神经纹理压缩:96% 更少的 VRAM! 🧠💾

Nvidia 的神经纹理压缩带来革命! 🚀

Nvidia 的神经纹理压缩带来革命! 🚀

Nvidia 的神经纹理压缩 (NTC) 终于接受了测试,展示了该技术在现实世界的 3D 工作负载中的能力。 撰写 YouTube 上的一位用户在 RTX 4090 上以 1440p 和 4K 分辨率对 Nvidia 的内存压缩技术进行了测试,结果显示与传统纹理压缩技术相比,96% 使用 NTC 后,内存纹理的大小显著减少。 🚀

Compusemble 以两种模式测试 NTC:“NTC 转码为 BCn”和“样本内推理”。前者在加载时将纹理转码为 BCn,而后者仅解压缩渲染特定视图所需的单个纹素,从而进一步减少纹理内存大小。 🎮

在启用 DLSS 升级的 1440p 分辨率下,“NTC 转码为 BCn”模式降低了 应用程序测试内存大小 在 64% 上,从 272MB 减少到 98MB。然而,“NTC 样本推断”模式显著减小了纹理大小至仅 11.37MB,与非神经压缩相比减少了 95.8%,与之前的神经压缩模式相比减少了 88%。 😲

Compusemble 指标显示,启用 RTX 神经纹理压缩时性能会略有下降。 “与禁用 NTC 相比,转码为 BCn 的 NTC 模式平均 FPS 略有降低,但最低 1% FPS 明显优于禁用 NTC 的传统纹理压缩。样本中的 NTC 推理模式遭遇了更大幅度的下降,从平均 FPS 1,600 下降到 1,500 FPS 左右。较低的 1% 显著下降至 840 FPS 左右。” 📉

首次在 RTX 4090 上试用 RTX 神经纹理压缩 (BETA) – YouTube

在 1440p 下,使用 TAA 而不是 DLSS 升级时内存大小的减少是相同的,但 GPU 性能行为有所不同。所有模式的运行速度都明显快于 DLSS,运行速度接近 2000 FPS。 “NTC 样本推理”模式下最低的 1% 在 1,300 FPS 范围内移动,与 840 FPS 相比有了很大的飞跃。 🎉

毫不奇怪,将分辨率提高到 4K 使得 表现 急剧下降。启用 DLSS 升级后,在“NTC 转码为 BCn”模式下平均 FPS 在 1,100 FPS 范围内,在“NTC 样本推理”模式下平均 FPS 略低于 1,000 FPS。两种模式的最低 1% 都在 500 FPS 范围内。

禁用 DLSS 并转而使用 TAA 的原始分辨率后,在“NTC 转码为 BCn”模式下平均 FPS 增加到 1,700 FPS 范围内,在“NTC 样本推理”模式下平均 FPS 增加到 1,500 范围内。早期 NTC 模式的最低 1% 略低于 1,100 FPS,而后期模式的最低 1% 略低于 800 FPS。 📊

最后,Compusemble 使用“NTC 样本推断”模式测试了协作向量 4K 分辨率 与 TAA。启用合作矢量后,平均帧速率在 1,500 范围内,而禁用合作矢量后,平均 FPS 骤降到略低于 650 FPS。在启用合作矢量的情况下,最低的 1% 也略低于 750 FPS;禁用最低的 1% 分别略高于 400 FPS。 🔄

Compusemble 的 RTX NTC 测试表明,Nvidia 的神经压缩技术可以大大减少 3D 应用程序的纹理内存占用,但会牺牲性能,尤其是在“基于样本的推理”模式下。 ⚠️

结果中最有趣的一点是 性能是 DLSS 与原始分辨率相比。原始分辨率下帧速率的显著增加表明 张量核 用于处理 NTC 的计算资源负担很重,很可能会影响 DLSS 升级性能,从而潜在地限制着色器核心。如果没有发生这种情况,我们应该会看到 DLSS 模式以比 TAA 的原生 4K 测试更高的帧速率运行。 🔍

RTX 神经纹理压缩已经开发了至少几年。新技术使用现代 Nvidia GPU 的张量核心来压缩 3D 应用程序和游戏的纹理,而不是传统的块截断码。 RTX NTC 是 技术 自 1990 年代以来,纹理压缩技术不断发展,能够实现比当今 GPU 所能处理的分辨率高出四倍的纹理。 📈

技术 它还处于测试阶段并且还没有发布日期。有趣的是, 最低要求 NTC 的比率似乎出奇的低。 Nvidia 的 RTX NTC GitHub 页面确认最低 GPU 要求是 RTX 20 系列 GPU。不过,该技术也已验证可在 GTX 10 系列 GPU、AMD Radeon RX 6000 GPU 和 Arc A 系列 GPU 上运行,这表明我们可能会看到该技术在非 RTX GPU 甚至游戏机上变得普遍。 🎉

5 2 投票数
文章評級
訂閱
通知
客人

0 評論
最古老的
最新 投票最多
線上評論
查看所有評論