DirectX Raytracing 1.2:让你的游戏速度提升高达 2.3 倍!⚡🎮
本周,微软 广告 其全新的应用程序编程接口 DirectX Raytracing (DXR) 1.2 带来了显著的视觉质量和渲染性能提升,速度最高可达 2.3 倍!AMD、英特尔、Nvidia 和高通等公司以及 Remedy 等视频游戏开发商已开始着手将这些 DXR 1.2 技术融入未来的游戏硬件和软件中。🎮✨
DirectX 光线追踪 1.2 更新包含两项技术:不透明度微贴图 (OMM) 和着色器执行重排序 (SER),它们可优化光线追踪游戏的性能,将效率从 2 倍 (SER) 提升至 2.3 倍 (OMM)。在游戏或游戏引擎中实现这些技术对于充分利用性能优势至关重要。🔧⚡️
性能提升 2 倍 – 2.3 倍
光线追踪中经过 alpha 测试的几何体(例如树叶、栅栏和头发)面临的主要挑战之一是需要进行额外的计算来确定光线是照射到表面还是穿过表面。 不透明度微图 (OMM) 他们通过将带有 Alpha 通道的纹理应用于平面并移除低于特定透明度阈值的像素来改进这种几何图形的处理。这减少了所需的着色器数量,从而提高了性能和效率。
微软声称,在最佳情况下,渲染速度可以提升 2.3 倍。然而,需要注意的是,并非所有游戏和场景都包含树叶和栅栏等元素。例如, 潜行者2 几乎每个场景都有很多草、树叶和栅栏, 赛博朋克2077 它几乎没有叶子。🌿🚧
着色器执行重新排序 (SER) 它被视为一项更通用的功能,因为它重新组织了着色器的执行方式,以防止出现发散。当相邻像素需要着色器执行不同的任务时,就会出现这种发散,这在具有复杂光线追踪效果的场景中很常见,例如逼真的光照、细致的阴影和精准的反射。🌈✨
GPU 以并行线程的方式处理着色器,这些线程被组织成称为 Warp 或 Wavefront 的组。理想情况下,同一组内的所有线程同时执行相同的指令,从而最大限度地提高 GPU 效率。当同一 Warp 或 Wavefront 中的线程需要执行不同的指令时,就会发生着色器发散。在这种情况下,同时执行变得不可能,迫使 GPU 分别处理每个指令路径,导致一些线程处于空闲状态,并增加延迟。
据微软称,SER 可以对相似的着色器工作负载进行分组或组织,从而减少分歧,最大限度地提高 GPU 利用率,并将渲染速度提高 2 倍。🔥
硬件支持
至于硬件支持,情况是多种多样的,这对于新的 API 功能来说是常见的。
自 Turing 架构以来的所有 Nvidia GPU(GeForce RTX 20) 支持不透明度微贴图 (OMM),因此一旦游戏开发者在其游戏中实现该功能,这些显卡的性能将大幅提升。英特尔宣布其即将推出的下一代 Celestial (Xe3) GPU 也将支持 OMM。🌟
从 GeForce RTX 40 系列 Ada Lovelace 显卡开始,Nvidia GPU 已支持着色器执行重新排序 (SER)。英特尔表示,希望“在未来的 Agility SDK 中推出 SER 时”支持该功能。不过,目前尚不清楚英特尔 Arc Alchemist 或 Battlemage GPU(或两者)是否会支持该功能。🤔
就 AMD 而言,其 RDNA 2/3/4 GPU 似乎不支持 OMM 或 SER,不过微软表示,该公司正在努力推广这些技术。此外,AMD 有一些编程优化可以模拟 SER 的工作方式,因此,如果游戏开发者花时间针对 Radeon GPU 进行优化,他们可能会受益于速度的提升。⏩
高通也不支持 OMM 或 SER,但提到将在其下一代集成 GPU 中支持这些功能。🏆
DXR 1.2 预览版将于 2025 年 4 月发布。🗓️
总之,到来 DirectX 光线追踪 1.2 🎮 代表了电子游戏光线追踪技术的重大进步,为以下方面提供了重要改进: 表现 ⚡和 视觉质量 👁️得益于创新技术,例如 不透明度微图 (OMM) 和 着色器执行重新排序 (SER).
虽然不同制造商的硬件采用和支持情况有所不同,但大型公司的承诺,例如 英偉達, 英特尔, AMD 和 高通以及主要开发人员表示,这些改进将逐步融入到未来的游戏和设备中🚀。
计划于 2025年4月, DXR 1.2 承诺优化游戏体验,通过更高效、更逼真的渲染使开发者和玩家都受益🎯。
毫无疑问,这次更新将标志着我们向未来采用先进光线追踪技术的游戏迈出了重要一步🌟。