性能暴涨90%!英伟达SER技术如何让光追普及,改变游戏体验?

6分钟前
尽管是面向未来的技术,但免费的性能提升依然令人心动。

近半年来,PC DIY市场可谓一片惨淡,受闪存价格飙升影响,内存和显卡价格纷纷上涨,不少玩家像小雷一样,暂缓或取消了电脑升级计划。


升级电脑无望,玩家们对游戏性能的需求该如何满足?别担心,微软出手了——玩家们期待已久的DirectX 12 SER已完成技术验证,正式纳入DXR 1.2规范。


性能最高提升90%,SER究竟是什么?


SER全称为Shader Execution Reordering(着色器执行重排序),这项技术最初由英伟达研发,后被微软纳入DirectX 12开放规范。它的核心作用是在光追模式下重新排列GPU计算线程,归类相似工作负载,充分释放GPU的并行计算能力。



对于玩家而言,光追功能真是让人又爱又恨:开启后画质大幅提升,但对显卡性能要求极高,盲目开启可能导致游戏卡顿。为解决光追模式下的帧率问题,英伟达在RTX 40系显卡首次引入SER技术,不过当时开发者需通过NVAPI或虚幻5的RTX插件才能调用。


要理解SER的用途,得先了解传统显卡在光追功能上面临的困境。光追技术出现前,游戏场景光线采用光栅化渲染,这是一种循序渐进的过程,使得传统显卡发展出SIMD架构(单指令多数据),让流处理器可同时处理同一渲染需求。


但开启光追后,这种架构就遇到了麻烦。光追本质是模拟物理光线的漫反射,衍生的“二次光线”具有随机性,导致传统显卡在计算光追路径时,需应对大量零碎需求,效率严重下降。


打个比方,原本只拧螺丝的生产线,某天传送带上出现螺丝、螺母、钉子等多种零件,每条产线只能处理部分工作,再继续自己的任务,导致部分性能“空转”。


SER就像产线分拣员,让GPU在计算时即时检查和调度光线任务。在光线模拟生成前,SER会将任务放入缓冲区,分类后把相似光线生成任务打包成计算块,交给对应产线处理。



简单说,就是在原料进入产线前加个分拣员,整理零件并交给对应产线,让GPU回到熟悉高效的运行状态。英伟达在RTX 20系列推出光追后,很快意识到光追瓶颈在于调度,于是耗时数年研发出SER。


随后微软将SER“招安”,毕竟好技术应共享。当时英伟达盈利重心转向AI芯片,消费端需求增长放缓且精力有限,便同意了这一要求(传闻)。


未来不仅英伟达能用SER,AMD、英特尔等厂商的显卡也可使用,且无需开发者针对性调用,只需支持DX12即可。这让多数中小型厂商能放心加入光追,无需担心优化问题。


微软测试报告显示,开启路径光追后,SER普遍带来20%—40%帧率提升,部分优化Demo甚至达90%。这种无副作用的免费提升,定会让玩家叫好。


SER虽好,但并非所有显卡都支持


看到这里,很多读者会问:何时能用上?


答案很微妙。若你用RTX 40系以上显卡且玩过《赛博朋克2077》,其实已体验过SER。该游戏路径光追模式下SER自动启用,这也是英伟达中高端显卡能稳定60fps以上的关键。


不过DirectX 12的SER并非适用于所有显卡,需硬件调度器和驱动支持。RTX 40系以上玩家无需担心,问题主要在AMD和英特尔用户身上。


其中,AMD需RX 9000系列以上显卡才能完美支持SER,因RDNA 4首次引入全新RT单元架构。其本质与英伟达SER硬件调度器相同,都是线程排序缓冲区,使RDNA 4原生支持DXR 1.2,这也是RX 9000系光追表现远超RX 7000系的原因。



但RX 9000系目前只有两款中端显卡,性能无法满足高端玩家需求,且受闪存涨价影响,剩余两款高端显卡能否今年按时发布销售还是未知数。


英特尔情况较好,因历史包袱小(仅3年多),从Xe2开始原生支持SER。2024年发布的B580显卡,售价不到两千,2K分辨率下性能稳超RTX 4060,接近RTX 4060Ti;光追模式原本是弱势,凭借SER更新(90%性能提升),也追上了4060水平。


可以说,SER普及后,B580成为最香的2K游戏显卡之一,12GB显存避免了像英伟达甜点卡那样爆显存。今年英特尔还将推出Xe3架构的新一代B系列显卡,性能值得期待。



总之,SER带来的性能提升确实显著,但老显卡玩家可能无法享受。小雷总结,目前RTX 4060Ti、B580和RX 9070 GRE都是不错的选择,打算长期使用的朋友可考虑升级。


硬件提升接近瓶颈,软件才是未来


即便显卡支持SER,系统和驱动也已更新,最终仍需等待游戏更新。因很少有开发者手动优化DirectX代码,DirectX 12 SER普及需等虚幻5等主流引擎整合。


更扎心的是,SER不像DLSS那样替换DLL就能生效,它涉及渲染管线底层任务调度逻辑。已发售的老游戏,除非开发商投入人力重写渲染后端并发布大型补丁,否则永远无法支持SER。


其实SER的意义在于让路径光追真正普及,不再是少数游戏的“特权”,老显卡也能受益,这是光追普及的附带福利。甚至“全景光追(实时生成所有光线)”也需依靠SER才能实现。


目前SER主要对近两年的显卡生效,虽有“富人越富”之感,但技术发展本就是“旗舰平权”过程:先旗舰使用,再下放到中端、入门产品,最后进入移动端,带动行业下限提升。


在闪存涨价导致的“硬件寒冬”里,SER这类通过底层优化挖掘硬件潜能的技术,或许是打破性能瓶颈的关键。摩尔定律近年逐渐失效,硬件升级带来的性能提升越来越少,比如RTX 50系对比40系,理论性能提升大多在20%以下。


那50系与40系帧数差距为何大?原因是DLSS等软件优化,如DLSS 4的多帧生成,最高能让帧数翻8倍。未来“软件定义硬件”的情况会更多,对玩家来说是好事,毕竟软件升级是“真免费”,哪怕1%的提升也很香。


本文来自微信公众号“雷科技”,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com