2022年最值得购买的显卡?iGame GeForce RTX 4080 16GB Vulcan OC首测

今天我将通过全新显卡技术介绍与性能实测,帮助大家详细了解采用Ada架构的RTX 40系显卡到底有着多么巨大的架构与性能进步。

好了,废话不再多说,我们开车吧。

Ada Lovelace 架构优势分析

说到RTX 40系显卡,首先自然要为大家介绍一下其在制作工艺与架构上的升级,这里我先为大家介绍一下全新的Ada Lovelace架构。

新架构,新制程

▲NVIDIA Ada Lovelace 架构作为 GeForce RTX 40 系列显卡的核心,必须要放在最前面说。Ada 架构基于定制的 TSMC 4N 工艺,晶体管数量从上一代的 280 亿个激增至 760 亿个,是目前世界上工艺最精湛的 GPU 架构。

▲从图灵架构开始,英伟达开始采用 流式多处理器 (Streaming Multiprocessor,SM)架构以执行光线追踪等运算工作,上图左侧为全新Ada架构,右侧为30系所使用的安培架构,从图中可以看出,SM布局基本与上代保持一致,而最核心的变化便是其内Ada 4代 Tensor Core取代了安培架构中的3代的Tensor,用于光线追踪的RT CORE从安培架构的第二代RT CORE升级到了第三代RT CORE。不仅将光线与三角形求交性能提高了一倍,还将 RT-TFLOP 峰值性能提高了一倍之多。

▲而每两个SM组成一个纹理处理集群(Texture Processing Clusters,TPCs),再由多个TPC组成一个图形处理集群(Graphics Processing Clusters,GPCs)。

▲而Ada架构的GPU则是由多个GPC组成的,以一个完整的AD 102芯片为例,其拥有12个GPC,72个TPC,144个SM,18432个 CUDA核心。

▲而RTX 4080的GPU芯片中共拥有9728个CUDA核心,并搭载了16GB 的256bit GDDR6X显存。

▲技术方面,ADA架构的RTX显卡还带来了着色器执行重排序、微 格位移、不透明微遮蔽、FP8推理、光流加速器、DLSS 3。这几个技术,我会在后面详细介绍。

▲最后,在能效比方面,Ada 架构的效率也令人感到不可思议:在相同的功率下,其性能相较安培架构最高可达两倍以上;增大功率,性能还能持续提升。

第三代光线追踪 画面更加真实

这里先说一下着色器执行重排序 (SER) 技术吧。

▲高级光线追踪技术需要计算同一场景中数百万条光线照射在诸多不同类型材质上的效果,这就使得着色器只能低效地处理一系列截然不同的工作负载。(在渲染 3D 场景时,着色器用于计算恰当的亮度、暗度和颜色级别。每一款现代游戏都需要使用到着色器。)

着色器执行重排序 (SER) 技术能够动态调整这些工作负载的顺序,让原本低效的流程变得异常高效。SER 可将光线追踪操作的着色器性能最高提升 2 倍,或将游戏的帧率最高提升 25%。

▲通俗一点说,SER技术便是通过将排序,使显卡由逐个运算加法改为了运算乘法,自然效率能够得到大幅提升,同时不会增加显示延迟。

▲紧接着我们再说一下第三代RT CORE新搭载的两款引擎,除了在安培架构中已经使用的Box Intersection Engine与Triangle Intersection Engine两款引擎。Ada架构搭载的新款 RT CORE 还配备全新 Opacity Micromap (OMM) 引擎和 Displaced Micro-Mesh (DMM) 引擎。

▲OMM 引擎可大幅提升对 alpha 测试纹理进行光线追踪的速度,此类纹理通常应用于树叶、颗粒,围栏等。

▲以树叶为例,全新ADA架构RT Core搭载的OMM引擎可将树叶分为全透明部分,不透明部分与半透明部分,大幅减少着色器工作量,进而明显降低光线追踪对游戏性能的影响。

▲左侧为未开启OMM引擎时的着色器工作量,右侧为OMM引擎开启后的着色器工作量,可见OMM的性能立竿见影。

▲而面对珊瑚蟹这种极不规则,超多个平面(三角形)的物体,则需要DMM引擎来提升光追性能了。

▲相较于安培架构需要将多个三角形与复杂的BVH放入RT CORE中进行处理,ADA机构可以将图形转化为一个基础的三角形,一个Displace Map与一个简单的BVH,再放入RT CORE中进行处理。

▲因此,DMM 引擎能够以近乎 9 倍的速度构建光线追踪边界体积层次结构 (BVH),而所占用的显存只有之前的二十分之一。从而实现几何复杂场景的实时光线追踪。

DLSS 3 让帧数起飞

▲有一说一,光线追踪还是会对游戏帧数有一定的负面影响的,所以就需要DLSS来提升游戏帧数了,DLSS的全名是DEEP LEARNING SUPER SAMPLING(深度学习超级采样),是一种通过基于 AI 的超高分辨率重新定义实时渲染,即渲染更少的像素,然后使用 AI 构建更清晰、更高分辨率的图像的方法,可以有效的在不牺牲画质的情况下通过AI算法提升游戏的帧率表现。

▲从图灵架构的RTX 20系显卡开始,DLSS技术随着显卡架构一起进化,目前已经进化到了第三代DLSS,除了代表性的DLSS 超分辨率技术,还融合了DLSS帧生成技术与NVIDIA Reflex技术。

▲这里重点说一下DLSS 3中的潜在帧生成技术,其可通过对前后帧的分析,在两帧之间插入一帧,进而是游戏帧数有着近乎翻倍的提升。肯定有朋友会问,这个插帧技术与电视常用的MEMC插帧技术相比有什么区别。

▲这里便要说,电视因为其不参与画面渲染的过程,所以只能够通过算法与预测中间帧应该显示的画面,难免在阴影方面出现不准确的情况,导致插帧后画面不自然。而英伟达显卡的DLSS 潜在帧生成技术因为是在渲染过程中在光流加速器中发生的,所以可以获得准确的运动矢量(MOTION VECTORS),所以可以准确预测出中间画面所处的状态, 自然画面阴影效果就十分准确了。同时,生成的帧不需要CPU提供数据,因此整体帧率可以超过CPU渲染的帧率限制,大幅降低了对CPU性能的要求。

▲同时,DLSS 3 潜在帧生成技术与超分辨率技术结合,渲染1080P分辨率的原始画面,再超分辨率到4K画面,同时,2个4K分辨率的帧之间再生成一帧。所以,平均两个4K帧中,只有一张1080P的帧是CPU与显卡实际渲染的,占总生成画面的八分之一,可见DLSS技术对帧数提升之大。

截至11月15日发文,已有10款DLSS 3游戏发布:

1.《瘟疫传说:安魂曲》(A Plague Tale: Requiem)

2.《光明记忆:无限》(Bright Memory: Infinite)

3.《毁灭全人类2:重新探测》(Destroy All Humans! 2 – Reprobed)

4.《暗影火炬城》(F.I.S.T.: Forged in Shadow Torch)

5.F1 ? 22

6.《逆水寒》(Justice)

7.《生死轮回》(Loopmancer)

8.《漫威蜘蛛侠:重制版》 (Marvel’s Spider-Man Remastered)

9.《微软模拟飞行》(Microsoft Flight Simulator )

10.《超级人类》(SUPER PEOPLE)

其中,《逆水寒》、《瘟疫传说:安魂曲》我在RTX 4090首测中有所设涉及,本次还加入了《光明记忆:无限》、《毁灭全人类2:重新探测》、《暗影火炬城》、《生死轮回》四款正式版游戏的实测。除了DLSS 3普及速度非常快之外,以上10款游戏有4款为国产游戏,可见国产游戏在新技术的使用上还是非常厉害的,后续文章中我会详细与大家聊。

另外,WRC Generations, 《极品飞车:不羁》(Need for Speed Unbound)和 《战锤40K:暗潮》(Warhammer 40,000: Darktide) 在RTX 4080推出后不久就会发布,圣诞节前玩家就可畅玩这些DLSS 3游戏。

书归正传,我们来比较一下DLSS开启后对画面效果的影响,左侧为DLSS性能模式下的4K分辨率,右侧为原生4K画质:

▲首先看一看《赛博朋克2077》BenchMark中的截图,整体画面一眼看上去基本无差异,DLSS似乎能够无比接近原生分辨率了。

▲背景中的这个栏杆,DLSS画面还要比原生4K画质更加锐利清晰。

▲不过,背景的瓷砖上,开启DLSS后还是稍微有一点糊的,不过如果不像我这样放大多倍去找茬,是根本发现不了的。

▲在同BenchMark的酒吧场景中,DLSS开启后,画面效果则要明显比未开启DLSS时更加的透彻,顶部招牌也更加的锐利清晰,个人觉得本场景下DLSS的画质要明显优于原生4K分辨率。

▲同样,在 易大作逆水寒的测试中,DLSS开启后的地砖,相较原生4K分辨率的地砖,纹理上也更加清晰,可见在有光照充足的画面中,开启DLSS后的画面甚至可能超过原生4K分辨率的画质,且其能偶带来大幅度的帧数上升,还是很值得开启的。

NVIDIA REFLEX 低延迟技术

▲在传统的图像处理流程中,如果CPU 处理帧的速度快于 GPU 渲染帧的速度(高U低显),则会在CPU到GPU之间有一个等待渲染帧的队列,进而导致渲染延迟的增加。

▲而通过将NVIDIA REFLEX SDK直接集成到游戏中,就可以使CPU的帧处理速度与GPU的渲染速度保持同步,大幅降低渲染队列,并降低CPU背压,进而使游戏能够采样键鼠等外设最新的输入。最终降低画面与输入延迟,提高游戏体验。目前,NVIDIA REFLEX技术已经被集成在了DLSS 3中。

▲目前已经有超过35款游戏与软件支持DLSS 3,包括国产游戏《黑神话:悟空》、《光明记忆:无限》、《生死轮回》、《仙剑奇侠传 7》等。

NVIDIA RTX REMIX 让老游戏重获新生

▲有非常多的经典游戏,无论在剧情上还是游戏性上,都堪称经典,唯独游戏画面上受开发时间限制,已经跟不上现在的潮流。因此,英伟达开发了RTX REMIX软件,可以帮助MOD爱好者在AI的帮助下,对游戏画面进行光追化重构,让游戏重获新生。

▲NVIDIA RTX REMIX可以将素材资源整合给多个软件使用,进而大幅降低MOD制作难度,提高制作效率。

▲V 经典游戏《传送门》最近便推出了RTX版的DLC,也即将上线,之前在Steam上拥有《传送门》原作的同学可以免费获得光追升级哦,游戏的画面效果可以说是立竿见影,算是老游戏重获新生的优秀例子了。各位MOD爱好者们也可以根据自己的喜好对旧游戏进行画质升级,我很好奇各位会拿NVIDIA RTX REMIX去升级哪些游戏的画质。

RTX 4080 全新旗舰级游戏显卡

自从英伟达在安培架构中新增了RTX 3090与RTX 3090 Ti这两款24GB显存的显卡,可以说将图灵架构时代单独命名的TITAN RTX这个生产力工具级别的显卡正式并入了GeForce RTX系列。因此,无论是上代的RTX 3090(Ti)还是本代的RTX 4090,更多情况下还是被当作生产力工具使用,亦或者用来游玩8K与VR游戏,而RTX 4080这个级别的显卡往往更被游戏玩家所喜爱,完全可以视作全新的旗舰级游戏显卡,所以我们首先来测试一下iGame GeForce RTX 4080 16GB Vulcan OC 的游戏性能。

测试平台简介

本次我分别测试了全新的iGame GeForce RTX 4080 16GB Vulcan OC与上一代安培架构的iGame GeForce RTX 3080 Vulcan OC 10G,两款火神显卡,无论是从英伟达的GPU芯片定位,还是从七彩虹 iGame的显卡产品线定位,都完全一致,所以用于比较两代显卡架构与性能上的差距再好不过。

iGame GeForce RTX 4080 16GB Vulcan OC参数对比

▲可以看到,iGame GeForce RTX 4080 16GB Vulcan OC相较于iGame GeForce RTX 3080 Vulcan OC 10G,在芯片制程、CUDA数量与核心频率上均有提升,其中一键超频核心频率更是上升了47%,这在显卡上来说,绝对是巨幅提升。

而在显存方面,RTX 4080 16GB提升了频率而降低了显存位宽,两者的显存总带宽差的并不大,个人觉得是为了降低GDDR6X的发热,同时大显存也可以一定程度上放置爆显存的发生,这点晚一点我们再来测试。

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2022年10月12日
下一篇 2022年10月12日

相关推荐