创作立场声明:显卡为七彩虹与NVIDIA联合送测,所有数据均真实测试。

大家好,我是黄昏百分百,很荣幸受到了NVIDIA与七彩虹的联合邀请,参加NVIDIA GeForce RTX 3080 Ti显卡的媒体首测。

因为我之前已有iGame GeFore RXT 3080 Vulcan OC 10G,所以这次专门申请了同系列的iGame GeFore RXT 3080 Ti Vulcan OC,并结合七彩虹iGame GeFore RXT 2080 Ti Vulcan X OC的参数,使大家能够对新一代的NVIDIA GeFore RXT 3080 Ti 有更深刻的了解,看一看这款限制挖矿的显卡,能否成为新一代的4K卡皇。好了,废话不再多说,我们开车吧。

iGame GeFore RTX 3080 Ti Vulcan OC外观简晒

▲开箱部分我就不说了,毕竟iGame RTX 30系显卡 Vulcan系列的包装设计除了型 差异其他基本一样,直接快速看一下显卡本体,显卡外观设计棱角分明,带有非常明显的赛博朋克元素,同时最新的施剑者(SWORIZER)散热器3.0更是配备了3把13片扇叶的“捕风手”风扇,将气旋压入散热器内实现风压及进风量的进一步提升,同时给人以非常霸气的感觉。

▲iGame GeForce RTX 3080 Ti Vulcan OC最明显的识别标志,LCD侧显示屏也比前代有了大幅升级,分辨率提升到了480*128px,屏幕变得更加清晰,更重要的是,显示屏也调整为了翻转式的,无论显卡是横插还是竖插,显示屏都可以正对着用户视角,比上一代固定的显示屏要好非常多。

▲在iGame Center中,可以详细配置显卡显示屏所显示的信息,包括CPU频率、显卡使用率等等均可实时显示,还可以自定义文字、图片与动图,打造专属于自己的火神显卡。

▲而显卡的背板叫做“灵视背板”,在为显卡提供足够的支撑的同时还能够为其颜值大幅加分,那个LED背光的iGame Logo是支持神光同步的,在iGame Center的加持下可以有着非常棒的灯光表现。

安培架构简介

新架构,新制程

▲从图灵架构开始,英伟达开始采用 流式多处理器 (Streaming Multiprocessor,SM)架构以执行光线追踪等运算工作,在图灵架构中,一个处理器被分为了4部分,每部分含有2个Turing Tensor Core,所以共有8个Turing Tensor Core。而在安培架构下,则用一个性能为Turing Tensor Core性能二倍的GA10x Tensor Core取代了两个Turing Tensor Core,所以之前8个Turing Tensor Core才能完成的工作,目前只需要4个GA10x Tensor Core就可以完成了。

另外,与图灵架构相比,GA10x SM的L1数据缓存和共享内存的组合容量增加了33%。对于图形工作负载,与图灵架构,GA10x SM 缓存分区容量增加了一倍,从32KB增加到64KB。

▲得益于芯片制程从14nm到8nm的巨大飞跃以及其他新技术的加持,在同样的实际功率下,安培架构的图形处理能力是图灵架构的1.9倍。

第二代光线追踪

▲左图为第一代光线追踪技术,右图为第二代光线追踪技术。相对于第一代光线追踪技术,第二代光线追踪技术增加了时间这个自变量,从而使光线效果变得更加真实,这一点,我们从下面几张图进行详解。

▲左图为第一代光线追踪技术,右图为第二代光线追踪技术。在多重光线照射运动物体的情况下,会产生多重,暗度不一的影子,更贴近实际生活中的场景,所以画面也就变得更加的真实。

▲美剧《指定幸存者》剧照,可以看到,摩托车灯光并没有在地面上反射出清晰的影子,而是在运动的光源以及漫反射,散焦等因数等共同的作用下,形成了亮度不均,模糊的影子。这才是现实中的光线效果,游戏中的光线追踪效果越贴近这种效果,则画面效果越真实。

▲刚才说到的散焦,指的是光线经光滑金属或透明物体表面反射/折射后,产生汇聚或发散,从而形成新的光源照亮周边的其他物体,比如上图中的被打碎的玻璃瓶便是一个散焦光源。(图片出自光明记忆Benchmark)

▲左图有散焦效果,右图没有散焦效果,可以看出画面效果区别巨大。

正是由于有了如此之多的光追新技术,我们的画面才能日趋真实。

那么,光线追踪到底的实际画面到底进化到了什么地步呢?我们用一组《赛博朋克2077》游戏的实机画面来看一看:

在4K分辨率光追效果最高的情况下,游戏帧数能够稳定在60帧以上,因为这个游戏没有benchmark,所以我没有计算平均帧数,我们重点来看一看,在最新发售的大作中,光线追踪技术运用到了什么程度。

▲在汽车追逐桥段中,中间路过了一个旅馆,大家可以清楚的看到,旅馆招牌上的霓虹灯与其在车顶的反射是一一对应的,十分的真实。

▲广告牌与路灯在淋湿的马路上的光线也特别真实,给人一种电影的感觉了。

▲来一段汽车转弯的动图,随着玩家位置的改变,路边广场上的积水反射的画面也随之改变,这种游戏画面已经足以乱真了,代入感超强!

GDDR6X新显存

▲我曾经只以为1和0只是数学上的两个数字,后来才知道,它们还有哲学上的意义,在学习了计算机科学之后,又对这组数字有了更深刻的了解,那就是他们还代表着逻辑学上的是(1)和否(0)。稍微对计算机科学有一点了解的朋友都知道,计算机中的所有数据都是以“0”和“1”的形式储存和传输的。

之前的GDDR6显存与其他内存一样,以高低两段电压来传递信 ,而新的GDDR6X则进行了革命性的升级,从两段电压传输信 升级到4端电压传输信 。

▲左图为GDDR6显存的2段电压,右图为GDDR6X的4段电压,所以,传输同样数量的数据,GDDR6X只需要GDDR6一半的频率变动,使得其有效带宽直接翻倍。按阴阳理论来说,基本上就是由太极生两仪(0,1)的维度进化到了两仪生四象(00,01,10,11)的维度。双倍的带宽满足了诸如光线追踪,DLSS等新技术对数据传输速度极高的要求,从而使这些新技术在RTX 30系显卡上的表现要比在RTX 20系显卡上有着极大的提升,比如我马上要说的8K DLSS就是得益于GDDR6X带来的双倍带宽才能够实现的。

8K DLSS

▲DLSS(深度学习超级采样) 2.0是通过基于 AI 的超高分辨率重新定义实时渲染,即渲染更少的像素,然后使用 AI 构建更清晰、更高分辨率的图像,可以有效的在不牺牲画质的情况下通过AI算法提升游戏的帧率表现。

▲RTX 20系显卡基本可以满足4K分辨率的DLSS计算,而RTX 30系显卡则直接可以满足8K分辨率下的DLSS计算,其画面的像素点是4K分辨率的4倍,可见画面提升效果之大。上图分别为1080P原生画质,4K原生画质,8K DLSS画质。嗯,8K分辨率下画面比4K分辨率下画质更清晰,这点没毛病。

NVIDIA IO

刚才在GDDR6X部分已经讨论到了,数据的传输速度是图像非常重要的部分,甚至可以说是重中之重,所以我们现在还要讨论一下在整个电脑画面处理过程中,新发布的NVIDIA IO技术相较于传统的数据传输模式有什么进步。

▲先说一下传统的数据传输模式,数据首先从硬盘中读取,途径NIC通过PCIe总线传输到CPU后再传输到系统内存中(RAM),然后再通过PCIe总线传输到显存中。整个数据的传输途径了硬盘,CPU,系统内存,显存4部分。所以除了硬盘读取速度之外,系统内存的容量和频率也都会对数据传输有影响,在传统数据传输模式下,最大的数据传输带宽大概为7GB/s。

▲那么,如果通过CPU对内存中的数据进行压缩,再将数据传输到显存中,是不是传输速率就可以提升了呢?理论上这个是可行的,也是目前多数游戏运行所使用的方式。但是,现在NVMe固态硬盘的已经非常高了,压缩7GB/s数据就需要24核心的CPU,这比AMD的3960X的核心数都多,可以说,一向被说性能过剩的CPU在压缩数据的任务中却成为了整个工作的性能瓶颈。

▲既然CPU和系统内存容易出问题,而且问题又不好解决,所以,最好的办法,自然就是解决掉提出问题的人啦。在新应用的NVIDIA IO技术中,数据从硬盘中被读取之后,直接走PCIe通道,经过GPU进入显存,这样,就无需担心CPU与系统内存的性能了,可以轻松跑满14GB/s的带宽。

▲在RTX IO的加持下,读取速度可以达到CPU压缩传输方式速度的三倍以上。

安培架构小结

性能的提升

我专门做了iGame Vulcan系列中RTX 2080 Ti、RTX 3080、RTX 3080 Ti三款显卡的参数比较:

▲几款产品的主要区别我都列在了表中,图灵架构的12nm制程的TU104芯片与安培架构8nm的GA102芯片自然是最大的区别。

除此之外,RTX 3080 Ti的CUDA数量为10240个,比RTX 3080多1536个(提升17.6%),更是仅有4352个CUDA核心的RTX 2080 Ti的2.35倍。

可见,RTX 3080 Ti的CUDA数量相较于RTX 2080Ti使一个质的飞跃,而相较于RTX 3080则是一种锦上添花的升级,相信大家都能够理解。

另外,RTX 3080 Ti与RTX 3080搭载的都是最新的GDDR6X显存,正如前文所讲,GDDR6X显存性能要比普通的GDDR6显存好很多。而RTX 3080Ti在显存大小上更是比RTX 3080的10GB容量提升到了12GB容量,显存位宽也由320Bit提升到了384Bit。

▲现在,让我们直接用各项测试,来看看iGame GeForce RTX 3080 Ti Vulcan OC,到底比iGame GeForce RTX 3080 Vulcan OC 10G提升了多少吧。

▲本次的测评平台,i9-11900K与七彩虹iGame Z590 Vulcan主板、4266MHz的 iGame Vulcan 内存可以保证CPU与内存不会成为测试的瓶颈,同时上了1000w的振华LEADEX G电源与九州风神的堡垒360EX以保证测试过程中的供电与散热稳定。

好了,测试平台介绍完毕,开始显卡的测试,测显卡我们肯定要先从3D MARK开始,你们说对吧?

3D Mark Time Spy Extreme

▲3D MARK专为DirectX 12设计的Time Spy Extreme, Time Spy是一个DirectX 12 基准测试,支持原生新的API 功能,如异步计算,显式多显卡适配器技术和多线程,而其Extreme版本则是将分辨率提升至4K。

▲iGame GeForce RTX 3080 Vulcan OC 10G的总得分为8069分,其中显卡得分8662分,CPU得分5815分。

▲iGame GeForce RTX 3080Ti Vulcan OC的总得分为9073分,其中显卡得分10118分,CPU得分5724分。

▲值得注意的是,显卡测试1、显卡测试2的帧数分别由RTX 3080的 55.23帧和50.65帧提升到了64.24帧和59.39帧。忽略测试时的误差,RTX 3080 Ti已经可以在不开DLSS的情况下提供稳定的4K 60hz的游戏画面,刚好跑满4K 60Hz的电视与显示器,不得不佩服老黄的刀法之精准,一分不多,一分不少,刚好满足4K 60Hz的需求。

3D Mark Fire Strike Ultra

▲Fire Strike 是一项适用于高性能游戏电脑和超频系统的 DirectX 11 基准测试。即使对于最新的显卡而言,Fire Strike 测试也非常严苛。而Fire Strike Ultra是其4K版本。

▲iGame GeForce RTX 3080 Vulcan OC 10G的总得分为10783分,其中显卡得分10663分,w物理得分26862分,综合得分5947分。

▲iGame GeForce RTX 3080Ti Vulcan OC的总得分为12595分,其中显卡得分12571分,物理得分26432分,综合得分7114分。

这里第一点值得注意的是, RTX 3080与RTX 3080 Ti 在Fire Strike Ultra物理分数这一项上得分相差17.9%,而这两款显卡的CUDA核心数相差则为17.6%,刨除测量误差,可见Fire Strike Ultra测试在核心频率相同时,CUDA数与得分基本上成正比。

▲而RTX 3080 Ti 在显卡测试1与显卡测试2的帧数分别为68.85帧与45.32帧,相较于RTX 3080的58.54帧与38.38,分别提升了17.6%与18%,刚才提及的,Fire Strike Ultra测试在核心频率相同时,CUDA数与帧数(分数)成正比的结论同样成立。

NVIDIA DLSS feature test

▲深度学习超级采样(DLSS) 是一种 NVIDIA RTX 技术,它利用深度学习和 AI 的强大能力来提高游戏性能,同时保持视觉质量。NVIDIA DLSS 功能测试会运行 Port Royal 基准测试两次,以测试 DLSS 性能和图像质量。第一次运行 Port Royal 时,会以输出分辨率渲染,并停用 DLSS 以测量基线性能。第二次运行以较低的分辨率渲染 Port Royal,然后使用 DLSS 处理以达到输出分辨率所需的帧。通过比较两次渲染的帧数差异来测试显卡的DLSS能力。本次测试的DLSS输出分辨率为4K,DLSS模式为DLSS 2.0性能模式。

▲iGame GeForce RTX 3080 Vulcan OC 10G,DLSS关闭时帧数不正常,只有2.45帧,应该是我打的是测试版驱动的缘故,而DLSS开启后帧数是正常的,为64.47帧。

▲iGame GeForce RTX 3080 Ti Vulcan OC,DLSS关闭时帧数为28.36帧,DLSS开启后帧数为70.76帧,相较于iGame GeForce RTX 3080 Vulcan OC 10G提升了10%。

《光明记忆:无限》光线追踪 BenchMark

《光明记忆:无限》是国内工作室的作品,在英伟达新技术的应用上可以说处于世界领先水准,同时支持第二代光追技术以及DLSS 2.0。这次我使用的是媒体特供的《光明记忆:无限》光线追踪 BenchMark。在这里我再为大家补充一点光线追踪的知识。

▲散焦是第二代光线追踪技术所特有的,左边无散焦,右边有散焦,可以看到士兵头盔和肩甲上的亮度截然不同,明显左边的更加真实。

▲女主角在汽车玻璃上的倒影是镜面反射,而在车漆上则是漫反射,所以倒影的清晰度截然不同,这点相信大家很容易理解。

▲多次反射的话,在生活中注意观察的朋友们也很好理解是吧?不做过多解释了。

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2021年5月2日
下一篇 2021年5月2日

相关推荐