影驰RTX 3080 Ti 星曜OC评测 千面闪耀百变星曜

GeForce RTX 3080 Ti已经于6月2日正式性能解禁,相信看过公版首测的用户们都已经了解其大致性能,这款最新发布的显卡根据性能来看处于RTX 3080与RTX 3090之间,并非常接近后者,综合来看几乎只比RTX 3090少了12GB的显存。今天给大家带来的是影驰GeForce RTX 3080 Ti星曜OC的评测。

再一次发布新卡,玩家最关心的肯定是能不能买到,一卡难求的局面能否得到改善。的确近一年来收到全球芯片短缺加上矿潮的影响,真正有需求的玩家几乎很难买到显卡,反而是矿老板和黄牛冲的最勇猛。

影驰GeForce RTX 3080 Ti星曜OC

NVIDIA也关注到了玩家需求,在官方博客中再次宣布,后续推出的RTX 30系显卡,除了GeForce RTX 3090外将全部从芯片层面限制挖矿,包括之前已经推出的RTX 3060/3060 Ti/3070/3080,以及后续将要推出的显卡。

影驰在GeForce RTX 30系显卡中将全部系列推倒重做,包括黑将、金属大师、星曜以及GAMER系列在外观上均有非常大的改动,今天我们要评测的GeForce RTX 3080 Ti星曜OC,则是更加注重于动手动脑的一款产品,在评测开始前,笔者先将它的特点简要列出,方便大家阅读:

  1. 性能超越公版,Boost频率达到1710MHz
  2. 上盖可自由涂鸦,并且官方接受私人订制图案
  3. 附赠2槽挡板,可兼容更多机箱

影驰GeForce RTX 3080 Ti星曜OC

总的来说,影驰GeForce RTX 3080 Ti星曜OC是一款可玩性很高的显卡,上盖可自由涂鸦,并且官方接受私人订制图案。透明的亚克力罩采用不规则水晶切割面,真正做到“千面闪耀 百变星曜”。性能方面这款显卡几乎与GeForce RTX 3090无差别,同时相对GeForce RTX 3080将显存增加到12GB,更适合4K游戏。

01 旗舰核心GA102-225-A1

下面我们先来看看在架构上有哪些改动,官方白皮书上对比的对象为GeForce RTX 2080 Ti,相较于上一代的NVIDIA Turing架构,NVIDIA Ampere架构下的GeForce RTX 3080 Ti每个时钟执行2次着色器运算,而Turing为1次,GeForce RTX 3080 Ti的着色器性能达到34 TFLOPS单精度性能,而Turing为14 TFLOPS。

第一代NVIDIA RTX架构 Turing下的RTX 2080 Ti

第二代NVIDIA RTX架构 Ampere下的RTX 3080 Ti

NVIDIA Ampere架构翻倍了光线与三角形的相交吞吐量,RT Core达到67 RT TFLOPS,而Turing为43 RT TFLOPS。而且第二代光线追踪最重要的不仅仅是性能提升,还增加了对游戏中运动模糊部分场景的光线追踪计算加速。

第三代Tensor Core可自动识别并消除不太重要的DNN权重,处理稀疏 络的速率是Turing的两倍,算力高达273 Tensor TFLOPS,而Turing为114 Tensor TFLOPS。

GeForce RTX 3080 Ti仍然采用了GA102核心,与GeForce RTX 3080/3090相同,下面我们来看一看GeForce RTX 3080 Ti在GA102中做了哪些改动。

完整的GA102核心

完整的GA102 GPU包含7个GPC(图形处理集群)42个TPC(纹理处理集群)以及84个SM(流处理器)组成,而GeForce RTX 3080 Ti的CUDA数量是10240个,所以可以推断GeForce RTX 3080 Ti屏蔽了两组TPC,所以只有80个SM单元,而完整GA102核心的CUDA数量应该是10752个。

为了查询方便,笔者将这几款显卡的核心参数列出,可以看到GeForce RTX 3080 Ti与GeForce RTX 3090的核心参数非常接近。相差的两个SM单元,也就是1组TPC,256个CUDA,其实在实际应用中来讲差距并不是很大,最大差别是GeForce RTX 3090相比GeForce RTX 3080 Ti多了12GB的显存;而相比RTX 3080来说提升就非常大了。

渲染8K素材占用了17GB显存(点击查看大图)

如图我们使用Keyshot9做测试,渲染8K或4K素材的显存占用率非常高,能达到17GB甚至更高,这对于只有12GB显存的RTX 3080 Ti就完全不够了,爆显存的危害想必大家也知道,可以导致游戏或软件崩溃,从而进程丢失。

02 NVIDIA Ampere架构GA102解析

GeForce RTX 3080 Ti采用了GA102核心,拥有280亿(28000 million)个晶体管,628平方毫米的面积,基于三星的8nm NVIDIA定制工艺,来自Micron的GDDR6X显存。

本次NVIDIA Ampere架构的SM在Turing架构基础上增加了一倍的FP32运算单元,这使得每个SM的FP32运算单元数量提高了一倍,同时吞吐量也就变为了一倍。

而通常我们计算显卡的CUDA数量,并不是把SM中的所有单元加起来计数,而是只统计FP32单元的数量,所以这样一来,SM中的【FP32 : INT32】 从 1:1 变为 2:1。

GeForce RTX 3080 Ti共有10240个CUDA,其实它有5120个INT32单元,但由于内部的FP32数量翻了一倍,所以最终实现了10240的CUDA数量。

而这样粗暴的提升CUDA数量对于游戏其实有着非常大的帮助,通常在游戏中浮点运算相比整数计算要常用的多,图形、算法以及各种计算操作中着色器工作负载通常需要混合使用FP32算数指令,而FP32的加速也有助于光线追踪降噪着色器。

在去年与GeForce RTX 30系显卡一同发布的还有一项新技术——RTX IO。目前很多游戏动辄几十G甚至百G的安装空间,对于存储空间的负担暂且不提,但存放在硬盘中的数据,如果显卡想要读取到,需要先由CPU从硬盘中读取压缩过的数据,经过解压缩再发送到显存中。

虽然随着NVMe SSD的推出,读取速度相较机械硬盘能够快20倍,但受制于传统I/O限制,NVMe高达7GB/秒的高速读写对于CPU是极大的负担。

传统的数据交换

在这个过程中,会占用多个CPU核心,压力急剧增大,占用较多的内存,而此时其实GPU是处于闲置状态的。RTX IO的作用就是越过CPU解压再传输数据这一步,直接从PCIE总线读取硬盘上经过压缩的数据,并且完成无损GPU解压,降低CPU占用,变向提升了性能。

RTX IO可以极大解放CPU负担

当然这项技术作为系统底层的运行方式改变,还需要借助微软发布的DirectStorage来实现,对于目前容量的游戏来说,RTX IO的改善效果有限,但假以时日等游戏容量上百G成为常态的时候,这项技术将会发挥巨大的功效。

同时搭配新增的HDMI 2.1接口,可以支持单线8K的视频输出,而上一代HDMI 2.0仅支持4K 98Hz的视频输出,如果想要连接8K电视,则需要更多的线缆支持。

03 影驰GeForce RTX 3080 Ti 星曜OC 外观

影驰GeForce RTX 3080 Ti星曜OC是外观非常独特的一款显卡,导流罩分为两部分,底层为纯白色,能够进行涂鸦设计,上面还有一层透明亚克力罩,让玩家充分发挥动手能力,下面我们也找了几张官方样图来看看涂鸦后的效果。

官方涂鸦后的星曜

官方涂鸦后的星曜

同一张显卡在不同人的手中,能有千种变化,大大提高了可玩性。当然对于绝大多数玩家来说,拿笔画画是太遥远的事情,不过好在影驰GeForce RTX 3080 Ti星曜OC的上盖和背板接受私人订制,助你打造出“百变星曜娘”。关于私人订制,用户购买后可通过电商客服联系影驰官方人员。

影驰GeForce RTX 3080 Ti 星曜OC及包装内配件一览

影驰GeForce RTX 3080 Ti 星曜OC打开包装后除了显卡本体外,还附赠了可替换的2槽位挡板、显卡支架、灯光同步线以及防滑贴等配件。而显卡则为纯白色,正面导流罩分为白色底层以及透明的亚克力罩双层,整体尺寸为316×132×56.5mm(不含挡板)。

影驰GeForce RTX 3080 Ti 星曜OC上机效果

再来看一下上机点亮后的效果,默认为RGB颜色渐变循环,因为有透明亚克力罩的原因,每种颜色看起来都晶莹剔透,仙气飘飘。可以说不涂鸦的影驰GeForce RTX 3080 Ti 星曜OC也是非常好看的。另外所有的灯光效果通过包装内附赠的12V VRGB灯光同步线,可支持四大板厂灯控软件。

11叶静霜风扇

影驰GeForce RTX 3080 Ti 星曜OC的主动散热部分采用11叶静霜风扇,每一片扇叶均为三折设计,能够有效加强进风量,顺畅输送风流,保障散热效果。内部则为大面积镀镍铜底,全面覆盖GPU和显存,搭配6根6mm镀镍复合热管辅助导热。

不规则的水晶切割亚克力罩

从显卡侧面我们可以直观感受到,影驰GeForce RTX 3080 Ti 星曜OC的透明亚克力罩均为水晶切割状,这也是为什么在通电后我们能看到如此晶莹剔透的效果。

影驰GeForce RTX 3080 Ti 星曜OC背板展示

影驰GeForce RTX 3080 Ti 星曜OC背板部分可以看到芯片处有较大面积镂空,方便发热量高的元器件散热,在尾部同样有蜂窝状的镂空处理。另外在供电接口处当外接供电连接正确,正常供电,则白灯亮起,反之则红灯亮起还有电源连接指示灯。

8+8pin供电接口

影驰GeForce RTX 3080 Ti 星曜OC定位于游戏旗舰,性能目前仅次于GeForce RTX 3090,所以功耗也与之相仿达到350W。供电接口采用了8+8pin的设计,推荐电源为750W及以上。

挡板及视频接口

视频输出接口依旧采用了DP1.4a*3+HDMI 2.1的四接口设计,另外由于新的HDMI 2.1协议,最高已可支持单线8K的视频输出。影驰GeForce RTX 3080 Ti 星曜OC的默认挡板为3槽厚度,如有机箱不兼容的情况可以手动替换为包装内的2槽挡板。

04 3DMARK 理论性能测试

首先介绍一下测试平台,为了保证此次评测能够发挥影驰GeForce RTX 3080 Ti 星曜OC显卡的最佳性能,主板和CPU采用了目前桌面旗舰级配置,具体如下。

在测试成绩上,基准测试采用3DMARK,游戏性能测试使用游戏自带Benchmark,同时为了减小误差,每项测试成绩均测试3遍取平均值。

GPU-Z参数

首先看一下GPU-Z的参数,影驰GeForce RTX 3080 Ti 星曜OC采用GA102核心,三星8nm工艺,芯片面积628平方毫米,拥有10240个CUDA,Boost频率达到1710MHz,相较公版的1665MHz有很大提升。采用12GB GDDR6X显存,位宽为384bit,显存带宽达到了912.4 GB/s,光栅单元和纹理单元为112和320。

下面先进行的是用来衡量显卡DX11理论性能的3DMARK FS套装:FS,FSE,FSU三者分别对应显卡在1080P、2K、4K的理论性能,取显卡分数实际测试结果如下(所有测试项均为一键超频后1710MHz测试结果):

3D MARK FS套装测试

在针对显卡DX11性能的3DMARK FS套装测试中,我们选择了上代和本代的4张显卡进行分值对比,以便能更好的反应影驰GeForce RTX 3080 Ti 星曜OC的性能水平。

在该测试中可以发现三款显卡的分数基本难分伯仲,其中在2K/4K分辨率下影驰GeForce RTX 3080 Ti 星曜OC的分数甚至超越了GeForce RTX 3090公版的成绩。

3D MARK TS套装测试

而在针对DX12环境下的Time Spy和Time Spy Extreme测试中,影驰GeForce RTX 3080 Ti 星曜OC的分数会略逊于GeForce RTX 3090。对比公版GeForce RTX 3080 Ti高1%,对比GeForce RTX 3080的分数要高出9%左右;对比上一代GeForce RTX 2080 Ti的分数要高出45%左右。

3D MARK 光追测试

PortRoyal是3DMARK中专门针对光追性能的测试项,在这组测试中影驰GeForce RTX 3080 Ti 星曜OC再次超越GeForce RTX 3090,虽然成绩微乎其微,但也的确出现了性能的越级;对比GeForce RTX 3080的分数提升约为13%;对比上一代GeForce RTX 2080 Ti的分数提升则非常大,约为62%。

05 游戏性能测试

在游戏性能测试中,我们选择了《德军总部新血脉》、《孤岛惊魂5》、《刺客信条:英灵殿》、《无主之地》,国产游戏《边境》、《光明记忆:无限》的benchmark跑分软件。

另外在游戏测试中,由于显卡驱动的版本更新和游戏更新非常影响游戏帧数,所有benchmark跑分成绩均以本次成绩为准。

《刺客信条:英灵殿》游戏测试

在《刺客信条:英灵殿》中影驰GeForce RTX 3080 Ti 星曜OC和GeForce RTX 3090的大部分分数相同,仅有1帧的差距。同时GeForce RTX 3080的分数差距在1080P和2K分辨率下也并不大,主要是4K分辨率会有10%左右的差距。

《德军总部新血脉》游戏测试

《德军总部新血脉》并且由于自带两个benchmark,所以我们的数据取跑分均值,另外这款游戏几乎每更新一次驱动或者游戏版本升级都会导致分数的巨大差异,在本次重新测试中,影驰GeForce RTX 3080 Ti 星曜OC小幅领先GeForce RTX 3090,而相比GeForce RTX 3080的提升约为5%左右。

《孤岛惊魂5》游戏测试

《孤岛惊魂5》同样算是优化比较到位的3A大作,但在benchmark的帧数测试中经常会不稳定,在本次测试中影驰GeForce RTX 3080 Ti 星曜OC在4K分辨率下与GeForce RTX 3090相差1帧,另外在4K分辨率下的成绩要领先GeForce RTX 3080 17%左右。

《无主之地3》游戏测试

《无主之地3》是一款采用了卡通渲染风格的游戏,它对于性能要求的下限很低而上限又很高,另外我们注意到,在本次测试中大部分游戏1080P分辨率的成绩基本没有差距,这也是因为如此高性能的GPU在1080P分辨率下已经绰绰有余,开始受制于CPU的性能。

《光明记忆:无限》游戏测试

《光明记忆:无限》是由飞燕群岛工作室开发的《光明记忆》新系列,目前还没有游戏提供试玩,不过benchmark的跑分软件官方已经提供,玩家可以在steam上自行下载。另外我们在测试的时候由于无法关闭光追选项,故所有测试成绩均为“RTX 最高/DLSS 质量”模式下进行。可以看出三款显卡的成绩基本相同,在整体性能趋同的情况下,分数差距并不大。

《边境》游戏测试

在另外一款国产游戏《边境》的跑分软件中,情况基本与《光明记忆:无限》相同,测试条件均在“RTX最高/DLSS质量”下进行。

06 功耗及温度测试

功耗测试中,我们选择FurMark软件进行拷机测试,并采用GPU-Z检测温度,功耗仅计算显卡自身。

功耗测试(点击查看大图)

影驰GeForce RTX 3080 Ti 星曜OC经过我们的实测在满载状态下单卡功耗为350W左右,满载频率保持在1965MHz左右,在整体性能与GeForce RTX 3090相仿的情况下,建议搭配750W及以上电源。

温度方面,本次的影驰GeForce RTX 3080 Ti 星曜OC经过15分钟左右的拷机,温度稳定为71℃左右,在更高频率的情况下比GeForce RTX 3080 Ti低了4℃左右,并且频率稳定无降频情况。

07 部分游戏光追及DLSS效果展示

上面我们测试了部分游戏的光追和DLSS性能表现,这些效果具体在游戏中是什么表现,下边笔者选择了两款游戏给大家展示一下。

《赛博朋克2077》RTX ON(点击查看大图)

《赛博朋克2077》RTX OFF(点击查看大图)

在《赛博朋克2077》中,光追效果随处可见,而在游戏中也运用到了不同的光追效果,包括最常见的光追反射、阴影,还有环境光遮蔽、漫反射照明以及全局光照等比较高级的效果。

RTX ON(点击图片查看大图)

RTX OFF(点击图片查看大图)

在 游《逆水寒》中,由于光追效果正处于试验阶段,并没有如宣传片一样的水面反射。但画面整体的阴影更加真实,如头顶树木的阴影,以及水面上荷叶的效果。而且由于光追效果较少,在打开该功能后帧数并没有明显下降。

《堡垒之夜》RTX ON(点击查看大图)

《堡垒之夜》RTX OFF(点击查看大图)

堡垒之夜的光追效果还是比较明显的,其中加入了反射、全局照明和路径追踪等效果。卡车车身上的反射较为明显,角色身上的环境光在打开光追后更为写实,另外仔细看的话远处建筑物的玻璃同样有光线的反射,整体画质改善非常明显。

《魔兽世界9.0》RTX ON(点击查看大图)

《魔兽世界9.0》RTX OFF(点击查看大图)

《魔兽世界9.0》同样作为一款卡通渲染的 游来说,魔兽的年代更加久远,此次加入光追效果在整体视觉上没有堡垒之夜明显。不过如远处的树木阴影,以及近处石台下方的阴影都比较明显。

《控制》RTX ON(点击查看大图)

《控制》RTX OFF(点击查看大图)

《控制》这款游戏所采用的引擎物理效果非常出色,同时光追开关的对比也是肉眼可见的明显。包括玻璃上的人物反光,远处地面的植物反光都比较清晰,同时打开光追后屋顶处的明暗对比也更加明显。

《赛博朋克2077》DLSS模式对比

DLSS的对比测试我们选择《赛博朋克2077》这款游戏,2K/RTX ON/DLSS关闭 原生画质下作为标准,在打开DLSS质量模式后可以看到整体画面几乎没有任何变化,广告牌的字样边缘依然很清晰。在DLSS平衡和DLSS性能模式中依然有着不错的状态,整体相较原生画质并无二致。

《逆水寒》DLSS模式对比

画质说明

在《逆水寒》的DLSS测试中,我们将画面设置为4K分辨率,画质为预设最高。通过关闭、快速、超级性能,3种不同模式来进行帧数以及画面的对比。

首先在关闭DLSS中,游戏帧数为26帧原生画质,打开DLSS快速模式后为41帧,而打开DLSS超级性能模式后为57帧。通过放大图片不难发现原生画质和DLSS快速模式的区别很小,而DLSS超级性能模式中角色背后的装饰会变模糊,以及木条箱的纹理边界会有较明显变化。但帧数提升却非常明

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2021年5月3日
下一篇 2021年5月3日

相关推荐