挑战CPU,GPU通用化强势来袭
提到3D渲染和建筑可视化,相信很多创意家们都会很自然的在需求清单上加入一颗强劲的处理器,由于之前的3D渲染软件的渲染器都是CPU渲染器,所以很多创意家都抱有”反正都是处理器渲染,不是专业显卡,游戏显卡没什么提升,随便选一个就可以了”这样的观念。
GPU与CPU两者之间的不同,体现在他们处理任务的不同方式上。CPU由专为串行任务而优化的核心组成,GPU则是由数以千计的更小、更高效的核心组成的大规模并行架构(专为同时处理多重任务而设计)。因此,在并行处理特定数据的时候,GPU要比CPU高效很多。
那既然GPU效率高,为什么还是需要CPU来干这事呢?CPU是为了解决复杂的通用计算问题而生,而早期GPU因为指令集有限和浮点小数支持度的问题,在通用计算方面限制较多。在离线渲染中,算法复杂,并行计算难度较大,更适合CPU工作。而实时渲染中,渲染器逻辑得到简化,加上渲染器算法的不断迭代,所以能够适应GPU的工作模式。另外,早期的GPU并没有通用计算架构也是一大问题。
在游戏显卡无法魔改专业显卡的这些年里,普通玩家们似乎对已经淡忘了显卡对于专业应用软件的加速能力。但随着游戏市场需求的牵引,GPU的性能得到了极大的提升,主流的GPU都采用了统一架构单元,大大的扩展了应用范围,从而使得GPU也能够支持越来越复杂的运算,可编程性和功能得到了极大的扩展,单精度浮点处理能力也得到了极大的增强。以NVIDIA显卡为例,其搭载了CUDA通用并行计算架构,该架构让GPU可以参与解决复杂的计算问题,借助NVIDIA提供的CUDA SDK,开发者可以更容易地让GPU参与到运算中。
与此同时,越来越多的主流应用和渲染器开始支持GPU参与辅助计算,带来了效率上极大的提升。所以,现在已经从单纯的CPU计算时代开始逐渐转向GPU辅助CPU计算的时代。GPU在3D渲染、视频压缩编码、图像处理、流体力学等方面的作用越来越大。
从1999年第一块Quadro GPU出世到现在已经整整20年,在这20年里,NVIDIA在专业图形计算方面积累了大量的经验,和业界众多知名专业应用达成了良好的合作,成为了专业显卡市场中绝对的王者。
提到建筑可视化与3D渲染,那就不得不提到渲染器。如今,3D渲染软件的渲染器早已不是CPU渲染器的天下。Redshift、Octane等GPU渲染器得到了创意家们的一致好评,并成为了市面上主流的渲染器,在各类炙手可热的创意应用中表现出色,为丰富的虚拟世界高效建模和渲染。
在NVIDIA RTX GPU和NVIDIA RTX STUDIO的支持下,可以使用GPU极大的加速如Autodesk 3ds Max、Maya、Maxon Cinema 4D 和 Blender这样的应用对大型3D场景进行实时建模和渲染,方便创意家们无缝打造复杂的可视化和动画效果。
借助NVIDIA RTX GPU 和NVIDIA RTX STUDIO,还能更好的加速基于物理效果的渲染,让光线追踪功能可让创意家们的 Autodesk Arnold、Chaos Group V-Ray、OTOY OctaneRender、Maxon Redshift 和 Blender Cycles 中以栩栩如生的方式实时呈现素材。
虽然光线追踪在概念层面很简单,但是在计算层面却比较复杂
随着RTX GPU的推出,NVIDIA 还设计了新一代的NVIDIA OptiX框架来让开发者和使用者能够更方便的上手。OptiX框架的核心是一个特定领域的实时编译。编译器通过结合用户提供的光线生成、材质着色、对象相交和场景遍历的程序来生成自定义光线追踪内核。高性能是通过使用紧凑型对象模型和光线追踪编译器优化实现的,可有效地映射到全新RTX GPU上。其利用了最新的RTX GPU架构特性,无需在应用层面进行更改,同时还包含了基于AI的降噪器,可有效改善设计师们在实时渲染中的体验。同时,其还能通过垮多个GPU 的透明缩放、以及通过NVLink自动组合多个GPU显存来实现大型场景的渲染,并灵活支持任意着色模型,包括基于物理的MDL材料规范的实施示例等。
惊人效率提升,NVIDIO RTX Studio性能实测
测试平台
显卡:技嘉RTX 2070 SUPER GAMING OC WHITE 8G
CPU:AMD 锐龙7 3800X
内存:芝奇幻光戟8GB DDR4 3200MHz × 2
主板:技嘉X570 AORUS PRO WIFI
硬盘:技嘉AORUS NVMe Gen4 SSD
电源:技嘉AORUS AP850GM
操作系统:Windows10 64bit 2004 专业版
显示驱动:NVIDIA Studio Driver 451.48
技嘉RTX 2070 SUPER GAMING OC WHITE 8G隶属于技嘉GAMING显卡系列,相比大小雕系列性价比更高,更适合主流玩家的选购需求。其拥有40个RT Cores,加速频率为1815MHz(公版为1770MHz),可以为创意家们提供更加强劲的光线追踪计算能力。
散热部分,该显卡的采用了6条结合了传统沟槽式和铜粉烧结式热管优点的复合式热管直触GPU的设计,通过双重传导媒介,能将热量更快速地导出。该显卡依旧拥有个技嘉引以为傲的正逆转气流导向风扇设计,三个刀锋式风扇中,位于正中央的风扇旋转方向与左右两个风扇相反,能将风扇风流导向同一方向,加强风压、减少扰流,提升整体散热性能。
其供电部分采用8相核心供电和2相显存供电的设计,有效降低MOSFET的工作温度,而且每个MOSFET都有提供过温保护设计和负载平衡,再加上长寿命固态电容、合金电感与低电阻式晶体管等超耐久用料,提供强劲的显卡性能和更长的使用寿命。
V-RAY For SketchUP测试
软件版本:SketchUP2020,V-Ray Next 4.20.02
V-Ray渲染器是一款应用非常广泛的渲染器,可以支持3DS MAX、SKETCHUP、MAYA、CINEMA 4D、HOUDINI、KATANA、BLENDER等主流3D设计制作软件。V-Ray Next作为其最新版本为创意家们带来了全新的GPU渲染体验,之前的V-Ray RT 渲染器更名为 V-Ray GPU,新版本将成为更加强大的产品级渲染器。由于 V-Ray GPU 在 CPU 和 NVIDIA GPU 上使用相同的准蒙特卡罗(Quasi Monte Carlo , QMC)采样,因此可以保证在渲染农场中所有的计算机获得相同的结果。V-Ray Next 为 V-Ray GPU 带来了巨大的速度提升,新的内核架构在整体上提高了 GPU 性能,自动曝光、V-Ray 去噪支持可组合渲染元素以及交互式快速 NVIDIA AI Denoiser 等新的后期制作功能极大地扩展了 V-Ray GPU 的生产级使用。
在这里我们选择SketchUp搭配V-Ray Next渲染器进行测试,SketchUp是一个极受欢迎并且易于使用的3D设计软件,也是目前建筑、城市规划、室内设计、园林设计等行业经常用到的软件,上手简单,使用方便。而其搭配各种渲染器可以为使用者提供非常方便易用且丰富的效果呈现。
V-Ray Next 渲染器
降噪测试
在实际使用中,V-Ray Next除了支持NVIDIA GPU的CUDA渲染,还能够很好的支持OptiX渲染模式。我们使用V-Ray Next的官方demo模型文件进行了实际渲染测试,从测试来看,使用技嘉RTX 2070 SUPER GAMING OC WHITE 8G的 GPU CUDA计算可以将整体渲染时间缩短至CPU渲染的一半,而如果使用全新的RTX OptiX API进行渲染,性能上的表现则更加强劲,只用了CPU处理时间的1/3左右即可完成渲染,带来了巨大的效能提升。
借助 RTX 加速的光线追踪实现高性能渲染输出的同时。V-Ray Next还能借助NVIDIA GPU的AI降噪功能,进一步加速交互式渲染。我们在渲染器中可以看到其支持V-Ray降噪和NVIDIA AI降噪两种模式。在同样使用RTX OptiX API进行渲染的情况下,使用NVIDIA AI降噪相比V-Ray降噪节省了13%的时间,NVIDIA GPU的AI人工智能张量核心得到了很好的利用。
AUTODESK ARNOLD渲染测试
软件版本:3Ds Max 2021、Arnold 4.04.36(内核6.0.3.0)
Arnold渲染器是一款高级的、跨平台的渲染 API,其基于物理算法的电影级别渲染引擎,正在被越来越多的好莱坞电影公司以及工作室作为首席渲染器使用。与传统用于 CG 动画的 scanline(扫描线)渲染器不同,Arnold 是照片真实、基于物理的光线追踪渲染器。我们看到的《地心引力》《饥饿游戏》《复仇者联盟》《X战警》《源代码》等好莱坞大片中均有其参与渲染的身影。
之前的Arnold渲染器给大家的印象便是真实细致的画面表现,但由于其能支持CPU渲染,渲染速度慢也是创意家们比较在意的地方。在RTX GPU诞生之后,NVIDIA与AUTODESK进行了密切的合作,如今Arnold渲染器已经支持RTX GPU加速光线追踪,可实现超快的逼真渲染,同时可以通过AI 降噪实现快速的交互式渲染。
Arnold渲染器可以在 3Ds Max、Maya、Houdini 和 Cinema 4D 等众多热门 3D 应用中使用。我们在这里搭配工业设计、建筑设计、三维动画、多媒体制作、游戏、工程可视化、影视等领域经常用到的AUTODESK 3Ds Max进行测试。
如今Arnold渲染器已经是3Ds MAX的内置渲染器之一,3Ds MAX 2021直接内置了可以支持GPU渲染的新版Arnold渲染器,我们在渲染设置中直接选择Arnold渲染器即可使用。在Arnold渲染器设置的System中,可以很方便的切换CPU与GPU渲染模式。
从渲染时间来看,Arnold渲染器的GPU渲染效率非常惊人,在使用技嘉RTX 2070 SUPER GAMING OC WHITE 8G这样的性能级显卡的情况下,只用了不到CPU渲染十分之一的时间即可完成渲染,提升非常恐怖。
之前创意家们担心的GPU渲染效果不如CPU的问题在这里也得到了妥善的解决。Arnold渲染器支持NVIDIA OptiX降噪器,利用AI神经 络可以快速的进行降噪处理。在测试中,开启降噪后,我们得到了较为精美的画面,但整体时间依旧不到处理器渲染时间的十分之一,表现非常不错。
当然,从目前来看,Arnold渲染器的GPU渲染还有一部分渲染效果无法支持,但相信随着开发的深入,这些问题都将引刃而解。而更高效的GPU渲染,也将把更好的实时渲染效果带入创意家们的视野,带来更方便高效的创作体验。
Blender渲染测试
软件版本:Blender 2.83
Blender 是一款开源的跨平台全能三维动画制作软件,提供从建模、动画、材质、渲染、到音频处理、视频剪辑等一系列动画短片制作解决方案。Blender 拥有方便在不同工作下使用的多种用户界面,内置绿屏抠像、摄像机反向跟踪、遮罩处理、后期结点合成等高级影视解决方案。同时还内置有卡通描边(FreeStyle)和基于 GPU 技术 Cycles 渲染器。以 Python 为内建脚本,支持多种第三方渲染器。
Blender Cycles中由RTX加速的OptiX光线追踪可提供超快的渲染速度。GPU 加速的交互式视窗支持对更庞大和更复杂的 3D 场景进行建模和渲染。
Blender渲染模型
从测试成绩来看,在使用技嘉RTX 2070 SUPER GAMING OC WHITE 8G这样的性能级显卡的情况下,GPU CUDA的渲染时间只有处理器渲染时间的三分之一,而NVIDIA OptiX的渲染时间则只有处理器渲染时间的四分之一,效率表现非常突出。
实时设计可视化,GPU渲染的未来可期
上手简单、速度快、实时显示结果,实时设计可视化正一步步走来,离我们越来越近。NVIDIA RTX STUDIO在支持实时渲染器方面也有非常不错的表现,在使用了NVIDIA RTX STUDIO收,Lumion、Twinmotion、Enscape之类的实时渲染器将获得更快的实时渲染表现和更稳定性使用体验。
对于光线追踪技术的大力推进还在继续进行中,NVIDIA和国内D5渲染器团队通过战略合,D5 Render渲染器的最新1.6正式版本已经支持基于NVIDIA图灵架构重新研发的混合实时渲染管线。这是国内首款支持实时光线追踪的渲染器,进一步壮大了NVIDIA Studio生态。利用AI加速核心Tensor Cores,和重新研发的混合实时渲染管线、自研动态全局光照技术,D5渲染器可以高效生成8K分辨率、清晰锐利的图像,并大幅缩短动画渲染时间。
基于UE4的D5 Render渲染器可以做到无需烘焙、预计算,实时渲染高品质画面,NVIDIA RTX技术使D5渲染器能够在几分钟内计算和缓存全局照明,反射和阴影数据,并导出4K动画。与CPU渲染器或上一代GPU加速相比,D5渲染器此次更新将动画渲染时间缩短10倍以上。除了实时光线追踪外,D5渲染器还利用RTX进行AI降噪。借助分别用于实时交互和最终输出的两种不同的AI去噪器,设计人员可以在整个可视化过程中轻松创建无噪声的图像。
总的来说,实时设计可视化在NVIDIA RTX Studio的支持,离我们将越来越近,使用体验也将越来越好。
总结:建筑可视化高效率首选NVIDIA RTX STUDIO
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!