NVIDIASTUDIO对于设计师用户来说并不陌生,自从各种生产力工具软件(诸如视频编辑、3D建模渲染等等)开始支持NVIDIA显卡的硬件加速以来,N卡就成为了设计师用户装机或者购买整机的首选,而NVIDIA也最终为设计师用户推出了完整的NVIDIASTUDIO解决方案(包括NVIDIA显卡、STUDIO驱动程序和各种黑科技功能)。随着初代支持光追的Turing架构出现,NVIDIASTUDIO的强大已经让设计师用户惊叹,而支持第二代光追加速的Ampere架构,更是让NVIDIASTUDIO的功能与效率拥有了里程碑级的提升。
不止玩游戏强,NVIDIAAmpere架构生产力更犀利
相对上代架构,Ampere的SM单元、RTCore和TENSORCore都进行了升级
我们熟悉的RTX30系列显卡就采用了NVIDIAAmpere架构,它采用了三星8nm先进工艺,相对上代架构大幅提升了晶体管数量并提升了执行效率。从数据上来看,Ampere架构的SM单元提供了数量翻倍的FP32单元,每个时钟周期可实现bitFMA浮点运算;具备全新的L1缓存/材质系统,提供双倍的L1缓存带宽和缓存分区尺寸,总容量提升达33%;配备全新的加速核心,包括具备两倍三角形相交速率的第二代RTCore和具备两倍稀疏矩阵计算能力的第三代TENSORCore。这些升级让Ampere架构的SM单元FP32最高算力提升了大约%,而RTCore最高算力提升了71%左右、TENSORCore最高算力提升了约%,这些都为NVIDIAAmpere架构在各种生产力软件中的强大加速能力打下了硬件基础。
以RTX为例,得益于工艺的升级,芯片规模相比上代对位产品大幅提升
那么具体到实际应用中,Ampere架构的升级带来了什么提升呢?首先,第二代RTCore在计算光线追踪时,计算三角形相交和时间插值三位置可以同时进行,从而可以实现带光追特效的动态模糊效果,在这个计算过程中,相当于提供了最快8倍的射线穿越计算性能,相信经常需要完成3D建模工作的设计师用户很清楚这意味着这将带来多高的效率提升。
其次,虽说RTX30系列显卡每个SM单元的TENSORCore数量减少,但由于TENSORCore升级到了第三代,最终的效率反而实现了巨幅提升。举个例子,RTXSUPER每个SM单元一个时钟周期可以完成次FP16浮点运算操作,而RTX仅用一半数量的第三代TENSORCore就能单时钟周期完成次(密集矩阵)/次(稀疏矩阵)FP16浮点运算操作,这么来看的话,第三代TENSORCore的效率相对上代做到了大约一倍的提升。
RTX/RTX采用GDDR6X显存,速率为GDDR6的两倍
此外,Ampere架构的RTX/显卡还有一个巨大的升级,那就是使用了NVIDIA与美光合作开发的GDDR6X显存。由于GDDR6X显存采用了PAM4信号编码,也就是每个周期利用4个电平信号进行数据传输,效率相比GDDR6的两个电平信号大幅增加,从而带来了更高的显存数据带宽,这在需要经常进行大量显存数据交换的专业设计应用中具有极高的实用意义。
RTX30系列显卡提供HDMI2.1接口,可单数据线输出8K/60HzHDR视频信号,同时还提供了对AV1的硬件解码加速,支持8K/60fps视频实时解码
采用NVIDIAAmpere架构的RTX30系列显卡提供了对HDMI2.1接口的支持,可以实现单数据线8K/60Hz或者4K/Hz的HDR画面输出。此外,RTX30系列也是全球首批支持AV1硬件解码的显卡,可以流畅解码8K/60fps视频,这对于视频剪辑师用户来说也是一个非常有价值的特性。
RTX30系列显卡的高超算力为内容创作提供了强大的动力
在渲染动态模糊画面方面,RTX的性能约为RTXSUPER的5倍
在达芬奇视频剪辑中,RTX的效率甚至超过了RTXSUPER的两倍
正是因为Ampere架构带来了硬件性能上的飞跃,基于RTX30显卡的NVIDIASTUDIO解决方案也得到了大幅升级。从官方提供的数据来看,RTX在各种主流渲染器中的加速性能都远超RTXSUPER,在LUXMARK和V-Ray中甚至超过了RTXSUPER的两倍。视频剪辑部分,RTX也表现出了惊人的性能,DaVinci测试中的成绩远远领先RTXSUPER,甚至有些项目几乎达到了RTXSUPER的2.5倍性能。总而言之,现在设计师用户入手一块RTX30显卡,可以大幅提升工作效率、改善工作中的使用体验。
当然,除了制造工艺、架构和硬件规格方面的升级,Ampere架构的RTX30显卡还有大量针对设计师用户的黑科技功能。
新一代黑科技助力!RTX30显卡专业应用更高效
RTXIO快速载入技术
RTXIO技术可直接将压缩数据读取到显存,CPU占用率降低20倍、载入速度相较HDD提升百倍
针对磁盘数据载入特别占处理器资源、效率较低的问题,NVIDIA推出了RTXIO技术,通过这项技术,就能让GPU来处理数据解压,从而大幅度降低CPU的占用率。从图上可以看到,在PCIe4.0固态硬盘上达到同样读取速度的时候,如果采用传统的方式,会占用24个CPU核心,而采用RTXIO技术后,只需要占用0.5个CPU核心,这在实际的创意设计应用中就可以体现为载入素材和项目文件的时候更加流畅。要享受这项技术,需要软件支持微软的DirectStorageAPI,当然也需要RTX30系列显卡。
NVIDIAOMNIVERSEMACHINIMA
通过NVIDIAOMNIVERSEMACHINIMA可以让用户使用游戏素材打造电影级视频
NVIDIAOMNIVERSEMACHINIMA是基于RTX30系列GPU强大计算能力打造的APP,能够让设计师用户利用现有的游戏素材,通过RTX30显卡AI技术制作出电影级的视频。NVIDIAOMNIVERSEMACHINIMA可以从支持该技术的游戏中获取素材、工具,然后通过赋予材质、Audio2Face(声音转表情)、增加物理效果、AI采集动作,最后使用RTX光线追踪渲染从而制造出堪比电影画质的视频。
NVIDIABRODCAST
得益于RTX30系列显卡强大的视频加速和AI计算能力,用户可以轻松打造家庭工作室
NVIDIABROADCAST工具可以为用户提供强大的直播应用解决方案,它主要包括了音频降噪(降低录音的环境噪音)、虚拟背景(通过AI抠出人像,并提供各种直播时需要的虚拟背景)、摄像头自动构图(可以保证改变动态视频图像比例时,自动将目标位于视觉中央)等实用功能。从图上可以看到,麦克风、音箱(或耳机)、摄像头等设备连接到电脑后,通过NVIDIABROADCAST工具可以被AI技术强化形成虚拟设备,从而获得各种强大的功能。
由此可见,NVIDIAAmpere架构的RTX30显卡确实不止是玩游戏厉害,还有各种实用黑科技可以让你在工作中如虎添翼。当然,要享受到如此强大的性能与功能,你得拥有一块强大的RTX30显卡才行,例如技嘉雪鹰GEFORCERTXVISIONOC10G,就是众多超公版RTX显卡中的代表之作。
技嘉雪鹰GEFORCERTXVISIONOC10G
规格参数
GPU型号:RTX
核心频率:MHz
CUDA数量:
显存规格:bit/10GBGDDR6X
显存容量:24GB
显存频率:MHz
输出接口:DP1.4a×3
HDMI2.1×2
显卡配备了风之力三风扇正逆转散热系统
显卡顶部提供了支持炫彩魔光灯效同步技术的LOGO灯,色调也非常适合设计师用户
背板金属装甲设计感强烈,防护能力和散热能力出众,并提供了进气栅格设计,有利于改善机箱内散热风道
技嘉雪鹰GEFORCERTXVISIONOC10G显卡隶属于专为设计师打造的VISION系列,它采用了银色与白色的搭配,散热器造型科技感十足,符合设计师的审美口味。散热部分,技嘉雪鹰GEFORCERTXVISIONOC10G搭载了风之力3风扇散热系统,配备两个90mm与一个80mm风扇,采用刀刃式扇叶设计,搭载正逆转功能、配备7根高性能纯铜导热管、散热片巨大的铜底直接与GPU接触,风扇支持智能启停,并在背板上设计了进气格栅,这些设计对于大幅提高散热能力都很有帮助。此外,散热器的风扇还配备了纳米石墨烯润滑油,可以大幅延长油封轴承风扇的寿命,达到滚珠轴承风扇的水平。
技嘉雪鹰GEFORCERTXVISIONOC10G显卡还采用了独有的超耐久供电设计,配备数字供电电路,可以有效降低MOSFET的工作温度,而且每个MOSFET芯片都提供了过温保护、支持负载平衡,配合长寿命的固态电容、合金电感与低电阻式晶体管等超耐久用料,提供强劲的显卡性能和更长的使用寿命。频率方面,该显卡的核心频率达到了MHz,比公版的MHz高出很不少,性能表现更出色。
接下来,我们一起来看看技嘉雪鹰GEFORCERTXVISIONOC10G在实际的设计师应用中,相对上代旗舰有多大的优势吧。
RTX生产力性能实测:相对上代旗舰提升巨大
测试平台
显卡:技嘉雪鹰GEFORCERTXVISIONOC10G
主板:技嘉设计师ZVISIOND
内存:技嘉DESIGNAREDDR4032GB×2
处理器:Intel酷睿iK
硬盘:技嘉钛雕AORUSGens1TB
电源:技嘉AORUSAPGM
操作系统:Windowsbit专业版20H2
NVIDIASTUDIO驱动.92
在达芬奇视频转码测试中,得益于新一代编码器和CUDA算力的大幅提升,RTX相对上代旗舰RTXTi有大约12%的效率优势,这个提升是非常可观的,可以有效提升视频后期处理效率。
Blender渲染测试中,RTX相对RTXTi的优势从32%到72%不等,综合优势为58.7%,这就非常厉害了。特别值得一提的是,新版Blender使用了Optix渲染引擎,对于RTX30显卡的光线追踪加速支持也非常完善,能够更好地发挥RTX30显卡第二代光追的强大性能,提供更高的执行效率。
V-Ray测试中,RTX相对RTXTi的优势也高达75.8%,渲染效率得到了跨代的巨大提升。OctaneRender测试包括了开关光追情况下的渲染对比,从测试来看,关闭光追的时候,RTX相对RTXTi的优势约为30%(完全来自CUDA计算的优势),而开启光追后,优势提升到了46%~49%。由此可见,在包含光追渲染的专业设计应用中,RTX的优势会被进一步放大,第二代光追单元的升级幅度确实是非常明显的。
总结:高效渲染无压力,专业设计装机首选RTX30显卡!
从前面的测试数据可以看到,如果设计师将手中的RTX20系列显卡升级到RTX30系列显卡,并搭配最新版的NVIDIASTUDIO驱动程序,就可以在视频剪辑、3D建模渲染输出等等创意设计应用中获得巨大的工作效率提升,这对于“时间就是金钱”的设计师用户来说,相当于带来了可观的经济利益和更舒适、流畅的工作体验。所以,说RTX30显卡是“设计师必备”真是毫不为过的。当然,技嘉雪鹰GEFORCERTXVISIONOC10G作为专门为设计师用户打造的高效生产工具,不但在外观设计方面更符合设计师用户的品味,而且在散热设计与性能方面也相比公版表现更价,确实值得设计师用户优先选择。
特别补充:如何切换NVIDIASTUDIO驱动
在NVIDIA