索泰GeForce RTX 4090 AMP EXTREME AIRO评测 圆润外表下的锋芒毕露

首批RTX4090 显卡已经上市一段时间了,相信大家已经被40系显卡强大的硬件性能所折服,NVIDIA Ada Lovelace 架构本次带来的第三代光追技术和DLSS3 技术,再一次重新书写了GPU市场的竞争规则,无论是画面效果还是计算性能,都达到了前所未有的巅峰。今天为大家带来的则是索泰的GeForce RTX 4090 AMP EXTREME AIRO显卡评测。

索泰GeForce RTX 4090 AMP EXTREME AIRO评测 圆润外表下的锋芒毕露

在过去的一段时间,我们也陆续为大家带来了多款非公版RTX 4090 的产品评测,不过今天一定是外观设计最为独特的一款产品,下面我们一起来详细地了解一下。

1 索泰GeForce RTX 4090 AMP EXTREME AIRO概览

索泰AMP系列是索泰的旗舰产品系列,曾经只在海外市场发售,近年来,索泰为了丰富次旗舰产品线,将这个系列也带到了国内市场,AMP系列的最大特色便是独特的外观设计。

索泰GeForce RTX 4090 AMP EXTREME AIRO评测 圆润外表下的锋芒毕露

从正面看过去,索泰GeForce RTX 4090 AMP EXTREME AIRO的最大特点便是圆润。现如今几乎所有的显卡都采用立体方正的外观设计,索泰的这份圆润可以说是非常难得。显卡的表面采用了温和的曲线纹理过渡,三颗风扇的中心大胆地使用了金色点缀,黑金配色将显卡的档次拉升了一个等级。RGB灯带围绕着三枚风扇,点亮后可以与显卡的其他四个区域的灯光形成幻光同步效果。

索泰GeForce RTX 4090 AMP EXTREME AIRO评测 圆润外表下的锋芒毕露

索泰表示GeForce RTX 4090 AMP EXTREME AIRO的创意灵感来自空气动力学,整个显卡的造型都是为了让气流更好地服务于显卡散热,显卡本身的散热系统也进行了全面迭代优化,带来了名为IceStorm3.0 的风扇系统。

索泰GeForce RTX 4090 AMP EXTREME AIRO评测 圆润外表下的锋芒毕露

索泰GeForce RTX 4090 AMP EXTREME AIRO 配备了三个11cm直径的仿生盾鳞2.0风扇,支持智能启停,中央的风扇反向旋转,有效减少乱流、降低风扇噪音。三枚风扇的扇叶面积大幅提升,每一片扇叶的曲率和鳞状仿生条纹都能够大幅提升进风量、风压和风流,同时也增加了风扇的厚度,加深了风扇外罩,让气流更加集中,使风扇产生的气流集中压向散热鳍片,从而提升散热效率。

索泰GeForce RTX 4090 AMP EXTREME AIRO评测 圆润外表下的锋芒毕露

超大VC均热板

索泰GeForce RTX 4090 AMP EXTREME AIRO评测 圆润外表下的锋芒毕露

9热管豪华阵列

索泰GeForce RTX 4090 AMP EXTREME AIRO评测 圆润外表下的锋芒毕露

加厚散热鳍片

在内部的散热模组上,索泰GeForce RTX 4090 AMP EXTREME AIRO 使用了9根冰脉2.0热管豪华阵列,通过大面积的VC均热板覆盖核心和显存部位,并且加厚、加高了散热鳍片,让热量能够以最快的速度从核心向外扩散。

索泰GeForce RTX 4090 AMP EXTREME AIRO评测 圆润外表下的锋芒毕露

索泰GeForce RTX 4090 AMP EXTREME AIRO的四周均设有导流通道,气流可以吹透所有鳍片,从各个方向流动排出,减少显卡内部的热量堆积,降低GPU核心的温度压力。

索泰GeForce RTX 4090 AMP EXTREME AIRO评测 圆润外表下的锋芒毕露

索泰GeForce RTX 4090 AMP EXTREME AIRO 的背部设计同样出彩,流线型的线条贯穿于显卡背板,“LIVE TO GAME”的品牌宣言和支持RGB灯光效果的索泰LOGO遥相呼应,位于散热鳍片右侧的线条纹理同样支持RGB灯光效果。

索泰GeForce RTX 4090 AMP EXTREME AIRO评测 圆润外表下的锋芒毕露

显卡右侧背板采用镂空设计,便于风扇从显卡背面抽取冷空气,提高散热效率。

索泰GeForce RTX 4090 AMP EXTREME AIRO评测 圆润外表下的锋芒毕露

显卡顶部采用半透明彩虹色涂层,设计灵感来源于北欧神话中的彩虹桥,点亮时透射出惹眼的光芒,旖旎斑斓,呈现出独特的美感。即便是在没有点亮的状态下,也能够感受到它反射出的流光溢彩,个性十足。

索泰GeForce RTX 4090 AMP EXTREME AIRO评测 圆润外表下的锋芒毕露

中心位置照例是一组16pin电源接口,索泰GeForce RTX 4090 AMP EXTREME AIRO 采用了高成本镀金12+4P供电接口,接口的金属端子整体镀金,减缓氧化、降低电源线和接口的接触阻抗,减少发热量。另外显卡附带了一组16pin电源转接线,最高可提供600W供电能力,为后续超频奠定基础。

接口右侧是BIOS切换按键,索泰GeForce RTX 4090 AMP EXTREME AIRO 提供了加速和静音两种模式,既可以通过这个物理按键切换,也可以在索泰的Firestorm控制软件中调整,这一点比其他很多竞品做的方便。

索泰GeForce RTX 4090 AMP EXTREME AIRO评测 圆润外表下的锋芒毕露

索泰GeForce RTX 4090 AMP EXTREME AIRO 采用三槽设计,提供了三个DP1.4和1个HDMI2.1 显示输出接口,索泰的LOGO也在这里有直接体现,设计细节到位。至于呼声较高的DP2.0,其实目前绝大部分消费级游戏显示器都没有实装,且DP1.4a标准也能够支持8K60Hz刷新率的显示器。所以,综合来看,绝对够用。

索泰GeForce RTX 4090 AMP EXTREME AIRO评测 圆润外表下的锋芒毕露

总体来说,索泰GeForce RTX 4090 AMP EXTREME AIRO 的散热器高度和厚度都相当夸张,显卡的整体尺寸为355x166x72mm,对机箱的空间要求还是比较大的,当然这也是所有RTX4090共同的问题。

2 FireStorm软件

本次FireStorm软件也进行了更新,界面更直观,UI设计也更好看了。软件共分为五大栏,首页的状态栏可显示显卡详细信息,包括温度、风扇、核心频率等实时信息。

索泰GeForce RTX 4090 AMP EXTREME AIRO评测 圆润外表下的锋芒毕露 索泰GeForce RTX 4090 AMP EXTREME AIRO评测 圆润外表下的锋芒毕露

风扇一栏同样可以显示当前转速信息,更重要的是可以手动调节风扇转速曲线或者手动控制,这对于超频的用户来说比较重要。

索泰GeForce RTX 4090 AMP EXTREME AIRO评测 圆润外表下的锋芒毕露

性能一栏便于玩家手动超频,不过超频有风险,还需谨慎。如果是超频新手,可以先试试简单拉一点频率及功耗,而电压则需要一点一点手动增加,直至参数稳定即可,不要一下都拉满。

索泰GeForce RTX 4090 AMP EXTREME AIRO评测 圆润外表下的锋芒毕露

而灯效部分其实才是玩家调节最多的地方,本次FireStrom提供了丰富的选项,可以整卡灯效调节,也可以分区域调节。

索泰GeForce RTX 4090 AMP EXTREME AIRO评测 圆润外表下的锋芒毕露

不得不说,卡身整体柔中带刚加上彩虹桥式的灯效,相比常规方方正正的显卡更具观赏性。最后一栏则是软件方面的相关设置,就不在这里多说了。

3 Ada Lovelace 是谁?

下面我们来看一下此次推出NVIDIA Ada Lovelace架构,我们先从Ada Lovelace这个人讲起,相较于Ampere,这位似乎大家更陌生一些。

Ada Lovelace(1815-1852)是英国数学家、计算机程序创始人,建立了循环和子程序概念,被称为世界上第一位程序员

Ada从小对数学有极高天赋,其父称她为“平行四边形公主”,后来的合作伙伴Charles Babbage称她为“数字女巫”。在19岁时Ada嫁给了自己曾经的科学家庭教师,婚后的她对数学热情不减。

索泰GeForce RTX 4090 AMP EXTREME AIRO评测 圆润外表下的锋芒毕露

1842年到1843年花了9个月时间翻译了Babbage的《分析机概论》的备忘录,写了很多注记,其中给出了用计算机进行Bernoulli数求解的详细说明。由此,Ada被广泛认为是世界上第一位程序员。

而以她名字命名的语言——ada语言,已经成为了美国军方开发战斗机等尖端武器的语言。

从几行简短的生平简介中,不难看出Ada的生命虽然只经历了短暂的37个春秋,但却足以被后人铭记。

这也是为什么此次NVIDIA RTX 40的先行宣传中,用到了“以未来敬传奇”的slogan,下面我们详细剖析一下,这次的Ada Lovelace还有哪些创新和超越。

4 NVIDIA Ada Lovelace架构

本次发布的GeForce RTX 40系显卡由全新的NVIDIA Ada Lovelace架构打造,采用TSMC 4nm定制工艺(TSMC 4 nm NVIDIA Custom Process),旗舰核心AD102达到了恐怖的760亿个晶体管,而在RTX 30系显卡中为280亿个。

索泰GeForce RTX 4090 AMP EXTREME AIRO评测 圆润外表下的锋芒毕露

与上一代NVIDIA Ampere相比,NVIDIA Ada Lovelace在相同功率下,具有2倍以上的性能提升。最高可达到90-TFLOPS的着色器数据吞吐量,而本次发布的GeForce RTX 4090则达到83-TFLOPs,相比上一代NVIDIA Ampere则只有40-TFOPs。

索泰GeForce RTX 4090 AMP EXTREME AIRO评测 圆润外表下的锋芒毕露 索泰GeForce RTX 4090 AMP EXTREME AIRO评测 圆润外表下的锋芒毕露

完整的AD102核心共有18432个CUDA,其中包含12个图形处理集群(GPCs), 72个纹理处理集群(TPCs), 144个流式多处理器(SMs)。144个第三代光追核心(RT Cores)、576个第四代张量核心(Tensor Cores)。另外可以看到Boost频率也从1.9GHz猛增到了2.5GHz。

另外一点在架构图上没有体现的是,AD102核心还包含288个FP64双精度浮点核心(每SM 2个),用来确保FP64代码正确处理,包括FP64张量核心代码。

通常来讲,单精度浮点运算会用于深度学习模型训练,而双精度浮点运算则用于数值模拟工作。通常游戏卡都会砍掉FP64,这既节省了成本,又对游戏本身没有影响。而专业卡都保留有FP64,目的就是为了精度更高训练与计算。

此次资料中只提到了AD102核心搭载了288个FP64,尚不知道后续的推出的产品有无变更。

索泰GeForce RTX 4090 AMP EXTREME AIRO评测 圆润外表下的锋芒毕露

了解了完整的GA102核心,我们再来看一下RTX 4090的核心,其实知道了RTX 4090的参数,我们大概也能了解到后续可能推出的“Ti”系列究竟相差在哪。

相比完整的GA102来说,RTX 4090共有16384个CUDA,其中包含11个GPC、64个TPC以及128个SM单元,第三代RT Cores为128个,第四代Tensor Cores为512个。

索泰GeForce RTX 4090 AMP EXTREME AIRO评测 圆润外表下的锋芒毕露

其实根据完整的架构图就能看出,此次Ada架构整体结构性的改动并不大,这一点从SM单元便能清晰印证,同样的FP32 CUDA核心,同样的FP32/INT32混合CUDA核心,同样的L1级缓存等等。当然,每个SM单元内部的Tensor Core升级为第四代。

索泰GeForce RTX 4090 AMP EXTREME AIRO评测 圆润外表下的锋芒毕露

不过变化最为显著的,则是第三代光追核心,我们结合两代架构来看。在第二代光追核心中,包含负责边界交叉测试的Box Intersection Engine引擎,和负责三角形交叉测试的Triangle Intersection Engine引擎。

索泰GeForce RTX 4090 AMP EXTREME AIRO评测 圆润外表下的锋芒毕露

而在第三代光追核心中,还增加了两个新的引擎:Opacity Micro-Map Engines(OMM)和Displaced Micro-Mesh Engines(DMM),这两个新的硬件单元可以极大地提升光追性能(具体原理后文详细介绍)。

索泰GeForce RTX 4090 AMP EXTREME AIRO评测 圆润外表下的锋芒毕露

至此,每2个SM单元组成一个TPC单元,每6组TPC单元组成一个完整的GPC顶层单元(在部分核心中,会出现5组TPC组成一个GPC单元的情况)。

而每个GPC单元又搭载一个独立的光栅引擎、两组ROP分区(每组包含8个ROP单元)。

过多关于数数的部分就不再介绍了,毕竟此次架构图的大面上与NVIDIA Ampere架构基本相同,下面我们分别来看看,除了性能Ada架构还有哪些升级。

Shader Execution Reordering (SER)着色器执行重排序

SER主要的作用是提升着色器性能,它可以将效率低下的工作负载,动态重组为更高效的工作负载。主要针对光线追踪的性能提升非常大。

简单地说,GPU在执行类似工作的时候效率最高。但随着光追效果越来越强大,每个场景可能有数百万条光线照射在不同材质上,而我们知道不同材质的反射率,以及反射效果也是不同的。所以这样就为着色器创建了大量的、发散的,效率低下的工作负载。

索泰GeForce RTX 4090 AMP EXTREME AIRO评测 圆润外表下的锋芒毕露

SER则可以将这些杂乱的指令重新分门别类,动态重组为更高效的工作负载。根据NVIDIA的说法,SER可将着色器性能最多提升2倍,并将游戏帧率最高提升25%。

索泰GeForce RTX 4090 AMP EXTREME AIRO评测 圆润外表下的锋芒毕露

举个简单的例子,当光线第一次从发射端到碰撞端是非常有规律的射线,而碰撞到物体后的二次光追,则会出现大量发散的、无规律的反射,这对于光追负载是非常高的。而从图中便能看到,SER可以将这些指令进行二次排序,以发挥出着色器的最大性能。

不过好在这么实用的功能并不是RTX 40系的专利,它是一个易于集成的SDK,目前需要游戏开发商集成在游戏中。另外由于它是一个通用的逻辑,后续也有可能直接集成在Windows的API中,这样游戏开发者就无需特意引用,直接调用系统API即可。

索泰GeForce RTX 4090 AMP EXTREME AIRO评测 圆润外表下的锋芒毕露

可以说SER对于手持RTX 20系及以上(能够开启光线追踪)的N卡用户来说,是极大地福音。毕竟免费提升的光追性能,谁不喜欢呢。

第三代 RT Cores

RT Core的作用在于更快的光线追踪计算能力,如果说在RTX 30系显卡中,想要畅享4K高帧率游戏有点吃力,那么RTX 40系显卡中,将显得轻而易举。

索泰GeForce RTX 4090 AMP EXTREME AIRO评测 圆润外表下的锋芒毕露

在GeForce RTX 4090这张显卡上,达到了191 RT-TFLOPs的处理能力,而RTX 30系显卡最快处理能力为78 RT-TFLOPs,足足为2.4倍。并且根据NVIDIA的官方说法,第三代RT Core的峰值RT-TFLOPs相比于前代提高了2.8倍。而这只能说明,这张4090并非Ada Lovelace架构的最终形态。

Opacity Micro-Map Engines(OMM)

在第三代RT Cores中引入了两个重要的硬件单元,首先是Opacity Micro-Map Engines,可以理解为微映射透明度引擎,它主要的作用是优化光线追踪渲染,可大幅减轻着色器的工作负担。

比如树叶之类的复杂物体,不同的光线都会影响它的表现状态,以及树叶之间的光线反弹,所以对于光线追踪的计算量是巨大的。

索泰GeForce RTX 4090 AMP EXTREME AIRO评测 圆润外表下的锋芒毕露

不过Opacity Micro-Map Engines可以将光线追踪特性烘焙到不透明蒙版中,所以那些不规则形状和半透明的对象,也就能够更快更精准的渲染出来,从而极大减轻着色器的工作负担。

Displaced Micro-Mesh Engines(DMM)

Displaced Micro-Mesh Engines可理解为微网格置换引擎,它构建光线追踪的BVH(Bounding volume hierarchy)的速度提高了10倍!所使用的的显存减少了20倍!

索泰GeForce RTX 4090 AMP EXTREME AIRO评测 圆润外表下的锋芒毕露

DMM由第三代RT core本地处理,与前几代相比,它只使用基本三角形渲染复杂几何图形,极大减少了存储和处理需求。

具体的工作原理从图中一目了然,新的DMM可以将面数非常多的复杂图形做简化,创造出简单的模型,但整体的光线追踪效果不变。

索泰GeForce RTX 4090 AMP EXTREME AIRO评测 圆润外表下的锋芒毕露

通过一些模型数据我们可以具体看到,新的DMM将模型简化了多少。原本1100万三角面的模型,经过简化后,只有15万左右的微网格,BVH的构建速度提升了8.5倍,小了6.5倍。

而这还不是最夸张的,越复杂的模型往往优化的效果越好,在官方展示的这几组对比示例中,最快可提升大于15倍的速度,容量简化20倍的模型。

第四代 Tensor Cores

除了光追单元的升级外,第四代张量核心的升级更加恐怖。它采用了新的FP8张量引擎,在GeForce RTX 4090这张显卡上,吞吐量达到了1.32 Tensor petaFLOPs,提高了5倍。

注意这里的单位——petaFLOPs。以往的TFLOPs为万亿次浮点运算,而petaFLOPs则为千万亿次浮点运算。

索泰GeForce RTX 4090 AMP EXTREME AIRO评测 圆润外表下的锋芒毕露

DLSS 3 神经网络渲染新时代

本次推出的DLSS 3也是RTX 40系一大卖点,从DLSS 2.3直接迈入了3.0版本,也能看出此次的升级之大。而DLSS 3也被NVIDIA官方称为神经网络渲染新时代。

全新的DLSS 3在原有的DLSS超分辨率的基础上,添加了光学多帧生成技术,以生成全新的帧,而不像原来只能生成像素。

索泰GeForce RTX 4090 AMP EXTREME AIRO评测 圆润外表下的锋芒毕露

DLSS 3结合了DLSS超分辨率、DLSS帧生成和NVIDIA Reflex这三大技术,能够重建八分之七的像素,极大提高性能。

在GPU受限的游戏中,比如2K分辨率及以上的更高分辨率,DLSS 2能够将帧率提高2倍,DLSS 3则能够提升4倍。

本次DLSS 3跨越了一个大版本,从想法和原理上也再度升级,完全“猜想”1帧的技术,我们解释起来简单,但实施起来需要大量的推理与演算,以及绝对超前的想法。

不过“凭空”生成的1帧,在延迟上绝对要比DLSS 2高。所以此次完整的DLSS 3中,捆绑了NVIDIA Reflex,可以有效帮助减小延迟。

索泰GeForce RTX 4090 AMP EXTREME AIRO评测 圆润外表下的锋芒毕露

这也不负NVIDIA给它起了个“神经网络渲染新时代”的名号。纵观目前市面上的XeSS、FSR技术,DLSS绝对称得上“巨人的肩膀”。当然,连年的创新,苦的是手持上一代显卡的玩家,想体验DLSS 3的帧生成,目前唯一的办法就是购入一张RTX 40系显卡。

New Optical Flow Accelerator

New Optical Flow Accelerator光流加速器是在第四代Tensor Cores中最新引入的,这也是为何DLSS 3中的帧生成为RTX 40系显卡独享。

光流加速器在原本DLSS 2的基础上,还可以计算两个连续帧内的光流场,能够捕捉游戏画面从第1帧到第2帧的方向和速度,从中捕捉粒子、反射和光照等像素信息。并分别计算运动矢量和光流来获得精准的阴影重建效果。

索泰GeForce RTX 4090 AMP EXTREME AIRO评测 圆润外表下的锋芒毕露

以《赛博朋克2077》为例,在第一帧,光流加速器会捕捉到每一个像素中的粒子、反射和光照等信息。并在第二帧中查找匹配的像素区域,计算帧之间的差值。

如果说原来DLSS 2能够“猜”出一张图剩下的像素,那么DLSS 3除了这些,还能够“猜”出下一帧的画面。

索泰GeForce RTX 4090 AMP EXTREME AIRO评测 圆润外表下的锋芒毕露

另外由于DLSS 3的帧生成是在GPU中处理和运行的,所以即使遇到CPU瓶颈的游戏,AI同样能够提升帧率。这也是为什么在此次发布会中说到,DLSS 3能够突破CPU的限制来提升帧数。

双AV1编码器

本次升级的第八代NVENC编码器可以说是直播、视频、后期工作者的极大福音。它首次加入了对AV1编码的支持,最显而易见的效果就是直播。

索泰GeForce RTX 4090 AMP EXTREME AIRO评测 圆润外表下的锋芒毕露

相比传统的H.264编码,AV1编码的效率平均提升了40%,在同码率下AV1编码的画质将更好。目前大部分直播的分辨率和清晰度,均受限于平台规定的最大比特率。以Twitch限制的8Mbps为例,可以看到在同等带宽下,同为2K 60帧的画面,采用AV1编码的清晰度明显比H.264更高。

说起直播,OBS相信大家都不陌生,在10月份即将发布的补丁中,OBS就加入了对NVENC的AV1编码支持

当然,直播只是我们更容易见到的AV1优势,在视频工作的所有环节,AV1编码都可以带来极大提升。

索泰GeForce RTX 4090 AMP EXTREME AIRO评测 圆润外表下的锋芒毕露

所以,如图所见。NVIDIA已经为广大用户铺好了一条完整的生态链,从编码API、软件、平台到播放器,将全面支持AV1编码。

另外再说一下NVIDIA一直强调的双AV1编码。顾名思义,即部分显卡内搭载了两个编码器,它所带来的效果也是显而易见的。

索泰GeForce RTX 4090 AMP EXTREME AIRO评测 圆润外表下的锋芒毕露

首先,根据官方宣传的,在4K H.265的导出速度上,RTX 4090是RTX 3090 Ti的2.2倍;在8K H.265的导出速度上更是达到了2.5倍。这部分的提升,大家常用的剪映同样适用,感兴趣的用户不妨亲自体验一下。

除了导出速度,8K 60帧的视频录制在以前简直难以想象,而双编码器的好处就是可以将图像一分为二,两个编码器分别处理7680×2160的图像信息,最后拼合完整。

关于编码部分,可能大部分用户的感受不深,但当有一天,你想录屏的时候,却发现显卡不支持,才会发觉它的重要性……

随着图像逐渐进入到超清时代,硬件编码和渲染几乎已经成为不可或缺的帮手。虽然论质量,硬件编码仍不及CPU软编,但软编做到了极限画质,也要承受时间的无穷长。

甚至在一张8K渲染图中,两种编码方式的时间差距就已经达到了几个小时,遑论一段10秒的CG动画。在不断进步的硬件编码中,质量和时间也在不断地被挑战和刷新。

5 测试平台简介

索泰GeForce RTX 4090 AMP EXTREME AIRO评测 圆润外表下的锋芒毕露

首先介绍一下测试平台,为了保障索泰GeForce RTX 4090 AMP EXTREME AIRO 的性能发挥,我们的平台也再次进行了全面更新。不过由于手头上没有旗舰处理器,采用了12代中高端产品,并且在电源上进行了着重升级,采用了华硕ROG雷神2代1600W的钛金牌全模组电源。

索泰GeForce RTX 4090 AMP EXTREME AIRO评测 圆润外表下的锋芒毕露

首先看一下GPU-Z的参数,索泰GeForce RTX 4090 AMP EXTREME AIRO 采用AD102核心,采用TSMC4nm 定制工艺(TSMC4 nm NVIDIA Custom Process),芯片面积608平方毫米,这里相对于RTX30 系的GA102的628平方毫米更小。

拥有16384个CUDA,相比RTX3090 Ti 的10752多52%,Boost频率达到了2580MHz,相比公版的2520MHz有一定的提升。

采用24GBGDDR6XMicron显存,位宽为384bit,显存带宽达到了1008.4GB/s,光栅单元和纹理单元为176和512。

6 理论性能测试

下面先进行的是用来衡量显卡DX11理论性能的3DMARKFS套装:FS,FSE,FSU三者分别对应显卡在1080P、2K、4K的理论性能,取显卡分数实际测试结果如下:

索泰GeForce RTX 4090 AMP EXTREME AIRO评测 圆润外表下的锋芒毕露

在针对显卡DX11性能的3DMARKFS 套装测试中,索泰GeForce RTX 4090 AMP EXTREME AIRO 的提升非常惊人,可以看到在分辨率越高的情况下这张显卡提升越大,其中FS提升了63%;FSE提升了75%;FSU则暴力提升了79%。

综合来看,在整个FS套装的测试中,索泰GeForce RTX 4090 AMP EXTREME AIRO 相较GeForce RTX 3090 Ti 的提升约为72%。

3DMark FireStrike 系列的测试可以看作是大部分过去流行热门游戏的基准,索泰GeForce RTX 4090 AMP EXTREME AIRO 相比上一代旗舰RTX3090Ti 以及RTX3090 都有着巨幅性能提升。

索泰GeForce RTX 4090 AMP EXTREME AIRO评测 圆润外表下的锋芒毕露

而在针对DX12环境下的TimeSpy 和TimeSpy Extreme 测试中,索泰GeForce RTX 4090 AMP EXTREME AIRO 相较GeForce RTX 3090 Ti 的提升分别为:TS提升68%;TSE提升74%,综合下来约为71%。

3DMarkTime Spy 系列是针对DX12的基准测试,能够代表目前以及可预见未来游戏大作的性能提升表现,索泰GeForce RTX 4090 AMP EXTREME AIRO 的成绩同样惊人。

索泰GeForce RTX 4090 AMP EXTREME AIRO评测 圆润外表下的锋芒毕露

PortRoyal是3DMARK中专门针对光追性能的测试项,索泰GeForce RTX 4090 AMP EXTREME AIRO 相较GeForce RTX 3090 Ti 的提升约为78%。

索泰GeForce RTX 4090 AMP EXTREME AIRO评测 圆润外表下的锋芒毕露

本次测试我们还引入了3DMark最新的SpeedWay性能测试模块,SpeedWay使用光线追踪和实时全局照明来渲染逼真的光照和反射效果。它基于新的DirectX12 旗舰版功能(如网格着色器和可变速率着色)来优化性能和视觉质量,是测试显卡全方位综合性能的基准测试工具。

不过由于这个工具刚刚发布,所以我们暂时没有更多其他产品的跑分进行对比,这里的数据供大家参考。

综合来看,索泰GeForce RTX 4090 AMP EXTREME AIRO 的理论性能相较GeForce RTX 3090 Ti的提升约为74%。

索泰GeForce RTX 4090 AMP EXTREME AIRO DLSS 3 4K

在本次测试中,我们使用3DMARK的测试版进行了DLSS3 的相关测试。在4K分辨率下,DLSS关闭为57.34帧,DLSS3 开启后为170.27帧,提升幅度高达197%!

RTX3090 Ti DLSS 2 4K

另外我们也测试了GeForce RTX 3090 Ti 在该程序下成绩,其中DLSS关闭为32.73帧,由于不支持DLSS3,所以在DLSS2 下的成绩为83.63帧。

索泰GeForce RTX 4090 AMP EXTREME AIRO 在开启DLSS3 后,相比关闭提升了197%;而GeForce RTX 3090 Ti 在开启DLSS2 后,相比关闭提升了155%。

当然DLSS3最夸张的还不止数字上这么简单,我们再来看看这张图。

索泰GeForce RTX 4090 AMP EXTREME AIRO DLSS 3 8K

在8K(7680×4320)分辨率下的 DLSS3 测试中,索泰GeForce RTX 4090 AMP EXTREME AIRO 在DLSS关闭的情况下仅有13.18帧,已经无法正常运行游戏,而在开启DLSS3 后,一跃达到了92.09的流畅水准,提升了599%!

8K 下的测试成绩意味着索泰GeForce RTX 4090 AMP EXTREME AIRO 已经可以满足8K@60fps的游戏运行及格线,让现在的8K电视等设备也可以用于游戏需求,为玩家带来更加极致的游戏画面。

7 常规游戏性能测试

由于本次RTX40 系加入了DLSS3 新技术,所以后面会进行单独测试,这里依然选择主流的几款3A大作进行游戏性能对比。

首先在《地平线5》中,可以明显看到,不止在1080p分辨率下,即使在2K分辨率中,受限CPU的情况依然明显。作为一款标准的3A游戏,在4K分辨率下依然可以跑到135帧,这在以前绝对是无法想象的。《地平线5》吸引玩家的关键因素不仅仅是赛车竞速,更是制作组在游戏中带来的精美绝伦的风景,在4K分辨率下,墨西哥风光将更加逼真,更加引人入胜。

性能方面,索泰GeForce RTX 4090 AMP EXTREME AIRO 相比GeForce RTX 3090 Ti 的提升分别为:1080p提升52%;2K提升55%;4K提升73%,综合提升60%。

索泰GeForce RTX 4090 AMP EXTREME AIRO评测 圆润外表下的锋芒毕露

在《刺客信条:英灵殿》中,索泰GeForce RTX 4090 AMP EXTREME AIRO 相比GeForce RTX 3090Ti 的提升分别为:1080p提升58%;2K提升64%;4K提升47%,综合提升57%。在众生平等《英灵殿》中取得如此巨额的画面帧数改进属实难得,索泰GeForce RTX 4090 AMP EXTREME AIRO 即便在4K分辨率下也能够获得超过100fps的帧率表现,非常不容易。

在《无主之地3》中,索泰GeForce RTX 4090 AMP EXTREME AIRO 相比GeForce RTX 3090 Ti 的提升分别为:1080p提升46%;2K提升67%;4K提升66%,综合提升60%。

《光明记忆:无限》的光追测试软件是独立于游戏的测试工具,比游戏中用到的光线追踪技术更多,测试条件为“RTX最高/DLSS质量”。所以测试帧数相对较低,但实际游戏配置相当亲民。

性能方面,索泰GeForce RTX 4090 AMP EXTREME AIRO 相比GeForce RTX 3090 Ti 的提升分别为:1080p提升70%;2K提升77%;4K提升73%,综合提升76%。

在另外一款国产游戏《边境》的跑分软件中,情况基本与《光明记忆:无限》相同,测试条件均在“RTX最高/DLSS质量”下进行。

在《边境》中,索泰GeForce RTX 4090 AMP EXTREME AIRO 相比GeForce RTX 3090 Ti 的提升分别为:1080p提升82%;2K提升89%;4K提升85%,综合提升85%。

《光明记忆:无限》和《边境》两款最早的光追测试程序,到今天也已经陪伴着NVIDIA走过了三代光追核心,索泰GeForce RTX 4090 AMP EXTREME AIRO 的提升是肉眼可见的,从初代只能保证1080P下的流畅运行,到如今在4K分辨率下获得87fps的运行帧率,能够切实感受到NVIDIA的技术“大跃进”。

8 DLSS3性能测试

由于本次新技术DLSS3的推出,将有35款游戏将于近期推出全新的DLSS3功能,本次我们也拿到了部分游戏的测试版。

另外《超级人类》、《生死轮回》、《逆水寒》“拂云庭“、《微软模拟飞行》、《瘟疫传说:安魂曲》都将在10月陆续发布支持DLSS3 的版本。

其中《赛博朋克2077》、《F122》、《瘟疫传说:安魂曲》、《微软模拟飞行》、《逆水寒》本次进行了DLSS3 的测试,另外Unity和虚幻引擎也提供了本次的测试程序。

本次DLSS3 的测试图表比较繁琐,并且增加了1%Low FPS 和延迟的测试,普通的FPS好理解,那么这个1%Low FPS 是什么意思。

首先,游戏Benchmark通常测试的FPS即为,一段时间内的游戏平均帧。而1%Low FPS 则是将一段时间内的帧数从大到小排列,取最小的1%出来,再对这1%的数求平均值。

其实简单来说,这两个数值都不能代表我们在游玩时,具体哪一刻的感受,但FPS更注重整体,而1%Low FPS 则是从最差的里面求平均,更谨慎一些。

看懂了1%LowFPS,我们再来看这张图表,在坐标轴左侧的为延迟(越低越好),坐标轴右侧的均为帧数(越高越好),并且由于牵扯到正负坐标,所以两侧的值有可能会不同。

Frameview中的测试结果为小数点后三位,为了方便观看,这里在帧数上进行四舍五入,延迟则保留小数点后一位。由于目前测试DLSS3 的游戏均为测试版,所以难免出现BUG。

在《微软模拟飞行》中,在开启和关闭DLSS2 的时候,分数几乎无变化。这款游戏是极度吃CPU资源的游戏,如果瓶颈卡在处理器上,那么传统的DLSS2 的确无法提供更多的帧数加成。

而在DLSS3 中,我们能够明显看到帧数的大幅提升,要知道我们所有DLSS3 的测试均在4K分辨率下进行。

不过帧生成并不是毫无弊端,这也是为什么此次测试加入了延迟。并且在开启DLSS3 后,NVIDIAReflex 是捆绑开启的。但相对于DLSS2 增加的这点延迟,在实际体验中的感受并不强。

在《赛博朋克2077》中的数据反映比较真实,可以看到在DLSS关的光线追踪最高的情况下,即便索泰GeForce RTX 4090 AMP EXTREME AIRO 显卡也只有38帧,并且延迟达到了52.5毫秒。

而在开启DLSS3 后,帧数为137,提升了261%。虽然相比DLSS2 的延迟高了9.5毫秒左右,但相比关闭DLSS来说,依然维持在较低的水平。DLSS3 直接将索泰GeForce RTX 4090 AMP EXTREME AIRO 的运行帧数从及格线拉到了电竞水平,提升相当明显。

《瘟疫传说:安魂曲》是即将发布的一款游戏,在DLSS3 和DLSS关之间的帧数提升,同样达到了136%。不过在这款游戏中,DLSS3 相比DLSS2 的延迟增加了12.2ms,在我们测试过的4090显卡中属于比较低的水平了。

目前《F122》的数据测试同样有问题,在DLSS关和DLSS2 中均没有延迟数据。

这一组主要看帧数的提升。其中DLSS3 相比DLSS关的帧数提升了143%,相比DLSS2 的提升也达到了22%。赛车游戏的帧数提升虽然不像FPS那样可以提升游戏胜率,但是画面越流畅,真实度就越强,DLSS3 给《F122》带来的改善相当巨大。

最后则是国产游戏《逆水寒》的光追测试,本次我们选择的测试Demo采用了真正的全局光照。

在尝试关闭DLSS运行后,帧数仅有个位数,而延迟早已上万。还记得在纯光线追踪软件中测试的《光明记忆无限》和《边境》,在本次只有DLSS2 的情况下都能够达到80帧左右。而《逆水寒》这款真正意义上的全局光照,在DLSS2 开启后仅有48帧左右,着实恐怖。不过在开启DLSS3 的情况下,4K分辨率也来到了80帧,已经可以保证基本的游戏体验了。

画质方面,在上图中我们截取《赛博朋克2077》中的一角,可以看到在两种DLSS模式下,相较原画质几乎没有明显变化,只在栅栏处的光影效果有所不同,但对于如此大幅度的帧数提升,这点瑕疵几乎可以忽略不计。

RTX3090 Ti即时帧数39帧

索泰GeForce RTX 4090 AMP EXTREME AIRO 即时帧数98帧

在Unity的测试程序中,有一组实时演算的光线追踪+DLSS的帧数对比。索泰GeForce RTX 4090 AMP EXTREME AIRO 在开启DLSS3 后,实时帧数为98;而GeForce RTX 3090 Ti在开启 DLSS2 后,实时帧数为39帧,提升约为151%。

DLSS关76帧

DLSS2 147帧

DLSS3 186帧

在UE5提供的测试游戏中,方便地给出了DLSS的快捷测试,这里分为DLSS关(超分辨率关+帧生成关+Reflex关);DLSS2(超分辨率性能+帧生成关+Reflex开);DLSS3(超分辨率性能+帧生成开+Reflex开)三档测试。

其中,索泰GeForce RTX 4090 AMP EXTREME AIRO 在DLSS关的即时帧

来源:中关村在线

声明:本站部分文章及图片转载于互联网,内容版权归原作者所有,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2022年9月25日
下一篇 2022年9月25日

相关推荐