GeForce RTX 4090 - 评测

帧数至上

很长一段时间以来,我在显卡评测中都必须提一下子全球供应链问题、芯片短缺以及加密货币热潮让显卡本身的性能变得无关紧要,因为大部分人都找不到显卡,就算能找到很可能也买不起溢价后的显卡。但是,英伟达最新一代性能之王 GeForce RTX 4090 是在上述问题基本上已经不复存在的时候面市的。我们终于可以惊叹于顶级显卡跑出的帧数,而不用惊叹于离谱的售价。这感觉真好!

 

过去一周内,我都在全方位测试公版 RTX 4090 的性能,在软件跑分和实际游戏场景下测试它的表现。4090 有着硕大的身板,价格也同样不低,公版的价格就高达 1599 美元(国行 12999 元)。但是,这可是一块能够开着光追以 4K 分辨率运行《赛博朋克 2077》并达到一百多 fps 的游戏硬件,很难让人说它不值这个价。

英伟达 GeForce RTX 4090 设计与功能

首先,我们先来聊聊大家一眼就能看到的问题——RTX 4090 是一张巨大的显卡,约摸和上一代卡皇 RTX 3090 Ti 一般大。这是一张 3 槽显卡,大约 2.5 公斤重。它的体型虽大却又不失优雅,整体外观沿用了两年前公版 30 系显卡的银黑配色。

 

英伟达的工程师们贴出了一张让人瞠目结舌的规格清单,对比之下,就连 RTX 3090 Ti都逊色了几分。这块显卡拥有 16384 个 CUDA 核心,而 3090 Ti 只有 10752 个。它的基础频率为 2.23 GHz,加速频率最高可达 2.52 GHz,还搭载了 24GB 的 GDDR6 显存。这使其拥有了 83 TFlop 着色器算力、1321 TFlop Tensor 算力和 191 TFlop 光追算力(作为对比,3090 Ti 是 40 TFlop 着色器算力、320 Tensor 算力、78 TFlop 光追算力)。

这块显卡在规格上的提升是巨大的。然而,正如我们之前见过的许多案例,核心与着色器数量翻倍,并不意味着游戏表现能够同样翻倍。不过这一次,英伟达交出了相当优异的成绩单,在我的大部分测试中,我看到的性能进步都不止是增量升级。这是一次真真正正的升级换代。

 

这张显卡的设计目标显然是要主宰 4K 游戏,不过内容创作者与专业人士应该也会非常喜欢 24 GB 的 GDDR6X 显存。即便是对于当下最吃性能的游戏来说,这么大的显存也有点性能过剩了。但如果你要 3D 建模,这就能省下不少的渲染时间。有了 24 GB 的显存加持,OctaneRenderer 直接用显卡上速度更快的帧缓存就行了,几乎用不上系统内存,这极大地提升了渲染速度。同样的,在 Blender 中,你能在等待后台渲染完成的同时继续完成窗口内的工作。

在这些程序之内的工作体验也得到了显著改善。得益于显卡上搭载的 AI 核心,图像去噪渲染更快了。不过如果你是使用 Unity 引擎、虚幻引擎,或是英伟达 Omniverse 平台的游戏开发者,新显卡最重要的升级可能就是对 DLSS 3 的支持。该技术对游戏带来的增益同样适用于游戏开发:仅占用一小部分性能,就能实现实时的光线追踪渲染。英伟达称,与 RTX 3090 Ti 相比,RTX 4090 的渲染速度最多可以提高四倍。

 

如果你是一位职业 3D 建模师,一块专业的工作站显卡仍然是最佳选择。就像 RTX 系列显卡专为游戏所打造,英伟达的工作站显卡也有针对专业创作者的特有优化。不过随着这些优化到来的是极大的价格鸿沟。如果你是在一家小型企业工作,或是自己在弄一些独立项目,那么 RTX 4090 比起那些专业的工作站卡,确实是一个非常不错的折中选择,能够为你省下好几千美元。

本代显卡的另一个重大升级是支持 AV1 编码。AV1 是一种视频压缩格式,能够让你用更少的带宽和更高的质量来进行渲染和串流。虽然 RTX 30 系列支持 AV1 解码,但编码器对创作过程的帮助极大。它的效率很高,可以在不加带宽的情况下提高直播流的画质。此外,达芬奇(DaVinci Resolves)中的视频渲染时间也能最多缩减一半。

英伟达 GeForce RTX 4090 游戏表现

测试系统:华硕 Z390 ROG Maximus XI Extreme 主板。英特尔 i9-9900K CPU,海盗船 H115i PRO RGB 280mm AIO CPU 散热器,32GB 海盗船复仇者 RGB Pro DDR4-3200 内存,1TB 三星 EVO Plus NVMe SSD,海盗船 HX1200 1200W 电源。

首先从软件跑分说起。4090 轻松刷新了各项记录,在 3DMark Fire Strike Ultra 中,4090 的分数达到了令人震惊的 21872。作为对比,这个分数比 RX 6950 XT 的 14512 高了 50% 左右(在 4090 到来前,这是我们记录过的最高分)。这个分数也和 Fire Strike Ultra 的 2x SLI 超频跑分世界纪录基本持平——要知道,那可是两块 GPU 一起超频才跑出来的分啊。

 

Unigine Heaven 中的测试也是同样的情况:4090 远远超过了我们测试过的所有显卡,以 3090 Ti 为对比,在 1080p 下分数增幅为 26%,1440p 增幅为 39%,4k 增幅为 31%。

 

光追跑分也延续了这个势头,4090 的分数几乎是 3090 Ti 的两倍,而且在一些情况下真的达到了两倍。这些数据看起来是真的厉害。

 

接下来是我们的游戏跑分,4090 在这里继续主宰比赛。这一次我们还是使用了我们常用的四款测试游戏,包括《无主之地 3》《战争机器 战术小队》《地铁:离去》和《全面战争:三国》,此外我们还测了《控制》和《古墓丽影:暗影》。所有游戏都以最高预设画质运行,并且在支持的游戏中均开启了光线追踪和 DLSS。

 
 
 
 

就和软件跑分测试结果一样,4090 在每个分辨率下都在所有测试游戏中遥遥领先我们测试过的其他显卡。当然,它的表现就该如此。毕竟这是新一代显卡的旗舰产品,所以只有 3090 Ti 这个前任卡皇才有一战的可能性。

问题是,4090 的性能提升到底有多大?纵观我们测试的多款游戏,在 4K 分辨率下,4090 领先 3090 Ti 的幅度从《地铁:离去》的 14% 到《古墓丽影:暗影》的 90% 不等。意味着所有游戏的帧数都能保持在 100 fps 之上——要知道,这可是 4K 最高画质开启光追的测试结果。这些数据再次让我惊叹不已。

 

英伟达 GeForce RTX 4090 DLSS 表现

4090 的成功,无疑有一部分要归功于英伟达对 DLSS 技术的不断改进。DLSS 的全名为「深度学习超级采样技术」,这个以 AI 为基础的技术能够以较低的分辨率渲染游戏,但输出分辨率更高的画面,例如以 1440p 渲染但最终输出 4K,而且输出的画面和原生 4K 之间几乎看不出区别。早期的 DLSS 会因为 AI 算法问题而导致画质劣化,但这项技术已经得到了长足的发展,现在开了 DLSS 以后,画质基本和不开的时候一样出色,说不定甚至还能反超。

这个技术的最新版本是 DLSS 3,只有 40 系显卡支持,不过它带来了一个 AI 自动补帧的新功能。英伟达官网上有非常详细的技术介绍,这里就不过多赘述,感兴趣的话可自行阅读。简而言之就是显卡会分析前后两帧,计算出两者之间的不同,然后再利用 AI 来生成出中间的一帧。

 
图源:英伟达

与上一代显卡相比,这是一个重大的进步,有时候 FPS 的提升只能用天壤之别来形容。DLSS 2 能够分析动态矢量数据和每一帧,从而智能升级图像以及提升性能表现;而 RTX 4090 的光流加速器能够分析运动路径并自行生成新的帧,而且不需要借助游戏引擎原生的帧输出。该技术与 Nvidia Reflex 同时运作,能够消除让游戏迟钝的延迟。英伟达给出的数据显示,在开启 DLSS 3 后,帧率最高可提升至原本的四倍。

在以 4K 分辨率、最高画质、开启光追的条件测试《赛博朋克 2077》时,开启 DLSS 带来了显著的帧数提升,开启帧生成后帧数进一步提高。关闭 DLSS 时,4090 在时长 1 分钟的游戏内置基准测试中得到了 41.9 fps 的成绩。开启 DLSS 但不开帧生成的情况下,结果飞跃至 84 fps。开启帧生成后,测试结果达到了令人难以置信的 136 fps,并且游戏画面还是一如既往地华丽。

 

目前的帧生成技术确实会伴随着一些妥协,那就是显卡虽然会生成额外的帧,但把这一帧加入到输出流时会带来一定的延迟。毕竟这些帧是由 GPU 生成,独立于游戏引擎之外。只靠 DLSS 3 本身的话,可能会让 120 fps 体感像是 60 fps。但不用怕,Nvidia Reflex 解决了部分延迟问题。事实上,在《赛博朋克 2077》里面测试帧生成技术的时候,在我玩到的那一部分里,我完全感觉不出来有任何延迟。不过其他游戏中的情况可能有所不同,这个延迟在一些毫秒必争的快节奏电竞游戏中可能会造成麻烦。不过能在《赛博朋克》这种非常看重画质的游戏中,以 4K 分辨率、开启光追的情况下超过 120 fps,这个成就令人赞叹。

另一个需要注意的事项是,英伟达对 RTX 4090 给出了相对高端的推荐配置。为了发挥出这块显卡的全部潜力,英伟达建议用户搭配最新的 CPU 和 DDR5 内存。它还需要 DirectX 12 和硬件加速 GPU 计划,并且不兼容 v-sync(但支持 G-Sync)。可以从我们的测试机看出,这些硬件条件并非绝对的硬性要求(比如我们用的内存是 DDR4),所以和我们一样,就算你最近不打算升级整套系统,也能享受到这块显卡带来的提升。

 

最后一个需要考虑的当然就是价格了。通常情况下,新一代显卡都是用我理解中的「高端主流显卡」打头阵,N 卡的话,就是指 3080、2080、1080 这些。而这次一上来就是 4090,所以测试的时候我们也就只能和上一代产品比较了。虽然我们知道 16 GB 显存的 4080 卖 1199 美元(国行 9499 元),12 GB 的版本则卖 899 美元(国行 7199 元),但在亲手测试之前,我们无法知道这些显卡会有什么样的表现。

所以现在 4090 当然能够打遍天下无敌手,毕竟它可是新一代的发烧级显卡。但是它物有所值吗?这还有待观察。

不过和现在能买到的其他显卡相比(包括 3090 Ti),它的数据都是非常亮眼的。3090 Ti 在今年年初才刚刚发售,首发时的建议零售价为 2000 美元(国行 14999 元),不过最近的价格已经跌了不少,打折的时候最低是 1100 美元。上文提到过,4090 在 4K 分辨率下游戏性能比 3090 Ti 高出 15% 到 90% 不等。有鉴于此,4090 比前一代卡皇贵 45% 好像不过分。

总结

RTX 4090 或许又大又贵,但在它面前,其它对手完全没有还手之力。这其实有些不太公平——它是新一代显卡中唯一面市的产品,所以我们只能让过去几年里发售的显卡当它的对手。不过在其他新卡发售前,考虑到这张卡有着惊人的硬件规格和魔法般的 DLSS 3 AI 技术,而且运行游戏时的帧率打遍天下无敌手,即便是 1599 美元的高价也显得合理了。

本文编译自 IGN US 相关内容,原作者 Chris Coke,翻译 豚骨拉面,编辑 Tony,未经授权禁止转载。

优点

  • 在规格和堆料上相对 30 系列有巨大的提升
  • 让 4K+光追条件下的游戏表现大幅超越 100 帧
  • 性能表现大幅超越竞争对手

缺点

  • 体积巨大
  • 售价昂贵

评测成绩

RTX 4090 或许又大又贵,但在它面前,其它对手完全没有还手之力。这其实有些不太公平——它是新一代显卡中唯一面市的产品,所以我们只能让过去几年里发售的显卡当它的对手。不过在其他新卡发售前,考虑到这张卡有着惊人的硬件规格和魔法般的 DLSS 3 AI 技术,而且运行游戏时的帧率打遍天下无敌手,即便是 1599 美元的高价也显得合理了。

文章提及

GeForce RTX 4090

2022年10月12日

英伟达公版 GeForce RTX 4090 评测:8 分

8
优秀
RTX 4090 以新一代消费级卡皇的姿态高调登场,这是一块硕大而美丽的显卡,可以让 4K 游戏的帧率大幅超越 100 fps,不过 1599 美元的高昂售价也注定了这是一款只有最忠实的发烧友才会购买的产品。
GeForce RTX 4090