英伟达公版 RTX 3080 - 评测

让光追 4K 游戏成为可能

英伟达公版 RTX 3080 现已发售,随之到来的是多年未见的 PC 玩家热潮。伴随着各种传言与小道消息,英伟达在本月初终于公布了全新的 RTX 30 系显卡,称之为公司有史以来最大的迭代进步,能够带来上一代同价位产品两倍的性能。而其能否兑现承诺呢?我们对 RTX 3080 进行了各种测试,发掘出了其全部性能,供大家在升级 PC 时参考。

设计与特色

RTX 3080 的纸面参数亮眼。与上一代 RTX 2080 Super 相比,其 8704 个流处理器数量几乎翻倍,同时还有 10 GB GDDR6X 显存(320 bit)。GDDR6X 是目前市面上最快的显存,其频率可高达 19 Gbps,比图灵架构的 14 Gbps 提升了不止一星半点。这张显卡的核心加速频率为 1.71 GHz,不过英伟达称这张卡的功耗也很出色,每瓦特性能是 20 系显卡的 1.9 倍。

虽然 RTX 3080 与 RTX 2080 的流处理器数量乍一看与官方宣传的两倍性能差异相符,但实际上并没有这么简单。安培架构与图灵架构的流处理器性能并不对等,新的架构中 FP32 单精度浮点单元能够与 INT 32 单精度整数单元并发运算,意味着吞吐量翻倍。不同游戏引擎与应用对核心的利用率不同,所以流处理器的性能虽有提升,但并不是每款游戏都能达到双倍效果。

 

新的显卡架构还带来了最新的 RTX 三大处理系统:可编程着色器,负责标准光栅化过程(日常游戏渲染);光追核心,负责光线追踪技术;以及张量核心,负责处理光线追踪中的 AI 技术,让 DLSS 以及 RTX Voice 等功能成真。

而在 RTX 3080 中这三部分都得到了极大提升:比起 RTX 2080,着色器算力 2.7 倍,光追核心算力 1.7 倍,张量核心算力 2.7 倍。对比 20 系列显卡的处理能力提升惊人:

  • 可编程着色器算力:30 TFLOP(前代:11 TFLOP)
  • 光追核心算力:58 RT-TFLOP(前代:34 RT-TFLOP)
  • 张量核心算力:238 Tensor-TFLOP(前代:89 Tensor-TFLOP)

而作为参照,下一代 Xbox Series X 算力为 12 TFLOP,比起 RTX 3080 的30 TFLOP,差距显而易见。(不过 Xbox Series X 显卡采用的是不同架构,所以实际差距与纸面数字不同)

 

公版 RTX 3080 采用了英伟达最新的双面双风扇设计。比起煤气炉般的上一代显卡来说,新显卡看起来就像一大块散热器。其面板隐藏到了散热器中,而整体尺寸基本保持不变,留有充足的空间供热量散发。其双面风扇设计契合大多数中塔机箱的风道,冷风从机箱前面板进入,穿过显卡散热模块后从出风口排出,与 CPU 的热风一起经由机箱后方出风口排出机箱,工作原理与普通风冷散热器一致。英伟达称这样的设计能够将显卡温度降低 20 摄氏度,并且比前代显卡安静 3 倍。测试结果的确更安静、温度也更低,不过仍没有官方所说的那么夸张。事实证明,这个散热设计确实行之有效。

 

新款显卡的电源采用了全新的 12 pin 电源接口。玩家们不用购置支持这个接口的专用电源,公版显卡会附赠一个双 8 pin 转 12 pin 的转接线。不过鉴于定制线连转接线后颜值太低,我更希望他们采用双 8 pin 的设计。

如果你使用的是中档电源,还是有必要升级一下。RTX 3080 功耗达到了 320 W,而 2080 Super 与 2080Ti 只有 250W,推荐使用 750W 电源,并且两根 8 pin 的线最好是分别直接连接电源。

新卡带有三个 DP1.4 接口与一个 HDMI 2.1 接口。公版 RTX3080 有能力输出广色域 HDR 画面以及支持流压缩技术的显示器,能够同时向四台显示器输出 8K 分辨率的画面。

RTX IO, RTX Reflex, RTX Broadcast

除了显卡本身,RTX 30 系列公布时还带来了一些额外的功能。首当其冲的便是 RTX IO 快速载入技术,可以直接从 SSD 中将压缩数据提取到显存,载入速度飞快,有望带来 PS5 般的瞬时加载。不过这项技术需要对应游戏的技术支持,所以本评测中未能测试。

其他关键技术还有 RTX Reflex 与 RTX Broadcast。RTX Reflex 技术主要面向电竞玩家,大幅降低 4K 分辨率下的画面延迟。过去,游戏分辨率越高,图像设置越高,画面延迟也会越高,进而影响玩家的发挥。而帧数优化加上支持 RTX Reflex 的显示器与将大幅降低系统延迟。

 

为了测试这个程序的效果,我用 RTX 3080 替换了先前测试所用的 GTX 1660 Super,并打开 Valorant 进行测试。在我的 4K 显示器上开启优化后,系统整体延迟降低了超过 50%。我本身不是电竞玩家,所以对这部分提升感觉不明显,但确实能感觉到画面响应更快了。如果你是一个追求极致的玩家,那么没有任何理由不开启 RTX Reflex,目前以及将来要推出的许多 FPS 游戏如《使命召唤:现代战争》《堡垒之夜》《Apex 英雄》都支持该功能。

 

RTX Broadcast 的目标受众则是视频创作者和主播们。利用 RTX 显卡中的 AI 算力,你能直接消除背景杂音或是更换人像后方的背景特效。诚然,其他软件也有类似功能,但在 AI 的加持下,该程序带来了我亲所未见的效果。英伟达的演示中,它能做到消除吸尘器噪音的同时,还几乎不影响说话者的声音质量。AI 替换的背景特效也有着极高的保真度,很好地将主播从背景中剥离出来。如果你的室内空间有限,无法悬挂绿布的话,请一定关注这项功能。

以上介绍了这款显卡的方方面面,接下来我们直接切入测试跑分。

性能测试

RTX 30系列背后的技术令人惊异,但显卡最重要的还是其性能参数。为了测试这张卡的性能,我测试了一系列跑分软件和游戏内的基准测试。所有测试均开启最高画面设置,来模拟最极端的情况。此外我还进行了一些额外测试来得出 RTX 3080 比起上一代显卡的光追运算能力差距。

测试系统:华硕 ROG Z390 Maximus XI Extreme 主板,英特尔 i9-9900K,海盗船 H115i PRO 280mm 一体式水冷,32GB 复仇者 RGB Pro DDR4-3200 内存,1TB 三星 EVO Plus NVMe SSD,海盗船 HX1200 1200W 电源。

注意测试中用于对比的是非公版 RTX 2080 Super。

首先我们进行的是软件跑分,主要测试光栅化处理能力。

英伟达 GeForce RTX 3080 跑分测试

 
 

能看出 RTX 3080 比起其他显卡提升明显,在 3DMark Fire Strike Utra 中最多超出 AMD RX5700 56%,在 Unigine Heaven 超出 RX5700 47%。而对于 2080Ti 的提升最值得关注,在 Fire Strike 中跑分高出 28%,在 Unigine Heaven 高出 18%。

接下来是游戏性能测试

英伟达 GeForce RTX 3080 游戏性能测试

 
 
 
 
 

简单来说:RTX 3080 是一块性能猛兽。毫不意外地领先所有其他测试卡。而让我惊讶的一点在于其提升的多少。对比 2080 Super,其在 1080p 下帧数提升 29% 至 51% 不等,平均帧数提升 44%。而 4K 分辨率下帧数提升更为明显,从 53% 至 67% 不等,平均提升了 57% 的帧速率。

RTX 3080 整体性能甚至超过上一代旗舰 RTX 2080Ti,不过两者的差距并没有那么显著。1080p 下帧数提升 6% 至 24% 不等,帧速率平均提升 18%。而 4K 下帧数提升 17% 至 34% 不等,帧速率平均提升 26%。再对比两张卡发售时的定价,5499 元与 9999 元,RTX 3080 性价比明显高得多。

我还单独对比了同价位产品 RTX 2080 Super 的游戏性能,以此来展现新一代显卡的性能提升。以下测试均在 4K 分辨率下,开启光线追踪与 DLSS。

 

测试结果很好地展现了 RTX 3080 带来的性能飞跃。这是一张完全能带动 4K 游戏的显卡。其爆炸性的性能提升也与 10 系到 20 系的微弱差距形成了鲜明对比。

要注意的是,新卡对比上一代显卡的性能提升视测试所用的游戏而不同,游戏的参数设置以及游戏引擎都会影响 RTX 3080 的算力发挥。游戏测试结果显示 RTX 3080 对比上一代显卡带来了非凡的游戏体验升级,在 4K 分辨率下这一点更为明显。

光追性能测试

性能跑分只是 RTX 显卡的一部分,另一个关键组成部分是光线追踪性能。两大次世代主机都将支持硬件加速的光线追踪,我很好奇 RTX 3080 将为未来游戏带来怎样的提升。于是我用公版 RTX 3080 与公版 RTX 2080 Super 展开了光追性能测试。

 

测试所用游戏为柳叶刀科技的《边境计划》以及飞燕群岛的《光明记忆》,两款游戏在 DLSS 开启的情况下对性能要求都不低。我在 4K 分辨率下进行测试。结果显示《边境计划》中,RTX 3080 对 RTX 2080 Super 提升超过 81%,而《光明记忆》中的提升为 67%。

而测试目前市面上游戏的光追性能时,我更注重 RTX/DLSS 对帧数的影响。我在 4K 分辨率下分别开启与关闭光追与 DLSS 测试了 4 款游戏:《德军总部:新血液》《地铁:离去》《我的世界》都有自带的基准测试,而测试《控制》时,我尽量多次重复同一条穿越控制局的路线,并用英伟达 FrameView 软件记录了帧数结果。

测试结果如下,第一张表格是具体帧数表现,第二张表格则是光追状态下开启 DLSS 后的性能提升。

 

从上图中可以看出, RTX 3080 的表现证明 4K 60 帧的光追游戏成为现实。光追核心与张量核心的优化带来了远超 RTX 2080 Super 的亮眼表现。以下是光追状态下开启 DLSS 性能提升百分比。

 

开启光追与 DLSS 后,游戏帧数都有所下降,其中 RTX 3080 开启 DLSS 性能提升普遍更多。测试中唯一的例外是《地铁:离去》,RTX 2080 Super 的性能提升比较多。因为测试样本有限,所以很难得出既定的结论。不过看起来,迭代后的光追核心与张量核心让光追性能也得到了提升。其中要注意的是,《控制》在 4K 分辨率下开启光追与 DLSS 的表现比完全不开启帧数更高。

总体来说,《德军总部:新血液》和《控制》两款游戏的光追性能提升没有我预期的多,而《地铁:离去》中反而 2080 Super 的光追性能提升更为明显。RTX 3080 能够以更高帧数在光追状态下运行这几款游戏(《新血液》126 帧,《控制》69 帧,《地铁》:64 帧),不过要想得出 RTX 3080 的光追性能较 RTX 2080 Super 有多少提升仍需更多测试。

在我的测试中,两张显卡在《我的世界》中的光追性能差异最为明显,达到了 30.4%,在《控制》和《德军总部:新血液》中提升分别仅为 4.5% 与 3.1%。未来游戏的光追优化将更接近《我的世界》还是《地铁:离去》?只有时间会告诉我们答案。

DLSS

DLSS 全称「深度学习超级采样(Deep Learning Super Sampling)」,自从首次出现以来已经经历了不断优化。这个技术利用 AI 来提高图像质量。RTX 显卡能够渲染较低分辨率画面,并利用自带的张量核心来提高输出画面的分辨率,理论上玩家实际看到的画质不变。在 4K 下开启 DLSS 实际上可能只需渲染 1440 P 的画面,意味着能够以 2K 的帧数带来 4K 的画面。这项技术刚面市时,图像的饱和度有着明显问题,所以当时并没能引起大量关注。英伟达一直悄悄改善这个技术,现在 DLSS 技术输出的画面比原生 4K 画面画质还棒。

 
 

上方两张《德军总部:新血液》的截图很好地展示了 DLSS 的强大之处,细看硬纸盒的材质和线条,以及下方弹药盒的材质,你会发现 DLSS 输出的图像更加清晰,并且帧数还高了 39 帧。实际渲染 2K 画面,却输出了比原生 4K 还棒的画面。如此效果让人惊讶,让人没有任何理由不用 DLSS。

散热与噪音

英伟达在宣传中对 RTX 3080 的散热设计百般赞誉。他们称新的设计能将显卡温度降低 20 摄氏度,并且噪音只有上一代的三分之一。在实际游戏与跑分测试中,RTX 3080 都比上一代显卡温度更低、也确实更安静,不过远没有官方宣传的那么夸张。在我的机箱中,室温 26 的时候最高温度达到了 75 度,而室温 21 度的时候最高温度只有 69 度,这样的结果突出了新散热设计对冷风的依赖。值得一提的是,我的测试系统采用了机箱前方进气的设计,如果风扇在机箱顶部的话风道会更好。相信在更好的测试条件下,显卡温度会更低。

新卡运行时非常安静,由于我没有分贝测试器,所以无法准确测量噪音数值。不过在测试过程中我曾多次误以为显卡没有工作而打开机箱盖检查。本次双面双风扇的设计比起以往的设计,噪音确实降低了不少。

总评

英伟达公版 RTX 3080 是一张了不起的显卡。对比起 RTX 2080 Super,这张卡带来了极大的性能飞跃,其算力甚至比昂贵的 RTX 2080 Ti 还要强劲。简单来说,定价 5499 元的 RTX 3080 不仅性价比超高,更是 4K 游戏必备的显卡。

本文编译自 IGN US 相关文章,作者:Chirs Coke。

优点

  • 性能有了极大飞跃,性价比超高

缺点

  • 光追等新的特性还有待厂商们的优化

评测成绩

无论光追开启与否,定价相对实惠的 RTX 3080 都带来了显著的性能飞跃。

英伟达公版 RTX 3080 IGN 评测 9 分:定价合理的性能猛兽

9
奇佳
无论光追开启与否,定价相对实惠的 RTX 3080 都带来了显著的性能飞跃。
英伟达公版 RTX 3080