影驰 GeForce RTX 5070 Ti 星曜 LUNA OC 显卡评测:不止高性能,还有高颜值!

资讯 » 新零售 2025-05-30

写在开头

作为NVIDIA GeForce RTX 50系列中备受关注的中高端,GeForce RTX 5070 Ti自亮相以来,凭借均衡的性能表现和相对亲民的定价策略,一直在游戏玩家与创作者群体中保持着不低的热度。甚至被不少玩家称为目前最具性价比的RTX 50系显卡。在众多品牌和型号中,如何挑选出一款真正适合自己的显卡,成为了许多消费者面临的难题。

最近,影驰推出了全新的GeForce RTX 5070 Ti 星曜 LUNA OC 16GB,我们也在第一时间上手了这款显卡,其独特的设计和卓越的性能表现,确实让人一眼吸睛,各方面都堪称性能与美学的完美结合。接下来,就让我们一同深入了解一下这款显卡的独特魅力。

规格介绍

开始前,照例讲讲新显卡的规格。GeForce RTX 50系显卡采用了此前NVIDIA在AI领域推出的Blackwell架构,以大卫·布莱克威尔命名,其是一名受人尊敬的数学家和统计学家,在博弈论和统计学领域留下了不可磨灭的贡献,NVIDIA用其名字命名这一架构反映了新平台的开创性和先进的计算能力。Blackwell可以说是NVIDIA近年来更新幅度最大的GPU架构了,相比起之前的架构来说,划时代地引入了神经网络着色器,力图为游戏开创先进、高效更有逼真的渲染方式,带给玩家全新的游戏体验。

相比前代Ada架构,Blackwell的升级聚焦于四大方向:分别是AI算力的爆发、光线追踪技术的革新、显存能效的提升以及划时代的神经网络渲染。

第五代Tensor Core

其中AI算力的爆发就不得不提到Blackwell架构上的第五代Tensor Core,新一代Tensor Core添加了对FP4浮点运算精度的支持。FP4是一种较低的量化方法,类似于文件压缩,可以减小模型推理过程中数据存储和计算量大小,提高计算效率,降低该过程对显存的要求。与大多数模型默认使用的FP16相比,FP4使用的显存不到其一半,并使GeForce RTX 50系列GPU的性能相比上一代提升高达2倍。

第四代RT Core

而光线追踪技术的革新则仰赖于第四代RT Core的加持,相较于第三代RT Core来说,Blackwell架构的第四代RT Core主要提升了检测光线、路径与三角形相交的效能,过往在检测时往往只能检测单个三角形,一旦场景复杂,检测能力不足就容易导致渲染出错等问题,而现在检测能够以簇集方式进行,检测效率更高。同时还有三角形簇集解压缩引擎加持,其新增了Linear-swept Spheres(LSS)功能,可以减少渲染毛发所需的几何图形数量,并使用球体代替三角形以获得更准确的毛发形状拟合,能够让显卡发挥更好的性能但只消耗较小的显存占用。

综合来看,Blackwell架构的光线追踪多边形相交效率是上一代Ada架构的2倍,是Turing架构的8倍,同时还可以节省25%的显存使用率。

第四代RT Core的改进主要是为实现更好的光追效果。其中有两项新技术能够受益,第一项是RTX Mega Geometry技术。随着光线追踪游戏场景的几何复杂性不断增加,游戏画面中几何图形的计算量也呈现出快速增长的趋势。而RTX Mega Geometry技术能够加速构建边界体积层次结构(BVH),使得在实时渲染中可以处理多达100倍的三角形数量。

该技术的出现,也使得开发者能够在游戏场景中使用更复杂的几何图形,而不会影响游戏帧率。过去需要一个个算BVH,现在RTX Mega Geometry能够智能地在GPU上批量更新三角形簇,减少了的负担,既保证了性能,也兼顾了图像质量。相信随着这些技术的不断发展和应用,未来的游戏将能够呈现出更加逼真和细腻的视觉效果,同时保持高效的性能表现。

另外一个能够受益的技术则是Curve Primitive,方便光追在曲面中的应用,例如一位男士的头发可能需要多达400万个三角形,再加上光线追踪技术,画面所需要的运算负载极大。NVIDIA则通过第四代RT核心中的Linear- Swept Spheres(线性扫描球体)技术有效减少了渲染头发所需的几何体数量,以球形代替多边形,更贴合头发的形状,从而将占用量大幅缩减至三分之一,并进一步提升了实际帧数,让头发的渲染效果更加自然流畅。

GDDR7显存

第三点改变则是显存效率的提升,Blackwell架构中还首次加入了对GDDR7显存的支持,此前GDDR6显存的信号编码为NRZ/PAM2,而RTX 40系上的GDDR6X则是PAM4编码。最新的GDDR7显存,信号编码改成了PAM3,NRZ/PAM2每周期提供1位的数据传输,PAM4每周期提供2位的数据传输,而PAM3每两个周期的数据传输为3位。说人话就是,新的编码机制可以使杂讯失真比减小,信号品质更清晰,同时还能带来更高的显存运行频率以及更低的电压,根据NVIDIA的介绍,使用GDDR7显存后,数据传输速率可达GDDR6时的2倍,并且功耗接近GDDR6的一半,经典加量还减价。

神经网络着色器

接着我们再细说一下这一代架构的最大变化,NVIDIA这次将Blackwell架构的SM单元直接称为神经网络着色器。相比较于之前的可编程着色、CUDA统一着色、通用计算着色来说,其最大的变化就是引入了AI,AI将会彻底改变GPU的着色方式。

在Blackwell架构中,NVIDIA 进一步拓展了神经网络渲染的范畴,引入了诸多创新元素,包括神经网络纹理压缩(Neural Textures)、神经网络材质(Neural Materials)、神经网络体积(Neural Volumes)、神经网络辐射场(Neural Radiance Fields)以及神经网络辐射缓存(Neural Radiance Cache)等,这些元素共同构成了神经网络渲染中神经网络着色的重要呈现方式。

这里举个例子让大家能够更简单地理解神经网络渲染,过去复杂的物品或大量异材质的贴图往往会占用相当大的内存空间,如果叠加光追的话,计算量将会更大。然而,得益于神经网络渲染技术中的神经网络材质功能,这一问题得到了显著改善。开发者可以先在离线渲染出物品的光照数据,然后再用这些数据训练一个小的AI模型,游戏运行时只要实时调用这个AI模型当场推理就好了,这样就能还原出想要的光照效果了,再配合神经网络纹理压缩技术,就能显著降低实际生成的材质数据量,从而在占用更少显示内存的同时,实现了细节更丰富的材质表现,达到了实时生成如电影般细腻素材的效果。

目前神经网络渲染技术已经得到了微软的大力支持,未来也将会加入DirectX中,玩家能够体验到更真实的游戏世界。

而在硬件层面,由于神经网络渲染的加入,Blackwell架构的SM单元相较于RTX 40系的Ada架构还是有不小变化的,Ada架构内的SM内,SM单元会拆分成一半的CUDA专门用于处理FP 32(单精度浮点数),另一半则依需求动态调整去处理FP32和INT32(32位整数)。而在Blackwell架构上,SM单元则改成了CUDA核心可以完全依需求动态处理FP32和INT32的形式。

另外一个改进是,过往的着色工作往往只有SM单元的Shader在处理,而Blackwell架构上引入了神经网络渲染以后,使得Blackwell架构上的第五代也能共同分担着色工作,大大提高了着色效率。

这样改进的好处是,Blackwell架构能够进一步针对神经网络渲染工作进行排序,即把传统的着色工作分配给Shader,而需要动用神经网络渲染的工作负载则可以给到上,两种核心同时运用,效率最高可以提升2倍之多。并且得益于也加入了可编程渲染管线,现在开发者或API也能更好地调用,未来游戏内我们能见到的AI技术势必越来越多。

先进的AI管理处理器

此外,AI的应用也越来越多,不仅游戏中应用AI技术,现在连可编程渲染的过程里也引入了AI,因此如何去分配显卡内部多样化工作就成了一个问题。如过往显卡在开启DLSS玩游戏时,其中应用到的语言模型和游戏引擎需要同时与GPU的不同核心交互,生成游戏帧,但是往往很难做到每一帧都有一致的生成时间,抑或者是游戏AI对话的响应不够及时,这些情况都会造成游戏体验不友好。

而Blackwell架构为了解决这一问题,引入了AI管理处理器(AMP)。它能够实时调度资源,确保在神经网络渲染、帧生成和 AI 驱动的游戏交互中实现智能化的任务分配。这种设计不仅带来了更高效的性能输出,还让显卡在游戏渲染和 AI 运算之间实现了绝佳的平衡,确保帧的间隔均匀,对话类型的AI能够及时响应,玩家的游戏体验一致性能够比较好地保障。

GeForce RTX 5070 Ti规格

说了这么多,接下来给大家介绍一下GeForce RTX 5070 Ti的硬件规格。这款显卡的核心采用的是GeForce RTX 5080同款GB203,不过核心代号上稍有区别,GeForce RTX 5070 Ti为GB203-300-A1。规格上,拥有6个GPC,每个GPC包含的TPC并不相同。GeForce RTX 5070 Ti上总共集成了35个TPC,略少于RTX 5080。整卡共有70个SM单元,280个TMUs纹理单元,96个ROPs光栅化处理单元,8960个CUDA核心。对比上代RTX 4070 Ti的话,可以说是史诗级进步了,单是CUDA核心就增加了17%左右,甚至已经超越了RTX 4070 Ti SUPER!

在工艺制程方面,新的GB203核心沿用了TSMC 4nm 4N NVIDIA Custom Process工艺。核心面积为378mm2,同样比RTX 4070 Ti的AD104核心大了28%,内部晶体管数量则有456亿。另一个对比RTX 4070 Ti升级的点在于显存的配置,上代RTX 4070 Ti的显存为192-bit的12GB GDDR6X,而全新的GeForce RTX 5070 Ti不仅升级了GDDR7显存,还将显存位宽提升至256-bit。正因如此,GeForce RTX 5070 Ti也是众多玩家所期待的RTX 50系列显卡之一。

同时16GB的大容量显存也能为玩家提供高分辨率下的极致帧率,还能兼顾大部分AIGC用户的应用需求,多重黑科技加持下,高分辨率出图也可更加高效。同时视频输出接口也进行了升级,能够兼顾高分辨率与高刷新率,后续开箱显卡时我们会详细介绍。

最后一个变化则是售价了,上代RTX 4070 Ti的售价为6499元,而全新的GeForce RTX 5070 Ti售价6299元!对比上代直接便宜了200!这么一看,再结合一下新架构新技术,瞬间就有性价比了。这里提一下我们本次上手的影驰GeForce RTX 5070 Ti 星曜 LUNA OC 16GB,从后缀就能看出这款显卡是超频版本,其相比MSRP版本的RTX 5070 Ti有更强的性能释放,上面的表格中也可以看出其Boost频率明显要比MSRP版本的要高不少,由原来的2452MHz提升至2527MHz,事不宜迟,下面我们就给大家揭晓影驰GeForce RTX 5070 Ti星曜LUNA OC 16GB的性能表现。

外观赏析

影驰GeForce RTX 5070 Ti 星曜LUNA OC 16GB的外包装设计延续了老大哥RTX 5090 D星曜LUNA OC的风格,正面的“星曜娘”化身月之女神,一改RTX 40系时的机甲展示风格,整体变得更优雅更有质感。

包装的右上角则标注了这款显卡支持42个月的质保时间,相比较于一般厂商的3年质保,影驰更长的质保时间既展现了对产品的信心,也让玩家多了一份放心。除此之外,影驰显卡还支持个人送保服务,售后省心有保障。

包装盒的背面则是经典的显卡技术介绍,方便玩家对显卡有个基本的了解。主要介绍了影驰GeForce RTX 5070 Ti星曜LUNA OC 16GB采用了全新的磁星散热系统,显卡还配备有炫曜光效,能够带来极致的视觉效果

拆开包装,内部附赠的配件还是相当丰富的,除了有常见的快速安装指南、显卡支撑架、RGB同步线以及电源转接线外,这一代星曜显卡内还附赠了一张贴纸、一块常规的金属背板以及一块无尘布,玩家能够DIY自己的显卡,打造独属于自己的游戏利器。

影驰 GeForce RTX 5070 Ti 星曜 LUNA OC 16GB 显卡的外观设计可以说是独具匠心,整体以白色为主色调,简约而不失大气,辅以银白色的装饰环绕散热风扇,尽显潮流与科技美感。

正面最吸睛的当属那三把 95mm直径的霜环风扇,风扇四周环绕着灯带,宛如星曜娘的羽翼,为显卡颜值大幅增色。再看风扇中央,是星曜系列的 LOGO,其背后呈现出类似钻石切割的璀璨纹理,使得显卡表面拥有了光影流转的质感。

凑近看风扇细节,每把风扇包含7片三折大扇叶,全新的霜环扇叶设计对比上代能够实现同噪音下风压提升15%,同转速下噪音降低5%且风压提升10%,并且风扇的寿命与强度也得到了加强。

来到显卡背面,与我们之前测过的RTX 5090 D星曜LUNA OC不一样,影驰GeForce RTX 5070 Ti 星曜LUNA OC 16GB用的是镜面材质的金属背板。官方称其为星镜界,不仅带来了独特的视觉效果,还赋予了显卡更高的质感和辨识度。

显卡背板的尾部是镂空的散热设计,并且面积不小,足足占了背板三分之一的位置。从密密麻麻的散热鳍片中还可以看到内部的热管,搭配正面的散热风扇,能够最大限度的吹透整个散热器,进一步提升散热效能。

另外,影驰也为玩家准备了常规的白色金属背板,玩家可以自行更换。

换上金属白色背板后,整张显卡又是另一番风味,一身雪白的设计更显纯洁高雅。

喜欢二次元的玩家还可以将星曜娘的贴纸粘在金属背板上,贴纸每个元素都相互独立,玩家可以自行选择贴纸位置。

纯白的背板加上星曜娘的贴纸以后,整体的颜值更进一步,特别是这代的月之女神形象,与白色非常契合,本身月之女神就象征着希望与智慧,在白色背板的承托下,整体形象更加圣洁,显卡的质感都高了不少。

继续看显卡的侧边,圆润的造型加上拼接设计,整体视觉观感不错,相比起方方正正的外形,这种圆润设计更能显现星曜系列的优雅精致。旁边还有星曜LOGO样式的IML穹顶ARGB灯带与BOOMSTAR标识。

显卡的顶部同样充满了不少有意思的小设计。顶部右侧是我们熟悉的“GEFORCE RTX”字样,这也算是NVIDIA显卡的老传统了。除此之外,你还能看到密密麻麻的散热鳍片配置,散热堆料有一手。

显卡顶部正中央则是影驰专为这款显卡设计的千层星曜LOGO,隐隐约约能够看到内部有“BOOMSTAR”字样,据说通电后效果更佳,后文会详细给大家展示。

供电接口部分则是我们熟悉的12V-2×6接口,最大600W的供电能力,带这张最高350W TDP的显卡,应该说是绰绰有余了。

显卡I/O接口部分,视频输出接口还是常规的3个DP加1个HDMI的配置,不过规格上有了升级,影驰GeForce RTX 5070 Ti星曜LUNA OC 16GB采用的是DP 2.1b与HDMI 2.1b规格。理论上,这一代显卡的视频输出接口可以轻松实现4K 480Hz和8K 240Hz超高分辨率与超高刷新率的需求。

最后我们再来看看显卡的“三围”数据,根据我们的测量,影驰GeForce RTX 5070 Ti星曜LUNA OC 16GB的尺寸为348*155*56mm(含挡板),这个厚度甚至不足3槽。相比起其他家的RTX 5070 Ti来说,已经算是瘦身很多了。

上机展示

欣赏完开箱,我们再上机看看这款显卡的RGB效果如何,既然是白色主题的星曜显卡,那自然得白色主题装机才行。

白色的金属背板搭配星曜娘贴纸彰显了这款显卡的二次元属性,结合赛博朋克风的未来感线条,整体造型灵动而富有科技感。

如果换上星镜界背板后,整体又是别样韵味。得益于镜面元素的加入,主机内的RGB灯效交相辉映,效果更加动人。

无论是内存条的RGB灯效还是散热风扇的RGB效果都很好的映射在镜面背板上,整机颜值更进一步。

再来看外壳上的千层星曜LOGO,开箱时隐约能够看到其内部带有“BOOMSTAR”字样,通电以后,灯光亮起更显惊艳,除了有醒目的“BOOMSTAR”,四周还有繁星点点作伴,配合千层镜的灯效,若隐若现的观感,就好像水面掀起千层涟漪一样,这个效果也与星曜系列这个命名不谋而合。

当然,如果你的显卡是竖装时还能看到正面环绕风扇的IML穹顶ARGB灯也同步亮起,多彩的灯效变化配合其样式,犹如蓄势待发的翅膀一般。

再来看侧边外壳上的IML穹顶ARGB灯,光影流转的质感真的一眼吸睛,给纯白的显卡增添了不少层次感。

并且这个IML ARGB穹顶灯一直延伸至显卡的正面,效果非常吸睛。纯白的外观设计配合五光十色的RGB灯效堪称一场精彩的视觉盛宴。

显卡拆解

看完了显卡的外观,我们再看看影驰GeForce RTX 5070 Ti星曜LUNA OC 16GB的内部构造。拆解这款显卡还是非常简单的,卸下背板上的螺丝即可取下金属背板。

首先看显卡的PCB,为异型设计,并且有稍稍越肩,不过PCB上的接口、供电、核心、显存,以及辅助供电位置都相当的合理且规正,有大厂出品的质感。

PCB为12层非公设计,更高的PCB层数也意味着其拥有更高的电气性能稳定性。

PCB的中间则是GPU核心,它与GeForce RTX 5080用的是同款GB203核心,不过代号为GB203-300-A1。规格上,这颗核心集成了70个SM单元,280个TMUs纹理单元,96个ROPs光栅化处理单元,8960个CUDA核心。对比上代RTX 4070 Ti的话,单是CUDA核心就增加了17%左右,已经完全可以对标RTX 4070 Ti SUPER了。

在GPU核心周围则是8颗海力士的显存,编号是H57G42MP2AX004-503A,显存速率为28Gbps,单颗容量2GB,一共是16GB的GDDR7显存。

影驰GeForce RTX 5070 Ti 星曜LUNA OC 16GB采用了12+4+3相超强供电设计,其中12相为NVVDC核心供电,4相为MSVDD辅助供电,剩下的3相为显存供电,这样的设计确保了显卡获得更稳定、更强大的电力供应。

每相供电都配备了独立的DrMos芯片,来自万国半导体,型号均为DNN0 5C36。

控制它们的电源管理芯片则被安排在PCB的右侧,一样来自万国半导体,具体型号为AC500 84516。

供电接口则是12V-2x6供电接口,也就是我们熟悉的16Pin接口,单口可以提供600W的供电能力。

接下来让我们看看这款显卡的散热配置,影驰GeForce RTX 5070 Ti星曜LUNA OC 16GB配备的是全新的磁星MAX散热器。其最大的特点就是首创一体式磁吸上盖,玩家可以直接免工具拆装清灰,非常方便。

散热器最显眼的就是右侧大面积的大面积铜板,散热效能不容小觑。中间核心处,影驰更是用上了用霍尼韦尔PTM7950相变硅脂片,其拥有业界领先的导热效能和长效稳定性,能够更好的带离核心热量。

除此之外,铜板的四周,显存、电感、MOS管接触的地方也都用上了高系数的导热垫辅助散热。

整个散热器为左右两段式设计,由饱和式型鳍片结构设计,密密麻麻的散热鳍片一看就知道散热性能不容小觑。

在散热鳍片之间还暗藏玄机,里面有4根8mm热管与3根6mm热管,每根热管都贯穿整个散热器,并且直触上方的均热板。

同时得益于回流焊接工艺加持,热管与鳍片严丝合缝,犹如一体,能够快速将热量带离,保证了高效导热。

主动散热部分则是外观部分给大家介绍过的三把霜环散热风扇,全新升级的扇叶配合双滚珠轴承设计,绝对是散热系统的中流砥柱,既保证了风量的充足又兼顾了风扇的寿命。

测试平台介绍

开始性能测试前介绍一下本次的测试平台, CPU使用的是目前毫无争议的游戏神U——Ryzen R7-9800X3D,则是来自微星的MPG X870E CARBON Wi-Fi 暗黑主板。内存为24G×2套条的T-FORCE XTREEM ARGB 幻镜DDR5内存,在主板上直接开启AMD EXPO功能即能轻松达成DDR5-8000 C38的成绩,确保显卡能够释放全部性能。

完整测试平台配置如下:

理论性能测试

首先我们先在GPU-Z中看看这款显卡的详细参数,影驰GeForce RTX 5070 Ti 星曜LUNA OC 16GB的基准频率为2295MHz,S-Mode下的Boost频率为2452MHz,与MSRP版本的RTX 5070 Ti一样,而P-Mode下显卡的Boost频率为2527MHz。其他方面,这张显卡的TDP设定也非常激进,最高可以去到350W,显卡金手指支持PCIe 5.0速率,妥妥的战未来设计。

在性能实测环节,我们首先进行的是3DMARK理论性能测试。在Fire Strike系列测试中,影驰GeForce RTX 5070 Ti 星曜LUNA OC 16GB的表现令人瞩目,其在4K分辨率压力最大的FireStrike Ultra小项中可以做到领先RTX 4070 Ti约39%,而在2K分辨率的Fire Strike Extreme中则领先约37%,即便是1080P分辨率的Fire Strike也能做到32%的领先。接着,我们关注了以DX12为基准的Time Spy测试,影驰GeForce RTX 5070 Ti 星曜LUNA OC 16GB在Time Spy Extreme中的得分达到了13523,相较于RTX 4070 Ti,平均领先幅度达到了26%。Time Spy得分则是27697,领先幅度也有23%。

光线追踪是RTX 50系列显卡提升的重点领域之一。在这一领域,影驰GeForce RTX 5070 Ti 星曜LUNA OC 16GB以19396的得分成绩大幅领先RTX 4070 Ti,领先幅度高达38%。在最新的Speed Way测试中,性能提升同样达到了37%。实事求是地说,CUDA核心数量的优势确实让GeForce RTX 5070 Ti在理论性能上表现出色。同时得益于Blackwell架构的优化,它进一步拉开了与前代RTX 4070 Ti的差距。可以说,这一代RTX 50系显卡确实具备了不容小觑的实力。

DLSS 4专项测试

看完了理论性能部分的测试,接着我们再来看看本次RTX 50系显卡最“顶”的升级,DLSS 3在RTX 40系显卡上引入了帧生成技术,能够依靠AI在两帧之间生成一帧AI帧,从而实现帧数的翻倍,用过的玩家都说好!不过由于每生成一个新的帧都需要光流加速器和 AI 模型参与,因此生成多帧的开销相当高昂,而过高的性能开销会带来瓶颈,导致帧率提升受限。

而这次DLSS 4全新升级,引入了多帧生成技术,它可以利用 AI 为每个渲染帧额外生成多达3帧!相比传统渲染的方式,能够最多实现8倍的性能提升。并且每次渲染额外帧只需要AI模型执行一次,就能输出三帧画面,因此无论是对性能、显存的开销还是延迟都比之前要好了许多。

另外,由于多帧生成技术,输出的帧多了,要给每一帧都安排一个合理的间隔刷新才能让观感更好。因此NVIDIA还引入了专属的Flip Metering来代替CPU Pacing,它将帧节奏逻辑转移到显示引擎,让GPU能够更精确地管理显示时间,尽可能地将每一帧画面的生成时间保持一致,从而提高整体游戏视觉的流畅感。不过由于Flip Metering是硬件级的控制器,因此DLSS 4的多帧生成目前只有RTX 50系显卡支持。

同时DLSS 4 还引入了图形行业首个 Transformer 模型实时应用。熟悉AI的应该对它很熟悉了,它在AI生成领域已经应用多年了。基于Transformer架构的 DLSS 超分辨率和光线重建模型,相比之前DLSS使用的卷积神经网络(CNN)模型来说,具备2倍的参数量和4倍的计算量。在游戏场景中,能够提供更高的稳定性、更少的拖影、更高的细节和更强的抗锯齿能力,使画面更加清晰、流畅和逼真。

不过虽然DLSS 4的多帧生成功能是RTX 50系显卡的独占功能,但新的Transformer模型将会逐步下放至DLSS 3、DLSS 2等,将适用于所有GeForce RTX显卡。并且根据NVIDIA的说法,超过75款游戏和应用将在GeForce RTX 50系列开售时支持DLSS 4的全新DLSS多帧生成功能,包括《赛博朋克2077》《战神:诸神黄昏》《心灵杀手2》《霍格沃兹之遗》《黑神话:悟空》等,更多游戏也将于今年晚些时候升级支持 DLSS4的多帧生成。随着时间的推移,支持DLSS 4的游戏和应用数量将不断增加。

在简单介绍之后,让我们进一步探讨DLSS 4理论性能表现,为经典的3DMark测试。不测不知道,一测吓一跳,影驰GeForce RTX 5070 Ti 星曜LUNA OC 16GB,在启用DLSS 4后,帧数表现宛如开了挂一般,实现了巨大的性能飞跃。开启与关闭DLSS 4的性能对比,简直是天壤之别!在2K分辨率下,性能差距达到了惊人的4倍之多。而到了4K分辨率,性能差距更是夸张,达到了6倍。与DLSS 3相比,帧数提升也接近80%,最令人震惊的是在8K分辨率下的表现,通常情况下,即使是中高端显卡也难以在8K分辨率下流畅运行游戏。然而,影驰GeForce RTX 5070 Ti 星曜LUNA OC 16GB在DLSS 4的加持下,竟然能够达到138.38 FPS,都已经达到高刷的水准了,完全超出了我们之前的想象,也意味着分辨率不再是限制我们畅玩游戏的障碍。

接着我们看看DLSS 4在实际游戏中的表现,率先登场的就是有着“显卡杀手”之称的《赛博朋克2077》,它的设置页面是目前支持DLSS 4游戏中最为丰富一款,除了能够设置DLSS 4的多帧生成外,还可以切换DLSS 4的另一个特性——Transfomer Mode,据说能够让画质更清晰,同时还能改善此前的拖影问题,对玩家可以说是一大利好。

我们直接来一波对比,左侧为Transformer模型,右侧则是原本的CNN模型。从第一个场景来看,Transformer模型能够带来更多的细节。例如左侧图片中的栏杆倒影,这部分表现是比较清晰的,而CNN模型中则几乎不可见。

第二个场景也是能够一眼看出区别的,例如金属门的纹理细节以及砖墙的接缝处,明显是Transformer模型的优化要更好一些。

这个场景的区别主要在于地板细节刻画以及右侧铁栏杆部分,采用Transformer模型的情况下,地板细节更接近真实世界,并且铁栏杆的细节也能更好的还原。而CNN模型则会丢失比较多的细节,虽然不影响观感,但总有种“失真感”。

不过Transformer模型目前也并非万能,毕竟是由AI生成而来,因此在部分细节上还是有些错误的。例如下方的窗口部分,阳光照射下应该是斑驳的光影,比较正确显示的应该是CNN模型中的样式。整体来看,现在Transformer模型瑕不掩瑜,大幅改善的画面细节能够给玩家带来更精致的游戏展现。

见识完Transformer模型的魅力以后,我们再来看DLSS 4的性能表现,毕竟是“显卡杀手”,对显卡的压力确实不一般,在最高画质+路径追踪的情况下,影驰GeForce RTX 5070 Ti 星曜LUNA OC 16GB只能跑32.41 FPS,勉强可玩的水准。开启DLSS 3质量以后,游戏帧数为110.08 FPS,体感已经非常流畅了。开启DLSS 4质量以后,影驰GeForce RTX 5070 Ti 星曜LUNA OC 16GB能够做到200.95 FPS,对比原生分辨率,性能提升接近7倍。1%Low就更离谱了,几乎快要追上DLSS 3下的平均帧了,整体游戏体验更佳。

看过上面的性能成绩,不得不说DLSS 4带来的性能提升是有目共睹的,不过也有玩家担心DLSS 4的画质表现如何,这里我们也在游戏中截取了部分画面,第一个场景其实差距不大,肉眼很难分辨出区别。

第二与第三个场景还是能够看出部分细节的,例如第二幅图中的霓虹灯牌,DLSS开至性能档以后,能够看到灯牌与前面三张图有些许差异,不过你得靠细致的对比才能看出。实际游戏过程中很难发现,基本不影响观感。

总的来说,DLSS对画质的影响没有玩家想象中那么大,甚至于在纹理细节上能够不输或超越原生分辨率。如果你是敏感型玩家,那建议可以开至平衡档,在画面质量和帧率之间能够做到很好的平衡。如果你是追求超高帧率,那性能档也绝对可用,细节保留也不错,不对比基本看不出,同时帧率还能进一步提高。

紧接着进行的是我们测试的第二款DLSS 4游戏《霍格沃兹之遗》,支持DLSS 4技术以后可以在设置看到帧生成部分多了一些选择,其中×2则是原本DLSS 3的帧生成,而×4则是RTX 50系独有的多帧生成功能,另外你也可以选择插2帧的方式,也就是所谓的×3选项。

实际测试过程中,《霍格沃兹之遗》这款游戏优化还是不错的,2K分辨率画质光追均设置最高的情况下,影驰GeForce RTX 5070 Ti 星曜LUNA OC 16GB在不开任何超分的情况下,平均帧为77 FPS,已经可以畅玩了。如果开启DLSS 3质量档,此时帧数已经能够做到156FPS了,体验已经相当丝滑了。开启DLSS 4质量以后,帧数可以进一步提升至294 FPS,对比原生2K时,性能提升了约4倍接近5倍。同时实际游戏过程中,无论是1%Low还是延迟都不错,特别是延迟,相比原生分辨率还要低不少,跟手感更好。

第三款游戏我们测试的是《星球大战》,一样你能在设置中看到其帧生成功能已经支持×4的选项,也就是DLSS 4多帧生成功能。

实测DLSS 4在这类优化欠佳的游戏中确实大有用处,在2K原生分辨率下,影驰GeForce RTX 5070 Ti 星曜LUNA OC 16GB的平均帧仅有35 FPS,延迟也很高,游戏体验一般。而开启DLSS 4质量档以后,游戏平均帧直接暴增至198 FPS,游戏体验如德芙般丝滑,对比原生2K的表现,足足有6.6倍左右的提升。即便是对比DLSS 3的110 FPS,那也是接近翻倍的性能提升。

最后一款游戏是我们的老熟人《漫威争锋》,这款游戏在RTX 50系显卡首发之时,它还没有完全适配DLSS 4,玩家想要体验多帧生成功能还需要依靠NVIDIA App的DLSS 4优设功能。不过现在《漫威争锋》也正式支持DLSS 4了,与上面的游戏一样,玩家在游戏设置中就能直接开启,并且提供了2x、3x以及4x选项,玩家可以随意选择是插一帧、插两帧还是插三帧。

实测影驰GeForce RTX 5070 Ti 星曜LUNA OC 16GB在2K全高设置下,不开超分,帧数为124 FPS,已经可以高刷畅玩了。而开启DLSS 3质量档后帧数可以达到223 FPS,相比原生分辨率提升接近一倍,如果再开启DLSS 4多帧生成,性能对比原生分辨率直接提升3倍以上,375 FPS的表现妥妥的电竞3A。同时延迟表现也非常出色,原生分辨率下,其延迟为35 ms,而开启DLSS 4以后,延迟甚至能够降低至23 ms,游戏会更加跟手,体感更佳。

当然,如果你想玩的游戏还不支持DLSS 4,那也不用担心,NVIDIA App还提供DLSS 4优设功能,说人话就是能够让游戏强开DLSS 4,像此前的《漫威争锋》,在未更新前,玩家可以直接在NVIDIA App中简单设置,就能将帧生成调至“4×”,一键实现多帧生成。目前也有不少游戏支持DLSS 4优设功能,感兴趣的玩家可以前往体验。

总的来说,DLSS 4多帧生成功能的问世,毫无疑问为玩家带来了前所未有的游戏体验升级。与上一代RTX 40系的DLSS 3帧生成功能相比,它再次实现了帧数的惊人飞跃。在相同的画质设置下,影驰GeForce RTX 5070 Ti 星曜LUNA OC 16GB的表现远远超越了前代RTX 4070 Ti。实际测试中,在上述四款游戏里,开启DLSS 4的影驰GeForce RTX 5070 Ti 星曜LUNA OC 16GB,帧数几乎是RTX 4070 Ti的两倍甚至接近三倍!并且我们的测试还是在2K分辨率进行的,以目前影驰GeForce RTX 5070 Ti 星曜LUNA OC 16GB开启DLSS 4的性能,轻松征服4K分辨率也不成问题。

另外,值得一提的是,与DLSS 4一起到来的还有全新的NVIDIA Reflex 2技术。延迟一直是电竞中绕不开的话题,玩家的每个动作都会经过复杂的计算,再在屏幕上渲染,这其中的每一步都会增加延迟。虽然延迟往往只有几十毫秒,但是你却能明显的感觉到游戏的不流畅、卡顿。

为了尽可能的降低延迟所带来的不良游戏体验,NVIDIA发布了NVIDIA Reflex技术,它可以使GPU和CPU同步,确保最佳响应速度和低系统延迟。目前NVIDIA Reflex已集成到超过100款游戏中,可以将PC延迟降低50%。

而GeForce RTX 50系显卡再度升级,带来了NVIDIA Reflex 2技术。它结合了Reflex低延迟模式与frame Warp技术。它可以把最新的鼠标输入指令同步给渲染帧,及时更新渲染的游戏帧并在渲染帧被发送到显示器之前获取最新的鼠标信息,通过刷新渲染的游戏帧以进一步减少延迟,将PC延迟进一步降低多达75%。

另外,frame Warp的加入,能够进一步将延迟降低。当一个帧被GPU渲染时,CPU会根据最新鼠标或手柄输入计算工作流中下一帧的视角位置。frame Warp从CPU采样新的视角位置,然后将GPU刚才渲染的帧扭转到最新的视角位置。在渲染帧被发送到显示器之前,在尽可能最新的时间进行扭转操作,确保屏幕上反映最新鼠标输入。

而当frame Warp转移游戏像素时,图像中可能会产生缝隙撕裂、镜头位置的变化会让游戏场景中显示新的部分。NVIDIA则开发了一种优化了延迟的预测渲染算法,该算法使用来自先前帧的视角、颜色和深度数据,对这些撕裂空白的像素进行准确的图像修复。玩家可以通过更新的视角看到没有撕裂的渲染帧,并降低了改变游戏内视角位置而产生的延迟。说人话就是现在NVIDIA Reflex 2还可以根据上一帧的信息去脑补一些空白的像素,有种无中生有但你又看不出来的感觉。

首发支持NVIDIA Reflex 2技术的游戏是《THE FINALS》以及《无畏契约》。

游戏性能测试

DLSS 4的性能想必让你震惊,不过目前还有部分游戏没有适配DLSS 4,因此我们也对这部分游戏进行了详细的测试。一如既往,我们首先进行3DMark的DLSS 3性能测试。影驰GeForce RTX 5070 Ti 星曜LUNA OC 16GB在2K分辨率下的性能相较于RTX 4070 Ti提升了约38%;而在4K分辨率下,启用DLSS 3后,性能优势大致保持在40%。8K档位的话,提升的幅度则高达41%,不过成绩不及DLSS 4下亮眼。

理论性能还是非常强的,但是理论终归是纸上谈兵,还得进游戏里实际测试一下才知道影驰GeForce RTX 5070 Ti 星曜LUNA OC 16GB的实力。这里我们选取了11款游戏进行测试,包含光追及光栅性能方面的测试,而游戏画质方面均全部选择最高画质,光追设定部分,如有则采用最高。

实测2K分辨率下,影驰GeForce RTX 5070 Ti 星曜LUNA OC 16GB应对绝大多数游戏都轻轻松松,特别是在DLSS的加持下,满足2K高刷电竞体验是完全没有问题的,像有“显卡杀手”之称的《赛博朋克2077》,我们在超级光追档位下,开启DLSS 3也有160 FPS,部分优化好的游戏甚至能够逼近200 FPS。具体到性能上,在这么多款游戏里,影驰GeForce RTX 5070 Ti 星曜LUNA OC 16GB整体比RTX 4070 Ti强约31%左右。以影驰GeForce RTX 5070 Ti 星曜LUNA OC 16GB的表现来说,它不仅可以满足2K高刷的游戏体验,还能实现4K畅玩3A。

图像视频创作性能测试

游戏测完,下面就来看一下创作者们比较关心的生产力性能,在PCMark10 Extended测试, 影驰GeForce RTX 5070 Ti 星曜LUNA OC 16GB在游戏、数位内容创作方面的表现更佳,基本上要比RTX 4070 Ti高12%和16%左右。而生产力方面的成绩与之前我们所测试的RTX 50系列一样,得分比较低,推测是目前驱动和软件优化还不完善所致。

在办公软件的测试环节中,影驰GeForce RTX 5070 Ti 星曜LUNA OC 16GB同样表现出色,其整体性能大约领先6%。这一优势主要体现在Excel、PowerPoint以及Outlook这三个应用程序上。然而,实事求是地说,使用这两款显卡进行日常办公任务确实显得有些奢侈。毕竟,在打开这些软件时,性能上的差异几乎可以忽略不计。

提升明显的则要看图像视频创作方面,在Adobe和达芬奇的基准测试中,影驰GeForce RTX 5070 Ti 星曜LUNA OC 16GB相较于RTX 4070 Ti性能提升非常显著,尤其是在视频编辑方面。这一进步主要得益于新一代GeForce RTX 5070 Ti对编码器的进一步升级,它不仅提高了编解码的效率,还扩展了支持的格式范围。例如,在达芬奇和Premiere Pro的测试中,影驰GeForce RTX 5070 Ti 星曜LUNA OC 16GB相较于RTX 4070 Ti领先约16%~33%,这一差距相当显著。此外,在After Effects中也有约7%的性能提升,总体而言,内容创作的效率得到了极大的提升,这一领域的工作者完全可以升级这次的影驰GeForce RTX 5070 Ti 星曜LUNA OC 16GB。

3D渲染创作性能测试

看完了图像视频方面的创作,我们再把目光投向3D渲染以及工业领域的软件中,看看RTX 50系显卡又有怎样的精彩表现。首先是熟悉的朋友Blender以及V-Ray,在这两款软件中,影驰GeForce RTX 5070 Ti 星曜LUNA OC 16GB的表现也是异常惊人,基本是大幅度领先RTX 4070 Ti。特别是Blender的junkshop场景,对比RTX 4070 Ti的提升幅度直接来到了29%。

再看看另外一款渲染器,D5 Render是一款基于DXR和光线追踪技术构建的GPU渲染器。正因为其有光线追踪技术,其渲染的画面相当出色。这款软件在RTX 40系显卡测试时支持了DLSS 3帧生成,而现在随着RTX 50系显卡的发布,它也可以通过NVIDIA App的方式支持最新的DLSS 4多帧生成功能。

实测在开启DLSS 4以后,影驰GeForce RTX 5070 Ti 星曜LUNA OC 16GB整个渲染预览的界面变得丝滑流畅,帧数基本在222 FPS附近,而对比不开DLSS时,仅58 FPS的表现来看,性能几乎是提升了4倍以上。对比仅可开DLSS 3的RTX 40系来说,性能优势也有50%以上,可以说直接让这款软件的体验有了史诗级的提升。

再看看工业领域的表现,SPEC2020能够比较全面的反映显卡的工业能力,在多项测试中影驰GeForce RTX 5070 Ti 星曜LUNA OC 16GB依旧傲视群雄,对比RTX 4070 Ti平均有18%的提升,这个性能提升还是很可观的。

NVIDIA编解码性能测试

接下来的测试则是介绍RTX 50系显卡的编解码器,GeForce RTX 50系列显卡上换装了第9代NVENC编码器与第6代NVDEC解码器,在视频规格上支持AV1 UHQ(超高画质 AV1)与MV-HEVC(多视角HEVC)编解码。同时由于GeForce RTX 50系列显卡还升级支持DisplayPort 2.1 UHBR20输出,单一通道支持20Gbps带宽,因此用户可以体验到令人惊叹的HDR视觉效果、超高分辨率和更流畅的游戏体验。

这里我们直接使用NVIDIA提供的4K60片源与工程文件分别测试AV1、H.265以及H.264下的编码导出时间。实测同一段素材下,影驰GeForce RTX 5070 Ti 星曜LUNA OC 16GB导出三段视频的时间分别是9秒、14秒以及10秒,效率提升已经是超级明显了。

同时,我们也对导出的不同格式的视频进行了画质对比,实测AV1编码的视频在画质上与H.265或H.264也没有明显差距,无论是在文字、人像还是建筑等画面里,三者的画质可以说是伯仲之间,如果不特地标注其格式,一般人很难用肉眼分辨出来。随着目前越来越多视频网站、剪辑软件和硬件厂商的推动,未来AV1势必会成为下一个最受欢迎的格式。

值得一提的是,GeForce RTX 50系显卡还能够支持4:2:2色度取样的视频编解码,这将节省CPU的负担,加快创作速度。上面的图表里也可以看到我们的测试成绩,实测导出时间会比上代显卡快不少,毕竟RTX 40系显卡不支持该功能,仅支持4:2:0色度采样,如果一定要4:2:2导出只能靠CPU软解。

4:2:2色度采样的视频文件采用的是YUV颜色格式,与存储红色、绿色和蓝色(RGB)值不同,颜色被存储为亮度Y、蓝差色度U和红差色度V。在这类视频中,视频的完整亮度将被保留,而原始色度信息只保留一半,因此相比4:4:4的视频,其视频帧数据量仅有不到三分之二,而相比4:2:0的视频又能提供两倍的颜色分辨率,因此创作者采用这种格式拍摄,能够在保留更多色彩信息的同时还能减少文件大小和带宽需求。

AI性能测试

AI性能目前也是大家关注的重点,特别是在国产大模型爆火以后,各行各业都开始接入AI,似乎AI成了必选项。RTX 50系显卡也针对AI进行了改进,其中最值得说道的就是其加入了对FP4精度模型加速处理的支持,它相比此前RTX 40系上的FP8精度,能够实现更快的生成速度,同时显存占用也更低。

利用UL Procyon测试版本FLUX.1 AI Image Generation Demo For NVIDIA,在FP8精度模型与FP4精度模型下分别进行测试。在均使用FP8精度模型时,影驰GeForce RTX 5070 Ti 星曜LUNA OC 16GB能够做到16.51 s生成一张图,而RTX 4070 Ti明显已经爆显存了,运行时已经需要依赖共享内存才能运行,因此耗时超长;而切换到FP4精度模型后,影驰GeForce RTX 5070 Ti 星曜LUNA OC 16GB生成图片的速度能够提升到8.26秒一张,效率同样是翻了几番。这一切的AI性能提升,不仅是Blackwell架构能够实现原生对FP4精度模型的支持,从而带来的性能优势;更是影驰GeForce RTX 5070 Ti 星曜LUNA OC 16GB所配备的16GB GDDR7显存带来了更大容量与更高带宽的传输优势。

并且FP4精度模型生成的图片超级快,从下图就能看出来,其与FP8生成的图片几乎没有区别,无论是对关键词的理解还是图像的质量,都非常有保障,新时代AIGC玩家的最佳选择了。

在AI文本生成测试中,影驰GeForce RTX 5070 Ti 星曜LUNA OC 16GB在一众大语言模型里同样表现出众,我们用MLPerf Client v0.5大语言模型进行测试,它是基于meta的Llama 2 7B开源LLM打造,涵盖了四项AI任务,分别是内容生成、创意写作以及对两份不同长度文本进行总结摘要。实测影驰GeForce RTX 5070 Ti 星曜LUNA OC 16GB在每一项中都表现出了绝对的统治力,各项领先幅度均在40%以上。

随后,我们利用UL Procyon的AI Text Generation对多个大型语言模型进行了进一步测试。在这些测试中,影驰GeForce RTX 5070 Ti 星曜LUNA OC 16GB的领先优势依然显著。在基于Llama 3.1 7B LLM构建的Phi-3.5测试中,这款新一代显卡取得了4338分的成绩,相较于RTX 4070 Ti,性能提升了26%。当测试参数扩展至Llama 2 13B时,影驰GeForce RTX 5070 Ti 星曜LUNA OC 16GB的表现更加卓越,得分高达4374分,相较于RTX 4070 Ti,性能领先幅度达到了约44%。

功耗与温度表现

最后一项测试烤机,这也是许多玩家关注的重点。影驰GeForce RTX 5070 Ti 星曜LUNA OC 16GB配备了P-Mode以及S-Mode两种BIOS模式,我们分别进行测试。在P-Mode模式下,Furmark烧机20分钟后,得益于影驰GeForce RTX 5070 Ti 星曜LUNA OC 16GB出色的设计底蕴,核心温度并不高,仅有65度,显存温度更是低至56度,此时显卡的最大功率为299.9W,风扇转速则是1600 RPM,表现相当惊人。

在S-Mode的设定下,同样是烤机20分钟,由于Boost频率的降低,核心温度也稍低一些,为63.3度,显存则是54度。

横向对比前代显卡时可以看到,虽然新显卡的TDP提升了一些,不过整体的烤机功耗并不算高,并且影驰GeForce RTX 5070 Ti 星曜LUNA OC 16GB还有双BIOS设置,两种模式下核心与显存的温度都还控制得不错,多一点点功耗,但却换来了极大的性能提升,属于是非常惊喜了。

评测总结

总的来说,影驰 GeForce RTX 5070 Ti 星曜 LUNA OC 16GB,从外观设计到硬件配置,从散热效能到做工品质,皆展现出顶级非公版显卡的风范。其卓越的性能、出色的温控以及令人瞩目的高颜值,充分诠释了顶级显卡的实力,更是影驰对玩家文化深刻洞察的体现,力求在功能与美学间达到完美平衡。

外观设计方面是影驰GeForce RTX 5070 Ti 星曜 LUNA OC 16GB最吸睛的部分。显卡四周环绕着如梦似幻的灯带,恰似星曜娘的翅膀,为显卡增添了几分灵动与梦幻。五光十色的星曜LOGO与全新设计的星镜界背板相互辉映,光影流转间尽显高端质感,让显卡宛如艺术品一般。

在实际应用中,影驰GeForce RTX 5070 Ti 星曜 LUNA OC 16GB更是展现了卓越的性能。游戏方面,仅开启DLSS 3,其性能就比上一代显卡提升约40%,而支持的革命性DLSS 4技术更是让性能大幅提升,与2K原生分辨率相比,差距更是可以拉开至几倍以上。在内容创作领域,新一代编解码器让视频和渲染速度成倍增长,配合不断优化的NVIDIA Studio平台,为创作者带来强大助力。AI性能方面,支持FP4精度加速,AI图像生成速度远超RTX 4070 Ti,再加上16GB GDDR7大显存,数据传输速度惊人,可轻松应对高分辨率渲染和AI创作任务。

最后再说说选购建议,有一说一,GeForce RTX 5070 Ti无疑是目前RTX 50系中的明星产品,它巧妙地融合了高性能与高性价比。对于热衷于游戏的玩家来说,这款显卡能够轻松应对各类高画质游戏大作,确保流畅的游戏体验。而对于从事视频制作的专业人士,其强大的图形处理能力可以大大提升工作效率,满足复杂的视频编辑和渲染需求。此外,对于有意向构建小型本地化AI PC的用户,GeForce RTX 5070 Ti同样是个理想的选择,能够为AI应用提供足够的算力支持。

而影驰GeForce RTX 5070 Ti星曜LUNA OC 16GB更是一众GeForce RTX 5070 Ti中的佼佼者。除了有高性能高性价比的优势外,设计上也别出心裁,展现出非凡的吸引力。如果你正在寻找一款能够满足游戏、创意工作以及 AI 开发等多样化需求的显卡,那么 影驰GeForce RTX 5070 Ti星曜LUNA OC 16GB绝对值得你考虑。



免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。由用户投稿,经过编辑审核收录,不代表头部财经观点和立场。
证券投资市场有风险,投资需谨慎!请勿添加文章的手机号码、公众号等信息,谨防上当受骗!如若本网有任何内容侵犯您的权益,请及时联系我们。