看过我们之前十年旗舰N卡横评(点击这里可以跳转)的朋友,可能都会感慨半导体行业的神速发展,从GTX 480到RTX 2080 Ti,性能提升到了1298%!
也有朋友吐槽RTX 20对比GTX 10提升不大,但是,在老黄发布RTX 30后,那价格,那性能,真香!
同时这也引发了圈内一大波的连锁效应,RTX 2080 Ti二手价格一夜腰斩,相关的段子和弔图也铺得满天都是,不过关于RTX 3080的评测相信大家已经看过不少,今天我们就带来更为直观的RTX 3080评测视频。
视频不仅有3080的全面测试,还有对比十年前GTX480等特别的项目,大家耐心看就知道啦。
当然了假如你不喜欢看视频,或者流量捉鸡,我们也有文字版本~
NVIDIAAmpere架构解析-CUDA流处理器翻倍提升的秘密
有的朋友可能想到了,那么晶体管翻倍是不是就是流处理器翻倍的原因呢?你答对了一点点,晶体管暴增让GA102核心拥有84组SM计算单元,比上一代的TU102多了12组,但我们这次评测的3080和2080 Ti SM单元一样仅有72组,但CUDA核心数目还是翻倍了
根本原因是这次老黄改变了N卡流处理器的运算模式。
想搞清楚这点我们首先要知道显卡运算一般分为整数运算(Integer)和浮点运算(floatingpoint)两种,而浮点运算可以分为半精度(FP16)、单精度(FP32)、双精度(FP64),整数运算也可以这样划分。
与游戏最密切相关的就是FP32运算,其次是INT32,从费米架构以来NV就把显卡专门做FP32的运算单元叫做CUDA核心,因此以往我们可以根据CUDA核心的数量来比较N卡性能,但是做其他运算的流处理器数量NV并没有统计
那么总流处理器数怎么算的呢?
以2080 Ti TU102核心图为例,完整的TU102有6组GPC图形簇,每组GPC有12组SM单元。
再放大一点这里我们能看到每组SM又能划分为四个小组,每个小方格代表一个运算单元,因此一个模块有16个进行FP32运算的cuda单元,和16个进行INT32运算的单元,还有个Tensor Croes,一个SM总共64个CUDA运算单元和64个INT32运算单元,4个tensorCores和1个RTCores,这是图灵架构的细节,所以TU102总共有64*12*6共4608个cuda核心和4608个INT32运算单元。
到了NVIDIAAmpere架构,大家能发现这里原本的16个INT32单元也能进行FP32运算,右边的FP32单元保持不变,所以这样一个小分区里一个运算周期内显卡可以选择做16个FP32运算+16个INT32运算或者做16FP32+16FP32共32个FP32运算。
因此按照N卡能做FP32运算的单元就是CUDA核心的算法,这里一个SM单元的CUDA流处理器数目就翻倍到128个了。
这样做能让显卡在单纯跑FP32浮点运算时性能翻倍,但是显卡在游戏中是不可能只做浮点运算的,这也是为什么3080对比2080 Ti CUDA数目翻倍,但游戏性能并不会翻倍的原因。
除了CUDA核心数目提升,显存带宽提升也是RTX30性能暴涨的一大原因,3080和3090采用了镁光新一代的GDDR6X显存,新显存加入PAM4信令机制,让每周期传输的数据量翻倍,大家可以理解为SLC到MLC那样的升级。
新的显存其速率达到了19Gbps和19.5Gbps,根据显存带宽等于显存速率 x 位宽除以8,3080的显存带宽达到了760GB/s,3090更是达到了惊人的936GB/s,对比2080 Ti提升了24%和52%。
其他方面呢,比如PCIE4.0与RTXIO、HDMI2.1这些就不详细介绍了。
但是这次公版设计,还是获得我们的一致好评, 不得不佩服NVIDIA的工业设计能力,看到官方渲染图的时候,我们都啧啧称奇,有人说没必要,也有人说这是艺术品。
直到我们看到它满载78℃与裸机48分贝噪音的测试结果的时候,整个猛男团队都跪服了,这个异形PCB实在是太有必要了。也只有这样的设计,才能用上这种双轴流通式散热器。
第二部分,为什么这次它叫RTX 3090,而不是RTX3080 Ti?
这部分单纯是我们的猜测,如有雷同实属巧合,以后发现猜错了再回来打我们脸吧
猜测1:虽然AMD迟迟没有出招,皮衣刀客老黄的实力可不是盖的,这次算了算差不多是AMD再怎么蓄力都触碰不了的高度,出了张新卡,直接给它命名90吧,既能给AMD一个震慑作用,又能把价格定得更高,毕竟是90嘛,怎么也得比80Ti卖贵一些呀,好了,大家乖乖掏钱。
猜测2:在顶级位置安排一个高定价的RTX3090,能显得RTX3080性价比很高,毕竟看规格有80%的性能,可价格还不到一半,是不是很香?预计第一批货会秒没。
猜测3:在RTX3090和3080之间还有很多刀的空间,比如RTX3080可以加点流处理器,加点显存,做成RTX3080Ti或者3080S作为后手招呼AMD10月28日要发的大Navi,毕竟这5499和11999之间还有6000多块钱的差价。
而且从老黄在发布会上的说法来看,RTX3090很可能就是用来取代在此之前TITAN定位的产品的,这对于需要巨大算力的专业机构来说,简直是天赐的福利。
对了,就算是RTX3090也不是完整版,参照我们前面的算法,完整版GA102是有10752个流处理器的,老黄只开了10496个。
反正无论如何,老黄还留了个超级后手,…真不愧是皮衣刀客,刀法如此精妙,猛男团佩服佩服。
第三部分,十年显卡性能增长多少?
3090还没解禁,目前3080也算是这十年来NVIDIA游戏显卡市场中最强的单芯卡了,立马实测一波
测试平台和项目与上期一致,大家看表格就好。
评测平台操作系统Windows 10 1909 Pro Workstations 18363.720CPUi7-10700K主板华硕ROG M12E内存影驰HOF EXTREME 设置在3600MHz8GB X 2SSD三星 970 Evo Plus 1TB电源昆仑KL-1080W电源水冷散热器超频三凌镜GI-CX360水冷散热器
理论性能测试方面RTX3080平均四项对比2080Ti提升了28%,对比2080提升了65%。
在游戏方面,麻烦又来了,因为3080性能实在太强,即使我们开了全高画质,很多游戏比如吃鸡在1080P下CPU还是出现瓶颈了,3080对比2080Ti的提升只有几帧。
很多小机灵鬼在上期视频曾经质疑我们,怎么不用10900K呢?其实看过我们十代酷睿评测这期的网友就知道和10700K差不多性能的9900K游戏对比10900K也就弱了7%,不能根本性解决问题该瓶颈还是瓶颈。
这也侧面说明了,目前CPU的游戏性能增长已经赶不上GPU游戏性能的增长了,大家手动艾特牙膏厂进来挨打!
最后剔除掉有问题的数据,最终3080对比2080 Ti提升22%,对比480提升到了1584%,整机平台功耗上涨了133W。
但是显然用这种测试方法来给RTX 3080对比RTX 2080 Ti的提升下结论,是不够全面的,主要有三个槽点。
RTX30系显卡是支持PCIe 4.0的显卡,你这里用PCIe 3.0的平台会不会限制显卡性能发挥?
刚刚也说了1080P下很多游戏中CPU已经成为瓶颈,而且买这个性能显卡的玩家大部分也不会在1080P下玩游戏了,对比2K游戏和4K游戏性能会更为靠谱。
第三,我们这里为了让10年前的显卡都能和3080在同一条赛道上比赛,用的都是老游戏,但是DX12新游戏,特别是包含光线追踪和DLSS支持的新游戏才是两者差距所在,才能体现30系第二代RT Cores和TensorCores的威力。所以我们再来个加时赛,专门让3080、2080Ti、2080SUPER和2080和进行PK。
第四部分:PCIe4.0显卡用在3.0平台有没瓶颈?
其实在老黄开发布会官方演示的PPT中,他们就是使用酷睿i9进行测试的,光是这点,你们就不用担心PCIe3.0够不够用的问题了。但猛男抱着实事求是的态度,还是拿支持PCIe4.0的AMDRyzen93900XT与X570作为平台再测一遍对比一下。
虽然两者跑3DMark的带宽测试有差距,但是多个理论性能测试项目中,两者都没有明显的差异,因此我们可以得到结论PCIe3.0×16的带宽是完全能满足RTX3080对带宽的需求的。
但是,我这个结论只针对单卡用途啊,因为RTX3080是不支持双路SLI的,而RTX3090则是支持SLI的,如果在Z490这种消费平台PCIe3.0主板上进行双路SLI的话,那每路就只能拿到PCIe3.0×8的通道了,在那个时候就可能出现瓶颈了。
第五部分,加入DX12游戏,更全面的性能测试
针对第二点我们先追加了三项理论性能测试,分别是更严苛的DX12测试场景TimeSpyExtreme、光追性能测试PortRoyal和DLSS测试,这里3080对比2080Ti也是保持30%左右的性能优势。
除此以外我们还准备了6个新游戏进行测试其中有5个支持光线追踪和DLSS,这里只看它们在2K和4K分辨率下的表现,各项测试中3080对比2080Ti都有明显的优势。
在毁灭战士4k分辨率测试时优势最明显,达到43%,平均下来也有30%左右的提升,而对比2080提升最大则在德军总部4k分辨率测试中,这里显然2080和2080SUPER就爆显存了,帧数只有30801/3。
结合此前6个旧游戏中这四张显卡在2K、4K分辨率的成绩,最后我们就能得到这张全面的性能百分比图表。
12个游戏,两个分辨率,9项理论性能测试,这33项测试得出的这张性能百分比图表应该算非常全面和具有参考价值的了,RTX3080对比RTX2080Ti提升为28%,对比2080SUPER提升56%,对比2080提升足足有71%。
第六部分,对比目前最强A卡,简直是屠杀..
虽然现在市面上的A卡比较弱鸡,但作为NV目前唯一的对手,这里我还是要象征性拿出几张A卡出来鞭尸,这里我们选用了RadeonVII和5700XT两张显卡,因为我们发现虽然理论性能RadeonVII是目前最强的A卡,但是GCN架构实在太老了,在很多新游戏中RadeonVII的表现反而不如5700XT,因此我们索性两张显卡都加入测试。
测试项目是12项游戏中不涉及光追和DLSS的7个游戏,最终3080比RadeonVII强了82%,对比RX5700XT强了93%,接近翻倍
测试结果看完,相信每一个A粉都压力山大,不过苏妈给了大家点信心,根据泄露的消息,BIGNAVI采用RDNA2架构,命名6800或者6900XT,10月28日发布,届时我们再来看看红绿两家的PK。
第7部分,功耗温度测试、噪音测试、延迟测试
RTX30系使用的是三星特制8nm工艺,显卡的功耗表现如何呢?这里我们使用了一套很牛逼的设备,由NVIDIA提供能通过PCIe插槽供电和外接供电直接读出显卡单独的功耗,3080的功耗比2080Ti要高了30~60W,能耗比对比2080Ti高了7%。
这样看新显卡的工艺还是有点拉跨,其实三星8nm工艺确实在密度上是比不上台积电的7nm工艺的,老黄用它也是胜在便宜,最后3080的价格也确实让人惊喜。
显卡的噪音也非常不错,50分贝以下根本没有感觉。
在RTX30系发布会上老黄还提到了一个降低显卡延迟的技术Reflex这里我们也检测了一下新显卡在堡垒之夜游戏中的延迟情况,打开Reflex后在画面延迟确实有所降低,而且分辨率越高疗效越明显,对职业电竞玩家的确实是个好东西,只是对于晓边我来说可能就感知不强了。
总结
3080的性能提升足够让人惊喜,当然最令我惊讶的是价格,毕竟此前的消息一直都说RTX30系要继续涨价,唯一的槽点就是功耗也增长了不少,但前面也说了,假如不是用三星8nm工艺,新显卡的价格也不会那么出人意料,算是一把双刃剑吧,大家记得选购靠谱的电源就好。
再从十年提升的曲线也能看出,在RTX20划了两年水之后,在心疼买了20系的小伙伴之余,也能欣慰地看到这代RTX 30系的提升开始回到了正轨,而对于RTX 3090显卡,性能从它的规格来看也大致推算出会比3080强20%左右,八九不离十了。
如果说英伟达图灵架构的RTX20是试水光追的一代,那么英伟达安培架构的RTX30就是扬帆起航的一代了。本次实测可以看到,在同时开启DLSS和光线追踪功能之后,RTX 3080已经足以支持4K60帧的游戏体验了。
我们曾经猜测过光追可能是未来,但没想到这个未来来得这么快!如果说光追导致帧数低是你曾经拒绝它的原因,那么这一代,这个理由已经不成立了。
当然,这也还得老黄去大力把这技术普及到更多的游戏制作公司、游戏引擎上,才能有足够丰富的游戏来让玩家买单。不然我猜到你还能说:才那么几款游戏支持光追,有什么用呢?
抛开光追不说,RTX 30的绝对性能、以及定价,也已经足够排除掉你其他的选项了。(作者:贾晓边)
责任编辑:kj005
文章投诉热线:156 0057 2229 投诉邮箱:29132 36@qq.com如果你有原装的SurfacePro、SurfacePro2或SurfacePro3设备,那么我们有一个重要的安全信息给你。微软已...
对GalaxyS22用户来说现在有一个好消息,基于OneUI5 0的Android13测试版固件可能很快就会开放下载。这个...
Google正在为Maps服务添加一个标签,让人们识别他们的商户是LGBTQ+人士开设的,这与之前Yelp提供的功能...