中华网数码

数码
设为书签Ctrl+D将本页面保存为书签,全面了解最新资讯,方便快捷。
业 界/ 互联网/ 行 业/ 通 信/ 数 码/ 手 机/ 平 板/ 笔记本/ 相 机
当前位置: 数码 > IT硬件 >

CPU缓存与内存延迟测试对比:AMD RDNA2完胜NVIDIA安培

CPU缓存与内存延迟测试对比:AMD RDNA2完胜NVIDIA安培
2021-04-20 09:47:06 来源:快科技

CPU缓存与内存延迟测试,相信大家都有所耳闻,但是GPU同样的测试却几乎没人做过。

Chips And Cheese就做了一次特别的测试,对比考察了AMD、NVIDIA GPU架构的缓存、显存迟问题。

首先是AMD RDNA2、NVIDIA Ampere两家最新架构的比拼,代表是RX 6900 XT、RTX 3090,前者在几乎所有阶段都完胜。

RNDA2架构创新性地加入了Infinity Cache无限缓存,提升带宽的同时,延迟也可圈可点,二级缓存命中率上只增加了大约20ns的延迟,明显低于Ampere。

更惊人的是,RDNA2显存延迟和Ampere几乎一模一样,但是别忘了,Ampere只有两个层级的缓存,RDNA2却有四个。

Ampere的缓存架构更加传统,SM阵列私有一级缓存到二级缓存要增加超过100ns的延迟,RDNA2从零级缓存到二级缓存则只增加了约66ns。看起来,GA102核心面积过大,也直接增加了延迟。

这正好可以解释AMD RDNA2架构在低分辨率下性能、能效更优秀,因为二级缓存、三级缓存延迟很低,更适合执行较小的负载。Ampere则相反,高负载下优势明显,比如说4K分辨率。

说完了GPU之间的对比,那么GPU、CPU放在一起怎么样呢?这里以RX 6900 XT、Intel四代酷睿i7-4770为例来看看。

CPU缓存自然不是一个级别的,所以这里Y轴用了线性数据,可以看到全程大大低于RDNA2,搭配DDR3-1600 CL9内存延迟只有63ns,RX 6900 XT、GDDR6的组合则有226ns,另外末级缓存平均延迟分别是53.42ns、123.2ns。

再看看前几代的NVIDIA GPU,包括Maxwell架构的GTX 980 Ti、Pascal架构的GTX 1080、Turing架构的RTX 2060 Mobile。

Maxwell、Pascal其实差不多,前者整体略高一些,可能是受制于芯片面积较大、核心频率较低。

Turing则已经有了Ampere的样子,一级缓存延迟低得多,二级差不多,奇怪的是显存延迟在32MB之后偏高,原因未知。

AMD考察了TeraScale架构的HD 5850/6950、GCN架构的HD 7970,再加上RX 6900 XT,很明显在逐代降低,而且是各级缓存都在同时进步。(作者:上方文Q)

责任编辑:kj005

文章投诉热线:156 0057 2229  投诉邮箱:29132 36@qq.com
关键词:

个保法颁布一周年:个性化广告发展需平衡隐私保护与用户体验

2022-11-14 11:53:20个保法颁布一周年:个性化广告发展需平衡隐私保护与用户体验

2022年全球折叠手机总销量将首度超过千万部大关

2022-02-09 11:40:212022年全球折叠手机总销量将首度超过千万部大关

印度市场智能手机出货量出炉:vivo占比排名第三

2022-02-08 11:19:13印度市场智能手机出货量出炉:vivo占比排名第三

平板电脑进入新的竞争阶段 重新夺回市场主导权

2022-02-07 16:52:08平板电脑进入新的竞争阶段 重新夺回市场主导权

2021年四季度中国手机市场苹果占有率位居第一

2022-01-27 13:33:342021年四季度中国手机市场苹果占有率位居第一

预测2022年中国市场智能机销量达3.4亿部 同比增长8%

2022-01-26 14:57:26预测2022年中国市场智能机销量达3.4亿部 同比增长8%

相关新闻