英伟达更新超算平台加入三项关键技术 AI优势前所未有

2021-06-30 10:08:45 来源：雷锋网

小大

本周，一年一度的高性能计算大会ISC如期而至，世界TOP 500超级计算机排名也随之更新公布，对比去年的榜单，今年TOP 10的榜单中，来自美国新能源部劳伦斯伯克利国家实验室的Perlmutter系统新晋入围。

在TOP500的榜单中，中国超级计算机的数量虽然下降至186台，但对比位居第二的美国的123台，依然遥遥领先。

一个值得注意的事实是，此次榜单中有342套系统采用了英伟达技术提供加速，对比去年的333套提升2%，榜单上使用InfiniBand的系统数量也比去年增加了20%。另外，名单上更新的两个新系统“超级云”，能够同时满足AI、高性能计算(HPC)和云端需求。

这意味着，高性能计算正在同AI加速融合，而在这一融合趋势下，英伟达在超算领域的优势前所未有。

不止是TOP10中的8台，新晋系统也选英伟达

雷锋网(公众号：雷锋网)此前在《全球TOP10超级计算机8台都选英伟达的三大原因》一文中分析过，由于高速数据互连技术的普及，以及英伟达GPU系统能够提高将超算的能效提升2.8倍，全球TOP10超级计算机中的8台都采用了英伟达GPU或InfiniBand网络技术。

在最新公布的榜单中，不少新晋系统也都选择英伟达提供支持，其中包括云端的两个新系统。

Microsoft Azure是其中之一，在TOP 500榜单上连续占据第26位到第29位，利用集群将公有云服务提升到新的水平。作为新兴的共享超级计算机，地球上的任何用户都可以按需使用。

在Azure系统的背后，有8个NVIDIA A100 Tensor Core GPU为其各个虚拟实例提供动力支持，每个芯片都有自己的HDR 200G InfiniBand 通信接口，可以与Azure云中的数千个GPU建立高速连接。

剑桥大学的新系统Wilkes-3是另一个超级云系统，也是世界上第一台云原生超级计算机。该系统使用了320个连接在HDR 200G Infiniband 网络上的 A100 GPU，且有经过优化的NVIDIA BlueField DPU提供安全、虚拟化的数据处理，保证虚拟资源的隐私性和安全性。

此外，本次进入TOP10的新系统Perlmutter，以 64.59 Linpack petaflops 在 TOP500 中排名第 5，也是由来自英伟达6144个A100GPU提供动力支持。

国家能源研究科学计算中心 (NERSC) 数据和分析服务组代理负责人 Wahid Bhimji 表示：“AI是美国能源部的一个增长领域，其可行性已被验证，正计划投入生产。”

英伟达更新超算平台，加入三项关键技术

为了持续满足高性能计算对AI的需求，英伟达也在本次ISC大会上发布全新的HGX A100系统，且已经在英国爱丁堡大学托管的DiRAC超级计算机中落地。

英伟达HGX A100加入了三项关键技术：NVIDIA A100 80GB PCIe GPU、NVIDIA NDR 400G InfiniBand 网络和 NVIDIA Magnum IO GPUDirect Storage 软件。

其中，A100 80GB PCle GPU采用NVIDIA Ampere架构，与A100 40GB相比其内存带宽带到2TB/S，提升25% 。更高的内存容量和内存带宽，能够将更多的数据和更大的神经网络保存在内存中，从而最大限度地减少节点通信和能耗，研究人员也能获得更高的吞吐率和更快的结果。

在网络方面，英伟达并购Mellanox后，释放 InfiniBand高效网络潜能。InfiniBand 作为全球唯一具有完全负载转移功能的网络内计算互连系统，英伟达为此配备了NVIDIA Quantum-2固定配置交换机和模块化交换机。

NVIDIA Quantum-2 模块化交换机最高可提供 2048 个 NDR 400Gb/s InfiniBand 端口(或 4096个 NDR200 端口)的可扩展端口配置，双向总吞吐量达到每秒 1.64 PB，是上一代 HDR InfiniBand 模块化交换机系列的5倍。

NVIDIA Quantum-2 交换机具有向前和向后兼容的特性，可以轻松迁移和扩展现有的系统和软件。

在软件方面，Magnum IO GPUDirect Storage软件提供了GPU内存和存储之间的直接内存访问，能够实现复杂工作负载处理性能。英伟达称，应用程序通过直接路径从低 I/O 延迟中受益并能够使用网络适配器的全部带宽，同时减少 CPU 的利用负载并管理数据消耗增加所产生的影响。

目前，英伟达最新HGX高性能计算平台已落地英国爱丁堡大学，为其托管的新型DiRAC超级计算机Tursa提供动力支持。

爱丁堡大学的 Peter Boyle 教授对HGX所提供的支持表示肯定：“Tursa 旨在应对独特的研究挑战，为科学建模和仿真解锁新的可能性。NVIDIA 加速计算平台提供超大规模服务，通过精确平衡网络带宽和FLOPS 来以实现这项研究所需的出色性能，进而助力新发现。”

几十年前，学术研究中心尝试模拟原理的相互作用，吸引了航空航天、医疗健康等多个行业的注意，但其所需要的巨量计算阻碍了发展研究，直到加速计算和深度学习的出现，才使得高性能计算落地得以推进。

“得益于各种进步，我们正处于高新能计算革命的开端。”黄仁勋如此评价当下高性能计算的发展。(作者：吴优)

关键词：英伟达超算平台三项关键技术 AI优势

责任编辑：kj005

文章投诉热线:156 0057 2229 投诉邮箱:29132 36@qq.com

关键词：

2021三季度企业级SSD市场统计：三星出货份额过半

我国仍有1.4亿老年人使用功能机数字鸿沟问题凸显

8GB+256GB版本！OPPO Find N预售抢购一空

培养一名航天员到底有多难？

中华网数码

英伟达更新超算平台加入三项关键技术 AI优势前所未有

个保法颁布一周年：个性化广告发展需平衡隐私保护与用户体验

2022年全球折叠手机总销量将首度超过千万部大关

印度市场智能手机出货量出炉：vivo占比排名第三

平板电脑进入新的竞争阶段重新夺回市场主导权

2021年四季度中国手机市场苹果占有率位居第一

预测2022年中国市场智能机销量达3.4亿部同比增长8%

相关新闻

环球即时看！格力电器专利数量破10万！董明珠曾称天天被偷技术

每日视讯：10秒满电！三星三防新机曝光

世界即时：御供俊元先生出任索尼中国董事长，全新领导团队将进一步强化中国市场战略地位

世界快讯:成交金额达1.35亿！太平洋电脑网 618“头号买家”活动专场收官

当前要闻：微软召回Surface Pro至Surface Pro 3设备的交流电源线

全球速看：面向Galaxy S22的Android 13测试版计划即将开启

世界百事通！从公司120年历史汲取的设计元素：凯迪拉克发布Celestiq内饰预告

焦点快看：Google将让LGBTQ+人士开设的商户实体可以在地图上被特别标注

焦点观察：Google为更好地获取知识信息而向维基媒体基金会付费

观热点：德国反对欧盟2035年禁售新燃油车计划欧洲电气化转型受阻

数码推荐

数码图片

聚焦国货、引领潮流，源机购带你智享科技生活

生活甚好，居心地，东芝冰箱诠释年轻人空间尺度生活哲学

全新ICON“热潮APP”来袭打响《中国热潮音K歌大赛》百万豪礼疯狂洒

手持周杰伦同款手办蓝牙音响K歌麦克风，与好友享受K歌乐趣!

新闻排行

从“小树苗”到“大森林” 成都...

探索新赛道哪个领域能成为家电...

2021年全球TV出货下降6.2% 面板...

巨头争相布局全屋智能市场向AI...

Mini LED市场不及预期产业陷...

海南省市场监管局抽查10批次快热...

智能化开辟产品创新边界智能坐...

中国制造主导高端冰箱进入新一...

苹果或正开发Apple Music新功能...

欧洲智能手机2021年“现状”：三...

英伟达更新超算平台加入三项关键技术 AI优势前所未有

相关新闻

数码推荐

数码图片

聚焦国货、引领潮流，源机购带你智享科技生活

生活甚好，居心地，东芝冰箱诠释年轻人空间尺度生活哲学

全新ICON“热潮APP”来袭 打响《中国热潮音K歌大赛》 百万豪礼疯狂洒

手持周杰伦同款手办蓝牙音响K歌麦克风，与好友享受K歌乐趣!

新闻排行

全新ICON“热潮APP”来袭打响《中国热潮音K歌大赛》百万豪礼疯狂洒