融合AI和高性能计算的超级计算机,为天体物理学、气象科学等领域科学发展赋能

服务器 芯片
Perlmutter超级计算机将在一个项目中协助拼装迄今为止最大的宇宙三维地图。它将处理来自宇宙摄像机——暗能量光谱仪(DESI)的数据。暗能量光谱仪每次曝光可以捕获多达5000个星系。

   今天,在美国国家能源研究科学计算中心(NERSC),搭配六千个NVIDIA A100 GPU,提供了近4 百亿亿次混合精度性能的超级计算机,正式启动。这台超级计算机以Perlmutter命名,将为7000多名研究人员提供近4 百亿亿次的AI性能。

  以Perlmutter命名的超级计算机正式启动

  Saul Perlmutter是暗能量的主要发现者,他是来自于伯克利实验室的天体物理学家,并因此而获得诺贝尔奖。而暗能量光谱仪(DESI)的地图,将揭示暗能量这一宇宙加速膨胀背后的神秘物理学现象。

  在Perlmutter因这一发现而获得诺贝尔奖后, Thomas与他一起开展了后续的项目。而以Perlmutter命名,采用了全球最大的A100赋能系统,搭载6144块NVIDIA A100 Tensor Core GPU,也正式发布了。据了解,Perlmutter能够支持20多种应用,能够很好的推动天体物理学、气象科学等领域的科学发展。

  Perlmutter超级计算机将在一个项目中协助拼装迄今为止最大的宇宙三维地图。它将处理来自宇宙摄像机——暗能量光谱仪(DESI)的数据。暗能量光谱仪每次曝光可以捕获多达5000个星系。

  研究人员需要利用Perlmutter的GPU速度,及时捕捉每晚几十次曝光,从而确定次日晚间将DESI对准何处。在以前的系统中,研究人员需要几周乃至几个月的时间,才能完成一年数据的发布准备工作,而有了Perlmutter,他们在短短几天内就能完成任务。

  NERS数据架构师Rollin Thomas目前正在帮助研究人员为Perlmutter编写代码,他表示:“GPU让我们的数据准备工作速度提升了20倍,这太令人感到惊喜了。”

  在线上组织的剪彩仪式上,NERSC数据和分析服务组代理负责人Wahid Bhimji表示:美国能源部正在大力发展人工智能科学,将概念验证引入粒子物理学、材料科学和生物能源等领域的生产用例。”他表示,当前人们正在探索更大规模的神经网络模型,希望获得更加强大的资源,而Perlmutter基于A100 GPU、全闪存系统和数据流功能,能够适时满足人们对AI的这一需求。

  软硬件结合,加速推进高性能计算应用

  据了解,传统的超级计算机几乎无法在几纳秒内使用Quantum Espresso等程序来处理模拟多个原子所需的数学运算。然而,通过将它们的高精度模拟与机器学习相结合,科学家们可以在更长的时间内研究更多的原子。

  Perlmutter超级计算机采用了业界领先的A100,其Tensor Core既能加速用于模拟的双精度浮点数学运算,又能加速深度学习所需的混合精度计算。

  NERSC的应用性能专家Brandon Cook表示:“以前我们不可能针对电池接口这样的大型系统进行完整的原子模拟,但现在科学家们计划用Perlmutter来进行这一模拟。”目前,Brandon Cook正在帮助研究人员启动此类项目。

  在去年11月,入围戈登·贝尔奖决赛的BerkeleyGW项目赢得了NERSC的认可,这一项目使用了NVIDIA V100 GPU。在NERSC领导该项目并负责监督应用性能的Jack Deslippe认为,A100的强大性能有望将此类研究提升到一个新的水平。

  除了硬件之外, Perlmutter的另一个战略组成部分是软件。与此同时,他还指出该系统所使用的NVIDIA HPC SDK能够支持OpenMP和其他常用编程模型。

  另外,用于GPU上数据科学的开源代码RAPIDS,将加快NERSC内部日渐壮大的Python程序员团队的工作速度。目前它已在一个项目中证明了自身价值:相比之前的CPU,它使NERSC Cori超级计算机网络流量分析速度加快了近600倍。

  Thomas表示:“这使我们相信,对于如何通过数据加速科学研究,RAPIDS将发挥重要的作用。”

  另据了解,据了解, Perlmutter是在AI使用的16位和32位混合精度数学运算方面全球最快的系统。这一性能,还未包括今年晚些时候,将在劳伦斯伯克利国家实验室系统中开展的项目第二阶段。

责任编辑:张诚 来源: 51cto
相关推荐

2024-05-14 15:43:02

2016-11-18 13:29:06

华为&华算

2009-02-04 11:43:31

信息化 融合

2022-09-02 10:15:38

AI计算

2018-10-13 17:32:50

2013-10-21 09:56:36

2024-03-20 11:24:47

云服务器物联网数据科学

2024-06-05 15:02:59

生成式人工智能机器学习人工智能

2010-03-16 11:03:00

计算机鼻祖物理学著作

2011-11-18 09:26:09

IBM超级计算机蓝色基因

2009-07-15 17:52:12

浪潮倚天高性能

2013-06-21 09:32:52

Linux超级计算机

2011-10-12 10:21:07

HPC云计算高性能计算

2009-11-20 18:28:33

2012-05-04 10:21:52

亚马逊弹性计算云EC2高性能计算

2021-12-25 07:34:47

量子计算机分子模拟保护数据

2010-10-26 11:05:27

霍金

2024-04-22 13:37:00

模型训练

2011-11-11 17:12:21

曙光星云高性能计算机云计算

2021-04-15 10:54:51

NVIDIA
点赞
收藏

51CTO技术栈公众号