全球最快超算天河二号面面观

服务器 服务器产品
天河二号超级计算机系统由170个机柜组成,包括125个计算机柜、8个服务机柜、13个通信机柜和24个存储机柜,占地面积720平方米,内存总容量1400万亿字节,存储总容量12400万亿字节,最大运行功耗17.8兆瓦。

6月17日,在第41届全球高性能计算机500强(TOP500)排行榜中,天河二号(Milky Way 2)荣登榜首,成为全球最快的超级计算机。天河二号系统有多快?使用了哪些先进技术?可以应用在哪些领域?

又快又强 数字看天河二号

作为国家863计划“十二五”高效能计算机重大项目的阶段性成果,天河二号双精度浮点运算峰值速度达到每秒5.49亿亿次,Linpack测试性能已达到每秒3.39亿亿次。比美国能源部橡树岭国家实验室的“泰坦”快74%。

天河二号超级计算机系统由170个机柜组成,包括125个计算机柜、8个服务机柜、13个通信机柜和24个存储机柜,占地面积720平方米,内存总容量1400万亿字节,存储总容量12400万亿字节,最大运行功耗17.8兆瓦。与2010年11月获得TOP500第一的天河一号相比,天河二号峰值计算速度和持续计算速度均提升10倍以上,计算密度提升了10倍以上,系统能效比是天河一号的3倍。

通俗点说,天河二号的系统存储总容量相当于600亿册每册10万字的图书。假设每人每秒钟进行一次运算,天河二号运算一小时,相当于13亿人同时用计算器算上1000年。

异构多态 技术看天河二号

“天河二号配备了48,000颗英特尔至强融核协处理器和32,000颗英特尔至强处理器,”国防科技大学计算机学院教授、博士生导师及天河高性能计算机系统副总设计师卢凯说,“我们也采用了由国家核高基重大专项支持、国防科技大学自主研制的新一代‘飞腾-1500’CPU。”

“天河二号不仅仅是为传统的科学计算构建,也会兼顾信息处理与数据分析等需求。”卢凯表示,“所以我们从体系结构、具体的技术方案设计方面都进行了定制化。”因此,在总结天河一号成功经验的基础上,自主创新了新型异构多态体系结构,实现了多类型计算资源、输入输出资源和服务资源的灵活配置。

天河二号采用了英特尔的微异构技术,使应用程序代码的开发和调优更为省时省力,能帮助用户将其代码顺畅地运行在不同硬件平台上,充分释放硬件平台的性能潜力。

存储作为整个架构的一部分,对于大数据的信息处理与支持以及科学计算都有很好的兼顾和适配。在新型的编程模型方面,把“Mapreduce”的工作面向于大数据、信息处理的工作也移到了天河二号上,这样的话,在强化科学工程计算的同时,可高效支持大数据处理、高吞吐率和高安全信息服务等多类应用,扩大了天河二号的应用领域。

在软件方面,很大的工作量是在系统管理方面。比如采用了多层次的容错设计,机器管理机器的自治故障管理技术等,使系统能够及时的发现、诊断和处理故障。

“中国创造”在天河二号上比比皆是。基于自主通信接口芯片和互连交换芯片设计实现了光电混合的自主定制高速互连系统,性能是当前国际上最先进的商用互连系统的2倍;采用综合化的能耗控制机制,能效比进入国际先进行列;设计实现了基于背板前后对插、水平盲插的高密度高精度组装结构。这一系列技术创新和突破,涉及体系结构、微异构计算阵列、高速互连网络、加速存储架构、并行编程模型与框架、系统容错设计与故障管理、综合化能耗控制技术以及高密度高精度结构工艺等方面。“TOP500仅仅只是一个榜单,更重要的是这个机器是用来给谁服务,如何用好这样大型的机器。”卢凯表示。

医行娱食 应用看天河二号

如今,高性能计算机已经与我们的生活密切相关。如大家熟悉的天气预报预测、电影渲染等等。

2010年天河一号在天津超算中心投入使用后,其600多位用户涉及石油勘探、地震数据处理、土木工程设计、航空航天、生物医药、天气预报与气候研究、海洋环境研究、新能源、新材料、宇宙科学研究、动漫与影视渲染等领域,涵盖了老百姓医、行、娱、食等方面。

从中国制造向中国创造改变之后,研发就变成了很重要的转变力量。卢凯举例说明,一家研究微波功率器件的厂商做微波管实验,做十次实验需要花费几千万资金,使用超级计算机后,只需要进行两次实验,大大节省了研发费用。

国防科技大学计算机学院研究员、天河高性能计算机系统副总设计师朱小谦表示,天河二号系统目前对外服务不到一个月,已经有20多位用户完成了第一轮试算,如中科院软件所、上海中科院、上海药物研究所等。此外还有很多重点用户提出试算申请。

据悉,天河二号将作为广州超算中心的业务主机,于今年底交付运行,主要用于科学计算、工程计算以及信息化的服务等多个领域,将服务于珠三角地区以及包括香港、澳门在内的周边区域。

软硬兼施 超级计算机的未来

超级计算机正逐渐成为各国争夺的一个战略制高点。超级计算机有五个超级,就是速度超级快、容量超级大、体积超级大、耗电超级多、造价超级贵。避免超级计算机成为烧钱机器,须进一步破解应用瓶颈。

卢凯表示,“国家需要进一步加大软件方面的投入。从国家的科技布局上就要软件、硬件都要重视,甚至也还要往软件方面倾斜。”天河二号是863专项重大项目,在这个项目里也包含了若干个高性能计算的应用,包括应用服务环境。这样大的一个平台,能产生科研成果,体现科技实力,面对经济、科技都有提升的应用软件系统,因为最后所有的东西都是靠应用软件系统显现。

此外,超级计算机的应用涉及到各行各业,需要很多具备深度学科背景的专业人才,才能将该领域的大型软件开发出来。“广州市政府在提出倡议,中山大学已建立超算学院,培养超算方面的人才。”卢凯告诉TechTarget记者。

除了航天、气候等“高端”领域,超级计算机如何在民用领域发挥更大效益也是我们需要思考的问题。

从天河一号的5000节点到天河二号的16000节点,再到2015年计划研制出十亿亿次超级计算机的50000或更多节点,这中间又要克服哪些技术难关呢?卢凯表示,简单归纳起来是能耗、可扩展性和系统可靠性三方面。“当然,还有一些新问题可能还未发现或考虑到”,他说,“我们现在一部分工作就是梳理天河二号遇到的技术瓶颈,为以后的超级计算机设计提供指导与依据。”

责任编辑:路途 来源: TechTarget中国
相关推荐

2013-11-12 17:26:40

2014-06-23 16:10:17

2014-05-19 16:15:26

天河二号超级计算机

2013-06-18 18:24:16

英特尔协处理器超级计算机

2020-04-08 09:57:53

漏洞安全漏洞漏洞管理

2013-03-25 13:52:39

SDN软件定义网络Hybird

2014-06-18 13:06:24

天河二号浪潮中国超算

2019-09-11 17:16:34

DockerGitHubWindows

2014-11-18 15:07:34

天河二号

2009-12-30 15:10:44

摩卡

2009-02-16 09:47:00

IPTV技术多媒体运营

2023-03-24 07:31:58

Oracle兼容性产品

2013-07-22 17:49:52

Ubuntu虚拟机

2011-05-30 17:31:26

自动化测试

2014-04-02 12:57:55

袁学锋HPC天河二号

2009-07-21 13:01:07

ASP.NET上传文件

2011-06-21 09:02:06

天河一号

2010-09-01 17:13:56

无线局域网WLAN

2010-12-24 10:56:22

2009-10-28 11:35:25

Linux服务器优化
点赞
收藏

51CTO技术栈公众号