|
|
|
|
移动端

汇全球HPC数据 读懂中国超算十年逆袭之路

超算代表了最强计算力,反映了一个国家的科技实力,因此各国长期对超算的研究投入力度都很大。汇集了2007年到2017年十年间,全球最权威HPC数据后,清晰的看到了中国超算的逆袭之路,也看到了这十年来,超算软件、硬件配置的转变与升级。

作者:鲁畅来源:中关村在线|2017-11-22 09:14

技术沙龙 | 6月30日与多位专家探讨技术高速发展下如何应对运维新挑战!


超算代表了最强计算力,反映了一个国家的科技实力,因此各国长期对超算的研究投入力度都很大。汇集了2007年到2017年十年间,全球最权威HPC数据后,清晰的看到了中国超算的逆袭之路,也看到了这十年来,超算软件、硬件配置的转变与升级。

科普TIME:HPC是High performance computing首字母缩写,意为高性能计算。HPC一般采用专用操作系统、网络和计算架构,HPC能力一定程度上代表了一各国家的计算实力。(注:本文提到的TOP500榜单均属于ISC与SC大会HPC TOP500榜单)

NO.1:中国超算的逆袭路

中国在超算领域蓄力已久,但真正获得爆发性增长还在近两年。特别是在最新一期(2017年11月)的SC大会TOP500榜单中,中国上榜系统数量首次超过美国,已202套系统位列世界第一,这也是中国首次成为TOP500榜单中占比最高(40.4%)的国家。

回顾过去十年中国超算的发展史,从2007年11月的10台系统起步,彼时美国上榜系统数为280套系统,一家占据大半江山。到后来我国经历了“玻璃房子事件”后,国家835计划中也提到了对高性能计算项目的关注,中国超算上榜数量一致处在平稳上升阶段。

2017年11月SC TOP500中国系统占有数完胜美国

进入近五年,中国天河一号、天河二号的出现逐渐让中国在国际超算舞台上有了位置,中国上榜系统总数逐渐超过日本和欧洲部分国家。直到两年前,中国超算数量首次破百,开始在数量上超过美国。

从中国超算供应商角度来看:中国超算之所以能够在十年内实现逆袭,除了天河一号、 天河二号这样由国防科技大学类似的研究所也研究机构提供的异构超级计算机之外,更重要的是以联想、曙光为代表中国企业在超算领域的突破。

四家企业撑起中国“超算梦”

以2015年11月SC榜当中中国上榜数量首次过百为例,在109个系统中,曙光贡献最大,49套系统,其次是联想。对比2015年上半年的亮相1套,曙光5套,当年11月中国排名猛增企业力量的确功不可没。(注:本次统计上榜数量均为企业单独提供系统,中外企业联合研发未纳入其中。)

除了联想和曙光这两家作为排头兵为中国超算在国际舞台上发声,近两年同样实现快速崛起的中国企业还有浪潮和华为。

联想、曙光、浪潮和华为四家企业,对中国超算在国际舞台上的体量大小起到了决定性作用;而中国超算的最强音则是由国防科技大学和中国国家并行计算工程技术研究中心这样的学术性平台发出的。

申威:少而精的自研处理器

当中国神威太湖之光第五次夺得全球超算排行第一名,当第二名有之前的七连冠,同样来自中国的天河二号占据时,中国超算在国际舞台上已经成为声量与音高同样出众的国家。

然而,无论是2010年在TOP1上一闪而过(以微弱优势获得一次第一名)的天河一号,还是后来以33862.7TFlops的浮点运算数连续七次夺得世界冠军的天河二号,均采用了英特尔至强系列处理器。

近五年超算TOP1由中国霸占

事实上,从TOP500的处理器选择上来看, 英特尔至强确实成为众家的首选,从2012年11月到2017年11月,至强处理器成长了30.2%。相较而言,采用AMD皓龙处理器和IBM的POWER处理器的超算数量急剧减少。

尽管天河二号采用至强处理器取得了不错的成绩,但是超过天河二号性能的神威太湖之光却采用了中国自研的申威处理器。其背后的原因不论是客观地美国禁止向中国出口高性能处理器,还是中国自身对自研处理器的需求,结果总是让人欣喜的。

至强成为超算主流

神威太湖之光以93014.6TFlops的浮点运算数第五次夺得世界冠军。神威太湖之光采用国产处理器申威26010众核处理器(有74%的效率),拥有260个处理核心和4个内存控制器;支持264位的矢量指令集,内置32KiB一级指令缓存、32KiB一级数据缓存、256KiB二级缓存,主频达到1.45GHz;双精浮点峰值为3.06TFlops。

申威26010众核处理器内包括四个核心组,每组有65个内核,由8×8 Mesh架构计算集群(CPE)、一个管理单元(MPE)、一个内存控制器(MC)组成。P.S:在英特尔至强今年新发布的可扩展处理其中,也改用了这种Mesh架构。

科普TIME:Mesh架构是目前业界最新的处理器架构,与传统的Ring架构不同,Mesh架构采用网状形式互连,因此改善了CPU核心和高速缓存间存取数据的路径,降低了延迟。

垄断:Linux成为超算唯一系统

Unix、Windows、BSD Based等操作系统在2017年11月的榜单中首次尽数消失,最新的TOP500中所有系统都采用开源的Linux系统。而这距离1998年Linux系统首次出现在TOP500榜单中仅有不到20年。

事实上, 在1993年6月份发布的首份Top 500超算榜单中,Unix还是绝对的霸主,彼时的Linux才诞生两年,连吉祥物(Tux企鹅)还没有选好。

Linux在超算领域完胜

Linux在超算领域的主动地位是从2003年开始的,直到今年6月的榜单中还有两款选择Unix系统的超算上榜。可能有人好奇,为什么Linux能够获得超算的青睐,并最终垄断超算TOP500榜单呢?难道仅仅是因为Linux属于开源系统,便宜?

当然不是,想来我国当年打造天河一号一期就耗资6亿元人民币,是不太可能因为价格而左右对操作系统的选择的。

但是,由于超算并非大规模商用产品,也不可能由企业会为超算单独打造一款操作系统,就意味着超算只有两种选择:采用现有商业化操作系统或对现有系统进行改进。由于超算一般都有特殊的应用需求,需要做特殊优化,所以对开源系统进行改进是最好的选择。

Linux系统拥有开放的内核,工程设计人员可以根据自身需求对系统进行改进,同时,Linux系统对于大部分软件都有很好的兼容性,还拥有庞大的Linux技术社区作支撑,因此Linux走向垄断就成为了必然。

当然,考虑到超算的规模,Linux发行版本对于任何数量节点的授权费都一样,也确实让超算研发单位在扩展过程中更安心。

定位:行业分布变化不大

通过对近十年二十次超算排名各行业分布情况来看,变化并不大。始终以互联网与工商类应用场景最强,其次是研究机构与学术类场景,这两者此起彼伏均徘徊在100个系统数。

超算需求场景已经定型

这样的数据表明,在十年前超算的目标应用场景就已经成熟,以商业应用场景为主,学术性、研究性为辅,而中国在近两三年中迅速崛起,依然需要寻找合适的应用场景与庞大计算力的输出口。

问题:硬件发展太快

可能有人问,发展太快还不好吗?这就像是软件、硬件应该两条腿走路,而其中一条腿十分健壮,另一条腿则十分虚弱,这样的情况下不但不能正常行走,甚至是处于残疾状态,硬件计算力突飞猛进,而软件应用却蹒跚不前,必然无法带来健康的产业生态。

诚然,从天河一号算起,中国超算已经在近五年中13次获得排行榜TOP1。但是,天河一号在建成之后却传出门可罗雀的消息。当一个科技产品变成了供人展览参观的摆件,实在是一种悲哀。

除了天河一号之外,神威太湖之光由于采用了国产处理器,也传出了对部分基础应用不兼容的新闻。

2017年11月SC TOP10名称、国别、所属单位与TFplos值

反观国外的超算状况,除了第三名来自瑞士的Piz Daint来自瑞士国家超算中心之外,接下来的Gyoukou(日本)、Titan(美国)、Sequoia(美国)……多来自能源、地球科学、核能研究室,这些超算的出现有着明确的工作内容,研究单位对其有着强烈的需求。

正如开头笔者所言,超算确实代表了一个国家的技术实力,但是不是全部,只是代表了一部分。从这十年来的超算数据中,我们看到了中国超算的强军路,却也看到了中国IT发展的一个缩影。

附录:全球两大超算排行榜

TOP500榜单是全球超算能力评定的权威,这是由ISC与SC分别在每年的6月和11月公布的。

ISC国际超级计算机大会(International Supercomputing Conference )每年举行一次,是IEEE认可的全球性会议,展览的是高性能计算,网络和存储。

ISC:聚焦HPC、云、大数据和机器学习

2017年6月ISC正步入它的第32个年头,它为所有HPC研究人员、技术的领导者、科学家和IT决策者提供了一个一起研究HPC解决方案的平台。ISC每年会主要聚焦在不同的主题上进行深入探讨,一般覆盖高效节能的HPC中心、E级计算、未来的异构架构、替代处理器和云中HPC实战等方面。

SC全球超级计算大会(Supercomputing Conference),每年举行一次,会议由IEEE计算机学会(IEEE Computer Society)、美国计算机协会(Association for Computing Machinery,ACM)联合主办,举办地一般在美国,除了HPC TOP500榜单外,每年还会发布绿色HPC榜单。

高性能共轭梯度基准测试

2017年11月在美国丹佛举行,大会宣布增加High-Performance Conjugate Gradient(高性能共轭梯度基准测试),包括矩阵乘法,全局集合,向量刷新等计算方法,旨在为系统性能提供更均衡的评判标准。

科普TIME:高性能共轭梯度基准测试High-Performance Conjugate Gradient,简称HPCG。HPCG所使用的计算及数据访问模式与实际的应用程序之间的相关性更强,可以用来指导高性能系统的设计与实现,从而提升实际应用在高性能计算系统中的性能。(注:该部分资料来自田纳西大学Jack Dongarra与圣地亚国家实验室Michael A. Heroux)

ISC与SC大会可以说是高性能计算领域的两座神坛,拥有相当巩固的地位。但是,随着国内HPC产业的兴起,中国也开始举办类似的大会,公布国内的超算排行榜;同时,全球性的超算排行榜也在随着技术变化而不断更迭,提出新的标准。

【编辑推荐】

  1. 如何为微服务选择数据库
  2. 数据中心在追求PUE的同时更要关注隐性成本
  3. 什么是云计算数据中心?云计算数据中心和传统IDC有何区别?
  4. 人工智能将成为数据中心管理的覆性的技术
  5. 移动数据中心策略:在向SDDC转移中需要考虑什么?
【责任编辑:武晓燕 TEL:(010)68476606】


点赞 0
分享:
大家都在看
猜你喜欢
24H热文
一周话题
本月最赞

视频课程+更多

热门职位+更多

读 书 +更多

网管员必读-网络管理(第2版)

本书是对《网管员必读—网络管理》第1版的全面重写,因为书中所涉及的两个主要网络操作系统都已升级。本书介绍的是Windows Server 2003 R2...

订阅51CTO邮刊

点击这里查看样刊

订阅51CTO邮刊