在10月28日召开的2010年全国高性能计算学术年会上,中国高性能计算机排行榜Top100再度被刷新。国防科大研制的“天河一号”以2507万亿次的Linpack成绩再度取得了第一名,并有望冲击年底世界高性能计算排行榜第一名。那么抛却性能排行不谈,这些超级计算机都用在了哪些行业呢?
一、天河一号TOP100再夺魁,有望冲击TOP500冠军
以行业属性和应用领域来划分,top100榜单上的超级计算机中有30套系统面向的是科学计算(涵盖面较广,如高校科研教育、工业科研等),17套系统面向的是能源和地球物理方面的计算,工业计算16套(不包括游戏行业),游戏领域9套,政府部门应用9套,电信领域6套,气象与地理研究6套,生物研究4套等(太小规模的应用或不参与评选的领域未计入)。我们挑出了较有特色的几个领域做出如下解读,提升top100的趣味性。
在过去一年里,天河一号进行了大升级,目前的配置是14336颗英特尔六核至强X5670 2.93GHz CPU和7168颗Nvidia Tesla M2050 GPU和2048颗自主研发的八核飞腾FT-1000 CPU。处理内核数突破20万颗,是去年24576颗的8.25倍。其实,天河一号不仅仅是升级,而是几乎更新了整个结构,上一代采用的是英特尔四核CPU+ATI GPU,通过Infiniband互连,而新一代则是英特尔六核CPU+NVIDIA GPU+自主八核飞腾CPU,通过专有网络互连(51CTO推荐阅读:真实的谎言!天河一号排名中国第一超算名不副实)。
▲现场展出的新一代天河一号超级计算机系统
▲自主设计的FT-1000 CPU
天河一号的峰值计算性能达到了4.7Pflops,即每秒4.7千万亿次,是上一代的3.9倍,Linpack值达到2.507Pflops,达到上一代的4.4倍。与排名第二的曙光“星云”相比,天河一号的峰值性能是其1.57倍,Linpack性能是1.97倍。另外,通过采用双精度性能更高的GPU后,天河一号的系统效率,即Linpack值与理论峰值的比率,也由原来的47%提高了现在的53.3%。
而且,值得一提的是,天河一号的Linpack性能比目前TOP500第一名的Cray机器还要高,是后者的1.425倍。因此,天河一号还非常有希望在11月中旬将要公布的新一期TOP500中取得冠军地位,结果如何,让我们拭目以待。
#p#
二、10万核以上的超大规模计算系统出现,应用堪忧
在今年的TOP100排行榜上,出现了两台拥有10万个处理内核以上的超级计算机系统,这些内核包括普通的CPU核和GPU核。其中,天河一号的计算内核数更是超过了20万颗,达到202752颗。TOP10系统采用的处理器核数如下表所示:
排名
|
安装地点
|
厂商型号
|
处理器核数
|
1
|
国家超级计算天津中心
|
国防科大天河一号A
|
202752
|
2
|
曙光公司
|
曙光星云
|
120640
|
3
|
中国科学院过程工程研究所
|
Mole-8.5 Cluster
|
33120
|
4
|
上海超级计算中心
|
魔方/曙光5000A
|
30720
|
5
|
中国科学院超级计算中心
|
联想深腾7000
|
12160
|
6
|
成都超级计算中心(二期)
|
曙光星云
|
5720
|
7
|
中国科学院计算技术研究所
|
曙光生物专用机
|
4160
|
8
|
工程公司
|
IBM xSeries x3650M2 Cluster
|
8960
|
9
|
中国电信
|
HP Cluster Platform 3000 BL460c G6
|
7848
|
10
|
网络公司
|
IBM BladeCenter HS22 Cluster
|
7168
|
这种超大系统的出现对技术和应用两方面都提出了很多挑战,包括计算效率、功耗、管理、I/O、占地面积、应用软件等等,尤其是应用软件可能会成为很大的瓶颈。据上海超算统计,2009年其使用16核以下的作业占到了60%,17-160核的作业占39%,160核以上仅仅占到1%。这也意味着很多大机器被各类超算中心买去之后,实际上都会拆分成若干块分给不同单位或部门去使用,因此并没在起到大机器应有的作用。
▲
要解决这个问题,一方面,我们需要开发出可以使用到千核以上的应用,以充分发挥大机器应有的作用;另一方面,其实也可以考虑将“HPC与云计算”更好结合,让高性能计算资源池化和自动化,让更多中小企业来使用。
#p#
三、GPU加速流行,其中5套进了TOP10
GPU加速已经成为做大系统的“绝招”。在最新的榜单上,采用CPU+GPU混合架构的高性能计算机就达到了7套之多(如下表所示),而且都是2010年新安装的,其中有6套是英特尔CPU与NVIDIA GPU的搭配,另一套是英特尔CPU与AIT GPU的搭配。而且值得关注的是,在TOP10中,就有5套采用了CPU+GPU的结构。
英特尔与NVIDIA这对老冤家明争暗斗,没想到在用户这里却成了好搭档。从大多数系统所使用的GPU来看,基于Fermi架构的NVidia Tesla C2050受到了一致的青睐。这也似乎意味着NIVIDA在经过几年艰辛推广之后,终于迎来了春天。
不过值得注意的是,GPU系统也并非完美无缺,除了软件编程和移植比较难之外,计算系统效率低也是此次TOP100反映的一个现实。这7套GPU系统的计算效率都比较低,最低的只有18.3%,最高的也不过54%,而一般CPU集群的效率最高可突破90%,比如排名第20位的安装在南京大学的IBM BladeCenter HS22刀片集群的效率就达到92%。
#p#
四、厂商集中化趋势非常明显,曙光和IBM占三分之二
从最新一期的TOP100来看,厂商的集中化趋势非常明显,表现在:一是有一些厂商退出了排行榜,比如SGI、银河风云、蚬壳星盈等;二是份额越来越多的掌握在少数两三家厂商手中,仅曙光和IBM两家的份额之和就超过了62%,几乎在重演2007年的市场格局。
另外从发展趋势来看,笔者统计了2007年-2010年的数据,发现曙光和IBM都在不断扩大各自在HPC领域里的优势地位,尤其是IBM已经连续四年稳步增长,曙光今年的增长幅度也尤其高,相反,HP的份额却在不断减少,一增一减形成了非常鲜明的对比。
显然,厂商的过度集中化,对于整个产业的健康发展并非好事,因为一方面市场需要竞争,从而可为用户提供更高性价比的产品和服务,另一方面,产业也需要创新,特别是在云计算、物联网的时代,需要有众多的、有不同专业优势的大小厂商一起参与创新。
#p#
五、高性能计算在物联网的应用值得关注
石油勘探、科学计算、互联网、工业、电信、教育仍然是我国高性能计算的主力军。不过,随着许多新兴行业的发展,也对大型超级计算机产生了新的需求,比如生物信息、视频计算、动漫渲染、电子商务等。
今年尤其值得关注的是HPC在物联网领域里的应用——无锡物联网云计算中心的曙光5000排在第80位。物联网的发展会产生大量的数据需要计算处理,对超级计算机有着强烈的需求,虽然目前物理网还处于起步阶段,但相信随着物联网的发展,会有越来越多的HPC系统出现。
《2010年中国高性能计算机性能TOP100排行榜》请到这里下载。
【编辑推荐】