11月14日在美国举办的2011年全球超级计算大会SC11上,新一期Top500全球高性能计算系统榜单发布。本期榜单中来自中国的超算系统进一步增多到了74套,因而被美国《连线》杂志所称赞表示:这是一项了不起的成就,中国超级计算机系统无论是在总数还是累计峰值运算能力上,都超过了德、日、法等传统的超级计算机大国。
定睛观瞧本届Top500榜单的前10名不难发现与年中发布的榜单变化不大(Top500每年发布两次:分别是6月和11月)。其中最瞩目的要数来自日本的“京”,再次***,而其计算性能也突破了1亿亿次(10PFlops),这也是人类***跨越1亿亿次计算大关。
日本的“京”超级计算系统由日本政府出资,富士通公司承建。该系统在6月份的top500榜单中就以8.16PFlops的运算性能夺得***,而本次榜单中“京”继续扩建达到了10PFlops的超强性能。该系统采用富士通自己研发的SPARC64 VIIIfx八核心处理器组成(代号“Venus”),没有采用任何GPU做协处理加速。
第二名是部署在中国天津的“天河一号”——早在2010年top500排行榜中就以2.5PFlops的速度一举成为当时全世界最快的超算系统。该超算系统主要由14336颗至强X5670处理器(32nm工艺,六核12线程,2.93GHz主频)做通用计算,另外还采用了7168块Nvidia“Fermi”架构的Tesla M2050计算卡(主频1.15GHz,双精度浮点性能515Gflops、单精度浮点性能1.03Tflops)做浮点加速。而2048颗国产飞腾处理器(八核64线程,主频1GHz)则主要用于“天河一号”的网络通讯。
Cray为美国橡树岭国家实验室打造的Cray XT5系统“美洲豹”(Jaguar)排名第三,中国深圳超算中心的“星云”系统排名第四——该系统由曙光公司打造,也采用了至强+GPU的解决方案。NEC和HP在日本用ProLiant SL390s打造的超算系统排名第五。
AMD推土机倍受认可
后面的排名中,值得注意的是Cray的XE6架构超算系统(第六名),采用的是AMD皓龙6136处理器——也就是著名的“马尼库尔”,不过没有用12核心型号,而是用了8核型号。排行第12名的超算系统也由Cray打造,不过这套XE6系统却使用了***的皓龙6276处理器(即推土机架构),16核心2.3GHz的推土机处理器成就了德国斯图加特大学这套831万亿次的超算系统。榜单前50名中的第19、20、34名的超算系统也采用了推土机架构处理器。
还未发布——至强E5闪光
而Appro为美国利弗莫尔国家实验室打造的超算系统则采用了还未发布的英特尔至强E5处理器(Sandy-Bridge架构8核心2.6GHz),整个系统的计算性能达到了773万亿次。前50名中第27、28、45和48名的超算系统也采用了Sandy-Bridge架构的至强E5处理器。
榜单数据不同——“星云”性能变化情有可原
引起笔者注意的是在10月末发布的国内高性能计算排行榜Top100中,排名第二的“神威蓝光”Linpack成绩795万亿次,而国防科大的另一套“天河一号”运算性能771万亿次排名第三,曙光公司研制的“星云”以749万亿次成绩排名第四。
本届Top500中的排名却是“星云”排名世界第四,运算性能1271万亿次,“神威蓝光”和第二套“天河一号”排名在14和16名。对比之下发现,“神威蓝光”和第二套“天河一号”成绩与国内排行榜相比成绩没有变化。而曙光“星云系统”的成绩前后不符。
Top500沿用了去年的成绩,而曙光“星云”系统在这一年里精简了?不太可能。那么,到底是Top500的成绩标错了,还是国内Top100的成绩有了新变动,前后数据不一致的谜团背后究竟是什么原因呢?
日前曙光公司向ZDNet发来声明表示:从2011年年初开始,星云机器就从工厂开始陆续拆装运往深圳,到11月的时候系统还处于部署阶段,所以在TOP500中的数据继续沿用了去年的数据;而在机器运往深圳后,根据用户的使用情况,系统实际被分成了三部分,一部分侧重于高性能计算,一部分侧重于云计算,还有一部分用于网络资源管理,前两部系统较大,后一部分系统较小,在10月份***00的排名中前两部分进入了排名,后一部分由于系统较小未进入排名;三部分相加的值与TOP500一致。
如此解答了“星云”在两个Top榜单上性能数据不同的谜团。