作为芬兰主要的学术超级计算中心,芬兰科学信息技术中心(CSC)从2012年年初开始就一直在增强数字运算能力和数据存储容量;近日它向克雷公司购置了未来的“Cascade”超级计算机,又往前迈出了一步。CSC归芬兰教育和文化部管理,它负责支持全国各地的众多学术、研究和企业超级计算系统。
CSC运行着芬兰最庞大的超级计算机:“Louhi”系统,该系统结合了克雷XT4和XT5节点,这些节点又结合使用四核皓龙处理器和“SeaStar”XT互连系统;作为SeaStar XT的后续产品,目前***的“Gemini”XE路由器用来把***XE6和XK6机器中的处理器(CPU)和图形处理器(GPU)结合起来。
这款机器在2007年春天投入使用,两年后升级到了采用目前配置的系统:有10864个处理器核心,可提供每秒76.5万亿次浮点运算的持续性能,理论峰值性能可达到每秒102万亿次浮点运算。
这么多年来,CSC混合使用不同的平台,包括来自克雷的向量机和标量机以及来自IBM的基于Power的集群。在过去这十年,芬兰的这个计算中心还构建了由基于惠普皓龙的刀片服务器和InfiniBand互连系统组成的集群。这种类型的功能***大的机器当数“Vouri”集群,包括3264个皓龙核心和2010年夏天安装的InfiniBand双倍数据速率(DDR)交换机;该集群在Linpack测试时提供了每秒22.8万亿次浮点运算的性能。
CSC在今年晚些时候搬到位于卡亚尼的旧纸张仓库的一个新模块化数据中心后,Louhi和Vouri机器将换成新系统。今年会先更换惠普系统,然后等克雷向市场推出采用新设计的Cascade后,接着就会换上这款新机器。
CSC与惠普签署了为期五年的合同,价值450万欧元,基于SL65000高度密集的模块化服务器设计。CSC选择了ProLiant SL230s第八代服务器节点,这种节点在一个节点中有两个英特尔至强E5-2600处理器,最多可将八个节点塞入到一个4U机箱。(奇怪的是,惠普还没有正式宣布这些机器。)
惠普集群将有576个计算节点,采用八核至强E5-2600s,总共有9216个核心,这些节点上共有40.5TB主内存。
这些机器将通过Mellanox Technologies公司提供的56Gb/sec十四倍数据速率(FDR)InfiniBand交换结构彼此连接起来,CSC预计其理论峰值处理能力会达到每秒190万亿次浮点运算左右——大致相当于目前Vouri机器的六倍。而这还没有借助使用GPU协处理器。顺便说一下,这只是新惠普系统扩建项目的***个阶段。
说到协处理器,CSC在卡尼亚的数据中心还将安装一套试验型的混合机器,由英特尔至强处理器、至强Phi协处理器以及英伟达的特斯拉GPU协处理器组成。Phi协处理器之前名为集成众核(MIC)架构或“Knights Corner”。
这款机器由俄罗斯超级计算机厂商T-Platforms公司制造,将归瑞士全国超级计算中心(CSCS)和阿姆斯特丹学术计算基金会共同所有,它基于该公司的“T-Rex”混合超级计算机。将分阶段安装,最初会基于***的V5000刀片服务器,这样就有地方在5U机箱中塞入十个双插座服务器x86节点;这台机器会在今年第三季度部署到CSC数据中心。
T-Platforms混合机器最终将包括256个T-Rex节点,结合使用特斯拉协处理器和至强Phi协处理器;目前,我们对于T-Rex设计知之甚少;但这家公司称,该机器在机架中会采用热水冷却技术,将基于特斯拉和至强Phi协处理器以及英特尔处理器,其峰值聚合性能将达到每秒400万亿次浮点运算。这台机器得到了欧洲先进计算合作伙伴计划(PRACE)组织的资助。
芬兰CSC正在卡尼亚施工建造的模块化数据中心
芬兰将斥资1000万欧元购买Cascade超级计算机,该超级计算机基于英特尔的至强处理器(不像***的XE6和XK6超级计算机采用AMD皓宠处理器)和“Aries”高速路由器互连系统。Gemini互连系统是Aries的低速版;由于不想等Aries到2013年才出来,美国核实验室就请克雷开发了低速的Gemini互连系统。
当然除了Aries现在归英特尔所有外,眼下外界对它所知甚少。CSC没有透露它向克雷购买的Cascade机器的具体硬件规格,但表明将由产品和服务组成;该系统的绝大部分部件将在2014年供应,会在2012年年底开始***期安装,到时美国国防高级研究计划局(DARPA)将获得从Cascade生产线下来的***台机器,该机构在过去几年承担了Cascade的研发费用。
CSC的Cascade机器估计会基于英特尔未来的“Ivy Bridge”至强E5处理器,甚至可能还会配备来自英特尔及/或英伟达的协处理器。
克雷方面表示,它会支持塞在图形卡上的至强Phi协处理器,这是并行运行的小型x86引擎,但是还没有证实会支持将来的“Kepler”和“Maxwell”特斯拉GPU协处理器——克雷当然会支持,因为它需要让采用高性能计算(HPC)系统的公司可以从XK6升级到新系统,XK6结合了皓龙和特斯拉M2090 GPU。
CSC并没有选择克雷制造这些超级计算机背后的存储系统。早在今年3月,芬兰超级计算机中心与系统生产商富士通签署了一份价值250万欧元的合同;除了日本国内市场外,富士通还角逐欧洲市场,还是重量级厂商。在这个案例中,CSC与富士通合作,实际上采用由有时是竞争对手有时是合作伙伴的日立数据系统公司生产的存储系统(存储容量未透露)。
CSC还与DataDirect Networks签署了一份价值250万欧元的合同,生产和支持SFA 10K集群存储阵列、数PB级磁带库以及数据迁移软件(在任务运行过程中,必要的话,负责将数据从磁盘迁移到磁带,并从磁带迁回到磁盘)。
我们联系了克雷,希望对方透露部署到CSC的Cascade机器一些更具体的配置方面的细节,但公司发言人表示没有更多的细节方便透露。
不过,假设两周前宣布部署到美国能源部伯克利实验室的售价4000万美元的机器其一半成本用于存储、一半用于计算,而且包括为每秒2千万亿次浮点运算的Cascade机器和每秒6千万亿次浮点运算的Sonexion存储系统提供的多年支持,那么完全计算型的CSC Cascade机器其峰值性能有望达到每秒1千万亿次浮点运算。
关于CSC在卡尼亚建造的数据中心的另一个值得关注的方面是,它与硅图公司(Silicon Graphics)签署合同不是看中对方的服务器,而是看中对方的ICE Cube Air集装箱式数据中心。ICE Cube Air提供了1.08或更小的电力使用效率(PUE),这远低于CSC希望卡尼亚数据中心达到的1.2 PUE。
正如你可能预料的那样,当初CSC之所以选中卡尼亚,是因为这个地方常年寒冷,但是这里的问题是,气温可能低至零下45摄氏度,这对计算机来说实在有点太冷了。硅图公司只好制造经过改动的ICE Cube Air集装箱模块,以便放置服务器和存储系统。 三周前,CSC与硅图公司就这些经过改动的集装箱模块签署了一份价值260万欧元的合同。
原文地址:http://www.theregister.co.uk/2012/07/09/csc_finland_cray_hp_supers/