Power过时了,现在流行的是至强。
蓝色巨人的服务器主管们现在也许可以喘口气了,因为这家公司在美国国家海洋和大气管理局(NOAA)的一笔超大超级计算机合同的竞标中成功中标,这个部门是隶属美国商务部的气候模拟部门。因而,IBM就有望在为NOAA制造和支持超级计算机、直到2021年的过程中,获得5.02亿美元的回报,前提是所有合同条款展延和激活的话。
NOAA平时处理许多任务,包括为美国国家气象局从事天气模拟工作,还要通过其国家环境预测中心,从事更长期的气候模拟,这些模拟工作可能会影响美国经济。因而,该部门隶属美国商务部。
NOAA自从早在2010年11月开始发布采购需求(RFP)草案以来,就一直在选购供应商,以便为美国国家气象局和国家环境预测中心升级其计算机系统。招标过程在去年经过了多次修改。IBM在声明中表示,招标过程是公平竞争的,但是NOAA和IBM都没有透露谁参与了这次竞标。
2002年,IBM赢得了一份合同,为NOAA的国家环境预测中心建在马里兰州盖瑟斯堡的主数据中心和建在西弗雷尼亚州费尔蒙特的备用数据中心安装镜像计算机。那些机器是AIX集群,基于IBM采用水冷技术、基于Power6的Power 575服务器,上一次升级是在2008年年底,2009年8月投入运行使用。
在Linpack Fortran基准测试中,每个集群的峰值性能其评分只有每秒73.1万亿次浮点运算;因而这台超级计算机在2008年11月的全球前500强超级计算机榜单上仅排名第37位,但并不意味着在最近的这次榜单上排名靠前;高端机器的性能达到了每秒数十千万亿次浮点运算。这对超级计算机如今在2011年11月榜单上排名第224位和第223位。
NOAA目前使用的Stratus超级计算机
自这些Power 575机器安装以来,NOAA就一直认为,考虑到美国的气象变化越来越极端化,自己需要每秒千万亿次浮点运算级别的超级计算机,作出更准确的预测;这种想法完全正确。而且,它还需要更迅速地预测,因为正如近日出现在俄亥俄谷的龙卷风表明的那样,有时,气象预测的速度和准确性事关生死。
直到上世纪90年代,国家环境预测中心都一直在使用克雷公司(Cray)的超级计算机,使用各种各样的克雷Y-MP系统。IBM在2002年获得国家环境预测中心的超级计算机合同后,气象预测工作在一系列基于Power的服务器上运行,最初用的是由pSeries 690机器组成的一对镜像集群,这种机器使用704个IBM的双核1.3GHz Power4处理器。这些机器的峰值性能是每秒3.6万亿次浮点运算,在当年的榜单上排名第25位和第26位。
目前安装在马里兰州和西弗吉尼亚诈的每个集群都有156个Power 575节点,它们使用双倍数据速率(DDR)InfiniBand网络连接起来。Power6处理器的主频为4.7GHz,总共提供4992个核心、18.7TB主内存、170TB磁盘容量和13PM的磁带归档容量。
#p# 如果你想知道超级计算机的名称,马里兰州的主机器名为“Stratus”(层云),弗吉尼亚州的备用机器名为“Cirrus”(卷云)。它们的处理速度比被换掉的机器快四倍,但那是很多年前的事了;很显然,这些机器的确早就过时了。
下面这两张图由NOAA负责国家气象局和国家环境预测中心工作运营的环境模拟代理主管William Lapenta提供,显示了这些机器每天处理的工作负载,你就不难看出个究竟。下图是2011年9月主集群上普通一天的混合模拟工作负载,包括生产和开发任务。
NOAA国家环境预测中心2011年9月在Stratus超级计算机上的工作负载
下图是Lapenta预测2012年5月的总工作负载:
NOAA国家环境预测中心预测在Stratus上的工作负载:
正如你所见,NOAA的系统上用来运行模型、同时处理新任务的预留资源快用完了。因而它早在2011年10月就渴望完成招标工作。
新的气象和气候运行超级计算机系统(WCOSS)将是一对镜像系统,就跟以前一样。合同要求新建数据中心,以便放得下这些机器;还要求某家供应商(或参与招标的多家供应商)提供设施服务、对系统进行更新以及项目管理。
合同要求五年的基本期,加三年的选择期和两年的转型期,合同期限总共长达十年,这十年间的总合同金额不超过5.02亿美元。
去年开始招标时,没有具体明确WCOSS系统的硬件规格;但是NOAA表示,自己想要这样的机器:可以在Unix上或在Linux上运行,每个核心至少2GB主内存。考虑到数据不断、实时地进入到NOAA,NOAA又要不断、实时地为全美的气象预测人员进行模拟、发布报告,合同还要求99%的正常运行时间。
就WCOSS系统的外观而言,IBM并没有透露关于这些系统的大量信息;实际上,IBM的美国联邦部门负责宣布这方面的信息。也许是由于IBM不想谈论又一个Power Systems集群用户改用x86机器。
早在2011年1月,为欧洲地区提供超级计算服务的欧洲高级计算合作伙伴组织(PRACE)表示,它在建造与IBM制造的每秒1千万亿次浮点运算的“Jugene”BlueGene/P大规模并行机器配套的系统,并且使用IBM的PowerPC芯片,安装在德国于利希研究中心(FZJ)。但是性能达到每秒3千万亿次浮点运算的“SuperMUC”系统将安装在莱布尼茨超级计算中心(LRZ),将使用iDataPlex节点和近日刚宣布的英特尔新至强E5-2600处理器制造而成。
iDataPlex机器是介于刀片服务器与机架服务器之间的混合体,已被全球各地的许多超级计算机所选用。SuperMUC定于今年年中搭建并运行起来。
同样,从事更广泛气象模拟工作的美国国家大气研究中心(NCAR)以前是克雷超级计算机系统的一大用户,它在十年前改用了 IBM Power系统。它有一套名为“Bluefire”(蓝火)的系统,该系统与NOAA的Stratus系统底非常相似。NCAR正在制造一台每秒1.6千万亿次浮点运算的超级计算机,名为“Yellowstone”(黄石),它同样基于iDataPlex节点而建,同样采用英特尔的至强E5处理器。这个“黄石”系统将拥有4662个节点、74592个核心,造价在2500万美元到3500万美元之间,具体取决于实际配置。
可能更为重要的是,IBM基于Power7的“Blue Waters”(蓝水)系统是一个性能达到每秒数千万亿次浮点运算的系统,定于安装在伊利诺斯大学的国家超级计算应用中心,但在去年8月被IBM叫停。Blue Waters机器现在将由克雷公司制造,采用混合的AMD皓龙6200处理器和英伟达Tesla图形处理器(GPU),造价1.88亿美元。
虽然IBM没有透露关于NOAA WCOSS机器的过多信息,但是它的确表示,该机器将基于IBM***的iDataPlex x86服务器、磁盘存储系统和通用并行文件系统(GPFS)。该系统将采用“热备用技术”来配置,以满足正常运行时间方面的要求,但是IBM的声明没有表明哪些方面采用热备用技术。
据***消息,IBM正在尽量为我们提供关于WCOSS系统的更多详细信息。该机器基于新的iDataPlex dx360 M4服务器,而该服务器采用至强E5-2600处理器。它有448个节点,使用56Gb/sec十四倍数据速率(FDR) InfiniBand网络来连接诸节点,以便制造一台性能达到每秒149千万亿次浮点运算的机器。节点运行红帽企业版Linux。
原文链接: http://www.theregister.co.uk/2012/03/08/ibm_noaa_ncep_weather_super/