为什么超级计算机如此重要?

译文
服务器 服务器产品
对于普通企业的IT部门来说,每年发布两次的Top500超级计算机排行榜(http://www.top500.org/lists/2011/11)尽管很吸引眼球,但是对于今天的运营来说没有多大意义。

对于普通企业的IT部门来说,每年发布两次的Top500超级计算机排行榜(http://www.top500.org/lists/2011/11)尽管很吸引眼球,但是对于今天的运营来说没有多大意义。宏伟的口号和目标对于大多数数据中心中的日常运行来说同样没有多大影响,比如2018年之前要达到Exaflop的性能。(快速介绍一下背景知识:FLOP是指每秒执行的浮点运算次数;Exaflop是1018即1000000000000000000 FLOP。)

尽管这样的新闻今天可能不会影响你,但是很重要,因为高端领域取得的进展会影响低中端领域。别忘了就在不久前,今天的智能手机其功能相当于一台超级计算机的功能。想一想Knight's Corner,11月初英特尔在华盛顿西雅图举行的2011年超级计算大会上展示了这款原型芯片。英特尔在这次计算机盛会上发布了这款硅芯片,起初早在6月就宣布了。虽然官方上市发售日期还没有确定,但是已经有了硅芯片产品,并进行了演示。单单一块22纳米芯片就能提供1012 FLOP的可持续双精度性能。这相当于每秒执行1万亿次运算。如果你想相对了解其规模和速度,这个信息图(http://mozy.com/infographics/when-will-we-run-out-of-space/)提供了很直观的感觉。

这不是英特尔***次提供1012 FLOP系统了。早在1997年,它就在桑迪亚国家实验室***展示了ASCI Red:9298个奔腾2至强处理器塞入到占用72个机柜的服务器中,服务器的耗电量高达800千瓦。想一下:今天你工作站(或者甚至智能手机)的功能与15年前的典型超级计算机一样强大。

时代确确实实发生了变化

处在另一头的是英伟达。英伟达联合创始人、总裁兼***执行官黄仁勋(Jen-Hsun Huang)在近日的主题演讲中介绍了,英伟达如何能够充分利用超级计算机的功能:将众多工作站和大众化服务器集群起来,以获得提供所需图形功能所需要的计算功能。“其在市场低端的搅局”加大了给主流市场带来的影响,有可能实际上将超级计算机变成工作站。

当然,大多数企业介于英特尔的高端系统和英伟达的大规模集群比萨盒系统(pizza box)之间。超级计算机对它们会有什么影响呢?

耗电量仍是首要问题

你可以买到市面上速度最快、吞吐量***的系统;你可以确保自己的服务器拥有高可用性,软件配置完全合适。但是如果你的电费超过了整个大城市的电费,那么这一切都是白搭。

随着性能越来越强大,超级计算机越来越觉得用电紧张,这在某种程度上决定了它们可以放置在什么地方。虽然这些局限性在高性能计算(HPC)环境中体现得尤为明显,但是对于核心业务取决于管理数据仓库中数据的任何公司来说,比如依赖大数据以及为大数据赋予生命的电力的那些公司,这些却是普遍性难题。

Facebook也许是这方面的***例子之一。当你想到超级计算机,这家公司其实并不立马浮现在脑海中;但是其核心业务围绕大数据:用户必须可以访问这些大数据,还要确保随时可用,以便用于挖掘分析。大概两年半前,该公司原先依赖的基于行业标准的服务器显然满足不了要求。Facebook的服务器和数据中心工程师Amir Michael开始负责一个项目,旨在对进入到Facebook更新颖数据中心的服务器进行定制。

这些服务器是用基于行业标准的部件做成的。从外观尺寸到造型设计,它们都遵循了更高的能源效率这个标准。Michael解释,从头开始搞自定义设计要比捣鼓现有的设计来得容易。Facebook设计的服务器有更大的散热器,因而显得比普通的1U服务器更高(由于这个原因,这些服务器还放在定制的底架和机架上)。它们还只包括必要部件。塑料边框及添加的其他花哨部分都去掉了,包括“面板”。这样一来,空气就能更轻松自如地进出。由于这些变化,风扇能够更高效地运转,因为需要输送的空气比较少。Michael解释,这将每台服务器的总能耗减少了多达10%至20%。主板也经过了调整,能源效率高达92%。

服务器层面的这些变化,加上数据中心层面的改动(比如依赖可再生能源或数据中心所在地的气候条件),有助于防止Facebook的能源成本急剧失控。

不是只有Facebook这一家公司在处理这些问题。谷歌、亚马逊及大数据对自身业务而言很关键的其他公司都在应对类似的挑战。这时,开放计算项目(Open Compute Project)应运而生,这是Facebook今年4月发起成立的开源硬件项目;到目前为止,其成员包括英特尔、华硕、戴尔、Mellanox、红帽和Cloudera。

Facebook的***举措:定制的存储设备就是通过这个开源项目做出来的。Michael称之为“具有一些独特属性的一款通用设备。”

谷歌和亚马逊尽管不是该项目的成员,但也在充分利用定制硬件。不过与Facebook不一样,它们选择了不公开各自硬件的规格。

随着大数据对于高性能计算和社交媒体来说变得更重要,适合这些公司计算要求的硬件会变得更加重要。眼下为时尚早,无法确定定制硬件会变得司空见惯,还是原始设备制造商(OEM)会适应出现了变化的要求。

说到电力管理方面的意识,原始设备制造商们并非一无所知。Glenn Keels是惠普行业标准服务器和软件部门超大规模计算(Hyperscale)事业部的营销主管;他表示,由于认识到电力和计算能力会在2016年之前遇到瓶颈,惠普开发出了一项低能耗的服务器技术,以削减能源、电力和场地。为了增加计算功能,同时控制能源成本,Project Moonshot在今年11月初应运而生。这项计划旨在帮助提供互联网服务、社交媒体和简单内容的公司。惠普正在通过惠普探路者项目(Pathfinder Program),竭力为Project Moonshot寻求合作伙伴。

首批产品的核心将采用Calxeda公司的EnergyCore ARM RISC服务器芯片处理器,将归为惠普企业级服务器、存储和网络这一产品系列。

***款产品: Redstone服务器开发平台定于2012年上半年发布,它将在一个机架中塞入2800多台凌动处理器服务器。据惠普声称,这些服务器的能耗将减少89%,占用场地将减少94%,而且价格也会低63%。Keels表示,他认为这款产品会会特别适合社交媒体领域。

Keels表示,等到惠普发现实验室(HP Discovery Lab)在2012年1月启动后,许多公司就有机会在Redstone服务器开发平台、其他能耗极低的平台以及传统服务器上试运行、测试和比较应用程序。

#p# 高性能计算重心偏离北美

超级计算大会向来是侧重技术和研究的业界盛会。只是近些年来,商业机构以这个盛会为平台,展示各自的产品。大会还着眼于全球,对于哪个国家在排行榜上占据席位最多抱着开放的心态。自1993年首届超级计算大会举办以来,大会的重点一向是揭晓全球500台运行速度最快的超级计算机。2011年11月,263台超级计算机(占53%)是在美国。尽管这比今年6月的255台略有增加,但是离2005年11月的305台还是相差甚大。

亚太区、尤其是中国在后来居上。近些年来,中国在排行榜上的席位增多是最值得注意的亮点。在最近这份排行榜上,中国有74台超级计算机上榜,占到总数的15%。考虑到在6月,中国只有61台超级计算机上榜,一年前更是只有41台,进步可谓明显。而早在2009年11月,中国只有区区21台超级计算机上榜。

没有哪个国家在这方面的发展速度比得上中国。整个东亚表现抢眼,与北美的54.4%相比,其总份额也占到了22%。

值得关注的是,前十大超级计算机的分布情况很相似。两套系统来自日本,两套系统来自中国,五套系统来自美国,一套系统来自法国。另外令人关注又发人发省的是这个事实:“自从我们早在1993年开始发布排行榜以来,前十大系统没有出现任何变动这还是头一回,”Top500排行榜的编辑Erich Strohmaier在Top500网站上指出。

前十大超级计算机的排名次序与2011年6月一样。不过在所有情况下,它们的速度都更快了,这证明了标准在继续越来越高。

虽然这份排行榜本身纯粹是学术层面的,不带厂商营销的色彩,却是个晴雨表,反映了技术创新来自哪里。中国的迅速崛起无疑令人瞩目,但更重要的是,中国宣布它在从头开始构建一台性能达到Petaflop(1015 FLOP)的超级计算机,使用的是完全国产的部件,包括其自主开发的SW1600芯片。

超级计算机代表了先进计算技术的***峰。投入到超级计算机的研发工作会慢慢影响到主流的公司企业,而且这种影响的速度一年比一年快。超级计算机还使得其他方面的创新成为了可能。如果美国要继续站在创新的前沿,类似的研发合作和资金就必须到位。

原文链接:http://www.serverwatch.com/server-trends/why-supercomputing-matters.html

责任编辑:张玉 来源: 51CTO
相关推荐

2012-12-16 15:26:49

超级计算机LinuxHPC

2020-11-05 10:50:09

物联网数据技术

2021-10-26 10:12:04

技术债务软件开发应用程序

2020-04-21 11:03:34

微服务数据工具

2022-11-21 18:02:04

前端测试

2023-04-10 15:41:35

2018-04-24 15:53:52

2021-09-30 10:19:29

物联网安全物联网IOT

2021-11-29 11:40:46

FPGA芯片数据中心

2020-05-19 10:49:10

网络安全恶意软件技术

2011-07-04 11:35:59

2022-08-22 13:17:19

智能建筑楼宇自控物联网

2023-10-08 14:36:59

2021-10-26 10:01:41

量子计算芯片超算

2021-09-07 13:25:31

物联网安全物联网IOT

2013-04-01 10:51:02

2011-11-17 13:28:35

云计算超级计算机

2011-12-28 13:30:36

云计算Amazon超级计算机

2021-04-16 17:37:28

数据智能照明物联网

2021-08-30 17:14:22

物联网IOT
点赞
收藏

51CTO技术栈公众号