研究表明,虽然数据中心的能耗成本高昂,但服务器效率也越来越高。
每个数据中心都拥有运行各种工作负载的大量服务器。无论是企业数据中心、托管数据中心还是云计算数据中心,都必须全天候运行以支持那些关键任务应用程序。因此,运营数据中心的首要任务是增强可靠性。
而一旦完成可靠性任务,其成本和效率便成为了首要问题。一些早期建设的数据中心为了确保可靠性,其电源和冷却设备过度设计,但运营者很快就发现,一半以上的能耗用于保持IT硬件的散热和冷却,而实际用于计算硬件的能耗还不到一半。
行业厂商多年来致力于提高冷却系统效率,使数据中心新一代设备的能源使用效率(PUE)等于或小于1.2,这意味着80%以上的电力都将用于服务器的运行。
服务器的效率和能耗
因此,现在是更详细地研究服务器的效率和能耗的时候了,因为这是数据中心能耗的主要部分。美国劳伦斯伯克利国家实验室受到美国能源部委托为此进行了研究,并在今年2月发布了一份调查报告,其中揭示了一些有趣的统计数据。
首先,该研究证实了一个经常引用的经验法则,即数据中心现在消耗的能源只占全球能源消耗的一小部分。根据美国能源部发布的调查报告,到2018年,这一数字已接近1%。
这个数字听起来易于管理,但它掩盖了数据中心能耗已经成为一种负担的事实。例如,爱尔兰正在面临数据中心建设的热潮,但其电网扩展能力有限,难以满足其电力需求。根据爱尔兰工程学院研究人员的预测,到2027年,爱尔兰电网中31%的电力将提供给数据中心。
其次,该报告表明,这一总体数字的增长速度没有某些人所担心的那样快。2018年,数据中心的工作负载和计算实例比2010年增长了6倍多,但用电量仅增长了6%。
数据中心性能和成本的改进
戴尔技术公司EMEA地区数据中心电源部门主管Jim Hearnden表示:“提高数据中心能效不仅是环保策略,而且是管理运营成本的一种关键方法,这使其成为业界应该优先考虑的领域。大多数IT经理都热衷于提高与数据中心相关的能源效率,尤其是这样做也有助于提高性能和降低成本。”
显然,数据中心已经看到了巨大的效率提升——正如人们预期PUE值下降那样,其中大部分能耗来自数据中心冷却设备。而从2010年到2018年,数据中心的服务器能耗增长了25%。
研究表明这是一个实质性的增长,尽管其增长幅度比工作负载增长六倍要小得多,但也表明服务器的效率也越来越高,能够以更少的能耗处理更多的工作负载。
其中大部分归功于功能更强大的处理器。英特尔公司前首席执行官Gordon Moore预测,IT技术目前仍处在摩尔定律时代,芯片上的晶体管数量每两年翻一番。而芯片上的晶体管越多,就意味着计算能力就越强,因为更多的计算可以在芯片内完成,无需传输到邻近的芯片。
根据英特尔公司David House的一项观察,摩尔定律意味着处理器的计算能力应该每18个月翻一番,而不会增加能耗。与处理器一样,构成数据中心服务器的所有组件中都存在可以消除的能耗。
据主板供应商超微(Supermicro)公司技术营销高级总监Doug Herz介绍,该公司生产的主板被许多大型数据中心的建设者所使用,而且该公司一直在致力于提高服务器的效率。
他表示:“美国的数据中心能耗增长已经开始趋于平稳。由于采用了多种节能技术,因此增长速度并没有那么快。尽管服务器运行更多的工作负载,但使用的电能却更少。我们已经发现了问题所在,就是数据中心运营商并未将其重点放在闲置服务器及其成本方面,而采用新的管理软件有助于降低能耗。”
闲置功率
研究表明,一台使用5年的服务器空闲时的能耗为175W,这并不比其满载使用的能耗少多少。而近年来闲置的服务器越来越多,但Herz估计,运行空闲服务器的数据中心可能会浪费三分之一甚至一半的能耗。
管理软件可以平衡工作负载,合理分配任务,从而减少服务器的空闲时间。Herz说:“这种软件不仅用于监控数据中心的服务器,还用于平衡数据中心工作负载,优化电力供应。如果拥有大量的工作负载,必须平均分配在特定数量的服务器上,也许有更有效的方法来实现这一点。此外,还需要整合和优化数据中心的服务器,以便以满负荷运行其中一些服务器。这样可以实现规模经济。”
数据中心的能耗可以在更高的层次上进行优化。例如,法国提供商OVH公司采用超微公司的主板,并通过专门调整的机架和水冷系统来定制其服务器,以进行更有效的冷却。
OVH公司首席工业官Francois Sterin表示,“这具有很好的商业意义,使我们的服务器非常节能,并更具成本效益。”
显而易见,能源效率如今已成为数据中心堆栈各层次的头等大事。效率更高的服务器处理器得到更有效的管理,并得到了更持续的使用,因此能够以更少的能耗处理更多的工作负载。
与此同时,服务器采用智能冷却技术,而液体冷却可以减少对冷却系统的能源需求,使IT硬盘可以在更高的温度下运行,因此浪费的电能更少。
但是摩尔定律终将结束,芯片密度也不可能无限增加,并且无法实现相同的性能提升。如果尽可能提高冷却效率,并且芯片效率开始趋于稳定,那么如何寻求下一个效率提升?一种可能性是优化在处理器上运行的软件程序:那么有多少计算资源是由于代码效率低下而浪费?
另一种可能性是电力的传输环节。远程输送电力的高压电缆将导致8%到15%的电力损失。为了减少损耗,最好采用本地化电源,例如数据中心附近的微电网。
如今,用户对数据中心仍有更多大的需求,并且具有很多独创性。而提高数据中心效率的下一个阶段可能会更加有趣。