进入暑期,数据中心的散热问题便成为业界关注的热点话题。近年来,随着生成式AI的爆火,对数据中心算力提出了更高的要求,GPU服务器的数量大幅增加带来的功耗和散热问题日益凸显。特别是在双碳政策下,如何解决能耗和散热问题成为摆在数据中心运营者面前的主要挑战。
去年中旬,由财政部、生态环境部和工信部共同编制的《绿色数据中心政府采购需求标准(试行)》(财库〔2023〕7号,以下简称《采购需求标准》)正式施行。该标准规定,自2023年6月起数据中心PUE值不高于1.4,2025年起数据中心PUE值不高于1.3。不难发现,数据中心从传统的风冷向液冷转型,已经成为大势所趋。根据IDC的预测,2022-2027年,中国液冷服务器市场年复合增长率将达到54.7%,2027年市场规模将达到89亿美元。
液冷散热系统的两种主流技术
目前,液冷散热技术主要有冷板液冷系统为代表的间接液冷技术和以浸没式液冷系统为代表的直接液冷技术。
其中,冷板液冷系统是利用冷板等介质与CPU、内存、GPU、硬盘等表面进行接触,通过冷却液的流动将热量带走。浸没式液冷系统是将服务器内部的主板、CPU、内存、GPU、硬盘等部件浸没在冷却液中,利用冷却液的流动将热量排出。根据冷却介质是否发生相变,浸没式液冷系统又可分为单相浸没式和相变浸没式。
从散热效率上来看,浸没式液冷系统容易将热量带来,具有更高的散热效率和更低的能耗(冷板液冷系统仍然需要在机房中部署空调系统)。不过,就目前而言,笔者认为冷板液冷系统仍旧是未来一段时间内数据中心最佳的散热解决方案。
冷板液冷散热方案的主要优势
之所以说冷板式液冷散热方案是目前乃至未来很长一段时间内数据中心的首选方式,主要有如下几点原因。
一)兼容性好,改造成本低
在新建数据中心和老旧数据中心的改造方面,成本是重要的考量因素。
我们知道,冷板式液冷主要通过冷板(铜、铝等高导热金属构成的封闭腔体)将元器件的热量间接传递给封闭在循环管道中的冷却液体,然后利用冷却液体将热量带走。由于冷板式液冷技术在冷却液管路中流动时并未与主板和芯片模块进行直接的接触,材料兼容性较强。而且在选择冷却液时,只需要考虑冷却液与循环管路以及冷板之间的兼容性问题。
因此,冷板式技术不需要改变服务器主板原有的形态,而只需要在现有服务器主板上进行改装即可实现。这种改装方式不仅拆卸简单、安装方便,并且在技术、产业以及规模化生产上具有更好的可行性,成本也更容易得到控制。
除此之外,由于服务器整体形态没有发生根本改变,因此数据中心内部的机柜也并不需要大幅地改动,因此对于一些老旧数据中心而言,改造起来成本相对较低,也更易实现。
二)散热效率高,具备更好的能效比
一方面,与风冷式散热相比,冷板式液冷系统具备更高的散热效率,能够在同一机房和机架内部部署更多服务器,能够实现机架功率密度的提高,有效提升单机架的计算能力。另一方面,相对风冷散热系统,冷板式液冷系统由于替代了数据中心内部的空调散热系统,因此有效提高数据中心的能源利用率,降低了数据中心的整体TCO。
三)易于管理维护
相比于浸没式液冷系统,冷板式液冷系统在管理运维方面与采用风冷技术的数据中心相比并无太大差异,因此更易于后期的运营维护,管理成本更低。
冷板液冷散热方案的主要问题
缺乏统一的标准,是影响冷板式液冷散热的主要问题。
我们知道,冷板式液冷系统核心器件涵盖冷板、连接系统、冷量分配单元及监控系统等等,这些设备目前还没有统一的标准规范。由于缺乏统一的标准,也就意味着各家在建设、改造冷板式液冷数据中心时,会采用不同的规范和标准,给整机柜和服务器的规模化推广带来极大困难。因此,这也成为影响数据中心部署冷板式液冷系统的主要原因。
不过,为了推动冷板式液冷在数据中心的发展,业界也在积极地建立标准规范。例如,英特尔携手生态伙伴发布了《英特尔高效能数据中心白皮书》和《绿色数据中心创新实践——冷板液冷系统设计参考》两份白皮书,并先后发布了冷板液冷团体标准,旨在通过将冷板液冷技术的规范标准化,降低产业与技术门槛。与此同时,英特尔与生态伙伴一同通过简化设计与替代材料的选择等举措,推动成本优化措施,加速方案落地。
OCTC启动了多个开放标准建立,涵盖液冷及整机柜服务器相关技术领域,其中,已立项4个重量级冷板式液冷数据中心核心器件技术规范,涵盖冷板、连接系统、冷量分配单元及监控系统。
可以说,随着标准规范的逐步完善,冷板式液冷系统将加速进入数据中心,成为未来数据中心的主要散热方式。
写在最后:
比风冷散热具有更高的效率,比浸没式液冷散热具备更低的成本,这就是冷板式液冷技术之所以能够快速普及的根本原因所在。实际上,目前已经有很多智算中心采用了冷板式液冷技术的散热方案。未来,随着规范标准的进一步完善,冷板式液冷系统将成为数据中心的主流散热方案。