随着高级分析、人工智能以及各种流程的数字化,数据中心的工作负载不断增加,平均机架功耗大幅上升。而且,正如我们所知,随着功率消耗的增加,需要从机架中排出的余热也随之增加,最终需要从空白空间中移除。
在最近,当机架功耗高达20kW时,可以依靠基于空气的冷却方法来保持IT硬件安全高效地运行。但随着一些机架开始超过30kW甚至更多时,需要使用新的冷却方法。
这在一定程度上是由于IT硬件总体上的致密化,每一代新的CPU都在越来越小的尺寸中封装了更多的处理能力。人工智能 (AI) 和机器学习 (ML) 等工作负载需要通常通过图形处理单元交付的浮点运算。这些GPU被设计为在完全用于特定工作负载时具有高于80°C(176°F)的正常工作温度。
尽管功率超过20kW的机柜有基于空气的冷却选项,但它们通常难以有效安装和维护,基本上超过了冷却能力方面的收益递减点。因此,数据中心的所有者和运营商现在正在谨慎地为他们的新设施项目寻求液体冷却。
液体冷却的简史
IT设备的液体冷却似乎是一项新技术,但事实并非如此。
一般来说,液体是一种很好的传热介质,只需一点点化学工程,就可以精确地调整沸点和凝结点,从而使用介电流体改善传热。
自19世纪末以来,各种形式的液体冷却就已经出现,当时它们被用于绝缘和冷却超高压变压器。汽车行业是另一个依赖并且仍然依赖液体冷却的生态系统,如典型的汽车散热器中的水。
液冷技术进入计算机领域的历史较早,当时IBM在20世纪60年代早期发布了一系列名为System/360的企业级计算机。
360系统是市面上最经久不衰的电脑系列之一。虽然最初的硬件现在已经退役,但在20世纪60年代早期编写的S/360代码仍然可以在今天的新大型机中找到。它也是第一台具有统一指令集的计算机,使得主机的升级或更改比以往任何时候都更容易。
System/360还采用了空气和液体冷却的混合方法进行冷却。这计算机相当大且安装麻烦,但IBM开发了混合模型,以适应增加的热负荷。在这些系统中,多达50%的散热是通过水冷式热交换器从冷却空气中除去的。
今天,液冷已经出现在几乎每一台台式电脑上,而且这个概念本质上保持不变。冷却过程由三个不同的部分组成:-热板,供应和返回管道,以及散热器和风扇。
热板本质上是一个金属板,覆盖整个CPU模具,顶部有一个小的储水池。该板被设计成尽可能导热的。芯片产生的任何热量都将传递到顶部的蓄水池。
液体在这个闭环将通过供应和返回管道旅行到散热器,在那里热量将通过散热器翅片推出PC外壳-这些翅片被风扇主动冷却。
消费级液冷最初只处理CPU热量,但现在现代PC的几乎每个组件都可以进行液冷。
这是液冷的消费级选择——但大规模部署和企业级解决方案呢?接下来我们将在数据中心行业背景中讨论这些问题。
企业级液体冷却解决方案
在分析企业级IT硬件的液体冷却选项时,主要有两大类液体冷却——直抵芯片液体冷却(也称为传导或冷板液体冷却)和浸入式液体冷却。
浸入式液体冷却包括将IT硬件直接浸入充满电介质氟化液、密封且易于触及的外壳中,电子组件产生的热量直接传递至氟化液。相反,直抵芯片冷却技术完全避免了氟化液与电子器件之间的直接接触。使用管道将液体冷却剂泵送到电子部件上的冷板上来传递热量
当考虑到冷却剂所经过的相(流体处于什么状态——液体或气体)时,我们有五种不同类型的液体冷却。
直抵芯片 - 单相
这种冷却方法需要将液体冷却剂直接输送到服务器的较热组件 ,如CPU或GPU,并将冷板直接放在芯片上。电气元件从不与冷却剂直接接触。
使用这种方法,仍然需要风扇提供气流通过服务器以带走余热。虽然空气冷却的基础设施大大减少,但仍然需要正确操作这种液冷方法。
冷却剂可以是水或介电流体,但水会导致停机泄漏风险,但是,可以使用防漏系统 (LPS)。单相是指冷却剂不会改变状态——即从液体变为气体。
这也与前面台式电脑示例中使用的方法相同。
直抵芯片 - 两相
两相直接芯片液体冷却方法与之前的单相方法类似,唯一的区别是液体冷却剂会改变状态——在完成冷却回路时从气体变为液体,反之亦然。这些系统将始终使用工程介电流体。
在排热方面,两相系统优于单相系统,并且由于冷却剂的状态变化特性而具有较低的泄漏风险。然而,它们确实需要额外的控制,这将增加系统生命周期内的维护成本。
浸入式液体冷却 – IT机柜单相
这种冷却方法使用单相介电流体并与IT组件直接接触。服务器完全或部分浸没在机箱内的这种非导电液体中,有效地消除了所有热源。
冷却可以通过传导被动发生或主动泵送发生。热交换器和泵都可以在底盘内部或侧面布置中找到,热量从液体传递到水回路。
这种方法也不涉及风扇,因此其运行几乎无声 (0 dB)。相比之下,一些风冷设施在数据大厅中可以达到 80 分贝以上,工人需要听力保护才能长时间暴露在这种环境中。
浸入式冷却 – 开放式浴缸 – 单相
这种沉浸式液体冷却方法有时被称为“开放式浴缸”,将IT设备完全浸没在液体中。
从本质上讲,它是一个背面翻转的机架,里面充满了介电流体——服务器现在不是水平安装的,而是垂直安装的。
这些系统通常配备集中式电源,天然介电流体通过使用泵的热交换器冷却,泵可以安装在浴缸内部或外部,或通过对流。
浸入式冷却 - 开放式浴缸 - 两相
与单相一样,在这种方法中,IT设备完全浸没在储罐内垂直的流体中。但是,对于这种方法,重要的是,介电流体在加热时必须能够将状态从液态变为气态。
在这样的系统中,浸没和暴露的部分会产生热量,将液体变成气体,气体上升到水面并凝结在线圈上,一旦足够冷却又变回液态,就会自然落下。
什么是介电流体?
电介质液体在高压应用中用作电绝缘体,例如变压器、电容器、高压电缆和开关设备(即高压开关设备)。
它们的功能是提供电绝缘,抑制电晕和电弧,并用作冷却剂。通常,它们分为两类,含氟化合物和碳氢化合物。
含氟流体通常具有较低的沸点,主要用于两相浸没冷却。
碳氢化合物通常不用于两相浸没式冷却系统,因为大多数碳氢化合物是可燃或易燃的。因此,碳氢化合物通常仅用于单相应用。
含氟化合物(或碳氟化合物)和碳氢化合物(例如矿物油、合成油、天然油)均可用于单相浸入式冷却。沸点较高(高于系统的最高温度)的流体对于确保流体保持液相是必要的。
在各种含氟化合物和碳氢化合物之间做出选择时的考虑因素包括传热性能(随时间推移的稳定性和可靠性等)、IT硬件维护的难易程度、流体卫生和更换需求、材料兼容性、电气特性、易燃性或可燃性、环境影响、安全性等相关问题,以及储罐或数据中心整个生命周期内的总流体成本。
目前采用情况
虽然远非主流,但液体冷却将自己定位为高性能计算的冷却解决方案。然而,其主流采用将取决于技术和芯片设计的进步。
改造现有的数据中心对于某些形式的液体冷却来说成本很高,而浸没式水箱的重量使其对于许多当前的高架地板设施来说不切实际。
浸没式液冷与传统风冷相比的优势
1、节能性更加极致:冷媒与发热器件直接接触,换热效率更高,且可实现全面自然冷却,系统PUE<1.05;
2、器件散热更加均匀:采用全浸没方式,服务器内部温度场更加均匀,器件可靠性更有保障;
3、无泄漏风险:采用绝缘、环保的冷却液体,即使发生泄露对基础设施硬件和外界环境均无任何风险;
4、噪声更低:服务器全部元器件均可通过液冷方式散热,内部实现无风扇设计,满载运行噪音<45dB;
5、功率密度大幅提升:单机柜功率密度可达60kW以上。