2022年,数据中心及其配电设备需要满足极限性能需求;服务器机柜和机架需要进行架构设计以实现最大的适应性。将超级计算和人工智能 (AI) 添加到这个等式中,很明显许多数据中心不是即插即用的——它们通常必须符合独特的物理架构。
在独特的物理架构中,有边缘计算。边缘计算旨在让应用和数据更接近最终用户。但空间通常是一个重大问题,远程监控和修复是绝对必要的过程。
无论外形如何,数据中心运营商都不断面临着寻找定制解决方案来提供电力、冷却和连接的挑战。
数据中心需要大量电力
正确满足数据中心的电力需求并在设施中分配电力一直是一个问题,尤其是在更细粒度地管理电力时。那么解决方案是什么?
在远程访问、电源和空白空间基础设施方面,现成的和半定制的解决方案可以满足大多数数据中心应用的需求。但是,对于持续提高效率和可持续性的需求又如何呢?
这种需求导致许多高性能计算 (HPC) 安装、人工智能应用、超大规模数据中心和电信运营商寻找功率密度、冷却和连接的定制解决方案。
当然,超级计算需要物理上靠近的所有东西才能最大限度地提高吞吐量。人工智能需要在专门的处理器上;就其本质而言,边缘计算本质上是分布式的。之所以存在这些功耗差异,是因为每个软件工作负载都有其独特的功耗要求。简而言之:应用驱动硬件及其环境的架构选择。
这种理念的缺点是它几乎没有为机架安装设备分配电力的空间。这就是为什么服务器机架需要定制的机架配电单元 (PDU) 解决方案,因为:
- 机架后部几乎没有空间容纳 PDU。
- 带有更多服务器的更高机架会产生高插座密度的情况。
- 极有可能几乎没有气流。
数据中心的设计也必须考虑到如何分配能量,以满足密集的处理和人工智能应用。
配电不能事后考虑
人工智能是一场革命,它需要大量的计算能力和电力来设计和训练算法。在分配电力或容量时,这些特殊情况需要额外考虑,过热可能很快成为一个问题。在为 AI 设施设计配电计划时,请牢记以下潜在挑战:
- 您可能需要 PDU 来帮助进行容量规划和最大限度地利用电力。
- AI 设施通常需要定制机架,这需要在 PDU 的位置上独创性。
- 高密度和更高功率的安装测试了标准 PDU 的局限性。
- 您的功率密度超出了 C19 或其他标准插座所能提供的范围。
在边缘计算方面,将计算服务放在更靠近数据处理的地方会使依赖它的人受益——物联网设备、智慧城市和自动驾驶汽车证明了这一点。然而,这些新应用也需要实时计算能力来持续驱动边缘计算。
不幸的是,这些小型数据中心位于偏远的无人位置,例如蜂窝塔底部或街角,这使得它们既费时又难以管理。在这些情况下,必须应用不同的配电思维过程,该过程需要:
- 需要进行环境监测,以防止设备运行能力之外的温度和功率极端情况。
- 提出远程监控和管理功耗的案例。
- 具有板载通信功能的 PDU,能够安排插座电源的开启和关闭。
- 如果单元超过阈值,PDU 能够减少电力负载以最大限度地延长电池电力正常运行时间。
- 您的操作环境要求 PDU 超出通常的 0-60 摄氏度。
结论
如前所述,用于远程访问、电源和空白空间基础设施的现成和半定制解决方案满足了典型数据中心应用的需求。然而,高性能计算安装、人工智能应用、超大规模数据中心和边缘计算很快就从独特的设施转移到工作负载处理规范。
随着这种情况的持续,运营商仍需要在布局、功率密度、冷却和整体连通性等方面采用定制解决方案。定制的一部分必须包括仔细考虑如何在整个机架中分配电力,以及同样重要的是如何监控机架的环境条件。
为高度定制的数据中心订购通用 PDU 就像购买 D 型电池来为特斯拉供电,即为不同设备制造电池的方式与为专用服务器应用制造定制 PDU 的方式相同。不要让配电成为事后的想法并拖延或停止您的工作负载。