如今,使用自然冷却系统已经成为数据中心设施所有者的常见做法,特别是在新的关键任务设施建设中。直接或间接使用外部空气来冷却ICT设备在技术逻辑上和财务收益上都是令人认可的。
但是自然空气冷却真的免费吗?不总是。采用自然冷却系统对机械设备的运行和维护增加了相当大的复杂性。如果这种复杂性不能被很好地管理和运营,自然冷却将增加能源成本,并增加操作风险。
Facebook公司在普赖恩维尔的数据中心
天气是主要因素
对于采用自然冷却的数据中心,天气是最明显的变数。在炎热的天气下,自然冷却能力显著下降,需要进行设计,或者可以提高室内温度,或将自然冷却与常规机械冷却相结合,以确保室内温度保持在设备运行可接受的范围内。
多种操作模式是另一个复杂因素。例如,Facebook公司在普赖恩维尔的数据中心的自然冷却系统采用八个不同的操作条件来优化直接外部空气的使用,以及在不同天气条件下的直接蒸发冷却。使用通过压缩的外部空气的自然冷却系统具有至少三个不同的操作条件。
其维护工作也变得更加复杂。自然冷却增加了与室外空气直接接触的移动机械部件(例如空气阻尼器和执行器)的数量。此外,室外空气具有一定的腐蚀性,可能会导致阻尼器和执行器卡住,不能提供冷却,或者导致系统从室外带来的热风。带有蒸发冷却功能的自然冷却系统增加了冷却水的维护工作,并需要进行化学处理和定期冲洗。
高故障率
数据中心自然冷却系统的高故障率在能源效率和建筑技术文献中有据可查。由Kristen Heinemeier撰写的题为“自然制冷”是一篇特别好的实用文章,并在2014年ACEEE建筑节能夏季研究报告上发表。智能能耗管理系统厂商Vigilent公司总裁兼创始人Cliff Federspiel表示,其在美国和欧洲的自然冷却系统的丰富经验与Heinemeier的文章描述的完全一致。具体来说,他在任务关键设施中看到的故障率甚至高于Heinemeier的文章中所提到的商业建筑。
Heinemeier研究表明,空气侧节能器(直接自然冷却)故障和影响具有普遍性。她发现尽管空气节能器是一种优秀的节能技术,但在实践中表现不佳。在加利福尼亚的一次会议上,她指出,数据中心设施的节能器的功能是残缺不全的,外部空气阻尼器在30-40%的时间内关闭。她说:“这种失败意味着节能器不提供任何节能,而且建筑物可能不会引入任何外部空气。其他研究发现,技术人员在加利福尼亚数据中心的大多数RTU设定的高限设定点都是不正确的,导致自然冷却的使用时间只有几个小时。”
Cliff Federspiel最近参观了位于美国两个联邦州的由不同的跨国公司建设的五个数据中心,这些数据中心使用三个不同制造商的提供的冷却设备。
在这次参观中,Cliff观察到的几十个自然冷却单元中,几乎都有容量和功能有限的问题,或者根本没有工作。其问题包括控制器配置,传感器故障,安装故障,以及机械故障。
以下是一些例子:
例如在室外空气很冷的一个场所,但是其外部的空气阻尼器是完全关闭的,并且该设备是循环的室内空气。温度保持在可接受的范围内,然而,其直接膨胀(DX)压缩机没有必要运行,并且其费用很高。运营商知道自然冷却应该运行,但不知道为什么不运行。自从安装了大约一年前的自然冷却装置以来,该设施一直在运行。检查之后表明,控制器配置不正确,配置错误的控制逻辑阻止了自然冷却操作。
在另一个场合,Cliff观察到控制系统正在工作,似乎正在引入外部空气。然而,其排放空气并不像预期那么冷。检查显示,外部空气阻尼器和回风阻尼器关闭。外部空气阻尼器上的阻尼器执行器夹具已经掉下或被拆除,使得阻尼器卡在完全关闭位置。通过分析来自冷却优化传感器网络的数据确定了这个问题。
值得注意的是,尽管在每种情况下,自然冷却系统都有问题,但它们都是可以解决的问题,通常很少或根本没有投资。更重要的是,数据中心运营商并不总是认识到自然冷却受到影响,也不能解决这个问题。除了这种缺乏可见性的额外能源成本和潜在的热风险之外,这些设施正在花费大量资金来追求解决方案,实际上可以采用现有设备实现所期望的运营。
监控冷却系统
因为自然冷却系统在按照预期工作时是高效的,所以最佳实践表明,要实现安全运行和自然冷却的全部好处,需要通过监控系统进行风险减轻和可视化。在加利福尼亚州,需要用于自然冷却系统的诊断。动态监测,分析和诊断结合视觉检查将揭示问题,并有助于确保在复杂的冷却基础设施中持续和正确地运行自然冷却。在无人关键任务设施运行中,使用远程监控和分析结合智能报警是确保可靠运行自然冷却的唯一方法。
随着自然冷却成为冷却任务关键设施的标准手段,考虑其增加的风险和复杂性至关重要。数据驱动的冷却操作监控与智能分析和控制层相结合,是确保用户的热环境以最有效的方式持续运行的最佳实践方式。这种监督也确保企业继续优化其资本投资,即使随着时间的推移,这些条件,天气和物理方面也会发生变化。