伴随着SC15超算大会新一期世界HPC性能TOP500的公布,"天河二号"领衔的当今世界性能强的500台超级计算机已经揭晓。然而,如果要比谁的性能能耗比高、最"绿色",这些上榜的超级计算机系统恐怕要另有一番排列。
本次TOP500发布会也给出了这个问题的答案。按照Rmax(即好的Linpack性能)和能耗之比重新排列,本次TOP500中11台电源效率高的系统被遴选出来。其中,来自中科曙光的Sugon Cluster W780i高居第二位,堪称"绿色"中的"深绿"。
推出中国首款量产液冷服务器
高性能计算系统发展至今,需要解决的两大问题:性能和能耗。Sugon Cluster W780i就是通过采用由Nvdia提供的 GPU加速器异构系统来提高性能功耗比。除此之外,曙光的节能事业还有一项"秘密武器":液冷技术。
在今年6月举办的2015创新技术大会上,中科曙光就发布了中国首款可量产的液冷服务器:曙光TC4600E-LP冷板液冷服务器。与该服务器相配套的制冷解决方案能大幅降低整机功耗并降低机房噪音,机房全年PUE(负载耗能占比)可轻松降至1.20以下。服务器也因此得到了实现高密度、低噪音、低传热温差、自然冷却的效果。
值得一提的是,这款液冷服务器所需要的"冷却水"是很容易获得的30℃的水,不需用压缩机等装置。此外,在液冷环境中,服务器的CPU可超频运行,计算性能因此可提高12%.
有国外研究显示CPU核温每提高10℃,可靠性降低一半,液冷服务器的CPU核温比风冷极限温度可低20-30℃,CPU可靠性也得到了大幅度提高。"TC4600E-LP实际上是TC4600E服务器的液冷版本,以后曙光服务器都会同时开发液冷和风冷两种版本。"曙光数据中心产品事业部总经理沈卫东介绍说,该液冷技术的实现是通过将服务器最热的部分——高密度CPU的散热用液冷解决,与'浸没式'液冷有所区别。
未来液冷或颠覆行业创新
冷板式液冷服务器是业内液冷模式的一种,暂时尚未触及服务器物理外形的变革。而另外一种液冷模式——浸没式,则有可能在服务器架构上带来颠覆式改变。
"目前冷板式液冷技术不太会改变服务器现有的物理形态,只是用冷板代替了原来的CPU的散热片,这一步比较容易实现。" 沈卫东介绍说,浸没式则是"浸泡版"的冷板式,"冷板式实际上是一种中间替代方案,浸没式才是最终的结果。"
曙光公司近日在浸没式液冷服务器上也取得了重大突破。在本次SC大会上,中科曙光发布了其自主研发的新一代液冷展机——"RoboBlades浸没式液冷刀片服务器".沈卫东指出,该液冷展机的诞生为服务器浸没式液冷技术的产业化应用扫除了维护性障碍。
"未来的浸没式服务器或许是一个'缸':大量贴在一起的主板,紧凑地浸泡在这个'缸'里面。预计该结构服务器的功率密度可以20倍于今天的产品。沈卫东说:"随着浸没式液冷技术的应用和普及,未来服务器形态、制冷方式以及数据中心建设模式将迎来革命性变化。届时(浸没式液冷服务器)不但会抛弃现有服务器的外形,甚至会影响整个行业——除了冷却行业,他可能会影响到上游(如芯片设计等)很多行业。"
部署液冷服务器不会加大数据中心成本
液冷,顾名思义,液体注入服务器,通过冷热交换带走服务器的散热。目前曙光公司对液冷技术使用会使相应服务器的成本提高约30%-40%.不过,这并不会增加数据中心的建设成本。
"发热部件CPU和部分电源模块的热量占服务器的70%,采用液冷技术后可以减少2/3的风冷(设备)投入。"沈卫东指出,液冷系统不需要压缩机,替代空调机"肯定是便宜了",可降低数据中心基础设施投入。
如果不是新建机房而引入液冷服务器,综合考核液冷冷却器投入和风冷空调系统投入,液冷服务器所需的基础投入对风冷系统仍有优势,而服务器部分的"超支"一般可在1年到1年半在节能方面的表现回收成本。
此外,针对一些用户对液冷服务器液体泄漏的顾虑,曙光的技术团队调研了多种快速插拔方案,并在过去3年里做了大量的实验证实了其液冷服务器在该方面的可靠性。据悉,量产的TC4600E-LP液冷服务器已应用于建于曙光大厦的"地球数值模拟装置"原型系统上,如今正承担来自中科院大气所等单位所赋予的"解读地球"的计算任务。