zyf1

大家下午好,接下来我分享的主题是液冷构建绿色计算。

有人会问,为什么要用液冷,以及液冷这么多产品该如何选择。我个人认为,没有十全十美的产品技术,只有我们选择最合适的产品技术能够提供给我们的业务发展。接下来的分享是阿里巴巴在这方面的一些考虑和探索实践。

接下来看几组相应的数据,从60年代大型机可能只有100万的设备接入,80年代小型机1000万,90年代是PC时代,1000亿个石碑,到2000年专网时代,然后是移动互联时代,未来到2020年,即将进入IoT物联网时代,500亿的设备会给我们带来什么样的挑战,这么多设备到物联网,随时随地会不断产生大量的数据。2005年,全球的数据总量是0.1ZB,2010年是1.2ZB,2012年是2.8ZB,2015年是8.5ZB,这么多的数据量需要大量的计算能力和大量的服务器来支撑这么多的数据量的计算和处理,同时也对IDC支撑这种服务器和计算带来相应的挑战。中国电子节能技术协会统计和预测,预计2024年能达到中国社会用总用电量8万亿度,数据中心的能耗问题变得无法忽视。这个是数据中心能耗的示意图,可以看到,一个典型的数据中心PUE是2.13,另外国际上一个组织对全球1100多个数据中心做了调查统计,平均的PUE是在1.8到1.89,高能耗不仅给企业带来大的负担,同时对社会造成巨大浪费。

看看业界其他一些公司在做些什么,微软把数据中心放在海底,Facebook把数据中心搬到北极寒冷的地方,因为这个地方全年气温超过30度的只有不超过24小时。

这是一个英特尔服务器产品的架构发展,除了CPU以外,内存的功耗和目的也在不断增加,所以对CPU的挑战不断提升。除了英特尔的计算,大家还面临AI的计算也在浮出水面。AI也是一个极大的耗能大户,一个3U的GPU服务器可以达到3.2kw。根据阿里服务器利用率的趋势,过去可能是3-5kw一个密度,现在是7.2-15kw一个密度,未来可能是25到40kw一个密度。

这是服务器功率与冷却方式的关系,这种提升的速度和方式是比较缓慢的,IDC更新换代是8-10年一个周期,服务器更新换掉是3-5年一个周期,为了应对服务器力度快速增长,液冷成为最终的趋势。

液冷大家也比较清楚,就是通过液体代替空气,把CPU、内存还有一些其他部件的,主要是间接制冷和直接液冷,对机房来说,既需要空气冷却的设备,也需要增加液冷的设备,对机房来说复杂度会提高,虽然PUE可以做到1.2以下,浸没液冷的方式,对IDC是比较简单的,可以把冷水机组、空调、风扇都去掉,但是另外它的密度对IDC也有挑战。

阿里巴巴在选择冷却方式的考虑,因为建设低能耗、环保型的数据中心是阿里追求的目标,为什么阿里现在研究浸没式液冷,因为架构简单节约,系统更简化,建设和维护成本更低,更低的PUE,系统更耐用。在液冷我们肯定是要有收益才去做这件事情,我们分了一下,液冷这里面有三个数据,首先是降低TCO,其次是性能提升,然后是降低PCIe。如果采用浸没液冷的方式,整个机房的IDC设计会更加简单,同时空间也会更少,这样就可以节省大量的成本。在成本方面,浸没液冷方式可以节省更多的电费成本。

如果采用浸没液冷的方式,基本上把服务器放在一个不导电液体当中,完全得出了空气、水、灰尘,在温度上,浸没液冷的温度比空冷的温度,其中核心部件温度要低一二十度以上。同比传统风冷系统,采用浸没液冷方式服务器实效率降低50%以上,它对湿度、灰尘、振动的影响基本上没有了,同时机房可以部署在任何一个环境,比如楼道、厂房都可以部署。未来边缘计算也是可以完全放在一个比较简单的地方,只要插上电、送上水、通上网络就可以使用了。

浸没液冷有很多挑战,第一是服务器本身,第二是IDC基础,第三是TCO方面。阿里巴巴在这方面做了一些研发,包括新材料技术、新IT设备、新液冷系统和新监控管理。

阿里在液冷的研究路线主要分为五个步骤,首先是基础技术,然后是部件级、系统级、小批量、规模化。基础技术首先是从液体材料选型,与服务器里面的部件各方面都是可兼容的,还有信号是可兼容的,不能影响高速信号。另外是提高密度,选择散热强的材料,来提高部署能力。另外是材料连接器。除了竹板上的,还有外置的,比如光器件,另外CPU、存储、内存、网络这些部件放在液体里是不是性能会受影响,另外稳定性、服务器性能、能效测试这些优化。系统级,因为是全新的变化,服务器架构、可维护、空间利用率还有整体数据中心的设计和架构,还有整个监控管理系统,都是全新的变化,阿里在这方面都进行了一定的探索和研究。未来的路还是比较长,比如未来的规模化部署与小批量这些工作都还在做。

以上是阿里巴巴近期的探索和研究,谢谢大家!

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2024-01-09 16:53:00
市场情报 中兴通讯分布式存储+ DPU,加速数据中心转型
存储技术在不断地创新、完善、加速演进,以更好地满足业务的存储需求,但同时也使得存储协议和文件系统越来越繁重。 <详情>
2023-12-18 17:49:00
市场情报 openEuler Summit 2023:汇聚全球创新力量,共建开源新生态
创新项目是openEuler社区发展的推动力,开发者是社区可持续发展的能源。 <详情>