2023年8月,8款生成式人工智能服务器通过首批备案;2024年3月底,这一数字已增至117款,短短7个月增长了109款。这反映了我国大模型的快速发展,背后则是快速增长的算力需求。
面对这一情况,传统数据中心已经力有不逮,正从芯片、服务器、散热、建设、设计等多方面进行优化,多项新技术、新解决方案不断涌现。以中科可控日前发布的新一代高融合一体化算力平台D9000 G5为例,其支持高密算力、高效调度,可提供9216个核心的澎湃动力,一柜相当于2000台传统服务器的算力总和,为数据中心满足高算力发展提供了新思路。
图:D9000 G5整机柜集群
新一代整机柜助力数据中心实现高密算力
当前,芯片功率不断提高,为满足持续提升的算力需求,作为算力基础设施的数据中心必然向高密化方向发展,以降低算力成本,提升算力建设效率。
整机柜是将原有机架+机器分离的架构进行融合,打包成为一个独立的产品。以一个整机柜为最小颗粒度进行交付的服务器,是算力的优质载体。通过技术与设计上的深入研发,新一代整机柜能够持续优化架构,实现高密算力,有效降低算力成本,提升算力建设效率,让数据中心具备更强的市场竞争力,获得更好的商业利益。如D9000 G5,其单节点最高支持256颗物理核心,512线程的算力,可实现6组xHCL高速互联,峰值带宽达230.4GB/s,算力密度提升4-8倍以上。
图:D9000 G5支持高密算力
同时,智能化、数字化均会产生海量数据,数据中心想要满足人工智能算力需求,也要有先进的存储力。D9000 G5在存储力层面同样有着较大优势,可提供3.2P全闪存储空间,实现高达61万+IOPS数据吞吐量,能够满足语料读取和大模型 Checkpoint需求。
以此来看,数据中心搭载D9000 G5后,其计算能力与存储能力均能够得到有效提高,能够更好地实现市场价值与商业目的。
值得注意的是,实现高密算力的必要前提是高效制冷。芯片功率的提升,密度的提高,都要求整机柜需要具备良好的散热能力,以保证芯片的安全运行。D9000 G5同样在此方面进行了全面优化,在覆盖风冷、风液混合、全液冷等全类节能形式的基础上,着重应用了液冷这一高效制冷方式,液冷覆盖率超过95%,以提供稳定的温度及环境,进一步激活芯片算力潜能,确保算力的全面输出。
新一代整机柜助推数据中心节能降碳
伴随智能化、数字化发展,全社会对算力的需求快速提升,算力产业规模迅速扩大,尤其是智能算力需求随着大模型数量的快速增长而迅速上升。据中国信通院统计,截至2023年底,我国智算规模约69 EFLOPS,相较于2023年6月的50EFLOPS,半年时间规模增加38%。
算力的产生主要依赖于电力的支撑,算力产业扩大的同时,用电耗能也在快速增长。以GPT-3为例,GPT-3前期训练的耗电量为128.7万度,相当于国内348个家庭一年的生活用电;GPT每日访问量约为2.7亿次,平均每次访问5个问题,每月用在回答问题上的推理计算耗电量则是1872万度,这就导致了大量的碳排放。这种情况下,伴随“双碳”目标的临近,绿色化已成为数据中心发展的必然趋势。
目前数据中心已经在设备、建设等方面采取多种节能减碳措施。而新一代整机柜通过持续创新,在绿色化方面的作用日益显著。
图:D9000 G5采用液冷、智能流量调节等降低能耗
作为其中的代表,D9000 G5有效降低了数据中心用能,减少了碳排放。它采用智能供电技术,集中供电效率提升,整柜节能20%以上;通过智能流量调节技术,二次侧液冷系统最高节能56%。同时,液冷高效率制冷的能力可大幅度减少散热的电能消耗,让数据中心实现低PUE。全液冷模式下,搭载D9000 G5的数据中心PUE可低至1.09,有效减少了碳排放。
新一代整机柜可适配数据中心差异化配置需要
整机柜需要应用于数据中心才能体现出其价值,但不同的数据中心在供电、建设规模等方面存在着差异。整机柜能否实现灵活配置,其自身在运维过程中是否便捷,可否实现快速交付等都成为摆在整机柜面前的挑战。也正因如此,新一代整机柜在设计、布局、配置等方面进行了多项创新,将这些问题一一化解,已经具备高可用性。
以D9000 G5为例,其自主研发的“积木式”模块化部署可满足服务器节点、交换节点、管理模块、电源模块的一体化集成、一体化运输,实现机柜级交付。同时,D9000 G5支持水、电、网三线全盲插,在安装过程中无需精准对位,极大地提升了部署效率。经测试,D9000 G5的安装时间比传统方式缩短了80%。
图:D9000 G5支持水、电、网三线全盲插
D9000 G5还实现了智能运维,通过集成的U位识别技术,可全面掌握RMC整柜和节点信息,简化远程智能运维场景。一旦有机器发生故障,系统能迅速锁定位置,配合自动化机械臂的介入,可显著降低人力运维成本,确保数据中心高效运行状态;面向机房无人化运维场景,D9000 G5节点级与机柜级智能双重漏液防控设计,可实现远程智能操控供电、供液;通过智能化操作,D9000 G5节点级MTTR可节省30%以上。
D9000 G5能够进行灵活配置,电源箱、交换机,节点位置可根据场景灵活配置。如电源箱通过灵活布局能够支持高中低不同位置的安装,完美适应不同机房的走电规划,而且与液冷系统的紧密结合,可彻底消除水电交叉可能引发的安全隐患。
此外,D9000 G5具备灵活形态,支持整柜、半柜等不同交付形式。其中,整机柜设计适用通信、金融、科教等用户;半柜则适用中小型数据中心,有效满足了不同规模不同场景下的使用需求,实现全屋定制。
算力的产出依赖于芯片,整机柜与数据中心的协同发展是为了最大可能释放芯片潜能,目前D9000 G5通过算、存、管、用的设计创新正加快推动数据中心突破算力瓶颈,而这可能仅仅是第一步,伴随算力需求的提升,整机柜乃至数据中心的形态均有可能发生新的变化,包括在软件层面上的进一步契合等。智能化的未来,整机柜与数据中心还将从多个层面上进行突破,最终实现契合智能化、数字化发展的高算力供给。