2020年12月8日-10日,第十五届中国IDC产业年度大典在北京国家会议中心正式召开。作为数据中心云计算产业内知名的盛会以及IDC企业、电信运营商、互联网、金融、政府和厂商等产业上下游的高效沟通平台,与会嘉宾包括政府领导,行业专家和企业代表数千人。在主论坛上午场,浪潮信息副总裁沈荣为我们带来了《释放计算力 开放即未来》的主题演讲。
尊敬的吴部长、何所长、各位领导、各位来宾,早上好!非常高兴有这个机会代表浪潮来这里跟大家做交流,聊聊开放计算和数据中心的想法。
一、从圈内浪潮角度看看数据中心发展趋势。
数据中心很重要的一个点是IT算力,算力持续演进导致很多功率 上升,左上角这个图看到绿色部分是处理器大的设计功耗,在不久之前是260瓦,现在是270瓦,一年多以后大家将看到350瓦的单核CPU的设计功耗。另外一块蓝色部分是2路非常大量主流服务器的功耗 ,从过去的400瓦,很快大家会看到800瓦,算力提升带来了功耗 上升,随着功耗 上升,数据中心不得不关注绿色节能这个非常大的一件事情。
国内数据中心电费 支出占43%,基础设施投资也就12%,但是运营43%的费用放到电费 上。看联合国做的调查,预计到明年,国内所有数据中心总能耗加在一起会突破2000亿千瓦时,这是非常大的数字,什么概念?相当于两个三峡当年的发电量,这是巨大无比的功耗 。
另外,由于互联网行业迅猛发展,导致数据中心向超大规模发展,这个数据来自信通院,它说到2020年,27%服务器会部署在所谓的超大型数据中心,这里定义的“超大型”是指1万台以上的规模。我们看到,2019年全球大的数据中心平方数面积大概是99万多平方米,接近100万平方米,概念相当于140个左右足球场这么大,是非常庞大的!放在一起,大规模有大规模的好处。大规模接下来碰到的问题是变成了智能化运维的事情,人看不了这么多机器,一定要靠机器做些事情。前面世纪互联的朋友讲到他们的机柜数非常多,万级机柜,十万级IT设备,很多参数放在一起,IT业务负载变化以及环境变化,所有这些需要智能化运维。
二、讲到这里,再看看业界开源开放的做法。
这张图回顾业界发展,上面是软件开源,从最早的操作系统开始,一直到了数据库、中间件,以及面向云计算、大数据这些不同的应用,以及算法框架的一些开源开放,到riscV芯片的开放,到数据中心开放标准的建设。这些开源开放促使行业繁荣发展。使得技术演进更加健康、迅速,整体改变了IT行业的生产方式、应用部署的方式,这是个基础。
讲开放计算是很好的应对了数据中心的核心诉求,我们看到数据中心第一件核心诉求是性能,我们为什么建这么多数据中心或者不断建设新的数据中心?最重要的一件事情是性能,性能不够了,我们应用太多了,应用爆发增长,性能特别重要的一件事情。之前见到合作伙伴,说了很有意思的事情,说10-15年规划一个数据中心,但是用到6、7年以后,会发现原来的想法不对了、不成立了,用不了15年,可能很快要建设新的数据中心,或者我们要去找租赁的数据中心来开展我的业务。第二件事情是所谓的弹性,这里的弹性讲的是资源利用率,怎样使得资源更好的灵活部署,或者我们在应用上来的时候资源能够很快部署出去,这是弹性的概念。第三是节能,服务器功耗非常大,大量能源消耗,能源节能非常重要。开放计算是开放很多东西,能够更好的解决这方面的问题。
如果在性能层面,如果应用开放标准来做,我们能够看到的是:第一,空间优化,它能使计算密度提升30-50%,这是非常大的一个事情,不至于不断建数据中心,虽然基础设施建设不是那么贵,但是反复建设是困难的,听到一个行业建设数据中心,3年是最少的,不能再少了,从地皮、电力各种各样的行政审批,真正部署起来没有3年是做不起来的,非常麻烦!所以空间优化是非常好的一件事情。第二,开放架构,更好兼顾纵向、横向扩展能力,纵向是性能不断往上提升,横向是数量集群,性能更大。第三,弹性层面讲到资源解耦和池化。GPU是非常昂贵的宝贝,GPU插到服务器里,只能给服务器用是非常浪费的,所以怎么把GPU跟服务器做解耦,放到专门的盒子里,GPU放到一起池化,使得利用率大大提升,服务器需要的时候通过网络来进行这个服务。另外,模块化设计,数据中心模块化,数据中心里面的设备也要模块化设计,模块化能够帮助快速弹性部署。另外,L11整机柜交付,浪潮是交付和生产合到一起,而不是机架到了数据中心在这个节点不断上架去做,而是生产过程当中把交付做掉了,交付效率会提升非常大,我们看到自己的实际数据统计是10倍以上的效能提升。另外,节能。供电逃不掉,功耗非常大,多的6-8千瓦,也有3、4千瓦的,以后一个单机柜在2、3年以后会达到50千瓦的供电情况,供电变得非常重要,从12V变成了48V的供电方式,节能降耗3%,中国一年耗电2000亿,3%非常大。另外,液冷降低能源开销,很好的降低PUE,外面的一个厂商PUE变到接近1的理论极限值,所以开放里面液冷是非常重要的话题。第四,管理,管理对标准化,很多管理软件,底层的Open BMC、RMC,RMC是机柜管理模块,包括整个数据中心集的套件,很多都有自己的管理软件,很多互联网企业都需要比较合理和优秀的数据中心管理套件。
说了这么多开放计算,但它并不遥远,今天很多大型数据中心已经在部署各种各样的、各种层面的、各种粒度的和百分比的开放计算,今天开放有很多ODCC规范的东西,在互联网里用得特别多,在传统行业也看到这些事情。开源软件方面,openstack、Hadoop、TensorFlow算法这些已经成为各个数据中心都在用,成为事实标准了。国内顶级的互联网中心,不光是国内的,海外的也一样,运营商数据中心、金融行业的或多或少都在采用开放计算标准的产品,它们不光采用,也加入到组织里面去,因为这些计算离开了用户,光厂商去做是不够的,所以这个特别重要。
右手边是一个案例,我们的某一个客户完全用开放计算的产品去部署数据中心,可以看到电力节约1个机柜一年在30%的量,系统故障率降低90%,投资收益率33%,这个数据不是我们说的,是它自己测算出来的。运维效率提升3倍,一个人管理超过4000台的服务器节点,是非常大的事情。
数据中心在不断演进,我们在不同时期、不同的计算要求,有不同的计算中心数据中心来对应,最早是数字计算、科学计算,这些是超算中心应对的。后面来了很多企业关键应用、关键计算,互联网的、政府的、企业的数据中心、传统的数据中心,进一步往上走称之为“智算中心”,什么是智算中心?今天人工智能无处不在 ,将来计算需求80%以上都是跟人工智能相关,“智算中心”是一个AI算力中心,浪潮简单把它称之为“智算中心”,我们4月份提出这个概念,国家信息中心联合发布《智算中心白皮书》,看到智算中心普及。特别同意何所长讲的,以后私有的慢慢变成公有基础设施,我们希望智算中心变成公有基础设施必须要做的事情。
回过头来讲开放计算跟智算中心的关联,这不是脱离的事情。我们今天看到很多参与到开放计算里的人,包括用户也好,组织者也好,最重要的第一个原因关注成本降低,太贵了!巨贵无比,GPU、CPU太贵了,希望成本降低,90%的人希望开放计算降低成本,电力节能降耗也跟成本有关,另外是灵活性,今天不希望被厂商锁住。今天可以买浪潮的开放产品,明天可以买其它厂商的,完全通用,因为接口一致、电源位置一致,不希望你们把我们拔掉换上别人,希望我们服务好。
这背后最重要的原因,首先是开放生态,这是大家共同参与的一件事情,对用户更加容易选择、互通、成本更低、规模更大,有规模效益。第二,透明安全。这很重要,今天只跟一个厂商做,它里面有什么问题,你未必知道,如果用得越多,它的问题是已知的,知道这里面有什么问题、这个问题被谁解决,在被解决的第一时间拿到方案。同时,由于透明的事情,很多接口开放,很多人一起创新。第三,导致领先的技术产生。人类发展到现在,最重要的是协作,一个厂商、一个科技人员无法解决所有的事情,企业可能有些问题自己解决不了,所以把这个问题丢出来,告诉你我们是怎么做的、我们碰到什么问题,别的自上而下的人帮助我们一起解决问题,解决方案开放出来,大家互为肩膀往上走。
对浪潮来说,我们坚定不移的相信开放计算,为什么?开放计算鞭策我们自己不断往前走,不能躺在原来的成绩上面,靠这个技术来吃饭。所以开放计算不断能够加速智算中心的建设。
浪潮在此方面花了很大的投资,在过去10年就很早加入到开放计算领域里,在不断推动引领行业发展。浪潮是唯一一个在业界里支持三大国际开发标准的,第一个是我们国内的ODCC的标准,OCP是全球的标准,另外是OPEN19的标准,我们唯一参与到三大组织里,我们在ODCC里是很重要的核心技术人员,我们在OCP是白金会员。ODCC出货量非常大,超过三分之二ODCC机柜是浪潮 的。另外,我们节点非常多,有17款节点。除了硬件外,刚才说到开放计算有软件部分、硬件部分,软件部分我们做了大量工作,比如Openstack是全球前十大的代码贡献者,超过1万个代码部署,贡献了使得Openstack有10倍提升。深度学习使得AI计算超过10倍以上。SPEC组织里面是委员,机器学习SPEC这个组织是浪潮主导的,浪潮是走得最快的。我们是英伟达全球大的服务器合作伙伴。我们在机器学习认证里面,我们设计的东西远远超过GPU排名第一。我们在软件层面大量参与,坚信开放计算才是未来。
智算中心是非常重要的一件事情,浪潮作为智慧计算的领先企业,我们本着开源开放的原则来帮助,我们是模块的提供者,并不主导建设,但希望通过硬件重构的方式形成算力基础,帮助大家做到更好算力基础。通过软件定义方式推出智算中心超算系统,资源协同,对各行各业提供云计算、大数据、人工智能服务。
最后,这一件事情浪潮一家做不了,刚才讲到开放和协作,我们愿意与产业伙伴一起推动基于开放计算的数据中心转型,模式层面也完全是开放的模式,可以联合规划、协同设计、敏捷研发。技术层面,不光是芯片层技术,还是池化技术、网络互联技术、冷却技术、供电技术,方方面面很愿意跟在座合作伙伴,不光是国内合作伙伴,还有国外合作伙伴,一起探讨怎么做好这件事情,在产品层面是开放的产品,在服务层面怎样基于开放式的服务。
我的演讲到这里,谢谢大家!