在常人眼中,数据中心不过是一座摆放了成千上万台设备的普通建筑,只要有资金,有人力,谁都可以建造上几座。而实际上,一个数据中心的复杂度远超人们想象,是“贫穷限制了想象力”。

数据中心几乎将世界上最先进的信息技术都集成了起来,在这里涉及到动力、制冷、通风、建筑、网络、计算、存储、布线、消防、监控等等十几个技术门类,覆盖到数十项学科的先进技术。现在很多的云计算大数据、人工智能、软件定义也都是在数据中心里大放异彩,数据中心是这些先进技术的实践土壤,都要到数据中心来走一遭,只有经过数据中心考验的技术才是真正的技术,能够得到业界认可的技术。

关于数据中心,维基百科给出的定义是“数据中心是一整套复杂的设施。它不仅仅包括计算机系统和其它与之配套的设备,还包含冗余的数据通信连接、环境控制设备、监控设备以及各种安全装置”。这个定义还不够全面,几乎没有哪个定义能够将数据中心概括清楚,因为数据中心实在是太复杂了,并非用几个词语或者几句话就能概括清楚。当然,并不是一开始数据中心就很复杂,在最开始我们甚至可以将拥有几台PC的机房也可以叫做数据中心,但数据中心规模和技术都发展太快,复杂性呈几何性增长,我们讨论数据中心的复杂性都是基于当前现状来讨论的。

首先,数据中心规模增长迅速,原来占地几千平米的大型数据中心,放到现在也就属于中小型数据中心,现在的数据中心动辄10万服务器,要将这些服务器都放满就得多大的建筑空间,这还不包括网络、通风和制冷等其它不可缺少的系统。一旦规模上来,所有的系统都需要适配,这个复杂不是简单地累加,而是几何倍数的增长。比如建造大楼,建设一座50层的大楼和120层的大楼成本可不是增长两倍的关系,假如建设50层大楼,平均下来3000元一平,10万平米就是3亿。120层的话,造价应该是50层楼的10倍,3万元一平,如果是30万平方米,那就是90亿,整整差了87亿。

其次,数据中心是一个多功能的建筑物,并不仅仅是一些服务器的集合,要将这些服务器互联互通起来,并且让运行的应用软件平稳运行,需要做大量系统设计工作,每个设备里跑的每一条指令都有其特定的意义。我们知道仅仅以太网的RFC就有八千多篇了,没有人能将所有网络协议都搞懂,但却要在数据中心里部署很多网络协议,复杂度可想而知。登录到任意一台网络设备,都能看出至少上百行的网络配置,多的有上万行,这里的每一条配置指令都是为整个数据中心运行服务的,不可缺少,任何一个局部微小的操作都可能导致全局业务受损,为何要建设自动化运行的数据中心,其实有一个重要的原因就是靠人的经验去管理数据中心已经不可能了,只能靠机器自动管理。

第三,新技术演进太快,云计算也不过才十年之久,就已经遍地开花了,大数据、人工智能甚至区块链都来了,这些技术的寄托都是在海量数据上,哪里有海量数据,就是数据中心。还有5G、移动互联网、物联网等等,哪个能离开数据中心?数据中心真是一专多能,海纳百川,无所不能,这些应用都给数据中心提出了新的挑战,数据中心的基础设施要能满足这些应用,只能不断变化调整,系统愈发复杂。

第四,人们对数据中心要求越来越高,现在的数据中心全年都不能中断,每中断一分钟都会影响业务,因为很多互联网业务是24小时的都有人访问,前几天阿里云中断一个小时,全网一片哗然,阿里云也及时坦诚不公地进行了道歉。这种事情再一再二可以,不能再三再四了,反复多次的故障很容易导致大量用户流失,最终只能关门大吉,所以数据中心提供持续无中断的能力看得比命都重要,如此必然要在数据中心的各个系统中做冗余备份设计。

冗余备份设计给数据中心带来的就是增加复杂性,冗余做的越多,复杂性越高,看似安全,实则危险重重。过于复杂的系统运行起来不仅效率低,甚至在故障出现时,根本无法快速准确定位,所以要在冗余和复杂性之间做取舍,选择上做好平衡。  

所以,数据中心不仅包含很多系统,每个系统还都很复杂,越来越复杂,真是“贫穷限制了想象力”。现在哪个大型数据中心不是要靠几十人的运维团队才能支撑,这是一项庞大的费用支出,而且还并不能保证支持好,数据中心涉及那么多学科技术,一个人完全掌握一项都不得了,怎么可能都掌握到。数据中心每天要疲于处理各种各样的问题:应用需求、扩容、变更、升级等等,复杂性增加了这里的每一项工作,要想一点错不出很困难,这也就不难想象一个数据中心百分之八十的故障都来自人为。

这么复杂的系统,没有谁能够有百分之百的把握操作能达到预期效果,不出意外。如果我们再一味这样,将数据中心按如此的方式,不断建造下去,数据中心复杂性迟早会达到人们无法想象,无法管控的阶段,让数据中心陷入无序,这样再好的技术也是白搭。数据中心复杂性已经引起了更多人的关注,很多专家和学者也在出谋划策,给出了一些超融合解决方案,试图减轻数据中心负担。现在的数据中心必须做减法,要化繁而简,不能再去一味追求规模,新技术的引入也不能增加系统复杂性,控制好数据中心复杂度,以免失控。

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2018-10-25 14:55:08
机房建设 互联网数据中心的设计与构建正在不断发展
将定制设计与工业化的过程相结合,允许根据特定的个人客户需求创建一个设施,并且可以包括Uptime Institute层级认证——用于设计和构建。事实上,可以实现的功能没有限制, <详情>
2018-10-25 11:50:54
国际资讯 Facebook公司努力突破数据中心互连“黑匣子”获得成功
大约两年前,Facebook公司公布了一个项目,其目标是与数据中心互连技术的目标是服务器、存储和网络交换机。 <详情>
2018-10-18 11:09:07
国内资讯 我国IDC市场如何大而强?政策方面仍需"五大推手"
日前,中国信息通信研究院、开放数据中心委员会联合发布《数据中心白皮书(2018年)》指出,我国IDC市场未来三年仍将处于快速发展期,白皮书建议,我国在政策方面可从五方 <详情>
2018-09-28 11:29:00
国际资讯 Facebook将斥资7.5亿美元扩建Henrico数据中心
Facebook在宣布在俄勒冈州校园增建两栋新楼的计划五天后,已经透露将扩建亨利科县的校园,在该网站上再开发三个互联网数据中心——顺便说一句,这些数据中心仍在建设中。 <详情>
2018-09-18 09:52:13
运维管理 调查表明可靠性降低导致数据中心中断事件增加
Uptime Institute的数据表明数据中心停电仍然“普遍、昂贵、可预防的,甚至可能会增加。”抛开所有的细微差别,传达给数据中心和关键IT服务运营业务的组织的信息非常简单: <详情>