前段时间,由于数据中心电力故障,微博遭遇了“黑色一小时”;就在微博还没有从阴影中走出来的时候,饿了么机房也跟着出现了事故;再加上这段时间的先是热浪冲击,后来雷电恐吓,暴雨洗礼,一时间关于数据中心宕机的话题成为了圈内朋友们热烈讨论的话题。其中,讨论最多的就是为什么在配置双路市电并配备UPS系统的情况下还会因电力故障宕机,对此中国IDC圈采访了数据中心领域资深专家段旭。

机房宕机

既然标榜双路市电+UPS,为何还会因停电宕机?

数据中心是信息整合的核心区域,必须要有充足的电力电源保障,真正的双路供电系统,是从两个独立的变电站引入的两路电源,而两个变电站同时停电的概率极其小,所以数据中心才要求双路供电。双路市电是两路的不同的市电,当其中一路出现问题,另一路就成了“保险”。但是在实际建设过程中,很多数据中心并没有真正的双路供电。

段旭说,“这其实是三个问题。首先,需要我们认清一个问题:双路市电是否必要?目前国内以BAT为主的互联网数据中心在推动单路市电+UPS的方式,但是客观地说,BAT的做法有其业务需要的特殊性,同时,也依托于自身强有力的运维保障,才能做此想。除此之外,纵观国内外相关数据中心标准,均对高等级数据中心有双路市电的要求,并且此处所讲的双路市电,是来自不同变电站的两路市电,并不是来自同一变电站的”伪双路“。这样才能尽可能地保证在遇到紧急情况下,市电供电不发生中断。

其次,有人可能会说既然有应急发电系统和UPS系统,即便市电中断了也没有太大的问题吧?其实不然,UPS后备电池的放电时间很短,最多15分钟。在应急处置情况下,15分钟转瞬即逝,堪称黄金时间,在这15分钟里,要求运维团队发现故障、到达现场、紧急处置后进行切换,一旦一个环节出现问题,就可能导致停电宕机。

最后,也是我想认真地跟数据中心管理者说的,数据中心是个复杂的建筑综合体,平衡合规性、经济性、可用性之间的关系之后,认真地进行规划、设计、建设、运营,这样,才能真正持有并平稳运营一座可用性及安全性都不错的数据中心。“

机房UPS

70%的数据中心故障都是人为引起的?

对于这个疑问段旭表示,70%的数据中心故障都是人为引起的“这句话来自Uptime,这是对数据中心运维操作的合规性进行警示。以我之前的经验和教训来看,常见的人为故障可能发生在以下几点:第一是运维操作人员凭”经验“和”手感“走天下,认为这套操作流程我天天干,丧失了对工作和操作说明最起码的敬畏之心。这种懈怠的结果,就是发生操作失误,导致严重的后果。因此,不断更新操作说明文档,并严格按照操作程序进行操作,是运维管理者需要注意的问题。

第二是安全管控的缺失,缺乏对内和对外的安全管控策略和相关规定。

第三是标识管理的混乱,数据中心内应对所有设备进行标识管理,并确保运维操作人员在执行操作前进行核对。

应当说,为了尽量避免运维操作失误,有三个关键词,尤以最后一个最为重要。这三个关键词分别是:合规、流程化、敬畏之心。

如何多方面综合评判一家数据中心的水平?

段旭说:“评价一家数据中心的水平,应当从三个方面入手:”硬件“、”软件“、增值服务。

首先说硬件,所谓的硬件,是基础设施的水平,包括可用性水平、可靠性水平、安全性水平、能效利用水平。国内外现在已经有非常完善的各类国际性标准、国家标准和行业标准,对基础设施水平进行约定,此处不再赘述。

其次是软件,所谓的软件,是运维服务的水平,包括运维服务是否高效、安全、守规章、依流程。运维服务水平,既考验数据中心运维管理体系是否合理、有效;又考验运维服务团队的能力与经验。

再次是增值服务,所谓的增值服务,是针对不同的服务对象,所提供的有针对性的服务。举例来说,对互联网用户,可能是如何满足并保障其瞬时计算能力的需求、防Ddos攻击要求;对金融用户,可能是如何满足安全性的要求。“

数据中心宕机

运营多年的“中老年”数据中心,可能面临哪些问题?

段旭表示,目前,以北京为例,确实是有很多数据中心已经进入“中老年期”,对于这一类数据中心而言,可能存在以下两方面问题:其一,是当初的规划设计已经不满足目前市场环境需求的问题。显而易见的是,目前市场环境所需要的数据中心,应当是单机柜供电密度相对更高、能效利用水平更好的数据中心。有个很有意思的现象:最近这一年来,我所接触到的数据中心资源使用需求,都会要求单机柜供电密度在4kW或以上。这一点,很多“中老年”数据中心就输在了起跑线上。同时,能效利用水平的较低会导致企业经营成本的升高。

其二,是设备的折旧问题。这又分两个方面讲:一是正常折旧,这种情况下,按照计划更换设备就好了;二是因为运维管理的不足,导致设备提前折旧,这种情况并不鲜见,这种情况下,需要内外部评估检测,既检测设备使用情况,更评估运维水平,才能有的放矢。

对于“中老年”数据中心,应当有针对性地进行评估检测,并据此提出有效的改进计划,进行改造或检修整改。

【本文中国IDC圈原创,如需转载请注明出处】

关注中国IDC圈官方微信:idc-quan或微信号:821496803 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2017-07-28 15:04:03
市场情报 一切用实力证明,阿尔法特入围第二十二期节能产品政府采购清单
日前,国家财政部、发改委联合公布了“第二十二期节能产品政府采购清单”。深圳市阿尔法特网络环境有限公司(简称阿尔法特)作为数据中心领域的杰出厂商,旗下“机房单元式 <详情>
2017-07-28 15:00:17
市场情报 把握趋势,超前布局,阿尔法特渠道拓展及大客户挖掘双管齐下
随着先进信息技术的广泛应用及市场的快速发展,数据中心行业格局发生转变,如何做好市场战略成为数据中心厂商实现更大发展的关键因素。面对行业发展的全新趋势,数据中心厂 <详情>
2017-07-28 14:51:10
国际资讯 Visa为促进货币无纸化 新建两个数据中心
由于信用卡数量的增多和移动支付需求的上升,世界上最大的信用卡和旅行支票组织Visa将开设两个新的数据中心,一个在伦敦,另一个在新加坡。 <详情>
2017-07-28 14:40:00
云资讯 Oracle公司希望其云计算在数据中心内成长
Oracle公司采用了与其最大的竞争对手不同的混合云方法,大大加强了其在客户端称为Oracle云的内部部署云产品的功能。它使企业能够使用其云服务,也可以在自己的数据中心内运 <详情>
2017-07-28 14:31:08
大数据资讯 谷歌表示人工智能将在数据中心运营有所作为
日前,谷歌公司工程副总裁Ben Treynor Sloss表示,其全球在线服务的庞大数量的数据中心将很快在人工智能的帮助下运营。这一预测是基于机器学习系统的计划所确定的,这个系 <详情>