首页 新闻 技术 数据中心 云计算 大数据 互联网 研究报告 机房地图 IDC探营 企业名录 IDC大会 资讯大全 专题 专栏 图片

当前位置: 首页 > 数据中心 > 运维管理

数据中心维护:应该包含哪些内容?

2016-12-10 14:05  中国IDC圈  

核心提示: 拥有维护和生命周期策略的熟练运营团队是数据中心关键系统基础设施在长时间能持续提供高可用性服务交付和正常运行能力的核心。

在日前的《行业之声》中,FORTRUST公司首席运营官罗伯特o麦克拉里讨论了数据中心维护和工作方式战略,以及包括哪些内容。FORTRUST公司首席运营官罗伯特o麦克拉里主要负责FORTRUST公司的业务运营,高层建设和战略技术指导的整体监督。他开发并实施了过程控制,有效地支持了自2001年以来丹佛公司提供的持续正常运行时间和可靠性。他是数据中心行业管理和运营的领先专家之一,并被AFCOM选为入围年度数据中心经理。

2

拥有维护和生命周期策略的熟练运营团队是数据中心关键系统基础设施在长时间能持续提供高可用性服务交付和正常运行能力的核心。

根据最近的市场研究,企业在继续利用托管服务,并将其作为企业基础设施的关键部分。桑德勒研究公司预测,到2020年,全球托管市场的复合年增长率将超过12%,这是由于企业IT预算减少,以及关键应用支持和可访问性需求的上升。

随着企业越来越依赖托管服务提供商,对这些数据中心进行适当维护变得更加重要。即使是一分钟的宕机时间,也可能使企业付出数千美元的代价,并损害其在行业中的声誉,因此需要服务提供商竭尽全力确保24小时的正常运行时间是绝对必要的。

这就是强大的数据中心维护和生命周期策略在发挥作用,并成为数据中心设施流程的关键部分。但是,确切地说,客户应该问托管供应商这些维护策略会带来什么样的好处?

是什么使维护和生命周期策略如此重要?

在当前的IT环境中,停机时间不仅在成本方面代价高昂,而且还会对企业品牌的声誉造成无法估量的损害。尤其是那些支持客户服务所必需面向客户资源的托管数据中心设施更是如此。

FORTRUST公司首席运营官罗伯特o麦克拉里指出,数据中心糟糕的维护和生命周期策略是计划外停机的第二个主要原因,人为错误和容量管理不善是数据中心停机的最主要的原因。即使是最佳优化设计的数据中心,如果缺乏适当的系统维护和保养的话,也无法阻止这种情况发生。

麦克拉里在FORTRUST公司发布的高可靠性数据中心操作指南中写道:"数据中心的设计可靠性并不能弥补较差的维护和生命周期策略所带来的损失。而维护和生命周期战略是数据中心持续长期提供高可用性服务交付和正常运行时间的核心。"

不同类型的维护

当涉及到维护策略时,有一些不同的类型,托管客户应该获取有关这些过程的细节,这是至关重要的,因为它将显示托管服务提供商对数据中心设施内正常运行时间的奉献。

麦克拉里指出,这里的全面战略应包括:

定期和彻底的检查:数据中心工作人员应该不断检查数据中心的各种系统和设备,以确保它们处于正常工作状态。这包括对发电机,水温,燃料液位,气室压力,电气和机械分配系统操作参数,以及其他系统参数和配置的日常检查等。

连续测试:数据中心设施的员工还应测试特定系统,以确保其在正确的参数范围内运行。这里的过程可以包括红外线,负载测试和故障切换测试。

预测性维护:这是数据中心战略的关键部分。预测性维护利用测量和其他数据分析来识别可能指示潜在故障的任何变化,趋势或者违规行为。这样,工作人员可以在导致中断之前解决这些问题。

预防性维护:麦克拉里解释说,预防性维护的目的是"保持一件设备或部件运行在最佳水平或延长其生命周期的行动".这种类型的维护可包括过滤器或换油,以及清洁热交换器和电气系统。

纠正性维护:最后,当系统或组件需要维修或更换时,工作人员应充分利用纠正性维护流程。在正确的维护下,阻止泄漏或更换轴承或阀门。

通过包括预测性和预防性维护的策略,系统故障的可能性大大降低。这些过程使数据中心设施的工作人员能够在导致计划外或甚至计划中断之前查明和解决问题。

"不要成为一个只会等待失败的组织。" 麦克拉里建议说,"我相信,在故障前预测到设备中的问题是简单的。事实上,我相信,如果你有一个强大的维护和生命周期战略,不可预测的失败将会成为一个随机事件。"因此,定期维护对于确保关键系统正常运行时间至关重要。

生命周期策略的部分

确保设施管理人员有一个生命周期策略也是至关重要的。麦克拉里解释说,这包括预防性和预测性维护计划以及其他最佳实践,以提高设备的生命周期。在这里寻找的活动包括:

故障前更换:许多系统和组件在其使用期到期之后,将在一定的间隔时间之后进行更换。而没有更换这些设备会增加故障和意外停机的几率。

切换:类似地,某些组件需要根据特定的时间表进行切换,以确保性能和平衡。

更换:最后,客户应确保设数据心设施工作人员有一个规定正确时间更换设备的策略。

此过程可以确保关键系统在过程中不中断。

其他最佳实践

托管客户还应确保其服务提供商遵循其他维护和生命周期最佳实践。麦克拉里表示,"供应商应优先考虑预防性和预测性维护。这包括了解并将设备制造商的建议纳入其整个流程。在许多情况下,设施工作人员不应只是遵循这些建议,而是在这些建议之外,需要确保设备在最佳水平运行,并且可以延长其生命周期。客户还应该确保他们的提供商优先进行预防性和预测性维护措施,而不是纠正性维护措施。

"从长远来看,校正维护的成本要大得多," 麦克拉里写道。 "而定期的预防性维护将为企业节省更多的成本。"

此外,最好确保包括数据中心维护和生命周期过程的关键流程在内部处理,并且这些活动不会外包给第三方。数据中心设施管理者应该为外部供应商执行哪些流程提供极大的选择性。根据经验,这些整体程序中不到20%应该是外包的。

麦克拉里说:"拥有维护和生命周期策略的技术运营团队是数据中心关键系统基础设施在长时间内持续提供高可用性服务交付和正常运行时间的能力的核心。维护和生命周期战略必须是一个例行程序。这些细节和所有权都是可以复制的,而整个组织的每一级都可以确定和强调。

麦克拉里表示,FORTRUST公司已经连续提供了100%关键系统正常运行时间超过15年。



责任编辑:Archer

智·道 2016 IDC产业上市企业大会现场直播 直播详情》》

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
 

推荐专题 更多

热点图集 更多