就像任何设备一样,数据中心监控架构同样需要定期维护和测试。此外,为了适应数据中心的进化,把传感器安装好了就放手不管也是很不负责任的行为。小编在这里列举了一些关于数据中心环境监控的实践,仅供大家参考:

1、测试和维护。所有传感器都得定期测试维护,不稳定或有问题的传感器必须及时替换。有一种测试方法是看其他类似传感器的报道。当一台机架内几个传感器报告同时报告同样温度,但是有一个传感器却与其他相异,那就得检查了,当然你也得看看问题是不是来源于机架本身。

2、随时准备面对紧急状况。传感器本身不能防止紧急状况发生,所以你还要做好常规的计划,灾难恢复计划就得包含在内。你得知道数据中心运维团队是哪个,如何最快找到他们。当发生制冷故障,你得先找HVAC工程师,还得仔细描述问题。说到紧急故障,那可真是分秒必争。

3、准备好后备计划。监控系统能设置不同级别的告警。如果数据中心是在托管环境中运行,就得在服务级别的合同中指定紧急状况。托管商必须有意外事故的计划,以便面对突然发生的问题。在私人数据中心里,总有传感器监控和告警系统运作。制冷装置可能会在紧急状况发生时保证本地后备部件,即使这意味着使用临时便携制冷设备。

4、自动化恢复计划。有的监控系统整合了自动系统,一旦发生单独的机架事故,有的系统能关掉不必要的服务器。开发服务器通常有很多好处,但却用不着在正常产品过程中运行。对于任何测试服务器来说,如果不是必要的,它们都可以在紧急情况中关掉。

随着数据中心的不断进化,IT经理应该发掘更多自动化工具,来帮助环境长久运转。物理架构管理的自动化和中心化是数据中心设计运维的下一步,而关键仍然在于策略性地保持正常时间。只要提前做好机房监控,IT管理员就可以减少大量宕机危险。

关注中国IDC圈官方微信:idc-quan或微信号:821496803 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2017-07-19 15:32:09
运维管理 保护数据中心网络安全需要防止外部渗透
近年来,安全问题一直在IT行业频繁发生,WannaCry ransomware数据窃取事件发生在英国国家医疗服务系统(NHS)和"发薪日贷款公司Wonga",这让人们感到不安,因为传统的安全 <详情>
2017-07-19 15:16:49
运维管理 数据中心SDN网络的构建及通信业务与光纤引入
数据中心最重要的是要完善和建设10Gb、40Gb甚至是100Gb以太网的设施基础。软件定义网络(SDN)一直都是网络领域里的热门话题。SDN的最大好处是有可能节约网络的总拥有成本 <详情>
2017-07-19 12:06:10
国内资讯 国家大数据中心等建设提速 中心地区带动发展趋势凸显
以中心地区带动发展已经成为我国目前培育经济新动能的主要方,向记者从多个部门了解到,以北京、上海等大城市为主,我国部署了多批国家大数据中心、国家科学中心、国家制造 <详情>
2017-07-19 10:53:30
国内资讯 苹果数据中心选址贵州 数据中心规模增长几何?
7月12日,苹果宣布将投资10亿美元在贵州建立其在中国的首个数据中心,也是目前投资贵州云计算大数据行业最大的海外公司。 <详情>
2017-07-19 10:32:00
云资讯 落成西南地区首例数据中心双区布局 腾讯云计算加速
腾讯云今日宣布新增国内2大数据中心:成都第二个数据中心、广州第四个数据中心。6月13日,腾讯云宣布开放了成都第一个数据中心,今日成都二区开放之后,国内互联网云计算服 <详情>