在上个月,曾就关于创建数据中心整体监控做过激烈的讨论,讨论远未结束。在过去一个月里,当探讨关于在监控与数据中心管理方面,我收到一些不错的反馈与论点。毕竟,数据中心在此之前已默默按照原设计服务很长一段时间。一旦要合并,面临的一个很重要的问题:数据中心运营商如何“知道”监控哪些系统、设备?有没有为数据中心建立专门的环境监控指南?

我们都知道ASHRAE的推荐指南。业界专家坦言,数据中心部署对于各个组织需求是独一无二的。目前数据中心已被用来作为大数据处理、云工作负载、虚拟化等的核心,这一点确认无疑。再加上新类型的数据中心架构(如融合),会看到新的监控与管理要求等级。

目前面临的挑战——由于每个数据中心规模不同,需求不同,很难就监控管理给出统一的建议。但是无论如何,应遵守核心的环境条件。此外,其中一些环境条件可能不适用于某些规模和一些结构复杂的基础设施。

温度。测量温度始终是数据中心环境中的关键组成部分。基本上,温度范围都在规定范围内运行,通常建议最佳温度是在21℃到23℃(70℉至74℉)之间。但是,这个温度范围可能会因数据中心的使用情况而有所不同。事实上,范围可以从64.4℉到 80.6℉ ( 18℃-27℃ ) ;另一方面——取决于您的具体环境。请参看以下报告和图表:

相对湿度。如果湿度处理不好会对数据中心产生极为不好的后果。这就是为什么在不同规模的环境中必须配备符合标准的传感器。相对湿度被描述为在给定温度下样品空气中的水分比与与在该温度下样品可能含有的最大水分量的比率。推荐的相对湿度应该介于45%和60%之间。此湿度范围是数据中心和服务器设备运行的最佳湿度。

湿度。在任何数据中心都要尽可能做好水处理,尽可能避免水进入数据中心,对地板做好封堵。使用湿度传感器可以第一时间提醒相关管理员快速解决问题。

气流。保持良好的气流对温度和湿度的控制是至关重要的。良好的气流建议,要求气流速度为每秒10至13英尺/秒。避免气流混乱在气流组织管理方面是很重要的,一旦气流混乱,将会影响制冷效果。气流组织管理与数据中心规模相关。在高密数据中心,每小时的空气变化量可能比较小规模变化大几倍。

机架条件。在机架内, 重要的是监控所有上述组件以及其他组件,包括 - 机架门禁,热成像与循环气流百分比。

数据中心空调/处理器。制冷和处理数据中心环境条件的装置也需进行监控。包括进风温度和回风温度、内部湿度统计和空气损失百分比。

PDU(机柜插座)与电力状况。通过监控设备电流量,可以知道设备运行状况。这意味着要监控全部的分支电路和电源面板。

环境监控工具的整合,并使其与整体数据中心管理相结合。

另一个问题是:如果将这些因素(监控软件、数据中心管理平台)结合在一起,形成一个大平台,数据中心会发生怎样的变化呢?

毫无疑问,大型数据中心环境的方方面面必须清晰的体现在监控平台上。这不仅仅是环境信息——更能体现出服务器的性能指标。有一些工具能够结合环境监控系统来共同监测消耗、CPU、RAM以及其他重要组件。

对于大型基础设施的真正成功是来自源于数据中心团队之间的沟通。比如,听到服务器警报后,第一时间通知相关工程师,数据中心经理以及虚拟化团队成员,共同解除警报,在大家相互沟通,通力配合下共同解决情报,为数据中心运营创建一个良好的运行环境。

数据中心的整合是现在很多企业、组织正在做的,这意味着大型服务器正在执行更多的核心功能。如果系统发生任何事件,所有与该次事件相关的团队必须通力配合,为突发事件做出正确判断。

最好的建议——几个主要的系统整合后应该能共同处理供应商、客户需求以及数据中心自身设备监控。

数据中心健康运行取决于通过检测获得的各项设备检测数据,汇聚到软件平台,通过软件平台看到设备运行状况。确保将数据中心内各系统都考虑在内,通过监测这些系统运行状况,可以了解到目前工作负载会对数据中心运行是否产生压力,是否接近临界值?通过监测,可以帮助数据中心更健康的运行,同时增加数据中心灵活性。

关注中国IDC圈官方微信:idc-quan或微信号:821496803 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2017-07-26 09:19:00
国内资讯 世导大数据中心落户郑东新区
7月25日,郑州郑东新区举行世导大数据中心签约仪式,标志着世导大数据中心正式入驻郑东新区白沙大数据产业园,该项目将打造成郑州乃至河南的大数据中心。 <详情>
2017-07-26 09:08:00
运维管理 避免数据中心的停机 节省真金白银!
随着大量数据应用和业务量的激增,对大多数企业来说数据中心安全运行至关重要。然而,大多数企业低估了维护数据中心安全运行的重要性。 <详情>
2017-07-26 09:05:18
运维管理 数据中心对洪水风险应具备应急措施
随着夏季的来临,很多地方暴雨成灾。而对于一些位于洪水高发地区的英国数据中心基础设施的公司来说,这确实是一个令人头疼的问题。 <详情>
2017-07-25 18:39:05
云资讯 2017可信云大会在京召开
2017年7月25-26日,由工业和信息化部指导、中国信息通信研究院、中国通信标准化协会主办,数据中心联盟、云计算开源产业联盟、互联网医疗健康产业联盟承办的“2017可信云大 <详情>
2017-07-25 17:14:31
云资讯 云计算对数据中心行业未来发展的影响
在大数据时代的今天,面对越来越多的数据处理需求,企业的IT运营维护成本也在直线上升。各家公司都在寻找适合自己的安全可靠且能够节省成本的IT方案。因此,近年来云计算作 <详情>