数据中心管理和维护人员在评估性能时,他们需要查看短期数据和长期数据的方法。关键绩效指标(KPI)提供了一种评估组件的方法,以下以存储设备为例。

数据中心工作人员必须定期评估硬件和软件性能,以帮助他们做出有关升级和人员配置的决策。关键绩效指标(KPI)是获取更多视角的有用方法,可帮助业务运营,跟踪数据中心运行状况,并监控单个组件(如存储设备)。

为确保存储设备高效可靠,数据中心管理和维护人员应该跟踪和关注数据中心的这三个主要关键绩效指标(KPI)。

(1)利用率。这显示了可以使用的存储设备容量与存储总容量的比率。低比率意味着存储容量的浪费。当利用率这个关键绩效指标(KPI)较低时,企业负责人通常会限制新的存储投资。高比率表明需要额外的容量,可以帮助业务领导者证明购买存储硬件的合理性。

(2)可用性。这是可以衡量存储设备正常运行时间与计划或期望的存储正常运行时间的比率。可以衡量主要存储子系统(例如存储服务器或存储阵列)的可用性,或者在软件定义的环境中存储池时存储层的可用性。

极高的比率表示大多数时间都可以使用特定的存储资源。随着比率下降,业务领导者可以跟踪存储问题的早期警告,这些问题可能影响工作负载可用性、用户满意度和业务收入。

(3)计划不可用性。这是实际停机时间与计划停机时间的比率。KPI为1.0表示在分配的时间范围内已完成对存储资源执行的工作。比率小于1.0表示实际停机时间少于预期。如果比率上升至1.0以上,实际停机时间将超过预期。

比率高于1.0可能表明人员配置问题、设备短缺、采购批准延迟或延长服务时间。业务负领导者经常使用这个数据中心KPI作为运营有效性的衡量标准,并且如果它一直很高,那么需要做根本原因分析。

IT和业务领导者在存储方面可能会采用更精细的数据中心KPI,例如平均故障间隔时间(MTBF)和平均修复时间(MTTR)。

MTBF是设备故障或服务问题之间的平均时间。在存储方面,这是存储系统可靠性的平均度量。随着时间的推移,平均值的的任何变化都可以提供对可能出现系统问题的有价值的洞察,这些问题可能需要更深入的调查或设备评估。

平均修复时间(MTTR)是事件发生与解决之间的平均持续时间。在大多数情况下,平均修复时间(MTTR)只是随着时间的推移被跟踪,业务领导者会查找平均修复时间(MTTR)的变化,以作为平均维修成本、员工专业知识和系统可靠性问题的间接衡量标准。

【中国IDC圈编译 未经授权禁止转载】

相关阅读:

数据中心能耗和效率问题

数据中心为什么需要持续保持警惕和维护?

用什么治疗新型数据中心运维管理之“痛”?

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2019-07-31 13:38:58
国际资讯 微软加大可再生能源投资 亚利桑那州新数据中心将主要使用太阳能
为了减少数据中心的碳足迹,微软正在加大对太阳能的投资。2023 年的时候,其数据中心有望使用 70% 的可再生能源。亚利桑那数据中心的可持续发展项目,一直受到很多人的关注 <详情>
2019-07-31 09:41:00
国际资讯 英特尔公布Q2财报:数据中心压力陡增,物联网业务实现较大增长
日前,英特尔公布了 2019 年第二季度的盈利报告,实现营收 165 亿美元,同比下降3%;净利润为 42 亿美元,同比下降 17%。报告称,下降主要出现在数据中心业务,而在客户计 <详情>
2019-07-30 15:08:00
国内资讯 投资6亿美元 谷歌在德克萨斯州建第二个数据中心
谷歌在德克萨斯投资的第一个数据中心获得批准,该数据中心目前已开始施工。 <详情>
2019-07-30 13:12:04
机房建设 数据中心机器学习如何优化运营
机器学习和人工智能是当今IT专业人员的热门话题,而在企业的数据中心,它们拥有真正的前景。 <详情>
2019-07-29 20:36:30
UPS电力 发电机组和UPS电源之间的配合问题
近年大型的数据中心的建设得到迅猛增长,将应用越来越多的大功率UPS,由于要控制UPS所用蓄电池数量,大功率UPS的后备时间基本上都是15-30分钟,这样就需要匹配发电机组,为 <详情>