数据中心管理和维护人员在评估性能时,他们需要查看短期数据和长期数据的方法。关键绩效指标(KPI)提供了一种评估组件的方法,以下以存储设备为例。

数据中心工作人员必须定期评估硬件和软件性能,以帮助他们做出有关升级和人员配置的决策。关键绩效指标(KPI)是获取更多视角的有用方法,可帮助业务运营,跟踪数据中心运行状况,并监控单个组件(如存储设备)。

为确保存储设备高效可靠,数据中心管理和维护人员应该跟踪和关注数据中心的这三个主要关键绩效指标(KPI)。

(1)利用率。这显示了可以使用的存储设备容量与存储总容量的比率。低比率意味着存储容量的浪费。当利用率这个关键绩效指标(KPI)较低时,企业负责人通常会限制新的存储投资。高比率表明需要额外的容量,可以帮助业务领导者证明购买存储硬件的合理性。

(2)可用性。这是可以衡量存储设备正常运行时间与计划或期望的存储正常运行时间的比率。可以衡量主要存储子系统(例如存储服务器或存储阵列)的可用性,或者在软件定义的环境中存储池时存储层的可用性。

极高的比率表示大多数时间都可以使用特定的存储资源。随着比率下降,业务领导者可以跟踪存储问题的早期警告,这些问题可能影响工作负载可用性、用户满意度和业务收入。

(3)计划不可用性。这是实际停机时间与计划停机时间的比率。KPI为1.0表示在分配的时间范围内已完成对存储资源执行的工作。比率小于1.0表示实际停机时间少于预期。如果比率上升至1.0以上,实际停机时间将超过预期。

比率高于1.0可能表明人员配置问题、设备短缺、采购批准延迟或延长服务时间。业务负领导者经常使用这个数据中心KPI作为运营有效性的衡量标准,并且如果它一直很高,那么需要做根本原因分析。

IT和业务领导者在存储方面可能会采用更精细的数据中心KPI,例如平均故障间隔时间(MTBF)和平均修复时间(MTTR)。

MTBF是设备故障或服务问题之间的平均时间。在存储方面,这是存储系统可靠性的平均度量。随着时间的推移,平均值的的任何变化都可以提供对可能出现系统问题的有价值的洞察,这些问题可能需要更深入的调查或设备评估。

平均修复时间(MTTR)是事件发生与解决之间的平均持续时间。在大多数情况下,平均修复时间(MTTR)只是随着时间的推移被跟踪,业务领导者会查找平均修复时间(MTTR)的变化,以作为平均维修成本、员工专业知识和系统可靠性问题的间接衡量标准。

【中国IDC圈编译 未经授权禁止转载】

相关阅读:

数据中心能耗和效率问题

数据中心为什么需要持续保持警惕和维护?

用什么治疗新型数据中心运维管理之“痛”?

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2018-09-17 09:37:15
机房建设 除了IDC,80%的人可能都不知道还有其它几类数据中心
IDC是指为互联网企业、电商、媒体和各类网站等客户提供大规模、高质量、安全可靠的专业化服务器托管、空间租用、带宽批发以及ASP、EC等业务的场所。 <详情>
2018-09-14 17:18:18
云技术 采用多云 澳大利亚云计算市场日益成熟
数据中心运营商Polymer Connected公司总裁兼首席执行官Darren Hawkins表示,澳大利亚的云计算市场正在走向成熟,未能利用其提供的功能的组织可能会失去与竞争对手相比的优 <详情>
2018-09-14 17:04:51
机房建设 论ICT技术与数据中心的关系
ICT是信息Information、通信Communication和技术Technology三个英文单词的词头组合,是信息与通信技术相融合而形成的一个新的概念和技术领域。ICT技术已经发展近百年了,这 <详情>
2018-09-14 16:28:02
国际资讯 弗吉尼亚州丹维尔副市长建议提供最低的数据中心税率
美国弗吉尼亚州是目前世界上最大的数据中心集聚地,但到目前为止,却很少有企业来到位于小城丹维尔。 <详情>
2018-09-14 16:14:54
UPS电力 伊顿公司在美国推出紧凑型模块化9PXM系列UPS
日前据悉,美国动力管理厂商伊顿公司推出了一系列模块化UPS系统,旨在满足负载需求。 <详情>