数据中心企业常常因为运维管理人员的操作不当问题而出现硬件和网络故障等问题。那么不管是在机房还是远程运维的工作人员选择何种日常事务处理方式来高效安全工作?

数据中心如何减少人为故障发生率

(1)明确稳健的流程和文档

在数据中心进行的操作过程都应该文档化,有着明确具体的验证和实践过得程序来进行。当然在开始的时候需要数据中心管理人员花费时间和精力来创建、记录与维护这些流程和程序,建立程序库并对工作员工进行培训和学习,可以有效避免因为操作不当引起的网络问题。

(2)上岗前进行专业知识培训

数据中心工作人员应该了解电气和机械系统的基本知识,数据中心系统之间的相互关系,以及如何解决在这些类型的环境中可能出现的常见问题。此外,工作人员还应具有良好的解释能力和分析解决问题的能力。

为了建立一致的基础知识,服务供应商也应该定期培训他们的员工。McClary指出,许多数据中心设施运营商只提供短暂的工作培训,但不一定会长期进行。培训必须持续开展,而每个员工都应该对自己的教育和能力负责。

记录的流程和程序可为培训工作奠定基础。随着知识范围的不断变化和扩展,额外的培训可以确保对每个工作人员的角色,责任,以及所需技能有着敏锐的了解。

(3)日常检查和演练

数据中心员工花费时间去体验并检查数据中心设施中的所有关键系统至关重要。这些演练可以与培训工作结合起来,帮助工作人员认识到关键组成部分和任何可能出现的问题。

数据中心管理人员应该通过他们的检查来制定一些文档化的程序来帮助指导这些工作。这包括在演练期间应该检查的项目的列表,工作人员应该记录的具体参数,以及在参数结果中应采取的步骤。

通过演练可以帮助工作人员找出容易纠正的问题,防止以后出现更大的问题。

数据中心在进行租机服务时,通过手动操作来机房布线、上架服务器、安装系统、分配IP、添加硬盘等,不可避免的出现一些误操作,用户在遇到这类问题时可以督促运维工作人员仔细,同时也可以适当的理解这种错误的出现。现在比较先进的镜像和备份功能,对于数据丢失问题有一定的解决作用。

总而言之,在完美的设备没有完美的管理措施是容易发生事故的。数据中心的所有管理人员只有熟悉自己是谁,自己要做什么才能真正确保数据中心安全的运转。

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2018-03-01 14:18:25
整机柜服务器 IDC:2017年Q4全球服务器市场营收增长26.4%
据IDC全球服务器追踪报告显示,在2017年第四季度,全球服务器市场的供应商营收同比增长了26.4%,达到207亿美元。随着新型Purley和EPYC产品带动销售增长,服务器市场规模仍 <详情>
2018-03-01 12:02:33
数据中心节能 数据中心面临的能效问题
如今, 数据中心已经成为当今全球经济发展的基石。它们可以对位于个人和商业生活中心的信息进行移动、存储和分析。如果没有数据中心,人们不能这么自由地日常交流、分享社 <详情>
2018-03-01 10:43:00
国内资讯 全云化难以一步到位 云数据中心如何备战5G?
近年来电信行业一直在致力于推动数字化转型,与此同时,5G将临以及云服务、视频、IoT等业务的迅速崛起,都促使运营商加快走向全云化。然而运营商的组织结构和流程都极为复 <详情>
2018-03-01 10:32:00
国内资讯 国网江苏电力全业务统一数据中心初见成效
近日,国网江苏电力全业务统一数据中心分析域顺利完成配网运监大数据分析、信息系统应用情况分析两个新应用场景部署,并在国网大数据应用专题中发布。这是2017年江苏公司分 <详情>
2018-03-01 10:27:00
国际资讯 QTS公司扩展其在达拉斯的数据中心园区
日前据悉,美国房地产投资信托和数据中心服务提供商QTS公司正在扩建其在达拉斯的数据中心园区,计划为这个2014年开通运营的54英亩面积的园区增加32MW的电力容量。 <详情>