数据中心宕机会对整个企业产生负面影响,虽然首席信息官们不需要每天考虑数据中心的运营情况,但他们需要了解有关数据中心业务的一些基本要素,因为这些要素与数据中心宕机事件有关。以下就是首席信息官必须知道的关于数据中心宕机的10个问题:
1.假设数据中心明天要宕机,你会怎么做?
这是一个价值上百万美元的问题,大概很多首席信息官都回答不上来,但是,如果事前不知道数据中心存在的漏洞和缺陷,就更有可能出现业务中断的情况。首席信息官需要与经验丰富的顾问合作,利用他们的专业知识,通过新的视角来解决这个问题,这样以来至少可以审查两件事情:数据中心的设计方式和数据中心的运作方式。审查将有助于确定数据中心潜在的风险,并指出减轻潜在风险的方法。
2.你的企业是否定义了何为重大中断事故?
这里的关键定义是“重大中断”,不同规模的企业对这个定义的认识会不同,同时,定义也会因应用程序而发生变化。“重大中断”这一定义对于发现和阻止意外中断至关重要,一旦定义完成,企业就会开始跟踪,测量和传达这些定义。
3.你的企业最为关键的应用程序是什么?
我们常常会听到每个应用程序都很重要,但是每个企业都有自己定义的最为关键的应用程序和服务。例如,一家医院的网站中断并不能阻止病人得到治疗,但是一家电子商务公司的网站中断就会导致销售错误,并带来一定的损失,这是因为医院和公司定义的最关键的应用程序不同。企业一旦确定了最关键的应用程序和服务,就会根据具体的业务情况和风险承受能力,确定谁将保护它们以及如何保护它们。
4.如何衡量数据中心中断的成本?
清楚数据中心中断成本可以帮助企业做出更好的决策,通过开发一个模型来确定业务的中断成本,并根据成本来降低风险,帮助企业做出更明智的决策。企业的停电总成本可能是模糊的,因为它需要花费一定的时间去做统计。有些发电机项目和UPS升级失败,只是因为经理没有将数据中心中断成本告诉业务人员。所以,这里给出一个忠告:停电的证据和费用必须是真实的。
5. 数据中心中断造成的间接业务成本是多少?
虽然每个企业之间的成本差别很大,但都是难以量化的成本,如生产力损失,竞争优势的丧失,客户忠诚度降低,监管罚款,以及许多其他类型的损失。
6.你是否制定了程序和制度来减少数据中心的人为错误?
根据最近Uptime Institute机构的统计显示,大约73%的数据中心中断是人为原因引起的。在人们能够采用机器取代工作人员之前,解决这个问题的唯一方法是明确定义流程。目前,这个统计数字并没有随着时间的推移而改变,这表明大多数企业在这方面还有很多工作要做。同时,执行这些政策也至关重要,因为许多企业虽然有健全的政策,但没有充分执行。
7.你的数据中心安全策略是否与你的业务安全策略一致?
现在,IT部门和设施部门正在协作,并在为寻求更好的合作而努力。人们常见的问题是,企业物理安全系统需要在数据中心内运行,但企业其他部门则不需要,如果把企业安全和数据中心运营整合或共享数据,则会产生问题。
8.你是否有一个结构化和持续的应用程序?
随着业务需求的变化,企业的应用程序和服务也会发生变化。所以在数据中心中运行的所有应用程序应至少每年进行一次评估和评审,并根据业务的可靠性、性能和安全需求,为每个应用程序确定最佳类型的基础结构。
9.你的物联网安全策略是什么?
现在大多数企业已经解决或减轻了自携设备(BYOD)的威胁,物联网设备很可能成为下一个跟踪和监控的主要类别的输入设备。但是一直以来企业只监视应用程序堆栈的活动,而不监视物联网设备,而这些设备在运行企业的IT堆栈的物理基础设施(如电源和冷却系统)中起着重要作用,由于这些设备没有受到保护,数据中心中断的风险则会增加。
10.你的业务连续性、灾难恢复过程是什么?
如果你有一个非常重要的数据中心活动,那么你是否已经做好计划?活动的流程是很关键的,大多数企业在这些过程中都会进行设计、实施,并记录。如果你还没有做好计划,企业的员工是否知道他们需要做什么?然而,大多数人不了解这些过程并且没有实践经验,所以他们不知道当一个重大事件发生时该怎么办。
以上十个问题是数据中心IT运营面临的大的风险和问题。你能否回答这些问题?如果不能,现在是寻找答案的时候了。
关联阅读:
【中国IDC圈编译原创,转载请注明出处】