具备尽快的从灾难中恢复(或最好避免灾难发生)的能力对于任何企业组织的IT基础架构规划而言都可以说是一项极为关键的因素,因为系统停机对企业组织的平稳运营存在潜在的负面影响:其会影响到企业持续的创造营收的能力以及保持员工高效工作的能力。而导致这些后果的事件则包括人为操作错误、勒索软件攻击、停电、重大灾害性天气、地震、恐怖袭击行为以及其他扰乱企业正常业务运营的事件。虽然这些类型的事件在不同地区和个别年份之间差异很大,但最近的一些例子已然突显出了问题的严重程度:

  2017年6月,负责全球范围内七分之一的集装箱运输服务的马士基航运公司,在其系统被Petya勒索软件感染后,发生了全球性的停运事故。

  2017年3月,由于亚马逊计费系统中输入错误的命令导致部分亚马逊网络服务(AWS)的服务器出现长达5小时的停机事故。

  2017年6月,英国航空数据中心的承包商拔下电源线,造成75,000名乘客的航班被取消。

  飓风伊尔玛为美国佛罗里达州的近380万客户造成了断电,其中许多客户在暴风雨之后仍然遭受长达超过一周时间的断电。

  因此,当前的IT企业组织必须采用相应的办法识别并迅速从各种能够导致关键IT系统发生故障停机中断的事件中恢复过来。而需要引起高度警惕的方面就包括:

  企业IT部门或其他相关部门的人员出现人为操作错误。

  可能发生的各种IT问题,包括诸如配置错误、无法按广告宣传的那样顺利升级、服务器故障、DDoS攻击等。

  广泛的自然灾难,如地震或风暴等。

  施工现场或电网周围偶尔会出现的较多的局部事故。

  类似勒索软件攻击的逻辑灾难。

  在理想的情况下,企业的决策者们将实施相应的灾难恢复策略,使得企业所发生的故障停机中断尽可能地不影响到最终用户。

  目前,大多数的企业决策者们都认为制定灾难恢复计划方案对他们企业的业务是“绝对必要的”。在接下来的12个月中,绝大部分决策者都将持有这种观点。

  随着时间的推移,恢复点目标和恢复时间目标正在大幅度缩短,这表明各类停机故障的快速恢复正成为企业决策者们的首要任务。此外,企业的决策者们不仅注重从故障失败中快速恢复,并且还要以尽可能少地丢失数据为优先事项。

  企业部署实施强大的灾难恢复策略计划是由多种因素驱动的。但是,具备从勒索软件攻击中尽快实现灾难恢复的能力则被大量的决策者认为是“绝对必要的”。

  灾难恢复能够确保在发生灾害后的很短的时间内实现对于所有业务应用程序的完全访问,这对于越来越多的企业决策者来说是至关重要的。

  在发生重大灾害天气、勒索软件攻击或类似破坏性事件之后,获得灾难恢复计划的预算批准通常更容易。

  当前的灾难恢复解决方案正在越来越多地转向云计算,但是大多数企业组织已经实施了混合解决方案,该方案将云计算和企业内部部署二者的最佳元素结合在一起。

  2017年10月,Osterman Research对125家员工人数在210至2,500人之间的企业组织进行了调查。这些受访的企业均已经部署了灾难恢复解决方案,建立了灾难恢复应急预案,并且确保接受调查的相关工作人员都必须了解其灾难恢复解决方案和流程。

  驱动企业制定灾难恢复策略计划的因素

  该调研发现,三分之二的企业组织认为:灾难恢复计划策略对于其业务的关键系统而言是“绝对必要的”,如下图1所示。另外,有32%的企业组织(几乎剩下的所有企业)均认为实施灾难恢复计划是“重要的”。

  图1 2017年和2018年企业受访者认为灾难恢复计划对于其关键系统的重要性

  另外,如下图5-6所示,随着时间的推移,灾难恢复变得越来越重要:到2018年底,超过四分之三的企业组织将灾难恢复计划视为是绝对必要的,而几乎所有其他公司都将认为灾难恢复计划非常重要。

  虽然灾难恢复计划是每家企业组织都应该采取的最佳实践方案,但某些重要的驱动因素则可以同时告诉企业的决策者们实施灾难恢复解决方案的重要性及其原因:

  1、恢复点和恢复时间目标越来越短

  企业需要评估一旦发生停机故障中断后,发生多少的数据丢失被认为是“可接受的”,这一点非常重要。一家企业组织可能能够承受得起在发生停机中断之后丢失大量的数据,因此,他们可以承受得起在发生停机中断之后的相当长的一段时间内建立一个恢复点目标(RPO)。但是,大多数企业组织可能会认为丢失大量数据是不可接受的,因此他们需要建立一个相对较短的RPO。换句话说,如果RPO是“x”小时,这就意味着企业愿意接受这样时长的业务活动的损失——我们的调研数据清楚地表明,随着时间的推移,这种损失越来越难以被企业容忍。

  与RPO密切相关的是恢复时间目标(RTO),其涉及到确定企业可以接受的从开始发生停机故障到最终实现恢复之间的时长。

  如下图2所示,在2017年,RTO的平均值为436分钟,对于关键系统和应用程序的平均RPO则为500分钟。然而,我们的研究发现,到2018年底,两者都将显著下降,这意味着届时两者都低于2017年末的时长的一半。甚至在评估RTO和RPO的中值时,我们发现二者的中值均从2017年的120分钟分别下降一半至2018年底的60分钟。

  图2 RTO和RPO的均值和中值在2017和2018年的比较

  2、灾难恢复计划策略被企业视为从勒索软件攻击中恢复的关键

  对于当前大多数企业组织的IT决策者们而言,处理好勒索软件的攻击是他们的首要考虑因素,因为勒索软件攻击可能会对企业组织造成非常严重的破坏性影响。过去几年来,全球范围内发生了数千起重大勒索软件袭击事件,导致了一系列的医院、航运公司、警察部门、城市政府服务机构和其他相关组织关闭或受到严重恶劣影响的事件。

  尽管理想的做法是首先防止勒索软件的攻击,但从勒索软件感染中尽快恢复的最佳方法则是进行及时的备份,以便尽可能快地将受感染的终端恢复到已知的良好状态。鉴于其具备从勒索软件攻击中修复的功能,故而有超过三分之一的受访者认为实施灾难恢复计划策略对于企业而言是“绝对必要的”,而另外46%的受访者则认为灾难恢复计划“有助于”使得他们从勒索软件攻击中恢复,如下图3所示。

  图3 灾难恢复计划帮助企业从遭受勒索软件攻击中快速恢复所发挥的作用

  3、灾难恢复在企业中的优先级正稳步提升

  该调查询问了受访者们关于他们所在企业所运营的三大最为重要的应用程序,以及每款应用程序所能够容忍的数据丢失量:“无数据丢失”,“最小量的数据丢失”或“合理量的数据丢失”。毫不奇怪,我们发现:企业组织的应用程序越是关键,他们对其发生数据丢失的容忍度就越低。

  如下图4所示,46%的受访者告诉我们说,他们无法容忍所在企业最为关键的应用程序发生数据丢失,39%的受访者表示他们可以容忍所在企业第二重要的应用程序只发生最小量的数据丢失,26%表示无法容忍所在企业第三重要的应用程序发生数据丢失。表示可以容忍发生最小量或合理程度的数据丢失的企业组织所占的比例与应用程序的重要程度成反比。

  图4 企业对于数据从其对企业而言最重要、次重要和第三重要的应用程序发生丢失的容忍度

  4、企业决策者对于关键应用程序的快速恢复需求日益提升

  当灾难恢复在高级别上被视为从故障停机中断中迅速恢复与平衡这种能力和成本的重要性时,我们发现,随着时间的推移,灾难恢复在企业的战略上变得更加重要。如下图5所示,我们发现2017年绝大多数企业组织希望将实现灾难恢复的成本与迅速从停机中恢复的能力进行平衡。到2018年底,虽然大多数企业组织都仍然会采取同样的观点,同时尽管其成本要高得多,但偏好实现快速恢复的企业所占比例将从18%显著增加到26%。

  图5 2017年和2018年企业关于灾难恢复的更全面的观点

  5、灾害天气、停电中断和勒索软件对于推动企业组织实施适当的灾难恢复计划策略非常重要

  “灾难恢复”这一术语显然强调的是相关的技术和功能在使企业组织从各种灾难如灾害性天气问题、地震、断电和其他破坏性事件中恢复的过程中所发挥的主要作用。显然,对于企业组织的决策者们而言,这些传统的灾难恢复驱动因素依然重要。研究发现,在接受调查的企业中,大约一半的企业在发生重大问题后获得了灾难恢复计划方面的预算批准,如下图6所示,只有大约十一分之一的企业在发生了这样的事故之后,对企业决策者批准实施灾难恢复计划开支的意愿方面没有任何影响。

  事实上,企业决策者们可以通过采取相关的预防措施应对灾难恢复举措,以应对破坏性事件,这表明a)大多数企业组织均认为实施灾难恢复计划对维持企业的业务连续性是非常重要的,并且b)决策者们在这方面尚未采取积极主动的策略,是因为在实际部署实施灾难恢复计划之前,先要获得改进灾难恢复的预算批准)。

  图6 当企业在遭受到诸如重大灾害天气或勒索软件攻击等重大事故后,获得灾难恢复计划的预算批准往往更容易

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2018-10-26 10:52:42
机房建设 浪潮网络智能SDN平台 数据中心网络重构之路
随着云计算、大数据、AI等新兴技术的快速发展,个性化的网络应用需求增长迅速,网络正在从关注技术和设备,逐渐向以业务、用户和体验为中心转变。 <详情>
2018-10-26 10:41:46
机房建设 数据中心机房应该如何布线,机柜布线方法详解!
机柜的作用远远要比只是放置设备的柜子要高深得多,机柜系统性地解决了计算机应用中的高密度散热、大量线缆附设和管理、大容量配电及全面兼容不同厂商机架式设备的难题。 <详情>
2018-10-26 10:04:00
机房建设 智能化的数据中心到底该如何建设?
随着AI、大数据时代的到来,数据中心的业务也不断在演变,新的技术不断的融入到数据中心。这其中,智能化的数据中心包含两方面含义。 <详情>
2018-10-26 09:28:10
运维管理 如何经济而高效地提升数据中心的容量
全球计算容量在发生变化:大中小企业正在将工作负载从自己的基础设施转移到云端,被OpEx成本模式、灵活性和几乎无限增长的空间所吸引。消费者也日益使用云(有时没有意识到 <详情>
2018-10-26 09:14:37
云资讯 微软云业务“三驾马车”齐聚中国
微软今晨发布了创纪录的一季度业绩,智能云业务是微软营收增长的主要驱动,也是微软冲击万亿美元市值的主要支撑。 <详情>