从电力中断到恶劣天气再到网络犯罪,灾难可能随时发生。但是,无论威胁如何,互联网数据中心都应始终保持正常运行状态。为了确保在紧急情况下的正常运行时间,组织必须有一个经过深思熟虑的灾难准备计划,以恢复生产力,并快速完成。
虽然停电一直是数据中心经理关注的问题,但这些事件已经变得越来越普遍。最近的Uptime Institute报告指出混合IT的复杂性导致许多组织陷入困境。调查显示,虽然平均数据中心正在更好地利用其能源,但更容易遭遇停电。这些中断也比去年更具破坏性。
随着数据中心发现自己更容易受到停机威胁的影响,因此退一步评估当前的灾难恢复程序显得非常重要。在本文中,我们将探讨数据中心和IT专业人员可以做些什么来推动持续正常运行时间。
呼叫备份
在大多数数据中心环境中,防止停机的第一步涉及使用可靠的不间断电源系统(UPS),通常与备用发电机配合使用。这些系统可帮助组织避免数据丢失并防止硬件损坏,在发生电力事件的情况下为网络和其他应用程序提供可用性。由于这些系统对业务连续性非常重要,因此在评估其部署过程中的特性和功能时要小心谨慎。
组织使用UPS时考虑的主要因素之一是弹性。例如,在紧急情况下需要多少电池备份时间来关闭系统或切换到备用发电机?冗余是另一个因素。保护UPS有助于确保备用电源始终可用; 如果单个模块出现故障或需要脱机进行维修,冗余UPS系统仍能提供足够的电力。
在评估备灾时,考虑如何将电力输送到关键设备也很重要。在某些情况下,数据中心经理可能只是将负载直接插入其UPS中。在其他情况下,可以部署配备有多个输出的配电单元(PDU)来分配电力,这在机架环境中或者与位于数据中心内的网络设备特别有用。
正确的监控方式
在没有电动管理软件的情况下操作UPS就像在没有挡风玻璃刮水器的雨中驾驶,您可能会受到保护免受倾盆大雨的影响,但您无法清楚地看到东西。UPS解决方案与监控和管理软件相结合,是数据中心经理获得增强可见性的完美补充。
当今领先的电源管理软件解决方案提供的大好处之一是能够与通用虚拟化平台集成。这些系统提供了在物理或虚拟环境中监控和管理电源设备所需的工具,允许用户远程监控,管理和控制组织网络中的UPS和其他设备,从而帮助确保正常运行时间和数据完整性。UPS可以与管理程序一起使用,在设施断电或恶劣天气事件期间自动启动到灾难恢复站点的数据迁移。从查看事件历史记录并提供警报到提供实时状态和自动解决问题,这些工具可用于帮助保持关键设备的运行。
一些解决方案还利用预测分析服务的进步,这可以帮助组织将电力监控策略从被动转变为主动。通过收集和分析来自连接的电力基础设施设备的数据,该解决方案使员工能够预测关键电力组件发生之前的故障。可以在方便的时间安排维修或更新,避免紧急服务电话,并使用方便的维护窗口。而且,随着这些系统变得更加先进,它们将实现对组织的整个电力基础设施(包括UPS,PDU和跨多个供应商和平台的其他集成电力系统)的更加集中,高效的管理。
不要忘记那些检查
为避免意外故障,车辆需要定期进行预防性维护,包括常规换油和调整。确保UPS和其他电源管理系统的持续最佳性能大致相同。
最近的一项研究表明,伊顿公司对经历负荷损失的UPS的周边服务进行了记录。该研究发现,每年进行两次预防性维护访问的客户发生负载丢失事件的可能性是计划外停机时间的四倍。
定期服务访问可以帮助检测各种疾病,避免它们成为严重且成本高昂的问题。经过培训的技术人员可以在服务呼叫期间通过检查、评估UPS、测试电池以及检查其他关键组件(如风扇、电容器和内部连接),使数据中心经理通过检查。如果数据中心有发电机,那么定期测试这些发电机也很重要,以确保在发生长时间停电时能够获得持久的应急电源。
展望未来
最终,很多人都乘坐数据中心的电气系统。意外断电会对运营造成破坏性影响,并且会耗费大量资金。为了优化电力系统并避免停机的危险,组织及其IT团队需要做好防御准备。通过利用集成的电源备份解决方案,再加上日常服务检查,数据中心将为可能发生的意外事件做好准备。
相关阅读: