数据中心的硬件和软件升级是运营过程中不可避免的一部分工作,但组织可以采取措施确保其实施不会导致数据中心停机。在组织即将到来的升级过程中,避免停机的关键步骤是计划、测试和冗余。
数据中心的升级计划
数据中心升级的第一步是计划。首先考虑计划购买的硬件,或确保新软件版本与网络上的其他资源兼容。这个阶段的过程还涉及到如何在不中断的情况下执行升级。
传统上,数据中心升级计划意味着为组织提前通知各个系统将离线进行维护,然后通常在夜晚无人或很少有人工作时进行升级。这种方法在现代工作流程中不太可行,因为组织经常开展远程工作,并且可能在非工作时间工作。此外,全球性组织必须支持在不同时区全天候工作的最终用户。
减少数据中心升级影响的一种方法是将受影响的工作负载临时移动到公共云。一旦移动这些工作负载并重新加载路由流量,就可以开始升级过程,而不必担心组织的工作负载中断。
数据中心的升级测试
准备升级的第二步是在升级之前测试可以测试的任何内容。执行升级前测试的能力可能会因组织正在升级的内容而异,但通常可以测试某些内容。例如,如果组织计划将某个软件升级到较新版本,则可能需要在实验室环境中完成升级过程,以了解其工作原理。一旦实验室设置能够运行新的软件版本,就可以测试错误和兼容性问题。
如果组织不具备内部专业知识,请务必研究可以帮助进行配置和软件测试的服务提供商。对于规模更大或专业的升级来说,这有助于减少升级过程后必须执行的故障排除。
数据中心的冗余
人们对于冗余的讨论通常集中在容错上。即便如此,在整个数据中心升级过程中保持关键工作负载在线运行也很有帮助。例如,如果组织需要更换老旧的网络交换机,则通常会在执行更换之前通过辅助交换机建立冗余通信路径。这可以防止组织的工作负载在升级期间丢失连接。
同样,数据中心内的Windows服务器通常分组为故障转移群集。微软公司设计了Windows故障转移群集功能以支持不断升级。组织可以在整个升级过程中以允许群集保持联机的方式一次升级群集节点(不包括正在升级的节点)。将节点置于维护模式,进行离线升级,然后重新联机并退出维护模式。
然后,组织可以使用下一个节点重复此过程,直到升级每个节点。由于一次只有一个节点处于离线状态,因此所有群集的高可用性工作负载将在整个升级过程中保持联机状态。但是,在开始升级之前,必须确保群集具有足够的电源和冷却资源,以便在没有群集节点的情况下运行其工作负载。
【中国IDC圈编译 未经授权禁止转载】
相关阅读: