随着信息系统规模的扩大,数据中心机房无论从面积、配套基础设施等各个方面都逐渐不能满足需求。针对这种情况,大多数供电局选择重建机房。如何将服务器、存储、网络等设备迁移到新机房,则是一个较为棘手的问题。
通过分析,发现机房搬迁存在两个难点。一是搬迁风险大,许多设备早已过保修期且比较陈旧,因此设备安全性和数据安全性的保障显得尤为重要。二是对用户有较大的影响,机房迁移对业务工作的开展影响较大,甚至是整个单位的业务中断,导致严重后果。因此,搬迁前要做好大量的准备工作,制定周密的搬迁计划,提供相应的预防措施、补救措施,大程度保证数据和应用系统的安全。
1、什么是搬迁方案
为了使搬迁对应用系统的影响降至最小,可采用在线搬迁的方式,即建立平滑的网络过渡环境,以数据存储为核心,保障网络和应用系统的稳定性、连续性,大程度缩短系统运行的中断时间。搬迁方案包括以下几个方面:
(1)设备搬迁方案,主要内容为搬迁设备统计、搬迁配套工具、搬迁日程和人员安排、搬迁后设备位置平面图。
(2)网络割接方案,包括网络割接流程以及割接前后网络拓扑变化。
(3)系统及数据备份方案,包括备份方式以及时间。
(4)应急方案,包括硬件故障、操作系统故障、数据库及应用系统故障、存储设备及数据故障应急方案。
在方案中,首先要确定需搬迁设备清单,并对设备进行分类;其次按照系统划分设备,安排合理的搬迁次序。核心系统可在周末或者工作日的晚上搬迁,非核心系统可在工作日搬迁。对于双机运行的设备可先对备用系统搬迁、调试、正常运行后,再将主机搬迁至新机房。
2、搬迁步骤
搬迁前制定通知,把搬迁过程的停机安排统一发布,然后提供一个热线电话和信息部联系,负责协调各个专业的搬迁事宜。
(1)信息发布:信息部门提前进行信息发布,告知具体搬迁时间计划。
(2)网络互连:确定新数据中心机房和旧机房的光纤线路连通.
(3)检查机房环境条件和可用性:检查新机房空调、供电、消防、综合布线等设备正常运行的条件具备,同时进行网络联通性测试,保证网络的可用性。
(4)应用管理员检查确认应用是否正常运行,主机管理员检查确认主机是否正常运行。
(5)数据备份:搬迁前,做好该系统的相关备份。
(6)确认搬迁工具到位。
(7)确认关键业务系统相关厂家提供热线支持或现场支持。
(8)应用管理员退出应用,主机管理员停运主机,再由各搬迁组进行主机的拆卸、清洁、搬迁、上架及网络/KVM接入等工作,设备搬迁过程中应做好设备的防碰撞、防灰尘、防水等,同时必须严格按照设备布局图、设备背面接线图完成设备的上架、接线等工作。
(9)主机管理员通电启动设备,并进行主机测试,应用管理员负责应用测试。
(10)设备正常运行后,各搬迁组及时更新设备及连接线的标识。
建议人员变迁和系统搬迁分期进行。即人员在新大楼办公,系统在旧大楼,人员办公稳定后,再逐步迁移系统。
3、前期准备要扎实
为了减少出错、顺利迁移,需要在搬迁前完成以下工作。
(1)检查新大楼办公区环境(电源、家具、电话、网络)是否具备。检查数据中心机房环境是否具备(装修、电源、接地、防雷、综合布线、温湿度)等。
(2)新大楼和旧大楼之间的光纤网络保障连接顺畅,用至少2对光纤将新大楼联入旧大楼的IDC数据中心网。
(3)完成设备按照局域网、城域网及IDC内部网建设要求进行搬迁及更改相应配置,从而实现新大楼局域网的搭建,并实现与城域网的联网。实现新大楼数据中心网络的搭建,并实现和城域网的联网。
(4)制定新机房服务器布局表。在搬迁前要提供详细的设备搬迁后的机柜位置摆放图、设备连线图以及物理连接图,从而大程度保证搬迁的科学有序性。
(5)各系统管理员需做好系统应急预案的准备,并根据系统情况落实是否需联系系统厂商到现场协助系统搬迁,以确保及时、妥善地处理设备搬迁可能引起的安全事件。
4、注意事项
(1)搬迁前新机房要进行光纤、双绞线的测试工作。旧机房的服务器导轨是否都与新机房机柜间柜相符合,需提前确认。
(2)应用及设备的停运、启动等操作必须严格按照现场操作规程执行;各类设备都有明确的测试方法;准备好应用软件,包括中间件、数据库、应用软件等安装程序需在搬迁前进行集中准备、归档。
(3)数据的备份在系统迁移前,如有条件一定要做好重要系统的操作系统备份(磁带机备份),确保数据的完整性和正确性。
(4)设备标签在搬迁过程中,注意对标签的保护,防止标签的脱落,尤其是服务器的小配件及螺丝,拆卸时作好标签,以免对后面的重组造成影响。
(5)设备关机并切断电源后,需等到设备内部原件充分放电后才可拆迁,以尽量减少系统搬迁过程中原件损坏的可能。
(6)责任到人,设备的运输时要登记、运输都要有专人负责。
(7)搬迁人员应戴上放静电手套,设备搬迁过程中尽量做到轻放,避免碰撞;在新旧机房外进行打包和搬迁。
(8)搬迁使用车辆应通过年检和具备相关安全合格证,驾驶员应拥有驾驶证,并有搬迁车辆驾驶经验,搬迁车辆运行前驾驶员精神状态良好。
(9)设备搬迁后必须按原接入情况进行网络及存储的接入,保证各系统设备的连接方式及运行环境保持不变。
(10)搬迁相关人员要有一个集中办公的地方,供搬迁期间办公使用。搬迁过程中出现问题时间长的情况下,需轮班作业,以保证充裕的精力和体力。
5、应对措施
搬迁过程中易引发硬件损坏、人员伤害、应用故障等三方面的风险,针对他们,至少应采取以下措施。
(1)注意观察工作人员的身体状态、精神状态,若不符合工作要求应安排合适人员替换。
(2)搬迁、拆下、安装设备应轻卸轻放、过程中要有安全监护人负责全程引导、监护。
(3)运输前先用包装纸、海绵等物品加固设备,运输路线选择较平稳路段。
(4)用UPS输出电源进行设备调试、运行等需加电操作。工作场所应安全用电,应使用安全合格的工器具,规范操作,防止误碰带电设备。
(5)编制系统重启作业指导书和系统故障应急操作票,并在搬迁前实际测试操作的可行性,以确保及时、妥善地处理设备搬迁可能引起的安全事件。
(6)搬迁设备前,检查新旧大楼间光纤通道能否正常通信;重启原大楼机房服务器,检查原大楼机房服务器节点状态、应用状态是否正常,实时数据、实时告警数据、数据库读写功能等是否正常,操作系统是否正常、磁盘空间及磁盘文件是否能正常读写;对重要的数据、网络配置等进行备份,便于及时恢复配置或数据。
(7)是系统无法启动时,逐步从应用软件、操作系统、网络配置、硬件设备等逐步排查故障。安排小型机操作系统、Oracle数据库厂家现场值班,处理意外问题。
相关阅读: