如今,企业采取各种措施不让意外停机时间中断其数据中心业务。而进行电源循环测试,以主动监控系统并以有条不紊,有序的方式识别硬件故障是一种很好的措施。

由于在数据中心日常操作期间可能不会使用IT系统的所有部分,因此IT组件可能会失效或软件模块可能崩溃,但系统可能会正常运行数月甚至数年。在系统重新启动(通常意外)之前,故障可能无法显示,从而导致意外的工作负载中断和停机时间。而企业需要通过周期性电源循环测试,以识别可能出现的问题并主动解决问题。

如果没有看到任何问题,为什么要执行电源循环测试?

数据中心所采用的系统管理工具包括MicrosoftSystemCenter,SolarWinds,Nagios和Zabbix这些强大的多功能平台。几乎所有的系统管理工具都可以提供故障,配置,会计,性能和安全管理等功能,使其成为现代企业不可或缺的一部分。

但是,某些故障可能发生在硬件级别,但可能不会立即影响系统或工作负载。例如,可能在服务器的双列直插存储器模块(DIMM)中检测到存储器故障。但是,如果没有工作负载使用该内存空间,或者故障DIMM采用了故障纠正技术保护,则服务器可以继续工作,很少向系统管理报告其直接错误。在大多数情况下,现代服务器的智能平台管理界面或基板管理系统可以报告这些错误,但是该信息通常只是记录,系统及其工作负载将继续运行。

而那些未检测到的和未解决的硬件问题才是大的问题。如果意外的系统崩溃或电源中断导致计划外的系统重新启动,则系统的内部固件可能会看到这些问题并拒绝完成引导过程。例如,如果服务器的南桥芯片出现故障,并且USB或板载磁盘控制器功能未初始化或响应,则引导过程将停止,即使企业可能不使用服务器的USB端口,而是通过网络访问存储。现在,IT部门必须尝试从意外中断中恢复,并同时解决有缺陷的系统。

为了避免出这种情况,请进行定期现,并主动进行电源循环测试,以强制在低级别硬件中重新启动系统。除了在计划外中断或停机期间进行加扰,还可以使用计划的重新启动来确保数据保护,并以有组织的方式将虚拟机或存储实例迁移到目标设备之外。接下来,循环上电,并允许硬件系统完全启动,以显示潜在的未知或未解决的问题。系统电源循环通常作为组织现有关闭文档的一部分。如果在重新启动过程中出现问题,企业将采取更好的准备采取纠正措施。

应该如何接近电源循环测试,以及应该多久进行一次?

具有高质量设计的服务器可以运行多年。当企业在弹性配置(例如服务器集群)中部署这些服务器设计时,这些系统上支持的工作负载几乎是不可破坏的。事实上,强调系统弹性和正常运行时间常常导致许多组织放弃周期性的功率循环。

但是如果一个服务器或存储子系统运行了几年,你怎么知道它会正常启动?如果不知道,那么希望系统能够成功冷启动的唯一方法是定期进行测试。

电源循环测试需要什么样的依赖关系?

企业的数据中心根据需要进行电源循环测试,以便为其业务需求达到合理的置信水平。通常,可以每几个月或每年进行几次电源循环。将电源循环测试与常规灾难恢复和关闭测试保持同步,以便同时处理这两个目标可能是一个好主意。

有时,也有一些外部因素影响数据中心的正常运行,例如变电站升级改造或重要的建筑物改造,迫使企业使数据中心离线一段时间。如今,计划停机可以减少业务中断,因为企业的数据中心可以轻松地将工作负载迁移到辅助数据中心或云计算。所以任何IT团队准备处理计划内的设施关闭也应该能够进行常规电源循环。

服务器硬件有任何风险吗?

当数据中心启动和运行服务器或存储阵列时,总是有一定程度的电,热和机械应力。当允许电子元件冷却并再次升温时,可能会导致热应力,可能会导致边缘连接失效,并导致过早的系统故障。类似地,如果让老化的磁盘或冷却风扇冷却,它可能因润滑剂耗尽而卡住,并导致磁盘/风扇主轴或产生其他微妙机制的问题。

另外,还存在潜在的逻辑风险。意外的配置更改可能会使IT系统超出范围,并导致由于系统配置管理工具的警告或应用程序启动问题。例如,如果系统重新启动并尝试安装意外或未批准的修补程序,则配置管理工具可能会暂停工作负载或服务器集群启动,直到系统的批准配置恢复为止。

这样的问题是罕见的,特别是在现代的数据中心节能系统中。虽然一些IT专家认为电源循环可以减少这种故障的可能性,但是计划的电源循环测试正是沉淀,隔离和解决这些类型问题的办法。早期暴露任何问题好等到意外的电源故障或应用程序崩溃,并发现系统未正常启动的隐患。

随着数据中心使用虚拟化和群集,其工作负载将继续运行,同时识别和修复故障系统。

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2025-04-25 11:11:02
国内资讯 万国数据全国首单“数据中心持有型不动产ABS”在上交所 成功挂牌上市
本次发行是贯彻落实中央‘金融五篇大文章’要求的生动实践,通过‘持有型不动产ABS+可持续挂钩’这一创新,实现了资金用于金融数据中心核心资产收购和运营。 <详情>
2025-04-01 18:19:39
国内资讯 普洛斯中国首支数据中心基金完成募集,投资规模约26亿人民币
普洛斯推出首支数据中心收益基金,提供稳定收益和长期增长并重的投资产品,满足投资人需求。 <详情>
2025-03-26 16:35:02
国内资讯 中国移动成渝(重庆)江南数据中心正式投产
3月20日,中国移动成渝(重庆)江南数据中心(以下简称“江南数据中心”)投产暨战略合作协议签约仪式在南岸区、重庆经开区举行。 <详情>
倒计时1天 | 来服贸会参加一场贯穿AI与算力全景生态的活动
2025-09-12 13:27:07
浙江南湖(中国航信)人工智能产业园区揭牌!
2025-09-10 16:44:00
幽灵数据中心困扰美国 电力公司陷预测困境
2025-09-05 17:19:01
投资84.66亿元,新星市国信清控智算中心30000P建设项目招标公告
2025-09-05 17:17:01
福建华锐总经理林波一行到访蚂蚁集团,深入洽谈智算领域长期战略合作方向
2025-09-05 13:17:36
【ISSE国际智慧空间展】智构空间,慧聚未来 | 预登记早鸟福利发送,展会亮点抢先看!
2025-09-05 10:52:41
规划320000P、24000架,飞拓张家口智算中心一期中标候选人公示发布
2025-09-04 17:13:24
风液混合:数据中心冷却不容忽视的“中场战事”
2025-09-04 17:11:55
【9月ISSE国际智慧空间展】数据中心篇:数字基座 助力数字贸易生态
2025-09-03 16:47:32
智算中心新麻烦:AI大模型训练功率波动将危及电网?
2025-09-03 10:41:33
总投资8亿元、1300P,平潭两岸融合智算中心二期项目9月即将投产
2025-09-02 16:32:29
【数字匠人】盛达全球王鼎然:从本土到全球:以匠人精神重塑机房搬迁生态价值链
2025-09-02 16:31:12
715.5亿营收的背后,中兴通讯用“AI+算力”再造增长极
2025-09-02 16:29:06
Gartner张吟铃:算力“过剩”具有周期性和区域性
2025-09-02 12:19:12
刘烈宏:“东数西算”战略成果显著,八大枢纽节点智算规模已占全国八成
2025-09-01 16:24:22