摘要: 

本文针对某数据中心在2024年多次发生的、在特定运行工况下的2台UPS并机系统空载侧输入开关烧毁事故,进行了系统的阐述与深入分析。事故复现性测试揭示了关键现象:当系统处于单台UPS带载125%负荷,而另一台UPS空载并联在线运行时,空载UPS的输入侧A、B两相会涌现高达5600A的异常环流,并伴随严重的谐波畸变,最终导致其前端断路器因内部电流互感器(CT)过热而损毁。本文通过详尽的现场测试数据,结合系统架构与运行模式,逐步剖析了事故现象,排除了系统谐振等常见因素,并将故障根源指向了空载UPS在特定并联控制策略下产生的内部环流。尽管UPS生产厂家承认其设备在此工况下存在控制策略缺陷,但未提供根本原因。基于此,本文最终得出结论,并为数据中心UPS系统的安全运行与测试规程提出了具体的优化建议,以避免同类事故的再次发生。

关键词: UPS并机系统;输入开关烧毁;异常环流;谐波分析;故障复现;控制策略

1、引言

不间断电源(UPS)系统作为数据中心、工业控制及其他关键基础设施的核心供电保障环节,其运行的可靠性与稳定性直接关系到后端负载的连续性与安全性。通常,通过并联冗余配置可以提升系统的可用性。然而,复杂的并联交互机制也可能引入非预期的运行风险。

本案例聚焦于某数据中心一套2台600kVA UPS组成的并联系统。在2024年6月24日进行的常规单机125%负荷能力测试中,首次发生了非预期现象:带载UPS运行正常,而空载并联运行的UPS其输入断路器在测试开始约8分钟后出现严重过热、冒烟,最终烧毁。初次故障因缺乏详实数据,分析受阻,断路器专家的初步判断指向谐波过大问题。

为确保供电系统的长期安全,我们在2024年9月24日第二次发生同类事故后,立即制定了周密的测试方案,并于9月26日成功复现了故障。此次测试部署了多台高性能电能质量分析仪,完整记录了故障发生前后关键节点的电气参数,为本次深入的、数据驱动的故障分析提供了决定性的依据。本文旨在系统性地呈现此次事故的分析全过程,以期为同行提供借鉴。

2、事故现象描述

2.1 系统架构与运行状态

事故系统为一个典型的模块化供电架构,包含一路市电和一路柴油发电机作为电源输入(测试时仅市电投入)。下游低压配电系统中,核心为两台并联的600kVA高频UPS。测试期间的具体开关状态与电流路径如下图所示: 

640 (20)

· 市电总进线开关合闸,柴发进线开关分断。

· 两台UPS输入开关均合闸。

· 两台UPS均启动,运行于“在线模式”并处于并机状态。

· UPS-1.1的输出开关合闸,连接至720kVA假负载。

· UPS-1.2的输出开关分断,处于空载状态。

· 同一母线段的其他馈线负载未投入。

此状态可简言之为:“一主一备”并联模式,其中“备机”UPS-1.2空载热备份。

2.2事故过程回顾

2024年6月24日及9月24日,在进行单台UPS(UPS-1.1)带729kVA(125%额定容量)假负载运行10分钟的测试中,事故重复发生。测试进行至约8分钟时,现场人员闻到强烈焦糊味,随即发现空载的UPS-1.2输入开关柜内冒烟。紧急执行分闸、卸负载、关机操作后,将断路器拉出检查,发现其底部(电源进线侧)A、B两相接线端子严重发烫,初步判断为内部过热。 

640 (21)

2.3 事故复现测试(2024.9.26)

为捕获故障本质,我们于9月26日设计了完全复现6.24工况的测试。测试系统部署了5台电能质量分析仪(FLUKE 435、YOKOGAWA WT1800等),精确布置了以下测量点(如下图):

· 测量点1: 市电总进线开关输出侧(系统总览)。

· 测量点3: UPS-1.2输入开关下游侧(故障点关键数据)。

· 测量点4: UPS-1.2输出开关上游侧(观察UPS输出状态)。

· 测量点5: UPS-1.1输入开关下游侧(带载UPS输入特性)。

· 测量点6: UPS-1.1输出开关上游侧(带载UPS输出特性)。

测试步骤严格遵循既定流程:下午送电,依次合闸中压、低压进线开关、两台UPS输入开关;启动两台UPS至并机在线模式;合上同一母线的其他馈线开关;最后合上UPS-1.1的输出开关。在系统空载运行约半小时建立稳态后,于50秒内将假负载从300kVA平稳加载至720kVA。加载约8分钟后,空载UPS-1.2的输入开关如期开始冒烟,故障被成功复现,全过程数据被完整记录。

640 (37)

3、测试数据及深度分析

3.1 加载前基准状态分析

在UPS-1.1加载720kVA负载之前,系统处于两台UPS空载并联运行状态。对比测量点1、3、5的数据,旨在验证测试接线的正确性与系统的初始平衡性。

数据分析要点:

· 总有功功率: 测量点1(总进线)为17.4kW,测量点3(UPS-1.2)与测量点5(UPS-1.1)之和约为17kW,两者基本吻合,表明电能主要消耗于两台UPS的空载运行。

· 电流与谐波: 两台UPS的输入电流(测量点3和5)幅值处于同一数量级(15-44A),电流谐波失真率(THDi)在12%-25%之间,频谱分布特征也基本一致。这是高频机UPS空载运行的典型特征。

· 初步结论: 加载前,两台UPS工作状态对称,系统基线正常,测试仪器数据可信,为后续异常分析提供了可靠的对比基准。

640 (38)

640 (39)

3.2 加载后异常状态与关键发现

加载720kVA负载后,系统电气参数发生剧烈变化,空载UPS-1.2的异常现象是分析的核心。

3.2.1 带载UPS-1.1与系统总进线(测量点1 & 5)

- 测量点1和测量点5的数据高度一致:总有功功率约765kW,总电流约1130A,功率因数接近1,THDi极低(约2.5%)。

- 解读: 这表明带载的UPS-1.1工作完全正常,其所需能量几乎全部由电网通过市电进线提供,整流器工作于理想状态。系统总进线的良好电能质量排除了电网侧存在严重问题或系统谐振的可能性。

3.2.2 空载UPS-1.2输入侧(测量点3)——故障核心

此测量点的数据揭示了事故的直接原因:

- 巨大的异常电流: A相和B相总电流高达5600A以上,而C相电流仅为57A,中性线电流为4A。这形成了极其严重的三相不平衡。

- 严重的谐波畸变: THDi高达64%-69%。谐波分析显示,2次谐波电流尤为突出,A相达863A,B相高达1274A。3次、4次等偶次和奇次谐波电流也达到数百安培量级。

- 功率反向与畸变: A相和B相有功功率为负值(-24.8kW, -159kW),视在功率异常巨大(1521kVA, 913kVA),功率因数为负且接近于零。

- 解读:

1) 异常环流: 巨大的A、B相电流主要并非流向UPS-1.2的整流器(因其空载,正常电流应很小),而是在UPS-1.2的输入回路内部(可能通过其输入滤波器、旁路电路或整流桥臂)形成了相间环流。这种环流在A-B相之间构成回路,因此C相和N线电流很小。

2) 能量回馈: 负的有功功率表明,在UPS-1.2的A、B相输入侧,存在能量从UPS端向电网侧回送的现象。这并非正常的逆变器回馈,而是异常运行状态下的表现。

3) 谐波源: 丰富的谐波,特别是强烈的2次谐波,通常与系统的不对称和非线性运行有关,这进一步印证了内部电力电子器件处于异常导通或控制失稳状态。

640 (40)

640 (66)

4、故障机理综合分析与推断

基于上述测试数据,我们进行层层递进的推理分析:

4.1 排除性分析

- 系统谐振排除: 总进线(测量点1)电流谐波含量极低,且电压总谐波失真率(THDu)未见异常升高,可排除电网侧或系统级谐振引发过电流的可能。

- 测试误差排除: 加载前后数据自洽,测量点1和5的一致性证明了测试系统的准确性。

- 断路器本体质量问题: 虽初步怀疑,但连续三起相同工况下的相同故障,且能与异常电流数据精确对应,表明断路器是在承受了远超其设计能力的异常电流后失效,问题根源在于系统运行状态而非断路器本身。

4.2 根本原因推断

所有证据均指向空载UPS-1.2的内部运行状态。在并联系统中,两台UPS的输出通过并机柜强制同步。当UPS-1.1满载时,其直流母线电压可能因负载冲击而略有波动。此时,处于在线模式但空载的UPS-1.2,其控制系统的任务是维持与UPS-1.1的精确同步,并稳定自身的直流母线电压。

推测的故障链如下:

1) 控制策略触发: 在单机重载、另一台空载的极端不平衡工况下,空载UPS(UPS-1.2)的整流器控制逻辑可能进入一个非预期的“环流运行模式”。

2) 形成通路: 该控制模式可能导致UPS-1.2整流桥的某些开关器件(例如,与A、B相相关的IGBT)以异常的时序和占空比工作,并未进行有效的整流,反而在A、B相输入电感/滤波器之间形成了一个低阻抗的环流通路

3) 电流激增与谐波产生: 该通路被系统电压激励,产生巨大的工频环流。同时,由于电力电子器件的快速开关与线路非线性,该环流被“斩切”和“调制”,产生了大量以2次谐波为主的谐波电流。

4) 过热损坏: 此高达5600A的异常电流完全通过UPS-1.2的输入电缆和其前端断路器。断路器内部的A、B相电流互感器(CT)持续承受此巨大电流,导致铁芯饱和、涡流损耗急剧增加,最终因过热而烧毁。断路器拆解结果(A、B相CT严重烧毁,C相轻微受损)与测量数据完美吻合(见下图)。

640 (67)

4.3 厂家反馈与待解问题

与UPS厂家技术专家联合会诊后,厂家承认其UPS的固件控制程序在此特定“一重一空”并联工况下存在设计缺陷,会导致系统产生不可控的环流。然而,厂家未能清晰说明该环流产生的具体电路路径和精确的触发控制逻辑,这仍然是需要深入剖析的“黑箱”问题。

5. 结论

通过对多起同类型事故的复现、测试与系统性分析,本文得出以下明确结论:

1. 直接原因: 在2台UPS并联系统中,进行单机重载(125%)、另一台空载在线的测试时,空载UPS会因其内部控制策略缺陷,在输入侧A、B相产生高达5600A的异常环流,并伴随严重的谐波失真。

2. 损坏机制: 此异常电流长期流经空载UPS的前端断路器,导致其内部A、B相电流互感器(CT)因极端过热而烧毁,是开关冒烟和损坏的直接物理机制。

3. 问题根源: 故障的根本原因在于UPS设备在特定并联冗余逻辑下的控制策略不完善,未能有效抑制或避免此种不平衡工况下的内部环流。

5.2 建议

鉴于该故障复现率极高,且UPS厂家短期内未能提供根本解决方案,为保障数据中心供电系统的安全,提出以下分级建议:

1. 立即措施(规避风险):

在所有已投运或新建的2台UPS并联系统中,严格禁止“一台带载、另一台空载在线”的运行工况。

进行单机测试时,若非测试UPS不需投入,应将其输入断路器完全分闸,使其在电气上彻底脱离系统,而非仅保持空载在线。

2. 中期措施(优化操作):

修订UPS系统测试与运维规程,明确规定在并联系统中,应尽量保持各台UPS的负载率相对均衡,避免极大的负载差异。

考虑在UPS输入回路增设高级保护继电器,监测相电流不平衡度和谐波含量,在检测到异常环流时提前告警或跳闸。

3. 长期措施(根本解决):

督促并配合UPS制造商,深入分析并升级其控制固件,从算法层面彻底解决此异常环流问题。应在厂内进行充分的极端工况测试以验证解决方案。

在未来的UPS设备招标与技术协议中,应将“在N+1并联系统中,单机满载、其余空载的运行稳定性”作为一项强制性验证要求,并要求厂家提供相关的型式试验报告。

参考文献

[1] IEC 62040-3: Uninterruptible power systems (UPS) - Part 3: Method of specifying the performance and test requirements.

[2] Fluke Corporation. Fluke 435 Series II Power Quality and Energy Analyzer User Manual.

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2025-10-15 10:45:00
国内资讯 “航空智脑”的“护身法宝”:维谛技术(Vertiv)让机场节能效率突破临界点
近日,在广州举办的“2025国际机场博览会”上,维谛技术(Vertiv)通过分享《“双碳”跑道上的高可靠引擎——创新节能技术全场景透视》,给出了完美答案。 <详情>
UPS
2023-11-03 16:51:00
UPS电力 全面验证可靠性与可维护性,华为电力模块3.0让数据中心坚定运行
上电科的八项测试,充分验证了华为电力模块3.0具备与传统供配电系统同等的安全可靠性与高效便捷性。 <详情>
2021-12-02 18:09:00
市场情报 助攻中大型数据中心转型,看山特如何与“大象”共舞
随着数据中心未来新形象的明晰,它将在新基建、各行业数字化转型中发挥更为积极的关键性作用。 <详情>
2021-11-18 13:47:43
UPS电力 山特助攻数据中心,闯关发改委红线下的“大考”
作为新基建的重要组成部分,数据中心降低能耗,加快转型,不仅是响应国家号召,体现社会责任,也是数据中心自身发展的迫切需求。 <详情>
2021-09-23 14:46:00
市场情报 重磅!科华数据喜获2021年全球UPS竞争战略创新与领导力奖
经过该权威机构独立调研和评审的层层选拔,科华数据最终凭借卓越实力脱颖而出,荣膺Frost & Sullivan 2021年最佳实践奖系列之“2021年全球UPS竞争战略创新与领导者奖”!这 <详情>