事件回顾
相信近日大家都有关注到9月10日,阿里云新加坡数据中心火灾事件。
我们先简单的回顾一下,梳理一下事件的大致经过。
事件发生时间与地点:这起火灾发生在2024年9月10日,地点位于阿里云在新加坡的数据中心。
影响范围:火灾导致新加坡地域可用区C的网络访问出现异常,影响了部分云产品服务的正常运行。据报道,云网络的大部分产品及云安全产品在事件发生后约35分钟内完成了主动切换,但其他云产品服务仍在处理中。
应急响应:阿里云迅速启动了应急预案,工程师团队立即展开紧急处理。同时,消防人员也到达现场进行了处置。
部分进程:09月11日01:46,接当地消防要求,因消防浇水持续进行,机房开始出现积水和渗漏,电路存在短路风险,新加坡可用区C 一栋机房大楼整体紧急断电,可用区C其他大楼业务网络已陆续恢复。
最近消息:09月13日18:30,一层硬件设备正在安全迁移进行中。运维人员已获准进入二楼,完成勘查工作,在保全工作后将启动二层机器设备的安全迁移。当前新加坡区有16项异常未修复。
原因分析:据阿里云官方声明,异常因新加坡机房锂电爆炸导致火灾及升温。
此次事件再次引发了业界对云计算基础设施安全性的关注,特别是对于数据中心面临的物理威胁,如火灾等灾害的防范和应对措施。
数据中心火灾发生涉及多种因素
阿里云新加坡事件自发生以来,其背后的根本原因尚未被官方明确披露。然而,在信息不完全透明的情况下,部分“吃瓜群众”已经开始纷纷猜测,甚至对事件进行了定性,描述得仿佛亲眼所见。
众多媒体也纷纷转发,似乎形成了一种跟风现象。这其中不少参与者仅仅是出于好奇心,他们并未深入探究事件的详细原因和背景,只是盲目地跟随舆论潮流。不禁让人联想到前段时间“毒教材文化入侵”的现象。
这种盲目跟风、未经证实便下定论的行为,究竟意欲何为,是追求热点、博取关注,还是另有他因。
诚然,数据中心在现代信息社会中扮演着极其重要的角色,数据中心是存储、处理和分发大量数据的关键设施。随着云计算的普及,数据中心成为了提供云服务的基础设施。无论是IaaS、PaaS还是SaaS,都依赖于数据中心来提供稳定可靠的服务。
然而,我们查阅了大量的公开资料,近几年全球范围内的数据中心火灾事故确实时有发生,事故发生的原因也不尽相同。
如上表所示,数据中心火灾的发生涉及多种因素,包括UPS系统故障、柴油发电机问题、电气系统缺陷、外墙保温材料不当、冷却塔故障以及控制室的漏水情况等,这些原因都曾导致过火灾事故。
数据中心是一个复杂的系统,涉及多个相互关联的组件和操作流程,发生火灾的原因也是多方面的。
数据中心包含大量的电气设备,如服务器、不间断电源(UPS)、转换器等,这些设备在运行过程中可能会产生热量,存在过热和短路的风险。电气系统的设计缺陷、安装不当或维护不足都可能导致火灾。
数据中心内不仅有服务器,还有空调、电源分配单元(PDU)、电池备份系统等,每种设备都有可能因为故障或不当操作而引发火灾。
再者,环境因素及人为因素。温度和湿度控制不当可能导致设备过热或电气绝缘性能下降,增加火灾风险;操作人员的失误,如不当的设备操作、忽视安全规程等,维护人员的疏忽,如未及时更换老化的电缆或电池,均可能引发火灾。
即使是最先进的技术也有其局限性,如火灾探测系统的误报或漏报,自动灭火系统的故障等,也可能引发火灾。
数据中心起火原因不应单纯归咎于哪一项,任何一个环节的疏忽,无论是设备维护、环境控制还是安全管理,都有可能成为火灾的导火索。
各种技术路线风险等同
尽管我们尚未真正明确阿里云事件的根本原因,但这一事件无疑敦促整个行业深刻反思并加强自身基础设施的建设与安全防护。
“锂电,选用正品电芯,精密的BMS监控系统、充放电管理策略,分布式、小容量部署,配合完善的消防安全措施,并不会导致火灾的发生”,权威人士表示。
“数据中心本身设计架构,以及设备与设备的相互影响,有没有选用正品电芯,是不是分布式、小容量部署,而非集中式部署,有没有做好预防,都是影响火灾是否发生、发生后能否被有效抑制的关键因素。”
权威人士指出,“无论何种原因导致的数据中心着火,及时而有效的初期扑救,是避免火灾演变成灾难性后果的决定性因素,一旦火灾发生,迅速而有效的初期扑救完全能够将其扼杀在摇篮之中,并不会导致火势大面积的扩散,阿里云事件的情况颇为异常”。
有人说,数据中心因为锂电安全导致事故频发,这样的观点本身就站不住脚。
为什么这样说,根据大量的实际调查数据显示,在特定数据中心场景下与锂电着火相关的案例极为罕见,再加上一些保守势力的歪曲和阻碍。试想一下,作为新兴崛起的这样一种新质技术,相较于传统,案例数可想而知,将所有问题都归咎于新质技术本身,显然是歪曲事实。
锂电作为一种创新能源存储方式,不应该承担这样的不实指责。
在探讨数据中心锂电池着火事件时,我们必须认识到,锂电本身并非问题的根本所在,技术本身是成熟且可靠的。
为什么会出现上述认知误差。
首先,公众对锂电技术的了解不足,导致了对该技术的误解;其次,利益相关者在事故中的角色影响了舆论的导向。
再者,对于责任归属的担忧使得某些方面在事故发生后倾向于归咎于新技术;最后,过往的电动车负面舆论也加深了公众对锂电安全性的疑虑。
现实中存在一种现象,数据中心不采用锂电,是因为决策者担心发生事故而承担责任。
然而,我们需要明确的是,无论是采用新兴技术还是其他技术,都存在一定的风险。
从概率上讲,各种技术路线的风险是等同的,发生了即是躲避不了的。
我们不能因为对某一技术的担忧,就忽视了其他技术同样可能带来的风险。在决策过程中,我们更要全面评估各类技术的前瞻性和经济性,以及做好预防应急,忽视这些,仅仅因为担心承担责任而选择其他技术路线,并非明智之举。
让新质技术的梦想照亮更加广阔的未来
无疑,在数据中心推广新技术(不仅仅是锂电池)的过程中,确实存在一些阻挠。同样也会遭遇来自某些利益相关方的阻抗,这些阻抗在一定程度上影响了新技术在该领域的广泛应用和部署,甚至是对于话语权、舆论的把控。
任何由单一技术引发的数据中心火灾,就此对该技术采取封杀措施,都将对整个行业乃至国家的技术进步造成严重阻碍,UPS技术如是,柴油发电机技术亦如是,数据中心禁用新质技术不是最优解。
锂电新质技术在数据中心的应用无疑是一项革命性的创新,它以其高效能、低衰减和长寿命的特点,为数据中心的能源管理带来了前所未有的优化和提升。
而在汽车行业,锂电这一新质技术的应用更是我国实现汽车产业转型升级、跨越式发展的关键所在,它如同一条捷径,使得我国汽车工业在全球竞争中实现了“弯道超车”,加速了向新能源领域的迈进,展现了我国在新能源汽车领域的强大实力和无限潜力。
“橘生淮南则为橘,橘生淮北则为枳”。锂电这棵橘,要根植于适当的部署环境,施以适当的配置、保护方式,才可以结出理想的果实,而不能以传统集中式部署的平替方式直接生搬硬套。
此次阿里云事件,我们应该正视,积极呼吁相关部门加快锂电新质技术在数据中心行业标准和国家标准的制定与落地,这不仅是为了填补行业规范的空白,确保数据中心的安全稳定运行,更是为了推动我国新质产业的健康发展和行业竞争力的提升。
正如歌词中所表达的,‘我的梦,照亮了黑夜,闪耀着光芒’,新质技术(不仅仅是锂电)的发展也是这样一个照亮黑夜、闪耀光芒的梦,它是几代科研人员智慧和汗水的结晶,是他们不懈追求、勇于创新的结果。
面对数据中心的挑战,我们应该继续支持新质技术的发展,相信它能够不断突破自我,成为更加高效、可靠的能源解决方案。我们同样需要警惕数据中心对锂电新技术的扼杀,就像打压芯片一样,坚决捍卫我国科技创新的独立性和前沿性,让锂电技术的梦想照亮更加广阔的未来。