基于机器人感知技术与人工智能算法技术开发的巡检机器人,不仅可以对环境、系统、设备进行全天候的巡检巡查,及时发现隐患、问题、故障,提出改进方案并立即处置;还可以针对涉密、防疫等人工巡检难以开展的高风险区域进行监控和诊断,实现数据中心机房的智能化运营。此外,还可以让数据中心朝着运维智能化、无人化的方向转型,以实现更安全、运营成本更低的目标。
巡检在数据中心的作用
基础设施是整个数据中心重要的组成部分,也是日常运行维护的关键。按照《数据中心基础设施运行维护标准》(GB/T 51314-2018),运行工作主要包括日常巡检、启停控制、参数设置、状态监控和优化调节,运行的主要目的是确保生产工作的安全稳定、保证质量以及性能调优;维护工作主要包括预防性维护、预测性维护和维修,维护的主要目的是提高系统可靠性、排除隐患以及延长设施的生命周期。其中,巡检是发现生产安全隐患的重要途径。
巡检周期:巡检属于运行工作的一部分,通常情况下,数据中心各专业每天都要开展4次以上的现场巡检,每周至少开展一次全专业联合巡检,每月至少开展一次园区级的深度隐患巡检巡查工作。同时,在重要节假日前、重大会议前、可预测的自然灾害发生前、上级电力系统检修前等特殊时期,还需要开展有针对性、特定范围的专项巡检工作。
巡检内容:数据中心常规巡检范围覆盖园区、电缆隧道、楼内各机房等区域,除了需要观察、记录系统的运行环境和运行参数之外,通常还需要重点关注以下几个方面:第一,蓄电池、储油区、防疫酒精等数据中心重大危险源的状况;第二,数据中心核心关键设施的运行状况;第三,功率超限、环境升温等运行数据的异常情况;第四,备品备件、应急工器具、应急物资等应急设施的齐全良好情况。
人与机器人在巡检中的作用
现阶段,数据中心巡检工作基本是以运维人员的现场巡检与平台运行数据分析相结合的方式开展。通过人的视觉、听觉、嗅觉、味觉、触觉对现场环境信息进行采集,结合平台各系统的运行数据,再根据经验进行综合判断,确定系统是否处于正常运行状态。如发现系统运行存在安全隐患或处于异常状态等情况,将找到问题所在并及时处理。人体各感官在巡检中的主要作用和感知方式如图1所示。
图1 人体各感官在巡检中的主要作用和感知方式
视觉
视觉是指通过观察,发现外界事物的明暗、颜色、数值、痕迹。
在数据中心巡检中,主要通过视觉采集来判断有无:打火、冒烟、跑气、冒水、滴液、漏液等现象,告警指示、开关、连接等状态数据变化,温度、电流、负载等运行数据变化,着火、烟雾等环境数据变化,蓄电池排酸、漏水等痕迹数据变化。
其中,状态数据和运行数据的数值已基本实现标准化和数字化,前端采集、处理和后台分析均可通过图像识别等技术由巡检机器人替代人工实现;但环境数据和痕迹数据由于采集和判断都相对复杂,即使有相应传感器,也会因为数量、质量和精准度等原因无法做出准确的分析,有可能出现误判或漏判,因此短时间内难以用巡检机器人替代人工。
听觉
听觉是指在声波作用下产生的对声音特性的感觉,主要包括振幅和频率。
在数据中心巡检中,主要通过听觉采集来判断风扇等设备声音大小是否异常、水泵和皮带等声音状态是否正常、水泵内是否含气或杂质而产生异响、泵体是否由于不平衡产生噪声和共振等,往往需要通过经验进行判断并给出结论。
现阶段,声音振幅和频率等数据已实现标准化和数字化,但对不同厂家、品牌、型号的冷机、水泵等设备在不同工况下的声音指标缺少标准化的数据,设备的异常数据缺少个性化和专业性的分类分析,在嘈杂的环境中采集到声音数据无法进行精准的分析处理,无法判断其运行状态是否正常。
嗅觉
嗅觉是指对外部气味的感觉。
在数据中心巡检中,主要通过嗅觉对运行环境的气体味道、气体浓度、刺激性等进行检查,判断是否存在由于蓄电池爬酸和漏液、制冷剂泄漏、下水道反味、烟火等引起的生产和环境异常情况。
数据中心虽然已通过动环和极早期火灾报警等系统,实现了对有害气体、氢气、硫化物、PM2.5、洁净度的检测,但是每个模块通常只能检测单项内容,且需要保持一定的检测时间,因此在集成度和精确度等问题解决之前,巡检机器人尚无法大规模应用。
味觉
味觉是指对味道的感觉。
在数据中心巡检中,通常将嗅觉和味觉结合在一起,利用两者互相作用进行综合判断,以此作为嗅觉的辅助。
触觉
触觉是指皮肤接触外部刺激产生的感觉。
在数据中心巡检中,主要通过触觉对环境的温度和湿度、电气设备的运行温度、数据机房内气流组织循环等运行状态、变化进行检查。
触觉一般不会直接发现故障或问题,但是会发现异常和隐患,需要进一步综合分析和判断。巡检机器人可以很好地完成对环境温湿度以及设备表面温度的扫描检测,特别是对蓄电池温度的检测,比人工巡检要准确很多。
第六感
人类的第六感,可以理解为对各感官采集的数据进行综合分析,并结合经验给出相应的判断。由于模型不容易建立,因此不太容易实现标准化。
在数据中心巡检中,主要利用综合分析和经验判断,发现更深层次的隐患和潜在的问题,并做出早期处置,防患于未然。
机器人替代人工的可行性分析
巡检机器人可以通过模拟人的几种感官,分别从视觉识别、传感器识别、热成像识别、声音识别等角度开展巡检工作。从巡检机器人的特点看,以下几方面工作可以很好地替代人工:已数字化的采集核对等数据检查、已模型化的数据分析与判断、重复性强或耗时耗力的标准化检查项目、人员不方便进入的高风险检查区域、常规化的现场巡查工作。
巡检方面
数据中心巡检机器人通过视觉识别、声音识别、传感器识别、热成像识别等技术,实现对视觉、听觉、嗅觉、味觉和触觉的模拟,并可以对开关、指示灯等运行数据以及声音、洁净度等环境数据进行采集。但是,这部分数据实际上都可以通过DCIM(Data Center Infrastructure Management,数据中心基础设施管理)、动环、BA(Building Automation,暖通空调自动控制)等系统进行监测和采集,现场巡检更多是对这些数据的复核和确认。
在数据中心巡检中,人体各感官的重要性以及近阶段机器人对人工的可替代情况总结如表1所示。
处置方面
巡检最主要的目的是发现系统运行、环境等存在的问题或隐患,在其转化为故障或事件前将其处理,现场第一时间的判断和处置尤为重要。在生产过程中,很多经验丰富的人对问题、隐患的判断,实质上是多维度综合分析的结果,思考过程和分析依据很难进行量化并形成标准模型,因此巡检机器人在现场即使已经采集到了相关信息,依然无法通过综合评判提出预警并立即解决,巡检的效果也会大打折扣。
数据中心运行维护的各项指标虽然已基本实现标准化,但是依然有部分内容需要结合现场情况进行判定,机器人在数据处理等方面具有很大优势,但由于缺少更灵活的机制和模型,依然无法体现其巡检的价值。
在现场处置方面,平台类的系统性操作、动环和BA系统的性能调优等,机器人都要比人处理得快速和准确;但大部分EOP(Emergency Operating Procedure,应急操作流程)类应急操作,以及分合闸、并机切换等硬件类操作,由于安全性等原因,必须人员到现场处理,因此针对此类操作问题,人工巡检在处置方面要比机器人巡检更具有及时性。
在数据中心巡检中,人与机器人在数据中心处置方面的对比见表2。
巡检机器人在数据中心的发展
在数据中心内,基础设施巡检机器人相比IT巡检机器人发展得要缓慢一些,除去对外宣传等因素,现阶段真正大规模应用的并不多,更多是作为人工巡检的辅助或者作为试点在测试,实现的功能也基本以数据采集和对比为主,离完全替代人工、减少维护人员和降低维护成本还有很大的差距。
虽然如此,数据中心巡检的智能化和无人化是大势所趋,不但可以将运维人员从常规、耗时耗力的人工巡检中解放出来,降低巡检频次和强度;还可以促进运维基础设施向智能化方向快速发展,提高运维的自动化和智能化管理水平。数据中心巡检机器人需要向以下4个方面发展。
基础数据完全数字化和关联化
数据中心作为数字化建设的基石,是各行业数字化的重要前置条件,并为新型基础设施建设起到支撑作用。但在数据中心内部,却由于精细化程度等原因,并没有实现所有基础数据的数字化。同时,也由于生产系统种类繁多、接口复杂等原因,没有实现各系统、设备之间全部数据的关联和同步,对巡检机器人的数据分析和处理精度产生一定影响,因此需要先完成全面数据的数字化和关联。
运维工作全面标准化和模型化
不同数据中心虽然所处的地理位置、气候条件不同,所采用的制冷模式、供配电方式不同,规划建设等级不同,但在整体框架和运维结构上是一致的,因此可以用标准化的运维规则加上个性化的调整进行管理。同时,为实现更安全的生产、更低的成本,可以结合实际,建立和完善人员模型、成本模型、用户模型等;也可以结合经验,建立和完善各种隐患排查、故障处理等模型,实现巡检机器人现场采集数据后的综合分析和实时处理,实现巡检的价值。
传感器技术高速发展
数据中心巡检机器人在视觉传感器等技术和精确度等方面相对较高,应用较多,但在听觉和嗅觉传感器等方面还存在精确度不足、标准化缺失等问题导致无法放心应用。同时,关键零部件成本的高低也决定了巡检机器人生产成本能否进一步下降、能否规模化普及。
人工智能技术快速应用
巡检机器人除了在路线规划、避障、控制等方面需要利用人工智能进行技术积累和优化外,在图像数据处理、音频数据处理、综合分析与决策等方面也需要用到人工智能技术。一方面结合标准化的数据进行深度学习,另一方面结合模型化的场景进行广度拓展,提高巡检机器人现场安全预警的及时性,实现可替代人工的能力。换一个角度来说,人工智能在每一个领域的突破和发展,都会对智能巡检机器人核心功能、数据管理、隐患与预警等起到推动作用。
数据中心基础设施巡检最重要的价值就是发现系统、环境的隐患和问题,并及时处理,数据采集的精度不够、分析处理能力不足都将是致命的。因此,在现阶段数据中心巡检机器人还无法完全替代人工实现规模化应用,但“责任心强”、受外界影响小、可持续工作等特点,使其成为基础设施人工巡检的很好补充。随着数据中心全面标准化、模型化,以及传感器精度、人工智能技术的提升,有充分的理由相信,数据中心巡检机器人最终将得到更多的应用,也将推动数据中心运维向着无人化、智能化的方向高速发展。