一.目的
数据中心现场环境复杂,存在各种各样的风险。风险就是埋好的雷,我们需要一种行之有效的扫雷工具让它们现出原形,且在此基础上规划好风险应对措施并控制风险,以期最小化风险影响,提升人员安全意识。
二.适用范围
适用区域:数据中心园区
适用对象:基础设施运维工程师,IT运维工程师,现场资产管理员等现场运维人员
适用风险类别:与数据中心运营相关的风险。
三.危险源识别和分析方法
本程序从现场运维人员人身安全出发,总体过程如下图1所示:
图1 危险源辨识及风险控制程序
分解现场工作界面
首先对现场IT运维环境进行工作界面的分解,分为:
1.办公区域
2.拆卸缓冲区域
3.机房运维区域
4.备件存放区
识别工作界面内的危险源
针对不同工作界面,找出每个界面存在的危险源,包括工作活动中的危险源(动态)、场所内存在的危险源(静态)。动态危险源如:建设施工时被高空坠物砸中;静态危险源如:房间内未有明显标识的台阶。
在识别危险源的过程中需要考虑不同种类的危害在不同时态、不同状态可能发生的危害。(比如扶梯未来老化或破损后使用造成的人员摔伤)
2.1 不同种类:根据《生产过程危险和有害因素分类与代码》(GB/T 13861-2009),将生产过程中各种主要危险和有害因素分为四个大类,分别是
1.人的因素
2.物的因素
3.环境因素
4.管理因素
2.2 不同时态:
1.过去
2.现在
3.将来
2.3 不同状态:
1.正常
2.异常
3.紧急
针对发现的危险源,进行风险评价
首先,我们要组织对数据中心管理的风险态度、风险偏好、风险承受力、风险临界值,这是我们定量分析风险的重要因素。
这里采取的是LEC定量评价法,LEC评价法由美国安全专家K.J.格雷厄姆和K.F.金尼提出,是对具有潜在危险性作业环境中的危险源进行半定量的安全评价方法。用于评价操作人员在具有潜在危险性环境中作业时的危险性、危害性。以下是具体计算方法:
D=LEC
D为风险值;
L为发生事故的可能性大小;
E为暴露于危险环境的频繁程度;
C为发生事故产生的后果;
L、E、C的分值可以通过以下表格确定。
3.1 事故发生的可能性(L)
3.2 暴露于危险环境的频繁程度(E)
3.3 发生事故产生的后果(C)
3.4 危险源风险评价
结果分为重度危险、高度危险、一般危险、稍有危险四个等级。具体划分见下表:
对重大风险进行登记并公示
对于现存的危险源,应首先考虑予以消除或减少,然后再考虑具体的措施降低风险并进行保护。针对不同级别的危险源,应制定不同的应对策略。
4.1 一般及以下危险:现场在对应的场所进行危险源风险评价结果的公示,加强安全风险教育。
4.2 高度危险:应考虑制定并遵守相应的操作规范或应急预案。例如针对高压操作的相应操作规范或出现火灾后的消防应急预案等。
4.3 重度危险:在制定并遵守相应的操作规范或应急预案的同时,应定期考察现场人员对规范流程的了解程度,并定期进行应急演习。
通过从“人的因素”、“物的因素”、“环境因素”和“管理因素”四个综合制定风险应对策略。
发现新危险源
现场应结合实际情况对危险源进行更新,如运营环境、流程等发生变化、新增设备或危险源时,应及时结合上述方式对新的危险源进行风险评价及控制。
现场危险源识别示例(IT运维部分)
四.方法应用
在使用上述的方法时,有几点内容需特别注意:
1.充分识别现场可能存在的安全风险及危险源,保证危险源的全量发现;
2.危险源的识别过程中,应充分利用现场人员的力量,进行头脑风暴。在大家对风险源发掘的过程中,也会加深现场人员对身边潜在风险的理解;
3.危险源评价完成后应在现场进行公告和张贴,并定期进行回溯,以确保现场人员能够熟悉了解危险源评价体系;
4.某些危险源可以通过变更、改造等方式降低其危险等级。对于无法规避的危险源,现场的年度演习、应急预案等运维内容在制定过程中,应充分考虑这一类危险源,如火灾、自然灾害等场景。
5.除了指定操作规范或应急预案,数据中心的管理者可能还需要针对个别高度危险和重度危险,制定弹回计划(也就是俗称的PlanB,以便在主应急计划不起作用时采用),识别次生风险(应对风险而带来的另一个风险),监测残余风险(采取风险应对措施后仍然存在的风险),必要时可能提出变更以彻底规避风险。
五.总结
安全管理事无巨细,虽然危险源识别的过程中十分繁琐,但事前积极地管理风险,比事后补救风险造成的事故,更为经济有效。