二十世纪西方文化中最杰出的三大发现就是墨菲定律、帕金森原理、彼得定理了,其中墨菲定律的主要意思是只要事情存在问题,他总会发生。
先说一个近期的案例,一朋友在机房搬迁时,大部分工作都操作完毕,最后仅仅是Ddos安全设备未与安全同事确认部署效果,加上连续奋战太累就先回去休息了,以为安全攻击是较小概率事件,因此即时有问题,下午也可以很快搞定。结果在上午休息过程中,该机房某款业务就遭受到数次了大流量Ddos攻击,导致整机房业务受损严重。阿里云、青云,今年不少数据中心运营事件的产生,从某种角度来说都有墨菲定律的影子。
重视细节、重视流程
无论做变更操作还是版本发布及其他运维操作,在细心的同时严格按照流程和规范操作,比如小到变更流程、回退操作,发布流程大到运营管理和项目管理,使规范流程的意识深深的烙印在心里。无论是人为操作或者系统自动操作都有出纰漏的可能,按照规范流程操作可以有效的保护我们,使我们免于背负不必要的黑锅。
要有乐观积极心态,千万不能受负面情绪影响
在做运维过程中,任何操作都是战战兢兢、小心翼翼,若没有积极乐观的心态和强大的自信心,估计做不了几年运维,精神上就无法负荷了,肯定会被压垮,从而会导致更大的错误出现,乃至影响到自身的生活。因此,我们必须要有积极的心理暗示,强大的自信心来面对我们的工作,甚至客户、老板,只有这样才能在工作中游刃有余、稳步推动。也希望各位做运维的兄弟能够团结起来,进行资源、信息、知识共享降低运维的门槛。