网络是数据中心里是最为重要的组成部分,也是技术最为复杂的部分,要对网络运行进行日常维护,故障处理需要掌握不少本领才行。数据中心网络分为存储网和数据网,存储网采用的是光纤通道协议,数据网采用的是以太网协议。与以太网协议相比,光纤通道协议要简单得多,只要完成二层互通即可。以太网协议相对要复杂,各种协议标准琳琅满目,让人丈二和尚摸不到头脑,一个人要将所有协议吃透、吃精通根本不可能。那么,面对数据中心里复杂的网路世界,怎么才能做好维护呢?本文总结出了网络维护的三把斧,用好这三把斧,就有能力成为数据中心网络技术专家。
通常做网络维护工作有两大块,一是日常的检查,发现隐患及时消除;二是故障处理,出现故障能够及时恢复业务,同时还能定位出原因,避免相同的故障再出。日常的检查比较简单,就算应付了事也能过关。不过有句成语叫“千里之提,溃于蚁穴”,很多故障正是因为平时的疏忽,对各种小的隐患不重视,最终患酿成大事故。干网路维护进行故障处理,是比较有含金量的工作,也正是这样,网络故障排查专家非常受人欢迎。想要成为一名资深的网络维护专家,需要在故障分析和诊断上有手段。大多数的网络维护人员都是通过查设备、查线路、抓包、找故障点,累得烦死、掉大把头发还不能解决各种网络故障问题,这是因为没有找到这其中的门道。做网络维护要做网路设备监测、网络设备定位和故障定位报警、网络流量分析三点,这里称为三把斧。用好这三把斧头可以在网络技术世界里披荆斩棘,所向无敌。
第一把斧:网络流量分析
数据中心网络并不关心应用层的内容,只完成数据流量的交互,这样对流量的走向分析尤为重要。要对整个数据中心网络里所有链路流量进行监测,当故障发生时,能够迅速锁定故障范围和位置,这些故障最早在流量图上就可以反映出来,所以流量分析软件,对于数据中心网络维护必不可少。选择一两款使用广泛的流量分析软件部署到数据中心网络中,灵活启动不同层面(接入层、汇聚层、核心层)的网络设备进行流量信息采集,不需要改动现有的网络结构,实现对数据中心网络流量信息统计和分析功能,能够及时了解各种网络应用占用的网络带宽,各种业务消耗的网络资源,可以帮助网络维护人员及时发现网络瓶颈,防范网络病毒的攻击,并提供丰富的网络流量分析报表。学会从网络流量图中发现问题并解决问题,是网络维护的基本技能,必须要掌握。
第二把斧:网络监测分析
数据中心网络只要确保流量送达目的设备,就完成了自己的使命,这个运送过程是否有问题,需要通过监测手段来确定。一般我们判断一个网络是否有问题,往往需要借用一些探测工具,比如:PING、TRACERT、SNMP、SYSLOG等工具。通过PING和TRACERT可以快速确认故障位置和设备,以便对故障设备进行深入分析。通过SNMP和SYSLOG可以获取到故障设备运行的基本信息,很多时候通过设备报出的SYSLOG信息就可以确认设备故障的原因。很多数据中心将这些工具都固化到网络监测软件中,这样可以有效地预防或发现故障,警报将通过声音、短信、微信等方式显示报警框、发送Mail等方式及时发送相关人员,或自动运行相应的程序进行故障处理,提供全方位的告警监测、统计分析和报警定位。
第三把斧:网络故障分析
当用了前两把斧,故障分析依然没有头绪,就需要用上这第三把斧,对故障进行深入分析。这时还是要借助于从以上两点获得的网络基本情况,对故障表现有了基本了解。网络故障表现反映到PING业务上无非三个现象:不通、丢包、延迟大。三个现象衍生出来各种各样的网络问题,根据三个故障现象接着分析。首先,不通那一定是转发表项或者数据通路上出了问题,要沿路检查二三层转发表项、端口、VLAN、链路这些设备信息,看是否有设置错误的地方,再有就是不通也可能是连接设备直连的链路出现了断路,这个不仅指设备外部之间连接的链路、模块,也包括设备内部的连接,有的框式设备内部流量要经过很多块板卡,内部互连出了问题也会影响到转发,有的盒式设备,流量进入设备后,还没有处理就在端口的连接器上将报文丢弃掉了,这些都会造成不通;其次,丢包一定是转发表项不稳定或者数据通路上不稳定造成的问题,还是要将转发表项和数据通路都检查一遍,但是更加关注的是转发表项的稳定性,是否有变化,数据通路上更加关注是否有错包、MAC地址迁移、STP切换等故障表现;第三,延迟大那一定是数据通路上出现了拥塞,数据流量超过了网络通路上能提供的大带宽,这时要沿路查转发通道,看是否有拥塞丢包,端口流量是否有超线速、限速情况,这些故障会导致业务层面延迟大,延迟大对应用业务伤害蛮大的,访问体验感超级差,尤其是视频业务,会导致画面不流畅,观赏性变差。
做数据中心网络维护要用好这三把斧。这三把斧头说起来简单,可用起来就有很多门道,不同的人对此都有不同的理解,表现出来的就是每个人的网络技术水平。真正对这三把斧都理解透彻,往往需要大量时间经验积累。将每一把斧头展开谈的话,都会涉及到很多的网络技术,这需要在网络维护工作中不断地消化理解,慢慢地认识到,掌握了这三把斧,就可成为数据中心网络维护的专家。