网络是数据中心里是最为重要的组成部分,也是技术最为复杂的部分,要对网络运行进行日常维护,故障处理需要掌握不少本领才行。数据中心网络分为存储网和数据网,存储网采用的是光纤通道协议,数据网采用的是以太网协议。与以太网协议相比,光纤通道协议要简单得多,只要完成二层互通即可。以太网协议相对要复杂,各种协议标准琳琅满目,让人丈二和尚摸不到头脑,一个人要将所有协议吃透、吃精通根本不可能。那么,面对数据中心里复杂的网路世界,怎么才能做好维护呢?本文总结出了网络维护的三把斧,用好这三把斧,就有能力成为数据中心网络技术专家。

通常做网络维护工作有两大块,一是日常的检查,发现隐患及时消除;二是故障处理,出现故障能够及时恢复业务,同时还能定位出原因,避免相同的故障再出。日常的检查比较简单,就算应付了事也能过关。不过有句成语叫“千里之提,溃于蚁穴”,很多故障正是因为平时的疏忽,对各种小的隐患不重视,最终患酿成大事故。干网路维护进行故障处理,是比较有含金量的工作,也正是这样,网络故障排查专家非常受人欢迎。想要成为一名资深的网络维护专家,需要在故障分析和诊断上有手段。大多数的网络维护人员都是通过查设备、查线路、抓包、找故障点,累得烦死、掉大把头发还不能解决各种网络故障问题,这是因为没有找到这其中的门道。做网络维护要做网路设备监测、网络设备定位和故障定位报警、网络流量分析三点,这里称为三把斧。用好这三把斧头可以在网络技术世界里披荆斩棘,所向无敌。

6fe7d02578ef20d099a6fa10ca302020

第一把斧:网络流量分析

数据中心网络并不关心应用层的内容,只完成数据流量的交互,这样对流量的走向分析尤为重要。要对整个数据中心网络里所有链路流量进行监测,当故障发生时,能够迅速锁定故障范围和位置,这些故障最早在流量图上就可以反映出来,所以流量分析软件,对于数据中心网络维护必不可少。选择一两款使用广泛的流量分析软件部署到数据中心网络中,灵活启动不同层面(接入层、汇聚层、核心层)的网络设备进行流量信息采集,不需要改动现有的网络结构,实现对数据中心网络流量信息统计和分析功能,能够及时了解各种网络应用占用的网络带宽,各种业务消耗的网络资源,可以帮助网络维护人员及时发现网络瓶颈,防范网络病毒的攻击,并提供丰富的网络流量分析报表。学会从网络流量图中发现问题并解决问题,是网络维护的基本技能,必须要掌握。

第二把斧:网络监测分析

数据中心网络只要确保流量送达目的设备,就完成了自己的使命,这个运送过程是否有问题,需要通过监测手段来确定。一般我们判断一个网络是否有问题,往往需要借用一些探测工具,比如:PING、TRACERT、SNMP、SYSLOG等工具。通过PING和TRACERT可以快速确认故障位置和设备,以便对故障设备进行深入分析。通过SNMP和SYSLOG可以获取到故障设备运行的基本信息,很多时候通过设备报出的SYSLOG信息就可以确认设备故障的原因。很多数据中心将这些工具都固化到网络监测软件中,这样可以有效地预防或发现故障,警报将通过声音、短信、微信等方式显示报警框、发送Mail等方式及时发送相关人员,或自动运行相应的程序进行故障处理,提供全方位的告警监测、统计分析和报警定位。

第三把斧:网络故障分析

当用了前两把斧,故障分析依然没有头绪,就需要用上这第三把斧,对故障进行深入分析。这时还是要借助于从以上两点获得的网络基本情况,对故障表现有了基本了解。网络故障表现反映到PING业务上无非三个现象:不通、丢包、延迟大。三个现象衍生出来各种各样的网络问题,根据三个故障现象接着分析。首先,不通那一定是转发表项或者数据通路上出了问题,要沿路检查二三层转发表项、端口、VLAN、链路这些设备信息,看是否有设置错误的地方,再有就是不通也可能是连接设备直连的链路出现了断路,这个不仅指设备外部之间连接的链路、模块,也包括设备内部的连接,有的框式设备内部流量要经过很多块板卡,内部互连出了问题也会影响到转发,有的盒式设备,流量进入设备后,还没有处理就在端口的连接器上将报文丢弃掉了,这些都会造成不通;其次,丢包一定是转发表项不稳定或者数据通路上不稳定造成的问题,还是要将转发表项和数据通路都检查一遍,但是更加关注的是转发表项的稳定性,是否有变化,数据通路上更加关注是否有错包、MAC地址迁移、STP切换等故障表现;第三,延迟大那一定是数据通路上出现了拥塞,数据流量超过了网络通路上能提供的最大带宽,这时要沿路查转发通道,看是否有拥塞丢包,端口流量是否有超线速、限速情况,这些故障会导致业务层面延迟大,延迟大对应用业务伤害蛮大的,访问体验感超级差,尤其是视频业务,会导致画面不流畅,观赏性变差。

做数据中心网络维护要用好这三把斧。这三把斧头说起来简单,可用起来就有很多门道,不同的人对此都有不同的理解,表现出来的就是每个人的网络技术水平。真正对这三把斧都理解透彻,往往需要大量时间经验积累。将每一把斧头展开谈的话,都会涉及到很多的网络技术,这需要在网络维护工作中不断地消化理解,慢慢地认识到,掌握了这三把斧,就可成为数据中心网络维护的专家。

关注中国IDC圈官方微信:idc-quan或微信号:821496803 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2017-05-19 12:01:44
数据中心节能 比PUE更全面 数据中心能耗新标准:ASHRAE 90.4
ASHRAE90.4p标准明确提出“建立数据中心的能源效率的最低要求:设计、施工和运行维护计划,并利用现场或非现场可再生能源”。范围包括a)新的数据中心或其部分和其系统;b <详情>
2017-05-19 11:39:00
云资讯 先于AWS晚于IBM 微软将在非洲开设数据中心
微软宣布在非洲建立首批(2个)数据中心,据悉,亚马逊AWS、Google和在非洲大陆没有任何数据中心;IBM去年在南非约翰内斯堡建立了数据中心,是首个在非洲设立数据中心的云 <详情>
2017-05-18 16:29:55
国内资讯 河北省内最大的数据中心落户保定
今天恰逢“5.17世界电信和信息社会日”,迎合今年世界电信和信息社会日“发展大数据,扩大影响力(Big Data for Big Impact)”的主题,河北省内目前最大的数据中心——中 <详情>
2017-05-17 14:00:42
国内资讯 国家旅游局数据中心中卫云基地正式揭牌
5月16日,国家旅游局数据中心中卫云基地在宁夏中关村科技产业园揭牌,标志着国家旅游局数据中心项目落户中卫。 <详情>
2017-05-17 11:52:11
国内资讯 中国国际信息通信展览会助力高性能数据中心建设
数据中心是整个大数据时代发展的基石,是具有大数据时代典型特征的云计算、大数据、人工智能等技术实现的基础装备。 <详情>