数据中心要正常运转,离不开大量的运维工作。运维的工作需要很多专业技术人才,要做好数据中心的运维需要掌握多学科、多门类的专业技能,运维的工作不强调人才对一门技术有多专、有深度,但要有广度。出于成本的考虑,数据中心不可能聘入所有专业知识领域的人才,需要的是通用人才。如何才能成为一名优秀的数据中心运维专家呢?本文就来说一说运维工作所需的知识体系架构,根据这个知识体系架构,对自己弱势的部分有针对性地学习,很快就能成为一名数据中心运维专家。

数据中心运维知识可以分为三大部分:运维技术、测试和开发和运维管理体系。先来说一说运维技术,这里边包含的技术非常广泛,按照网络层的设计可以将运维技术再分为几大部分内容。首先是客户端,包括DNS地址解析,浏览器的使用,安全策略。这部分需要掌握一些浏览器技术,知晓如何提高浏览器并发数、避免静态资源在Cookie上传;当域名解析不出来的时候,知道如何分析,确认是否是客户端的问题;其次是外部层,包括第三方CDN,云计算和外包等,CDN这种网络优化技术在数据中心应用层使用非常普及,还有云计算的基础知识要掌握,尤其是与各种外包服务交流沟通的技巧,就算自己不了解的技术也可以通过外包找到答案,善于利用这些求助对象;第三是集群技术,包括负载均衡、集群管理。掌握四层和七层的负载均衡技术,开源的LVS(IP负载均衡),商业的F5都是很好的集群技术,应该去了解学习一下,这也是优化网络流量的重要手段之一;第四是应用服务层,包括Web应用,数据层,文件存储,分布式层等。这部分与应用关系密切,业务是否正常在这方面会有很多表现,往往数据中心出现故障,第一时间就是在应用层面上表现出来,掌握这部分的一些技术,有助于快速查找问题根源。像一些业务监控接口的设计、流量分析技术、服务和安全监控手段都需要认真掌握;第五是网络层,包括从接入到汇聚、核心的所有网络技术,主要有网关设备、防火墙、路由器、IPsec VPN、三层交换、二层交换等,网络技术是数据中心里三大技术之一,是实现所有设备互联互通的基础技术,必须要认真掌握,每个数据中心别的工程师可以不用配置,但是网络工程师必须配备。除了要掌握各种网络技术,还要懂得如何监控网络,掌握各种监控软件的使用方法,利用软件实现对网络的自动监控。第六是基础服务类,包括各种管理平台:日志收集平台、自动化部署平台、Job管理平台、项目管理、电子邮件、DHCP等等,这些技术可以通过各种监控软件来完成,所以掌握这些Zabbix、Kerberos等管理软件是非常有必要的,可以利用这些软件对数据中心进行管理;第七是操作系统层,数据中心里由大量的服务器组成,这些服务器大部分是Linux的操作系统,要掌握这些系统常用的操作,这样才能完成各种应用业务部署,并可以在出现问题的时候查看服务器的运行状态;第八是基础设施层,主要是设备的上下架,IDC的托管,这里要做好对网络配置、设备标注、资产录入、操作系统安装、机房巡检等运维工作,这部分工作虽然技术含量不高,但是却是数据复杂的,容易出错,需要工作的时候认真仔细才行,这部分的数据准确性直接决定了未来运维工作的有效性,尤其是在发生故障时,如果这些基础数据是错误的,排查起来就非常慢,甚至是错误的。

运维的工作也包括测试和开发部分。数据中心经常要针对某种业务或者是网络进行性能测试、故障模拟测试、新业务开展测试等,要掌握一些常见的测试方法,并在测试时设计好测试方案,尤其要避免对数据中心正在运行的业务造成影响。运维的工作有时也需要自己做软件开发,主要是一些管理软件,可提升运维效率,减少复杂重复的人力。有很多大型数据中心都是自己开发运维软件,对整个数据中心进行自动化管理,这种可以按照自己的管理风格和喜好进行设计,方便做后期的运维。测试和开发也是运维工作的重要部分,掌握一些常用的开发软件和测试方法非常必要。

运维的工作也需要管理,掌握一些管理体系:ITSM、ITIL、IT Service CMM等等,有效提升数据中心运维的管理水平,有些数据中心聘请了一些职业经理人进行管理,其实这些人并不了解数据中心里的各种技术,但是他们会管理,可以将运维的管理做得很好,这样同样可以提升数据中心运维水平,而且这种提升是质的提升,远大于单纯地掌握专业技能的人所做的贡献。对数据中心进行管理也是一种艺术,做好了更能体现出数据中心的运维水平。

以上简单罗列了数据中心运维所需的各种技术,一个人全部掌握起来难度不小。在大型的数据中心里运维人员也被分成网络、服务器、应用、监控等几个部分,每部分的人主要掌握其负责的这部分技术。在小型数据中心就没有那么细分了,一个数据中心可能就一两人在维护,所有涉及的技能问题都要处理,这时就需要掌握知识的广度。要想在数据中心运维领域成为专家,必须要掌握以上介绍的这三方面技能,缺一不可,至少遇到问题得到知道是哪个方面的问题,自己搞不定还可以寻求专家,就怕遇到问题连这个问题是什么都说不清楚。所以,掌握运维知识体系架构就可以将问题搞清楚,就算自己搞不定,也可以说清楚,然而自己去找求资源,找到问题答案。

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2025-04-25 11:11:02
国内资讯 万国数据全国首单“数据中心持有型不动产ABS”在上交所 成功挂牌上市
本次发行是贯彻落实中央‘金融五篇大文章’要求的生动实践,通过‘持有型不动产ABS+可持续挂钩’这一创新,实现了资金用于金融数据中心核心资产收购和运营。 <详情>
2025-04-01 18:19:39
国内资讯 普洛斯中国首支数据中心基金完成募集,投资规模约26亿人民币
普洛斯推出首支数据中心收益基金,提供稳定收益和长期增长并重的投资产品,满足投资人需求。 <详情>
2025-03-26 16:35:02
国内资讯 中国移动成渝(重庆)江南数据中心正式投产
3月20日,中国移动成渝(重庆)江南数据中心(以下简称“江南数据中心”)投产暨战略合作协议签约仪式在南岸区、重庆经开区举行。 <详情>
中兴通讯发布第三代模块化间接蒸发冷却解决方案,树立数据中心绿色制冷新标杆
2025-04-29 17:08:57
面向未来 Rambus CryptoManager如何重塑数据中心安全格局?
2025-04-29 13:22:16
1年5000P!算力“国家队”京算公司树行业新标杆
2025-04-28 11:01:06
万国数据全国首单“数据中心持有型不动产ABS”在上交所 成功挂牌上市
2025-04-25 11:11:02
供需牵引,生态共筑:2025中国智算产业生态发展大会即将启幕
2025-04-25 10:02:00
智算中心面临“分水岭”:施耐德电气以四维创新驱动价值破局
2025-04-24 14:35:25
上海市启动2024年度全市算力资源摸底工作通知
2025-04-24 13:44:00
聚焦投资、技术与可持续发展——中国—东南亚数字基础设施合作论坛圆满举行
2025-04-23 17:54:00
从算力变革到AI生产力创新 首届酒仙桥论坛丨AIDC创新驱动生产力新变革论坛成功举办
2025-04-22 10:19:00
Rambus 通过新一代CryptoManager安全IP解决方案增强数据中心与人工智能保护
2025-04-16 10:55:15
油城算力攀“新峰” 丝路云网架“金桥” ——克拉玛依市算力产业发展纪实
2025-04-15 10:57:00
筑AI生产力底座 酒仙桥论坛丨AIDC创新驱动力新变革专场将于4月16日隆重举行
2025-04-11 18:26:00
26亿!普洛斯中国首支数据中心基金完成募集 AI驱动算力资产升温
2025-04-07 16:10:47
科智咨询:寒冬将尽,春山可望!AI引领中国IDC市场进入新一轮增长周期
2025-04-03 12:04:48
原创|中国智算中心建设“过剩论”的另一面
2025-04-02 11:38:00