四年一度的世界杯足球盛宴即将进入总决赛,对于已经错过了小组赛、1/8决赛、1/4决赛,近半个月以来夜以继日奋战在数据中心的运维工程师Tony来说,此刻最渴望的就是能快速解决这些花样百出的故障问题,回家安安心心赶上世界杯的最后高潮。
对于任何企业IT工程师来说,服务器从采购到部署再到后期运维的每一个阶段都需要投入相应的精力来进行管理,任何一个IT工程师都不愿意看到服务器在使用的过程中出现故障,或者管理起来非常复杂。而如果IT系统与业务的耦合度过高往往会使得你很难放弃现有的硬件,只能以不完美的状态继续运行下去,最终成为鸡肋。这一切都是因为你没有能够实现对服务器的全生命周期管理。
数据中心的痛点:复杂度和成本
随着机房中的物理机乃至虚拟机的数量不断增加,IT系统的整体复杂性与日俱增。很多服务器管理员需要进行手动管理,而任何一个细微的错误都可能导致故障停机,甚至业务中断。管理员缺少一个统一的平台对服务器进行监控与管理,无法实现对服务器的配置、控制、自动运行、监控以及物理机和虚拟机进行评测的全生命周期的管理。
从成本角度来看,一旦业务中断将对企业造成的直接收入损失,另一方面则存在于管理复杂度的提升所带来的隐性成本增加。如果需要更换新的服务器,其采购成本也会随之大幅提高。
对服务器全生命周期360度监控管理
Forrester有统计数据显示,服务器运维成本在IT系统TCO中占比高达70%,因此,从多个角度来管理好服务器硬件的整个生命周期,是保障数据中心TCO整体降低的重要手段,数据中心需要一套完整的服务器全生命周期运维方案。
浪潮服务器全生命周期运维方案可支持从单机运维到批量自动化,从自动上架、批量监控到智能运维、故障预测,帮助IT管理员高效地部署、升级、监控和管理IT设备;无论是本地或是远程环境、带内或是带外操作,都可以提供全方位的运维方案,可轻松将服务器纳入到已有管理架构中,降低TCO维护成本。
Figure 1 服务器全生命周期运维
提高交付部署效率——浪潮服务器自动上架系统
ISIB如今大规模和超大规模数据中心越来越普及,服务器交付部署工作也随之变得复杂而繁重。浪潮服务器自动上架系统ISIB(Inspur Server Intelligent Boot), 基于PXE技术的操作系统批量部署,支持Windows Server、Redhat、CentOS、SUSE、Ubuntu等系统,解决了用户设备刚刚上架后的需要批量安装操作系统的问题;同时该软件支持带内模式下的RAID卡批量配置、BIOS批量升级、BMC批量升级功能,大幅提高部署效率,保障设备使用的平滑性。
Figure 2 浪潮服务器ISIB软件架构
实现远程轻松管理——浪潮服务器管理控制单元ISBMC
ISBMC即Inspur Server Baseboard Management Controller (浪潮服务器管理控制单元),是运行嵌入式OS的独立微处理器,它独立于服务器及其操作系统,嵌入到每一台浪潮M5新一代服务器中,可以通过带外方式监控服务器传感器状态、远程开关机和重启、访问BIOS配置或操作系统控制台信息、虚拟KVM等,并将监控到的服务器故障发送SNMP Trap、Email、Syslog告警等。
管理员可以通过Web方式进行远程管理,或通过IPMI、SNMP、Redfish、Smash CLI方式进行通讯。而在最新一代的ISBMC中,还增加了如BMC双镜像、RAID配置、BIOS配置、故障诊断、HTML5 KVM等实用功能,使整个带外管理过程轻松方便,管理员即便不在机房,也可远程进行管理,管理员将不需要24小时待在机房中饱受机房噪音的折磨。
Figure 3 NF5280M5 BMC管理单元
解决新设备的日常监管问题——浪潮物理基础设施管理平台ISPIM
浪潮物理基础设施管理平台ISPIM即Inspur Physical Infrastructure Manager,是根据市场需要自主研发的一款高可用、高性能、高可扩展、高可维护的物理基础设置管理平台。
ISPIM是面向通信、金融、互联网、政府和企业等行业数据中心的整体运维管理平台,具备资源管理、主/被动监控、实时性能监控、告警接收/推送、拓扑展示和日志收集等功能。可实现服务器、存储、交换机和防火墙等设备的统一管理,能有效地帮助企业提高运维效率、降低运维成本,保障数据中心安全、可靠稳定的运行。
Figure 4 浪潮物理基础设施管理平台架构
快速处理单台设备故障——浪潮服务器单机管理软件
ISQP浪潮服务器单机管理软件ISQP即Inspur Server Quick Provisioning,是一款用于浪潮服务器单机维护的工具,提供单机OS智能安装、RAID配置、硬件故障诊断、BIOS及BMC固件版本升级、FRU信息刷新等功能,为用户提供便利的设备升级维护功能;ISQP运行于独立的内存操作系统下,软件载体即插即用,可做到与服务器OS系统的物理隔离,保证客户的业务和数据安全。
Figure 5 浪潮服务器ISQP软件架构批量固件
快速升级——浪潮服务器带外批量运维工具ISA
浪潮服务器带外批量运维工具ISA即Inspur Server Automation,用于服务器的日常维护任务,目前包含的功能包括BIOS批量配置与升级,BMC批量配置与升级,批量服务器巡检,批量日志收集;ISA以任务的方式进行服务器的批量运维管理,同时支持任务结果的导出。
Figure 6 浪潮服务器ISA
软件架构单机管理无死角——浪潮服务器管理驱动ISMD
浪潮服务器管理驱动ISMD即Inspur Server Management Driver:运行于服务器及操作系统之上,对上层管理软件开放SNMP、CLI、Redfish等多种管理接口,兼容支持标准协议的第三方监控平台,且支持与带外BMC管理系统融合,以提供更完整的服务器单机管理能力。ISMD作为带内管理驱动,还可以管理BMC无法访问的操作系统内信息,如CPU、内存、硬盘性能状况、进程信息、RAID控制器信息等,做到单机管理无死角。
Figure 7 浪潮服务器ISMD驱动架构
故障快速诊断分析——浪潮云故障诊断系统ISCDS
浪潮云故障诊断系统ISCDS即Inspur Server Cloud Diagnostic System,可实现服务器故障的快速定位,系统面向客服、研发、测试人员,用于服务器出现故障时的日志分析,能够帮助用户实现服务器故障的精准定位,使维护人员快速解决硬件故障。
Figure 8 浪潮云故障诊断系统
服务器作为数据中心的核心组件,承载着数据中心绝大部分计算任务,其可靠性、性能稳定性以及故障之后问题定位的精准度等特性都直接影响着整个系统运行。一个高效、功能全面的服务器管理工具对于IT系统而言至关重,一个覆盖服务器全生命周期的运维方案,正是数据中心IT人员迫切需求的,浪潮服务器全生命周期运维方案已广泛应用于各类规模的企业级IT系统中,帮助客户大幅提升投资回报率,降低运维难度。