中国IDC圈1月9日报道,1月5-7日,第十届中国IDC产业年度大典(IDCC2015)在北京国家会议中心隆重召开。本次大会由中国信息通信研究院、云计算发展与政策论坛、数据中心联盟指导,中国IDC产业年度大典组委会主办,中国IDC圈承办,并受到诸多媒体的大力支持。
中国IDC产业年度大典作为国内云计算和数据中心领域规模大、具影响力的标志性盛会,之前已成功举办过九届,在本届大会无论是规格还是规模都"更上一层楼",引来现场人员爆满,影响力全面覆盖数据中心、互联网、云计算、大数据等多个领域。
英特尔亚太研发有限公司数据中心软件方案部研发总监王军出席IDCC2015大会并在数据中心设施与运营论坛发表主题为《软件定义的云数据中心基础架构敏捷管理》的精彩演讲。
英特尔亚太研发有限公司数据中心软件方案部研发总监王军
以下是演讲实录:
王军:各位朋友大家上午好!我我叫王军,来自于英特尔亚太研发有限公司。我领导的团队主要是针对全球的一些数据中心客户进行基础架构管理方面的一个工作。包括基于平台的基础创新,一些软件产品与方案的研发,以及针对我们的一些合作伙伴,包括ISV、OEM、ODM,以及SI,还有我们的一些终端客户进行支持与服务。今天我非常荣幸能够跟大家在这儿进行关于云数据中心基础架构的敏捷管理进行一些交流。
刚才我进会场的时候我发现大概超过一半,或者超过一半的要么正在看手机,要么刚刚看完,要么正准备低头去看,其实这个一点都不奇怪,中国已经进入一个完全的“互联网+”的时代。我们每天都离不开各种各样的智能终端,包括相应的一些应用。那么,我想问大家一个问题,大家知道每增加大概多少部智能手机就需要相应的增加一台服务器来满足它的移动应用。其实我也不知道这个具体数据,根据英特尔2013年的研究报告,大概每增加400部智能手机就需要增加一台相应的服务器满足它的移动应用。
随着中国进入“互联网+”的时代,计算无处不在,尤其随着各种各样智能终端的快速增长,包括智能手机,平板电脑以及各种各样的物联网传感设备,同时随着各种移动应用的快速增长,这些都对我们数据中心的计算、存储、网络带来一个巨大的需求。同时,这也为我们数据中心的基础架构带来一个巨大的挑战。
那么,开放的云生态环境,为这种巨大的移动需求,为数据中心带来的挑战,提供了很好的架构支持。开放的云生态环境主要包括整个上层的软件,架构层,以及底下的硬件基础架构层,硬件基础架构层包括IT设备层,以及运维设施层。对于软件架构层,我今天并不是进行专门的交流,有专门的分论坛有更深,更短的交流。基本的特征就是开放、灵活、高效、套用我们软件开发里面一个比较时髦的词敏捷性。软件与硬件息息相关。硬件的敏捷性同样适用于我们硬件的基础架构层,硬件层跟软件层相比在部署、更新以及增长方面相对来说有更大的挑战。所以,今天我的话题主要是关于数据中心基础架构的一个敏捷性。
为什么把IT基础架构层和运维设施层作为一个层面,我们认为只有把IT基础架构层和运维设施层当做一个整体来考虑,才能对整个硬件的基础架构层才会有更高效、更敏捷的管理。当然,把整个云生态环境分成软件层云,硬件本身也是一种割裂,只有真正把软件层跟硬件层当做一个整体来考虑,才能对我们整个的硬件基础架构层的管理进行更高效、更灵活的管理。后面我们可以谈到这方面的问题。
具体这种快速增长的移动应用对数据中心的基础架构层的管理带来什么样的挑战?根据英特尔跟我们合作伙伴的研究报告,主要整个有三大挑战。第一、关于数据中心的管理效率。这包括人均可维护的服务器台数,以及对于灾难恢复的水平。那么,随着应用的快速增长,数据中心也会快速增长,这样的挑战会变得越来越大。第二、关于业务的上限能力。这包括能够快速、迅速的、敏捷的对我们数据中心的基础架构进行扩张,也包括我们对于数据中心的一个容量的预测,能够比较智能化的预测数据中心的一个增长,这样能够便于我们数据中心的迅速扩张,来满足我们新应用的出现。第三、关于高能耗。那么,大家知道前面有嘉宾也谈到能耗的挑战问题。现在能耗已经变成数据中心运维的一个主要的成本之一,在不久的将来,它甚至会占到整个数据中心运营管理的一半以上。
那么,针对三大挑战,具体对我们数据中心带来什么样的新的需求呢?首先整个数据中心架构要开放,不能只局限于某一家品牌的产品。包括单一的管理协议,管理标准。灵活、易扩展,顾名思义整个数据中心基础架构要宾得非常的灵活,非常容易扩展,满足新应用的快速增长。高效、低成本,随着数据中心的快速扩张,能源和人力已经变成了最主要的一个成本,我们必须采用相应的一些技术与方案,能够对能源进行更灵活、更高效的管理,以及提高我们的数据中心管理效率,降低人力资源成本。快速响应、稳定可靠,包括提供很好的健康管理机制,保障我们数据中心健康、稳定的运行。
那么,针对数据中心这样的一些挑战以及现在这些需求,目前我们数据中心管理的一些现状到底如何呢?根据英特尔去年对于大概200家数据中心,主要是美国与欧洲的调查报告显示,目前数据中心基础架构的管理在很多方面不尽如人意。比如说数据中心管理人对整个数据中心缺乏全面的数据了解,也缺乏基于数据的对数据中心架构的进一步的一些分析、优化,以及更缺乏智能化的一些管理策略,对数据中心的基础架构实现智能化的自动控制。
英特尔作为一家业界领先的计算平台架构提供商,我们不仅仅提供针对计算、存储、网络,提供高性能的芯片,同时也结合我们对于英特尔平台的创新技术,创新能力,以及我们对于整个数据中心管理的了解,结合我们广泛的一些合作伙伴,为数据中心基础架构的管理提供完整的解决方案。
方案主要从三个层面:第一个层面,基于英特尔平台技术的创新能力。我们提供了管理架构,基于这个管理架构提供了相应的一些技术,比如说针对能源管理提供了专门的技术,包括还有PITAS(音译)技术。针对下一代英特尔平台我们会提供一种全新的管理架构,基于这个管理架构,我们的一些合作,第三方厂商,包括IDV、ISV、OEM能够基于这个架构提供更多的技术创新,为数据中心的架构管理提供更多的一些可能。
那么,对于健康管理,我们下一个平台也会提供一种新的管理技术,它能够对数据中心的计算架构,计算平台提供更好的健康预测,隔离以及恢复。
同时,英特尔提供了一种全新的计算架构,重新定义数据中心里的计算、IO,包括其他的一些相应的计算单元。比如说叫做RACSCALL(音译),这是全新的计算架构,能够把我们的计算节点、存储、网络、IO完全在硬件层面作为一种资源池的方式提供给云计算架构,这能够让数据中心真正变成软件定义的数据中心,我们这个话题是软件定义的数据中心,稍微有点误解。关于这方面,基于Rackscall(音译),基于我们上层的云计算,软件方面的架构,能够真正让数据中心基于软件定义。如果大家以后对于软件定义的数据中心架构感兴趣,我们台下可以进行更多的交流,正好我领导的团队也在这方面做一些技术方面的研发以及推广。
第二个层面关于软件产品与方案。为了更充分的发挥英特尔平台技术的一些创新能力,能够更大程度的挖掘这些技术对于数据中心基础架构的管理。我们英特尔也结合我们对数据中心市场的了解,我们也开发了一些软件产品。包括一些针对能耗以及容量管理的软件,以及针对远程高效的数据中心服务器远程接入与健康管理,提供另一块管理软件。英特尔也提供了更多的其他的一些软件产品,今天我可以知道介绍一下这两个软件产品,结合我们相应的一些数据中心的平台技术,能够为满足我们数据中心最突出的挑战,比如说像能耗、管理效率,我会介绍一下如何利用这两款产品,更方便,更灵活、更高效的进行能源以及健康方面的管理。
第三个层面,关于英特尔跟我们全球的很多合作伙伴一起,为我们全球的一些合作伙伴,包括我们的一些终端用户提供专业的方案以及技术支持。那么,方案包括软件与硬件相结合的方案,同时也针对我们客户的一些需求提供相应的个性化服务与技术支持。
总结一下,英特尔为数据中心的基础架构管理提供从平台创新到软件产品,以及到技术与服务全方位的专业的方案。今天我想下面对于如何利用英特尔两块软件产品,英特尔的数据中心,结合我们的英特尔平台创新技术,针对数据中心最突出的几个挑战,能耗以及管理效率做一些更进一步的探讨。
首先,Intel Datacenter Manager,DCM是一款对数据中心功耗、温度以及容量进行管理的管理软件,能够管理数据中心大部分的服务器,包括机架服务器,刀片服务器,以及部分存储设备、网络设备,以及相应的供电单元,比如UPS、PDU。这款软件能够对这些节点完全进行不间断的监测、数据采集、分析以及监控,以及更进一步的智能化的控制。DCM软件不仅仅支持英特尔平台创新技术与标准,同时也支持我们OEM厂商的一些特有的管理技术与标准。比如说IBM的 IMM。软件对于整个这些节点的管理代外管理方式,这样整个软件很容易集成到数据中心的管理方案中去。我们同时提供SDK跟界面管理方案,便于我们的客户进行集成与部署。
下面简单介绍一下如何利用DCM对数据中心的能源与容量进行管理的几个典型用例。首先,利用DCM可以对整个数据中心有一个全面的了解,从计算中心到机柜到计算节点,甚至节点里面的子部件有一个全面的了解,采用DCM可以对整个数据中心的架构进行快速的建模,并且可以采用文化代外的方式自动发现,并且加入这些管理节点进入我们的管理框架之中,对这些数据节点进行不尖端的采集,完全采用代外的方式,无须在任何节点上安装任何的客户端软件。
首先,我们看看如何利用这些采集的数据对数据中心进行更进一步的分析、预测与优化。首先,针对温度数据。这儿有两张图,左边这张图可以看到,采用DCM可以对整个数据中心的温度进行不间断的监测,基于一定的数据,比如针对特定案例,我们可以发现整个数据中心智能情况可能是根据内嵌的标准,美国关于智能方面的标准,根据这个标准我们可以发现整个数据中心在智能方面可能存在一些不足,可能让整个数据中心温度上面过于智能了,我们在这种情况下可以提高智能温度,提高智能的效率。右边这张图可以看到,通过数据的可视化展现与分析,发现整个数据中心里面可能存在局部的智能方面的热点,数据中心管理员通过这样一个可视化的报告,可以采用进一步的一些智能方面的优化策略,改变整个智能的设计,从而能够提高整个数据中心的智能效率。
那么,通过跟数据中心一些特定应用相结合,我们可以提供更多的一些智能方面的分析与优化。比如我们跟百度合作,跟百度的特定应用相结合,可以提供这种基于应用的一些智能方面的健康状况的预警,包括采用跟智能空调系统的一些结合进行更高效的智能控制,提高整个数据中心的智能效率。
前面讲了如何利用温度数据进行进一步的分析、优化与控制。那么,现在我们可以看看对我们的功耗数据也可以利用不断采集的功耗数据进行进一步的分析与优化。例如我们可以发现整个数据中心里面对于能源利用并不是很充分的一些服务器,同时我们也能发现整个数据中心里面能源利用效率不高的一些服务器,这样便于数据中心管理员对我们的应用,对我们的服务器进行更进一步的整合。同时,也能够发现我们数据中心里面利用效率不高的一些服务器便于进行设备的一些更新,提高整个数据中心的能源利用效率。
那么,采用DCM软件技术,不仅仅能够对数据中心的温度、能耗进行一些分析与优化,同时也能够对数据中心的能源状况进行智能化控制。比如可以采用基于DCM专利技术的,基于不同组,不同优先级,以及不同时间点的能源控制策略,可以对数据中心的能源进行智能化的一些能源预警控制,从而能够提高能源的利用效率,降低能源。同时,也能够在灾难发生的时候,降低整个数据中心能源消耗的水平,从而提高整个UPS的使用时间,在这种情况下,能够降低整个数据中心灾难发生造成的损失。
那么,同时与我们的一些数据中心客户的应用相结合,包括跟制冷系统相结合,我们提供更进一步的智能化控制。我们跟全球的一些数据中心客户进行了这些更深入的方案以及实现,在这方面实现了更多的智能控制的策略。关于这方面更多的控制案例,如果大家感兴趣,我们可以在台下进行这方面更多的一些交流。
那么,随着应用的提升,有一些数据中心原来的供电设备设计可能没有办法满足快速增长的移动应用的需求。比如随着应用的增长,需要提高整个机柜的容量。但是,现在的能源设计没有办法满足更进一步的增长需求。那么,采用DCM一些能源管理的策略,我们可以在最小程度影响客户应用软件性能的情况下,可以降低整个机柜或者一定的组的计算设备的能源消耗峰值,从而能够提高整个机柜的密度,在一定程度上能够提高整个数据中心的能源利用效率。当然,在一定程度上也能够延长数据中心的寿命。
那么,稍微总结一下,前面采用DCM软件可以对整个数据中心的能耗、温度进行一个全面的监控。那么,基于这些监控的数据,我们可以做更进一步的分析、优化,以及一些智能化控制,尤其跟我们数据中心的一些应用软件,或者跟我们一些智能系统相结合,对我们数据中心的能源管理可以更高效、更自动化的一些管理。
目前采用DCM软件的方案,英特尔跟全球40多家合作伙伴,一起为全球的客户提供了能源与容量管理方面的案例,当然不同的数据中心他们的情况也不太一样,所以针对不同的数据中心他们的用力也不一样。英特尔跟我们全球的大概40家合作伙伴一起为不同的数据中心客户量身订造他们自己的方案。这里面也有我们中国的一些客户,比如像中石化、百度、中国国网、中国海关等等,希望我们在座的朋友有更多的数据中心的客户能跟英特尔以及我们的合作伙伴一起共同探讨一些解决方案,让我们的数据中心变得更绿色,一方面能够降低我们整个数据中心的管理成本,另外一方面为整个绿色气候做出贡献。
下面介绍一下如何利用Virtual KVM对数据中心远程接入进行更高效的管理。Intel Virtual KVM是一款对数据中心服务器进行高效的远程接入以及健康管理的一款管理软件,远程接入主要指对数据中心的服务器进行远程的界面控制,远程诊断,以及服务器的一些配置信息更新。健康管理包括对数据中心的服务器进行一些健康监测、分析、检测与预警。跟DCM类似,Intel Virtual KVM整个架构能够对数据中心的服务器进行完全代外的管理方式,无须在任何节点上安装任何的客户端软件,我们支持大部分服务器厂商的服务器,比如HP、戴尔、联想,以及LoGo的一些ODM、OEM厂商。对于远程接入方式,我们采用代内代外相结合的方式,可以对整个服务器进行全生命周期的管理。对于远程接入,传统的管理方式要采用基于IT的硬件KVM方式,这是一种昂贵的基础设施的投资。要么采用针对不同品牌服务器的远程接入管理方案,采用Virtual KVM软件,无须购买任何额外的硬件设备,采用统一认证,一键化的管理方案,对数据中心的服务器进行一键化的远程接入方式。
对于健康管理,目前我们能对数据中心的服务器进行代表外的健康监测,我们定义了单一的健康指标,便于我们的管理人员非常直白,非常明显看到整个数据中心服务器的健康状况。有些数据中心管理员他们需要不间断的比如每隔半个小时看看数据中心服务器前面板灯的健康状况。那么,采用集中化的健康管理的软件方案,我们就无须再增加这样的一个额外的人工的允许的开销。
对于健康的管理,我们还提供更进一步的数据的分析,例如针对这些子部件的健康状况,便于我们的管理人员,便于我们的客户做更进一步的诊断。对于健康管理,我们正在做更进一步的研发工作。主要包括针对英特尔平台的技术创新,例如能够通过平台创新技术,让整个服务器能够暴露更多的健康数据。例如,CPU、存储器等的健康数据,通过更进一步的健康数据跟我们的应用相结合,能够提供更多的基于应用的健康状况的一些检测以及预警。我们也跟百度以及阿里巴巴在这方面进行一些合作。针对下一代产品的管理,我们也会对数据平台、计算平台、健康状况进行更及时的发现、隔离以及软件恢复。
那么,对于数据的进一步的分析,我们也会为整个数据中心,从数据中心层面到计算系统层面,到子部件的健康数据的层面我们都会做更进一步的数据分析、挖掘、统计,以及做一些健康的异常检测,也包括基于机器学习的异常预警。关于健康管理方面更多的一些案例,我们希望能够跟更多的业界合作伙伴以及数据中心的终端客户在这方面进行更多的合作,能够挖掘健康管理方面更多的一些痛点,能够开发出更多的技术,从平台到软件到方案,能够解决我们数据中心健康管理方面的问题,为数据中心高效、稳定的运行提供保障。
最后,我想简单谈一下针对这些反应产品、技术,包括我们英特尔数据平台创新技术的一些市场合作与推广。不管是我们的软件产品,包括DCM软件,或者Virtual KVM,我们主要有三种方式推向市场与我们的合作伙伴以及终端客户进行合作。
第一个层面,跟我们的ISV或者SI进行合作。比如施耐德,能够把我们的SDK软件集成到他们的管理软件里面去,通过他们的管理软件,能够跟我们的终端用户进行合作,能够对我们终端用户的数据中心、能耗、容量、健康,以及远程接入进行更高效的管理。
第二个层面,跟我们的OEM、ODM厂商进行合作,目前来说我们跟一些主要的OEM、ODM厂商进行合作,开发相应的一些管理软件。同时,能够大限度的发挥OEM厂商的平台的专有的一些管理技术与功能。例如,我们跟戴尔合作开发针对能源容量的一个管理软件,跟联想合作开发了一款管理软件,大家可以通过各级的服务级厂商,他们的渠道获得这些软件与技术。
第三个层面,我们也可以提供英特尔自带的管理方案,跟我们的终端用户进行直接的技术支持与服务。
目前这是我们一个全球的大概40家左右的合作伙伴。遍布在全球,也包括中国的一些合作伙伴。今天我希望在座的朋友里面有更多的一些能够加入到我们这个列表中来,成为英特尔平台技术以及软件技术的合作伙伴,也希望更多的一些终端客户能够跟我们以及我们的合作伙伴合作,为数据中心基础架构的高效稳定管理提供更多的一些方案,为迎接中国“移动互联网+”时代对数据中心的挑战保驾护航。
关于更多的信息,我们在311房间有一个展台,如果大家对更多的一些话题希望有更多的交流,我们可以在台下进行更多的交流。尤其是关于软件定义的数据中心,以及我们平台的一些创新技术,我很高兴能够跟大家做更进一步,更深入的交流。谢谢大家!