插座交换开关和插座级的功率测量对于现代数据中心的设备、增长和效率的完整管理目标是至关重要的。多年来,在数据中心业界一直流传着这样一条准则:您数据中心无法对不能测量的设施实施任何改善。尽管数据中心的操作运营人员们能够基于他们过去的经验总结,而进行一些标准化的设备升级;或可能实施偶然性的改进,但如若没有对IT设备的详细测量,以及对于分配系统的每个级别的功率控制,则不可能实施持续性的改进。管理对数据中心设备的部署和使用,并随着时间的推移,在设备达到其使用寿命期间时进行报废处置属于数据中心的日常运营活动。而通过机架密度意识、容量规划和正常运营维护来了解数据中心业务的增长,将继续成为数据中心管理人员们所面临的主要挑战。而随着经济大环境的紧缩、市场竞争在未来十年还将进一步加剧,故而效率分析只会变得更加关键。在本文中,我们将特别向广大读者诸君提出:具备插座交换开关和插座级功率测量功能的机架PDU是现代数据中心所必备的。

管理IT设备

业务所依赖的、托管在数据中心中的IT设备是安装在机柜或机架中的网络、计算和存储设备。这些设备具有由它们各自的使用目的而分别定义的有限的使用寿命周期,并且必须被妥善管理。不仅仅是在其操作运营期间注重对它们的管理,而是要从其部署到最终报废的整个使用寿命期间对于它们的所有使用寿命周期进行跟踪。此外,管理一款设备包括随着时间的推移对于相关设备的功耗成本会超过其所给企业业务带来的功能价值的理解。换句话说,数据中心管理人员们重要的是应该基于设备所消费的每瓦特的能耗所带来的性能,而准确的知道什么时候应该更新到更高效的设备,来替换旧的设备。由于能够从相关财务负责部门看到数据中心的电力成本费用,因此,及时报废淘汰这些旧的设备也有助于数据中心提高效率。

锁定和部署

关于在中型和大型数据中心环境中部署新的IT设备的一个难题是回答三个关于“在何处?”的问题。这三个“在何处?”的大问题与支持这些新设备所需的功率、空间和冷却有关。相当一部分的设备将被简单地安装在其所适合的位置,然后记录下来以便进行追踪。当设备的正常运行和效率被认为是非常重要的时候,这是一种有风险的部署方法。事实上,数据中心管理人员不仅需要识别新的IT设备适合安置在何处,而且还应当确定哪台机架能够在正常运营和效率方面以正确的相位为之提供恰当的可用功率,这是至关重要的。能够显示机柜电源使用情况和温度的趋势工具(例如,去年的趋势情况)可以帮助数据中心管理人员们确定基于最坏的情况条件在机柜内安装更多的设备是否安全。管理这方面的方法之一是“锁定”未使用的插座。换句话说,在没有安装设备时,请关闭交换机架PDU的插座。然后在所安装的新设备进行生产作业单时,按照计划将电力供应给适当的插座。下图1显示了插座控制操作的一般通用GUI界面。许多PDU还具有用于执行相同操作的命令行界面和SNMP访问。诸如Server Technology公司所提供的Sentry电源管理器(SPM)等电源管理软件可以调度插座控制的任务以便提供与票证部署(ticketed deployment)一致的手段。

QQ图片20161212094453

图1:通过Server Technology公司所提供的PRO2机架PDU,从一个网络访问进行插座控制

跟踪

不管简单与否,识别所安装的设备的任务通常归结为在资产管理系统中对每款设备进行命名,并提供关于机架名称、机架中的RU插槽和用于电源的机架PDU插座等相关信息。所以,以这种方式识别设备并提供“锁定”交换开关控制的一款软件包应该是一款数据中心管理器的打包。下图2显示了Server Technology公司的SPM中的机柜设备页面。通过配置每款部署设备的基本特性,如名称、RU位置、规模大小和使用的插座,数据中心管理人员可以轻松管理部署。

Bill-back

对于企业组织中的各个部门而言,特定IT设备的电力使用情况的“bill-back” ,或至少“show-back”一直是一种缓慢增长的趋势(许多人会认为“太慢了”)。但这不仅带来了更好的预算分配,而且还通过强制业务部门考虑每台设备的价值,而不是通过囤积服务器或存储,来提高效率。国际正常运行时间协会(Uptime Institute)一直是积极推广“bill-back”模式的领导者,并在其《IT Chargeback推动效率提升》一文中提供了一个很好的证据。为了在实践中执行“bill-back”或“show-back”,一家数据中心必须首先具有从能量消耗设备收集数据的能量管理系统。下图3显示了Server Technology公司的SPM通过位置所提取的标准能源成本报告。类似的报告还允许业务部门监控一组散布在世界各地的多个位置的机柜。如有必要,同样的软件还可以监测每款设备的插座级别能量消耗情况。

QQ图片20161212094420

图2:Server Technology公司的SPM中的机柜设备选项卡

QQ图片20161212094348

图3:Server Technology公司的SPM中的能源成本报告

管理增长

如果只需考虑数据中心的总体规模或数据中心的能耗总数,就很容易考虑到增长。这并不是说,对于某家特定数据中心的总能耗为1.5兆瓦的理解是没有意义的。事实上,在其能源利用率方面了解数据中心是至关重要的。关键在于,当谈到数据中心的增长时,人们不能放弃对于在IT设备级别所发生的任务的理解。考虑数据中心的所有增长因素,包括密度、容量、以及正常运行时间,对于数据中心的管理而言是至关重要的。而这一切都要从机架中的设备和其电源使用情况开始。随着时间的推移,充分了解机架内的电源使用情况,将有助于发现滞留容量能力,以便在已有资源内优化增长。

密度

在Server Technology公司所推出的《管理不同数据中心机架密度(Managing Variable Data Center Rack Densities)》一文中,这种情况是为了在数据中心的整个生命周期内规划机架内IT设备的密度。我们可以通过每台机架中的特定设备在数据中心中的功率使用的总体密度中所占据主导地位的程度来进一步加深这一认识。数据中心的增长不一定需要部署新的设备。下图4提供了在既定的特定电源电路下,关于服务器利用率计划如何影响可以部署到特定机架中的服务器的数量的示例。在这种情况下,可以部署28台利用率为30%的服务器,或者部署19台可以达到80%的利用率的服务器。在该示例中,数据中心的增长涉及将应用程序添加到现有设备,以便增加利用率。即使部署的服务器数量下降了约30%,每瓦能耗的性能也增加了80%.

QQ图片20161212094216

图4:每台服务器的能耗和每台机架的vs.CPU使用情况 - 30A 三相208V电路,来源:Server Technology公司《管理不同数据中心机架密度》

通过在机架PDU处测量的每个插座的功率,可以看出该效果的细节。我们可以说,这种机架具有更高的功率密度,但却是较低的物理设备密度。另一方面,新设备部署所增加的物理密度,可能会也可能不会增加机架中的总功率。这些设备趋势导致了具备更多插座的更高功率的机架PDU被安装到更高的机架。

容量规划

与为数据中心电力使用的增长进行规划相比,容量规划在电力供应链的各个层面都至关重要;然而,如果数据中心的设计充分实现了,则可以基于每个IT设备的测量来预测机架级的容量。下图5显示了对于机柜总功率的预测趋势。在这种情况下,简单地增加安装设备的利用率会导致功率使用增加的趋势。在包括安装附加设备的增长趋势中可以看到更明显的阶梯式变化。无论采用哪种方式,都可以设置容量的限制阈值,以允许基于未来可能的条件发出警报。这会带来关于机柜何时将耗尽功率或超过温度阈值的实际预测。

为了基于机柜内的实际利用情况来补充这种预测趋势,数据中心管理人员们可以使用现有机柜设备的插座功率测量来帮助涉及补充类似设备的“假设”情况。Server Technology公司的POPS PDU便是能够提供这种有价值的信息的一种方式。

QQ图片20161212094148

图5:Server Technology公司的SPM预测功率趋势

正常运行

无论企业数据中心正常运行的标准到底如何,很少有企业会仅仅只是因为增长太过突然就允许简单的降低正常运行水平的。网络可访问的插座控制减少了重新启动锁定设备的响应时间,特别是对于远程站点而言。在恢复了失去的功率之后,插座功率的分段排序将有助于防止浪涌引起额外的停机中断。当然,了解单个配电设备随着时间的推移的功耗情况有助于衡量冗余,以保持较高的正常运行水平。下图6显示了SPM的机柜内的功率使用的细节。在这种情况下,功率使用连续地在机架PDU电路的安全等级阈值的上下反弹。没有断路器会损害一个电源,但安全合规性可能会受到损害。如图6的左下角的条形图所示:虽然“A”(最左边的黄色条)和“B”(中间黄色条)电源上的单个PDU符合均安全规范,但是在一个电源损失的“假设”情况下(最右边的黄色条)表明其必须在电力允许范围内恢复正常功能。

QQ图片20161212094122

图6:执行冗余检查的机柜页面

管理效率

数据中心的效率是关乎到“绿色环保”,并甚至关乎到您的钱包的事项。提高效率的最重要的出发点是为了省钱。IT设备电力供应级别降低有助于数据中心从整体上降低功率和冷却要求。这不仅是从基本的kW-h成本的角度,而且还包括设备部署时的资本支出和持续增长的角度。众多介绍了管理数据中心效率的重要性的文章之一是:DatacenterDynamics网站所发表了《现实:数据中心电源使用已然失控(The truth is: data center power is out of control )》。在该文章中,作者指出,效率的提高将增加需求,使总体消费实际上增加。在数据中心,这意味着无论效率如何提高,功率使用都将增加。有人可能认为这是无视效率提升倡议的论据,但事实上这将是一个严重的错误。随着时间的推移,数据中心的效率将变得越来越重要,因为其他竞争性的企业组织将变得更有效率。考虑到这一点,根据数据中心中的特殊重点,管理效率将采取几种形式。在机架式IT设备领域,包括选择电力供应和正确利用IT资源。同时,一些简单易行的措施包括在下班时间或设备不被使用时将其断电关闭。

电源供应

在IT设备电源供应水平上管理效率有两种形式。首先,用电源输出除以电源输入,这是效率的技术定义。但由于电源效率接近95%,这可以说是一个微不足道的讨论。第二个方面是我们可以称之为有效性。这与设备所消耗的功率比上执行实际的工作任务所消耗的功率有关。绿色网格组织的DCeP(数据中心能源生产率)对于了解数据中心内的有效性非常有用。在2014年3月13日关于协调数据中心能源效率全球衡量标准的备忘录中,他们重申了他们的建议,即在IT负载中直接使用IT能源消耗来计算PUE.虽然许多服务器都有其收集电源性能数据的手段,但大多数其他类型的设备并没有。这使得数据中心的管理人员们只有一个选择——使用从机架PDU的插座级的监控来获取电力消耗和能耗情况。下图7显示了采用Server Technology公司的POPS PDU的插座能耗指标情况。

QQ图片20161212093948

图7:Server Technology公司的SPM的能耗报告

减载/调度

在许多企业组织机构中,完全供电的数据中心机架式IT设备并不需要24/7全天候的供电。在无人值守时间内关闭部分或全部的设备容量能力是降低功耗和成本的最重要的方式。下图8展示出了一个政府机构参照此方法的结果,其将设备在不需要运行的非工作时间关闭。结果显示在任何一周内,其POC数据中心的电力使用量平均下降超过50%.

插座级的控制允许通过自动化实现这样的中断过程的调度。很多机架PDU允许通过脚本或SNMP命令自动访问控制插座状态。诸如SPM这样的软件包可以提供简单的工具组以通过一个单一的调度任务实现一组插座控制命令,可以基于需求时间需要进行复制。

QQ图片20161212093838

图8:插座控制调度所带来的实际节省

僵尸服务器

尽管长期以来业界一直有关于“僵尸”服务器所造成浪费的讨论——“僵尸”服务器是那些仍然在使用但又尚未被充分使用的设备——但是它们对数据中心效率的影响几乎没有任何减少。自然资源保护委员会(NRDC)在其2014年8月发布的《数据中心效率评估(Data Center Efficiency Assessment )》中对“僵尸”或“昏迷”服务器提供了令人信服的评估。该报告指出了一个简单的问题: “据我们所知,目前没有IT经理因为没有处置其数据中心的僵尸服务器儿被企业开除炒掉,”作者还指出,“删除僵尸设备被证明是一个更具管理性的挑战,而不仅仅是一个纯技术的问题。”我们同意:随着时间的推移,对插座级别的测量可以让数据中心管理人员分析这些设备是否是仅保持在空闲状态,并且决定其是否可以被关闭或重新启动。下图9显示了基于SPM的机柜设备的简单趋势。连续的低功耗使用显然告诉了我们这款设备是一款“僵尸”的迹象。

QQ图片20161212093758

图9:SPM的机柜设备趋势

总结

一款具备插座交换开关和插座级功率测量功能的智能机架PDU与功率和能耗管理软件耦合的系统在现代数据中心中是必不可少的。而诸如Server Technology公司的SPM交换POPS PRO2系列PDU就满足了这一需求。这些功能能够帮助数据中心人员管理三个关键方面:在其整个生命周期的IT设备、数据中心机架内的增长以及通过成本节约实现企业效率要求的竞争优势。

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2024-01-09 16:53:00
市场情报 中兴通讯分布式存储+ DPU,加速数据中心转型
存储技术在不断地创新、完善、加速演进,以更好地满足业务的存储需求,但同时也使得存储协议和文件系统越来越繁重。 <详情>
2023-11-17 10:35:56