数据中心的PUE(电源使用效率)测量方案可以非常简单,在一个极端的层面,理论上只有两步;或者其又可以相当全面,包括数十个测量点。考虑到数据中心的容量(kW)、功率、冷却?架构、业务目标及其基础设施系统(例如冷水机组,发电机)的共享程度,本文中,我们将为您详细介绍如何为既定的数据中心确定适合级别的测量方法。电力使用效率是数据中心业界广泛接受的用于测量支持数据中心IT负载的物理基础设施系统(例如,电源和冷却)的能量效率的度量方法。而基于多方面的原因,您企业可能希望能够获得关于数据中心PUE值的报告;也许您企业制定了相应的内部规章要求遵循绿色环保/节能倡议,或者您企业所属的行业需要遵守相关的监管法规或授权(例如,美国政府部门已经颁布了行政命令,要求在政府机构的数据中心测量PUE);或者您企业可能希望将您的数据中心推广打造为“一流的数据中心”。一般而言,业界主要有三种的方法来获得一处数据中心的PUE值(如下表1),而对于某些特定的业务目标而言,其中一些方法可能比其他方法更为合适。

QQ图片20170209094659

表1 获取数据中心PUE值的一般方法一览

而在《数据中心的电力效率测量》一文中,我们为曾大家提供了关于PUE指标的介绍,讨论了其中的关键驱动因素是什么,并进一步探讨了模型和测量对于理解数据所扮演的角色方面所起的作用。有一些公共可用的工具,如施耐德电气公司推出的TradeOff工具、数据中心效率计算器,允许您企业在特定的设计条件,包括容量、IT负载、电源架构、冷却架构、空气流管理实践等等条件下,得以能够估计PUE值。但是对于任何计算器或估算器而言,均存在对于实际数据中心可能并不成立的基本假设。供应商和顾问提供相应的服务,以评估数据中心的效率,临时测量器被带到数据中心运营现场以测量数据中心的PUE值。这为数据中心效率的提高提供了良好的基准,但数据仅仅只代表一个时间点。

考虑上述这种情况。您企业需要进行数据中心现场能源审查,以测量数据中心的PUE值。鉴于没有永久性的仪表,所以工程师们只能借助一款临时性的仪表来监测各种电路并进行测量。从工作日早上一上班开始,他便开始测量IT负载,此时其IT负载正处于高值。当天晚些时候,这些工程师们又开始来测量变速空气处理机,但此时的空气处理机的负载与早上刚上班测量IT负载时的负载已经明显不同了。例如,如果此时的负载较低,所得到的PUE值将“人为地”变低,因为可变速风扇的运行速度将会下降。此外,由于冷却能量的吸取消耗取决于天气状况,而其在每天和每月都在不断变化,故而某一天的天气状况测量并不足以反映年度的PUE值。在数据中心运营现场安装永久的连续测量仪表有助于确保以同步的方式收集数据,从而避免了由于全天和整年的天气变化而导致的不准确性。

在本文中,我们将重点为您介绍表1中的第三种方法,即:连续或“实时”的测量,并将为您企业完成以下注意事项和步骤,以便部署有效的连续PUE测量和监测系统,提供相应的指导。

1、根据PUE目标选择合适的PUE测量水平

2、电路跟踪以捕获数据中心所有的IT和非IT负载

3、确定数据中心已经存在哪些测量仪表了(即嵌入式测量仪表);以及仍然还需要什么类型的测量仪表,而这些测量仪表又应该被安置在何处

4、在运营的数据中心中安装仪表

5、在聚合数据实施监控系统

选择恰当的PUE级别

绿色网格组织定义了四个级别的PUE报告,这四个级别的报告在精度、成本和测量复杂性方面各有不同。 0级不是连续的能量监控,因此我们将重点关注级别1、2和3.这些级别之间的主要区别是测量IT负载的仪表安置位置。

级别1——UPS输出

级别2——PDU输出

级别3——IT设备输入(例如,通过使用机架PDU测量)

测量和报告您企业数据中心PUE值的业务目标很可能会在决定哪个级别是最为适合的过程中发挥作用。级别1的部署实现是最为简单的,因为数据中心的UPS可能已经有一个嵌入式仪表用作IT负载的代理。例如,如果需要报告PUE是由任务驱动的,这个级别可能就已经足够了。但是,如果您企业希望更深入地了解数据中心中的低效率状况,则可能需要采用更准确的方法。

级别2的IT负载也可能依赖于嵌入式仪表,因为大多数配电单元(PDU)、远程电源面板(RPP)和母线槽系统都包括它们。级别1和级别2精度之间的差异取决于是否有非IT负载由UPS供电。例如,如果在UPS上有空气处理器,则使用UPS输出输出测量来表示IT负载将人为地增加IT负载值,并降低(改善)PUE值。如果所有UPS负载都是IT相关的,则两者之间的差异将来自UPS和负载之间的配电设备的损耗,其相对较小。

想要报告级别3,由于负载是在IT机架级别进行测量的,因此需要聚合的测量点的数量将更多。这增加了复杂性,但也提供了最为准确的IT负载。最终,级别3的测量表示了更多的数据,有助于更好地了解数据中心PUE为什么会随着时间的推移而趋向于更高或更低,最重要的是,其可以指导您企业可以采取怎样的相关措施。下表2总结了绿色网格组织所定义的三个级别。

如下表2所示,绿色网格组织的PUE指标还规定了所有三个级别的公用设施输入处的总设施能量值所需的仪表。然而,级别2和级别3建议增加仪表,例如在UPS输入/输出和机械输入。

无论选择哪个级别,如果目标是(至少部分地是)比较或对其PUE确定基准,则在企业组织确保所有数据中心保持一致是很重要的。如本文稍后所示,测量方案的复杂性最终将基于精准度,成本和简单性进行综合的权衡。

QQ图片20170209094618

表2 绿色网格组织定义的PUE级别

企业收集数据的频率应该是怎样的?

根据上面的由绿色网格组织所定义的表格,根据级别的不同,测量的频率也有变化。级别1要求每月实施测量。但是,请记住,月度报告不会提供与每周,每天或更短时间间隔报告相同的精准度,因为每月的天气变化情况不会被准确捕获,并且从白天到晚上或从工作日到周末的工作负载变化情况将不会被捕获。级别3要求每隔15分钟或更短的时间实施测量,这更适合于在既定的具备动态性质的数据中心的精确测量。

时间间隔从一个仪表类型到下一个仪表类型会有着显著的变化。例如,电源质量测量器具有比嵌入式UPS测量器更高的数据收集速率。但是在测量PUE的情况下,大多数永久的测量仪表(嵌入式或独立式)将满足15分钟的要求,并且建议的是最低频率。

如果我企业的数据中心是在共享的设施中该怎么办?

表面上,PUE似乎是一个非常简单的报告指标,因为其计算公式是基于两个数值:总的设施能耗和总IT负载能耗。如果您想要一个基本的PUE(级别1),并且您企业在一个专用的数据中心设施中具有一个常见的UPS输出(测量点将在服务入口和UPS输出处),其可以非常简单。然而,很少会有数据中心的报告要求会这么直接,因为(1)设施是一个多用途架构的;(2)您数据中心的报告目标是获取级别2或级别3的PUE值;(3)数据中心负载是分区的;(4)您数据中心有冗余组件;或者(5)您希望具有额外的仪表,以了解关键子系统的能耗情况,以便随时间的推移优化PUE值。

共享的设施通常意味着共享的电力和冷却基础设施子系统,其通常是大型的上游系统,如交换机设备、发电机和冷水机组装置。为了使用共享系统报告数据中心的PUE值,必须将来自这些共享系统的一部分能量分配给数据中心。有多种方法可以做到这一点:

对系统进行测量,并根据数据中心IT负载的总构建负荷的比例,将该能量的百分比应用于数据中心。

测量一款系统的输入,减去系统输出的非数据中心相关的子仪表。这种方法适用于电子面板。

排除来自共享子系统的能耗,并使用共享模型,包括共享系统的估计值。

用于特定数据中心的适当方法取决于数据中心架构的复杂性,但同时也取决于测量项目所被分配的成本。具备更多的仪表可以让您得到更精确的测量结果,但这是以更高的成本费用为代价的。

电路跟踪

电路跟踪是确定测量数据中心PUE的最佳测量方案计划的关键步骤,因为其确保了您企业是否能够准确地识别数据中心所有的负载电路,包括IT和非IT的。大多数数据中心并没有关于哪些电路承载了哪些负载的最新文档记录。

当您接近IT负载(即承载机架PDU的分支电路)时尤其如此,因为在IT空间中经常发生变化。上游的电气架构通常是由建筑设施团队持有的电气单线图的形式。故而数据中心管理人员有些问题要问自己:当发生变化时,IT团队和基础设施团队是否有通畅的沟通?您的文档记录是否是最新的?我们是更换了任何基础设施,还是添加了基础设施?下图1说明了旨在实现这一重要步骤的评估服务的工作说明。

这样的评估可确保在开始识别您企业所需的现有和新的仪表之前,您的面板计划是最新的,并且您已更新了包含所有当前基础设施子系统在内的单线图。在理想情况下,更新的单线图说明了已经存在的测量点的安置位置,以便将新仪表的投资保持在最低限度。

除了跟踪数据中心所有的电路之外,重要的是跟踪和更新机械系统的文档,因此管理人员务必要清楚数据中心建筑物内支持IT负载与其他非数据中心负载相关的排热系统、泵、管道等。

QQ图片20170209094516

图1 电路跟踪评估示例

确定仪表的位置

正如我们已经讨论过的,所需的测量仪表的数量,以及相关测量方案所涉及的成本取决于一系列的因素。故而寻找成本与您企业所需的PUE值精准度之间的平衡点是至关重要的,因为没有一个绝对正确的方法来测量数据中心的PUE值。

IT负载的测量是直接的,并且在许多情况下不需要额外的仪表,因为UPS和PDU通常具有内置(嵌入式)仪表以提供相关的数据。另一方面,测量物理基础设施往往变得更加复杂和成本昂贵。在本文以下部分中,我们将描述数据中心常见的仪表布局场景。

测量IT负载

在《数据中心电表类型》一文中,我们讨论不同类型的仪表的典型的测量成本。 IT负载的测量解决方案的成本范围很广,从免费的(使用嵌入式测量表)到每千瓦IT负载300美元不等。在大多数数据中心,有足够的测量方法来实现绿色网格组织所定义的1级PUE,因为大多数UPS系统均能够提供所需的能耗数据。

如果是由多个UPS支持IT负载,则可以将数据整合在一起,以获得总的IT负载,或者可以在通用的输出总线(即组合输出上的断路器跳闸单元)上进行测量。通过诸如DCIM软件工具的能量管理系统来实现数据整合。

当UPS输出仅包含IT负载(没有冷却系统或非数据中心负载)时,级别1是最具成本效益和最被推荐的方法。注意,如果不减去IT负载,IT负载将人为地从PDU变压器的损耗中以及UPS到负载的电线获得些许的增加。

对于那些寻求更高精度的数据中心,或者在UPS输出端具有大量非IT负载的数据中心而言,他们应考虑2级或3级方法。测量机架的PDU(如下图2所示)在安置在每个IT机架所收集的数据整合在一起时,可以最准确地获得关于IT负载能耗的测量。请注意,由于要整合的系统的数量的增加,此方法可能会增加数据聚合的复杂性。这可能会增加计算不正确的风险,因为一些测量点不报告或不包括在计算中。因此,此方法仅适用于具有成熟变更管理流程的数据中心,以确保在IT机架添加或更改时,机架PDU数据被正确计入。如果使用母线通道配电而不是机架PDU,则可以采用相同的方法,但可以借助承载每台机架的分接单元上安装的测量仪表。

QQ图片20170209094429

图2 机架PDU的测量示例

在机架级测量的另一个好处是,您可以更准确地识别上游配电中的“浪费”或损耗。如果上游PDU损失大于其应有的,则可以将其与其他数据中心或建模数据相比,这可以推动减少能耗的减少(例如通过合并负载和去除一些轻微加载的PDU)。

测量物理基础设施

对于特制的独立数据中心设施,测量总设施的功率是直接的。在这种情况下,服务入口处的仪表足以获得设备总能量所需的数据信息。但是,对于大多数数据中心而言,这是不够的,因为它们:

要么需要更多的数据(在子系统层面)以便采取相关的措施和改进

要么是在一个与共享基础设施系统混合使用的设施,如冷却机组和发电机。

对于“企业数据中心应该在何处安置仪表来测量总的能耗”的问题并没有一个绝对准确的答案,这是因为其非常依赖于数据中心建筑物内的电气和机械结构。但是采取有效的策略可以使获得所需测量结果的所需的仪表数量最小化。在混合使用的设施中,您不能只获取总的数据中心的主开关设备的输入值,因此有必要单独测量数据中心的负载。

考虑下图3中的面板。在左边的面板中,大多数电负载是数据中心相关的,而在右边的面板中,大多数电负载则不是。在第一种情况下,其使得感光仪作为面板的输入以及两个非数据中心相关的断路器,因此它们可以被减去。在第二种情况下,仅测量承载数据中心设备的四个独立断路器是有意义的,并将它们整合在一起。取决于“异常”状况,即非数据中心负载,有时测量IT负载和聚合更加成本有效,而有时测量非IT负载并将其减去更为成本有效。

QQ图片20170209094252

图3 一行代表显示仪表安置的示例

在确定要测量哪些面板并将其聚合在一起时,应小心谨慎,以避免重复计算。换句话说,如果一个面板承载了另一个,您肯定不想将它们汇总在一起,而是,您需要减去它们以获得准确的损耗。这回到电路跟踪的重要性,以便完全理解功率流。同样重要的是,有一些措施,使得有些企业不能简单地添加一个负载到面板,会使得一些数据中心的负载没有首先获得数据中心团队的检查。如果没有良好的文档变更管理,一旦面板中的负载发生第一次更改,这种节省资金的方法将无法准确反映PUE值。而这是我们测量主断路器的任何混合使用面板的关键。

当企业的测量预算紧张时,数据中心架构中的一些电气组件是很好的能源评估的候选。发电机是很好的候选,因为它们通常是一个共享的资源,他们并不是一个大的PUE值的推动因素。同样,对于测量和建模应进行评估权衡。

除了IT负载,冷却系统是数据中心最大的能源消费者。其包括了以下系统:

冷却器

冷却塔

冷冻水和冷凝水泵

冷凝器

CRAC和CRAH设备

机械系统也会降低性能,导致其效率低下。因此,测量这些系统通常是一项智能投资,以便在出现负面性能趋势时采取相应的行动措施。当这些系统专用于数据中心时,这些设备的输入断路器处的电表就足够了。但不幸的是,测量共享冷却系统的能量并不那么直接。有几份出版物曾讨论过间接测量共享冷却系统能量的选项。在制定数据中心测量计划时,这些是相当有用的资源。建议范围包括使用最小仪表和估算共享系统的能量消耗情况,使用典型的性能表,使用温度和流量仪表作为“热测量”手段来分配数据中心使用的系统。后者将提供更多可操作的数据,但也需要更多的实施成本。故而企业数据中心必须根据预算和业务预期确定适当的测量计划。

在预算允许的情况下,我们的建议是对制冷机进行热测量。下图4展示出了具有共享的多用途数据中心建筑的中央冷却器的建筑的简化概念管道图。为了分配仅由数据中心使用的电能,应进行以下操作:

在主回路上安置两个温度传感器(在供应和返回时);和一个流量计来测量主回路中的水流量。计算冷却器的热能排放率(kW)。

将两个温度传感器安置在数据中心回路(供应和回流)和一个流量计上,以测量数据中心回路中的水流量。计算数据中心的热能排放率(kW)。

将电表(如果尚未嵌入)安置在冷却器上,以测量电能消耗的速率(即kW)。

将热排除率(数据中心/冷却机组)的比率乘以冷却器电表的值。

QQ图片20170209094223

图4 具备混合建筑负载的冷却机组的简化图,显示了流量和温度传感器的安置。

温度和流量设备的安装为数据中心运营商们提供了额外的有价值的信息。该数据可用于优化泵和冷却器性能,恢复到冷冻水系统的原始ΔT,并准确分配冷冻水用量。

一个较低的成本选项,适合当非数据中心负载相当静态,其使用的是IT负载(kW)与总负载的比率,并由冷水机电能乘以该比例。

IT空间内的温度传感器虽然不是测量PUE所必需的,但是它们是一个重要的最佳实践方案,因为它们可以帮助识别热点,并识别过度冷却的位置,从而可以采取相关的措施以降低总能耗(即通过关闭多余的CRAH,而不超过温度阈值)。

安装仪表

一旦确定了额外的测量位置(除了现有的嵌入式测量仪表),下一步便是的选择仪表、传感器,和实施安装计划了。

PUE指南并不指定具体的仪表或传感器类型,因此决策的制定应该

基于数据中心是新建的还是现有的(正在操作运营中的)。通常期望选择能够避免或减少停机时间的传感器,因此一些传感器比现有数据中心的其他传感器更为合适。例如下图5中的分裂芯片传感器,不如实心芯片传感器那样精确,但是却更适合于安装正在操作运营中的数据中心中,因为它们被夹紧在带电导体周围,而不必通过导电体——核心传感器。

QQ图片20170209094146

图5 分裂式电流传感器(也称为电流互感器)示例

对于冷却系统上的温度传感器和流量计的安装,适用相同的逻辑。在实时数据中心中安装这些设备有两种方法。

热水龙头管道(Hot-tapping)——在完全运行的管道系统上安装仪表(只有微不足道的水损失),从而不存在停机中断的安全方法。 “这种方法比在建的新管道系统上的安装更昂贵,但是在现有管道上的安装能够节省关闭、排放、再填充、压力测试和处理水的时间,非常具有成本效益。

超声波仪表——一种在管道外部缠绕的仪表,避免任何切割或钻孔,并使用超声波信号来确定流速。从该速度和管道尺寸大小计算体积流量。 “为了准确地读取,流量仪器必须放置在长度足够长的直管上。”超声波仪表比热水龙头管道成本昂贵得多,因此不常使用。

一些测量仪器显示本地数据,而其他测量仪器仅将数据发送到聚合器。这是企业数据中心在选择特定仪表时所需考虑的另一个因素。是否需要在仪表位置本地进行数据值的检查?这又是一个成本权衡的问题。

电气仪表和热仪表的实际安装工作一般第三方承包商完成。他们将确保工作许可证的获得和工作的安全完成,并不会造成数据中心运营的中断。

监控系统

DCIM软件工具,如电力监控系统(EPMS)是PUE测量难题的关键部分,因为其是监控系统,具有聚合数据,呈现数据和提供可以采取行动的有用信息的作用。测量仪表必须同步,并确定数据报告的频率。聚合方法应该精心规划和记录,因为显示准确的PUE取决于仪表的正确加,减等,这样才能够反映IT负载的总量和数据中心设施的总量。

有效失望能量(PUE)监测系统显示三大关键数据——PUE、负载百分比和能量损耗(如下图6所示)。

QQ图片20170209094013

图6 跟踪PUE的DCIM能量管理仪表板示例

PUE

时间点PUE和历史平均值(季度,年度)都很重要。可能有相应的报告要求,使这些历史数据很重要。因为天气状况(如季节变化)可以对PUE值有很大的影响。时间点并不能说明数据中心性能的全部情况。

数据中心的负载百分比

IT负载对PUE有最大的影响。重要的是要知道糟糕的PUE值是否由于低效的功率和冷却?设计/操作,或者因为数据中心负载较轻而造成的。

轻负载的最佳实践数据中心可能具有较高的(差的)PUE值,这仅仅是因为其当前的轻负载,并且这样的数据中心将是被合并到其他数据中心的良好候选,而不是由于其PUE糟糕而被关闭。

关键子系统的能耗分解明细

为了推动PUE的改进,您需要知道您数据中心最大的能源消费者。您还可以将实际的子系统能耗与模型消耗进行比较,以确定可能的欠佳性能。

DCIM软件中基础架构组件的命名约定应该仔细考虑。标签对于轻松解释您在主聚合器上看到的内容是至关重要的。 “PDU的A侧”,“PDU的B侧”或“冷冻水供给泵”是清楚的名称的示例。另一方面,“面板1”,“面板2”对于那些位于电气单线中的子系统的位置将是不明确的。颜色编码和字母数字编码的组合有助于轻松找到正确的系统,并将其与软件上的数据相关联。

保持PUE监控系统的完整性是至关重要的。这需要数据中心运营团队的严格的操作纪律和成熟度。例如,当对数据中心和/或数据中心建筑发生改变时,电气单线和电路调度必须保持更新。

结论

数据中心业主将继续面临不断降低数据中心的能源消耗的压力。虽然整个数据中心行业的平均PUE值正在下降,但仍有许多数据中心并没有采取连续测量的相关措施。正确的测量和监控将使您能够计算实时操作控制,现场基准测试和现场合规性(内部或外部)的PUE.因为,想要通过系统的方式来改进您企业无法测量的东西是很难的。

通常,可以使用来自UPS、PDU或机架PDU的现有仪表来测量IT负载。测量机架PDU能够提供最准确的IT负载,因为其消除了UPS和负载之间的损耗。

如果数据中心是建筑物的唯一功能,那么测量总的数据中心负载可以是简单的;或者其可以涉及当数据中心在与共享系统的共享设施中时的聚合,计算和估计。当预算允许时,应测量冷却系统,因为这些系统具有PUE改进的最大的机会。对单个子系统的较低可见性意味着较少的持续改进或测量变更的有效性的能力较差。

关注中国IDC圈官方微信:idc-quan或微信号:821496803 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2017-07-19 15:32:09
运维管理 保护数据中心网络安全需要防止外部渗透
近年来,安全问题一直在IT行业频繁发生,WannaCry ransomware数据窃取事件发生在英国国家医疗服务系统(NHS)和"发薪日贷款公司Wonga",这让人们感到不安,因为传统的安全 <详情>
2017-07-19 15:16:49
运维管理 数据中心SDN网络的构建及通信业务与光纤引入
数据中心最重要的是要完善和建设10Gb、40Gb甚至是100Gb以太网的设施基础。软件定义网络(SDN)一直都是网络领域里的热门话题。SDN的最大好处是有可能节约网络的总拥有成本 <详情>
2017-07-19 12:06:10
国内资讯 国家大数据中心等建设提速 中心地区带动发展趋势凸显
以中心地区带动发展已经成为我国目前培育经济新动能的主要方,向记者从多个部门了解到,以北京、上海等大城市为主,我国部署了多批国家大数据中心、国家科学中心、国家制造 <详情>
2017-07-19 10:53:30
国内资讯 苹果数据中心选址贵州 数据中心规模增长几何?
7月12日,苹果宣布将投资10亿美元在贵州建立其在中国的首个数据中心,也是目前投资贵州云计算大数据行业最大的海外公司。 <详情>
2017-07-19 10:32:00
云资讯 落成西南地区首例数据中心双区布局 腾讯云计算加速
腾讯云今日宣布新增国内2大数据中心:成都第二个数据中心、广州第四个数据中心。6月13日,腾讯云宣布开放了成都第一个数据中心,今日成都二区开放之后,国内互联网云计算服 <详情>