在今天的数据中心行业中,最热门的流行术语可能非数据中心基础设施管理(DCIM)莫属了。现如今的几乎每款产品似乎提供了某种DCIM功能,并且还有几款独立的DCIM系统声称能够覆盖一切。但DCIM到底是什么?其到底应该做些什么呢?
数据中心基础设施管理监控工具的出现,引发了一些问题。什么因素使得DCIM对您的企业是有价值的呢?其是否会有助于提高您企业的盈利能力呢?其能否执行您企业最初所需要的一切工作需求,并能够随着您企业的发展一起成长呢?部署实施DCIM及保持其更新需要花费您数据中心工作人员的多少工时呢?这些都是在您数据中心选择采用任何一款DCIM系统之前,所需要询问您的供应商,并问问您企业自己的问题。
早期的DCIM是关于管理楼层空间,跟踪资产。电源使用效率(PUE)的度量推动其成为了一款更为全面的用于监控整个数据中心的基础设施的工具。如果您的数据中心真的关心的数据中心的能源效率,提高PUE值,并节约能源成本,那么您将需要掌握关于您数据中心的全方位的电力和冷却信息以及资产管理信息,而这些信息均可以储存在一款DCIM系统中。鉴于当前业界的减少能源消耗使用和节约成本的挑战压力,那句老话:“您无法对您不能测量的的设备实施管理!”从未没有变得如此真实。
对于许多一般性的数据中心而言,掌握操作空间的室温数据、机架功率电源消耗数据和不间断电源(UPS)的报警数据、以及空调故障数据就足够了。而来自多家硬件和软件供应商的DCIM选项有多种形式——从制造商的智能插座板,计算机室空调(CRAC)和湿度传感器到资产跟踪和机柜安全访问,并许多将这些基本参数集成整合为一个成本效益数据包,以便可以实现更多的效益。但是对于大型数据中心设施而言,特别是对于那些想要跟踪PUE值,并大限度地提高能源和计算使用效率的企业,掌握更多的信息则是必要的。
您数据中心可以从每家供应商那里部署采用离散的DCIM方法——独立的UPS和空调单元、机架电源、中央冷却设备、发电机和资产管理。但是以这种方式创建一个主要的DCIM系统将导致一系列显示、报告和数据列表的混乱,甚至某些数据可能会重叠并且变得不方便。更可能的情况是,大多数系统将被淘汰,导致大量的资金花费在技术上,但却没有收到管理的益处。
现在,数据中心中的一切都是相互关联和相互依赖的。随着处理器使用的增加,服务器获得更多的功率,然后减少计算负载。这影响了数据中心的冷却要求,在较新的数据中心设施中,应该通过具有变速控制的空调提供冷却。这些反过来又会引起泵速,冷却器容量和冷却塔操作的变化。在设计良好的基础设施中,这一切都应该自动平衡,但仍需要实施监控,以确保其正常工作。
来自DCIM系统的信息应该还有助于确定如何在数据中心内部部署和使用计算硬件,以便尽可能实现高效地运行。假设您的冷却设备可以处理集中的刀片服务器,但只有在当CRAC以大速度运行时才行。采用不同的部署方法可能会使用消耗更少的能量,但除非您可以看到这条链上的所有设备的功耗和操作点,否则您是不会知道的。同样,除非您数据中心可以对替代品进行模拟建模,看看其真实的意义,否则您无法知道能够做些什么以便改善操作。
简而言之,DCIM在数据中心的角色作用的显著扩展,也使得其复杂性随之明显增加,故而企业数据中心需要采用一套良好集成的解决方案。
集成DCIM系统的要求
在考察现代的DCIM方法时,有两项主要的事情需要考虑:通用性和数据处理。
真正通用的DCIM产品必须满足两项大的要求。首先,系统必须能够连接到空调、UPS系统、电源插座、电源配电单元、服务器、冷却机组、水泵、温度湿度和压力传感器、电表、冷却塔、发电机、电池监控器、照明控制、消防和安全系统、计算硬件以及与数据中心的操作有关的任何其它事物。第二,其必须在执行上述所有这一切时是与供应商无关的。必须无缝连接到每家制造商的硬件,并将所有可用的数据信息传递给DCIM系统,具有完全透明性。考虑到数据中心的复杂基础设施中的所有不同设备以及所使用的各种数据和报警协议,这可能是相当困难的。
当然,一款完整的DCIM系统还应包括跟踪资产的基本能力。
在选择一款DCIM系统时所需考虑的第二大要求是数据处理。DCIM广泛的扩张带来了数据爆炸。如果您数据中心真的测量和跟踪了数据中心的所有方面,那么您将所获太多的数据任何人都无法完全吸收。大多数数据中心设备现在都是网络连接和IP可寻址的。空调和UPS系统可以提供多达256个数据点。较新的计算硬件可以就内部温度、空气流、风扇速度和处理器利用率等方面生成大量的测量数据。
这些数据量远远超出了您的预期——或者远远超出了您所实际关注的领域——除非您是一家制造商,需要随着时间的推移收集设备的磨损,性能和能源效率的历史数据。对于普通用户来说,这些大部分数据是无意义的。
但是,您数据中心的DCIM系统需要捕获它,以避免丢失对您重要的参数。
那么,您要如何处理每天所收集的大量数据呢?将所有这些数据转换成信息,就是区分一套及格的解决方案和好的解决方案的差别所在了。为了能够作为管理工具而发挥作用,所有物理,电气,机械和操作方面均需要集成,并做到以下几个方面:
通过图形化的突出显示,指示异常和操作参数的变化,以便在其发生之前,提醒您潜在问题。
具备快速演示,并容易地深入探索的能力,以便获取有关任何条件的更多详细信息,其应以清晰的图形格式提交显示原始数据。
这肯定是一个具有挑战性的任务。随着各种的设备类型和制造商组成一处现代的数据中心,仅仅只是显示漂亮的3D图片、以及在问题已经发生后,才发出警报是远远不够的。重要的是,对于实施操作管理所必要的全部信息是否都是在第一位的。只有这样,才能考虑以3D图片显示是否提升了人们的理解,并使用户得以能够更快的掌握相关的意义并采取行动。
关于DCIM系统的更多优点
在确定了您数据中心的DCIM系统涵盖了上述基础层面之后,您可以继续研究构成全功能的DCIM系统的其他三个选项。
1、了解您数据中心是否可以运行“假设”场景来查看添加设备的效果,或者查看如果基础架构中的某些内容发生故障,会导致什么情况。在规划在何处安置新硬件时,这可以说是相当有帮助的。一些系统甚至具有计算流体动力学(CFD)集成。由具有空气流量和CFD系统的相关知识背景的人员来解释正确构造的CFD模型可以是相当有价值的补充。然而,输出数据的质量取决于输入数据的质量。CFD模型可以被构造为显示任何事物的好或坏,因此当其作为DCIM部署的一部分时,必须定期对照实际的条件进行验证。
2、该系统还必须能够增长并适应未来的需求。数据中心总会有新的硬件和持续不断涌现的关于现代化的数据中心基础设施的新的方法和技术,故而DCIM系统应该能够整合您企业的未来需求。理想情况下,这可以通过模块化的方法完成,要求您在开始时只购买所需的零件组建,并根据需求的变化以协调的方式增长。
3、最后,关于数据中心最初创建时的基本信息,数据库,图形,并持续支持对其实施维护更新的需求。许多DCIM系统被淘汰的原因就在于数据中心工作人员无法使其保持更新。
现如今,没有某种形式的DCIM,甚至即使是运行一处小型的数据中心也变得不切实际。仅仅依靠设备显示面板的报警和零星读数是不够的。您数据中心需要问问自己需要监控多少设备,需要监控哪些资源的消耗,并保持所需的控制级别。如果基本监测是必要的,那么比您最初所需要监控的范围监控更多,可能是更好的;毕竟,您企业的需求会随着时间的推移而增加。
但是,如果您知道您需要一套完整的数据中心基础架构管理工具来处理主要操作,那么,在确保所有必要的接口都是可用的之后,最重要的是要将数据转换为有价值信息,并以恰当的形式显示。