在过去几年里,数据中心发展很快,新建项目很多,也随之暴露出不少问题:未能满足企业业务需求,或者在测试验证或TIER认证过程中才发现问题,但亡羊补牢的修复需要花费更高、更耗时。这些失误,无论是数据中心业主还是设计者,都需要承担一定程度的责任。

专家对大量的案例研究发现,数据中心故障、项目延期、超预算等问题,起因大都根源于建设阶段,甚至项目早期的资金阶段——正在确定设计目标、预算、时间进度、需求建议书和采购文件发布、搭建建设团队的时候。原因是各利益方的目标未能协同一致、以及承包商的表现不良、项目计划不足和团队沟通问题。

建造监管、计划和预算的疏忽,意味着新建数据中心将不能满足业主对弹性的期望值,或者需要额外时间或者预算,来解决验证期间甚至更晚些时候暴露的愈发显著的问题。

导致数据中心表现不佳的建设问题可以归结如下:

- 复杂系统的整合不佳

- 缺少完整彻底的验证,或是压缩了验证周期

- 设计变更

- 材料或产品的替代

这些问题出现在建设阶段,验证甚至运维阶段,可能影响预算、项目进度或IT运营。这些建设问题经常发生是因为变更管理流程不佳,项目团队缺少经验,项目参与者的目标不一致,或者缺少第三方验证。

1、指定数据中心业主代表

所有利益方在项目伊始就应该认识到,业主的目标大大有别于建造者的目标。业主想要一个能够最佳满足成本、建设周期和所有业务需求包括数据中心可用性的数据中心。建造者想要满足项目预算和周期要求,同时获得一定项目利润。数据中心可用性和运营考虑通常在建造者的考虑范围和专业知识领域之外。

因此,当需要利用承包商在材料和人工成本、设备可用性、本地行为准则和实践等方面的经验,以便节省资金和帮助业主按照既定的项目周期进行建设,而不希望影响可靠性和可用性方面的时候,由项目业主或业主代表全力主导合同语言、流程、权限,以限制承包商去变更或者破坏设计决策的能力,就势在必行了。

业主应当指定有经验的代表,审核承包商的资格、经验、人手、领导力和沟通能力。缺少经验和报价便宜的承包商经常会出现质量控制问题和设计上的偷梁换柱。

业主或业主代表应该完成所有的项目要求,建立大家一致认同、基于运营序列和合理的、有激励性的建造进度表,包括留有足够的时间去做严格的和完整的验证。此外,业主代表应该经常性的检查项目进度、通知团队成员项目进展,以确保分配给测试和验收的时间没有被减少。

数据中心建设

项目经理,或承包商,要关注可能要执行序列外任务的进度表。执行序列外的任务以及返工去纠正错误放置的电气服务、管道、线缆等,这些都可能导致项目进度延误问题。

建造进度延误不应该用放弃测试验证来弥补滞后的时间差。在建造合同中加入多项针对延误的惩罚条款是一个应该考虑进去的解决方案。

2、价值工程

价值工程把“价值”定义为:“对象所具有的功能与获得该功能的全部费用之比”,价值工程(VE)被业主广为接受,以减少按照完整设计建设的预期成本。价值工程的流程有其价值,但它往往把重点放在建设的第一成本。这一方法常由承包商实施,在设计者中的口碑很糟,因为它经常倾向于变离设计初衷。然而也有其他设计者相信,对富有经验的人来说,即使在数据中心项目里,价值工程可以为项目管理者节省成本,而不影响可靠性、可用性或运营。

如果价值工程在执行时没有运营的反馈以及适当的设计评估,任何从价值工程变变更导致的初始的节省都可能会远远少于补救修复以达到并行的可维护性或者容错的必需功能的工作量,此外还要增加数据中心生命周期的运营成本。

数据中心业主需要很小心从价值工程出发考虑导致的项目变更:这些变更可能或偏离项目要求或偏离设计意图,而且如果价值工程的变更基本上改变了设计,想达到成本节省的目的也很难。因此,每个变更都应仔细观察它对设计的影响。聘用有数据中心经验的设计工程师或项目工程师也许可以减少建设过程中不恰当的变更的数量。即使如此,数据中心业主也要认识到不当执行的价值工程将导致设备替代或系统合并,从而影响业主希望的容错或并行可维护性。承包商可能会用有不同容量、容错或规范的低价设备替代原有设备,从而影响可靠性。

价值工程的变化的例子包括:

- 去掉并行的可维护性需要的阀门;

- 减少ATS数量;把设备整合到单一ATS上;

- 把热泵和能量效率系统整合在一起,而不考虑并行的可维护性和容错运营。

3、充足的验证时间

导致建造延误,有时是因为最初的建造进度表没有考虑进去充分的系统联调和故障模拟测试需要的时间。建造团队在严格的数据中心测试验证方面经验不足,是发生这类错误的主要因素。建造者有时也会设定最终截止期限,然后当工程滞后时,把测试验证时间当成一种缓冲。基于上述,对业主及其代表来说,很重要的是,计划出充分的测试验证时间,确保承包商按时或提前完成建造。专家建议,比较妥当的做法是,测试验证机构和总包商作为合作伙伴早点介入,共同规划制定项目进度。

此外,业主及其代表应该仔细观察建造项目招标以确保招标包括如下要求所需的资金及时间:

- 场验

- 由第三方承担的系统联调和故障模拟的验证

- 假负载以模拟关键环境的IT满载

- 柴油燃料测试以验证发电机系统;

4、数据中心建造失误案例

建造过程中几乎任何时间都会发生一系列问题,包括招标过程中。

例如,一个业主的采购部门试图大程度压低供应商的UPS价格,但是忘了订购连接UPS的母线和其他零件。

另一个例子,一个承包商因其低价从800英里外用滑轨运输完全组装完成的发动机的方案而中标。当供应商威胁不能支持对这一创新做法的保修,承包商被迫承担用更传统的方式运输设备的额外成本。这种情况下,业主得更明察秋毫:承包商是否会通过变更设计或用其他产品替代来补偿自身的损失。

电气母线槽的安装问题也很常见。经验丰富的设计者和承包商,或那些在建造阶段参与的运维人员,知道那些母线槽需要定期在负载下查看连接点,以确保连接点没有松开或过热而导致电弧故障。

给关键支线贴标签也非常重要,运维人员可以在出现事故时,知道如何快速应对以及关掉哪个系统。设计规范和建设团队都会按照数据中心开发商的对设备标识系统的清晰要求来执行。相反,也有实例说明,建造者不考虑后续的维护或者关键基础设施的标识,把母线槽跳接到共用的区隔,忽视了给任何一个导线贴标识。

在一些T3项目认证中,UPTIME观察到如下制冷系统的问题:

当屋顶空调控制序列协同出错时,RTU供应的风扇和室外空气阻尼未能同速反应导致数据间过压或低压:一种情况是超压炸倒一堆墙,一种情况是过压或低压导致开门或关门危险。

并行的可维护性要求特别检验火灾检测及灭火系统以确保任何维护修理活动不影响电力或制冷。

在一次UPTIME建造认证中,专家发现,即使当机械板完全隔离时,一个给提供稳定电压系统的机房空调关机继电器供电的双路供电UPS,也给配电盘提供活跃电源,迁移这个继电器导致全部电压损失,全部机房空调的断路器打开,数据机房和电力机房的关键制冷丧失。这个问题是对一个价值2千万美金的数据中心的并行可维护设计在建造中进行细微变化导致的。

燃料供应系统也对建造失误有极大影响。通常来说,发电机的柴油燃料通过过滤和控制室从储油罐泵出来输送到靠近发电机的日油箱,但在某个项目中,一个有经验的数据中心开发商为一个很小的建筑空间作出一个过度复杂的设计,燃料供应商没有正确地进行质量控制和系统搭建,测试验证团队也没有严格确认系统建造符合设计意图,这是最主要的失察行为。实际上,当建造认证团队到达现场,测试验证团队仅能手动测试真空管。操作这些阀门要求人员爬上和爬过管道。基于承包商的预算,很多系统被移动和重建。数据中心的拥有者不得不承担额外的项目时间、测试验证、整改和建造认证测试。

5、避免建造问题

一旦设计确定并符合质量政策要求,变更控制流程是建造阶段管理和控制风险的基本要求。基于不同原因,很多建造者,甚至一些业主,可能不清楚与数据中心项目相关的变更控制的关键性。没有项目能完全做到零差错,但是,好的项目流程和文档记录分类将减少错误的数量和严重程度,有时使错误的发生更易修正。

专家建议数据中心的业主、开发商、承包商等所有相关人士,按照以下流程部署数据中心项目,以避免错误和其他问题在建造阶段发生:

1) 搭建一个有广泛的数据中心经验的设计、建造、项目管理团队。

必要时引进第三方专家帮助落实质量政策要求。IT群组可能不理解进度风险或者项目的复杂性。有经验的团队会驳回不符合质量政策的不合理的进程安排或者价值分析建议,避免测试验证时间压缩,提升运营可持续性。另外,有经验的团队在运营和验证方面见多识广,这点将会对业主有莫大帮助。表面成本可能增加,但有经验的团队带来更高的投资回报。

此外,运营应该成为设计和建造团队从一开始的一部分。把运营也纳入变更管理,有机会分享和学习数据中心如何运行的关键信息,包括设立时间点,设备轮换,变更管理,培训,节省库存,这是日常运营和事件处理时非常基本的要素。

2) 第三方验证确保数据中心业主达到设计目标

专家认为,第三方验证帮助改进承包商的表现。有了验证,将激励承包商干得更好,这可能是因为验证时可能会发现建造的“缺斤短两”并且得占用承包商的费用整改。有了第三方验证,迫使承包商在“曲解”合同和作出没有经验的项目工程师和业主代表可能发现不了的变动时,更为谨慎。

由中立的、第三方机构做出的认证和验证更有效果。不会受到设计方或建设方等利益方的影响。

测试验证团队应该关注设计和安装是否满足质量政策要求:如果在验证阶段没有识别出异常事件的根源,那运营阶段一定会再次发生。

数据中心jifang

第三方验证和认证提供设计变更和价值工程的专家评审。现实中建造过程常会一团乱:现场团队只顾盯着预算和时间管理,可能会迷失“初心”,而独立第三方机构不受项目压力影响,审核采购文件中的信息邀请书、价值工程、设计变更等,帮助项目按轨道前进。

专家认为,当发现设计出现偏差时,一个组织严密的建造流程,包括系统联调和故障模拟的测试验证,以及数据中心等级认证,将有能力尽早发现问题,以减少额外支出或整改。

进入TIER等级认证流程再去检查设计和建造问题或者发现一个数据中心不是业主希望的在线可维护或者容错,已经为时甚晚或者改造代价甚高。当然,这也同时说明了第三方机构的价值:发现了存在的问题,帮助企业挽救了一个潜在的事件,避免故障发生。

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2024-01-09 16:53:00
市场情报 中兴通讯分布式存储+ DPU,加速数据中心转型
存储技术在不断地创新、完善、加速演进,以更好地满足业务的存储需求,但同时也使得存储协议和文件系统越来越繁重。 <详情>
2024-01-09 09:35:00
算力新闻 【算力之声】格力杨惠雄:绿色、低碳、高质量发展是数据中心发展关键词
格力专注于数据中心领域制冷技术研究,目前温控产品方案可应用各类型数据中心项目,高效冷源、专用末端、智能群控,专业服务可为数据中心提供整体式的空调系统解决方案。 <详情>
2024-01-04 16:44:00
机房建设 限价1680万元 江西电信数据中心三期蒸发冷却空调招标
本次采购的机组及管路系统须满足弹性可平滑扩容、便于后期扩容机组、末端要求,所有机组可统一控制。 <详情>