身处数据中心这一行业,相信大家一定对从T1到T4的机房等级四级划分、以及“五个九”的系统可用性感到耳熟能详。但是,你知道它们的由来吗?
这就要说起由美国通信工业学会(TIA)TR-42.2委员分会制定、由美国国家标准学会(ANSI)和美国通信工业协会(TIA)于2005年4月12日首次颁布的《ANSI/TIA-942-2005数据中心通信基础设施标准》。该标准是一部以数据中心为对象的技术规范,为数据中心设计提出了新的设计理念、系统架构与技术标准,成为当今商业建筑建设过程中通用的遵循标准之一。该标准规范了数据中心机房场地、供电、冷却、安防、地面承载、接地、电气保护以及其他工程和建筑上需要满足的条件,为数据中心机房的设计和安装提供要求和指南。
在TIA-942《数据中心通信基础设施标准》中,数据中心的四级可用性划分引用了源于The Uptime Institute所研发的Industry Standard Tier Classifications Define Site Infrastructure Performance(采用分类等级的方式定义场地基础设施性能的工业标准)。
数据中心机房设施功能分类的主要依据是可用性。The Uptime Institute依据工程需求与实践,提出了场地基础设施的分类等级的体系框架,针对数据中心基础设施期望达到“五个九”即99.999%的系统应用可用性的需求,提出了与之相匹配的机房场地基础设施(供电、空调制冷以及其他的相关系统)的可用性等级指标,并将数据中心分为四个等级,由“T1”没有冗余部件组成的系统(可提供99.671%的可用性),到“T4”有冗余部件(能够故障容错)和实现不间断维修的系统。四个不同的等级包含了对建筑结构、安全性、电气、制冷、接地、防火等不同的要求。
T1数据中心基础设施:最基本的数据中心
“T1”的数据中心是基本型的数据中心配置,有计划和无计划的运营中断都会影响它的正常运行。数据中心机房配有供配电系统和空调制冷系统,但是它可以或不一定有架高的活动地板、UPS或者发电机设备。如果系统配置了UPS或者发电机,但这些设备是单个模块的系统并且有很多单路径故障点。基于一个年度内进行预防性检修和维护的需要,机房内的这些基础设施需要完全关闭停运。当发生机房内的设备故障、操作错误以及外部因素或自然原因等紧急情况时,将引起数据中心运营的中断。T1机房基础设施没有荣誉的组成部分,可提供99.671%的可用性。
T2数据中心基础设施:部件冗余
“T2”的数据中心与“T1”的主要区别是基础设施系统中的关键设备采用了部件冗余配置(N+1)。机房内有架高的活动地板、UPS和发电机,但仍然是单模块系统。关键的供电线路的维修和场地内其他基础设施的维修维护都需要关闭中断。T2的供配电系统和冷却分配虽然仍是单通路组成,但由于关键设备是冗余配置,所以可提供99.741%的可用性。
T3数据中心基础设施:可在线维修
“T3”数据中心的功能考虑到了任何有计划的机房基础设施活动安排,而不应使IT设备硬件系统运行中断。有计划的活动安排包括预防性和程序性的维护修理、零部件更换、新设备的增加(扩容)或调整部件的容量、部件和系统的测试等。对使用冷冻水系统的大型机房来说,这表示要配置两套独立的管路,在进行维修或者在一条管路上测试时,另一条管路要保证有足够的容量维持系统正常运行。无计划的活动,例如基础设施的零部件发生故障,仍然会造成数据中心的运行中断。T3由多条有效地电力和冷却分配路径组成,通常只一条路径正常运行,有多余的备用组成部分,所以可在系统正常运行的情况下进行有计划的工作安排,具有可在线维修功能。系统的可用性可达到99.982%。
T4数据中心基础设施:故障容错
“T4”数据中心基础设施最重要的功能是具备故障容错功能,对于机房有计划的活动安排,包括预防性和程序性的维护修理、零部件更换、新设备的增加(扩容)或调整部件的容量、部件和系统的测试和意外的事件,都要保证系统关键负荷不中断运行。在系统结构上需要同时又两路在线运行,供电系统应该是两个独立的N+1UPS系统冗余。关键负载的大负荷不应超过每一个系统的大输出容量90%。“T4”要求全部IT设备硬件有故障容错的双电源输入。严格的故障容错能力使数据中心具有维持意外故障发生或者运行错误时,不发生运行中断的能力。T4由多条有效的电力和冷却分配路径组成,并且具有故障容错功能,可提供99.995%的可用性。