化零为整,裁撤冗源
“化零为整”则是将供电单元(Power Supply Unit,PSU)与服务器节点解耦,以机架为单位重新组织,对降低CAPEX和OPEX都有显著的效果。
传统的机架式服务器,1U或2U,为保证冗余,会采用双供电单元设计,1+1配置。仍以2U的戴尔PowerEdge R730为例,可选750W、1100W、1600W,还有不太常见的495W。按照750W来计算,20台服务器就是40个PSU,总功率30kW(以495W计也要19.8kW)。不论每台服务器上的两个PSU工作模式如何,都有20个是纯为冗余考虑的,浪费惊人。
2U机架式服务器后下方的2个750W电源模块,还有中前部的6组60mm风扇 (来源:张广彬拍摄)
若将PSU从服务器中取出,汇聚成池,统一给20台服务器供电,那么,只需10个1600W的PSU即可,总功率16kW,9+1的配置足够保证冗余度。10个1600W的PSU显然比40个750W的PSU便宜(CAPEX),功率只有一半左右但够用,服务器内部的空间也变得更规整,可以容纳更多的部件(如硬盘)。
浪潮SmartRack 4.0整机柜服务器中部集中放置的10个PSU(来源:张广彬拍摄)
另外,前一种(分散布置有冗余的)情况下每个PSU的负载情况只有20%~30%,后一种(集中布置共享的)情况则可以在50%左右,是电源效率高的时候,也意味着更省电(OPEX)。
电费是OPEX的重头。继续本章开始的估算,5台服务器不停的运转,就相当于美国一个家庭的平均用电量;以每千瓦时0.097美元(Dell在2012年的数据)计,100万台服务器每年的电费就超过2.1亿美元。尽管以服务器生命周期为三年来计算,全生命期内服务器所消耗的电费仍不及购置成本(何况每台1000美元的估价偏低),但是,只要把整体功耗降低10%,100万台服务器每年即可节省2100多万美元,三年累计的效果堪比取消两侧的机架导轨(Rack Rails)。
必须指出的是,这有一个适用场景的问题:配备冗余供电单元的服务器可以独立使用,对外界环境依赖很小;集中PSU之后,每个服务器节点不能独立使用,只能配合特定的机架——换言之,在小的尺度上解耦(decoupling,或disaggregation),又在更大的尺度上重新耦合,适用的也是大规模应用环境。