考虑到IT预算方面一向遭受压力,加上过去十年方兴未艾的“绿色IT”潮流,你会想:说到找出并解决数据中心的低效问题,IT部门会行动起来。但是据今年6月3日发布的一份报告声称,实际情况远非如此。
斯坦福大学斯泰尔-泰勒能源政策和金融中心的研究员Jonathan Koomey与资源咨询公司Anthesis Group的合伙人Jon Taylor共同撰写了这份报告,报告阐述了所谓的“休眠”服务器(comatose server),这类服务器在白白耗电,可是至少已有六个月没有在提供信息或计算服务。
两位作者援引了麦肯锡公司早在2008年的一项调查;那项调查当时发现,在企业级数据中心中,服务器利用率“很少超过6%”。两位作者表示,此外,超过30%的服务器被发现通了电,却处于闲置状态,并援引了麦肯锡以及Uptime Institute和TSO Logic的研究结果。
Koomey和Taylor估计,如今全球使用的休眠服务器多达360万台。正是诸如此类的数字让CIO和IT经理们处于困境。不过,对我们许多IT人士来说,这类数字没什么好奇怪的。
我在待过的绝大多数数据中心都亲眼目睹过低效问题。低效问题并不仅限于早被遗忘或配置过度的服务器。这个问题还蔓延到了数据中心的其他方面,包括通了电但闲置未用或毫无必要的网络设备、安全工具,甚至对数据中心所设温度过低。这些因素共同导致了严重的低效问题,因为在任何一个数据中心,电费都是大的一笔运营开支。
Koomey和Taylor在报告中表示:“在21世纪,每家公司都是IT公司,但是太多的企业将就于其IT基础设施存在的严重低效问题。存在那么多的休眠服务器,这清晰地表明,设计、建造、配置和运营企业中IT资源的方式需要有所变化。需要的变化并非主要是技术上的,而是要围绕管理方法、信息流和动机。”
的确,如果我们看一下为何会存在这些低效问题,你会发现许多因素与技术问题没有太大的关系。相反,那些负责运营数据中心或负责管理数据中心内设备的人监督和管理乏力才导致了大多数此类问题。
虽然不可能让系统利用率接近100%,也不可能确保每个通电设备实际上都物尽其用,但是大有改进的余地。比如说,万一出现故障,报告中被认为是休眠服务器的一些服务器有可能是被安装成热备用或灾难恢复系统的服务器。如果真是这样,该系统是否真正需要处于热备用模式,还是说冷/热备用模式更经济高效,却提供几乎一样级别的冗余性?
你可以通过下列七宗罪,找出并解决数据中心低效问题。如果你对于为何会出现低效问题或者如何解决或预防低效问题有自己的一番高见,欢迎留言交流。
第一宗罪:针对未知因素进行规划。
IT管理员往往购买过多的数据中心硬件,以支持业务战略中的未知项目或关键项目。虽然此举在一些情况下可以接受,但是这个策略很快就会失控。闲置设备不是装箱储藏起来,而是通常安装后保持通电状态,万一果真需要该闲置设备(这种可能性极小),它随时可以投入使用。
第二宗罪:没有停用策略。
应用程序换成现代系统后,旧系统(及数据)依然存在,因为没人知道如何处理它们。我发现数据中心的管理员们普遍担心:一旦应用程序或数据处理掉,有人需要它。
第三宗罪:不知道哪些是闲置服务器,任由它一直闲置着。
在IT管理员人员流动率很高的企业组织,你会发现数据中心部件到处闲置,因为没人知道哪些是闲置部件,而且很怕询问。新招员工任由闲置部件一直躺在那里,而不是大胆地关闭闲置未用的系统。