组织的首席技术官可以遵循一些最佳实践,以确保其IT运营高效,在容量范围内尽可能高效地执行。
Erik Brynjolfsson在其撰写的名为《投资回报率评估,IT生产力差距》的一篇文章中指出:当今IT经理面临的关键问题不是“采用IT值得吗?”,而是“如何好地使用计算机?”对于首席技术官来说,这是一个简单的问题,因为每个数据中心和IT运营都是独特的,并且有许多影响整体运营的变量。
Brynolfsson认为,对于两家拥有几乎完全相同的IT生态系统的不同公司来说,其中一家公司的生产力可能只是其竞争对手的一小部分。但是,首席技术官可以遵循以下几种最佳实践,以确保其IT运营高效,在容量范围内运行并尽可能高效地执行。
1.清理IT设备
清理IT设备可以减轻IT团队的压力。服务器和网络设备都有固定的使用寿命,老旧设备应该按照制造商规定的时间表退役,应该妥善销毁、回收或退回制造商,并擦除所有数据,以确保适当的安全性。
2.采用PUE进行衡量
谷歌公司是全球大的云计算服务提供商之一,该公司运营着大量的数据中心,其中一些数据中心运营数千台服务器。谷歌公司希望数据中心保持满载运行,因此采用衡量能源使用量的PUE值描述其数据中心的效率。
谷歌公司还采用PUE减少用于非计算业务的能源浪费,例如冷却和配电设备的能耗。并且每秒至少测量一次。还将考虑天气因素,因为季节变化对PUE值有着显著影响。
3.管理气流
良好的气流管理是高效数据中心运营的基础。应该完全消除热点,而填充面板可以应用在机架中空插槽,这有助于减少灰尘导致的问题。此外,采用填充面板确保气流不受干扰,灰尘可以很容易地吹走。而适当的气流对冷却至关重要。
使用正确安装的填充面板,使冷空气可以流动到需要冷却的设备,从而在服务器运行时将机架保持在适当的温度。这是一个投资成本最小、性能增强大的解决方案,因此值得花费时间安装填充面板。
4.监视一切
Plant&Works 工程公司指出,数据中心需要采用监视工具。经验丰富的IT技术人员可能会了解多年来使用的系统的每一个细微差别,但是如今的流程和监视工具在理解运营流程方面比运营人员深入得多。业务流程管理(BPM)软件、机器人流程自动化(RPA)和AIOps都是从早期的IT操作管理工具演变而来的,旨在通过自动化流程以及潜在的自我修复系统来增强IT运营。
调研机构Gartner公司将AIOps定义为一个可以利用大数据和人工智能增强IT运营功能的平台,如监控、自动化和服务台活动,并具有前瞻性、个性化和动态洞察力。AIOps平台支持同时使用多种数据源、数据收集方法、分析(实时和深入)技术和表示技术。AIOps解决方案可以了解和监控数据中心的日常IT运营,分析整个IT系统,然后解决问题或提示那些可以解决的问题。
5.容量规划
容量规划是确定组织的数据中心容量和运营需求的过程,以试图了解和满足由于销售和使用其产品或服务而引起的不断变化的IT和能源需求。容量管理试图在高峰使用时平衡适当数量的用户和适当的性能,以确保获得更好的用户体验。IT容量规划涉及估计组织的存储、硬件、软件和连接基础设施所需的资源,以便系统尽可能以最佳的方式运行,同时还减少了容量浪费。容量管理希望在物理或虚拟服务器上增加或减少CPU、内存和存储。
首席技术官应该优化系统,同时通过将业务需求与云计算服务利用率相关联,在应用程序级别不断审查其云计算使用情况。组织首席技术官应该规划容量增长,并通过高级分析来预测未来增加的成本。通过监视所有内容,首席技术官将会非常了解IT部门的CPU、内存、存储和电源使用情况,并采取相应的行动。
6.加强自动化
如今,增加容量、减少冗余,并提高整体效率应该是每个首席技术官的目标。在许多方面,组织都会要求首席技术官去做不可能的事情。大数据只会变得越来越大,越来越难以处理。大数据的五个“V”已经扩展到七个“V”:体积、速度、多样性、可变性、准确性、可视化、价值。
越来越多的组织采用更多的方法来收集、跟踪、量化,甚至可视化数据,但这几乎是一个艰巨的任务。5G的推出和物联网的扩展只会让数据收集、集成、虚拟化,甚至可视化变得更加困难。
Brynjolfsson警告说,“在信息经济中,稀缺的资源并不是信息,而是人类处理信息的能力。”以上很多实践使工作人员摆脱了困境,这并不是一件坏事,因为通常可以让工作人员将更多的时间花在更高层次的和有创造力的工作上,而不是从事繁琐重复的工作。
他说,“通常情况下,信息在价值链的高度自动化部分中急剧加速增长,而导致其他地方陷入僵局,特别是在工作人员必须参与并且流程没有更新的地方,其结果是整体表现几乎没有发生变化。”