几十年来,当谈论到计算机的性能时,人们理所当然地认为指的是运行速度。而在超级计算机的世界中,其运行速度是以每秒浮点运算次数来衡量的。目前全球运行速度高的计算机是日本的Fugaku超级计算机,其运行速度高达415 Petaflops。
但是将运行速度作为超级计算机性能比较的唯一度量标准存在一些问题。而基于FLOPS的技术竞赛不断见证速度更快的超级计算机的出现,这些超级计算机消耗大量的电力并产生大量的热量,因此需要部署非常复杂的冷却系统,以防止它们过热。过分依赖计算机基准测试的速度也会轻视其他重要特性,例如可靠性、可用性、有效性,以及是经济性。而将运行速度作为其成功的主要衡量标准,使得超级计算机的总拥有成本达到了前所未有的高度,同时也加剧了对环境的负面影响。
全球超级计算机的Green500排行榜及时提供了一种不同的方法。其排行除了以运营速度为中心的Top500强之外,也是全球最节能的500台超级计算机的排行榜,其目的是提高人们对除FLOPS以外的其他性能指标的认识。它通过根据功耗对超级计算机进行排名,并考虑到能源效率和可靠性来实现这一目标。Green500正如其名称所暗示的那样,这是为了向超级计算机领域的各种利益相关者和投资者宣传环境保护的重要性。
Green500排行榜揭示了有关超级计算的发展方向,并指出了效率可能成为行业领导者和追随者之间主要差异的原因。
目前在Green500榜单中排名第一的是由日本初创厂商Preferred Networks公司建造的MN-3系统,其能效为21.1 gigaFLOPS/W。以运行速度来衡量,MN-3在500强排名中排名第394名,并且目前还不能用于商业用途。
排在第二位的是NVIDIA公司开发的人工智能超级计算机Selene。Selene的能效为20.52 gigaFLOPS/W,在效率上可与MN-3并驾齐驱,但在运行速度的Top500排行榜上排名第七,因此其运行速度相当快。
Selene采用独特的开放式架构DGX SuperPOD。而NVIDIA公司在短短几周的时间内完成了DGX SuperPOD设计和制造,将其DGX处理器设计与Mellanox的人工智能网络架构结合在一起。
正是这种配置为Selene带来了更高的性能、效率和经济性,以及在各种用途方面的灵活性。NVIDIA公司开发Selene的目的是创建一个超级计算机级系统,该系统功能强大,足以训练和运行用于自动驾驶汽车等领域的人工智能模型,并且十分灵活,可以成为以学术为主导的深度学习研究项目的一部分。
自从部署以来,Selene每周可以同时运行数千个工作。它执行人工智能数据分析、传统机器学习和高性能计算(HPC)应用程序。DGX SuperPOD的强大功能正被一些公司使用,比如汽车厂商Continental公司、航空航天厂商洛克希德马丁公司,以及云计算提供商微软公司。
Green500榜单为超级计算机的发展指明了一个新的方向,希望成为人工智能行业先驱的组织需理解对计算能力的需求,这种能力提供了前所未有的规模以及快速简单的部署。
未来的超级计算机需要在更加节能环保的数据中心中运行。而采用开放式架构,不再需要花费数月时间才能调试完成的专有设计。
现代计算需要具有多种用途且使用寿命长的计算机,将尽可能多的处理、内存和存储设备集成到更小的空间中,并尽可能减少能耗。名列Green500榜单中的一些超级计算机已经将这些想法付诸于现实。