NVIDIA今日宣布将推出 NVIDIA Mellanox UFM Cyber-AI 平台,这款平台将利用搭载人工智能 (AI) 的分析功能来侦测安全威胁和运作问题,以及预测网络故障等情况,进而将 InfiniBand 数据中心的停机时间降到最低。
NVIDIA指出,过去使用 UFM 平台产品组合来管理 InfiniBand 系统,已有近十年的时间,而这款最新产品加入 AI 技术,运用实时与历史遥测及作业负载数据,学习数据中心的运行节奏和网络工作量处理模式。此平台在这个基础上追踪系统健全及网络修改情况,以及侦测效能表现下降、使用情况和配置文件的变化情形。
新平台会提醒管理员系统与应用程序的异常行为,以及潜在的系统故障和威胁,并且执行修正。如果发现有黑客企图进入系统,以运行不受欢迎的应用程序(例如加密货币挖矿等情况)等安全情况,也会通知管理员。如此便降低了数据中心的停机时间,ITIC 指出通常停机一小时的成本高达 30 万美元。
NVIDIA Mellanox 网络部门营销资深副总裁 Gilad Shainer 表示:「UFM Cyber-AI 平台可以判断数据中心独特的生命征象,用它们来辨识效能下降、零组件故障和异常使用模式。它让系统管理员能够快速侦测和因应潜在的安全威胁,解决即将出现的故障情况,进而节省成本与确保提供客户一致的服务。」
澳洲国家计算基础设施(NCI)副主任(服务和技术)Allan Williams说:「 NCI在国家研究领域中起着举足轻重的作用。我们的超级运算基础架构可为5,000名研究人员提供服务,服务重要的国家和全球活动。 UFM使我们能够有效地管理超级计算机并优化效能。我们期待利用UFM Cyber-AI的新功能来进一步提高我们的超级运算利用率并提高投资回报率。」
美国俄亥俄州超级计算机中心副主任 Douglas Johnson 说:「我们的 InfiniBand 数据中心多年来一直在使用 UFM 平台,UFM 加上 Mellanox 网络团队的专业长才是我们管理网络与维持网络稳定运作的基本要素。我们见到 UFM Cyber-AI 平台有着无比的优点。