数据中心68

存储厂商NGD Systems公司副总裁Scott Shadley在一次专题访谈中,探讨了SNIA计算存储(CS)工作组自成立以来的技术进步。Scott Shadley除了担任NGD Systems副总裁的职位外,Scott还是存储网络行业协会(SNIA)的董事会成员。

标准组织推出的新技术获得“官方定义”并不多见。但要获得这样的“定义”,这项技术需要相当大的突破。因此,希望正式引入计算存储(CS)——这是一种淘汰传统计算机存储技术的存储架构,以提供一种更快、更经济、更省电的方式来存储和分析PB字节的数据。

企业存储的发展

简而言之,计算存储是一种IT架构,其中数据在存储设备级别进行处理,以减少必须在存储和计算平台之间移动的数据量。因此,该技术提供了一种更快、更高效的方法来应对数据密集型世界的独特挑战,通过减少数据移动和允许对分析的响应速度高达20到40倍来满足减少的多余带宽,并提供非常低的延迟响应时间。

如果考虑一下企业存储的发展历史,计算存储的发展速度是适当的。得益于NVMe和NVMe Over Fabrics辅助的新闪存技术,该技术的发展越来越快。当今的数据中心(包括超大规模数据中心)主要依赖于使用冯·诺依曼体系结构的基本方法构建的传统服务器硬件,冯·诺依曼体系结构适用于几乎所有通用服务器,是具有70年历史的计算机体系结构,坦率地说,这种体系结构多年来从未经历过太多的变化。

而一些新方法并没有取得太大的成功。现在有了诸如人工智能和机器学习之类的应用程序,这些应用程序需要大量的原始数据(结构化和非结构化),这些数据需要高计算能力来“学习”,因此计算能力已成为瓶颈。在传统的横向扩展模型中,此问题通过添加节点来解决,从而获得更多的分布式计算能力和更多的内存。不幸的是,从投资成本和运营成本角度来看,添加服务器节点的成本很高。添加更多节点还增加了互连的长度,从而增加了数据移动和分析所需的时间。

计算存储这种技术可以将传感器(例如自动驾驶汽车、视频监控摄像头、交通信号灯)中的原始信息巧妙地组织为有意义的数据,因为缺乏移动性可以促进实时数据分析,从而通过减少输入来提高性能/输出瓶颈。随着人工智能、机器学习、物联网工作负载涌现出惊人的数据量(IDC公司的研究表明,到2025年,数据总量将超过163 ZB,其中95%是由物联网设备生成的),这项新技术是真正缺失的环节。

调研机构Dimensional Research公司最近对300多位计算机存储专业人员进行的一项调查揭示了这一挑战,表明存储瓶颈可能发生在10 TB以下。这样,计算存储可以提供更强大的处理能力来辅助每个主机CPU,从而使组织可以提取其可以生成的所有数据,并仅提供真正需要的数据,从而使“管道”尽可能保持开放。这样一来,就可以收集更多分析所需的原始数据,并为组织提供仅从该数据中提取实现价值所需的自由。在比较中,当组织必须处理整个数据集时,就会延误增值。这种方法可最大程度地提高效率,减少功耗,并降低运营成本。这种“分类、转换、发送”方法使快速、全面和有意义的实时数据应用成为可能。

计算存储的官方定义只花了一年时间就制定出来了,这是一个相当迅速的过程,证明了对这种截然不同的计算机存储技术的迫切需求。一年多前,存储网络行业协会(SNIA)召开会议,研究如何围绕计算存储技术定义和制定标准。SNIA是一个非盈利组织,由198家信息技术领域的成员公司组成。经过几个月的会议和一些辩论,他们现在已经制定了官方定义:

•“计算存储体系结构可通过集成计算资源(直接与存储、存储附近或主机与存储之间)集成来提高应用程序性能和/或基础设施效率。这些计算资源不在传统的计算和内存体系结构之外。

•这些体系结构的目标是:启用并行计算;减少I/O流量;减轻对现有计算、内存、存储和I/O的其他限制。”

受益于计算存储的行业

当将计算存储应用于多个用例时,将变得更易于理解。要求计算存储技术强大和高效的行业示例是新型“智能”汽车和即将推出的全自动驾驶汽车,这些汽车必须处理数据负载(每天高达28TB)以进行分析,否则可能会影响驾驶员的安全性。一些设计计算存储架构的公司已经能够提供利用小型化技术的技术,该技术可以与SSD硬盘一起使用来处理数据负载。这在空间受限的边缘相关(例如汽车)中效果很好。但是,尽管外形尺寸很大,计算存储解决方案仍可以将功能提高20倍甚至更多,并且使支持人工智能的系统能够以前所未有的方式读取和分析数据。

在数以千计的物理服务器和数百万个虚拟机上运行的超大规模数据中心(例如AWS的数据中心基础设施)必须并行执行各种工作负载。这些超大规模数据中心开始使用计算存储驱动器(CSD)来处理PB级的数据,同时也带来了体积小、功耗低但仍具有巨大计算能力的更小尺寸的优点。这样,体积小巧但功能强大的计算存储驱动器(CSD)可以帮助提高超大规模架构的计算能力,这些超大规模架构将机器用于人工智能(AI)和机器学习(ML)应用程序,而这些应用程序通常需要诸如实时、复杂和并行索引的操作和模式匹配。

例如,出于欺诈检测目的而需要实时分析大量数据以获取销售点数据的零售企业,也可能会受益于计算存储更快的响应时间。Storage Switzerland公司发布的调查报告指出,“这些应用程序必须在执行分析请求之前扫描大量数据,以识别与查询相关的信息子集。将大量数据移出存储系统,跨网络并移入主机内存会导致时间和延迟损失,这是实时分析应用程序无法承受的。”

内容交付网络(CDN)是利用计算存储技术的另一个市场。在这里,该技术可以帮助进行加密/数字版权管理(用于验证用户可以访问内容)。在这种情况下,计算存储通过安全地解锁内容而不共享密钥来提供更好的数据管理。这种将每个服务器机架的密钥匹配提高40倍的能力仅仅是这项工作的开始。

总结

事实上,在当今数据密集的世界中,更少的数据移动是至关重要的。数据移动的成本不仅仅是时间,还有资源,有时还会浪费分析资源。现在是采取下一步存储和实施NVMe计算存储驱动器的时候了。按照数据的步骤进行操作,注意在硬盘驱动器内部做了多少工作将节省数据移动时间,这将提高效率,并减少主机CPU和内存负载的采用。

相关阅读:

如何维护超融合数据中心  

漫谈数据中心的演变和发展  

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2020-03-03 09:50:00
国内资讯 4.2万机架,电信北方核心汇接节点开工!
中国电信京津冀大数据基地是天津市重点项目工程,预计可带动京津冀地区大数据、人工智能等一系列上下游产业链近500亿元的投资。 <详情>
2020-03-02 17:39:00
整机柜服务器 科技抗疫背后的1100万台服务器算力
目前中国已经是全球第二大服务器市场,并且增长迅速。能够对服务器保持如此旺盛的需求,是因为中国正处于从信息社会向智能社会升级的关键时期,服务器所提供的计算力正在成 <详情>
2020-03-02 11:59:00
模块化数据中心 面向未来的数据中心是什么样的?
在全球范围内,最终用户和组织正在生成和使用前所未有的大量数据。但是,要了解全球范围内数据的增长速度以及对存储、管理和访问所有数据的影响可能具有挑战性。 <详情>
2020-03-02 11:10:35
云资讯 抗击疫情,背后是1100万台服务器
2月19日,阿里云公众号发表了一篇文章,提到其华南地区规模最大的数据中心正在急速扩容。 <详情>
2020-02-29 21:22:12
国际资讯 Google 今年将为其美国办事处和数据中心投资 100 亿美元
Google 公布了 2020 年的扩张计划 ,计划在美国加州、科罗拉多州,乔治亚州等 11 个州的办事处和数据中心投资超过 100 亿美元。 <详情>