超融合存储可以说是存储领域近来最新最火爆的术语。而根据企业客户所咨询的供应商的不同,超融合存储被赋予了不同的确切含义,其解决方案在对多款虚拟管理程序和工作负载类型的支持方面变化很大,并且其在硬件组件和拓扑的灵活性方面也各有不同。
无论供应商们对于这一术语的具体定义如何,事实是,企业客户对于超融合基础设施的构建仍然需要归结为两大关键要求:选择最适合的基础设施产品和服务的组合以匹配工作负载的需求;选择一款超融合模型,以便能够随着不断变化的存储需求适应和扩展,而不会打破可用预算。
虽然超融合基础设施的出现仍然被视为最近的现象,但实际上,其在企业计算方面的应用已经有相当长久的历史了。当代的超融合基础设施是指通过一款基于软件的存储控制器实现服务器和存储技术的统一——有时,其被称为软件定义的存储器或SDS——即:在服务器的软件堆栈实例化。该软件层用作存储控制器,以替代阵列存储控制器的功能。
这并不是一个新的理念。在最早的大型机架构模型中,磁盘存储设备具有最少的板载存储软件;大多数存储控制功能位于在中央处理器中运行的软件应用程序中,而不是在直接访问存储设备(DASD)的控制器上。
超融合基础设施的积极倡导者们正在回归到这一想法,并将其与从分布式超级计算架构(如服务器节点集群)中所提取的概念相结合,以创建旨在简化规模化扩展(通过添加更多的服务器存储节点)的超融合模型,提高可用性(通过在节点之间复制数据并实现故障转移),并降低基础架构成本(通过使用更通用的存储组件替换硬盘来管理SAN和单片存储阵列,直接连接到服务器)。
然而,仅仅只是这样仍然是够的,其无法实现当代超融合基础设施的共同定义或共同架构。相反,必须使用一个矩阵来描述市场上出现的各种解决方案的特性。
如上面的矩阵所建议的,各种超融合基础设施解决方案(也被称为超融合存储,因为最初使用该技术用于在应用程序服务器后面的群集创建存储“节点”)的差异可以说是由两个参数所决定的:
1、解决方案包含的硬件模型
2、支持的解决方案能够提供对于不同虚拟化和物理工作负载数据的存储。
一些超融合存储节点是预制的或遵守严格的组件列表,在节点上施加固定的硬件模型。其他的对于可用于提供存储服务的硬件组件更灵活。
在矩阵的顶部是第二个参数:工作负载支持。一些超融合存储节点专用于特定的服务器管理程序,并且只能与使用该管理程序虚拟化和操作的工作负载一起使用。其他超融合存储节点可以与不同的虚拟管理程序结合部署,但为其套件的所有实例化提供公共的管理控制台。第三种解决方案模型为虚拟和非虚拟化工作负载提供存储,这对于需要操作多款虚拟管理程序,并与此同时还需要操作非虚拟化应用程序(例如高性能事务处理数据库)的企业而言尤其重要。根据领先的分析显示,混合虚拟化和非虚拟化工作负载混合的状况可能将会在一些企业中持续至少到十年之后。了解这一点对于规划者来说是极其重要的,因为其将对企业客户所选择的超融合解决方案的短期和长期的技术适合程度,以及投资回报产生直接影响。
上图中,我们将前文表格中的描述文字替换为产品名称,此图表提供了适合矩阵类别的产品的几个示例。VMware公司的EVO:Rail是使用预定义的节点硬件解决方案支持单一虚拟管理程序的超融合存储模型的示例。相比之下,Nutanix公司将其产品作为固定的硬件设备出售,但可以与多款虚拟管理程序结合使用。VMware公司的Virtual SAN可以被视为一款只支持一个虚拟管理程序工作负载的超融合模型,但其在部署在节点中的存储硬件类型方面提供了一些灵活性。而StarWind软件公司则是一家第三方软件定义存储供应商,以其具有单独实例化的解决方案支持多个虚拟机管理程序,同时支持跨所有实例的通用管理。DataCore软件还可以支持多个虚拟机管理程序以及非虚拟化工作负载,具有非常灵活的硬件标准和通用管理。
此矩阵是用于整理构建超融合基础设施选项的一个起点。根据其操作原理、工作负载支持和硬件依赖性对产品进行分类是找到最适合既定业务的解决方案的必要的第一步。
在选项被经过了排序分类之后,本文接下来将为广大读者诸君提供关于评估选项的关键标准。
选择合适的超融合基础设施技术的关键标准
有许多方法来定义超融合存储的选择标准。好的选择具商业经济头脑的:该数据需要能够提供最佳的成本控制、最佳的可用性、最佳的性能特性和适用性。
成本标准
成本控制已然成为当今大多数IT企业的一项工作内容。这在企业的分支机构或远程办公环境以及中小型企业中尤为重要,这些企业通常缺乏大型企业或云服务供应商所拥有的雄厚的IT预算资金。
成本是购置设备,并经营费用和劳动力的一个功能。高效的企业只采购存储数据所需的硬件,一些已安装的备用容量来满足峰值期间的容量需求。如果可以以一致和统一的方式管理存储设备,其结果将是减少基础设施的人员配置需求,并降低运营成本。
当考虑一款超融合存储基础设施时,成本标准应包括:
1、硬件的依赖性:某些超融合服务器/存储解决方案采用由特定虚拟管理程序供应商“认证”的预设计设备或硬件平台(来自特定供应商的硬件)的形式。两者都创建了与供应商试图替换传统或遗留单片存储器类似的一个硬件锁定。理想的情况下,企业客户应该寻找没有这种硬件依赖性的超融合解决方案。事实上,追求与硬件无关的方法是您可以根据需要或新技术的可用性在不同时间规模化扩展节点的不同部分的唯一方法。所以,第一个,也是最根本的问题便是“我企业需要什么硬件才能使解决方案奏效?
硬件的依赖性也应该联系规模化缩放一同考虑。说实话,硬件规格越紧凑严格,企业客户就越能够以模块化的方式缩放各种组件。考虑到“leap frog”这类典型的游戏总是在包括处理器、互连、网络和存储技术的计算机组件之间进行,这可能是一个巨大的问题。组件技术中的改进间隔可能非常不同,因此需要在任何给定时间更改一个组件或几个组件以跟上创新。套件的硬件依赖性越大,吸收技术变化的能力就越低。此外,随着时间的推移,被锁定在只能在一个列表范围内选择硬件可能会增加解决方案的成本。
2、多节点架构:领先的服务器虚拟管理程序供应商正在提出超融合存储模型,其启动需要至少三个(或更多)集群节点。一个节点通常需要一台物理服务器,一款存储软件许可证,集群软件(无论是部分的虚拟管理程序软件包,操作系统或专用第三方软件),闪存设备和一个存储阵列或JBOD.最近的一个测试实验报告指出,一家领先的虚拟管理程序供应商的超融合软件(即“Virtual SAN”)的每个节点的成本范围在软件许可证8,000到11,000美元之间,服务器和存储硬件在8,000到14,000美元之间。这些数字需要乘以创建超融合基础设施所需的节点数——至少三个节点,但出于可用性和性能方面的原因,建议为4个节点。 相比之下,一些第三方超融合服务器存储模型只需要两个物理节点即可启动,并且可以利用不太昂贵的硬件(例如,SATA,而无需SAS磁盘)。
3、可管理性:领先的服务器虚拟管理程序供应商(以及大多数超融合设备供应商)倾向于使用统一的软件堆栈来管理所有连接的资源和他们所提供的专门服务。当涉及到存储时,虚拟管理程序供应商们提供接口以用于相关功能的管理,包括了从数据镜像和跨存储节点的复制、存储资源的精简配置、重复数据删除和压缩、以及在阵列控制器上执行的其他功能。在本质上,它们将曾经被存储阵列供应商吹捧为区分的“增值”服务集中起来,集中到一款集中的基于软件的控制器,表面上是为了易于管理不断扩展的基础设施。这需要检查每项服务的操作,以确保其功能是与您企业所期望的能够与基础架构一起使用的。仅仅因为压缩服务在既定产品上令人印象深刻并不意味着其广域复制服务是好的。
此外,请注意,尽管所有超融合供应商都认可存储软件服务需要在离线软件堆栈中部署实现,但是许多同时避免了将容量管理从存储阵列控制器抽象化的理念。这是许多超融合解决方案的一个值得引起注意的限制,因为这意味着容量管理是必须在每款存储设备上执行的单独的管理活动,通常需要专门的工具和技能。或者,如果存储容量被“虚拟化”或聚合到虚拟化资源池中,则其管理可以被集中并且在分布式基础设施上更简单地交付,如同其他存储服务的情况一样。
缺乏容量池,超级融合基础设施的整体价值可能会随着规模化扩展的发生而受到影响。在没有容量虚拟化的情况下,存储管理将变得僵化 ——特别是当需要从单个位置管理多个站点(例如分支机构或远程办公室)时,或者在大型企业中,当使用多台虚拟服务器管理程序时——每台均具有其自己的超融合模型。后一个问题——为多台虚拟机管理程序环境提供存储资源——可能现在似乎不太重要,但其可能会在未来几年内变得相当重要。根据领先的分析显示,大型IT企业将在2016年结束之前实现75%的工作负载虚拟化。然而,大多数企业将使用多款虚拟机管理程序,并且他们仍然有高达25%的工作负载运行在没有虚拟化和传统的存储设备。
如果存储被隔离在每种类型的虚拟管理程序之后,这种情况将对管理和管理费用产生影响,从而潜在地增加成本。当您企业评估一个特定的网站或集群的超融合解决方案时,这一问题可能不会太明显,但随着你对企业环境的管理和业务的增长,其肯定会走到前面和中心,发展成为一大问题。
故而企业客户应当选择那些能够交付虚拟管理程序、并且是与硬件管理无关的超融合基础架构技术,使之成为您企业减少管理基础架构所需的补充人员的关键。
4、硬件利用效率:当然,在考虑成本控制的同时,选择能够优化硬件使用的一款超融合基础设施模型也是十分重要的。例如,虽然市场上的大多数超融合产品可以利用动态RAM和闪存存储技术来创建缓存并提高应用程序的性能,但并不是所有这些产品都能够在实际上实现有效地使用,或者使得企业客户能够充分利用多样化以及当前市场上不断增长各种产品选择。DRAM比闪存更适合写缓存,但是你可能无法从某些超融合基础架构供应商的营销宣传稿中看到这些。通常,闪存被推荐用于其并不适合的目的,或者超融合产品供应商限制了客户使用更便宜的组件,或者选择最佳的技术以加速应用程序的性能,这有利于已经获得认证的供应商的产品。较之传统存储设备,这些都是超融合的倡导者们所喜欢的常见问题。
此外,某些超融合模型供应商要求将“传统”存储替换为更新的、经过认证的设备,这再次增加了超融合基础设施构建和运行的成本。大多数企业客户购买存储设备时,通常希望其能够实现五至七年的投资回报。对尚未实现其预期回报的传统存储进行强制报废淘汰和替换的要求可能会带来巨大的投资成本,需要谨慎考虑。
可用性标准
可用性应该是指导企业客户采购超融合技术的第二大标准。鉴于数据是任何企业组织的重要命脉,很明显,当前企业的数据需要确保24 x 7全天侯的可访问。因此,遵循以下指导应该是不言而喻的:
5、具有数据镜像的高可用性群集是超融合基础设施的标志,但是……企业客户所正在考虑的超融合软件的群集/数据镜像的功能必须是相当坚实的,必须包括内存缓存和缓冲区中的数据镜像以及存储在固态或磁盘上的数据。中理想的情况下,它们不应要求每个节点具有相同的设备,并且用于镜像HA群集的硬件节点的数目应当从两个开始,而不是三个,以成本节省。
6、HA镜像必须能够在不中断应用程序操作的情况下进行测试和验证。镜像始终作为数据保护机制存在,但镜像很少被测试,因为需要在测试期间停止应用程序,并在测试完成时重新同步工作负载和复制进程。您企业所选择的解决方案应该更简单,以便能够提供镜像过程的专门测试。您企业还应该考虑镜像故障转移是否好是作为自动功能提供还是首先需要人工手动确认。考虑集群故障转移解决方案,如自动报警,即使好的工具包有时可能会提供假警报。
7、可用性是双向的:在发生故障转移后,还必须提供故障恢复功能。通常这需要缓冲镜像写入,直到可以重新建立连接——这是一个相当重要但通常却是未经检查的要求。
8、本地HA不会抢占灾难恢复。用于本地故障转移的高可用性镜像应该通过一个metro或拉伸集群功能来补充,这将使得企业客户能够在两个地理位置不同的节点之间进行数据复制。真正可用的超融合解决方案应该具有广域同步和异步复制的拉伸集群的功能,好是没有相同的节点配置要求。
匹配业务目标的标准
对于企业业务目标和性能的匹配是另外两大标准,这应该成为任何超融合服务器存储技术买家指南的一部分。这至少有两个关键部分:
9、运行多台虚拟机的服务器需要支持DRAM(也许是闪存)加速。使用基于内存的缓存和缓冲可以加快应用程序的性能,即使应用程序性能缓慢的根本原因与存储I/O并不相关。理想情况下,也将支持闪存技术,但不是强制性的。
10、整体上对于企业业务目标的匹配也很重要。匹配企业业务目标指的是技术适合于环境或其引入的环境。从超融合平台的物理足迹,其噪声管理或电源/ HVAC要求——当装配没有设备机柜或数据中心的ROBO办公室时,任何或所有这些都可能是重要因素,通过管理、操作和管理硬件/软件栈以及现场熟练工人的可用性、存储基础设施与不同虚拟管理程序或非虚拟化应用程序及其存储要求的兼容性与学习曲线相关联,一套超融合模型可能比另一套更适合于一套既定的工作负载和环境要求。在考虑替代产品之前,做一份关于设施,工作负载和用户限制的列表是值得的。
尽管上述这十项标准不可能详尽无遗面面俱到,但他们将大大有助于企业客户选择那些适合您企业业务长期良性发展的领域。在我看来,我更喜欢这样一款超融合基础设施解决方案:其应该是硬件和虚拟管理程序不相关的,将支持来自任何供应商的DRAM和闪存设备,以及具备直接连接和传统SAN连接的磁盘基础设施(这样我可以完全实现我企业预期的投资回报率),能够优化虚拟化所有的存储容量,以便我可以从单一的软件接口在多个站点和异构存储设备管理容量分配和特殊存储服务。