中国IDC圈讯,开放数据中心峰会(ODCC2020)在北京召开,峰会围绕数据中心新基建为主题,有数据中心领域及相关行业的众多专家与会在9月16日网络分论坛上,锐捷网络股份有限公司数据中心交换产品事业部首席架构师宋子航以《数据中心DCI互联的发展和实践》为题向参会嘉宾做了分享。
锐捷网络股份有限公司数据中心交换产品事业部首席架构师宋子航
宋子航:各位在场的朋友和嘉宾,我是锐捷的数据中心产品经理宋子航,下面主要和大家分享一个话题,就是DCI互联。
首先来看DCI最近几年的一些变化,首先是网络设备的基础盒子,原来多地的数据中心基本上都是靠路由器连接起来,现在我们看到的趋势是用交换机替代路由器把多个数据中心连接起来。通过这样的一个变化,能够变相地把多个数据中心带宽提高,并把成本降低,组建一个更加高性价比的网络。可以看到整个变化趋势就是设备短化、功能简化。原来其实都是协议本身,采用分布式的多地数据中心的网络架构在做互联,比如MPLS+TE,相对来说自由性比较高,现在已经逐渐进行开放,现在已经形成了SR-TE技术。原来没有所谓的SDN,现在把所有控制链提取出来放在控制平面,能够给用户一个集中的视角,对于整个路径、业务进行按需的编排,所以我们看到的变化就是针对开放性网络技术SDN是一个简化运维的诉求。
刚才说了单个数据中心,多个数据中心原来可能局限于国内或者全球一些少量的节点,现在我们看到大部分都是全球化的态势,接入方式也由原来的单平面演变成了多平面,可能原来只有一个平面,现在是有外网和内网DCI互联,通过多个平面的方式更好地提供一个业务交付。早些年带宽能力相对来说只局限于万兆的水平,随着现在我们把控制面提升,然后用交换机替代路由器,整个接口形态会由交换机的大带宽、大规模组网变成100G/400G组网,可以看到带宽和规模也是不断扩大的。
核心趋势就是DCI互联在当今、当前的变化是网络设备的功能简化,这样的变化带来的挑战是什么?又给用户带来哪些核心诉求?首先就是整个带宽化规模的不断扩大,运维的SDN化和整体简化,再就是设备功能的简化。在此趋势下,客户主要的诉求就是三个方面:首先是低成本的扩容诉求,通过所有的计算面提取出来,转发放到交换机的设备去做,这样的话可以更好地降低整个扩容成本,其实可以变相地降本提效。整个业务强诉求就是通过这样控制面的提取,就是把统一的控制面交给用户,最终用户可以通过业务的分析以及自定义,针对这个业务按需构建需要的路径,能够让整个调整业务路径的能力、推广和控制的能力得以增强。再就是整体网络运维的简化,刚才说过统一到其中的SDN控制器,把控制面提取出来以后能够让网络的部署可用性相对来讲增强。因此从这三个维度来看,可以看到大的趋势变化下客户的降本提效好运维的诉求。
原来DCI数据中心的方案其实很传统,就是MPSDE的分布式互联方式,在此变化、趋势和诉求下,现在的网络方案到底是什么样呢?原来的数据中心DCI互联的模型是统一的设备转发面,传统都是靠控制面和转发面集中在一起,多地数据中心的路由器打通互联,带来的一个问题就是所有的设备都需要计算全网信息,所以设备不仅转发能力很强,对于控制能力和计算能力,CPU能力也很强,就是对于原来的网络设备要求。所有节点的控制都不是由人控制的,是由机器自己计算的,所以干扰机器的计算也会相对来讲比较麻烦,复杂度也比较高,干扰之后得不到计算出来的结果,路径也不是想要的那样。现在我们的变化是把所有的控制面层级提升到了SDN控制器,设备仅限于一些弱控制,比如底层协议,通过控制器下发OCNMS统一由设备进行转发即可。
所有的控制面全部集中在SDN控制器,通过这样的变化集中+分布式的控制,可以实现的效果就是统一的自动化部署、统一控制的视角,可以通过SDN控制器对全局进行应用和定义,真正通过业务的视角跟网络进行耦合,实现按需应用的定义。由于这些设备由原来的强CPU、强转发的形式变成弱CPU强转发的形式,我们可以把原来的路由器通过现在交换机进行替代,所以业界也是强调比较火的,之前有很多客户在交流,就是通过交换机替代路由器在PCI互联场景如何去做,这些也是我们看到的趋势和变化,因为可以变相降本,通过SDN控制器集中控制面提升效率。整个变化就是把核心控制起来,按照网络状态和业务需求进行定义。
目前这种架构的变化有两个关键性的要素技术支撑:一个就是所谓的软路由SR业务,现在这张图就是很简单的SR原理,原来MPRS整个的RSVP和LBP的协议站都是非常复杂的,现在通过SDN控制器统一进行标签分配,选路、寻址、设备转发都会变得异常简单,设备只需要知道一个包进来以后压了这么多的标签,1001到1007,比如第一个是1002,那就把包扔给1002,然后就是1005,所以选择的简洁性和原则性更弱一些,设备的转发效率和能力以及对设备的要求更低一些,整个传输的端到端路径的能力和可控的能力会增强,所以让我们从SDN控制器的视角统一调整变得可能,按照业务需求调整变得可能。
在此关键技术下带来的几项优势:首先就是简化网络,原来可能有些RCVP的方式,再就是整个这套架构因为转发变得简单,所有的计算层面抽离出来,可以按需进行编程。整个规模的扩展能力也会得到增强,大家都知道路由器的扩展没有交换机扩展能力那么简单方便、高性价比,所以整个规模的扩展能力也会增强。这是支持刚才说的架构转型的关键技术之一,另外一个关键技术就是现在的交互方式,设备和设备之间已经把所有的控制层面全部提取到了SDN控制器,SDN控制器和设备之间的交互方式是什么?怎么告诉设备要做哪些事情?关键技术、关键协议到底是什么?总共分为两层:一层是转发层,一层是控制层。转发层就是很多交换机的盒子,这些盒子拼接在一起要怎么做?靠什么协议下发?拓扑采集方面通过LAS协议,运行采集的时候是靠设备本身的SNMP和GRC序列化和反序列化的效率远比SNMP更高,所以我们收集出来一些更深入更全面的信息。
再就是路径下发,SDN控制器对设备下发的协议原来在数据中心内部,现在这样的DCI互联的场景下我们会新增一些其它的协议,比如BGP或者PCEP等等,控制层之上其实还有一个层面就是应用层,其实就和原来SNMP控制器的架构模型很像,通过对控制层的统一应用调度,我们可以把很多收集上来的信息、想要预处理的信息进行处理,通过APP层面进行统一处理和优化,比如全局的故障模拟和流量调度,调度之后我们再进行路径的下发,通过这样的上收处理再下发的方式成为循环。我们这里比较特有的就是一些样本模型,私有样本和标准样本,可以采用适配的方式进行统一集成。
刚才说的两个关键性技术支撑核心理念的转变,具体落地到底是什么样子?这是新一代的DCI网络架构的互联模型,主要分为两块:一块就是所谓的内网互联骨干网,另一块就是外网骨干网。刚才已经说过,现在很多客户在做DCI互联的骨干网络当中都分平面,因为物理的整个冗余度更强,通过这样分层的设计能够更好地进行路径的调优和适配。现在很多时候从慢的区域到城域网都靠EVP,然后再到同城互联的时候通过SRTE,城市间互联也是通过SRTE,包括再到同城互联过去。内网互联的核心技术已经在用SRTE做了,大部分的设备基本上都是通过交换机已经替代路由器,但是在上面的外网骨干网,其实现在大部分的客户还是采用交换机+路由器,就是混合的部署模型,有些节点还是因为整个芯片的标签能力和层级约束条件,所以还是没办法完全把一些关键节点路由器替代,相信未来发展到G3或者G4,88960或者88970出来之后这些场景也会被替代。
现在我们发现了一个趋势,外网骨干网需要大标签的场景下也在出现交换机替代路由器的场景,只不过现在还没到那个时候,现在我们也发现了比例逐渐提高的变化。
之前说的很多都是架构、变化和趋势,以及带来的诉求和技术的支撑,这些技术到底对网络设备本身对我们网络厂家、网络产品需要做哪些事情?首先就是刚才说的信息采集,需要收集很多信息提升整个对网络的监控能力和网络现状的了解,这样SDN控制器可以更好地收集这些信息进行全网分析和指定相应的路径状态,所以就需要流程和软件信息的秒级和毫秒级监控技术满足。硬件监控就需要快速检测和切换机制保证,比如数据中心内部常用的接入,SR、FR的环境下应用没有那么太多,毫秒级切换应用相对更多来说。再就是转化面的承载,主要是SRPE来做支撑,再就是服务质量,原来很多数据中心的互联其实都是靠HQS方式去做,现在下放交换和路由这样的变化和事态,其实我们也需要有些路径QS的方式去做支撑。最后就是整个交付方式,这也是刚才说的很多关键技术之一,比如我们需要采用这种开放的、快速的标准交付方式,比如现在炒得比较多的GRPC,原来用得比较多的OC-YANG承载。
以上品类的要求最终会导致一个状态,就是网络设备就像一个士兵,既能听从指挥,也能单兵作战,就是可以达到这样的效果,所谓的DCI互联新一代网络稳定性才能更强。
DCI网络近期还有什么可见的变化和发展?协议方面现在越来越多是用SRv6,整个可编程能力更强一些,设备上有很多客户端交换机采用高密度接口来做互联,监控能力就是时延、丢包等可视化能力显著增强,原来很多设备都是黑盒,我们现在要去黑盒,所以也有很多协议支撑,最后就是交互协议,除了GRPC之外也是越来越多在SDN和交换机之间来做DCI场景下的新的改造之后的交互协议,相信这些协议也会对网络交付效率和交付能力进一步提升。