CN107276905A - 覆盖网络中的非对称多目的地流量复制 - Google Patents
覆盖网络中的非对称多目的地流量复制 Download PDFInfo
- Publication number
- CN107276905A CN107276905A CN201710231711.3A CN201710231711A CN107276905A CN 107276905 A CN107276905 A CN 107276905A CN 201710231711 A CN201710231711 A CN 201710231711A CN 107276905 A CN107276905 A CN 107276905A
- Authority
- CN
- China
- Prior art keywords
- multicast
- destination
- flow
- network equipment
- network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L45/00—Routing or path finding of packets in data switching networks
- H04L45/64—Routing or path finding of packets in data switching networks using an overlay routing layer
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L45/00—Routing or path finding of packets in data switching networks
- H04L45/16—Multipoint routing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H20/00—Arrangements for broadcast or for distribution combined with broadcast
- H04H20/26—Arrangements for switching distribution systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/28—Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
- H04L12/46—Interconnection of networks
- H04L12/4633—Interconnection of networks using encapsulation techniques, e.g. tunneling
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L45/00—Routing or path finding of packets in data switching networks
- H04L45/48—Routing tree calculation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L45/00—Routing or path finding of packets in data switching networks
- H04L45/74—Address processing for routing
- H04L45/745—Address table lookup; Address filtering
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/02—Details
- H04L12/16—Arrangements for providing special services to substations
- H04L12/18—Arrangements for providing special services to substations for broadcast or conference, e.g. multicast
- H04L12/1836—Arrangements for providing special services to substations for broadcast or conference, e.g. multicast with heterogeneous network architecture
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/28—Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
- H04L12/46—Interconnection of networks
- H04L12/4641—Virtual LANs, VLANs, e.g. virtual private networks [VPN]
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Computer Security & Cryptography (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本公开涉及覆盖网络中的非对称多目的地流量复制。本文呈现的是覆盖网络中的多目的地流量转发的混合方案,这些混合方案能够用于辅助头端复制支持的网络设备(即,仅使用头端复制的那些设备)和多播支持的网络设备(即,仅使用原生多播的那些设备)之间的互操作性。通过一般地使用现有的隧道端点(TEP)支持的用于发送多目的地流量的功能并且利用它们未原生地支持的封装方案来增强TEP以接收多目的地流量,所呈现的方法和系统将实现互操作性需要的增强最小化并且规避了端点硬件可能具有的任何硬限制。本方法和系统可被用于使用中的或部署的旧有硬件以及配置有旧有协议的新硬件。
Description
技术领域
本公开涉及覆盖网络中的隧道端点设备的网络化。
背景技术
覆盖网络是在下层的网络(即,底层(underlay)网络)基础设施的上方构建的,以增强底层的功能。除了其它事情之外,覆盖网络可被用于支持多租户以及改善应用部署的速度、灵活性、可扩展性、和可管理性,并且例如扩展层2(Layer 2)网域(domain)跨越数据中心网荚(pod)、网域、和站点间的到达性。VXLAN(虚拟可扩展LAN)例如是在层3网络上进行覆盖的层2覆盖方案。VXLAN使用VXLAN隧道端点(VTEP)设备来把租户的端设备映射至VXLAN分段并且执行VXLAN封装和解封装。
一类设备(被称作“多播隧道端点”设备或“MC TEPS”)可参与底层的IP多播路由并且可映射底层中的客户端多播群组和覆盖多播群组。多播-协议-支持辅助针对一对多通信的流量的更高效递送,它允许流量被发送到已经加入多播群组的一组网络设备。
第二类设备(被称作“头端复制”)仅支持多目的地流量的头端复制,其中客户端多目的地流量和覆盖多目的地流量由头端复制设备复制并且作为分离的单播副本被发送至具有多播信道的监听器(listener)的每个远程隧道端点设备。头端复制是使用VTEP的静态映射、用于广播、单播、多播、和未知分组的管理的封装和解封装方案(而非隧道类型)。
在某些环境中,期望使得仅支持多播(MC TEP)的设备和仅支持头端复制(HERTEP)的设备彼此相互操作。
发明内容
根据本公开的一个方面,提供了一种被配置为原生地将多目的地流量映射到网络中的多播群组的系统,系统包括:处理器;以及存储器,该存储器具有在其上存储的指令,其中在被处理器执行时,指令使得处理器:把系统加入到一个或多个多播树,每个多播树与网络中的多播群组相关联;以及订阅与被配置为把多目的地流量头端复制到离散的单播隧道中的网络设备相关联的头端复制列表,其中对头端复制列表的订阅将单播封装的流量从网络设备指引至第一网络设备以及其中列出的多个网络设备;其中此后,i)响应于从网络设备接收到单播封装的流量,其中每个单播封装的流量包括单播头部和经封装的分组,则移除单播封装的流量的单播头部,以及ii)响应于确定经封装的分组包括多目的地分组,则基于解封装的多目的地分组的分组头部来把解封装的多目的地分组转发至给定的多播群组;并且其中此后,响应于从另一第一网络设备接收到多目的地流量,根据多目的地流量的分组头部中的多播群组地址,经由多播树把所接收到的多目的地流量多播至与多播群组地址相关联的多播群组,其中与多播群组地址相关联的多播群组包括一个或多个第一网络设备和一个或多个网络设备。
根据本公开的另一方面,提供了一种被配置为复制多目的地流量并且向其它网络设备发送经复制的多目的地流量的分离的单播副本的系统,系统被配置为不原生地映射多目的地流量到底层网络中的多播群组,系统包括:处理器;以及存储器,该存储器具有在其上存储的指令,其中在被处理器执行时,指令使得处理器:通过静态配置或者通过与底层网络中的下一跳路由器经由IGMP的信令方式加入IP多播网络中的底层多播树,其中多播树中的所有多播群组被分配到用于不同的覆盖实例(VNI)的广播流量的分发;其中此后,响应于从网络设备接收到多目的地流量,每个多目的地流量包括多播头部和经封装的分组,则i)移除多播头部并且ii)复制多目的地流量的经封装的分组并且向底层多播树中规定的网络设备发送经复制的经封装的分组的单播副本。
根据本公开的又一方面,提供了一种方法,包括:在被配置为原生地将多目的地流量映射到网络中的多播群组的第一网络设备处,把第一网络设备加入到与网络中的多播群组相关联的多播树;以及订阅与第二网络设备相关联的头端复制列表,第二网络设备被配置为把多目的地流量头端复制到离散的单播隧道中,其中对头端复制列表的订阅把单播封装的流量从第二网络设备指引至第一网络设备以及其中列出的多个网络设备;其中此后,i)响应于从第二网络设备接收到单播封装的流量,其中每个单播封装的流量包括单播头部和经封装的分组,则移除单播封装的流量的单播头部,以及ii)响应于确定经封装的分组包括多目的地分组,则基于解封装的多目的地分组的分组头部来把解封装的多目的地分组转发至多播群组;并且其中此后,响应于从另一第一网络设备接收到多目的地流量,根据多目的地流量的分组头部中的多播群组地址,经由多播树把所接收到的多目的地流量多播至与多播群组地址相关联的第二多播群组,其中第二多播群组包括一个或多个第一网络设备和一个或多个第二网络设备,第二多播群组由多目的地流量的多目的地地址来规定;以及在被配置为复制多目的地流量并且向其它网络设备发送经复制的多目的地流量的分离的单播副本并且被配置为不原生地映射多目的地流量到底层网络中的多播群组的第二网络设备处,通过静态配置或者通过与底层网络中的下一跳路由器经由IGMP的信令方式作为主机加入多播树,其中多播树中的所有多播群组被分配到用于不同的覆盖实例(VNI)的广播流量的分发;其中此后,响应于从给定的第一网络设备接收到多目的地流量,每个多目的地流量包括多播头部和经封装的分组,则i)移除多播头部并且ii)复制多目的地流量的经封装的分组并且向底层多播树中规定的网络设备发送经复制的经封装的分组的单播副本。
附图说明
图1是根据描述性实施例的操作多播隧道端点网络设备以辅助与头端复制隧道端点网络设备的多目的地流量可操作性的方法的流程图。
图2是根据描述性实施例的操作头端复制隧道端点网络设备以辅助与多播隧道端点网络设备的多目的地流量可操作性的方法的流程图。
图3是根据描述性实施例示出多播隧道端点网络设备和头端复制网络设备的系统的图示,其中多目的地流量从头端复制网络设备被指引至多播隧道端点网络设备。
图4是根据描述性实施例示出多播隧道端点网络设备和头端复制网络设备的系统的图示,其中多目的地流量从多播隧道端点网络设备被指引至头端复制网络设备。
图5是示出把头端复制网络设备加入到底层多播树的示例IGMPv2请求的图示。
图6是示出把头端复制网络设备加入到底层多播树的示例IGMPv3请求的图示。
图7是示出TOR(“top of rack(架顶)”)网络设备的图示。
具体实施方式
概述
本文呈现的是覆盖网络中的多目的地流量转发的混合方案,这些混合方案能够用于辅助支持头端复制的网络设备(即,仅使用头端复制的那些设备)和支持多播的网络设备(即,仅使用原生(native)多播的那些设备)之间的互操作性。通过一般地使用现有的隧道端点(TEP)支持的用于发送多目的地流量的功能并且利用TEP未原生地支持的封装方案来增强TEP以接收多目的地流量,所呈现的方法和系统将实现互操作性需要的增强最小化,并且规避了端点硬件可能具有的任何硬限制。本方法和系统可被用于使用中的或部署的旧有硬件以及配置有旧有协议的新硬件。
即使在用于处置多目的地流量的通用方法由于端点的硬件能力的限制/约束而变得不可能的场景中,本方法和系统仍能辅助互操作性。TEP自己可以是虚拟的(软件VTEP)或实体的(硬件VTEP)。
示例实施例
呈现的方法和系统辅助具有不同的多目的地转发能力的隧道端点在网络中相互操作。覆盖系统被设计为假设所有的入口隧道路由器(ITR)、出口隧道路由器(ETR)(也被统称为“XTR”)和隧道端点(TEP)具有匹配的能力。为此,在这样的系统中,所有的XTR/TEP使用头端复制(HER)或使用底层多播(MC)。但是,既未定义也不支持双向混合环境。
就是说,在当前的覆盖多播解决方案中,具有HER能力的XTR/TEP不期望接收多播封装的流量,并且它也不参与加入底层多播分发树所需要的底层信令。头端复制TEP(HER-TEP)仅通过复制流量并向具有多播信道的监听器的每个远程TEP发送多目的地流量的分离的单播副本,来提供对于客户端/覆盖多目的地流量的支持。
此外,具有MC能力的XTR/TEP(此后被称为“MC-TEP”)不期望接收以单播形式封装的多播流量,并且具有MC能力的XTR/TEP也不参与使得远程HER-TEP能够构建需要的复制列表所需的信令。MC-TEP能够参与底层中的IP多播路由并且把客户端/覆盖多目的地流量映射到底层中的多播群组。
入口隧道路由器(ITR)可以是如下LISP(位置/标识符分离协议)站点边缘设备,该设备从面向站点的接口(内部主机)接收分组并且把它们封装至远程LISP站点或者原生地把它们转发至非LISP站点。出口隧道路由器(ETR)可以是从面向核心的接口(互联网)接收分组、对LISP分组进行解封装、并把它们递送至站点处的本地EID的LISP站点边缘设备。同时实现ITR和ETR功能的用户边缘(CE)设备一般被称作XTR。
示例性方法和系统修改MC-XTR/TEP和HER-XTR/TEP的控制平面和数据平面的接收行为以定义相应的XTR/TEP类型处的特定方向行为,从而使得MC-XTR/TEP能够在混合式环境中与其它HER-XTR/TEP(以及原生地与其它MC-XTR/TEP)进行相互操作,并且HER-XTR/TEP能够在混合式环境中与MC-XTR/TEP(以及原生地与其它HER-XTR/TEP)进行相互操作。
所提出的机制通过增强使用已知的覆盖多目的地流量处置方法的XTR/TEP的行为实现了混合的覆盖环境。该方法通过定义XTR/TEP处的特定方向行为来实现这一点。这种方向性的含义未被定义在LISP多播机制中(或者其它类似的多播机制(例如,在OTV或VXLAN-EVPN中使用的那些多播机制)中)。
示例性方法和系统中用以补足和/或增强当前的覆盖XTR和TEP的行为的这种方向性的考虑通过使用每个相应XTR/TEP的现有硬件以及相关联的底层网络基础设施并且无需额外的硬件或者对底层网络基础设施的原生控制的修改来辅助混合覆盖环境的操作。
因为不能以多播进行封装的TEP(例如,HER-TEP)可能能够接收多播封装的流量,本方法和系统利用并使用了HER-TEP的此特性。限制在于发送/封装方向。类似地,因为不能做出头端复制的TEP(例如,MC-TEP)可能能够接收单播封装的流量,本方法和系统利用并使用了MC-TEP的此特性。
可使用示例性方法和系统的覆盖解决方案的示例包括但不限于:当前定义的LISP(位置/标识符分离协议)、OTV(覆盖传输虚拟化)、和虚拟扩展LAN(VXLAN)。
多播(MC)-TEP的示例包括Nexus 5600系列路由器,该路由器由于硬件限制仅支持基于多播的BUM(广播,未知的目的地地址)处置。Nexus 5600系列路由器由思科系统公司(San Jose,CA)制造。
头端复制(HER)-TEP的示例包括Nexus 9K和虚拟拓扑系统(VTS)及虚拟拓扑转发器(VTF),其仅支持入口复制。Nexus 9K和VTS/VTF由思科系统公司(San Jose,CA)制造。
图1是根据描述性实施例的操作多播隧道端点网络设备以辅助与头端复制隧道端点网络设备的多目的地流量可操作性的方法100的流程图。
方法100包括:在被配置为原生地把多目的地流量映射到网络中的多播群组的第一网络设备(例如,多播使能的网络设备)处,将第一网络设备加入(步骤102)到一个或多个多播树,每个多播树与网络中的多播群组相关联,以及订阅(步骤104)与第二网络设备相关联的头端复制列表,第二网络设备被配置为将多目的地流量头端复制到分立的单播隧道中。对头端复制列表的订阅把单播封装的流量从第二网络设备指引至第一网络设备以及其中列出的多个网络设备。此后,响应于从第二网络设备接收单播封装的流量,每个单播封装的流量包括单播头部和经封装的分组,该方法还包括:移除(步骤106)单播封装的流量的单播头部,并且响应于确定该经封装的分组包括多目的地分组,基于解封装的多目的地分组的分组头部将解封装的多目的地分组转发至给定的多播群组。另外,此后响应于从另一第一网络设备接收多目的地流量,该方法还包括:根据接收到的多目的地流量的分组头部中的多播群组地址,经由多播树将接收到的多目的地流量多播(步骤108)至与多播群组地址相关联的多播群组。在一些实施例中,与多播群组地址相关联的多播群组包括一个或多个第一网络设备。在其它实施例中,与多播群组地址相关联的多播群组包括一个或多个第一网络设备和一个或多个第二网络设备。
换句话说,具有多播(MC)能力的端点能够获得多目的地流量并且把此多目的地流量映射到网络(即,底层网络,即提供网络中的路由器间的连接性的基底)中的多目的地树。覆盖(即,虚拟网络)在底层的上方运行,该覆盖仅在网络的边缘高效运行,从而使得在此覆盖网络中将要被传输的任何流量被映射至底层中的隧道,其中分组被封装以底层理解的额外头部。在单播中,隧道是通过封装单播IP头部而被指引到特定IP地址的隧道。相比而言,具有多播能力的隧道端点使用多播树用于多目的地流量。对于后者,多目的地流量被封装以到一个或多个具有多播能力的隧道端点的多播地址目的地,其中多播目的地地址在底层被理解。多播目的地地址的示例包括239.0.0.0和239.255.255.255之间的目的地地址范围。在一些实施例中,多播目的地地址具有224.0.0.0和239.255.255.255之间的范围。
应理解的是,在整个说明书中,标识符“第一”、“第二”、“第三”、“第四”等等仅被用于帮助区分所公开的主题的各个组件和步骤。标识符“第一”、“第二”、“第三”、“第四”等等并不意图暗示对于由这些术语修改的组件或步骤的任何具体次序、顺序、数量、偏好、或者重要性。
图2是根据描述性实施例的操作头端复制隧道端点网络设备以辅助与多播隧道端点网络设备的多目的地流量可操作性的方法的流程图。
方法包括:在被配置为复制多目的地流量并且把复制的多目的地流量的分离的单播副本发送给其它网络设备并且被配置为不原生地把多目的地流量映射到网络中的多播群组的第一网络设备处,在网络中通过静态配置或者通过与底层网络中的下一跳路由器、经由IGMP的信令方式作为主机(而不是作为路由器)加入(在步骤202处)IP多播网络的底层多播树,其中多播树的所有多播群组被分配给用于不同覆盖实例(VNI)的广播流量的分发。
其中,此后,该方法还包括:响应于从第二网络设备(例如,MC TEP)接收多目的地流量,每个多目的地流量包括多播头部和经封装的分组,移除(步骤204)多播头部、复制多目的地流量的经封装的分组、并且发送经复制的经封装的分组的单播副本到底层多播树中规定的网络设备。
另外,此后方法包括:响应于从另一第一网络设备(例如,HER TEP)接收流量,移除接收到的流量的头部,并且发送经复制且经解封装的流量的单播副本到被移除的头部中规定的网络设备(即,它的本地接收者)。
系统图
如图3中所示,存在标注为TOR1 302(“架顶1”302)、TOR2 304(“架顶2”304)、TOR3306(“架顶3”306)和TOR4 308(“架顶4”308)的四个隧道端点。TOR1 302、TOR2 304、TOR3306和TOR4 308中的每个可以是直接连接到例如数据中心中的服务器的交换机或路由器。在一些实施例中,服务器被布置在机架中,其中架顶包括交换机,该交换机向数据中心的网络结构进行馈送。
TOR3 306和TOR4 308是具有多播能力的TEP(MC-TEP)。它们能够参与底层中的IP多播路由,并且它们将客户端/覆盖多目的地流量映射到底层中的多播群组。
TOR1 302和TOR2 304被配置为头端复制TEP(HER-TEP)。它们不参与底层IP多播路由,而只是通过复制流量并且向具有多播信道的监听器的每个远程TEP发送多目的地流量的分离的单播副本来为客户端/覆盖多目的地流量提供支持。
目前的HER-TEP经常硬受限于(例如,在它们的专用集成电路(ASIC)方面)它们支持多播的能力。相反地,MC-TEP的许多专用集成电路(ASIC)在它们支持HER的能力上有限制。
如图3中所示,TOR1 302和TOR2 304具有头端复制能力而不具有多播能力。另外,TOR3 306和TOR4 308具有多播能力而不具有头端复制能力。
仍参考图3,现在描述HER设备到多个MC设备方向上的多播。假设具有连接到TOR1302(或TOR2 304)(即,HER设备)的源;TOR1 302的封装行为将产生多目的地流量的分离副本。以诸如TOR1 302或TOR2 304之间的股票报价馈送之类的多目的地流量为示例,该馈送将以被发往每个TOR的副本的形式被从例如TOR1 302单播到例如TOR2 304以及TOR3 306和TOR4 308。为此,对TOR2 304(即,HER-TEP)而言,TOR1 302的控制平面将订阅TOR 2到其复制列表。因为TOR3 306和TOR4 308是仅支持多播的设备,所以它们不与TOR1 302或TOR2304的控制平面通信。对从TOR1 302(即,起源HER TEP)接收多目的地流量的TOR3 306和TOR4 308(即,MC-TEP)而言,本方法和系统通过以下方式增强了TOR3 306和TOR4 308的控制平面,例如,通过对其固件和/或软件的更新,或者例如通过对其固件和/或软件的升级,以使得TOR3 306和TOR4 308的控制平面订阅TOR1 302(或TOR2 304)的头端复制列表。也就是说,通过对其固件和/或软件进行升级或更新,MC-TEP可以接收封装多目的地流量的单播,并且MC-TEP可以生成HER-TEP用其中所列出的MC-TEP来填入复制列表所需的覆盖信令。
为了这个目的,TOR1 302在它收听流的地方接收来自TOR2、TOR3和TOR4中每个的请求,以生成包括TOR2 304、TOR3 306和TOR4 308的复制列表(即,完整列表)。然后,响应于接收到多目的地流量,TOR1 302创建副本(在此示例中,3个副本),每个副本被封装为就如同它是在到多个TOR的单播IP隧道中被创建的一样。在TOR3 306和TOR4 308处,它们的固件和/或软件被更新或修改以接收单播封装的流量、解封装所接收的单播封装的流量、并且当有效载荷被确定为多目的地流量时则在本地站点进行复制(例如,多播复制)。例如,TOR3306或TOR4 308中的每个可以具有例如48个端口并且在例如这些端口中的40个端口上具有监听器。TOR3 306和TOR4 308可以在例如40个端口中的每个端口上放置所接收的多目的地流量的副本。因此,虽然来自TOR1 302或TOR2 304的初始流量是单播封装的,但是有效载荷是多播的。
图4是根据描述性实施例示出多播隧道端点网络设备和头端复制网络设备的系统的图示,其中多目的地流量从多播隧道端点网络设备被指引至头端复制网络设备。图4示出了在与图3相反方向上的多目的地流量流。
使用图3的股票报价馈送示例,现在假设股票报价馈送起源于TOR4 308。并且假设在TOR1 302、TOR2 304和TOR3 306中存在监听器。作为MC-TEP,TOR3 306仅像它通常所做的那样加入多播树。在TOR1 302和TOR2 304处,它们的固件和/或软件被更新或修改以加入该多播树。在一些实施例中,TOR1 302和TOR2 304通过静态加入或IGMP报告来加入该多播树。
最终结果是TOR1 302、TOR2 304、TOR3 306和TOR4 308中的每个都加入多播树,并且当MC-TEP(例如,TOR3 306或TOR4 308)需要发送多目的地流量时,MC-TEP将用MC目的地地址封装流量(如线402a-402d所示)。TOR4以多播方式封装,并且遵从屏幕中所示出的树。在TOR1 302和TOR2 304(即,HER-TEP)处,固件和/或软件被更新或升级以允许接收多播封装的流量。因为HER-TEP的硬件(例如,ASIC)能够对多播封装的流量进行解封装,所以在HER-TEP处的修改可以包括移除或禁用对多目的地地址的核对。
可以以若干种不同的方式来实现底层中的多播树,例如,共享树或源树。源树在源处具有其根,并且分支通过网络形成到接收方的生成树。源树还被称为最短路径树。共享树使用位于网络中的一些选定点的单一共同根。图7中示出了示例TOR 700。TOR 700包括连通性设备(例如,路由器或交换机702)以及多个网络设备704(被示出为设备704a、704b、704c、704d和704e)。连通性设备702被通过例如双绞线或光线光缆706连接到每个网络设备704。
对现有的具有多播(MC)能力的TEP的修改
具有MC能力的TEP的标准操作是接收针对覆盖的多播流量,并且通过将流量封装于多播目的地地址来将该流量映射到底层多播群组。为了这个目的,在一些实施例中,具有MC能力的TEP包括被配置为原生地将多目的地流量映射到底层网络中的多播群组的集成电路(例如,ASIC、混合信号FPGA或其他可编程混合信号集成电路)。在接收侧,具有MC能力的TEP从单播的角度起作用。
当与HER设备互操作并且接收来自HER设备的多目的地流时,MC TEP可以被修改以接收单播封装的分组。为这样做,MC TEP还被配置为接收单播封装的分组,并且如果有效负载被确定为是多播或广播流量则通过将经解封装的多目的地地址复制到本地站点来对有效负载做出响应。为了这个目的,虽然MC-TEP接收单播封装的分组,但是MC-TEP能够将所接收的流量在解封装后作为多目的地流量。
为配置MC-TEP以接收单播封装的流量,作为第一变化,在一些实施例中,在MC-TEP的软件中实现的对源目的地地址或目的地地址的核查被取消或移除。另外,作为第二变化,MC-TEP被配置为在其MC-TEP的控制平面的信令中包括加入复制列表的请求。MC-TEP被配置为以它们的标准模式加入底层中的多播树,并且使得被发布并预期被接收的信令与该方案一致。
在一些实施例中,在接收IGMP(互联网群组管理协议)REPORT(报告)或PIM(协议独立多播)JOIN(加入)后,作为第三变化,MC-TEP被配置为将其中的多目的地地址映射到底层中的相关复制列表。另外,在一些实施例中,作为第四变化,MC-TEP被配置为使用边界网关协议(BGP)通过信号向将被添加作为分发列表的一员的HER-XTR/TEP的控制平面发送控制器和信号兴趣,从而HER-XTR/TEP可以向它单播流量。这些增强实现了以下能力:使得TEP发送头端复制的流量并且接收多播封装的流量,或者反之亦然,使得TEP发送多播封装的流量并接收头端复制的流量。具有这些特征的MC-XTR/TEP和HER-XTR/TEP将是可互操作的。
换言之,为将MC-TEP配置为接收单播封装的流量,IP底层被假设为是支持多播的,并且MC-TEP在此IP底层网络中具有完善的功能(即,能够参与底层网络中的单播和多播控制平面并且能够发送和接收多播封装的流量以及单播封装的流量)。通过以下方式来增强MC-TEP:
1)MC-TEP被配置为能够接收已经被单播封装的多目的地流量。MC-TEP被配置为解封装这样的流量并且恰当地处理/复制多目的地有效负载(例如,无论它是以太网广播、IP多播还是别的)。
2)MC-TEP被配置为能够发布具有多目的地源的HER-TEP所必需的覆盖信令以创建头端复制列表。在一些实施例中,这主要涉及使得MC-TEP向具有针对这样的多目的地流量的源的任意HER-TEP报告它们对于接收多目的地流量的兴趣。
对现有的具有头端复制(HER)能力的TEP的修改
现有的HER-TEP通常单播封装本地复制的多目的地流量并且能够接收多播封装的多目的地流量。也就是说,HER TEP发送头端复制的流量并且接受可以使用多目的地地址进行封装的流量。为了这个目的,现有的HER-TEP可以包括集成电路(例如,ASIC、混合信号FPGA或其他可编程混合信号集成电路),该集成电路被配置为复制多目的地流量并且向其他网络设备发送所复制的多目的地流量的分离的单播副本并且被配置为不原生地将多目的地流量映射到底层网络中的多播群组。同一ASIC可能无法封装在多播中或参与核心中的多播树。为使得MC-TEP从HER-TEP接收单播封装的多目的地流量,通过以下方式来增强HER-TEP的软件(例如,固件):
1)HER-TEP被配置为能够接收已经被多播封装的多目的地流量。HER-TEP被配置为解封装这样的流量并且执行分发所接收的多目的地流量所需的任意本地复制。在一些实施例中,(ASIC的)单播管线能够解封装头部并且使用HER-TEP的软件来查看内在的头部,并且经由ASIC引起执行任意所需的本地复制。
2)HER-TEP被配置为作为主机而不是路由器连接到IP多播网络,以最小化对HER-TEP的多播要求。因此,HER-TEP被配置为通过静态配置或者通过与底层中的下一跳路由器的信令(比如,IGMP)来作为主机加入底层多播树。HER-TEP被配置为加入被分配给针对在TEP上被实例化的不同覆盖实例(VNI)的广播流量的分发的全部多播群组。作为主机加入HER-TEP促进了HER-TEP的控制平面上的薄的多播实现方式。
在一些实施例中,在覆盖实例在TEP上被部署并被激活时,发生加入这样的群组的信令。在一些实施例中,加入底层多播群组使用很好理解的IGMP报告机制。在另一实施例中,在覆盖实例被部署/激活时,可以通过使得下一跳路由器上具有网络控制器程序静态条目来加入该组。
可与头端复制隧道端点装置互操作的多播隧道端点装置的示例
根据另一方面,公开了一种装置(例如,被配置为与第二网络设备(例如,HER-TEP)互操作的MC TEP,第二网络设备被配置为将多目的地流量头端复制到离散的单播隧道)。该装置包括处理器;上面存储有指令的存储器;以及集成电路,该集成电路被配置为原生地将多目的地流量映射到网络中的多播群组,加入网络中的多播树。这些指令当被处理器执行时使得处理器订阅与第二网络设备(例如,HER-TEP)相关联的头端复制列表,第二网络设备被配置为将多目的地流量头端复制到离散的单播隧道,其中订阅头端复制列表将单播封装的流量从第二网络设备引导到其中所列出的多个网络设备;其中,此后,i)响应于从第二网络设备(例如,HER-TEP)接收各自包括单播头部和封装的分组的单播封装的流量,经由集成电路移除单播封装的流量的单播头部,以及ii)响应于确定封装的分组包括多目的地分组,经由处理器基于解封装的多目的地的分组头部来将解封装的多目的地分组转发到给定多播群组;并且其中此后,响应于从网络设备接收多目的地流量,经由集成电路使用来自多播树的数据、按照多目的地流量的分组头部中的多播群组地址将所述接收的多目的地流量多播到与多播群组地址相关联的多播群组,其中多播群组包括一个或多个网络设备(例如,MC-TEP)。在一些实施例中,多播群组还包括一个或多个第二网络设备(例如,HER-TEP)。
在一些实施例中,网络设备(例如,MC-TEP)的集成电路是从包括以下各项的组中选出的:专用集成电路(ASIC)、混合信号FPGA、以及可编程混合信号集成电路。在一些实施例中,处理器、存储器以及集成电路共同形成路由器。在一些实施例中,该装置包括一个或多个端口,其中一个或多个端口中至少有一个端口在分别使用该装置进行实例化的第一虚拟化网络设备和第二虚拟化网络设备之间共享。
可与多播隧道端点装置互操作的头端复制隧道端点装置的示例
根据另一方面,公开了一种装置(例如,被配置为将多目的地流量头端复制到离散的单播隧道以促进与第二网络设备(例如,MC-TEP)的多目的地流量操作的HER TEP)。该装置包括处理器;上面存储有指令的存储器;以及集成电路,该集成电路被配置为原生地将多目的地流量映射到网络中的多播群组。这些指令当被处理器执行时使得处理器加入底层网络中的多播树;以及订阅与网络设备(例如,HER-TEP)相关联的头端复制列表,该网络设备被配置为将多目的地流量头端复制到离散的单播隧道,其中订阅头端复制列表将单播封装的流量从订阅的设备引导到其中所列出的多个网络设备,其中,此后,i)响应于从网络设备(例如,MC-TEP)接收各自包括多播头部和封装的分组的多目的地流量,经由集成电路移除多播头部,并且经由集成电路复制多目的地流量的封装的分组,并且经由集成电路向底层多播树中所指定的网络设备发送所复制的封装的分组的单播副本。
在一些实施例中,网络设备(例如,HER-TEP)的集成电路是从包括以下各项的组中选出的:专用集成电路(ASIC)、混合信号FPGA、以及可编程混合信号集成电路。
在一些实施例中,处理器、存储器以及集成电路共同形成路由器。在一些实施例中,该装置包括一个或多个端口,其中一个或多个端口中至少有一个端口在分别使用该装置进行实例化的第一虚拟化网络设备和第二虚拟化网络设备之间共享。
当已经实现或将要实现在数据中心中的ASIC的混合时,可以使用本方法和系统。
示例IGMP报告
图5是示出了将头端复制网络设备加入到底层多播树的示例IGMPv2请求500的图示。如图5中所示,请求500包括类型字段502、最大响应时间字段504、校验和字段506、以及群组地址字段508。类型字段502指示消息类型(例如,成员资格查询(0x11)、成员资格报告(IGMPv1:0x12、IGMPv2:0x16、IGMPv3:0x22)、离开群组组(0x17))。最大响应时间字段504指定响应于成员资格查询(0x11)的相应报告的时间限制。群组地址字段508指定当发送特定于群组或特定于群组和源的查询时正被查询的多播地址。校验和字段506是整个IGMP消息的二进制反码和的16位二进制反码。
图6是将头端复制网络设备加入到底层多播树的示例IGMPv3请求600的图示。如图6中所示,请求600包括类型字段502、最大响应时间字段504、校验和字段506、以及群组地址字段508。另外,请求600包括预留字段602、S标志604(示为“S 604”)、查询器稳健性变量字段606(示为“QRV 606”)、查询器的查询间隔代码字段608(示为“QQIC 608”)、源的数目字段610(示为“源的数目(N)610”)、以及多个源地址612(示为612a、612b、612c和614d)。预留字段602包括预留位。S标志604(即,抑制路由器侧处理标志)向接收路由器指示它们将抑制标准计时器更新。查询器稳健性变量字段(QRV)606包含查询的发送方所使用的稳健性变量值。查询器的查询间隔代码字段608指定查询器所使用的查询间隔值(以秒计)。源的数目(N)字段610指定查询中所出现的源地址的数目。针对一般和特定于组的查询,该值为零。对于特定于群组和源的查询,该值为非零,但受限于网络的MTU。源地址[i]字段612是N个IP单播地址的向量,其中N是源的数目(N)字段中的值。
Claims (20)
1.一种被配置为原生地将多目的地流量映射到网络中的多播群组的系统,所述系统包括:
处理器;以及
存储器,该存储器具有在其上存储的指令,其中在被所述处理器执行时,所述指令使得所述处理器:
把所述系统加入到一个或多个多播树,每个多播树与所述网络中的多播群组相关联;以及
订阅与被配置为把多目的地流量头端复制到离散的单播隧道中的网络设备相关联的头端复制列表,其中对所述头端复制列表的订阅将单播封装的流量从所述网络设备指引至所述第一网络设备以及其中所列出的多个网络设备;
其中此后,i)响应于从所述网络设备接收到单播封装的流量,其中每个单播封装的流量包括单播头部和经封装的分组,则移除所述单播封装的流量的单播头部,以及ii)响应于确定所述经封装的分组包括多目的地分组,则基于解封装的多目的地分组的分组头部来把所述解封装的多目的地分组转发至给定的多播群组;并且
其中此后,响应于从另一第一网络设备接收到多目的地流量,根据所述多目的地流量的分组头部中的多播群组地址,经由多播树把所接收到的多目的地流量多播至与所述多播群组地址相关联的多播群组,其中与所述多播群组地址相关联的多播群组包括一个或多个第一网络设备和一个或多个网络设备。
2.如权利要求1所述的系统,包括第一集成电路,该第一集成电路被配置为原生地将多目的地流量映射到底层网络中的所述多播群组。
3.如权利要求1所述的系统,其中所述网络设备包括第二集成电路,第二集成电路被配置为复制多目的地流量并且向其它网络设备发送经复制的多目的地流量的分离的单播副本并且被配置为不原生地映射多目的地流量到底层网络中的多播群组。
4.如权利要求1所述的系统,其中所述系统包括路由器。
5.如权利要求4所述的系统,其中所述系统包括虚拟化的路由器。
6.如权利要求1所述的系统,其中所述网络设备包括路由器。
7.如权利要求6所述的系统,其中所述路由器同时被配置为所述网络设备和第四网络设备,其中所述第二网络设备和所述第四网络设备中的每一者共享所述路由器的至少一个端口。
8.如权利要求1所述的系统,其中所述系统包括多播使能的隧道端点设备。
9.如权利要求1所述的系统,其中所述网络设备包括头端复制使能的隧道端点设备。
10.一种被配置为复制多目的地流量并且向其它网络设备发送经复制的多目的地流量的分离的单播副本的系统,所述系统被配置为不原生地映射多目的地流量到底层网络中的多播群组,所述系统包括:
处理器;以及
存储器,该存储器具有在其上存储的指令,其中在被所述处理器执行时,所述指令使得所述处理器:
通过静态配置或者通过与所述底层网络中的下一跳路由器经由IGMP的信令方式加入IP多播网络中的底层多播树,其中所述多播树中的所有多播群组被分配到用于不同的覆盖实例(VNI)的广播流量的分发;
其中此后,响应于从网络设备接收到多目的地流量,每个多目的地流量包括多播头部和经封装的分组,则i)移除所述多播头部并且ii)复制所述多目的地流量的经封装的分组并且向所述底层多播树中规定的网络设备发送经复制的经封装的分组的单播副本。
11.如权利要求10所述的系统,其中在被所述处理器执行时,所述指令使得所述处理器作为主机而不是作为路由器来加入所述底层多播树。
12.如权利要求10所述的系统,其中所述系统包括头端复制使能的隧道端点设备。
13.如权利要求10所述的系统,其中所述网络设备包括多播使能的隧道端点设备。
14.如权利要求10所述的系统,包括集成电路,所述集成电路被配置为复制所述多目的地流量并且向其它第二网络设备发送经复制的多目的地流量的分离的单播副本,并且被配置为不原生地映射多目的地流量到底层网络中的多播群组。
15.如权利要求10所述的系统,其中所述网络设备包括被配置为原生地将多目的地流量映射到底层网络中的多播群组的集成电路。
16.如权利要求10所述的系统,其中所述系统包括路由器。
17.如权利要求16所述的系统,其中所述系统包括虚拟化的路由器。
18.如权利要求14所述的系统,其中所述网络设备包括路由器。
19.如权利要求18所述的系统,其中所述路由器同时被配置为所述网络设备和第四网络设备,其中所述第二网络设备和所述第四网络设备中的每一者共享所述路由器的至少一个端口。
20.一种方法,包括:
在被配置为原生地将多目的地流量映射到网络中的多播群组的第一网络设备处,把所述第一网络设备加入到与所述网络中的多播群组相关联的多播树;以及
订阅与第二网络设备相关联的头端复制列表,所述第二网络设备被配置为把多目的地流量头端复制到离散的单播隧道中,其中对所述头端复制列表的订阅把单播封装的流量从所述第二网络设备指引至所述第一网络设备以及其中列出的多个网络设备;
其中此后,i)响应于从所述第二网络设备接收到单播封装的流量,其中每个单播封装的流量包括单播头部和经封装的分组,则移除所述单播封装的流量的单播头部,以及ii)响应于确定所述经封装的分组包括多目的地分组,则基于解封装的多目的地分组的分组头部来把所述解封装的多目的地分组转发至多播群组;并且
其中此后,响应于从另一第一网络设备接收到多目的地流量,根据所述多目的地流量的分组头部中的多播群组地址,经由多播树把所接收到的多目的地流量多播至与所述多播群组地址相关联的第二多播群组,其中所述第二多播群组包括一个或多个第一网络设备和一个或多个第二网络设备,所述第二多播群组由所述多目的地流量的多目的地地址来规定;以及
在被配置为复制多目的地流量并且向其它网络设备发送经复制的多目的地流量的分离的单播副本并且被配置为不原生地映射多目的地流量到底层网络中的多播群组的所述第二网络设备处,通过静态配置或者通过与所述底层网络中的下一跳路由器经由IGMP的信令方式作为主机加入所述多播树,其中所述多播树中的所有多播群组被分配到用于不同的覆盖实例(VNI)的广播流量的分发;
其中此后,响应于从给定的第一网络设备接收到多目的地流量,每个多目的地流量包括多播头部和经封装的分组,则i)移除所述多播头部并且ii)复制所述多目的地流量的经封装的分组并且向所述底层多播树中规定的网络设备发送经复制的经封装的分组的单播副本。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201662320186P | 2016-04-08 | 2016-04-08 | |
US62/320,186 | 2016-04-08 | ||
US15/161,636 US10326694B2 (en) | 2016-04-08 | 2016-05-23 | Asymmetric multi-destination traffic replication in overlay networks |
US15/161,636 | 2016-05-23 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107276905A true CN107276905A (zh) | 2017-10-20 |
CN107276905B CN107276905B (zh) | 2021-03-12 |
Family
ID=58692294
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710231711.3A Active CN107276905B (zh) | 2016-04-08 | 2017-04-10 | 覆盖网络中的非对称多目的地流量复制 |
Country Status (3)
Country | Link |
---|---|
US (1) | US10326694B2 (zh) |
EP (1) | EP3229422A1 (zh) |
CN (1) | CN107276905B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116319529A (zh) * | 2019-09-30 | 2023-06-23 | 瞻博网络公司 | 软件定义网络中的辅助复制 |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10911262B2 (en) * | 2017-10-31 | 2021-02-02 | Cisco Technology, Inc. | Deterministic forwarding across L2 and L3 networks |
CN110519172B (zh) * | 2018-05-21 | 2022-05-13 | 华为技术有限公司 | 无线通信方法和设备 |
US10999196B2 (en) * | 2019-02-25 | 2021-05-04 | Vmware, Inc. | Global replication mode for overlay runtime state migration |
US10951428B2 (en) | 2019-03-28 | 2021-03-16 | Juniper Networks, Inc. | Reliable multicast using a redundant unicast overlay network |
US11601295B2 (en) | 2019-09-23 | 2023-03-07 | Juniper Networks, Inc. | Content delivery with reliable multicast using a redundant unicast overlay network |
JP7302742B2 (ja) * | 2020-06-23 | 2023-07-04 | 日本電気株式会社 | 通信システム、通信装置、通信方法及びプログラム |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101227306A (zh) * | 2008-02-19 | 2008-07-23 | 中兴通讯股份有限公司 | 用于多播处理的报文复制方法和装置 |
CN105379392A (zh) * | 2013-12-11 | 2016-03-02 | 华为技术有限公司 | 功率使用状态信息的传输方法及装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3001609B1 (en) * | 2013-06-28 | 2017-08-09 | Huawei Technologies Co., Ltd. | Method and device for processing multicast message in nvo3 network, and nvo3 network |
US9749221B2 (en) * | 2015-06-08 | 2017-08-29 | International Business Machines Corporation | Multi-destination packet handling at overlay virtual network tunneling endpoints |
-
2016
- 2016-05-23 US US15/161,636 patent/US10326694B2/en active Active
-
2017
- 2017-04-10 EP EP17165723.2A patent/EP3229422A1/en not_active Withdrawn
- 2017-04-10 CN CN201710231711.3A patent/CN107276905B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101227306A (zh) * | 2008-02-19 | 2008-07-23 | 中兴通讯股份有限公司 | 用于多播处理的报文复制方法和装置 |
CN105379392A (zh) * | 2013-12-11 | 2016-03-02 | 华为技术有限公司 | 功率使用状态信息的传输方法及装置 |
Non-Patent Citations (2)
Title |
---|
A. GHANWANI, ET AL.: ""Framework of Supporting Applications Specific Multicast in NVO3;draft-ghanwani-nvo3-app-mcast-framework-02"", 《IETF》 * |
L. XIA, ET AL: ""Detecting NVO3 Overlay Point-to-Multipoint Data Plane failures;draft-xia-nvo3-overlay-p2mp-ping-01"", 《IETF》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116319529A (zh) * | 2019-09-30 | 2023-06-23 | 瞻博网络公司 | 软件定义网络中的辅助复制 |
Also Published As
Publication number | Publication date |
---|---|
US20170295093A1 (en) | 2017-10-12 |
EP3229422A1 (en) | 2017-10-11 |
US10326694B2 (en) | 2019-06-18 |
CN107276905B (zh) | 2021-03-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11398921B2 (en) | SDN facilitated multicast in data center | |
CN107276905A (zh) | 覆盖网络中的非对称多目的地流量复制 | |
EP3677013B1 (en) | Replication with dedicated metal deployment in a cloud | |
US5959989A (en) | System for efficient multicast distribution in a virtual local area network environment | |
US9736054B2 (en) | Multicast active source discovery and management for layer-2 interconnect solutions | |
US6839348B2 (en) | System and method for distributing multicasts in virtual local area networks | |
US8717934B2 (en) | Multicast source move detection for layer-2 interconnect solutions | |
US20130021942A1 (en) | Granular Control of Multicast Delivery Services for Layer-2 Interconnect Solutions | |
CN112543146B (zh) | 基于控制平面的evpn优化子网间组播(oism)转发 | |
US20100329252A1 (en) | Method and Apparatus for Enabling Multicast Route Leaking Between VRFs in Different VPNs | |
EP2989755B1 (en) | Efficient multicast delivery to dually connected (vpc) hosts in overlay networks | |
US9008118B2 (en) | Multicast data delivery over mixed multicast and non-multicast networks | |
US9503272B2 (en) | Fast convergence with multicast source mobility | |
US9548887B2 (en) | Proactive creation of multicast state in an overlay transport network to achieve fast convergence on failover | |
WO2014199924A1 (ja) | 制御装置、通信システム、中継装置の制御方法及びプログラム | |
CN114915588B (zh) | 用于任播部署的上游多播跳umh扩展 | |
JP2013118537A (ja) | マルチキャスト配信システム、ルータ及びマルチキャスト配信方法 | |
KR101220177B1 (ko) | 이더넷 망에서 소스 지정 멀티캐스트 서비스 제공 방법 및 시스템 | |
Lee et al. | Implementing multicast on id/locator separation network | |
Lee et al. | Revisiting multicast on id/locator separation network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |