CN108512702B - 一种基于sr和esi实现dc间端到端质量保障的系统及方法 - Google Patents
一种基于sr和esi实现dc间端到端质量保障的系统及方法 Download PDFInfo
- Publication number
- CN108512702B CN108512702B CN201810256975.9A CN201810256975A CN108512702B CN 108512702 B CN108512702 B CN 108512702B CN 201810256975 A CN201810256975 A CN 201810256975A CN 108512702 B CN108512702 B CN 108512702B
- Authority
- CN
- China
- Prior art keywords
- network
- node
- vtep
- esi
- dci
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 18
- 238000005516 engineering process Methods 0.000 claims abstract description 29
- 238000004891 communication Methods 0.000 claims abstract description 18
- 230000007246 mechanism Effects 0.000 claims description 12
- 230000004888 barrier function Effects 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 11
- 230000009977 dual effect Effects 0.000 description 10
- 238000001514 detection method Methods 0.000 description 7
- 101100059544 Arabidopsis thaliana CDC5 gene Proteins 0.000 description 4
- 101150115300 MAC1 gene Proteins 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000007812 deficiency Effects 0.000 description 2
- 230000005484 gravity Effects 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 230000006855 networking Effects 0.000 description 2
- ABEXEQSGABRUHS-UHFFFAOYSA-N 16-methylheptadecyl 16-methylheptadecanoate Chemical compound CC(C)CCCCCCCCCCCCCCCOC(=O)CCCCCCCCCCCCCCC(C)C ABEXEQSGABRUHS-UHFFFAOYSA-N 0.000 description 1
- 101150077548 DCI1 gene Proteins 0.000 description 1
- 241000764238 Isis Species 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005538 encapsulation Methods 0.000 description 1
- 238000005417 image-selected in vivo spectroscopy Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000012739 integrated shape imaging system Methods 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 239000000523 sample Substances 0.000 description 1
- 238000003756 stirring Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0654—Management of faults, events, alarms or notifications using network fault recovery
- H04L41/0668—Management of faults, events, alarms or notifications using network fault recovery by dynamic selection of recovery network elements, e.g. replacement by the most appropriate element after failure
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/08—Configuration management of networks or network elements
- H04L41/0803—Configuration setting
- H04L41/0823—Configuration setting characterised by the purposes of a change of settings, e.g. optimising configuration for enhancing reliability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/12—Discovery or management of network topologies
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/50—Network service management, e.g. ensuring proper service fulfilment according to agreements
- H04L41/5003—Managing SLA; Interaction between SLA and QoS
- H04L41/5019—Ensuring fulfilment of SLA
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L45/00—Routing or path finding of packets in data switching networks
- H04L45/22—Alternate routing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L47/00—Traffic control in data switching networks
- H04L47/10—Flow control; Congestion control
- H04L47/12—Avoiding congestion; Recovering from congestion
- H04L47/125—Avoiding congestion; Recovering from congestion by balancing the load, e.g. traffic engineering
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明公开了一种基于SR和ESI实现DC间端到端质量保障的系统,包括若干DC网络端,任意两个DC网络端之间隔离出三个underlay网络;任意一个DC1网络端向另一个DC2网络端进行封装好的VXLAN数据包通讯时,首先从将数据包DC1网络端的CE进入到VTEP,然后由VTEP进入到DCI,接着通过underlay进入到DC2网络端的DCI,然后由DCI进入到VTEP,最后进入到DC2网络端的CE,通讯完成。在任意两个DC之间的underlay网络中,配置SR技术,实现快速重路由,保护DC之间广域网络的访问质量;在overlay网络中,在VTEP、DCI配置ESI技术,实现了DC到DC端到端冗余保护。
Description
技术领域
本发明涉及网络技术领域,具体涉及一种基于SR和ESI实现DC间端到端质量保障的系统及方法。
背景技术
VXLAN IETF Draft(vxlan标准草案)(draft-mahalingam-dutt-dcops-vxlan-01)规定了VTEP(VXLAN Tunnel Endpoints,VXLAN隧道的端点)间的通信基于underlay网络的特性,即部署的IGP/EBGP/MPLS等协议的路由特性。
VXLAN数据包在VTEP间的环路避免、快速重路由、路径选择、负载分担等路由特性基于underlay网络的IGP/BGP特性,这就存在以下两个问题:
IGP网络在链路故障时收敛速度慢,当IGP网络发生故障时,即使部署了BFD等快速检测工具,IGP网络在路径重新计算过程中往往需要1000ms以上达到秒级,不能满足业务无感知的要求;当底层underlay网络无法实现快速收敛或者DC内VTEP节点、DCI边缘节点故障时,上层overlay网络又缺乏快速有效的冗余保护机制,则无法实现业务的迅速切换。且VXLAN IETF Draft中没有定义VXLAN控制面的负载均衡参数,使得CE在不同VTEP结点间的负载均衡无法实现。
传统underlay网络不能根据业务属性选择与之相适应的路径,其视VXLAN数据包为普通IP包,在VTEP间转发时基于HASH算法,随机转发到一条路径上,该路径的时延、带宽、抖动等参数并不一定能满足VXLAN数据包的业务需求。
发明内容
为了解决上述技术问题,克服上述现有技术的不足,提供一种underlay网络快速收敛、overlay网络DC内及DC间网络多级冗余保护和根据业务选择最优路径的综合VXLAN网络通讯系统以及方法。
为实现上述目的,本发明采取的技术方案如下:
一种基于SR和ESI实现DC间端到端质量保障的系统,包括若干DC网络端,任意两个DC网络端之间通过广域网进行连接,所述广域网之间部署有用于保护DC之间网络的访问质量,实现快速重路由的SR;
任意一个DC网络端至少包括一个CE网络节点、两个VTEP网络节点及两个DCI节点,并且任意一个DC网络端中:
所述CE网络节点双规接入到所述VTEP网络节点中;
两个所述VTEP网络节点之间配置ESI,用于提供VTEP网络节点的overlay保护;
两个所述DCI网络节点之间配置ESI,用于提供DCI网络节点的overlay保护;
所述VTEP网络节点发布带有自身ESI信息的VXLAN路由,被所述DCI网络节点学习到后,形成该路由的ESI冗余转发信息;
任意一个DC网络端中所述VTEP网络节点与DCI网络节点之间配置有underlay网络,任意两个DC网络端之间的广域网内配置有underlay网络;
任意一个DC网络端作为发送端将封装好的VXLAN数据包发送给另一个作为接收端的DC网络端时,首先从发送端的DC网络端的CE进入到VTEP,然后由VTEP进入到DCI,接着通过广域网进入到接收端DC网络端的DCI,然后由DCI进入到VTEP,最后进入到DC2网络端的CE,通讯完成;
其中,所述CE为客户端,DC为网络中心,VXLAN为可扩展虚拟局域网,VTEP为VXLAN隧道的端点,DCI为数据中心与广域网互联点,ESI为网络中以太网段的唯一标识,underlay为基础框架层,overlay为上层网络,SR为源路由机制。优选地,所述VTEP网络节点及DCI网络节点均对外发布RT3路由,并且所发布RT3路由均不相同。
优选地,所述VTEP网络节点及DCI网络节点之间通过RT-4、根据优先级或者根据IP或者mac地址大小进行DF的选举。
优选地,所述VTEP网络节点及DCI网络节点进行DF的选举之后,选举机制自动产生新的DF,用于接收BUM流量。
优选地,所述VXLAN数据包由DC网络端进入所述广域网之前,在DCI将所述VXLAN数据包二层和三层之间封装SR标签。
优选地,所述SR在每个网络节点发生故障之前计算好倒换的备份路径。
优选地,所述备份路径存储在SDN控制器中,当某网络节点发生故障时,通过BFD快速检测链路故障,SDN控制器通过标签下发迅速改变转发流量通过备份路径,实现网络的快速收敛。
一种基于SR和ESI实现DC间端到端质量保障的方法,该方法应用在上述一种基于SR和ESI实现DC间端到端质量保障的系统中,该方法包括以下步骤:
S1:SR计算各个网络节点故障时剩余拓扑的最优路径,并将计算好的最优路径存储到控制器SDN中;
S2:打包封装好的VXLAN数据包从一个DC网络端发送到另一个DC网络端,若两个DC网络中的各个网络节点均正常,则VXLAN数据包正常发送,若两个DC网络中的任意一个网络节点出现故障,则跳转到S3;
S3:所述控制器SDN调取相应节点备份的故障时剩余拓扑的最优路径,改变标签下发,使发送的VXLAN数据包前换到新的路径上,快速完成收敛。
本发明有益的技术效果:在任意两个DC之间的underlay网络中,配置SR,实现快速重路由,保护DC之间网络的访问质量;在overlay网络中,在VTEP点配置ESI,实现了DC接入点的冗余保护,在DCI边缘节点配置ESI技术,实现DC间冗余保护,实现了全网端到端OVERLAY保护;从而形成了overlay+underlay的双重保护机制,极大地提高了网络的可靠性;通过引入ESI,解决了传统CE在双归到不同VTEP时出现的漂移问题,实现在正常转发情况下不同VTEP结点间的负载均衡。
附图说明
图1为本发明一种基于SR和ESI实现DC间端到端质量保障的系统结构框图;
图2为本发明一种基于SR和ESI技术的DC到DC网络端到端正常通讯时链路拓扑图;
图3为现有技术中DC到DC网络端到端链路2,3故障时的链路拓扑图;
图4为本发明一种基于SR和ESI技术的DC到DC网络端到端链路2,3故障时的链路拓扑图;
图5为本发明中单播报文转发与保护正常状态的结构框图。
图6为本发明中单播报文转发与保护VTEP网络节点故障时的结构框图。
图7为本发明中单播报文转发与保护DCI网络节点故障时的结构框图。
图8为本发明中BUM报文转发与保护正常状态的结构框图。
图9为本发明中BUM报文转发与保护VTEP网络节点故障时的结构框图。
图10为本发明中BUM报文转发与保护DCI网络节点故障时的结构框图。
图11为传统VXLAN网络中的数据转发的结构框图;
图12为本发明中VXLAN ESI网络中的数据转发的结构框图;
图13为本发明SR实现underlay网络的路径选择原理图;
图14为本发明SR架构中控制器的工作原理图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例对本发明进行进一步详细说明,但本发明要求保护的范围并不局限于下述具体实施例。
如图1所示,一种基于SR和ESI实现DC间端到端质量保障的系统,包括若干DC(数据中心)网络端,任意两个DC网络端之间隔离出三个underlay(基础架构层,专门用于承载用户流量的传统的IP网络)网络,具体地,两个DC网络端内配置有underlay,两个DC网络端之间通过广域网连接,该广域网配置有underlay和用于保护DC之间网络的访问质量,实现快速重路由的SR。所述SR是一种源路由机制,用于优化IP,MPLS的网络能力。可以使网络获得更佳的可扩展性,并以更加简单的方式提供TE、FRR、MPLS VPN等功能。和MPLS的网络类似,SR也是以标签交换为基础的。但是和MPLS网络需要依靠LDP,RSVP等外部协议实现标签的分发、TE等功能不同,SR只是对现有的IGP协议进行简单的扩展,就可以实现TE、FRR、MPLS VPN等功能,相较于传统的标签分发技术,SR最大特点是其在SR头结点完成了全程路径标签的分配,且标签分配是由SDN控制器完成,从而实现对全程访问路径的控制。
任意一个DC网络端至少包括一个CE(客户端路由器)网络节点、两个VTEP网络节点及两个DCI(数据中心间)网络节点,其中:
作为发送端的DC1网络端内的CE点双归接入VTEP点,VTEP点之间配置ESI,提供接入点的overlay保护。
DCI节点之间配置ESI,提供DCI点的overlay保护。
DC内的VTEP点发布带有自身ESI信息的VXLAN路由,被DCI节点学习到后,形成该路由的ESI冗余转发信息。
DCI节点修改路由的ESI信息与下一跳信息,并向中间域传播给其他DCI节点。
其他DCI节点收到后,形成该路由的ESI冗余转发信息,并继续修改路由的ESI信息与下一跳信息,发布给作为接收端的DC2网络端内的各个节点,以此形成了该路由的ESI冗余转发信息。
至此,形成了VXLAN的端到端的overlay冗余路由信息。
实现了全网端到端OVERLAY保护以及DC间overlay冗余保护,从而形成了overlay+underlay的双重保护机制,极大地提高了网络的可靠性。
任意一个DC网络端作为发送端(DC1)向另一个作为接收端的DC网络端(DC2)进行封装好的VXLAN数据包通讯时,数据包首先从发送端DC网络端的CE进入到VTEP,然后由VTEP进入到DCI,接着通过广域网进入到接收端DC网络端的DCI,然后由DCI进入到VTEP,最后进入到DC2网络端的CE,通讯完成。
其中,所述CE为客户端,DC为网络中心,VXLAN为可扩展虚拟局域网,VTEP为VXLAN隧道的端点,DCI为数据中心与广域网互联点,ESI为网络中以太网段的唯一标识,underlay为基础框架层,overlay为上层网络,SR为源路由机制。
具体地,所述VTEP网络节点及DCI网络节点均对外发布RT3(路由类型3,包容性组播路由)路由,并且所发布RT3路由均不相同。
优选地,所述VTEP网络节点及DCI网络节点之间通过RT-4(路由类型4,以太网段路由)、根据优先级或者根据IP或者mac地址大小进行DF(指定转发器)的选举。
优选地,所述VTEP网络节点及DCI网络节点进行DF的选举之后,选举机制自动产生新的DF,用于接收BUM(广播、未知单播或组播)流量。
优选地,所述VXLAN数据包由DC1网络端进入所述广域网之前,在DCI将所述VXLAN数据包二层和三层之间封装SR标签。
优选地,所述SR在每个网络节点发生故障之前计算好倒换的备份路径。
优选地,所述备份路径存储在SDN控制器中,当某网络节点发生故障时,通过BFD快速检测链路故障,SDN控制器通过标签下发迅速改变转发流量通过备份路径,实现网络的快速收敛。
一种基于SR和ESI实现DC间端到端质量保障的方法,该方法应用在上述一种基于SR和ESI实现DC间端到端质量保障的系统中,该方法包括以下步骤:
S1:SR计算各个网络节点故障时剩余拓扑的最优路径,并将计算好的最优路径存储到控制器SDN中;
S2:打包封装好的VXLAN数据包从一个DC网络端发送到另一个DC网络端,若两个DC网络中的各个网络节点均正常,则VXLAN数据包正常发送,若两个DC网络中的任意一个网络节点出现故障,则跳转到S3;
S3:所述控制器SDN调取相应节点备份的故障时剩余拓扑的最优路径,改变标签下发,使发送的VXLAN数据包前换到新的路径上,快速完成收敛。
具体地,本发明中采用SR实现underlay IGP网络的快速收敛原理如下:
FRR(Fast Reroute,快速重路由)旨在当网络中链路或者节点失效后,为这些重要的节点或链路提供备份保护,实现快速重路由,减少链路或节点失效时对流量的影响,使流量实现快速恢复。
SR中的FRR技术主要用于保护underlay网络中的设备和链路,每个被保护的设备和链路在故障发生之前被计算好倒换的备份路径。在确定好VXLAN网络的头尾节点后,SR计算备份路径仅基于独立的设备或者链路,与流量、标签及其他的设备无关。备份路径被存储在SDN控制器里,当该设备或者链路发生故障时,通过BFD快速检测链路故障,SDN控制器通过标签下发迅速改变转发流量通过备份路径,从而实现网络的快速收敛。
本发明使用ESI实现全程端到端的冗余保护及VTEP结点间负载均衡:
通常情况下,underlay网络中的SR技术可以实现快速重路由,overlay网络无感知,但是在极端情况下,underlay网络无法实现快速收敛,这时ESI技术可以实现overlay网络的冗余保护,CE点双归接入VTEP点,VTEP点之间配置ESI,实现VTEP节点之间的冗余保护;VTEP节点双归接入DCI节点,在DCI之间转发时形成该路由的ESI冗余转发信息,且DCI之间存在多个underlay网络。当DCI节点或者underlay网络发生故障时时,可通过冗余转发信息将路由迅速切换到其他正常的DCI节点及对应underlay网络上,实现快速重路由,保护业务不受影响。
EVPN网络通过引入ESI,解决了传统VXLAN网络中CE双归不同VTEP结点时的MAC地址漂移问题,实现VTEP结点间的负载均衡。
本发明使用SR实现underlay网络的路径选择:
VXLAN网络中DCI间的网络一般存在多条路径,每条路径的时延、丢包、抖动、负荷等网络质量不同,某些业务对特定的网络质量有要求,比如游戏业务要求时延低,语音业务要求丢包率低。SR网络可以实时采集不同路径的网络性能参数,根据需求将业务分配到满足要求的路径上承载,从而保证了业务质量,实现了网络资源的优化配置。
本发明使用SR技术优化了VXLAN的underlay网络,使其可以实现快速重路由和路径优化选择,为VXLAN网络提供了端到端的业务保障,提升了业务访问质量,实现了网络资源的优化配置。
SR架构网络转发面与MPLS网络类似,都是基于分配的标签转发;但是在控制面,SR架构网络在头节点的报文中按序插入带有全程路径信息的标签,以指示该报文在网络中转发的全程路径,其控制面信息在头节点压入数据包,转发过程中的中间节点无需维持隧道状态,仅需要依照标签信息进行转发。因此,头节点的标签生成成为SR网络中的核心问题,在SDN网络架构中,我们通常使用SDN控制器来控制全程的标签,可以与信息采集对接以便更好地管理网络。
VXLAN是目前基于三层IP overlay网络构建虚拟网络技术中影响力最为广泛的一种。它通过L2over L4(MAC in UDP)的报文封装方式,实现基于IP overlay的虚拟局域网。适用于DC间大二层的打通,是当下最主流的overlay网络构建方式之一。但是VXLAN技术在VTEP间流量传递依赖于底层underlay网络的IGP/BGP特性,IGP网络在链路故障时收敛速度慢。当IGP网络发生故障时,即使部署了BFD等快速检测工具,IGP网络在路径重新计算过程中往往需要达到秒级,不能满足业务无感知的要求;当底层underlay网络无法实现快速收敛或者DC内VTEP节点、DCI边缘节点故障时,上层overlay网络又缺乏快速有效的冗余保护机制,则无法实现业务的迅速切换。
SR技术可提供underlay网络的保护,ESI技术可提供overlay网络的保护,SR+ESI的网络解决方案,其提供的网络特性可以很好解决VXLAN网络的不足。
下面对SR实现underlay IGP网络的快速收敛以及使用ESI实现全程端到端的冗余保护及VTEP结点间负载均衡进行详细说明。
1.使用SR实现underlay IGP网络的快速收敛如下:
大型IGP(内部网关协议)网络中使用动态IGP协议(如OSPF、ISIS等)的路径计算基于底层的SPF(最短路径优先)算法,当故障发生时,即使网络中部署了BFD(双向转发检测机制)策略能实现故障的快速检测,SPF算法重新计算出最优路径的时间往往大于1000ms;传统的FRR技术是对每个可能故障的节点或链路都指定其备份节点或链路,当检测到链路故障时,把所有流量都切换到备份节点或链路上,但是并不是所有网络中的每个节点或链路都存在备份节点或链路,且切换后的路径并非最优路径,下面将详细说明:
如图2所示,从节点1去往节点4的最优路径为节点1>节点2>节点3>节点4,从节点1去往节点7的最优路径为节点1>节点2>节点3>节点7,为了保护节点2和节点3之间的链路(以下简称链路23,以此类推),传统FRR会指定链路23的备份链路为链路25,当链路23发生故障时所有流量迅速切换到链路25,如图3:
从图3可知,节点1去往节点7的路径存在两条:节点1>节点2>节点5>节点3>节点7(metric40)以及节点1>节点2>节点6>节点7(metric35),但是FRR指定的路径为第一条路径,从而形成了次优路径,究其原因,是传统的FRR对不同源目路径(如图中的1-4和1-7)都采用了同样的备份路径。
draft-francois-segment-routing-ti-lfa-00中规定了SR网络环境下拓扑无关的快速重路由机制。当网络中的节点或者链路发生故障时,SR可以帮助故障节点实现本地修复从而快速重新建立起一条端到端的最优路径。其原理是对于网络中的每个节点或者链路,计算其故障时剩余拓扑的最优路径,还是以上面的拓扑为例,为了保护链路23,我们可以假设其发生了故障,则其拓扑可以等价为图4:
如图4所示,在此拓扑下,从节点1去往节点4的最优路径为节点1>节点2>节点5>节点3>节点4,从节点1去往节点7的最优路径为节点1>节点2>节点6>节点7,可知以上两条路径就是在节点2和节点3之间链路发生故障时节点1去往节点4和节点7的最优路径,并将此两台路径信息存储在控制器,当链路23发生故障时,控制器可以改变标签下发,使节点1去往节点4和节点7的流量迅速切换到新的路径上。由此可知,控制器计算拓扑中每个节点或者链路故障时,会在拓扑中移除该节点或者链路,重新计算不同源目路径对应的备份路径,并通过Segment标签的形式存储在控制器,当该节点或者链路发生故障时,会迅速下发新的Segment标签,使去往目的节点的流量切换到新的路径上,从而实现了快速收敛,也解决了传统FRR技术中存在次优路径的问题。
对于部署SR的VXLAN网络,改变传统快速重路由需要在VXLAN交换机之间不停地发送探测报文的模式,其快速重路由完全不依赖overlay网络,仅在underlay网络层面就可以自动实现,使得网络对边缘节点VXLAN交换机的性能要求大大降低,便于VXLAN的大规模部署。
2.使用ESI实现全程端到端的冗余保护及VTEP结点间负载均衡
ESI可以提供在underlay网络无法快速收敛时的DC间网络的冗余保护,也可以提供DC内VTEP节点、DCI边缘节点故障时的接入冗余保护,下面分别对于单播报文和多播报文,在正常状态和各种节点故障的情况下的流量走向进行描述。具体如下:
如图5所示单播报文转发与保护正常状态:正常状态流量可以进行复合分担的转发,提供更高的带宽。
如图6所示,VTEP接入点故障保护:一个VTEP接入点的故障,可以通过另外一个VTEP接入点,正常传递流量。
如图7所示,DCI点故障保护:一个DCI接入点的故障,可以通过另外一个DCI点,正常传递流量。
如图8所示,BUM报文转发与保护的正常状态:网络中,DCI2,DCI4,VTEP3为DF节点,接收并转发BUM报文;DCI1,DCI3,VTEP4为non-DF节点,接收并丢弃BUM报文。
如图9所示,VTEP接入点故障保护:一个VTEP点的故障,对于BUM报文没有影响。如果是DF,则会导致DF的重选。
如图10所示,DCI点故障保护:一个DCI点的故障,对于BUM报文没有影响。如果是DF,则会导致DF的重选。
如图11所示,传统的VXLAN网络中,MAC1地址在被CE1学到后,会同时发给双归接入的PE1和PE2,因为传统VXLAN技术没有定义负载分担,PE3从PE1和PE2同时学到了MAC1的地址,其只会保留一个下一跳并存入转发表,这就会导致转发表下一跳频繁在PE1和PE2之间翻动,无法实现负载均衡且网络极不稳定。
如图12所示,而在VXLAN ESI网络中,由于引入了ESI的概念,扩展了BGP控制面属性,使得不同PE学到同样MAC地址并向外通告时,如果使用同样的ESI,则可被远端的PE同时接收。
MAC1地址在被CE1学到后,会同时发给双归接入的PE1和PE2,PE1、PE2在向远端通告BGP数据包时会在BGP数据包里携带MAC1地址以及对应的ESI,ESI可以手动配置也可以自动生成,此图中PE1、PE2及两者与CE1互联的链路被配置成了ESI1,,远端的PE3学到PE1、PE2通告同样的MAC地址及ESI1,会自动在转发表里将下一跳设置为ESI1,进一步迭代查询后会将PE1、PE2两个地址设为下一跳,从而实现负载均衡。
使用SR实现underlay网络的路径选择:
如图13所示,VXLAN作为一种overlay技术,其underlay网络承载在VXLAN交换机之间的IGP/BGP网络上,underlay网络往往存在等价/不等价负载均衡路径,不同路径的时延、抖动、丢包、负载等性能参数不同,而VXLAN隧道上承载不同的业务对网络性能参数指标的要求也不一样,比如游戏业务要求时延低,语音业务要求丢包率低、抖动小。在传统的underlay网络中,业务承载在哪条路径上是基于设备的HASH算法,现行条件下无法控制具体业务承载在哪条路径上。
SR是一种具有广泛适用性的协议,其转发面协议可以基于MPLS或者IPv6,控制面协议可以基于IGP、BGP,现行VXLAN网络环境下,SR使用MPLS作为其转发平面协议,使用IGP+BGP作为其控制平面协议。
如图14所示,SR架构SDN控制器具有以下几个功能:
1)路径计算。
VTEP间的可用路径由underlay网络的IGP/BGP协议计算得来,SDN控制器将这些路径列为可用路径,同时路由器实时采集网络中的时延、抖动、丢包、负载等性能参数,通过SNMP、netflow、telemetry等协议上送至SDN控制器,控制器实时计算不同可用路径的各项性能参数。
2)业务标记
当业务报文进入VXLAN交换机封装成VXLAN报文时,我们可以根据其带有的标记等区分不同业务,并在其报文里封装了全局有效的VNI,以此做业务隔离。使用Overlay+VNI构建虚拟网络,支持多达16M的虚拟网络,现行条件下可以覆盖区分所有类型的业务。带有VNI标记的VXLAN数据包进入基于SR的underlay网络时,SDN控制器会读取VNI并识别该数据包的业务类型。
3)智能选路
根据业务需求,可以在SDN控制器中制定选路原则。SDN控制器根据实时的路径各项网络性能参数以及事先制定的选路原则,智能地为进入SR网络的业务数据包分配匹配的路径。VXLAN的underlay网络底层基于IGP/BGP协议,IGP/BGP协议为SR生成标签空间时天然支持ECMP,在SDN控制器为业务数据包选路时也支持可选的多条路径的ECMP。
在完成对业务数据包的路径选择后,SDN控制器会根据选择的路径下发相应的segment标签,使得业务数据包承载在指定的路径上。
4)状态维护
SDN控制器通过标签下发控制业务数据包的具体路径,其在头节点就能确定全程路径的确定设备和链路,天然支持业务路径的显式呈现,可与网管系统相连,呈现显式路径便于管理者的查询和管理。
当网络状况发生变化时,SDN控制器重新计算VTEP节点间不同路径的网络参数,并根据业务需求重新规划路径。同时在网管系统上呈现显式路径的改变,便于管理者对网络的维护。
Overlay报文能够转发的基础是underlay的可靠传输,采用本专利所述的SR多路径保护技术,能够提高underlay网络的可靠性,以保证overlay控制面和数据面报文,能够正确传递到各个节点。
本文通过SR技术与EVPN ESI技术的有机结合,提供了overlay+underlay的双重保护技术。使用该技术,既可以使流量能够得到保护,提高系统的可靠性;而且在没有故障的情况下,能够使流量能够复合分担发送,提高系统的整体性能,对于DC和DC间的网络部署,具有现实意义。
以上各英文缩写对应的中文意思如下:
SR:Segment Routing,源路由机制
VXLAN:Virtual Extensible LAN,可扩展虚拟局域网
VTEP:VXLAN Tunnel Endpoints,VXLAN隧道的端点
ESI:Ethernet Segment Identifier,在网络中以太网段的唯一标识
VNI:VXLAN Network Identifier,VXLAN网络标识
FRR:Fast Reroute,快速重路由
BFD:Bidirectional Forwarding Detection,双向转发检测
SDN:Software Defined Network,软件定义网络
根据上述说明书的揭示和教导,本发明所属领域的技术人员还可以对上述实施方式进行变更和修改。因此,本发明并不局限于上面揭示和描述的具体实施方式,对发明的一些修改和变更也应当落入本发明的权利要求的保护范围内。此外,尽管本说明书中使用了一些特定的术语,但这些术语只是为了方便说明,并不对发明构成任何限制。
Claims (8)
1.一种基于Segment Routing和ESI技术的DC到DC网络端到端通讯系统,其特征在于,包括若干DC网络端,任意两个DC网络端之间通过广域网进行连接,所述广域网之间部署有用于保护DC之间网络的访问质量,实现快速重路由的Segment Routing;
任意一个DC网络端至少包括一个CE网络节点、两个VTEP网络节点及两个DCI网络节点,并且任意一个DC网络端中:
所述CE网络节点双规接入到所述VTEP网络节点中;
两个所述VTEP网络节点之间配置ESI,用于提供所有网络节点的overlay保护;
两个所述DCI网络节点之间配置ESI,用于提供都有网络节点的overlay保护;
所述VTEP网络节点发布带有自身ESI信息的VXLAN路由,被所述DCI网络节点学习到后,形成该路由的ESI冗余转发信息;
任意一个DC网络端中所述VTEP网络节点与DCI网络节点之间配置有underlay网络,任意两个DC网络端之间的广域网内配置有underlay网络;
任意一个DC网络端作为发送端将封装好的VXLAN数据包发送给另一个作为接收端的DC网络端时,首先从发送端的DC网络端的CE进入到VTEP,然后由VTEP进入到DCI,接着通过广域网进入到接收端DC网络端的DCI,然后由DCI进入到VTEP,最后进入到接收端DC网络端的CE,通讯完成;
其中,所述CE为客户端路由器,DC为网络中心,VXLAN为扩展的虚拟局域网专线,VTEP为VXLAN隧道的端点,DCI为数据中心间,ESI为网络中以太网段的唯一标识,underlay为基础框架层,overlay为上层网络,Segment Routing为源路由。
2.如权利要求1所述的一种基于Segment Routing和ESI技术的DC到DC网络端到端通讯系统,其特征在于,所述VTEP网络节点及DCI网络节点均对外发布RT3路由,并且所发布RT3路由均不相同。
3.如权利要求1或2所述的一种基于Segment Routing和ESI技术的DC到DC网络端到端通讯系统,其特征在于,所述VTEP网络节点及DCI网络节点之间通过RT-4、根据优先级或者根据IP或者mac地址大小进行指定转发器DF的选举。
4.如权利要求3所述的一种基于Segment Routing和ESI技术的DC到DC网络端到端通讯系统,其特征在于,所述VTEP网络节点及DCI网络节点进行DF的选举之后,选举机制自动产生新的指定转发器DF,用于接收广播、未知单播或组播BUM流量。
5.如权利要求1所述的一种基于Segment Routing和ESI技术的DC到DC网络端到端通讯系统,其特征在于,所述VXLAN数据包由DC网络端进入所述广域网之前,在所述VXLAN数据包二层和三层之间封装Segment Routing标签。
6.如权利要求1所述的一种基于Segment Routing和ESI技术的DC到DC网络端到端通讯系统,其特征在于,所述Segment Routing在每个网络节点发生故障之前计算好倒换的备份路径。
7.如权利要求6所述的一种基于Segment Routing和ESI技术的DC到DC网络端到端通讯系统,其特征在于,所述备份路径存储在软件定义网络SDN控制器中,当某网络节点发生故障时,通过双向转发检测BFD快速检测链路故障,软件定义网络SDN控制器通过标签下发迅速改变转发流量通过备份路径,实现网络的快速收敛。
8.一种基于Segment Routing和ESI技术的DC到DC网络端到端通讯方法,该方法应用在如权利要求1-7任意一项所述的一种基于Segment Routing和ESI技术的DC到DC网络端到端通讯系统中,其特征在于,该方法包括以下步骤:
S1:Segment Routing计算各个网络节点故障时剩余拓扑的最优路径,并将计算好的最优路径存储到SDN控制器中;
S2:打包封装好的VXLAN数据包从一个DC网络端发送到另一个DC网络端,若两个DC网络中的各个网络节点均正常,则VXLAN数据包正常发送,若两个DC网络中的任意一个网络节点出现故障,则跳转到S3;
S3:所述SDN控制器调取相应节点备份的故障时剩余拓扑的最优路径,改变标签下发,使发送的VXLAN数据包前换到新的路径上,快速完成收敛。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810256975.9A CN108512702B (zh) | 2018-03-27 | 2018-03-27 | 一种基于sr和esi实现dc间端到端质量保障的系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810256975.9A CN108512702B (zh) | 2018-03-27 | 2018-03-27 | 一种基于sr和esi实现dc间端到端质量保障的系统及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108512702A CN108512702A (zh) | 2018-09-07 |
CN108512702B true CN108512702B (zh) | 2019-06-11 |
Family
ID=63378713
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810256975.9A Active CN108512702B (zh) | 2018-03-27 | 2018-03-27 | 一种基于sr和esi实现dc间端到端质量保障的系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108512702B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3985930A4 (en) * | 2019-07-12 | 2022-08-03 | Huawei Technologies Co., Ltd. | DATA TRANSMISSION METHOD, NETWORK NODE AND STORAGE MEDIA |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111106991B (zh) * | 2018-10-29 | 2022-05-06 | 中国移动通信集团浙江有限公司 | 一种云专线系统及其业务发放和开通方法 |
CN109617716B (zh) * | 2018-11-30 | 2022-02-25 | 新华三技术有限公司合肥分公司 | 数据中心异常处理方法及装置 |
CN110535772B (zh) * | 2019-08-27 | 2020-06-16 | 南京中兴软件有限责任公司 | 分段路由流量工程策略的发送及接收方法、装置和网元 |
CN112671650B (zh) * | 2020-12-28 | 2022-07-22 | 网络通信与安全紫金山实验室 | Sd-wan场景下的端到端sr控制方法、系统和可读存储介质 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100481805C (zh) * | 2005-11-24 | 2009-04-22 | 杭州华三通信技术有限公司 | 环型以太网及其业务承载实现方法 |
US8767731B2 (en) * | 2010-05-19 | 2014-07-01 | Alcatel Lucent | Method and apparatus for MPLS label allocation for a BGP MAC-VPN |
-
2018
- 2018-03-27 CN CN201810256975.9A patent/CN108512702B/zh active Active
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3985930A4 (en) * | 2019-07-12 | 2022-08-03 | Huawei Technologies Co., Ltd. | DATA TRANSMISSION METHOD, NETWORK NODE AND STORAGE MEDIA |
Also Published As
Publication number | Publication date |
---|---|
CN108512702A (zh) | 2018-09-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108512702B (zh) | 一种基于sr和esi实现dc间端到端质量保障的系统及方法 | |
KR101503629B1 (ko) | 주소 기반 캐리어 네트워크의 구별 전달 | |
US10148517B2 (en) | Systems and methods for topology discovery and application in a border gateway protocol based data center | |
CN105049350B (zh) | 利用出口对等工程的分段路由的方法、装置及系统 | |
US8976793B2 (en) | Differential forwarding in address-based carrier networks | |
Bryant et al. | Remote loop-free alternate (LFA) fast reroute (FRR) | |
US7872991B2 (en) | Methods and systems for providing MPLS-based layer-2 virtual private network services | |
EP3002913B1 (en) | Tunnel establishment method, label allocation method, device, and network system | |
US8619595B2 (en) | Fault isolation in trill networks | |
US9077561B2 (en) | OAM label switched path for fast reroute of protected label switched paths | |
EP2151959B1 (en) | Path calculation device for calculating and controlling paths in a network | |
EP2685685B1 (en) | Method and related apparatus for establishing link-diverse traffic paths in a telecommunications network | |
US20150043348A1 (en) | Traffic Flow Redirection between Border Routers using Routing Encapsulation | |
US20090245137A1 (en) | Highly available virtual stacking architecture | |
KR101658327B1 (ko) | 통신 경로 선택을 위한 방법 및 장치 | |
US20160020941A1 (en) | Reliable multipath forwarding for encapsulation protocols | |
CN107566265B (zh) | 一种对称转发模型下的evpn vxlan网关esi冗余接入方法 | |
WO2018058639A1 (zh) | 伪线负载分担的方法和设备 | |
CN102132524B (zh) | 用于建立业务连接及相关监控连接的方法 | |
US20090168663A1 (en) | Reducing Configuration of OAM Signalling Data | |
CN111885630B (zh) | 数据传输方法及通信装置 | |
Bryant et al. | RFC 7490: Remote loop-free alternate (LFA) fast reroute (FRR) | |
CN108462635A (zh) | 一种多宿网络中的通信网络路径和状态信息 | |
GALEȘ et al. | PROPOSED SCENARIOS OF THE LOAD BALANCING MECHANISM IN MULTIPROTOCOL LABEL SWITCHING NETWORKS | |
Khan et al. | Comparative Analysis of Trill: A Research Study |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |