CN113890850A - 路由容灾系统及方法 - Google Patents

路由容灾系统及方法 Download PDF

Info

Publication number
CN113890850A
CN113890850A CN202010621377.4A CN202010621377A CN113890850A CN 113890850 A CN113890850 A CN 113890850A CN 202010621377 A CN202010621377 A CN 202010621377A CN 113890850 A CN113890850 A CN 113890850A
Authority
CN
China
Prior art keywords
route
controller
routing
standby
global
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010621377.4A
Other languages
English (en)
Other versions
CN113890850B (zh
Inventor
李光伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN202010621377.4A priority Critical patent/CN113890850B/zh
Publication of CN113890850A publication Critical patent/CN113890850A/zh
Application granted granted Critical
Publication of CN113890850B publication Critical patent/CN113890850B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/22Alternate routing

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Hardware Redundancy (AREA)

Abstract

本发明实施例提供了一种路由容灾系统及方法,其中,路由容灾系统包括:主全局路由控制器、备全局路由控制器、区域路由控制器、和路由依附组件;其中,主全局路由控制器用于维护软件定义网络的全局路由信息,并对区域路由控制器的路由探测请求进行处理;备全局路由控制器为主全局路由控制器的备份控制器,主全局路由控制器与备全局路由控制器的路由权重的差距大于预设阈值;主全局路由控制器与备全局路由控制器均与相同的路由依附组件连接,路由依附组件用于存储软件定义网络的全局路由信息。通过本发明实施例,实现了有效且安全的路由容灾。

Description

路由容灾系统及方法
技术领域
本发明实施例涉及计算机技术领域,尤其涉及一种路由容灾系统及路由容灾方法。
背景技术
随着SDN(Software Defined Network,软件定义网络)的发展,越来越多的企业基于SDN架构构建其自身企业网,以实现快速的组网互通。
SDN可通过软件编程的形式定义和控制网络,其整体架构由下到上分为数据平面、控制平面和应用平面。其中,数据平面由交换机等网络通用硬件组成,各个网络设备之间通过不同规则形成的SDN数据通路连接;控制平面包含了逻辑上为中心的SDN控制器,它掌握着全局网络信息,负责各种转发规则的控制;应用平面包含着各种基于SDN的网络应用,用户无需关心底层细节就可以编程、部署新应用。
从本质上讲,基于SDN架构的企业网通常实现为一套集中加分布的路由控制器集群,包括有全局路由控制器和区域路由控制器。通过路由控制器集群,可以对任意区域的网络实例进行路由处理和传播,能够很好地帮助用户解决组网难、运维难等诸多问题。但是,随着客户量和路由数量的与日俱增,以及一些客户对高可用的硬需求等,当前SDN架构中全局路由控制器的单点故障风险日前突显,并且越来越成为制约其自身发展的瓶颈。
发明内容
有鉴于此,本发明实施例提供一种路由容灾方案,以至少部分解决上述问题。
根据本发明实施例的第一方面,提供了一种路由容灾系统,包括:主全局路由控制器、备全局路由控制器、区域路由控制器、和路由依附组件;其中,所述主全局路由控制器用于维护软件定义网络的全局路由信息,并对所述区域路由控制器的路由探测请求进行处理;所述备全局路由控制器为所述主全局路由控制器的备份控制器,所述主全局路由控制器与所述备全局路由控制器的路由权重的差距大于预设阈值;所述主全局路由控制器与所述备全局路由控制器均与相同的路由依附组件连接,所述路由依附组件用于存储所述软件定义网络的全局路由信息。
根据本发明实施例的第二方面,提供了一种路由容灾方法,包括:若确定主全局路由控制器发生异常,则自动切换至备全局路由控制器;通过备全局路由控制器接收区域路由控制器发送的路由探测请求,并根据与所述主全局路由控制器和所述备全局路由控制器均连接的路由依附组件中存储的软件定义网络的全局路由信息,对所述路由探测请求进行处理。
根据本发明实施例提供的路由容灾方案,在基于SDN架构的网络中,一方面,同时设置了主全局路由控制器和备全局路由控制器,当主全局路由控制器出现异常即可切换至备全局路由控制器提供服务,避免了只设置单个全局路由控制器时可能出现的单点故障问题;另一方面,主全局路由控制器和备全局路由控制器均与相同的路由依附组件连接,避免了路由依附组件可能导致的分布式锁或信息脑裂的情况;又一方面,因主全局路由控制器与备全局路由控制器的路由权重的差距大于预设阈值,保证了正常情况下都是由主全局路由控制器进行相应的路由处理。
综上,通过本发明实施例,实现了有效且安全的路由容灾。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明实施例中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1A为一种基于SDN架构的网络示意图;
图1B为根据本发明实施例一的一种路由容灾系统的结构示意图;
图2为根据本发明实施例二的一种路由容灾系统的结构示意图;
图3A为根据本发明实施例三的一种路由容灾方法的步骤流程图;
图3B为图3A所示实施例中的一种使用场景的示意图。
具体实施方式
为了使本领域的人员更好地理解本发明实施例中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明实施例一部分实施例,而不是全部的实施例。基于本发明实施例中的实施例,本领域普通技术人员所获得的所有其他实施例,都应当属于本发明实施例保护的范围。
SDN的架构由下到上分为数据平面、控制平面和应用平面,数据平面可包括一个或多个网络硬件设备,如交换机等;控制平面可包括一个或多个控制器,如路由控制器等;应用平面包括一个或多个应用程序,如云应用、商务应用等等。在基于SDN架构的系统中,一种路由控制器的部署如图1A所示,其在控制平面中设置有全局路由控制器和区域路由控制器,区域路由控制器为全局路由控制器的一种下级路由控制器。其中,全局路由控制器为汇聚和传播区域路由控制器的路由信息的核心控制器,区域路由控制器为不同区域的路由计算单元。区域路由控制器可控制并维护其所在区域的路由信息,而全局路由控制器可控制其下级路由控制器包括区域路由控制器,全局路由控制器维护SDN的全局路由信息。
如果区域路由控制器没有足够的路由信息来为传输的数据确定路由,则全局路由控制器可通过其所维护的全局路由信息来为传输的数据确定路由,并将相关的路由信息推送给区域路由控制器。例如,如果某个区域路由控制器所传输数据的目的地节点位于SDN的另一区域中,则该区域路由控制器会向全局路由控制器发送路由探测请求。全局路由控制器接收到该路由探测请求后,根据自身维护的全局路由信息来确定相应的路由信息,并将确定的路由信息发送给该区域路由控制器。进而,该区域路由控制器可根据该路由信息进行数据传输。
上述架构中,如图1A中所示,其全局路由控制器设置为一个,存在单点故障隐患。为此,本发明实施例提供了一种路由容灾方案,以解决该问题。
下面结合本发明实施例附图进一步说明本发明实施例具体实现。
实施例一
参照图1B,示出了根据本发明实施例一的一种路由容灾系统的结构示意图。
本实施例的路由容灾系统包括:主全局路由控制器102、备全局路由控制器104、区域路由控制器106、和路由依附组件108。
其中,主全局路由控制器102用于维护SDN的全局路由信息,并对区域路由控制器106的路由探测请求进行处理。备全局路由控制器104为主全局路由控制器102的备份控制器。主全局路由控制器102与备全局路由控制器104的路由权重的差距大于预设阈值。其中,所述预设阈值可由本领域技术人员根据实际需求适当设置,越大越好,以有效保证主全局路由控制器正常工作时,主要路由工作均由主全局路由控制器102处理为原则。在一种可行方式中,所述预设阈值可以为10000,通过悬殊的路由权重,以保证正常情况下都会使用主全局路由控制器102进行工作。
在一种可行方式中,主全局路由控制器102设置于第一负载均衡服务器集群中,备全局路由控制器104设置于第二负载均衡服务器集群中。其中,第一负载均衡服务器集群和第二负载均衡服务器集群可以设置于不同的地域,由此实现跨地域的路由容灾。但不限于此,第一负载均衡服务器集群和第二负载服务器集群也可以为设置于相同地域的不同集群,保证路由容灾的健壮性。
主全局路由控制器102与备全局路由控制器104均与相同的路由依附组件108连接,路由依附组件108用于存储SDN的全局路由信息。可选地,路由依附组件108还用于进行主全局路由控制器102和备全局路由控制器104的数据一致性处理。例如,路由依附组件108中可以设置有数据库组件,以通过其中的数据库存储SDN的全局路由信息。又例如,路由依附组件108中可以设置有一致性服务组件,如Zookeeper等,以保证主全局路由控制器中数据与备全局路由控制器中的数据的一致性。
其中,主全局路由控制器102与备全局路由控制器104均可以包括一个或多个,当包括多个时,相应地,多个主全局路由控制器102形成主全局路由控制器集群,多个备全局路由控制器104形成备全局路由控制器集群。需要说明的是,在本发明实施例中,若无特殊说明,“多个”,“多种”等与“多”有关的数量均意指两个及两个以上。
区域路由控制器106也可以包括一个或多个。一般情况下,由区域路由控制器106负责本区域内数据传输的路由,当数据传输的目的地路由位于另一区域时,当前区域路由控制器106会向全局路由控制器,本实施例中,在正常工作情况下,会向主全局路由控制器102发送路由探测请求,以请求主全局路由控制器102确定该次数据传输的路由。主全局路由控制器102在根据其自身维护的全局路由信息的基础上,响应该路由探测请求,将确定的路由信息发送给区域路由控制器106。区域路由控制器106在接收到主全局路由控制器102发送来的路由信息后,实现该次数据的跨区域传输。
但若主全局路由控制器102发生故障,若存在主全局路由控制器集群,则主全局路由控制器集群中的所有主全局路由控制器均发生故障,系统会自动切换至备全局路由控制器104,这时,区域路由控制器106的路由探测请求将发送至备全局路由控制器104,备全局路由控制器104中的路由数据与主全局路由控制器102中的路由数据一致,因此,备全局路由控制器104也会根据其自身维护的全局路由信息,响应该路由探测请求,将确定的路由信息发送给区域路由控制器106。区域路由控制器106在接收到备全局路由控制器104发送来的路由信息后,实现该次数据的跨区域传输。
可见,通过本实施例的路由容灾系统,在基于SDN架构的网络中,一方面,同时设置了主全局路由控制器和备全局路由控制器,当主全局路由控制器出现异常即可切换至备全局路由控制器提供服务,避免了只设置单个全局路由控制器时可能出现的单点故障问题;另一方面,主全局路由控制器和备全局路由控制器均与相同的路由依附组件连接,避免了路由依附组件可能导致的分布式锁或信息脑裂的情况;又一方面,因主全局路由控制器与备全局路由控制器的路由权重的差距大于预设阈值,保证了正常情况下都是由主全局路由控制器进行相应的路由处理。通过本实施例,实现了有效且安全的路由容灾。
实施例二
参照图2,示出了根据本发明实施例二的一种路由容灾系统的结构示意图。
本实施例的路由容灾系统包括:主全局路由控制器202、备全局路由控制器204、区域路由控制器206、和路由依附组件208。
本实施例中,主全局路由控制器202设置于第一负载均衡服务器集群中,主全局路由控制器202用于维护SDN的全局路由信息,并对区域路由控制器206的路由探测请求进行处理。备全局路由控制器204为主全局路由控制器202的备份控制器,设置于第二负载均衡服务器集群中;主全局路由控制器202与备全局路由控制器204的路由权重的差距大于预设阈值。主全局路由控制器202与备全局路由控制器204均与相同的路由依附组件208连接,路由依附组件208用于存储SDN的全局路由信息,并进行主全局路由控制器202和备全局路由控制器204的数据一致性处理。
如图2所示,本实施例中,设定第一负载均衡服务器集群设置于区域A,第二负载均衡服务器集群设置于区域B。由此,可实现跨区域的路由容灾。
主全局路由控制器202可以包括一个或多个,当包括多个时,可形成主全局路由控制器集群。多个主全局路由控制器202之间可以相互通信,进行路由信息同步,保持数据一致性。
备全局路由控制器204也可以包括一个或多个,当包括多个时,形成备全局路由控制器集群。多个备全局路由控制器204之间可以相互通信,进行路由信息同步,保持数据一致性。
并且,主全局路由控制器202和备全局路由控制器204之间也相互通信,进行路由信息同步,保持数据一致性。
主全局路由控制器202与备全局路由控制器204之间的路由权重的差距大于预设阈值,所述预设阈值可由本领域技术人员根据实际需求适当设置,可选地,可设置为主全局路由控制器202与备全局路由控制器204之间的路由权重比为10000:1;或者,设置为主全局路由控制器集群与备全局路由控制器集群之间的路由权重比为10000:1。由此,保证了正常情况下,路由处理被分配给主全局路由控制器202或主全局路由控制器集群。
当主全局路由控制器202,或者,当主全局路由控制器集群中的所有主全局路由控制器均发生异常,如网络异常、被恶意攻击等等,系统会自动切换至第二负载均衡服务器集群中的备全局路由控制器204,以保证主备全局路由控制器的无缝切换,保障路由任务可以被无中断的执行。
图2所示路由容灾系统中,全局路由控制器集群注册在负载均衡服务器集群中,如,主全局路由控制器集群注册在第一负载均衡服务集群中,备全局路由控制器集群注册在第二负载均衡服务集群中。负载均衡服务器集群中的负载均衡服务器可以通过配置权重来进行任务分流,并且可以对全局路由控制器进行健康检查,从而及时排除不健康的控制器。基于负载均衡服务器集群的能力,本发明实施例的路由容灾方案打破了负载均衡服务器集群默认一个分组的概念,分别创建两个分组,即第一负载均衡服务器集群和第二负载均衡服务器集群,并在其中分别设置主、备全局路由控制器集群,主、备全局路由控制器集群配置比较悬殊的路由权重比(如10000:1,可选地,该路由权重比可大于10000:1),保证正常情况下的路由任务始终通过主全局路由控制器集群处理,当主全局路由控制器集群下的控制器全部处于异常之后,才会自动切换到备全局路由控制器集群。
此外,如图2所示,主全局路由控制器202与备全局路由控制器204均与相同的路由依附组件208连接。本实施例中,对应于主全局路由控制器202与备全局路由控制器204的设置,路由依附组件208也包括主路由依附组件和备路由依附组件,其中,备路由依附组件是主路由依附组件的备份组件。主路由依附组件依附于主全局路由控制器202,也设置于第一负载均衡服务器集群中;备路由依附组件依附于备全局路由控制器204,也设置于第二负载均衡服务器集群中。当主全局路由控制器202发生异常并切换为备全局路由控制器204时,主路由依附组件也自动切换至备路由依附组件。
在传统方式中,路由依附组件都是分区域独立部署,依附于相应的路由控制器,不同的路由控制器连接其所在区域的路由依附组件。而本实施例中,如图2所示,采用了主全局路由控制器集群和备全局路由控制器集群同时连接同一套路由依附组件208,从而从根本上避免了传统方式可能出现的、例如分布式锁或者路由数据信息脑裂的产生。
但是,在主、备路由依附组件设置在不同的负载均衡服务器集群中或设置在不同的区域中的情况下,主、备路由依附组件的访问延迟可能不一致。本发明实施例中,通过设置主、备全局路由控制器集群的悬殊的路由权重可解决该问题。基于负载均衡服务器集群的作用,悬殊的路由权重比可保证正常情况下的路由任务都会由主全局路由控制器集群处理,当主全局路由控制器集群中的所有全局路由控制器都失效后,备全局路由控制器集群会自动生效,相应地,主路由依附组件就会自动切换为备路由依附组件,这样就保证了在主备全局路由控制器集群切换的同时,因路由依附组件产生的访问延迟大小也会一致切换。
但本领域技术人员应当明了的是,既使未发生主、备全局路由控制器的切换,但若主路由依附组件发生故障,同样可以进行主备路由依附组件的切换,以保证路由依附组件的可用性。
在一种可行方式中,路由依附组件208可以包括:数据库组件和一致性服务组件;其中,数据库组件可以用于存储SDN的全局路由信息和区域路由控制器的区域路由信息;一致性服务组件可以用于进行主全局路由控制器和备全局路由控制器的数据一致性处理。例如,数据库组件可以实现为任意适当形式的数据库database,以存储汇聚的各区域路由控制器的路由信息;一致性服务组件可以实现为任意适当的可进行数据一致性操作的组件,如zookeeper等,以用于整个全局路由控制器集群的数据一致性操作,如分布式同步、分组服务等。通过数据库组件和一致性服务组件为全局路由控制器执行路由任务提供的数据保障。
主全局路由控制器202和备全局路由控制器204的数据一致性的一个重要方面是两者的数据库中的数据的一致性。在一种可行方式中,该一致性可通过DTS(DataTransmission Service,数据传输服务)实现,即,主路由依附组件和备路由依附组件之间,通过DTS进行数据库组件的数据库实时同步,以保证路由信息的一致。
此外,主路由依附组件自动切换至备路由依附组件后,备路由依附组件还可以从区域路由控制器206获取预设时间段内的路由信息,并对备路由依附组件中存储的全局路由信息和区域路由信息进行更新。其中,所述预设时间段可由本领域技术人员根据实际情况适当设置,例如,可设置为距离当前时间十分钟之前等,本发明实施例对此不作限制。
由上可见,主、备路由依附组件间,通过DTS进行数据库组件中的数据库实时同步,以保证因数据库故障导致的主备路由依附组件切换之后路由信息的获取,或者,保证因全局路由控制器故障导致的主备路由依附组件切换之后路由信息的获取。此外,也可能存在各区域路由控制器的路由信息和全局路由控制器的路由信息不一致的情况,为此,本发明实施例中采用了路由重推机制,当数据库成功切换后,会对近若干分钟内各区域路由控制器的路由变化进行统计,并自动进行路由重推,即前述备路由依附组件从区域路由控制器获取预设时间段内的路由信息,并对备路由依附组件中存储的全局路由信息和区域路由信息进行更新,以此来保证整体数据的一致性,同时可以基于用户的优先级进行排序。
此外,为了进一步提高全部路由控制器的可靠性,还可以设置巡检组件,以对所有路由控制器,包括主、备全局路由控制器、区域路由控制器等的路由信息周期性地进行一致性检查,并在发现不一致后进行及时告警和干预等。
通过上述设置,有效实现了跨集群或跨区域的路由容灾,保证了SDN的正常运行。
进一步可选地,还可以设置监控设备集群,如图2中所示,以对全局路由控制器进行监控。其中,监控设备集群中的监控设备用于:为发生异常的主全局路由控制器、或者备全局路由控制器、或者主路由依附组件、或者备路由依附组件确定切换等级,根据确定的切换等级进行相应的主备切换。因不同原因导致的主备切换对应有不同的切换等级,例如,若因维护升级等,导致主路由依附组件发生异常,因其可在可预期的时间内恢复,因此,可以为其设置较低的切换等级。若在预期时间内恢复则不进行切换,若超过预期时间则需要进行切换。又例如,若因某个数据库组件中的数据库发生异常,因数据库中通常存储有大量的路由信息,使得主备路由依附组件的切换对系统的影响较大,因此,也可以设置稍低一些的切换等级,等待一定时长如2-3分钟后再确定是否进行切换,若数据库恢复则无需进行切换,否则进行切换。而若主全局路由控制器发生异常,因其承担着主要的路由任务处理,则需设置较高的切换等级,尽快实现切换。本领域技术人员应当明了的是,上述切换等级的设置仅为示例性说明,在实际应用中,本领域技术人员可以根据实际需求适当设置,本发明实施例对此不作限制。通过确定切换等级,可以根据实际情况进行相应的切换或等待操作,避免乒乓效应,保证路由容灾系统的正常运行。
除此之外,监控设备还可以用于:对主全局路由控制器、备全局路由控制器、主路由依附组件、和备路由依附组件进行可用性监控和异常监控,以有效保证这些系统的正常运行和异常发现及处理。
在图2所示的路由容灾系统中,监控设备采用集群部署,集群中各监控设备均具备如下能力:(1)监控:包括对负载均衡服务器集群、路由依附组件如Zookeeper、database等的可用性,以及全局路由控制器自身服务能力的监控。并且,可以识别全局路由控制器集群的主备角色,以及路由依附组件的主备角色,并分别对主备全局路由控制器集群以及主备路由依附组件进行周期性检查、分析故障类型、汇总并上报等。(2)裁决:集群之间会对监控的故障类别进行仲裁,生成故障告警和切换等级。(3)执行:根据不同的切换等级,生成切换任务并执行相应的切换操作。(4)告警:切换前后,自动上报切换信息和告警信息,以保证人工及时介入,确认切换行为是否符合预期等。
根据本实施例,在基于SDN架构的网络中,一方面,同时设置了主全局路由控制器和备全局路由控制器,当主全局路由控制器出现异常即可切换至备全局路由控制器提供服务,避免了只设置单个全局路由控制器时可能出现的单点故障问题;另一方面,主全局路由控制器和备全局路由控制器设置在不同的负载均衡服务器集群中,实现了跨集群的路由容灾备份,提升了容灾备份效果;再一方面,主全局路由控制器和备全局路由控制器均与相同的路由依附组件连接,避免了路由依附组件可能导致的分布式锁或信息脑裂的情况;又一方面,因主全局路由控制器与备全局路由控制器的路由权重的差距大于预设阈值,保证了正常情况下都是由主全局路由控制器进行相应的路由处理。综上,通过本实施例,实现了有效且安全的路由容灾。
并且,利用了数据库实时同步机制和路由重推机制,保证了切换后数据的一致性。同时,无需对当前的路由传播协议和机制进行改造,避免了类似数据重建方式时,因路由信息数据量大而无法快速恢复路由,或者在采用BGP(边界网关协议)携带路由信息不足等问题。实现了可靠、易用的、可满足异地容灾需求的容灾方案,满足客户对路由高可用的硬需求。
实施例三
参照图3A,示出了根据本发明实施例三的一种路由容灾方法的步骤流程图。
本实施例基于前述实施例一或二中的路由容灾系统,基于该系统实现的路由容灾方法包括以下步骤:
步骤S302:若确定主全局路由控制器发生异常,则自动切换至备全局路由控制器。
在一种可行方式中,主全局路由控制器可以设置于第一负载均衡服务器集群中,备全局路由控制器可以设置于第二负载均衡服务器集群中,由此可实现跨集群的路由容灾。当第一负载均衡服务器集群和第二负载均衡服务器集群设置于不同地域中时,可实现跨地域的路由容灾。但不限于此,主全局路由控制器和备全局路由控制器也可以设置于一个负载均衡服务器集群中。
当主全局路由控制器发生异常时,系统会自动切换至第二负载均衡服务器集群中的备全局路由控制器,以保证全局路由处理的正常进行。
在一种可行方式中,在确定主全局路由控制器发生异常之前,还可以根据预设的路由权重,确定设置于第一负载均衡服务器集群中的全局路由控制器为主全局路由控制器;其中,设置于第一负载均衡服务器集群中的全局路由控制器的路由权重,与设置于第二负载均衡服务器集群中的全局路由控制器的路由权重的差距大于预设阈值。其中,所述预设阈值可由本领域技术人员根据实际需求适当设置,以较大差距为优,例如,将主全局路由控制器和备全局路由控制器的路由权重比设置为至少10000:1等,以保证正常情况下,全局路由处理任务由主全局路由控制器完成。
步骤S304:通过备全局路由控制器接收区域路由控制器发送的路由探测请求,并根据与主全局路由控制器和备全局路由控制器均连接的路由依附组件中存储的SDN的全局路由信息,对路由探测请求进行处理。
本实施例中,主全局路由控制器和备全局路由控制器连接相同的路由依附组件,以避免分布式锁或路由信息脑裂的情况。
为了保证路由依附组件的高可用性,路由依附组件包括主路由依附组件和备路由依附组件,其中,备路由依附组件是主路由依附组件的备份组件。基于此,本实施例的路由容灾方法还可以包括:确定主路由依附组件发生异常,将主全局路由控制器和备全局路由控制器均自动切换连接至备路由依附组件;或者,确定主全局路由控制器切换为备全局路由控制器后,将主路由依附组件自动切换至备路由依附组件。由上可见,一种方式中,主路由依附组件出现异常,则自动切换至备路由依附组件,以保证相关数据和服务的有效提供;另一种方式中,主全局路由控制器出现异常,使得切换为备全局路由控制器,主备路由依附组件随之切换,以保持访问延迟的一致。
其中,路由依附组件可以包括:数据库组件(如各种数据库)和一致性服务组件(如Zookeeper等);其中,数据库组件,用于存储SDN的全局路由信息,和区域路由控制器的区域路由信息;一致性服务组件,用于进行主全局路由控制器和备全局路由控制器的数据一致性处理。
在主备路由依附组件之间,可通过DTS进行数据库组件的数据库实时同步,以保证数据库中的路由信息的一致性。
进一步可选地,还可以采用路由重推机制进一步保证主全局路由控制器和备全局路由控制器之间的数据一致性,即,在将主全局路由控制器和备全局路由控制器均自动切换连接至备路由依附组件之后,还可以通过备路由依附组件从区域路由控制器获取预设时间段内的路由信息,并对备路由依附组件中存储的全局路由信息和区域路由信息进行更新。其中,预设时间段可由本领域技术人员根据实际需求适当设置,本发明实施例对此不作限制。
需要说明的是,上述过程描述比较简单,相关部分可参见前述实施例一或二中的相关内容。
以下,以一个场景示例对上述过程进行示例性说明,如图3B所示。图3B中,负载均衡服务器集群通过全局路由控制器A和B的路由权重比10000:1,确定控制器A为主全局路由控制器,确定控制器B为备全局路由控制器。
正常情况下,若区域路由控制器X向主全局路由控制器A发送了一个路由探测请求,则主全局路由控制器A会从其路由依附组件A1中获取相应的路由信息,以响应该路由探测请求,并通过响应消息回复给区域路由控制器X,该过程如图3B中实心箭头所示。
若主全局路由控制器A发生了异常,路由容灾系统会从主全局路由控制器A切换至备全局路由控制器B,并且,主路由依附组件A1也将切换为备路由依附组件B1。此时,若区域路由控制器X仍需进行路由探测,则会向备全局路由控制器集群B发送路由探测请求,则备全局路由控制器B会从其路由依附组件B1中获取相应的路由信息,以响应该路由探测请求,并回复给区域路由控制器X,该过程如图3B中空心箭头所示。
通过本实施例,使用主全局路由控制器和备全局路由控制器,当主全局路由控制器出现异常即可切换至备全局路由控制器提供服务,避免了只设置单个全局路由控制器时可能出现的单点故障问题;此外,主全局路由控制器和备全局路由控制器均与相同的路由依附组件连接,避免了路由依附组件可能导致的分布式锁或信息脑裂的情况;再者,因主全局路由控制器与备全局路由控制器的路由权重的差距大于预设阈值,保证了正常情况下都是由主全局路由控制器进行相应的路由处理。综上,通过本实施例,实现了有效且安全的路由容灾。
此外,若主全局路由控制器和备全局路由控制器设置在不同的负载均衡服务器集群中,还可实现跨集群的路由容灾备份,提升容灾备份效果.
需要指出,根据实施的需要,可将本发明实施例中描述的各个部件/步骤拆分为更多部件/步骤,也可将两个或多个部件/步骤或者部件/步骤的部分操作组合成新的部件/步骤,以实现本发明实施例的目的。
上述根据本发明实施例的方法可在硬件、固件中实现,或者被实现为可存储在记录介质(诸如CD ROM、RAM、软盘、硬盘或磁光盘)中的软件或计算机代码,或者被实现通过网络下载的原始存储在远程记录介质或非暂时机器可读介质中并将被存储在本地记录介质中的计算机代码,从而在此描述的方法可被存储在使用通用计算机、专用处理器或者可编程或专用硬件(诸如ASIC或FPGA)的记录介质上的这样的软件处理。可以理解,计算机、处理器、微处理器控制器或可编程硬件包括可存储或接收软件或计算机代码的存储组件(例如,RAM、ROM、闪存等),当所述软件或计算机代码被计算机、处理器或硬件访问且执行时,实现在此描述的路由容灾方法。此外,当通用计算机访问用于实现在此示出的路由容灾方法的代码时,代码的执行将通用计算机转换为用于执行在此示出的路由容灾方法的专用计算机。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及方法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明实施例的范围。
以上实施方式仅用于说明本发明实施例,而并非对本发明实施例的限制,有关技术领域的普通技术人员,在不脱离本发明实施例的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明实施例的范畴,本发明实施例的专利保护范围应由权利要求限定。

Claims (15)

1.一种路由容灾系统,包括:主全局路由控制器、备全局路由控制器、区域路由控制器、和路由依附组件;
其中,
所述主全局路由控制器用于维护软件定义网络的全局路由信息,并对所述区域路由控制器的路由探测请求进行处理;
所述备全局路由控制器为所述主全局路由控制器的备份控制器,所述主全局路由控制器与所述备全局路由控制器的路由权重的差距大于预设阈值;
所述主全局路由控制器与所述备全局路由控制器均与相同的路由依附组件连接,所述路由依附组件用于存储所述软件定义网络的全局路由信息。
2.根据权利要求1所述的系统,其中,所述主全局路由控制器设置于第一负载均衡服务器集群中;所述备全局路由控制器设置于第二负载均衡服务器集群中;所述路由依附组件还用于进行所述主全局路由控制器和所述备全局路由控制器的数据一致性处理。
3.根据权利要求2所述的系统,其中,所述主全局路由控制器包括至少一个;
若所述第一负载均衡服务器集群中的全部主全局路由控制器发生异常,则自动切换至所述第二负载均衡服务器集群中的备全局路由控制器。
4.根据权利要求2所述的系统,其中,所述路由依附组件包括:数据库组件和一致性服务组件;
其中,
所述数据库组件,用于存储所述软件定义网络的全局路由信息,和区域路由控制器的区域路由信息;
所述一致性服务组件,用于进行所述主全局路由控制器和所述备全局路由控制器的数据一致性处理。
5.根据权利要求4所述的系统,其中,所述路由依附组件包括主路由依附组件和备路由依附组件,其中,所述备路由依附组件是所述主路由依附组件的备份组件;所述主路由依附组件依附于所述主全局路由控制器,设置于所述第一负载均衡服务器集群中;所述备路由依附组件依附于所述备全局路由控制器,设置于所述第二负载均衡服务器集群中;
当所述主全局路由控制器发生异常并切换为所述备全局路由控制器时,所述主路由依附组件自动切换至所述备路由依附组件。
6.根据权利要求5所述的系统,其中,所述主路由依附组件和所述备路由依附组件之间,通过数据传输服务进行数据库组件的数据库实时同步。
7.根据权利要求5所述的系统,其中,所述主路由依附组件自动切换至所述备路由依附组件后,所述备路由依附组件从区域路由控制器获取预设时间段内的路由信息,并对所述备路由依附组件中存储的全局路由信息和区域路由信息进行更新。
8.根据权利要求5所述的系统,其中,所述系统还包括:监控设备集群;
所述监控设备集群中的监控设备用于:为发生异常的主全局路由控制器、或者备全局路由控制器、或者主路由依附组件、或者备路由依附组件确定切换等级,根据确定的切换等级进行相应的主备切换。
9.根据权利要求8所述的系统,其中,所述监控设备还用于:对主全局路由控制器、备全局路由控制器、主路由依附组件、和备路由依附组件进行可用性监控和异常监控。
10.一种路由容灾方法,包括:
若确定主全局路由控制器发生异常,则自动切换至备全局路由控制器;
通过备全局路由控制器接收区域路由控制器发送的路由探测请求,并根据与所述主全局路由控制器和所述备全局路由控制器均连接的路由依附组件中存储的软件定义网络的全局路由信息,对所述路由探测请求进行处理。
11.根据权利要求10所述的方法,其中,在确定主全局路由控制器发生异常之前,所述方法还包括:
根据预设的路由权重,确定设置于第一负载均衡服务器集群中的全局路由控制器为主全局路由控制器;
其中,设置于所述第一负载均衡服务器集群中的全局路由控制器的路由权重,与设置于所述第二负载均衡服务器集群中的全局路由控制器的路由权重的差距大于预设阈值。
12.根据权利要求10所述的方法,其中,所述路由依附组件包括主路由依附组件和备路由依附组件,其中,所述备路由依附组件是所述主路由依附组件的备份组件;
所述方法还包括:
确定所述主路由依附组件发生异常,将所述主全局路由控制器和所述备全局路由控制器均自动切换连接至所述备路由依附组件;
或者,
确定所述主全局路由控制器切换为所述备全局路由控制器后,将所述主路由依附组件自动切换至所述备路由依附组件。
13.根据权利要求12所述的方法,其中,所述路由依附组件包括:数据库组件和一致性服务组件;
其中,
所述数据库组件,用于存储所述软件定义网络的全局路由信息,和区域路由控制器的区域路由信息;
所述一致性服务组件,用于进行所述主全局路由控制器和所述备全局路由控制器的数据一致性处理。
14.根据权利要求13所述的方法,其中,所述方法还包括:
通过数据传输服务,在所述主路由依附组件和所述备路由依附组件之间进行数据库组件的数据库实时同步。
15.根据权利要求12所述的方法,其中,在将所述主全局路由控制器和所述备全局路由控制器均自动切换连接至所述备路由依附组件之后,所述方法还包括:
通过所述备路由依附组件从区域路由控制器获取预设时间段内的路由信息,并对所述备路由依附组件中存储的全局路由信息和区域路由信息进行更新。
CN202010621377.4A 2020-07-01 2020-07-01 路由容灾系统及方法 Active CN113890850B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010621377.4A CN113890850B (zh) 2020-07-01 2020-07-01 路由容灾系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010621377.4A CN113890850B (zh) 2020-07-01 2020-07-01 路由容灾系统及方法

Publications (2)

Publication Number Publication Date
CN113890850A true CN113890850A (zh) 2022-01-04
CN113890850B CN113890850B (zh) 2023-06-06

Family

ID=79012694

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010621377.4A Active CN113890850B (zh) 2020-07-01 2020-07-01 路由容灾系统及方法

Country Status (1)

Country Link
CN (1) CN113890850B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115086150A (zh) * 2022-05-31 2022-09-20 阿里巴巴(中国)有限公司 容灾控制系统

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102724323A (zh) * 2012-07-02 2012-10-10 鞠洪尧 一种基于多级容灾的高效物联网架构
WO2014179920A1 (zh) * 2013-05-06 2014-11-13 华为技术有限公司 基于sdn的网络配置方法、装置及系统
CN104429028A (zh) * 2013-05-06 2015-03-18 华为技术有限公司 基于sdn的网络配置方法、装置及系统
CN104702512A (zh) * 2013-12-06 2015-06-10 智梵网络科技有限公司 软件定义网络(sdn)中的分层控制
CN105471954A (zh) * 2014-09-11 2016-04-06 北京智梵网络科技有限公司 基于sdn网络的分布式控制系统与用户流量优化方法
US20170005870A1 (en) * 2015-07-02 2017-01-05 Vencore Labs, Inc. Configuration agreement protocol method
CN107404394A (zh) * 2016-05-20 2017-11-28 中兴通讯股份有限公司 一种iptv系统容灾方法及iptv容灾系统
CN107682410A (zh) * 2017-09-14 2018-02-09 广州西麦科技股份有限公司 一种分布式sdn控制器集群的控制方法及装置
CN107682411A (zh) * 2017-09-14 2018-02-09 广州西麦科技股份有限公司 一种大规模sdn控制器集群及网络系统
CN108270669A (zh) * 2016-12-30 2018-07-10 中兴通讯股份有限公司 Sdn网络的业务恢复装置、主控制器、系统及方法
CN108667868A (zh) * 2017-03-30 2018-10-16 杭州达乎科技有限公司 一种用于广域网长距离通信的sdn网络控制平面的部署架构
WO2019006708A1 (zh) * 2017-07-05 2019-01-10 全球能源互联网研究院有限公司 基于双端口交换机的sdn多域网络备份方法及系统
US20200167342A1 (en) * 2018-11-26 2020-05-28 Korea Advanced Institute Of Science And Technology System for Secure Software Defined Networking Based on Block-Chain and Method Thereof

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102724323A (zh) * 2012-07-02 2012-10-10 鞠洪尧 一种基于多级容灾的高效物联网架构
WO2014179920A1 (zh) * 2013-05-06 2014-11-13 华为技术有限公司 基于sdn的网络配置方法、装置及系统
CN104429028A (zh) * 2013-05-06 2015-03-18 华为技术有限公司 基于sdn的网络配置方法、装置及系统
CN104702512A (zh) * 2013-12-06 2015-06-10 智梵网络科技有限公司 软件定义网络(sdn)中的分层控制
CN105471954A (zh) * 2014-09-11 2016-04-06 北京智梵网络科技有限公司 基于sdn网络的分布式控制系统与用户流量优化方法
US20170005870A1 (en) * 2015-07-02 2017-01-05 Vencore Labs, Inc. Configuration agreement protocol method
CN107404394A (zh) * 2016-05-20 2017-11-28 中兴通讯股份有限公司 一种iptv系统容灾方法及iptv容灾系统
CN108270669A (zh) * 2016-12-30 2018-07-10 中兴通讯股份有限公司 Sdn网络的业务恢复装置、主控制器、系统及方法
CN108667868A (zh) * 2017-03-30 2018-10-16 杭州达乎科技有限公司 一种用于广域网长距离通信的sdn网络控制平面的部署架构
WO2019006708A1 (zh) * 2017-07-05 2019-01-10 全球能源互联网研究院有限公司 基于双端口交换机的sdn多域网络备份方法及系统
CN107682410A (zh) * 2017-09-14 2018-02-09 广州西麦科技股份有限公司 一种分布式sdn控制器集群的控制方法及装置
CN107682411A (zh) * 2017-09-14 2018-02-09 广州西麦科技股份有限公司 一种大规模sdn控制器集群及网络系统
US20200167342A1 (en) * 2018-11-26 2020-05-28 Korea Advanced Institute Of Science And Technology System for Secure Software Defined Networking Based on Block-Chain and Method Thereof

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ANDRES J. GONZALEZ; GIANFRANCO NENCIONI; BJARNE E. HELVIK; ANDRZEJ KAMISINSKI: "A Fault-Tolerant and Consistent SDN Controller", 《2016 IEEE GLOBAL COMMUNICATIONS CONFERENCE (GLOBECOM)》 *
向波;俞黎阳;: "SDN多控制器容错机制的研究与设计", 计算机工程与应用, no. 23 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115086150A (zh) * 2022-05-31 2022-09-20 阿里巴巴(中国)有限公司 容灾控制系统
CN115086150B (zh) * 2022-05-31 2023-12-29 阿里巴巴(中国)有限公司 容灾控制系统

Also Published As

Publication number Publication date
CN113890850B (zh) 2023-06-06

Similar Documents

Publication Publication Date Title
CN108270669B (zh) Sdn网络的业务恢复装置、主控制器、系统及方法
CN110209492B (zh) 一种数据处理方法及装置
CN107465721B (zh) 基于双活架构的全局负载均衡方法和系统及调度服务器
US8775589B2 (en) Distributed network management system and method
JP2004021549A (ja) ネットワーク監視システムおよびプログラム
CN105915405A (zh) 一种大型集群节点性能监控系统
CN103581276A (zh) 集群管理装置、系统、业务客户端及相应方法
CN107276839B (zh) 一种云平台的自监控方法和系统
CN110333986B (zh) 一种保障redis集群可用性的方法
US20120331084A1 (en) Method and System for Operation of Memory System Having Multiple Storage Devices
CN104486155A (zh) 一种数据库集群监控的方法及系统
CN113268351A (zh) 一种网关服务的负载均衡方法及装置
CN109039795A (zh) 一种云服务器资源监控方法和系统
CN111988347B (zh) 跳板机系统的数据处理方法和跳板机系统
CN111314443A (zh) 基于分布式存储系统的节点处理方法、装置和设备及介质
CN113890850B (zh) 路由容灾系统及方法
JP2008060971A (ja) 情報処理システム、情報処理装置、情報処理方法およびプログラム
JP2006195554A (ja) 統合監視システム
JP4464256B2 (ja) ネットワーク上位監視装置
EP2883414B1 (en) Self organizing network event reporting
CN111092754B (zh) 实时接入服务系统及其实现方法
CN117061357A (zh) 一种基于虚拟专用网络的网络拓扑管理方法和系统
JP4673532B2 (ja) マルチマネージャ環境における包括アライメントプロセス
CN110545197B (zh) 节点状态监控方法及装置
CN102185720A (zh) 一种北向通知管理接口装置及其管理方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40066033

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant