CN111817954B - 路由反射模式的切换方法及网络架构系统 - Google Patents

路由反射模式的切换方法及网络架构系统 Download PDF

Info

Publication number
CN111817954B
CN111817954B CN202010568094.8A CN202010568094A CN111817954B CN 111817954 B CN111817954 B CN 111817954B CN 202010568094 A CN202010568094 A CN 202010568094A CN 111817954 B CN111817954 B CN 111817954B
Authority
CN
China
Prior art keywords
switch
route
node
cluster
bgp
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010568094.8A
Other languages
English (en)
Other versions
CN111817954A (zh
Inventor
赵贝
刘云冲
矫恒浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Juhaokan Technology Co Ltd
Original Assignee
Juhaokan Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Juhaokan Technology Co Ltd filed Critical Juhaokan Technology Co Ltd
Priority to CN202010568094.8A priority Critical patent/CN111817954B/zh
Publication of CN111817954A publication Critical patent/CN111817954A/zh
Application granted granted Critical
Publication of CN111817954B publication Critical patent/CN111817954B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/02Topology update or discovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/22Alternate routing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/24Multipath
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/28Routing or path finding of packets in data switching networks using route fault recovery

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本申请涉及通信技术领域,尤其涉及一种路由反射模式的切换方法及网络架构系统。一定程度上可以解决容器云环境下切换路由反射模式带来的RR容器稳定下差、节点维护复杂的问题。所述网络架构系统包括:包含第一交换机、第二交换机的BGP对等体,所述BGP对等体用作路由反射器;第一机房集群各个节点至所述BGP对等体的交叉连接,所述交叉连接包含第一节点至第一交换机的默认路由,所述默认路由用于从所述第一交换机学习第一节点至第二节点的路由信息;第一机房交换机至第二机房交换机的路由;其中,所述第一节点被配置为所述第一交换机、第二交换机的路由反射客户端。

Description

路由反射模式的切换方法及网络架构系统
技术领域
本申请涉及通信技术领域,尤其涉及一种路由反射模式的切换方法及网络架构系统。
背景技术
云计算是一种计算模式,它将计算任务分布在大量计算机构成的资源池,使各种业务系统能够根据不同需要获取计算力、存储空间和信息服务。容器云环境下calico默认使用全节点互联模式(node-to-node mesh),所有节点通过建立BGP(Border GatewayProtocol:边界网关协议)连接进行互联,每个节点需要维护(n-1)个BGP连接,随着集群规模不断增加,节点维护的BGP连接数相应增加,如果某节点的BGP连接中断,就会出现跨节点访问不通的情况,因此集群需要在规模达到一定程度后改用RR(Route Reflector:路由反射)模式建立BGP连接。
在一些容器云环境下切换路由反射模式的实现中,通常在集群外搭建RR容器,然后集群内节点与集群外RR容器建立BGP连接,从而实现RR模式。
然而,在集群外搭建RR容器,需要增加关注RR容器健康状态的工作量,集群内监控告警机制不能兼顾到集群外的RR容器、RR容器在低稳定性低的情况下会影响整个集群的访问,并且集群服务需要做改动,节点之间仍存在大量的BGP连接需要进行维护。
发明内容
为了解决容器云环境下切换路由反射模式带来的RR容器稳定下差、节点维护复杂的问题,本申请提供了一种路由反射模式的切换方法及网络架构系统。
本申请的实施例是这样实现的:
本申请实施例第一方面提供一种网络架构系统,配置为在容器云环境下实现切换路由反射模式,包括:
包含第一交换机、第二交换机的BGP对等体,所述BGP对等体用作路由反射器;
第一机房集群各个节点至所述BGP对等体的交叉连接,所述交叉连接包含第一节点至第一交换机的默认路由,所述默认路由用于从所述第一交换机学习第一节点至第二节点的路由信息;
第一机房交换机至第二机房交换机的路由;
其中,所述第一节点被配置为所述第一交换机、第二交换机的路由反射客户端。
根据本申请中一些实施例的网络架构系统,其中,所述BGP对等体包含的交换机之间可同步路由信息。
根据本申请中一些实施例的网络架构系统,其中,还包括第一过滤器,所述第一过滤器配置于所述第一节点,用于滤除第一节点发送至第一交换机的默认路由。
根据本申请中一些实施例的网络架构系统,其中,还包括:第一交换机、第二交换机至第一节点的第二路由,用于交换机重新建立BGP连接时发送数据至第一节点。
根据本申请中一些实施例的网络架构系统,其中,所述第二路由被配置为静态路由。
根据本申请中一些实施例的网络架构系统,其中,在切换路由反射模式后,删除所述第二路由。
根据本申请中一些实施例的网络架构系统,其中,在所述第二节点位于第一机房集群内时,所述路由信息包括第一节点至第二节点的路由;在所述第二节点位于第二机房集群内时,所述路由信息包括默认路由、第一机房交换机至第二机房交换机的路由。
根据本申请中一些实施例的网络架构系统,其中,所述第一交换机为第一机房的网关;在所述第一交换机故障时,所述网关自动切换至第二交换机。
本申请实施例第二方面提供一种路由反射模式的切换方法,配置为在容器云环境下实现切换路由反射模式,所述方法包括:
添加第一机房集群第一节点至BGP对等体中第一交换机的默认路由,所述默认路由用于从所述第一交换机学习第一节点至第二节点的路由信息,所述BGP对等体还包括第二交换机;
将所述第一节点配置为所述第一交换机、第二交换机的路由反射客户端;
禁用集群的全节点互联模式,得到集群的路由反射模式。
根据本申请中一些实施例中路由反射模式的切换方法,其中,所述BGP对等体包含的交换机之间可同步路由信息。
根据本申请中一些实施例中路由反射模式的切换方法,其中,所述第一节点配置了第一过滤器,所述第一过滤器用于滤除第一节点发送至第一交换机的默认路由。
根据本申请中一些实施例中路由反射模式的切换方法,其中,将所述第一节点配置为所述第一交换机、第二交换机的路由反射客户端之前,还包括:添加第一交换机、第二交换机至第一节点的第二路由,所述第二路由用于交换机重新建立BGP连接时发送数据至第一节点。
根据本申请中一些实施例中路由反射模式的切换方法,其中,所述第二路由被配置为静态路由。
根据本申请中一些实施例中路由反射模式的切换方法,其中,得到集群的路由反射模式后,删除所述第二路由。
根据本申请中一些实施例中路由反射模式的切换方法,其中,在所述第二节点位于第一机房集群内时,所述路由信息包括第一节点至第二节点的路由;在所述第二节点位于第二机房集群内时,所述路由信息包括默认路由、第一机房交换机至第二机房交换机的路由。
根据本申请中一些实施例中路由反射模式的切换方法,其中,所述第一交换机为第一机房的网关;在所述第一交换机故障时,所述网关自动切换至第二交换机。
本申请实施例第三方面提供一种回滚方法,配置为在容器云环境下实现全节点互联模式的回滚,所述方法包括:
开启全节点互联模式,集群所有节点两两之间重新建立BGP连接,并同步路由信息;
移除第一交换机、第二交换机的路由反射客户端;
移除第一机房集群节点至BGP对等体中第一交换机的默认路由。
本申请实施例第四方面提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,当所述计算机指令中的至少部分指令被处理器执行时,实现如本申请实施例第二方面提供发明内容的方法。
本申请提供的技术方案包括以下有益效果:通过构建第一交换机、第二交换机作为路由反射器,可以提高RR模式中路由反射器的稳定性;进一步通过构建默认路由,可以实现集群节点从交换机学习至其它节点的路由信息;进一步通过同步第一交换机和第二交换机的路由信息,可以实现机房网关故障时备用网关的自动切换;进一步通过构建第一过滤器,可以避免集群节点无效学习默认路由;进一步通过构建第二路由,可以实现配置路由反射客户端瞬间交换机仍可有效转发数据至集群节点,可以简化、降低集群节点BGP连接的维护数量、仅维护集群节点至交换机的BGP连接、避免集群节点之间的BGP连接维护、实现容器云生产环境下不中断业务无缝切换RR模式。
附图说明
为了更清楚地说明本申请的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种服务系统的结构示意图;
图2示出了本申请一实施例在容器云环境下实现切换路由反射模式的网络架构系统;
图3示出了本申请另一实施例在容器云环境下实现切换路由反射模式的网络架构系统;
图4示出了本申请实施例交换机高可用设计示意图;
图5示出了本申请实施例一种路由反射模式切换方法的流程示意图;
图6示出了本申请实施例一种网络构架中切换路由反射模式的时序图;
图7示出了本申请实施例一种回滚方法的流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本说明书通篇提及的“多个实施例”、“一些实施例”、“一个实施例”或“实施例”等,意味着结合该实施例描述的具体特征、结构或特性包括在至少一个实施例中。因此,本说明书通篇出现的短语“在多个实施例中”、“在一些实施例中”、“在至少另一个实施例中”或“在实施例中”等并不一定都指相同的实施例。此外,在一个或多个实施例中,具体特征、结构或特性可以任何合适的方式进行组合。因此,在无限制的情形下,结合一个实施例示出或描述的具体特征、结构或特性可全部或部分地与一个或多个其他实施例的特征、结构或特性进行组合。这种修改和变型旨在包括在本申请的范围之内。
图1是本申请实施例提供的一种服务系统的结构示意图。
如图1所示,该服务系统10可以由多个设备A组成,该多个设备A之间可以通过网络进行通信。本申请实施例中所述的设备A可以为服务器或者服务器集群。该服务系统10可以为一个云服务系统,云服务系统指将企业或个人所需的软硬件和资料均上传至网络,在任何时间或地点均可以使用接入网络的设备实现数据存取和运算的服务系统。
服务系统10根据其中的各个设备A所在的地理位置可以划分为多个区域101,每个区域101包括位于一个地理区域中的多个设备A,不同区域101中的设备A位于不同的地理区域。示例地,亚洲地区的设备A可以组成一个区域101,非洲地区的设备A可以组成另一个区域101。服务系统10还可以包括管理设备100,该管理设备可以与各个区域101连接。
服务系统10中的每个区域101可以包括多个可用区1011。不同的可用区1011之间相互独立,每个可用区有独立的供电以及独立的网络等。当某个可用区出现问题时,其他可用区不会受到影响。同一区域101内的可用区1011可以通过高速网络连接,以保证可用区之间通信的时延较低。
在一些实施例中,云服务系统可以包括公有云和私有云,在公有云中不同的企业或个人用户可以共享资源,而私有云仅供其所属的用户使用。在公有云上可以自定义逻辑隔离网络空间,该逻辑隔离网络空间可以被称为VPC(Virtual Private Cloud:虚拟私有云)。且用户可以在VPC内托管私有云上的服务资源,如云主机和负载等,且可以自定义VPC中的网段划分、IP地址和路由策略等。
在一些实施例中,本申请实施例提供的服务系统10中可以具有虚拟私有云102,该虚拟私有云102可以包括一个或多个子网1021,虚拟私有云102中的云资源(例如云服务器、云数据库等)需要部署在子网1021内。每个虚拟私有云102可以归属于一个区域101,每个子网1021可以归属于一个可用区1011。当虚拟私有云102包括多个子网1021时,该多个子网1021可以均归属于同一可用区1011,或者也可以归属于不同的可用区1011。图1以虚拟私有云包括归属于不同可用区1011的多个子网1021为例进行示意。每个子网1021包括多个设备A,虚拟私有云102中的所有设备A共同提供VPC服务。同一虚拟私有云102中的各个子网1021内的设备A无论是否在同一可用区1011内,均可以通过内网互相连通,也即是可以直接使用内网IP地址进行互相访问。另外,可以将弹性IP(Elastic IP,EIP)地址添加至子网中的设备中,以完成子网中安全组和路由的配置,弹性IP地址也可称为弹性公网IP地址。在将EIP地址添加至子网中的设备后,该设备可以被公网访问。
在一些实施例中,虚拟私有云102可以包括主设备和一个或多个备设备,主设备用于为客户端提供服务。为了实现虚拟私有云102提供的服务的高可用性,当主设备宕机时,需进行主备切换,也即是将提供服务的设备切换为备设备,避免为客户端提供的服务中断。其中,主设备与备设备可以位于不同的子网中,如主设备可以位于第一子网中,备设备可以位于第二子网中。
其中,服务系统10中的每个能够连接至网络的设备A都有对应的真实内网IP地址,每个设备A在网络中的位置可以通过其对应的真实内网IP地址表征。虚拟私有云102中向用户提供服务的主设备除了真实内网IP地址还具有虚拟IP(virtual IP,VIP)地址,通过该真实内网IP地址与该虚拟IP地址中的任意一个都可以连接该主设备。在虚拟私有云102中使用该虚拟IP地址配置向通过内网连通的客户端提供服务的主设备,当正在提供服务的主设备发生故障而无法对外提供服务时,可以动态地将该虚拟IP地址切换到备设备,以使得原备设备作为主设备继续为客户端提供服务。
图2示出了本申请一实施例在容器云环境下实现切换路由反射模式的网络架构系统。
机房集群节点之间通过BGP连接进行路由通信,例如,第一机房集群第一节点与第一机房集群的第二节点通过BGP连接进行路由通信,所述第一节点例如可实施为Node1,所述第二节点可实施为Node2。
又例如,第一机房集群第一节点与第二机房集群的第二节点通过BGP连接进行路由通信,所述第二节点可实施为Node3、或Node4。
第一机房集群外第一交换机、第二交换机作为路由反射器,其中交换机分别与第一机房集群各个焦点交叉连接,进行路由通信,以实现路由反射模式。
图3示出了本申请另一实施例在容器云环境下实现切换路由反射模式的网络架构系统。
网络架构系统配置为在容器云环境下可实现切换路由反射模式,所述网络架构系统包括至少1个机房,机房内设置有集群节点、BGP对等体及用于通信的交叉连接。
BGP对等体包含第一交换机、第二交换机,所述BGP对等体用作路由反射器。RR模式中系统指定一个或多个BGP Speaker(BGP发言者)作为路由反射器,它与网络架构系统中其他BGP发言者建立连接,每个BGP发言者只要与路由反射器建立BGP连接就可以获得全网的路由信息,所述BGP发言者具体可实施为机房内的集群节点。
在一些实施例中,BGP对等体包含的交换机之间可同步路由信息。第一机房可实施为机房A,在第一交换机上设置第二交换机为本机BGP peer(BGP对等体),在第二交换机上设置第一交换机为本机BGP peer,从而在第一交换机、第二交换机之间建立BGP连接,实现交换机路由信息的同步,即BGP peer中所有的交换机可相互交换路由信息。
在一些实施例中,第一交换机为第一机房的网关;在所述第一交换机故障时,所述网关自动切换至第二交换机。
图4示出了本申请实施例交换机高可用设计示意图。
每个机房内将第一交换机、第二交换机作为路由反射器,上述这两台交换机采用类似堆叠的方式工作。
第一交换机和第二交换机之间建立BGP连接同步路由信息。机房集群各个节点都添加到本机房交换机网关的默认路由,如果网关所在交换机出现问题,所述网关会自动漂到另外的交换机上,所有数据请求通过另外一台交换机进行转发,使得网络请求不会中断。
继续参考图3,本申请提供的网络架构系统还包括第一机房集群各个节点至所述BGP对等体的交叉连接,所述交叉连接包含第一节点至第一交换机的默认路由,所述默认路由用于从所述第一交换机学习第一节点至第二节点的路由信息。
其中,第一节点可实施为第一机房集群内任一节点,例如Node1、或Node2,如图所示。第一节点连接至第一交换机、第二交换机,并且所述交叉连接还包括第一节点至第一交换机的默认路由,所述默认路由用于第一节点从所述第一交换机学习第一节点至第二节点的路由信息。
在一些实施例中,在所述默认路由可实施为在机房集群的第一节点添加“10.168.0.0/16via第一交换机虚拟IP”,设置为默认路由。
需要说明的是,Calico维护的网络在切换为RR模式、同时关闭node-to-node-mesh模式后,第一机房集群内节点无法从其他第二节点学习到路由信息,只能从本机房BGPpeer所在的交换机学习路由信息,也不能学习到第二机房集群第二节点的路由信息。因此第一节点对于不在本机路由表中路由下一跳地址需要指定为第一交换机。第一机房集群中每个节点、即第一节点被配置为指定交换机,即第一交换机的RR client(RouteReflectorclient:路由反射客户端),并且第一节点还需要配置连接至第一交换机的默认路由。
在一些实施例中,网络架构系统还包括第一过滤器,所述第一过滤器配置于所述第一节点用于滤除第一节点发送至第一交换机的默认路由。
基于第一机房集群各个节点添加的所述默认路由,第一交换机可以从集群各个节点学习路由并将学习到的路由同步到BGP peer所在的第二交换机,以及同步到BGP peer所在交换机的RR client、即机房内的其他集群节点。
为了避免第二交换机、集群其他节点学习到第一节点的默认路由,例如,Calico维护的网络可通过Etcd组件添加自定义过滤器,即第一过滤器,所述自定义过滤器可避免第一机房集群内第一节点发布其配置的默认路由至第一交换机,引起不必要的无效学习。
在一些实施例中,网络架构系统还包括第一交换机、第二交换机至第一节点的第二路由,用于交换机重新建立BGP连接时发送数据至第一节点,在一些实施例中,所述第二路由被配置为静态路由。
当路由反射器交换机设置集群节点为RR client时,交换机的BGP连接需要重新建立,在重新建立的过程中路由丢失会导致跨网段访问出现短时间的中断,因此可通过手动在交换机配置其到所有集群节点pod(容器)的第二路由,所述第二路由可配置为静态路由。当BGP连接重新建立过程中,交换机对于接收到的数据请求还可以通过所述第二路由转到相应的集群节点。
在一些实施例中,在切换路由反射模式后删除所述第二路由。在集群切换RR模式完成后,之前为了保证业务不中断临时在路由反射器交换机上添加的第二路由不再需要,可以通过管理工具在路由反射器交换机上删除这些静态路由。
继续参考图3,第一机房集群第一节点被配置为第一交换机、第二交换机的路由反射客户端,其中,第一节点可实施为第一机房集群内任一节点,例如Node1或Node2。
继续参考图3,在第二节点位于第一机房集群内时,所述路由信息包括第一节点至第二节点的路由,所述第二节点例如可实施为Node2;在第二节点位于第二机房集群内时,所述路由信息包括默认路由、第一机房交换机至第二机房交换机的路由,所述第二节点例如可实施为Node3、或Node4。
在一些实施例中,在路由反射器交换机上将其所在机房集群各个节点配置成RRclient后,可查看第一节点的bird(即BGP客户端)路由、交换机路由。
第一节点配置为RR client后,第一节点只可以从路由反射器交换机学习到与配置前同样的路由信息,因此节点路由没有变化;通过bird查看具体路由学习详情,可以发现对于同机房节点,每个节点都能从node BGP peer交换机学习到相应第一机房集群第二节点的路由,对于跨机房的bird路由,需要从配置的跨机房node BGP peer交换机学习到第二机房集群第二节点的路由,在路由学习过程中,网络的业务访问也不会出现中断。其中,第一机房和第二机房通过跨机房的BGP peer交换机进行连接。
需要说明的是,通过交换机在硬件层面支持路由反射的特点,选择第一交换机、第二交换机作为机房集群的路由反射器,并同时在第一交换机、第二交换机之间建立BGP连接,用于交换路由信息。
机房集群内所有节点作为RR client与路由反射器建立BGP连接,即每个节点或每个BGP Speaker只需要与路由反射器交换路由信息,就可以得到全网路由信息。
第一机房、第二机房是两套独立的路由反射集群,集群节点之间不再之间建立BGP连接进行交换路由,集群节点增加“10.168.0.0/16via本机房第一交换机虚拟IP”的默认路由,每个集群节点或BGP Speaker只需要与路由反射器交换路由信息,就可以得到全网路由信息,实现和第二节点的互联。
基于本申请上文中提供的网络架构系统内容,下文将就在容器云环境下实现切换路由反射模式的方法进行阐述。
图5示出了本申请实施例一种路由反射模式切换方法的流程示意图。
在步骤501中,添加第一机房集群第一节点至BGP对等体中第一交换机的默认路由,所述默认路由用于从所述第一交换机学习第一节点至第二节点的路由信息,所述BGP对等体还包括第二交换机。
其中,第一节点可实施为第一机房集群内任一节点,例如Node1、或Node2;第一机房内将第一交换机、第二交换机作为路由反射器,上述这两台交换机采用类似堆叠的方式工作,如图3中所示。
在第一节点配置连接至第一交换机的默认路由,所述默认路由用于第一节点从第一交换机学习第一节点至第二节点的路由信息。例如,在第一机房集群的第一节点添加“10.168.0.0/16via第一交换机虚拟IP”作为默认路由。
在一些实施例中,BGP对等体包含的交换机之间可同步路由信息,并作为路由反射器。在第一交换机上设置第二交换机为本机BGP peer(BGP对等体),在第二交换机上设置第一交换机为本机BGP peer,从而在第一交换机、第二交换机之间建立BGP连接,实现交换机路由信息的同步,即BGP peer中所有的交换机可相互交换路由信息。
在一些实施例中,在第二节点位于第一机房集群内时,所述第一节点学习的路由信息包括第一节点至第二节点的路由,所述第二节点例如可实施为Node2,或第一机房集群内任一节点。
在一些实施例中,在第二节点位于第二机房集群内时,所述第一节点学习的路由信息包括默认路由、第一机房交换机至第二机房交换机的路由,所述第二节点例如可实施为Node3、或Node4,或第二机房集群内任一节点。
在一些实施例中,第一节点配置了第一过滤器,所述第一过滤器用于滤除第一节点发送至第一交换机的默认路由。第一交换机可以从集群各个节点学习路由并将学习到的路由同步到BGP peer所在的第二交换机,以及同步到BGP peer所在交换机的RR client、即机房内的其他集群节点。为了避免第二交换机、集群其他节点学习到第一节点的默认路由,通过第一过滤器可避免第一机房集群内第一节点发布其配置的默认路由至第一交换机,引起不必要的无效学习。
继续参考图5,在步骤502中,将所述第一节点配置为所述第一交换机、第二交换机的路由反射客户端。
在路由反射器的第一交换机、第二交换机上将其所在机房集群各个节点配置成RRclient,从而可查看第一节点的bird(即BGP客户端)路由、交换机路由。
通过bird查看第一节点具体路由学习详情,可以发现对于同机房节点,每个节点都能从node BGP peer交换机学习到相应第一机房集群第二节点的路由,对于跨机房的bird路由,需要从配置的跨机房node BGP peer交换机学习到第二机房集群第二节点的路由,在路由学习过程中,网络的业务访问也不会出现中断。其中,第一机房和第二机房通过跨机房的BGP peer交换机进行连接。
在一些实施例中,将第一节点配置为第一交换机、第二交换机的路由反射客户端之前,还包括步骤:添加第一交换机、第二交换机至第一节点的第二路由,所述第二路由用于交换机重新建立BGP连接时发送数据至第一节点。在一些实施例中,所述第二路由被配置为静态路由。
当路由反射器交换机设置集群节点为RR client时,交换机的BGP连接需要重新建立,在重新建立的过程中路由丢失会导致跨网段访问出现短时间的中断,因此可通过手动在交换机配置其到所有集群节点pod(容器)的第二路由,所述第二路由可配置为静态路由。当BGP连接重新建立过程中,交换机对于接收到的数据请求还可以通过所述第二路由转到相应的集群节点。
继续参考图5,在步骤503中,禁用集群的全节点互联模式,得到集群的路由反射模式。
通过在配置有calicoctl管理工具的集群节点禁用默认的全节点互联模式,则得到集群的路由反射模式。
例如,通过管理工具calicoctl执行以下代码:
calicoctl config set nodeToNodeMesh off;
Calico维护的网络关闭node-to-node-mesh。查看集群节点路由、bird路由的学习详情、交换机路由,此时集群各个节点上路由表中没有到跨机房节点的路由、交换机上路由没有变化;通过bird查看路由学习详情可以发现此时节点只从交换机学习到同机房其他节点路由,无法学习到直接跨机房集群节点的路由。
在一些实施例中,得到集群的路由反射模式后,删除所述第二路由。在集群切换RR模式完成后,之前为了保证业务不中断临时在路由反射器交换机上添加的第二路由不再需要,可以通过管理工具在路由反射器交换机上删除这些静态路由。
在一些实施例中,第一交换机为第一机房的网关,在所述第一交换机故障时,所述网关自动切换至第二交换机。作为BGP对等体第一交换机和第二交换机之间可同步路由信息,并且机房集群各个节点都添加到本机房交换机网关的默认路由,如果网关所在交换机出现问题,所述网关会自动漂到另外的交换机上,所有数据请求通过另外一台交换机进行转发,使得网络请求不会中断。
图6示出了本申请实施例一种网络构架中切换路由反射模式的时序图。
在步骤601中,节点添加“10.168.0.0/16via交换机虚IP”作为默认路由。
添加第一机房集群第一节点至BGP对等体中第一交换机的默认路由,所述默认路由用于从所述第一交换机学习第一节点至第二节点的路由信息。
在步骤602中,两个交换机之间设置BGP peer。
BGP对等体包含的交换机之间可同步路由信息,并作为路由反射器。在第一交换机上设置第二交换机为本机BGP peer(BGP对等体),在第二交换机上设置第一交换机为本机BGP peer,从而在第一交换机、第二交换机之间建立BGP连接,实现交换机路由信息的同步,即BGP peer中所有的交换机可相互交换路由信息。
在步骤603中,节点添加过滤器避免发布默认路由。
第一节点配置了第一过滤器,所述第一过滤器用于滤除第一节点发送至第一交换机的默认路由,可避免第二交换机、集群其他节点学习到第一节点的默认路由,通过第一过滤器可避免第一机房集群内第一节点发布其配置的默认路由至第一交换机,引起不必要的无效学习。
在步骤604中,添加至节点的静态路由。
添加第一交换机、第二交换机至集群第一节点的静态路由,也称为第二路由,所述第二路由用于交换机重新建立BGP连接时发送数据至第一节点。
在步骤605中,设置节点为RR client。
在路由反射器的第一交换机、第二交换机上将其所在机房集群各个节点配置成RRclient,从而可查看第一节点的bird(即BGP客户端)路由、交换机路由。
在步骤606中,关闭集群noed-to-node-mesh。
通过在配置有calicoctl管理工具的集群节点禁用默认的全节点互联模式,则得到集群的路由反射模式。
在步骤607中,删除步骤604中的静态路由。
得到集群的路由反射模式后,删除所述第二路由。在集群切换RR模式完成后,之前为了保证业务不中断临时在路由反射器交换机上添加的第二路由不再需要,可以通过管理工具在路由反射器交换机上删除这些静态路由。
基于本申请上文中提供的网络架构系统、容器云环境下实现切换路由反射模式的方法,下文将就在容器云环境下实现回滚全节点互联模式的方法进行阐述。
图7示出了本申请实施例一种回滚方法的流程示意图。
如果切换RR模式有问题,需要将集群回滚到node-to-node-mesh模式,则执行如下回滚步骤。
在步骤701中,开启全节点互联模式,集群所有节点两两之间重新建立BGP连接,并同步路由信息。
通过在配置有calicoctl管理工具的集群节点开启默认的全节点互联模式,则得到集群的路由反射模式。全节点互联模式的每个BGP Speaker都需要和其他BGP Speaker建立BGP连接。
在步骤702中,移除第一交换机、第二交换机的路由反射客户端。
在路由反射器的第一交换机、第二交换机上移除所在机房集群之前设置的各个RRclient。
在步骤703中,移除第一机房集群节点至BGP对等体中第一交换机的默认路由。
例如,可实施为集群各个节点上删除“10.168.0.0/16via交换机虚拟IP”的默认路由。全节点互联模式中,节点通过BGP连接至其他节点学习集群节点至其他节点的路由信息。
本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,当所述计算机指令中的至少部分指令被处理器执行时,实现如路由反射模式切换方法,其具体操作方法在本申请前文的方法内容已经做了详细的阐述,此处不再赘述。
本申请提供的技术方案包括以下有益效果在于,通过构建第一交换机、第二交换机作为路由反射器,可以提高RR模式中路由反射器的稳定性;进一步通过构建默认路由,可以实现集群节点从交换机学习至其它节点的路由信息;进一步通过同步第一交换机和第二交换机的路由信息,可以实现机房网关故障时备用网关的自动切换;进一步通过构建第一过滤器,可以避免集群节点无效学习默认路由;进一步通过构建第二路由,可以实现配置路由反射客户端瞬间交换机仍可有效转发数据至集群节点,可以简化、降低集群节点BGP连接的维护数量、仅维护集群节点至交换机的BGP连接、避免集群节点之间的BGP连接维护、实现容器云生产环境下不中断业务无缝切换RR模式。
此外要意识到,本申请所述的各种组件、节点能够包括(一个或多个)电路,其能够包括适当值的组件和电路元件,以便实现本创新的方面。此外能够意识到,各种组件的许多组件能够在一个或多个集成电路(IC)芯片上实现。在一个示范实现中,组件集合能够在单个IC芯片上实现。在其它示范实现中,相应组件的一个或多个在单独IC芯片上制作或实现。
以上已经描述的包括本发明的实现的示例。为了描述要求保护主题的目的,当然不可能描述组件或方法的每一个可设想组合,但是要意识到,本创新的许多另外组合和置换是可能的。相应地,要求保护主题打算包含全部这类改变、修改和变化,其落入所附权利要求的精神和范围之内。此外,包括“摘要”中所述的事物的本申请的所示实现的以上描述并不是要详细列举或者将所公开实现局限于所公开的精确形式。虽然本申请中为了说明目的而描述具体实现和示例,但是如相关领域的技术人员能够认识的,被认为在这类实现和示例的范围之内的各种修改是可能的。
具体来说并且关于由上述组件、装置、电路、系统等所执行的各种功能,除非另加指示,否则用来描述这类组件的术语打算对应于执行所述组件的所指定功能(例如,功能等效)的任何组件,即使不是在结构上等效于所公开结构(其执行要求保护主题的本申请所示示范方面的功能)。在这方面,还将会认识到,创新包括系统以及计算机可读存储介质,其具有计算机可执行指令,以用于执行要求保护主题的各种方法的动作和/或事件。
已经针对若干组件/块之间的交互描述了上述系统/电路/模块。能够意识到,这类系统/电路和组件/块能够包括那些组件或者所指定子组件、所指定组件或者子组件的一些和/或附加组件,并且按照以上述各种置换和组合。子组件还能够实现为通信地耦合到其它组件而不是包括在父组件(分级)内的组件。另外,应当注意,一个或多个组件可组合为提供聚合功能性的单个组件或者分为若干单独子组件,以及可提供任何一个或多个中间层(例如管理层),以通信地耦合到这类子组件,以便提供综合功能性。本申请所述的任何组件还可与本申请中没有具体描述但是本领域的技术人员已知的一个或多个其它组件进行交互。
虽然阐明本发明的广义范围的数值范围和参数是近似值,但是具体示例中阐明的数值尽可能准确地报导。但是,任何数值固有地含有必然产生于其相应测试测量中找到的标准偏差的某些误差。此外,本申请所公开的全部范围要被理解为包含其中所包含的任何和全部子范围。例如,“小于或等于11”的范围能够包括零的最小值与11的最大值之间(并且包含该最小值与最大值)的任何和全部子范围,即,任何和全部子范围具有等于或大于零的最小值以及等于或小于11的最大值(例如1至5)。在某些情况下,如对参数所述的数值能够具有负值。
另外,虽然可能已经仅针对若干实现之一公开了本创新的特定特征,但是这种特征可如对任何给定或特定应用可预期和有利的与其它实现的一个或多个其它特征相组合。此外,在详细描述或者权利要求中使用术语“包括(include、including)”、“具有”、“含有”及其变体和其它类似词语的意义上,这些术语打算采用与作为开放过渡词语的术语“包含”相似的方式是包含的,而没有排除任何附加或其它元件。
遍及本说明书中提到“一个实现”或“一实现”表示结合该实现所述的特定特征、结构或特性包含在至少一个实现中。因此,短语“在一个实现中”或者“在一实现中”在遍及本说明书中的各个位置的出现不一定全部指相同实现。此外,具体特征、结构或特性可采用任何适当方式结合在一个或多个实现中。
此外,遍及本说明书中提到“项”或“文件”意味着结合实现所述的特定结构、特征或对象不一定指相同对象。此外,“文件”或“项”能够指各种格式的对象。
如本申请中使用的术语“节点”、“组件”、“模块”、“系统”等一般打算指作为硬件(例如电路)、硬件和软件的组合的计算机相关实体或者与具有一个或多个特定功能性的操作机器相关的实体。例如,组件可以是(但不限于)在处理器(例如数字信号处理器)上运行的进程、处理器、对象、可执行、执行线程、程序和/或计算机。作为说明,在控制器上运行的应用和控制器两者均能够是组件。一个或多个组件可驻留在进程和/或执行线程中,以及组件可定位在一个计算机上和/或分布在两个或更多计算机之间。虽然在各个实现中描绘单独组件,但是要意识到,组件可采用一个或多个公共组件来表示。此外,各个实现的设计能够包括不同组件放置、组件选择等,以实现最佳性能。此外,“装置”能够采取专门设计硬件;通过其上的软件(其使硬件能够执行特定功能)的执行被专门化的一般化硬件;计算机可读介质上存储的软件;或者其组合的形式。
此外,词语“示例”或“示范”在本申请中用来表示“用作示例、实例或说明”。本申请中描述为“示范”的任何方面或设计不一定被理解为相对其它方面或设计是优选或有利的。相反,词语“示例”或“示范”的使用打算以具体方式呈现概念。如本申请所使用的,术语“或者”打算表示包含“或”而不是互斥“或”。即,除非另加说明或者从上下文清楚地知道,否则“X采用A或B”打算表示自然包含置换的任一个。即,如果X采用A;X采用B;或者X采用A和B两者,则在上述实例的任何实例下均满足“X采用A或B”。另外,如本申请和所附权利要求中所使用的冠词“一(a和an)”应当一般地理解为表示“一个或多个”,除非另加说明或者从上下文清楚地知道针对单数形式。

Claims (9)

1.一种网络架构系统,配置为在容器云环境下实现切换路由反射模式,其特征在于,包括:
包含第一交换机、第二交换机的BGP对等体,所述BGP对等体用作路由反射器;
第一机房集群各个节点至所述BGP对等体的交叉连接,所述交叉连接包含第一节点至第一交换机的默认路由,所述默认路由用于从所述第一交换机学习第一节点至第二节点的路由信息;
第一机房交换机至第二机房交换机的路由;
其中,所述第一节点被配置为所述第一交换机、第二交换机的路由反射客户端;
配置于所述第一节点的第一过滤器,其中所述第一过滤器用于滤除第一节点发送至所述第一交换机的默认路由。
2.根据权利要求1所述网络架构系统,其特征在于,所述BGP对等体包含的交换机之间可同步路由信息。
3.根据权利要求1所述网络架构系统,其特征在于,还包括:
第一交换机、第二交换机至第一节点的第二路由,用于交换机重新建立BGP连接时发送数据至第一节点。
4.根据权利要求3所述网络架构系统,其特征在于,所述第二路由被配置为静态路由。
5.根据权利要求3所述网络架构系统,其特征在于,在切换路由反射模式后,删除所述第二路由。
6.根据权利要求1所述网络架构系统,其特征在于,
在所述第二节点位于第一机房集群内时,所述路由信息包括第一节点至第二节点的路由;
在所述第二节点位于第二机房集群内时,所述路由信息包括默认路由、第一机房交换机至第二机房交换机的路由。
7.根据权利要求2所述网络架构系统,其特征在于,
所述第一交换机为第一机房的网关;
在所述第一交换机故障时,所述网关自动切换至第二交换机。
8.一种路由反射模式的切换方法,配置为在容器云环境下实现切换路由反射模式,其特征在于,所述方法包括:
添加第一机房集群第一节点至BGP对等体中第一交换机的默认路由,所述默认路由用于从所述第一交换机学习第一节点至第二节点的路由信息,所述BGP对等体还包括第二交换机;
将所述第一节点配置为所述第一交换机、第二交换机的路由反射客户端;
禁用集群的全节点互联模式,得到集群的路由反射模式;
将第一过滤器配置于所述第一节点,其中,所述第一过滤器用于滤除第一节点发送至所述第一交换机的默认路由。
9.根据权利要求8所述路由反射模式的切换方法,其特征在于,所述第一节点配置了第一过滤器,所述第一过滤器用于滤除第一节点发送至第一交换机的默认路由。
CN202010568094.8A 2020-06-19 2020-06-19 路由反射模式的切换方法及网络架构系统 Active CN111817954B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010568094.8A CN111817954B (zh) 2020-06-19 2020-06-19 路由反射模式的切换方法及网络架构系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010568094.8A CN111817954B (zh) 2020-06-19 2020-06-19 路由反射模式的切换方法及网络架构系统

Publications (2)

Publication Number Publication Date
CN111817954A CN111817954A (zh) 2020-10-23
CN111817954B true CN111817954B (zh) 2022-07-26

Family

ID=72845342

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010568094.8A Active CN111817954B (zh) 2020-06-19 2020-06-19 路由反射模式的切换方法及网络架构系统

Country Status (1)

Country Link
CN (1) CN111817954B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106850422A (zh) * 2015-12-04 2017-06-13 中国电信股份有限公司 一种基于路由反射器的路径优选方法和系统
CN110875889A (zh) * 2018-09-03 2020-03-10 阿里巴巴集团控股有限公司 一种用于获取路径的方法及其装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7675912B1 (en) * 2005-07-05 2010-03-09 Cisco Technology, Inc. Method and apparatus for border gateway protocol (BGP) auto discovery
US9178797B2 (en) * 2012-06-30 2015-11-03 Juniper Networks, Inc. Selective BGP graceful restart in redundant router deployments
US10097449B2 (en) * 2015-02-20 2018-10-09 Cisco Technology, Inc. Optimized border gateway protocol best path selection for optimal route reflection
CN106452909B (zh) * 2016-11-07 2019-04-16 迈普通信技术股份有限公司 一种路由发布方法以及路由反射器设备
CN110417665B (zh) * 2019-08-05 2021-06-11 浪潮云信息技术股份公司 一种数据中心多Fabric场景的EVPN组网系统及方法
CN110995582A (zh) * 2019-12-03 2020-04-10 西安邮电大学 一种bgp路由反射器冗余网络收敛实现方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106850422A (zh) * 2015-12-04 2017-06-13 中国电信股份有限公司 一种基于路由反射器的路径优选方法和系统
CN110875889A (zh) * 2018-09-03 2020-03-10 阿里巴巴集团控股有限公司 一种用于获取路径的方法及其装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
BGP Add-path的研究与实现;王婷等;《电子设计工程》;20160731(第13期);128-130 *

Also Published As

Publication number Publication date
CN111817954A (zh) 2020-10-23

Similar Documents

Publication Publication Date Title
CN110912780B (zh) 一种高可用集群检测方法、系统及受控终端
TWI724106B (zh) 資料中心間的業務流量控制方法、裝置及系統
CN107454155B (zh) 一种基于负载均衡集群的故障处理方法、装置以及系统
US7609619B2 (en) Active-active data center using RHI, BGP, and IGP anycast for disaster recovery and load distribution
US20030051049A1 (en) Network provisioning in a distributed network management architecture
CN102624635B (zh) 一种平滑重启实现方法及设备
CN110417665B (zh) 一种数据中心多Fabric场景的EVPN组网系统及方法
CN111447146B (zh) 物理路由信息的动态更新方法、装置、设备和存储介质
CN112003716A (zh) 一种数据中心双活实现方法
WO2022083464A1 (zh) 数据处理方法、装置及系统,计算机设备和计算机可读存储介质
JP2002057682A (ja) ネットワークインタフェース切替え方法及びネットワークに接続可能なコンピュータ
WO2022017099A1 (zh) 通信方法、cp设备及nat设备
CN103119400B (zh) 用于跨ip网络连接的串行数据链路会话的状态同步的方法和设备
CN113381936B (zh) 网络信息处理方法、装置及网络设备
CN113407382B (zh) 一种服务故障动态调控方法与系统
EP1712067B1 (en) A method, apparatus and system of organizing servers
Aglan et al. Reliability and scalability in SDN networks
CN111371591B (zh) 一种双机虚拟化快速部署sdn组网的配置方法及系统
CN111371535B (zh) 一种异地主备数据中心灾备系统及切换方法
CN102291313B (zh) 虚拟路由器冗余协议网络拓扑的发现方法、装置及设备
CN111817954B (zh) 路由反射模式的切换方法及网络架构系统
US6535923B1 (en) Method and system for defining an efficient and reliable meshing of CP-CP sessions in an advanced peer to peer network
US9015518B1 (en) Method for hierarchical cluster voting in a cluster spreading more than one site
Cisco Designing APPN Internetworks
Cisco Designing APPN Internetworks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant