CN115037602A - 一种故障处理方法及装置 - Google Patents

一种故障处理方法及装置 Download PDF

Info

Publication number
CN115037602A
CN115037602A CN202210379132.4A CN202210379132A CN115037602A CN 115037602 A CN115037602 A CN 115037602A CN 202210379132 A CN202210379132 A CN 202210379132A CN 115037602 A CN115037602 A CN 115037602A
Authority
CN
China
Prior art keywords
address
gateway
ovs
host
tunnel destination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210379132.4A
Other languages
English (en)
Inventor
陈禄建
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
New H3C Technologies Co Ltd
Original Assignee
New H3C Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by New H3C Technologies Co Ltd filed Critical New H3C Technologies Co Ltd
Priority to CN202210379132.4A priority Critical patent/CN115037602A/zh
Publication of CN115037602A publication Critical patent/CN115037602A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0663Performing the actions predefined by failover planning, e.g. switching to standby network elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/28Routing or path finding of packets in data switching networks using route fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/74Address processing for routing

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本申请涉及网络通信技术领域,特别涉及一种故障处理方法及装置。该方法应用于控制器,所述控制器纳管的组网包括用于负载分担的至少两个网关的网关集合,所述网关集合包括的各网关用第一IP地址,所述方法包括:在检测到所述网关集合中第一网关故障时,向所述网关集合中除所述第一网关之外的第二网关下发第二IP地址;向所述第二网关发送携带OVS主机IP地址的路由通告,并接收所述第二网关发送的携带所述第二IP地址的路由通告;将所述OVS主机上隧道目的IP地址为所述第一IP地址的表项的隧道目的IP地址更新为所述第二IP地址。

Description

一种故障处理方法及装置
技术领域
本申请涉及网络通信技术领域,特别涉及一种故障处理方法及装置。
背景技术
在某些组网中,使用双活网关的方案,如,SDNGW为双活VXLAN网关,实现网关负载分担,两台SDNGW共用相同MAC及网关地址,作为VNF(虚机)的南北向VXLAN网关,并且由SDN控制器自动下发配置。当其中一个GW故障时,流量可以不感知切换,从而避免单点故障对网络的影响。
实际应用时,当控制器检测到有南向设备故障时(主要表现为控制器上纳管的设备状态为inactive,可能由于流量不通、openflow连接失败、netconf连接失败等导致),有配置需要下发到该故障的设备时,该配置下发到所有设备都会失败,同时向控制器的北向(VIM、mano)报错,通知北向的VIM和mano停止业务部署流程。该功能的主要目的是:在设备已经故障的情况下,配置会下发失败,如果作为控制器的上层应用VIM、mano不感知,继续完成业务部署流程的话,肯定会由于配置下发失败影响到流量。有了这个功能之后,就可以及时通知上层应用及时停止业务部署流程,排查问题。
然而,故障设备隔离只是解决了配置下发失败的问题,设备故障的情况可能是分多种的。当故障网关与控制器之间链路断开,控制器检测到网关故障,而该网关的端口up,这时候流量还会hash到该网关上,此时,仍存在一种情况,即该网关的端口up,但是转发不了流量,此时就会存在流量丢失的问题。
发明内容
本申请提供了一种故障处理方法及装置,用以解决现有技术中存在的流量丢失的问题。
第一方面,本申请提供了一种故障处理方法,应用于控制器,所述控制器纳管的组网包括用于负载分担的至少两个网关的网关集合,所述网关集合包括的各网关用第一IP地址,所述方法包括:
在检测到所述网关集合中第一网关故障时,向所述网关集合中除所述第一网关之外的第二网关下发第二IP地址;
向所述第二网关发送携带OVS主机IP地址的路由通告,并接收所述第二网关发送的携带所述第二IP地址的路由通告;
将所述OVS主机上隧道目的IP地址为所述第一IP地址的表项的隧道目的IP地址更新为所述第二IP地址。
可选地,在检测到所述网关集合中第一网关故障时,向所述网关集合中除所述第一网关之外的第二网关下发第二IP地址的步骤包括:
在检测到与所述网关集合中第一网关之间的连接断开后,提示用户输入第二IP地址;
基于用户输入的第二IP地址,向所述第二网关下发携带所述第二IP地址的配置。
可选地,将所述OVS主机上隧道目的IP地址为所述第一IP地址的表项的隧道目的IP地址更新为所述第二IP地址的步骤包括:
向所述OVS主机发送OVS流表修改指令,以使得所述OVS主机在接收到所述OVS流表修改指令后,将本地流表中隧道目的IP地址为所述第一IP地址的表项的隧道目的IP地址由所述第一IP地址更新为所述第二IP地址。
可选地,将所述OVS主机上隧道目的IP地址为所述第一IP地址的表项的隧道目的IP地址更新为所述第二IP地址的步骤包括:
向所述OVS主机发送用于替换所述OVS主机上隧道目的IP地址为所述第一IP地址的表项的OVS流表,以使得所述OVS主机在接收到该OVS流表后,将本地流表中隧道目的IP地址为所述第一IP地址的表项替换为该OVS流表。
可选地,所述方法还包括:
隔离故障的所述第一网关。
第二方面,本申请提供了一种故障处理装置,应用于控制器,所述控制器纳管的组网包括用于负载分担的至少两个网关的网关集合,所述网关集合包括的各网关用第一IP地址,所述装置包括:
第一发送单元,用于在检测到所述网关集合中第一网关故障时,向所述网关集合中除所述第一网关之外的第二网关下发第二IP地址;
第二发送单元,用于向所述第二网关发送携带OVS主机IP地址的路由通告,并接收所述第二网关发送的携带所述第二IP地址的路由通告;
更新单元,用于将所述OVS主机上隧道目的IP地址为所述第一IP地址的表项的隧道目的IP地址更新为所述第二IP地址。
可选地,在检测到所述网关集合中第一网关故障时,向所述网关集合中除所述第一网关之外的第二网关下发第二IP地址时,所述第一发送单元具体用于:
在检测到与所述网关集合中第一网关之间的连接断开后,提示用户输入第二IP地址;
基于用户输入的第二IP地址,向所述第二网关下发携带所述第二IP地址的配置。
可选地,将所述OVS主机上隧道目的IP地址为所述第一IP地址的表项的隧道目的IP地址更新为所述第二IP地址时,所述更新单元具体用于:
向所述OVS主机发送OVS流表修改指令,以使得所述OVS主机在接收到所述OVS流表修改指令后,将本地流表中隧道目的IP地址为所述第一IP地址的表项的隧道目的IP地址由所述第一IP地址更新为所述第二IP地址。
可选地,将所述OVS主机上隧道目的IP地址为所述第一IP地址的表项的隧道目的IP地址更新为所述第二IP地址时,所述更新单元具体用于:
向所述OVS主机发送用于替换所述OVS主机上隧道目的IP地址为所述第一IP地址的表项的OVS流表,以使得所述OVS主机在接收到该OVS流表后,将本地流表中隧道目的IP地址为所述第一IP地址的表项替换为该OVS流表。
可选地,所述装置还包括:
隔离单元,用于隔离故障的所述第一网关。
第三方面,本申请实施例提供一种故障处理装置,该故障处理装置包括:
存储器,用于存储程序指令;
处理器,用于调用所述存储器中存储的程序指令,按照获得的程序指令执行如上述第一方面中任一项所述的方法的步骤。
第四方面,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使所述计算机执行如上述第一方面中任一项所述方法的步骤。
综上可知,本申请实施例提供的故障处理方法,应用于控制器,所述控制器纳管的组网包括用于负载分担的至少两个网关的网关集合,所述网关集合包括的各网关用第一IP地址,所述方法包括:在检测到所述网关集合中第一网关故障时,向所述网关集合中除所述第一网关之外的第二网关下发第二IP地址;向所述第二网关发送携带OVS主机IP地址的路由通告,并接收所述第二网关发送的携带所述第二IP地址的路由通告;将所述OVS主机上隧道目的IP地址为所述第一IP地址的表项的隧道目的IP地址更新为所述第二IP地址。
采用本申请实施例提供的故障处理方法,在检测到网关集合中任一网关故障后,向其它正常网关配置新的IP地址,以使得其它正常网关能够基于新的IP地址与OVS主机建立隧道,快速恢复业务流量,及不影响原有业务和新业务的下发。使用户在替换、或维修故障设备期间,整个网络业务不受影响的继续运行。
附图说明
为了更加清楚地说明本申请实施例或者现有技术中的技术方案,下面将对本申请实施例或者现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据本申请实施例的这些附图获得其他的附图。
图1为本申请实施例提供的一种故障处理方法的详细流程图;
图2为本申请实施例提供的另一种故障处理方法的详细流程图;
图3为本申请实施例提供的一种故障处理装置的结构示意图;
图4为本申请实施例提供的另一种故障处理装置的结构示意图。
具体实施方式
在本申请实施例使用的术语仅仅是出于描述特定实施例的目的,而非限制本申请。本申请和权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其它含义。还应当理解,本文中使用的术语“和/或”是指包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请实施例可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,此外,所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
示例性的,参阅图1所示,为本申请实施例提供的一种故障处理方法的详细流程图,该方法应用于控制器,所述控制器纳管的组网包括用于负载分担的至少两个网关的网关集合,所述网关集合包括的各网关用第一IP地址,该方法包括以下步骤:
步骤100:在检测到所述网关集合中第一网关故障时,向所述网关集合中除所述第一网关之外的第二网关下发第二IP地址。
本申请实施例中,控制器在检测到任一网关故障时,隔离该故障的网关。
本申请实施例中,在检测到所述网关集合中第一网关故障时,向所述网关集合中除所述第一网关之外的第二网关下发第二IP地址时,一种较佳地实现方式为:在检测到与所述网关集合中第一网关之间的连接断开后,提示用户输入第二IP地址;基于用户输入的第二IP地址,向所述第二网关下发携带所述第二IP地址的配置。
具体的,控制器(如SDN控制器)纳管网关设备,与各网关设备通过管理网通信连接,当控制器检测到与一个网关之间的通信连接断开,则确定该网关发生故障。
本申请实施例中,网关集合可以包括至少两个网关设备,网关集合包括的各网关用于负载分担,即网关集合包括的各网关共用一个IP地址和MAC地址。
例如,网关集合包括网关1和网关2,网关1和网关2负载分担转发业务流量,即OVS主机会通过预设的hash算法将业务流量分别hash至网关1和网关2进行转发,网关1和网关2共用一个IP地址(如,第一IP地址)和MAC地址。
当然,网关集合包括的数量还可以是多个(如,3个,4个,n个),多个网关用于负载分担,本申请实施例中,在此不做具体限定。
若控制器检测到第一网关(如,网关1)故障,则向网关2下发新的IP地址(如,第二IP地址),具体地,控制器在检测到与第一网关之间连接断开,则提示用户输入第二IP地址,获取用户输入的第二IP地址,并将第二IP地址携带在配置中下发给网关2。
步骤110:向所述第二网关发送携带OVS主机IP地址的路由通告,并接收所述第二网关发送的携带所述第二IP地址的路由通告。
具体地,控制器与第二网关互相通告3类路由,即第二网关在接收到控制器下发的第二IP地址之后,会将本地IP地址配置为第二IP地址,并在配置成功之后,通过3类路由通告的方式将自身的IP地址(第二IP地址)通告给控制器,同时,控制器会通过3类路由的方式将其纳管的OVS主机的IP地址通告给第二网关。
步骤120:将所述OVS主机上隧道目的IP地址为所述第一IP地址的表项的隧道目的IP地址更新为所述第二IP地址。
具体地,本申请实施例中,在将所述OVS主机上隧道目的IP地址为所述第一IP地址的表项的隧道目的IP地址更新为所述第二IP地址时,一种较佳地实现方式为:向所述OVS主机发送OVS流表修改指令,以使得所述OVS主机在接收到所述OVS流表修改指令后,将本地流表中隧道目的IP地址为所述第一IP地址的表项的隧道目的IP地址由所述第一IP地址更新为所述第二IP地址。
例如,假设OVS主机上隧道目的IP地址为所述第一IP地址的表项为表项1和表项2,在未修改前,表项1和表项2的隧道目的IP地址为第一IP地址,OVS主机在接收到控制器发送的OVS修改指令后,将表项1和表项2的隧道目的IP地址由第一IP地址修改为第二IP地址。
本申请实施例中,在将所述OVS主机上隧道目的IP地址为所述第一IP地址的表项的隧道目的IP地址更新为所述第二IP地址时,另一种较佳地实现方式为:向所述OVS主机发送用于替换所述OVS主机上隧道目的IP地址为所述第一IP地址的表项的OVS流表,以使得所述OVS主机在接收到该OVS流表后,将本地流表中隧道目的IP地址为所述第一IP地址的表项替换为该OVS流表。
例如,假设OVS主机上隧道目的IP地址为所述第一IP地址的表项为表项1和表项2,此时,
下面结合具体应用场景对本申请实施例提供的故障处理方法的过程进行详细说明。示例性的,参阅图2所示,为本申请实施例提供的一种故障处理方法的详细流程图,包括如下步骤:
步骤1、控制器隔离故障设备。
具体地,网关集合中包括多个网关设备,该多个网关设备共用同一VTEP IP,当控制器在检测到任一网关设备故障后,将该故障设备进行隔离,即将该故障设备从其纳管的组网中剔除。
例如,当SDNGW设备从控制器下线或设备其他模块故障,导致控制器新增业务失败,或组网中原有业务流量异常,客户排查出SDNGW设备故障后,且想要用单SDNGW继续运行现有业务,使原有业务和新增业务都不受影响。那么此时客户就需要在控制器上操作隔离故障设备。
步骤2、向正常设备下发新的VTEP IP。
具体的,网关集合中还包括工作正常的其它网关设备,此时,控制器向工作正常的其它网关设备下发用户重新设置的VTEP IP。
实际应用中,在控制器上对故障设备操作隔离,控制器上要求客户输入新的VTEPIP(如,IP1),同时控制器保留原VTEP IP,只是原VTEP IP不下发设备而已。控制器向正常的SDNGW设备下发新的VTEP IP,下发到设备上后,对应配置的为evpn edge group IP1。后面流程里,正常的SDNGW设备会以IP1与OVS主机建立隧道。
隔离故障设备后,控制器上删除vBGP与故障设备之间的l2vpn evpn邻居,以免受到故障设备发来的bgp路由的影响。
步骤3、SDNGW与vBGP之间相互通告3类路由。
例如,SDNGW上新增evpn edge group IP1配置后,会向vBGP通过3类路由通告IP1。同时,控制器上对于自己纳管的OVS主机,也通过vBGP以3类路由的形式向SDNGW通告VTEPIP(OVS主机IP)。
步骤4、控制器修改OVS主机流表,使其远端VTEP IP为SDNGW上新下发的VTEP IP。
步骤5、OVS主机建立到正常SDNGW的新隧道。
具体的,控制器收到SDNGW通告的3类路由后,会更新OVS主机上的流表,通过流表实现封装vxlan报文后隧道的远端VTEP为IP1。从而实现OVS主机到SDNGW IP1的新隧道建立。
步骤6、SDNGW以新的VTEP IP建立到OVS主机的隧道。
具体的,SDNGW上收到vBGP通告含OVS主机VTEP的3类路由后,以IP1作为Tunnelsource ip,以OVS主机的VTEP IP作为Tunnel destination ip,建立新的隧道。
由上可知,当OVS主机上的虚机流量需要到外网时,由于流表已按SDNGW上新的VTEP IP更改,隧道的远端为正常SDNGW上的IP,所以流量只能走正常的SDNGW上去解封装;当流量从SDNGW回OVS虚机时,由于设备上只能存在一条evpn edge group IP生效,所以SDNGW上原VTEP IP已经不生效,生效的是IP1,所以流量回OVS时,隧道的源为IP1。整个业务流量走新的隧道就完成了,并且完全隔离了故障设备的影响。
当故障的设备恢复,此时用户可以取消隔离,继续使用双活网关。取消隔离时,控制器删除临时加的VTEP IP1,继续使用原有的双活VTEP IP。往双活网关下发一次原有的VTEP IP,然后其他就流程按隔离前处理。
示例性的,参阅图3所示,为本申请实施例提供的一种故障处理装置的结构示意图,该装置应用于控制器,所述控制器纳管的组网包括用于负载分担的至少两个网关的网关集合,所述网关集合包括的各网关用第一IP地址,该装置包括:
第一发送单元30,用于在检测到所述网关集合中第一网关故障时,向所述网关集合中除所述第一网关之外的第二网关下发第二IP地址;
第二发送单元31,用于向所述第二网关发送携带OVS主机IP地址的路由通告,并接收所述第二网关发送的携带所述第二IP地址的路由通告;
更新单元32,用于将所述OVS主机上隧道目的IP地址为所述第一IP地址的表项的隧道目的IP地址更新为所述第二IP地址。
可选地,在检测到所述网关集合中第一网关故障时,向所述网关集合中除所述第一网关之外的第二网关下发第二IP地址时,所述第一发送单元30具体用于:
在检测到与所述网关集合中第一网关之间的连接断开后,提示用户输入第二IP地址;
基于用户输入的第二IP地址,向所述第二网关下发携带所述第二IP地址的配置。
可选地,将所述OVS主机上隧道目的IP地址为所述第一IP地址的表项的隧道目的IP地址更新为所述第二IP地址时,所述更新单元32具体用于:
向所述OVS主机发送OVS流表修改指令,以使得所述OVS主机在接收到所述OVS流表修改指令后,将本地流表中隧道目的IP地址为所述第一IP地址的表项的隧道目的IP地址由所述第一IP地址更新为所述第二IP地址。
可选地,将所述OVS主机上隧道目的IP地址为所述第一IP地址的表项的隧道目的IP地址更新为所述第二IP地址时,所述更新单元32具体用于:
向所述OVS主机发送用于替换所述OVS主机上隧道目的IP地址为所述第一IP地址的表项的OVS流表,以使得所述OVS主机在接收到该OVS流表后,将本地流表中隧道目的IP地址为所述第一IP地址的表项替换为该OVS流表。
可选地,所述装置还包括:
隔离单元,用于隔离故障的所述第一网关。
以上这些单元可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(Application Specific Integrated Circuit,简称ASIC),或,一个或多个微处理器(digital singnal processor,简称DSP),或,一个或者多个现场可编程门阵列(Field Programmable Gate Array,简称FPGA)等。再如,当以上某个单元通过处理元件调度程序代码的形式实现时,该处理元件可以是通用处理器,例如中央处理器(CentralProcessing Unit,简称CPU)或其它可以调用程序代码的处理器。再如,这些单元可以集成在一起,以片上系统(system-on-a-chip,简称SOC)的形式实现。
进一步地,本申请实施例提供的故障处理装置,从硬件层面而言,所述故障处理装置的硬件架构示意图可以参见图4所示,所述故障处理装置可以包括:存储器40和处理器41,
存储器40用于存储程序指令;处理器41调用存储器40中存储的程序指令,按照获得的程序指令执行上述方法实施例。具体实现方式和技术效果类似,这里不再赘述。
可选地,本申请还提供一种控制器,包括用于执行上述方法实施例的至少一个处理元件(或芯片)。
可选地,本申请还提供一种程序产品,例如计算机可读存储介质,该计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令用于使该计算机执行上述方法实施例。
这里,机器可读存储介质可以是任何电子、磁性、光学或其它物理存储装置,可以包含或存储信息,如可执行指令、数据,等等。例如,机器可读存储介质可以是:RAM(RadomAccess Memory,随机存取存储器)、易失存储器、非易失性存储器、闪存、存储驱动器(如硬盘驱动器)、固态硬盘、任何类型的存储盘(如光盘、dvd等),或者类似的存储介质,或者它们的组合。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机,计算机的具体形式可以是个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件收发设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任意几种设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可以由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其它可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其它可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
而且,这些计算机程序指令也可以存储在能引导计算机或其它可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或者多个流程和/或方框图一个方框或者多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其它可编程数据处理设备上,使得在计算机或者其它可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其它可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述仅为本申请的较佳实施例而已,并不用以限制本申请,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请保护的范围之内。

Claims (10)

1.一种故障处理方法,其特征在于,应用于控制器,所述控制器纳管的组网包括用于负载分担的至少两个网关的网关集合,所述网关集合包括的各网关用第一IP地址,所述方法包括:
在检测到所述网关集合中第一网关故障时,向所述网关集合中除所述第一网关之外的第二网关下发第二IP地址;
向所述第二网关发送携带OVS主机IP地址的路由通告,并接收所述第二网关发送的携带所述第二IP地址的路由通告;
将所述OVS主机上隧道目的IP地址为所述第一IP地址的表项的隧道目的IP地址更新为所述第二IP地址。
2.如权利要求1所述的方法,其特征在于,在检测到所述网关集合中第一网关故障时,向所述网关集合中除所述第一网关之外的第二网关下发第二IP地址的步骤包括:
在检测到与所述网关集合中第一网关之间的连接断开后,提示用户输入第二IP地址;
基于用户输入的第二IP地址,向所述第二网关下发携带所述第二IP地址的配置。
3.如权利要求1所述的方法,其特征在于,将所述OVS主机上隧道目的IP地址为所述第一IP地址的表项的隧道目的IP地址更新为所述第二IP地址的步骤包括:
向所述OVS主机发送OVS流表修改指令,以使得所述OVS主机在接收到所述OVS流表修改指令后,将本地流表中隧道目的IP地址为所述第一IP地址的表项的隧道目的IP地址由所述第一IP地址更新为所述第二IP地址。
4.如权利要求1所述的方法,其特征在于,将所述OVS主机上隧道目的IP地址为所述第一IP地址的表项的隧道目的IP地址更新为所述第二IP地址的步骤包括:
向所述OVS主机发送用于替换所述OVS主机上隧道目的IP地址为所述第一IP地址的表项的OVS流表,以使得所述OVS主机在接收到该OVS流表后,将本地流表中隧道目的IP地址为所述第一IP地址的表项替换为该OVS流表。
5.如权利要求1所述的方法,其特征在于,所述方法还包括:
隔离故障的所述第一网关。
6.一种故障处理装置,其特征在于,应用于控制器,所述控制器纳管的组网包括用于负载分担的至少两个网关的网关集合,所述网关集合包括的各网关用第一IP地址,所述装置包括:
第一发送单元,用于在检测到所述网关集合中第一网关故障时,向所述网关集合中除所述第一网关之外的第二网关下发第二IP地址;
第二发送单元,用于向所述第二网关发送携带OVS主机IP地址的路由通告,并接收所述第二网关发送的携带所述第二IP地址的路由通告;
更新单元,用于将所述OVS主机上隧道目的IP地址为所述第一IP地址的表项的隧道目的IP地址更新为所述第二IP地址。
7.如权利要求6所述的装置,其特征在于,在检测到所述网关集合中第一网关故障时,向所述网关集合中除所述第一网关之外的第二网关下发第二IP地址时,所述第一发送单元具体用于:
在检测到与所述网关集合中第一网关之间的连接断开后,提示用户输入第二IP地址;
基于用户输入的第二IP地址,向所述第二网关下发携带所述第二IP地址的配置。
8.如权利要求6所述的装置,其特征在于,将所述OVS主机上隧道目的IP地址为所述第一IP地址的表项的隧道目的IP地址更新为所述第二IP地址时,所述更新单元具体用于:
向所述OVS主机发送OVS流表修改指令,以使得所述OVS主机在接收到所述OVS流表修改指令后,将本地流表中隧道目的IP地址为所述第一IP地址的表项的隧道目的IP地址由所述第一IP地址更新为所述第二IP地址。
9.如权利要求6所述的装置,其特征在于,将所述OVS主机上隧道目的IP地址为所述第一IP地址的表项的隧道目的IP地址更新为所述第二IP地址时,所述更新单元具体用于:
向所述OVS主机发送用于替换所述OVS主机上隧道目的IP地址为所述第一IP地址的表项的OVS流表,以使得所述OVS主机在接收到该OVS流表后,将本地流表中隧道目的IP地址为所述第一IP地址的表项替换为该OVS流表。
10.如权利要求6所述的装置,其特征在于,所述装置还包括:
隔离单元,用于隔离故障的所述第一网关。
CN202210379132.4A 2022-04-12 2022-04-12 一种故障处理方法及装置 Pending CN115037602A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210379132.4A CN115037602A (zh) 2022-04-12 2022-04-12 一种故障处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210379132.4A CN115037602A (zh) 2022-04-12 2022-04-12 一种故障处理方法及装置

Publications (1)

Publication Number Publication Date
CN115037602A true CN115037602A (zh) 2022-09-09

Family

ID=83119871

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210379132.4A Pending CN115037602A (zh) 2022-04-12 2022-04-12 一种故障处理方法及装置

Country Status (1)

Country Link
CN (1) CN115037602A (zh)

Similar Documents

Publication Publication Date Title
CN107809367B (zh) 一种sdn网络的设备上线方法及sdn控制器、网络设备
AU2004306913B2 (en) Redundant routing capabilities for a network node cluster
CN110417569B (zh) 一种网络链路故障处理方法和隧道端点设备
CN111092813B (zh) 一种等价多路径ecmp切换方法、网络设备及系统
US20110249679A1 (en) Method for implementing fast reroute
EP2974166B1 (en) Method and apparatus for ip/mpls fast reroute
WO2017193966A1 (zh) 一种存储系统中业务的链路切换方法和存储设备
CN112104478B (zh) 一种链路切换方法、装置、设备及机器可读存储介质
CN112702773B (zh) 一种通信方法及装置
WO2020030000A1 (zh) 容灾切换方法、相关设备及计算机存储介质
CN110708275B (zh) 一种协议报文的处理方法和装置
US20220103425A1 (en) Systems and methods for convergence of network traffic after an interruption of a network device's link
CN109815065B (zh) 双机的主备切换方法、装置、电子设备
CN105939215A (zh) Vrrp备份组状态切换的方法及装置
CN106209634B (zh) 地址映射关系的学习方法及装置
CN115037602A (zh) 一种故障处理方法及装置
CN110603798B (zh) 一种提供具有高可用性的弹性一致性平台的系统和方法
US10110474B2 (en) Updating interface list of multi-link group
CN107181678B (zh) 一种路由收敛的方法及装置
US10516625B2 (en) Network entities on ring networks
US20070233867A1 (en) Method and apparatus for preserving MAC addresses across a reboot
US11522749B2 (en) Detecting communication pathways affected by session flaps
US9769059B2 (en) Fast interlayer forwarding
WO2017000845A1 (zh) 一种流量控制方法及装置
CN111130871B (zh) 保护切换方法、装置和网络设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination