CN111970153A - 基于虚拟网关的故障隔离方法、装置及相关设备 - Google Patents

基于虚拟网关的故障隔离方法、装置及相关设备 Download PDF

Info

Publication number
CN111970153A
CN111970153A CN202010846852.8A CN202010846852A CN111970153A CN 111970153 A CN111970153 A CN 111970153A CN 202010846852 A CN202010846852 A CN 202010846852A CN 111970153 A CN111970153 A CN 111970153A
Authority
CN
China
Prior art keywords
virtual gateway
gateway node
service flow
service
current virtual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010846852.8A
Other languages
English (en)
Inventor
丁利锋
魏宇涛
胡迎东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Construction Bank Corp
Original Assignee
China Construction Bank Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Construction Bank Corp filed Critical China Construction Bank Corp
Priority to CN202010846852.8A priority Critical patent/CN111970153A/zh
Publication of CN111970153A publication Critical patent/CN111970153A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0663Performing the actions predefined by failover planning, e.g. switching to standby network elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/24Traffic characterised by specific attributes, e.g. priority or QoS
    • H04L47/2441Traffic characterised by specific attributes, e.g. priority or QoS relying on flow classification, e.g. using integrated services [IntServ]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明实施例提供一种基于虚拟网关的故障隔离方法、装置及相关设备,涉及混合云部署系统运维领域。其中,所述故障隔离方法应用于各虚拟网关节点上,所述虚拟网关节点以多活、无状态集群方式部署,对每一个虚拟网关节点,分别执行下述操作:获取流经当前虚拟网关节点的各业务流,以及各业务流的源IP和目的IP;根据各业务流的源IP和目的IP获取各业务流的服务质量策略;探测流经当前虚拟网关节点的流量是否超过设定阈值,若超过,则根据各业务流的服务质量策略进行限流处理。采用本发明提供的基于虚拟网关的故障隔离方法,可以将故障产生的业务影响最小化,减小对其他正常业务的影响。

Description

基于虚拟网关的故障隔离方法、装置及相关设备
技术领域
本发明涉及混合云部署系统运维领域,特别涉及一种基于虚拟网关的故障隔离方法、装置及相关设备。
背景技术
现有的大型混合云部署系统中,用户本地数据中心和云上数据中心的业务系统往往具有复杂的拓扑结构。一条业务流可能会使用多个不同的业务系统,多个云产品也存在资源共享、耦合度较高、部署方式交集中的特点。
虚拟网关是云网络架构中普遍存在的重要组件,不同云网络之间的通信主要靠虚拟网关进行连接。依赖于虚拟网关的相关云产品的运行状态和许多网络故障都与虚拟网关密不可分。如何将虚拟网关节点出现的故障进行隔离,将业务影响最小化具有重要意义。
发明内容
本发明实施方式提供了一种基于虚拟网关的故障隔离方法、装置及相关设备,以对虚拟网关节点出现的故障进行隔离,将故障对业务的影响最小化。
一方面,本发明实施方式提供一种基于虚拟网关的故障隔离方法,所述方法应用于各虚拟网关节点上,所述虚拟网关节点以多活、无状态集群方式部署,对集群中的每一个虚拟网关节点,分别执行下述处理:
获取流经当前虚拟网关节点的各业务流,以及各业务流的源IP和目的IP;
根据各业务流的源IP和目的IP获取各业务流的服务质量策略;
探测流经当前虚拟网关节点的流量是否超过设定阈值,若超过,则根据各业务流的服务质量策略进行限流处理。
在本发明的一种实施方式中,所述服务质量策略包括服务优先级,所述根据各业务流的服务质量策略进行限流处理包括:
对服务优先级低于设定阈值的业务流进行限流处理。
在本发明的一种实施方式中,所述方法还包括:
探测当前虚拟网关节点的健康状态;
在当前虚拟网关节点处于不健康状态时,将当前虚拟网关节点从其所属的虚拟网关集群中移除,以使所述虚拟网关集群的其他节点转发所述业务流,其中,所述不健康状态包括:当前虚拟网关节点硬件故障、当前虚拟网关节点软件程序运行异常、当前虚拟网关节点系统运行状态异常、系统日志报错、当前虚拟网关节点带宽负载超过设定阈值、当前虚拟网关节点的资源占用率超过设定阈值。
在本发明的一种实施方式中,所述方法还包括:
根据各业务流的源IP和目的IP获取各业务流发生指定类型错误的错误阈值;
探测各业务流在设定时间段内发生所述指定类型错误的错误次数;
检测各业务流的错误次数是否大于其错误阈值,若大于,则丢弃错误次数大于错误阈值的业务流的数据包。
在本发明的一种实施方式中,所述方法还包括:
根据各业务流的源IP和目的IP获取各业务流的路由策略;
根据各业务流的路由策略将各业务流转发给其路由策略中指定的虚拟网关节点。
在本发明的一种实施方式中,所述方法还包括:
将当前虚拟网关节点的故障信息发送给前端管理系统,以使前端管理系统根据当前虚拟网关节点的故障信息更新显示在网络拓扑结构图中的当前虚拟网关节点的健康状态,其中,所述网络拓扑结构图以图示的方式展示各虚拟网关节点之间的拓扑关系以及各虚拟网关节点的健康状态。
另一方面,本发明实施方式提供一种基于虚拟网关的故障处理装置,其中,对各虚拟网关节点分别部署所述故障处理装置,所述虚拟网关节点以多活、无状态集群方式部署,所述故障处理装置包括:
业务流获取模块,用于获取流经当前虚拟网关节点的各业务流,以及各业务流的源IP和目的IP;
服务质量策略获取模块,用于根据各业务流的源IP和目的IP获取各业务流的服务质量策略;
第一故障处理模块,用于探测流经当前虚拟网关节点的流量是否超过设定阈值,若超过,则根据各业务流的服务质量策略进行限流处理。
在本发明的一种实施方式中,所述服务质量策略包括服务优先级,所述根据各业务流的服务质量策略进行限流处理包括:
对服务优先级低于设定阈值的业务流进行限流处理。
在本发明的一种实施方式中,所述故障处理装置还包括:
健康状态获取模块,用于探测当前虚拟网关节点的健康状态;
第二故障处理模块,用于在当前虚拟网关节点处于不健康状态时,将当前虚拟网关节点从其所属的虚拟网关集群中移除,以使所述虚拟网关集群的其他节点转发所述业务流,其中,所述不健康状态包括:当前虚拟网关节点硬件故障、当前虚拟网关节点软件程序运行异常、当前虚拟网关节点系统运行状态异常、系统日志报错、当前虚拟网关节点带宽负载超过设定阈值、当前虚拟网关节点的资源占用率超过设定阈值。
在本发明的一种实施方式中,所述故障处理装置还包括:
错误阈值获取模块,用于根据各业务流的源IP和目的IP获取各业务流发生指定类型错误的错误阈值;
错误次数探测模块,用于探测各业务流在设定时间段内发生所述指定类型错误的错误次数;
第三故障处理模块,用于检测各业务流的错误次数是否大于其错误阈值,若大于,则丢弃错误次数大于错误阈值的业务流的数据包。
在本发明的一种实施方式中,所述故障处理装置还包括:
路由策略获取模块,用于根据各业务流的源IP和目的IP获取各业务流的路由策略;
路由模块,用于根据各业务流的路由策略将各业务流转发给其路由策略中指定的虚拟网关节点。
在本发明的一种实施方式中,所述故障处理装置还包括:
故障信息发送模块,用于将当前虚拟网关节点的故障信息发送给前端管理系统,以使前端管理系统根据当前虚拟网关节点的故障信息更新显示在网络拓扑结构图中的当前虚拟网关节点的健康状态,其中,所述网络拓扑结构图以图示的方式展示各虚拟网关节点之间的拓扑关系以及各虚拟网关节点的健康状态。
再一方面,本发明实施方式提供一种计算机可读存储介质,其上存储有计算机可读指令,该计算机可读指令可以被处理器执行以实现上述任意一种实施方式所述的故障隔离方法。
又一方面,本发明实施方式提供一种计算机设备,其特征在于,包括:
存储器,其上存储有计算机程序;
处理器,用于执行所述计算机程序以实现上述任意一种实施方式所述的故障隔离方法。
相比于现有技术而言,本发明实施方式提供的基于虚拟网关的故障隔离方法、装置及相关设备具有如下有益技术效果:
本发明实施方式通过获取流经当前虚拟网关节点的各业务流,以及各业务流的源IP和目的IP,根据各业务流的源IP和目的IP获取各业务流的服务质量策略,根据各业务流的服务质量策略进行限流处理,可以为重要租户或关键业务的业务流提供足够的资源,保证重要租户或关键业务的重要业务流安全通过,从而达到隔离故障,将业务影响最小化的目的。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简要的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例的附图,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例一的故障隔离方法的方法流程图;
图2是本发明实施例二的故障隔离方法的方法流程图;
图3是本发明实施例三的故障隔离方法的方法流程图;
图4是本发明实施例四的故障隔离方法的方法流程图;
图5是本发明实施例六的故障处理装置的模块示意图。
具体实施方式
为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方案对上述方案进行详细的说明。
实施例一
本实施例所述的虚拟网关的故障隔离方法应用于虚拟网关集群的各虚拟网关节点上。所述虚拟网关节点以多活、无状态集群方式部署,并与上联交换机建立协议链接。图1示出了根据本发明实施例一的基于虚拟网关的故障隔离方法的流程图。下面以对一个虚拟网关节点的进行故障隔离为例,对本实施例所述的故障隔离方法进行详细说明。如图1所示,本实施例所述的基于虚拟网关的故障隔离方法包括:
S101:获取流经当前虚拟网关节点的各业务流,以及各业务流的源IP和目的IP。
S102:根据各业务流的源IP和目的IP获取各业务流的服务质量策略。
S103:探测流经当前虚拟网关节点的流量是否超过设定阈值,若超过,则根据各业务流的服务质量策略进行限流处理。
其中,可以对各虚拟网关节点分别执行本实施例所述的故障隔离方法。
具体而言,一条业务流可以由该业务流的源IP和目的IP唯一标识。可以在虚拟网关节点上利用TcpDump(dump the traffic on a network,一种根据对网络上的数据包进行截获的包分析工具)截获流经当前虚拟网关节点的业务网卡实时数据包,基于源IP、目的IP等信息对不同业务系统的流量进行标记区分,从而获取流经当前虚拟网关节点的各业务流以及各业务流的源IP和目的IP。
在本实施例中,可以预先对不同业务流设置不同的服务质量策略,并保存在配置文件中,以各业务流的源IP和目的IP的组合作为各业务流的标识。在获取了业务流的源IP和目的IP后,可以根据各业务流的源IP和目的IP从所述配置文件中获取各业务流的服务质量策略。
在本实施例中,可以在当前虚拟网关节点上部署限流开关,在当前虚拟网关节点的流量超过设定阈值时,开启所述限流开关。所述限流开关开启后,可以根据各业务流的服务质量策略进行限流处理,以防止当前虚拟网关节点由于负载过大而夯死。
进一步地,所述服务质量策略中可以包括服务优先级。对于重要租户或关键业务的业务流,可以为其设置较高的服务优先级。在限流开关开启后,可以根据各业务流的服务优先级,对服务优先级低于设定阈值的业务流进行限流,从而为重要租户或关键业务的业务流提供足够的资源,保证重要业务流安全通过,从而达到隔离故障,将业务影响最小化的目的。
例如,可以按照核心功能、重要功能、非关键功能将业务流的服务优先级分为,高、中、低三个等级。在当前虚拟网关节点的流量超过设定阈值时,即当前虚拟网关节点的负载过高时,对服务优先级为低的业务流进行限流,从而保证核心功能和重要功能业务系统的业务流不受影响。
进一步的,如果某个大流量的业务流的服务优先级未知,例如,根据业务流的源IP和目的IP从配置文件中无法查找到该业务流的服务优先级,则可以对该业务流进行限流,以避免突发流量或恶意流量的攻击。
实施例二
图2示出了根据本发明实施例三的故障隔离方法的流程示意图。如图2所示,除了实施例一所述的故障隔离方法之外,本实施例所述的故障隔离方法还包括:
S201:探测当前虚拟网关节点的健康状态。
S202:在当前虚拟网关节点处于不健康状态时,将当前虚拟网关节点从其所属的虚拟网关集群中移除,以使所述虚拟网关集群的其他节点转发所述业务流,其中,所述不健康状态包括:当前虚拟网关节点硬件故障、当前虚拟网关节点软件程序运行异常、当前虚拟网关节点系统运行状态异常、系统日志报错、当前虚拟网关节点带宽负载超过设定阈值、当前虚拟网关节点的资源占用率超过设定阈值。
其中,所述虚拟网关集群为多活集群,同一集群内的虚拟网关节点类型相同。集群中的各虚拟网关节点通过OSPF(Open Shortest Path First,开放式最短路径优先)或者VRRP((Virtual Router Redundancy Protocol,虚拟路由冗余协议)协议与上联交换机建立邻居关系。可以对集群中的各虚拟网关节点可以分别执行本实施例所述的方法。
具体而言,各业务系统之间的正常通信强依赖于业务系统上所部署的虚拟网关节点的运行健康性。如果某个虚拟网关节点出现软件或硬件故障,则该虚拟网关节点可能无法正常转发流经该节点的正常流量,从而影响其他产品的正常功能。
为解决上述问题,本实施例在各虚拟网关节点上分别部署操作系统、软件、硬件等健康检查监控程序。所述健康检查监控程序可以周期性的探测当前虚拟网关节点的健康状态。在当前虚拟网关节点的硬件或软件出现故障时,该健康检查监控程序可以通过关闭OSPF或者VRRP协议来断开当前虚拟网关节点与上联交换机的邻居关系,从而将当前虚拟网关节点从其所在的多活集群中移除。在当前虚拟网关节点从其所在的多活集群中移除后,该多活集群会自动将当前虚拟网关节点的业务流切换到该集群内的其他虚拟网关节点转发。
通过上述方式,本实施例可以将不可用的虚拟网关节点从其所属的集群中剔除,可以防止单一节点故障对整体业务的影响。
实施例三
图3示出了根据本发明实施例二的故障隔离方法的流程示意图。如图3所示,除实施例一、实施例二所述的故障隔离方法外,本实施例所述的方法还包括:
S301:根据各业务流的源IP和目的IP获取各业务流发生指定类型错误的错误阈值。
S302:探测各业务流在设定时间段内发生所述指定类型错误的错误次数。
S303:检测各业务流的错误次数是否大于其错误阈值,若大于,则丢弃错误次数大于错误阈值的业务流的数据包。
其中,可以对虚拟网关集群中的各虚拟网关节点分别执行本实施例所述的方法。
具体而言,各业务流对于通信质量的敏感程度不同。当某个业务流出现大量重传、重发、乱序、丢包等异常现象时,会浪费大量的系统资源和网络带宽,并会造成阻塞和更大的故障。
为解决上述问题,本实施例可以为不同的业务流预先指定其错误类型和错误阈值(即,在设定时间段内发生错误的类型以及该错误发生的最大次数),并存储在配置文件中,以各业务流的源IP和目的IP的组合作为各业务流的标识。在获取到各业务流后,可以根据各业务流的源IP和目的IP获取各业务流的错误类型和错误阈值,同时对各业务流的数据包进行分析,获取各业务流发生器指定类型错误的次数。所述指定类型的错误包括但不限于:TCP Dup Ack(重发)、TCP Retransmission(重传)、TCP Out-Of-Order(乱序)、TCPPrevious segment not captured(丢包)等。如果某个业务流在设定时间段内发生其指定类型错误的错误次数超过其错误阈值,则表明该业务流存在大量重传、重发、乱序或丢包等异常现象,可以开启该虚拟网关节点的断路器,所述断路器开启后会丢弃该业务流的数据包,避免造成阻塞和更大的故障。其中,可以预先为各虚拟网关节点分别设置断路器。通过这种方式,本实施例可以避免故障扩大化,减少对其他业务流的影响。
进一步地,断路器会检查该业务流接下来的每一个数据包,如果设定时间段内该业务流的数据包均正常,则该断路器可以关闭。断路器关闭后,可以使该业务流正常通过。
可以理解的是,本发明实施例一、二、三所述的故障隔离方法可以同时执行,也可以轮询执行,在此本发明不做限定。
实施例四
图4示出了根据本发明实施例三的故障隔离方法的流程示意图。如图4所示,除实施例一、实施例二、实施例三所述的故障隔离方法外,本实施例所述的方法还包括:
S401:根据各业务流的源IP和目的IP获取各业务流的路由策略。
S402:将各业务流转发给其路由策略中指定的虚拟网关节点。
其中,可以对各虚拟网关节点分别实行本实施例所述的故障隔离方法。
具体而言,可以为不同的业务流预先指定路由策略,并存储在配置文件中,以各业务流的源IP和目的IP的组合作为各业务流的标识。其中,所述路由策略中可以包括所述业务流的路由优先级,并可以指定业务流的下一虚拟网关节点。
在获取各业务流的源IP和目的IP后,可以根据各业务流的源IP和目的IP从配置文件中获取各业务流的路由策略,从路由策略中获取各业务流的路由优先级,并根据各业务流的路由优先级将各业务流转发给其路由策略中指定的虚拟网关节点。
通过上述方法,可以为不同租户、不同业务系统的业务流指定具体的传输路径,各路径之间相互隔离,从而使不同租户、不同业务系统的业务流所使用的网关资源分离,当部分网关资源故障时,只影响部分用户和产品,而不对全体用户和产品产生影响。
实施例五
除了实施例一、实施例二、实施例三、实施例四所述的故障隔离方法之外,本实施例所述的故障隔离方法还包括:
将当前虚拟网关节点的故障信息发送给前端管理系统,以使前端管理系统根据当前虚拟网关节点的故障信息更新显示在网络拓扑结构图中的当前虚拟网关节点的健康状态,其中,所述网络拓扑结构图以图示的方式展示各虚拟网关节点之间的拓扑关系以及各虚拟网关节点的健康状态。
具体而言,前端管理系统可以获取各虚拟网关节点的设备信息、拓扑关系和故障信息。根据各虚拟网关节点之间的拓扑关系和故障状态生成网络拓扑结构图,并将所述网络拓扑结构图显示用户界面,以向运维人员展示各虚拟网关节点之间的拓扑关系和健康状态。例如,可以将网络拓扑结构图中的正常虚拟网关节点显示为绿色,将故障虚拟网关节点显示为红色。从而,运维人员可以通过用户界面上显示的网络拓扑结构图直观的区分正常虚拟网关节点和故障虚拟网关节点,迅速定位故障点。
进一步地,可以在各虚拟网关节点分别部署监听接口,所述监听接口可以采用Web服务的方式实现,并负责收集其虚拟网关节点的故障信息,所述故障信息包括但不限于:健康指标、健康状态、异常现象等。在当前虚拟网关节点发生故障时,可以通过当前虚拟网关节点的监听接口将当前虚拟网关节点的故障信息发送给前端管理系统。前端管理系统接收到故障信息后,可以及时更新邻居关系结构图中相应虚拟网关节点的相应健康指标的健康状态。
进一步地,在更新虚拟网关节点的健康状态时,前端管理系统还可以发送邮件或短信告警通知给相关运维人员,以便运维人员迅速处理故障。
实施例六
本实施例提供一种基于虚拟网关的故障处理装置,可以在各虚拟网关节点分别部署本实施例所述的故障处理装置,各虚拟网关节点以多活、无状态集群方式部署。图5示出了根据本发明实施例六的故障处理装置的模块示意图。如图5所示,本实施例的故障处理装置装置100包括:
业务流获取模块11,用于获取流经当前虚拟网关节点的各业务流,以及各业务流的源IP和目的IP;
服务质量策略获取模块21,用于根据各业务流的源IP和目的IP获取各业务流的服务质量策略;
第一故障处理模块22,用于探测流经当前虚拟网关节点的流量是否超过设定阈值,若超过,则根据各业务流的服务质量策略进行限流处理。
在本实施例的一种实现方式中,所述服务质量策略包括服务优先级,所述根据各业务流的服务质量策略进行限流处理包括:
对服务优先级低于设定阈值的业务流进行限流处理。
进一步地,所述装置还包括:
健康状态获取模块31,用于探测当前虚拟网关节点的健康状态;
第二故障处理模块32,用于在当前虚拟网关节点处于不健康状态时,将当前虚拟网关节点从其所属的虚拟网关集群中移除,以使所述虚拟网关集群的其他节点转发所述业务流,其中,所述不健康状态包括:当前虚拟网关节点硬件故障、当前虚拟网关节点软件程序运行异常、当前虚拟网关节点系统运行状态异常、系统日志报错、当前虚拟网关节点带宽负载超过设定阈值、当前虚拟网关节点的资源占用率超过设定阈值。
进一步地,所述装置还包括:
错误阈值获取模块41,用于根据各业务流的源IP和目的IP获取各业务流发生指定类型错误的错误阈值;
错误次数探测模块42,用于探测各业务流在设定时间段内发生所述指定类型错误的错误次数;
第三故障处理模块43,用于检测各业务流的错误次数是否大于其错误阈值,若大于,则丢弃错误次数大于错误阈值的业务流的数据包。
进一步地,所述装置还包括:
路由策略获取模块51,用于根据各业务流的源IP和目的IP获取各业务流的路由策略;
路由模块52,用于根据各业务流的路由策略将各业务流转发给其路由策略中指定的虚拟网关节点。
进一步地,所述装置还包括:
故障信息发送模块61,用于将当前虚拟网关节点的故障信息发送给前端管理系统200,以使前端管理系统根据当前虚拟网关节点的故障信息更新显示在网络拓扑结构图中的当前虚拟网关节点的健康状态,其中,所述网络拓扑结构图以图示的方式展示各虚拟网关节点之间的拓扑关系以及各虚拟网关节点的健康状态。
本实施例所述的故障处理装置用于实现上述方法实施例所述的故障隔离方法,其处理流程和处理方式可参见上述方法实施例的对应过程,在此不再赘述。
通过以上的实施例的描述,本领域的技术人员可以清楚地了解到本发明可借助软件结合硬件平台的方式来实现。基于这样的理解,本发明的技术方案对背景技术做出贡献的全部或者部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施方式的某些部分所述的方法。
实施例七
本实施例提供一种计算机存储介质,如硬盘、光盘、闪存、软盘、磁带等,其上存储有计算机可读指令,该计算机可读指令能够被处理器执行以实现上述实施例所述的基于虚拟网关的故障隔离方法。
实施例八
本实施例提供一种计算机设备,包括:
存储器,其上存储有计算机程序,
处理器,其可以执行所述计算机程序以实现上述实施例所述的基于虚拟网关的故障隔离方法。
本说明书中使用的术语和措辞仅仅为了举例说明,并不意味构成限定。本领域技术人员应当理解,在不脱离所公开的实施方式的基本原理的前提下,对上述实施方式中的各细节可进行各种变化。因此,本发明的保护范围只由权利要求确定,在权利要求中,除非另有说明,所有的术语应按最宽泛合理的意思进行理解。

Claims (14)

1.一种基于虚拟网关的故障隔离方法,其特征在于,所述方法应用于各虚拟网关节点上,所述虚拟网关节点以多活、无状态集群方式部署,对集群中的每一个虚拟网关节点,分别执行下述处理:
获取流经当前虚拟网关节点的各业务流,以及各业务流的源IP和目的IP;
根据各业务流的源IP和目的IP获取各业务流的服务质量策略;
探测流经当前虚拟网关节点的流量是否超过设定阈值,若超过,则根据各业务流的服务质量策略进行限流处理。
2.根据权利要求1所述的故障隔离方法,其特征在于,所述服务质量策略包括服务优先级,所述根据各业务流的服务质量策略进行限流处理包括:
对服务优先级低于设定阈值的业务流进行限流处理。
3.根据权利要求1所述故障隔离方法,其特征在于,所述方法还包括:
探测当前虚拟网关节点的健康状态;
在当前虚拟网关节点处于不健康状态时,将当前虚拟网关节点从其所属的虚拟网关集群中移除,以使所述虚拟网关集群的其他节点转发所述业务流,其中,所述不健康状态包括:当前虚拟网关节点硬件故障、当前虚拟网关节点软件程序运行异常、当前虚拟网关节点系统运行状态异常、系统日志报错、当前虚拟网关节点带宽负载超过设定阈值、当前虚拟网关节点的资源占用率超过设定阈值。
4.根据权利要求1所述的故障隔离方法,其特征在于,所述方法还包括:
根据各业务流的源IP和目的IP获取各业务流发生指定类型错误的错误阈值;
探测各业务流在设定时间段内发生所述指定类型错误的错误次数;
检测各业务流的错误次数是否大于其错误阈值,若大于,则丢弃错误次数大于错误阈值的业务流的数据包。
5.根据权利要求1所述的故障隔离方法,其特征在于,所述方法还包括:
根据各业务流的源IP和目的IP获取各业务流的路由策略;
根据各业务流的路由策略将各业务流转发给其路由策略中指定的虚拟网关节点。
6.根据权利要求1所述的故障隔离方法,其特征在于,所述方法还包括:
将当前虚拟网关节点的故障信息发送给前端管理系统,以使前端管理系统根据当前虚拟网关节点的故障信息更新显示在网络拓扑结构图中的当前虚拟网关节点的健康状态,其中,所述网络拓扑结构图以图示的方式展示各虚拟网关节点之间的拓扑关系以及各虚拟网关节点的健康状态。
7.一种基于虚拟网关的故障处理装置,其特征在于,对各虚拟网关节点分别部署所述故障处理装置,所述虚拟网关节点以多活、无状态集群方式部署,所述故障处理装置包括:
业务流获取模块,用于获取流经当前虚拟网关节点的各业务流,以及各业务流的源IP和目的IP;
服务质量策略获取模块,用于根据各业务流的源IP和目的IP获取各业务流的服务质量策略;
第一故障处理模块,用于探测流经当前虚拟网关节点的流量是否超过设定阈值,若超过,则根据各业务流的服务质量策略进行限流处理。
8.根据权利要求7所述的故障处理装置,其特征在于,所述服务质量策略包括服务优先级,所述根据各业务流的服务质量策略进行限流处理包括:
对服务优先级低于设定阈值的业务流进行限流处理。
9.根据权利要求7所述故障处理装置,其特征在于,所述故障处理装置还包括:
健康状态获取模块,用于探测当前虚拟网关节点的健康状态;
第二故障处理模块,用于在当前虚拟网关节点处于不健康状态时,将当前虚拟网关节点从其所属的虚拟网关集群中移除,以使所述虚拟网关集群的其他节点转发所述业务流,其中,所述不健康状态包括:当前虚拟网关节点硬件故障、当前虚拟网关节点软件程序运行异常、当前虚拟网关节点系统运行状态异常、系统日志报错、当前虚拟网关节点带宽负载超过设定阈值、当前虚拟网关节点的资源占用率超过设定阈值。
10.根据权利要求7所述的故障处理装置,其特征在于,所述故障处理装置还包括:
错误阈值获取模块,用于根据各业务流的源IP和目的IP获取各业务流发生指定类型错误的错误阈值;
错误次数探测模块,用于探测各业务流在设定时间段内发生所述指定类型错误的错误次数;
第三故障处理模块,用于检测各业务流的错误次数是否大于其错误阈值,若大于,则丢弃错误次数大于错误阈值的业务流的数据包。
11.根据权利要求7所述的故障处理装置,其特征在于,所述故障处理装置还包括:
路由策略获取模块,用于根据各业务流的源IP和目的IP获取各业务流的路由策略;
路由模块,用于根据各业务流的路由策略将各业务流转发给其路由策略中指定的虚拟网关节点。
12.根据权利要求7所述的故障处理装置,其特征在于,所述故障处理装置还包括:
故障信息发送模块,用于将当前虚拟网关节点的故障信息发送给前端管理系统,以使前端管理系统根据当前虚拟网关节点的故障信息更新显示在网络拓扑结构图中的当前虚拟网关节点的健康状态,其中,所述网络拓扑结构图以图示的方式展示各虚拟网关节点之间的拓扑关系以及各虚拟网关节点的健康状态。
13.一种计算机可读存储介质,其特征在于,其上存储有计算机可读指令,该计算机可读指令可以被处理器执行以实现权利要求1-6中任意一项权利要求所述的方法。
14.一种计算机设备,其特征在于,包括:
存储器,其上存储有计算机程序;
处理器,用于执行所述计算机程序以实现权利要求1-6中任意一项权利要求所述的方法。
CN202010846852.8A 2020-08-21 2020-08-21 基于虚拟网关的故障隔离方法、装置及相关设备 Pending CN111970153A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010846852.8A CN111970153A (zh) 2020-08-21 2020-08-21 基于虚拟网关的故障隔离方法、装置及相关设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010846852.8A CN111970153A (zh) 2020-08-21 2020-08-21 基于虚拟网关的故障隔离方法、装置及相关设备

Publications (1)

Publication Number Publication Date
CN111970153A true CN111970153A (zh) 2020-11-20

Family

ID=73391071

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010846852.8A Pending CN111970153A (zh) 2020-08-21 2020-08-21 基于虚拟网关的故障隔离方法、装置及相关设备

Country Status (1)

Country Link
CN (1) CN111970153A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106789660A (zh) * 2017-03-31 2017-05-31 中国科学技术大学苏州研究院 软件定义网络中QoS可感知的流量管理方法
CN108306777A (zh) * 2018-04-20 2018-07-20 平安科技(深圳)有限公司 基于sdn控制器的虚拟网关主备切换方法及装置
CN109639754A (zh) * 2018-10-29 2019-04-16 南京南瑞继保电气有限公司 一种电网调度服务网关数据审计的实现方法
CN110191063A (zh) * 2019-06-13 2019-08-30 北京百度网讯科技有限公司 服务请求的处理方法、装置、设备及存储介质
CN110380986A (zh) * 2019-07-23 2019-10-25 中南民族大学 基于Zuul的流量限制方法、装置、设备及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106789660A (zh) * 2017-03-31 2017-05-31 中国科学技术大学苏州研究院 软件定义网络中QoS可感知的流量管理方法
CN108306777A (zh) * 2018-04-20 2018-07-20 平安科技(深圳)有限公司 基于sdn控制器的虚拟网关主备切换方法及装置
CN109639754A (zh) * 2018-10-29 2019-04-16 南京南瑞继保电气有限公司 一种电网调度服务网关数据审计的实现方法
CN110191063A (zh) * 2019-06-13 2019-08-30 北京百度网讯科技有限公司 服务请求的处理方法、装置、设备及存储介质
CN110380986A (zh) * 2019-07-23 2019-10-25 中南民族大学 基于Zuul的流量限制方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
US10142203B2 (en) Ethernet fault management systems and methods
US10454806B2 (en) SDN controller, data center system, and routing connection method
US8289839B2 (en) Scaling BFD sessions for neighbors using physical / sub-interface relationships
US8982710B2 (en) Ethernet operation and maintenance (OAM) with flexible forwarding
US8406143B2 (en) Method and system for transmitting connectivity fault management messages in ethernet, and a node device
EP2781063B1 (en) Rerouting technique
US9094297B2 (en) Wide area network monitoring
CN101159669A (zh) 一种业务流量切换方法及装置
KR20140072343A (ko) Sdn 망의 장애 대처 방법
JP2005295209A (ja) レイヤ2ループ検知システム
EP2553870B1 (en) An operations, administrations and management proxy and a method for handling operations, administrations and management messages
US20090310483A1 (en) Network device and link switching method
EP4142239A1 (en) Network performance monitoring and fault management based on wide area network link health assessments
EP3029883B1 (en) Network protection method and apparatus, next-ring node, and system
WO2011157149A2 (zh) 通信设备间的主备倒换方法、通信设备和系统及服务请求设备
US11336564B1 (en) Detection of active hosts using parallel redundancy protocol in software defined networks
US20230061491A1 (en) Improving efficiency and fault tolerance in a software defined network using parallel redundancy protocol
EP2129042B1 (en) A multicast network system, node and a method for detecting a fault of a multicast network link
JP2010239369A (ja) 通信ネットワークにおける通信装置およびその通信制御方法
US8929200B2 (en) Communication device, communication system, and communication method
CN112995002B (zh) 一种交换机环网的设计方法、交换机及存储介质
US8351324B2 (en) Analyzing service impacts on virtual private networks
CN111970153A (zh) 基于虚拟网关的故障隔离方法、装置及相关设备
CN115955690A (zh) 不良网络链路性能的基于无线信号强度的检测
US11750502B2 (en) Detection of in-band software defined network controllers using parallel redundancy protocol

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20201120

RJ01 Rejection of invention patent application after publication