CN114363342A - 故障收敛方法及其相关装置和负载均衡集群 - Google Patents

故障收敛方法及其相关装置和负载均衡集群 Download PDF

Info

Publication number
CN114363342A
CN114363342A CN202111650040.7A CN202111650040A CN114363342A CN 114363342 A CN114363342 A CN 114363342A CN 202111650040 A CN202111650040 A CN 202111650040A CN 114363342 A CN114363342 A CN 114363342A
Authority
CN
China
Prior art keywords
communication
communication device
fault
load balancing
connection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111650040.7A
Other languages
English (en)
Inventor
张致江
吴亮亮
张明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
iFlytek Co Ltd
Original Assignee
iFlytek Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by iFlytek Co Ltd filed Critical iFlytek Co Ltd
Priority to CN202111650040.7A priority Critical patent/CN114363342A/zh
Publication of CN114363342A publication Critical patent/CN114363342A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本申请公开了一种故障收敛方法及其相关装置和负载均衡集群,其中,故障收敛方法包括:第一通信设备通过预设连接协议与第二通信设备建立连接,且第一通信设备和第二通信设备的其中一者为负载均衡集群中的路由设备、另一者为负载均衡集群中的负载均衡节点;通过双向转发检测协议检测与第二通信设备是否存在通信故障;若检测到存在通信故障,则执行预设故障处理,其中,预设故障处理用于停止与存在通信故障的第二通信设备间的通信。上述方案,能够实现故障快速收敛。

Description

故障收敛方法及其相关装置和负载均衡集群
技术领域
本申请涉及网络通信技术领域,特别是涉及一种故障收敛方法及其相关装置和负载均衡集群。
背景技术
随着网络技术的快速发展,网络服务的质量要求成为主要关注点,用户对网络的响应时间和服务质量具有更高的要求。例如,在生产环境中,负载均衡集群是应用流量的入口,对应用的可靠性和性能起着决定性的作用。
目前,在集群之间进行通信过程中,当服务器集群出现单点故障后,故障恢复时间受限于路由协议的收敛时间,集群出现故障会严重影响业务系统的正常应用,路由器任将数据包发送到故障节点上,其会导致大量的连接出现异常,业务连接中断。由此,如何提高故障收敛的速度成为亟待解决的问题。
发明内容
本申请主要解决的技术问题是提供一种故障收敛方法及其相关装置和负载均衡集群,能够实现故障快速收敛。
为了解决上述技术问题,本申请第一方面提供了一种故障收敛方法,包括:第一通信设备通过预设连接协议与第二通信设备建立连接,且第一通信设备和第二通信设备的其中一者为负载均衡集群中的路由设备、另一者为负载均衡集群中的负载均衡节点;通过双向转发检测协议检测与第二通信设备是否存在通信故障;若检测到存在通信故障,则执行预设故障处理,其中,预设故障处理用于停止与存在通信故障的第二通信设备间的通信。
为了解决上述技术问题,本申请第二方面提供了一种故障收敛装置,包括连接模块、检测模块和处理模块;连接模块用于使第一通信设备通过预设连接协议与第二通信设备建立连接,且第一通信设备和第二通信设备的其中一者为负载均衡集群中的路由设备、另一者为负载均衡集群中的负载均衡节点;检测模块用于通过双向转发检测协议检测与第二通信设备是否存在通信故障;处理模块用于对通信故障进行处理,若检测到存在通信故障,则执行预设故障处理,其中,预设故障处理用于停止与存在通信故障的第二通信设备间的通信。
为了解决上述技术问题,本申请第三方面提供了一种通信设备,包括相互耦接的存储器和处理器,存储器中存储有程序指令,处理器用于执行程序指令以实现上述第一方面中的故障收敛方法。
为了解决上述技术问题,本申请第四方面提供了一种负载均衡集群,包括路由设备和若干负载均衡节点;且路由设备和负载均衡节点用于实现上述第一方面中的故障收敛方法。
为了解决上述技术问题,本申请第五方面提供了一种计算机可读存储介质,存储有能够被处理器运行的程序指令,所述程序指令用于实现上述第一方面中的故障收敛方法。
上述方案,第一通信设备通过预设连接协议与第二通信设备建立连接,且第一通信设备和第二通信设备的其中一者为负载均衡集群中的路由设备、另一者为负载均衡集群中的负载均衡节点;再通过双向转发检测协议检测与第二通信设备是否存在通信故障;若检测到存在通信故障,则执行预设故障处理,其中,预设故障处理用于停止与存在通信故障的第二通信设备间的通信。由于利用双向转发检测协议进行故障检测,且一旦检测到通信故障则执行预设故障处理,实现了毫秒级故障收敛,并且确保了通信过程的可靠性和业务的连续性。故此,能够实现故障快速收敛。
附图说明
图1是本申请故障收敛方法一实施例的流程示意图;
图2是图1中步骤S13一实施例的连接示意图;
图3是本申请负载均衡集群一实施例的连接示意图;
图4是本申请故障收敛装置一实施例的框架示意图;
图5是本申请通信设备一实施例的框架示意图;
图6是本申请计算机可读存储介质一实施例的框架示意图。
具体实施方式
下面结合说明书附图,对本申请实施例的方案进行详细说明。
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、接口、技术之类的具体细节,以便透彻理解本申请。
本文中术语“系统”和“网络”在本文中常被可互换使用。本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。此外,本文中的“多”表示两个或者多于两个。
请参阅图1,图1是本申请故障收敛方法一实施例的流程示意图。
具体而言,可以包括如下步骤:
步骤S11:第一通信设备通过预设连接协议与第二通信设备建立连接。
本公开实施例中,第一通信设备和第二通信设备的其中一者为负载均衡集群中的路由设备、另一者为负载均衡集群中的负载均衡节点。负载均衡集群是将工作量分配到多个任务执行端,进而可以达到最佳的利用率、最大限度的缩短响应时间;其中,路由设备用于选择信息传送的线路,通过选择通畅快捷的线路进而提高通信速度,减轻网络系统通信负荷,节约网络系统资源,提高网络系统畅通率,从而让网络系统发挥出更大的效益来。负载均衡节点用于接收路由设备分配的工作,完成工作任务。
在一个实施场景中,预设连接协议是一组连接规则,用来指定多端进行通信实体之间的交互,进而建立可靠的连接关系。预设连接协议可以是路由信息协议(RIP,RoutingInformation Protocol),也可以是边界网关协议(BGP,Border Gateway Protocol),还可以是开放式最短路径优先协议(OSPF,Open Shortest Path First)等等。预设连接协议可以根据实际情况进行选择,在此不做具体限定。
在一个具体实施场景中,边界网关协议是一个用来处理像因特网大小的网络的协议,并且能够妥善处理好不相关路由域间的多路连接的协议,边界网关协议系统的主要功能是和其他的边界网关协议系统交换网络可达信息。边界网关协议消息类型包括Open消息、Keepalive消息、Update消息和Notification消息,其中,Open消息是连接建立后发送的第一个消息,用于建立边界网关协议对等体之间的连接关系,并且边界网关协议会周期性地向对等体发出Keepalive消息,用来保持连接的有效性;Update消息用于在对等体之间交换路由信息,该消息既可以发布可达路由信息,也可以撤销不可达路由信息,当边界网关协议检测到错误状态时,就向对等体发出Notification消息,之后边界网关协议连接会立即中断。边界网关协议建立的过程是从初始状态开始,当协议激活后开始初始化,复位计时器,并发起第一个连接并开始倾听远程对等体所发起的连接,若连接已建立,发送第一个Open报文,等待接收对方的Open报文,并对报文进行检查,若发现错误则发送Notification消息报文并进行等待,否则发送Keepalive消息报文,Keepalive计时器开始计时,如果接收到对等体Keepalive报文,则邻居关系协商完成,在已建立了领取关系之后,路由器将和邻居交换Update报文,同时复位保持计时器。
在一个实施场景中,第一通信设备通过预设连接协议与第二通信设备建立连接,第一通信设备包括连接模块和双向转发检测模块,通过预设连接协议与第二通信设备建立连接的步骤由连接模块执行。若第一通信设备为负载均衡节点,则负载均衡节点中的连接模块向路由设备发送连接请求,以与路由设备建立连接,以建立连接进而进行会话。具体地,负载均衡节点中连接模块向路由设备发送建立连接请求,且连接请求包括负载均衡节点的地址信息。
在一个具体实施场景中,若第一通信设备为路由设备,则响应于负载均衡节点的连接请求,与负载均衡节点建立连接,并基于负载均衡节点的地址信息,建立负载均衡节点的路由信息。具体地,路由设备的连接模块接收到负载均衡节点发送的连接请求之后,与负载均衡节点通过连接模块建立连接,路由设备中连接模块通过学习负载均衡节点的地址信息,进而确定了新的邻居关系,即路由设备与负载均衡节点之间通过连接模块建立连接成功。
步骤S12:通过双向转发检测协议检测与所述第二通信设备是否存在通信故障。
在一个实施场景中,第一通信设备包括连接模块和双向转发检测模块,通过双向转发检测协议检测与第二通信设备是否存在通信故障的步骤由双向转发检测模块执行。双向转发检测协议(BFD,Bidirectional Forwarding Detection)可以检测网络各层的故障,双向转发检测协议能够与相邻系统建立对等关系,然后根据系统以协商的速率监测来自其他系统的双向转发检测协议速率,常见的监测速率能够以毫秒级增量设定。具体地,双向转发检测协议是一个通用的、标准化的、介质无关和协议无关的快速故障检测机制,用于检测IP网络中链路的连通状况,保证设备之间能够快速检测到通信故障,以便能够及时采取措施,保证业务持续运行。BFD可以为各种上层协议(如BGP、OSPF、RIP等)快速检测两台设备间双向转发路径的故障。当对等系统没有接到预先设定数量的数据包时,它推断双向转发检测协议保护的软件或硬件基础设施发生故障,不管基础设施是标记交换路径、其他类型的隧道还是交换以太网络。
在一个实施场景中,双向检测协议检测与第二通信设备是否存在通信故障,可以与第二通信设备建立双向转发检测会话,即接收第二通信设备发送的检测参数,再基于检测参数与第二通信设备建立双向转发检测会话,并与第二通信设备协商发送间隔和检测时间。具体地,第二通信设备发送检测参数至第一通信设备,检测参数包括Desired Min TXInterval(本地支持的最小BFD报文发送间隔)、Required Min RX Interval(本地支持的最小BFD报文接收间隔)、Required Min Echo RX Interval(本地支持的最小Echo报文接收间隔)和Sta(当前会话状态)等,第一通信设备与第二通信设备根据预先设置规则协商参数的发送间隔和检测时间。
在一个具体实施场景中,预先设置规则可以根据协议规定进行设置,例如,在本地支持的最小BFD报文发送间隔与本地支持的最小BFD报文接收间隔之间选择数值较大的一者为发送间隔时间,发送间隔时间即为定时器时间;预先设置也可以设置为在本地支持的最小BFD报文发送间隔与本地支持的最小BFD报文接收间隔之间选择数值较小的一者为发送间隔时间。预先设置规则可以根据实际情况进行确定,在此不做具体限定。
在一个实施场景中,第一通信设备与第二通信设备在协商后确定参数的具体数值,并且进行会话。在双向转发检测会话中,向第二通信设备发送第一控制报文,并检测在检测时间内是否接收到第二通信设备发送的第二控制报文,向第二通信设备发送第一控制报文,可以按照发送间隔向第二通信设备发送第一控制报文。例如,发送间隔时间确定为20毫秒,在双向转发检测会话中,第一通信设备在每隔20毫秒内,向第二通信设备发送第一控制报文,并且第一通信设备根据发送间隔时间检测在时间段内是否接收到第二通信设备发送的第二控制报文;第二通信设备在每隔20毫秒内,向第一通信设备发送第二控制报文,并且第二通信设备根据发送间隔时间检测在时间段内是否接收到第一通信设备发送的第一控制报文。
在一个具体实施场景中,若第一通信设备(第二通信设备)在检测时间内未接收到第二通信设备(第一通信设备)发送的控制报文,则确定连接过程存在通信故障。检测时间可以根据发送间隔时间记性确定,即检测时间为发送间隔时间与最大间隔次数的乘积。检测时间也可以根据实际情况进行确定,在此不做具体限制。
步骤S13:若检测到存在通信故障,则执行预设故障处理。
在一个实施场景中,若检测到存在通信故障,则由双向转发检测模块通知连接模块存在通信故障,并由连接模块执行预设故障处理。根据预设故障处理,对存在通信故障的通信设备进行处理,进而尽可能地减少系统性能出现瓶颈的情况。
本公开实施例中,预设故障处理用于停止与存在通信故障的第二通信设备间的通信,若第一通信设备为路由设备,则删除存在通信故障的第二通信设备的路由信息;若第一通信设备为负载均衡节点,则停止向第二通信设备发送数据。上述方式,加快了网络收敛速度,减少应用中断时间,提高网络的可靠性。
在一个具体实施场景中,路由设备中包括等价路由模块,等价路由模块中存在多条不同链路到达同一目的地址的网络环境中,发往该目的地址的数据包只能利用其中的一条链路,其它链路处于备份状态或无效状态,并且在动态路由环境下相互的切换需要一定时间,而等值多路径路由协议可以在该网络环境下同时使用多条链路,不仅增加了传输带宽,并且可以无时延无丢包地备份失效链路的数据传输。等价路由模块最大的特点是实现了等值情况下,多路径负载均衡和链路备份的目的。
在一个具体实施场景中,若第一通信设备为路由设备,路由设备中的等价路由模块将删除存在通信故障的第二通信设备的路由信息,删除后路由设备不能获取此节点的节点信息,此后等价路由模块将不会给此节点分发流量;若第一通信设备为负载均衡节点,负载均衡节点可以通过停止向第二通信设备发送数据,则第二通信设备在检测时间内没有接收到第一报文,则第二通信设备删除该负载均衡节点;负载均衡节点还可以通过发送报文中参数告知第二通信设备通信出现故障,即将参数中当前会话状态参数值进行调制,进而告知第二通信设备通信出现故障。对预设故障中负载均衡节点出现故障后的处理方法可以根据实际情况进行设置,在此不做具体限定。
请参阅图2,图2是图1中步骤S13一实施例的连接示意图,如图2所示,负载均衡节点22中包括负载均衡模块23、连接模块24、双向转发检测协议(BFD模块)25,其中,负载均衡模块23提供了一种有效透明的方法扩展网络设备和服务器的带宽、增加吞吐量、加强网络数据处理能力、提高网络的灵活性和可用性。连接模块24向路由设备21中的连接模块发送连接请求,连接请求包括负载均衡节点22的地址信息,连接模块24与路由设备21中的连接模块建立连接,路由设备21中的连接模块学习地址信息后,确定了连接关系。路由设备21中BFD模块与BFD模块25进行会话,路由设备21中的BFD模块接收负载均衡节点发送的检测参数,路由设备21中的BFD模块根据检测参数与BFD模块25建立双向转发检测会话,并协商发送间隔和检测时间,进而确定发送间隔和检测时间。路由设备21中BFD模块与BFD模块25根据发送间隔时间互相发送报文,若负载均衡节点22中BFD模块25在检测时间内未收到路由设备21中BFD模块发送的报文,则负载均衡节点22中BFD模块25上报连接模块24后,负载均衡节点22中BFD模块25可以通过停止向路由设备21中的BFD模块发送数据,告知路由设备21中的BFD模块通信出现故障,负载均衡节点22还可以通过改变参数并且发送报文告知路由设备21中的BFD模块通信出现故障,即将参数中当前会话状态参数值进行调整,例如,参数值由连接状态转换为断开状态。若路由设备21中的BFD模块在检测时间内未收到负载均衡节点22中BFD模块25发送的报文,路由设备21中的BFD模块告知路由设备21中的连接模块,并且路由设备21中包括等价路由模块,路由设备21中的等价路由模块将删除存在通信故障的BFD模块25所在的负载均衡节点22的路由信息,删除后路由设备21不能获取此节点的节点信息。
上述方案,第一通信设备通过预设连接协议与第二通信设备建立连接,且第一通信设备和第二通信设备的其中一者为负载均衡集群中的路由设备、另一者为负载均衡集群中的负载均衡节点;再通过双向转发检测协议检测与第二通信设备是否存在通信故障;若检测到存在通信故障,则执行预设故障处理,其中,预设故障处理用于停止与存在通信故障的第二通信设备间的通信。由于利用双向转发检测协议进行故障检测,且一旦检测到通信故障则执行预设故障处理,实现了毫秒级故障收敛,并且确保了通信过程的可靠性和业务的连续性。故此,能够实现故障快速收敛。
请参阅图3,图3是本申请负载均衡集群一实施例的连接示意图,如图3所示,路由设备21分别与负载均衡节点(1)32、负载均衡节点(2)33、负载均衡节点(3)34……负载均衡节点(n)35连接,负载均衡节点向路由设备21发送连接请求,路由设备21与各个负载均衡节点建立连接并且发送报文信息,并且各个负载均衡节点与路由设备21之间的连接互不影响。例如,路由设备21与负载均衡节点(1)32之间建立连接,并给发送报文,此时,负载均衡节点(2)33发送连接请求至路由设备21,路由设备21根据与负载均衡节点(1)32协商确定的发送间隔发送报文,并且与负载均衡节点(2)33之间建立连接,负载均衡集群实现了毫秒级故障收敛,并且确保了通信过程的可靠性和业务的连续性。
上述方案,第一通信设备通过预设连接协议与第二通信设备建立连接,且第一通信设备和第二通信设备的其中一者为负载均衡集群中的路由设备、另一者为负载均衡集群中的负载均衡节点;再通过双向转发检测协议检测与第二通信设备是否存在通信故障;若检测到存在通信故障,则执行预设故障处理,其中,预设故障处理用于停止与存在通信故障的第二通信设备间的通信。由于利用双向转发检测协议进行故障检测,且一旦检测到通信故障则执行预设故障处理,实现了毫秒级故障收敛,并且确保了通信过程的可靠性和业务的连续性。故此,能够实现故障快速收敛。
请参阅图4,图4是本申请故障收敛装置一实施例的框架示意图。故障收敛装置40包括连接模块41、检测模块42和处理模块43,其中,连接模块41用于使第一通信设备通过预设连接协议与第二通信设备建立连接,且第一通信设备和第二通信设备的其中一者为负载均衡集群中的路由设备、另一者为负载均衡集群中的负载均衡节点;检测模块42用于通过双向转发检测协议检测与第二通信设备是否存在通信故障;处理模块43用于对通信故障进行处理,若检测到存在通信故障,则执行预设故障处理,且预设故障处理用于停止与存在通信故障的第二通信设备间的通信。
上述方案,由于利用双向转发检测协议进行故障检测,且一旦检测到通信故障则执行预设故障处理,实现了毫秒级故障收敛,并且确保了通信过程的可靠性和业务的连续性。故此,能够实现故障快速收敛。
在一些公开实施例中,预设连接协议包括边界网关协议或开放式最短路径优先协议。
在一些公开实施例中,第一通信设备包括连接模块和双向转发检测模块,通过预设连接协议与第二通信设备建立连接的步骤由连接模块执行,通过双向转发检测协议检测与第二通信设备是否存在通信故障的步骤由双向转发检测模块执行;处理模块43还包括检测子模块,检测子模块用于对通信连接进行检测,若检测到存在通信故障,则由双向转发检测模块通知连接模块存在通信故障,并由连接模块执行预设故障处理。
因此,通过预设故障处理,可以尽可能地减少通信故障造成的系统性能出现瓶颈的情况。
在一些公开实施例中,执行预设故障处理时,若第一通信设备为路由设备,则删除存在通信故障的第二通信设备的路由信息;若第一通信设备为负载均衡节点,则停止向第二通信设备发送数据。
因此,第一通信设备与第二通信设备在通信连接发生故障时,确保连接设备之间能够快速检测到通信故障,进而能够及时采取措施,确保业务持续运行。
在一些公开实施例中,检测模块42包括会话模块,用于与第二通信设备建立双向转发检测会话;检测模块42包括转发模块,用于在双向转发检测会话中,向第二通信设备发送第一控制报文,并检测在检测时间内是否接收到第二通信设备发送的第二控制报文;检测模块42包括确认模块,若在检测时间内未接收到第二控制报文,则确定与第二通信设备存在通信故障。
在一些公开实施例中,会话模块包括接收单元,接收单元用于接收第二通信设备发送的检测参数;会话模块包括协商单元,用于基于检测参数与第二通信设备建立双向转发检测会话,并与第二通信设备协商发送间隔和检测时间;向第二通信设备发送第一控制报文,包括按照发送间隔向第二通信设备发送第一控制报文。
因此,连接通信根据协商发送间隔和检测时间发送报文并且检测是否接收到报文信息,可以减少应用中断时间,提高网络的可靠性。
在一些公开实施例中,通过预设连接协议与第二通信设备建立连接,若第一通信设备为负载均衡节点,则向路由设备发送连接请求,以与路由设备建立连接,且连接请求包括负载均衡节点的地址信息;若第一通信设备为路由设备,则响应于负载均衡节点的连接请求,与负载均衡节点建立连接,并基于负载均衡节点的地址信息,建立负载均衡节点的路由信息。
请参阅图5,图5是本申请通信设备一实施例的框架示意图。电子设备50包括相互耦接的存储器51和处理器52,存储器51中存储有程序指令,处理器52用于执行程序指令以实现上述任一故障收敛方法实施例中的步骤。具体地,电子设备50可以包括但不限于:台式计算机、笔记本电脑、服务器、手机、平板电脑等等,在此不做限定。
具体而言,处理器52用于控制其自身以及存储器51以实现上述任一故障收敛方法实施例中的步骤。处理器52还可以称为CPU(Central Processing Unit,中央处理单元)。处理器52可能是一种集成电路芯片,具有信号的处理能力。处理器52还可以是通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。另外,处理器52可以由集成电路芯片共同实现。
上述方案,由于利用双向转发检测协议进行故障检测,且一旦检测到通信故障则执行预设故障处理,实现了毫秒级故障收敛,并且确保了通信过程的可靠性和业务的连续性。故此,能够实现故障快速收敛。
请参阅图6,图6是本申请计算机可读存储介质一实施例的框架示意图。计算机可读存储介质60存储有能够被处理器运行的程序指令61,程序指令61用于实现上述任一故障收敛方法实施例中的步骤。
上述方案,由于利用双向转发检测协议进行故障检测,且一旦检测到通信故障则执行预设故障处理,实现了毫秒级故障收敛,并且确保了通信过程的可靠性和业务的连续性。故此,能够实现故障快速收敛。
在一些实施例中,本公开实施例提供的装置具有的功能或包含的模块可以用于执行上文方法实施例描述的方法,其具体实现可以参照上文方法实施例的描述,为了简洁,这里不再赘述。
上文对各个实施例的描述倾向于强调各个实施例之间的不同之处,其相同或相似之处可以互相参考,为了简洁,本文不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的方法和装置,可以通过其它的方式实现。例如,以上所描述的装置实施方式仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性、机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施方式方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本申请各个实施方式方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

Claims (11)

1.一种故障收敛方法,其特征在于,包括:
第一通信设备通过预设连接协议与第二通信设备建立连接,其中,所述第一通信设备和第二通信设备的其中一者为负载均衡集群中的路由设备、另一者为所述负载均衡集群中的负载均衡节点;
通过双向转发检测协议检测与所述第二通信设备是否存在通信故障;
若检测到存在所述通信故障,则执行预设故障处理,其中,所述预设故障处理用于停止与所述存在通信故障的第二通信设备间的通信。
2.根据权利要求1所述的方法,其特征在于,所述预设连接协议包括边界网关协议或开放式最短路径优先协议。
3.根据权利要求1所述的方法,其特征在于,所述第一通信设备包括连接模块和双向转发检测模块,所述通过预设连接协议与第二通信设备建立连接的步骤由所述连接模块执行,所述通过双向转发检测协议检测与所述第二通信设备是否存在通信故障的步骤由所述双向转发检测模块执行;
所述若检测到存在所述通信故障,则执行预设故障处理,包括:
若检测到存在所述通信故障,则由所述双向转发检测模块通知所述连接模块存在所述通信故障,并由所述连接模块执行预设故障处理。
4.根据权利要求1所述的方法,其特征在于,所述执行预设故障处理,包括:
若所述第一通信设备为所述路由设备,则删除存在所述通信故障的第二通信设备的路由信息;
若所述第一通信设备为所述负载均衡节点,则停止向所述第二通信设备发送数据。
5.根据权利要求1所述的方法,其特征在于,所述利用双向转发检测协议检测与所述第二通信设备是否存在通信故障,包括:
与所述第二通信设备建立双向转发检测会话;
在所述双向转发检测会话中,向所述第二通信设备发送第一控制报文,并检测在检测时间内是否接收到所述第二通信设备发送的第二控制报文;
若在所述检测时间内未接收到所述第二控制报文,则确定与所述第二通信设备存在通信故障。
6.根据权利要求5所述的方法,其特征在于,所述与所述第二通信设备建立双向转发检测会话,包括:
接收所述第二通信设备发送的检测参数;
基于所述检测参数与所述第二通信设备建立双向转发检测会话,并与所述第二通信设备协商发送间隔和所述检测时间;
所述向所述第二通信设备发送第一控制报文,包括:
按照所述发送间隔向所述第二通信设备发送第一控制报文。
7.根据权利要求1所述的方法,其特征在于,所述通过预设连接协议与第二通信设备建立连接,包括:
若所述第一通信设备为所述负载均衡节点,则向所述路由设备发送连接请求,以与所述路由设备建立所述连接,其中,所述连接请求包括所述负载均衡节点的地址信息;
若所述第一通信设备为所述路由设备,则响应于所述负载均衡节点的连接请求,与所述负载均衡节点建立所述连接,并基于所述负载均衡节点的地址信息,建立所述负载均衡节点的路由信息。
8.一种故障收敛装置,其特征在于,包括:
连接模块,用于使第一通信设备通过预设连接协议与第二通信设备建立连接,其中,所述第一通信设备和第二通信设备的其中一者为负载均衡集群中的路由设备、另一者为所述负载均衡集群中的负载均衡节点;
检测模块,用于通过双向转发检测协议检测与所述第二通信设备是否存在通信故障;
处理模块,用于对所述通信故障进行处理,若检测到存在所述通信故障,则执行预设故障处理,其中,所述预设故障处理用于停止与所述存在通信故障的第二通信设备间的通信。
9.一种通信设备,其特征在于,包括相互耦接的存储器和处理器,所述存储器中存储有程序指令,所述处理器用于执行所述程序指令以实现权利要求1至7任一项所述的故障收敛方法。
10.一种负载均衡集群,包括路由设备和若干负载均衡节点;
其中,所述路由设备和负载均衡节点用于执行权利要求1至7任一项所述的方法。
11.一种计算机可读存储介质,其特征在于,存储有能够被处理器运行的程序指令,所述程序指令用于实现权利要求1至7任一项所述的故障收敛方法。
CN202111650040.7A 2021-12-30 2021-12-30 故障收敛方法及其相关装置和负载均衡集群 Pending CN114363342A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111650040.7A CN114363342A (zh) 2021-12-30 2021-12-30 故障收敛方法及其相关装置和负载均衡集群

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111650040.7A CN114363342A (zh) 2021-12-30 2021-12-30 故障收敛方法及其相关装置和负载均衡集群

Publications (1)

Publication Number Publication Date
CN114363342A true CN114363342A (zh) 2022-04-15

Family

ID=81103496

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111650040.7A Pending CN114363342A (zh) 2021-12-30 2021-12-30 故障收敛方法及其相关装置和负载均衡集群

Country Status (1)

Country Link
CN (1) CN114363342A (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101217457A (zh) * 2007-12-28 2008-07-09 华为技术有限公司 实现快速重路由的方法及路由器
CN101420381A (zh) * 2008-12-08 2009-04-29 杭州华三通信技术有限公司 一种提高vrrp负载均衡中转发可靠性的方法和装置
CN101697626A (zh) * 2009-10-30 2010-04-21 中兴通讯股份有限公司 基于双向转发检测协议的通信故障检测方法及系统
CN104901881A (zh) * 2015-04-30 2015-09-09 华为技术有限公司 路由设备、负载均衡设备、消息分发方法及系统
WO2021018150A1 (zh) * 2019-07-29 2021-02-04 华为技术有限公司 一种链路检测的方法和装置
US20210075722A1 (en) * 2019-09-10 2021-03-11 Cisco Technology, Inc. Determining Connectivity Between Compute Nodes in Multi-Hop Paths
CN113132159A (zh) * 2021-04-08 2021-07-16 北京马赫谷科技有限公司 存储集群节点故障的处理方法、设备及存储系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101217457A (zh) * 2007-12-28 2008-07-09 华为技术有限公司 实现快速重路由的方法及路由器
CN101420381A (zh) * 2008-12-08 2009-04-29 杭州华三通信技术有限公司 一种提高vrrp负载均衡中转发可靠性的方法和装置
CN101697626A (zh) * 2009-10-30 2010-04-21 中兴通讯股份有限公司 基于双向转发检测协议的通信故障检测方法及系统
CN104901881A (zh) * 2015-04-30 2015-09-09 华为技术有限公司 路由设备、负载均衡设备、消息分发方法及系统
WO2021018150A1 (zh) * 2019-07-29 2021-02-04 华为技术有限公司 一种链路检测的方法和装置
US20210075722A1 (en) * 2019-09-10 2021-03-11 Cisco Technology, Inc. Determining Connectivity Between Compute Nodes in Multi-Hop Paths
CN113132159A (zh) * 2021-04-08 2021-07-16 北京马赫谷科技有限公司 存储集群节点故障的处理方法、设备及存储系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
付明磊;乐孜纯;: "基于双向转发检测协议的光突发交换链路快速故障检测方案", 光学精密工程, no. 12 *

Similar Documents

Publication Publication Date Title
JP5913635B2 (ja) 冗長ネットワーク接続
US8886831B2 (en) System and methodology for fast link failover based on remote upstream failures
EP1763204B1 (en) System and method for redundant switches taking into account learning bridge functionality
JP5828954B2 (ja) サーバ故障中のパケット処理方法及びルータ
CN108965123A (zh) 一种链路切换方法和网络通信系统
CN101060485B (zh) 拓扑改变报文的处理方法和处理装置
CA2311197A1 (en) Enhanced dual counter rotating ring network control system
WO2011100882A1 (zh) 链路检测方法、装置和系统
WO2009023996A1 (fr) Procédé de mise en œuvre d'une interconnexion de réseau par l'intermédiaire d'une agrégation de liaisons
WO2013053267A1 (zh) 一种lacp链路切换、数据传输方法与装置
WO2012068996A1 (zh) 链路状态检测方法和装置
EP1727309A1 (en) Methods and apparatus for monitoring link integrity for signaling traffic over a path traversing hybrid ATM/ethernet infrastructure in support of packet voice service provisioning
WO2008014696A1 (fr) Méthode et dispositif pour effectuer un transfert de communications
CN111447101B (zh) 链路检测方法、装置、计算机设备及存储介质
WO2015070383A1 (zh) 一种链路聚合的方法、装置和系统
KR20150033681A (ko) 연결 실패 시에 홈 네트워크에 대한 재라우팅을 인에이블시키는 방법 및 시스템
WO2019174454A1 (zh) 链路恢复方法及装置、系统、存储介质、电子装置
EP2254289A1 (en) Method, device, and system for establishing label switching path in fast rerouting switching
US8060628B2 (en) Technique for realizing high reliability in inter-application communication
CN106453074A (zh) 一种切换方法及装置
KR20200072941A (ko) 실시간 오류 감지를 통한 vrrp 기반의 네트워크 장애 대응 방법 및 장치
CN108270593B (zh) 一种双机热备份方法和系统
JP5558436B2 (ja) ネットワークシステムおよびネットワーク故障回避方法
WO2021098806A1 (zh) 报文传输路径的切换方法、设备和系统
CN114363342A (zh) 故障收敛方法及其相关装置和负载均衡集群

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination