CN115378844B - 一种网络链路的故障检测方法及装置 - Google Patents

一种网络链路的故障检测方法及装置 Download PDF

Info

Publication number
CN115378844B
CN115378844B CN202210811167.0A CN202210811167A CN115378844B CN 115378844 B CN115378844 B CN 115378844B CN 202210811167 A CN202210811167 A CN 202210811167A CN 115378844 B CN115378844 B CN 115378844B
Authority
CN
China
Prior art keywords
detection
fault
link
determining
detection duration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210811167.0A
Other languages
English (en)
Other versions
CN115378844A (zh
Inventor
崔一佳
王丽梅
温彦龙
王振民
吴桐华
杨磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianyi Cloud Technology Co Ltd
Original Assignee
Tianyi Cloud Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianyi Cloud Technology Co Ltd filed Critical Tianyi Cloud Technology Co Ltd
Priority to CN202210811167.0A priority Critical patent/CN115378844B/zh
Publication of CN115378844A publication Critical patent/CN115378844A/zh
Application granted granted Critical
Publication of CN115378844B publication Critical patent/CN115378844B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0823Errors, e.g. transmission errors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/28Routing or path finding of packets in data switching networks using route fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/50Reducing energy consumption in communication networks in wire-line communication networks, e.g. low power modes or reduced link rate

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本申请涉及通信技术领域,提供了一种网络链路的故障检测方法及装置,考虑了网络设备单位时间内的业务流量和限速带宽,通过业务流量和限速带宽计算的带宽占用率,灵活的调节故障检测的灵敏度,这样,在网络业务复杂的情况下,提高了链路故障的检测的灵活性,从而在业务流量较小时,及时的报告链路故障,当业务流量较高时,能够兼顾网络抖动或拥塞等异常现象,提高链路故障检测的准确性,避免链路来回切换,降低链路损耗。

Description

一种网络链路的故障检测方法及装置
技术领域
本申请涉及通信技术领域,公开了一种网络链路的故障检测方法及装置。
背景技术
随着网关类设备的应用,对于一些重要业务,通常会在网路设备中部署多条网络链路,当主链路故障时,能够从主链路切换到备链路,达到主备多线的高可用场景,以确保该业务不会发生中断。因此,链路高可用的核心功能之一是:网络设备如何检测链路故障以进行主备链路切换。
目前,主流的链路故障检测技术包括双向转发检测(Bidirectional ForwardingDetection,BFD)协议和网络质量分析(Network Quality Analyzer,NQA)。其中,BFD基于接收到的对端发送的检测报文的时间进行链路故障检测,NQA通过分析对端发送的检测报文的网络参数进行链路故障检测。
由于网络设备对服务质量(Quality of Service,QOS)存在上限,可能会丢失检测报文,导致链路故障检测出现错误,从而引发链路的错误切换;且这两种技术并未兼顾链路的特殊状态,当网络链路出现间歇性抖动时,可能出现反复切换链路和反复回切的情况,加重链路损伤。
发明内容
本申请提供了一种网络链路的故障检测方法及装置,用于提高链路故障检测的准确性。
一方面,本申请提供一种网络链路的故障检测方法,所述方法包括:
按照设定的检测时间间隔,向对端网络设备发送的HTTP请求;
在设定的检测时长内,当未接收到所述对端网络设备针对所述HTTP请求发送的响应报文时,获取所述检测时长内自身的业务流量;
根据所述业务流量和限速带宽,确定所述检测时长内连续发生故障的次数;
根据所述次数和所述检测时间间隔,确定故障倒换时间;
当所述故障倒换时间到达时,确定发生链路故障。
可选的,所述根据所述业务流量和限速带宽,确定所述检测时长内连续发生故障的次数,包括:
根据所述业务流量和所述业务流量的预设统计时间间隔,确定单位时间的吞吐量;
根据所述吞吐量和所述限速带宽,确定带宽占用率;
根据预设的基础故障门限和所述带宽占用率,确定所述检测时长内连续发生故障的次数。
可选的,所述检测时长内连续发生故障的次数的计算公式为:
Figure BDA0003739108820000021
Figure BDA0003739108820000022
其中,FDF表示所述检测时长内连续发生故障的次数,BF表示所述基础故障门限,TPS表示单位时间的吞吐量,BW表示所述限速带宽,DT表示所述预设统计时间间隔,
Figure BDA0003739108820000023
表示向下取整。
可选的,所述方法还包括:
在所述检测时长内,每次接收到所述对端网络设备针对所述HTTP请求发送的响应报文后,则重新计算检测时长;
根据新的检测时长内获取自身的业务流量,重新确定故障倒换时间。
可选的,所述方法还包括:
在所述检测时长内,若至少一次接收到所述对端网络设备针对所述HTTP请求发送的响应报文,则确定未发生链路故障。
另一方面,本申请提供一种网络链路的故障检测装置,包括:
请求模块,用于按照设定的检测时间间隔,向对端网络设备发送的HTTP请求;
获取模块,用于在设定的检测时长内,当未接收到所述对端网络设备针对所述HTTP请求发送的响应报文时,获取所述检测时长内自身的业务流量;
故障检测模块,用于根据所述业务流量和限速带宽,确定所述检测时长内连续发生故障的次数;以及,根据所述次数和所述检测时间间隔,确定故障倒换时间;
故障确定模块,当所述故障倒换时间到达时,确定发生链路故障。
可选的,所述故障检测模块具体用于:
根据所述业务流量和所述业务流量的预设统计时间间隔,确定单位时间的吞吐量;
根据所述吞吐量和所述限速带宽,确定带宽占用率;
根据预设的基础故障门限和所述带宽占用率,确定所述检测时长内连续发生故障的次数。
可选的,所述检测时长内连续发生故障的次数的计算公式为:
Figure BDA0003739108820000031
Figure BDA0003739108820000032
其中,FDF表示所述检测时长内连续发生故障的次数,BF表示所述基础故障门限,TPS表示单位时间的吞吐量,BW表示所述限速带宽,DT表示所述预设统计时间间隔,
Figure BDA0003739108820000033
表示向下取整。
可选的,所述故障检测模块403还用于:
在所述检测时长内,每次接收到所述对端网络设备针对所述HTTP请求发送的响应报文后,则重新计算检测时长;
根据新的检测时长内获取自身的业务流量,重新确定故障倒换时间。
可选的,所述故障确定模块还用于:
在所述检测时长内,若至少一次接收到所述对端网络设备针对所述HTTP请求发送的响应报文,则确定未发生链路故障。
另一方面,本申请提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,当所述计算机指令在网络设备上运行时,使得网络设备执行网络链路的故障检测方法。
另一方面,本申请实施例提供一种计算机程序产品,包含计算机程序,所述计算机程序被网络设备执行时实现上述网络链路的故障检测方法的步骤。
本申请实施例的有益效果如下:
本申请提供一种网络链路的故障检测方法及装置,按照设定的检测时间间隔,向对端网络设备发送的HTTP请求,基于HTTP协议,每一次HTTP请求均应得到HTTP响应,如果在设定的检测时长内若未接收到对端网络设备针对HTTP请求发送的响应报文,并不是立即确定发送故障,而是获取检测时长内自身的业务流量,并根据业务流量和限速带宽,确定检测时长内连续发生故障的次数,结合检测时间间隔,得到故障倒换时间,当故障倒换时间到达时,确定发生链路故障。通过基于HTTP协议、业务流量和限速带宽进行链路故障检测,从而可以根据网络设备实际的业务情况,灵活适配网络情况,拉长网络允许的故障次数,能够根据业务情况灵活变换故障检测的灵敏度,提高故障检测的准确性;且由于不是检测出一次故障后立即上报进行链路切换,从而可以兼顾网络的异常变化,提高故障检测的稳定性。
本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的应用场景示意图;
图2为本申请实施例提供的网络链路的故障检测方法流程图;
图3为本申请实施例提供的检测时长内链路故障的次数的确定方法流程图;
图4为本申请实施例提供的网络链路的故障检测装置的结构图;
图5为本申请实施例提供的网络设备的结构图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请技术方案的一部分实施例,而不是全部的实施例。基于本申请文件中记载的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请技术方案保护的范围。
在网络通信中,一些重要业务通常会部署多条网络链路,以便在底层链路故障时进行切换,实现多条链路的高可用场景。
目前,主流的链路故障检测技术包括基于BFD协议的检测方法和基于NQA的检测方法。其中:
BFD协议是一个简单的“Hello”协议,与路由协议(如:开放的最短路径优先协议(Open Shortest Path First,OSPF))的邻居检测部分相似,提供了一种检测两台邻接路由器/交换机之间转发路径连通状态的方法,具有轻负载、速度快的特点。在BFD协议中,相邻的两个网络设备在二者建立会话的通道上周期性的发送检测报文,如果一个网络设备在足够长的时间内,没有收到对端网络设备发送的检测报文,则确定在这条双向通道的某个部分发生了故障。通过BFD协议可以快速检测到转发路径的连通故障,加快启用备份转发路径,提升网络性能。
NQA是一种实时的网络性能探测和统计技术,可以对响应时间、网络抖动、丢包率等网络信息进行统计。NQA还提供了与Track和应用模块联动的功能,实时监控网络状态的变化。NQA通过发送检测报文,对网络性能或服务质量进行分析,提供网络性能参数,如:时延抖动、HTTP的总时延、通过DHCP获取IP地址的时延、TCP连接时延、FTP连接时延和文件传输速率等。
目前主流的链路故障检测技术的目的是:当发生链路故障时,实现网络链路的快速切换,减少业务中断的时间,故障检测的灵敏度较高。
在实际应用中,采用主流的链路故障检测技术,由于故障检测灵敏度较高,当检测到主链路故障时,会立刻切换到备链路,当检测到主链路恢复后,又会立刻回切到主链路。这样,可能出现有损或者无效的切换。例如,当网络链路出现间歇性抖动时,采用主流的链路故障检测技术,可能出现反复切换和反复回切的情况,加重链路损伤的程度,对业务的影响表现为,出现严重的丢包效果,降低业务体验。
同时,考虑到网络设备对QOS存在限速的情况,当网络流量达到QOS限速的上限时,QOS会随机丢包,有可能会丢掉检测报文,导致链路故障检测出现错误,从而引发链路的错误切换。
鉴于此,本申请实施例提供一种网络链路的故障检测方法及装置,基于HTTP协议,结合业务流量、带宽等多因素进行故障判断,可以根据网络设备实际的业务情况,灵活适配网络情况,拉长网络允许的故障次数,从而确定合适的故障倒换时间,做出更准确的链路故障检测,且能兼顾网络抖动或网络拥塞等异常时做出错误的故障判断,适应更多的故障检测场景,具有高效、灵活、适应性强的特点。
参见图1,为本申请实施例提供的应用场景示意图。在图1中,A点网络设备配置有对端网络设备(B点网络设备)的IP地址,B点网络设备配置有对端网络设备(A点网络设备)的IP地址。A点网络设备和B点网络设备之间可以通过网络进行点对点(Post OfficeProtocol,POP)通信。其中,A点网络设备和B点网络设备之间部署了两条链路。A点网络设备和B点网络设备根据各自配置的IP地址,通过一条链路(在图1中用粗虚线表示)进行双向通信,通信过程中,网络设备可以向对端网络设备发送用于故障检测的HTTP请求,根据对端网络设备对HTTP请求的响应情况,确定当前链路(在图1中用粗虚线表示)是否发生故障,并在发生故障时切换至另一条链路,保证业务的正常运行。
基于图1所述的应用场景,图2示例性示出了本申请实施例提供的网络链路的故障检测方法流程图,该流程由任一网络设备执行,主要包括以下几步:
S201:按照设定的检测时间间隔,向对端网络设备发送HTTP请求。
在S201中,网络设备配置了对端网络设备的IP地址,根据配置的IP地址,按照设定的检测时间间隔,向该IP地址指示的对端网络设备发送HTTP请求。
需要说明的是,本申请实施例中的检测时间间隔可根据实际业务进行设置,大小不做限制性要求。
S202:在设定的检测时长内,当未接收到对端网络设备针对HTTP请求发送的响应报文时,获取检测时长内自身的业务流量。
网络设备每次发送HTTP请求后,如果未接收到对端网络设备发送的响应报文,表明探测失败一次,但如果立即确定网络链路出现故障,进而进行链路切换,可能会出现误判。这是因为网络处于动态的变化,如果发生网络抖动或网络拥塞时,可能会引发响应报文不可达或延时,但不是网络链路出现了故障。因此,在S202中,网格设备在设定的检测时长内未接收到对端网络设备针对HTTP请求发送的响应报文时,并未立即做出链路故障的判断,而是通过网络接口,获取检测时长内自身的业务流量,进而根据实际业务的情况进行故障检测,防止网络异常引发的错误检测,提高链路故障检测的准确性。
本申请的实施例中,在检测时长内,当网络设备至少一次接收到对端网络设备针对HTTP请求发送的响应报文,则确定未发生链路故障。
S203:根据业务流量和限速带宽,确定检测时长内连续发生故障的次数。
在S203中,检测时长内故障发生的次数的确定过程参见图3,主要包括以下几步:
S2031:根据业务流量和业务流量的预设统计时间间隔,确定单位时间的吞吐量。
在S2031中,单位时间内吞吐量的计算公式为:
Figure BDA0003739108820000081
其中,TPS(Throughput Per Second)表示单位时间的吞吐量,TB(ThroughputByte)表示检测时长内的业务流量,也可理解为检测时长内的下行流量,单位为字节(Byte),DT(Duration time)表示业务流量的预设统计时间间隔。
在公式1中,DT的时间单位可自行定义,本申请不做限制性要求,时间单位越小,故障检测的灵敏度越高,进行链路切换的灵敏度越高。
S2032:根据吞吐量和限速带宽,确定带宽占用率。
在S2032中,限速带宽即理论上最大的带宽速率,本申请实施例为QOS的限速带宽。通过吞吐量和限速带宽的比,可以得到带宽占用率。
S2033:根据预设的基础故障门限和带宽占用率,确定检测时长内连续发生故障的次数。
在S2033中,故障次数的计算公式为:
Figure BDA0003739108820000082
其中,FDF(Fault Detection Frequency)表示检测时长内连续发生故障的次数,即连续几次未收到响应报文,BF(Basic Frequency)表示预设的基础故障门限,代表最少的故障次数门限,BW(Bandwidth)表示限速带宽,
Figure BDA0003739108820000083
表示带宽占用率,/>
Figure BDA0003739108820000084
表示向下取整。
在S2033中,通过带宽占用率乘以100向下取整后得到一个整数,加上基础故障门限后得到检测时长内连续发生故障的次数。
通过公式2可知,当获得的业务流量较低时,检测时长内网络允许发生的故障次数越少,这样可以及时的报告网络设备和对端网络设备的链路出现了故障,当获得的业务流量较高时,检测时长内网络允许发生的故障次数越多,从而降低故障倒换的灵敏度,可以兼顾网络抖动或者网络拥塞等异常引发的错误检测,避免链路的频繁切换造成的链路损耗。
从公式2还可以看出,当业务流量很小时,检测时长内网络允许发生的故障次数为基本故障门限。例如,假设基础故障门限为三次,业务流量很小导致带宽占用率取整后为0时,当有三次未接收到响应报文时,判断网络设备和对端网络设备的链路发生了故障,需要进行切换。
本申请实施例考虑了单位时间内的业务流量和限速带宽,通过带宽占用率灵活的调节链路故障检测的灵敏度,其中,带宽占用率越高,故障检测的灵敏性越低,带宽占用率越低,故障检测的灵敏性越高。
可选的,本申请实施例设置FDF的上限为100次。
S204:根据次数和检测时间间隔,确定故障倒换时间。
在S204中,故障倒换时间的计算公式为:
PSD=FDF*LAG 公式3
其中,PSD(Protection Switching Duration)表示故障倒换时间,LAG表示检测时间间隔,默认为1秒。
S205:当故障倒换时间到达时,确定发生链路故障。
例如,假设LAG=1秒,FDF=N次,这样,网络设备最小可在N秒确定发生链路故障,进行链路切换;最大可在100N秒确定发生链路故障,进行链路切换。
本申请的实施例中,采用公式3计算链路的故障到换时间,当业务流量较小(当链路真正中断或者进行演示测试的情况下,业务流量接近0kbps)时,可以快速进行链路切换,以保障业务连续不中断;当业务流量较大时,增加了故障倒换时间,这样可以兼顾间歇的网络抖动或者网络拥塞等异常情况,适当降低故障检测的敏感性,减小故障误判造成的链路来回切换的损耗,保障业务的持续性。
本申请上述实施例的方法可独立运作预网络设备侧,仅需要与对端网络设备或对端终端进行互动,相对独立,且配置灵活。
在一些实施例中,网络设备按照设定的检测时间间隔向对端网络设备发送HTTP请求时,在设定的检测时长内可能间断性的接收到响应报文,由于故障倒换时间时基于连续的故障次数确定的,因此,当间断性接收到响应报文时,需从新计算检测时长。
具体实施时,在检测时长内,每次接收到对端网络设备针对HTTP请求发送的响应报文后,则重新计算检测时长,并根据新的检测时长内获取自身的业务流量,重新确定故障倒换时间。
例如,假设当前业务对应的FDF为5次,在当前检测时长内,网络设备针对前2次发送的HTTP请求没有接收到响应报文,而第3次接收到了响应报文,则从第3次接收到响应报文开始,连续5次未接收到响应报文时,确定发生了链路故障,并在第3次接收到响应报文开始,5*LAG秒后上报链路故障并切换。
本申请实施例提供的网络链路的故障检测方法中,在进行链路故障检测时,考虑了网络设备在单位时间内业务流量的大小和QOS限速带宽的大小,通过计算带宽占用率灵活的调节故障检测的灵敏度,带宽占用率越高,故障检测的灵敏性越低,带宽占用率越低,故障检测的灵敏性越高,这样,在处理网络业务复杂的情况下,提高了链路故障的检测的灵活性,从而在业务流量较小时,及时的报告链路故障,当业务流量较高时,能够兼顾网络抖动或拥塞等异常现象,提高链路故障检测的准确性,避免链路来回切换,降低链路损耗,具有高效、灵活、适应性强的特点。并且,本申请基于HTTP协议进行故障检测,相对于控制报文协议(Internet Control Message Protocol,ICMP),故障检测的准确性更高,对实际应用可用性指导性更强,提供业务体验。
本申请上述实施例提供的网络链路的故障检测方法,可所有网络终端类设备,适合支持多链路出口的场景,通过检测时长内连续发生故障的次数,最终确定是否真的故障,并在主链路故障时,切换到备用链路。
例如,上述网络设备可以为软件定义广域网(Software Defined Wide AreaNetwork,SD-WAN)的智能网关。SD-WAN的智能网关支持双WAN、LTE等多种上行链路方式,且具备多链路高可用倒换的能力。SD-WAN的智能网关采用本申请实施例提供的方法进行链路故障检测,相对于使用BFD协议,该方法简单,实现难度低,性能消耗小,不仅能兼顾BFD的优点,同时解决BFD方案的不足,能够有效解决SDWAN的智能网关在实际应用中出现的错误切换问题。
基于相同的技术构思,本申请实施例提供一种网络链路的故障检测装置,该装置能够执行上述实施例中网络链路的故障检测方法,且能够实现相同的技术效果,在此不再赘述。
参见图4,该装置包括请求模块401、获取模块402、故障检测模块403和故障确定模块404,其中:
请求模块401,用于按照设定的检测时间间隔,向对端网络设备发送的HTTP请求;
获取模块402,用于在设定的检测时长内,当未接收到所述对端网络设备针对所述HTTP请求发送的响应报文时,获取所述检测时长内自身的业务流量;
故障检测模块403,用于根据所述业务流量和限速带宽,确定所述检测时长内连续发生故障的次数;以及,根据所述次数和所述检测时间间隔,确定故障倒换时间;
故障确定模块404,当所述故障倒换时间到达时,确定发生链路故障。
可选的,所述故障检测模块403具体用于:
根据所述业务流量和所述业务流量的预设统计时间间隔,确定单位时间的吞吐量;
根据所述吞吐量和所述限速带宽,确定带宽占用率;
根据预设的基础故障门限和所述带宽占用率,确定所述检测时长内连续发生故障的次数。
可选的,所述检测时长内联系发生故障的次数的计算公式为:
Figure BDA0003739108820000121
Figure BDA0003739108820000122
其中,FDF表示所述检测时长内连续发生故障的次数,BF表示所述基础故障门限,TPS表示单位时间的吞吐量,BW表示所述限速带宽,DT表示所述预设统计时间间隔,
Figure BDA0003739108820000123
表示向下取整。
可选的,所述故障检测模块403还用于:
在所述检测时长内,每次接收到所述对端网络设备针对所述HTTP请求发送的响应报文后,则重新计算检测时长;
根据新的检测时长内获取自身的业务流量,重新确定故障倒换时间。
基于相同的技术构思,本申请实施例提供一种网络设备,该网络设备执行上述实施例中网络链路的故障检测方法,且能够实现相同的技术效果,在此不再赘述。
参见图5,该网络设备包括处理器501、存储器502和通信接口503,所述处理器501、所述存储器502和所述通信接口通过总线504连接,所述通信接口503用于与对端网络设备进行通信,包括但不限于发送请求和接收响应,所述存储器502存储有计算机程序,所述处理器501根据所述计算机程序执行上述实施例中网络链路的故障检测方法步骤。
本申请实施例图5中涉及的处理器可以是中央处理器(Central ProcessingUnit,CPU),通用处理器,图形处理器(Graphics Processing Unit,GPU)数字信号处理器(Digital Signal Processor,DSP),专用集成电路(Application-specific IntegratedCircuit,ASIC),现场可编程门阵列(Field Programmable Gate Array,FPGA)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。
另一方面,本申请提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,当所述计算机指令在网络设备上运行时,使得网络设备执行网络链路的故障检测方法。
另一方面,本申请实施例提供一种计算机程序产品,包含计算机程序,所述计算机程序被网络设备执行时实现上述网络链路的故障检测方法的步骤。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (6)

1.一种网络链路的故障检测方法,其特征在于,所述方法包括:
按照设定的检测时间间隔,向对端网络设备发送HTTP请求;
在设定的检测时长内,当未接收到所述对端网络设备针对所述HTTP请求发送的响应报文时,获取所述检测时长内自身的业务流量;
根据所述业务流量和所述业务流量的预设统计时间间隔,确定单位时间的吞吐量;
根据所述吞吐量和限速带宽,确定带宽占用率;
根据预设的基础故障门限和所述带宽占用率,确定所述检测时长内连续发生故障的次数;
根据所述次数和所述检测时间间隔,确定故障倒换时间;
当所述故障倒换时间到达时,确定发生链路故障;
其中,所述检测时长内连续发生故障的次数的计算公式为:
Figure QLYQS_1
Figure QLYQS_2
所述故障倒换时间的计算公式为:
PSD=FDF*LAG
其中,FDF表示所述检测时长内连续发生故障的次数,BF表示所述基础故障门限,TPS表示单位时间的吞吐量,BW表示所述限速带宽,DT表示所述预设统计时间间隔,TB表示所述检测时长内的业务流量,
Figure QLYQS_3
表示向下取整,PSD表示所述故障倒换时间,LAG表示所述检测时间间隔。
2.如权利要求1所述的方法,其特征在于,所述方法还包括:
在所述检测时长内,每次接收到所述对端网络设备针对所述HTTP请求发送的响应报文后,则重新计算检测时长;
根据新的检测时长内获取自身的业务流量,重新确定故障倒换时间。
3.如权利要求1所述的方法,其特征在于,所述方法还包括:
在所述检测时长内,若至少一次接收到所述对端网络设备针对所述HTTP请求发送的响应报文,则确定未发生链路故障。
4.一种网络链路的故障检测装置,其特征在于,包括:
请求模块,用于按照设定的检测时间间隔,向对端网络设备发送的HTTP请求;
获取模块,用于在设定的检测时长内,当未接收到所述对端网络设备针对所述HTTP请求发送的响应报文时,获取所述检测时长内自身的业务流量;
故障检测模块,用于根据所述业务流量和所述业务流量的预设统计时间间隔,确定单位时间的吞吐量;根据所述吞吐量和限速带宽,确定带宽占用率;根据预设的基础故障门限和所述带宽占用率,确定所述检测时长内连续发生故障的次数;以及,根据所述次数和所述检测时间间隔,确定故障倒换时间;
故障确定模块,当所述故障倒换时间到达时,确定发生链路故障;
其中,所述检测时长内连续发生故障的次数的计算公式为:
Figure QLYQS_4
Figure QLYQS_5
其中,FDF表示所述检测时长内连续发生故障的次数,BF表示所述基础故障门限,TPS表示单位时间的吞吐量,BW表示所述限速带宽,DT表示所述预设统计时间间隔,
Figure QLYQS_6
表示向下取整。
5.如权利要求4所述的装置,其特征在于,所述故障检测模块还用于:
在所述检测时长内,每次接收到所述对端网络设备针对所述HTTP请求发送的响应报文后,则重新计算检测时长;
根据新的检测时长内获取自身的业务流量,重新确定故障倒换时间。
6.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,当所述计算机指令在网络设备上运行时,使得网络设备执行如权利要求1-3中任一项所述的方法。
CN202210811167.0A 2022-07-11 2022-07-11 一种网络链路的故障检测方法及装置 Active CN115378844B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210811167.0A CN115378844B (zh) 2022-07-11 2022-07-11 一种网络链路的故障检测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210811167.0A CN115378844B (zh) 2022-07-11 2022-07-11 一种网络链路的故障检测方法及装置

Publications (2)

Publication Number Publication Date
CN115378844A CN115378844A (zh) 2022-11-22
CN115378844B true CN115378844B (zh) 2023-06-23

Family

ID=84062068

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210811167.0A Active CN115378844B (zh) 2022-07-11 2022-07-11 一种网络链路的故障检测方法及装置

Country Status (1)

Country Link
CN (1) CN115378844B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116192757A (zh) * 2022-12-27 2023-05-30 天翼云科技有限公司 负载均衡方法、装置、电子设备及可读存储介质
CN117289685B (zh) * 2023-11-27 2024-02-02 青岛创新奇智科技集团股份有限公司 一种基于人工智能的生产线故障预测与自愈方法及系统

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003050706A1 (en) * 2001-12-12 2003-06-19 Valve Corporation Method and system for load balancing an authentication system
CN101697626A (zh) * 2009-10-30 2010-04-21 中兴通讯股份有限公司 基于双向转发检测协议的通信故障检测方法及系统
JP2011151752A (ja) * 2010-01-25 2011-08-04 Fujitsu Ltd パケットトランスポート障害検出機能を含む通信ネットワークシステム
CN102624563A (zh) * 2012-03-13 2012-08-01 网经科技(苏州)有限公司 基于双wan的ims注册快速切换方法
CN105897580A (zh) * 2016-03-29 2016-08-24 中国科学院信息工程研究所 一种协议无关转发网络快速故障检测与流量保护切换方法
WO2016169616A1 (en) * 2015-04-24 2016-10-27 Telefonaktiebolaget Lm Ericsson (Publ) Fault diagnosis in networks
CN106792956A (zh) * 2017-01-20 2017-05-31 深圳前海弘稼科技有限公司 种植设备和网络切换方法
CN110362461A (zh) * 2018-03-26 2019-10-22 福建天泉教育科技有限公司 平均故障间隔时间的测试方法及计算机可读存储介质
CN110808873A (zh) * 2019-10-21 2020-02-18 锐捷网络股份有限公司 一种检测链路故障的方法及装置
US10673506B1 (en) * 2018-03-09 2020-06-02 Quantenna Communications, Inc. Adaptive spatial diagnostics in a wireless network
CN111988191A (zh) * 2019-05-22 2020-11-24 北京华为数字技术有限公司 一种分布式通信网络的故障检测方法及装置

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003050706A1 (en) * 2001-12-12 2003-06-19 Valve Corporation Method and system for load balancing an authentication system
CN101697626A (zh) * 2009-10-30 2010-04-21 中兴通讯股份有限公司 基于双向转发检测协议的通信故障检测方法及系统
JP2011151752A (ja) * 2010-01-25 2011-08-04 Fujitsu Ltd パケットトランスポート障害検出機能を含む通信ネットワークシステム
CN102624563A (zh) * 2012-03-13 2012-08-01 网经科技(苏州)有限公司 基于双wan的ims注册快速切换方法
WO2016169616A1 (en) * 2015-04-24 2016-10-27 Telefonaktiebolaget Lm Ericsson (Publ) Fault diagnosis in networks
CN105897580A (zh) * 2016-03-29 2016-08-24 中国科学院信息工程研究所 一种协议无关转发网络快速故障检测与流量保护切换方法
CN106792956A (zh) * 2017-01-20 2017-05-31 深圳前海弘稼科技有限公司 种植设备和网络切换方法
US10673506B1 (en) * 2018-03-09 2020-06-02 Quantenna Communications, Inc. Adaptive spatial diagnostics in a wireless network
CN110362461A (zh) * 2018-03-26 2019-10-22 福建天泉教育科技有限公司 平均故障间隔时间的测试方法及计算机可读存储介质
CN111988191A (zh) * 2019-05-22 2020-11-24 北京华为数字技术有限公司 一种分布式通信网络的故障检测方法及装置
CN110808873A (zh) * 2019-10-21 2020-02-18 锐捷网络股份有限公司 一种检测链路故障的方法及装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Detection and location of multiple faults in baseline interconnection networks;Lombardi, F.;Feng, C.;IEEE Transactions on Computers;第41卷(第10期);全文 *
Yunfei Zhou ; Xiaocui Hui.Fault diagnosis method of large-scale complex electromechanical system based on extension neural network.Cluster Computing.2018,全文. *
园区网络常见故障分析及监测技术;郑守洋;;中国新通信(第13期);全文 *
智能电网调度控制系统在线监测评估研究与应用;汪伟;李端超;庞晴晴;刘夏;;东北电力技术(第02期);全文 *

Also Published As

Publication number Publication date
CN115378844A (zh) 2022-11-22

Similar Documents

Publication Publication Date Title
CN115378844B (zh) 一种网络链路的故障检测方法及装置
US11005685B2 (en) Methods and systems for transmitting packets through aggregated end-to-end connection
US11902080B2 (en) Congestion avoidance in a slice-based network
US9258216B2 (en) Methods and systems for transmitting packets through network interfaces
US9485181B2 (en) Dynamic bandwidth adjustment in packet transport network
US9585175B2 (en) Methods and systems for transmitting packets through aggregated end-to-end connection
CN108306777B (zh) 基于sdn控制器的虚拟网关主备切换方法及装置
US9451500B2 (en) Conditional routing technique
US10897423B2 (en) Congestion avoidance in a slice-based network
US10958579B2 (en) Congestion avoidance in a slice-based network
CN101483592A (zh) 一种抑制双向转发检测链路振荡的方法及装置
WO2015001393A1 (en) Methods and systems for transmitting packets through aggregated end-to-end connection
WO2008148334A1 (fr) Procédé, système et appareil pour détecter la réception anormale d'un message
WO2015001394A1 (en) Methods and systems for transmitting packets through aggregated end-to-end connection
WO2015001395A1 (en) Methods and systems for transmitting packets through network interfaces
CN114070774A (zh) 数据转发方法及系统
Hussein et al. SDN for MPTCP: An enhanced architecture for large data transfers in datacenters
CN108683602B (zh) 一种数据中心网络负载均衡方法
CN112073270B (zh) 一种链路故障检测方法及装置
Caba et al. Mitigating sdn controller performance bottlenecks
Popovic Redundancy in communication networks for smart grids
US11902140B2 (en) Systems and methods for activating FEC processing per application probe class
Meijers Increasing fault tolerance in service-level agreement constrained context-aware data networks.
Park et al. Software-defined networking (SDN) control message classification, verification, and optimization system
CN118075195A (zh) 数据中心网络故障重路由方法、装置、电子设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant