CN109495311B - 一种网络故障检测方法及装置 - Google Patents

一种网络故障检测方法及装置 Download PDF

Info

Publication number
CN109495311B
CN109495311B CN201811452294.6A CN201811452294A CN109495311B CN 109495311 B CN109495311 B CN 109495311B CN 201811452294 A CN201811452294 A CN 201811452294A CN 109495311 B CN109495311 B CN 109495311B
Authority
CN
China
Prior art keywords
tcp
message
sequence number
fault
quintuple information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811452294.6A
Other languages
English (en)
Other versions
CN109495311A (zh
Inventor
郑文楷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ruijie Networks Co Ltd
Original Assignee
Ruijie Networks Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ruijie Networks Co Ltd filed Critical Ruijie Networks Co Ltd
Priority to CN201811452294.6A priority Critical patent/CN109495311B/zh
Publication of CN109495311A publication Critical patent/CN109495311A/zh
Application granted granted Critical
Publication of CN109495311B publication Critical patent/CN109495311B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/55Prevention, detection or correction of errors
    • H04L49/555Error detection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/55Prevention, detection or correction of errors
    • H04L49/557Error correction, e.g. fault recovery or fault tolerance
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/16Implementation or adaptation of Internet protocol [IP], of transmission control protocol [TCP] or of user datagram protocol [UDP]
    • H04L69/163In-band adaptation of TCP data exchange; In-band control procedures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/22Parsing or analysis of headers
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/50Reducing energy consumption in communication networks in wire-line communication networks, e.g. low power modes or reduced link rate

Abstract

本发明公开了一种网络故障检测方法,应用于交换设备的可编程交换芯片中,所述方法包括:所述可编程交换芯片对接收到的传输控制协议TCP报文进行数据流检测,获取所述TCP报文的五元组信息以及TCP序列号;当记录有所述TCP报文的五元组信息时,判断所述TCP序列号是否大于所述五元组信息对应的记录序列号;若所述TCP序列号不大于所述记录序列号,则将所述五元组信息对应的重传次数加一,并将所述记录序列号更新为所述TCP序列号;判断所述重传次数是否大于预设重传次数阈值;若所述重传次数大于所述预设重传次数阈值,则将所述TCP报文确定为故障报文并发送给故障处理设备以进行故障处理。本发明实施例能够提高网络故障检测的准确率。

Description

一种网络故障检测方法及装置
技术领域
本发明涉及通信技术领域,尤指一种网络故障检测方法及装置。
背景技术
网络故障一直是数据中心网络需要解决的问题,随着网络环境愈加复杂,越难以及时准确地发现哪里发生了故障。TCP协议会通过报文重传的方式处理少量的报文丢包,但如果网络出现故障则会出现大量的重传报文。因此,少量的TCP重传并不一定说明网络发生故障,而网络故障必然会导致大量的报文重传,因此可以通过一定时间内的重传数量大小来粗略判断网络是否发生故障。
现有检测网络故障主要是在网络外部进行探测,当通信主机的TCP报文大量重传,得知网络出现故障时,在网络外部通过traceroute等手段来探测网络的连通性。但这种方法无法精确感知网络内部情况,还有多径等多种因素影响,准确性不高。因此,现有网络故障的检测方案准确率不高,效率太低。
发明内容
本发明实施例提供一种网络故障检测方法及装置,用以解决现有技术中网络故障检测准确率不高、效率低下的问题。
一种网络故障检测方法,应用于交换设备的可编程交换芯片中,所述方法包括:
所述可编程交换芯片对接收到的传输控制协议TCP报文进行数据流检测,获取所述TCP报文的五元组信息以及TCP序列号;
当根据所述TCP报文的五元组信息找到对应的记录序列号时,判断所述TCP序列号是否大于所述记录序列号;
若所述TCP序列号不大于所述记录序列号,则将所述五元组信息对应的重传次数加一,并将所述记录序列号更新为所述TCP序列号;
判断所述重传次数是否大于预设重传次数阈值;
若所述重传次数大于所述预设重传次数阈值,则将所述TCP报文确定为故障报文并发送给故障处理设备以进行故障处理。
进一步地,当根据所述TCP报文的五元组信息未找到对应的记录序列号时,所述方法,还包括:
将所述TCP报文的TCP序列号记录为所述五元组信息对应的记录序列号,并设置所述五元组信息对应的重传次数为0;所述五元组信息包括源IP、目的IP、协议号、目的端口号、源端口号。
其中,所述将所述TCP报文的TCP序列号记录为所述五元组信息对应的记录序列号,并设置所述五元组信息对应的重传次数为0,具体为:
将所述五元组信息进行哈希算法,得到五元组哈希值;
分别将所述TCP序列号和初始化为0的重传次数存入以所述五元组哈希值为索引的两个缓存中。
进一步地,在将所述TCP报文确定为故障报文并发送给故障处理设备以进行故障处理之后,所述方法,还包括:
将所述五元组信息对应的重传次数清零。
其中,所述将所述TCP报文确定为故障报文并发送给故障处理设备以进行故障处理,包括:
将所述TCP报文确定为故障报文并复制给所述交换设备的CPU进行故障处理;或者
将所述TCP报文确定为故障报文并镜像所述TCP报文至监控设备进行故障处理。
一种网络故障检测装置,所述装置应用于交换设备的可编程交换芯片,包括:检测单元、第一判断单元、处理单元、第二判断单元、故障报文发送单元;其中,
所述检测单元,用于对接收到的传输控制协议TCP报文进行数据流检测,获取所述TCP报文的五元组信息以及TCP序列号;
所述第一判断单元,用于当根据所述TCP报文的五元组信息找到对应的记录序列号时,判断所述TCP序列号是否大于所述记录序列号;
所述处理单元,用于若所述TCP序列号不大于所述记录序列号,则将所述五元组信息对应的重传次数加一,并将所述记录序列号更新为所述TCP序列号;
所述第二判断单元,用于判断所述重传次数是否大于预设重传次数阈值;
所述故障报文发送单元,用于若所述重传次数大于所述预设重传次数阈值,则将所述TCP报文确定为故障报文并发送给故障处理设备以进行故障处理。
进一步地,所述装置,还包括:记录单元;用于当根据所述TCP报文的五元组信息未找到对应的记录序列号时,将所述TCP报文TCP序列号记录为所述五元组信息对应的记录序列号,并设置所述五元组信息对应的重传次数为0;所述五元组信息包括源IP、目的IP、协议号、目的端口号、源端口号。
其中,所述记录单元,具体用于将所述五元组信息进行哈希算法,得到五元组哈希值;分别将所述TCP序列号和初始化为0的重传次数存入以所述五元组哈希值为索引的两个缓存中。
进一步地,所述装置,还包括:清零单元,用于在故障报文发送单元将所述TCP报文确定为故障报文并发送给故障处理设备以进行故障处理之后,将所述五元组信息对应的重传次数清零。
其中,所述故障报文发送单元,具体用于将所述TCP报文确定为故障报文并复制给所述交换设备的CPU进行故障处理;或者将所述TCP报文确定为故障报文并镜像所述TCP报文至监控设备进行故障处理。
本发明有益效果如下:
本发明实施例提供的网络故障检测方法及装置,交换设备的可编程交换芯片对接收到的TCP报文进行故障报文的检测,由于可编程交换芯片可在数据平面即可完成对报文的检测,因此所有的检测、判断逻辑都可在报文线速转发的过程中同时完成,既不会产生大量的额外带宽消耗,也不会对转发性能有任何影响。通过可编程交换芯片来进行故障报文的筛选,性能远远超过监控服务器使用CPU来进行故障报文判断,并且可编程交换芯片位于数据中心网络内部,不仅能感知到网络故障,并且准确率较高。
附图说明
图1为本发明实施例中网络故障检测方法的流程图;
图2为本发明实施例中TCP报文的五元组信息、TCP序列号及重传次数的存储示意图;
图3为本发明实施例中网络故障检测装置的结构示意图。
具体实施方式
对于数据中心网络内部,服务器只能通过重传TCP报文来尝试恢复连接,无法定位故障位置,因此亟需一种网络故障检测方法,能够及时发现TCP流的故障并进行定位。
针对现有技术中存在的网络故障检测准确率低、效率不高的问题,本发明实施例提供的一种网络故障检测方法,该方法应用于交换设备的可编程交换芯片中先。本发明方法的流程如图1所示,执行步骤如下:
步骤101,所述可编程交换芯片对接收到的传输控制协议TCP报文进行数据流检测,获取所述TCP报文的五元组信息以及TCP序列号;
这里,所述可编程交换芯片具体可以为用于数据平面可编程的交换芯片,如P4(Programming Protocol-Independent Packet Processors)可编程交换芯片。
具体地,所述可编程交换芯片对TCP报文进行数据流检测,获得该TCP报文的五元组信息,并查询自身是否存有该五元组信息对应的记录序列号,若是,则执行步骤102,否则,所述方法,还包括:将所述TCP报文的TCP序列号记录为所述五元组信息对应的记录序列号,并设置所述五元组信息对应的重传次数为0;所述五元组信息包括源IP、目的IP、协议号、目的端口号、源端口号,这里,记录下的TCP序列号与五元组信息一一对应,即为前述五元组信息对应的记录序列号。
进一步地,将所述TCP报文的TCP序列号记录为所述五元组信息对应的记录序列号,并设置所述五元组信息对应的重传次数为0,具体可以为:将所述五元组信息进行哈希算法,得到五元组哈希值;这里,对五元组信息进行处理的算法也可以不限于哈希算法,能实现同样功能的算法均可实现,本发明实施例并不对此进行限定。分别将所述TCP序列号和初始化为0的重传次数存入以所述五元组哈希值为索引的两个缓存(Register)中。例如,参考图2,新的数据流报文Packet进入,首先对该数据报文进行计算得到五元组hash值H,然后分别在存储TCP序列号的Register1和存储重传次数Register2中进行地址偏移H后,将TCP序列号存入Register1,将重传次数=0存入Register2中。
步骤102,当根据所述TCP报文的五元组信息找到对应的记录序列号时,判断所述TCP序列号是否大于所述记录序列号;
步骤103,若所述TCP序列号不大于所述记录序列号,则将所述五元组信息对应的重传次数加一,并将所述记录序列号更新为所述TCP序列号;
这里,所述TCP序列号若不大于所述记录序列号,表示该TCP报文并不是第一次接收到,即该TCP报文是重传报文,因此,将该TCP报文的五元组信息对应的重传次数加一,并将所述记录序列号更新为所述TCP序列号;优选地,这里无论所述记录序列号与所述TCP序列号是否一样,为保证准确性,可以将所述记录序列号均进行更新操作,更新为所述TCP序列号。
步骤104,判断所述重传次数是否大于预设重传次数阈值;
这里,所述预设重传次数阈值可以根据需求和经验进行预先设置,也可以根据环境和需求的变更,进行更改。
步骤105,若所述重传次数大于所述预设重传次数阈值,则将所述TCP报文确定为故障报文并发送给故障处理设备以进行故障处理。
具体地,可将所述TCP报文确定为故障报文并复制给所述交换设备的CPU进行故障处理;这里,前述已经对报文进行了筛选确定出了故障报文,因此发送给交换设备的CPU的报文不会爆发性增多,如此,交换设备在保证报文流量线速转发的同时,即可进行故障报文的处理,提高了故障检测的处理效率,并且准确度较高;
或者,
将所述TCP报文确定为故障报文并镜像所述TCP报文至监控设备进行故障处理。这里,所述将故障报文镜像至监控设备,具体可以通过在所述故障报文中添加私有头部,通过该私有头部携带有附加信息以告知所述监控设备该报文为故障报文,以使监控设备对故障报文进行处理,如此,经过交换设备对报文筛选后,只将故障报文镜像给监控设备,大大减少了涌入监控设备的流量,能够大大提高处理效率。
基于同一发明构思,本发明实施例提供一种网络故障检测装置,该装置可以设置在交换设备的可编程交换芯片中,这里,所述可编程交换芯片具体可以为用于数据平面可编程的交换芯片,如P4(Programming Protocol-IndependentPacket Processors)可编程交换芯片。结构如图3所示,包括:检测单元31、第一判断单元32、处理单元33、第二判断单元34、故障报文发送单元35;其中,
所述检测单元31,用于对接收到的传输控制协议TCP报文进行数据流检测,获取所述TCP报文的五元组信息以及TCP序列号;
所述第一判断单元32,用于当根据所述TCP报文的五元组信息找到对应的记录序列号时,判断所述TCP序列号是否大于所述记录序列号;
所述处理单元33,用于若所述TCP序列号不大于所述记录序列号,则将所述五元组信息对应的重传次数加一,并将所述记录序列号更新为所述TCP序列号;这里,所述TCP序列号若不大于所述记录序列号,表示该TCP报文并不是第一次接收到,即该TCP报文是重传报文,因此,将该TCP报文的五元组信息对应的重传次数加一,并将所述记录序列号更新为所述TCP序列号;优选地,这里无论所述记录序列号与所述TCP序列号是否一样,为保证准确性,可以将所述记录序列号均进行更新操作,更新为所述TCP序列号。
所述第二判断单元34,用于判断所述重传次数是否大于预设重传次数阈值;这里,所述预设重传次数阈值可以根据需求和经验进行预先设置,也可以根据环境和需求的变更,进行更改。
所述故障报文发送单元35,用于若所述重传次数大于所述预设重传次数阈值,则将所述TCP报文确定为故障报文并发送给故障处理设备以进行故障处理。
进一步地,所述装置,还包括:记录单元36;用于当根据所述TCP报文的五元组信息未找到对应的记录序列号时,将所述TCP报文TCP序列号记录为所述五元组信息对应的记录序列号,并设置所述五元组信息对应的重传次数为0;所述五元组信息包括源IP、目的IP、协议号、目的端口号、源端口号。这里,记录下的TCP序列号与五元组信息一一对应,即为前述五元组信息对应的记录序列号。
其中,所述记录单元36,具体用于将所述五元组信息进行哈希算法,得到五元组哈希值;分别将所述TCP序列号和初始化为0的重传次数存入以所述五元组哈希值为索引的两个缓存中。这里,对五元组信息进行处理的算法也可以不限于哈希算法,能实现同样功能的算法均可实现,本发明实施例并不对此进行限定。
进一步地,所述装置,还包括:清零单元37,用于在故障报文发送单元35将所述TCP报文确定为故障报文并发送给故障处理设备以进行故障处理之后,将所述五元组信息对应的重传次数清零。
其中,所述故障报文发送单元35,具体用于将所述TCP报文确定为故障报文并复制给所述交换设备的CPU进行故障处理;这里,前述已经对报文进行了筛选确定出了故障报文,因此发送给交换设备的CPU的报文不会爆发性增多,如此,交换设备在保证报文流量线速转发的同时,即可进行故障报文的处理,提高了故障检测的处理效率,并且准确度较高;
或者,将所述TCP报文确定为故障报文并镜像所述TCP报文至监控设备进行故障处理。这里,所述将故障报文镜像至监控设备,具体可以通过在所述故障报文中添加私有头部,通过该私有头部携带有附加信息以告知所述监控设备该报文为故障报文,以使监控设备对故障报文进行处理,如此,经过交换设备对报文筛选后,只将故障报文镜像给监控设备,大大减少了涌入监控设备的流量,能够大大提高处理效率。
应当理解,本发明实施例提供的网络故障检测装置实现原理及过程与上述图1及所示的实施例类似,在此不再赘述。
本发明实施例提供的网络故障检测方法及装置,交换设备的可编程交换芯片对接收到的TCP报文进行故障报文的检测,由于可编程逻辑芯片可在数据平面即可完成对报文的检测,因此所有的检测、判断逻辑都可在报文线速转发的过程中同时完成,既不会产生大量的额外带宽消耗,也不会对转发性能有任何影响。通过可编程交换芯片来进行故障报文的筛选,性能远远超过监控服务器使用CPU来进行故障报文判断,并且可编程交换芯片位于数据中心网络内部,不仅能感知到网络故障,并且准确率较高。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的可选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括可选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明实施例进行各种改动和变型而不脱离本发明实施例的精神和范围。这样,倘若本发明实施例的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种网络故障检测方法,其特征在于,应用于交换设备的可编程交换芯片中,所述方法包括:
所述可编程交换芯片对接收到的传输控制协议TCP报文进行数据流检测,获取所述TCP报文的五元组信息以及TCP序列号;
当根据所述TCP报文的五元组信息找到对应的记录序列号时,判断所述TCP序列号是否大于所述记录序列号;
若所述TCP序列号不大于所述记录序列号,则将所述五元组信息对应的重传次数加一,并将所述记录序列号更新为所述TCP序列号;
判断所述重传次数是否大于预设重传次数阈值;
若所述重传次数大于所述预设重传次数阈值,则将所述TCP报文确定为故障报文并发送给故障处理设备以进行故障处理。
2.根据权利要求1所述的方法,其特征在于,当根据所述TCP报文的五元组信息未找到对应的记录序列号时,所述方法,还包括:
将所述TCP报文的TCP序列号记录为所述五元组信息对应的记录序列号,并设置所述五元组信息对应的重传次数为0;所述五元组信息包括源IP、目的IP、协议号、目的端口号、源端口号。
3.根据权利要求2所述的方法,其特征在于,所述将所述TCP报文的TCP序列号记录为所述五元组信息对应的记录序列号,并设置所述五元组信息对应的重传次数为0,具体为:
将所述五元组信息进行哈希算法,得到五元组哈希值;
分别将所述TCP序列号和初始化为0的重传次数存入以所述五元组哈希值为索引的两个缓存中。
4.根据权利要求1所述的方法,其特征在于,在将所述TCP报文确定为故障报文并发送给故障处理设备以进行故障处理之后,所述方法,还包括:
将所述五元组信息对应的重传次数清零。
5.根据权利要求1至4任一所述的方法,其特征在于,所述将所述TCP报文确定为故障报文并发送给故障处理设备以进行故障处理,包括:
将所述TCP报文确定为故障报文并复制给所述交换设备的CPU进行故障处理;或者
将所述TCP报文确定为故障报文并镜像所述TCP报文至监控设备进行故障处理。
6.一种网络故障检测装置,其特征在于,所述装置应用于交换设备的可编程交换芯片,包括:检测单元、第一判断单元、处理单元、第二判断单元、故障报文发送单元;其中,
所述检测单元,用于对接收到的传输控制协议TCP报文进行数据流检测,获取所述TCP报文的五元组信息以及TCP序列号;
所述第一判断单元,用于当根据所述TCP报文的五元组信息找到对应的记录序列号时,判断所述TCP序列号是否大于所述记录序列号;
所述处理单元,用于若所述TCP序列号不大于所述记录序列号,则将所述五元组信息对应的重传次数加一,并将所述记录序列号更新为所述TCP序列号;
所述第二判断单元,用于判断所述重传次数是否大于预设重传次数阈值;
所述故障报文发送单元,用于若所述重传次数大于所述预设重传次数阈值,则将所述TCP报文确定为故障报文并发送给故障处理设备以进行故障处理。
7.根据权利要求6所述的装置,其特征在于,所述装置,还包括:记录单元;用于当根据所述TCP报文的五元组信息未找到对应的记录序列号时,将所述TCP报文TCP序列号记录为所述五元组信息对应的记录序列号,并设置所述五元组信息对应的重传次数为0;所述五元组信息包括源IP、目的IP、协议号、目的端口号、源端口号。
8.根据权利要求7所述的装置,其特征在于,所述记录单元,具体用于将所述五元组信息进行哈希算法,得到五元组哈希值;分别将所述TCP序列号和初始化为0的重传次数存入以所述五元组哈希值为索引的两个缓存中。
9.根据权利要求6所述的装置,其特征在于,所述装置,还包括:清零单元,用于在故障报文发送单元将所述TCP报文确定为故障报文并发送给故障处理设备以进行故障处理之后,将所述五元组信息对应的重传次数清零。
10.根据权利要求6至9任一所述的装置,其特征在于,所述故障报文发送单元,具体用于将所述TCP报文确定为故障报文并复制给所述交换设备的CPU进行故障处理;或者将所述TCP报文确定为故障报文并镜像所述TCP报文至监控设备进行故障处理。
CN201811452294.6A 2018-11-30 2018-11-30 一种网络故障检测方法及装置 Active CN109495311B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811452294.6A CN109495311B (zh) 2018-11-30 2018-11-30 一种网络故障检测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811452294.6A CN109495311B (zh) 2018-11-30 2018-11-30 一种网络故障检测方法及装置

Publications (2)

Publication Number Publication Date
CN109495311A CN109495311A (zh) 2019-03-19
CN109495311B true CN109495311B (zh) 2022-05-20

Family

ID=65698943

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811452294.6A Active CN109495311B (zh) 2018-11-30 2018-11-30 一种网络故障检测方法及装置

Country Status (1)

Country Link
CN (1) CN109495311B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113259143B (zh) * 2020-02-07 2023-04-18 阿里巴巴集团控股有限公司 信息处理方法、设备、系统及存储介质
CN113300816B (zh) * 2020-07-15 2022-04-12 阿里巴巴集团控股有限公司 节点定位方法、网络传输方法、装置及设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102769869A (zh) * 2012-08-09 2012-11-07 北京傲天动联技术有限公司 无线接入点的控制和配置报文快速转发系统
CN103023728A (zh) * 2013-01-15 2013-04-03 中国人民解放军信息工程大学 流监控方法
CN107154867A (zh) * 2017-04-24 2017-09-12 北京星网锐捷网络技术有限公司 网络故障检测方法及装置
CN107645409A (zh) * 2017-08-18 2018-01-30 上海华为技术有限公司 一种确定数据的传输故障原因方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102769869A (zh) * 2012-08-09 2012-11-07 北京傲天动联技术有限公司 无线接入点的控制和配置报文快速转发系统
CN103023728A (zh) * 2013-01-15 2013-04-03 中国人民解放军信息工程大学 流监控方法
CN107154867A (zh) * 2017-04-24 2017-09-12 北京星网锐捷网络技术有限公司 网络故障检测方法及装置
CN107645409A (zh) * 2017-08-18 2018-01-30 上海华为技术有限公司 一种确定数据的传输故障原因方法及装置

Also Published As

Publication number Publication date
CN109495311A (zh) 2019-03-19

Similar Documents

Publication Publication Date Title
US10917322B2 (en) Network traffic tracking using encapsulation protocol
CN101132320B (zh) 检测接口故障的方法及网络节点设备
CN109245955B (zh) 一种数据处理方法、装置及服务器
CN110661702B (zh) 一种链路备份的方法、装置及计算机可读存储介质
US10033602B1 (en) Network health management using metrics from encapsulation protocol endpoints
CN109347705B (zh) 一种环路检测方法及装置
EP3707862B1 (en) Method and sytem for detecting sources of computer network failures
CN112311580B (zh) 报文传输路径确定方法、装置及系统、计算机存储介质
CN109495311B (zh) 一种网络故障检测方法及装置
WO2013044827A1 (zh) 一种跟踪路由测试方法、系统、装置及设备
CN111817885B (zh) 基于网络的主从机判别和切换方法、装置
CN112637015B (zh) 一种基于psn实现rdma网络的丢包检测方法及装置
CN103607317A (zh) 二层环路检测方法和装置及通信系统
JP2009182430A (ja) パケット解析方法
CN102739462B (zh) 一种测试报文的发送方法以及装置
Molero et al. Fast in-network gray failure detection for isps
CN108683602B (zh) 一种数据中心网络负载均衡方法
CN110912912A (zh) 一种切换ip信誉检测模式的方法及装置
CN110855566B (zh) 上行流量的牵引方法和装置
CN106230658B (zh) 一种监控网络设备的方法和装置
CN112702221B (zh) Bgp异常路由监测方法和装置
US10721145B2 (en) Identification of candidate problem network entities
CN113890858B (zh) Pmtu的探测方法及装置
CN111654440B (zh) 一种智能选路的方法、电子设备以及存储介质
CN109039822B (zh) 一种bfd协议报文过滤方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant