CN106961344B - 一种网络故障检测方法及装置 - Google Patents

一种网络故障检测方法及装置 Download PDF

Info

Publication number
CN106961344B
CN106961344B CN201610014741.4A CN201610014741A CN106961344B CN 106961344 B CN106961344 B CN 106961344B CN 201610014741 A CN201610014741 A CN 201610014741A CN 106961344 B CN106961344 B CN 106961344B
Authority
CN
China
Prior art keywords
network element
node network
sent
message
messages
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610014741.4A
Other languages
English (en)
Other versions
CN106961344A (zh
Inventor
易小聪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN201610014741.4A priority Critical patent/CN106961344B/zh
Priority to PCT/CN2016/080400 priority patent/WO2016197736A1/zh
Publication of CN106961344A publication Critical patent/CN106961344A/zh
Application granted granted Critical
Publication of CN106961344B publication Critical patent/CN106961344B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0823Errors, e.g. transmission errors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/10Active monitoring, e.g. heartbeat, ping or trace-route

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明提供一种网络故障检测方法及装置,涉及通信技术领域,用以保证网络中业务的运行。本发明的网络故障检测方法,包括:接收客户端的网络故障检测指令,在所述网络故障检测指令中包括待检测隧道的标识;根据所述待检测隧道的标识确定所述待检测隧道包括的网元;向所述网元发送报文统计指令,使得所述网元根据所述报文统计指令统计所述网元收到的和/或发出的报文数目;接收所述网元发送的报文统计结果,根据所述报文统计结果确定所述网元是否发生故障,其中所述报文统计结果中包括所述网元收到的和/或发出的报文数目。本发明主要用于PTN技术中。

Description

一种网络故障检测方法及装置
技术领域
本发明涉及通信技术领域,尤其涉及一种网络故障检测方法及装置。
背景技术
PTN(Packet Transport Network,分组传送网)是一种基于分组的路由架构,它能够提供对多业务的技术支持。在PTN网络中,如果在端到端的隧道中出现丢包现象,承载在该隧道上的业务将会受到影响。现有的方案中能够通过隧道头节点的发包和收包情况来确定隧道中是否出现丢包现象。但是,现有的方案无法定位出出现故障的网元,从而准确的解决网络的故障,影响了网络中业务的运行。
发明内容
有鉴于此,本发明提供一种网络故障检测方法及装置,用以保证网络中业务的运行。
为解决上述技术问题,本发明提供一种网络故障检测方法,包括:
接收客户端的网络故障检测指令,在所述网络故障检测指令中包括待检测隧道的标识;
根据所述待检测隧道的标识确定所述待检测隧道包括的网元;
向所述网元发送报文统计指令,使得所述网元根据所述报文统计指令统计所述网元收到的和/或发出的报文数目;
接收所述网元发送的报文统计结果,根据所述报文统计结果确定所述网元是否发生故障,其中所述报文统计结果中包括所述网元收到的和/或发出的报文数目。
优选的,所述网元包括:头节点网元,其他节点网元;所述向所述网元发送报文统计指令包括:
先向所述其他节点网元发送报文统计指令,间隔预设时间后,向所述头节点网元发送所述报文统计指令。
优选的,所述网络故障检测指令中还包括检测配置参数;所述方法还包括:向所述头节点网元发送所述检测配置参数。
优选的,所述检测配置参数包括:检测模式;当检测模式为慢Ping检测模式时,所述检测配置参数还包括:包长,重复次数,超时时间,回复模式;当检测模式为快Ping检测模式时,所述检测配置参数还包括:带宽,优先级,检测时间,回复模式。
优选的,当检测模式为慢Ping检测模式时,所述接收所述网元发送的报文统计结果具体为:在头节点发送报文的次数到达重复次数这一参数的要求时,接收所述网元发送的报文统计结果;
当检测模式为快Ping检测模式时,所述接收所述网元发送的报文统计结果具体为:在所述检测时间到时时,接收所述网元发送的报文统计结果。
优选的,当单向传输报文时,所述接收所述网元发送的报文统计结果,根据所述报文统计结果确定所述网元是否发生故障,其中所述报文统计结果中包括所述网元收到和/或发出的报文数目包括:
若所述网元为头节点网元,所述头节点网元的报文统计结果中包括所述头节点网元发出的报文数目;若所述头节点网元发出的报文数目与预设发送报文数目不符,则确定所述头节点网元发生故障;
若所述其他节点网元为头节点网元和尾节点网元之间的中间节点网元,所述中间节点网元的报文统计结果中包括所述中间节点网元收到和发出的报文数目;若所述中间节点网元收到的和/或发出的报文数目与所述中间节点网元的上一节点网元发出的报文数目不符,则确定所述中间节点网元发生故障;
若所述其他节点网元为尾节点网元,所述尾节点网元的报文统计结果中包括所述尾节点网元收到的报文数目;若所述尾节点网元收到的报文数目与所述尾节点网元的上一节点网元发出的报文数目不符,则确定所述尾节点网元发生故障。
优选的,当双向传输报文时,所述接收所述网元发送的报文统计结果,根据所述报文统计结果确定所述网元是否发生故障,其中所述报文统计结果中包括所述网元收到和/或发出的报文数目包括:
若所述网元为头节点网元,所述头节点网元的报文统计结果中包括所述头节点网元正向发出的报文数目和反向收到的报文数目;若所述头节点网元正向发出的报文数目与预设发送报文数目不符或所述头节点网元反向接收的报文数目与所述头节点网元的上一节点网元发出的报文数目不符,则确定所述头节点网元发生故障;
若所述其他节点网元为头节点网元和尾节点网元之间的中间节点网元,所述中间节点网元的报文统计结果中包括所述中间节点网元收到和发出的报文数目;若所述中间节点网元收到的和/或发出的报文数目与所述中间节点网元的上一节点网元发出的报文数目不符,则确定所述中间节点网元发生故障;
若所述其他节点网元为尾节点网元,所述尾节点网元的报文统计结果中包括所述尾节点网元收到的报文数目和发出的报文数目;若所述尾节点网元收到的和/或发出的报文数目与所述尾节点网元的上一节点网元发出的报文数目不符,则确定所述尾节点网元发生故障。
本发明还提供一种网络故障检测方法,包括:
接收服务器发送的报文统计指令;
根据所述报文统计指令统计收到的和/或发出的报文数目;
向所述服务器发送报文统计结果,在所述报文统计结果中包括收到的和/或发出的报文数目。
优选的,所述方法还包括:
接收所述服务器发送的检测配置参数;所述检测配置参数包括:检测模式;当检测模式为慢Ping检测模式时,所述检测配置参数还包括:包长,重复次数,超时时间,回复模式;当检测模式为快Ping检测模式时,所述检测配置参数还包括:带宽,优先级,检测时间,回复模式;
所述向所述服务器发送报文统计结果具体为:当检测模式为慢Ping检测模式时,在头节点发送报文的次数到达重复次数这一参数的要求时,接收所述网元发送的报文统计结果;当检测模式为快Ping检测模式时,在所述检测时间到时时,接收所述网元发送的报文统计结果。
本发明还提供一种网络故障检测装置,包括:
接收单元,用于接收客户端的网络故障检测指令,在所述网络故障检测指令中包括待检测隧道的标识;
确定单元,用于根据所述待检测隧道的标识确定所述待检测隧道包括的网元;
发送单元,用于向所述网元发送报文统计指令,使得所述网元根据所述报文统计指令统计所述网元收到的和/或发出的报文数目;
处理单元,用于接收所述网元发送的报文统计结果,根据所述报文统计结果确定所述网元是否发生故障,其中所述报文统计结果中包括所述网元收到的和/或发出的报文数目。
优选的,所述网元包括:头节点网元,其他节点网元;所述发送单元具体用于:
先向所述其他节点网元发送报文统计指令,间隔预设时间后,向所述头节点网元发送所述报文统计指令。
优选的,所述网络故障检测指令中还包括检测配置参数;所述发送单元还用于,向所述头节点网元发送检测配置参数。
优选的,所述处理单元包括:
接收模块,用于接收所述网元发送的报文统计结果;
解析模块,用于在单向传输报文时解析所述网元发送的报文统计结果;若所述网元为头节点网元,所述头节点网元的报文统计结果中包括所述头节点网元发出的报文数目;若所述其他节点网元为头节点网元和尾节点网元之间的中间节点网元,所述中间节点网元的报文统计结果中包括所述中间节点网元收到和发出的报文数目;若所述其他节点网元为尾节点网元,所述尾节点网元的报文统计结果中包括所述尾节点网元收到的报文数目;
处理模块,用于在单向传输报文时,若所述头节点网元发出的报文数目与预设发送报文数目不符,则确定所述头节点网元发生故障;若所述中间节点网元收到的和/或发出的报文数目与所述中间节点网元的上一节点网元发出的报文数目不符,则确定所述中间节点网元发生故障;若所述尾节点网元收到的报文数目与所述尾节点网元的上一节点网元发出的报文数目不符,则确定所述尾节点网元发生故障。
优选的,所述处理单元包括:
接收模块,用于接收所述网元发送的报文统计结果;
解析模块,用于在双向传输报文时解析所述网元发送的报文统计结果;若所述网元为头节点网元,所述头节点网元的报文统计结果中包括所述头节点网元正向发出的报文数目和反向收到的报文数目;若所述其他节点网元为头节点网元和尾节点网元之间的中间节点网元,所述中间节点网元的报文统计结果中包括所述中间节点网元收到和发出的报文数目;若所述其他节点网元为尾节点网元,所述尾节点网元的报文统计结果中包括所述尾节点网元收到的报文数目和发出的报文数目;
处理模块,用于在双向传输报文时,若所述头节点网元正向发出的报文数目与预设发送报文数目不符或所述头节点网元反向接收的报文数目与所述头节点网元的上一节点网元发出的报文数目不符,则确定所述头节点网元发生故障;若所述中间节点网元收到的和/或发出的报文数目与所述中间节点网元的上一节点网元发出的报文数目不符,则确定所述中间节点网元发生故障;若所述尾节点网元收到的和/或发出的报文数目与所述尾节点网元的上一节点网元发出的报文数目不符,则确定所述尾节点网元发生故障。
优选的,当检测模式为慢Ping检测模式时,所述接收模块具体用于在头节点发送报文的次数到达重复次数这一参数的要求时,接收所述网元发送的报文统计结果;
当检测模式为快Ping检测模式时,所述接收模块具体用于:在检测时间到时时,接收所述网元发送的报文统计结果。
本发明还提供一种网络故障检测装置,包括:
接收单元,用于接收服务器发送的报文统计指令;
统计单元,用于根据所述报文统计指令统计收到的和/或发出的报文数目;
发送单元,用于向所述服务器发送报文统计结果,在所述报文统计结果中包括收到的和/或发出的报文数目。
优选的,所述接收单元还用于,接收所述服务器发送的检测配置参数;所述检测配置参数包括:检测模式;当检测模式为慢Ping检测模式时,所述检测配置参数还包括:包长,重复次数,超时时间,检测时间;当检测模式为快Ping检测模式时,所述检测配置参数还包括:包长,带宽,优先级,检测时间;
所述发送单元具体用于:当检测模式为慢Ping检测模式时,在头节点发送报文的次数到达重复次数这一参数的要求时,接收所述网元发送的报文统计结果;当检测模式为快Ping检测模式时,在所述检测时间到时时,接收所述网元发送的报文统计结果。
本发明的上述技术方案的有益效果如下:
在本发明实施例中,当检测网络故障时,服务器接收客户端发送的网络故障检测指令,而后,服务器根据该网络故障检测指令向待检测隧道的网元发送报文统计指令,从而使得各网元根据该报文统计指令统计各自收到的和/或发出的报文数目并反馈给服务器,从而可以使得服务器根据各网元反馈的收到的和/或发出的报文数目确定网元是否发生故障。因而,通过上述描述可以看出,在本发明实施例中,服务器可根据各网元的收到的和/或发出的报文数目确定网元是否发生故障,从而准确的定位出发生故障的网元,方便维护人员准确的解决网络的故障,进而保证了网络中业务的运行。
附图说明
图1为本发明实施例一的网络故障检测方法的流程图;
图2为本发明实施例二的网络故障检测方法的流程图;
图3为本发明实施例三的网络故障检测方法的流程图;
图4为本发明实施例四的网络故障检测装置的示意图;
图5为本发明实施例五的网络故障检测装置的示意图。
具体实施方式
下面将结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
如图1所示,本发明实施例一的网络故障检测方法,由服务器执行,包括:
步骤11、接收客户端的网络故障检测指令,在所述网络故障检测指令中包括待检测隧道的标识。
在本发明实施例中,根据PTN网络架构端到端通信的特点,将两端的网元节点之间的通信链路称为隧道。在此,将需要检测是否发生故障的隧道称为待检测隧道。报文在该隧道中的传输可以经过多个网元。其中,所述待检测隧道的标识可以是任意的形式,例如可以是两端的网元节点的名称组成的标识。如,假设一端网元节点是A,另一端网元节点是Z,那么在此的待检测隧道的标识可以是AZ等。
当需要对某个隧道进行检测时,客户端向服务器发送网络故障检测指令,在该指令中包括待检测隧道的标识,用以指示服务器对对应的隧道进行故障检测。
步骤12、根据所述待检测隧道的标识确定所述待检测隧道包括的网元。
在具体应用中,服务器存储有各个隧道所经过的网元的信息。因此,根据待检测隧道的标识,服务器可确定待检测隧道所包括的网元。例如,假设待检测隧道为由节点A到节点Z的隧道,标识为AZ,它经过的网元为A、B、C、Z,那么,该隧道包括的网元分别是网元A、B、C、Z。
步骤13、向所述网元发送报文统计指令,使得所述网元根据所述报文统计指令统计所述网元收到的和/或发出的报文数目。
当确定了待检测隧道包括的网元后,服务器可分别向各个网元发送报文统计指令,该报文统计指令用于使得所述网元根据所述报文统计指令统计所述网元收到的和/或发出的报文数目。在具体应用中,为了保证确定出的故障网元的准确性,在此,可先向所述其他节点网元发送报文统计指令,间隔预设时间后,向所述头节点网元发送所述报文统计指令。其中,所述预设时间可以任意设置,例如设置为3s等。
步骤14、接收所述网元发送的报文统计结果,根据所述报文统计结果确定所述网元是否发生故障,其中所述报文统计结果中包括所述网元收到的和/或发出的报文数目。
在待检测隧道中传输报文的时候,可以通过单向传输模式传输,或者还可以通过双向传输模式传输。例如,假设待检测隧道包括的网元分别为A、B、C、Z,其中网元A称为头节点网元,网元Z为尾节点网元,网元B、C称为中间节点网元;而网元B、C、Z又可统称为其他节点网元。在单向传输模式下,报文由网元A发出,经网元B、C传输到网元Z;在双向传输模式下,报文由网元A发出,经网元B、C传到网元Z,然后再由网元Z发出报文,网元Z发出的报文经网元B、C传输到网元A。在此,可以将由网元A到Z的传输方向称为正向传输,由网元Z到A的传输方向称为反向传输。
在不同的传输模式下,待检测隧道中各个网元的报文统计结果不同。在本发明实施例中,主要是基于某个网元节点收到的和发出的报文的数目是否符合要求来确定该网元节点是否发生故障的。
例如,在单向传输模式下,若某个网元为头节点网元,所述头节点网元的报文统计结果中包括所述头节点网元发出的报文数目。若某个其他节点网元为头节点网元和尾节点网元之间的中间节点网元,所述中间节点网元的报文统计结果中包括所述中间节点网元收到和发出的报文数目。若某个其他节点网元为尾节点网元,所述尾节点网元的报文统计结果中包括所述尾节点网元收到的报文数目。
此时,若所述头节点网元发出的报文数目与预设发送报文数目不符,则确定所述头节点网元发生故障;若所述中间节点网元收到的和/或发出的报文数目与所述中间节点网元的上一节点网元发出的报文数目不符,则确定所述中间节点网元发生故障;若所述尾节点网元收到的报文数目与所述尾节点网元的上一节点网元发出的报文数目不符,则确定所述尾节点网元发生故障。否则认为各节点正常工作。
又例如,在双向传输模式下,若某个网元为头节点网元,所述头节点网元的报文统计结果中包括所述头节点网元正向发出的报文数目和反向收到的报文数目。若某个其他节点网元为头节点网元和尾节点网元之间的中间节点网元,所述中间节点网元的报文统计结果中包括所述中间节点网元收到和发出的报文数目。若某个其他节点网元为尾节点网元,所述尾节点网元的报文统计结果中包括所述尾节点网元收到的报文数目和发出的报文数目。
此时,若所述头节点网元正向发出的报文数目与预设发送报文数目不符或所述头节点网元反向接收的报文数目与所述头节点网元的上一节点网元发出的报文数目不符,则确定所述头节点网元发生故障;若所述中间节点网元收到的和/或发出的报文数目与所述中间节点网元的上一节点网元发出的报文数目不符,则确定所述中间节点网元发生故障;若所述尾节点网元收到的和/或发出的报文数目与所述尾节点网元的上一节点网元发出的报文数目不符,则确定所述尾节点网元发生故障。
通过上述描述可以看出,在本发明实施例中,服务器可根据各网元的收到的和/或发出的报文数目确定网元是否发生故障,从而准确的定位出发生故障的网元,方便维护人员准确的解决网络的故障,进而保证了网络中业务的运行。
如图2所示,本发明实施例二的网络故障检测方法,由网元执行,包括:
步骤21、接收服务器发送的报文统计指令。
步骤22、根据所述报文统计指令统计收到的和/或发出的报文数目。
例如,在单向传输模式下,若某个网元为头节点网元,所述头节点网元的报文统计结果中包括所述头节点网元发出的报文数目。若某个其他节点网元为头节点网元和尾节点网元之间的中间节点网元,所述中间节点网元的报文统计结果中包括所述中间节点网元收到和发出的报文数目。若某个其他节点网元为尾节点网元,所述尾节点网元的报文统计结果中包括所述尾节点网元收到的报文数目。
又例如,在双向传输模式下,若某个网元为头节点网元,所述头节点网元的报文统计结果中包括所述头节点网元正向发出的报文数目和反向收到的报文数目。若某个其他节点网元为头节点网元和尾节点网元之间的中间节点网元,所述中间节点网元的报文统计结果中包括所述中间节点网元收到和发出的报文数目。若某个其他节点网元为尾节点网元,所述尾节点网元的报文统计结果中包括所述尾节点网元收到的报文数目和发出的报文数目。
步骤23、向所述服务器发送报文统计结果,在所述报文统计结果中包括收到的和/或发出的报文数目。
通过上述描述可以看出,在本发明实施例中,服务器可根据各网元的收到的和/或发出的报文数目确定网元是否发生故障,从而准确的定位出发生故障的网元,方便维护人员准确的解决网络的故障,进而保证了网络中业务的运行。
如图3所示,本发明实施例三的网络故障检测方法,包括:
步骤31、客户端向服务器发送网络故障检测指令。
其中,在所述网络故障检测指令中包括待检测隧道为由网元A到网元Z之间的隧道1,其对应的标识为隧道1。
此外,在所述网络故障检测指令中还可包括检测配置参数,包括:检测模式,包长,重复次数,超时时间,回复模式,带宽,优先级,检测时间等。其中,所述检测模式包括慢Ping检测模式和快Ping检测模式两种。对于慢Ping检测模式来说,它所需要的参数包括包长,重复次数,超时时间,回复模式;对于快Ping检测模式来说,它所需要的参数包括带宽,优先级,检测时间,回复模式。
步骤32、服务器根据所述待检测隧道的标识确定所述待检测隧道包括的网元。
假设,在此步骤中服务器根据自身存储的隧道配置信息确定隧道1包括的网元分别为网元A、网元B和网元Z。其中,网元A为头节点,网元Z为尾节点。
步骤33、服务器获取检测配置参数,并将其发送给头节点网元A。
由于头节点主要用于向他节点发送报文,因此,在此实施例中,可只将检测配置参数发送给头节点网元A,用于指示头节点网元A按照检测配置参数发送报文。
步骤34、服务器向各网元发送报文统计指令。
具体的,在此步骤中可先向网元B和网元Z发送报文统计指令,然后经过3s后再向网元A发送报文统计指令。之后,网元A开始发送报文,该报文经网元B传输到网元Z;若双向传输,则网元Z发送的报文再经网元B传输到网元A。在此实施例中,假设需要发送的报文数目为5个。
步骤35、各网元根据报文统计指令统计各自的报文数目。
如果是单向传输,即报文仅从网元A传输到网元Z,那么对于网元A来讲,它需要统计其发出的报文数目,对于网元Z来讲,它需要统计其收到的报文数目,对于网元Z来讲,它则需要统计其收到的和发出的报文数目。
如果是双向传输,即报文从网元A传输到网元Z(正向)后再由网元Z传输到网元Z(反向),那么对于网元A来讲,它需要统计其正向发出的和反向接收的报文数目,对于网元Z来讲,它需要统计其正向收到的和反向发出的报文数目,对于网元Z来讲,它则需要统计其正反向收到的和发出的报文数目。
步骤36、各网元向服务器发送报文统计结果,在结果中包括各网元统计的报文数目。
步骤37、显示各网元的报文统计结果。
具体的,在此步骤中显示各网元收到的和发出的报文数目。
步骤38、服务器根据各网元的报文统计结果确定各网元是否发生故障。
在此实施例中报文以单向传输为例。假设,经分析,网元A发出的报文数目是5,网元B收到的报文数目是5,发出的报文数目是4,网元Z收到的报文数目是4。那么可以确定网元B发生故障。
又假设,经分析,网元A发出的报文数目是4,网元B收到的报文数目是4,发出的报文数目是4,网元Z收到的报文数目是3。那么可以确定A和网元Z发生故障。
在此实施例中报文以双向传输为例。假设,经分析,网元A正向发出的报文数目是5,网元B正向收到的报文数目是5,正向发出的报文数目是4,网元Z正向收到的报文数目是4。网元Z反向发出的报文数目是4,网元B反向收到的和发出的报文数目分别是3和3,网元A反向收到的报文数目是2。那么,可确定网元B、A发生故障。
在图3中仅示出了头节点网元和服务器的发送报文统计指令、统计报文数目和上报报文统计结果的过程,其他节点的上述过程可参照图3中的相应描述执行。
通过上述描述可以看出,在本发明实施例中,服务器可根据各网元的收到的和/或发出的报文数目确定网元是否发生故障,从而准确的定位出发生故障的网元,方便维护人员准确的解决网络的故障,进而保证了网络中业务的运行;而且该方案简单,容易实现。
如图4所示,本发明实施例四的网络故障检测装置,包括:
接收单元41,用于接收客户端的网络故障检测指令,在所述网络故障检测指令中包括待检测隧道的标识;确定单元42,用于根据所述待检测隧道的标识确定所述待检测隧道包括的网元;发送单元43,用于向所述网元发送报文统计指令,使得所述网元根据所述报文统计指令统计所述网元收到的和/或发出的报文数目;处理单元44,用于接收所述网元发送的报文统计结果,根据所述报文统计结果确定所述网元是否发生故障,其中所述报文统计结果中包括所述网元收到的和/或发出的报文数目。
在具体应用中,所述网元包括:头节点网元,其他节点网元。此时,所述发送单元43具体用于:先向所述其他节点网元发送报文统计指令,间隔预设时间后,向所述头节点网元发送所述报文统计指令。其中,所述预设时间可以设置为3s。
为了使得报文准确传输,在所述网络故障检测指令中还包括检测配置参数。因此,所述发送单元43还用于,向所述头节点网元发送检测配置参数。
具体的,所述处理单元44包括:
接收模块,用于接收所述网元发送的报文统计结果;解析模块,用于在单向传输报文时解析所述网元发送的报文统计结果;若所述网元为头节点网元,所述头节点网元的报文统计结果中包括所述头节点网元发出的报文数目;若所述其他节点网元为头节点网元和尾节点网元之间的中间节点网元,所述中间节点网元的报文统计结果中包括所述中间节点网元收到和发出的报文数目;若所述其他节点网元为尾节点网元,所述尾节点网元的报文统计结果中包括所述尾节点网元收到的报文数目;
处理模块,用于在单向传输报文时,若所述头节点网元发出的报文数目与预设发送报文数目不符,则确定所述头节点网元发生故障;若所述中间节点网元收到的和/或发出的报文数目与所述中间节点网元的上一节点网元发出的报文数目不符,则确定所述中间节点网元发生故障;若所述尾节点网元收到的报文数目与所述尾节点网元的上一节点网元发出的报文数目不符,则确定所述尾节点网元发生故障。
具体的,所述处理单元44又可包括:
接收模块,用于接收所述网元发送的报文统计结果;
解析模块,用于在双向传输报文时解析所述网元发送的报文统计结果;若所述网元为头节点网元,所述头节点网元的报文统计结果中包括所述头节点网元正向发出的报文数目和反向收到的报文数目;若所述其他节点网元为头节点网元和尾节点网元之间的中间节点网元,所述中间节点网元的报文统计结果中包括所述中间节点网元收到和发出的报文数目;若所述其他节点网元为尾节点网元,所述尾节点网元的报文统计结果中包括所述尾节点网元收到的报文数目和发出的报文数目;
处理模块,用于在双向传输报文时,若所述头节点网元正向发出的报文数目与预设发送报文数目不符或所述头节点网元反向接收的报文数目与所述头节点网元的上一节点网元发出的报文数目不符,则确定所述头节点网元发生故障;若所述中间节点网元收到的和/或发出的报文数目与所述中间节点网元的上一节点网元发出的报文数目不符,则确定所述中间节点网元发生故障;若所述尾节点网元收到的和/或发出的报文数目与所述尾节点网元的上一节点网元发出的报文数目不符,则确定所述尾节点网元发生故障。
由上述处理单元的功能可以看出,两种形式的处理单元结相同,只是在不同的报文传输模式下执行了不同的功能。因此,在具体应用中可将上述两种形式的处理单元可以合成为一种形式,使其在不同的报文传输模式下执行与该传输模式对应的功能。
由于检测模式的不同,所以网元发送报文统计结果的方式不同。当检测模式为慢Ping检测模式时,所述接收模块具体用于在头节点发送报文的次数到达重复次数这一参数的要求时,接收所述网元发送的报文统计结果;当检测模式为快Ping检测模式时,所述接收模块具体用于:在检测时间到时时,接收所述网元发送的报文统计结果。
本发明装置的工作原理可参照前述方法实施例的描述,该装置可位于服务器中。
通过上述描述可以看出,在本发明实施例中,服务器可根据各网元的收到的和/或发出的报文数目确定网元是否发生故障,从而准确的定位出发生故障的网元,方便维护人员准确的解决网络的故障,进而保证了网络中业务的运行。
如图5所示,本发明实施例五的网络故障检测装置,其特征在于,包括:
接收单元51,用于接收服务器发送的报文统计指令;统计单元52,用于根据所述报文统计指令统计收到的和/或发出的报文数目;发送单元53,用于向所述服务器发送报文统计结果,在所述报文统计结果中包括收到的和/或发出的报文数目。
此外,所述接收单元51还用于,接收所述服务器发送的检测配置参数;所述检测配置参数包括:检测模式;当检测模式为慢Ping检测模式时,所述检测配置参数还包括:包长,重复次数,超时时间,检测时间;当检测模式为快Ping检测模式时,所述检测配置参数还包括:包长,带宽,优先级,检测时间。此时,所述发送单元53具体用于:当检测模式为慢Ping检测模式时,在头节点发送报文的次数到达重复次数这一参数的要求时,接收所述网元发送的报文统计结果;当检测模式为快Ping检测模式时,在所述检测时间到时时,接收所述网元发送的报文统计结果。
本发明装置的工作原理可参照前述方法实施例的描述,该装置可位于各个网元中。
通过上述描述可以看出,在本发明实施例中,服务器可根据各网元的收到的和/或发出的报文数目确定网元是否发生故障,从而准确的定位出发生故障的网元,方便维护人员准确的解决网络的故障,进而保证了网络中业务的运行。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种网络故障检测方法,其特征在于,包括:
服务器接收客户端发送的包含检测配置参数和待检测隧道的标识的网络故障检测指令,并根据所述待检测隧道的标识确定所述待检测隧道包括的网元,所述网元包括:头节点网元和其他节点网元;
服务器将所述检测配置参数发送给所述头节点网元后,再向所述待检测隧道的所包括的网元分别发送报文统计指令,以便所述头节点网元接收到报文统计指令后按照所述检测配置参数向所述其他节点网元发送报文,使得所述网元根据所述报文统计指令统计所述网元收到的和/或发出的报文数目;
服务器接收所述网元发送的报文统计结果,根据所述报文统计结果确定所述网元是否发生故障,其中所述报文统计结果中包括所述网元收到的和/或发出的报文数目;
其中,所述检测配置参数包括:检测模式;
当检测模式为慢Ping检测模式时,所述检测配置参数还包括:包长,重复次数,超时时间,回复模式;当检测模式为快Ping检测模式时,所述检测配置参数还包括:带宽,优先级,检测时间,回复模式。
2.根据权利要求1所述的方法,其特征在于,所述向所述待检测隧道的所包括的网元发送报文统计指令包括:
先向所述其他节点网元发送报文统计指令,间隔预设时间后,向所述头节点网元发送所述报文统计指令。
3.根据权利要求1所述的方法,其特征在于,
当检测模式为慢Ping检测模式时,所述接收所述网元发送的报文统计结果具体为:在所述头节点发送报文的次数到达重复次数这一参数的要求时,接收所述网元发送的报文统计结果;
当检测模式为快Ping检测模式时,所述接收所述网元发送的报文统计结果具体为:在所述检测时间到时时,接收所述网元发送的报文统计结果。
4.根据权利要求1-3任一所述的方法,其特征在于,当单向传输报文时,所述接收所述网元发送的报文统计结果,根据所述报文统计结果确定所述网元是否发生故障,其中所述报文统计结果中包括所述网元收到和/或发出的报文数目包括:
若所述网元为头节点网元,所述头节点网元的报文统计结果中包括所述头节点网元发出的报文数目;若所述头节点网元发出的报文数目与预设发送报文数目不符,则确定所述头节点网元发生故障;
若所述其他节点网元为头节点网元和尾节点网元之间的中间节点网元,所述中间节点网元的报文统计结果中包括所述中间节点网元收到和发出的报文数目;若所述中间节点网元收到的和/或发出的报文数目与所述中间节点网元的上一节点网元发出的报文数目不符,则确定所述中间节点网元发生故障;
若所述其他节点网元为尾节点网元,所述尾节点网元的报文统计结果中包括所述尾节点网元收到的报文数目;若所述尾节点网元收到的报文数目与所述尾节点网元的上一节点网元发出的报文数目不符,则确定所述尾节点网元发生故障。
5.根据权利要求1-3任一所述的方法,其特征在于,当双向传输报文时,所述接收所述网元发送的报文统计结果,根据所述报文统计结果确定所述网元是否发生故障,其中所述报文统计结果中包括所述网元收到和/或发出的报文数目包括:
若所述网元为头节点网元,所述头节点网元的报文统计结果中包括所述头节点网元正向发出的报文数目和反向收到的报文数目;若所述头节点网元正向发出的报文数目与预设发送报文数目不符或所述头节点网元反向接收的报文数目与所述头节点网元的上一节点网元发出的报文数目不符,则确定所述头节点网元发生故障;
若所述其他节点网元为头节点网元和尾节点网元之间的中间节点网元,所述中间节点网元的报文统计结果中包括所述中间节点网元收到和发出的报文数目;若所述中间节点网元收到的和/或发出的报文数目与所述中间节点网元的上一节点网元发出的报文数目不符,则确定所述中间节点网元发生故障;
若所述其他节点网元为尾节点网元,所述尾节点网元的报文统计结果中包括所述尾节点网元收到的报文数目和发出的报文数目;若所述尾节点网元收到的和/或发出的报文数目与所述尾节点网元的上一节点网元发出的报文数目不符,则确定所述尾节点网元发生故障。
6.一种网络故障检测装置,其特征在于,包括:
接收单元,用于接收客户端发送的包含检测配置参数和待检测隧道的标识的网络故障检测指令;
确定单元,用于根据所述待检测隧道的标识确定所述待检测隧道包括的网元,所述网元包括:头节点网元和其他节点网元;
发送单元,用于将所述检测配置参数发送给所述头节点网元后,再向所述待检测隧道的所包括的网元分别发送报文统计指令,以便所述头节点网元接收到报文统计指令后按照所述检测配置参数向所述其他节点网元发送报文,使得所述网元根据所述报文统计指令统计所述网元收到的和/或发出的报文数目;
处理单元,用于接收所述网元发送的报文统计结果,根据所述报文统计结果确定所述网元是否发生故障,其中所述报文统计结果中包括所述网元收到的和/或发出的报文数目;
其中,所述检测配置参数包括:检测模式;
当检测模式为慢Ping检测模式时,所述检测配置参数还包括:包长,重复次数,超时时间,回复模式;当检测模式为快Ping检测模式时,所述检测配置参数还包括:带宽,优先级,检测时间,回复模式。
7.根据权利要求6所述的装置,其特征在于,所述发送单元具体用于:先向所述其他节点网元发送报文统计指令,间隔预设时间后,向所述头节点网元发送所述报文统计指令。
8.根据权利要求6所述的装置,其特征在于,所述处理单元包括:
接收模块,用于接收所述网元发送的报文统计结果;
解析模块,用于在单向传输报文时解析所述网元发送的报文统计结果;若所述网元为头节点网元,所述头节点网元的报文统计结果中包括所述头节点网元发出的报文数目;若所述其他节点网元为头节点网元和尾节点网元之间的中间节点网元,所述中间节点网元的报文统计结果中包括所述中间节点网元收到和发出的报文数目;若所述其他节点网元为尾节点网元,所述尾节点网元的报文统计结果中包括所述尾节点网元收到的报文数目;
处理模块,用于在单向传输报文时,若所述头节点网元发出的报文数目与预设发送报文数目不符,则确定所述头节点网元发生故障;若所述中间节点网元收到的和/或发出的报文数目与所述中间节点网元的上一节点网元发出的报文数目不符,则确定所述中间节点网元发生故障;若所述尾节点网元收到的报文数目与所述尾节点网元的上一节点网元发出的报文数目不符,则确定所述尾节点网元发生故障。
9.根据权利要求6所述的装置,其特征在于,所述处理单元包括:
接收模块,用于接收所述网元发送的报文统计结果;
解析模块,用于在双向传输报文时解析所述网元发送的报文统计结果;若所述网元为头节点网元,所述头节点网元的报文统计结果中包括所述头节点网元正向发出的报文数目和反向收到的报文数目;若所述其他节点网元为头节点网元和尾节点网元之间的中间节点网元,所述中间节点网元的报文统计结果中包括所述中间节点网元收到和发出的报文数目;若所述其他节点网元为尾节点网元,所述尾节点网元的报文统计结果中包括所述尾节点网元收到的报文数目和发出的报文数目;
处理模块,用于在双向传输报文时,若所述头节点网元正向发出的报文数目与预设发送报文数目不符或所述头节点网元反向接收的报文数目与所述头节点网元的上一节点网元发出的报文数目不符,则确定所述头节点网元发生故障;若所述中间节点网元收到的和/或发出的报文数目与所述中间节点网元的上一节点网元发出的报文数目不符,则确定所述中间节点网元发生故障;若所述尾节点网元收到的和/或发出的报文数目与所述尾节点网元的上一节点网元发出的报文数目不符,则确定所述尾节点网元发生故障。
10.根据权利要求8或9所述的装置,其特征在于,当检测模式为慢Ping检测模式时,所述接收模块具体用于在头节点发送报文的次数到达重复次数这一参数的要求时,接收所述网元发送的报文统计结果;
当检测模式为快Ping检测模式时,所述接收模块具体用于:在检测时间到时时,接收所述网元发送的报文统计结果。
CN201610014741.4A 2016-01-08 2016-01-08 一种网络故障检测方法及装置 Active CN106961344B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201610014741.4A CN106961344B (zh) 2016-01-08 2016-01-08 一种网络故障检测方法及装置
PCT/CN2016/080400 WO2016197736A1 (zh) 2016-01-08 2016-04-27 一种网络故障检测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610014741.4A CN106961344B (zh) 2016-01-08 2016-01-08 一种网络故障检测方法及装置

Publications (2)

Publication Number Publication Date
CN106961344A CN106961344A (zh) 2017-07-18
CN106961344B true CN106961344B (zh) 2021-02-09

Family

ID=57502903

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610014741.4A Active CN106961344B (zh) 2016-01-08 2016-01-08 一种网络故障检测方法及装置

Country Status (2)

Country Link
CN (1) CN106961344B (zh)
WO (1) WO2016197736A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109560945B (zh) 2017-09-25 2021-02-12 华为技术有限公司 业务服务质量的检测方法、设备及系统
CN109728931B (zh) * 2017-10-31 2021-06-15 华为技术有限公司 网络的故障定界方法、装置以及计算机存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1815970A (zh) * 2005-02-01 2006-08-09 华为技术有限公司 一种检测网络链路故障并定位故障的方法
CN102355383A (zh) * 2011-09-28 2012-02-15 深圳市深信服电子科技有限公司 一种检测网络节点故障的方法和系统
CN102594600A (zh) * 2012-02-21 2012-07-18 中兴通讯股份有限公司 一种确定双向转发检测会话故障位置的方法及系统
CN104601407A (zh) * 2015-01-23 2015-05-06 北京奥普维尔科技有限公司 一种网络智能测试方法
US20160006634A1 (en) * 2013-03-15 2016-01-07 Huawei Technologies Co., Ltd. Network Performance Monitoring Method and Apparatus

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101232343B (zh) * 2008-01-21 2012-03-07 中兴通讯股份有限公司 一种定位嵌入控制通路故障的方法
CN101808021A (zh) * 2010-04-16 2010-08-18 华为技术有限公司 故障检测方法、装置及系统以及报文统计方法、节点设备
CN102137282B (zh) * 2010-12-15 2014-02-19 华为技术有限公司 一种检测故障链路的方法、装置、节点和系统
CN102868553B (zh) * 2012-08-28 2016-03-30 华为技术有限公司 故障定位方法及相关设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1815970A (zh) * 2005-02-01 2006-08-09 华为技术有限公司 一种检测网络链路故障并定位故障的方法
CN102355383A (zh) * 2011-09-28 2012-02-15 深圳市深信服电子科技有限公司 一种检测网络节点故障的方法和系统
CN102594600A (zh) * 2012-02-21 2012-07-18 中兴通讯股份有限公司 一种确定双向转发检测会话故障位置的方法及系统
US20160006634A1 (en) * 2013-03-15 2016-01-07 Huawei Technologies Co., Ltd. Network Performance Monitoring Method and Apparatus
CN104601407A (zh) * 2015-01-23 2015-05-06 北京奥普维尔科技有限公司 一种网络智能测试方法

Also Published As

Publication number Publication date
CN106961344A (zh) 2017-07-18
WO2016197736A1 (zh) 2016-12-15

Similar Documents

Publication Publication Date Title
CN111052668B (zh) 用于优化网络服务的驻留时间测量
US20090003241A1 (en) A Method and System For Obtaining Path Maximum Transfer Unit in Network
EP3295612B1 (en) Uplink performance management
CN104917641A (zh) 一种用于测试丢包的方法、测试设备和系统
CN102195832A (zh) 一种环回测试方法、装置及系统
US10097366B2 (en) Methods, systems, and computer readable media for monitoring latency and/or time-based data locations of multicast communications
CN101808021A (zh) 故障检测方法、装置及系统以及报文统计方法、节点设备
EP1746769A1 (en) Measurement system and method of measuring a transit metric
CN102325060B (zh) 一种链路带宽测试的方法和路由器
CN106961344B (zh) 一种网络故障检测方法及装置
CN103139014A (zh) 基于旁路的网络质量评测方法及装置
CN108683568B (zh) 一种vpn业务通道质量分段检测的方法及系统
JP2006246118A (ja) 品質劣化切り分け方法、及びその装置
CN102487338A (zh) 根据网络抖动调整bfd发送间隔的方法及装置
KR101866377B1 (ko) Sdn상의 멀티캐스트 패킷 손실 위치 탐지 방법
JP4169725B2 (ja) パケット廃棄箇所探索方法及び装置
CN105471667A (zh) 一种组播链路的检测方法、网络设备及服务器
KR20120093548A (ko) 무선통신시스템에서 네트워크 품질을 측정하기 위한 장치 및 방법
KR101831165B1 (ko) Ntp 서버와 ntp 클라이언트 간 시각 동기 상태의 실시간 모니터링 및 분석 장치
CN101155078A (zh) 一种快速定位ip网络故障的方法
WO2022007969A1 (en) Network error performance measurement
JP3953999B2 (ja) 輻輳検知装置、tcpトラヒックの輻輳検知方法およびプログラム
EP2712121A1 (en) Method, apparatus and system for detecting packet path signal degraded
JP6378653B2 (ja) サービス影響原因推定装置、サービス影響原因推定プログラム、及びサービス影響原因推定方法
CN112787881A (zh) 通信链路检测方法、通信装置、存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant