CN112202592B - 告警延迟诊断方法、系统及可读存储介质 - Google Patents
告警延迟诊断方法、系统及可读存储介质 Download PDFInfo
- Publication number
- CN112202592B CN112202592B CN202010910580.3A CN202010910580A CN112202592B CN 112202592 B CN112202592 B CN 112202592B CN 202010910580 A CN202010910580 A CN 202010910580A CN 112202592 B CN112202592 B CN 112202592B
- Authority
- CN
- China
- Prior art keywords
- link
- alarm
- network
- network management
- state information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0695—Management of faults, events, alarms or notifications the faulty arrangement being the maintenance, administration or management system
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0823—Errors, e.g. transmission errors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0852—Delays
Abstract
本发明提供一种告警延迟诊断方法、系统及可读存储介质,该方法包括:设备侧对连接网管侧以及设备侧的网络链路的状态进行监测,得到网络链路的链路状态信息;将告警信息以及链路状态信息发送至网管侧;当存在告警延迟时,网管侧基于告警信息以及链路状态信息,检测告警延迟是否因为链路故障导致;若告警延迟因为链路故障导致,则基于链路状态信息确定存在故障的链路。通过本发明,在设备侧上报告警信息的同时,上报网络链路状态信息,网管侧通过分析设备侧上传的信息,就可以诊断出告警延迟是否由链路故障引起,并能够定位出故障链路的位置,为快速发现链路故障、排除故障提供了有力的技术支撑。
Description
技术领域
本发明涉及网络运维技术领域,尤其涉及告警延迟诊断方法、系统及可读存储介质。
背景技术
设备上报告警信息,通常采用“上报-确认”机制。即:当出现新的告警或者已报告警结束,则设备向网管上报一条告警消息,网管接收到设备上报的告警消息后,给设备发送确认报文。
目前,网管只能通过对比接收到告警消息的时刻与告警消息中包含的告警消息产生时刻或告警结束时刻,当两时刻的时间差超过阈值时,判断发生告警延迟。这种机制下,当设备与网管通信的链路出现故障时,会导致设备的告警消息无法及时上报给网管,待网络恢复后再上报,网管会确定发生了告警延迟;当网管的数据处理发生阻塞时,网管也会确定发生了告警延迟。
根据现有的方案,网管无法确定告警延迟是否因为链路故障导致,还是因为网管的数据处理发生阻塞导致,也就更无法进行故障定位。
发明内容
本发明的主要目的在于提供一种告警延迟诊断方法、系统及可读存储介质,旨在解决现有技术中网管无法判断告警延迟是否因为链路故障导致,以及无法对存在故障的链路进行定位的技术问题。
第一方面,本发明提供一种告警延迟诊断方法,所述告警延迟诊断方法包括:
设备侧对连接网管侧以及所述设备侧的网络链路的状态进行监测,得到所述网络链路的链路状态信息,其中,所述链路状态信息包括链路中断时间区间以及中断起始设备侧的IP地址;
将告警信息以及所述链路状态信息发送至所述网管侧,其中,所述告警信息包含告警产生时刻或告警结束时刻;
当存在告警延迟时,所述网管侧基于所述告警信息以及所述链路状态信息,检测告警延迟是否因为链路故障导致;
若告警延迟因为链路故障导致,则基于所述链路状态信息确定存在故障的链路。
可选的,所述设备侧对连接网管侧以及所述设备侧的网络链路的状态进行监测,得到所述网络链路的链路状态信息的步骤包括:
每隔预设时间间隔,设备侧通过连接网管侧以及所述设备侧的网络链路,发送一次目的地址为网管侧的IP地址的链路探测报文,其中,每次发送所述链路探测报文后,若在预设时长内接收到所述网管侧反馈的第一应答报文,则确定网络链路处于连通状态,否则确定所述网络链路处于断开状态;
当第N次发送所述链路探测报文后,确定所述网络链路由连通状态改变为断开状态,则以第N次发送所述链路探测报文的时刻为网络断开起始时刻t1;
当第M次发送所述链路探测报文后,确定所述网络链路由断开状态改变为连通状态,则以第M次发送所述链路探测报文的时刻为网络断开结束时刻t2;
根据第N次发送所述链路探测报文后,接收到的第二应答报文确定中断起始设备侧,并获取所述中断起始设备侧的IP地址,其中,所述第二应答报文来自所述网络链路中与所述设备侧可正常通信的其他设备侧;
以所述t1至t2对应的时间区间为链路中断时间区间,综合所述中断起始设备侧的IP地址以及所述链路中断时间区间得到所述网络链路的链路状态信息。
可选的,所述根据第N次发送所述链路探测报文后,接收到的第二应答报文确定中断起始设备侧,并获取所述中断起始设备侧的IP地址的步骤包括:
根据第N次发送所述链路探测报文后,接收到的第二应答报文,确定所述网络链路中与所述设备侧可正常通信的设备侧组;
以所述设备侧组中最靠近网管侧的设备侧作为中断起始设备侧,并获取所述中断起始设备侧的IP地址。
可选的,在所述设备侧对连接网管侧以及所述设备侧的网络链路的状态进行监测,得到所述网络链路的链路状态信息的步骤之后,还包括:
将所述链路状态信息放入消息栈中。
可选的,所述将告警信息以及所述链路状态信息发送至所述网管侧的步骤包括:
当存在待上报的告警信息时,将所述告警信息以及所述消息栈中位于栈顶的链路状态信息发送至所述网管侧。
可选的,所述网管侧基于所述告警信息以及所述链路状态信息,检测告警延迟是否因为链路故障导致的步骤包括:
所述网管侧从所述告警信息以及所述链路状态信息中获取所述告警产生时刻或告警结束时刻以及链路中断时间区间;
检测所述告警产生时刻或告警结束时刻是否处于所述链路中断时间区间;
若处于,则确定告警延迟是因为链路故障导致。
可选的,所述基于所述链路状态信息确定存在故障的链路的步骤包括:
从所述链路状态信息中获取所述中断起始设备侧的IP地址,确定所述中断起始设备侧的IP地址对应的中断起始设备侧至所述网管侧所对应的链路为存在故障的链路。
第二方面,本发明还提供一种告警延迟诊断系统,所述告警延迟诊断系统包括:
设备侧,用于:
对连接网管侧以及所述设备侧的网络链路的状态进行监测,得到所述网络链路的链路状态信息,其中,所述链路状态信息包括链路中断时间区间以及中断起始设备侧的IP地址;
将告警信息以及所述链路状态信息发送至所述网管侧,其中,所述告警信息包含告警产生时刻或告警结束时刻;
网管侧,用于:
当存在告警延迟时,基于所述告警信息以及所述链路状态信息,检测告警延迟是否因为链路故障导致;
若告警延迟因为链路故障导致,则基于所述链路状态信息确定存在故障的链路。
第三方面,本发明还提供一种可读存储介质,所述可读存储介质上存储有告警延迟诊断程序,其中所述告警延迟诊断程序被处理器执行时,实现如上所述的告警延迟诊断方法的步骤。
本发明中,设备侧对连接网管侧以及所述设备侧的网络链路的状态进行监测,得到所述网络链路的链路状态信息,其中,所述链路状态信息包括链路中断时间区间以及中断起始设备侧的IP地址;将告警信息以及所述链路状态信息发送至所述网管侧,其中,所述告警信息包含告警产生时刻或告警结束时刻;当存在告警延迟时,所述网管侧基于所述告警信息以及所述链路状态信息,检测告警延迟是否因为链路故障导致;若告警延迟因为链路故障导致,则基于所述链路状态信息确定存在故障的链路。通过本发明,在设备侧向网管侧上报的告警信息的同时,上报链路状态信息,由于告警信息中包含告警产生时间或者告警结束时间,链路状态信息中包含链路中断时间区间,当存在告警延迟时,网管侧通过检测告警产生时间或者告警结束时间是否处于链路中断时间区间,即可判断告警延迟是否由于链路故障导致,而且,在确定告警延迟是由于链路故障导致时,还可以进一步根据中断起始设备侧的IP地址,定位出故障链路的位置,为快速发现网络链路故障、排除故障提供了有力的技术支撑。
附图说明
图1为本发明告警延迟诊断方法一实施例的流程示意图;
图2为一实施例中网络拓扑示意图;
图3为一实施例中告警报文的帧格式的示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
第一方面,本发明实施例提供了一种告警延迟诊断方法。
参照图1,图1为本发明告警延迟诊断方法一实施例的流程示意图。如图1所示,告警延迟诊断方法包括:
步骤S10,设备侧对连接网管侧以及所述设备侧的网络链路的状态进行监测,得到所述网络链路的链路状态信息,其中,所述链路状态信息包括链路中断时间区间以及中断起始设备侧的IP地址;
本实施例中,设备侧指网络拓扑中的各个设备侧。参照图2,图2为一实施例中网络拓扑示意图。如图2所示,对设备D而言,连接网管侧以及设备D的网络链路即为设备D到设备B到设备A再到网管侧,则设备D便是对这条由设备D到设备B到设备A再到网管侧的网络链路的状态进行监测,得到这条网络链路的链路状态信息。对设备C而言,连接网管侧以及设备C的网络链路即为设备C到设备A再到网管侧,则设备C便是对这条由设备C到设备A再到网管侧的网络链路的状态进行监测,得到这条网络链路的链路状态信息。以此类推,网络拓扑中的其他设备侧对连接其本身以及网管侧的网络链路进行监测,得到对应的网络链路的链路状态信息。其中,链路状态信息包含包括链路中断时间区间以及中断起始设备侧的IP地址。
以设备侧D为例,将连接设备侧D以及网管侧的网络链路称为网络链路1,则设备侧D对网路链路1的状态进行监测,需要得到网络链路1的中断时间区间,即得到网络链路1在什么时间段上是处于中断状态,以及需要得到中断起始设备侧的IP地址,即网络链路1处于中断状态时,是从网路链路1上的哪个设备侧开始断开了与网管侧的通信连接,以该设备侧为中断起始设备侧,并获取该设备侧的IP地址,即得到中断起始设备侧的IP地址。从而以得到的中断时间区间以及中断起始设备侧的IP地址作为链路状态信息。例如,设备侧D监测到网络链路1在00:00至00:30处于中断状态,且是从设备侧B开始断开了与网管侧的通信连接,则中断时间区间为00:00至00:30,中断起始设备侧的IP地址为设备侧B的IP地址,则链路状态信息为:
中断时间区间:00:00至00:30;中断起始设备侧的IP地址:设备侧B的IP地址。
步骤S20,将告警信息以及所述链路状态信息发送至所述网管侧,其中,所述告警信息包含告警产生时刻或告警结束时刻;
本实施例中,继续以设备侧D为例进行说明。设备侧D在对网络链路1的状态进行监测的同时,还会执行告警监测任务,即监测本设备侧在运行过程中是否存在故障,并在检测到故障时或检测到故障解除时,向网管侧上报告警信息,即告警信息包含告警产生时刻或告警结束时刻。且在上报告警信息时,将对网路链路1进行监测得到的链路状态信息连同告警信息一同上报至网管侧。当然,告警信息还可以包含告警类型、告警代码等信息。
设备侧D可将告警信息以及链路状态信息整合为告警报文,然后将告警报文发送至网管侧。参照图3,图3为一实施例中告警报文的帧格式的示意图。如图3所示,告警报文包含链路中断时间区间、中断起始设备侧的IP地址以及告警产生时刻或告警结束时刻。容易理解的是,当链路存在故障时,告警报文是无法送达网管侧的,为了确保网管侧能收到告警报文,设备侧在发送告警报文后,会等待网管侧的应答,若没有收到应答,就会定期反复上报告警报文,直至链路恢复后,告警报文成功发送至网管侧,且收到网管侧反馈的应答时,确认该告警报文已成功发送至网管侧。
步骤S30,当存在告警延迟时,所述网管侧基于所述告警信息以及所述链路状态信息,检测告警延迟是否因为链路故障导致;
本实施例中,当网管侧在t3时收到来自设备侧D的告警信息以及链路状态信息,则比较t3与告警信息包含的告警产生时刻或告警结束时刻的时间差,当时间差大于阈值时,确定存在告警延迟。其中,阈值根据实际需要进行设置,在此不做限制。当存在告警延迟时,网管侧基于告警信息包含的告警产生时刻或告警结束时刻以及链路状态信息包含的链路中断时间区间,检测告警延迟是否因为链路故障导致。通过检测告警产生时刻或告警结束时刻是否处于链路中断时间区间,即可确定告警延迟是否因为链路故障导致。
进一步地,一实施例中,所述网管侧基于所述告警信息以及所述链路状态信息,检测告警延迟是否因为链路故障导致的步骤包括:
所述网管侧从所述告警信息以及所述链路状态信息中获取所述告警产生时刻或告警结束时刻以及链路中断时间区间;检测所述告警产生时刻或告警结束时刻是否处于所述链路中断时间区间;若处于,则确定告警延迟是因为链路故障导致。
本实施例中,网管侧从告警信息以及链路状态信息中(或是从如图3所示的告警报文中)获取告警产生时刻或告警结束时刻以及链路中断时间区间,然后检测告警产生时刻或告警结束时刻是否处于所述链路中断时间区间,若处于,则说明告警信息是在链路处于中断状态时产生的,而链路中断后,告警信息无法上报给网管侧,因此,确定告警延迟是因为链路故障导致。
步骤S40,若告警延迟因为链路故障导致,则基于所述链路状态信息确定存在故障的链路。
本实施例中,若告警延迟是因为链路故障导致,则进一步根据链路状态信息确定存在故障的链路。其中,由于链路状态信息包含中断起始设备侧的IP地址,则可根据中断起始设备侧的IP地址确定存在故障的链路。
在确定存在故障的链路后,可将该存在故障的链路的相关信息通过语音、图像显示等方式告知运维人员,从而指导运维人员及时对该链路进行检修,提升了网络运营质量。
进一步地,一实施例中,所述基于所述链路状态信息确定存在故障的链路的步骤包括:
从所述链路状态信息中获取所述中断起始设备侧的IP地址,确定所述中断起始设备侧的IP地址对应的中断起始设备侧至所述网管侧所对应的链路为存在故障的链路。
本实施例中,以设备侧D为例,若从链路状态信息中获取的中断起始设备侧的IP地址为设备侧B的IP地址,则确定中断起始设备侧的IP地址对应的中断起始设备侧至网管侧所对应的链路为存在故障的链路,即确定设备侧B到设备侧A再到网管侧所对应的这条链路为存在故障的链路。
本实施例中,设备侧对连接网管侧以及所述设备侧的网络链路的状态进行监测,得到所述网络链路的链路状态信息,其中,所述链路状态信息包括链路中断时间区间以及中断起始设备侧的IP地址;将告警信息以及所述链路状态信息发送至所述网管侧,其中,所述告警信息包含告警产生时刻或告警结束时刻;当存在告警延迟时,所述网管侧基于所述告警信息以及所述链路状态信息,检测告警延迟是否因为链路故障导致;若告警延迟因为链路故障导致,则基于所述链路状态信息确定存在故障的链路。通过本实施例,在设备侧向网管侧上报的告警信息的同时,上报链路状态信息,由于告警信息中包含告警产生时间或者告警结束时间,链路状态信息中包含链路中断时间区间,当存在告警延迟时,网管侧通过检测告警产生时间或者告警结束时间是否处于链路中断时间区间,即可判断告警延迟是否由于链路故障导致,而且,在确定告警延迟是由于链路故障导致时,还可以进一步根据中断起始设备侧的IP地址,定位出故障链路的位置,为快速发现网络链路故障、排除故障提供了有力的技术支撑。
进一步地,一实施例中,所述设备侧对连接网管侧以及所述设备侧的网络链路的状态进行监测,得到所述网络链路的链路状态信息的步骤包括:
步骤S101,每隔预设时间间隔,设备侧通过连接网管侧以及所述设备侧的网络链路,发送一次目的地址为网管侧的IP地址的链路探测报文,其中,每次发送所述链路探测报文后,若在预设时长内接收到所述网管侧反馈的第一应答报文,则确定网络链路处于连通状态,否则确定所述网络链路处于断开状态;
本实施例中,预设时间间隔根据实际需要进行设置,例如设置为10秒。即每隔10秒钟,设备侧通过连接网管侧以及设备侧的网络链路,发送一次目的地址为网管侧的IP地址的链路探测报文。
以设备侧D为例,设备侧D每隔10秒,通过链路1,发送一次目的地址为网管侧的IP地址的链路探测报文。链路1上,所有收到该链路探测报文的节点均会回复应答报文。例如,链路探测报文被设备侧B接收到后,设备侧B转发给设备侧A,并回复应答报文1给设备侧D,设备侧D收到应答报文1后,便确定设备侧B收到了链路探测报文;设备侧A收到链路探测报文后,将链路探测报文转发给网管侧,并回复应答报文2给设备侧D,设备侧D收到应答报文2后,便确定设备侧A收到了链路探测报文;当网管侧收到链路探测报文后,回复应答报文3给设备侧D,设备侧D收到应答报文3后,便确定网管侧收到了链路探测报文。容易理解的是,每次发送链路探测报文后,若在预设时长内接收到网管侧反馈的第一应答报文,则说明设备D与网管侧的通信连接是正常的,即可确定连接设备D与网管侧的网络链路处于连通状态;若某次发送链路探测报文后,经过预设时长,为未接收到网管侧反馈的第一应答报文,则说明设备D与网管侧的通信连接不正常,即可确定连接设备D与网管侧的网络链路处于断开状态。
步骤S102,当第N次发送所述链路探测报文后,确定所述网络链路由连通状态改变为断开状态,则以第N次发送所述链路探测报文的时刻为网络断开起始时刻t1;
本实施例中,当N次发送链路探测报文后,在预设时长内未接收到网管侧反馈的第一应答报文,而在第N-1发送链路探测报文后,在预设时长内接收到网管侧反馈的第一应答报文,则说明网络链路由连通状态改变为断开状态,并以此次发送链路探测报文的时刻为网络断开起始时刻t1。
步骤S103,当第M次发送所述链路探测报文后,确定所述网络链路由断开状态改变为连通状态,则以第M次发送所述链路探测报文的时刻为网络断开结束时刻t2;
本实施例中,在第N次发送链路探测报文后,经过预设时间间隔,会再次发送链路探测报文(即第N+1次发送链路探测报文),直至当第M次发送所述链路探测报文后,在预设时长内接收到网管侧反馈的第一应答报文,而在第M-1次发送链路探测报文后,在预设时长内未接收到网管侧反馈的第一应答报文,则说明网络链路由断开状态改变为连通状态,并以此次发送链路探测报文的时刻为网络断开结束时刻t2。
步骤S104,根据第N次发送所述链路探测报文后,接收到的第二应答报文确定中断起始设备侧,并获取所述中断起始设备侧的IP地址,其中,所述第二应答报文来自所述网络链路中与所述设备侧可正常通信的其他设备侧;
本实施例中,以设备侧D为例,在第N次发送链路探测报文后,与设备侧D正常通信的其他设备侧会回复第二应答报文给设备侧D。若第N次发送所述链路探测报文后,接收到的第二应答报文包括设备侧B回复的应答报文1以及设备侧A回复的应答报文2,则从设备侧B以及设备侧A中确定中断起始设备侧,并获取中断起始设备侧的IP地址。
进一步的,一实施例中,所述根据第N次发送所述链路探测报文后,接收到的第二应答报文确定中断起始设备侧,并获取所述中断起始设备侧的IP地址的步骤包括:
根据第N次发送所述链路探测报文后,接收到的第二应答报文,确定所述网络链路中与所述设备侧可正常通信的设备侧组;以所述设备侧组中最靠近网管侧的设备侧作为中断起始设备侧,并获取所述中断起始设备侧的IP地址。
本实施例中,以设备侧D为例,若第N次发送所述链路探测报文后,接收到的第二应答报文包括设备侧B回复的应答报文1以及设备侧A回复的应答报文2,则可确定网络链路1中与设备侧D可正常通信的设备侧组包括设备侧B以及设备侧A。然后从设备侧B以及设备侧A中选择最靠近网管侧的设备侧,作为中断起始设备侧。如图2所示,设备侧B以及设备侧A中最靠近网管侧的设备侧为设备侧A,则以设备侧A作为中断起始设备侧,并获取中断起始设备侧的IP地址,即获取设备侧A的IP地址。
步骤S105,以所述t1至t2对应的时间区间为链路中断时间区间,综合所述中断起始设备侧的IP地址以及所述链路中断时间区间得到所述网络链路的链路状态信息。
本实施例中,以t1至t2对应的时间区间为链路中断时间区间,综合链路中断时间区间以及中断起始设备侧的IP地址,即可得到网络链路的链路状态信息。
本实施例中,通过设备侧向网管侧发送链路探测报文的形式,实现了对网络链路的状态进行监测,从而使得设备侧向网管侧上报告警信息的同时,可上报网络链路的链路状态信息,以供网管侧基于设备侧上报的信息诊断出告警延迟是否由链路故障引起,并能够定位出故障链路的位置。
容易理解的是,随着监测时长的增加,基于上述实施例,又会得到新的链路状态信息。
进一步地,一实施例中,在步骤S10之后,还包括:
将所述链路状态信息放入消息栈中。
本实施例中,将得到的链路状态信息放入消息栈中,在需要上报时,直接从消息栈中获取即可。
进一步地,一实施例中,所述将告警信息以及所述链路状态信息发送至所述网管侧的步骤包括:
当存在待上报的告警信息时,将所述告警信息以及所述消息栈中位于栈顶的链路状态信息发送至所述网管侧。
本实施例中,当存在待上报的告警信息时,从消息栈中获取位于栈顶的链路状态信息,然后将告警信息以及消息栈中位于栈顶的链路状态信息发送至网管侧。其中,消息栈的特点是“后进先出”,使得连同告警信息一同发送的链路状态信息是最新得到的链路状态信息。
第二方面,本发明实施例还提供一种告警延迟诊断系统。
本实施例中,所述告警延迟诊断系统包括:
设备侧,用于:
对连接网管侧以及所述设备侧的网络链路的状态进行监测,得到所述网络链路的链路状态信息,其中,所述链路状态信息包括链路中断时间区间以及中断起始设备侧的IP地址;
将告警信息以及所述链路状态信息发送至所述网管侧,其中,所述告警信息包含告警产生时刻或告警结束时刻;
网管侧,用于:
当存在告警延迟时,基于所述告警信息以及所述链路状态信息,检测告警延迟是否因为链路故障导致;
若告警延迟因为链路故障导致,则基于所述链路状态信息确定存在故障的链路。
进一步地,一实施例中,所述设备侧,还用于:
每隔预设时间间隔,通过连接网管侧以及所述设备侧的网络链路,发送一次目的地址为网管侧的IP地址的链路探测报文,其中,每次发送所述链路探测报文后,若在预设时长内接收到所述网管侧反馈的第一应答报文,则确定网络链路处于连通状态,否则确定所述网络链路处于断开状态;
当第N次发送所述链路探测报文后,确定所述网络链路由连通状态改变为断开状态,则以第N次发送所述链路探测报文的时刻为网络断开起始时刻t1;
当第M次发送所述链路探测报文后,确定所述网络链路由断开状态改变为连通状态,则以第M次发送所述链路探测报文的时刻为网络断开结束时刻t2;
根据第N次发送所述链路探测报文后,接收到的第二应答报文确定中断起始设备侧,并获取所述中断起始设备侧的IP地址,其中,所述第二应答报文来自所述网络链路中与所述设备侧可正常通信的其他设备侧;
以所述t1至t2对应的时间区间为链路中断时间区间,综合所述中断起始设备侧的IP地址以及所述链路中断时间区间得到所述网络链路的链路状态信息。
进一步地,一实施例中,设备侧,还用于:
根据第N次发送所述链路探测报文后,接收到的第二应答报文,确定所述网络链路中与所述设备侧可正常通信的设备侧组;
以所述设备侧组中最靠近网管侧的设备侧作为中断起始设备侧,并获取所述中断起始设备侧的IP地址。
进一步地,一实施例中,设备侧,还用于:
将所述链路状态信息放入消息栈中。
进一步地,一实施例中,设备侧,还用于:
当存在待上报的告警信息时,将所述告警信息以及所述消息栈中位于栈顶的链路状态信息发送至所述网管侧。
进一步地,一实施例中,网管侧,还用于:
从所述告警信息以及所述链路状态信息中获取所述告警产生时刻或告警结束时刻以及链路中断时间区间;
检测所述告警产生时刻或告警结束时刻是否处于所述链路中断时间区间;
若处于,则确定告警延迟是因为链路故障导致。
进一步地,一实施例中,网管侧,还用于:
从所述链路状态信息中获取所述中断起始设备侧的IP地址,确定所述中断起始设备侧的IP地址对应的中断起始设备侧至所述网管侧所对应的链路为存在故障的链路。
其中,上述告警延迟诊断系统中各个设备的功能实现与上述告警延迟诊断方法实施例中各步骤相对应,其功能和实现过程在此处不再一一赘述。
第三方面,本发明实施例还提供一种可读存储介质。
本发明可读存储介质上存储有告警延迟诊断程序,其中所述告警延迟诊断程序被处理器执行时,实现如上述的告警延迟诊断方法的步骤。
其中,告警延迟诊断程序被执行时所实现的方法可参照本发明告警延迟诊断方法的各个实施例,此处不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种告警延迟诊断方法,其特征在于,所述告警延迟诊断方法包括:
设备侧对连接网管侧以及所述设备侧的网络链路的状态进行监测,得到所述网络链路的链路状态信息,其中,所述链路状态信息包括链路中断时间区间以及中断起始设备侧的IP地址,以所述网络链路上开始断开了与网管侧的通信连接的设备侧为中断起始设备侧;
将告警信息以及所述链路状态信息发送至所述网管侧,其中,所述告警信息包含告警产生时刻或告警结束时刻;
当存在告警延迟时,所述网管侧基于所述告警信息以及所述链路状态信息,检测告警延迟是否因为链路故障导致;
若告警延迟因为链路故障导致,则基于所述链路状态信息确定存在故障的链路。
2.如权利要求1所述的告警延迟诊断方法,其特征在于,所述设备侧对连接网管侧以及所述设备侧的网络链路的状态进行监测,得到所述网络链路的链路状态信息的步骤包括:
每隔预设时间间隔,设备侧通过连接网管侧以及所述设备侧的网络链路,发送一次目的地址为网管侧的IP地址的链路探测报文,其中,每次发送所述链路探测报文后,若在预设时长内接收到所述网管侧反馈的第一应答报文,则确定网络链路处于连通状态,否则确定所述网络链路处于断开状态;
当第N次发送所述链路探测报文后,确定所述网络链路由连通状态改变为断开状态,则以第N次发送所述链路探测报文的时刻为网络断开起始时刻t1;
当第M次发送所述链路探测报文后,确定所述网络链路由断开状态改变为连通状态,则以第M次发送所述链路探测报文的时刻为网络断开结束时刻t2;
根据第N次发送所述链路探测报文后,接收到的第二应答报文确定中断起始设备侧,并获取所述中断起始设备侧的IP地址,其中,所述第二应答报文来自所述网络链路中与所述设备侧可正常通信的其他设备侧;
以所述t1至t2对应的时间区间为链路中断时间区间,综合所述中断起始设备侧的IP地址以及所述链路中断时间区间得到所述网络链路的链路状态信息。
3.如权利要求2所述的告警延迟诊断方法,其特征在于,所述根据第N次发送所述链路探测报文后,接收到的第二应答报文确定中断起始设备侧,并获取所述中断起始设备侧的IP地址的步骤包括:
根据第N次发送所述链路探测报文后,接收到的第二应答报文,确定所述网络链路中与所述设备侧可正常通信的设备侧组;
以所述设备侧组中最靠近网管侧的设备侧作为中断起始设备侧,并获取所述中断起始设备侧的IP地址。
4.如权利要求2所述的告警延迟诊断方法,其特征在于,在所述设备侧对连接网管侧以及所述设备侧的网络链路的状态进行监测,得到所述网络链路的链路状态信息的步骤之后,还包括:
将所述链路状态信息放入消息栈中。
5.如权利要求4所述的告警延迟诊断方法,其特征在于,所述将告警信息以及所述链路状态信息发送至所述网管侧的步骤包括:
当存在待上报的告警信息时,将所述告警信息以及所述消息栈中位于栈顶的链路状态信息发送至所述网管侧。
6.如权利要求1所述的告警延迟诊断方法,其特征在于所述网管侧基于所述告警信息以及所述链路状态信息,检测告警延迟是否因为链路故障导致的步骤包括:
所述网管侧从所述告警信息以及所述链路状态信息中获取所述告警产生时刻或告警结束时刻以及链路中断时间区间;
检测所述告警产生时刻或告警结束时刻是否处于所述链路中断时间区间;
若处于,则确定告警延迟是因为链路故障导致。
7.如权利要求1所述的告警延迟诊断方法,其特征在于,所述基于所述链路状态信息确定存在故障的链路的步骤包括:
从所述链路状态信息中获取所述中断起始设备侧的IP地址,确定所述中断起始设备侧的IP地址对应的中断起始设备侧至所述网管侧所对应的链路为存在故障的链路。
8.一种告警延迟诊断系统,其特征在于,所述告警延迟诊断系统包括:
设备侧,用于:
对连接网管侧以及所述设备侧的网络链路的状态进行监测,得到所述网络链路的链路状态信息,其中,所述链路状态信息包括链路中断时间区间以及中断起始设备侧的IP地址,以所述网络链路上开始断开了与网管侧的通信连接的设备侧为中断起始设备侧;
将告警信息以及所述链路状态信息发送至所述网管侧,其中,所述告警信息包含告警产生时刻或告警结束时刻;
网管侧,用于:
当存在告警延迟时,基于所述告警信息以及所述链路状态信息,检测告警延迟是否因为链路故障导致;
若告警延迟因为链路故障导致,则基于所述链路状态信息确定存在故障的链路。
9.如权利要求8所述的告警延迟诊断系统,其特征在于,所述设备侧,还用于:
每隔预设时间间隔,通过连接网管侧以及所述设备侧的网络链路,发送一次目的地址为网管侧的IP地址的链路探测报文,其中,每次发送所述链路探测报文后,若在预设时长内接收到所述网管侧反馈的第一应答报文,则确定网络链路处于连通状态,否则确定所述网络链路处于断开状态;
当第N次发送所述链路探测报文后,确定所述网络链路由连通状态改变为断开状态,则以第N次发送所述链路探测报文的时刻为网络断开起始时刻t1;
当第M次发送所述链路探测报文后,确定所述网络链路由断开状态改变为连通状态,则以第M次发送所述链路探测报文的时刻为网络断开结束时刻t2;
根据第N次发送所述链路探测报文后,接收到的第二应答报文确定中断起始设备侧,并获取所述中断起始设备侧的IP地址,其中,所述第二应答报文来自所述网络链路中与所述设备侧可正常通信的其他设备侧;
以所述t1至t2对应的时间区间为链路中断时间区间,综合所述中断起始设备侧的IP地址以及所述链路中断时间区间得到所述网络链路的链路状态信息。
10.一种可读存储介质,其特征在于,所述可读存储介质上存储有告警延迟诊断程序,其中所述告警延迟诊断程序被处理器执行时,实现如权利要求1至7中任一项所述的告警延迟诊断方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010910580.3A CN112202592B (zh) | 2020-09-02 | 2020-09-02 | 告警延迟诊断方法、系统及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010910580.3A CN112202592B (zh) | 2020-09-02 | 2020-09-02 | 告警延迟诊断方法、系统及可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112202592A CN112202592A (zh) | 2021-01-08 |
CN112202592B true CN112202592B (zh) | 2022-08-02 |
Family
ID=74006298
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010910580.3A Active CN112202592B (zh) | 2020-09-02 | 2020-09-02 | 告警延迟诊断方法、系统及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112202592B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112804122B (zh) * | 2021-01-12 | 2022-07-22 | 昆高新芯微电子(江苏)有限公司 | 报文链路的故障诊断方法、装置及计算机可读存储介质 |
CN112769653B (zh) * | 2021-01-18 | 2022-07-12 | 苏州浪潮智能科技有限公司 | 一种基于网口绑定的网络检测与切换方法、系统及介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101707537A (zh) * | 2009-11-18 | 2010-05-12 | 华为技术有限公司 | 故障链路定位方法、告警根因分析方法及设备、系统 |
CN101951632A (zh) * | 2010-09-16 | 2011-01-19 | 新邮通信设备有限公司 | 一种物理链路断路告警处理方法和设备单元 |
CN102882723A (zh) * | 2012-09-28 | 2013-01-16 | 烽火通信科技股份有限公司 | 通信网络中告警时序错差的处理方法及装置 |
CN105578490A (zh) * | 2014-10-17 | 2016-05-11 | 北京神州泰岳软件股份有限公司 | 一种信令监测方法及系统 |
CN106685682A (zh) * | 2015-11-10 | 2017-05-17 | 中国移动通信集团公司 | 一种故障处理方法、网络设备及系统 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7472314B2 (en) * | 2003-09-26 | 2008-12-30 | Alcatel - Lucent Usa Inc. | System and method for monitoring link delays and faults in an IP network |
CN105577401A (zh) * | 2014-10-10 | 2016-05-11 | 中兴通讯股份有限公司 | 网络设备告警上报的方法及网络设备 |
-
2020
- 2020-09-02 CN CN202010910580.3A patent/CN112202592B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101707537A (zh) * | 2009-11-18 | 2010-05-12 | 华为技术有限公司 | 故障链路定位方法、告警根因分析方法及设备、系统 |
CN101951632A (zh) * | 2010-09-16 | 2011-01-19 | 新邮通信设备有限公司 | 一种物理链路断路告警处理方法和设备单元 |
CN102882723A (zh) * | 2012-09-28 | 2013-01-16 | 烽火通信科技股份有限公司 | 通信网络中告警时序错差的处理方法及装置 |
CN105578490A (zh) * | 2014-10-17 | 2016-05-11 | 北京神州泰岳软件股份有限公司 | 一种信令监测方法及系统 |
CN106685682A (zh) * | 2015-11-10 | 2017-05-17 | 中国移动通信集团公司 | 一种故障处理方法、网络设备及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN112202592A (zh) | 2021-01-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112202592B (zh) | 告警延迟诊断方法、系统及可读存储介质 | |
US7430688B2 (en) | Network monitoring method and apparatus | |
CN101426306A (zh) | 一种容灾切换方法、系统及装置 | |
EP1890427B1 (en) | A system and method for monitoring the device port state | |
CN108566405B (zh) | 医疗设备的状态监控方法、装置及存储介质 | |
EP2698948A1 (en) | Method and device for determining failure elimination based on oam protocol | |
CN103414916A (zh) | 一种故障诊断系统及方法 | |
CN111565135A (zh) | 监控服务器运行的方法、监控服务器和存储介质 | |
CN108092829B (zh) | 集群分裂的处理方法、sdn控制器及存储介质 | |
EP1820359B1 (en) | Service alarm correlation | |
JP4364879B2 (ja) | 障害通報システム、障害通報方法及び障害通報プログラム | |
CN107426030B (zh) | 一种链路故障提醒方法及装置 | |
CN111181763A (zh) | 一种网络报障方法和装置 | |
CN113824595B (zh) | 链路切换控制方法、装置和网关设备 | |
CN113381884B (zh) | 用于监控告警系统的全链路监控方法及装置 | |
CN110572292B (zh) | 基于单向传输链路的高可用系统及方法 | |
JP5240825B2 (ja) | 警備システム | |
US8665861B1 (en) | VoIP delay for predictive maintenance | |
JP5029697B2 (ja) | オペレーションシステムのサーバシステム | |
JP2013121095A (ja) | 通信装置 | |
JP2004282655A (ja) | 監視情報通報方法、監視情報通報装置および端末 | |
JP2001223722A (ja) | 集中障害監視方式 | |
US6956856B2 (en) | System and method for managing a plurality of calls | |
JP2013026794A (ja) | 無線通信システムおよび無線通信システムにおけるサイレント障害の検出方法 | |
JP2005033643A (ja) | ケーブルモデムシステム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |