CN112953736A - 基于网络连通性测试的设备监控告警方法及装置 - Google Patents

基于网络连通性测试的设备监控告警方法及装置 Download PDF

Info

Publication number
CN112953736A
CN112953736A CN201911172559.1A CN201911172559A CN112953736A CN 112953736 A CN112953736 A CN 112953736A CN 201911172559 A CN201911172559 A CN 201911172559A CN 112953736 A CN112953736 A CN 112953736A
Authority
CN
China
Prior art keywords
equipment
monitored
network connectivity
network
test
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911172559.1A
Other languages
English (en)
Inventor
张勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhongying Youchuang Information Technology Co Ltd
Original Assignee
Zhongying Youchuang Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhongying Youchuang Information Technology Co Ltd filed Critical Zhongying Youchuang Information Technology Co Ltd
Priority to CN201911172559.1A priority Critical patent/CN112953736A/zh
Publication of CN112953736A publication Critical patent/CN112953736A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0811Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking connectivity
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0604Management of faults, events, alarms or notifications using filtering, e.g. reduction of information by using priority, element types, position or time
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种基于网络连通性测试的设备监控告警方法及装置,该方法包括:通过多台采集机向待监控设备发送网络连通性测试请求,其中,每台采集机到待监控设备的路由信息不同;获取每台采集机对待监控设备执行网络连通性测试的测试结果,其中,测试结果包括:第一结果或第二结果,第一结果用于表征待监控设备通过网络连通性测试,第二结果用于表征待监控设备未通过网络连通性测试;当各台采集机对待监控设备执行网络连通性测试的测试结果均为第二结果的情况下,输出待监控设备的告警信息。本发明能够避免由于采集机与网络设备之间网络故障导致的设备故障误告警,提高网络设备故障告警的准确性。

Description

基于网络连通性测试的设备监控告警方法及装置
技术领域
本发明涉及网络设备监控领域,尤其涉及一种基于网络连通性测试的设备监控告警方法及装置。
背景技术
本部分旨在为权利要求书中陈述的本发明实施例提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
随着互联网行业的飞速发展,互联网用户数量的不断提高,以及业务种类的不断增加,使得运营商业务量大幅攀升,提供服务的各种网络设备数量不断增加。随着网络设备数量的激增,如何更好地监控网络设备的网络状态,是提供运营商提供可靠、高效业务的重要保障。
网络设备之间的连通性是衡量网络质量的一项指标,而网络连通性测试(例如,ping测试)是检测网络设备之间连通性的主要技术手段。目前,现有对网络设备执行网络连通性测试的方案,是通过采集机向网络设备发起网络连通性测试,并采集网络设备返回的响应数据来检测网络设备是否存在网络故障,若存在网络故障,则发出告警信息。但由于采集机与网络设备之间也可能存在网络故障,从而网络连通性测试失败(例如,ping不通),这种情况下,会发出错误的告警信息。
针对上述问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供一种基于网络连通性测试的设备监控告警方法,用以解决现有对网络设备执行网络连通性测试的方案,由于采集机与网络设备之间网络故障而造成的网络连通性测试失败结果,会导致设备故障误告警的技术问题,该方法包括:通过多台采集机向待监控设备发送网络连通性测试请求,其中,网络连通性测试请求用于对待监控设备执行网络连通性测试,每台采集机到待监控设备的路由信息不同;获取每台采集机对待监控设备执行网络连通性测试的测试结果,其中,测试结果包括:第一结果或第二结果,第一结果用于表征待监控设备通过网络连通性测试,第二结果用于表征待监控设备未通过网络连通性测试;当各台采集机对待监控设备执行网络连通性测试的测试结果均为第二结果的情况下,输出待监控设备的告警信息,其中,告警信息用于提示待监控设备存在网络故障。
本发明实施例还提供一种基于网络连通性测试的设备监控告警装置,用以解决现有对网络设备执行网络连通性测试的方案,由于采集机与网络设备之间网络故障而造成的网络连通性测试失败结果,会导致设备故障误告警的技术问题,该装置包括:测试请求发送模块,用于通过多台采集机向待监控设备发送网络连通性测试请求,其中,网络连通性测试请求用于对待监控设备执行网络连通性测试,每台采集机到待监控设备的路由信息不同;测试结果获取模块,用于获取每台采集机对待监控设备执行网络连通性测试的测试结果,其中,测试结果包括:第一结果或第二结果,第一结果用于表征待监控设备通过网络连通性测试,第二结果用于表征待监控设备未通过网络连通性测试;设备告警模块,用于当各台采集机对待监控设备执行网络连通性测试的测试结果均为第二结果的情况下,输出待监控设备的告警信息,其中,告警信息用于提示待监控设备存在网络故障。
本发明实施例还提供一种计算机设备,用以解决现有对网络设备执行网络连通性测试的方案,由于采集机与网络设备之间网络故障而造成的网络连通性测试失败结果,会导致设备故障误告警的技术问题,该计算机设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述基于网络连通性测试的设备监控告警方法。
本发明实施例还提供一种计算机可读存储介质,用以解决现有对网络设备执行网络连通性测试的方案,由于采集机与网络设备之间网络故障而造成的网络连通性测试失败结果,会导致设备故障误告警的技术问题,该计算机可读存储介质存储有执行上述基于网络连通性测试的设备监控告警方法的计算机程序。
本发明实施例中,通过部署于多个局点的多台采集机向待监控设备发送对其执行网络连通性测试的网络连通性测试请求,其中,网络连通性测试请求用于对待监控设备执行网络连通性测试,每台采集机到待监控设备的路由信息不同;获取每台采集机对待监控设备执行网络连通性测试的测试结果,其中,测试结果包括:第一结果或第二结果,第一结果用于表征待监控设备通过网络连通性测试,第二结果用于表征待监控设备未通过网络连通性测试;当各台采集机对待监控设备执行网络连通性测试的测试结果均为第二结果的情况下,输出待监控设备的告警信息,其中,告警信息用于提示待监控设备存在网络故障。
通过本发明实施例,能够避免由于采集机与网络设备之间网络故障而造成的网络连通性测试失败,减少误告警,提高网络设备故障告警的准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1为本发明实施例中提供的一种基于网络连通性测试的设备监控告警方法流程图;
图2为本发明实施例中提供的一种待监控设备的配置界面示意图;
图3为本发明实施例中提供的一种设备信息修改界面示意图;
图4为本发明实施例中提供的一种设备对的ping测试结果显示界面示意图;
图5为本发明实施例中提供的一种基于网络连通性测试的设备监控告警装置示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本发明实施例做进一步详细说明。在此,本发明的示意性实施例及其说明用于解释本发明,但并不作为对本发明的限定。
在本说明书的描述中,所使用的“包含”、“包括”、“具有”、“含有”等,均为开放性的用语,即意指包含但不限于。参考术语“一个实施例”、“一个具体实施例”、“一些实施例”、“例如”等的描述意指结合该实施例或示例描述的具体特征、结构或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。各实施例中涉及的步骤顺序用于示意性说明本申请的实施,其中的步骤顺序不作限定,可根据需要作适当调整。
本发明实施例中提供了一种基于网络连通性测试的设备监控告警方法,图1为本发明实施例中提供的一种基于网络连通性测试的设备监控告警方法流程图,如图1所示,该方法可以包括如下步骤:
S101,通过多台采集机向待监控设备发送网络连通性测试请求,其中,网络连通性测试请求用于对待监控设备执行网络连通性测试,每台采集机到待监控设备的路由信息不同。
需要说明的是,本发明实施例中待监控设备可以是但不限于路由器、防火墙、交换机等任意一种网络设备。本发明实施例中涉及到的网络连通性测试可以是但不限于ping测试。当网络连通性测试为ping测试的情况下,可以通过向待监控设备发送ping命令来实现对待监控设备的网络连通性测试。
由于采集机到网络设备的网络故障可能导致网络连通性测试失败(即ping不通),从而导致误告警,因而,本发明实施例通过布署于多个局点的多台采集机(2台或多台)对待监控设备执行网络连通性测试,能够提高网络设备故障告警的准确性。所以本专利通过放置2台(或者多台)采集机在不同局点对设备进行ping测试,以保证告警的准确性。
作为一种优选的实施例,本发明实施例中待监控设备可以式设备对,设备对是指在网络中成对出现的设备,可以是一台设备,也可以是多台设备。
S102,获取每台采集机对待监控设备执行网络连通性测试的测试结果,其中,测试结果包括:第一结果或第二结果,第一结果用于表征待监控设备通过网络连通性测试,第二结果用于表征待监控设备未通过网络连通性测试。
需要说明的是,当对待监控设备执行的网络连通性测试为ping测试的情况下,第一结果为ping通的结果,第二结果为ping不同的结果。
S103,当各台采集机对待监控设备执行网络连通性测试的测试结果均为第二结果的情况下,输出待监控设备的告警信息,其中,告警信息用于提示待监控设备存在网络故障。
需要说明的是,本发明实施例提供的设备监控告警方法通过多台采集机对待监控设备执行网络连通性测试,只要有一台采集机对待监控设备执行网络连通性测试的测试结果为第一结果(即待监控设备通过网络连通性测试),则表明待监控设备不存在网络故障问题,因而无需告警。而当所有采集机对待监控设备执行网络连通性测试的测试结果均为第二结果(即待监控设备未通过网络连通性测试)的情况下,则表明待监控设备极大可能存在网络故障,因而,需要发出告警。
由上可知,本发明实施例提供的设备监控告警方法,通过部署于多个局点的多台采集机向待监控设备发送对其执行网络连通性测试的网络连通性测试请求,其中,网络连通性测试请求用于对待监控设备执行网络连通性测试,每台采集机到待监控设备的路由信息不同;获取每台采集机对待监控设备执行网络连通性测试的测试结果,其中,测试结果包括:第一结果或第二结果,第一结果用于表征待监控设备通过网络连通性测试,第二结果用于表征待监控设备未通过网络连通性测试;当各台采集机对待监控设备执行网络连通性测试的测试结果均为第二结果的情况下,输出待监控设备的告警信息,其中,告警信息用于提示待监控设备存在网络故障。
通过本发明实施例提供的设备监控告警方法,能够避免由于采集机与网络设备之间网络故障而造成的网络连通性测试失败,减少误告警,提高网络设备故障告警的准确性。
当所有采集机对待监控设备执行网络连通性测试的测试结果均为第二结果,且输出提示待监控设备存在网络故障的告警信息后,为了让网络设备运维人员快速定位到网络故障的来源,作为一种优选的实施方式,本发明实施例提供的设备监控告警方法还可以包括如下步骤:当各台采集机对待监控设备执行网络连通性测试的测试结果均为第二结果的情况下,通过每台采集机对待监控设备执行路由路径追踪测试,得到每台采集机到待监控设备的路由信息;将各台采集机到到待监控设备的路由信息,记录到告警信息中。
通过该实施方式,将发生网络故障的待监控设备到每台采集机的路由信息记录到告警信息中,可以方便运维人员根据路由信息来快速定位到发生网络故障的设备。
由于路由信息中记录的设备信息是各台采集机到待监控设备的路由路径中经过的各个网络设备的IP地址,可读性不强,因而,进一步地,本发明实施例提供的设备监控告警方法还可以包括如下步骤:从每台采集机到待监控设备的路由信息中,识别出每台采集机到待监控设备的路由路径中经过的各个网络设备的IP地址;根据每个网络设备的IP地址,从网管设备表中查询每个网络设备的设备名称,其中,网管设备表中包含预设的多个网络设备的设备名称及对应的IP地址;在告警信息包含的路由信息中,添加各个网络设备的设备名称。
通过该实施方式,将各个网络设备的设备名称记录到告警信息包含的路由信息中,可以快速发现发生网络故障的网络设备的设备名称。
需要注意的是,网络中有很多设备是成对出现的,例如,城域网核心设备,或者省网骨干设备等,两台设备之间为主备关系,因而,当本发明实施例中的待监控设备为设备对,且设备对包含多台设备的情况下,当各台采集机对设备对中任意一台设备执行网络连通性测试的测试结果均为第二结果的情况下,则输出设备对的告警信息。
以ping测试为例,在不同的局点放置两台(或者多台)采集机,对设备对中的设备进行ping测试,如果两台(或者多台)采集机都无法ping通设备对中的设备则认为是设备网络不通故障;如果仅仅是一台采集机ping不通,则可能只是这个局点的网络到设备对的设备不通,并不能说明这台设备的网络不通。
以2台采集机对包含3台设备的设备对ping测试为例,测试结果如表1所示。每隔预设时长(例如,5分钟,预设时长可以根据情况进行手动修改)ping一次,从两台采集机进行发起ping操作。两台采集机都不通,才认为这台设备ping不通。
表1设备对ping测试结果
Figure BDA0002289120040000061
需要注意的是,ping告警页面中的一台设备对,可能是一台或多台设备,如果是多台设备,则是“并且”的关系;如果单台设备恢复,则需要针对这台设备发出恢复告警。每次有设备ping通/不通的变化,都要发出告警/恢复,进行提示。(此处说的ping不通,是指两台都不通;只要有一台采集机ping通,则认为恢复)。
可选地,如果两台采集机都ping不通,则再分别通过traceroute命令(用于追踪数据包在网络上的传输时的全部路径),执行路由路径追踪测试做traceroute,将traceroute的结果记录在告警内容中。可选地,通过接口IP,找到对应的设备名称,并将tracerout的结果中翻译IP对应的设备名称。
一种tracerout的结果示例如下:
“bash-3.2$traceroute 218.203.40.12
traceroute:Warning:Multiple interfaces found;using 192.168.10.8@igb0
traceroute to 218.203.40.12(218.203.40.12)[设备名称],30hops max,40byte packets
1 bogon(192.168.10.241)[设备名称]2.001ms 1.839ms 1.833ms
2 bogon(192.168.201.2)[设备名称]2.604ms 2.515ms 2.512ms
3 112.100.0.93(112.100.0.93)[设备名称]1.663ms 1.448ms 1.533ms
4 112.100.0.81(112.100.0.81)[设备名称]1.573ms 1.798ms 1.682ms
5 112.100.0.9(112.100.0.9)[设备名称]4.199ms 2.636ms 112.100.0.13(112.100.0.13)[设备名称]4.555ms
6***
7***
8 202.97.87.138(202.97.87.138)[设备名称]43.419ms**
9***
10*221.176.26.242(221.176.26.242)[设备名称]44.185ms*
11**221.183.25.46(221.183.25.46)[设备名称]55.555ms
12***
13 218.203.47.29(218.203.47.29)[设备名称]63.737ms 63.838ms218.203.46.29(218.203.46.29)[设备名称]57.499ms
14 218.203.48.41(218.203.48.41)[设备名称]62.867ms 218.203.40.12(218.203.40.12)[设备名称]78.073ms 72.074ms”
上述方括号中的设备名称即为IP对应的设备名称。如果网管中无法找到设备IP对应的设备名称,则通过[/]进行表示。连续出现3个“***”(表明设备网络超时,网络不通trace失败),则停止trace。
可选地,当本发明实施例中的待监控设备为设备对的情况下,上述告警信息包含如下至少一种信息:设备对的设备名称、设备对的IP地址、告警类型、告警时间(第一次告警发生时刻和最后一次告警发生时刻)、设备对包含的设备数、设备对中通过网络连通性测试的设备数、设备对中未通过网络连通性测试的设备数、设备对中未通过网络连通性测试的设备IP地址、设备对中未通过网络连通性测试的设备名称、设备对中通过网络连通性测试的设备IP地址、设备对中通过网络连通性测试的设备名称、每台采集机到到待监控设备的路由信息。
作为一种可选的实施方式,告警格式定义为:
告警变量:告警设备名称【DeviceName】、告警设备IP【DeviceIP】、告警第一次发生时间【StartTime】、告警最后发生时间【LastOccurTime】、告警恢复时间【ClearTime】、告警类型【AlarmType】、设备对设备数【TN】、设备对不通设备数【EN】、不通设备名称【UnDevName】、不通设备IP【UnDevIP】、正常设备名称【DevName】、正常设备IP【DevIP】、traceroute结果【traceroute】。
在一种可选的实施例中,本发明实施例提供的设备监控告警方法,还可以通过短信或邮件的形式,输出待监控设备的告警信息。
作为一种可选的实施方式,短信格式的定义如下:
例如:218.203.40.12(HLJXI-MC-IPMAN-SR02-HWME60)ping不通。此设备对共TN台设备,已有EN台设备不通。
作为一种可选的实施方式,邮件格式的定义如下:
收件人:即告警设备对应的维护人的邮箱
邮件标题:告警:设备名称(设备IP)告警类型
例如:告警:218.203.40.12(HLJXI-MC-IPMAN-SR02-HWME60)ping不通
邮件内容:时间:XX,设备名称(设备IP),端口名称,告警类型
例如:218.203.40.12(HLJXI-MC-IPMAN-SR02-HWME60),ping不通。此设备对中:设备IP1(设备名称)ping测试正常、设备IP2(设备名称)ping测试正常、设备IP3(设备名称)ping测试不通。
1.1.1.1采集机traceroute结果为:.........;
1.1.1.2采集机traceroute结果为:........,(traceroute的内容,请参见以上traceroute示例)。
作为一种可选的实施方式,告警板格式的定义如下:
告警内容为:告警标题:218.203.40.12(HLJXI-MC-IPMAN-SR02-HWME60)ping不通。此设备对共N台设备,已有N台设备不通。
告警正文为:218.203.40.12(HLJXI-MC-IPMAN-SR02-HWME60),ping不通。
此设备对中:设备IP1(设备名称)ping测试正常、设备IP2(设备名称)ping测试正常、设备IP3(设备名称)ping测试不通。
1.1.1.1采集机traceroute结果为:
“bash-3.2$traceroute 218.203.40.12
traceroute:Warning:Multiple interfaces found;using 192.168.10.8@igb0
traceroute to 218.203.40.12(218.203.40.12)[设备名称],30hops max,40byte packets
1 bogon(192.168.10.241)[设备名称]2.001ms 1.839ms 1.833ms
2 bogon(192.168.201.2)[设备名称]2.604ms 2.515ms 2.512ms
3 112.100.0.93(112.100.0.93)[设备名称]1.663ms 1.448ms 1.533ms
4 112.100.0.81(112.100.0.81)[设备名称]1.573ms 1.798ms 1.682ms
5 112.100.0.9(112.100.0.9)[设备名称]4.199ms 2.636ms 112.100.0.13(112.100.0.13)[设备名称]4.555ms
6***
7***
8 202.97.87.138(202.97.87.138)[设备名称]43.419ms**
9***
10*221.176.26.242(221.176.26.242)[设备名称]44.185ms*
11**221.183.25.46(221.183.25.46)[设备名称]55.555ms
12***
13 218.203.47.29(218.203.47.29)[设备名称]63.737ms 63.838ms218.203.46.29(218.203.46.29)[设备名称]57.499ms
14 218.203.48.41(218.203.48.41)[设备名称]62.867ms 218.203.40.12(218.203.40.12)[设备名称]78.073ms 72.074ms”
1.1.1.2采集机traceroute结果为:
“bash-3.2$traceroute 218.203.40.12
traceroute:Warning:Multiple interfaces found;using 192.168.10.8@igb0
traceroute to 218.203.40.12(218.203.40.12)[设备名称],30hops max,40byte packets
1 bogon(192.168.10.241)[设备名称]2.001ms 1.839ms 1.833ms
2 bogon(192.168.201.2)[设备名称]2.604ms 2.515ms 2.512ms
3 112.100.0.93(112.100.0.93)[设备名称]1.663ms 1.448ms 1.533ms
4 112.100.0.81(112.100.0.81)[设备名称]1.573ms 1.798ms 1.682ms
5 112.100.0.9(112.100.0.9)[设备名称]4.199ms 2.636ms 112.100.0.13(112.100.0.13)[设备名称]4.555ms
6***
7***
8 202.97.87.138(202.97.87.138)[设备名称]43.419ms**
9***
10*221.176.26.242(221.176.26.242)[设备名称]44.185ms*
11**221.183.25.46(221.183.25.46)[设备名称]55.555ms
12***
13 218.203.47.29(218.203.47.29)[设备名称]63.737ms 63.838ms218.203.46.29(218.203.46.29)[设备名称]57.499ms
14 218.203.48.41(218.203.48.41)[设备名称]62.867ms 218.203.40.12(218.203.40.12)[设备名称]78.073ms 72.074ms”
在一种可选的实施例中,本发明实施例提供的设备监控告警方法还可以包括如下步骤:显示待监控设备的配置界面;接收用户通过配置界面输入的待监控设备的设备信息,其中,设备信息包括:设备名称或设备IP地址。
图2为本发明实施例中提供的一种待监控设备的配置界面示意图,如图2所示,用户可以通过该配置界面,按照设备名称或设备IP查询已经录入的设备,针对每台设备对,可以填写设备对各台设备的IP地址,各台设备IP地址之间可以使用分号(兼容中英文分号)隔开。对于某台设备对,还可以执行新增、修改或删除等功能,点击“新增”或“修改”按钮,弹出图3所示的设备信息修改界面(例如,对待监控的设备对包含的一个或设备进行修改),可选地,当点击新增按钮的时候,默认显示一台设备名称或IP地址的输入框;当点击修改按钮的时候,显示图2设备对列表中已选一台或多台设备的设备名称或IP地址输入框。当点击图3中“增加设备”按钮的时候,则可新增加一台设备IP的输入框。点击图2中某台设备对的测试按钮,可以对该设备对执行ping测试,从而出现图4所示的测试结果。如图4所示,可以将测试失败的记录使用不同格式的字体或不同颜色的字体突出显示。
基于同一发明构思,本发明实施例中还提供了一种基于网络连通性测试的设备监控告警装置,如下面的实施例所述。由于该装置实施例解决问题的原理与基于网络连通性测试的设备监控告警方法相似,因此该装置实施例的实施可以参见方法的实施,重复之处不再赘述。
图5为本发明实施例中提供的一种基于网络连通性测试的设备监控告警装置示意图,如图5所示,该装置包括:测试请求发送模块51、测试结果获取模块52和设备告警模块53。
其中,测试请求发送模块51,用于通过多台采集机向待监控设备发送网络连通性测试请求,其中,网络连通性测试请求用于对待监控设备执行网络连通性测试,每台采集机到待监控设备的路由信息不同;测试结果获取模块52,用于获取每台采集机对待监控设备执行网络连通性测试的测试结果,其中,测试结果包括:第一结果或第二结果,第一结果用于表征待监控设备通过网络连通性测试,第二结果用于表征待监控设备未通过网络连通性测试;设备告警模块53,用于当各台采集机对待监控设备执行网络连通性测试的测试结果均为第二结果的情况下,输出待监控设备的告警信息,其中,告警信息用于提示待监控设备存在网络故障。
由上可知,本发明实施例提供的设备监控告警装置,测试请求发送模块51通过部署于多个局点的多台采集机向待监控设备发送对其执行网络连通性测试的网络连通性测试请求;测试结果获取模块52获取每台采集机对待监控设备执行网络连通性测试的测试结果;设备告警模块53在检测到各台采集机对待监控设备执行网络连通性测试的测试结果均为第二结果的情况下,输出待监控设备的告警信息。
通过本发明实施例提供的设备监控告警装置,能够避免由于采集机与网络设备之间网络故障而造成的网络连通性测试失败,减少误告警,提高网络设备故障告警的准确性。
在一种可选的实例中,本发明实施例提供的基于网络连通性测试的设备监控告警装置还可以包括:路由信息采集模块54,用于当各台采集机对待监控设备执行网络连通性测试的测试结果均为第二结果的情况下,通过每台采集机对待监控设备执行路由路径追踪测试,得到每台采集机到待监控设备的路由信息;以及将各台采集机到到待监控设备的路由信息,记录到告警信息中。
在一种可选的实例中,本发明实施例提供的基于网络连通性测试的设备监控告警装置还可以包括:路由信息处理模块55,用于从每台采集机到待监控设备的路由信息中,识别出每台采集机到待监控设备的路由路径中经过的各个网络设备的IP地址,根据每个网络设备的IP地址,从网管设备表中查询每个网络设备的设备名称,其中,网管设备表中包含预设的多个网络设备的设备名称及对应的IP地址;设备告警模块53还用于在告警信息包含的路由信息中,添加各个网络设备的设备名称。
在一种可选的实例中,本发明实施例提供的设备监控告警装置中,设备告警模块53还用于通过短信或邮件的形式,输出待监控设备的告警信息。
在一种可选的实例中,本发明实施例提供的设备监控告警装置还可以包括:设备信息配置模块56,用于显示待监控设备的配置界面,以及接收用户通过配置界面输入的待监控设备的设备信息,其中,设备信息包括:设备名称或设备IP地址。
作为一种优选的实施例,本发明实施例提供的设备监控告警装置中,待监控设备可以是设备对,设备对包含网络中成对出现一台或多台设备,其中,设备告警模块53还用于当各台采集机对设备对中任意一台设备执行网络连通性测试的测试结果均为第二结果的情况下,输出设备对的告警信息,其中,设备对的告警信息包含:设备对中通过网络连通性测试和未通过网络连通性测试的设备数、设备IP地址、设备名称。
可选地,设备对的告警信息还可以包含:设备对的设备名称、设备对的IP地址、告警类型、告警时间。
本发明实施例还提供一种计算机设备,用以解决现有对网络设备执行网络连通性测试的方案,由于采集机与网络设备之间网络故障而造成的网络连通性测试失败结果,会导致设备故障误告警的技术问题,该计算机设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述基于网络连通性测试的设备监控告警方法。
本发明实施例还提供一种计算机可读存储介质,用以解决现有对网络设备执行网络连通性测试的方案,由于采集机与网络设备之间网络故障而造成的网络连通性测试失败结果,会导致设备故障误告警的技术问题,该计算机可读存储介质存储有执行上述基于网络连通性测试的设备监控告警方法的计算机程序。
综上所述,本发明实施例提供了一种基于网络连通性测试的设备监控告警方法、装置、计算机设备及计算机可读存储介质,通过在不同的局点放置两台或多台采集机,对设备对(网络中成对出现的设备)中的设备发起网络连通性测试(例如,ping测试),如果两台或多台采集机都无法ping通设备对中的设备则认为是设备网络不通故障。如果仅仅是一台采集机ping不通,则可能只是这个局点的网络到设备对的设备不通,并不能说明这台设备的网络不通故障。通过本发明实施例能够保证告警的准确性,减少误告警。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于网络连通性测试的设备监控告警方法,其特征在于,包括:
通过多台采集机向待监控设备发送网络连通性测试请求,其中,所述网络连通性测试请求用于对待监控设备执行网络连通性测试,每台采集机到待监控设备的路由信息不同;
获取每台采集机对待监控设备执行网络连通性测试的测试结果,其中,所述测试结果包括:第一结果或第二结果,第一结果用于表征待监控设备通过网络连通性测试,第二结果用于表征待监控设备未通过网络连通性测试;
当各台采集机对待监控设备执行网络连通性测试的测试结果均为第二结果的情况下,输出待监控设备的告警信息,其中,所述告警信息用于提示待监控设备存在网络故障。
2.如权利要求1所述的方法,其特征在于,所述方法还包括:
当各台采集机对待监控设备执行网络连通性测试的测试结果均为第二结果的情况下,通过每台采集机对待监控设备执行路由路径追踪测试,得到每台采集机到待监控设备的路由信息;
将各台采集机到到待监控设备的路由信息,记录到所述告警信息中。
3.如权利要求2所述的方法,其特征在于所述方法还包括:
从每台采集机到待监控设备的路由信息中,识别出每台采集机到待监控设备的路由路径中经过的各个网络设备的IP地址;
根据每个网络设备的IP地址,从网管设备表中查询每个网络设备的设备名称,其中,所述网管设备表中包含预设的多个网络设备的设备名称及对应的IP地址;
在所述告警信息包含的路由信息中,添加各个网络设备的设备名称。
4.如权利要求1所述的方法,其特征在于,输出待监控设备的告警信息,包括:通过短信或邮件的形式,输出待监控设备的告警信息。
5.如权利要求1所述的方法,其特征在于,所述方法还包括:
显示待监控设备的配置界面;
接收用户通过所述配置界面输入的待监控设备的设备信息,其中,所述设备信息包括:设备名称或设备IP地址。
6.如权利要求1至5任一项所述的方法,其特征在于,待监控设备为设备对,设备对包含网络中成对出现一台或多台设备,当各台采集机对待监控设备执行网络连通性测试的测试结果均为第二结果的情况下,输出待监控设备的告警信息,包括:
当各台采集机对设备对中任意一台设备执行网络连通性测试的测试结果均为第二结果的情况下,输出设备对的告警信息,其中,设备对的告警信息包含:设备对中通过网络连通性测试和未通过网络连通性测试的设备数、设备IP地址、设备名称。
7.如权利要求6所述的方法,其特征在于,设备对的告警信息还包含:设备对的设备名称、设备对的IP地址、告警类型、告警时间。
8.一种基于网络连通性测试的设备监控告警装置,其特征在于,包括:
测试请求发送模块,用于通过多台采集机向待监控设备发送网络连通性测试请求,其中,所述网络连通性测试请求用于对待监控设备执行网络连通性测试,每台采集机到待监控设备的路由信息不同;
测试结果获取模块,用于获取每台采集机对待监控设备执行网络连通性测试的测试结果,其中,所述测试结果包括:第一结果或第二结果,第一结果用于表征待监控设备通过网络连通性测试,第二结果用于表征待监控设备未通过网络连通性测试;
设备告警模块,用于当各台采集机对待监控设备执行网络连通性测试的测试结果均为第二结果的情况下,输出待监控设备的告警信息,其中,所述告警信息用于提示待监控设备存在网络故障。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6任一项所述基于网络连通性测试的设备监控告警方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有执行权利要求1至6任一项所述基于网络连通性测试的设备监控告警方法的计算机程序。
CN201911172559.1A 2019-11-26 2019-11-26 基于网络连通性测试的设备监控告警方法及装置 Pending CN112953736A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911172559.1A CN112953736A (zh) 2019-11-26 2019-11-26 基于网络连通性测试的设备监控告警方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911172559.1A CN112953736A (zh) 2019-11-26 2019-11-26 基于网络连通性测试的设备监控告警方法及装置

Publications (1)

Publication Number Publication Date
CN112953736A true CN112953736A (zh) 2021-06-11

Family

ID=76224939

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911172559.1A Pending CN112953736A (zh) 2019-11-26 2019-11-26 基于网络连通性测试的设备监控告警方法及装置

Country Status (1)

Country Link
CN (1) CN112953736A (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050099951A1 (en) * 2003-11-10 2005-05-12 Nortel Networks Limited Ethernet OAM fault detection and verification
CN101141329A (zh) * 2007-10-22 2008-03-12 中兴通讯股份有限公司 一种实现连通性检测的方法和系统
CN101753379A (zh) * 2008-12-12 2010-06-23 米特尔网络公司 快速检测通信路径故障的系统和方法
US20110235525A1 (en) * 2010-03-24 2011-09-29 Fujitsu Limited Monitoring apparatus, monitoring method, and monitoring program
US20140379894A1 (en) * 2013-06-21 2014-12-25 Microsoft Corporation Using different connectivity checks to determine causes of connectivity issues
CN104601394A (zh) * 2014-11-26 2015-05-06 华为技术有限公司 一种业务链连通性检测的方法、装置及系统
GB2542832A (en) * 2015-09-30 2017-04-05 British Telecomm Analysis of network performance
CN106571938A (zh) * 2015-10-09 2017-04-19 腾讯科技(深圳)有限公司 一种基于访问链路的告警检测方法和装置
CN108123824A (zh) * 2016-11-30 2018-06-05 华为技术有限公司 一种网络故障检测方法及装置
CN108833202A (zh) * 2018-05-22 2018-11-16 华为技术有限公司 故障链路检测方法、装置和计算机可读存储介质

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050099951A1 (en) * 2003-11-10 2005-05-12 Nortel Networks Limited Ethernet OAM fault detection and verification
CN101141329A (zh) * 2007-10-22 2008-03-12 中兴通讯股份有限公司 一种实现连通性检测的方法和系统
CN101753379A (zh) * 2008-12-12 2010-06-23 米特尔网络公司 快速检测通信路径故障的系统和方法
US20110235525A1 (en) * 2010-03-24 2011-09-29 Fujitsu Limited Monitoring apparatus, monitoring method, and monitoring program
US20140379894A1 (en) * 2013-06-21 2014-12-25 Microsoft Corporation Using different connectivity checks to determine causes of connectivity issues
CN104601394A (zh) * 2014-11-26 2015-05-06 华为技术有限公司 一种业务链连通性检测的方法、装置及系统
GB2542832A (en) * 2015-09-30 2017-04-05 British Telecomm Analysis of network performance
CN106571938A (zh) * 2015-10-09 2017-04-19 腾讯科技(深圳)有限公司 一种基于访问链路的告警检测方法和装置
CN108123824A (zh) * 2016-11-30 2018-06-05 华为技术有限公司 一种网络故障检测方法及装置
CN108833202A (zh) * 2018-05-22 2018-11-16 华为技术有限公司 故障链路检测方法、装置和计算机可读存储介质

Similar Documents

Publication Publication Date Title
CN103442008B (zh) 一种路由安全检测系统及检测方法
US5822302A (en) LAN early warning system
CN107229556A (zh) 基于elastic组件的日志分析系统
CN107241229B (zh) 一种基于接口测试工具的业务监控方法及装置
CN110830311B (zh) 网络质量探测方法、装置、设备和存储介质
CN103138988B (zh) 网络故障的定位处理方法及装置
WO2016045353A1 (zh) 一种故障诊断分析方法、装置、系统及存储介质
CN111030873A (zh) 一种故障诊断方法及装置
CN111934936A (zh) 网络状态检测方法、装置、电子设备及存储介质
CN112087462A (zh) 一种工控系统的漏洞检测方法和装置
CN101252477B (zh) 一种网络故障根源的确定方法及分析装置
CN111371570A (zh) 一种nfv网络的故障检测方法及装置
CN109150602A (zh) 一种适配存储设备的方法、装置、计算机存储介质及终端
JP2011254320A (ja) ネットワーク障害分析処理装置
CN112953736A (zh) 基于网络连通性测试的设备监控告警方法及装置
JP4434457B2 (ja) アクセスログの監視支援方法およびそのシステム、並びに統合監視装置
CN111385157A (zh) 一种服务器异常检测方法及装置
CN114338347A (zh) 基于Ampere平台的故障信息带外获取方法及装置
CN114039943A (zh) 一种域名系统的数据处理方法及装置
KR20040028400A (ko) 매트로 이더넷망의 장애처리 장치 및 그 방법
CN110969082A (zh) 一种时钟同步测试巡检方法和系统
JP2007235380A (ja) マルチレイヤネットワーク運用管理システムおよびコンピュータプログラム
JP2007206998A (ja) 遠隔診断用の仲介装置
JP3271676B2 (ja) 通信プロトコル故障解析方法および装置
JP2015185968A (ja) 障害メッセージ集約装置および障害メッセージ集約プログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210611

RJ01 Rejection of invention patent application after publication