CN108616423A - 一种脱网设备监测方法以及装置 - Google Patents
一种脱网设备监测方法以及装置 Download PDFInfo
- Publication number
- CN108616423A CN108616423A CN201810386108.7A CN201810386108A CN108616423A CN 108616423 A CN108616423 A CN 108616423A CN 201810386108 A CN201810386108 A CN 201810386108A CN 108616423 A CN108616423 A CN 108616423A
- Authority
- CN
- China
- Prior art keywords
- network equipment
- equipment
- network
- information
- detection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/10—Active monitoring, e.g. heartbeat, ping or trace-route
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0805—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
- H04L43/0811—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking connectivity
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0805—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
- H04L43/0817—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/54—Presence management, e.g. monitoring or registration for receipt of user log-on information, or the connection status of the users
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/10—Active monitoring, e.g. heartbeat, ping or trace-route
- H04L43/103—Active monitoring, e.g. heartbeat, ping or trace-route with adaptive polling, i.e. dynamically adapting the polling rate
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Environmental & Geological Engineering (AREA)
- Health & Medical Sciences (AREA)
- Cardiology (AREA)
- General Health & Medical Sciences (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本申请提供的脱网设备监测方法以及装置,一旦监测到某台网络设备脱网,将该网络设备作为目标设备,根据预存的网络拓扑结构,向与该目标网络设备存在直接或者间接链路关系的关联网络设备发送探测信息,以能够快速确定关联网络设备是否脱网检测,从而能够更快速的发现网络中的脱网设备。
Description
技术领域
本申请涉及网络管理技术领域,具体而言,涉及一种脱网设备监测方法以及装置。
背景技术
网络设备指网络中运行的交换机、路由器、安全设备等通过交互式命令行完成配置的设备。通过网络管理系统(下称网管系统)对网络中的网络设备进行管理是一种保证网络可靠性的非常重要的方式。通过网管系统,可以对网络中的所有网络设备进行统一的管理、控制和监控;网管系统的使用,也为网络的管理带来很大的便利。脱网设备,即脱离现有网络,已经无法被网管系统访问到的网络设备;网络设备脱网的原因有多种,如网络设备的链路DOWN,接口DOWN等,都会导致网络设备脱网。当网络设备脱网后,可能会对现有的网络业务造成很大的影响;尤其当脱网设备是核心网络设备时,对网络业务的影响就会更大。同时,网络设备脱网越久,对业务造成的影响就越大;尤其在一些特殊的场景下,如电力系统、银行、证券、各种售票系统等,就算是秒级的设备脱网导致的业务中断也会造成很大的损失。因此,网管系统对网络中网络设备的监测,很重要的一点就是监测网络设备是否已经脱网,当网络设备脱网后,网管系统会采用上报告警,第一时间通知到相关管理人员的措施降低对业务的影响。
目前网管系统一般采用周期性检测被网管系统所纳管的网络设备的方式监测网络中网络设备是否脱网;当检测到某网络设备时,网管系统会向该网络设备发送ping报文;若在预设时间内未接收到该网络设备发送的反馈信息,则认为该网络设备已经脱网,而后产生相应告警。
但随着网络复杂性的日益提升,网络中的网络设备也日益增多;采取目前这种通过周期性检测网络设备的方式监测网络设备是否脱网,若检测周期设置较长,则会导致发现网络设备脱网的时间过久;若检测时间设置较短,则需要网管系统频繁的ping设备,在ping设备的过程中会导致网管系统的计算量过大,影响网管系统的性能,从而影响网管系统的正常业务运转;若基于二者之间的平衡设置检测时间,也同样存在发现脱网设备的时效性差的问题。
发明内容
有鉴于此,本申请实施例的目的在于提供一种脱网设备监测方法以及装置,能够快速发现网络中的脱网设备。
第一方面,提供一种脱网设备监测方法,应用于网络管理系统中,包括:
获取设备异常告警信息,所述设备异常告警信息中携带有链路连接存在问题的目标网络设备信息;
根据预存的网络拓扑结构以及所述目标网络设备信息,向所述目标网络设备的关联网络设备发送探测信息;
若没有接收到所述关联网络设备针对所述探测信息的反馈信息,则上报所述关联网络设备的设备脱网告警信息;
其中,所述关联网络设备是指与所述目标网络设备之间存在直接或间接的链路连接关系的网络设备。
第二方面,提供一种脱网设备监测装置,应用于网络管理系统中,包括:
获取模块,用于获取设备异常告警信息,所述设备异常告警信息中携带有链路连接存在问题的目标网络设备信息;
第一探测模块,用于根据预存的网络拓扑结构以及所述目标网络设备信息,向所述目标网络设备的关联网络设备发送探测信息;
上报模块,在没有接收到所述关联网络设备针对所述探测信息的反馈信息时,上报所述关联网络设备的设备脱网告警信息;
其中,所述关联网络设备是指与所述目标网络设备之间存在直接或间接的链路连接关系的网络设备。
本实施例所提供的方法,无需等待达到关联网络设备的轮询周期,而是在发现了目标网络设备有异常时,直接向关联网络设备发送探测信息,从而可以缩短发现关联网络设备脱网的时间。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请实施例所提供的一种脱网设备监测方法的流程图;
图2示出了本申请实施例所提供的一种组网示例;
图3示出了本申请实施例所提供的确定关联网络设备脱网的具体方法的流程图;
图4示出了本申请实施例提供的一种脱网设备监测装置的结构示意图;
图5示出了本申请实施例提供的一种网络侧设备的结构示意图。
具体实施方式
在相关技术中,网管系统一般采用周期性检测被网管系统所纳管的网络设备的方式监测网络中网络设备是否脱网。例如网管系统管理1000台网络设备,且将每台网络设备的检测周期均设为1分钟;每当某台网络设备的检测周期到达时,网管系统会向该网络设备发送ping报文。例如在无法接收到第500台网络设备对该ping报文的反馈的时候,则生成并上报第500台设备脱网的告警,并在其它网络设备的检测周期到达时,向其它网络设备发送ping报文,以检测其它网络设备是否也断网。
但是实际上,在整个网络中,当某台网络设备脱网的时候,与之存在直接链路关系或者间接链路关系的其它网络设备也可能脱网;例如与第500台网络设备具有直连链路关系的网络设备有第570台,第600台,第750台,第790台共四台网络设备,当第500台网络设备脱网的时候,很可能也会造成这四台网络设备也脱网。而当前这种检测方式导致了只能在第570台,第600台,第750台,第790台设备的检测周期到达的时候,才能通过向其发送ping报文确定其是否脱网,从而导致这些网络设备的脱网情况无法被及时发现。
与现有技术不同,本申请实施例一旦监测到某台网络设备脱网,将该网络设备作为目标设备,根据预存的网络拓扑结构,向与该目标网络设备存在直接或者间接链路关系的关联网络设备发送探测信息,以能够快速确定关联网络设备是否脱网检测,从而能够更快速的发现网络中的脱网设备。
为便于对本实施例进行理解,首先对本申请实施例所公开的一种脱网设备监测方法进行详细介绍,该方法的执行主体为网络管理系统。
参见图1所示,本申请实施例一提供的脱网设备监测方法,包括:
S101:获取设备异常告警信息;设备异常告警信息中携带有链路连接存在问题的目标网络设备信息。
在具体实现的时候,设备异常告警信息有下述至少一种来源:
其一,由被网管系统纳管的网络设备主动上报设备异常告警,例如,网络设备的链路down告警、接口down告警等,一般会由网络设备主动向网络管理系统上报;
其二,由网管系统发出探测信息,根据探测信息的反馈信息确定是否要生成告警。例如,网络管理系统会按照轮询周期向网络设备发送ping报文,若在预设时间长度内没有收到Ping报文的反馈信息,则可以确定网络设备脱网,从而可以生成设备异常告警信息。为便于后续描述,这里引入网络管理系统的两个功能模块,告警处理模块和网络设备检测模块。
其中,网络设备检测模块用于按照每台网络设备对应的预设的检测周期,检测网管系统所纳管的网络设备是否脱网。在检测到某网络设备并发现该网络设备脱网后,生成用于指示该网络设备脱网的设备异常告警信息,并将设备异常告警信息上报至告警处理模块。
此处,不同的网络设备的检测周期可以相同,也可以不同。当网络设备接入网管系统后,网管系统会为该网络设备设置检测周期,并按照网络设备接入到网管系统的时间,以该检测周期为网络设备进行计时;当该网络设备的检测周期到计时达时,网管系统会向该网络设备发送ping报文,以检测该网络设备是否脱网。
例如,网络设备A于12点33分27秒接入到网管系统,且网管系统为网络设备A设置的检测周期为1分钟;网络设备B于13点15分33秒接入到网管系统,且网管系统为网络设备B设置的检测周期为1分钟;网络设备C于13点16分54秒接入到网管系统,且网管系统为网络设备C设置的检测周期为2分钟。当设备A接入到网管系统后,网管系统为网络设备A进行计时;当计时到达12点34分27秒、12点35分27秒……的时候,向网络设备A发送ping报文;当网络设备B接入到网管系统后,网管系统为网络设备B进行计时,当计时到达13点16分33秒、13点17分33秒……的时候,向网络设备B发送ping报文;当网络设备C接入到网管系统后,网管系统为网络设备C进行计时,当计时到达13点18分54秒、13点20分54秒……的时候,向网络设备C发送ping报文。
告警处理模块用于接收网络设备上报的设备异常告警信息,和/或,接收网络设备检测模块上报的设备异常告警信息。
下面分别对上述两种获取设备异常告警信息的方法加以说明:
Ⅰ:针对上述第一种情况,被网管系统纳管的任一网络设备会对自身的状态进行监测。当某网络设备监测自身状态出现问题,该问题可能导致该网络设备与其他网络设备连接的链路连接断开时,该网络设备作为目标网络设备向告警处理模块发送设备异常告警信息。
例如,设备异常告警可能是以下情况的一种或多种导致:用户去使能(disable)接口、连接接口的网线被拔掉、连接接口的网线损坏、接口配置中接口的IP地址被删除、链路中对端接口故障等原因造成的链路DOWN或接口DOWN;使能了开放式最短路径优先(OpenShortest Path First,OSPF)协议的接口状态改变、接口的OSPF连接状态改变、使能了OSPF协议的接口接收冲突配置、接口的OSPF邻居状态改变、接口的中间系统到中间系统(Intermediate System-to-Intermediate System,IS-IS)邻居状态改变、接口的IS-IS邻居关系改变、接口的边界网关协议(Border Gateway Protocol,BGP)状态回退等。
网络设备生成设备异常告警信息后,将该设备异常告警信息上报给告警处理模块,其中,该设备异常告警信息中携带该网络设备的信息,也即目标网络设备信息。其中,该目标网络设备信息可以是该目标网络设备上链路连接出现问题的接口的接口信息,也可以是链路出现问题的链路的链路信息。
当告警处理模块接收到网络设备上报的设备异常告警信息后,若目标网络设备信息为链路连接存在问题的接口的相关信息,则网管系统根据预存的网络拓扑结构以及接口的相关信息,将与该接口直接连接的网络设备确定为关联网络设备;若目标网络设备信息为链路信息,则网管系统根据预存的网络拓扑结构以及链路信息,则将与目标网络设备通过该链路连接的网络设备确定为关联网络设备。
如图2所示的组网示例中,被网管系统纳管的网络设备包括:设备1至设备9;其中设备1和设备2与部署有网管系统的设备直连;设备3、设备4和设备5分别与设备1直连;设备6和设备7分别与设备4直连;设备8和设备5直连;设备9和设备6直连。
假设设备1监控到其与设备4连接的链路连接断开,则生成相应的设备异常告警信息,并上报给告警处理模块;由于设备4与设备1的接口2连接,因此在该设备异常告警信息中携带的目标网络设备信息为接口2的信息。告警处理模块在接收到设备1上报的设备异常告警信息后,将设备1确定为目标网络设备,并根据预存的该组网的拓扑结构并根据该接口2的信息,将与该接口2直连的设备4确定为关联网络设备。
Ⅱ:针对上述第二种情况,网络设备检测模块会按照被网管系统所纳管的每台网络设备的预设的检测周期,向检测周期到达的网络设备发送探测信息。若在预设时间长度内没有接收到该网络设备针对探测信息的反馈信息,则将该网络设备确定为目标网络设备,并确定目标网络设备信息包括该为发送反馈信息的网络设备信息,生成用于指示网络设备脱网的设备异常告警信息,并将设备异常告警信息上报给告警处理模块。
如图2所示的组网示例中,网络设备检测模块会按照每一台网络设备的检测周期,在与每台网络设备的检测时间到达时,向对应的网络设备发送ping报文;例如在设备4的检测时间到达时,向设备4发送ping报文后,若在预设时间内没有接收到设备4对该ping报文的反馈信息,则认为该设备4脱网,将该设备4作为目标网络设备,生成设备异常告警信息,并将该设备4的信息作为目标网络设备信息携带在设备异常告警信息中,上报给告警处理模块。
另外,为了能够在执行本申请提供的脱网设备监测方法的同时,对网管系统原有的脱网设备监测流程不造成影响,使得网管系统在执行本申请提供的脱网设备监测方法的同时,能够并行执行原有的脱网设备监测流程,在本申请另一实施例中,按照预设的检测周期,向被纳管的每台网络设备发送探测信息,包括:
按照被网络管理系统纳管的每台网络设备对应的预设的检测周期,启动第一进程向检测周期到达的网络设备发送探测信息。
根据预存的网络拓扑结构,向目标网络设备的关联网络设备发送探测信息,包括:
若根据反馈信息确定出目标网络设备,则启动第二进程向该目标网络设备的关联网络设备发送探测信息,并继续通过第一进程在其余网络设备的检测周期到达时,向其余网络设备发送探测信息。
例如在图2所示的组网示例中,第一进程按照每一台网络设备的检测周期,在确定设备4的检测周期到达后,向设备4发送ping报文;并检测到该设备4脱网,则生成设备异常告警信息上报给第二进程。第二进程在接收到网络设备检测模块发送的设备异常告警信息后,确定设备4为目标网络设备,并确定设备6和设备7为当前关联网络设备;假设当第二进程向设备6发送ping报文的当前时刻,与设备6连接的设备9的检测周期恰好到达,第一进程向设备9发送ping报文以检测设备9是否脱网,进而第一进程能够较之第二进程更早的检测设备9是否脱网。
通过第一进程和第二进程并行执行两种网设备监测方法,使得网管设备能够更及时的发现网络中的脱网设备。
S102:根据预存的网络拓扑结构以及目标网络设备信息,向目标网络设备的关联网络设备发送探测信息,若没有接收到关联网络设备针对探测信息的反馈信息,上报关联网络设备的设备脱网告警信息。
其中,关联网络设备是指与目标网络设备之间存在直接或间接的链路连接关系的网络设备。
在具体实现的时候,网管系统在纳管组网内的网络设备时会保存所有被纳管的网络设备的拓扑结构,并随着新的网络设备加入组网,或者原有的网络设备退出组网即时更新。
告警处理模块获取到设备异常告警信息后,会确定目标网络设备,根据预存的网络拓扑结构,以及设备异常告警信息中携带的链路连接存在问题的目标网络设备信息,确定与目标网络设备存在直接或者间接的链路关系的网络设备作为关联网络设备,并向确定的关联网络设备发送探测信息;若在预设时间长度内没有接收到关联网络设备针对探测信息的反馈信息,则说明该关联网络设备脱网,上报关联网络设备的设备脱网告警信息。
在相关技术中,是在到达了关联网络设备检测周期,才会向关联网络设备发送探测信息。而本实施例所提供的方法,无需等待达到关联网络设备的轮询周期,而是在发现了目标网络设备有异常时,直接向关联网络设备发送探测信息,从而可以缩短发现关联网络设备脱网的时间。
当然,如果在预设时间长度内接收到关联网络设备针对探测信息的反馈信息,则说明该关联网络设备未脱网。
具体地,参见图3所示,本申请实施例提供一种确定关联网络设备脱网的具体方法:
S301:根据预存的网络拓扑结构以及目标网络设备信息,将目标网络设备的下一跳网络设备确定为当前关联网络设备。
S302:向确定的当前关联网络设备发送探测信息。
S303:检测在预设时间长度内是否接收到当前关联网络设备针对探测信息的反馈信息;如果是,则跳转至S307;如果否,则结束该确定关联网络设备脱网方法的执行流程。
S304:上报当前关联网络设备的设备脱网告警信息;跳转至S305。
S305:检测从目标网络设备到达当前关联网络设备的最短路径所包括的链路数量是否达到设定阈值;如果是,则结束该确定关联网络设备脱网方法的执行流程;如果否,则跳转至S306;
S306:将与当前关联网络设备的直接连接的下一级网络设备作为当前关联网络设备,跳转至S302。此处,本申请中的“下一级”网络设备是指相对于网管系统而言,与关联网络设备连接的远离网管系统的网络设备。
在具体实现的时候,设备异常告警信息有两个来源,其一,由被网管系统纳管的网络设备上报;其二,由网管系统生成。
Ⅰ:针对上述第一种情况,所确定的目标网络设备为上报备脱网告警信息的网络设备,所包括的目标网络设备信息包括:链路连接存在问题的接口的相关信息,或者链路的相关信息;因此,假若目标网络设备信息包括接口的相关信息时,以目标网络设备为出发点,将与该接口信息对应接口连接的下一跳网络设备确定为关联网络设备;假若目标网络设备包括链路的相关信息,以目标网络设备为出发点,将该链路信息对应链路的下一跳网络设备确定为当前关联网络设备,并检测当前关联网络设备是否脱网。
需要注意的是,在此种情况下,当确定目标网络设备后,第一次确定的当前关联网络设备的数量一般只有一台,除初次以外所确定的当前关联网络设备可以有多台。
例如在图2所提供的组网示例中,假设从目标网络设备到达当前关联网络设备的最短路径所包括的链路数量的设定阈值为2。若设备1监测到端口2的状态为DOWN,则向告警处理模块上报用于指示该设备1上端口2的链路连接断开的设备异常告警信息;告警处理模块确定设备1为目标网络设备,第一次确定的关联网络设备为设备4,告警处理模块向设备4发送探测信息;若在预设时间内接收到设备4针对该探测信息的反馈信息,则确定设备4并未脱网,结束该确定关联网络设备脱网的流程。
若预设时间长度内并未接收到设备4针对该探测信息的反馈信息,则确定设备4脱网;此时,确定与设备4直接连接的下一级设备6、设备7为当前关联网络设备,并向设备6和设备7发送探测信息,以探测设备6和设备7是否脱网。若在预设时间长度内并未接收到设备6针对探测信息的反馈信息,但由于从设备1到达设备9的最短路径所包括的链路数量为3,超出了设定阈值,因此即使发现设备6脱网,也不会再向作为设备6直接连接的下一级网络设备的设备9发送探测信息。
这里检测从目标网络设备到达当前关联网络设备的最短路径所包括的链路数量是否达到设定阈值,是由于在某些组网的结构是比较复杂,若目标网络设备与当前关联网络设备之间的链路所经过的网络设备数目过多,确定关联网络设备脱网的步骤所使用的时间可能会大于设备检测周期,在所花费的时间成本上实际上是没有意义的,若从目标网络设备到达关联网络设备的最短路径所包括的链路数量过多,不仅不会加快脱网设备发现的速度,反而会由于计算量增加导致的计算资源浪费,因此,对确定的关联网络设备进行限制,从而达到速发现组网中脱网设备的同时,将计算资源限制在合理范围内。
Ⅱ:针对上述第二种情况,所确定的目标网络设备为检测过程中未向网络设备检测模块发送针对探测信息的反馈信息的网络设备,所包括的目标网络设备信息包括:目标网络设备的信息,因此将该网络设备的下一跳网络设备确定为当前关联网络设备。
在此种情况下,当确定目标网络设备后,第一次确定的当前关联网络设备的数量根据目标网络设备直接连接的网络设备对应;若目标网络设备直连的网络设备只有一台,则第一次确定的当前关联网络设备数量也为一台;若目标网络设备直连的网络设备有多台,则第一次确定的当前关联网络设备的数量也为多台。
例如在图2所提供的组网示例中,假设从目标网络设备到达当前关联网络设备的最短路径所包括的链路数量的设定阈值为2。
若网络设备检测模块在检测过程中向设备1发送ping报文;若在预设时间长度内未接收到设备1针对该ping报文的反馈信息,则网络设备检测模块生成并向告警处理模块上报用于指示该设备1脱网的设备异常告警信息。
告警处理模块在接收到网络设备检测模块上报的设备异常告警信息后,将设备1作为目标网络设备,根据网络拓扑结构,首次确定设备3、设备4以及设备5为当前关联网络设备,并分别向设备3、设备4以及设备5发送ping报文;若在预设时间长度内分别接收到设备3和设备5针对向其发送的ping报文的反馈信息,则确定设备3和设备5未脱网;若在预设时间长度内未接受到设备4针对向其发送的ping报文的反馈信息,则确定设备4脱网。
由于确定了设备4脱网,且从设备1到达设备4的最短路径所包括的链路数量为1,未到达设定阈值,因此将与设备4直接连接的下一级网络设备,也即设备6和设备7作为当前关联网络设备,并向设备6和设备7发送ping报文。
若在预设时间长度内接收到设备6和设备7针对ping报文的反馈信息,则确定设备6和设备7未脱网,结束该确定关联网络设备脱网的步骤;若在预设时间长度内未接受到设备6针对ping报文的反馈信息,但由于设备1到达设备6的最短路径所包括的链路数量为2,达到了设定阈值,因此即使发现设备6脱网,也不会再向与设备6直接连接的下一级网络设备的设备9发送探测信息。
另外,为了保证检测的准确性,避免由于网络拥堵等原因造成的误检测,可以在获取设备异常告警信息后,根据预存的网络拓扑结构,向目标网络设备的关联网络设备发送预设数量的探测信息;若在发出探测信息的预设时间长度内均未接收到关联网络设备针对该探测信息的反馈信息,且未收到反馈消息的探测消息数量达到预设数量,则确定关联网络设备脱网。若在发出探测信息的而预设时间长度为,接收到关联网络设备针对该探测信息的反馈信息的数量达到1个以及以上,则认为该关联网络设备未脱网。
本申请实施中,当网络管理系统获取设备异常告警信息后,会根据预存的网络拓扑结构以及设备异常告警信息中携带的目标网络设备信息,确定目标网络设备,然后将与目标网络设备之间存在直接或间接的链路连接关系的网络设备确定为关联网络设备,并向关联网络设备发送探测消息。若预设时间长度内并未接收到关联网络设备针对探测信息的反馈信息,则确定关联网络设备脱网,该过程无需等待达到关联网络设备的轮询周期,而是在发现了目标网络设备有异常时,直接向关联网络设备发送探测信息,从而可以缩短发现关联网络设备脱网的时间。
基于同一发明构思,本申请实施例中还提供了与脱网设备监测方法对应的脱网设备监测装置,由于本申请实施例中的装置解决问题的原理与本申请实施例上述脱网设备监测方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。
本申请又一实施例还提供一种脱网设备监测装置,参见图4所示,本申请实施例所提供的脱网设备监测装置包括:
获取模块41,用于获取设备异常告警信息,所述设备异常告警信息中携带有链路连接存在问题的目标网络设备信息;
第一探测模块42,用于根据预存的网络拓扑结构以及所述目标网络设备信息,向所述目标网络设备的关联网络设备发送探测信息;
上报模块43,在没有接收到所述关联网络设备针对所述探测信息的反馈信息时,上报所述关联网络设备的设备脱网告警信息;
其中,所述关联网络设备是指与所述目标网络设备之间存在直接或间接的链路连接关系的网络设备。
本实施例所提供的装置,无需等待达到关联网络设备的轮询周期,而是在发现了目标网络设备有异常时,直接向关联网络设备发送探测信息,从而可以缩短发现关联网络设备脱网的时间。
可选地,所述第一探测模块42,具体用于根据如下步骤根据预存的网络拓扑结构以及所述目标网络设备信息,向所述目标网络设备的关联网络设备发送探测信息:
根据预存的所述网络拓扑结构以及所述目标网络设备信息,将与所述目标网络设备的直接连接的下一级网络设备确定为当前关联网络设备;
向确定的当前关联网络设备发送探测信息;
若在预设时间长度内没有接收到当前关联网络设备针对所述探测信息的反馈信息,则上报当前关联网络设备的设备脱网告警信息,将与当前关联网络设备直接连接的下一级网络设备作为当前关联网络设备,返回执行所述向当前关联网络设备发送探测信息的步骤。
可选地,所述第一探测模块42,还用于在上报当前关联网络设备的设备脱网告警信息之后,检测从目标网络设备到达当前关联网络设备的最短路径所包括的链路数量是否达到设定阈值;
所述探测模块,用于在检测到从目标网络设备到达当前关联网络设备的最短路径所包括的链路数量未达到设定阈值后,将与当前关联网络设备直接连接的下一级网络设备作为当前关联网络设备;
在检测到从目标网络设备到达当前关联网络设备的最短路径所包括的链路数量达到设定阈值后,结束根据预存的网络拓扑结构以及所述目标网络设备信息,向所述目标网络设备的关联网络设备发送探测信息的步骤。
可选地,还包括第二探测模块44,用于按照每台网络设备的预设的检测周期,向检测周期到达的网络设备发送探测信息,若没有接收到检测周期到达的网络设备针对所述探测信息的反馈信息,则生成该检测周期到达的网络设备发送的设备异常告警信息。
所述获取模块41具体用于根据下述一种或者多种情况获取设备异常告警信息:
接收被网络管理系统纳管的任一网络设备发送的所述设备异常告警信息;
接收所述第二探测模块上报的设备异常告警信息。
可选地,述第二探测模块44具体用于通过下述步骤按照预设的检测周期,向被纳管的每台网络设备发送探测信息:
按照被网络管理系统纳管的每台网络设备对应的预设的检测周期,启动第一进程向检测周期到达的所述网络设备发送探测信息;
所述第二探测模块具体用于根据如下步骤根据预存的网络拓扑结构,向所述目标网络设备的关联网络设备发送探测信息:
若根据反馈信息确定出目标网络设备,则启动第二进程向该目标网络设备的关联网络设备发送探测信息,并继续通过第一进程在其余网络设备的检测周期到达时,向其余网络设备发送探测信息。
可选地,所述第一探测模块42具体用于:向所述目标网络设备的关联网络设备发送预设数量的探测信息;
若在发出所述探测信息的预设时间长度内未接收到任何所述探测信息的反馈信息,则上报所述关联网络设备的设备脱网告警信息。
如图5所示,本公开实施例还提供了一种网络侧设备50,该网络侧设备50包括处理器51、存储器52和总线53,存储器53存储有所述处理器可执行的机器可读指令,当网络侧设备50运行时,处理器51与存储器52之间通过总线53通信,机器可读指令被处理器51执行时执行如下处理:
获取设备异常告警信息,所述设备异常告警信息中携带有链路连接存在问题的目标网络设备信息;
根据预存的网络拓扑结构以及所述目标网络设备信息,向所述目标网络设备的关联网络设备发送探测信息;
若没有接收到所述关联网络设备针对所述探测信息的反馈信息,则上报所述关联网络设备的设备脱网告警信息;
其中,所述关联网络设备是指与所述目标网络设备之间存在直接或间接的链路连接关系的网络设备。
在一种实施方式中,上述处理器51还用于在根据预存的网络拓扑结构以及所述目标网络设备信息,向所述目标网络设备的关联网络设备发送探测信息时,执行以下处理:
根据预存的所述网络拓扑结构以及所述目标网络设备信息,将与所述目标网络设备的直接连接的下一级网络设备确定为当前关联网络设备;
向确定的当前关联网络设备发送探测信息;
若在预设时间长度内没有接收到当前关联网络设备针对所述探测信息的反馈信息,则上报当前关联网络设备的设备脱网告警信息,将与当前关联网络设备直接连接的下一级网络设备作为当前关联网络设备,返回执行所述向当前关联网络设备发送探测信息的步骤。
在一种实施方式中,上述处理器51还用于在上报当前关联网络设备的设备脱网告警信息之后,执行以下处理:
检测从目标网络设备到达当前关联网络设备的最短路径所包括的链路数量是否达到设定阈值;
在检测到从目标网络设备到达当前关联网络设备的最短路径所包括的链路数量未达到设定阈值后,将与当前关联网络设备直接连接的下一级网络设备作为当前关联网络设备;
在检测到从目标网络设备到达当前关联网络设备的最短路径所包括的链路数量达到设定阈值后,结束根据预存的网络拓扑结构以及所述目标网络设备信息,向所述目标网络设备的关联网络设备发送探测信息的步骤。
在一种实施方式中,上述处理器51还用于在获取设备异常告警信息时,执行下述一种或者多种处理:接收被网络管理系统纳管的任一网络设备发送的所述设备异常告警信息;
按照每台网络设备的预设的检测周期,向检测周期到达的网络设备发送探测信息,若没有接收到检测周期到达的网络设备针对所述探测信息的反馈信息,则生成该检测周期到达的网络设备发送的设备异常告警信息。
在一种实施方式中,上述处理器51还用于按照每台网络设备的预设的检测周期,向检测周期到达的网络设备发送探测信息时,执行以下处理:
按照被网络管理系统纳管的每台网络设备对应的预设的检测周期,启动第一进程向检测周期到达的所述网络设备发送探测信息;
上述处理器51还用于在根据预存的网络拓扑结构,向所述目标网络设备的关联网络设备发送探测信息时,执行以下处理:
若根据反馈信息确定出目标网络设备,则启动第二进程向该目标网络设备的关联网络设备发送探测信息,并继续通过第一进程在其余网络设备的检测周期到达时,向其余网络设备发送探测信息。
在一种实施方式中,上述处理器51还用于向所述目标网络设备的关联网络设备发送探测信息时,执行以下处理:向所述目标网络设备的关联网络设备发送预设数量的探测信息;
上述处理器51还用于确定所述关联网络设备脱网时,执行以下处理:
若在发出所述探测信息的预设时间长度内未接收到任何所述探测信息的反馈信息,则上报所述关联网络设备的设备脱网告警信息
本公开实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器51运行时执行上述脱网设备监测方法的步骤。
本申请实施例所提供的一种脱网设备监测方法以及装置的计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
所述功能如果以系统功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以系统产品的形式体现出来,该计算机系统产品存储在一个存储介质中,包括若干指令用以使得一台计算机网络设备(可以是个人计算机,服务器,或者网络网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。
Claims (12)
1.一种脱网设备监测方法,应用于网络管理系统中,其特征在于,包括:
获取设备异常告警信息,所述设备异常告警信息中携带有链路连接存在问题的目标网络设备信息;
根据预存的网络拓扑结构以及所述目标网络设备信息,向所述目标网络设备的关联网络设备发送探测信息;
若没有接收到所述关联网络设备针对所述探测信息的反馈信息,则上报所述关联网络设备的设备脱网告警信息;
其中,所述关联网络设备是指与所述目标网络设备之间存在直接或间接的链路连接关系的网络设备。
2.根据权利要求1所述的方法,其特征在于,根据预存的网络拓扑结构以及所述目标网络设备信息,向所述目标网络设备的关联网络设备发送探测信息,包括:
根据预存的所述网络拓扑结构以及所述目标网络设备信息,将与所述目标网络设备的直接连接的下一级网络设备确定为当前关联网络设备;
向确定的当前关联网络设备发送探测信息;
若在预设时间长度内没有接收到当前关联网络设备针对所述探测信息的反馈信息,则上报当前关联网络设备的设备脱网告警信息,将与当前关联网络设备直接连接的下一级网络设备作为当前关联网络设备,返回执行向确定的当前关联网络设备发送探测信息的步骤。
3.根据权利要求2所述的方法,其特征在于,所述上报当前关联网络设备的设备脱网告警信息之后,还包括:检测从目标网络设备到达当前关联网络设备的最短路径所包括的链路数量是否达到设定阈值;
若目标网络设备到达当前关联网络设备的最短路径所包括的链路数量达到设定阈值,则结束所述脱网设备监测方法的执行流程;
若目标网络设备到达当前关联网络设备的最短路径所包括的链路数量未达到设定阈值,则执行所述将与当前关联网络设备直接连接的下一级网络设备作为当前关联网络设备的步骤。
4.根据权利要求1所述的方法,其特征在于,所述获取设备异常告警信息,具体包括以下情况的一种或多种:
接收被网络管理系统纳管的任一网络设备发送的所述设备异常告警信息;
按照每台网络设备的预设的检测周期,向检测周期到达的网络设备发送探测信息,若没有接收到检测周期到达的网络设备针对所述探测信息的反馈信息,则生成该检测周期到达的网络设备发送的设备异常告警信息。
5.根据权利要求4所述的方法,其特征在于,所述按照每台网络设备的预设的检测周期,向检测周期到达的网络设备发送探测信息,包括:
按照被网络管理系统纳管的每台网络设备对应的预设的检测周期,启动第一进程向检测周期到达的所述网络设备发送探测信息;
所述根据预存的网络拓扑结构,向所述目标网络设备的关联网络设备发送探测信息,包括:
若根据反馈信息确定出目标网络设备,则启动第二进程向该目标网络设备的关联网络设备发送探测信息,并继续通过第一进程在其余网络设备的检测周期到达时,向其余网络设备发送探测信息。
6.根据权利要求4或5所述的方法,其特征在于,所述向所述目标网络设备的关联网络设备发送探测信息,具体包括:
向所述目标网络设备的关联网络设备发送预设数量的探测信息;
确定所述关联网络设备脱网,具体包括:
若在发出所述探测信息的预设时间长度内未接收到任何所述探测信息的反馈信息,则上报所述关联网络设备的设备脱网告警信息。
7.一种脱网设备监测装置,应用于网络管理系统中,其特征在于,包括:
获取模块,用于获取设备异常告警信息,所述设备异常告警信息中携带有链路连接存在问题的目标网络设备信息;
第一探测模块,用于根据预存的网络拓扑结构以及所述目标网络设备信息,向所述目标网络设备的关联网络设备发送探测信息;
上报模块,在没有接收到所述关联网络设备针对所述探测信息的反馈信息时,上报所述关联网络设备的设备脱网告警信息;
其中,所述关联网络设备是指与所述目标网络设备之间存在直接或间接的链路连接关系的网络设备。
8.根据权利要求7所述的装置,其特征在于,所述第一探测模块,具体用于根据如下步骤根据预存的网络拓扑结构以及所述目标网络设备信息,向所述目标网络设备的关联网络设备发送探测信息:
根据预存的所述网络拓扑结构以及所述目标网络设备信息,将与所述目标网络设备的直接连接的下一级网络设备确定为当前关联网络设备;
向确定的当前关联网络设备发送探测信息;
若在预设时间长度内没有接收到当前关联网络设备针对所述探测信息的反馈信息,则上报当前关联网络设备的设备脱网告警信息,将与当前关联网络设备直接连接的下一级网络设备作为当前关联网络设备,返回执行所述向确定的当前关联网络设备发送探测信息的步骤。
9.根据权利要求8所述的装置,其特征在于,所述第一探测模块,还用于在上报当前关联网络设备的设备脱网告警信息之后,检测从目标网络设备到达当前关联网络设备的最短路径所包括的链路数量是否达到设定阈值;
若目标网络设备到达当前关联网络设备的最短路径所包括的链路数量达到设定阈值,则结束所述第一探测模块执行的步骤;
若目标网络设备到达当前关联网络设备的最短路径所包括的链路数量未达到设定阈值,则执行所述将与当前关联网络设备直接连接的下一级网络设备作为当前关联网络设备的步骤。
10.根据权利要求7所述的装置,其特征在于,还包括第二探测模块,用于按照每台网络设备的预设的检测周期,向检测周期到达的网络设备发送探测信息,若没有接收到检测周期到达的网络设备针对所述探测信息的反馈信息,则生成该检测周期到达的网络设备发送的设备异常告警信息;
所述获取模块具体用于根据下述一种或者多种情况获取设备异常告警信息:
接收被网络管理系统纳管的任一网络设备发送的所述设备异常告警信息;
接收所述第二探测模块上报的设备异常告警信息。
11.根据权利要求10所述的装置,其特征在于,所述第二探测模块具体用于通过下述步骤按照预设的检测周期,向被纳管的每台网络设备发送探测信息:
按照被网络管理系统纳管的每台网络设备对应的预设的检测周期,启动第一进程向检测周期到达的所述网络设备发送探测信息;
所述第二探测模块具体用于根据如下步骤根据预存的网络拓扑结构,向所述目标网络设备的关联网络设备发送探测信息:
若根据反馈信息确定出目标网络设备,则启动第二进程向该目标网络设备的关联网络设备发送探测信息,并继续通过第一进程在其余网络设备的检测周期到达时,向其余网络设备发送探测信息。
12.根据权利要求9或10所述的装置,其特征在于,所述第一探测模块具体用于:向所述目标网络设备的关联网络设备发送预设数量的探测信息;
若在发出所述探测信息的预设时间长度内未接收到任何所述探测信息的反馈信息,则上报所述关联网络设备的设备脱网告警信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810386108.7A CN108616423B (zh) | 2018-04-26 | 2018-04-26 | 一种脱网设备监测方法以及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810386108.7A CN108616423B (zh) | 2018-04-26 | 2018-04-26 | 一种脱网设备监测方法以及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108616423A true CN108616423A (zh) | 2018-10-02 |
CN108616423B CN108616423B (zh) | 2020-12-08 |
Family
ID=63661064
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810386108.7A Active CN108616423B (zh) | 2018-04-26 | 2018-04-26 | 一种脱网设备监测方法以及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108616423B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109413689A (zh) * | 2018-11-30 | 2019-03-01 | 公安部沈阳消防研究所 | 一种无线链路脱网检测方法 |
CN114006800A (zh) * | 2021-10-11 | 2022-02-01 | 中盈优创资讯科技有限公司 | 一种基于igp-spf算法的设备脱网告警方法及装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101217420A (zh) * | 2007-12-27 | 2008-07-09 | 华为技术有限公司 | 一种联动处理方法及设备 |
CN101478775A (zh) * | 2009-01-20 | 2009-07-08 | 中兴通讯股份有限公司 | 一种多邻居连接状态的检测方法、系统和设备 |
CN102263651A (zh) * | 2010-05-28 | 2011-11-30 | 烽火通信科技股份有限公司 | Snmp网络管理系统中局端设备连接状态的检测方法 |
CN102413187A (zh) * | 2011-12-09 | 2012-04-11 | 杭州华三通信技术有限公司 | 一种mpls l2vpn业务信息传输方法及设备 |
CN102638375A (zh) * | 2012-04-26 | 2012-08-15 | 北京星网锐捷网络技术有限公司 | 一种网络故障识别方法及装置 |
US20170302555A1 (en) * | 2004-01-27 | 2017-10-19 | At&T Intellectual Property Ii, L.P. | Optimized job scheduling and execution in a distributed computing grid |
-
2018
- 2018-04-26 CN CN201810386108.7A patent/CN108616423B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170302555A1 (en) * | 2004-01-27 | 2017-10-19 | At&T Intellectual Property Ii, L.P. | Optimized job scheduling and execution in a distributed computing grid |
CN101217420A (zh) * | 2007-12-27 | 2008-07-09 | 华为技术有限公司 | 一种联动处理方法及设备 |
CN101478775A (zh) * | 2009-01-20 | 2009-07-08 | 中兴通讯股份有限公司 | 一种多邻居连接状态的检测方法、系统和设备 |
CN102263651A (zh) * | 2010-05-28 | 2011-11-30 | 烽火通信科技股份有限公司 | Snmp网络管理系统中局端设备连接状态的检测方法 |
CN102413187A (zh) * | 2011-12-09 | 2012-04-11 | 杭州华三通信技术有限公司 | 一种mpls l2vpn业务信息传输方法及设备 |
CN102638375A (zh) * | 2012-04-26 | 2012-08-15 | 北京星网锐捷网络技术有限公司 | 一种网络故障识别方法及装置 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109413689A (zh) * | 2018-11-30 | 2019-03-01 | 公安部沈阳消防研究所 | 一种无线链路脱网检测方法 |
CN114006800A (zh) * | 2021-10-11 | 2022-02-01 | 中盈优创资讯科技有限公司 | 一种基于igp-spf算法的设备脱网告警方法及装置 |
CN114006800B (zh) * | 2021-10-11 | 2023-12-05 | 中盈优创资讯科技有限公司 | 一种基于igp-spf算法的设备脱网告警方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN108616423B (zh) | 2020-12-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Holterbach et al. | Swift: Predictive fast reroute | |
CN102308522B (zh) | 一种定位网络故障的方法、设备及系统 | |
US8631115B2 (en) | Connectivity outage detection: network/IP SLA probes reporting business impact information | |
CN111030873A (zh) | 一种故障诊断方法及装置 | |
CN103368843A (zh) | 受保护标签交换路径快速重路由的oam标签交换路径 | |
CN110113259A (zh) | 路径状态通知方法、路径切换方法、转发设备及系统 | |
CN101188530B (zh) | OSPF路由监测系统的IPv4和IPv6网络故障检测及定位方法和装置 | |
EP3232620B1 (en) | Data center based fault analysis method and device | |
CN109032610B (zh) | 一种程序包部署方法、电子设备及分布式系统 | |
CN108306747A (zh) | 一种云安全检测方法、装置和电子设备 | |
Gheorghe et al. | SDN-RADAR: Network troubleshooting combining user experience and SDN capabilities | |
CN109739527A (zh) | 一种客户端灰度发布的方法、装置、服务器和存储介质 | |
CN104471902A (zh) | 确定性网络故障检测 | |
Khan et al. | Data plane failure and its recovery techniques in SDN: A systematic literature review | |
CN108616423A (zh) | 一种脱网设备监测方法以及装置 | |
CN108206767A (zh) | 一种网络设备故障检测方法及装置 | |
CN106656636A (zh) | 一种云平台故障探测方法及装置 | |
US20090316570A1 (en) | Futile neighbor state loop prevention in high availability networks | |
CN109964450A (zh) | 一种确定共享风险链路组的方法及装置 | |
CN108696433A (zh) | 路由振荡抑制方法及bgp路由设备 | |
CN107656847A (zh) | 基于分布式集群的节点管理方法、系统、装置及存储介质 | |
CN102204169A (zh) | 故障检测方法、路由节点及系统 | |
JP2009296531A (ja) | 監視装置 | |
Tapolcai et al. | Internet optical infrastructure | |
US10461992B1 (en) | Detection of failures in network devices |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |