CN106301826A - 一种故障检测方法及装置 - Google Patents

一种故障检测方法及装置 Download PDF

Info

Publication number
CN106301826A
CN106301826A CN201510256309.1A CN201510256309A CN106301826A CN 106301826 A CN106301826 A CN 106301826A CN 201510256309 A CN201510256309 A CN 201510256309A CN 106301826 A CN106301826 A CN 106301826A
Authority
CN
China
Prior art keywords
webmaster
detection
alarm
network element
passage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510256309.1A
Other languages
English (en)
Inventor
阚江涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN201510256309.1A priority Critical patent/CN106301826A/zh
Priority to PCT/CN2016/075655 priority patent/WO2016184222A1/zh
Publication of CN106301826A publication Critical patent/CN106301826A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/02Standardisation; Integration
    • H04L41/0213Standardised network management protocols, e.g. simple network management protocol [SNMP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明实施例公开了一种故障检测方法及装置,其中,该方法包括:所述告警检测指令用于所述网管检测所述网元设备上报故障至网管的通道是否出现故障;所述网管判断在预设时间阈值内是否接收到所述网元设备根据所述告警检测指令反馈的检测信息;在判断结果为否的情况下,所述网管确定所述通道出现故障,解决了相关技术中无法确定网元告警上报通道是否正常,导致网管对网元监控不可靠的问题,实现了网管系统可以检查网元上报通道,提高工作效率,降低网元告警脱管可能性,提高了网管对设备监控的可靠性。

Description

一种故障检测方法及装置
技术领域
本发明涉及数据通信领域,特别涉及一种故障检测方法及装置。
背景技术
简单网络管理协议(Simple Network Management Protocol,简称为SNMP)是一种应用层协议,是传输控制协议/因特网互联协议(Transmission ControlProtocol/Internet Protocol,简称为TCP/IP)协议族的一部分。它使网络设备之间能够方便地交换管理信息。能够让网络管理员对网络进行配置管理,发现和解决网络问题。目前SNMP已成为网络管理领域中最重要的标准,并被广泛支持和应用,大多数网络管理系统和平台都是基于SNMP的。
网管系统管理网元设备,网元设备主动上报故障信息,或者网管监测网元设备。如果网元向网管告警的通道出现故障,网管无法实现对网元的监管功能,网元也无法成功地上报告警,有网元告警脱管的可能。网管接收不到网元的报文,会认为网元设备出现故障,但接收不到报文的原因很有可能是告警上报通道出现了故障。因此,目前的网管系统故障检测方法都未涉及一个问题:即无法确定网元告警上报通道是否正常。
针对相关技术中无法确定网元告警上报通道是否正常,导致网管对网元监控不可靠的问题,目前尚未提出有效的解决方案。
发明内容
本发明提供了一种故障检测方法及装置,以至少解决无法确定网元告警上报通道是否正常,导致网管对网元监控不可靠的问题。
根据本发明的一个方面,提供了一种故障检测方法,包括:网管向网元设备发送告警检测指令,其中,所述告警检测指令用于所述网管检测所述网元设备上报故障至网管的通道是否出现故障;所述网管判断在预设时间阈值内是否接收到所述网元设备根据所述告警检测指令反馈的检测信息;在判断结果为否的情况下,所述网管确定所述通道出现故障。
进一步地,所述方法还包括:在判断结果为是的情况下,所述网管确定所述通道正常。
进一步地,在所述网管确定所述通道正常之后,所述方法还包括:所述网管丢弃所述检测信息。
进一步地,所述方法还包括:所述网管检测所述网管的告警信息接收功能是否正常。
进一步地,所述网管检测所述网管的告警信息接收功能是否正常包括:所述网管向网卡发送检测指令;所述网管判断在预设时间阈值内是否接收到所述网卡发送的所述检测指令;在判断结果为是的情况下,所述网管确定所述网管的告警信息接收功能正常;在判断结果为否的情况下,所述网管确定所述网管的告警信息接收功能出现故障。
进一步地,所述告警检测指令是SNMP TRAP报文的情况下,所述检测信息是失败告警,其中,所述SNMP TRAP报文用于触发所述网元设备认证所述失败告警。
根据本发明的另一方面,提供了一种故障检测装置,该装置包括:发送模块,用于向网元设备发送告警检测指令,其中,所述告警检测指令用于所述网管检测所述网元设备上报故障至网管的通道是否出现故障;判断模块,用于判断在预设时间阈值内是否接收到所述网元设备根据所述告警检测指令反馈的检测信息;确定模块,用于在判断结果为否的情况下,确定所述通道出现故障。
进一步地,所述确定模块,还用于在判断结果为是的情况下,确定所述通道正常。
进一步地,所述装置还包括:检测模块,用于检测所述网管的告警信息接收功能是否正常。
进一步地,所述检测模块包括:发送单元,用于向网卡发送检测指令;判断单元,用于所述网管判断在预设时间阈值内是否接收到所述网卡发送的所述检测指令;第一确定单元,用于在判断结果为是的情况下,确定所述网管的告警信息接收功能正常;第二确定单元,用于在判断结果为否的情况下,确定所述网管的告警信息接收功能出现故障。
通过本发明,采用网管向网元设备发送告警检测指令,其中,所述告警检测指令用于所述网管检测所述网元设备上报故障至网管的通道是否出现故障;所述网管判断在预设时间阈值内是否接收到所述网元设备根据所述告警检测指令反馈的检测信息;在判断结果为否的情况下,所述网管确定所述通道出现故障,解决了相关技术中无法确定网元告警上报通道是否正常,导致网管对网元监控不可靠的问题,实现了网管系统可以检查网元上报通道,提高工作效率,降低网元告警脱管可能性,提高了网管对设备监控的可靠性。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的故障检测方法的流程图一;
图2是根据本发明实施例的故障检测方法的流程图二;
图3是根据本发明实施例的故障检测方法的流程图三;
图4是根据本发明实施例的故障检测装置的结构框图一;
图5是根据本发明实施例的故障检测装置的结构框图二;
图6是根据本发明实施例的故障检测装置的检测模块的结构框图;
图7是根据本发优选实施例的故障检测装置的结构框图;
图8是根据本发明优选实施例的故障检测方法的流程图一;
图9是根据本发明优选实施例的故障检测方法的流程图二;
图10是根据本发明优选实施例的网管告警接收模块72收到的检测忽略消息结构示意图;
图11是相关技术中RFC1907定义的认证失败告警(authenticationFailure NOTIFICATION-TYPE)的示意图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
在本实施例中提供了一种故障检测方法,图1是根据本发明实施例的故障检测方法的流程图,如图1所示,该流程可以包括如下步骤:
步骤S100,网管向网元设备发送告警检测指令,其中,告警检测指令用于网管检测所述网元设备上报故障至网管的通道是否出现故障;
步骤S102,网管判断在预设时间阈值内是否接收到所述网元设备根据所述告警检测指令反馈的检测信息;
步骤S104,在判断结果为否的情况下,所述网管确定所述通道出现故障。
通过上述步骤,网管系统主动向网元设备发送检测指令,网元设备根据检测指令反馈检测信息。如果在预定时间范围内,网管系统未接收到网元设备反馈的检测信息,则可以确定网元设备向网管系统上报故障的通道出现了故障,解决了相关技术中无法确定网元告警上报通道是否正常,导致网管对网元监控不可靠的问题,实现了网管系统可以检查网元上报通道,提高工作效率,降低网元告警脱管可能性,提高了网管对设备监控的可靠性。
进一步地,该方法还可以包括步骤S106,在判断结果为是的情况下,所述网管确定所述通道正常。如果在预定时间范围内,网管系统接收到网元设备反馈的检测信息,则可以认为上报告警通道正常,保障网管系统对网元设备监控的可靠性。
在优选的实施方式中,网管系统在确定上报告警通道正常的情况下,该方法还可以包括:所述网管丢弃所述检测信息。在检测上报通道是否出现故障期间,不需要对接收到的检测信息显示到网管或入库,否则会给客户带来误解,以为设备遭到了攻击,因此网管系统会丢弃并忽略该检测信息,
在本发明实施例中还提供了一种故障检测方法,图2是根据本发明实施例的故障检测方法的流程图二,如图2所示,该流程可以包括如下步骤:
步骤S200,网管检测网管的告警信息接收功能是否正常;
步骤S202,网管向网元设备发送告警检测指令,其中,告警检测指令用于网管检测网元设备上报故障至网管的通道是否出现故障;
步骤S204,网管判断在预设时间阈值内是否接收到网元设备根据告警检测指令反馈的检测信息;
步骤S206,在判断结果为否的情况下,网管确定通道出现故障;
步骤S208,在判断结果为是的情况下,网管确定通道正常。
网管系统在确定网元设备告警上报通道正常的情况下,这个结论是很明确的,不需要对网管系统的告警接收功能检测。在网管系统确定网元设备上报告警通道出现故障的情况下,并不能百分百确定是告警通道出了问题,也有一定的可能性是网管系统告警接收功能出现了故障,导致网管无法及时接收到网元上报的故障检测信息,使网管误认为通道出现故障。在该种情况下,还需要对网管的告警接收功能进行检测。网管告警通道检测模块通知网管告警接收测试模块进行网管告警接收检测。
进一步地,步骤S200可以在步骤S202之前,也可以在步骤S206或者S208之后。在网管接收功能正常的情况下,检测告警上报通道的判断结果可以是准确的。在确定上报告警通道出现故障的情况下,再对网管接收功能进行检测。如果网管告警接收功能正常,说明告警通道检测结果没有问题;在告警接收功能出现故障时,就不能确定告警通道是否出现故障。
在本实施例中提供了一种故障检测方法,图3是根据本发明实施例的故障检测方法的流程图三,如图3所示,该流程可以包括如下步骤:
步骤S300,网管向网卡发送检测指令;
步骤S302,网管判断在预设时间阈值内是否接收到网卡发送的检测指令;
步骤S304,在判断结果为否的情况下,网管确定网管的告警信息接收功能出现故障;
步骤S306,在判断结果为是的情况下,网管确定网管的告警信息接收功能正常;
通过网管系统内部模块发送和接收检测指令,实现检测网管系统接收功能的可靠性。
步骤S208,网管向网元设备发送告警检测指令,其中,告警检测指令用于网管检测网元设备上报故障至网管的通道是否出现故障;
步骤S310,网管判断在预设时间阈值内是否接收到网元设备根据告警检测指令反馈的检测信息;
步骤S312,在判断结果为否的情况下,网管确定通道出现故障;
步骤S314,在判断结果为是的情况下,网管确定通道正常。
网管告警接收功能正常是网元告警上报通道检测的必要条件。只有网管告警接收功能无问题测试设备上报才有意义。通过该方法,确定网管系统的告警接收功能正常的情况下,再对告警上报通道进行检测,根据检测结果确定告警上报通道是否正常,解决了相关技术中无法确定网元告警上报通道是否正常,导致网管对网元监控不可靠的问题,提高了告警管理的可靠性,用户可以及时的发现网元告警脱管问题。
在优选的实施方式中,上述方法还可以包括:该告警检测指令是SNMP TRAP报文,其中,所述SNMP TRAP报文用于触发所述网元设备认证失败告警;该检测信息是认证失败告警。SNMP Trap是SNMP的一部分,当被监控段出现特定事件或故障,代理端会给网管发告警事件。在RFC1907中有定义认证失败告警(authentication Failure NOTIFICATION-TYPE,在该优选实施方中利用此告警作为告警上报检测。可以简单快速的检测设备告警上报通道是否正常,支持所有支持SNMP(简单网络协议)V1和V2C管理的设备。测试效率比手动触发端口宕告警和配置检查的效率高了上百倍。
在本实施例中还提供了一种故障检测装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图4是根据本发明实施例的故障检测装置的结构框图一,如图4所示,该装置包括发送模块40、判断模块42和确定模块44,下面对该装置进行说明。
发送模块40,用于向网元设备发送告警检测指令,其中,告警检测指令用于网管检测所述网元设备上报故障至网管的通道是否出现故障;
判断模块42,用于判断在预设时间阈值内是否接收到网元设备根据所述告警检测指令反馈的检测信息;
确定模块44,用于在判断结果为否的情况下,确定通道出现故障。
进一步地,确定模块44,还可以用于在判断结果为是的情况下,确定所述通道正常。
图5是根据本发明实施例的故障检测装置的结构框图二,结合图5对该装置进行说明。
检测模块50,用于检测所述网管的告警信息接收功能是否正常;
发送模块52,用于向网元设备发送告警检测指令,其中,告警检测指令用于网管检测所述网元设备上报故障至网管的通道是否出现故障;
判断模块54,用于判断在预设时间阈值内是否接收到网元设备根据所述告警检测指令反馈的检测信息;
确定模块56,用于在判断结果为否的情况下,确定通道出现故障。
进一步地,如附图6所示,该检测模块50还可以包括:
发送单元501,用于向网卡发送检测指令;
判断单元502,用于判断在预设时间阈值内是否接收到所述网卡发送的所述检测指令;
第一确定单元503,用于在判断结果为是的情况下,确定网管的告警信息接收功能正常;
第二确定单元504,用于在判断结果为否的情况下,确定网管的告警信息接收功能出现故障。
通过上述装置,网管系统主动向网元设备发送检测指令,网元设备根据检测指令反馈检测信息。如果在预定时间范围内,网管系统未接收到网元设备反馈的检测信息,则可以确定网元设备向网管系统上报故障的通道出现了故障,解决了相关技术中无法确定网元告警上报通道是否正常,导致网管对网元监控不可靠的问题,实现了网管系统可以检查网元上报通道,提高工作效率,降低网元告警脱管可能性,提高了网管对设备监控的可靠性。
下面再结合具体实施例对本发明进行说明。
图7是根据本发明优选实施例的故障检测的结构框图;如图7所示,该装置可以实现上述图4至6中所述装置的功能,可以包括如下模块:
网管告警通道检测模块70:负责检测告警上报通道是否正常可以实现上述图4中的判断模块42的功能;
网管告警接收模块72:主要负责监听端口,接收trap,可以实现图4中发送模块的功能;
网管告警接收测试模块74:主要负责产生并发送特定的trap到网管告警接收端口,可以实现图5中的检测模块50的功能;
网元告警测试模块76:主要使设备产生认证失败告警,并记录告警产生时间。将记录的告警产生时间和设备信息返回给告警通道检测模块,可以实现图4中确定模块44的功能;
与现有技术相比较,本实施例提供一种快速检测告警上报通道是否正常方法和系统,通过实际的测试真实的反映了网管对设备告警的管理状况。基于测试的告警上报检查方法简单,便于操作与配置检查相比可靠性更高,检查速度更快,告警测试不需要修改设备上的业务,对设备的影响更小。
在本发明的优选实施例中提供了一种故障检测方法,图8是根据本发明优选实施例的一种故障检测方法的流程图一,如图8所示,该流程可以包括如下步骤:
步骤S800,检测网管告警接收是否正常;
步骤S802,检测网元上报告警通道是否正常。
网管告警接收检测是网元告警上报检测的前提条件。只有网管告警接收功能无问题测试设备上报才有意义。目前已知的网管接收问题有很多种类,大概有:服务器端口被占用,告警接收模块未启动;网管上存在防火墙服务器上的告警被拦截了;网管服务端没有获得足够的权限,启动异常等。网元告警上报异常更加多了,主要原因集中在设备侧。本优选实施例并不关注设备的具体配置,只关注设备是否可以上报trap到网管。
在本发明的优选实施例中提供了一种故障检测方法,图9是根据本发明优选实施例的一种基于家庭网关的故障检测的方法流程图二,图9针对图8中所示的步骤S800/、步骤S802进行了详细的描述。如图10所示,该方法可以包括如下步骤:
步骤S900,网管发送指定TRAP到网络上;
网管告警通道检测模块70通知网管告警接收测试模块74进行网管告警接收功能检测;网管告警接收测试模块74发送指定trap(例如:.1.3.6.1.4.1.3902.10.10.10.10)到网络上。
步骤S902,监听在指定时间内是否接收到指定的TRAP;
网管告警接收模块70监听网络在指定的时间(通常为4秒)内是否收到指定trap。
步骤S904,在否的情况下,确定网管接收告警功能出现故障;如果在达到超时时间还没有收到trap报文,则网管服务器告警接收出现问题。网管告警通道检测模块70记录检测结果。
步骤S906,在是的情况下,确定网管接收告警功能正常;如果网管告警接收模块70收到了指定的trap报文:表明网管的trap接收端口是可用了,即Trap监听正常。网管告警通道检测模块70记录检测结果。
进一步地,网管告警通道检测模块70通知网管告警接收模块72忽略在指定时间内忽略设备认证失败告警。如果设备在测试告警上报期间产生的认证失败告警显示到网管或入库了,会给客户带来误解,认为设备遭到了攻击。所以应通知告警接收模块72丢弃该检测的TRAP报文。
具体地,网管告警接收模块收到的检测忽略消息结构可以如图10所示,主要包括:网元id和开始时间。每个网元trap上报检测开始的时候,网管告警通道检测模块会往检测队列中加入一条记录。当检测完成或检测超时会将队列的相应数据删除。如果队列中的数据为非空的时候,告警检测将会忽略一次检测报文。并将对应的检测条目从丢列中删除。
步骤S908,网管向网元发送检测报文;
告警通道检测模块70通知网元告警测试模块76发送检测报文SBMP Trap;SNMP Trap是SNMP的一部分,当被监控段出现特定事件或故障,代理端会给网管发告警事件。在RFC1907中有定义认证失败告警(authenticationFailure NOTIFICATION-TYPE,具体可以详见图11)。
步骤S910,触发网元产生认证失败告警;
网元告警测试模块76触发网元设备产生认证失败告警。使用错误的团体串取设备上指定的mib节点(即snmp get操作),设备会产生认证失败告警。如使用errorCommunity作为团体串,使用snmp get方式发送请求取.iso.org.dod.internet.mgmt.mib-2.system.sysDescr上的值;设备收到错误的团体串后,会产生认证失败告警(如图11所示),并将认证失败告警发到网管告警接收模块72。
步骤S912,网管是否在指定的时间内接收到认证失败告警;
使用错误的团体串取设备上指定的mib节点的时候,通常设置重试次数为0,如果设置为多次重试会影响接收的判断功能。触发命令发出后,通常等待4秒左右,如果命令发出4秒网管没有收到则告警可以确认是无法收到了。在网络较差的时候可以加大这个时间。增加时间会降低通道检测速度,所以需要按照实际的网络情况进行调整。但是建议不要低于2秒。
步骤S914,在是的情况下,确定网元上报告警通道正常;
步骤S916,在否的情况下,确定网元上报告警通道出现故障。
网管告警接收模块72,如果在指定时间内收到了该测试设备的认证失败报文,网管系统可以确定该上报告警通道正常,记录该网元设备可以上报告警。为防止网管和维护误认,可以将该报文丢弃。如果在指定时间内未收到了该测试设备的认证失败报文,网管系统可以确定该上报告警通道出现了故障,记录此设备不能正常地上报告警信息。
进一步地,通过发送标准的测试报文可以用于所有支持snmpv1和snmpv2C的设备。被管理设备不需要特别定制,开发和应用成本低。使用报文测试如果设备告警可达测试单个设备的时间少于1秒,高性能设备测试时间可以少于0.1秒。测试效率比手动触发端口宕告警和配置检查的效率高了上百倍。无论该通道是否正常,该网元设备是否可以正常上报告警,在检测结束后网管系统都会将检测队列中的条目删除,使其不影响正常的认证失败报文上报。当检测完成后,可以测试结果显示给用户。
通过本优选实施例提供的方法,支持所有支持SNMP(简单网络协议)V1和V2C管理的设备。可以快速地检测告警上报通道是否正常,可以降低告警无法上报导致的网元告警脱管可能性,提高网管对设备监控的可靠性。
综上所述,上述实施例、优选实施例和实施方式提供了一种上报告警通道的检测方法及装置,通过网管发送检测报文,判断在预设时间内是否接收到根据检测报文反馈的检测故障信息,确定上报告警通道是否出现故障,解决了相关技术中无法确定网元告警上报通道是否正常,导致网管对网元监控不可靠的问题,实现了用户可以及时的发现网元告警脱管,降低网元告警脱管可能性,提高了网管对设备监控的可靠性。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上该仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种故障检测方法,其特征在于,包括:
网管向网元设备发送告警检测指令,其中,所述告警检测指令用于所述网管检测所述网元设备上报故障至网管的通道是否出现故障;
所述网管判断在预设时间阈值内是否接收到所述网元设备根据所述告警检测指令反馈的检测信息;
在判断结果为否的情况下,所述网管确定所述通道出现故障。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在判断结果为是的情况下,所述网管确定所述通道正常。
3.根据权利要求2所述的方法,在所述网管确定所述通道正常之后,所述方法还包括:
所述网管丢弃所述检测信息。
4.根据权利要求1至3任意一项所述的方法,其特征在于,所述方法还包括:
所述网管检测所述网管的告警信息接收功能是否正常。
5.根据权利要求4所述的方法,其特征在于,所述网管检测所述网管的告警信息接收功能是否正常包括:
所述网管向网卡发送检测指令;
所述网管判断在预设时间阈值内是否接收到所述网卡发送的所述检测指令;
在判断结果为是的情况下,所述网管确定所述网管的告警信息接收功能正常;
在判断结果为否的情况下,所述网管确定所述网管的告警信息接收功能出现故障。
6.根据权利要求1至3任意一项所述的方法,其特征在于,
所述告警检测指令是SNMP TRAP报文的情况下,所述检测信息是失败告警,其中,所述SNMP TRAP报文用于触发所述网元设备认证所述失败告警。
7.一种故障检测装置,应用于网管,其特征在于,包括:
发送模块,用于向网元设备发送告警检测指令,其中,所述告警检测指令用于所述网管检测所述网元设备上报故障至网管的通道是否出现故障;
判断模块,用于判断在预设时间阈值内是否接收到所述网元设备根据所述告警检测指令反馈的检测信息;
确定模块,用于在判断结果为否的情况下,确定所述通道出现故障。
8.根据权利要求1所述的装置,其特征在于,
所述确定模块,还用于在判断结果为是的情况下,确定所述通道正常。
9.根据权利要求7或8所述的装置,其特征在于,所述装置还包括:
检测模块,用于检测所述网管的告警信息接收功能是否正常。
10.根据权利要求9所述的装置,其特征在于,所述检测模块包括:
发送单元,用于向网卡发送检测指令;
判断单元,用于所述网管判断在预设时间阈值内是否接收到所述网卡发送的所述检测指令;第一确定单元,用于在判断结果为是的情况下,确定所述网管的告警信息接收功能正常;
第二确定单元,用于在判断结果为否的情况下,确定所述网管的告警信息接收功能出现故障。
CN201510256309.1A 2015-05-19 2015-05-19 一种故障检测方法及装置 Pending CN106301826A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201510256309.1A CN106301826A (zh) 2015-05-19 2015-05-19 一种故障检测方法及装置
PCT/CN2016/075655 WO2016184222A1 (zh) 2015-05-19 2016-03-04 一种故障检测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510256309.1A CN106301826A (zh) 2015-05-19 2015-05-19 一种故障检测方法及装置

Publications (1)

Publication Number Publication Date
CN106301826A true CN106301826A (zh) 2017-01-04

Family

ID=57319365

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510256309.1A Pending CN106301826A (zh) 2015-05-19 2015-05-19 一种故障检测方法及装置

Country Status (2)

Country Link
CN (1) CN106301826A (zh)
WO (1) WO2016184222A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113013992A (zh) * 2021-04-16 2021-06-22 广东电网有限责任公司 一种保信主站功能监控方法及装置

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11265080B2 (en) * 2019-04-29 2022-03-01 Hmn Technologies Co., Limited Submarine cable fault determining method and apparatus
CN116015426B (zh) * 2022-11-10 2024-04-02 国网山东省电力公司信息通信公司 电力通信网与继电保护2m通道故障联合诊断方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102142977A (zh) * 2010-08-02 2011-08-03 华为技术有限公司 远程管理脱管节点的方法、网管设备及系统
CN103109560A (zh) * 2012-09-07 2013-05-15 华为技术有限公司 一种操作维护通道的故障恢复方法和网络管理终端
US20140207929A1 (en) * 2013-01-21 2014-07-24 Alaxala Networks Corporation Management apparatus and management method
CN104579836A (zh) * 2015-01-06 2015-04-29 浪潮电子信息产业股份有限公司 一种通过收发trap数据包监控存储服务器状态的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102142977A (zh) * 2010-08-02 2011-08-03 华为技术有限公司 远程管理脱管节点的方法、网管设备及系统
CN103109560A (zh) * 2012-09-07 2013-05-15 华为技术有限公司 一种操作维护通道的故障恢复方法和网络管理终端
US20140207929A1 (en) * 2013-01-21 2014-07-24 Alaxala Networks Corporation Management apparatus and management method
CN104579836A (zh) * 2015-01-06 2015-04-29 浪潮电子信息产业股份有限公司 一种通过收发trap数据包监控存储服务器状态的方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113013992A (zh) * 2021-04-16 2021-06-22 广东电网有限责任公司 一种保信主站功能监控方法及装置

Also Published As

Publication number Publication date
WO2016184222A1 (zh) 2016-11-24

Similar Documents

Publication Publication Date Title
US6813634B1 (en) Network fault alerting system and method
US9014012B2 (en) Network path discovery and analysis
US5859959A (en) Computer network with devices/paths having redundant links
US7486625B2 (en) Communications network tap with link fault detector
JP2006501717A (ja) 電気通信ネットワーク・エレメントの監視
CN104219091A (zh) 一种网络运行故障检测系统及其方法
CN103810076B (zh) 数据复制的监控方法及装置
US20040006619A1 (en) Structure for event reporting in SNMP systems
CN106301826A (zh) 一种故障检测方法及装置
KR100908131B1 (ko) 로그 필터링을 통한 장애 감지 장치 및 그 방법과 그장치를 이용한 장애 감지 시스템
CN110474821A (zh) 节点故障检测方法及装置
CN101924661A (zh) 告警的处理方法及装置
CN116302862B (zh) 一种微服务架构下监控告警方法和系统
US7367055B2 (en) Communication systems automated security detection based on protocol cause codes
US20030110243A1 (en) Method, system and policy decision point (PDP) for policy-based test management
CN113612647B (zh) 一种告警处理方法及装置
Cisco Polling---The Event Generation Process
Cisco Polling-The Event Generation Process
Cisco Polling---The Event Generation Process
Cisco Polling---The Event Generation Process
Cisco Polling---The Event Generation Process
Cisco Polling-The Event Generation Process
WO2012079487A1 (zh) 一种基于snmp的trap处理的方法、网管及系统
CN101247287B (zh) 操作管理维护机制的故障检测方法
KR101214651B1 (ko) Snmp trap을 이용한 usp의 장애발생을 sms를 이용하여 통지하는 장치

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170104