CN109039785B - 基于SNMP的Trap告警恢复方法和装置 - Google Patents

基于SNMP的Trap告警恢复方法和装置 Download PDF

Info

Publication number
CN109039785B
CN109039785B CN201811134214.2A CN201811134214A CN109039785B CN 109039785 B CN109039785 B CN 109039785B CN 201811134214 A CN201811134214 A CN 201811134214A CN 109039785 B CN109039785 B CN 109039785B
Authority
CN
China
Prior art keywords
component
detection
address
detecting
identifier
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811134214.2A
Other languages
English (en)
Other versions
CN109039785A (zh
Inventor
何万县
张保林
胡汉顶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201811134214.2A priority Critical patent/CN109039785B/zh
Publication of CN109039785A publication Critical patent/CN109039785A/zh
Application granted granted Critical
Publication of CN109039785B publication Critical patent/CN109039785B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/02Standardisation; Integration
    • H04L41/0213Standardised network management protocols, e.g. simple network management protocol [SNMP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种基于简单网络管理协议SNMP的陷阱Trap告警恢复方法和装置,该方法包括:接收Trap告警信息,其中,所述Trap告警信息中包括IP地址和组件标识;查找所述IP地址对应的设备;在所述IP地址对应的设备中,检测所述组件标识对应的组件;当检测到所述组件标识对应的组件恢复正常状态时,发送告警恢复信息,实现了对设备的全面监控和管理,提高了工作效率、节约了运营成本。

Description

基于SNMP的Trap告警恢复方法和装置
技术领域
本申请涉及计算机技术领域,具体涉及一种基于简单网络管理协议SNMP的陷阱Trap告警恢复方法和装置。
背景技术
随着海量数据的存储和应用,越来越多的设备被应用在数据中心中。数据中心中的监控平台通过监测设备的运行情况,更好地对设备进行运营和管理。数据中心会从各类厂家采购多种设备以保证数据的安全性和健壮性,为了方便设备的运营和管理,监管平台在对设备的监管中,会通过设备发送的SNMP trap信息来判断硬件的故障和插拔情况。然而部分硬件只会发送硬件的故障信息和拔出情况,不会发送故障恢复信息。因此,监管平台只会收到部分设备的故障信息,并不能获得故障是否恢复的信息,不能对设备进行全面的监控和管理。
发明内容
为了解决上述技术问题,本申请提供了一种简单网络管理协议SNMP的陷阱Trap告警恢复方法和装置,实现了对设备的全面监控和管理,提高了工作效率、节约了运营成本。
本申请提供了一种基于简单网络管理协议SNMP的陷阱Trap告警恢复方法,包括:
接收Trap告警信息,其中,所述Trap告警信息中包括IP地址和组件标识;
查找所述IP地址对应的设备;
在所述IP地址对应的设备中,检测所述组件标识对应的组件;
当检测到所述组件标识对应的组件恢复正常状态时,发送告警恢复信息。
在一个示例性的实施例中,上述方法还具有以下特点:
所述Trap告警信息中还包括组件类型;
检测时长与组件类型之间的对应关系预先存储在存储系统中;
所述检测所述组件标识对应的组件,包括:
根据所述组件类型,查询所述存储系统,获取所述组件类型对应的检测时长;
根据所述检测时长,在所述IP地址对应的设备中,检测所述组件标识对应的组件。
在一个示例性实施例中,上述方法还具有以下特点:
根据检测时长,在所述IP地址对应的设备中,检测所述组件标识对应的组件,包括:
步骤S41: 将所述IP地址、所述组件标识、所述检测时长以及当前时刻、写入到定时任务文件中;
步骤S42: 将所述当前时刻作为设备检测的起始时刻,根据所述当前时刻以及所述检测时长,获得设备检测的结束时刻;
步骤S43: 在所述检测时长内,在所述定时任务文件中存储的IP地址对应的设备中,对所述组件标识对应的组件进行检测;其中,对所述组件标识对应的组件的检测在所述设备检测的结束时刻停止。
在一个示例性实施例中,上述方法还具有以下特点:
在所述检测时长内,在所述定时任务文件中存储的IP地址对应的设备中,对所述组件标识对应的组件进行检测,包括:
当在所述设备检测结束时刻,在所述定时任务文件中存储的IP地址对应的设备中,检测到所述组件标识对应的组件恢复正常状态时,发送告警恢复信息,其中,所述告警恢复信息中包含所述IP地址和所述组件标识。
在一个示例性实施例中,上述方法还具有以下特点:
在所述检测时长内,在所述定时任务文件中存储的IP地址对应的设备中,对所述组件标识对应的组件进行检测,包括:
当在所述设备检测结束时刻,在所述定时任务文件中存储的IP地址对应的设备中,检测到所述定时任务文件中存储的组件标识对应的组件未恢复正常状态时,在预设的检测间隔后,返回所述步骤S41。
本申请提供了一种基于简单网络管理协议SNMP的陷阱Trap告警恢复装置,包括:存储器和处理器:
所述存储器,用于存储计算机可读指令;
所述处理器,用于执行所述计算机可读指令,以执行如下操作:
接收Trap告警信息,其中,所述Trap告警信息中包括IP地址和组件标识;
查找所述IP地址对应的设备;
在所述IP地址对应的设备中,检测所述组件标识对应的组件;
当检测到所述组件标识对应的组件恢复正常状态时,发送告警恢复信息。
在一个示例性实施例中,上述装置还具有以下特点:
所述Trap告警信息中还包括组件类型;
检测时长与组件类型之间的对应关系预先存储在存储系统中;
所述检测所述组件标识对应的组件,包括:
根据所述组件类型,查询所述存储系统,获取所述组件类型对应的检测时长;
根据所述检测时长,在所述IP地址对应的设备中,检测所述组件标识对应的组件。
在一个示例性实施例中,上述装置还具有以下特点:
根据检测时长,在所述IP地址对应的设备中,检测所述组件标识对应的组件,包括:
步骤S41: 将所述IP地址、所述组件标识、所述检测时长以及当前时刻、写入到定时任务文件中;
步骤S42: 将所述当前时刻作为设备检测的起始时刻,根据所述当前时刻以及所述检测时长,获得设备检测的结束时刻;
步骤S43: 在所述检测时长内,在所述定时任务文件中存储的IP地址对应的设备中,对所述组件标识对应的组件进行检测;其中,对所述组件标识对应的组件的检测在所述设备检测的结束时刻停止。
在一个示例性实施例中,上述装置还具有以下特点:
在所述检测时长内,在所述定时任务文件中存储的IP地址对应的设备中,对所述组件标识对应的组件进行检测,包括:
当在所述设备检测结束时刻,在所述定时任务文件中存储的IP地址对应的设备中,检测到所述组件标识对应的组件恢复正常状态时,发送告警恢复信息,其中,所述告警恢复信息中包含所述IP地址和所述组件标识。
在一个示例性实施例中,上述装置还具有以下特点:
在所述检测时长内,在所述定时任务文件中存储的IP地址对应的设备中,对所述组件标识对应的组件进行检测,包括:
当在所述设备检测结束时刻,在所述定时任务文件中存储的IP地址对应的设备中,检测到所述定时任务文件中存储的组件标识对应的组件未恢复正常状态时,在预设的检测间隔后,返回所述步骤S41。
综上,在本实施例中,接收Trap告警信息,其中,所述Trap告警信息中包括IP地址和组件标识;查找所述IP地址对应的设备;在所述IP地址对应的设备中,检测所述组件标识对应的组件;当检测到所述组件标识对应的组件恢复正常状态时,发送告警恢复信息, 可以检测硬件故障是否恢复,发送设备的故障恢复信息,实现了对设备的全面监控和管理,提高了工作效率、节约了运营成本。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
附图用来提供对本发明技术方案的进一步理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本发明的技术方案,并不构成对本发明技术方案的限制。
图1为本发明实施例的基于简单网络管理协议SNMP的陷阱Trap告警恢复方法的流程图;
图2为本发明实施例的基于简单网络管理协议SNMP的陷阱Trap告警恢复的示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下文中将结合附图对本发明的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。
图1是本发明实施例的基于简单网络管理协议SNMP的陷阱Trap告警恢复方法的流程图,根据该流程图,本实施例的基于简单网络管理协议SNMP的陷阱Trap告警恢复方法,包括:
步骤S101: 接收Trap告警信息,其中,所述Trap告警信息中包括IP地址和组件标识。
步骤S102: 查找所述IP地址对应的设备。
步骤103:在所述IP地址对应的设备中,检测所述组件标识对应的组件。
在该步骤中,可以检测以下设备中的组件包括但不限于:存储设备中的组件、服务器中的组件、交换机中的组件和防火墙设备中的组件等。当检测存储设备中的组件运行状态时,采用SMI-S协议;检测服务器中的组件的运行状态时,采用IPMI协议;当检测交换机和防火墙设备中的组件时,采用SNMP协议。
步骤S104: 当检测到所述组件标识对应的组件恢复正常状态时,发送告警恢复信息。
通过以上步骤,实现了对设备的全面监控和管理,提高了工作效率、节约了运营成本。
在一种实施方式中,所述Trap告警信息中还包括组件类型;
检测时长与组件类型之间的对应关系预先存储在存储系统中;
所述检测所述组件标识对应的组件,包括:
根据所述组件类型,查询所述存储系统,获取所述组件类型对应的检测时长;
根据所述检测时长,在所述IP地址对应的设备中,检测所述组件标识对应的组件。
在其他实施方式中,所述Trap告警消息还可以包括其他信息,而不限于采用上述实施方式中的组件类型。
在本实施方式的一个示例性实施例中,检测时长可以根据组件类型预先测试得到,并将测试得到的检测时长和组件类型对应存储在本地。这样,在需要获取组件的检测时长时,提取本地预先存储的检测时长即可。比如,可以首先提供一组同一类型的组件,并记录完成该组组件中,检测每个组件所需要的时长,由此得到分别对应于该组组件的多个检测时长;最后计算前述多个检测时长的平均检测时长,将计算得到的平均时长作为检测该类型组件所需的检测时长。在其他实施方式中,组件的检测时长还可以通过其他方式获取,本申请并不对此进行限定。
在一种实施方式中,根据检测时长,在所述IP地址对应的设备中,检测所述组件标识对应的组件,包括:
步骤S41: 将所述IP地址、所述组件标识、所述检测时长以及当前时刻、写入到定时任务文件中;
步骤S42: 将所述当前时刻作为设备检测的起始时刻,根据所述当前时刻以及所述检测时长,获得设备检测的结束时刻;
步骤S43: 在所述检测时长内,在所述定时任务文件中存储的IP地址对应的设备中,对所述组件标识对应的组件进行检测;其中,对所述组件标识对应的组件的检测在所述设备检测的结束时刻停止。
在一种实施方式中,在所述检测时长内,在所述定时任务文件中存储的IP地址对应的设备中,对所述组件标识对应的组件进行检测,包括:
当在所述设备检测结束时刻,在所述定时任务文件中存储的IP地址对应的设备中,检测到所述组件标识对应的组件恢复正常状态时,发送告警恢复信息,其中,所述告警恢复信息中包含所述IP地址和所述组件标识。
在另一种实施方式中,当在所述设备检测结束时刻,在所述定时任务文件中存储的IP地址对应的设备中,检测到所述组件标识对应的组件恢复正常状态时,发送告警恢复信息,其中,所述告警恢复信息中包含所述IP地址、所述组件标识和所述设备检测的开始时刻。
在又一个实施方式中,当在所述设备检测结束时刻,在所述定时任务文件中存储的IP地址对应的设备中,检测到所述组件标识对应的组件恢复正常状态时,发送告警恢复信息,其中,所述告警恢复信息中包含所述IP地址、所述组件标识、所述设备检测的开始时刻和所述设备检测的结束时刻。
在一种实施方式中,在所述检测时长内,在所述定时任务文件中存储的IP地址对应的设备中,对所述组件标识对应的组件进行检测,包括:
当在所述设备检测结束时刻,在所述定时任务文件中存储的IP地址对应的设备中,检测到所述定时任务文件中存储的组件标识对应的组件未恢复正常状态时,在预设的检测间隔后,返回所述步骤S41。
下面以具体应用示例对上述软件安装进度监控方法进行进一步说明。
应用实例1:
步骤一:设备监控装置收到设备发送的trap消息,其中,trap消息中包括的IP地址为192.168.24.47、组件类型为电源(power supply)、组件标识为PSU2。
步骤二:设备查找装置查找到IP地址192.168.24.47对应的设备。
步骤三:查询存储系统,得到组件类型电源对应的检测时长为3秒。
步骤四:将以上IP地址、组件标识、检测时长和当前时刻(例如,2018年9月26日14时56分03秒)写入到定时任务文件中。
步骤五:确定检测开始的时间为当前时刻,根据检测时长和当前时刻计算得到检测结束时刻(例如:2018年9月26日14时56分05秒)。
步骤六:在以上当前时刻时,对IP地址对应的设备中,组件标识为PSU2的电源进行检测。
步骤七:在检测结束时刻时,获得检测结果,当检测结果表明对应的组件恢复正常状态时,向监控平台发送包括该IP地址192.168.24.47和组件标识PSU2的告警恢复信息。
应用实例2:
步骤一:设备监控装置收到设备发送的trap消息,其中,trap消息中包括的IP地址为192.168.24.47、组件类型为电源(power supply)、组件标识为PSU2。
步骤二:设备查找装置查找到IP地址192.168.24.47对应的设备。
步骤三:查询存储系统,得到组件类型电源对应的检测时长为3秒。
步骤四:将以上IP地址、组件标识、检测时长和当前时刻(例如,2018年9月26日14时56分03秒)写入到定时任务文件中。
步骤五:确定检测开始的时间为当前时刻,根据检测时长和当前时刻计算得到检测结束时刻(例如:2018年9月26日14时56分06秒)。
步骤六:在以上当前时刻时,对IP地址对应的设备中,组件标识为PSU2的电源进行检测,在检测结束时刻时,获得检测结果,当检测结果表明对应的组未恢复正常状态时,在预设的检测间隔24小时后(即, 2018年9月27日14时56分03秒),将IP地址192.168.24.47、组件标识检测时长和此时的当前时间(2018年9月27日14时56分03秒)写入定时任务文件中。
步骤七:确定检测开始的时间为当前时刻,根据检测时长和当前时刻计算得到检测结束时刻(例如:2018年9月27日14时56分05秒)。
步骤八:在检测结束时刻时(2018年9月27日14时56分05秒),获得检测结果,当检测结果表明对应的组件恢复正常状态时,向监控平台发送包括该IP地址192.168.24.47和组件标识PSU2的告警恢复信息。
图2为本发明实施例的基于SNMP的Trap告警恢复装置,包括存储器10和处理器20;
所述存储器 10,用于存储计算机可读指令;
所述处理器 20,用于执行所述计算机可读指令,以执行如下操作:
接收Trap告警信息,其中,所述Trap告警信息中包括IP地址和组件标识;
查找所述IP地址对应的设备;
在所述IP地址对应的设备中,检测所述组件标识对应的组件;
当检测到所述组件标识对应的组件恢复正常状态时,发送告警恢复信息。
可以检测以下设备中的组件包括但不限于:存储设备中的组件、服务器中的组件、交换机中的组件和防火墙设备中的组件等。当检测存储设备中的组件运行状态时,采用SMI-S协议;检测服务器中的组件的运行状态时,采用IPMI协议;当检测交换机和防火墙设备中的组件时,采用SNMP协议。
在一种实施方式中,所述Trap告警信息中还包括组件类型;
检测时长与组件类型之间的对应关系预先存储在存储系统中;
所述检测所述组件标识对应的组件,包括:
根据所述组件类型,查询所述存储系统,获取所述组件类型对应的检测时长;
根据所述检测时长,在所述IP地址对应的设备中,检测所述组件标识对应的组件。
在其他实施方式中,所述Trap告警消息还可以包括其他信息,而不限于采用上述实施方式中的组件类型。
在本实施方式的一个示例性实施例中,检测时长可以根据组件类型预先测试得到,并将测试得到的检测时长和组件类型对应存储在本地。这样,在需要获取组件的检测时长时,提取本地预先存储的检测时长即可。比如,可以首先提供一组同一类型的组件,并记录完成该组组件中,检测每个组件所需要的时长,由此得到分别对应于该组组件的多个检测时长;最后计算前述多个检测时长的平均检测时长,将计算得到的平均时长作为检测该类型组件所需的检测时长。在其他实施方式中,组件的检测时长还可以通过其他方式获取,本申请并不对此进行限定。
在一种实施方式中,根据检测时长,在所述IP地址对应的设备中,检测所述组件标识对应的组件,包括:
步骤S41: 将所述IP地址、所述组件标识、所述检测时长以及当前时刻、写入到定时任务文件中;
步骤S42: 将所述当前时刻作为设备检测的起始时刻,根据所述当前时刻以及所述检测时长,获得设备检测的结束时刻;
步骤S43: 在所述检测时长内,在所述定时任务文件中存储的IP地址对应的设备中,对所述组件标识对应的组件进行检测;其中,对所述组件标识对应的组件的检测在所述设备检测的结束时刻停止。
在一种实施方式中,在所述检测时长内,在所述定时任务文件中存储的IP地址对应的设备中,对所述组件标识对应的组件进行检测,包括:
当在所述设备检测结束时刻,在所述定时任务文件中存储的IP地址对应的设备中,检测到所述组件标识对应的组件恢复正常状态时,发送告警恢复信息,其中,所述告警恢复信息中包含所述IP地址和所述组件标识。
在另一种实施方式中,当在所述设备检测结束时刻,在所述定时任务文件中存储的IP地址对应的设备中,检测到所述组件标识对应的组件恢复正常状态时,发送告警恢复信息,其中,所述告警恢复信息中包含所述IP地址、所述组件标识和所述设备检测的开始时刻。
在又一个实施方式中,当在所述设备检测结束时刻,在所述定时任务文件中存储的IP地址对应的设备中,检测到所述组件标识对应的组件恢复正常状态时,发送告警恢复信息,其中,所述告警恢复信息中包含所述IP地址、所述组件标识、所述设备检测的开始时刻和所述设备检测的结束时刻。
在一种实施方式中,在所述检测时长内,在所述定时任务文件中存储的IP地址对应的设备中,对所述组件标识对应的组件进行检测,包括:
当在所述设备检测结束时刻,在所述定时任务文件中存储的IP地址对应的设备中,检测到所述定时任务文件中存储的组件标识对应的组件未恢复正常状态时,在预设的检测间隔后,返回所述步骤S41。
本领域普通技术人员可以理解上述方法中的全部或部分步骤可通过程序来指令相关硬件完成,所述程序可以存储于计算机可读存储介质中,如只读存储器、磁盘或光盘等。可选地,上述实施例的全部或部分步骤也可以使用一个或多个集成电路来实现。相应地,上述实施例中的各模块/单元可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。本发明不限制于任何特定形式的硬件和软件的结合。
以上仅为本发明的优选实施例,当然,本发明还可有其他多种实施例,在不背离本发明精神及其实质的情况下,熟悉本领域的技术人员当可根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。

Claims (10)

1.一种基于简单网络管理协议SNMP的陷阱Trap告警恢复方法,其特征在于,包括:
接收Trap告警信息,其中,所述Trap告警信息中包括IP地址和组件标识;
查找所述IP地址对应的设备;
在所述IP地址对应的设备中,检测所述组件标识对应的组件,其中,当检测存储设备中的组件运行状态时,采用SMI-S协议;检测服务器中的组件的运行状态时,采用IPMI协议;当检测交换机和防火墙设备中的组件时,采用SNMP协议;
当检测到所述组件标识对应的组件恢复正常状态时,发送告警恢复信息。
2.根据权利要求1所述的方法,其特征在于:
所述Trap告警信息中还包括组件类型;
检测时长与组件类型之间的对应关系预先存储在存储系统中;
所述检测所述组件标识对应的组件,包括:
根据所述组件类型,查询所述存储系统,获取所述组件类型对应的检测时长;
根据所述检测时长,在所述IP地址对应的设备中,检测所述组件标识对应的组件。
3.根据权利要求2所述的方法,其特征在于:根据检测时长,在所述IP地址对应的设备中,检测所述组件标识对应的组件,包括:
步骤S41: 将所述IP地址、所述组件标识、所述检测时长以及当前时刻、写入到定时任务文件中;
步骤S42: 将所述当前时刻作为设备检测的起始时刻,根据所述当前时刻以及所述检测时长,获得设备检测的结束时刻;
步骤S43: 在所述检测时长内,在所述定时任务文件中存储的IP地址对应的设备中,对所述组件标识对应的组件进行检测;其中,对所述组件标识对应的组件的检测在所述设备检测的结束时刻停止。
4.根据权利要求3所述的方法,其特征在于:在所述检测时长内,在所述定时任务文件中存储的IP地址对应的设备中,对所述组件标识对应的组件进行检测,包括:
当在所述设备检测结束时刻,在所述定时任务文件中存储的IP地址对应的设备中,检测到所述组件标识对应的组件恢复正常状态时,发送告警恢复信息,其中,所述告警恢复信息中包含所述IP地址和所述组件标识。
5.根据权利要求3所述的方法,其特征在于:在所述检测时长内,在所述定时任务文件中存储的IP地址对应的设备中,对所述组件标识对应的组件进行检测,包括:
当在所述设备检测结束时刻,在所述定时任务文件中存储的IP地址对应的设备中,检测到所述定时任务文件中存储的组件标识对应的组件未恢复正常状态时,在预设的检测间隔后,返回所述步骤S41。
6.一种基于简单网络管理协议SNMP的陷阱Trap告警恢复装置,包括:存储器和处理器;其特征在于:
所述存储器,用于存储计算机可读指令;
所述处理器,用于执行所述计算机可读指令,以执行如下操作:
接收Trap告警信息,其中,所述Trap告警信息中包括IP地址和组件标识;
查找所述IP地址对应的设备;
在所述IP地址对应的设备中,检测所述组件标识对应的组件,其中,当检测存储设备中的组件运行状态时,采用SMI-S协议;检测服务器中的组件的运行状态时,采用IPMI协议;当检测交换机和防火墙设备中的组件时,采用SNMP协议;
当检测到所述组件标识对应的组件恢复正常状态时,发送告警恢复信息。
7.根据权利要求6所述的装置,其特征在于:
所述Trap告警信息中还包括组件类型;
检测时长与组件类型之间的对应关系预先存储在存储系统中;
所述检测所述组件标识对应的组件,包括:
根据所述组件类型,查询所述存储系统,获取所述组件类型对应的检测时长;
根据所述检测时长,在所述IP地址对应的设备中,检测所述组件标识对应的组件。
8.根据权利要求7所述的装置,其特征在于:根据检测时长,在所述IP地址对应的设备中,检测所述组件标识对应的组件,包括:
步骤S41: 将所述IP地址、所述组件标识、所述检测时长以及当前时刻、写入到定时任务文件中;
步骤S42: 将所述当前时刻作为设备检测的起始时刻,根据所述当前时刻以及所述检测时长,获得设备检测的结束时刻;
步骤S43: 在所述检测时长内,在所述定时任务文件中存储的IP地址对应的设备中,对所述组件标识对应的组件进行检测;其中,对所述组件标识对应的组件的检测在所述设备检测的结束时刻停止。
9.根据权利要求8所述的装置,其特征在于:在所述检测时长内,在所述定时任务文件中存储的IP地址对应的设备中,对所述组件标识对应的组件进行检测,包括:
当在所述设备检测结束时刻,在所述定时任务文件中存储的IP地址对应的设备中,检测到所述组件标识对应的组件恢复正常状态时,发送告警恢复信息,其中,所述告警恢复信息中包含所述IP地址和所述组件标识。
10.根据权利要求8所述的装置,其特征在于:在所述检测时长内,在所述定时任务文件中存储的IP地址对应的设备中,对所述组件标识对应的组件进行检测,包括:
当在所述设备检测结束时刻,在所述定时任务文件中存储的IP地址对应的设备中,检测到所述定时任务文件中存储的组件标识对应的组件未恢复正常状态时,在预设的检测间隔后,返回所述步骤S41。
CN201811134214.2A 2018-09-27 2018-09-27 基于SNMP的Trap告警恢复方法和装置 Active CN109039785B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811134214.2A CN109039785B (zh) 2018-09-27 2018-09-27 基于SNMP的Trap告警恢复方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811134214.2A CN109039785B (zh) 2018-09-27 2018-09-27 基于SNMP的Trap告警恢复方法和装置

Publications (2)

Publication Number Publication Date
CN109039785A CN109039785A (zh) 2018-12-18
CN109039785B true CN109039785B (zh) 2021-05-04

Family

ID=64614774

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811134214.2A Active CN109039785B (zh) 2018-09-27 2018-09-27 基于SNMP的Trap告警恢复方法和装置

Country Status (1)

Country Link
CN (1) CN109039785B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102687111A (zh) * 2009-07-20 2012-09-19 美国能量变换公司 用于功率分析的技术
CN105490833A (zh) * 2015-11-19 2016-04-13 国家电网公司 一种信息系统的巡检系统与方法
CN106054787A (zh) * 2016-08-17 2016-10-26 深圳飞思安诺网络技术有限公司 一种基于硬件的机房网管和动力环境统一监控报警系统

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100514962C (zh) * 2004-09-30 2009-07-15 北京航空航天大学 大型网络中主机性能采集代理系统
CN100556037C (zh) * 2005-07-08 2009-10-28 中兴通讯股份有限公司 一种snmp协议下采用确认机制实现告警管理的方法
CN100539513C (zh) * 2005-11-09 2009-09-09 华为技术有限公司 基于简单网络管理协议的故障/告警管理系统及方法
CN101267335B (zh) * 2007-03-15 2011-10-26 中兴通讯股份有限公司 一种保证简单网络管理协议告警成功收发的方法
CN101388808B (zh) * 2008-10-24 2011-07-13 中兴通讯股份有限公司 一种基于简单网络管理协议的trap处理方法
CN104380660B (zh) * 2012-04-13 2017-09-29 思杰系统有限公司 用于在多核和集群系统中进行陷阱监控的系统和方法
US9244800B2 (en) * 2012-09-03 2016-01-26 Hitachi, Ltd. Management system for managing computer system comprising multiple monitoring-target devices
CN104486109B (zh) * 2014-12-09 2018-02-23 大唐移动通信设备有限公司 一种故障检测、恢复方法及装置
CN106506194A (zh) * 2016-10-17 2017-03-15 武汉丰天鼎业信息网络有限公司 通过snmp协议自动识别不同类型或型号设备告警的方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102687111A (zh) * 2009-07-20 2012-09-19 美国能量变换公司 用于功率分析的技术
CN105490833A (zh) * 2015-11-19 2016-04-13 国家电网公司 一种信息系统的巡检系统与方法
CN106054787A (zh) * 2016-08-17 2016-10-26 深圳飞思安诺网络技术有限公司 一种基于硬件的机房网管和动力环境统一监控报警系统

Also Published As

Publication number Publication date
CN109039785A (zh) 2018-12-18

Similar Documents

Publication Publication Date Title
US8041996B2 (en) Method and apparatus for time-based event correlation
CN108847982B (zh) 一种分布式存储集群及其节点故障切换方法和装置
CN106789306B (zh) 通信设备软件故障检测收集恢复方法和系统
CN109274544B (zh) 一种分布式存储系统的故障检测方法及装置
EP2472402A1 (en) Remote management systems and methods for mapping operating system and management controller located in a server
CN108933798B (zh) 数据存储方法、存储服务器及系统
CN111796959B (zh) 宿主机容器自愈方法、装置及系统
CN108776579B (zh) 一种分布式存储集群扩容方法、装置、设备及存储介质
CN104486125A (zh) 配置文件的备份方法及装置
CN112769652B (zh) 一种节点服务监控方法、装置、设备及介质
CN111565135A (zh) 监控服务器运行的方法、监控服务器和存储介质
US11930292B2 (en) Device state monitoring method and apparatus
CN109039785B (zh) 基于SNMP的Trap告警恢复方法和装置
CN112306871A (zh) 数据处理方法、装置、设备及存储介质
CN112069032A (zh) 一种虚拟机的可用性检测方法、系统及相关装置
CN112099990A (zh) 一种容灾备份方法、装置、设备及机器可读存储介质
CN109245937B (zh) 一种pim平台的告警方法及装置
CN115102838B (zh) 服务器宕机风险的应急处理方法和装置、电子设备
CN110377450A (zh) 一种硬件异常处理方法、系统及相关组件
CN116306429A (zh) 实现状态数据捕获的方法、装置、计算机存储介质及终端
CN104346233A (zh) 一种用于计算机系统的故障恢复方法及装置
CN115190052A (zh) 一种长连接的管理方法、系统和控制单元
CN110289977B (zh) 物流仓库系统的故障检测方法及系统、设备和存储介质
CN115460271B (zh) 一种基于边缘计算的网络控制方法及装置、存储介质
CN111414274A (zh) 运用于数据中心的机柜异常状态的远端排除方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant