CN104753712B - 一种告警上报方法、告警上报节点及告警上报系统 - Google Patents

一种告警上报方法、告警上报节点及告警上报系统 Download PDF

Info

Publication number
CN104753712B
CN104753712B CN201310752991.4A CN201310752991A CN104753712B CN 104753712 B CN104753712 B CN 104753712B CN 201310752991 A CN201310752991 A CN 201310752991A CN 104753712 B CN104753712 B CN 104753712B
Authority
CN
China
Prior art keywords
node
alarm report
alarm
report node
warning information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310752991.4A
Other languages
English (en)
Other versions
CN104753712A (zh
Inventor
李光瑞
齐骥
钱岭
邓展成
高丹
秦平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN201310752991.4A priority Critical patent/CN104753712B/zh
Publication of CN104753712A publication Critical patent/CN104753712A/zh
Application granted granted Critical
Publication of CN104753712B publication Critical patent/CN104753712B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明涉及通信技术领域,尤其涉及一种告警上报方法、告警上报节点及告警上报系统。本发明的内容包括:告警上报节点将采集到的告警信息发送给同一分组内的主告警上报节点,以使所述主告警上报节点上报所述告警信息;所述告警上报节点在预设时间段内没有接收到所述主告警上报节点发送的响应消息,将所述告警信息发送给同一分组内的从告警上报节点,以使所述从告警上报节点上报所述告警信息。本发明实施例在主告警上报节点故障时,通过同一分组内的从告警上报节点上报告警信息,可保证告警信息的可靠上报。

Description

一种告警上报方法、告警上报节点及告警上报系统
技术领域
本发明涉及通信技术领域,尤其涉及一种告警上报方法、告警上报节点及告警上报系统。
背景技术
随着通信技术的不断发展,通信业务的种类以及通信设备的数量不断增多。为了保证通信业务的正常开展,需要对通信设备的运行情况进行监测。
为了监测通信设备的运行情况,需要对通信设备产生的告警信息进行及时、有效地监控、处理和上报,以便网络运维人员能够实时监控,并进行相应的故障派单处理,使得通信设备能够快速恢复到正常状态,进而提供良好的通信服务。为此,就需要对通信设备产生的告警信息进行有效地处理,并能够可靠、有序地上报到网管系统。
现有技术中,为了将通信设备的告警信息上报给网管系统,将采集到告警信息上报给告警上报节点,如果没有得到告警上报节点的确认则一直向该告警上报节点发送告警信息。
然而,如果告警上报节点出现故障,则无法上报告警信息,告警上报的可靠性不高。
发明内容
本发明实施例提供了一种告警上报方法、告警上报节点及告警上报系统,用以解决现有技术中存在的告警上报的可靠性不高的问题。
一种告警上报方法,所述方法包括:
告警上报节点将采集到的告警信息发送给同一分组内的主告警上报节点,以使所述主告警上报节点上报所述告警信息;其中,同一分组内的所有告警上报节点采集的告警信息的类型相同或同一分组内任意两个告警上报节点之间的物理链路距离不大于设定阈值;
所述告警上报节点在预设时间段内没有接收到所述主告警上报节点发送的响应消息,将所述告警信息发送给同一分组内的从告警上报节点,以使所述从告警上报节点上报所述告警信息。
采用上述方案,可在主告警上报节点故障时,通过同一分组内的从告警上报节点上报告警信息,可保证告警信息的可靠上报。并且,如果将告警信息的类型相同的告警上报节点设置在同一个分组内,则可根据实际的业务需求获取所关注业务的告警信息。如果将物理链路距离不大于设定阈值的告警上报节点设置在同一个分组内,则可降低告警信息传输的代价。并且,对告警上报节点进行分组,有利于对不同组内的告警上报节点进行管理。
可选地,所述告警上报节点在将所述告警信息发送给所述从告警上报节点之后,还包括:
如果所述告警上报节点在预设时间段内没有接收到所述从告警上报节点发送的响应消息,在确定自身的告警信息响应值大于同一分组内的所有其他告警上报节点的告警信息响应值时,确定自身为新的主告警上报节点,并向所述所有其他告警上报节点发送用于通知新的主告警上报节点的主节点消息;
其中,所述告警上报节点的告警信息响应值是所述告警上报节点每接收到一次所述其他告警上报节点的告警信息后累加得到的。
如此,即可在主告警上报节点和从告警上报节点均发生故障后,根据告警上报节点的处理能力选择新的主告警上报节点。
可选地,所述方法还包括:
如果所述告警上报节点的告警信息响应值不大于所述所有其他告警上报节点的告警信息响应值,且在预设时间段内没有接收到来自其他告警上报节点的所述主节点消息,在确定自身的节点标识小于所述所有其他告警上报节点的节点标识时,确定自身为新的主告警上报节点,并向所述所有其他告警上报节点发送所述主节点消息。
如此,即可在主告警上报节点和从告警上报节点均发生故障后,根据告警上报节点的节点标识选择新的主告警上报节点。
可选地,所述告警上报节点在将所述告警信息发送给所述从告警上报节点之后,还包括:
如果所述告警上报节点在预设时间段内没有接收到所述从告警上报节点发送的响应消息,在接收到同一分组内的其他告警上报节点发送的新的从告警上报节点的节点信息后,若收到的所述节点信息与自身的节点信息相同,则确定自身为新的从告警上报节点。
如此,即可在主告警上报节点和从告警上报节点均发生故障后,由新的主告警上报节点选择新的从告警上报节点。
可选地,所述告警上报节点在确定自身为新的从告警上报节点之后,还包括:
所述告警上报节点在接收到同一分组内的其他告警上报节点发送的告警信息时,向发送告警信息的其他告警上报节点发送响应消息,并将接收到的告警信息发送给主告警代理节点;
所述告警上报节点在预设时间段内没有接收到所述主告警代理节点发送的响应消息,将所述接收到的告警信息发送给从告警代理节点。
如此,新的从告警上报节点在新的主告警上报节点发生故障后,可将其他告警上报节点发送的告警信息上报给主告警代理节点。并且,如果主告警代理节点发生故障,可通过从告警代理节点上报告警信息。
可选地,所述告警上报节点在确定自身为新的从告警上报节点之后,还包括:
所述告警上报节点在设定时长内接收到告警信息的数量大于所述所有其他告警上报节点的数量的一半时,确定自身为新的主告警上报节点。
如此,新的从告警上报节点在新的主告警上报节点发生故障后,可切换作为新的主告警上报节点。
可选地,所述告警上报节点在确定自身为新的主告警上报节点之后,还包括:
所述告警上报节点从所述所有其他告警上报节点中,选择告警信息响应值最大的告警上报节点作为新的从告警上报节点,并向所述所有其他告警上报节点发送所述新的从告警上报节点的节点信息。
如此,即可在主告警上报节点和从告警上报节点均发生故障后,由新的主告警上报节点选择新的从告警上报节点。
可选地,所述告警上报节点在确定自身为新的主告警上报节点之后,还包括:
所述告警上报节点接收同一分组内的其他告警上报节点的告警信息,并向发送告警信息的其他告警上报节点发送响应消息;
所述告警上报节点将自身采集到的告警信息和接收到的告警信息发送给主告警代理节点;
所述告警上报节点在预设时间段内没有接收到所述主告警代理节点发送的响应消息,将自身采集到的告警信息和接收到的告警信息发送给从告警代理节点。
如此,新的主告警上报节点可将自身采集到的告警信息和其他告警上报节点发送的告警信息上报给主告警代理节点。并且,如果主告警代理节点发生故障,可通过从告警代理节点上报告警信息。
可选地,所述告警上报节点在确定自身为新的主告警上报节点之后,还包括:
所述告警上报节点在收到其他告警上报节点的加入消息后,向发送所述加入消息的其他告警上报节点发送通知消息,以使所述发送所述加入消息的其他告警上报节点确定新的主告警上报节点和新的从上报告警节点。
如此,即可在有新的告警上报节点需要加入分组时,将新的主告警上报节点和新的从上报告警节点的信息告知新加入的告警上报节点。
可选地,所述告警上报节点在将采集到的告警信息发送给所述主告警上报节点之前,还包括:
所述告警上报节点在需要加入一分组时,向该分组内的所有其他告警上报节点发送加入消息;
所述告警上报节点在接收到所述主告警上报节点发送的通知消息时,根据所述通知消息确定所述主告警上报节点和所述从告警上报节点。
如此,即可在加入一个分组时,获取得到主告警上报节点和从告警上报节点的信息。
一种告警上报节点,所述告警上报节点包括:
采集模块,用于采集告警信息;
处理模块,用于将所述采集模块采集到的告警信息发送给同一分组内的主告警上报节点,以使所述主告警上报节点上报所述告警信息;在预设时间段内没有接收到所述主告警上报节点发送的响应消息,将所述告警信息发送给同一分组内的从告警上报节点,以使所述从告警上报节点上报所述告警信息;其中,同一分组内的所有告警上报节点采集的告警信息的类型相同或同一分组内任意两个告警上报节点之间的物理链路距离不大于设定阈值。
采用该设备,可在主告警上报节点故障时,通过同一分组内的从告警上报节点上报告警信息,可保证告警信息的可靠上报。
可选地,所述处理模块,还用于在将所述告警信息发送给所述从告警上报节点之后,在预设时间段内没有接收到所述从告警上报节点发送的响应消息,在确定所述告警上报节点的告警信息响应值大于同一分组内的所有其他告警上报节点的告警信息响应值时,确定所述告警上报节点为新的主告警上报节点,并向所述所有其他告警上报节点发送用于通知新的主告警上报节点的主节点消息;其中,所述告警上报节点的告警信息响应值是所述告警上报节点每接收到一次所述其他告警上报节点的告警信息后累加得到的。
如此,即可在主告警上报节点和从告警上报节点均发生故障后,根据告警上报节点的处理能力选择新的主告警上报节点。
可选地,所述处理模块,还用于如果所述告警上报节点的告警信息响应值不大于所述所有其他告警上报节点的告警信息响应值,且在预设时间段内没有接收到来自其他告警上报节点的所述主节点消息,在确定所述告警上报节点的节点标识小于所述所有其他告警上报节点的节点标识时,确定所述告警上报节点为新的主告警上报节点,并向所述所有其他告警上报节点发送所述主节点消息。
如此,即可在主告警上报节点和从告警上报节点均发生故障后,根据告警上报节点的节点标识选择新的主告警上报节点。
可选地,所述处理模块,还用于在将所述告警信息发送给所述从告警上报节点之后,在预设时间段内没有接收到所述从告警上报节点发送的响应消息,在接收到同一分组内的其他告警上报节点发送的新的从告警上报节点的节点信息后,若收到的所述节点信息与所述告警上报节点的节点信息相同,则确定所述告警上报节点为新的从告警上报节点。
如此,即可在主告警上报节点和从告警上报节点均发生故障后,由新的主告警上报节点选择新的从告警上报节点。
可选地,所述处理模块,还用于在确定所述告警上报节点为新的从告警上报节点之后,在接收到同一分组内的其他告警上报节点发送的告警信息时,向发送告警信息的其他告警上报节点发送响应消息,并将接收到的告警信息发送给主告警代理节点;在预设时间段内没有接收到所述主告警代理节点发送的响应消息,将所述接收到的告警信息发送给从告警代理节点。
如此,新的从告警上报节点在新的主告警上报节点发生故障后,可将其他告警上报节点发送的告警信息上报给主告警代理节点。并且,如果主告警代理节点发生故障,可通过从告警代理节点上报告警信息。
可选地,所述处理模块,还用于在确定所述告警上报节点为新的从告警上报节点之后,在设定时长接收到告警信息的数量大于所述所有其他其他告警上报节点的数量的一半时,确定所述告警上报节点为新的主告警上报节点。
如此,新的从告警上报节点在新的主告警上报节点发生故障后,可切换作为新的主告警上报节点。
可选地,所述处理模块,还用于在确定所述告警上报节点为新的主告警上报节点之后,从所述所有其他告警上报节点中,选择告警信息响应值最大的告警上报节点作为新的从告警上报节点,并向所述所有其他告警上报节点发送所述新的从告警上报节点的节点信息。
如此,即可在主告警上报节点和从告警上报节点均发生故障后,由新的主告警上报节点选择新的从告警上报节点。
可选地,所述处理模块,还用于在确定所述告警上报节点为新的主告警上报节点之后,接收同一分组内的其他告警上报节点的告警信息,并向发送告警信息的其他告警上报节点发送响应消息;将所述采集模块采集到的告警信息和接收到的告警信息发送给主告警代理节点;在预设时间段内没有接收到所述主告警代理节点发送的响应消息,将所述采集模块采集到的告警信息和接收到的告警信息发送给从告警代理节点。
如此,新的主告警上报节点可将自身采集到的告警信息和其他告警上报节点发送的告警信息上报给主告警代理节点。并且,如果主告警代理节点发生故障,可通过从告警代理节点上报告警信息。
可选地,所述处理模块,还用于在确定所述告警上报节点为新的主告警上报节点之后,在收到同一分组内的其他告警上报节点的加入消息后,向发送所述加入消息的其他告警上报节点发送通知消息,以使所述发送所述加入消息的其他告警上报节点确定新的主告警上报节点和新的从告警上报节点。
如此,即可在有新的告警上报节点需要加入分组时,将新的主告警上报节点和新的从上报告警节点的信息告知新加入的告警上报节点。
可选地,所述处理模块,还用于在将所述采集模块采集到的告警信息发送给所述主告警上报节点之前,在需要加入一分组时,向该分组内的所有其他告警上报节点发送加入消息;在接收到所述主告警上报节点发送的通知消息时,根据所述通知消息确定所述主告警上报节点和所述从告警上报节点。
如此,即可在加入一个分组时,获取得到主告警上报节点和从告警上报节点的信息。
一种告警上报系统,所述系统包括至少一组告警上报节点,其中,一组告警上报节点中包括至少三个相互连接的告警上报节点,三个相互连接的告警上报节点中包括主告警上报节点和从告警上报节点:
除主告警上报节点和从告警上报节点之外的告警上报节点,用于将采集到的告警信息发送给同一分组内的主告警上报节点,以使所述主告警上报节点上报所述告警信息,如果在预设时间段内没有接收到所述主告警上报节点发送的响应消息,则将所述告警信息发送给同一分组内的从告警上报节点,以使所述从告警上报节点上报所述告警信息;其中,同一分组内的所有告警上报节点采集的告警信息的类型相同或同一分组内任意两个告警上报节点之间的物理链路距离不大于设定阈值。
采用该系统,可在主告警上报节点故障时,通过同一分组内的从告警上报节点上报告警信息,可保证告警信息的可靠上报。
附图说明
图1为本发明实施例一中告警上报方法的步骤示意图;
图2a为本发明包含主告警上报节点、从告警上报节点和告警上报节点的系统示意图;
图2b为在图2a所示的系统中添加主告警代理节点和从告警代理节点的系统示意图;
图3为本发明实施例二中告警上报方法的步骤示意图;
图4为本发明实施例三中告警上报节点的结构示意图;
图5为本发明实施例四中告警上报节点的结构示意图;
图6为本发明实施例五中告警上报系统的架构示意图;
图7为本发明实施例六中告警上报系统的架构示意图。
具体实施方式
本发明实施例通过在每个分组内设置主告警上报节点和从告警上报节点,在主告警上报节点故障时,通过同一分组内的从告警上报节点上报告警信息,可保证告警信息的可靠上报。
下面结合说明书附图对本发明实施例作进一步说明,但本发明不局限于下面的实施例。
实施例一:
如图1所示,本发明实施例一中告警上报方法包括以下步骤:
步骤101:告警上报节点将采集到的告警信息发送给同一分组内的主告警上报节点;
步骤102:告警上报节点在预设时间段内没有接收到主告警上报节点发送的响应消息,将采集到的告警信息发送给同一分组内的从告警上报节点。
如图2a所示为包含主告警上报节点、从告警上报节点和告警上报节点的系统示意图。
其中,本发明实施例中的主告警上报节点和从告警上报节点可以只具备上报告警信息的功能,不具备采集告警信息的功能。告警上报节点在采集到告警信息后将告警信息发送给主告警上报节点或从告警上报节点。
可选地,本发明实施例中的主告警上报节点可采集自身的告警信息,并将自身采集到的告警信息上报,也可接收告警上报节点发送的告警信息并上报。本发明实施例中的从告警上报节点可采集告警信息,并将采集到的告警信息上报给主告警上报节点,如果主告警上报节点发生故障,则从告警上报节点可在接收到告警上报节点的告警信息后上报。
步骤101中,告警上报节点在采集到自身的故障信息后,可生成统一格式的告警信息,上报给主告警上报节点。主告警上报节点在接收到告警上报节点发送的告警信息后,即可将告警信息上报。
具体地,本发明实施例中的告警信息可包含以下七部分内容:告警节点名称(alarmNodeName)、告警信息标题(alarmTitle)、告警等级(alarmLevel)、告警标识(alarmID)、告警发生时间(alarmOccurTime)、告警原因描述(alarmDescription)、告警修复建议(alarmRestoreDevice),可由以下七元组标识来表示:
<alarmNodeName,alarmTitle,alarmLevel,alarmID,alarmOccurTime,alarmDescription,alarmRestoreDevice>
其中,告警等级分为五个等级:警告告警(waring)、次要告警(minor)、重要告警(major)、严重告警(critical)、致命告警(fatal)。
为了提高告警信息上报的效率,本发明实施例对告警上报节点进行分组。具体地,可根据业务类型将告警信息的类型相同的告警上报节点设置在同一个分组内,也可将物理链路距离不大于设定阈值的告警上报节点设置在同一个分组内。其中,一个分组包含一个主告警上报节点、从告警上报节点和至少一个告警上报节点。
如果根据业务类型将告警信息的类型相同的告警上报节点设置在同一个分组内,则可根据实际的业务需求获取所关注业务的告警信息,例如,可从语音业务类型的分组中提取出语音告警信息。如果将物理链路距离不大于设定阈值的告警上报节点设置在同一个分组内,则可降低告警信息传输的代价。
基于此,同一分组内的所有告警上报节点采集的告警信息的类型相同或同一分组内任意两个告警上报节点之间的物理链路距离不大于设定阈值。则告警上报节点在采集到告警信息后,可将采集到的告警信息发送给同一分组内的主告警上报节点。
可选地,在步骤101之前,告警上报节点在需要加入一分组时,向该分组内的所有其他告警上报节点发送加入消息。告警上报节点在接收到主告警上报节点发送的通知消息时,根据通知消息确定主告警上报节点和从告警上报节点。
例如,假设分组内的主告警上报节点接收到需要加入分组的告警上报节点发送的加入消息,则向发送该加入消息的告警上报节点发送通知消息,以使发送加入消息的告警上报节点确定主告警上报节点和从上报告警节点。
告警上报节点在确定主告警上报节点后,即可将采集到的告警信息发送给该主告警上报节点。
步骤102中,告警上报节点在预设时间段内(例如10秒内)没有接收到主告警上报节点发送的响应消息,表示主告警上报节点可能发生故障,则将采集到的告警信息发送给同一分组内的从告警上报节点。从告警上报节点在接收到告警上报节点发送的告警信息后,可将告警信息上报。
本发明实施例的主告警上报节点在接收到告警上报节点发送的告警信息后,会在预设时间段内(例如10秒内)发送响应消息。如果告警上报节点在向主告警上报节点发送告警信息后的预设时间段内没有接收到主告警上报节点发送的响应消息,表示主告警上报节点可能发生故障。
如果主告警上报节点发生故障,则从告警上报节点可在接收到告警上报节点的告警信息后上报。从告警上报节点在接收到告警上报节点发送的告警信息后,会在预设时间段内发送响应消息。如果告警上报节点在向从告警上报节点发送告警信息后的预设时间段内没有接收到从告警上报节点发送的响应消息,表示从告警上报节点也可能发生故障。
如果同一分组内的主告警上报节点和从告警上报节点均发生故障,则同一分组内剩余的告警上报节点(即除了主告警上报节点和从告警上报节点之外的告警上报节点)可竞选成为新的主告警上报节点或新的从告警上报节点。
因此,在步骤102之后,如果告警上报节点在预设时间段内没有接收到从告警上报节点发送的响应消息,则可在确定自身的告警信息响应值大于同一分组内的所有其他告警上报节点的告警信息响应值时,确定自身为新的主告警上报节点,并向所有其他告警上报节点发送用于通知新的主告警上报节点的主节点消息。其中,告警上报节点的告警信息响应值是告警上报节点每接收到一次其他告警上报节点的告警信息后累加得到的。需要说明的是,在告警上报节点初始启动时,其告警信息响应值为0。
下面对如何确定新的主告警上报节点和新的从告警上报节点进行说明。
假设同一分组内包括主告警上报节点1、从告警上报节点2、告警上报节点3~5。由于主告警上报节点1和从告警上报节点2均发生故障,则新的主告警上报节点和新的从告警上报节点将从告警上报节点3~5中竞选确定。
其中,新的主告警上报节点可通过以下方式确定:
同一分组内的告警上报节点3~5分别向组内其他告警上报节点广播自身的告警信息响应值(responseID)和节点标识(NodeID)。针对一个告警上报节点,当该告警上报节点接收到的告警信息响应值比自身的告警信息响应值大时,返回接受(ACCEPT)消息;否则不做响应。
例如,假设告警上报节点3的告警信息响应值为10,接收到告警上报节点5广播的告警信息响应值为12,则告警上报节点3向告警上报节点5发送接受消息。
如果分组内的一个告警上报节点接收到分组内所有其他告警上报节点返回的接受消息时,表示该告警上报节点的告警信息响应值大于同一分组内的所有其他告警上报节点的告警信息响应值,此时,即可确定该告警上报节点为新的主告警上报节点。
例如,假设告警上报节点4的告警信息响应值为16,则告警上报节点4可接收到告警上报节点3和告警上报节点5发送的接受消息,表示告警上报节点4的告警信息响应值大于同一分组内的所有其他告警上报节点的告警信息响应值,此时,即可确定告警上报节点4为新的主告警上报节点。
在确定出新的主告警上报节点后,新的主告警上报节点可向分组内的所有其他告警上报节点发送主节点(MASTER)消息,用于通知其他告警上报节点自己是新的主告警上报节点。例如,告警上报节点4向告警上报节点3和告警上报节点5发送主节点消息。
如果同一分组内的有至少两个告警上报节点的告警信息响应值最大且相同,且在预设时间段内没有确定出新的主告警上报节点,则将分组内节点标识最小的告警上报节点作为新的主告警上报节点。
例如,假设告警上报节点4的告警信息响应值为12,与告警上报节点5的告警信息响应值相同,则将告警上报节点3~5中节点标识最小的告警上报节点作为新的主告警上报节点。
也就是说,针对一个告警上报节点,如果该告警上报节点的告警信息响应值不大于同一分组内的所有其他告警上报节点的告警信息响应值,且在预设时间段内没有接收到来自其他告警上报节点的主节点消息,则在确定自身的节点标识小于同一分组内的所有其他告警上报节点的节点标识时,确定自身为新的主告警上报节点,并向同一分组内的所有其他告警上报节点发送主节点消息。
其中,同一分组内的所有告警上报节点的节点标识预先存储在各告警上报节点的节点列表中,针对一个告警上报节点,该告警上报节点可确定自身是否为分组内节点标识最小的告警上报节点。
在确定出新的主告警上报节点后,新的主告警上报节点将具备上报告警信息的功能。具体地,当新的告警上报节点接收到同一分组内的其他告警上报节点的告警信息时,可向发送告警信息的其他告警上报节点发送响应消息,并将自身采集到的告警信息和接收到的告警信息发送给主告警代理节点。如果新的告警上报节点在预设时间段内没有接收到主告警代理节点发送的响应消息,则将自身采集到的告警信息和接收到的告警信息发送给从告警代理节点。
如图2b所示为在图2a所示的系统中添加主告警代理节点和从告警代理节点的系统示意图。其中,每个分组内的主告警上报节点和从告警上报节点可与主告警代理节点和从告警代理节点进行通信。
本发明实施例的主告警代理节点和从告警代理节点是专用服务器,具备较高的性能,从主告警代理节点和从告警代理节点中可获取上报的告警信息的历史记录。主告警代理节点和从告警代理节点在接收到告警信息后即可通过告警展示节点展示上报的告警信息,以便于网管人员对告警信息的数据进行分析。
针对有新的告警上报节点加入分组的情况,如果新的主告警上报节点收到其他告警上报节点的加入消息,则向发送加入消息的其他告警上报节点发送通知消息,以使发送加入消息的其他告警上报节点确定新的主告警上报节点和新的从告警上报节点。新加入的告警上报节点在确定新的主告警上报节点后,即可将采集到的告警信息发送给该新的主告警上报节点。
在确定了新的主告警上报节点后,可由新的主告警上报节点从同一分组内所有其他告警上报节点中选择一个告警上报节点作为从告警上报节点。
具体地,新的主告警上报节点可从所有其他告警上报节点中随机选择一个告警上报节点作为从告警上报节点;也可从所有其他告警上报节点中选择告警信息响应值最大的告警上报节点作为新的从告警上报节点。
在确定出新的从告警上报节点后,新的主告警上报节点可向所有其他告警上报节点发送新的从告警上报节点的节点信息。
其中,新的从告警上报节点可通过以下方式确定:
新的主告警上报节点向同一分组内的所有其他告警上报节点广播选择(ELECTION)消息。其他告警上报节点在接收到选择消息后,将自身的告警信息响应值发送给新的主告警上报节点。新的主告警上报节点在接收到分组内的所有其他告警上报节点发送的告警信息响应值后,从中选择告警信息响应值最大的告警上报节点作为新的从告警上报节点,并向分组内的所有其他告警上报节点发送新的从告警上报节点的节点信息(例如新的从告警上报节点的节点标识)。
因此,针对一个告警上报节点,在确定主告警上报节点和从告警上报节点均发生故障之后,在接收到同一分组内的其他告警上报节点发送的新的从告警上报节点的节点信息后,若收到的节点信息与自身的节点信息相同,则可确定自身为新的从告警上报节点。
在确定自身为新的从告警上报节点之后,该告警上报节点即可协助新的主告警上报节点完成告警信息的可靠上报。假设新的主告警上报节点发生故障,则新的从告警上报节点在接收到同一分组内的其他告警上报节点发送的告警信息时,向发送告警信息的其他告警上报节点发送响应消息,并将接收到的告警信息发送给主告警代理节点。如果在预设时间段内没有接收到主告警代理节点发送的响应消息,则将接收到的告警信息发送给从告警代理节点。
如果新的从告警上报节点在设定时长内接收到告警信息的数量大于同一分组内的所有其他告警上报节点的数量的一半时,确定自身为新的主告警上报节点。
例如,假设同一分组内的所有其他告警上报节点的数量为10,则如果新的从告警上报节点在设定时长内(例如1分钟内)接收到告警信息的数量为6,则可确定主告警上报节点发生故障,该新的从告警上报节点可确定自身为新的主告警上报节点,向同一分组内的所有其他告警上报节点发送主节点消息,并从剩余的告警上报节点中选择一个新的从告警上报节点。
本发明实施例通过在每个分组内设置主告警上报节点和从告警上报节点,在主告警上报节点故障时,通过同一分组内的从告警上报节点上报告警信息,可保证告警信息的可靠上报。在主告警上报节点和从告警上报节点均发生故障时,可从剩余的告警上报节点确定出新的主告警上报节点和新的从告警上报节点,进一步保证了告警信息的可靠上报。
实施例二:
如图3所示,本发明实施例二中告警上报方法包括以下步骤:
步骤301:告警上报节点将告警信息发送给主告警代理节点;
步骤302:告警上报节点在预设时间段内没有接收到主告警代理节点发送的响应消息,将告警信息发送给从告警代理节点。
可选地,在步骤301之前,告警上报节点可作为主告警上报节点或从告警上报节点,接收来自其他告警上报节点的告警信息。则步骤301和步骤302中的告警信息包括告警上报节点自身采集到的告警信息和告警上报节点接收到的告警信息。其中,告警信息的内容可与实施例一中描述的相同。
步骤301中,主告警代理节点在接收到告警上报节点发送的告警信息后,会在预设时间段内发送响应消息,并通过告警展示节点展示上报的告警信息。
步骤302中,告警上报节点在预设时间段内没有接收到主告警代理节点发送的响应消息,表示主告警代理节点可能发生故障,则将告警信息发送给从告警代理节点。从告警代理节点在接收到告警上报节点发送的告警信息后,会在预设时间段内发送响应消息,并通过告警展示节点展示上报的告警信息。告警展示节点在接收到告警信息后,即可将告警信息展示,以便于网管人员对告警信息的数据进行分析。
本发明实施例的主告警代理节点和从告警代理节点是专用服务器,具备较高的性能,从主告警代理节点和从告警代理节点中可获取上报的告警信息的历史记录。主告警代理节点和从告警代理节点在接收到告警信息后即可通过告警展示节点展示上报的告警信息,以便于网管人员对告警信息的数据进行分析。
本发明实施例通过设置主告警代理节点和从告警代理节点,在主告警代理节点故障时,通过从告警代理节点上报告警信息,可保证告警信息的可靠上报。
实施例三:
本实施例三是与实施例一属于同一发明构思的一种告警上报节点,因此实施例三的实施可以参见实施例一的实施,重复之处不再赘述。
如图4所示,所述告警上报节点包括:
采集模块41用于采集告警信息。
处理模块42用于将所述采集模块采集到的告警信息发送给同一分组内的主告警上报节点,以使所述主告警上报节点上报所述告警信息;在预设时间段内没有接收到所述主告警上报节点发送的响应消息,将所述告警信息发送给同一分组内的从告警上报节点,以使所述从告警上报节点上报所述告警信息;其中,同一分组内的所有告警上报节点采集的告警信息的类型相同或同一分组内任意两个告警上报节点之间的物理链路距离不大于设定阈值。
所述处理模块42还用于在将所述告警信息发送给所述从告警上报节点之后,在预设时间段内没有接收到所述从告警上报节点发送的响应消息,在确定所述告警上报节点的告警信息响应值大于同一分组内的所有其他告警上报节点的告警信息响应值时,确定所述告警上报节点为新的主告警上报节点,并向所述所有其他告警上报节点发送用于通知新的主告警上报节点的主节点消息;其中,所述告警上报节点的告警信息响应值是所述告警上报节点每接收到一次所述其他告警上报节点的告警信息后累加得到的。
所述处理模块42还用于如果所述告警上报节点的告警信息响应值不大于所述所有其他告警上报节点的告警信息响应值,且在预设时间段内没有接收到来自其他告警上报节点的所述主节点消息,在确定所述告警上报节点的节点标识小于所述所有其他告警上报节点的节点标识时,确定所述告警上报节点为新的主告警上报节点,并向所述所有其他告警上报节点发送所述主节点消息。
所述处理模块42还用于在将所述告警信息发送给所述从告警上报节点之后,在预设时间段内没有接收到所述从告警上报节点发送的响应消息,在接收到同一分组内的其他告警上报节点发送的新的从告警上报节点的节点信息后,若收到的所述节点信息与所述告警上报节点的节点信息相同,则确定所述告警上报节点为新的从告警上报节点。
所述处理模块42还用于在确定所述告警上报节点为新的从告警上报节点之后,在接收到同一分组内的其他告警上报节点发送的告警信息时,向发送告警信息的其他告警上报节点发送响应消息,并将接收到的告警信息发送给主告警代理节点;在预设时间段内没有接收到所述主告警代理节点发送的响应消息,将所述接收到的告警信息发送给从告警代理节点。
所述处理模块42还用于在确定所述告警上报节点为新的从告警上报节点之后,在设定时长接收到告警信息的数量大于所述所有其他其他告警上报节点的数量的一半时,确定所述告警上报节点为新的主告警上报节点。
所述处理模块42还用于在确定所述告警上报节点为新的主告警上报节点之后,从所述所有其他告警上报节点中,选择告警信息响应值最大的告警上报节点作为新的从告警上报节点,并向所述所有其他告警上报节点发送所述新的从告警上报节点的节点信息。
所述处理模块42还用于在确定所述告警上报节点为新的主告警上报节点之后,接收同一分组内的其他告警上报节点的告警信息,并向发送告警信息的其他告警上报节点发送响应消息;将所述采集模块41采集到的告警信息和接收到的告警信息发送给主告警代理节点;在预设时间段内没有接收到所述主告警代理节点发送的响应消息,将所述采集模块41采集到的告警信息和接收到的告警信息发送给从告警代理节点。
所述处理模块42还用于在确定所述告警上报节点为新的主告警上报节点之后,在收到同一分组内的其他告警上报节点的加入消息后,向发送所述加入消息的其他告警上报节点发送通知消息,以使所述发送所述加入消息的其他告警上报节点确定新的主告警上报节点和新的从告警上报节点。
所述处理模块42还用于在将所述采集模块41采集到的告警信息发送给所述主告警上报节点之前,在需要加入一分组时,向该分组内的所有其他告警上报节点发送加入消息;在接收到所述主告警上报节点发送的通知消息时,根据所述通知消息确定所述主告警上报节点和所述从告警上报节点。
需要说明的是,本发明实施例三中对告警上报节点的各组成部分的描述是对各组成部分主要功能的描述,本发明实施例三中各组成部分也具备实现实施例一中所描述的方法步骤的功能,同时,本发明实施例三中的告警上报节点还具有执行实施例一各步骤的逻辑模块。
实施例四:
本实施例四是与实施例二属于同一发明构思的一种告警上报节点,因此实施例四的实施可以参见实施例二的实施,重复之处不再赘述。
如图5所示,所述告警上报节点包括:
第一处理模块51用于将告警信息发送给主告警代理节点。
第二处理模块52用于在预设时间段内没有接收到所述主告警代理节点发送的响应消息,将所述告警信息发送给从告警代理节点。
所述第一处理模块51具体用于:在所述告警上报节点作为主告警上报节点或从告警上报节点时,接收来自其他告警上报节点的告警信息,将采集到的告警信息和接收到的告警信息发送给主告警代理节点。
所述第二处理模块52具体用于:在预设时间段内没有接收到所述主告警代理节点发送的响应消息,将采集到的告警信息和所述第一处理模块51接收到的告警信息发送给从告警代理节点。
需要说明的是,本发明实施例四中对告警上报节点的各组成部分的描述是对各组成部分主要功能的描述,本发明实施例四中各组成部分也具备实现实施例二中所描述的方法步骤的功能,同时,本发明实施例四中的告警上报节点还具有执行实施例二各步骤的逻辑模块。
实施例五:
本实施例五是与实施例一属于同一发明构思的一种告警上报系统,因此实施例五的实施可以参见实施例一的实施,重复之处不再赘述。
如图6所示,所述告警上报系统包括至少一组告警上报节点,其中,一组告警上报节点中包括至少三个相互连接的告警上报节点,三个相互连接的告警上报节点中包括主告警上报节点61和从告警上报节点62:
除主告警上报节点和从告警上报节点之外的告警上报节点63用于将采集到的告警信息发送给同一分组内的主告警上报节点,以使所述主告警上报节点上报所述告警信息,如果在预设时间段内没有接收到所述主告警上报节点发送的响应消息,则将所述告警信息发送给同一分组内的从告警上报节点,以使所述从告警上报节点上报所述告警信息;其中,同一分组内的所有告警上报节点采集的告警信息的类型相同或同一分组内任意两个告警上报节点之间的物理链路距离不大于设定阈值。
需要说明的是,本发明实施例的告警上报系统在初始启动时,各告警上报节点的告警信息响应值均为0,系统中节点标识最小的告警上报节点为主告警上报节点,节点标识次小的告警上报节点为从告警上报节点。当主告警上报节点接收到其他告警上报节点发送的告警信息后,将其维持的告警信息响应值加1,将告警信息响应值返回给该发送告警信息的其他告警上报节点,并将告警信息响应值同步给从告警上报节点。
为了便于描述,下文将除主告警上报节点和从告警上报节点之外的告警上报节点称为普通告警上报节点。
普通告警上报节点63还用于在将所述告警信息发送给所述从告警上报节点之后,如果在预设时间段内没有接收到所述从告警上报节点发送的响应消息,在确定自身的告警信息响应值大于同一分组内的所有其他告警上报节点的告警信息响应值时,确定自身为新的主告警上报节点,并向所述所有其他告警上报节点发送用于通知新的主告警上报节点的主节点消息;其中,所述告警上报节点的告警信息响应值是所述告警上报节点每接收到一次所述其他告警上报节点的告警信息后累加得到的。
所述普通告警上报节点63还用于如果自身的告警信息响应值不大于所述所有其他告警上报节点的告警信息响应值,且在预设时间段内没有接收到来自其他告警上报节点的所述主节点消息,在确定自身的节点标识小于所述所有其他告警上报节点的节点标识时,确定自身为新的主告警上报节点,并向所述所有其他告警上报节点发送所述主节点消息。
所述普通告警上报节点63还用于在将所述告警信息发送给所述从告警上报节点之后,如果在预设时间段内没有接收到所述从告警上报节点发送的响应消息,在接收到同一分组内的其他告警上报节点发送的新的从告警上报节点的节点信息后,若收到的所述节点信息与自身的节点信息相同,则确定自身为新的从告警上报节点。
可选地,所述系统还包括主告警代理节点64和从告警代理节点65,其中:
所述普通告警上报节点63还用于在确定自身为新的从告警上报节点之后,在接收到同一分组内的其他告警上报节点发送的告警信息时,向发送告警信息的其他告警上报节点发送响应消息,并将接收到的告警信息发送给主告警代理节点64;在预设时间段内没有接收到所述主告警代理节点64发送的响应消息,将所述接收到的告警信息发送给从告警代理节点65。
所述普通告警上报节点63还用于在确定自身为新的从告警上报节点之后,在设定时长内接收到告警信息的数量大于所述所有其他告警上报节点的数量的一半时,确定自身为新的主告警上报节点。
所述普通告警上报节点63还用于在确定自身为新的主告警上报节点之后,从所述所有其他告警上报节点中,选择告警信息响应值最大的告警上报节点作为新的从告警上报节点,并向所述所有其他告警上报节点发送所述新的从告警上报节点的节点信息。
所述普通告警上报节点63还用于在确定自身为新的主告警上报节点之后,接收同一分组内的其他告警上报节点的告警信息,并向发送告警信息的其他告警上报节点发送响应消息;将自身采集到的告警信息和接收到的告警信息发送给主告警代理节点64;在预设时间段内没有接收到所述主告警代理节点64发送的响应消息,将自身采集到的告警信息和接收到的告警信息发送给从告警代理节点65。
所述普通告警上报节点63还用于在确定自身为新的主告警上报节点之后,在收到其他告警上报节点的加入消息后,向发送所述加入消息的其他告警上报节点发送通知消息,以使所述发送所述加入消息的其他告警上报节点确定新的主告警上报节点和新的从上报告警节点。
所述普通告警上报节点63还用于在将采集到的告警信息发送给所述主告警上报节点之前,在需要加入一分组时,向该分组内的所有其他告警上报节点发送加入消息;在接收到所述主告警上报节点发送的通知消息时,根据所述通知消息确定所述主告警上报节点和所述从告警上报节点。
需要说明的是,基于本发明实施例提供的系统,可灵活地实现对新业务的告警信息的上报。具体地,可将对新业务的告警信息进行采集的脚本或应用程序添加到告警上报节点中,从而实现告警上报节点对新业务的告警信息的采集与上报。
实施例六:
本实施例六是与实施例二属于同一发明构思的一种告警上报系统,因此实施例六的实施可以参见实施例二的实施,重复之处不再赘述。
如图7所示,所述告警上报系统包括告警上报节点71、主告警代理节点72和从告警代理节点73,其中:
所述告警上报节点71,用于将告警信息发送给所述主告警代理节点72,如果在预设时间段内没有接收到所述主告警代理节点72发送的响应消息,则将所述告警信息发送给所述从告警代理节点73;
所述主告警代理节点72,用于接收所述告警上报节点71发送的告警信息,并将所述告警信息转发给告警展示节点74;
所述从告警代理节点73,用于接收所述告警上报节点71发送的告警信息,并将所述告警信息转发给告警展示节点74。
所述告警上报节点71具体用于在作为主告警上报节点或从告警上报节点时,接收来自其他告警上报节点75的告警信息,并将自身采集到的告警信息和接收到的告警信息发送给主告警代理节点,在预设时间段内没有接收到所述主告警代理节点72发送的响应消息,将自身采集到的告警信息和接收到的告警信息发送给从告警代理节点73。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (19)

1.一种告警上报方法,其特征在于,所述方法包括:
告警上报节点将采集到的告警信息发送给同一分组内的主告警上报节点,以使所述主告警上报节点上报所述告警信息;其中,同一分组内的所有告警上报节点采集的告警信息的类型相同或同一分组内任意两个告警上报节点之间的物理链路距离不大于设定阈值;
所述告警上报节点在预设时间段内没有接收到所述主告警上报节点发送的响应消息,将所述告警信息发送给同一分组内的从告警上报节点,以使所述从告警上报节点上报所述告警信息;
如果所述告警上报节点在预设时间段内没有接收到所述从告警上报节点发送的响应消息,在确定自身的告警信息响应值大于同一分组内的所有其他告警上报节点的告警信息响应值时,确定自身为新的主告警上报节点,并向所述所有其他告警上报节点发送用于通知新的主告警上报节点的主节点消息;其中,所述告警上报节点的告警信息响应值是所述告警上报节点每接收到一次所述其他告警上报节点的告警信息后累加得到的。
2.如权利要求1所述的方法,其特征在于,还包括:
如果所述告警上报节点的告警信息响应值不大于所述所有其他告警上报节点的告警信息响应值,且在预设时间段内没有接收到来自其他告警上报节点的所述主节点消息,在确定自身的节点标识小于所述所有其他告警上报节点的节点标识时,确定自身为新的主告警上报节点,并向所述所有其他告警上报节点发送所述主节点消息。
3.如权利要求1所述的方法,其特征在于,所述告警上报节点在将所述告警信息发送给所述从告警上报节点之后,还包括:
如果所述告警上报节点在预设时间段内没有接收到所述从告警上报节点发送的响应消息,在接收到同一分组内的其他告警上报节点发送的新的从告警上报节点的节点信息后,若收到的所述节点信息与自身的节点信息相同,则确定自身为新的从告警上报节点。
4.如权利要求3所述的方法,其特征在于,所述告警上报节点在确定自身为新的从告警上报节点之后,还包括:
所述告警上报节点在接收到同一分组内的其他告警上报节点发送的告警信息时,向发送告警信息的其他告警上报节点发送响应消息,并将接收到的告警信息发送给主告警代理节点;
所述告警上报节点在预设时间段内没有接收到所述主告警代理节点发送的响应消息,将所述接收到的告警信息发送给从告警代理节点。
5.如权利要求3所述的方法,其特征在于,所述告警上报节点在确定自身为新的从告警上报节点之后,还包括:
所述告警上报节点在设定时长内接收到告警信息的数量大于所述所有其他告警上报节点的数量的一半时,确定自身为新的主告警上报节点。
6.如权利要求1、2或5任一所述的方法,其特征在于,所述告警上报节点在确定自身为新的主告警上报节点之后,还包括:
所述告警上报节点从所述所有其他告警上报节点中,选择告警信息响应值最大的告警上报节点作为新的从告警上报节点,并向所述所有其他告警上报节点发送所述新的从告警上报节点的节点信息。
7.如权利要求1、2或5任一所述的方法,其特征在于,所述告警上报节点在确定自身为新的主告警上报节点之后,还包括:
所述告警上报节点接收同一分组内的其他告警上报节点的告警信息,并向发送告警信息的其他告警上报节点发送响应消息;
所述告警上报节点将自身采集到的告警信息和接收到的告警信息发送给主告警代理节点;
所述告警上报节点在预设时间段内没有接收到所述主告警代理节点发送的响应消息,将自身采集到的告警信息和接收到的告警信息发送给从告警代理节点。
8.如权利要求1、2或5任一所述的方法,其特征在于,所述告警上报节点在确定自身为新的主告警上报节点之后,还包括:
所述告警上报节点在收到其他告警上报节点的加入消息后,向发送所述加入消息的其他告警上报节点发送通知消息,以使所述发送所述加入消息的其他告警上报节点确定新的主告警上报节点和新的从上报告警节点。
9.如权利要求1~5任一所述的方法,其特征在于,所述告警上报节点在将采集到的告警信息发送给所述主告警上报节点之前,还包括:
所述告警上报节点在需要加入一分组时,向该分组内的所有其他告警上报节点发送加入消息;
所述告警上报节点在接收到所述主告警上报节点发送的通知消息时,根据所述通知消息确定所述主告警上报节点和所述从告警上报节点。
10.一种告警上报节点,其特征在于,所述告警上报节点包括:
采集模块,用于采集告警信息;
处理模块,用于将所述采集模块采集到的告警信息发送给同一分组内的主告警上报节点,以使所述主告警上报节点上报所述告警信息;在预设时间段内没有接收到所述主告警上报节点发送的响应消息,将所述告警信息发送给同一分组内的从告警上报节点,以使所述从告警上报节点上报所述告警信息;其中,同一分组内的所有告警上报节点采集的告警信息的类型相同或同一分组内任意两个告警上报节点之间的物理链路距离不大于设定阈值;
所述处理模块,还用于在将所述告警信息发送给所述从告警上报节点之后,在预设时间段内没有接收到所述从告警上报节点发送的响应消息,在确定所述告警上报节点的告警信息响应值大于同一分组内的所有其他告警上报节点的告警信息响应值时,确定所述告警上报节点为新的主告警上报节点,并向所述所有其他告警上报节点发送用于通知新的主告警上报节点的主节点消息;其中,所述告警上报节点的告警信息响应值是所述告警上报节点每接收到一次所述其他告警上报节点的告警信息后累加得到的。
11.如权利要求10所述的告警上报节点,其特征在于,
所述处理模块,还用于如果所述告警上报节点的告警信息响应值不大于所述所有其他告警上报节点的告警信息响应值,且在预设时间段内没有接收到来自其他告警上报节点的所述主节点消息,在确定所述告警上报节点的节点标识小于所述所有其他告警上报节点的节点标识时,确定所述告警上报节点为新的主告警上报节点,并向所述所有其他告警上报节点发送所述主节点消息。
12.如权利要求10所述的告警上报节点,其特征在于,
所述处理模块,还用于在将所述告警信息发送给所述从告警上报节点之后,在预设时间段内没有接收到所述从告警上报节点发送的响应消息,在接收到同一分组内的其他告警上报节点发送的新的从告警上报节点的节点信息后,若收到的所述节点信息与所述告警上报节点的节点信息相同,则确定所述告警上报节点为新的从告警上报节点。
13.如权利要求12所述的告警上报节点,其特征在于,
所述处理模块,还用于在确定所述告警上报节点为新的从告警上报节点之后,在接收到同一分组内的其他告警上报节点发送的告警信息时,向发送告警信息的其他告警上报节点发送响应消息,并将接收到的告警信息发送给主告警代理节点;在预设时间段内没有接收到所述主告警代理节点发送的响应消息,将所述接收到的告警信息发送给从告警代理节点。
14.如权利要求12所述的告警上报节点,其特征在于,
所述处理模块,还用于在确定所述告警上报节点为新的从告警上报节点之后,在设定时长接收到告警信息的数量大于所述所有其他其他告警上报节点的数量的一半时,确定所述告警上报节点为新的主告警上报节点。
15.如权利要求10、11或14任一所述的告警上报节点,其特征在于,
所述处理模块,还用于在确定所述告警上报节点为新的主告警上报节点之后,从所述所有其他告警上报节点中,选择告警信息响应值最大的告警上报节点作为新的从告警上报节点,并向所述所有其他告警上报节点发送所述新的从告警上报节点的节点信息。
16.如权利要求10、11或14任一所述的告警上报节点,其特征在于,
所述处理模块,还用于在确定所述告警上报节点为新的主告警上报节点之后,接收同一分组内的其他告警上报节点的告警信息,并向发送告警信息的其他告警上报节点发送响应消息;将所述采集模块采集到的告警信息和接收到的告警信息发送给主告警代理节点;在预设时间段内没有接收到所述主告警代理节点发送的响应消息,将所述采集模块采集到的告警信息和接收到的告警信息发送给从告警代理节点。
17.如权利要求10、11或14任一所述的告警上报节点,其特征在于,
所述处理模块,还用于在确定所述告警上报节点为新的主告警上报节点之后,在收到同一分组内的其他告警上报节点的加入消息后,向发送所述加入消息的其他告警上报节点发送通知消息,以使所述发送所述加入消息的其他告警上报节点确定新的主告警上报节点和新的从告警上报节点。
18.如权利要求10~14任一所述的告警上报节点,其特征在于,
所述处理模块,还用于在将所述采集模块采集到的告警信息发送给所述主告警上报节点之前,在需要加入一分组时,向该分组内的所有其他告警上报节点发送加入消息;在接收到所述主告警上报节点发送的通知消息时,根据所述通知消息确定所述主告警上报节点和所述从告警上报节点。
19.一种告警上报系统,其特征在于,所述系统包括至少一组告警上报节点,其中,一组告警上报节点中包括至少三个相互连接的告警上报节点,三个相互连接的告警上报节点中包括主告警上报节点和从告警上报节点:
除主告警上报节点和从告警上报节点之外的告警上报节点,用于将采集到的告警信息发送给同一分组内的主告警上报节点,以使所述主告警上报节点上报所述告警信息,如果在预设时间段内没有接收到所述主告警上报节点发送的响应消息,则将所述告警信息发送给同一分组内的从告警上报节点,以使所述从告警上报节点上报所述告警信息;其中,同一分组内的所有告警上报节点采集的告警信息的类型相同或同一分组内任意两个告警上报节点之间的物理链路距离不大于设定阈值;
如果所述告警上报节点在预设时间段内没有接收到所述从告警上报节点发送的响应消息,在确定自身的告警信息响应值大于同一分组内的所有其他告警上报节点的告警信息响应值时,确定自身为新的主告警上报节点,并向所述所有其他告警上报节点发送用于通知新的主告警上报节点的主节点消息;其中,所述告警上报节点的告警信息响应值是所述告警上报节点每接收到一次所述其他告警上报节点的告警信息后累加得到的。
CN201310752991.4A 2013-12-31 2013-12-31 一种告警上报方法、告警上报节点及告警上报系统 Active CN104753712B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310752991.4A CN104753712B (zh) 2013-12-31 2013-12-31 一种告警上报方法、告警上报节点及告警上报系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310752991.4A CN104753712B (zh) 2013-12-31 2013-12-31 一种告警上报方法、告警上报节点及告警上报系统

Publications (2)

Publication Number Publication Date
CN104753712A CN104753712A (zh) 2015-07-01
CN104753712B true CN104753712B (zh) 2018-01-30

Family

ID=53592864

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310752991.4A Active CN104753712B (zh) 2013-12-31 2013-12-31 一种告警上报方法、告警上报节点及告警上报系统

Country Status (1)

Country Link
CN (1) CN104753712B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107682821A (zh) * 2017-11-01 2018-02-09 深圳市龙腾飞通讯装备技术有限公司 一种基于无线网组卫星电话的求救方法以及终端设备
CN108696396A (zh) * 2018-06-15 2018-10-23 郑州云海信息技术有限公司 一种分布式存储系统的监控告警装置及其方法
CN110687554A (zh) * 2019-10-31 2020-01-14 苏州泽海物联智能科技有限公司 一种基于低功耗无线传输的告警设备
CN112003746B (zh) * 2020-08-20 2023-01-10 北京浪潮数据技术有限公司 一种基于分布式系统的告警管理方法、装置和介质
CN113821412A (zh) * 2021-09-26 2021-12-21 中国建设银行股份有限公司 一种设备运维管理方法及装置
CN113923100A (zh) * 2021-10-09 2022-01-11 中国电信股份有限公司 告警采集方法、告警采集系统、存储介质与电子设备
CN114785665A (zh) * 2022-04-20 2022-07-22 海信视像科技股份有限公司 一种告警通知管理系统及告警通知管理方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101494572A (zh) * 2009-03-10 2009-07-29 中国电信股份有限公司 设备告警信息远程管理方法及系统
CN101771488A (zh) * 2009-01-05 2010-07-07 华为技术有限公司 提高多业务传送网可靠性的方法、系统及设备
CN102006191A (zh) * 2010-11-26 2011-04-06 中兴通讯股份有限公司 一种实现告警的方法及装置
CN102904752A (zh) * 2012-09-25 2013-01-30 新浪网技术(中国)有限公司 一种节点选举方法、节点设备及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030105856A1 (en) * 2001-11-30 2003-06-05 Telefonaktiebolaget L M Ericsson (Publ) Meaningful alarm notification structure for alarm identification

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101771488A (zh) * 2009-01-05 2010-07-07 华为技术有限公司 提高多业务传送网可靠性的方法、系统及设备
CN101494572A (zh) * 2009-03-10 2009-07-29 中国电信股份有限公司 设备告警信息远程管理方法及系统
CN102006191A (zh) * 2010-11-26 2011-04-06 中兴通讯股份有限公司 一种实现告警的方法及装置
CN102904752A (zh) * 2012-09-25 2013-01-30 新浪网技术(中国)有限公司 一种节点选举方法、节点设备及系统

Also Published As

Publication number Publication date
CN104753712A (zh) 2015-07-01

Similar Documents

Publication Publication Date Title
CN104753712B (zh) 一种告警上报方法、告警上报节点及告警上报系统
CN102447570B (zh) 一种基于健康度分析的监控装置及方法
CN106713017A (zh) 告警信息的处理方法及装置
CN105991332A (zh) 告警处理方法及装置
CN104796273A (zh) 一种网络故障根源诊断的方法和装置
CN103794033B (zh) 监控报警方法和装置
CN104243623B (zh) 乘客信息系统与ats系统间接口的数据处理方法
CN103430483A (zh) 用于确定通信系统中的关联事件的技术
CN103208170A (zh) 一种多客户端接收报警信息的方法和系统
CN102255764A (zh) 传输网故障诊断方法及装置
CN103220173A (zh) 一种报警监控方法及监控系统
CN105991337A (zh) 一种告警压缩方法及告警压缩装置
CN107820692A (zh) 一种告警同步方法和系统
CN107547228A (zh) 一种基于大数据的安全运维管理平台的实现架构
CN109688018A (zh) 一种基于设备异常的告警消息推送方法及系统
CN104092577A (zh) 一种网络告警通知系统及其通知方法
CN103021144B (zh) 一种传输预警信息的方法和设备
CN110262416A (zh) 一种基于物联网的工业设备维护系统及其工作方法
CN104468224B (zh) 一种双重过滤的数据中心监控系统故障告警方法
CN110347694A (zh) 一种基于物联网的设备监控方法、装置及系统
CN106487597A (zh) 一种基于Zookeeper的服务监控系统和方法
CN103763143A (zh) 基于存储服务器的设备异常报警的方法及系统
CN103840962B (zh) 服务器告警输出方法及系统
CN106027306A (zh) 一种资源监控方法及装置
CN111200522B (zh) 一种端口检测方法、装置、设备及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant