CN102694678A - 告警消息传输方法及系统、网管服务器和网元设备 - Google Patents

告警消息传输方法及系统、网管服务器和网元设备 Download PDF

Info

Publication number
CN102694678A
CN102694678A CN2012101367131A CN201210136713A CN102694678A CN 102694678 A CN102694678 A CN 102694678A CN 2012101367131 A CN2012101367131 A CN 2012101367131A CN 201210136713 A CN201210136713 A CN 201210136713A CN 102694678 A CN102694678 A CN 102694678A
Authority
CN
China
Prior art keywords
priority
network element
alarm information
element device
server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012101367131A
Other languages
English (en)
Inventor
胡桂娇
高仁忠
杨恒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qingdao Hisense Media Network Technology Co Ltd
Original Assignee
Qingdao Hisense Media Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qingdao Hisense Media Network Technology Co Ltd filed Critical Qingdao Hisense Media Network Technology Co Ltd
Priority to CN2012101367131A priority Critical patent/CN102694678A/zh
Publication of CN102694678A publication Critical patent/CN102694678A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)
  • Computer And Data Communications (AREA)

Abstract

本发明公开了一种告警消息传输系统及方法、网管服务器和网元设备,所述系统包括:网管服务器以及网元设备;网管服务器定时监测从网元设备接收的待处理的告警消息的数量,若监测到的数量超过设定的数量阈值时,将优先级阈值向网元设备发送;网元设备在接收到优先级阈值后,对于优先级低于优先级阈值的告警消息暂停发送,对于优先级不低于优先级阈值的告警消息正常发送。由于在待处理的告警消息的数量超过设定的数量阈值时,通过向网元设备发送优先级阈值来通知网元设备启动过滤发送机制,从而在网管服务器接收和处理告警能力暂时相对的严重不足时,优先保证优先级别高的告警消息的发送和传输,使得网管服务器及时地处理优先级较高的告警消息。

Description

告警消息传输方法及系统、网管服务器和网元设备
技术领域
本发明涉及网络通信技术,尤其涉及一种告警消息传输方法及系统、网管服务器和网元设备。
背景技术
电信网络管理系统通常分为网管侧和网元侧两部分。其中,网管侧的网管服务器往往管理成百上千个网元,分析网元的性能数据,处理网元上报的告警消息。网元侧有多个网元,各个网元直接或者若干网元组成一组通过网元代理的方式,将网元产生的告警消息发送给网管侧的网管服务器,网管侧的网管服务器接收并处理这些告警消息,一个网管服务器可能对应多个网元或网元代理。由于网元或网元代理只是不同组网方式下的概念,在本发明中功能是相同的,以下将网元以及网元代理统称为网元设备。
一般来说,网管侧的告警接收和处理能力能够应对正常情况的网元告警,但是在一些特殊情况下会产生告警风暴,导致网元侧的告警发送与网管侧的告警接收和处理会严重不对称。例如,网元侧由于某些原因出现大面积的故障,导致告警数量急剧增加,网元设备发送的告警消息也随之大量增加。这就很容易导致网路的堵塞、告警的丢失,以及网管侧缓存中积累的告警消息量过大,从而影响了告警处理的及时性,尤其是对程度严重的重要告警处理的及时性;再比如,网管侧部分设备出现故障,告警消息接收和处理的任务转移到尚能正常运行的网管设备上,导致网管侧的某些网管服务器处理任务大大增加,众多的告警消息拥堵在网路上,或者已接收待处理的告警消息积累和排列过多,也会导致重要告警处理的及时性得不到保证。
为了解决上述问题,现有技术中公开了一种网元对其告警消息进行优先级分类,按照优先级规则顺序向网管服务器发送告警消息的技术。虽然该方法中每个网元设备可以保证本网元设备中优先级高的告警消息被优先发送,但是仍然解决不了在一些特殊情况下产生告警风暴时,导致网路堵塞、告警丢失的问题,从而仍会导致重要告警处理的及时性得不到保证。具体原因分析如下:各网元分别根据自己当前已有的告警消息进行优先级排序,并依据优先级进行告警消息的先后发送。假设有一个网元设备A的告警消息严重程度很高,则该告警消息的优先级也高,该网元设备安排该优先级高的告警消息优先发送。然而,在其它网元设备中可能存在许多严重程度较低的告警消息需要发送,这些严重程度较低的告警消息被其所属网元设备进行优先级排序后,也将被其所属的网元设备优先发送。这时,网元设备A的严重程度很高的告警信息(高优先级的告警消息)将与其它网元设备所发送的严重程度较低的告警消息(低优先级的告警消息)争抢网络传输资源,尤其是在产生告警风暴的时候,仍然可能会导致严重程度很高的告警信息(高优先级的告警消息)丢失或得不到及时处理。
因此,存在对能够在网管服务器接收和处理告警能力暂时相对的严重不足时,优先保证优先级别高的告警消息的发送和传输的告警消息传输和处理技术的需要。
发明内容
本发明的实施例提供了一种告警消息传输方法及系统、网管服务器和网元设备,用以缓解网路堵塞、告警丢失的问题,并更为及时地处理优先级较高的告警消息。
根据本发明的一个方面,提供了一种告警消息传输系统,包括:网管侧的网管服务器以及网元侧的向所述网管服务器发送告警消息的网元设备;
所述网管服务器用于定时监测从所述网元设备接收的待处理的告警消息的数量,若监测到所述待处理的告警消息的数量超过设定的数量阈值时,将优先级阈值向所述网元设备发送;
网元侧的网元设备用于在接收到优先级阈值后,对于本网元设备中优先级低于所述优先级阈值的告警消息暂停发送,对于本网元设备中优先级不低于所述优先级阈值的告警消息正常发送。
进一步,所述网元设备还用于在接收到优先级阈值后,若在设定时间段内没有再接收到所述网管服务器发送的优先级阈值,则对之前暂停发送的告警消息恢复正常发送;或者,
所述网元设备还用于在接收到优先级阈值后,若接收到所述网管服务器发送的过滤发送停止信息,则对之前暂停发送的告警消息恢复正常发送;其中,过滤发送停止信息为所述网管服务器将优先级阈值向所述网元设备发送后,在监测到所述待处理的告警消息的数量小于等于所述数量阈值时,向所述网元设备发送的。
其中,所述优先级阈值为预先设置的固定值;或者,
所述优先级阈值根据所述网管服务器中各待处理的告警消息的优先级计算得到。
较佳地,所述优先级阈值具体是根据所述网管服务器中各待处理的告警消息的优先级的平均值确定的。
根据本发明的另一个方面,还提供了一种网管服务器,包括:
监测模块,用于定时监测从所述网元设备接收的待处理的告警消息的数量;
网元设备通知模块,用于在所述监测模块监测的数量超过设定的数量阈值时,将优先级阈值向所述网元设备发送。
较佳地,所述网管服务器还包括:
优先级阈值确定模块,用于根据所述网管服务器中各待处理的告警消息的优先级确定所述优先级阈值。
较佳地,所述优先级阈值确定模块具体用于根据所述网管服务器中各待处理的告警消息的优先级的平均值确定所述优先级阈值。
进一步,所述网元设备通知模块还用于在将优先级阈值向所述网元设备发送后,若所述监测模块监测的数量小于等于所述数量阈值时,向所述网元设备发送过滤发送停止信息。
根据本发明的另一个方面,还提供了一种网元设备,包括:
优先级阈值获取模块,用于获取接收网管服务器发送的优先级阈值;
告警消息发送模块,用于在所述优先级阈值获取模块接收到所述优先级阈值后,对于本网元设备中优先级低于所述优先级阈值的告警消息暂停发送,对于本网元设备中优先级不低于所述优先级阈值的告警消息正常发送。
进一步,所述告警消息发送模块还用于在接收到优先级阈值后,若在设定时间段内没有再接收到所述网管服务器发送的优先级阈值,则对之前暂停发送的告警消息恢复正常发送。
根据本发明的另一个方面,还提供了一种告警消息传输方法,包括:
网管服务器用于定时监测从所述网元设备接收的待处理的告警消息的数量;
若所述网管服务器监测到所述待处理的告警消息的数量超过设定的数量阈值时,将优先级阈值向所述网元设备发送;其中,所述优先级阈值用于指示所述网元设备:对于本网元设备中优先级低于所述优先级阈值的告警消息暂停发送,对于本网元设备中优先级不低于所述优先级阈值的告警消息正常发送。
其中,所述优先级阈值为预先设置的固定值;或者,
所述优先级阈值根据所述网管服务器中各待处理的告警消息的优先级计算得到。
较佳地,所述优先级阈值根据所述网管服务器中各待处理的告警消息的优先级计算得到,具体包括:
计算所述网管服务器中各待处理的告警消息的优先级的平均值,将所述平均值作为所述优先级阈值。
根据本发明的另一个方面,还提供了一种告警消息传输方法,包括:
网元设备接收网管服务器发送的优先级阈值;并
对于本网元设备中优先级低于所述优先级阈值的告警消息暂停发送,对于本网元设备中优先级不低于所述优先级阈值的告警消息正常发送;
其中,所述优先级阈值为所述网管服务器在监测到所述待处理的告警消息的数量超过设定的数量阈值时发送的。
进一步,在所述网元设备接收网管服务器发送的优先级阈值之后,还包括:
若所述网元设备在设定时间段内没有再接收到所述网管服务器发送的优先级阈值,则对之前暂停发送的告警消息恢复正常发送;或者,
若所述网元设备接收到所述网管服务器发送的过滤发送停止信息,则对之前暂停发送的告警消息恢复正常发送;其中,过滤发送停止信息为所述网管服务器将优先级阈值向所述网元设备发送后,在监测到所述待处理的告警消息的数量小于等于所述数量阈值时发送的。
其中,所述优先级阈值为预先设置的固定值;或者,
所述优先级阈值根据所述网管服务器中各待处理的告警消息的优先级计算得到。
较佳地,所述优先级阈值根据所述网管服务器中各待处理的告警消息的优先级计算得到,具体包括:
计算所述网管服务器中各待处理的告警消息的优先级的平均值,将所述平均值作为所述优先级阈值。
本发明实施例的网管服务器由于在待处理的告警消息的数量超过设定的数量阈值时,通过向网元设备发送优先级阈值来通知网元设备启动过滤发送机制:对于本网元设备中优先级低于所述优先级阈值的告警消息暂停发送,对于本网元设备中优先级不低于所述优先级阈值的告警消息正常发送,从而在网管服务器接收和处理告警能力暂时相对的严重不足时,优先保证优先级别高的告警消息的发送和传输,防止或缓解网路堵塞、告警丢失的问题,从而使得网管服务器及时地处理优先级较高的告警消息。
附图说明
图1为本发明实施例的电信网络管理系统示意图;
图2为本发明实施例的网管服务器与网元设备之间告警消息传输方法流程图;
图3为本发明实施例的网管服务器和网元设备的内部结构框图。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚明白,以下参照附图并举出优选实施例,对本发明进一步详细说明。然而,需要说明的是,说明书中列出的许多细节仅仅是为了使读者对本发明的一个或多个方面有一个透彻的理解,即便没有这些特定的细节也可以实现本发明的这些方面。
本申请使用的“模块”、“系统”等术语旨在包括与计算机相关的实体,例如但不限于硬件、固件、软硬件组合、软件或者执行中的软件。例如,模块可以是,但并不仅限于:处理器上运行的进程、处理器、对象、可执行程序、执行的线程、程序和/或计算机。举例来说,计算设备上运行的应用程序和此计算设备都可以是模块。一个或多个模块可以位于执行中的一个进程和/或线程内,一个模块也可以位于一台计算机上和/或分布于两台或更多台计算机之间。
本发明通过为网管侧的网管服务器与网元设备之间建立一种告警通信协调机制,在网管服务器接收和处理告警能力暂时相对的严重不足时,在包括多个网元设备的整个网络上,优先保证优先级别高的告警消息的发送和传输,从而使得网管服务器及时地处理优先级较高的告警消息。
网管侧的网管服务器监测本服务器所接收的待处理的告警消息数量,根据待处理的告警消息数量来判定网管服务器接收和处理告警的能力。当监测到待处理的告警消息数量急剧增加时,说明可能网元大面积发生故障或者有其它网管设备出现问题将告警处理转移至本设备上,而导致发生了告警风暴,有可能使得网管服务器接收和处理告警能力出现严重不足的情况。网管服务器随即通知网元设备,网元设备启动过滤发送机制:暂保留某个优先级以下的告警信息不进行发送,仅发送该优先级或该优先级以上的告警消息,以防止或缓解网路堵塞、告警丢失的问题,并同时使得各网元设备中某个优先级或该优先级以上的告警信息得以优先发送到网管侧的网管服务器被进行处理。
下面结合附图详细说明本发明实施例的技术方案。在如图1所示的电信网络管理系统中,网管侧的网管服务器102接收网元侧的网元设备102发送的告警信息,并将接收的告警消息缓存在告警消息列表中,作为待处理的告警消息。网管服务器102按顺序处理告警消息列表中的待处理的告警消息,处理完毕的告警记录被存放到数据库中。
在一些特殊情况下若产生告警风暴,导致网元侧的告警发送与网管侧的告警接收和处理会严重不对称。例如,网元设备发送的告警消息大量增加,或者网管侧部分设备出现故障,网管侧的其它设备的处理任务,如待处理的告警消息被转移到网管服务器102,从而导致网管服务器102的告警消息列表中的待处理的告警消息的数量大大增加。
为了防止、缓解网路堵塞、告警丢失的问题,以及重要告警处理的及时性得不到保证的问题,本发明提供了一种告警消息传输方法,如图2所示。
在步骤S201,网管服务器101定时监测待处理的告警消息的数量。具体地,网管服务器101定时监测从网元设备102接收的、缓存在告警消息列表中的待处理的告警消息的数量。具体地,网管服务器101具有一监测定时器。当监测定时器的计时达到设定时间段值,如5分钟,网管服务器101检测告警消息列表中待处理的告警消息的数量,之后监测定时器清零。监测定时器清零后,在下次到达设定时间段值时,再次触发网管服务器101执行步骤S201检测告警消息列表中待处理的告警消息的数量。本领域技术人员可以根据实际情况设定定时监测的间隔时间段(即监测定时器的设定时间段值),比如,设置每隔5分钟监测统计一次告警消息列表中的待处理的告警消息的数量。
接下来,网管服务器101判断待处理的告警消息的数量是否超过设定的数量阈值(S202)。若网管服务器101判断待处理的告警消息的数量超过设定的数量阈值,执行步骤S203。
本领域技术人员可以根据具体情况设置数量阈值。例如,设置的数量阈值为200,若监测到待处理的告警数量为263条,高于预设的数量阈值200,则执行如下步骤S203。
在步骤S203,网管服务器101将优先级阈值发送到网元侧的各网元设备102。具体地,网管服务器101将优先级阈值封装在消息中发送到网元侧的各网元设备102,例如,网管服务器101可以将优先级阈值封装在告警阀值消息中发送到网元侧的各网元设备102。
优先级阈值用于指示网元设备102对于本网元设备中优先级低于所述优先级阈值的告警消息暂停发送,对于本网元设备中优先级不低于所述优先级阈值的告警消息正常发送。
优先级阈值可以是预先设定的固定值。例如,告警消息的优先级从低到高分别定义为:1、2、3、4、5,那么,优先级阈值可以预先设定为3。
一种较佳的方案是,根据网管服务器101中各待处理的告警消息的优先级计算得到优先级阈值。例如,计算网管服务器中各待处理的告警消息的优先级的平均值,将计算出的平均值作为优先级阈值。
接下来,网元设备102在接收到优先级阈值后,启动过滤发送机制(S204)。
通常,网元设备102会将产生的告警形成告警消息,并且将告警消息暂存在一个告警消息发送列表中。告警消息的内容包含:告警编号、告警优先级、告警产生时间、告警对象ID、告警对象类型等。告警消息在告警消息发送列表中的排列顺序是按照告警产生的时间先后或者其它策略生成的顺序。在本发明实施例的网元设备102中,网元设备102可以采用两种不同的发送机制对告警消息发送列表中的告警消息进行发送。一种发送机制为正常发送机制;另一种发送机制为过滤发送机制。
正常发送机制下,网元设备102对告警消息的发送方式与现有技术的相同:网元设备按照告警消息在告警消息发送列表中的顺序逐个将告警消息发送出去。表1示出了一个网元设备的告警消息发送列表。可以看出该告警消息发送列表中告警消息的排列是按照告警产生的时间先后顺序自上而下的排列的。正常发送机制下,该网元设备将按照告警消息发送列表中告警消息的先后排列顺序将各条告警消息逐个发送给网管服务器,即序号为sdqd20120311370245961的第一条告警消息被发送出去以后,该条消息即在列表中消失,然后发送下一条消息,即序号为sdqd20120311370245962的告警消息。网元设备新产生的告警消息则不断的被顺序添加在告警消息发送列表的下面。
表1
  告警编号   告警优先级   告警产生时间   告警对象ID   告警对象类型
  sdqd20120311370245961   5   20120330052605   00263   1
  sdqd20120311370245962   4   20120330052612   01170   2
  sdqd20120311370245963   1   20120330052614   02205   1
  sdqd20120311370245964   2   20120330052638   00141   2
  sdqd20120311370245965   2   20120330052650   03677   2
  sdqd20120311370245966   3   20120330052705   06423   2
  sdqd20120311370245967   4   20120330052717   05594   1
  sdqd20120311370245968   5   20120330052733   06101   1
  sdqd20120311370245969   4   20120330052738   02558   2
  sdqd20120311370245970   2   20120330052808   01639   1
  sdqd20120311370245971   3   20120330052841   05426   1
  sdqd20120311370245972   1   20120330052901   07220   2
  sdqd20120311370245973   1   20120330052903   01464   2
  sdqd20120311370245974   5   20120330052915   07757   1
  sdqd20120311370245975   3   20120330052959   04433   1
网元设备102在接收到优先级阈值后,即启动过滤发送机制:对于本网元设备的告警消息发送列表中优先级低于优先级阈值的告警消息暂停发送,对于本网元设备的告警消息发送列表中优先级不低于(即大于等于)优先级阈值的告警消息正常发送。例如,对于表1所示的告警消息发送列表,假设在序号为sdqd20120311370245961的第一条消息被发送出去之前,网元设备收到了网管服务器发送来的优先级阈值,该优先级阈值为3,网元设备启动过滤发送机制。即在顺序处理告警消息发送列表的每一条告警消息记录时,先将该条告警消息的优先级与网管服务器发送来的优先级阈值进行比较。对于优先级低于优先级阈值的告警消息,网元设备102暂时不发送;网元设备102跳到下一条告警消息并且对该下一条告警消息进行判断,如该下一条告警消息优先级不低于优先级阈值则将其发送。表2显示出来执行过滤发送机制几秒钟后该告警消息发送列表的情况。从表2可以看出,由于编号为sdqd20120311370245961、sdqd20120311370245962的两条告警消息的优先级分别为5和4,不低于优先级阈值3,因此被逐个发送出去从而在列表上消失了;但是对于编号为sdqd20120311370245963、sdqd20120311370245964、sdqd20120311370245965的三条告警消息,由于它们的告警优先级分别为1、2、2,均低于优先级阈值3,因此都被“跳过”,从而被暂时保留在了告警消息发送列表中。
表2
  告警编号   告警优先级   告警产生时间   告警对象ID   告警对象类型
  sdqd20120311370245963   1   20120330052614   02205   1
  sdqd20120311370245964   2   20120330052638   00141   2
  sdqd20120311370245965   2   20120330052650   03677   2
  sdqd20120311370245966   3   20120330052705   06423   2
  sdqd20120311370245967   4   20120330052717   05594   1
  sdqd20120311370245968   5   20120330052733   06101   1
  sdqd20120311370245969   4   20120330052738   02558   2
  sdqd20120311370245970   2   20120330052808   01639   1
  sdqd20120311370245971   3   20120330052841   05426   1
  sdqd20120311370245972   1   20120330052901   07220   2
  sdqd20120311370245973   1   20120330052903   01464   2
  sdqd20120311370245974   5   20120330052915   07757   1
  sdqd20120311370245975   3   20120330052959   04433   1
  sdqd20120311370245976   5   20120330053020   00272   1
  sdqd20120311370245977   4   20120330053041   01717   2
由于电信网络管理系统中与网管服务器101通信的每个网元设备102都会收到网管服务器101发送的优先级阈值,并启动过滤发送机制,因此在这一时间段,低等级的告警消息都被暂留在了网元侧,而网管侧的网管服务器收到的告警消息的告警优先级都是在优先级阈值以上。在这种情况下,假设有的网元设备产生的告警消息的优先级均低于优先级阈值3,则该网元设备将一个告警消息也不发出;假设有的网元设备在这期间所产生的告警的优先级均不低于优先级阈值3,则该网元设备的告警消息将按顺序发出。因此,本发明实施例的方法在网管服务器接收和处理告警能力暂时相对的严重不足的情况下,可以防止或缓解网路堵塞、告警丢失,并且保证了网元侧的高优先级的告警消息优先发送,网管服务器优先接收处理高优先级的告警消息。也就是说,本发明的方法,在发送告警消息方面,网元设备之间发送告警消息的处理不再是完全不受其他网元设备发送告警消息的影响;通过网管服务器的协调使网元设备之间能够动态的使用网管的告警处理资源,从而在整个网络上实现了告警统筹处理的最佳效果,提高了整个网络系统的性能。
继上次网管服务器101执行步骤S201监测待处理的告警消息的数量后,在定时监测的间隔时间段(例如5分钟)到达时,网管服务器再次查看告警消息列表中的待处理的告警消息的数量,即重复开始执行上述步骤S201。如果网管服务器101在再次执行步骤S201后发现待处理的告警消息的数量仍不低于数量阈值,再次计算告警消息列表中告警消息的优先级的平均值为4,将优先级阈值4发送给各个网元设备,各网元设备继续执行过滤发送机制;在继续执行时,仍从告警消息发送列表中首条消息开始进行比较判断,只不过都是与新的优先级阈值4进行比较判断,其它不变。
从上述举例中可以看出,在第一个5分钟内由于网管服务器101处理能力相对不足,网元设备暂时只发送等级为3、4、5的告警,但是即使这样,5分钟后网管侧的网管服务器101仍积累了超过数量阈值的待处理的告警消息数量。因此,客观上还需要进一步的提高网元侧的过滤标准,而此时的网管侧的待处理的告警消息的优先级平均值就能反映这一点;网管服务器再一次发送反映待处理的告警消息的优先级平均值的优先级阈值4,各网元设备在接下来的在5分钟内仅发送优先级为4和5的告警消息,即过滤标准提高到了不低于4级。因此说,使用本发明实施例的方法,网管处理能力相对不足的程度,根据网管服务器中各待处理的告警消息的优先级的平均值确定的优先级阈值决定了各网元设备发送的告警消息的优先级标准的高低,即相当于能够进行动态的自适应调整整个网络上传输的告警消息的优先级的高低,而且控制比较精确。
在告警风暴过去,告警消息列表中的待处理的告警消息的数量恢复正常后,网元设备102将从过滤发送机制恢复到正常发送机制。
下面详细描述网元设备102从过滤发送机制恢复到正常发送机制的具体过程。
每当监测定时器的计时达到设定时间段值,则触发网管服务器101开始执行步骤S201。如果告警风暴过去了,告警消息列表中的待处理的告警消息的数量将恢复正常,那么在步骤S202中,网管服务器101将判断出待处理的告警消息的数量小于或等于设定的数量阈值;网管服务器101跳过上述步骤S203,不再对网元设备102发送优先级阈值。网元设备102在接收到优先级阈值启动过滤发送机制后,若在设定的时间段内(比如设定的5分钟内)没有再接收到所述网管服务器发送的优先级阈值,则对之前暂停发送的告警消息恢复正常发送。具体地,网元设备102在接收到优先级阈值启动过滤发送机制后,还启动一接收定时器,在每次接收到优先级阈值时都对该接收定时器清零,当接收定时器计时达到设定时间段值时,将触发网元设备102恢复正常发送机制。在正常发送机制下,网元设备102将告警消息列表中的之前暂停发送的告警消息撤销暂停,网元设备按照告警消息在告警消息发送列表中的顺序逐个将告警消息发送出去。本领域技术人员可以根据实际情况设置接收定时器的设定时间段值,通常可以将接收定时器的设定时间段值设置与监测定时器的设定时间段值相等。
下面描述另一种网元设备102从过滤发送机制恢复到正常发送机制的具体过程。
每当监测定时器的计时达到设定时间段值,则触发网管服务器101开始执行步骤S201。如果告警风暴过去了,告警消息列表中的待处理的告警消息的数量将恢复正常,那么在步骤S202中,网管服务器101将判断出待处理的告警消息的数量小于或等于设定的数量阈值;网管服务器101跳过上述步骤S203,不再对网元设备102发送优先级阈值,而是执行步骤S211:网管服务器101向各网元设备102发送过滤机制停止信息;网元设备102执行的步骤S212为:网元设备102在接收到过滤机制停止信息后,将告警消息列表中的之前暂停发送的告警消息撤销暂停,网元设备按照告警消息在告警消息发送列表中的顺序逐个将告警消息发送出去,即从过滤发送机制恢复到正常发送机制。
与现有技术相比,本发明实施例通过监测网管侧的网管服务器已接收待处理告警的数量来判断网管服务器当前告警处理能力与处理需求之间的关系,或者说网管服务器处理能力满足处理需求的程度;由于网管服务器已接收待处理的告警消息列表的告警是来自各个网元设备的,因此该告警消息列表中告警的平均优先级级反映的是最近时间段内整个系统中所有网元设备告警的综合情况,因此将该参数(平均优先级值)发送给各网元设备,以其作为各网元设备下一时间段内进行告警消息发送控制的过滤标准,实现的是在整个网络系统中所有网元设备之间的一个协调平衡,保证的是网管服务器处理能力相对不足时,整个网络系统中严重程度高的告警消息能够得到最及时的处理,而且能够进行精确的控制。
图3示出了本发明实施例提供的网管服务器101以及网元设备102的具体内部结构框图。
如图3所示,网管服务器101包括:监测模块301、网元设备通知模块302。监测模块301用于定时监测从网元设备102接收的待处理的告警消息的数量。网元设备通知模块302用于在监测模块301监测的数量超过设定的数量阈值时,将优先级阈值向所述网元设备发送。
较佳地,网管服务器101还可以包括:优先级阈值确定模块303。优先级阈值确定模块303用于在监测模块301监测的数量超过设定的数量阈值时,根据所述网管服务器中各待处理的告警消息的优先级确定所述优先级阈值。具体地,在监测模块301监测的数量超过设定的数量阈值时,网元设备通知模块302将优先级阈值确定模块303确定的优先级阈值向所述网元设备发送。例如,优先级阈值确定模块303将各待处理的告警消息的优先级的平均值作为所述优先级阈值。
进一步,网元设备通知模块302还用于在将优先级阈值向所述网元设备发送后,若监测模块301监测的数量小于等于所述数量阈值时,向所述网元设备发送过滤发送停止信息。
本发明实施例的网管服务器101中的各模块所涉及的具体工作过程,可以参考上述网管服务器102与网元设备102之间的告警消息传输方法中所公开的相关内容,此处不再赘述。
如图3所示,本发明实施例提供的网元设备102包括:优先级阈值获取模块401、告警消息发送模块402。
优先级阈值获取模块401用于获取接收网管服务器101发送的优先级阈值。告警消息发送模块402用于在优先级阈值获取模块401接收到所述优先级阈值后,对于本网元设备中优先级低于所述优先级阈值的告警消息暂停发送,对于本网元设备中优先级不低于所述优先级阈值的告警消息正常发送。
进一步,告警消息发送模块402在接收到优先级阈值后,若在设定时间段内没有再接收到网管服务器101发送的优先级阈值,则对之前暂停发送的告警消息恢复正常发送。
本发明实施例的网管服务器由于在待处理的告警消息的数量超过设定的数量阈值时,通过向网元设备发送优先级阈值来通知网元设备启动过滤发送机制:对于本网元设备中优先级低于所述优先级阈值的告警消息暂停发送,对于本网元设备中优先级不低于所述优先级阈值的告警消息正常发送,从而在网管服务器接收和处理告警能力暂时相对的严重不足时,优先保证优先级别高的告警消息的发送和传输,防止或缓解网路堵塞、告警丢失的问题,从而使得网管服务器及时地处理优先级较高的告警消息。
进一步,根据网管服务器中各待处理的告警消息的优先级的平均值确定的优先级阈值决定了各网元设备发送的告警消息的优先级标准的高低,即达到能够进行动态的自适应调整整个网络上传输的告警消息的优先级的高低的目的,即自适应调整保证发送和传输的告警消息的优先级的高度,在网管服务器接收和处理告警能力持续不足的情况下,使网元设备自适应地调整发送的告警消息的优先级的标准。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读取存储介质中,如:ROM/RAM、磁碟、光盘等。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种告警消息传输系统,包括:网管侧的网管服务器以及网元侧的向所述网管服务器发送告警消息的网元设备;
所述网管服务器用于定时监测从所述网元设备接收的待处理的告警消息的数量,若监测到所述待处理的告警消息的数量超过设定的数量阈值时,将优先级阈值向所述网元设备发送;
网元侧的网元设备用于在接收到所述优先级阈值后,对于本网元设备中优先级低于所述优先级阈值的告警消息暂停发送,对于本网元设备中优先级不低于所述优先级阈值的告警消息正常发送。
2.如权利要求1所述的系统,其特征在于,所述网元设备还用于在接收到优先级阈值后,若在设定时间段内没有再接收到所述网管服务器发送的优先级阈值,则对之前暂停发送的告警消息恢复正常发送;或者,
所述网元设备还用于在接收到优先级阈值后,若接收到所述网管服务器发送的过滤发送停止信息,则对之前暂停发送的告警消息恢复正常发送;其中,所述过滤发送停止信息为所述网管服务器将优先级阈值向所述网元设备发送后,在监测到所述待处理的告警消息的数量小于等于所述数量阈值时,向所述网元设备发送的。
3.如权利要求2所述的系统,其特征在于,所述优先级阈值是根据所述网管服务器中各待处理的告警消息的优先级的平均值确定的。
4.一种网管服务器,包括:
监测模块,用于定时监测从所述网元设备接收的待处理的告警消息的数量;
网元设备通知模块,用于在所述监测模块监测的数量超过设定的数量阈值时,将优先级阈值向所述网元设备发送。
5.如权利要求4所述的服务器,其特征在于,还包括:
优先级阈值确定模块,用于根据所述网管服务器中各待处理的告警消息的优先级的平均值确定所述优先级阈值。
6.如权利要求5所述的服务器,其特征在于,所述网元设备通知模块还用于在将优先级阈值向所述网元设备发送后,若所述监测模块监测的数量小于等于所述数量阈值时,向所述网元设备发送过滤发送停止信息。
7.一种告警消息传输方法,包括:
网管服务器用于定时监测从所述网元设备接收的待处理的告警消息的数量;
若所述网管服务器监测到所述待处理的告警消息的数量超过设定的数量阈值时,将优先级阈值向所述网元设备发送;其中,所述优先级阈值用于指示所述网元设备:对于本网元设备中优先级低于所述优先级阈值的告警消息暂停发送,对于本网元设备中优先级不低于所述优先级阈值的告警消息正常发送。
8.如权利要求7所述的方法,其中,所述优先级阈值为预先设置的固定值;或者,所述优先级阈值是通过计算所述网管服务器中各待处理的告警消息的优先级的平均值,将所述平均值作为所述优先级阈值得到的。
9.一种告警消息传输方法,包括:
网元设备接收网管服务器发送的优先级阈值;并
对于本网元设备中优先级低于所述优先级阈值的告警消息暂停发送,对于本网元设备中优先级不低于所述优先级阈值的告警消息正常发送;
其中,所述优先级阈值为所述网管服务器在监测到所述待处理的告警消息的数量超过设定的数量阈值时发送的。
10.如权利要求9所述的方法,其中,在所述网元设备接收网管服务器发送的优先级阈值之后,还包括:
若所述网元设备在设定时间段内没有再接收到所述网管服务器发送的优先级阈值,则对之前暂停发送的告警消息恢复正常发送;或者,
若所述网元设备接收到所述网管服务器发送的过滤发送停止信息,则对之前暂停发送的告警消息恢复正常发送;其中,所述过滤发送停止信息为所述网管服务器将优先级阈值向所述网元设备发送后,在监测到所述待处理的告警消息的数量小于等于所述数量阈值时发送的。
CN2012101367131A 2012-05-04 2012-05-04 告警消息传输方法及系统、网管服务器和网元设备 Pending CN102694678A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2012101367131A CN102694678A (zh) 2012-05-04 2012-05-04 告警消息传输方法及系统、网管服务器和网元设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012101367131A CN102694678A (zh) 2012-05-04 2012-05-04 告警消息传输方法及系统、网管服务器和网元设备

Publications (1)

Publication Number Publication Date
CN102694678A true CN102694678A (zh) 2012-09-26

Family

ID=46859970

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012101367131A Pending CN102694678A (zh) 2012-05-04 2012-05-04 告警消息传输方法及系统、网管服务器和网元设备

Country Status (1)

Country Link
CN (1) CN102694678A (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104125115A (zh) * 2014-08-01 2014-10-29 浪潮(北京)电子信息产业有限公司 一种日志信息传送方法及装置
CN104243217A (zh) * 2014-09-29 2014-12-24 中国农业银行股份有限公司宿迁分行 一种网络故障检测方法及装置
CN104243587A (zh) * 2014-09-18 2014-12-24 苏州阔地网络科技有限公司 一种消息服务器负载均衡方法及系统
WO2015131744A1 (zh) * 2014-10-10 2015-09-11 中兴通讯股份有限公司 网络设备告警上报的方法及网络设备
WO2015192561A1 (zh) * 2014-06-18 2015-12-23 中兴通讯股份有限公司 一种告警数据处理方法及网络管理设备
CN105791015A (zh) * 2016-03-09 2016-07-20 浪潮通信信息系统有限公司 针对分布式告警处理系统的高可用消息传输通道及方法
CN106412091A (zh) * 2016-10-25 2017-02-15 广东欧珀移动通信有限公司 数据传输的控制方法、装置及系统
CN103648165B (zh) * 2013-12-30 2017-08-04 大唐移动通信设备有限公司 一种异常情况下的寻呼控制方法及装置
CN107450475A (zh) * 2016-05-30 2017-12-08 兄弟工业株式会社 移位检测系统和移位检测系统的控制方法
CN110072199A (zh) * 2018-01-23 2019-07-30 优信拍(北京)信息科技有限公司 一种监控短消息发送异常的方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101043373A (zh) * 2006-10-17 2007-09-26 华为技术有限公司 提高通信系统可靠性的装置和方法以及通信系统
CN101115264A (zh) * 2006-07-24 2008-01-30 中兴通讯股份有限公司 通讯终端故障监控系统及其实现方法
CN102006191A (zh) * 2010-11-26 2011-04-06 中兴通讯股份有限公司 一种实现告警的方法及装置
CN102368714A (zh) * 2011-11-09 2012-03-07 华为技术有限公司 一种网络告警的处理方法、装置及其系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101115264A (zh) * 2006-07-24 2008-01-30 中兴通讯股份有限公司 通讯终端故障监控系统及其实现方法
CN101043373A (zh) * 2006-10-17 2007-09-26 华为技术有限公司 提高通信系统可靠性的装置和方法以及通信系统
CN102006191A (zh) * 2010-11-26 2011-04-06 中兴通讯股份有限公司 一种实现告警的方法及装置
CN102368714A (zh) * 2011-11-09 2012-03-07 华为技术有限公司 一种网络告警的处理方法、装置及其系统

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103648165B (zh) * 2013-12-30 2017-08-04 大唐移动通信设备有限公司 一种异常情况下的寻呼控制方法及装置
WO2015192561A1 (zh) * 2014-06-18 2015-12-23 中兴通讯股份有限公司 一种告警数据处理方法及网络管理设备
CN105306232A (zh) * 2014-06-18 2016-02-03 中兴通讯股份有限公司 一种告警数据处理方法及网络管理设备
CN104125115A (zh) * 2014-08-01 2014-10-29 浪潮(北京)电子信息产业有限公司 一种日志信息传送方法及装置
CN104125115B (zh) * 2014-08-01 2017-09-22 浪潮(北京)电子信息产业有限公司 一种日志信息传送方法及装置
CN104243587A (zh) * 2014-09-18 2014-12-24 苏州阔地网络科技有限公司 一种消息服务器负载均衡方法及系统
CN104243217A (zh) * 2014-09-29 2014-12-24 中国农业银行股份有限公司宿迁分行 一种网络故障检测方法及装置
WO2015131744A1 (zh) * 2014-10-10 2015-09-11 中兴通讯股份有限公司 网络设备告警上报的方法及网络设备
CN105577401A (zh) * 2014-10-10 2016-05-11 中兴通讯股份有限公司 网络设备告警上报的方法及网络设备
CN105791015A (zh) * 2016-03-09 2016-07-20 浪潮通信信息系统有限公司 针对分布式告警处理系统的高可用消息传输通道及方法
CN105791015B (zh) * 2016-03-09 2018-10-26 浪潮天元通信信息系统有限公司 基于高可用消息传输通道的分布式告警处理系统及方法
CN107450475A (zh) * 2016-05-30 2017-12-08 兄弟工业株式会社 移位检测系统和移位检测系统的控制方法
CN106412091A (zh) * 2016-10-25 2017-02-15 广东欧珀移动通信有限公司 数据传输的控制方法、装置及系统
CN110072199A (zh) * 2018-01-23 2019-07-30 优信拍(北京)信息科技有限公司 一种监控短消息发送异常的方法及系统
CN110072199B (zh) * 2018-01-23 2023-01-20 优信拍(北京)信息科技有限公司 一种监控短消息发送异常的方法及系统

Similar Documents

Publication Publication Date Title
CN102694678A (zh) 告警消息传输方法及系统、网管服务器和网元设备
CN107040415B (zh) 一种终端及数据上报方法、服务器及数据接收方法
CN104935456B (zh) 通信网络告警系统的告警消息传输和处理方法
WO2012146026A1 (zh) 一种物联网监控方法及系统
CN101436146B (zh) 动态调节远程设备管理进程的优先级的方法及系统
CN103634149A (zh) 一种用于分布式系统的监测方法
CN101662386B (zh) 告警风暴的处理方法和装置
CN111104257A (zh) 一种备份日志数据的防超时方法、装置、设备及介质
CN102314392A (zh) 一种计算机监控系统及监控告警的方法
CN111147313B (zh) 一种报文异常监控方法、装置、存储介质及电子设备
CN107040566B (zh) 业务处理方法及装置
CN103763143A (zh) 基于存储服务器的设备异常报警的方法及系统
CN102981939A (zh) 磁盘监控方法
CN113806045A (zh) 一种任务分配方法、系统、设备以及介质
CN112000422B (zh) 一种防止容器编排框架中pod内存溢出的方法、装置
CN101106702B (zh) 视频监控系统可配置告警过滤方法
CN101499935B (zh) 一种WiMAX基站的告警处理方法
CN101267473B (zh) 一种振荡告警的处理方法
WO2014040470A1 (zh) 告警消息的处理方法及装置
CN113760669A (zh) 问题数据的告警方法及装置、电子设备、存储介质
CN102262579A (zh) 一种计算机监控方法及系统
CN112838957A (zh) 一种具备智能调度的流量预测系统
CN110874430B (zh) 网络爬虫调度方法、装置及设备
CN106878101B (zh) 监控系统中告警信息的处理方法和装置
CN105099819A (zh) 一种监控网站状态的系统和方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20120926