CN103684862B - 告警消息的处理方法、装置、系统以及设备 - Google Patents

告警消息的处理方法、装置、系统以及设备 Download PDF

Info

Publication number
CN103684862B
CN103684862B CN201310658874.1A CN201310658874A CN103684862B CN 103684862 B CN103684862 B CN 103684862B CN 201310658874 A CN201310658874 A CN 201310658874A CN 103684862 B CN103684862 B CN 103684862B
Authority
CN
China
Prior art keywords
alarm
message
collection machine
produces
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310658874.1A
Other languages
English (en)
Other versions
CN103684862A (zh
Inventor
袁静
张培良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Datang Mobile Communications Equipment Co Ltd
Original Assignee
Datang Mobile Communications Equipment Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Datang Mobile Communications Equipment Co Ltd filed Critical Datang Mobile Communications Equipment Co Ltd
Priority to CN201310658874.1A priority Critical patent/CN103684862B/zh
Publication of CN103684862A publication Critical patent/CN103684862A/zh
Application granted granted Critical
Publication of CN103684862B publication Critical patent/CN103684862B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明提供了一种告警消息的处理方法、装置、系统以及设备,包括:接收告警代理上报的第一告警产生消息;定位第一告警收集机,所述第一告警收集机中存储有第二告警产生消息;判断所述第一告警收集机中是否存在与所述第一告警产生消息相同的第二告警产生消息;若是,则将所述第一告警产生消息添加到所述告警代理对应的第二告警收集机;若否,则判断第三告警收集机中是否存在与所述第一告警产生消息相同的第三告警产生消息;若是,则丢弃所述第一告警产生消息;否则,则将所述第一告警产生消息添加到第二告警收集机中,并将所述第一告警产生消息上报至OMC。本发明可以确保网络运维人员所观察到的告警上报时间是初次故障发生时间。

Description

告警消息的处理方法、装置、系统以及设备
技术领域
本发明涉及分布式通信领域,特别是涉及一种告警消息的处理方法、一种告警消息的处理装置、一种告警消息的处理系统、一种主控全局板以及一种外围单板。
背景技术
在分布式电信设备中,为了监测网元设备的运行情况,通常需要对网元设备产生的告警消息进行及时、有效的监控、处理和上报。
目前告警系统由OAMS(操作维护子系统)、OMC(操作维护中心)和告警源组成。其中,告警源负责监测所管理对象状态的变化,在对象状态出现变化后生成告警信息(包括告警产生消息和告警清除消息),并向OAMS上报该告警信息;OAMS将收到的告警信息发送给OMC;OMC负责网元的配置、操作维护等管理,并将接收到的告警信息呈现给用户。
具体而言,参考图1所示的告警消息产生和上报处理流程图,网元设备侧对于告警消息的产生和上报的处理方案通常如下:当告警源检测到所监测的对象状态变为故障或出现异常时,发送告警产生消息到OAMS的告警处理模块,告警处理模块进行简单的预处理,并更新相应的活跃告警列表后,将该告警产生消息发送至OMC。当告警源所在的单板发生异常导致复位或由于外在原因人为复位时,OAMS告警处理模块在收到该单板CPU状态异常的通知消息后,告警处理模块会触发相应的告警清除消息并发送至OMC把该单板所上报的所有告警产生消息全部清除。当单板复位重启正常后,告警源重新检测对象状态,如果该对象状态依然异常,则再次上报告警产生消息至OAMS的告警处理模块,告警处理模块经过简单的重复性校验和更新活跃告警列表后,把该告警产生消息发送至OMC。
然而,发明人在实施上述的网元设备侧对于告警消息的产生和上报的处理过程中,发现如下不足:
一方面是对于在单板复位前后一直处于故障状态的对象,单板会在初次检测到该故障时上报一次告警产生消息到网元的告警处理模块,告警处理模块会把该告警产生消息上报至OMC;当单板复位时,告警处理模块会触发相应的告警清除消息发送至OMC用来清除该单板在复位前所上报的所有告警消息;当单板复位后,单板会重新检测到该故障并上报相应的告警产生消息。也就是说在单板复位前后会有大量的告警消息上报至OMC,增加网元和网管间消息通信的压力,同时也影响OMC的告警处理效率;
另一方面是对于同一原因引起的故障,反复地上报告警消息至OMC,告警产生时间不断被更新(如在2013-6-208:00产生了一个小区退服的告警消息上报到了OMC,此后小区一直处于退服状态,然后在2013-6-2110:00上报该告警消息的单板发生了复位,单板复位时会把原来上报的小区退服告警清除掉,复位完成后,由于该小区状态一直没有恢复,那么会再次上报小区退服告警至OMC,但是告警产生时间却是复位后的时间),可能会造成重复故障派单,降低故障处理效率,增加设备维护成本。
发明内容
本发明实施例所要解决的技术问题是提供一种告警消息的处理方法,使得单板复位前后一直处于故障态的故障对象的告警消息在OMC上所呈现的上报时间不被更新,确保网络运维人员所观察到的告警上报时间是初次故障发生时间。
本发明还提供了一种告警消息的处理装置、一种告警消息的处理系统、一种主控全局板以及一种外围单板,用以保证所述方法的实现及应用。
为了解决所述问题,本发明公开了一种告警消息的处理方法,所述告警消息由单板生成,所述单板将所述告警消息传送至告警代理,由所述告警代理发送至告警主控,所述告警代理与一个或多个告警收集机关联,所述方法包括:
告警主控接收告警代理上报的告警消息,所述告警消息包括第一告警产生消息;
告警主控定位第一告警收集机,所述第一告警收集机中存储有第二告警产生消息,所述第二告警产生消息为所述单板在复位前上报的告警产生消息;
告警主控判断所述第一告警收集机中是否存在与所述第一告警产生消息相同的第二告警产生消息;
若是,则告警主控将所述第一告警产生消息添加到所述告警代理对应的第二告警收集机中;
若否,则告警主控判断第三告警收集机中是否存在与所述第一告警产生消息相同的第三告警产生消息,所述第三告警收集机中存储有没有发生复位的单板上报的告警产生消息;
若所述第三告警收集机中存在所述相同的第三告警产生消息,则告警主控丢弃所述第一告警产生消息;
若所述第三告警收集机中不存在所述相同的第三告警产生消息,则告警主控将所述第一告警产生消息添加到第二告警收集机中,并将所述第一告警产生消息上报至操作维护中心。
优选地,所述告警消息还包括第一告警清除消息,所述方法还包括:
告警主控判断所述第一告警收集机中是否存在与所述第一告警清除消息对应的第四告警产生消息;
若是,则告警主控在第三告警收集机中查找所述第一告警清除消息对应的第五告警产生消息,在找到所述第五告警产生消息时删除所述第五告警产生消息,并将所述第一告警清除消息上报至操作维护中心中;
若否,则告警主控在第三告警收集机中查找所述第一告警清除消息对应的第六告警产生消息,在找到所述第六告警产生消息时删除所述第六告警产生消息,并将所述第一告警清除消息上报至操作维护中心中。
优选地,所述方法还包括:
若所述第一告警收集机中存在与所述第一告警产生消息相同的第二告警产生消息,为所述相同的第二告警产生消息设置上报标识。
优选地,在告警主控接收告警代理上报的告警消息步骤之前,所述方法还包括:
当监控到单板发生复位时,获取所述单板对应的告警代理的物理地址;
在预设映射表中查找所述告警代理的物理地址,获得与所述告警代理对应的第一告警收集机;
启动所述第一告警收集机的定时器。
优选地,所述第一告警收集机设置有预设标识,所述告警主控依据所述预设标识定位第一告警收集机。
优选地,所述方法还包括:
当所述定时器到时时,将所述第一告警收集机中的设置有上报标识的第二告警产生消息删除;
将所述第一告警收集机中没有设置有上报标识的第二告警产生消息删除,并分别产生对应的第二告警清除消息上报至操作维护中心;
初始化所述第一告警收集机。
优选地,所述方法还包括:
告警主控在接收到告警消息后,向所述告警代理返回告警响应消息。
本发明还公开了一种告警消息的处理装置,所述告警消息由单板生成,所述单板将所述告警消息传送至告警代理,由所述告警代理发送至告警主控,所述告警代理与一个或多个告警收集机关联,所述装置包括:
告警消息接收模块,用于接收告警代理上报的告警消息,所述告警消息包括第一告警产生消息;
定位模块,用于定位第一告警收集机,所述第一告警收集机中存储有第二告警产生消息,所述第二告警产生消息为所述单板在复位前上报的告警产生消息;
第一判断模块,用于判断所述第一告警收集机中是否存在与所述第一告警产生消息相同的第二告警产生消息;
第一告警消息添加模块,用于在存在所述相同的第二告警产生消息时,将所述第一告警产生消息添加到所述告警代理对应的第二告警收集机中;
第二判断模块,用于在不存在所述相同的第二告警产生消息时,判断第三告警收集机中是否存在与所述第一告警产生消息相同的第三告警产生消息,所述第三告警收集机中存储有没有发生复位的单板上报的告警产生消息;
丢弃模块,用于在所述第三告警收集机中存在所述相同的第三告警产生消息时,丢弃所述第一告警产生消息;
第二告警消息添加模块,用于在所述第三告警收集机中不存在所述相同的第三告警产生消息时,将所述第一告警产生消息添加到第二告警收集机中,并将所述第一告警产生消息上报至操作维护中心。
优选地,所述告警消息还包括第一告警清除消息,所述装置还包括:
第三判断模块,用于判断所述第一告警收集机中是否存在与所述第一告警清除消息对应的第四告警产生消息;
第一删除模块,用于在存在所述对应的第四告警产生消息时,在第三告警收集机中查找所述第一告警清除消息对应的第五告警产生消息,在找到所述第五告警产生消息时删除所述第五告警产生消息,并将所述第一告警清除消息上报至操作维护中心中;
第二删除模块,用于在不存在所述对应的第四告警产生消息时,在第三告警收集机中查找所述第一告警清除消息对应的第六告警产生消息,在找到所述第六告警产生消息时删除所述第六告警产生消息,并将所述第一告警清除消息上报至操作维护中心中。
优选地,所述装置还包括:
上报标识添加模块,用于在所述第一告警收集机中存在与所述第一告警产生消息相同的第二告警产生消息时,为所述相同的第二告警产生消息设置上报标识。
优选地,所述装置还包括:
物理地址获取模块,用于在接收告警代理上报的告警消息之前,当监控到单板发生复位时,获取所述单板对应的告警代理的物理地址;
第一告警收集机查找模块,用于在预设映射表中查找所述告警代理的物理地址,获得与所述告警代理对应的第一告警收集机;
定时器启动模块,用于启动所述第一告警收集机的定时器。
优选地,所述第一告警收集机设置有预设标识,所述告警主控依据所述预设标识定位第一告警收集机。
优选地,所述装置还包括:
第三删除模块,用于在所述定时器到时时,将所述第一告警收集机中的设置有上报标识的第二告警产生消息删除;
第四删除模块,用于将所述第一告警收集机中没有设置有上报标识的第二告警产生消息删除,并分别产生对应的第二告警清除消息上报至操作维护中心;
初始化模块,用于初始化所述第一告警收集机。
优选地,所述装置还包括:
告警响应消息返回模块,用于在接收到告警消息后,向所述告警代理返回告警响应消息。
本发明还公开了一种告警消息的处理系统,所述处理系统包括外围单板,主控全局板、操作维护中心,
其中,所述外围单板包括:
告警监控模块,用于在检测到外围单板中的故障产生或故障消除时,生成告警消息,并向告警代理模块发送所述告警消息;
告警代理模块,用于将所述告警消息发送至主控全局板;
所述主控全局板包括:
告警接收模块,用于为告警代理模块分配对应的告警收集机,将接收到的告警消息存储在告警代理对应的告警收集机中,并定位第一告警收集机,所述第一告警收集机中存储有第二告警产生消息,所述第二告警产生消息为所述单板在复位前上报的告警产生消息;
告警判断模块,用于在所述告警消息为告警产生消息时,判断所述第一告警收集机中是否存在与所述第一告警产生消息相同的第二告警产生消息,若是,则将所述第一告警产生消息添加到所述告警代理对应的第二告警收集机中;若否,则判断第三告警收集机中是否存在与所述第一告警产生消息相同的第三告警产生消息,所述第三告警收集机中存储有没有发生复位的单板上报的告警产生消息;若所述第三告警收集机中存在所述相同的第三告警产生消息,则丢弃所述第一告警产生消息;若所述第三告警收集机中不存在所述相同的第三告警产生消息,则将所述第一告警产生消息添加到第二告警收集机中,并将所述第一告警产生消息上报至告警上报模块;
告警上报模块,用于将所述告警消息上报到操作维护中心;
所述操作维护中心,用于根据所述告警消息进行告警处理。
优选地,所述告警判断模块用于:
在所述告警消息为告警清除消息时,判断所述第一告警收集机中是否存在与所述第一告警清除消息对应的第四告警产生消息;若是,则在第三告警收集机中查找所述第一告警清除消息对应的第五告警产生消息,在找到所述第五告警产生消息时删除所述第五告警产生消息,并将所述第一告警清除消息上报至告警上报模块;若否,则在第三告警收集机中查找所述第一告警清除消息对应的第六告警产生消息,在找到所述第六告警产生消息时删除所述第六告警产生消息,并将所述第一告警清除消息上报至告警上报模块。
优选地,所述主控全局板还包括:
定时器设置模块,用于为所述第一收集机设置定时器。
优选地,所述主控全局板还包括:
告警消息清除模块,用于当所述定时器到时时,将所述第一告警收集机中的设置有上报标识的第二告警产生消息删除;将所述第一告警收集机中没有设置有上报标识的第二告警产生消息删除,并分别产生对应的第二告警清除消息上报至告警上报模块;
初始化模块,用于初始化所述第一告警收集机。
本发明还公开了一种主控全局板,包括:
告警接收模块,用于为告警代理模块分配对应的告警收集机,将接收到的告警消息存储在告警代理对应的告警收集机中,并定位第一告警收集机,所述第一告警收集机中存储有第二告警产生消息,所述第二告警产生消息为所述单板在复位前上报的告警产生消息;
告警判断模块,用于在所述告警消息为告警产生消息时,判断所述第一告警收集机中是否存在与所述第一告警产生消息相同的第二告警产生消息,若是,则将所述第一告警产生消息添加到所述告警代理对应的第二告警收集机中;若否,则判断第三告警收集机中是否存在与所述第一告警产生消息相同的第三告警产生消息,所述第三告警收集机中存储有没有发生复位的单板上报的告警产生消息;若所述第三告警收集机中存在所述相同的第三告警产生消息,则丢弃所述第一告警产生消息;若所述第三告警收集机中不存在所述相同的第三告警产生消息,则将所述第一告警产生消息添加到第二告警收集机中,并将所述第一告警产生消息上报至告警上报模块;
告警上报模块,用于将所述告警消息上报到操作维护中心。
本发明还公开了一种外围单板,包括:
告警监控模块,用于在检测到外围单板中的故障产生或故障消除时,生成告警消息,并向告警代理模块发送所述告警消息;
告警代理模块,用于将所述告警消息发送至主控全局板。
与背景技术相比,本发明实施例包括以下优点:
在本发明中,对单板复位后所属的告警代理对应的告警收集机设置单板复位标识,当接收到告警消息后首先在具有单板复位标识的告警处理机中查找,并根据查找结果判断是否需要将该告警消息上报至OMC,减轻了网元和OMC间的消息通信压力,提高了OMC的告警处理效率和处理性能。此外,由于在单板复位前后一直处于故障态的告警对象的告警消息在OMC上所呈现的上报时间不被更新,确保网络运维人员所观察到的告警上报时间是初次故障发生时间,进而对故障进行准确派单,提高故障处理效率,降低设备维护成本。
附图说明
图1是本发明背景技术中的告警消息产生和上报处理流程图;
图2是本发明实施例的一种告警消息的处理方法实施例一的步骤流程图;
图3是本发明实施例的一种告警消息的处理方法实施例二的步骤流程图;
图4是本发明实施例的一种告警消息的处理装置实施例的结构框图;
图5是本发明实施例的一种告警消息的处理系统实施例的结构框图;
图6是本发明实施例的一种主控全局板实施例的结构框图;
图7是本发明实施例的一种外围单板实施例的结构框图。
具体实施方式
为使本发明实施例的所述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明实施例作进一步详细的说明。
本发明实施例的核心构思在于,对单板复位后所属的告警代理对应的告警收集机设置单板复位标识并对所述设置了单板复位标识的告警收集机设置定时器,当接收到告警消息后首先在具有单板复位标识的告警处理机中查找,并根据查找结果判断是否需要将该告警消息上报至OMC,在定时器到时时,清除定时器的冗余告警消息,释放该告警收集机。从而减轻了网元和OMC间的消息通信压力,提高了OMC的告警处理效率和处理性能,并确保网络运维人员所观察到的告警上报时间是初次故障发生时间。
随着现代电信网络的飞速发展,单板在分布式系统中的应用越来越广泛。分布式系统中各功能一般分由不同的单板来承载,所述单板可以分为全局控制板以及外围单板,其中,所述全局控制板是分布式系统的中枢,负责接收网管的指令完成对分布式系统的操作维护,所述外围单板是分布式系统中除全局控制板以外的其它单板的总称。
在实际中,外围单板上可以包括多种应用子系统,每种应用子系统各自管理和维护自身的资源,当应用子系统的告警检测模块监测到自身的资源发生异常或出现故障时,产生告警消息,并将告警消息发送至OAMS的告警处理模块。在本发明实施例中,将OAMS的告警处理模块分为告警代理和告警主控两部分。其中告警主控仅部署在网元设备的全局控制板上,不直接与外围单板中的应用子系统交互,告警代理部署在所有外围单板上,直接与外围单板中的应用子系统交互,负责接收各个应用子系统的告警监测模块上报的告警消息并把其上报到告警主控中。为了便于与外围单板上的告警代理和OMC进行交互,告警主控又分为告警主控收集模块和告警主控上报模块;在告警收集模块中,针对每个告警代理都分配一个告警收集机,用于存储、维护告警代理上报的活跃告警消息;每个告警代理和其对应的告警收集机都各自维护一个活跃告警列表,并且其所维护的告警信息是一致的。
参照图2,示出了本发明实施例的一种告警消息的处理方法实施例一的步骤流程图,其中,所述告警消息由单板生成,所述单板将所述告警消息传送至告警代理,由所述告警代理发送至告警主控,所述告警代理与一个或多个告警收集机关联,本实施例可以包括如下步骤:
步骤201,告警主控接收告警代理上报的告警消息,所述告警消息包括第一告警产生消息;
步骤202,告警主控定位第一告警收集机,所述第一告警收集机中存储有第二告警产生消息,所述第二告警产生消息为所述单板在复位前上报的告警产生消息;
步骤203,告警主控判断所述第一告警收集机中是否存在与所述第一告警产生消息相同的第二告警产生消息;若是,则执行步骤204,若否,则执行步骤205;
步骤204,告警主控将所述第一告警产生消息添加到所述告警代理对应的第二告警收集机中;
步骤205,告警主控判断第三告警收集机中是否存在与所述第一告警产生消息相同的第三告警产生消息,所述第三告警收集机中存储有没有发生复位的单板上报的告警产生消息,若是,则执行步骤206,若否,则执行步骤207;
步骤206,告警主控丢弃所述第一告警产生消息;
步骤207,告警主控将所述第一告警产生消息添加到第二告警收集机中,并将所述第一告警产生消息上报至操作维护中心。
在本发明实施例中,当告警主控接收到告警代理发送的第一告警产生消息时,先到第一告警收集机中查找与所述第一告警产生消息相同的第二告警产生消息,若所述第二告警产生消息查找成功,说明所述第一告警产生消息是单板发生复位后针对旧故障对象发送的告警产生消息,单板复位前针对该故障对象已经上报过告警产生消息,则将所述第一告警产生消息添加到告警代理对应的告警收集机中,但不将该第一告警产生消息上报到OMC中;若所述第二告警产生消息没有查找成功,说明所述第一告警产生消息是针对新故障对象的告警产生消息,则将所述第一告警产生消息添加到告警代理对应的告警收集机中,并将该第一告警产生消息上报到OMC中,减少了网元与OMC间的告警消息上报次数,从而减轻了网元和OMC间的消息通信压力,提高了OMC的告警处理效率和处理性能,并保证了OMC上所呈现的上报时间不被更新,确保网络运维人员所观察到的告警上报时间是初次故障发生时间,进而对故障进行准确派单,提高故障处理效率,降低设备维护成本。
参照图3,示出了本发明实施例的一种告警消息的处理方法实施例二的步骤流程图在本实施例中从告警主控侧进行详细说明,可以包括如下步骤:
步骤301,当检测到单板发生复位时,获取所述单板对应的告警代理的物理地址;
在网络中,一般都有对单板的保护措施,如冗余备份、复位等。特别是复位,是单板维护中必不可少的措施。在具体实现中,单板复位是指外围单板发生的复位情况,外围单板发生复位的情况可以分为外部原因以及内部原因,外部原因通常可以为人为复位单板或者插拔、更换单板等;内部原因通常可以为单板内的处理器(CPU)占用率高,压任务,压心跳等等CPU异常情况或发生故障的情况,另外,单板的各种带宽端口以及端口与端口间的链路发生异常或出现故障的情况也可以导致单板复位。
在实际中,针对外围单板上的各处理器(CPU)分别部署一个对应的告警代理,每个告警代理的物理地址就是对应的处理器的物理地址。具体而言,告警主控通过在RDBS(资源和数据库子系统,分布于外围单板中的一种应用子系统)中注册需要监控的CPU信息以及告警主控的信息,来主动监控各个外围单板的CPU状态变更情况,当RDBS监控到某一单板的CPU发生变更时,发送CPU变更消息到告警主控中,该CPU变更消息中携带有对应的CPU的物理地址,即告警主控可以根据该CPU变更消息获得该CPU对应的告警代理的物理地址。
步骤302,在预设映射表中查找所述告警代理的物理地址,获得与所述告警代理对应的第一告警收集机;
在具体实现中,在告警代理初始化时会把自己的物理地址发送给告警主控,告警主控在给其分配告警收集机的时候会存储该告警代理的物理地址,生成告警代理的物理地址与告警收集机的映射关系并存储在预设映射表中。因此,当告警主控获得告警代理的物理地址后,可以在预设映射表中查找该物理地址,从而获得该物理地址对应的告警收集机。
在本发明实施例中,与所述发生复位的单板对应的告警代理所关联的告警收集机称为第一告警收集机。在具体实现中,所述第一告警收集机设置有预设标识,用于标示所述第一告警收集机所对应的单板发生了复位,所述第一告警收集机中存储有发生复位的单板在复位前上报的告警产生消息(即第二告警产生消息),其中,所述预设标识是一种TAG标签,通过TAG标签可以使被标识的对象更容易被搜索到。
步骤303,启动所述第一告警收集机的定时器;
具体而言,由于第一告警收集机是单板复位前告警代理维护的告警收集机,单板复位后告警主控会为该告警代理分配一个有别于所述第一告警收集机的第二告警收集机来存储单板复位后上报的告警消息。此时,所述第一告警收集机只是起到了辅助过渡的作用,当单板复位正常后,第一告警收集机中的告警产生消息就都变成了冗余告警,需要全部清除,该收集机也需要被释放,以便可以后续被分配给其他复位或者新启动的外围单板继续使用。因此,所述第一告警收集机中设置有定时器,在为所述第一告警收集机设置预设标识的同时,启动所述第一告警收集机的定时器。所述定时器是一种冗余告警定时器,用于通过设置该定时器的时长来将该定时器所在的第一告警收集机中的冗余告警消息清除,其中,所述定时器的时长可以根据不同的单板类型做不同的设置,例如8分钟定时器,10分钟定时器等等。
步骤304,接收告警代理上报的告警消息;
具体而言,所述告警消息可以包括告警产生消息以及告警清除消息,所述告警产生消息为告警检测模块在检测到某对象的状态由正常变更为故障或出现异常时上报的告警消息;所述告警清除消息为告警监控模块在监测到某对象的状态由异常变更为正常时上报的告警消息。
在具体实现中,告警代理接收到告警监控模块上报的告警消息后,先对所述告警消息进行重复性校验和准确性校验后才将该告警消息发送至告警主控中,具体的,若该告警消息为告警产生消息,则告警代理确定其自身的活跃列表中是否存在与该告警产生消息相同的告警消息,若是,说明该告警产生消息为重复产生的告警消息,则不上报该告警消息到告警主控中;否则,说明该告警产生消息不是重复产生的告警消息,则上报该告警消息到告警主控中;另一方面,若该告警消息为告警清除消息,告警代理确定其自身维护的活跃告警列表中是否存在与所述告警清除消息对应的告警产生消息,若否,说明在接收到该告警清除消息之前,没有接受到该告警清除消息对应的告警产生消息,该告警清除消息为误报消息(因其不符合告警产生消息和告警清除消息成对出现,且告警产生消息必须早于告警清除消息的原则),则不上报该告警清除消息到告警主控中;若告警代理确定其自身维护的活跃告警列表中存在与所述告警清除消息对应的告警产生消息,则上报该告警清除消息到告警主控中。
在实际应用中,告警消息中携带有告警编号、告警上报类型以及对应的故障对象等信息,判断两条告警消息是否相同或相对应的方法可以是,若这两条告警消息的告警上报类型、告警编号和对应的故障对象均相同,则这两条告警消息为相同的告警消息;若这两条告警消息的告警编号和对应的故障对象均相同且其告警上报类型不同,则这两条告警消息为相对应的告警消息。
步骤305,向所述告警代理返回告警响应消息;
应用于本发明实施例,告警主控在接收到告警代理发送的告警消息后,向所述告警代理返回告警响应消息,用于告之告警代理该告警消息已经成功接收,所述告警代理在接收到告警响应消息后,在告警代理侧做相应的处理:若所述告警消息为告警发生消息,则在告警代理自身维护的活跃告警列表上添加该条告警产生消息;若所述告警消息为告警清除消息,则在告警代理自身维护的活跃告警列表中找到与该告警清除消息对应的告警产生消息并进行清除,从而保障告警代理和对应的告警收集机上的活跃告警列表是一致的。
步骤306,判断所述告警消息为第一告警产生消息或第一告警清除消息;若所述告警消息为第一告警产生消息,执行步骤307;若所述告警消息为第一告警清除消息,执行步骤312;
具体而言,可以根据所述告警消息中的告警上报类型判断该告警消息为告警产生消息或告警清除消息。例如,若告警消息为告警产生消息,则其告警上报类型可以标识为1,若告警消息为告警清除消息,则其告警上报类型可以标识为0。当然,本领域技术人员也可以采用其他方式表示告警上报类型,本发明实施例对此无需加以限制。
步骤307,定位第一告警收集机,判断所述第一告警收集机中是否存在与所述第一告警产生消息相同的第二告警产生消息,若是,执行步骤308,若否,执行步骤309;
具体而言,告警主控在接收到告警代理上报的告警产生消息后,首先在其分配的所有告警收集机中定位第一告警收集机,具体的,告警主控从其分配的所有告警收集机中查找设置了TAG标签的告警收集机,在找到后,判断第一告警收集机中是否存在与所述第一告警产生消息相同的第二告警产生消息。由于单板复位而被置TAG标签的第一告警收集机的数量远小于告警主控上已经分配的所有告警收集机的数量,先在在设置了TAG标签的第一告警收集机中查找告警产生消息可以减少遍历次数节省遍历时间,提高查询效率。
步骤308,将所述相同的第二告警产生消息设置上报标识,并将所述第一告警产生消息添加到所述告警代理对应的第二告警收集机中,继续执行步骤315;
步骤309,判断第三告警收集机中是否存在与所述第一告警产生消息相同的第三告警产生消息,若是,则执行步骤310,若否,则执行步骤311,
步骤310,丢弃所述第一告警产生消息;
步骤311,将所述第一告警产生消息添加到第二告警收集机中,并将所述第一告警产生消息上报至操作维护中心;
在本发明实施例中,单板在发生复位后所上报的告警消息一般存在两种情况:一是故障对象一直没有恢复,单板复位后重新检测到该故障对象并再次上报告警消息的情况;另一种是检测到新的故障对象所上报的新的告警消息。对于第一种情况,由于单板在发生复位前已经针对该故障对象上报过告警产生消息(即上报过第二告警产生消息),因此告警主控再次接收到针对该故障对象的告警产生消息(即第一告警产生消息)时并不上报到操作维护中心OMC中,保证OMC中只收到一次针对该故障对象的告警产生消息,从而保证OMC中记录的告警时间不被更新,确保网络运维人员所观察到的告警上报时间是初次故障发生时间,进而对故障进行准确派单,提高故障处理效率,降低设备维护成本。而对于第二种情况,上报上来的告警产生是新故障对象的告警消息,属于第一次上报告警产生消息的情况,所以需要上报到OMC中。
具体而言,告警主控对于复位的单板会维护两个或多个告警收集机。其中一个是复位前被置TAG标签的告警收集机(第一告警收集机),另外的告警收集机是复位后重新分配的告警收集机。若告警主控在第一告警收集机中查找到与告警代理上报的第一告警产生消息相同的第二告警产生消息,说明该条告警代理上报的第一告警产生消息是单板复位后发出的针对同一故障对象的告警产生消息,所述单板在复位前已经上报过第二告警产生消息,则把第一告警收集机中的该条第二告警产生消息设置上报标识,同时将告警代理上报的第一告警产生消息添加到告警代理对应的第二告警收集机中,但不把该第一告警产生消息上报到OMC中。
另一方面,若告警主控在第一告警收集机中没有查找到与告警代理上报的第一告警产生消息相同的第二告警产生消息,说明该条告警代理上报的第一告警产生消息不是单板复位后针对同一故障对象发出的告警产生消息,则告警主控到除所述第一告警收集机外的其他告警收集机(即第三告警收集机,第三告警收集机存储有没有发生复位的单板上报的告警产生消息)中去查找告警代理上报的第一告警产生消息,如果在第三告警收集机中查找到该第一告警产生消息,说明该第一告警产生消息是重复上报的告警消息,此时告警主控可以将该告警产生消息做丢弃处理;如果在第三告警收集机中没有查找到该第一告警产生消息,说明该第一告警产生消息是第一次上报的告警产生消息,则将该第一告警产生消息添加到其告警代理对应的第二告警收集机的中,并将该第一告警产生消息上报到OMC中。
在实际应用中,每个告警收集机都维护一个对应的活跃告警列表,将告警产生消息添加到告警收集机中,实际上是将该告警产生消息在该告警收集机的活跃告警列表中进行挂链,以更新告警收集机的活跃告警列表。
需要说明的是,由于告警代理在发送告警消息时已经进行了重复性校验,所以一般情况下,告警代理只会将第一次接收到的告警消息发送到告警主控中。然而,为了避免意外情况的发生(告警代理的重复性校验机制失效等情况),告警主控上也设置有重复性校验机制,即告警主控在判断接收到的第一告警产生消息不是单板复位后发出的告警产生消息并且该第一告警产生消息在第三告警收集机中存在时,即认为该条告警产生消息是重复的,对其作丢弃处理。
步骤312,判断所述第一告警收集机中是否存在与所述第一告警清除消息对应的第四告警产生消息,若是,则执行步骤313,若否,则执行步骤314;
步骤313,在第三告警收集机中查找所述第一告警清除消息对应的第五告警产生消息,在找到所述第五告警产生消息时删除所述第五告警产生消息,并将所述第一告警清除消息上报至操作维护中心中,继续执行步骤315;
步骤314,在第三告警收集机中查找所述第一告警清除消息对应的第六告警产生消息,在找到所述第六告警产生消息时删除所述第六告警产生消息,并将所述第一告警清除消息上报至操作维护中心中;
具体而言,若所述告警消息为第一告警清除消息,告警主控首先会在第一告警收集机中去查找该第一告警清除消息相对应的第四告警产生消息,如果查找到,说明是该单板在复位后上报过第五告警产生消息,则在第三告警收集机中去找该第五告警产生消息,找到后把其在第三告警收集机的活跃告警列表中清除,然后把该第一告警清除消息上报给OMC,由OMC清除OMC中存储的对应告警产生消息;如果在第一告警收集机中没有找到该第一告警清除消息相对应的第四告警产生消息,说明在第三告警收集机中存在所述第一告警清除消息相对应的第六告警产生消息,则需要在第三告警收集机活跃告警列表中去查找该告警清除消息相应的第六告警产生消息,找到后将所述第六告警产生消息删除,然后把该第一告警清除消息上报至OMC。
步骤315,当所述定时器到时时,将所述第一告警收集机中的设置有上报标识的第二告警产生消息删除;将所述第一告警收集机中没有设置有上报标识的第二告警产生消息,并分别产生对应的第二告警清除消息上报至操作维护中心;初始化所述第一告警收集机。
在本发明实施例中,由于第一告警收集机只是起到过渡辅助的作用,当第一收集机中设置的定时器到时时,会清除该第一告警收集机中的告警消息,释放该第一告警收集机,以供其他外围单板继续使用。其中,清除第一告警收集机中的告警消息,具体可以为,对于第一告警收集机中没有设置上报标识的第二告警产生消息,说明发出该第二告警产生消息的单板在复位后处于正常状态,此时复位后的单板是不会单独去上报一个告警清除消息的,所以就需要告警主控来负责清除该第二告警产生消息,并产生第二清除消息上报至OMC中;而对于第一告警收集机中设置了上报标识的第二告警产生消息,说明发出该告警产生消息的单板在复位后仍处于异常状态,此时复位单板已经向OMC上报过告警清理消息,因此不需要再生成告警清理消息上报至OMC,只需要直接删除该设置了上报标识的告警消息即可。因此,当所述定时器到时时,告警主控会对第一告警收集机作如下处理:对第一告警收集机中没有设置上报标识的第二告警产生消息进行清除,并产生相应的第二告警清除消息上报至OMC;而对于该收集机中的已经设置了上报标识的第二告警产生消息仅做清除处理,然后初始化此第一告警收集机。
其中,初始化第一告警收集机的方式可以为释放该第一收集机的内存,以便可以后续被分配给其他复位或者新启动的外围单板继续使用。
在本发明实施例中,对单板复位后所属的告警代理对应的告警收集机设置预设标识,当接收到告警消息后首先在具有预设标识的告警处理机中查找,并根据查找结果判断是否需要将该告警消息上报至OMC,减轻了网元和OMC间的消息通信压力,提高了OMC的告警处理效率和处理性能。此外,由于在单板复位前后一直处于故障态的故障对象的告警消息在OMC上所呈现的上报时间不被更新,确保网络运维人员所观察到的告警上报时间是初次故障发生时间,进而对故障进行准确派单,提高故障处理效率,降低设备维护成本。
对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
参照图4,示出了本发明实施例的一种告警消息的处理装置实施例的结构框图,所述告警消息由单板生成,所述单板将所述告警消息传送至告警代理,由所述告警代理发送至告警主控,所述告警代理与一个或多个告警收集机关联,所述装置可以包括以下模块:
告警消息接收模块401,用于接收告警代理上报的告警消息,所述告警消息包括第一告警产生消息;
定位模块402,用于定位第一告警收集机,所述第一告警收集机中存储有第二告警产生消息,所述第二告警产生消息为所述单板在复位前上报的告警产生消息;
第一判断模块403,用于判断所述第一告警收集机中是否存在与所述第一告警产生消息相同的第二告警产生消息;
第一告警消息添加模块404,用于在存在所述相同的第二告警产生消息时,将所述第一告警产生消息添加到所述告警代理对应的第二告警收集机中;
第二判断模块405,用于在不存在所述相同的第二告警产生消息时,判断第三告警收集机中是否存在与所述第一告警产生消息相同的第三告警产生消息,所述第三告警收集机中存储有没有发生复位的单板上报的告警产生消息;
丢弃模块406,用于在所述第三告警收集机中存在所述相同的第三告警产生消息时,丢弃所述第一告警产生消息;
第二告警消息添加模块407,用于在所述第三告警收集机中不存在所述相同的第三告警产生消息时,将所述第一告警产生消息添加到第二告警收集机中,并将所述第一告警产生消息上报至操作维护中心。
在本发明的一种优选实施例中,所述告警消息还可以包括第一告警清除消息,所述装置还可以包括如下模块:
第三判断模块,用于判断所述第一告警收集机中是否存在与所述第一告警清除消息对应的第四告警产生消息;
第一删除模块,用于在存在所述对应的第四告警产生消息时,在第三告警收集机中查找所述第一告警清除消息对应的第五告警产生消息,在找到所述第五告警产生消息时删除所述第五告警产生消息,并将所述第一告警清除消息上报至操作维护中心中;
第二删除模块,用于在不存在所述对应的第四告警产生消息时,在第三告警收集机中查找所述第一告警清除消息对应的第六告警产生消息,在找到所述第六告警产生消息时删除所述第六告警产生消息,并将所述第一告警清除消息上报至操作维护中心中。
在本发明的一种优选实施例中,所述装置还可以包括如下模块:
上报标识添加模块,用于在所述第一告警收集机中存在与所述第一告警产生消息相同的第二告警产生消息时,为所述相同的第二告警产生消息设置上报标识。
在本发明的一种优选实施例中,所述装置还可以包括如下模块:
物理地址获取模块,用于在接收告警代理上报的告警消息之前,当监控到单板发生复位时,获取所述单板对应的告警代理的物理地址;
第一告警收集机查找模块,用于在预设映射表中查找所述告警代理的物理地址,获得与所述告警代理对应的第一告警收集机;
定时器启动模块,用于启动所述第一告警收集机的定时器。
在本发明的一种优选实施例中,所述第一告警收集机设置有预设标识,所述告警主控依据所述预设标识定位第一告警收集机。
在本发明的一种优选实施例中,所述装置还可以包括如下模块:
第三删除模块,用于在所述定时器到时时,将所述第一告警收集机中的设置有上报标识的第二告警产生消息删除;
第四删除模块,用于将所述第一告警收集机中没有设置有上报标识的第二告警产生消息删除,并分别产生对应的第二告警清除消息上报至操作维护中心;
初始化模块,用于初始化所述第一告警收集机。
在本发明的一种优选实施例中,所述装置还可以包括如下模块:
告警响应消息返回模块,用于在接收到告警消息后,向所述告警代理返回告警响应消息。
对于图4所示的装置实施例而言,由于其与前述方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
参照图5,示出了本发明实施例的一种告警消息的处理系统实施例的结构框图,所述系统可以包括外围单板501,主控全局板502、操作维护中心503,
其中,所述外围单板501可以包括如下模块:
告警监控模块,用于在检测到外围单板中的故障产生或故障消除时,生成告警消息,并向告警代理模块发送所述告警消息;
告警代理模块,用于将所述告警消息发送至主控全局板;
所述主控全局板502可以包括如下模块:
告警接收模块,用于为告警代理模块分配对应的告警收集机,将接收到的告警消息存储在告警代理对应的告警收集机中,并定位第一告警收集机,所述第一告警收集机中存储有第二告警产生消息,所述第二告警产生消息为所述单板在复位前上报的告警产生消息;
告警判断模块,用于在所述告警消息为告警产生消息时,判断所述第一告警收集机中是否存在与所述第一告警产生消息相同的第二告警产生消息,若是,则将所述第一告警产生消息添加到所述告警代理对应的第二告警收集机中;若否,则判断第三告警收集机中是否存在与所述第一告警产生消息相同的第三告警产生消息,所述第三告警收集机中存储有没有发生复位的单板上报的告警产生消息;若所述第三告警收集机中存在所述相同的第三告警产生消息,则丢弃所述第一告警产生消息;若所述第三告警收集机中不存在所述相同的第三告警产生消息,则将所述第一告警产生消息添加到第二告警收集机中,并将所述第一告警产生消息上报至告警上报模块;
告警上报模块,用于将所述告警消息上报到操作维护中心;
所述操作维护中心503,用于根据所述告警消息进行告警处理。
在本发明的一种优选实施例中,所述告警判断模块还可以用于:
在所述告警消息为告警清除消息时,判断所述第一告警收集机中是否存在与所述第一告警清除消息对应的第四告警产生消息;若是,则在第三告警收集机中查找所述第一告警清除消息对应的第五告警产生消息,在找到所述第五告警产生消息时删除所述第五告警产生消息,并将所述第一告警清除消息上报至告警上报模块;若否,则在第三告警收集机中查找所述第一告警清除消息对应的第六告警产生消息,在找到所述第六告警产生消息时删除所述第六告警产生消息,并将所述第一告警清除消息上报至告警上报模块。
在本发明的一种优选实施例中,所述主控全局板还可以包括:
定时器设置模块,用于为所述第一收集机设置定时器。
在本发明的一种优选实施例中,所述主控全局板还可以包括:
告警消息清除模块,用于当所述定时器到时时,将所述第一告警收集机中的设置有上报标识的第二告警产生消息删除;将所述第一告警收集机中没有设置有上报标识的第二告警产生消息删除,并分别产生对应的第二告警清除消息上报至告警上报模块。;
初始化模块,用于初始化所述第一告警收集机。
对于图5所示的系统实施例而言,由于其与前述方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
参照图6,示出了本发明实施例的一种主控全局板实施例的结构框图,所述主控全局板可以包括如下模块:
告警接收模块601,用于为告警代理模块分配对应的告警收集机,将接收到的告警消息存储在告警代理对应的告警收集机中,并定位第一告警收集机,所述第一告警收集机中存储有第二告警产生消息,所述第二告警产生消息为所述单板在复位前上报的告警产生消息;
告警判断模块602,用于在所述告警消息为告警产生消息时,判断所述第一告警收集机中是否存在与所述第一告警产生消息相同的第二告警产生消息,若是,则将所述第一告警产生消息添加到所述告警代理对应的第二告警收集机中;若否,则判断第三告警收集机中是否存在与所述第一告警产生消息相同的第三告警产生消息,所述第三告警收集机中存储有没有发生复位的单板上报的告警产生消息;若所述第三告警收集机中存在所述相同的第三告警产生消息,则丢弃所述第一告警产生消息;若所述第三告警收集机中不存在所述相同的第三告警产生消息,则将所述第一告警产生消息添加到第二告警收集机中,并将所述第一告警产生消息上报至告警上报模块;
告警上报模块603,用于将所述告警消息上报到操作维护中心。
在本发明的一种优选实施例中,所述告警判断模块602还可以用于:
在所述告警消息为告警清除消息时,判断所述第一告警收集机中是否存在与所述第一告警清除消息对应的第四告警产生消息;若是,则在第三告警收集机中查找所述第一告警清除消息对应的第五告警产生消息,在找到所述第五告警产生消息时删除所述第五告警产生消息,并将所述第一告警清除消息上报至告警上报模块;若否,则在第三告警收集机中查找所述第一告警清除消息对应的第六告警产生消息,在找到所述第六告警产生消息时删除所述第六告警产生消息,并将所述第一告警清除消息上报至告警上报模块。
在本发明的一种优选实施例中,所述主控全局板还可以包括:
定时器设置模块,用于为所述第一收集机设置定时器。
在本发明的一种优选实施例中,所述主控全局板还可以包括:
告警消息清除模块,用于当所述定时器到时时,将所述第一告警收集机中的设置有上报标识的第二告警产生消息删除;将所述第一告警收集机中没有设置有上报标识的第二告警产生消息删除,并分别产生对应的第二告警清除消息上报至告警上报模块;;
初始化模块,用于初始化所述第一告警收集机。
对于图6所示的实施例而言,由于其与前述方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
参照图7,示出了本发明实施例的一种外围单板实施例的结构框图,所述外围单板可以包括如下模块:
告警监控模块701,用于在检测到外围单板中的故障产生或故障消除时,生成告警消息,并向告警代理模块发送所述告警消息;
告警代理模块702,用于将所述告警消息发送至主控全局板。
对于图7所示的实施例而言,由于其与前述方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者移动设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者移动设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者移动设备中还存在另外的相同要素。
以上对本发明实施例所提供的告警消息的处理方法、装置、系统以及设备,进行了详细介绍,本文中应用了具体个例对本发明实施例的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明实施例的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明实施例的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明实施例的限制。

Claims (19)

1.一种告警消息的处理方法,其特征在于,所述告警消息由单板生成,所述单板将所述告警消息传送至告警代理,由所述告警代理发送至告警主控,所述告警代理与一个或多个告警收集机关联,所述方法包括:
告警主控接收告警代理上报的告警消息,所述告警消息包括第一告警产生消息;
告警主控定位第一告警收集机,所述第一告警收集机中存储有第二告警产生消息,所述第二告警产生消息为所述单板在复位前上报的告警产生消息;
告警主控判断所述第一告警收集机中是否存在与所述第一告警产生消息相同的第二告警产生消息;
若是,则告警主控将所述第一告警产生消息添加到所述告警代理对应的第二告警收集机中;
若否,则告警主控判断第三告警收集机中是否存在与所述第一告警产生消息相同的第三告警产生消息,所述第三告警收集机中存储有没有发生复位的单板上报的告警产生消息;
若所述第三告警收集机中存在所述相同的第三告警产生消息,则告警主控丢弃所述第一告警产生消息;
若所述第三告警收集机中不存在所述相同的第三告警产生消息,则告警主控将所述第一告警产生消息添加到第二告警收集机中,并将所述第一告警产生消息上报至操作维护中心。
2.根据权利要求1所述的方法,其特征在于,所述告警消息还包括第一告警清除消息,所述方法还包括:
告警主控判断所述第一告警收集机中是否存在与所述第一告警清除消息对应的第四告警产生消息;
若是,则告警主控在第三告警收集机中查找所述第一告警清除消息对应的第五告警产生消息,在找到所述第五告警产生消息时删除所述第五告警产生消息,并将所述第一告警清除消息上报至操作维护中心中;
若否,则告警主控在第三告警收集机中查找所述第一告警清除消息对应的第六告警产生消息,在找到所述第六告警产生消息时删除所述第六告警产生消息,并将所述第一告警清除消息上报至操作维护中心中。
3.根据权利要求1或2所述的方法,其特征在于,还包括:
若所述第一告警收集机中存在与所述第一告警产生消息相同的第二告警产生消息,为所述相同的第二告警产生消息设置上报标识。
4.根据权利要求3所述的方法,其特征在于,在告警主控接收告警代理上报的告警消息步骤之前,还包括:
当监控到单板发生复位时,获取所述单板对应的告警代理的物理地址;
在预设映射表中查找所述告警代理的物理地址,获得与所述告警代理对应的第一告警收集机;
启动所述第一告警收集机的定时器。
5.根据权利要求1或2或4所述的方法,其特征在于,所述第一告警收集机设置有预设标识,所述告警主控依据所述预设标识定位第一告警收集机。
6.根据权利要求4所述的方法,其特征在于,还包括:
当所述定时器到时时,将所述第一告警收集机中的设置有上报标识的第二告警产生消息删除;
将所述第一告警收集机中没有设置有上报标识的第二告警产生消息删除,并分别产生对应的第二告警清除消息上报至操作维护中心;
初始化所述第一告警收集机。
7.根据权利要求1所述的方法,其特征在于,还包括:
告警主控在接收到告警消息后,向所述告警代理返回告警响应消息。
8.一种告警消息的处理装置,其特征在于,所述告警消息由单板生成,所述单板将所述告警消息传送至告警代理,由所述告警代理发送至告警主控,所述告警代理与一个或多个告警收集机关联,所述装置包括:
告警消息接收模块,用于接收告警代理上报的告警消息,所述告警消息包括第一告警产生消息;
定位模块,用于定位第一告警收集机,所述第一告警收集机中存储有第二告警产生消息,所述第二告警产生消息为所述单板在复位前上报的告警产生消息;
第一判断模块,用于判断所述第一告警收集机中是否存在与所述第一告警产生消息相同的第二告警产生消息;
第一告警消息添加模块,用于在存在所述相同的第二告警产生消息时,将所述第一告警产生消息添加到所述告警代理对应的第二告警收集机中;
第二判断模块,用于在不存在所述相同的第二告警产生消息时,判断第三告警收集机中是否存在与所述第一告警产生消息相同的第三告警产生消息,所述第三告警收集机中存储有没有发生复位的单板上报的告警产生消息;
丢弃模块,用于在所述第三告警收集机中存在所述相同的第三告警产生消息时,丢弃所述第一告警产生消息;
第二告警消息添加模块,用于在所述第三告警收集机中不存在所述相同的第三告警产生消息时,将所述第一告警产生消息添加到第二告警收集机中,并将所述第一告警产生消息上报至操作维护中心。
9.根据权利要求8所述的装置,其特征在于,所述告警消息还包括第一告警清除消息,所述装置还包括:
第三判断模块,用于判断所述第一告警收集机中是否存在与所述第一告警清除消息对应的第四告警产生消息;
第一删除模块,用于在存在所述对应的第四告警产生消息时,在第三告警收集机中查找所述第一告警清除消息对应的第五告警产生消息,在找到所述第五告警产生消息时删除所述第五告警产生消息,并将所述第一告警清除消息上报至操作维护中心中;
第二删除模块,用于在不存在所述对应的第四告警产生消息时,在第三告警收集机中查找所述第一告警清除消息对应的第六告警产生消息,在找到所述第六告警产生消息时删除所述第六告警产生消息,并将所述第一告警清除消息上报至操作维护中心中。
10.根据权利要求8或9所述的装置,其特征在于,还包括:
上报标识添加模块,用于在所述第一告警收集机中存在与所述第一告警产生消息相同的第二告警产生消息时,为所述相同的第二告警产生消息设置上报标识。
11.根据权利要求10所述的装置,其特征在于,还包括:
物理地址获取模块,用于在接收告警代理上报的告警消息之前,当监控到单板发生复位时,获取所述单板对应的告警代理的物理地址;
第一告警收集机查找模块,用于在预设映射表中查找所述告警代理的物理地址,获得与所述告警代理对应的第一告警收集机;
定时器启动模块,用于启动所述第一告警收集机的定时器。
12.根据权利要求8或9或11所述的装置,其特征在于,所述第一告警收集机设置有预设标识,所述告警主控依据所述预设标识定位第一告警收集机。
13.根据权利要求11所述的装置,其特征在于,还包括:
第三删除模块,用于在所述定时器到时时,将所述第一告警收集机中的设置有上报标识的第二告警产生消息删除;
第四删除模块,用于将所述第一告警收集机中没有设置有上报标识的第二告警产生消息删除,并分别产生对应的第二告警清除消息上报至操作维护中心;
初始化模块,用于初始化所述第一告警收集机。
14.根据权利要求8所述的装置,其特征在于,还包括:
告警响应消息返回模块,用于在接收到告警消息后,向所述告警代理返回告警响应消息。
15.一种告警消息的处理系统,其特征在于,所述处理系统包括外围单板,主控全局板、操作维护中心,
其中,所述外围单板包括:
告警监控模块,用于在检测到外围单板中的故障产生或故障消除时,生成告警消息,并向告警代理模块发送所述告警消息;
告警代理模块,用于将所述告警消息发送至主控全局板;
所述主控全局板包括:
告警接收模块,用于为告警代理模块分配对应的告警收集机,将接收到的告警消息存储在告警代理对应的告警收集机中,并定位第一告警收集机,所述第一告警收集机中存储有第二告警产生消息,所述第二告警产生消息为所述外围单板在复位前上报的告警产生消息;
告警判断模块,用于在所述告警消息为告警产生消息时,判断所述第一告警收集机中是否存在与第一告警产生消息相同的第二告警产生消息,若是,则将所述第一告警产生消息添加到所述告警代理模块对应的第二告警收集机中;若否,则判断第三告警收集机中是否存在与所述第一告警产生消息相同的第三告警产生消息,所述第三告警收集机中存储有没有发生复位的外围单板上报的告警产生消息;若所述第三告警收集机中存在所述相同的第三告警产生消息,则丢弃所述第一告警产生消息;若所述第三告警收集机中不存在所述相同的第三告警产生消息,则将所述第一告警产生消息添加到第二告警收集机中,并将所述第一告警产生消息上报至告警上报模块;
告警上报模块,用于将所述告警消息上报到操作维护中心;
所述操作维护中心,用于根据所述告警消息进行告警处理。
16.根据权利要求15所述的系统,其特征在于,所述告警判断模块用于:
在所述告警消息为告警清除消息时,判断所述第一告警收集机中是否存在与第一告警清除消息对应的第四告警产生消息;若是,则在第三告警收集机中查找所述第一告警清除消息对应的第五告警产生消息,在找到所述第五告警产生消息时删除所述第五告警产生消息,并将所述第一告警清除消息上报至告警上报模块;若否,则在第三告警收集机中查找所述第一告警清除消息对应的第六告警产生消息,在找到所述第六告警产生消息时删除所述第六告警产生消息,并将所述第一告警清除消息上报至告警上报模块。
17.根据权利要求15或16所述的系统,其特征在于,所述主控全局板还包括:
定时器设置模块,用于为所述第一告警收集机设置定时器。
18.根据权利要求17所述的系统,其特征在于,所述主控全局板还包括:
告警消息清除模块,用于当所述定时器到时时,将所述第一告警收集机中的设置有上报标识的第二告警产生消息删除;将所述第一告警收集机中没有设置有上报标识的第二告警产生消息删除,并分别产生对应的第二告警清除消息上报至告警上报模块;
初始化模块,用于初始化所述第一告警收集机。
19.一种主控全局板,其特征在于,包括:
告警接收模块,用于为告警代理模块分配对应的告警收集机,将接收到的告警消息存储在告警代理对应的告警收集机中,并定位第一告警收集机,所述第一告警收集机中存储有第二告警产生消息,所述第二告警产生消息为外围单板在复位前上报的告警产生消息;
告警判断模块,用于在所述告警消息为告警产生消息时,判断所述第一告警收集机中是否存在与第一告警产生消息相同的第二告警产生消息,若是,则将所述第一告警产生消息添加到所述告警代理模块对应的第二告警收集机中;若否,则判断第三告警收集机中是否存在与所述第一告警产生消息相同的第三告警产生消息,所述第三告警收集机中存储有没有发生复位的外围单板上报的告警产生消息;若所述第三告警收集机中存在所述相同的第三告警产生消息,则丢弃所述第一告警产生消息;若所述第三告警收集机中不存在所述相同的第三告警产生消息,则将所述第一告警产生消息添加到第二告警收集机中,并将所述第一告警产生消息上报至告警上报模块;
告警上报模块,用于将所述告警消息上报到操作维护中心。
CN201310658874.1A 2013-12-06 2013-12-06 告警消息的处理方法、装置、系统以及设备 Active CN103684862B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310658874.1A CN103684862B (zh) 2013-12-06 2013-12-06 告警消息的处理方法、装置、系统以及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310658874.1A CN103684862B (zh) 2013-12-06 2013-12-06 告警消息的处理方法、装置、系统以及设备

Publications (2)

Publication Number Publication Date
CN103684862A CN103684862A (zh) 2014-03-26
CN103684862B true CN103684862B (zh) 2017-09-22

Family

ID=50321243

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310658874.1A Active CN103684862B (zh) 2013-12-06 2013-12-06 告警消息的处理方法、装置、系统以及设备

Country Status (1)

Country Link
CN (1) CN103684862B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112422304B (zh) * 2019-08-21 2021-11-26 大唐移动通信设备有限公司 一种告警处理方法和装置
CN111143127B (zh) * 2019-12-23 2023-09-26 杭州迪普科技股份有限公司 监管网络设备的方法、装置、存储介质及设备
CN112565009A (zh) * 2020-11-27 2021-03-26 中盈优创资讯科技有限公司 一种基于自定义性能阈值告警规则的处理方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101136799A (zh) * 2007-09-20 2008-03-05 中兴通讯股份有限公司 一种实现通讯设备故障集中告警处理的方法
CN101159634A (zh) * 2007-10-25 2008-04-09 中兴通讯股份有限公司 一种告警恢复消息上报方法
CN101499935A (zh) * 2008-01-30 2009-08-05 中兴通讯股份有限公司 一种WiMAX基站的告警处理方法
CN102263674A (zh) * 2010-05-26 2011-11-30 大唐移动通信设备有限公司 告警上报方法、系统和设备
CN103281209A (zh) * 2013-06-05 2013-09-04 大唐移动通信设备有限公司 一种告警信息的处理方法及设备

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2310611T3 (es) * 2002-11-06 2009-01-16 Telefonaktiebolaget Lm Ericsson (Publ) Un medio y un metodo relacionados con la optimizacion del funcionamiento y planificacion de redes.

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101136799A (zh) * 2007-09-20 2008-03-05 中兴通讯股份有限公司 一种实现通讯设备故障集中告警处理的方法
CN101159634A (zh) * 2007-10-25 2008-04-09 中兴通讯股份有限公司 一种告警恢复消息上报方法
CN101499935A (zh) * 2008-01-30 2009-08-05 中兴通讯股份有限公司 一种WiMAX基站的告警处理方法
CN102263674A (zh) * 2010-05-26 2011-11-30 大唐移动通信设备有限公司 告警上报方法、系统和设备
CN103281209A (zh) * 2013-06-05 2013-09-04 大唐移动通信设备有限公司 一种告警信息的处理方法及设备

Also Published As

Publication number Publication date
CN103684862A (zh) 2014-03-26

Similar Documents

Publication Publication Date Title
CN101312405B (zh) 一种告警处理方法及网管系统
US7287193B2 (en) Methods, systems, and media to correlate errors associated with a cluster
CN111193605B (zh) 一种故障定位方法、装置及存储介质
CN106856489A (zh) 一种分布式存储系统的服务节点切换方法和装置
WO2004039004A1 (fr) Procede de traitement d'alerte dans un reseau de communications et gestionnaire d'analyse de relativite
EP1150455A2 (en) Root cause analysis in a distributed network management architecture
CN100388218C (zh) 一种在服务器之间实现备份的方法
CN105183619B (zh) 一种系统故障预警方法和系统
CN101883028A (zh) 网络文件系统服务器的检测方法及装置
CN103684862B (zh) 告警消息的处理方法、装置、系统以及设备
CN113973042B (zh) 用于网络问题的根本原因分析的方法和系统
CN107222356A (zh) 一种云监控系统告警方法和系统
CN106021070A (zh) 服务器集群监测方法及装置
CN108776579A (zh) 一种分布式存储集群扩容方法、装置、设备及存储介质
CN107769943A (zh) 一种主备集群切换的方法和设备
CN101022638A (zh) 一种告警上报方法和告警装置
CN106656568A (zh) 一种告警同步拓扑显示的方法及装置
CN106161126A (zh) 告警的测试处理方法及装置
CN102196472A (zh) 网元异常告警方法、装置及系统
CN113285840B (zh) 存储网络故障根因分析方法及计算机可读存储介质
JP2006025434A (ja) 大容量障害相関システム及び方法
CN101741618A (zh) 一种数据通信设备进行业务处理的方法及数据通信设备
CN106817238A (zh) 虚拟机修复方法、虚拟机装置、系统及业务功能网元
CN104346246B (zh) 故障预测方法和装置
JP2017521802A (ja) スーパーコンピュータ監視用の相関イベントのためのアーキテクチャ

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant