CN101958804A - 提升告警处理效率的方法、服务器及系统 - Google Patents

提升告警处理效率的方法、服务器及系统 Download PDF

Info

Publication number
CN101958804A
CN101958804A CN2010102881975A CN201010288197A CN101958804A CN 101958804 A CN101958804 A CN 101958804A CN 2010102881975 A CN2010102881975 A CN 2010102881975A CN 201010288197 A CN201010288197 A CN 201010288197A CN 101958804 A CN101958804 A CN 101958804A
Authority
CN
China
Prior art keywords
alarm
warning information
information
processing
network element
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2010102881975A
Other languages
English (en)
Other versions
CN101958804B (zh
Inventor
郭慧峰
张伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN201010288197.5A priority Critical patent/CN101958804B/zh
Priority to PCT/CN2010/079942 priority patent/WO2012037760A1/zh
Publication of CN101958804A publication Critical patent/CN101958804A/zh
Application granted granted Critical
Publication of CN101958804B publication Critical patent/CN101958804B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Debugging And Monitoring (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明涉及一种提升告警处理效率的方法、服务器及系统,其中方法包括:定时接收携带有网元标识符的告警信息,将告警信息按照该告警信息上报的先后顺序依次放入待处理告警队列;告警信息包括告警产生信息或告警消失信息;根据告警信息携带的网元标识符及预定规则对待处理告警队列中的告警信息进行并行线程批处理。本发明通过从告警服务器使用预定的时间延迟来收集告警信息,然后将告警信息批量送往主告警服务器,增强了主告警服务器的批处理能力;同时,在主告警服务器中,根据预定规则实现多线程并行处理,大大提升了告警处理的并行性,从而提升了网管告警的处理效率。

Description

提升告警处理效率的方法、服务器及系统
技术领域
本发明涉及网络管理技术领域,尤其涉及一种应用于网管系统中的提升告警处理效率的方法、服务器及系统。
背景技术
目前,传输网管中告警管理的核心功能是对来自网元硬件设备或路径结点的告警进行实时监控、报告和存储。当网元设备检测到故障后,上报告警产生信息给网管,当故障恢复后,上报告警消失信息给网管,网管需对这些告警信息进行及时处理并展现。
网管系统中的告警管理功能必须保证告警信息处理的准确性与及时性,对于同一网元的告警,其告警产生与告警消失具有时序要求,网管必须先处理告警产生信息再处理告警消失信息才能保证网管系统告警信息处理的准确性。
传统处理告警信息的方法为串行处理方式,该方法在告警量小时可满足处理需求,但是,随着网络管理规模的不断扩大,网管中的设备多达几千台,需要处理的告警数据量很大,而且新一代的网管要求当前告警数据和历史告警数据均需入网管数据库,由此使得告警处理流程中与数据库的交互比例增大,而传统的串行处理方式势必造成告警处理的延迟加大,降低了告警处理效率,不能满足用户对网管系统高性能的需求。
发明内容
本发明的主要目的在于提供一种提升告警处理效率的方法、服务器及系统,旨在提升网管系统中告警的处理效率。
本发明提出一种提升告警处理效率的方法,包括:
定时接收携带有网元标识符的告警信息,将所述告警信息按照该告警信息上报的先后顺序依次放入待处理告警队列;
根据所述告警信息携带的网元标识符及预定规则对所述待处理告警队列中的告警信息进行并行线程批处理。
优选地,所述根据告警信息携带的网元标识符及预定规则对所述待处理告警队列中的告警信息进行并行线程批处理的步骤具体包括:
当预设的n个工作线程中有空闲工作线程时,访问当前待处理告警队列中的第一条告警信息;
将该条告警携带的网元标识符除以n,得到余数i;
判断i号工作线程是否空闲;
若i号工作线程空闲,则将当前待处理告警队列中所有余数为i的告警信息取出,构成一告警处理任务,调度至i号工作线程进行处理;并返回步骤当预设的n个工作线程中有空闲工作线程时,访问当前待处理告警队列中的第一条告警信息;
若i号工作线程忙,则访问当前待处理告警队列内下一条告警信息,并返回步骤将该条告警信息携带的网元标识符除以n,得到余数i。
优选地,所述根据告警信息携带的网元标识符及预定规则对所述待处理告警队列中的告警信息进行并行线程批处理的步骤进一步包括:
当预设的n个工作线程均无空闲时,暂停预定时间后执行步骤当预设的n个工作线程中有空闲工作线程时,访问当前待处理告警队列中的第一条告警信息。
优选地,i号工作线程对告警处理任务进行处理的步骤具体包括:
批处理当前告警处理任务中各网元第一个告警消失信息之前的所有对应网元的告警产生信息;
将处理过的告警产生信息从当前告警处理任务中删除,将处理过的告警产生消息入网管数据库;
批处理当前告警处理任务中各网元第一个告警产生信息之前的所有对应网元的告警消失信息;
将处理过的告警消失信息从当前告警处理任务中删除,将处理过的告警消失消息入网管数据库;并返回步骤批处理当前告警处理任务中各网元第一个告警消失信息之前的所有对应网元的告警产生信息。
本发明提出一种提升告警处理效率的服务器,包括:
接收模块,用于定时接收携带有网元标识符的告警信息,将所述告警信息按照该告警信息上报的先后顺序依次放入待处理告警队列;告警批处理模块,用于根据所述告警信息携带的网元标识符及预定规则对所述待处理告警队列中的告警信息进行并行线程批处理。
优选地,所述告警批处理模块包括:
访问单元,用于当预设的n个工作线程中有空闲工作线程时,访问当前待处理告警队列中的第一条告警信息;以及当i号工作线程忙时,访问当前待处理告警队列内下一条告警信息;
计算单元,用于将该条告警信息携带的网元标识符除以n,得到余数i;
判断单元,用于判断i号工作线程是否空闲;
线程调度处理单元,用于当i号工作线程空闲时,将当前待处理告警队列中所有余数为i的告警信息取出,构成一告警处理任务,调度至i号工作线程进行处理。
优选地,所述线程调度处理单元还用于当预设的n个工作线程均无空闲时,暂停预定时间。
优选地,所述线程调度处理单元包括:
批处理子单元,用于批处理当前告警处理任务中各网元第一个告警消失信息之前的所有对应网元的告警产生信息;以及批处理当前告警处理任务中各网元第一个告警产生信息之前的所有对应网元的告警消失信息;
删除子单元,用于将处理过的告警产生信息从当前告警处理任务中删除;以及将处理过的告警消失信息从当前告警处理任务中删除。
本发明还提出一种提升告警处理效率的系统,包括:
从告警服务器,用于接收网元发送的携带有所述网元标识符的告警信息,对所述告警信息进行数据转换以及分类处理后定时上报给主告警服务器;所述主告警服务器,用于定时接收所述告警信息,将所述告警信息按照该告警信息上报的先后顺序依次放入待处理告警队列,根据所述告警信息携带的网元标识符及预定规则对所述告警队列中的告警信息进行并行线程批处理。
优选地,所述主告警服务器为如上所述的服务器。
本发明提出一种提升告警处理效率的方法、服务器及系统,通过主从告警服务器使用预定的时间延迟(通常可以预设为1秒)来收集告警信息,然后将告警信息批量送往主告警服务器,增强了主告警服务器的批处理能力;同时,在主告警服务器中,根据预定规则实现多线程并行处理,大大提升了告警处理的并行性,提高了网管告警的处理效率。
附图说明
图1是本发明提升告警处理效率的方法一实施例流程示意图;
图2是本发明提升告警处理效率的方法一实施例中根据标识符及预定规则对待处理告警队列中的告警信息进行并行线程批处理的具体流程示意图;
图3是本发明提升告警处理效率的方法一实施例中i号工作线程对告警处理任务进行处理的具体流程示意图;
图4是本发明提升告警处理效率的服务器一实施例结构示意图;
图5是本发明提升告警处理效率的服务器一实施例中告警批处理模块具体结构示意图;
图6是本发明提升告警处理效率的服务器一实施例中线程调度处理单元具体结构示意图;
图7是本发明提升告警处理效率的系统一实施例结构示意图。
为了使本发明的技术方案更加清楚、明了,下面将结合附图作进一步详述。
具体实施方式
本发明实施例解决方案主要是根据预设的工作线程以及各网元的标识符对网元上报的告警信息进行并行线程批处理。本发明可以应用于网管系统等需要处理告警信息的网络系统中,以下以本发明应用于网管系统为例说明本发明的技术方案,但不限于应用于网管系统的情形。
如图1所示,本发明一实施例提出一种提升告警处理效率的方法,包括:
步骤S101,定时接收携带有网元标识符的告警信息,将告警信息按照该告警信息上报的先后顺序依次放入待处理告警队列;
本实施例方法运行环境包括一接收告警信息的从告警服务器和对告警信息进行并行线程处理的主告警服务器,其中,从告警服务器可通过网管适配器接收告警设备(本实施例称网元,以下称网元)上报的告警信息,网管适配器负责将网元上报的告警数据转换成网管可识别的报文,然后上报给从告警服务器。
之后,从告警服务器按照各告警信息上报的顺序依次为每条告警信息进行分类,告警信息分为告警产生信息和告警消失信息。在进行分类时,从告警服务器依次为每条告警信息贴上处理类型标签,比如告警信息ME{1}ANew是ALARM_NEW,表示的是网元1的告警产生信息上报,ME{1}BClear是ALARM_CLEAR,表示的是网元1的告警消失信息上报,其中括号里的数字表示该网元在网管中的唯一标识符,字母A、B、C等代表该告警信息的标识。然后每隔一段时间(该时间可以预设,通常为1秒),从告警服务器将收集到的告警信息批量上报给主告警服务器。
在本实施例中,从告警服务器之所以要使用一段时间延迟来收集告警信息,其目的是为了增强主告警服务器批量处理告警信息的能力。
本实施例中主告警服务器设置有一个待处理告警队列,用于接收从告警服务器定时批量上报的待处理的告警信息。主告警服务器接收到携带有网元标识符的告警信息后,将告警信息按照该告警信息上报的先后顺序依次放入待处理告警队列中。
步骤S102,根据告警信息携带的网元标识符及预定规则对待处理告警队列中的告警信息进行并行线程批处理。
在本实施例中,对于告警信息处理而言,同一个网元产生或消失的告警信息具有时序上的要求,但不同网元的告警信息没有时序要求,所以只要保证同一个网元的告警信息在同一个工作线程进行处理,即可满足时序上的要求,而不同网元的告警信息可以进行多线程处理,即可提升告警处理效率。
因此,本实施例在主告警服务器中,可以预先设置n个工作线程(0号工作线程、1号工作线程......n-1号工作线程)并行执行告警处理任务,并设置一个专门的调度线程执行模块A,用来从缓存区中构造告警处理的任务,并将各告警处理任务调度到n个工作线程中进行处理。
本实施例中,预定规则即是通过网元标识符与设置的工作线程的数量n之间的对应关系确定处理该网元的告警信息为n个工作线程中的哪一个,告警信息按所属网元进行分类,具体以网元唯一标识符来进行分类,上述预定规则可以为:若网元标识符除以n所得的余数以i表示,则设定该网元的告警信息固定在i号工作线程处理。其中主告警服务器批处理告警信息的流程如图2所示。
如图2所示,步骤S102具体包括:
步骤S1021,判断待处理告警队列中的告警信息数是否为0,若是,则进入步骤S1029;否则,进入步骤S1022;
步骤S1022,判断预设的n个工作线程中是否有空闲工作线程,若是,则进入步骤S1023;否则,进入步骤S1029;
步骤S1023,访问当前待处理告警队列中的第一条告警信息;
步骤S1024,将该条告警信息携带的网元标识符除以n,得到余数i;
i为0~n-1中任意整数。
步骤S1025,判断i号线工作线程是否空闲,若是,则进入步骤S1026;否则,进入步骤S1027;
步骤S1026,将当前待处理队列中所有余数为i的告警信息取出,构成一告警处理任务,调度至i号工作线程进行处理;返回步骤S1021;
步骤S1027,判断有无下一条告警信息,若有,则进入步骤S1028;否则,进入步骤S1029;
步骤S1028,访问当前待处理告警队列内下一条告警信息,并进入步骤S1024;
步骤S1029,暂停预定时间,返回步骤S1021。
如图3所示,步骤S1026中i号工作线程对告警处理任务进行处理的步骤具体包括:
步骤S10261,判断当前告警处理任务中的告警信息数是否为0,若是,则结束流程;否则,进入步骤步骤S10262;
步骤S10262,批处理当前告警处理任务中各网元第一个告警消失信息之前的所有对应网元的告警产生信息;
本步骤中,将每一个网元中对应第一个告警消失消息之前的该网元的所有告警产生信息取出来,将所有取出来的告警产生信息构成一个批次,进行处理。
步骤S10263,将处理过的告警产生信息从当前告警处理任务中删除,并将处理过的告警产生信息入网管数据库;
步骤S10264,批处理当前告警处理任务中各网元第一个告警产生信息之前的所有对应网元的告警消失信息;
本步骤中,将当前告警处理任务中每一个网元对应的第一个告警产生信息之前的该网元的所有告警消失信息取出来,将所有取出来的告警消失信息构成一个批次,进行处理。
本步骤中当前告警处理任务包括该工作线程中当前所有未处理的告警信息。
步骤S10265,将处理过的告警消失信息从当前告警处理任务中删除,将处理过的告警消失信息入网管数据库;返回步骤S10262。
上述步骤S10261至步骤S10265中,工作线程在对一个告警处理任务中的告警信息进行处理时,由于告警的产生和消失有时序要求,必须先处理告警产生信息后处理告警消失信息,所以对告警处理任务中的告警信息必须串行处理。为了提升对告警信息的批处理能力,对告警产生信息和告警消失信息的处理都为批处理,且处理过程按照告警产生->告警消失->告警产生->告警消失循环执行,直到所有告警信息被处理完。在保证告警数据处理正确性的情况下,告警信息的批处理应尽可能多的包含告警数据。
下面以实例详细介绍本实施例方法的工作流程:
假设目前网管管理了4台设备(即本实施例称网元),分别是ME{1}、ME{2}、ME{3}和ME{4},其中括号里的数字表示该设备的网管ID,是该设备在网管中的唯一标识符。
主告警服务器中设置了3个工作线程并行处理告警信息,分别是Thread0、Thread1和Thread2。主告警服务器中设置了1个专门的调度线程执行模块A。
根据预定规则,ME{1}的网管ID为1,1%3等于1,所以ME{1}的告警信息在Thread1号工作线程处理,ME{2}的网管ID为2,2%3等于2,所以ME{2}的告警信息在Thread2号工作线程处理,依次类推,可以得到ME{1}和ME{4}的告警信息都在Thread1号工作线程处理,ME{2}的告警信息在Thread2号工作线程处理,ME{3}的告警信息在Thread0号工作线程处理。
该实例中,若当前告警上报情况为:
10:35:20:175时刻,ME{1}上报了ME{1}ANew、ME{1}BClear、ME{1}CNew三条告警信息;
10:35:20:275时刻,ME{2}上报了ME{2}ANew、Me{2}BNew两条告警信息;
10:35:20:375时刻,ME{3}上报了ME{3}AClear一条告警信息;
10:35:20:475时刻,ME{4}上报了ME{4}ANew、ME{4}BNew、ME{4}CClear3条告警信息。
其中,10:35:20:175指某个时刻,表示10点35分20秒175毫秒。
ME{1}Anew表示该告警信息属于ME{1}设备,A是该告警信息的标识,New表示是新告警产生信息,ME{1}BClear表示该告警信息属于ME{1}设备,B是该告警信息的标识,Clear表示是告警消失信息。其它告警信息的名称依此解释。
经过适配器转换后,上述各告警信息依次上报给从告警服务器处理。其上报的顺序按告警产生的先后顺序:ME{1}ANew、ME{1}BClear、ME{1}CNew、ME{2}ANew、Me{2}BNew、ME{3}AClear、ME{4}ANew、ME{4}BNew、ME{4}CClear。
之后,从告警服务器依次对各告警信息进行分类,贴上处理类型标签标签,从告警服务器每隔1秒向主告警服务器发送一次批量告警信息,假设从告警服务器上次是在10:35:20:000时刻发送的批量告警信息,1秒的时间延迟到,10:35:21:000时刻,从告警服务器将本次新上报的告警信息一起上报到主告警服务器,即将ME{1}ANew、ME{1}BClear、ME{1}CNew、ME{2}ANew、Me{2}BNew、ME{3}AClear、ME{4}ANew、ME{4}BNew、ME{4}CClear一起发送给主告警服务器。
主告警服务器将报上来的告警信息按照各告警信息上报的先后顺序放置于待处理告警队列中,因此,当前待处理告警队列为:
{ME{1}Anew、ME{1}BClear、ME{1}CNew、ME{2}Anew、Me{2}BNew、ME{3}AClear、ME{4}Anew、ME{4}BNew、ME{4}CClear}。
负责任务调度的调度线程执行模块A对待处理告警队列中的待处理告警信息进行任务调度,其调度过程如下:
1、遍历队列中的所有告警信息,发现ME{1}Anew告警信息属于ME{1}网元,根据预定规则,1%3等于1,该告警应该在Thread1工作线程中处理,并且若此时Thread1空闲,那么将队列中所有网管ID除以3余数为1的告警信息都取出来构成一个告警处理任务,调度到Thread1中进行处理,该告警处理任务中包含的告警信息包括{ME{1}Anew、ME{1}BClear、ME{1}CNew、ME{4}Anew、ME{4}BNew和ME{4}CClear}。主告警服务器中剩余的告警信息包括{ME{2}Anew、Me{2}BNew和ME{3}AClear}。
2、调度线程执行模块A再访问剩余告警信息中的第一个告警信息,同理得到:ME{2}Anew告警属于ME{2}网元,根据预定规则,2%3等于2,该告警信息应该在Thread2工作线程中处理,并且若此时Thread2空闲,则将队列中所有网管ID除以3余数为2的告警信息都取出来构成一个告警处理任务,调度到Thread2中进行处理,该告警处理任务中包含的告警信息包括{ME{2}Anew、ME{2}BNew}。主告警服务器中剩余的告警信息包括{ME{3}AClear}。
3、调度线程执行模块A再访问剩余告警信息中的第一个告警信息,得到:ME{3}AClear告警信息属于ME{3}网元,根据预定规则,3%3等于0,该告警信息应该在Thread0工作线程中进行处理,并且若此时Thread0空闲,则将所有网元ID除以3为0的告警信息都取出来构成一个告警处理任务,调度到Thread0中进行处理,该告警处理任务中包含的告警信息包括{ME{3}AClear}。此时,主告警服务器中剩余的告警信息为空。
4、此时待处理告警队列已为空,则暂停休息1秒,再继续遍历告警信息,进行调度。
最终的调度执行结果如下表1所示:
Figure BSA00000278667800091
表1
由上表1可知,通过上述告警处理方式可达到对批量告警信息实现最大限度的并行处理效果。
下面以工作线程Thread0为例,详细描述工作线程Thread0进行告警处理的过程:
Thread0工作线程收到的告警处理任务包括的告警信息为{ME{1}Anew、ME{1}BClear、ME{1}CNew、ME{4}Anew、ME{4}BNew、ME{4}CClear}。
1、批处理告警产生消息。对告警处理任务中所有的网元,将该网元对应的第一个告警消失之前的告警产生信息都取出来进行批处理。当前任务中有两个网元,ME{1}和ME{4},ME{1}的第一个告警消失信息是ME{1}BClear,将ME{1}BClear之前的ME{1}的告警产生信息取出来进行处理,即可以把ME{1}Anew取出来,ME{4}的第一个告警消失信息是ME{4}CClear,将ME{4}CClear之前的ME{4}的告警产生信息取出来,即将ME{4}Anew和ME{4}BNew取出来,最后构成一个执行队列{ME{1}Anew、ME{4}Anew和ME{4}BNew},对其进行批处理后,在告警处理任务中删除该执行队列中的告警信息,告警数据入网管数据库。
2、批处理告警消失。此时告警处理任务中的告警信息剩余{ME{1}BClear、ME{1}CNew、ME{4}CClear}。将当前告警处理任务中所有的网元对应的第一个告警产生信息之前的告警消失信息都取出来,进行批处理。ME{1}的第一个告警产生信息是ME{1}CNew,将ME{1}CNew之前的ME{1}的告警消失信息都取出,即将ME{1}BClear取出;ME{4}已没有告警产生,则将该网元所有的告警消失信息都取出,即将ME{4}CClear取出。最后构成一个执行队列{ME{1}BClear,ME{4}CClear},对其进行批处理后,在告警处理任务中删除该执行队列中的告警信息,并将处理过的告警数据入网管数据库。
3、批处理告警产生。此时告警处理任务中的告警信息剩余{ME{1}CNew}。将当前告警处理任务中所有的网元对应的第一个告警消失信息之前的告警产生信息都取出来,进行批处理。ME{1}没有告警消失信息,则将所有的该网元的告警产生信息取出,即取出ME{1}CNew,最后构成一个执行队列{ME{1}CNew},对其进行处理后,在告警处理任务中删除该执行队列中的告警信息,并将处理过的告警数据入网管数据库。
4、此时告警处理任务中的告警信息为空,则任务执行结束;如果不为空,则继续执行批处理告警消失信息。
因此,本次告警处理任务串行执行了下列批次的告警信息:
{ME{1}Anew、ME{4}Anew、ME{4}BNew},走告警产生信息批处理流程,最后将告警数据放入网管数据库。
{ME{1}BClear,ME{4}CClear},走告警消失信息批处理流程,最后将告警数据放入网管数据库。
{ME{1}CNew},走告警产生信息批处理流程,最后将告警数据放入网管数据库。
由上述告警信息处理过程可以看到:在保证告警数据处理正确性的情况下,每个告警处理批次都最大限度的包含了尽可能多的告警数目,最大程度的提升了告警信息的批处理能力。
本实施例相比传统的告警处理方法,具有以下优点:
1、引入“主从告警服务器”,在“从告警服务器”使用一定的时间延迟(通常是1秒)来收集告警,然后批量送往“主告警服务器”,增强了“主告警服务器”的批处理能力。
2、在“主告警服务器”中,根据一定的规则实现多线程处理,从而大大提升告警处理的并行性,提升了网管告警的处理效率。
如图4所示,本发明一实施例提出一种提升告警处理效率的服务器,包括:接收模块401以及告警批处理模块402;其中:
接收模块401,用于定时接收携带有网元标识符的告警信息,将告警信息按照该告警信息上报的先后顺序依次放入待处理告警队列;
告警信息包括告警产生信息或告警消失信息。
告警批处理模块402,用于根据告警信息携带的网元标识符及预定规则对待处理告警队列中的告警信息进行并行线程批处理。
在本实施例中,接收模块401定时接收上报的批量告警信息,该批量告警信息由告警网元上报给网管适配器,经网管适配器对告警信息进行数据转换后,发至从告警服务器进行分类,由从告警服务器定时(每隔预定时间,通常为1秒)批量上报给主告警服务器接收模块401。
在本实施例中,从告警服务器之所以要使用一段时间延迟来收集告警信息,其目的是为了增强主告警服务器批量处理告警信息的能力。
本实施例中主告警服务器设置有一个待处理告警队列,用于接收从告警服务器定时批量上报的待处理的告警信息。主告警服务器接收模块401接收到携带有网元标识符的告警信息后,将告警信息按照该告警信息上报的先后顺序依次放入待处理告警队列中。
在本实施例中,对于告警信息处理而言,同一个网元产生或消失的告警信息具有时序上的要求,但不同网元的告警信息没有时序要求,所以只要保证同一个网元的告警信息在同一个工作线程进行处理,即可满足时序上的要求,而不同网元的告警信息可以进行多线程处理,即可提升告警处理效率。
因此,本实施例在主告警服务器告警批处理模块402中,可以预先设置n个工作线程(0号工作线程、1号工作线程......n-1号工作线程)并行执行告警处理任务,并设置一个专门的调度线程执行模块A,用来从缓存区中构造告警处理的任务,并将各告警处理任务调度到n个工作线程中进行处理。
本实施例中,预定规则即是通过网元标识符与设置的工作线程的数量n之间的对应关系确定处理该网元的告警信息为n个工作线程中的哪一个,告警信息按所属网元进行分类,具体以网元唯一标识符来进行分类,上述预定规则可以为:若网元标识符除以n所得的余数以i表示,则设定该网元的告警信息固定在i号工作线程处理。
如图5所示,告警批处理模块402包括:访问单元4021、计算单元4022、判断单元4023以及线程调度处理单元4024;其中:
访问单元4021,用于当预设的n个工作线程中有空闲工作线程时,访问当前待处理告警队列中的第一条告警信息;以及当i号工作线程忙时,访问当前待处理告警队列内下一条告警信息;
计算单元4022,用于将该条告警信息携带的网元标识符除以n,得到余数i;
判断单元4023,用于判断i号工作线程是否空闲;
线程调度处理单元4024,用于当i号工作线程空闲时,将当前待处理告警队列中所有余数为i的告警信息取出,构成一告警处理任务,调度至i号工作线程进行处理。
更进一步的,线程调度处理单元4024还用于当预设的n个工作线程均无空闲时,暂停预定时间。
如图6所示,线程调度处理单元4024包括:
批处理子单元40241,用于批处理当前告警处理任务中各网元第一个告警消失信息之前的所有对应网元的告警产生信息;以及批处理当前告警处理任务中各网元第一个告警产生信息之前的所有对应网元的告警消失信息;
删除子单元40242,用于将处理过的告警产生信息从当前告警处理任务中删除;以及将处理过的告警消失信息从当前告警处理任务中删除。
如图7所示,本发明一实施例提出一种提升告警处理效率的系统,包括:从告警服务器701以及主告警服务器702;其中:
从告警服务器701,用于接收网元发送的携带有网元标识符的告警信息,对告警信息进行数据转换以及分类处理后定时上报给主告警服务器702;
主告警服务器702,用于定时接收告警信息,将告警信息按照该告警信息上报的先后顺序依次放入待处理告警队列,根据告警信息携带的网元标识符及预定规则对告警队列中的告警信息进行并行线程批处理。
在本实施例中,主告警服务器702为上述实施例中所述的服务器。
本发明实施例通过主从告警服务器使用预定的时间延迟(通常可以预设为1秒)来收集告警信息,然后将告警信息批量送往主告警服务器,增强了主告警服务器的批处理能力;同时,在主告警服务器中,根据预定规则实现多线程并行处理,大大提升了告警处理的并行性,提高了网管告警的处理效率。
以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或流程变换,或直接或间接运用在其它相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种提升告警处理效率的方法,其特征在于,包括:
定时接收携带有网元标识符的告警信息,将所述告警信息按照该告警信息上报的先后顺序依次放入待处理告警队列;
根据所述告警信息携带的网元标识符及预定规则对所述待处理告警队列中的告警信息进行并行线程批处理。
2.根据权利要求1所述的方法,其特征在于,
所述根据告警信息携带的网元标识符及预定规则对所述待处理告警队列中的告警信息进行并行线程批处理的步骤具体包括:
当预设的n个工作线程中有空闲工作线程时,访问当前待处理告警队列中的第一条告警信息;
将该条告警信息携带的网元标识符除以n,得到余数i;
判断i号工作线程是否空闲;
若i号工作线程空闲,则将当前待处理告警队列中所有余数为i的告警信息取出,构成一告警处理任务,调度至i号工作线程进行处理;并返回步骤当预设的n个工作线程中有空闲工作线程时,访问当前待处理告警队列中的第一条告警信息;
若i号工作线程忙,则访问当前待处理告警队列内下一条告警信息,并返回步骤将该条告警信息携带的网元标识符除以n,得到余数i。
3.根据权利要求2所述的方法,其特征在于,所述根据告警信息携带的网元标识符及预定规则对所述待处理告警队列中的告警信息进行并行线程批处理的步骤进一步包括:
当预设的n个工作线程均无空闲时,暂停预定时间后执行步骤当预设的n个工作线程中有空闲工作线程时,访问当前待处理告警队列中的第一条告警信息。
4.根据权利要求2所述的方法,其特征在于,i号工作线程对告警处理任务进行处理的步骤具体包括:
批处理当前告警处理任务中各网元第一个告警消失信息之前的所有对应网元的告警产生信息;
将处理过的告警产生信息从当前告警处理任务中删除,并将处理过的告警产生消息入网管数据库;
批处理当前告警处理任务中各网元第一个告警产生信息之前的所有对应网元的告警消失信息;
将处理过的告警消失信息从当前告警处理任务中删除,将处理过的告警消失消息入网管数据库;并返回步骤批处理当前告警处理任务中各网元第一个告警消失信息之前的所有对应网元的告警产生信息。
5.一种提升告警处理效率的服务器,其特征在于,包括:
接收模块,用于定时接收携带有网元标识符的告警信息,将所述告警信息按照该告警信息上报的先后顺序依次放入待处理告警队列;
告警批处理模块,用于根据所述告警信息携带的网元标识符及预定规则对所述待处理告警队列中的告警信息进行并行线程批处理。
6.根据权利要求5所述的服务器,其特征在于,所述告警批处理模块包括:
访问单元,用于当预设的n个工作线程中有空闲工作线程时,访问当前待处理告警队列中的第一条告警信息;以及当i号工作线程忙时,访问当前待处理告警队列内下一条告警信息;
计算单元,用于将该条告警信息携带的网元标识符除以n,得到余数i;
判断单元,用于判断i号工作线程是否空闲;
线程调度处理单元,用于当i号工作线程空闲时,将当前待处理告警队列中所有余数为i的告警信息取出,构成一告警处理任务,调度至i号工作线程进行处理。
7.根据权利要求6所述的服务器,其特征在于,所述线程调度处理单元还用于当预设的n个工作线程均无空闲时,暂停预定时间。
8.根据权利要求6或7所述的服务器,其特征在于,所述线程调度处理单元包括:
批处理子单元,用于批处理当前告警处理任务中各网元第一个告警消失信息之前的所有对应网元的告警产生信息;以及批处理当前告警处理任务中各网元第一个告警产生信息之前的所有对应网元的告警消失信息;
删除子单元,用于将处理过的告警产生信息从当前告警处理任务中删除;以及将处理过的告警消失信息从当前告警处理任务中删除。
9.一种提升告警处理效率的系统,其特征在于,包括:
从告警服务器,用于接收网元发送的携带有所述网元标识符的告警信息,对所述告警信息进行数据转换以及分类处理后定时上报给主告警服务器;所述主告警服务器,用于定时接收所述告警信息,将所述告警信息按照该告警信息上报的先后顺序依次放入待处理告警队列,根据告警信息携带的网元所述标识符及预定规则对所述告警队列中的告警信息进行并行线程批处理。
10.根据权利要求9所述的系统,其特征在于,所述主告警服务器为权利要求5至8中任一项所述的服务器。
CN201010288197.5A 2010-09-20 2010-09-20 提升告警处理效率的方法、服务器及系统 Active CN101958804B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201010288197.5A CN101958804B (zh) 2010-09-20 2010-09-20 提升告警处理效率的方法、服务器及系统
PCT/CN2010/079942 WO2012037760A1 (zh) 2010-09-20 2010-12-17 提升告警处理效率的方法、服务器及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201010288197.5A CN101958804B (zh) 2010-09-20 2010-09-20 提升告警处理效率的方法、服务器及系统

Publications (2)

Publication Number Publication Date
CN101958804A true CN101958804A (zh) 2011-01-26
CN101958804B CN101958804B (zh) 2014-05-28

Family

ID=43485926

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201010288197.5A Active CN101958804B (zh) 2010-09-20 2010-09-20 提升告警处理效率的方法、服务器及系统

Country Status (2)

Country Link
CN (1) CN101958804B (zh)
WO (1) WO2012037760A1 (zh)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103326874A (zh) * 2012-03-22 2013-09-25 西门子公司 告警管理系统及方法
CN105262621A (zh) * 2015-09-22 2016-01-20 上海斐讯数据通信技术有限公司 一种无源光网络中的告警处理方法及olt设备
CN105281962A (zh) * 2015-12-03 2016-01-27 成都广达新网科技股份有限公司 一种基于并行管道实现网管性能采集系统及其工作方法
CN105323081A (zh) * 2014-06-16 2016-02-10 中兴通讯股份有限公司 并行处理方法、装置及告警的处理方法及装置
CN105450445A (zh) * 2015-11-17 2016-03-30 武汉日电光通信工业有限公司 一种大容量分组传送系统下的高性能告警处理系统及方法
CN106375103A (zh) * 2015-07-23 2017-02-01 杭州海康威视数字技术股份有限公司 一种告警数据采集和发送方法
CN106851703A (zh) * 2016-12-22 2017-06-13 上海斐讯数据通信技术有限公司 云接入控制器处理告警信息的方法和装置
CN107528882A (zh) * 2017-07-14 2017-12-29 阿里巴巴集团控股有限公司 区块链共识网络中处理共识请求的方法、装置和电子设备
CN107958535A (zh) * 2017-11-01 2018-04-24 深圳怡化电脑股份有限公司 一种纸币信息的获取方法、获取装置及终端设备
CN109286532A (zh) * 2018-11-28 2019-01-29 郑州云海信息技术有限公司 云计算系统中告警信息的管理方法和装置
WO2019019384A1 (zh) * 2017-07-27 2019-01-31 上海壹账通金融科技有限公司 消息推送方法、装置、计算机设备和存储介质
CN110502404A (zh) * 2019-07-22 2019-11-26 平安科技(深圳)有限公司 一种基于数据治理平台的预警处理方法及相关设备
CN110610344A (zh) * 2019-07-29 2019-12-24 黑龙江金域医学检验所有限公司 一种提高自动审核系统审核速度的方法、装置及设备
CN111371602A (zh) * 2020-02-27 2020-07-03 中国联合网络通信集团有限公司 告警信息处理方法和设备
CN112422303A (zh) * 2019-08-21 2021-02-26 大唐移动通信设备有限公司 告警数据的处理方法、管理者实体和网元
CN112749018A (zh) * 2019-10-31 2021-05-04 大唐移动通信设备有限公司 一种消息处理方法和消息处理装置
CN113342603A (zh) * 2021-06-07 2021-09-03 平安证券股份有限公司 告警数据处理方法、装置、计算机设备和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6119158A (en) * 1996-11-29 2000-09-12 Nec Corporation Method of forming multi-integrated agent system
CN101018157A (zh) * 2007-02-14 2007-08-15 华为技术有限公司 一种告警处理方法及告警系统
CN101145969A (zh) * 2007-10-25 2008-03-19 中兴通讯股份有限公司 一种减少网元上报告警数量的方法及系统
CN101599027A (zh) * 2009-06-30 2009-12-09 中兴通讯股份有限公司 一种线程池管理方法及其系统
CN101674592A (zh) * 2009-10-13 2010-03-17 浪潮通信信息系统有限公司 一种移动通信网管系统中多线程告警关联分析的方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE547858T1 (de) * 2005-07-06 2012-03-15 Telecom Italia Spa Verfahren und system zum identifizieren von fehlern in kommunikationsnetzen
CN101170361B (zh) * 2006-10-27 2011-09-21 中兴通讯股份有限公司 提高告警数据查找和存储效率的方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6119158A (en) * 1996-11-29 2000-09-12 Nec Corporation Method of forming multi-integrated agent system
CN101018157A (zh) * 2007-02-14 2007-08-15 华为技术有限公司 一种告警处理方法及告警系统
CN101145969A (zh) * 2007-10-25 2008-03-19 中兴通讯股份有限公司 一种减少网元上报告警数量的方法及系统
CN101599027A (zh) * 2009-06-30 2009-12-09 中兴通讯股份有限公司 一种线程池管理方法及其系统
CN101674592A (zh) * 2009-10-13 2010-03-17 浪潮通信信息系统有限公司 一种移动通信网管系统中多线程告警关联分析的方法

Cited By (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103326874A (zh) * 2012-03-22 2013-09-25 西门子公司 告警管理系统及方法
CN105323081A (zh) * 2014-06-16 2016-02-10 中兴通讯股份有限公司 并行处理方法、装置及告警的处理方法及装置
CN106375103A (zh) * 2015-07-23 2017-02-01 杭州海康威视数字技术股份有限公司 一种告警数据采集和发送方法
CN106375103B (zh) * 2015-07-23 2020-02-21 杭州海康威视数字技术股份有限公司 一种告警数据采集和发送方法
CN105262621B (zh) * 2015-09-22 2019-06-25 上海斐讯数据通信技术有限公司 一种无源光网络中的告警处理方法及olt设备
CN105262621A (zh) * 2015-09-22 2016-01-20 上海斐讯数据通信技术有限公司 一种无源光网络中的告警处理方法及olt设备
CN105450445A (zh) * 2015-11-17 2016-03-30 武汉日电光通信工业有限公司 一种大容量分组传送系统下的高性能告警处理系统及方法
CN105281962A (zh) * 2015-12-03 2016-01-27 成都广达新网科技股份有限公司 一种基于并行管道实现网管性能采集系统及其工作方法
CN105281962B (zh) * 2015-12-03 2018-08-28 成都广达新网科技股份有限公司 一种基于并行管道实现网管性能采集系统及其工作方法
CN106851703A (zh) * 2016-12-22 2017-06-13 上海斐讯数据通信技术有限公司 云接入控制器处理告警信息的方法和装置
CN106851703B (zh) * 2016-12-22 2021-03-02 金华市智甄通信设备有限公司 云接入控制器处理告警信息的方法和装置
CN107528882A (zh) * 2017-07-14 2017-12-29 阿里巴巴集团控股有限公司 区块链共识网络中处理共识请求的方法、装置和电子设备
US10897522B2 (en) 2017-07-14 2021-01-19 Advanced New Technologies Co., Ltd. Method, apparatus, and electronic device for processing consensus requests in a blockchain consensus network
US11095750B2 (en) 2017-07-14 2021-08-17 Advanced New Technologies Co., Ltd. Method, apparatus, and electronic device for processing consensus requests in a blockchain consensus network
CN112804349A (zh) * 2017-07-14 2021-05-14 创新先进技术有限公司 区块链共识网络中处理共识请求的方法、装置和电子设备
US10693994B2 (en) 2017-07-14 2020-06-23 Alibaba Group Holding Limited Method, apparatus, and electronic device for processing consensus requests in a blockchain consensus network
US10721326B2 (en) 2017-07-14 2020-07-21 Alibaba Group Holding Limited Method, apparatus, and electronic device for processing consensus requests in a blockchain consensus network
WO2019019384A1 (zh) * 2017-07-27 2019-01-31 上海壹账通金融科技有限公司 消息推送方法、装置、计算机设备和存储介质
CN107958535A (zh) * 2017-11-01 2018-04-24 深圳怡化电脑股份有限公司 一种纸币信息的获取方法、获取装置及终端设备
CN109286532B (zh) * 2018-11-28 2021-07-27 郑州云海信息技术有限公司 云计算系统中告警信息的管理方法和装置
CN109286532A (zh) * 2018-11-28 2019-01-29 郑州云海信息技术有限公司 云计算系统中告警信息的管理方法和装置
CN110502404A (zh) * 2019-07-22 2019-11-26 平安科技(深圳)有限公司 一种基于数据治理平台的预警处理方法及相关设备
CN110610344A (zh) * 2019-07-29 2019-12-24 黑龙江金域医学检验所有限公司 一种提高自动审核系统审核速度的方法、装置及设备
CN112422303A (zh) * 2019-08-21 2021-02-26 大唐移动通信设备有限公司 告警数据的处理方法、管理者实体和网元
CN112422303B (zh) * 2019-08-21 2022-04-05 大唐移动通信设备有限公司 告警数据的处理方法、管理者实体和网元
CN112749018A (zh) * 2019-10-31 2021-05-04 大唐移动通信设备有限公司 一种消息处理方法和消息处理装置
CN112749018B (zh) * 2019-10-31 2023-11-07 大唐移动通信设备有限公司 一种消息处理方法和消息处理装置
CN111371602A (zh) * 2020-02-27 2020-07-03 中国联合网络通信集团有限公司 告警信息处理方法和设备
CN111371602B (zh) * 2020-02-27 2023-05-23 中国联合网络通信集团有限公司 告警信息处理方法和设备
CN113342603A (zh) * 2021-06-07 2021-09-03 平安证券股份有限公司 告警数据处理方法、装置、计算机设备和存储介质
CN113342603B (zh) * 2021-06-07 2022-09-27 平安证券股份有限公司 告警数据处理方法、装置、计算机设备和存储介质

Also Published As

Publication number Publication date
CN101958804B (zh) 2014-05-28
WO2012037760A1 (zh) 2012-03-29

Similar Documents

Publication Publication Date Title
CN101958804B (zh) 提升告警处理效率的方法、服务器及系统
CN106802826B (zh) 一种基于线程池的业务处理方法及装置
CN110019651A (zh) 一种流式规则引擎及业务数据处理方法
WO2019223062A1 (zh) 系统异常的处理方法和系统
EP2503733A1 (en) Data collecting method, data collecting apparatus and network management device
US10044820B2 (en) Method and system for automated transaction analysis
CN102750350B (zh) 监控系统及方法
CN103559082A (zh) 一种基于队列的分布式任务调度方法、装置及系统
CN105159769A (zh) 一种适用于计算能力异构集群的分布式作业调度方法
WO2014065115A1 (ja) ルール分配サーバ、イベント処理システム、方法及びプログラム
CN1794668A (zh) 信息技术系统的监控器和监控进程的实现的方法及系统
WO2016201812A1 (zh) 告警的方法及装置
CN109327321B (zh) 网络模型业务执行方法、装置、sdn控制器及可读存储介质
CN111913824A (zh) 确定数据链路故障原因的方法及相关设备
TW201214286A (en) Computer system, method, and program
CN102055620B (zh) 监控用户体验的方法和系统
CN104217314B (zh) 路由信息抓取方法和装置
CN105187490B (zh) 一种物联网数据的中转处理方法
CN108717438B (zh) 一种链式数据状态采集系统及方法
US20120158824A1 (en) Apparatus and method for distributed processing of radio frequency identification (rfid) middleware
CN107247715A (zh) Wms系统与erp系统的同步方法
CN103514036A (zh) 一种用于事件触发和批量处理的调度系统和方法
CN102314631A (zh) 制造执行系统的事件处理装置
CN107453882B (zh) 一种集群中告警信息聚合系统及方法
CN108170825A (zh) 基于云平台的分布式能源数据监控清洗方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant