CN101018157A - 一种告警处理方法及告警系统 - Google Patents

一种告警处理方法及告警系统 Download PDF

Info

Publication number
CN101018157A
CN101018157A CNA2007100801974A CN200710080197A CN101018157A CN 101018157 A CN101018157 A CN 101018157A CN A2007100801974 A CNA2007100801974 A CN A2007100801974A CN 200710080197 A CN200710080197 A CN 200710080197A CN 101018157 A CN101018157 A CN 101018157A
Authority
CN
China
Prior art keywords
alarm
buffer queue
queue length
monitor
speed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2007100801974A
Other languages
English (en)
Other versions
CN100490397C (zh
Inventor
刘畅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CNB2007100801974A priority Critical patent/CN100490397C/zh
Publication of CN101018157A publication Critical patent/CN101018157A/zh
Application granted granted Critical
Publication of CN100490397C publication Critical patent/CN100490397C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)
  • Alarm Systems (AREA)

Abstract

本发明属于网管技术领域,提供了一种告警处理方法及告警系统,通过本发明所提供的系统,采用下列方法:接收告警并将告警存入告警缓冲队列;获取告警缓冲队列长度;当所述告警缓冲队列长度超过预设的异常阈值时,增加线程处理告警缓冲队列中的告警。这种告警处理方法能够及时识别并处理告警风暴,为传输网管的告警管理功能提供了有效的告警风暴识别以及应对机制,减少了告警风暴给用户造成的影响。

Description

一种告警处理方法及告警系统
技术领域
本发明涉及网管技术领域,尤其涉及一种告警处理方法及告警系统。
背景技术
对整个网络的运行状况进行集中地监控是传输网络网管系统的重要功能之一,其中最为重要的是对网络中的异常状况进行实时监控的故障管理功能。
故障管理的常用功能包括:帮助管理员对各种传输设备以及传输网络的异常状况进行实时监控,对告警信号的收集、查看、报告、存储以及故障的初步定位、诊断、业务影响评估、告警处理等,并给出告警提示。总之,通过各种手段为管理员提供帮助,使网络尽快恢复运行。
告警的上报具有集中性和突发性的特点,在某个时段可能密集上报,比如纤缆割接或者多站点掉站情况下,就会发生所谓的“告警风暴”。由于告警风暴的突发性特点,现有技术中无法及时判断何时告警会大量增加,因此,不论告警数量多少,都是采用单线程处理。由于当出现告警风暴时,这样系统会花费很长时间才能处理完告警,处理效率低下。而如果告警得不到及时处理,会对用户的日常使用造成影响。同时,大量的告警密集上报,可能导致告警延迟,进而使得用户对故障的定位产生偏差。由于系统无法预测或实时获取告警数量,何时出现告警风暴,为了排除故障,用户对历史告警记录进行统计,根据某个网元或区域某个历史时期告警数量来判断该网元或区域在某个历史阶段是否发生过告警风暴。举例说明用户进行告警分析的方式:
首先通过告警统计报表,如把某个月中出现的告警首先按照子网或区域统计出来,如表1为按照子网统计。从表1可以看出,子网1的告警较多,子网1有可能出现告警风暴。再把子网1的告警按照时间进行统计,如表2所示,发现10月2日告警明显上涨,那么该日子网1有可能出现过告警风暴。然后再查看告警,分析原因等。
可见,该技术方案在告警数量很大时,系统无法及时处理,而用户也只是对历史告警进行简单的分析,当告警数据量很大如发生告警风暴时,告警服务器将无法及时处理,进而对用户造成影响。因此,这种告警处理方法不能实时发现告警风暴,更无法在发生告警风暴时及时地处理。
  子网名称     紧急     重要     次要     提示     总计
  子网1     98     709     523     0     1330
  子网2     24     211     105     12     352
  子网3     41     300     350     10     701
  ...     ...     ...     ...     ...     ...
  总计     ...     ...     ...     ...     ...
表1按照子网统计
   时间     紧急     重要     次要     提示     总计
   10月1日     1     40     37     0     78
   10月2日     10     112     50     2     174
   10月3日     2     32     20     0     54
   ...     ...     ...     ...     ...     ...
   总计     ...     ...     ...     ...     ...
表2按照时间统计
发明内容
本发明实施例要解决的技术问题是提供一种告警处理方法及告警系统。
本发明实施例的目的是通过以下技术方案实现的:
本发明实施例提供了一种告警处理方法,该方法包括:
接收告警并将告警存入告警缓冲队列;
获取告警缓冲队列长度;
当所述告警缓冲队列长度超过预设的异常阈值时,增加线程处理告警缓冲队列中的告警。
本发明实施例还提供了一种告警系统,该系统包括:告警存储器、告警缓冲队列长度检测器、告警缓冲队列长度第一监视器、第一负载策略器、告警处理器,其中:
告警存储器,用于通过告警缓冲队列接收告警;
告警缓冲队列长度检测器,用于检测告警缓冲队列长度;
告警缓冲队列长度第一监视器,用于判断从告警缓冲队列长度检测器所获取的告警缓冲队列长度是否超过预设的异常阈值,并在超过时通知第一负载策略器;
第一负载策略器,用于接收到告警缓冲队列长度超过预设的异常阈值的消息时,通知告警处理器增加线程处理告警;
告警处理器,用于通过至少一个线程处理告警存储器中的告警。
从以上技术方案可以看出,通过预先将告警存入告警缓冲队列然后进行处理,并根据告警缓冲队列长度判断是否发生告警风暴,可以及时的识别告警风暴的发生,并在发生告警风暴时增加线程处理告警,可以有效地应对告警风暴。总之,这种告警处理方法为传输网管的告警管理功能提供了有效的告警风暴识别以及应对机制,减少了告警风暴给用户造成的影响。
附图说明
图1为本发明一实施例中处理告警的流程图;
图2为本发明另一实施例中处理告警的流程图;
图3为本发明一实施例中多线程处理告警示意图;
图4为本发明一实施例中提示告警上报速度异常增加示意图;
图5为本发明实施例中一种系统界面图形化显示告警监控信息示意图;
图6为本发明实施例中另一种系统界面图形化显示告警监控信息示意图;
图7为本发明实施例中另一种系统界面图形化显示告警监控信息示意图;
图8为本发明实施例中另一种系统界面图形化显示告警监控信息示意图;
图9为本发明一实施例中告警系统结构示意图。
具体实施方式
为使本发明的优点和特征更加清楚明白,下面参照附图并举实施例对本发明作进一步描述。
告警的处理具有数据量大的特点,逐条的接收处理会增加系统的开销,本发明各实施例采用先用缓冲队列缓冲后再批量处理告警,这样可以有效地提高系统的稳定性。以下举实施例说明本发明如何处理告警的。
实施例1,参照图1,通过监控告警队列长度识别告警风暴并采用增加线程处理的方法排除告警风暴:
步骤11:接收告警并将告警存入告警缓冲队列;
步骤12:获取告警缓冲队列长度;
告警缓冲队列长度就是告警缓冲队列中的告警条数,可以周期性地从告警缓冲队列中查出。
步骤13:判断所获取的告警缓冲队列长度是否超过预设的异常阈值,如果是,则执行步骤14;如果否,则执行步骤15;
步骤14:增加线程处理告警缓冲队列中的告警;
步骤15:保持现有线程处理告警缓冲队列中的告警。
本实施例提供了一种告警处理的方法,其中,步骤13~步骤15说明了如何识别以及应对告警风暴的方法。当告警风暴到来时,告警缓冲队列长度会大幅增加,如果告警缓冲队列长度超过预先设置的异常阈值,就作出发生告警风暴的判断。例如,系统的单线程告警处理速度为S条/秒,当告警缓冲队列长度达到60S条,即系统单线程处理要1分钟才能处理完时,就根据实际情况增加新的线程处理。例如:当告警缓冲队列长度达到60S条时,增加4个新的线程,如图3所示。以后缓冲队列长度每增加60S条,就新增一个线程处理,即达到120S条时有6个线程处理,到300S条时有9个线程处理。
不过,系统所增加的新的线程通常是有限的,如果告警缓冲队列中的告警远远超过系统的处理能力,就意味着告警占用了大量的网络资源与系统资源,仍然会对用户造成影响。这时可将告警风暴划分为不同的级别,设置不同的阈值并进行相应处理。例如,在实施例1中设置的异常阈值基础上,再设置一个第一超标阈值。举实施例2进行说明:
实施例2,仍假设系统单线程告警处理速度是S条/秒,系统设置默认值为:当告警缓冲队列长度达到60S条,即1分钟才能处理完时,向告警处理器发出告警缓冲队列长度异常的通知,告警处理器进入异常处理模式;当告警缓冲队列长度达到5×60×S条,即5分钟才能处理完时,向告警处理器发出告警缓冲队列长度超标的通知,告警处理器进入超标处理模式。
当进入异常处理模式时,告警处理器会增加4个新的线程,并把告警缓冲队列中的告警按照网元分类,并保持同一网元上的告警顺序,并分发给已启动的5个线程处理。仍同实施例1中所述,在进入异常处理模式后,缓冲队列长度每增加60S条,就增加一个新的线程处理,即达到120S条时有6个线程处理,达到300S条时有9个线程处理。不过,系统用于处理告警的线程毕竟是有限的,不可能无限制增加线程处理,因此,可以设置用于处理告警的线程最大值,例如最多有9个线程同时处理。
其中,将告警按照网元分类并保持同一网元上告警的顺序,是为了保持告警的时序性,因为告警分为告警上报和告警恢复,而在同一网元上,告警恢复应该在该条告警上报之后再上报,才能找到它对应的告警,否则就违反了顺序的合理性。不过,在不同的网元之间没有这种顺序性,告警可以并行处理。
当告警处理器进入超标处理模式时,告警处理器除了保持在异常处理模式中的多线程处理外,还会向发出告警的网元例如管理设备或下层网管发出停止告警上报的消息,从而有效地降低告警风暴对网管系统的压力。
在异常处理模式下,当告警缓冲队列长度下降时,系统可以根据下降幅度相应地减少处理线程。比如,缓冲队列降到120S条时,就把工作线程降到6个。当然,如7此时7个线程都在处理,就不需强行终止线程,而是等下次有线程空闲时将该空闲线程释放。
同样,当所获取的缓冲队列长度下降到预设的第二超标阈值时,比如告警缓冲队列长度降到30S时,通知发出告警的网元重新进行告警上报,进行告警增量同步,保持上下层数据的一致。为了避免过早解除告警上报禁止而导致告警风暴的再次出现,可以等待告警缓冲队列长度恢复到正常模式时再解除禁止。
以上告警处理方法为通过监视告警缓冲队列长度而对告警风暴采取的相应的应对策略,以下提供另一实施例。
实施例3,通过监控告警缓冲队列长度和告警上报速度发现告警风暴并采用相应地应对策略,参照图2。
步骤21:接收告警并将告警存入告警缓冲队列;
步骤22:获取告警缓冲队列长度、告警上报速度、告警处理速度;
告警缓冲队列长度就是告警缓冲队列中的告警条数,可以设置一个计数器,初始值为0,每有一条告警上报计数器值就增加1,告警处理器每处理一批告警,计数器值就减去该批告警条数,并定时获取该计数器值。
可用如下方法测量告警上报速度以及告警处理速度:
测量告警上报速度:在告警缓冲队列入口设置一个告警上报计数器,初始值可设为0,当告警缓冲队列中每有一条新的告警插入就将告警上报计数器值增加1。定时从告警上报计数器中读取告警上报计数值,设为N条,除以定时周期,定时周期设为P秒,就可以得到当前告警上报速度为N/P(条/秒)。然后将告警上报计数值归0。
测量告警处理速度:与测量告警上报速度类似,在告警缓冲队列的出口设置一个告警处理计数器,初始值为0。当告警处理器从缓冲队列中取出一批告警进行处理时,就将告警处理计数器值增加该批告警条数。定时从告警处理计数器中读取告警处理计数值,设为M条,除以定时周期,定时周期设为P秒,则告警处理器的当前告警处理速度为M/P(条/秒)。
步骤23:判断步骤22中获取的告警缓冲队列长度是否超过预设的异常阈值,如果是,则执行步骤24;如果否,则执行步骤25;
步骤24:增加新的线程处理告警缓冲队列中的告警;
步骤25:保持现有线程处理告警缓冲队列;
步骤26:判断告警上报速度是否超过告警处理速度并持续一定时间,如果是,执行步骤27;否则,则结束流程;
步骤27:系统通过界面发送消息提示用户,并记录日志。
图4为向用户提供的提示消息示意图。其中,窗口41中有向用户发出的提示,确认按钮42供用户进行确认。窗口41可以是浮动的。
在本实施例提供的告警处理方法中,步骤23~步骤25为监控告警缓冲队列长度并根据告警缓冲队列长度进行处理,应对告警风暴;步骤26~步骤27为根据告警上报速度与告警处理速度判断是否可能发生报警风暴,并采取的相应策略。步骤23~步骤25与步骤26~步骤27没有时间上的顺序性,事实上,两种策略是同步进行的。
告警风暴到来的主要表现就是:告警缓冲队列长度大幅增加,告警上报速度非常快。所以将告警缓冲队列长度和告警上报速度成为监控告警风暴的重要参数。前者是系统现在需要处理的告警总量,后者是系统单位时间内接收到的告警上报信息条数。通过监控告警缓冲队列长度的方法并当告警风暴发生时所采取的应对策略参见实施例1和实施例2,不再详细描述。下面详细说明告警上报速度大幅增加时系统的应对策略。
设告警处理器单线程的告警处理速度是ProcessSpeed(条/秒),现在缓冲队列中缓冲的数据量是Total(条),如果告警处理器只有一个线程处理,而且处理期间没有告警上报,设处理完这些告警需要N秒,则:
N=Total/ProcessSpeed;
如果处理期间有新的告警上报,假设上报速度为NewSpeed(条/秒),处理完这些告警需要AllTime秒,则:
AllTime=Total/(ProcessSpeed-NewSpeed);
如果NewSpeed大于ProcessSpeed,并且持续了一定时间,仅靠已有的工作线程可能无法完成任务,说明告警风暴可能发生。假设系统平时告警处理速度为S条/秒,当告警上报速度超过S条/秒,并且持续了5秒钟后,系统界面向用户发出提示,并记录一条日志。
这种情况下不需要启动多线程处理机制处理告警,因为它只是有可能引起告警缓冲队列增长过快,而不一定会产生持续的告警风暴压力,所以只需要通过界面提示用户即可。而记录日志对用户日后查看和分析会有帮助。
由于仅是某一时刻的告警上报速度超过告警处理速度,一般情况下不会形成告警风暴,所以没有必要向用户发消息提示,而如果这种情况持续了足够的时间,则很有可能形成告警风暴,用户可自定义设置持续时间,如果超过这一时间,系统则通过界面向用户发出提示,并记录日志。
以上各实施例对告警处理的方法进行了详细说明。从中可以看出,当有大量告警上报发生告警风暴时所采取的相应的应对策略。为了增强告警系统的交互性能,为用户提供一个友好的界面,帮助用户对告警进行实时监控及告警分析,可以将告警采用更为直观的图形进行显示,以下举例详细说明。
实施例4,在系统实时处理告警的同时,可以设置一个图形化的监控界面。将告警缓冲队列长度、告警上报速度以及告警处理速度等作为重要的监控参数。
如图5和图6,将告警缓冲队列长度、告警上报速度、告警处理速度用折线图进行显示。其中,后两项参数放在一幅图中进行显示,可以减少用户收集信息的时间。
其中,图5中,横轴是时间纬度,纵轴是缓冲队列长度;图6中,横轴是时间纬度,纵轴是时间,实线为告警上报速度随时间变化图,虚线为告警处理速度随时间变化图。
当前告警实时监控还可以用数字的形式直接显示瞬时状态各个参数之间的关系。如图7所示,图中从上到下三个位置依次显示了告警处理速度、当前告警缓冲队列长度、告警上报速度三个参数,形象而直观。
为帮助用户进行分析,还可以将某一段时间内告警上报信息按照网元统计并用图形进行显示,如图8,用柱状图显示本月某次告警风暴中各个网元的告警上报情况,其中横轴是用户选取的网元,纵轴是网元上的告警数量统计值,这张图是在指定的一个历史时段后对一部分网元的告警上报数量的统计结果,可以直观看出告警风暴可能发生在网元2。
同样,还可以用图形对异常或超标等其它情况进行显示,帮助用户进行管理和分析。
以上各实施例对告警处理方法进行了详细介绍,下面通过具体实施例对告警系统进行描述。
如图9所示,为一种告警系统的结构示意图,该告警系统包括:告警存储器91、告警缓冲队列长度检测器92、告警缓冲队列长度第一监视器93、第一负载策略器94、告警处理器95,其中:
告警存储器91,用于通过告警缓冲队列接收告警;
告警缓冲队列长度检测器92,用于检测告警缓冲队列长度;
告警缓冲队列长度第一监视器93,用于判断从告警缓冲队列长度检测器所获取的告警缓冲队列长度是否超过预设的异常阈值,并在超过时通知第一负载策略器94;
第一负载策略器94,用于接收到告警缓冲队列长度超过预设的异常阈值的消息时,通知告警处理器95增加线程处理告警;
告警处理器95,用于通过至少一个线程处理告警存储器91中的告警。
可以设置不同的告警缓冲队列长度阈值而采用而启用不同的应对策略。例如,如果告警风暴没有得到及时的解决而告警处理器95能够提供的线程是有限的,此时可设置告警缓冲队列长度第二监视器、第二负载策略器,其中,
告警缓冲队列长度第二监视器,用于判断从告警缓冲队列长度检测器所获取的告警缓冲队列长度是否超过预设的第一超标阈值,并在超过时通知第二负载策略器;
第二负载策略器,用于接收到告警缓冲队列长度超过预设的第一超标阈值的消息时,发送禁止信息上报的通知。
如果告警风暴缓解,则没有必要启用过多的线程处理,此时,系统中可进一步设置告警缓冲队列长度第三监控器以及第三负载策略器,第三负载策略器可根据告警缓冲队列长度第三监视器发送的相应通知而启用不同的应对策略。
具体来说,告警缓冲队列长度第三监视器用于在所述告警缓冲队列长度超过预设的告警缓冲队列长度阈值时,判断告警缓冲队列长度是否下降到预设的幅度阈值,并在下降到预设的幅度阈值时,通知第三负载策略器。相应地,第三负载策略器用于接收到告警缓冲队列下降到预设的幅度阈值的消息时,通知告警处理器95减少用于处理告警的线程。
如果告警风暴解除,则需要保持告警的同步,针对这个目的,告警系统中可以设置告警缓冲队列长度第四监视器和第四负载策略器,其中,
告警缓冲队列长度第四监视器,用于判断从告警缓冲队列检测器所获取的告警缓冲队列长度是否下降到预设的第二超标阈值,并在下降到所述第二超标阈值时,通知第四负载策略器;
第四负载策略器,用于在接收到告警缓冲队列长度下降到第二超标阈值的消息时,发送允许告警上报的通知。
以上各实施方式中,告警缓冲队列长度的各个阈值用户均可自定义设置。
以上各实施例中,所述告警缓冲队列长度第一监视器、告警缓冲队列长度第二监视器、告警缓冲队列长度第三监视器、告警缓冲队列长度第四监视器均可以任意集成在一起,相应地,第一负载策略器、第二负载策略器、第三负载策略器以及第四负载策略器其中任意两个或多个也可以集成在一起。
为增强交互性,可将告警缓冲队列长度各个监视器从告警缓冲队列长度检测器所获取的告警缓冲队列长度用图形显示出来,如告警系统中还设置有告警缓冲队列长度显示器96,如图9所示,用图形实时显示从各个告警缓冲队列长度监视器所获取的告警缓冲队列长度,如图5、图7所示。
下面参照图9说明本发明告警系统的另一实施例,与上述方案不同的是,该系统还包括:告警上报速度检测器97、告警处理速度检测器98、告警速度监视器99,其中:
告警上报速度检测器97,用于检测告警上报速度并将检测结果发送到告警速度监视器99;
告警处理速度检测器98,用于检测告警处理速度并将检测结果发送到告警速度监视器99;
告警速度监视器99,用于比较接收到的告警上报速度与告警处理速度,并当告警上报速度大于告警处理速度且持续了预设的时间时,发送消息提示告警上报速度异常。
同样,针对告警上报速度、告警处理速度也可采用相应的图形化显示界面,所以,告警系统还可包括告警速度显示器90,用图形实时从告警速度监视器99所获取的告警上报速度以及告警处理速度。
为便于用户进行历史告警数据分析,告警系统同样也可用图形显示历史告警,如图8为按照网元统计的告警历史告警柱状图。
总之,告警系统对所有监控信息均可用图形进行显示,不再一一列举。
以上告警缓冲队列长度检测器92、告警上报速度检测器97、告警处理速度检测器98可组合在一起,作为告警检测器,同样,告警缓冲队列长度各个监视器与告警速度监视器99也可组合在一起作为告警监视器,告警速度显示器90也可与告警缓冲队列长度显示器96组合在一起。当然,本发明并不限于这些组合。
从以上各实施例可以看出,通过预先将告警存入告警缓冲队列然后进行处理,并根据告警缓冲队列长度判断是否发生告警风暴,可以及时的识别告警风暴,并在发生告警风暴时增加线程处理告警,可以有效地应对告警风暴,减少了告警风暴的发生对用户造成影响。这种告警处理方法为传输网管的告警管理功能提供了有效的告警风暴识别以及应对机制,减少了告警风暴给用户造成的影响。
而根据告警缓冲队列长度值处于不同的范围,启动不同数目的线程处理告警或是否限制告警的上报,从而为传输网管的告警管理功能提供了自适应应对告警风暴的方法。
另外,通过图形显示告警监控信息,操作简单,显示直观,便于历史数据的分析,提高了网管系统的可维护性和易用性,为用户提供了更加友好的交互界面。
当将本发明实施例中的告警处理方法做成独立软件时,该软件可以存储在计算机可读取的任何类型存储介质如中。例如该软件可存储在记录介质中,如可插入计算机系统驱动器的圆盘状介质,采用磁性、光学或磁光方式存储信息;或者可存储在计算机系统的固定记录介质如硬盘驱动器,或者一固态计算机存储器中。使用时,将实现上述各实施例的功能的软件程序代码的存储介质提供给系统或设备,利用系统或设备的计算机(或者CPU或者MPU)通过读取和执行存储在存储介质中的程序代码实现该功能。在这种情况下,从存储介质读出的程序代码本身实现了在上述实施例中的功能,存储程序代码的存储介质构成了本发明。
这种情况不仅包括其中上述实施例中的功能由计算机执行它读出的程序代码被实现的情况,而且包括其中当计算机所基于的操作系统等根据程序代码的指令执行实际程序的部分或全部被实现的情况。
以上对本发明实施例所提供的一种告警处理方法及告警系统进行了详细介绍,以上实施例的说明只是用于帮助理解本发明的方法及其思想;同时,对于本领域的一般技术人员,依据本发明实施例的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (13)

1.一种告警处理方法,应用于传输网管技术领域,其特征在于,包括:
接收告警并将告警存入告警缓冲队列;
获取告警缓冲队列长度;
当所述告警缓冲队列长度超过预设的异常阈值时,增加线程处理告警缓冲队列中的告警。
2.如权利要求1所述的告警处理方法,其特征在于,进一步包括:当所述告警缓冲队列长度超过预设的第一超标阈值时,保持多个线程处理告警缓冲队列中的告警,并通知发出告警的网元停止告警上报。
3.如权利要求2所述的告警处理方法,其特征在于,进一步包括:
当所述告警缓冲队列长度下降到预设的第二超标阈值时,通知发出告警的网元重新进行告警上报。
4.如权利要求1或2所述的告警处理方法,其特征在于,进一步包括,当所述告警缓冲队列长度下降时,根据下降幅度减少用于处理告警的线程。
5.如权利要求1或2所述的告警处理方法,其特征在于,多个线程处理告警时,将所述告警按照发出告警的网元分类后分发给各个线程处理,各个线程按照收到告警的时间顺序处理来自同一网元的告警。
6.如权利要求1或2所述的告警处理方法,其特征在于,进一步包括:
获取告警上报速度以及告警处理速度;
当告警上报速度大于告警处理速度,且持续时间超过了预设的时间时,提示告警上报速度异常。
7.如权利要求1或2所述的告警处理方法,其特征在于,进一步包括:
将获取的所述告警缓冲队列长度用图形化界面显示。
8.一种告警系统,其特征在于,包括:告警存储器、告警缓冲队列长度检测器、告警缓冲队列长度第一监视器、第一负载策略器、告警处理器,其中:
告警存储器,用于通过告警缓冲队列接收告警;
告警缓冲队列长度检测器,用于检测告警缓冲队列长度;
告警缓冲队列长度第一监视器,用于判断从告警缓冲队列长度检测器所获取的告警缓冲队列长度是否超过预设的异常阈值,并在超过时通知第一负载策略器;
第一负载策略器,用于接收到告警缓冲队列长度超过预设的异常阈值的消息时,通知告警处理器增加线程处理告警;
告警处理器,用于通过至少一个线程处理告警存储器中的告警。
9.如权利要求8所述的告警系统,其特征在于,还包括告警缓冲队列长度第二监视器和第二负载策略器,其中:
告警缓冲队列长度第二监视器,用于判断从告警缓冲队列长度检测器所获取的告警缓冲队列长度是否超过预设的第一超标阈值,并在超过时通知第二负载策略器;
第二负载策略器,用于接收到告警缓冲队列长度超过预设的第一超标阈值的消息时,发送禁止信息上报的通知。
10.如权利要求8所述的告警系统,其特征在于,还包括告警缓冲队列长度第三监视器和第三负载策略器,其中:
告警缓冲队列长度第三监视器,用于从所述告警缓冲队列长度检测器所获取的告警缓冲队列长度超过预设的异常阈值时,判断告警缓冲队列长度是否下降到预设的幅度阈值,并在下降到预设的幅度阈值时,通知第三负载策略器;
第三负载策略器,用于接收到告警缓冲队列下降到预设的幅度阈值的消息时,通知告警处理器减少用于处理告警的线程。
11.如权利要求9所述的告警系统,其特征在于,还包括告警缓冲队列长度第四监视器和第四负载策略器,其中:
告警缓冲队列长度第四监视器,用于判断从所述告警缓冲队列长度检测器所获取的告警缓冲队列长度是否下降到预设的第二超标阈值,并在下降到所述第二超标阈值时,通知第四负载策略器;
第四负载策略器,用于接收到所述告警缓冲队列长度下降到预设的第二超标阈值的消息时,发送允许告警上报的通知。
12.如权利要求8至11任一项所述的告警系统,其特征在于,还包括告警缓冲队列长度显示器,用于将告警缓冲队列长度第一监视器所获取的告警缓冲队列长度用图形实时显示出来。
13.如权利要求8至11任一项所述的告警系统,其特征在于,还包括:告警上报速度检测器、告警处理速度检测器、告警速度监视器,其中:
告警上报速度检测器,用于检测告警上报速度并将检测结果发送到告警速度监视器;
告警处理速度检测器,用于检测告警处理速度并将检测结果发送到告警速度监视器;
告警速度监视器,用于比较接收到的告警上报速度与告警处理速度,并当告警上报速度大于告警处理速度且持续了预设的时间时,发送消息提示告警上报速度异常。
CNB2007100801974A 2007-02-14 2007-02-14 一种告警处理方法及告警系统 Expired - Fee Related CN100490397C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB2007100801974A CN100490397C (zh) 2007-02-14 2007-02-14 一种告警处理方法及告警系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2007100801974A CN100490397C (zh) 2007-02-14 2007-02-14 一种告警处理方法及告警系统

Publications (2)

Publication Number Publication Date
CN101018157A true CN101018157A (zh) 2007-08-15
CN100490397C CN100490397C (zh) 2009-05-20

Family

ID=38726924

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2007100801974A Expired - Fee Related CN100490397C (zh) 2007-02-14 2007-02-14 一种告警处理方法及告警系统

Country Status (1)

Country Link
CN (1) CN100490397C (zh)

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101222361B (zh) * 2008-01-22 2010-07-14 中兴通讯股份有限公司 一种告警频率监控器及告警处理方法
CN101958804A (zh) * 2010-09-20 2011-01-26 中兴通讯股份有限公司 提升告警处理效率的方法、服务器及系统
CN101340692B (zh) * 2008-08-21 2011-02-16 中国移动通信集团河北有限公司 移动通信工程割接告警过滤方法
CN101534526B (zh) * 2008-03-14 2011-04-20 中兴通讯股份有限公司 一种基站系统分级告警同步方法
CN102118275A (zh) * 2009-12-30 2011-07-06 大唐移动通信设备有限公司 一种告警风暴的处理方法及处理装置
CN101764719B (zh) * 2009-11-30 2012-06-27 福建星网锐捷网络有限公司 一种内存告警处理方法、装置及网络设备
CN102546216A (zh) * 2010-12-30 2012-07-04 中国移动通信集团山东有限公司 网络管理系统中的告警消息处理方法及网络管理系统
CN102082677B (zh) * 2009-11-30 2012-10-31 中国移动通信集团天津有限公司 一种告警信息处理方法和装置及系统
CN101594295B (zh) * 2008-05-30 2012-11-21 原创信通电信技术(北京)有限公司 基于阈值控制的ip电信网边缘关口设备资源管理方法
CN102999415A (zh) * 2012-11-22 2013-03-27 江苏睿博数据技术有限公司 一种告警通知功能的优化方法及设备
CN104205925A (zh) * 2013-03-25 2014-12-10 华为技术有限公司 传输网络管理数据的方法及装置
CN104219259A (zh) * 2013-05-30 2014-12-17 中国电信股份有限公司 一种传输异常事件的处理方法和装置
CN104599433A (zh) * 2014-10-13 2015-05-06 北京国双科技有限公司 一种指标数据的监测方法、装置及服务器
CN104750596A (zh) * 2013-12-30 2015-07-01 中国移动通信集团公司 一种告警信息处理方法及服务子系统
CN104852824A (zh) * 2014-02-19 2015-08-19 联想(北京)有限公司 一种信息处理方法和装置
CN105323081A (zh) * 2014-06-16 2016-02-10 中兴通讯股份有限公司 并行处理方法、装置及告警的处理方法及装置
CN105827418A (zh) * 2015-01-04 2016-08-03 中国移动通信集团山东有限公司 一种通信网络告警关联方法及装置
CN106507401A (zh) * 2015-09-08 2017-03-15 大唐移动通信设备有限公司 一种告警持久化方法和设备
CN107222345A (zh) * 2017-06-06 2017-09-29 烽火通信科技股份有限公司 一种基于光传输设备的告警抑制和上报方法
CN110096409A (zh) * 2019-03-13 2019-08-06 中国平安人寿保险股份有限公司 异常报警方法、装置、监控装置及计算机可读存储介质
CN111142493A (zh) * 2020-01-10 2020-05-12 汉威科技集团股份有限公司 一种用于工业安全监管的异构数据采集装置及方法
CN112306711A (zh) * 2020-10-21 2021-02-02 深圳前海微众银行股份有限公司 一种业务告警方法、设备及计算机可读存储介质
CN112422303A (zh) * 2019-08-21 2021-02-26 大唐移动通信设备有限公司 告警数据的处理方法、管理者实体和网元
CN114070718A (zh) * 2021-10-19 2022-02-18 深圳市有方科技股份有限公司 一种告警方法、装置和存储介质
CN115294736A (zh) * 2022-10-09 2022-11-04 深圳曼顿科技有限公司 报警消息控制方法、装置、终端设备以及存储介质
CN116055289A (zh) * 2022-12-14 2023-05-02 中电信数智科技有限公司 一种传输网络告警高效发送方法

Cited By (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101222361B (zh) * 2008-01-22 2010-07-14 中兴通讯股份有限公司 一种告警频率监控器及告警处理方法
CN101534526B (zh) * 2008-03-14 2011-04-20 中兴通讯股份有限公司 一种基站系统分级告警同步方法
CN101594295B (zh) * 2008-05-30 2012-11-21 原创信通电信技术(北京)有限公司 基于阈值控制的ip电信网边缘关口设备资源管理方法
CN101340692B (zh) * 2008-08-21 2011-02-16 中国移动通信集团河北有限公司 移动通信工程割接告警过滤方法
CN101764719B (zh) * 2009-11-30 2012-06-27 福建星网锐捷网络有限公司 一种内存告警处理方法、装置及网络设备
CN102082677B (zh) * 2009-11-30 2012-10-31 中国移动通信集团天津有限公司 一种告警信息处理方法和装置及系统
CN102118275A (zh) * 2009-12-30 2011-07-06 大唐移动通信设备有限公司 一种告警风暴的处理方法及处理装置
CN101958804A (zh) * 2010-09-20 2011-01-26 中兴通讯股份有限公司 提升告警处理效率的方法、服务器及系统
WO2012037760A1 (zh) * 2010-09-20 2012-03-29 中兴通讯股份有限公司 提升告警处理效率的方法、服务器及系统
CN101958804B (zh) * 2010-09-20 2014-05-28 中兴通讯股份有限公司 提升告警处理效率的方法、服务器及系统
CN102546216B (zh) * 2010-12-30 2015-03-11 中国移动通信集团山东有限公司 网络管理系统中的告警消息处理方法及网络管理系统
CN102546216A (zh) * 2010-12-30 2012-07-04 中国移动通信集团山东有限公司 网络管理系统中的告警消息处理方法及网络管理系统
CN102999415A (zh) * 2012-11-22 2013-03-27 江苏睿博数据技术有限公司 一种告警通知功能的优化方法及设备
CN104205925A (zh) * 2013-03-25 2014-12-10 华为技术有限公司 传输网络管理数据的方法及装置
CN104205925B (zh) * 2013-03-25 2018-05-04 华为技术有限公司 传输网络管理数据的方法及装置
CN104219259A (zh) * 2013-05-30 2014-12-17 中国电信股份有限公司 一种传输异常事件的处理方法和装置
CN104219259B (zh) * 2013-05-30 2017-09-12 中国电信股份有限公司 一种传输异常事件的处理方法和装置
CN104750596B (zh) * 2013-12-30 2018-05-08 中国移动通信集团公司 一种告警信息处理方法及服务子系统
CN104750596A (zh) * 2013-12-30 2015-07-01 中国移动通信集团公司 一种告警信息处理方法及服务子系统
CN104852824A (zh) * 2014-02-19 2015-08-19 联想(北京)有限公司 一种信息处理方法和装置
CN105323081A (zh) * 2014-06-16 2016-02-10 中兴通讯股份有限公司 并行处理方法、装置及告警的处理方法及装置
CN104599433B (zh) * 2014-10-13 2017-06-20 北京国双科技有限公司 一种指标数据的监测方法、装置及服务器
CN104599433A (zh) * 2014-10-13 2015-05-06 北京国双科技有限公司 一种指标数据的监测方法、装置及服务器
CN105827418A (zh) * 2015-01-04 2016-08-03 中国移动通信集团山东有限公司 一种通信网络告警关联方法及装置
CN105827418B (zh) * 2015-01-04 2019-07-05 中国移动通信集团山东有限公司 一种通信网络告警关联方法及装置
CN106507401A (zh) * 2015-09-08 2017-03-15 大唐移动通信设备有限公司 一种告警持久化方法和设备
CN107222345A (zh) * 2017-06-06 2017-09-29 烽火通信科技股份有限公司 一种基于光传输设备的告警抑制和上报方法
CN107222345B (zh) * 2017-06-06 2019-12-24 烽火通信科技股份有限公司 一种基于光传输设备的告警抑制和上报方法
CN110096409A (zh) * 2019-03-13 2019-08-06 中国平安人寿保险股份有限公司 异常报警方法、装置、监控装置及计算机可读存储介质
CN112422303B (zh) * 2019-08-21 2022-04-05 大唐移动通信设备有限公司 告警数据的处理方法、管理者实体和网元
CN112422303A (zh) * 2019-08-21 2021-02-26 大唐移动通信设备有限公司 告警数据的处理方法、管理者实体和网元
CN111142493A (zh) * 2020-01-10 2020-05-12 汉威科技集团股份有限公司 一种用于工业安全监管的异构数据采集装置及方法
CN112306711A (zh) * 2020-10-21 2021-02-02 深圳前海微众银行股份有限公司 一种业务告警方法、设备及计算机可读存储介质
CN112306711B (zh) * 2020-10-21 2024-04-09 深圳前海微众银行股份有限公司 一种业务告警方法、设备及计算机可读存储介质
CN114070718A (zh) * 2021-10-19 2022-02-18 深圳市有方科技股份有限公司 一种告警方法、装置和存储介质
CN114070718B (zh) * 2021-10-19 2023-11-21 深圳市有方科技股份有限公司 一种告警方法、装置和存储介质
CN115294736A (zh) * 2022-10-09 2022-11-04 深圳曼顿科技有限公司 报警消息控制方法、装置、终端设备以及存储介质
CN115294736B (zh) * 2022-10-09 2023-02-10 深圳曼顿科技有限公司 报警消息控制方法、装置、终端设备以及存储介质
CN116055289A (zh) * 2022-12-14 2023-05-02 中电信数智科技有限公司 一种传输网络告警高效发送方法

Also Published As

Publication number Publication date
CN100490397C (zh) 2009-05-20

Similar Documents

Publication Publication Date Title
CN100490397C (zh) 一种告警处理方法及告警系统
CN101222361B (zh) 一种告警频率监控器及告警处理方法
US8458530B2 (en) Continuous system health indicator for managing computer system alerts
JP5603603B2 (ja) ギア組立体の状態を監視するための方法
CN103220173B (zh) 一种报警监控方法及监控系统
CN109539473A (zh) 空调系统的故障类型确定方法、电子设备
CN111679958A (zh) 一种服务器监控系统
CN101741991A (zh) 告警处理方法、装置及系统
CN101222369B (zh) 网元链路分时检测方法和装置
CN109150626A (zh) Ftp服务监测方法、装置、终端及计算机可读存储介质
JP2005018120A (ja) ネットワーク管理システムにおける機器情報の収集方法
CN106254148A (zh) 运维数据处理的方法及装置
CN116401127B (zh) 信息系统健康状态的监测方法、装置和电子设备
JP4578371B2 (ja) 監視情報取得装置
CN110633161B (zh) 一种广播的处理方法及装置
KR100953510B1 (ko) 재기동 정보 관리 기능을 구비한 장치
CN100489786C (zh) 状态机维护方法及装置
CN114493720A (zh) 监控Kafka消费者的方法、装置、存储介质及设备
TW201409968A (zh) 資通信服務品質評估與即時告警系統與方法
CN108023741A (zh) 一种监控资源使用方法及服务器
JP6984299B2 (ja) 通信中継装置
CN101206610A (zh) 计算机运行事件的管理系统及其方法
CN113971187A (zh) 一种服务监控方法及装置
CN104756448A (zh) 信息处理装置、信息处理方法和程序
JP2915061B2 (ja) 計算機システムの負荷制御方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20090520

Termination date: 20150214

EXPY Termination of patent right or utility model