CN1585344A - 一种振荡告警的处理方法 - Google Patents

一种振荡告警的处理方法 Download PDF

Info

Publication number
CN1585344A
CN1585344A CN 200410027629 CN200410027629A CN1585344A CN 1585344 A CN1585344 A CN 1585344A CN 200410027629 CN200410027629 CN 200410027629 CN 200410027629 A CN200410027629 A CN 200410027629A CN 1585344 A CN1585344 A CN 1585344A
Authority
CN
China
Prior art keywords
alarm
oscillating
report
reports
threshold value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 200410027629
Other languages
English (en)
Inventor
罗江凯
蒋贤忠
谢永辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN 200410027629 priority Critical patent/CN1585344A/zh
Publication of CN1585344A publication Critical patent/CN1585344A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Telephonic Communication Services (AREA)

Abstract

本发明的一种振荡告警的处理方法,其采用如下步骤:循环接收来自网元设备监控系统上报的告警;处理分析该告警;判断是否为振荡告警,如果是,就报告该告警为振荡告警。本发明方法,采用振荡告警处理方法以后,直接提示用户这是振荡告警,把真正有价值的信息提炼出来呈现给维护人员,使维护人员可以根据这些信息找出设备工作不稳定的瓶颈所在,从而快速定位并解决了故障,提高了系统的稳定性。

Description

一种振荡告警的处理方法
技术领域
本发明涉及一种通信领域的设备告警及其处理方法,尤其涉及的是通信设备网管系统的告警处理的方法。
背景技术
各种通信设备的告警处理功能在网管系统中占有越来越重要的地位,完善有效的告警处理方法不仅能使维护人员快速定位设备故障所在、及时避免可能造成的严重后果,而且可以根据历史告警统计出告警发生的规律、频度、时间以及容易产生告警的地点等信息,给用户对设备进行评估提供强有力的依据,同时也为系统设备运行提供预警机制。
目前,常用的告警处理方法是网管接收来自设备的告警上报信息,根据重要性对告警进行分级,如警告告警、次要告警、严重告警和重大告警等,把告警时间、地点、级别等信息分别记录在数据库中,系统及时以信号灯变化、语音提示、推屏、弹框、根据告警级别以不同颜色显示或通过Email前转等方式通知维护人员查看,进行相应的处理,直到上报告警恢复后该告警提示消失。但有的告警很特殊,如果按现有的处理方法进行处理,就不能反应真实的系统故障。如当系统设备工作不稳定时,在短时间内连续上报告警和告警恢复,有时维护人员还没有来得及处理告警就已经恢复了,只有通过对告警的历史日志进行查询并经过统计分析才能看出来这种特殊的告警,非常繁琐,或者根本就不会注意到这个告警,这样的告警就可能得不到及时处理,然而,这种告警正是系统工作不稳定的潜在因素,给整个系统的稳定运行埋下严重隐患,对这样的告警有必要进行进一步处理。
对于这种在短时间内不停的连续上报告警和告警恢复,虽然告警流水号不同,但实质上是同一种告警的重复上报,这类告警即为振荡告警,一般来说,在具有大量告警上报的时候,维护人员很难注意到它,因此往往得不到及时的处理和修复,从而会对系统的稳定性造成严重影响。因此,现有技术中的对振荡告警的处理存在缺陷,有待于改进和发展。
发明内容
本发明的目的在于克服现有网管系统的告警处理中没有对振荡告警进行针对性处理的缺点,提出一种振荡告警的处理方法,通过对系统上报告警进行分析,能够针对振荡告警进行识别和显示。
本发明的技术方案为:
一种振荡告警的处理方法,其采用如下步骤:
a)循环接收来自网元设备监控系统上报的告警;
b)处理分析该告警;
c)判断是否为振荡告警,如果是,就报告该告警为振荡告警。
所述的方法,其中,所述方法中还预先设置振荡告警门限值。
所述的方法,其中,所述设置振荡告警门限值还包括以下步骤:
01)设置门限值包括设置统计分析的时间段长度;
02)设置在所分析的时间段内上报的同一种类型告警数量。
所述的方法,其中,所述步骤a)还包括以下步骤:
a1)当设备运行状态由正常变为异常时则上报告警;
a2)如果发现上报的告警已经存在,则上报告警恢复,再次上报告警;
a3)当运行状态由异常转为正常,则上报告警恢复。
所述的方法,其中,所述步骤b)还包括以下步骤:
b1)对同一种告警建立告警队列;
b2)维护告警队列,采用先进先出的机制,即最先上报的告警最先出队列,始终保持队列中的所有告警的上报时间与当前时间之差不超过设置的统计分析时长;
b3)判断该告警队列中的告警总数是否超出设置的门限值,如果超出则报告为振荡告警。
本发明所提供的一种振荡告警的处理方法,由于采用振荡告警的分析方法,可以反映出设备的一些不容易引起维护人员足够重视的轻微故障,采用振荡告警处理方法以后,直接提示用户这是振荡告警,把真正有价值的信息提炼出来呈现给维护人员,使维护人员可以根据这些信息找出设备工作不稳定的瓶颈所在,从而快速定位并解决了故障,提高了系统的稳定性。同时,本方法不改变现有的告警处理流程,对系统性能和其他功能不造成影响。
附图说明
图1本发明的一种振荡告警的处理方法流程图。
具体实施方式
下面结合附图对振荡告警处理方法的具体实施方式作详细说明。
本发明的振荡告警的处理方法,如图1所示的,可采用以下步骤:
步骤一:设置振荡告警门限值;
步骤二:接收来自网元设备监控系统上报的告警;
步骤三:处理分析告警;
步骤四:判断是否振荡告警,如果是就报告该告警为振荡告警;
步骤五:回到步骤二,继续接收来自网元设备监控系统上报的告警。
其中,所述步骤一包括以下步骤:
1.1)设置门限值包括设置统计分析的时间段长度,如分析1分钟的时长;
1.2)设置在所分析的时间段内上报的同一种类型告警数量,如每1分钟内出现10次告警;
其中,所述步骤二包括以下步骤:
2.1)当设备运行状态由正常变为异常则上报告警;
2.2)如果发现上报的告警已经存在,则上报告警恢复,再次上报告警;
2.3)当设图示运行状态由异常转为正常,则上报告警恢复;
其中,所述步骤三包括以下步骤:
3.1)对同一种告警建立告警队列;
3.2)维护该告警队列,采用先进先出的机制,即最先上报的告警最先出队列;始终保持队列中的告警上报时间跟当前时间不超过设置的统计分析时间;
3.3)判断该告警队列中的告警总数是否超出设置的门限值,如果超出则报告为振荡告警。
本发明方法可以应用在各种网元设备的告警处理中,以PHS个人无线通信网络管理系统为例,本发明的振荡告警的处理方法的具体实施方式如下。
PHS网管系统包括故障处理子系统,其中振荡告警处理模块是故障处理子系统的一部份,以下是一些关键的数据结构定义。
1)告警节点
Typedef struct tagAlmNode
{
TIME            AlmTime;//上报告警时间
ALMSTRUT        AlmInfo;//告警详细信息
tagAlmNode*     pAlmNodeNext;//告警链表指针
}AlmNode;
告警节点是存放于告警队列中的单元,所记录的信息包括上报告警的时间,以及该告警相关的详细信息;
2)振荡告警分析类
class SurgAlmAnalyze
{
private:
int         iAna lyzeTimeLen;    //振荡告警统计时长
int         iAlmLimi tNum;       //振荡告警门限值
LIST        AlmNodeList;         //告警链表
public:
SurgAlmAnalyze(int iLimitTime,int iLimitNum);
//振荡告警分析构造函数,分析内存资源,创建告警链表和设置告警门限值
SurgAlmAnalyze();
//振荡告警分析析构函数,释放内存资源
AlmNode * AddAlmNodeToListTail(AlmNode * pAlmNode);
//在告警链表末尾加入告警节点
void    DeleteTimeOutAlmNode();
//从告警链表中删除超过统计时长的告警节点
int    ComputeTotalAlmNodeNum();
//计算告警链表中总的告警节点数
void    ReportAnalyzeResult();
//报告分析结果
}。
以上仅为本发明方法的一具体实施例的说明,需注意的是,不能因此而理解为对本发明的权利要求请求保护范围的限制。
按照图1的处理流程说明本发明方法如下:
步骤100:设置告警门限值,即设置振荡告警分析类的构造函数输入参数,ilimitTime-统计分析时长,iLimitNum-振荡告警数目;
步骤110:接受设备监控系统的告警上报,上报的告警结构为ALMSTRUCT,即告警相关的详细信息;
步骤120a:解析上报的告警数据,得到告警的告警类型,查看是否已经创建了该告警类型的告警链表(队列),如果没有创建,则构造振荡告警分析类对象,调用构造函数创建告警链表;
步骤120b:将上报的告警数据和当前的告警时间组成告警节点AlmNode,调用函数AlmNode * AddAlmNodeToListTail(AlmNode*pAlmNode),将节点加入到告警链表末尾;
步骤130a:判断告警链表中是否存在超过设置门限统计时长的告警节点,如果有调用函数void DeleteTimeOutAlmNode()将这些节点从告警链表中删除;
步骤130b:调用函数int ComputeTotalAlmNodeNum()计算出当前告警链表中总的告警节点个数;
步骤140:如果超过步骤100所设定的振荡告警门限值,则调用函数voidReportAnalyzeResult()报告有振荡告警产生;如果没有,则返回步骤110,继续接受新的告警上报。
在当设备工作不稳定的时候,就容易出现振荡告警。本发明方法采用振荡告警的分析方法,可以反应出设备的一些不容易引起维护人员足够重视的轻微故障;采用振荡告警处理方法以后,直接提示用户这是振荡告警,把真正有价值的信息提炼出来呈现给维护人员。维护人员可以根据这些信息找出设备工作不稳定的瓶颈所在,可以快速定位并解决故障,提高了系统的稳定性。同时,本方法不改变现有的告警处理流程,对系统性能不造成影响。
应当理解的是,本发明方法上述描述比较具体,针对具体实施例的描述并不能因此而理解为对本发明的请求保护范围的限制,其请求保护范围应以后附权利要求为准。

Claims (5)

1、一种振荡告警的处理方法,其采用如下步骤:
a)循环接收来自网元设备监控系统上报的告警;
b)处理分析该告警;
c)判断是否为振荡告警,如果是,就报告该告警为振荡告警。
2、根据权利要求1所述的方法,其特征在于,所述方法中还预先设置振荡告警门限值。
3、根据权利要求2所述的方法,其特征在于,所述设置振荡告警门限值还包括以下步骤:
01)设置门限值包括设置统计分析的时间段长度;
02)设置在所分析的时间段内上报的同一种类型告警数量。
4、根据权利要求3所述的方法,其特征在于,所述步骤a)还包括以下步骤:
a1)当设备运行状态由正常变为异常时则上报告警;
a2)如果发现上报的告警已经存在,则上报告警恢复,再次上报告警;
a3)当运行状态由异常转为正常,则上报告警恢复。
5、根据权利要求1~4任一权项所述的方法,其特征在于,所述步骤b)还包括以下步骤:
b1)对同一种告警建立告警队列;
b2)维护告警队列,采用先进先出的机制,即最先上报的告警最先出队列,始终保持队列中的所有告警的上报时间与当前时间之差不超过设置的统计分析时长;
b3)判断该告警队列中的告警总数是否超出设置的门限值,如果超出则报告为振荡告警。
CN 200410027629 2004-06-12 2004-06-12 一种振荡告警的处理方法 Pending CN1585344A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 200410027629 CN1585344A (zh) 2004-06-12 2004-06-12 一种振荡告警的处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 200410027629 CN1585344A (zh) 2004-06-12 2004-06-12 一种振荡告警的处理方法

Publications (1)

Publication Number Publication Date
CN1585344A true CN1585344A (zh) 2005-02-23

Family

ID=34601442

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 200410027629 Pending CN1585344A (zh) 2004-06-12 2004-06-12 一种振荡告警的处理方法

Country Status (1)

Country Link
CN (1) CN1585344A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100458859C (zh) * 2005-05-31 2009-02-04 华为技术有限公司 一种告警信息的处理方法
CN101039316B (zh) * 2006-03-17 2010-04-14 中兴通讯股份有限公司 振荡选择抑制方法
CN101267473B (zh) * 2007-03-16 2010-12-08 中兴通讯股份有限公司 一种振荡告警的处理方法
CN102594590A (zh) * 2012-02-06 2012-07-18 烽火通信科技股份有限公司 告警主动上报中对振荡告警的抑制方法
CN111176876A (zh) * 2019-12-27 2020-05-19 广东浪潮大数据研究有限公司 一种故障恢复确定方法、装置、设备及可读存储介质
CN111782462A (zh) * 2020-06-13 2020-10-16 华青融天(北京)软件股份有限公司 告警方法、装置和电子设备
CN111782462B (zh) * 2020-06-13 2024-05-24 华青融天(北京)软件股份有限公司 告警方法、装置和电子设备

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100458859C (zh) * 2005-05-31 2009-02-04 华为技术有限公司 一种告警信息的处理方法
CN101039316B (zh) * 2006-03-17 2010-04-14 中兴通讯股份有限公司 振荡选择抑制方法
CN101267473B (zh) * 2007-03-16 2010-12-08 中兴通讯股份有限公司 一种振荡告警的处理方法
CN102594590A (zh) * 2012-02-06 2012-07-18 烽火通信科技股份有限公司 告警主动上报中对振荡告警的抑制方法
CN102594590B (zh) * 2012-02-06 2015-01-14 烽火通信科技股份有限公司 告警主动上报中对振荡告警的抑制方法
CN111176876A (zh) * 2019-12-27 2020-05-19 广东浪潮大数据研究有限公司 一种故障恢复确定方法、装置、设备及可读存储介质
CN111176876B (zh) * 2019-12-27 2024-04-16 广东浪潮大数据研究有限公司 一种故障恢复确定方法、装置、设备及可读存储介质
CN111782462A (zh) * 2020-06-13 2020-10-16 华青融天(北京)软件股份有限公司 告警方法、装置和电子设备
CN111782462B (zh) * 2020-06-13 2024-05-24 华青融天(北京)软件股份有限公司 告警方法、装置和电子设备

Similar Documents

Publication Publication Date Title
CN101039498A (zh) 带有分布式告警处理的基站系统及其告警处理方法
CN101052020A (zh) 一种自动化测试执行过程的监控方法和系统
CN101446914B (zh) 一种数据库监控方法及装置
CN101034974A (zh) 基于时间序列和事件序列的关联分析攻击检测方法和装置
CN1878322A (zh) 故障定位的方法及装置
CN1741526A (zh) 网络异常流量的检测方法及系统
CN1655518A (zh) 网络安全系统和方法
CN1794646A (zh) 一种网络管理服务器从网元设备获取日志信息的方法
CN1536827A (zh) 网络管理器snmp陷阱抑制
CN1901568A (zh) 一种网管系统中实现历史性能采集的方法
CN1874272A (zh) 识别网络故障节点的方法
CN1946042A (zh) 基于aop技术的大规模集群管理监控系统中的报警方法
CN1722682A (zh) 网络监控系统
CN101076174A (zh) 告警风暴的处理方法
CN1863080A (zh) 一种告警管理方法和系统
CN1585344A (zh) 一种振荡告警的处理方法
CN1567851A (zh) 一种在网络管理系统中监控用户行为的方法
CN1175352C (zh) Windows nt进程自动保护系统
CN1901467A (zh) 一种快速处理告警的方法和系统
CN1852546A (zh) 一种用于基站系统的操作维护系统和方法
CN1266222A (zh) 系统应用软件管理方式及记录执行该方式程序的记录媒体
CN1175351C (zh) Solaris进程自动保护系统
CN1625125A (zh) 用于客户端设备的系统环境规则违反的检测方法
CN101064636A (zh) 网络管理系统和网元管理系统之间过滤告警的方法
CN1842997A (zh) 终端装置、终端装置的控制方法、网络系统及其控制方法、程序及记录介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication