CN102523137B - 一种故障监测方法、装置及系统 - Google Patents

一种故障监测方法、装置及系统 Download PDF

Info

Publication number
CN102523137B
CN102523137B CN201110447815.0A CN201110447815A CN102523137B CN 102523137 B CN102523137 B CN 102523137B CN 201110447815 A CN201110447815 A CN 201110447815A CN 102523137 B CN102523137 B CN 102523137B
Authority
CN
China
Prior art keywords
event
analyzed
threshold value
stable state
failure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201110447815.0A
Other languages
English (en)
Other versions
CN102523137A (zh
Inventor
欧阳辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Service Co Ltd
Original Assignee
Huawei Technologies Service Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Service Co Ltd filed Critical Huawei Technologies Service Co Ltd
Priority to CN201110447815.0A priority Critical patent/CN102523137B/zh
Publication of CN102523137A publication Critical patent/CN102523137A/zh
Application granted granted Critical
Publication of CN102523137B publication Critical patent/CN102523137B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明实施例提供一种故障监测方法、装置及系统,其中该方法包括:当监测到上报的故障事件时,根据事件分析规则确定所述上报的事件为待分析事件时,获得所述待分析事件的持续时间;若所述待分析事件的持续时间小于所述事件分析规则中与所述待分析事件关联的持续时间阈值,标记所述待分析事件为瞬态事件;若所述待分析事件的持续时间大于或等于所述事件分析规则中与所述待分析事件关联的持续时间阈值,标记所述待分析事件为稳态事件,并上报所述待分析事件或者被标记为稳态事件的所述待分析事件,从而能够有效监测出故障事件中的稳态事件和瞬态事件,避免真正故障事件的丢失,提高维护人员处理故障事件的效率。

Description

一种故障监测方法、装置及系统
技术领域
本发明涉及设备监控领域,尤其涉及一种故障监测方法、装置及系统。
背景技术
由于网络闪断、设备接口接触不好、单板松动等原因,设备会上报大量的故障事件(故障事件可以是一种消息,代表设备的某种故障)到监控系统,当设备检测到故障已修复,会产生相应的清除事件。如果故障事件的持续时间(指从事件产生到事件清除的时间)很短,说明故障通常可以自动修复成功,不需要人为干预;如果故障事件的持续时间很长或故障事件在短时间内反复发生很多次,说明此类故障可能需要人为干预才能修复,需要用户重点关注。
现有的故障监测技术采用一种事件过滤的方法来过滤掉设备的一些可能会自我修复的故障事件,仅向用户上报其认为重要的事件,并将持续时间小于阈值的事件全部丢弃,忽略了某些事件反复发生的情况,容易将真正的故障事件丢弃;且只要持续时间小于阈值的事件就会被丢弃,用户后续做故障事件统计分析时缺少一个完整的故障事件视图,影响用户统计分析工作。
发明内容
本发明实施例提供一种故障监测方法、装置及系统,一定程度上避免真正故障丢失的问题。
为了解决上述技术问题,本发明实施例提供如下技术方案:
本发明实施例提供一种故障监测方法,该方法包括:
当监测到上报的故障事件时,根据事件分析规则确定所述上报的事件为待分析事件时,获得所述待分析事件的持续时间;
若所述待分析事件的持续时间小于所述事件分析规则中与所述待分析事件关联的持续时间阈值,标记所述待分析事件为瞬态事件;
若所述待分析事件的持续时间大于或等于所述事件分析规则中与所述待分析事件关联的持续时间阈值,标记所述待分析事件为稳态事件,并上报所述待分析事件或者被标记为稳态事件的所述待分析事件。
本发明实施例还提供一种故障监测装置,该装置包括:规则匹配模块、第一分析模块、事件标记模块和事件上报模块;
所述规则匹配模块用于:当监测到上报的故障事件时,根据事件分析规则确定所述上报的事件为待分析事件;
所述第一分析模块用于:获得所述待分析事件的持续时间,若所述待分析事件的持续时间小于所述事件分析规则中与所述待分析事件关联的持续时间阈值,由所述事件标记模块标记所述待分析事件为瞬态事件;若所述待分析事件的持续时间大于或等于所述事件分析规则中与所述待分析事件关联的持续时间阈值,由所述事件标记模块标记所述待分析事件为稳态事件。
所述事件标记模块用于:标记所述待分析事件为瞬态事件,或稳态事件;
所述事件上报模块用于:上报标记为稳态事件的所述待分析事件或未标记但确定为稳态事件的所述待分析事件。
本发明实施例还提供一种监控系统,该系统包括监控终端和监控服务器,其中:
所述监控终端用于:接收所述监控服务器上报的故障事件;
所述监控服务器用于:当监测到上报的故障事件时,根据事件分析规则确定所述上报的事件为待分析事件时,获得所述待分析事件的持续时间;若所述待分析事件的持续时间小于所述事件分析规则中与所述待分析事件关联的持续时间阈值,标记所述待分析事件为瞬态事件;若所述待分析事件的持续时间大于或等于所述事件分析规则中与所述待分析事件关联的持续时间阈值,标记所述待分析事件为稳态事件,并上报所述待分析事件或者被标记为稳态事件的所述待分析事件。
可见,本发明实施例提供一种故障监测的方法、装置及系统,通过当监测到上报的故障事件时,根据事件分析规则确定所述上报的事件为待分析事件时,获得所述待分析事件的持续时间;若所述待分析事件的持续时间小于所述事件分析规则中与所述待分析事件关联的持续时间阈值,标记所述待分析事件为瞬态事件;若所述待分析事件的持续时间大于或等于所述事件分析规则中与所述待分析事件关联的持续时间阈值,标记所述待分析事件为稳态事件,并上报所述待分析事件或者被标记为稳态事件的所述待分析事件,从而能够有效监测出故障事件中的稳态事件和瞬态事件,在一定程度上避免真正故障事件的丢失,从而提高维护人员处理故障事件的效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种故障监测方法的流程示意图;
图2为本发明实施例提供的另一种故障监测方法的流程示意图;
图3为本发明实施例提供的一种故障监测方法的具体流程示意图;
图4为本发明实施例提供的一种故障监测方法的原理示例图;
图5为本发明实施例提供的一种故障监测装置的结构示意图;
图6为本发明实施例提供的另一种故障监测装置的结构示意图;
图7为本发明实施例提供的一种事件分析规则的逻辑结构示例图;
图8为本发明实施例提供的一种监控系统的结构示意图;
图9为本发明实施例提供的一种监控系统的物理部署示意图;
图10为本发明实施例提供的一种监控系统的电信网络部署示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了便于本领域普通技术人员理解和实现本发明,首先介绍本发明实施例涉及的几个定义:
瞬态事件,指持续时间小于指定的阈值的消息,代表通常故障自动修复成功。瞬态事件代表了一种瞬态故障。
稳态事件,指持续时间达到指定的阈值的消息,代表一种稳态故障,需要人为干预才成修复。稳态事件代表了一种稳态故障。
瞬态故障,故障持续时间小于指定的阈值的故障,通常可以在比较短的时间内自动修复,不需要人为干预。
稳态故障,指故障持续时间超过指定的阈值,或故障反复发生超过指定的阈值,是一种真正的故障。
持续时间,指从事件产生到事件清除的时间段(当设备检测到故障已修复,会产生相应的清除事件)。
同一类事件,指事件名称+事件源信息相同的事件,也可以根据需要自定义。
请参阅图1,为本发明实施例一提供的一种故障监测方法的流程示意图,该方法可以应用于传统电信网管、企业网等领域,具体该方法可以应用于包括监控终端和监控服务器的监控系统,更具体的,该方法的执行主体可以是监控服务器,如图1所示,该方法可以包括:
S101、当监测到上报的故障事件时,根据事件分析规则确定所述上报的事件为待分析事件时,获得所述待分析事件的持续时间;
具体的,在一种实现方式下,当故障系统的监控服务器监测到设备上报的故障事件时,首先,提取所述上报的故障事件的事件属性信息,所述事件属性信息可以包括事件名称和事件源信息等事件信息;将所述故障事件的事件名称和事件源信息与所述事件分析规则中的规则项匹配,若匹配成功,确定所述上报的事件为待分析事件。在本发明实施例中,事件名称和事件源信息联合起来可以用来做唯一确定一个事件的标识,其中事件名称表示该故障事件的种类,事件源信息表示该故障事件发生的位置,可以是事件发生的设备标识,或者如果监控粒度更小,可以是该设备包含的子对象的标识。
在另一种实现方式下,故障事件也可以只有一个标识(该标识可能是事件名称与事件源信息的任意一个或其它事件的属性信息),事件分析规则相应的也通过该标识来标识故障事件,这样二者只通过一个标识的匹配就可以获得匹配结果。本发明实施例中事件信息里负责确定唯一事件的事件名称和事件源信息,与之匹配的事件分析规则中也需要包含事件名称与事件源信息标识,本领域普通技术人员据此容易想到可以修改此唯一确定一个事件的标识,只是事件分析规则中与之匹配的信息也需要修改,这种改变依然应用了本发明实施例提供的思想,因此也应在本发明实施例保护的范围之内。
需要说明的是,本发明实施例提供的监控服务器中包含的事件分析规则代表的是故障监控人员根据故障事件发生的经验总结的故障事件的规律,可以包括事件名称、事件源信息标识、持续时间阈值、间隔时间、发生次数阈值等属性信息,事件分析规则可以是监控服务器通过对发生过的故障事件进行自学习获得,也可以由监控人员通过监控终端配置好后下发。另外,确定待分析事件的过程可以是系统根据事件分析规则自动完成的,也可以是人工确定的。应当理解的是,本发明实施例提供的事件分析规则在一种实现方式下,可以是事件分析规则表,对于事件分析规则表中每一个规则项包括事件名称、事件源信息标识、持续时间阈值、间隔时间、发生次数阈值等属性信息。
如果依照上述过程确定监测到的故障事件为待分析事件,即可以理解为该待分析事件在以前发生过,并由监控人员记录过相关规律,根据已经记录的规律对这种待分析事件分析进行分析,分析之前首先计算该待分析事件的持续时间,计算过程可以如下:
启动所述待分析事件的持续时间计算,可以在接收到该故障事件时或确定该故障事件是待分析事件时启动一个计时器开始计算该故障事件的持续时间,前一种方案对于那些不是待分析事件的故障事件计时器会在确定其不为待分析事件是停止计时。
当接收到所述待分析事件的结束消息时,停止计算,获得所述待分析事件的持续时间。在一种实现方式下,如前述启用一个计时器计时故障的持续时间;在另一种实现方式下,由于结束消息可以携带时间信息,因此可以通过故障事件对应的消除事件和故障事件本身发生的时间之差计算出持续时间。
值得注意的是,依照上述方法可以获得该待分析事件的具体持续时间,如果对系统不需要记录详细的持续时间,也可以在计时器计算的持续时间大于或等于特定持续时间阈值时就停止计算,此特定持续时间阈值可以与后续步骤S102中的持续时间阈值相等。
另外,需要说明的是,若该事件信息与所述事件分析规则中的规则项匹配不成功,说明该故障事件没有包含在这个预先设置的事件分析规则中,这种情况代表该故障事件可能以前没有发生过或发生次数相对较少,所以没有被记录相关信息,此时为了避免丢失重要故障事件,可以直接上报此未知故障事件,以供设备维护人员进行分析处理,当然也可以不上报,对此本发明实施例不做限定。
S102、若所述待分析事件的持续时间小于所述事件分析规则中与所述待分析事件关联的持续时间阈值,标记所述待分析事件为瞬态事件;
若步骤S101计算获得的该待分析事件的持续时间小于事件分析规则中与该待分析事件关联的持续时间阈值,可以标记该待分析事件为瞬态事件,具体可以通过扩展该待分析事件的信息字段,将该扩展出的信息字段表示为“瞬态”,例如字段00代表瞬态标记。在一种实现方式下,为每个故障事件设置一个标志位。当确定故障事件是稳态事件时,将其对应的标志位设置为“稳态”或10;同理,当确定故障事件是瞬态事件时,将其对应标志位设置为“瞬态”或00。
应当理解的是,本发明实施例中的持续时间阈值可以是一个具体的值,例如10s,也可以是一段取值范围,例如[10s,20s]等。
另外,需要说明的是,步骤S102当确定所述待分析事件为瞬态事件时,也可以同时设置将该待分析事件或已标记为瞬态事件的该待分析事件上报给监控客户端,本发明实施例对此不做限定。
S103、若所述待分析事件的持续时间大于或等于所述事件分析规则中与所述待分析事件关联的持续时间阈值,标记所述待分析事件为稳态事件,并上报所述待分析事件或者被标记为稳态事件的所述待分析事件。
若步骤S101计算获得的该待分析事件的持续时间大于或等于前述事件分析规则中与该待分析事件关联的持续时间阈值,说明该待分析事件可能代表一种需要人工干预才能修复的稳态故障,因此需要上报该待分析事件,这里需要注意的是,上报的待分析事件可以是经过标记为稳态事件的,也可以没有经过标记直接上报(因为通常情况下只要上报的故障事件设备维护人员都应该进行处理),本发明实施例不做限定。具体标记的实现方式可以参照步骤S102,在此不再赘述。
需要说明的是,步骤S103里标记的瞬态事件也可以及时上报给监控系统客户端,本发明实施例没有限定的意思。
综上所述,本发明实施例提供的故障事件监测方法,当监测到上报的故障事件时,根据事件分析规则确定所述上报的事件为待分析事件时,获得所述待分析事件的持续时间;若所述待分析事件的持续时间小于所述事件分析规则中与所述待分析事件关联的持续时间阈值,标记所述待分析事件为瞬态事件;若所述待分析事件的持续时间大于或等于所述事件分析规则中与所述待分析事件关联的持续时间阈值,标记所述待分析事件为稳态事件,并上报所述待分析事件或者被标记为稳态事件的所述待分析事件,从而能够有效监测出稳态事件和瞬态事件,一定程度上避免真正故障事件的丢失,提高维护人员处理故障事件的效率。
进一步的,请参阅图2,为本发明实施例二提供的另一种故障监测方法的流程示意图。如图2所示,本发明实施例二提供的故障监测方法除上述步骤S101至步骤S103之外还可以包括:
S201、于统计时间段阈值内,统计同一类瞬态事件的发生次数;其中,所述同一类瞬态事件表示标记为瞬态事件且至少包含事件名称、事件源信息的事件属性信息相同的一类事件,所述统计时间段阈值为所述事件分析规则中与所述同一类瞬态事件关联的统计时间段阈值;
在一种优选的实现方式下,瞬态事件中不同事件名称和事件源信息对应的不同类别事件可以具有不同的统计时间段阈值,和/或,不同给的发生次数阈值;在另一种实现方式下,所有瞬态事件可以具有统一的统计时间段阈值,和/或发生次数阈值。
需要说明的是,在本发明实施例中所述同一类瞬态事件可以指事件名称和事件源信息都相同的瞬态事件;在其它实施例中,“同一类”也可以利用其它的事件信息来限制,例如事件的定位信息或附加信息等。该同一类瞬态事件的限定可以根据实际需要自主定义,本发明实施例不做限定。
S202、若所述同一类瞬态事件的发生次数大于或等于发生次数阈值,基于所述同一类瞬态事件生成一条非原始故障事件(不是设备上报的故障事件),所述非原始故障事件被标记为稳态事件,并上报所述非原始故障事件或标记为稳态事件的所述非原始故障事件;其中,所述发生次数阈值为所述事件分析规则中与所述同一类瞬态事件关联的发生次数阈值。
在一种优选的实现方式下,本发明实施例中向监控终端上报的这条代表所述同类瞬态事件的非原始故障事件,可以是一条由监控服务器新建的故障事件;在另一种实现方式下,如果监控系统对设备产生的瞬态事件并不是特别关注,也可以将同类瞬态事件中的其中一条瞬态事件的进行修改获得一条新的稳态事件,但是这种实现方式会丢失一条瞬态事件的信息。
可选的,本发明实施例中所述非原始故障事件可以包含事件名称、事件源信息、事件级别和稳态事件标记等信息,其中所述事件名称、事件源信息的属性值与所述同一类瞬态事件相同,所述事件级别的属性值可以较同一类瞬态事件的事件级别的原属性值高一级或多级。应当理解的是,故障监控系统中事件级别可以用来表示故障事件的紧急程度,因此本发明实施例这样实现可以表示该新生成的故障事件的紧急程度比那些同类瞬态事件要高一些。
另外,所述非原始故障事件的稳态标记与步骤S103标记的稳态事件的标识可以相同,也可以不同。根据前述实施例的描述,步骤S103标记的稳态事件(本发明实施例中可以理解为设备上报的原始故障事件)的稳态标记可以为10,为了区分该非原始的稳态事件以便于设备维护人员统计和分析,可以将该非原始的稳态事件的稳态标记确定为11。
应当理解的是,以上三种故障事件:设备上报的瞬态事件、稳态事件以及监控服务器生成的非原始稳态事件的事件级别属性可以相同也可以不同。
需要说明的是,区分非原始稳态事件和原始稳态事件、或者区分非原始稳态事件和那些同一类瞬态事件的目的是便于设备维护人员或网络管理人员等进行故障事件的详细分类、统计和故障的分析,若当前的设备根据实际情况并不需要对故障事件如此细化处理,也可以不做区分,本发明实施例对此不做限定。
更进一步的,如图2所示,为了支持设备维护人员等对后续故障事件的统计和分析,本发明实施例二提供的故障监测方法还可以包括:
S301、存储所述瞬态事件和稳态事件;
将本发明实施例中标记出的三种类型的故障事件都存储在监控服务器或与监控服务器具有通信连接的存储设备中,例如监控服务器后台数据库或网络存储设备。如果需要有效区分三种类型的故障事件,存储的事件信息里应当包括事件的瞬态标识和稳态标识,若有级别标识,也应当存储该级别标识。
应当理解的是,在一种实现方式下,为了方便后续查询统计分析,所述瞬态事件和稳态事件可以分别存储于不同的存储空间中,例如,分别存储于监控服务器后台数据库的不同存储空间中。S302、根据故障事件查询请求返回与所述故障事件查询请求中包含的查询条件所对应的故障事件,所述查询条件包括瞬态事件、稳态事件或全部事件中的一个或任意组合。
监控终端根据设备维护人员的需求向监控服务器发送故障事件查询请求,故障事件查询请求可以为请求查询所有瞬态事件、请求查询所有稳态事件或请求查询全部事件中的一个或任意组合。
监控服务器可以通过稳态标识、瞬态标识和/或级别标识来过滤掉不需要的故障事件,将请求的故障事件发送给监控终端。
应当理解的是,图2所示的方法只是本发明实施例中的一个,本发明实施例提供的故障监测方法也可以只有步骤S102至步骤S103和步骤S301至步骤S302,只是此时没有对同一类的瞬态事件进行处理而生成非原始的故障事件,因此存储的故障事件只是原始的稳态或瞬态事件。综上所述,本发明实施例提供的故障事件监测方法,当监测到上报的故障事件时,根据事件分析规则确定所述上报的事件为待分析事件时,获得所述待分析事件的持续时间;若所述待分析事件的持续时间小于所述事件分析规则中与所述待分析事件关联的持续时间阈值,标记所述待分析事件为瞬态事件;若所述待分析事件的持续时间大于或等于所述事件分析规则中与所述待分析事件关联的持续时间阈值,标记所述待分析事件为稳态事件,并上报所述待分析事件或者被标记为稳态事件的所述待分析事件,从而能够有效监测出稳态事件和瞬态事件,一定程度上避免真正故障事件的丢失,提高维护人员处理故障事件的效率。
进一步的,本发明实施例通过于统计时间段阈值内,统计同一类瞬态事件的发生次数;其中,所述同一类瞬态事件表示标记为瞬态事件且至少包含事件名称、事件源信息的事件属性信息相同的一类事件;若所述同一类瞬态事件的发生次数大于或等于发生次数阈值,基于所述同一类瞬态事件生成一条非原始故障事件,所述非原始故障事件被标记为稳态事件,并上报所述非原始故障事件,从而准确监测出反复发生的瞬态事件实际也可能代表一种需要人工干预的稳态故障(换言之,当某类瞬态故障反复发生超过一定的阈值后代表设备的一种真正故障),提高了监控服务器的故障监测性能。再进一步的,本发明实施例通过存储所有故障事件,并根据故障事件查询请求发送请求查询的故障事件,例如,支持查看稳态事件、查看瞬态事件或查看完整事件视图,从而为设备维护人员保存了完整的事件视图,有利于后续的事件统计分析,进而提高了设备维护人员的工作效率。
请参与图3,为本发明实施例提供的故障监测方法的具体流程示意图,详见图3,该方法涉及到用户或设备维护/分析人员等、监控终端、监控服务器以及需要故障监测的设备。
步骤401、用户或设备维护人员设置事件分析规则,该规则可以包括事件名称、设备DN(Distinguished Name,DN发生故障的设备的标识)、持续时间阈值、统计间隔时间、发生次数阈值等属性信息。其中事件的持续时间阈值、统计时间段、发生次数阈值等属性信息是用户或设备维护人员根据发生过的此类事件总结出的规律。
需要说明的是,本领域普通技术人员应当理解本发明实施例并无限定这种事件分析规则如何获得的意思,可以人为分析获得,也可以通过算法分析获得,还可以通过本发明实施例提供的监控系统获得一些故障数据之后分析获得,并且用户可以根据需求的改变更新或重新设置该事件分析规则。
步骤402、监控终端下发该事件分析规则到监控系统服务器。
步骤403、监控服务器存储此事件分析规则,可以存储在监控服务器后台数据库中,也可以以程序代码的形式存储。
步骤404、监控服务器存储完成之后可以向监控系统客户端返回一个设置结果,以通知客户端操作已完成。
步骤405、设备检测到故障之后向监控服务器上报故障事件。该故障事件可以以消息的形式实现,该消息包含事件名称和设备DN等事件信息。如图4所示,设备上报事件名称分别为1、2、3和4的四个事件。
步骤406、监控服务器将事件信息与前述事件分析规则进行匹配,查看以事件名称和设备DN标识的事件是否存在在此事件分析规则中。若匹配成功,执行步骤407;若匹配不成功,如图3所示,可以将此故障事件直接上报给监控终端,以免遗漏关键故障。
步骤407、如果步骤406的匹配成功,那么表明该故障事件存在于事件分析规则中,即该故障发生过并且极有可能符合已经总结出的规律,那么缓存该事件并启动一个计时器计算,当接收到该故障事件的结束消息或计时器计时等于或大于该故障事件在所述预先设置的事件分析规则中对应的持续时间阈值时,停止计时器,获得该故障事件的持续时间。
步骤408、根据步骤407获得的持续时间与该故障事件在事件分析规则中对应的持续时间阈值进行比较(在步骤406匹配成功时,该故障事件的事件名称和设备DN在事件分析规则匹配成功的规则项中对应一个持续时间阈值),若持续时间小于该持续时间阈值,设置该故障事件的属性标识为“瞬态”,并缓存该故障事件;若持续时间大于或等于该持续时间阈值,设置该故障事件的属性标识为“稳态”即代表第一种类型的稳态事件,可以直接上报给监控系统客户端,也可以后续步骤中再上报。
如图4所示1、2、3、4四个事件假设在步骤407中都匹配成功,则经过步骤408之后1、2和4三个事件持续时间小于各自的持续时间阈值,所以分别被标识为“瞬态”,2事件持续时间大于其阈值,被标识为“稳态”。
步骤409、对缓存中存储的同一类瞬态事件进行发生次数的统计。“同一类”可以指事件名称和设备DN相同,也可以根据需求自主定义。统计发生次数的间隔时间可以是该类故障事件在稳态事件分析规则中对应的统计间隔时间。
步骤410、如果在统计间隔时间内同一类瞬态事件的发生次数大于或等于发生次数阈值,那么认为此类事件代表一种稳态故障。因此创建一条新的事件,该事件代表这一类瞬态事件,并将该新事件的属性标识为“稳态”,事件信息可以与原始同类瞬态事件相同,只是持续时间是原始瞬态事件第一次发生到最后一次发生的时间间隔,同时该新的稳态事件的级别属性比原始瞬态事件和前述第一种类型的稳态事件高一个级别。
如图4所示,图中1、2和3三个事件经过步骤409之后发现其实三者的事件名称和设备DN相同,属于同一类瞬态事件,而且3次发生超过了发生次数阈值,那么产生一条新的事件1’,并将其标识为“稳态”。
下面通过一个具体的示例介绍事件被打上瞬态或稳态标识以及根据反复发生的瞬态事件产生新的稳态事件的过程。如表1所示:
表1
表1中通过事件名称、告警源、定位信息(其中告警源和定位信息可以看做事件源信息信息)将事件区分为三类,且这三类事件分别具有重要、普通和紧急的级别。通过对事件的持续时间与相对应的持续时间阈值进行比较后,得到表2。
需要说明的是,表1中全部三个瞬态事件是一类,但实际应用中还存在其它类别的瞬态事件,表1限于篇幅限制只是举例说明,并无限定所有瞬态事件都是一类的意思。
表2中持续时间大于所对应的持续时间阈值的重要和紧急的故障事件都表标识为“稳态”,其余三个同类的普通级别的故障事件都被标识为“瞬态”。
表2
然后采用步骤409和步骤410的方法根据表2中同一类的三个瞬态事件产生一条新的级别为重要的稳态事件,如表3所示,该重要事件的事件名称和事件源信息都与原来的瞬态事件相同,其持续时间可以设置为三个瞬态事件中第一个到最后一个事件发生时间的间隔,即19∶15∶20到19∶18∶15的时间间隔175s,当然也可以设置为三个瞬态事件的持续时间之和,即4.0850s,具体可以根据实际应用中利用该持续时间做什么来确定。
表3
步骤411、保存所有故障事件。将所有故障事件(包括设备上报的和监控服务器根据反复发生的瞬态事件而产生的稳态事件)存储在监控服务器的后台数据库中。
步骤412、上报带“稳态标识”的事件到监控系统客户端。
步骤413、监控系统客户端可以向用户展现故障事件,并支持按“稳态标识”属性进行过滤(详见图4)。监控时可以只关注稳态事件,统计分析人员定期故障根因分析、经验总结等工作时可以关注所有事件。
综上所述,本发明实施例提供的故障事件监测方法,当监测到上报的故障事件时,根据事件分析规则确定所述上报的事件为待分析事件时,获得所述待分析事件的持续时间;若所述待分析事件的持续时间小于所述事件分析规则中与所述待分析事件关联的持续时间阈值,标记所述待分析事件为瞬态事件;若所述待分析事件的持续时间大于或等于所述事件分析规则中与所述待分析事件关联的持续时间阈值,标记所述待分析事件为稳态事件,并上报所述待分析事件或者被标记为稳态事件的所述待分析事件,从而能够有效监测出稳态事件和瞬态事件,一定程度上避免真正故障事件的丢失,提高维护人员处理故障事件的效率。
进一步的,本发明实施例通过于统计时间段阈值内,统计同一类瞬态事件的发生次数;其中,所述同一类瞬态事件表示标记为瞬态事件且至少包含事件名称、事件源信息的事件属性信息相同的一类事件;若所述同一类瞬态事件的发生次数大于或等于发生次数阈值,基于所述同一类瞬态事件生成一条非原始故障事件,所述非原始故障事件被标记为稳态事件,并上报所述非原始故障事件,从而准确监测出反复发生的瞬态事件实际也可能代表一种需要人工干预的稳态故障,提高了监控服务器的故障监测性能。
再进一步的,本发明实施例通过存储所有故障事件,并根据故障事件查询请求发送请求查询的故障事件,从而为设备维护人员保存了完整的事件视图,有利于后续的事件统计分析,进而提高了设备维护人员的工作效率。
请参与图5,为本发明实施例提供一种故障事件监测装置的逻辑结构示意图,如图5所示,该监测装置包括:
规则匹配模块11,用于当监测到上报的故障事件时,根据事件分析规则确定所述上报的事件为待分析事件;
具体的,当监测到上报的故障事件时,提取所述故障事件的事件信息,所述事件信息包括事件名称和事件源信息;
将所述故障事件的事件信息与所述事件分析规则中的规则项匹配,若匹配成功,确定所述上报的事件为待分析事件。
事件分析规则可以实现为一个存储着各种事件及其对应的持续时间阈值等信息的表格,参见图7,为本发明实施例提供的一种事件分析规则的逻辑结构示例图,其中包括字段事件名称、事件源信息、持续时间阈值、统计时间段阈值以及发生次数阈值等。将提取出的事件名称和事件源信息信息与此事件分析规则中的事件名称和事件源信息信息进行匹配,若此故障事件存在在事件分析规则中,那么就确定此故障事件为待分析故障事件。
第一分析模块12,用于获得所述待分析事件的持续时间,若所述待分析事件的持续时间小于所述事件分析规则中与所述待分析事件关联的持续时间阈值,由所述事件标记模块标记所述待分析事件为瞬态事件;若所述待分析事件的持续时间大于或等于所述事件分析规则中与所述待分析事件关联的持续时间阈值,由所述事件标记模块标记所述待分析事件为稳态事件。
具体的,启动所述待分析事件的持续时间计算;
当接收到所述待分析事件的结束消息时或者当持续时间大于或等于所述待分析事件的持续时间阈值时,停止计算,获得代表所述待分析事件的持续时间的一个时间值。
事件标记模块13,用于标记所述待分析事件为瞬态事件,或稳态事件;
事件上报模块14,用于上报标记为稳态事件的所述待分析事件或未标记但确定为稳态事件的所述待分析事件。如图5所示,事件上报模块14可以直接上报第一分析模块12确定的稳态事件,也可以待事件分析模块13对此稳态事件进行标记后再上报。
进一步的,如图6所示,本发明实施例提供的故障监测装置还可以包括:
第二分析模块21,于统计时间段阈值内,统计同一类瞬态事件的发生次数;其中,所述同一类瞬态事件表示标记为瞬态事件且至少包含事件名称、事件源信息的事件属性信息相同的一类事件,所述统计时间段阈值为所述事件分析规则中与所述同一类瞬态事件关联的统计时间段阈值;若所述同一类瞬态事件的发生次数大于或等于发生次数阈值,基于所述同一类瞬态事件生成一条非原始故障事件,所述非原始故障事件被标记为稳态事件,并上报所述非原始故障事件或标记为稳态事件的所述非原始故障事件;其中,所述发生次数阈值为所述事件分析规则中与所述同一类瞬态事件关联的发生次数阈值。
相应的,事件标记模块13还用于:标记所述非原始故障事件为稳态事件;
需要说明的是,第二分析模块产生的非原始故障事件可以由事件标记模块13进行标记,也可以在产生时直接携带稳态标识(也可称为稳态标记)。
事件上报模块14还用于:上报所述第二分析模块生成的所述非原始故障事件或标记为稳态事件的所述非原始故障事件。
再进一步的,如图6所示,本发明实施例提供的故障监测装置还可以包括:
事件存储模块31,用于存储所述瞬态事件和稳态事件;如图6所示,本发明实施例中存储事件的动作发生在事件由事件标记模块13标记上稳态或瞬态标识之后。
事件过滤模块32,用于根据故障事件查询请求返回与所述故障事件查询请求中包含的查询条件所对应的故障事件,所述查询条件包括瞬态事件、稳态事件或全部事件中的一个或任意组合。
如图6所示,事件过滤模块32根据故障事件查询请求对存储的故障事件进行选择(过滤)后可以通过事件上报模块14上报用户需求的故障事件。
需要说明的是,本发明实施例提供的模块划分仅供本领域普通技术人员参考,并无限定的意思。另外,图6仅是举例说明,在图6所示的基础上,本发明实施例提供的故障监测装置也可以不包括第二分析模块21,即不对同一类的瞬态事件进行相应处理,仅处理和保存设备上报的原始故障事件。
综上所述,本发明实施例提供的故障事件监测装置,当监测到上报的故障事件时,根据事件分析规则确定所述上报的事件为待分析事件时,获得所述待分析事件的持续时间;若所述待分析事件的持续时间小于所述事件分析规则中与所述待分析事件关联的持续时间阈值,标记所述待分析事件为瞬态事件;若所述待分析事件的持续时间大于或等于所述事件分析规则中与所述待分析事件关联的持续时间阈值,标记所述待分析事件为稳态事件,并上报所述待分析事件或者被标记为稳态事件的所述待分析事件,从而能够有效监测出稳态事件和瞬态事件,一定程度上避免真正故障事件的丢失,提高维护人员处理故障事件的效率。
进一步的,本发明实施例提供的故障监测装置通过于统计时间段阈值内,统计同一类瞬态事件的发生次数;其中,所述同一类瞬态事件表示标记为瞬态事件且至少包含事件名称、事件源信息的事件属性信息相同的一类事件;若所述同一类瞬态事件的发生次数大于或等于发生次数阈值,基于所述同一类瞬态事件生成一条非原始故障事件,所述非原始故障事件被标记为稳态事件,并上报所述非原始故障事件,从而准确监测出反复发生的瞬态事件实际也可能代表一种需要人工干预的稳态故障,提高了监控服务器的故障监测性能。
再进一步的,本发明实施例提供的故障监测装置通过存储所有故障事件,并根据故障事件查询请求发送请求查询的故障事件,从而为设备维护人员保存了完整的事件视图,有利于后续的事件统计分析,进而提高了设备维护人员的工作效率。
请参阅图8,为本发明实施例提供的一种监控系统,如图8所示,该监控系统包括监控终端501和监控服务器502,其中监控终端可以有一个或多个,监控服务器也可以有一个或多个。
监控终端501用于:接收所述监控服务器上报的故障事件;
监控服务器502用于:当监测到设备503(设备虽都用标号503表示,但并无限定这些设备必须都是同一种设备的意思,同样前述监控终端也是如此,这里的设备可以理解为事件源)上报的故障事件时,根据事件分析规则确定所述上报的事件为待分析事件时,获得所述待分析事件的持续时间;若所述待分析事件的持续时间小于所述事件分析规则中与所述待分析事件关联的持续时间阈值,标记所述待分析事件为瞬态事件;若所述待分析事件的持续时间大于或等于所述事件分析规则中与所述待分析事件关联的持续时间阈值,标记所述待分析事件为稳态事件,并上报所述待分析事件或者被标记为稳态事件的所述待分析事件。
进一步的,监控服务器502还用于:于统计时间段阈值内,统计同一类瞬态事件的发生次数;其中,所述同一类瞬态事件表示标记为瞬态事件且至少包含事件名称、事件源信息的事件属性信息相同的一类事件,所述统计时间段阈值为所述事件分析规则中与所述同一类瞬态事件关联的统计时间段阈值;若所述同一类瞬态事件的发生次数大于或等于发生次数阈值,基于所述同一类瞬态事件生成一条非原始故障事件,所述非原始故障事件被标记为稳态事件,并上报所述非原始故障事件或标记为稳态事件的所述非原始故障事件;其中,所述发生次数阈值为所述事件分析规则中与所述同一类瞬态事件关联的发生次数阈值。
进一步的,监控终端501还用于:向所述监控服务器发送故障事件查询请求,所述故障事件查询请求包括瞬态事件、稳态事件或全部事件中的一个或任意组合所表示的查询条件;相应的,监控服务器502还用于:存储所述瞬态事件和稳态事件,并根据所述故障事件查询请求向所述监控终端返回与所述故障事件查询请求中包含的查询条件所对应的故障事件。
再进一步的,监控终端501还用于:根据用户的设置配置所述事件分析规则,并向所述监控服务器发送所述事件分析规则;相应的,监控服务器502还用于接收所述监控客户端发送的所述事件分析规则。
需要说明的是,本发明实施例提供的监控系统中监控终端和监控服务器进一步增加的功能可以与其主要功能任意组合使用,本发明实施例对此不做限定。
需要说明的是,本发明实施例提供的监控系统可以采用客户端/服务器(Client/Server,C/S)结构,也可以采用浏览器/服务器(Browser/Server,B/S)结构;监控终端和监控服务器可以同时部署在一台物理机上,例如以虚拟机的形式部署在一台物理机上,也可以分别部署在两台独立的具有通信连接的物理机上;监控系统可以有一或多个监控终端,也可以有一或多个监控服务器。
图9为本发明实施例提供的监控系统的物理部署示意图,如图9所示,监控终端和监控服务器分别部署在独立的具有通信连接的物理机上,即监控终端部署在物理机501上,监控服务器部署在物理机502上;监控系统各种可以有一或多个监控终端,也可以有一或多个监控服务器。需要说明的是,本发明实施例提供的物理机可以是物理计算机,具体可以是个人计算机PC、笔记本电脑laptop、工作站Workstation、服务器Server、大型机Mainframe或者超级计算机Supercomputer,或者具体可以是手机、智能终端等等。
图10为本发明实施例提供的监控系统在传统电信网络中的部署示意图,如图10所示,监控系统(包括多个监控终端和中心监控服务器)通过设备能力管理DCM(Device Capability Management)网络与电信网络中各种网元设备连接,例如无线接入网的无线网络控制器RNC(Radio Network Controller)、核心网的SGSN(Serving GPRSSUPPORT NODE)、GGSN(Gateway GPRS Support Node)、MGW(MediaGateWay)以及路由器等设备,监控系统可以对这些以及更多的电信网络设备进行监控,并将可疑的故障事件上报给设备维护人员。
综上所述,本发明实施例提供的一种监控系统,监控服务器当监测到上报的故障事件时,根据事件分析规则确定所述上报的事件为待分析事件时,获得所述待分析事件的持续时间;若所述待分析事件的持续时间小于所述事件分析规则中与所述待分析事件关联的持续时间阈值,标记所述待分析事件为瞬态事件;若所述待分析事件的持续时间大于或等于所述事件分析规则中与所述待分析事件关联的持续时间阈值,标记所述待分析事件为稳态事件,并上报所述待分析事件或者被标记为稳态事件的所述待分析事件,从而能够有效监测出稳态事件和瞬态事件,一定程度上避免真正故障事件的丢失,提高维护人员处理故障事件的效率。
进一步的,本发明实施例提供的监控系统中的监控给服务器通过于统计时间段阈值内,统计同一类瞬态事件的发生次数;其中,所述同一类瞬态事件表示标记为瞬态事件且至少包含事件名称、事件源信息的事件属性信息相同的一类事件;若所述同一类瞬态事件的发生次数大于或等于发生次数阈值,基于所述同一类瞬态事件生成一条非原始故障事件,所述非原始故障事件被标记为稳态事件,并上报所述非原始故障事件,从而准确监测出反复发生的瞬态事件实际也可能代表一种需要人工干预的稳态故障,提高了监控服务器的故障监测性能。
再进一步的,本发明实施例的监控给服务器通过存储所有故障事件,并根据故障事件查询请求发送请求查询的故障事件,从而为设备维护人员保存了完整的事件视图,有利于后续的事件统计分析,进而提高了设备维护人员的工作效率。
再进一步的,本发明实施例提供的监控客户端可以根据用户的设置配置所述事件分析规则,并向所述监控服务器发送所述事件分析规则,监控服务器接收所述监控客户端发送的所述事件分析规则,从而使得事件分析规则可以依照故障事件的演进而动态改变,提高监控系统监测故障的性能。
本领域普通技术人员可以理解实现前述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件(如处理器)来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如前述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。
以上所述仅是本发明的具体实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (11)

1.一种故障监测方法,其特征在于,所述方法包括:
当监测到上报的故障事件时,根据事件分析规则确定所述上报的事件为待分析事件时,获得所述待分析事件的持续时间;
若所述待分析事件的持续时间小于所述事件分析规则中与所述待分析事件关联的持续时间阈值,标记所述待分析事件为瞬态事件;
若所述待分析事件的持续时间大于或等于所述事件分析规则中与所述待分析事件关联的持续时间阈值,标记所述待分析事件为稳态事件,并上报标记为稳态事件的所述待分析事件或未标记但确定为稳态事件的所述待分析事件;
于统计时间段阈值内,统计同一类瞬态事件的发生次数;其中,所述同一类瞬态事件表示标记为瞬态事件且至少包含事件名称和事件源信息的事件属性信息相同的一类事件,所述统计时间段阈值为所述事件分析规则中与所述同一类瞬态事件关联的统计时间段阈值;
若所述同一类瞬态事件的发生次数大于或等于发生次数阈值,基于所述同一类瞬态事件生成一条非原始故障事件,所述非原始故障事件被标记为稳态事件,并上报所述生成的非原始故障事件或所述标记为稳态事件的非原始故障事件;其中,所述发生次数阈值为所述事件分析规则中与所述同一类瞬态事件关联的发生次数阈值。
2.根据权利要求1所述的方法,其特征在于,
所述非原始故障事件包含事件名称、事件源信息、事件级别和稳态事件标记,其中所述事件名称和事件源信息的属性值与所述同一类瞬态事件相同,所述事件级别的属性值较同一类瞬态事件的事件级别的原属性值高一级或多级。
3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
存储所述瞬态事件和稳态事件;
根据收到的故障事件查询请求返回与所述故障事件查询请求中包含的查询条件所对应的故障事件,所述查询条件包括瞬态事件、稳态事件和全部事件中的一个或任意组合。
4.根据权利要求1或2所述的方法,其特征在于,所述当监测到上报的故障事件时,根据事件分析规则确定所述上报的事件为待分析事件,包括:
当监测到上报的故障事件时,提取所述上报的故障事件的事件属性信息,所述事件属性信息包括事件名称和事件源信息;
将所述故障事件的事件名称和事件源信息与所述事件分析规则中的规则项匹配,若匹配成功,确定所述上报的事件为待分析事件。
5.根据权利要求1或2所述的方法,所述事件分析规则包括事件名称、事件源信息、持续时间阈值、统计时间段阈值和发生次数阈值;其中,事件源信息包括设备信息或所述设备所包含的子对象信息。
6.一种故障监测装置,其特征在于,所述装置包括:规则匹配模块、第一分析模块、事件标记模块和事件上报模块;
所述规则匹配模块用于:当监测到上报的故障事件时,根据事件分析规则确定所述上报的事件为待分析事件;
所述第一分析模块用于:获得所述待分析事件的持续时间,若所述待分析事件的持续时间小于所述事件分析规则中与所述待分析事件关联的持续时间阈值,由所述事件标记模块标记所述待分析事件为瞬态事件;若所述待分析事件的持续时间大于或等于所述事件分析规则中与所述待分析事件关联的持续时间阈值,由所述事件标记模块标记所述待分析事件为稳态事件;
所述事件标记模块用于:标记所述待分析事件为瞬态事件,或稳态事件;
所述事件上报模块用于:上报标记为稳态事件的所述待分析事件或未标记但确定为稳态事件的所述待分析事件;
第二分析模块,用于在统计时间段阈值内,统计同一类瞬态事件的发生次数;其中,所述同一类瞬态事件表示标记为瞬态事件且至少包含事件名称和事件源信息的事件属性信息相同的一类事件,所述统计时间段阈值为所述事件分析规则中与所述同一类瞬态事件关联的统计时间段阈值;若所述同一类瞬态事件的发生次数大于或等于发生次数阈值,基于所述同一类瞬态事件生成一条非原始故障事件;其中,所述发生次数阈值为所述事件分析规则中与所述同一类瞬态事件关联的发生次数阈值;
所述事件标记模块还用于:标记所述非原始故障事件为稳态事件;
所述事件上报模块还用于:上报所述第二分析模块生成的所述非原始故障事件或标记为稳态事件的所述非原始故障事件。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:
事件存储模块,用于存储所述瞬态事件和稳态事件;
事件过滤模块,用于根据故障事件查询请求返回与所述故障事件查询请求中包含的查询条件所对应的故障事件,所述查询条件包括瞬态事件、稳态事件和全部事件中的一个或任意组合。
8.根据权利要求6或7所述的装置,其特征在于,所述规则匹配模块具体用于:当监测到上报的故障事件时,提取所述上报的故障事件的事件属性信息,所述事件属性信息包括事件名称和事件源信息;将所述故障事件的事件名称和事件源信息与所述事件分析规则中的规则项匹配,若匹配成功,确定所述上报的事件为待分析事件。
9.一种监控系统,其特征在于,所述监控系统包括监控终端和监控服务器,其中:
所述监控终端用于:接收所述监控服务器上报的故障事件;
所述监控服务器用于:当监测到上报的故障事件时,根据事件分析规则确定所述上报的事件为待分析事件时,获得所述待分析事件的持续时间;若所述待分析事件的持续时间小于所述事件分析规则中与所述待分析事件关联的持续时间阈值,标记所述待分析事件为瞬态事件;若所述待分析事件的持续时间大于或等于所述事件分析规则中与所述待分析事件关联的持续时间阈值,标记所述待分析事件为稳态事件,并上报标记为稳态事件的所述待分析事件或未标记但确定为稳态事件的所述待分析事件;
所述监控服务器进一步用于:于统计时间段阈值内,统计同一类瞬态事件的发生次数;其中,所述同一类瞬态事件表示标记为瞬态事件且至少包含事件名称和事件源信息的事件属性信息相同的一类事件,所述统计时间段阈值为所述事件分析规则中与所述同一类瞬态事件关联的统计时间段阈值;若所述同一类瞬态事件的发生次数大于或等于发生次数阈值,基于所述同一类瞬态事件生成一条非原始故障事件,所述非原始故障事件被标记为稳态事件,并上报所述生成的非原始故障事件或所述标记为稳态事件的非原始故障事件;其中,所述发生次数阈值为所述事件分析规则中与所述同一类瞬态事件关联的发生次数阈值。
10.根据权利要求9所述的系统,其特征在于,
所述监控终端进一步用于:向所述监控服务器发送故障事件查询请求,所述故障事件查询请求包括瞬态事件、稳态事件和全部事件中的一个或任意组合所表示的查询条件;
所述监控服务器进一步用于:存储所述瞬态事件和稳态事件,并根据所述故障事件查询请求向所述监控终端返回与所述故障事件查询请求中包含的查询条件所对应的故障事件。
11.根据权利要求9或10所述的系统,其特征在于,
所述监控终端进一步用于:根据用户的设置配置所述事件分析规则,并向所述监控服务器发送所述事件分析规则;
所述监控服务器进一步用于:接收所述监控终端发送的所述事件分析规则。
CN201110447815.0A 2011-12-22 2011-12-22 一种故障监测方法、装置及系统 Active CN102523137B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110447815.0A CN102523137B (zh) 2011-12-22 2011-12-22 一种故障监测方法、装置及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110447815.0A CN102523137B (zh) 2011-12-22 2011-12-22 一种故障监测方法、装置及系统

Publications (2)

Publication Number Publication Date
CN102523137A CN102523137A (zh) 2012-06-27
CN102523137B true CN102523137B (zh) 2014-10-08

Family

ID=46293936

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110447815.0A Active CN102523137B (zh) 2011-12-22 2011-12-22 一种故障监测方法、装置及系统

Country Status (1)

Country Link
CN (1) CN102523137B (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103024786B (zh) * 2012-11-26 2015-07-15 大唐移动通信设备有限公司 一种资源管理方法和系统
CN103812699A (zh) * 2014-02-17 2014-05-21 无锡华云数据技术服务有限公司 基于云计算的监控管理系统
CN104052739B (zh) * 2014-05-22 2017-03-22 汉柏科技有限公司 一种基于安全管理平台的改进交叉关联方法及系统
CN105323101A (zh) * 2014-07-31 2016-02-10 中兴通讯股份有限公司 电信设备的管理方法及装置
CN105681064A (zh) * 2014-11-18 2016-06-15 中兴通讯股份有限公司 一种信息处理的方法及装置
CN104601369A (zh) * 2014-12-15 2015-05-06 中电长城网际系统应用有限公司 It运维报警方法、装置和系统
CN104468827B (zh) * 2014-12-25 2018-11-27 四川金网通电子科技有限公司 Android设备错误信息远程收集与管理的系统及其方法
CN105785469A (zh) * 2016-03-22 2016-07-20 富士电机(中国)有限公司 线材断线检测系统及检测方法
CN106201753B (zh) * 2016-06-28 2019-12-31 苏州浪潮智能科技有限公司 一种基于linux中PCIE错误的处理方法及系统
CN106289370B (zh) * 2016-07-19 2018-11-23 珠海格力电器股份有限公司 一种故障检测装置和方法
CN108632108B (zh) * 2018-01-11 2020-07-28 西门子电力自动化有限公司 基于轮询协议的监控方法、装置与及可读存储介质
CN112511579A (zh) 2019-09-16 2021-03-16 京东方科技集团股份有限公司 事件通知方法、系统,服务器设备、计算机存储介质
CN113127804B (zh) * 2021-03-10 2023-03-21 广州亚美信息科技有限公司 确定车辆故障次数的方法、装置、计算机设备和存储介质
CN113741387B (zh) * 2021-08-16 2024-06-18 北京工业大学 一种瞬时故障发生强度的阈值判断方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1171181A (zh) * 1994-12-23 1998-01-21 英国电讯公司 故障的监视
CN101312405A (zh) * 2007-05-24 2008-11-26 杭州华三通信技术有限公司 一种告警处理方法及网管系统
EP2354945A1 (en) * 2010-01-29 2011-08-10 Honeywell International Inc. Noisy monitor detection and intermittent fault isolation

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1171181A (zh) * 1994-12-23 1998-01-21 英国电讯公司 故障的监视
CN101312405A (zh) * 2007-05-24 2008-11-26 杭州华三通信技术有限公司 一种告警处理方法及网管系统
EP2354945A1 (en) * 2010-01-29 2011-08-10 Honeywell International Inc. Noisy monitor detection and intermittent fault isolation

Also Published As

Publication number Publication date
CN102523137A (zh) 2012-06-27

Similar Documents

Publication Publication Date Title
CN102523137B (zh) 一种故障监测方法、装置及系统
CN104407964B (zh) 一种基于数据中心的集中监控系统及方法
US10205792B2 (en) Method and apparatus for processing page operation data
WO2019223062A1 (zh) 系统异常的处理方法和系统
CN111176879A (zh) 设备的故障修复方法及装置
CN103684828A (zh) 一种电信设备故障的处理方法和装置
CN110166290A (zh) 基于日志文件的告警方法及装置
CN102196373B (zh) 一种短信告警系统及短信告警方法
CN107943649A (zh) 一种分布式集群性能监控系统及方法
CN105159964A (zh) 一种日志监控方法及系统
CN104022902A (zh) 一种监控服务器集群的方法和系统
CN105791028A (zh) 一种服务器集群的监控方法、服务器及系统
CN113704052B (zh) 一种微服务架构的运维系统、方法、设备及介质
CN110493806A (zh) 移动网络投诉溯源方法及装置
CN107835209A (zh) 基于复合物联网的维修人员调度方法及物联网系统
CN106878038A (zh) 一种通信网络中故障定位方法及装置
CN113505048A (zh) 基于应用系统画像的统一监控平台及实现方法
CN103248522B (zh) 一种性能数据的上报方法及装置
CN103824017A (zh) 监控恶意程序的方法和监控平台
CN113467782B (zh) 一种确定业务流程的方法、装置及设备
CN102571424A (zh) 一种工程事件处理方法、装置和系统
CN114172921A (zh) 一种调度录音系统的日志审计方法及装置
CN112468387A (zh) 一种模板消息发送方法、计算机设备以及计算机存储介质
CN113076229A (zh) 一种通用的企业级信息技术监控系统
CN106155000A (zh) 半导体机台的机台警报信息的处理方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant