CN101272285B - 故障定位方法及系统 - Google Patents

故障定位方法及系统 Download PDF

Info

Publication number
CN101272285B
CN101272285B CN2007100866358A CN200710086635A CN101272285B CN 101272285 B CN101272285 B CN 101272285B CN 2007100866358 A CN2007100866358 A CN 2007100866358A CN 200710086635 A CN200710086635 A CN 200710086635A CN 101272285 B CN101272285 B CN 101272285B
Authority
CN
China
Prior art keywords
fault
information
related information
network element
warning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2007100866358A
Other languages
English (en)
Other versions
CN101272285A (zh
Inventor
李非
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Shanghai Electric Power Co Ltd
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN2007100866358A priority Critical patent/CN101272285B/zh
Publication of CN101272285A publication Critical patent/CN101272285A/zh
Application granted granted Critical
Publication of CN101272285B publication Critical patent/CN101272285B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)
  • Maintenance And Management Of Digital Transmission (AREA)

Abstract

本发明公开了一种故障定位方法及系统。其中,该故障定位方法包括以下步骤:S102,从网元设备发出的故障告警中获取与故障告警相关的信息,并根据与故障告警相关的信息获取故障告警之间的关联信息;S104,在根据网元设备之间的设备连接信息和网元设备的单板之间的单板连接信息得出的业务路径上,对关联信息进行过滤;以及S106,根据过滤后的关联信息和与故障告警相关的信息对故障进行定位。通过本发明,可以减少与故障定位有关的信息,并可以提高与故障定位有关的信息的准确性,从而可以缩短进行故障定位所需的时间。

Description

故障定位方法及系统
技术领域
本发明涉及通信领域,更具体地涉及一种故障定位方法及系统。
背景技术
电信网络故障被定义为网络中的电信设备或软件模块异常。故障发生时系统状态会发生变化,从而引发告警事件。因为电信网络是由多种设备相互连接起来的,一个部件故障会影响到很多设备,从而引发很多设备告警,甚至同一个设备多次告警,所以告警数目庞大。我们要从大量的告警中定位出引发故障的真正原因是十分困难的,因此需要进行告警相关性分析,以便找出真正的根源告警,从而能快带定位故障,解决问题。
在告警相关性分析过程中,主要是根据告警之间的关联规则来进行判断的。通常情况下,系统会预先人工定义一些关联规则,然后按照这些关联规则来过滤冗余告警,分析告警之间的相关性。但是告警数目庞大、告警之间的相关性复杂,完全靠人工定义相关规则的判断效率很低。
如果将数据挖掘中的关联规则发现技术(数据挖掘的一种方法)用于分析历史告警数据,通过对大量历史告警数据的挖掘,可以发现其中某些告警之间有关联关系,这种关联关系就可以在告警相关性分析中作为关联规则使用。这样,通过一些数据挖掘方法,可以找出一些告警相关性规则,将这些关联规则用作对人工定义的规则的补充,可以提高相关性分析的准确性、减轻网络管理员的工作强度、提高工作效率。
数据挖掘是从大量的数据中抽取出潜在的、不为人知的有用信息、模式、和趋势。关联规则发现技术是数据挖掘的一种分析方法,目的在于寻找给定数据记录集中数据项之间隐藏的关联关系。常见的关联分析方法有:Apriori方法、和FP-Growth方法等。
在现有技术中,对大量历史告警进行数据挖掘得出的告警关联规则数量通常都比较多,并且挖掘出来的结果有很多规则不准确。所以,影响了对故障进行准确定位。
发明内容
鉴于上述一个或多个问题,本发明提供了一种故障定位方法及系统,以解决在故障定位的过程中,存在的故障相关信息不够准确并且数量太大的问题,以提高故障定位效率、提高工作效率。
根据本发明的故障定位方法包括以下步骤:S102,从网元设备发出的故障告警中获取与故障告警相关的信息,并根据与故障告警相关的信息获取故障告警之间的关联信息;S104,在根据网元设备之间的设备连接信息和网元设备的单板之间的单板连接信息得出的业务路径上,对关联信息进行过滤;以及S106,根据过滤后的关联信息和与故障告警相关的信息对故障进行定位。
其中,步骤S104包括以下步骤:S1042,在根据设备连接信息和单板连接信息得出的业务路径上遍历关联信息,以从关联信息中选出包括两条故障告警的关联信息;S1044,根据故障告警所在端口是否有业务通过、以及故障告警是否在同一业务路径上,对包括两条故障告警的关联信息进行过滤。
其中,步骤S1044包括:S1044a,检测故障告警所在的端口是否有业务通过,如果没有,则舍弃包括两条故障告警的关联信息,否则保留;S1044b,检测故障告警是否在同一业务路径上,如果不在同一业务路径上,则舍弃包括两条故障告警的关联信息,否则保留。
根据本发明的故障定位方法适用于电信网络。其中,故障相关信息至少包括以下信息之一:网元设备的名称、告警所在单板、告警所在的端口、告警信息描述、告警开始时间、以及告警结束时间。网元设备是波分复用网元设备。
根据本发明的故障定位系统包括:信息获取装置,用于从网元设备发出的故障告警中获取与故障告警相关的信息,并根据与故障告警相关的信息获取故障告警之间的关联信息;信息过滤装置,用于在根据网元设备之间的设备连接信息和网元设备的单板之间的单板连接信息得出的业务路径上,对关联信息进行过滤;以及故障定位装置,用于根据过滤后的关联信息和与故障告警相关的信息对故障进行定位。
其中,信息过滤装置包括:信息选择模块,用于在根据设备连接信息和单板连接信息得出的业务路径上遍历关联信息,以从关联信息中选出包括两条故障告警的关联信息;信息过滤模块,用于根据故障告警所在端口是否有业务通过、以及故障告警是否在同一业务路径上,对包括两条故障告警的关联信息进行过滤。
其中,故障定位系统适用于电信网络。故障相关信息至少包括以下信息之一或其组合:网元设备的名称、告警所在单板、告警所在的端口、告警信息描述、告警开始时间、以及告警结束时间。网元设备是波分复用网元设备。
通过本发明,可以减少与故障定位有关的信息,并可以提高与故障定位有关的信息的准确性,从而可以缩短进行故障定位所需的时间。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1A、1B是根据本发明实施例的故障定位方法及其步骤的流程图;
图2是根据本发明实施例的故障定位方法中所用的告警相关规则挖掘方法的流程图;
图3是运用根据本发明实施例的告警相关性规则挖掘方法的实例的框图;以及
图4是根据本发明实施例的故障定位系统的框图。
具体实施方式
下面参考附图,详细说明本发明的具体实施方式。
参考图1A和图1B,说明根据本发明实施例的故障定位方法及步骤。如图1A所示,该故障定位方法包括以下步骤:S102,从网元设备发出的故障告警中获取与故障告警相关的信息,并根据与故障告警相关的信息获取故障告警之间的关联信息;S104,在根据网元设备之间的设备连接信息和网元设备的单板之间的单板连接信息得出的业务路径上,对关联信息进行过滤;以及S106,根据过滤后的关联信息和与故障告警相关的信息对故障进行定位。
其中,如图1B所示,步骤S104包括以下步骤:S1042,在根据设备连接信息和单板连接信息得出的业务路径上遍历关联信息,以从关联信息中选出包括两条故障告警的关联信息;S1044,根据故障告警所在端口是否有业务通过、以及故障告警是否在同一业务路径上,对包括两条故障告警的关联信息进行过滤。
其中,步骤S1044包括:S1044a,检测故障告警所在的端口是否有业务通过,如果没有,则舍弃包括两条故障告警的关联信息,否则保留;S1044b,检测故障告警是否在同一业务路径上,如果不在同一业务路径上,则舍弃包括两条故障告警的关联信息,否则保留。
根据本发明的故障定位方法适用于电信网络。其中,故障相关信息至少包括以下信息之一:网元设备的名称、告警所在单板、告警所在的端口、告警信息描述、告警开始时间、以及告警结束时间。网元设备是波分复用网元设备。
参考图2,说明根据本发明实施例的故障定位方法中所用的告警相关规则挖掘方法。如图2所示,该方法包括以下步骤:
S202,对原始告警数据预处理,提取出网元名称、网元类型、告警所在单板及端口、告警信息描述、告警开始时间、和告警结束时间,生成告警事务集合。
S204,对生成的告警事务集合进行数据挖掘,得到初步的告警相关性列表。
S206,获取网元间和网元内的单板连接信息。
S208,根据单板连接情况计算出当前所有的业务路径。
S210,遍历挖掘结果,对挖掘出来的关联规则进行过滤。其中,挖掘结果中的一条关联规则包括了两条告警。
S212,根据每条告警所在的单板和端口号,判断该告警是否在业务路径上。如果在业务路径上,则进行S214,否则将该告警丢弃。
S214,判断两条告警是否在同一条业务路径上。如果在同一路径上,则这两条告警相关,保存该规则。否则,这两条告警不相关,该规则被丢弃。
S216,输出告警关联规则。
参考图3,说明运用根据本发明实施例的告警相关性规则挖掘方法的实例。图3示出了一种业务连接情况:网元1和网元2中分别有两块单板,在这两个网元间已经有一条建好的业务,该业务的路径是:从单板A的端口1开始,依次连接单板A的端口3,单板B的端口1,单板B的端口3,单板C的端口1,单板C的端口3,单板D的端口1,单板D的端口3。
假设经过一段时间的运行后,产生了如表1所示的历史告警。
表1
 
编号 网元 单板 端口 告警信息 开始时间 结束时间 业务路径
1 网元1 单板A 端口1 输入无光 0:10:28 0:10:32 业务1
2 网元1 单板B 端口4 输出无光 0:10:30 0:10:34
3 网元2 单板C 端口2 输入无光 0:10:31 0:10:35
4 网元2 单板D 端口3 输出无光 0:10:31 0:10:35 业务1
5 网元2 单板C 端口4 输出无光 0:10:31 0:10:35
6 网元2 单板D 端口2 输入无光 0:10:31 0:10:35
根据图2中所示步骤,进行以下动作:
S202,生成如表1所示的告警事务集合。
S204,进行数据挖掘,得到以下的相关性规则:编号1的告警与编号3的告警关联;编号1的告警与编号4的告警关联;编号1的告警与编号5的告警关联;编号1的告警与编号6的告警关联;编号2的告警与编号4的告警关联。
S206,获取网元间和网元内的单板连接信息:网元1和网元2之间有一条网元间连接;网元1和网元2内部各有一条网元内连接。
S208,根据单板连接情况计算出当前所有的业务路径,得到一条业务路径,如图3中粗虚线所示的“业务1”。
S210,遍历以上的5条数据挖掘结果。
S212,判断以上的5条规则中存在两条告警的规则中的告警所在端口上是否有业务通过。在图3中,只有编号1的告警和编号4的告警所在端口上有业务经过,因此以上数据挖掘中所得到的5条规则中有4条被丢弃,只有1条还保留(编号1的告警与编号4的告警关联)。
S214,判断所保留的规则中的两条告警是否在同一业务路径上,从图3中可以看出,编号1的告警与编号4的告警都在业务1的路径上,因此该规则保留,编号1的告警与编号4的告警关联。,如果所剩规则中的两条告警不在同一条业务路径上,则该规则被丢弃。这种情况下没有被丢弃的规则。如果所剩规则中的两条告警在同一条业务路径上,则这两条告警相关,保存该规则(编号1的告警与编号4的告警关联)。
S216,最后的分析结果得到了一条告警相关性规则:编号1的告警与编号4的告警关联。
如果不进行如图2所示的步骤,将会得到5条规则,而这5条规则中有4条是不准确的。
参考图4,说明根据本发明实施例的故障定位系统。如图4所示,该故障定位系统包括:信息获取装置402,用于从网元设备发出的故障告警中获取与故障告警相关的信息,并根据与故障告警相关的信息获取故障告警之间的关联信息;信息过滤装置404,用于在根据网元设备之间的设备连接信息和网元设备的单板之间的单板连接信息得出的业务路径上,对关联信息进行过滤;以及故障定位装置406,用于根据过滤后的关联信息和与故障告警相关的信息对故障进行定位。
其中,信息过滤装置404包括:信息选择模块4042,用于在根据设备连接信息和单板连接信息得出的业务路径上遍历关联信息,以从关联信息中选出包括两条故障告警的关联信息;信息过滤模块4044,用于根据故障告警所在端口是否有业务通过、以及故障告警是否在同一业务路径上,对包括两条故障告警的关联信息进行过滤。
其中,故障定位系统适用于电信网络。故障相关信息至少包括以下信息之一:网元设备的名称、告警所在单板、告警所在的端口、告警信息描述、告警开始时间、以及告警结束时间。网元设备是波分复用网元设备。
综上所述,通过本发明,压缩了告警事务集,缩短了关联规则挖掘过程的时间,减小了数据挖掘结果的规模。并且,本发明是根据业务路径来对数据挖掘的结果进行过滤的,所以挖掘出来的告警关联规则结果更加准确。
以上所述仅为本发明的实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。

Claims (8)

1.一种故障定位方法,其特征在于,包括以下步骤:
S102,从网元设备发出的故障告警中获取与故障告警相关的信息,并根据所述与故障告警相关的信息获取所述故障告警之间的关联信息;
S104,在根据所述网元设备之间的设备连接信息和所述网元设备的单板之间的单板连接信息得出的业务路径上遍历所述关联信息,以从所述关联信息中选出包括两条故障告警的关联信息;根据所述故障告警所在端口是否有业务通过、以及所述故障告警是否在同一业务路径上,对包括两条故障告警的所述关联信息进行过滤;以及
S106,根据所述过滤后的关联信息和所述与故障告警相关的信息对故障进行定位;
其中,根据所述故障告警所在端口是否有业务通过、以及所述故障告警是否在同一业务路径上,对包括两条故障告警的所述关联信息进行过滤包括:
a,检测所述故障告警所在的端口是否有业务通过,如果没有,则舍弃所述包括两条故障告警的关联信息,否则保留;
b,检测所述故障告警是否在同一业务路径上,如果不在同一业务路径上,则舍弃所述包括两条故障告警的关联信息,否则保留。
2.根据权利要求1所述的故障定位方法,其特征在于,所述故障定位方法适用于电信网络。
3.根据权利要求2所述的故障定位方法,其特征在于,所述与故障告警相关的信息至少包括以下信息之一:网元设备的名称、告警所在单板、告警所在的端口、告警信息描述、告警开始时间、以及告警结束时间。
4.根据权利要求1至3中任一项所述故障定位方法,其特征在于,所述网元设备是波分复用网元设备。
5.一种故障定位系统,其特征在于,包括:
信息获取装置,用于从网元设备发出的故障告警中获取与故障告警相关的信息,并根据所述与故障告警相关的信息获取所述故障告警之间的关联信息;
信息过滤装置,用于在根据所述网元设备之间的设备连接信息和所述网元设备的单板之间的单板连接信息得出的业务路径上,对所述关联信息进行过滤,包括:信息选择模块和信息过滤模块,其中,
所述信息选择模块,用于在根据所述设备连接信息和所述单板连接信息得出的业务路径上遍历所述关联信息,以从所述关联信息中选出包括两条故障告警的关联信息;
所述信息过滤模块,用于根据所述故障告警所在端口是否有业务通过、以及所述故障告警是否在同一业务路径上,对包括两条故障告警的所述关联信息进行过滤;
以及
故障定位装置,用于根据所述过滤后的关联信息和所述与故障告警相关的信息对故障进行定位;
其中,根据所述故障告警所在端口是否有业务通过、以及所述故障告警是否在同一业务路径上,对包括两条故障告警的所述关联信息进行过滤包括:
a,检测所述故障告警所在的端口是否有业务通过,如果没有,则舍弃所述包括两条故障告警的关联信息,否则保留;
b,检测所述故障告警是否在同一业务路径上,如果不在同一业务路径上,则舍弃所述包括两条故障告警的关联信息,否则保留。
6.根据权利要求5所述的故障定位系统,其特征在于,所述故障定位系统适用于电信网络。
7.根据权利要求5或6所述的故障定位系统,其特征在于,所述与故障相关的信息至少包括以下信息之一:网元设备的名称、告警所在单板、告警所在的端口、告警信息描述、告警开始时间、以及告警结束时间。
8.根据权利要求5或6所述的故障定位系统,其特征在于,所述网元设备是波分复用网元设备。
CN2007100866358A 2007-03-23 2007-03-23 故障定位方法及系统 Active CN101272285B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2007100866358A CN101272285B (zh) 2007-03-23 2007-03-23 故障定位方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2007100866358A CN101272285B (zh) 2007-03-23 2007-03-23 故障定位方法及系统

Publications (2)

Publication Number Publication Date
CN101272285A CN101272285A (zh) 2008-09-24
CN101272285B true CN101272285B (zh) 2010-12-01

Family

ID=40005994

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007100866358A Active CN101272285B (zh) 2007-03-23 2007-03-23 故障定位方法及系统

Country Status (1)

Country Link
CN (1) CN101272285B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101478440B (zh) * 2009-01-22 2011-12-28 中兴通讯股份有限公司 一种故障信息可追溯的系统及方法
CN102457396B (zh) * 2010-10-28 2014-10-29 大唐移动通信设备有限公司 故障告警的方法及设备
WO2012071697A1 (zh) * 2010-11-29 2012-06-07 中兴通讯股份有限公司 一种告警定位方法及装置
CN102571407A (zh) * 2010-12-30 2012-07-11 中国移动通信集团河北有限公司 告警关联分析方法及装置
CN105071970B (zh) * 2015-08-27 2018-09-11 中国电信股份有限公司 故障分析方法和系统以及网管设备
CN108073611A (zh) * 2016-11-14 2018-05-25 国网江苏省电力公司镇江供电公司 一种告警信息的过滤方法及装置
CN108847994B (zh) * 2018-07-25 2021-10-15 山东中创软件商用中间件股份有限公司 基于数据分析的告警定位方法、装置、设备以及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1474542A (zh) * 2002-08-06 2004-02-11 华为技术有限公司 电信设备故障信息管理方法
CN1505284A (zh) * 2002-12-02 2004-06-16 深圳市中兴通讯股份有限公司 一种全光网中的分布式故障定位方法
CN1633082A (zh) * 2004-12-21 2005-06-29 中国联合通信有限公司 一种用于通信网络中的故障定位方法及装置
CN1863173A (zh) * 2006-01-05 2006-11-15 华为技术有限公司 获取设备输出信息的实现方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1474542A (zh) * 2002-08-06 2004-02-11 华为技术有限公司 电信设备故障信息管理方法
CN1505284A (zh) * 2002-12-02 2004-06-16 深圳市中兴通讯股份有限公司 一种全光网中的分布式故障定位方法
CN1633082A (zh) * 2004-12-21 2005-06-29 中国联合通信有限公司 一种用于通信网络中的故障定位方法及装置
CN1863173A (zh) * 2006-01-05 2006-11-15 华为技术有限公司 获取设备输出信息的实现方法及装置

Also Published As

Publication number Publication date
CN101272285A (zh) 2008-09-24

Similar Documents

Publication Publication Date Title
CN101272285B (zh) 故障定位方法及系统
CN100479385C (zh) 一种多设备集中维护方法和系统
US7043661B2 (en) Topology-based reasoning apparatus for root-cause analysis of network faults
US9350618B2 (en) Estimation of network path and elements using geodata
CN110445665B (zh) 基于改进gsp的电力通信网络告警关联挖掘方法
CN100409710C (zh) 检查电信网络中的节点配置的方法和系统
JP4554964B2 (ja) 分散警報相関を使用する障害診断のシステムおよび方法
CN108650140B (zh) 光传输设备业务故障的自动化辅助分析方法和系统
EP2842264A1 (en) Estimating physical locations of network faults
EP2842262A1 (en) Mapping a network fault
CN100531052C (zh) 一种用于多厂商dwdm网管系统的根告警分析方法
EP2842261A1 (en) Network monitoring with estimation of network path to network element location
DE69933919T2 (de) Filterung eines sekundären Alarms
CN110083575A (zh) 履职监控方法、装置、设备及计算机可读存储介质
CN107085552A (zh) 测试方法及装置
CN110597687B (zh) 一种日志处理方法和装置
CN111262624B (zh) 光缆故障的监控方法和装置
CN105071970A (zh) 故障分析方法和系统以及网管设备
CN110380893A (zh) 通讯故障分析方法、装置及区块链通讯平台
CN113938372A (zh) 一种基于魔百盒优良率的传输联动监测方法
CN115829192B (zh) 一种用于实现工程信息安全监管的数字化管理系统及方法
CN117459365A (zh) 故障原因确定方法、装置、设备及存储介质
CN106603722A (zh) 一种管理设备的确定方法及装置
CN113821412A (zh) 一种设备运维管理方法及装置
CN107645395A (zh) 组播路由数据检查方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: STATE GRID SHANGHAI ELECTRIC POWER COMPANY

Free format text: FORMER OWNER: ZTE CORPORATION

Effective date: 20141224

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: 518057 SHENZHEN, GUANGDONG PROVINCE TO: 200122 PUDONG NEW AREA, SHANGHAI

TR01 Transfer of patent right

Effective date of registration: 20141224

Address after: 200122 Shanghai City, Pudong New Area source deep road, No. 1122

Patentee after: State Grid Shanghai Municipal Electric Power Company

Address before: 518057 Nanshan District science and Technology Industrial Park, Guangdong high tech Industrial Park, ZTE building

Patentee before: ZTE Corporation

ASS Succession or assignment of patent right

Owner name: STATE GRID SHANGHAI ELECTRIC POWER COMPANY

Free format text: FORMER OWNER: ZTE CORPORATION

Effective date: 20150320

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: 518057 SHENZHEN, GUANGDONG PROVINCE TO: 200122 PUDONG NEW AREA, SHANGHAI

TR01 Transfer of patent right

Effective date of registration: 20150320

Address after: 200122 Shanghai City, Pudong New Area source deep road, No. 1122

Patentee after: State Grid Shanghai Municipal Electric Power Company

Address before: 518057 Nanshan District science and Technology Industrial Park, Guangdong high tech Industrial Park, ZTE building

Patentee before: ZTE Corporation