CN104158682B - 一种基于贡献度的同步数字体系sdh故障定位方法 - Google Patents

一种基于贡献度的同步数字体系sdh故障定位方法 Download PDF

Info

Publication number
CN104158682B
CN104158682B CN201410390448.9A CN201410390448A CN104158682B CN 104158682 B CN104158682 B CN 104158682B CN 201410390448 A CN201410390448 A CN 201410390448A CN 104158682 B CN104158682 B CN 104158682B
Authority
CN
China
Prior art keywords
sdh
alarm
failure
factor
contribution degree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410390448.9A
Other languages
English (en)
Other versions
CN104158682A (zh
Inventor
洪涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Power Supply Co ltd
Original Assignee
Shenzhen Power Supply Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Power Supply Co ltd filed Critical Shenzhen Power Supply Co ltd
Priority to CN201410390448.9A priority Critical patent/CN104158682B/zh
Publication of CN104158682A publication Critical patent/CN104158682A/zh
Application granted granted Critical
Publication of CN104158682B publication Critical patent/CN104158682B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明提供一种基于贡献度的同步数字体系SDH故障定位方法,其特征在于,包括:构建告警传播模型,建立SDH的告警衍生树;计算每种SDH告警的贡献度因子;统计每种SDH告警数据的故障原因和该原因导致该种SDH告警的次数;计算每种SDH故障的可信度因子;整合计算得出的SDH贡献度因子和SDH故障的可信度因子,构建SDH告警故障原因列表,并由所述构建的SDH告警故障原因列表构建SDH告警规则知识库;进行关联模型分析,对SDH当前告警进行SDH网络故障定位。本发明是基于告警贡献度的SDH故障定位技术,实现了对拓扑复杂的SDH网络的故障自动定位,在保持准确性的基础上,效率更高。

Description

一种基于贡献度的同步数字体系SDH故障定位方法
技术领域
本发明涉及传输技术领域,尤其涉及一种基于贡献度的同步数字体系SDH故障定位方法。
背景技术
在SDH传输网中,网络故障总是伴随着大量告警消息而发生,维护人员的很多精力都是在处理网元设备的告警。每天都会有大量告警数据从SDH通信设备中发出,处理这些告警成为维护人员一项繁琐和具有挑战性的工作。因此,通过对告警数据的分析来定位故障对SDH维护人员来说是一项意义重大的功能。
SDH网络的故障定位是指根据SDH设备产生的告警数据进行关联性分析,从而得出网络故障的根源。下面介绍目前常用的两种故障定位方法以及它们的优缺点:
1、穷举搜索法
(1)原理:计算可疑故障集合的所有子集,然后从中选择可以解释告警集合的最小子集。
(2)优点:可以产生比较合理的故障解释。
(3)缺点:需要指数级的复杂度,对于经常产生大量告警的SDH网络而言,该方法效率过低。
2、基于时间窗口的故障定位法
(1)原理:每次只对时间窗口内的告警数据进行分析,通过不断扩大时间窗口的长度,达到对告警全集的分析。
(2)优点:故障诊断的效率穷举搜索法高。
(3)缺点:不适用于拓扑复杂SDH网络,因为告警的时延是难以确定的,所以很难判断合适的时间窗口长度,而这也直接影响了故障诊断的准确性。
发明内容
为解决上述技术问题,本发明提供一种基于贡献度的同步数字体系SDH故障定位方法,包括:
构建告警传播模型,建立SDH的告警衍生树;
根据所述SDH的告警衍生树,计算每种SDH告警的贡献度因子;
从SDH网络告警数据库中收集SDH告警数据,统计每种SDH告警数据的故障原因和该原因导致该种SDH告警的次数;
根据统计每种SDH告警数据的故障原因和该原因导致该种SDH告警的次数,计算每种SDH故障的可信度因子;
整合计算得出的SDH贡献度因子和SDH故障的可信度因子,构建SDH告警故障原因列表,并由所述构建的SDH告警故障原因列表构建SDH告警规则知识库;
根据所述SDH告警规则知识库,进行关联模型分析,对SDH当前告警进行SDH网络故障定位。
其中,根据所述SDH的告警衍生树,计算每种SDH告警的贡献度因子的步骤,包括:
通过如下公式计算SDH告警的贡献度因子β:
其中,H为SDH的告警衍生树总高度,i为该SDH的告警衍生树的子树中的告警的编号,i=1,2……n,n为子树的节点和,hi为第i个子告警的高度,βi为第i个子告警的贡献度因子;SDH的告警衍生树中叶子β1的贡献度定义为1。
其中,所述根据统计每种SDH告警数据的故障原因和该原因导致该种SDH告警的次数,计算每种SDH故障的可信度因子的步骤,包括:
通过如下公式计算SDH故障的可信度因子γi:
其中,γi为SDH告警的第i个故障的可信度因子;ci为第i个故障导致该告警的次数,n为特定告警的故障原因总数,i为特定告警的故障原因编号。
其中,根据所述SDH告警规则知识库,进行关联模型分析,对SDH当前告警进行SDH网络故障定位的步骤,包括:
1)输入SDH当前告警集合A和最小SDH故障的可信度门限α;
2)从所述集合A中选择β值最小的两个SDH故障告警Ai和Aj;
3)从所述SDH告警规则知识库中提取Ai和Aj对应的故障原因列表Li和Lj;
4)计算所述Li与Lj的交集,更新Li与Lj的交集中的SDH故障原因可信度γij=γi*βi+γj*βj;
5)合并Li与Lj,令Li=Li∪Lj;
6)从所述集合A中删除Aj、Lj,更新SDH故障原因贡献度βi=βi+βj;
7)重复2)-6),遍历SDH网络当前告警集合A;
8)将最后合并的Li中SDH故障原因的可信度γ小于α的故障原因删除;
9)将可信度超过α的SDH故障原因定位为故障结果。
实施本发明,具有如下有益效果:
(1)相比于穷举搜索法,在同等准确性上,基于贡献度的SDH故障定位方法的复杂度更低;
(2)由于SDH告警的时延难于确定,传统的基于时间窗口的故障定位方法的时间窗口长度难于选择,实际应用中往往是根据经验确定的,这大大降低了复杂网络的故障定位准确性,而基于告警贡献度的SDH故障定位方法使用的所有数据都是来自网管数据库的历史告警数据,不存在模糊变量,因此准确性更高,误差更小;
(3)相比于穷举搜索法和基于时间窗口的故障定位方法,基于贡献度的SDH故障定位技术在保持正确性的基础上,实现了负责SDH网络的故障定位,提高了故障定位的效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的一种基于贡献度的同步数字体系SDH故障定位方法实施例一的流程示意图;
图2为本发明提供的一种基于贡献度的同步数字体系SDH故障定位方法实施例二的流程示意图。
具体实施方式
本发明是基于告警贡献度的SDH故障定位技术,实现了对拓扑复杂的SDH网络的故障自动定位,在保持准确性的基础上,效率更高。
告警贡献度是指特定告警类型在故障定位过程中的影响权重,根据告警的传播和衍生过程对应的生成树来进行定义,由特定告警在告警衍生树中的高度及其子树的规模决定。
SDH告警具有衍生和传播特性,SDH网络的故障主要是由硬件设备或软件管理系统中发生的异常或错误引起的,告警症状是出现故障的外在表现形式。绝大多数的故障和异常都会在SDH帧的开销字节中体现出来,网元设备通过检测这些开销字节来判断是否发生特定的故障,如果有就会以告警的形式通过主控上报网管。因此,当SDH网络中某一点发生了故障,通常会在触发点对特定开销字节置位,然后故障信息就会随着信号一直传播下去,下游的各个接收端(可能是网元内不同硬件板块之间或者是不同网元之间)检测到该字节的内容会产生相应的告警,同时一般还会在检测点的位置使另外一些开销字节置位,从而产生其它的告警信息并传播下去,这就是SDH告警的传播和衍生过程。
如图1所示,本发明提供一种基于贡献度的同步数字体系SDH故障定位方法,包括:
步骤100,构建告警传播模型,建立SDH的告警衍生树;本实施例中,对ITU-T规定的标准告警类型和衍生关系进行建模分析,建立SDH的告警衍生树。具体的,SDH网络的故障主要是由硬件设备或软件管理系统中发生的异常或错误引起的,告警症状是出现故障的外在表现形式。绝大多数的故障和异常都会在SDH帧的开销字节(每个开销字节的作用在ITU-T协议有详细规定)中体现出来,网元设备通过检测这些开销字节来判断是否发生特定的故障,如果有就会以告警的形式通过主控上报网管。因此,当SDH网络中某一点发生了故障,通常会在触发点对特定开销字节置位,然后故障信息就会随着信号一直传播下去,下游的各个接收端(可能是网元内不同硬件板块之间或者是不同网元之间)检测到该字节的内容会产生相应的告警,同时一般还会在检测点的位置使另外一些开销字节置位,从而产生其它的告警信息并传播下去,这就是SDH告警的传播和衍生过程。根据这个衍生过程,把每个告警作为衍生树的节点,即可建立告警衍生树。
步骤101,根据所述SDH的告警衍生树,计算每种SDH告警的贡献度因子;
具体的,通过如下公式计算SDH告警的贡献度因子β:
其中,H为SDH的告警衍生树总高度,i为该SDH的告警衍生树的子树中的告警的编号,i=1,2……n,n为子树的节点和,hi为第i个子告警的高度,βi为第i个子告警的贡献度因子;SDH的告警衍生树中叶子β1的贡献度定义为1。
步骤102,从SDH网络告警数据库中收集SDH告警数据,统计每种SDH告警数据的故障原因和该原因导致该种SDH告警的次数;
具体的,从SDH网络告警数据库中导出SDH网络告警数据库的历史告警数据,对历史告警数据进行筛选,剔除原因不明,故障尚未定位的告警数据。
经过数据筛选之后,对每种SDH告警数据进行统计。待统计数据有:告警类型、每种SDH告警的故障原因以及此原因导致这种告警的次数。
步骤103,根据统计每种SDH告警数据的故障原因和该原因导致该种SDH告警的次数,计算每种SDH故障的可信度因子;
具体的,通过如下公式计算SDH故障的可信度因子γi:
其中,γi为SDH告警的第i个故障的可信度因子;ci为第i个故障导致该告警的次数,n为特定告警的故障原因总数,i为特定告警的故障原因编号。
步骤104,整合计算得出的SDH贡献度因子和SDH故障的可信度因子,构建SDH告警故障原因列表,并由所述构建的SDH告警故障原因列表构建SDH告警规则知识库;
具体的,将步骤101和步骤103计算得到的贡献度因子和可信度因子进行整合,形成一张张SDH告警的故障原因列表(示例如表1所示)。SDH告警规则知识库由所有的SDH告警的故障原理列表组成。
表1、SDH告警的故障原因列表
步骤105,根据所述SDH告警规则知识库,进行关联模型分析,对SDH当前告警进行SDH网络故障定位。
如图2所示,根据所述SDH告警规则知识库,进行关联模型分析,对SDH当前告警进行SDH网络故障定位的步骤,具体包括:
步骤200,输入SDH当前告警集合A和最小SDH故障的可信度门限α;具体的,这里的可信度门限α取值可以是0.5-0.8。优选的实施方式中,α取值可以是0.6。其中,SDH当前告警集合为SDH网络出现故障的时候产生的告警的所有集合,由SDH网管系统检测得到,并从网管系统的告警数据库导出这些告警记录的集合。
步骤201,从所述集合A中选择β值最小的两个SDH故障告警Ai和Aj;
步骤202,从所述SDH告警规则知识库中提取Ai和Aj对应的故障原因列表Li和Lj;
步骤203,计算所述Li与Lj的交集,更新Li与Lj的交集中的SDH故障原因可信度γij=γi*βi+γj*βj;
步骤204,取Li与Lj的并集,令Li=Li∪Lj;
步骤205,从所述集合A中删除Aj、Lj,更新SDH故障原因贡献度βi=βi+βj;
步骤206,重复步骤201-步骤205,遍历SDH网络当前告警集合A;
步骤207,将最后合并的Li中SDH故障原因的可信度γ小于α的故障原因删除;
步骤208,将可信度超过α的SDH故障原因定位为故障结果。
实施本发明,具有如下有益效果:
(1)相比于穷举搜索法,在同等准确性上,基于贡献度的SDH故障定位方法的复杂度更低;
(2)由于SDH告警的时延难于确定,传统的基于时间窗口的故障定位方法的时间窗口长度难于选择,实际应用中往往是根据经验确定的,这大大降低了复杂网络的故障定位准确性,而基于告警贡献度的SDH故障定位方法使用的所有数据都是来自网管数据库的历史告警数据,不存在模糊变量,因此准确性更高,误差更小;
(3)相比于穷举搜索法和基于时间窗口的故障定位方法,基于贡献度的SDH故障定位技术在保持正确性的基础上,实现了负责SDH网络的故障定位,提高了故障定位的效率。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

Claims (2)

1.一种基于贡献度的同步数字体系SDH故障定位方法,其特征在于,包括:
构建告警传播模型,建立SDH的告警衍生树;
根据所述SDH的告警衍生树,计算每种SDH告警的贡献度因子;
从SDH网络告警数据库中收集SDH告警数据,统计每种SDH告警数据的故障原因和该原因导致该种SDH告警的次数;
根据统计每种SDH告警数据的故障原因和该原因导致该种SDH告警的次数,计算每种SDH故障的可信度因子;
整合计算得出的SDH贡献度因子和SDH故障的可信度因子,构建SDH告警故障原因列表,并由所述构建的SDH告警故障原因列表构建SDH告警规则知识库;
根据所述SDH告警规则知识库,进行关联模型分析,对SDH当前告警进行SDH网络故障定位;
其中,根据所述SDH的告警衍生树,计算每种SDH告警的贡献度因子的步骤,包括:
通过如下公式计算SDH告警的贡献度因子β:
<mrow> <mi>&amp;beta;</mi> <mo>=</mo> <msub> <mi>&amp;Sigma;</mi> <mi>i</mi> </msub> <mfrac> <msub> <mi>h</mi> <mi>i</mi> </msub> <mi>H</mi> </mfrac> <msub> <mi>&amp;beta;</mi> <mi>i</mi> </msub> </mrow>
其中,H为SDH的告警衍生树总高度,i为该SDH的告警衍生树的子树中的告警的编号,i=1,2……n,n为子树的节点和,hi为第i个子告警的高度,βi为第i个子告警的贡献度因子;SDH的告警衍生树中叶子β1的贡献度定义为1;
所述根据统计每种SDH告警数据的故障原因和该原因导致该种SDH告警的次数,计算每种SDH故障的可信度因子的步骤,包括:
通过如下公式计算SDH故障的可信度因子γi:
<mrow> <msub> <mi>&amp;gamma;</mi> <mi>i</mi> </msub> <mo>=</mo> <mfrac> <msub> <mi>c</mi> <mi>i</mi> </msub> <mrow> <msubsup> <mi>&amp;Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </msubsup> <msub> <mi>c</mi> <mi>i</mi> </msub> </mrow> </mfrac> </mrow>
其中,γi为SDH告警的第i个故障的可信度因子;ci为第i个故障导致该告警的次数,n为特定告警的故障原因总数,i为特定告警的故障原因编号。
2.如权利要求1所述的基于贡献度的SDH故障定位方法,其特征在于,根据所述SDH告警规则知识库,进行关联模型分析,对SDH当前告警进行SDH网络故障定位的步骤,包括:
1)输入SDH当前告警集合A和最小SDH故障的可信度门限α;
2)从所述集合A中选择β值最小的两个SDH故障告警Ai和Aj;
3)从所述SDH告警规则知识库中提取Ai和Aj对应的故障原因列表Li和Lj;
4)计算所述Li与Lj的交集,更新Li与Lj的交集中的SDH故障原因可信度γij=γi*βi+γj*βj;
5)取Li与Lj的并集,令Li=Li∪Lj;
6)从所述集合A中删除Aj、Lj,更新SDH故障原因贡献度βi=βi+βj;
7)重复2)-6),遍历SDH网络当前告警集合A;
8)将最后合并的Li中SDH故障原因的可信度γ小于α的故障原因删除;
9)将可信度超过α的SDH故障原因定位为故障结果。
CN201410390448.9A 2014-08-08 2014-08-08 一种基于贡献度的同步数字体系sdh故障定位方法 Active CN104158682B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410390448.9A CN104158682B (zh) 2014-08-08 2014-08-08 一种基于贡献度的同步数字体系sdh故障定位方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410390448.9A CN104158682B (zh) 2014-08-08 2014-08-08 一种基于贡献度的同步数字体系sdh故障定位方法

Publications (2)

Publication Number Publication Date
CN104158682A CN104158682A (zh) 2014-11-19
CN104158682B true CN104158682B (zh) 2017-08-22

Family

ID=51884093

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410390448.9A Active CN104158682B (zh) 2014-08-08 2014-08-08 一种基于贡献度的同步数字体系sdh故障定位方法

Country Status (1)

Country Link
CN (1) CN104158682B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106843111B (zh) * 2017-03-10 2019-04-05 中国石油大学(北京) 油气生产系统报警信号根原因精确溯源方法及装置
CN110943874B (zh) * 2018-09-21 2021-11-19 中国移动通信有限公司研究院 一种家庭宽带网络的故障检测方法、装置和可读介质
CN109634819B (zh) * 2018-10-26 2022-02-01 创新先进技术有限公司 告警根因定位方法和装置、电子设备
CN110149223B (zh) * 2019-05-10 2022-04-15 中国联合网络通信集团有限公司 故障定位方法和设备
CN110307990B (zh) * 2019-06-05 2020-12-25 中国中车股份有限公司 一种柴油机机油系统故障的智能诊断方法及系统
CN110351136B (zh) * 2019-07-04 2022-06-28 创新先进技术有限公司 一种故障定位方法和装置
CN112580678A (zh) * 2019-09-29 2021-03-30 中兴通讯股份有限公司 一种构造云化网络告警根因关系树模型方法和装置
CN112820090A (zh) * 2020-12-30 2021-05-18 苏州绿科智能机器人研究院有限公司 一种基于大数据的报警系统及其实现方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07231353A (ja) * 1994-02-16 1995-08-29 Nec Corp 網障害監視システム
CN1633082A (zh) * 2004-12-21 2005-06-29 中国联合通信有限公司 一种用于通信网络中的故障定位方法及装置
CN101217331A (zh) * 2008-01-02 2008-07-09 中兴通讯股份有限公司 一种定位和恢复嵌入控制通道通讯故障的装置和方法
CN101299636A (zh) * 2008-06-18 2008-11-05 中兴通讯股份有限公司 一种利用性能缓冲器进行性能处理的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07231353A (ja) * 1994-02-16 1995-08-29 Nec Corp 網障害監視システム
CN1633082A (zh) * 2004-12-21 2005-06-29 中国联合通信有限公司 一种用于通信网络中的故障定位方法及装置
CN101217331A (zh) * 2008-01-02 2008-07-09 中兴通讯股份有限公司 一种定位和恢复嵌入控制通道通讯故障的装置和方法
CN101299636A (zh) * 2008-06-18 2008-11-05 中兴通讯股份有限公司 一种利用性能缓冲器进行性能处理的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
网管告警相关性分析机制的研究与应用;石峰;《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》;20061115;全文 *

Also Published As

Publication number Publication date
CN104158682A (zh) 2014-11-19

Similar Documents

Publication Publication Date Title
CN104158682B (zh) 一种基于贡献度的同步数字体系sdh故障定位方法
CN108199795B (zh) 一种设备状态的监测方法和装置
WO2021057576A1 (zh) 一种构造云化网络告警根因关系树模型方法、装置和存储介质
CN104021195B (zh) 基于知识库的告警关联分析方法
CN107203450A (zh) 故障的分类方法和设备
CN108322347A (zh) 数据检测方法、装置、检测服务器及存储介质
CN106656590A (zh) 一种网络设备告警消息风暴的处理方法和装置
CN106708692B (zh) 建立过滤报警模型的方法和装置以及过滤报警的方法、装置和电子设备
CN106815125A (zh) 一种日志审计方法及平台
CN114785666B (zh) 一种网络故障排查方法与系统
CN111209274B (zh) 一种数据质量检核方法、系统、设备及可读存储介质
US10158522B2 (en) Network monitor and method for event based prediction of radio network outages and their root cause
CN116010485B (zh) 一种动态周期时序的无监督异常检测方法
CN101188523A (zh) 告警相关性规则的生成方法及生成系统
CN115981984A (zh) 一种设备故障检测方法、装置、设备及存储介质
WO2019019749A1 (zh) 一种内存异常检测方法及设备
CN105471647B (zh) 一种电力通信网故障定位方法
US20200112488A1 (en) Network management based on modeling of cascading effect of failure
CN111176953A (zh) 一种异常检测及其模型训练方法、计算机设备和存储介质
CN115514619B (zh) 告警收敛方法及系统
CN108170702A (zh) 一种基于统计分析的电力通信告警关联模型
CN110245077A (zh) 一种程序异常的响应方法及设备
CN107111609A (zh) 用于神经语言行为识别系统的词法分析器
CN107548087A (zh) 一种告警关联分析的方法及装置
CN116032725B (zh) 故障根因定位模型的生成方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant