CN108521346B - 一种基于终端数据的电信承载网异常节点定位方法 - Google Patents

一种基于终端数据的电信承载网异常节点定位方法 Download PDF

Info

Publication number
CN108521346B
CN108521346B CN201810303367.9A CN201810303367A CN108521346B CN 108521346 B CN108521346 B CN 108521346B CN 201810303367 A CN201810303367 A CN 201810303367A CN 108521346 B CN108521346 B CN 108521346B
Authority
CN
China
Prior art keywords
node
warning
child
child node
moment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810303367.9A
Other languages
English (en)
Other versions
CN108521346A (zh
Inventor
王建新
单文波
钟秋浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianyun Software Technology Co ltd
Original Assignee
Central South University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Central South University filed Critical Central South University
Priority to CN201810303367.9A priority Critical patent/CN108521346B/zh
Publication of CN108521346A publication Critical patent/CN108521346A/zh
Application granted granted Critical
Publication of CN108521346B publication Critical patent/CN108521346B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种基于终端数据的电信承载网异常节点定位方法,包括:S1:获取终端设备的时序数据;S2:构建网络拓扑中每个节点的状态属性序列;S3:识别每个节点的状态属性序列中是否存在状态属性值大于或等于指标阈值,若存在,将状态属性值大于或等于指标阈值的节点作为对应时刻的基本警告节点;S4:筛出同一时刻的所有警示节点;S5:计算同一的每个警示节点的设备发生故障的概率和设备可靠性阈值;S6:分别判断同一的每个警示节点的设备发生故障的概率是否大于同一时刻的同一警示节点的设备可靠性阈值,若是,将对应警示节点的设备标记为真故障设备。本发明可以提高异常节点定位的准确性。

Description

一种基于终端数据的电信承载网异常节点定位方法
技术领域
本发明涉及通信技术领域,尤其涉及一种基于终端数据的电信承载网异常节点定位方法。
背景技术
与传统故障定位方法不同,传统电信承载网设备节点的故障定位方法具有结果误差较大,准确度不高,容易产生错误告警的特点,难以利用定位结果进行实际故障运维派单,这就使得传统故障定位方法难以满足电信运营商对承载网节点设备的管理和运维需求,使得电信运营商对电信运营商对承载网节点设备的管理和运维的效率严重下降。这些方法在进行异常定位处理时主要依赖于单台设备指标异常变化,而较少考虑该指标异常变化是否为受到网络拓扑中周边异常设备影响而变化。因此很容易忽略一个设备的异常特征是否是该设备的真正异常特征,也需要通过分析设备间异常干扰来过滤大部分冗余记录。故需要提供一种基于终端数据的电信承载网异常节点定位方法来提高定位结果准确率。
发明内容
本发明的目的是提供一种基于终端数据的电信承载网异常节点定位方法,其以电信承载网网络拓扑、终端数据作为计算数据,通过分析相关性分析对警告数据进行过滤,最后对警示节点进行设备可靠性分析,识别到真实警告设备,有效地减少了误告率,从而提高了整体定位的准确率。
本发明提供一种基于终端数据的电信承载网异常节点定位方法,包括如下步骤:
S1:获取电信承载网的网络拓扑以及所述网络拓扑中每个终端设备的时序数据;
其中,所述时序数据为终端设备在一个预设周期内各个时刻上异常代码的标记值;
S2:根据所述网络拓扑和终端设备的所述时序数据构建网络拓扑中每个节点的状态属性序列S;
其中,每个节点的状态属性序列S如下所示:
S=[(t1,V1),…(ti,Vi),……,(tn,Vn)]
式中,ti表示所述预设周期中的第i个时刻,Vi表示节点在ti时刻的状态属性值,节点的状态属性值Vi的计算公式如下:
Vi=Vi(D)=f(v)或
Figure GDA0002448222160000011
其中,Vi(D)表示子节点为单个终端设备表示时的状态属性值,f(v)为终端设备的异常代码的标记值,Vi(F)表示节点为父级节点时的状态属性值,V(Dj)表示父级节点下的子节点的状态属性值,N表示父级节点下的子节点数量;
S3:识别每个节点的状态属性序列S中是否存在状态属性值大于或等于指标阈值,若存在,将状态属性值大于或等于指标阈值的节点作为对应时刻的基本警告节点W,并获取同一时刻的所有基本警告节点W;
S4:基于获取的同一时刻的所有基本警告节点W采用节点的相关性系数分析法依次筛出各个时刻的警示节点;
S5:基于失效率函数计算所述各个时刻的每个警示节点的设备发生故障的概率,以及基于累积失效概率函数计算同一时刻的同一警示节点的设备可靠性阈值;
S6:分别判断所述各个时刻的每个警示节点的设备发生故障的概率是否大于同一时刻的同一警示节点的设备可靠性阈值,若是,将大于同一时刻的同一警示节点的设备可靠性阈值的警示节点标记为异常节点且将对应设备标记为真故障设备,否则,不是真故障设备。
S2中单个终端设备必然是叶子节点,先获取到叶子节点的状态属性值,然后再根据网络拓扑的结构获取父级节点的状态属性值,进而从下往上计算得到每个时刻每个节点的状态属性值,故而构建出每个节点的状态属性序列S。网络拓扑中每个节点是单个终端设备或是由终端设备组成的设备组,此时也将其视为一个设备,一个节点即对应一个设备。
应当理解,S3中若节点的状态属性序列S中存在ti时刻的状态属性值大于或等于指标阈值时,则将状态属性值大于或等于指标阈值的节点作为对应ti时刻的基本警告节点W。其中,若节点的状态属性序列S存在多个ti时刻的状态属性值大于或等于指标阈值时,则针对每个ti时刻都会执行S4-S6。
进一步优选,将S4中获取的同一时刻的所有基本警告节点W记为同一ti时刻的所有基本警告节点W,S4中每次筛出任意ti时刻的警示节点的执行过程如下:
Step A:判断在ti时刻根节点Q是否是基本警告节点W,若不是,执行Step C;若是,计算根节点Q与所述根节点Q的每个子节点Pj的相关性系数R(Q,Pj)并计算所述根节点Q的子节点相似比例PWD1
Figure GDA0002448222160000021
式中,
Figure GDA0002448222160000022
表示根节点Q的所有子节点Pj中相关性系数R(Q,Pj)中大于或等于相关系数阈值Rth的子节点Pj的个数,
Figure GDA0002448222160000031
表示根节点Q的所有子节点Pj的总个数;
Step B:判断所述根节点Q的子节点相似比例PwD1是否大于或等于告警比例阈值Pwth,若是,所述根节点为ti时刻的警示节点,若不是,执行Step C;
Step C:基于获取的ti时刻的所有基本警告节点W得到根节点到每个基本警告节点W的节点链路,并针对每个节点链路分别采用节点相关性系数分析法识别出每个节点链路上ti时刻的警示节点;
其中,每个基本警告节点W的节点链路是以根节点为链路起始节点,以基本警告节点W为链路终节点。
其中,进入Step C则表示根节点无故障。Step C中每个基本警告节点W对应一个节点链路。
进一步优选,Step C中对每个节点链路分别采用节点相关性系数分析法识别出每个节点链路上ti时刻的警示节点的过程如下:
Step a:判断节点链路上是否存在子节点,若存在,按照从上至下的方向遍历节点链路获取第一个子节点E;若不存在,流程结束;
Step b:计算所述子节点E的父节点F与所述子节点E的相关性系数R(E,F),以及判断所述相关性系数R(E,F)是否大于或等于相关系数阈值Rth;若是,执行Step g,否则,执行Step c;
Step c:计算所述子节点E的每个兄弟节点Bi与所述子节点E之间的相关性系数R(E,Bi),并计算所述子节点E的兄弟相似比例PWB
Figure GDA0002448222160000032
式中,
Figure GDA0002448222160000033
表示子节点E的所有兄弟节点Bi中相关性系数R(E,Bi)中大于或等于相关系数阈值Rth的兄弟节点Bi的个数,
Figure GDA0002448222160000034
表示子节点E的兄弟节点Bi的总个数;
Step d:判断所述子节点E的兄弟相似比例PWB是否小于告警比例阈值Pwth,若是,执行Step e;否则,执行Step g;
Step e:将所述子节点E标记为故障节点,并计算所述子节点E的每个子节点Dj与所述子节点E之间的相关性系数(E,Dj),以及计算所述子节点E的子节点相似比例PWD2
Figure GDA0002448222160000035
式中,
Figure GDA0002448222160000041
表示子节点E的所有子节点Dj中相关性系数R(E,Dj)中大于或等于相关系数阈值Rth的子节点Dj的个数,
Figure GDA0002448222160000042
表示子节点E的子节点Dj的总个数;
Step f:判断所述子节点E的子节点相似比例PWD2是否大于或等于告警比例阈值Pwth,若是,所述子节点E为ti时刻的警示节点,流程结束;否则,执行Step l;
Step g:将所述子节点E定义为父节点,并返回Step a;
Step l:将所述子节点E定义为父节点,并将所述子节点E中相关性系数(E,Dj)大于或等于相关系数阈值Rth的子节点Dj作为基本告警节点W,再获取作为基本告警节点W的每个子节点Dj的节点链路,并针对每个子节点Dj的节点链路分别执行Step a-Step l,以识别出子节点Dj节点链路上ti时刻的警示节点;
其中,所述子节点Dj的节点链路是以根节点为链路起始点,作为基本警告节点W的子节点Dj作为链路终节点。
Step b中若相关性系数R(E,F)大于或等于相关系数阈值Rth,即节点E的特征与父节点F的特征保持一致,没有故障,因此Step g中将当前的节点E定义为父节点F,然后进入下一层迭代,其过程可以理解为将当前的节点E定义为父节点F,将当前的节点E的子节点定义为下一层迭代中的字节点E。若相关性系数R(E,F)小于相关系数阈值Rth,即节点E的特征与父节点F的特征不一致,需要进一步判断。
Step d中若所述子节点E的兄弟相似比例PWB小于告警比例阈值Pwth,则子节点E和兄弟节点Bi也不具备特征相似性,因此,故障来源子节点E本身,进而将子节点E标记为故障节点,对其进行进一步判断。否则PWB≥Pwth,说明子节点E和其兄弟节点Bi有着较强相关性,则子节点E和父节点F也有着较强相似性,认为子节点E为非故障节点,进而Step g中当前的节点E定义为父节点F,然后进入下一层迭代。
Step f中若子节点E的子节点相似比例PWD2大于或等于告警比例阈值Pwth,子节点E与各个子节点Dj故障特征表现一致,则进一步确认告警来源为子节点E;否则PWD2<Pwth,认为大部分子节点Dj和告警设备的特征表现不一致,这部分子节点Dj可以保持正常工作状态,因此故障源可能来自于那少部分子节点Dj,即对(E,Dj)大于Rth的部分子节点Dj分别作为基本告警节点W进行迭代,迭代过程实质上也是针对每个节点链路执行Step a-Step l。
其中,得到警示节点后,在同一ti时刻,将警示节点下全部节点相关告警记录均清除掉,当作误告记录处理。
进一步优选,任意两个节点x与y的相关性系数R(x,y)的计算公式如下:
Figure GDA0002448222160000051
Figure GDA0002448222160000052
其中,Sxi和Syi分别为节点x与节点y的状态属性序列S中ti时刻对应的状态属性值Vi,n为状态属性序列S的长度。
需要说明的是,上述步骤中子节点E与父节点F相关性系数R(E,F)、子节点E的子节点Dj与子节点E之间的相关性系数(E,Dj)、子节点E的兄弟节点Bi与子节点E之间的相关性系数R(E,Bi)均是参照上述公式计算而来。本发明所选用的相关性系数R(x,y)为斯皮尔曼级相关系数。
进一步优选,所述告警比例阈值Pwth为0.7。
进一步优选,所述相关系数阈值Rth为0.8。
进一步优选,S5的执行过程如下:
首先,基于历史记录的每个警示节点的设备故障时刻获取ti时刻的每个警示节点的设备寿命序列Sl
Sl={l1,…,lm…,lM}={t1-t0,…,tm-t0,…,tM-t0},tm<ti,m∈[1,M]
lm=tm-t0
式中,lm表示警示节点的设备寿命序列Sl中tm时刻对应的寿命,tm表示历史记录中第m+1次发生故障的时间,t0表示历史记录中第1次发生故障的时间,M为设备寿命序列Sl的长度;
然后,计算ti时刻的每个警示节点的设备发生故障的概率;
Figure GDA0002448222160000053
li=ti-t0
式中,Pi为ti时刻的警示节点的设备发生故障的概率,λ(li)表示ti时刻对应的失效率函数,li为警示节点在ti时刻对应的寿命,α和β为失效率函数的参数,其中α和β的计算公式如下:
Figure GDA0002448222160000054
其中:
Figure GDA0002448222160000061
式中,
Figure GDA0002448222160000062
xm、ym均为中间参数:
再次,计算ti时刻的每个警示节点的设备可靠性阈值;
Pthi=F(li)+0.04,
Figure GDA0002448222160000063
式中,Pthi为ti时刻的警示节点的设备可靠性阈值,F(li)表示ti时刻对应的累积失效概率函数。
每个警示节点对应存在一个设备寿命序列Sl,其中,获取到ti时刻的警示节点后,所选取的警示节点的历史记录是ti时刻之前的历史数据。例如,状态属性序列S中预设周期为一天,以1小时为间距将预设周期分为24个时刻,ti时刻即是一天中第i小时;设备寿命序列Sl的周期为7天,即ti时刻前7天的数据,每一天也是对应24个时刻。
进一步优选,节点的指标阈值的计算公式如下:
Vth=(1+0.06*U,
其中,Vth表示指标阈值,U为在连续7天的时间范围内节点的同一时刻中的所有状态属性值的平均值。
进一步优选,S1获取的每个终端设备的时序数据还包括每个终端设备的终端MOS值,终端设备的异常代码的标记值是根据终端设备的终端MOS值计算的;
其中,终端设备的异常代码的标记值f(v)的计算公式如下:
Figure GDA0002448222160000064
式中,v表示终端设备的终端MOS值,vth为预设标准阈值。
进一步优选,所述预设标准阈值th等于4.83。
有益效果
与现有预测技术相比,本发明的优点有:
本发明以电信承载网网络拓扑、终端数据作为计算数据,通过将终端数据量化汇集后,根据网络拓扑进行汇聚计算统计,形成时序数据;再对各个节点的时序数据进行判断识别出基本警告节点W,再基于节点的相关性系数分析即设备间的时序关联性对告警数据进行过滤进而获取到警示节点,最后通过对过滤后的警示节点对应进行设备可靠性分析,实现告警有效性判断,实现故障精确定位。
为了尽可能使得从告警设备中分辨出真告警设备以及找出真正故障设备。在进行虚假告警清洗和故障节点定位过程中,除使用网元设备本身监控数据和管理系统的告警数据外,还采用终端数据在网络拓扑节点上的分布状态特征来辅助分析。本发明上述过程通过分析故障带来的拓扑网络时序数据变化和分布状态变化,和其短时间内的周期性、关联性的特殊关系,以及通过较长时间设备可靠性因素有效地减少了误告率,从而提高了整体定位的准确率。能直观地通过终端分布状态来反映网络的健康状态,对于提高网络异常节点的定位的准确性具有一定的意义。本发明为电信运营商指导承载网运维、管理、科学定位故障节点和高效派单管理等需求,提供有价值的参考信息。
附图说明
图1是本发明提供一种基于终端数据的电信承载网异常节点定位方法的流程图;
图2是本发明实施例提供的图1的第一个子流程图;
图3是本发明实施例提供的图1的第三个子流程图;
图4是本发明实施例提供的图1的第二个子流程图;
图5是本发明实施例提供的节点链路示意图。
具体实施方式
下面将结合实施例对本发明做进一步的说明。
如图1所示,本发明提供一种基于终端数据的电信承载网异常节点定位方法,包括以下步骤:
S1:获取电信承载网的网络拓扑以及所述网络拓扑中每个终端设备的时序数据;
其中,所述时序数据包括为每个终端设备的终端MOS值(Mean Opinion Score)以及终端设备在一个预设周期内各个时刻上异常代码的标记值;其中,终端设备的异常代码的标记值是根据终端设备的终端MOS值计算的;
终端设备的异常代码的标记值f(v)的计算公式如下:
Figure GDA0002448222160000071
式中,v表示终端设备的终端MOS值,vth为预设标准阈值。本实施例中优选预设标准阈值th等于4.83。其中,f(v)=0,表示异常代码不存在,为正常数据;f(v)=1,表示出现异常代码,为异常数据;本实施例中以5分钟为时间间隔,若一个类别的异常代码多次出现,仅记录一次。
S2:根据所述网络拓扑和终端设备的所述时序数据构建网络拓扑中每个节点的状态属性序列S;
其中,每个节点的状态属性序列S如下所示:
S=[(t1,V1),…(ti,Vi),……,(tn,Vn)]
式中,ti表示所述预设周期中的第i个时刻,Vi表示节点在ti时刻的状态属性值,节点的状态属性值Vi的计算公式如下:
Vi=Vi(D)=f(v)或
Figure GDA0002448222160000081
其中,Vi(D)表示叶子节点为单个终端设备表示时的状态属性值,f(v)为终端设备的异常代码的标记值,Vi(F)表示节点为父级节点时的状态属性值,V(Dj)表示父级节点下的子节点的状态属性值,N表示父级节点下的子节点数量。应当理解,网络拓扑中的节点可以是单个终端设备;还可以是多个终端设备组成的设备组,也将其视为一个设备,设备组必然是网络拓扑中的父级节点。
S3:识别每个节点的状态属性序列S中是否存在状态属性值大于或等于指标阈值,若存在,将状态属性值大于或等于指标阈值的节点作为对应时刻的基本警告节点W,并获取同一时刻的所有基本警告节点W;
例如:节点的状态属性序列S中存在ti时刻的状态属性值大于或等于指标阈值,则将该节点作为ti时刻的基本警告节点W,并获取同一ti时刻的所有基本警告节点W。
如图2所示,即在ti时刻,如果设备的状态属性值Vi满足Vi≥Vth,则将该节点标记为作为基本告警节点W。其中,节点的指标阈值Vth的计算公式如下:
Vth=(1+0.06*U,
其中,U为在连续7天的时间范围内节点的同一时刻中的所有状态属性值的平均值。
S4:基于获取的同一时刻的所有基本警告节点W采用节点的相关性系数分析法依次筛出各个时刻的警示节点。
例如:基于获取的同一ti时刻的所有基本警告节点W采用节点的相关性系数分析法筛出ti时刻的警示节点。
本发明中节点的相关性系数分为节点与父节点的相关性系数、节点与兄弟节点的相关系数以及节点与子节点的相关性系数三类。其中,S4的执行过程下文将对此进行具体描述。
S5:基于失效率函数计算所述各个时刻的每个警示节点的设备发生故障的概率,以及基于累积失效概率函数计算同一时刻的同一警示节点的设备可靠性阈值。
例如:基于失效率函数计算ti时刻的每个警示节点的设备发生故障的概率,以及基于累积失效概率函数计算同一ti时刻的每个警示节点的设备可靠性阈值。
S5的执行过程如下:
首先,基于历史记录的每个警示节点的设备故障时刻获取ti时刻的每个警示节点的设备寿命序列Sl
Sl={l1,…,lm…,lM}={t1-t0,…,tm-t0,…,tM-t0},tm<ti,m∈[1,M]
lm=tm-t0
式中,lm表示警示节点的设备寿命序列Sl中tm时刻对应的寿命,tm表示历史记录中第m+1次发生故障的时间,t0表示历史记录中第1次发生故障的时间,M为设备寿命序列Sl的长度。
然后,计算ti时刻的每个警示节点的设备发生故障的概率;
Figure GDA0002448222160000091
li=ti-t0
式中,Pi为ti时刻的警示节点的设备发生故障的概率,λ(li)表示ti时刻对应的失效率函数,li为警示节点在ti时刻对应的寿命,α和β为失效率函数的参数,其中α和β的计算公式如下:
Figure GDA0002448222160000092
其中:
Figure GDA0002448222160000093
式中,
Figure GDA0002448222160000094
xm、ym均为中间参数;
再次,计算ti时刻的每个警示节点的设备可靠性阈值;
Pthi=F(li)+0.04,
Figure GDA0002448222160000095
式中,Pthi为ti时刻的警示节点的设备可靠性阈值,F(li)表示ti时刻对应的累积失效概率函数。
上述中累计失效概率函数和失效率函数是使用已知的最小二乘法估计的两参数韦布尔分布计算所得。
S6:分别判断所述各个时刻的每个警示节点的设备发生故障的概率是否大于同一时刻的同一警示节点的设备可靠性阈值,若是,将大于同一时刻的同一警示节点的设备可靠性阈值的警示节点标记为异常节点且将对应设备标记为真故障设备,否则,不是真故障设备。
例如:分别判断ti时刻的每个警示节点的设备发生故障的概率是否大于同一ti时刻的同一警示节点的设备可靠性阈值,若是,将ti时刻大于设备可靠性阈值的警示节点的设备标记为真故障设备,否则,不是真故障设备。
最终可以得到异常节点列表。
具体的,如果在数据清洗过程中标记为告警节点的设备,在告警时间点ti计算所得发生故障的概率满足:Pi=P(li)=λ(li)>Pthi,则认为该设备会发生故障,且超出阈值范围越大,则认为故障可能性越大,并标记为真故障设备;否则不会。
相关性分析:
如图4和图5所示,将S4中获取的同一时刻的所有基本警告节点W记为同一ti时刻的所有基本警告节点W,S4中每次筛出任意ti时刻的警示节点的执行过程如下:
Step A:判断在ti时刻根节点Q是否是基本警告节点W,若不是,执行Step C;若是,计算根节点Q与所述根节点Q的每个子节点Pj的相关性系数R(Q,Pj)并计算所述根节点Q的子节点相似比例PWD1
Figure GDA0002448222160000101
式中,
Figure GDA0002448222160000102
表示根节点Q的所有子节点Pj中相关性系数R(Q,Pj)中大于或等于相关系数阈值Rth的子节点Pj的个数,
Figure GDA0002448222160000103
表示根节点Q的所有子节点Pj的总个数。即根节点Q的子节点相似比例PWD1等于
Figure GDA0002448222160000104
Figure GDA0002448222160000105
之比。
Step B:判断所述根节点Q的子节点相似比例PWD1是否大于或等于告警比例阈值Pwth,若是,所述根节点为ti时刻的警示节点,若不是,执行Step C;
Step C:基于获取的ti时刻的所有基本警告节点W得到根节点到每个基本警告节点W的节点链路,并针对每个节点链路分别采用节点相关性系数分析法识别出每个节点链路上ti时刻的警示节点;
其中,每个基本警告节点W的节点链路是以根节点为链路起始节点,以基本警告节点W为链路终节点。每个基本警告节点W对应一个节点链路。
其中,针对每个节点链路,Step C中对每个节点链路分别采用节点相关性系数分析法识别出每个节点链路上ti时刻的警示节点的过程如下:
Step a:判断节点链路上是否存在子节点,若存在,按照从上至下的方向遍历节点链路获取第一个子节点E;若不存在,流程结束;
Step b:计算所述子节点E的父节点F与所述子节点E的相关性系数R(E,F),以及判断所述相关性系数R(E,F)是否大于或等于相关系数阈值Rth;若是,执行Step g,否则,执行Step c;
其中,若相关性系数R(E,F)大于或等于相关系数阈值Rth,即节点E的特征与父节点F的特征保持一致,没有故障,因此Step g中将当前的节点E定义为父节点F,然后进入下一层迭代。若相关性系数R(E,F)小于相关系数阈值Rth,即节点E的特征与父节点F的特征不一致,需要进一步判断。
Step c:计算所述子节点E的每个兄弟节点Bi与所述子节点E之间的相关性系数R(E,Bi),并计算所述子节点E的兄弟相似比例PWB
Figure GDA0002448222160000111
式中,
Figure GDA0002448222160000112
表示子节点E的所有兄弟节点Bi中相关性系数R(E,Bi)中大于或等于相关系数阈值Rth的兄弟节点Bi的个数,
Figure GDA0002448222160000113
表示子节点E的兄弟节点Bi的总个数;即子节点E的兄弟相似比例PWB等于
Figure GDA0002448222160000114
Figure GDA0002448222160000115
之比。
Step d:判断所述子节点E的兄弟相似比例PWB是否小于告警比例阈值Pwth,若是,执行Step e;否则,执行Step g;
其中,若所述子节点E的兄弟相似比例PWB小于告警比例阈值Pwth,则子节点E和兄弟节点Bi也不具备特征相似性,因此,故障来源子节点E本身,进而将子节点E标记为故障节点,对其进行进一步判断。否则PwB≥Pwth,说明子节点E和其兄弟节点Bi有着较强相关性,则子节点E和父节点F也有着较强相似性,认为子节点E为非故障节点,进而Step g中当前的节点E定义为父节点F,然后进入下一层迭代。
Step e:将所述子节点E标记为故障节点,并计算所述子节点E的每个子节点Dj与所述子节点E之间的相关性系数(E,Dj),以及计算所述子节点E的子节点相似比例PWD2
Figure GDA0002448222160000121
式中,
Figure GDA0002448222160000122
表示子节点E的所有子节点Dj中相关性系数R(E,Dj)中大于或等于相关系数阈值Rth的子节点Dj的个数,
Figure GDA0002448222160000123
表示子节点E的子节点Dj的总个数;即子节点E的子节点相似比例PWD2等于
Figure GDA0002448222160000124
Figure GDA0002448222160000125
之比。
Step f:判断所述子节点E的子节点相似比例PWD2是否大于或等于告警比例阈值Pwth,若是,所述子节点E为ti时刻的警示节点,流程结束;否则,执行Step l;
其中,若子节点E的子节点相似比例PWD大于或等于告警比例阈值Pwth,子节点E与各个子节点Dj故障特征表现一致,则进一步确认告警来源为子节点E;否则PWD2<Pwth,认为大部分子节点Dj和告警设备的特征表现不一致,这部分子节点Dj可以保持正常工作状态,因此故障源可能来自于那少部分子节点Dj,即对(E,Dj)大于Rth的部分子节点Dj分别作为基本告警节点W进行迭代,迭代过程实质上也是针对每个节点链路执行Step a-Step l。
Step g:将所述子节点E定义为父节点,并返回Step a;
Step l:将所述子节点E定义为父节点,并将所述子节点E中相关性系数(E,Dj)大于或等于相关系数阈值Rth的子节点Dj作为基本告警节点W,再获取作为基本告警节点W的每个子节点Dj的节点链路,并针对每个子节点Dj的节点链路分别执行Step a-Step l,以识别出子节点Dj节点链路上ti时刻的警示节点;
其中,所述子节点Dj的节点链路是以根节点为链路起始点,作为基本警告节点W的子节点Dj作为链路终节点。
其中,确认警示节点后,在相同ti时刻,将警示节点下全部节点相关告警记录均清除掉,当作误告记录处理。
本实施例中,优选告警比例阈值Pwth为0.7,相关系数阈值Rth为0.8。
本发明中,任意两个节点x与y的相关性系数R(x,y)的计算公式如下:
Figure GDA0002448222160000126
其中,Sxi和Syi分别为节点x与节点y的状态属性序列S中第i个时刻对应的状态属性值Vi,n为状态属性序列S的长度。
验证本发明的有效性
本发明在对判定模型的推测效果评估时,考虑到不仅需要检测出网络中可能的故障节点,同时也要尽可能避免误告。因此本发明以承载网7455个设备(OLT及其以上层级)的3个月历史监控数据和系统告警数据中随机抽取进行验证,并将所得结果与设备告警工单进行比较。为了更好的统计方法的准确率(Precision),准确率定义为TP/(TP+FP),其中TP是真阳性(True Positive),FP是假阳性(False Positive)。TP定义为设备故障属于真故障设备,且被正确识别为故障设备,FP定义为设备故障属于非故障设备,但被识别为故障设备。
表1描述的是方法分别用于识别中国电信湖南省承载网全网2017年4月至6月份共3个月时间范围内告警的识别结果。
表1:本发明方法在承载网上的计算精度表
Figure GDA0002448222160000131
其中,表中部分指标含义:
1)准确率(Precision):TP/(TP+FP)
2)召回率(Recall):TP/(TP+FN)
3)F1值:2*Precision*Recall/(Precision+Recall)
4)TN(True Negative),真阴性:表示设备故障属于非故障设备,并识别为非故障设备;FN(False Negative),假阴性:表示设备故障属于真故障设备,但被识别为非故障设备。
需要强调的是,本发明所述的实例是说明性的,而不是限定性的,因此本发明不限于具体实施方式中所述的实例,凡是由本领域技术人员根据本发明的技术方案得出的其他实施方式,不脱离本发明宗旨和范围的,不论是修改还是替换,同样属于本发明的保护范围。

Claims (10)

1.一种基于终端数据的电信承载网异常节点定位方法,其特征在于:包括如下步骤:
S1:获取电信承载网的网络拓扑以及所述网络拓扑中每个终端设备的时序数据;
其中,所述时序数据为终端设备在一个预设周期内各个时刻上异常代码的标记值;
S2:根据所述网络拓扑和终端设备的所述时序数据构建网络拓扑中每个节点的状态属性序列S;
其中,每个节点的状态属性序列S如下所示:
S=[(t1,V1),…(ti,Vi),……,(tn,Vn)]
式中,ti表示所述预设周期中的第i个时刻,Vi表示节点在ti时刻的状态属性值,节点的状态属性值Vi的计算公式如下:
Vi=Vi(D)=f(v)或
Figure FDA0002448222150000011
其中,Vi(D)表示子节点为单个终端设备表示时的状态属性值,f(v)为终端设备的异常代码的标记值,Vi(F)表示节点为父级节点时的状态属性值,V(Dj)表示父级节点下的子节点的状态属性值,N表示父级节点下的子节点数量;
S3:识别每个节点的状态属性序列S中是否状态属性值大于或等于指标阈值,若存在,将状态属性值大于或等于指标阈值的节点作为对应时刻的基本警告节点W,并获取同一时刻的所有基本警告节点W;
S4:基于获取的同一时刻的所有基本警告节点W采用节点的相关性系数分析法依次筛出各个时刻的警示节点;
S5:基于失效率函数计算所述各个时刻的每个警示节点的设备发生故障的概率,以及基于累积失效概率函数计算同一时刻的同一警示节点的设备可靠性阈值;
S6:分别判断所述各个时刻的每个警示节点的设备发生故障的概率是否大于同一时刻的同一警示节点的设备可靠性阈值,若是,将大于同一时刻的同一警示节点的设备可靠性阈值的警示节点标记为异常节点且将对应设备标记为真故障设备,否则,不是真故障设备。
2.根据权利要求1所述的方法,其特征在于:将S4中获取的同一时刻的所有基本警告节点W记为同一ti时刻的所有基本警告节点W,S4中每次筛出任意ti时刻的警示节点的执行过程如下:
Step A:判断在ti时刻根节点Q是否是基本警告节点W,若不是,执行Step C;若是,计算根节点Q与所述根节点Q的每个子节点Pj的相关性系数R(Q,Pj)并计算所述根节点Q的子节点相似比例PWD1
Figure FDA0002448222150000021
式中,
Figure FDA0002448222150000022
表示根节点Q的所有子节点Pj中相关性系数R(Q,Pj)中大于或等于相关系数阈值Rth的子节点Pj的个数,
Figure FDA0002448222150000023
表示根节点Q的所有子节点Pj的总个数;
Step B:判断所述根节点Q的子节点相似比例PWD1是否大于或等于告警比例阈值Pwth,若是,所述根节点为ti时刻的警示节点,若不是,执行Step C;
Step C:基于获取的ti时刻的所有基本警告节点W得到根节点到每个基本警告节点W的节点链路,并针对每个节点链路分别采用节点相关性系数分析法识别出每个节点链路上ti时刻的警示节点;
其中,每个基本警告节点W的节点链路是以根节点为链路起始节点,以基本警告节点W为链路终节点。
3.根据权利要求2所述的方法,其特征在于:Step C中对每个节点链路分别采用节点相关性系数分析法识别出每个节点链路上ti时刻的警示节点的过程如下:
Step a:判断节点链路上是否存在子节点,若存在,按照从上至下的方向遍历节点链路获取第一个子节点E;若不存在,流程结束;
Step b:计算所述子节点E的父节点F与所述子节点E的相关性系数R(E,F),以及判断所述相关性系数R(E,F)是否大于或等于相关系数阈值Rth;若是,执行Step g,否则,执行Stepc;
Step c:计算所述子节点E的每个兄弟节点Bi与所述子节点E之间的相关性系数R(E,Bi),并计算所述子节点E的兄弟相似比例PWB
Figure FDA0002448222150000024
式中,
Figure FDA0002448222150000025
表示子节点E的所有兄弟节点Bi中相关性系数R(E,Bi)中大于或等于相关系数阈值Rth的兄弟节点Bi的个数,
Figure FDA0002448222150000026
表示子节点E的兄弟节点Bi的总个数;
Step d:判断所述子节点E的兄弟相似比例PWB是否小于告警比例阈值Pwth,若是,执行Step e;否则,执行Step g;
Step e:计算所述子节点E的每个子节点Dj与所述子节点E之间的相关性系数R(E,Dj),以及计算所述子节点E的子节点相似比例PWD2
Figure FDA0002448222150000031
式中,
Figure FDA0002448222150000032
表示子节点E的所有子节点Dj中相关性系数R(E,Dj)中大于或等于相关系数阈值Rth的子节点Dj的个数,
Figure FDA0002448222150000033
表示子节点E的子节点Dj的总个数;
Step f:判断所述子节点E的子节点相似比例PWD2是否大于或等于告警比例阈值Pwth,若是,所述子节点E为ti时刻的警示节点,流程结束;否则,执行Step l;
Step g:将所述子节点E定义为父节点,并返回Step a;
Step l:将所述子节点E定义为父节点,并将所述子节点E中相关性系数R(E,Dj)大于或等于相关系数阈值Rth的子节点Dj作为基本告警节点W,再获取作为基本告警节点W的每个子节点Dj的节点链路,并针对每个子节点Dj的节点链路分别执行Step a-Step l,以识别出子节点Dj节点链路上ti时刻的警示节点;
其中,所述子节点Dj的节点链路是以根节点为链路起始点,作为基本警告节点W的子节点Dj作为链路终节点。
4.根据权利要求1-3任一项所述的方法,其特征在于:任意两个节点x与y的相关性系数R(x,y)的计算公式如下:
Figure FDA0002448222150000034
其中,Sxi和Syi分别为节点x与节点y的状态属性序列S中ti时刻对应的状态属性值Vi,n为状态属性序列S的长度。
5.根据权利要求3所述的方法,其特征在于:所述告警比例阈值Pwth为0.7。
6.根据权利要求3所述的方法,其特征在于:所述相关系数阈值Rth为0.8。
7.根据权利要求1所述的方法,其特征在于:S5的执行过程如下:
首先,基于历史记录的每个警示节点的设备故障时刻获取ti时刻的每个警示节点的设备寿命序列Sl
Sl={l1,…,lm…,lM}={t1-t0,…,tm-t0,…,tM-t0},tm<ti,m∈[1,M]
lm=tm-t0
式中,lm表示警示节点的设备寿命序列Sl中tm时刻对应的寿命,tm表示历史记录中第m+1次发生故障的时间,t0表示历史记录中第1次发生故障的时间,M为设备寿命序列Sl的长度;
然后,计算ti时刻的每个警示节点的设备发生故障的概率;
Figure FDA0002448222150000035
li=ti-t0
式中,Pi为ti时刻的警示节点的设备发生故障的概率,λ(li)表示ti时刻对应的失效率函数,li为警示节点在ti时刻对应的寿命,α和β为失效率函数的参数,其中α和β的计算公式如下:
Figure FDA0002448222150000041
Figure FDA0002448222150000042
其中:
Figure FDA0002448222150000043
Figure FDA0002448222150000044
式中,
Figure FDA0002448222150000045
xm、ym分别为中间参数;
再次,计算ti时刻的每个警示节点的设备可靠性阈值;
Pthi=F(li)+0.04,
Figure FDA0002448222150000046
式中,Pthi为ti时刻的警示节点的设备可靠性阈值,F(li)表示ti时刻对应的累积失效概率函数。
8.根据权利要求1所述的方法,其特征在于:节点的指标阈值的计算公式如下:
Vth=(1+0.06)*U,
其中,Vth表示指标阈值,U为在连续7天的时间范围内节点的同一时刻中的所有状态属性值的平均值。
9.根据权利要求1所述的方法,其特征在于:S1获取的每个终端设备的时序数据还包括每个终端设备的终端MOS值,终端设备的异常代码的标记值是根据终端设备的终端MOS值计算的;
其中,终端设备的异常代码的标记值f(v)的计算公式如下:
Figure FDA0002448222150000047
式中,v表示终端设备的终端MOS值,vth为预设标准阈值。
10.根据权利要求9所述的方法,其特征在于:所述预设标准阈值vth等于4.83。
CN201810303367.9A 2018-04-07 2018-04-07 一种基于终端数据的电信承载网异常节点定位方法 Active CN108521346B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810303367.9A CN108521346B (zh) 2018-04-07 2018-04-07 一种基于终端数据的电信承载网异常节点定位方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810303367.9A CN108521346B (zh) 2018-04-07 2018-04-07 一种基于终端数据的电信承载网异常节点定位方法

Publications (2)

Publication Number Publication Date
CN108521346A CN108521346A (zh) 2018-09-11
CN108521346B true CN108521346B (zh) 2020-06-02

Family

ID=63431515

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810303367.9A Active CN108521346B (zh) 2018-04-07 2018-04-07 一种基于终端数据的电信承载网异常节点定位方法

Country Status (1)

Country Link
CN (1) CN108521346B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110086643B (zh) * 2019-02-18 2022-03-11 咪咕文化科技有限公司 一种风险识别方法、终端及存储介质
CN110493042B (zh) * 2019-08-16 2022-09-13 中国联合网络通信集团有限公司 故障诊断方法、装置及服务器

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101783749A (zh) * 2009-12-24 2010-07-21 北京市天元网络技术股份有限公司 一种网络故障定位方法和装置
CN103533567A (zh) * 2012-09-29 2014-01-22 深圳市友讯达科技发展有限公司 备用节点的确定方法及节点
WO2015051638A1 (zh) * 2013-10-08 2015-04-16 华为技术有限公司 一种故障定位方法及装置
CN106330624A (zh) * 2016-11-07 2017-01-11 国网江苏省电力公司南京供电公司 一种电力信息网络流量异常检测方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102196481A (zh) * 2011-06-07 2011-09-21 中兴通讯股份有限公司 网络状态上报方法、检测方法、装置和系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101783749A (zh) * 2009-12-24 2010-07-21 北京市天元网络技术股份有限公司 一种网络故障定位方法和装置
CN103533567A (zh) * 2012-09-29 2014-01-22 深圳市友讯达科技发展有限公司 备用节点的确定方法及节点
WO2015051638A1 (zh) * 2013-10-08 2015-04-16 华为技术有限公司 一种故障定位方法及装置
CN106330624A (zh) * 2016-11-07 2017-01-11 国网江苏省电力公司南京供电公司 一种电力信息网络流量异常检测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Network Capability in Localizing Node Failures via End-to-End Path Measurements;Liang Ma等;《IEEE/ACM TRANSACTIONS ON NETWORKING》;20170228;第25卷(第1期);434-450 *
The Reply and Development Strategy of Cable TV industry in the era of big data;Junjie Huang等;《computer society》;20170526;563-567 *

Also Published As

Publication number Publication date
CN108521346A (zh) 2018-09-11

Similar Documents

Publication Publication Date Title
CN110110870B (zh) 一种基于事件图谱技术的设备故障智能监控方法
CN114024837B (zh) 一种微服务系统的故障根因定位方法
CN111309565B (zh) 告警处理方法、装置、电子设备以及计算机可读存储介质
CN110502398B (zh) 一种基于人工智能的交换机故障预测系统及方法
CN109753591A (zh) 业务流程预测性监控方法
CN114385391A (zh) 一种nfv虚拟化设备运行数据分析方法及装置
CN111722952A (zh) 业务系统的故障分析方法、系统、设备和存储介质
CN111176953B (zh) 一种异常检测及其模型训练方法、计算机设备和存储介质
CN108521346B (zh) 一种基于终端数据的电信承载网异常节点定位方法
CN115454778A (zh) 大规模云网络环境下的时序指标异常智能监控系统
CN114201374A (zh) 基于混合机器学习的运维时序数据异常检测方法及系统
CN109547251B (zh) 一种基于监控数据的业务系统故障与性能预测方法
CN111756560A (zh) 一种数据处理方法、装置及存储介质
CN115514619B (zh) 告警收敛方法及系统
Chun-Hui et al. Anomaly detection in network management system based on isolation forest
CN115357418A (zh) 微服务故障检测方法、装置、存储介质及计算机设备
CN114615018B (zh) 一种金融业交易全链路日志的异常检测方法
CN112464439A (zh) 基于三层数据挖掘的电力系统故障类型分析方法及装置
CN115719283A (zh) 一种智能化会计管理系统
CN103490925A (zh) 电力通信网性能状态实时评估方法与系统
CN108446202B (zh) 一种机房设备的安全状况的判断方法
CN111275136B (zh) 基于小样本下的故障预测系统及其预警方法
CN113919225B (zh) 环境试验箱可靠性评估方法和系统
CN114629776B (zh) 基于图模型的故障分析方法及装置
CN117560300B (zh) 一种智能物联网流量预测与优化系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20210120

Address after: Room 301, building 1, R & D headquarters, Science Park, Central South University, changzuo Road, Yuelu street, Yuelushan University Science and Technology City, Changsha City, Hunan Province, 410000

Patentee after: Hunan Tianyun Software Technology Co.,Ltd.

Address before: Yuelu District City, Hunan province 410083 Changsha Lushan Road No. 932

Patentee before: CENTRAL SOUTH University

TR01 Transfer of patent right
CP01 Change in the name or title of a patent holder

Address after: Room 301, building 1, R & D headquarters, Science Park, Central South University, changzuo Road, Yuelu street, Yuelushan University Science and Technology City, Changsha City, Hunan Province, 410000

Patentee after: Tianyun Software Technology Co.,Ltd.

Address before: Room 301, building 1, R & D headquarters, Science Park, Central South University, changzuo Road, Yuelu street, Yuelushan University Science and Technology City, Changsha City, Hunan Province, 410000

Patentee before: Hunan Tianyun Software Technology Co.,Ltd.

CP01 Change in the name or title of a patent holder