CN111242225A - 一种基于卷积神经网络的故障检测与诊断方法 - Google Patents

一种基于卷积神经网络的故障检测与诊断方法 Download PDF

Info

Publication number
CN111242225A
CN111242225A CN202010047079.9A CN202010047079A CN111242225A CN 111242225 A CN111242225 A CN 111242225A CN 202010047079 A CN202010047079 A CN 202010047079A CN 111242225 A CN111242225 A CN 111242225A
Authority
CN
China
Prior art keywords
fault
network
data
layer
parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202010047079.9A
Other languages
English (en)
Inventor
朱晓荣
池德盛
卞浩卜
赵凌宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Posts and Telecommunications
Original Assignee
Nanjing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Posts and Telecommunications filed Critical Nanjing University of Posts and Telecommunications
Priority to CN202010047079.9A priority Critical patent/CN111242225A/zh
Publication of CN111242225A publication Critical patent/CN111242225A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24147Distances to closest patterns, e.g. nearest neighbour classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明提出了一种适用于异构无线网络的基于卷积神经网络的故障检测与诊断方法。本发明利用基于卷积神经网络的诊断模型,以提高故障诊断准确率为目标,使用ReliefF和互信息方法,选取合适的特征参数输入诊断模型中做故障分类;筛选出有用的网络参数,选择最佳特征组合作为故障检测阶段的输入参数,进一步判断网络中是否存在故障小区;最后利用卷积神经网络诊断模型定位故障的根本原因;本发明可以在故障检测阶段选择最佳的特征组合作为输入参数,降低特征维度,从而提升计算效率和节约网络计算资源。

Description

一种基于卷积神经网络的故障检测与诊断方法
技术领域
本发明涉及异构无线网络通信技术领域,主要涉及一种基于卷积神经网络的故障检测与诊断方法。
背景技术
近年来移动通信行业正发生着巨大的变化,可以预见在不久的将来无线通信系统不仅应该连接人类,还应该连接机器,车辆和传感器等。为了满足不同类型的业务需求,下一代无线网络的发展趋势必将是集成LTE,WLAN和5G等多种无线接入技术(RAT,RadioAccess Technology)的异构无线网络(HWN,Heterogeneous Wireless Network)。在复杂的异构无线网络的背景下,迫切需要一种动态和自适应的网络管理方法。而故障管理是网络管理的重要方面之一,它可以分为故障检测和故障诊断两部分。故障检测就是根据观察网络症状来识别有故障的小区,故障诊断就是对故障的原因进行识别。
针对上述需求,使用图论、模型遍历技术和人工智能等方法对计算机网络中的故障进行建模以实现对故障的检测和定位。然而,最近许多研究人员越来越关注研究无线网络故障的智能检测和定位算法。与计算机网络中的故障定位相比,由于多个无线网络的覆盖共存和无线信道的广播特性,无线网络中的故障定位也变得更加复杂。有人针对分布式故障检测中的配置开销和链路负载过大的问题,提出了一种具有自适应探测间隔的故障检测模型,可以根据探测响应时延和丢包率的变化动态改变探测间隔。也有人通过改进基于动态贝叶斯网络的推理算法,在略微降低诊断准确性的情况下,大大降低了算法的计算复杂度,解决了大规模IP动态网络故障诊断耗时长的问题。
在无线网络中,以往网络故障的自动检测和诊断仅针对完全中断的情况,在性能降低情况下的诊断分析还需要人工处理,针对此问题提出了对关键性能指标(KPI,KeyPerformance Indicators)等级化,通过对之前的故障案例分析形成报告,并设计了一个以KPI等级和报告为输入参数的得分系统以实现网络故障的自动检测和诊断,但是随着网络复杂性的增加,故障报告数据库的建立将是一个挑战。
可是随着网络规模和复杂性的增加,迫切地需要更多智能的算法从数据中提取有用信息。上述方法大多采用的网络故障诊断指标都是由OAM提供的KPI和警报,而还有人提出一种将KPI与用户上下文信息相结合的指标,可以有效提高诊断的准确度。或是在用户侧建立一个QoE异常检测和诊断框架,利用两边KS-test算法计算当前QoS与数据库中QoS的距离来判断QoE是否异常,再利用等价类的序列检测(SPADE,Sequential Pattern Discoveryusing Equivalence classes)方法诊断出QoE异常的原因。
发明内容
发明目的:本发明旨在提供一种基于卷积神经网络的故障检测与诊断方法,该方法用于异构无线网络中在诊断时延和诊断准确率上都有更好的性能,提供了基于ReliefF(Relevant Features)和互信息方法选择最佳特征组合作为故障检测阶段的输入参数,从而判断网络中是否存在故障小区;最后利用基于CNN的故障诊断模型定位故障的根本原因。
技术方案:为实现上述目的,本发明采用的技术方案为:
一种基于卷积神经网络的故障检测与诊断方法,包括故障检测和故障诊断两部分,具体包括以下步骤:
步骤1、针对具体网络场景分析发生的故障原因的种类,筛选出相关网络参数,包括覆盖与信道质量指标、接入性指标、保持性指标、移动性指标和业务量指标;
步骤2、基于ReliefF和互信息方法参数表中筛选出主要特征,作为故障检测阶段的输入参数,降低特征维度,提升计算效率和节约网络计算资源;
步骤3、计算时序数据分布相似度,用于判断网络是否发生了故障;
步骤4、采用基于卷积神经网络的故障诊断模型对网络进行诊断。
进一步地,所述步骤2中基于ReliefF和互信息方法参数表中筛选出主要特征的步骤如下:
步骤2.1、每次从训练数据集D中随机选出一个样本R,然后从R同类的样本中寻找k个猜中最近邻样本Hj,再从R的每个不同类样本中找到k个猜错最近邻样本Mj(C),C≠class(R),j=(1,2,...,k),然后更新每个特征的权重,如下式所示:
Figure BDA0002369804930000021
其中,diff(A,R1,R2)表示样本R1和样本R2在特征A上的距离,Mj(C)表示类C中第j个猜错最近邻样本,P表示边缘概率分布函数W(A)表示特征权重;diff(A,R1,R2)满足如下条件:
Figure BDA0002369804930000031
步骤2.2、利用互信息来表征特征之间的相关性,删去相关性高的特征;连续型随机变量互信息的计算公式如下:
Figure BDA0002369804930000032
其中,p(x,y)是随机变量x,y的联合概率分布函数,p(x),p(y)分别是随机变量X,Y边缘概率分布函数。
进一步地,所述步骤3中计算时序数据分布相似度的方法如下:
针对每个节点得到的k个最优参数,在t时刻,k个参数形成的参数集合KPI如下:
Figure BDA0002369804930000037
当数据采集时间窗口长度为T时,在t时刻,基于最优参数集合形成的时间窗参数矩阵的分布X如下:
Figure BDA0002369804930000033
对上式取平均值,得到t时刻的数据集合如下:
Figure BDA0002369804930000034
Figure BDA0002369804930000035
计算线上KPI参数分布和数据库中正常状态下参数分布的距离dis为:
Figure BDA0002369804930000036
考虑到数据分布的时间变化特征,可以数据库中可以存储多个时刻正常状态下参数分布,若当前时刻t不在数据库中,可以通过下式计算t时刻正常状态下参数分布:
Figure BDA0002369804930000041
定义数据分布相似度因子α,其中α=0表示完全相同,α=1表示完全不同;当dis>α就可以认为是一种疑似故障,通过数据来源基站的位置信息定位故障小区,并向故障诊断模型发送启动诊断的命令。
进一步地,所述步骤4中建立基于卷积神经网络的故障诊断模型以及诊断网络故障的方法如下:
步骤4.1,建立一个8层的卷积神经网络故障诊断模型,初始化参数;所述故障诊断模型分别包括输入层、卷积层、探测层、池化层、全连接层和输出层;
其中输入层采集的数据包括特征参数、当前基站邻居基站和时间特性三个维度;在邻居基站的选择上,将两基站间最小切换次数多的视为邻居基站,并获取前三的邻居基站信息;为了保证数据格式的一致性,对不满足3个基站的数据样本填充0,这样可以避免基站部署稀疏的情况下邻居基站数目缺失的情况;
卷积层卷积核大小为3x3,步长为1;所述卷积层运算公式如下:
Figure BDA0002369804930000042
其中fi,j是在位置(i,j)上的卷积元素,f是卷积核,H是卷积核的行数,W是卷积核的列数,对于第一层卷积层,
Figure BDA0002369804930000044
是指输入的参数矩阵(i,j)处的元素,在后面的卷积层,是上一层的卷积层的相应输出值位置的计算数值;
探测层采用ReLU作为激活函数;池化核大小为2x2,步长为2;全连接层设置dropout操作的参数为0.5,优化器的学习步长为0.0001;并采用交叉熵作为损失函数,如下所示:
z=L(x,y)=∑iyilog(pi)
其中,
Figure BDA0002369804930000043
C是分类任务类别个数;
步骤4.2、将输入数据分为训练数据和验证数据,利用训练数据训练模型;基于步骤4.1所述的卷积公式将数据前向传递到最后一层,再利用反向传播算法更新网络的权重和偏置并保存训练好的网络参数;
步骤4.3、当诊断阶段触发后,系统会请求最近一段时间内相关的网络信息,将其预处理为以下格式:
Figure BDA0002369804930000051
其中Lcur表示当前基站的位置信息,
Figure BDA0002369804930000052
表示当前基站在t时刻的第i个KPI参数值,Xi(t)表示当前基站的第i个邻居基站;考虑到网络参数的时间变化特性,本文中取一段时间内的参数数据作为模型的输入:
Input=[X(t-n+1),X(t-n+2),...,X(t)]
步骤4.4、输入验证数据测试故障诊断模型的性能;每条KPI数据中都包含数据来源基站的位置信息,所以当新数据输入训练好的模型中,故障的原因和位置都可以定位出来。
有益效果:本发明具备以下优点:
(1)提出了一种基于卷积神经网络的异构无线网络故障检测与诊断方法,首先,分析网络故障的原因;然后,基于ReliefF算法和互信息,选择合适的特征组合作为故障检测阶段的输入参数来识别网络中的可疑故障小区。如果检测到疑似故障小区,则通过基于卷积神经网络的故障诊断模型来定位故障的根本原因。
(2)基于ReliefF(Relevant Features)和互信息方法选择最佳特征组合作为故障检测阶段的输入参数,降低特征维度,提升计算效率和节约网络计算资源。
(3)采集的数据具有特征参数、当前基站邻居基站和时间特性三个维度,就类似于图片的长、宽、高(颜色)三个维度。
(4)通过卷积、非线性激活函数映射和池化操作将输入数据层层变换,使得高层的数据信息逐层从原始数据中抽取出来完成前馈运算。
(5)卷积核参数共享,通过一定大小的卷积核,作用于局部数据矩阵区域可以得到数据的局部信息,完成卷积后实现了多个局部特征的组合,而卷积核中的参数是通过数据训练反馈得到的。
附图说明
图1是本发明提供的模型结构示意图;
图2是本发明提供的故障诊断模型结构示意图;
图3是本发明提供的卷积神经网络层结构示意图;
图4是本发明提供的卷积神经网络层模型示意图。
具体实施方式
下面结合附图对本发明作更进一步的说明。
如图1-2所示,在异构无线网络中设计一种基于卷积神经网络的故障检测与诊断方法,首先针对具体的网络场景分析可能发生的故障原因的种类,筛选出有用的网络参数;然后基于ReliefF(Relevant Features)和互信息方法选择最佳特征组合作为故障检测阶段的输入参数,从而判断网络中是否存在故障小区;最后利用基于CNN的故障诊断模型定位故障的根本原因。
1、网络故障分析
对运营商而言最严重的故障就是服务中断,因为这会直接影响用户的使用体验和满意度。通过对网络场景的分析,我们发现造成小区服务中断的原因大致可以分为干扰、覆盖、硬件、传输和其他这五大类。
a.干扰
上行干扰会影响基站接收信号,下行干扰会影响移动台接收信号。在LTE网络中,通常用SINR(Signal to Interference Noise Ratio信干噪比)来衡量当前信道的质量。
b.覆盖范围
覆盖范围的故障可以分为缺少小区边界覆盖和小区内覆盖盲点两类,这些都会导致接收信号功率和质量的下降,从而发生业务中断。前者通常发生在偏远农村和低人口密集度的区域的边界,因为这些区域的业务量小,基站往往追求更大的覆盖范围,从而靠近区域边界的移动台发送的信号强度对于基站接收器来说是远远不够的,所以这些小区上行链路传输会受到限制。后者在农村和城市都可能发生,但在城市中更为常见。因为众多的高楼、汽车等障碍物对信号传播的影响,可能会导致小区内某一区域基站或移动台的接收信号强度突然降低,从而引发业务中断。
c.硬件
硬件故障通常指基站设备组件故障,基站中部分组件随时间逐渐恶化失效,而部分组件则突然失效。从而硬件故障的影响轻则信号强度下降,少量无线链路质量恶化,重则小区服务中断、掉话率急剧上升。在大多数情况下,当发生硬件故障时会触发大量警报。
d.传输
在无线接入网侧用户和基站之间一般采用无线链路,基站与基站之间一般采用有线链路,所以传输故障可以分为接口故障(如Uu接口、X2接口和S1接口等)和链路故障两类。
e.其他故障
除了之前所描述的这些故障外,还有许多不常出现的或者比较低级的故障(比如断电等),其中较为突出的有衰落和参数配置错误。
2、网络参数选择
症状对于网络故障诊断而言非常重要,因为其参数能反映网络的状态并能指出故障发生的原因。通过对网络场景和故障原因的分析,本发明选取了以下网络参数,可以分为覆盖与信道质量指标、接入性指标、保持性指标、移动性指标和业务量指标。
a.覆盖&信道质量指标
RSRQ(Reference Signal Strength Indicator,参考信号接收质量)反映和指示当前信道质量的信噪比和干扰水平,计算公式如下:
Figure BDA0002369804930000071
其中N表示一个载波中资源块的数量,RSSI(Received Signal StrengthIndication,接收信号强度指示)反映接收信号的平均功率,包括导频信号、干扰信号和噪声信号。从公式中可以看出RSRQ是从接收信号强度和干扰两个方面表征的,更为全面的反映网络的性能,当RSRQ小于-8dB时信号受到的干扰比较大。
丢包率可以反映不同故障情况,比如若物理层的接收和发送的丢包率一直很高,则说明该节点的收发器等硬件发生故障,若只是短暂的升高则可能是受到干扰的原因。
b.接入性指标
呼叫成功率(无线接通率)是反映小区对UE呼叫的接纳能力,直接影响用户的使用感受,一个完整的无线接通率包括RRC连接建立和E-RAB连接建立两个过程。
造成RRC连接建立失败的原因有上行随机接入信道功率问题、小区重选参数问题、下行初始发射功率偏低、上行初始功控问题、拥塞问题或设备异常问题等。比如说eNodeB收到UE发的RRC建立请求消息后,下发了RRC Connection Setup消息而UE没有收到。如果此时的SINR偏低,而且监视集中没有质量更好的小区,那就是覆盖的问题,可以适当提高下行公共信道的功率。如果此时监视集中有更好的小区,则就是小区重选的问题,可以适当调整小区重选参数加快小区重选。
E-RAB反映了eNB接纳业务的能力,造成E-RAB建立失败的原因有核心网问题、传输层问题或无线资源不足等。比如说在上下文建立过程中等待RRC重配完成超时,所以一般如果RRC连接失败增加,E-RAB失败的次数也会升高。
c.保持性指标
正如上文所说网络故障会导致大量掉话以及服务中断,严重影响用户的使用体验。通常用掉话率来反映网络通信保持性能。
掉话率反映了系统的通讯保持能力。当用户服务发生中断,E-RAB的承载连接就会断开,所以我们采用E-RAB异常释放来计算该指标。
d.移动性指标
切换成功率是移动传输类的重要指标之一,按照涉及的网元关系可以分为eNodeB内切换成功率、eNodeB间(包括X2切换和S1切换)切换成功率。切换成功率的高低,直接与掉话率相挂钩,是运营商重点关注的KPI指标之一。
eNodeB内切换成功率反映了eNodeB内小区间切换的成功情况,保证用户在移动过程中使用业务的连续性。
X2口切换成功率反映了与其他eNodeB存在X2连接的情况下,UE在基站间的切换成功情况。
S1口切换成功率是当eNodeB根据UE测量上报决定UE要切换,且目标小区与eNB无X2连接,就进行通过核心网的S1切换。
切换时延相比较于3G,LTE没有软切换概念,全部为硬切换,即切换过程中业务会发生中断。切换时延就是衡量用户感受网络服务质量的一个重要指标,中断时间过长,用户会明显感受到业务中断,特别对于实时性业务。
造成切换成功率指标下降的原因有硬件故障(天线问题、天线馈线问题)、传输接口问题、拥塞问题、覆盖问题和数据配置不当。比如,信号覆盖问题导致切换成功率低,一类是越区覆盖,由于边缘门限设置过低,基站功率过大,倾角不合适导致越区覆盖,形成同频干扰,影响切换成功率;另一类是弱覆盖形成的覆盖漏洞。
e.业务量指标
小区上/下行平均吞吐率反映了单位时间内上/下行的流量情况。链路的吞吐量、误码率和丢包率可以反映传输链路的健康情况,与小区吞吐量指标相结合一定程度上就能反映出是节点故障还是链路故障。
3、基于卷积神经网络CNN的网络故障诊断
基于CNN的网络故障诊断模型分为检测和诊断两个阶段,如图2所示。在检测阶段,先利用ReliefF和互信息方法筛选出主要特征,降低特征维度,提升计算效率和节约网络计算资源,然后计算时序数据分布相似度来判断网络中是否发生了故障。当检测阶段检测出疑似故障小区时就会触发诊断阶段,该阶段会将相关的网络参数都作为卷积神经网络的输入,诊断出故障发生的根本原因。
(1)特征选择阶段
在检测阶段,检测程序需要时刻运行,收集节点(例如:宏基站,小基站,中继等)参数信息,如果将网络中所有的数据都传送到服务器上计算,不仅占用无线资源,而且服务器负载也会受到影响。因此,需要基于网络参数的重要性,选择少量重要的网络参数来识别故障小区。一般常用的特征选择的方案是基于特征和分类变量相关度的最大化准则做优化,即选择和分类变量之间拥有最高相关度的前k个变量。但是,特征之间可能存在较高的相关性,从而造成特征的冗余。
因此本发明分两步对特征进行筛选,第一步采用ReliefF计算出每个特征的权重,然后按权重大小排序,得到集合S1;第二步对S1里的特征两两计算互信息,互信息大于一定阈值的删除权重较小的那个特征,得到集合S2,最后从S2中挑选前k个特征作为检测阶段的输入网络参数。
首先,每次从训练数据集D中随机选出一个样本R,然后从R同类的样本中寻找k个猜中最近邻样本Hj,再从R的每个不同类样本中找到k个猜错最近邻样本Mj(C),C≠class(R),j=(1,2,...,k),然后更新每个特征的权重,如下式所示:
Figure BDA0002369804930000091
其中,diff(A,R1,R2)表示样本R1和样本R2在特征A上的距离,Mj(C)表示类C中第j个猜错最近邻样本,P表示边缘概率分布函数,W(A)表示特征权重;diff(A,R1,R2)满足如下条件:
Figure BDA0002369804930000101
从上式可以看出,若R与其猜中近邻Hj在特征A上的距离小于R与其猜错近邻Mj(C)的距离,则说明特征A对区分同类与异类样本是有益的,于是增大特征A所对应的统计权重;反之,若R与其猜中近邻Hj在特征A上的距离大于R与其猜错近邻Mj(C)的距离,则说明特征A起副作用,于是减少特征A所对应的统计权重。最后,对基于不同样本得到的估计结果进行平均,就得到各特征的权重,权重值越大,则对应特征的分类能力就越强。
虽然ReliefF算法运算效率高,对于数据类型没有要求,可以赋予所有和类别相关性高的特征较高的权重,但是其不能有效的去除冗余特征。于是利用互信息来表征特征之间的相关性,删去相关性高的特征,连续型随机变量互信息的计算公式如下:
Figure BDA0002369804930000102
其中,p(x,y)是随机变量x,y的联合概率分布函数,p(x),p(y)分别是随机变量X,Y边缘概率分布函数。由于连续型的随机变量难以求出对应的概率密度函数,基于Parzenwindows估算互信息量I(X;Y)。
(2)故障检测阶段
针对每个节点得到的k个最优参数,在t时刻,k个参数形成的参数集合KPI如下:
Figure BDA0002369804930000104
当数据采集时间窗口长度为T时,在t时刻,基于最优参数集合形成的时间窗参数矩阵的分布X如下:
Figure BDA0002369804930000103
对上式取平均值,得到t时刻的数据集合如下:
Figure BDA0002369804930000111
Figure BDA0002369804930000112
计算线上KPI参数分布和数据库中正常状态下参数分布的距离dis为:
Figure BDA0002369804930000113
考虑到数据分布的时间变化特征,可以数据库中可以存储多个时刻正常状态下参数分布,若当前时刻t不在数据库中,可以通过下式计算t时刻正常状态下参数分布:
Figure BDA0002369804930000114
定义数据分布相似度因子α,其中α=0表示完全相同,α=1表示完全不同;当dis>α就可以认为是一种疑似故障,通过数据来源基站的位置信息定位故障小区,并向故障诊断模型发送启动诊断的命令。
(3)故障诊断阶段
首先,建立一个8层的卷积神经网络故障诊断模型,如图3-4所示,初始化参数;所述故障诊断模型分别包括输入层、卷积层、探测层、池化层、全连接层和输出层;
其中输入层采集的数据包括特征参数、当前基站邻居基站和时间特性三个维度;在邻居基站的选择上,将两基站间最小切换次数多的视为邻居基站,并获取前三的邻居基站信息;为了保证数据格式的一致性,对不满足3个基站的数据样本填充0,这样可以避免基站部署稀疏的情况下邻居基站数目缺失的情况;
卷积层卷积核大小为3x3,步长为1;所述卷积层运算公式如下:
Figure BDA0002369804930000115
其中fi,j是在位置(i,j)上的卷积元素,f是卷积核,H是卷积核的行数,W是卷积核的列数,对于第一层卷积层,
Figure BDA0002369804930000116
是指输入的参数矩阵(i,j)处的元素,在后面的卷积层,是上一层的卷积层的相应输出值位置的计算数值;
探测层采用ReLU作为激活函数;池化核大小为2x2,步长为2;全连接层设置dropout操作的参数为0.5,优化器的学习步长为0.0001;并采用交叉熵作为损失函数,如下所示:
z=L(x,y)=∑iyilog(pi)
其中,
Figure BDA0002369804930000121
C是分类任务类别个数;
其次,将输入数据分为训练数据和验证数据,利用训练数据训练模型;基于步骤4.1所述的卷积公式将数据前向传递到最后一层,再利用反向传播算法更新网络的权重和偏置并保存训练好的网络参数;
然后,当诊断阶段触发后,系统会请求最近一段时间内相关的网络信息,将其预处理为以下格式:
Figure BDA0002369804930000122
其中Lcur表示当前基站的位置信息,
Figure BDA0002369804930000123
表示当前基站在t时刻的第i个KPI参数值,Xi(t)表示当前基站的第i个邻居基站;考虑到网络参数的时间变化特性,本文中取一段时间内的参数数据作为模型的输入:
Input=[X(t-n+1),X(t-n+2),...,X(t)]
最后,输入验证数据测试故障诊断模型的性能;每条KPI数据中都包含数据来源基站的位置信息,所以当新数据输入训练好的模型中,故障的原因和位置都可以定位出来。
以上所述仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (4)

1.一种基于卷积神经网络的故障检测与诊断方法,其特征在于,包括故障检测和故障诊断两部分,具体包括以下步骤:
步骤1、针对具体网络场景分析发生的故障原因的种类,筛选出相关网络参数,包括覆盖与信道质量指标、接入性指标、保持性指标、移动性指标和业务量指标;
步骤2、基于ReliefF和互信息方法参数表中筛选出主要特征,作为故障检测阶段的输入参数,降低特征维度,提升计算效率和节约网络计算资源;
步骤3、计算时序数据分布相似度,用于判断网络是否发生了故障;
步骤4、采用基于卷积神经网络的故障诊断模型对网络进行诊断。
2.根据权利要求1所述的一种基于卷积神经网络的故障检测与诊断方法,其特征在于,所述步骤2中基于ReliefF和互信息方法参数表中筛选出主要特征的步骤如下:
步骤2.1、每次从训练数据集D中随机选出一个样本R,然后从R同类的样本中寻找k个猜中最近邻样本Hj,再从R的每个不同类样本中找到k个猜错最近邻样本Mj(C),C≠class(R),j=(1,2,...,k),然后更新每个特征的权重,如下式所示:
Figure FDA0002369804920000011
其中,diff(A,R1,R2)表示样本R1和样本R2在特征A上的距离,Mj(C)表示类C中第j个猜错最近邻样本,P表示边缘概率分布函数,W(A)表示特征权重;d iff(A,R1,R2)满足如下条件:
Figure FDA0002369804920000012
步骤2.2、利用互信息来表征特征之间的相关性,删去相关性高的特征;连续型随机变量互信息的计算公式如下:
Figure FDA0002369804920000013
其中,p(x,y)是随机变量x,y的联合概率分布函数,p(x),p(y)分别是随机变量X,Y边缘概率分布函数。
3.根据权利要求1所述的一种基于卷积神经网络的故障检测与诊断方法,其特征在于,所述步骤3中计算时序数据分布相似度的方法如下:
针对每个节点得到的k个最优参数,在t时刻,k个参数形成的参数集合KPI如下:
Figure FDA0002369804920000021
当数据采集时间窗口长度为T时,在t时刻,基于最优参数集合形成的时间窗参数矩阵的分布X如下:
Figure FDA0002369804920000022
对上式取平均值,得到t时刻的数据集合如下:
Figure FDA0002369804920000023
Figure FDA0002369804920000024
计算线上KPI参数分布和数据库中正常状态下参数分布的距离dis为:
Figure FDA0002369804920000025
考虑到数据分布的时间变化特征,可以数据库中可以存储多个时刻正常状态下参数分布,若当前时刻t不在数据库中,可以通过下式计算t时刻正常状态下参数分布:
Figure FDA0002369804920000026
定义数据分布相似度因子α,其中α=0表示完全相同,α=1表示完全不同;当dis>α就可以认为是一种疑似故障,通过数据来源基站的位置信息定位故障小区,并向故障诊断模型发送启动诊断的命令。
4.根据权利要求1所述的一种基于卷积神经网络的故障检测与诊断方法,其特征在于,所述步骤4中建立基于卷积神经网络的故障诊断模型以及诊断网络故障的方法如下:
步骤4.1,建立一个8层的卷积神经网络故障诊断模型,初始化参数;所述故障诊断模型分别包括输入层、卷积层、探测层、池化层、全连接层和输出层;
其中输入层采集的数据包括特征参数、当前基站邻居基站和时间特性三个维度;在邻居基站的选择上,将两基站间最小切换次数多的视为邻居基站,并获取前三的邻居基站信息;为了保证数据格式的一致性,对不满足3个基站的数据样本填充0,这样可以避免基站部署稀疏的情况下邻居基站数目缺失的情况;
卷积层卷积核大小为3x3,步长为1;所述卷积层运算公式如下:
Figure FDA0002369804920000031
其中fi,j是在位置(i,j)上的卷积元素,f是卷积核,H是卷积核的行数,W是卷积核的列数,对于第一层卷积层,
Figure FDA0002369804920000032
是指输入的参数矩阵(i,j)处的元素,在后面的卷积层,是上一层的卷积层的相应输出值位置的计算数值;
探测层采用ReLU作为激活函数;池化核大小为2x2,步长为2;全连接层设置dropout操作的参数为0.5,优化器的学习步长为0.0001;并采用交叉熵作为损失函数,如下所示:
z=L(x,y)=∑iyi log(pi)
其中,
Figure FDA0002369804920000033
C是分类任务类别个数;
步骤4.2、将输入数据分为训练数据和验证数据,利用训练数据训练模型;基于步骤4.1所述的卷积公式将数据前向传递到最后一层,再利用反向传播算法更新网络的权重和偏置并保存训练好的网络参数;
步骤4.3、当诊断阶段触发后,系统会请求最近一段时间内相关的网络信息,将其预处理为以下格式:
Figure FDA0002369804920000034
其中Lcur表示当前基站的位置信息,
Figure FDA0002369804920000035
表示当前基站在t时刻的第i个KPI参数值,Xi(t)表示当前基站的第i个邻居基站;考虑到网络参数的时间变化特性,本文中取一段时间内的参数数据作为模型的输入:
Input=[X(t-n+1),X(t-n+2),...,X(t)]
步骤4.4、输入验证数据测试故障诊断模型的性能;每条KPI数据中都包含数据来源基站的位置信息,所以当新数据输入训练好的模型中,故障的原因和位置都可以定位出来。
CN202010047079.9A 2020-01-16 2020-01-16 一种基于卷积神经网络的故障检测与诊断方法 Withdrawn CN111242225A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010047079.9A CN111242225A (zh) 2020-01-16 2020-01-16 一种基于卷积神经网络的故障检测与诊断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010047079.9A CN111242225A (zh) 2020-01-16 2020-01-16 一种基于卷积神经网络的故障检测与诊断方法

Publications (1)

Publication Number Publication Date
CN111242225A true CN111242225A (zh) 2020-06-05

Family

ID=70865909

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010047079.9A Withdrawn CN111242225A (zh) 2020-01-16 2020-01-16 一种基于卷积神经网络的故障检测与诊断方法

Country Status (1)

Country Link
CN (1) CN111242225A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112039687A (zh) * 2020-07-14 2020-12-04 南京邮电大学 一种面向小样本特征的基于改进生成对抗网络的故障诊断方法
CN112180217A (zh) * 2020-09-30 2021-01-05 福州大学 一种配电网单相接地故障区段定位方法及系统
CN112283050A (zh) * 2020-11-17 2021-01-29 天津科技大学 一种基于机器视觉的风力机叶片在线监测方法
CN112465055A (zh) * 2020-12-09 2021-03-09 西安邮电大学 一种基于卷积神经网络的网络故障诊断方法
CN112465052A (zh) * 2020-12-07 2021-03-09 重庆忽米网络科技有限公司 基于卷积神经网络的设备故障诊断报告生成方法与系统
CN113259847A (zh) * 2021-07-01 2021-08-13 南京邮电大学 一种基于特征优化和LightGBM的室内定位方法
CN113473514A (zh) * 2021-09-06 2021-10-01 国网江苏省电力有限公司信息通信分公司 电力无线专网故障诊断模型训练方法、诊断方法及装置
CN113689911A (zh) * 2021-10-26 2021-11-23 苏州浪潮智能科技有限公司 一种故障诊断方法、装置、设备及可读存储介质
CN113709779A (zh) * 2021-07-29 2021-11-26 南京邮电大学 一种蜂窝网络故障诊断方法
CN113740667A (zh) * 2021-08-30 2021-12-03 华北电力大学 一种融合自编码器和卷积神经网络的电网故障诊断方法
CN114521903A (zh) * 2022-02-15 2022-05-24 南京邮电大学 一种基于特征选择的脑电注意力识别系统及方法
CN115642967A (zh) * 2022-10-14 2023-01-24 中国科学技术大学 基于小样本信标帧的无线局域网吞吐量预测方法及系统

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112039687A (zh) * 2020-07-14 2020-12-04 南京邮电大学 一种面向小样本特征的基于改进生成对抗网络的故障诊断方法
CN112180217A (zh) * 2020-09-30 2021-01-05 福州大学 一种配电网单相接地故障区段定位方法及系统
CN112283050A (zh) * 2020-11-17 2021-01-29 天津科技大学 一种基于机器视觉的风力机叶片在线监测方法
CN112465052A (zh) * 2020-12-07 2021-03-09 重庆忽米网络科技有限公司 基于卷积神经网络的设备故障诊断报告生成方法与系统
CN112465052B (zh) * 2020-12-07 2023-04-07 重庆忽米网络科技有限公司 基于卷积神经网络的设备故障诊断报告生成方法与系统
CN112465055A (zh) * 2020-12-09 2021-03-09 西安邮电大学 一种基于卷积神经网络的网络故障诊断方法
CN113259847A (zh) * 2021-07-01 2021-08-13 南京邮电大学 一种基于特征优化和LightGBM的室内定位方法
CN113709779A (zh) * 2021-07-29 2021-11-26 南京邮电大学 一种蜂窝网络故障诊断方法
CN113709779B (zh) * 2021-07-29 2023-06-02 南京邮电大学 一种蜂窝网络故障诊断方法
CN113740667B (zh) * 2021-08-30 2022-06-14 华北电力大学 一种融合自编码器和卷积神经网络的电网故障诊断方法
CN113740667A (zh) * 2021-08-30 2021-12-03 华北电力大学 一种融合自编码器和卷积神经网络的电网故障诊断方法
CN113473514B (zh) * 2021-09-06 2021-11-16 国网江苏省电力有限公司信息通信分公司 电力无线专网故障诊断模型训练方法、诊断方法及装置
CN113473514A (zh) * 2021-09-06 2021-10-01 国网江苏省电力有限公司信息通信分公司 电力无线专网故障诊断模型训练方法、诊断方法及装置
CN113689911A (zh) * 2021-10-26 2021-11-23 苏州浪潮智能科技有限公司 一种故障诊断方法、装置、设备及可读存储介质
WO2023071039A1 (zh) * 2021-10-26 2023-05-04 苏州浪潮智能科技有限公司 一种故障诊断方法、装置、设备及可读存储介质
CN114521903A (zh) * 2022-02-15 2022-05-24 南京邮电大学 一种基于特征选择的脑电注意力识别系统及方法
CN114521903B (zh) * 2022-02-15 2024-06-28 南京邮电大学 一种基于特征选择的脑电注意力识别系统及方法
CN115642967A (zh) * 2022-10-14 2023-01-24 中国科学技术大学 基于小样本信标帧的无线局域网吞吐量预测方法及系统

Similar Documents

Publication Publication Date Title
CN111242225A (zh) 一种基于卷积神经网络的故障检测与诊断方法
CN108540330B (zh) 一种异构网络环境下的基于深度学习的网络故障诊断方法
EP1142377B1 (en) Method of performing handoff in a wireless communication system
US10374882B2 (en) Systems and methods for identifying causes of quality degradation in wireless networks
US8831586B2 (en) Method and system for reporting neighbor cell information
Amirijoo et al. Cell outage management in LTE networks
Sallent et al. A roadmap from UMTS optimization to LTE self-optimization
CN109845302B (zh) 用于自动识别和优化过冲小区的系统和方法
CN106792752B (zh) 基站信号覆盖自优化方法和系统
WO2010128576A1 (ja) 網管理システム、無線カバレッジ調節方法および無線カバレッジ調節用プログラム
US20230362758A1 (en) Methods and apparatuses for handover procedures
KR101991761B1 (ko) 셀 정전 검출 및 송신 전력 조절 방법 및 장치
US20140194113A1 (en) Radio Base Station, Radio Network Node and Methods Therein for Detecting a Faulty Antenna
CN110062393B (zh) 一种网络差小区智能分析方法
US9980187B2 (en) Method of optimizing a cellular network and system thereof
WO2021151503A1 (en) Analytics node and method thereof
JP5399562B2 (ja) セルラ無線システムにおける問題発生の示唆を行う方法及び装置
Puttonen et al. Coverage optimization for minimization of drive tests in LTE with extended RLF reporting
EP2485516A1 (en) Radio coverage in mobile telecommunications systems
Abd El-Aziz et al. Cell outage detection and degradation classification based on alarms and kpi’s correlation
Gharouni et al. Signal overhead reduction for AI-assisted conditional handover preparation
Aziz et al. Autonomous neighbor relation detection and handover optimization in LTE
KR100447698B1 (ko) 네트워크 성능 최적화를 위한 분석 장치 및 그 방법
Zoha et al. Anomaly Detection and Self‐healing in Industrial Wireless Networks
Kaada et al. Measuring 5G-RAN resilience using coverage and quality of service indicators

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 210003 Gulou District, Jiangsu, Nanjing new model road, No. 66

Applicant after: NANJING University OF POSTS AND TELECOMMUNICATIONS

Address before: Yuen Road Qixia District of Nanjing City, Jiangsu Province, No. 9 210003

Applicant before: NANJING University OF POSTS AND TELECOMMUNICATIONS

CB02 Change of applicant information
WW01 Invention patent application withdrawn after publication

Application publication date: 20200605

WW01 Invention patent application withdrawn after publication