CN115278741A - 一种基于多模态数据依赖关系的故障诊断方法和装置 - Google Patents

一种基于多模态数据依赖关系的故障诊断方法和装置 Download PDF

Info

Publication number
CN115278741A
CN115278741A CN202210676227.2A CN202210676227A CN115278741A CN 115278741 A CN115278741 A CN 115278741A CN 202210676227 A CN202210676227 A CN 202210676227A CN 115278741 A CN115278741 A CN 115278741A
Authority
CN
China
Prior art keywords
data
index
dependency relationship
fault
graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210676227.2A
Other languages
English (en)
Other versions
CN115278741B (zh
Inventor
裴丹
李明杰
卢香琳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN202210676227.2A priority Critical patent/CN115278741B/zh
Publication of CN115278741A publication Critical patent/CN115278741A/zh
Application granted granted Critical
Publication of CN115278741B publication Critical patent/CN115278741B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/04Arrangements for maintaining operational condition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/16Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks using machine learning or artificial intelligence

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明公开了一种基于多模态数据依赖关系的故障诊断方法和装置,该方法包括:构建分层依赖关系图,对指标层依赖关系图的节点指标进行故障检测;将故障发生前的第一预设时间段的数据作为训练集,第二预设时间段的数据作为测试集,根据训练集计算得到平均数和标准差,判定节点指标是否为异常节点指标,并计算异常分数,沿着指标层依赖关系图的因果关系边反向搜索异常分数超过预设数值的指标节点,根据搜索路径构成异常子图,保留异常子图上的根节点,将根节点按照指标异常分数排序,得到故障原因候选集,以完成故障诊断。本发明通过构建无线小区之间的依赖关系图,获取到无线小区指标间的依赖关系,精确地进行无线网络的故障诊断和故障传播路径追溯。

Description

一种基于多模态数据依赖关系的故障诊断方法和装置
技术领域
本发明涉及关系挖掘和故障诊断等技术领域,尤其涉及一种基于多模态数据依赖关系的故障诊断方法和装置。
背景技术
在第四代移动通信技术4G网络中,网络采用扁平化的架构,主要由用户设备、基站和核心网组成。其中,基站是4G网络中的主要设备之一,是用户设备和核心网之间的桥梁,其运行状况对用户感知的影响极大。每个基站覆盖多个无线小区,为小区内的用户提供无线网络通信服务。无线小区一直是运维保障系统所关心的重点单元,运营商通常会采集每个无线小区的表征网络关键性能水平的指标、用户感知情况指标、无线小区配置信息、设备日志、告警信息等多模态数据,捕捉到与网络系统状态和服务质量相关的信息。
聚焦于无线网络中的无线小区层面,将无线小区抽象为一个节点,每个节点内包括采集的多模态数据,仅凭单模态数据难以完整刻画系统整体的状态,而这些多模态数据之间通常具有一定的依赖关系,单个或多个无线小区的故障或配置更改将产生连带的影响,例如两个小区间的切换迟滞配置参数发生改变,将影响其最大RRC(Radio ResourceControl)连接用户数、上行PRB(Physical Resource Block)平均利用率等指标。随着底层数据逐步复杂化和海量化,无线网络的维护优化日益精细化,有效地挖掘节点间和节点的多模态数据中的依赖关系对后续的变更推荐和故障定位具有重要意义。然而,无线网络中的无线小区众多,且采集到的多模态数据量大,内部关系复杂。传统的方法很难高效且准确地在本场景中进行依赖关系发现。
在大规模无线网络中,为监控系统性能,运维人员通常会对关键业务指标配置异常告警,当检测到无线网络的关键业务指标出现异常时,触发告警,我们通常认为发生故障。由于无线网络的众多无线小区和大量的多模态数据,以及其中存在复杂的因果关系,当故障发生时,故障将沿着因果关系从因到果不断传播,导致出现大量数据表现异常的情况,人工排查数量如此多的异常数据难度过高。而基于专家知识配置的因果关系不全面,已有因果关系挖掘算法不能准确高效地挖掘大规模无线网络中多模态数据的因果关系,在故障诊断和故障传播路径追溯上,常常面临着很大的瓶颈。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的目的在于提出一种基于多模态数据依赖关系的故障诊断方法,本发明通过构建无线小区之间的依赖关系图,根据指标的依赖关系,精确地进行无线网络的故障诊断和故障传播路径追溯。
本发明的另一个目的在于提出一种基于多模态数据依赖关系的故障诊断装置。
为达上述目的,本发明一方面提出了一种基于多模态数据依赖关系的故障诊断方法,包括:
获取多个无线小区的多模态数据,基于所述多模态数据构建分层依赖关系图;基于所述分层依赖关系图中的指标层依赖关系图,根据预设故障发生时间对所述指标层依赖关系图的指标数据进行故障检测;其中,所述故障检测,包括:将故障发生前的第一预设时间段的数据作为训练集,第二预设时间段的数据作为测试集,并根据所述训练集计算得到平均数和标准差;以及,基于所述测试集的指标数据,通过基于所述平均数和标准差的预设公式,判定所述指标数据是否为异常指标数据,并计算所述指标数据的异常分数;基于所述故障检测判定的所述异常指标数据,沿着所述指标层依赖关系图的因果关系边反向搜索所述异常分数超过预设数值的指标数据,根据搜索路径构成异常子图,保留所述异常子图上的根节点,将所述根节点按照指标异常分数排序,得到故障原因候选集,以完成故障诊断。
本发明实施例的基于多模态数据依赖关系的故障诊断方法,能够支持大规模无线网络中无线小区的多模态数据的依赖关系发现,将无线网络中多模态数据预处理为统一表征的指标形式后,提出将无线小区及其指标建模为分层图,并将系统知识与算法自动学习融合,构建无线小区的分层依赖关系,这些关系对于网络性能的深层诊断和分析至关重要。提出基于条件独立检验的时空依赖发现算法,通过在空间维度的分割采集更多的样本,增加了依赖关系发现的准确度,同时由于空间上的样本组分割,能够适用于大规模无线小区间的大量指标的依赖关系发现,具有高效性,也可以推广到其他相似场景。采用基于主动学习的方案,提出将专家反馈融入到依赖关系挖掘中,通过选取关系边推荐给运维人员来判断是否正确,让挖掘算法根据反馈结果学习优化,在迭代中不断提升算法识别有效依赖关系边的准确率,以进行无线网络的故障诊断和故障传播路径追溯。
为达到上述目的,本发明另一方面提出了一种基于多模态数据依赖关系的故障诊断装置,包括:
数据获取模块,用于获取多个无线小区的多模态数据,基于所述多模态数据构建分层依赖关系图;
故障检测模块,用于基于所述分层依赖关系图中的指标层依赖关系图,根据预设故障发生时间对所述指标层依赖关系图的指标数据进行故障检测;其中,所述故障检测模块,包括:
第一检测模块,用于将故障发生前的第一预设时间段的数据作为训练集,第二预设时间段的数据作为测试集,并根据所述训练集计算得到平均数和标准差;以及,
第二检测模块,用于基于所述测试集的指标数据,通过基于所述平均数和标准差的预设公式,判定所述指标数据是否为异常指标数据,并计算所述指标数据的异常分数;
故障溯源模块,用于基于所述故障检测模块判定的所述异常指标数据,沿着所述指标层依赖关系图的因果关系边反向搜索所述异常分数超过预设数值的指标数据,根据搜索路径构成异常子图,保留所述异常子图上的根节点,将所述根节点按照指标异常分数排序,得到故障原因候选集,以完成故障诊断。
本发明实施例的基于多模态数据依赖关系的故障诊断装置,能够支持大规模无线网络中无线小区的多模态数据的依赖关系发现,将无线网络中多模态数据预处理为统一表征的指标形式后,提出将无线小区及其指标建模为分层图,并将系统知识与算法自动学习融合,构建无线小区的分层依赖关系,这些关系对于网络性能的深层诊断和分析至关重要。提出基于条件独立检验的时空依赖发现算法,通过在空间维度的分割采集更多的样本,增加了依赖关系发现的准确度,同时由于空间上的样本组分割,能够适用于大规模无线小区间的大量指标的依赖关系发现,具有高效性,也可以推广到其他相似场景。采用基于主动学习的方案,提出将专家反馈融入到依赖关系挖掘中,通过选取关系边推荐给运维人员来判断是否正确,让挖掘算法根据反馈结果学习优化,在迭代中不断提升算法识别有效依赖关系边的准确率,以进行无线网络的故障诊断和故障传播路径追溯。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为根据本发明实施例的基于多模态数据依赖关系的故障诊断方法的流程图;
图2为根据本发明实施例的无线网络中多模态数据的依赖关系发现架构图;
图3为根据本发明实施例的基于多模态数据依赖关系的故障诊断装置的结构示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
下面参照附图描述根据本发明实施例提出的基于多模态数据依赖关系的故障诊断方法及系统。
图1是本发明一个实施例的基于多模态数据依赖关系的故障诊断方法的流程图。
如图1所示,该方法包括但不限于以下步骤:
S1,获取多个无线小区的多模态数据,基于多模态数据构建分层依赖关系图;
S2,基于分层依赖关系图中的指标层依赖关系图,根据预设故障发生时间对指标层依赖关系图的指标数据进行故障检测;其中,故障检测,包括:
S3,将故障发生前的第一预设时间段的数据作为训练集,第二预设时间段的数据作为测试集,并根据训练集计算得到平均数和标准差;以及,
S4,基于测试集的指标数据,通过基于平均数和标准差的预设公式,判定指标数据是否为异常指标数据,并计算指标数据的异常分数;
S5,基于故障检测判定的异常指标数据,沿着指标层依赖关系图的因果关系边反向搜索异常分数超过预设数值的指标数据,根据搜索路径构成异常子图,保留异常子图上的根节点,将根节点按照指标异常分数排序,得到故障原因候选集,以完成故障诊断。
下面结合附图对本发明实施例做进一步阐述。
图2为无线网络中多模态数据的依赖关系发现架构图,如图2所示:
可以理解的是,本发明获取的多模态数据可以包括采集每个无线小区的表征网络关键性能水平的指标、用户感知情况指标、无线小区配置信息、设备日志、告警信息等多模态数据。
进一步地,对获取的模态数据预处理:将多模态数据处理成统一的时间序列的形式,
对指标数据:指标数据已经是时间序列,无需处理;
对日志数据:提取日志模板数量的时间序列;
对告警数据:提取告警类型,并生成告警数量的时间序列;
对配置数据:提取配置项的各参数,生成按照时间变化的序列。
进一步地,分层图构建:
上层为无线小区层,每个小区为一个节点;下层为指标层,每个无线小区包含多个指标。考虑到不同无线小区应用功能和内部协议的一致性,本发明对无线小区进行等价建模。
首先是无线小区层构建关系依赖图:
在无线网络中,对于任一无线小区Vk,运营商会为其配置邻区。
若Vk的邻区参数调整,则将对Vk内部的指标数据产生一定程度的影响。
因此,本项目采用基于系统信息的依赖关系发现方法,根据无线小区间的拓扑图和邻区配置信息,构建依赖关系图。
具体来说,当拓扑中有无线小区Vk和Vj连接,或当邻区配置信息中表明无线小区Vk与Vj为双向邻区,则在依赖关系图中加一条Vk与Vj之间的双向边,当邻区配置信息中表明无线小区Vk仅为Vj的单向邻区,则在依赖关系图中加一条Vj到Vk的单向边。
其次是指标层构建关系依赖图:
具体地,对于指标层依赖关系图的构建,本方案采用基于条件独立检验的时空依赖关系发现算法,基于变量间固有的条件独立性,通过条件独立性检验算法,从数据中分析变量间的依赖关系。本发明实施例的算法在空间维度上提出改进,以适用于当前超大规模无线网络的应用场景,具体算法流程如下:
假设共有M个小区节点,不同节点的指标数量相同,记为N。根据无线小区层的依赖关系,得到任一小区节点Vk的依赖关系父项集
Figure BDA0003696671680000051
(即在无线小区层依赖关系图中指向Vk的所有节点)。
记指标中第一个时间点为T=1,最新时刻为T=t,那么Vk在t-τ时刻的所有指标可表示为
Figure BDA0003696671680000052
其中,
Figure BDA0003696671680000053
表示无线小区Vk在t-τ时刻的第n个指标。
可以理解的是,预设τmax是因果关系存在的最长时延,即在时间差为τmax内的两个时间序列间存在因果关系。
作为一种示例,本发明在挖掘无线小区节点Vk内部指标的依赖关系时,在时间上划分得到t-τmax+1个样本,在空间上将每个无线小区节点与其依赖关系父项
Figure BDA0003696671680000054
均作为一个样本,由此得到该样本总数为(t-τmax+])×M;在挖掘跨小区间(例如,Vl和Vk,其中
Figure BDA0003696671680000055
)指标的依赖关系时,将两个小区节点以及其依赖关系父项的交集
Figure BDA0003696671680000056
作为一个样本,由于跨无线小区间指标的因果关系仅存在于具有因果关系的两个无线小区之间,本发明在时间上划分得到的t-τmax+1个样本的基础上,在空间上将任意两个存在因果关系的无线小区节点均作为一个样本,故该样本总数至多为(t-τmax+1)×M(M-1)/2。
所有样本根据其结构差异划分为不同样本组。在检验时,不同的样本组间采用按照样本数量加权的方式投票。对于所有样本组,采取如下的检验算法:
对于任意指标Xj,k,先采用第一预设算法计算变量的相关条件。
具体来说,首先为变量
Figure BDA0003696671680000061
初始化父节点,本方案认为,只有过去时间的变量会对现在造成影响,从而产生从过去到现在的因和果的关系,因此父节点初始化如下:
Figure BDA0003696671680000062
在第一次迭代中(迭代id:p=0),进行非条件独立测试,当零假设
Figure BDA0003696671680000063
不能在显著性水平α1上被拒绝时,从
Figure BDA0003696671680000064
中移除
Figure BDA0003696671680000065
当对
Figure BDA0003696671680000066
都不能在显著性水平α1上拒绝零假设
Figure BDA0003696671680000067
时,从
Figure BDA0003696671680000068
中移除
Figure BDA0003696671680000069
在此后的每次迭代中(p→p+1),先根据父节点的检验统计值来对它们进行排序,均根据显著性水平α1检验。
首先考虑受检验的两个变量所对应的指标位于同一无线小区内的情况,即检验
Figure BDA00036966716800000610
此时,在
Figure BDA00036966716800000611
中选择统计值最大的p个父节点作为
Figure BDA00036966716800000618
考虑到无线小区的等价性,对任意指标i、时延τ,若
Figure BDA00036966716800000612
更新
Figure BDA00036966716800000619
Figure BDA00036966716800000613
随后进行条件独立性检验
Figure BDA00036966716800000614
若独立,则将
Figure BDA00036966716800000615
Figure BDA00036966716800000616
中移除。
其次考虑受检验的两个变量对应的指标位于不同无线小区节点内的情况,即检验
Figure BDA00036966716800000617
考虑到仅公共父节点无线小区中的指标才可能成为混杂变量,因此,在
Figure BDA0003696671680000071
中筛选出位于无线小区Vk,Vq以及Vk和Vq的公共父节点无线小区中的指标对应的变量中统计值最大的p个父节点作为
Figure BDA0003696671680000072
在进行独立性检验时,由于k的父节点互相等价,当对
Figure BDA0003696671680000073
均检测到
Figure BDA0003696671680000074
时,才将
Figure BDA0003696671680000075
Figure BDA0003696671680000076
中移除。
最后通过第二预设算法测试来检验是否存在
Figure BDA0003696671680000077
的依赖关系。检验的方式可用如下公式表达:
Figure BDA0003696671680000078
当该假设不能在显著性水平α2上被拒绝时,则存在边
Figure BDA0003696671680000079
由此构建小区节点的指标间依赖关系图。
进一步,专家判断:
具体地,将算法学习到的依赖关系推荐给运维人员,运维人员根据自身的运维经验对推荐的依赖关系正确与否进行判断,反馈结果将交由依赖关系发现算法,被判断为无效的依赖关系在分层依赖关系图中删除。与此同时人工反馈的结果也将作为挖掘算法优化的依据。
进一步,算法模型重新学习:
具体地,算法模型重新学习基于主动学习的思路,依赖关系挖掘算法将根据运维人员的人工反馈,来优化后续的挖掘结果。具体来说,专家判断为正确的边,将作为已知加入到依赖关系发现算法中,在第一预设算法中,将已知边对应的父节点直接加入到子节点的依赖关系父项中,并在第二预设算法中不测试该边而直接加入依赖关系图中;对于专家判断为错误的边则不将其父节点加入到子节点的依赖关系父项中,这将对其他边的构建准确性产生正向效用。
进一步,故障诊断:
基于上述分层因果关系图构建方法,本发明采用近期长度为l的指标数据学习无线网络中的因果关系,并定期重新学习。当每一次故障出现时,设故障开始发生时间为t,进行如下步骤的故障诊断。
异常检测:对所有指标采用基于3σ准则的方法进行异常检测。具体来说,对某一个指标X,将故障开始前t-lh至t-1时间段内的数据作为测试集,记为Xtrain,将t至t+lm时间段内的数据作为测试集,记为Xtest。其中lh和lm代表训练集和测试集的长度,均可以由运维人员自行指定,lh不能过小,为更好地学习到指标取值的分布,避免受极端情况影响,要有足够多的数据用于训练;lm与故障诊断的实时性要求相关。对于Xtrain,计算出平均数μ和标准差σ,用于建模指标取值分布。对于Xtest,对其中的每个时刻点Xi做异常检测,若
Figure BDA0003696671680000081
则判定该点为异常。
Figure BDA0003696671680000082
记为该指标的异常分数。
故障溯源:在分层图的指标层中,从出现告警的指标开始,沿着因果关系边反向持续搜索异常分数不为0的指标节点,搜索路径构成异常子图。保留异常子图上的所有根节点。将根节点按照指标异常分数排序,得到故障根本原因候选集,完成故障诊断。
根据本发明实施例的基于多模态数据依赖关系的故障诊断方法,能够支持大规模无线网络中无线小区的多模态数据的依赖关系发现,将无线网络中多模态数据预处理为统一表征的指标形式后,提出将无线小区及其指标建模为分层图,并将系统知识与算法自动学习融合,构建无线小区的分层依赖关系,这些关系对于网络性能的深层诊断和分析至关重要。提出基于条件独立检验的时空依赖发现算法,通过在空间维度的分割采集更多的样本,增加了依赖关系发现的准确度,同时由于空间上的样本组分割,能够适用于大规模无线小区间的大量指标的依赖关系发现,具有高效性,也可以推广到其他相似场景。采用基于主动学习的方案,提出将专家反馈融入到依赖关系挖掘中,通过选取关系边推荐给运维人员来判断是否正确,让挖掘算法根据反馈结果学习优化,在迭代中不断提升算法识别有效依赖关系边的准确率,以进行无线网络的故障诊断和故障传播路径追溯。
为了实现上述实施例,如图3所示,本实施例中还提供了基于多模态数据依赖关系的故障诊断装置10,该装置10包括:数据获取模块100、第一检测模块200、第二检测模块300、第三检测模块400和故障溯源模块500。
数据获取模块100,用于获取多个无线小区的多模态数据,基于多模态数据构建分层依赖关系图;
故障检测模块200,用于基于分层依赖关系图中的指标层依赖关系图,根据预设故障发生时间对指标层依赖关系图的指标数据进行故障检测;其中,故障检测模块200,包括:
第一检测模块300,用于将故障发生前的第一预设时间段的数据作为训练集,第二预设时间段的数据作为测试集,并根据训练集计算得到平均数和标准差;以及,
第二检测模块400,用于基于测试集的指标数据,通过基于平均数和标准差的预设公式,判定指标数据是否为异常指标数据,并计算指标数据的异常分数;
故障溯源模块500,用于基于第二检测模块400判定的异常指标数据,沿着指标层依赖关系图的因果关系边反向搜索异常分数超过预设数值的指标数据,根据搜索路径构成异常子图,保留异常子图上的根节点,将根节点按照指标异常分数排序,得到故障原因候选集,以完成故障诊断。
根据本发明实施例的基于多模态数据依赖关系的故障诊断装置,能够支持大规模无线网络中无线小区的多模态数据的依赖关系发现,将无线网络中多模态数据预处理为统一表征的指标形式后,提出将无线小区及其指标建模为分层图,并将系统知识与算法自动学习融合,构建无线小区的分层依赖关系,这些关系对于网络性能的深层诊断和分析至关重要。提出基于条件独立检验的时空依赖发现算法,通过在空间维度的分割采集更多的样本,增加了依赖关系发现的准确度,同时由于空间上的样本组分割,能够适用于大规模无线小区间的大量指标的依赖关系发现,具有高效性,也可以推广到其他相似场景。采用基于主动学习的方案,提出将专家反馈融入到依赖关系挖掘中,通过选取关系边推荐给运维人员来判断是否正确,让挖掘算法根据反馈结果学习优化,在迭代中不断提升算法识别有效依赖关系边的准确率,以进行无线网络的故障诊断和故障传播路径追溯。
需要说明的是,前述对基于多模态数据依赖关系的故障诊断方法实施例的解释说明也适用于该实施例的基于多模态数据依赖关系的故障诊断装置,此处不再赘述。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (10)

1.一种基于多模态数据依赖关系的故障诊断方法,其特征在于,包括以下步骤:
获取多个无线小区的多模态数据,基于所述多模态数据构建分层依赖关系图;
基于所述分层依赖关系图中的指标层依赖关系图,根据预设故障发生时间对所述指标层依赖关系图的指标数据进行故障检测;其中,所述故障检测,包括:
将故障发生前的第一预设时间段的数据作为训练集,第二预设时间段的数据作为测试集,并根据所述训练集计算得到平均数和标准差;以及,
基于所述测试集的指标数据,通过基于所述平均数和标准差的预设公式,判定所述指标数据是否为异常指标数据,并计算所述指标数据的异常分数;
基于所述故障检测判定的所述异常指标数据,沿着所述指标层依赖关系图的因果关系边反向搜索所述异常分数超过预设数值的指标数据,根据搜索路径构成异常子图,保留所述异常子图上的根节点,将所述根节点按照指标异常分数排序,得到故障原因候选集,以完成故障诊断。
2.根据权利要求1所述的方法,其特征在于,所述获取多个无线小区的多模态数据,基于所述多模态数据构建分层依赖关系图,包括:
获取多个无线小区的多模态数据,并通过数据预处理从所述多模态数据中提取出时间序列的指标数据;
根据多个无线小区节点之间的拓扑图和邻区配置信息,构建无线小区层依赖关系图;以及,基于所述无线小区层依赖关系图,通过依赖关系发现算法挖掘所有指标数据之间的依赖关系构建初始的分层依赖关系图;
对挖掘的所述所有指标数据之间的关系进行专家判断,将被判断为无效的关系在所述初始的分层依赖关系图中删除,得到最终的分层依赖关系图。
3.根据权利要求2所述的方法,其特征在于,所述通过数据预处理从所述多模态数据中提取出时间序列的指标数据,包括:对时间序列的指标数据保留其本身;对日志数据,提取日志模板数量的时间序列;对告警数据,提取告警类型生成告警数量的时间序列;对配置数据,提取配置项的各参数按照时间变化的序列。
4.根据权利要求2所述的方法,其特征在于,所述根据所述多个无线小区节点之间的拓扑图和邻区配置信息,构建无线小区层依赖关系图,包括:
当所述多个无线小区节点之间的拓扑图中有无线小区Vk和Vj连接,或当所述邻区配置信息中表明所述无线小区Vk与Vj为双向邻区,则添加一条Vk与Vj之间的双向边;以及,
当所述邻区配置信息中表明无线小区Vk仅为Vj的单向邻区,则添加一条Vj到Vk的单向边,以构建所述无线小区层依赖关系图。
5.根据权利要求2所述的方法,其特征在于,所述基于所述无线小区层依赖关系图,通过依赖关系发现算法挖掘所有指标数据之间的依赖关系构建初始的分层依赖关系图,包括:
预设M个无线小区节点,每个小区节点的指标数量相同记为N,根据所述无线小区层依赖关系图的依赖关系,得到任一无线小区节点Vk的依赖关系父项集
Figure FDA0003696671670000021
记指标中第一个时间点为T=1,最新时刻为T=t,Vk
Figure FDA0003696671670000028
时刻的所有指标表示为:
Figure FDA0003696671670000022
其中,
Figure FDA0003696671670000023
表示无线小区Vk
Figure FDA0003696671670000029
时刻的第n个指标。
6.根据权利要求5所述的方法,其特征在于,预设
Figure FDA00036966716700000210
是因果关系存在的最长时延,即在时间差为
Figure FDA00036966716700000211
内的两个时间序列间存在因果关系,在挖掘所述无线小区节点Vk内部指标的依赖关系时,对每一个小区节点与该小区节点依赖关系父项
Figure FDA0003696671670000024
分别生成第一样本,所述第一样本总数为
Figure FDA00036966716700000213
在挖掘跨无线小区间指标的依赖关系时,将两个小区节点Vl和Vk,其中
Figure FDA0003696671670000025
以及所述两个小区节点的依赖关系父项的交集
Figure FDA0003696671670000026
作为第二样本,所述第二样本总数至多为
Figure FDA00036966716700000212
根据所述第一样本和所述第二样本的结构差异划分为不同样本组。
7.根据权利要求6所述的方法,其特征在于,对于划分的所述不同样本组,采取检验算法为:
对于任意指标Xj,k,采用第一预设算法计算变量的相关条件;
为变量
Figure FDA0003696671670000027
初始化父节点:
Figure FDA0003696671670000031
在第一次迭代中,进行非条件独立检验(p=0个条件),当零假设
Figure FDA0003696671670000032
不能在显著性水平α1上被拒绝时,从
Figure FDA0003696671670000033
中移除
Figure FDA0003696671670000034
当对
Figure FDA0003696671670000035
不能在显著性水平α1上拒绝零假设
Figure FDA0003696671670000036
时,从
Figure FDA0003696671670000037
中移除
Figure FDA0003696671670000038
在后面每次迭代中p→p+1,根据父节点的检验统计值进行排序,根据显著性水平α1检验;
根据受检验的两个变量所对应的指标位于同一无线小区内的情况,检验
Figure FDA0003696671670000039
Figure FDA00036966716700000310
中选择统计值最大的p个父节点作为
Figure FDA00036966716700000311
对任意指标i、时延
Figure FDA00036966716700000327
Figure FDA00036966716700000312
更新
Figure FDA00036966716700000313
Figure FDA00036966716700000314
进行条件独立性检验
Figure FDA00036966716700000315
若独立,则将
Figure FDA00036966716700000316
Figure FDA00036966716700000317
中移除;
根据受检验的两个变量对应的指标位于不同无线小区节点内的情况,检验
Figure FDA00036966716700000318
Figure FDA00036966716700000319
中筛选出位于无线小区Vk,Vq以及Vk和Vq的公共父节点无线小区中的指标对应的变量中统计值最大的p个父节点作为
Figure FDA00036966716700000320
进行独立性检验,当对
Figure FDA00036966716700000321
检测到
Figure FDA00036966716700000322
时,将
Figure FDA00036966716700000323
Figure FDA00036966716700000324
中移除。
8.根据权利要求7所述的方法,其特征在于,所述方法,还包括:
通过第二预设算法测试检验是否存在
Figure FDA00036966716700000325
的依赖关系,检验方式的表达式为:
Figure FDA00036966716700000326
当假设不能在显著性水平α2上被拒绝时,则存在边
Figure FDA0003696671670000041
构建小区节点最终的指标层依赖关系图。
9.根据权利要求1所述的方法,其特征在于,当每一次故障出现时,预设故障发生时间为t,对所有所述节点指标采用基于3σ准则的方法进行异常检测,对某一个指标X,将故障发生前t-lh至t-1时间段内的数据作为所述训练集,记为Xtrain,将t至t+lm时间段内的数据作为所述测试集,记为Xtest,其中lh和lm代表所述训练集和所述测试集的长度;对于Xtrain,计算出平均数μ和标准差σ,对于Xtest,对其中的每个时刻的取值Xi做异常检测,若有
Figure FDA0003696671670000042
则判定该节点指标为异常,用
Figure FDA0003696671670000043
记为该节点指标的异常分数。
10.一种基于多模态数据依赖关系的故障诊断装置,其特征在于,包括:
数据获取模块,用于获取多个无线小区的多模态数据,基于所述多模态数据构建分层依赖关系图;
故障检测模块,用于基于所述分层依赖关系图中的指标层依赖关系图,根据预设故障发生时间对所述指标层依赖关系图的指标数据进行故障检测;其中,所述故障检测模块,包括:
第一检测模块,用于将故障发生前的第一预设时间段的数据作为训练集,第二预设时间段的数据作为测试集,并根据所述训练集计算得到平均数和标准差;以及,
第二检测模块,用于基于所述测试集的指标数据,通过基于所述平均数和标准差的预设公式,判定所述指标数据是否为异常指标数据,并计算所述指标数据的异常分数;
故障溯源模块,用于基于所述第二检测模块判定的所述异常指标数据,沿着所述指标层依赖关系图的因果关系边反向搜索所述异常分数超过预设数值的指标数据,根据搜索路径构成异常子图,保留所述异常子图上的根节点,将所述根节点按照指标异常分数排序,得到故障原因候选集,以完成故障诊断。
CN202210676227.2A 2022-06-15 2022-06-15 一种基于多模态数据依赖关系的故障诊断方法和装置 Active CN115278741B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210676227.2A CN115278741B (zh) 2022-06-15 2022-06-15 一种基于多模态数据依赖关系的故障诊断方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210676227.2A CN115278741B (zh) 2022-06-15 2022-06-15 一种基于多模态数据依赖关系的故障诊断方法和装置

Publications (2)

Publication Number Publication Date
CN115278741A true CN115278741A (zh) 2022-11-01
CN115278741B CN115278741B (zh) 2024-06-18

Family

ID=83762147

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210676227.2A Active CN115278741B (zh) 2022-06-15 2022-06-15 一种基于多模态数据依赖关系的故障诊断方法和装置

Country Status (1)

Country Link
CN (1) CN115278741B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115756929A (zh) * 2022-11-23 2023-03-07 北京大学 一种基于动态服务依赖图的异常根因定位方法及系统
CN116662060A (zh) * 2023-07-31 2023-08-29 深圳市创银科技股份有限公司 传感器信号采集处理系统的数据处理方法及系统
CN116737511A (zh) * 2023-08-10 2023-09-12 山景智能(北京)科技有限公司 基于图的调度作业监控方法及装置
CN117041072A (zh) * 2023-06-25 2023-11-10 兴容(上海)信息技术股份有限公司 一种基于人工智能的多模态数据管理系统及方法
CN117252346A (zh) * 2023-11-15 2023-12-19 江西珉轩智能科技有限公司 一种物料溯源系统及方法
CN117939506A (zh) * 2024-03-25 2024-04-26 云南大学 一种基于近似依赖规则的无线通信网络异常检测方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170109222A1 (en) * 2015-10-15 2017-04-20 Tata Consultancy Services Limited Systems and methods for predictive reliability mining
CN108320040A (zh) * 2017-01-17 2018-07-24 国网重庆市电力公司 基于贝叶斯网络优化算法的采集终端故障预测方法及系统
CN110855503A (zh) * 2019-11-22 2020-02-28 叶晓斌 一种基于网络协议层级依赖关系的故障定因方法和系统
CN110888755A (zh) * 2019-11-15 2020-03-17 亚信科技(中国)有限公司 一种微服务系统异常根因节点的查找方法及装置
CN111342997A (zh) * 2020-02-06 2020-06-26 烽火通信科技股份有限公司 一种深度神经网络模型的构建方法、故障诊断方法及系统
CN111368888A (zh) * 2020-02-25 2020-07-03 重庆邮电大学 基于深度动态贝叶斯网络的服务功能链故障诊断方法
CN112698975A (zh) * 2020-12-14 2021-04-23 北京大学 一种微服务架构信息系统的故障根因定位方法及系统
CN112905371A (zh) * 2021-01-28 2021-06-04 清华大学 基于异构多源数据异常检测的软件变更检查方法和装置
CN113190373A (zh) * 2021-05-31 2021-07-30 中国人民解放军国防科技大学 一种基于故障特征比较的微服务系统故障根因定位方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170109222A1 (en) * 2015-10-15 2017-04-20 Tata Consultancy Services Limited Systems and methods for predictive reliability mining
CN108320040A (zh) * 2017-01-17 2018-07-24 国网重庆市电力公司 基于贝叶斯网络优化算法的采集终端故障预测方法及系统
CN110888755A (zh) * 2019-11-15 2020-03-17 亚信科技(中国)有限公司 一种微服务系统异常根因节点的查找方法及装置
CN110855503A (zh) * 2019-11-22 2020-02-28 叶晓斌 一种基于网络协议层级依赖关系的故障定因方法和系统
CN111342997A (zh) * 2020-02-06 2020-06-26 烽火通信科技股份有限公司 一种深度神经网络模型的构建方法、故障诊断方法及系统
CN111368888A (zh) * 2020-02-25 2020-07-03 重庆邮电大学 基于深度动态贝叶斯网络的服务功能链故障诊断方法
CN112698975A (zh) * 2020-12-14 2021-04-23 北京大学 一种微服务架构信息系统的故障根因定位方法及系统
CN112905371A (zh) * 2021-01-28 2021-06-04 清华大学 基于异构多源数据异常检测的软件变更检查方法和装置
CN113190373A (zh) * 2021-05-31 2021-07-30 中国人民解放军国防科技大学 一种基于故障特征比较的微服务系统故障根因定位方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张圣林,林潇等: "基于深度学习的无监督KPI异常检测", 数据与计算发展前沿, vol. 2, no. 3, 30 June 2020 (2020-06-30), pages 87 - 100 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115756929A (zh) * 2022-11-23 2023-03-07 北京大学 一种基于动态服务依赖图的异常根因定位方法及系统
CN117041072A (zh) * 2023-06-25 2023-11-10 兴容(上海)信息技术股份有限公司 一种基于人工智能的多模态数据管理系统及方法
CN117041072B (zh) * 2023-06-25 2024-02-13 兴容(上海)信息技术股份有限公司 一种基于人工智能的多模态数据管理系统及方法
CN116662060A (zh) * 2023-07-31 2023-08-29 深圳市创银科技股份有限公司 传感器信号采集处理系统的数据处理方法及系统
CN116662060B (zh) * 2023-07-31 2024-02-06 深圳市创银科技股份有限公司 传感器信号采集处理系统的数据处理方法及系统
CN116737511A (zh) * 2023-08-10 2023-09-12 山景智能(北京)科技有限公司 基于图的调度作业监控方法及装置
CN117252346A (zh) * 2023-11-15 2023-12-19 江西珉轩智能科技有限公司 一种物料溯源系统及方法
CN117252346B (zh) * 2023-11-15 2024-02-13 江西珉轩智能科技有限公司 一种物料溯源系统及方法
CN117939506A (zh) * 2024-03-25 2024-04-26 云南大学 一种基于近似依赖规则的无线通信网络异常检测方法

Also Published As

Publication number Publication date
CN115278741B (zh) 2024-06-18

Similar Documents

Publication Publication Date Title
CN115278741B (zh) 一种基于多模态数据依赖关系的故障诊断方法和装置
CN109787817A (zh) 网络故障诊断方法、装置和计算机可读存储介质
CN112700056B (zh) 复杂网络链路预测方法、装置、电子设备及介质
CN101516099B (zh) 一种传感器网络异常检测方法
CN110335168B (zh) 基于gru优化用电信息采集终端故障预测模型的方法及系统
CN115412947B (zh) 一种基于数字孪生与ai算法的故障仿真方法和系统
Sugiarto et al. Data classification for air quality on wireless sensor network monitoring system using decision tree algorithm
CN108921301A (zh) 一种基于自学习的机器学习模型更新方法及系统
CN105471647B (zh) 一种电力通信网故障定位方法
CN112579789A (zh) 一种设备故障诊断的方法和装置及设备
CN112217674B (zh) 基于因果网络挖掘和图注意力网络的告警根因识别方法
CN110297207A (zh) 智能电表的故障诊断方法、系统及电子装置
CN116862081B (zh) 一种污染治理设备运维方法及系统
CN111586728B (zh) 一种面向小样本特征的异构无线网络故障检测与诊断方法
CN111884859B (zh) 一种网络故障诊断方法、装置及可读存储介质
CN116308958A (zh) 基于移动终端的碳排放在线检测预警系统及方法
CN114139589A (zh) 故障诊断方法、装置、设备与计算机可读存储介质
CN111444075A (zh) 一种自动发现关键影响力指标的方法
CN114897085A (zh) 一种基于封闭子图链路预测的聚类方法及计算机设备
CN114416573A (zh) 一种应用程序的缺陷分析方法、装置、设备及介质
CN117221087A (zh) 告警根因定位方法、装置及介质
CN107454089A (zh) 一种基于多节点关联性的网络安全态势诊断方法
WO2023093431A1 (zh) 一种模型训练方法、装置、设备、存储介质和程序产品
CN112039907A (zh) 一种基于物联网终端评测平台的自动测试方法及系统
CN113744888B (zh) 区域流行病趋势预测预警方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant