CN113326160A - 一种基于贝叶斯网络的异常路径分析方法 - Google Patents
一种基于贝叶斯网络的异常路径分析方法 Download PDFInfo
- Publication number
- CN113326160A CN113326160A CN202110473513.4A CN202110473513A CN113326160A CN 113326160 A CN113326160 A CN 113326160A CN 202110473513 A CN202110473513 A CN 202110473513A CN 113326160 A CN113326160 A CN 113326160A
- Authority
- CN
- China
- Prior art keywords
- data
- bayesian network
- network structure
- anomaly
- abnormal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000002159 abnormal effect Effects 0.000 title claims abstract description 36
- 238000004458 analytical method Methods 0.000 title claims abstract description 21
- 238000001514 detection method Methods 0.000 claims abstract description 17
- 238000000034 method Methods 0.000 claims description 12
- 230000008859 change Effects 0.000 claims description 7
- 230000008569 process Effects 0.000 claims description 2
- 238000000547 structure data Methods 0.000 claims description 2
- 230000005856 abnormality Effects 0.000 abstract description 14
- 230000001364 causal effect Effects 0.000 abstract 1
- 238000011156 evaluation Methods 0.000 abstract 1
- 238000005516 engineering process Methods 0.000 description 9
- 230000008901 benefit Effects 0.000 description 5
- 238000011161 development Methods 0.000 description 3
- 238000009776 industrial production Methods 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 206010063385 Intellectualisation Diseases 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000011895 specific detection Methods 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000013024 troubleshooting Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/079—Root cause analysis, i.e. error or fault diagnosis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/29—Graphical models, e.g. Bayesian networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Quality & Reliability (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明公开了一种新的异常路径分析方法,利用贝叶斯网络结构,帮助在工业数据流中建立因果模型,了解工业数据之间的依赖关系,并对网络节点数据流进行异常检测,最后对最大异常路径进行输出,得到最可能的异常传播路径。本发明提出了一种新的异常路径分析方法,提出了通过调整优化变量序并将其作为贝叶斯网络结构学习的搜索空间,提高贝叶斯网络结构学习的准确度。然后利用异常检测方法,对贝叶斯网络结构节点进行异常值评估,实现有效的异常路径分析。
Description
技术领域
本发明涉及一种新的数据异常路径分析方法—一种基于贝叶斯网络的异常路径分析方法。
背景技术
近年来,随着数据技术的发展,数据的采集、传输、存储和挖掘等被各行业广泛应用。数据技术已经服务于多个行业领域包括工业生产、公共安全、交通运输等,并取得了了较大的成功。通过数据挖掘技术,建立基于数据驱动的辅助决策系统,提高工作效率和经济效益是目前数据技术应用的主要内在动力之一。因此,如何充分利用数据技术在行业发展中的作用,不断提高经济效益和社会效益一直是研究的热点。伴随着工业生产的智能化,人的作用越来越弱而大机器设备愈发复杂,保障机器设备安全稳定运行极其重要。近几年数据采集技术和大数据传输技术的发展,为建立基于数据驱动的设备监控和异常预警系统准备了充分的数据条件。而通过数据去发现设备中的问题所利用的核心技术之一就是异常检测方法,通过对数据进行分析并发现异常,进而及时了解设备状态,对设备进行相关维护。目前在复杂的工业生产设备下,发现问题仅仅是初步的任务,如果排查定位问题是需要进一步解决的问题。
目前人们普遍关注于发现数据中的异常,基于此学者们研究了大量的异常检测算法如基于统计模型、基于聚类、基于相似性度量、基于约束规则等。但这些异常检测算法只能处理异常的发现任务,而对于异常是从哪里发生并传播的很难给出有效的解决方案。尤其是在工业领域,各个采集数据点之间存在较强的关联程度,某一处的数据异常波动,会导致其下游的数据也出现异常。当异常存在放大效应时,某一点的微小波动可能不易察觉,但到下游则会出现剧烈的异常波动,此时根据当前点的波动去分析异常来源具有重要的现实意义。尤其是涉及到工业设备安全运行方面,工业界最普遍的设备维护方法是对设备进行定期的维护和检修。而早期的设备异常往往能够反映在数据之中,通过对数据进行分析能够更早的发现异常,同时利用异常路径分析方法对异常源进行定位,有利于用户发现问题原因,提前排查问题,减少经济损失。通过异常路径分析技术,对协助用户筛查问题,辅助用户决策等具有重要的意义。
发明内容
发明目的:本发明针对异常路径分析的需求,提出一种新的异常路径分析方法—一种基于贝叶斯网络的异常路径分析方法。该算法满足工业大数据流中的对于异常数据的识别和异常传播路径及异常原因的分析定位功能。
技术方案:本发明使用的一种基于贝叶斯网络的异常路径分析方法包括四个部分:贝叶斯网络结构的学习、数据流的接入以及异常检测和最大异常路径输出。
贝叶斯网络结构的学习主要任务是在从数据中学习贝叶斯网络结构。其主要包含两个步骤(1)变量序的获取;(2)网络结构的学习。贝叶斯网络结构能够有效地表达数据中各维度之间的依赖关系,是后续异常路径分析的主要依据。
数据流的接入。数据流中的每个维度与贝叶斯网络结构中的每一个节点一一对应。
异常检测。异常检测的目标是对流入到贝叶斯网络结构中的每个节点进行异常识别并给出异常评分值。该阶段采用滑动窗口方法,保存T大小时刻的网络结构数据状态。
最大异常路径输出。针对时刻t下的数据,在进行异常检测后,每个节点均保存着当前时刻的异常评分值。当存在异常点时,在贝叶斯网络中搜索异常评分值和最大的异常路径并作为结果输出。
有益效果:本发明的显著优点是通过变量序调整方法优化贝叶斯网络结构学习提升其网络结构学习效果。同时将网络结构与异常检测方法相结合,采取异常评分机制对异常可疑程度进行打分,最后通过在网络中搜索最大的异常评分值和给出最可能的异常传播路径。
附图说明
图1是本发明的总体结构图。
图2是贝叶斯网络状态流示意图。
图3是滑动窗口示意图。
具体实施方式
如图1所示,本发明的方法主要包括四个部分贝叶斯网络结构学习、数据异常检测、异常路径分析和结果输出,下面详细进行说明:
步骤1:从数据集中学习贝叶斯网络结构。
从数据集中学习贝叶斯网络结构主要分为以下两步:
1)首先获取贝叶斯网络结构学习算法的搜索空间,以降低贝叶斯网络结构学习的复杂度。该搜索空间称为变量序,用符号ρ表示。对于有n个变量的数据集D,其变量序的获取方法如下:
①首先初始两个矩阵mn*n和Gn*n。其中mn*n是变量间的互信息矩阵m(i,j)=k表示变量Xi与Xk的依赖强度排在第j位。矩阵Gn*n是对称矩阵,表示每个变量的邻居集;
独立性检验采用互信息方法,其计算公式如下:
在上式中当I(Xi,Xj)=0,表示Xi与Xj相互独立;结果越大,则变量Xi与Xj之间的相关性越强。条件独立性的计算公式如下:
同理当I(Xi,Xj|Xk)=0时,表示变量Xi与Xj在Xj的条件下相互独立。
③根据G(N*N)的邻接点的个数,对节点按降序排序得到并输出ρt;
④对ρt进行调整,调整算法流程如下:
前一个节点不是待插入节点的连接点,仅当前一个节点的连接点个数比待插入节点小;若前一个节点是待插入节点的邻接点,仅当越过该点后,仍能保证待插入点之前的连接点个数大于或等于节点之后的依附点个数则允许越过;特殊情况,对于要找到其连接点中影响度为1的点放置到前。
⑤输变量序ρ
2)将第一步输出的输变量序ρ作为K2贝叶斯网络结构学习的参数,对数据集D进行贝叶斯网络结构学习并输出贝叶斯网络结构G。
步骤2:将数据流与贝叶斯网络结构中的节点进行一一对应输入
步骤3:对节点数据进行异常检测。具体的检测流程如下:
①假设贝叶斯网络结构中某一节点对应实时数据流记为Dt={...,xt-3,xt-2,xt-1,xt}。其中以xt为该节点在时刻t时的数据。设置时间窗口T,并保持T个时刻状态下的贝叶斯网络。
②对这T个时刻下的数据进行波动异常检测,并对异常程度给出评分。此时我们利用方差变化值进行异常的评分。首先设置长度为T的滑动窗口,依次计算待检测数据在窗口中的方差统计值;再计算相邻两滑动窗口中的方差差值作为当前数据到来后整体方差的变化值,并将其作为异常程度评分。
方差计算量:
在整体数据集中而部分数据偏离时,对偏离数据的变化十分敏感,即当在离散程度较小的数据中加入一个较为偏离的数据时,整体的方差会骤然增大,因此我们采用方差差值:
步骤4:当出现异常数据时,计算当前贝叶斯网络结构下,最大得分的异常路径,并将路径进行输出。
以上详细描述了本发明的优选实施方式,但是,本发明并不限于上述实施方式中的具体细节,在本发明的技术构思范围内,可以对本发明的技术方案进行多种等同变换,这些等同变换均属于本发明的保护范围。
Claims (5)
1.一种基于贝叶斯网络结构的数据异常路径分析算法,其特征在于,主要包括如下步骤:
步骤1:从数据中学习贝叶斯网络结构;
步骤2:将数据流与贝叶斯网络结构节点一一对应输入;
步骤3:对贝叶斯网络结构中的节点进行异常检测识别,并给出异常程度分值;
步骤4:对贝叶斯网络中连通的异常路径进行求和,给出其中最大的一条或几条可能的异常传播路径。
2.根据权利要求1所述的基于贝叶斯网络结构的数据异常路径分析算法,其特征在于,在数据流的接入过程中,数据流中的每个维度与贝叶斯网络结构中的每一个节点一一对应。
3.根据权利要求1所述的基于贝叶斯网络结构的数据异常路径分析算法,其特征在于,在异常检测识别过程中,异常检测的目标是对流入到贝叶斯网络结构中的每个节点进行异常识别并给出异常评分值;该阶段采用滑动窗口方法,保存T大小时刻的网络结构数据状态。
4.根据权利要求1所述的基于贝叶斯网络结构的数据异常路径分析算法,其特征在于,在异常传播路径过程中,最大的异常路径输出包括:针对时刻t下的数据,在进行异常检测后,每个节点均保存着当前时刻的异常评分值;当存在异常点时,在贝叶斯网络中搜索异常评分值和最大的异常路径并作为结果输出。
5.根据权利要求1所述的基于贝叶斯网络结构的数据异常路径分析算法,其特征在于,异常检测识别的具体流程如下:
假设贝叶斯网络结构中某一节点对应实时数据流Dt记为其中以xt为该节点在时刻t时的数据;设置时间窗口T,并保持T个时刻状态下的贝叶斯网络;
对这T个时刻下的数据进行波动异常检测,并对异常程度给出评分。此时我们利用方差变化值进行异常的评分;
首先设置长度为T的滑动窗口,依次计算待检测数据在窗口中的方差统计值;
再计算相邻两滑动窗口中的方差差值作为当前数据到来后整体方差的变化值,并将其作为异常程度评分;
在整体数据集中而部分数据偏离时,对偏离数据的变化十分敏感,即当在离散程度较小的数据中加入一个较为偏离的数据时,整体的方差会骤然增大;
步骤4:当出现异常数据时,计算当前贝叶斯网络结构下,最大得分的异常路径,并将路径进行输出。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110473513.4A CN113326160A (zh) | 2021-04-29 | 2021-04-29 | 一种基于贝叶斯网络的异常路径分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110473513.4A CN113326160A (zh) | 2021-04-29 | 2021-04-29 | 一种基于贝叶斯网络的异常路径分析方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113326160A true CN113326160A (zh) | 2021-08-31 |
Family
ID=77413888
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110473513.4A Pending CN113326160A (zh) | 2021-04-29 | 2021-04-29 | 一种基于贝叶斯网络的异常路径分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113326160A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105764162A (zh) * | 2016-05-10 | 2016-07-13 | 江苏大学 | 一种基于多属性关联的无线传感器网络异常事件检测方法 |
CN108460144A (zh) * | 2018-03-14 | 2018-08-28 | 西安华光信息技术有限责任公司 | 一种基于机器学习的煤炭设备故障预警系统及方法 |
CN108712504A (zh) * | 2018-05-31 | 2018-10-26 | 深圳源广安智能科技有限公司 | 基于物联网的机床设备智能监控系统 |
CN109298704A (zh) * | 2018-08-31 | 2019-02-01 | 江苏方天电力技术有限公司 | 一种基于贝叶斯网络的工业故障路径追溯方法及系统 |
CN109688604A (zh) * | 2018-12-06 | 2019-04-26 | 北京航空航天大学 | 一种基于贝叶斯网络的高动态移动自组织网络抗毁性评估方法 |
CN109887330A (zh) * | 2019-04-09 | 2019-06-14 | 南京维智感网络科技有限公司 | 面向室外停车位状态管理的地感线圈车辆探测方法 |
-
2021
- 2021-04-29 CN CN202110473513.4A patent/CN113326160A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105764162A (zh) * | 2016-05-10 | 2016-07-13 | 江苏大学 | 一种基于多属性关联的无线传感器网络异常事件检测方法 |
CN108460144A (zh) * | 2018-03-14 | 2018-08-28 | 西安华光信息技术有限责任公司 | 一种基于机器学习的煤炭设备故障预警系统及方法 |
CN108712504A (zh) * | 2018-05-31 | 2018-10-26 | 深圳源广安智能科技有限公司 | 基于物联网的机床设备智能监控系统 |
CN109298704A (zh) * | 2018-08-31 | 2019-02-01 | 江苏方天电力技术有限公司 | 一种基于贝叶斯网络的工业故障路径追溯方法及系统 |
CN109688604A (zh) * | 2018-12-06 | 2019-04-26 | 北京航空航天大学 | 一种基于贝叶斯网络的高动态移动自组织网络抗毁性评估方法 |
CN109887330A (zh) * | 2019-04-09 | 2019-06-14 | 南京维智感网络科技有限公司 | 面向室外停车位状态管理的地感线圈车辆探测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Huang et al. | Structure dictionary learning-based multimode process monitoring and its application to aluminum electrolysis process | |
CN101957889B (zh) | 一种基于选择性磨损的设备最优维修时间预测方法 | |
CN110335168B (zh) | 基于gru优化用电信息采集终端故障预测模型的方法及系统 | |
CN111651931B (zh) | 基于深度神经网络的高炉故障诊断规则导出方法 | |
CN109716303A (zh) | 使用k最近邻及逻辑回归方法的时间序列故障检测、故障分类及转变分析 | |
CN110472671B (zh) | 基于多阶段的油浸式变压器故障数据预处理方法 | |
CN107862324B (zh) | 一种基于mwspca的cbr预测模型智能化预警方法 | |
CN106126607A (zh) | 一种面向社交网络的用户关系分析方法 | |
US20230221684A1 (en) | Explaining Machine Learning Output in Industrial Applications | |
US20240160961A1 (en) | Differentiable method for mining constant rules | |
CN109826818A (zh) | 一种矿用风机的故障诊断方法 | |
CN117556347A (zh) | 一种基于工业大数据的电力设备故障预测与健康管理方法 | |
CN115659774A (zh) | 一种融合机器学习的大坝风险贝叶斯网络模型建模方法 | |
CN118244709A (zh) | 关联故障设备及影响因素获取方法、装置及异常处理系统 | |
CN115470831A (zh) | 一种基于频繁项集推理的水电信号异常判断方法 | |
CN111126477A (zh) | 一种混合贝叶斯网络的学习与推理方法 | |
CN114326639A (zh) | 基于混合注意力卷积神经网络的工业过程性能评估方法 | |
CN113326160A (zh) | 一种基于贝叶斯网络的异常路径分析方法 | |
Menegozzo et al. | Causal interaction modeling on ultra-processed food manufacturing | |
Brønstad | Data-driven detection and identification of undesirable events in subsea oil wells | |
Jiang et al. | Hierarchical Fault Root Cause Identification in Plant-Wide Processes Using Distributed Direct Causality Analysis | |
Baig et al. | One-dependence estimators for accurate detection of anomalous network traffic | |
Yuan et al. | Deep causal mining for plant-wide oscillations with multilevel granger causality analysis | |
CN114462636A (zh) | 一种工业时序数据通过数据处理进行在线异常监测方法 | |
Baig et al. | An AODE-based intrusion detection system for computer networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210831 |