CN113722140B - 基于小样本学习的工业报警泛滥根源诊断方法及存储介质 - Google Patents

基于小样本学习的工业报警泛滥根源诊断方法及存储介质 Download PDF

Info

Publication number
CN113722140B
CN113722140B CN202111005272.7A CN202111005272A CN113722140B CN 113722140 B CN113722140 B CN 113722140B CN 202111005272 A CN202111005272 A CN 202111005272A CN 113722140 B CN113722140 B CN 113722140B
Authority
CN
China
Prior art keywords
alarm
flooding
industrial
sequence
root cause
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111005272.7A
Other languages
English (en)
Other versions
CN113722140A (zh
Inventor
胡文凯
杨光
张祥祥
曹卫华
吴敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China University of Geosciences
Original Assignee
China University of Geosciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China University of Geosciences filed Critical China University of Geosciences
Priority to CN202111005272.7A priority Critical patent/CN113722140B/zh
Publication of CN113722140A publication Critical patent/CN113722140A/zh
Application granted granted Critical
Publication of CN113722140B publication Critical patent/CN113722140B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A10/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE at coastal zones; at river basins
    • Y02A10/40Controlling or monitoring, e.g. of flood or hurricane; Forecasting, e.g. risk assessment or mapping

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Alarm Systems (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

本发明提供了一种基于小样本学习的工业报警泛滥根源诊断方法及存储介质,该方法包括离线训练过程和在线诊断过程,其中离线训练过程包括:对历史报警事件日志进行预处理,提取由显著故障引起的报警泛滥序列,进行文本编码,基于原型网络的小样本学习方法获得根源诊断模型以及每种根源的类表示,在线诊断过程包括:对待诊断的报警泛滥序列进行文本编码后,输入根源诊断模型,获取待诊断报警泛滥序列的空间表示向量,同时与每种根源问题的类表示进行相似性分析,输出故障类型。本发明通过考虑报警事件数据与故障根源的直接相关性,利用少量报警泛滥事件序列构建高精度的工业报警泛滥根源诊断模型,提高了工业报警泛滥根源诊断的实用性和有效性。

Description

基于小样本学习的工业报警泛滥根源诊断方法及存储介质
技术领域
本发明涉及工业过程故障监测与诊断领域,尤其涉及一种基于小样本学习的工业报警泛滥根源诊断方法及存储介质。
背景技术
近些年,分布式控制系统或数据采集与监控系统的广泛应用,生产和管理的自动化水平逐步提高。但同时,由于大型工业设施中包含大量生产设备和复杂的生产过程,导致异常状况频现并且容易快速传播扩散,为工业生产带来严峻的安全问题。而报警监控系统作为现代大规模复杂工业的核心成分,其性能的优劣直接影响到工业生产运行的安全性、稳定性和高效性。通过近些年国内外学者的研究,报警监控中的诸多问题,如误报警、漏报警、抖振报警和关联报警等,都得到了有效解决,但报警泛滥仍是困扰操作运营人员的难点问题。
报警泛滥是制约大型工业系统中报警监控系统性能的主要瓶颈。ANSI/ISA-18.2标准将报警泛滥定义为“大量报警信号出现导致报警率超过运营人员响应能力的情形”,规定每10分钟出现10个报警作为识别报警泛滥出现的基准阈值和每10分钟5个作为识别报警泛滥消逝的阈值,并建议报警泛滥的出现时间不超过总运营时间的1%。但实际工业中的报警泛滥无论是在报警率还是占比时间上,都远远超过这个标准。由于大型工业设施规模庞大、结构复杂,大量的监测变量和复杂的网络结构,导致异常状况频发并广泛传播,形成报警泛滥。而报警泛滥的频繁出现和传播,导致报警系统丧失其有效性,无法给操作运营人员提供有效的报警监控信息,从而极易导致生产事故的发生。因此,如何针对报警泛滥的分析与抑制研究成为学术界和工业界共同关注的问题。
报警泛滥的形成原因众多、类型不同、复杂程度不同,给报警泛滥的分析和应用带来挑战。现有研究方法主要集中于报警泛滥序列的相似性比对和报警泛滥序列的模式挖掘、和报警泛滥的分类方法,为报警泛滥的研究提供有效解决方法。然而,这些理论都是基于连续过程数据,但是忽略了与异常状况直接相关的报警事件数据,相比于连续过程数据,报警事件数据包含更少的数据量,并且包含有效信息的比例更大。同时,由于实际工业中,带标签的样本获取步骤繁琐、成本代价高,导致大量根源诊断方法应用受到限制,如何利用少量样本建立面向报警泛滥的根源诊断模型也值得进一步关注。
发明内容
为了解决实际工业中,带标签的样本获取步骤繁琐、成本代价高,导致大量根源诊断方法应用受到限制的技术问题,本发明提供了一种利用报警事件数据和少量带标签样本来构建工业报警泛滥根源诊断模型的方法。相比于连续过程数据,报警事件数据包含更少的数据量,但由于其与故障问题直接相关,因此,包含有效信息的比例更大。通过对报警事件日志进行预处理,然后提取报警泛滥序列;利用Word2Vec方法对提取的报警泛滥序列进行文本编码,得到新的可直接计算的报警泛滥序列。
由于带标签的工业故障样本不易直接获取,本发明提出了一种基于小样本学习(Few-Shot Learning,FSL)的工业报警泛滥根源诊断方法,量化不同故障类间差异。并提出一种基于原型网络的改进理论,用于进一步分析报警事件数据的时间序列特性,该方法利用长短期记忆网络(Long Short Term Memory,LSTM)进行特征提取,通过训练,得到诊断模型。基于小样本学习的建模方法利用少量报警泛滥事件序列构建报警泛滥根源诊断模型,可以提高诊断的实用性和有效性。所提方法的具体步骤如下:
获取历史报警事件日志;
对所述历史报警事件日志进行预处理;
提取由显著故障引起的工业报警泛滥序列;
搭建基于词嵌入的报警事件数据结构化编码模型,将所述历史报警事件日志输入所述基于词嵌入的报警事件数据结构化编码模型,不断更新模型参数,获取最佳结构化编码模型;
通过所述最佳结构化编码模型,对所述由显著故障引起的工业报警泛滥序列进行数据编码,得到结构化编码的工业报警泛滥序列;
通过长短期记忆网络提取所述结构化编码的报警泛滥序列中各序列的时间序列特征,结合基于原型网络的小样本学习,获取各报警泛滥序列的空间表达向量,从而搭建工业报警泛滥根源诊断模型;
将待诊断的工业报警事件日志进行预处理及结构化编码后,输入所述工业报警泛滥根源诊断模型,并输出最终根源诊断类型。
进一步地,所述预处理包括:
检查并统一报警事件数据配置信息和日志格式,修改不规范数据类型,并进一步删除信息不完整的事件数据;
去除抖振报警及冗余报警,通过设置延时器、滤波器、阈值死区、时间死区进行优化处理,提取由显著故障引起的报警泛滥序列。
进一步地,所述由显著故障引起的工业报警泛滥序列表示为:
F=[a1,a2,…,am,1≤m≤M]
其中,am表示报警泛滥序列F中第m个报警,M表示报警泛滥序列的长度。
进一步地,所述搭建基于词嵌入的报警事件数据结构化编码模型,将所述历史报警事件日志输入所述基于词嵌入的报警事件数据结构化编码模型,不断更新模型参数,获取最佳结构化编码模型的步骤,具体包括:
提取各连续历史报警事件日志中所有独立报警事件数据标签;
根据N个所述独立报警事件数据标签制作报警数据类型库,利用独热编码获得报警事件数据的初步结构化编码表示;
初始化一个N*d维的权重矩阵V,其中N为权重矩阵V的行数,与独立报警事件数据标签的个数相等,d为权重矩阵V的列数,利用所述报警事件数据的初步结构化编码表示做内积计算,获取报警事件数据的结构化编码结果;
初始化d*N维的权重矩阵W,其中d为权重矩阵W的行数,N为权重矩阵W的列数,利用多个连续历史报警事件日志库中,当前报警事件数据的结构化编码结果与其前后c个窗口内的报警事件数据结构化编码结果做内积计算,结合softmax函数对计算结果进一步映射,从而建立基于词嵌入的报警事件数据结构化编码模型;
计算所述基于词嵌入的报警事件数据结构化编码模型的平均对数概率,最大化期望输出概率,利用梯度下降法进行参数更新,获取最佳结构化编码模型。
进一步地,所述通过长短期记忆网络提取所述结构化编码的报警泛滥序列中各序列的时间序列特征,结合基于原型网络的小样本学习,获取各报警泛滥序列的空间表达向量,从而搭建工业报警泛滥根源诊断模型的步骤,具体包括:
通过长短期记忆网络提取所述结构化编码的报警泛滥序列的时序信息,将不同长度的所述结构化编码的报警泛滥序列转化为相同维度大小的编码矩阵;
将不同类型的报警泛滥序列的编码矩阵分布到高维空间平面,计算同一根源类型下不同报警泛滥序列的空间表达向量,利用其空间均值作为每类根源类型的原型表示,从而建立工业报警泛滥根源诊断模型。
进一步地,所述将待诊断的工业报警事件日志进行预处理及结构化编码后,输入所述工业报警泛滥根源诊断模型,并输出最终根源诊断类型的步骤,具体包括:
将待诊断的工业报警事件日志经过预处理后,提取待诊断的工业报警泛滥序列;
通过所述最佳结构化编码模型,对所述待诊断的工业报警泛滥序列进行结构化编码,得到结构化编码的待诊断报警泛滥序列;
将所述结构化编码的待诊断报警泛滥序列输入所述工业报警泛滥根源诊断模型,计算待诊断报警泛滥序列的空间表达向量;
将所述待诊断报警泛滥序列的表达向量与每类根源类型的原型表示进行欧氏距离计算,采用最近邻比较,将空间相对距离最小的根源类型作为最终根源诊断类型。
为了实现上述目的,本发明还提供了一种存储介质,所述存储介质为计算机可读存储介质,所述计算机可读存储介质中存储有任一所述的基于小样本学习的工业报警泛滥根源诊断方法。
本发明的有益效果在于:在实际工业故障样本缺乏的情况下,提出一种基于报警事件数据和少量样本来构建高精度报警泛滥根源诊断模型的方法,可以提高诊断的实用性和有效性。本发明应用于工业监测与诊断系统中,针对报警泛滥根源诊断的问题,提出基于小样本学习的工业报警泛滥根源诊断方法,在实际工业故障样本缺乏的情况下,利用所提方法可以快速诊断出引起报警泛滥的根源故障,从而确保生产过程的安全性,对于提升工业监控系统的性能具有重要意义。
附图说明
下面将结合附图及实施例对本发明作进一步说明,附图中:
图1为本发明一种基于小样本学习的工业报警泛滥根源诊断方法的根源诊断流程图;
图2为本发明部分报警泛滥序列图;
图3为本发明部分编码后报警泛滥序列图;
图4为本发明一种基于小样本学习的工业报警泛滥根源诊断方法诊断每种故障类型的正确率图。
具体实施方式
为了对本发明的技术特征、目的和效果有更加清楚的理解,现对照附图详细说明本发明的具体实施方式。
本实施例基于VAM报警平台模型设计仿真实验,验证方法的有效性。所采用的数据来源于VAM平台仿真实验,通过触发故障生成报警事件日志。该系统包含35个不同的故障(MAL1~35),其中显著故障包括MAL15、16、17、23、24、25、26、27、27、28、29、30、32和33。这些显著故障都有很大可能导致报警泛滥的发生。为了保证工业故障仿真的合理性,对报警系统虚拟配置增加了若干规则,如下:
a)每次只触发一个异常事件;
b)引发下一个异常事件前,应确保系统处于稳定运行状态,即先前异常事件的影响被视为结束;
在本实施中,故障的模拟时间设置为从20到60分钟,故障模拟时间段间距为10分钟。延时器被配置为300秒,以抑制抖振报警等虚假报警泛滥。
如图1所示,所提方法主要包括离线训练和在线诊断两个部分。
步骤1、离线训练:
从报警事件日志中提取报警泛滥序列,然后进行文本编码得到新的报警泛滥序列,作为模型输入,利用长短期记忆网络和基于原型网络的小样本学习方法搭建根源诊断模型。
步骤1.1、报警泛滥序列提取:
从历史报警事件日志中准确提取报警泛滥序列是进行根源诊断的先决条件。但是,由于日志格式和存在抖振报警等问题,使报警泛滥根源诊断方法的有效性受到质疑。因此,对历史报警事件日志进行充分的预处理能够保证数据的合理性和有效性,以便提取更为准确的工业报警泛滥序列。对历史报警事件日志的预处理分为两步,具体如下:
a)时间戳和日志格式的检查:不同历史报警日志可能会有不同的格式,导致分析困难。因此需要进一步修改或删除不规整数据,以确保数据格式统一;
b)减少抖振报警:表示采用延时定时器,可以有效规避虚假报警泛滥的出现,进一步增强真实故障问题引起的报警泛滥序列的合理性。
经过预处理,大大减少了历史报警事件日志中的滋扰报警。进一步的,根据ANSI-ISA-18.2标准规定:“每10分钟出现10个报警作为识别报警泛滥出现的基准阈值和每10分钟5个作为识别报警泛滥消逝的阈值”。进一步的,报警泛滥序列F提取并被表示为:
F=<a1,a2,…,am,1≤m≤M>,
其中am表示序列F中第m个报警,M表示报警泛滥序列的长度。
在本实施例中,对采集的历史报警事件日志进行预处理,提取由显著故障引起的13类报警泛滥序列。对于每种故障根源类别,收集10个历史报警泛滥序列。提取的部分报警泛滥序列如图2所示。
步骤1.2、文本编码:
由于报警事件序列是文本信息,不可直接计算,本发明根据多个所述连续历史报警事件日志库,搭建了一种基于词嵌入的报警事件数据结构化编码模型(基于Skip-gram模型),以用于报警泛滥序列的结构化编码。本发明所采用的模型框架如附表所示,可以捕获并表达连续历史报警事件日志库中各报警事件数据的时间序列关系。
首先,取连续历史报警事件日志库中所有独立不重复报警事件数据信号;根据N个独立报警事件信号制作报警数据类型库,利用独热编码获得报警事件数据的初步结构化编码表示,即报警事件数据类型库的第i个报警信号,被表示为二值向量ηi=[0,...,0,1,0,...0]T,其中’1’为报警时间日志库中第i个位置,且整个报警数据类型库可以表示为N*N维的初步结构化编码矩阵;
进一步地,将每个报警映射到d维空间,通过初始化权重矩阵将所有报警映射到权重矩阵V上,利用权重矩阵与报警事件数据的初步结构化编码进行内积计算,获取报警事件数据的结构化编码。
进一步地,给出多个连续历史报警事件日志库,日志库中共有T个报警信号。基于词嵌入的报警事件数据结构化编码模型的优化目标是最大化平均对数概率Φ,该概率表示为
其中c是模型训练时的窗口长度,与日志库中第t个报警at相关,at+j表示日志库中距离第t个报警信号间距为j的报警信号,其中-c≤j≤c,当j<0时,说明该报警信号发生在at之前发生,当j>0时,在at之后发生,P(at+j|at)表示条件概率。
进一步地,由于函数最大值不容易计算,因此,最大平均对数概率可以进一步转换为
其中,条件概率P(at+j|at)可以表示为
其中va+j表示报警信号作为模型训练中作为中心报警时的结构化编码向量,v′a+j表示报警信号作为模型训练中作为背景报警时的结构化编码向量,表示相应矩阵的转置,N表示所有报警标签的个数总和,/>表示第n个标签对应的报警事件数据结构化编码,/>表示当前第t个报警的结构化编码。
进一步地,利用梯度下降法极小化目标函数:
进一步地,更新所需的结构化编码
其中α是迭代权重。
最终,利用向量来实现报警am的结构化表示。第一数据集通过结构化编码后得到新的报警泛滥序列F为
本发明中,根源类型由K类组成,其中C样本作为训练集,L样本作为验证集,可以表示为Hs和Hr分别表示训练集和验证集,Fs和Fr分别表示相应的报警泛滥序列,ys和yr分别表示工业报警泛滥序列对应的故障根源类型。部分编码后的报警泛滥序列如图3所示。
步骤1.3、离线建模:
提出一种基于原型网络的改进理论,用于分析小样本学习的时间序列数据。该网络能识别出在训练过程中从未见过的新类别,并且对于每个类别只需要很少的已知标签的样例数据。原型网络将每个类别中的样例数据映射到一个空间当中,并且提取“空间均值”来表示为该类的原型。进一步使用欧氏距离作为距离度量,通过训练使得验证集样本到本类原型表示的距离为最近,到其它类原型表示的距离较远。
利用长短期记忆网络(Long and Short Term Memory,LSTM)进行特征提取。LSTM有三个主要特性,包括输入门、遗忘门和输出门。以下方程式给出了一层存储单元hm的更新,其中hm-1表示在上一个序列步骤中在同一层的上一个输出。候选记忆单元的值被计算为
输入栅极gm用于确定单元格状态是否更新,为
遗忘门fm用于控制是否将先前的状态保留,为
输出门om用于控制单元状态的最终输出,为
更新内存单位值cm,即
然后计算LSTM单位输出hm,即
hm=om⊙tanh(cm)
其中Wαβ(α=c,g,f,o andβ=x,h)表示不同门机制的不同输入,bα表示相应的偏差向量;σ代表应用sigmoid函数,表示逐元素乘积(Hadamard product)。cm是LSTM记忆单元的值,是候选记忆单元的值。通过训练,可以得到f(·)函数,即诊断模型本身。
基于上述的改进原型网络方法,计算每一类的原型。每个原型计算由该类根源类型训练集样本获取的平均向量表示。第k类根源χk的原型被计算为
其中f表示将报警泛滥事件序列提取到特征向量中的LSTM模块,C表示训练集样本个数。因此,待测根源类型属于第k类的概率由一个非参数的softmax分类器计算,具体实现为:
其中K表示总的种类,χk′表示所有根源类型分别对应的原型,d表示度量函数,本发明中利用欧式距离作为具体的度量函数,即
因此通过分类器可以计算出属于第k类的概率,进而判断故障类型。
步骤2、在线诊断:
在线诊断中,对输入的报警泛滥序列进行结构化编码,利用诊断模型计算报警泛滥序列的高维空间嵌入,然后与原始故障的类表示进行距离度量,从而比较相似性,以判断故障根源类型,实现故障根源的诊断。进一步的,根据几个评价指标来衡量模型的诊断效果。具体步骤如下:
a)在线采集的报警泛滥的结构化编码。数据预处理后,从在线的待诊断报警事件日志中采集新的报警泛滥序列利用结构化编码模型进行数据表示。
b)高维空间计算。基于训练好的诊断模型f,将编码后的报警泛滥序列输入诊断模型,获取诊断模型的输出高维向量
c)距离度量分析。利用欧式距离计算类原型和在线报警泛滥的高维空间向量的相关性,利用最近邻法判断故障根源类型。待诊断的的故障类型可表示为
通过以上步骤,可以实现工业报警泛滥根源类型的在线诊断。
模型的根源诊断性能可以根据Accuracy(精度),Macro-Precision(宏-精度率),Macro-Recall(宏-召回率)和Macro-F1分数(宏-F1分数)等评价指标进行评估。
Accuracy计算公式为
其中Nan表示此故障类型被误检测为其它故障类型的数量;Naf表示其它故障类型被误检测为此故障类型的数量;Ntf表示其它故障样本的总数;Ntn表示此故障样本的总数,其中Ntp表示故障类型被正确诊断的数量。
其他三个指标作为多分类的诊断指标,其中L表示测试集样本数目,这里参数l表示第l个样本带入模型所计算出的相应参数。因此,三个宏指标被定义为:
得到的诊断结果如下:
表1:所提方法的根源诊断结果
表1表明利用所提出的方法建立的根源诊断模型具有较高的性能。因此,可以得出结论,所提出的基于报警泛滥事件序列和FSL方法(小样本学习方法)在根源诊断中是有效的。所提方法针对不同故障类型的诊断结果如图4所示。
作为可选地实施方式,本实施例还提供了一种存储介质,所述存储介质为计算机可读存储介质,所述计算机可读存储介质中存储有任一所述的基于小样本学习的工业报警泛滥根源诊断方法。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。词语第一、第二、以及第三等的使用不表示任何顺序,可将这些词语解释为标识。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (7)

1.一种基于小样本学习的工业报警泛滥根源诊断方法,其特征在于,包括以下步骤:
获取历史报警事件日志;
对所述历史报警事件日志进行预处理;
提取由显著故障引起的工业报警泛滥序列;
搭建基于词嵌入的报警事件数据结构化编码模型,将所述历史报警事件日志输入所述基于词嵌入的报警事件数据结构化编码模型,不断更新模型参数,获取最佳结构化编码模型;
通过所述最佳结构化编码模型,对所述由显著故障引起的工业报警泛滥序列进行数据编码,得到结构化编码的工业报警泛滥序列;
通过长短期记忆网络提取所述结构化编码的报警泛滥序列中各序列的时间序列特征,结合基于原型网络的小样本学习,获取各报警泛滥序列的空间表达向量,从而搭建工业报警泛滥根源诊断模型;
将待诊断的工业报警事件日志进行预处理及结构化编码后,输入所述工业报警泛滥根源诊断模型,并输出最终根源诊断类型。
2.如权利要求1所述的基于小样本学习的工业报警泛滥根源诊断方法,其特征在于,所述预处理包括:
检查并统一报警事件数据配置信息和日志格式,修改不规范数据类型,并进一步删除信息不完整的事件数据;
去除抖振报警及冗余报警,通过设置延时器、滤波器、阈值死区、时间死区进行优化处理,提取由显著故障引起的报警泛滥序列。
3.如权利要求1所述的基于小样本学习的工业报警泛滥根源诊断方法,其特征在于,所述由显著故障引起的工业报警泛滥序列表示为:
F=[a1,a2,…,am,1≤m≤M]
其中,am表示报警泛滥序列F中第m个报警,M表示报警泛滥序列的长度。
4.如权利要求1所述的基于小样本学习的工业报警泛滥根源诊断方法,其特征在于,所述搭建基于词嵌入的报警事件数据结构化编码模型,将所述历史报警事件日志输入所述基于词嵌入的报警事件数据结构化编码模型,不断更新模型参数,获取最佳结构化编码模型的步骤,具体包括:
提取各连续历史报警事件日志中所有独立报警事件数据标签;
根据N个所述独立报警事件数据标签制作报警数据类型库,利用独热编码获得报警事件数据的初步结构化编码表示;
初始化一个N*d维的权重矩阵V,其中N为权重矩阵V的行数,与独立报警事件数据标签的个数相等,d为权重矩阵V的列数,利用所述报警事件数据的初步结构化编码表示做内积计算,获取报警事件数据的结构化编码结果;
初始化d*N维的权重矩阵W,其中d为权重矩阵W的行数,N为权重矩阵W的列数,利用多个连续历史报警事件日志库中,当前报警事件数据的结构化编码结果与其前后c个窗口内的报警事件数据结构化编码结果做内积计算,结合softmax函数对计算结果进一步映射,从而建立基于词嵌入的报警事件数据结构化编码模型;
计算所述基于词嵌入的报警事件数据结构化编码模型的平均对数概率,最大化期望输出概率,利用梯度下降法进行参数更新,获取最佳结构化编码模型。
5.如权利要求1所述的基于小样本学习的工业报警泛滥根源诊断方法,其特征在于,所述通过长短期记忆网络提取所述结构化编码的报警泛滥序列中各序列的时间序列特征,结合基于原型网络的小样本学习,获取各报警泛滥序列的空间表达向量,从而搭建工业报警泛滥根源诊断模型的步骤,具体包括:
通过长短期记忆网络提取所述结构化编码的报警泛滥序列的时序信息,将不同长度的所述结构化编码的报警泛滥序列转化为相同维度大小的编码矩阵;
将不同类型的报警泛滥序列的编码矩阵分布到高维空间平面,计算同一根源类型下不同报警泛滥序列的空间表达向量,利用其空间均值作为每类根源类型的原型表示,从而建立工业报警泛滥根源诊断模型。
6.如权利要求1所述的基于小样本学习的工业报警泛滥根源诊断方法,其特征在于,所述将待诊断的工业报警事件日志进行预处理及结构化编码后,输入所述工业报警泛滥根源诊断模型,并输出最终根源诊断类型的步骤,具体包括:
将待诊断的工业报警事件日志经过预处理后,提取待诊断的工业报警泛滥序列;
通过所述最佳结构化编码模型,对所述待诊断的工业报警泛滥序列进行结构化编码,得到结构化编码的待诊断报警泛滥序列;
将所述结构化编码的待诊断报警泛滥序列输入所述工业报警泛滥根源诊断模型,计算待诊断报警泛滥序列的空间表达向量;
将所述待诊断报警泛滥序列的表达向量与每类根源类型的原型表示进行欧氏距离计算,采用最近邻比较,将空间相对距离最小的根源类型作为最终根源诊断类型。
7.一种存储介质,其特征在于,所述存储介质为计算机可读存储介质,所述计算机可读存储介质中存储有如权利要求1-6任一所述的基于小样本学习的工业报警泛滥根源诊断方法。
CN202111005272.7A 2021-08-30 2021-08-30 基于小样本学习的工业报警泛滥根源诊断方法及存储介质 Active CN113722140B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111005272.7A CN113722140B (zh) 2021-08-30 2021-08-30 基于小样本学习的工业报警泛滥根源诊断方法及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111005272.7A CN113722140B (zh) 2021-08-30 2021-08-30 基于小样本学习的工业报警泛滥根源诊断方法及存储介质

Publications (2)

Publication Number Publication Date
CN113722140A CN113722140A (zh) 2021-11-30
CN113722140B true CN113722140B (zh) 2023-08-04

Family

ID=78679139

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111005272.7A Active CN113722140B (zh) 2021-08-30 2021-08-30 基于小样本学习的工业报警泛滥根源诊断方法及存储介质

Country Status (1)

Country Link
CN (1) CN113722140B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114529247A (zh) * 2021-12-29 2022-05-24 浙江中控技术股份有限公司 一种流程工业生产过程中的实时报警溯源装置及其方法
CN117118811A (zh) * 2023-10-25 2023-11-24 南京邮电大学 一种工业报警泛滥的报警分析方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010058765A1 (ja) * 2008-11-19 2010-05-27 株式会社日立製作所 装置異常診断方法及びシステム
EP3026518A1 (en) * 2014-11-25 2016-06-01 ABB Technology AG Method for Root analysis of an alarm flood sequence
CN109146246A (zh) * 2018-05-17 2019-01-04 清华大学 一种基于自动编码器和贝叶斯网络的故障检测方法
EP3447595A1 (en) * 2017-08-23 2019-02-27 ABB Schweiz AG Method for monitoring an industrial plant and industrial control system
CN111340238A (zh) * 2020-03-12 2020-06-26 中南大学 一种工业系统的故障诊断方法、装置、设备及存储介质
CN111538643A (zh) * 2020-07-07 2020-08-14 宝信软件(成都)有限公司 一种监控系统报警信息过滤方法和系统
CN113159088A (zh) * 2021-01-07 2021-07-23 中国地质大学(武汉) 一种基于多特征融合和宽度学习的故障监测与诊断方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9608856B2 (en) * 2013-11-03 2017-03-28 Teoco Ltd. System, method, and computer program product for identification and handling of a flood of alarms in a telecommunications system
US10579459B2 (en) * 2017-04-21 2020-03-03 Hewlett Packard Enterprise Development Lp Log events for root cause error diagnosis

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010058765A1 (ja) * 2008-11-19 2010-05-27 株式会社日立製作所 装置異常診断方法及びシステム
EP3026518A1 (en) * 2014-11-25 2016-06-01 ABB Technology AG Method for Root analysis of an alarm flood sequence
EP3447595A1 (en) * 2017-08-23 2019-02-27 ABB Schweiz AG Method for monitoring an industrial plant and industrial control system
CN109146246A (zh) * 2018-05-17 2019-01-04 清华大学 一种基于自动编码器和贝叶斯网络的故障检测方法
CN111340238A (zh) * 2020-03-12 2020-06-26 中南大学 一种工业系统的故障诊断方法、装置、设备及存储介质
CN111538643A (zh) * 2020-07-07 2020-08-14 宝信软件(成都)有限公司 一种监控系统报警信息过滤方法和系统
CN113159088A (zh) * 2021-01-07 2021-07-23 中国地质大学(武汉) 一种基于多特征融合和宽度学习的故障监测与诊断方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Comparison of the Smith-Waterman and Needleman-Wunsch algorithms for online similarity analysis of industrial alarm floods;Md Rezwan Parvez, Wenkai Hu,Tongwen Chen;《2020 IEEE Electric Power and Energy Conference (EPEC)》;第1-6页 *

Also Published As

Publication number Publication date
CN113722140A (zh) 2021-11-30

Similar Documents

Publication Publication Date Title
CN112987675B (zh) 一种异常检测的方法、装置、计算机设备和介质
CN113722140B (zh) 基于小样本学习的工业报警泛滥根源诊断方法及存储介质
CN114757309B (zh) 多物理场监测数据协同融合的工程灾害预警方法及系统
CN111339712A (zh) 质子交换膜燃料电池剩余寿命预测方法
CN111352977B (zh) 基于自注意力双向长短期记忆网络的时序数据监测方法
CN109681391B (zh) 一种叶根螺栓断裂故障检测方法及介质
CN112085621B (zh) 一种基于K-Means-HMM模型的分布式光伏电站故障预警算法
Gu et al. An improved sensor fault diagnosis scheme based on TA-LSSVM and ECOC-SVM
CN110580213A (zh) 一种基于循环标记时间点过程的数据库异常检测方法
CN116205265A (zh) 一种基于深层神经网络的电网故障诊断方法及装置
CN115758908A (zh) 一种基于深度学习的报警泛滥情况下的报警在线预测方法
CN115563880A (zh) 一种基于Isolated forest-变点增强的企业用电异常检测方法
CN113899987A (zh) 基于深度金字塔卷积神经网络的电网故障诊断方法
CN117556347A (zh) 一种基于工业大数据的电力设备故障预测与健康管理方法
CN116627116B (zh) 一种流程工业故障定位方法、系统及电子设备
CN109635008B (zh) 一种基于机器学习的设备故障检测方法
CN112418529A (zh) 基于lstm神经网络的户外广告在线倒塌预测方法
CN117033923A (zh) 一种基于可解释性机器学习的犯罪数量预测方法及系统
CN115965135A (zh) 基于朴素贝叶斯分类的新能源预测误差建模方法及系统
Shu et al. A general kpi anomaly detection using attention models
Febriansyah et al. Outlier detection and decision tree for wireless sensor network fault diagnosis
Tian et al. Structure feature extraction for hierarchical alarm flood classification and alarm prediction
CN115865458B (zh) 基于lstm和gat算法的网络攻击行为检测方法、系统及终端
Najar et al. Comparative Machine Learning Study for Estimating Peak Cladding Temperature in AP1000 Under LOFW
Javanbakht et al. Alarm-based root cause analysis in industrial processes using deep learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant