CN113537360A - 一种基于深度学习的逐点分类故障检测方法 - Google Patents
一种基于深度学习的逐点分类故障检测方法 Download PDFInfo
- Publication number
- CN113537360A CN113537360A CN202110815847.5A CN202110815847A CN113537360A CN 113537360 A CN113537360 A CN 113537360A CN 202110815847 A CN202110815847 A CN 202110815847A CN 113537360 A CN113537360 A CN 113537360A
- Authority
- CN
- China
- Prior art keywords
- sequence
- time
- point
- channel
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
- G06F18/24137—Distances to cluster centroïds
- G06F18/2414—Smoothing the distance, e.g. radial basis function networks [RBFN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Molecular Biology (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Debugging And Monitoring (AREA)
Abstract
本发明公开了一种基于深度学习的逐点分类故障检测方法(DPCFD),具体包括:采集工业系统的各信道数据,得到原始数据序列;将原始数据序列输入至预训练的序列状态生成器模型,生成各信道的实时状态序列;将各信道的实时状态序列与原始数据序列按照时间维度进行拼接,得到融合数据序列,根据信道之间的关联关系对信道进行分组,按照信道分组将融合数据序列输入预训练的基于深度学习逐点分类的故障检测模型,得到故障检测结果的序列。该方法使用标准数据集田纳西伊士曼对DPCFD方法进行评估,实验结果表明本方法具有兼顾高检测性能与低检测时延的优势。
Description
技术领域
本申请涉及故障检测技术领域,特别是涉及一种基于深度学习的逐点分类故障检测方法。
背景技术
故障是系统功能的非期望改变,一般定义为系统中至少一个变量、参数或者特征属性偏离了正常范围,通常会引起元器件以及系统的性能恶化或功能丧失。尽早快速地发现故障对重大事故的预防具有十分重要的意义,因此重要系统一般都会被多个传感数据实时监测,而基于这些多变量的实时监测数据进行故障检测十分困难,其挑战主要有如下几个方面:①各信道的数据均为时间序列,它们的时序关系往往是非线性的,而且各元器件性能会随着使用而衰减,这些都大大增大了数据的复杂性,故而难以精确地定位出故障的起止时间;②不同信道之间存在复杂的关联关系,而且这种关联关系随着时间动态变化,传统方法难以挖掘这种信道间的时序关联关系;③故障样本通常较少,属于典型的类别不平衡问题,且人工给数据进行故障标注困难,成本代价很高。
故障检测方法包括基于模型、基于知识和数据驱动的方法。基于模型的方法需要通过物理原理和逻辑结构构建系统的精确数学模型;基于知识的方法则是使用定性描述的方式,通过因果模型和专家先验知识库获得监控模型。数据驱动的方法因其不依赖背景知识的巨大优势具有很强的通用性,近年来逐渐成为最流行和可靠的故障检测方法。数据驱动的诸多方法中,深度神经网络由于其自学习和自适应的特性,能够很好地学习非线性的特征,得到了更为广泛的研究与应用。基于深度学习进行故障检测的方法大致可以分为有监督的方法和无监督的方法。有监督的方法通过有标注的正负样本构建分类模型,训练模型参数;而无监督的方法则可以分为基于偏差的方法和基于单类分类器的方法。
基于偏差的无监督方法仅使用正常样本建立预测模型,学习系统在正常模式下的规律,最后根据测试样本的预测偏差和阈值来判定是否故障。
基于偏差的方法通过各点的异常得分计算和阈值的设定,在理论上则可以将故障定位到采样时间点。基于单类分类器的无监督方法则通过在正常样本上的训练学习正常样本的边界来区分正常样本和故障样本。这类方法先采用自编码器等特征提取进行特征提取,然后分别使用正常样本建立单类分类器模型,最后分别使用单类分类器进行故障检测。
综上所述,无监督方法的优势是不依赖故障样本,通用性强;而它们的劣势则是没有利用已有的故障信息,因此在故障训练样本较为充足的条件下,这类方法的整体性能难以超过有监督的方法。各类无监督的方法虽然通常在理论上能将故障定位到时间点,但无法利用故障样本的劣势导致它们在实际应用中难以兼顾故障检测的高性能以及低检测时延。
有监督的故障检测方法使用带有故障标注的样本进行训练,在对故障样本分类的同时,可通过故障样本对应的时间确定故障的发生时间。这类方法通过将原始数据分为多个预设长度的子序列,以带有故障标注的各子序列作为训练样本学习分类器;在测试阶段,基于训练好的分类器对各测试子序列进行分类,分类结果包含了故障的类别也隐含了故障出现的时段(子序列)。使用这类基于分类的方法进行故障检测时,只能够确定故障的大致时段,而无法精确定位到故障开始和结束的时间。如果预定义的时序片段过长,则更加难以确定故障开始和结束的准确时间,甚至不知道该故障是否结束,不利于对故障的合理处置;反之,如果预定义的时序片段过短,则无法充分利用时序信息,检测效果难以保证。
发明内容
基于上述各种故障检测方法的不足,本文提出了一种基于深度学习的逐点分类故障检测方法(Deep-learningbasedPoint-wiseClassificationforFaultDetection,DPCFD),以采样时间点为最小粒度进行更加精确地故障检测。
一种基于深度学习的逐点分类故障检测方法,所述方法包括:
采集工业系统的各信道数据,得到原始数据序列;
将原始数据序列输入至预训练的序列状态生成器模型(Sequence StateGenerator,SSG),生成各信道的实时状态序列;所述序列状态生成器模型包括:卷积模块、双向LSTM模块、时间注意力机制模块、全连接层、softmax分类和标签转换;
将各信道的实时状态序列与原始数据序列按照时间维度进行拼接,得到融合数据序列,根据信道之间的关联关系对信道进行分组,按照信道分组将融合数据序列输入预训练的基于深度学习逐点分类的故障检测模型(Deep-learningbasedPoint-wiseClassification Model,DPCM),得到故障检测结果的序列。
在其中一个实施例中,所述将原始数据序列输入至预训练的序列状态生成器模型,生成各信道的实时状态序列,包括:
将原始数据序列输入卷积模块进行短时的时序特征抽取,得到时序特征;
将所述时序特征输入所述双向LSTM模块进行时序关系提取,并根据所述时间注意力机制模块在所有时间点上根据不同权重计算得到时序相关特征;
将所述时序相关特征输入时序共享参数的全连接层和softmax进行分类,得到表示单信道实时状态的输出序列,将所述输出序列转换为类别标签组成的实时状态序列后输出。
所述卷积模块由一维卷积层、批规范化处理层和ReLU激活函数构成,并对卷积层采用了0填充。
各信道的实时状态序列中的各点表示在各时刻下的状态,不同的状态类别使用不同的标签表示,一般状态用标签0表示,其他特殊状态分别用非0标签表示。
在其中一个实施例中,根据信道之间的关联关系对信道进行分组,包括:
根据信道间的关联关系对多个信道的数据进行分组,将关联程度高的信道分为一组,控制各组内的信道数在一个预设定的值以内。
在其中一个实施例中,所述基于深度学习逐点分类的故障检测模型包括:一个卷积模块、压缩和激活块、双向LSTM模块、时间注意力机制模块、时序全连接层和softmax。
在其中一个实施例中,按照信道分组将融合数据序列输入预训练的基于深度学习逐点分类的故障检测模型,通过一下步骤得到故障检测结果的序列,包括:
对每一个分组的输入数据分别采用一个卷积模块进行特征提取;
在每个卷积模块后使用压缩和激活块对各卷积模块的特征图进行加权选择;
经过压缩和激活块后,将各模块提取的特征根据时间维度进行拼接,得到所有信道卷积和特征图筛选后的特征;
使用一个两层的带有Dropout的双向LSTM模块提取时序关系,并利用时间注意力机制模块在所有时间点上根据不同权重计算相关特征;最后经过时序全连接层和softmax进行分类,得到表示故障检测结果的输出序列。
所述卷积模块由一个一维卷积层、批规范化处理层,以及ReLU激活函数构成,一维卷积可以同时抽取各组内信道间的时序关联关系,对卷积层采用了0填充。
在其中一个实施例中,还包括:使用标准数据集田纳西伊士曼对基于深度学习的逐点分类故障检测方法进行评估。
本发明的有益效果:①引入信道实时状态的概念,设计了一种单信道实时状态描述的序列状态生成器,通过仿真数据的训练,序列状态生成器能较为精确地描述单信道数据的实时状态;②将序列状态生成器生成的各信道实时状态序列和原始实时数据序列进行分组,构建了一种基于深度学习的端到端时序数据故障检测模型。该故障检测模型能够对序列中各时间点的故障情况进行分类,从而在时间点这个粒度上精确地检测出故障;③使用标准数据集实验验证了DPCFD方法通过在少量故障样本上的有监督训练,可兼顾高检测性能和低检测时延。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。
图1一种基于深度学习的逐点分类故障检测方法流程图;
图2为原始数据序列及其实时状态序列;
图3为基于SSG的状态序列获取;
图4为DPCM模型故障检测的示意图;
图5为DPCM模型及其各变种对比。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的一种基于深度学习的逐点分类故障检测方法(Deep-learningbased Point-wise Classification for Fault Detection,DPCFD),可以应用于复杂大型工业系统,是减少重大事故发生的重要手段。
在一个实施例中,如图1所示,提供了一种基于深度学习的逐点分类故障检测方法,包括以下步骤:
步骤1:采集工业系统的各信道数据,得到原始数据序列;
步骤2:将原始数据序列输入至预训练的序列状态生成器模型(Sequence StateGenerator,SSG),生成各信道的实时状态序列;所述序列状态生成器模型包括:卷积模块、双向LSTM模块、时间注意力机制模块、全连接层、softmax分类和标签转换;
步骤3:将各信道的实时状态序列与原始数据序列按照时间维度进行拼接,得到融合数据序列;
步骤4:根据信道之间的关联关系对信道进行分组,按照信道分组将融合数据序列输入预训练的基于深度学习逐点分类的故障检测模型,得到故障检测结果的序列。
使用上述DPCFD方法检测工业系统故障,整个检测过程既考虑了数据的时序关系和状态发生变化的关键时间点,也同时根据先验知识对信道分组,在组内和组间两个层次上抽取了不同信道间的时序关联关系,并且使用各点的故障情况进行训练也利用了数据增强的思想,保证了故障检测的性能。
所述各信道实时状态指的是分别对各信道数据的实时定性描述,这些状态包括一些常见的特殊状态,而将非特殊状态定义为一般状态,特殊状态包括:渐变、震荡、突变和周期变化。渐变状态表示该点及其邻近点共处于一个上升或者下降的整体趋势中,震荡状态表示该点及其邻近点共处于一种剧烈的波动之中,突变状态表示该点及其邻近点共处于一个明显偏离周围点的状态,周期变化表示该点及其邻近点共处于一个周期性变化的过程。各信道的实时状态分别用一个与原始数据等长的序列表示,序列中的各点表示它们在各时刻下的状态,根据这些状态的物理意义,通常相邻的点对应着相同的一个状态。状态序列反映了两方面的信息:一个是时间维度的信息,即何时在信道上出现了特殊状态;另一个是状态的描述信息,即出现的特殊状态具体是哪一种状态。不同的状态类别使用不同的标签表示,一般状态用标签0表示,而其他特殊状态分别用非0标签表示。图2给出了一个原始数据序列对应的状态序列,图中突变状态的标签用离散值1表示,渐变状态的标签用离散值2表示。
由图2可以看出,用标签标识的信道实时状态是对原始数据高抽象程度的简化,该表示方法能够大幅简化原始数据,且极大程度地简化时序关系。
在另一个实施例中,如图3所示,序列状态生成器SSG以单信道的时序数据作为输入,输出与输入序列等长的实时状态序列。由图3可见,输入的是由连续数值组成的序列,而输出的是离散化的标签序列。首先,输入数据经过一个卷积模块进行短时的时序特征抽取,该卷积模块由一维卷积层、批规范化处理层(BatchNormalization,BN),以及ReLU激活函数构成。为了保持时序维度不变,对卷积层采用了0填充。继而,再使用一个两层的带有Dropout的双向LSTM模块进一步提取时序关系,并利用时间注意力机制在所有时间点上根据不同权重计算相关特征。选择双向LSTM模块在于当对序列中每一个点进行状态分类时,可以同时考虑它前后两个方向的信息。最后经过时序共享参数的全连接层(TimeDistributedDense,TDD)和softmax的分类,即可得到表示单信道实时状态的输出序列。图3中标明了各模块引起的维度变化,TDD层的单样本输入为形如L×K2的矩阵,输出为形如L×C的矩阵,C表示输出的状态类别数。TDD层在每个时间步上均采用了相同的全连接计算,保留了输入的时序维度,因此可以得到一个序列的分类结果,最后将用独热(One-hot)编码表示的矩阵转换为类别标签组成的实时状态序列。
序列状态生成器SSG是基于信道实时状态概念设计的,能较为精确地描述单信道数据的实时状态。
在另一个实施例中,详细描述了根据信道之间的关联关系对信道进行分组。当多个信道的数据同时输入进行特征提取时,过多的信道输入在训练的过程中容易相互干扰,不利于模型的收敛和最终的效果。本方法根据信道间的关联关系对多个信道的数据进行分组,将关联程度高的信道分为一组,控制各组内的信道数为一个较小的值。如果一个组内的相关信道数仍然很多,则可以继续对该组信道分组,直至各组内的信道数降至一个预设定的值以内。通过信道分组控制组内信道的数量,保证特征提取的质量。另一方面,由于不同组间的特征会在后续的特征提取提取过程中进一步融合,因此也不需要担心分组使得不同组间信道的关联关系被忽略掉。
在另一个实施例中,如图4所示,在使用训练好的SSG模型得到各信道的状态序列后,将这些状态序列与它们的原始数据序列按照时间维度拼接在一起,然后将这些原始的传感数据与它们相对应的实时状态序列按照分组拼接在一起。由于各信道原始序列和状态序列标签的取值范围差异较大,需要进行对各信道的数据归一化,将原始数据线性映射到0和1之间。故障检测结果用一个与输入等长的序列表示,序列中各点由0或非0的标签表示,非0标签在序列中出现的位置代表了故障发生的时间。图4中,将各组的传感数据与实时状态序列作为DPCM模型的输入,m为信道数,对每一个分组的输入数据分别采用一个卷积模块进行特征提取,各卷积模块均由一个一维卷积层、BN层,以及ReLU激活函数构成。一维卷积可以同时抽取各组内信道间的时序关联关系,卷积核的大小较小,因此卷积关注的更多的是邻近时序间的关系。为了保持时序维度不变,同样对卷积层采用了0填充。特别地,在每个卷积模块后使用了压缩和激活块(Squeezeand Excite,SE)对各卷积模块的特征图进行加权选择。经过了SE模块后,将各模块提取的特征根据时间维度进行拼接,得到所有信道卷积和特征图筛选后的特征。继而,再使用一个两层的带有Dropout的双向LSTM模块进一步提取时序关系,并利用时间注意力机制在所有时间点上根据不同权重计算相关特征。最后经过时序全连接层和softmax的分类,得到表示故障检测结果的输出序列。DPCM模型能够对序列中各时间点的故障情况进行分类,从而在时间点这个粒度上精确地检测出故障。
在另一个实施例中,还包括:使用标准数据集田纳西伊士曼对基于深度学习的逐点分类故障检测方法进行评估。田纳西伊士曼(Tennessee Eastman,TE)数据集是过程监测、故障检测与诊断领域的常用标准数据集。TE数据集包含52个监测变量,其中有11个是操纵变量,22个过程测量变量和19个成分测量变量。该数据集中训练集和测试集的各样本分别包含了25小时和48小时的数据,且它们的时间采样间隔都是3分钟,因此训练样本的序列长度为500,测试集样本的序列长度为960。数据集中包含了20种故障类别的数据IDV(1)-IDV(20),其中第1、2、6、7、8、12、13、14、17和18类故障为显著故障,第3、4、5、9、10、11、15、16、19和20类故障是微小故障。故障IDV(3)、IDV(9)和IDV(15)几乎无法被识别出来,因此剔除了这三类故障。训练集和测试集中,正常样本和各类故障样本的样本数均为500。训练集的样本中故障是在1小时后引入的,而测试集的样本中故障是在8小时后引入的。
实验评估
(1)实验设置
为了训练SSG模型,使用时序异常仿真工具Agotsmaster(时序异常发生器,来源于https://github.com/KDD-OpenSource/agots)和DeepADoTSmaster(时序异常检测器,来源于https://github.com/KDD-OpenSource/deepadots)生成了包含多种特殊状态的单变量时间序列数据集,该数据集训练集包含了10000个训练样本和1000个测试样本。各训练样本和测试样本的时序长度均为1000,“突变”、“渐变”、“震荡”和“周期变化”型的特殊状态均以10%的比例被随机插入了这些单变量时序样本中,在生成这些样本的过程中也随即给样本中各时间点标注了它们的状态标签,包括一般、突变、渐变、震荡和周期变化。SSG模型中,L=200表示的是输入序列的长度,N=64表示卷积核的个数,1维卷积核的大小设为8,K1=50、K2=20分别表示双向LSTM网络中两个单向隐藏层的单元个数。在DPCM模型中,输入的序列长度也设为200,K=32表示各输入组中使用的卷积核个数,各卷积核的大小均设为8。N1=40、N2=20分别表示双向LSTM网络中两个单向隐藏层的单元个数。在其他设置方面,两个模型相同。如Dropout均设为0.3,且损失函数均定义为“分类交叉熵”,并使用Adam优化器来最小化上述损失函数。将训练的批处理大小设置为128,迭代次数设置为100,且采用提前终止策略,初始学习率为0.001,如果连续10个epoch损失函数不下降,则学习率衰减一次,衰减系数为0.1。这些超参数均是根据经验与大量实验针对数据集设计和选择的。将变量分为10组,分组情况如表1所示。
表1数据集中的变量分组
组编号 | 组类别 | 组内变量 |
第一组 | 输入进料量 | XMEAS(1)-XMEAS(4) |
第二组 | 反应器 | XMEAS(6)-XMEAS(9) |
第三组 | 分离器 | XMEAS(11)-XMEAS(14) |
第四组 | 汽提器 | XMEAS(15)-XMEAS(19) |
第五组 | 其他混杂输入 | XMEAS(5)、XMEAS(10)、XMEAS(20)-XMEAS(22) |
第六组 | 反应器进料 | XMEAS(23)-XMEAS(28) |
第七组 | 排放气体 | XMEAS(29)-XMEAS(36) |
第八组 | 产品 | XMEAS(37)-XMEAS(41) |
第九组 | 控制变量1 | XMV(1)-XMV(5) |
第十组 | 控制变量2 | XMV(6)-XMV(11) |
为了验证本方法在少量故障样本下的有效性,实验中仅从每个故障类别原有的500个样本中随机抽取了5%的故障样本用作训练,即25个故障样本。实验评估采用了召回率(R)、精度(P)和同时考虑了这两个指标的F值(F)以及检测时延等指标。TP、FP、TN和FN分别表示真正例、假正例、真负例和假负例的个数,各性能指标的计算公式如下所示:
R=TP/(TP+FN)
P=TP/(TP+FP)
F=2×P×R/(P+R)
召回率反映了检测方法对故障样本的敏感程度,精度反应了检测出来的故障确实为故障的可信度,而F值则是同时考虑召回率和精度的指标。检测时延表示从故障出现到该故障能被检测方法检测出来的时间差,检测时延越短则表示检测方法对故障越灵敏,留给故障处置的时间越长。
(2)SSG模型的性能测试
SSG模型生成的准确的状态序列才有可能辅助DPCM模型取得良好的故障检测效果。由于没有相应的对比方法,表2仅展示了SSG模型在仿真数据集上对特殊状态检测的性能指标。
表2SSG模型的检测性能
精度 | 召回率 | F值 |
0.9524 | 0.7632 | 0.8474 |
从表2可以看出,SSG模型对特殊状态的检测精度超过95%,说明使用SSG模型对单信道特殊状态的识别较为准确。考虑到SSG模型的结果只是为DPCM模型提供辅助输入,即使召回率为0,即完全无法检测出特殊状态,那么也只是给DPCM模型引入了无效的输入,而不会带来过大的消极作用;反之,如果精度过低,则会出现将过多一般状态的点判为特殊状态的点,引入过多的错误信息进入DPCM模型,对故障检测带来干扰。由此可见,只要特殊状态检测的精度高,即使召回率较低也是可以容忍的。综上所述,虽然SSG模型对单信道特殊状态的召回率并不高,但这是可以接受的,而且它的高精度使之能够较为精准地检测出单信道的特殊状态。因此,SSG模型基本达到了预期效果。
(3)DPCFD的故障检测评估
本实验中对比方法为三种可以定位到采样时间点的基准故障检测方法:OC-SVM、AE1SVM和HELM。OC-SVM方法以原始的多变量数据作为样本并仅在正常样本上进行训练,然后根据测试样本与正常样本的距离判断测试样本是否正常,非正常的样本即为故障。AE1SVM方法和HELM方法则是深度学习与传统机器学习结合的方法,它们首先使用自编码器学习正常样本的特征表示,然后分别根据学习到的特征训练单类SVM模型和单类极限学习机。OC-SVM方法和AE1SVM方法中,v是正类样本占比的上界,本实验中将v设为一个常用值0.1,将HELM方法中确定阈值的相关参数设为p=99.5%,γ=1.5。各方法的召回率和精度的对比结果如表3所示,表中上半部分对应数据集中的显著故障,下半部分对应较难检测的微小故障,微小故障的编号用下划线标注。
表3各方法的召回率与精度对比
由表3左半部分可见,在显著故障上,OCSVM方法的召回率表现较为突出;在微小故障上,DPCFD方法在召回率上表现出明显的优势。整体上来看,DPCFD方法获得了最高的平均召回率,且平均召回率远高于其他对比方法。OC-SVM方法和HELM方法在显著故障上的召回率具有一定优势,但对微小故障的检测性能较弱;而AE1SVM方法则对显著故障和微小故障的召回率都明显弱于其他方法。各对比方法对微小故障较低的召回率说明,这些无监督的检测方法难以检测出微小故障,而其根本原因在于它们难以区分正常样本和微小故障样本的边界,因此导致了对微小故障的低召回率。而DPCFD方法通过在少量故障样本上的训练,大幅提升了对微小故障的召回率。
由表3右半部分可见,在显著故障上和微小故障的各类别上,HELM方法和DPCFD方法在精度上表现突出,且几乎不相上下,但DPCFD方法的平均精度略高于HELM方法。OC-SVM方法的精度优于表现最弱的AE1SVM方法。表4进一步对比各方法同时考虑召回率和精度的F值以及检测时延。
表4各方法的F值与检测时延对比
由表4可见,在多个显著故障上,HELM方法同时获得了最高的F值;而在所有的微小故障上,DPCFD方法则获得了最高的F值。HELM方法虽然在显著故障上表现突出,但是在微小故障上的表现却有很大的下降,其平均F值甚至低于OC-SVM方法。结合表3可知,这主要是由于它对微小故障的低召回率引起的。DPCFD方法在微小故障上的性能与在显著故障上的性能相差不大,且在获得高召回率的同时精度也较高,因此DPCFD方法获得了最高的平均F值。在多个显著故障上,OC-SVM方法的检测时延最短;而在除了IDV(20)以外的其他微小故障上,DPCFD方法的检测时延最短。从所有故障类别的平均检测时延来看,DPCFD方法优于各对比方法。纵向来看,OC-SVM方法对大部分显著故障的检测时延较短,而对大部分微小故障的检测时延明显增大;而DPCFD方法对显著故障与微小故障的检测时延没有明显区别。这一对比结果进一步说明,DPCFD方法的主要优势体现在微小故障上,这与表3中的结果一致。无监督的检测方法难以区分正常样本和微小故障样本的边界,因此更难以准确地检测出微小故障的早期征兆,导致检测时延增加。综上所述,DPCFD方法在微小故障检测方面具有显著优势,且这一优势主要是召回率的提升带来的,这一优势使得它能快速准确地检测出包含微小故障的各类故障。
(4)模型变种对比
为了进一步探究DPCFD方法中各核心部分起到的作用,实验对比了DPCM模型及其以下几种变种:不使用各信道实时状态作为输入的变种(NS)、没有使用信道分组的变种(NG)、将双向LSTM替换为单向LSTM的变种(NBL)、没有使用SE模块的变种(NSE),以及没有使用注意力机制的变种(NA)。各变种的召回率、精度以及F值对比结果如图5所示。
由图5可见,在综合考虑召回率和精度的F值上,DPCM模型获得了最佳的综合性能,这说明各变种在精度和召回率这两个指标上至少有一个低于DPCM模型。变种NS、NG、NBL有着相似的表现,即召回率明显低于DPCM模型,而精度则稍高于DPCM模型。变种NSE和NA有着相似的表现,即精度明显低于DPCM模型。分析各变种与DPCM模型的区别并结合各变种在召回率与精度的表现可知,使用各信道实时状态、信道分组以及双向LSTM代替单向LSTM对于提升召回率有较大贡献,而SE模块和注意力机制则对于提升精度较为有效。这一对比结果不仅表明了DPCM模型中各核心部分起到的作用,而且也证明了将它们组合在一起时表现出来的优势。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (9)
1.一种基于深度学习的逐点分类故障检测方法,其特征在于,所述方法包括:
采集工业系统的各信道数据,得到原始数据序列;
将原始数据序列输入至预训练的序列状态生成器模型,生成各信道的实时状态序列;所述序列状态生成器模型包括:卷积模块、双向LSTM模块、时间注意力机制模块、全连接层、softmax分类和标签转换;
将各信道的实时状态序列与原始数据序列按照时间维度进行拼接,得到融合数据序列,根据信道之间的关联关系对信道进行分组,按照信道分组将融合数据序列输入预训练的基于深度学习逐点分类的故障检测模型,得到故障检测结果的序列。
2.根据权利要求1所述的方法,其特征在于,将原始数据序列输入至预训练的序列状态生成器模型,生成各信道的实时状态序列,包括:
将原始数据序列输入卷积模块进行短时的时序特征抽取,得到时序特征;
将所述时序特征输入所述双向LSTM模块进行时序关系提取,并根据所述时间注意力机制模块在所有时间点上根据不同权重计算得到时序相关特征;
将所述时序相关特征输入时序共享参数的全连接层和softmax进行分类,得到表示单信道实时状态的输出序列,将所述输出序列转换为类别标签组成的实时状态序列后输出。
3.根据权利要求2所述的方法,其特征在于,所述卷积模块由一维卷积层、批规范化处理层和ReLU激活函数构成,并对卷积层采用了0填充。
4.根据权利要求2所述的方法,其特征在于,各信道的实时状态序列中的各点表示在各时刻下的状态,不同的状态类别使用不同的标签表示,一般状态用标签0表示,其他特殊状态分别用非0标签表示。
5.根据权利要求1所述的方法,其特征在于,根据信道之间的关联关系对信道进行分组,包括:
根据信道间的关联关系对多个信道的数据进行分组,将关联程度高的信道分为一组,控制各组内的信道数在一个预设定的值以内。
6.根据权利要求1所述的方法,其特征在于,所述基于深度学习逐点分类的故障检测模型包括:一个卷积模块、压缩和激活块、双向LSTM模块、时间注意力机制模块、时序全连接层和softmax。
7.根据权利要求1所述的方法,其特征在于,所述按照信道分组将融合数据序列输入预训练的基于深度学习逐点分类的故障检测模型,得到故障检测结果的序列,包括:
对每一个分组的输入数据分别采用一个卷积模块进行特征提取;
在每个卷积模块后使用压缩和激活块对各卷积模块的特征图进行加权选择;
经过压缩和激活块后,将各模块提取的特征根据时间维度进行拼接,得到所有信道卷积和特征图筛选后的特征;
使用一个两层的带有Dropout的双向LSTM模块提取时序关系,并利用时间注意力机制模块在所有时间点上根据不同权重计算相关特征;最后经过时序全连接层和softmax进行分类,得到表示故障检测结果的输出序列。
8.根据权利要求7所述的方法,其特征在于,所述卷积模块由一个一维卷积层、批规范化处理层,以及ReLU激活函数构成,一维卷积可以同时抽取各组内信道间的时序关联关系,对卷积层采用了0填充。
9.根据权利要求1所述的方法,其特征在于,使用标准数据集田纳西伊士曼对基于深度学习逐点分类的故障检测方法进行评估。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110815847.5A CN113537360B (zh) | 2021-07-19 | 2021-07-19 | 一种基于深度学习的逐点分类故障检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110815847.5A CN113537360B (zh) | 2021-07-19 | 2021-07-19 | 一种基于深度学习的逐点分类故障检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113537360A true CN113537360A (zh) | 2021-10-22 |
CN113537360B CN113537360B (zh) | 2023-02-03 |
Family
ID=78128799
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110815847.5A Active CN113537360B (zh) | 2021-07-19 | 2021-07-19 | 一种基于深度学习的逐点分类故障检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113537360B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116298947A (zh) * | 2023-03-07 | 2023-06-23 | 中国铁塔股份有限公司黑龙江省分公司 | 一种蓄电池核容监测装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200371491A1 (en) * | 2017-10-26 | 2020-11-26 | Gb Gas Holdings Limited | Determining Operating State from Complex Sensor Data |
CN112101431A (zh) * | 2020-08-30 | 2020-12-18 | 西南电子技术研究所(中国电子科技集团公司第十研究所) | 电子设备故障诊断系统 |
CN112147432A (zh) * | 2020-08-25 | 2020-12-29 | 国网上海市电力公司 | 基于注意力机制的BiLSTM模块、变压器状态诊断方法和系统 |
CN112989976A (zh) * | 2021-03-03 | 2021-06-18 | 南京航空航天大学 | 一种基于双深度学习模型的设备故障模式预测方法 |
US20210209871A1 (en) * | 2020-01-06 | 2021-07-08 | Hyundai Motor Company | State diagnosis apparatus and method of moving system part |
-
2021
- 2021-07-19 CN CN202110815847.5A patent/CN113537360B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200371491A1 (en) * | 2017-10-26 | 2020-11-26 | Gb Gas Holdings Limited | Determining Operating State from Complex Sensor Data |
US20210209871A1 (en) * | 2020-01-06 | 2021-07-08 | Hyundai Motor Company | State diagnosis apparatus and method of moving system part |
CN112147432A (zh) * | 2020-08-25 | 2020-12-29 | 国网上海市电力公司 | 基于注意力机制的BiLSTM模块、变压器状态诊断方法和系统 |
CN112101431A (zh) * | 2020-08-30 | 2020-12-18 | 西南电子技术研究所(中国电子科技集团公司第十研究所) | 电子设备故障诊断系统 |
CN112989976A (zh) * | 2021-03-03 | 2021-06-18 | 南京航空航天大学 | 一种基于双深度学习模型的设备故障模式预测方法 |
Non-Patent Citations (2)
Title |
---|
XIAOYANG ZHENG等: "An End-To-End CNN-BiLSTM Attention Model for Gearbox Fault Diagnosis", 《2020 IEEE INTERNATIONAL CONFERENCE ON PROGRESS IN INFORMATICS AND COMPUTING (PIC)》 * |
王太勇等: "基于注意力机制BiLSTM的设备智能故障诊断方法", 《天津大学学报(自然科学与工程技术版)》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116298947A (zh) * | 2023-03-07 | 2023-06-23 | 中国铁塔股份有限公司黑龙江省分公司 | 一种蓄电池核容监测装置 |
CN116298947B (zh) * | 2023-03-07 | 2023-11-03 | 中国铁塔股份有限公司黑龙江省分公司 | 一种蓄电池核容监测装置 |
Also Published As
Publication number | Publication date |
---|---|
CN113537360B (zh) | 2023-02-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111552609B (zh) | 一种异常状态检测方法、系统、存储介质、程序、服务器 | |
CN111902781B (zh) | 用于控制系统的设备和方法 | |
CN110132598B (zh) | 旋转设备滚动轴承故障噪声诊断算法 | |
US11989983B2 (en) | Deep learning of fault detection in onboard automobile systems | |
CN108780315A (zh) | 用于优化旋转设备的诊断的方法和装置 | |
CN112101431A (zh) | 电子设备故障诊断系统 | |
CN104503434B (zh) | 一种基于故障征兆主动推送的故障诊断方法 | |
CN111241673A (zh) | 用于噪声环境工业设备的健康状态预测方法 | |
CN113962299A (zh) | 一种核电设备智能运行监测与故障诊断通用模型 | |
CN113339204B (zh) | 一种基于混合神经网络的风力发电机故障识别方法 | |
CN111291783A (zh) | 一种燃气调压设备的智能化故障诊断方法、系统、终端及存储介质 | |
CN105303296B (zh) | 一种电力设备全寿命状态评价方法 | |
CN109270921A (zh) | 一种故障诊断方法及装置 | |
US20230110056A1 (en) | Anomaly detection based on normal behavior modeling | |
CN113537360B (zh) | 一种基于深度学习的逐点分类故障检测方法 | |
CN114036998A (zh) | 一种基于机器学习对工业硬件进行故障检测的方法及系统 | |
CN117951646A (zh) | 一种基于边缘云的数据融合方法及系统 | |
CN111765449A (zh) | 一种基于长短期记忆网络的过热器爆泄预警方法 | |
Zhang et al. | Recurrent neural network model with self-attention mechanism for fault detection and diagnosis | |
CN111080168A (zh) | 一种基于胶囊网络的电力通信网络设备可靠性评估方法 | |
CN118070229A (zh) | 一种基于多模态数据挖掘的设备故障预警模型及方法 | |
KR20210011822A (ko) | 인공 지능 기반 비정상 로그를 탐지하는 방법 및 이를 구현하는 시스템 | |
US20080202763A1 (en) | Method to Optimize Production from a Gas-lifted Oil Well | |
CN117992496A (zh) | 一种基于时空特征融合的日志异常检测方法 | |
CN112199295A (zh) | 一种基于频谱的深度神经网络缺陷定位方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |