CN114021663B - 基于序列局部判别信息挖掘网络的工业过程离线数据分割方法 - Google Patents

基于序列局部判别信息挖掘网络的工业过程离线数据分割方法 Download PDF

Info

Publication number
CN114021663B
CN114021663B CN202111348814.0A CN202111348814A CN114021663B CN 114021663 B CN114021663 B CN 114021663B CN 202111348814 A CN202111348814 A CN 202111348814A CN 114021663 B CN114021663 B CN 114021663B
Authority
CN
China
Prior art keywords
network
sequence
contribution rate
hidden layer
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111348814.0A
Other languages
English (en)
Other versions
CN114021663A (zh
Inventor
宋执环
钱金传
刘高平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN202111348814.0A priority Critical patent/CN114021663B/zh
Publication of CN114021663A publication Critical patent/CN114021663A/zh
Application granted granted Critical
Publication of CN114021663B publication Critical patent/CN114021663B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开一种基于序列局部判别信息挖掘网络的工业过程离线数据分割方法,主要分为特征挖掘和数据聚类两个步骤。用于特征挖掘的模型由神经网络构成,并且所设计的网络的第一层由循环神经网络组成,用于输入序列数据,挖掘数据中的动态特征。此外,为了能指导网络挖掘出有效的具有判别性的特征,模型输出为一组贡献率序列,并且模型参数通过最小化贡献率序列预测误差得到。最后,所得到的隐层特征经过重构邻域序列样本特征,进一步挖掘出带有局部信息的判别特征。在得到最终的特征输出后,利用高斯混合模型进行聚类,以得到最终的数据分割结果。本发明提出的方法对类别标签的需求较少,且对离线数据分割的稳定性更好,分类准确率高。

Description

基于序列局部判别信息挖掘网络的工业过程离线数据分割 方法
技术领域
本发明属于工业过程的离线数据分割领域,具体涉及一种基于序列局部判别信息挖掘网络的工业过程离线数据分割方法。
背景技术
计算机和人工智能技术在近几年有了显著的发展,这些技术可以在缺少先验知识的情况下,对流程工业的复杂特征进行有效挖掘,这也使数据驱动的过程建模技术成为了近几年最为火热的研究领域之一,并且在故障检测、故障诊断和软测量得到了广泛的应用。此外,随着数据采集和数据存储技术的发展,越来越多的过程数据得以被记录下来,如何最大限度的利用好这些数据是很多算法改进的出发点。
对储存的离线数据进行有效的分割,可以帮助后期通过过程的专家知识对各个数据块进行有效的标注,从而为故障诊断模型的训练提供有效的数据支持,提高模型的性能;此外,利用故障识别算法,以及因果分析技术,针对每个数据块进行分析也可以完成过程的离线知识库的建立,以应对过程中出现的各类故障,保持过程的平稳运行。
由于面对的是一组无标签的数据,因此针对离线数据的分割可以通过聚类方法来实现,但直接使用传统的聚类方法,难以给出准确的分割精度。近年来,深度学习成为了研究热点,其主要包括一些基于神经网络的特征提取模型,可用于挖掘过程中的复杂特征。将深度学习模型挖掘出的特征和传统模型相结合可大幅提高传统模型性能。
发明内容
针对工业过程中的离线数据分割问题,本发明提出一种基于序列局部判别信息挖掘网络的工业过程离线数据分割方法,该方法充分利用神经网络的特征挖掘能力,首先利用由正常数据采用降噪策略训练好的自编码器得到贡献率序列,并利用贡献率序列来引导网络对离线数据中的判别特征进行挖掘,此外,通过结合动态时间规整搜索邻域样本,并且通过重构邻域样本对局部信息进行进一步的挖掘,从而使最终所得到的特征能够清晰的区分不同类别的过程数据,最后将所挖掘的特征训练GMM,得到最终的分割结果。具体技术方案如下:
一种基于序列局部判别信息挖掘网络的工业过程离线数据分割方法,该方法包括如下步骤:
S1:收集一组正常工况下的数据,并用该组数据采用降噪策略训练一个自编码器;
S2:将待分割的离线数据带入训练好的自编码器中,得到重构值;同时对待分割的离线数据进行序列化,得到序列化的数据集X,并计算X中每个样本的贡献率,组成贡献率序列集C;
其中,X中的第n个序列表示为
Figure BDA0003355205870000021
其中,L为序列长度,m为原始样本的变量个数;C中的第n个序列表示为
Figure BDA0003355205870000022
其中
Figure BDA0003355205870000023
为第i个元素,计算方法如下式所示:
Figure BDA0003355205870000024
其中,r(*)为自编码器的重构函数,
Figure BDA0003355205870000025
为通过
Figure BDA0003355205870000026
得到的向量的第j个元素;Xn为Cn在X中对应的序列样本;
S3:利用C和X训练贡献率序列网络,X进行前向传播,得到贡献率预测值,并通过迭代的方法最小化损失函数,直到模型参数收敛或者达到最大迭代次数;所述贡献率序列网络包括输入层和预测层两部分,所述输入层由RNN组成,用于输入序列样本,挖掘过程中的动态特征;所述预测层接在RNN最后一个隐层输出后,由多个单层神经网络构成,用于预测输入序列中每个样本对应的贡献率;
S4:将数据集X输入训练好的贡献率序列网络,得到贡献率序列网络的隐层输出,作为经过贡献率序列网络映射后的特征hL
S5:搜索每个Cn在贡献率序列集C中的与其自身相似度最高的K个贡献率序列,并将这些最相似的贡献率序列所对应X中的序列样本作为Xn的邻域样本;
S6:利用S4得到的贡献率序列网络映射后的特征hL和每个Xn的邻域样本训练局部信息挖掘网络;hL进行前向传播,得到重构值;利用重构值和邻域样本计算损失函数,并通过迭代的方法最小化损失函数,直到模型参数收敛或者达到最大迭代次数;
所述局部信息挖掘网络包括编码器和解码器,编码器和解码器均由单层神经网络组成;将由贡献率序列网络中所得的隐层输出带入局部信息挖掘网络得到当前样本和其领域样本重构值;
S7:将hL进一步经过训练后的局部信息挖掘网络映射,得到局部信息挖掘网络的隐层输出;
S8:将S7得到的隐层输出训练GMM,并利用训练好的GMM得到最终分割结果。
进一步地,所述S3通过如下子步骤实现:
(1)将Xn带入贡献率序列网络,Xn前向传播得到RNN的隐层输出
Figure BDA0003355205870000031
其中Ue表示将输入映射到RNN的隐层特征的权重,
Figure BDA0003355205870000032
he为RNN隐层的节点数,m为输入样本的变量个数;We表示将RNN中t-1时刻的隐层输出映射到RNN中t时刻的隐层输出的权重,
Figure BDA0003355205870000033
Figure BDA0003355205870000034
Figure BDA0003355205870000035
分别代表t时刻和t-1时刻的隐层输出,
Figure BDA0003355205870000036
代表的是t时刻的输入样本,f(*)代表RNN中的非线性激活函数;
(2)Xn经过L次前向映射,得到特征输出
Figure BDA0003355205870000037
RNN的特征输出经过预测层,得到贡献率预测输出;
训练过程中,损失函数定义为下式:
Figure BDA0003355205870000038
其中,N为用于训练模型的序列数量,其中
Figure BDA0003355205870000039
为第i个贡献率预测输出为
Figure BDA00033552058700000310
softmax(*)代表softmax映射;
Figure BDA00033552058700000311
为预测层中对输入序列第i个样本的贡献率的预测所用网络的权重和偏置,
Figure BDA00033552058700000312
Figure BDA00033552058700000313
进一步地,所述S6通过如下子步骤实现:
(1)将hL的第n个数据
Figure BDA00033552058700000314
在局部信息挖掘网络中进行前向映射,得到特征输出
Figure BDA00033552058700000315
其中,Wle、ble为局部信息挖掘网络中用于将输入映射至隐层的权重和偏置,
Figure BDA00033552058700000316
Figure BDA00033552058700000317
hl为局部信息挖掘网络的隐层特征维度;σ(*)代表非线性激活函数;
(2)将
Figure BDA00033552058700000318
进一步进行前向映射得到重构值
Figure BDA00033552058700000319
其中,Wld、bld为局部信息挖掘网络中用于将隐层映射至输出的权重和偏置,
Figure BDA00033552058700000320
Figure BDA00033552058700000321
训练过程中,损失函数定义为下式:
Figure BDA00033552058700000322
其中,λ为可调节的超参数,
Figure BDA0003355205870000041
为由Xn的第k个近邻序列得到的贡献率序列网络的特征输出。
进一步地,S5中的邻域样本搜索通过动态时间规整计算相似度。
进一步地,所述S3和S6通过梯度下降法最小化损失函数。
本发明的有益效果如下:
(1)本发明的序列局部判别信息挖掘网络包括贡献率序列网络和局部信息挖掘网络两部分,其中,贡献率序列网络部分,利用得到的贡献率序列,指引该部分网络对不同类别的过程数据进行判别特征挖掘,其输入层由RNN组成,用于输入序列样本,挖掘过程中的动态特征,利用RNN最后一个隐层输出预测输入序列中的每个样本对应的贡献率。
(2)局部信息挖掘网络在由贡献率序列网络得到的判别特征的基础上进一步通过重构邻域样本挖掘局部信息,从而使最终所得到的特征能够清晰的区分不同类别的过程数据。
(3)相比与传统的通过分类实现数据分割方法,本发明提出的方法对类别标签的需求较少,且对离线数据分割的稳定性更好,分类准确率高。
附图说明
图1是基于序列局部判别信息挖掘网络的工业过程离线数据分割方法的流程图;
图2是序列局部判别信息挖掘网络的结构示意图;
图3是Tennessee Eastman(TE)过程流程图;
图4是TE过程数据分割结果图;
图5是相同训练和测试数据集下2种不同的数据分割方法的NMI对比图。
具体实施方式
下面根据附图和优选实施例详细描述本发明,本发明的目的和效果将变得更加明白,应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
为了能对过程的动态特征进行挖掘,本发明将离线数据转化为序列,并通过序列聚类来得到最终的分割结果,模型主要由贡献率序列网络和局部信息挖掘网络两部分组成,贡献率序列网络通过第一层的RNN输入序列数据,提取动态特征,随后通过预测层预测对应样本的贡献率,使得所提取的动态特征具有判别性。为了能结合局部信息,通过贡献率序列网络的特征进一步输入局部信息挖掘网络,通过重构由动态时间规整筛选出来的邻域样本挖掘具有局部信息的判别特征。最后利用所得到的特征训练GMM模型,并得到最终的数据分割结果。
本发明的方法具体步骤如下:
S1:收集一组正常工况下的数据,并用该组数据采用降噪策略训练一个自编码器;其中,降噪策略简述如下:将原始样本加入随机噪声后再输入至自编码器中,得到重构值;将重构值和原始样本之间的均方误差作为损失函数来训练自编码器的参数。
S2:将待分割的离线数据带入训练好的自编码器中,得到重构值;同时对待分割的离线数据进行序列化,得到序列化的数据集X,并计算X中每个样本的贡献率,组成贡献率序列集C;
其中,X中的第n个序列表示为
Figure BDA0003355205870000051
其中,L为序列长度,m为原始样本的变量个数;C中的第n个序列表示为
Figure BDA0003355205870000052
其中
Figure BDA0003355205870000053
为第i个元素,计算方法如下式所示:
Figure BDA0003355205870000054
其中,r(*)为自编码器的重构函数,
Figure BDA0003355205870000055
为通过
Figure BDA0003355205870000056
得到的向量的第j个元素;由于C可以很好的指示出不同类别之间的差异,因此可以作为标签来指引网络对不同类别之间的判别信息进行挖掘;Xn为Cn在X中对应的序列样本。
S3:利用C和X训练贡献率序列网络,X进行前向传播,得到贡献率预测值,并通过迭代的方法最小化损失函数,直到模型参数收敛或者达到最大迭代次数;所述贡献率序列网络包括输入层和预测层两部分,所述输入层由RNN组成,用于输入序列样本,挖掘过程中的动态特征;所述预测层接在RNN最后一个隐层输出后,由多个单层神经网络构成,用于预测输入序列中每个样本对应的贡献率;具体包括如下子步骤:
(1)将Xn带入贡献率序列网络,Xn前向传播得到RNN的隐层输出
Figure BDA0003355205870000057
其中Ue表示将输入映射到RNN的隐层特征的权重,
Figure BDA0003355205870000058
he为RNN隐层的节点数,m为输入样本的变量个数;We表示将RNN中t-1时刻的隐层输出映射到RNN中t时刻的隐层输出的权重,
Figure BDA0003355205870000059
Figure BDA00033552058700000510
Figure BDA00033552058700000511
分别代表t时刻和t-1时刻的隐层输出,
Figure BDA00033552058700000512
代表的是t时刻的输入样本,f(*)代表RNN中的非线性激活函数;
(2)Xn经过L次前向映射,得到RNN的特征输出
Figure BDA0003355205870000061
RNN的特征输出经过预测层,得到贡献率预测输出;
贡献率序列网络的参数通过梯度下降法最小化损失函数训练得到,损失函数定义为下式:
Figure BDA0003355205870000062
其中,N为用于训练模型的序列数量,其中
Figure BDA0003355205870000063
为第i个贡献率预测输出为
Figure BDA0003355205870000064
softmax(*)代表softmax映射;
Figure BDA0003355205870000065
为预测层中对输入序列第i个样本的贡献率的预测所用网络的权重和偏置,
Figure BDA0003355205870000066
Figure BDA0003355205870000067
S4:将数据集X输入训练好的贡献率序列网络,得到贡献率序列网络输入层中RNN的最后一步的隐层输出,作为经过贡献率序列网络映射后的特征hL
S5:搜索每个Cn在贡献率序列集C中的与其自身相似度最高的K个贡献率序列,并将这些最相似的贡献率序列所对应X中的序列样本作为Xn的邻域样本;序列之间的相似度通过动态时间规整计算得到;相比与Xn,Cn更能体现数据之间的差异性,因此邻域搜索通过Cn来进行相似度的计算,然后再找到X中对应的序列样本来完成邻域样本的搜索;
S6:利用S4得到的贡献率序列网络映射后的特征hL和每个Xn的邻域样本训练局部信息挖掘网络;hL进行前向传播,得到重构值;利用重构值和邻域样本计算损失函数,并通过迭代的方法最小化损失函数,直到模型参数收敛或者达到最大迭代次数;
所述局部信息挖掘网络包括编码器和解码器,编码器和解码器均由单层神经网络组成;将由贡献率序列网络中所得的隐层输出带入局部信息挖掘网络得到当前样本和其领域样本重构值;其目的在于让局部信息挖掘网络的隐层特征不仅包括输入序列的信息,也包括输入序列的领域样本的信息;具体包括如下子步骤:
(1)将hL的第n个数据
Figure BDA0003355205870000068
在局部信息挖掘网络中进行前向映射,得到特征输出
Figure BDA0003355205870000069
其中,Wle、ble为局部信息挖掘网络中用于将输入映射至隐层的权重和偏置,
Figure BDA00033552058700000610
Figure BDA00033552058700000611
hl为局部信息挖掘网络的隐层特征维度;σ(*)代表非线性激活函数;
(2)将
Figure BDA0003355205870000071
进一步进行前向映射得到重构值
Figure BDA0003355205870000072
其中,Wld、bld为局部信息挖掘网络中用于将隐层映射至输出的权重和偏置,
Figure BDA0003355205870000073
Figure BDA0003355205870000074
局部信息挖掘网络参数通过梯度下降法最小化损失函数训练得到,损失函数定义为下式:
Figure BDA0003355205870000075
其中,λ为可调节的超参数,
Figure BDA0003355205870000076
为由Xn的第k个近邻序列得到的贡献率序列网络的特征输出。
S7:将hL进一步经过训练后的局部信息挖掘网络映射,得到局部信息挖掘网络的隐层输出;
S8:将S7得到的隐层输出训练GMM,并利用训练好的GMM得到最终分割结果。
以下结合一个具体的TE过程的例子来说明基于序列局部判别信息挖掘网络的工业过程离线数据分割方法的性能。TE过程是故障诊断与故障分类领域常用的标准数据集,其工艺流程如图3所示。该流程由气液分离塔、连续搅拌式反应釜、分凝器、离心式压缩机、再沸器等5个操作单元组成,该过程可以由多个代数和微分方程来表示,非线性和强耦合性是该过程传感数据的主要特点。为了更好说明局部信息对离线数据分割准确率的提升,将所述模型,记为LCSN,和不加局部信息挖掘网络,记为CSN,的模型进行性能对比。
针对该过程,将33个过程变量作为模型的输入,用于生成真实贡献率序列的自编码器模型由500个正常样本训练得到,其中该自编码器的隐层维度设为22;贡献率序列网络中,序列长度为32,RNN的隐层节点数为64;局部信息挖掘网络中,隐层节点数为16,Loss2中的λ=0.1;模型中所有的激活函数都为线性整流函数,即RELU函数。用于测试的离线数据集包含6个样本类别,所用数据为每种类别的TE数据集中的第461-960个样本,具体信息如表1所示。
表1测试所用的离线数据具体描述
Figure BDA0003355205870000077
Figure BDA0003355205870000081
图4是所述方法的离线数据分割结果,除了第三个类别的数据有部分分错的情况,其他数据都能准确的进行分割;图5展示的是在两种网络结构挖掘出来的特征上运行100次GMM聚类得到的NMI箱线图,从中可以看出,加入局部信息挖掘网络后的NMI中位数远高于只用贡献率序列网络的NMI中位数,此外,从加入局部信息挖掘网络后得到的箱线图中可见,上下边缘线几乎与中位数一致,这说明,所述的离线数据分割方法具有更加稳定的数据分割性能。
本领域普通技术人员可以理解,以上所述仅为发明的优选实例而已,并不用于限制发明,尽管参照前述实例对发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实例记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在发明的精神和原则之内,所做的修改、等同替换等均应包含在发明的保护范围之内。

Claims (5)

1.一种基于序列局部判别信息挖掘网络的工业过程离线数据分割方法,其特征在于,该方法包括如下步骤:
S1:收集一组正常工况下的数据,并用该组数据采用降噪策略训练一个自编码器;
S2:将待分割的离线数据带入训练好的自编码器中,得到重构值;同时对待分割的离线数据进行序列化,得到序列化的数据集X,并计算X中每个样本的贡献率,组成贡献率序列集C;
其中,X中的第n个序列表示为
Figure FDA0003355205860000011
其中,L为序列长度,m为原始样本的变量个数;C中的第n个序列表示为
Figure FDA0003355205860000012
其中
Figure FDA0003355205860000013
为第i个元素,计算方法如下式所示:
Figure FDA0003355205860000014
其中,r(*)为自编码器的重构函数,
Figure FDA0003355205860000015
为通过
Figure FDA0003355205860000016
得到的向量的第j个元素;Xn为Cn在X中对应的序列样本;
S3:利用C和X训练贡献率序列网络,X进行前向传播,得到贡献率预测值,并通过迭代的方法最小化损失函数,直到模型参数收敛或者达到最大迭代次数;所述贡献率序列网络包括输入层和预测层两部分,所述输入层由RNN组成,用于输入序列样本,挖掘过程中的动态特征;所述预测层接在RNN最后一个隐层输出后,由多个单层神经网络构成,用于预测输入序列中每个样本对应的贡献率;
S4:将数据集X输入训练好的贡献率序列网络,得到贡献率序列网络的隐层输出,作为经过贡献率序列网络映射后的特征hL
S5:搜索每个Cn在贡献率序列集C中的与其自身相似度最高的K个贡献率序列,并将这些最相似的贡献率序列所对应X中的序列样本作为Xn的邻域样本;
S6:利用S4得到的贡献率序列网络映射后的特征hL和每个Xn的邻域样本训练局部信息挖掘网络;hL进行前向传播,得到重构值;利用重构值和邻域样本计算损失函数,并通过迭代的方法最小化损失函数,直到模型参数收敛或者达到最大迭代次数;
所述局部信息挖掘网络包括编码器和解码器,编码器和解码器均由单层神经网络组成;将由贡献率序列网络中所得的隐层输出带入局部信息挖掘网络得到当前样本和其领域样本重构值;
S7:将hL进一步经过训练后的局部信息挖掘网络映射,得到局部信息挖掘网络的隐层输出;
S8:将S7得到的隐层输出训练GMM,并利用训练好的GMM得到最终分割结果。
2.根据权利要求1所述的基于序列局部判别信息挖掘网络的工业过程离线数据分割方法,其特征在于,所述S3通过如下子步骤实现:
(1)将Xn带入贡献率序列网络,Xn前向传播得到RNN的隐层输出
Figure FDA0003355205860000021
其中Ue表示将输入映射到RNN的隐层特征的权重,
Figure FDA0003355205860000022
he为RNN隐层的节点数,m为输入样本的变量个数;We表示将RNN中t-1时刻的隐层输出映射到RNN中t时刻的隐层输出的权重,
Figure FDA0003355205860000023
Figure FDA0003355205860000024
Figure FDA0003355205860000025
分别代表t时刻和t-1时刻的隐层输出,
Figure FDA0003355205860000026
代表的是t时刻的输入样本,f(*)代表RNN中的非线性激活函数;
(2)Xn经过L次前向映射,得到特征输出
Figure FDA0003355205860000027
RNN的特征输出经过预测层,得到贡献率预测输出;
训练过程中,损失函数定义为下式:
Figure FDA0003355205860000028
其中,N为用于训练模型的序列数量,其中
Figure FDA0003355205860000029
为第i个贡献率预测输出为
Figure FDA00033552058600000213
softmax(*)代表softmax映射;
Figure FDA00033552058600000210
为预测层中对输入序列第i个样本的贡献率的预测所用网络的权重和偏置,
Figure FDA00033552058600000211
3.根据权利要求1所述的基于序列局部判别信息挖掘网络的工业过程离线数据分割方法,其特征在于,所述S6通过如下子步骤实现:
(1)将hL的第n个数据
Figure FDA00033552058600000214
在局部信息挖掘网络中进行前向映射,得到特征输出
Figure FDA00033552058600000212
其中,Wle、ble为局部信息挖掘网络中用于将输入映射至隐层的权重和偏置,
Figure FDA0003355205860000031
hl为局部信息挖掘网络的隐层特征维度;σ(*)代表非线性激活函数;
(2)将
Figure FDA0003355205860000032
进一步进行前向映射得到重构值
Figure FDA0003355205860000033
其中,Wld、bld为局部信息挖掘网络中用于将隐层映射至输出的权重和偏置,
Figure FDA0003355205860000034
训练过程中,损失函数定义为下式:
Figure FDA0003355205860000035
其中,λ为可调节的超参数,
Figure FDA0003355205860000036
为由Xn的第k个近邻序列得到的贡献率序列网络的特征输出。
4.根据权利要求1所述的基于序列局部判别信息挖掘网络的工业过程离线数据分割方法,其特征在于,S5中的邻域样本搜索通过动态时间规整计算相似度。
5.根据权利要求1所述的基于序列局部判别信息挖掘网络的工业过程离线数据分割方法,其特征在于,所述S3和S6通过梯度下降法最小化损失函数。
CN202111348814.0A 2021-11-15 2021-11-15 基于序列局部判别信息挖掘网络的工业过程离线数据分割方法 Active CN114021663B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111348814.0A CN114021663B (zh) 2021-11-15 2021-11-15 基于序列局部判别信息挖掘网络的工业过程离线数据分割方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111348814.0A CN114021663B (zh) 2021-11-15 2021-11-15 基于序列局部判别信息挖掘网络的工业过程离线数据分割方法

Publications (2)

Publication Number Publication Date
CN114021663A CN114021663A (zh) 2022-02-08
CN114021663B true CN114021663B (zh) 2022-09-27

Family

ID=80064451

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111348814.0A Active CN114021663B (zh) 2021-11-15 2021-11-15 基于序列局部判别信息挖掘网络的工业过程离线数据分割方法

Country Status (1)

Country Link
CN (1) CN114021663B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3617947A1 (en) * 2018-08-30 2020-03-04 Nokia Technologies Oy Apparatus and method for processing image data
CN112461537A (zh) * 2020-10-16 2021-03-09 浙江工业大学 基于长短时神经网络与自动编码机的风电齿轮箱状态监测方法
CN112784965A (zh) * 2021-01-28 2021-05-11 广西大学 面向云环境下大规模多元时间序列数据异常检测方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190199602A1 (en) * 2019-03-01 2019-06-27 Intel Corporation Method and apparatus for closed-loop optimization flow in a network functions virtualization environment

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3617947A1 (en) * 2018-08-30 2020-03-04 Nokia Technologies Oy Apparatus and method for processing image data
CN112461537A (zh) * 2020-10-16 2021-03-09 浙江工业大学 基于长短时神经网络与自动编码机的风电齿轮箱状态监测方法
CN112784965A (zh) * 2021-01-28 2021-05-11 广西大学 面向云环境下大规模多元时间序列数据异常检测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Motor Fault Detection and Feature Extraction Using RNN-Based Variational Autoencoder;Yang Huang等;《IEEE Access》;20190912;第7卷;139086-139096 *
深度学习技术及其故障诊断应用分析与展望;张西宁等;《西安交通大学学报》;20200930;第54卷(第12期);1-13 *

Also Published As

Publication number Publication date
CN114021663A (zh) 2022-02-08

Similar Documents

Publication Publication Date Title
CN108573225B (zh) 一种局部放电信号模式识别方法及系统
CN108985380B (zh) 一种基于聚类集成的转辙机故障识别方法
CN110647830B (zh) 基于卷积神经网络和高斯混合模型的轴承故障诊断方法
CN111080021B (zh) 一种基于地质信息库的砂体构型cmm神经网络预测方法
CN108171119B (zh) 基于残差网络的sar图像变化检测方法
CN106874950A (zh) 一种暂态电能质量录波数据的识别分类方法
CN111723949A (zh) 基于选择性集成学习的孔隙度预测方法
Ristanto et al. Machine learning applied to multiphase production problems
CN116258175A (zh) 一种基于主动学习的焊缝缺陷智能识别模型进化方法
Ye et al. A deep learning-based method for automatic abnormal data detection: Case study for bridge structural health monitoring
CN113283467B (zh) 一种基于平均损失和逐类选择的弱监督图片分类方法
CN115165366A (zh) 一种旋转机械变工况故障诊断方法及系统
CN116310647A (zh) 一种基于增量学习的劳保物品目标检测方法及系统
CN115953683A (zh) 基于双向生成的跨异质域小样本学习高光谱变化检测方法
CN117272841B (zh) 一种基于混合神经网络的页岩气甜点预测方法
CN117349786A (zh) 基于数据均衡的证据融合变压器故障诊断方法
CN114021663B (zh) 基于序列局部判别信息挖掘网络的工业过程离线数据分割方法
CN117093922A (zh) 一种基于改进svm的不平衡样本油藏复杂流体识别方法
CN112817954A (zh) 一种基于多种方法集成学习的缺失值插补方法
CN115964667A (zh) 基于深度学习和重采样的河流-湖泊岩相测井识别方法
CN116185817A (zh) 一种软件缺陷预测规则的筛选方法及系统
CN113688879B (zh) 一种基于置信度分布外检测的广义零样本学习分类方法
CN114818493A (zh) 一种隧道岩体完整程度定量评价的方法
CN113592028A (zh) 多专家分类委员会机器测井流体识别的方法及系统
CN114819260A (zh) 一种水文时间序列预测模型动态生成方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant