CN116451063A

CN116451063A - 一种基于主元分析法和卷积模型工业过程故障检测方法

Info

Publication number: CN116451063A
Application number: CN202310200648.2A
Authority: CN
Inventors: 谢莹; 朱愿; 胡范超; 刘雪伟; 鲁振杰
Original assignee: Shenyang University of Chemical Technology
Current assignee: Shenyang University of Chemical Technology
Priority date: 2023-03-03
Filing date: 2023-03-03
Publication date: 2023-07-18

Abstract

一种基于主元分析法和卷积模型工业过程故障检测方法，涉及一种工业过程故障检测方法。该方法首先采集工业生产过程的数据，利用主元分析法对数据进行降维降噪处理；其次将主元分析法处理后的数据输入到多层卷积结构，来实现更多角度更深层次地挖掘数据的局部相关信息；随后将融合局部信息的数据输入到Transformer模型，利用注意力机制来提取数据的全局相关性；最后模型通过逻辑回归得到预测结果，保存性能最好的模型用于后续测试。本发明有效解决Transformer模型存在的忽略局部相关信息、学习全局信息时无法去除噪声信息干扰和收敛速度缓慢的问题，提高了模型故障检测的性能。实现了在数据是大规模、高维度和非线性的情况下，对工业数据进行特征提取，提高故障检测的准确率。

Description

一种基于主元分析法和卷积模型工业过程故障检测方法

技术领域

本发明涉及一种工业过程故障检测方法，特别是涉及一种基于主元分析法和卷积模型工业过程故障检测方法。

背景技术

近年来，现代工业发展迅速，已经成为经济增长的强大助力，但工业生产过程往往复杂多变，稍有不规范就有可能发生事故，造成严重的经济损失甚至人员伤亡，因此一个安全准确的故障检测和诊断(Fault Detection and Diagnosis，FDD)算法是至关重要的。同时由于目前工业生产过程的高度复杂性和智能性，基于数据驱动建模的方法受到更多关注。分散式控制系统的广泛应用，使得大量的工业生产过程数据可以被采集和存储，这为基于数据驱动的过程检测技术提供了坚实的基础。基于数据驱动建模的方法是利用工业过程中传感器收集到的历史数据直接建立模型，从而实现系统状态检测和诊断。基于数据驱动建模的方法可以进一步细分为统计方法、浅层学习方法和深度学习方法，但工业过程数据往往具有强非线性关系，浅层结构可能无法有效处理，因此深度学习方法得到更多的运用。

表示学习是一组方法，它可以从原始数据中提取到预测或分类所需的特征，深度学习是一种具有多层表示法的表示学习方法，由多个简单但非线性的模块组成，层次越深特征越抽象，因此可以拟合非常复杂的函数。工业过程故障检测和诊断领域中，应用较广泛的传统深度学习方法有自动编码器、深度置信网络、卷积神经网络和循环神经网络等，在诸多研究中也取得了不错的效果。

Transformer是由谷歌在2017年提出的完全基于注意力机制的深度学习模型，首先被应用于自然语言处理领域，在诸多任务上取得了显著的效果，因此各个领域有关Transformer模型的研究开始兴起，其中包括计算机视觉、音频处理和时间序列等。Transformer模型在各领域的应用中显现出了它的诸多优点，如其能够显著地捕获序列数据的长时程依赖性，解决顺序学习问题实现并行运算，模型融合多种模态信息能力强，模型中的多头自注意力机制能够实现特征信息的全面提取，模型可解释性强等。Transformer模型长时间建模的强大能力和诸多优点使得其在故障检测领域有着很好的应用前景，但仍有不足之处，如Transformer模型忽略了数据之间的局部相关性、注意力机制在计算注意力权重时无法去除噪声信息的干扰和收敛速度缓慢等问题。因此在面对具有大规模、高维度、非线性等复杂数据特性的工业过程数据时，传统的Transformer模型很难取得良好的故障检测效果。所以现在急需一种有效的过程故障检测方法对现代的工业生产过程采集的大规模数据进行统一建模并进行故障检测。

发明内容

本发明的目的在于提供一种基于主元分析法和卷积模型工业过程故障检测方法，本发明针对工业过程中数据的大规模、高维度、非线性等复杂数据特性以及故障检测问题，提出了一种基于改进Transformer模型的工业过程故障检测方法，实现在数据是大规模、高维度和非线性的情况下，对工业数据进行特征提取，提高故障检测的准确率。

本发明的目的是通过以下技术方案实现的：

一种基于主元分析法和卷积模型工业过程故障检测方法，所述方法包括以下步骤：

步骤一：采集工业过程中N个样本数据X∈R^N×m，其中m表示数据的变量数，N表示采集的样本总数，利用主元分析法(Principal Component Analysis，PCA)对数据X进行降维降噪处理；

步骤二：将PCA处理后的数据X_pca∈R^N×k通过全连接神经网络(Fully ConnectedNeural Network,FC)映射至高维空间得到其中d_model为变量数m映射得到的维度；随后将X_fc输入到多层卷积结构，利用卷积神经网络的局部连接的特性来提取数据的局部相关信息，因为单层卷积的卷积核大小固定，感受野有限，提取到的特征受限，因此采用多层卷积操作，每层卷积配置多个卷积核，每层卷积的卷积核大小不同，前一层卷积的输出作为后一层卷积的输入，以此不断增大感受野，来提取更加准确全面的局部特征；

步骤三：将带有局部相关信息的数据输入到Transformer模型，由于工业过程数据是具有时序性的，需要添加位置编码(Positional Encoding,PE)来补充顺序信息得到/>

步骤四：将带有位置信息和局部相关信息的X_convpe输入到编码器中，利用多头自注意力机制来捕获数据的全局相关性；

步骤五：将融合了局部信息和全局信息的数据输入到前馈网络层，在多头自注意力机制中进行的都是线性变换，学习泛化能力不强，因此需要激活函数来强化学习，增强非线性；

步骤六：将经过编码器后的数据再次执行步骤四、五n次得到经过Transformer模型后的数据/>

步骤七：在Y和实际标签之间计算交叉熵损失函数，不断更新模型网络参数，保存性能最好的模型用于后续测试；

步骤八：故障检测阶段，过程如下：

1)采集工业过程中的新数据X^new∈R^N×m，按照公式(1)使用训练数据的均值和方差σ先进行标准化处理得到标准化数据X^new，随后按照公式(4)将X^new与训练数据的降维矩阵P相乘得到PCA处理后的数据/>

2)将输入到训练阶段保存的模型进行故障检测；通过该模型对新数据进行故障检测。

所述的一一种基于主元分析法和卷积模型工业过程故障检测方法，所述步骤一PCA处理流程如公式(1)*(4)所示：

S＝COV(X) (2)

p，v，p^T＝SVD(S) (3)

X_pca＝XP (4)

其中，公式(1)是对数据X做标准化处理，表示数据X的列均值，σ表示数据X的列方差，公式(2)是求标准化数据X的协方差矩阵S∈R^m×m，公式(3)是对协方差矩阵S做奇异值分解得到它的奇异值v∈R^m和奇异矩阵p∈R^m×1，假设取奇异值总和的85％作为主成分，则满足条件的前k个奇异值对应的基向量组成降维矩阵P∈R^m×k，公式(4)是将标准化数据X与降维矩阵P相乘得到PCA处理后的数据X_pca∈R^N×k。

所述的一种基于主元分析法和卷积模型工业过程故障检测方法，所述步骤三添加位置编码(Positional Encoding,PE)来补充顺序信息得到具体公式如下：

其中，pos表示数据在时序序列中的位置，2i和2i+1分别表示向量中的偶数位置和奇数位置。

所述的一种基于主元分析法和卷积模型工业过程故障检测方法，所述步骤六n为Transformer模型中编码器的层数，前一层编码器的输出为后一层编码器的输入；随后X_Trm经过一层全连接层对d_model降维到1得到X_out∈R^N×1，再使用Sigmoid函数将X_out中的数值变化到[0，1]之间，若数值大于等于0.5，模型预测值为1，表示是故障样本，若数值小于0.5，模型预测值为0，表示是正常样本；上述过程如公式(17)-(18)所示：

本发明的优点与效果是：

(1)本发明方法利用主元分析法对数据进行降维降噪处理，减少噪声信息对模型训练时的干扰；

(2)本发明方法利用卷积神经网络的局部连接的特性来提取局部信息，多层卷积层逐渐扩大的感受野，各层卷积层中不同尺寸的多个卷积核，能够充分学习数据之间的局部相关信息；

本发明方法利用Pre-Ln结构来提高模型的收敛速度。本发明的过程监测方法有效提高了故障检测性能，充分验证了该发明的过程监测方法的有效性和可行性。

附图说明

图1为基于田纳西州伊斯曼化学品公司真实工业化工过程的仿真系统结构图；

图2为本发明基于主元分析法和卷积的Transformer模型的流程图；

图3为本发明基于主元分析法和卷积的Transformer模型的架构图；

图4为数据经过第一层卷积神经网络后的热力图；

图5为数据在多头自注意力机制中第一层的注意力得分矩阵热力图。

具体实施方式

下面结合附图和实施例，对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明，但不用来限制本发明的范围。

本发明以田纳西州伊斯曼化学品公司(Eastman Chemicals of Tennessee，TE)真实工业化工过程的仿真系统得到的数据为例，TE过程仿真系统结构如图1所示，基于改进Transformer模型的工业过程故障检测方法如图2所示，基于主元分析法和卷积的Transformer模型架构如图3所示。

具体步骤：

步骤一：采集工业过程中的样本数据。TE仿真系统中包括五种进料(A、B、C、D和E)，在两个平行反应中获得两种液体产物(G、H)和一种液体副产物(F)。TE数据中包括11个操纵变量和41个测量变量，因此每个数据有52维向量。TE仿真系统在每次运行时都会加入随机噪声，并且分为训练和测试来采集，采集间隔为3分钟，故障种类共21种，因此分别运行21次，其中训练数据每次运行25个小时，训练数据从故障引入时开始采集，因此每次实验只有480组故障数据；测试数据每次运行48小时，因此每次实验共960组测试数据，其中故障数据中前160组为正常数据，后800组为故障数据，系统还采集了两次正常工况下的数据，分别为500组和960组数据。将正常工况下的960组数据分别和每种故障的训练集组合作为训练集。训练集X∈R^N×m，其中m表示数据的变量数，在本实施例中m＝52；N表示采集的样本总数，在本实施例中N＝1440，利用主元分析法(Principal Component Analysis，PCA)对数据X进行降维降噪处理，PCA处理流程如公式(19)-(21)所示：

S＝COV(X) (2)

p，v，p^T＝SVD(S) (3)

X_pca＝XP (4)

其中，公式(19)是对数据X做标准化处理，表示数据X的列均值，σ表示数据X的列方差，公式(22)是求标准化数据X的协方差矩阵S∈R^m×m，公式(21)是对协方差矩阵S做奇异值分解得到它的奇异值v∈R^m和奇异矩阵p∈R^m×1，假设取奇异值总和的85％作为主成分，本实施例中取95％作为主成分，则满足条件的前k个奇异值对应的基向量组成降维矩阵P∈R^m ^×k，本实施例中k＝3，公式(22)是将标准化数据X与降维矩阵P相乘得到PCA处理后的数据X_pca∈R^N×k。

步骤二：将PCA处理后的数据X_pca∈R^N×k通过全连接神经网络(Fully ConnectedNeural Network,FC)映射至高维空间得到其中d_model为变量数m映射得到的维度，本实施例中d_model＝256。随后将X_fc输入到多层卷积结构，利用卷积神经网络的局部连接的特性来提取数据的局部相关信息，因为单层卷积的卷积核大小固定，感受野有限，提取到的特征受限，因此采用多层卷积操作，每层卷积配置多个卷积核，每层卷积的卷积核大小不同，前一层卷积的输出作为后一层卷积的输入，以此不断增大感受野，来提取更加准确全面的局部特征。此外为了防止网络层数加深出现梯度消失，强化模型非线性和保证中间层分布一致性，在多层卷积结构后添加了批归一化(Bach Normalization，BN)和Relu激活函数，同时还添加了残差连接模块使模型更加关注差异部分，减缓网络退化。上述过程如公式(23)-(24)所示：

(X_conv＝X_fc+Relu(0，Bn(Conv_n(...(Conv₁(X_fc))))) (6)

其中，表示经过多层卷积结构后带有局部相关信息的数据，n表示卷积层数，本实施例中n＝4。

步骤三：将带有局部相关信息的数据输入到Transformer模型，由于工业过程数据是具有时序性的，因此需要添加位置编码(Positional Encoding，PE)来补充顺序信息得到/>具体公式如下：

步骤四：将带有位置信息和局部相关信息的X_convpe输入到编码器中，利用多头自注意力机制来捕获数据的全局相关性。在多头自注意力机制前添加了层规范化(LayerNormalization,LN)得到来减少“协变量偏移”问题，同时提高模型收敛速度。在多头自注意力机制中首先通过多个不同的线性变换将X′_covpe转化为不同子空间内的(查询)、/>(键值)和/>(值)，每个子空间内只关注d_model/h＝d_k＝d_V个维度的信息，本实施例中d_k＝d_V＝64，h为多头自注意力机制的头数，本实施例中h＝4，在每个子空间内先将Q_i和K_i的转置进行点积来计算每个特征间的注意力权重矩阵，再使用softmax函数对注意力权重矩阵进行归一化，最后与V_i进行加权求和，则得到一个子空间内的特征之间关联性输出/>i∈[1，h]，将每个子空间内的输出使用Concat函数进行拼接，再经过线性变换得到多头自注意机制的输出X_H，随后添加了残差连接模块来简化网络训练，减少网络退化。上述过程如公式(27)-(31)所示：

X’_convpe＝LN(X_convpe) (9)

X_H＝concat(head₁，...head_i，...head_h)W^O (12)

X_H＝X_convpe+X_H (13)

其中，表示经过多头注意力机制后带有全局信息的数据，和/>为线性变换矩阵，d_k＝d_v＝d_model/h，/>是缩放因子，它的引入是为了防止梯度过小和注意力权重分散。

步骤五：将融合了局部信息和全局信息的数据输入到前馈网络层，在多头自注意力机制中进行的都是线性变换，学习泛化能力不强，因此需要激活函数来强化学习，增强非线性。在前馈网络层前同样添加了LN层得到/>首先经过层全连接层对d_model进行升维到d_ff，本实施例中d_ff＝512，再利用Relu激活函数进行强化学习，随后再经过层全连接层对d_ff降维到d_model得到前馈网络层的输出/>最后经过残差连接得到经过编码器后的数据/>上述过程如公式(32)-(34)所示：

X’_H＝LN(X_H) (14)

X_FFN＝max(0,X’_HW₁+b₁)W₂+b₂ (15)

X_Enc＝X_H+X_FFN (16)

其中，W₁、b₁、W₂和b₂为全连接层的参数，由模型训练得到。

步骤六：将经过编码器后的数据再次执行步骤四、五L次得到经过Transformer模型后的数据/>L为Transformer模型中编码器的层数，本实施例中L＝2，前一层编码器的输出为后一层编码器的输入。随后X_Trm经过一层全连接层对d_model降维到1得到X_out∈R^N×1，再使用Sigmoid函数将X_out中的数值变化到[0，1]之间，若数值大于等于0.5，模型预测值为1，表示是故障样本，若数值小于0.5，模型预测值为0，表示是正常样本。上述过程如公式(35)-(36)所示：

步骤七：在Y和实际标签之间计算交叉熵损失函数，不断更新模型网络参数，保存性能最好的模型用于后续测试。

步骤八：故障检测阶段，过程如下：

1)采集工业过程中的新数据X^new∈R^N×m，在本实施例中，引入测试数据，测试数据运行时间为48小时，采样间隔为3分钟，即采集960组测试样本数据。其中故障2是由B成分变化出现阶跃故障引起的，故障发生时刻为第161个样本并一直持续到最后。按照公式(19)使用训练数据的均值和方差σ先进行标准化处理得到标准化数据X^new，随后按照公式(22)将X^new与训练数据的降维矩阵P相乘得到PCA处理后的数据/>

2)将输入到训练阶段保存的模型进行故障检测。

仿真实验结果分析：

在本实施例中，故障2检测准确率和F1分数分别为92.07％和0.78。通过结果可以看出，综合准确率和F1分数两个统计量，该发明的过程监测方法体现出了较好的故障检测性能

接下来对该发明的故障检测性能进行分析。图4表示测试集中第100个到第350个样本在第一层卷积神经网络中的神经元表达，其中前60个样本为正常样本，剩下的全是故障样本，图中横轴时间步表示样本数，纵轴卷积核代表该层卷积层中卷积核个数，蓝色表示神经元被最大激活，黄色表示神经元没有激活。首先卷积层中大多数神经元呈蓝色，说明模型倾向于学习一种稠密表达(Dense Representation)，卷积神经网络提取的是复杂特征信息；其次从图中可以看出，多数卷积核只学习正常信号或只学习故障信号，少数卷积核能学习全部样本信息，得出卷积神经网络可以多角度去学习数据信息，但更专注于局部信息，并且能够分辨出两种类别信号分别提取特征。综上所述，卷积神将网络对提高模型性能有很大帮助。

图5表示测试集中第100个到第300个样本在注意力机制中第一层的注意力得分矩阵，其中前60个样本为正常样本，剩下的全是故障样本，横轴纵轴的标签时间步均表示样本数，蓝色表示注意力得分最高，黄色表示注意力得分最低。首先，注意力模块中每个头的注意力得分矩阵中蓝色区域分布不同，说明模型关注的位置有所不同，这与多头注意力机制的初衷一样，每个头从不同角度提取特征，分类信息更加全面，模型鲁棒性得到提高；第二，注意力得分矩阵的主对角线区域体现了同类别样本之间的注意力得分情况，2、3、4头中的主对角线区域更多为蓝色，其他区域更多为黄色，可以得到同类样本间注意力得分更高，不同类别样本间注意力得分较低，即同类别样本间相关性更高，不同类别样本间相关性较低，且注意力机制能够分辨出两种类别信号。综上所述，注意力机制可以提高模型性能和鲁棒性。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明权利要求所限定的范围。

Claims

1.一种基于主元分析法和卷积模型工业过程故障检测方法，其特征在于，所述方法包括以下步骤：

步骤二：将PCA处理后的数据X_pca∈R^N×k通过全连接神经网络(Fully Connected NeuralNetwork,FC)映射至高维空间得到其中d_model为变量数m映射得到的维度；随后将X_fc输入到多层卷积结构，利用卷积神经网络的局部连接的特性来提取数据的局部相关信息，因为单层卷积的卷积核大小固定，感受野有限，提取到的特征受限，因此采用多层卷积操作，每层卷积配置多个卷积核，每层卷积的卷积核大小不同，前一层卷积的输出作为后一层卷积的输入，以此不断增大感受野，来提取更加准确全面的局部特征；

步骤三：将带有局部相关信息的数据输入到Transformer模型，由于工业过程数据是具有时序性的，需要添加位置编码(Positional Encoding，PE)来补充顺序信息得到/>

步骤八：故障检测阶段，过程如下：

2.根据权利要求1所述的一种基于主元分析法和卷积模型工业过程故障检测方法，其特征在于，所述步骤一PCA处理流程如公式(1)-(4)所示：

s＝COV(X) (2)

p，v，p^T＝SVD(S) (3)

X_pca＝XP (4)

3.根据权利要求1所述的一种基于主元分析法和卷积模型工业过程故障检测方法，其特征在于，所述步骤三添加位置编码(Positional Encoding,PE)来补充顺序信息得到具体公式如下：

4.根据权利要求1所述的一种基于主元分析法和卷积模型工业过程故障检测方法，其特征在于，所述步骤六n为Transformer模型中编码器的层数，前一层编码器的输出为后一层编码器的输入；随后X_Trm经过一层全连接层对d_model降维到1得到X_out∈R^N×1，再使用Sigmoid函数将X_out中的数值变化到[0，1]之间，若数值大于等于0.5，模型预测值为1，表示是故障样本，若数值小于0.5，模型预测值为0，表示是正常样本；上述过程如公式(17)-(18)所示：