CN112149355B

CN112149355B - 基于半监督动态反馈堆栈降噪自编码器模型的软测量方法

Info

Publication number: CN112149355B
Application number: CN202011029629.0A
Authority: CN
Inventors: 周乐; 王尧欣; 侯北平; 陈光捷; 刘薇
Original assignee: Zhejiang Lover Health Science and Technology Development Co Ltd
Current assignee: Zhejiang Lover Health Science and Technology Development Co Ltd
Priority date: 2020-09-27
Filing date: 2020-09-27
Publication date: 2023-08-22
Anticipated expiration: 2040-09-27
Also published as: CN112149355A

Abstract

本发明公开了一种基于半监督动态反馈堆栈降噪自编码器模型的软测量方法，包括：采集正常工况下的过程变量样本和关键质量变量样本，对得到的样本进行标准化处理；利用标准化处理后的过程变量样本和关键质量变量样本构建半监督动态反馈堆栈降噪自编码器模型；在线收集新的化工过程的过程变量样本，并进行标准化处理；利用构建的半监督动态反馈堆栈降噪自编码器模型对标准化后的在线过程变量样本进行软测量，得到在线过程变量样本对应的关键质量变量样本。采用本发明的测量方法，加强了对噪声的鲁棒性，提高了对多层特征信息的合理利用，从而提高了软测量的精度。

Description

基于半监督动态反馈堆栈降噪自编码器模型的软测量方法

技术领域

本发明属于工业过程检测技术领域，具体是涉及一种基于半监督动态反馈堆栈降噪自编码器模型的造纸废水过程软测量方法。

背景技术

在现代化工过程中，多传感器技术配合集散控制系统(DCS)等大数据存储技术可实现对流量、温度和压力等常规过程变量的高采样率获取和存储。但这些过程变量数据往往无法直接用于判断过程处理的效果和产品质量的优劣，而是需要借助对一些难以用常规传感器采集的关键质量变量进行抽样化验，这也就导致关键质量变量和常规过程变量之间存在较大的采样差异，同时关键质量数据在时序上也呈现出严重的稀缺性。传统基于模型的过程监控手段是基于整个工艺流程建立的，在复杂工业噪声的影响下，其精度由于过度依赖于高速采样的低精度过程变量数据，而难以对关键质量变量做出精准检测或估计。而随着大数据采集和存储手段的推广，基于数据的软测量方法试图从大量历史数据中发现过程变量和关键质量变量之间的数学联系，从而探索得到数据本身的内在规律性以减少对实际工艺流程的依赖性以及检测的成本。

在常见的基于数据的软测量技术中，主成分回归(PCR)和偏最小二乘回归(PLSR)的方法通过提取主元信息的方法将数据进行降维，同时还可通过其共享的静态潜隐特征求得相应的关键质量变量，在动态性不强的工况下具有不错的表现。而在复杂动态工况下，动态主成分回归(DPCR)和自回归动态潜隐变量回归(ARDLVR)通过增广矩阵或在概率框架下提取共享的扩展动态潜隐变量的方法，在建模中考虑了变量本身的自相关性，进而完善了过程变量和关键质量变量之间公共特征提取的过程，提高了软测量的精度。然而，传统的方法大多存在线性、抗噪性不强以及单一采样处理等建模局限性。但随着深度学习的兴起，非线性的神经网络被广泛用于数据深层特征的提取和变量间关系的建立，循环时间网络(RNN)及其各种变体被用于提取数据间的非线性动态关系,降噪自编码器(DAE)通过对数据本身进行编码重构的方法提取潜隐特征，并在训练中加入人为噪声以加强模型的抗噪能力和鲁棒性。不过大多深度学习的方法集中于对图像数据的处理，而工业数据本身的特殊结构，导致卷积等特征提取手段无法适用，数据深层特征难以可视化，特征信息在各层间的损失也造成数据重构的不完整性，除此之外，单一的神经网络也难以处理不规则的采样数据。因此，需要提出一种既能够合理利用各层特征信息，又具有较好的降噪功能的混合神经网络软测量技术。

发明内容

本发明提供了基于半监督动态反馈堆栈降噪自编码器模型的软测量方法，利用过程变量实现对关键质量变量的快速检测。

一种基于半监督动态反馈堆栈降噪自编码器模型的软测量方法，包括：

(1)采集化工过程正常工况下的过程变量样本和关键质量变量样本，对得到的样本进行标准化处理；

(2)利用标准化处理后的过程变量样本和关键质量变量样本构建半监督动态反馈堆栈降噪自编码器模型；

(3)在线收集新的化工过程的过程变量样本，并进行标准化处理；

(4)利用步骤(2)构建的半监督动态反馈堆栈降噪自编码器模型对标准化后的在线过程变量样本进行软测量，得到在线过程变量样本对应的关键质量变量样本。

步骤(1)中，利用集散控制系统收集化工过程中正常工况下的大量过程变量数据，得到过程变量样本，同时用化验手段在相同时间段内定期抽样获取少量关键质量变量数据，得到关键质量变量样本，由得到的大量过程变量样本和少量关键质量变量样本组成数据建模用的训练样本集，假设采集到了同一时间段内正常工况下的过程变量X₀和关键质量变量Y₀，其样本数量分别为K,J，且J＜K，由对应的采样率决定：

其中，R表示实数集；M为过程变量数，H为关键质量变量数，将这些数据存入历史数据库。

同时，对数据集X₀,Y₀进行标准化处理，使得各个变量的均值为0，方差为1，得到标准化的过程变量数据集X，和关键质量变量数据集Y，且与隐变量间存在非线性动态关系，同时由于X和Y是造纸废水处理系统的主要输入输出变量，因此它们之间同样也存在非线性动态联系。

步骤(2)中，所述半监督动态反馈堆栈降噪自编码器模型包括用于对输入的过程变量样本进行降噪重构的前端网络以及用于构建降噪重构过程变量样本与对应关键质量变量样本之间非线性关系的后端网络；为实现深度网络信息的反馈和原始过程数据的降噪，所述前端网络利用无监督反馈式堆栈降噪自编码器实现；所述后端网络通过有监督门控循环神经网络(GRU网络)实现。本发明利用前端网络降噪重构，从而为后端网络非线性动态拟合提供更纯净更有效的过程变量样本数据。

作为优选，步骤(2)中，所述半监督动态反馈堆栈降噪自编码器模型由如下方法构建：

(2-1)利用标准化处理后的过程变量样本训练无监督反馈式堆栈降噪自编码器，同时得到降噪重构的过程变量样本，即过程重构变量样本；

(2-2)抽取同时拥有过程变量与关键质量变量的有标签数据样本；此处的有标签数据样本由两部分组成，一部分是过程重构变量样本，另外一部分是同时刻采集得到的标准化处理后的关键质量变量；

(2-3)利用抽取的有标签数据样本，构建有监督门控循环神经网络。

作为优选，所述无监督反馈式堆栈降噪自编码器的构造如下：

其中，上述结构中的第一式表示过程变量X在前端无监督反馈式降噪堆栈自编码器中的编码结构式；其中N为编码网络的层数，X为标准化后的含噪过程变量样本；σ₁(*)为无监督反馈式堆栈降噪自编码器的非线性激活函数；A_n为第n层前向编码网络的权值，ε_n为第n层前向编码网络的人为加噪分量；a_n为偏置系数；t_n为第n层对应的过程变量的潜隐特征；t_n-1为第n-1层对应的过程变量的潜隐特征；t_n-2为第n-2层对应的过程变量的潜隐特征；P_n为维度转换矩阵；F_n为重构权值，b_n为重构偏置系数；Z'_n+1为无监督反馈式堆栈降噪自编码器中n+1层的特征重构变量，G_n为转换权重；Z'₁为无监督反馈式堆栈降噪自编码器中第一层得到的反馈降噪重构结果，最终得到Z'₁为所述降噪重构的过程变量样本。

为了避免这种深层网络的衰减，本发明在原有的堆栈降噪自编码网络的基础上加设了间隔式残差结构，即式(2)中的第二个式子。本发明利用残差结构间隔性地将浅层网络特征向深层网络传递，弥补了各层特征在提取中的损失，实现了更深层降噪网络的搭建。此外，由于连续型的残差网络难以调整隐层神经元数，不利于网络的进一步调节和优化，而本发明采用的间隔型残差网络结构，可以通过两个残差结构间的隐层以及隐层维度转换矩阵P_n来不断切换和调节隐层数，从而使网络结构更加合理。

作为优选，训练无监督反馈式堆栈降噪自编码器时，对于每一层利用输入和重构的最小平方误差作为优化目标优化各自的网络参数。具体讲，当对大量过程数据实现深度编码后，各层网络将利用这些深层和浅层特征在每一层分别进行重构，并以每层输入和重构输出的平方误差||X-Z||²(或||t_n-1-Z_n||²)作为网络训练的优化目标，这就建立了n个小型的自监督网络，使各层网络能在人为加噪后还能保留最大特征并重构，也就是能够消除人为加噪的影响，而当人为加噪与数据本身的噪声相近时，网络就能实现有效的降噪效果。

传统的堆栈降噪自编码网络的数据重构只与其相应的隐层特征有关，深层和浅层的重构信息往往都无法保证包含全部的特征信息，因此，本发明通过加权重构的方法建立了深层网络到浅层网络的反馈式连接，对传统的表示从各隐层特征到去噪信息的重构过程进行改进，即得：

Z_n＝σ₁(F_nt_n+G_nZ_n+1+b_n) (3)

其中，Z_n+1为前端网络中n+1层的特征重构变量，G_n为其相应的转换权重，代表了深层网络特征对于前一网络重构的贡献程度。而各个加权重构的连接，将使深层特征信息传递到最浅层的重构，使最浅层网络的数据重构变得更加合理，同时也构成了一条类似于深层编码通道的深层重构信息通道，其结构如式(2)中的第三个式子所示。

传统反馈式堆栈降噪自编码器中，各层重构无直接的联系，特征提取也可能会出现逐层变差的情况，而本发明通过残差结构和加权重构的方法实现了网络特征信息交互，同时反馈式的网络重构连接也使各层降噪特征加权集中于第一层的重构，使第一层的重构将在训练中变得更加科学合理，也为后续的有监督网络拟合提供了更纯净的过程信息。

作为优选，步骤(2-1)和步骤(2-3)中，均采用adam优化函数进行参数优化，反复迭代更新网络参数，直至达到优化目标或到达最大迭代次数。

步骤(2-1)的网络训练结束后，网络参数{A_n,F_n,G_n,P_n,a_n,b_n}将被保存用于测试过程样本数据的降噪重构。

利用门控循环神经网络(GRUNN)拟合降噪重构的过程变量和关键质量变量之间的非线性动态关系。在前端网络训练中，大量无标签的过程变量的使用有利于提取出关键过程变量中更加完整的过程特征，从而更好地进行降噪重构。然而，重构后的过程变量和标准化后的关键质量变量因采样差异而存在时序的不一致问题，故需在将数据输入后端的有监督GRU网络前进行预处理，方法为按关键质量变量和过程变量的相对采样比对重构的过程样本进行抽样，保留同时具有重构后的过程变量和关键质量变量的有标签数据，以保证两者样本数和时序一致，用于后端网络的构建。

在有监督的GRU网络中，经过预处理的重构过程变量Z′和关键质量变量Y将进行非线性动态关系拟合。所述有监督门控循环神经网络的结构如下：

其中，r_k和u_k分别表示k时刻监督门控循环神经网络的重置系数和更新系数，W_r和W_u分别为重置权值和更新权值，s(*)表示监督门控循环神经网络的非线性激活函数；h_k-1为k-1时刻的隐藏状态；h_k为k时刻的隐藏状态；Z'₁为k时刻对应的降噪重构的过程变量样本；为k时刻的候选信息；tanh(*)表示tanh非线性激活函数；/>为相应的候选信息转换权重；W_o为输出权值；y_k为当前的网络输出，即测量得到的关键质量变量。

在上述结构中，第一式和第二式分别构成了GRU网络的两个特殊结构：重置门和更新门，重置门决定了网络将忘记的历史信息量，更新门则将决定网络要丢弃哪些信息以及要添加的新信息。而为了防止时间轴上的梯度消失问题，GRU网络设置了隐藏状态h保存历史信息特征并进行长时间尺度的特征传输。在这一环节中，重置门将在第三式中决定k-1时刻的信息忘记量，以得到k时刻候选信息tanh(*)表示tanh非线性激活函数，/>为相应的候选信息转换权重；然后更新门将在第四式中结合k-1时刻的隐藏状态h_k-1和k时刻的候选信息/>进行状态更新，得到k时刻的隐藏状态h_k。最后在第五式中通过k时刻的隐藏状态h_k和输出权值W_o就可得到当前的网络输出y_k，而在网络输出端再加设全连接层即可实现有监督的GRU网络搭建。

在GRU网络搭建完毕后，adam优化器将用于网络参数的优化训练，最终将训练后的网络参数保存并用于后续的软测量测试。

步骤(1)中，得到的标准化处理后的过程变量样本和关键质量变量样本一部分用于步骤(2)的模型构建，一部分用于对构建后的模型进行验证优化。构建模型完成后，可以对构建的模型进行评价，作为优选，利用所求的关键质量样本集和真实的关键质量样本集之间的预测残差，可获得各质量变量所对应的均方根误差(RMSE)，以评价软测量模型的优劣：

其中，K表示时间序列的长度，即样本数；Y_k,test表示k时刻关键质量样本的预测值，Y′_k,test表示k时刻关键质量样本的真实值，e_k为k时刻的预测残差。最终得到的RMSE值越小，则表示模型预测的精度越高。当发现精度不满足要求时，可以通过调节神经元数量以及人为加噪强度等重新进行模型构建，直至模型精度满足要求。

步骤(4)中，在线收集相同工况下新的造纸废水处理过程的过程变量数据，得到测试样本集X_test，并进行z-score标准化处理，其样本数量为K′，过程变量类型和种类与训练样本集一致。

步骤(5)中，利用半监督动态反馈堆栈降噪自编码器模型对测试数据进行软测量，得到过程样本所对应的关键质量样本。首先采用已训练好的反馈式堆栈降噪自编码器对标准化后的过程变量X_test进行降噪重构，得到重构的过程样本Z′_1,test。

其中，网络参数{A_n,F_n,G_n,P_n,a_n,b_n}与训练完毕的网络一致，由于模型训练考虑了噪声的影响，当人为加噪和数据噪声相似时，大部分噪声将会在编码重构中消失，使模型在训练后就会对该类噪声有一定的抗性，因此不需要在测试时再添加人为噪声；求得第一层前端网络中的反馈降噪重构的结果，它是各隐层网络特征的加权重构，将作为后端网络的输入。

然后，将前端网络的降噪重构的过程样本Z′_1,test作为有监督GRU网络的输入，以预测相应的关键质量变量样本y_k,test，最终得到关键质量样本集Y_test。在上述计算结构中，利用已经拟合好的网络参数对输入的过程重构样本进行计算，首先得到相应的测试重置系数r_k,test和更新系数u_k,test，然后利用重置门和更新门分别求解相应时刻过程测试样本的候选信息/>和隐藏状态h_k,test，最后利用输出权重和隐藏状态得到GRU网络输出，并通过全连接网络将网络输出集中为所求的关键质量样本集Y_test。

作为优选，所述化工过程为造纸废水处理过程，也可为制药和石油化工等流程工业过程。

作为优选，本发明中，所述标准化处理采用z-score标准化处理方法。

本发明提供一种基于半监督动态反馈堆栈降噪自编码器模型的造纸废水过程软测量方法。通过半监督学习的思路，所有数据集可以分为同时拥有过程变量与关键质量变量的有标签数据和仅包含过程变量的无标签数据，然后通过前端网络降噪重构，后端网络有监督拟合的方法建立过程重构变量和关键质量变量的内在联系模型。为了削弱工业噪声对实际数据的干扰，本发明在前端网络采用反馈堆栈降噪自编码器(FSDAE)，在每一层都以输入和重构输出之间的残差最小作为训练目标形成多个小型的自监督网络，提高了深层特征提取的科学合理，而在网络训练时每层的加噪编码也加强了对噪声的鲁棒性，能够起到逐层降噪净化的效果；为了防止深层网络在特征提取时信息的过度损失，残差结构被设计将浅层特征信息传递给深层网络，同时为了防止浅层网络因缺乏准确特征指导而无法有效重构，每层重构被加权连接至上一层的重构，从而实现深层信息与浅层信息的交互训练，最终实现对含噪工业数据的有效降噪重构；而在后端的门控循环神经网络(GRUNN)利用有标签的少量降噪重构的过程数据和关键质量变量进行有监督的拟合，从而建立起准确的非线性动态关系，提高了软测量的精度。

具体实施方式

以造纸废水处理过程为例，对本发明的基于半监督动态反馈堆栈降噪自编码器模型的软测量方法做进一步说明：

该方法针对造纸废水处理过程中关键质量变量和过程变量间的差异采样以及工业噪声干扰的工况背景，首先利用集散控制系统收集正常工况下大量过程变量数据，利用化验手段获取同一时间段的少量关键质量变量数据。在半监督学习的指导下，该方法利用无监督的反馈式堆栈降噪自编码器对大量过程变量数据进行逐层降噪编码与重构，同时通过残差结构和加权重构建立浅层网络和深层网络之间的信息交互，使原始过程变量数据在保留大部分特征信息的情况下剔除尽量多的无关信息，最后通过有监督的GRU网络拟合少量净化后的过程重构变量(即经过降噪重构的过程变量样本)和标准化后的关键质量变量，从而建立精确的非线性动态网络模型。对同一工况下的在线造纸废水处理过程进行采样并获取大量新的过程变量数据作为测试样本，此时不需要化验手段获取关键质量变量数据，而是通过预先训练的反馈堆栈降噪自编码器对大量过程变量数据进行降噪重构，然后就可通过预先训练的GRU网络直接获取相应的关键质量变量数据，从而实现软测量的效果。

具体讲，本实施例是一种基于半监督动态反馈堆栈降噪自编码器模型的造纸废水处理过程软测量方法，包括以下步骤：

第一步：利用集散控制系统收集造纸废水处理过程中正常工况下的大量过程变量数据，得到过程变量样本，同时用化验手段在相同时间段内定期抽样获取少量关键质量变量数据，得到关键质量变量样本，组成数据建模用的训练样本集，假设采集到了同一时间段内正常工况下的过程变量X₀和关键质量变量Y₀，其样本数量分别为K,J，且J＜K：

其中，R表示实数集；M为过程变量数，H为关键质量变量数，将这些数据存入历史数据库；

第二步：对数据集X₀,Y₀进行z-score标准化处理，得到标准化的过程变量数据集X，和关键质量变量数据集Y，使得各个变量的均值为0，方差为1，且与隐变量间存在非线性动态关系，同时由于X和Y是造纸废水处理系统的主要输入输出变量，因此它们之间同样也存在非线性动态联系，假设其简化关系式如下：

其中，第一式为含噪的过程变量X的结构组成式，包含了数据的真实部分和自身的噪声分量δ_n，它是各种深层简单特征叠加的集合，N表示特征提取的深度，可对应于神经网络的层数；t_n∈R^D1×1表示第n层中过程变量的潜隐特征，其维度为D1；A_n为第n层非线性特征转换矩阵；后三式为过程重构变量和关键质量变量之间的非线性动态关系式，它们通过动态潜隐特征相互联系；Z_k∈R^M×K为k时刻过程变量X_k的降噪重构，由于只是去除了过程变量数据中的无关信息，所以在数据大小上和X_k一致；t′_k∈R^D2×1表示k时刻动态潜隐特征，t′_k-1∈R^D2×1表示k-1时刻动态潜隐特征，维度(即隐层神经元数)分别为为D2；B和C分别为过程重构变量和关键质量变量的非线性观测矩阵，E为非线性动态转换矩阵。

该步骤得到的标准化样本，一部分用于后续模型的训练，另外一部分可用于构建完成的模型的评价和优化。

第三步：利用前端网络降噪重构、为后端网络非线性动态拟合提供更纯净的等价过程数据。为实现深度网络信息的反馈和原始过程数据的降噪，前端网络利用反馈式堆栈降噪自编码器利用实现，并将输入和重构的最小平方误差作为优化目标，在adam优化函数的辅助下，反复迭代更新网络参数，直至达到优化目标或到达最大迭代次数；后端网络选择有监控的门控循环神经网络(GRUNN)，实现过程重构变量和关键质量变的非线性动态网络模型的构建。

首先，标准化后的大量含噪过程变量数据X被送入反馈式堆栈降噪自编码器逐层编码提取隐层特征t_n并重构。常规堆栈前向编码网络的基本的结构如下：

其中，上述结构中的第一式表示过程变量X在前端无监督反馈式降噪堆栈自编码器中的编码结构式，A_n和ε_n分别为第n层前向编码网络的权值和人为加噪分量，a_n为偏置系数，σ₁(*)为前端网络的非线性激活函数，N层的堆栈自编码网络将不断提取过程变量中的各隐层特征t_n；第二式表示从各隐层特征到去噪信息的重构过程，Z_n为第n层中含噪过程变量X对应的降噪重构，F_n和b_n分别为相应的重构权值和偏置；

由(3)式可基本建立常规堆栈前向编码网络，但信息在每层特征提取中的损失不可避免，因此深层的网络虽然理论上能够提取更深层次的特征信息，但由于深层网络特征的逐层损失，提取特征的效果将可能变差。因此为了避免这种深层网络的衰减，本发明在原有的堆栈降噪自编码网络的基础上加设了间隔式残差结构，对(3)中的第一式优化设计如下：

其中，t_n为第n层对应的过程变量的潜隐特征；t_n-1为第n-1层对应的过程变量的潜隐特征；t_n-2为第n-2层对应的过程变量的潜隐特征。第一式和原有结构一致，表示过程变量X和各层特征t_n间的基本关系未发生变化，而第二式利用了残差结构间隔性地将浅层网络特征向深层网络传递，弥补了各层特征在提取中的损失，实现了更深层降噪网络的搭建。此外，由于连续型的残差网络难以调整隐层神经元数，不利于网络的进一步调节和优化，而本发明采用的间隔型残差网络结构，可以通过两个残差结构间的隐层以及隐层维度转换矩阵P_n来不断切换和调节隐层数，从而使网络结构更加合理。

当对大量过程数据实现深度编码后，各层网络将利用这些深层和浅层特征在每一层分别进行重构，并以每层输入和重构输出的平方误差||X-Z||²(或||t_n-1-Z_n||²)作为网络训练的优化目标，这就建立了n个小型的自监督网络，使各层网络能在人为加噪后还能保留最大特征并重构，也就是能够消除人为加噪的影响，而当人为加噪与数据本身的噪声相近时，网络就能实现有效的降噪效果。然而，传统的堆栈降噪自编码网络的数据重构只与其相应的隐层特征有关，深层和浅层的重构信息往往都无法保证包含全部的特征信息，因此，本发明通过加权重构的方法建立了深层网络到浅层网络的反馈式连接，对(3)中第二式的具体优化设计如下：

Z'_n＝σ₁(F_nt_n+G_nZ'_n+1+b_n) (5)

其中，Z'_n为前端网络中第n层的特征重构变量，Z'_n+1为前端网络中第n+1层的特征重构变量，G_n为其相应的转换权重，代表了深层网络特征对于前一网络重构的贡献程度。而各个加权重构的连接，将使深层特征信息传递到最浅层的重构，使最浅层网络的数据重构变得更加合理，同时也构成了一条类似于深层编码通道的深层重构信息通道，其结构如下：

上式中，Z'₁为无监督反馈式堆栈降噪自编码器中第一层得到的反馈降噪重构结果，最终得到Z'₁为所述降噪重构的过程变量样本Z′。

在(3)式中，各层重构无直接的联系，特征提取也可能会出现逐层变差的情况，而本发明通过残差结构(式(4))和加权重构(式(6))的方法实现了网络特征信息交互，同时反馈式的网络重构连接也使各层降噪特征加权集中于第一层的重构，使第一层的重构将在训练中变得更加科学合理，也为后续的有监督网络拟合提供了更纯净的过程信息。而在网络训练结束后，网络参数{A_n,F_n,G_n,P_n,a_n,b_n}将被保存用于测试过程样本数据的降噪重构。

然后，利用门控循环神经网络(GRUNN)(简写为：GRU网络)拟合降噪重构的过程变量和关键质量变量之间的非线性动态关系。在前端网络训练中，大量无标签的过程变量的使用有利于提取出过程变量中更加完整的过程特征，从而更好地进行降噪重构。然而，重构后的过程变量和标准化后的关键质量变量因采样差异而存在时序的不一致问题，故需在将数据输入后端的有监督GRU网络前进行预处理，方法为按关键质量变量和过程变量的相对采样比对重构的过程样本进行抽样，保留同时拥有过程变量与关键质量变量的有标签数据进行后端网络的构建，以保证两者样本数和时序一致。

在有监督的GRU网络中，经过预处理的重构过程变量Z′和关键质量变量Y将进行非线性动态关系拟合。具体网络结构设计如下：

在上述结构中，第一式和第二式分别构成了GRU网络的两个特殊结构：重置门和更新门。其中，r_k和u_k分别表示k时刻GRU网络的重置系数和更新系数，W_r和W_u分别为重置权值和更新权值，s(*)表示后端网络的非线性激活函数，重置门决定了网络将忘记的历史信息量，更新门则将决定网络要丢弃哪些信息以及要添加的新信息。而为了防止时间轴上的梯度消失问题，GRU网络设置了隐藏状态h保存历史信息特征并进行长时间尺度的特征传输。在这一环节中，重置门将在第三式中决定k-1时刻的信息忘记量，以得到k时刻候选信息tanh(*)表示tanh非线性激活函数，/>为相应的候选信息转换权重；然后更新门将在第四式中结合k-1时刻的隐藏状态h_k-1和k时刻的候选信息/>进行状态更新，得到k时刻的隐藏状态h_k。最后在第五式中通过k时刻的隐藏状态h_k和输出权值W_o就可得到当前的网络输出y_k，而在网络输出端再加设全连接层即可实现有监督的GRU网络搭建。

模型构建完成后，可以对得到的模型进行评价和优化，可以利用所求得的关键质量样本集和真实的关键质量样本集之间的预测残差，可获得各质量变量所对应的均方根误差(RMSE)，以评价软测量模型的优劣：

其中，K表示时间序列的长度，即样本数；Y_k,test表示k时刻关键质量样本的预测值，Y′_k,test表示k时刻关键质量样本的真实值，e_k为k时刻的预测残差。最终得到的RMSE值越小，则表示模型预测的精度越高。当精度不满足要求时，可以通过调整前端网络中隐层数、神经元数等参数进行优化，重新进行建模，直至得到符合精度的模型，用于后续的实际检测。

第四步：在线收集相同工况下新的造纸废水处理过程的过程变量数据，得到测试样本集X_test,0，并进行z-score标准化处理，得到标准化后的X_test，其样本数量为K′，过程变量类型和种类与训练样本集一致：

X_test∈R^M×K′,X_test＝{x_1,test,x_2,test，,...,x_K',test} (9)

第五步：利用半监督动态反馈堆栈降噪自编码器模型对测试数据进行软测量，得到过程变量样本所对应的关键质量变量样本。

首先采用步骤三中已训练好的反馈式堆栈降噪自编码器对标准化后的过程变量X_test进行降噪重构，得到重构的过程变量样本Z′_1,test：

t_n-1,test为第n-1层对应的过程测试样本的潜隐特征；t_n-2,test为第n-2层对应的过程测试样本的潜隐特征；Z_n+1,test为第n+1层过程测试样本对应构成重构变量。

其中，网络参数{A_n,F_n,G_n,P_n,a_n,b_n}与训练完毕的网络一致，由于模型训练考虑了噪声的影响，当人为加噪和数据噪声相似时，大部分噪声将会在编码重构中消失，使模型在训练后就会对该类噪声有一定的抗性，因此不需要在测试时再添加人为噪声，即省略ε_n；t_n,test表示过程测试样本在第n层网络中的隐层特征，Z'_1,test表示第一层前端网络中的反馈降噪重构的结果，它是各隐层网络特征的加权重构，将作为后端网络的输入。

然后，将前端网络的降噪重构的过程样本Z'_1,test作为有监督GRU网络的输入，以预测相应的关键质量变量：

其中Z'_1,k,test为k时刻对应的降噪重构的过程样本Z'_1,test；h_k-1,test为测试样本对应的k-1时刻的隐藏状态；Z'₁为k时刻对应的降噪重构的过程变量样本；为k时刻的候选信息；tanh(*)表示tanh非线性激活函数；/>为相应的候选信息转换权重；W_o为输出权值；y_k为当前的网络输出，即测量得到的关键质量变量。

在上述计算结构中，利用已经拟合好的网络参数对输入的过程重构样本Z'_1,k,test进行计算，首先得到相应的测试重置系数r_k,test和更新系数u_k,test，然后利用重置门和更新门分别求解相应时刻过程测试样本的候选信息/>和隐藏状态h_k,test，最后利用输出权重和隐藏状态得到GRU网络输出，并通过全连接网络将网络输出集中为所求的关键质量样本集Y_test。/>

Claims

1.一种基于半监督动态反馈堆栈降噪自编码器模型的软测量方法，其特征在于，包括：

(4)利用步骤(2)构建的半监督动态反馈堆栈降噪自编码器模型对标准化后的在线过程变量样本进行软测量，得到在线过程变量样本对应的关键质量变量样本；

步骤(2)中，所述半监督动态反馈堆栈降噪自编码器模型包括用于对输入的过程变量样本进行降噪重构的前端网络以及用于构建降噪重构过程变量样本与对应关键质量变量样本之间非线性关系的后端网络；所述前端网络利用无监督反馈式堆栈降噪自编码器实现；所述后端网络通过有监督门控循环神经网络实现；

所述无监督反馈式堆栈降噪自编码器的构造如下：

其中，N为编码网络的层数，X为标准化后的含噪过程变量样本；σ₁(*)为无监督反馈式堆栈降噪自编码器的非线性激活函数；A_n为第n层前向编码网络的权值，ε_n为第n层前向编码网络的人为加噪分量；a_n为偏置系数；t_n为第n层对应的过程变量的潜隐特征；t_n-1为第n-1层对应的过程变量的潜隐特征；t_n-2为第n-2层对应的过程变量的潜隐特征；P_n为维度转换矩阵；F_n为重构权值，b_n为重构偏置系数；Z'_n+1为无监督反馈式堆栈降噪自编码器中n+1层的特征重构变量，G_n为转换权重；Z'₁为无监督反馈式堆栈降噪自编码器中第一层得到的反馈降噪重构结果，最终得到Z'₁为所述降噪重构的过程变量样本。

2.根据权利要求1所述的基于半监督动态反馈堆栈降噪自编码器模型的软测量方法，其特征在于，步骤(2)中，所述半监督动态反馈堆栈降噪自编码器模型由如下方法构建：

(2-1)利用标准化处理后的过程变量样本训练无监督反馈式堆栈降噪自编码器，同时得到降噪重构的过程变量样本；

(2-2)抽取同时拥有过程变量与关键质量变量的有标签数据样本；

3.根据权利要求1或2所述的基于半监督动态反馈堆栈降噪自编码器模型的软测量方法，其特征在于，训练无监督反馈式堆栈降噪自编码器时，对于每一层利用输入和重构的最小平方误差作为优化目标优化各自的网络参数。

4.根据权利要求2所述的基于半监督动态反馈堆栈降噪自编码器模型的软测量方法，其特征在于，步骤(2-1)和步骤(2-3)中，均采用adam优化函数进行参数优化。

5.根据权利要求1或2所述的基于半监督动态反馈堆栈降噪自编码器模型的软测量方法，其特征在于，所述有监督门控循环神经网络的结构如下：

r_k和u_k分别表示k时刻有监督门控循环神经网络的重置系数和更新系数，W_r和W_u分别为重置权值和更新权值，s(*)表示监督门控循环神经网络的非线性激活函数；h_k-1为k-1时刻的隐藏状态；h_k为k时刻的隐藏状态；Z'_1,k为k时刻对应的降噪重构的过程变量样本；为k时刻的候选信息；tanh(*)表示tanh非线性激活函数；W_h％为相应的候选信息转换权重；W_o为输出权值；y_k为当前的网络输出，即测量得到的关键质量变量。

6.根据权利要求1或2所述的基于半监督动态反馈堆栈降噪自编码器模型的软测量方法，其特征在于，步骤(4)中，首先采用已训练好的反馈式堆栈降噪自编码器对标准化后的过程变量X_test进行降噪重构，在降噪重构时，省略人为加噪分量，得到降噪重构的过程变量样本；然后，将前端网络的降噪重构的过程变量样本作为有监督门控循环神经网络的输入，以预测相应的关键质量变量。

7.根据权利要求1所述的基于半监督动态反馈堆栈降噪自编码器模型的软测量方法，其特征在于，所述化工过程为造纸废水处理过程，制药过程和石油化工。

8.根据权利要求1所述的基于半监督动态反馈堆栈降噪自编码器模型的软测量方法，其特征在于，步骤(1)中，得到的标准化处理后的过程变量样本和关键质量变量样本一部分用于步骤(2)的模型构建，一部分用于对构建后的模型进行验证优化。