CN116882299A

CN116882299A - 一种基于增强局部感知自注意力的动态软测量建模方法

Info

Publication number: CN116882299A
Application number: CN202310968903.8A
Authority: CN
Inventors: 高世伟; 方则宇; 王琼; 赵文丰; 党小超; 董晓辉; 陈致伟; 王静宇; 张稣艾; 曾宇峰
Original assignee: Northwest Normal University
Current assignee: Northwest Normal University
Priority date: 2023-08-03
Filing date: 2023-08-03
Publication date: 2023-10-13

Abstract

本发明公开了一种基于增强局部感知自注意力的动态软测量建模方法，首先提出一种基于卷积生成自注意力机制的Transformer编码器结构，利用其自注意力机制，能够通过遍历序列，获取过程变量或质量变量之间任意两个时间点的相关性，从而实现对输入序列的全局感知。此外，使用卷积生成自注意力机制中的Query和Key，提出了一种新型点积自注意力计算方法，能够利用局部信息，减弱某一时刻异常数据所产生的潜在影响，从而实现对输入序列的局部感知。最终使用长短时记忆网络(LSTM)网络，深层提取时间序列信息，得到最终预测结果。该发明充分利用过程序列的过程动态和非线性特征，提高了软测量模型的预测精度和鲁棒性。

Description

一种基于增强局部感知自注意力的动态软测量建模方法

技术领域

本发明涉及一种软测量建模方法，该方法在工业测量与生产控制领域具有重要的应用价值。

背景技术

在现代工业过程中，有些变量难以或无法直接测量的，但这些变量往往是过程控制和优化的关键因素，实时地获取它们的信息是提高生产效率和产品质量的保证。然而，由于技术、安全等原因，传统的硬件传感器往往不能满足这些需求。软测量技术的基本思想是根据过程知识和数据分析，选择一些容易测量的变量(辅助变量)，通过建立数学模型(软测量模型)，来推断和估计难以直接测量的变量(主导变量)。目前软测量技术已经在化工、冶金、电力、环境等领域得到了广泛的应用。

目前常用的软测量模型有基于机理分析、基于数据驱动和基于混合方法三类。基于数据驱动的软测量建模方法可以适应复杂变化的环境，不需要对过程进行物理建模或假设，只需要利用大量的过程数据来自动学习抽象表示。其中深度学习方法可以根据实时数据更新或优化模型的参数，捕捉过程变量之间的复杂非线性关系。工业过程具有数据高维度、测量变量关系非线性、强相关、过程时变性与动态性等难以直接描述的多重特征。过程动态、非线性问题是软测量建模中面临的两个主要挑战。过程动态问题指的是过程变量之间的关系随时间而变化，导致模型失效或精度下降。非线性问题指的是过程变量之间的关系不符合简单的线性函数，导致模型复杂或不准确。越来越多深度学习模型被引入软测量建模中并具有良好的性能表现。然而这些方法大都基于静态假设，此类模型仅能够描述输入输出变量间的瞬时关系，其有效性需要依赖于过程的稳态假设。然而通常生产过程都是动态的，动态软测量模型在静态模型基础上考虑了过程前几时刻的过程状态信息，具有一定动态特征描述能力。同时动态模型可以在进行预测时加入质量变量的时序信息，能够保证非稳态下的预测精度。

发明内容

本发明涉及一种基于增强局部感知自注意力的动态软测量建模方法，该方法能够充分利用过程序列的过程动态和非线性特征，从而提高软测量模型的预测精度和鲁棒性。该方法采用Transformer编码器结构，利用其自注意力机制，能够通过遍历序列，获取过程变量或质量变量之间任意两个时间点的相关性，从而实现对输入序列的全局感知。该方法还使用卷积生成自注意力机制中的Query和Key，提出了一种新型点积自注意力计算方法，能够利用局部信息，减弱某一时刻异常数据所产生的潜在影响，从而实现对输入序列的局部感知。该方法最后使用长短时记忆网络(LSTM)网络，深层提取时间序列信息，得到最终预测结果。

本发明主要包括四个部分:(1)对工业过程数据进行预处理；(2)构建增强局部感知自注意力的动态软测量模型；(3)训练模型；(4)验证本发明所提出模型的性能。

下面分别介绍以上四个部分的内容：

(1)确定输入输出辅助变量与质量变量。在训练软测量模型时，挑选整个工业状况中与质量变量较为相关的过程变量为辅助变量。

(2)首先本模型使用滑动窗口将工业过程数据转化为有监督的时间序列预测问题：滑动窗口延时间方向每次滑动一个时间步，对时间窗内的样本数据与位置编码相结合后进行特征提取。然后由不同卷积核大小的卷积神经网络提取到的特征分别作为查询、键值和值，进入多头自注意力计算注意力分数。最后将编码器得到的特征向量，进入长短时记忆网络回归器中深度挖掘时序信息，并结合全连接层得到最终质量变量的预测结果。

(3)通过历史数据训练出基于增强局部感知自注意力的动态软测量模型，模型图如图1所示。

(4)使用训练集训练该软测量模型，并使用测试集进行验证。将测试集的数据输入到已经训练好的模型中，得到关键变量的预测值，并与真实的标签进行比较。如果真实值和预测值之间的误差很小，就说明该软测量模型是有效的。

本发明基于增强局部感知自注意力的动态软测量模型详细实施步骤如下：

步骤1：对工业过程数据进行预处理。为了更好地学习过程动态特性并且符合过程动力学。使用滑动窗口将过程数据样本处理为有监督的时间序列预测形式，挖掘过程时序动态信息，这意味着利用先前采样时刻的特征来预测当前时刻的质量变量。在具有固定大小为m的滑动时间窗口设置下，假设有n个传感器得到的过程变量表示为这里时间变量t是相对的，不同时间序列中的同一个t可能代表不同时间点。由于t时刻的y值是未知的，将质量变量在t-m+1时刻到t时刻之间的平均值表示为/>以满足模型需要，Y_t表示需要预测的质量变量。

步骤2：构建增强局部感知自注意力的动态软测量模型，详细的网络模型构建分为三个步骤，具体构建过程在步骤2.1、2.2和步骤2.3中进行说明。

步骤2.1：构建数据编码模块，本发明涉及一种基于Transformer编码器的软测量质量变量预测方法，该方法利用Transformer编码器的自注意力机制，能够适应不同的输入数据分布，捕捉输入序列中的长期依赖关系。该方法将软测量中的输入数据表示为一个由若干个数值型向量组成的矩阵，其中每行代表了某一个时间点上多个易测变量传感器观测到的数据。该方法在序列转换为向量型时，将这些数值型向量与位置编码相加，以便保留时间顺序信息。位置编码可以是相对或绝对的，用于表示序列中每个元素的位置信息。

其中pos是位置，i是维度，d_model为变量维数。对于每个奇数时间步使用余弦函数创建一个向量，每个偶数时间步使用正弦函数创建一个向量。然后将这些向量与它们对应的向量相结合，这样加了位置编码的数值型向量会作为第一个编码器块的输入。

步骤2.2：本发明涉及一种增强局部感知自注意力模块，用于软测量过程动态特征的提取。该模块能够有效地处理变量的自相关性随着生产环境、时间的显著演变而发生变化的问题，以及不同时刻点之间的关系受到异常点影响的问题。本发明采用了一种基于局部区域变化趋势的相似性计算方法，代替了原生Transformer编码器中的缩放点积注意力层中基于逐点值的相似性计算方法。如图2所示，(a)中曲线与红色虚线相交部分的红点只关注到与它绝对数值相接近的另一单时间点，而(b)中曲线与红色虚线相交部分的红点则关注到了与它局部区域变化趋势相似的多个时间点，因此，本发明能够更好地捕捉时间序列中的局部性，提高软测量模型的性能。

步骤2.2.1具体来说，局部感知自注意力的推导过程为：

上述公式中是处理为有监督的时序预测形式的原始输入，B是时间窗的个数，I为时间步长，N是辅助变量的维度。/>与/>是/>经过两个大小不同的卷积核后得到的序列，Cov^{kernel size(1)}与Cov^{kernel size(k)}分别表示kernel size为1与k，的卷积核，步长设置为1，填充为0。

步骤2.2.2将与/>分别切分为h个不同子向量，查询向量Q_h、键值向量K_h和值向量V_h的计算公式为：

其中h＝1,···,H为多头的个数。模型可学习的参数矩阵为和/>其中d_k＝d_v＝d_model/h。这种方式生成的Q_h、K_h和V_h的可以充分考虑局部关系，从而根据局部信息来衡量它们的相似度，而不是使用单一值，这有利于提升预测精度。

步骤2.2.3本发明涉及一种基于缩放点积注意力的序列向量输出方法，用于计算每个子向量的注意力分数并进行归一化和加权。该方法首先对每个子向量进行缩放点积注意力操作，得到其注意力分数，然后对每一行的注意力分数进行softmax归一化，得到其注意力权重，最后将归一化后的注意力权重乘以对应的V子向量，并拼接起来，得到最终的序列向量输出。对于每个子向量，计算注意力分数并进行缩放点积注意力，并对每一行的注意力分数进行softmax归一化。最后，归一化后的注意力权重乘以对应的V子向量，并连接得到一系列向量输出。推导公式如下：

步骤2.2.4本发明涉及一种基于前馈神经网络层和残差连接的多头自注意力模块，用于对多头自注意力层输出的向量进行进一步转换和优化。该模块首先对每个多头自注意力层输出的向量进行两次线性变换和一次激活函数(ReLU)操作，得到前馈神经网络层的输出，然后对每个子层的输入和输出进行残差连接和layerNorm操作，以保留原始信息并提高梯度传播效率。具体步骤如下：

给定多头自注意力层输出的向量，其中：

对每个向量，进行两次线性变换和一次激活函数(ReLU)操作，得到前馈神经网络层的输出，其中W₁和W₂为模型可学习的参数矩阵。最后，在每个子层之后，为了更好的保留原始信息并提高梯度传播效率，经过残差连接将子层的输入和输出相加，并使用layerNorm对每个向量进行缩放和平移，使它们在不同维度上有相同的均值和方差。本发明通过使用前馈神经网络层和残差连接，能够有效地对多头自注意力层输出的向量进行进一步转换和优化，提高了多头自注意力模块的性能和效率。

推导公式如下：

FFN(x)＝max(0,xW₁+b₁)W₂+b₂

Eout¹＝LayerNorm(x+MHA(x))

Eout²＝LayerNorm(Eout¹+FeedForward(Eout¹))

步骤3：建立回归模型。本发明中编码器的输出可以作为软测量质量变量预测任务的特征向量，用于后续的预测模型。Transformer编码器的输出是软测量质量变量预测任务中输入序列到输出序列的中间层。本专利将长短时记忆网络(LSTM)与全连接层作为软测量模型的回归器，因为LSTM可以处理序列数据，捕捉动态特征，而全连接层可以进行非线性变换，增加模型的深层提取时间序列信息表达能力。假设x_t是t时刻的输入向量，Y_t是t时刻的输出向量，那么LSTM与全连接层作为软测量模型的回归器的公式可以表示为：h_t,c_t＝LSTM(x_t,h_t-1,c_t-1)、Y_t＝FC(h_t)。其中LSTM表示长短期记忆网络，它有一个隐藏状态h_t和一个细胞状态c_t，它们都是随时间更新的向量。FC表示全连接层，它有一个可学习的权重矩阵和偏置向量。

步骤4：训练基于增强局部感知自注意力的动态软测量模型，本发明在软测量模型构建完成之后，将步骤1处理好的训练数据输入到软测量模型中，并使用BP算法随机梯度下降进行权值的更新，直至梯度收敛为止，此时的网络中的权重即本发明软测量模型中的最合适权重。其权重更新公式如下：

(Lr为神经网络的学习率)，根据损失函数Loss进行梯度下降，找到合适的权重参数。其损失函数如下：

其中：Y_real为数据的标签，Y_pre为模型的输出值。

步骤5：模型有效性验证，将整个软测量模型训练完成后，并将模型各部分的参数保存下来。将提前处理好的测试数据通过该模型进行前向传播，得到预测值y_pre。通过指标RMSE、MSE、MAE、R²评价本发明的性能。其各公式定义如下：

式中Y_real、Y_pre分别为标签值和预测输出值。较小的RMSE往往表示更好的预测性能。

决定系数R²反应模型的可靠性，Y_mean为测试数据输出值的均值，R²越大表明软测量模型具有较好的预测性能。

附图说明

图1是本发明中基于增强局部感知自注意力的动态软测量模型的流程图

图2是本发明中增强局部感知自注意力模块的具体结构图

图3是本发明实施案例中硫回收流程图

图4是本发明实施案例中在硫回收中硫化氢浓度预测软测量模型与其他建模方法对比图

图5是本发明实施案例中在硫回收中硫化氢浓度预测软测量模型预测结果与其他软测量模型预测结果分布图

具体实施方式

下面结合附图和实例对本发明进一步说明。

将本发明的软测量建模方法应用于硫回收装置的空气供给量控制，根据酸性气体的燃烧情况，调节燃烧炉中空气的供给量，以达到去除污染物，减少尾气排放对环境的污染的目的。根据硫回收装置的简要流程图(如图3所示)，分析酸性气体与空气的燃烧反应过程，以及空气供给量对于尾气中SO₂和H₂S的浓度的影响。其中，酸性气体在燃烧炉F101中与空气进行燃烧，生成SO₂、H₂O、CO₂等产物，并在水冷凝设备E101、催化反应器R101、R102和冷凝器E102、E103中进行进一步转化，形成硫磺产物。根据尾气中SO₂和H₂S的浓度，精准地测量酸性气体的燃烧情况，并根据测量结果，调节燃烧炉F101中空气的供给量。

本发明通过使用实测数据和精准测量方法，应用于收集意大利某炼油厂的实测数据，通过实验证明本发明能够有效地控制硫回收装置中空气的供给量，提高了硫回收装置的效率和环保性。选取该生产环境下的5个相关辅助变量，预测目标为硫化氢的浓度。选好辅助变量以后，下一步就开始建立基于增强局部感知自注意力的动态软测量模型，通过收集10081条的历史数据经过预处理后训练软测量模型

将前8000个测试数据输入训练完成的软测量模型得到预测值，其模型预测值与标签值进行对比在测试集中评价指标MAR＝0.00789，MSE＝0.0143，RMSE＝0.0143，R²＝0.947，本发明也与传统的LSTM、CNN+LSTM、Transformer方法进行了对比。对比结果如图4所示，可以看出该方法在模型构建相比于传统方法，提高了预测能力。图5给出该软测量模型与对比软测量模型的预测结果分布图，可以看出误差表现优于其他软测量模型。综上所述，本发明提供的软测量模型能够在硫回收装置中硫化氢浓度预测上有着较好的应用。

Claims

1.一种基于增强局部感知自注意力的动态软测量建模方法，其特征在于：包括以下步骤：

步骤1：对工业过程数据进行预处理，有固定大小为m的滑动时间窗口设置下，假设有n个传感器得到的过程变量表示为这里时间变量t是相对的，不同时间序列中的同一个t可能代表不同时间点。由于t时刻的y值是未知的，将质量变量在t-m+1时刻到t时刻之间的平均值表示为/>以满足模型需要，Y_t表示需要预测的质量变量；

步骤2：构建增强局部感知自注意力的动态软测量模型，详细的网络模型构建分为三个步骤，具体构建过程在步骤2.1、2.2和步骤2.3中进行说明；

步骤2.1：构建数据编码模块，方法将软测量中的输入数据表示为一个由若干个数值型向量组成的矩阵，其中每行代表了某一个时间点上多个易测变量传感器观测到的数据，方法在序列转换为向量型时，将这些数值型向量与位置编码相加，以便保留时间顺序信息，置编码可以是相对或绝对的，用于表示序列中每个元素的位置信息。

其中pos是位置，i是维度，d_model为变量维数，每个奇数时间步使用余弦函数创建一个向量，每个偶数时间步使用正弦函数创建一个向量，后将这些向量与它们对应的向量相结合，这样加了位置编码的数值型向量会作为第一个编码器块的输入；

步骤2.2：本发明涉及一种增强局部感知自注意力模块，用于软测量过程动态特征的提取，发明采用了一种基于局部区域变化趋势的相似性计算方法，代替了原生Transformer编码器中的缩放点积注意力层中基于逐点值的相似性计算方法，本发明能够更好地捕捉时间序列中的局部性，提高软测量模型的性能；

步骤2.2.1具体来说，局部感知自注意力的推导过程为：

上述公式中是处理为有监督的时序预测形式的原始输入，B是时间窗的个数，I为时间步长，N是辅助变量的维度。/>与/>是/>经过两个大小不同的卷积核后得到的序列，Cov^{kernel size(1)}与Cov^{kernel size(k)}分别表示kernelsize为1与k，的卷积核，步长设置为1，填充为0；

上述公式中h＝1,···,H为多头的个数。模型可学习的参数矩阵为和/>其中d_k＝d_v＝d_model/h。这种方式生成的Q_h、K_h和V_h的可以充分考虑局部关系，从而根据局部信息来衡量它们的相似度，而不是使用单一值，这有利于提升预测精度；

步骤2.2.4本发明涉及一种基于前馈神经网络层和残差连接的多头自注意力模块，用于对多头自注意力层输出的向量进行进一步转换和优化，模块首先对每个多头自注意力层输出的向量进行两次线性变换和一次激活函数(ReLU)操作，得到前馈神经网络层的输出，然后对每个子层的输入和输出进行残差连接和layerNorm操作，以保留原始信息并提高梯度传播效率。具体步骤如下：

给定多头自注意力层输出的向量，其中对每个向量，进行两次线性变换和一次激活函数(ReLU)操作，得到前馈神经网络层的输出，其中W₁和W₂为模型可学习的参数矩阵。最后，在每个子层之后，为了更好的保留原始信息并提高梯度传播效率，经过残差连接将子层的输入和输出相加，并使用layerNorm对每个向量进行缩放和平移，发明使用前馈神经网络层和残差连接，能够有效地对多头自注意力层输出的向量进行进一步转换和优化，提高了多头自注意力模块的性能和效率；

推导公式如下：

FFN(x)＝max(0,xW₁+b₁)W₂+b₂

Eout¹＝LayerNorm(x+MHA(x))

Eout²＝LayerNorm(Eout¹+FeedForward(Eout¹))

步骤3：建立回归模型。本发明中编码器的输出可以作为软测量质量变量预测任务的特征向量，用于后续的预测模型，本专利将长短时记忆网络(LSTM)与全连接层作为软测量模型的回归器，假设x_t是t时刻的输入向量，Y_t是t时刻的输出向量，那么LSTM与全连接层作为软测量模型的回归器的公式可以表示为：h_t,c_t＝LSTM(x_t,h_t-1,c_t-1)、Y_t＝FC(h_t)。其中LSTM表示长短期记忆网络，它有一个隐藏状态h_t和一个细胞状态c_t，FC表示全连接层，它有一个可学习的权重矩阵和偏置向量；

步骤4：训练基于增强局部感知自注意力的动态软测量模型，本发明在软测量模型构建完成之后，将步骤1处理好的训练数据输入到软测量模型中，并使用BP算法随机梯度下降进行权值的更新，直至梯度收敛为止；

此时的网络中的权重即本发明软测量模型中的最合适权重。其权重更新公式如下：

其中：Y_real为数据的标签，Y_pre为模型的输出值。

步骤5：模型有效性验证，将整个软测量模型训练完成后，并将模型各部分的参数保存下来。将提前处理好的测试数据通过该模型进行前向传播，得到预测值y_pre。通过指标RMSE、MSE、MAE、R²评价本发明的性能。