CN115186584A

CN115186584A - 一种融合注意力机制和自适应构图的宽度学习半监督软测量建模方法

Info

Publication number: CN115186584A
Application number: CN202210807679.XA
Authority: CN
Inventors: 王平; 李雪静; 尹贻超
Original assignee: China University of Petroleum East China
Current assignee: China University of Petroleum East China
Priority date: 2022-07-11
Filing date: 2022-07-11
Publication date: 2022-10-14

Abstract

本发明涉及一种融合注意力机制和自适应构图的宽度学习半监督软测量建模方法，该方法综合利用数据输入空间和预测输出空间的加权欧式距离信息自适应构建近邻图实现对数据潜在结构信息的准确逼近；同时，考虑到不同的辅助变量对主导变量的准确估计具有不同程度的贡献度，通过融入注意力机制对变量进行加权，即对重要的信息增加一定比例的权重，对于无法提升模型性能的一些信息则选择降低权重，以降低冗余变量和噪声对构图和回归学习的不良影响；最后，将注意力机制、自适应构图和宽度学习建模整合在一个统一学习框架内，并采用交替迭代优化求解获得建模学习的整体最优解。因此，本发明提供的半监督学习框架能够充分利用标签数据所包含的监督信息，辅助以无标签数据所蕴含的结构信息，改善宽度学习模型性能，达到提升软测量模型泛化能力和可靠性之目的。

Description

一种融合注意力机制和自适应构图的宽度学习半监督软测量建模方法

技术领域

本发明属于工业过程检测技术领域，涉及工业过程软测量技术，具体地说，涉及了一种融合注意力机制和自适应构图的宽度学习半监督软测量建模方法。

背景技术

现代工业生产过程正朝着数字化和智能化方向快速发展，与此同时，对产品质量控制的追求也越来越高。为此，实际生产装置通常配备了大量工业传感器，用于实时测量反映过程运行状态的操作参数，为实现产品质量闭环优化控制提供必需的反馈信息。然而，工业过程中总存在一些与产品质量密切相关但又难以实现直接测量的重要参数，如产品浓度、组分和各物性参数等。这些关键的质量相关参数目前只能依靠离线采样后送实验室化验分析得到，具有测量周期长、反馈滞后大和人力物力成本高等问题。因此，过程工况发生变化时，操作人员由于无法及时掌握过程的真实运行状态，很难给出正确的调整对策，致使生产效率降低甚至危及操作安全。软测量技术正是在这样的背景下发展起来的，其通过建立容易测量的过程变量(又称为辅助变量)与难以直接测量的质量相关变量(又称为主导变量)之间的数学模型，实现对关键质量相关参数的间接估计。与实验室化验分析或在线成分仪表相比，具有应用和维护成本低、响应及时等显著优点，因此在炼油、化工、冶金和制药等众多工业领域有着广泛应用。

软测量技术的关键在于建立能够准确描述出辅助变量与主导变量之间潜在函数关系的数学模型。若对生产过程有深刻认识且具备丰富相关领域知识，则可以采用机理建模方法建立软测量模型。然而，现代工业过程的复杂性和不确定性大大限制了机理建模方法的应用范围。因此，基于数据驱动的回归建模方法，由于其不依赖具体领域专业知识，普适性和灵活性更具优势，近几十年来在软测量领域得到了广泛应用。其中代表性技术有主元回归、偏最小二乘、人工神经网络和支持向量机等。特别地，随着大数据时代的到来，基于深度学习的人工神经网络算法，诸如卷积神经网络、循环神经网络和自编码器等，近年来已成为软测量建模领域的研究热点并取得了令人瞩目的一系列成果。

基于数据驱动的软测量建模方法的性能在很大程度上取决于训练数据的数量和质量。具体地说，为获得泛化能力强的软测量模型，需要利用大量覆盖过程主要操作工况的输入-输出数据集进行训练。特别地，对于人工神经网络等结构复杂和可调参数众多的机器学习模型而言更是如此。然而，对于实际软测量建模问题，主导变量(对应着软测量模型的输出变量)的采样速率一般远低于辅助变量(对应着软测量模型的输入变量)的采样频率。这导致实际收集到的训练数据只有一小部分同时具有输入和输出值，而绝大部分数据只有输入值，对应的输出值是缺失的。在机器学习领域，那些输入端和输出端同时有值的数据称为标签数据，而那些只有输入端有值的数据称为无标签数据。目前，基于数据驱动的软测量建模方法多采用监督学习方式，即仅使用标签数据建模而忽视了无标签数据的作用，在标签样本稀缺的情况下，很容易出现模型过拟合现象，模型的泛化能力和可靠性均得不到保证，不能满足实际应用的需要。实际上，无标签数据蕴含了丰富的数据结构信息，一系列研究表明，合理利用无标签数据所蕴含的信息能够显著提升回归模型的性能。因此，采用半监督学习方式，即同时利用少量的标签数据和大量的无标签数据，建立软测量数学模型受到越来越多的重视。

但在一些主流的深度学习网络中，即使网络模型的结构已经十分稳定，在网络训练过程中，耗时仍然是一个十分显著的缺陷，主要由于深度学习的网络结构十分复杂，且运用了很多超参数，这样进一步分析网络结构变得更加困难。Pao提出了随机向量函数链神经网络，可以在一定程度上有效解决模型训练时间长的问题，基于前者，Chen等(2018)提出了宽度学习模型，不仅大大缩短了模型训练所需时间，而且在数据特征提取时，用映射特征的方式来作为输入，在海量新数据加入后可以更高效的更新模型。为了提高宽度学习的泛化性能，Feng等(2018)提出了模糊宽度系统；针对特定数据集样本量少、标记难的问题，Kong等(2019)提出了无监督宽度学习用于高光谱图像聚类，采用稀疏编码器对随机权重进行微调，以图正则化项和输出权重的l₂范数为代价函数优化求解连接权重；基于流行正则化(Manifold Regularization,MR)框架，Zhao等(2020)提出了半监督宽度学习，进一步丰富了宽度学习理论体系。研究表明，基于MR的半监督学习框架能够同时利用标签数据所提供的监督/辨别信息和无标签数据所蕴含的结构信息来提升模型的泛化能力和可靠性，具有简洁的描述形式和扎实的理论基础，因此在软测量建模领域得到了许多成功应用。

值得注意的是，基于MR的半监督学习方法取得性能改善的一个重要前提是，所构建的近邻图能够实现对数据潜在局部流行结构准确逼近。考虑到数据流行结构是预先未知且问题相关的，人们提出了许多构建近邻图的方法，如k近邻法、局部线性表示、稀疏自表示和低秩自表示等，并在多个不同的研究领域内获得了成功应用。然而，现有方法大多是在数据原始高维输入空间内采用无监督学习方式离线构建近邻图。这可能造成下述两个问题：(1)实际建模数据中不可避免地存在着冗余辅助变量和噪声，构图过程中，这些冗余信息可能严重影响数据间相似度的计算，使得所构建的近邻图内各节点出现错误连接。(2)现有方法普遍采用离线构图的方式，构图与后续回归建模学习是作为两个独立的学习任务单独完成，忽略了构图与回归学习之间的内在联系，因此构图时无法有效利用标签样本所提供的监督信息，造成所构建的近邻图与后续回归建模任务不适配的问题。

综上所述，采用现有基于MR的半监督学习方法解决实际软测量建模问题时容易出现模型泛化能力弱和可靠性差等突出问题。这主要是因为，现有方法忽视了构图和回归建模学习之间的必然内在联系，使得所建图的结构和参数不能准确地描述出数据潜在的结构信息，无法达到利用无标签样本提高模型性能之目的。

发明内容

本发明针对现有基于流行正则化的半监督软测量建模技术存在着的构图和回归建模脱节这一关键问题，提供一种融合注意力机制和自适应构图的宽度学习半监督软测量建模方法，将注意力机制、自适应构图和宽度学习建模紧密联系起来，并形成一个统一的优化学习框架联合求解。具体地说，本发明综合利用数据输入空间和预测输出空间的加权欧式距离信息自适应构建近邻图实现对数据潜在结构信息的准确逼近；同时，考虑到不同辅助变量对主导变量的准确估计具有不同的贡献度，通过引入注意力机制对变量进行加权，即对重要的信息增加一定比例的权重，对于无法提升模型性能的一些信息则选择降低权重；最后，将注意力机制、自适应构图和宽度学习建模整合在一个统一优化框架内，并采用交替迭代求解达到建模学习的整体最优。因此，本发明提供的半监督学习框架能够充分利用标签数据所包含的监督信息，辅助以无标签数据所蕴含的结构信息，达到改善软测量模型泛化能力和可靠性之目的。

为了达到上述目的，本发明提供了一种融合注意力机制和自适应构图的宽度学习半监督软测量建模方法，含有以下步骤：

(一)离线建模阶段：收集主导变量化验分析值y_i及与其对应的辅助变量测量值

其中i＝1,2,…,n_l，n_l为所收集主导变量值的个数，d为辅助变量的维数；额外收集n_u个辅助变量测量值

定义n＝n_l+n_u为所收集辅助变量值的个数；将所收集的辅助变量值按行排序得到辅助变量数据矩阵

上标T表示矩阵转置运算，相应地，将所收集的主导变量值按行排序得到主导变量数据行向量

进一步地，定义n_u行全0行向量

将y_l和y_u合并为行向量

利用X₀的均值mean(X₀)和均方差std(X₀)对X₀进行标准化处理得

利用y₀的均值mean(y₀)和均方差std(y₀)对y₀进行标准化处理得

得到宽度学习的离线训练数据X,y；

(二)指定宽度学习每组特征节点个数n_c、增强节点个数为n_s、正则化参数β,λ,μ,θ和最大迭代次数max_iterate，初始化变量加权矩阵

计算每个样本间的距离并选择出与第i个样本x_i最近的k个样本构造初始拉普拉斯矩阵

(三)随机生成N组宽度学习输入层和特征层之间的权值矩阵

和偏置项矩阵

利用线性映射计算特征层输出

随机生成M组特征层和增强层之间权值矩阵

和偏置项矩阵

并利用非线性激活函数计算增强层输出

进而得到输出增广数据矩阵

(四)更新隐层和输出层之间的权重

偏置b和模型预测标签值

(五)利用相似矩阵

更新变量加权矩阵

(六)更新相似矩阵

(七)重复步骤(四)(五)(六)直到达到最大迭代次数max_iterate；

(八)在线测试阶段：采集测试数据X_new，利用训练数据X₀的均值mean(X₀)和均方差std(X₀)对测试数据X_new进行标准化处理，得到标准化后的测试数据

对宽度学习预测结果

进行反标准化，得到X_new对应的估计值

进一步的，所述步骤(一)中，首先利用训练数据

的均值mean(X₀)和均方差std(X₀)通过公式(1)对训练数据X₀进行标准化处理，公式(1)的表达式为：

公式中，mean(·)表示计算矩阵各列的均值，std(·)表示计算矩阵各列的均方差，得到标准化后的训练数据

对

也需要类似标准化过程如公式(2):

进一步的，所述步骤(二)中，针对初始化变量加权矩阵

的具体步骤为；

首先，通过公式(3)初始化变量加权矩阵M,公式(3)表示为：

其中，M为对角线上的元素均为

其余元素为0的对角矩阵，

其次，通过公式(4)-公式(7)计算初始拉普拉斯矩阵L，其过程为：

公式中，

D_ii为对角阵D对角线上的第i个元素，S_ij为相似矩阵S的第i行第j列元素，L为与数据集X对应的拉普拉斯矩阵，然后根据公式(8)-公式(11)求解公式(4)：

通过定义两个拉格朗日乘数将公式(9)写成拉格朗日公式(10)。对公式(10)关于s_i求偏导并令其为0，可得到

根据KTT条件，得到最优解如公式(11)所示，

其中

其中(·)₊表示括号内的值大于0时取本身，小于或等于0时取0，利用公式(12)得到只有k个非零元素的稀疏表示的s_i，

将公式(12)进一步化简为公式(13)为：

因为γ跟k有关，k为整数且0≤k≤n，参数γ可以表示为公式(14)：

将η和γ代入公式(11)得：

进一步的，所述步骤(三)中，随机生成N组宽度学习输入层和特征层之间的权值矩阵

和偏置项矩阵

利用线性映射计算特征层输出

随机生成M组特征层和增强层间的权值矩阵

和偏置项矩阵

并利用非线性激活函数计算增强层输出

进而得到输出增广数据矩阵

的具体步骤为：

首先，在(-1，1)范围内，随机生成宽度学习输入层和特征层之间的权值矩阵W_ei和偏置项矩阵B_ei，通过线性映射得到特征层Z；

Z_i＝φ_i(XW_ei+B_ei),i＝1,2,…,N (16)

公式中，

表示第i组映射特征，n_c表示每组特征节点个数，φ_i(·)表示线性映射；每组映射包含n_c个特征节点，从而N组映射共包含Nn_c个特征节点，通过N组映射可以相互抵消部分权重和偏置随机生成的过程中带来的误差，从而提高模型的精度，全部特征节点输出Z记为公式(17):

然后，利用非线性函数以及数据Z计算宽度学习增强层输出矩阵H如公式(18)-公式(19)所示：

公式中，

表示第j组映射特征，W_hj，B_hj表示其权重和偏置，n_s表示每组增强节点的个数，

表示非线性激活函数；

最后，将特征层输出Z和增强层输出矩阵H按行进行合并得增广数据矩阵A如公式(20)所示；

A＝[Z₁,Z₂,…,Z_N,H₁,H₂,…,H_M] (20)

公式中，q＝Nn_c+Mn_s；

进一步的，所述步骤(四)中，更新隐层和输出层之间的权重

偏置b和模型预测标签值

首先，将宽度学习、变量加权和自适应局部构图有机融合到一个统一的优化目标函数中，最小化目标函数如公式(21)所示：

其中Tr(·)表示矩阵求迹运算，

表示l₂范数的平方，1表示所有元素都为1的列向量，对角矩阵

即给前n_l个标签值赋予一定的权值β，λ,μ,β,θ为给定的正则化参数，且

w,b,f分别为隐层和输出层之间的权重，偏置和模型预测标签值；

然后，固定相似矩阵

变量加权矩阵

得到关于w、b和f的优化问题描述如公式(22)所示，从而可以得到w，b的解析表达式如公式(23)所示：

公式(23)中，D＝λ(λA^TH_CA+I_q×q)^-1A^TH_C，其中，

I表示单位矩阵，1表示所有元素都为1的列向量，将公式(23)带入公式(22)中的目标函数Aw+1_n×1b得到公式(24)：

其中，

最后，根据公式(23)和公式(24),可以将公式(22)中的优化问题转化为公式(25)：

对f求偏导并令其为0，可以得到f的解析表达式如公式(26)所示，

f＝(U+L+μλH_C-μλ²N)^-1Uy (26)

其中

X_C＝AH_C；

进一步的，所述步骤(五)中，利用相似矩阵

更新变量加权矩阵

的具体步骤为公式(27)-公式(28)：

首先，固定输出

相似矩阵S,目标函数由公式(21)简化为公式(27)：

然后，求解公式(27)，可以得变量加权矩阵M的更新公式(28)：

其中，t_i＝z_ii,Zⁿ＝X^TLX,z_ii为矩阵Zⁿ第i个主对角线上的元素；

进一步的，所述步骤(六)中，更新相似矩阵

的步骤为公式(25)-公式(27)：

首先，固定输出

变量加权矩阵

目标函数由公式(21)简化为公式(29)：

然后，公式(29)可以进一步化简为求解如公式(30)所示优化问题：

最后，同样根据步骤(二)中的原理得到相似矩阵S的更新公式(31)，

公式(31)中，

进一步的，所述步骤(七)中，重复步骤(四)(五)(六)直到达到最大迭代次数max_iterate，并输出模型参数

b。

进一步的，所述步骤(八)中，在线测试阶段的具体步骤为：

首先，对于采集到的n_t个测试数据

利用训练数据

的均值mean(X₀)和均方差std(X₀)通过公式(32)对测试数据X_new进行标准化处理，公式(32)表示为：

然后，根据标准化后的测试数据

通过公式(33)-公式(35)计算测试数据的输出值

公式(33)、公式(34)、公式(35)分别表示为:

Z_ti＝φ_i(X_testW_ei+B_ei),i＝1,2,…,N (33)

其中，将特征层输出Z_t和增强层输出数据H_t按行进行合并得增广数据矩阵

最后对预测结果y_test进行反标准化，得到X_new对应的估计值

如公式(36)所示：

y_new＝y_test×std(y₀)+mean(y₀) (36)

与现有技术相比，本发明的优点和积极效果在于：

本发明提供的融合注意力机制和自适应构图的宽度学习半监督软测量建模方法，将注意力机制、自适应构图和宽度学习建模紧密联系起来，并形成一个统一的优化学习框架联合求解。具体地，一方面，本发明综合利用数据输入空间和预测输出空间的加权欧式距离信息自适应构建近邻图实现对数据潜在结构信息的准确逼近。另一方面，考虑到不同辅助变量对主导变量的准确估计具有不同的贡献度，通过融入注意力机制对变量进行加权，即对重要的信息增加一定比例的权重，对于无法提升模型性能的一些信息则选择降低权重，通过模型的不断学习，不断的调整权重，减少冗余变量和噪声对构图和回归建模的不良影响。相比现有其他算法，本发明将注意力机制、自适应构图和宽度学习建模整合在一个统一优化框架内，并采用交替迭代求解达到建模学习的整体最优。本方法可以充分利用标签数据所包含的监督信息，辅助以无标签数据所蕴含的结构信息，达到改善软测量模型泛化能力和可靠性之目的。

附图说明

图1为本发明所述融合注意力机制和自适应构图的宽度学习半监督软测量建模方法(简称：AA-SS-BLS)的流程图；

图2为本发明实施例所述脱丁烷塔过程原理图；

图3为自适应局部构图半监督宽度学习模型(简称：A-SS-BLS)测试集的预测效果图；

图4为本发明所述方法测试集的预测效果图；

图5为基础的半监督宽度学习模型(简称：SS-BLS)测试集误差分布直方图；

图6为本发明所述方法测试集误差分布直方图；

图7为基础的半监督宽度学习模型的测试集真实值和预测值之间的散点图；

图8为本发明所述方法的测试集真实值和预测值之间的散点图；

图9为三种模型在最优参数下的测试集决定系数的箱状图；

图10为在自适应局部构图半监督宽度学习模型下不同迭代次数下对脱丁烷塔训练集和测试集的决定系数的影响图；

图11为在本发明所述方法下不同迭代次数下对脱丁烷塔训练集和测试集的决定系数的影响图；

具体实施方式

下面，通过示例性的实施方式对本发明进行具体描述。然而应当理解，在没有进一步叙述的情况下，一个实施方式中的元件、结构和特征也可以有益地结合到其他实施方式中。

参见图1，本发明揭示了一种融合注意力机制和自适应构图的宽度学习半监督软测量建模方法，含有以下步骤：

进一步地，定义n_u行全0行向量

将y_l和y_u合并为行向量

得到宽度学习的离线训练数据X,y，具体步骤为：

利用训练数据

式(1)中，mean(·)表示计算矩阵各列的均值，std(·)表示计算矩阵各列的均方差，得到标准化后的训练数据

对

也需要类似标准化过程如公式(2):

其具体过程为：

首先，通过公式(3)初始化变量加权矩阵M,公式(3)表示为：

其中，M为对角线上的元素均为

其余元素为0的对角矩阵，

公式中，

根据KTT条件，得到最优解如公式(11)所示，

其中

将公式(12)进一步化简为公式(13)为：

将η和γ代入公式(11)得：

(三)随机生成随机生成N组宽度学习输入层和特征层之间的权值矩阵

和偏置项矩阵

利用线性映射计算特征层输出

随机生成M组特征层和增强层间的权值矩阵

和偏置项矩阵

并利用非线性激活函数计算增强层输出

进而得到输出增广数据矩阵

的具体步骤为：

Z_i＝φ_i(XW_ei+B_ei),i＝1,2,…,N (16)

公式中，

公式中，

表示非线性激活函数；

最后，将特征层输出Z和增强层输出矩阵H按行进行合并得增广数据矩阵

如公式(20)所示；

A＝[Z₁,Z₂,…,Z_N,H₁,H₂,…,H_M] (20)

公式中，q＝Nn_c+Mn_s；

(四)更新隐层和输出层之间的权重

偏置b和模型预测标签值

其具体过程为：

首先，将宽度学习、注意力机制和自适应局部构图有机融合到一个统一的优化目标函数中，最小化目标函数如公式(21)所示：

其中Tr(·)表示矩阵求迹运算，

然后，固定相似矩阵

变量加权矩阵

公式(23)中，D＝λ(λA^TH_CA+I_q×q)^-1A^TH_C，

其中，

f＝(U+L+μλH_C-μλ²N)^-1Uy (26)

其中

X_C＝AH_C；

(五)利用相似矩阵

更新变量加权矩阵

其具体过程为：

首先，固定输出

相似矩阵S,目标函数由公式(21)简化为公式(27)：

然后，求解公式(27)，可以得变量加权矩阵M的更新公式(28)：

(六)更新相似矩阵

其具体过程为：

首先，固定输出

变量加权矩阵

目标函数由公式(21)简化为公式(29)：

公式(31)中，

(七)重复步骤(四)(五)(六)直到达到最大迭代次数max_iterate，其具体过程为：

重复步骤(四)(五)(六)直到达到最大迭代次数max_iterate，并输出模型参数

b。

(八)在线测试阶段：对于采集到的n_t个测试数据

首先，利用训练数据

然后，根据标准化后的测试数据

通过公式(33)-公式(35)计算测试数据的输出值

公式(33)、公式(34)、公式(35)分别表示为:

Z_ti＝φ_i(X_testW_ei+B_ei),i＝1,2,…,N (33)

最后对预测结果y_test进行反标准化，得到X_new对应的估计值

如公式(36)所示：

y_new＝y_test×std(y₀)+mean(y₀) (36)

本发明实施例上述方法，该模型将注意力机制、自适应构图和宽度学习建模整合在一个统一学习框架内，并采用交替迭代优化求解获得建模学习的整体最优解。该方法综合利用数据输入空间和预测输出空间的加权欧式距离信息自适应构建近邻图实现对数据潜在结构信息的准确逼近，而融合注意力机制和自适应局部构图的宽度学习在自适应局部构图的宽度学习的基础上进行输入样本的变量加权学习，通过加入注意力机制对不同的辅助变量赋予不同的权重，以减少冗余变量和噪声对构图和回归学习的不良影响。本方法通过利用标签数据所包含的监督信息，辅助以无标签数据所蕴含的结构信息，改善了宽度学习模型性能。

为了说明本发明上述融合注意力机制和自适应构图的宽度学习软测量建模方法的效果，以下结合具体实施例对本发明做出进一步说明。

实施例：以脱丁烷塔的过程数据为例进行说明。

脱丁烷塔精馏塔是脱硫和石脑油分离器装置的一部分，其主要任务是最大限度地提高脱丁烷塔塔顶(液化石油气分离器进料)中的C5(稳定汽油)含量，并且尽量减少脱丁烷塔底部(Naptha分离器进料)中的C4(丁烷)含量。其框图如图2所示。除精馏塔(T102)外，脱丁烷塔还包含了换热器(E105B)、塔顶冷凝器(E107AB)、底部再沸器(E108AB)、塔顶回流泵(P102AB)以及LPG分离器的给水泵(P103AB)等设备。脱丁烷塔塔顶中的C5含量由位于900号装置液化石油气分馏塔底部的分析仪间接测量。该装置的测量周期为10分钟。另外，测量装置的位置会导致延迟，该延迟不为人所知，但为常数，可能在20-60分钟范围内。同样，脱丁烷塔底中的C4含量也无法在塔底直接检测得到，而是通过在塔顶安装气相色谱仪进行检测。该设备的测量周期一般为15分钟，同样由于分析仪器的安装位置，获得浓度值时会有一个很大的延迟，这个延迟不是众所周知的，但是恒定的，并且可能在30–75分钟的范围内。因此，为实现对丁烷浓度的实时测量，提高脱丁烷塔的控制质量，有必要建立软测量模型来实时估计底部丁烷浓度。另外，考虑到实际生产过程中质量变量的采样效率低、时延大的问题，假设所有的历史样本中仅有五分之一的样本具有标签(既包含输入数据，也包含输出数据)，其他历史样本均为无标签样本(仅包含输入数据)。

接下来结合脱丁烷塔生产过程对本发明的具体步骤进行阐述：

1、离线建模阶段：将已采集到的数据作为训练数据集，并且进行预处理。

首先，对所有样本进行预处理，删除其中的异常样本；然后，考虑到过程的动态特性，对所有样本进行维度扩展，扩展后的样本特征个数为30；最后，进行标准化处理得到最终训练离线训练数据

将所收集的质量变量值按行排序得到质量变量数据行向量

进一步地，定义1440行全0行向量

将y_l和y_u合并为行向量

得到宽度学习的离线训练数据X,y；

2、根据训练数据集构造初始拉普拉斯矩阵。

指定宽度学习每组130个特征节点、5个增强节点，正则化参数β,λ,μ,θ分别为10^-1，10^-1，10^-3，0.05和最大迭代次数15，初始化变量加权矩阵

计算每个样本间的距离并选择出与第i个样本x_i最近的3个样本构造初始拉普拉斯矩阵

3、计算特征层和增强层输出，进而得到输出

4、更新模型参数

变量加权矩阵

相似矩阵

5、重复步骤4直到达到最大迭代次数15；

6、在线测试阶段：采集测试数据

测试集所采集主导变量值的个数为400，利用训练数据X₀的均值mean(X₀)和均方差std(X₀)对测试数据X_new进行标准化处理，得到标准化后的测试数据

对宽度学习预测结果

进行反标准化，得到X_new对应的估计值

采用均方根误差(RMSE)，决定系数(R²)，平均绝对误差(MAE)三种评价指标来综合评价软测量模型的预测性能，三种评价指标的表达式如公式(37)-公式(39)所示：

公式中，y_i和

分别为第i个样本目标变量的真实值和预测值，

为所有样本目标变量的平均值。决定系数R²能够衡量预测结果的可靠性，其计算结果越接近于1，软测量模型的预测效果越好。采用RMSE和MAE计算软测量模型的预测误差，误差值越小，软测量模型的预测精度越高。

表1给出了最优参数下传统半监督宽度学习模型(简称：SS-BLS)，自适应局部构图的宽度学习模型(简称：A-SS-BLS)和本发明融合注意力机制和自适应构图的宽度学习模型(简称：AA-SS-BLS)在10次仿真实验中对于脱丁烷塔数据的拟合情况。

表1

由表1可知，本发明提供的方法总体上取得了最好的效果，测试集MAE,R²,RMSE都有一定的提升。

综合以上分析，本发明提供的融合注意力机制和自适应构图的宽度学习模型，不仅可以综合利用数据输入空间和预测输出空间的加权欧式距离信息自适应构建近邻图实现对数据潜在结构信息的准确逼近，还可以通过融合注意力机制对不同的辅助变量赋予不同的权重，从而提高了模型的泛化能力和可靠性。

图3，图4为基础的半监督宽度学习模型(简称：SS-BLS)以及本发明所述方法(简称：AA-SS-BLS)的测试集的预测效果图，图5,图6为基础的半监督宽度学习模型以及本发明所述方法测试集误差分布直方图，图7,图8为基础的半监督宽度学习模型以及本发明所述方法测试集真实值和预测值之间的散点图，图9为三种模型在最优参数下十次仿真的测试集决定系数的箱状图，自适应局部构图半监督宽度学习模型(简称：A-SS-BLS)以及本发明所述方法对脱丁烷塔数据在不同迭代次数下对训练集和测试集的决定系数的影响图如图10和图11所示，由图可知，两种模型下测试集的决定系数都呈上升趋势且在第8次迭代左右达到稳定，综上可知，本发明所述方法与传统方法相比，具有更高的预测精度，

上述实施例用来解释本发明，而不是对本发明进行限制，在本发明的精神和权利要求的保护范围内，对本发明做出的任何修改和改变，都落入本发明的保护范围。

Claims

1.一种融合注意力机制和自适应构图的宽度学习半监督软测量建模方法，其特征在于，含有以下步骤：

进一步地，定义n_u行全0行向量

将y_l和y_u合并为行向量

得到宽度学习的离线训练数据X,y；

(三)随机生成N组宽度学习输入层和特征层之间的权值矩阵

和偏置项矩阵

利用线性映射计算特征层输出

随机生成M组特征层和增强层之间权值矩阵

和偏置项矩阵

并利用非线性激活函数计算增强层输出

进而得到输出增广数据矩阵

(四)更新隐层和输出层之间的权重

b和模型预测标签值

(五)利用相似矩阵更新变量加权矩阵

(六)更新相似矩阵

(七)重复步骤(四)(五)(六)直到达到最大迭代次数max_iterate，并输出模型参数w，b；

(八)在线测试阶段：采集测试数据

n_t为测试集所采集主导变量值的个数，利用训练数据X₀的均值mean(X₀)和均方差std(X₀)对测试数据X_new进行标准化处理，得到标准化后的测试数据

对宽度学习预测结果

进行反标准化，得到X_new对应的估计值

。

2.权利要求1所述的一种融合注意力机制和自适应构图的宽度学习半监督软测量建模方法，其特征在于，所述步骤(一)中，首先利用训练数据

式中，mean(·)表示计算矩阵各列的均值，std(·)表示计算矩阵各列的均方差，得到标准化后的训练数据

对

也需要类似标准化过程如公式(2):

。

3.权利要求2所述的一种融合注意力机制和自适应构图的宽度学习半监督软测量建模方法，其特征在于，所述步骤(二)中，针对初始化变量加权矩阵

的具体步骤为；

首先，通过公式(3)初始化变量加权矩阵M,公式(3)表示为：

其中，M为对角线上的元素均为

其余元素为0的对角矩阵，

上述公式中，

根据KTT条件，得到最优解如公式(11)所示，

其中

将公式(12)进一步化简为公式(13)为：

将η和γ代入公式(11)得：

。

4.权利要求3所述的一种融合注意力机制和自适应构图的宽度学习半监督软测量建模方法，其特征在于，所述步骤(三)中，随机生成N组宽度学习输入层和特征层之间的权值矩阵

和偏置项矩阵

利用线性映射计算特征层输出

随机生成M组特征层和增强层间的权值矩阵

和偏置项矩阵

并利用非线性激活函数计算增强层输出

进而得到输出增广数据矩阵

的具体步骤为：

首先，在(-1，1)范围内，随机生成N组宽度学习输入层和特征层之间的权值矩阵W_ei和偏置项矩阵B_ei，通过线性映射得到特征层Z；

Z_i＝φ_i(XW_ei+B_ei),i＝1,2,…,N (16)

公式中，

然后，利用非线性激活函数以及数据Z计算宽度学习增强层输出矩阵H如公式(18)-公式(19)所示：

公式中，

表示非线性激活函数；

A＝[Z₁,Z₂,…,Z_N,H₁,H₂,…,H_M] (20)

公式中，q＝Nn_c+Mn_s。

5.权利要求4所述的一种融合注意力机制和自适应构图的宽度学习半监督软测量建模方法，其特征在于，所述步骤(四)中，更新隐层和输出层之间的权重

偏置b和模型预测标签值

的具体步骤为：

首先，将宽度学习、注意力机制和自适应局部构图有机融合到一个统一的优化目标函数中，最小化如公式(21)所示优化问题：

其中Tr(·)表示矩阵求迹运算，

然后，固定相似矩阵

变量加权矩阵

公式(23)中，D＝λ(λA^TH_CA+I_q×q)^-1A^TH_C，

I表示单位矩阵，1表示所有元素都为1的列向量，将公式(23)带入公式(22)中的Aw+1_n×1b得到公式(24)：

公式(24)中的

最后，根据公式(23)和公式(24),将优化问题公式(22)转化为公式(25)：

对f求偏导并令其为0，得其最优解如公式(26)所示，

f＝(U+L+μλH_C-μλ²N)^-1Uy (26)

其中

X_C＝AH_C。

6.权利要求5所述的一种融合注意力机制和自适应构图的宽度学习半监督软测量建模方法，其特征在于，所述步骤(五)中，利用相似矩阵

更新变量加权矩阵

的具体步骤为：

首先，固定输出

相似矩阵S,目标函数由公式(21)简化为公式(27)：

然后，求解公式(27)，可以得变量加权矩阵M的更新公式(28)：

其中，t_i＝z_ii,Zⁿ＝X^TLX,z_ii为矩阵Zⁿ第i个主对角线上的元素。

7.权利要求6所述的一种融合注意力机制和自适应构图的宽度学习半监督软测量建模方法，其特征在于，所述步骤(六)中，更新相似矩阵

的具体步骤为：

首先，固定输出

变量加权矩阵

目标函数由公式(21)简化为公式(29)：

公式(31)中，

。

8.权利要求7所述的一种融合注意力机制和自适应构图的宽度学习半监督软测量建模方法，其特征在于，所述步骤(八)中，在线测试阶段的具体步骤为：

首先，对于采集到的n_t个测试数据

利用训练数据

然后，根据标准化后的测试数据

通过公式(33)-公式(35)计算测试数据的输出值

公式(33)、公式(34)、公式(35)分别表示为:

Z_ti＝φ_i(X_testW_ei+B_ei),i＝1,2,…,N (33)

y_test＝A_tw+1_nt×1b (35)

最后对预测结果y_test进行反标准化，得到X_new对应的估计值

如公式(36)所示：

y_new＝y_test×std(y₀)+mean(y₀) (36) 。