CN117272244B - 一种融合特征提取和自适应构图的软测量建模方法 - Google Patents

一种融合特征提取和自适应构图的软测量建模方法 Download PDF

Info

Publication number
CN117272244B
CN117272244B CN202311550643.9A CN202311550643A CN117272244B CN 117272244 B CN117272244 B CN 117272244B CN 202311550643 A CN202311550643 A CN 202311550643A CN 117272244 B CN117272244 B CN 117272244B
Authority
CN
China
Prior art keywords
matrix
data
formula
training data
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311550643.9A
Other languages
English (en)
Other versions
CN117272244A (zh
Inventor
王平
李雪静
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China University of Petroleum East China
Original Assignee
China University of Petroleum East China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China University of Petroleum East China filed Critical China University of Petroleum East China
Priority to CN202311550643.9A priority Critical patent/CN117272244B/zh
Publication of CN117272244A publication Critical patent/CN117272244A/zh
Application granted granted Critical
Publication of CN117272244B publication Critical patent/CN117272244B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/27Regression, e.g. linear or logistic regression
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/0895Weakly supervised learning, e.g. semi-supervised or self-supervised learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2119/00Details relating to the type or aim of the analysis or the optimisation
    • G06F2119/02Reliability analysis or reliability optimisation; Failure analysis, e.g. worst case scenario performance, failure mode and effects analysis [FMEA]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Biology (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Medical Informatics (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种融合特征提取和自适应构图的软测量建模方法,属于软测量技术领域,首先,考虑到原始高维数据中的冗余特征会影响相似矩阵对数据间局部结构信息的准确逼近,本发明致力于结合特征和标签信息之间的相关性选择高维样本的低秩表示;同时,将特征学习和自适应构图整合在一个统一学习框架内,综合利用动态自适应构图优化思想指导算法特征提取,并保证算法同步进行特征学习和回归建模;最后采用交替迭代优化求解获得建模学习的整体最优解。因此,本发明提供的半监督学习框架能够充分利用标签数据所包含的监督信息,辅助以无标签数据所蕴含的结构信息,达到提升软测量模型泛化能力和可靠性之目的。

Description

一种融合特征提取和自适应构图的软测量建模方法
技术领域
本发明属于软测量技术领域,具体涉及一种融合特征提取和自适应构图的软测量建模方法。
背景技术
为确保生产装置安全、平稳、高效、优质地运行,现代工业一般需要配备多种传感器和在线分析仪,用于实时检测能够反映装置运行状态的重要过程变量,如温度、压力和流量等,为闭环控制、实时优化等策略的实施提供必要的反馈信息。然而,受测量技术、经济成本等因素限制,实际中经常存在一些关键的质量变量,如反应物组分、产品质量指标等无法直接测量,而只能通过离线采样化验分析得到,存在采样频率低、时间滞后大等问题。针对上述问题,软测量技术通过建立容易测量的过程变量与难以测量的质量变量之间的数学模型,为实现质量变量的实时估计提供了一种有效的间接测量手段,在现代工业多个领域得到广泛应用并发挥着重要作用。
现代工业过程的规模和复杂性不断增加,一般很难通过机理分析的方式构建可靠的软测量模型。因此,如偏最小二乘回归、核回归、神经网络等数据驱动方法,由于不需要依赖过多的领域专业知识,而致力于挖掘过程运行期间所收集数据中蕴含的有用信息进行建模,在软测量建模领域得到越来越多应用。特别地,神经网络凭借其灵活多样的网络架构和突出的非线性逼近能力,成为了解决复杂软测量建模问题的有力工具。目前,诸如反向传播网络、径向基函数网络、自动编码器、循环神经网络、卷积神经网络、长短期记忆网络、残差网络、极限学习机、回声状态网络、宽度学习系统、生成性对抗网络、图神经网络等多种根据特定问题而设计的浅层或深层网络结构在软测量建模中得到广泛应用并取得了良好的效果。值得注意的是,上述神经网络的训练多采用监督学习的方式,需要大量的标签样本才能保证获得令人满意的预测性能。然而,在很多实际工业应用场景中,质量变量的采样周期很长,这导致实际收集到的训练数据只有一小部分是同时具有输入和输出值(即标签样本),而绝大部分数据只有输入值,对应的输出值则是缺失的(即无标签样本)。这种情况下,若仅利用有限的标签样本训练神经网络,容易出现过拟合问题,很难得到具有良好泛化能力的软测量模型。此外,面对复杂非线性建模问题时,神经网络需要利用大量隐层神经元将输入变量映射到高维特征空间中进行回归建模,如果标签样本数量远小于特征空间维度,将出现“维数灾难”现象,导致网络训练计算复杂度急剧增加。
为克服因标签样本不足导致模型出现过拟合等问题,建模时可以引入正则化、迁移学习、积极学习、集成学习和半监督学习等技术。其中,半监督学习旨在综合利用少量的标签样本和大量的无标签样本来提高建模精度,特别适合解决无标签样本丰富而标签样本稀缺的工业软测量建模问题。经过多年的发展,已经形成了概率生成、自训练、协同训练和基于图的半监督学习等多种学习框架。其中,基于图的半监督学习方法具有理论基础扎实、实现简单、性能优越等优点,一直是半监督学习方法的研究热点。一般地,基于图的半监督学习过程可以划分为两个相对独立的阶段:第一个阶段,构造相似图,刻画出全部样本之间的相似关系;第二个阶段,基于所构造的相似图,将标签信息由标签样本传播到无标签样本上。因此,构图质量在很大程度上决定了模型性能。然而,现有方法一般在后续模型学习过程中不再对初始构造的图进行改进,其局限性体现在下述几个方面。
1)许多复杂工业过程涉及的软测量问题,由于相关特征/输入变量事先未知,一般引入过多的候选特征以期更好地表征问题。然而,随着样本维度的增加,噪声特征和冗余特征也被大量引入,使得很多常用的距离度量并不能较好地刻画样本之间的相似性关系。因此,面对高维样本时,如果没有对输入数据进行有效的特征提取,很难构造出能够真实反映样本之间相似关系的高质量图结构。
2)目前方法普遍采用无监督学习方式构图,即构图时没有考虑标签信息对构图的监督作用。这些方法将相似图的构造和未知标签的推断看作两个独立学习阶段,没有考虑相似图与标签信息之间的相似性。由于两个学习阶段的目的不一致,使得所构造的图往往不能很好地匹配后续建模学习任务的需求,从而很难有效地提升模型性能。
发明内容
为了解决上述问题,本发明提出了一种融合特征提取和自适应构图的软测量建模方法,将特征提取、自适应构图和回归建模三个学习任务综合在一个统一的优化框架内完成,并设计了有效的迭代优化求解算法,最终实现软测量建模的整体优化。
本发明的技术方案如下:
一种融合特征提取和自适应构图的软测量建模方法,包括如下步骤:
步骤1、收集通过化验室离线分析得到的质量变量化验分析值和通过工业传感器获得的过程变量测量值,并对质量变量化验分析值和过程变量测量值进行归一化处理;
步骤2、初始化拉普拉斯矩阵、映射矩阵和低维空间矩阵;
步骤3、将特征提取和自适应构图进行融合,采用回归建模的方式构建得到模型优化目标函数,根据构建的优化目标函数更新隐层和输出层之间的权重、偏置和模型预测标签值;
步骤4、更新映射矩阵、相似矩阵和低维空间矩阵;
步骤5、重复步骤3和步骤4,直到达到最大迭代次数,此时输出最终的模型权重、偏置和映射矩阵;
步骤6、采集测试数据并做归一化处理得到归一化后的测试集,经神经网络得到扩维后的数据集,最后利用训练集模型参数对测试集进行估计。
进一步地,步骤1的具体过程为:
步骤1.1、按采样时间排序记收集的初始质量变量化验分析值集合为Yorg中的每一个初始质量变量化验分析值均为标签数据,/>为第/>个标签数据,/>为标签数据的序号,nl为标签数据的总个数,T为矩阵转置算子;按采样时间排序记收集的初始过程变量测量值集合为Uorg中的每一个初始过程变量测量值均为训练数据,/>为第i个训练数据,i为训练数据的序号,n为训练数据的总个数,d为采集数据的特征维数;训练数据中既包含标签数据,也包含无标签数据;
步骤1.2、对Yorg中的每一个数据按照公式(1)进行归一化处理,
式中,为归一化后的第/>个标签数据,/>表示归一化后的质量变量化验分析值集合,作为训练真实标签值;yorgmax表示Yorg中的最大值,yorgmin表示Yorg中的最小值;
对Uorg按照与公式(1)相同的方式处理得到归一化后的过程变量测量值集合ui为归一化后的第i个训练数据;
步骤1.3、将归一化后的过程变量测量值集合经神经网络映射为增广数据矩阵xi为经神经网络映射后的第i个训练数据,m为经神经网络映射后的特征维数。
进一步地,步骤2的具体过程为:
步骤2.1、利用增广数据矩阵X=[x1,x2,…,xi,…xn]T计算初始拉普拉斯矩阵L0;具体为:
首先通过公式(8)计算初始相似矩阵S0
式中,为第i个训练数据与其他数据之间相似性组成的向量的转置;1n为n个元素均为1的列向量;sij为第i个训练数据和第j个训练数据之间的相似性;/>表示l2范数的平方;xi为经神经网络映射后的第i个训练数据,xj为经神经网络映射后的第j个训练数据;γ为参数;/>si为第i个训练数据与其他数据之间相似性组成的向量;利用得到的相似矩阵S0求初始拉普拉斯矩阵L0如公式(9)所示:
式中,对角矩阵D0的对角元素
步骤2.2、随机生成初始映射矩阵初始映射矩阵中的每一个元素均在(-1,1)范围内随机赋值;k为映射后低维数据的特征维数;
步骤2.3、初始化低维空间矩阵,在(-1,1)范围内,随机生成初始低维空间矩阵关于V0的目标函数表示为公式(18):
对公式(18)中的V0求偏导并利用非线性规划条件获得迭代公式(19):
式中,←为迭代更新运算符号;⊙表示两个矩阵中对应位置的元素相乘。
进一步地,步骤3的具体过程为:
步骤3.1、将特征提取和自适应构图进行融合,采用回归建模的方式构建得到模型的优化目标函数,优化目标函数如公式(20)所示:
其中,T表示映射矩阵;V表示低维空间矩阵;S表示相似矩阵;f表示模型预测标签值;w表示隐层和输出层之间的权重;b表示隐层和输出层之间的偏置;vi、vj分别表示V中的第i个、第j个训练数据的低维向量表示;Tr(·)表示矩阵求迹运算;L表示拉普拉斯矩阵;为对角矩阵,diag(·)表示对角矩阵的表示函数;/>为训练集质量变量化验分析值集合;λ、μ、β、α、ξ均为给定的正则化参数;/>表示F范数;
步骤3.2、固定相似矩阵S、映射矩阵T和低维空间矩阵V,得到关于w、b和f的优化问题描述如公式(21)所示:
通过对公式(21)中的w求偏导,得到关于w的解析表达式如公式(22)所示:
公式(22)中,中间变量E=λ(λVTHCV+Ik×k)-1VTHC,中间变量I表示单位矩阵;
通过对b求偏导,得到关于b的解析表达式如公式(23)所示:
f最优解如公式(26)所示:
f=(U+L+μλHC-μλ2N)-1UY (26);
式中,中间变量中间变量XC=HCV。
进一步地,步骤4的具体过程为:
步骤4.1、更新映射矩阵T时,固定模型预测标签值f、相似矩阵S和低维空间矩阵V,映射矩阵T的更新公式如下:
T=(XTX+Ik×k)-1(XTV) (28);
步骤4.2、更新相似矩阵S时,固定模型预测标签值f、映射矩阵T和低维空间矩阵V,相似矩阵S的更新公式如下:
公式(31)中,K为非零元素稀疏表示的个数;di,K+1为第i个训练数据与第K+1个训练数据之间总的距离向量;为总的距离向量,/>为样本间输入数据的距离向量,/>为标签数据的距离向量;fi、fj分别表示f中的第i个、第j个训练数据的预测标签值;
步骤4.3、更新低维空间矩阵V时,固定模型预测标签值f、映射矩阵T和相似矩阵S,低维空间矩阵V的更新公式如下:
其中,D为与S相关的对角矩阵。
进一步地,步骤6的具体过程为:
步骤6.1、在线采集测试数据,经过归一化处理后得到归一化后的质量变量测试集其中,nt为测试集中质量变量值的个数,/>为归一化后的测试集中第it个质量变量值;
步骤6.2、经神经网络映射得到扩维后的增广数据矩阵Xts
步骤6.3、利用训练集模型参数对测试集进行估计,具体过程如公式(35)所示:
式中,为测试数据的估计值;/>为nt个元素为1的列向量。
本发明所带来的有益技术效果:本发明考虑到高维数据中的冗余特征会影响相似矩阵对数据间局部结构信息的准确逼近,同时现有特征提取方法大都为无监督方法,无法有效利用标签数据的信息,提供了一种融合特征提取、自适应构图和回归建模的软测量建模方法,该方法通过将特征学习、自适应构图和回归建模三个不同的学习任务综合在一个统一学习框架内,综合利用动态自适应构图优化思想指导算法选择特征,并保证算法同步进行特征学习和回归建模,并采用交替迭代优化求解获得建模学习的整体最优解。因此,本发明提供的半监督学习框架能够充分利用标签数据所包含的监督信息,辅助以无标签数据所蕴含的结构信息达到提升软测量模型泛化能力和可靠性之目的。
附图说明
图1为本发明融合特征提取和自适应构图的软测量建模方法的流程图。
图2为本发明实施例中正则化参数β对CSTR训练集和测试集决定系数的影响图。
图3为本发明实施例中正则化参数λ对CSTR训练集和测试集决定系数的影响图。
图4为本发明实施例中正则化参数μ对CSTR训练集和测试集决定系数的影响图。
图5为本发明实施例中正则化参数α对CSTR训练集和测试集决定系数的影响图。
图6为本发明实施例中正则化参数ξ对CSTR训练集和测试集决定系数的影响图。
图7为本发明实施例中对CSTR训练集决定系数、目标函数值以及测试集决定系数在最优正则化参数下随迭代次数的变化图。
图8为本发明实施例中BLS方法在CSTR数据集下散点图对比。
图9为本发明实施例中SSBLS方法在CSTR数据集下散点图对比。
图10为本发明实施例中RBLS方法在CSTR数据集下散点图对比。
图11为本发明实施例中SSRBLS方法在CSTR数据集下散点图对比。
图12为本发明实施例中P-SSRBLS和本发明方法FE-SSRBLS在CSTR数据集下散点图对比。
图13为本发明实施例中采用本发明方法FE-SSRBLS在CSTR数据集下散点图对比。
图14为本发明实施例中采用本发明所示方法在CSTR数据集中训练集下的拟合效果图。
图15为本发明实施例中采用本发明所示方法在CSTR数据集中测试集下的拟合效果图。
具体实施方式
下面结合附图以及具体实施方式对本发明作进一步详细说明:
如图1所示,本发明提出了一种融合特征提取和自适应构图的软测量建模方法,包括如下步骤:
步骤1、在离线建模阶段,收集通过化验室离线分析得到的质量变量化验分析值和通过工业传感器获得的过程变量测量值,并对质量变量化验分析值和过程变量测量值进行归一化处理;在连续搅拌反应釜的建模中,质量变量化验分析值具体包括反应釜出料浓度,过程变量测量值具体包括进料浓度、进料温度、冷却水温度和反应釜温度;具体过程如下:
步骤1.1、按采样时间排序记收集的初始质量变量化验分析值集合为Yorg中的每一个初始质量变量化验分析值均为标签数据,/>为第/>个标签数据,/>为标签数据的序号,nl为标签数据的总个数,T为矩阵转置算子;按采样时间排序记收集的初始过程变量测量值集合为Uorg中的每一个初始过程变量测量值均为训练数据,/>为第i个训练数据,i为训练数据的序号,n为训练数据的总个数,d为采集数据的特征维数;训练数据中既包含标签数据,也包含无标签数据;
步骤1.2、对Yorg中的每一个数据按照公式(1)进行归一化处理,
式中,为归一化后的第/>个质量变量化验分析值数据,表示归一化后的质量变量化验分析值集合,作为训练真实标签值;yorgmax表示集合Yorg中的最大值,yorgmin表示集合Yorg中的最小值;
同理,对Uorg按照与公式(1)相同的方式处理得到归一化后的过程变量测量值集合ui为归一化后的第i个训练数据;
步骤1.3、将归一化后的过程变量测量值集合经神经网络映射为增广数据矩阵xi为经神经网络映射后的第i个训练数据,m为经神经网络映射后的特征维数,m>d。本发明采用的神经网络为循环宽度学习网络,具体过程如下:
步骤1.3.1、引入了循环神经网络的思想来取代宽度学习网络原始特征层,进而构建循环宽度学习网络,将Unor通过循环宽度学习网络映射得到特征层输出Z,具体如公式(2)-公式(4)所示,首先通过公式(2)得到第i个训练数据的状态向量zi
g(·)表示特征层中的非线性激活函数;为循环特征节点中的内部连接矩阵;zi-1为第i-1个训练数据的状态向量;/>为输入矩阵。其次,对于Unor中的每一个ui,按照采样时间,通过公式(2)依次生成状态向量,将n个训练数据的状态向量记为矩阵形式/>
nc为每组特征节点个数;为高维数据集合形式,表示训练数据第/>个特征节点窗口的映射特征;zn为第n个训练数据的状态向量;最后,将N个特征节点窗口的映射特征表示为公式(4):
ZN为第N个特征节点窗口的映射特征;N表示特征节点窗口个数;
步骤1.3.2、利用非线性激活函数以及特征层输出Z计算循环宽度学习网络增强层输出矩阵H,具体如下所示:
式中,表示第/>个增强节点窗口的增强层输出,ns表示每组增强节点的个数;/>表示增强层中第/>个增强节点窗口的非线性激活函数;Whj表示权重;Bhj表示偏置;M表示增强节点窗口个数;将M个增强节点窗口的映射特征表示为公式(6):
HM为第M个增强节点窗口的映射特征;
步骤1.3.3、将特征层输出Z和增强层输出矩阵H按行进行合并,得到增广数据矩阵X,具体如公式(7)所示;
X=[Z1,Z2,…,ZN,H1,H2,…,HM]=[x1,x2,…,xi,…xn]T (7);
式中,m为经神经网络映射后的特征维数,m=Nnc+Mns
步骤2、初始化拉普拉斯矩阵映射矩阵/>和低维空间矩阵具体过程如下:
步骤2.1、利用增广数据矩阵X=[x1,x2,…,xi,…xn]T计算初始拉普拉斯矩阵L0;首先通过公式(8)计算初始相似矩阵S0
式中,为第i个训练数据与其他数据之间相似性组成的向量的转置;1n为n个元素均为1的列向量;sij为第i个训练数据和第j个训练数据之间的相似性;/>表示l2范数的平方;xi为经神经网络映射后的第i个训练数据,xj为经神经网络映射后的第j个训练数据;γ为参数;/>si为第i个训练数据与其他数据之间相似性组成的向量;利用得到的相似矩阵S0求初始拉普拉斯矩阵L0如公式(9)所示:
式中,对角矩阵D0的对角元素
进一步地,步骤2.1中,根据公式(10)-公式(13)求解公式(8):
式中,为xi和xj之间的距离,/>为列向量,将公式(10)带入公式(8)可得:
通过定义两个拉格朗日乘数η1和ζ,将公式(11)写成拉格朗日公式(12):
对公式(12)关于si求偏导并令其为0,可得到根据非线性规划Karush-Kuhn-Tucker(KTT)条件,得到最优解如公式(13)所示,
其中其中函数(·)+表示括号内的值大于0时取本身,小于或等于0时取0,为了得到只有K个非零元素稀疏表示的si,公式(14)如下;
将公式(14)进一步化简为公式(15):
因为γ跟K有关,K为整数且0≤K≤n,参数γ可以表示为公式(16):
将η和γ代入公式(13)得:
步骤2.2、在(-1,1)范围内,随机生成初始映射矩阵即初始映射矩阵中的每一个元素均在(-1,1)范围内随机赋值;
步骤2.3、初始化低维空间矩阵在(-1,1)范围内,随机生成初始低维空间矩阵V0,关于V0的目标函数表示为公式(18):
对公式(18)中的V0求偏导并利用KKT条件获得迭代公式(19):
式中,←为迭代更新运算符号;⊙表示两个矩阵中对应位置的元素相乘。
步骤3、构建优化目标函数,根据优化目标函数更新隐层和输出层之间的权重偏置b和模型预测标签值/>具体过程如下:
步骤3.1、将特征提取和自适应构图进行融合,采用回归建模的方式构建得到模型的优化目标函数,最小化如公式(20)所示优化问题:
其中,T表示映射矩阵;V表示低维空间矩阵;S表示相似矩阵;f表示模型预测标签值;w表示隐层和输出层之间的权重;b表示隐层和输出层之间的偏置;vi、vj分别表示V中的第i个、第j个训练数据的低维向量表示;Tr(·)表示矩阵求迹运算;L表示拉普拉斯矩阵;对角矩阵即给前nl个标签值赋予一定的权值,正则化参数β即为权值,diag(·)表示对角矩阵的表示函数;训练集质量变量化验分析值集合/>即对归一化后的质量变量扩维,增加nu个0元素;λ、μ、β、α、ξ均为给定的正则化参数;/>表示F范数;
步骤3.2、固定相似矩阵S、映射矩阵T和低维空间矩阵V,得到关于w、b和f的优化问题描述如公式(21)所示:
通过对公式(21)中的w求偏导,可以得到关于w的解析表达式如公式(22)所示:
公式(22)中,中间变量E=λ(λVTHCV+Ik×k)-1VTHC,中间变量I表示单位矩阵;
同样的,通过对b求偏导,可以得到关于b的解析表达式如公式(23)所示:
将公式(22)-公式(23)带入公式(21)中的Vw+1nb得到公式(24):
公式(24)中的中间变量
进一步地,根据公式(22)-公式(24),将优化问题公式(21)转化为公式(25):
对f求偏导并令其为0,得其最优解如公式(26)所示:
f=(U+L+μλHC-μλ2N)-1UY (26);
式中,中间变量中间变量XC=HCV。
步骤4、更新映射矩阵相似矩阵/>和低维空间矩阵具体过程如下:
步骤4.1、更新映射矩阵T时,固定模型预测标签值f、相似矩阵S和低维空间矩阵V,目标函数由公式(20)简化为公式(27):
其中,表示F范数;
求解公式(27),可以得映射矩阵T的更新公式(28):
T=(XTX+Ik×k)-1(XTV) (28);
步骤4.2、更新相似矩阵S时,固定模型预测标签值f、映射矩阵T和低维空间矩阵V,目标函数由公式(20)简化为公式(29):
公式(29)可以化简为求解如公式(30)所示优化问题:
进一步地,根据步骤2中的原理得到相似矩阵S的更新公式(31),
公式(31)中,di,K+1为第i个训练数据与第K+1个训练数据之间总的距离向量;为总的距离向量,/>为样本间输入数据的距离向量,为标签数据的距离向量;fi、fj分别表示f中的第i个、第j个训练数据的预测标签值;
步骤4.3、更新低维空间矩阵V时,固定模型预测标签值f、映射矩阵T和相似矩阵S,目标函数由公式(20)简化为公式(32):
进一步地,对V求偏导并令其为0,并利用KKT条件Φ⊙V=0,得其最优解如公式(33)所示:
2(V-XT+βDV-βSV+μλVwwT+μλ1nbwT-μλfwT)⊙V=0 (33);
遵循乘法迭代规则,V更新如下:
步骤5、重复步骤3和步骤4,直到达到最大迭代次数,此时输出最终的模型参数w、b、T。
步骤6、采集测试数据并做归一化处理得到归一化后的测试集,经神经网络得到扩维后的数据集,最后利用训练集模型参数对测试集进行估计。具体过程如下:
步骤6.1、在线采集测试数据,经过归一化处理后得到归一化后的质量变量测试集其中,nt为测试集中质量变量值的个数,/>为归一化后的测试集中第it个质量变量值;
步骤6.2、经神经网络映射得到扩维后的增广数据矩阵Xts
步骤6.3、利用训练集模型参数对测试集进行估计,具体过程如公式(35)所示:
式中,为测试数据的估计值;/>为nt个元素为1的列向量。
本发明方法通过循环宽度学习网络提取数据的动态和非线性特征;同时综合利用降维后数据输入空间和预测输出空间的加权欧式距离信息自适应构建近邻图实现对数据潜在结构信息的准确逼近。该模型将特征提取和自适应构图整合在一个统一学习框架内,并采用交替迭代优化求解获得建模学习的整体最优解。
为了证明本发明发法的可行性与优越性,给出如下具体实施例。该实施例以连续搅拌反应釜的过程数据为例进行详细说明。
连续搅拌反应釜(Continuous Stirred Tank Reactor,CSTR)是现代石油化工工业重要的操作单元。由于CSTR内进行复杂的化学反应,其动态响应通常具有很强的非线性特性,对关键生产指标的准确预测和有效控制都提出了挑战。连续搅拌反应釜的变量包含进料浓度CA,f、进料温度Tf、冷却水温度TC、反应釜出料浓度CA和反应釜温度T等信息;其中釜出料浓度CA为质量变量;进料浓度CA,f、进料温度Tf、冷却水温度TC和反应釜温度T为过程变量。受测量技术限制,出料浓度CA只能离线采样后送实验室化验分析得到,其采样周期较长,无法满足闭环控制实时反馈要求。因此,实现对反应釜出料浓度CA的实时估计,提高反应器的控制质量,有必要建立软测量模型来实时估计出料浓度CA。另外,考虑到实际生产过程中质量变量的采样效率低、时延大的问题,假设所有的历史样本中仅有五十分之一的样本具有标签(既包含输入数据,也包含输出数据),其他历史样本均为无标签数据(仅包含输入数据)。
接下来结合CSTR生产过程对本发明的具体步骤进行阐述:
步骤1、离线建模阶段:将通过化验室离线分析得到的质量变量化验分析值和通过工业传感器获得的过程变量测量值作为训练数据集,并且进行预处理。其中,质量变量化验分析值具体包括反应釜出料浓度CA,过程变量测量值具体包括进料浓度CA,f、进料温度Tf、冷却水温度TC和反应釜温度T;
按采样时间划分训练集和测试集,其中训练集按1比50的采样间隔选取样本作为有标签样本,其他样本剔除标签作为无标签样本;指定宽度学习400个增强节点,300个特征节点,将用于训练的归一化后的过程变量测量值数据经循环宽度学习网络得到隐层输出增广数据矩阵/>将所收集的质量变量值按采样时间排序得到质量变量数据行向量/>
步骤2、根据训练数据集构造初始拉普拉斯矩阵,低维空间矩阵和映射矩阵。
指定正则化参数β、λ、μ、α、ξ分别为10、103、10-2、10-4、0.1,最大迭代次数为50,计算每个样本间的距离并选择出与第i个训练数据xi最近的3个样本构造初始拉普拉斯矩阵
步骤3、更新模型参数b、/>
步骤4、更新低维空间矩阵映射矩阵/>相似矩阵
步骤5、重复步骤3和步骤4直到达到最大迭代次数50;
步骤6、在线测试阶段:采集测试数据,经过归一化处理后得到归一化后的质量变量测试集经循环宽度学习网络得扩维后的数据/>对利用训练集模型参数对测试集进行估计。
本发明采用均方根误差(RMSE),决定系数(R2),平均绝对误差(MAE)三种评价指标来综合评价软测量模型的预测性能,三种评价指标的表达式如公式(36)-公式(38)所示:
式中,和/>分别为第/>个样本目标变量的真实值和预测值;n0为样本目标变量的总个数;/>为所有样本目标变量的平均值。决定系数R2能够衡量预测结果的可靠性,其计算结果越接近于1,软测量模型的预测效果越好。采用RMSE和MAE计算软测量模型的预测误差,误差值越小,软测量模型的预测精度越高。
表1给出了最优参数下宽度学习(BLS)、半监督宽度学习(SSBLS)、循环宽度学习(RBLS),半监督循环宽度学习(SSRBLS)、基于主成分分析的半监督循环宽度学习(P-SSRBLS)以及本发明所述方法(FE-SSRBLS)在固定随机参数下的评价指标对比:
表1软测量建模方法性能指标
由表1可知,本发明提供的方法总体上取得了最好的效果,测试集MAE、R2、RMSE都有一定的提升。
图2-图6分别给出了不同正则化参数对训练集和测试集决定系数的影响图,如图2-图6所示,随着正则化参数的变大,模型决定系数先变大后减小或趋于问题,在固定参数下达到最优。
图7给出了训练集决定系数、目标函数值以及测试集决定系数在最优正则化参数下随迭代次数的变化图,可知,在25次迭代左右趋于收敛,收敛速度较快。
图8-图13分别给出了本发明提供方法和对比方法预测值与真实值之间的散点图,可知本发明提供方法误差更小,效果更优。
图14和图15分别给出了训练集拟合效果图和测试集预测效果图,本发明提供方法能较好的跟踪数据趋势,且真实值与估计值基本吻合,证明了本方法的准确度。
综合以上分析,本发明提供的一种融合特征学习和自适应构图的软测量建模方法,不仅可以综合利用数据输入空间和预测输出空间的加权欧式距离信息自适应构建近邻图实现对数据潜在结构信息的准确逼近,还可以通过特征提取降低数据特征之间的冗余性,从而提高了模型的泛化能力和可靠性。
当然,上述说明并非是对本发明的限制,本发明也并不仅限于上述举例,本技术领域的技术人员在本发明的实质范围内所做出的变化、改型、添加或替换,也应属于本发明的保护范围。

Claims (1)

1.一种融合特征提取和自适应构图的软测量建模方法,其特征在于,包括如下步骤:
步骤1、收集通过化验室离线分析得到的质量变量化验分析值和通过工业传感器获得的过程变量测量值,并对质量变量化验分析值和过程变量测量值进行归一化处理;在连续搅拌反应釜的建模中,质量变量化验分析值具体包括反应釜出料浓度,过程变量测量值具体包括进料浓度、进料温度、冷却水温度和反应釜温度;具体过程为:
步骤1.1、按采样时间排序记收集的初始质量变量化验分析值集合为Yorg中的每一个初始质量变量化验分析值均为标签数据,/>为第/>个标签数据,/>为标签数据的序号,nl为标签数据的总个数,T为矩阵转置算子;按采样时间排序记收集的初始过程变量测量值集合为Uorg中的每一个初始过程变量测量值均为训练数据,/>为第i个训练数据,i为训练数据的序号,n为训练数据的总个数,d为采集数据的特征维数;训练数据中既包含标签数据,也包含无标签数据;
步骤1.2、对Yorg中的每一个数据按照公式(1)进行归一化处理,
式中,为归一化后的第/>个标签数据,/>表示归一化后的质量变量化验分析值集合,作为训练真实标签值;yorgmax表示Yorg中的最大值,yorgmin表示Yorg中的最小值;
对Uorg按照与公式(1)相同的方式处理得到归一化后的过程变量测量值集合ui为归一化后的第i个训练数据;
步骤1.3、将归一化后的过程变量测量值集合经神经网络映射为增广数据矩阵/>xi为经神经网络映射后的第i个训练数据,m为经神经网络映射后的特征维数;
步骤2、初始化拉普拉斯矩阵、映射矩阵和低维空间矩阵;具体过程为:
步骤2.1、利用增广数据矩阵X=[x1,x2,…,xi,…xn]T计算初始拉普拉斯矩阵L0;具体为:
首先通过公式(8)计算初始相似矩阵S0
式中,为第i个训练数据与其他数据之间相似性组成的向量的转置;1n为n个元素均为1的列向量;sij为第i个训练数据和第j个训练数据之间的相似性;/>表示l2范数的平方;xi为经神经网络映射后的第i个训练数据,xj为经神经网络映射后的第j个训练数据;γ为参数;/>si为第i个训练数据与其他数据之间相似性组成的向量;利用得到的相似矩阵S0求初始拉普拉斯矩阵L0如公式(9)所示:
式中,对角矩阵D0的对角元素
步骤2.2、随机生成初始映射矩阵初始映射矩阵中的每一个元素均在(-1,1)范围内随机赋值;k为映射后低维数据的特征维数;
步骤2.3、初始化低维空间矩阵,在(-1,1)范围内,随机生成初始低维空间矩阵关于V0的目标函数表示为公式(18):
对公式(18)中的V0求偏导并利用非线性规划条件获得迭代公式(19):
式中,←为迭代更新运算符号;⊙表示两个矩阵中对应位置的元素相乘;
步骤3、将特征提取和自适应构图进行融合,采用回归建模的方式构建得到模型优化目标函数,根据构建的优化目标函数更新隐层和输出层之间的权重、偏置和模型预测标签值;具体过程为:
步骤3.1、将特征提取和自适应构图进行融合,采用回归建模的方式构建得到模型的优化目标函数,优化目标函数如公式(20)所示:
其中,T表示映射矩阵;V表示低维空间矩阵;S表示相似矩阵;f表示模型预测标签值;w表示隐层和输出层之间的权重;b表示隐层和输出层之间的偏置;vi、vj分别表示V中的第i个、第j个训练数据的低维向量表示;Tr(·)表示矩阵求迹运算;L表示拉普拉斯矩阵;为对角矩阵,diag(·)表示对角矩阵的表示函数;/>为训练集质量变量化验分析值集合;λ、μ、β、α、ξ均为给定的正则化参数;/>表示F范数;
步骤3.2、固定相似矩阵S、映射矩阵T和低维空间矩阵V,得到关于w、b和f的优化问题描述如公式(21)所示:
通过对公式(21)中的w求偏导,得到关于w的解析表达式如公式(22)所示:
公式(22)中,中间变量E=λ(λVTHCV+Ik×k)-1VTHC,中间变量I表示单位矩阵;
通过对b求偏导,得到关于b的解析表达式如公式(23)所示:
f最优解如公式(26)所示:
f=(U+L+μλHC-μλ2N)-1UY (26);
式中,中间变量中间变量XC=HCV;
步骤4、更新映射矩阵、相似矩阵和低维空间矩阵;具体过程为:
步骤4.1、更新映射矩阵T时,固定模型预测标签值f、相似矩阵S和低维空间矩阵V,映射矩阵T的更新公式如下:
T=(XTX+Ik×k)-1(XTV) (28);
步骤4.2、更新相似矩阵S时,固定模型预测标签值f、映射矩阵T和低维空间矩阵V,相似矩阵S的更新公式如下:
公式(31)中,K为非零元素稀疏表示的个数;di,K+1为第i个训练数据与第K+1个训练数据之间总的距离向量;为总的距离向量,/>为样本间输入数据的距离向量,/>为标签数据的距离向量;fi、fj分别表示f中的第i个、第j个训练数据的预测标签值;
步骤4.3、更新低维空间矩阵V时,固定模型预测标签值f、映射矩阵T和相似矩阵S,低维空间矩阵V的更新公式如下:
其中,D为与S相关的对角矩阵;
步骤5、重复步骤3和步骤4,直到达到最大迭代次数,此时输出最终的模型权重、偏置和映射矩阵;
步骤6、采集测试数据并做归一化处理得到归一化后的测试集,经神经网络得到扩维后的数据集,最后利用训练集模型参数对测试集进行估计;具体过程为:
步骤6.1、在线采集测试数据,经过归一化处理后得到归一化后的质量变量测试集其中,nt为测试集中质量变量值的个数,/>为归一化后的测试集中第it个质量变量值;
步骤6.2、经神经网络映射得到扩维后的增广数据矩阵Xts
步骤6.3、利用训练集模型参数对测试集进行估计,具体过程如公式(35)所示:
式中,为测试数据的估计值;/>为nt个元素为1的列向量。
CN202311550643.9A 2023-11-21 2023-11-21 一种融合特征提取和自适应构图的软测量建模方法 Active CN117272244B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311550643.9A CN117272244B (zh) 2023-11-21 2023-11-21 一种融合特征提取和自适应构图的软测量建模方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311550643.9A CN117272244B (zh) 2023-11-21 2023-11-21 一种融合特征提取和自适应构图的软测量建模方法

Publications (2)

Publication Number Publication Date
CN117272244A CN117272244A (zh) 2023-12-22
CN117272244B true CN117272244B (zh) 2024-03-15

Family

ID=89210880

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311550643.9A Active CN117272244B (zh) 2023-11-21 2023-11-21 一种融合特征提取和自适应构图的软测量建模方法

Country Status (1)

Country Link
CN (1) CN117272244B (zh)

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104462196A (zh) * 2014-10-30 2015-03-25 南京信息工程大学 多特征联合哈希信息检索方法
WO2019213860A1 (en) * 2018-05-09 2019-11-14 Jiangnan University Advanced ensemble learning strategy based semi-supervised soft sensing method
CN111639685A (zh) * 2020-05-17 2020-09-08 西北工业大学 一种基于灵活流形嵌入和结构图优化的特征选择方法
CN112699960A (zh) * 2021-01-11 2021-04-23 华侨大学 基于深度学习的半监督分类方法、设备及存储介质
WO2021139175A1 (zh) * 2020-01-09 2021-07-15 国网浙江省电力有限公司舟山供电公司 一种基于卷积神经网络的电力操作票文字识别方法
CN113570161A (zh) * 2021-08-29 2021-10-29 浙江工业大学 基于宽度迁移学习的搅拌釜反应物浓度预测模型构建方法
CN113705633A (zh) * 2021-08-11 2021-11-26 西安交通大学 基于自适应图的半监督核宽度分类学习方法及设备
CN114528764A (zh) * 2022-02-18 2022-05-24 清华大学 基于整体优化的即时学习的软测量建模方法及装置
CN114841073A (zh) * 2022-05-17 2022-08-02 中国石油大学(华东) 基于局部标签传播的即时学习半监督软测量建模方法
CN114936528A (zh) * 2022-06-07 2022-08-23 中国石油大学(华东) 一种基于变量加权自适应局部构图的极限学习机半监督软测量建模方法
CN116484275A (zh) * 2023-04-17 2023-07-25 中南大学 基于自适应时空图卷积神经网络的铝电解阳极效应监测方法
CN116738866A (zh) * 2023-08-11 2023-09-12 中国石油大学(华东) 一种基于时间序列特征提取的即时学习的软测量建模方法
CN116821695A (zh) * 2023-08-30 2023-09-29 中国石油大学(华东) 一种半监督神经网络软测量建模方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113222041B (zh) * 2021-05-24 2022-06-07 北京航空航天大学 图结构表征的高阶关联发现细粒度图像识别方法及装置

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104462196A (zh) * 2014-10-30 2015-03-25 南京信息工程大学 多特征联合哈希信息检索方法
WO2019213860A1 (en) * 2018-05-09 2019-11-14 Jiangnan University Advanced ensemble learning strategy based semi-supervised soft sensing method
WO2021139175A1 (zh) * 2020-01-09 2021-07-15 国网浙江省电力有限公司舟山供电公司 一种基于卷积神经网络的电力操作票文字识别方法
CN111639685A (zh) * 2020-05-17 2020-09-08 西北工业大学 一种基于灵活流形嵌入和结构图优化的特征选择方法
CN112699960A (zh) * 2021-01-11 2021-04-23 华侨大学 基于深度学习的半监督分类方法、设备及存储介质
CN113705633A (zh) * 2021-08-11 2021-11-26 西安交通大学 基于自适应图的半监督核宽度分类学习方法及设备
CN113570161A (zh) * 2021-08-29 2021-10-29 浙江工业大学 基于宽度迁移学习的搅拌釜反应物浓度预测模型构建方法
CN114528764A (zh) * 2022-02-18 2022-05-24 清华大学 基于整体优化的即时学习的软测量建模方法及装置
CN114841073A (zh) * 2022-05-17 2022-08-02 中国石油大学(华东) 基于局部标签传播的即时学习半监督软测量建模方法
CN114936528A (zh) * 2022-06-07 2022-08-23 中国石油大学(华东) 一种基于变量加权自适应局部构图的极限学习机半监督软测量建模方法
CN116484275A (zh) * 2023-04-17 2023-07-25 中南大学 基于自适应时空图卷积神经网络的铝电解阳极效应监测方法
CN116738866A (zh) * 2023-08-11 2023-09-12 中国石油大学(华东) 一种基于时间序列特征提取的即时学习的软测量建模方法
CN116821695A (zh) * 2023-08-30 2023-09-29 中国石油大学(华东) 一种半监督神经网络软测量建模方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Adaptive cascade enhancement broad learning system combined with stacked correlation information autoencoder for soft sensor modeling of industrial process;Ni, Mingming等;《COMPUTERS & CHEMICAL ENGINEERING》;全文 *
基于QPSO-RVM的双酚A软测量建模;何新礼;谢莉;杨慧中;;计算机与应用化学(11);全文 *
基于无监督特征选择和卷积神经网络的图像识别算法;万萌;冯新玲;;赤峰学院学报(自然科学版)(10);全文 *

Also Published As

Publication number Publication date
CN117272244A (zh) 2023-12-22

Similar Documents

Publication Publication Date Title
CN109060001B (zh) 一种基于特征迁移学习的多工况过程软测量建模方法
CN108897286B (zh) 一种基于分散式非线性动态关系模型的故障检测方法
Han et al. Adaptive computation algorithm for RBF neural network
Khan et al. A higher prediction accuracy–based alpha–beta filter algorithm using the feedforward artificial neural network
CN110377942B (zh) 一种基于有限高斯混合模型的多模型时空建模方法
El-Koujok et al. Multiple sensor fault diagnosis by evolving data-driven approach
Wu et al. A weighted deep domain adaptation method for industrial fault prognostics according to prior distribution of complex working conditions
CN111079836A (zh) 基于伪标签方法和弱监督学习的过程数据故障分类方法
Ma et al. Degradation prognosis for proton exchange membrane fuel cell based on hybrid transfer learning and intercell differences
CN113485261B (zh) 一种基于CAEs-ACNN的软测量建模方法
CN115618196A (zh) 基于时空特征下的Transformer异常检测方法
CN112989711B (zh) 基于半监督集成学习的金霉素发酵过程软测量建模方法
CN113012766B (zh) 一种基于在线选择性集成的自适应软测量建模方法
CN111709577B (zh) 基于长程相关性gan-lstm的rul预测方法
Bakhtiaridoust et al. Data-driven fault detection and isolation of nonlinear systems using deep learning for Koopman operator
CN116894180B (zh) 一种基于异构图注意力网络的产品制造质量预测方法
CN117272244B (zh) 一种融合特征提取和自适应构图的软测量建模方法
CN116882299A (zh) 一种基于增强局部感知自注意力的动态软测量建模方法
Qi et al. Using stacked auto-encoder and bi-directional LSTM for batch process quality prediction
CN112001115A (zh) 一种半监督动态软测量网络的软测量建模方法
Darvishi et al. Deep Recurrent Graph Convolutional Architecture for Sensor Fault Detection, Isolation and Accommodation in Digital Twins
Moslemi et al. Scaling up bayesian neural networks with neural networks
CN115035962A (zh) 基于变分自编码器和生成对抗网络的虚拟样本生成及软测量建模方法
Zhang et al. Active learning strategy for online prediction of particle size distribution in cobalt oxalate synthesis process
He et al. Improved Bi-LSTM with distributed nonlinear extensions and parallel inputs for soft sensing

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant