CN114239400A - 基于局部双加权概率隐变量回归模型的多工况过程自适应软测量建模方法 - Google Patents

基于局部双加权概率隐变量回归模型的多工况过程自适应软测量建模方法 Download PDF

Info

Publication number
CN114239400A
CN114239400A CN202111547244.8A CN202111547244A CN114239400A CN 114239400 A CN114239400 A CN 114239400A CN 202111547244 A CN202111547244 A CN 202111547244A CN 114239400 A CN114239400 A CN 114239400A
Authority
CN
China
Prior art keywords
sample
gaussian
component
hidden variable
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111547244.8A
Other languages
English (en)
Inventor
姚乐
葛志强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN202111547244.8A priority Critical patent/CN114239400A/zh
Publication of CN114239400A publication Critical patent/CN114239400A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Mathematics (AREA)
  • Algebra (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Mathematical Analysis (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Complex Calculations (AREA)

Abstract

本发明公开一种基于局部双加权概率隐变量回归模型的多工况过程自适应软测量建模方法,首先基于变分贝叶斯高斯混合模型拟合多工况过程,利用多个高斯组分模拟多工况数据的分布,并计算训练样本归属于各高斯组分的后验概率,实现对训练数据集的多工况软划分;进而针对待预测样本构建各组分下的局部双加权概率隐变量回归模型,并计算待预测样本归属于各组分的后验概率,以融合各局部加权模型的输出预测,形成最终的软测量预测结果。本发明能够获得更准确的输出预测结果,极大地提升工业软测量模型的预报性能,同时自适应多工况过程,可更精准反映工业生产状况。

Description

基于局部双加权概率隐变量回归模型的多工况过程自适应软 测量建模方法
技术领域
本发明属于工业过程控制领域,特别涉及一种基于局部双加权概率隐变量回归模型的多工况过程自适应软测量建模方法。
背景技术
在工业生产过程中,由于过程环境和生产条件的复杂,许多反映生产质量的关键变量无法用工业仪表实时测量。这些质量变量的数据通常由实验室分析或在线分析仪获得,受到大延迟或高成本的限制。近年来,随着数据科学和信息技术的进步,数据驱动软测量模型在过程工业中得到了广泛的应用,主要基于历史过程数据和统计机器学习方法构建输入输出模型,以解决具有非线性、噪声、多模态和多采样率等特点的过程数据建模问题。此外,由于实际生产要求的频繁变化,工业过程数据普遍存在时变特性。
由于生产的要求和原料成分的比例不同,实际工业生产的操作点是经常变化的,产生了多工况过程建模问题。近年来,多工况过程建模成为的研究热点。数据驱动方法中,高斯混合模型(GMM)是最适合对多工况数据进行建模的方法,因为它能以多个高斯组分拟合工业过程的多个生产工况。基本的高斯混合模型需要指定高斯组分的个数,而基于变分贝叶斯算法的高斯混合模型(VBGMM)可自动确定高斯组分个数,实现对工业过程的多工况软划分。
局部加权学习模型通过选择与在线测试样本相似的历史样本建立局部模型进行输出预测,能够较好地建立非线性、多工况和时变过程软测量模型。与此同时,概率隐变量回归模型(PLVR)能够以随机变量的形式对含有噪声的工业数据进行描述,在隐变量空间中提取数据特征。因此,对概率隐变量回归模型采取局部加权的学习策略能够有效解决非线性、时变、多模态过程数据建模问题,可以大大提升工业软测量模型的预测性能和对过程变化的自适应能力。
进一步,在不同高斯组分下建立局部加权模型,不仅可以集成多个工况下的数据特征信息,还能提升各工况下局部模型的预测性能。同时,以概率归属度的形式对工业数据的不同工况进行软划分,可以有效避免硬划分算法带来的信息损失问题。对不同工况下进行软测预报时,以概率归属度为权重融合各局部加权模型的预测结果,可有效实现对多工况过程的自适应建模和预报。因此,非常有必要发明一种面向多工况过程集成学习的局部加权概率隐变量模型,以提升复杂工业过程软测量模型的预报性能。
发明内容
本发明的目的在于针对现有软测量建模方法的局限,提供一种基于局部双加权概率隐变量回归模型的多工况过程自适应软测量建模方法,具体技术方案如下:
一种基于局部双加权概率隐变量回归模型的多工况过程自适应软测量建模方法,包括以下步骤:
(1)利用工业控制系统收集训练数据集
Figure BDA0003416100480000021
其中N代表训练数据集中样本个数,M代表训练数据集变量维度,数据集由输入变量ξn∈Rm和输出变量οn∈R1构成,即ψn=[ξn οn]T;假设训练数据集服从混合高斯分布
Figure BDA0003416100480000022
包含K个高斯组分,其均值和协方差为
Figure BDA0003416100480000023
Figure BDA0003416100480000024
τk代表第k个高斯组分的混合权重;
(2)基于训练数据集训练变分贝叶斯高斯混合模型,获得各高斯组分参数Θk={τk,ukk},k=1,...,K;
(3)计算每个训练样本属于各高斯组分的归属度S={Snk},n=1,...,N;k=1,...,K,并在各高斯组分下依据归属度值Snk从大到小对原始训练样本进行排序,为每个高斯组分构造一组重新排序后的训练数据集Zk,k=1,...,K;
(4)分别计算待预测样本输入部分
Figure BDA0003416100480000025
与训练后的各高斯组分下的训练样本的相似度
Figure BDA0003416100480000026
(5)将各高斯组分下相似度值较高的前Ns个样本取出,并基于训练样本归属度Snk和相似度
Figure BDA0003416100480000027
双加权的策略构建并训练各组分下的局部加权概率隐变量回归模型Mik,并设定隐变量个数p和加权调节参数
Figure BDA0003416100480000028
(6)计算待预测样本输入部分归属于各高斯组分的后验概率ωik
(7)计算各局部加权概率隐变量回归模型Mik的预测值
Figure BDA0003416100480000029
并依据待预测样本输入部分的归属度值ωik进行加权求和,获得待预测样本输入部分的最终输出预测值
Figure BDA00034161004800000210
进一步地,所述步骤(2)具体为:
1)基于变分贝叶斯算法学习高斯混合模型参数时,需要为模型的随机变量V={τ,u,Ω,C}设定先验分布,均值和方差服从正态逆威沙特分布:p(ukk)=NIW(ukkkkkk),高斯混合权重服从狄利克雷分布:p(τk)=Dir(τkk)和样本的组分标签Cn服从类别分布:Cn~categorical(Cn|π),其中υ,ε,Γ,κ,ν是先验分布的超参数;
2)在变分贝叶斯算法中,采用变分分布q(V|η)近似随机变量的后验分布:
q(V|η)=q(τ|ητ)q(u,Ω|ηυεΓκ)q(C|ηC)
其中η代表变分分布的超参数;
3)依据变分贝叶斯算法原理,构建目标函数,即变分证据下界:
Figure BDA0003416100480000031
(a)首先最大化目标函数的第一项,获得变分分布q(C|ηC)的变分超参数ηC
Figure BDA0003416100480000032
其中Ψ(·)代表双伽玛函数,利用softmax函数得到ηC的计算式:
Figure BDA0003416100480000033
(b)然后最大化目标函数的第二项,获得剩余的变分超参数:
Figure BDA0003416100480000034
Figure BDA0003416100480000035
(c)最后将变分超参数转化为高斯混合模型的各高斯组分的参数Θk={τk,ukk},k=1,...,K:
Figure BDA0003416100480000041
进一步地,所述步骤(3)具体为:
1)基于贝叶斯公式计算每个训练样本属于各高斯组分的归属度:
Figure BDA0003416100480000042
其中p(ψnk)是ψn在第k个组分下的似然函数,其参数为Θk={τk,ukk};
2)在第k个组分中,对归属度值Snk进行从大到小排序,并依据该顺序对原始训练样本进行重新排列,即可为每个组分构造一组重新排序后的训练数据集Zk,k=1,...,K。
进一步地,所述步骤(4)具体为:
1)分别计算待预测样本输入部分
Figure BDA0003416100480000043
与第k个高斯组分训练集Zk中样本的欧氏距离:
Figure BDA0003416100480000044
其中
Figure BDA0003416100480000045
代表Zk中第n个样本Znk
Figure BDA0003416100480000046
的欧氏距离;
2)利用负指数函数将欧氏距离转化为(0,1)范围内的相似度值:
Figure BDA0003416100480000047
其中
Figure BDA0003416100480000048
为样本集Zk
Figure BDA0003416100480000049
欧氏距离
Figure BDA00034161004800000410
的标准差,
Figure BDA00034161004800000411
是调节参数,在[0.1,10]内取值。
进一步地,所述步骤(5)具体为:
1)对于待预测样本输入部分
Figure BDA00034161004800000412
将各高斯组分下相似度值较高的前Ns个训练样本取出,基于样本归属度Snk和相似度
Figure BDA00034161004800000413
双加权策略构建K个高斯组分下的局部加权概率隐变量回归模型Mik,k=1,...,K,具体包括如下步骤:
利用训练样本归属度Snk对第k个组分下的Ns个训练样本进行加权,即:
Figure BDA00034161004800000414
然后,基于相似度
Figure BDA00034161004800000415
构建局部加权概率隐变量回归模型,其表达式为:
ξ=ΗL+e
ο=ΡL+f
其中Η∈RM×p和Ρ∈Rr×p是待求解的参数矩阵;
Figure BDA00034161004800000416
Figure BDA00034161004800000417
分别代表模型的输入和输出,对应第k个高斯组分下的加权样本
Figure BDA0003416100480000051
其变量维度分别为M和r;
Figure BDA0003416100480000052
代表模型的隐变量,服从单位高斯分布
Figure BDA0003416100480000053
隐变量维度设为p;e和f分别代表输入和输出变量包含的噪声,并假设其服从高斯分布
Figure BDA0003416100480000054
Figure BDA0003416100480000055
其中Σξ和Σο代表噪声的协方差矩阵;
2)采用期望最大化算法求解模型参数,基于相似度
Figure BDA0003416100480000056
加权后的模型目标函数,即Q函数为:
Figure BDA0003416100480000057
3)通过期望最大化算法中的E步计算隐变量的充分统计量:
Figure BDA0003416100480000058
Figure BDA0003416100480000059
其中<·>代表隐变量的期望;
4)通过期望最大化算法中的M步,最大化Q函数,获得模型参数的更新公式:
Figure BDA00034161004800000510
Figure BDA00034161004800000511
Figure BDA00034161004800000512
Figure BDA00034161004800000513
5)对模型参数设定初始值,代入期望最大化算法中的E步计算充分统计量,开始EM算法迭代,经过E步和M步的多次交替迭代后,参数值趋于收敛,迭代停止,即可得到最终的局部加权概率隐变量回归模型参数。
进一步地,所述步骤(6)具体为:基于贝叶斯公式计算待预测样本
Figure BDA00034161004800000514
属于各高斯组分的后验概率:
Figure BDA00034161004800000515
其中
Figure BDA00034161004800000516
Figure BDA00034161004800000517
服从第k个高斯分布的概率,其参数为Θk={τk,ukk}。
进一步地,所述步骤(7)具体为:
1)基于步骤(6)中获得的局部加权概率隐变量回归模型参数,计算待预测样本输入部分
Figure BDA0003416100480000061
在第k个组分下的隐变量的估计值:
Figure BDA0003416100480000062
2)根据模型表达式计算第k个组分下局部加权概率隐变量回归模型的输出预测值:
Figure BDA0003416100480000063
其中
Figure BDA0003416100480000064
代表训练样本基于相似度加权后的输入均值和输出均值;
3)依据待预测样本输入部分的归属度值ωik对各局部加权概率隐变量回归模型的输出预测结果进行加权求和,获得待预测样本的最终输出预测值:
Figure BDA0003416100480000065
本发明的有益效果如下:
本发明通过基于概率归属度的多工况软划分方法,避免了传统多工况过程硬划分带来的建模信息损失,并且本发明在构建局部加权预测模型时,提出了一种局部样本归属度和相似度双加权的策略,能够获得更加准确的输出预测结果,提升工业软测量模型的预报性能,同时具备自适应多工况过程的能力,可更加精准地反映工业生产状况。
附图说明
图1是基于局部双加权概率隐变量回归模型的多工况过程自适应软测量建模算法流程图;
图2是一段炉生产工艺流程图;
图3是确定VBGMM高斯组分数目折线图;
图4是本发明提出方法的预测结果图;
图5是对比方法一的预测结果图;
图6是对比方法二的预测结果图;
图7是对比方法三的预测结果图;
图8是对比方法四的预测结果图。
具体实施方式
下面根据附图和优选实施例详细描述本发明,本发明的目的和效果将变得更加明白,应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明针对多工况工业过程软测量建模问题,提出了一种基于局部双加权概率隐变量回归模型的多工况过程自适应软测量建模方法,其算法流程如图1所示。该方法首先基于变分贝叶斯高斯混合模型(VBGMM)拟合多工况过程,利用多个高斯组分模拟多工况数据的分布,并计算训练样本归属于各高斯组分(工况)的后验概率,实现对训练数据集的多工况软划分;进而针对待预测样本构建各组分下的局部双加权概率隐变量回归模型(LDWPLVR),并计算待预测样本归属于各组分的后验概率,以融合各局部加权模型的输出预测,形成最终的软测量预测结果。
本发明通过基于概率归属度的多工况软划分方法,可以有效避免传统多工况过程硬划分带来的建模信息损失,并且局部样本归属度和相似度双加权的策略,能够使模型获得更加准确的输出预测结果,极大地提升工业软测量模型的预报精度,同时具备自适应多工况过程的能力,精准地反映工业生产状况。
本发明的基于局部双加权概率隐变量回归模型的多工况过程自适应软测量建模方法,具体包括如下步骤:
第一步:利用工业控制系统收集软测量建模用的训练数据集
Figure BDA0003416100480000071
其中N代表训练数据集中样本个数,M代表训练数据集变量维度,数据集由输入变量ξn∈Rm和输出变量οn∈R1构成,即ψn=[ξn οn]T。假设训练数据集服从混合高斯分布
Figure BDA0003416100480000072
包含K个高斯组分,其均值和协方差为
Figure BDA0003416100480000073
Figure BDA0003416100480000074
τk代表第k个高斯组分的混合权重。将这些数据存入历史数据库。
第二步基于历史数据训练变分贝叶斯高斯混合模型(VBGMM),获得各高斯组分参数Θk={τk,ukk},k=1,...,K。具体按照下面三个内容展开:
1)基于变分贝叶斯算法学习高斯混合模型参数时,需要为模型的随机变量V={τ,u,Ω,C}设定先验分布,均值和方差服从正态逆威沙特分布:p(ukk)=NIW(ukkkkkk),高斯混合权重服从狄利克雷分布:p(τk)=Dir(τkk)和隐变量——样本的组分标签Cn服从类别分布:Cn~categorical(Cn|π),其中υ,ε,Γ,κ,ν是先验分布的超参数。
2)在变分贝叶斯算法中,采用变分分布q(V|η)近似随机变量的后验分布:
q(V|η)=q(τ|ητ)q(u,Ω|ηυεΓκ)q(C|ηC)
其中η代表变分分布的超参数。
3)依据变分贝叶斯算法原理,可得模型需要最大化的目标函数——变分证据下界(ELBO):
Figure BDA0003416100480000081
(a)首先最大化第一项计算变分分布q(C|ηC)的变分超参数ηC
Figure BDA0003416100480000082
其中Ψ(·)代表双伽玛函数,利用softmax函数可得ηC的计算式:
Figure BDA0003416100480000083
(b)然后最大化第二项以获得余下变分超参数:
Figure BDA0003416100480000084
Figure BDA0003416100480000085
(c)最后将变分超参数转化为GMM的参数Θk={τk,ukk},k=1,...,K:
Figure BDA0003416100480000086
第三步计算每个训练样本属于各高斯组分的归属度S={Snk},n=1,...,N;k=1,...,K,并在各高斯组分下依据归属度值Snk从大到小对原始训练样本进行排序,为每个高斯组分构造一组重新排序后的训练数据集Zk,k=1,...,K。具体按照下面两个内容展开:
1)基于贝叶斯公式计算每个训练样本属于各高斯组分的归属度:
Figure BDA0003416100480000087
其中p(ψnk)是ψn在第k个组分下的似然函数,其参数为Θk={τk,ukk}。
2)在第k个高斯组分中,对归属度值Snk进行从大到小排序,并依据该顺序对原始训练样本进行重新排列,即可为每个高斯组分构造一组重新排序后的训练数据集Zk,k=1,...,K。
第四步在获得待预测样本
Figure BDA0003416100480000091
时,分别计算待预测样本与各组分下训练样本的相似度
Figure BDA0003416100480000092
这里基于欧氏距离和负指数函数计算样本间的相似度值
Figure BDA0003416100480000093
具体按照下面两个内容展开:
1)分别计算待预测样本
Figure BDA0003416100480000094
与第k个组分训练集Zk中样本的欧氏距离:
Figure BDA0003416100480000095
其中
Figure BDA0003416100480000096
代表Zk中第n个样本Znk
Figure BDA0003416100480000097
的欧氏距离。
2)利用负指数函数将欧氏距离转化为(0,1)范围内的相似度值:
Figure BDA0003416100480000098
其中
Figure BDA0003416100480000099
为样本集Zk
Figure BDA00034161004800000910
欧氏距离
Figure BDA00034161004800000911
的标准差,
Figure BDA00034161004800000912
是调节参数,在[0.1,10]内取值。
第五步将各高斯组分下相似度值较高的前Ns个样本取出,并基于样本归属度Snk和相似度
Figure BDA00034161004800000913
双加权的策略构建各组分下的局部加权概率隐变量回归(LDWPLVR)模型Mik,并设定隐变量个数p和加权调节参数
Figure BDA00034161004800000914
具体按照下面五个内容展开:
1)对于待预测样本
Figure BDA00034161004800000915
将各高斯组分下相似度值较高的前Ns个训练样本取出,基于样本归属度Snk和相似度
Figure BDA00034161004800000916
双加权策略构建K个组分下的局部加权概率隐变量回归(LDWPLVR)模型Mik,k=1,...,K。首先引入样本的高斯组分归属度Snk,以区分模型训练时样本的不同贡献(对当前高斯组分的归属度越高,在建立当前局部模型时的贡献越大),利用样本归属度Snk对第k个高斯组分下的Ns个训练样本进行加权,即:
Figure BDA00034161004800000917
然后,考虑训练样本与待预测样本的相似程度(相似程度越高,其建模时的贡献越大),基于相似度
Figure BDA00034161004800000918
构建LDWPLVR模型:
ξ=ΗL+e
ο=ΡL+f
其中,Η∈RM×p和Ρ∈Rr×p是待求解的参数矩阵;
Figure BDA00034161004800000919
Figure BDA00034161004800000920
分别代表LDWPLVR模型的输入和输出,对应第k个高斯组分下的加权样本
Figure BDA0003416100480000101
其变量维度分别为M和r;
Figure BDA0003416100480000102
代表LDWPLVR模型的隐变量,服从单位高斯分布
Figure BDA0003416100480000103
隐变量维度设为p;e和f分别代表输入和输出变量包含的噪声,并假设其服从高斯分布
Figure BDA0003416100480000104
Figure BDA0003416100480000105
其中Σξ和Σο代表噪声的协方差矩阵。
2)采用期望最大化(EM)算法求解模型参数,基于相似度
Figure BDA0003416100480000106
加权后的模型目标函数(Q函数)为:
Figure BDA0003416100480000107
3)通过E步计算隐变量的充分统计量:
Figure BDA0003416100480000108
Figure BDA0003416100480000109
其中<·>代表隐变量的期望。
4)通过M步最大化Q函数获得模型参数的更新公式:
Figure BDA00034161004800001010
Figure BDA00034161004800001011
Figure BDA00034161004800001012
Figure BDA00034161004800001013
5)对模型参数设定初始值,代入E步计算充分统计量,开始EM算法迭代,经过E步和M步的多次交替迭代后,参数值趋于收敛,迭代停止,即可得到最终的LDWPLVR模型参数。
第六步基于贝叶斯公式计算待预测样本
Figure BDA00034161004800001014
属于各高斯组分的后验概率(归属度):
Figure BDA00034161004800001015
其中
Figure BDA00034161004800001016
Figure BDA00034161004800001017
服从第k个高斯分布的概率,其参数为Θk={τk,ukk}。
第七步计算各局部加权概率隐变量回归模型Mik的预测值
Figure BDA0003416100480000111
并依据待预测样本的归属度值ωik进行加权求和,获得待预测样本的最终输出预测值
Figure BDA0003416100480000112
具体按照下面三个内容展开:
1)基于步骤(6)中获得的LDWPLVR参数,计算待预测样本
Figure BDA0003416100480000113
在第k个高斯组分下的隐变量:
Figure BDA0003416100480000114
2)根据模型表达式计算第k个高斯组分下局部模型的输出预测值:
Figure BDA0003416100480000115
其中
Figure BDA0003416100480000116
代表样本基于相似度加权后的输入均值和输出均值。
3)依据待预测样本的归属度值ωik对各局部模型的输出预测结果进行加权求和,获得待预测样本的最终输出预测值:
Figure BDA0003416100480000117
为了评价软测量模型的性能,计算模型评价指标——均方根误差(RMSE)和确定性系数(R2)
Figure BDA0003416100480000118
Figure BDA0003416100480000119
其中,
Figure BDA00034161004800001110
Figure BDA00034161004800001111
分别为待预测样本输出的真实值、预测值和平均值,Nt为待预测样本的个数。
以下结合一个具体的工业过程实例来验证本发明的有效性。一段炉是合成氨生产过程的核心工艺装置,其功能是将天然气转化为氢。图2为该装置的工艺流程图,其中包含13个工艺变量和一个质量变量,其中的变量描述如表1所示。在这个装置中,炉顶的氧含量是一个关键的质量变量。在实际生产过程中,需要建立数据驱动的软测量模型对氧含量进行实时估计。由于原料成分变化,使得实际工艺操作需要随之变化,炉膛内的氧含量也经常发生变化,存在多工况特性。由于过程结构复杂,过程变量与质量变量之间存在很强的非线性关系。因此,本发明可用于此案例建立在线预测模型。从实际工艺过程中收集了2000个样本数据,其中1500个用于训练模型,剩下500个用于构建测试数据集。
表1:工艺变量说明
标签 变量 标签 变量
U<sub>1</sub> 燃料天然气流量 U<sub>8</sub> 顶部左侧炉膛烟气温度
U<sub>2</sub> 燃料尾气流量 U<sub>9</sub> 顶部右侧炉膛烟气温度
U<sub>3</sub> 出口燃料天然气压力 U<sub>10</sub> 顶部混合炉膛烟气温度
U<sub>4</sub> 出口炉膛烟气压力 U<sub>11</sub> 出口转换气温度
U<sub>5</sub> E3出口燃料尾气温度 U<sub>12</sub> 右侧出口转换气温度
U<sub>6</sub> 出口燃料天然气温度 U<sub>13</sub> 出口转换气温度
U<sub>7</sub> 入口工艺气温度 Y 炉内顶部氧气含量
首先基于VBGMM对数据中存在的生产工况数量进行确定。将VBGMM的初始组分数设置为3~20,根据最终收缩得到的组分数来确定。如果初始值足够大,最终有效组分数值就会坍缩到一个稳定值。组分数的详细确定如图3所示。可以看出,当初始值增大时,拟合RMSE减小且保持不变。最终确定了本案例的高斯组分数为14,此时RMSE趋于稳定且计算负担相对较小。
然后,基于本发明提出的方法构建氧含量软测量模型。在VBGMM确定的各个高斯组分下,建立针对在线测试样本的LDWPLVR模型,并基于样本的归属度权重将各组分下的预测结果融合成最终的软测量预测值。与四种方法进行对比。方法一为仅用相似度加权的LWPLVR模型,方法二为基于VBGMM工况硬划分下的LWPLVR模型,方法三为基本的LWPLVR模型(不采用VBGMM进行工况划分),方法四为基本的VBGMR模型。最终,本发明提出的方法和上述四种方法在测试集上的预测结果分别如图4、图5、图6、图7、图8所示,预测性能评价指标RMSE和R2值如表2所示。比较结果表明,本发明提出的软测建模方法能够有效融合多工况下的数据信息,同时考虑样本归属度和相似度构建局部双加权学习模型,其性能相较先前的局部加权软测量模型有了显著提升。
表2:软测量模型预测性能比较
指标/模型 本发明 方法一 方法二 方法三 方法四
预测RMSE 0.76 0.85 0.89 1.01 1.18
预测R<sup>2</sup> 0.82 0.74 0.71 0.63 0.55
本领域普通技术人员可以理解,以上所述仅为发明的优选实例而已,并不用于限制发明,尽管参照前述实例对发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实例记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在发明的精神和原则之内,所做的修改、等同替换等均应包含在发明的保护范围之内。

Claims (7)

1.一种基于局部双加权概率隐变量回归模型的多工况过程自适应软测量建模方法,其特征在于,包括以下步骤:
(1)利用工业控制系统收集训练数据集
Figure FDA0003416100470000011
其中N代表训练数据集中样本个数,M代表训练数据集变量维度,数据集由输入变量ξn∈Rm和输出变量οn∈R1构成,即ψn=[ξn οn]T;假设训练数据集服从混合高斯分布
Figure FDA0003416100470000012
包含K个高斯组分,其均值和协方差为
Figure FDA0003416100470000013
Figure FDA0003416100470000014
τk代表第k个高斯组分的混合权重;
(2)基于训练数据集训练变分贝叶斯高斯混合模型,获得各高斯组分参数Θk={τk,ukk},k=1,...,K;
(3)计算每个训练样本属于各高斯组分的归属度S={Snk},n=1,...,N;k=1,...,K,并在各高斯组分下依据归属度值Snk从大到小对原始训练样本进行排序,为每个高斯组分构造一组重新排序后的训练数据集Zk,k=1,...,K;
(4)分别计算待预测样本输入部分
Figure FDA0003416100470000015
与训练后的各高斯组分下的训练样本的相似度
Figure FDA0003416100470000016
(5)将各高斯组分下相似度值较高的前Ns个样本取出,并基于训练样本归属度Snk和相似度
Figure FDA0003416100470000017
双加权的策略构建并训练各组分下的局部加权概率隐变量回归模型Mik,并设定隐变量个数p和加权调节参数
Figure FDA0003416100470000018
(6)计算待预测样本输入部分归属于各高斯组分的后验概率ωik
(7)计算各局部加权概率隐变量回归模型Mik的预测值
Figure FDA0003416100470000019
并依据待预测样本输入部分的归属度值ωik进行加权求和,获得待预测样本输入部分的最终输出预测值
Figure FDA00034161004700000110
2.根据权利要求1所述基于局部双加权概率隐变量回归模型的多工况过程自适应软测量建模方法,其特征在于,所述步骤(2)具体为:
1)基于变分贝叶斯算法学习高斯混合模型参数时,需要为模型的随机变量V={τ,u,Ω,C}设定先验分布,均值和方差服从正态逆威沙特分布:p(ukk)=NIW(ukkkkkk),高斯混合权重服从狄利克雷分布:p(τk)=Dir(τkk)和样本的组分标签Cn服从类别分布:Cn~categorical(Cn|π),其中υ,ε,Γ,κ,ν是先验分布的超参数;
2)在变分贝叶斯算法中,采用变分分布q(V|η)近似随机变量的后验分布:
q(V|η)=q(τ|ητ)q(u,Ω|ηυεΓκ)q(C|ηC)
其中η代表变分分布的超参数;
3)依据变分贝叶斯算法原理,构建目标函数,即变分证据下界:
Figure FDA0003416100470000021
(a)首先最大化目标函数的第一项,获得变分分布q(C|ηC)的变分超参数ηC
Figure FDA0003416100470000022
其中Ψ(·)代表双伽玛函数,利用softmax函数得到ηC的计算式:
Figure FDA0003416100470000023
(b)然后最大化目标函数的第二项,获得剩余的变分超参数:
Figure FDA0003416100470000024
Figure FDA0003416100470000025
(c)最后将变分超参数转化为高斯混合模型的各高斯组分的参数Θk={τk,ukk},k=1,...,K:
Figure FDA0003416100470000031
3.根据权利要求1所述基于局部双加权概率隐变量回归模型的多工况过程自适应软测量建模方法,其特征在于,所述步骤(3)具体为:
1)基于贝叶斯公式计算每个训练样本属于各高斯组分的归属度:
Figure FDA0003416100470000032
其中p(ψnk)是ψn在第k个组分下的似然函数,其参数为Θk={τk,ukk};
2)在第k个组分中,对归属度值Snk进行从大到小排序,并依据该顺序对原始训练样本进行重新排列,即可为每个组分构造一组重新排序后的训练数据集Zk,k=1,...,K。
4.根据权利要求1所述基于局部双加权概率隐变量回归模型的多工况过程自适应软测量建模方法,其特征在于,所述步骤(4)具体为:
1)分别计算待预测样本输入部分
Figure FDA0003416100470000033
与第k个高斯组分训练集Zk中样本的欧氏距离:
Figure FDA0003416100470000034
其中
Figure FDA0003416100470000035
代表Zk中第n个样本Znk
Figure FDA0003416100470000036
的欧氏距离;
2)利用负指数函数将欧氏距离转化为(0,1)范围内的相似度值:
Figure FDA0003416100470000037
其中
Figure FDA0003416100470000038
为样本集Zk
Figure FDA0003416100470000039
欧氏距离
Figure FDA00034161004700000310
的标准差,
Figure FDA00034161004700000311
是调节参数,在[0.1,10]内取值。
5.根据权利要求1所述基于局部双加权概率隐变量回归模型的多工况过程自适应软测量建模方法,其特征在于,所述步骤(5)具体为:
1)对于待预测样本输入部分
Figure FDA00034161004700000312
将各高斯组分下相似度值较高的前Ns个训练样本取出,基于样本归属度Snk和相似度
Figure FDA00034161004700000313
双加权策略构建K个高斯组分下的局部加权概率隐变量回归模型Mik,k=1,...,K,具体包括如下步骤:
利用训练样本归属度Snk对第k个组分下的Ns个训练样本进行加权,即:
Figure FDA00034161004700000314
然后,基于相似度
Figure FDA00034161004700000315
构建局部加权概率隐变量回归模型,其表达式为:
ξ=ΗL+e
ο=ΡL+f
其中Η∈RM×p和Ρ∈Rr×p是待求解的参数矩阵;
Figure FDA0003416100470000041
Figure FDA0003416100470000042
分别代表模型的输入和输出,对应第k个高斯组分下的加权样本
Figure FDA0003416100470000043
其变量维度分别为M和r;
Figure FDA0003416100470000044
代表模型的隐变量,服从单位高斯分布
Figure FDA0003416100470000045
隐变量维度设为p;e和f分别代表输入和输出变量包含的噪声,并假设其服从高斯分布
Figure FDA0003416100470000046
Figure FDA0003416100470000047
其中Σξ和Σο代表噪声的协方差矩阵;
2)采用期望最大化算法求解模型参数,基于相似度
Figure FDA0003416100470000048
加权后的模型目标函数,即Q函数为:
Figure FDA0003416100470000049
3)通过期望最大化算法中的E步计算隐变量的充分统计量:
Figure FDA00034161004700000410
Figure FDA00034161004700000411
其中<·>代表隐变量的期望;
4)通过期望最大化算法中的M步,最大化Q函数,获得模型参数的更新公式:
Figure FDA00034161004700000412
Figure FDA00034161004700000413
Figure FDA00034161004700000414
Figure FDA00034161004700000415
5)对模型参数设定初始值,代入期望最大化算法中的E步计算充分统计量,开始EM算法迭代,经过E步和M步的多次交替迭代后,参数值趋于收敛,迭代停止,即可得到最终的局部加权概率隐变量回归模型参数。
6.根据权利要求1所述基于局部双加权概率隐变量回归模型的多工况过程自适应软测量建模方法,其特征在于,所述步骤(6)具体为:基于贝叶斯公式计算待预测样本
Figure FDA00034161004700000416
属于各高斯组分的后验概率:
Figure FDA0003416100470000051
其中
Figure FDA0003416100470000052
Figure FDA0003416100470000053
服从第k个高斯分布的概率,其参数为Θk={τk,ukk}。
7.根据权利要求1所述基于局部双加权概率隐变量回归模型的多工况过程自适应软测量建模方法,其特征在于,所述步骤(7)具体为:
1)基于步骤(6)中获得的局部加权概率隐变量回归模型参数,计算待预测样本输入部分
Figure FDA0003416100470000054
在第k个组分下的隐变量的估计值:
Figure FDA0003416100470000055
2)根据模型表达式计算第k个组分下局部加权概率隐变量回归模型的输出预测值:
Figure FDA0003416100470000056
其中
Figure FDA0003416100470000057
代表训练样本基于相似度加权后的输入均值和输出均值;
3)依据待预测样本输入部分的归属度值ωik对各局部加权概率隐变量回归模型的输出预测结果进行加权求和,获得待预测样本的最终输出预测值:
Figure FDA0003416100470000058
CN202111547244.8A 2021-12-16 2021-12-16 基于局部双加权概率隐变量回归模型的多工况过程自适应软测量建模方法 Pending CN114239400A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111547244.8A CN114239400A (zh) 2021-12-16 2021-12-16 基于局部双加权概率隐变量回归模型的多工况过程自适应软测量建模方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111547244.8A CN114239400A (zh) 2021-12-16 2021-12-16 基于局部双加权概率隐变量回归模型的多工况过程自适应软测量建模方法

Publications (1)

Publication Number Publication Date
CN114239400A true CN114239400A (zh) 2022-03-25

Family

ID=80757475

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111547244.8A Pending CN114239400A (zh) 2021-12-16 2021-12-16 基于局部双加权概率隐变量回归模型的多工况过程自适应软测量建模方法

Country Status (1)

Country Link
CN (1) CN114239400A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114781166A (zh) * 2022-04-27 2022-07-22 浙江科技学院 基于加权概率慢特征模型的污水处理过程软测量方法
CN114841000A (zh) * 2022-05-09 2022-08-02 杭州师范大学 一种基于模态共有特征分离的软测量建模方法
CN116307303A (zh) * 2023-05-24 2023-06-23 中国石油大学(华东) 机理-数据双驱动的成品油管道混油长度预测方法及系统
CN116680589A (zh) * 2023-05-18 2023-09-01 哈尔滨工业大学 一种基于狄利克雷过程与折棍构造表示的直流充电桩远程检定方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6892163B1 (en) * 2002-03-08 2005-05-10 Intellectual Assets Llc Surveillance system and method having an adaptive sequential probability fault detection test
CN103927412A (zh) * 2014-04-01 2014-07-16 浙江大学 基于高斯混合模型的即时学习脱丁烷塔软测量建模方法
US10361802B1 (en) * 1999-02-01 2019-07-23 Blanding Hovenweep, Llc Adaptive pattern recognition based control system and method
CN112650063A (zh) * 2020-12-30 2021-04-13 浙江大学 一种基于半监督增量高斯混合回归的自适应软测量方法
CN113012766A (zh) * 2021-04-27 2021-06-22 昆明理工大学 一种基于在线选择性集成的自适应软测量建模方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10361802B1 (en) * 1999-02-01 2019-07-23 Blanding Hovenweep, Llc Adaptive pattern recognition based control system and method
US6892163B1 (en) * 2002-03-08 2005-05-10 Intellectual Assets Llc Surveillance system and method having an adaptive sequential probability fault detection test
CN103927412A (zh) * 2014-04-01 2014-07-16 浙江大学 基于高斯混合模型的即时学习脱丁烷塔软测量建模方法
CN112650063A (zh) * 2020-12-30 2021-04-13 浙江大学 一种基于半监督增量高斯混合回归的自适应软测量方法
CN113012766A (zh) * 2021-04-27 2021-06-22 昆明理工大学 一种基于在线选择性集成的自适应软测量建模方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
熊伟丽等: "一种动态校正的AGMM-GPR多模型软测量建模方法", 《大连理工大学学报》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114781166A (zh) * 2022-04-27 2022-07-22 浙江科技学院 基于加权概率慢特征模型的污水处理过程软测量方法
CN114781166B (zh) * 2022-04-27 2024-04-23 浙江科技学院 基于加权概率慢特征模型的污水处理过程软测量方法
CN114841000A (zh) * 2022-05-09 2022-08-02 杭州师范大学 一种基于模态共有特征分离的软测量建模方法
CN114841000B (zh) * 2022-05-09 2024-05-14 杭州师范大学 一种基于模态共有特征分离的软测量建模方法
CN116680589A (zh) * 2023-05-18 2023-09-01 哈尔滨工业大学 一种基于狄利克雷过程与折棍构造表示的直流充电桩远程检定方法
CN116307303A (zh) * 2023-05-24 2023-06-23 中国石油大学(华东) 机理-数据双驱动的成品油管道混油长度预测方法及系统
CN116307303B (zh) * 2023-05-24 2023-09-26 中国石油大学(华东) 机理-数据双驱动的成品油管道混油长度预测方法及系统

Similar Documents

Publication Publication Date Title
CN114239400A (zh) 基于局部双加权概率隐变量回归模型的多工况过程自适应软测量建模方法
CN108921604B (zh) 一种基于代价敏感分类器集成的广告点击率预测方法
CN108763237A (zh) 一种基于注意力机制的知识图谱嵌入方法
CN112489733B (zh) 基于粒子群算法和神经网络的辛烷值损失预测方法
CN111950854A (zh) 一种基于多层神经网络的焦炭质量指标预测方法
CN114678080B (zh) 转炉终点磷含量预测模型及构建方法、磷含量预测方法
CN107045569B (zh) 基于聚类多目标分布估计算法的齿轮减速器优化设计方法
CN113012766B (zh) 一种基于在线选择性集成的自适应软测量建模方法
CN111507365A (zh) 一种基于模糊聚类的置信规则自动生成方法
CN112163376A (zh) 一种基于天牛须搜索的极端随机树炉温预测控制方法
CN109919236A (zh) 一种基于标签相关性的bp神经网络多标签分类方法
CN108416439A (zh) 基于变量加权深度学习的炼油过程产品预测方法和系统
CN113780420A (zh) 基于gru-gcn的变压器油中溶解气体浓度预测方法
CN112464984A (zh) 一种基于注意力机制和强化学习的自动特征构造方法
CN102621953A (zh) 一种橡胶硬度的在线自动质量监控和预测模型更新的方法
CN114239397A (zh) 基于动态特征提取与局部加权深度学习的软测量建模方法
CN113762591A (zh) 一种基于gru和多核svm对抗学习的短期电量预测方法及系统
CN117497038A (zh) 一种基于核方法的快速优化培养基配方的方法
CN112734510A (zh) 基于融合改进模糊聚类和兴趣衰减的商品推荐方法
CN115829683A (zh) 一种基于逆奖赏学习优化的电力积分商品推荐方法及系统
CN115168602A (zh) 一种基于改进的概念和实例的三元组分类方法
CN114091961A (zh) 一种基于半监督svm的电力企业供应商评价方法
Li et al. Long short-term memory based on random forest-recursive feature eliminated for hot metal silcion content prediction of blast furnace
CN111650894A (zh) 一种基于隐变量的贝叶斯网络复杂工业过程软测量方法
Lööv Comparison of undersampling methods for prediction of casting defects based on process parameters

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20220325