CN113707240B - 基于半监督非线性变分贝叶斯混合模型的成分参数鲁棒软测量方法 - Google Patents
基于半监督非线性变分贝叶斯混合模型的成分参数鲁棒软测量方法 Download PDFInfo
- Publication number
- CN113707240B CN113707240B CN202110872306.6A CN202110872306A CN113707240B CN 113707240 B CN113707240 B CN 113707240B CN 202110872306 A CN202110872306 A CN 202110872306A CN 113707240 B CN113707240 B CN 113707240B
- Authority
- CN
- China
- Prior art keywords
- component
- model
- sample
- semi
- distribution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000691 measurement method Methods 0.000 title claims abstract description 12
- 238000009826 distribution Methods 0.000 claims abstract description 43
- 238000000034 method Methods 0.000 claims abstract description 26
- 230000008569 process Effects 0.000 claims abstract description 17
- 238000013507 mapping Methods 0.000 claims abstract description 7
- 230000006870 function Effects 0.000 claims description 21
- 238000012549 training Methods 0.000 claims description 15
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 claims description 10
- 238000004519 manufacturing process Methods 0.000 claims description 10
- 238000012545 processing Methods 0.000 claims description 8
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 6
- 239000011159 matrix material Substances 0.000 claims description 6
- 238000010521 absorption reaction Methods 0.000 claims description 5
- 229910002092 carbon dioxide Inorganic materials 0.000 claims description 5
- 239000001569 carbon dioxide Substances 0.000 claims description 5
- 229910021529 ammonia Inorganic materials 0.000 claims description 3
- 238000012544 monitoring process Methods 0.000 abstract description 4
- 238000013461 design Methods 0.000 abstract description 2
- 238000005065 mining Methods 0.000 abstract 1
- 238000005259 measurement Methods 0.000 description 10
- 239000007788 liquid Substances 0.000 description 6
- 238000012360 testing method Methods 0.000 description 5
- 239000006096 absorbing agent Substances 0.000 description 3
- 239000000470 constituent Substances 0.000 description 3
- 238000012423 maintenance Methods 0.000 description 3
- 238000003556 assay Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000009434 installation Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 238000012773 Laboratory assay Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000010978 in-process monitoring Methods 0.000 description 1
- 238000009533 lab test Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 229910000028 potassium bicarbonate Inorganic materials 0.000 description 1
- 235000015497 potassium bicarbonate Nutrition 0.000 description 1
- 239000011736 potassium bicarbonate Substances 0.000 description 1
- TYJJADVDDVDEDZ-UHFFFAOYSA-M potassium hydrogencarbonate Chemical compound [K+].OC([O-])=O TYJJADVDDVDEDZ-UHFFFAOYSA-M 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/70—Machine learning, data mining or chemometrics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/10—Analysis or design of chemical reactions, syntheses or processes
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/30—Prediction of properties of chemical compounds, compositions or mixtures
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/90—Programming languages; Computing architectures; Database systems; Data warehousing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computing Systems (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Crystallography & Structural Chemistry (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Pure & Applied Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Analytical Chemistry (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- Mathematical Physics (AREA)
- Algebra (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Mathematical Optimization (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Complex Calculations (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开一种基于半监督非线性变分贝叶斯混合模型的成分参数鲁棒软测量方法,该方法在有监督线性变分贝叶斯混合模型的基础上,设计了非线性组分模型的模型结构,采用极限学习机表示每个组分内辅助变量和成分参数之间的非线性映射关系;然后同时挖掘有标签和无标签样本信息,利用变分贝叶斯算法自动学习模型参数的变分后验分布。应用本发明,可充分表征辅助变量和成分参数之间的非线性映射关系,并能够利用无标签样本提高模型参数学习的准确性,进而有效地提高模型的预测精度,为提高产品质量、降低成本、过程监控以及决策制定提供技术支持和保障。
Description
技术领域
本发明属于过程系统软测量建模与应用领域,具体来说,涉及一种基于半监督非线性变分贝叶斯混合模型的成分参数鲁棒软测量方法。
背景技术
成分参数广泛存在于大量的工业生产过程中。为了能够及时有效地监控系统运行状态、实现过程平稳控制、快速跟踪产品质量,成分参数的实时监测显得极为重要。实际上,这些成分参数的测量通常是通过在线分析仪测量得到。然而,这类分析仪价格非常昂贵且易发生故障,导致高昂的安装和维护成本。此外,经过实验室化验得到成分参数值虽然准确,但是会带来较大的时滞,不利于工业现场实时的监测和决策。
数据驱动的软测量模型能够实现成分参数的在线实时预测。软测量本质上是数学模型,能够根据易于测量的过程变量(也叫作辅助变量),如流量、温度、压力等,在线预测这些成分参数。软测量因其无延迟和便于维护等优点,在过程监控、闭环控制、过程优化等方面发挥着重要作用。然而,实际工业过程呈现的复杂的过程特性,往往会限制数据驱动软测量模型的预测性能。复杂的过程特性在Distributed Control System系统采集到的工业数据中主要表现为强非线性,非高斯性,多模态特性和离群点污染等。其中,强非线性、非高斯性和多模态特性通常来源于复杂的过程机理、多种产品等级或运行阶段引起的多种工况/阶段、负载变化等。离群点主要是由于硬件传感器采集到的一些工业过程变量的测量值不可避免地被错误地观察、记录或导入数据库。针对于上述特性,有监督线性变分贝叶斯混合模型被提出并应用到工业过程的成分参数鲁棒软测量。但有监督线性变分贝叶斯混合模型采用的是线性组分模型,不能够充分地表征强非线性特征,且有监督线性变分贝叶斯混合模型仅仅利用稀少的有标签数据进行建模,模型参数学习的准确性不高,导致成分参数的预测精度也不高。
发明内容
本发明的目的在于针对现有的有监督线性变分贝叶斯混合模型在预测成分参数中存在的不足,提供一种基于半监督非线性变分贝叶斯混合模型的成分参数鲁棒软测量方法。具体来说,本发明在有监督线性变分贝叶斯混合模型的基础上,设计了非线性组分模型的模型结构,采用极限学习机表示每个组分内辅助变量和成分参数之间的非线性映射关系;本发明采用半监督学习策略,同时挖掘有标签和无标签样本信息,并利用变分贝叶斯算法自动学习模型参数的变分后验分布。
本发明是通过以下具体技术方案实现的:一种基于半监督非线性变分贝叶斯混合模型的成分参数鲁棒软测量方法,具体步骤如下:
一种基于半监督非线性变分贝叶斯混合模型的成分参数鲁棒软测量方法,该方法包括以下步骤:
(1)选择与成分参数密切相关的辅助变量,辅助变量和成分参数分别记为x∈Rd和y∈R,其中d表示辅助变量的个数;
(2)收集历史工业过程中的有标签和无标签样本构成训练集;在训练集中,有标签样本集和无标签样本集分别记为和其中NL和NU分别表示有标签样本和无标签样本的个数;
(3)将步骤(2)采集到的数据进行标准化处理,即,将辅助变量和成分参数的样本处理为均值均为0,样本方差均为1;标准化后的数据集记为其中,表示有标签样本标准化后的辅助变量样本集,表示有标签样本标准化后的成分参数样本集,表示无标签样本标准化后的样本集;
(4)将步骤(3)得到的有标签样本和无标签样本输入到半监督非线性变分贝叶斯混合模型中,给定组分个数K,学习模型参数的变分后验分布和自由度参数集合的值;
其中,αk表示第k个组分的混合系数,μk、Λk、vk分别表示第k个组分中辅助变量对应的均值向量、精度矩阵和自由度参数,ωk、τk分别表示第k个组分中成分参数与辅助变量之间的回归系数和精度,γk表示第k个组分的回归系数的超参数;
(5)将仅包含辅助变量的待测样本进行标准化处理,输入步骤(4)训练得到的半监督非线性变分贝叶斯混合模型,得到对应的成分参数的预测值。
进一步地,所述步骤(4)中构建的半监督非线性变分贝叶斯混合模型具有如下形式:
在输入空间上,辅助变量和服从混合Student’s-t分布,其概率密度函数为
其中,St(·)表示Student’s-t分布的概率密度函数;
在输出空间上,首先通过极限学习机将有标签样本的辅助变量映射到s维隐层空间,得到的隐层特征记为hi;然后,建立起成分参数与隐层特征hi之间的线性关系;成分参数相对于隐层特征hi的条件概率密度函数为
其中, 表示正态分布的概率密度函数;
在半监督非线性变分贝叶斯混合模型中,将模型参数Θ贝叶斯化,并分配相应的共轭先验分布如下:
其中,a0、b0、c0、f0、e0、m0、β0、W0、r0是模型参数先验分布的超参数,Dir(·)、Gam(·)和w(·)分别表示狄利克雷分布、伽马分布和威沙特分布的概率密度函数;C(a0)=Γ(Ka0)/Γ(a0)K,且Γ(·)表示伽马函数。
进一步地,所述步骤(4)中,给定组分个数K,利用变分贝叶斯算法自动学习模型参数的变分后验分布,具有如下形式:
q(α)=Dir(α|a)
通过求解下列非线性方程得到自由度参数vk
其中,
ak、bk、ck、fk、ek、mk、βk、Wk、rk、κk、Φk是模型参数变分后验分布的超参数,Tr(·)是矩阵的迹,Rik、Rjk、Tik、Tjk、Sik、Sjk均为有效统计量,ψ(·)是digamma函数;
bk=b0+(d+1)/2
其中,<·>表示数学期望的计算符号。
进一步地,所述步骤(4)中,给定组分个数K,根据学习到的模型参数的变分后验分布计算变分下界ELBO,来决定是否完成训练过程,ELBO计算公式如下:
其中,表示有标签样本对应的隐层特征集,和分别表示有标签样本和无标签样本对应的类别隐变量集, 和分别表示有标签样本和无标签样本对应的鲁棒隐变量集,
其中,
进一步地,所述步骤(5)具体包括如下子步骤:
首先,计算标准化后的待测样本的辅助变量对应的类别隐变量zq={zq1,zq2,...,zqK}的后验概率,如下式
其中,
然后,计算待测样本的成分参数关于的条件概率分布为
其中,
最终,得到待测样本的成分参数预测值为
本发明的有益效果具体如下:
(1)本发明方法中设计的非线性组分模型,能够充分表征每个组分内辅助变量和成分参数之间的非线性映射关系;
(2)本发明方法采用的半监督学习策略,能够同时挖掘有标签样本和无标签样本蕴含的信息,提高模型参数学习的准确性;
(3)在变分贝叶斯算法的框架下,所有模型参数均可自适应学习,无需人工干预,无需额外的校验数据集,极大节省了投入到模型开发的时间和精力。
附图说明
图1是应用本发明进行成分参数离线训练和在线预测的流程。
图2是某石化企业合成氨工业过程中二氧化碳吸收塔单元的工艺原理图。
图3是半监督非线性变分贝叶斯混合模型对于残留CO2浓度的在线预测结果。其中,点划线代表残留CO2浓度的化验值,黑色实线代表本发明提供的预测值,横坐标表示测试样本序号,纵坐标表示残留CO2浓度。
图4是有监督线性变分贝叶斯混合模型对于残留CO2浓度的在线预测结果。其中,点划线代表残留CO2浓度的化验值,黑色实线线代表有监督线性变分贝叶斯混合模型提供的预测值,横坐标表示测试样本序号,纵坐标表示残留CO2浓度。
具体实施方式
下面根据附图和优选实施例详细描述本发明,本发明的目的和效果将变得更加明白,应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明的基于半监督非线性变分贝叶斯混合模型的成分参数鲁棒软测量方法,具体实施方法如图1所示,并详述如下:
I.离线训练阶段
(1)根据专家知识选择与成分参数密切相关的辅助变量,辅助变量和成分参数分别记为x∈Rd和y∈R,其中d表示辅助变量的个数;
(2)收集历史工业过程中的有标签和无标签样本构成训练集;在训练集中,有标签样本集和无标签样本集分别记为和其中NL和NU分别表示有标签样本和无标签样本的个数;
(3)将步骤(2)采集到的数据进行标准化处理,即,将辅助变量和成分参数的样本处理为均值均为0,样本方差均为1;标准化后的数据集记为其中,表示有标签样本标准化后的辅助变量样本集,表示有标签样本标准化后的成分参数样本集,表示无标签样本标准化后的样本集;
(4)将步骤(3)得到的有标签样本和无标签样本输入到半监督非线性变分贝叶斯混合模型中,给定组分个数K,学习模型参数的变分后验分布和自由度参数集合的值;
其中,αk表示第k个组分的混合系数,μk、Λk、vk分别表示第k个组分中辅助变量对应的均值向量、精度矩阵和自由度参数,ωk、τk分别表示第k个组分中成分参数与辅助变量之间的回归系数和精度,γk表示第k个组分的回归系数的超参数;具体过程如下:
在输入空间上,辅助变量和服从混合Student’s-t分布,其概率密度函数为
其中,St(·)表示Student’s-t分布的概率密度函数。
在输出空间上,首先通过极限学习机将有标签样本的辅助变量映射到s维隐层空间,得到的隐层特征记为hi。然后,建立起成分参数与隐层特征hi之间的线性关系。成分参数相对于隐层特征hi的条件概率密度函数为
其中, 表示正态分布的概率密度函数。
在半监督非线性变分贝叶斯混合模型中,将模型参数Θ贝叶斯化,并分配相应的共轭先验分布如下:
其中,a0、b0、c0、f0、e0、m0、β0、W0、r0是模型参数先验分布的超参数,Dir(·)、Gam(·)和W(·)分别表示狄利克雷分布、伽马分布和威沙特分布的概率密度函数;C(a0)=Γ(Ka0)/Γ(a0)K,且Γ(·)表示伽马函数。
利用变分贝叶斯算法自动学习模型参数的变分后验分布,具有如下形式:
q(α)=Dir(α|a)
通过求解下列非线性方程得到自由度参数νk
其中,
ak、bk、ck、fk、ek、mk、βk、Wk、rk、κk、Φk是模型参数变分后验分布的超参数,Tr(·)是矩阵的迹,Rik、Rjk、Tik、Tjk、Sik、Sjk均为有效统计量,ψ(·)是digamma函数;
bk=b0+(d+1)/2
其中,<·>表示数学期望的计算符号。
根据学习到的模型参数的变分后验分布计算变分下界ELBO,来决定是否完成训练过程,ELBO计算公式如下:
其中,表示有标签样本对应的隐层特征,和分别表示有标签样本和无标签样本对应的类别隐变量,和分别表示有标签样本和无标签样本对应的鲁棒隐变量,
其中,
II.在线预测阶段
(1)采样到需要预测的未知样本xq后,按步骤(3)进行标准化消除辅助变量的量纲,得到计算标准化后的待测样本的辅助变量对应的类别隐变量zq={zq1,zq2,...,zqK}的后验概率,如下式
其中,
然后,计算待测样本的成分参数关于的条件概率分布为
其中,
最终,可以得到待测样本的成分参数的预测值为
实施例
以下结合一个具体的某石化企业合成氨工业过程中二氧化碳吸收塔单元例子来说明半监督非线性变分贝叶斯混合模型的性能。该单元的主要目的是将原料气体中的CO2转化成碳酸氢钾,进而降低输送到下游单元的原料气体中CO2浓度至一定水平。因此需要对该单元出口气体中的残留CO2浓度进行实时的监测。实际上,CO2浓度值主要是由质谱仪测量得到。然而,这类质谱仪非常昂贵且易发生故障,导致高昂的安装和维护成本。此外,经过实验室化验得到CO2浓度值虽然准确,但是会带来较大的时滞,不利于工业现场实时的监测和决策。因此,为了提高二氧化碳吸收塔单元的控制质量以及降低测量成本,需要对二氧化碳吸收塔单元中残留CO2浓度建立一个软测量模型。根据对该单元的生产工艺(图2)进行机理分析,选择了与残留CO2浓度密切相关的11个变量作为辅助变量,分别为进入E3的工艺气压力(x1)、分离器2的液位(x2)、E1出口贫液温度(x3)、到CO2吸收塔的贫液流量(x4)、到CO2吸收塔的半富液流量(x5)、分离器2出口工艺气温度(x6)、CO2吸收塔入口工艺气压差(x7)、CO2吸收塔出口富液温度(x8)、CO2吸收塔液位(x9)、分离器1液位(x10)和出口工艺气压力(x11)。
针对该过程,连续等时间间隔采集了9000个过程样本,随机选择7000个样本构成训练集,余下的2000样本作为测试集。在训练集中,有标签样本的个数设置为1000,则无标签样本个数为6000。对于本发明和有监督线性变分贝叶斯混合模型,初始组分个数均设置为K=50。对于本发明,隐层空间维度设置为s=200。按照步骤(5),对残留CO2浓度进行预测,预测结果如图3所示;同时,图4给出了有监督线性变分贝叶斯混合模型的预测结果。采用均方根误差(RMSE)量化本发明和有监督线性变分贝叶斯混合模型的预测精度,定义如下
其中yq和分别代表第q个测试样本的化验值与反标准化后的预测值。本发明提供的方法与有监督线性变分贝叶斯混合模型的预测RMSE分别为0.002460和0.003411。可见,本发明较有监督线性变分贝叶斯混合模型对残留CO2浓度的预测精度有显著改善,预测误差降低了27.9%。
本领域普通技术人员可以理解,以上所述仅为发明的优选实例而已,并不用于限制发明,尽管参照前述实例对发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实例记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在发明的精神和原则之内,所做的修改、等同替换等均应包含在发明的保护范围之内。
Claims (4)
1.一种基于半监督非线性变分贝叶斯混合模型的成分参数鲁棒软测量方法,其特征在于,该方法包括以下步骤:
(1)选择与成分参数密切相关的辅助变量,辅助变量和成分参数分别记为x∈Rd和y∈R,其中d表示辅助变量的个数;所述成分参数为二氧化碳吸收塔单元中残留CO2浓度;
(2)收集合成氨工业过程中的有标签和无标签样本构成训练集;在训练集中,有标签样本集和无标签样本集分别记为和其中NL和NU分别表示有标签样本和无标签样本的个数;
(3)将步骤(2)采集到的数据进行标准化处理,即,将辅助变量和成分参数的样本处理为均值均为0,样本方差均为1;标准化后的数据集记为其中,表示有标签样本标准化后的辅助变量样本集,表示有标签样本标准化后的成分参数样本集,表示无标签样本标准化后的样本集;
(4)将步骤(3)得到的有标签样本和无标签样本输入到半监督非线性变分贝叶斯混合模型中,给定组分个数K,学习模型参数的变分后验分布和自由度参数集合的值;
其中,αk表示第k个组分的混合系数,μk、Λk、vk分别表示第k个组分中辅助变量对应的均值向量、精度矩阵和自由度参数,ωk、τk分别表示第k个组分中成分参数与辅助变量之间的回归系数和精度,γk表示第k个组分的回归系数的超参数;
(5)将仅包含辅助变量的待测样本进行标准化处理,输入步骤(4)训练得到的半监督非线性变分贝叶斯混合模型,得到对应的成分参数的预测值;
所述步骤(4)中构建的半监督非线性变分贝叶斯混合模型具有如下形式:
在输入空间上,辅助变量和服从混合Student’s-t分布,其概率密度函数为
其中,St(·)表示Student’s-t分布的概率密度函数;
在输出空间上,首先通过极限学习机将有标签样本的辅助变量映射到s维隐层空间,得到的隐层特征记为hi;然后,建立起成分参数与隐层特征hi之间的线性关系;成分参数相对于隐层特征hi的条件概率密度函数为
其中, 表示正态分布的概率密度函数;
在半监督非线性变分贝叶斯混合模型中,将模型参数Θ贝叶斯化,并分配相应的共轭先验分布如下:
其中,a0、b0、c0、f0、e0、m0、β0、W0、r0是模型参数先验分布的超参数,Dir(·)、Gam(·)和分别表示狄利克雷分布、伽马分布和威沙特分布的概率密度函数;C(a0)=Γ(Ka0)/Γ(a0)K,且Γ(·)表示伽马函数。
2.根据权利要求1所述基于半监督非线性变分贝叶斯混合模型的成分参数鲁棒软测量方法,其特征在于,所述步骤(4)中,给定组分个数K,利用变分贝叶斯算法自动学习模型参数的变分后验分布,具有如下形式:
q(α)=Dir(α|a)
通过求解下列非线性方程得到自由度参数vk
其中,
ak、bk、ck、fk、ek、mk、βk、Wk、rk、κk、Φk是模型参数变分后验分布的超参数,Tr(·)是矩阵的迹,Rik、Rjk、Tik、Tjk、Sik、Sjk均为有效统计量,ψ(·)是digamma函数;
bk=b0+(d+1)/2
其中,<·>表示数学期望的计算符号。
3.根据权利要求2所述基于半监督非线性变分贝叶斯混合模型的成分参数鲁棒软测量方法,其特征在于,所述步骤(4)中,给定组分个数K,根据学习到的模型参数的变分后验分布计算变分下界ELBO,来决定是否完成训练过程,ELBO计算公式如下:
其中,表示有标签样本对应的隐层特征集,和分别表示有标签样本和无标签样本对应的类别隐变量集, 和分别表示有标签样本和无标签样本对应的鲁棒隐变量集,
其中,
4.根据权利要求1所述基于半监督非线性变分贝叶斯混合模型的成分参数鲁棒软测量方法,其特征在于,所述步骤(5)具体包括如下子步骤:
首先,对待测样本标准化,计算标准化后的待测样本的辅助变量对应的类别隐变量的后验概率,如下式
其中,
然后,计算待测样本的成分参数关于的条件概率分布为
其中,
最终,得到待测样本的成分参数预测值为
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110872306.6A CN113707240B (zh) | 2021-07-30 | 2021-07-30 | 基于半监督非线性变分贝叶斯混合模型的成分参数鲁棒软测量方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110872306.6A CN113707240B (zh) | 2021-07-30 | 2021-07-30 | 基于半监督非线性变分贝叶斯混合模型的成分参数鲁棒软测量方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113707240A CN113707240A (zh) | 2021-11-26 |
CN113707240B true CN113707240B (zh) | 2023-11-07 |
Family
ID=78650974
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110872306.6A Active CN113707240B (zh) | 2021-07-30 | 2021-07-30 | 基于半监督非线性变分贝叶斯混合模型的成分参数鲁棒软测量方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113707240B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114708930A (zh) * | 2022-04-19 | 2022-07-05 | 泉州装备制造研究所 | 一种基于层次基团构建的纯组分炼化性质的预测方法 |
CN118351966A (zh) * | 2024-05-09 | 2024-07-16 | 中国地质科学院岩溶地质研究所 | 一种基于贝叶斯算法的岩石风化速度测定方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108664706A (zh) * | 2018-04-16 | 2018-10-16 | 浙江大学 | 一种基于半监督贝叶斯高斯混合模型的合成氨过程一段炉氧气含量在线估计方法 |
CN109858511A (zh) * | 2018-11-30 | 2019-06-07 | 杭州电子科技大学 | 基于协同表示的安全半监督超限学习机分类方法 |
US10678196B1 (en) * | 2020-01-27 | 2020-06-09 | King Abdulaziz University | Soft sensing of a nonlinear and multimode processes based on semi-supervised weighted Gaussian regression |
WO2020247949A1 (en) * | 2019-06-07 | 2020-12-10 | The Regents Of The University Of California | General form of the tree alternating optimization (tao) for learning decision trees |
CN112650063A (zh) * | 2020-12-30 | 2021-04-13 | 浙江大学 | 一种基于半监督增量高斯混合回归的自适应软测量方法 |
-
2021
- 2021-07-30 CN CN202110872306.6A patent/CN113707240B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108664706A (zh) * | 2018-04-16 | 2018-10-16 | 浙江大学 | 一种基于半监督贝叶斯高斯混合模型的合成氨过程一段炉氧气含量在线估计方法 |
CN109858511A (zh) * | 2018-11-30 | 2019-06-07 | 杭州电子科技大学 | 基于协同表示的安全半监督超限学习机分类方法 |
WO2020247949A1 (en) * | 2019-06-07 | 2020-12-10 | The Regents Of The University Of California | General form of the tree alternating optimization (tao) for learning decision trees |
US10678196B1 (en) * | 2020-01-27 | 2020-06-09 | King Abdulaziz University | Soft sensing of a nonlinear and multimode processes based on semi-supervised weighted Gaussian regression |
CN112650063A (zh) * | 2020-12-30 | 2021-04-13 | 浙江大学 | 一种基于半监督增量高斯混合回归的自适应软测量方法 |
Non-Patent Citations (1)
Title |
---|
基于循环神经网络的半监督动态软测量建模方法;邵伟明等;电子测量与仪器学报(第11期);12-18 * |
Also Published As
Publication number | Publication date |
---|---|
CN113707240A (zh) | 2021-11-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113707240B (zh) | 基于半监督非线性变分贝叶斯混合模型的成分参数鲁棒软测量方法 | |
CN112131212A (zh) | 基于集成学习技术面向混合云场景的时序数据异常预测方法 | |
CN111047012A (zh) | 基于深度双向长短期记忆网络的空气质量预测方法 | |
CN108873859B (zh) | 基于改进关联规则的桥式抓斗卸船机故障预测模型方法 | |
CN111325403B (zh) | 一种公路隧道机电设备剩余寿命预测方法 | |
CN109033524B (zh) | 一种基于鲁棒混合模型的化工过程浓度变量在线估计方法 | |
CN113642666B (zh) | 一种基于样本扩充和筛选的主动增强软测量方法 | |
CN113011102B (zh) | 基于多元时间序列的Attention-LSTM的青霉素发酵过程故障预测方法 | |
CN114841073A (zh) | 基于局部标签传播的即时学习半监督软测量建模方法 | |
CN114169254A (zh) | 基于短期建筑能耗预测模型的异常能耗诊断方法及系统 | |
CN113281229B (zh) | 一种基于小样本下多模型自适应大气pm2.5浓度预测方法 | |
CN114239397A (zh) | 基于动态特征提取与局部加权深度学习的软测量建模方法 | |
CN111143768A (zh) | 一种基于arima-svm组合模型的空气质量预测算法 | |
CN101673096B (zh) | 一种丹参注射液生产浓缩过程密度的软测量方法 | |
CN115034129A (zh) | 一种面向火电厂脱硝装置的NOx排放浓度软测量方法 | |
CN112395684A (zh) | 一种高速列车走行部系统智能故障诊断方法 | |
Zhou et al. | Multi-rate principal component regression model for soft sensor application in industrial processes | |
CN116779172A (zh) | 一种基于集成学习的肺癌疾病负担风险预警方法 | |
Mu et al. | Semi-supervised learning-based calibration model building of NIR spectroscopy for in situ measurement of biochemical processes under insufficiently and inaccurately labeled samples | |
CN108664706A (zh) | 一种基于半监督贝叶斯高斯混合模型的合成氨过程一段炉氧气含量在线估计方法 | |
CN108171002B (zh) | 一种基于半监督混合模型的聚丙烯熔融指数预测方法 | |
CN115035962A (zh) | 基于变分自编码器和生成对抗网络的虚拟样本生成及软测量建模方法 | |
CN116738866B (zh) | 一种基于时间序列特征提取的即时学习的软测量建模方法 | |
Li et al. | A model combining seq2seq network and lightgbm algorithm for industrial soft sensor | |
CN116881798A (zh) | 用于气象等复杂系统的基于变量选择和反向时滞特征选择的条件格兰杰因果分析方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |