CN112837761A - 一种烟气成分的预测方法 - Google Patents

一种烟气成分的预测方法 Download PDF

Info

Publication number
CN112837761A
CN112837761A CN202011579151.9A CN202011579151A CN112837761A CN 112837761 A CN112837761 A CN 112837761A CN 202011579151 A CN202011579151 A CN 202011579151A CN 112837761 A CN112837761 A CN 112837761A
Authority
CN
China
Prior art keywords
sample
variable
training set
quality
normalized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011579151.9A
Other languages
English (en)
Inventor
彭志平
李德阳
宋执环
崔得龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong University of Petrochemical Technology
Original Assignee
Guangdong University of Petrochemical Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong University of Petrochemical Technology filed Critical Guangdong University of Petrochemical Technology
Priority to CN202011579151.9A priority Critical patent/CN112837761A/zh
Publication of CN112837761A publication Critical patent/CN112837761A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/30Prediction of properties of chemical compounds, compositions or mixtures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/11Complex mathematical operations for solving equations, e.g. nonlinear equations, general mathematical optimization problems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C10/00Computational theoretical chemistry, i.e. ICT specially adapted for theoretical aspects of quantum chemistry, molecular mechanics, molecular dynamics or the like

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computational Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Analysis (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Operations Research (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Algebra (AREA)
  • Chemical & Material Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及石油化工及能源领域,更具体地,涉及一种烟气成分的预测方法,包括以下步骤:步骤S1:收集乙烯裂解炉工业过程的历史数据,建立训练集;所述历史数据为用于反映裂解炉燃烧效率与状态的数据;所述训练集包括辅助变量数据集和质量变量数据集;步骤S2:对训练集进行标准化处理,获取标准化训练集;所述标准化训练集为均值为0,方差为1的数据集;步骤S3:根据标准化训练集初始化模型参数;步骤S4:以迭代的方式优化模型参数;步骤S5:根据优化后的模型参数获取质量变量的预测值。本发明能准确预测烟气成分。

Description

一种烟气成分的预测方法
技术领域
本发明涉及石油化工及能源领域,更具体地,涉及一种烟气成分的预测方法。
背景技术
乙烯裂解炉用于加工裂解气,是乙烯生产装置的核心设备,主要作用是把天然气、炼厂气、原油及石脑油等各类原材料加工成裂解气,并提供给其它乙烯装置,最终加工成乙烯、丙烯及各种副产品。在乙烯裂解炉工业过程中,裂解炉内的烟气主要成分包括氧气、一氧化碳、二氧化碳。这些烟气成分含量反映了裂解炉燃烧效率与状态,实时监测烟气主要成分浓度是实现裂解炉运行状态智能调控的重要前提。然而这些质量变量(主要为:氧气浓度、一氧化碳浓度和二氧化碳浓度)的测量通常是通过分析仪在尾气排放处测量的,存在测量滞后和测量间隔时间长问题,无法直接用于燃烧反馈控制。软测量本质上是数学模型,能够根据易于测量的过程变量(也叫作辅助变量),如烟气流量、炉内温度、炉内压力等,在线预测这些质量变量。软测量因其无延迟和便于维护等优点,在过程监控、闭环控制、过程优化等方面发挥着重要作用。
乙烯裂解炉工业过程呈现非线性、非高斯性、多模态等特性。这些特性增加了开发高精度软测量模型的难度。此外,通过硬件传感器获得的一些工业过程变量的测量值不可避免地存在观察误差、记录错误、测量干扰或数据缺失等问题,导致可用来进行统计分析的数据集被离群点污染。不幸的是,这些离群点很难被完全识别和移除。因此,混合Student’st模型被提出并且应用到多模态工业过程的鲁棒软测量开发。混合Student’s t模型可以按概率组合一组Student’s t分布来近似任意复杂的非高斯分布,并通过对每个Student’s t分量赋予不同的重要性来构造局部模型,从而实现非线性、非高斯性和过程不确定性的建模。Student’s t分布相较于高斯分布具有重尾特性,能够对工业过程数据集中的离群点具有一定的鲁棒特性。然而,现有的混合Student’s t模型在软测量开发时都是针对单质量变量的,而忽略了多质量变量的预测问题,尤其是乙烯裂解炉烟气成分中多质量变量相互耦合下的预测问题。若考虑在单质量变量混合Student’s t模型的基础上,设计一种多质量变量的模型结构,以及多质量变量联合学习算法,可实现对多质量变量的乙烯裂解炉烟气成分的多质量变量联合鲁棒软测量建模,由此解决问题。因此,目前亟需一种能准确预测烟气成分的测量方法。
发明内容
为了解决上述问题,本发明提供一种烟气成分的预测方法,该方法能准确预测烟气成分。
本发明采取的技术方案是:
一种烟气成分的预测方法,包括以下步骤:
步骤S1:收集乙烯裂解炉工业过程的历史数据,建立训练集;
所述历史数据为用于反映裂解炉燃烧效率与状态的数据;
所述训练集包括辅助变量数据集和质量变量数据集;
步骤S2:对训练集进行标准化处理,获取标准化训练集;
所述标准化训练集为均值为0,方差为1的数据集;
步骤S3:根据标准化训练集初始化模型参数;
步骤S4:以迭代的方式优化模型参数;
步骤S5:根据优化后的模型参数获取质量变量的预测值。
具体地,首先,收集乙烯裂解炉工业过程的历史数据,历史数据用于反映裂解炉燃烧效率与状态,一般为烟气流量、炉内温度、炉内压力、各种气体浓度等,以此建立训练集。其中,烟气流量、炉内温度、炉内压力为辅助变量,由辅助变量数据集存储,各种气体浓度为质量变量,由质量变量数据集存储。然后,对训练集进行标准化处理,获取标准化训练集。之后,利用标准化训练集进行概率密度估计,确定组分,建立模型参数。所述组分指炉内烟气的各种成分,如氧气、一氧化碳和二氧化碳都为烟气的组分。最后,优化模型参数,以优化好的模型参数预测烟气成分。
进一步地,所述训练集为D=[X;Y],D∈R(d+m)×N;所述训练集采集的样本数为N,每个样本包含一个辅助变量样本和一个质量变量样本;所述R为实数集;所述辅助变量数据集为X={x1,x2,…,xN}∈Rd×N,用于存储辅助变量样本;所述辅助变量样本为维度为d的多维数组,每个辅助变量样本包含至少一种辅助变量,即d≥1;所述辅助变量为用于预测质量变量的量;所述质量变量数据集为Y={y1,y2,…,yN}∈Rm×N,用于存储质量变量样本;所述质量变量样本为维度为m的多维数组,每个质量变量样本包含至少一种质量变量,即m≥1;所述质量变量为用于反映裂解炉燃烧效率与状态的量;所述标准化训练集为
Figure BDA0002864864540000021
所述
Figure BDA0002864864540000022
为标准化后的辅助变量数据集,
Figure BDA0002864864540000031
所述
Figure BDA0002864864540000032
为标准化后的质量变量数据集,
Figure BDA0002864864540000033
具体地,虽然质量变量可以反映裂解炉燃烧效率与状态,但是一般只能在尾气排放时测量,存在测量滞后和测量间隔时间过长的问题,无法直接用于燃烧反馈控制。因此,一般的做法是先采集易于测量的辅助变量,然后通过辅助变量预测质量变量,再通过预测出来的质量变量反映裂解炉燃烧效率与状态。训练集采集的样本为N,样本数与辅助变量样本数、质量变量样本数对应,相应的采集到的辅助变量样本的数量也为N,N个辅助变量样本预估出来的质量变量样本数量也为N。
进一步地,所述标准化后的辅助变量样本的概率密度函数为:
Figure BDA0002864864540000034
所述标准化后的质量变量样本的概率密度函数为:
Figure BDA0002864864540000035
所述
Figure BDA0002864864540000036
为第n个标准化后的辅助变量样本,
Figure BDA0002864864540000037
所述
Figure BDA0002864864540000038
为第n个标准化后的质量变量样本;所述zn为第n个样本对应的类别隐变量,zn=(zn1,zn2,…,znK);所述K为组分数量;所述αk为第k个组分的混合系数;所述μk为第k个组分中标准化后的辅助变量样本对应的均值向量;所述Λk为第k个组分中标准化后的辅助变量样本对应的精度矩阵;所述υk为第k个组分中标准化后的辅助变量样本对应的自由度参数;所述Φk为第k个组分中标准化后的质量变量样本与标准化后的辅助变量样本之间的回归系数;所述∑k为第k个组分中标准化后的质量变量样本与标准化后的辅助变量样本之间的协方差矩阵;所述Φk和∑k的维度为m+1。
进一步地,所述模型参数为:
Figure BDA0002864864540000039
进一步地,所述步骤S4中迭代的方式为重复执行期望最大化算法。
具体地,期望最大化算法(Expectation Maximization)简称EM算法,是一类算法的总称。EM算法分为E-Step和M-Step两步。EM算法的应用范围很广,一般用于基本机器学习中迭代优化参数模型。E-Step:E的全称是Expectation,即期望的意思。E-step也是获取期望的过程。即根据现有的模型,计算各个观测数据输入到模型中的计算结果。这个过程称为期望值计算过程,即E过程。M-Step:M的全称是Maximization,即最大化的意思。M-step也是期望最大化的过程。得到一轮期望值以后,重新计算模型参数,以最大化期望值。这个过程为最大化过程,即M过程。最大化的意思是我们在使用这个模型时希望我们定义的函数能使得到的结果最大化,而结果越大越接近我们希望得到的结果。我们优化的目标也就是这些能得到最大值的函数。
进一步地,所述期望最大化算法包括:
E-step:
根据模型参数计算样本对应的类别隐变量的后验分布:
Figure BDA0002864864540000041
所述样本的类别隐变量Z=(z1,z2,…,zN);所述
Figure BDA0002864864540000042
为高斯分布的概率密度函数;所述St(·)为Student’s t分布的概率密度函数;
根据样本对应的类别隐变量的后验分布,获取样本由组分解释的后验概率的数学期望:
Figure BDA0002864864540000043
为了后续推导的简洁性,其中第n个样本由第k个组分解释的后验概率的数学期望
Figure BDA0002864864540000044
简记为Rnk
对样本引入对应的中间隐变量;所述中间隐变量的后验分布的数学期望为:
Figure BDA0002864864540000045
所述中间隐变量为η=(η12,…,ηN);所述ηnk为第n个样本对应的中间隐变量;所述ψ(·)为digamma函数。
具体地,首先,根据模型参数计算第n个样本对应的类别隐变量的后验分布为:
Figure BDA0002864864540000046
换算后为
Figure BDA0002864864540000047
然后,根据第n个样本对应的类别隐变量的后验分布获取第n个样本由第k个组分解释的后验概率的数学期望。
最后,由于Student’s t分布不属于指数家族分布,因此对Student’s t分布进行最大似然估计往往很难得到解析解。通过对第k个组分的第n个辅助变量样本
Figure BDA0002864864540000048
引入中间隐变量ηnk;Student’s t分布可写成
Figure BDA0002864864540000051
其中Gam(·)表示Gamma分布的概率密度函数。由于高斯分布和Gamma分布隶属于指数家族分布,因此执行最大似然估计可以获得解析解。为了便于推导,我们定义
Figure BDA0002864864540000052
Figure BDA0002864864540000053
对于中间隐变量η=(η12,…,ηN),其后验分布的数学期望
Figure BDA0002864864540000054
换算后为:
Figure BDA0002864864540000055
Figure BDA0002864864540000056
进一步地,在E-step之后,所述期望最大化算法还包括:
M-step:
根据E-step获取的数学期望,计算训练集的对数似然函数的数学期望:
Figure BDA0002864864540000057
其中,
Figure BDA0002864864540000058
Figure BDA0002864864540000059
Figure BDA00028648645400000510
Figure BDA00028648645400000511
执行最大化似然估计更新模型参数:
Figure BDA00028648645400000512
Figure BDA00028648645400000513
Figure BDA00028648645400000514
Figure BDA0002864864540000061
Figure BDA0002864864540000062
所述更新的υk通过求解非线性方程获取,非线性方程如下:
Figure BDA0002864864540000063
根据更新后的模型参数计算训练集的对数似然函数的数学期望
Figure BDA0002864864540000064
Figure BDA0002864864540000065
收敛,模型参数为最终模型参数;若
Figure BDA0002864864540000066
不收敛,则重复E-step和M-step,直至对数似然函数的数学期望
Figure BDA0002864864540000067
收敛为止。
具体地,根据E-step求解得到的数学期望,计算训练集的对数似然函数的数学期望,然后执行最大化似然估计获取模型参数的更新公式。假设所有数据样本服从独立同分布假设,可得到上述训练集的对数似然函数的数学期望。最后通过训练集的对数似然函数的数学期望计算
Figure BDA0002864864540000068
Figure BDA0002864864540000069
不收敛,则重复E-step和M-step,否则确定模型参数为最终模型参数,以此迭代优化模型参数。
进一步地,所述步骤S5包括:
步骤S5.1:计算待测样本对应的类别隐变量的后验概率:
Figure BDA00028648645400000610
为了后续推导的简洁性,其中待测样本对应的类别隐变量的后验概率
Figure BDA00028648645400000611
简记为Rqk;所述待测样本的辅助变量样本为
Figure BDA00028648645400000612
所述待测样本对应的类别隐变量为zq={zq1,zq2,…,zqK};
步骤S5.2:根据待测样本对应的类别隐变量的后验概率,计算待测样本的质量变量样本关于辅助变量样本的条件概率分布:
Figure BDA00028648645400000613
所述待测样本的质量变量样本为
Figure BDA00028648645400000614
Figure BDA00028648645400000615
步骤S5.3:根据待测样本的质量变量样本关于辅助变量样本的条件概率分布,计算待测样本的质量变量样本的预测值:
Figure BDA0002864864540000071
进一步地,所述辅助变量样本包括:炉膛温度、炉管外壁温度、引风机转速、烧嘴燃料量、进风量中的一种或多种。
进一步地,所述质量变量样本包括:氧气浓度、一氧化碳浓度和二氧化碳浓度中的一种或多种。
与现有技术相比,本发明的有益效果为:
(1)设计多质量变量的模型及多质量变量联合学习算法,实现对具有多质量变量的乙烯裂解炉的鲁棒软测量。
(2)可以有效处理数据缺失、质量差等情形,能够实现乙烯裂解炉烟气成分的实时多变量预测。
附图说明
图1为本发明的流程图。
具体实施方式
本发明附图仅用于示例性说明,不能理解为对本发明的限制。为了更好说明以下实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
实施例
本实施例提供一种烟气成分的预测方法,图1为本发明的流程图,如图所示,包括以下步骤:
步骤S1:收集乙烯裂解炉工业过程的历史数据,建立训练集;
所述历史数据为用于反映裂解炉燃烧效率与状态的数据;
所述训练集包括辅助变量数据集和质量变量数据集;
步骤S2:对训练集进行标准化处理,获取标准化训练集;
所述标准化训练集为均值为0,方差为1的数据集;
步骤S3:根据标准化训练集初始化模型参数;
步骤S4:以迭代的方式优化模型参数;
步骤S5:根据优化后的模型参数获取质量变量的预测值。
具体地,首先,收集乙烯裂解炉工业过程的历史数据,历史数据用于反映裂解炉燃烧效率与状态,一般为烟气流量、炉内温度、炉内压力、各种气体浓度等,以此建立训练集。其中,烟气流量、炉内温度、炉内压力为辅助变量,由辅助变量数据集存储,各种气体浓度为质量变量,由质量变量数据集存储。然后,对训练集进行标准化处理,获取标准化训练集。之后,利用标准化训练集进行概率密度估计,确定组分,建立模型参数。所述组分指炉内烟气的各种成分,如氧气、一氧化碳和二氧化碳都为烟气的组分。最后,优化模型参数,以优化好的模型参数预测烟气成分。
进一步地,所述训练集为D=[X;Y],D∈R(d+m)×N;所述训练集采集的样本数为N,每个样本包含一个辅助变量样本和一个质量变量样本;所述R为实数集;所述辅助变量数据集为X={x1,x2,…,xN}∈Rd×N,用于存储辅助变量样本;所述辅助变量样本为维度为d的多维数组,每个辅助变量样本包含至少一种辅助变量,即d≥1;所述辅助变量为用于预测质量变量的量;所述质量变量数据集为Y={y1,y2,…,yN}∈Rm×N,用于存储质量变量样本;所述质量变量样本为维度为m的多维数组,每个质量变量样本包含至少一种质量变量,即m≥1;所述质量变量为用于反映裂解炉燃烧效率与状态的量;所述标准化训练集为
Figure BDA0002864864540000081
所述
Figure BDA0002864864540000082
为标准化后的辅助变量数据集,
Figure BDA0002864864540000083
所述
Figure BDA0002864864540000084
为标准化后的质量变量数据集,
Figure BDA0002864864540000085
具体地,虽然质量变量可以反映裂解炉燃烧效率与状态,但是一般只能在尾气排放时测量,存在测量滞后和测量间隔时间过长的问题,无法直接用于燃烧反馈控制。因此,一般的做法是先采集易于测量的辅助变量,然后通过辅助变量预测质量变量,再通过预测出来的质量变量反映裂解炉燃烧效率与状态。训练集采集的样本为N,样本数与辅助变量样本数、质量变量样本数对应,相应的采集到的辅助变量样本的数量也为N,N个辅助变量样本预估出来的质量变量样本数量也为N。
进一步地,所述标准化后的辅助变量样本的概率密度函数为:
Figure BDA0002864864540000086
所述标准化后的质量变量样本的概率密度函数为:
Figure BDA0002864864540000091
所述
Figure BDA0002864864540000092
为第n个标准化后的辅助变量样本,
Figure BDA0002864864540000093
所述
Figure BDA0002864864540000094
为第n个标准化后的质量变量样本;所述zn为第n个样本对应的类别隐变量,zn=(zn1,nn2,…,znK);所述K为组分数量;所述αk为第k个组分的混合系数;所述μk为第k个组分中标准化后的辅助变量样本对应的均值向量;所述Λk为第k个组分中标准化后的辅助变量样本对应的精度矩阵;所述υk为第k个组分中标准化后的辅助变量样本对应的自由度参数;所述Φk为第k个组分中标准化后的质量变量样本与标准化后的辅助变量样本之间的回归系数;所述∑k为第k个组分中标准化后的质量变量样本与标准化后的辅助变量样本之间的协方差矩阵;所述Φk和∑k的维度为m+1。
进一步地,所述模型参数为:
Figure BDA0002864864540000095
进一步地,所述步骤S4中迭代的方式为重复执行期望最大化算法。
具体地,期望最大化算法(Expectation Maximization)简称EM算法,是一类算法的总称。EM算法分为E-Step和M-Step两步。EM算法的应用范围很广,一般用于基本机器学习中迭代优化参数模型。E-Step:E的全称是Expectation,即期望的意思。E-step也是获取期望的过程。即根据现有的模型,计算各个观测数据输入到模型中的计算结果。这个过程称为期望值计算过程,即E过程。M-Step:M的全称是Maximization,即最大化的意思。M-step也是期望最大化的过程。得到一轮期望值以后,重新计算模型参数,以最大化期望值。这个过程为最大化过程,即M过程。最大化的意思是我们在使用这个模型时希望我们定义的函数能使得到的结果最大化,而结果越大越接近我们希望得到的结果。我们优化的目标也就是这些能得到最大值的函数。
进一步地,所述期望最大化算法包括:
E-step:
根据模型参数计算样本对应的类别隐变量的后验分布:
Figure BDA0002864864540000096
所述样本的类别隐变量Z=(z1,z2,…,zN);所述
Figure BDA0002864864540000097
为高斯分布的概率密度函数;所述St(·)为Student’s t分布的概率密度函数;
根据样本对应的类别隐变量的后验分布,获取样本由组分解释的后验概率的数学期望:
Figure BDA0002864864540000101
为了后续推导的简洁性,其中第n个样本由第k个组分解释的后验概率的数学期望
Figure BDA0002864864540000102
简记为Rnk
对样本引入对应的中间隐变量;所述中间隐变量的后验分布的数学期望为:
Figure BDA0002864864540000103
所述中间隐变量为η=(η12,…,ηN);所述ηnk为第n个样本对应的中间隐变量;所述ψ(·)为digamma函数。
具体地,首先,根据模型参数计算第n个样本对应的类别隐变量的后验分布为:
Figure BDA0002864864540000104
换算后为
Figure BDA0002864864540000105
然后,根据第n个样本对应的类别隐变量的后验分布获取第n个样本由第k个组分解释的后验概率的数学期望。
最后,由于Student’s t分布不属于指数家族分布,因此对Student’s t分布进行最大似然估计往往很难得到解析解。通过对第k个组分的第n个辅助变量样本
Figure BDA0002864864540000106
引入中间隐变量ηnk;Student’s t分布可写成
Figure BDA0002864864540000107
其中Gam(·)表示Gamma分布的概率密度函数。由于高斯分布和Gamma分布隶属于指数家族分布,因此执行最大似然估计可以获得解析解。为了便于推导,我们定义
Figure BDA0002864864540000108
Figure BDA0002864864540000109
对于中间隐变量η=(η12,…,ηN),其后验分布的数学期望
Figure BDA00028648645400001010
换算后为:
Figure BDA00028648645400001011
Figure BDA00028648645400001012
进一步地,在E-step之后,所述期望最大化算法还包括:
M-step:
根据E-step获取的数学期望,计算训练集的对数似然函数的数学期望:
Figure BDA00028648645400001013
其中,
Figure BDA0002864864540000111
Figure BDA0002864864540000112
Figure BDA0002864864540000113
Figure BDA0002864864540000114
执行最大化似然估计更新模型参数:
Figure BDA0002864864540000115
Figure BDA0002864864540000116
Figure BDA0002864864540000117
Figure BDA0002864864540000118
Figure BDA0002864864540000119
所述更新的υk通过求解非线性方程获取,非线性方程如下:
Figure BDA00028648645400001110
根据更新后的模型参数计算训练集的对数似然函数的数学期望
Figure BDA00028648645400001111
Figure BDA00028648645400001112
收敛,模型参数为最终模型参数;若
Figure BDA00028648645400001113
不收敛,则重复E-step和M-step,直至对数似然函数的数学期望
Figure BDA00028648645400001114
收敛为止。
具体地,根据E-step求解得到的数学期望,计算训练集的对数似然函数的数学期望,然后执行最大化似然估计获取模型参数的更新公式。假设所有数据样本服从独立同分布假设,可得到上述训练集的对数似然函数的数学期望。最后通过训练集的对数似然函数的数学期望计算
Figure BDA0002864864540000121
Figure BDA0002864864540000122
不收敛,则重复E-step和M-step,否则确定模型参数为最终模型参数,以此迭代优化模型参数。
进一步地,所述步骤S5包括:
步骤S5.1:计算待测样本对应的类别隐变量的后验概率:
Figure BDA0002864864540000123
为了后续推导的简洁性,其中待测样本对应的类别隐变量的后验概率
Figure BDA0002864864540000124
简记为Rqk;所述待测样本的辅助变量样本为
Figure BDA0002864864540000125
所述待测样本对应的类别隐变量为zq={zq1,zq2,…,zqK};
步骤S5.2:根据待测样本对应的类别隐变量的后验概率,计算待测样本的质量变量样本关于辅助变量样本的条件概率分布:
Figure BDA0002864864540000126
所述待测样本的质量变量样本为
Figure BDA0002864864540000127
Figure BDA0002864864540000128
步骤S5.3:根据待测样本的质量变量样本关于辅助变量样本的条件概率分布,计算待测样本的质量变量样本的预测值:
Figure BDA0002864864540000129
进一步地,所述辅助变量样本包括:炉膛温度、炉管外壁温度、引风机转速、烧嘴燃料量、进风量中的一种或多种。
进一步地,所述质量变量样本包括:氧气浓度、一氧化碳浓度和二氧化碳浓度中的一种或多种。
显然,本发明的上述实施例仅仅是为清楚地说明本发明技术方案所作的举例,而并非是对本发明的具体实施方式的限定。凡在本发明权利要求书的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。

Claims (10)

1.一种烟气成分的预测方法,其特征在于,包括以下步骤:
步骤S1:收集乙烯裂解炉工业过程的历史数据,建立训练集;
所述历史数据为用于反映裂解炉燃烧效率与状态的数据;
所述训练集包括辅助变量数据集和质量变量数据集;
步骤S2:对训练集进行标准化处理,获取标准化训练集;
所述标准化训练集为均值为0,方差为1的数据集;
步骤S3:根据标准化训练集初始化模型参数;
步骤S4:以迭代的方式优化模型参数;
步骤S5:根据优化后的模型参数获取质量变量的预测值。
2.根据权利要求1所述的一种烟气成分的预测方法,其特征在于,所述训练集为D=[X;Y],D∈R(d+m)×N;所述训练集采集的样本数为N,每个样本包含一个辅助变量样本和一个质量变量样本;所述R为实数集;所述辅助变量数据集为X={x1,x2,...,xN}∈Rd×N,用于存储辅助变量样本;所述辅助变量样本为维度为d的多维数组,每个辅助变量样本包含至少一种辅助变量,即d≥1;所述辅助变量为用于预测质量变量的量;所述质量变量数据集为Y={y1,y2,...,yN}∈Rm×N,用于存储质量变量样本;所述质量变量样本为维度为m的多维数组,每个质量变量样本包含至少一种质量变量,即m≥1;所述质量变量为用于反映裂解炉燃烧效率与状态的量;所述标准化训练集为
Figure FDA0002864864530000011
所述
Figure FDA0002864864530000012
为标准化后的辅助变量数据集,
Figure FDA0002864864530000013
所述
Figure FDA0002864864530000014
为标准化后的质量变量数据集,
Figure FDA0002864864530000015
3.根据权利要求2所述的一种烟气成分的预测方法,其特征在于,所述标准化后的辅助变量样本的概率密度函数为:
Figure FDA0002864864530000016
所述标准化后的质量变量样本的概率密度函数为:
Figure FDA0002864864530000017
所述
Figure FDA0002864864530000018
为第n个标准化后的辅助变量样本,
Figure FDA0002864864530000019
所述
Figure FDA00028648645300000110
为第n个标准化后的质量变量样本;所述zn为第n个样本对应的类别隐变量,zn=(zn1,zn2,...,znK);所述K为组分数量;所述αk为第k个组分的混合系数;所述μk为第k个组分中标准化后的辅助变量样本对应的均值向量;所述Λk为第k个组分中标准化后的辅助变量样本对应的精度矩阵;所述υk为第k个组分中标准化后的辅助变量样本对应的自由度参数;所述Φk为第k个组分中标准化后的质量变量样本与标准化后的辅助变量样本之间的回归系数;所述∑k为第k个组分中标准化后的质量变量样本与标准化后的辅助变量样本之间的协方差矩阵;所述Φk和∑k的维度为m+1。
4.根据权利要求3所述的一种烟气成分的预测方法,其特征在于,所述模型参数为:
Figure FDA0002864864530000021
5.根据权利要求4所述的一种烟气成分的预测方法,其特征在于,所述步骤S4中迭代的方式为重复执行期望最大化算法。
6.根据权利要求5所述的一种烟气成分的预测方法,其特征在于,所述期望最大化算法包括:
E-step:
根据模型参数计算样本对应的类别隐变量的后验分布:
Figure FDA0002864864530000022
所述样本的类别隐变量为Z=(z1,z2,...,zN);所述
Figure FDA0002864864530000023
为高斯分布的概率密度函数;所述St(·)为Student’s t分布的概率密度函数;
根据样本对应的类别隐变量的后验分布,获取样本由组分解释的后验概率的数学期望:
Figure FDA0002864864530000024
其中第n个样本由第k个组分解释的后验概率的数学期望
Figure FDA0002864864530000025
简记为Rnk
对样本引入对应的中间隐变量;所述中间隐变量的后验分布的数学期望为:
Figure FDA0002864864530000026
所述中间隐变量为η=(η1,η2,...,ηN);所述ηnk为第n个样本对应的中间隐变量;所述ψ(·)为digamma函数。
7.根据权利要求6所述的一种烟气成分的预测方法,其特征在于,在E-step之后,所述期望最大化算法还包括:
M-step:
根据E-step获取的数学期望,计算训练集的对数似然函数的数学期望:
Figure FDA0002864864530000027
其中,
Figure FDA0002864864530000031
Figure FDA0002864864530000032
Figure FDA0002864864530000033
Figure FDA0002864864530000034
执行最大化似然估计更新模型参数:
Figure FDA0002864864530000035
Figure FDA0002864864530000036
Figure FDA0002864864530000037
Figure FDA0002864864530000038
Figure FDA0002864864530000039
所述更新的υk通过求解非线性方程获取,非线性方程如下:
Figure FDA00028648645300000310
根据更新后的模型参数计算训练集的对数似然函数的数学期望
Figure FDA00028648645300000311
Figure FDA00028648645300000312
收敛,模型参数为最终模型参数;若
Figure FDA00028648645300000313
不收敛,则重复E-step和M-step,直至对数似然函数的数学期望
Figure FDA00028648645300000314
收敛为止。
8.根据权利要求7所述的一种烟气成分的预测方法,其特征在于,所述步骤S5包括:
步骤S5.1:计算待测样本对应的类别隐变量的后验概率:
Figure FDA0002864864530000041
其中待测样本对应的类别隐变量的后验概率
Figure FDA0002864864530000042
简记为Rqk;所述待测样本的辅助变量样本为
Figure FDA0002864864530000043
所述待测样本对应的类别隐变量为zq={zq1,zq2,...,zqK};
步骤S5.2:根据待测样本对应的类别隐变量的后验概率,计算待测样本的质量变量样本关于辅助变量样本的条件概率分布:
Figure FDA0002864864530000044
所述待测样本的质量变量样本为
Figure FDA0002864864530000045
步骤S5.3:根据待测样本的质量变量样本关于辅助变量样本的条件概率分布,计算待测样本的质量变量样本的预测值:
Figure FDA0002864864530000046
9.根据权利要求1所述的一种烟气成分的预测方法,其特征在于,所述辅助变量样本包括:炉膛温度、炉管外壁温度、引风机转速、烧嘴燃料量、进风量中的一种或多种。
10.根据权利要求1所述的一种烟气成分的预测方法,其特征在于,所述质量变量样本包括:氧气浓度、一氧化碳浓度和二氧化碳浓度中的一种或多种。
CN202011579151.9A 2020-12-28 2020-12-28 一种烟气成分的预测方法 Pending CN112837761A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011579151.9A CN112837761A (zh) 2020-12-28 2020-12-28 一种烟气成分的预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011579151.9A CN112837761A (zh) 2020-12-28 2020-12-28 一种烟气成分的预测方法

Publications (1)

Publication Number Publication Date
CN112837761A true CN112837761A (zh) 2021-05-25

Family

ID=75925034

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011579151.9A Pending CN112837761A (zh) 2020-12-28 2020-12-28 一种烟气成分的预测方法

Country Status (1)

Country Link
CN (1) CN112837761A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100145896A1 (en) * 2007-08-22 2010-06-10 Fujitsu Limited Compound property prediction apparatus, property prediction method, and program for implementing the method
CN102456142A (zh) * 2010-11-02 2012-05-16 上海宝信软件股份有限公司 一种基于计算机视觉的烟气黑度分析方法
CN103884670A (zh) * 2014-03-13 2014-06-25 西安交通大学 基于近红外光谱的烟气成分定量分析方法
CN109033524A (zh) * 2018-06-27 2018-12-18 浙江大学 一种基于鲁棒混合模型的化工过程浓度变量在线估计方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100145896A1 (en) * 2007-08-22 2010-06-10 Fujitsu Limited Compound property prediction apparatus, property prediction method, and program for implementing the method
CN102456142A (zh) * 2010-11-02 2012-05-16 上海宝信软件股份有限公司 一种基于计算机视觉的烟气黑度分析方法
CN103884670A (zh) * 2014-03-13 2014-06-25 西安交通大学 基于近红外光谱的烟气成分定量分析方法
CN109033524A (zh) * 2018-06-27 2018-12-18 浙江大学 一种基于鲁棒混合模型的化工过程浓度变量在线估计方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
周书恒 等: "基于迁移学习的裂解炉产率建模", 《化工学报》 *

Similar Documents

Publication Publication Date Title
CN111804146B (zh) 一种智能喷氨控制方法以及智能喷氨控制装置
CN104778298A (zh) 基于egmm的高斯过程回归软测量建模方法
CN109492319B (zh) 一种火电厂锅炉烟气含氧量软测量方法
CN116448419A (zh) 基于深度模型高维参数多目标高效寻优的零样本轴承故障诊断方法
CN112650063B (zh) 一种基于半监督增量高斯混合回归的自适应软测量方法
CN113012766B (zh) 一种基于在线选择性集成的自适应软测量建模方法
CN114036736B (zh) 一种基于局部格兰杰因果分析的因果网络学习方法
CN111814956A (zh) 一种基于多维度二次特征提取的多任务学习的空气质量预测方法
CN110046377B (zh) 一种基于异构相似度的选择性集成即时学习软测量建模方法
CN114239400A (zh) 基于局部双加权概率隐变量回归模型的多工况过程自适应软测量建模方法
CN110189800A (zh) 基于多粒度级联循环神经网络的炉氧含量软测量建模方法
CN114117919B (zh) 基于样本协同表示的即时学习的软测量建模方法
CN117497038B (zh) 一种基于核方法的快速优化培养基配方的方法
CN114528764A (zh) 基于整体优化的即时学习的软测量建模方法及装置
Li et al. Data cleaning method for the process of acid production with flue gas based on improved random forest
CN112837761A (zh) 一种烟气成分的预测方法
CN113707240B (zh) 基于半监督非线性变分贝叶斯混合模型的成分参数鲁棒软测量方法
CN113222268B (zh) 一种基于多模式推理的烟草烘烤质量预测模型建立方法
CN114924489A (zh) 一种适用于流程工业预测控制的模型自主学习方法
CN115186584A (zh) 一种融合注意力机制和自适应构图的宽度学习半监督软测量建模方法
CN115222114A (zh) 汽车零部件装配指标值预测方法、终端设备及存储介质
CN114943328A (zh) 基于bp神经网络非线性组合的sarima-gru时序预测模型
CN114970674A (zh) 一种基于关联度对齐的时序数据概念漂移适配方法
CN112836431A (zh) 基于pso-lstm的青霉素发酵过程故障预测方法
CN110879873B (zh) 一种基于哈密顿蒙特卡洛采样的vine copula相关性描述的软测量方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination