CN113191082B - 基于机器学习的模型参数获取方法、系统及可读介质 - Google Patents
基于机器学习的模型参数获取方法、系统及可读介质 Download PDFInfo
- Publication number
- CN113191082B CN113191082B CN202110483532.5A CN202110483532A CN113191082B CN 113191082 B CN113191082 B CN 113191082B CN 202110483532 A CN202110483532 A CN 202110483532A CN 113191082 B CN113191082 B CN 113191082B
- Authority
- CN
- China
- Prior art keywords
- model
- function
- delay
- parameter
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/11—Complex mathematical operations for solving equations, e.g. nonlinear equations, general mathematical optimization problems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02E—REDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
- Y02E60/00—Enabling technologies; Technologies with a potential or indirect contribution to GHG emissions mitigation
Abstract
本发明公开了一种基于机器学习的模型参数获取方法、系统及可读介质,建立延迟状态空间模型、全局模型,通过机器学习算法即EM算法确定参数估计,所述的延迟状态空间模型,引入一个隐藏变量表示在时间t生效的子模型,得到输出模型;利用贝叶斯规则得出延迟的概率,使用卡尔曼滤波器对这些密度函数进行数值计算;用当前估计的参数评估Q函数,在下一个最大化步骤中,通过最大化Q函数获得新参数;最大化Q函数,对每个参数执行微分运算;通过将导数等于零来计算每次迭代时系统参数的最佳估计。本发明通过使用多个双速率状态空间模型来逼近具有不同工作条件的参数变化时延系统。
Description
技术领域
本发明涉及精馏塔系统的参数估计和时延辨识领域,属于复杂工业过程辨识和控制领域。
背景技术
随着现代工业过程规模的不断扩大和复杂性的日益提高,建立有效的过程监控方法是确保生产安全、提高产品质量和保证经济效益的关键。对于复杂的工业过程来说,往往难以得到精确的数学模型对全过程进行能量和物料平衡关系的描述,而随着计算机技术的不断发展,控制装置对工业现场的信息采集、处理和加工能力显著加强,工业过程中采集和存储的过程数据越来越丰富,如何从海量数据中挖掘出有价值的过程信息,成为具有实际应用意义的研究课题。在这样的背景下,基于多元统计理论的统计过程监控方法应运而生,并在近年来取得了广泛的关注和应用。
多模态工业过程中,往往存在某些不可测变量(例如化工过程中的精馏塔产品组分浓度),这些不可测变量(也称作隐藏变量)往往用来描述这些过程的动态特性。由于物理条件或经济方面的约束,比如某些在线传感器价格特别昂贵,导致某些关键变量缺乏在线测量手段,或者只有稀少的滞后实验室化验值,难以有效地控制和提高生产效率,降低成本。对于这类复杂系统,传统的等周期采样数据计算机控制建模理论和辨识方法已不再适用,研究这类存在不可测变量的多模态系统建模及参数估计方法具有极为重要的意义。
发明内容
1、本发明的目的
本发明要解决的技术问题是提供一种辨识算法来估计精馏塔时延系统以达到对系统参数辨识的高精度。
2、本发明所采用的技术方案
其中,{xt}是精馏塔精馏过程中不可测量的状态;输入{ut,t=1,2,...,L}是精馏塔的回流流量和再沸器加热流量,并且在每个采样周期Δt可测量;顶部产物的组成是不规则采样的输出,仅在时刻t=Ti·Δt且具有未知的时间延迟λi·Δt时才可用,每个数据样本的延迟有所不同;ωt和分别是精馏过程噪声和测量噪声;ωt和是分别具有协方差矩阵Q和R的独立且分布均匀的高斯噪声;延迟λi为遵循任何离散分布的随机整数;
建立全局模型,即每个局部模型的加权插值,采用指数加权函数来表示每个局部模型的权重;
通过机器学习算法即EM算法确定参数估计,所述的延迟状态空间模型,引入一个隐藏变量表示在时间t生效的子模型,得到输出模型;
利用贝叶斯规则得出延迟的概率,使用卡尔曼滤波器对这些密度函数进行数值计算;用当前估计的参数Θk评估Q函数,在下一个最大化步骤中,通过最大化Q函数获得新参数Θk+1;为了最大化Q函数,对每个参数执行微分运算;通过将导数等于零来计算每次迭代时系统参数的最佳估计。
优选的,建立延迟状态空间模型:
假设λi在0和q之间遵循均匀分布,
其中,q为正整数,由于操作条件的变化,单个模型不足以表示过程动力学;因此,使用全局模型,它是每个局部模型的加权插值,如下:
其中,xt和yt分别表示t时刻精馏过程的状态变量和输出变量,j和J为整数常数,αtj为权重,为常数;此处采用指数加权函数来表示每个局部模型的权重:
其中,ωtj为指数函数,Ht为t时刻的操作变量,Hj为j时刻的操作变量,t为时间,j为常数,σj表示每个局部模型的有效宽度,该宽度由σmin(σj,j=1:J)和σmax(σj,j=1:J)界定;归一化权重推导为α
其中,αtj为权重,ωij为指数函数。
优选的,通过EM算法确定参数估计:
对于所提出的状态空间模型,引入一个隐藏变量It表示在时间t生效的子模型;数据集Cobs为{u1,...,uT}和{H1,...,HT},隐藏状态X={x1,...,xT},则隐藏的模型特性I={I1,...,IT}和时间延迟λi看作是潜在数据Cmis;Q函数为
其中,Ht表示在时间t的调度变量的测量值,Hj是第jth个工作点,σj表示第jth个局部模型的有效宽度;
使用移位算子的属性,状态方程改写为
xt=(zI-A)-1but+(zI-A)-1ωt
其中,α(z)是传递函数的分母,即系统的特征多项式,而β(z)是传递函数的分子,由下式定义
α(z):=z-ndet[zI-A]
=z-n(zn+α1zn-1+α2zn-2+…+αn)
=1+α1z-1+α2z-2+…+αnz-n,
β(z):=z-ncadj[zI-A]b
=β0+β1z-1+β2z-1+…+βnz-n
OE模型和FIR模型的参数之间的关系描述为
f0=β0,
输出误差(OE)或传递函数模型已被广泛用于设计高级控制,一个多虑输出误差模型为
用来近似由下式给出的阶数nf的方程
优选的,利用贝叶斯规则得出延迟的概率为:
评估Q函数,需要密度函数p(x1:T|Cobs,Θk)的值,使用卡尔曼滤波器对这些密度函数进行数值计算;在期望步骤中,使用当前估计的参数Θk评估Q函数,在下一个最大化步骤中,通过最大化Q函数获得新参数Θk+1;最大化Q函数,对每个参数执行微分运算;因此,通过将导数等于零来计算每次迭代时系统参数的最佳估计
本发明提出了一种基于参数估计的精馏塔时延系统,包括存储器和处理器,存储器存储有计算机程序,所述处理器执行所述计算机程序时实现所述的方法步骤。
本发明提出了一种计算机可读存储介质,其上存储有计算机程序,所述的计算机程序被处理器执行时实现所述的方法步骤。
3.本发明所采用的有益效果
(1)对于在不同工况下的整个工作范围内的动态过程辨识,很难通过单一过程模型来捕获过程动力学,本发明可以采用传统的辨识方法来进行参数估计。通过使用多个双速率状态空间模型来逼近具有不同工作条件的参数系统。
(2)本发明探索了一种EM算法,以交互方式估计隐藏变量,参数变量,状态变量和时间变量,通过引入隐藏变量并组合卡尔曼平滑器来延迟。
(3)本发明研究了带迟延的状态空间模型的联合参数和状态估计问题。借助于卡尔曼滤波器和平滑器,获得了一种EM识别方法来同时估计状态和参数。所提出的算法与递归最小二乘参数辨识方法不同,后者仅利用状态观测器来近似未知状态,而忽略了过程噪声和噪声在状态估计过程中的影响。
(4)本发明考虑了用于辨识具有迟延的状态空间系统的EM算法,并提出了多模型来描述所考虑的系统。在借助EM方法基于估计的状态对参数进行估计的同时,由Kalman平滑器使用获取的系统参数更新状态。通过最大化所有状态延迟的联合后验概率来估计时间延迟,并且可以通过解决离散优化问题来实现。
(3)本发明具有延迟的状态空间系统的参数估计。基于卡尔曼滤波器和平滑器,以系统状态不可预测,时延不确定为隐藏变量,推导了迭代EM算法。未知的系统状态和参数是交互式估算的。数值仿真和实验结果表明了EM算法的优越性。本发明中使用的算法可以应用于具有延迟的非线性系统。仿真案例研究表明,所提出的算法/过程在设计和实现上是有效和高效的。
附图说明
图1为本发明的精馏塔示意图;
图2为本发明的不确定迟延估计;
图3为本发明的参数估计;
图4为本发明的测量值与预测值的比较;
图5为本发明的真实输出与估计输出的比较。
具体实施方式
下面结合本发明实例中的附图,对本发明实例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域技术人员在没有做创造性劳动前提下所获得的所有其他实施例,都属于本发明的保护范围。
下面将结合附图对本发明实例作进一步地详细描述。
实施例
许多工业过程通常以某些“有序”的方式进行操作以满足不同的生产目标。这种有序的方式也称为操作轨迹,它由几个预先设计的操作点组成。使用“H”表示操作过程所依据的操作变量。考虑具有以下时间延迟的状态空间模型:
xt+1=Axt+but+ωt,
其中,{xt}是精馏塔精馏过程中不可测量的状态;输入{ut,t=1,2,...,L}是精馏塔的回流流量和再沸器加热流量,并且在每个采样周期Δt可测量;顶部产物的组成是不规则采样的输出,仅在时刻t=Ti·Δt且具有未知的时间延迟λii·Δt时才可用(每个数据样本的延迟可能有所不同);ωt和分别是精馏过程噪声和测量噪声;ωt和是分别具有协方差矩阵Q和R的独立且分布均匀的高斯噪声。延迟λi是可以遵循任何离散分布的随机整数。假设它在0和q之间遵循均匀分布,
其中,q为正整数,由于操作条件的变化,单个模型不足以表示过程动力学。因此,使用全局模型,它是每个局部模型的加权插值,如下所示:
其中,xt和yt分别表示t时刻精馏过程的状态变量和输出变量,j和J为整数常数,αtj为权重(常数)。此处采用指数加权函数来表示每个局部模型的权重
其中,ωtj为指数函数,Ht为t时刻的操作变量,Hj为j时刻的操作变量,t为时间,j为常数,σj表示每个局部模型的有效宽度,该宽度由σmin(σj,j=1:J)和σmax(σj,j=1:J)界定。归一化权重可以推导为α
其中,αtj为权重,ωtj为指数函数。下面将展示如何在EM算法的方案下制定参数估计问题。
对于所提出的状态空间模型,引入一个隐藏变量It表示在时间t生效的子模型。数据集Cobs为{u1,...,uT}和{H1,...,HT},隐藏状态X={x1,...,xT},则隐藏的模型特性I={I1,...,IT}和时间延迟λi可以看作是潜在数据Cmis。Q函数为
其中,τik为延迟的概率,yTi为精馏在Ti时刻的输出,为精馏在Ti-λi时刻的状态估计值,λi为延迟,k为正整数,N为正整数,T为时间,C为常数。可以将第jth个局部模型在第tth个采样时间生效的概率计算为
其中,Ht表示在时间t的调度变量的测量值,Hj是第jth个工作点,σj表示第jth个局部模型的有效宽度。
使用移位算子的属性,状态方程可以改写为
xt=(zI-A)-1but+(zI-A)-1ωt,
其中,α(z)是传递函数的分母,即系统的特征多项式,而β(z)是传递函数的分子,它们由下式定义
α(z):=z-ndet[zI-A]
=z-n(zn+α1zn-1+α2zn-2+...+αn)
=1+α1z-1+α2z-2+...+αnz-n,
β(z):=z-nc adj[zI-A]b
=β0+β1z-1+β2z-1+...+βnz-n.
OE模型和FIR模型的参数之间的关系描述为
f0=β0,
输出误差(OE)或传递函数模型已被广泛用于设计高级控制,一个多虑输出误差模型为
可以用来近似由下式给出的足够大的阶数nf的方程
为了评估Q函数,需要密度函数p(x1:T|Cobs,Θk)的值,由于直接计算很困难,因此将使用卡尔曼滤波器对这些密度函数进行数值计算。在期望步骤中,使用当前估计的参数Θk评估Q函数,在下一个最大化步骤中,通过最大化Q函数获得新参数Θk+1。为了最大化Q函数,对每个参数执行微分运算。因此,可以通过将导数等于零来计算每次迭代时系统参数的最佳估计
本发明中的模型可应用于精馏塔。精馏广泛用于许多生产过程,例如炼油和化学工业,并且是过程工业应用中最常见的单元之一。在精馏塔中,将回流流量和再沸器加热流量用作输入变量ut,以控制顶部产品和底部产品的组成。另外,将回流速度用作干扰变量ω,顶部产物的组成用作输出变量精馏塔的示意图如图1所示。
参照附图的图2-图3,可以得出:提出的EM算法具有良好的辨识性能,经过几次迭代后,可以将参数逼近为真实参数。测量值和预测值的比较结果,真实输出和估计输出的比较结果如图4-5所示。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。
Claims (6)
1.一种基于机器学习的模型参数获取方法,其特征在于:
其中,{xt}是精馏塔精馏过程中不可测量的状态;输入{ut,t=1,2,...,L}是精馏塔的回流流量和再沸器加热流量,并且在每个采样周期Δt可测量;顶部产物的组成是不规则采样的输出,仅在时刻t=Ti·Δt且具有未知的时间延迟λi·Δt时才可用,每个数据样本的延迟有所不同;ωt和分别是精馏过程噪声和测量噪声;ωt和是分别具有协方差矩阵Q和R的独立且分布均匀的高斯噪声;延迟λi为遵循任何离散分布的随机整数;
建立全局模型,即每个局部模型的加权插值,采用指数加权函数来表示每个局部模型的权重;
通过机器学习算法即EM算法确定参数估计,所述的延迟状态空间模型,引入一个隐藏变量表示在时间t生效的子模型,得到输出模型;
利用贝叶斯规则得出延迟的概率,使用卡尔曼滤波器对这些密度函数进行数值计算;用当前估计的参数Θk评估Q函数,在下一个最大化步骤中,通过最大化Q函数获得新参数Θk+1;为了最大化Q函数,对每个参数执行微分运算;通过将导数等于零来计算每次迭代时系统参数的最佳估计;
通过EM算法确定参数估计:
对于所提出的状态空间模型,引入一个隐藏变量It表示在时间t生效的子模型;数据集Cobs为{u1,...,uΤ}和{H1,...,HΤ},隐藏状态X={x1,...,xΤ},则隐藏的模型特性I={I1,...,IΤ}和时间延迟λi看作是潜在数据Cmis;Q函数为
其中,Ht表示在时间t的调度变量的测量值,Hj是第jth个工作点,σj表示第jth个局部模型的有效宽度;
使用移位算子的属性,状态方程改写为
xt=(zI-A)-1but+(zI-A)-1wt
其中,α(z)是传递函数的分母,即系统的特征多项式,而β(z)是传递函数的分子,由下式定义
α(z):=z-ndet[zI-A]
=z-n(zn+α1zn-1+α2zn-2+…+αn)
=1+α1z-1+α2z-2+…+αnz-n,
β(z):=z-ncadj[zI-A]b
=β0+β1z-1+β2z-1+…+βnz-n
OE模型和FIR模型的参数之间的关系描述为
f0=β0,
输出误差OE或传递函数模型已被广泛用于设计高级控制,一个多虑输出误差模型为:
用来近似由下式给出的阶数nf的方程
2.根据权利要求1所述的基于机器学习的模型参数获取方法,其特征在于,建立延迟状态空间模型:
假设λi在0和q之间遵循均匀分布,
其中,q为正整数,由于操作条件的变化,单个模型不足以表示过程动力学;因此,使用全局模型,它是每个局部模型的加权插值,如下:
其中,xt和yt分别表示t时刻精馏过程的状态变量和输出变量,j和J为整数常数,αtj为权重,为常数;此处采用指数加权函数来表示每个局部模型的权重:
其中,ωtj为指数函数,Ht为t时刻的操作变量,Hj为j时刻的操作变量,t为时间,j为常数,σj表示每个局部模型的有效宽度,该宽度由σmin(σj,j=1:J)和σmax(σj,j=1:J)界定;归一化权重推导为α
其中,αtj为权重,ωtj为指数函数。
5.一种基于参数估计的精馏塔时延系统,包括存储器和处理器,存储器存储有计算机程序,其特征在于;所述处理器执行所述计算机程序时实现如权利要求1-4任一所述的方法步骤。
6.一种计算机可读介质,其上存储有计算机程序,其特征在于:所述的计算机程序被处理器执行时实现如权利要求1-4任一所述的方法步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110483532.5A CN113191082B (zh) | 2021-04-30 | 2021-04-30 | 基于机器学习的模型参数获取方法、系统及可读介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110483532.5A CN113191082B (zh) | 2021-04-30 | 2021-04-30 | 基于机器学习的模型参数获取方法、系统及可读介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113191082A CN113191082A (zh) | 2021-07-30 |
CN113191082B true CN113191082B (zh) | 2022-09-13 |
Family
ID=76983367
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110483532.5A Active CN113191082B (zh) | 2021-04-30 | 2021-04-30 | 基于机器学习的模型参数获取方法、系统及可读介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113191082B (zh) |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7289906B2 (en) * | 2004-04-05 | 2007-10-30 | Oregon Health & Science University | Navigation system applications of sigma-point Kalman filters for nonlinear estimation and sensor fusion |
US8532863B2 (en) * | 2009-09-28 | 2013-09-10 | Sri International | Audio based robot control and navigation |
EP2429138A1 (en) * | 2010-09-07 | 2012-03-14 | Technische Universität Graz | Method for the determination of the number of superimposed signals using variational bayesian inference |
CN111381498B (zh) * | 2020-03-09 | 2020-12-08 | 常熟理工学院 | 多传感器基于多率变时滞状态空间模型的期望最大化辨识方法 |
CN111308979B (zh) * | 2020-03-09 | 2020-11-24 | 常熟理工学院 | 基于多率迟延状态空间模型的u控制系统 |
-
2021
- 2021-04-30 CN CN202110483532.5A patent/CN113191082B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN113191082A (zh) | 2021-07-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Tepljakov | Fractional-order modeling and control of dynamic systems | |
Yuan et al. | Weighted linear dynamic system for feature representation and soft sensor application in nonlinear dynamic industrial processes | |
CA2718911C (en) | Method of multi-dimensional nonlinear control | |
CN111308979B (zh) | 基于多率迟延状态空间模型的u控制系统 | |
CN110045606A (zh) | 一种用于分布式参数系统在线建模的增量时空学习方法 | |
CN112989711B (zh) | 基于半监督集成学习的金霉素发酵过程软测量建模方法 | |
CN102004444A (zh) | 稀土萃取过程组分含量多模型预测控制方法 | |
Hocalar et al. | Comparison of different estimation techniques for biomass concentration in large scale yeast fermentation | |
Castañeda et al. | Decentralized neural identifier and control for nonlinear systems based on extended Kalman filter | |
CN114580747A (zh) | 基于数据相关性和模糊系统的异常数据预测方法及系统 | |
Kusiak et al. | Effective strategies of metamodelling of industrial metallurgical processes | |
Gašperin et al. | Application of unscented transformation in nonlinear system identification | |
Shi et al. | Machine learning accelerated pde backstepping observers | |
Li et al. | Adaptive soft sensor based on a moving window just-in-time learning LS-SVM for distillation processes | |
CN113191082B (zh) | 基于机器学习的模型参数获取方法、系统及可读介质 | |
Pires et al. | Methodology for modeling fuzzy Kalman filters of minimum realization from evolving clustering of experimental data | |
Li et al. | Identification and nonlinear model predictive control of MIMO Hammerstein system with constraints | |
Liu et al. | Iterative state and parameter estimation algorithms for bilinear state-space systems by using the block matrix inversion and the hierarchical principle | |
Zhao et al. | A Kalman–Koopman LQR control approach to robotic systems | |
Chang et al. | A GREY-BASED ROLLING PROCEDURE FOR SHORT-TERM FORECASTING USING LIMITED TIME SERIES DATA. | |
CN111507003A (zh) | 基于质量相关动态特性提取的脱丁烷塔关键变量预测方法 | |
Peerajit | Accurate Average Run Length Analysis for Detecting Changes in a Long-Memory Fractionally Integrated MAX Process Running on EWMA Control Chart | |
CN111650894A (zh) | 一种基于隐变量的贝叶斯网络复杂工业过程软测量方法 | |
CN110597203A (zh) | 一种基于多gpu并行crpf的故障诊断方法 | |
CN104133373A (zh) | 基于改进型递推最小二乘的室温被控对象在线辨识算法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |