CN110826184B - 一种在时变时滞下narx模型结构和参数的变分贝叶斯辨识方法 - Google Patents

一种在时变时滞下narx模型结构和参数的变分贝叶斯辨识方法 Download PDF

Info

Publication number
CN110826184B
CN110826184B CN201910953433.1A CN201910953433A CN110826184B CN 110826184 B CN110826184 B CN 110826184B CN 201910953433 A CN201910953433 A CN 201910953433A CN 110826184 B CN110826184 B CN 110826184B
Authority
CN
China
Prior art keywords
model
parameters
theta
parameter
time lag
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910953433.1A
Other languages
English (en)
Other versions
CN110826184A (zh
Inventor
靳其兵
韩雨薇
蔡鋈
周星
王再富
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Guokong Tiancheng Technology Co ltd
Beijing University of Chemical Technology
Original Assignee
Beijing Guokong Tiancheng Technology Co ltd
Beijing University of Chemical Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Guokong Tiancheng Technology Co ltd, Beijing University of Chemical Technology filed Critical Beijing Guokong Tiancheng Technology Co ltd
Priority to CN201910953433.1A priority Critical patent/CN110826184B/zh
Publication of CN110826184A publication Critical patent/CN110826184A/zh
Application granted granted Critical
Publication of CN110826184B publication Critical patent/CN110826184B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Feedback Control In General (AREA)

Abstract

本发明公开了一种针对时变时滞下NARX模型的结构和参数的辨识方法。该辨识方法主要包括:首先采用加权多项式作为基函数来表达NARX模型,利用稀疏估计的基础,通过向参数先验中引入稀疏因子独立作用于每个子模型的权重,在整个变分贝叶斯框架下正确地将模型的结构选择出来。对于模型参数的辨识,将每一时刻的时滞值作为缺失变量,利用变分贝叶斯的迭代公式,随着模型结构的正确选择,将对应的未知参数和时变时滞估计出来。本发明的优点:(1)在时变时滞下,能将NARX模型的结构和参数有效地辨识出来(2)能实现对每一时刻时滞的分布进行估计。

Description

一种在时变时滞下NARX模型结构和参数的变分贝叶斯辨识 方法
技术领域
本发明属于系统辨识领域,涉及带有时变时滞的非线性自回归模型的辨识方案
背景技术
近年来,非线性系统辨识成为一个重要而具有挑战性的问题。具有外部输入的非线性自回归(NARX)模型是一类建立在带外部输入的线性自回归模型的基础上的非线性黑箱模型。NARX可以描述一般的非线性,具有良好的函数逼近能力,因此其辨识受到广泛关注。NARX可通过子模型加权的方式表示为参数线性的紧凑形式,子模型可选择为多项式、径向基函数或小波函数。因此NARX模型的辨识包括选择一个具有好的解释能力的最简模型结构及其参数辨识。
目前,NARX模型的识别方法可分为几种类型。其中,最小二乘法和最大似然法是常用的经典方法,包括正回归法、正、反修剪法、稀疏估计法和EM算法。此外,贝叶斯模型识别在近几十年发展迅速,它比其他算法有许多优势。例如:1.不确定性被内部描述,对于分析、仿真和控制设计都很有用2.过度拟合可通过对过于复杂的模型进行自然惩罚来避免3.即使对于样本相对较少的数据记录,模型不确定性也可以精确地量化4.可以在可用的地方加入信息。 NARX识别的贝叶斯方法包括基于高斯过程的非参数方法和基于可逆跳马尔可夫链蒙特卡罗(RJMCMC)等。近年来,一些学者将稀疏技术与贝叶斯方法相结合,发展了稀疏贝叶斯学习方法、稀疏贝叶斯增广拉格朗日算法等。此外, W.R.Jacobs等人还提出了一种新的稀疏贝叶斯识别方法,该方法采用稀疏诱导超先验和变分推理,比MCMC方法快一个数量级。
现提出的NARX模型的辨识方法大都假设没有时滞存在或者只存在单一时滞,但是由于网络传输、硬件限制、化学反应过程等原因,许多控制过程存在时变时滞。如何在时变时滞下对NARX模型结构和参数辨识,成为亟待解决的技术问题。对此,D.H.Zhou等人提出了一种改进的强跟踪滤波器(MSTF)来估计 NARX过程的时变延迟和参数。然而延时变化率必须比输入信号慢,否则算法将失效。期望最大化(EM)算法是识别具有时滞等潜在变量的系统的有效方法。变分贝叶斯(VB)作为EM的一种推广,可以实现参数和时间延迟的估计分布,而不是点估计。因此,在时变延迟下,有学者提出利用VB算法对ARX线性系统进行辨识,可以取得较好的效果,同时也对将线性系统推广到非线性系统提供了很好的思路。
发明内容
对于在时变时滞下NARX模型的结构和参数辨识问题,为了克服现有技术的不足,本发明提供了一种辨识方案。本发明的目的是通过以下技术方案实现的:对带输入时变时滞的NARX模型,使用带稀疏因子的变分贝叶斯方法来辨识结构和参数。首先采用加权多项式作为基函数来表达NARX模型,利用ARD稀疏估计的基础,通过向参数先验中引入稀疏因子独立作用于每个子模型的权重,在整个变分贝叶斯框架下正确地将模型的结构选择出来。对于模型参数的辨识,将每一时刻的时滞值作为隐变量,利用变分贝叶斯的迭代公式,随着模型结构的正确选择,将对应的未知参数和时变时滞估计出来。
本发明的流程图如图1所示,其特征在于包括两大阶段:
第一阶段,进行结构预设/结构初始化,将NARX非线性模型转化为多项式子模型加权和的形式;
第一阶段所述的带时变时滞的单输入单输出NARX模型描述如下:
Figure RE-GDA0002361860280000021
其中,f(·)是某个非线性函数;{uk}和{yk}分别是采样得到的输入和输出数据;下标k表示第k个采样时刻;nu,ny分别是输入和输出的最大动态阶次;λk为第k个采样时刻出现的时滞,
Figure RE-GDA0002361860280000022
{vk}是均值为0,方差为δ-1的高斯分布白噪声;
可对动态阶次nu、ny及多项式阶次nl设置上限,将NARX模型表示为多项式子模型加权和的形式:
Figure RE-GDA0002361860280000023
Φk=[φ12,…,φM],θ=[θ12,…,θM]T
其中,φm是由
Figure RE-GDA0002361860280000031
构成的多项式子模型,例如,
Figure RE-GDA0002361860280000032
M表示多项式子模型的个数由输入输出的动态阶次nu、ny以及多项式的最大阶次nl决定,θm表示每个子模型的权重参数;因此可得一个初始的模型集Φk。初始的最大模型集中会出现冗余子模型结构项,需将其从子模型集中剔除。
第二阶段,对多项式子模型加权和的形式进行结构辨识和参数辨识,即选出能够表达系统的最佳多项式子模型集Φk,以及求出时变时滞下模型对应的参数 {Θ,β},其中Θ={θ,δ,α},β={β12,…,βj,…},θ表示子模型的权重向量,δ表示噪声方差的逆,α表示参数θ的先验分布中引入的稀疏因子,βj表示时滞值j 出现的概率,具体包括以下步骤:
步骤一:设置参数的先验分布,所述的设置参数的先验分布指对使用变分贝叶斯方法进行辨识时所需要的参数设置参数先验,包括设置参数θ的先验分布,α的先验分布,噪声方差的逆δ的先验分布,以及时滞的先验分布,具体如下:
为实现结构辨识,在参数θ的先验分布中引入稀疏因子α,同时为实现共轭分布,选择θ的先验分布为正态分布,具体如下,
p(θ|α)=p(θ|0,(A)-1)
其中,α=(α12,…,αm,…,αM)T=diag(A),αm用于控制θm变化的幅度,由分析可知,如果
Figure RE-GDA0002361860280000033
则θm越接近于0,说明第m个子模型项对数据来说不显著,为冗余结构,应该将其从模型集中移除;
同样,为得到一个共轭分布,将α的先验分布设置为Gamma分布:
Figure RE-GDA0002361860280000034
考虑到辨识问题的一般情况,噪声的方差未知,同样将方差的逆δ作为需要辨识的参数并设置先验分布,即如下:
p(δ)=Gamma(c0,d0) 假设时滞出现的最大值为D,设置时滞的先验分布,可将每种时滞出现的概率初始化为相同的值βj即如下:
Figure RE-GDA0002361860280000041
p(λk=j)=βj
其中,{a0,b0,c0,d0,D}是需要人为给定的初始化超参数;
步骤二:在VB框架下,在步骤一的基础上进行特定结构下的参数辨识,再用其中的稀疏因子对多项式子模型加权和的形式进行结构修剪即把冗余的多项式子模型剔除,用修剪后的新结构再次进行参数辨识,直到多项式子模型加权和的形式最终只保留一项子模型;计算每种结构和及其对应参数下的Evidence Lower Bound,即F[q(λ),q(θ,α,δ)],
对于有时变时滞存在时的变分贝叶斯辨识,优点是可以将时滞作为隐变量,可得到时滞点的后验分布估计。另外,通过上述在参数先验分布中引入稀疏因子,可在VB框架下同时进行结构选择和参数估计,方便实施。
现简要说明VB参数辨识机制:
假设用Cobs,Cmis,β,Θ分别表示观测变量、缺失变量、模型结构和未知参数,我们可得到下式的log似然表达:
logp(Cobs,Cmis|β)=logp(Cobs,Cmis,Θ|β)-logp(Cmis,Θ|Cobs,β)
向上式中加入变分后验q(Cmis,Θ),其进行分解,q(Cmis,Θ)=q(Cmis)q(Θ),可得:
Figure RE-GDA0002361860280000042
对上式等号两边同时对q(Cmis,Θ)取期望可得:
Figure RE-GDA0002361860280000043
定义Evidence Lower Bound为:
Figure RE-GDA0002361860280000051
定义KL散度为:
Figure RE-GDA0002361860280000052
因此有logp(Cobs|β)=L(q)+KL(q||p)。根据KL散度的定义,我们引入的缺失/ 隐变量和代求参数的变分后验联合分布(需要求的)q(Cmis,Θ)越接近于真实的后验分布P(Cmis,Θ|Cobs,β),则KL(q||p)的值越小,此时L(q)越接近于 logp(Cobs|β),使logp(Cobs|β)最大(最大似然)便等价于使L(q)最大。换句话说,我们可以通过求L(q)关于q(Cmis,Θ)的最大值,来得到q(Cmis,Θ)。求出q(Cmis,Θ)后,返代回求出的L(q)越大,则辨识的效果越好。
因为q(Cmis,Θ)可分解q(Cmis,Θ)=q(Cmis)q(Θ),求L(q)关于q(Cmis,Θ)的最大值,可用L(q)分别对q(Cmis)和q(Θ)求偏导并使其等于0来获得q(Cmis)和q(Θ) 的表达式。求q(Cmis)的过程叫做VB的E步;求q(Θ)的过程叫做VB的M步。下面给出q(Cmis)和q(Θ)的一般表达式:
Figure RE-GDA0002361860280000053
Figure RE-GDA0002361860280000054
VB参数辨识过程介绍完毕。
该步骤有两个循环,外层循环为结构修剪循环,内层循环为在特定结构下的参数循环。
外层循环初始设置:初始模型集为最大模型集
Figure RE-GDA0002361860280000055
结构循环标识为s,令s=0。
内层循环过程:(该过程在结构
Figure RE-GDA0002361860280000056
下进行,为方便起见,省略s标识)
1)收集辨识输入输出数据,给出超参数{a0,b0,c0,d0,D}初始值,按照先验分布初始化参数
Figure RE-GDA0002361860280000061
其中
Figure RE-GDA0002361860280000062
是以
Figure RE-GDA0002361860280000063
为对角线值的对角矩阵,
Figure RE-GDA0002361860280000064
符号“-”代表平均值,上标表示参数循环标识,此处为0,表示初始值,M是当前模型集的子模型个数,选择一个小的正数ε,作为参数收敛标准;
2)使用VB方法进行参数辨识,首先用VB的E步得到时滞λ的后验分布更新公式
Figure RE-GDA0002361860280000065
其中,
Figure RE-GDA0002361860280000066
表示在已知Φk
Figure RE-GDA0002361860280000067
λk=j下,第k个时刻输出为yk的概率;
Figure RE-GDA0002361860280000068
表示在第t次迭代时,时滞为j的概率;yk表示k时刻的输出值,Φkj表示k时刻时,时滞为j时的模型集;
Figure RE-GDA0002361860280000069
为t次参数迭代下θ的均值;
Figure RE-GDA00023618602800000610
表示θθT在θ的后验分布下的值, 3)在上步中得到的q(λk=j)下进行VB的M步,得到参数
Figure RE-GDA00023618602800000611
Var(θ)t+1,θt+1
Figure RE-GDA00023618602800000612
Figure RE-GDA00023618602800000613
的更新公式
按下列公式得到参数
Figure RE-GDA00023618602800000614
Var(θ)t+1和θt+1的更新公式:
Figure RE-GDA00023618602800000615
Figure RE-GDA00023618602800000616
Figure RE-GDA00023618602800000617
按下列公式得到参数
Figure RE-GDA00023618602800000618
的更新公式:
q(δ)=Gamma(c,d)
Figure RE-GDA00023618602800000619
Figure RE-GDA0002361860280000071
Figure RE-GDA0002361860280000072
按下列公式得到
Figure RE-GDA0002361860280000073
的更新公式
Figure RE-GDA0002361860280000074
Figure RE-GDA0002361860280000075
Figure RE-GDA0002361860280000076
Figure RE-GDA0002361860280000077
其中,
Figure RE-GDA0002361860280000078
Figure RE-GDA0002361860280000079
中的第m个值,
Figure RE-GDA00023618602800000710
是Var(θ)t中的第m行m列的值;
按下列公式得到参数
Figure RE-GDA00023618602800000711
的更新公式:
Figure RE-GDA00023618602800000712
4)按下列公式判断参数是否收敛
Figure RE-GDA00023618602800000713
若满足上式条件,则跳出内层循环得到参数
Figure RE-GDA00023618602800000714
Var(θ)t+1、θt+1、a 、
Figure RE-GDA00023618602800000715
c、dt+1、q(λk=j)t+1
Figure RE-GDA00023618602800000716
若不满足上式,则t=t+1返回步骤2)
5)参数收敛后,在当前结构和参数下计算Evidence Lower Bound, F[q(λ),q(θ,α,δ)]的计算公式为:
F[q(λ),q(θ,α,δ)]=f1-f2+f3-f4
其中,
Figure RE-GDA0002361860280000081
Figure RE-GDA0002361860280000082
Figure RE-GDA0002361860280000083
Figure RE-GDA0002361860280000084
外层循环过程
1)修剪模型集
计算修剪子模型的指标ARDs,由内层循环得到的参数
Figure RE-GDA0002361860280000085
取逆表示,记为
Figure RE-GDA0002361860280000086
修剪条件:log(ARDs)中的值小于限值
Figure RE-GDA0002361860280000087
的冗余子模型会被从模型中修剪出去,其中,限值
Figure RE-GDA0002361860280000088
的定义如下所示:
Figure RE-GDA0002361860280000089
修剪后得到新的模型集结构
Figure RE-GDA00023618602800000810
模型集的大小M也得到了更新;
2)判断模型个数是否为1,若M=1,则退出外层循环;否则令s=s+1,并
在当前修剪后的模型结构下返回内层循环初始步骤,再次进行参数估计。步骤三:在步骤二的基础上,在最终只保留了一项子模型的结构时,寻找不同结构参数对应的F[q(λ),q(θ,α,δ)]s(s=0,1,2,…是模型修剪的次数)中的最大值,此时最大的F[q(λ),q(θ,α,δ)]函数值对应的模型结构和参数即为最优模型,完成结构辨识和参数辨识。
在最终只保留了一项子模型的结构时,寻找不同结构参数对应的F[q(λ),q(θ,α,δ)]s(s=0,1,2,…是结构循环标识)中的最大值,可见:
Figure RE-GDA0002361860280000091
此时最大的F[q(λ),q(θ,α,δ)]s函数值对应的模型结构
Figure RE-GDA0002361860280000092
和参数Θ*即为最优,完成结构辨识和参数辨识。
有益效果:
由于不确定实验室分析或网络拥堵,时滞在每次采样时变化。无需知道时滞的精确范围,只需给定时滞上界即可。在VB辨识下,可得到每个采样时刻时滞的分布估计而不是点估计。
结构和参数的辨识可在VB框架下迭代进行,在每次模型结构修剪过程中,通过在参数先验中引入稀疏因子,实现了每个子模型与数据预测的相关性度量。对于给定的数据集,不同子模型的显著性是可以直接比较的,因此提供了一种快速简单的模型选择方法。
仿真结果表明,该算法对参数初值不敏感,参数值设置为0也可收敛到真实值。
附图说明
图1为本发明辨识流程图。
图2为一个水箱模型
图3为模型结构修剪图
图4为时滞估计图
具体实施方式
参照附图并举实施例说明本发明的具体实施方式。
图1为本发明提供的一种针对时变时滞下NARX模型结构和参数辨识流程图。
以一个水箱模型为例,见图2,uk
Figure RE-GDA0002361860280000093
分别为阀的开度和进水流量。uk
Figure RE-GDA0002361860280000094
之间存在的非线性关系为:
Figure RE-GDA0002361860280000095
yk为水箱2的液位高度。以
Figure RE-GDA0002361860280000096
为输入、yk为输出的线性部分的传递函数为: G(z)=(b1z-1+b2z-2)/(1+a1z-1+a2z-2)。系统的真实参数为 [a1,a2,b1,b212]T=[-0.5 0.83 0.36 1.1 1 0.58]T
输入序列{uk}取为不相关的持久激励序列,Δt=10s更新一次。由压力传感器得到的输出序列{yk}以相同的时间间隔更新。我们对输入信号手动施加一个变化的时间延迟为10s,20s和30s,以模拟由测量设备和信号通信引入的可能的时间延迟。因此仿真时,实际的时滞为{1,2,3},并且三种时滞时间按概率β1=0.2, β2=0.5,β2=0.3产生。{vk}是方差为0.04的高斯白噪声序列。取N=600个数据进行仿真。
第一阶段:为方便说明,设置nu=ny=2,nl=3,因此得到个子模型个数为 M=34的初始模型集。建立NARX的多项式子模型加权和形式为:
Figure RE-GDA0002361860280000101
Figure RE-GDA0002361860280000102
第二阶段:为进行结构辨识引入稀疏因子α。设置参数先验,将θ的先验分布设置为正态分布;α和δ的分布设置为Gamma分布。
p(θ|α)=p(θ|0,(A)-1)
Figure RE-GDA0002361860280000103
p(δ)=Gamma(c0,d0)
假设关于时滞先验信息为最大时滞时间不超过D,因此设时滞j∝{1,2,…,D}
超参数初始化为:{a0,b0,c0,d0,D}={0.01,0.0001,0.01,0.0001,4}
初始结构下的参数初始化为:
Figure RE-GDA0002361860280000104
Figure RE-GDA0002361860280000105
参数辨识收敛后的子模型对应的权重值以及是否修剪子模型项如下表所示:
计算当前结构和参数下的Evidence Lower Bound,计算出的修剪限值为:
Figure RE-GDA0002361860280000111
Figure RE-GDA0002361860280000112
Figure RE-GDA0002361860280000121
第一轮结构修剪后,新的子模型集为:
Figure RE-GDA0002361860280000122
使用新的模型集重新进行参数辨识,参数收敛后再次计算Evidence Lower Bound和限值
Figure RE-GDA0002361860280000123
第二次模型修剪过程见下表:
Figure RE-GDA0002361860280000124
Figure RE-GDA0002361860280000131
第二次模型修剪后得到的结构为:
Figure RE-GDA0002361860280000132
用新模型继续进行参数辨识,直至模型修剪到剩一个。此时s=6
在每种模型下计算得到的Evidence Lower Bound为
s Evidence Lower Bound
0 -INF
1 517.513701
2 536.349211
3 -524.065867
4 -3139.817458
5 -3535.626748
6 -3653.818099
当s=2时,Evidence Lower Bound有最大值。此时模型的结构和参数为:
Figure RE-GDA0002361860280000133
最优模型结构下,时滞参数的估计值见下表:
Figure RE-GDA0002361860280000134
Figure RE-GDA0002361860280000141
结构辨识结果如图3所示,可知第三次结构迭代,s=2时即可将正确模型选择出来。
时滞辨识结果如图4所示,时滞正确率为:0.825。

Claims (4)

1.一种在时变时滞下NARX模型结构和参数的变分贝叶斯辨识方法,其特征在于包括两大阶段,
第一阶段,对水箱模型进行结构预设,将NARX非线性模型转化为多项式子模型加权和的形式;
第二阶段,对多项式子模型加权和的形式进行结构辨识和参数辨识,即选出能够表达系统的最佳多项式子模型集Φk,以及求出时变时滞下模型对应的参数{Θ,β},其中Θ={θ,δ,α},β={β12,…,βj,…},θ表示子模型的权重向量,δ表示噪声方差的逆,α表示参数θ的先验分布中引入的稀疏因子,βj表示时滞值j出现的概率,具体包括以下步骤:
步骤一:设置参数的先验分布;
步骤二:在VB框架下,在步骤一的基础上进行特定结构下的参数辨识,再用其中的稀疏因子对多项式子模型加权和的形式进行结构修剪即把冗余的多项式子模型剔除,用修剪后的新结构再次进行参数辨识,直到多项式子模型加权和的形式最终只保留一项子模型;计算每种结构和及其对应参数下的Evidence Lower Bound,即F[q(λ),q(θ,α,δ)],
所述的步骤二为:
该步骤有两个循环,外层循环为结构修剪循环,内层循环为在特定结构下的参数循环,
外层循环初始设置:初始模型集为最大模型集
Figure FDA0003109539150000011
结构循环标识为s,令s=0.
内层循环过程:该过程在结构
Figure FDA0003109539150000012
下进行,为方便起见,省略s标识;
1)收集辨识输入输出数据,给出超参数{a0,b0,c0,d0,D}初始值,按照先验分布初始化参数
Figure FDA0003109539150000013
其中
Figure FDA0003109539150000014
是以
Figure FDA0003109539150000015
为对角线值的对角矩阵,
Figure FDA0003109539150000016
符号“-”代表平均值,上标表示参数循环标识,此处为0,表示初始值,M是当前模型集的子模型个数,选择一个小的正数ε,作为参数收敛标准;
2)使用VB方法进行参数辨识,首先用VB的E步得到时滞λ的后验分布更新公式
Figure FDA0003109539150000021
其中,
Figure FDA0003109539150000022
表示在已知Φk
Figure FDA0003109539150000023
λk=j下,第k个时刻输出为yk的概率;
Figure FDA0003109539150000024
表示在第t次迭代时,时滞为j的概率;yk表示k时刻的输出值,Φkj表示k时刻时,时滞为j时的模型集;
Figure FDA0003109539150000025
为t次参数迭代下θ的均值;
Figure FDA0003109539150000026
表示θθT在θ的后验分布下的值,
3)在上步中得到的q(λk=j)下进行VB的M步,按下列公式得到参数
Figure FDA0003109539150000027
Var(θ)t+1,θt+1
Figure FDA0003109539150000028
Figure FDA0003109539150000029
的更新公式
Figure FDA00031095391500000210
Figure FDA00031095391500000211
Figure FDA00031095391500000212
按下列公式得到参数
Figure FDA00031095391500000213
的更新公式:
Figure FDA00031095391500000214
Figure FDA00031095391500000215
Figure FDA00031095391500000216
按下列公式得到
Figure FDA00031095391500000217
的更新公式
Figure FDA00031095391500000218
Figure FDA0003109539150000031
Figure FDA0003109539150000032
其中,
Figure FDA0003109539150000033
Figure FDA0003109539150000034
中的第m个值,
Figure FDA0003109539150000035
是Var(θ)t中的第m行m列的值;
按下列公式得到参数
Figure FDA0003109539150000036
的更新公式:
Figure FDA0003109539150000037
4)按下列公式判断参数是否收敛
Figure FDA0003109539150000038
若满足上式条件,则跳出内层循环得到参数
Figure FDA0003109539150000039
Var(θ)t+1、θt+1、a、
Figure FDA00031095391500000310
c、dt+1、q(λk=j)t+1
Figure FDA00031095391500000311
若不满足上式,则t=t+1返回步骤2)
5)参数收敛后,在当前结构和参数下计算Evidence Lower Bound,F[q(λ),q(θ,α,δ)]的计算公式为:
F[q(λ),q(θ,α,δ)]=f1-f2+f3-f4
其中,
Figure FDA00031095391500000312
Figure FDA00031095391500000313
Figure FDA00031095391500000314
Figure FDA0003109539150000041
外层循环过程
1)修剪模型集
计算修剪子模型的指标ARDs,由内层循环得到的参数
Figure FDA0003109539150000042
取逆表示,记为
Figure FDA0003109539150000043
修剪条件:log(ARDs)中的值小于限值
Figure FDA0003109539150000044
的冗余子模型会被从模型中修剪出去,其中,限值
Figure FDA0003109539150000045
的定义如下所示:
Figure FDA0003109539150000046
修剪后得到新的模型集结构
Figure FDA0003109539150000047
模型集的大小M也得到了更新;
2)判断模型个数是否为1,若M=1,则退出外层循环;否则令s=s+1,并在当前修剪后的模型结构下返回内层循环初始步骤,再次进行参数估计;
步骤三:在步骤二的基础上,在最终只保留了一项子模型的结构时,寻找不同结构参数对应的F[q(λ),q(θ,α,δ)]s中的最大值,此时最大的F[q(λ),q(θ,α,δ)]函数值对应的模型结构和参数即为最优模型,完成结构辨识和参数辨识,s=0,1,2,…是模型修剪的次数。
2.根据权利要求1所述的一种在时变时滞下NARX模型结构和参数的变分贝叶斯辨识方法,其特征在于,第一阶段所述的带时变时滞的单输入单输出NARX模型描述如下:
Figure FDA0003109539150000048
其中,f(·)是某个非线性函数;{uk}和{yk}分别是采样得到的输入和输出数据,即分别是阀的开度和水箱的液位高度;下标k表示第k个采样时刻;nu,ny分别是输入和输出的最大动态阶次;λk为第k个采样时刻出现的时滞,
Figure FDA0003109539150000051
{vk}是均值为0,方差为δ-1的高斯分布白噪声;
可对动态阶次nu、ny及多项式阶次nl设置上限,将NARX模型表示为多项式子模型加权和的形式:
Figure FDA0003109539150000052
Φk=[φ12,…,φM],θ=[θ12,…,θM]T
其中,φm是由
Figure FDA0003109539150000053
构成的多项式子模型,M表示多项式子模型的个数,θm表示每个子模型的权重参数,因此得一个初始的模型集Φk
3.根据权利要求1所述的一种在时变时滞下NARX模型结构和参数的变分贝叶斯辨识方法,其特征在于,所述的步骤一为:
所述的设置参数的先验分布指对使用变分贝叶斯方法进行辨识时所需要的参数设置参数先验,包括设置参数θ的先验分布,α的先验分布,噪声方差的逆δ的先验分布,以及时滞的先验分布,具体如下:
为实现结构辨识,在参数θ的先验分布中引入稀疏因子α,同时为实现共轭分布,选择θ的先验分布为正态分布,具体如下,
p(θ|α)=p(θ|0,(A)-1)
其中,α=(α12,…,αm,…,αM)T=diag(A),αm用于控制θm变化的幅度,由分析可知,如果
Figure FDA0003109539150000054
则θm越接近于0,说明第m个子模型项对数据来说不显著,为冗余结构,应该将其从模型集中移除;
同样,为得到一个共轭分布,将α的先验分布设置为Gamma分布:
Figure FDA0003109539150000055
考虑到辨识问题的一般情况,噪声的方差未知,同样将方差的逆δ作为需要辨识的参数并设置先验分布,即如下:
p(δ)=Gamma(c0,d0)
假设时滞出现的最大值为D,设置时滞的先验分布,将每种时滞出现的概率初始化为相同的值βj即如下:
Figure FDA0003109539150000061
其中,{a0,b0,c0,d0,D}是需要人为给定的初始化超参数。
4.根据权利要求1所述的一种在时变时滞下NARX模型结构和参数的变分贝叶斯辨识方法,其特征在于所述的步骤三为:
在最终只保留了一项子模型的结构时,寻找不同结构参数对应的F[q(λ),q(θ,α,δ)]s中的最大值,s=0,1,2,…是结构循环标识,可见:
Figure FDA0003109539150000062
此时最大的F[q(λ),q(θ,α,δ)]s函数值对应的模型结构
Figure FDA0003109539150000063
和参数Θ*即为最优,完成结构辨识和参数辨识。
CN201910953433.1A 2019-10-09 2019-10-09 一种在时变时滞下narx模型结构和参数的变分贝叶斯辨识方法 Active CN110826184B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910953433.1A CN110826184B (zh) 2019-10-09 2019-10-09 一种在时变时滞下narx模型结构和参数的变分贝叶斯辨识方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910953433.1A CN110826184B (zh) 2019-10-09 2019-10-09 一种在时变时滞下narx模型结构和参数的变分贝叶斯辨识方法

Publications (2)

Publication Number Publication Date
CN110826184A CN110826184A (zh) 2020-02-21
CN110826184B true CN110826184B (zh) 2021-08-17

Family

ID=69548851

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910953433.1A Active CN110826184B (zh) 2019-10-09 2019-10-09 一种在时变时滞下narx模型结构和参数的变分贝叶斯辨识方法

Country Status (1)

Country Link
CN (1) CN110826184B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114595681B (zh) * 2022-02-08 2024-05-28 清华大学 文本切分方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102360454A (zh) * 2011-10-12 2012-02-22 北京交通大学 基于narx神经网络的轮轨力预测方法
CN106683122A (zh) * 2016-12-16 2017-05-17 华南理工大学 一种基于高斯混合模型和变分贝叶斯的粒子滤波方法
CN106971077A (zh) * 2017-03-30 2017-07-21 中国人民解放军国防科学技术大学 一种基于时间片段参数辨识的动态仿真模型验证方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11347191B2 (en) * 2015-07-29 2022-05-31 Illinois Tool Works Inc. System and method to facilitate welding software as a service
CN109284937A (zh) * 2018-10-15 2019-01-29 广东工业大学 一种基于神经网络的输电线路鸟害状态预估方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102360454A (zh) * 2011-10-12 2012-02-22 北京交通大学 基于narx神经网络的轮轨力预测方法
CN106683122A (zh) * 2016-12-16 2017-05-17 华南理工大学 一种基于高斯混合模型和变分贝叶斯的粒子滤波方法
CN106971077A (zh) * 2017-03-30 2017-07-21 中国人民解放军国防科学技术大学 一种基于时间片段参数辨识的动态仿真模型验证方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"Sparse Bayesian Nonlinear System Identification Using Variational Inference";William R. Jacobs等;《IEEE TRANSACTIONS ON AUTOMATIC CONTROL》;20181231;第63卷(第12期);第4172-4187页 *

Also Published As

Publication number Publication date
CN110826184A (zh) 2020-02-21

Similar Documents

Publication Publication Date Title
CN109060001B (zh) 一种基于特征迁移学习的多工况过程软测量建模方法
CN111079836B (zh) 基于伪标签方法和弱监督学习的过程数据故障分类方法
CN107729999A (zh) 考虑矩阵相关性的深度神经网络压缩方法
CN108710974B (zh) 一种基于深度置信网络的水体氨氮预测方法及装置
CN107704962B (zh) 一种基于不完整训练数据集的蒸汽流量区间预测方法
CN110377942B (zh) 一种基于有限高斯混合模型的多模型时空建模方法
CN111027732A (zh) 一种多风电场出力场景的生成方法及系统
Lotrič Wavelet based denoising integrated into multilayered perceptron
CN115561005A (zh) 基于eemd分解和轻量化神经网络的化工过程故障诊断方法
Jiang et al. A new central limit theorem for the augmented ipw estimator: Variance inflation, cross-fit covariance and beyond
CN110826184B (zh) 一种在时变时滞下narx模型结构和参数的变分贝叶斯辨识方法
Regazzoni et al. A physics-informed multi-fidelity approach for the estimation of differential equations parameters in low-data or large-noise regimes
CN114004346A (zh) 基于门控堆叠同构自编码器的软测量建模方法及存储介质
CN116303786B (zh) 一种基于多维数据融合算法的区块链金融大数据管理系统
CN116826739A (zh) 基于单变量时序的超短期农业电力负荷预测方法及装置
CN115794805A (zh) 一种中低压配网量测数据补齐方法
CN115062542A (zh) 基于二维稳健lstm的聚合反应过程质量预测方法
CN112949599B (zh) 基于大数据的候选内容推送方法
CN113723707A (zh) 一种基于深度学习模型的中长期径流趋势预测方法
JP2016520220A (ja) 隠れ属性モデル推定装置、方法およびプログラム
CN111160464B (zh) 基于多隐层加权动态模型的工业高阶动态过程软测量方法
CN113569993A (zh) 一种聚合反应过程质量预测模型构建方法
Li et al. Policy gradient methods with gaussian process modelling acceleration
Wang et al. A super-atomic norm minimization approach to identifying sparse dynamical graphical models
CN113344245A (zh) 混合深度学习短期预测模型、方法、存储介质和计算设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant