CN117518810A - 融合深度信念网络状态估计的模型预测控制方法、电子设备及可存储介质 - Google Patents

融合深度信念网络状态估计的模型预测控制方法、电子设备及可存储介质 Download PDF

Info

Publication number
CN117518810A
CN117518810A CN202311552249.9A CN202311552249A CN117518810A CN 117518810 A CN117518810 A CN 117518810A CN 202311552249 A CN202311552249 A CN 202311552249A CN 117518810 A CN117518810 A CN 117518810A
Authority
CN
China
Prior art keywords
model
control method
dbn
predictive control
mpc
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311552249.9A
Other languages
English (en)
Inventor
承孝敏
徐徐
骆文辉
邢凯
杨华
陈剑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Science and Technology of China USTC
Original Assignee
University of Science and Technology of China USTC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Science and Technology of China USTC filed Critical University of Science and Technology of China USTC
Priority to CN202311552249.9A priority Critical patent/CN117518810A/zh
Publication of CN117518810A publication Critical patent/CN117518810A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明公开了一种融合深度信念网络状态估计的模型预测控制方法、电子设备及可存储介质,属于工业控制技术领域。本发明的模型预测控制方法,包括:配置MPC控制器,将多个相关生产参数输入至MPC控制器;训练DBN模型,并利用该模型估计MPC的状态变量;对MPC控制器中的状态变量进行修改和更新,MPC控制器根据更新后的状态变量和设备数据求解最优控制;进行设备控制,并进行数据反馈。本发明通过对DBN模型进行训练,并利用该模型估计MPC的状态变量,从而可以适用于非线性模型预测控制系统,有利于提高预测控制的准确性。

Description

融合深度信念网络状态估计的模型预测控制方法、电子设备 及可存储介质
技术领域
本发明属于工业控制技术领域,尤其涉及一种融合深度信念网络状态估计的模型预测控制方法、电子设备及可存储介质。
背景技术
模型预测控制(MPC)是一种使用已有模型对系统未来状态进行预测,同时根据预测结果修正被控变量,使系统状态达到预期的控制方法。对系统未来状态预测的准确度由模型的准确度及对系统当前状态估测的准确度来决定,因此,系统状态估测方法对于MPC控制效果有着决定性的影响。
传统的模型预测控制算法(MPC)对于状态X的估计一般采用卡尔曼滤波状态估计器。卡尔曼滤波(Kalman filtering)是一种利用线性系统状态方程,通过系统输入输出观测数据,对系统状态进行最优估计的算法,其具体控制流程如图1所示,状态估测器获取系统当前控制变量u及被控变量y,结合已有模型,给出系统当前状态x的估测值x′,与前述变量一同送入MPC控制器,控制器结合控制参数及模型,计算出控制变量u的推荐值u′,送入系统参与调节。
但卡尔曼滤波存在着一个非常大的局限性——它仅能对线性的过程模型和测量模型进行精确的估计,在非线性的场景中并不能达到最优的估计效果,为了能够设定线性的环境,通常假定过程模型为恒定速度模型,但是显然在现实的应用中并不是这样的,不论是过程模型还是测量模型,都是非线性的。
发明内容
本发明的目的在于提供一种融合深度信念网络的模型预测控制状态估计方法、电子设备及可存储介质,用于解决现有技术中传统模型无法满足实际工业控制系统对复杂非线性系统的状态估计问题。
为了解决上述技术问题,本发明采用的技术方案为:
本发明提供了一种融合深度信念网络状态估计的模型预测控制方法,包括:
配置MPC控制器,将多个相关生产参数输入至MPC控制器;
训练DBN模型,并利用该模型估计MPC的状态变量;
对MPC控制器中的状态变量进行修改和更新,MPC控制器根据更新后的状态变量和设备数据求解最优控制;
进行设备控制,并进行数据反馈。
更进一步的,定义DBN模型的初始输入向量为:
xin=[△u(k)T,y(k)T]
其中,Δu(k)为模型输入,MPC中具体为被控向量;y(k)为模型输出,MPC中具体为观测向量。
更进一步的,在对DBN模型进行训练之前,先通过交叉特征融合的方式,采用FM算法对输入向量进行预处理。
更进一步的,采用二阶交叉特征融合对输入向量进行预处理,特征交叉如下:
其中,d为样本的特征的个数,本发明中具体为xin的长度,两两相互交可得到d(d-1)/2个交叉项;wij是组合对应的权重,用于表达对应特征的重要程度,wij个数为d(d-1)/2。
更进一步的,DBN模型的输出为xout,实测值为ytrue,用对DBN的输出左乘Ca构建损失函数J:
其中,δ为超参数,J的形式随δ的变化而变化,Ca:=[OI]。
更进一步的,DBN模型的学习过程分为两个阶段,先对所有的RBM进行逐层无监督预训练,再用有监督算法进行调优。
更进一步的,所述无监督预训练采用对比散度算法,有监督算法采用BP算法。
本发明还提供了一种可存储介质,所述可存储介质中存储有计算机程序,该计算机程序被处理器调用时运行本发明的模型预测控制方法。
本发明还提供了一种电子设备,包括处理器和可存储介质,可存储介质中存储有计算机程序,当处理器调用上述计算机程序时运行本发明的模型预测控制方法。
由于常规的模型预测控制系统大多采用单一的过程预测模型,由于受到原料状况以及调度策略的改变,化工等领域的生产过程也经常会在多种操作工况之间进行切换,这会使得对于利用卡尔曼滤波进行状态数据的预测出现较大偏差,进而影响模型预测控制的效果。
由于神经网络具有强大的拟合能力,利用工业过程积累的历史数据训练深度学习模型可以建立性能较好的预测效果,本发明提供了一种融合深度信念网络的模型预测控制状态估计方法,相对于现有技术,本发明具有以下优点:
1)诸如水泥煤磨生产过程等领域的控制系统具有非线性、复杂性等特点,而传统的模型预测控制算法所使用的卡尔曼滤波估计算法是线性的,用其对煤磨开环系统进行描述存在一定的误差,本方法融合深度信念网络进行状态估计,能够应用于非线性预测控制系统,克服了传统辨识方法的缺陷。
2)本方法融合深度信念网络(DBN),符合DBN所带来的对数据处理的优点如下:
处理高维数据:DBN能够处理高维数据,这是由于其深层网络结构和随机初始化权重的组合使得模型能够从数据中提取更多的有用特征;
自动学习特征表示:DBN能够通过逐层无监督预训练来自动地学习特征表示;预训练阶段目标是通过对训练数据进行建模,从而使得网络能够学习到数据中的有用结构;
模型可解释性:DBN在每个隐藏层都有一个可视化的权重矩阵,这使得模型的结果能够被解释,这些权重矩阵显示了模型在每个层级上学习的特征;
适用于大规模数据:DBN在大规模数据上具有良好的扩展性,可以处理数百万个特征和样本;
强泛化能力:DBN能够有效地泛化到未见过的数据,因为它通过多层抽象来表示数据,从而提高了模型的泛化能力。
附图说明
图1为现有传统的模型预测控制系统的系统状态估计方法示意图;
图2为本发明实施例的一种融合深度信念网络的模型预测控制状态估计的示意图;
图3为本发明实施例中实现融合深度信念网络的步骤架构图;
图4为本发明实施例的深度信念网络DBN组成结构受限玻尔兹曼机RBM网络结构图;
图5为本发明实施例的深度信念网络DBN训练数据网络架构图;
图6为本发明实施例的特殊RBM联想记忆模块网络结构图。
具体实施方式
为进一步了解本发明的内容,现结合附图和实施例对本发明作详细描述。
如图3所示,本发明实施例提供了一种融合深度信念网络状态估计的模型预测控制方法,包括:
步骤一、配置MPC控制器
通过配置MPC控制器,将多个相关生产参数(控制参数及被控参数)输入至MPC控制器,得到对应的输出。
MPC状态空间以及连续到离散的转化,一般地,用状态空间方程可以描述系统为:
x(k+1)=Ax(k)+Bu(k)
y(k)=Cx(k)
其中,y(k)为k时刻的模型输出,MPC中一般为目标向量;u(k)为k时刻的模型输入,MPC中一般为操纵向量,x(k)为k时刻的状态变量;A为系统状态转移矩阵,大小为1X 1;B为输入转移矩阵;C为输出转移矩阵。
由于损失函数需要优化输入向量的变化量,因此将状态方程中的输入向量替换为输入变化量。令△x(k+1)=x(k+1)-x(k),则有
△y(k+1)=CA△x(k)+CB△u(k)
y(k+1)=y(k)+CA△x(k)+CB△u(k)
写成紧凑的形式
因此,本发明定义一个新的状态空间,其输入向量为原来的输入向量变化量,定义:
新的状态空间方程即为:
xa(k+1)=Aaxa(k)+Ba△u(k)
y(k)=Caxa(k)
考虑位于预测时域上的序列状态,定义Np为预测时域,控制器将会预测一共Nc个状态作为依据进行优化。定义符号x(k+N∣k)表示在k时刻预测的k+N时刻的变量x的值。那么有:
将上式简化表示为
Y=Wxa(k)+Z△U
因此可以构造出损失函数J(△U):
其中,Q和R为半正定矩阵,作用是设定两项优化项的权重,当Q显著大的时候,可以让系统追踪期望向量rp更加紧密,当R显著大的时候可以让系统的输入变化更小,式中的1/2使得求梯度时形式更好看。在没有任何约束的时候,优化这个损失函数,直接求导可以得到
△U*=(R+ZTQZ)-1ZTQ(rp-Wxa)
步骤二、训练DBN模型,并利用该模型估计MPC的状态变量。
在模型预测控制过程中,状态变量xa(k)一般是通过Ca逆矩阵乘以观测向量y(k)或者通过卡尔曼滤波算法进行求解,然而由于Ca逆矩阵不一定存在,xa(k)通过此方法不一定能够得到,而卡尔曼滤波算法能够对线性的过程模型和测量模型进行精确的估计,在非线性的场景中并不能达到最优的估计效果,容易存在较大偏差。
因此,如图2所示,本发明实施例利用深度信念网络(Deep Belief Network,DBN)进行状态估计,提出了一种融合深度信念网络状态估计的用于模型预测控制的状态估计方法,对DBN模型进行训练,并利用该模型对MPC的状态变量进行估计,从而对步骤一中的状态变量进行修改,可以有效提高状态估计的准确性,尤其是可以适用于非线性场景中,有效提高了状态参数的估计效果,降低了偏差数值,因而可以进一步提高模型预测控制的精确度。
DBN是一种基于深度学习技术的生成模型,由Hinton等于2006年提出。DBN的组成元素是受限玻尔兹曼机(Restricted Boltzmann Machine,RBM),每一个RBM都可以单独用作分类器。RBM只有两层神经元,一层为可视层,由显性神经元组成,用于输入训练数据;另一层为隐含层,由隐性神经元组成,用于提取训练数据的特征。RBM的结构如图4所示,DBN的结构如图5所示。
在图4中,可视层有m个节点,隐含层有n个节点,为连接权值矩阵。若干个RBM顺序堆叠构成DBN,上一个RBM的输出作为下一个RBM的训练输入。作为一种生成模型,DBN的学习过程可以分为两个阶段,即先对所有的RBM进行逐层无监督预训练,再用有监督算法进行调优。
图5中,l是隐含层个数,y是输出层状态向量,表示通过无监督预训练所得到的除去输出层之外的初始化权值矩阵。DBN中输出层(可直接接收标签输出)与和最后两个隐含层构成联想记忆模块,联想记忆模块的训练属于有监督调优的一部分,直接得到/>和/>最终/>作为整个DBN的初始化权值。
根据WR和输入数据可直接得到DBN的实际输出,将实际输出与期望输出作比较,利用BP算法对整个DBN进行调优,进一步得到最终权值矩阵:
W=(W1,W2,W3,…,Wl-1,Wl,Wout)
同时得到隐含层所提取特征向量组成的特征矩阵:
H=(h1,h2,h3,…,hl-1,hl,hout)
在一个RBM中,v表示可视层状态向量,h表示隐含层状态向量。在给定模型参数:
对于一个伯努利RBM(可视层和隐含层状态服从伯努利分布),其能量函数定义为,
则可视层和隐含层的联合概率分P(v,h;θ)定义为:
其中,Z=∑v,he-E(v,h;θ)是归一化因子,模型关于v的边缘分布为:
由RBM的结构可以看出,从可视层到隐含层的映射以及对可视层的重构实质上是对神经元的激活程度进行量化,因此神经元的状态用0或1表示,0表示神经元处于关闭状态,1表示神经元处于开启状态。无论是可视层还是隐含层,同一层的节点之间是相互独立的,那么在给定可视层神经元状态v的情况下,隐含层第j个神经元被开启的概率可表示为:
根据RBM的对称结构可知,当给定隐含层状态h时,可视层第i个神经元被开启的概率可表示为:
其中,
其中,是RBM的连接权值,bvi和bhj分别为可视层和隐藏层的偏置,由于可视层和隐含层是伯努利的二值状态,判断它们二值概率取值的标准常通过设定一个阈值来实现,以隐含层为例可表示为:
DBN无监督预训练的目的是通过逐层训练每一个RBM来确定整个网络的初始权值。本申请中RBM的训练方法优选为采用对比散度(CD)算法,以初始输入数据重构的方式降低能量函数值,在不断调整参数的过程中最小化重构误差,从而使得RBM的特征提取过程能够实现较高精度的特征还原。由于对比散度(CD)算法为现有技术,并非本发明的改进之处,因此此处不进行具体展开说明。
在有监督调优阶段,首先对联想记忆模块进行训练来确定和Wout,联想记忆模块是一个特殊的RBM,如图6所示。
当给定参数集时,联想记忆模块的能量函数可表示为:
此处y′为RBM网络的输出。
初始化权值确定后,DBN被展开成一个前向多层感知器,该多层感知器的权值和偏置为采用无监督预训练阶段得到的
和bv、bh来初始化,并通过BP算法(现有算法)进一步调整和优化。
由状态空间方程可以看出,xa(k)是与Δu(k)和y(k)都相关的,因此定义模型的输入向量为:
xin=[Δu(k)T,y(k)T]
由于Δu(k)和y(k)为不同维度的特征,并且具有相关性,因此本发明在对DBN模型进行训练之前,先采用交叉特征融合的方式,采用FM(Factorization Machine)算法对输入向量进行预处理。FM算法的核心是在线性模型基础上增加了多阶因子分解项,用于表示特征间的交叉。
为了权衡效率和性能,本发明进一步优选为采用二阶,特征交叉如下:
其中,d为样本的特征的个数,本发明中具体为xin的长度,两两相互交可得到d(d-1)/2个交叉项;wij是组合特征对应的权重,用于表达对应特征的重要程度,wij个数为d(d-1)/2,w0为第一个特征,为常数项,wi是第i个样本的特征权重,xi、xj分别是第i个和第j个样本的特征。
因此,新的输入向量变为:
xin_new=[m1,m2,…md(d-1)/2]
维度为d(d-1)/2,mi(i=1,2,…,d(d-1)/2)为新的输入向量的第i个特征值。
【DBN模型的输入输出说明】
本发明中xa(k)的维度为Ca第一维的长度设为K,则图5中的输出向量个数为K,输入向量个数为d(d-1)/2。
【DBN的损失函数】
令DBN模型的输出为xout,实测值为ytrue,然而xout无法测量,而ytrue是可测量的,因此需要用对DBN的输出左乘Ca构建损失函数J。
其中,δ为超参数,J的形式可以随δ的变化而变化,从而可以有效提升DBN模型的泛化能力;S为ytrue向量的维数。
步骤三、MPC控制器根据状态变量和设备数据求解最优控制。
重复步骤一,对通过调整后的MPC控制器,根据预测参数,构建二次型损失函数,并对其进行二次规划求解,对系统输入输出进行调整控制。
步骤四、进行设备控制,并进行数据反馈。
将模型预测控制的得到输入反馈给DCS系统,并由底层硬件控制器进行控制,并获取新的传感器测量值,通过反馈系统传递给MPC控制器。
步骤三和步骤四均为现有技术,此处不再进行详细展开说明。
本发明的模型预测控制方法可以适用于各种生产过程的控制系统,尤其是应用于对于非线性预测控制系统可以取得较好的效果,提高预测控制精度。比如,以水泥煤磨生产过程为例,水泥煤磨生产控制系统是一个多输入多输出的非线性系统,由于水泥煤磨生产模型是一个具有大时滞、非线性等特性的系统,对于准确建立其预测和控制模型都有一定的难度。通过本方法对系统状态的预测进行优化,实现了对系统预测控制准确性的提高。进行MPC控制器配置时,控制器输入为冷风阀门开合度、热风阀门开合度、喂煤量等,输出为煤磨生产系统的出口温度、压差等。

Claims (9)

1.一种融合深度信念网络状态估计的模型预测控制方法,其特征在于,包括:
配置MPC控制器,将多个相关生产参数输入至MPC控制器;
训练DBN模型,并利用该模型估计MPC的状态变量;
对MPC控制器中的状态变量进行修改和更新,MPC控制器根据更新后的状态变量和设备数据求解最优控制;
进行设备控制,并进行数据反馈。
2.根据权利要求1所述的融合深度信念网络状态估计的模型预测控制方法,其特征在于,定义DBN模型的初始输入向量为:
xin=[Δu(k)T,y(k)T]
其中,Δu(k)为模型输入,MPC中具体为操纵向量;y(k)为模型输出,MPC中具体为目标向量。
3.根据权利要求2所述的融合深度信念网络状态估计的模型预测控制方法,其特征在于,在对DBN模型进行训练之前,先通过交叉特征融合的方式,采用FM算法对输入向量进行预处理。
4.根据权利要求3所述的融合深度信念网络状态估计的模型预测控制方法,其特征在于,采用二阶交叉特征融合对输入向量进行预处理,特征交叉如下:
其中,d为样本的特征的个数,本发明中具体为xin的长度,两两相互交可得到d(d-1)/2个交叉项;wij是组合对应的权重,用于表达对应特征的重要程度,wij个数为d(d-1)/2;w0为第一个特征,为常数项,wi是第i个样本的特征权重,xi、xj分别是第i个和第j个样本的特征。
5.根据权利要求1-4中所述的融合深度信念网络状态估计的模型预测控制方法,其特征在于,DBN模型的输出为xout,实测值为ytrue,用对DBN的输出左乘Ca构建损失函数J:
其中,δ为超参数,J的形式随δ的变化而变化,Ca:=[O I],S为ytrue向量的维数。
6.根据权利要求1-4中所述的融合深度信念网络状态估计的模型预测控制方法,其特征在于,DBN模型的学习过程分为两个阶段,先对所有的RBM进行逐层无监督预训练,再用有监督算法进行调优。
7.根据权利要求6所述的融合深度信念网络状态估计的模型预测控制方法,其特征在于,所述无监督预训练采用对比散度算法,有监督算法采用BP算法。
8.一种可存储介质,其特征在于,所述可存储介质中存储有计算机程序,该计算机程序被处理器调用时运行权利要求1-7中任一项所述的模型预测控制方法。
9.一种电子设备,包括处理器和可存储介质,可存储介质中存储有计算机程序,其特征在于,当处理器调用上述计算机程序时运行权利要求1-7中任一项所述的模型预测控制方法。
CN202311552249.9A 2023-11-17 2023-11-17 融合深度信念网络状态估计的模型预测控制方法、电子设备及可存储介质 Pending CN117518810A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311552249.9A CN117518810A (zh) 2023-11-17 2023-11-17 融合深度信念网络状态估计的模型预测控制方法、电子设备及可存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311552249.9A CN117518810A (zh) 2023-11-17 2023-11-17 融合深度信念网络状态估计的模型预测控制方法、电子设备及可存储介质

Publications (1)

Publication Number Publication Date
CN117518810A true CN117518810A (zh) 2024-02-06

Family

ID=89754709

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311552249.9A Pending CN117518810A (zh) 2023-11-17 2023-11-17 融合深度信念网络状态估计的模型预测控制方法、电子设备及可存储介质

Country Status (1)

Country Link
CN (1) CN117518810A (zh)

Similar Documents

Publication Publication Date Title
Han et al. Adaptive computation algorithm for RBF neural network
US11543787B2 (en) Networked control system time-delay compensation method based on predictive control
Lu et al. A hybrid-adaptive dynamic programming approach for the model-free control of nonlinear switched systems
Iplikci Support vector machines‐based generalized predictive control
CN111260124A (zh) 一种基于注意力机制深度学习的混沌时间序列预测方法
Pillai et al. Extreme learning ANFIS for control applications
Chen et al. Adaptive fuzzy control of switched nonlinear systems with uncertain dead-zone: A mode-dependent fuzzy dead-zone model
Liu et al. Convergence analysis of the batch gradient-based neuro-fuzzy learning algorithm with smoothing L1/2 regularization for the first-order Takagi–Sugeno system
Agarwal et al. Classification of profit-based operating regions for the tennessee eastman process using deep learning methods
CN117518810A (zh) 融合深度信念网络状态估计的模型预测控制方法、电子设备及可存储介质
Amin et al. System identification via artificial neural networks-applications to on-line aircraft parameter estimation
Saikia et al. Unsupervised pre-training on improving the performance of neural network in regression
Juuso Intelligent Methods in Modelling and Simulation of Complex Systems.
Heinen et al. IPNN: An incremental probabilistic neural network for function approximation and regression tasks
Ardilla et al. Batch Learning Growing Neural Gas for Sequential Point Cloud Processing
CN114638076A (zh) 一种基于物理神经网络的流体拓扑优化方法及系统
Ye et al. Online optimal control of discrete-time systems based on globalized dual heuristic programming with eligibility traces
Scheurenberg et al. Evaluation of data enhanced model predictive control for a coupled tank system
Dawy et al. The most general intelligent architectures of the hybrid neuro-fuzzy models
Zarzycki et al. Fast Nonlinear Model Predictive Control Using LSTM Networks: A Model Linearisation Approach
Otadi Simulation and evaluation of second-order fuzzy boundary value problems
Chinnam et al. Neural network-based quality controllers for manufacturing systems
Souza et al. Multiple local ARX modeling for system identification using the self-organizing map
Chandra A Survey on deep learning its architecture and various applications
Figueiredo et al. Reinforcement learning/spl I. bar/hierarchical neuro-fuzzy politree model for control of autonomous agents

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination