WO2017024583A1

WO2017024583A1 - 模型预测控制的方法和装置

Info

Publication number: WO2017024583A1
Application number: PCT/CN2015/086848
Authority: WO
Inventors: 闫正; 毕舒展
Original assignee: 华为技术有限公司
Priority date: 2015-08-13
Filing date: 2015-08-13
Publication date: 2017-02-16
Also published as: CN107615186A

Abstract

一种模型预测控制的方法和装置，该方法包括：确定在k时刻的参数变量θ(k)（S110）；通过单层递归神经网络算法，根据k-1时刻的控制变量u(k-1)、k时刻的状态变量x(k)和参数变量θ(k)，确定满足预测模型性能指标的控制增量Δu(k)（S120）；将该预测模型的该控制变量u(k-1)和该控制增量Δu(k)之和确定为该预测模型在该k时刻的控制变量u(k)（S130）；根据该预测模型的该控制变量u(k)，进行模型预测控制（S140）。根据当前时刻k时刻的状态变量x(k)和参数变量θ(k)，以及前一时刻的控制变量u(k-1)，通过单层递归神经网络算法，确定满足预测模型性能指标的控制变量u(k)，根据该控制变量u(k)，进行模型预测控制，能够提高计算效率，可以保证性能指标的可靠性。

Description

模型预测控制的方法和装置

技术领域

本发明涉及信息技术领域，尤其涉及模型预测控制的方法和装置。

背景技术

模型预测控制(Model Predictive Control，简称“MPC”)是一种采取有限时域多步预测、滚动优化和反馈矫正的控制策略，广泛应用于网络化控制、资源调度管理等多个领域。MPC的核心思想是在每一个采样时刻对被控系统未来N个有限时刻的状态进行预测，进而通过求解一个有限时域最优控制问题以获得当前时刻的最优控制信号。

对于一个一般性的离散系统模型x(k+1)＝f(x(k),u(k))，其中x是n维状态变量，u是m维控制信号，f表示系统模型，k是当前采样时刻，k+1表示下一采样时刻。该系统的MPC问题可以描述为：

s.t.x(k+j+1)＝f(x(k+j),u(k+j)),j＝1,...,N-1

u_min≤u(k+j)≤u_max,j＝0,...,N-1

x_min≤x(k+j)≤x_max,j＝1,...,N

其中，J(k)是控制系统的性能指标，Q和R为系数矩阵，可以根据实际应用设置为相应的矩阵；F(x(k+N))为关于状态变量x(k+N)的函数，该函数可以根据实际应用进行设置；u_max和u_min分别是控制输入的约束上界和下界，x_max和x_min分别是系统状态的约束上界和下界，N为预测步长。

具体地，考虑一个线性变参数系统x(k+1)＝A(θ(k))x(k)+B(θ(k))u(k)，其中θ是p维的不确定参数。一般地，当前时刻的参数变量θ(k)可测量获得，将来任意时刻的θ取值范围已知但是其具体的函数表达式未知。针对这一类带有不确定参数系统的MPC问题，一个广泛采用的技术方案是min-max优化方法，即对所有θ的可能影响所造成的最差情况做优化设计。通过优化目标函数的上界，采用线性矩阵不等式这一工具将线性变参数系统的MPC问题转化为线性矩阵不等式优化问题：

min_γ,Q,Y,X,Lγ

这里*代表对称矩阵相应的项，s代表θ可能产生的情形数。在每个采样时刻对上述矩阵不等式优化问题求解后，控制系统的最优控制信号为u(k)＝YQ^-1x(k)。

该技术的最大问题在于其计算的保守性。在MPC框架下设计最优控制信号，其目标是使得系统特定的性能指标取得最好的表现。现有的最小最大(min-max)优化方案考虑了系统所可能出现的最差情况，但是对于被控对象来讲，其每一个时刻的表现形式是确定的，而且往往不会呈现最差的情形。在这种情况下，对性能指标的最差情况做优化，无疑牺牲了整体控制性能。另外，MPC最优控制信号的获得是基于对系统未来预测状态的优化，如果被控系统的模型f(x,u)与实际被控对象之间存在较大误差，那么所得到的最优控制信号就难以获得令人满意的控制效果。

发明内容

本发明提供了一种模型预测控制的方法和的装置，能够提高计算效率，保证模型预测控制的性能指标的可靠性。

第一方面，提供了一种模型预测控制的方法，该方法包括：根据预测模型在k-1时刻的至k-q时刻的参数变量θ(k-1)至θ(k-q)、在k时刻的状态变量x(k)以及在该k-1时刻的控制变量u(k-1)中的至少一个，确定在该k时刻的参数变量θ(k)；通过单层递归神经网络算法在线求解二次规划问题，根据该状态变量x(k)、该控制变量u(k-1)和该参数变量θ(k)，确定满足该预测模型性能指标的控制增量Δu(k)；根据该预测模型的该控制变量u(k-1)和该控制增量Δu(k)，确定该预测模型在该k时刻的控制变量u(k)，其中，u(k)＝u(k-1)+Δu(k)；根据该预测模型的该控制变量u(k)，进行模型预测控制。

结合第一方面，在第一方面的一种实现方式中，该根据预测模型在k-1时刻的至k-q时刻的参数变量θ(k-1)至θ(k-q)、在k时刻的状态变量x(k)以及在该k-1时刻的控制变量u(k-1)中的至少一个，确定在该k时刻的参数变量θ(k)，包括：确定单隐藏层神经网络的模型函数θ(α)；根据该预测模型的该状态变量x(k)、在该k时刻的预测控制变量u'(k)以及该k-1时刻至该k-q时刻的该参数变量θ(k-1)至θ(k-q)，确定输入参数α(k)＝[x(k)；u'(k)；θ(k-1)；...；θ(k-q)]，其中，q为整数，1≤q<k；将该输入参数α(k)代入该模型函数θ(α)中，计算得到该k时刻的该参数变量θ(k)。

结合第一方面及其上述实现方式，在第一方面的另一种实现方式中，该确定单隐藏层神经网络的模型函数θ(α)，包括：确定s组输入数据α＝[α₁，…,α_s]和对应的s组输出数据θ＝[θ₁，…,θ_s]；构建该单隐藏层神经网络，该单隐藏层神经网络的输入层神经元数目为n+m+pq，隐藏层神经元的数目为L，输出层神经元数目为p，隐藏层神经元激励函数为g(·)，第i个输入层到隐藏层的权值向量为w_i，神经元的偏置向量为b_i，其中，n为该状态变量x(k)的维度，m为该控制变量u(k)的维度；根据该单隐藏层神经网络、该输入数据α＝[α₁，…,α_s]和该输出数据θ＝[θ₁，…,θ_s]，确定该单隐藏层神经网络神经元与输出层相连的权重参数β＝H^T(I+HH^T)^-1[θ₁,...,θ_s]，其中：

确定该模型函数θ(α):

其中，β_i为该权重参数β的第i行。

结合第一方面及其上述实现方式，在第一方面的另一种实现方式中，该方法还包括：根据该k时刻的该参数变量θ(k)、该状态变量x(k)以及k+N-1时刻的预测控制变量u'(k+N-1)，通过下面的公式，确定该预测模型在k+N时刻的该状态变量x(k+N)：

x(k+N)＝A(θ(k+N-1))x(k+N-1))+B(θ(k+N-1))u'(k+N-1))

其中A(θ(·))为关于θ(·)的第一参考函数，B(θ(·))为关于θ(·)的第二参考函数，N为时间步长，N为正整数；根据该状态变量x(k+N)、在该k+N时刻的预测控制变量u'(k+N)以及k+N-1时刻至k+N-q时刻的参数变量θ(k+N-1)至θ(k+N-q)，确定输入参数α(k+N)＝[x(k+N)；u'(k+N)；θ(k+N-1)；...；θ(k+N-q)]，其中，q为整数，1≤q<k；将该输入参数α(k+N)代入该模型函数θ(α)中，计算得到该k+N时刻的该参数变量θ(k+N)。

结合第一方面及其上述实现方式，在第一方面的另一种实现方式中，该通过单层递归神经网络算法在线求解二次规划问题，根据该状态变量x(k)、该控制变量u(k-1)和该参数变量θ(k)，确定满足该预测模型性能指标的控制增量Δu(k)，包括：通过该单层递归神经网络算法，根据下面的公式确定该控制增量Δu(k)：

其中，

A(θ(·))为关于θ(·)的第一参考函数，B(θ(·))为关于θ(·)的第二参考函数，

和

分别为S、V和M的后n行构成的矩阵，n为该状态变量x(k)的维度，-u_min+u(k-1)为每一行均为-u_min+u(k-1)的m行矩阵，u_max-u(k-1)为每一行均为u_max-u(k-1)的m行矩阵，m为该控制变量u(k)的维度，λ为正实数，u_max和u_min表示该预测模型的控制变量最大值和最小值，x_max和x_min表示该预测模型的状态变量最大值和最小值，Q和R为任意正定对角矩阵，P满足下面的不等式：

Q+K^TRK+(A(θ(k+1))+B(θ(k+1))K)^TP(A(θ(k+1))+B(θ(k+1))K)-P≤0

其中，P>0，K为辅助变量。

结合第一方面及其上述实现方式，在第一方面的另一种实现方式中，该方法还包括：通过该单层递归神经网络算法在线求解二次规划问题，根据下面的公式确定该k时刻至k+N-1时刻的控制增量

其中，

Δu(k+j)＝u(k+j)-u(k+j-1)]，0≤j≤N，A(θ(·))为关于θ(·)的第一参考函数，B(θ(·))为关于θ(·)的第二参考函数，

和

分别为S、V和M的后n行构成的矩阵，n为该状态变量x(k)的维度，

为每一行均为

的m*N行矩阵，

为每一行均为

的m*N行矩阵，m为该控制变量u(k)的维度，N为时间步长，λ为正实数，

和

表示该预测模型的控制变量最大值和最小值，

和

表示该预测模型的状态变量最大值和最小值，Q和R为任意正定对角矩阵，P满足下面的不等式：

Q+K^TRK+(A(θ(k+N))+B(θ(k+N))K)^TP(A(θ(k+N))+B(θ(k+N))K)-P≤0

其中，P>0，K为辅助变量。

结合第一方面及其上述实现方式，在第一方面的另一种实现方式中，该方法还包括：根据该k时刻至该k+N-1时刻的该控制增量

以及该k-1时刻至k+N-2时刻的控制变量

确定该k时刻至该k+N-1时刻的控制变量

其中，

根据该k时刻至该k+N-1时刻的控制变量

进行模型预测控制。

第二方面，提供了一种模型预测控制的的装置，该装置包括：第一确定模块，用于根据预测模型在k-1时刻的至k-q时刻的参数变量θ(k-1)至θ(k-q)、在k时刻的状态变量x(k)以及在该k-1时刻的控制变量u(k-1)中的至少一个，确定在该k时刻的参数变量θ(k)；第二确定模块，用于通过单层递归神经网络算法在线求解二次规划问题，根据该状态变量x(k)、该控制变量u(k-1)和该第一确定模块确定的该参数变量θ(k)，确定满足该预测模型性能指标的控制增量Δu(k)；第三确定模块，用于根据该预测模型的该控制变量u(k-1)和该第二确定模块确定的该控制增量Δu(k)，确定该预测模型在该k时刻的控制变量u(k)，其中，u(k)＝u(k-1)+Δu(k)；控制模块，用于根据该第三确定模块确定的该预测模型的该控制变量u(k)，进行模型预测控制。

结合第二方面及其上述实现方式，在第二方面的另一种实现方式中，该第一确定模块具体用于：确定s组输入数据α＝[α₁，…,α_s]和对应的s组输出数据θ＝[θ₁，…,θ_s]；构建该单隐藏层神经网络，该单隐藏层神经网络的输入层神经元数目为n+m+pq，隐藏层神经元的数目为L，输出层神经元数目为p，隐藏层神经元激励函数为g(·)，第i个输入层到隐藏层的权值向量为w_i，神经元的偏置向量为b_i，其中，n为该状态变量x(k)的维度，m为该控制变量u(k)的维度；根据该单隐藏层神经网络、该输入数据α＝[α₁，…,α_s]和该输出数据θ＝[θ₁，…,θ_s]，确定该单隐藏层神经网络神经元与输出层相连的权重参数β＝H^T(I+HH^T)^-1[θ₁,...,θ_s]，其中：

确定该模型函数θ(α):

其中，β_i为该权重参数β的第i行。

结合第二方面，在第二方面的一种实现方式中，该第一确定模块具体用于：确定单隐藏层神经网络的模型函数θ(α)；根据该预测模型的该状态变量x(k)、在该k时刻的预测控制变量u'(k)以及该k-1时刻至该k-q时刻的该参数变量θ(k-1)至θ(k-q)，确定输入参数α(k)＝[x(k)；u'(k)；θ(k-1)；...；θ(k-q)]，其中，q为整数，1≤q<k；将该输入参数α(k)代入该模型函数θ(α)中，计算得到该k时刻的该参数变量θ(k)。

结合第二方面及其上述实现方式，在第二方面的另一种实现方式中，该第一确定模块具体用于：根据该k时刻的该参数变量θ(k)、该状态变量x(k)以及k+N-1时刻的预测控制变量u'(k+N-1)，通过下面的公式，确定该预测模型在k+N时刻的该状态变量x(k+N)：

x(k+N)＝A(θ(k+N-1))x(k+N-1))+B(θ(k+N-1))u'(k+N-1))

结合第二方面及其上述实现方式，在第二方面的另一种实现方式中，该第二确定模块具体用于：通过该单层递归神经网络算法，根据下面的公式确定该控制增量Δu(k)：

其中，

和

Q+K^TRK+(A(θ(k+1))+B(θ(k+1))K)^TP(A(θ(k+1))+B(θ(k+1))K)-P≤0

其中，P>0，K为辅助变量。

结合第二方面及其上述实现方式，在第二方面的另一种实现方式中，该第二确定模块还用于：通过该单层递归神经网络算法，根据下面的公式确定该k时刻至k+N-1时刻的控制增量

其中，

和

为每一行均为

的m*N行矩阵，

为每一行均为

和

表示该预测模型的控制变量最大值和最小值，

和

Q+K^TRK+(A(θ(k+N))+B(θ(k+N))K)^TP(A(θ(k+N))+B(θ(k+N))K)-P≤0

其中，P>0，K为辅助变量。

结合第二方面及其上述实现方式，在第二方面的另一种实现方式中，该第三确定模块还用于：根据该k时刻至该k+N-1时刻的该控制增量

以及该k-1时刻至k+N-2时刻的控制变量

确定该k时刻至该k+N-1时刻的控制变量

其中，

根据该k时刻至该k+N-1时刻的控制变量

进行模型预测控制。

基于上述技术方案，本发明实施例的模型预测控制的方法和装置，根据当前时刻k时刻的状态变量x(k)和参数变量θ(k)，以及前一时刻k-1时刻的控制变量u(k-1)，通过单层递归神经网络算法，确定满足预测模型性能指标的控制增量Δu(k)，该控制增量Δu(k)与k-1时刻的控制变量u(k-1)的和为当前时刻k时刻的控制变量u(k)，最后根据该控制变量u(k)，进行模型预测控制。因此能够获得较现有技术更为优化的当前时刻控制变量，从而能够提高计算效率，从理论上保证了性能指标的准确度，即使得闭环控制系统是渐进稳定的，并且整个模型预测控制系统高度自主运行，实现了自动化操作。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例中所需要使用的附图作简单地介绍，显而易见地，下面所描述的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是根据本发明实施例的模型预测控制的方法的示意性流程图。

图2是根据本发明实施例的单隐藏层神经网络结构的示意图。

图3是根据本发明实施例的质量弹簧系统的控制变量对比的示意图。

图4是根据本发明实施例的质量弹簧系统的状态变量对比的示意图。

图5是根据本发明实施例的模型预测控制的装置的示意性框图。

图6是根据本发明实施例的模型预测控制的装置的另一示意性框图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明的一部分实施例，而不是全部实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都应属于本发明保护的范围。

图1示出了根据本发明实施例的模型预测控制的方法100的示意性流程图。如图1所示，该方法100包括：

S110，根据预测模型在k-1时刻的至k-q时刻的参数变量θ(k-1)至θ(k-q)、在k时刻的状态变量x(k)以及在该k-1时刻的控制变量u(k-1)中的至少一个，确定在该k时刻的参数变量θ(k)；

S120，通过单层递归神经网络算法在线求解二次规划问题，根据该状态变量x(k)、该控制变量u(k-1)和该参数变量θ(k)，确定满足该预测模型性能指标的控制增量Δu(k)；

S130，根据该预测模型的该控制变量u(k-1)和该控制增量Δu(k)，确定该预测模型在该k时刻的控制变量u(k)，其中，u(k)＝u(k-1)+Δu(k)；

S140，根据该预测模型的该控制变量u(k)，进行模型预测控制。

具体地，获取预测模型在k时刻的状态变量x(k)以及在k-1时刻的控制变量u(k-1)，根据该状态变量x(k)以及控制变量u(k-1)，确定在该k时刻的参数变量θ(k)，可选地，可以通过训练单隐藏层神经网络的模型确定该参数变量θ(k)；通过单层递归神经网络算法，根据状态变量x(k)、控制变量u(k-1)和参数变量θ(k)，确定满足该预测模型性能指标的控制增量Δu(k)，该控制增量Δu(k)与k-1时刻的控制变量u(k-1)的和为当前时刻k时刻的控制变量u(k)，通过该当前时刻k时刻的控制变量，进行模型预测控制。

可选地，本发明实施例的方法可以通过神经网络架构完成，例如，该方法中的确定参数变量θ(k)的预测过程与确定控制增量Δu(k)的在线优化过程等都可以通过神经网络架构完成，并且该神经网络架构可以通过一个神经形态计算芯片完成，本发明并不限于此。

因此，本发明实施例的模型预测控制的方法，根据当前时刻k时刻的状态变量x(k)和参数变量θ(k)，以及前一时刻k-1时刻的控制变量u(k-1)，通过单层递归神经网络算法，确定满足预测模型性能指标的控制增量Δu(k)，该控制增量Δu(k)与k-1时刻的控制变量u(k-1)的和为当前时刻k时刻的控制变量u(k)，最后根据该控制变量u(k)，进行模型预测控制。因此能够获得较现有技术更为优化的当前时刻控制变量，从而能够提高计算效率，从理论上保证了性能指标的准确度，即使得闭环控制系统是渐进稳定的，并且整个模型预测控制系统高度自主运行，实现了自动化操作。

在本发明实施例中，对于一个有优化需求的控制问题，具体表现在被控对象的模型可以表示为如公式(1)的形式：

x(k+1)＝A(θ(k))x(k)+B(θ(k))u(k) (1)

其中x(k)是系统在当前时刻k时刻的状态变量，可以从受控过程中实时测量获得；u(k)是系统在当前时刻k时刻的控制变量，即控制信号，是当前未知的；A(θ(·))和B(θ(·))是受控过程中与参数变量θ(k)有关的参考函数，可以看做参数矩阵的形式，其具体形式依赖于参数变量θ(k)的取值，θ(k)是可以从受控过程中实时测量得到的。该控制问题有一个已知的目标输出，控制目标为通过设计u(k)使得受控过程的实际输出与目标输出趋近于相等。

可选地，本发明实施例的典型用例包括：数据中心的资源管理，机器人的自动控制，半导体生产的供应链管理，楼宇节能控制，无人机飞行控制等。这些用例的一个显著共性特征为他们的控制目标都是为了实现描述全局系统行为的某一个性能指标的最优化，而物理条件的约束限定了所能采取的控制行为的范围。在可行的范围里，总是存在一个控制行为使得描述全局系统的性能指标取得最小值。例如，对于数据中心的资源管理，一个重要的全局性能指标就是系统整体能耗，在这种情况下，预测控制的状态变量可以包括数据中心的温度、功耗或资源利用率等，控制信号可以是风扇/空调的转速、CPU线程分配指令等，但本发明并不限于此。

在S110中，根据预测模型在k-1时刻的至k-q时刻的参数变量θ(k-1)至θ(k-q)、在k时刻的状态变量x(k)以及在该k-1时刻的控制变量u(k-1)中的至少一个，确定在该k时刻的参数变量θ(k)。具体地，对于被控对象的模型可以表示为如公式(1)所示，其中，被控对象当前时刻k时刻的状态变量以及k时刻的前一时刻k-1时刻的控制变量，可以通过测量实时获取得到；而参数变量θ(k)可以根据预测模型在k-1时刻的至k-q时刻的参数变量θ(k-1)至θ(k-q)、在k时刻的状态变量x(k)以及在该k-1时刻的控制变量u(k-1)中的至少一个确定，具体地，可以利用现有技术确定该参数变量θ(k)，也可以通过本发明实施例中单隐藏层神经网络确定该参数变量θ(k)，本发明并不限于此。

可选地，可以通过单隐藏层神经网络对该参数变量θ(k)进行建模和在线估计。神经网络是一种模拟人脑结构行为特征进行分布式并行信息处理的计算模型。神经网络依靠其学习算法调整其内部大量神经元之间的相互连接关系，从而达到特定的计算目的。首先可以确定单隐藏层神经网络的模型函数θ(α)，具体地，可以通过下面的公式(2)定义一个输入参数α(k)：

θ(k)＝F(x(k),u(k),θ(k-1),...,θ(k-q))＝F(α(k)) (2)

即对于当前时刻的参数变量θ(k)，可以表示为一个关于输入参数α(k)的函数F(α(k))，由于该函数的输入为α(k)，输出为参数变量θ(k)，即可以表示为一个模型函数θ(α)，其中输入参数α(k)满足下面的公式(3)：

α(k)＝[x(k)；u'(k)；θ(k-1)；...；θ(k-q)] (3)

其中，x(k)为当前时刻k时刻的状态变量；u'(k)为当前时刻的控制变量的预测量，即预测控制变量；k-1时刻至k-q时刻的参数变量为θ(k-1)至θ(k-q)，其中q为时间常数，可以由用户进行定义。

具体地，可以通过下面的方法确定该单隐藏层神经网络的模型函数θ(α)的具体形式。首先对被控对象进行离线分析，可以获得两组数据θ＝[θ₁，…,θ_s]以及α＝[α₁，…,α_s]，其中s是样本数据的数量，由用户进行定义，样本数量越大，准确度越高，但是采样成本越高，因此可以根据经验值确定合理的样本数量。另外，这里的每个α和θ一一对应，即对于每个输入α_i，对应地可以获得一个输出θ_i。

如图2所示，构建单隐藏层神经网络。该单隐藏层神经网络的输入层神经元数目为n+m+pq，n为状态变量x(k)的维度，m为控制变量u(k)的维度；输出层神经元数目为p，p为θ(k)的维度；隐藏层神经元的数目为L，L的值可以由用户进行定义；隐藏层神经元激励函数为g(·)，g(·)可以由经验值确定；第i个输入层到隐藏层的权值向量为w_i，神经元的偏置向量为b_i，w_i和b_i可以随机产生。

将样本中的输入参数α＝[α₁，…,α_s]代入下面的公式(4)中，获得神经元矩阵H：

将获得的矩阵H以及s个样本中的输出θ＝[θ₁，…,θ_s]代入下面的公式(5)中，获得该单隐藏层神经网络神经元与输出层相连的权重参数β：

β＝H^T(I+HH^T)^-1[θ₁,...,θ_s] (5)

则可以确定完成训练的该单隐藏层神经网络的模型函数θ(α)表示为公式(6)：

其中，β_i为权重参数β的矩阵的第i行。

因此，对于当前时刻k时刻，以公式(3)定义的输入参数α(k)为输入，代入公式(6)中，即可获得k时刻的参数变量θ(k)。

在本发明实施例中，当确定了k时刻的参数变量θ(k)后，可以代入公式(1)中，可以确定k+1时刻的状态变量x(k+1)，再根据k+1时刻的预测的控制变量u'(k+1)，可以确定k+1时刻的参数变量θ(k+1)，依次类推，对于确定任意时刻k+N时刻的参数变量θ(k+N)，N为预测步长。首先根据k时刻的参数变量θ(k)以及k+N-1时刻的预测控制变量u'(k+N-1)，通过下面的公式(7)，可以获得k+N时刻的状态变量x(k+N)：

x(k+N)＝A(θ(k+N-1))x(k+N-1)+B(θ(k+N-1))u'(k+N-1) (7)

其中，该公式(7)为公式(1)在时刻k+N时刻的变形形式，A(θ(·))为关于θ(·)的第一参考函数，B(θ(·))为关于θ(·)的第二参考函数，N为正整数。

对于确定的k+N时刻的状态变量x(k+N)以及k+N时刻的预测控制变量u(k+N)，可以类似的通过公式(3)确定输入参数α(k+N)如公式(8)所示：

α(k+N)＝[x(k+N)；u'(k+N)；θ(k+N-1)；...；θ(k+N-q)] (8)

将该输入参数α(k+N)代入公式(6)中，即可获得k+N时刻的参数变量θ(k+N)。

在本发明实施例中，利用单隐藏层神经网络对未知参数进行建模与估计，较好的解决了线性变参数系统预测控制中的模型失配问题。该神经网络结构简单，训练速度快，避免了传统神经网络复杂的迭代训练，提高了计算效率。

在S120中，通过单层递归神经网络算法在线求解二次规划问题，根据该状态变量x(k)、该控制变量u(k-1)和该参数变量θ(k)，确定满足该预测模型性能指标的控制增量Δu(k)。具体地，对于如公式(1)表示的被控系统，可以定义k时刻至k+N时刻的几个参数，如下面的公式(9)所示：

其中，矩阵

为k+1时刻至k+N时刻的状态变量x(k+1)至x(k+N)构成的矩阵；矩阵

为k时刻至k+N-1时刻的控制变量u(k)至u(k+N-1)构成的矩阵；矩阵

为k时刻至k+N-1时刻的控制增量Δu(k)至Δu(k+N-1)构成的矩阵，对于任意一个控制增量Δu(k+j)，可以表示为如公式(10)所示：

Δu(k+j)＝u(k+j)-u(k+j-1) (10)

则根据公式(9)和公式(10)，可以将公式(1)表示为下面的公式(11)所示：

其中，矩阵S、V和M分别表示为如下面的公式(12)所示：

其中，A(θ(·))为关于θ(·)的第一参考函数，B(θ(·))为关于θ(·)的第二参考函数，与被控对象有关；θ(·)可以为S110中确定的各个时刻的参数变量。

在本发明实施例中，将MPC的性能指标表示为如下面的公式(13)所示：

其中，Q和R为任意的正定对角矩阵，可以由用户进行定义选择，而P满足下面的不等式(14)：

Q+K^TRK+(A(θ(k+N))+B(θ(k+N))K)^TP(A(θ(k+N))+B(θ(k+N))K)-P≤0

P>0 (14)

其中，K为辅助变量。

将公式(11)代入公式(13)可获得被控对象性能指标的约束优化问题，可以如下面的公式(15)表示：

其中，各个参数还满足下面的公式(16)：

其中，

和

分别为S、V和M的后n行构成的矩阵，n为状态变量x(k)的维度，

和

表示预测模型的控制变量最大值和最小值，

和

表示预测模型的状态变量最大值和最小值，

和

表示预测模型的控制增量最大值和最小值，

为n*n的单位矩阵。

如下面的公式(17)定义几个矩阵形式：

其中，

为每一行均为

的m*N行矩阵，

为每一行均为

的m*N行矩阵。

则根据公式(17)，如公式(15)所示的性能指标可以表示为下面的公式(18)所示：

则相应的公式(17)可以表示为如公式(19)所示：

通过设计单层递归神经网络，可以在线求解二次规划问题，即可以在线求解约束优化问题，该神经网络的模型和自学习法可以由下面的公式(20) 定义，即根据下面的公式(20)确定公式(9)中k时刻至k+N-1时刻的控制增量

其中，λ是一个足够大的正实数，其具体数值可以由用户定义。通过最优化理论和神经动力学相关理论，该神经网络可以从任意初始状态收敛到对应约束优化问题的全局最优解。

在本发明实施例中，可以通过上述公式(20)确定k时刻至k+N-1时刻的控制增量

例如，对于k时刻的控制增量Δu(k)，则可以令N＝1，代入上述的公式(20)中，则可以获得当前时刻k时刻的控制增量Δu(k)，本发明并不限于此，根据N的取值的不同，可以确定当前时刻k时刻以及之后任意N个时刻中每个时刻的控制增量。

在本发明实施例中，利用递归神经网络在线计算最优控制变量，即最优控制信号，计算效率高，实时性好。并且，该神经网络的神经元数目与学习算法定量定性给出，实施起来简单方便，无需人为调整内部参数。

在S130中，根据该预测模型的该控制变量u(k-1)和该控制增量Δu(k)，确定该预测模型在该k时刻的控制变量u(k)，其中，u(k)＝u(k-1)+Δu(k)。具体地，对于S130中确定的k时刻至k+N-1时刻的控制增量

例如，对于k时刻的控制增量Δu(k)，由于满足公式(9)，因此将确定的控制增量Δu(k)与获得的前一时刻k-1时刻的控制变量u(k-1)求和，则可以获得当前时刻的控制变量u(k)，依次类推，可以获得对于k+N-1时刻的控制增量

将该控制增量与前一时刻k+N-2的控制变量u(k+N-2)求和，则可以获得k+N-1时刻的控制变量u(k+N-1)，本发明并不限于此。

在本发明实施例中，将k+N-1时刻的控制变量u(k+N-1)和实时测量获得的状态变量x(k+N-1)代入公式(7)中，则可以获得k+N时刻的状态变量x(k+N)，依次类推，获得k时刻以及k时刻之后任意时刻的状态变量以及控制变量，本发明并不限于此。

在S140中，根据该预测模型的该控制变量u(k)，进行模型预测控制。

应理解，在本发明的各种实施例中，上述各过程的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本发明实施例的实施过程构成任何限定。

下面将以质量弹簧系统的MPC过程为例进行举例说明。具体地，由被控系统的自身物理学运动规律可知，可以将预测模型写作如下面的公式(21)所示：

x(k+1)＝A(θ(k))x(k))+Bu(k)) (21)

即对于如公式(1)的被控对象模型的一般表示形式，在质量弹簧系统中可以写作如公式(21)所示的形式，其中，第一参考函数A(θ(k))和第二参考函数B的具体形式如下面的公式(22)所示：

在该质量弹簧系统中，假设测量系统的初始状态得到x(0)＝[1；1；0；0]；控制目标为将系统状态变量镇定到零点；该状态变量可以为速度或加速度等，控制变量可以为施加的外力，但本发明并不限于此。具体地，本发明实施例的控制方法在该质量弹簧系统上的实施过程如下：

首先，根据公式(9)，定义从当前时刻k时刻到未来k+20时刻的几个未知参数，如公式(23)所示：

其中，矩阵

为k+1时刻至k+20时刻的状态变量x(k+1)至x(k+20)构成的矩阵；矩阵

为k时刻至k+19时刻的控制变量u(k)至u(k+19)构成的矩阵；矩阵

为k时刻至k+19时刻的控制增量Δu(k)至Δu(k+19)构成的矩阵，对于任意一个控制增量Δu(k+j)，可以表示为如公式(10)所示。

第二，根据公式(11)将公式(21)进行变换，则根据公式(12)定义的参数矩阵S、V和M可以写成如下面的公式(24)所示：

其中，A(θ(k+i))满足下面的公式(25)：

第三，构建单隐藏层神经网络，确定参数变量θ(k)。具体地，根据公式(3)定义输入参数α(k)，这里，令q＝1，获取当前时刻k时刻的状态变量x(k)，预测k时刻的控制变量为u'(k)，则可以确定输入参数α(k)表示为如公式(26)所示：

α(k)＝[x(k)；u'(k)；θ(k-1)] (26)

首先，在被控系统，即该质量弹簧系统中，实测得到2000组样本数据，该样本数据包括2000组输入数据α＝[α₁，…,α₂₀₀₀]的具体数值和2000组对应的输出数据θ＝[θ₁，…,θ₂₀₀₀]的具体数值。

其次，设计一个单隐藏层神经网络，根据被控系统的状态与输入数据的维度，令输入层的神经元数为6；设定隐藏层的数目为1000，可以由用户定义；输出层的神经元数目为1。

再次，随机产生输入层到隐藏层的权值向量w_i，神经元的偏置向量为b_i。令每个神经元的激励函数g(·)＝sin(·)，将上述各个参数代入公式(4)中，可以获得神经元矩阵H。将矩阵H以及2000组样本数据的输出数据θ＝[θ₁，…,θ₂₀₀₀]代入公式(5)中，确定输出层权重参数β；再将该β代入公式(6)中，可以获得关于α的单隐藏层神经网络的模型函数θ(α)。

最后，将公式(26)确定的输入参数α(k)代入确定的单隐藏层神经网络的模型函数θ(α)中，即可获得参数变量θ(k)。

第四，将当前时刻k时刻的状态变量x(k)、获得的参数变量θ(k)以及预测的控制变量u'(k)代入公式(21)及(22)，则可以获得k+1时刻的状态变量x(k+1)。更新公式(26)中的输入参数，获得k+1时刻的输入参数α(k+1)如下面公式(27)所示：

α(k+1)＝[x(k+1)；u'(k+1)；θ(k)] (27)

将输入参数α(k+1)代入确定的单隐藏层神经网络的模型函数θ(α)中，即可对应的获得参数变量θ(k+1)。循环该步骤，即还可以依次获得参数变量θ(k+2)；…θ(k+19)。

将上面获得的参数变量θ(k)；…θ(k+19)依次代入公式(24)中，则可以分别获得参数矩阵S、V和M的数值。

第五，令Q和R矩阵为单位矩阵，将上述求得各个参数代入不等式(14)中，可以获得矩阵P，具体地，该P矩阵的具体表达式见下面的公式(28)：

第六，根据公式(15)所描述的优化问题，将上述确定的参数矩阵S、V和M的数值代入公式(17)中，获得W、p、E和b的具体数值。

第七，将确定的W、p、E和b的具体数值代入公式(20)中，计算求得k时刻到k+19时刻的控制增量

第八，根据公式(10)，计算k时刻至k+19时刻的控制变量u(k)至u(k+19)构成的矩阵

最后，将确定的控制变量实施到被控系统中即可。

可选地，在第七步中，可以根据公式(20)先确定当前时刻k时刻的控制增量Δu(k)，并进而确定k时刻的最优控制变量u(k)；令k＝k+1，更新k的值，重复上述步骤中第三至第七步骤，直到k值取到控制时间的终点，例如k＝k+10为止，但本发明并不限于此。

在本发明实施例中，采用上述方法对质量弹簧系统进行控制，计算得到的控制变量u(·)如图3中的实线所示，虚线为通过现有技术的线性二次型调节器(linear quadratic regulator，简称“LQR”)确定的控制变量u(·)。另外，对应的，根据该控制变量对被控系统进行控制，则如图4所示，实线为采用本发明实施例而获得的状态变量与时间的变化曲线x(k)，虚线为采用LQR确定的状态变量与时间的曲线x(k)。

根据图4可知，通过本发明实施例获得的状态变量比LQR更快趋于零，也就是本发明实施例的方法使得该弹簧系统更快镇定到零点状态，效果明显比LQR好。

因此，本发明实施例的模型预测控制的方法，根据当前时刻k时刻的状态变量x(k)和参数变量θ(k)，以及前一时刻k-1时刻的控制变量u(k-1)，通过单层递归神经网络算法，确定满足预测模型性能指标的控制增量Δu(k)，该控制增量Δu(k)与k-1时刻的控制变量u(k-1)的和为当前时刻k时刻的控制变量u(k)，最后根据该控制变量u(k)，进行模型预测控制。因此能够获得相较于现有技术更为优化的当前时刻的控制变量，还能够提高计算效率，从理论上保证了性能指标的准确度，使得闭环控制系统是渐进稳定的，并且整个模型预测控制系统高度自主运行，实现了自动化操作。

下面将以一个数据中心的通风和空调系统为例进行举例说明如何运用本发明的模型预测控制的方法来优化数据中心的温度与湿度。具体地，令W_z表示室内温度，T_z表示室内温度，T_sec表示次级线圈温度，

表示空气流入的速率，则控制系统的状态向量可以表示为

根据先验知识建模可以得到控制模型如公式(1)所示，其中A(θ(k))和B(θ(k))如下面的公式(29)所示：

其中，V_z为区体积(zone volume)，W_pri为主空气湿度(moisture content of the primary air)，W_z,op为区湿度(zone moisture content)，τ_v是阀门的时间常量(time constant of the valve)，ε是增益常量(gain consant)。

另外，令u＝[ρ；T_z,in]，其中，ρ为开关阀门的打开幅度，T_z,in为进口冷冻水的温度。假设数据中心当前的温度时25度，湿度为10.25*10^-3，控制目标为将室内温度变为24度，湿度变为9.25*10^-3，则本发明实施例的控制方法的具体实施过程如下：

首先，根据公式(9)，令N＝10，定义从当前时刻k时刻到未来的k+10时刻的几个未知向量，如公式(30)所示：

其中，矩阵

为k+1时刻至k+10时刻的状态变量x(k+1)至x(k+20)构成的矩阵；矩阵

为k时刻至k+9时刻的控制变量u(k)至u(k+19)构成的矩阵；矩阵

为k时刻至k+9时刻的控制增量Δu(k)至Δu(k+19)构成的矩阵，对于任意一个控制增量Δu(k+j)，可以表示为如公式(10)所示。

第二，将公式(10)和公式(30)代入公式(1)中，则可以得到公式(11)中，其中参数矩阵S、V和M可以写成如公式(12)所示。

第三，构建单隐藏层神经网络，确定参数变量θ(k)，其中， θ(k)＝[θ₁(k)；θ₂(k)；θ₃(k)；θ₄(k)；θ₅(k)]。具体地，根据公式(3)定义输入参数α(k)，这里，令q＝1，获取当前时刻k时刻的状态变量x(k)，预测k时刻的控制变量为u'(k)，则可以确定输入参数α(k)表示为如公式(31)所示：

α(k)＝[x(k)；u'(k)；θ(k-1)] (31)

首先，为了精确估计θ(k)，对数据中心的通风和空调系统进行离线数据采集，可以在2000个时刻进行采样从而得到2000组样本数据，即2000组输入数据α＝[α₁，…,α₂₀₀₀]的具体数值和2000组对应的输出数据θ＝[θ₁，…,θ₂₀₀₀]的具体数值。

其次，设计一个单隐藏层神经网络，根据被控系统的状态与输入数据的维度，可以令输入层的神经元数为4+2+5＝11；设定隐藏层神经元的数目为1000，可以由用户定义；输出层的神经元数目为5。

再次，随机产生输入层到隐藏层的权值向量w_i，神经元的偏置向量为b_i。令每个神经元的激励函数g(s)＝tanh(s)，将上述各个参数代入公式(4)中，可以获得神经元矩阵H。将矩阵H以及2000组样本数据的输出数据θ＝[θ₁，…,θ₂₀₀₀]代入公式(5)中，确定输出层权重参数β；再将该β代入公式(6)中，可以获得关于α的单隐藏层神经网络的模型函数θ(α)。

最后，将根据公式(31)确定的输入参数α(k)代入确定的单隐藏层神经网络的模型函数θ(α)中，即可获得参数变量θ(α(k))，即可以根据α(k)对应获得θ(α(k))。

第四，令当前k时刻为k＝0时刻，测得系统的状态变量x(k)＝x(0)＝[0.001；0.012；1；5]，初始的控制变量为u(k)＝u(0)＝[0；0]，则可以根据公式(31)，依次以α(k)；α(k+1)；…；α(k+9)为输入信号，代入关于α(k)的单隐藏层神经网络的模型函数θ(α(k))中，即可相应地计算得到输出信号θ(k)；θ(k+1)；…；θ(k+9)。

将上面获得的参数变量θ(k)；θ(k+1)；…；θ(k+9)依次代入公式(12)中，则可以分别获得参数矩阵S、V和M的具体数值。

第五，令Q和R矩阵如下面的公式(32)所示：

将确定的Q、R、K、A(θ(k))和B(θ(k))等参数代入不等式(14)中，可以获得矩阵P，具体地，最后计算该P矩阵的具体表达式见下面的公式(33)：

第六，根据公式(15)和(16)所描述的优化问题，将上述确定的参数矩阵S、V和M的数值代入公式(17)中，其中，不限定

和

的取值范围；

和

满足下面的公式(34)：

则相应的的公式(17)可以简化为如公式(35)所示：

根据公式(35)即可获得W、p、E和b的具体数值。

第七，将确定的W、p、E和b的具体数值代入公式(20)中，其中，可以令λ＝10⁶，计算求得k时刻到k+9时刻的控制增量

第八，根据公式(10)，计算k时刻至k+9时刻的控制变量u(k)至u(k+9)构成的矩阵

最后，将确定的控制变量实施到被控系统中即可。

可选地，在第七步中，可以根据公式(20)先确定当前时刻k时刻的控制增量Δu(k)，并进而确定k时刻的最优控制变量u(k)；令k＝k+1，更新k的值，重复上述步骤中第三至第七步骤，直到k值取到控制时间的终点，例如k＝k+9为止，但本发明并不限于此。

上文中结合图1至图4，详细描述了根据本发明实施例的模型预测控制的方法，下面将结合图5，描述根据本发明实施例的模型预测控制的装置。

图5示出了根据本发明实施例的模型预测控制的装置200的示意性框图，可选地，该模型预测控制的装置200中的各个模块可以集成在用一个芯片中，例如在神经形态计算芯片上可以包括该模型预测控制的装置200中各个模块。如图5所示，根据本发明实施例的模型预测控制的装置200包括：

第一确定模块210，用于根据预测模型在k-1时刻的至k-q时刻的参数变量θ(k-1)至θ(k-q)、在k时刻的状态变量x(k)以及在该k-1时刻的控制变量u(k-1)中的至少一个，确定在该k时刻的参数变量θ(k)；

第二确定模块220，用于通过单层递归神经网络算法，根据该状态变量x(k)、该控制变量u(k-1)和该第一确定模块确定的该参数变量θ(k)，确定满足该预测模型性能指标的控制增量Δu(k)；

第三确定模块230，用于根据该预测模型的该控制变量u(k-1)和该第二确定模块确定的该控制增量Δu(k)，确定该预测模型在该k时刻的控制变量u(k)，其中，u(k)＝u(k-1)+Δu(k)；

控制模块240，用于根据该第三确定模块确定的该预测模型的该控制变量u(k)，进行模型预测控制。

因此，本发明实施例的模型预测控制的装置，根据当前时刻k时刻的状态变量x(k)和参数变量θ(k)，以及前一时刻k-1时刻的控制变量u(k-1)，通过单层递归神经网络算法，确定满足预测模型性能指标的控制增量Δu(k)，该控制增量Δu(k)与k-1时刻的控制变量u(k-1)的和为当前时刻k时刻的控制变量u(k)，最后根据该控制变量u(k)，进行模型预测控制。因此能够获得相较于现有技术更为优化的当前时刻的控制变量，还能够提高计算效率，从理论上保证了性能指标的准确度，使得闭环控制系统是渐进稳定的，并且整个模型预测控制系统高度自主运行，实现了自动化操作。

在本发明实施例中，第一确定模块210可以根据预测模型在k-1时刻的至k-q时刻的参数变量θ(k-1)至θ(k-q)、在k时刻的状态变量x(k)以及在该k-1时刻的控制变量u(k-1)中的至少一个，确定在该k时刻的参数变量θ(k)。具体地，对于被控对象的模型可以表示为如公式(1)所示，其中，被控对象当前时刻k时刻的状态变量以及k时刻的前一时刻k-1时刻的控制变量，可以通过测量实时获取得到；而参数变量θ(k)可以根据预测模型在k-1时刻的至k-q时刻的参数变量θ(k-1)至θ(k-q)、在k时刻的状态变量x(k)以及在该k-1时刻的控制变量u(k-1)中的至少一个由第一确定模块210确定，具体地，可以利用现有技术确定该参数变量θ(k)，也可以通过本发明实施例中单隐藏层神经网络确定该参数变量θ(k)，本发明并不限于此。

可选地，第一确定模块210可以通过单隐藏层神经网络对该参数变量θ(k)进行建模和在线估计。神经网络是一种模拟人脑结构行为特征进行分布式并行信息处理的计算模型。神经网络依靠其学习算法调整其内部大量神经元之间的相互连接关系，从而达到特定的计算目的。该第一确定模块210可以为一个专用的处理器，该处理器可以包括多个单元，如矩阵乘积单元，矩阵求逆单元，随机数生成单元，非线性函数映射单元和存储单元等。具体地，该处理器的操作可以包括离线训练和在线预测两种模式，离线训练模式主要用于确定处理器里每个单元的配置和函数关系，例如确定单隐藏层神经网络的模型函数θ(α)；而在线预测模式主要用于根据离线训练结果，通过一定的输入数据，确定相应的输出数据，例如用于确定k时刻的参数变量θ(k)，但本发明并不限于此。

在本发明实施例中，首先可以由第一确定模块210确定单隐藏层神经网络的模型函数θ(α)，具体地，可以先通过公式(2)定义一个输入参数α(k)，即对于当前时刻的参数变量θ(k)，可以表示为一个关于输入参数α(k)的函数F(α(k))，由于该函数的输入为α(k)，输出为参数变量θ(k)，即可以表示为一个模型函数θ(α)，其中输入参数α(k)满足公式(3)，其中，x(k)为当前时刻k时刻的状态变量；u'(k)为当前时刻的控制变量的预测量，即预测控制变量；k-1时刻至k-q时刻的参数变量为θ(k-1)至θ(k-q)，其中q为时间常数，可以由用户进行定义。

具体地，可以通过第一确定模块210在离线训练模式下，通过下面的方法确定该单隐藏层神经网络的模型函数θ(α)的具体形式。首先对被控对象进行离线分析，可以获得两组数据θ＝[θ₁，…,θ_s]以及α＝[α₁，…,α_s]，其中s是样本数据的数量，由用户进行定义，样本数量越大，准确度越高，但是采样成本越高，因此可以根据经验值确定合理的样本数量。另外，这里的每个α和θ一一对应，即对于每个输入α_i，对应地可以获得一个输出θ_i。

将样本中的输入参数α＝[α₁，…,α_s]代入公式(4)中，获得神经元矩阵H。将获得的矩阵H以及s个样本中的输出θ＝[θ₁，…,θ_s]代入公式(5)中，获得该单隐藏层神经网络神经元与输出层相连的权重参数β，则可以确定完成训练的该单隐藏层神经网络的模型函数θ(α)表示为公式(6)，其中，β_i为权重参数β的矩阵的第i行。

在本发明实施例中，当第一确定模块210确定了k时刻的参数变量θ(k)后，可以代入公式(1)中，可以确定k+1时刻的状态变量x(k+1)，再根据k+1时刻的预测的控制变量u'(k+1)，可以确定k+1时刻的参数变量θ(k+1)，依次类推，对于确定任意时刻k+N时刻的参数变量θ(k+N)，首先根据k时刻的参数变量θ(k)以及k+N-1时刻的预测控制变量u'(k+N-1)，通过公式(7)，可以获得k+N时刻的状态变量x(k+N)，其中，该公式(7)为公式(1)在时刻k+N时刻的变形形式，A(θ(·))为关于θ(·)的第一参考函数，B(θ(·))为关于θ(·)的第二参考函数，N为正整数。

对于确定的k+N时刻的状态变量x(k+N)以及k+N时刻的预测控制变量u(k+N)，可以类似的通过公式(3)确定输入参数α(k+N)如公式(8)所示，将该输入参数α(k+N)代入公式(6)中，即可获得k+N时刻的参数变量θ(k+N)。

在本发明实施例中，第二确定模块220通过单层递归神经网络算法，根据该状态变量x(k)、该控制变量u(k-1)和第一确定模块210该参数变量θ(k)，确定满足该预测模型性能指标的控制增量Δu(k)。可选地，该第二确定模块220，也可以为递归神经网络模块，可以由一个专用处理器组成，该处理器可以包括矩阵乘积单元，矩阵求和单元，max函数运算单元和随机数生成单元等多个单元。

具体地，对于如公式(1)表示的被控系统，该第二确定模块220可以定义k时刻至k+N时刻的几个参数，如公式(9)所示，其中，矩阵x(k)为k+1时刻至k+N时刻的状态变量x(k+1)至x(k+N)构成的矩阵；矩阵u(k)为k时刻至k+N-1时刻的控制变量u(k)至u(k+N-1)构成的矩阵；矩阵Δu(k)为k时刻至k+N-1时刻的控制增量Δu(k)至Δu(k+N-1)构成的矩阵，对于任意一个控制增量Δu(k+j)，可以表示为如公式(10)所示。根据公式(9)和公式(10)，可以将公式(1)表示为如公式(11)所示，其中，矩阵S、V和M分别表示为如公式(12)所示，其中，A(θ(·))为关于θ(·)的第一参考函数，B(θ(·))为关于θ(·)的第二参考函数，与被控对象有关；θ(·)可以为第一确定模块210确定的各个时刻的参数变量。

在本发明实施例中，将MPC的性能指标表示为如公式(13)所示，其中，Q和R为任意的正定对角矩阵，可以由用户进行定义选择，而P满足不等式(14)，其中，K为辅助变量。

将公式(11)代入公式(13)可获得被控对象性能指标的约束优化问题，可以如公式(15)表示，其中，各个参数还满足公式(16)，其中，

和

分别为S、V和M的后n行构成的矩阵，n为状态变量x(k)的维度，

和

表示预测模型的控制变量最大值和最小值，

和

表示预测模型的状态变量最大值和最小值，

和

表示预测模型的控制增量最大值和最小值，

为n*n的单位矩阵。

如公式(17)定义几个矩阵形式，其中，

为每一行均为

的m*N行矩阵，

为每一行均为

的m*N行矩阵。

则根据公式(17)，如公式(15)所示的性能指标可以表示为公式(18)所示，则相应的公式(17)可以表示为如公式(19)所示。

在本发明实施例中，第二确定模块220通过设计单层递归神经网络，可以在线求解约束优化问题，该神经网络的模型和自学习法可以由公式(20)定义，即根据公式(20)确定公式(9)中k时刻至k+N-1时刻的控制增量

在本发明实施例中，第三确定模块230根据该预测模型的该控制变量u(k-1)和该控制增量Δu(k)，确定该预测模型在该k时刻的控制变量u(k)，其中，u(k)＝u(k-1)+Δu(k)。具体地，对于到第二确定模块220中确定的k时刻至k+N-1时刻的控制增量

例如，对于k时刻的控制增量Δu(k)，由于满足公式(9)，因此将确定的控制增量Δu(k)与获得的前一时刻k-1时刻的控制变量u(k-1)求和，则可以获得当前时刻的控制变量u(k)，依次类推，第三确定模块230可以计算获得对于k+N-1时刻的控制增量

在本发明实施例中，控制模块240根据第三确定模块230确定的该预测模型的该控制变量u(k)，进行模型预测控制。

应理解，根据本发明实施例的模型预测控制的装置200可对应于执行本发明实施例中的模型预测控制的方法100，并且模型预测控制的装置200中的各个模块的上述和其它操作和/或功能分别为了实现图1至图2中的各个方法的相应流程，为了简洁，在此不再赘述。

如图6所示，本发明实施例还提供了一种模型预测控制的装置300，包括处理器310、存储器320和总线系统330。其中，处理器310和存储器320通过总线系统330相连，该存储器320用于存储指令，该处理器310用于执行该存储器320存储的指令。该存储器320存储程序代码，且处理器310可以调用存储器320中存储的程序代码执行以下操作：根据预测模型在k-1时刻的至k-q时刻的参数变量θ(k-1)至θ(k-q)、在k时刻的状态变量x(k)以及在该k-1时刻的控制变量u(k-1)中的至少一个，确定在该k时刻的参数变量θ(k)；通过单层递归神经网络算法，根据该状态变量x(k)、该控制变量u(k-1)和该参数变量θ(k)，确定满足该预测模型性能指标的控制增量Δu(k)；根据该预测模型的该控制变量u(k-1)和该控制增量Δu(k)，确定该预测模型在该k时刻的控制变量u(k)，其中，u(k)＝u(k-1)+Δu(k)；根据该预测模型的该控制变量u(k)，进行模型预测控制。

应理解，在本发明实施例中，该处理器310可以是中央处理单元(Central Processing Unit，简称为“CPU”)，该处理器310还可以是其他通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

该存储器320可以包括只读存储器和随机存取存储器，并向处理器310提供指令和数据。存储器320的一部分还可以包括非易失性随机存取存储器。例如，存储器320还可以存储设备类型的信息。

该总线系统330除包括数据总线之外，还可以包括电源总线、控制总线和状态信号总线等。但是为了清楚说明起见，在图中将各种总线都标为总线系统330。

在实现过程中，上述方法的各步骤可以通过处理器310中的硬件的集成逻辑电路或者软件形式的指令完成。结合本发明实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成，或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器320，处理器310读取存储器320中的信息，结合其硬件完成上述方法的步骤。为避免重复，这里不再详细描述。

可选地，作为一个实施例，处理器310可以调用存储器320中存储的程序代码执行以下操作：确定单隐藏层神经网络的模型函数θ(α)；根据该预测模型的该状态变量x(k)、在该k时刻的预测控制变量u'(k)以及该k-1时刻至该k-q时刻的该参数变量θ(k-1)至θ(k-q)，确定输入参数α(k)＝[x(k)；u'(k)；θ(k-1)；...；θ(k-q)]，其中，q为整数，1≤q<k；将该输入参数α(k)代入该模型函数θ(α)中，计算得到该k时刻的该参数变量θ(k)。

可选地，作为一个实施例，处理器310可以调用存储器320中存储的程序代码执行以下操作：根据该k时刻的该参数变量θ(k)、该状态变量x(k)以及k+N-1时刻的预测控制变量u'(k+N-1)，通过公式(7)，确定该预测模型在k+N时刻的该状态变量x(k+N)，其中A(θ(·))为关于θ(·)的第一参考函数，B(θ(·))为关于θ(·)的第二参考函数，N为时间步长，N为正整数；根据该状态变量x(k+N)、在该k+N时刻的预测控制变量u'(k+N)以及k+N-1时刻至k+N-q时刻的参数变量θ(k+N-1)至θ(k+N-q)，确定输入参数α(k+N)＝[x(k+N)；u'(k+N)；θ(k+N-1)；...；θ(k+N-q)]，其中，q为整数，1≤q<k；将该输入参数α(k+N)代入该模型函数θ(α)中，计算得到该k+N时刻的该参数变量θ(k+N)。

可选地，作为一个实施例，处理器310可以调用存储器320中存储的程序代码执行以下操作：确定s组输入数据α＝[α₁，…,α_s]和对应的s组输出数据θ＝[θ₁，…,θ_s]；构建该单隐藏层神经网络，该单隐藏层神经网络的输入层神经元数目为n+m+pq，隐藏层神经元的数目为L，输出层神经元数目为p，隐藏层神经元激励函数为g(·)，第i个输入层到隐藏层的权值向量为w_i，神经元的偏置向量为b_i，其中，n为该状态变量x(k)的维度，m为该控制变量u(k)的维度；根据该单隐藏层神经网络、该输入数据α＝[α₁，…,α_s]和该输出数据θ＝[θ₁，…,θ_s]，确定该单隐藏层神经网络神经元与输出层相连的权重参数β＝H^T(I+HH^T)^-1[θ₁,...,θ_s]，其中H满足公式(4)，确定该模型函数θ(α)如公式(5)所示，其中，β_i为该权重参数β的第i行。

可选地，作为一个实施例，处理器310可以调用存储器320中存储的程序代码执行以下操作：通过该单层递归神经网络算法，根据下面的公式确定该控制增量Δu(k)：

其中，

和

分别为S、V和M的后n行构成的矩阵，n为该状态变量x(k)的维度，[-u_min+u(k-1)]为每一行均为-u_min+u(k-1)的m行矩阵， [u_max-u(k-1)]为每一行均为u_max-u(k-1)的m行矩阵，m为该控制变量u(k)的维度，λ为正实数，u_max和u_min表示该预测模型的控制变量最大值和最小值，x_max和x_min表示该预测模型的状态变量最大值和最小值，Q和R为任意正定对角矩阵，P满足下面的不等式：

Q+K^TRK+(A(θ(k+1))+B(θ(k+1))K)^TP(A(θ(k+1))+B(θ(k+1))K)-P≤0

其中，P>0，K为辅助变量。

可选地，作为一个实施例，处理器310可以调用存储器320中存储的程序代码执行以下操作：通过该单层递归神经网络算法，根据公式(20)确定该k时刻至k+N-1时刻的控制增量

其中，矩阵S、V和M分别满足公式(12)，矩阵W、p、E和b分别满足公式(17)，Δu(k+j)＝u(k+j)-u(k+j-1)]，0≤j≤N，A(θ(·))为关于θ(·)的第一参考函数，B(θ(·))为关于θ(·)的第二参考函数，

和

为每一行均为

的m*N行矩阵，

为每一行均为

和

表示该预测模型的控制变量最大值和最小值，

和

表示该预测模型的状态变量最大值和最小值，Q和R为任意正定对角矩阵，P满足不等式(14)，K为辅助变量。

可选地，作为一个实施例，处理器310可以调用存储器320中存储的程序代码执行以下操作：根据该k时刻至该k+N-1时刻的该控制增量

以及该k-1时刻至k+N-2时刻的控制变量

确定该k时刻至该k+N-1时刻的控制变量

其中，

根据该k时刻至该k+N-1时刻的控制变量

进行模型预测控制。

应理解，根据本发明实施例的模型预测控制的装置300可对应于本发明实施例中的模型预测控制的装置200，并可以对应于执行根据本发明实施例的方法100中的相应主体，并且模型预测控制的装置300中的各个模块的上述和其它操作和/或功能分别为了实现图1至图2中的各个方法的相应流程，为了简洁，在此不再赘述。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应所述以权利要求的保护范围为准。

Claims

一种模型预测控制的方法，其特征在于，所述方法包括：

根据预测模型在k-1时刻的至k-q时刻的参数变量θ(k-1)至θ(k-q)、在k时刻的状态变量x(k)以及在所述k-1时刻的控制变量u(k-1)中的至少一个，确定在所述k时刻的参数变量θ(k)；

通过单层递归神经网络算法在线求解二次规划问题，根据所述状态变量x(k)、所述控制变量u(k-1)和所述参数变量θ(k)，确定满足所述预测模型性能指标的控制增量Δu(k)；

根据所述预测模型的所述控制变量u(k-1)和所述控制增量Δu(k)，确定所述预测模型在所述k时刻的控制变量u(k)，其中，u(k)＝u(k-1)+Δu(k)；

根据所述预测模型的所述控制变量u(k)，进行模型预测控制。
根据权利要求1所述的方法，其特征在于，所述根据预测模型在k-1时刻的至k-q时刻的参数变量θ(k-1)至θ(k-q)、在k时刻的状态变量x(k)以及在所述k-1时刻的控制变量u(k-1)中的至少一个，确定在所述k时刻的参数变量θ(k)，包括：

确定单隐藏层神经网络的模型函数θ(α)；

根据所述预测模型的所述状态变量x(k)、在所述k时刻的预测控制变量u'(k)以及所述k-1时刻至所述k-q时刻的所述参数变量θ(k-1)至θ(k-q)，确定输入参数α(k)＝[x(k)；u'(k)；θ(k-1)；...；θ(k-q)]，其中，q为整数，1≤q<k；

将所述输入参数α(k)代入所述模型函数θ(α)中，计算得到所述k时刻的所述参数变量θ(k)。
根据权利要求2所述的方法，其特征在于，所述确定单隐藏层神经网络的模型函数θ(α)，包括：

确定s组输入数据α＝[α₁，…,α_s]和对应的s组输出数据θ＝[θ₁，…,θ_s]；

构建所述单隐藏层神经网络，所述单隐藏层神经网络的输入层神经元数目为n+m+pq，隐藏层神经元的数目为L，输出层神经元数目为p，隐藏层神经元激励函数为g(·)，第i个输入层到隐藏层的权值向量为w_i，神经元的偏置向量为b_i，其中，n为所述状态变量x(k)的维度，m为所述控制变量u(k)的维度；

根据所述单隐藏层神经网络、所述输入数据α＝[α₁，…,α_s]和所述输出数据θ＝[θ₁，…,θ_s]，确定所述单隐藏层神经网络神经元与输出层相连的权重参数β＝H^T(I+HH^T)^-1[θ₁,...,θ_s]，其中：

确定所述模型函数θ(α):

其中，β_i为所述权重参数β的第i行。
根据权利要求2或3所述的方法，其特征在于，所述方法还包括：

根据所述k时刻的所述参数变量θ(k)、所述状态变量x(k)以及k+N-1时刻的预测控制变量u'(k+N-1)，通过下面的公式，确定所述预测模型在k+N时刻的所述状态变量x(k+N)：

x(k+N)＝A(θ(k+N-1))x(k+N-1))+B(θ(k+N-1))u'(k+N-1))

其中A(θ(·))为关于θ(·)的第一参考函数，B(θ(·))为关于θ(·)的第二参考函数，N为时间步长，N为正整数；

根据所述状态变量x(k+N)、在所述k+N时刻的预测控制变量u'(k+N)以及k+N-1时刻至k+N-q时刻的参数变量θ(k+N-1)至θ(k+N-q)，确定输入参数α(k+N)＝[x(k+N)；u'(k+N)；θ(k+N-1)；...；θ(k+N-q)]，其中，q为整数，1≤q<k；

将所述输入参数α(k+N)代入所述模型函数θ(α)中，计算得到所述k+N时刻的所述参数变量θ(k+N)。
根据权利要求1至4中任一项所述的方法，其特征在于，所述通过单层递归神经网络算法在线求解二次规划问题，根据所述状态变量x(k)、所述控制变量u(k-1)和所述参数变量θ(k)，确定满足所述预测模型性能指标的控制增量Δu(k)，包括：

通过所述单层递归神经网络算法，根据下面的公式确定所述控制增量Δu(k)：

其中，

A(θ(·))为关于θ(·)的第一参考函数，B(θ(·))为关于θ(·)的第二参考函数，
和
分别为S、V和M的后n行构成的矩阵，n为所述状态变量x(k)的维度，-u_min+u(k-1)为每一行均为-u_min+u(k-1)的m行矩阵，u_max-u(k-1)为每一行均为u_max-u(k-1)的m行矩阵，m为所述控制变量u(k)的维度，λ为正实数，u_max和u_min表示所述预测模型的控制变量最大值和最小值，x_max和x_min表示所述预测模型的状态变量最大值和最小值，Q和R为任意正定对角矩阵，P满足下面的不等式：

Q+K^TRK+(A(θ(k+1))+B(θ(k+1))K)^TP(A(θ(k+1))+B(θ(k+1))K)-P≤0

其中，P>0，K为辅助变量。
根据权利要求3或4所述的方法，其特征在于，所述方法还包括：

通过所述单层递归神经网络算法在线求解二次规划问题，根据下面的公式确定所述k时刻至k+N-1时刻的控制增量

其中，

Δu(k+j)＝u(k+j)-u(k+j-1)]，0≤j≤N，A(θ(·))为关于θ(·)的第一参考函数，B(θ(·))为关于θ(·)的第二参考函数，
和
分别为S、V和M的后n行构成的矩阵，n为所述状态变量x(k)的维度，
为每一行均为
的m*N行矩阵，
为每一行均为
的m*N行矩阵，m为所述控制变量u(k)的维度，N为时间步长，λ为正实数，
表示所述预测模型的控制变量最大值和最小值，
和
表示所述预测模型的状态变量最大值和最小值，Q和R为任意正定对角矩阵，P满足下面的不等式：

Q+K^TRK+(A(θ(k+N))+B(θ(k+N))K)^TP(A(θ(k+N))+B(θ(k+N))K)-P≤0

其中，P>0，K为辅助变量。
根据权利要求6所述的方法，其特征在于，所述方法还包括：

根据所述k时刻至所述k+N-1时刻的所述控制增量
以及所述k-1时刻至k+N-2时刻的控制变量
确定所述k时刻至所述k+N-1时刻的控制变量
其中，

根据所述k时刻至所述k+N-1时刻的控制变量
进行模型预测控制。
一种模型预测控制的装置，其特征在于，所述装置包括：

第一确定模块，用于根据预测模型在k-1时刻的至k-q时刻的参数变量θ(k-1)至θ(k-q)、在k时刻的状态变量x(k)以及在所述k-1时刻的控制变量u(k-1)中的至少一个，确定在所述k时刻的参数变量θ(k)；

第二确定模块，用于通过单层递归神经网络算法在线求解二次规划问题，根据所述状态变量x(k)、所述控制变量u(k-1)和所述第一确定模块确定的所述参数变量θ(k)，确定满足所述预测模型性能指标的控制增量Δu(k)；

第三确定模块，用于根据所述预测模型的所述控制变量u(k-1)和所述第二确定模块确定的所述控制增量Δu(k)，确定所述预测模型在所述k时刻的控制变量u(k)，其中，u(k)＝u(k-1)+Δu(k)；

控制模块，用于根据所述第三确定模块确定的所述预测模型的所述控制变量u(k)，进行模型预测控制。
根据权利要求8所述的装置，其特征在于，所述第一确定模块具体用于：

确定单隐藏层神经网络的模型函数θ(α)；

根据所述预测模型的所述状态变量x(k)、在所述k时刻的预测控制变量u'(k)以及所述k-1时刻至所述k-q时刻的所述参数变量θ(k-1)至θ(k-q)，确定输入参数α(k)＝[x(k)；u'(k)；θ(k-1)；...；θ(k-q)]，其中，q为整数，1≤q<k；

将所述输入参数α(k)代入所述模型函数θ(α)中，计算得到所述k时刻的所述参数变量θ(k)。
根据权利要求9所述的装置，其特征在于，所述第一确定模块具体用于：

确定s组输入数据α＝[α₁，…,α_s]和对应的s组输出数据θ＝[θ₁，…,θ_s]；

构建所述单隐藏层神经网络，所述单隐藏层神经网络的输入层神经元数目为n+m+pq，隐藏层神经元的数目为L，输出层神经元数目为p，隐藏层神经元激励函数为g(·)，第i个输入层到隐藏层的权值向量为w_i，神经元的偏置向量为b_i，其中，n为所述状态变量x(k)的维度，m为所述控制变量u(k)的维度；

根据所述单隐藏层神经网络、所述输入数据α＝[α₁，…,α_s]和所述输出数据θ＝[θ₁，…,θ_s]，确定所述单隐藏层神经网络神经元与输出层相连的权重参数β＝H^T(I+HH^T)^-1[θ₁,...,θ_s]，其中：

确定所述模型函数θ(α):

其中，β_i为所述权重参数β的第i行。
根据权利要求9或10所述的装置，其特征在于，所述第一确定模块具体用于：

根据所述k时刻的所述参数变量θ(k)、所述状态变量x(k)以及k+N-1时刻的预测控制变量u'(k+N-1)，通过下面的公式，确定所述预测模型在k+N时刻的所述状态变量x(k+N)：

x(k+N)＝A(θ(k+N-1))x(k+N-1))+B(θ(k+N-1))u'(k+N-1))

其中A(θ(·))为关于θ(·)的第一参考函数，B(θ(·))为关于θ(·)的第二参考函数，N为时间步长，N为正整数；

根据所述状态变量x(k+N)、在所述k+N时刻的预测控制变量u'(k+N)以及k+N-1时刻至k+N-q时刻的参数变量θ(k+N-1)至θ(k+N-q)，确定输入参数α(k+N)＝[x(k+N)；u'(k+N)；θ(k+N-1)；...；θ(k+N-q)]，其中，q为整数，1≤q<k；

将所述输入参数α(k+N)代入所述模型函数θ(α)中，计算得到所述k+N时刻的所述参数变量θ(k+N)。
根据权利要求8至11中任一项所述的装置，其特征在于，所述第二确定模块具体用于：

通过所述单层递归神经网络算法，根据下面的公式确定所述控制增量Δu(k)：

其中，

A(θ(·))为关于θ(·)的第一参考函数，B(θ(·))为关于θ(·)的第二参考函数，
和
分别为S、V和M的后n行构成的矩阵，n为所述状态变量x(k)的维度，[-u_min+u(k-1)]为每一行均为-u_min+u(k-1)的m行矩阵，[u_max-u(k-1)]为每一行均为u_max-u(k-1)的m行矩阵，m为所述控制变量u(k)的维度，λ为正实数，u_max和u_min表示所述预测模型的控制变量最大值和最小值，x_max和x_min表示所述预测模型的状态变量最大值和最小值，Q和R为任意正定对角矩阵，P满足下面的不等式：

Q+K^TRK+(A(θ(k+1))+B(θ(k+1))K)^TP(A(θ(k+1))+B(θ(k+1))K)-P≤0

其中，P>0，K为辅助变量。
根据权利要求10或11所述的装置，其特征在于，所述第二确定模块还用于：

通过所述单层递归神经网络算法，根据下面的公式确定所述k时刻至k+N-1时刻的控制增量

其中，

Δu(k+j)＝u(k+j)-u(k+j-1)]，0≤j≤N，A(θ(·))为关于θ(·)的第一参考函数，B(θ(·))为关于θ(·)的第二参考函数，
和
分别为S、V和M的后n行构成的矩阵，n为所述状态变量x(k)的维度，
为每一行均为
的m*N行矩阵，
为每一行均为
的m*N行矩阵，m为所述控制变量u(k)的维度，N为时间步长，λ为正实数，
和
表示所述预测模型的控制变量最大值和最小值，
和
表示所述预测模型的状态变量最大值和最小值，Q和R为任意正定对角矩阵，P满足下面的不等式：

Q+K^TRK+(A(θ(k+N))+B(θ(k+N))K)^TP(A(θ(k+N))+B(θ(k+N))K)-P≤0

其中，P>0，K为辅助变量。
根据权利要求13所述的装置，其特征在于，所述第三确定模块还用于：

根据所述k时刻至所述k+N-1时刻的所述控制增量
以及所述k-1时刻至k+N-2时刻的控制变量
确定所述k时刻至所述k+N-1时刻的控制变量
其中

根据所述k时刻至所述k+N-1时刻的控制变量
进行模型预测控制。