CN112015083B

CN112015083B - Siso紧格式无模型控制器基于集成学习的参数自整定方法

Info

Publication number: CN112015083B
Application number: CN202010559963.0A
Authority: CN
Inventors: 卢建刚; 杨晔; 陈晨; 陈金水; 王文海
Original assignee: Zhejiang University ZJU; Zhejiang Lab
Current assignee: Zhejiang University ZJU; Zhejiang Lab
Priority date: 2020-06-18
Filing date: 2020-06-18
Publication date: 2021-09-24
Anticipated expiration: 2040-06-18
Also published as: CN112015083A

Abstract

本发明公开了一种SISO紧格式无模型控制器基于集成学习的参数自整定方法，所述集成学习算法包含PSO算法、BP神经网络以及循环神经网络三种个体算法。以系统误差作为集成学习算法的输入，首先进行三种个体算法对SISO紧格式无模型控制器的参数在线整定并输出三组临时整定参数，将结果分别输入到控制器中计算被控对象的控制输入，计算得到三组临时系统误差并利用softmax函数计算个体算法的权重比，将权重比与临时整定参数进行加权求和作为最终SISO紧格式无模型控制器待整定参数，实现参数自整定。本发明提出的SISO紧格式无模型控制器基于集成学习的参数自整定方法，结合不同个体算法优势，增强算法泛化性，克服控制器参数在线整定难题，对SISO系统具有良好的控制效果。

Description

SISO紧格式无模型控制器基于集成学习的参数自整定方法

技术领域

本发明属于自动化控制领域，尤其是涉及一种SISO紧格式无模型控制器基于集成学习的参数自整定方法。

背景技术

SISO(Single Input and Single Output，单输入单输出)系统广泛存在于炼油、化工、火电、机械、电气、石化、制药、食品、造纸、水处理、冶金、水泥、橡胶等行业的反应器、精馏塔、机器、设备、装置、生产线、车间、工厂等被控对象中。随着科技水平的不断提高，工业装置日益大型化与复杂化，使生产过程呈现出越来越多的强非线性、时变等特征，而以PID为代表的传统控制器在控制具有强非线性、时变等特征的复杂被控对象时往往难以达到理想的控制效果。无模型控制器是一种新型的基于数据驱动的控制模型，对未知非线性时变系统具有很好的控制效果，因此具有良好的应用前景。

针对SISO系统的无模型控制器的现有实现方法中包括SISO紧格式无模型控制器。SISO紧格式无模型控制器是一种新型的数据驱动控制方法，其特征在于不需要掌握被控对象的任何数学原理，仅需要SISO被控对象实时测量的输入输出数据就可以进行控制器的分析和设计，具有实现方法简单、计算负担小且鲁棒性强等优点，对未知非线性时变SISO系统也能够进行较好的控制。SISO紧格式无模型控制器的理论基础，由侯忠生与金尚泰在其合著的《无模型自适应控制—理论与应用》(科学出版社，2013年，第55页)中提出，其控制算法如下：

其中，u(k)为k时刻的系统控制输入；e(k)为k时刻的系统误差；φ_c(k)为k时刻的SISO系统伪偏导数估计值；λ为惩罚因子，ρ为步长因子。

然而，SISO紧格式无模型控制器在投入实际工业场景之前需要根据行业的专业知识与经验来预先设定惩罚因子λ和步长因子ρ等参数的数值，错误的参数值设定可能会导致工况故障等问题，同时无模型控制器在实际投用过程中也尚未实现惩罚因子λ和步长因子ρ等参数的在线自整定。控制器参数有效整定手段的缺乏，不仅使SISO紧格式无模型控制器的使用调试过程中耗时耗力，而且有时还会严重影响SISO紧格式无模型控制器的控制效果，限制了SISO紧格式无模型控制器的广泛应用。

为了打破制约SISO紧格式无模型控制器推广应用的瓶颈，SISO紧格式无模型控制器在实际投用过程中还需要解决在线自整定参数的难题。

发明内容

本发明的目的在于，提供一种SISO紧格式无模型控制器基于集成学习的参数自整定方法，以解决SISO紧格式无模型控制器的参数在线自整定问题。

为此，本发明的上述目的通过以下技术方案来实现，包括以下步骤：

步骤(1)：SISO紧格式无模型控制器参数包含惩罚因子λ和步长因子ρ；确定SISO紧格式无模型控制器待整定参数，所述SISO紧格式无模型控制器待整定参数，为所述SISO紧格式无模型控制器参数的部分或全部，包含惩罚因子λ和步长因子ρ的任意之一或其组合；确定集成学习算法中个体算法的数目为3；确定集成学习算法中具体个体算法包含PSO算法、BP神经网络和循环神经网络；确定PSO算法的迭代次数、种群规模；初始化PSO算法中粒子群的位置与速度；确定BP神经网络的输入层节点数、隐含层单元数、输出层节点数，所述输出层节点数不少于所述SISO紧格式无模型控制器待整定参数个数；初始化BP神经网络隐含层和输出层中所有待训练学习的权系数；确定BP神经网络反向传播的学习率参数值；确定循环神经网络的输入层节点数、隐含层单元数、输出层节点数，所述输出层节点数不少于所述SISO紧格式无模型控制器待整定参数个数；初始化循环神经网络隐含层和输出层中所有待训练学习的权系数；确定循环神经网络反向传播的学习率参数值；

步骤(2)：将当前时刻记为k时刻，基于系统输出期望值与系统输出实际值，采用系统误差计算函数计算得到k时刻的系统误差，记为e(k)；

步骤(3)：将步骤(2)计算得到的系统误差及其函数组、系统输出期望值、系统输出实际值的任意之一或任意种组合，作为系统误差集合，所述的系统误差集合作为集成学习算法的输入集合；

步骤(4)：基于步骤(3)所述的集成学习算法的输入集合，步骤(1)中所述的集成学习算法中的个体算法进行并行运算，各自运算方法如下：

当所述个体算法为PSO算法时，PSO算法粒子群规模为待整定参数的数目，初始化PSO算法中的所有粒子的位置，计算粒子群中每一个粒子的适应度值，通过对比粒子的适应度值确定每一个粒子在历次迭代中个体最优位置和整个粒子群在历次迭代中的群体最优位置，基于所述个体最优位置和群体最优位置对粒子进行速度和位置的更新，更新公式如下：

V(i)＝wV(i)+c₁r₁(gbest(i)-pop(i))+c₂r₂(zbest-pop(i))

pop(i)＝pop(i)+wV(i)

其中V(i)是待更新的粒子个体速度，pop(i)是待更新的粒子个体位置，zbest是当前群体最优粒子，gbest是当前个体最优粒子，c₁和c₂是非负的常数，r₁和r₂是分布于0到1之间的随机数，w是惯性权重系数；最终输出的群体最优粒子作为所述SISO紧格式无模型控制器待整定参数的值λ₁和/或ρ₁，记为候选参数集合1；

当所述个体算法为BP神经网络时，基于步骤(3)的输入，BP神经网络进行前向运算，首先计算当前时刻的输入与待训练权系数的乘积并输入至激活函数，得到隐含层状态值，接着将隐含层输出与输出层权系数相乘并通过激活函数即可得到最终输出层的值输出的值作为所述SISO紧格式无模型控制器待整定参数的值λ₂和/或ρ₂，记为候选参数集合2；

当所述个体算法为循环神经网络时，基于步骤(3)的输入，循环神经网络进行前向运算，首先计算当前时刻的输入与待训练权系数的乘积以及上一时刻的隐含层状态值与待训练权系数的乘积，将两个乘积的结果进行求和并输入至激活函数，得到当前时刻的隐含层状态值；将当前时刻隐含层状态值乘以权系数并通过激活函数得到最终输出层的值，输出的值作为所述SISO紧格式无模型控制器待整定参数的值λ₃和/或ρ₃，记为候选参数集合3；

步骤(5)：将步骤(4)所述的候选参数集合1、候选参数集合2以及候选参数集合3，分别作用于SISO紧格式无模型控制器中，进而分别计算得到三组SISO紧格式无模型控制器针对被控对象在k时刻的控制输入u₁(k)、u₂(k)以及u₃(k)；

步骤(6)：步骤(5)所述控制输入u₁(k)、u₂(k)和u₃(k)分别作用于被控对象后，得到三组被控对象在后一时刻的系统输出实际值，根据系统的期望输出值采用步骤(2)中的误差计算函数计算集成学习中个体算法参数整定所产生对应的临时系统误差，记为err₁(k)、err₂(k)和err₃(k)；

步骤(7)：基于步骤(6)的临时系统误差err₂(k)和err₃(k)，集成学习中的BP神经网络和循环神经网络以最小化各自系统误差函数的值为目标，采用基于链式法则的梯度下降法进行神经网络反向传播计算，目的是更新各自神经网络所有待训练学习的权系数，作为下一时刻神经网络进行前向计算的权系数；所述梯度下降法公式如下：

其中w为各种神经网络中待训练学习的权系数，J(w)是关于权系数w的系统误差函数，α是学习率，为0到1之间的实数；所述反向传播计算过程中，在更新神经网络所有待训练学习的权系数时，使用步骤(5)中所述控制输入u₂(k)以及u₃(k)分别针对SISO紧格式无模型控制器候选参数集合2和候选参数集合3中各个待整定参数在k时刻的偏导数，具体计算公式如下：

当候选参数集合2包含惩罚因子λ₂时，所述控制输入u₂(k)针对所述惩罚因子λ₂在k时刻的偏导数为：

当候选参数集合2包含步长因子ρ₂时，所述控制输入u₂(k)针对所述步长因子ρ₂在k时刻的偏导数为：

当候选参数集合3包含惩罚因子λ₃时，所述控制输入u₃(k)针对所述惩罚因子λ₃在k时刻的偏导数为：

当候选参数集合3包含步长因子ρ₃时，所述控制输入u₃(k)针对所述步长因子ρ₃在k时刻的偏导数为：

其中，φ(k)为k时刻的伪梯度估计值；

步骤(8)：基于步骤(6)的三组临时系统误差err₁(k)、err₂(k)和err₃(k)，利用softmax(归一化指数)函数计算三种个体算法整定参数的权重比例，并根据步骤(4)所述的候选参数集合与权重比例进行加权求和，得到最终SISO紧格式无模型控制器待整定参数，具体计算公式如下：

其中α_i(k)是每一个个体算法在集成学习算法中的权重比例，λ_i(k)和ρ_i(k)表示当前时刻集成学习中所有个体算法整定的参数值；

步骤(9)：基于步骤(2)得到的系统误差e(k)、步骤(8)得到的所述SISO紧格式无模型控制器待整定参数的值，采用SISO紧格式无模型控制器的控制算法，计算得到SISO紧格式无模型控制器针对被控对象在k时刻的控制输入u(k)；

步骤(10)：基于步骤(9)得到的所述控制输入u(k)，计算所述控制输入u(k)分别针对各个所述SISO紧格式无模型控制器待整定参数在k时刻的偏导数，计算公式如下：

当所述SISO紧格式无模型控制器待整定参数中包含惩罚因子λ时，所述控制输入u(k)针对所述惩罚因子λ在k时刻的偏导数为：

当所述SISO紧格式无模型控制器待整定参数中包含步长因子ρ时，所述控制输入u(k)针对所述步长因子ρ在k时刻的偏导数为：

其中，φ(k)为k时刻的伪梯度估计值；

步骤(11)：所述控制输入u(k)作用于被控对象后，得到被控对象在后一时刻的系统输出实际值，返回到步骤(2)，重复步骤(2)到步骤(11)。

集成学习算法的本质是将多个个体学习算法用某种策略结合起来，组成一个更高级学习器。SISO紧格式无模型控制器在每一个时刻都会产生不同的系统控制输入输出以及系统误差等时间序列信息，待整定参数与上述数据的数理关系在时刻变化，运用单一的学习算法无法始终保持高精度的参数整定效果，算法的泛化能力相对较低。因此利用多种个体学习算法对SISO紧格式无模型控制器待整定参数进行同时整定，并根据个体算法的参数整定效果进行综合的参数确定决策。集成学习算法中个体学习算法的选择需要遵循准确性与多样性两个标准，个体算法本身需要具备参数整定的有效性，个体算法之间需要具备差异性。

PSO算法是一种基于群体智能的进化计算方法，用随机解初始化一群随机粒子，然后通过迭代进化找到最优解，在每一次迭代中，粒子通过跟踪个体最优与群体最优两个极值来更新粒子。PSO算法具有参数少、搜索速度快的特点，并且采用实数编码，直接由问题的解决定，问题解的变量数直接作为粒子的维数，节省运算空间。但是PSO算法也存在着收敛精度低等缺点。

BP神经网络是传统的神经网络算法，根据外界输入样本值不断改变网络中的权系数，使网络的输出不断接近期望的输出值。BP神经网络本质上实现了从输入到输出的映射功能，使其适合求解内部机制复杂的问题，并且网络中的神经元可以存储权系数的值，保证BP神经网络具有高度自学习和自适应能力。但是当BP神经网络解决复杂的非线性问题时，会面临陷入局部最优的问题，与此同时，不同时刻下BP神经网络的神经元相互独立，没有信息的交互，导致BP神经网络在处理与时序相关的问题时存在精度低的问题。

循环神经网络是一种时间递归式神经网络，传统的神经网络所有参数相互独立，且相邻时刻的神经元之间互不依赖，无法做到信息的共享。但是循环神经网络的计算流程中将上一时刻的隐含层状态一并与当前时刻的输入进行同步计算，实现网络当前时刻可以利用上一时刻数据的相关信息，这种网络运算结构保证循环神经网络同时具备传统前馈神经网络的学习能力以及存储时间序列信息的记忆能力。但是循环神经网络也存在参数多，训练时间较长的问题。

集成学习算法结合上述三种个体算法的特点，利用个体算法同时对SISO紧格式无模型控制器进行参数在线自整定，根据个体算法参数整定的效果计算系统误差，判断每一个时刻三种个体算法参数整定的优劣，根据误差值分配对应权重，最后进行待整定参数的加权求和作为最终SISO紧格式无模型控制器的整定参数。因此集成学习算法可以灵活利用个体算法的优势，做出最优决策，提高算法的泛化能力，更高效稳定地帮助SISO紧格式无模型控制器实现在线参数自整定。

在采用上述技术方案的同时，本发明还可以采用或者组合采用以下进一步的技术方案：

所述步骤(2)中的所述系统误差计算函数的自变量包含系统输出期望值与系统输出实际值。

所述步骤(2)中的所述系统误差计算函数采用e(k)＝y^*(k)-y(k)，其中y^*(k)为k时刻设定的系统输出期望值，y(k)为k时刻采样得到的系统输出实际值；或者采用e(k)＝y^*(k+1)-y(k)，其中y^*(k+1)为k+1时刻的系统输出期望值；或者采用e(k)＝y(k)-y^*(k)；或者采用e(k)＝y(k)-y^*(k+1)。

所述步骤(3)中的所述系统误差及其函数组，包含k时刻的系统误差e(k)、k时刻及之前所有时刻的系统误差的累积即

k时刻系统误差e(k)的一阶后向差分e(k)-e(k-1)、k时刻系统误差e(k)的二阶后向差分e(k)-2e(k-1)+e(k-2)、k时刻系统误差e(k)的高阶后向差分的任意之一或任意种组合。

所述步骤(7)中的所述系统误差函数的自变量包含系统误差、系统输出期望值、系统输出实际值的任意之一或任意种组合。

所述步骤(7)中的所述系统误差函数为ae²(k)+bΔu²(k)，其中，e(k)为系统误差，Δu(k)＝u(k)-u(k-1)，a与b为大于或等于0的常数。

所述被控对象包含反应器、精馏塔、机器、设备、装置、生产线、车间、工厂等工业对象。

运行所述控制方法的硬件平台包含数字信号处理控制器、嵌入式系统控制器、可编程逻辑控制器、工业控制计算机、单片机控制器、微处理器控制器、现场可编程门阵列控制器、集散控制系统、现场总线控制系统、工业物联网控制系统、工业互联网控制系统的任意之一或任意种组合。

本发明提供的SISO紧格式无模型控制器基于集成学习的参数自整定方法，能够实现良好的控制效果，并有效克服在工业控制中，SISO紧格式无模型控制器的惩罚因子λ和步长因子ρ需要费时费力进行整定的难题。

附图说明

图1为本发明的原理框图；

图2为本发明中PSO算法原理图；

图3为本发明中BP神经网络原理图；

图4为本发明中循环神经网络原理图；

图5为三容水箱SISO系统的示意图；

图6为三容水箱SISO系统输出的控制效果图；

图7为三容水箱SISO系统控制输入曲线；

图8为三容水箱SISO系统控制输入的惩罚因子λ变化曲线；

图9为三容水箱SISO系统控制输入的步长因子ρ变化曲线。

具体实施方式

下面结合附图和具体实施例对本发明进一步说明。

图1给出了本发明的原理框图。针对具有单个输入和单个输出的SISO系统，采用SISO紧格式无模型控制器进行控制；SISO紧格式无模型控制器参数包含惩罚因子λ和步长因子ρ；确定SISO紧格式无模型控制器待整定参数，所述SISO紧格式无模型控制器待整定参数，为所述SISO紧格式无模型控制器参数的部分或全部，包含惩罚因子λ和步长因子ρ的任意之一或其组合；确定集成学习算法中个体算法的数目为3；确定集成学习算法中具体个体算法包含PSO算法、BP神经网络和循环神经网络；确定PSO算法的迭代次数、种群规模；初始化PSO算法中粒子群的速度；确定BP神经网络的输入层节点数、隐含层单元数、输出层节点数，所述输出层节点数不少于所述SISO紧格式无模型控制器待整定参数个数；初始化BP神经网络隐含层和输出层中所有待训练学习的权系数；确定BP神经网络反向传播的学习率参数值；确定循环神经网络的输入层节点数、隐含层单元数、输出层节点数，所述输出层节点数不少于所述SISO紧格式无模型控制器待整定参数个数；初始化循环神经网络隐含层和输出层中所有待训练学习的权系数；确定循环神经网络反向传播的学习率参数值；当前时刻记为k时刻；将输出期望值y^*(k)与输出实际值y(k)之差作为k时刻的系统误差e(k)，同时计算k时刻系统误差的一阶后向差分e(k)-e(k-1)以及历史系统误差总和

将e(k)、e(k)-e(k-1)、

组合向量作为集成学习算法的输入集合。

基于上述的集成学习算法的输入集合，进行集成算法中个体算法的运算。当所述个体算法为图2所示的PSO算法时，PSO算法粒子群规模为待整定参数的数目，初始化PSO算法中的所有粒子的位置，计算粒子群中每一个粒子的适应度值，通过对比粒子的适应度值确定每一个粒子在历次迭代中个体最优位置和整个粒子群在历次迭代中的群体最优位置，基于所述个体最优位置和群体最优位置对粒子进行速度和位置的更新，当满足算法终止条件时，输出群体最优粒子作为所述SISO紧格式无模型控制器待整定参数的值λ₁和/或ρ₁，记为候选参数集合1；当所述个体算法为图3所示的BP神经网络时，BP神经网络进行前向运算，首先计算当前时刻的输入与待训练权系数的乘积并输入至激活函数，得到隐含层状态值，接着将隐含层输出与输出层权系数相乘并通过激活函数即可得到最终输出层的值输出的值作为所述SISO紧格式无模型控制器待整定参数的值λ₂和/或ρ₂，记为候选参数集合2；当所述个体算法为图4所示的循环神经网络时，循环神经网络进行前向运算，首先计算当前时刻的输入与待训练权系数的乘积以及上一时刻的隐含层状态值与待训练权系数的乘积，将两个乘积的结果进行求和并输入至激活函数，得到当前时刻的隐含层状态值；将当前时刻隐含层状态值乘以权系数并通过激活函数得到最终输出层的值，输出的值作为所述SISO紧格式无模型控制器待整定参数的值λ₃和/或ρ₃，记为候选参数集合3。

将上述的候选参数集合1、候选参数集合2以及候选参数集合3，分别作用于SISO紧格式无模型控制器中，进而分别计算得到三组SISO紧格式无模型控制器针对被控对象在k时刻的控制输入u₁(k)、u₂(k)以及u₃(k)，控制输入u₁(k)、u₂(k)和u₃(k)分别作用于被控对象后，得到三组被控对象在后一时刻的系统输出实际值，根据系统的期望输出值采用步骤(2)中的误差计算函数计算集成学习中个体算法参数整定所产生对应的临时系统误差，记为err₁(k)、err₂(k)和err₃(k)。

基于上述的临时系统误差err₂(k)和err₃(k)，集成学习中的BP神经网络和循环神经网络以最小化各自系统误差函数的值为目标，采用基于链式法则的梯度下降法进行神经网络反向传播计算，目的是更新各自神经网络所有待训练学习的权系数，作为下一时刻神经网络进行前向计算的权系数。所述反向传播计算过程中，在更新神经网络所有待训练学习的权系数时，需要使用各自控制输入u₂(k)以及u₃(k)分别针对各个所述SISO紧格式无模型控制器待整定参数在k时刻的偏导数。以当前时刻为例，对于BP神经网络输出层待训练学习的权系数，首先计算误差函数关于当前时刻输出层权系数的梯度，利用梯度下降法更新当前时刻的输出层权系数；对于BP神经网络隐含层中所有待训练学习的权系数，首先利用链式法则计算误差函数关于隐含层状态的梯度值，再利用全导数公式获得误差函数关于隐含层中所有权系数的梯度代数式，同样利用梯度下降法即可对权系数进行更新。循环神经网络的权系数更新过程与BP神经网络相同。

基于个体算法三组临时系统误差err₁(k)、err₂(k)和err₃(k)，利用softmax(归一化指数)函数计算三种个体算法整定参数的权重比例，并根据候选参数集合1、候选参数集合2以及候选参数集合3与权重比例进行加权求和，得到最终SISO紧格式无模型控制器待整定参数。基于系统误差e(k)、最终SISO紧格式无模型控制器待整定参数的值，采用SISO紧格式无模型控制器的控制算法，计算得到SISO紧格式无模型控制器针对被控对象在k时刻的控制输入u(k)。控制输入u(k)作用于被控对象后，得到被控对象在后一时刻的输出实际值，然后重复上述过程，进行后一时刻的SISO紧格式无模型控制器基于循环神经网络的参数自整定过程。

以下是本发明的一个具体实施例。

被控对象三容水箱为单输入单输出SISO系统，是一个具有非线性、大惯性等复杂特点的典型工业对象，图5为三容水箱的示意图，由3个水箱构成，其中系统输出实际值y是水箱3的液位高度(cm)，控制输入u是流入水箱1的流量调节阀的阀门开度(％)。三容水箱的初始工况为：u(0)＝40％，y(0)＝50cm。在20秒处，为满足工业现场工况调整的需要，系统输出期望值y^*(20)从50cm调整为60cm；随后，在60秒处，系统输出期望值y^*(60)从60cm又调整回到50cm。针对工业现场的上述典型实际工况，开展三组试验进行对比验证。运行本发明控制方法的硬件平台采用工业控制计算机。

第一组试验(RUN1)：循环神经网络的输入层节点数预设为9个，隐含层节点数预设为20个，输出层节点数预设为2个，其中输出层2个节点分别输出惩罚因子λ和步长因子ρ；然后采用SISO紧格式无模型控制器的控制算法，对上述三容水箱SISO系统进行控制；图6的RUN1曲线为输出的控制效果图，图7的RUN1曲线为控制输入曲线，图8的RUN1曲线为控制输入的惩罚因子λ变化曲线，图9的RUN1曲线为控制输入的步长因子ρ变化曲线；从图6的RUN1曲线可以发现，系统输出实际值能够快速跟踪系统输出期望值的变化，同时系统输出实际值的超调量很小，实现了理想的控制性能；从图8与图9的RUN1曲线可以发现，惩罚因子λ和步长因子ρ能够及时根据系统误差的变化进行在线自整定，使系统更快速、准确、稳定地跟踪输出期望值。本发明的方法通过对惩罚因子λ和步长因子ρ进行同时自整定，能够实现良好的控制效果，并且可以有效克服惩罚因子λ和步长因子ρ需要费时费力进行整定的难题。

第二组试验(RUN2)：惩罚因子λ固定，取值为第一组试验(RUN1)时惩罚因子λ变化曲线的平均值；步长因子ρ固定，取值为第一组试验(RUN1)时步长因子ρ变化曲线的平均值；然后采用SISO紧格式无模型控制器的控制算法，对上述三容水箱SISO系统进行控制；图6的RUN2曲线为输出的控制效果图，图7的RUN2曲线为控制输入曲线，图8的RUN2曲线为控制输入的惩罚因子λ，图9的RUN2曲线为控制输入的步长因子ρ；从图6的RUN2曲线可以发现，系统输出实际值能够慢速跟踪系统输出期望值的变化，同时系统输出实际值的超调量很小；与第一组试验(RUN1)的控制性能相比，第二组试验(RUN2)在控制性能的快速性指标方面较为逊色。

第三组试验(RUN3)：惩罚因子λ与步长因子ρ的取值，均固定为常用值0.5；然后采用SISO紧格式无模型控制器的控制算法，对上述三容水箱SISO系统进行控制；图6的RUN3曲线为输出的控制效果图，图7的RUN3曲线为控制输入曲线；从图6的RUN3曲线可以发现，系统输出实际值能够最快速跟踪系统输出期望值的变化，但是系统输出实际值的超调量较大；与第一组试验(RUN1)的控制性能相比，第三组试验(RUN3)在控制性能的稳定性指标方面较为逊色。

上述三组试验的结果表明，第一组试验(RUN1)中采用的由本发明提供的SISO紧格式无模型控制器基于集成学习的参数自整定方法，具有最优的控制性能综合指标。

应该特别指出的是，在上述具体实施例中，将输出期望值y^*(k)与输出实际值y(k)之差作为k时刻的系统误差e(k)，也就是e(k)＝y^*(k)-y(k)，仅为所述误差计算函数中的一种方法；也可以将k+1时刻系统输出期望值y^*(k+1)与k时刻输出y(k)之差作为系统误差e(k)，也就是e(k)＝y^*(k+1)-y(k)；所述误差计算函数还可以采用输出期望值与输出实际值的其他计算方法，举例来说，

对上述具体实施例的被控对象而言，采用上述不同的系统误差计算函数，都能够实现良好的控制效果。

更应该特别指出的是，在上述具体实施例中，在以系统误差函数的值最小化为目标来更新循环神经网络的隐含层权系数、输出层权系数时，所述系统误差函数采用了系统误差平方e²(k)，仅为所述系统误差函数中的一种函数；举例来说，所述系统误差函数还可以采用ae²(k)+bΔu²(k)，其中，Δu(k)＝u(k)-u(k-1)，a与b为大于或等于0的常数；显然，当b等于0时，所述系统误差函数仅考虑了e²(t)的贡献，表明最小化的目标是系统误差最小，也就是追求精度高；而当b大于0时，所述系统误差函数同时考虑e²(t)的贡献和Δu²(t)的贡献，表明最小化的目标在追求系统误差小的同时，还追求控制输入变化小，也就是既追求精度高又追求操纵稳。对上述具体实施例的被控对象而言，采用上述不同的系统误差函数，都能够实现良好的控制效果；与系统误差函数仅考虑e²(k)贡献时的控制效果相比，在系统误差函数同时考虑e²(t)的贡献和Δu²(t)的贡献时其控制精度略有降低而其操纵平稳性则有提高。

最后应该特别指出的是，所述SISO紧格式无模型控制器待整定参数，包含惩罚因子λ和步长因子ρ的其中之一或所有；在上述具体实施例中，试验验证时惩罚因子λ和步长因子ρ实现了同时自整定；在实际应用时，还可以根据具体情况，选择待整定参数的任意种组合，举例来说，步长因子ρ固定而惩罚因子实现自整定；此外，SISO紧格式无模型控制器待整定参数，包括但不限于惩罚因子λ和步长因子ρ，举例来说，根据具体情况，还可以包括SISO系统伪偏导数估计值φ(k)等参数。

上述具体实施方式用来解释说明本发明，仅为本发明的优选实施例，而不是对本发明进行限制，在本发明的精神和权利要求的保护范围内，对本发明作出的任何修改、等同替换、改进等，都落入本发明的保护范围。

Claims

1.SISO紧格式无模型控制器基于集成学习的参数自整定方法，其特征在于包括以下步骤：

V(i)＝wV(i)+c₁r₁(gbest(i)-pop(i))+c₂r₂(zbest-pop(i))

pop(i)＝pop(i)+wV(i)

其中，φ(k)为k时刻的伪梯度估计值；

其中，φ(k)为k时刻的伪梯度估计值；

2.根据权利要求1所述的SISO紧格式无模型控制器基于集成学习的参数自整定方法，其特征在于，所述步骤(2)中的所述系统误差计算函数的自变量包含系统输出期望值与系统输出实际值。

3.根据权利要求2所述的SISO紧格式无模型控制器基于集成学习的参数自整定方法，其特征在于，所述系统误差计算函数采用e(k)＝y^*(k)-y(k)，其中y^*(k)为k时刻设定的系统输出期望值，y(k)为k时刻采样得到的系统输出实际值；或者采用e(k)＝y^*(k+1)-y(k)，其中y^*(k+1)为k+1时刻的系统输出期望值；或者采用e(k)＝y(k)-y^*(k)；或者采用e(k)＝y(k)-y^*(k+1)。

4.根据权利要求1所述的SISO紧格式无模型控制器基于集成学习的参数自整定方法，其特征在于，所述步骤(3)中的所述系统误差及其函数组，包含k时刻的系统误差e(k)、k时刻及之前所有时刻的系统误差的累积即

5.根据权利要求1所述的SISO紧格式无模型控制器基于集成学习的参数自整定方法，其特征在于，所述步骤(7)中的所述系统误差函数的自变量包含系统误差、系统输出期望值、系统输出实际值的任意之一或任意种组合。

6.根据权利要求5所述的SISO紧格式无模型控制器基于集成学习的参数自整定方法，其特征在于，所述系统误差函数为ae²(k)+bΔu²(k)，其中，e(k)为系统误差，Δu(k)＝u(k)-u(k-1)，a与b为大于或等于0的常数。

7.根据权利要求1所述的SISO紧格式无模型控制器基于集成学习的参数自整定方法，其特征在于：所述被控对象包含反应器、精馏塔、机器、设备、装置、生产线、车间、工厂。

8.根据权利要求1所述的SISO紧格式无模型控制器基于集成学习的参数自整定方法，其特征在于：运行所述的SISO紧格式无模型控制器的硬件平台包含数字信号处理控制器、嵌入式系统控制器、可编程逻辑控制器、工业控制计算机、单片机控制器、微处理器控制器、现场可编程门阵列控制器、集散控制系统、现场总线控制系统、工业物联网控制系统、工业互联网控制系统的任意之一或任意种组合。