CN113568306A

CN113568306A - 考虑状态约束和控制增益的倒立摆系统控制方法及系统

Info

Publication number: CN113568306A
Application number: CN202110691975.3A
Authority: CN
Inventors: 牛奔; 苏薇; 张家鸣; 王晓梅
Original assignee: Shandong Normal University
Current assignee: Shandong Normal University
Priority date: 2021-06-22
Filing date: 2021-06-22
Publication date: 2021-10-29
Anticipated expiration: 2041-06-22
Also published as: CN113568306B

Abstract

本公开提供了一种考虑状态约束和控制增益的倒立摆系统控制方法及系统，所述方案包括：构建倒立摆系统的非线性模型，并将倒立摆系统的相关状态约束引入所述非线性模型；根据倒立摆系统控制目标以及倒立摆系统的结构，确定所述倒立摆系统的系统误差函数以及BLF函数；采用具有自适应律的径向基神经网络对所述倒立摆系统中的完全未知非线性函数进行逼近；并基于特定增益抑制不等式对所述系统误差函数进而优化求解，构建最优倒立摆系统控制器；基于所述最优倒立摆系统控制器，实现对所述倒立摆系统指定性能的自适应跟踪控制。

Description

考虑状态约束和控制增益的倒立摆系统控制方法及系统

技术领域

本公开属于随机系统控制技术领域，尤其涉及一种考虑状态约束和控制增益的倒立摆系统控制方法及系统。

背景技术

本部分的陈述仅仅是提供了与本公开相关的背景技术信息，不必然构成在先技术。

众所周知，随机干扰在实际应用中经常发生，其性质是导致控制系统不稳定的原因之一。因此，近年来，越来越多的研究都集中在随机系统的稳定性控制上。发明人发现，现有的大部分理论都忽略了状态约束的影响，从而导致系统性能不佳，其中，关于非线性系统的研究，其只考虑确定性的非线性系统，而并非随机系统；关于随机个案的研究，其仍有许多困难需要进一步解决；同时，需要说明的是，未知的控制增益也会导致随机系统的不确定性和控制器设计的复杂性，然而，尚未有针对具有未知控制增益和全状态约束的MIMO(Multi-Input Multi-Output)随机非线性系统(特别是倒立摆系统)的研究。

发明内容

本公开为了解决上述问题，提供了一种考虑状态约束和控制增益的倒立摆系统控制方法及系统，所述方案采用具有自适应律的径向基神经网络处理倒立摆系统中含有的完全未知非线性函数，并通过将BLF与自适应反步技术相结合，实现对所述倒立摆系统指定性能的自适应跟踪控制。

根据本公开实施例的第一个方面，提供了一种考虑状态约束和控制增益的倒立摆系统控制方法，包括：

构建倒立摆系统的非线性模型，并将倒立摆系统的相关状态约束引入所述非线性模型；

根据倒立摆系统控制目标以及倒立摆系统的结构，确定所述倒立摆系统的系统误差函数以及BLF函数；

采用具有自适应律的径向基神经网络对所述倒立摆系统中的完全未知非线性函数进行逼近；并基于特定增益抑制不等式对所述系统误差函数进而优化求解，构建最优倒立摆系统控制器；

基于所述最优倒立摆系统控制器，实现对所述倒立摆系统指定性能的自适应跟踪控制。

进一步的，所述具有自适应律的径向基神经网络，具体表示如下：

其中，W为理想加权向量，S为高斯函数，所述自适应律

与RBF神经网络的加权向量

的关系为

进一步的，根据所述径向基神经网络的基向量来确定最优的自适应律，通过不断迭代调节所述自适应律的参数使倒立摆系统误差函数逼近到零。

进一步的，所述自适应反步算法具体为：基于确定好的所述倒立摆系统的系统误差函数以及BLF函数，以最小化系统误差函数为目的，运用反步法逐步对所述控制器和自适应律进行调整，使倒立摆系统趋于最优状态。

进一步的，所述倒立摆系统的非线性模型，具体表示如下：

其中，x＝[x₁,x₂,...,x_n]^T是系统状态，y∈R是系统输出，b是未知控制增益常数，u是控制器的输入，i＝1,2,...,n和

是局部利普希茨参数未知光滑非线性函数，t是时间，w是独立标准布朗运动，

根据本公开实施例的第二个方面，提供了一种考虑全状态约束和未知控制增益的倒立摆系统控制系统，包括：

模型构建单元，其用于构建倒立摆系统的非线性模型，并将倒立摆系统的相关状态约束引入所述非线性模型；

BLF函数确定单元，其用于根据倒立摆系统控制目标以及倒立摆系统的结构，确定所述倒立摆系统的系统误差函数以及BLF函数；

未知控制增益处理单元，其用于采用具有自适应律的径向基神经网络对所述倒立摆系统中的完全未知非线性函数进行逼近；并基于特定增益抑制不等式对所述系统误差函数进而优化求解，构建最优倒立摆系统控制器；

跟踪控制单元，其用于基于所述最优倒立摆系统控制器，实现对所述倒立摆系统指定性能的自适应跟踪控制。

根据本公开实施例的第三个方面，提供了一种控制器，包括存储器、处理器及存储在存储器上运行的计算机程序，所述处理器执行所述程序时实现所述的一种考虑全状态约束和未知控制增益的倒立摆系统控制方法。

根据本公开实施例的第四个方面，提供了一种非暂态计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现所述的一种考虑全状态约束和未知控制增益的倒立摆系统控制方法。

与现有技术相比，本公开的有益效果是：

(1)本公开所述方案采用一种特定增益抑制不等式方法来消除未知的控制增益，并利用BLF函数来解决完全状态约束问题，并基于李亚普诺夫稳定性分析，所提出的控制策略可以有效地保证所有系统变量在不违反完全状态约束的情况下的概率有界，其跟踪误差收敛为零。

(2)本公开所述方案首次针对倒立摆系统提出了一种自适应渐近跟踪控制方案，同时考虑了含有全状态约束和未知控制增益，与现有的自适应控制器相比，所述方案在自适应反步算法中引入了一种特定增益抑制不等式，从而消除了假设控制增益是已知的假设，而且考虑了跟踪问题，相比自适应有界控制结果更为普遍。

本公开附加方面的优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本公开的实践了解到。

附图说明

构成本公开的一部分的说明书附图用来提供对本公开的进一步理解，本公开的示意性实施例及其说明用于解释本公开，并不构成对本公开的不当限定。

图1为本公开实施例一中所述的考虑全状态约束和未知控制增益的倒立摆系统控制方法流程图；

图2为本公开实施例一中所述的二阶倒立摆系统模型；

图3(a)为本公开实施例一中所述控制方法的跟踪性能与现有控制器性能比较曲线；

图3(b)为本公开实施例一中所述控制方法的多输入多输出系统的第一个系统的跟踪性能与现有控制器性能比较曲线

图4为本公开实施例一中所述控制方法的多输入多输出系统的第二个系统的跟踪误差曲线；

图5(a)为本公开实施例一中所述的第一个系统的第一个子系统的自适应律示意图曲线图；

图5(b)为本公开实施例一中所述的第一个系统的第二个子系统的自适应律示意图曲线图；

图5(c)为本公开实施例一中所述的第二个系统的第一个子系统的自适应律示意图曲线图；

图5(d)为本公开实施例一中所述的第二个系统的第二个子系统的自适应律示意图曲线图。

具体实施方式

下面结合附图与实施例对本公开做进一步说明。

应该指出，以下详细说明都是例示性的，旨在对本公开提供进一步的说明。除非另有指明，本公开使用的所有技术和科学术语具有与本公开所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是，这里所使用的术语仅是为了描述具体实施方式，而非意图限制根据本公开的示例性实施方式。如在这里所使用的，除非上下文另外明确指出，否则单数形式也意图包括复数形式，此外，还应当理解的是，当在本说明书中使用术语“包含”和/或“包括”时，其指明存在特征、步骤、操作、器件、组件和/或它们的组合。

在不冲突的情况下，本公开中的实施例及实施例中的特征可以相互组合。

实施例一：

本实施例的目的是提供一种考虑全状态约束和未知控制增益的倒立摆系统控制方法。

一种考虑全状态约束和未知控制增益的倒立摆系统控制方法，包括：

具体的，为了便于理解，以下结合附图对本公开所述方案进行详细说明：

在本实施例中，设计了一种全状态约束和未知控制增益的倒立摆系统的指定性能控制算法，其中，所述指定性能具体指让倒立摆系统的运动状态达到预先设定的运动状态，通俗的讲，就是使倒立摆系统的运动状态与我们的参考信号yd保持同步状态，其最终目的是将系统误差函数逼近到零，具体的，所述控制方法主要分为四个步骤：步骤1，构建非线性模型；步骤2，确定BLF函数和特定的增益抑制不等式；步骤3，定义系统误差函数；步骤4，设计虚拟控制器、自适应律，最终确定实际控制器；最后，对所述控制方法进行验证。

优选地，步骤1中，所述倒立摆系统采用的非线性模型包括：

其中，x＝[x₁,x₂,...,x_n]^T是系统状态，y∈R是系统输出，b是未知控制增益常数，u是虚拟控制器的输入，i＝1,2,...,n和

是局部Lipschitz参数未知光滑非线性函数，t是时间，w是独立标准布朗运动，

优选地，步骤1中，所述状态约束范围为：

其中，

是正常数，x指倒立摆系统的状态输入，并对倒立摆系统的每一个状态输入根据需求设定一个上下界的约束。具体的，所述倒立摆系统的状态参数主要包括：小车质量，摆杆质量,小车摩擦系数，摆杆转动轴心到杆质心的长度，摆杆惯量；通过设计以小车加速度为系统输入，以摆杆角度为系统输出的被控对象模型。

优选地，所述步骤2中，所述倒立摆系统的BLF函数(barrier Lyapunov函数)具体如下：

其中，设计参数k_i,bj>0,

是θ的估计，θ为神经网络权值参数；

所述特定增益抑制不等式定义为：

其中，t∈[0,t_w),v_j(t),j＝1,2,...,n是一个光滑的函数，t_w为大于零的时间值，v_j即本公开中所述的自适应律函数，Z(t)是一个光滑的函数,即确定好的BLF函数，由于需要对其进行微分，故需要所述BLF函数为光滑函数；LZ(t)为确定好的BLF函数的微分形式，其中，ρ,χ表示未知正常数，b_j是未知正变量。

优选地，步骤3进一步包括：定义倒立摆系统误差函数，具体为，

z_i,j＝x_i,j-y_di

其中，z_i,j是坐标变换之后的状态变量，y_di为跟踪信号。以倒立摆系统而言，所述系统误差函数具体指让倒立摆系统的运动状态达到我们想要的运动状态，言外之意，与我们的参考信号y_di保持同步状态，即我们的最终目的是将系统误差函数z(倒立摆系统的状态输入x与跟踪系统函数y_di的误差)逼近到零。

优选地，步骤4进一步包括以下步骤：

步骤4.1：确定虚拟控制器，具体为：

其中，设计参数k_i,j>0,a_i,j>0，

为所述径向基神经网络的基函数向量，α是虚拟控制器，I_st是控制增益函数，

是等价虚拟控制单元，k是设计的参数，a是设计的参数，z是系统误差函数，S是高斯函数，

是自适应的估计。

步骤4.2，对所述BLF函数进行微分处理，并将系统误差函数、系统误差函数的导数，以及倒立摆系统的非线性函数模型的变量带入到所述特定的BLF微分函数不等式，即可得到下式，其中，

为所述的虚拟控制器。

其中，

是坐标变量，

是约束

范围的参数，

是系统的函数，

是系统的未知增益常数，y_di是跟踪系统函数，

是设计的参数，另外有

是

的误差，

是

的估计。

采用具有自适应律的径向基神经网络对所述倒立摆系统中的完全未知非线性函数进行处理(即对所述完全未知非线性函数进行逼近，这里利用了径向基神经网络可以有效对任意非线性函数进行描述的功能)，所述完全未知非线性函数，表示如下：

其中，所述具有自适应律的径向基神经网络是基于经典的RBF神经网络，并定义所述自适应律

与RBF神经网络的加权向量

的关系为

此处的*表示最优；具体的，所述RBF神经网络具体表示为

其中，W为理想加权向量，S为高斯函数，Young不等式的形式为:对于

有如下关系：

其中，ε>0,r>1,t>1,(r-1)(t-1)＝1。

步骤4.3，利用所述具有自适应律的径向基神经网络对所述完全未知非线性函数进行逼近处理，同时，基于young不等式，得到下式：

其具体步骤如下：

根据

通过径向基神经网络中的加权向量变形得到：

其中，ε为

与

之间的误差；

基于所述young不等式，得到：

带入上文中的公式：

得到公式：

步骤4.4，虚拟控制器设计为

其中设计参数

步骤4.5，通过引入自适应律，得到：

步骤4.6，利用young不等式，得到：

步骤4.7，根据倒立摆系统中的各系统进行叠加，得到最终的控制器

其中，m表示一共有几阶倒立摆系统，i泛指其中任意一阶倒立摆系统。n_i表示每一阶倒立摆系统中子系统的数量，j_i表示某一阶倒立摆系统的任意一个子系统，i∈[1,m]，j_i∈[1,n_i]。

整理如上式子得到：

其中，

对

在[0,t]上积分，得到：

所述方案的整体思路是，首先对每一个子系统确定误差函数，然后设计BLF函数，进行一系列的求导转换过程得到每一个子系统的最优的控制器和自适应律，然后将这所有的子系统都累加起来组成了本案例的闭环系统，继而得到本案例闭环系统的总体最优控制器和自适应律。

进一步的，为了证明本公开所述方案的有效性，进行了如下实验：

以图2中所述的倒立摆系统为例(二阶倒立摆系统)，

(1)其非线性模型具体描述如下：

第一系统：

第二系统：

其中，所述第一系统和第二系统对应于所述二阶倒立摆系统的每一阶，而第一子系统和第二子系统则对应于每一阶倒立摆系统中的相应子系统。

(2)其控制器状态参数选取如下：

k_1，b1＝k_1，b2＝k_2，b1＝k_2，b2＝15，k_1，1＝k_2，1＝230，k_1，2＝k_2，2＝10，R_1，1＝R_1，2＝R_2，1＝R_2，2＝1，r_1，1＝r_1，2＝r_2，1＝r_2，2＝10，a_1，1＝a_1，2＝a_2，1＝a_2，2＝0.01，σ_1，1＝σ_1，2＝σ_2，1＝σ_2，2＝1.

(3)仿真参数初始化如下：

[x₁(0)，x₂(0)，x₃(0)]^T＝[0.1，0.1，0.1]^T，

其仿真结果如图3至图5所示。图3(a)-图3(b)是系统的跟踪性能曲线。从图3可以看出，与现有的结果相比，本公开设计的控制器使系统具有更好的跟踪性能。图4表示倒立摆系统的跟踪误差曲线，从图4可以看出本公开设计的控制器能够保证跟踪误差到零。图5(a)-图5(d)分别展示了图2中所述倒立摆系统的不同系统的不同子系统中的自适应律示意图。

本公开所述方案通过引入一种新的barrier Lyapunov函数(BLF)，并针对考虑的系统引入特定的增益抑制不等式，提出了一种新的控制算法，包括如下步骤：首先考虑了一类多输入多输出(MIMO)随机非线性系统，采用具有自适应律的径向基(RBF)神经网络处理系统中含有的完全未知非线性函数，接着将BLF与自适应反步技术相结合，设计了针对实现指定性能的控制算法的自适应跟踪控制器。本公开所述方案首次针对MIMO随机非线性系统提出了一种新的自适应渐近跟踪控制方案，同时考虑了含有全状态约束和未知控制增益，与现有的自适应控制器相比，所述方案在自适应反步算法中引入了一种特定增益抑制不等式，从而消除了假设控制增益是已知的假设，而且考虑了跟踪问题，相比自适应有界控制结果更为普遍。

实施例二：

本实施例的目的是提供一种考虑全状态约束和未知控制增益的倒立摆系统控制系统。

一种考虑全状态约束和未知控制增益的倒立摆系统控制系统，包括：

在更多实施例中，还提供：

一种控制器，包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令，所述计算机指令被处理器运行时，完成实施例一中所述的方法。为了简洁，在此不再赘述。

应理解，本实施例中，处理器可以是中央处理单元CPU，处理器还可以是其他通用处理器、数字信号处理器DSP、专用集成电路ASIC，现成可编程门阵列FPGA或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

存储器可以包括只读存储器和随机存取存储器，并向处理器提供指令和数据、存储器的一部分还可以包括非易失性随机存储器。例如，存储器还可以存储设备类型的信息。

一种计算机可读存储介质，用于存储计算机指令，所述计算机指令被处理器执行时，完成实施例一中所述的方法。

实施例一中的方法可以直接体现为硬件处理器执行完成，或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器、闪存、只读存储器、可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器，处理器读取存储器中的信息，结合其硬件完成上述方法的步骤。为避免重复，这里不再详细描述。

本领域普通技术人员可以意识到，结合本实施例描述的各示例的单元即算法步骤，能够以电子硬件或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本公开的范围。

上述实施例提供的一种考虑全状态约束和未知控制增益的倒立摆系统控制方法及系统可以实现，具有广阔的应用前景。

以上所述仅为本公开的优选实施例而已，并不用于限制本公开，对于本领域的技术人员来说，本公开可以有各种更改和变化。凡在本公开的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本公开的保护范围之内。

上述虽然结合附图对本公开的具体实施方式进行了描述，但并非对本公开保护范围的限制，所属领域技术人员应该明白，在本公开的技术方案的基础上，本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本公开的保护范围以内。

Claims

1.一种考虑状态约束和控制增益的倒立摆系统控制方法，其特征在于，包括：

2.如权利要求1所述的一种考虑状态约束和控制增益的倒立摆系统控制方法，其特征在于，所述具有自适应律的径向基神经网络，具体表示如下：

其中，W为理想加权向量，S为高斯函数，所述自适应律

与RBF神经网络的加权向量

的关系为

3.如权利要求2所述的一种考虑状态约束和控制增益的倒立摆系统控制方法，其特征在于，根据所述径向基神经网络的基向量来确定最优的自适应律，通过不断迭代调节所述自适应律的参数使倒立摆系统误差函数逼近到零。

4.如权利要求1所述的一种考虑状态约束和控制增益的倒立摆系统控制方法，其特征在于，所述自适应反步算法具体为：基于确定好的所述倒立摆系统的系统误差函数以及BLF函数，以最小化系统误差函数为目的，运用反步法逐步对所述控制器和自适应律进行调整，使得倒立摆系统趋于最优状态。

5.如权利要求1所述的一种考虑状态约束和控制增益的倒立摆系统控制方法，其特征在于，所述特定增益抑制不等式具体为：

其中，t∈[0,t_w),v_j(t),j＝1,2,...,n是一个光滑的函数，t_w为大于零的时间值，v_j即所述的自适应律函数，Z(t)是一个光滑的函数,即确定好的BLF函数，由于需要对其进行微分，故需要所述BLF函数为光滑函数；LZ(t)为确定好的BLF函数的微分形式，其中，ρ,χ表示未知正常数，b_j是未知正变量。

6.如权利要求1所述的一种考虑状态约束和控制增益的倒立摆系统控制方法，其特征在于，所述状态约束具体包括：倒立摆系统的每一个输入状态、倒立摆系统的输出以及倒立摆系统所跟的跟踪信号的相关约束。

7.如权利要求1所述的一种考虑状态约束和控制增益的倒立摆系统控制方法，其特征在于，所述倒立摆系统非线性模型，具体表示如下：

8.一种考虑全状态约束和未知控制增益的倒立摆系统控制系统，其特征在于，包括：

9.一种控制器，包括存储器、处理器及存储在存储器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1-7任一项所述的一种考虑全状态约束和未知控制增益的倒立摆系统控制方法。

10.一种非暂态计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1-7任一项所述的一种考虑全状态约束和未知控制增益的倒立摆系统控制方法。