CN110134011B - 一种倒立摆自适应迭代学习反演控制方法 - Google Patents

一种倒立摆自适应迭代学习反演控制方法 Download PDF

Info

Publication number
CN110134011B
CN110134011B CN201910328490.0A CN201910328490A CN110134011B CN 110134011 B CN110134011 B CN 110134011B CN 201910328490 A CN201910328490 A CN 201910328490A CN 110134011 B CN110134011 B CN 110134011B
Authority
CN
China
Prior art keywords
function
formula
inverted pendulum
follows
unknown
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910328490.0A
Other languages
English (en)
Other versions
CN110134011A (zh
Inventor
陈强
施卉辉
陈凯杰
孙明轩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Technology ZJUT
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN201910328490.0A priority Critical patent/CN110134011B/zh
Publication of CN110134011A publication Critical patent/CN110134011A/zh
Application granted granted Critical
Publication of CN110134011B publication Critical patent/CN110134011B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance

Abstract

一种倒立摆自适应迭代学习反演控制方法,针对含有未知输入饱和的倒立摆系统,利用神经网络和反演控制方法,结合自适应迭代学习控制,设计一种自适应迭代学习反演控制器。积分李雅普诺夫函数的构建解决了由于未知增益函数求导引起的控制问题。基于中值定理,采用双曲正切函数逼近输入饱和项。然后,采用径向基神经网络逼近和补偿系统不确定未知项,并采用两个组合自适应律更新神经网络的权值和估计误差的界。本发明在系统存在输入饱和的情况下,提供了一种能补偿系统未知不确定性,解决由于未知增益函数求导引起的控制问题,实现系统跟踪误差在有限迭代次数内二范数收敛到零附近的控制方法。

Description

一种倒立摆自适应迭代学习反演控制方法
技术领域
本发明涉及一种倒立摆自适应迭代学习反演控制方法,特别是带有未知输入饱和的倒立摆控制方法。
背景技术
倒立摆系统的控制问题就是控制摆杆快速达到一个平衡位置,使其没有明显的振荡和过大的角度和速度。倒立摆系统具有自然不稳定性,强耦合,强非线性,存在外界干扰等特点,对倒立摆系统的研究可以有效反映非线性控制的典型问题,如非线性问题,鲁棒性问题等。因此研究存在输入饱和的情况下倒立摆系统的控制问题具有十分重要的意义。
迭代学习控制方法是一种具有强学习能力的控制方法,尤其是在解决重复作业的控制问题上展现了它的优越性。基于李雅普诺夫函数的自适应迭代学习控制充分利用上一次迭代后的系统信息,对系统的不确定参数和控制器中未知控制增益进行自适应迭代学习,不断提高系统的跟踪性能。针对系统参数或是结构存在非线性不确定性的情况下,自适应迭代学习控制能有效保证系统的稳定性,在有限时间区间内达到很高的跟踪精度。当系统模型不确定甚至是未知时,自适应迭代学习控制方法也可以达到完美的跟踪效果。
神经网络可以在任意精度内逼近一个未知函数,补偿不确定项,能有效地处理系统模型不确定性,参数不确定性等问题,因此被广泛用于解决系统动态模型中存在的不确定性。而径向基神经网络结构具有三层前馈网络,结构简单,收敛快速,不仅优化了算法的学习速度又避免了局部极小问题。
在研究非线性系统控制问题时,大多数的增益函数都是未知的,在李雅普诺夫稳定性分析中会有可能会出现由于对系统未知增益函数的求导而引起的奇异值问题等控制问题,因此构造一个简单有效的李雅普诺夫函数十分重要。因此,研究在存在输入饱和情况下,利用神经网络和反演控制方法,结合自适应迭代学习,实现倒立摆系统的高精度跟踪控制具有很高的理论和实际意义。
发明内容
为了克服现有倒立摆存在的未知输入饱和问题,本发明提供一种倒立摆自适应迭代学习反演控制方法,在系统存在输入饱和的情况下,估计和补偿系统未知不确定性,解决由未知增益函数求导引起的控制问题,实现在有限迭代次数内系统跟踪误差二范数收敛到零附近的控制方法。
为了解决上述技术问题提出的技术方案如下:
一种倒立摆自适应迭代学习反演控制方法,所述控制方法包括以下步骤:
步骤1,建立倒立摆的动态模型,初始化系统状态、采样时间以及控制参数,过程如下:
1.1倒立摆的动态模型表达形式为:
Figure BDA0002036963980000021
其中x1,k,x2,k分别是角度位置和角速度,k是迭代次数;
Figure BDA0002036963980000022
分别是角度位置和角速度的一阶导数;g是重力加速度;mc,m是分别是小车和倒立摆的质量;l是倒立摆长度的一半;uk表示控制输入,sat(uk)表示受饱和限制的控制输入,其表达形式为:
Figure BDA0002036963980000023
其中um是uk的最大值,|uk|表示uk的绝对值,sgn(uk)表示uk的符号函数;
1.2定义未知函数f(xk)和b(xk),将式(1)写成以下形式:
Figure BDA0002036963980000024
其中
Figure BDA0002036963980000031
是未知的光滑函数;xk=[x1,k,x2,k]T;从b(xk)的表达式中得到b(xk)>0;
步骤2,逼近和估计输入饱和项,其过程如下:
采用以下的双曲正切函数逼近输入饱和函数:
Figure BDA0002036963980000032
其中tanh(·)表示双曲正切函数;
由此得
sat(uk)=g(uk)+d(uk) (5)
其中d(uk)是一个有界函数,满足
|d(uk)|=|sat(uk)-g(uk)|≤um(1-tanh(1))=D (6)
其中D是一个未知正数,|d(uk)|表示d(uk)的绝对值;
通过微分中值定理计算,得出
Figure BDA0002036963980000033
其中uξ=ξuk+(1-ξ)u0,u0∈[0,uk];0<ξ<1是一个常数;
Figure BDA0002036963980000034
是uk=uξ时对g(uk)的偏导,
Figure BDA0002036963980000035
取u0=0,g(u0)=0;则公式(7)写为:
Figure BDA0002036963980000036
将公式(8)代入到公式(5)中,得
Figure BDA0002036963980000037
步骤3,计算系统跟踪误差,其过程如下:
定义系统跟踪误差z1,k如下:
z1,k=x1,k-xd (10)
其中xd是给定的光滑有界的参考轨迹;
对公式(10)求导得到:
Figure BDA0002036963980000041
其中
Figure BDA0002036963980000042
是系统跟踪误差的一阶导数,
Figure BDA0002036963980000043
是参考轨迹的一阶导数;
步骤4,定义误差变量,设计虚拟控制器,其过程如下:
4.1定义误差变量z2,k为:
z2,k=x2,k1,k (12)
其中,α1,k是设计控制器过程中的虚拟控制器;系统初始条件为:z1,k(0)=0,z2,k(0)=0;
对式(12)进行求导,得到:
Figure BDA0002036963980000044
其中
Figure BDA0002036963980000045
是误差变量的一阶导数,
Figure BDA0002036963980000046
是设计控制器过程中虚拟控制器的一阶导数;
将式(3),式(9)代入式(11)和式(13)中,得到:
Figure BDA0002036963980000047
由此,计算:
Figure BDA0002036963980000048
Figure BDA0002036963980000049
其中
Figure BDA00020369639800000410
由于0<g≤1,则必定存在一个正的常数gN使得
Figure BDA00020369639800000411
成立;然后,得出
Figure BDA00020369639800000412
是有界的,并且
Figure BDA0002036963980000051
其中
Figure BDA0002036963980000052
表示
Figure BDA0002036963980000053
的绝对值,ρD是一个大于零的常数;
4.2为逼近函数
Figure BDA0002036963980000054
设计以下神经网络:
定义W*为神经网络理想权重矩阵,则
Figure BDA0002036963980000055
写成以下形式:
Figure BDA0002036963980000056
其中W*T=W*
Figure BDA0002036963980000057
是神经网络的输入向量,
Figure BDA0002036963980000058
是参考轨迹的二次导数,εk是神经网络的逼近误差且满足|εk|≤σN,|εk|表示εk的绝对值,σN是|εk|的上界,是一个正的常数,Φ(Xk)=[φ1(Xk),φ2(Xk),…,φm(Xk)]T是神经网络的基函数,m为神经元的个数,φi(Xk)的形式如下所示:
Figure BDA0002036963980000059
其中ιi和υi分别是高斯函数的中心和宽度,i=1,…,m,其中exp(·)是指数函数;
4.3设计神经网络权值和估计误差更新律:
Figure BDA00020369639800000510
Figure BDA00020369639800000511
其中γ1,γ2,β1,β2都是合适的参数,
Figure BDA00020369639800000512
分别表示在第k和k-1次迭代时对W*和σN的估计,
Figure BDA00020369639800000513
Figure BDA00020369639800000514
Figure BDA00020369639800000515
的一阶导数,δ是一个正的常数;给定
Figure BDA00020369639800000516
4.4设计虚拟控制器和实际控制器,如下:
Figure BDA00020369639800000517
Figure BDA0002036963980000061
其中c1,c2是正常数,
Figure BDA0002036963980000062
4.5把式(18),式(22)和式(23)代入到式(15)和式(16)中,得:
Figure BDA0002036963980000063
Figure BDA0002036963980000064
其中
Figure BDA0002036963980000065
步骤5,构造李雅普诺夫函数Vk(t)与类李雅普诺夫函数Ek(t),分析系统性能,其过程如下所示:
Figure BDA0002036963980000066
Figure BDA0002036963980000067
其中
Figure BDA0002036963980000068
对Vk(t)求导,并将式(24),(25)代入,得到:
Figure BDA0002036963980000069
其中
Figure BDA00020369639800000610
Figure BDA00020369639800000611
分别是
Figure BDA00020369639800000612
Figure BDA00020369639800000613
的一阶导数;
将(17)代入(28),得到:
Figure BDA0002036963980000071
其中|z2,k|表示z2,k的绝对值;
然后,
Figure BDA0002036963980000072
写为:
Figure BDA0002036963980000073
其中
Figure BDA0002036963980000074
将(20),(21)代入(30),得:
Figure BDA0002036963980000075
采用双曲正切函数的以下性质:
0≤|z2,k|-z2,ktanh(z2,k/δ)≤0.2785δ; (32)
将式(32)代入(31),得到:
Figure BDA0002036963980000081
对式(27)求导,得到:
Figure BDA0002036963980000082
在初始迭代k=0时,
Figure BDA0002036963980000083
Figure BDA0002036963980000084
Figure BDA0002036963980000085
由此得到:
Figure BDA0002036963980000086
对式(35)两侧同时进行积分运算,得到:
Figure BDA0002036963980000087
可以看出
Figure BDA0002036963980000088
在[0,T]中是有界的;在初始条件的选择下,V0(0)也是有界的;得出E0(t)是有界的,即
Figure BDA0002036963980000089
Ek(t)在第k次迭代的差分形式为:
Figure BDA0002036963980000091
其中Vk-1(t)和Ek-1(t)分别是第k-1次的李雅普诺夫函数和类李雅普诺夫函数;
将式(33)代入(38)中,得到
Figure BDA0002036963980000092
结合
Figure BDA0002036963980000093
得到:
Figure BDA0002036963980000094
其中T表示倒立摆系统的迭代周期;cm=min{c1,c2}表示取c1,c2的最小值;
Figure BDA0002036963980000095
表示一个正的常数;zr,k,r=1,2表示误差变量;
对ΔEk(T)有限迭代次数的累加得到:
Figure BDA0002036963980000101
其中Ek(T)表示第k次迭代,t=T时的类李雅普诺夫函数;E0(T)表示k-1,t=T时的类李雅普诺夫函数;
将(40)代入到(41),写成:
Figure BDA0002036963980000102
从(42)得出:
Figure BDA0002036963980000103
其中
Figure BDA0002036963980000104
表示zr,k,r=1,2的二范数形式;
则判定对于任意给定常数
Figure BDA0002036963980000106
都存在一个正的有限迭代次数k0,对于k>k0,使得
Figure BDA0002036963980000105
成立;也就是说,系统跟踪误差z1,k在二范数的意义上在有限迭代次数内收敛到零附近的领域内。
本发明基于含有未知输入饱和问题的倒立摆系统模型,结合反演控制算法,神经网络,自适应迭代学习控制方法,设计了倒立摆自适应迭代学习反演控制方法,解决了系统中输入饱和问题,解决由未知增益函数求导引起的控制问题,实现在有限迭代次数内系统跟踪误差二范数收敛到零附近的。
本发明的技术构思为:针对含有未知输入饱和的倒立摆,设计自适应迭代学习控制,基于微分中值定理,通过光滑的双曲正切函数拟合饱和函数,然后,利用神经网络逼近系统中的不确定项,设计一种倒立摆自适应迭代学习反演控制方法。本发明提供了一种能补偿系统未知不确定项,解决由未知增益函数求导引起的控制问题,实现在有限迭代次数内系统跟踪误差二范数收敛到零附近的控制方法。
本发明的有益效果为:补偿系统未知不确定项,解决了由未知增益函数求导引起的控制问题,实现在有限迭代次数内系统跟踪误差二范数收敛到零附近。
附图说明
图1为本发明的跟踪效果图;
图2为本发明的跟踪误差图;
图3为本发明的控制输入图;
图4为本发明的系统性能指标图;
图5为本发明的控制流程示意图。
具体实施方式
下面结合附图对本发明做进一步说明。
参照图1-图5,一种倒立摆自适应迭代学习反演控制方法,其特征在于:所述控制方法包括以下步骤:
步骤1,建立倒立摆的动态模型,初始化系统状态、采样时间以及控制参数,过程如下:
1.1倒立摆的动态模型表达形式为:
Figure BDA0002036963980000111
其中x1,k,x2,k分别是角度位置和角速度,k是迭代次数;
Figure BDA0002036963980000112
分别是角度位置和角速度的一阶导数;g是重力加速度;mc,m是分别是小车和倒立摆的质量;l是倒立摆长度的一半;uk表示控制输入,sat(uk)表示受饱和限制的控制输入,其表达形式为:
Figure BDA0002036963980000113
其中um是uk的最大值,|uk|表示uk的绝对值,sgn(uk)表示uk的符号函数;
1.2定义未知函数f(xk)和b(xk),将式(1)写成以下形式:
Figure BDA0002036963980000114
其中
Figure BDA0002036963980000121
是未知的光滑函数;xk=[x1,k,x2,k]T;从b(xk)的表达式中得到b(xk)>0;
步骤2,逼近和估计输入饱和项,其过程如下:
采用以下的双曲正切函数逼近输入饱和函数:
Figure BDA0002036963980000122
其中tanh(·)表示双曲正切函数;
由此得
sat(uk)=g(uk)+d(uk) (5)
其中d(uk)是一个有界函数,满足
|d(uk)|=|sat(uk)-g(uk)|≤um(1-tanh(1))=D (6)
其中D是一个未知正数,|d(uk)|表示d(uk)的绝对值;
通过微分中值定理计算,得出
Figure BDA0002036963980000123
其中uξ=ξuk+(1-ξ)u0,u0∈[0,uk];0<ξ<1是一个常数;
Figure BDA0002036963980000124
是uk=uξ时对g(uk)的偏导,
Figure BDA0002036963980000125
取u0=0,g(u0)=0;则公式(7)写为:
Figure BDA0002036963980000126
将公式(8)代入到公式(5)中,得
Figure BDA0002036963980000127
步骤3,计算系统跟踪误差,其过程如下:
定义系统跟踪误差z1,k如下:
z1,k=x1,k-xd (10)
其中xd是给定的光滑有界的参考轨迹;
对公式(10)求导得到:
Figure BDA0002036963980000131
其中
Figure BDA0002036963980000132
是系统跟踪误差的一阶导数,
Figure BDA0002036963980000133
是参考轨迹的一阶导数;
步骤4,定义误差变量,设计虚拟控制器,其过程如下:
4.1定义误差变量z2,k为:
z2,k=x2,k1,k (12)
其中,α1,k是设计控制器过程中的虚拟控制器;系统初始条件为:z1,k(0)=0,z2,k(0)=0;
对式(12)进行求导,得到:
Figure BDA0002036963980000134
其中
Figure BDA0002036963980000135
是误差变量的一阶导数,
Figure BDA0002036963980000136
是设计控制器过程中虚拟控制器的一阶导数;
将式(3),式(9)代入式(11)和式(13)中,得到:
Figure BDA0002036963980000137
由此,计算:
Figure BDA0002036963980000138
Figure BDA0002036963980000139
其中
Figure BDA00020369639800001310
由于0<g≤1,则必定存在一个正的常数gN使得
Figure BDA00020369639800001311
成立;然后,得出
Figure BDA00020369639800001312
是有界的,并且
Figure BDA0002036963980000141
其中
Figure BDA0002036963980000142
表示
Figure BDA0002036963980000143
的绝对值,ρD是一个大于零的常数;
4.2为逼近函数
Figure BDA0002036963980000144
设计以下神经网络:
定义W*为神经网络理想权重矩阵,则
Figure BDA0002036963980000145
写成以下形式:
Figure BDA0002036963980000146
其中W*T=W*
Figure BDA0002036963980000147
是神经网络的输入向量,
Figure BDA0002036963980000148
是参考轨迹的二次导数,εk是神经网络的逼近误差且满足|εk|≤σN,|εk|表示εk的绝对值,σN是|εk|的上界,是一个正的常数,Φ(Xk)=[φ1(Xk),φ2(Xk),…,φm(Xk)]T是神经网络的基函数,m为神经元的个数,φi(Xk)的形式如下所示:
Figure BDA0002036963980000149
其中ιi和υi分别是高斯函数的中心和宽度,i=1,…,m,其中exp(·)是指数函数;
4.3设计神经网络权值和估计误差更新律:
Figure BDA00020369639800001410
Figure BDA00020369639800001411
其中γ1,γ2,β1,β2都是合适的参数,
Figure BDA00020369639800001412
分别表示在第k和k-1次迭代时对W*和σN的估计,
Figure BDA00020369639800001413
Figure BDA00020369639800001414
Figure BDA00020369639800001415
的一阶导数,δ是一个正的常数;给定
Figure BDA00020369639800001416
4.4设计虚拟控制器和实际控制器,如下所示:
Figure BDA00020369639800001417
Figure BDA0002036963980000151
其中c1,c2是正常数,
Figure BDA0002036963980000152
4.5把式(18),式(22)和式(23)代入到式(15)和式(16)中,得:
Figure BDA0002036963980000153
Figure BDA0002036963980000154
其中
Figure BDA0002036963980000155
步骤5,构造李雅普诺夫函数Vk(t)与类李雅普诺夫函数Ek(t),分析系统性能,其过程如下所示:
Figure BDA0002036963980000156
Figure BDA0002036963980000157
其中
Figure BDA0002036963980000158
对Vk(t)求导,并将式(24),(25)代入,得到:
Figure BDA0002036963980000159
其中
Figure BDA00020369639800001510
Figure BDA00020369639800001511
分别是
Figure BDA00020369639800001512
Figure BDA00020369639800001513
的一阶导数;
将(17)代入(28),得到:
Figure BDA0002036963980000161
其中|z2,k|表示z2,k的绝对值;
然后,
Figure BDA0002036963980000162
写为:
Figure BDA0002036963980000163
其中
Figure BDA0002036963980000164
将(20),(21)代入(30),得:
Figure BDA0002036963980000165
采用双曲正切函数的以下性质:
0≤|z2,k|-z2,ktanh(z2,k/δ)≤0.2785δ; (32)
将式(32)代入(31),得到:
Figure BDA0002036963980000171
对式(27)求导,得到:
Figure BDA0002036963980000172
在初始迭代k=0时,
Figure BDA0002036963980000173
Figure BDA0002036963980000174
Figure BDA0002036963980000175
由此得到:
Figure BDA0002036963980000176
对式(35)两侧同时进行积分运算,得到:
Figure BDA0002036963980000177
可以看出
Figure BDA0002036963980000178
在[0,T]中是有界的;在初始条件的选择下,V0(0)也是有界的;得出E0(t)是有界的,即
Figure BDA0002036963980000179
Ek(t)在第k次迭代的差分形式为:
Figure BDA0002036963980000181
其中Vk-1(t)和Ek-1(t)分别是第k-1次的李雅普诺夫函数和类李雅普诺夫函数;
将式(33)代入(38)中,得到
Figure BDA0002036963980000182
结合
Figure BDA0002036963980000183
得到:
Figure BDA0002036963980000184
其中T表示倒立摆系统的迭代周期;cm=min{c1,c2}表示取c1,c2的最小值;
Figure BDA0002036963980000185
表示一个正的常数;zr,k,r=1,2表示误差变量;
对ΔEk(T)有限迭代次数的累加得到:
Figure BDA0002036963980000191
其中Ek(T)表示第k次迭代,t=T时的类李雅普诺夫函数;E0(T)表示k-1,t=T时的类李雅普诺夫函数;
将(40)代入到(41),写成:
Figure BDA0002036963980000192
从(42)得出:
Figure BDA0002036963980000193
其中
Figure BDA0002036963980000194
表示zr,k,r=1,2的二范数形式;
则判定对于任意给定常数
Figure BDA0002036963980000195
都存在一个正的有限迭代次数k0,对于k>k0,使得
Figure BDA0002036963980000196
成立;也就是说,系统跟踪误差z1,k在二范数的意义上在有限迭代次数内收敛到零附近的领域内。
为了验证所提方法的有效性,本方法针对倒立摆模型进行仿真验证。倒立摆系统参数设置如下:mc=1kg,m=0.1kg,l=0.5m,g=9.8m/s2,um=5.5N·m;系统初始化参数设置如下:神经网络的神经元个数如下:N=150,对高斯函数的宽度设定如下:υj=3,j=1,…,N,其中心ιj,j=1,…,N均匀分布在[-0.5,0.5]×[-0.5,0.5]×[-0.5,0.5]×[-0.5,0.5]×[-0.5,0.5]中,神经网络权值以及误差估计的更新律参数如下:γ1=0.7,γ2=0.8,β1=2,β2=2,虚拟控制器和实际控制器的系数如下:c1=6,c2=25,δ=0.5,系统初始值给定:x1,k(0)=0.2,x2,k(0)=0,参考轨迹方程为:xd(t)=0.2sin(0.4πt),修正后的参考轨迹方程如下:
Figure BDA0002036963980000201
其中设定时间Δ=0.4s,周期时间T=6s,xr(t)=A5t5+A4t4+A3t3+A2t2+A1t+A0
A0=x1,k(0)
Figure BDA0002036963980000202
Figure BDA0002036963980000203
Figure BDA0002036963980000204
Figure BDA0002036963980000205
Figure BDA0002036963980000206
其中xd(Δ),
Figure BDA0002036963980000207
是在设定时间上的期望轨迹的值和它的一阶导数和二阶导数;x1,k(0),
Figure BDA0002036963980000208
是在初始时刻倒立摆系统的角度位置的值和它的一阶导数和二阶导数;
图1和图2表示的分别是系统角度位置跟踪效果和对应的跟踪误差,可以看出系统的角度位置x1,k可以很好地跟踪参考轨迹xd,并且保证跟踪误差收敛在一个邻域内;图3表示了系统的控制输入;图4表示系统的性能指标。
因此,本发明能提供一种可以补偿系统未知不确定项,并解决由未知增益函数求导引起的控制问题的自适应迭代学习控制方法,实现了在有限迭代次数内系统跟踪误差二范数收敛到零附近。
以上阐述的是本发明给出的一个实施例表现出的优良优化效果,显然本发明不只是限于上述实施例,在不偏离本发明基本精神及不超出本发明实质内容所涉及范围的前提下对其可作种种变形加以实施。

Claims (1)

1.一种倒立摆自适应迭代学习反演控制方法,其特征在于,所述控制方法包括以下步骤:
步骤1,建立倒立摆的动态模型,初始化系统状态、采样时间以及控制参数,过程如下:
1.1倒立摆的动态模型表达形式为:
Figure FDA0003309904680000011
其中x1,k,x2,k分别是角度位置和角速度,k是迭代次数;
Figure FDA0003309904680000012
分别是角度位置和角速度的一阶导数;g是重力加速度;mc,m是分别是小车和倒立摆的质量;l是倒立摆长度的一半;uk表示控制输入,sat(uk)表示受饱和限制的控制输入,其表达形式为:
Figure FDA0003309904680000013
其中um是uk的最大值,|uk|表示uk的绝对值,sgn(uk)表示uk的符号函数;
1.2定义未知函数f(xk)和b(xk),将式(1)写成以下形式:
Figure FDA0003309904680000014
其中
Figure FDA0003309904680000015
是未知的光滑函数;xk=[x1,k,x2,k]T;从b(xk)的表达式中得到b(xk)>0;
步骤2,逼近和估计输入饱和项,其过程如下:
采用以下的双曲正切函数逼近输入饱和函数:
Figure FDA0003309904680000021
其中tanh(·)表示双曲正切函数,e(·)表示以自然常数e为底的指数函数;
由此得
sat(uk)=g(uk)+d(uk) (5)
其中d(uk)是一个有界函数,满足
|d(uk)|=|sat(uk)-g(uk)|≤um(1-tanh(1))=D (6)
其中D是一个未知正数,|d(uk)|表示d(uk)的绝对值;
通过微分中值定理计算,得出
Figure FDA0003309904680000022
其中uξ=ξuk+(1-ξ)u0,u0∈[0,uk];0<ξ<1是一个常数;
Figure FDA0003309904680000023
是uk=uξ时对g(uk)的偏导,
Figure FDA0003309904680000024
取u0=0,g(u0)=0;则公式(7)写为:
Figure FDA0003309904680000025
将公式(8)代入到公式(5)中,得
Figure FDA0003309904680000026
步骤3,计算系统跟踪误差,其过程如下:
定义系统跟踪误差z1,k如下:
z1,k=x1,k-xd (10)
其中xd是给定的光滑有界的参考轨迹;
对公式(10)求导得到:
Figure FDA0003309904680000027
其中
Figure FDA0003309904680000028
是系统跟踪误差的一阶导数,
Figure FDA0003309904680000029
是参考轨迹的一阶导数;
步骤4,定义误差变量,设计虚拟控制器,其过程如下:
4.1定义误差变量z2,k为:
z2,k=x2,k1,k (12)
其中,α1,k是设计控制器过程中的虚拟控制器;系统初始条件为:z1,k(0)=0,z2,k(0)=0;
对式(12)进行求导,得到:
Figure FDA0003309904680000031
其中
Figure FDA0003309904680000032
是误差变量的一阶导数,
Figure FDA0003309904680000033
是设计控制器过程中虚拟控制器的一阶导数;
将式(3),式(9)代入式(11)和式(13)中,得到:
Figure FDA0003309904680000034
由此,计算:
Figure FDA0003309904680000035
Figure FDA0003309904680000036
其中
Figure FDA0003309904680000037
由于0<g≤1,则必定存在一个正的常数gN使得
Figure FDA0003309904680000038
成立;然后,得出
Figure FDA0003309904680000039
是有界的,并且
Figure FDA00033099046800000310
其中
Figure FDA00033099046800000311
表示
Figure FDA00033099046800000312
的绝对值,ρD是一个大于零的常数;
4.2为逼近函数
Figure FDA00033099046800000313
设计以下神经网络:
定义W*为神经网络理想权重矩阵,则
Figure FDA00033099046800000314
写成以下形式:
Figure FDA0003309904680000041
其中W*T=W*
Figure FDA0003309904680000042
是神经网络的输入向量,
Figure FDA0003309904680000043
是参考轨迹的二次导数,εk是神经网络的逼近误差且满足|εk|≤σN,|εk|表示εk的绝对值,σN是|εk|的上界,是一个正的常数,Φ(Xk)=[φ1(Xk),φ2(Xk),…,φm(Xk)]T是神经网络的基函数,m为神经元的个数,φi(Xk)的形式如下所示:
Figure FDA0003309904680000044
其中ιi和υi分别是高斯函数的中心和宽度,i=1,…,m,其中exp(·)是指数函数;
4.3设计神经网络权值和估计误差更新律:
Figure FDA0003309904680000045
Figure FDA0003309904680000046
其中γ1,γ2,β1,β2都是合适的参数,
Figure FDA0003309904680000047
分别表示在第k和k-1次迭代时对W*和σN的估计,
Figure FDA0003309904680000048
Figure FDA0003309904680000049
Figure FDA00033099046800000410
的一阶导数,δ是一个正的常数;给定
Figure FDA00033099046800000411
4.4设计虚拟控制器和实际控制器,如下所示:
Figure FDA00033099046800000412
Figure FDA00033099046800000413
其中c1,c2是正常数,
Figure FDA00033099046800000414
4.5把式(18),式(22)和式(23)代入到式(15)和式(16)中,得:
Figure FDA00033099046800000415
Figure FDA0003309904680000051
其中
Figure FDA0003309904680000052
步骤5,构造李雅普诺夫函数Vk(t)与类李雅普诺夫函数Ek(t),分析系统性能,其过程如下所示:
Figure FDA0003309904680000053
Figure FDA0003309904680000054
其中
Figure FDA0003309904680000055
对Vk(t)求导,并将式(24),(25)代入,得到:
Figure FDA0003309904680000056
其中
Figure FDA0003309904680000057
Figure FDA0003309904680000058
分别是
Figure FDA0003309904680000059
Figure FDA00033099046800000510
的一阶导数;
将(17)代入(28),得到:
Figure FDA00033099046800000511
其中|z2,k|表示z2,k的绝对值;
然后,
Figure FDA0003309904680000061
写为:
Figure FDA0003309904680000062
其中
Figure FDA0003309904680000063
将(20),(21)代入(30),得:
Figure FDA0003309904680000064
采用双曲正切函数的以下性质:
0≤|z2,k|-z2,ktanh(z2,k/δ)≤0.2785δ; (32)
将式(32)代入(31),得到:
Figure FDA0003309904680000065
对式(27)求导,得到:
Figure FDA0003309904680000066
在初始迭代k=0时,
Figure FDA0003309904680000071
Figure FDA0003309904680000072
Figure FDA0003309904680000073
由此得到:
Figure FDA0003309904680000074
对式(35)两侧同时进行积分运算,得到:
Figure FDA0003309904680000075
可以看出
Figure FDA0003309904680000076
在[0,T]中是有界的;在初始条件的选择下,V0(0)也是有界的;得出E0(t)是有界的,即
Figure FDA0003309904680000077
Ek(t)在第k次迭代的差分形式为:
Figure FDA0003309904680000078
其中Vk-1(t)和Ek-1(t)分别是第k-1次的李雅普诺夫函数和类李雅普诺夫函数;
将式(33)代入(38)中,得到
Figure FDA0003309904680000081
结合
Figure FDA0003309904680000082
得到:
Figure FDA0003309904680000083
其中T表示倒立摆系统的迭代周期;cm=min{c1,c2}表示取c1,c2的最小值;
Figure FDA0003309904680000084
表示一个正的常数;zr,k,r=1,2表示系统跟踪误差和误差变量的总称;
对ΔEk(T)有限迭代次数的累加得到:
Figure FDA0003309904680000085
其中Ek(T)表示第k次迭代,t=T时的类李雅普诺夫函数;E0(T)表示k=0,t=T时的类李雅普诺夫函数;
将(40)代入到(41),写成:
Figure FDA0003309904680000091
从(42)得出:
Figure FDA0003309904680000092
其中
Figure FDA0003309904680000093
表示zr,k,r=1,2的二范数形式;
则判定对于任意给定常数
Figure FDA0003309904680000094
都存在一个正的有限迭代次数k0,对于k>k0,使得
Figure FDA0003309904680000095
成立;也就是说,系统跟踪误差z1,k在二范数的意义上在有限迭代次数内收敛到零附近的领域内。
CN201910328490.0A 2019-04-23 2019-04-23 一种倒立摆自适应迭代学习反演控制方法 Active CN110134011B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910328490.0A CN110134011B (zh) 2019-04-23 2019-04-23 一种倒立摆自适应迭代学习反演控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910328490.0A CN110134011B (zh) 2019-04-23 2019-04-23 一种倒立摆自适应迭代学习反演控制方法

Publications (2)

Publication Number Publication Date
CN110134011A CN110134011A (zh) 2019-08-16
CN110134011B true CN110134011B (zh) 2022-01-11

Family

ID=67570686

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910328490.0A Active CN110134011B (zh) 2019-04-23 2019-04-23 一种倒立摆自适应迭代学习反演控制方法

Country Status (1)

Country Link
CN (1) CN110134011B (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110908280B (zh) * 2019-10-30 2023-01-03 宁波大学 一种小车-二级倒立摆系统优化控制方法
CN110716434A (zh) * 2019-11-13 2020-01-21 合肥工业大学 带有自适应摩擦补偿的倒立摆系统神经网络跟踪控制方法
CN110848662B (zh) * 2019-12-13 2021-03-19 浙江省能源集团有限公司 一种基于参数自适应提高暂态性能的燃煤机组汽包锅炉水位控制方法
CN111061216B (zh) * 2019-12-28 2022-11-15 哈尔滨工业大学 基于二元样条尺度函数的贴片机运动系统智能控制方法
CN111221250B (zh) * 2020-01-14 2022-06-03 三峡大学 一种具有参数不确定性和多个外部扰动的非线性系统及其设计方法
CN111474922B (zh) * 2020-05-08 2021-07-16 哈尔滨工业大学 一种连续非线性系统的控制器构建方法
CN111580392B (zh) * 2020-07-14 2021-06-15 江南大学 一种串联倒立摆的有限频率范围鲁棒迭代学习控制方法
CN111736471B (zh) * 2020-07-14 2021-06-15 江南大学 一种旋转倒立摆的迭代反馈整定控制及其鲁棒优化方法
CN111872937B (zh) * 2020-07-23 2022-04-19 西华大学 一种任务空间中不确定机械臂的控制方法
CN113050493B (zh) * 2021-03-19 2022-03-04 大连理工大学 一种网络化环境下的小车倒立摆系统输出反馈控制方法
CN113359434A (zh) * 2021-04-15 2021-09-07 山东师范大学 针对电动平衡车的有限时间跟踪控制方法及系统
CN113219832A (zh) * 2021-05-10 2021-08-06 西安理工大学 一种自适应迭代学习非一致目标跟踪控制器设计方法
CN114460844B (zh) * 2022-01-12 2023-06-23 山东科技大学 一种自适应神经网络边界减振控制方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103324087A (zh) * 2013-06-19 2013-09-25 河海大学常州校区 基于神经网络的微陀螺仪的自适应反演控制系统及方法
CN104267596A (zh) * 2014-08-15 2015-01-07 浙江工业大学 一种小车倒立摆系统的有限时间解耦控制方法
CN104834218A (zh) * 2015-04-29 2015-08-12 南京邮电大学 一种平行单级双倒立摆的动态面控制器结构及设计方法
CN105573124A (zh) * 2016-03-16 2016-05-11 河南理工大学 不确定性平面倒立摆系统的自适应滑模控制器生成方法
CN105843041A (zh) * 2016-04-08 2016-08-10 浙江工业大学 一种带有未知滞环的小车倒立摆系统积分滑模控制方法
CN106094530A (zh) * 2016-07-22 2016-11-09 吉林大学 倒立摆的非线性控制器设计方法
CN108614419A (zh) * 2018-03-28 2018-10-02 贵州大学 一种弧形微机电系统的自适应神经网络控制方法
WO2019024377A1 (zh) * 2017-08-03 2019-02-07 淮阴工学院 分数阶弧形微机电系统的自适应同步控制方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8489528B2 (en) * 2009-07-28 2013-07-16 Georgia Tech Research Corporation Systems and methods for training neural networks based on concurrent use of current and recorded data

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103324087A (zh) * 2013-06-19 2013-09-25 河海大学常州校区 基于神经网络的微陀螺仪的自适应反演控制系统及方法
CN104267596A (zh) * 2014-08-15 2015-01-07 浙江工业大学 一种小车倒立摆系统的有限时间解耦控制方法
CN104834218A (zh) * 2015-04-29 2015-08-12 南京邮电大学 一种平行单级双倒立摆的动态面控制器结构及设计方法
CN105573124A (zh) * 2016-03-16 2016-05-11 河南理工大学 不确定性平面倒立摆系统的自适应滑模控制器生成方法
CN105843041A (zh) * 2016-04-08 2016-08-10 浙江工业大学 一种带有未知滞环的小车倒立摆系统积分滑模控制方法
CN106094530A (zh) * 2016-07-22 2016-11-09 吉林大学 倒立摆的非线性控制器设计方法
WO2019024377A1 (zh) * 2017-08-03 2019-02-07 淮阴工学院 分数阶弧形微机电系统的自适应同步控制方法
CN108614419A (zh) * 2018-03-28 2018-10-02 贵州大学 一种弧形微机电系统的自适应神经网络控制方法

Non-Patent Citations (10)

* Cited by examiner, † Cited by third party
Title
"Adaptive backstepping control design for stabilization of inverted pendulum";Varunendra Kumar Singh,等;《2014 Students Conference on Engineering and Systems》;20140821;1-8 *
"Adaptive NN Tracking Control of Double Inverted Pendulums with Input Saturation";Wenlian Yang,等;《Advances in Neural Networks》;20130706;147-154 *
"Neural-Network Decoupled Sliding-Mode Control for Inverted Pendulum System with Unknown Input Saturation";Tang Xiaoqing,等;《2015 2nd International Conference on Information Science and Control Engineering》;20150611;838-842 *
"基于Backstepping和MATLAB/Simulink的直线型一级倒立摆系统的控制器设计与实时控制研究";邓丽霞;《中国优秀硕士学位论文全文数据库 工程科技II辑》;20081115;C042-128 *
"基于Backstepping方法的RBF神经网络在倒立摆系统中的应用研究";李金万;《中国优秀硕士学位论文全文数据库 信息科技辑》;20120515;I140-33 *
"基于改进粒子群算法的仿人机器人步态多目标优化";陈强;《中国优秀硕士学位论文全文数据库 信息科技辑》;20111215;I140-163 *
"空间多级倒立摆非线性控制方法研究";张永立;《中国博士学位论文全文数据库 信息科技辑》;20120515;I140-9 *
"约束自适应模糊迭代学习控制";陈乐剑;《中国优秀硕士学位论文全文数据库 信息科技辑》;20160415;I140-301 *
"自适应模糊控制算法研究及其实现";石如冬;《中国优秀硕士学位论文全文数据库 信息科技辑》;20120715;I140-745 *
"非线性动力学系统的多目标优化控制设计";秦志昌;《万方学位论文全文数据库》;20180829;1-183 *

Also Published As

Publication number Publication date
CN110134011A (zh) 2019-08-16

Similar Documents

Publication Publication Date Title
CN110134011B (zh) 一种倒立摆自适应迭代学习反演控制方法
CN107662208B (zh) 一种基于神经网络的柔性关节机械臂有限时间自适应反步控制方法
Boukattaya et al. Adaptive nonsingular fast terminal sliding-mode control for the tracking problem of uncertain dynamical systems
Pi et al. Low-level autonomous control and tracking of quadrotor using reinforcement learning
CN110750050B (zh) 一种基于神经网络的机械臂系统预设性能控制方法
Shojaei Leader–follower formation control of underactuated autonomous marine surface vehicles with limited torque
CN106886149B (zh) 一种航天器鲁棒有限时间饱和姿态跟踪控制方法
Han et al. Recurrent fuzzy neural network backstepping control for the prescribed output tracking performance of nonlinear dynamic systems
Wang et al. Morphing aircraft control based on switched nonlinear systems and adaptive dynamic programming
CN110977988B (zh) 基于有限时间命令滤波的多关节机械臂阻抗控制方法
CN112987567B (zh) 非线性系统的固定时间自适应神经网络滑模控制方法
CN104950677A (zh) 基于反演滑模控制的机械臂系统饱和补偿控制方法
CN110877333A (zh) 一种柔性关节机械臂控制方法
CN110543184B (zh) 一种刚性飞行器的固定时间神经网络控制方法
CN104216284A (zh) 机械臂伺服系统的有限时间协同控制方法
CN107831655A (zh) 微陀螺仪的分数阶自适应反演模糊滑模控制方法
CN110471438B (zh) 一种刚性飞行器的固定时间自适应姿态跟踪控制方法
CN109634291B (zh) 一种基于改进型障碍李雅普诺夫函数的刚性飞行器姿态约束跟踪控制方法
CN109062240B (zh) 一种基于神经网络估计的刚性飞行器固定时间自适应姿态跟踪控制方法
CN113031446A (zh) 不确定时滞非线性系统非奇异性神经自适应跟踪控制方法
Huang et al. Modified Newton integration neural algorithm for dynamic complex-valued matrix pseudoinversion applied to mobile object localization
Wang et al. A noise-suppressing Newton-Raphson iteration algorithm for solving the time-varying Lyapunov equation and robotic tracking problems
CN110488854B (zh) 一种基于神经网络估计的刚性飞行器固定时间姿态跟踪控制方法
da Costa et al. Fast real-time SDRE controllers using neural networks
Wang et al. Neural network adaptive inverse model control method for quadrotor UAV

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant