CN111580392A - 一种串联倒立摆的有限频率范围鲁棒迭代学习控制方法 - Google Patents

一种串联倒立摆的有限频率范围鲁棒迭代学习控制方法 Download PDF

Info

Publication number
CN111580392A
CN111580392A CN202010674050.3A CN202010674050A CN111580392A CN 111580392 A CN111580392 A CN 111580392A CN 202010674050 A CN202010674050 A CN 202010674050A CN 111580392 A CN111580392 A CN 111580392A
Authority
CN
China
Prior art keywords
equation
inverted pendulum
matrix
robust
iterative learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010674050.3A
Other languages
English (en)
Other versions
CN111580392B (zh
Inventor
陶洪峰
魏强
周龙辉
刘巍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangnan University
Original Assignee
Jiangnan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangnan University filed Critical Jiangnan University
Priority to CN202010674050.3A priority Critical patent/CN111580392B/zh
Publication of CN111580392A publication Critical patent/CN111580392A/zh
Priority to PCT/CN2021/094741 priority patent/WO2022012155A1/zh
Application granted granted Critical
Publication of CN111580392B publication Critical patent/CN111580392B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明公开了一种串联倒立摆的有限频率范围鲁棒迭代学习控制方法,涉及迭代学习控制领域,方法包括:建立串联倒立摆的状态空间方程;对原串联倒立摆的状态空间方程进行转换;根据重复过程理论设计鲁棒迭代学习控制算法;分析有限频率范围内的鲁棒迭代学习控制算法的收敛性;求解鲁棒迭代学习控制算法的控制律增益。所提算法将保证系统频域稳定并且具有鲁棒控制性能,同时在外界干扰存在时确保输出误差在时域和频域范围内的收敛性。本申请不仅考虑了单个倒立摆子系统时间和运行维度的系统特性,而且能直接应用于由多个倒立摆子系统组成的串联倒立摆系统,具有较好的控制精度,对于控制理论的验证以及具有相似结构系统的研究具有良好的应用价值。

Description

一种串联倒立摆的有限频率范围鲁棒迭代学习控制方法
技术领域
本发明涉及迭代学习控制领域,尤其是一种串联倒立摆的有限频率范围鲁棒迭代学习控制方法。
背景技术
串联倒立摆是一个高阶次、强耦合、多变量的不稳定复杂系统,可以直观地反应非线性、稳定性和鲁棒性等控制问题,是对控制理论进行检验的一个良好装置。串联倒立摆是由若干个结构相同的倒立摆子系统串联而成,其中倒立摆子系统具有重要的工程应用背景。单级倒立摆的稳定控制在火箭飞行过程中的姿态控制中具有广泛应用。同时倒立摆与双足机器人的行走有相似性。日常生活中重心在上、支点在下的问题都与倒立摆有极大的相似性,故其稳定控制在实际中有广泛的应用,如海上钻井平台的稳定控制、卫星发射架的稳定控制、火箭姿态控制、飞机安全着陆、化工过程控制等。因此,由若干个倒立摆子系统组合而成的串联倒立摆具有很好的工程应用背景。
目前针对串联倒立摆的控制方法主要有:专家控制,模糊控制和神经网络控制等。专家控制的主体由知识库和推理机构组成,涉及到知识库的自动更新与规则自动生成,因此专家控制在实时性和信息的并行处理方面有很大的局限性。模糊控制具有较强的鲁棒性能和容错性能,但是由于其模糊的特性会导致系统的控制精度和动态品质的降低。神经网络控制具有较强的自适应能力,但是其必须要有已知的具体工程应用数据样本,同时还需要足够长的时间来进行在线或离线学习训练,因此其收敛速度缓慢。上述控制方法在系统的实时性和精确性上均存在较大局限,难以解决串联倒立摆的轨迹跟踪问题。
发明内容
本发明人针对上述问题及技术需求,提出了一种串联倒立摆的有限频率范围鲁棒迭代学习控制方法。基于提升技术将重复运行的多维串联倒立摆系统转换为等效系统,然后为了进一步表示有界扰动与系统输出误差之间的联系,设计鲁棒迭代学习控制律将被控系统转换为一类连续离散重复过程模型。基于重复过程理论,通过线性矩阵不等式表示鲁棒迭代学习控制算法。所提算法将保证系统频域稳定并且具有鲁棒控制性能,同时在外界干扰存在时确保输出误差在时域和频域范围内的收敛性。
本发明的技术方案如下:
一种串联倒立摆的有限频率范围鲁棒迭代学习控制方法,包括如下步骤:
第一步:建立串联倒立摆的状态空间方程;
Figure BDA0002583413430000021
其中,
Figure BDA0002583413430000022
Figure BDA0002583413430000023
Figure BDA0002583413430000024
Figure BDA0002583413430000025
式(17)中k表示迭代周期,p表示控制节点序号,t代表连续时间,串联倒立摆系统工作于t∈[0,T]的重复时间周期内;xk(p,t)∈Rn,uk(p,t)∈Rm和yk(p,t)∈Rl分别表示串联倒立摆系统第p个节点的状态、输入和输出信号;vk(p,t)∈Ri和wk(p,t)∈Rj分别表示串联倒立摆系统第p个节点的状态端外部有界扰动和输出端外部有界扰动信号,并且扰动信号可导;
Figure BDA0002583413430000031
Figure BDA0002583413430000032
Figure BDA0002583413430000033
分别表示适当维数的系统矩阵;m表示摆杆质量,l表示摆杆质心到转动轴心的距离,J表示摆杆的转动惯量,M表示小车质量,a表示弹簧劲度系数,b表示小车摩擦系数;串联倒立摆系统第p个节点的状态会受到前后节点状态的影响,其中0≤p≤α-1,α表示串联倒立摆系统的总节点数,为已知的任意正整数;不失一般性,假设串联倒立摆系统满足边界条件xk(p,0)=0,并且xk(-1,t)=0,xk(α,t)=0;
第二步:对原串联倒立摆的状态空间方程进行转换;
对于原串联倒立摆的状态空间方程(17),利用提升技术,定义关于输入、输出、状态和扰动信号的超级矢量Uk(t),Yk(t),Xk(t),Vk(t),Wk(t)为如下形式:
Figure BDA0002583413430000034
则原串联倒立摆的状态空间方程(17)转换成等效系统:
Figure BDA0002583413430000035
其中,
Figure BDA0002583413430000041
Figure BDA0002583413430000042
第三步:根据重复过程理论设计鲁棒迭代学习控制算法;
定义等效系统输出跟踪误差为
ek(t)=Yr(t)-Yk(t)
其中Yr(t)为期望输出信号的超级矢量,且为连续可导的期望输出轨迹;
针对等效系统(19)设计如下形式的迭代学习控制律
Uk(t)=Uk-1(t)+ΔUk(t) (20)
在式(20)中,Uk(t)是当前周期的输入量;Uk-1(t)是前一个周期的输入量;ΔUk(t)是控制系统周期更新的修正量,为了便于分析,定义中间变量ηk(t),θk(t)和ζk(t)为
Figure BDA0002583413430000044
根据式(19)、式(20)和式(21)得到:
Figure BDA0002583413430000045
Figure BDA0002583413430000046
将式(20)中的迭代学习更新律定义为如下形式:
Figure BDA0002583413430000047
其中,
Figure BDA0002583413430000051
其中
Figure BDA0002583413430000052
分别对应将迭代学习更新律与等效系统(19)结合,得到被控系统的重复过程模型为如下形式:
Figure BDA0002583413430000053
其中,
Figure BDA0002583413430000054
I表示单位矩阵;
重复过程模型(26)从系统误差ek-1(t)到系统误差ek(t)之间的传递函数为:
Figure BDA0002583413430000055
为了进一步表示系统外部有界扰动与系统输出之间的关系,将式(26)转换成如下形式的连续离散重复过程模型:
Figure BDA0002583413430000056
其中,
Figure BDA0002583413430000057
则连续离散重复过程模型(28)从系统外部有界扰动
Figure BDA0002583413430000058
到系统误差ek-1(t)之间的传递函数为:
Figure BDA0002583413430000059
ω表示系统工作频率;
第四步:分析有限频率范围内的鲁棒迭代学习控制算法的收敛性;
本申请的控制目标是设计鲁棒迭代学习控制律使得具有外部有界扰动的等效系统(19)在有限频率范围内鲁棒稳定;首先应保证在无外部有界扰动情况下等效系统(19)的稳定性;
在无外部有界扰动情况下,重复过程稳定和误差收敛需要满足三个条件:
条件一:重复过程模型(26)的矩阵
Figure BDA0002583413430000061
的所有特征值都具有严格的负实部;
条件二:重复过程模型(26)的矩阵
Figure BDA0002583413430000062
的谱半径严格小于1;
条件三:重复过程模型(26)传递函数的矩阵
Figure BDA0002583413430000063
其特征值的模严格小于1;
在无外部有界扰动情况下,重复过程模型(26)在有限频率范围内稳定和误差收敛的结论为:
对于重复过程模型(26),若存在对称正定矩阵Q>0,P>0,Z>0和W1>0使得如下线性矩阵不等式成立:
Figure BDA0002583413430000064
Figure BDA0002583413430000065
则无扰动的等效系统(19)在迭代学习更新律(24)的作用下,输出跟踪误差在低、中频段范围内沿时间和批次方向单调收敛;
对于重复过程模型(26),若存在对称正定矩阵Q>0,P>0,Z>0和W1>0,以及标量τ>0使得如下线性矩阵不等式成立:
Figure BDA0002583413430000066
Figure BDA0002583413430000067
则无扰动的等效系统(19)在迭代学习更新律(24)作用下,输出跟踪误差在高频段范围内沿时间和批次方向单调收敛;
在无扰动结论的基础上进一步扩展带有外部有界扰动的等效系统(19)在有限频率范围内鲁棒稳定且具有鲁棒性能的结论;
若连续离散重复过程模型(28)从外部有界扰动到系统输出误差之间的传递函数Gwz(s)满足
||Gwz(s)||<γ (34)则称连续离散重复过程模型具有鲁棒性能,γ为其性能指标,且γ取值越小,表明连续离散重复过程模型的抑制干扰的性能越好;
广义有界实引理内容为:
给定标量γ>0,对于给定系统的传递函数G(s)及其频率响应G(jω)=C(jωI-A)- 1B,以下不等式等价:
(i)频率响应不等式
Figure BDA0002583413430000078
(ii)线性矩阵不等式
Figure BDA0002583413430000071
其中Q>0,P=PT>0,
Figure BDA0002583413430000072
系统的频率范围以及不同频率范围内Ψ取值如表1所示
表1 系统的频率范围
Figure BDA0002583413430000073
注释:设
Figure BDA0002583413430000074
Figure BDA0002583413430000075
N11、N12、N21、N22需要在不同频率范围内具备不同的形式。
将连续离散重复过程模型(28)的系数矩阵(29)代入广义有界实引理的线性矩阵不等式,同时令
Figure BDA0002583413430000076
Figure BDA0002583413430000077
并取频率响应不等式中的矩阵
Figure BDA0002583413430000081
则线性矩阵不等式写成:
Figure BDA0002583413430000082
且式(35)又可以写成:
Figure BDA0002583413430000083
其中
Figure BDA0002583413430000084
对于式(36)中的Λ,取
Figure BDA0002583413430000085
其次,取矩阵
Figure BDA0002583413430000086
则得到下列等式:
Figure BDA0002583413430000087
其中定义Q>0,根据广义有界实引理中N11=-Q可得
Figure BDA0002583413430000088
又因为-γ2I<0所以
Figure BDA0002583413430000089
根据投影引理
Figure BDA00025834134300000810
得到以下不等式成立:
Figure BDA00025834134300000811
其中
Figure BDA00025834134300000812
对式(38)使用Schur补引理得到:
Figure BDA00025834134300000813
根据广义有界实引理G(jω)*G(jω)<γ2,得到ρ(G(jω))<γ,由于ρ(G(jω))≤||G(jω)||,则得到:
||G(jω)||
保证了连续离散重复过程系统(28)具有鲁棒性能γ;
因此对于低、中频段得到下列结论:
针对式(26)的重复过程模型,给定对称矩阵P>0,Q>0,Z>0,W1>0和W2>0以及给定标量γ>0使得式(30)和式(31)以及下列矩阵不等式成立:
Figure BDA0002583413430000091
则在迭代学习更新律(24)作用下,等效系统(19)在低、中频率范围内鲁棒稳定且具有鲁棒性能γ,同时输出跟踪误差沿时间和周期方向收敛;
根据广义有界实引理中N矩阵N11元素在低、中频范围内和高频范围内的取值可知,低中频段为-Q,高频段为Q,不同频段取值不同,当系统工作于高频段时N11=Q>0,相应的结论式(40)无法保证其负定,因此引入标量τ>0,取下列矩阵
Figure BDA0002583413430000092
则得到:
Figure BDA0002583413430000093
则相应高频段的结论为:
针对式(26)的重复过程模型,给定对称矩阵P>0,Q>0,Z>0,W1>0和W2>0以及给定标量τ>0和γ>0使得式(32)和式(33)以及下列矩阵不等式成立:
Figure BDA0002583413430000101
其中T1=N11-τW1-τW1 T,T2=N11-τW2-τW2 T;则在迭代学习更新律(24)作用下,等效系统(19)在高频率范围内鲁棒稳定且具有鲁棒性能γ,同时输出跟踪误差沿时间和周期方向收敛;
第五步:求解鲁棒迭代学习控制算法的控制律增益;
上述结论不能直接用于控制律的求解,需要进行一定的转换才能进行求解。
根据式(30)得出式(42)
Figure BDA0002583413430000102
Figure BDA0002583413430000103
Figure BDA0002583413430000104
因此Σ=[-ρ2I ρ1I],定义ρ2<0,ρ1>0,则得到:
Figure BDA0002583413430000105
运用投射引理得到如下结果:
Figure BDA0002583413430000106
将重复过程模型的系数矩阵(27)代入式(44)并在上式不等式左右两边乘以diag{S1 T,S1 T}、diag{S1,S1},其中S1=W1 -1,得到如下不等式:
Figure BDA0002583413430000107
其中
Figure BDA0002583413430000108
将重复过程模型的系数矩阵式(27)代入式(31),因此得到下列不等式:
Figure BDA0002583413430000111
在式(31)中,不等式左右两边乘以diag{S1 T,S1 T,I,I}、diag{S1,S1,I,I},其中S1=W1 -1,得到下列不等式:
Figure BDA0002583413430000112
化简得到下列不等式:
Figure BDA0002583413430000113
其中
Figure BDA0002583413430000114
将重复过程模型的系数矩阵(27)代入式(40),得到:
Figure BDA0002583413430000115
其中,
Γ1=N22+ATW1+W1 TA+K1 TBTW1+W1 TBK12=-K1 TBTCTW2-ATCTW2+W1 TBK23=N22+W2 T+W2-K2 TBTCTW2-W2 TCBK2
在式(49)左右两边乘以diag{S1 T,S2 T,S1 T,S2 T,I,I,I}、diag{S1,S2,S1,S2,I,I,I},其中S1=W1 -1,S2=W2 -1得到
Figure BDA0002583413430000121
其中,
Figure BDA0002583413430000122
Figure BDA0002583413430000123
令X1=K1S1,X2=K2S2
对于低、中频段得出下列结论:
针对式(26)的重复过程模型,给定适当维数矩阵X1,X2,对称矩阵
Figure BDA0002583413430000124
Figure BDA0002583413430000125
S1>0和S2>0以及标量ρ1>0,ρ2<0和γ>0使得下列线性矩阵不等式成立:
Figure BDA0002583413430000126
Figure BDA0002583413430000127
Figure BDA0002583413430000128
则在迭代学习更新律(24)作用下,等效系统(19)在低、中频率范围内鲁棒稳定且具有鲁棒性能γ,同时输出跟踪误差沿时间和周期方向收敛,迭代学习控制律的增益由
Figure BDA0002583413430000129
给出;
同时相应高频段的结论为:
针对式(26)的重复过程模型,给定适当维数矩阵X1,X2,对称矩阵
Figure BDA0002583413430000131
Figure BDA0002583413430000132
S1>0和S2>0以及标量ρ1>0,ρ2<0,γ>0和τ>0使得式(51)以及下列线性矩阵不等式成立:
Figure BDA0002583413430000133
Figure BDA0002583413430000134
其中
Figure BDA0002583413430000135
则在迭代学习更新律(24)作用下,等效系统(19)在高频率范围内鲁棒稳定且具有鲁棒性能γ,同时输出跟踪误差沿时间和周期方向收敛,迭代学习控制律的增益由
Figure BDA0002583413430000136
K2=X2S2 -1给出。
本发明的有益技术效果是:
本申请公开了一种串联倒立摆的有限频率范围鲁棒迭代学习控制方法,根据重复过程理论和广义有界实引理,给出确保系统稳定和具有鲁棒控制性能的充分条件并保证了输出跟踪误差在时域和频域内的收敛性,同时将该条件转换成相应的线性矩阵不等式对鲁棒迭代学习控制律进行求解,本申请不仅考虑了单个倒立摆子系统时间和运行维度的系统特性,而且能直接应用于由多个倒立摆子系统组成的串联倒立摆系统,具有较好的控制精度,对于控制理论的验证以及具有相似结构系统的研究具有良好的应用价值,同时,本申请的方法结构简单,易于工程实现。
附图说明
图1是本申请提供的串联倒立摆的迭代学习控制方法的流程图。
图2是本申请提供的串联倒立摆整体结构图。
图3是本申请提供的小车受力分析图。
图4是本申请提供的摆杆受力分析图。
图5是本申请一实施例提供的串联倒立摆系统的输出参考轨迹。
图6是本申请一实施例提供的串联倒立摆系统的输出参考轨迹频谱。
图7是本申请一实施例提供的串联倒立摆第3个子系统的输出变化曲面。
图8是本申请一实施例提供的串联倒立摆第3个子系统的输入变化曲面。
图9是本申请一实施例提供的串联倒立摆第3个子系统的误差变化曲面。
图10是本申请一实施例提供的串联倒立摆系统的均方根误差变化效果。
具体实施方式
下面结合附图对本发明的具体实施方式做进一步说明。
本申请公开了一种串联倒立摆的有限频率范围鲁棒迭代学习控制方法,其方法流程图如图1所示,串联倒立摆本身具有强耦合、非线性以及不稳定等特点,对其建立状态空间模型具有一定的难度。但是通过对系统的合理假设,将部分系统变量进行合理的近似后,就可以使用经典的牛顿力学在惯性坐标系内对串联倒立摆系统建立的状态空间模型。
在建立串联倒立摆的状态空间方程的步骤之前,方法还包括:
对串联倒立摆进行建模之前,对串联倒立摆系统作如下假设:
(1)摆体是严格的刚体,运动过程中不会变形,
(2)小车与导轨间的摩擦力与相对速度成正比,忽略空气阻力及其他摩擦力,
(3)外力对串联倒立摆系统的作用无时滞。
串联倒立摆系统包括多个通过弹簧串联的一级倒立摆,根据牛顿力学先对第p个节点的一级倒立摆单独进行动力学分析,利用隔离法将第p个节点的一级倒立摆分为小车和摆杆两个部分,对两个部分分别进行受力分析。串联倒立摆的物理量参数如表2所示。
表2 串联倒立摆系统物理量参数表
Figure BDA0002583413430000141
Figure BDA0002583413430000151
结合图2-图4所示,对小车进行受力分析,在水平方向上,由牛顿力学分析得到小车的运动方程为:
Figure BDA0002583413430000152
由假设得到:
Figure BDA0002583413430000153
对摆杆进行受力分析,在水平方向上得到:
Figure BDA0002583413430000154
将式(3)求导展开得到:
Figure BDA0002583413430000155
同时根据串联倒立摆整体结构得到:
Figure BDA0002583413430000158
将式(5)、式(4)和式(2)代入式(1)得到:
Figure BDA0002583413430000156
将式(6)化简合并得到系统第一运动方程式(7)
Figure BDA0002583413430000157
对摆杆进行受力分析,根据力矩平衡方程得到:
Figure BDA0002583413430000161
在摆杆竖直方向上受力分析得到:
Figure BDA0002583413430000162
展开式(9)得到:
Figure BDA0002583413430000163
将式(4)和式(10)代入式(8)得到系统第二运动方程式(11)
Figure BDA0002583413430000164
为实现串联倒立摆在平衡点附近微小的角度内重复摆动,同时对串联倒立摆系统变量进行如下近似处理:
Figure BDA0002583413430000165
同时:
Figure BDA0002583413430000166
将周期变量k和时间变量t加入第一运动方程式(7)和第二运动方程式(11)中并根据式(12)和式(13)简化得到串联倒立摆的运动方程为:
Figure BDA0002583413430000167
由式(14)的第一个方程得到:
Figure BDA0002583413430000168
将式(15)代入式(14)的第二个方程得到:
Figure BDA0002583413430000171
将式(16)回代式(15)的第一个方程得到:
Figure BDA0002583413430000172
Figure BDA0002583413430000173
同时设置如下形式状态变量:
Figure BDA0002583413430000174
Figure BDA0002583413430000175
Figure BDA0002583413430000176
Figure BDA0002583413430000177
uk(p,t)=Fk(p,t)
并在系统每个倒立摆子系统节点中引入状态端外部有界扰动vk(p,t)和输出端外部有界扰动信号wk(p,t),则得到串联倒立摆的状态空间方程:
Figure BDA0002583413430000178
针对式(17)所描述的串联倒立摆,选取各项结构参数值分别为:
M=1(kg),m=0.2(kg),l=0.3(m),a=1(N/m),b=0.3(N/m/sec),g=9.8(m/s2),J=0.006(kg·m2).
同时取串联倒立摆各子系统的状态初值xk(p,0)=0,uk(p,0)=0。根据式(17)系统各个参数矩阵为
Figure BDA0002583413430000181
Figure BDA0002583413430000182
设定串联倒立摆包含6个子系统节点,根据串联倒立摆系统的特点,定义每个子系统各个节点具有相同的参考轨迹,考虑分别定义每个节点摆杆摆动角度的参考轨迹为:
Figure BDA0002583413430000183
倒立摆的参考轨迹角度在STM32F103C8T6单片机内进行设定,参考轨迹在时域中的曲线如图5所示,绘制相应的频谱曲线如图6所示,由图6可知参考轨迹的有效谐波在0到10HZ之间全部衰减,因此可以直接选取该频段为系统运行的低频范围,即
Figure BDA0002583413430000184
对应于系统运行的低频范围。同时,假设每个倒立摆子系统的状态端外界扰动为
vk(p,t)=0.01sin(kt),p=1,2,…,6.
以及输出端外界扰动为
wk(p,t)=0.01sin(kt),p=1,2,…,6.
给定系统的鲁棒性能指标γ=0.9,并求解式(51)、式(52)和式(53)的线性矩阵不等式可得迭代学习更新律(24)中的矩阵增益为
Figure BDA0002583413430000185
Figure BDA0002583413430000186
上述迭代学习控制器算法通过一块STM32F103C8T6芯片实现。整体系统由STM32F103C8T6单片机、MG513编码器、直流电机、倒立摆机械机构和WDD35D4角传感器等几部分组成。利用WDD35D4角传感器作为摆杆摆动角度的传感器,对摆杆倾角进行角度检测,并将检测到的实时角度模拟量传送给STM32F103C8T6单片机。STM32F103C8T6单片机进行A/D转换并实时处理,与给定参考轨迹比较并计算偏差。同时利用MG513编码器作为小车的位移传感器,对底座位置进行位置检测,将检测到的实时位置信息传送单片机内。利用摆杆角度偏差信号与小车实时位置信号构建迭代学习更新律,并通过单片机计算与上一周期的控制信号结合得到前周期的控制信号Uk(t),控制信号通过D/A转换电路,控制执行机构直流电机工作,使底座在皮带上重复执行水平运动的动作,不断修正倒立摆摆杆的输出角度,从而使串联倒立摆的摆杆能够精确跟踪上给定的期望轨迹。
由于篇幅限制此处仅给出第3个子系统状态。图7表示串联倒立摆第3个子系统的输出变化曲面,图8为串联倒立摆第3个子系统的输入变化曲面,图9为串联倒立摆第3个子系统的误差变化曲面。为进一步评价系统跟踪性能,引入性能指标:
Figure BDA0002583413430000191
图10表示串联倒立摆的均方根误差变化效果,在有限频率范围内设计的鲁棒迭代学习控制方案使得串联倒立摆稳定。第3个节点以及整体系统的摆角跟踪过程不受到外部有界扰动的影响,摆角的跟踪误差可以收敛到零。
以上所述的仅是本申请的优选实施方式,本发明不限于以上实施例。可以理解,本领域技术人员在不脱离本发明的精神和构思的前提下直接导出或联想到的其他改进和变化,均应认为包含在本发明的保护范围之内。

Claims (2)

1.一种串联倒立摆的有限频率范围鲁棒迭代学习控制方法,其特征在于,所述方法包括如下步骤:
第一步:建立串联倒立摆的状态空间方程;
Figure FDA0002583413420000011
其中,
Figure FDA0002583413420000012
Figure FDA0002583413420000013
Figure FDA0002583413420000014
Figure FDA0002583413420000015
式(17)中k表示迭代周期,p表示控制节点序号,t代表连续时间,串联倒立摆系统工作于t∈[0,T]的重复时间周期内;xk(p,t)∈Rn,uk(p,t)∈Rm和yk(p,t)∈Rl分别表示串联倒立摆系统第p个节点的状态、输入和输出信号;vk(p,t)∈Ri和wk(p,t)∈Rj分别表示串联倒立摆系统第p个节点的状态端外部有界扰动和输出端外部有界扰动信号,并且扰动信号可导;
Figure FDA0002583413420000021
Figure FDA0002583413420000022
Figure FDA0002583413420000023
分别表示适当维数的系统矩阵;m表示摆杆质量,l表示摆杆质心到转动轴心的距离,J表示摆杆的转动惯量,M表示小车质量,a表示弹簧劲度系数,b表示小车摩擦系数;串联倒立摆系统第p个节点的状态会受到前后节点状态的影响,其中0≤p≤α-1,α表示串联倒立摆系统的总节点数,为已知的任意正整数;不失一般性,假设串联倒立摆系统满足边界条件xk(p,0)=0,并且xk(-1,t)=0,xk(α,t)=0;
第二步:对原串联倒立摆的状态空间方程进行转换;
对于所述原串联倒立摆的状态空间方程(17),利用提升技术,定义关于输入、输出、状态和扰动信号的超级矢量Uk(t),Yk(t),Xk(t),Vk(t),Wk(t)为如下形式:
Figure FDA0002583413420000024
则所述原串联倒立摆的状态空间方程(17)转换成等效系统:
Figure FDA0002583413420000025
其中,
Figure FDA0002583413420000026
Figure FDA0002583413420000027
第三步:根据重复过程理论设计鲁棒迭代学习控制算法;
定义所述等效系统输出跟踪误差为
ek(t)=Yr(t)-Yk(t)
其中Yr(t)为期望输出信号的超级矢量,且为连续可导的期望输出轨迹;
针对所述等效系统(19)设计如下形式的迭代学习控制律
Uk(t)=Uk-1(t)+ΔUk(t) (20)
在式(20)中,Uk(t)是当前周期的输入量;Uk-1(t)是前一个周期的输入量;ΔUk(t)是控制系统周期更新的修正量,为了便于分析,定义中间变量ηk(t),
Figure FDA0002583413420000037
和ζk(t)为
Figure FDA0002583413420000031
根据式(19)、式(20)和式(21)得到:
Figure FDA0002583413420000032
Figure FDA0002583413420000033
将式(20)中的迭代学习更新律定义为如下形式:
Figure FDA0002583413420000034
其中,
Figure FDA0002583413420000035
其中
Figure FDA0002583413420000036
分别对应将所述迭代学习更新律与所述等效系统(19)结合,得到被控系统的重复过程模型为如下形式:
Figure FDA0002583413420000041
其中,
Figure FDA0002583413420000042
I表示单位矩阵;
所述重复过程模型(26)从系统误差ek-1(t)到系统误差ek(t)之间的传递函数为:
Figure FDA0002583413420000043
为了进一步表示系统外部有界扰动与系统输出之间的关系,将式(26)转换成如下形式的连续离散重复过程模型:
Figure FDA0002583413420000044
其中,
Figure FDA0002583413420000045
则所述连续离散重复过程模型(28)从系统外部有界扰动
Figure FDA0002583413420000046
到系统误差ek-1(t)之间的传递函数为:
Figure FDA0002583413420000047
ω表示系统工作频率;
第四步:分析有限频率范围内的所述鲁棒迭代学习控制算法的收敛性;
本申请的控制目标是设计鲁棒迭代学习控制律使得具有外部有界扰动的所述等效系统(19)在有限频率范围内鲁棒稳定;首先应保证在无外部有界扰动情况下所述等效系统(19)的稳定性;
在无外部有界扰动情况下,重复过程稳定和误差收敛需要满足三个条件:条件一:所述重复过程模型(26)的矩阵
Figure FDA0002583413420000048
的所有特征值都具有严格的负实部;条件二:所述重复过程模型(26)的矩阵
Figure FDA0002583413420000049
的谱半径严格小于1;条件三:所述重复过程模型(26)传递函数的矩阵
Figure FDA0002583413420000051
Figure FDA0002583413420000052
其特征值的模严格小于1;
在无外部有界扰动情况下,所述重复过程模型(26)在有限频率范围内稳定和误差收敛的结论为:
对于所述重复过程模型(26),若存在对称正定矩阵Q>0,P>0,Z>0和W1>0使得如下线性矩阵不等式成立:
Figure FDA0002583413420000053
Figure FDA0002583413420000054
则无扰动的等效系统(19)在所述迭代学习更新律(24)的作用下,输出跟踪误差在低、中频段范围内沿时间和批次方向单调收敛;
对于重复过程模型(26),若存在对称正定矩阵Q>0,P>0,Z>0和W1>0,以及标量τ>0使得如下线性矩阵不等式成立:
Figure FDA0002583413420000055
Figure FDA0002583413420000056
则无扰动的等效系统(19)在所述迭代学习更新律(24)作用下,输出跟踪误差在高频段范围内沿时间和批次方向单调收敛;
在无扰动结论的基础上进一步扩展带有外部有界扰动的等效系统(19)在有限频率范围内鲁棒稳定且具有鲁棒性能的结论;
若所述连续离散重复过程模型(28)从外部有界扰动到系统输出误差之间的传递函数Gwz(s)满足
||Gwz(s)||<γ (34)
则称所述连续离散重复过程模型具有鲁棒性能,γ为其性能指标,且γ取值越小,表明所述连续离散重复过程模型的抑制干扰的性能越好;
将所述连续离散重复过程模型(28)的系数矩阵(29)代入广义有界实引理的线性矩阵不等式,同时令
Figure FDA0002583413420000057
Figure FDA0002583413420000061
并取频率响应不等式中的矩阵
Figure FDA0002583413420000062
则线性矩阵不等式写成:
Figure FDA0002583413420000063
且式(35)又可以写成:
Figure FDA0002583413420000064
其中
Figure FDA0002583413420000065
对于式(36)中的Λ,取
Figure FDA0002583413420000066
其次,取矩阵
Σ=[0 I 0,
Figure FDA0002583413420000067
则得到下列等式:
Figure FDA0002583413420000068
其中定义Q>0,根据广义有界实引理中N11=-Q可得
Figure FDA0002583413420000069
又因为-γ2I<0所以
Figure FDA00025834134200000613
根据投影引理
Figure FDA00025834134200000614
得到以下不等式成立:
Figure FDA00025834134200000610
其中
Figure FDA00025834134200000611
对式(38)使用Schur补引理得到:
Figure FDA00025834134200000612
根据广义有界实引理G(jω)*G(jω)<γ2,得到ρ(G(jω))<γ,由于ρ(G(jω))≤||G(jω)||,则得到:
||G(jω)||
保证了所述连续离散重复过程系统(28)具有鲁棒性能γ;
因此对于低、中频段得到下列结论:
针对式(26)所述的重复过程模型,给定对称矩阵P>0,Q>0,Z>0,W1>0和W2>0以及给定标量γ>0使得式(30)和式(31)以及下列矩阵不等式成立:
Figure FDA0002583413420000071
则在所述迭代学习更新律(24)作用下,所述等效系统(19)在低、中频率范围内鲁棒稳定且具有鲁棒性能γ,同时输出跟踪误差沿时间和周期方向收敛;
根据广义有界实引理中N矩阵N11元素在低、中频范围内和高频范围内的取值可知,低中频段为-Q,高频段为Q,不同频段取值不同,当系统工作于高频段时N11=Q>0,相应的结论式(40)无法保证其负定,因此引入标量τ>0,取下列矩阵
Σ=[τI I 0,
Figure FDA0002583413420000072
则得到:
Figure FDA0002583413420000073
则相应高频段的结论为:
针对式(26)所述的重复过程模型,给定对称矩阵P>0,Q>0,Z>0,W1>0和W2>0以及给定标量τ>0和γ>0使得式(32)和式(33)以及下列矩阵不等式成立:
Figure FDA0002583413420000081
其中T1=N11-τW1-τW1 T
Figure FDA00025834134200000810
则在所述迭代学习更新律(24)作用下,所述等效系统(19)在高频率范围内鲁棒稳定且具有鲁棒性能γ,同时输出跟踪误差沿时间和周期方向收敛;
第五步:求解所述鲁棒迭代学习控制算法的控制律增益;
根据式(30)得出式(42)
Figure FDA0002583413420000082
Figure FDA0002583413420000083
Figure FDA0002583413420000084
因此Σ=[-ρ2I ρ1I],定义ρ2<0,ρ1>0,则得到:
Figure FDA0002583413420000085
运用投射引理得到如下结果:
Figure FDA0002583413420000086
将所述重复过程模型的系数矩阵(27)代入式(44)并在上式不等式左右两边乘以diag{S1 T,S1 T}、diag{S1,S1},其中S1=W1 -1,得到如下不等式:
Figure FDA0002583413420000087
其中
Figure FDA0002583413420000088
将所述重复过程模型的系数矩阵式(27)代入式(31),因此得到下列不等式:
Figure FDA0002583413420000089
在式(31)中,不等式左右两边乘以diag{S1 T,S1 T,I,I}、diag{S1,S1,I,I},其中S1=W1 -1,得到下列不等式:
Figure FDA0002583413420000091
化简得到下列不等式:
Figure FDA0002583413420000092
其中
Figure FDA0002583413420000093
将所述重复过程模型的系数矩阵(27)代入式(40),得到:
Figure FDA0002583413420000094
其中,
Γ1=N22+ATW1+W1 TA+K1 TBTW1+W1 TBK12=-K1 TBTCTW2-ATCTW2+W1 TBK23=N22+W2 T+W2-K2 TBTCTW2-W2 TCBK2
在式(49)左右两边乘以diag{S1 T,S2 T,S1 T,S2 T,I,I,I}、diag{S1,S2,S1,S2,I,I,I},其中S1=W1 -1,S2=W2 -1得到
Figure FDA0002583413420000095
其中,
Figure FDA0002583413420000101
Figure FDA0002583413420000102
令X1=K1S1,X2=K2S2
对于低、中频段得出下列结论:
针对式(26)所述的重复过程模型,给定适当维数矩阵X1,X2,对称矩阵
Figure FDA0002583413420000103
S1>0和S2>0以及标量ρ1>0,ρ2<0和γ>0使得下列线性矩阵不等式成立:
Figure FDA0002583413420000104
Figure FDA0002583413420000105
Figure FDA0002583413420000106
则在所述迭代学习更新律(24)作用下,所述等效系统(19)在低、中频率范围内鲁棒稳定且具有鲁棒性能γ,同时输出跟踪误差沿时间和周期方向收敛,所述迭代学习控制律的增益由
Figure FDA0002583413420000107
给出;
同时相应高频段的结论为:
针对式(26)所述的重复过程模型,给定适当维数矩阵X1,X2,对称矩阵
Figure FDA0002583413420000108
S1>0和S2>0以及标量ρ1>0,ρ2<0,γ>0和τ>0使得式(51)以及下列线性矩阵不等式成立:
Figure FDA0002583413420000111
Figure FDA0002583413420000112
其中
Figure FDA0002583413420000113
则在所述迭代学习更新律(24)作用下,所述等效系统(19)在高频率范围内鲁棒稳定且具有鲁棒性能γ,同时输出跟踪误差沿时间和周期方向收敛,所述迭代学习控制律的增益由
Figure FDA0002583413420000114
K2=X2S2 -1给出。
2.根据权利要求1所述的串联倒立摆的有限频率范围鲁棒迭代学习控制方法,其特征在于,在所述建立串联倒立摆的状态空间方程的步骤之前,所述方法还包括:
对串联倒立摆进行建模之前,对所述串联倒立摆系统作如下假设:
(1)摆体是严格的刚体,运动过程中不会变形,
(2)小车与导轨间的摩擦力与相对速度成正比,忽略空气阻力及其他摩擦力,
(3)外力对所述串联倒立摆系统的作用无时滞;
所述串联倒立摆系统包括多个通过弹簧串联的一级倒立摆,根据牛顿力学先对第p个节点的一级倒立摆单独进行动力学分析,利用隔离法将第p个节点的一级倒立摆分为小车和摆杆两个部分,对所述两个部分分别进行受力分析;
对所述小车进行受力分析,在水平方向上,由牛顿力学分析得到小车的运动方程为:
Figure FDA0002583413420000115
在式(1)中,Lp表示第p个节点小车相对初始位置的位移,F表示作用于串联倒立摆系统上的控制力,Fp-1表示第p-1个节点对第p个节点的作用力,Fp+1表示第p+1个节点对第p个节点的作用力,FN表示摆杆与小车水平方向的相互作用力,Ff表示小车与导轨间的摩擦力;
由假设得到:
Figure FDA0002583413420000121
对摆杆进行受力分析,在水平方向上得到:
Figure FDA0002583413420000122
在式(3)中,θp表示第p个节点摆杆与竖直向上方向的夹角;
将式(3)求导展开得到:
Figure FDA0002583413420000123
同时根据串联倒立摆整体结构得到:
Figure FDA0002583413420000124
将式(5)、式(4)和式(2)代入式(1)得到:
Figure FDA0002583413420000125
将式(6)化简合并得到系统第一运动方程式(7)
Figure FDA0002583413420000126
对所述摆杆进行受力分析,根据力矩平衡方程得到:
Figure FDA0002583413420000127
在式(8)中,FT表示摆杆与小车竖直方向的相互作用力;
在摆杆竖直方向上受力分析得到:
Figure FDA0002583413420000128
在式(9)中,Gm表示摆杆的重力;
展开式(9)得到:
Figure FDA0002583413420000129
将式(4)和式(10)代入式(8)得到系统第二运动方程式(11)
Figure FDA00025834134200001210
为实现串联倒立摆在平衡点附近微小的角度内重复摆动,同时对所述串联倒立摆系统变量进行如下近似处理:
Figure FDA0002583413420000131
同时:
Figure FDA0002583413420000132
将周期变量k和时间变量t加入所述第一运动方程式(7)和所述第二运动方程式(11)中并根据式(12)和式(13)简化得到串联倒立摆的运动方程为:
Figure FDA0002583413420000133
由式(14)的第一个方程得到:
Figure FDA0002583413420000134
将式(15)代入式(14)的第二个方程得到:
Figure FDA0002583413420000135
将式(16)回代式(15)的第一个方程得到:
Figure FDA0002583413420000136
Figure FDA0002583413420000137
同时设置如下形式状态变量:
Figure FDA0002583413420000141
Figure FDA0002583413420000142
Figure FDA0002583413420000143
Figure FDA0002583413420000144
uk(p,t)=Fk(p,t)
并在系统每个倒立摆子系统节点中引入状态端外部有界扰动vk(p,t)和输出端外部有界扰动信号wk(p,t),则得到所述串联倒立摆的状态空间方程。
CN202010674050.3A 2020-07-14 2020-07-14 一种串联倒立摆的有限频率范围鲁棒迭代学习控制方法 Active CN111580392B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202010674050.3A CN111580392B (zh) 2020-07-14 2020-07-14 一种串联倒立摆的有限频率范围鲁棒迭代学习控制方法
PCT/CN2021/094741 WO2022012155A1 (zh) 2020-07-14 2021-05-20 一种串联倒立摆的有限频率范围鲁棒迭代学习控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010674050.3A CN111580392B (zh) 2020-07-14 2020-07-14 一种串联倒立摆的有限频率范围鲁棒迭代学习控制方法

Publications (2)

Publication Number Publication Date
CN111580392A true CN111580392A (zh) 2020-08-25
CN111580392B CN111580392B (zh) 2021-06-15

Family

ID=72124031

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010674050.3A Active CN111580392B (zh) 2020-07-14 2020-07-14 一种串联倒立摆的有限频率范围鲁棒迭代学习控制方法

Country Status (2)

Country Link
CN (1) CN111580392B (zh)
WO (1) WO2022012155A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112230549A (zh) * 2020-10-28 2021-01-15 杭州电子科技大学 一种基于鲁棒自适应控制器的平衡车控制方法
CN112327971A (zh) * 2020-10-27 2021-02-05 江南大学 金属棒温度分布系统的鲁棒启发式迭代学习控制方法
CN112486191A (zh) * 2020-10-28 2021-03-12 杭州电子科技大学 一种基于增强型误差模型的平衡车控制方法
WO2022012155A1 (zh) * 2020-07-14 2022-01-20 江南大学 一种串联倒立摆的有限频率范围鲁棒迭代学习控制方法
CN114721268A (zh) * 2022-04-08 2022-07-08 江南大学 注塑成型喷嘴压力鲁棒启发式迭代学习控制方法

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114625011B (zh) * 2022-03-23 2024-04-02 合肥工业大学 一种配电网无线通信可靠性的鲁棒控制方法
CN114559437B (zh) * 2022-03-25 2023-06-27 合肥工业大学 机械手臂系统在有限频域扰动下的稳定鲁棒控制方法
CN114944796B (zh) * 2022-05-20 2024-06-11 上海航天控制技术研究所 基于参数补偿的同轴串联系统驱动力同步协调控制方法
CN117250863B (zh) * 2023-09-26 2024-03-08 天津大学 一种基于特征值计算的单输入单输出负虚系统判别方法
CN117850237B (zh) * 2024-01-10 2024-06-21 西安工程大学 基于迭代学习控制的跟踪处理方法、装置、设备和介质
CN117951650B (zh) * 2024-03-27 2024-06-21 湖南大学 融合奇异谱分析与鲁棒子空间辨识的动态称量方法及系统
CN118170035A (zh) * 2024-05-16 2024-06-11 南昌大学 基于深度学习的自平衡机器人设计方法及系统

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008067404A2 (en) * 2006-11-29 2008-06-05 Honda Motor Co., Ltd. Determination of foot placement for humanoid push recovery
CN101673354A (zh) * 2009-06-12 2010-03-17 北京工业大学 操作条件反射自动机及其在仿生自主学习控制中的应用
CN101846979A (zh) * 2010-06-29 2010-09-29 北京航空航天大学 一种精确目标跟踪的超前迭代学习控制方法
CN104570740A (zh) * 2015-01-21 2015-04-29 江南大学 一种输入饱和机械臂系统的周期自适应学习控制方法
CN107561929A (zh) * 2017-07-25 2018-01-09 北京理工大学 一种伺服系统的无模型鲁棒自适应优化方法
CN109375512A (zh) * 2018-11-20 2019-02-22 中南大学 基于rbf-arx模型的保证倒立摆系统闭环稳定的预测控制方法
CN109709802A (zh) * 2018-12-14 2019-05-03 江南大学 基于迭代学习控制的有源电子梯形电路的控制方法
US20190228309A1 (en) * 2018-01-25 2019-07-25 The Research Foundation For The State University Of New York Framework and methods of diverse exploration for fast and safe policy improvement
US20190272752A1 (en) * 2018-03-05 2019-09-05 NEC Laboratories Europe GmbH Method for robust control of a machine learning system and robust control system
CN110221539A (zh) * 2019-05-17 2019-09-10 江苏理工学院 基于线性扩张观测器的四旋翼非奇异终端滑模控制方法
CN111736471A (zh) * 2020-07-14 2020-10-02 江南大学 一种旋转倒立摆的迭代反馈整定控制及其鲁棒优化方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111360811B (zh) * 2018-12-26 2022-11-22 中国科学院沈阳自动化研究所 一种基于串联机器人的倒立摆教学系统及控制方法
CN110134011B (zh) * 2019-04-23 2022-01-11 浙江工业大学 一种倒立摆自适应迭代学习反演控制方法
CN110908280B (zh) * 2019-10-30 2023-01-03 宁波大学 一种小车-二级倒立摆系统优化控制方法
CN111580392B (zh) * 2020-07-14 2021-06-15 江南大学 一种串联倒立摆的有限频率范围鲁棒迭代学习控制方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008067404A2 (en) * 2006-11-29 2008-06-05 Honda Motor Co., Ltd. Determination of foot placement for humanoid push recovery
CN101673354A (zh) * 2009-06-12 2010-03-17 北京工业大学 操作条件反射自动机及其在仿生自主学习控制中的应用
CN101846979A (zh) * 2010-06-29 2010-09-29 北京航空航天大学 一种精确目标跟踪的超前迭代学习控制方法
CN104570740A (zh) * 2015-01-21 2015-04-29 江南大学 一种输入饱和机械臂系统的周期自适应学习控制方法
CN107561929A (zh) * 2017-07-25 2018-01-09 北京理工大学 一种伺服系统的无模型鲁棒自适应优化方法
US20190228309A1 (en) * 2018-01-25 2019-07-25 The Research Foundation For The State University Of New York Framework and methods of diverse exploration for fast and safe policy improvement
US20190272752A1 (en) * 2018-03-05 2019-09-05 NEC Laboratories Europe GmbH Method for robust control of a machine learning system and robust control system
CN109375512A (zh) * 2018-11-20 2019-02-22 中南大学 基于rbf-arx模型的保证倒立摆系统闭环稳定的预测控制方法
CN109709802A (zh) * 2018-12-14 2019-05-03 江南大学 基于迭代学习控制的有源电子梯形电路的控制方法
CN110221539A (zh) * 2019-05-17 2019-09-10 江苏理工学院 基于线性扩张观测器的四旋翼非奇异终端滑模控制方法
CN111736471A (zh) * 2020-07-14 2020-10-02 江南大学 一种旋转倒立摆的迭代反馈整定控制及其鲁棒优化方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
HONGFENG TAO: "Robust Iterative Learning Control in Finite Frequency Ranges for Differential Spatially Interconnected Systems", 《CIRCUITS, SYSTEMS, AND SIGNAL PROCESSING》 *
陶洪峰: "输出时滞双率采样系统的鲁棒迭代学习控制", 《控制与决策》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022012155A1 (zh) * 2020-07-14 2022-01-20 江南大学 一种串联倒立摆的有限频率范围鲁棒迭代学习控制方法
CN112327971A (zh) * 2020-10-27 2021-02-05 江南大学 金属棒温度分布系统的鲁棒启发式迭代学习控制方法
CN112327971B (zh) * 2020-10-27 2021-06-15 江南大学 金属棒温度分布系统的鲁棒启发式迭代学习控制方法
WO2022088857A1 (zh) * 2020-10-27 2022-05-05 江南大学 金属棒温度分布系统的鲁棒启发式迭代学习控制方法
CN112230549A (zh) * 2020-10-28 2021-01-15 杭州电子科技大学 一种基于鲁棒自适应控制器的平衡车控制方法
CN112486191A (zh) * 2020-10-28 2021-03-12 杭州电子科技大学 一种基于增强型误差模型的平衡车控制方法
CN112230549B (zh) * 2020-10-28 2022-06-03 杭州电子科技大学 一种基于鲁棒自适应控制器的平衡车控制方法
CN112486191B (zh) * 2020-10-28 2022-07-01 杭州电子科技大学 一种基于增强型误差模型的平衡车控制方法
CN114721268A (zh) * 2022-04-08 2022-07-08 江南大学 注塑成型喷嘴压力鲁棒启发式迭代学习控制方法

Also Published As

Publication number Publication date
WO2022012155A1 (zh) 2022-01-20
CN111580392B (zh) 2021-06-15

Similar Documents

Publication Publication Date Title
CN111580392B (zh) 一种串联倒立摆的有限频率范围鲁棒迭代学习控制方法
Atkeson et al. Robot trajectory learning through practice
CN111596545B (zh) 一种多输入多输出机械系统自适应容错预设性能控制方法
Sun et al. Neural network-based adaptive controller design of robotic manipulators with an observer
CN112904728B (zh) 一种基于改进型趋近律的机械臂滑模控制轨迹跟踪方法
Qi et al. Stable indirect adaptive control based on discrete-time T–S fuzzy model
CN113183154B (zh) 一种柔性关节机械臂的自适应反演控制方法
CN112338913B (zh) 一种多关节柔性机械臂的轨迹跟踪控制方法及系统
CN114326756A (zh) 一种考虑输入量化的自适应预设性能轨迹跟踪控制方法
Polydoros et al. Online multi-target learning of inverse dynamics models for computed-torque control of compliant manipulators
Safaei et al. Adaptive model-free control for robotic manipulators
Van Tran et al. Artificial chemical reaction optimization algorithm and neural network based adaptive control for robot manipulator
CN115981149B (zh) 基于安全强化学习的高超声速飞行器最优控制方法
CN109176529B (zh) 一种空间机器人协调运动的自适应模糊控制方法
CN113900377B (zh) 双转子气动系统点对点迭代学习最小能量控制方法
CN116047888A (zh) 一种基于bp神经网络pid的自平衡车的控制方法
Yin et al. Adaptive decision and robust control under parallel precedence constraints in human strategy modeling
Jiang et al. Fast and smooth composite local learning-based adaptive control
Chen et al. Neural network compensator-based robust iterative learning control scheme for mobile robots nonlinear systems with disturbances and uncertain parameters
Pandey et al. Learning koopman operators with control using bi-level optimization
CN117484499B (zh) 一种机械臂鲁棒轨迹跟踪的scara机器人
JPH0736505A (ja) 制御対象の同定・制御方法
CN114167728B (zh) 带有死区约束的多智能体系统的自适应控制方法及装置
Byeon et al. PPO-based Model Reference Tracking Control for a Quadrotor UAV
Andropov et al. Synthesis of neurocontroller for multirotor unmanned aerial vehicle based on neuroemulator

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant