CN111580392A - 一种串联倒立摆的有限频率范围鲁棒迭代学习控制方法 - Google Patents
一种串联倒立摆的有限频率范围鲁棒迭代学习控制方法 Download PDFInfo
- Publication number
- CN111580392A CN111580392A CN202010674050.3A CN202010674050A CN111580392A CN 111580392 A CN111580392 A CN 111580392A CN 202010674050 A CN202010674050 A CN 202010674050A CN 111580392 A CN111580392 A CN 111580392A
- Authority
- CN
- China
- Prior art keywords
- equation
- inverted pendulum
- matrix
- robust
- iterative learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/04—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
- G05B13/042—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Feedback Control In General (AREA)
Abstract
本发明公开了一种串联倒立摆的有限频率范围鲁棒迭代学习控制方法,涉及迭代学习控制领域,方法包括:建立串联倒立摆的状态空间方程;对原串联倒立摆的状态空间方程进行转换;根据重复过程理论设计鲁棒迭代学习控制算法;分析有限频率范围内的鲁棒迭代学习控制算法的收敛性;求解鲁棒迭代学习控制算法的控制律增益。所提算法将保证系统频域稳定并且具有鲁棒控制性能,同时在外界干扰存在时确保输出误差在时域和频域范围内的收敛性。本申请不仅考虑了单个倒立摆子系统时间和运行维度的系统特性,而且能直接应用于由多个倒立摆子系统组成的串联倒立摆系统,具有较好的控制精度,对于控制理论的验证以及具有相似结构系统的研究具有良好的应用价值。
Description
技术领域
本发明涉及迭代学习控制领域,尤其是一种串联倒立摆的有限频率范围鲁棒迭代学习控制方法。
背景技术
串联倒立摆是一个高阶次、强耦合、多变量的不稳定复杂系统,可以直观地反应非线性、稳定性和鲁棒性等控制问题,是对控制理论进行检验的一个良好装置。串联倒立摆是由若干个结构相同的倒立摆子系统串联而成,其中倒立摆子系统具有重要的工程应用背景。单级倒立摆的稳定控制在火箭飞行过程中的姿态控制中具有广泛应用。同时倒立摆与双足机器人的行走有相似性。日常生活中重心在上、支点在下的问题都与倒立摆有极大的相似性,故其稳定控制在实际中有广泛的应用,如海上钻井平台的稳定控制、卫星发射架的稳定控制、火箭姿态控制、飞机安全着陆、化工过程控制等。因此,由若干个倒立摆子系统组合而成的串联倒立摆具有很好的工程应用背景。
目前针对串联倒立摆的控制方法主要有:专家控制,模糊控制和神经网络控制等。专家控制的主体由知识库和推理机构组成,涉及到知识库的自动更新与规则自动生成,因此专家控制在实时性和信息的并行处理方面有很大的局限性。模糊控制具有较强的鲁棒性能和容错性能,但是由于其模糊的特性会导致系统的控制精度和动态品质的降低。神经网络控制具有较强的自适应能力,但是其必须要有已知的具体工程应用数据样本,同时还需要足够长的时间来进行在线或离线学习训练,因此其收敛速度缓慢。上述控制方法在系统的实时性和精确性上均存在较大局限,难以解决串联倒立摆的轨迹跟踪问题。
发明内容
本发明人针对上述问题及技术需求,提出了一种串联倒立摆的有限频率范围鲁棒迭代学习控制方法。基于提升技术将重复运行的多维串联倒立摆系统转换为等效系统,然后为了进一步表示有界扰动与系统输出误差之间的联系,设计鲁棒迭代学习控制律将被控系统转换为一类连续离散重复过程模型。基于重复过程理论,通过线性矩阵不等式表示鲁棒迭代学习控制算法。所提算法将保证系统频域稳定并且具有鲁棒控制性能,同时在外界干扰存在时确保输出误差在时域和频域范围内的收敛性。
本发明的技术方案如下:
一种串联倒立摆的有限频率范围鲁棒迭代学习控制方法,包括如下步骤:
第一步:建立串联倒立摆的状态空间方程;
其中,
式(17)中k表示迭代周期,p表示控制节点序号,t代表连续时间,串联倒立摆系统工作于t∈[0,T]的重复时间周期内;xk(p,t)∈Rn,uk(p,t)∈Rm和yk(p,t)∈Rl分别表示串联倒立摆系统第p个节点的状态、输入和输出信号;vk(p,t)∈Ri和wk(p,t)∈Rj分别表示串联倒立摆系统第p个节点的状态端外部有界扰动和输出端外部有界扰动信号,并且扰动信号可导; 和分别表示适当维数的系统矩阵;m表示摆杆质量,l表示摆杆质心到转动轴心的距离,J表示摆杆的转动惯量,M表示小车质量,a表示弹簧劲度系数,b表示小车摩擦系数;串联倒立摆系统第p个节点的状态会受到前后节点状态的影响,其中0≤p≤α-1,α表示串联倒立摆系统的总节点数,为已知的任意正整数;不失一般性,假设串联倒立摆系统满足边界条件xk(p,0)=0,并且xk(-1,t)=0,xk(α,t)=0;
第二步:对原串联倒立摆的状态空间方程进行转换;
对于原串联倒立摆的状态空间方程(17),利用提升技术,定义关于输入、输出、状态和扰动信号的超级矢量Uk(t),Yk(t),Xk(t),Vk(t),Wk(t)为如下形式:
则原串联倒立摆的状态空间方程(17)转换成等效系统:
其中,
第三步:根据重复过程理论设计鲁棒迭代学习控制算法;
定义等效系统输出跟踪误差为
ek(t)=Yr(t)-Yk(t)
其中Yr(t)为期望输出信号的超级矢量,且为连续可导的期望输出轨迹;
针对等效系统(19)设计如下形式的迭代学习控制律
Uk(t)=Uk-1(t)+ΔUk(t) (20)
在式(20)中,Uk(t)是当前周期的输入量;Uk-1(t)是前一个周期的输入量;ΔUk(t)是控制系统周期更新的修正量,为了便于分析,定义中间变量ηk(t),θk(t)和ζk(t)为
根据式(19)、式(20)和式(21)得到:
将式(20)中的迭代学习更新律定义为如下形式:
其中,
其中,
I表示单位矩阵;
重复过程模型(26)从系统误差ek-1(t)到系统误差ek(t)之间的传递函数为:
为了进一步表示系统外部有界扰动与系统输出之间的关系,将式(26)转换成如下形式的连续离散重复过程模型:
其中,
ω表示系统工作频率;
第四步:分析有限频率范围内的鲁棒迭代学习控制算法的收敛性;
本申请的控制目标是设计鲁棒迭代学习控制律使得具有外部有界扰动的等效系统(19)在有限频率范围内鲁棒稳定;首先应保证在无外部有界扰动情况下等效系统(19)的稳定性;
在无外部有界扰动情况下,重复过程稳定和误差收敛需要满足三个条件:
在无外部有界扰动情况下,重复过程模型(26)在有限频率范围内稳定和误差收敛的结论为:
对于重复过程模型(26),若存在对称正定矩阵Q>0,P>0,Z>0和W1>0使得如下线性矩阵不等式成立:
则无扰动的等效系统(19)在迭代学习更新律(24)的作用下,输出跟踪误差在低、中频段范围内沿时间和批次方向单调收敛;
对于重复过程模型(26),若存在对称正定矩阵Q>0,P>0,Z>0和W1>0,以及标量τ>0使得如下线性矩阵不等式成立:
则无扰动的等效系统(19)在迭代学习更新律(24)作用下,输出跟踪误差在高频段范围内沿时间和批次方向单调收敛;
在无扰动结论的基础上进一步扩展带有外部有界扰动的等效系统(19)在有限频率范围内鲁棒稳定且具有鲁棒性能的结论;
若连续离散重复过程模型(28)从外部有界扰动到系统输出误差之间的传递函数Gwz(s)满足
||Gwz(s)||∞<γ (34)则称连续离散重复过程模型具有鲁棒性能,γ为其性能指标,且γ取值越小,表明连续离散重复过程模型的抑制干扰的性能越好;
广义有界实引理内容为:
给定标量γ>0,对于给定系统的传递函数G(s)及其频率响应G(jω)=C(jωI-A)- 1B,以下不等式等价:
(i)频率响应不等式
(ii)线性矩阵不等式
表1 系统的频率范围
N11、N12、N21、N22需要在不同频率范围内具备不同的形式。
且式(35)又可以写成:
则得到下列等式:
根据广义有界实引理G(jω)*G(jω)<γ2,得到ρ(G(jω))<γ,由于ρ(G(jω))≤||G(jω)||∞,则得到:
||G(jω)||∞<γ
保证了连续离散重复过程系统(28)具有鲁棒性能γ;
因此对于低、中频段得到下列结论:
针对式(26)的重复过程模型,给定对称矩阵P>0,Q>0,Z>0,W1>0和W2>0以及给定标量γ>0使得式(30)和式(31)以及下列矩阵不等式成立:
则在迭代学习更新律(24)作用下,等效系统(19)在低、中频率范围内鲁棒稳定且具有鲁棒性能γ,同时输出跟踪误差沿时间和周期方向收敛;
根据广义有界实引理中N矩阵N11元素在低、中频范围内和高频范围内的取值可知,低中频段为-Q,高频段为Q,不同频段取值不同,当系统工作于高频段时N11=Q>0,相应的结论式(40)无法保证其负定,因此引入标量τ>0,取下列矩阵
则得到:
则相应高频段的结论为:
针对式(26)的重复过程模型,给定对称矩阵P>0,Q>0,Z>0,W1>0和W2>0以及给定标量τ>0和γ>0使得式(32)和式(33)以及下列矩阵不等式成立:
其中T1=N11-τW1-τW1 T,T2=N11-τW2-τW2 T;则在迭代学习更新律(24)作用下,等效系统(19)在高频率范围内鲁棒稳定且具有鲁棒性能γ,同时输出跟踪误差沿时间和周期方向收敛;
第五步:求解鲁棒迭代学习控制算法的控制律增益;
上述结论不能直接用于控制律的求解,需要进行一定的转换才能进行求解。
根据式(30)得出式(42)
运用投射引理得到如下结果:
将重复过程模型的系数矩阵(27)代入式(44)并在上式不等式左右两边乘以diag{S1 T,S1 T}、diag{S1,S1},其中S1=W1 -1,得到如下不等式:
将重复过程模型的系数矩阵式(27)代入式(31),因此得到下列不等式:
在式(31)中,不等式左右两边乘以diag{S1 T,S1 T,I,I}、diag{S1,S1,I,I},其中S1=W1 -1,得到下列不等式:
化简得到下列不等式:
将重复过程模型的系数矩阵(27)代入式(40),得到:
其中,
Γ1=N22+ATW1+W1 TA+K1 TBTW1+W1 TBK1,Γ2=-K1 TBTCTW2-ATCTW2+W1 TBK2,Γ3=N22+W2 T+W2-K2 TBTCTW2-W2 TCBK2,
在式(49)左右两边乘以diag{S1 T,S2 T,S1 T,S2 T,I,I,I}、diag{S1,S2,S1,S2,I,I,I},其中S1=W1 -1,S2=W2 -1得到
其中,
令X1=K1S1,X2=K2S2,
对于低、中频段得出下列结论:
同时相应高频段的结论为:
本发明的有益技术效果是:
本申请公开了一种串联倒立摆的有限频率范围鲁棒迭代学习控制方法,根据重复过程理论和广义有界实引理,给出确保系统稳定和具有鲁棒控制性能的充分条件并保证了输出跟踪误差在时域和频域内的收敛性,同时将该条件转换成相应的线性矩阵不等式对鲁棒迭代学习控制律进行求解,本申请不仅考虑了单个倒立摆子系统时间和运行维度的系统特性,而且能直接应用于由多个倒立摆子系统组成的串联倒立摆系统,具有较好的控制精度,对于控制理论的验证以及具有相似结构系统的研究具有良好的应用价值,同时,本申请的方法结构简单,易于工程实现。
附图说明
图1是本申请提供的串联倒立摆的迭代学习控制方法的流程图。
图2是本申请提供的串联倒立摆整体结构图。
图3是本申请提供的小车受力分析图。
图4是本申请提供的摆杆受力分析图。
图5是本申请一实施例提供的串联倒立摆系统的输出参考轨迹。
图6是本申请一实施例提供的串联倒立摆系统的输出参考轨迹频谱。
图7是本申请一实施例提供的串联倒立摆第3个子系统的输出变化曲面。
图8是本申请一实施例提供的串联倒立摆第3个子系统的输入变化曲面。
图9是本申请一实施例提供的串联倒立摆第3个子系统的误差变化曲面。
图10是本申请一实施例提供的串联倒立摆系统的均方根误差变化效果。
具体实施方式
下面结合附图对本发明的具体实施方式做进一步说明。
本申请公开了一种串联倒立摆的有限频率范围鲁棒迭代学习控制方法,其方法流程图如图1所示,串联倒立摆本身具有强耦合、非线性以及不稳定等特点,对其建立状态空间模型具有一定的难度。但是通过对系统的合理假设,将部分系统变量进行合理的近似后,就可以使用经典的牛顿力学在惯性坐标系内对串联倒立摆系统建立的状态空间模型。
在建立串联倒立摆的状态空间方程的步骤之前,方法还包括:
对串联倒立摆进行建模之前,对串联倒立摆系统作如下假设:
(1)摆体是严格的刚体,运动过程中不会变形,
(2)小车与导轨间的摩擦力与相对速度成正比,忽略空气阻力及其他摩擦力,
(3)外力对串联倒立摆系统的作用无时滞。
串联倒立摆系统包括多个通过弹簧串联的一级倒立摆,根据牛顿力学先对第p个节点的一级倒立摆单独进行动力学分析,利用隔离法将第p个节点的一级倒立摆分为小车和摆杆两个部分,对两个部分分别进行受力分析。串联倒立摆的物理量参数如表2所示。
表2 串联倒立摆系统物理量参数表
结合图2-图4所示,对小车进行受力分析,在水平方向上,由牛顿力学分析得到小车的运动方程为:
由假设得到:
对摆杆进行受力分析,在水平方向上得到:
将式(3)求导展开得到:
同时根据串联倒立摆整体结构得到:
将式(5)、式(4)和式(2)代入式(1)得到:
将式(6)化简合并得到系统第一运动方程式(7)
对摆杆进行受力分析,根据力矩平衡方程得到:
在摆杆竖直方向上受力分析得到:
展开式(9)得到:
将式(4)和式(10)代入式(8)得到系统第二运动方程式(11)
为实现串联倒立摆在平衡点附近微小的角度内重复摆动,同时对串联倒立摆系统变量进行如下近似处理:
同时:
将周期变量k和时间变量t加入第一运动方程式(7)和第二运动方程式(11)中并根据式(12)和式(13)简化得到串联倒立摆的运动方程为:
由式(14)的第一个方程得到:
将式(15)代入式(14)的第二个方程得到:
将式(16)回代式(15)的第一个方程得到:
uk(p,t)=Fk(p,t)
并在系统每个倒立摆子系统节点中引入状态端外部有界扰动vk(p,t)和输出端外部有界扰动信号wk(p,t),则得到串联倒立摆的状态空间方程:
针对式(17)所描述的串联倒立摆,选取各项结构参数值分别为:
M=1(kg),m=0.2(kg),l=0.3(m),a=1(N/m),b=0.3(N/m/sec),g=9.8(m/s2),J=0.006(kg·m2).
同时取串联倒立摆各子系统的状态初值xk(p,0)=0,uk(p,0)=0。根据式(17)系统各个参数矩阵为
设定串联倒立摆包含6个子系统节点,根据串联倒立摆系统的特点,定义每个子系统各个节点具有相同的参考轨迹,考虑分别定义每个节点摆杆摆动角度的参考轨迹为:
倒立摆的参考轨迹角度在STM32F103C8T6单片机内进行设定,参考轨迹在时域中的曲线如图5所示,绘制相应的频谱曲线如图6所示,由图6可知参考轨迹的有效谐波在0到10HZ之间全部衰减,因此可以直接选取该频段为系统运行的低频范围,即对应于系统运行的低频范围。同时,假设每个倒立摆子系统的状态端外界扰动为
vk(p,t)=0.01sin(kt),p=1,2,…,6.
以及输出端外界扰动为
wk(p,t)=0.01sin(kt),p=1,2,…,6.
给定系统的鲁棒性能指标γ=0.9,并求解式(51)、式(52)和式(53)的线性矩阵不等式可得迭代学习更新律(24)中的矩阵增益为
上述迭代学习控制器算法通过一块STM32F103C8T6芯片实现。整体系统由STM32F103C8T6单片机、MG513编码器、直流电机、倒立摆机械机构和WDD35D4角传感器等几部分组成。利用WDD35D4角传感器作为摆杆摆动角度的传感器,对摆杆倾角进行角度检测,并将检测到的实时角度模拟量传送给STM32F103C8T6单片机。STM32F103C8T6单片机进行A/D转换并实时处理,与给定参考轨迹比较并计算偏差。同时利用MG513编码器作为小车的位移传感器,对底座位置进行位置检测,将检测到的实时位置信息传送单片机内。利用摆杆角度偏差信号与小车实时位置信号构建迭代学习更新律,并通过单片机计算与上一周期的控制信号结合得到前周期的控制信号Uk(t),控制信号通过D/A转换电路,控制执行机构直流电机工作,使底座在皮带上重复执行水平运动的动作,不断修正倒立摆摆杆的输出角度,从而使串联倒立摆的摆杆能够精确跟踪上给定的期望轨迹。
由于篇幅限制此处仅给出第3个子系统状态。图7表示串联倒立摆第3个子系统的输出变化曲面,图8为串联倒立摆第3个子系统的输入变化曲面,图9为串联倒立摆第3个子系统的误差变化曲面。为进一步评价系统跟踪性能,引入性能指标:
图10表示串联倒立摆的均方根误差变化效果,在有限频率范围内设计的鲁棒迭代学习控制方案使得串联倒立摆稳定。第3个节点以及整体系统的摆角跟踪过程不受到外部有界扰动的影响,摆角的跟踪误差可以收敛到零。
以上所述的仅是本申请的优选实施方式,本发明不限于以上实施例。可以理解,本领域技术人员在不脱离本发明的精神和构思的前提下直接导出或联想到的其他改进和变化,均应认为包含在本发明的保护范围之内。
Claims (2)
1.一种串联倒立摆的有限频率范围鲁棒迭代学习控制方法,其特征在于,所述方法包括如下步骤:
第一步:建立串联倒立摆的状态空间方程;
其中,
式(17)中k表示迭代周期,p表示控制节点序号,t代表连续时间,串联倒立摆系统工作于t∈[0,T]的重复时间周期内;xk(p,t)∈Rn,uk(p,t)∈Rm和yk(p,t)∈Rl分别表示串联倒立摆系统第p个节点的状态、输入和输出信号;vk(p,t)∈Ri和wk(p,t)∈Rj分别表示串联倒立摆系统第p个节点的状态端外部有界扰动和输出端外部有界扰动信号,并且扰动信号可导; 和分别表示适当维数的系统矩阵;m表示摆杆质量,l表示摆杆质心到转动轴心的距离,J表示摆杆的转动惯量,M表示小车质量,a表示弹簧劲度系数,b表示小车摩擦系数;串联倒立摆系统第p个节点的状态会受到前后节点状态的影响,其中0≤p≤α-1,α表示串联倒立摆系统的总节点数,为已知的任意正整数;不失一般性,假设串联倒立摆系统满足边界条件xk(p,0)=0,并且xk(-1,t)=0,xk(α,t)=0;
第二步:对原串联倒立摆的状态空间方程进行转换;
对于所述原串联倒立摆的状态空间方程(17),利用提升技术,定义关于输入、输出、状态和扰动信号的超级矢量Uk(t),Yk(t),Xk(t),Vk(t),Wk(t)为如下形式:
则所述原串联倒立摆的状态空间方程(17)转换成等效系统:
其中,
第三步:根据重复过程理论设计鲁棒迭代学习控制算法;
定义所述等效系统输出跟踪误差为
ek(t)=Yr(t)-Yk(t)
其中Yr(t)为期望输出信号的超级矢量,且为连续可导的期望输出轨迹;
针对所述等效系统(19)设计如下形式的迭代学习控制律
Uk(t)=Uk-1(t)+ΔUk(t) (20)
根据式(19)、式(20)和式(21)得到:
将式(20)中的迭代学习更新律定义为如下形式:
其中,
其中,
I表示单位矩阵;
所述重复过程模型(26)从系统误差ek-1(t)到系统误差ek(t)之间的传递函数为:
为了进一步表示系统外部有界扰动与系统输出之间的关系,将式(26)转换成如下形式的连续离散重复过程模型:
其中,
ω表示系统工作频率;
第四步:分析有限频率范围内的所述鲁棒迭代学习控制算法的收敛性;
本申请的控制目标是设计鲁棒迭代学习控制律使得具有外部有界扰动的所述等效系统(19)在有限频率范围内鲁棒稳定;首先应保证在无外部有界扰动情况下所述等效系统(19)的稳定性;
在无外部有界扰动情况下,重复过程稳定和误差收敛需要满足三个条件:条件一:所述重复过程模型(26)的矩阵的所有特征值都具有严格的负实部;条件二:所述重复过程模型(26)的矩阵的谱半径严格小于1;条件三:所述重复过程模型(26)传递函数的矩阵 其特征值的模严格小于1;
在无外部有界扰动情况下,所述重复过程模型(26)在有限频率范围内稳定和误差收敛的结论为:
对于所述重复过程模型(26),若存在对称正定矩阵Q>0,P>0,Z>0和W1>0使得如下线性矩阵不等式成立:
则无扰动的等效系统(19)在所述迭代学习更新律(24)的作用下,输出跟踪误差在低、中频段范围内沿时间和批次方向单调收敛;
对于重复过程模型(26),若存在对称正定矩阵Q>0,P>0,Z>0和W1>0,以及标量τ>0使得如下线性矩阵不等式成立:
则无扰动的等效系统(19)在所述迭代学习更新律(24)作用下,输出跟踪误差在高频段范围内沿时间和批次方向单调收敛;
在无扰动结论的基础上进一步扩展带有外部有界扰动的等效系统(19)在有限频率范围内鲁棒稳定且具有鲁棒性能的结论;
若所述连续离散重复过程模型(28)从外部有界扰动到系统输出误差之间的传递函数Gwz(s)满足
||Gwz(s)||∞<γ (34)
则称所述连续离散重复过程模型具有鲁棒性能,γ为其性能指标,且γ取值越小,表明所述连续离散重复过程模型的抑制干扰的性能越好;
且式(35)又可以写成:
其次,取矩阵
则得到下列等式:
根据广义有界实引理G(jω)*G(jω)<γ2,得到ρ(G(jω))<γ,由于ρ(G(jω))≤||G(jω)||∞,则得到:
||G(jω)||∞<γ
保证了所述连续离散重复过程系统(28)具有鲁棒性能γ;
因此对于低、中频段得到下列结论:
针对式(26)所述的重复过程模型,给定对称矩阵P>0,Q>0,Z>0,W1>0和W2>0以及给定标量γ>0使得式(30)和式(31)以及下列矩阵不等式成立:
则在所述迭代学习更新律(24)作用下,所述等效系统(19)在低、中频率范围内鲁棒稳定且具有鲁棒性能γ,同时输出跟踪误差沿时间和周期方向收敛;
根据广义有界实引理中N矩阵N11元素在低、中频范围内和高频范围内的取值可知,低中频段为-Q,高频段为Q,不同频段取值不同,当系统工作于高频段时N11=Q>0,相应的结论式(40)无法保证其负定,因此引入标量τ>0,取下列矩阵
则得到:
则相应高频段的结论为:
针对式(26)所述的重复过程模型,给定对称矩阵P>0,Q>0,Z>0,W1>0和W2>0以及给定标量τ>0和γ>0使得式(32)和式(33)以及下列矩阵不等式成立:
第五步:求解所述鲁棒迭代学习控制算法的控制律增益;
根据式(30)得出式(42)
运用投射引理得到如下结果:
将所述重复过程模型的系数矩阵(27)代入式(44)并在上式不等式左右两边乘以diag{S1 T,S1 T}、diag{S1,S1},其中S1=W1 -1,得到如下不等式:
将所述重复过程模型的系数矩阵式(27)代入式(31),因此得到下列不等式:
在式(31)中,不等式左右两边乘以diag{S1 T,S1 T,I,I}、diag{S1,S1,I,I},其中S1=W1 -1,得到下列不等式:
化简得到下列不等式:
将所述重复过程模型的系数矩阵(27)代入式(40),得到:
其中,
Γ1=N22+ATW1+W1 TA+K1 TBTW1+W1 TBK1,Γ2=-K1 TBTCTW2-ATCTW2+W1 TBK2,Γ3=N22+W2 T+W2-K2 TBTCTW2-W2 TCBK2,
在式(49)左右两边乘以diag{S1 T,S2 T,S1 T,S2 T,I,I,I}、diag{S1,S2,S1,S2,I,I,I},其中S1=W1 -1,S2=W2 -1得到
其中,
令X1=K1S1,X2=K2S2,
对于低、中频段得出下列结论:
同时相应高频段的结论为:
2.根据权利要求1所述的串联倒立摆的有限频率范围鲁棒迭代学习控制方法,其特征在于,在所述建立串联倒立摆的状态空间方程的步骤之前,所述方法还包括:
对串联倒立摆进行建模之前,对所述串联倒立摆系统作如下假设:
(1)摆体是严格的刚体,运动过程中不会变形,
(2)小车与导轨间的摩擦力与相对速度成正比,忽略空气阻力及其他摩擦力,
(3)外力对所述串联倒立摆系统的作用无时滞;
所述串联倒立摆系统包括多个通过弹簧串联的一级倒立摆,根据牛顿力学先对第p个节点的一级倒立摆单独进行动力学分析,利用隔离法将第p个节点的一级倒立摆分为小车和摆杆两个部分,对所述两个部分分别进行受力分析;
对所述小车进行受力分析,在水平方向上,由牛顿力学分析得到小车的运动方程为:
在式(1)中,Lp表示第p个节点小车相对初始位置的位移,F表示作用于串联倒立摆系统上的控制力,Fp-1表示第p-1个节点对第p个节点的作用力,Fp+1表示第p+1个节点对第p个节点的作用力,FN表示摆杆与小车水平方向的相互作用力,Ff表示小车与导轨间的摩擦力;
由假设得到:
对摆杆进行受力分析,在水平方向上得到:
在式(3)中,θp表示第p个节点摆杆与竖直向上方向的夹角;
将式(3)求导展开得到:
同时根据串联倒立摆整体结构得到:
将式(5)、式(4)和式(2)代入式(1)得到:
将式(6)化简合并得到系统第一运动方程式(7)
对所述摆杆进行受力分析,根据力矩平衡方程得到:
在式(8)中,FT表示摆杆与小车竖直方向的相互作用力;
在摆杆竖直方向上受力分析得到:
在式(9)中,Gm表示摆杆的重力;
展开式(9)得到:
将式(4)和式(10)代入式(8)得到系统第二运动方程式(11)
为实现串联倒立摆在平衡点附近微小的角度内重复摆动,同时对所述串联倒立摆系统变量进行如下近似处理:
同时:
将周期变量k和时间变量t加入所述第一运动方程式(7)和所述第二运动方程式(11)中并根据式(12)和式(13)简化得到串联倒立摆的运动方程为:
由式(14)的第一个方程得到:
将式(15)代入式(14)的第二个方程得到:
将式(16)回代式(15)的第一个方程得到:
uk(p,t)=Fk(p,t)
并在系统每个倒立摆子系统节点中引入状态端外部有界扰动vk(p,t)和输出端外部有界扰动信号wk(p,t),则得到所述串联倒立摆的状态空间方程。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010674050.3A CN111580392B (zh) | 2020-07-14 | 2020-07-14 | 一种串联倒立摆的有限频率范围鲁棒迭代学习控制方法 |
PCT/CN2021/094741 WO2022012155A1 (zh) | 2020-07-14 | 2021-05-20 | 一种串联倒立摆的有限频率范围鲁棒迭代学习控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010674050.3A CN111580392B (zh) | 2020-07-14 | 2020-07-14 | 一种串联倒立摆的有限频率范围鲁棒迭代学习控制方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111580392A true CN111580392A (zh) | 2020-08-25 |
CN111580392B CN111580392B (zh) | 2021-06-15 |
Family
ID=72124031
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010674050.3A Active CN111580392B (zh) | 2020-07-14 | 2020-07-14 | 一种串联倒立摆的有限频率范围鲁棒迭代学习控制方法 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN111580392B (zh) |
WO (1) | WO2022012155A1 (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112230549A (zh) * | 2020-10-28 | 2021-01-15 | 杭州电子科技大学 | 一种基于鲁棒自适应控制器的平衡车控制方法 |
CN112327971A (zh) * | 2020-10-27 | 2021-02-05 | 江南大学 | 金属棒温度分布系统的鲁棒启发式迭代学习控制方法 |
CN112486191A (zh) * | 2020-10-28 | 2021-03-12 | 杭州电子科技大学 | 一种基于增强型误差模型的平衡车控制方法 |
WO2022012155A1 (zh) * | 2020-07-14 | 2022-01-20 | 江南大学 | 一种串联倒立摆的有限频率范围鲁棒迭代学习控制方法 |
CN114721268A (zh) * | 2022-04-08 | 2022-07-08 | 江南大学 | 注塑成型喷嘴压力鲁棒启发式迭代学习控制方法 |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114625011B (zh) * | 2022-03-23 | 2024-04-02 | 合肥工业大学 | 一种配电网无线通信可靠性的鲁棒控制方法 |
CN114559437B (zh) * | 2022-03-25 | 2023-06-27 | 合肥工业大学 | 机械手臂系统在有限频域扰动下的稳定鲁棒控制方法 |
CN114944796B (zh) * | 2022-05-20 | 2024-06-11 | 上海航天控制技术研究所 | 基于参数补偿的同轴串联系统驱动力同步协调控制方法 |
CN117250863B (zh) * | 2023-09-26 | 2024-03-08 | 天津大学 | 一种基于特征值计算的单输入单输出负虚系统判别方法 |
CN117850237B (zh) * | 2024-01-10 | 2024-06-21 | 西安工程大学 | 基于迭代学习控制的跟踪处理方法、装置、设备和介质 |
CN117951650B (zh) * | 2024-03-27 | 2024-06-21 | 湖南大学 | 融合奇异谱分析与鲁棒子空间辨识的动态称量方法及系统 |
CN118170035A (zh) * | 2024-05-16 | 2024-06-11 | 南昌大学 | 基于深度学习的自平衡机器人设计方法及系统 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008067404A2 (en) * | 2006-11-29 | 2008-06-05 | Honda Motor Co., Ltd. | Determination of foot placement for humanoid push recovery |
CN101673354A (zh) * | 2009-06-12 | 2010-03-17 | 北京工业大学 | 操作条件反射自动机及其在仿生自主学习控制中的应用 |
CN101846979A (zh) * | 2010-06-29 | 2010-09-29 | 北京航空航天大学 | 一种精确目标跟踪的超前迭代学习控制方法 |
CN104570740A (zh) * | 2015-01-21 | 2015-04-29 | 江南大学 | 一种输入饱和机械臂系统的周期自适应学习控制方法 |
CN107561929A (zh) * | 2017-07-25 | 2018-01-09 | 北京理工大学 | 一种伺服系统的无模型鲁棒自适应优化方法 |
CN109375512A (zh) * | 2018-11-20 | 2019-02-22 | 中南大学 | 基于rbf-arx模型的保证倒立摆系统闭环稳定的预测控制方法 |
CN109709802A (zh) * | 2018-12-14 | 2019-05-03 | 江南大学 | 基于迭代学习控制的有源电子梯形电路的控制方法 |
US20190228309A1 (en) * | 2018-01-25 | 2019-07-25 | The Research Foundation For The State University Of New York | Framework and methods of diverse exploration for fast and safe policy improvement |
US20190272752A1 (en) * | 2018-03-05 | 2019-09-05 | NEC Laboratories Europe GmbH | Method for robust control of a machine learning system and robust control system |
CN110221539A (zh) * | 2019-05-17 | 2019-09-10 | 江苏理工学院 | 基于线性扩张观测器的四旋翼非奇异终端滑模控制方法 |
CN111736471A (zh) * | 2020-07-14 | 2020-10-02 | 江南大学 | 一种旋转倒立摆的迭代反馈整定控制及其鲁棒优化方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111360811B (zh) * | 2018-12-26 | 2022-11-22 | 中国科学院沈阳自动化研究所 | 一种基于串联机器人的倒立摆教学系统及控制方法 |
CN110134011B (zh) * | 2019-04-23 | 2022-01-11 | 浙江工业大学 | 一种倒立摆自适应迭代学习反演控制方法 |
CN110908280B (zh) * | 2019-10-30 | 2023-01-03 | 宁波大学 | 一种小车-二级倒立摆系统优化控制方法 |
CN111580392B (zh) * | 2020-07-14 | 2021-06-15 | 江南大学 | 一种串联倒立摆的有限频率范围鲁棒迭代学习控制方法 |
-
2020
- 2020-07-14 CN CN202010674050.3A patent/CN111580392B/zh active Active
-
2021
- 2021-05-20 WO PCT/CN2021/094741 patent/WO2022012155A1/zh active Application Filing
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008067404A2 (en) * | 2006-11-29 | 2008-06-05 | Honda Motor Co., Ltd. | Determination of foot placement for humanoid push recovery |
CN101673354A (zh) * | 2009-06-12 | 2010-03-17 | 北京工业大学 | 操作条件反射自动机及其在仿生自主学习控制中的应用 |
CN101846979A (zh) * | 2010-06-29 | 2010-09-29 | 北京航空航天大学 | 一种精确目标跟踪的超前迭代学习控制方法 |
CN104570740A (zh) * | 2015-01-21 | 2015-04-29 | 江南大学 | 一种输入饱和机械臂系统的周期自适应学习控制方法 |
CN107561929A (zh) * | 2017-07-25 | 2018-01-09 | 北京理工大学 | 一种伺服系统的无模型鲁棒自适应优化方法 |
US20190228309A1 (en) * | 2018-01-25 | 2019-07-25 | The Research Foundation For The State University Of New York | Framework and methods of diverse exploration for fast and safe policy improvement |
US20190272752A1 (en) * | 2018-03-05 | 2019-09-05 | NEC Laboratories Europe GmbH | Method for robust control of a machine learning system and robust control system |
CN109375512A (zh) * | 2018-11-20 | 2019-02-22 | 中南大学 | 基于rbf-arx模型的保证倒立摆系统闭环稳定的预测控制方法 |
CN109709802A (zh) * | 2018-12-14 | 2019-05-03 | 江南大学 | 基于迭代学习控制的有源电子梯形电路的控制方法 |
CN110221539A (zh) * | 2019-05-17 | 2019-09-10 | 江苏理工学院 | 基于线性扩张观测器的四旋翼非奇异终端滑模控制方法 |
CN111736471A (zh) * | 2020-07-14 | 2020-10-02 | 江南大学 | 一种旋转倒立摆的迭代反馈整定控制及其鲁棒优化方法 |
Non-Patent Citations (2)
Title |
---|
HONGFENG TAO: "Robust Iterative Learning Control in Finite Frequency Ranges for Differential Spatially Interconnected Systems", 《CIRCUITS, SYSTEMS, AND SIGNAL PROCESSING》 * |
陶洪峰: "输出时滞双率采样系统的鲁棒迭代学习控制", 《控制与决策》 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022012155A1 (zh) * | 2020-07-14 | 2022-01-20 | 江南大学 | 一种串联倒立摆的有限频率范围鲁棒迭代学习控制方法 |
CN112327971A (zh) * | 2020-10-27 | 2021-02-05 | 江南大学 | 金属棒温度分布系统的鲁棒启发式迭代学习控制方法 |
CN112327971B (zh) * | 2020-10-27 | 2021-06-15 | 江南大学 | 金属棒温度分布系统的鲁棒启发式迭代学习控制方法 |
WO2022088857A1 (zh) * | 2020-10-27 | 2022-05-05 | 江南大学 | 金属棒温度分布系统的鲁棒启发式迭代学习控制方法 |
CN112230549A (zh) * | 2020-10-28 | 2021-01-15 | 杭州电子科技大学 | 一种基于鲁棒自适应控制器的平衡车控制方法 |
CN112486191A (zh) * | 2020-10-28 | 2021-03-12 | 杭州电子科技大学 | 一种基于增强型误差模型的平衡车控制方法 |
CN112230549B (zh) * | 2020-10-28 | 2022-06-03 | 杭州电子科技大学 | 一种基于鲁棒自适应控制器的平衡车控制方法 |
CN112486191B (zh) * | 2020-10-28 | 2022-07-01 | 杭州电子科技大学 | 一种基于增强型误差模型的平衡车控制方法 |
CN114721268A (zh) * | 2022-04-08 | 2022-07-08 | 江南大学 | 注塑成型喷嘴压力鲁棒启发式迭代学习控制方法 |
Also Published As
Publication number | Publication date |
---|---|
WO2022012155A1 (zh) | 2022-01-20 |
CN111580392B (zh) | 2021-06-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111580392B (zh) | 一种串联倒立摆的有限频率范围鲁棒迭代学习控制方法 | |
Atkeson et al. | Robot trajectory learning through practice | |
CN111596545B (zh) | 一种多输入多输出机械系统自适应容错预设性能控制方法 | |
Sun et al. | Neural network-based adaptive controller design of robotic manipulators with an observer | |
CN112904728B (zh) | 一种基于改进型趋近律的机械臂滑模控制轨迹跟踪方法 | |
Qi et al. | Stable indirect adaptive control based on discrete-time T–S fuzzy model | |
CN113183154B (zh) | 一种柔性关节机械臂的自适应反演控制方法 | |
CN112338913B (zh) | 一种多关节柔性机械臂的轨迹跟踪控制方法及系统 | |
CN114326756A (zh) | 一种考虑输入量化的自适应预设性能轨迹跟踪控制方法 | |
Polydoros et al. | Online multi-target learning of inverse dynamics models for computed-torque control of compliant manipulators | |
Safaei et al. | Adaptive model-free control for robotic manipulators | |
Van Tran et al. | Artificial chemical reaction optimization algorithm and neural network based adaptive control for robot manipulator | |
CN115981149B (zh) | 基于安全强化学习的高超声速飞行器最优控制方法 | |
CN109176529B (zh) | 一种空间机器人协调运动的自适应模糊控制方法 | |
CN113900377B (zh) | 双转子气动系统点对点迭代学习最小能量控制方法 | |
CN116047888A (zh) | 一种基于bp神经网络pid的自平衡车的控制方法 | |
Yin et al. | Adaptive decision and robust control under parallel precedence constraints in human strategy modeling | |
Jiang et al. | Fast and smooth composite local learning-based adaptive control | |
Chen et al. | Neural network compensator-based robust iterative learning control scheme for mobile robots nonlinear systems with disturbances and uncertain parameters | |
Pandey et al. | Learning koopman operators with control using bi-level optimization | |
CN117484499B (zh) | 一种机械臂鲁棒轨迹跟踪的scara机器人 | |
JPH0736505A (ja) | 制御対象の同定・制御方法 | |
CN114167728B (zh) | 带有死区约束的多智能体系统的自适应控制方法及装置 | |
Byeon et al. | PPO-based Model Reference Tracking Control for a Quadrotor UAV | |
Andropov et al. | Synthesis of neurocontroller for multirotor unmanned aerial vehicle based on neuroemulator |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |