CN112318505A - 一种移动机器人变批次长度迭代学习优化控制方法 - Google Patents

一种移动机器人变批次长度迭代学习优化控制方法 Download PDF

Info

Publication number
CN112318505A
CN112318505A CN202011171545.0A CN202011171545A CN112318505A CN 112318505 A CN112318505 A CN 112318505A CN 202011171545 A CN202011171545 A CN 202011171545A CN 112318505 A CN112318505 A CN 112318505A
Authority
CN
China
Prior art keywords
input
batch
mobile robot
length
constraint
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011171545.0A
Other languages
English (en)
Other versions
CN112318505B (zh
Inventor
陶洪峰
庄志和
黄彦德
官上雷
胡计昶
陶新悦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZMOTION Corp.
Original Assignee
Jiangnan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangnan University filed Critical Jiangnan University
Priority to CN202011171545.0A priority Critical patent/CN112318505B/zh
Priority to PCT/CN2020/140591 priority patent/WO2022088471A1/zh
Publication of CN112318505A publication Critical patent/CN112318505A/zh
Application granted granted Critical
Publication of CN112318505B publication Critical patent/CN112318505B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1628Programme controls characterised by the control loop
    • B25J9/163Programme controls characterised by the control loop learning, adaptive, model based, rule based expert control
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1602Programme controls characterised by the control system, structure, architecture
    • B25J9/1607Calculation of inertia, jacobian matrixes and inverses

Landscapes

  • Engineering & Computer Science (AREA)
  • Robotics (AREA)
  • Mechanical Engineering (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明公开了一种移动机器人变批次长度迭代学习优化控制方法,涉及移动机器人优化控制领域;该方法基于提升技术将重复运行的移动机器人系统转换为时间序列的输入输出矩阵模型,并通过随机变量将变批次长度问题建立为批次长度随机变化模型;针对系统出现的批次长度变化情况,采用优化的思想设计迭代学习优化控制算法,并基于性能指标函数得到批次长度变化下迭代学习优化控制算法的前馈形式;基于逐次投影框架,证明了存在及不存在输入约束时所设计的迭代学习优化控制算法在数学期望意义下的收敛性。该方法解决了变批次长度下移动机器人系统的跟踪控制问题,同时考虑输入受约束的情况,从而实现对期望轨迹的高精度跟踪。

Description

一种移动机器人变批次长度迭代学习优化控制方法
技术领域
本发明涉及移动机器人优化控制领域,尤其是一种移动机器人变批次长度迭代学习优化控制方法。
背景技术
移动机器人可通过移动来完成一些繁重、危险、重复的任务,如地雷探测、海底探测、无人驾驶等,在工业、医疗、国防等很多领域都有实用价值。移动机器人有很多种,最常见的是在地面上依靠轮子移动的机器人。
移动机器人在执行重复过程任务时,受限于某些输出约束或在运行轨迹上出现障碍,不同批次的持续时长可能是变化的。比如移动机器人的位姿角被约束在一定输出范围内运行时,当移动机器人转动角度超出该限制范围,移动机器人将中断运行;又或者在某一批次中运行轨迹中出现障碍,使得移动机器人受迫停下,这些都会导致出现批次长度变化的情况。
批次长度变化问题的常用解决思路是设定一个期望的批次长度,在实际应用中,该期望批次长度一般设为可能出现的最大长度。若实际批次长度小于最大长度,则将该批次缺失的误差信息用零来补齐,那么批次长度变化问题就可以用常规的迭代学习控制(Iterative learning control,ILC)方法来解决。常规的ILC解决批次长度变化问题一般有两种:其一为采用高阶迭代学习控制方法,使用以往批次的误差及输入信息来更新输入信号,从而增强对于批次长度随机变化的鲁棒性。值得一提的是,一阶迭代学习控制律对于批次长度变化问题也具有较强的鲁棒性;其二为采用自适应迭代学习控制方法,在某次迭代过程中,先根据输出误差对系统的未知参数进行学习,再根据这些参数估计值更新系统的输入信号。然而,常规的ILC方法在处理批次长度变化问题时,由于批次长度的随机性,其收敛速度及单调性并不能得到良好保证。
优化ILC方法是一种将优化思想与ILC相结合的高性能控制方法,针对上述批次长度可变问题,优化ILC方法应运而生。
发明内容
本发明人针对上述问题及技术需求,提出了一种移动机器人变批次长度迭代学习优化控制方法,利用优化的思想来解决批次长度可变问题,通过引入逐次投影算法的思想来设计优化算法,并采用前馈结构来构造控制律,得到了单调收敛特性及更快的收敛速度,提升了系统对于批次长度可变情况的跟踪性能表现。
本发明的技术方案如下:
单机械臂变批次长度迭代学习优化控制方法,包括如下步骤:
建立双后轮独立驱动刚性移动机器人控制系统的动态模型;构建双后轮独立驱动刚性移动机器人控制系统的离散状态空间方程;利用随机变量建立批次长度随机变化模型;设计批次长度可变的迭代学习轨迹跟踪优化算法;分析批次长度可变的迭代学习轨迹跟踪优化算法的收敛性;在输入约束下设计批次长度可变的迭代学习轨迹跟踪优化算法;分析输入约束下的批次长度可变的迭代学习轨迹跟踪优化算法的收敛性;实现批次长度可变的移动机器人控制系统在有输入约束情形下的轨迹跟踪;
第一步、建立双后轮独立驱动刚性移动机器人控制系统的动态模型:
双后轮独立驱动刚性移动机器人通过两个后轮的不同速度来控制移动机器人的速度和航向,在固定平面内设置绝对坐标XOY,假设双后轮独立驱动刚性移动机器人在固定平面内移动,移动机器人的实际物理模型如下:
Figure BDA0002747449320000021
其中,v表示移动机器人的线速度,θ表示移动机器人的位姿角,ur和ul分别表示右轮和左轮的驱动控制输入,c表示黏性摩擦系数,k表示驱动增益,M1表示移动机器人的质量,Iw表示车轮的转动惯量,Iv表示绕机器人重心的转动惯量,r表示车轮半径,l表示左右轮到机器人重心的距离;
第二步、构建双后轮独立驱动刚性移动机器人控制系统的离散状态空间方程:
将移动机器人的线速度、位姿角和位姿角导数定义为状态变量:
Figure BDA0002747449320000022
定义输入变量为驱动控制输入:u=[ur ul]T,输出变量为移动机器人的线速度和位姿角:y=[vθ]T,则式(1)所示的移动机器人控制系统描述为:
Figure BDA0002747449320000031
其中,
Figure BDA0002747449320000032
对连续系统模型式(2)进行离散化,选取满足香农采样定理的采样周期Ts,进一步得到移动机器人控制系统的离散状态空间模型:
Figure BDA0002747449320000033
式中t和k分别代表采样时间和批次,批次过程的运行周期为T,且在每个重复过程周期t∈[0,T]内,取Nd个采样点;uk(t)∈Rl,yk(t)∈Rm和xk(t)∈Rn分别是移动机器人控制系统第k批次t时刻的l维输入、m维输出和n个状态向量;A,B,C为式(2)对应的离散系统参数矩阵,且满足CB≠0;并且假设系统运行的初始状态在围绕期望初始状态xd(0)的小范围内随机变化,其数学期望满足E{xk(0)}=xd(0);
第三步、利用随机变量建立批次长度随机变化模型:
针对式(3)形式的线性离散系统,将其状态空间表达式转换为时间序列的输入输出矩阵模型:
yk=Guk+dk (4)
其中:
Figure BDA0002747449320000034
Figure BDA0002747449320000036
uk=[uk(0),uk(1),...,uk(Nd-1)]T
yk=[yk(1),yk(2),...,yk(Nd)]T
G是时间序列上的输入输出传递矩阵,dk是系统初始状态对输出的影响;输入Hilbert空间l2 l[0,Nd]和输出Hilbert空间l2 m[0,Nd]分别由如下内积及相关的诱导范数定义:
Figure BDA0002747449320000035
Figure BDA0002747449320000041
其中,
Figure BDA0002747449320000042
分别为输入输出Hilbert空间上的向量,权矩阵R和
Figure BDA0002747449320000043
为适当维数的实正定矩阵;
并且,定义期望输出yd∈l2[0,Nd]为:
yd=[yd(1) yd(2) … yd(Nd)]T (7)
传统的迭代学习控制要求批次长度固定为预期长度Nd,然而实际的运行批次长度在不同批次之间可能随机变化;记第k次迭代实际批次长度为Nk,定义实际批次长度的最小值与最大值分别为Nm和Nh;实际情况下一般将预期长度Nd设定为最大长度,即Nd=Nh;那么实际批次长度Nk在{Nm,Nm+1,…,Nd}内随机变动,即至多存在τm=Nd-Nm+1个运行批次长度;为了描述批次长度的随机性,令批次长度为Nm,Nm+1,…,Nd的概率分别为
Figure BDA00027474493200000411
,其中pi>0,1≤i≤τm,且
Figure BDA00027474493200000410
当实际批次长度Nk小于预期长度Nd时,第k批次的输出yk在时刻t∈[Nk+1,Nd]是缺失的,不能被用于输入的更新;将缺失时刻的跟踪误差简单地设置为零,从而转化成常规情况;那么得到修正后的跟踪误差为:
Figure BDA0002747449320000044
修正后的跟踪误差序列为:
Figure BDA0002747449320000045
当Nk<Nd时,ek≠yd-yk,于是引入如下随机矩阵Mk来消除该不等关系:
Figure BDA0002747449320000046
其中INk表示Nk×Nk维的单位矩阵、Im表示m×m维的单位矩阵、
Figure BDA00027474493200000412
表示(Nd-Nk)×(Nd-Nk)维的零矩阵,
Figure BDA0002747449320000047
表示克罗内克积,于是修正后的跟踪误差序列表示为:
Figure BDA0002747449320000048
对于多输出系统,当其中一个输出出现提前终止的情况,其它的输出也应同时终止,即使其它输出并未终止,其产生的输出也失去了学习的价值;例如,移动机器人在预设轨迹上移动时,遇到障碍提前停止,线速度变为零,但位姿角仍在变化,然而位姿角之后的输出值失去了迭代学习的价值,因此在刻画多输出系统随机矩阵的数学期望时,可以看做各输出具有相同的数学期望;
为了计算随机矩阵Mk的数学期望,引入伯努利二元随机变量γk(t)来表示第k批次时刻t输出是否存在;记第k批次时刻t输出存在的概率为p(t),则有:
Figure BDA0002747449320000051
由于E{γk(t)}=P{γk(t)=1}×1+P{γk(t)=0}×0=p(t),则随机矩阵Mk的数学期望计算如下:
Figure BDA0002747449320000052
其中,用
Figure BDA0002747449320000053
来简单表示随机矩阵的期望;
第四步、设计批次长度可变的迭代学习轨迹跟踪优化算法:
将批次长度随机变化的离散状态空间模型(3)作为批次长度随机变化系统,给定任意初始输入及对应的跟踪误差,通过如下定义的输入信号:
Figure BDA0002747449320000054
得到的输入序列{uk}k≥0能够迭代地解决批次长度随机变化下的跟踪问题,其中,M为某一批次的随机矩阵,其定义与式(10)相同,输入信号控制律的前馈形式通过求解如下定义的第一性能指标函数得到:
Figure BDA0002747449320000055
将式(11)和式(4)先后代入第一性能指标函数(15),求其二次型最优解,得:
Figure BDA0002747449320000056
其中
Figure BDA0002747449320000057
根据系统初始状态的假设E{xk(0)}=xd(0)可知:
E{dk-dk+1}=0 (17)
将式(17)代入式(16)得:
Figure BDA0002747449320000058
由于对于第k+1批次的输入,第k批次的输入信号和跟踪误差已知,其期望等于其本身,又由于GTKG+R可逆,将式(18)整理后得到控制律为:
uk+1=uk+Lek (19)
其中
Figure BDA0002747449320000061
是误差项的学习增益;
第五步、分析批次长度可变的迭代学习轨迹跟踪优化算法的收敛性:
鉴于批次长度随机变化系统迭代学习优化算法的特殊性,引入逐次投影思想对算法进行收敛性分析;批次长度随机变化下轨迹跟踪问题的设计目标是迭代地找到一个最优控制输入
Figure BDA0002747449320000062
使得跟踪误差的期望收敛到零,这等价于迭代地在Hilbert空间中两个凸集S1和S2的交集中寻找点
Figure BDA0002747449320000063
集合S1和集合S2定义如下:
S1={(e,u)∈H:e=E{M(yd-y)},y=Gu+d} (20)
S2={(e,u)∈H:e=0} (21)
其中,集合S1表示系统动态,集合S2表示跟踪需求;假设集合S1和S2在Hilbert空间中存在交集,即
Figure BDA0002747449320000064
Hilbert空间H定义如下:
Figure BDA0002747449320000065
Hilbert空间H包括跟踪误差及输入信号,其内积和相关的诱导范数由式(5)和式(6)导出:
Figure BDA0002747449320000066
其中,
Figure BDA0002747449320000067
分别为输入输出Hilbert空间上的向量;
定义投影算子如下:
Figure BDA0002747449320000068
Figure BDA0002747449320000069
其中,x为Hilbert空间H上的一个点,PS(x)表示x在集合S上的投影;
对于x=(0,u)∈S2,其在S1上的投影为:
Figure BDA00027474493200000610
优化问题(26)的解为
Figure BDA00027474493200000611
其中
Figure BDA00027474493200000612
那么:
Figure BDA00027474493200000613
对投影算子PS2采取相似的运算,对于
Figure BDA0002747449320000071
有:
Figure BDA0002747449320000072
优化问题(28)的解取
Figure BDA0002747449320000073
于是:
Figure BDA0002747449320000074
根据逐次投影思想,使用
Figure BDA0002747449320000075
及xk=(0,uk)分别表示对集合S1和S2第k次投影后的点,给定一个初始点x0=(0,u0)∈S2,通过控制律(19)进行连续投影能够得到沿迭代轴更新的输入序列{uk}k≥0
设集合S1和S2交于一点
Figure BDA0002747449320000076
Figure BDA0002747449320000077
由于集合S1和S2均为Hilbert空间中的有限维闭凸集,根据逐次投影引理知,序列
Figure BDA0002747449320000078
和{xk}k≥0均收敛于
Figure BDA0002747449320000079
即:
Figure BDA00027474493200000710
由式(30)得:
Figure BDA00027474493200000711
第k+1次输入如式(14)所示,
根据第一性能指标函数式(15),对于其非最优解uk有:
Figure BDA00027474493200000712
由式(33)得:
Figure BDA00027474493200000713
即期望意义下的误差范数E{||ek||}单调收敛至零;
另外,为了得到权矩阵Q和R的选取范围,将控制律的前馈形式(19)代入式(33),并全部替换为与ek相关的形式,得:
Figure BDA00027474493200000714
其中,
Figure BDA00027474493200000715
为单位矩阵,由于每个批次的误差ek均不相同,为了选取一组对任意批次误差均满足式(34)的权矩阵
Figure BDA0002747449320000081
和R,需要得到一个约束条件;对式(34)两边取范数后,得其一个必要条件:
Figure BDA0002747449320000082
将式(35)整理得到权矩阵Q和R应满足的约束条件为:
Figure BDA0002747449320000085
第六步、在输入约束下设计批次长度可变的迭代学习轨迹跟踪优化算法:
在许多工业过程控制应用中,为了确保工业过程安全、顺利地运行,需要对输入变量施加一定的约束,输入约束集Ω通常为凸集;输入约束集Ω一般有如下几种形式:
控制器输入的饱和约束:
Ω={u∈l2[0,Nd]:|u(t)|≤Z(t),0≤t≤Nd} (37)
其中Z(t)≥0,0≤t≤Nd是随时间变化的输入幅值约束;
控制器输入的能量约束:
Figure BDA0002747449320000086
其中Z>0是输入总能量约束;
控制器输入的震荡约束:
Ω={u∈l2[0,Nd]:|Δu(t)|≤Z(t),1≤t≤Nd} (39)
其中Δu(t)=u(t)-u(t-1),Z(t)≥0,0≤t≤Nd是随时间变化的执行器输入震荡约束;
当出于实际需要对输入信号进行约束时,直接求取输入约束下的二次规划QP问题是困难的,于是根据逐次投影的思想设计在实际应用中更易实现的算法;
对于批次长度随机变化系统,给定任意满足约束的初始输入及对应的跟踪误差,先通过无约束控制律的前馈形式(19)得到输入信号
Figure BDA0002747449320000087
Figure BDA0002747449320000088
再将其投影到输入约束集Ω:
Figure BDA0002747449320000089
从而得到满足输入约束的输入序列{uk∈Ω}k≥0能够迭代地解决批次长度随机变化下的跟踪问题;由于在实践中输入约束通常是逐点约束,因而需计算出优化问题(41)的解;当输入约束为饱和约束形式(37)时,对于t∈[0,Nd],优化问题(41)的解直接由如下形式给出:
Figure BDA0002747449320000091
第七步、分析输入约束下的批次长度可变的迭代学习轨迹跟踪优化算法的收敛性:
仍然采用逐次投影思想对输入约束下的批次长度随机变化优化算法进行收敛性分析;重新定义集合S1和S2如下:
S1={(e,u)∈H:e=E{M(yd-y)},y=Gu+d} (43)
S2={(e,u)∈H:e=0,u∈Ω} (44)
与第五步证明类似,对于x=(0,u)∈S2,其在S1上的投影为:
Figure BDA0002747449320000092
其中
Figure BDA0002747449320000093
是根据无约束控制律的前馈形式(19)得到的;
对于
Figure BDA0002747449320000094
其在S2上的投影
Figure BDA0002747449320000095
有:
Figure BDA0002747449320000096
S2中的
Figure BDA0002747449320000097
Figure BDA0002747449320000098
是相互独立的,也就是说可以分开进行求解,于是:
PS2(x)=(0,u*) (47)
其中
Figure BDA0002747449320000099
根据逐次投影思想,使用
Figure BDA00027474493200000910
分别表示对集合S1和S2第k次投影后的点,给定一个初始点x0=(0,u0)∈S2,通过式(40)和式(41)进行连续投影能够得到沿迭代轴更新的输入序列{uk}k≥0
当存在输入约束时,集合S1和S2可能不存在交集,所以对输入约束下的批次长度随机变化优化算法进行收敛性分析时,需要考虑
Figure BDA00027474493200000911
Figure BDA00027474493200000912
两种情况;
针对输入约束情况,先定义第二性能指标函数:
Figure BDA00027474493200000913
当S1
Figure BDA00027474493200000914
时,仍然得到式(30)和式(31);
xk与集合S1的最小距离为:
Figure BDA00027474493200000915
根据优化迭代学习控制律的前馈形式(19),得式(49)的优化解为:
u*=uk+Lek (50)
将式(50)代入到式(49)中,得:
Figure BDA0002747449320000101
同理有:
Figure BDA0002747449320000102
根据逐次投影引理的内容,每次投影后的抽象距离均单调减小,得到:
Figure BDA0002747449320000103
即第二性能指标函数
Figure BDA0002747449320000104
是单调收敛的;
Figure BDA0002747449320000105
时,首先定义
Figure BDA0002747449320000106
是两集合S1和S2取最小距离时线段的两个端点,同时这也是如下优化问题的解:
Figure BDA0002747449320000107
式(54)等价于:
Figure BDA0002747449320000108
那么输入约束下的最优解为:
Figure BDA0002747449320000109
根据优化迭代学习控制律的前馈形式(19)可知,式(56)内部的最小化问题的最优解为:
Figure BDA00027474493200001010
将式(57)代入到式(56)中,得:
Figure BDA00027474493200001011
式(58)中ek前的权重I-MkGL和L均是可逆的,那么需要最小化的性能指标是严格凸的,且输入约束集Ω也是凸的,因此该最小化问题具有唯一解,由此可得:
Figure BDA00027474493200001012
其中,a是一个正常数,dd由期望初始状态导出:
Figure BDA00027474493200001013
由式(59)得知,误差范数的期望有界收敛;
根据
Figure BDA00027474493200001014
情况下第二性能指标函数
Figure BDA00027474493200001015
单调收敛的证明,同理可证明
Figure BDA00027474493200001016
情况下第二性能指标函数
Figure BDA00027474493200001017
单调收敛;
第八步、实现批次长度可变的移动机器人控制系统在有输入约束情形下的轨迹跟踪:
根据优化迭代学习控制律确定移动机器人系统每一迭代批次的输入矢量,将得到的输入矢量输入批次长度变化的移动机器人系统进行轨迹跟踪控制,移动机器人系统在批次长度变化情况下受到输入矢量的控制作用追踪期望输出。
本发明的有益技术效果是:
本申请公开了针对双后轮独立驱动刚性移动机器人控制系统此类具有重复运动特征的线性系统,将该移动机器人控制系统作为被控对象,针对被控对象出现的变批次长度情况,采用优化的思想设计迭代学习优化控制算法,并基于第一性能指标函数得到批次长度可变情况下的迭代学习优化控制算法的前馈形式,进而保证跟踪误差的单调收敛特性以及获得更快的收敛速度,提升了系统对于批次长度可变情况的跟踪性能表现。同时基于逐次投影框架,对存在及不存在输入约束时设计的迭代学习优化算法进行收敛性分析,保证了跟踪误差在数学期望意义下的收敛性。
附图说明
图1是本申请公开的移动机器人控制系统的模型框图。
图2是本申请公开的双后轮独立驱动刚性移动机器人系统的物理模型图。
图3是本申请的移动机器人控制系统的线速度和位姿角实际输出与跟踪曲线图。
图4是本申请中的无输入约束下系统线速度和位姿角跟踪误差2-范数收敛图。
图5是本申请中的移动机器人系统的位置轨迹跟踪曲线图。
图6是本申请中的输入约束下最佳跟踪可行时左右两轮电机的输入电压曲线图。
图7是本申请中的输入约束下最佳跟踪不可行时左右两轮电机的输入电压曲线图。
图8是本申请中的输入约束下最佳跟踪可行时系统线速度和位姿角跟踪误差2-范数曲线图。
图9是本申请中的输入约束下最佳跟踪不可行时系统线速度和位姿角跟踪误差2-范数曲线图。
具体实施方式
下面结合附图对本发明的具体实施方式做进一步说明。
结合图1-图9所示,请参考图1,其示出了本申请公开的双后轮独立驱动刚性移动机器人控制系统模型框图。第k批次的控制器输入为uk,作用于移动机器人两个独立的后轮驱动电机可以得到系统第k批次的实际输出yk,其与储存在期望轨迹存储器的设定期望值进行比较,结果传递给跟踪误差修正器,得到修正后的跟踪误差ek。修正后的跟踪误差精度与设定的精度值做比较,若误差精度没有达到所设定的精度则将修正后误差ek与当前控制器输入uk传递到优化迭代学习控制器生成下一批次的控制器输入uk+1,如此循环运行直至系统实际输出与期望值之间的误差达到精度要求,则停止运行,此时的控制器输入即为最优控制输入。
针对图2和式(1)所示的双后轮独立驱动刚性移动机器人实际物理模型,变量参数分别设定为:
c=0.05kg·m2/s Iw=0.005kg·m2
k=5 Iv=10kg·m2
M=200kg l=0.3m
r=0.1m
系统仿真时间设定为t=2s,采样时间设定为Ts=0.1s,则系统的离散状态空间表达式的参数矩阵分别为:
Figure BDA0002747449320000121
在移动机器人系统实际运行过程中,可能需要该系统跟踪某一个特定的轨迹。因此,本实施方式分别设定移动机器人的期望线速度和位姿角期望轨迹为:
vd=1m/s,θd=sin(4t)
位姿角单位为rad。令初始状态满足:
E{xk(0)}=xd(0)=[0 0 0]T
当移动机器人在运行轨迹上遇到障碍时,移动机器人的运行可能会提前终止,这就会导致实际批次长度的变化。作为一个简单的示例,令实际批次长度Nk满足离散均匀分布,且在16~20之间随机变化的随机变量,即pi=0.2。不失一般性,令初始输入u0=0,0≤t≤Nd
选取权矩阵
Figure BDA0002747449320000122
R=0.001I,满足式(37)。当权矩阵
Figure BDA0002747449320000123
和R与采样点确定时,优化迭代学习控制律的前馈形式(19)中的L也随之确定。本申请的上述优化迭代学习控制器基于STM32F103RCT6芯片实现,芯片的输入为电机控制电压u,并通过电压传感器采集得到。输入信号通过调理电路进入STM32F103RCT6芯片进行存储和计算,并构建迭代学习更新律,CPU计算后得到的信号为最优控制输入信号uk+1,输入信号再经RS232通信模块作用于移动机器人控制系统,不断修正移动机器人跟踪轨迹,直到跟踪上期望轨迹。移动机器人控制系统的动态模型(1)运行时,请参考图3,其分别示出了移动机器人系统应用优化迭代学习控制律前馈形式(19)的线速度和位姿角轨迹跟踪效果图,经过一定批次k后,系统的输出值能准确跟踪到期望轨迹,并且迭代过程中间几个批次的实际运行长度均不到2s,这也显示了系统批次长度随机变化的问题假设。图4表明移动机器人线速度和位姿角的跟踪误差经过一定的迭代批次后能够收敛。请注意,此处误差的2-范数的收敛并未呈现单调形式是由于跟踪误差范数的期望形式无法获得,当前后批次长度不等时,则呈现不单调的情形。图5示出了移动机器人系统的位置轨迹跟踪轨迹图,表明系统在经过一定次数的迭代之后,能够跟踪上预设轨迹。
移动机器人系统在实际控制过程中输入可能会受到约束,这里考虑对左轮电机输入电压施加输入幅值约束。当控制输入受到约束时,根据约束强度的不同,可能会出现最优控制输入能够得到以及得不到的情况。当在输入约束下最优控制输入能够取到时,即最佳跟踪可行时,此时电机控制电压的范围可取为[-10V,20V];当在输入约束下最优控制输入取不到时,即最佳跟踪不可行时,此时电机控制电压的范围可取为[-8V,8V]。结合图6至图9所示,上述各图表明系统的输入信号在加以一定的约束条件后,无论最佳跟踪是否可行,系统依然能够完成跟踪任务,只是当最佳跟踪不可行时,系统会收敛到一个界而不是收敛到零,这也进一步验证了算法的合理性以及有效性。
本申请将迭代学习算法和优化算法相结合构造优化迭代学习控制器,采用优化的思想来解决移动机器人系统重复过程的批次长度变化的轨迹跟踪问题。此外移动机器人系统执行重复过程任务时,控制器输入信号可能会受到约束。然而不管输入是否受到约束,所提出的变批次长度迭代学习优化方法能保证移动机器人系统在出现批次长度变化情况时,依然能实现对期望轨迹的高精度跟踪。
以上所述的仅是本申请的优选实施方式,本发明不限于以上实施例。可以理解,本领域技术人员在不脱离本发明的精神和构思的前提下直接导出或联想到的其他改进和变化,均应认为包含在本发明的保护范围之内。

Claims (1)

1.一种移动机器人变批次长度迭代学习优化控制方法,其特征在于,所述方法包括:建立双后轮独立驱动刚性移动机器人控制系统的动态模型;构建所述双后轮独立驱动刚性移动机器人控制系统的离散状态空间方程;利用随机变量建立批次长度随机变化模型;设计批次长度可变的迭代学习轨迹跟踪优化算法;分析所述批次长度可变的迭代学习轨迹跟踪优化算法的收敛性;在输入约束下设计批次长度可变的迭代学习轨迹跟踪优化算法;分析所述输入约束下的批次长度可变的迭代学习轨迹跟踪优化算法的收敛性;实现批次长度可变的移动机器人控制系统在有输入约束情形下的轨迹跟踪;
第一步、建立双后轮独立驱动刚性移动机器人控制系统的动态模型:
所述双后轮独立驱动刚性移动机器人通过两个后轮的不同速度来控制移动机器人的速度和航向,在固定平面内设置绝对坐标XOY,假设所述双后轮独立驱动刚性移动机器人在所述固定平面内移动,所述移动机器人的实际物理模型如下:
Figure FDA0002747449310000011
其中,v表示移动机器人的线速度,θ表示移动机器人的位姿角,ur和ul分别表示右轮和左轮的驱动控制输入,c表示黏性摩擦系数,k表示驱动增益,M1表示移动机器人的质量,Iw表示车轮的转动惯量,Iv表示绕机器人重心的转动惯量,r表示车轮半径,l表示左右轮到机器人重心的距离;
第二步、构建所述双后轮独立驱动刚性移动机器人控制系统的离散状态空间方程:
将所述移动机器人的线速度、位姿角和位姿角导数定义为状态变量:
Figure FDA0002747449310000012
定义输入变量为驱动控制输入:u=[ur ul]T,输出变量为所述移动机器人的线速度和位姿角:y=[v θ]T,则式(1)所示的移动机器人控制系统描述为:
Figure FDA0002747449310000021
其中,
Figure FDA0002747449310000022
对连续系统模型式(2)进行离散化,选取满足香农采样定理的采样周期Ts,进一步得到所述移动机器人控制系统的离散状态空间模型:
Figure FDA0002747449310000023
式中t和k分别代表采样时间和批次,批次过程的运行周期为T,且在每个重复过程周期t∈[0,T]内,取Nd个采样点;uk(t)∈Rl,yk(t)∈Rm和xk(t)∈Rn分别是所述移动机器人控制系统第k批次t时刻的l维输入、m维输出和n个状态向量;A,B,C为式(2)对应的离散系统参数矩阵,且满足CB≠0;并且假设系统运行的初始状态在围绕期望初始状态xd(0)的小范围内随机变化,其数学期望满足E{xk(0)}=xd(0);
第三步、利用随机变量建立批次长度随机变化模型:
针对式(3)形式的线性离散系统,将其状态空间表达式转换为时间序列的输入输出矩阵模型:
yk=Guk+dk (4)
其中:
Figure FDA0002747449310000024
Figure FDA0002747449310000025
uk=[uk(0),uk(1),...,uk(Nd-1)]T
yk=[yk(1),yk(2),...,yk(Nd)]T
G是时间序列上的输入输出传递矩阵,dk是系统初始状态对输出的影响;输入Hilbert空间
Figure FDA0002747449310000026
和输出Hilbert空间
Figure FDA0002747449310000027
分别由如下内积及相关的诱导范数定义:
Figure FDA0002747449310000028
Figure FDA0002747449310000031
其中,
Figure FDA0002747449310000032
分别为输入输出Hilbert空间上的向量,权矩阵R和Q为适当维数的实正定矩阵;
并且,定义期望输出yd∈l2[0,Nd]为:
yd=[yd(1) yd(2)…yd(Nd)]T (7)
传统的迭代学习控制要求批次长度固定为预期长度Nd,然而实际的运行批次长度在不同批次之间可能随机变化;记第k次迭代实际批次长度为Nk,定义实际批次长度的最小值与最大值分别为Nm和Nh;实际情况下一般将预期长度Nd设定为最大长度,即Nd=Nh;那么实际批次长度Nk在{Nm,Nm+1,…,Nd}内随机变动,即至多存在τm=Nd-Nm+1个运行批次长度;为了描述批次长度的随机性,令批次长度为Nm,Nm+1,…,Nd的概率分别为
Figure FDA0002747449310000033
其中pi>0,1≤i≤τm,且
Figure FDA0002747449310000034
当实际批次长度Nk小于预期长度Nd时,第k批次的输出yk在时刻t∈[Nk+1,Nd]是缺失的,不能被用于输入的更新;将缺失时刻的跟踪误差简单地设置为零,从而转化成常规情况;那么得到修正后的跟踪误差为:
Figure FDA0002747449310000035
修正后的跟踪误差序列为:
Figure FDA0002747449310000036
当Nk<Nd时,ek≠yd-yk,于是引入如下随机矩阵Mk来消除该不等关系:
Figure FDA0002747449310000037
其中
Figure FDA0002747449310000038
表示Nk×Nk维的单位矩阵、Im表示m×m维的单位矩阵、
Figure FDA0002747449310000039
表示(Nd-Nk)×(Nd-Nk)维的零矩阵,
Figure FDA00027474493100000310
表示克罗内克积,于是修正后的跟踪误差序列表示为:
Figure FDA00027474493100000311
对于多输出系统,当其中一个输出出现提前终止的情况,其它的输出也应同时终止,即使其它输出并未终止,其产生的输出也失去了学习的价值;例如,所述移动机器人在预设轨迹上移动时,遇到障碍提前停止,所述线速度变为零,但所述位姿角仍在变化,然而位姿角之后的输出值失去了迭代学习的价值,因此在刻画多输出系统随机矩阵的数学期望时,可以看做各输出具有相同的数学期望;
为了计算所述随机矩阵Mk的数学期望,引入伯努利二元随机变量γk(t)来表示第k批次时刻t输出是否存在;记第k批次时刻t输出存在的概率为p(t),则有:
Figure FDA0002747449310000041
由于E{γk(t)}=P{γk(t)=1}×1+P{γk(t)=0}×0=p(t),则所述随机矩阵Mk的数学期望计算如下:
Figure FDA0002747449310000042
其中,用
Figure FDA0002747449310000043
来简单表示随机矩阵的期望;
第四步、设计批次长度可变的迭代学习轨迹跟踪优化算法:
将批次长度随机变化的离散状态空间模型(3)作为批次长度随机变化系统,给定任意初始输入及对应的跟踪误差,通过如下定义的输入信号:
Figure FDA0002747449310000044
得到的输入序列{uk}k≥0能够迭代地解决批次长度随机变化下的跟踪问题,其中,M为某一批次的随机矩阵,其定义与式(10)相同,输入信号控制律的前馈形式通过求解如下定义的第一性能指标函数得到:
Figure FDA0002747449310000045
将式(11)和式(4)先后代入所述第一性能指标函数(15),求其二次型最优解,得:
Figure FDA0002747449310000046
其中
Figure FDA0002747449310000047
根据系统初始状态的假设E{xk(0)}=xd(0)可知:
E{dk-dk+1}=0 (17)
将式(17)代入式(16)得:
Figure FDA0002747449310000048
由于对于第k+1批次的输入,第k批次的输入信号和跟踪误差已知,其期望等于其本身,又由于
Figure FDA0002747449310000051
可逆,将式(18)整理后得到控制律为:
uk+1=uk+Lek (19)
其中
Figure FDA0002747449310000052
是误差项的学习增益;
第五步、分析所述批次长度可变的迭代学习轨迹跟踪优化算法的收敛性:
鉴于批次长度随机变化系统迭代学习优化算法的特殊性,引入逐次投影思想对算法进行收敛性分析;批次长度随机变化下轨迹跟踪问题的设计目标是迭代地找到一个最优控制输入
Figure FDA0002747449310000053
使得跟踪误差的期望收敛到零,这等价于迭代地在Hilbert空间中两个凸集S1和S2的交集中寻找点
Figure FDA0002747449310000054
集合S1和集合S2定义如下:
S1={(e,u)∈H:e=E{M(yd-y)},y=Gu+d} (20)
S2={(e,u)∈H:e=0} (21)
其中,所述集合S1表示系统动态,所述集合S2表示跟踪需求;假设所述集合S1和S2在Hilbert空间中存在交集,即
Figure FDA0002747449310000055
Hilbert空间H定义如下:
Figure FDA0002747449310000056
Hilbert空间H包括跟踪误差及输入信号,其内积和相关的诱导范数由式(5)和式(6)导出:
Figure FDA0002747449310000057
其中,
Figure FDA0002747449310000058
分别为输入输出Hilbert空间上的向量;
定义投影算子如下:
Figure FDA0002747449310000059
Figure FDA00027474493100000510
其中,x为Hilbert空间H上的一个点,PS(x)表示x在集合S上的投影;
对于x=(0,u)∈S2,其在S1上的投影为:
Figure FDA00027474493100000511
优化问题(26)的解为
Figure FDA00027474493100000617
其中
Figure FDA0002747449310000062
那么:
Figure FDA0002747449310000063
对投影算子
Figure FDA0002747449310000064
采取相似的运算,对于
Figure FDA0002747449310000065
有:
Figure FDA0002747449310000066
优化问题(28)的解取
Figure FDA0002747449310000067
于是:
Figure FDA0002747449310000068
根据逐次投影思想,使用
Figure FDA0002747449310000069
及xk=(0,uk)分别表示对集合S1和S2第k次投影后的点,给定一个初始点x0=(0,u0)∈S2,通过所述控制律(19)进行连续投影能够得到沿迭代轴更新的输入序列{uk}k≥0
设所述集合S1和S2交于一点
Figure FDA00027474493100000610
Figure FDA00027474493100000611
由于所述集合S1和S2均为Hilbert空间中的有限维闭凸集,根据逐次投影引理知,序列
Figure FDA00027474493100000612
和{xk}k≥0均收敛于
Figure FDA00027474493100000613
即:
Figure FDA00027474493100000614
由式(30)得:
Figure FDA00027474493100000615
第k+1次输入如式(14)所示,
根据所述第一性能指标函数式(15),对于其非最优解uk有:
Figure FDA00027474493100000616
由式(33)得:
E{||ek+1||}≤E{||ek||} (33)
即期望意义下的误差范数E{||ek||}单调收敛至零;
另外,为了得到所述权矩阵Q和R的选取范围,将控制律的前馈形式(19)代入式(33),并全部替换为与ek相关的形式,得:
Figure FDA0002747449310000071
其中,
Figure FDA0002747449310000072
为单位矩阵,由于每个批次的误差ek均不相同,为了选取一组对任意批次误差均满足式(34)的所述权矩阵Q和R,需要得到一个约束条件;对式(34)两边取范数后,得其一个必要条件:
Figure FDA0002747449310000073
将式(35)整理得到所述权矩阵Q和R应满足的约束条件为:
Figure FDA0002747449310000074
第六步、在输入约束下设计批次长度可变的迭代学习轨迹跟踪优化算法:
在许多工业过程控制应用中,为了确保工业过程安全、顺利地运行,需要对输入变量施加一定的约束,输入约束集Ω通常为凸集;所述输入约束集Ω一般有如下几种形式:
控制器输入的饱和约束:
Ω={u∈l2[0,Nd]:|u(t)|≤Z(t),0≤t≤Nd} (37)
其中Z(t)≥0,0≤t≤Nd是随时间变化的输入幅值约束;
控制器输入的能量约束:
Figure FDA0002747449310000075
其中Z>0是输入总能量约束;
控制器输入的震荡约束:
Ω={u∈l2[0,Nd]:|Δu(t)|≤Z(t),1≤t≤Nd} (39)
其中Δu(t)=u(t)-u(t-1),Z(t)≥0,0≤t≤Nd是随时间变化的执行器输入震荡约束;
当出于实际需要对输入信号进行约束时,直接求取输入约束下的二次规划QP问题是困难的,于是根据逐次投影的思想设计在实际应用中更易实现的算法;
对于所述批次长度随机变化系统,给定任意满足约束的初始输入及对应的跟踪误差,先通过无约束控制律的前馈形式(19)得到输入信号
Figure FDA0002747449310000076
Figure FDA0002747449310000077
再将其投影到所述输入约束集Ω:
Figure FDA0002747449310000078
从而得到满足输入约束的输入序列{uk∈Ω}k≥0能够迭代地解决批次长度随机变化下的跟踪问题;由于在实践中输入约束通常是逐点约束,因而需计算出优化问题(41)的解;当所述输入约束为饱和约束形式(37)时,对于t∈[0,Nd],优化问题(41)的解直接由如下形式给出:
Figure FDA0002747449310000081
第七步、分析所述输入约束下的批次长度可变的迭代学习轨迹跟踪优化算法的收敛性:
仍然采用所述逐次投影思想对所述输入约束下的批次长度随机变化优化算法进行收敛性分析;重新定义集合S1和S2如下:
S1={(e,u)∈H:e=E{M(yd-y)},y=Gu+d} (43)
S2={(e,u)∈H:e=0,u∈Ω} (44)
与第五步证明类似,对于x=(0,u)∈S2,其在S1上的投影为:
Figure FDA0002747449310000082
其中
Figure FDA0002747449310000083
是根据所述无约束控制律的前馈形式(19)得到的;
对于
Figure FDA0002747449310000084
其在S2上的投影
Figure FDA0002747449310000085
有:
Figure FDA0002747449310000086
S2中的
Figure FDA0002747449310000087
Figure FDA0002747449310000088
是相互独立的,也就是说可以分开进行求解,于是:
Figure FDA0002747449310000089
其中
Figure FDA00027474493100000810
根据所述逐次投影思想,使用
Figure FDA00027474493100000811
及xk=(0,uk)分别表示对集合S1和S2第k次投影后的点,给定一个初始点x0=(0,u0)∈S2,通过式(40)和式(41)进行连续投影能够得到沿迭代轴更新的输入序列{uk}k≥0
当存在所述输入约束时,集合S1和S2可能不存在交集,所以对所述输入约束下的批次长度随机变化优化算法进行收敛性分析时,需要考虑
Figure FDA00027474493100000812
Figure FDA00027474493100000813
两种情况;
针对输入约束情况,先定义第二性能指标函数:
Figure FDA00027474493100000814
Figure FDA00027474493100000815
时,仍然得到式(30)和式(31);
xk与集合S1的最小距离为:
Figure FDA0002747449310000091
根据优化迭代学习控制律的前馈形式(19),得式(49)的优化解为:
u*=uk+Lek (50)
将式(50)代入到式(49)中,得:
Figure FDA0002747449310000092
同理有:
Figure FDA0002747449310000093
根据逐次投影引理的内容,每次投影后的抽象距离均单调减小,得到:
Figure FDA0002747449310000094
即所述第二性能指标函数
Figure FDA0002747449310000095
是单调收敛的;
Figure FDA0002747449310000096
时,首先定义
Figure FDA0002747449310000097
是两集合S1和S2取最小距离时线段的两个端点,同时这也是如下优化问题的解:
Figure FDA0002747449310000098
式(54)等价于:
Figure FDA0002747449310000099
那么输入约束下的最优解为:
Figure FDA00027474493100000910
根据所述优化迭代学习控制律的前馈形式(19)可知,式(56)内部的最小化问题的最优解为:
Figure FDA00027474493100000911
将式(57)代入到式(56)中,得:
Figure FDA00027474493100000912
式(58)中ek前的权重I-MkGL和L均是可逆的,那么需要最小化的性能指标是严格凸的,且所述输入约束集Ω也是凸的,因此该最小化问题具有唯一解,由此可得:
Figure FDA00027474493100000913
其中,a是一个正常数,dd由期望初始状态导出:
Figure FDA00027474493100000914
由式(59)得知,误差范数的期望有界收敛;
根据
Figure FDA0002747449310000101
情况下所述第二性能指标函数
Figure FDA0002747449310000102
单调收敛的证明,同理可证明
Figure FDA0002747449310000103
情况下所述第二性能指标函数
Figure FDA0002747449310000104
单调收敛;
第八步、实现批次长度可变的移动机器人控制系统在有输入约束情形下的轨迹跟踪:
根据所述优化迭代学习控制律确定移动机器人系统每一迭代批次的输入矢量,将得到的输入矢量输入批次长度变化的移动机器人系统进行轨迹跟踪控制,移动机器人系统在批次长度变化情况下受到输入矢量的控制作用追踪期望输出。
CN202011171545.0A 2020-10-28 2020-10-28 一种移动机器人变批次长度迭代学习优化控制方法 Active CN112318505B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202011171545.0A CN112318505B (zh) 2020-10-28 2020-10-28 一种移动机器人变批次长度迭代学习优化控制方法
PCT/CN2020/140591 WO2022088471A1 (zh) 2020-10-28 2020-12-29 一种移动机器人变批次长度迭代学习优化控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011171545.0A CN112318505B (zh) 2020-10-28 2020-10-28 一种移动机器人变批次长度迭代学习优化控制方法

Publications (2)

Publication Number Publication Date
CN112318505A true CN112318505A (zh) 2021-02-05
CN112318505B CN112318505B (zh) 2021-11-16

Family

ID=74296551

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011171545.0A Active CN112318505B (zh) 2020-10-28 2020-10-28 一种移动机器人变批次长度迭代学习优化控制方法

Country Status (2)

Country Link
CN (1) CN112318505B (zh)
WO (1) WO2022088471A1 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112947090A (zh) * 2021-03-23 2021-06-11 河南理工大学 一种dos攻击下轮式机器人数据驱动迭代学习控制方法
CN113352570A (zh) * 2021-06-04 2021-09-07 华北电力大学 基于迭代学习模型预测控制的注塑机注射速度控制方法
CN113786556A (zh) * 2021-09-17 2021-12-14 江南大学 足下垂功能性电刺激康复系统变长度迭代学习控制方法
CN114721268A (zh) * 2022-04-08 2022-07-08 江南大学 注塑成型喷嘴压力鲁棒启发式迭代学习控制方法
CN114888797A (zh) * 2022-05-06 2022-08-12 武汉科技大学 一种基于参考轨迹实时修正的机器人轨迹跟踪控制方法
CN116048085A (zh) * 2023-02-03 2023-05-02 江南大学 一种移动机器人的故障估计和容错迭代学习控制方法

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115047763B (zh) * 2022-06-08 2023-10-13 国网安徽省电力有限公司天长市供电公司 一种多无人机系统的最小能量控制方法
CN116893619B (zh) * 2023-08-29 2024-04-09 江南大学 一种工业机器人量化迭代学习控制方法
CN116909154B (zh) * 2023-09-13 2023-12-08 武汉瀚迈科技有限公司 一种通过特征查表进行前馈补偿的机器人轨迹优化方法
CN117590766B (zh) * 2024-01-19 2024-05-28 青岛理工大学 通道入口导流栏杆角度调整的控制方法和装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103631142A (zh) * 2013-12-09 2014-03-12 天津工业大学 一种用于轮式机器人轨迹跟踪的迭代学习算法
US20160096272A1 (en) * 2014-10-02 2016-04-07 Brain Corporation Apparatus and methods for training of robots
CN105549598A (zh) * 2016-02-16 2016-05-04 江南大学 一种二维运动移动机器人的迭代学习轨迹跟踪控制及其鲁棒优化方法
CN106529023A (zh) * 2016-11-09 2017-03-22 南京工程学院 一种基于迭代学习的地铁列车自动运行速度控制方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8504175B2 (en) * 2010-06-02 2013-08-06 Honeywell International Inc. Using model predictive control to optimize variable trajectories and system control
CN106933105B (zh) * 2017-04-24 2019-07-26 清华大学 受限条件下的轨迹更新综合预测迭代学习控制算法
CN109031958B (zh) * 2018-10-16 2021-07-27 廊坊师范学院 分数阶多智能体追踪一致性的迭代学习控制方法
CN110221538B (zh) * 2019-04-26 2021-10-01 华南理工大学 一种结合迭代学习的时间最优轨迹规划控制器及方法
CN110815225B (zh) * 2019-11-15 2020-12-25 江南大学 电机驱动单机械臂系统的点对点迭代学习优化控制方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103631142A (zh) * 2013-12-09 2014-03-12 天津工业大学 一种用于轮式机器人轨迹跟踪的迭代学习算法
US20160096272A1 (en) * 2014-10-02 2016-04-07 Brain Corporation Apparatus and methods for training of robots
CN105549598A (zh) * 2016-02-16 2016-05-04 江南大学 一种二维运动移动机器人的迭代学习轨迹跟踪控制及其鲁棒优化方法
CN106529023A (zh) * 2016-11-09 2017-03-22 南京工程学院 一种基于迭代学习的地铁列车自动运行速度控制方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
HONGFENG TAO,ET AL.: "Finite frequency range robust iterative learning control of linear discrete system with multiple time-delays", 《JOURNAL OF THE FRANKLIN INSTITUTE》 *
陶洪峰,等.: "离散非线性系统的迭代学习轨迹跟踪鲁棒算法优化及应用", 《信息与控制》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112947090A (zh) * 2021-03-23 2021-06-11 河南理工大学 一种dos攻击下轮式机器人数据驱动迭代学习控制方法
CN113352570A (zh) * 2021-06-04 2021-09-07 华北电力大学 基于迭代学习模型预测控制的注塑机注射速度控制方法
CN113352570B (zh) * 2021-06-04 2022-11-04 华北电力大学 基于迭代学习模型预测控制的注塑机注射速度控制方法
CN113786556A (zh) * 2021-09-17 2021-12-14 江南大学 足下垂功能性电刺激康复系统变长度迭代学习控制方法
CN113786556B (zh) * 2021-09-17 2024-05-10 江南大学 足下垂功能性电刺激康复系统变长度迭代学习控制方法
CN114721268A (zh) * 2022-04-08 2022-07-08 江南大学 注塑成型喷嘴压力鲁棒启发式迭代学习控制方法
CN114888797A (zh) * 2022-05-06 2022-08-12 武汉科技大学 一种基于参考轨迹实时修正的机器人轨迹跟踪控制方法
CN114888797B (zh) * 2022-05-06 2023-11-24 武汉科技大学 一种基于参考轨迹实时修正的机器人轨迹跟踪控制方法
CN116048085A (zh) * 2023-02-03 2023-05-02 江南大学 一种移动机器人的故障估计和容错迭代学习控制方法
CN116048085B (zh) * 2023-02-03 2023-11-07 江南大学 一种移动机器人的故障估计和容错迭代学习控制方法

Also Published As

Publication number Publication date
CN112318505B (zh) 2021-11-16
WO2022088471A1 (zh) 2022-05-05

Similar Documents

Publication Publication Date Title
CN112318505B (zh) 一种移动机器人变批次长度迭代学习优化控制方法
Jin et al. Robot manipulator control using neural networks: A survey
Fierro et al. Control of a nonholomic mobile robot: Backstepping kinematics into dynamics
CN111618858B (zh) 一种基于自适应模糊滑模的机械手鲁棒跟踪控制算法
CN110815225B (zh) 电机驱动单机械臂系统的点对点迭代学习优化控制方法
CN110809505A (zh) 用于执行机器人手臂的移动控制的方法和装置
Yoo et al. Adaptive formation tracking control of electrically driven multiple mobile robots
Chen Supervisory adaptive tracking control of robot manipulators using interval type-2 TSK fuzzy logic system
CN115157238A (zh) 一种多自由度机器人动力学建模和轨迹跟踪方法
Boudjedir et al. Iterative learning control of multivariable uncertain nonlinear systems with nonrepetitive trajectory
Polydoros et al. Online multi-target learning of inverse dynamics models for computed-torque control of compliant manipulators
Zhang et al. An adaptive approach to whole-body balance control of wheel-bipedal robot Ollie
Zhu et al. A fuzzy logic-based cascade control without actuator saturation for the unmanned underwater vehicle trajectory tracking
Kolathaya PD tracking for a class of underactuated robotic systems with kinetic symmetry
Ly et al. A Neural Network Controller Design for the Mecanum Wheel Mobile Robot
Voliansky et al. Sliding mode interval controller for the mobile robot
CN115047763B (zh) 一种多无人机系统的最小能量控制方法
Kawaharazuka et al. Dynamic task control method of a flexible manipulator using a deep recurrent neural network
Ayça et al. Trajectory tracking control of an industrial robot manipulator using fuzzy SMC with RBFNN
Chattopadhyay et al. Control of single-segment continuum robots: reinforcement learning vs. neural network based PID
Peng et al. Trajectory-tracking control for mobile robot using recurrent fuzzy cerebellar model articulation controller
CN113352320B (zh) 一种基于Q学习的Baxter机械臂智能优化控制方法
Zhang et al. Hierarchical autonomous switching control of a multi-modes omnidirectional mobile robot
Ouamri Computed Torque Control of a Puma 600 Robot by using Fuzzy Logic
Chen et al. Trajectory-tracking for a mobile robot using robust predictive control and adaptive control

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20220106

Address after: 518000 floor 3, floor 4 and floor 5, building A1, Sunshine Industrial Park, No. 2-3, Hezhou nanpian Industrial Zone, Hezhou community, Hangcheng street, Bao'an District, Shenzhen, Guangdong

Patentee after: ZMOTION Corp.

Address before: No. 1800 road 214122 Jiangsu Lihu Binhu District City of Wuxi Province

Patentee before: Jiangnan University

TR01 Transfer of patent right