CN112318505A - 一种移动机器人变批次长度迭代学习优化控制方法 - Google Patents
一种移动机器人变批次长度迭代学习优化控制方法 Download PDFInfo
- Publication number
- CN112318505A CN112318505A CN202011171545.0A CN202011171545A CN112318505A CN 112318505 A CN112318505 A CN 112318505A CN 202011171545 A CN202011171545 A CN 202011171545A CN 112318505 A CN112318505 A CN 112318505A
- Authority
- CN
- China
- Prior art keywords
- input
- batch
- mobile robot
- length
- constraint
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J9/00—Programme-controlled manipulators
- B25J9/16—Programme controls
- B25J9/1628—Programme controls characterised by the control loop
- B25J9/163—Programme controls characterised by the control loop learning, adaptive, model based, rule based expert control
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J9/00—Programme-controlled manipulators
- B25J9/16—Programme controls
- B25J9/1602—Programme controls characterised by the control system, structure, architecture
- B25J9/1607—Calculation of inertia, jacobian matrixes and inverses
Landscapes
- Engineering & Computer Science (AREA)
- Robotics (AREA)
- Mechanical Engineering (AREA)
- Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Automation & Control Theory (AREA)
- Feedback Control In General (AREA)
Abstract
本发明公开了一种移动机器人变批次长度迭代学习优化控制方法,涉及移动机器人优化控制领域;该方法基于提升技术将重复运行的移动机器人系统转换为时间序列的输入输出矩阵模型,并通过随机变量将变批次长度问题建立为批次长度随机变化模型;针对系统出现的批次长度变化情况,采用优化的思想设计迭代学习优化控制算法,并基于性能指标函数得到批次长度变化下迭代学习优化控制算法的前馈形式;基于逐次投影框架,证明了存在及不存在输入约束时所设计的迭代学习优化控制算法在数学期望意义下的收敛性。该方法解决了变批次长度下移动机器人系统的跟踪控制问题,同时考虑输入受约束的情况,从而实现对期望轨迹的高精度跟踪。
Description
技术领域
本发明涉及移动机器人优化控制领域,尤其是一种移动机器人变批次长度迭代学习优化控制方法。
背景技术
移动机器人可通过移动来完成一些繁重、危险、重复的任务,如地雷探测、海底探测、无人驾驶等,在工业、医疗、国防等很多领域都有实用价值。移动机器人有很多种,最常见的是在地面上依靠轮子移动的机器人。
移动机器人在执行重复过程任务时,受限于某些输出约束或在运行轨迹上出现障碍,不同批次的持续时长可能是变化的。比如移动机器人的位姿角被约束在一定输出范围内运行时,当移动机器人转动角度超出该限制范围,移动机器人将中断运行;又或者在某一批次中运行轨迹中出现障碍,使得移动机器人受迫停下,这些都会导致出现批次长度变化的情况。
批次长度变化问题的常用解决思路是设定一个期望的批次长度,在实际应用中,该期望批次长度一般设为可能出现的最大长度。若实际批次长度小于最大长度,则将该批次缺失的误差信息用零来补齐,那么批次长度变化问题就可以用常规的迭代学习控制(Iterative learning control,ILC)方法来解决。常规的ILC解决批次长度变化问题一般有两种:其一为采用高阶迭代学习控制方法,使用以往批次的误差及输入信息来更新输入信号,从而增强对于批次长度随机变化的鲁棒性。值得一提的是,一阶迭代学习控制律对于批次长度变化问题也具有较强的鲁棒性;其二为采用自适应迭代学习控制方法,在某次迭代过程中,先根据输出误差对系统的未知参数进行学习,再根据这些参数估计值更新系统的输入信号。然而,常规的ILC方法在处理批次长度变化问题时,由于批次长度的随机性,其收敛速度及单调性并不能得到良好保证。
优化ILC方法是一种将优化思想与ILC相结合的高性能控制方法,针对上述批次长度可变问题,优化ILC方法应运而生。
发明内容
本发明人针对上述问题及技术需求,提出了一种移动机器人变批次长度迭代学习优化控制方法,利用优化的思想来解决批次长度可变问题,通过引入逐次投影算法的思想来设计优化算法,并采用前馈结构来构造控制律,得到了单调收敛特性及更快的收敛速度,提升了系统对于批次长度可变情况的跟踪性能表现。
本发明的技术方案如下:
单机械臂变批次长度迭代学习优化控制方法,包括如下步骤:
建立双后轮独立驱动刚性移动机器人控制系统的动态模型;构建双后轮独立驱动刚性移动机器人控制系统的离散状态空间方程;利用随机变量建立批次长度随机变化模型;设计批次长度可变的迭代学习轨迹跟踪优化算法;分析批次长度可变的迭代学习轨迹跟踪优化算法的收敛性;在输入约束下设计批次长度可变的迭代学习轨迹跟踪优化算法;分析输入约束下的批次长度可变的迭代学习轨迹跟踪优化算法的收敛性;实现批次长度可变的移动机器人控制系统在有输入约束情形下的轨迹跟踪;
第一步、建立双后轮独立驱动刚性移动机器人控制系统的动态模型:
双后轮独立驱动刚性移动机器人通过两个后轮的不同速度来控制移动机器人的速度和航向,在固定平面内设置绝对坐标XOY,假设双后轮独立驱动刚性移动机器人在固定平面内移动,移动机器人的实际物理模型如下:
其中,v表示移动机器人的线速度,θ表示移动机器人的位姿角,ur和ul分别表示右轮和左轮的驱动控制输入,c表示黏性摩擦系数,k表示驱动增益,M1表示移动机器人的质量,Iw表示车轮的转动惯量,Iv表示绕机器人重心的转动惯量,r表示车轮半径,l表示左右轮到机器人重心的距离;
第二步、构建双后轮独立驱动刚性移动机器人控制系统的离散状态空间方程:
将移动机器人的线速度、位姿角和位姿角导数定义为状态变量:定义输入变量为驱动控制输入:u=[ur ul]T,输出变量为移动机器人的线速度和位姿角:y=[vθ]T,则式(1)所示的移动机器人控制系统描述为:
对连续系统模型式(2)进行离散化,选取满足香农采样定理的采样周期Ts,进一步得到移动机器人控制系统的离散状态空间模型:
式中t和k分别代表采样时间和批次,批次过程的运行周期为T,且在每个重复过程周期t∈[0,T]内,取Nd个采样点;uk(t)∈Rl,yk(t)∈Rm和xk(t)∈Rn分别是移动机器人控制系统第k批次t时刻的l维输入、m维输出和n个状态向量;A,B,C为式(2)对应的离散系统参数矩阵,且满足CB≠0;并且假设系统运行的初始状态在围绕期望初始状态xd(0)的小范围内随机变化,其数学期望满足E{xk(0)}=xd(0);
第三步、利用随机变量建立批次长度随机变化模型:
针对式(3)形式的线性离散系统,将其状态空间表达式转换为时间序列的输入输出矩阵模型:
yk=Guk+dk (4)
其中:
uk=[uk(0),uk(1),...,uk(Nd-1)]T
yk=[yk(1),yk(2),...,yk(Nd)]T
G是时间序列上的输入输出传递矩阵,dk是系统初始状态对输出的影响;输入Hilbert空间l2 l[0,Nd]和输出Hilbert空间l2 m[0,Nd]分别由如下内积及相关的诱导范数定义:
并且,定义期望输出yd∈l2[0,Nd]为:
yd=[yd(1) yd(2) … yd(Nd)]T (7)
传统的迭代学习控制要求批次长度固定为预期长度Nd,然而实际的运行批次长度在不同批次之间可能随机变化;记第k次迭代实际批次长度为Nk,定义实际批次长度的最小值与最大值分别为Nm和Nh;实际情况下一般将预期长度Nd设定为最大长度,即Nd=Nh;那么实际批次长度Nk在{Nm,Nm+1,…,Nd}内随机变动,即至多存在τm=Nd-Nm+1个运行批次长度;为了描述批次长度的随机性,令批次长度为Nm,Nm+1,…,Nd的概率分别为,其中pi>0,1≤i≤τm,且;
当实际批次长度Nk小于预期长度Nd时,第k批次的输出yk在时刻t∈[Nk+1,Nd]是缺失的,不能被用于输入的更新;将缺失时刻的跟踪误差简单地设置为零,从而转化成常规情况;那么得到修正后的跟踪误差为:
修正后的跟踪误差序列为:
当Nk<Nd时,ek≠yd-yk,于是引入如下随机矩阵Mk来消除该不等关系:
对于多输出系统,当其中一个输出出现提前终止的情况,其它的输出也应同时终止,即使其它输出并未终止,其产生的输出也失去了学习的价值;例如,移动机器人在预设轨迹上移动时,遇到障碍提前停止,线速度变为零,但位姿角仍在变化,然而位姿角之后的输出值失去了迭代学习的价值,因此在刻画多输出系统随机矩阵的数学期望时,可以看做各输出具有相同的数学期望;
为了计算随机矩阵Mk的数学期望,引入伯努利二元随机变量γk(t)来表示第k批次时刻t输出是否存在;记第k批次时刻t输出存在的概率为p(t),则有:
由于E{γk(t)}=P{γk(t)=1}×1+P{γk(t)=0}×0=p(t),则随机矩阵Mk的数学期望计算如下:
第四步、设计批次长度可变的迭代学习轨迹跟踪优化算法:
将批次长度随机变化的离散状态空间模型(3)作为批次长度随机变化系统,给定任意初始输入及对应的跟踪误差,通过如下定义的输入信号:
得到的输入序列{uk}k≥0能够迭代地解决批次长度随机变化下的跟踪问题,其中,M为某一批次的随机矩阵,其定义与式(10)相同,输入信号控制律的前馈形式通过求解如下定义的第一性能指标函数得到:
将式(11)和式(4)先后代入第一性能指标函数(15),求其二次型最优解,得:
E{dk-dk+1}=0 (17)
将式(17)代入式(16)得:
由于对于第k+1批次的输入,第k批次的输入信号和跟踪误差已知,其期望等于其本身,又由于GTKG+R可逆,将式(18)整理后得到控制律为:
uk+1=uk+Lek (19)
第五步、分析批次长度可变的迭代学习轨迹跟踪优化算法的收敛性:
鉴于批次长度随机变化系统迭代学习优化算法的特殊性,引入逐次投影思想对算法进行收敛性分析;批次长度随机变化下轨迹跟踪问题的设计目标是迭代地找到一个最优控制输入使得跟踪误差的期望收敛到零,这等价于迭代地在Hilbert空间中两个凸集S1和S2的交集中寻找点集合S1和集合S2定义如下:
S1={(e,u)∈H:e=E{M(yd-y)},y=Gu+d} (20)
S2={(e,u)∈H:e=0} (21)
Hilbert空间H包括跟踪误差及输入信号,其内积和相关的诱导范数由式(5)和式(6)导出:
定义投影算子如下:
其中,x为Hilbert空间H上的一个点,PS(x)表示x在集合S上的投影;
对于x=(0,u)∈S2,其在S1上的投影为:
根据逐次投影思想,使用及xk=(0,uk)分别表示对集合S1和S2第k次投影后的点,给定一个初始点x0=(0,u0)∈S2,通过控制律(19)进行连续投影能够得到沿迭代轴更新的输入序列{uk}k≥0;
由式(30)得:
第k+1次输入如式(14)所示,
根据第一性能指标函数式(15),对于其非最优解uk有:
由式(33)得:
即期望意义下的误差范数E{||ek||}单调收敛至零;
另外,为了得到权矩阵Q和R的选取范围,将控制律的前馈形式(19)代入式(33),并全部替换为与ek相关的形式,得:
将式(35)整理得到权矩阵Q和R应满足的约束条件为:
第六步、在输入约束下设计批次长度可变的迭代学习轨迹跟踪优化算法:
在许多工业过程控制应用中,为了确保工业过程安全、顺利地运行,需要对输入变量施加一定的约束,输入约束集Ω通常为凸集;输入约束集Ω一般有如下几种形式:
控制器输入的饱和约束:
Ω={u∈l2[0,Nd]:|u(t)|≤Z(t),0≤t≤Nd} (37)
其中Z(t)≥0,0≤t≤Nd是随时间变化的输入幅值约束;
控制器输入的能量约束:
其中Z>0是输入总能量约束;
控制器输入的震荡约束:
Ω={u∈l2[0,Nd]:|Δu(t)|≤Z(t),1≤t≤Nd} (39)
其中Δu(t)=u(t)-u(t-1),Z(t)≥0,0≤t≤Nd是随时间变化的执行器输入震荡约束;
当出于实际需要对输入信号进行约束时,直接求取输入约束下的二次规划QP问题是困难的,于是根据逐次投影的思想设计在实际应用中更易实现的算法;
再将其投影到输入约束集Ω:
从而得到满足输入约束的输入序列{uk∈Ω}k≥0能够迭代地解决批次长度随机变化下的跟踪问题;由于在实践中输入约束通常是逐点约束,因而需计算出优化问题(41)的解;当输入约束为饱和约束形式(37)时,对于t∈[0,Nd],优化问题(41)的解直接由如下形式给出:
第七步、分析输入约束下的批次长度可变的迭代学习轨迹跟踪优化算法的收敛性:
仍然采用逐次投影思想对输入约束下的批次长度随机变化优化算法进行收敛性分析;重新定义集合S1和S2如下:
S1={(e,u)∈H:e=E{M(yd-y)},y=Gu+d} (43)
S2={(e,u)∈H:e=0,u∈Ω} (44)
与第五步证明类似,对于x=(0,u)∈S2,其在S1上的投影为:
PS2(x)=(0,u*) (47)
针对输入约束情况,先定义第二性能指标函数:
xk与集合S1的最小距离为:
根据优化迭代学习控制律的前馈形式(19),得式(49)的优化解为:
u*=uk+Lek (50)
将式(50)代入到式(49)中,得:
同理有:
根据逐次投影引理的内容,每次投影后的抽象距离均单调减小,得到:
式(54)等价于:
那么输入约束下的最优解为:
根据优化迭代学习控制律的前馈形式(19)可知,式(56)内部的最小化问题的最优解为:
将式(57)代入到式(56)中,得:
式(58)中ek前的权重I-MkGL和L均是可逆的,那么需要最小化的性能指标是严格凸的,且输入约束集Ω也是凸的,因此该最小化问题具有唯一解,由此可得:
其中,a是一个正常数,dd由期望初始状态导出:
由式(59)得知,误差范数的期望有界收敛;
第八步、实现批次长度可变的移动机器人控制系统在有输入约束情形下的轨迹跟踪:
根据优化迭代学习控制律确定移动机器人系统每一迭代批次的输入矢量,将得到的输入矢量输入批次长度变化的移动机器人系统进行轨迹跟踪控制,移动机器人系统在批次长度变化情况下受到输入矢量的控制作用追踪期望输出。
本发明的有益技术效果是:
本申请公开了针对双后轮独立驱动刚性移动机器人控制系统此类具有重复运动特征的线性系统,将该移动机器人控制系统作为被控对象,针对被控对象出现的变批次长度情况,采用优化的思想设计迭代学习优化控制算法,并基于第一性能指标函数得到批次长度可变情况下的迭代学习优化控制算法的前馈形式,进而保证跟踪误差的单调收敛特性以及获得更快的收敛速度,提升了系统对于批次长度可变情况的跟踪性能表现。同时基于逐次投影框架,对存在及不存在输入约束时设计的迭代学习优化算法进行收敛性分析,保证了跟踪误差在数学期望意义下的收敛性。
附图说明
图1是本申请公开的移动机器人控制系统的模型框图。
图2是本申请公开的双后轮独立驱动刚性移动机器人系统的物理模型图。
图3是本申请的移动机器人控制系统的线速度和位姿角实际输出与跟踪曲线图。
图4是本申请中的无输入约束下系统线速度和位姿角跟踪误差2-范数收敛图。
图5是本申请中的移动机器人系统的位置轨迹跟踪曲线图。
图6是本申请中的输入约束下最佳跟踪可行时左右两轮电机的输入电压曲线图。
图7是本申请中的输入约束下最佳跟踪不可行时左右两轮电机的输入电压曲线图。
图8是本申请中的输入约束下最佳跟踪可行时系统线速度和位姿角跟踪误差2-范数曲线图。
图9是本申请中的输入约束下最佳跟踪不可行时系统线速度和位姿角跟踪误差2-范数曲线图。
具体实施方式
下面结合附图对本发明的具体实施方式做进一步说明。
结合图1-图9所示,请参考图1,其示出了本申请公开的双后轮独立驱动刚性移动机器人控制系统模型框图。第k批次的控制器输入为uk,作用于移动机器人两个独立的后轮驱动电机可以得到系统第k批次的实际输出yk,其与储存在期望轨迹存储器的设定期望值进行比较,结果传递给跟踪误差修正器,得到修正后的跟踪误差ek。修正后的跟踪误差精度与设定的精度值做比较,若误差精度没有达到所设定的精度则将修正后误差ek与当前控制器输入uk传递到优化迭代学习控制器生成下一批次的控制器输入uk+1,如此循环运行直至系统实际输出与期望值之间的误差达到精度要求,则停止运行,此时的控制器输入即为最优控制输入。
针对图2和式(1)所示的双后轮独立驱动刚性移动机器人实际物理模型,变量参数分别设定为:
c=0.05kg·m2/s Iw=0.005kg·m2
k=5 Iv=10kg·m2
M=200kg l=0.3m
r=0.1m
系统仿真时间设定为t=2s,采样时间设定为Ts=0.1s,则系统的离散状态空间表达式的参数矩阵分别为:
在移动机器人系统实际运行过程中,可能需要该系统跟踪某一个特定的轨迹。因此,本实施方式分别设定移动机器人的期望线速度和位姿角期望轨迹为:
vd=1m/s,θd=sin(4t)
位姿角单位为rad。令初始状态满足:
E{xk(0)}=xd(0)=[0 0 0]T
当移动机器人在运行轨迹上遇到障碍时,移动机器人的运行可能会提前终止,这就会导致实际批次长度的变化。作为一个简单的示例,令实际批次长度Nk满足离散均匀分布,且在16~20之间随机变化的随机变量,即pi=0.2。不失一般性,令初始输入u0=0,0≤t≤Nd。
选取权矩阵R=0.001I,满足式(37)。当权矩阵和R与采样点确定时,优化迭代学习控制律的前馈形式(19)中的L也随之确定。本申请的上述优化迭代学习控制器基于STM32F103RCT6芯片实现,芯片的输入为电机控制电压u,并通过电压传感器采集得到。输入信号通过调理电路进入STM32F103RCT6芯片进行存储和计算,并构建迭代学习更新律,CPU计算后得到的信号为最优控制输入信号uk+1,输入信号再经RS232通信模块作用于移动机器人控制系统,不断修正移动机器人跟踪轨迹,直到跟踪上期望轨迹。移动机器人控制系统的动态模型(1)运行时,请参考图3,其分别示出了移动机器人系统应用优化迭代学习控制律前馈形式(19)的线速度和位姿角轨迹跟踪效果图,经过一定批次k后,系统的输出值能准确跟踪到期望轨迹,并且迭代过程中间几个批次的实际运行长度均不到2s,这也显示了系统批次长度随机变化的问题假设。图4表明移动机器人线速度和位姿角的跟踪误差经过一定的迭代批次后能够收敛。请注意,此处误差的2-范数的收敛并未呈现单调形式是由于跟踪误差范数的期望形式无法获得,当前后批次长度不等时,则呈现不单调的情形。图5示出了移动机器人系统的位置轨迹跟踪轨迹图,表明系统在经过一定次数的迭代之后,能够跟踪上预设轨迹。
移动机器人系统在实际控制过程中输入可能会受到约束,这里考虑对左轮电机输入电压施加输入幅值约束。当控制输入受到约束时,根据约束强度的不同,可能会出现最优控制输入能够得到以及得不到的情况。当在输入约束下最优控制输入能够取到时,即最佳跟踪可行时,此时电机控制电压的范围可取为[-10V,20V];当在输入约束下最优控制输入取不到时,即最佳跟踪不可行时,此时电机控制电压的范围可取为[-8V,8V]。结合图6至图9所示,上述各图表明系统的输入信号在加以一定的约束条件后,无论最佳跟踪是否可行,系统依然能够完成跟踪任务,只是当最佳跟踪不可行时,系统会收敛到一个界而不是收敛到零,这也进一步验证了算法的合理性以及有效性。
本申请将迭代学习算法和优化算法相结合构造优化迭代学习控制器,采用优化的思想来解决移动机器人系统重复过程的批次长度变化的轨迹跟踪问题。此外移动机器人系统执行重复过程任务时,控制器输入信号可能会受到约束。然而不管输入是否受到约束,所提出的变批次长度迭代学习优化方法能保证移动机器人系统在出现批次长度变化情况时,依然能实现对期望轨迹的高精度跟踪。
以上所述的仅是本申请的优选实施方式,本发明不限于以上实施例。可以理解,本领域技术人员在不脱离本发明的精神和构思的前提下直接导出或联想到的其他改进和变化,均应认为包含在本发明的保护范围之内。
Claims (1)
1.一种移动机器人变批次长度迭代学习优化控制方法,其特征在于,所述方法包括:建立双后轮独立驱动刚性移动机器人控制系统的动态模型;构建所述双后轮独立驱动刚性移动机器人控制系统的离散状态空间方程;利用随机变量建立批次长度随机变化模型;设计批次长度可变的迭代学习轨迹跟踪优化算法;分析所述批次长度可变的迭代学习轨迹跟踪优化算法的收敛性;在输入约束下设计批次长度可变的迭代学习轨迹跟踪优化算法;分析所述输入约束下的批次长度可变的迭代学习轨迹跟踪优化算法的收敛性;实现批次长度可变的移动机器人控制系统在有输入约束情形下的轨迹跟踪;
第一步、建立双后轮独立驱动刚性移动机器人控制系统的动态模型:
所述双后轮独立驱动刚性移动机器人通过两个后轮的不同速度来控制移动机器人的速度和航向,在固定平面内设置绝对坐标XOY,假设所述双后轮独立驱动刚性移动机器人在所述固定平面内移动,所述移动机器人的实际物理模型如下:
其中,v表示移动机器人的线速度,θ表示移动机器人的位姿角,ur和ul分别表示右轮和左轮的驱动控制输入,c表示黏性摩擦系数,k表示驱动增益,M1表示移动机器人的质量,Iw表示车轮的转动惯量,Iv表示绕机器人重心的转动惯量,r表示车轮半径,l表示左右轮到机器人重心的距离;
第二步、构建所述双后轮独立驱动刚性移动机器人控制系统的离散状态空间方程:
将所述移动机器人的线速度、位姿角和位姿角导数定义为状态变量:定义输入变量为驱动控制输入:u=[ur ul]T,输出变量为所述移动机器人的线速度和位姿角:y=[v θ]T,则式(1)所示的移动机器人控制系统描述为:
对连续系统模型式(2)进行离散化,选取满足香农采样定理的采样周期Ts,进一步得到所述移动机器人控制系统的离散状态空间模型:
式中t和k分别代表采样时间和批次,批次过程的运行周期为T,且在每个重复过程周期t∈[0,T]内,取Nd个采样点;uk(t)∈Rl,yk(t)∈Rm和xk(t)∈Rn分别是所述移动机器人控制系统第k批次t时刻的l维输入、m维输出和n个状态向量;A,B,C为式(2)对应的离散系统参数矩阵,且满足CB≠0;并且假设系统运行的初始状态在围绕期望初始状态xd(0)的小范围内随机变化,其数学期望满足E{xk(0)}=xd(0);
第三步、利用随机变量建立批次长度随机变化模型:
针对式(3)形式的线性离散系统,将其状态空间表达式转换为时间序列的输入输出矩阵模型:
yk=Guk+dk (4)
其中:
uk=[uk(0),uk(1),...,uk(Nd-1)]T
yk=[yk(1),yk(2),...,yk(Nd)]T
并且,定义期望输出yd∈l2[0,Nd]为:
yd=[yd(1) yd(2)…yd(Nd)]T (7)
传统的迭代学习控制要求批次长度固定为预期长度Nd,然而实际的运行批次长度在不同批次之间可能随机变化;记第k次迭代实际批次长度为Nk,定义实际批次长度的最小值与最大值分别为Nm和Nh;实际情况下一般将预期长度Nd设定为最大长度,即Nd=Nh;那么实际批次长度Nk在{Nm,Nm+1,…,Nd}内随机变动,即至多存在τm=Nd-Nm+1个运行批次长度;为了描述批次长度的随机性,令批次长度为Nm,Nm+1,…,Nd的概率分别为其中pi>0,1≤i≤τm,且
当实际批次长度Nk小于预期长度Nd时,第k批次的输出yk在时刻t∈[Nk+1,Nd]是缺失的,不能被用于输入的更新;将缺失时刻的跟踪误差简单地设置为零,从而转化成常规情况;那么得到修正后的跟踪误差为:
修正后的跟踪误差序列为:
当Nk<Nd时,ek≠yd-yk,于是引入如下随机矩阵Mk来消除该不等关系:
对于多输出系统,当其中一个输出出现提前终止的情况,其它的输出也应同时终止,即使其它输出并未终止,其产生的输出也失去了学习的价值;例如,所述移动机器人在预设轨迹上移动时,遇到障碍提前停止,所述线速度变为零,但所述位姿角仍在变化,然而位姿角之后的输出值失去了迭代学习的价值,因此在刻画多输出系统随机矩阵的数学期望时,可以看做各输出具有相同的数学期望;
为了计算所述随机矩阵Mk的数学期望,引入伯努利二元随机变量γk(t)来表示第k批次时刻t输出是否存在;记第k批次时刻t输出存在的概率为p(t),则有:
由于E{γk(t)}=P{γk(t)=1}×1+P{γk(t)=0}×0=p(t),则所述随机矩阵Mk的数学期望计算如下:
第四步、设计批次长度可变的迭代学习轨迹跟踪优化算法:
将批次长度随机变化的离散状态空间模型(3)作为批次长度随机变化系统,给定任意初始输入及对应的跟踪误差,通过如下定义的输入信号:
得到的输入序列{uk}k≥0能够迭代地解决批次长度随机变化下的跟踪问题,其中,M为某一批次的随机矩阵,其定义与式(10)相同,输入信号控制律的前馈形式通过求解如下定义的第一性能指标函数得到:
将式(11)和式(4)先后代入所述第一性能指标函数(15),求其二次型最优解,得:
E{dk-dk+1}=0 (17)
将式(17)代入式(16)得:
uk+1=uk+Lek (19)
第五步、分析所述批次长度可变的迭代学习轨迹跟踪优化算法的收敛性:
鉴于批次长度随机变化系统迭代学习优化算法的特殊性,引入逐次投影思想对算法进行收敛性分析;批次长度随机变化下轨迹跟踪问题的设计目标是迭代地找到一个最优控制输入使得跟踪误差的期望收敛到零,这等价于迭代地在Hilbert空间中两个凸集S1和S2的交集中寻找点集合S1和集合S2定义如下:
S1={(e,u)∈H:e=E{M(yd-y)},y=Gu+d} (20)
S2={(e,u)∈H:e=0} (21)
Hilbert空间H包括跟踪误差及输入信号,其内积和相关的诱导范数由式(5)和式(6)导出:
定义投影算子如下:
其中,x为Hilbert空间H上的一个点,PS(x)表示x在集合S上的投影;
对于x=(0,u)∈S2,其在S1上的投影为:
根据逐次投影思想,使用及xk=(0,uk)分别表示对集合S1和S2第k次投影后的点,给定一个初始点x0=(0,u0)∈S2,通过所述控制律(19)进行连续投影能够得到沿迭代轴更新的输入序列{uk}k≥0;
由式(30)得:
第k+1次输入如式(14)所示,
根据所述第一性能指标函数式(15),对于其非最优解uk有:
由式(33)得:
E{||ek+1||}≤E{||ek||} (33)
即期望意义下的误差范数E{||ek||}单调收敛至零;
另外,为了得到所述权矩阵Q和R的选取范围,将控制律的前馈形式(19)代入式(33),并全部替换为与ek相关的形式,得:
将式(35)整理得到所述权矩阵Q和R应满足的约束条件为:
第六步、在输入约束下设计批次长度可变的迭代学习轨迹跟踪优化算法:
在许多工业过程控制应用中,为了确保工业过程安全、顺利地运行,需要对输入变量施加一定的约束,输入约束集Ω通常为凸集;所述输入约束集Ω一般有如下几种形式:
控制器输入的饱和约束:
Ω={u∈l2[0,Nd]:|u(t)|≤Z(t),0≤t≤Nd} (37)
其中Z(t)≥0,0≤t≤Nd是随时间变化的输入幅值约束;
控制器输入的能量约束:
其中Z>0是输入总能量约束;
控制器输入的震荡约束:
Ω={u∈l2[0,Nd]:|Δu(t)|≤Z(t),1≤t≤Nd} (39)
其中Δu(t)=u(t)-u(t-1),Z(t)≥0,0≤t≤Nd是随时间变化的执行器输入震荡约束;
当出于实际需要对输入信号进行约束时,直接求取输入约束下的二次规划QP问题是困难的,于是根据逐次投影的思想设计在实际应用中更易实现的算法;
再将其投影到所述输入约束集Ω:
从而得到满足输入约束的输入序列{uk∈Ω}k≥0能够迭代地解决批次长度随机变化下的跟踪问题;由于在实践中输入约束通常是逐点约束,因而需计算出优化问题(41)的解;当所述输入约束为饱和约束形式(37)时,对于t∈[0,Nd],优化问题(41)的解直接由如下形式给出:
第七步、分析所述输入约束下的批次长度可变的迭代学习轨迹跟踪优化算法的收敛性:
仍然采用所述逐次投影思想对所述输入约束下的批次长度随机变化优化算法进行收敛性分析;重新定义集合S1和S2如下:
S1={(e,u)∈H:e=E{M(yd-y)},y=Gu+d} (43)
S2={(e,u)∈H:e=0,u∈Ω} (44)
与第五步证明类似,对于x=(0,u)∈S2,其在S1上的投影为:
根据所述逐次投影思想,使用及xk=(0,uk)分别表示对集合S1和S2第k次投影后的点,给定一个初始点x0=(0,u0)∈S2,通过式(40)和式(41)进行连续投影能够得到沿迭代轴更新的输入序列{uk}k≥0;
针对输入约束情况,先定义第二性能指标函数:
xk与集合S1的最小距离为:
根据优化迭代学习控制律的前馈形式(19),得式(49)的优化解为:
u*=uk+Lek (50)
将式(50)代入到式(49)中,得:
同理有:
根据逐次投影引理的内容,每次投影后的抽象距离均单调减小,得到:
式(54)等价于:
那么输入约束下的最优解为:
根据所述优化迭代学习控制律的前馈形式(19)可知,式(56)内部的最小化问题的最优解为:
将式(57)代入到式(56)中,得:
式(58)中ek前的权重I-MkGL和L均是可逆的,那么需要最小化的性能指标是严格凸的,且所述输入约束集Ω也是凸的,因此该最小化问题具有唯一解,由此可得:
其中,a是一个正常数,dd由期望初始状态导出:
由式(59)得知,误差范数的期望有界收敛;
第八步、实现批次长度可变的移动机器人控制系统在有输入约束情形下的轨迹跟踪:
根据所述优化迭代学习控制律确定移动机器人系统每一迭代批次的输入矢量,将得到的输入矢量输入批次长度变化的移动机器人系统进行轨迹跟踪控制,移动机器人系统在批次长度变化情况下受到输入矢量的控制作用追踪期望输出。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011171545.0A CN112318505B (zh) | 2020-10-28 | 2020-10-28 | 一种移动机器人变批次长度迭代学习优化控制方法 |
PCT/CN2020/140591 WO2022088471A1 (zh) | 2020-10-28 | 2020-12-29 | 一种移动机器人变批次长度迭代学习优化控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011171545.0A CN112318505B (zh) | 2020-10-28 | 2020-10-28 | 一种移动机器人变批次长度迭代学习优化控制方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112318505A true CN112318505A (zh) | 2021-02-05 |
CN112318505B CN112318505B (zh) | 2021-11-16 |
Family
ID=74296551
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011171545.0A Active CN112318505B (zh) | 2020-10-28 | 2020-10-28 | 一种移动机器人变批次长度迭代学习优化控制方法 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN112318505B (zh) |
WO (1) | WO2022088471A1 (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112947090A (zh) * | 2021-03-23 | 2021-06-11 | 河南理工大学 | 一种dos攻击下轮式机器人数据驱动迭代学习控制方法 |
CN113352570A (zh) * | 2021-06-04 | 2021-09-07 | 华北电力大学 | 基于迭代学习模型预测控制的注塑机注射速度控制方法 |
CN113786556A (zh) * | 2021-09-17 | 2021-12-14 | 江南大学 | 足下垂功能性电刺激康复系统变长度迭代学习控制方法 |
CN114721268A (zh) * | 2022-04-08 | 2022-07-08 | 江南大学 | 注塑成型喷嘴压力鲁棒启发式迭代学习控制方法 |
CN114888797A (zh) * | 2022-05-06 | 2022-08-12 | 武汉科技大学 | 一种基于参考轨迹实时修正的机器人轨迹跟踪控制方法 |
CN116048085A (zh) * | 2023-02-03 | 2023-05-02 | 江南大学 | 一种移动机器人的故障估计和容错迭代学习控制方法 |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115047763B (zh) * | 2022-06-08 | 2023-10-13 | 国网安徽省电力有限公司天长市供电公司 | 一种多无人机系统的最小能量控制方法 |
CN116893619B (zh) * | 2023-08-29 | 2024-04-09 | 江南大学 | 一种工业机器人量化迭代学习控制方法 |
CN116909154B (zh) * | 2023-09-13 | 2023-12-08 | 武汉瀚迈科技有限公司 | 一种通过特征查表进行前馈补偿的机器人轨迹优化方法 |
CN117590766B (zh) * | 2024-01-19 | 2024-05-28 | 青岛理工大学 | 通道入口导流栏杆角度调整的控制方法和装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103631142A (zh) * | 2013-12-09 | 2014-03-12 | 天津工业大学 | 一种用于轮式机器人轨迹跟踪的迭代学习算法 |
US20160096272A1 (en) * | 2014-10-02 | 2016-04-07 | Brain Corporation | Apparatus and methods for training of robots |
CN105549598A (zh) * | 2016-02-16 | 2016-05-04 | 江南大学 | 一种二维运动移动机器人的迭代学习轨迹跟踪控制及其鲁棒优化方法 |
CN106529023A (zh) * | 2016-11-09 | 2017-03-22 | 南京工程学院 | 一种基于迭代学习的地铁列车自动运行速度控制方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8504175B2 (en) * | 2010-06-02 | 2013-08-06 | Honeywell International Inc. | Using model predictive control to optimize variable trajectories and system control |
CN106933105B (zh) * | 2017-04-24 | 2019-07-26 | 清华大学 | 受限条件下的轨迹更新综合预测迭代学习控制算法 |
CN109031958B (zh) * | 2018-10-16 | 2021-07-27 | 廊坊师范学院 | 分数阶多智能体追踪一致性的迭代学习控制方法 |
CN110221538B (zh) * | 2019-04-26 | 2021-10-01 | 华南理工大学 | 一种结合迭代学习的时间最优轨迹规划控制器及方法 |
CN110815225B (zh) * | 2019-11-15 | 2020-12-25 | 江南大学 | 电机驱动单机械臂系统的点对点迭代学习优化控制方法 |
-
2020
- 2020-10-28 CN CN202011171545.0A patent/CN112318505B/zh active Active
- 2020-12-29 WO PCT/CN2020/140591 patent/WO2022088471A1/zh active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103631142A (zh) * | 2013-12-09 | 2014-03-12 | 天津工业大学 | 一种用于轮式机器人轨迹跟踪的迭代学习算法 |
US20160096272A1 (en) * | 2014-10-02 | 2016-04-07 | Brain Corporation | Apparatus and methods for training of robots |
CN105549598A (zh) * | 2016-02-16 | 2016-05-04 | 江南大学 | 一种二维运动移动机器人的迭代学习轨迹跟踪控制及其鲁棒优化方法 |
CN106529023A (zh) * | 2016-11-09 | 2017-03-22 | 南京工程学院 | 一种基于迭代学习的地铁列车自动运行速度控制方法 |
Non-Patent Citations (2)
Title |
---|
HONGFENG TAO,ET AL.: "Finite frequency range robust iterative learning control of linear discrete system with multiple time-delays", 《JOURNAL OF THE FRANKLIN INSTITUTE》 * |
陶洪峰,等.: "离散非线性系统的迭代学习轨迹跟踪鲁棒算法优化及应用", 《信息与控制》 * |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112947090A (zh) * | 2021-03-23 | 2021-06-11 | 河南理工大学 | 一种dos攻击下轮式机器人数据驱动迭代学习控制方法 |
CN113352570A (zh) * | 2021-06-04 | 2021-09-07 | 华北电力大学 | 基于迭代学习模型预测控制的注塑机注射速度控制方法 |
CN113352570B (zh) * | 2021-06-04 | 2022-11-04 | 华北电力大学 | 基于迭代学习模型预测控制的注塑机注射速度控制方法 |
CN113786556A (zh) * | 2021-09-17 | 2021-12-14 | 江南大学 | 足下垂功能性电刺激康复系统变长度迭代学习控制方法 |
CN113786556B (zh) * | 2021-09-17 | 2024-05-10 | 江南大学 | 足下垂功能性电刺激康复系统变长度迭代学习控制方法 |
CN114721268A (zh) * | 2022-04-08 | 2022-07-08 | 江南大学 | 注塑成型喷嘴压力鲁棒启发式迭代学习控制方法 |
CN114888797A (zh) * | 2022-05-06 | 2022-08-12 | 武汉科技大学 | 一种基于参考轨迹实时修正的机器人轨迹跟踪控制方法 |
CN114888797B (zh) * | 2022-05-06 | 2023-11-24 | 武汉科技大学 | 一种基于参考轨迹实时修正的机器人轨迹跟踪控制方法 |
CN116048085A (zh) * | 2023-02-03 | 2023-05-02 | 江南大学 | 一种移动机器人的故障估计和容错迭代学习控制方法 |
CN116048085B (zh) * | 2023-02-03 | 2023-11-07 | 江南大学 | 一种移动机器人的故障估计和容错迭代学习控制方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112318505B (zh) | 2021-11-16 |
WO2022088471A1 (zh) | 2022-05-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112318505B (zh) | 一种移动机器人变批次长度迭代学习优化控制方法 | |
Jin et al. | Robot manipulator control using neural networks: A survey | |
Fierro et al. | Control of a nonholomic mobile robot: Backstepping kinematics into dynamics | |
CN111618858B (zh) | 一种基于自适应模糊滑模的机械手鲁棒跟踪控制算法 | |
CN110815225B (zh) | 电机驱动单机械臂系统的点对点迭代学习优化控制方法 | |
CN110809505A (zh) | 用于执行机器人手臂的移动控制的方法和装置 | |
Yoo et al. | Adaptive formation tracking control of electrically driven multiple mobile robots | |
Chen | Supervisory adaptive tracking control of robot manipulators using interval type-2 TSK fuzzy logic system | |
CN115157238A (zh) | 一种多自由度机器人动力学建模和轨迹跟踪方法 | |
Boudjedir et al. | Iterative learning control of multivariable uncertain nonlinear systems with nonrepetitive trajectory | |
Polydoros et al. | Online multi-target learning of inverse dynamics models for computed-torque control of compliant manipulators | |
Zhang et al. | An adaptive approach to whole-body balance control of wheel-bipedal robot Ollie | |
Zhu et al. | A fuzzy logic-based cascade control without actuator saturation for the unmanned underwater vehicle trajectory tracking | |
Kolathaya | PD tracking for a class of underactuated robotic systems with kinetic symmetry | |
Ly et al. | A Neural Network Controller Design for the Mecanum Wheel Mobile Robot | |
Voliansky et al. | Sliding mode interval controller for the mobile robot | |
CN115047763B (zh) | 一种多无人机系统的最小能量控制方法 | |
Kawaharazuka et al. | Dynamic task control method of a flexible manipulator using a deep recurrent neural network | |
Ayça et al. | Trajectory tracking control of an industrial robot manipulator using fuzzy SMC with RBFNN | |
Chattopadhyay et al. | Control of single-segment continuum robots: reinforcement learning vs. neural network based PID | |
Peng et al. | Trajectory-tracking control for mobile robot using recurrent fuzzy cerebellar model articulation controller | |
CN113352320B (zh) | 一种基于Q学习的Baxter机械臂智能优化控制方法 | |
Zhang et al. | Hierarchical autonomous switching control of a multi-modes omnidirectional mobile robot | |
Ouamri | Computed Torque Control of a Puma 600 Robot by using Fuzzy Logic | |
Chen et al. | Trajectory-tracking for a mobile robot using robust predictive control and adaptive control |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20220106 Address after: 518000 floor 3, floor 4 and floor 5, building A1, Sunshine Industrial Park, No. 2-3, Hezhou nanpian Industrial Zone, Hezhou community, Hangcheng street, Bao'an District, Shenzhen, Guangdong Patentee after: ZMOTION Corp. Address before: No. 1800 road 214122 Jiangsu Lihu Binhu District City of Wuxi Province Patentee before: Jiangnan University |
|
TR01 | Transfer of patent right |