1.一种二维运动移动机器人的迭代学习轨迹跟踪控制及其鲁棒优化方法,其特征包括:构建移动机器人离散非线性系统动力学方程;设计常规P型开闭环迭代学习控制器;鲁棒迭代学习轨迹跟踪控制算法的收敛性分析;进一步优化鲁棒迭代学习轨迹跟踪控制器;系统输出误差的鲁棒单调性分析;给出鲁棒优化迭代学习控制方案的具体实施;
第一步:构建移动机器人离散非线性系统动力学方程
二维运动移动机器人实际物理模型如式(1)所示,机器人当前位置z(t)点在广义坐标中定义为[sz(t),pz(t),θz(t)],sz(t)和pz(t)为直角坐标系下z(t)的坐标,θz(t)为机器人的方位角;当机器人的标定方向为地理坐标系的横轴正半轴时,θz(t)定义为0;移动机器人受不完全约束的影响而只能在驱动轮轴的方向运动,点z(t)的线速度和角速度定义为和
<mrow>
<mfenced open = "[" close = "]">
<mtable>
<mtr>
<mtd>
<mrow>
<msub>
<mi>s</mi>
<mi>z</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>+</mo>
<mn>1</mn>
<mo>)</mo>
</mrow>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<msub>
<mi>p</mi>
<mi>z</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>+</mo>
<mn>1</mn>
<mo>)</mo>
</mrow>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<msub>
<mi>&theta;</mi>
<mi>z</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>+</mo>
<mn>1</mn>
<mo>)</mo>
</mrow>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
<mo>=</mo>
<mfenced open = "[" close = "]">
<mtable>
<mtr>
<mtd>
<mrow>
<msub>
<mi>s</mi>
<mi>z</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<msub>
<mi>p</mi>
<mi>z</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<msub>
<mi>&theta;</mi>
<mi>z</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
<mo>+</mo>
<mi>&Delta;</mi>
<mi>T</mi>
<mfenced open = "[" close = "]">
<mtable>
<mtr>
<mtd>
<mrow>
<msub>
<mi>cos&theta;</mi>
<mi>z</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
</mrow>
</mtd>
<mtd>
<mn>0</mn>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<msub>
<mi>sin&theta;</mi>
<mi>z</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
</mrow>
</mtd>
<mtd>
<mn>0</mn>
</mtd>
</mtr>
<mtr>
<mtd>
<mn>0</mn>
</mtd>
<mtd>
<mn>1</mn>
</mtd>
</mtr>
</mtable>
</mfenced>
<mfenced open = "[" close = "]">
<mtable>
<mtr>
<mtd>
<mrow>
<msub>
<mover>
<mi>&upsi;</mi>
<mo>&OverBar;</mo>
</mover>
<mi>z</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<msub>
<mover>
<mi>&omega;</mi>
<mo>&OverBar;</mo>
</mover>
<mi>z</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>1</mn>
<mo>)</mo>
</mrow>
</mrow>
其中:ΔT为采样时间;定义状态向量x(t)=[sz(t),pz(t),θz(t)]T表示移动机器人在采样点处的s坐标量,p坐标量和角度量,其中s坐标和p坐标分别表示直角坐标系中的横轴坐标和纵轴坐标;速度向量移动机器人的输入量在点z(t)处的线速度和角速度定义为和定义变量矩阵
<mrow>
<mi>B</mi>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>,</mo>
<mi>x</mi>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mi>&Delta;</mi>
<mi>T</mi>
<mfenced open = "[" close = "]">
<mtable>
<mtr>
<mtd>
<mrow>
<msub>
<mi>cos&theta;</mi>
<mi>z</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
</mrow>
</mtd>
<mtd>
<mn>0</mn>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<msub>
<mi>sin&theta;</mi>
<mi>z</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
</mrow>
</mtd>
<mtd>
<mn>0</mn>
</mtd>
</mtr>
<mtr>
<mtd>
<mn>0</mn>
</mtd>
<mtd>
<mn>1</mn>
</mtd>
</mtr>
</mtable>
</mfenced>
<mo>;</mo>
</mrow>
考虑到二维运动移动机器人受外界状态干扰因素和输出受扰因素的影响,且系统初态与期望初值不严格一致情况,将式(1)表示为如(2)形式的状态空间方程:
<mrow>
<mfenced open = "{" close = "">
<mtable>
<mtr>
<mtd>
<mrow>
<msub>
<mi>x</mi>
<mi>k</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>+</mo>
<mn>1</mn>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mi>f</mi>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>,</mo>
<msub>
<mi>x</mi>
<mi>k</mi>
</msub>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
<mo>)</mo>
</mrow>
<mo>+</mo>
<mi>B</mi>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>,</mo>
<msub>
<mi>x</mi>
<mi>k</mi>
</msub>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
<mo>)</mo>
</mrow>
<msub>
<mi>u</mi>
<mi>k</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
<mo>+</mo>
<msub>
<mi>&omega;</mi>
<mi>k</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<msub>
<mi>y</mi>
<mi>k</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mi>g</mi>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>,</mo>
<msub>
<mi>x</mi>
<mi>k</mi>
</msub>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
<mo>)</mo>
</mrow>
<mo>+</mo>
<msub>
<mi>v</mi>
<mi>k</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>2</mn>
<mo>)</mo>
</mrow>
</mrow>
式中0≤t≤T,T为系统运动周期,xk(t)∈Rn,uk(t)∈Rr,yk(t)∈Rm分别表示移动机器人第k次运行时的状态量,控制输入量和输出量,即移动机器人在坐标系中的实际坐标、坐标及角度坐标运行轨迹;ωk(t)∈Rn,vk(t)∈Rm分别为系统第k次运行时的状态和输出干扰量,且对于任意的k>0,t∈{0,1,…,T},必然||ωk(t)||≤bω,||vk(t)||≤bv,其中bω和bv是已知的可调常数,表示干扰量信号范数有界;f(t,xk(t))和B(t,xk(t))为系统第k次运行时的非线性系统矩阵函数,f(·)、B(·)关于x满足一致全局Lipschitz条件,函数g(t,xk(t))存在状态量x的偏导数,满足上确界要求:bgx=sup||g′xk(t)(t,xk(t))||,且在不注明情况下,g′xk(t)(t,xk(t))均简写为g′xk(t);系统的初态满足条件其中xd(t)表示与给定的期望轨迹yd(t)相对应的期望状态信号,满足条件yd(t)=g(t,xd(t)),xd(0)表示xd(t)在初始时刻的期望初始状态,表示一个已知的可调常数,表示系统实际初始状态与给定的期望初始状态信号之间的偏差范围;
第二步:设计常规P型开闭环迭代学习控制器
针对非线性移动机器人系统(2)设计P型开闭环迭代学习控制律:
uk+1(t)=uk(t)+Lk+1(t)ek(t+1)+Γk+1(t)ek+1(t) (3)
式中其中Lk+1(t),Γk+1(t)为迭代学习的增益矩阵,由于实际控制器增益有界,因此其中bL和bΓ为给定的可调常数,用于限制增益矩阵的变化范围;
第三步:鲁棒迭代学习轨迹跟踪控制器收敛性分析
定义输出跟踪误差:ek(t)=yd(t)-yk(t),同时定义误差变量δxk(t)=xd(t)-xk(t),δuk(t)=ud(t)-uk(t),其中ud(t)表示使移动机器人的输出yk(t)最终完全跟踪上期望轨迹yd(t)的期望控制输入量,则:
<mrow>
<mtable>
<mtr>
<mtd>
<mrow>
<mo>|</mo>
<mo>|</mo>
<msub>
<mi>&delta;u</mi>
<mrow>
<mi>k</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
</msub>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
<mo>|</mo>
<mo>|</mo>
<mo>&le;</mo>
<mo>|</mo>
<mo>|</mo>
<mi>I</mi>
<mo>-</mo>
<msub>
<mi>L</mi>
<mrow>
<mi>k</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
</msub>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
<msubsup>
<mi>g</mi>
<mrow>
<msub>
<mover>
<mi>x</mi>
<mo>~</mo>
</mover>
<mi>k</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>k</mi>
<mo>+</mo>
<mn>1</mn>
<mo>)</mo>
</mrow>
</mrow>
<mo>&prime;</mo>
</msubsup>
<mi>B</mi>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>,</mo>
<msub>
<mi>x</mi>
<mi>k</mi>
</msub>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
<mo>)</mo>
</mrow>
<mo>|</mo>
<mo>|</mo>
<mo>|</mo>
<mo>|</mo>
<msub>
<mi>&delta;u</mi>
<mi>k</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
<mo>|</mo>
<mo>|</mo>
<mo>+</mo>
<mo>|</mo>
<mo>|</mo>
<msub>
<mi>L</mi>
<mrow>
<mi>k</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
</msub>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
<mo>|</mo>
<mo>|</mo>
<mo>|</mo>
<mo>|</mo>
<msubsup>
<mi>g</mi>
<mrow>
<msub>
<mover>
<mi>x</mi>
<mo>~</mo>
</mover>
<mi>k</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>+</mo>
<mn>1</mn>
<mo>)</mo>
</mrow>
</mrow>
<mo>&prime;</mo>
</msubsup>
<mo>|</mo>
<mo>|</mo>
<mo>(</mo>
<mo>|</mo>
<mo>|</mo>
<mi>f</mi>
<mo>(</mo>
<mrow>
<mi>t</mi>
<mo>,</mo>
<msub>
<mi>&delta;x</mi>
<mi>k</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
</mrow>
<mo>)</mo>
<mo>|</mo>
<mo>|</mo>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<mo>+</mo>
<mo>|</mo>
<mo>|</mo>
<mi>B</mi>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>,</mo>
<msub>
<mi>&delta;x</mi>
<mi>k</mi>
</msub>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
<mo>)</mo>
</mrow>
<mo>|</mo>
<mo>|</mo>
<mo>|</mo>
<mo>|</mo>
<msub>
<mi>u</mi>
<mi>d</mi>
</msub>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
<mo>|</mo>
<mo>|</mo>
<mo>)</mo>
<mo>+</mo>
<mo>|</mo>
<mo>|</mo>
<msub>
<mi>L</mi>
<mrow>
<mi>k</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
</msub>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
<mo>|</mo>
<mo>|</mo>
<mo>|</mo>
<mo>|</mo>
<msubsup>
<mi>g</mi>
<mrow>
<msub>
<mover>
<mi>x</mi>
<mo>~</mo>
</mover>
<mi>k</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>k</mi>
<mo>+</mo>
<mn>1</mn>
<mo>)</mo>
</mrow>
</mrow>
<mo>&prime;</mo>
</msubsup>
<mo>|</mo>
<mo>|</mo>
<mo>|</mo>
<mo>|</mo>
<msub>
<mi>&omega;</mi>
<mi>k</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
<mo>|</mo>
<mo>|</mo>
<mo>+</mo>
<mo>|</mo>
<mo>|</mo>
<msub>
<mi>L</mi>
<mrow>
<mi>k</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
</msub>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
<mo>|</mo>
<mo>|</mo>
<mo>|</mo>
<mo>|</mo>
<msub>
<mi>v</mi>
<mi>k</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>+</mo>
<mn>1</mn>
<mo>)</mo>
</mrow>
<mo>|</mo>
<mo>|</mo>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<mo>+</mo>
<mo>|</mo>
<mo>|</mo>
<msub>
<mi>&Gamma;</mi>
<mrow>
<mi>k</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
</msub>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
<mo>|</mo>
<mo>|</mo>
<mo>|</mo>
<mo>|</mo>
<msub>
<mi>v</mi>
<mrow>
<mi>k</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
</msub>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
<mo>|</mo>
<mo>|</mo>
<mo>+</mo>
<mo>|</mo>
<mo>|</mo>
<msub>
<mi>L</mi>
<mrow>
<mi>k</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
</msub>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
<mo>|</mo>
<mo>|</mo>
<mo>|</mo>
<mo>|</mo>
<msubsup>
<mi>g</mi>
<mrow>
<msub>
<mover>
<mi>x</mi>
<mo>~</mo>
</mover>
<mrow>
<mi>k</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
</msub>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
</mrow>
<mo>&prime;</mo>
</msubsup>
<mo>|</mo>
<mo>|</mo>
<mo>|</mo>
<mo>|</mo>
<msub>
<mi>&delta;x</mi>
<mrow>
<mi>k</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
</msub>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
<mo>|</mo>
<mo>|</mo>
</mrow>
</mtd>
</mtr>
</mtable>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>4</mn>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<mo>|</mo>
<mo>|</mo>
<msub>
<mi>&delta;x</mi>
<mi>k</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>+</mo>
<mn>1</mn>
<mo>)</mo>
</mrow>
<mo>|</mo>
<mo>|</mo>
<mo>&le;</mo>
<mo>|</mo>
<mo>|</mo>
<mi>f</mi>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>,</mo>
<msub>
<mi>&delta;x</mi>
<mi>k</mi>
</msub>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
<mo>)</mo>
</mrow>
<mo>|</mo>
<mo>|</mo>
<mo>+</mo>
<mo>|</mo>
<mo>|</mo>
<mi>B</mi>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>,</mo>
<msub>
<mi>&delta;x</mi>
<mi>k</mi>
</msub>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
<mo>)</mo>
</mrow>
<mo>|</mo>
<mo>|</mo>
<mo>|</mo>
<mo>|</mo>
<msub>
<mi>u</mi>
<mi>d</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
<mo>|</mo>
<mo>|</mo>
<mo>+</mo>
<mo>|</mo>
<mo>|</mo>
<mi>B</mi>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>,</mo>
<msub>
<mi>x</mi>
<mi>k</mi>
</msub>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
<mo>)</mo>
</mrow>
<mo>|</mo>
<mo>|</mo>
<mo>|</mo>
<mo>|</mo>
<msub>
<mi>&delta;u</mi>
<mi>k</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
<mo>|</mo>
<mo>|</mo>
<mo>+</mo>
<mo>|</mo>
<mo>|</mo>
<msub>
<mi>&omega;</mi>
<mi>k</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
<mo>|</mo>
<mo>|</mo>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>5</mn>
<mo>)</mo>
</mrow>
</mrow>
其中在xk(t+1)与xd(t+1)之间取值,取为α1和α2都是小于1的可调正数,且α1+α2=1;在xk+1(t)与xd(t)之间取值,取为α3和α4为小于1的可调正数,且α3+α4=1;令分别表示变量ud(t)和函数B(t,xk(t))、f(t,δxk(t))、B(t,δxk(t))在系统运动周期范围内的范数上界,则进而可得:
<mrow>
<mo>|</mo>
<mo>|</mo>
<msub>
<mi>&delta;x</mi>
<mi>k</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
<mo>|</mo>
<mo>|</mo>
<mo>&le;</mo>
<msubsup>
<mi>c</mi>
<mn>1</mn>
<mi>t</mi>
</msubsup>
<mo>|</mo>
<mo>|</mo>
<msub>
<mi>&delta;x</mi>
<mi>k</mi>
</msub>
<mrow>
<mo>(</mo>
<mn>0</mn>
<mo>)</mo>
</mrow>
<mo>|</mo>
<mo>|</mo>
<mo>+</mo>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>j</mi>
<mo>=</mo>
<mn>0</mn>
</mrow>
<mrow>
<mi>t</mi>
<mo>-</mo>
<mn>1</mn>
</mrow>
</munderover>
<msubsup>
<mi>c</mi>
<mn>1</mn>
<mrow>
<mi>t</mi>
<mo>-</mo>
<mn>1</mn>
<mo>-</mo>
<mi>j</mi>
</mrow>
</msubsup>
<mrow>
<mo>(</mo>
<msub>
<mi>b</mi>
<mi>B</mi>
</msub>
<mo>|</mo>
<mo>|</mo>
<msub>
<mi>&delta;u</mi>
<mi>k</mi>
</msub>
<mo>(</mo>
<mi>j</mi>
<mo>)</mo>
<mo>|</mo>
<mo>|</mo>
<mo>+</mo>
<msub>
<mi>b</mi>
<mi>&omega;</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>6</mn>
<mo>)</mo>
</mrow>
</mrow>
令:得到:
<mrow>
<mo>|</mo>
<mo>|</mo>
<msub>
<mi>&delta;u</mi>
<mrow>
<mi>k</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
</msub>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
<mo>|</mo>
<mo>|</mo>
<mo>&le;</mo>
<mi>&rho;</mi>
<mo>|</mo>
<mo>|</mo>
<msub>
<mi>&delta;u</mi>
<mi>k</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
<mo>|</mo>
<mo>|</mo>
<mo>+</mo>
<msub>
<mi>b</mi>
<mi>&Gamma;</mi>
</msub>
<msub>
<mi>b</mi>
<msub>
<mi>g</mi>
<msub>
<mi>x</mi>
<mn>2</mn>
</msub>
</msub>
</msub>
<mo>|</mo>
<mo>|</mo>
<msub>
<mi>&delta;x</mi>
<mrow>
<mi>k</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
</msub>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
<mo>|</mo>
<mo>|</mo>
<mo>+</mo>
<msub>
<mi>b</mi>
<mi>L</mi>
</msub>
<msub>
<mi>b</mi>
<msub>
<mi>g</mi>
<msub>
<mi>x</mi>
<mn>1</mn>
</msub>
</msub>
</msub>
<mrow>
<mo>(</mo>
<msub>
<mi>k</mi>
<mi>f</mi>
</msub>
<mo>+</mo>
<msub>
<mi>k</mi>
<mi>B</mi>
</msub>
<msub>
<mi>b</mi>
<msub>
<mi>u</mi>
<mi>c</mi>
</msub>
</msub>
<mo>)</mo>
</mrow>
<mo>|</mo>
<mo>|</mo>
<msub>
<mi>&delta;x</mi>
<mi>k</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
<mo>|</mo>
<mo>|</mo>
<mo>+</mo>
<msub>
<mi>b</mi>
<mi>L</mi>
</msub>
<msub>
<mi>b</mi>
<msub>
<mi>g</mi>
<msub>
<mi>x</mi>
<mn>1</mn>
</msub>
</msub>
</msub>
<msub>
<mi>b</mi>
<mi>&omega;</mi>
</msub>
<mo>+</mo>
<msub>
<mi>b</mi>
<mi>L</mi>
</msub>
<msub>
<mi>b</mi>
<mi>v</mi>
</msub>
<mo>+</mo>
<msub>
<mi>b</mi>
<mi>L</mi>
</msub>
<msub>
<mi>b</mi>
<mi>v</mi>
</msub>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>7</mn>
<mo>)</mo>
</mrow>
</mrow>
接下来,将式(6)代入式(7)中,并令 两端同时乘以λt,并取λ范数立即可得:
<mrow>
<mo>|</mo>
<mo>|</mo>
<msub>
<mi>&delta;u</mi>
<mrow>
<mi>k</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
</msub>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
<mo>|</mo>
<msub>
<mo>|</mo>
<mi>&lambda;</mi>
</msub>
<mo>&le;</mo>
<mover>
<mi>&rho;</mi>
<mo>&OverBar;</mo>
</mover>
<mo>|</mo>
<mo>|</mo>
<msub>
<mi>&delta;u</mi>
<mi>k</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
<mo>|</mo>
<msub>
<mo>|</mo>
<mi>&lambda;</mi>
</msub>
<mo>+</mo>
<mi>&theta;</mi>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>8</mn>
<mo>)</mo>
</mrow>
</mrow>
其中:
<mrow>
<mover>
<mi>&rho;</mi>
<mo>&OverBar;</mo>
</mover>
<mo>=</mo>
<mfrac>
<mrow>
<mo>(</mo>
<mi>&rho;</mi>
<mo>+</mo>
<msub>
<mi>c</mi>
<mn>2</mn>
</msub>
<msub>
<mi>b</mi>
<mi>B</mi>
</msub>
<mi>&lambda;</mi>
<mfrac>
<mrow>
<mn>1</mn>
<mo>-</mo>
<msup>
<mrow>
<mo>(</mo>
<msub>
<mi>&lambda;c</mi>
<mn>1</mn>
</msub>
<mo>)</mo>
</mrow>
<mi>T</mi>
</msup>
</mrow>
<mrow>
<mn>1</mn>
<mo>-</mo>
<msub>
<mi>&lambda;c</mi>
<mn>1</mn>
</msub>
</mrow>
</mfrac>
<mo>)</mo>
</mrow>
<mrow>
<mo>(</mo>
<mn>1</mn>
<mo>-</mo>
<msub>
<mi>c</mi>
<mn>3</mn>
</msub>
<msub>
<mi>b</mi>
<mi>B</mi>
</msub>
<mi>&lambda;</mi>
<mfrac>
<mrow>
<mn>1</mn>
<mo>-</mo>
<msup>
<mrow>
<mo>(</mo>
<msub>
<mi>&lambda;c</mi>
<mn>1</mn>
</msub>
<mo>)</mo>
</mrow>
<mi>T</mi>
</msup>
</mrow>
<mrow>
<mn>1</mn>
<mo>-</mo>
<msub>
<mi>&lambda;c</mi>
<mn>1</mn>
</msub>
</mrow>
</mfrac>
<mo>)</mo>
</mrow>
</mfrac>
<mo>,</mo>
<mi>&theta;</mi>
<mo>=</mo>
<mfrac>
<mrow>
<msub>
<mi>c</mi>
<mn>2</mn>
</msub>
<msub>
<mi>b</mi>
<msub>
<mi>x</mi>
<mn>0</mn>
</msub>
</msub>
<mo>+</mo>
<msub>
<mi>c</mi>
<mn>3</mn>
</msub>
<msub>
<mi>b</mi>
<msub>
<mi>x</mi>
<mn>0</mn>
</msub>
</msub>
<mo>+</mo>
<msub>
<mi>c</mi>
<mn>4</mn>
</msub>
</mrow>
<mrow>
<mn>1</mn>
<mo>-</mo>
<msub>
<mi>c</mi>
<mn>3</mn>
</msub>
<msub>
<mi>b</mi>
<mi>B</mi>
</msub>
<mi>&lambda;</mi>
<mfrac>
<mrow>
<mn>1</mn>
<mo>-</mo>
<msup>
<mrow>
<mo>(</mo>
<msub>
<mi>&lambda;c</mi>
<mn>1</mn>
</msub>
<mo>)</mo>
</mrow>
<mi>T</mi>
</msup>
</mrow>
<mrow>
<mn>1</mn>
<mo>-</mo>
<msub>
<mi>&lambda;c</mi>
<mn>1</mn>
</msub>
</mrow>
</mfrac>
</mrow>
</mfrac>
<mo>+</mo>
<mfrac>
<mrow>
<msub>
<mi>c</mi>
<mn>2</mn>
</msub>
<msub>
<mi>b</mi>
<mi>&omega;</mi>
</msub>
<mi>&lambda;</mi>
<mfrac>
<mrow>
<mn>1</mn>
<mo>-</mo>
<msup>
<mrow>
<mo>(</mo>
<msub>
<mi>&lambda;c</mi>
<mn>1</mn>
</msub>
<mo>)</mo>
</mrow>
<mi>T</mi>
</msup>
</mrow>
<mrow>
<mn>1</mn>
<mo>-</mo>
<msub>
<mi>&lambda;c</mi>
<mn>1</mn>
</msub>
</mrow>
</mfrac>
<mo>+</mo>
<msub>
<mi>c</mi>
<mn>3</mn>
</msub>
<msub>
<mi>b</mi>
<mi>&omega;</mi>
</msub>
<mi>&lambda;</mi>
<mfrac>
<mrow>
<mn>1</mn>
<mo>-</mo>
<msup>
<mrow>
<mo>(</mo>
<msub>
<mi>&lambda;c</mi>
<mn>1</mn>
</msub>
<mo>)</mo>
</mrow>
<mi>T</mi>
</msup>
</mrow>
<mrow>
<mn>1</mn>
<mo>-</mo>
<msub>
<mi>&lambda;c</mi>
<mn>1</mn>
</msub>
</mrow>
</mfrac>
</mrow>
<mrow>
<mn>1</mn>
<mo>-</mo>
<msub>
<mi>c</mi>
<mn>3</mn>
</msub>
<msub>
<mi>b</mi>
<mi>B</mi>
</msub>
<mi>&lambda;</mi>
<mfrac>
<mrow>
<mn>1</mn>
<mo>-</mo>
<msup>
<mrow>
<mo>(</mo>
<msub>
<mi>&lambda;c</mi>
<mn>1</mn>
</msub>
<mo>)</mo>
</mrow>
<mi>T</mi>
</msup>
</mrow>
<mrow>
<mn>1</mn>
<mo>-</mo>
<msub>
<mi>&lambda;c</mi>
<mn>1</mn>
</msub>
</mrow>
</mfrac>
</mrow>
</mfrac>
</mrow>
即经k次迭代后:
<mrow>
<mo>|</mo>
<mo>|</mo>
<msub>
<mi>&delta;u</mi>
<mrow>
<mi>k</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
</msub>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
<mo>|</mo>
<msub>
<mo>|</mo>
<mi>&lambda;</mi>
</msub>
<mo>&le;</mo>
<msup>
<mover>
<mi>&rho;</mi>
<mo>&OverBar;</mo>
</mover>
<mrow>
<mi>k</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
</msup>
<mo>|</mo>
<mo>|</mo>
<msub>
<mi>&delta;u</mi>
<mn>0</mn>
</msub>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
<mo>|</mo>
<msub>
<mo>|</mo>
<mi>&lambda;</mi>
</msub>
<mo>+</mo>
<mi>&theta;</mi>
<mfrac>
<mrow>
<mn>1</mn>
<mo>-</mo>
<msup>
<mrow>
<mo>(</mo>
<mover>
<mi>&rho;</mi>
<mo>&OverBar;</mo>
</mover>
<mo>)</mo>
</mrow>
<mrow>
<mi>k</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
</msup>
</mrow>
<mrow>
<mn>1</mn>
<mo>-</mo>
<mover>
<mi>&rho;</mi>
<mo>&OverBar;</mo>
</mover>
</mrow>
</mfrac>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>9</mn>
<mo>)</mo>
</mrow>
</mrow>
当λ取足够小,时:
<mrow>
<munder>
<mi>lim</mi>
<mrow>
<mi>k</mi>
<mo>&RightArrow;</mo>
<mi>&infin;</mi>
</mrow>
</munder>
<mo>|</mo>
<mo>|</mo>
<msub>
<mi>&delta;u</mi>
<mi>k</mi>
</msub>
<mo>|</mo>
<msub>
<mo>|</mo>
<mi>&lambda;</mi>
</msub>
<mo>&le;</mo>
<mfrac>
<mi>&theta;</mi>
<mrow>
<mn>1</mn>
<mo>-</mo>
<mover>
<mi>&rho;</mi>
<mo>&OverBar;</mo>
</mover>
</mrow>
</mfrac>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>10</mn>
<mo>)</mo>
</mrow>
</mrow>
则:
<mrow>
<mo>|</mo>
<mo>|</mo>
<msub>
<mi>e</mi>
<mi>k</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
<mo>|</mo>
<msub>
<mo>|</mo>
<mi>&lambda;</mi>
</msub>
<mo>&le;</mo>
<msub>
<mi>b</mi>
<msub>
<mi>g</mi>
<mi>x</mi>
</msub>
</msub>
<msub>
<mi>b</mi>
<msub>
<mi>x</mi>
<mn>0</mn>
</msub>
</msub>
<mo>+</mo>
<msub>
<mi>b</mi>
<mi>v</mi>
</msub>
<mo>+</mo>
<msub>
<mi>b</mi>
<mi>&omega;</mi>
</msub>
<mi>&lambda;</mi>
<mfrac>
<mrow>
<mn>1</mn>
<mo>-</mo>
<msup>
<mrow>
<mo>(</mo>
<msub>
<mi>&lambda;c</mi>
<mn>1</mn>
</msub>
<mo>)</mo>
</mrow>
<mi>T</mi>
</msup>
</mrow>
<mrow>
<mn>1</mn>
<mo>-</mo>
<msub>
<mi>&lambda;c</mi>
<mn>1</mn>
</msub>
</mrow>
</mfrac>
<mo>+</mo>
<msub>
<mi>&lambda;b</mi>
<mi>B</mi>
</msub>
<mo>|</mo>
<mo>|</mo>
<msub>
<mi>&delta;u</mi>
<mi>k</mi>
</msub>
<mo>|</mo>
<msub>
<mo>|</mo>
<mi>&lambda;</mi>
</msub>
<mfrac>
<mrow>
<mn>1</mn>
<mo>-</mo>
<msup>
<mrow>
<mo>(</mo>
<msub>
<mi>&lambda;c</mi>
<mn>1</mn>
</msub>
<mo>)</mo>
</mrow>
<mi>T</mi>
</msup>
</mrow>
<mrow>
<mn>1</mn>
<mo>-</mo>
<msub>
<mi>&lambda;c</mi>
<mn>1</mn>
</msub>
</mrow>
</mfrac>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>11</mn>
<mo>)</mo>
</mrow>
</mrow>
而且将式(10)代入式(11)中,进一步可得:
<mrow>
<munder>
<mi>lim</mi>
<mrow>
<mi>k</mi>
<mo>&RightArrow;</mo>
<mi>&infin;</mi>
</mrow>
</munder>
<mo>|</mo>
<mo>|</mo>
<msub>
<mi>e</mi>
<mi>k</mi>
</msub>
<mo>|</mo>
<msub>
<mo>|</mo>
<mi>&lambda;</mi>
</msub>
<mo>&le;</mo>
<msub>
<mi>b</mi>
<msub>
<mi>g</mi>
<mi>x</mi>
</msub>
</msub>
<msub>
<mi>b</mi>
<msub>
<mi>x</mi>
<mn>0</mn>
</msub>
</msub>
<mo>+</mo>
<msub>
<mi>b</mi>
<mi>v</mi>
</msub>
<mo>+</mo>
<msub>
<mi>b</mi>
<mi>&omega;</mi>
</msub>
<mi>&lambda;</mi>
<mfrac>
<mrow>
<mn>1</mn>
<mo>-</mo>
<msup>
<mrow>
<mo>(</mo>
<msub>
<mi>&lambda;c</mi>
<mn>1</mn>
</msub>
<mo>)</mo>
</mrow>
<mi>T</mi>
</msup>
</mrow>
<mrow>
<mn>1</mn>
<mo>-</mo>
<msub>
<mi>&lambda;c</mi>
<mn>1</mn>
</msub>
</mrow>
</mfrac>
<mo>+</mo>
<mrow>
<mo>(</mo>
<msub>
<mi>&lambda;b</mi>
<mi>B</mi>
</msub>
<mo>)</mo>
</mrow>
<mfrac>
<mi>&theta;</mi>
<mrow>
<mn>1</mn>
<mo>-</mo>
<mover>
<mi>&rho;</mi>
<mo>&OverBar;</mo>
</mover>
</mrow>
</mfrac>
<mfrac>
<mrow>
<mn>1</mn>
<mo>-</mo>
<msup>
<mrow>
<mo>(</mo>
<msub>
<mi>&lambda;c</mi>
<mn>1</mn>
</msub>
<mo>)</mo>
</mrow>
<mi>T</mi>
</msup>
</mrow>
<mrow>
<mn>1</mn>
<mo>-</mo>
<msub>
<mi>&lambda;c</mi>
<mn>1</mn>
</msub>
</mrow>
</mfrac>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>12</mn>
<mo>)</mo>
</mrow>
</mrow>
由式(12)可知,通过k次迭代后,最终跟踪误差会收敛到一定范围以内,即:其中:特别地,当非线性
系统不存在外界因素的干扰且系统初始值与给定期望初态严格一致时,
<mrow>
<munder>
<mi>lim</mi>
<mrow>
<mi>k</mi>
<mo>&RightArrow;</mo>
<mi>&infin;</mi>
</mrow>
</munder>
<mo>|</mo>
<mo>|</mo>
<msub>
<mi>e</mi>
<mi>k</mi>
</msub>
<mo>|</mo>
<msub>
<mo>|</mo>
<mi>&lambda;</mi>
</msub>
<mo>=</mo>
<mn>0</mn>
<mo>;</mo>
</mrow>
第四步:优化鲁棒迭代学习轨迹跟踪控制器
虽然在第三步中鲁棒迭代学习轨迹跟踪控制器能够使得移动机器人系统满足稳定性条件,但稳定参数的选择范围较大,稳定参数的人为随意选择将使得系统即使满足稳定性条件通常也会降低最终控制性能;因此需要进一步考虑存在干扰情形下,非线性机器人离散系统(2)的鲁棒优化控制算法,其中t∈{0,1,…,T}为采样时刻;将式(2)中的状态量xk(t)代入yk(t),则输出表示为:
<mfenced open = "" close = "">
<mtable>
<mtr>
<mtd>
<mrow>
<msub>
<mi>y</mi>
<mi>k</mi>
</msub>
<mrow>
<mo>(</mo>
<mn>1</mn>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mi>H</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>x</mi>
<mi>k</mi>
</msub>
<mo>(</mo>
<mn>0</mn>
<mo>)</mo>
<mo>,</mo>
<msub>
<mi>u</mi>
<mi>k</mi>
</msub>
<mo>(</mo>
<mn>0</mn>
<mo>)</mo>
<mo>,</mo>
<msub>
<mi>u</mi>
<mi>k</mi>
</msub>
<mo>(</mo>
<mn>0</mn>
<mo>)</mo>
<mo>,</mo>
<msub>
<mi>&omega;</mi>
<mi>k</mi>
</msub>
<mo>(</mo>
<mn>0</mn>
<mo>)</mo>
<mo>+</mo>
<msub>
<mi>v</mi>
<mi>k</mi>
</msub>
<mo>(</mo>
<mn>1</mn>
<mo>)</mo>
<mo>)</mo>
</mrow>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mo>.</mo>
</mtd>
</mtr>
<mtr>
<mtd>
<mo>.</mo>
</mtd>
</mtr>
<mtr>
<mtd>
<mo>.</mo>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<msub>
<mi>y</mi>
<mi>k</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>T</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mi>H</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>x</mi>
<mi>k</mi>
</msub>
<mo>(</mo>
<mn>0</mn>
<mo>)</mo>
<mo>,</mo>
<msub>
<mi>u</mi>
<mi>k</mi>
</msub>
<mo>(</mo>
<mn>0</mn>
<mo>)</mo>
<mo>,</mo>
<mn>...</mn>
<mo>,</mo>
<msub>
<mi>u</mi>
<mi>k</mi>
</msub>
<mo>(</mo>
<mrow>
<mi>T</mi>
<mo>-</mo>
<mn>1</mn>
</mrow>
<mo>)</mo>
<mo>,</mo>
<msub>
<mi>&omega;</mi>
<mi>k</mi>
</msub>
<mo>(</mo>
<mn>0</mn>
<mo>)</mo>
<mo>,</mo>
<mo>...</mo>
<mo>,</mo>
<msub>
<mi>&omega;</mi>
<mi>k</mi>
</msub>
<mo>(</mo>
<mrow>
<mi>T</mi>
<mo>-</mo>
<mn>1</mn>
</mrow>
<mo>)</mo>
<mo>+</mo>
<msub>
<mi>v</mi>
<mi>k</mi>
</msub>
<mo>(</mo>
<mi>T</mi>
<mo>)</mo>
<mo>)</mo>
</mrow>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
其中H(·)表示非线性机器人离散系统(2)运行时,在一个运行周期内所有采样点t∈{0,1,…,T}都满足的一个非线性函数,则输出误差可表示为:
ek+1=ek-(yk+1-yk) (13)
由微分中值定理及非线性系统可得:
<mrow>
<msub>
<mi>y</mi>
<mrow>
<mi>k</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
</msub>
<mo>-</mo>
<msub>
<mi>y</mi>
<mi>k</mi>
</msub>
<mo>=</mo>
<msub>
<mover>
<mi>H</mi>
<mo>~</mo>
</mover>
<mrow>
<mi>k</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
</msub>
<mrow>
<mo>(</mo>
<msub>
<mi>u</mi>
<mrow>
<mi>k</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
</msub>
<mo>-</mo>
<msub>
<mi>u</mi>
<mi>k</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>+</mo>
<mover>
<mi>d</mi>
<mo>~</mo>
</mover>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>14</mn>
<mo>)</mo>
</mrow>
</mrow>
其中表示H(·)关于uk的Jacobain矩阵在uk+1(t)和uk(t)之间的取值,为含初值不严格一致的扰动总量;
为方便求解,将增益矩阵改写成一种特殊形式:Lk+1=αk+1W,Γk+1=βk+1M,其中W,M分别为与Lk+1和Γk+1相同结构和维数的构造矩阵,αk+1、βk+1分别为参量,则迭代学习控制律可改写成:
<mrow>
<msub>
<mi>u</mi>
<mrow>
<mi>k</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
</msub>
<mo>-</mo>
<msub>
<mi>u</mi>
<mi>k</mi>
</msub>
<mo>=</mo>
<msub>
<mi>&alpha;</mi>
<mrow>
<mi>k</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
</msub>
<msub>
<mi>We</mi>
<mi>k</mi>
</msub>
<mo>+</mo>
<msub>
<mi>&beta;</mi>
<mrow>
<mi>k</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
</msub>
<msub>
<mi>Me</mi>
<mrow>
<mi>k</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
</msub>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>15</mn>
<mo>)</mo>
</mrow>
</mrow>
得到ek+1,即进一步整理得到:
<mrow>
<msub>
<mi>e</mi>
<mrow>
<mi>k</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
</msub>
<mo>=</mo>
<msup>
<mrow>
<mo>(</mo>
<mi>I</mi>
<mo>+</mo>
<msub>
<mover>
<mi>H</mi>
<mo>~</mo>
</mover>
<mrow>
<mi>k</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
</msub>
<msub>
<mi>&beta;</mi>
<mrow>
<mi>k</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
</msub>
<mi>M</mi>
<mo>)</mo>
</mrow>
<mrow>
<mo>-</mo>
<mn>1</mn>
</mrow>
</msup>
<mrow>
<mo>(</mo>
<mo>(</mo>
<mrow>
<mi>I</mi>
<mo>-</mo>
<msub>
<mover>
<mi>H</mi>
<mo>~</mo>
</mover>
<mrow>
<mi>k</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
</msub>
<msub>
<mi>&alpha;</mi>
<mrow>
<mi>k</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
</msub>
<mi>W</mi>
</mrow>
<mo>)</mo>
<mo>-</mo>
<mover>
<mi>d</mi>
<mo>~</mo>
</mover>
<mo>)</mo>
</mrow>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>16</mn>
<mo>)</mo>
</mrow>
</mrow>
考虑性能指标:
其中调节量ψ>0,Q=I;
利用最优控制原理中的极值原理可以得到:
<mrow>
<mfenced open = "{" close = "">
<mtable>
<mtr>
<mtd>
<mrow>
<msubsup>
<mi>&alpha;</mi>
<mrow>
<mi>k</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
<mo>*</mo>
</msubsup>
<mo>=</mo>
<mi>arg</mi>
<mi> </mi>
<mi>min</mi>
<mo>&lsqb;</mo>
<msub>
<mi>J</mi>
<mrow>
<mi>k</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
</msub>
<mrow>
<mo>(</mo>
<msub>
<mi>&alpha;</mi>
<mrow>
<mi>k</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
</msub>
<mo>,</mo>
<msub>
<mi>&beta;</mi>
<mi>k</mi>
</msub>
<mo>+</mo>
<mn>1</mn>
<mo>)</mo>
</mrow>
<mo>&rsqb;</mo>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<msubsup>
<mi>&beta;</mi>
<mrow>
<mi>k</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
<mo>*</mo>
</msubsup>
<mo>=</mo>
<mi>arg</mi>
<mi> </mi>
<mi>m</mi>
<mi>i</mi>
<mi>n</mi>
<mo>&lsqb;</mo>
<msub>
<mi>J</mi>
<mrow>
<mi>k</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
</msub>
<mrow>
<mo>(</mo>
<msub>
<mi>&alpha;</mi>
<mrow>
<mi>k</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
</msub>
<mo>,</mo>
<msub>
<mi>&beta;</mi>
<mrow>
<mi>k</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
</msub>
<mo>)</mo>
</mrow>
<mo>&rsqb;</mo>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>18</mn>
<mo>)</mo>
</mrow>
</mrow>
注意到这里求出的与将分别含有ψ和说明ψ与对αk+1取最优解具有调节作用,同时对βk+1也具有调节作用,因此需对ψ和求偏导求其相应的最优解,即:
综合以上优化分析条件建立多目标优化函数,得到最优化参数代入迭代学习律中即可得到鲁棒优化迭代学习的P型开闭环控制器;
第五步:系统输出跟踪误差的鲁棒单调性分析
考虑性能指标函数式(17):
当取非最优化解αk+1=0,βk+1=0,则:
因此,||ek+1||≤||ek||,即误差单调收敛,||ek+1||的极限必然存在;根据可知误差会收敛到优化后的有界误差范围内;实际上,对于确定性系统,由于则误差将收敛到零;综合式(20)和式(21)可得:
经k次迭代后有:
实际上,在理想状态下系统不存在干扰,且初值严格一致的条件下,对于P型开环的参数优化式(27)中e0=0,最终而对于非线性系统采用P型开闭环控制律,由于随机干扰的存在,且初值不严格一致,则将会无限逼近于零,但无法达到,而对于由式(23)移项整理可知其存在一定的上限;
第六步:具体鲁棒单调优化迭代学习控制方案实施
迭代学习轨迹跟踪算法具体的鲁棒优化方案如下:
1)针对被控移动机器人系统,设定系统期望初始状态xk(0),初始控制u0,期望轨迹yd,采样周期ΔT;
2)给定最大跟踪误差精度εmax;
3)设定系统批次运行时的初值xk(0),在干扰量存在条件下运行系统并记录时刻对应的输出误差和干扰量值的大小,给定适当的W和M,带入多目标优化函数性能指标得到得到最优化控制律;
4)对第k+1批次控制量作用于被控移动机器人系统,产生跟踪误差若在允许最大跟踪误差精度范围以内,结束迭代过程,否则回到3)中重新设定相应初值,继续迭代,直到达到要求误差精度范围;
将上述鲁棒单调优化迭代学习控制方案在FPGA芯片EP1C6T144C8上实现,输入量为移动机器人的线速度和角速度其线速度和角速度信号分别由扭矩传感器和旋转角度传感器检测得到,输入信号通过调理电路由FPGA核心中央处理芯片按性能指标进行程序计算得出优化参数,并构建鲁棒单调优化控制器,CPU程序计算得到的输出信号为FPGA经迭代信号处理后得到最优化控制器控制信号再经RS232通信模块作用于机器人控制系统,不断修正二维运动移动机器人的跟踪轨迹,直到达到设定要求,误差允许在一定范围内保持。