CN113110063B

CN113110063B - 单轴进给系统的鲁棒单调收敛点对点迭代学习控制方法

Info

Publication number: CN113110063B
Application number: CN202110500437.1A
Authority: CN
Inventors: 陶洪峰; 李健; 王瑞; 庄志和; 黄彦德; 陶新悦; 胡计昶
Original assignee: Jiangnan University
Current assignee: Sichuan Digital Economy Industry Development Research Institute
Priority date: 2021-05-08
Filing date: 2021-05-08
Publication date: 2022-05-31
Anticipated expiration: 2041-05-08
Also published as: CN113110063A

Abstract

本发明公开了一种单轴进给系统的鲁棒单调收敛点对点迭代学习控制方法，涉及单轴进给系统领域，该方法包括：通过动力学方程式表示单轴进给系统，将动力学方程式转变离散状态空间模型并得到输入输出矩阵模型；选取M个预设时间点，通过满足预设条件的托普利兹矩阵得到点对点不确定性动力学方程并得到预设时间点在当前运行批次的输出向量；通过预设时间点在当前运行批次的输出向量确定预设时间点在当前运行批次的跟踪误差；通过迭代学习控制更新律对当前运行批次的输入向量进行迭代更新直到跟踪误差不大于预设值，通过当前运行批次的输入向量对单轴进给系统进行控制，实现了点对点跟踪误差单调收敛。

Description

单轴进给系统的鲁棒单调收敛点对点迭代学习控制方法

技术领域

本发明涉及单轴进给系统领域，尤其是一种单轴进给系统的鲁棒单调收敛点对点迭代学习控制方法。

背景技术

单轴进给系统是一种在机械工业普遍运用的驱动系统，例如激光切割机、数控机床、电火花线切割机、水射流机等都需要使用到单轴进给系统，在实际使用中需要驱动单轴进给系统按照特定的轨迹运动，但实际在运行过程中，单轴进给系统跟踪该特定的轨迹运动的能力不强，往往会有一定的误差，为了修正这一误差提高单轴进给系统的跟踪精度，迭代学习控制方法得到了极大的发展，迭代学习控制方法适用于有限时间范围内多批次执行同一任务的系统，迭代学习控制方法的原理是：使用之前运行批次的误差与控制输入信息，不断修正更新当前运行批次的控制输入信息，从而减小当前运行批次的跟踪误差，通过迭代学习控制方法，即使部分方法参数未知或者存在未知的外部干扰，也能保证跟踪误差在一定条件下的收敛性。

在大多数情况下，迭代学习控制方法的目的是解决跟踪误差的问题，然而在许多迭代学习方法的应用中，往往不需要跟踪完整的轨迹运动，只需要在一些关键的时间点满足跟踪要求即可，因此现有的迭代学习控制方法不能满足这一要求，同时当建立的模拟模型不够准确时，鲁棒性会是一个严重的问题，迭代学习控制方法的收敛速度会变慢，甚至不能为原有的控制问题提供有效解。

发明内容

本发明人针对上述问题及技术需求，提出了一种单轴进给系统的鲁棒单调收敛点对点迭代学习控制方法，本发明的技术方案如下：

一种单轴进给系统的鲁棒单调收敛点对点迭代学习控制方法，所述方法包括以下步骤：

通过动力学方程式表示单轴进给系统的动态模型，所述动力学方程式描述当前单轴进给系统的实际位置和控制电压之间的关系，将所述实际位置作为输出向量，并根据所述实际位置定义状态向量，定义控制电压为输入向量，将所述动力学方程式转变为关于当前运行批次的离散状态空间模型；

将所述离散状态空间模型转换为关于时间序列的输入输出矩阵模型，所述输入输出矩阵模型描述输入向量和输出向量之间的关系；

选取所述单轴进给系统在运行过程中的当前运行批次中M个预设时间点，构建满足收敛约束条件的托普利兹矩阵并对应得到所述单轴进给系统的加性不确定性，通过所述加性不确定性更新所述输入输出矩阵模型得到点对点不确定性动力学方程，通过所述点对点不确定动力学方程得到所述预设时间点在当前运行批次的输出向量；

通过所述预设时间点在当前运行批次的输出向量确定所述预设时间点在当前运行批次的跟踪误差；

根据所述M个预设时间点确定转换矩阵并修正系统矩阵，通过修正后的系统矩阵得到基于当前运行批次的跟踪误差和学习增益的迭代学习控制更新律；

通过所述迭代学习控制更新律对当前运行批次的输入向量进行迭代更新直到所述预设时间点在当前运行批次的跟踪误差不大于预设值，通过所述当前运行批次的输入向量对所述单轴进给系统进行控制。

其进一步的技术方案为，所述动力学方程式的表达式为：

其中m为惯性系数，c为粘滞摩擦系数，q为当前单轴进给系统的实际位置，

为当前单轴进给系统的速度，

为当前单轴进给系统的加速度，u为控制电压。

其进一步的技术方案为，所述将所述动力学方程式转变为关于当前运行批次的离散状态空间模型，包括：

将实际位置q作为输出向量，利用当前单轴进给系统的实际位置定义状态向量x：

并定义控制电压u为输入向量；

将所述动力学方程式转变为连续系统模型，所述连续系统模型的表达式为：

其中，m为惯性系数，c为粘滞摩擦系数；

对所述连续系统模型进行离散化处理得到离散状态空间模型，则所述离散状态空间模型的表达式为：

其中，k表示单轴进给系统的运行批次，第k个运行批次包括N个采样时刻，u_k(t)、y_k(t)和x_k(t)分别为单轴进给系统第k个运行批次在采样时刻t的输入向量、输出向量和状态向量，x_k(t+1)单轴进给系统第k个运行批次在采样时刻t+1的状态向量，A、B、C表示离散系统参数矩阵，且满足CB≠0，x_k(0)＝x₀，x₀表示常向量。

其进一步的技术方案为，所述输入输出矩阵模型的表达式为：

y_k＝Gu_k+d_k；

其中，y_k＝[y_k(1),y_k(2),...,y_k(N)]^T，u_k＝[u_k(0),u_k(1),...,u_k(N-1)]^T，

d_k＝[CA CA² CA³ ... CA^N]^Tx_k(0)，

u_k，y_k和x_k分别为第k个运行批次的输入向量、输出向量和状态向量，其中，t∈{1,2,…,N}，M≤N，y_k(N)表示第k个运行批次的采样时刻N的输出向量，u_k(N-1)表示第k个运行批次的采样时刻N-1的输入向量，A、B、C表示离散系统参数矩阵，且满足CB≠0，x_k(0)＝x₀，x₀表示常向量。

其进一步的技术方案为，所述加性不确定性G_Δ的表达式为：

G_Δ＝G+Δ·W；

其中，Δ为托普利兹矩阵，且Δ∈Θ，

W为权重矩阵，G表示系统矩阵；

其中，δ_N-1和w_N-1为不确定因子矩阵参数；

其中，||u||表示控制电压u的2-范数，

表示系统矩阵G的最大奇异值。

其进一步的技术方案为，不失一般性，令x_k(0)＝0，所述点对点不确定性动力学方程为：

其中

G_Δ表示加性不确定性，

表示第k个运行批次的M个预设时间点的输出向量，u_k＝[u_k(0),u_k(1),...,u_k(N-1)]^T，u_k(N-1)表示第k个运行批次的采样时刻N-1的输入向量。

其进一步的技术方案为，所述通过所述预设时间点在当前运行批次的输出向量确定所述预设时间点在当前运行批次的跟踪误差，包括：

确定第k批次t_b时刻的参考值r(t_b)为第k批次t_b时刻的输出y_k(t_b)，即y_k(t_b)＝r(t_b)，t_b表示预设时间点中的一个时刻，b为参数，b≤M；

计算得到M个预设时间点的参考值向量r^p，其计算公式为：

r^p＝[r(t₁),r(t₂),...,r(t_M)]^T；

确定预设时间点在当前运行批次的输出向量为

y_k为第k个运行批次的输出向量，r(t_M)表示第k批次t_M时刻的参考值,其中，ψ表示M行N列的转换矩阵，ψ的表达式为：

其中，ψ_ij为转换矩阵ψ中第i行第j列的元素；

确定预设时间点在当前运行批次的跟踪误差

其计算公式为：

其中，

为预设时间点在当前运行批次的输出向量。

其进一步的技术方案为，所述收敛约束条件为Δ∈Θ，

构建的满足收敛约束条件的托普利兹矩阵Δ＝0：

确定得到的所述迭代学习控制更新律的表达式为：

u_k为第k个运行批次的输入向量，u_k+1为第k+1个运行批次的输入向量，

表示预设时间点在当前运行批次的跟踪误差，L_u表示输入项的学习增益，L_e表示误差项的学习增益，计算公式为：

L_u＝((G^p)^TQG^p+R+S)^-1((G^p)^TQG^p+R)；

L_e＝((G^p)^TQG^p+R+S)^-1(G^p)^TQ；

其中，Q、R、S表示对称正定权重矩阵，G^p＝ΨG，G表示系统矩阵，ψ表示根据所述M个预设时间点确定的转换矩阵且ψ的表达式为：

其中，ψ_ij为转换矩阵ψ中第i行第j列的元素。

其进一步的技术方案为，所述收敛约束条件为Δ∈Ξ，

且构建的满足收敛约束条件的托普利兹矩阵Δ满足

确定所述迭代学习控制更新律的表达式为：

其中，u_k为第k个运行批次的输入向量，u_k+1为第k+1个运行批次的输入向量，

表示预设时间点在当前运行批次的跟踪误差，

表示输入项的学习增益，

表示误差项的学习增益，

表示N×N维度的实数矩阵；

其中，

I表示单位矩阵，Q、R、S表示对称正定权重矩阵，G^p＝ΨG，G表示系统矩阵，ψ表示根据所述M个预设时间点确定的转换矩阵且ψ的表达式为：

其中，ψ_ij为转换矩阵ψ中第i行第j列的元素；

其中，

第k个运行批次包括N个采样时刻；

为通过拉格朗日对偶函数将求解

转化为最小化问题函数

时得到的最优解。

其进一步的技术方案为，所述

为通过拉格朗日对偶函数将求解

转化为最小化问题函数

时得到的最优解，包括：

求解

的最大化问题并将

改写为最大化问题函数：

令z_k+1＝ΨΔW(u_k+1-u_k)；

则约束条件||ΨΔ||<1改写为||z_k+1||²≤||W(u_k+1-u_k)||²；

则更新后最大化问题函数表示为：

引入拉格朗日乘子λ_k+1，得到拉格朗日函数L(z_k+1,λ_k+1)，其表达式为：

对z_k+1微分并令

得到：

其中，I表示单位矩阵；

因此，拉格朗日函数L(z_k+1,λ_k+1)的对偶函数为：

将所述更新后最大化问题函数转化为关于对偶函数最小化函数，即：

s.t.λ_k+1I-Q≥0

其中，

其中，

表示λ_k+1I-Q的伪逆；

通过新对偶性能指标函数对所述对偶函数最小化函数进行改写，得到最小化问题函数：

其中，J_dual(u_k+1,λ_k+1)表示新对偶性能指标函数，且

其中，

值域；

其中，最小化问题

是关于λ_k+1的凸优化问题，因此最优解

可由所述新对偶性能指标函数通过对λ_k+1微分得到，将

代入新对偶性能指标函数得到：

对所述新对偶性能指标函数中的u_k+1进行微分，并令

合并同类项得到更新后指标函数：

本发明的有益技术效果是：针对单轴进给系统此类具有重复运动特征的线性系统为被控对象设计点对点轨迹跟踪迭代学习控制算法；控制算法可以利用轨迹跟踪部分关键时间点处的跟踪误差信息来更新控制输入,进而消除了不必要的非关键点跟踪约束，非关键点处的自由度给迭代学习控制算法设计增加自由度的同时,也增加了系统整体性能的提升空间；本方法基于范数最优迭代学习框架，设计了一种最坏情况下的鲁棒范数最优点对点迭代学习控制方法，保证系统建模不确定性较大时依然能够实现点对点跟踪误差单调收敛。

附图说明

图1是本申请的控制方法的流程示意图。

图2是块对角块对角有界摄动结构图(M-Δ_M结构图)。

图3是不确定性系统传统范数最优迭代学习控制算法框图。

图4是不确定性系统传统范数最优迭代学习控制算法M-Δ_M结构图。

图5是不确定性较小时单轴进给系统的实际输出与参考点跟踪曲线图。

图6是不确定性较小时鲁棒算法与传统算法均方误差比较曲线图。

图7是不确定性较小时鲁棒算法与传统算法性能指标比较曲线图。

图8是不确定性较小时鲁棒算法的增益参数λ_k+1随迭代批次变化图。

图9是不确定性较大时单轴进给系统的实际输出与参考点跟踪曲线图。

图10是不确定性较大时鲁棒算法与传统算法均方误差比较曲线图。

图11是不确定性较大时鲁棒算法与传统算法性能指标比较曲线图。

具体实施方式

下面结合附图对本发明的具体实施方式做进一步说明。

一种单轴进给系统的鲁棒单调收敛点对点迭代学习控制方法，具体步骤如图1所示。

步骤1：通过动力学方程式表示单轴进给系统的动态模型，动力学方程式描述当前单轴进给系统的实际位置和控制电压之间的关系。

其中m为惯性系数，c为粘滞摩擦系数，q为当前单轴进给系统的实际位置，u为控制电压。

具体的，设定惯性系数m＝0.044Vs²/mm，设定粘滞摩擦系数c＝0.21Vs/mm。

步骤2：利用当前单轴进给系统的实际位置定义状态向量x：

并定义控制电压u为输入向量，将实际位置作为输出向量；

将动力学方程式转变为连续系统模型，连续系统模型的表达式为：

其中，m为惯性系数，c为粘滞摩擦系数，q为当前单轴进给系统的实际位置，

为当前单轴进给系统的速度，

为当前单轴进给系统的加速度，u为控制电压。

选取满足香农采样定理的采样周期T_s，并将实际位置作为输出，对连续系统模型进行离散化处理得到离散状态空间模型，则离散状态空间模型的表达式为：

其中，k表示单轴进给系统的运行批次，第k个运行批次包括N个采样时刻，u_k(t)，y_k(t)和x_k(t)分别为单轴进给系统第k个运行批次采样时刻t的输入向量、输出向量和状态向量，其中N＝T/T_s；x_k(t+1)单轴进给系统第k个运行批次采样时刻t+1的状态向量，A、B、C表示离散系统参数矩阵，且满足CB≠0，假设系统每批次运行完成后初始状态完美重置，即x_k(0)＝x₀，x₀表示常向量。

步骤3：将离散状态空间模型转换为关于时间序列的输入输出矩阵模型。

输入输出矩阵模型的表达式为：

y_k＝Gu_k+d_k；

d_k＝[CA CA² CA³ ... CA^N]^Tx_k(0)，

不失一般性，假设

则d_k＝0，选取第k个运行批次中的M个关键时间点，第k个运行批次包括N个采样时刻，其中，t∈{1,2,…,N}，M≤N，A、B、C表示离散系统参数矩阵，y_k(N)表示第k个运行批次的采样时刻N的输出向量，u_k(N-1)表示第k个运行批次的第t时间的输入向量。

步骤4：选取单轴进给系统在运行过程中的当前运行批次中M个预设时间点，得到当前运行批次的输出向量。

构建满足收敛约束条件的托普利兹矩阵并对应得到单轴进给系统的加性不确定性，加性不确定性G_Δ的表达式为：

G_Δ＝G+Δ·W；

其中，Δ为托普利兹矩阵，且Δ∈Θ，

W为权重矩阵，G表示系统矩阵；

其中，δ_N-1和w_N-1为不确定因子矩阵参数；

其中，||u||表示控制电压u的2-范数，

表示系统矩阵G的最大奇异值；

通过加性不确定性更新输入输出矩阵模型得到点对点不确定性动力学方程，点对点不确定性动力学方程为：

其中

表示第k个运行批次的M个关键时间点的输出向量，u_k＝[u_k(0),u_k(1),...,u_k(N-1)]^T，u_k(N-1)表示第k个运行批次的采样时刻t输入向量。

进一步的，系统仿真时间设定为T＝2s，采样时间设定为T_s＝0.01s，则系统的离散状态空间表达式的参数矩阵分别为：

C＝[0 1]

不失一般性，取五个关键时间点对系统进行点对点跟踪控制，选取的采样点为t＝{20,60,100,140,180}，即跟踪时刻分别为：

t₁＝0.2s,t₂＝0.6s,t₃＝1.0s,t₄＝1.4s,t₅＝1.8s；

跟踪点处的参考值设定为

r^p＝[0.0048 0.0029 -0.0029 -0.0048 0]^T

同时设定初始状态为x_k(0)＝[0,0]^T。

假设系统的不确定性Δ以及W的参数分别为：

C_Δ＝[0 -14.5455]

C_W＝[0 10]

则有：

此时||Δ||＝0.8982<1。

步骤5：通过预设时间点在当前运行批次的输出向量确定预设时间点在当前运行批次的跟踪误差。

传统的迭代学习控制方法的控制目标是跟踪整个运行时间内的完整参考轨迹,即y_k(t)→r(t)，其中t∈{1,2,…,N}，y_k(t)为系统第k批次t时刻的实际输出,r(t)为第k批次t时刻的参考轨迹。对于点对点跟踪问题，只需要跟踪一些关键时间点处的参考值，即y_k(t_i)＝r(t_i)，i＝1,2,…,M，假设关键时间点按升序排列，即0<t₁<t₂<…<t_M≤N，确定关键时间点的参考值r(t_b)为第k批次t_b时刻的输出y_k(t_b)，即y_k(t_b)＝r(t_b)，t_b表示关键时间点中的一个采样时刻，b为参数，b≤M；

计算得到M个关键时间点的参考值向量r^p，其计算公式为：

r^p＝[r(t₁),r(t₂),...,r(t_M)]^T；

确定N个采样时刻内所选取的M个关键时间点的输出为

其中，ψ表示M行N列的转换矩阵，当第i个采样时刻t_i为关键时间点时，该矩阵第i行的所有N个元素除j＝t时为1其余全为0，从而可得到ψy_k为整个轨迹N个采样时刻点内所选取的M个关键时间点的实际输出值，ψ的表达式为：

其中，ψ_ij为转换矩阵ψ中第i行第j列的元素；

确定第k批次的跟踪误差

其计算公式为：

其中，

e_k(t_M)表示第k个运行批次的采样时刻t_M的输出向量。

步骤6：根据M个预设时间点确定转换矩阵并修正系统矩阵，通过修正后的系统矩阵得到基于当前运行批次的跟踪误差和学习增益的迭代学习控制更新律。

步骤6.1：利用现有的迭代学习控制方法进行计算，其中，迭代学习更新律的形式为现有技术，本申请不再赘述如何获取该更新律。

收敛约束条件为Δ∈Θ，

构建的满足收敛约束条件的托普利兹矩阵Δ＝0：

确定得到的迭代学习控制更新律的表达式为：

L_u＝((G^p)^TQG^p+R+S)^-1((G^p)^TQG^p+R)；

L_e＝((G^p)^TQG^p+R+S)^-1(G^p)^TQ；

其中，Q、R、S表示对称正定权重矩阵，G^p＝ΨG，G表示系统矩阵，ψ表示M行N列的转换矩阵。

则进一步可以得到：

L_u-L_eG^p＝((G^p)^TQG^p+R+S)^-1R；

渐近稳定的迭代学习控制系统在收敛前可能在迭代域经历大瞬变，单调收敛是比渐近稳定更强的稳定性要求，并使暂态增长的可能性最小化，若||L_u-L_eG^p||<1，则当迭代批次k→∞时，系统点对点输出跟踪误差收敛；

进一步的，

确定系统稳态输入信号

则u_∞＝(L_u-L_eG^p)u_∞+L_er^p；

进一步得到u_∞-u_k+1＝(L_u-L_eG^p)(u_∞-u_k)，||u_∞-u_k+1||≤η||u_∞-u_k||，

其中η表示辅助变量，η＝||L_u-L_eG^p||；

若满足||L_u-L_eG^p||<1，则控制输入在范数意义下单调收敛，进一步得到

其中，

表示第∞批次下的跟踪误差向量。

当各权重矩阵参数确定时,可以得出,稳态误差范数最终将收敛到常值。并且若S越小,在迭代学习控制更新律作用下系统的点对点跟踪稳态误差越小；特别地当S取为零矩阵时,系统跟踪点处的输出误差范数可以收敛到零。由此可以推出，当Δ≠0时，若满足

则不确定系统鲁棒单调收敛。

因为传统算法鲁棒单调收敛条件是有关Δ的表达式，因此无法使用该条件去保证系统鲁棒单调收敛，并且，使用代数方法去消除Δ可能会使结果具有很大的保守性。又因为Δ结构的特殊性及其最大奇异值小于1。因此，可使用μ分析法进行不确定系统鲁棒单调收敛条件的分析，μ又称为结构奇异值。

传统范数最优点对点ILC算法是在Δ＝0的假设下得到的，一旦各参数确定则学习律增益就固定不变了。根据所示的加性不确定性系统以及点对点跟踪任务可知，系统执行点对点跟踪任务时可将不确定性范围扩展到||ΨΔ||<1。针对上述问题，提出了一个最坏情况下的范数最优点对点迭代学习控制设计框架。

步骤6.2：收敛约束条件为Δ∈Ξ，

且构建的满足收敛约束条件的托普利兹矩阵Δ满足

鲁棒单调收敛点对点迭代学习控制更新律并不基于Δ＝0的假设得到，而是通过求解一个最坏情况下的优化问题。

确定迭代学习控制更新律的表达式为：

表示预设时间点在当前运行批次的跟踪误差，

表示输入项的学习增益，

表示误差项的学习增益，

表示N×N维度的实数矩阵，

其中，

I表示单位矩阵，Q、R、S表示对称正定权重矩阵，G^p＝ΨG，G表示系统矩阵；

其中，

第k个运行批次包括N个采样时刻；

通过性能指标函数得到每个运行批次的控制输入J(u_k+1)，性能指标函数的表达式为：

其中，

表示跟踪误差，

表示控制振荡，

表示控制能量，

u_k＝[u_k(0),u_k(1),...,u_k(N-1)]^T，u_k+1＝[u_k+1(0),u_k+1(1),...,u_k+1(N-1)]^T；

且有||ΨΔ||≤||Ψ||||Δ||＝||Δ||，各部分分别用对称正定权重矩阵Q、R和S来表示其优先级，即Q＝Q^T>0,R＝R^T≥0,S＝S^T≥0，不失一般性，可取权阵Q＝qI,R＝rI,S＝sI，其中，Q、R、S表示对称正定权重矩阵，h为参数，将跟踪误差替换为点对点跟踪误差

得到更新后性能指标函数为：

其中，

点对点控制输入；

为通过拉格朗日对偶函数将求解

转化为最小化问题函数

时得到的最优解。

为了解决最小-最大化问题，利用拉格朗日对偶函数将最小-最大化问题转化为最小-最小化问题。因此，最小-最大化问题可以重新表述为一个凸优化问题，从而保证全局最优解。

首先考虑关于不确定性Δ的最大化问题，因为性能指标函数只有第一项与Δ有关，将最小最大化函数的改写为最大化问题函数，求解

的最大化问题并改写为最大化问题函数：

令z_k+1＝ΨΔW(u_k+1-u_k)；

则约束条件||ΨΔ||<1改写为||z_k+1||²≤||W(u_k+1-u_k)||²；

则更新后最大化问题函数表示为：

上述最大化问题具有很强的对偶性，因此引入拉格朗日乘子λ_k+1，得到拉格朗日函数L(z_k+1,λ_k+1)，其表达式为：

对z_k+1微分并令

得到最坏情况下的

为：

其中，I表示单位矩阵；

因此，拉格朗日函数L(z_k+1,λ_k+1)的对偶函数为：

将更新后最大化问题函数转化为关于对偶函数最小化函数，即：

s.t.λ_k+1I-Q≥0

其中，

其中，

表示λ_k+1I-Q的伪逆；

将原始优化问题外部的最小化问题与最小化问题相结合，得到新对偶函数，且原始优化问题的最小化-最大化问题转化如下最小化-最小化问题。

通过新对偶性能指标函数对最小化问题函数进行改写，得到最小化问题函数：

其中，J_dual(u_k+1,λ_k+1)表示新对偶性能指标函数，且

其中，

值域；

其中，最小化问题

是关于λ_k+1的凸优化问题，因此最优解

可由新对偶性能指标函数通过对λ_k+1微分得到，将

代入新对偶性能指标函数得到：

对新对偶性能指标函数中的u_k+1进行微分，并令

合并同类项得到更新后指标函数：

其中，因为Q、R、S为对称正定权重矩阵，且

也是正定的，因此Q_k+1和R_k+1也是正定的，则(G^p)^TQ_k+1G^p+R_k+1+S可逆。

假设(u_k+1,λ_k+1)为更新后最小化问题函数的最优解，则当

时有

得到：

因为λ_k+1为最优解，得到：

由此得到：

且

对新对偶性能指标函数进行改写得到：

对λ_k+1求微分并令

得到最优参数

的解析表达式。并且当||W(u_k+1-u_k)||₂≠0时有

否则

且

一定满足

的约束条件；

将更新后最小化问题函数转化为与输入信号u_k+1有关的无约束优化问题函数，其表达式为：

其中，

利用凸规划可以有效地解决这一问题。可使用现有的凸优化工具箱CVX求解优化问题得到全局最优解

根据式可得出

因此迭代学习控制更新律的各变增益参数也随之确定。

由此可知，当系统不确定性很小时，即||W||≈0时，

所提鲁棒迭代学习控制算法的变增益参数Q_k+1→Q,R_k+1→R。因为该迭代学习控制算法是稳定收敛的，则有k→∞时，u_k+1＝u_k。进一步可知k→∞时

Q_k+1最终会收敛到Q，但是||R_k+1||会不断增大。||R_k+1||增大会使收敛速度降低，这也证明了鲁棒单调收敛点对点迭代学习控制算法在鲁棒性能和收敛速度之间的妥协。

步骤7：通过迭代学习控制更新律对输入向量进行迭代更新直到跟踪误差不大于预设值。

根据鲁棒单调收敛点对点迭代学习控制算法确定单轴进给系统的每一迭代批次的输入向量，将得到的输入向量输入单轴进给系统进行点对点轨迹跟踪控制，单轴进给系统在输入向量的控制作用下实现点对点跟踪误差单调收敛，并与传统范数最优迭代学习控制算法进行了性能比较。

下面举出一种具体的实施例，分别用传统范数最优迭代学习控制算法与鲁棒单调收敛点对点迭代学习控制算法作用于该实际模型。鲁棒单调收敛点对点迭代学习控制算法已给出了具体的单调收敛条件，然而统范数最优迭代学习控制算法并没有得出具体的单调收敛条件，因此，将首先使用μ分析法进行传统范数最优迭代学习控制算法应用于不确定系统鲁棒单调收敛条件的分析。

μ分析方法的基本思想为：通过对系统中输入、输出、传递函数、确定性因子等进行回路整形,得到如图2所示的BDBP(块对角有界摄动)问题，并基于μ分析法进行系统分析和设计。此外M为确定性结构，Δ_M为系统总的不确定性且需满足条件||Δ_M||<1。

将传统范数最优迭代学习控制更新律(23)作用于不确定系统(13)，其结构框图为图3。其中ω为迭代批次方向的转移因子，且有u_k+1＝ωu_k。引入一虚拟不确定因子

则图3所示系统鲁棒单调收敛等价于图4所示系统鲁棒单调收敛。

忽略参考轨迹的影响，由图4得

其中Δ_M＝diag(Δ,Δ_p)。

对于系统M以及不确定性Δ_M，M关于Δ_M的最大结构奇异值

为：

如果不存在满足det(I-MΔ_M)＝0的Δ_M，则令

基于μ分析方法可得，系统鲁棒单调收敛的条件为

最大结构奇异值是使系统稳定的最大不确定性范围的度量，但是一般情况下在应用过程中难以通过直接计算得到系统的结构奇异值。因此结构奇异值的计算是一个逐步逼近的过程，用一个上界代替

通过引入标定阵D_M，且D_M满足

D_M＝{diag(D,D_p),D_MΔ_M＝Δ_MD_M}；

为简化运算，取D_p＝I。进一步有

因此此时仅需满足DΔ＝ΔD。则给定系统(70)中M，

的上界估计值为

因为Δ为下三角托普利兹矩阵，因此D可以设计为相同结构的形式以满足条件,即

则可知使得

成立的充分条件为

由更新律可知权阵R对系统收敛速度有较大影响，因此在进行系统鲁棒性分析时，着重R的影响。

当R＝0时，根据式(25)可知L_u-L_eG^p＝0，取D＝dW^-1，则可得

由此可知，给定

d＝||L_eΨW||；

上述不等式可以等价转换为

||L_eΨW||<1；

又因为

则进一步可得

可知系统鲁棒单调的收敛条件为

||((G^p)^TQG^p+S)^-1(G^p)^TQΨW||<1；

假设R＝0时系统鲁棒单调收敛，则对于任意的权重矩阵R＝rI,r≥0，更新律依然能保证不确定系统鲁棒单调收敛。由此可知存在一常数α，0≤α<1使得

||((G^p)^TQG^p+S)^-1(G^p)^TQΨΔW||≤α<1；

因为Q和S为对称正定权重矩阵，则(G^p)^TQG^p+S为正定阵，对其进行奇异值分解得到(G^p)^TQG^p+S＝U∑U^T，其中U为酉矩阵，而且∑＝diag{σ_i}，σ_i为分解矩阵的第i个奇异值。进一步得

则可知权重矩阵R＝rI的设计不会影响被控系统的鲁棒收敛性，另一方面，参数S的设计需要满足条件。

点对点跟踪均方误差的阈值设定为ε＝0.1mm²。权重矩阵分别取为Q＝10000I,R＝0.1I,S＝0.0001I。根据鲁棒单调收敛点对点迭代学习控制更新律(67)对单轴进给系统进行控制。为了进行比较，使用具有相同权重矩阵的传统范数最优迭代学习控制算法来执行相同的控制任务。图5为鲁棒单调收敛点对点迭代学习控制算法的点对点估计跟踪效果图，表明经过一定的迭代批次k后，系统在关键跟踪点处的输出值能准确跟踪到参考值。图6和图7表明鲁棒单调收敛点对点迭代学习控制算法(鲁棒算法)和传统范数最优迭代学习控制算法(传统算法)经过一定的迭代批次后都能够实现单调收敛。并且当||Δ||<1时，传统算法收敛速度比鲁棒算法快，这是由于λ_k+1随着批次不断增大，如图8所示。λ_k+1越大则R_k+1越大，这是导致鲁棒算法收敛速度慢的主要原因。接下来，增大不确定性Δ，取新的Δ参数为

C_Δ1＝[0 -54.5455]；

此时||Δ||>1但||ΨΔ||＝0.5344<1。图9为新的不确定性模型鲁棒单调收敛点对点迭代学习控制算法的点对点估计跟踪效果图，表明不确定性增大时，系统在关键跟踪点处的输出值依旧能准确跟踪到参考值。图10和图11表明鲁棒单调收敛点对点迭代学习控制算法(鲁棒算法)经过一定的迭代批次后依旧能够实现单调收敛，但是传统范数最优迭代学习控制算法(传统算法)并没有实现单调收敛，表明鲁棒算法的鲁棒性较强，验证了算法的合理性及有效性。

以上所述的仅是本申请的优选实施方式，本发明不限于以上实施例。可以理解，本领域技术人员在不脱离本发明的精神和构思的前提下直接导出或联想到的其他改进和变化，均应认为包含在本发明的保护范围之内。