CN113110063B - 单轴进给系统的鲁棒单调收敛点对点迭代学习控制方法 - Google Patents

单轴进给系统的鲁棒单调收敛点对点迭代学习控制方法 Download PDF

Info

Publication number
CN113110063B
CN113110063B CN202110500437.1A CN202110500437A CN113110063B CN 113110063 B CN113110063 B CN 113110063B CN 202110500437 A CN202110500437 A CN 202110500437A CN 113110063 B CN113110063 B CN 113110063B
Authority
CN
China
Prior art keywords
point
matrix
batch
vector
preset time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110500437.1A
Other languages
English (en)
Other versions
CN113110063A (zh
Inventor
陶洪峰
李健
王瑞
庄志和
黄彦德
陶新悦
胡计昶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan Digital Economy Industry Development Research Institute
Original Assignee
Jiangnan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangnan University filed Critical Jiangnan University
Priority to CN202110500437.1A priority Critical patent/CN113110063B/zh
Publication of CN113110063A publication Critical patent/CN113110063A/zh
Application granted granted Critical
Publication of CN113110063B publication Critical patent/CN113110063B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明公开了一种单轴进给系统的鲁棒单调收敛点对点迭代学习控制方法,涉及单轴进给系统领域,该方法包括:通过动力学方程式表示单轴进给系统,将动力学方程式转变离散状态空间模型并得到输入输出矩阵模型;选取M个预设时间点,通过满足预设条件的托普利兹矩阵得到点对点不确定性动力学方程并得到预设时间点在当前运行批次的输出向量;通过预设时间点在当前运行批次的输出向量确定预设时间点在当前运行批次的跟踪误差;通过迭代学习控制更新律对当前运行批次的输入向量进行迭代更新直到跟踪误差不大于预设值,通过当前运行批次的输入向量对单轴进给系统进行控制,实现了点对点跟踪误差单调收敛。

Description

单轴进给系统的鲁棒单调收敛点对点迭代学习控制方法
技术领域
本发明涉及单轴进给系统领域,尤其是一种单轴进给系统的鲁棒单调收敛点对点迭代学习控制方法。
背景技术
单轴进给系统是一种在机械工业普遍运用的驱动系统,例如激光切割机、数控机床、电火花线切割机、水射流机等都需要使用到单轴进给系统,在实际使用中需要驱动单轴进给系统按照特定的轨迹运动,但实际在运行过程中,单轴进给系统跟踪该特定的轨迹运动的能力不强,往往会有一定的误差,为了修正这一误差提高单轴进给系统的跟踪精度,迭代学习控制方法得到了极大的发展,迭代学习控制方法适用于有限时间范围内多批次执行同一任务的系统,迭代学习控制方法的原理是:使用之前运行批次的误差与控制输入信息,不断修正更新当前运行批次的控制输入信息,从而减小当前运行批次的跟踪误差,通过迭代学习控制方法,即使部分方法参数未知或者存在未知的外部干扰,也能保证跟踪误差在一定条件下的收敛性。
在大多数情况下,迭代学习控制方法的目的是解决跟踪误差的问题,然而在许多迭代学习方法的应用中,往往不需要跟踪完整的轨迹运动,只需要在一些关键的时间点满足跟踪要求即可,因此现有的迭代学习控制方法不能满足这一要求,同时当建立的模拟模型不够准确时,鲁棒性会是一个严重的问题,迭代学习控制方法的收敛速度会变慢,甚至不能为原有的控制问题提供有效解。
发明内容
本发明人针对上述问题及技术需求,提出了一种单轴进给系统的鲁棒单调收敛点对点迭代学习控制方法,本发明的技术方案如下:
一种单轴进给系统的鲁棒单调收敛点对点迭代学习控制方法,所述方法包括以下步骤:
通过动力学方程式表示单轴进给系统的动态模型,所述动力学方程式描述当前单轴进给系统的实际位置和控制电压之间的关系,将所述实际位置作为输出向量,并根据所述实际位置定义状态向量,定义控制电压为输入向量,将所述动力学方程式转变为关于当前运行批次的离散状态空间模型;
将所述离散状态空间模型转换为关于时间序列的输入输出矩阵模型,所述输入输出矩阵模型描述输入向量和输出向量之间的关系;
选取所述单轴进给系统在运行过程中的当前运行批次中M个预设时间点,构建满足收敛约束条件的托普利兹矩阵并对应得到所述单轴进给系统的加性不确定性,通过所述加性不确定性更新所述输入输出矩阵模型得到点对点不确定性动力学方程,通过所述点对点不确定动力学方程得到所述预设时间点在当前运行批次的输出向量;
通过所述预设时间点在当前运行批次的输出向量确定所述预设时间点在当前运行批次的跟踪误差;
根据所述M个预设时间点确定转换矩阵并修正系统矩阵,通过修正后的系统矩阵得到基于当前运行批次的跟踪误差和学习增益的迭代学习控制更新律;
通过所述迭代学习控制更新律对当前运行批次的输入向量进行迭代更新直到所述预设时间点在当前运行批次的跟踪误差不大于预设值,通过所述当前运行批次的输入向量对所述单轴进给系统进行控制。
其进一步的技术方案为,所述动力学方程式的表达式为:
Figure BDA0003056310510000021
其中m为惯性系数,c为粘滞摩擦系数,q为当前单轴进给系统的实际位置,
Figure BDA0003056310510000022
为当前单轴进给系统的速度,
Figure BDA0003056310510000023
为当前单轴进给系统的加速度,u为控制电压。
其进一步的技术方案为,所述将所述动力学方程式转变为关于当前运行批次的离散状态空间模型,包括:
将实际位置q作为输出向量,利用当前单轴进给系统的实际位置定义状态向量x:
Figure BDA0003056310510000031
并定义控制电压u为输入向量;
将所述动力学方程式转变为连续系统模型,所述连续系统模型的表达式为:
Figure BDA0003056310510000032
其中,m为惯性系数,c为粘滞摩擦系数;
对所述连续系统模型进行离散化处理得到离散状态空间模型,则所述离散状态空间模型的表达式为:
Figure BDA0003056310510000033
其中,k表示单轴进给系统的运行批次,第k个运行批次包括N个采样时刻,uk(t)、yk(t)和xk(t)分别为单轴进给系统第k个运行批次在采样时刻t的输入向量、输出向量和状态向量,xk(t+1)单轴进给系统第k个运行批次在采样时刻t+1的状态向量,A、B、C表示离散系统参数矩阵,且满足CB≠0,xk(0)=x0,x0表示常向量。
其进一步的技术方案为,所述输入输出矩阵模型的表达式为:
yk=Guk+dk
其中,yk=[yk(1),yk(2),...,yk(N)]T,uk=[uk(0),uk(1),...,uk(N-1)]T
dk=[CA CA2 CA3 ... CAN]Txk(0),
Figure BDA0003056310510000034
uk,yk和xk分别为第k个运行批次的输入向量、输出向量和状态向量,其中,t∈{1,2,…,N},M≤N,yk(N)表示第k个运行批次的采样时刻N的输出向量,uk(N-1)表示第k个运行批次的采样时刻N-1的输入向量,A、B、C表示离散系统参数矩阵,且满足CB≠0,xk(0)=x0,x0表示常向量。
其进一步的技术方案为,所述加性不确定性GΔ的表达式为:
GΔ=G+Δ·W;
其中,Δ为托普利兹矩阵,且Δ∈Θ,
Figure BDA0003056310510000041
W为权重矩阵,G表示系统矩阵;
Figure BDA0003056310510000042
其中,δN-1和wN-1为不确定因子矩阵参数;
Figure BDA0003056310510000043
其中,||u||表示控制电压u的2-范数,
Figure BDA0003056310510000044
Figure BDA0003056310510000045
表示系统矩阵G的最大奇异值。
其进一步的技术方案为,不失一般性,令xk(0)=0,所述点对点不确定性动力学方程为:
Figure BDA0003056310510000046
其中
Figure BDA0003056310510000047
GΔ表示加性不确定性,
Figure BDA0003056310510000048
表示第k个运行批次的M个预设时间点的输出向量,uk=[uk(0),uk(1),...,uk(N-1)]T,uk(N-1)表示第k个运行批次的采样时刻N-1的输入向量。
其进一步的技术方案为,所述通过所述预设时间点在当前运行批次的输出向量确定所述预设时间点在当前运行批次的跟踪误差,包括:
确定第k批次tb时刻的参考值r(tb)为第k批次tb时刻的输出yk(tb),即yk(tb)=r(tb),tb表示预设时间点中的一个时刻,b为参数,b≤M;
计算得到M个预设时间点的参考值向量rp,其计算公式为:
rp=[r(t1),r(t2),...,r(tM)]T
确定预设时间点在当前运行批次的输出向量为
Figure BDA0003056310510000051
yk为第k个运行批次的输出向量,r(tM)表示第k批次tM时刻的参考值,其中,ψ表示M行N列的转换矩阵,ψ的表达式为:
Figure BDA0003056310510000052
其中,ψij为转换矩阵ψ中第i行第j列的元素;
确定预设时间点在当前运行批次的跟踪误差
Figure BDA0003056310510000053
其计算公式为:
Figure BDA0003056310510000054
其中,
Figure BDA0003056310510000055
为预设时间点在当前运行批次的输出向量。
其进一步的技术方案为,所述收敛约束条件为Δ∈Θ,
Figure BDA0003056310510000056
构建的满足收敛约束条件的托普利兹矩阵Δ=0:
确定得到的所述迭代学习控制更新律的表达式为:
Figure BDA0003056310510000057
uk为第k个运行批次的输入向量,uk+1为第k+1个运行批次的输入向量,
Figure BDA0003056310510000058
表示预设时间点在当前运行批次的跟踪误差,Lu表示输入项的学习增益,Le表示误差项的学习增益,计算公式为:
Lu=((Gp)TQGp+R+S)-1((Gp)TQGp+R);
Le=((Gp)TQGp+R+S)-1(Gp)TQ;
其中,Q、R、S表示对称正定权重矩阵,Gp=ΨG,G表示系统矩阵,ψ表示根据所述M个预设时间点确定的转换矩阵且ψ的表达式为:
Figure BDA0003056310510000059
其中,ψij为转换矩阵ψ中第i行第j列的元素。
其进一步的技术方案为,所述收敛约束条件为Δ∈Ξ,
Figure BDA0003056310510000061
且构建的满足收敛约束条件的托普利兹矩阵Δ满足
Figure BDA0003056310510000062
确定所述迭代学习控制更新律的表达式为:
Figure BDA0003056310510000063
其中,uk为第k个运行批次的输入向量,uk+1为第k+1个运行批次的输入向量,
Figure BDA0003056310510000064
表示预设时间点在当前运行批次的跟踪误差,
Figure BDA0003056310510000065
表示输入项的学习增益,
Figure BDA0003056310510000066
表示误差项的学习增益,
Figure BDA0003056310510000067
表示N×N维度的实数矩阵;
Figure BDA0003056310510000068
Figure BDA0003056310510000069
其中,
Figure BDA00030563105100000610
I表示单位矩阵,Q、R、S表示对称正定权重矩阵,Gp=ΨG,G表示系统矩阵,ψ表示根据所述M个预设时间点确定的转换矩阵且ψ的表达式为:
Figure BDA00030563105100000611
其中,ψij为转换矩阵ψ中第i行第j列的元素;
其中,
Figure BDA00030563105100000612
Figure BDA00030563105100000613
第k个运行批次包括N个采样时刻;
Figure BDA00030563105100000614
为通过拉格朗日对偶函数将求解
Figure BDA00030563105100000615
转化为最小化问题函数
Figure BDA00030563105100000616
时得到的最优解。
其进一步的技术方案为,所述
Figure BDA00030563105100000617
为通过拉格朗日对偶函数将求解
Figure BDA0003056310510000071
转化为最小化问题函数
Figure BDA0003056310510000072
时得到的最优解,包括:
求解
Figure BDA0003056310510000073
的最大化问题并将
Figure BDA0003056310510000074
改写为最大化问题函数:
Figure BDA0003056310510000075
Figure BDA0003056310510000076
令zk+1=ΨΔW(uk+1-uk);
则约束条件||ΨΔ||<1改写为||zk+1||2≤||W(uk+1-uk)||2
则更新后最大化问题函数表示为:
Figure BDA0003056310510000077
引入拉格朗日乘子λk+1,得到拉格朗日函数L(zk+1k+1),其表达式为:
Figure BDA0003056310510000078
对zk+1微分并令
Figure BDA0003056310510000079
得到:
Figure BDA00030563105100000710
其中,I表示单位矩阵;
因此,拉格朗日函数L(zk+1k+1)的对偶函数为:
Figure BDA00030563105100000711
将所述更新后最大化问题函数转化为关于对偶函数最小化函数,即:
Figure BDA0003056310510000081
s.t.λk+1I-Q≥0
Figure BDA0003056310510000082
其中,
Figure BDA0003056310510000083
其中,
Figure BDA0003056310510000084
表示λk+1I-Q的伪逆;
通过新对偶性能指标函数对所述对偶函数最小化函数进行改写,得到最小化问题函数:
Figure BDA0003056310510000085
其中,Jdual(uk+1k+1)表示新对偶性能指标函数,且
Figure BDA0003056310510000086
其中,
Figure BDA0003056310510000087
值域;
其中,最小化问题
Figure BDA0003056310510000088
是关于λk+1的凸优化问题,因此最优解
Figure BDA0003056310510000089
可由所述新对偶性能指标函数通过对λk+1微分得到,将
Figure BDA00030563105100000810
代入新对偶性能指标函数得到:
Figure BDA00030563105100000811
对所述新对偶性能指标函数中的uk+1进行微分,并令
Figure BDA00030563105100000812
合并同类项得到更新后指标函数:
Figure BDA00030563105100000813
本发明的有益技术效果是:针对单轴进给系统此类具有重复运动特征的线性系统为被控对象设计点对点轨迹跟踪迭代学习控制算法;控制算法可以利用轨迹跟踪部分关键时间点处的跟踪误差信息来更新控制输入,进而消除了不必要的非关键点跟踪约束,非关键点处的自由度给迭代学习控制算法设计增加自由度的同时,也增加了系统整体性能的提升空间;本方法基于范数最优迭代学习框架,设计了一种最坏情况下的鲁棒范数最优点对点迭代学习控制方法,保证系统建模不确定性较大时依然能够实现点对点跟踪误差单调收敛。
附图说明
图1是本申请的控制方法的流程示意图。
图2是块对角块对角有界摄动结构图(M-ΔM结构图)。
图3是不确定性系统传统范数最优迭代学习控制算法框图。
图4是不确定性系统传统范数最优迭代学习控制算法M-ΔM结构图。
图5是不确定性较小时单轴进给系统的实际输出与参考点跟踪曲线图。
图6是不确定性较小时鲁棒算法与传统算法均方误差比较曲线图。
图7是不确定性较小时鲁棒算法与传统算法性能指标比较曲线图。
图8是不确定性较小时鲁棒算法的增益参数λk+1随迭代批次变化图。
图9是不确定性较大时单轴进给系统的实际输出与参考点跟踪曲线图。
图10是不确定性较大时鲁棒算法与传统算法均方误差比较曲线图。
图11是不确定性较大时鲁棒算法与传统算法性能指标比较曲线图。
具体实施方式
下面结合附图对本发明的具体实施方式做进一步说明。
一种单轴进给系统的鲁棒单调收敛点对点迭代学习控制方法,具体步骤如图1所示。
步骤1:通过动力学方程式表示单轴进给系统的动态模型,动力学方程式描述当前单轴进给系统的实际位置和控制电压之间的关系。
Figure BDA0003056310510000091
其中m为惯性系数,c为粘滞摩擦系数,q为当前单轴进给系统的实际位置,u为控制电压。
具体的,设定惯性系数m=0.044Vs2/mm,设定粘滞摩擦系数c=0.21Vs/mm。
步骤2:利用当前单轴进给系统的实际位置定义状态向量x:
Figure BDA0003056310510000101
并定义控制电压u为输入向量,将实际位置作为输出向量;
将动力学方程式转变为连续系统模型,连续系统模型的表达式为:
Figure BDA0003056310510000102
其中,m为惯性系数,c为粘滞摩擦系数,q为当前单轴进给系统的实际位置,
Figure BDA0003056310510000103
为当前单轴进给系统的速度,
Figure BDA0003056310510000104
为当前单轴进给系统的加速度,u为控制电压。
选取满足香农采样定理的采样周期Ts,并将实际位置作为输出,对连续系统模型进行离散化处理得到离散状态空间模型,则离散状态空间模型的表达式为:
Figure BDA0003056310510000105
其中,k表示单轴进给系统的运行批次,第k个运行批次包括N个采样时刻,uk(t),yk(t)和xk(t)分别为单轴进给系统第k个运行批次采样时刻t的输入向量、输出向量和状态向量,其中N=T/Ts;xk(t+1)单轴进给系统第k个运行批次采样时刻t+1的状态向量,A、B、C表示离散系统参数矩阵,且满足CB≠0,假设系统每批次运行完成后初始状态完美重置,即xk(0)=x0,x0表示常向量。
步骤3:将离散状态空间模型转换为关于时间序列的输入输出矩阵模型。
输入输出矩阵模型的表达式为:
yk=Guk+dk
其中,yk=[yk(1),yk(2),...,yk(N)]T,uk=[uk(0),uk(1),...,uk(N-1)]T
dk=[CA CA2 CA3 ... CAN]Txk(0),
Figure BDA0003056310510000111
不失一般性,假设
Figure BDA0003056310510000112
则dk=0,选取第k个运行批次中的M个关键时间点,第k个运行批次包括N个采样时刻,其中,t∈{1,2,…,N},M≤N,A、B、C表示离散系统参数矩阵,yk(N)表示第k个运行批次的采样时刻N的输出向量,uk(N-1)表示第k个运行批次的第t时间的输入向量。
步骤4:选取单轴进给系统在运行过程中的当前运行批次中M个预设时间点,得到当前运行批次的输出向量。
构建满足收敛约束条件的托普利兹矩阵并对应得到单轴进给系统的加性不确定性,加性不确定性GΔ的表达式为:
GΔ=G+Δ·W;
其中,Δ为托普利兹矩阵,且Δ∈Θ,
Figure BDA0003056310510000113
W为权重矩阵,G表示系统矩阵;
Figure BDA0003056310510000114
其中,δN-1和wN-1为不确定因子矩阵参数;
Figure BDA0003056310510000115
其中,||u||表示控制电压u的2-范数,
Figure BDA0003056310510000116
Figure BDA0003056310510000117
表示系统矩阵G的最大奇异值;
通过加性不确定性更新输入输出矩阵模型得到点对点不确定性动力学方程,点对点不确定性动力学方程为:
Figure BDA0003056310510000118
其中
Figure BDA0003056310510000121
Figure BDA0003056310510000122
表示第k个运行批次的M个关键时间点的输出向量,uk=[uk(0),uk(1),...,uk(N-1)]T,uk(N-1)表示第k个运行批次的采样时刻t输入向量。
进一步的,系统仿真时间设定为T=2s,采样时间设定为Ts=0.01s,则系统的离散状态空间表达式的参数矩阵分别为:
Figure BDA0003056310510000123
C=[0 1]
不失一般性,取五个关键时间点对系统进行点对点跟踪控制,选取的采样点为t={20,60,100,140,180},即跟踪时刻分别为:
t1=0.2s,t2=0.6s,t3=1.0s,t4=1.4s,t5=1.8s;
跟踪点处的参考值设定为
rp=[0.0048 0.0029 -0.0029 -0.0048 0]T
同时设定初始状态为xk(0)=[0,0]T
假设系统的不确定性Δ以及W的参数分别为:
Figure BDA0003056310510000124
CΔ=[0 -14.5455]
Figure BDA0003056310510000125
CW=[0 10]
则有:
Figure BDA0003056310510000126
Figure BDA0003056310510000131
此时||Δ||=0.8982<1。
步骤5:通过预设时间点在当前运行批次的输出向量确定预设时间点在当前运行批次的跟踪误差。
传统的迭代学习控制方法的控制目标是跟踪整个运行时间内的完整参考轨迹,即yk(t)→r(t),其中t∈{1,2,…,N},yk(t)为系统第k批次t时刻的实际输出,r(t)为第k批次t时刻的参考轨迹。对于点对点跟踪问题,只需要跟踪一些关键时间点处的参考值,即yk(ti)=r(ti),i=1,2,…,M,假设关键时间点按升序排列,即0<t1<t2<…<tM≤N,确定关键时间点的参考值r(tb)为第k批次tb时刻的输出yk(tb),即yk(tb)=r(tb),tb表示关键时间点中的一个采样时刻,b为参数,b≤M;
确定第k批次tb时刻的参考值r(tb)为第k批次tb时刻的输出yk(tb),即yk(tb)=r(tb),tb表示预设时间点中的一个时刻,b为参数,b≤M;
计算得到M个关键时间点的参考值向量rp,其计算公式为:
rp=[r(t1),r(t2),...,r(tM)]T
确定N个采样时刻内所选取的M个关键时间点的输出为
Figure BDA0003056310510000132
其中,ψ表示M行N列的转换矩阵,当第i个采样时刻ti为关键时间点时,该矩阵第i行的所有N个元素除j=t时为1其余全为0,从而可得到ψyk为整个轨迹N个采样时刻点内所选取的M个关键时间点的实际输出值,ψ的表达式为:
Figure BDA0003056310510000133
其中,ψij为转换矩阵ψ中第i行第j列的元素;
确定第k批次的跟踪误差
Figure BDA0003056310510000141
其计算公式为:
Figure BDA0003056310510000142
其中,
Figure BDA0003056310510000143
ek(tM)表示第k个运行批次的采样时刻tM的输出向量。
步骤6:根据M个预设时间点确定转换矩阵并修正系统矩阵,通过修正后的系统矩阵得到基于当前运行批次的跟踪误差和学习增益的迭代学习控制更新律。
步骤6.1:利用现有的迭代学习控制方法进行计算,其中,迭代学习更新律的形式为现有技术,本申请不再赘述如何获取该更新律。
收敛约束条件为Δ∈Θ,
Figure BDA0003056310510000144
构建的满足收敛约束条件的托普利兹矩阵Δ=0:
确定得到的迭代学习控制更新律的表达式为:
Figure BDA0003056310510000145
uk为第k个运行批次的输入向量,uk+1为第k+1个运行批次的输入向量,
Figure BDA0003056310510000146
表示预设时间点在当前运行批次的跟踪误差,Lu表示输入项的学习增益,Le表示误差项的学习增益,计算公式为:
Lu=((Gp)TQGp+R+S)-1((Gp)TQGp+R);
Le=((Gp)TQGp+R+S)-1(Gp)TQ;
其中,Q、R、S表示对称正定权重矩阵,Gp=ΨG,G表示系统矩阵,ψ表示M行N列的转换矩阵。
则进一步可以得到:
Lu-LeGp=((Gp)TQGp+R+S)-1R;
渐近稳定的迭代学习控制系统在收敛前可能在迭代域经历大瞬变,单调收敛是比渐近稳定更强的稳定性要求,并使暂态增长的可能性最小化,若||Lu-LeGp||<1,则当迭代批次k→∞时,系统点对点输出跟踪误差收敛;
进一步的,
Figure BDA0003056310510000151
确定系统稳态输入信号
Figure BDA0003056310510000152
则u=(Lu-LeGp)u+Lerp
进一步得到u-uk+1=(Lu-LeGp)(u-uk),||u-uk+1||≤η||u-uk||,
其中η表示辅助变量,η=||Lu-LeGp||;
若满足||Lu-LeGp||<1,则控制输入在范数意义下单调收敛,进一步得到
Figure BDA0003056310510000153
其中,
Figure BDA0003056310510000154
表示第∞批次下的跟踪误差向量。
当各权重矩阵参数确定时,可以得出,稳态误差范数最终将收敛到常值。并且若S越小,在迭代学习控制更新律作用下系统的点对点跟踪稳态误差越小;特别地当S取为零矩阵时,系统跟踪点处的输出误差范数可以收敛到零。由此可以推出,当Δ≠0时,若满足
Figure BDA0003056310510000155
则不确定系统鲁棒单调收敛。
因为传统算法鲁棒单调收敛条件是有关Δ的表达式,因此无法使用该条件去保证系统鲁棒单调收敛,并且,使用代数方法去消除Δ可能会使结果具有很大的保守性。又因为Δ结构的特殊性及其最大奇异值小于1。因此,可使用μ分析法进行不确定系统鲁棒单调收敛条件的分析,μ又称为结构奇异值。
传统范数最优点对点ILC算法是在Δ=0的假设下得到的,一旦各参数确定则学习律增益就固定不变了。根据所示的加性不确定性系统以及点对点跟踪任务可知,系统执行点对点跟踪任务时可将不确定性范围扩展到||ΨΔ||<1。针对上述问题,提出了一个最坏情况下的范数最优点对点迭代学习控制设计框架。
步骤6.2:收敛约束条件为Δ∈Ξ,
Figure BDA0003056310510000161
且构建的满足收敛约束条件的托普利兹矩阵Δ满足
Figure BDA0003056310510000162
鲁棒单调收敛点对点迭代学习控制更新律并不基于Δ=0的假设得到,而是通过求解一个最坏情况下的优化问题。
确定迭代学习控制更新律的表达式为:
Figure BDA0003056310510000163
其中,uk为第k个运行批次的输入向量,uk+1为第k+1个运行批次的输入向量,
Figure BDA0003056310510000164
表示预设时间点在当前运行批次的跟踪误差,
Figure BDA0003056310510000165
表示输入项的学习增益,
Figure BDA0003056310510000166
表示误差项的学习增益,
Figure BDA0003056310510000167
表示N×N维度的实数矩阵,
Figure BDA0003056310510000168
Figure BDA0003056310510000169
Figure BDA00030563105100001610
其中,
Figure BDA00030563105100001611
I表示单位矩阵,Q、R、S表示对称正定权重矩阵,Gp=ΨG,G表示系统矩阵;
其中,
Figure BDA00030563105100001612
Figure BDA00030563105100001613
第k个运行批次包括N个采样时刻;
通过性能指标函数得到每个运行批次的控制输入J(uk+1),性能指标函数的表达式为:
Figure BDA00030563105100001614
其中,
Figure BDA00030563105100001615
Figure BDA00030563105100001616
表示跟踪误差,
Figure BDA00030563105100001617
Figure BDA0003056310510000171
表示控制振荡,
Figure BDA0003056310510000172
Figure BDA0003056310510000173
表示控制能量,
Figure BDA0003056310510000174
uk=[uk(0),uk(1),...,uk(N-1)]T,uk+1=[uk+1(0),uk+1(1),...,uk+1(N-1)]T
且有||ΨΔ||≤||Ψ||||Δ||=||Δ||,各部分分别用对称正定权重矩阵Q、R和S来表示其优先级,即Q=QT>0,R=RT≥0,S=ST≥0,不失一般性,可取权阵Q=qI,R=rI,S=sI,其中,Q、R、S表示对称正定权重矩阵,h为参数,将跟踪误差替换为点对点跟踪误差
Figure BDA0003056310510000175
得到更新后性能指标函数为:
Figure BDA0003056310510000176
其中,
Figure BDA0003056310510000177
点对点控制输入;
Figure BDA0003056310510000178
为通过拉格朗日对偶函数将求解
Figure BDA0003056310510000179
转化为最小化问题函数
Figure BDA00030563105100001710
时得到的最优解。
为了解决最小-最大化问题,利用拉格朗日对偶函数将最小-最大化问题转化为最小-最小化问题。因此,最小-最大化问题可以重新表述为一个凸优化问题,从而保证全局最优解。
首先考虑关于不确定性Δ的最大化问题,因为性能指标函数只有第一项与Δ有关,将最小最大化函数的改写为最大化问题函数,求解
Figure BDA00030563105100001711
的最大化问题并改写为最大化问题函数:
Figure BDA00030563105100001712
Figure BDA00030563105100001713
令zk+1=ΨΔW(uk+1-uk);
则约束条件||ΨΔ||<1改写为||zk+1||2≤||W(uk+1-uk)||2
则更新后最大化问题函数表示为:
Figure BDA0003056310510000181
上述最大化问题具有很强的对偶性,因此引入拉格朗日乘子λk+1,得到拉格朗日函数L(zk+1k+1),其表达式为:
Figure BDA0003056310510000182
对zk+1微分并令
Figure BDA0003056310510000183
得到最坏情况下的
Figure BDA0003056310510000184
为:
Figure BDA0003056310510000185
其中,I表示单位矩阵;
因此,拉格朗日函数L(zk+1k+1)的对偶函数为:
Figure BDA0003056310510000186
将更新后最大化问题函数转化为关于对偶函数最小化函数,即:
Figure BDA0003056310510000187
s.t.λk+1I-Q≥0
Figure BDA0003056310510000188
其中,
Figure BDA0003056310510000189
其中,
Figure BDA00030563105100001810
表示λk+1I-Q的伪逆;
将原始优化问题外部的最小化问题与最小化问题相结合,得到新对偶函数,且原始优化问题的最小化-最大化问题转化如下最小化-最小化问题。
通过新对偶性能指标函数对最小化问题函数进行改写,得到最小化问题函数:
Figure BDA0003056310510000191
其中,Jdual(uk+1k+1)表示新对偶性能指标函数,且
Figure BDA0003056310510000192
其中,
Figure BDA0003056310510000193
值域;
其中,最小化问题
Figure BDA0003056310510000194
是关于λk+1的凸优化问题,因此最优解
Figure BDA0003056310510000195
可由新对偶性能指标函数通过对λk+1微分得到,将
Figure BDA0003056310510000196
代入新对偶性能指标函数得到:
Figure BDA0003056310510000197
对新对偶性能指标函数中的uk+1进行微分,并令
Figure BDA0003056310510000198
合并同类项得到更新后指标函数:
Figure BDA0003056310510000199
其中,因为Q、R、S为对称正定权重矩阵,且
Figure BDA00030563105100001910
也是正定的,因此Qk+1和Rk+1也是正定的,则(Gp)TQk+1Gp+Rk+1+S可逆。
假设(uk+1k+1)为更新后最小化问题函数的最优解,则当
Figure BDA00030563105100001911
时有
Figure BDA00030563105100001912
得到:
Figure BDA00030563105100001913
因为λk+1为最优解,得到:
Figure BDA00030563105100001914
由此得到:
Figure BDA0003056310510000201
Figure BDA0003056310510000202
对新对偶性能指标函数进行改写得到:
Figure BDA0003056310510000203
对λk+1求微分并令
Figure BDA0003056310510000204
得到最优参数
Figure BDA0003056310510000205
的解析表达式。并且当||W(uk+1-uk)||2≠0时有
Figure BDA0003056310510000206
否则
Figure BDA0003056310510000207
Figure BDA0003056310510000208
一定满足
Figure BDA0003056310510000209
的约束条件;
将更新后最小化问题函数转化为与输入信号uk+1有关的无约束优化问题函数,其表达式为:
Figure BDA00030563105100002010
其中,
Figure BDA00030563105100002011
利用凸规划可以有效地解决这一问题。可使用现有的凸优化工具箱CVX求解优化问题得到全局最优解
Figure BDA00030563105100002012
根据式可得出
Figure BDA00030563105100002013
因此迭代学习控制更新律的各变增益参数也随之确定。
由此可知,当系统不确定性很小时,即||W||≈0时,
Figure BDA00030563105100002014
所提鲁棒迭代学习控制算法的变增益参数Qk+1→Q,Rk+1→R。因为该迭代学习控制算法是稳定收敛的,则有k→∞时,uk+1=uk。进一步可知k→∞时
Figure BDA00030563105100002015
Qk+1最终会收敛到Q,但是||Rk+1||会不断增大。||Rk+1||增大会使收敛速度降低,这也证明了鲁棒单调收敛点对点迭代学习控制算法在鲁棒性能和收敛速度之间的妥协。
步骤7:通过迭代学习控制更新律对输入向量进行迭代更新直到跟踪误差不大于预设值。
根据鲁棒单调收敛点对点迭代学习控制算法确定单轴进给系统的每一迭代批次的输入向量,将得到的输入向量输入单轴进给系统进行点对点轨迹跟踪控制,单轴进给系统在输入向量的控制作用下实现点对点跟踪误差单调收敛,并与传统范数最优迭代学习控制算法进行了性能比较。
下面举出一种具体的实施例,分别用传统范数最优迭代学习控制算法与鲁棒单调收敛点对点迭代学习控制算法作用于该实际模型。鲁棒单调收敛点对点迭代学习控制算法已给出了具体的单调收敛条件,然而统范数最优迭代学习控制算法并没有得出具体的单调收敛条件,因此,将首先使用μ分析法进行传统范数最优迭代学习控制算法应用于不确定系统鲁棒单调收敛条件的分析。
μ分析方法的基本思想为:通过对系统中输入、输出、传递函数、确定性因子等进行回路整形,得到如图2所示的BDBP(块对角有界摄动)问题,并基于μ分析法进行系统分析和设计。此外M为确定性结构,ΔM为系统总的不确定性且需满足条件||ΔM||<1。
将传统范数最优迭代学习控制更新律(23)作用于不确定系统(13),其结构框图为图3。其中ω为迭代批次方向的转移因子,且有uk+1=ωuk。引入一虚拟不确定因子
Figure BDA0003056310510000211
则图3所示系统鲁棒单调收敛等价于图4所示系统鲁棒单调收敛。
忽略参考轨迹的影响,由图4得
Figure BDA0003056310510000212
其中ΔM=diag(Δ,Δp)。
对于系统M以及不确定性ΔM,M关于ΔM的最大结构奇异值
Figure BDA0003056310510000221
为:
Figure BDA0003056310510000222
如果不存在满足det(I-MΔM)=0的ΔM,则令
Figure BDA0003056310510000223
基于μ分析方法可得,系统鲁棒单调收敛的条件为
Figure BDA0003056310510000224
最大结构奇异值是使系统稳定的最大不确定性范围的度量,但是一般情况下在应用过程中难以通过直接计算得到系统的结构奇异值。因此结构奇异值的计算是一个逐步逼近的过程,用一个上界代替
Figure BDA0003056310510000225
通过引入标定阵DM,且DM满足
DM={diag(D,Dp),DMΔM=ΔMDM};
为简化运算,取Dp=I。进一步有
Figure BDA0003056310510000226
因此此时仅需满足DΔ=ΔD。则给定系统(70)中M,
Figure BDA0003056310510000227
的上界估计值为
Figure BDA0003056310510000228
因为Δ为下三角托普利兹矩阵,因此D可以设计为相同结构的形式以满足条件,即
Figure BDA0003056310510000229
则可知使得
Figure BDA00030563105100002210
成立的充分条件为
Figure BDA00030563105100002211
由更新律可知权阵R对系统收敛速度有较大影响,因此在进行系统鲁棒性分析时,着重R的影响。
当R=0时,根据式(25)可知Lu-LeGp=0,取D=dW-1,则可得
Figure BDA0003056310510000231
由此可知,给定
d=||LeΨW||;
上述不等式可以等价转换为
||LeΨW||<1;
又因为
Figure BDA0003056310510000232
则进一步可得
Figure BDA0003056310510000233
可知系统鲁棒单调的收敛条件为
||((Gp)TQGp+S)-1(Gp)TQΨW||<1;
假设R=0时系统鲁棒单调收敛,则对于任意的权重矩阵R=rI,r≥0,更新律依然能保证不确定系统鲁棒单调收敛。由此可知存在一常数α,0≤α<1使得
||((Gp)TQGp+S)-1(Gp)TQΨΔW||≤α<1;
因为Q和S为对称正定权重矩阵,则(Gp)TQGp+S为正定阵,对其进行奇异值分解得到(Gp)TQGp+S=U∑UT,其中U为酉矩阵,而且∑=diag{σi},σi为分解矩阵的第i个奇异值。进一步得
Figure BDA0003056310510000241
则可知权重矩阵R=rI的设计不会影响被控系统的鲁棒收敛性,另一方面,参数S的设计需要满足条件。
点对点跟踪均方误差的阈值设定为ε=0.1mm2。权重矩阵分别取为Q=10000I,R=0.1I,S=0.0001I。根据鲁棒单调收敛点对点迭代学习控制更新律(67)对单轴进给系统进行控制。为了进行比较,使用具有相同权重矩阵的传统范数最优迭代学习控制算法来执行相同的控制任务。图5为鲁棒单调收敛点对点迭代学习控制算法的点对点估计跟踪效果图,表明经过一定的迭代批次k后,系统在关键跟踪点处的输出值能准确跟踪到参考值。图6和图7表明鲁棒单调收敛点对点迭代学习控制算法(鲁棒算法)和传统范数最优迭代学习控制算法(传统算法)经过一定的迭代批次后都能够实现单调收敛。并且当||Δ||<1时,传统算法收敛速度比鲁棒算法快,这是由于λk+1随着批次不断增大,如图8所示。λk+1越大则Rk+1越大,这是导致鲁棒算法收敛速度慢的主要原因。接下来,增大不确定性Δ,取新的Δ参数为
Figure BDA0003056310510000242
CΔ1=[0 -54.5455];
此时||Δ||>1但||ΨΔ||=0.5344<1。图9为新的不确定性模型鲁棒单调收敛点对点迭代学习控制算法的点对点估计跟踪效果图,表明不确定性增大时,系统在关键跟踪点处的输出值依旧能准确跟踪到参考值。图10和图11表明鲁棒单调收敛点对点迭代学习控制算法(鲁棒算法)经过一定的迭代批次后依旧能够实现单调收敛,但是传统范数最优迭代学习控制算法(传统算法)并没有实现单调收敛,表明鲁棒算法的鲁棒性较强,验证了算法的合理性及有效性。
以上所述的仅是本申请的优选实施方式,本发明不限于以上实施例。可以理解,本领域技术人员在不脱离本发明的精神和构思的前提下直接导出或联想到的其他改进和变化,均应认为包含在本发明的保护范围之内。

Claims (10)

1.一种单轴进给系统的鲁棒单调收敛点对点迭代学习控制方法,其特征在于,所述方法包括以下步骤:
通过动力学方程式表示单轴进给系统的动态模型,所述动力学方程式描述当前单轴进给系统的实际位置和控制电压之间的关系,将所述实际位置作为输出向量,并根据所述实际位置定义状态向量,定义控制电压为输入向量,将所述动力学方程式转变为关于当前运行批次的离散状态空间模型;
将所述离散状态空间模型转换为关于时间序列的输入输出矩阵模型,所述输入输出矩阵模型描述输入向量和输出向量之间的关系;
选取所述单轴进给系统在运行过程中的当前运行批次中M个预设时间点,构建满足收敛约束条件的托普利兹矩阵并对应得到所述单轴进给系统的加性不确定性,通过所述加性不确定性更新所述输入输出矩阵模型得到点对点不确定性动力学方程,通过所述点对点不确定动力学方程得到所述预设时间点在当前运行批次的输出向量;
通过所述预设时间点在当前运行批次的输出向量确定所述预设时间点在当前运行批次的跟踪误差;
根据所述M个预设时间点确定转换矩阵并修正系统矩阵,通过修正后的系统矩阵得到基于当前运行批次的跟踪误差和学习增益的迭代学习控制更新律;
通过所述迭代学习控制更新律对当前运行批次的输入向量进行迭代更新直到所述预设时间点在当前运行批次的跟踪误差不大于预设值,通过所述当前运行批次的输入向量对所述单轴进给系统进行控制。
2.根据权利要求1所述的鲁棒单调收敛点对点迭代学习控制方法,其特征在于,所述动力学方程式的表达式为:
Figure FDA0003056310500000011
其中m为惯性系数,c为粘滞摩擦系数,q为当前单轴进给系统的实际位置,
Figure FDA0003056310500000021
为当前单轴进给系统的速度,
Figure FDA0003056310500000022
为当前单轴进给系统的加速度,u为控制电压。
3.根据权利要求1所述的鲁棒单调收敛点对点迭代学习控制方法,其特征在于,所述将所述动力学方程式转变为关于当前运行批次的离散状态空间模型,包括:
将实际位置q作为输出向量,利用当前单轴进给系统的实际位置定义状态向量x:
Figure FDA0003056310500000023
并定义控制电压u为输入向量;
将所述动力学方程式转变为连续系统模型,所述连续系统模型的表达式为:
Figure FDA0003056310500000024
其中,m为惯性系数,c为粘滞摩擦系数;
对所述连续系统模型进行离散化处理得到离散状态空间模型,则所述离散状态空间模型的表达式为:
Figure FDA0003056310500000025
其中,k表示单轴进给系统的运行批次,第k个运行批次包括N个采样时刻,uk(t)、yk(t)和xk(t)分别为单轴进给系统第k个运行批次在采样时刻t的输入向量、输出向量和状态向量,xk(t+1)单轴进给系统第k个运行批次在采样时刻t+1的状态向量,A、B、C表示离散系统参数矩阵,且满足CB≠0,xk(0)=x0,x0表示常向量。
4.根据权利要求1所述的鲁棒单调收敛点对点迭代学习控制方法,其特征在于,所述输入输出矩阵模型的表达式为:
yk=Guk+dk
其中,yk=[yk(1),yk(2),...,yk(N)]T,uk=[uk(0),uk(1),...,uk(N-1)]T
dk=[CA CA2 CA3...CAN]Txk(0),
Figure FDA0003056310500000031
uk,yk和xk分别为第k个运行批次的输入向量、输出向量和状态向量,其中,t∈{1,2,…,N},M≤N,yk(N)表示第k个运行批次的采样时刻N的输出向量,uk(N-1)表示第k个运行批次的采样时刻N-1的输入向量,A、B、C表示离散系统参数矩阵,且满足CB≠0,xk(0)=x0,x0表示常向量。
5.根据权利要求1所述 的鲁棒单调收敛点对点迭代学习控制方法,其特征在于,所述加性不确定性GΔ的表达式为:
GΔ=G+Δ·W;
其中,Δ为托普利兹矩阵,且Δ∈Θ,
Figure FDA0003056310500000032
W为权重矩阵,G表示系统矩阵;
Figure FDA0003056310500000033
其中,δN-1和wN-1为不确定因子矩阵参数;
Figure FDA0003056310500000034
其中,||u||表示控制电压u的2-范数,
Figure FDA0003056310500000035
Figure FDA0003056310500000036
表示系统矩阵G的最大奇异值。
6.根据权利要求5所述的鲁棒单调收敛点对点迭代学习控制方法,其特征在于,不失一般性,令xk(0)=0,所述点对点不确定性动力学方程为:
Figure FDA0003056310500000037
其中
Figure FDA0003056310500000038
GΔ表示加性不确定性,
Figure FDA0003056310500000039
表示第k个运行批次的M个预设时间点的输出向量,uk=[uk(0),uk(1),...,uk(N-1)]T,uk(N-1)表示第k个运行批次的采样时刻N-1的输入向量。
7.根据权利要求1所述的鲁棒单调收敛点对点迭代学习控制方法,其特征在于,所述通过所述预设时间点在当前运行批次的输出向量确定所述预设时间点在当前运行批次的跟踪误差,包括:
确定第k批次tb时刻的参考值r(tb)为第k批次tb时刻的输出yk(tb),即yk(tb)=r(tb),tb表示预设时间点中的一个时刻,b为参数,b≤M;
计算得到M个预设时间点的参考值向量rp,其计算公式为:
rp=[r(t1),r(t2),...,r(tM)]T
确定预设时间点在当前运行批次的输出向量为
Figure FDA0003056310500000041
yk为第k个运行批次的输出向量,r(tM)表示第k批次tM时刻的参考值,其中,ψ表示M行N列的转换矩阵,ψ的表达式为:
Figure FDA0003056310500000042
其中,ψij为转换矩阵ψ中第i行第j列的元素;
确定预设时间点在当前运行批次的跟踪误差
Figure FDA0003056310500000043
其计算公式为:
Figure FDA0003056310500000044
其中,
Figure FDA0003056310500000045
为预设时间点在当前运行批次的输出向量。
8.根据权利要求1所述的鲁棒单调收敛点对点迭代学习控制方法,其特征在于,所述收敛约束条件为
Figure FDA0003056310500000046
构建的满足收敛约束条件的托普利兹矩阵Δ=0:
确定得到的所述迭代学习控制更新律的表达式为:
Figure FDA0003056310500000047
uk为第k个运行批次的输入向量,uk+1为第k+1个运行批次的输入向量,
Figure FDA0003056310500000048
表示预设时间点在当前运行批次的跟踪误差,Lu表示输入项的学习增益,Le表示误差项的学习增益,计算公式为:
Lu=((Gp)TQGp+R+S)-1((Gp)TQGp+R);
Le=((Gp)TQGp+R+S)-1(Gp)TQ;
其中,Q、R、S表示对称正定权重矩阵,Gp=ΨG,G表示系统矩阵,ψ表示根据所述M个预设时间点确定的转换矩阵且ψ的表达式为:
Figure FDA0003056310500000051
其中,ψij为转换矩阵ψ中第i行第j列的元素。
9.根据权利要求1所述的鲁棒单调收敛点对点迭代学习控制方法,其特征在于,所述收敛约束条件为Δ∈Ξ,
Figure FDA0003056310500000052
且构建的满足收敛约束条件的托普利兹矩阵Δ满足
Figure FDA0003056310500000053
确定所述迭代学习控制更新律的表达式为:
Figure FDA0003056310500000054
其中,uk为第k个运行批次的输入向量,uk+1为第k+1个运行批次的输入向量,
Figure FDA0003056310500000055
表示预设时间点在当前运行批次的跟踪误差,
Figure FDA0003056310500000056
表示输入项的学习增益,
Figure FDA0003056310500000057
表示误差项的学习增益,
Figure FDA0003056310500000058
表示N×N维度的实数矩阵;
Figure FDA0003056310500000059
Figure FDA00030563105000000510
其中,
Figure FDA00030563105000000511
I表示单位矩阵,Q、R、S表示对称正定权重矩阵,Gp=ΨG,G表示系统矩阵,ψ表示根据所述M个预设时间点确定的转换矩阵且ψ的表达式为:
Figure FDA0003056310500000061
其中,ψij为转换矩阵ψ中第i行第j列的元素;
其中,
Figure FDA0003056310500000062
Figure FDA0003056310500000063
第k个运行批次包括N个采样时刻;
Figure FDA0003056310500000064
为通过拉格朗日对偶函数将求解
Figure FDA0003056310500000065
转化为最小化问题函数
Figure FDA0003056310500000066
时得到的最优解。
10.根据权利要求9所述的鲁棒单调收敛点对点迭代学习控制方法,其特征在于,所述
Figure FDA0003056310500000067
为通过拉格朗日对偶函数将求解
Figure FDA0003056310500000068
转化为最小化问题函数
Figure FDA0003056310500000069
时得到的最优解,包括:
求解
Figure FDA00030563105000000610
的最大化问题并将
Figure FDA00030563105000000611
改写为最大化问题函数:
Figure FDA00030563105000000612
s.t.||zk+1||2≤||W(uk+1-uk)||2
令zk+1=ΨΔW(uk+1-uk);
则约束条件||ΨΔ||<1改写为||zk+1||2≤||W(uk+1-uk)||2
则更新后最大化问题函数表示为:
Figure FDA00030563105000000613
引入拉格朗日乘子λk+1,得到拉格朗日函数L(zk+1k+1),其表达式为:
Figure FDA0003056310500000071
对zk+1微分并令
Figure FDA0003056310500000072
得到:
Figure FDA0003056310500000073
其中,I表示单位矩阵;
因此,拉格朗日函数L(zk+1k+1)的对偶函数为:
Figure FDA0003056310500000074
将所述更新后最大化问题函数转化为关于对偶函数最小化函数,即:
Figure FDA0003056310500000075
s.t.λk+1I-Q≥0
Figure FDA0003056310500000076
其中,
Figure FDA0003056310500000077
其中,
Figure FDA0003056310500000078
表示λk+1I-Q的伪逆;
通过新对偶性能指标函数对所述对偶函数最小化函数进行改写,得到最小化问题函数:
Figure FDA0003056310500000079
其中,Jdual(uk+1k+1)表示新对偶性能指标函数,且
Figure FDA00030563105000000710
其中,
Figure FDA00030563105000000711
值域;
其中,最小化问题
Figure FDA00030563105000000712
是关于λk+1的凸优化问题,因此最优解
Figure FDA00030563105000000713
可由所述新对偶性能指标函数通过对λk+1微分得到,将
Figure FDA00030563105000000714
代入新对偶性能指标函数得到:
Figure FDA0003056310500000081
对所述新对偶性能指标函数中的uk+1进行微分,并令
Figure FDA0003056310500000082
合并同类项得到更新后指标函数:
Figure FDA0003056310500000083
CN202110500437.1A 2021-05-08 2021-05-08 单轴进给系统的鲁棒单调收敛点对点迭代学习控制方法 Active CN113110063B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110500437.1A CN113110063B (zh) 2021-05-08 2021-05-08 单轴进给系统的鲁棒单调收敛点对点迭代学习控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110500437.1A CN113110063B (zh) 2021-05-08 2021-05-08 单轴进给系统的鲁棒单调收敛点对点迭代学习控制方法

Publications (2)

Publication Number Publication Date
CN113110063A CN113110063A (zh) 2021-07-13
CN113110063B true CN113110063B (zh) 2022-05-31

Family

ID=76721628

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110500437.1A Active CN113110063B (zh) 2021-05-08 2021-05-08 单轴进给系统的鲁棒单调收敛点对点迭代学习控制方法

Country Status (1)

Country Link
CN (1) CN113110063B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113900377B (zh) * 2021-10-19 2023-10-20 国网江苏省电力有限公司盐城供电分公司 双转子气动系统点对点迭代学习最小能量控制方法
CN114625008B (zh) * 2022-03-17 2022-12-16 哈尔滨工业大学 一种自整定非线性迭代学习控制方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104647378A (zh) * 2015-01-21 2015-05-27 江南大学 一种单关节机械臂系统的迭代学习故障诊断方法
CN106933105A (zh) * 2017-04-24 2017-07-07 清华大学 受限条件下的轨迹更新综合预测迭代学习控制算法
CN107272409A (zh) * 2017-07-04 2017-10-20 浙江理工大学 一种基于迭代学习的直线伺服系统振动抑制方法
CN108536008A (zh) * 2018-03-07 2018-09-14 江苏经贸职业技术学院 一种多输入多输出非线性系统的迭代学习控制方法
CN110815225A (zh) * 2019-11-15 2020-02-21 江南大学 电机驱动单机械臂系统的点对点迭代学习优化控制方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104647378A (zh) * 2015-01-21 2015-05-27 江南大学 一种单关节机械臂系统的迭代学习故障诊断方法
CN106933105A (zh) * 2017-04-24 2017-07-07 清华大学 受限条件下的轨迹更新综合预测迭代学习控制算法
CN107272409A (zh) * 2017-07-04 2017-10-20 浙江理工大学 一种基于迭代学习的直线伺服系统振动抑制方法
CN108536008A (zh) * 2018-03-07 2018-09-14 江苏经贸职业技术学院 一种多输入多输出非线性系统的迭代学习控制方法
CN110815225A (zh) * 2019-11-15 2020-02-21 江南大学 电机驱动单机械臂系统的点对点迭代学习优化控制方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
多轴运动系统非线性轮廓重复跟踪的主从交叉耦合迭代学习控制;凌杰等;《自动化学报》;20171231;第43卷(第12期);2127-2138页 *

Also Published As

Publication number Publication date
CN113110063A (zh) 2021-07-13

Similar Documents

Publication Publication Date Title
Wang et al. Self-learning optimal regulation for discrete-time nonlinear systems under event-driven formulation
Chen et al. Approximating explicit model predictive control using constrained neural networks
CN110815225B (zh) 电机驱动单机械臂系统的点对点迭代学习优化控制方法
Petersen et al. Constrained quadratic programming techniques for control allocation
CN113110063B (zh) 单轴进给系统的鲁棒单调收敛点对点迭代学习控制方法
Folkestad et al. Koopman NMPC: Koopman-based learning and nonlinear model predictive control of control-affine systems
Gupta et al. Constrained spacecraft attitude control on SO (3) using fast nonlinear model predictive control
CN114761966A (zh) 用于以轨迹为中心的基于模型的强化学习的稳健优化的系统及方法
Qi et al. Stable indirect adaptive control based on discrete-time T–S fuzzy model
Oliveira et al. Multiobjective optimization techniques applied to engineering problems
Balashevich et al. Numerical methods for open-loop and closed-loop optimization of linear control systems
Landry et al. A differentiable augmented lagrangian method for bilevel nonlinear optimization
CN108803601B (zh) 一种具有通信约束的移动机器人鲁棒预测跟踪控制方法
Hu et al. Real-time tube MPC applied to a 10-state quadrotor model
CN108762077B (zh) 一种具有通信约束的移动机器人滚动时域估计方法
Li et al. Five-instant type discrete-time ZND solving discrete time-varying linear system, division and quadratic programming
CN110738363B (zh) 一种光伏发电功率预测方法
Polydoros et al. Online multi-target learning of inverse dynamics models for computed-torque control of compliant manipulators
Wu et al. A simple and fast coordinate-descent augmented-Lagrangian solver for model predictive control
CN113900377B (zh) 双转子气动系统点对点迭代学习最小能量控制方法
Mahayana Synthesis of data-driven LightGBM controller for spacecraft attitude control
Zhang et al. Initial value problem enhanced sampling for closed-loop optimal control design with deep neural networks
CN114063458A (zh) 一种非三角结构系统不依赖初始条件的预设性能控制方法
Gupta et al. Global Horizontal Irradiance Estimation Using Bi-LSTM Algorithm
CN113945997A (zh) 一种基于解析四维集合变分的提高海洋预报精度的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20240515

Address after: Chengbei oak forest center, No. 88, Section 1, Jiefang Road, Jinniu District, Chengdu, Sichuan 610000

Patentee after: Sichuan Digital Economy Industry Development Research Institute

Country or region after: China

Address before: No. 1800 road 214122 Jiangsu Lihu Binhu District City of Wuxi Province

Patentee before: Jiangnan University

Country or region before: China