CN113110063B - 单轴进给系统的鲁棒单调收敛点对点迭代学习控制方法 - Google Patents
单轴进给系统的鲁棒单调收敛点对点迭代学习控制方法 Download PDFInfo
- Publication number
- CN113110063B CN113110063B CN202110500437.1A CN202110500437A CN113110063B CN 113110063 B CN113110063 B CN 113110063B CN 202110500437 A CN202110500437 A CN 202110500437A CN 113110063 B CN113110063 B CN 113110063B
- Authority
- CN
- China
- Prior art keywords
- point
- matrix
- batch
- vector
- preset time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 239000011159 matrix material Substances 0.000 claims abstract description 106
- 239000013598 vector Substances 0.000 claims abstract description 97
- 230000006870 function Effects 0.000 claims description 57
- 230000009977 dual effect Effects 0.000 claims description 31
- 238000005070 sampling Methods 0.000 claims description 29
- 239000000126 substance Substances 0.000 claims description 18
- 239000000654 additive Substances 0.000 claims description 11
- 230000000996 additive effect Effects 0.000 claims description 11
- 238000004364 calculation method Methods 0.000 claims description 11
- 238000006243 chemical reaction Methods 0.000 claims description 11
- 238000005457 optimization Methods 0.000 claims description 10
- 230000009466 transformation Effects 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 6
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 claims description 3
- 230000001133 acceleration Effects 0.000 claims description 3
- 230000001131 transforming effect Effects 0.000 claims description 2
- 238000004422 calculation algorithm Methods 0.000 description 42
- 238000004458 analytical method Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 3
- 230000033001 locomotion Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- ATJFFYVFTNAWJD-UHFFFAOYSA-N Tin Chemical compound [Sn] ATJFFYVFTNAWJD-UHFFFAOYSA-N 0.000 description 1
- 108010074506 Transfer Factor Proteins 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000003698 laser cutting Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000010355 oscillation Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000004576 sand Substances 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- QERYCTSHXKAMIS-UHFFFAOYSA-M thiophene-2-carboxylate Chemical compound [O-]C(=O)C1=CC=CS1 QERYCTSHXKAMIS-UHFFFAOYSA-M 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/04—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
- G05B13/042—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Feedback Control In General (AREA)
Abstract
本发明公开了一种单轴进给系统的鲁棒单调收敛点对点迭代学习控制方法,涉及单轴进给系统领域,该方法包括:通过动力学方程式表示单轴进给系统,将动力学方程式转变离散状态空间模型并得到输入输出矩阵模型;选取M个预设时间点,通过满足预设条件的托普利兹矩阵得到点对点不确定性动力学方程并得到预设时间点在当前运行批次的输出向量;通过预设时间点在当前运行批次的输出向量确定预设时间点在当前运行批次的跟踪误差;通过迭代学习控制更新律对当前运行批次的输入向量进行迭代更新直到跟踪误差不大于预设值,通过当前运行批次的输入向量对单轴进给系统进行控制,实现了点对点跟踪误差单调收敛。
Description
技术领域
本发明涉及单轴进给系统领域,尤其是一种单轴进给系统的鲁棒单调收敛点对点迭代学习控制方法。
背景技术
单轴进给系统是一种在机械工业普遍运用的驱动系统,例如激光切割机、数控机床、电火花线切割机、水射流机等都需要使用到单轴进给系统,在实际使用中需要驱动单轴进给系统按照特定的轨迹运动,但实际在运行过程中,单轴进给系统跟踪该特定的轨迹运动的能力不强,往往会有一定的误差,为了修正这一误差提高单轴进给系统的跟踪精度,迭代学习控制方法得到了极大的发展,迭代学习控制方法适用于有限时间范围内多批次执行同一任务的系统,迭代学习控制方法的原理是:使用之前运行批次的误差与控制输入信息,不断修正更新当前运行批次的控制输入信息,从而减小当前运行批次的跟踪误差,通过迭代学习控制方法,即使部分方法参数未知或者存在未知的外部干扰,也能保证跟踪误差在一定条件下的收敛性。
在大多数情况下,迭代学习控制方法的目的是解决跟踪误差的问题,然而在许多迭代学习方法的应用中,往往不需要跟踪完整的轨迹运动,只需要在一些关键的时间点满足跟踪要求即可,因此现有的迭代学习控制方法不能满足这一要求,同时当建立的模拟模型不够准确时,鲁棒性会是一个严重的问题,迭代学习控制方法的收敛速度会变慢,甚至不能为原有的控制问题提供有效解。
发明内容
本发明人针对上述问题及技术需求,提出了一种单轴进给系统的鲁棒单调收敛点对点迭代学习控制方法,本发明的技术方案如下:
一种单轴进给系统的鲁棒单调收敛点对点迭代学习控制方法,所述方法包括以下步骤:
通过动力学方程式表示单轴进给系统的动态模型,所述动力学方程式描述当前单轴进给系统的实际位置和控制电压之间的关系,将所述实际位置作为输出向量,并根据所述实际位置定义状态向量,定义控制电压为输入向量,将所述动力学方程式转变为关于当前运行批次的离散状态空间模型;
将所述离散状态空间模型转换为关于时间序列的输入输出矩阵模型,所述输入输出矩阵模型描述输入向量和输出向量之间的关系;
选取所述单轴进给系统在运行过程中的当前运行批次中M个预设时间点,构建满足收敛约束条件的托普利兹矩阵并对应得到所述单轴进给系统的加性不确定性,通过所述加性不确定性更新所述输入输出矩阵模型得到点对点不确定性动力学方程,通过所述点对点不确定动力学方程得到所述预设时间点在当前运行批次的输出向量;
通过所述预设时间点在当前运行批次的输出向量确定所述预设时间点在当前运行批次的跟踪误差;
根据所述M个预设时间点确定转换矩阵并修正系统矩阵,通过修正后的系统矩阵得到基于当前运行批次的跟踪误差和学习增益的迭代学习控制更新律;
通过所述迭代学习控制更新律对当前运行批次的输入向量进行迭代更新直到所述预设时间点在当前运行批次的跟踪误差不大于预设值,通过所述当前运行批次的输入向量对所述单轴进给系统进行控制。
其进一步的技术方案为,所述动力学方程式的表达式为:
其进一步的技术方案为,所述将所述动力学方程式转变为关于当前运行批次的离散状态空间模型,包括:
将所述动力学方程式转变为连续系统模型,所述连续系统模型的表达式为:
其中,m为惯性系数,c为粘滞摩擦系数;
对所述连续系统模型进行离散化处理得到离散状态空间模型,则所述离散状态空间模型的表达式为:
其中,k表示单轴进给系统的运行批次,第k个运行批次包括N个采样时刻,uk(t)、yk(t)和xk(t)分别为单轴进给系统第k个运行批次在采样时刻t的输入向量、输出向量和状态向量,xk(t+1)单轴进给系统第k个运行批次在采样时刻t+1的状态向量,A、B、C表示离散系统参数矩阵,且满足CB≠0,xk(0)=x0,x0表示常向量。
其进一步的技术方案为,所述输入输出矩阵模型的表达式为:
yk=Guk+dk;
其中,yk=[yk(1),yk(2),...,yk(N)]T,uk=[uk(0),uk(1),...,uk(N-1)]T,
uk,yk和xk分别为第k个运行批次的输入向量、输出向量和状态向量,其中,t∈{1,2,…,N},M≤N,yk(N)表示第k个运行批次的采样时刻N的输出向量,uk(N-1)表示第k个运行批次的采样时刻N-1的输入向量,A、B、C表示离散系统参数矩阵,且满足CB≠0,xk(0)=x0,x0表示常向量。
其进一步的技术方案为,所述加性不确定性GΔ的表达式为:
GΔ=G+Δ·W;
其中,δN-1和wN-1为不确定因子矩阵参数;
其进一步的技术方案为,不失一般性,令xk(0)=0,所述点对点不确定性动力学方程为:
其进一步的技术方案为,所述通过所述预设时间点在当前运行批次的输出向量确定所述预设时间点在当前运行批次的跟踪误差,包括:
确定第k批次tb时刻的参考值r(tb)为第k批次tb时刻的输出yk(tb),即yk(tb)=r(tb),tb表示预设时间点中的一个时刻,b为参数,b≤M;
计算得到M个预设时间点的参考值向量rp,其计算公式为:
rp=[r(t1),r(t2),...,r(tM)]T;
其中,ψij为转换矩阵ψ中第i行第j列的元素;
确定得到的所述迭代学习控制更新律的表达式为:
Lu=((Gp)TQGp+R+S)-1((Gp)TQGp+R);
Le=((Gp)TQGp+R+S)-1(Gp)TQ;
其中,Q、R、S表示对称正定权重矩阵,Gp=ΨG,G表示系统矩阵,ψ表示根据所述M个预设时间点确定的转换矩阵且ψ的表达式为:
其中,ψij为转换矩阵ψ中第i行第j列的元素。
确定所述迭代学习控制更新律的表达式为:
其中,ψij为转换矩阵ψ中第i行第j列的元素;
第k个运行批次包括N个采样时刻;
令zk+1=ΨΔW(uk+1-uk);
则约束条件||ΨΔ||<1改写为||zk+1||2≤||W(uk+1-uk)||2;
则更新后最大化问题函数表示为:
引入拉格朗日乘子λk+1,得到拉格朗日函数L(zk+1,λk+1),其表达式为:
其中,I表示单位矩阵;
因此,拉格朗日函数L(zk+1,λk+1)的对偶函数为:
将所述更新后最大化问题函数转化为关于对偶函数最小化函数,即:
s.t.λk+1I-Q≥0
通过新对偶性能指标函数对所述对偶函数最小化函数进行改写,得到最小化问题函数:
其中,Jdual(uk+1,λk+1)表示新对偶性能指标函数,且
本发明的有益技术效果是:针对单轴进给系统此类具有重复运动特征的线性系统为被控对象设计点对点轨迹跟踪迭代学习控制算法;控制算法可以利用轨迹跟踪部分关键时间点处的跟踪误差信息来更新控制输入,进而消除了不必要的非关键点跟踪约束,非关键点处的自由度给迭代学习控制算法设计增加自由度的同时,也增加了系统整体性能的提升空间;本方法基于范数最优迭代学习框架,设计了一种最坏情况下的鲁棒范数最优点对点迭代学习控制方法,保证系统建模不确定性较大时依然能够实现点对点跟踪误差单调收敛。
附图说明
图1是本申请的控制方法的流程示意图。
图2是块对角块对角有界摄动结构图(M-ΔM结构图)。
图3是不确定性系统传统范数最优迭代学习控制算法框图。
图4是不确定性系统传统范数最优迭代学习控制算法M-ΔM结构图。
图5是不确定性较小时单轴进给系统的实际输出与参考点跟踪曲线图。
图6是不确定性较小时鲁棒算法与传统算法均方误差比较曲线图。
图7是不确定性较小时鲁棒算法与传统算法性能指标比较曲线图。
图8是不确定性较小时鲁棒算法的增益参数λk+1随迭代批次变化图。
图9是不确定性较大时单轴进给系统的实际输出与参考点跟踪曲线图。
图10是不确定性较大时鲁棒算法与传统算法均方误差比较曲线图。
图11是不确定性较大时鲁棒算法与传统算法性能指标比较曲线图。
具体实施方式
下面结合附图对本发明的具体实施方式做进一步说明。
一种单轴进给系统的鲁棒单调收敛点对点迭代学习控制方法,具体步骤如图1所示。
步骤1:通过动力学方程式表示单轴进给系统的动态模型,动力学方程式描述当前单轴进给系统的实际位置和控制电压之间的关系。
其中m为惯性系数,c为粘滞摩擦系数,q为当前单轴进给系统的实际位置,u为控制电压。
具体的,设定惯性系数m=0.044Vs2/mm,设定粘滞摩擦系数c=0.21Vs/mm。
将动力学方程式转变为连续系统模型,连续系统模型的表达式为:
选取满足香农采样定理的采样周期Ts,并将实际位置作为输出,对连续系统模型进行离散化处理得到离散状态空间模型,则离散状态空间模型的表达式为:
其中,k表示单轴进给系统的运行批次,第k个运行批次包括N个采样时刻,uk(t),yk(t)和xk(t)分别为单轴进给系统第k个运行批次采样时刻t的输入向量、输出向量和状态向量,其中N=T/Ts;xk(t+1)单轴进给系统第k个运行批次采样时刻t+1的状态向量,A、B、C表示离散系统参数矩阵,且满足CB≠0,假设系统每批次运行完成后初始状态完美重置,即xk(0)=x0,x0表示常向量。
步骤3:将离散状态空间模型转换为关于时间序列的输入输出矩阵模型。
输入输出矩阵模型的表达式为:
yk=Guk+dk;
其中,yk=[yk(1),yk(2),...,yk(N)]T,uk=[uk(0),uk(1),...,uk(N-1)]T,
不失一般性,假设则dk=0,选取第k个运行批次中的M个关键时间点,第k个运行批次包括N个采样时刻,其中,t∈{1,2,…,N},M≤N,A、B、C表示离散系统参数矩阵,yk(N)表示第k个运行批次的采样时刻N的输出向量,uk(N-1)表示第k个运行批次的第t时间的输入向量。
步骤4:选取单轴进给系统在运行过程中的当前运行批次中M个预设时间点,得到当前运行批次的输出向量。
构建满足收敛约束条件的托普利兹矩阵并对应得到单轴进给系统的加性不确定性,加性不确定性GΔ的表达式为:
GΔ=G+Δ·W;
其中,δN-1和wN-1为不确定因子矩阵参数;
通过加性不确定性更新输入输出矩阵模型得到点对点不确定性动力学方程,点对点不确定性动力学方程为:
进一步的,系统仿真时间设定为T=2s,采样时间设定为Ts=0.01s,则系统的离散状态空间表达式的参数矩阵分别为:
C=[0 1]
不失一般性,取五个关键时间点对系统进行点对点跟踪控制,选取的采样点为t={20,60,100,140,180},即跟踪时刻分别为:
t1=0.2s,t2=0.6s,t3=1.0s,t4=1.4s,t5=1.8s;
跟踪点处的参考值设定为
rp=[0.0048 0.0029 -0.0029 -0.0048 0]T
同时设定初始状态为xk(0)=[0,0]T。
假设系统的不确定性Δ以及W的参数分别为:
CΔ=[0 -14.5455]
CW=[0 10]
则有:
此时||Δ||=0.8982<1。
步骤5:通过预设时间点在当前运行批次的输出向量确定预设时间点在当前运行批次的跟踪误差。
传统的迭代学习控制方法的控制目标是跟踪整个运行时间内的完整参考轨迹,即yk(t)→r(t),其中t∈{1,2,…,N},yk(t)为系统第k批次t时刻的实际输出,r(t)为第k批次t时刻的参考轨迹。对于点对点跟踪问题,只需要跟踪一些关键时间点处的参考值,即yk(ti)=r(ti),i=1,2,…,M,假设关键时间点按升序排列,即0<t1<t2<…<tM≤N,确定关键时间点的参考值r(tb)为第k批次tb时刻的输出yk(tb),即yk(tb)=r(tb),tb表示关键时间点中的一个采样时刻,b为参数,b≤M;
确定第k批次tb时刻的参考值r(tb)为第k批次tb时刻的输出yk(tb),即yk(tb)=r(tb),tb表示预设时间点中的一个时刻,b为参数,b≤M;
计算得到M个关键时间点的参考值向量rp,其计算公式为:
rp=[r(t1),r(t2),...,r(tM)]T;
确定N个采样时刻内所选取的M个关键时间点的输出为其中,ψ表示M行N列的转换矩阵,当第i个采样时刻ti为关键时间点时,该矩阵第i行的所有N个元素除j=t时为1其余全为0,从而可得到ψyk为整个轨迹N个采样时刻点内所选取的M个关键时间点的实际输出值,ψ的表达式为:
其中,ψij为转换矩阵ψ中第i行第j列的元素;
步骤6:根据M个预设时间点确定转换矩阵并修正系统矩阵,通过修正后的系统矩阵得到基于当前运行批次的跟踪误差和学习增益的迭代学习控制更新律。
步骤6.1:利用现有的迭代学习控制方法进行计算,其中,迭代学习更新律的形式为现有技术,本申请不再赘述如何获取该更新律。
确定得到的迭代学习控制更新律的表达式为:
Lu=((Gp)TQGp+R+S)-1((Gp)TQGp+R);
Le=((Gp)TQGp+R+S)-1(Gp)TQ;
其中,Q、R、S表示对称正定权重矩阵,Gp=ΨG,G表示系统矩阵,ψ表示M行N列的转换矩阵。
则进一步可以得到:
Lu-LeGp=((Gp)TQGp+R+S)-1R;
渐近稳定的迭代学习控制系统在收敛前可能在迭代域经历大瞬变,单调收敛是比渐近稳定更强的稳定性要求,并使暂态增长的可能性最小化,若||Lu-LeGp||<1,则当迭代批次k→∞时,系统点对点输出跟踪误差收敛;
进一步得到u∞-uk+1=(Lu-LeGp)(u∞-uk),||u∞-uk+1||≤η||u∞-uk||,
其中η表示辅助变量,η=||Lu-LeGp||;
若满足||Lu-LeGp||<1,则控制输入在范数意义下单调收敛,进一步得到
当各权重矩阵参数确定时,可以得出,稳态误差范数最终将收敛到常值。并且若S越小,在迭代学习控制更新律作用下系统的点对点跟踪稳态误差越小;特别地当S取为零矩阵时,系统跟踪点处的输出误差范数可以收敛到零。由此可以推出,当Δ≠0时,若满足
则不确定系统鲁棒单调收敛。
因为传统算法鲁棒单调收敛条件是有关Δ的表达式,因此无法使用该条件去保证系统鲁棒单调收敛,并且,使用代数方法去消除Δ可能会使结果具有很大的保守性。又因为Δ结构的特殊性及其最大奇异值小于1。因此,可使用μ分析法进行不确定系统鲁棒单调收敛条件的分析,μ又称为结构奇异值。
传统范数最优点对点ILC算法是在Δ=0的假设下得到的,一旦各参数确定则学习律增益就固定不变了。根据所示的加性不确定性系统以及点对点跟踪任务可知,系统执行点对点跟踪任务时可将不确定性范围扩展到||ΨΔ||<1。针对上述问题,提出了一个最坏情况下的范数最优点对点迭代学习控制设计框架。
鲁棒单调收敛点对点迭代学习控制更新律并不基于Δ=0的假设得到,而是通过求解一个最坏情况下的优化问题。
确定迭代学习控制更新律的表达式为:
第k个运行批次包括N个采样时刻;
通过性能指标函数得到每个运行批次的控制输入J(uk+1),性能指标函数的表达式为:
uk=[uk(0),uk(1),...,uk(N-1)]T,uk+1=[uk+1(0),uk+1(1),...,uk+1(N-1)]T;
且有||ΨΔ||≤||Ψ||||Δ||=||Δ||,各部分分别用对称正定权重矩阵Q、R和S来表示其优先级,即Q=QT>0,R=RT≥0,S=ST≥0,不失一般性,可取权阵Q=qI,R=rI,S=sI,其中,Q、R、S表示对称正定权重矩阵,h为参数,将跟踪误差替换为点对点跟踪误差得到更新后性能指标函数为:
为了解决最小-最大化问题,利用拉格朗日对偶函数将最小-最大化问题转化为最小-最小化问题。因此,最小-最大化问题可以重新表述为一个凸优化问题,从而保证全局最优解。
令zk+1=ΨΔW(uk+1-uk);
则约束条件||ΨΔ||<1改写为||zk+1||2≤||W(uk+1-uk)||2;
则更新后最大化问题函数表示为:
上述最大化问题具有很强的对偶性,因此引入拉格朗日乘子λk+1,得到拉格朗日函数L(zk+1,λk+1),其表达式为:
其中,I表示单位矩阵;
因此,拉格朗日函数L(zk+1,λk+1)的对偶函数为:
将更新后最大化问题函数转化为关于对偶函数最小化函数,即:
s.t.λk+1I-Q≥0
将原始优化问题外部的最小化问题与最小化问题相结合,得到新对偶函数,且原始优化问题的最小化-最大化问题转化如下最小化-最小化问题。
通过新对偶性能指标函数对最小化问题函数进行改写,得到最小化问题函数:
其中,Jdual(uk+1,λk+1)表示新对偶性能指标函数,且
因为λk+1为最优解,得到:
由此得到:
且
对新对偶性能指标函数进行改写得到:
将更新后最小化问题函数转化为与输入信号uk+1有关的无约束优化问题函数,其表达式为:
其中,
由此可知,当系统不确定性很小时,即||W||≈0时,所提鲁棒迭代学习控制算法的变增益参数Qk+1→Q,Rk+1→R。因为该迭代学习控制算法是稳定收敛的,则有k→∞时,uk+1=uk。进一步可知k→∞时Qk+1最终会收敛到Q,但是||Rk+1||会不断增大。||Rk+1||增大会使收敛速度降低,这也证明了鲁棒单调收敛点对点迭代学习控制算法在鲁棒性能和收敛速度之间的妥协。
步骤7:通过迭代学习控制更新律对输入向量进行迭代更新直到跟踪误差不大于预设值。
根据鲁棒单调收敛点对点迭代学习控制算法确定单轴进给系统的每一迭代批次的输入向量,将得到的输入向量输入单轴进给系统进行点对点轨迹跟踪控制,单轴进给系统在输入向量的控制作用下实现点对点跟踪误差单调收敛,并与传统范数最优迭代学习控制算法进行了性能比较。
下面举出一种具体的实施例,分别用传统范数最优迭代学习控制算法与鲁棒单调收敛点对点迭代学习控制算法作用于该实际模型。鲁棒单调收敛点对点迭代学习控制算法已给出了具体的单调收敛条件,然而统范数最优迭代学习控制算法并没有得出具体的单调收敛条件,因此,将首先使用μ分析法进行传统范数最优迭代学习控制算法应用于不确定系统鲁棒单调收敛条件的分析。
μ分析方法的基本思想为:通过对系统中输入、输出、传递函数、确定性因子等进行回路整形,得到如图2所示的BDBP(块对角有界摄动)问题,并基于μ分析法进行系统分析和设计。此外M为确定性结构,ΔM为系统总的不确定性且需满足条件||ΔM||<1。
将传统范数最优迭代学习控制更新律(23)作用于不确定系统(13),其结构框图为图3。其中ω为迭代批次方向的转移因子,且有uk+1=ωuk。引入一虚拟不确定因子则图3所示系统鲁棒单调收敛等价于图4所示系统鲁棒单调收敛。
忽略参考轨迹的影响,由图4得
其中ΔM=diag(Δ,Δp)。
最大结构奇异值是使系统稳定的最大不确定性范围的度量,但是一般情况下在应用过程中难以通过直接计算得到系统的结构奇异值。因此结构奇异值的计算是一个逐步逼近的过程,用一个上界代替通过引入标定阵DM,且DM满足
DM={diag(D,Dp),DMΔM=ΔMDM};
为简化运算,取Dp=I。进一步有
因为Δ为下三角托普利兹矩阵,因此D可以设计为相同结构的形式以满足条件,即
由更新律可知权阵R对系统收敛速度有较大影响,因此在进行系统鲁棒性分析时,着重R的影响。
当R=0时,根据式(25)可知Lu-LeGp=0,取D=dW-1,则可得
由此可知,给定
d=||LeΨW||;
上述不等式可以等价转换为
||LeΨW||<1;
可知系统鲁棒单调的收敛条件为
||((Gp)TQGp+S)-1(Gp)TQΨW||<1;
假设R=0时系统鲁棒单调收敛,则对于任意的权重矩阵R=rI,r≥0,更新律依然能保证不确定系统鲁棒单调收敛。由此可知存在一常数α,0≤α<1使得
||((Gp)TQGp+S)-1(Gp)TQΨΔW||≤α<1;
因为Q和S为对称正定权重矩阵,则(Gp)TQGp+S为正定阵,对其进行奇异值分解得到(Gp)TQGp+S=U∑UT,其中U为酉矩阵,而且∑=diag{σi},σi为分解矩阵的第i个奇异值。进一步得
则可知权重矩阵R=rI的设计不会影响被控系统的鲁棒收敛性,另一方面,参数S的设计需要满足条件。
点对点跟踪均方误差的阈值设定为ε=0.1mm2。权重矩阵分别取为Q=10000I,R=0.1I,S=0.0001I。根据鲁棒单调收敛点对点迭代学习控制更新律(67)对单轴进给系统进行控制。为了进行比较,使用具有相同权重矩阵的传统范数最优迭代学习控制算法来执行相同的控制任务。图5为鲁棒单调收敛点对点迭代学习控制算法的点对点估计跟踪效果图,表明经过一定的迭代批次k后,系统在关键跟踪点处的输出值能准确跟踪到参考值。图6和图7表明鲁棒单调收敛点对点迭代学习控制算法(鲁棒算法)和传统范数最优迭代学习控制算法(传统算法)经过一定的迭代批次后都能够实现单调收敛。并且当||Δ||<1时,传统算法收敛速度比鲁棒算法快,这是由于λk+1随着批次不断增大,如图8所示。λk+1越大则Rk+1越大,这是导致鲁棒算法收敛速度慢的主要原因。接下来,增大不确定性Δ,取新的Δ参数为
CΔ1=[0 -54.5455];
此时||Δ||>1但||ΨΔ||=0.5344<1。图9为新的不确定性模型鲁棒单调收敛点对点迭代学习控制算法的点对点估计跟踪效果图,表明不确定性增大时,系统在关键跟踪点处的输出值依旧能准确跟踪到参考值。图10和图11表明鲁棒单调收敛点对点迭代学习控制算法(鲁棒算法)经过一定的迭代批次后依旧能够实现单调收敛,但是传统范数最优迭代学习控制算法(传统算法)并没有实现单调收敛,表明鲁棒算法的鲁棒性较强,验证了算法的合理性及有效性。
以上所述的仅是本申请的优选实施方式,本发明不限于以上实施例。可以理解,本领域技术人员在不脱离本发明的精神和构思的前提下直接导出或联想到的其他改进和变化,均应认为包含在本发明的保护范围之内。
Claims (10)
1.一种单轴进给系统的鲁棒单调收敛点对点迭代学习控制方法,其特征在于,所述方法包括以下步骤:
通过动力学方程式表示单轴进给系统的动态模型,所述动力学方程式描述当前单轴进给系统的实际位置和控制电压之间的关系,将所述实际位置作为输出向量,并根据所述实际位置定义状态向量,定义控制电压为输入向量,将所述动力学方程式转变为关于当前运行批次的离散状态空间模型;
将所述离散状态空间模型转换为关于时间序列的输入输出矩阵模型,所述输入输出矩阵模型描述输入向量和输出向量之间的关系;
选取所述单轴进给系统在运行过程中的当前运行批次中M个预设时间点,构建满足收敛约束条件的托普利兹矩阵并对应得到所述单轴进给系统的加性不确定性,通过所述加性不确定性更新所述输入输出矩阵模型得到点对点不确定性动力学方程,通过所述点对点不确定动力学方程得到所述预设时间点在当前运行批次的输出向量;
通过所述预设时间点在当前运行批次的输出向量确定所述预设时间点在当前运行批次的跟踪误差;
根据所述M个预设时间点确定转换矩阵并修正系统矩阵,通过修正后的系统矩阵得到基于当前运行批次的跟踪误差和学习增益的迭代学习控制更新律;
通过所述迭代学习控制更新律对当前运行批次的输入向量进行迭代更新直到所述预设时间点在当前运行批次的跟踪误差不大于预设值,通过所述当前运行批次的输入向量对所述单轴进给系统进行控制。
3.根据权利要求1所述的鲁棒单调收敛点对点迭代学习控制方法,其特征在于,所述将所述动力学方程式转变为关于当前运行批次的离散状态空间模型,包括:
将所述动力学方程式转变为连续系统模型,所述连续系统模型的表达式为:
其中,m为惯性系数,c为粘滞摩擦系数;
对所述连续系统模型进行离散化处理得到离散状态空间模型,则所述离散状态空间模型的表达式为:
其中,k表示单轴进给系统的运行批次,第k个运行批次包括N个采样时刻,uk(t)、yk(t)和xk(t)分别为单轴进给系统第k个运行批次在采样时刻t的输入向量、输出向量和状态向量,xk(t+1)单轴进给系统第k个运行批次在采样时刻t+1的状态向量,A、B、C表示离散系统参数矩阵,且满足CB≠0,xk(0)=x0,x0表示常向量。
4.根据权利要求1所述的鲁棒单调收敛点对点迭代学习控制方法,其特征在于,所述输入输出矩阵模型的表达式为:
yk=Guk+dk;
其中,yk=[yk(1),yk(2),...,yk(N)]T,uk=[uk(0),uk(1),...,uk(N-1)]T,
uk,yk和xk分别为第k个运行批次的输入向量、输出向量和状态向量,其中,t∈{1,2,…,N},M≤N,yk(N)表示第k个运行批次的采样时刻N的输出向量,uk(N-1)表示第k个运行批次的采样时刻N-1的输入向量,A、B、C表示离散系统参数矩阵,且满足CB≠0,xk(0)=x0,x0表示常向量。
7.根据权利要求1所述的鲁棒单调收敛点对点迭代学习控制方法,其特征在于,所述通过所述预设时间点在当前运行批次的输出向量确定所述预设时间点在当前运行批次的跟踪误差,包括:
确定第k批次tb时刻的参考值r(tb)为第k批次tb时刻的输出yk(tb),即yk(tb)=r(tb),tb表示预设时间点中的一个时刻,b为参数,b≤M;
计算得到M个预设时间点的参考值向量rp,其计算公式为:
rp=[r(t1),r(t2),...,r(tM)]T;
其中,ψij为转换矩阵ψ中第i行第j列的元素;
确定得到的所述迭代学习控制更新律的表达式为:
Lu=((Gp)TQGp+R+S)-1((Gp)TQGp+R);
Le=((Gp)TQGp+R+S)-1(Gp)TQ;
其中,Q、R、S表示对称正定权重矩阵,Gp=ΨG,G表示系统矩阵,ψ表示根据所述M个预设时间点确定的转换矩阵且ψ的表达式为:
其中,ψij为转换矩阵ψ中第i行第j列的元素。
确定所述迭代学习控制更新律的表达式为:
其中,ψij为转换矩阵ψ中第i行第j列的元素;
第k个运行批次包括N个采样时刻;
s.t.||zk+1||2≤||W(uk+1-uk)||2;
令zk+1=ΨΔW(uk+1-uk);
则约束条件||ΨΔ||<1改写为||zk+1||2≤||W(uk+1-uk)||2;
则更新后最大化问题函数表示为:
引入拉格朗日乘子λk+1,得到拉格朗日函数L(zk+1,λk+1),其表达式为:
其中,I表示单位矩阵;
因此,拉格朗日函数L(zk+1,λk+1)的对偶函数为:
将所述更新后最大化问题函数转化为关于对偶函数最小化函数,即:
s.t.λk+1I-Q≥0
通过新对偶性能指标函数对所述对偶函数最小化函数进行改写,得到最小化问题函数:
其中,Jdual(uk+1,λk+1)表示新对偶性能指标函数,且
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110500437.1A CN113110063B (zh) | 2021-05-08 | 2021-05-08 | 单轴进给系统的鲁棒单调收敛点对点迭代学习控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110500437.1A CN113110063B (zh) | 2021-05-08 | 2021-05-08 | 单轴进给系统的鲁棒单调收敛点对点迭代学习控制方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113110063A CN113110063A (zh) | 2021-07-13 |
CN113110063B true CN113110063B (zh) | 2022-05-31 |
Family
ID=76721628
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110500437.1A Active CN113110063B (zh) | 2021-05-08 | 2021-05-08 | 单轴进给系统的鲁棒单调收敛点对点迭代学习控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113110063B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113900377B (zh) * | 2021-10-19 | 2023-10-20 | 国网江苏省电力有限公司盐城供电分公司 | 双转子气动系统点对点迭代学习最小能量控制方法 |
CN114625008B (zh) * | 2022-03-17 | 2022-12-16 | 哈尔滨工业大学 | 一种自整定非线性迭代学习控制方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104647378A (zh) * | 2015-01-21 | 2015-05-27 | 江南大学 | 一种单关节机械臂系统的迭代学习故障诊断方法 |
CN106933105A (zh) * | 2017-04-24 | 2017-07-07 | 清华大学 | 受限条件下的轨迹更新综合预测迭代学习控制算法 |
CN107272409A (zh) * | 2017-07-04 | 2017-10-20 | 浙江理工大学 | 一种基于迭代学习的直线伺服系统振动抑制方法 |
CN108536008A (zh) * | 2018-03-07 | 2018-09-14 | 江苏经贸职业技术学院 | 一种多输入多输出非线性系统的迭代学习控制方法 |
CN110815225A (zh) * | 2019-11-15 | 2020-02-21 | 江南大学 | 电机驱动单机械臂系统的点对点迭代学习优化控制方法 |
-
2021
- 2021-05-08 CN CN202110500437.1A patent/CN113110063B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104647378A (zh) * | 2015-01-21 | 2015-05-27 | 江南大学 | 一种单关节机械臂系统的迭代学习故障诊断方法 |
CN106933105A (zh) * | 2017-04-24 | 2017-07-07 | 清华大学 | 受限条件下的轨迹更新综合预测迭代学习控制算法 |
CN107272409A (zh) * | 2017-07-04 | 2017-10-20 | 浙江理工大学 | 一种基于迭代学习的直线伺服系统振动抑制方法 |
CN108536008A (zh) * | 2018-03-07 | 2018-09-14 | 江苏经贸职业技术学院 | 一种多输入多输出非线性系统的迭代学习控制方法 |
CN110815225A (zh) * | 2019-11-15 | 2020-02-21 | 江南大学 | 电机驱动单机械臂系统的点对点迭代学习优化控制方法 |
Non-Patent Citations (1)
Title |
---|
多轴运动系统非线性轮廓重复跟踪的主从交叉耦合迭代学习控制;凌杰等;《自动化学报》;20171231;第43卷(第12期);2127-2138页 * |
Also Published As
Publication number | Publication date |
---|---|
CN113110063A (zh) | 2021-07-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wang et al. | Self-learning optimal regulation for discrete-time nonlinear systems under event-driven formulation | |
Chen et al. | Approximating explicit model predictive control using constrained neural networks | |
CN110815225B (zh) | 电机驱动单机械臂系统的点对点迭代学习优化控制方法 | |
Petersen et al. | Constrained quadratic programming techniques for control allocation | |
CN113110063B (zh) | 单轴进给系统的鲁棒单调收敛点对点迭代学习控制方法 | |
Folkestad et al. | Koopman NMPC: Koopman-based learning and nonlinear model predictive control of control-affine systems | |
Gupta et al. | Constrained spacecraft attitude control on SO (3) using fast nonlinear model predictive control | |
CN114761966A (zh) | 用于以轨迹为中心的基于模型的强化学习的稳健优化的系统及方法 | |
Qi et al. | Stable indirect adaptive control based on discrete-time T–S fuzzy model | |
Oliveira et al. | Multiobjective optimization techniques applied to engineering problems | |
Balashevich et al. | Numerical methods for open-loop and closed-loop optimization of linear control systems | |
Landry et al. | A differentiable augmented lagrangian method for bilevel nonlinear optimization | |
CN108803601B (zh) | 一种具有通信约束的移动机器人鲁棒预测跟踪控制方法 | |
Hu et al. | Real-time tube MPC applied to a 10-state quadrotor model | |
CN108762077B (zh) | 一种具有通信约束的移动机器人滚动时域估计方法 | |
Li et al. | Five-instant type discrete-time ZND solving discrete time-varying linear system, division and quadratic programming | |
CN110738363B (zh) | 一种光伏发电功率预测方法 | |
Polydoros et al. | Online multi-target learning of inverse dynamics models for computed-torque control of compliant manipulators | |
Wu et al. | A simple and fast coordinate-descent augmented-Lagrangian solver for model predictive control | |
CN113900377B (zh) | 双转子气动系统点对点迭代学习最小能量控制方法 | |
Mahayana | Synthesis of data-driven LightGBM controller for spacecraft attitude control | |
Zhang et al. | Initial value problem enhanced sampling for closed-loop optimal control design with deep neural networks | |
CN114063458A (zh) | 一种非三角结构系统不依赖初始条件的预设性能控制方法 | |
Gupta et al. | Global Horizontal Irradiance Estimation Using Bi-LSTM Algorithm | |
CN113945997A (zh) | 一种基于解析四维集合变分的提高海洋预报精度的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20240515 Address after: Chengbei oak forest center, No. 88, Section 1, Jiefang Road, Jinniu District, Chengdu, Sichuan 610000 Patentee after: Sichuan Digital Economy Industry Development Research Institute Country or region after: China Address before: No. 1800 road 214122 Jiangsu Lihu Binhu District City of Wuxi Province Patentee before: Jiangnan University Country or region before: China |