CN109946964B - 一种基于非严格重复问题的复杂非线性系统学习控制方法 - Google Patents
一种基于非严格重复问题的复杂非线性系统学习控制方法 Download PDFInfo
- Publication number
- CN109946964B CN109946964B CN201910123675.8A CN201910123675A CN109946964B CN 109946964 B CN109946964 B CN 109946964B CN 201910123675 A CN201910123675 A CN 201910123675A CN 109946964 B CN109946964 B CN 109946964B
- Authority
- CN
- China
- Prior art keywords
- unknown
- matrix
- strict
- learning
- control method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 239000011159 matrix material Substances 0.000 claims description 47
- 239000013598 vector Substances 0.000 claims description 23
- 230000008859 change Effects 0.000 claims description 13
- 230000003252 repetitive effect Effects 0.000 claims description 12
- 230000006870 function Effects 0.000 claims description 6
- 230000009466 transformation Effects 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 238000013461 design Methods 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000012067 mathematical method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
Images
Landscapes
- Feedback Control In General (AREA)
Abstract
本发明公开了一种基于非严格重复问题的复杂非线性系统学习控制方法,针对一类可重复运行的复杂非线性系统,考虑到系统中存在未知变量、控制增益及扰动的情况下,充分利用实际系统中未知变量的已知边界条件和非严格重复规律,将经典自适应迭代学习控制方法与已知边界条件结合,设计一种学习控制方法,解决系统中的多种非严格重复问题。本发明可以使一类复杂非线性系统在有限时间内,渐近收敛到非严格重复的目标轨迹,并具备一定的鲁棒性。
Description
技术领域
本发明涉及的是一种学习控制领域的方法,具体是一种基于非严格重复问题的复杂非线性系统学习控制方法。
背景技术
非严格重复问题是指在可反复运行的系统中,每次迭代时,系统的某些状态并非严格一致的问题。由于迭代学习控制理论的主旨是充分利用被控系统的可重复运行特性,通过对测得的误差和理想值进行比较,在迭代中不断进行自我学习,修正误差,因此,非严格重复问题严重桎梏迭代学习控制理论的发展。目前,针对系统中出现的非严格重复问题进行的讨论主要有非严格重复的初态、非严格重复的参考轨迹、非严格重复的系统变量等。针对这些非严格重复问题的讨论主要出现在线性系统的迭代学习控制中并取得了较好的效果,针对非线性系统中存在的各种非严格重复问题的讨论较少,并且由于非线性系统本身的复杂性,要同时考虑非严格重复问题和控制方法的鲁棒性、快速收敛性比较困难。
发明内容
发明目的:针对现有技术存在的问题,本发明的目的是提供一种基于非严格重复问题的复杂非线性系统学习控制方法,以解决系统中存在未知变量、控制增益及扰动的情况下,如何充分利用实际系统中未知变量的已知边界条件和非严格重复规律,将经典自适应迭代学习控制方法与已知边界条件结合,设计学习控制方法,并同时解决系统中的多种非严格重复问题,实现对目标轨迹的鲁棒渐近跟踪。
技术方案:本发明所述的一种基于非严格重复问题的复杂非线性系统学习控制方法,包括步骤:
(1)针对一类复杂非线性系统模型进行矩阵变换,将高阶内模的未知初值和未知控制增益、未知扰动设计为一个未知矩阵Θ(t)如下公式所示:
其中,Φ(i)(t),i=1,…,p为高阶内模中分解出的未知时变初值,d(l)(t),l=1,…,n为系统扰动,B(t)为未知控制增益,mi,i=1,…,p为高阶内模的阶次。
将未知矩阵Θ(t)表示成如下公式所示:
Θ(t)=[Ψ(t),B(t)]
(2)设计一种基于多种非严格重复问题的学习控制方法,同时解决高阶内模生成的系统未知和非严格重复的系统初态定位以及跟踪参考轨迹,学习控制方法如下公式所示:
其中,“proj”是一个算子,通过算子“proj”对初次估计矩阵和系统边界条件进行比较,若初次估计矩阵中的第i行第j列元素ηi,j超过边界条件则将其回调至系统边界,否则保持原估计值;是系统未知量的边界。初次估计矩阵的学习更新律如下公式所示:
有益效果
与现有技术相比,本发明具有以下优点:当复杂非线性系统中存在未知变量、控制增益及扰动的情况下,充分利用被控系统中未知变量的已知边界条件和非严格重复规律,将经典自适应迭代学习控制方法与已知边界条件结合,在系统中存有多种非严格重复问题时,所设计的学习控制方法,不仅能实现对目标轨迹的渐近跟踪,还具有一定的鲁棒性。
附图说明
图1为本发明的一种基于非严格重复问题的复杂非线性系统学习控制方法流程图;
图3是本发明实施例二中的最大绝对值误差在100次运行中的渐近收敛曲线;
图4是是本发明实施例三中的最大绝对值误差在100次运行中的渐近收敛曲线。
具体实施方式
下面结合附图和实施例对本发明的技术方案作进一步的说明。
如图1~图4,一种基于非严格重复问题的复杂非线性系统学习控制方法,针对一类可重复运行的复杂非线性系统,考虑到系统中存在未知变量、控制增益及扰动的情况下,充分利用实际系统中未知变量的已知边界条件和非严格重复规律,将经典自适应迭代学习控制方法与已知边界条件结合,解决系统中的多种非严格重复问题。所考虑的复杂非线性系统既可以是单输入单输出系统,也可以是多输入多输出系统。所考虑的非严格重复问题,既可以是非严格重复规律已知,也可以是非严格重复规律未知;由于严格重复问题也是一种特殊的非严格重复问题,因此还可以是严格重复的。
如图1所示,本发明的一种基于非严格重复问题的复杂非线性系统学习控制方法,包括步骤:
(1)针对一类非线性系统模型进行分析,将系统中所有未知设计为一个未知矩阵;本发明的应用对象是一类复杂非线性离散时间系统,系统一般模型可以表示如下:
其中,xk(t)∈Rn是系统状态,k是系统迭代运行的次数;uk(t)∈Rn是控制输入;是系统中非严格重复的未知参数;ξ(i)(xk(t),t)∈Rn是系统的已知函数向量;B(t)∈Rn×n是系统的未知控制增益;D(t)∈Rn是外部扰动。
此外,对于上述复杂非线性系统模型进行学习控制方法设计需要满足如下先验条件:
条件1:系统函数向量ξ(i)(xk(t),t)满足线性增长条件,即
||ξ(i)(xk(t),t)||≤a1+a2||xk(t)||,i=1,2,…,p
其中,a1和a2为正常数。
条件2:系统中的未知参数满足高阶内模规律,即
条件3:系统中的所有未知量均有界,且边界已知。
条件4:系统未知控制增益方向保持恒定,且满足B(t)>0。
在系统迭代运行过程中,系统中的一些变量不能保证每次迭代时都和上一次迭代时一致,这种问题称为非严格重复问题。非严格重复问题可以分为非严格重复规律已知和未知两种。
高阶内模是一种用来描述非严格重复规律的数学方法。
在一个实施例中,满足mi阶内模的变量,第k+1次迭代时的变量值和第k次、第k-1次,直至第k-mi+1次迭代时的变量值相关。
在另一个实施例中,高阶内模也可描述在迭代中严格重复的变量,此时,亦可称之为一阶内模。即,每次迭代时的变量值都不变。
非严格重复规律未知的典型问题就是每次迭代时状态初值的定位偏差问题。由于实际系统的控制精度无法保证每次迭代时状态初值xk(0)都严格定位到某一点(比如零点),因此,在实际系统中,每次迭代时的xk(0)都会或多或少发生偏移,且偏移量在有限范围内随机变化。
控制目标是设计合适的学习控制方法,使得在有限时间t∈{0,1,…,T-1}内,当迭代次数k→∞时,系统跟踪误差渐近收敛到零。
为了将系统中的全部未知组合成一个未知矩阵,首先对高阶内模的时域-迭代域变化规律进行解耦。
可见,系统中时变-迭代变化的未知参数被解耦成仅时变的高阶内模未知初值部分和仅迭代变化的已知部分。
定义跟踪误差向量为:
由于系统扰动可被表示成如下公式:
其中,I(1)=[1,0,…,0]T∈Rn,I(2)=[0,1,0,…,0]T∈Rn,……,I(n)=[0,…,0,1]T∈Rn;再将非线性系统模型(1)和系统未知参数的分解结果(6)代入跟踪误差可得:
将未知矩阵向量Φ(i)(t)和扰动组合到一起,新的未知矩阵向量如下公式所示:
此时,跟踪误差可表示成:
将系统中的所有未知向量组合成一个未知矩阵向量,所述未知矩阵向量如下公式所示:
则跟踪误差可表示为:
(2)设计一种新型学习控制方法;
设计第k次迭代时的控制输入为:
其中,“proj”是一个算子,通过算子“proj”对初次估计矩阵和系统边界条件进行比较,若初次估计矩阵中的第i行第j列元素ηi,j超过边界条件则将其回调至系统边界,否则保持原估计值;是系统未知量的边界。初次估计矩阵的学习更新律如下公式所示:
其中,ek-1(t+1)是跟踪误差向量;Pk-1(t)是正定学习增益矩阵,如下公式所示:
由于本发明中的新型学习控制方法适用于多种非线性系统,首先选择了下面的带有三个高阶内模生成的未知参数以及非严格重复规律未知的状态初值和跟踪参考轨迹的复杂非线性系统作为实施例一进行了仿真实验,来阐明该发明所设计的方法的有效性。
实施例一:被控非线性系统的系统方程如下:
其中,是非严格重复的未知参数,且变化规律满足高阶内模;是满足线性增长的系统函数向量。未知参数在区间[-1.4,+1.4]中有界变化;的有界变化区间为[-3,+3];的有界变化区间为[-0.1,+0.1];外部扰动的有界变化区间为[-0.1,+0.1]。系统在离散时间区间{0,1,…,100}中迭代运行。
系统跟踪参考轨迹为:
本实施例中,被控非线性系统含有时变扰动,如式(8)所示,d(1)(t)=0.1cos(0.05t),d(2)(t)=0.1sin(0.01t)。根据公式(17),取学习增益矩阵初值为将所发明的基于非严格重复问题的复杂非线性系统学习控制方法在离散时间区间{0,1,…,100}中运行100次。运行结果如图2a~2g所示。
通过图2a~2g可以看出,针对复杂的多输入多输出非线性系统存在高阶内模规律变化的未知参数、非严格重复规律未知的初态定位和非严格重复参考轨迹的情况下,同时考虑未知控制增益和扰动的存在,所发明的基于非严格重复问题的复杂非线性系统学习控制方法能保证跟踪误差渐近收敛,在存在未知增益和扰动的情况下,输出轨迹仍趋近期望轨迹,控制系统具备鲁棒性。
实施例二:为了更好的考察所提出的基于非严格重复问题的复杂非线性系统学习控制方法的适用范围,考虑到迭代域严格重复是非严格重复的一种特殊情况,将所设计的学习控制方法应用于下面的永磁直线电机的控制问题:
其中,vk(t)代表永磁直线电机的动子角速度,系统非线性函数分别为 和系统未知参数迭代域严格重复,具体如下:θ(1)=0.8237,θ(2)=θ(3)=θ(4)=-0.014,控制增益b=0.0014,扰动d(t)=-0.07sin(0.001πt)。系统跟踪参考轨迹为其中系数在区间(0,1]中随迭代变化而随机取值。
此时,系统未知参数边界已知,分别为θ(i)∈[-2,2],i=1,2,3,4,b∈(0,1],d(t)=[-0.1,0.1]。采用所发明的一种基于非严格重复问题的复杂非线性系统学习控制方法,学习增益矩阵初值设计成图3表示100次迭代运行内,状态跟踪的最大绝对值误差max|ek|的学习收敛性情况。
由图3可以看出,当仅含有严格重复的未知变量的复杂非线性系统跟踪非严格重复的参考轨迹时,采用所发明的基于非严格重复问题的复杂非线性系统学习控制方法仍能很好的实现跟踪误差的渐近收敛。
实施例三:针对带有多种非严格重复问题的单输入单输出系统,考虑系统方程如下:
其中,未知参数θk(t)随时域-迭代域变化而变化,且变化范围已知,变化规律同实施例一中的未知控制增益B(t)=(1+sin(0.5t)),扰动d(t)=0.1cos(0.05t)。系统跟踪参考轨迹同实施例一中的被控系统在有限时间区间t∈{0,1,…,100}内迭代运行。
根据公式(17),取学习增益矩阵初值将所发明的一种基于非严格重复问题的复杂非线性系统学习控制方法在离散时间区间{0,1,…,100}中迭代运行100次,状态跟踪的最大绝对值误差的学习收敛性情况如表1和图4所示。
表1.不同迭代次数时的最大绝对值误差
k=4 | k=13 | k=27 | k=32 | |
max|e<sub>k</sub>| | 0.0157 | 0.0042 | 0.0056 | 0.0057 |
通过图4和表1可以看出,本发明的基于非严格重复问题的复杂非线性系统学习控制方法不仅可用于多输入多输出系统,同样可用于单输入单输出系统,具有很好的渐近收敛效果和鲁棒性。
以上阐述的是本发明给出的三个实施例表现出的精确跟踪效果。本发明针对一类带有多种非严格重复问题的复杂非线性系统模型给出了求解学习控制律的方法,目的是说明简介清楚,但需要指出,本发明不只限于上述实施例,在不偏离本发明基本精神及不超出本发明实质内容所设计范围的前提下对其可做种种变形加以实施。
Claims (4)
1.一种基于非严格重复问题的复杂非线性系统学习控制方法,其特征在于,包括步骤:
(1)针对一类复杂非线性系统模型进行矩阵变换,根据高阶内模的未知初值、未知控制增益、未知扰动按如下公式设计未知矩阵Θ(t):
Θ(t)=[Ψ(t),B(t)]
其中,Φ(i)(t),i=1,…,p为高阶内模中分解出的未知时变初值,d(l)(t),l=1,…,n为系统扰动,B(t)为未知控制增益,mi,i=1,…,p为高阶内模的阶次;
(2)按照如下公式设计一种基于多种非严格重复问题的学习控制模型:
其中,“proj”是一个算子,通过算子“proj”对初次估计矩阵和系统边界条件进行比较,若初次估计矩阵中的第i行第j列元素ηi,j超过边界条件则将其回调至系统边界,否则保持原估计值;是系统未知量的边界;
(4)为学习控制方法选择合适的正定学习增益矩阵初值,控制系统反复运行;
上述学习控制方法应用于下面的永磁直线电机的控制问题:
2.根据权利要求1所述的基于非严格重复问题的复杂非线性系统学习控制方法,其特征在于:步骤(1)中,被控系统中能同时存在多种非严格重复问题,包括满足高阶内模规律的非严格重复条件和规律未知的非严格重复问题。
3.根据权利要求1所述的基于非严格重复问题的复杂非线性系统学习控制方法,其特征在于:步骤(1)中,被控系统中同时存在多种系统未知情况,包括满足高阶内模规律的未知参数、未知控制增益和未知扰动。
4.根据权利要求2所述的基于非严格重复问题的复杂非线性系统学习控制方法,其特征在于:步骤(1)中,一类复杂非线性系统为多输入多输出系统或单输入单输出系统。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910123675.8A CN109946964B (zh) | 2019-02-19 | 2019-02-19 | 一种基于非严格重复问题的复杂非线性系统学习控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910123675.8A CN109946964B (zh) | 2019-02-19 | 2019-02-19 | 一种基于非严格重复问题的复杂非线性系统学习控制方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109946964A CN109946964A (zh) | 2019-06-28 |
CN109946964B true CN109946964B (zh) | 2021-07-13 |
Family
ID=67008029
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910123675.8A Active CN109946964B (zh) | 2019-02-19 | 2019-02-19 | 一种基于非严格重复问题的复杂非线性系统学习控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109946964B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111459031A (zh) * | 2020-04-21 | 2020-07-28 | 青岛科技大学 | 一种面向学习的扰动观测器设计方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8014881B2 (en) * | 2007-02-15 | 2011-09-06 | Asml Netherlands B.V. | Lithographic apparatus and device manufacturing method |
CN106935033B (zh) * | 2017-04-28 | 2020-07-28 | 青岛科技大学 | 快速路交通系统的迭代动态线性化及自学习控制方法 |
CN108536007A (zh) * | 2018-03-01 | 2018-09-14 | 江苏经贸职业技术学院 | 一种基于非严格重复的自适应迭代学习控制方法 |
-
2019
- 2019-02-19 CN CN201910123675.8A patent/CN109946964B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN109946964A (zh) | 2019-06-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Shen et al. | Survey on stochastic iterative learning control | |
Owens et al. | Iterative learning control—An optimization paradigm | |
Bolder et al. | Rational basis functions in iterative learning control—with experimental verification on a motion system | |
Bristow et al. | A survey of iterative learning control | |
CN108536007A (zh) | 一种基于非严格重复的自适应迭代学习控制方法 | |
Blanken et al. | Data-driven feedforward tuning using non-causal rational basis functions: With application to an industrial flatbed printer | |
Fu et al. | Frequency-domain data-driven adaptive iterative learning control approach: With application to wafer stage | |
CN109946964B (zh) | 一种基于非严格重复问题的复杂非线性系统学习控制方法 | |
Zhu et al. | Observer-based iterative and repetitive learning control for a class of nonlinear systems | |
CN114355781A (zh) | 一种基于零值化神经动力学模型求解时变复值线性矩阵方程的方法 | |
Zhang et al. | Identification and adaptive multi‐dimensional Taylor network control of single‐input single‐output non‐linear uncertain time‐varying systems with noise disturbances | |
Pakkhesal et al. | Sum‐of‐squares‐based policy iteration for suboptimal control of polynomial time‐varying systems | |
CN113219832A (zh) | 一种自适应迭代学习非一致目标跟踪控制器设计方法 | |
CN108536008A (zh) | 一种多输入多输出非线性系统的迭代学习控制方法 | |
Tanemura et al. | Closed-loop data-driven estimation on passivity property | |
CN109901388A (zh) | 一种基于高阶内模的新型学习控制方法 | |
Liu et al. | Immersion and invariance based composite adaptive control of nonlinear high-order systems | |
Ragi et al. | Random-sampling monte-carlo tree search methods for cost approximation in long-horizon optimal control | |
Sun et al. | Iterative tuning of feedforward controller with precise time‐delay compensation for precision motion system | |
Satoh et al. | Iterative feedback tuning for Hamiltonian systems based on variational symmetry | |
CN113625570A (zh) | 一种量测异常下非线性保概率包络约束滤波器的设计方法 | |
You | Normalized learning rule for iterative learning control | |
Li | Adaptive control for enhanced performance of devices and algorithms | |
Wakitani et al. | Design of a vehicle driver model based on database-driven control approach | |
Maniarski et al. | Robust PD-type iterative learning control design for uncertain batch processes subject to nonrepetitive disturbances |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |