CN112147896B - 一种非标准型mimo离散非线性系统的自适应控制方法及系统 - Google Patents
一种非标准型mimo离散非线性系统的自适应控制方法及系统 Download PDFInfo
- Publication number
- CN112147896B CN112147896B CN202011042487.1A CN202011042487A CN112147896B CN 112147896 B CN112147896 B CN 112147896B CN 202011042487 A CN202011042487 A CN 202011042487A CN 112147896 B CN112147896 B CN 112147896B
- Authority
- CN
- China
- Prior art keywords
- adaptive control
- output
- matrix
- standard
- nonlinear system
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000003044 adaptive effect Effects 0.000 title claims abstract description 82
- 238000000034 method Methods 0.000 title claims abstract description 40
- 239000011159 matrix material Substances 0.000 claims description 80
- 239000013598 vector Substances 0.000 claims description 35
- 238000013461 design Methods 0.000 claims description 19
- 238000000354 decomposition reaction Methods 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 11
- 238000004364 calculation method Methods 0.000 claims description 4
- 241001347978 Major minor Species 0.000 claims description 3
- 230000017105 transposition Effects 0.000 claims description 2
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 230000000750 progressive effect Effects 0.000 abstract 1
- 230000004044 response Effects 0.000 description 9
- 238000013507 mapping Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000006978 adaptation Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000006641 stabilisation Effects 0.000 description 3
- 238000011105 stabilization Methods 0.000 description 3
- 230000008649 adaptation response Effects 0.000 description 2
- 238000012938 design process Methods 0.000 description 2
- 238000005316 response function Methods 0.000 description 2
- 239000008186 active pharmaceutical agent Substances 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000005339 levitation Methods 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/04—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
- G05B13/042—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Feedback Control In General (AREA)
Abstract
本发明公开了一种非标准型MIMO离散时间非线性系统的自适应控制方法及系统,属于人工智能及控制技术领域,包括:对于非标准型离散时间多输入输出非线性系统,构建被控非线性系统的标准形式的参数化模型;对于参数化模型中的输入变量,设计其自适应控制律;基于自适应控制律和参数化模型,构建被控非线性系统的预期跟踪误差模型;利用被控非线性系统的预期跟踪误差模型,设计自适应控制规律中的参数更新定律;利用具有参数更新定律的自适应控制规律对非标准型离散时间多输入输出非线性系统进行自适应控制。本发明可保证非标准型离散时间多输入输出非线性系统的闭环稳定性和渐进输出跟踪性能。
Description
技术领域
本发明涉及人工智能及控制技术领域,特别涉及一种非标准型MIMO离散时间非线性系统的自适应控制方法及系统。
背景技术
在控制领域存在着大量非线性系统,如伺服系统、磁悬浮系统、航空航天飞行器、机器人等。其中,MIMO非线性系统(MIMO Nonlinear Systems)指同时具有MIMO系统和非线性系统特点的系统,即具有其输出不与其输入成正比的特性,同时在发射端和接收端分别使用多个发射天线和接收天线,使信号通过发射端与接收端的多个天线传送和接收,从而改善通信质量。
对于不确定的多输入输出MIMO非线性系统的自适应控制,通常需要处理高频增益矩阵,这是因为高频增益矩阵包含了未知参数,并且其自适应版本在参数自适应过程中可能是奇异的,这就导致了自适应控制规律的奇异性问题。1993年提出的矩阵分解技术来解决奇异性问题,迄今为止,也研究发表了许多显著结果,这些结果能够解决由高频增益矩阵引起的奇异性问题。
然而,矩阵分解技术在MIMO DT线性系统(尤其是非标准型)的自适应控制中的应用很少见。非标准型意味着系统动力学不具有严格反馈形式,并且系统输出通常是某些或所有状态变量的组合。由于MIMODT非线性系统不具有传递函数,并且不存在适用于MIMO DT非线性系统的相关小增益引理,因此对于线性时不变系统LTI(Linear Time-invariantSystems)系统的现有控制方法很难扩展到MIMO DT非线性系统。
此外,由于连续时间(CT)和离散时间(DT)控制方案的系统稳定性特征之间存在本质差异,因此CT非线性系统的现有控制方法也无法应用于MIMO DT非线性系统。换句话说,如何为MIMO DT非线性系统开发基于矩阵分解的自适应控制方案仍有待研究。
发明内容
本发明的目的在于克服上述背景技术中的不足,解决MIMO DT非线性系统的闭环稳定性和渐近输出跟踪性能的问题。
为实现以上目的,一方面,采用一种非标准型MIMO离散非线性系统的自适应控制方法,包括如下步骤:
对于向量相对阶为[1,1,...,1]的非标准型离散时间多输入输出非线性系统,构建被控非线性系统的标准形式的参数化模型;
对于参数化模型中的输入变量,设计其自适应控制规律;
基于自适应控制规律和参数化模型,构建被控非线性系统的预期跟踪误差模型;
利用被控非线性系统的预期跟踪误差模型,设计自适应控制规律中的参数更新律;
利用具有参数更新定律的自适应控制规律对所述向量相对阶为[1,1,...,1]的非标准型离散时间多输入输出非线性系统进行自适应控制。
进一步地,所述被控非线性系统的标准形式的参数化模型为:
其中,I表示单位阵,S*是一个正定矩阵,Us是一个单位上三角矩阵,Ds是对角矩阵,离散时间t∈{0,1,2,…},x(t)=[x1(t),x2(t),…,xn(t)]T∈Rn为t时刻的系统状态向量,n为系统状态向量维度,上标T表示矩阵转置,R表示实数空间,u(t)为t时刻的控制输入变量,φf(x(t))表示将非标准系统动力学方程重构成一个输出方程所得到的输出方程的系统函数,表示将非标准系统动力学方程重构成一个输出方程所得到的输出方程的系数,y(t+1)表示t+1时刻系统的输出。
进一步地,所述自适应控制规律为:
u(t)=-Θ2(t)u(t)-Θ1(t)φf(x(t))+Θ3(t)ym(t+1)-Θ3(t)Am(y(t)-ym(t))
其中,Θi(t),i=1,2,3分别是(S*Ds)-1的估计值,Am是一个任意的一个特征值在单位圆内的稳定矩阵,ym(t)∈RM是t时刻的一个给定的有界参考输出信号,M为输出向量维度,y(t)是t时刻的输出变量。
进一步地,所述预期跟踪误差模型为:
其中,h(z)=1/h0(z),h0(z)=z-α,0<α<1,z为时间前移算子,h(z)是时间前移算子函数,是一个整体,表示h(z)作用于是为得到所期望的跟踪误差方程中所定义的中间变量,与输出动态方程参数化模型和所设计的自适应控制律中需要更新的参数有关。
进一步地,所述利用被控非线性系统的预期跟踪误差模型,设计自适应控制规律中的参数更新定律,包括:
定义估计误差为其中,Φ(t)是所述S*Ds的估计值,σ(t)=[σ1(t),σ2(t),…,σM(t)]T, 其中,∈(t)表示估计误差,σ(t)表示中间变量,δj(t)是为定义σ(t)每个分量所定义的中间变量,它们均与跟踪误差方程中的变量h(z)有关,其中Ψj(t),分别表示Ψ(t),的第j个分量;
根据估计误差,设计参数Ψ(t)和Φ(t)的更新定律分别为:
其中,i=1,2,…,M,Δi为高频增益矩阵的顺序主子式的符号,Δi≠0且符号{Δi}已知,m(t)表示设计参数Φ(t)更新律中随时间变化的一个变量,由系统输出方程中高频增益矩阵进行LDU矩阵分解得到,即中对角阵D*的对角线元素且它们可由的顺序主子式计算得到,γj表示系统输出动态方程中的对角矩阵Ds对角元素的绝对值, β∈R是一个选定的自适应增益,使得0<β<2λmin{S*-1}/λmax{S*-1},其中λmin{S*-1}和λmax{S*-1}分别表示S*-1特征值的最小值和最大值。
另一方面,采用一种计算机可读存储设备,所述存储设备存储有计算机程序,所述计算机程序被执行时实现上述非标准型MIMO离散非线性系统的自适应控制方法。
另一方面,采用一种非标准型MIMO离散非线性系统的自适应控制系统,包括存储设备、处理器以及存储在所述存储设备中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序实现上述非标准型MIMO离散非线性系统的自适应控制方法。
与现有技术相比,本发明存在以下技术效果:本发明针对向量相对阶为[1,1,...,1]的这一类非标准型离散时间多输入输出非线性系统,用该系统的输出方程重构非标准型系统动力学得到一个向量相对阶相关的标准形式的参数化模型,基于标准形式的参数化模型设计自适应控制框架,并通过矩阵分解技术分解高频增益矩阵,然后将设计的自适应控制框架扩展到非标准型离散时间多输入输出非线性系统的自适应控制,实现保证非标准型离散时间多输入输出非线性系统的闭环稳定性和渐近输出跟踪性能。
附图说明
下面结合附图,对本发明的具体实施方式进行详细描述:
图1是一种非标准型MIMO离散非线性系统的自适应控制方法的流程图;
图2是情况(1)对应的系统的输出y对ym1的响应;
图3是情况(1)对应的控制输入和系统状态变量的响应;
图4是情况(1)对应的Ψ(t)部分的参数自适应响应;
图5是情况(2)对应的系统的输出y对ym2的响应;
图6是情况(2)对应的控制输入和系统状态变量的响应;
图7是情况(2)对应的Ψ(t)部分的参数自适应响应;
图8是平面肘臂机械手系统模型。
具体实施方式
为了更进一步说明本发明的特征,请参阅以下有关本发明的详细说明与附图。所附图仅供参考与说明之用,并非用来对本发明的保护范围加以限制。
首先需要说明的是,非标准型离散时间多输入多输出非线性系统的描述如下:
yj(t)=Cjx(t),j=1,2,…,M,
其中,t∈{0,1,2,…},x(t)=[x1(t),x2(t),…,xn(t)]T∈Rn为系统状态向量,且uj(t)∈R为控制输入变量,yj(t)∈R为输出变量;Bj=[bi1,bi2,…,bin]T和是未知常数向量;f:Rn→Rn是形式为f(x(t))=[f1(x(t)),f2(x(t)),…,fn(x(t))]T的连续可微映射。
此外,
将非标准型离散时间多输入多输出非线性系统的描述简化成以下形式:
y(t)=Cx(t),
其中,有:
y(t)=[y1(t),y2(t),…,yM(t)]T∈RM,
u(t)=[u1(t),u2(t),…,uM(t)]T∈RM,
B=[B1,B2,…,BM]∈Rn×M,
假设系统对于所有(x,u)∈Rn×M有向量相对阶为[1,1,...,1],则系统的输出动力学为:
本实施例在进行非标准型离散时间多输入输出非线性系统的自适应控制设计之前,首先通过指定一般的向量相对阶并导出向量相对阶相关的标准形式来解决系统的反馈线性化问题。然后,以标准形式设计条件,这对于闭环稳定性的分析至关重要。
下面定义一个矩阵:
这将用于定义向量相对阶。
由此可引出系统相对阶概念:
且矩阵G对于所有(x,u)∈Rn×RM是非奇异的。
(2)离散时间非线性系统的标准形式
在上述(1)的分析基础上,假设多输入多输出离散时间非线性系统具有向量相对阶[ρ1,ρ2,…,ρM],则非标准型系统输出动力学可以转换为两个子系统。
如果对于所有(x,u)∈Rn×R具有向量相对阶为[ρ1,ρ2,…,ρM]的多输入多输出离散时间非线性系统可以通过微分同胚映射T(x(t))=[ξT(t),ηT(t)]T,其中, 且则多输入多输出离散时间非线性系统可以转换成如下两个子系统:
ξji(t+1)=ξji+1(t),i=1,…,ρj-1
其中,ξj1(t)=yj(t),j=1,2,…,M使得矩阵G对于任意(x,u)∈Rn×R都是非奇异的,且内部动力学方程为:
η(t+1)=q(ξ(t),η(t),u(t))
这提供了一个与向量相对阶相关的标准形式,用于自适应输出跟踪控制设计。
(3)内部动力学的输入状态稳定条件
对于输出跟踪控制设计,控制律u设计成如下基本形式
u(t)=u(x(t),ym(t))=u(T-1(ξ(t),η(t)),ym(t))
其中,ym(t)是给定的有界参考输出信号。
因此,内部动力学方程η(t+1)=q(ξ(t),η(t),u(t))可以表示为:
η(t+1)=q(ξ(t),η(t),ym(t)),
由于ym是有界的,因此可以将其视为系统η(t+1)=q(ξ(t),η(t),ym(t))的外部输入信号,那么可以引入输入状态稳定(ISS)条件或最小相位条件假设:
系统η(t+1)=q(0,η(t),0)的原点是全局指数稳定的且q(ξ,η,v)在ξ和v上是全局Lipschitz连续的。由这个假设可以得到
||η(t+1)||≤||q(ξ(t),η(t),v(t))-q(0,η(t),v(t))||+||q(0,η(t),v(t))-q(0,η(t),0)||+||q(0,η(t),0)||
≤Lξ||ξ(t)||+Lv||v(t)||+L0
其中,Lξ和Lv是Lipschitz常数,L0是某些正常数且||X||表示任意合适维度的欧几里得范数,如果ξ(t)和v(t)有界,则η(t)有界。即系统η(t+1)=q(ξ(t),η(t),ym(t))是输入状态稳定的。
基于以上分析的多输入多输出离散时间非线性系统的自适应控制方案时设计思想,如图1所示,本实施例公开了一种非标准型MIMO离散时间非线性系统的自适应控制方法,包括如下步骤S1至S5:
S1、对于向量相对阶为[1,1,...,1]的非标准型离散时间多输入输出非线性系统,构建被控非线性系统的标准形式的参数化模型;
S2、对于参数化模型中的输入变量,设计其自适应控制规律;
S3、基于自适应控制规律和参数化模型,构建被控非线性系统的预期跟踪误差模型;
S4、利用被控非线性系统的预期跟踪误差模型,设计自适应控制规律中的参数更新定律;
S5、利用具有参数更新定律的自适应控制规律对所述向量相对阶为[1,1,...,1]的非标准型离散时间多输入输出非线性系统进行自适应控制。
具体来说,在上述步骤S1中,基于用于分解高频增益矩阵的假设条件,将系统的输出动力学转换为被控非线性系统的标准形式的参数化模型。其中,用于分解高频增益矩阵的假设条件为:假设高频增益矩阵的所有前主子式定义为Δi,i=1,2,…,M,均非零并且他们的符号均已知,即Δi≠0,符号{Δi}已知。
使得γi>0,i=1,…,M可以是任意的。
其中,S*是一个正定矩阵,Us是一个单位上三角矩阵且Ds是形式为的已知对角矩阵,φf(x(t))表示将非标准系统动力学方程重构成一个输出方程所得到的输出方程的系统函数,表示将非标准系统动力学方程重构成一个输出方程所得到的输出方程的系数,y(t+1)表示输出y(t)的下一离散时刻的值,是从所研究系统转化得到的输出动力学方程的系数(需要说明的是,通过将转化得到的输出动力学方程的高频增益矩阵在满足一定假设条件下进行SDU矩阵分解得到参数模型,这样我们就可以根据对得到的未知参数进行估计,进而设计一个定义明确的自适应控制律),前者与原系统的未知常值向量Cj及未知常值参数有关,后者与原系统的未知常值向量Bj,Cj有关,从而得出被控非线性系统的标准形式的参数化模型为:
具体来说,上述步骤S2中所设计的自适应控制规律为:
u(t)=-Θ2(t)u(t)-Θ1(t)φf(x(t))+Θ3(t)ym(t+1)-Θ3(t)Am(y(t)-ym(t))
其中,Θi(t),i=1,2,3分别是(S*Ds)-1的估计值,Am是一个选定的稳定矩阵即特征值的模长均小于1即可,ym(t)∈RM是一个给定的有界参考输出信号,y(t)是输出变量,ym(t+1)表示给定的有界参考输出信号下一个离散时刻的值,y(t)表示系统的输出变量。
特别地,Θ2(t)有以下形式:
需要说明的是,该自适应控制律中的Θ2(t)是对角线元素为零的上三角矩阵,自适应控制律的结构如下:
u(t)=-Θ2(t)u(t)-Θ1(t)φf(x(t))+Θ3(t)ym(t+1)-Θ3(t)Am(y(t)-ym(t))
其中,Θi(t),i=1,2,3分别是(S*Ds)-1的估计值,Am是一个任意的一个特征值在单位圆内的稳定矩阵,ym(t)∈RM是t时刻的一个给定的有界参考输出信号,M为输出向量维度,y(t)是t时刻的输出变量。
需要说明的是,要保证该自适应控制律非奇异,只需让I+Θ2(t)非奇异即可,I是M阶的单位阵。注意到,I+Θ2(t)是一对角线元素为1的上三角矩阵,显然无论Θ2(t)中的参数如何更新,I+Θ2(t)永远是非奇异的。
本实施例的这一特殊结构决定了无论参数如何更新,自适应控制律永远是非奇异的,根据Θ2(t)的特殊形式,可通过所设计的自适应控制规律实现自适应控制律u(t),而不会出现奇异性问题,能够实现所研究对象的闭环稳定性和渐近输出跟踪。
详细地,可以计算控制信号如下:
由Θ2(t),定义以下向量:
θ2j(t)=[θ2jj+1(t),θ2jj+2(t),…,θ2jM(t)]T∈RM-j,j=1,2,…,M-1
需要说明的是,现有技术大多依赖参数投影技术保障自适应增益矩阵在参数更新时的非奇异性。然而,参数投影技术对于保障自适应增益矩阵的非奇异性需依赖异常严格的设计条件,这极大限制了方法的适用范围。本方法采用矩阵分解技术处理自适应增益矩阵的奇异性问题,所提出的自适应控制律不依赖参数投影技术,但依然能保证参数更新时控制律的非奇异性。
具体来说,上述步骤S3中,所述预期跟踪误差模型为:
其中,h(z)=1/h0(z),h0(z)=z-α,0<α<1,z为时间前移算子,h(z)是时间前移算子函数,是一个整体,表示h(z)作用于上,是为得到所期望的跟踪误差方程中所定义的中间变量,与输出动态方程参数化模型和所设计的自适应控制律中需要更新的参数有关,跟踪误差将作为关键反馈信号,用于调节自适应控制律参数。只要跟踪误差不为零,自适应控制律参数将持续调节,直至误差为零。当误差为零时,可实现控制目标。
其中,预期的跟踪误差模型的计算过程如下:
首先,定义跟踪误差:
e(t)=y(t)-ym(t)∈RM
将自适应控制规律代入到参数化模型中,得到以下跟踪误差方程:
Ψ(t)=[Θ1(t),Θ2(t),Θ3(t)],
Pm(z)=zI+Am,
这里z表示时间前移算子,即
z[X](t)=X(t+1)
其中,ai,i=0,…,p,是选定的常数。那么S*-1(e(t+1)+Ame(t))的表示公式可以表示为:
其中:
且有:
现介绍一个稳定的多项式:
h0(z)=z-α,且0<α<1。
然后,定义:
h(z)=1/h0(z)
为了得出参数更新定律,需要一个滤波误差定义如下
其中Φ(t)是S*Ds的估计值,σ(t)=[σ1(t),σ2(t),…,σM(t)]T,且对于j=1,2,…,M,有:
为了实现自适应控制律中的控制信号,需要更新Θi,i=1,2,3即等效于更新Ψ(t)和Φ(t)(S*Ds的估计值),参数更新定律设计如下:
其中, Δi为高频增益矩阵的顺序主子式的符号,Δi≠0且符号{Δi}已知,m(t)表示表示设计参数Φ(t)更新律中随时间变化的一个变量由系统输出方程中高频增益矩阵进行LDU矩阵分解得到,即中对角阵D*的对角线元素且它们可由的顺序主子式计算得到,γj表示系统输出动态方程中的对角矩阵Ds对角元素的绝对值,β∈R是一个选定的自适应增益,使得0<β<2λmin{S*-1}/λmax{S*-1},其中λmin{S*-1}和λmax{S*-1}分别表示S*-1特征值的最小值和最大值。
特别地,注意参数更新定律中关于γj的设计条件可以满足:
需要说明的是,通过将具有参数更新定律的自适应控制律应用到向量相对阶为[1,1,…,1]以及未知参数为的非标准型MIMO离散非线性系统中可以确保闭环稳定性和渐近输出跟踪,即limt→∞(y(t)-ym(t))=0。
本实施例中的参数更新律采用常规梯度法而设计,结构简单,易于操作。本方法的主要创新在于自适应控制律的设计。控制律基于矩阵分解技术而设计,具有特定的结构,该结构决定了无论参数如何更新,控制律永远是非奇异的。
以下通过一具体应用实例对本方案进行详细说明:
考虑以下多输入多输出离散时间非系统模型:
x(t+1)=f(x(t))+B1u1(t)+B2u2(t)
yi(t)=Cjx(t),j=1,2
其中为系统状态,uj,yj,j=1,2,分别为控制输入变量和输出变量,B1=[1,0,1]T,B2=[1,2,0]T,C1=[-1,0,0],C2=[1,-2,-1]以及f(x(t))=[f1(x(t)),f2(x(t)),f3(x(t))]T,这里
对于以上多输入多输出离散时间非系统模型,本方案的具体实现步骤如下:
S1:构建被控非线性系统的标准形式的参数化模型,具体为:
1)系统转换
根据Bj,Cj,j=1,2,的参数,我们得到
这意味着系统模型具有向量相对阶[1,1]。然后,利用微分同胚映射,令[ξ1(t),ξ2(t)]T=[y1(t),y2(t)]T且η(t)=x3(t),将系统模型转换为两个子系统:输出动力学为
y1(t+1)=-f1(x(t))-u1(t)-u2(t),
y2(t+1)=f1(x(t))-2f2(x(t))-f3(x(t))-3u2(t),以及内部动力学为
η(t+1)=f3(x(t))+u1(t)
2)构建参数化模型
在相对阶条件下,将输出动力学参数化为
为了导出参数化模型,我们首先将{CjBj}分解为SDU形式
其中S*,DS,US分别是等式右侧的三个矩阵。
最后,推导出输出动力学的参数化模型为
其中
S2:对于参数化模型的输入变量,设计其设计自适应控制律,自适应控制律设计为:
u(t)=-Θ2(t)u(t)-Θ1(t)φf(x(t))+Θ3(t)ym(t+1)-Θ3(t)Am(y(t)-ym(t))ym(t)=[ym1(t),ym2(t)]T稍后选择,Θi(t),i=1,2,3分别为(S*Ds)-1的估计值,且具有如下形式
以及:
S3:基于自适应控制规律和参数化模型,构建被控非线性系统的预期跟踪误差模型:
因此,预期跟踪误差模型为:
S4:利用被控非线性系统的预期跟踪误差模型,设计自适应控制律中的参数更新定律:
1)定义估计误差
将∈(t)指定为
这里Φ(t)是S*Ds的估计值,σ(t)=[σ1(t),σ2(t)]T且
2)设计参数更新定律
其中γj,j=1,2和β均选择0.5。
S5:利用具有参数更新定律的自适应控制规律对被控非线性系统进行自适应控制。
针对上述系统我们提出两种情况来验证所提出的自适应控制方法的有效性:(1)系统输出跟踪一个恒定的参考输出信号ym1=[-1,2]T。(2)系统输出跟踪一个时变的参考输出信号ym2(t)=[0.5+1.2 sin(0.5t),-3+2cos(0.4t)sin(0.3t)]T。
对于情况(1),图2显示了系统模型的输出信号y(t)对恒定参考输出信号ym1的响应,从中我们可以看到,系统的输出y(t)可以渐近跟踪ym1。图3显示了控制信号u(t)和系统状态变量的响应,从中我们可以看到控制输入和状态变量都收敛到某个有界常值。此外,我们还在图4中给出了部分参数自适应的响应,从中我们看到θi(t+1)-θi(t)渐近收敛到零。
对于情况(2),其操作过程与情况(1)相似。图5显示了系统模型的输出信号y(t)对时变参考输出信号ym2(t)的响应,从中我们看到y(t)可以渐近跟踪ym2。图6显示了控制信号u(t)和系统状态变量的响应,从中我们可以看到控制输入和状态变量都是有界的。图7给出了一些参数自适应的响应,从中我们看到θi(t+1)-θi(t)渐近收敛到零。从仿真结果可以得出,本发明所提出的自适应控制方案是有效的。
进一步地,本发明给出一个实际系统的例子,如图8所示的一种实用模型:平面肘臂机械手系统模型。
考虑一个平面的双连杆铰接机械手,其位置可以用关节角的二维向量q=[q1,q2]T来描述,其执行器输入由施加在机械手关节上的力矩组成,且力矩用一个二维向量τ=[τ1,τ2]T表示。对于i=1,2,mi表示连杆i的质量;li表示连杆i的长度;lci表示为连杆i前一个关节到连杆i质心的距离;Ii表示连杆i绕出页面经过连杆i质心的轴的转动惯量。
当q2较小时,机械手运动方程可简化为:
这里:
d22=m2lc2+I2
因此,输出方程y(t+1)可表示为:
这里θ*是一个未知矩阵,且是非奇异的,那么,离散时间机械手模型具有相对度[1,1]。θ*可被唯一分解为:
θ*=LD*U
其中:
利用L,D*,U,可将θ*分解为SDU形式
θ*=S*DsUs
这里S*是一个正定矩阵,Us是一个单位上三角矩阵,Ds是一个对角阵:
注意,这里S*和Ds是未知的,Ds是已知的。
其中,自适应控制律设计过程如下:
S1:构建被控非线性系统的标准形式的参数化模型:
S2:对于参数化模型的输入变量,设计其设计自适应控制律,自适应控制律设计为:
以及:
这里Am可取任意一个稳定的矩阵。
S3:基于自适应控制规律和参数化模型,构建被控非线性系统的预期跟踪误差模型:
令h0(z)=z-α(0<α<1),那么
因此,预期跟踪误差模型为:
S4:利用被控非线性系统的预期跟踪误差模型,设计自适应控制律中的参数更新定律。
1)定义估计误差
我们将∈(t)指定为
这里Φ(t)是S*Ds的估计值,σ(t)=[σ1(t),σ2(t)]T且
2)设计参数更新定律
其中γj,j=1,2和自适应增益β是可选择参数,且满足下面条件:
λmin{S*-1}和λmax{S*-1}分别表示S*-1的最大和最小特征值。
S5:利用具有参数更新定律的自适应控制规律对被控非线性系统进行自适应控制。
将上述步骤得到的参数更新律Θ1(t),Θ2(t)和Θ3(t)待入到设计的自适应控制律中,得到具有参数更新定律的自适应控制规律u(t):
其中x1,x2是系统的状态向量,表示双连杆铰接机械手的两个关节角,对于i=1,2,mi表示连杆i的质量;li表示连杆i的长度;lci表示为连杆i前一个关节到连杆i质心的距离;Am是设计过程中的一个中间矩阵,且是可任选的稳定矩阵;ym(t)是系统参考输入信号,ym(t+1)表示系统参考输入信号下一离散时刻的值。
本实施例还公开了一种计算机可读存储设备,所述存储设备存储有计算机程序,所述计算机程序被执行时实现上述实施例公开的非标准型MIMO离散非线性系统的自适应控制方法。
本实施例还公开了一种非标准型MIMO离散非线性系统的自适应控制系统,包括存储设备、处理器以及存储在所述存储设备中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序实现上述实施例公开的非标准型MIMO离散非线性系统的自适应控制方法。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (6)
1.一种非标准型MIMO离散非线性系统的自适应控制方法,其特征在于,包括:
对于向量相对阶为[1,1,...,1]的非标准型离散时间多输入输出非线性系统,构建被控非线性系统的标准形式的参数化模型;
对于参数化模型中的输入变量,设计其自适应控制规律;
基于自适应控制规律和参数化模型,构建被控非线性系统的预期跟踪误差模型;
利用被控非线性系统的预期跟踪误差模型,设计自适应控制规律中的参数更新定律,包括:
定义估计误差为其中,Φ(t)是S*Ds的估计值,S*是一个正定矩阵,Ds是对角矩阵,σ(t)=[σ1(t),σ2(t),...,σM(t)]T,∈(t)表示估计误差,σ(t)表示中间变量,δj(t)是为定义σ(t)每个分量所定义的中间变量,它们均与跟踪误差方程中的变量h(z)有关,其中,Ψj(t),分别表示Ψ(t),的第j个分量;
根据估计误差,设计参数Ψ(t)和Φ(t)的更新定律分别为:
其中,i=1,2,…,M,Δi为高频增益矩阵的顺序主子式的符号,Δi≠0且符号{Δi}已知,m(t)表示设计参数Φ(t)更新律中随时间变化的一个变量,由系统输出方程中高频增益矩阵进行LDU矩阵分解得到,即中对角阵D*的对角线元素且它们可由的顺序主子式计算得到,γj表示系统输出动态方程中的对角矩阵Ds对角元素的绝对值, β∈R是一个选定的自适应增益,使得0<β<2λmin{S*-1}/λmax{S*-1},其中λmin{S*-1}和λmax{S*-1}分别表示S*-1特征值的最小值和最大值;
利用具有参数更新定律的自适应控制规律对所述向量相对阶为[1,1,...,1]的非标准型离散时间多输入输出非线性系统进行自适应控制。
2.如权利要求1所述的非标准型MIMO离散非线性系统的自适应控制方法,其特征在于,所述被控非线性系统的标准形式的参数化模型为:
5.一种计算机可读存储设备,所述存储设备存储有计算机程序,其特征在于,所述计算机程序被执行时实现如权利要求1~4任一项所述方法。
6.一种非标准型MIMO离散非线性系统的自适应控制系统,包括存储设备、处理器以及存储在所述存储设备中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序实现如权利要求如权利要求1~4任一项所述方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011042487.1A CN112147896B (zh) | 2020-09-28 | 2020-09-28 | 一种非标准型mimo离散非线性系统的自适应控制方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011042487.1A CN112147896B (zh) | 2020-09-28 | 2020-09-28 | 一种非标准型mimo离散非线性系统的自适应控制方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112147896A CN112147896A (zh) | 2020-12-29 |
CN112147896B true CN112147896B (zh) | 2021-09-03 |
Family
ID=73896091
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011042487.1A Active CN112147896B (zh) | 2020-09-28 | 2020-09-28 | 一种非标准型mimo离散非线性系统的自适应控制方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112147896B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114527660B (zh) * | 2022-02-23 | 2022-09-02 | 中国科学院数学与系统科学研究院 | 无人直升机偏航通道动力学的自适应跟踪控制方法及系统 |
CN115453873B (zh) * | 2022-09-16 | 2024-07-09 | 北京理工大学 | 非线性结构动力学系统瞬态响应无条件稳定时间积分方法 |
CN116339155B (zh) * | 2023-05-25 | 2023-08-15 | 华东交通大学 | 高速动车组数据驱动积分滑模控制方法、系统及设备 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111352078A (zh) * | 2019-12-20 | 2020-06-30 | 湖北工业大学 | 杂波下基于admm的低截获频控阵mimo雷达系统的设计方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104571120A (zh) * | 2014-12-31 | 2015-04-29 | 天津大学 | 四旋翼无人机的姿态非线性自适应控制方法 |
CN107065554B (zh) * | 2017-04-27 | 2019-04-09 | 南京航空航天大学 | 近空间可变翼飞行器自适应小翼切换控制系统及工作方法 |
CN110061668B (zh) * | 2019-03-27 | 2021-02-09 | 贵州大学 | 一种pmsm的输入-输出精确反馈线性化控制方法 |
CN110109357B (zh) * | 2019-05-15 | 2022-02-18 | 曲阜师范大学 | 针对非标准型非线性航空器的半全局自适应控制方法 |
-
2020
- 2020-09-28 CN CN202011042487.1A patent/CN112147896B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111352078A (zh) * | 2019-12-20 | 2020-06-30 | 湖北工业大学 | 杂波下基于admm的低截获频控阵mimo雷达系统的设计方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112147896A (zh) | 2020-12-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112147896B (zh) | 一种非标准型mimo离散非线性系统的自适应控制方法及系统 | |
Ni et al. | Fixed-time adaptive neural network control for nonstrict-feedback nonlinear systems with deadzone and output constraint | |
Ma et al. | Stabilization of networked switched linear systems: An asynchronous switching delay system approach | |
Chu et al. | H∞ observer-based event-triggered sliding mode control for a class of discrete-time nonlinear networked systems with quantizations | |
Goswami et al. | Global bilinearization and controllability of control-affine nonlinear systems: A Koopman spectral approach | |
Boulkroune et al. | Adaptive fuzzy controller for multivariable nonlinear state time-varying delay systems subject to input nonlinearities | |
Feng et al. | Full-order terminal sliding-mode control of MIMO systems with unmatched uncertainties | |
Sakthivel et al. | Dissipative analysis for network-based singular systems with non-fragile controller and event-triggered sampling scheme | |
Liu et al. | Observer-based adaptive fuzzy-neural control for a class of uncertain nonlinear systems with unknown dead-zone input | |
CN110376879B (zh) | 一种基于神经网络的pid型迭代学习控制方法 | |
CN110007602B (zh) | 一种非线性系统低复杂度自适应饱和控制方法 | |
Wang et al. | Command filter based globally stable adaptive neural control for cooperative path following of multiple underactuated autonomous underwater vehicles with partial knowledge of the reference speed | |
Sun et al. | Robust adaptive neural network control of a class of uncertain strict-feedback nonlinear systems with unknown dead-zone and disturbances | |
Song et al. | Partial-state feedback multivariable MRAC and reduced-order designs | |
Ho | A system level approach to discrete-time nonlinear systems | |
CN116661347A (zh) | 一种含不确定时滞的多智能体一致性控制方法 | |
Li et al. | Distributed adaptive leader-following consensus control of connected Lagrangian systems with input hysteresis quantization and time-varying control gain | |
Rizvi et al. | Experience replay–based output feedback Q‐learning scheme for optimal output tracking control of discrete‐time linear systems | |
He et al. | Anti-disturbance dynamic inversion backstepping control for uncertain pure-feedback systems via multiple extended state observers | |
Selvaraj et al. | Stabilization of time delay systems with saturations via PDE predictor boundary control design | |
Chang et al. | Stabilization for a class of strict-feedback nonlinear systems via the PWM control law | |
Sun et al. | Iterative learning control with extended state observer for iteration-varying disturbance rejection | |
Tayebi | Model reference adaptive iterative learning control for linear systems | |
Shahriari-Kahkeshi | Dead-zone model-based adaptive fuzzy wavelet control for nonlinear systems including input saturation and dynamic uncertainties | |
CN112731801B (zh) | 一种对称死区非线性的自适应动态面输出反馈控制方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |