CN110687786B - 一种基于特征模型的自适应控制方法 - Google Patents

一种基于特征模型的自适应控制方法 Download PDF

Info

Publication number
CN110687786B
CN110687786B CN201910951321.2A CN201910951321A CN110687786B CN 110687786 B CN110687786 B CN 110687786B CN 201910951321 A CN201910951321 A CN 201910951321A CN 110687786 B CN110687786 B CN 110687786B
Authority
CN
China
Prior art keywords
control
control law
characteristic model
identification
law
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910951321.2A
Other languages
English (en)
Other versions
CN110687786A (zh
Inventor
孟斌
王丽娇
解永春
吴宏鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute of Control Engineering
Original Assignee
Beijing Institute of Control Engineering
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute of Control Engineering filed Critical Beijing Institute of Control Engineering
Priority to CN201910951321.2A priority Critical patent/CN110687786B/zh
Publication of CN110687786A publication Critical patent/CN110687786A/zh
Application granted granted Critical
Publication of CN110687786B publication Critical patent/CN110687786B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T90/00Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)

Abstract

一种基于特征模型的自适应控制方法,首先获取被控对象的特征模型,然后设计特征模型的系数与状态相关的界和参数辨识的投影方法,使用投影辨识算法辨识特征模型中的未知系数变量,得到辨识值,最后根据辨识值得到控制量,进而得到下一周期被控对象的输入,完成当前周期的基于特征模型的闭环控制。本发明方法通过设计与状态相关的系数的界,并进一步设计参数辨识的投影方法,解决了特征模型的参数难以确定常数的界的问题,实现了欧拉‑拉格朗日系统基于特征模型的自适应控制。同时,方法可涵盖多类被控对象,包括航天器被控对象、先进静止无功发生器被控对象等欧拉‑拉格朗日系统,具有较好的通用性与应用前景。

Description

一种基于特征模型的自适应控制方法
技术领域
本发明属于航天器控制领域,涉及一种基于特征模型的闭环反馈控制方法。
背景技术
特征建模理论是吴宏鑫院士20世纪80年代提出的控制理论,经过30多年的研究,在理论和应用上均取得了重要进展,形成了一套完整的实用性很强的自适应控制理论和方法。该方法在载人飞船再入升力控制、交会对接控制,以及探月返回控制中得到成功应用,开伞精度达到世界先进水平。因此,特征建模理论具有重要的应用价值和应用前景。
目前,所建立的特征模型的参数界均为常值。系统实际运行中,被控对象的系数与状态和控制输入有关。由于状态大部分时间运行在稳态,如果按照状态的物理意义来计算特征模型参数的界,所得到的界往往太过宽泛,实用性较差,保守性过强,导致闭环系统性能下降。例如航天器姿态角的范围是[-180度,180度],如果按照这个范围计算参数界的范围,则得到的范围较宽。实际上,姿态角只有暂态时变化较大,大部分时间是运行在稳态的,因此实际上并不需要如此大的范围。但是也不能按照稳态来计算其范围,因为这样计算的范围对于暂态又是不适用的。所以在实际当中,特征模型的系数的常数界难以确定。目前,针对该问题也尚未有解决方法。
发明内容
本发明解决的技术问题是:克服现有技术的不足,针对系数界与状态相关的参数未知的被控对象,给出了其特征建模的方法,通过设计与状态相关的系数的界,并进一步设计参数辨识的投影方法,解决了特征模型的参数难以确定常数的界的问题,并在此基础上设计闭环反馈控制律,为航天器等一大类欧拉-拉格朗日被控对象的自适应控制提供了基础。
本发明的技术解决方案是:一种基于特征模型的自适应控制方法,包括如下步骤:
(1)确定可由欧拉-拉格朗日方程表示的被控对象;所述的欧拉-拉格朗日方程为
Figure BDA0002225860960000021
其中,q∈Rp是广义坐标,
Figure BDA0002225860960000022
是广义速度,
Figure BDA0002225860960000023
是广义加速度,M(q)∈Rp×p是对称正定惯量矩阵,
Figure BDA0002225860960000024
是科里奥力,G(q)∈Rp是广义有势力,τ∈Rp是广义控制力矩,R表示实数空间;
(2)建立所述被控对象的特征模型;所述特征模型表示为:
q(k)=FC1(k-1)q(k-1)+FC2(k-1)q(k-2)+GC0(k-1)τ(k-1)
其中,k表示步数,k=1,2,…,初值为q(0)=q(-1)=0,τ(0)=0;FC1(k-1)∈Rp×p,FC2(k-1)∈Rp×p,GC0(k-1)∈Rp×p为系数矩阵;
(3)确定系数矩阵的界为
Figure BDA0002225860960000025
其中,Ts表示采样周期,eq(k-1)=q(k-1)-q(k-2);Km,KM,KC为正常数,满足KmIp≤M(q)≤KMIp
Figure BDA0002225860960000026
Ip表示p阶单位矩阵,|| ||表示矩阵和向量的范数,
Figure BDA0002225860960000027
是未知正常数,存在已知正常数KG,使得
Figure BDA0002225860960000028
(4)辨识所述系数矩阵的系数,辨识结果记为
Figure BDA0002225860960000029
(5)将步骤(4)得到的辨识结果投影到步骤(3)的界中,得到投影后的输出记为
Figure BDA00022258609600000210
(6)将步骤(5)的结果代入所述特征模型,并设计结果代入后基于特征模型的控制律τ(k-1);
(7)将步骤(6)得到的控制律τ(k-1)输入到被控对象的控制输入端,形成闭环控制。
所述的被控对象为航天器或者静止无功发生器,对于航天器,q表示航天器的三个姿态角组成的列矩阵,p=3;对于静止无功发生器,q表示电流和电压组成的列矩阵,p=3。
优选所述的步骤(4)中采用梯度算法或最小二乘算法进行参数辨识。
所述的采用梯度算法进行参数辨识,具体为:
Figure BDA0002225860960000031
Θ(k-1)=[FC1(k-1) FC2(k-1) GC0(k-1)]∈Rp×3p
Φ(k-1)=[q(k-1)T q(k-2)T τ(k-1)T]∈R1×3p
其中
Figure BDA0002225860960000032
是梯度算法的输出,
Figure BDA0002225860960000033
Figure BDA0002225860960000034
分别是FC1(k-1),FC2(k-1),GC0(k-1)的辨识结果;
梯度算法初值选取为:
当k=1时:
Figure BDA0002225860960000035
q(0)=0;Φ(-1)=01×3p,由初值计算得到
Figure BDA0002225860960000036
当k大于1时,对于第k步,
Figure BDA0002225860960000037
由第k-1步时得到;q(k-1)由第k-1步测量得到;Φ(k-2)=[q(k-2)T q(k-3)T τ(k-2)T],q(k-2)是第k-2步时的测量值,q(k-3)是第k-3步时的测量值,τ(k-2)由第k-1步时得到。
所述的采用最小二乘算法进行参数辨识,具体为:
Figure BDA0002225860960000038
Θ(k-1)=[FC1(k-1) FC2(k-1) GC0(k-1)]∈Rp×3p
Φ(k-1)=[q(k-1)T q(k-2)T τ(k-1)T]∈R1×3p
Figure BDA0002225860960000039
其中,
Figure BDA00022258609600000310
是梯度算法的输出,
Figure BDA00022258609600000311
Figure BDA00022258609600000312
分别是FC1(k-1),FC2(k-1),GC0(k-1)的辨识结果;
最小二乘算法初值选取为:
当k=1时:
Figure BDA0002225860960000041
q(0)=0p×1;Φ(-1)=01×3p;P(-1)=I3p;P(-1)=I3p;Φ(-1)=01×3p
当k大于1时,对于第k步,
Figure BDA0002225860960000042
由第k-1步得到;q(k-1)由第k-1步测量得到;Φ(k-2)=[q(k-2)T q(k-3)T τ(k-2)T],q(k-2)是第k-2步的测量值,q(k-3)是k-3步的测量值,τ(k-2)由第k-1步得到;P(k-2)由第k-1步得到;P(k-2)由第k-1步得到;Φ(k-2)=[q(k-2)T q(k-3)T τ(k-2)T],q(k-2)是第k-2步的测量值,q(k-3)是k-3步的测量值,τ(k-2)由第k-1步得到。
所述将步骤(4)得到的辨识结果投影到步骤(3)的界中,具体为:
首先作如下变换
Figure BDA0002225860960000043
然后将
Figure BDA0002225860960000044
投影,
Figure BDA0002225860960000045
Figure BDA0002225860960000046
Figure BDA0002225860960000047
投影后的输出记为
Figure BDA0002225860960000048
所述控制律τ(k-1)为线性控制律τL(k-1),或者黄金分割控制律τG(k-1),或者线性控制律τL(k-1)与黄金分割控制律τG(k-1)中的任意一个与维持跟踪控制律τ0(k-1)、逻辑积分控制律τI(k-1)、逻辑微分控制律τD(k-1)中的任意一个或多个控制律的和。
所述线性控制律τL(k-1)表示为
Figure BDA0002225860960000051
所述黄金分割控制律τG(k-1)表示为
Figure BDA0002225860960000052
所述跟踪控制律τ0(k-1)表示为
Figure BDA0002225860960000053
所述逻辑积分控制律τI(k-1)表示为
τI(k-1)=τI(k-2)-kIe(k-1)
所述逻辑微分控制律τD(k-1)表示为
τD(k-1)=-kD(e(k-1)-e(k-2))
其中,λ>0;L1>0,L2>0;l1=0.382,l2=0.618为黄金分割系数;qR(k-1),qR(k-2)分别是第k-1步和第k-2步的已知参考曲线,qR(0)=qR(-1)=0p×1
Figure BDA0002225860960000054
τI(0)=τI(-1)=0p×1;e(k-1)=q(k-1)-qR(k-1),e(k-2)=q(k-2)-qR(k-2),
qR(k-1),qR(k-2)分别是第k-1步和第k-2步的已知参考曲线;
Figure BDA0002225860960000055
或者
Figure BDA0002225860960000056
cD>0,lD>0
其中,e(k-j-1)=q(k-j-1)-qR(k-j-1),j=0,1,…,lD,q(k-j-1)由第k-j-1步测量得到,q(k)=0p×1,k≤0;qR(k-j-1)由第k-j-1步测量得到,qR(k)=0p×1,k≤0。
本发明与现有技术相比的优点在于:
(1)本发明方法与现有技术相比,通过提出与状态相关的特征模型系数的界与投影方法,涵盖了多类被控对象,包括航天器被控对象、先进静止无功发生器被控对象等欧拉-拉格朗日系统,解决了它们基于特征模型的自适应控制问题,突破了特征模型参数的界的确定问题,具有较好的通用性;
(2)本发明方法与现有技术相比,通过设计特征模型的系数与状态相关的界,解决了经典特征模型定常界难以确定的问题;
(3)本发明方法与现有技术相比,通过设计与状态相关的界的投影方法,解决了特征模型的参数辨识问题,实现了基于特征模型的自适应控制设计,提高了闭环系统的性能。
附图说明
图1为本发明方法的流程框图。
具体实施方式
下面结合附图对本发明做详细说明。
本发明方法提出了与状态相关的系数界,及其辨识方法,解决特征模型的建模问题,并在此基础上实现对欧拉-拉格朗日被控对象的自适应控制。如图1所示,本发明通过步骤(1)-步骤(7)实现。
步骤(1)
被控对象由如下欧拉-拉格朗日方程表示:
Figure BDA0002225860960000061
其中,q∈Rp是广义坐标,
Figure BDA0002225860960000062
是广义速度,
Figure BDA0002225860960000063
是广义加速度,M(q)∈Rp×p是对称正定惯量矩阵,
Figure BDA0002225860960000064
是科里奥力,G(q)∈Rp是广义有势力,τ∈Rp是广义控制力矩,R表示实数空间。
系统公式(1)满足如下性质:
性质1:存在已知正常数Km,KM,KC,使得KmIp≤M(q)≤KMIp
Figure BDA0002225860960000065
Ip表示p阶单位矩阵,
|| ||表示矩阵和向量的范数。
很多被控对象都可以用欧拉-拉格朗日系统公式(1)描述。
本发明中,被控对象可以是航天器被控对象。在公式(1)中,p=3;q具体表示航天器的三个姿态角组成的列矩阵,G(q)=0;各个变量所表示的意义可以参见文献:杨洪平,编队航天器有限时间姿态协同控制,黑龙江大学硕士研究生学位论文:2016。
本发明中,被控对象可以是先进静止无功发生器。在公式(1)中,p=3;q具体表示电流和电压组成的列矩阵,
Figure BDA0002225860960000071
是未知正常数,存在已知正常数KG,使得
Figure BDA0002225860960000072
各个变量所表示的意义可以参见文献:谢争先,梁志珊,张化光,基于欧拉-拉格朗日系统模型的ASVG无源非线性综合控制,电力自动化设备,2009,29(3):61-64。
因此,不失一般性,做如下假设:
假设1:
Figure BDA0002225860960000073
是未知正常数,存在已知正常数KG,使得
Figure BDA0002225860960000074
步骤(2)
按照特征模型理论,建立被控对象公式(1)的特征模型如下:
q(k)=FC1(k-1)q(k-1)+FC2(k-1)q(k-2)+GC0(k-1)τ(k-1) (2)
其中,k表示步数,k=1,2,…;初值为q(0)=q(-1)=0,τ(0)=0;系数矩阵FC1(k-1)∈Rp×p,FC2(k-1)∈Rp×p,GC0(k-1)∈Rp×p由步骤(3)和步骤(4)辨识得到,它们的界为
Figure BDA0002225860960000075
其中,Ts表示采样周期;eq(k-1)=q(k-1)-q(k-2);kC,kM,km,kG在性质1和假设1中给出。
本发明中,公式(2)和公式(3)是通过下面的推导得到的。首先,采用欧拉离散化方法对公式(1)进行离散化,结合假设1,可以得到
Figure BDA0002225860960000081
对公式(4)进行整理,可以得到公式(2),其中
Figure BDA0002225860960000082
下面推导公式(3)。
由公式(5)、性质1、假设1,可得
Figure BDA0002225860960000083
Figure BDA0002225860960000084
Figure BDA0002225860960000085
可知,公式(3)成立。
在步骤(3)中采用梯度算法或最小二乘算法进行辨识,这里需要用到上一步(也即上一个k值)中步骤(6)得到的控制律;步骤(4)对步骤(3)得到的辨识结果进行投影,得到最终的辨识结果;步骤(5)利用步骤(4)得到的辨识结果组成特征模型,用以步骤(6)设计控制律;步骤(6)计算控制律,用以下一步的参数辨识,如此循环往复。
步骤(3)
采用梯度算法或最小二乘算法辨识公式(2)的系数FC1(k),FC2(k),GC0(k),辨识结果记为
Figure BDA0002225860960000086
将公式(2)改写为:
q(k)=Θ(k-1)Φ(k-1)T
其中,
Θ(k-1)=[FC1(k-1) FC2(k-1) GC0(k-1)]∈Rp×3p
Φ(k-1)=[q(k-1)T q(k-2)T τ(k-1)T]∈R1×3p
采用梯度算法或最小二乘算法辨识Θ(k-1)。
梯度算法为:
Figure BDA0002225860960000091
其中,
Figure BDA0002225860960000092
是梯度算法的输出,
Figure BDA0002225860960000093
Figure BDA0002225860960000094
分别是FC1(k-1),FC2(k-1),GC0(k-1)的辨识结果。
Figure BDA0002225860960000095
k=1,2…中,当k=1时,
Figure BDA0002225860960000096
由下面的初值选取得到;当k〉1时,由下面的步骤(4)得到。
梯度算法初值选取为:
当k=1时:
Figure BDA0002225860960000097
kM,km在性质1中给出;q(0)=0;Φ(-1)=01×3p。由上述初值可以计算得到
Figure BDA0002225860960000098
利用下面步骤(4),由
Figure BDA0002225860960000099
可以得到
Figure BDA00022258609600000910
下面进一步采用公式(9)递推计算
Figure BDA00022258609600000911
k=2,3,…。具体步骤如下:
当k=2时:公式(9)的等号右侧各值为:
Figure BDA00022258609600000912
由第k=1步时步骤(4)得到;q(1)由第k=1步测量得到;Φ(0)=01×3p。由公式(9)可以计算得到
Figure BDA00022258609600000913
利用下面步骤(4),由
Figure BDA00022258609600000914
可以得到
Figure BDA00022258609600000915
当k=3时:公式(9)的等号右侧各值为:
Figure BDA00022258609600000916
由第k=2步时步骤(4)得到;q(2)由第k=2步测量得到;Φ(1)=[q(1)T q(0)T τ(1)T],q(1)由第k=1步测量得到,q(0)=0p×1,τ(1)由第k=2步时步骤(6)得到。由公式(9)可以计算得到
Figure BDA00022258609600000917
利用下面步骤(4),由
Figure BDA00022258609600000918
可以得到
Figure BDA00022258609600000919
类似地,接着根据公式(9)计算k=4,5,…,的辨识值
Figure BDA00022258609600000920
具体地说,对于第k步,公式(9)的等号右侧各值为:
Figure BDA00022258609600000921
由第k-1步时步骤(4)得到;q(k-1)由第k-1步测量得到;Φ(k-2)=[q(k-2)T q(k-3)T τ(k-2)T],q(k-2)是第k-2步时的测量值,q(k-3)是第k-3步时的测量值,τ(k-2)由第k-1步时步骤(6)得到。由公式(9)可以计算得到
Figure BDA0002225860960000101
利用下面步骤(4),由
Figure BDA0002225860960000102
可以得到
Figure BDA0002225860960000103
最小二乘算法为:
Figure BDA0002225860960000104
Figure BDA0002225860960000105
其中,
Figure BDA0002225860960000106
是梯度算法的输出,
Figure BDA0002225860960000107
Figure BDA0002225860960000108
分别是FC1(k-1),FC2(k-1),GC0(k-1)的辨识结果。
最小二乘算法初值选取为:
当k=1时:
公式(10)的初值:
Figure BDA0002225860960000109
kM,km在性质1中给出;q(0)=0p×1;Φ(-1)=01×3p;P(-1)=I3p
公式(11)的初值:P(-1)=I3p;Φ(-1)=01×3p
由公式(10)的初值可以计算得到
Figure BDA00022258609600001010
利用下面步骤(4),由
Figure BDA00022258609600001011
可以得到
Figure BDA00022258609600001012
由公式(11)的初值可以计算得到P(0)∈I3p。用于下一步当k=2时公式(10)和公式(11)。
下面进一步采用公式(10)和公式(11)递推计算
Figure BDA00022258609600001013
和P(k)∈I3p,k=2,3,…。具体步骤如下:
当k=2时:
公式(10)的等号右侧各值为:
Figure BDA00022258609600001014
由上一步第k=1步时步骤(4)得到;q(1)由第k=1步测量得到;Φ(0)=01×3p;P(0)由第k=1步步骤(3)公式(11)得到。由公式(10)可以计算得到
Figure BDA00022258609600001015
进一步由步骤(4)得到
Figure BDA00022258609600001016
公式(11)的等号右侧各值为:P(0)由第k=1步时步骤(3)公式(11)得到;Φ(0)=01×3p。由公式(11)可以计算得到P(1)∈I3p
当k=3时:
公式(10)的等号右侧各值为:
Figure BDA0002225860960000111
由第k=2步时步骤(4)得到;q(2)由第k=2步测量得到;Φ(1)=[q(1)T q(0)T τ(1)T],q(1)是k=1时的测量值,q(0)=0p×1,τ(1)由第k=2步时步骤(6)得到;P(1)由第k=2步时步骤(3)公式(11)得到。由公式(10)可以计算得到
Figure BDA0002225860960000112
进一步由步骤(4)得到
Figure BDA0002225860960000113
公式(11)的等号右侧各值为:P(1)由上一步当k=2时公式(11)得到;Φ(1)=[q(1)T q(0)T τ(1)T],q(1)是k=1时的测量值,q(0)=0p×1,τ(1)由第k=2步时步骤(6)得到。
类似地,接着根据公式(10)和公式(11)计算k=4,5,…,的辨识值
Figure BDA0002225860960000114
和P(k-1)∈I3p。具体地说,对于第k步:
公式(10)的等号右侧各值为:
Figure BDA0002225860960000115
由第k-1步时步骤(4)得到;q(k-1)由第k-1步测量得到;Φ(k-2)=[q(k-2)T q(k-3)T τ(k-2)T],q(k-2)是第k-2步时的测量值,q(k-3)是k-3步时的测量值,τ(k-2)由第k-1步时步骤(6)得到;P(k-2)由第k-1步时步骤(3)公式(11)得到。由公式(10)可以计算得到
Figure BDA0002225860960000116
进一步由步骤(4)得到
Figure BDA0002225860960000117
公式(11)的等号右侧各值为:P(k-2)由第k-1步时步骤(3)公式(11)得到;Φ(k-2)=[q(k-2)T q(k-3)T τ(k-2)T],q(k-2)是第k-2步时的测量值,q(k-3)是k-3步时的测量值,τ(k-2)由第k-1步时步骤(6)得到。由公式(11)可以计算得到P(k-1)∈I3p
综上,通过梯度算法公式(9)或者最小二乘算法公式(10)或者公式(11)可以得到
Figure BDA0002225860960000118
步骤(4)
将步骤(3)得到的辨识值
Figure BDA0002225860960000119
投影到公式(3)的界中,得到最终辨识值
Figure BDA00022258609600001110
由于已知参数的界公式(3),因此进行投影。
本发明中,具体投影方法为:
首先作如下变换
Figure BDA0002225860960000121
Figure BDA0002225860960000122
投影到公式(3)的区域中。具体投影方法是:
Figure BDA0002225860960000123
Figure BDA0002225860960000124
Figure BDA0002225860960000125
投影后的输出记为
Figure BDA0002225860960000126
在本发明中,公式(15)通过如下推导得到。由公式(4)
Figure BDA0002225860960000127
本步骤通过对
Figure BDA0002225860960000128
进行变换
Figure BDA0002225860960000129
从而保证了它的对称性。
步骤(5)
利用步骤(4)得到的辨识值得到特征模型
Figure BDA0002225860960000131
步骤(6)
由公式(17),设计基于特征模型的控制律。
本发明方法中针对二阶特征模型公式(17),控制律τ(k-1)可以取为线性控制律τL(k-1),或者黄金分割控制律τG(k-1),或者τL(k-1)(τG(k-1))与维持跟踪控制律τ0(k-1)、逻辑积分控制律τI(k-1)、逻辑微分控制律τD(k-1)中的某一个或多个控制律的和,其中,
Figure BDA0002225860960000132
Figure BDA0002225860960000133
Figure BDA0002225860960000134
τI(k-1)=τI(k-2)-kIe(k-1) (21)
τD(k-1)=-kD(e(k-1)-e(k-2)) (22)
公式(18)~公式(22)中各变量由下面的方法得到。
在公式(18)中,λ>0;
Figure BDA0002225860960000135
由步骤(4)得到;q(k-1),q(k-2)分别由第k-1步和第k-2步测量得到,q(0)=q(-1)=0p×1;L1>0,L2>0。
在公式(19)中,l1=0.382,l2=0.618为黄金分割系数。其他变量与公式(18)相同。
在公式(20)中,qR(k-1),qR(k-2)分别是第k-1步和第k-2步的已知参考曲线,qR(0)=qR(-1)=0p×1。其他参数与公式(18)取法相同。
在公式(21)中,
Figure BDA0002225860960000136
τI(k-2)是第k-1步时步骤(6)公式(21)的输出值,τI(0)=τI(-1)=0p×1;e(k-1)=q(k-1)-qR(k-1),e(k-2)=q(k-2)-qR(k-2),q(k-1),q(k-2)分别由第k-1步和第k-2步测量得到,q(0)=q(-1)=0p×1,qR(k-1),qR(k-2)分别是第k-1步和第k-2步的已知参考曲线,qR(0)=qR(-1)=0p×1
在公式(22)中,
Figure BDA0002225860960000141
或者
Figure BDA0002225860960000142
cD>0,lD>0
其中,e(k-j-1)=q(k-j-1)-qR(k-j-1),j=0,1,…,lD,q(k-j-1)由第k-j-1步测量得到,q(k)=0p×1,k≤0;qR(k-j-1)由第k-j-1步测量得到,qR(k)=0p×1,k≤0。
步骤(7)
将步骤(6)得到的控制律τ(k-1)输入到被控对象公式(1)的输入端,形成闭环。
综上,步骤(1)-步骤(7)在一定条件下解决了系数界与状态相关的特征建模的辨识方法和控制方法,实现了基于特征模型的自适应控制。
本发明说明书中未作详细描述的内容属本领域技术人员的公知技术。

Claims (6)

1.一种基于特征模型的自适应控制方法,其特征在于包括如下步骤:
(1)确定可由欧拉-拉格朗日方程表示的被控对象;所述的欧拉-拉格朗日方程为
Figure FDA0003604119840000011
其中,q∈Rp是广义坐标,
Figure FDA0003604119840000012
是广义速度,
Figure FDA0003604119840000013
是广义加速度,M(q)∈Rp×p是对称正定惯量矩阵,
Figure FDA0003604119840000014
是科里奥力,G(q)∈Rp是广义有势力,τ∈Rp是广义控制力矩,R表示实数空间;
(2)建立所述被控对象的特征模型;所述特征模型表示为:
q(k)=FC1(k-1)q(k-1)+FC2(k-1)q(k-2)+GC0(k-1)τ(k-1)
其中,k表示步数,k=1,2,…,初值为q(0)=q(-1)=0,τ(0)=0;FC1(k-1)∈Rp×p,FC2(k-1)∈Rp×p,GC0(k-1)∈Rp×p为系数矩阵;
(3)确定系数矩阵的界为
Figure FDA0003604119840000015
其中,Ts表示采样周期,eq(k-1)=q(k-1)-q(k-2);Km,KM,KC为正常数,满足KmIp≤M(q)≤KMIp
Figure FDA0003604119840000016
Ip表示p阶单位矩阵,|| ||表示矩阵和向量的范数,
Figure FDA0003604119840000017
Figure FDA0003604119840000018
是未知正常数,存在已知正常数KG,使得
Figure FDA0003604119840000019
(4)辨识所述系数矩阵的系数,辨识结果记为
Figure FDA00036041198400000110
(5)将步骤(4)得到的辨识结果投影到步骤(3)的界中,得到投影后的输出记为
Figure FDA00036041198400000111
(6)将步骤(5)的结果代入所述特征模型,并设计结果代入后基于特征模型的控制律τ(k-1);
所述控制律τ(k-1)为线性控制律τL(k-1),或者黄金分割控制律τG(k-1),或者线性控制律τL(k-1)与黄金分割控制律τG(k-1)中的任意一个与维持跟踪控制律τ0(k-1)、逻辑积分控制律τI(k-1)、逻辑微分控制律τD(k-1)中的任意一个或多个控制律的和;
所述线性控制律τL(k-1)表示为
Figure FDA0003604119840000021
所述黄金分割控制律τG(k-1)表示为
Figure FDA0003604119840000022
所述跟踪控制律τ0(k-1)表示为
Figure FDA0003604119840000023
所述逻辑积分控制律τI(k-1)表示为
τI(k-1)=τI(k-2)-kIe(k-1)
所述逻辑微分控制律τD(k-1)表示为
τD(k-1)=-kD(e(k-1)-e(k-2))
其中,λ>0;L1>0,L2>0;l1=0.382,l2=0.618为黄金分割系数;qR(k-1),qR(k-2)分别是第k-1步和第k-2步的已知参考曲线,qR(0)=qR(-1)=0p×1
Figure FDA0003604119840000024
τI(0)=τI(-1)=0p×1;e(k-1)=q(k-1)-qR(k-1),e(k-2)=q(k-2)-qR(k-2),qR(k-1),qR(k-2)分别是第k-1步和第k-2步的已知参考曲线;
Figure FDA0003604119840000025
或者
Figure FDA0003604119840000026
其中,e(k-j-1)=q(k-j-1)-qR(k-j-1),j=0,1,…,lD,q(k-j-1)由第k-j-1步测量得到,q(k)=0p×1,k≤0;qR(k-j-1)由第k-j-1步测量得到,qR(k)=0p×1,k≤0;
(7)将步骤(6)得到的控制律τ(k-1)输入到被控对象的控制输入端,形成闭环控制。
2.根据权利要求1所述的一种基于特征模型的自适应控制方法,其特征在于:所述的被控对象为航天器或者静止无功发生器,对于航天器,q表示航天器的三个姿态角组成的列矩阵,p=3;对于静止无功发生器,q表示电流和电压组成的列矩阵,p=3。
3.根据权利要求1或2所述的一种基于特征模型的自适应控制方法,其特征在于:所述的步骤(4)中采用梯度算法或最小二乘算法进行参数辨识。
4.根据权利要求3所述的一种基于特征模型的自适应控制方法,其特征在于:所述的采用梯度算法进行参数辨识,具体为:
Figure FDA0003604119840000031
Θ(k-1)=[FC1(k-1) FC2(k-1) GC0(k-1)]∈Rp×3p
Φ(k-1)=[q(k-1)T q(k-2)T τ(k-1)T]∈R1×3p
其中
Figure FDA0003604119840000032
是梯度算法的输出,
Figure FDA0003604119840000033
Figure FDA0003604119840000034
分别是FC1(k-1),FC2(k-1),GC0(k-1)的辨识结果;
梯度算法初值选取为:
当k=1时:
Figure FDA0003604119840000035
q(0)=0;Φ(-1)=01×3p,由初值计算得到
Figure FDA0003604119840000036
当k大于1时,对于第k步,
Figure FDA0003604119840000037
由第k-1步时得到;q(k-1)由第k-1步测量得到;Φ(k-2)=[q(k-2)T q(k-3)T τ(k-2)T],q(k-2)是第k-2步时的测量值,q(k-3)是第k-3步时的测量值,τ(k-2)由第k-1步时得到。
5.根据权利要求3所述的一种基于特征模型的自适应控制方法,其特征在于:所述的采用最小二乘算法进行参数辨识,具体为:
Figure FDA0003604119840000038
Θ(k-1)=[FC1(k-1) FC2(k-1) GC0(k-1)]∈Rp×3p
Φ(k-1)=[q(k-1)T q(k-2)T τ(k-1)T]∈R1×3p
Figure FDA0003604119840000039
其中,
Figure FDA0003604119840000041
是梯度算法的输出,
Figure FDA0003604119840000042
Figure FDA0003604119840000043
分别是FC1(k-1),FC2(k-1),GC0(k-1)的辨识结果;
最小二乘算法初值选取为:
当k=1时:
Figure FDA0003604119840000044
q(0)=0p×1;Φ(-1)=01×3p;P(-1)=I3p;P(-1)=I3p;Φ(-1)=01×3p
当k大于1时,对于第k步,
Figure FDA0003604119840000045
由第k-1步得到;q(k-1)由第k-1步测量得到;Φ(k-2)=[q(k-2)T q(k-3)T τ(k-2)T],q(k-2)是第k-2步的测量值,q(k-3)是k-3步的测量值,τ(k-2)由第k-1步得到;P(k-2)由第k-1步得到;P(k-2)由第k-1步得到;Φ(k-2)=[q(k-2)T q(k-3)T τ(k-2)T],q(k-2)是第k-2步的测量值,q(k-3)是k-3步的测量值,τ(k-2)由第k-1步得到。
6.根据权利要求3所述的一种基于特征模型的自适应控制方法,其特征在于:所述将步骤(4)得到的辨识结果投影到步骤(3)的界中,具体为:
首先作如下变换
Figure FDA0003604119840000046
然后将
Figure FDA0003604119840000047
投影,
Figure FDA0003604119840000048
Figure FDA0003604119840000049
Figure FDA0003604119840000051
投影后的输出记为
Figure FDA0003604119840000052
CN201910951321.2A 2019-10-08 2019-10-08 一种基于特征模型的自适应控制方法 Active CN110687786B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910951321.2A CN110687786B (zh) 2019-10-08 2019-10-08 一种基于特征模型的自适应控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910951321.2A CN110687786B (zh) 2019-10-08 2019-10-08 一种基于特征模型的自适应控制方法

Publications (2)

Publication Number Publication Date
CN110687786A CN110687786A (zh) 2020-01-14
CN110687786B true CN110687786B (zh) 2022-07-05

Family

ID=69111614

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910951321.2A Active CN110687786B (zh) 2019-10-08 2019-10-08 一种基于特征模型的自适应控制方法

Country Status (1)

Country Link
CN (1) CN110687786B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111505941B (zh) * 2020-05-11 2022-07-29 北京控制工程研究所 一种基于一阶特征模型的加速度模式自适应无拖曳控制方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2267560A1 (en) * 2009-06-22 2010-12-29 Fisher-Rosemount Systems, Inc. Continuously scheduled model parameter based adaptive controller
CN104460318A (zh) * 2013-09-25 2015-03-25 北京化工大学 一种基于闭环过程信息约束的前向通道模型多目标优化辨识整定方法
CN105912025A (zh) * 2016-06-08 2016-08-31 北京控制工程研究所 一种基于特征模型的高空飞艇水平位置控制方法
CN108490785A (zh) * 2018-04-26 2018-09-04 北京控制工程研究所 一种参数未知系统的控制系数范围确定的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2267560A1 (en) * 2009-06-22 2010-12-29 Fisher-Rosemount Systems, Inc. Continuously scheduled model parameter based adaptive controller
CN104460318A (zh) * 2013-09-25 2015-03-25 北京化工大学 一种基于闭环过程信息约束的前向通道模型多目标优化辨识整定方法
CN105912025A (zh) * 2016-06-08 2016-08-31 北京控制工程研究所 一种基于特征模型的高空飞艇水平位置控制方法
CN108490785A (zh) * 2018-04-26 2018-09-04 北京控制工程研究所 一种参数未知系统的控制系数范围确定的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
饶卫东."基于特征模型的挠性航天器".《空间控制技术与应用》.2009,第35卷(第3期),第49-52页. *

Also Published As

Publication number Publication date
CN110687786A (zh) 2020-01-14

Similar Documents

Publication Publication Date Title
Djordjevic et al. Data-driven control of hydraulic servo actuator based on adaptive dynamic programming.
Wang et al. Data-driven performance-prescribed reinforcement learning control of an unmanned surface vehicle
Li et al. Robust simultaneous fault estimation and nonfragile output feedback fault-tolerant control for Markovian jump systems
Zhu et al. Adaptive suboptimal output-feedback control for linear systems using integral reinforcement learning
Rovithakis et al. Adaptive control with recurrent high-order neural networks: theory and industrial applications
Jiang et al. Finite-time output feedback attitude control for spacecraft using “Adding a power integrator” technique
Mayhew et al. Quaternion-based hybrid control for robust global attitude tracking
CN106125553B (zh) 一种考虑状态约束的液压系统自适应控制方法
Tian et al. A continuous finite-time output feedback control scheme and its application in quadrotor UAVs
Kersten et al. State-space transformations of uncertain systems with purely real and conjugate-complex eigenvalues into a cooperative form
Taylor et al. A control lyapunov perspective on episodic learning via projection to state stability
Li et al. On robust control of continuous-time systems with state-dependent uncertainties and its application to mechanical systems
Chen et al. Barrier Lyapunov function-based sliding mode control for BWB aircraft with mismatched disturbances and output constraints
CN110687786B (zh) 一种基于特征模型的自适应控制方法
Peng et al. Distributed Consensus‐Based Robust Adaptive Formation Control for Nonholonomic Mobile Robots with Partial Known Dynamics
CN105589334B (zh) 一种基于输入平滑的特征模型参数辨识方法
Mayhew et al. On the non-robustness of inconsistent quaternion-based attitude control systems using memoryless path-lifting schemes
Ali et al. State recovery and disturbance estimation-based fast trajectory tracking of autonomous surface vehicles: A finite-time approach
Zhang et al. Nonrecursive Control Design for Nonlinear Systems: Theory and Applications
Mohammadpour et al. A new discrete-time robust adaptive time-delay control for a class of uncertain nonlinear strict-feedback systems using sliding mode
Rigo et al. A comparison between the Extended Kalman Filter and a Minimum-Energy Filter in the TSE (2) case
Luo et al. Data-based approximate policy iteration for nonlinear continuous-time optimal control design
Szuster et al. Discrete Globalised Dual Heuristic Dynamic Programming in Control of the Two‐Wheeled Mobile Robot
Wang et al. Path following of Nano quad-rotors using a novel disturbance observer-enhanced dynamic inversion approach
Chen et al. An improved nonlinear model for a helicopter and its self-repairing control with multiple faults via quantum information technique

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant