CN112379595B - 非线性严格反馈切换系统复合干扰学习控制方法 - Google Patents

非线性严格反馈切换系统复合干扰学习控制方法 Download PDF

Info

Publication number
CN112379595B
CN112379595B CN202011273968.3A CN202011273968A CN112379595B CN 112379595 B CN112379595 B CN 112379595B CN 202011273968 A CN202011273968 A CN 202011273968A CN 112379595 B CN112379595 B CN 112379595B
Authority
CN
China
Prior art keywords
neural network
nonlinear
design parameter
switching
positive
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011273968.3A
Other languages
English (en)
Other versions
CN112379595A (zh
Inventor
许斌
程怡新
马波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northwestern Polytechnical University
AVIC Chengdu Aircraft Design and Research Institute
Original Assignee
Northwestern Polytechnical University
AVIC Chengdu Aircraft Design and Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northwestern Polytechnical University, AVIC Chengdu Aircraft Design and Research Institute filed Critical Northwestern Polytechnical University
Priority to CN202011273968.3A priority Critical patent/CN112379595B/zh
Publication of CN112379595A publication Critical patent/CN112379595A/zh
Application granted granted Critical
Publication of CN112379595B publication Critical patent/CN112379595B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/0265Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
    • G05B13/027Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion using neural networks only
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance

Landscapes

  • Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明涉及一种非线性严格反馈切换系统复合干扰学习控制方法,用于解决现有非线性切换系统控制方法实用性差的技术问题。技术方案是考虑非线性严格反馈切换系统存在外界干扰和输入死区,对系统进行模型变换;使用神经网络逼近系统未知非线性函数,设计切换扰动观测器估计复合干扰;基于动态逆控制框架设计自适应神经网络切换控制器;通过设计平行估计模型构造了预测误差,并将预测误差引入到神经网络权重自适应更新律和切换扰动观测器设计中,提升了不确定学习精度;本发明结合非线性切换系统控制特点,通过设计复合干扰学习控制器有效提升了控制性能,适用于工程应用。

Description

非线性严格反馈切换系统复合干扰学习控制方法
技术领域
本发明涉及一种非线性切换系统控制方法,特别是涉及一种非线性严格反馈切换系统复合干扰学习控制方法,属于飞行控制领域。
背景技术
在实际工程中,许多控制对象如变体飞行器、变频电机以及机器人等都可以用非线性切换系统来描述,因此非线性切换系统控制技术引起了广泛关注,在汽车、电力、化工等许多行业都得到了研究与应用。
非线性切换系统自身具有较强的不确定性,同时易受到外部干扰和输入死区的影响,现有的控制方法多采用神经网络或模糊逻辑等智能系统逼近不确定性,采用扰动观测器估计外部干扰。这些控制方法只考虑了智能系统的逼近作用,忽视了智能学习策略的本质,没有对不确定性学习性能进行有效评价,且智能逼近系统和扰动观测器之间没有信息交互,鲁棒性性较差,不利于工程实现。因此研究面向学习性能提升的先进控制方法对于非线性切换系统控制研究意义重大且有着迫切需求。
发明内容
要解决的技术问题
为了克服现有非线性切换系统控制方法实用性差的不足,本发明提供一种非线性严格反馈切换系统复合干扰学习控制方法。
技术方案
一种非线性严格反馈切换系统复合干扰学习控制方法,其特征在于以下步骤:
步骤1:考虑一类单输入单输出非线性严格反馈切换系统
Figure BDA0002778558720000021
其中,x(t)=[x1,...,xn]T∈Rn是系统状态向量,
Figure BDA0002778558720000022
uσ(t)∈R是系统输入,y∈R是系统输出;函数σ(t):[0,∞)→M={1,2,…,m}是切换信号,且σ(t)=k时表示第k个子系统是激活的;
Figure BDA0002778558720000023
Figure BDA0002778558720000024
是关于
Figure BDA0002778558720000025
的未知平滑函数;di,σ(t)(t),i=1,2,…,n是外部未知干扰;
步骤2:将系统输入非线性描述为
Figure BDA0002778558720000026
其中,uv,σ(t)∈R是带死区的输入,
Figure BDA0002778558720000027
br,σ(t)和bl,σ(t)是未知的正常数;
可将(2)进一步描述为
Figure BDA0002778558720000028
其中
Figure BDA0002778558720000029
信号uσ(t)存在如下关系
Figure BDA00027785587200000210
其中
Figure BDA00027785587200000211
是uv,σ(t)的上界值;
则系统(1)可进一步写为
Figure BDA0002778558720000031
其中,
Figure BDA0002778558720000032
步骤3:针对非线性切换系统(5),基于动态逆控制框架设计复合干扰学习控制器;
第1步:
定义输出跟踪误差e1=x1-yd,其中yd是控制参考指令;
对于未知函数
Figure BDA0002778558720000033
用神经网络来逼近
Figure BDA0002778558720000034
其中,
Figure BDA0002778558720000035
是神经网络最优权重向量,
Figure BDA0002778558720000036
是神经网络基函数向量,ε1,k是神经网络残差且存在
Figure BDA0002778558720000037
Figure BDA0002778558720000038
是正常数;
Figure BDA0002778558720000039
的估计值可写为
Figure BDA00027785587200000310
其中,
Figure BDA00027785587200000311
是神经网络最优权重向量估计值;
进而x1的导数可写为
Figure BDA00027785587200000312
其中,
Figure BDA00027785587200000313
D1,k(t)=ε1,k+d1,k(t)是复合干扰;
设计虚拟控制量
Figure BDA00027785587200000314
Figure BDA00027785587200000315
其中,β1,k是正的设计参数,
Figure BDA00027785587200000316
是D1,k的估计值;
引入如下的一阶滤波器,可得新的状态变量
Figure BDA00027785587200000317
Figure BDA00027785587200000318
其中,
Figure BDA00027785587200000319
α2是正的时间常数;
设计滤波器补偿信号z1
Figure BDA0002778558720000041
其中,z1(0)=0,z2可从后文得到
定义补偿跟踪误差v1
v1=e1-z1 (12)
构造预测误差z1NN
Figure BDA0002778558720000042
其中,
Figure BDA0002778558720000043
可由如下的平行估计模型得到
Figure BDA0002778558720000044
其中,
Figure BDA0002778558720000045
λ1,k是正的设计参数;
设计神经网络权重更新律为
Figure BDA0002778558720000046
其中,γ1,k,γz1,k和δ1,k是正的设计参数;
设计切换扰动观测器为
Figure BDA0002778558720000047
其中,ξ1是中间变量,L1,k是正的设计参数;
第i步,i=2,...,n-1:
定义输出跟踪误差
Figure BDA0002778558720000048
对于未知函数
Figure BDA0002778558720000049
用神经网络来逼近
Figure BDA00027785587200000410
其中,
Figure BDA00027785587200000411
是神经网络最优权重向量,
Figure BDA00027785587200000412
是神经网络基函数向量,εi,k是神经网络残差且存在
Figure BDA00027785587200000413
Figure BDA00027785587200000414
是正常数;
Figure BDA00027785587200000415
的估计值可写为
Figure BDA0002778558720000051
其中,
Figure BDA0002778558720000052
是神经网络最优权重向量估计值;
进而xi的导数可写为
Figure BDA0002778558720000053
其中,
Figure BDA0002778558720000054
Di,k(t)=εi,k+di,k(t)是复合干扰;
设计虚拟控制量
Figure BDA0002778558720000055
Figure BDA0002778558720000056
其中,βi,k是正的设计参数,
Figure BDA0002778558720000057
是Di,k的估计值;
引入如下的一阶滤波器,可得新的状态变量
Figure BDA0002778558720000058
Figure BDA0002778558720000059
其中,
Figure BDA00027785587200000510
αi+1是正的时间常数;
设计滤波器补偿信号zi
Figure BDA00027785587200000511
其中,zi(0)=0,zi+1可从后文得到;
定义补偿跟踪误差vi
vi=ei-zi (23)
构造预测误差ziNN
Figure BDA00027785587200000512
其中,
Figure BDA00027785587200000513
可由如下的平行估计模型得到
Figure BDA00027785587200000514
其中,
Figure BDA00027785587200000515
λi,k是正的设计参数;
设计神经网络权重更新律为
Figure BDA0002778558720000061
其中,γi,k,γzi,k和δi,k是正的设计参数;
设计切换扰动观测器为
Figure BDA0002778558720000062
其中,ξi是中间变量,Li,k是正的设计参数;
第n步:
定义输出跟踪误差
Figure BDA0002778558720000063
对于未知函数
Figure BDA0002778558720000064
Figure BDA0002778558720000065
用神经网络来逼近
Figure BDA0002778558720000066
Figure BDA0002778558720000067
其中,
Figure BDA0002778558720000068
Figure BDA0002778558720000069
是神经网络最优权重向量,
Figure BDA00027785587200000610
Figure BDA00027785587200000611
是神经网络基函数向量,εn,k和εG,k是神经网络残差且存在
Figure BDA00027785587200000612
Figure BDA00027785587200000613
Figure BDA00027785587200000614
Figure BDA00027785587200000615
是正常数;
Figure BDA00027785587200000616
Figure BDA00027785587200000617
的估计值可写为
Figure BDA00027785587200000618
Figure BDA00027785587200000619
其中,
Figure BDA00027785587200000620
Figure BDA00027785587200000621
是神经网络最优权重向量估计值;
定义Δuk=uv,k-uc,k,进而xn的导数可写为
Figure BDA00027785587200000622
其中,
Figure BDA00027785587200000623
是复合干扰,
Figure BDA00027785587200000624
设计控制器uc,k
Figure BDA0002778558720000071
其中,βn,k是正的设计参数,
Figure BDA0002778558720000072
是Dn,k的估计值;
设计滤波器补偿信号zn
Figure BDA0002778558720000073
其中,zn(0)=0;
定义补偿跟踪误差vn
vn=en-zn (35)
构造预测误差znNN
Figure BDA0002778558720000074
其中,
Figure BDA0002778558720000075
可由如下的平行估计模型得到
Figure BDA0002778558720000076
其中,
Figure BDA0002778558720000077
λn,k是正的设计参数;
设计神经网络权重更新律为
Figure BDA0002778558720000078
Figure BDA0002778558720000079
其中,γn,k,γG,k,γzn,k,δn,k和δG,k是正的设计参数;
设计切换扰动观测器为
Figure BDA00027785587200000710
其中,ξn是中间变量,Ln,k是正的设计参数;
步骤4:根据步骤3中(33)得到的控制量uc,k,返回到系统模型(1),对系统输出y进行跟踪控制。
有益效果
本发明提出的一种非线性严格反馈切换系统复合干扰学习控制方法,该方法考虑非线性切换系统存在不确定性、外界干扰和输入死区,采用神经网络估计系统不确定性,利用切换扰动观测器估计包含神经网络逼近误差、时变干扰和未知死区影响的复合干扰。进一步基于动态逆控制框架设计自适应神经网络切换控制器。为了提升不确定学习精度,结合智能学习和扰动观测设计了平行估计模型,基于平行估计模型构造了表征不确定学习性能的预测误差信号,该信号又被引入到神经网络权重更新律和切换扰动观测器中进行调节。该方法通过提升学习精度实现了非线性切换系统控制性能增强,便于工程实现。有益效果如下:
(1)将一阶滤波器引入到设计过程中,有效避免了反步法设计带来的复杂度爆炸问题,有利于工程实现;
(2)基于平行估计模型构造了预测误差,基于该误差设计神经网络权重更新律,提高不确定性学习精度,便于工程应用;
(3)设计非线性切换扰动观测器,对外界时变干扰和输入未知死区带来的不利影响进行了有效的估计补偿;
(4)神经网络和扰动观测器通过平行估计模型进行信息交互,实现对未知非线性函数和外界时变干扰的协同估计,有效提升控制性能。
附图说明
图1为本发明实施流程图。
具体实施方式
现结合实施例、附图对本发明作进一步描述:
参照图1,本发明非线性严格反馈切换系统复合干扰学习控制方法具体步骤如下:
步骤1:考虑变体飞行器纵向短周期动力学模型
Figure BDA0002778558720000091
其中,V是飞行速度,α是攻角,γ是航迹角,θ是俯仰角,q是俯仰角速率;L、T和My分别是升力、推力和俯仰力矩;ZT是动力位置;
Figure BDA0002778558720000092
Figure BDA0002778558720000093
分别是变体引起的惯性力和惯性力矩;m、g、Iy和Sx分别是飞行器质量、重力加速度、俯仰轴转动惯量和飞机静矩在x轴上的分量;
力和力矩定义为
Figure BDA0002778558720000094
其中,ρ表示空气密度,S表示气动参考面积,
Figure BDA0002778558720000095
表示平均气动弦长,Cx,x=L0,Lα,M0,Mα,Mδe,Mq表示气动参数;
气动参数的表达式为
Figure BDA0002778558720000096
其中,χ是变体飞行器的后掠角;
定义状态量x(t)=[x1,x2]T∈R2,其中x1=α,x2=q,以后掠角作为切换信号,可将变体飞行器模型转化为2阶单输入单输出非线性严格反馈切换系统
Figure BDA0002778558720000101
其中,
Figure BDA0002778558720000102
uσ(t)=δe∈R是系统输入,y∈R是系统输出;函数σ(t)∈{1,2}是切换信号;
Figure BDA0002778558720000103
Figure BDA0002778558720000104
Figure BDA0002778558720000105
是未知非线性函数;d1,1(t)=0.1cos(t),d2,1(t)=0.1cos(2t),d1,2(t)=0.1cos(t2),d2,2(t)=0.1sin(t)是引入的外部干扰;
步骤2:将系统输入非线性描述为
Figure BDA0002778558720000106
其中,uv,σ(t)∈R是带死区的输入,
Figure BDA0002778558720000107
bl,1=0.5,br,1=0.1,
Figure BDA0002778558720000108
bl,2=0.8,br,2=0.3;
可将(4)进一步描述为
Figure BDA0002778558720000109
其中
Figure BDA00027785587200001010
信号uσ(t)存在如下关系
Figure BDA00027785587200001011
其中
Figure BDA0002778558720000111
是uv,σ(t)的上界值;
则系统(3)可进一步写为
Figure BDA0002778558720000112
其中,
Figure BDA0002778558720000113
步骤3:针对非线性切换系统(7),基于动态逆控制框架设计复合干扰学习控制器;
第1步:
定义输出跟踪误差e1=x1-yd,其中yd是控制参考指令;
对于未知函数
Figure BDA0002778558720000114
用神经网络来逼近
Figure BDA0002778558720000115
其中,
Figure BDA0002778558720000116
是神经网络最优权重向量,
Figure BDA0002778558720000117
是神经网络基函数向量,ε1,k是神经网络残差且存在
Figure BDA0002778558720000118
Figure BDA0002778558720000119
是正常数;
Figure BDA00027785587200001110
的估计值可写为
Figure BDA00027785587200001111
其中,
Figure BDA00027785587200001112
是神经网络最优权重向量估计值;
进而x1的导数可写为
Figure BDA00027785587200001113
其中,
Figure BDA00027785587200001114
D1,k(t)=ε1,k+d1,k(t)是复合干扰;
设计虚拟控制量
Figure BDA00027785587200001115
Figure BDA00027785587200001116
其中,β1,k是正的设计参数,
Figure BDA00027785587200001117
是D1,k的估计值;
引入如下的一阶滤波器,可得新的状态变量
Figure BDA00027785587200001118
Figure BDA0002778558720000121
其中,
Figure BDA0002778558720000122
α2是正的时间常数;
设计滤波器补偿信号z1
Figure BDA0002778558720000123
其中,z1(0)=0,z2可从后文得到
定义补偿跟踪误差v1
v1=e1-z1 (14)
构造预测误差z1NN
Figure BDA0002778558720000124
其中,
Figure BDA0002778558720000125
可由如下的平行估计模型得到
Figure BDA0002778558720000126
其中,
Figure BDA0002778558720000127
λ1,k是正的设计参数;
设计神经网络权重更新律为
Figure BDA0002778558720000128
其中,γ1,k,γz1,k和δ1,k是正的设计参数;
设计切换扰动观测器为
Figure BDA0002778558720000129
其中,ξ1是中间变量,L1,k是正的设计参数;
第2步:
定义输出跟踪误差
Figure BDA00027785587200001210
对于未知函数
Figure BDA00027785587200001211
Figure BDA00027785587200001212
用神经网络来逼近
Figure BDA00027785587200001213
Figure BDA00027785587200001214
其中,
Figure BDA0002778558720000131
Figure BDA0002778558720000132
是神经网络最优权重向量,
Figure BDA0002778558720000133
Figure BDA0002778558720000134
是神经网络基函数向量,ε2,k和εG,k是神经网络残差且存在
Figure BDA0002778558720000135
Figure BDA0002778558720000136
Figure BDA0002778558720000137
Figure BDA0002778558720000138
是正常数;
Figure BDA0002778558720000139
Figure BDA00027785587200001310
的估计值可写为
Figure BDA00027785587200001311
Figure BDA00027785587200001312
其中,
Figure BDA00027785587200001313
Figure BDA00027785587200001314
是神经网络最优权重向量估计值;
定义Δuk=uv,k-uc,k,进而x2的导数可写为
Figure BDA00027785587200001315
其中,
Figure BDA00027785587200001316
是复合干扰,
Figure BDA00027785587200001317
设计控制器uc,k
Figure BDA00027785587200001318
其中,β2,k是正的设计参数,
Figure BDA00027785587200001319
是D2,k的估计值;
设计滤波器补偿信号z2
Figure BDA00027785587200001320
其中,z2(0)=0;
定义补偿跟踪误差v2
v2=e2-z2 (26)
构造预测误差z2NN
Figure BDA00027785587200001321
其中,
Figure BDA00027785587200001322
可由如下的平行估计模型得到
Figure BDA0002778558720000141
其中,
Figure BDA0002778558720000142
λ2,k是正的设计参数;
设计神经网络权重更新律为
Figure BDA0002778558720000143
Figure BDA0002778558720000144
其中,γ2,k,γG,k,γz2,k,δ2,k和δG,k是正的设计参数;
设计切换扰动观测器为
Figure BDA0002778558720000145
其中,ξ2是中间变量,L2,k是正的设计参数;
步骤4:根据步骤3中(24)得到的控制量uc,k,返回到变体飞行器模型(1),对攻角α进行跟踪控制。
本发明未详细说明部分属于领域技术人员公知常识。

Claims (1)

1.一种非线性严格反馈切换系统复合干扰学习控制方法,其特征在于步骤如下:
步骤1:考虑一类单输入单输出非线性严格反馈切换系统
Figure FDA0002778558710000011
其中,x(t)=[x1,...,xn]T∈Rn是系统状态向量,
Figure FDA0002778558710000012
uσ(t)∈R是系统输入,y∈R是系统输出;函数σ(t):[0,∞)→M={1,2,…,m}是切换信号,且σ(t)=k时表示第k个子系统是激活的;
Figure FDA0002778558710000013
Figure FDA0002778558710000014
是关于
Figure FDA0002778558710000015
的未知平滑函数;di,σ(t)(t),i=1,2,…,n是外部未知干扰;
步骤2:将系统输入非线性描述为
Figure FDA0002778558710000016
其中,uv,σ(t)∈R是带死区的输入,
Figure FDA0002778558710000017
br,σ(t)和bl,σ(t)是未知的正常数;
可将(2)进一步描述为
Figure FDA0002778558710000018
其中
Figure FDA0002778558710000019
信号uσ(t)存在如下关系
Figure FDA00027785587100000110
其中
Figure FDA00027785587100000111
是uv,σ(t)的上界值;
则系统(1)可进一步写为
Figure FDA0002778558710000021
其中,
Figure FDA0002778558710000022
步骤3:针对非线性切换系统(5),基于动态逆控制框架设计复合干扰学习控制器;
第1步:
定义输出跟踪误差e1=x1-yd,其中yd是控制参考指令;
对于未知函数
Figure FDA0002778558710000023
用神经网络来逼近
Figure FDA0002778558710000024
其中,
Figure FDA0002778558710000025
是神经网络最优权重向量,
Figure FDA0002778558710000026
是神经网络基函数向量,ε1,k是神经网络残差且存在
Figure FDA0002778558710000027
Figure FDA0002778558710000028
是正常数;
Figure FDA0002778558710000029
的估计值可写为
Figure FDA00027785587100000210
其中,
Figure FDA00027785587100000211
是神经网络最优权重向量估计值;
进而x1的导数可写为
Figure FDA00027785587100000212
其中,
Figure FDA00027785587100000213
D1,k(t)=ε1,k+d1,k(t)是复合干扰;
设计虚拟控制量
Figure FDA00027785587100000214
Figure FDA00027785587100000215
其中,β1,k是正的设计参数,
Figure FDA00027785587100000216
是D1,k的估计值;
引入如下的一阶滤波器,可得新的状态变量
Figure FDA00027785587100000217
Figure FDA00027785587100000218
其中,
Figure FDA0002778558710000031
α2是正的时间常数;
设计滤波器补偿信号z1
Figure FDA0002778558710000032
其中,z1(0)=0,z2可从后文得到
定义补偿跟踪误差v1
v1=e1-z1 (12)
构造预测误差z1NN
Figure FDA0002778558710000033
其中,
Figure FDA0002778558710000034
可由如下的平行估计模型得到
Figure FDA0002778558710000035
其中,
Figure FDA0002778558710000036
λ1,k是正的设计参数;
设计神经网络权重更新律为
Figure FDA0002778558710000037
其中,γ1,k,γz1,k和δ1,k是正的设计参数;
设计切换扰动观测器为
Figure FDA0002778558710000038
其中,ξ1是中间变量,L1,k是正的设计参数;
第i步,i=2,...,n-1:
定义输出跟踪误差
Figure FDA0002778558710000039
对于未知函数
Figure FDA00027785587100000310
用神经网络来逼近
Figure FDA00027785587100000311
其中,
Figure FDA00027785587100000312
是神经网络最优权重向量,
Figure FDA00027785587100000313
是神经网络基函数向量,εi,k是神经网络残差且存在
Figure FDA0002778558710000041
Figure FDA0002778558710000042
是正常数;
Figure FDA0002778558710000043
的估计值可写为
Figure FDA0002778558710000044
其中,
Figure FDA0002778558710000045
是神经网络最优权重向量估计值;
进而xi的导数可写为
Figure FDA0002778558710000046
其中,
Figure FDA0002778558710000047
Di,k(t)=εi,k+di,k(t)是复合干扰;
设计虚拟控制量
Figure FDA0002778558710000048
Figure FDA0002778558710000049
其中,βi,k是正的设计参数,
Figure FDA00027785587100000410
是Di,k的估计值;
引入如下的一阶滤波器,可得新的状态变量
Figure FDA00027785587100000411
Figure FDA00027785587100000412
其中,
Figure FDA00027785587100000413
αi+1是正的时间常数;
设计滤波器补偿信号zi
Figure FDA00027785587100000414
其中,zi(0)=0,zi+1可从后文得到;
定义补偿跟踪误差vi
vi=ei-zi (23)
构造预测误差ziNN
Figure FDA00027785587100000415
其中,
Figure FDA00027785587100000416
可由如下的平行估计模型得到
Figure FDA00027785587100000417
其中,
Figure FDA00027785587100000418
λi,k是正的设计参数;
设计神经网络权重更新律为
Figure FDA0002778558710000051
其中,γi,k,γzi,k和δi,k是正的设计参数;
设计切换扰动观测器为
Figure FDA0002778558710000052
其中,ξi是中间变量,Li,k是正的设计参数;
第n步:
定义输出跟踪误差
Figure FDA0002778558710000053
对于未知函数
Figure FDA0002778558710000054
Figure FDA0002778558710000055
用神经网络来逼近
Figure FDA0002778558710000056
Figure FDA0002778558710000057
其中,
Figure FDA0002778558710000058
Figure FDA0002778558710000059
是神经网络最优权重向量,
Figure FDA00027785587100000510
Figure FDA00027785587100000511
是神经网络基函数向量,εn,k和εG,k是神经网络残差且存在
Figure FDA00027785587100000512
Figure FDA00027785587100000513
Figure FDA00027785587100000514
Figure FDA00027785587100000515
是正常数;
Figure FDA00027785587100000516
Figure FDA00027785587100000517
的估计值可写为
Figure FDA00027785587100000518
Figure FDA00027785587100000519
其中,
Figure FDA00027785587100000520
Figure FDA00027785587100000521
是神经网络最优权重向量估计值;
定义Δuk=uv,k-uc,k,进而xn的导数可写为
Figure FDA00027785587100000522
其中,
Figure FDA00027785587100000523
是复合干扰,
Figure FDA0002778558710000061
设计控制器uc,k
Figure FDA0002778558710000062
其中,βn,k是正的设计参数,
Figure FDA0002778558710000063
是Dn,k的估计值;
设计滤波器补偿信号zn
Figure FDA0002778558710000064
其中,zn(0)=0;
定义补偿跟踪误差vn
vn=en-zn (35)
构造预测误差znNN
Figure FDA0002778558710000065
其中,
Figure FDA0002778558710000066
可由如下的平行估计模型得到
Figure FDA0002778558710000067
其中,
Figure FDA0002778558710000068
λn,k是正的设计参数;
设计神经网络权重更新律为
Figure FDA0002778558710000069
Figure FDA00027785587100000610
其中,γn,k,γG,k,γzn,k,δn,k和δG,k是正的设计参数;
设计切换扰动观测器为
Figure FDA00027785587100000611
其中,ξn是中间变量,Ln,k是正的设计参数;
步骤4:根据步骤3中(33)得到的控制量uc,k,返回到系统模型(1),对系统输出y进行跟踪控制。
CN202011273968.3A 2020-11-14 2020-11-14 非线性严格反馈切换系统复合干扰学习控制方法 Active CN112379595B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011273968.3A CN112379595B (zh) 2020-11-14 2020-11-14 非线性严格反馈切换系统复合干扰学习控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011273968.3A CN112379595B (zh) 2020-11-14 2020-11-14 非线性严格反馈切换系统复合干扰学习控制方法

Publications (2)

Publication Number Publication Date
CN112379595A CN112379595A (zh) 2021-02-19
CN112379595B true CN112379595B (zh) 2022-06-21

Family

ID=74582516

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011273968.3A Active CN112379595B (zh) 2020-11-14 2020-11-14 非线性严格反馈切换系统复合干扰学习控制方法

Country Status (1)

Country Link
CN (1) CN112379595B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112947089B (zh) * 2021-03-18 2023-04-07 西安电子科技大学 一种预设跟踪精度的自适应神经网络跟踪控制方法
CN113031449B (zh) * 2021-03-29 2022-08-09 西北工业大学 面向气动未知的宽域飞行智能反步切换控制方法
CN113093539B (zh) * 2021-03-29 2022-08-09 西北工业大学 基于多模态划分的宽域飞行鲁棒自适应切换控制方法
CN114609975B (zh) * 2022-03-25 2024-04-30 江南大学 一种基于复合自抗扰控制的fts控制方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108828957A (zh) * 2018-08-20 2018-11-16 西北工业大学 基于切换机制的飞行器全局有限时间神经网络控制方法
CN108897227A (zh) * 2018-08-20 2018-11-27 西北工业大学 非线性严格反馈系统全局有限时间神经网络控制方法
CN109062049A (zh) * 2018-08-20 2018-12-21 西北工业大学 基于集总复合估计的严格反馈系统神经网络控制方法
CN109581873A (zh) * 2018-12-26 2019-04-05 河海大学 未知执行器死区切换系统的有限时间指定性能控制算法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108828957A (zh) * 2018-08-20 2018-11-16 西北工业大学 基于切换机制的飞行器全局有限时间神经网络控制方法
CN108897227A (zh) * 2018-08-20 2018-11-27 西北工业大学 非线性严格反馈系统全局有限时间神经网络控制方法
CN109062049A (zh) * 2018-08-20 2018-12-21 西北工业大学 基于集总复合估计的严格反馈系统神经网络控制方法
CN109581873A (zh) * 2018-12-26 2019-04-05 河海大学 未知执行器死区切换系统的有限时间指定性能控制算法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
HOSM observer based robust adaptive hypersonic flight control using composite learning;Yixin Cheng 等;《Neurocomputing》;20180315;第295卷;第98-107页 *
Neural Learning Control of Strict-Feedback Systems Using Disturbance Observer;Bin Xu 等;《 IEEE Transactions on Neural Networks and Learning Systems》;20180924;第30卷(第5期);第1296-1307页 *

Also Published As

Publication number Publication date
CN112379595A (zh) 2021-02-19

Similar Documents

Publication Publication Date Title
CN112379595B (zh) 非线性严格反馈切换系统复合干扰学习控制方法
CN112327627B (zh) 基于复合学习的非线性切换系统自适应滑模控制方法
CN114995132B (zh) 一种基于高斯混合过程的多臂航天器模型预测控制方法、设备和介质
Guo et al. Finite-time deterministic learning command filtered control for hypersonic flight vehicle
CN102411305A (zh) 单旋翼直升机/涡轴发动机综合抗扰控制系统设计方法
CN113211446B (zh) 一种事件触发-神经动态规划的机械臂分散跟踪控制方法
CN108663940A (zh) 基于集总复合估计的飞行器神经网络学习控制方法
CN113377121B (zh) 一种基于深度强化学习的飞行器智能抗扰动控制方法
CN102880052A (zh) 基于时标功能分解的高超声速飞行器执行器饱和控制方法
CN113093538A (zh) 一种模块化机器人系统的非零和博弈神经-最优控制方法
CN110320794A (zh) 基于干扰观测的弹性飞行器奇异摄动复合学习控制方法
Yuan et al. Automatic carrier landing control with external disturbance and input constraint
Yuan et al. Adaptive fault-tolerant controller for morphing aircraft based on the L2 gain and a neural network
CN113283090B (zh) 基于蜂群算法的飞机舵机电动伺服系统摩擦补偿方法
CN114237268A (zh) 一种基于深度强化学习的无人机强鲁棒姿态控制方法
CN110376887B (zh) 基于时变滑模增益的飞行器离散滑模智能控制方法
CN115981149B (zh) 基于安全强化学习的高超声速飞行器最优控制方法
Li et al. Prioritized experience replay based reinforcement learning for adaptive tracking control of autonomous underwater vehicle
CN114578696B (zh) 2-dof直升机系统自适应神经网络量化容错控制方法
Kamalasadan A new generation of adaptive control: An intelligent supervisory loop approach
Su et al. Adaptive UAV maneuvering control system based on dynamic inversion and long-short-term memory network
Suprapto et al. A comparison of back propagation neural network and elman recurrent neural network algorithms on altitude control of heavy-lift hexacopter based on direct inverse control
Mahmoudabadi et al. Adaptive Super Twisting Sliding Mode Control for Coaxial Octorotor UAVs
Sun et al. Robust chattering-free control for flexible air-breathing hypersonic vehicles in the presence of disturbances and measurement noises
Brahim et al. Anti-saturation finite time adaptive altitude quadrotor control under unknown disturbances

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant