CN112379595B - 非线性严格反馈切换系统复合干扰学习控制方法 - Google Patents
非线性严格反馈切换系统复合干扰学习控制方法 Download PDFInfo
- Publication number
- CN112379595B CN112379595B CN202011273968.3A CN202011273968A CN112379595B CN 112379595 B CN112379595 B CN 112379595B CN 202011273968 A CN202011273968 A CN 202011273968A CN 112379595 B CN112379595 B CN 112379595B
- Authority
- CN
- China
- Prior art keywords
- neural network
- nonlinear
- design parameter
- switching
- positive
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 17
- 238000013528 artificial neural network Methods 0.000 claims abstract description 57
- 239000002131 composite material Substances 0.000 claims abstract description 17
- 230000006870 function Effects 0.000 claims abstract description 17
- 238000010276 construction Methods 0.000 claims description 7
- 150000001875 compounds Chemical class 0.000 claims description 4
- 238000009499 grossing Methods 0.000 claims description 2
- 229910052718 tin Inorganic materials 0.000 claims description 2
- 230000003044 adaptive effect Effects 0.000 abstract description 2
- 230000009466 transformation Effects 0.000 abstract 1
- 230000000694 effects Effects 0.000 description 3
- 230000007786 learning performance Effects 0.000 description 3
- 230000003993 interaction Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- JAQUADIPBIOFCE-UHFFFAOYSA-N 1,N(2)-ethenoguanine Chemical compound N1C2=NC=CN2C(=O)C2=C1N=CN2 JAQUADIPBIOFCE-UHFFFAOYSA-N 0.000 description 1
- RZVHIXYEVGDQDX-UHFFFAOYSA-N 9,10-anthraquinone Chemical compound C1=CC=C2C(=O)C3=CC=CC=C3C(=O)C2=C1 RZVHIXYEVGDQDX-UHFFFAOYSA-N 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000003889 chemical engineering Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000012938 design process Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/0265—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
- G05B13/027—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion using neural networks only
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/04—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
- G05B13/042—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
Landscapes
- Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Feedback Control In General (AREA)
Abstract
本发明涉及一种非线性严格反馈切换系统复合干扰学习控制方法,用于解决现有非线性切换系统控制方法实用性差的技术问题。技术方案是考虑非线性严格反馈切换系统存在外界干扰和输入死区,对系统进行模型变换;使用神经网络逼近系统未知非线性函数,设计切换扰动观测器估计复合干扰;基于动态逆控制框架设计自适应神经网络切换控制器;通过设计平行估计模型构造了预测误差,并将预测误差引入到神经网络权重自适应更新律和切换扰动观测器设计中,提升了不确定学习精度;本发明结合非线性切换系统控制特点,通过设计复合干扰学习控制器有效提升了控制性能,适用于工程应用。
Description
技术领域
本发明涉及一种非线性切换系统控制方法,特别是涉及一种非线性严格反馈切换系统复合干扰学习控制方法,属于飞行控制领域。
背景技术
在实际工程中,许多控制对象如变体飞行器、变频电机以及机器人等都可以用非线性切换系统来描述,因此非线性切换系统控制技术引起了广泛关注,在汽车、电力、化工等许多行业都得到了研究与应用。
非线性切换系统自身具有较强的不确定性,同时易受到外部干扰和输入死区的影响,现有的控制方法多采用神经网络或模糊逻辑等智能系统逼近不确定性,采用扰动观测器估计外部干扰。这些控制方法只考虑了智能系统的逼近作用,忽视了智能学习策略的本质,没有对不确定性学习性能进行有效评价,且智能逼近系统和扰动观测器之间没有信息交互,鲁棒性性较差,不利于工程实现。因此研究面向学习性能提升的先进控制方法对于非线性切换系统控制研究意义重大且有着迫切需求。
发明内容
要解决的技术问题
为了克服现有非线性切换系统控制方法实用性差的不足,本发明提供一种非线性严格反馈切换系统复合干扰学习控制方法。
技术方案
一种非线性严格反馈切换系统复合干扰学习控制方法,其特征在于以下步骤:
步骤1:考虑一类单输入单输出非线性严格反馈切换系统
其中,x(t)=[x1,...,xn]T∈Rn是系统状态向量,uσ(t)∈R是系统输入,y∈R是系统输出;函数σ(t):[0,∞)→M={1,2,…,m}是切换信号,且σ(t)=k时表示第k个子系统是激活的;和是关于的未知平滑函数;di,σ(t)(t),i=1,2,…,n是外部未知干扰;
步骤2:将系统输入非线性描述为
可将(2)进一步描述为
其中
信号uσ(t)存在如下关系
则系统(1)可进一步写为
步骤3:针对非线性切换系统(5),基于动态逆控制框架设计复合干扰学习控制器;
第1步:
定义输出跟踪误差e1=x1-yd,其中yd是控制参考指令;
进而x1的导数可写为
设计滤波器补偿信号z1为
其中,z1(0)=0,z2可从后文得到
定义补偿跟踪误差v1为
v1=e1-z1 (12)
构造预测误差z1NN为
设计神经网络权重更新律为
其中,γ1,k,γz1,k和δ1,k是正的设计参数;
设计切换扰动观测器为
其中,ξ1是中间变量,L1,k是正的设计参数;
第i步,i=2,...,n-1:
进而xi的导数可写为
设计滤波器补偿信号zi为
其中,zi(0)=0,zi+1可从后文得到;
定义补偿跟踪误差vi为
vi=ei-zi (23)
构造预测误差ziNN为
设计神经网络权重更新律为
其中,γi,k,γzi,k和δi,k是正的设计参数;
设计切换扰动观测器为
其中,ξi是中间变量,Li,k是正的设计参数;
第n步:
定义Δuk=uv,k-uc,k,进而xn的导数可写为
设计控制器uc,k为
设计滤波器补偿信号zn为
其中,zn(0)=0;
定义补偿跟踪误差vn为
vn=en-zn (35)
构造预测误差znNN为
设计神经网络权重更新律为
其中,γn,k,γG,k,γzn,k,δn,k和δG,k是正的设计参数;
设计切换扰动观测器为
其中,ξn是中间变量,Ln,k是正的设计参数;
步骤4:根据步骤3中(33)得到的控制量uc,k,返回到系统模型(1),对系统输出y进行跟踪控制。
有益效果
本发明提出的一种非线性严格反馈切换系统复合干扰学习控制方法,该方法考虑非线性切换系统存在不确定性、外界干扰和输入死区,采用神经网络估计系统不确定性,利用切换扰动观测器估计包含神经网络逼近误差、时变干扰和未知死区影响的复合干扰。进一步基于动态逆控制框架设计自适应神经网络切换控制器。为了提升不确定学习精度,结合智能学习和扰动观测设计了平行估计模型,基于平行估计模型构造了表征不确定学习性能的预测误差信号,该信号又被引入到神经网络权重更新律和切换扰动观测器中进行调节。该方法通过提升学习精度实现了非线性切换系统控制性能增强,便于工程实现。有益效果如下:
(1)将一阶滤波器引入到设计过程中,有效避免了反步法设计带来的复杂度爆炸问题,有利于工程实现;
(2)基于平行估计模型构造了预测误差,基于该误差设计神经网络权重更新律,提高不确定性学习精度,便于工程应用;
(3)设计非线性切换扰动观测器,对外界时变干扰和输入未知死区带来的不利影响进行了有效的估计补偿;
(4)神经网络和扰动观测器通过平行估计模型进行信息交互,实现对未知非线性函数和外界时变干扰的协同估计,有效提升控制性能。
附图说明
图1为本发明实施流程图。
具体实施方式
现结合实施例、附图对本发明作进一步描述:
参照图1,本发明非线性严格反馈切换系统复合干扰学习控制方法具体步骤如下:
步骤1:考虑变体飞行器纵向短周期动力学模型
其中,V是飞行速度,α是攻角,γ是航迹角,θ是俯仰角,q是俯仰角速率;L、T和My分别是升力、推力和俯仰力矩;ZT是动力位置;和分别是变体引起的惯性力和惯性力矩;m、g、Iy和Sx分别是飞行器质量、重力加速度、俯仰轴转动惯量和飞机静矩在x轴上的分量;
力和力矩定义为
气动参数的表达式为
其中,χ是变体飞行器的后掠角;
定义状态量x(t)=[x1,x2]T∈R2,其中x1=α,x2=q,以后掠角作为切换信号,可将变体飞行器模型转化为2阶单输入单输出非线性严格反馈切换系统
其中,uσ(t)=δe∈R是系统输入,y∈R是系统输出;函数σ(t)∈{1,2}是切换信号; 是未知非线性函数;d1,1(t)=0.1cos(t),d2,1(t)=0.1cos(2t),d1,2(t)=0.1cos(t2),d2,2(t)=0.1sin(t)是引入的外部干扰;
步骤2:将系统输入非线性描述为
可将(4)进一步描述为
其中
信号uσ(t)存在如下关系
则系统(3)可进一步写为
步骤3:针对非线性切换系统(7),基于动态逆控制框架设计复合干扰学习控制器;
第1步:
定义输出跟踪误差e1=x1-yd,其中yd是控制参考指令;
进而x1的导数可写为
设计滤波器补偿信号z1为
其中,z1(0)=0,z2可从后文得到
定义补偿跟踪误差v1为
v1=e1-z1 (14)
构造预测误差z1NN为
设计神经网络权重更新律为
其中,γ1,k,γz1,k和δ1,k是正的设计参数;
设计切换扰动观测器为
其中,ξ1是中间变量,L1,k是正的设计参数;
第2步:
定义Δuk=uv,k-uc,k,进而x2的导数可写为
设计控制器uc,k为
设计滤波器补偿信号z2为
其中,z2(0)=0;
定义补偿跟踪误差v2为
v2=e2-z2 (26)
构造预测误差z2NN为
设计神经网络权重更新律为
其中,γ2,k,γG,k,γz2,k,δ2,k和δG,k是正的设计参数;
设计切换扰动观测器为
其中,ξ2是中间变量,L2,k是正的设计参数;
步骤4:根据步骤3中(24)得到的控制量uc,k,返回到变体飞行器模型(1),对攻角α进行跟踪控制。
本发明未详细说明部分属于领域技术人员公知常识。
Claims (1)
1.一种非线性严格反馈切换系统复合干扰学习控制方法,其特征在于步骤如下:
步骤1:考虑一类单输入单输出非线性严格反馈切换系统
其中,x(t)=[x1,...,xn]T∈Rn是系统状态向量,uσ(t)∈R是系统输入,y∈R是系统输出;函数σ(t):[0,∞)→M={1,2,…,m}是切换信号,且σ(t)=k时表示第k个子系统是激活的;和是关于的未知平滑函数;di,σ(t)(t),i=1,2,…,n是外部未知干扰;
步骤2:将系统输入非线性描述为
可将(2)进一步描述为
其中
信号uσ(t)存在如下关系
则系统(1)可进一步写为
步骤3:针对非线性切换系统(5),基于动态逆控制框架设计复合干扰学习控制器;
第1步:
定义输出跟踪误差e1=x1-yd,其中yd是控制参考指令;
进而x1的导数可写为
设计滤波器补偿信号z1为
其中,z1(0)=0,z2可从后文得到
定义补偿跟踪误差v1为
v1=e1-z1 (12)
构造预测误差z1NN为
设计神经网络权重更新律为
其中,γ1,k,γz1,k和δ1,k是正的设计参数;
设计切换扰动观测器为
其中,ξ1是中间变量,L1,k是正的设计参数;
第i步,i=2,...,n-1:
进而xi的导数可写为
设计滤波器补偿信号zi为
其中,zi(0)=0,zi+1可从后文得到;
定义补偿跟踪误差vi为
vi=ei-zi (23)
构造预测误差ziNN为
设计神经网络权重更新律为
其中,γi,k,γzi,k和δi,k是正的设计参数;
设计切换扰动观测器为
其中,ξi是中间变量,Li,k是正的设计参数;
第n步:
定义Δuk=uv,k-uc,k,进而xn的导数可写为
设计控制器uc,k为
设计滤波器补偿信号zn为
其中,zn(0)=0;
定义补偿跟踪误差vn为
vn=en-zn (35)
构造预测误差znNN为
设计神经网络权重更新律为
其中,γn,k,γG,k,γzn,k,δn,k和δG,k是正的设计参数;
设计切换扰动观测器为
其中,ξn是中间变量,Ln,k是正的设计参数;
步骤4:根据步骤3中(33)得到的控制量uc,k,返回到系统模型(1),对系统输出y进行跟踪控制。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011273968.3A CN112379595B (zh) | 2020-11-14 | 2020-11-14 | 非线性严格反馈切换系统复合干扰学习控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011273968.3A CN112379595B (zh) | 2020-11-14 | 2020-11-14 | 非线性严格反馈切换系统复合干扰学习控制方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112379595A CN112379595A (zh) | 2021-02-19 |
CN112379595B true CN112379595B (zh) | 2022-06-21 |
Family
ID=74582516
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011273968.3A Active CN112379595B (zh) | 2020-11-14 | 2020-11-14 | 非线性严格反馈切换系统复合干扰学习控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112379595B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112947089B (zh) * | 2021-03-18 | 2023-04-07 | 西安电子科技大学 | 一种预设跟踪精度的自适应神经网络跟踪控制方法 |
CN113031449B (zh) * | 2021-03-29 | 2022-08-09 | 西北工业大学 | 面向气动未知的宽域飞行智能反步切换控制方法 |
CN113093539B (zh) * | 2021-03-29 | 2022-08-09 | 西北工业大学 | 基于多模态划分的宽域飞行鲁棒自适应切换控制方法 |
CN114609975B (zh) * | 2022-03-25 | 2024-04-30 | 江南大学 | 一种基于复合自抗扰控制的fts控制方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108828957A (zh) * | 2018-08-20 | 2018-11-16 | 西北工业大学 | 基于切换机制的飞行器全局有限时间神经网络控制方法 |
CN108897227A (zh) * | 2018-08-20 | 2018-11-27 | 西北工业大学 | 非线性严格反馈系统全局有限时间神经网络控制方法 |
CN109062049A (zh) * | 2018-08-20 | 2018-12-21 | 西北工业大学 | 基于集总复合估计的严格反馈系统神经网络控制方法 |
CN109581873A (zh) * | 2018-12-26 | 2019-04-05 | 河海大学 | 未知执行器死区切换系统的有限时间指定性能控制算法 |
-
2020
- 2020-11-14 CN CN202011273968.3A patent/CN112379595B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108828957A (zh) * | 2018-08-20 | 2018-11-16 | 西北工业大学 | 基于切换机制的飞行器全局有限时间神经网络控制方法 |
CN108897227A (zh) * | 2018-08-20 | 2018-11-27 | 西北工业大学 | 非线性严格反馈系统全局有限时间神经网络控制方法 |
CN109062049A (zh) * | 2018-08-20 | 2018-12-21 | 西北工业大学 | 基于集总复合估计的严格反馈系统神经网络控制方法 |
CN109581873A (zh) * | 2018-12-26 | 2019-04-05 | 河海大学 | 未知执行器死区切换系统的有限时间指定性能控制算法 |
Non-Patent Citations (2)
Title |
---|
HOSM observer based robust adaptive hypersonic flight control using composite learning;Yixin Cheng 等;《Neurocomputing》;20180315;第295卷;第98-107页 * |
Neural Learning Control of Strict-Feedback Systems Using Disturbance Observer;Bin Xu 等;《 IEEE Transactions on Neural Networks and Learning Systems》;20180924;第30卷(第5期);第1296-1307页 * |
Also Published As
Publication number | Publication date |
---|---|
CN112379595A (zh) | 2021-02-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112379595B (zh) | 非线性严格反馈切换系统复合干扰学习控制方法 | |
CN112327627B (zh) | 基于复合学习的非线性切换系统自适应滑模控制方法 | |
CN114995132B (zh) | 一种基于高斯混合过程的多臂航天器模型预测控制方法、设备和介质 | |
Guo et al. | Finite-time deterministic learning command filtered control for hypersonic flight vehicle | |
CN102411305A (zh) | 单旋翼直升机/涡轴发动机综合抗扰控制系统设计方法 | |
CN113211446B (zh) | 一种事件触发-神经动态规划的机械臂分散跟踪控制方法 | |
CN108663940A (zh) | 基于集总复合估计的飞行器神经网络学习控制方法 | |
CN113377121B (zh) | 一种基于深度强化学习的飞行器智能抗扰动控制方法 | |
CN102880052A (zh) | 基于时标功能分解的高超声速飞行器执行器饱和控制方法 | |
CN113093538A (zh) | 一种模块化机器人系统的非零和博弈神经-最优控制方法 | |
CN110320794A (zh) | 基于干扰观测的弹性飞行器奇异摄动复合学习控制方法 | |
Yuan et al. | Automatic carrier landing control with external disturbance and input constraint | |
Yuan et al. | Adaptive fault-tolerant controller for morphing aircraft based on the L2 gain and a neural network | |
CN113283090B (zh) | 基于蜂群算法的飞机舵机电动伺服系统摩擦补偿方法 | |
CN114237268A (zh) | 一种基于深度强化学习的无人机强鲁棒姿态控制方法 | |
CN110376887B (zh) | 基于时变滑模增益的飞行器离散滑模智能控制方法 | |
CN115981149B (zh) | 基于安全强化学习的高超声速飞行器最优控制方法 | |
Li et al. | Prioritized experience replay based reinforcement learning for adaptive tracking control of autonomous underwater vehicle | |
CN114578696B (zh) | 2-dof直升机系统自适应神经网络量化容错控制方法 | |
Kamalasadan | A new generation of adaptive control: An intelligent supervisory loop approach | |
Su et al. | Adaptive UAV maneuvering control system based on dynamic inversion and long-short-term memory network | |
Suprapto et al. | A comparison of back propagation neural network and elman recurrent neural network algorithms on altitude control of heavy-lift hexacopter based on direct inverse control | |
Mahmoudabadi et al. | Adaptive Super Twisting Sliding Mode Control for Coaxial Octorotor UAVs | |
Sun et al. | Robust chattering-free control for flexible air-breathing hypersonic vehicles in the presence of disturbances and measurement noises | |
Brahim et al. | Anti-saturation finite time adaptive altitude quadrotor control under unknown disturbances |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |