CN114815618B - 一种基于动态增益的自适应神经网络跟踪控制方法 - Google Patents

一种基于动态增益的自适应神经网络跟踪控制方法 Download PDF

Info

Publication number
CN114815618B
CN114815618B CN202210467223.3A CN202210467223A CN114815618B CN 114815618 B CN114815618 B CN 114815618B CN 202210467223 A CN202210467223 A CN 202210467223A CN 114815618 B CN114815618 B CN 114815618B
Authority
CN
China
Prior art keywords
neural network
function
derivative
control
nonlinear
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210467223.3A
Other languages
English (en)
Other versions
CN114815618A (zh
Inventor
于兴虎
郑晓龙
杨佳兴
杨学博
李湛
高会军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Institute of Technology
Original Assignee
Harbin Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Institute of Technology filed Critical Harbin Institute of Technology
Priority to CN202210467223.3A priority Critical patent/CN114815618B/zh
Publication of CN114815618A publication Critical patent/CN114815618A/zh
Application granted granted Critical
Publication of CN114815618B publication Critical patent/CN114815618B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)

Abstract

一种基于动态增益的自适应神经网络跟踪控制方法,本发明涉及基于动态增益的自适应神经网络跟踪控制方法。本发明是为了解决目前自适应神经网络控制的反馈增益参数以未知函数的上界设计,使得系统的控制器设计不灵活,导致设计的控制器能量消耗过大的问题。过程为:一、建立具有未知非线性控制方向函数的不确定非线性严格反馈系统的二维状态空间模型,使系统输出跟踪目标信号;二、建立具有扩展状态变量的三维非线性系统状态空间模型;三、设计李雅普诺夫函数;四、利用李雅普诺夫函数对时间求一阶导数;五、改写李雅普诺夫函数的一阶导数;六、设计神经网络权值更新律、虚拟控制函数及控制输入。本发明用于非线性控制技术领域。

Description

一种基于动态增益的自适应神经网络跟踪控制方法
技术领域
本发明属于非线性控制技术领域,具体涉及一种基于动态增益的自适应神经网络跟踪控制。
背景技术
在工程实践中有许多非线性系统的跟踪控制问题,如机械臂轨迹跟踪控制、航天器姿态跟踪控制、电机伺服控制等,实际上不可能获得与真实系统相对应的准确数学模型。在进行非线性系统跟踪控制设计时必须要考虑非线性系统的不确定性,一种常用的控制方法是自适应神经网络跟踪控制,该方法是基于反步控制思想设计控制器,结合神经网络逼近系统中的未知项函数和虚拟控制函数的导数,克服了反步控制法设计过程中虚拟控制函数求导带来的计算爆炸问题,极大降低了不确定非线性系统控制器的设计难度。自适应神经网络跟踪控制技术可以参考中国发明专利CN114019804A、中国发明专利CN112192573A及中国发明专利CN107577146B。在处理具有未知控制方向函数的不确定非线性系统控制问题时,传统的自适应神经网络控制方法只能以未知控制方向函数的上界设计反馈增益,不等式的过度放大,得到的结果很大程度具有保守性。由于反馈增益参数是一个固定值,使得系统的控制器设计不灵活,导致设计的控制器能量消耗过大。
发明内容
本发明是为了解决目前自适应神经网络控制的反馈增益参数以未知函数的上界设计,使得系统的控制器设计不灵活,导致设计的控制器能量消耗过大的问题,提出了一种基于动态增益的自适应神经网络跟踪控制方法。
本方法为了解决上述技术问题采取的技术方案是:一种基于动态增益的自适应神经网络跟踪控制方法,该方法包括以下步骤:
步骤一、根据系统的状态变量x1和x2,输出信号y和控制信号u,建立具有未知非线性控制方向函数的不确定非线性严格反馈系统的二维状态空间模型,使系统输出y(t)跟踪目标信号yd(t);
步骤二、定义扩展状态变量x3=u,建立具有扩展状态变量的三维非线性系统状态空间模型,定义误差变量z1,z2,z3
步骤三、利用步骤二中的误差变量z1,z2,z3设计李雅普诺夫函数V;
步骤四、利用步骤三中的李雅普诺夫函数V对时间求一阶导数得到
Figure BDA0003624837040000011
步骤五、引入等价控制方向函数,定义需要依靠神经网络逼近的未知项F1和F2,改写步骤四中李雅普诺夫函数的一阶导数
Figure BDA0003624837040000021
步骤六、引入动态增益,根据步骤五中李雅普诺夫函数的一阶导数
Figure BDA0003624837040000022
利用反步法和自适应神经网络,设计神经网络权值更新律、虚拟控制函数α1和α2及控制输入u。
本发明的有益效果:
引入动态增益,让控制器的设计更灵活,降低控制器u的能量消耗;引入等价控制增益,使自适应神经网络控制的反馈增益不再需要根据未知控制方向函数的上界设计,避免了控制器过于保守的问题;实现设计反馈控制器u(t),使系统输出y(t)能够在小误差范围内跟踪给定目标信号yd(t)。
附图说明
图1为本发明系统(公式1)输出曲线图;
图2为本发明系统(公式1)跟踪误差曲线图;
图3为本发明神经网络逼近F1曲线图;
图4为本发明神经网络逼近F2曲线图;
图5为本发明动态增益曲线图;
图6为本发明控制信号u曲线图。
具体实施方式
具体实施方式一:本实施方式一种基于动态增益的自适应神经网络跟踪控制方法具体过程为:
步骤一、根据实际非线性控制系统(如机械臂轨迹跟踪控制、航天器姿态跟踪控制、电机伺服控制等)的状态变量x1和x2,输出信号y和控制信号u,建立具有未知非线性控制方向函数的不确定非线性严格反馈系统的二维状态空间模型,使系统输出y(t)能够在小误差范围内跟踪给定系统目标信号yd(t);
步骤二、定义扩展状态变量x3=u,建立具有扩展状态变量的三维非线性系统状态空间模型,定义误差变量z1,z2,z3
步骤三、利用步骤二中的误差变量z1,z2,z3设计李雅普诺夫函数V;
步骤四、利用步骤三中的李雅普诺夫函数V对时间求一阶导数得到
Figure BDA0003624837040000023
步骤五、引入等价控制方向函数,定义需要依靠神经网络逼近的未知项F1和F2,改写步骤四中李雅普诺夫函数的一阶导数
Figure BDA0003624837040000024
步骤六、引入动态增益,根据步骤五中李雅普诺夫函数的一阶导数
Figure BDA0003624837040000025
利用反步法和自适应神经网络,设计神经网络权值更新律、虚拟控制函数α1和α2及控制输入u。
具体实施方式二:本实施方式与具体实施方式一不同的是,所述步骤一中根据实际非线性控制系统(如机械臂轨迹跟踪控制、航天器姿态跟踪控制、电机伺服控制等)的状态变量x1和x2,输出信号y和控制信号u,建立具有未知非线性控制方向函数的不确定非线性严格反馈系统的二维状态空间模型,使系统输出y(t)能够在小误差范围内跟踪给定系统目标信号yd(t);具体过程为:
建立具有未知非线性控制方向函数的不确定非线性严格反馈系统的二维状态空间模型为:
Figure BDA0003624837040000031
其中x1(t)和x2(t)表示系统(1)的状态变量,f1(x1(t),t)和f2(x1(t),x2(t),t)为系统未知非线性函数,ψ1(x1(t))和ψ2(x1(t),x2(t))为系统未知控制方向函数,
Figure BDA0003624837040000033
为x1(t)的一阶导数,
Figure BDA0003624837040000032
为x2(t)的一阶导数,t为时间,u(t)为反馈控制器,y(t)为系统输出;
不确定指ψ1(x1(t))、f1(x1(t),t)、ψ2(x1(t),x2(t))、f2(x1(t),x2(t),t)具有不确定性;非线性指ψ1(x1(t))、f1(x1(t),t)、ψ2(x1(t),x2(t))、f2(x1(t),x2(t),t)是非线性的;严格反馈是ψ1(x1(t))只和x1(t)有关不涉及x2(t)和u(t),f1(x1(t),t)只和x1(t),t有关不涉及x2(t)和u(t),ψ2(x1(t),x2(t))只和x1(t),x2(t)有关不涉及u(t),f2(x1(t),x2(t),t)只和x1(t),x2(t),t有关不涉及u(t)。
“具有未知控制方向函数”是指ψ1(x1(t))、ψ2(x1(t),x2(t))未知的,这样的系统更难设计。
控制目标是设计一个反馈控制器u(t),使系统输出y(t)能够在小误差范围内跟踪给定系统目标信号yd(t)。
其它步骤及参数与具体实施方式一相同。
具体实施方式三:本实施方式与具体实施方式一或二不同的是,所述状态变量x1和x2有界时,f1,f2,ψ1,ψ2是有界的,f1,f2,ψ1,ψ2各自对时间求的一阶导数是有界的,且ψ1≠0,ψ2≠0;
所述f1,f2,ψ1,ψ2分别代表f1(x1(t),t)、f2(x1(t),x2(t),t)、ψ1(x1(t))和ψ2(x1(t),x2(t))。
其它步骤及参数与具体实施方式一或二相同。
具体实施方式四:本实施方式与具体实施方式一至三之一不同的是,所述目标信号yd是连续有界的,目标信号yd对时间求的一阶导数是连续有界的,目标信号yd对时间求的二阶导数是连续有界的,目标信号yd对时间求的三阶导数是连续有界的。
其它步骤及参数与具体实施方式一至三之一相同。
具体实施方式五:本实施方式与具体实施方式一至四之一不同的是,所述步骤二中定义扩展状态变量x3=u,建立具有扩展状态变量的三维非线性系统状态空间模型,定义误差变量z1,z2,z3;具体过程为:
1)定义扩展状态变量x3(t)=u(t),
Figure BDA0003624837040000041
2)建立具有扩展状态变量的三维非线性系统状态空间模型:
Figure BDA0003624837040000042
其中
Figure BDA0003624837040000043
为x3(t)的一阶导数,
Figure BDA0003624837040000044
为u(t)的一阶导数;
3)定义误差变量z1=x1-yd,z2=x21,z3=x32
其中α1和α2代表虚拟控制函数。
其它步骤及参数与具体实施方式一至四之一相同。
具体实施方式六:本实施方式与具体实施方式一至五之一不同的是,所述步骤三中利用步骤二中的误差变量z1,z2,z3设计李雅普诺夫函数V;具体过程为:
利用步骤二中的误差变量z1,z2,z3设计李雅普诺夫函数V
Figure BDA0003624837040000045
其它步骤及参数与具体实施方式一至五之一相同。
具体实施方式七:本实施方式与具体实施方式一至六之一不同的是,所述步骤四中利用步骤三中的李雅普诺夫函数V对时间求一阶导数得到
Figure BDA0003624837040000046
利用步骤三中的李雅普诺夫函数V对时间求一阶导数
Figure BDA0003624837040000047
其中
Figure BDA0003624837040000048
为目标信号yd的一阶导数,
Figure BDA0003624837040000049
Figure BDA00036248370400000410
分别代表虚拟控制函数α1和α2的一阶导数。
其它步骤及参数与具体实施方式一至六之一相同。
具体实施方式八:本实施方式与具体实施方式一至七之一不同的是,所述步骤五中引入等价控制方向函数,定义需要依靠神经网络逼近的未知项F1和F2,改写步骤四中李雅普诺夫函数的一阶导数
Figure BDA0003624837040000051
具体过程为:
1)利用等价控制方向函数改写步骤四中李雅普诺夫函数的一阶导数
Figure BDA0003624837040000052
Figure BDA0003624837040000053
其中,b1和b2是等价控制方向函数,在本发明中优先b1和b2为正常数;
2)定义需要依靠神经网络逼近的未知项
Figure BDA0003624837040000054
Figure BDA0003624837040000055
Figure BDA0003624837040000056
即:
Figure BDA0003624837040000057
其它步骤及参数与具体实施方式一至七之一相同。
具体实施方式九:本实施方式与具体实施方式一至八之一不同的是,所述步骤六中引入动态增益,根据步骤五中李雅普诺夫函数的一阶导数
Figure BDA0003624837040000058
利用反步法和自适应神经网络,设计神经网络权值更新律、虚拟控制函数α1和α2及控制输入u;具体过程为:
1)设计动态增益:
Figure BDA0003624837040000059
Figure BDA00036248370400000510
Figure BDA00036248370400000511
其中,
Figure BDA00036248370400000512
为动态增益,在本发明中简记为Di,i=1,2,3;ki为控制器参数,i=1,2,3;Ii为控制器参数,i=1,2,3;
Figure BDA00036248370400000527
为控制器参数,i=1,2,3;
Figure BDA00036248370400000526
ki>Ii/4;
2)利用神经网络
Figure BDA00036248370400000513
Figure BDA00036248370400000514
分别逼近未知项F1和F2,W1、W2表示神经网络的权值向量,
Figure BDA00036248370400000515
Figure BDA00036248370400000516
Figure BDA00036248370400000517
表示实数,
Figure BDA00036248370400000518
表示神经网络的权值向量W1的元素,
Figure BDA00036248370400000519
表示表示神经网络的权值向量W2的元素,T表示转置,
Figure BDA00036248370400000520
为神经网络权值的更新律,S1(X1)、S2(X2)表示径向基函数向量,
Figure BDA00036248370400000521
Figure BDA00036248370400000522
Figure BDA00036248370400000523
表示向量S1(X1)的元素,
Figure BDA00036248370400000524
表示向量S2(X2)的元素,N1和N2表示神经网络的节点数,X1、X2为神经网络的输入,
Figure BDA00036248370400000525
Figure BDA0003624837040000061
Figure BDA0003624837040000062
为目标信号yd的二阶导数,径向基函数定义为:
Figure BDA0003624837040000063
Figure BDA0003624837040000064
其中,Cj和ηj分别是径向基函数的中心向量和宽度,在本发明中,Ci和ηi为给定的固定值;
3)设计神经网络权值更新律:
Figure BDA0003624837040000065
Figure BDA0003624837040000066
所述S1、S2分别为S1(X1)和S2(X2);
其中,μ1,μ2∈(0,1)是学习律,
Figure BDA0003624837040000067
Figure BDA0003624837040000068
分别是指令滤波器的输出:
Figure BDA0003624837040000069
Figure BDA00036248370400000610
其中,
Figure BDA00036248370400000611
Figure BDA00036248370400000612
分别为指令滤波器的状态变量,ρ1,ρ2>0是设计的滤波器参数;
公式(14)是一个指令滤波器,输入是已知的z1,状态变量是
Figure BDA00036248370400000613
输出是
Figure BDA00036248370400000614
公式(15)是一个指令滤波器,输入是已知的z2,状态变量是
Figure BDA00036248370400000615
输出是
Figure BDA00036248370400000616
式(14)中给定
Figure BDA00036248370400000617
初值,计算
Figure BDA00036248370400000618
Figure BDA00036248370400000619
积分得到
Figure BDA00036248370400000620
再将
Figure BDA00036248370400000621
带入式(14),得到新的
Figure BDA00036248370400000622
式(15)同理;
4)根据步骤五中李雅普诺夫函数的一阶导数
Figure BDA00036248370400000623
利用反步法和自适应神经网络,设计虚拟控制函数α1和α2
Figure BDA00036248370400000624
Figure BDA00036248370400000625
其中,
Figure BDA00036248370400000626
为期望的虚拟控制函数,ρα>0为设计的滤波器参数;
式(17)中给定α2初值,计算
Figure BDA00036248370400000627
Figure BDA00036248370400000628
积分得到α2,再将α2带入式(17),得到新的
Figure BDA00036248370400000629
5)设计控制信号u:
Figure BDA00036248370400000630
其中,τ为积分变量。
式(18)为基于动态增益的自适应神经网络跟踪控制器。
其它步骤及参数与具体实施方式一至八之一相同。
具体实施方式十:本实施方式与具体实施方式一至九之一不同的是,所述期望的虚拟控制函数
Figure BDA0003624837040000071
其它步骤及参数与具体实施方式一至九之一相同。
下面将证明基于动态增益的自适应神经网络跟踪控制器(18)能使系统跟踪误差收敛到原点附近较小的邻域内。证明过程如下:
由指令滤波器技术,可得
Figure BDA0003624837040000072
Figure BDA0003624837040000073
Figure BDA0003624837040000074
其中,σ1和σ2为指令滤波器的估计误差,
Figure BDA0003624837040000075
Figure BDA0003624837040000076
为指令滤波器估计误差的上界,ξα为α2
Figure BDA0003624837040000077
的跟踪误差,
Figure BDA0003624837040000078
为跟踪误差的上界。
由神经网络权值更新律,可得
Figure BDA0003624837040000079
Figure BDA00036248370400000710
其中δ1和δ2分别是神经网络的逼近误差,
Figure BDA00036248370400000711
Figure BDA00036248370400000712
分别是神经网络逼近误差的上界。
将式(22)带入式(16)、将式(23)带入式(21),可得
Figure BDA00036248370400000713
Figure BDA00036248370400000714
将式(18)(24)(25)带入李雅普诺夫函数的一阶导数(5),有
Figure BDA00036248370400000715
其中,
Figure BDA0003624837040000081
Figure BDA0003624837040000082
由式(26)可得
Figure BDA0003624837040000083
令b/a<r<V(0)≤M,可得
Figure BDA0003624837040000084
而且
Figure BDA0003624837040000085
式(29)表明当时间趋于无穷,系统跟踪误差收敛到原点附近较小的邻域内,证毕。
采用以下实施例验证本发明的有益效果:
实施例一:
对于系统(公式1),未知控制方向函数
Figure BDA0003624837040000086
ψ2(x1(t),x2(t))=2+cos(x1),未知非线性函数f1(x1(t),t)=0.5x1,f2(x1(t),x2(t),t)=x1x2,取初值为x1(0)=0.2,x2(0)=-0.1,系统目标信号yd(t)=sin(t)。神经网络参数μ1=0.4,μ2=0.2,N1=20,N2=80,
Figure BDA0003624837040000089
η1j=2,j=1,2,…,N1
Figure BDA00036248370400000810
j=1,2,…,N2。控制器参数b1=1,b2=2,ρ1=40,ρ2=40,ρα=100,
Figure BDA0003624837040000087
α2(0)=0,k1=10,k2=30,k3=20,I1=10,I2=30,I3=20,
Figure BDA0003624837040000088
图1为本发明系统输出曲线图;图2为本发明系统跟踪误差曲线图;图3为本发明神经网络逼近F1曲线图;图4为本发明下神经网络逼近F2曲线图;图5为本发明下动态增益曲线图;图6为本发明下控制信号u曲线图。
结论:由图1可知基于动态增益的自适应神经网络跟踪控制方法设计的控制信号u能使系统的跟踪误差收敛到原点附近的小领域内。
本发明还可有其它多种实施例,在不背离本发明精神及其实质的情况下,本领域技术人员当可根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。

Claims (8)

1.一种基于动态增益的自适应神经网络跟踪控制方法,其特征在于:所述方法具体过程为:
步骤一、根据系统的状态变量x1和x2,输出信号y和控制信号u,建立具有未知非线性控制方向函数的不确定非线性严格反馈系统的二维状态空间模型,使系统输出y(t)跟踪目标信号yd(t);
步骤二、定义扩展状态变量x3=u,建立具有扩展状态变量的三维非线性系统状态空间模型,定义误差变量z1,z2,z3
步骤三、利用步骤二中的误差变量z1,z2,z3设计李雅普诺夫函数V;
步骤四、利用步骤三中的李雅普诺夫函数V对时间求一阶导数得到
Figure QLYQS_1
步骤五、引入等价控制方向函数,定义需要依靠神经网络逼近的未知项F1和F2,改写步骤四中李雅普诺夫函数的一阶导数
Figure QLYQS_2
步骤六、引入动态增益,根据步骤五中李雅普诺夫函数的一阶导数
Figure QLYQS_3
利用反步法和自适应神经网络,设计神经网络权值更新律、虚拟控制函数α1和α2及控制输入u;
所述步骤五中引入等价控制方向函数,定义需要依靠神经网络逼近的未知项F1和F2,改写步骤四中李雅普诺夫函数的一阶导数
Figure QLYQS_4
具体过程为:
1)利用等价控制方向函数改写步骤四中李雅普诺夫函数的一阶导数
Figure QLYQS_5
Figure QLYQS_6
其中,b1和b2是等价控制方向函数,取值为正常数;
2)定义需要依靠神经网络逼近的未知项
Figure QLYQS_7
Figure QLYQS_8
Figure QLYQS_9
即:
Figure QLYQS_10
所述步骤六中引入动态增益,根据步骤五中李雅普诺夫函数的一阶导数
Figure QLYQS_11
利用反步法和自适应神经网络,设计神经网络权值更新律、虚拟控制函数α1和α2及控制输入u;具体过程为:
1)设计动态增益:
Figure QLYQS_12
Figure QLYQS_13
Figure QLYQS_14
其中,
Figure QLYQS_15
为动态增益,i=1,2,3;ki为控制器参数,i=1,2,3;1i为控制器参数,i=1,2,3;
Figure QLYQS_16
为控制器参数,i=1,2,3;
Figure QLYQS_17
2)利用神经网络
Figure QLYQS_21
Figure QLYQS_24
分别逼近未知项F1和F2,W1、W2表示神经网络的权值向量,
Figure QLYQS_27
表示实数,
Figure QLYQS_19
表示神经网络的权值向量W1的元素,
Figure QLYQS_23
表示神经网络的权值向量W2的元素,T表示转置,
Figure QLYQS_26
为神经网络权值的更新律,S1(X1)、S2(X2)表示径向基函数向量,
Figure QLYQS_29
Figure QLYQS_18
表示向量S1(X1)的元素,
Figure QLYQS_22
表示向量S2(X2)的元素,N1和N2表示神经网络的节点数,X1、X2为神经网络的输入,
Figure QLYQS_25
Figure QLYQS_28
Figure QLYQS_20
为目标信号yd的二阶导数,径向基函数定义为:
Figure QLYQS_30
Figure QLYQS_31
其中,Cj和ηj分别是径向基函数的中心向量和宽度;
3)设计神经网络权值更新律:
Figure QLYQS_32
Figure QLYQS_33
其中,μ1,μ2∈(0,1)是学习律,
Figure QLYQS_34
Figure QLYQS_35
分别是指令滤波器的输出:
Figure QLYQS_36
Figure QLYQS_37
其中,
Figure QLYQS_38
Figure QLYQS_39
分别为指令滤波器的状态变量,ρ1,ρ2>0是滤波器参数;
4)根据步骤五中李雅普诺夫函数的一阶导数
Figure QLYQS_40
利用反步法和自适应神经网络,设计虚拟控制函数α1和α2
Figure QLYQS_41
Figure QLYQS_42
其中,
Figure QLYQS_43
为期望的虚拟控制函数,ρα>0为滤波器参数;
5)设计控制信号u:
Figure QLYQS_44
其中,τ为积分变量;
式(18)为基于动态增益的自适应神经网络跟踪控制器。
2.根据权利要求1所述一种基于动态增益的自适应神经网络跟踪控制方法,其特征在于:所述步骤一中根据系统的状态变量x1和x2,输出信号y和控制信号u,建立具有未知非线性控制方向函数的不确定非线性严格反馈系统的二维状态空间模型,使系统输出y(t)跟踪目标信号yd(t);具体过程为:
建立具有未知非线性控制方向函数的不确定非线性严格反馈系统的二维状态空间模型为:
Figure QLYQS_45
其中x1(t)和x2(t)表示系统的状态变量,f1(x1(t),t)和f2(x1(t),x2(t),t)为系统未知非线性函数,ψ1(x1(t))和ψ2(x1(t),x2(t))为系统未知控制方向函数,
Figure QLYQS_46
为x1(t)的一阶导数,
Figure QLYQS_47
为x2(t)的一阶导数,t为时间,u(t)为反馈控制器,y(t)为系统输出。
3.根据权利要求2所述一种基于动态增益的自适应神经网络跟踪控制方法,其特征在于:所述状态变量x1和x2有界时,f1,f2,ψ1,ψ2是有界的,f1,f2,ψ1,ψ2各自对时间求的一阶导数是有界的,且ψ1≠0,ψ2≠0。
4.根据权利要求3所述一种基于动态增益的自适应神经网络跟踪控制方法,其特征在于:所述目标信号yd是连续有界的,目标信号yd对时间求的一阶导数是连续有界的,目标信号yd对时间求的二阶导数是连续有界的,目标信号yd对时间求的三阶导数是连续有界的。
5.根据权利要求4所述一种基于动态增益的自适应神经网络跟踪控制方法,其特征在于:所述步骤二中定义扩展状态变量x3=u,建立具有扩展状态变量的三维非线性系统状态空间模型,定义误差变量z1,z2,z3;具体过程为:
1)定义扩展状态变量x3(t)=u(t),
Figure QLYQS_48
2)建立具有扩展状态变量的三维非线性系统状态空间模型:
Figure QLYQS_49
其中
Figure QLYQS_50
为x3(t)的一阶导数,
Figure QLYQS_51
为u(t)的一阶导数;
3)定义误差变量z1=x1-yd,z2=x21,z3=x32
其中α1和α2代表虚拟控制函数。
6.根据权利要求5所述一种基于动态增益的自适应神经网络跟踪控制方法,其特征在于:所述步骤三中利用步骤二中的误差变量z1,z2,z3设计李雅普诺夫函数V;具体过程为:
利用步骤二中的误差变量z1,z2,z3设计李雅普诺夫函数V
Figure QLYQS_52
7.根据权利要求6所述一种基于动态增益的自适应神经网络跟踪控制方法,其特征在于:所述步骤四中利用步骤三中的李雅普诺夫函数V对时间求一阶导数得到
Figure QLYQS_53
利用步骤三中的李雅普诺夫函数V对时间求一阶导数
Figure QLYQS_54
其中
Figure QLYQS_55
为目标信号yd的一阶导数,
Figure QLYQS_56
Figure QLYQS_57
分别代表虚拟控制函数α1和α2的一阶导数。
8.根据权利要求7所述一种基于动态增益的自适应神经网络跟踪控制方法,其特征在于:所述期望的虚拟控制函数
Figure QLYQS_58
CN202210467223.3A 2022-04-29 2022-04-29 一种基于动态增益的自适应神经网络跟踪控制方法 Active CN114815618B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210467223.3A CN114815618B (zh) 2022-04-29 2022-04-29 一种基于动态增益的自适应神经网络跟踪控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210467223.3A CN114815618B (zh) 2022-04-29 2022-04-29 一种基于动态增益的自适应神经网络跟踪控制方法

Publications (2)

Publication Number Publication Date
CN114815618A CN114815618A (zh) 2022-07-29
CN114815618B true CN114815618B (zh) 2023-05-16

Family

ID=82509775

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210467223.3A Active CN114815618B (zh) 2022-04-29 2022-04-29 一种基于动态增益的自适应神经网络跟踪控制方法

Country Status (1)

Country Link
CN (1) CN114815618B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115373270A (zh) * 2022-08-29 2022-11-22 扬州大学 基于全状态约束mimo自适应事件触发控制方法及系统
CN115981165B (zh) * 2023-02-15 2023-12-26 杭州电子科技大学 一种高阶非严格反馈非线性系统全局自适应跟踪控制方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107479384A (zh) * 2017-09-05 2017-12-15 西北工业大学 高超声速飞行器神经网络复合学习非反步控制方法
CN113031446A (zh) * 2021-03-15 2021-06-25 贵州大学 不确定时滞非线性系统非奇异性神经自适应跟踪控制方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170139423A1 (en) * 2015-11-12 2017-05-18 King Fahd University Of Petroleum And Minerals Control system and method for multi-vehicle systems
CN110515302B (zh) * 2019-08-13 2022-04-15 西安理工大学 一种液压位置伺服系统反步自适应神经网络控制方法
CN110376879B (zh) * 2019-08-16 2022-05-10 哈尔滨工业大学(深圳) 一种基于神经网络的pid型迭代学习控制方法
CN114077192B (zh) * 2020-08-20 2024-04-05 南京工业大学 一种非线性系统输出反馈智能控制方法
CN112859608B (zh) * 2021-01-13 2023-08-01 沈阳工程学院 一种基于rbf神经网络补偿的自适应动态面控制方法
CN112904726B (zh) * 2021-01-20 2022-11-18 哈尔滨工业大学 一种基于误差重构权重更新的神经网络反步控制方法
CN113325717B (zh) * 2021-06-10 2022-01-28 哈尔滨工业大学 基于互联大规模系统的最优容错控制方法、系统、处理设备、存储介质
CN114326405B (zh) * 2021-12-30 2023-04-07 哈尔滨工业大学 一种基于误差训练的神经网络反步控制方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107479384A (zh) * 2017-09-05 2017-12-15 西北工业大学 高超声速飞行器神经网络复合学习非反步控制方法
CN113031446A (zh) * 2021-03-15 2021-06-25 贵州大学 不确定时滞非线性系统非奇异性神经自适应跟踪控制方法

Also Published As

Publication number Publication date
CN114815618A (zh) 2022-07-29

Similar Documents

Publication Publication Date Title
CN114815618B (zh) 一种基于动态增益的自适应神经网络跟踪控制方法
CN110977988B (zh) 基于有限时间命令滤波的多关节机械臂阻抗控制方法
Cui et al. Finite-time tracking control for a class of uncertain strict-feedback nonlinear systems with state constraints: A smooth control approach
Xu et al. Neural network-based finite horizon stochastic optimal control design for nonlinear networked control systems
Qi et al. Stable indirect adaptive control based on discrete-time T–S fuzzy model
Chi et al. Enhanced data-driven optimal terminal ILC using current iteration control knowledge
Lian et al. Disturbance observer-based adaptive neural network output feedback control for uncertain nonlinear systems
CN109976161A (zh) 一种不确定非线性系统的有限时间优化跟踪控制方法
CN113589689A (zh) 一种基于多参数自适应神经网络的滑模控制器设计方法
Wang et al. Decentralised adaptive dynamic surface control for a class of interconnected non-linear systems
CN109108964B (zh) 一种基于自适应动态规划Nash博弈的空间机械臂协调控制方法
Kumar et al. Wavelet neural network based controller design for non-affine nonlinear systems
CN112363538A (zh) 一种速度信息不完备下的auv区域跟踪控制方法
CN109995278B (zh) 一种考虑输入受限的电机伺服系统自调节控制方法
CN111590561A (zh) 一种分布式机械臂系统鲁棒预设性能控制方法
CN116690561A (zh) 一种用于单连杆机械臂的自适应最优反步控制方法及系统
CN115524961B (zh) 执行器故障时不确定非线性系统的自适应跟踪控制方法
CN115220352A (zh) 基于有限时间指令滤波器的自适应跟踪控制方法及系统
Abbasi et al. Adaptive identification of underwater glider using U-model for depth & pitch control under hydrodynamic disturbances
CN114384800A (zh) 一种具有输入信号延时的未知非线性系统反推控制方法
Zhao et al. Adaptive neural tracking control of nonlinear nonstrict-feedback systems with unmodeled dynamics
Park et al. Decentralized output-feedback controller for uncertain large-scale nonlinear systems using higher-order switching differentiator
CN112731801A (zh) 一种对称死区非线性的自适应动态面输出反馈控制方法
Hsu et al. Adaptive Command-Filtered Backstepping Control for Chaotic Dynamic Systems
CN115981165B (zh) 一种高阶非严格反馈非线性系统全局自适应跟踪控制方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant