CN114815618A - 一种基于动态增益的自适应神经网络跟踪控制方法 - Google Patents

一种基于动态增益的自适应神经网络跟踪控制方法 Download PDF

Info

Publication number
CN114815618A
CN114815618A CN202210467223.3A CN202210467223A CN114815618A CN 114815618 A CN114815618 A CN 114815618A CN 202210467223 A CN202210467223 A CN 202210467223A CN 114815618 A CN114815618 A CN 114815618A
Authority
CN
China
Prior art keywords
neural network
function
derivative
dynamic gain
control
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210467223.3A
Other languages
English (en)
Other versions
CN114815618B (zh
Inventor
于兴虎
郑晓龙
杨佳兴
杨学博
李湛
高会军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Institute of Technology
Original Assignee
Harbin Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Institute of Technology filed Critical Harbin Institute of Technology
Priority to CN202210467223.3A priority Critical patent/CN114815618B/zh
Publication of CN114815618A publication Critical patent/CN114815618A/zh
Application granted granted Critical
Publication of CN114815618B publication Critical patent/CN114815618B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)

Abstract

一种基于动态增益的自适应神经网络跟踪控制方法,本发明涉及基于动态增益的自适应神经网络跟踪控制方法。本发明是为了解决目前自适应神经网络控制的反馈增益参数以未知函数的上界设计,使得系统的控制器设计不灵活,导致设计的控制器能量消耗过大的问题。过程为:一、建立具有未知非线性控制方向函数的不确定非线性严格反馈系统的二维状态空间模型,使系统输出跟踪目标信号;二、建立具有扩展状态变量的三维非线性系统状态空间模型;三、设计李雅普诺夫函数;四、利用李雅普诺夫函数对时间求一阶导数;五、改写李雅普诺夫函数的一阶导数;六、设计神经网络权值更新律、虚拟控制函数及控制输入。本发明用于非线性控制技术领域。

Description

一种基于动态增益的自适应神经网络跟踪控制方法
技术领域
本发明属于非线性控制技术领域,具体涉及一种基于动态增益的自适应神经网络跟踪控制。
背景技术
在工程实践中有许多非线性系统的跟踪控制问题,如机械臂轨迹跟踪控制、航天器姿态跟踪控制、电机伺服控制等,实际上不可能获得与真实系统相对应的准确数学模型。在进行非线性系统跟踪控制设计时必须要考虑非线性系统的不确定性,一种常用的控制方法是自适应神经网络跟踪控制,该方法是基于反步控制思想设计控制器,结合神经网络逼近系统中的未知项函数和虚拟控制函数的导数,克服了反步控制法设计过程中虚拟控制函数求导带来的计算爆炸问题,极大降低了不确定非线性系统控制器的设计难度。自适应神经网络跟踪控制技术可以参考中国发明专利CN114019804A、中国发明专利CN112192573A及中国发明专利CN107577146B。在处理具有未知控制方向函数的不确定非线性系统控制问题时,传统的自适应神经网络控制方法只能以未知控制方向函数的上界设计反馈增益,不等式的过度放大,得到的结果很大程度具有保守性。由于反馈增益参数是一个固定值,使得系统的控制器设计不灵活,导致设计的控制器能量消耗过大。
发明内容
本发明是为了解决目前自适应神经网络控制的反馈增益参数以未知函数的上界设计,使得系统的控制器设计不灵活,导致设计的控制器能量消耗过大的问题,提出了一种基于动态增益的自适应神经网络跟踪控制方法。
本方法为了解决上述技术问题采取的技术方案是:一种基于动态增益的自适应神经网络跟踪控制方法,该方法包括以下步骤:
步骤一、根据系统的状态变量x1和x2,输出信号y和控制信号u,建立具有未知非线性控制方向函数的不确定非线性严格反馈系统的二维状态空间模型,使系统输出y(t)跟踪目标信号yd(t);
步骤二、定义扩展状态变量x3=u,建立具有扩展状态变量的三维非线性系统状态空间模型,定义误差变量z1,z2,z3
步骤三、利用步骤二中的误差变量z1,z2,z3设计李雅普诺夫函数V;
步骤四、利用步骤三中的李雅普诺夫函数V对时间求一阶导数得到
Figure BDA0003624837040000011
步骤五、引入等价控制方向函数,定义需要依靠神经网络逼近的未知项F1和F2,改写步骤四中李雅普诺夫函数的一阶导数
Figure BDA0003624837040000021
步骤六、引入动态增益,根据步骤五中李雅普诺夫函数的一阶导数
Figure BDA0003624837040000022
利用反步法和自适应神经网络,设计神经网络权值更新律、虚拟控制函数α1和α2及控制输入u。
本发明的有益效果:
引入动态增益,让控制器的设计更灵活,降低控制器u的能量消耗;引入等价控制增益,使自适应神经网络控制的反馈增益不再需要根据未知控制方向函数的上界设计,避免了控制器过于保守的问题;实现设计反馈控制器u(t),使系统输出y(t)能够在小误差范围内跟踪给定目标信号yd(t)。
附图说明
图1为本发明系统(公式1)输出曲线图;
图2为本发明系统(公式1)跟踪误差曲线图;
图3为本发明神经网络逼近F1曲线图;
图4为本发明神经网络逼近F2曲线图;
图5为本发明动态增益曲线图;
图6为本发明控制信号u曲线图。
具体实施方式
具体实施方式一:本实施方式一种基于动态增益的自适应神经网络跟踪控制方法具体过程为:
步骤一、根据实际非线性控制系统(如机械臂轨迹跟踪控制、航天器姿态跟踪控制、电机伺服控制等)的状态变量x1和x2,输出信号y和控制信号u,建立具有未知非线性控制方向函数的不确定非线性严格反馈系统的二维状态空间模型,使系统输出y(t)能够在小误差范围内跟踪给定系统目标信号yd(t);
步骤二、定义扩展状态变量x3=u,建立具有扩展状态变量的三维非线性系统状态空间模型,定义误差变量z1,z2,z3
步骤三、利用步骤二中的误差变量z1,z2,z3设计李雅普诺夫函数V;
步骤四、利用步骤三中的李雅普诺夫函数V对时间求一阶导数得到
Figure BDA0003624837040000023
步骤五、引入等价控制方向函数,定义需要依靠神经网络逼近的未知项F1和F2,改写步骤四中李雅普诺夫函数的一阶导数
Figure BDA0003624837040000024
步骤六、引入动态增益,根据步骤五中李雅普诺夫函数的一阶导数
Figure BDA0003624837040000025
利用反步法和自适应神经网络,设计神经网络权值更新律、虚拟控制函数α1和α2及控制输入u。
具体实施方式二:本实施方式与具体实施方式一不同的是,所述步骤一中根据实际非线性控制系统(如机械臂轨迹跟踪控制、航天器姿态跟踪控制、电机伺服控制等)的状态变量x1和x2,输出信号y和控制信号u,建立具有未知非线性控制方向函数的不确定非线性严格反馈系统的二维状态空间模型,使系统输出y(t)能够在小误差范围内跟踪给定系统目标信号yd(t);具体过程为:
建立具有未知非线性控制方向函数的不确定非线性严格反馈系统的二维状态空间模型为:
Figure BDA0003624837040000031
其中x1(t)和x2(t)表示系统(1)的状态变量,f1(x1(t),t)和f2(x1(t),x2(t),t)为系统未知非线性函数,ψ1(x1(t))和ψ2(x1(t),x2(t))为系统未知控制方向函数,
Figure BDA0003624837040000033
为x1(t)的一阶导数,
Figure BDA0003624837040000032
为x2(t)的一阶导数,t为时间,u(t)为反馈控制器,y(t)为系统输出;
不确定指ψ1(x1(t))、f1(x1(t),t)、ψ2(x1(t),x2(t))、f2(x1(t),x2(t),t)具有不确定性;非线性指ψ1(x1(t))、f1(x1(t),t)、ψ2(x1(t),x2(t))、f2(x1(t),x2(t),t)是非线性的;严格反馈是ψ1(x1(t))只和x1(t)有关不涉及x2(t)和u(t),f1(x1(t),t)只和x1(t),t有关不涉及x2(t)和u(t),ψ2(x1(t),x2(t))只和x1(t),x2(t)有关不涉及u(t),f2(x1(t),x2(t),t)只和x1(t),x2(t),t有关不涉及u(t)。
“具有未知控制方向函数”是指ψ1(x1(t))、ψ2(x1(t),x2(t))未知的,这样的系统更难设计。
控制目标是设计一个反馈控制器u(t),使系统输出y(t)能够在小误差范围内跟踪给定系统目标信号yd(t)。
其它步骤及参数与具体实施方式一相同。
具体实施方式三:本实施方式与具体实施方式一或二不同的是,所述状态变量x1和x2有界时,f1,f2,ψ1,ψ2是有界的,f1,f2,ψ1,ψ2各自对时间求的一阶导数是有界的,且ψ1≠0,ψ2≠0;
所述f1,f2,ψ1,ψ2分别代表f1(x1(t),t)、f2(x1(t),x2(t),t)、ψ1(x1(t))和ψ2(x1(t),x2(t))。
其它步骤及参数与具体实施方式一或二相同。
具体实施方式四:本实施方式与具体实施方式一至三之一不同的是,所述目标信号yd是连续有界的,目标信号yd对时间求的一阶导数是连续有界的,目标信号yd对时间求的二阶导数是连续有界的,目标信号yd对时间求的三阶导数是连续有界的。
其它步骤及参数与具体实施方式一至三之一相同。
具体实施方式五:本实施方式与具体实施方式一至四之一不同的是,所述步骤二中定义扩展状态变量x3=u,建立具有扩展状态变量的三维非线性系统状态空间模型,定义误差变量z1,z2,z3;具体过程为:
1)定义扩展状态变量x3(t)=u(t),
Figure BDA0003624837040000041
2)建立具有扩展状态变量的三维非线性系统状态空间模型:
Figure BDA0003624837040000042
其中
Figure BDA0003624837040000043
为x3(t)的一阶导数,
Figure BDA0003624837040000044
为u(t)的一阶导数;
3)定义误差变量z1=x1-yd,z2=x21,z3=x32
其中α1和α2代表虚拟控制函数。
其它步骤及参数与具体实施方式一至四之一相同。
具体实施方式六:本实施方式与具体实施方式一至五之一不同的是,所述步骤三中利用步骤二中的误差变量z1,z2,z3设计李雅普诺夫函数V;具体过程为:
利用步骤二中的误差变量z1,z2,z3设计李雅普诺夫函数V
Figure BDA0003624837040000045
其它步骤及参数与具体实施方式一至五之一相同。
具体实施方式七:本实施方式与具体实施方式一至六之一不同的是,所述步骤四中利用步骤三中的李雅普诺夫函数V对时间求一阶导数得到
Figure BDA0003624837040000046
利用步骤三中的李雅普诺夫函数V对时间求一阶导数
Figure BDA0003624837040000047
其中
Figure BDA0003624837040000048
为目标信号yd的一阶导数,
Figure BDA0003624837040000049
Figure BDA00036248370400000410
分别代表虚拟控制函数α1和α2的一阶导数。
其它步骤及参数与具体实施方式一至六之一相同。
具体实施方式八:本实施方式与具体实施方式一至七之一不同的是,所述步骤五中引入等价控制方向函数,定义需要依靠神经网络逼近的未知项F1和F2,改写步骤四中李雅普诺夫函数的一阶导数
Figure BDA0003624837040000051
具体过程为:
1)利用等价控制方向函数改写步骤四中李雅普诺夫函数的一阶导数
Figure BDA0003624837040000052
Figure BDA0003624837040000053
其中,b1和b2是等价控制方向函数,在本发明中优先b1和b2为正常数;
2)定义需要依靠神经网络逼近的未知项
Figure BDA0003624837040000054
Figure BDA0003624837040000055
Figure BDA0003624837040000056
即:
Figure BDA0003624837040000057
其它步骤及参数与具体实施方式一至七之一相同。
具体实施方式九:本实施方式与具体实施方式一至八之一不同的是,所述步骤六中引入动态增益,根据步骤五中李雅普诺夫函数的一阶导数
Figure BDA0003624837040000058
利用反步法和自适应神经网络,设计神经网络权值更新律、虚拟控制函数α1和α2及控制输入u;具体过程为:
1)设计动态增益:
Figure BDA0003624837040000059
Figure BDA00036248370400000510
Figure BDA00036248370400000511
其中,
Figure BDA00036248370400000512
为动态增益,在本发明中简记为Di,i=1,2,3;ki为控制器参数,i=1,2,3;Ii为控制器参数,i=1,2,3;
Figure BDA00036248370400000527
为控制器参数,i=1,2,3;
Figure BDA00036248370400000526
ki>Ii/4;
2)利用神经网络
Figure BDA00036248370400000513
Figure BDA00036248370400000514
分别逼近未知项F1和F2,W1、W2表示神经网络的权值向量,
Figure BDA00036248370400000515
Figure BDA00036248370400000516
Figure BDA00036248370400000517
表示实数,
Figure BDA00036248370400000518
表示神经网络的权值向量W1的元素,
Figure BDA00036248370400000519
表示表示神经网络的权值向量W2的元素,T表示转置,
Figure BDA00036248370400000520
为神经网络权值的更新律,S1(X1)、S2(X2)表示径向基函数向量,
Figure BDA00036248370400000521
Figure BDA00036248370400000522
Figure BDA00036248370400000523
表示向量S1(X1)的元素,
Figure BDA00036248370400000524
表示向量S2(X2)的元素,N1和N2表示神经网络的节点数,X1、X2为神经网络的输入,
Figure BDA00036248370400000525
Figure BDA0003624837040000061
Figure BDA0003624837040000062
为目标信号yd的二阶导数,径向基函数定义为:
Figure BDA0003624837040000063
Figure BDA0003624837040000064
其中,Cj和ηj分别是径向基函数的中心向量和宽度,在本发明中,Ci和ηi为给定的固定值;
3)设计神经网络权值更新律:
Figure BDA0003624837040000065
Figure BDA0003624837040000066
所述S1、S2分别为S1(X1)和S2(X2);
其中,μ1,μ2∈(0,1)是学习律,
Figure BDA0003624837040000067
Figure BDA0003624837040000068
分别是指令滤波器的输出:
Figure BDA0003624837040000069
Figure BDA00036248370400000610
其中,
Figure BDA00036248370400000611
Figure BDA00036248370400000612
分别为指令滤波器的状态变量,ρ1,ρ2>0是设计的滤波器参数;
公式(14)是一个指令滤波器,输入是已知的z1,状态变量是
Figure BDA00036248370400000613
输出是
Figure BDA00036248370400000614
公式(15)是一个指令滤波器,输入是已知的z2,状态变量是
Figure BDA00036248370400000615
输出是
Figure BDA00036248370400000616
式(14)中给定
Figure BDA00036248370400000617
初值,计算
Figure BDA00036248370400000618
Figure BDA00036248370400000619
积分得到
Figure BDA00036248370400000620
再将
Figure BDA00036248370400000621
带入式(14),得到新的
Figure BDA00036248370400000622
式(15)同理;
4)根据步骤五中李雅普诺夫函数的一阶导数
Figure BDA00036248370400000623
利用反步法和自适应神经网络,设计虚拟控制函数α1和α2
Figure BDA00036248370400000624
Figure BDA00036248370400000625
其中,
Figure BDA00036248370400000626
为期望的虚拟控制函数,ρα>0为设计的滤波器参数;
式(17)中给定α2初值,计算
Figure BDA00036248370400000627
Figure BDA00036248370400000628
积分得到α2,再将α2带入式(17),得到新的
Figure BDA00036248370400000629
5)设计控制信号u:
Figure BDA00036248370400000630
其中,τ为积分变量。
式(18)为基于动态增益的自适应神经网络跟踪控制器。
其它步骤及参数与具体实施方式一至八之一相同。
具体实施方式十:本实施方式与具体实施方式一至九之一不同的是,所述期望的虚拟控制函数
Figure BDA0003624837040000071
其它步骤及参数与具体实施方式一至九之一相同。
下面将证明基于动态增益的自适应神经网络跟踪控制器(18)能使系统跟踪误差收敛到原点附近较小的邻域内。证明过程如下:
由指令滤波器技术,可得
Figure BDA0003624837040000072
Figure BDA0003624837040000073
Figure BDA0003624837040000074
其中,σ1和σ2为指令滤波器的估计误差,
Figure BDA0003624837040000075
Figure BDA0003624837040000076
为指令滤波器估计误差的上界,ξα为α2
Figure BDA0003624837040000077
的跟踪误差,
Figure BDA0003624837040000078
为跟踪误差的上界。
由神经网络权值更新律,可得
Figure BDA0003624837040000079
Figure BDA00036248370400000710
其中δ1和δ2分别是神经网络的逼近误差,
Figure BDA00036248370400000711
Figure BDA00036248370400000712
分别是神经网络逼近误差的上界。
将式(22)带入式(16)、将式(23)带入式(21),可得
Figure BDA00036248370400000713
Figure BDA00036248370400000714
将式(18)(24)(25)带入李雅普诺夫函数的一阶导数(5),有
Figure BDA00036248370400000715
其中,
Figure BDA0003624837040000081
Figure BDA0003624837040000082
由式(26)可得
Figure BDA0003624837040000083
令b/a<r<V(0)≤M,可得
Figure BDA0003624837040000084
而且
Figure BDA0003624837040000085
式(29)表明当时间趋于无穷,系统跟踪误差收敛到原点附近较小的邻域内,证毕。
采用以下实施例验证本发明的有益效果:
实施例一:
对于系统(公式1),未知控制方向函数
Figure BDA0003624837040000086
ψ2(x1(t),x2(t))=2+cos(x1),未知非线性函数f1(x1(t),t)=0.5x1,f2(x1(t),x2(t),t)=x1x2,取初值为x1(0)=0.2,x2(0)=-0.1,系统目标信号yd(t)=sin(t)。神经网络参数μ1=0.4,μ2=0.2,N1=20,N2=80,
Figure BDA0003624837040000089
η1j=2,j=1,2,…,N1
Figure BDA00036248370400000810
j=1,2,…,N2。控制器参数b1=1,b2=2,ρ1=40,ρ2=40,ρα=100,
Figure BDA0003624837040000087
α2(0)=0,k1=10,k2=30,k3=20,I1=10,I2=30,I3=20,
Figure BDA0003624837040000088
图1为本发明系统输出曲线图;图2为本发明系统跟踪误差曲线图;图3为本发明神经网络逼近F1曲线图;图4为本发明下神经网络逼近F2曲线图;图5为本发明下动态增益曲线图;图6为本发明下控制信号u曲线图。
结论:由图1可知基于动态增益的自适应神经网络跟踪控制方法设计的控制信号u能使系统的跟踪误差收敛到原点附近的小领域内。
本发明还可有其它多种实施例,在不背离本发明精神及其实质的情况下,本领域技术人员当可根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。

Claims (10)

1.一种基于动态增益的自适应神经网络跟踪控制方法,其特征在于:所述方法具体过程为:
步骤一、根据系统的状态变量x1和x2,输出信号y和控制信号u,建立具有未知非线性控制方向函数的不确定非线性严格反馈系统的二维状态空间模型,使系统输出y(t)跟踪目标信号yd(t);
步骤二、定义扩展状态变量x3=u,建立具有扩展状态变量的三维非线性系统状态空间模型,定义误差变量z1,z2,z3
步骤三、利用步骤二中的误差变量z1,z2,z3设计李雅普诺夫函数V;
步骤四、利用步骤三中的李雅普诺夫函数V对时间求一阶导数得到
Figure FDA0003624837030000011
步骤五、引入等价控制方向函数,定义需要依靠神经网络逼近的未知项F1和F2,改写步骤四中李雅普诺夫函数的一阶导数
Figure FDA0003624837030000012
步骤六、引入动态增益,根据步骤五中李雅普诺夫函数的一阶导数
Figure FDA0003624837030000013
利用反步法和自适应神经网络,设计神经网络权值更新律、虚拟控制函数α1和α2及控制输入u。
2.根据权利要求1所述一种基于动态增益的自适应神经网络跟踪控制方法,其特征在于:所述步骤一中根据系统的状态变量x1和x2,输出信号y和控制信号u,建立具有未知非线性控制方向函数的不确定非线性严格反馈系统的二维状态空间模型,使系统输出y(t)跟踪目标信号yd(t);具体过程为:
建立具有未知非线性控制方向函数的不确定非线性严格反馈系统的二维状态空间模型为:
Figure FDA0003624837030000014
其中x1(t)和x2(t)表示系统的状态变量,f1(x1(t),t)和f2(x1(t),x2(t),t)为系统未知非线性函数,ψ1(x1(t))和ψ2(x1(t),x2(t))为系统未知控制方向函数,
Figure FDA0003624837030000015
为x1(t)的一阶导数,
Figure FDA0003624837030000016
为x2(t)的一阶导数,t为时间,u(t)为反馈控制器,y(t)为系统输出。
3.根据权利要求2所述一种基于动态增益的自适应神经网络跟踪控制方法,其特征在于:所述状态变量x1和x2有界时,f1,f212是有界的,f1,f212各自对时间求的一阶导数是有界的,且ψ1≠0,ψ2≠0。
4.根据权利要求3所述一种基于动态增益的自适应神经网络跟踪控制方法,其特征在于:所述目标信号yd是连续有界的,目标信号yd对时间求的一阶导数是连续有界的,目标信号yd对时间求的二阶导数是连续有界的,目标信号yd对时间求的三阶导数是连续有界的。
5.根据权利要求4所述一种基于动态增益的自适应神经网络跟踪控制方法,其特征在于:所述步骤二中定义扩展状态变量x3=u,建立具有扩展状态变量的三维非线性系统状态空间模型,定义误差变量z1,z2,z3;具体过程为:
1)定义扩展状态变量x3(t)=u(t),
Figure FDA0003624837030000021
2)建立具有扩展状态变量的三维非线性系统状态空间模型:
Figure FDA0003624837030000022
其中
Figure FDA0003624837030000023
为x3(t)的一阶导数,
Figure FDA0003624837030000024
为u(t)的一阶导数;
3)定义误差变量z1=x1-yd,z2=x21,z3=x32
其中α1和α2代表虚拟控制函数。
6.根据权利要求5所述一种基于动态增益的自适应神经网络跟踪控制方法,其特征在于:所述步骤三中利用步骤二中的误差变量z1,z2,z3设计李雅普诺夫函数V;具体过程为:
利用步骤二中的误差变量z1,z2,z3设计李雅普诺夫函数V
Figure FDA0003624837030000025
7.根据权利要求6所述一种基于动态增益的自适应神经网络跟踪控制方法,其特征在于:所述步骤四中利用步骤三中的李雅普诺夫函数V对时间求一阶导数得到
Figure FDA00036248370300000215
利用步骤三中的李雅普诺夫函数V对时间求一阶导数
Figure FDA0003624837030000026
其中
Figure FDA0003624837030000027
为目标信号yd的一阶导数,
Figure FDA0003624837030000028
Figure FDA0003624837030000029
分别代表虚拟控制函数α1和α2的一阶导数。
8.根据权利要求7所述一种基于动态增益的自适应神经网络跟踪控制方法,其特征在于:所述步骤五中引入等价控制方向函数,定义需要依靠神经网络逼近的未知项F1和F2,改写步骤四中李雅普诺夫函数的一阶导数
Figure FDA00036248370300000210
具体过程为:
1)利用等价控制方向函数改写步骤四中李雅普诺夫函数的一阶导数
Figure FDA00036248370300000211
Figure FDA00036248370300000212
其中,b1和b2是等价控制方向函数;
2)定义需要依靠神经网络逼近的未知项
Figure FDA00036248370300000213
Figure FDA00036248370300000214
Figure FDA0003624837030000031
即:
Figure FDA0003624837030000032
9.根据权利要求8所述一种基于动态增益的自适应神经网络跟踪控制方法,其特征在于:所述步骤六中引入动态增益,根据步骤五中李雅普诺夫函数的一阶导数
Figure FDA0003624837030000033
利用反步法和自适应神经网络,设计神经网络权值更新律、虚拟控制函数α1和α2及控制输入u;具体过程为:
1)设计动态增益:
Figure FDA0003624837030000034
Figure FDA0003624837030000035
Figure FDA0003624837030000036
其中,
Figure FDA0003624837030000037
为动态增益,i=1,2,3;ki为控制器参数,i=1,2,3;li为控制器参数,i=1,2,3;
Figure FDA0003624837030000038
为控制器参数,i=1,2,3;
Figure FDA0003624837030000039
ki>Ii/4;
2)利用神经网络
Figure FDA00036248370300000310
Figure FDA00036248370300000311
分别逼近未知项F1和F2,W1、W2表示神经网络的权值向量,
Figure FDA00036248370300000312
Figure FDA00036248370300000313
表示实数,
Figure FDA00036248370300000314
表示神经网络的权值向量W1的元素,
Figure FDA00036248370300000315
表示表示神经网络的权值向量W2的元素,T表示转置,
Figure FDA00036248370300000316
为神经网络权值的更新律,S1(X1)、S2(X2)表示径向基函数向量,
Figure FDA00036248370300000317
Figure FDA00036248370300000318
Figure FDA00036248370300000319
表示向量S1(X1)的元素,
Figure FDA00036248370300000320
表示向量S2(X2)的元素,N1和N2表示神经网络的节点数,X1、X2为神经网络的输入,
Figure FDA00036248370300000321
Figure FDA00036248370300000322
Figure FDA00036248370300000323
为目标信号yd的二阶导数,径向基函数定义为:
Figure FDA00036248370300000324
Figure FDA00036248370300000325
其中,Cj和ηj分别是径向基函数的中心向量和宽度;
3)设计神经网络权值更新律:
Figure FDA0003624837030000041
Figure FDA0003624837030000042
其中,μ12∈(0,1)是学习律,
Figure FDA0003624837030000043
Figure FDA0003624837030000044
分别是指令滤波器的输出:
Figure FDA0003624837030000045
Figure FDA0003624837030000046
其中,
Figure FDA0003624837030000047
Figure FDA0003624837030000048
分别为指令滤波器的状态变量,ρ12>0是滤波器参数;
4)根据步骤五中李雅普诺夫函数的一阶导数
Figure FDA0003624837030000049
利用反步法和自适应神经网络,设计虚拟控制函数α1和α2
Figure FDA00036248370300000410
Figure FDA00036248370300000411
其中,
Figure FDA00036248370300000412
为期望的虚拟控制函数,ρα>0为滤波器参数;
5)设计控制信号u:
Figure FDA00036248370300000413
其中,τ为积分变量。
式(18)为基于动态增益的自适应神经网络跟踪控制器。
10.根据权利要求9所述一种基于动态增益的自适应神经网络跟踪控制方法,其特征在于:所述期望的虚拟控制函数
Figure FDA00036248370300000414
CN202210467223.3A 2022-04-29 2022-04-29 一种基于动态增益的自适应神经网络跟踪控制方法 Active CN114815618B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210467223.3A CN114815618B (zh) 2022-04-29 2022-04-29 一种基于动态增益的自适应神经网络跟踪控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210467223.3A CN114815618B (zh) 2022-04-29 2022-04-29 一种基于动态增益的自适应神经网络跟踪控制方法

Publications (2)

Publication Number Publication Date
CN114815618A true CN114815618A (zh) 2022-07-29
CN114815618B CN114815618B (zh) 2023-05-16

Family

ID=82509775

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210467223.3A Active CN114815618B (zh) 2022-04-29 2022-04-29 一种基于动态增益的自适应神经网络跟踪控制方法

Country Status (1)

Country Link
CN (1) CN114815618B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115373270A (zh) * 2022-08-29 2022-11-22 扬州大学 基于全状态约束mimo自适应事件触发控制方法及系统
CN115981165A (zh) * 2023-02-15 2023-04-18 杭州电子科技大学 一种高阶非严格反馈非线性系统全局自适应跟踪控制方法

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170139423A1 (en) * 2015-11-12 2017-05-18 King Fahd University Of Petroleum And Minerals Control system and method for multi-vehicle systems
CN107479384A (zh) * 2017-09-05 2017-12-15 西北工业大学 高超声速飞行器神经网络复合学习非反步控制方法
CN110376879A (zh) * 2019-08-16 2019-10-25 哈尔滨工业大学(深圳) 一种基于神经网络的pid型迭代学习控制方法
CN110515302A (zh) * 2019-08-13 2019-11-29 西安理工大学 一种液压位置伺服系统反步自适应神经网络控制方法
CN112859608A (zh) * 2021-01-13 2021-05-28 沈阳工程学院 一种基于rbf神经网络补偿的自适应动态面控制方法
CN112904726A (zh) * 2021-01-20 2021-06-04 哈尔滨工业大学 一种基于误差重构权重更新的神经网络反步控制方法
CN113031446A (zh) * 2021-03-15 2021-06-25 贵州大学 不确定时滞非线性系统非奇异性神经自适应跟踪控制方法
CN113325717A (zh) * 2021-06-10 2021-08-31 哈尔滨工业大学 基于互联大规模系统的最优容错控制方法、系统、处理设备、存储介质
CN114077192A (zh) * 2020-08-20 2022-02-22 南京工业大学 一种非线性系统输出反馈智能控制方法
CN114326405A (zh) * 2021-12-30 2022-04-12 哈尔滨工业大学 一种基于误差训练的神经网络反步控制方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170139423A1 (en) * 2015-11-12 2017-05-18 King Fahd University Of Petroleum And Minerals Control system and method for multi-vehicle systems
CN107479384A (zh) * 2017-09-05 2017-12-15 西北工业大学 高超声速飞行器神经网络复合学习非反步控制方法
CN110515302A (zh) * 2019-08-13 2019-11-29 西安理工大学 一种液压位置伺服系统反步自适应神经网络控制方法
CN110376879A (zh) * 2019-08-16 2019-10-25 哈尔滨工业大学(深圳) 一种基于神经网络的pid型迭代学习控制方法
CN114077192A (zh) * 2020-08-20 2022-02-22 南京工业大学 一种非线性系统输出反馈智能控制方法
CN112859608A (zh) * 2021-01-13 2021-05-28 沈阳工程学院 一种基于rbf神经网络补偿的自适应动态面控制方法
CN112904726A (zh) * 2021-01-20 2021-06-04 哈尔滨工业大学 一种基于误差重构权重更新的神经网络反步控制方法
CN113031446A (zh) * 2021-03-15 2021-06-25 贵州大学 不确定时滞非线性系统非奇异性神经自适应跟踪控制方法
CN113325717A (zh) * 2021-06-10 2021-08-31 哈尔滨工业大学 基于互联大规模系统的最优容错控制方法、系统、处理设备、存储介质
CN114326405A (zh) * 2021-12-30 2022-04-12 哈尔滨工业大学 一种基于误差训练的神经网络反步控制方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
HUIFANG MIN等: "Further Results on Adaptive Stabilization of High-Order Stochastic Nonlinear Systems Subject to Uncertainties" *
YUJIA WANG等: "Neural-network-based fault-tolerant control for nonlinear systems subjected to faults and saturations" *
张超,等: "小型航天器浸入与不变自适应反步姿态跟踪" *
胡超芳;高志飞;刘运兵;王娜;: "高超声速飞行器模糊自适应动态面容错控制" *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115373270A (zh) * 2022-08-29 2022-11-22 扬州大学 基于全状态约束mimo自适应事件触发控制方法及系统
CN115981165A (zh) * 2023-02-15 2023-04-18 杭州电子科技大学 一种高阶非严格反馈非线性系统全局自适应跟踪控制方法
CN115981165B (zh) * 2023-02-15 2023-12-26 杭州电子科技大学 一种高阶非严格反馈非线性系统全局自适应跟踪控制方法

Also Published As

Publication number Publication date
CN114815618B (zh) 2023-05-16

Similar Documents

Publication Publication Date Title
CN114815618A (zh) 一种基于动态增益的自适应神经网络跟踪控制方法
CN112904728B (zh) 一种基于改进型趋近律的机械臂滑模控制轨迹跟踪方法
Xu et al. Fixed time synchronization control for bilateral teleoperation mobile manipulator with nonholonomic constraint and time delay
CN110977988B (zh) 基于有限时间命令滤波的多关节机械臂阻抗控制方法
Rubio Modified optimal control with a backpropagation network for robotic arms
CN112987567B (zh) 非线性系统的固定时间自适应神经网络滑模控制方法
CN106774379B (zh) 一种智能超螺旋强鲁棒姿态控制方法
Yan et al. Barrier function-based adaptive neural network sliding mode control of autonomous surface vehicles
Du et al. Adaptive neural network output feedback control for a class of non-affine non-linear systems with unmodelled dynamics
Yu et al. H∞ tracking adaptive fuzzy integral sliding mode control for parallel manipulators
Choi et al. Minimal-approximation-based decentralized backstepping control of interconnected time-delay systems
CN110543184B (zh) 一种刚性飞行器的固定时间神经网络控制方法
CN107877511B (zh) 基于输出位置的多双连杆机械臂包含控制器及设计方法
Chow et al. Modeling of continuous time dynamical systems with input by recurrent neural networks
Yoo Adaptive neural output-feedback control for a class of non-linear systems with unknown time-varying delays
CN109108964B (zh) 一种基于自适应动态规划Nash博弈的空间机械臂协调控制方法
CN115047763A (zh) 一种多无人机系统的最小能量控制方法
CN111590561B (zh) 一种分布式机械臂系统鲁棒预设性能控制方法
Yoo et al. Decentralized low-complexity tracking of uncertain interconnected high-order nonlinear systems with unknown high powers
CN115016273A (zh) 一种单连杆机械手臂的预定义时间稳定控制方法及系统
Singh et al. Intelligent robust adaptive trajectory and force tracking controller for holonomic constrained nonholonomic mobile manipulators
Yang et al. Robust integral of neural network and sign of tracking error control of uncertain nonlinear affine systems using state and output feedback
Pham et al. Adaptive neural network sliding mode control for an unmanned surface vessels
Dyda et al. Neural network control system for underwater robots
Khalil Nonlinear Control: Adaptation and Learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant