CN112650233A - 死区限制下基于反步法与自适应动态规划的无人船轨迹跟踪最优控制方法 - Google Patents

死区限制下基于反步法与自适应动态规划的无人船轨迹跟踪最优控制方法 Download PDF

Info

Publication number
CN112650233A
CN112650233A CN202011484822.3A CN202011484822A CN112650233A CN 112650233 A CN112650233 A CN 112650233A CN 202011484822 A CN202011484822 A CN 202011484822A CN 112650233 A CN112650233 A CN 112650233A
Authority
CN
China
Prior art keywords
controller
optimal
unmanned ship
backstepping
unmanned
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011484822.3A
Other languages
English (en)
Other versions
CN112650233B (zh
Inventor
赵红
王宁
杨忱
高颖
李堃
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dalian Maritime University
Original Assignee
Dalian Maritime University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dalian Maritime University filed Critical Dalian Maritime University
Priority to CN202011484822.3A priority Critical patent/CN112650233B/zh
Publication of CN112650233A publication Critical patent/CN112650233A/zh
Application granted granted Critical
Publication of CN112650233B publication Critical patent/CN112650233B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • G05D1/0206Control of position or course in two dimensions specially adapted to water vehicles

Landscapes

  • Engineering & Computer Science (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明提供一种死区限制下基于反步法与自适应动态规划的无人船轨迹跟踪最优控制方法,包括:建立无人水面船数学模型,设定无人水面船的期望轨迹数学模型;基于设定的所述期望轨迹数学模型,引入控制器输入死区函数;基于引入控制器输入死区函数的期望轨迹数学模型,采用反步法设计无人船轨迹跟踪系统的虚拟控制器和反步控制器;基于设计的虚拟控制器和反步控制器,为无人船轨迹跟踪的剩余误差设计基于自适应动态规划的最优控制器,并与反步控制器一起作用于无人船,设计无人船的轨迹跟踪控制器;基于无人船的轨迹跟踪控制器,设计无人船轨迹跟踪最优控制率。本发明技术方案解决了现有技术未考虑控制器存在输入死区限制,使得跟踪效果变差的问题。

Description

死区限制下基于反步法与自适应动态规划的无人船轨迹跟踪 最优控制方法
技术领域
本发明涉及自适应动态规划与水面无人船的轨迹跟踪技术领域,具体而言,尤其涉及死区限制下基于反步法与自适应动态规划的无人船轨迹跟踪最优控制方法。
背景技术
如今人工智能技术已经广泛应用于控制领域,特别是无人船系统中。与传统船舶相比无人船可以很好的处理复杂多变的海上环境并且减少人为因素和不确定扰动的影响。强化学习是一个解决最优控制问题的高效的解决方法。它可以解决传统的最优控制问题中求解哈密尔顿-雅克比-贝尔曼方程不易的缺点。Werbos提出一种基于强化学习并使用演员-评论家神经网络的最优控制框架。通过使用演员-评论家神经网络可以逼近成本函数和控制策略,从而满足最优准则且避免了维数灾难问题。
执行器存在对小信号不灵敏的特性,需要对控制器提出一定的要求。当控制器中存在死区特性时,往往不能达到控制要求,因此,需要考虑在控制器存在饱和时的轨迹跟踪控制问题。同时当对系统的动态控制性能提出较高要求时,往往对控制的精度要求比较高,因此,需要考虑在控制器存在死区时系统的轨迹跟踪最优控制问题。
发明内容
根据上述提出的技术问题,而提供一种死区限制下基于反步法与自适应动态规划的无人船轨迹跟踪最优控制方法。本发明考虑控制器存在输入死区限制,当控制输入为小信号时,控制器不会因为输入死区特性使得跟踪效果变差,当需要提高系统的动态性能而对系统进行最优控制设计时,采用自适应动态规划的控制方法,使得系统的最优性能得到保证。
本发明采用的技术手段如下:
死区限制下基于反步法与自适应动态规划的无人船轨迹跟踪最优控制方法,包括如下步骤:
S1、建立无人水面船数学模型,设定无人水面船的期望轨迹数学模型;
S2、基于设定的所述期望轨迹数学模型,引入控制器输入死区函数;
S3、基于引入控制器输入死区函数的期望轨迹数学模型,采用反步法设计无人船轨迹跟踪系统的虚拟控制器和反步控制器;
S4、基于设计的虚拟控制器和反步控制器,为无人船轨迹跟踪的剩余误差设计基于自适应动态规划的最优控制器,并与反步控制器一起作用于无人船,设计无人船的轨迹跟踪控制器;
S5、基于无人船的轨迹跟踪控制器,设计无人船轨迹跟踪最优控制率。
进一步地,所述步骤S1具体包括:
S11、定义北东坐标系XOY和附体坐标系XBOBYB,将北东坐标系XOY视作惯性坐标系,取地球任一点O为坐标原点,OX指向正北,OY指向正东;将附体坐标系XBOBYB视作非惯性坐标系,船舶左右对称时,取其中心为坐标原点OB,OBXB轴沿着船舶中线指向船艏方向,OBYB轴垂直指向右舷;
S12、对无人水面船进行建模,得到如下船舶运动控制数学模型:
Figure BDA0002838750740000021
Figure BDA0002838750740000022
其中,η=[x,y,ψ]T表示北东坐标系下的船舶位置向量,x、y表示无人水面船运动位置矢量,ψ∈[0,2π]表示艏摇角;R(ψ)表示地球坐标系和船体坐标系之间的转换矩阵;
Figure BDA0002838750740000023
ν=[u,v,r]T表示附体坐标系下无人水面船运动的速度矢量,u、v、r分别表示其纵荡速度、横荡速度、艏摇速度;τ′=M-1τ,τ=[τuvr]T表示船舶控制输入向量,τu、τv、τr分别表示纵荡控制力、横荡控制力、艏摇控制力;f(v)表示系统动态向量,f(v)=-M-1(C(v)v+D(v)v),M(t)=MT(t)>0表示包含附加质量的惯性矩阵,C(v)表示斜对称矩阵,D(v)表示阻尼矩阵。
进一步地,所述步骤S2中,引入控制器输入死区函数,具体如下:
τ(μ)=βμ+h
其中,
Figure BDA0002838750740000031
令f(η,υ)=-C(υ)υ-D(υ)υ+h,得到:
Figure BDA0002838750740000032
进一步地,所述步骤S3具体包括:
S31、反步控制第一步,定义无人船的跟踪误差:
Figure BDA0002838750740000033
其中,ηd表示参考轨迹的位置矢量,α表示反步控制第一步设计的虚拟控制器,对z1求导得到:
Figure BDA0002838750740000034
S32、构建反步控制第一步的李雅普诺夫函数:
Figure BDA0002838750740000035
S33、对V1求导得到:
Figure BDA0002838750740000036
S34、根据李雅普诺夫稳定性判据,设计反步控制第一步的虚拟控制器:
Figure BDA0002838750740000037
进一步得出:
Figure BDA0002838750740000038
S35、反步控制第二步,根据z2=υ-α,对z2求导,得到:
Figure BDA0002838750740000041
其中,
Figure BDA0002838750740000042
S36、根据反步控制第二步设计两个控制器,具体为:
μ=μa*
其中,μa表示反步法第二步设计的反步控制器,μ*表示自适应动态规划所设计的最优控制器;进一步得到:
Figure BDA0002838750740000043
S37、构建反步控制第二步的李雅普诺夫函数:
Figure BDA0002838750740000044
S38、对V2求导得到:
Figure BDA0002838750740000045
使用杨式不等式,得到:
Figure BDA0002838750740000046
其中,
Figure BDA0002838750740000047
进一步得到:
Figure BDA0002838750740000048
S39、根据李雅普诺夫稳定性判据,设计反步控制第二步的反步控制器:
Figure BDA0002838750740000049
进一步得到:
Figure BDA00028387507400000410
Figure BDA00028387507400000411
Figure BDA00028387507400000412
则由上式得到:
Figure BDA00028387507400000413
进一步地,所述步骤S4具体为:
将步骤S3中定义无人船的跟踪误差z2记为剩余误差,并且令:
Figure BDA0002838750740000051
进一步地,所述步骤S5具体包括:
S51、在最优控制输入μ*作用下,将无人船剩余误差的动力学方程表示为:
Figure BDA0002838750740000052
S52、定义剩余误差系统的消耗函数:
Figure BDA0002838750740000053
其中,J*表示最优的消耗函数,Q∈R6×6,B∈R3×3
S53、根据最优控制理论并考虑上述消耗函数,建立剩余误差系统的Hamilton-Jacobi-Bellman方程:
Figure BDA0002838750740000054
其中,
Figure BDA0002838750740000055
记为消耗函数的梯度最优值;
S54、系统的最优消耗函数满足
Figure BDA0002838750740000056
根据
Figure BDA0002838750740000057
得到理想的最优控制器:
Figure BDA0002838750740000058
S55、将上述理想的最优控制器计算公式代入到Hamilton-Jacobi-Bellman方程,得到:
Figure BDA0002838750740000059
S56、使用Critic神经网络逼近最优的消耗函数J*,得到:
Figure BDA00028387507400000510
其中,W*∈RN记为理想的有界权重矢量||W*||≤bc,N表示神经元的数量,
Figure BDA0002838750740000061
表示高斯函数的基函数,且
Figure BDA0002838750740000062
ε*记为最优控制器下神经网络有界的逼近误差;
S57、取最优的消耗函数J*对z2的梯度,得到:
Figure BDA0002838750740000063
其中,
Figure BDA0002838750740000064
Figure BDA00028387507400000616
记为神经网络回归矢量与逼近误差对于z2的梯度;
S58、将步骤S56中得到的公式代入到步骤S54得到的理想最优控制器的公式中,得到最优的跟踪控制器,如下:
Figure BDA0002838750740000065
则由最优控制器计算出的HJB方程为:
Figure BDA0002838750740000066
其中,
Figure BDA0002838750740000067
S59、由于步骤S56得到的理想的Critic权重矢量W*实际上是未知的,因此,Critic神经网络使用
Figure BDA0002838750740000068
逼近系统的消耗函数J*得到:
Figure BDA0002838750740000069
其中,
Figure BDA00028387507400000610
是理想权重矢量W*的神经网络估计值,并且
Figure BDA00028387507400000611
则Critic神经网络实际逼近的最优控制器为:
Figure BDA00028387507400000612
因此,Critic神经网络实际逼近的HJB方程为:
Figure BDA00028387507400000613
S60、令
Figure BDA00028387507400000614
则根据梯度下降法可以设计
Figure BDA00028387507400000615
的更新率,如下:
Figure BDA0002838750740000071
较现有技术相比,本发明具有以下优点:
外界有较大的风浪流等干扰因素,因此无人船需要较大的控制输入来进行控制,本发明提供的死区限制下基于反步法与自适应动态规划的无人船轨迹跟踪最优控制方法,本发明考虑控制器存在输入死区限制,当控制输入为小信号时,控制器不会因为输入死区特性使得跟踪效果变差,当需要提高系统的动态性能而对系统进行最优控制设计时,采用自适应动态规划的控制方法,使得系统的最优性能得到保证,更加具有实际工程意义。
基于上述理由本发明可在自适应动态规划与水面无人船的轨迹跟踪等领域广泛推广。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做以简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明方法流程图。
图2为本发明实施例提供的无人船位置跟踪图。
图3为本发明实施例提供的无人船速度跟踪图。
图4为本发明实施例提供的无人船位置误差图。
图5为本发明实施例提供的无人船速度误差图。
图6为本发明实施例提供的无人船轨迹跟踪图。
图7为本发明实施例提供的Critic神经网络权重更新图。
图8为本发明实施例提供的无人船控制律图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
如图1所示,本发明提供了一种死区限制下基于反步法与自适应动态规划的无人船轨迹跟踪最优控制方法,包括如下步骤:
S1、建立无人水面船数学模型,设定无人水面船的期望轨迹数学模型;
具体实施时,作为本发明优选的实施方式,所述步骤S1具体包括:
S11、定义北东坐标系XOY和附体坐标系XBOBYB,将北东坐标系XOY视作惯性坐标系,取地球任一点O为坐标原点,OX指向正北,OY指向正东;将附体坐标系XBOBYB视作非惯性坐标系,船舶左右对称时,取其中心为坐标原点OB,OBXB轴沿着船舶中线指向船艏方向,OBYB轴垂直指向右舷;
S12、对无人水面船进行建模,得到如下船舶运动控制数学模型:
Figure BDA0002838750740000081
Figure BDA0002838750740000082
其中,η=[x,y,ψ]T表示北东坐标系下的船舶位置向量,x、y表示无人水面船运动位置矢量,ψ∈[0,2π]表示艏摇角;R(ψ)表示地球坐标系和船体坐标系之间的转换矩阵;
Figure BDA0002838750740000083
ν=[u,v,r]T表示附体坐标系下无人水面船运动的速度矢量,u、v、r分别表示其纵荡速度、横荡速度、艏摇速度;τ′=M-1τ,τ=[τuvr]T表示船舶控制输入向量,τu、τv、τr分别表示纵荡控制力、横荡控制力、艏摇控制力;f(v)表示系统动态向量,f(v)=-M-1(C(v)v+D(v)v),M(t)=MT(t)>0表示包含附加质量的惯性矩阵,C(v)表示斜对称矩阵,D(v)表示阻尼矩阵。
S2、基于设定的所述期望轨迹数学模型,引入控制器输入死区函数;
具体实施时,作为本发明优选的实施方式,所述步骤S2中,引入控制器输入死区函数,具体如下:
τ(μ)=βμ+h
其中,
Figure BDA0002838750740000091
令f(η,υ)=-C(υ)υ-D(υ)υ+h,得到:
Figure BDA0002838750740000092
S3、基于引入控制器输入死区函数的期望轨迹数学模型,采用反步法设计无人船轨迹跟踪系统的虚拟控制器和反步控制器;
具体实施时,作为本发明优选的实施方式,所述步骤S3具体包括:
S31、反步控制第一步,定义无人船的跟踪误差:
Figure BDA0002838750740000093
其中,ηd表示参考轨迹的位置矢量,α表示反步控制第一步设计的虚拟控制器,对z1求导得到:
Figure BDA0002838750740000094
S32、构建反步控制第一步的李雅普诺夫函数:
Figure BDA0002838750740000095
S33、对V1求导得到:
Figure BDA0002838750740000096
S34、根据李雅普诺夫稳定性判据,设计反步控制第一步的虚拟控制器:
Figure BDA0002838750740000101
进一步得出:
Figure BDA0002838750740000102
S35、反步控制第二步,根据z2=υ-α,对z2求导,得到:
Figure BDA0002838750740000103
其中,
Figure BDA0002838750740000104
S36、根据反步控制第二步设计两个控制器,具体为:
μ=μa*
其中,μa表示反步法第二步设计的反步控制器,μ*表示自适应动态规划所设计的最优控制器;进一步得到:
Figure BDA0002838750740000105
S37、构建反步控制第二步的李雅普诺夫函数:
Figure BDA0002838750740000106
S38、对V2求导得到:
Figure BDA0002838750740000107
使用杨式不等式,得到:
Figure BDA0002838750740000108
其中,
Figure BDA0002838750740000109
进一步得到:
Figure BDA00028387507400001010
S39、根据李雅普诺夫稳定性判据,设计反步控制第二步的反步控制器:
Figure BDA00028387507400001011
进一步得到:
Figure BDA00028387507400001012
Figure BDA0002838750740000111
Figure BDA0002838750740000112
则由上式得到:
Figure BDA0002838750740000113
S4、基于设计的虚拟控制器和反步控制器,为无人船轨迹跟踪的剩余误差设计基于自适应动态规划的最优控制器,并与反步控制器一起作用于无人船,设计无人船的轨迹跟踪控制器;
具体实施时,作为本发明优选的实施方式,所述步骤S4具体为:
将步骤S3中定义无人船的跟踪误差z2记为剩余误差,并且令:
Figure BDA0002838750740000114
S5、基于无人船的轨迹跟踪控制器,设计无人船轨迹跟踪最优控制率。
具体实施时,作为本发明优选的实施方式,所述步骤S5具体包括:
S51、在最优控制输入μ*作用下,将无人船剩余误差的动力学方程表示为:
Figure BDA0002838750740000115
S52、定义剩余误差系统的消耗函数:
Figure BDA0002838750740000116
其中,J*表示最优的消耗函数,Q∈R6×6,B∈R3×3
S53、根据最优控制理论并考虑上述消耗函数,建立剩余误差系统的Hamilton-Jacobi-Bellman方程:
Figure BDA0002838750740000117
其中,
Figure BDA0002838750740000121
记为消耗函数的梯度最优值;
S54、系统的最优消耗函数满足
Figure BDA0002838750740000122
根据
Figure BDA0002838750740000123
得到理想的最优控制器:
Figure BDA0002838750740000124
S55、将上述理想的最优控制器计算公式代入到Hamilton-Jacobi-Bellman方程,得到:
Figure BDA0002838750740000125
S56、使用Critic神经网络逼近最优的消耗函数J*,得到:
Figure BDA0002838750740000126
其中,W*∈RN记为理想的有界权重矢量||W*||≤bc,N表示神经元的数量,
Figure BDA0002838750740000127
表示高斯函数的基函数,且
Figure BDA0002838750740000128
ε*记为最优控制器下神经网络有界的逼近误差;
S57、取最优的消耗函数J*对z2的梯度,得到:
Figure BDA0002838750740000129
其中,
Figure BDA00028387507400001210
Figure BDA00028387507400001214
记为神经网络回归矢量与逼近误差对于z2的梯度;
S58、将步骤S56中得到的公式代入到步骤S54得到的理想最优控制器的公式中,得到最优的跟踪控制器,如下:
Figure BDA00028387507400001211
则由最优控制器计算出的HJB方程为:
Figure BDA00028387507400001212
其中,
Figure BDA00028387507400001213
S59、由于步骤S56得到的理想的Critic权重矢量W*实际上是未知的,因此,Critic神经网络使用
Figure BDA0002838750740000131
逼近系统的消耗函数J*得到:
Figure BDA0002838750740000132
其中,
Figure BDA0002838750740000133
是理想权重矢量W*的神经网络估计值,并且
Figure BDA0002838750740000134
则Critic神经网络实际逼近的最优控制器为:
Figure BDA0002838750740000135
因此,Critic神经网络实际逼近的HJB方程为:
Figure BDA0002838750740000136
S60、令
Figure BDA0002838750740000137
则根据梯度下降法可以设计
Figure BDA0002838750740000138
的更新率,如下:
Figure BDA0002838750740000139
为了验证本发明方法的有效性,进行了仿真实验,从附图2-8可以看出本发明方法跟踪的优越性,图2为无人船位置跟踪图,可以看出船舶在有限时间跟踪上参考轨迹;图3为无人船速度跟踪图,可见虽然前期的速度有波动,但是在有限时间内也达到跟踪效果。图4和图5分别是位置误差与速度误差,从这两个误差图中可以看出误差最终在0附近波动,可以满足无人船系统良好的跟踪效果。图6为无人船轨迹跟踪图,船舶的参考轨迹几乎为一个圆,可以看出跟踪效果很好。图7为Critic神经网络权重更新图,可见船舶在短时间内进行训练然后达到稳定,达到跟踪效果;图8为无人船控制律图,可见船舶所设计的控制器满足有限时间的要求,达到了很好的控制效果。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (6)

1.死区限制下基于反步法与自适应动态规划的无人船轨迹跟踪最优控制方法,其特征在于,包括如下步骤:
S1、建立无人水面船数学模型,设定无人水面船的期望轨迹数学模型;
S2、基于设定的所述期望轨迹数学模型,引入控制器输入死区函数;
S3、基于引入控制器输入死区函数的期望轨迹数学模型,采用反步法设计无人船轨迹跟踪系统的虚拟控制器和反步控制器;
S4、基于设计的虚拟控制器和反步控制器,为无人船轨迹跟踪的剩余误差设计基于自适应动态规划的最优控制器,并与反步控制器一起作用于无人船,设计无人船的轨迹跟踪控制器;
S5、基于无人船的轨迹跟踪控制器,设计无人船轨迹跟踪最优控制率。
2.根据权利要求1所述的无人船轨迹跟踪最优控制方法,其特征在于,所述步骤S1具体包括:
S11、定义北东坐标系XOY和附体坐标系XBOBYB,将北东坐标系XOY视作惯性坐标系,取地球任一点O为坐标原点,OX指向正北,OY指向正东;将附体坐标系XBOBYB视作非惯性坐标系,船舶左右对称时,取其中心为坐标原点OB,OBXB轴沿着船舶中线指向船艏方向,OBYB轴垂直指向右舷;
S12、对无人水面船进行建模,得到如下船舶运动控制数学模型:
Figure FDA0002838750730000011
Figure FDA0002838750730000012
其中,η=[x,y,ψ]T表示北东坐标系下的船舶位置向量,x、y表示无人水面船运动位置矢量,ψ∈[0,2π]表示艏摇角;R(ψ)表示地球坐标系和船体坐标系之间的转换矩阵;
Figure FDA0002838750730000013
ν=[u,v,r]T表示附体坐标系下无人水面船运动的速度矢量,u、v、r分别表示其纵荡速度、横荡速度、艏摇速度;τ′=M-1τ,τ=[τuvr]T表示船舶控制输入向量,τu、τv、τr分别表示纵荡控制力、横荡控制力、艏摇控制力;f(v)表示系统动态向量,f(v)=-M-1(C(v)v+D(v)v),M(t)=MT(t)>0表示包含附加质量的惯性矩阵,C(v)表示斜对称矩阵,D(v)表示阻尼矩阵。
3.根据权利要求1所述的无人船轨迹跟踪最优控制方法,其特征在于,所述步骤S2中,引入控制器输入死区函数,具体如下:
τ(μ)=βμ+h
其中,
Figure FDA0002838750730000021
令f(η,υ)=-C(υ)υ-D(υ)υ+h,得到:
Figure FDA0002838750730000022
4.根据权利要求1所述的无人船轨迹跟踪最优控制方法,其特征在于,所述步骤S3具体包括:
S31、反步控制第一步,定义无人船的跟踪误差:
Figure FDA0002838750730000023
其中,ηd表示参考轨迹的位置矢量,α表示反步控制第一步设计的虚拟控制器,对z1求导得到:
Figure FDA0002838750730000024
S32、构建反步控制第一步的李雅普诺夫函数:
Figure FDA0002838750730000025
S33、对V1求导得到:
Figure FDA0002838750730000026
S34、根据李雅普诺夫稳定性判据,设计反步控制第一步的虚拟控制器:
Figure FDA0002838750730000027
进一步得出:
Figure FDA0002838750730000028
S35、反步控制第二步,根据z2=υ-α,对z2求导,得到:
Figure FDA0002838750730000031
其中,
Figure FDA0002838750730000032
S36、根据反步控制第二步设计两个控制器,具体为:
μ=μa*
其中,μa表示反步法第二步设计的反步控制器,μ*表示自适应动态规划所设计的最优控制器;进一步得到:
Figure FDA0002838750730000033
S37、构建反步控制第二步的李雅普诺夫函数:
Figure FDA0002838750730000034
S38、对V2求导得到:
Figure FDA0002838750730000035
使用杨式不等式,得到:
Figure FDA0002838750730000036
其中,
Figure FDA0002838750730000037
进一步得到:
Figure FDA0002838750730000038
S39、根据李雅普诺夫稳定性判据,设计反步控制第二步的反步控制器:
Figure FDA0002838750730000039
进一步得到:
Figure FDA00028387507300000310
Figure FDA00028387507300000311
Figure FDA00028387507300000312
则由上式得到:
Figure FDA00028387507300000313
5.根据权利要求1所述的无人船轨迹跟踪最优控制方法,其特征在于,所述步骤S4具体为:
将步骤S3中定义无人船的跟踪误差z2记为剩余误差,并且令:
Figure FDA0002838750730000041
6.根据权利要求1所述的无人船轨迹跟踪最优控制方法,其特征在于,所述步骤S5具体包括:
S51、在最优控制输入μ*作用下,将无人船剩余误差的动力学方程表示为:
Figure FDA0002838750730000042
S52、定义剩余误差系统的消耗函数:
Figure FDA0002838750730000043
其中,J*表示最优的消耗函数,Q∈R6×6,B∈R3×3
S53、根据最优控制理论并考虑上述消耗函数,建立剩余误差系统的Hamilton-Jacobi-Bellman方程:
Figure FDA0002838750730000044
其中,
Figure FDA0002838750730000045
记为消耗函数的梯度最优值;
S54、系统的最优消耗函数满足
Figure FDA0002838750730000046
根据
Figure FDA0002838750730000047
得到理想的最优控制器:
Figure FDA0002838750730000048
S55、将上述理想的最优控制器计算公式代入到Hamilton-Jacobi-Bellman方程,得到:
Figure FDA0002838750730000049
S56、使用Critic神经网络逼近最优的消耗函数J*,得到:
Figure FDA0002838750730000051
其中,W*∈RN记为理想的有界权重矢量||W*||≤bc,N表示神经元的数量,
Figure FDA0002838750730000052
表示高斯函数的基函数,且
Figure FDA0002838750730000053
ε*记为最优控制器下神经网络有界的逼近误差;
S57、取最优的消耗函数J*对z2的梯度,得到:
Figure FDA0002838750730000054
其中,
Figure FDA0002838750730000055
Figure FDA0002838750730000056
记为神经网络回归矢量与逼近误差对于z2的梯度;
S58、将步骤S56中得到的公式代入到步骤S54得到的理想最优控制器的公式中,得到最优的跟踪控制器,如下:
Figure FDA0002838750730000057
则由最优控制器计算出的HJB方程为:
Figure FDA0002838750730000058
其中,
Figure FDA0002838750730000059
S59、由于步骤S56得到的理想的Critic权重矢量W*实际上是未知的,因此,Critic神经网络使用
Figure FDA00028387507300000510
逼近系统的消耗函数J*得到:
Figure FDA00028387507300000511
其中,
Figure FDA00028387507300000512
是理想权重矢量W*的神经网络估计值,并且
Figure FDA00028387507300000513
则Critic神经网络实际逼近的最优控制器为:
Figure FDA00028387507300000514
因此,Critic神经网络实际逼近的HJB方程为:
Figure FDA0002838750730000061
S60、令
Figure FDA0002838750730000062
则根据梯度下降法可以设计
Figure FDA0002838750730000063
的更新率,如下:
Figure FDA0002838750730000064
CN202011484822.3A 2020-12-15 2020-12-15 无人船轨迹跟踪最优控制方法 Active CN112650233B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011484822.3A CN112650233B (zh) 2020-12-15 2020-12-15 无人船轨迹跟踪最优控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011484822.3A CN112650233B (zh) 2020-12-15 2020-12-15 无人船轨迹跟踪最优控制方法

Publications (2)

Publication Number Publication Date
CN112650233A true CN112650233A (zh) 2021-04-13
CN112650233B CN112650233B (zh) 2023-11-10

Family

ID=75354264

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011484822.3A Active CN112650233B (zh) 2020-12-15 2020-12-15 无人船轨迹跟踪最优控制方法

Country Status (1)

Country Link
CN (1) CN112650233B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113791614A (zh) * 2021-08-19 2021-12-14 广州大学 非完整轮式机器人的控制方法、系统、装置及存储介质
CN114442640A (zh) * 2022-02-28 2022-05-06 哈尔滨理工大学 一种水面无人艇轨迹跟踪控制方法
CN116690561A (zh) * 2023-05-30 2023-09-05 渤海大学 一种用于单连杆机械臂的自适应最优反步控制方法及系统
CN116819973A (zh) * 2023-08-29 2023-09-29 北京成功领行汽车技术有限责任公司 一种轨迹跟踪控制方法

Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150045223A (ko) * 2013-10-18 2015-04-28 한국전기연구원 백스테핑 적응 제어 방법을 이용한 권선형 유도발전기 제어 방법 및 장치
CN105204343A (zh) * 2015-10-13 2015-12-30 淮阴工学院 具有输出约束和非对称死区输入的纳米机电系统自适应backstepping控制方法
US20160299507A1 (en) * 2015-04-08 2016-10-13 University Of Maryland, College Park Surface vehicle trajectory planning systems, devices, and methods
KR20170071440A (ko) * 2015-12-15 2017-06-23 성균관대학교산학협력단 파라미터 적응형 백스테핑 제어 auv 시스템
US20170277189A1 (en) * 2013-01-31 2017-09-28 Flir Systems, Inc. Adaptive autopilot control systems and methods
CN108170151A (zh) * 2017-07-24 2018-06-15 西北工业大学 一种水下机器人的自适应运动控制装置及其方法
CN108638068A (zh) * 2018-05-18 2018-10-12 华南理工大学 一种携带冗余度机械臂的飞行机器人控制系统设计方法
CN109189071A (zh) * 2018-09-25 2019-01-11 大连海事大学 基于模糊观测器的鲁棒自适应无人船路径跟踪控制方法
CN109857124A (zh) * 2019-03-22 2019-06-07 大连海事大学 基于速度与航向双重制导的无人船精确路径跟踪控制方法
CN109901605A (zh) * 2019-04-11 2019-06-18 大连海事大学 一种四旋翼飞行器跟踪无人水面船的控制方法
CN110018687A (zh) * 2019-04-09 2019-07-16 大连海事大学 基于强化学习方法的无人水面船最优轨迹跟踪控制方法
CN110162039A (zh) * 2019-05-09 2019-08-23 大连海事大学 一种新型综合船舶路径跟踪与减横摇优化控制方法
CN110311607A (zh) * 2019-07-24 2019-10-08 大连海事大学 一种反步滑模最大波能捕获方法
CN110362110A (zh) * 2019-07-12 2019-10-22 西北工业大学 一种固定时自适应神经网络无人机航迹角控制方法
CN110362089A (zh) * 2019-08-02 2019-10-22 大连海事大学 一种基于深度强化学习和遗传算法的无人船自主导航的方法
CN110456636A (zh) * 2019-07-11 2019-11-15 西北工业大学 基于不确定性上界估计的飞行器离散滑模自适应控制方法
CN111562794A (zh) * 2020-04-08 2020-08-21 中南大学 执行器故障和输入量化的航天器姿态控制方法
CN111880546A (zh) * 2020-08-11 2020-11-03 大连海事大学 一种基于自适应动态规划算法的虚拟引导船舶自动靠泊控制方法

Patent Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170277189A1 (en) * 2013-01-31 2017-09-28 Flir Systems, Inc. Adaptive autopilot control systems and methods
KR20150045223A (ko) * 2013-10-18 2015-04-28 한국전기연구원 백스테핑 적응 제어 방법을 이용한 권선형 유도발전기 제어 방법 및 장치
US20160299507A1 (en) * 2015-04-08 2016-10-13 University Of Maryland, College Park Surface vehicle trajectory planning systems, devices, and methods
CN105204343A (zh) * 2015-10-13 2015-12-30 淮阴工学院 具有输出约束和非对称死区输入的纳米机电系统自适应backstepping控制方法
KR20170071440A (ko) * 2015-12-15 2017-06-23 성균관대학교산학협력단 파라미터 적응형 백스테핑 제어 auv 시스템
CN108170151A (zh) * 2017-07-24 2018-06-15 西北工业大学 一种水下机器人的自适应运动控制装置及其方法
CN108638068A (zh) * 2018-05-18 2018-10-12 华南理工大学 一种携带冗余度机械臂的飞行机器人控制系统设计方法
CN109189071A (zh) * 2018-09-25 2019-01-11 大连海事大学 基于模糊观测器的鲁棒自适应无人船路径跟踪控制方法
CN109857124A (zh) * 2019-03-22 2019-06-07 大连海事大学 基于速度与航向双重制导的无人船精确路径跟踪控制方法
CN110018687A (zh) * 2019-04-09 2019-07-16 大连海事大学 基于强化学习方法的无人水面船最优轨迹跟踪控制方法
CN109901605A (zh) * 2019-04-11 2019-06-18 大连海事大学 一种四旋翼飞行器跟踪无人水面船的控制方法
CN110162039A (zh) * 2019-05-09 2019-08-23 大连海事大学 一种新型综合船舶路径跟踪与减横摇优化控制方法
CN110456636A (zh) * 2019-07-11 2019-11-15 西北工业大学 基于不确定性上界估计的飞行器离散滑模自适应控制方法
CN110362110A (zh) * 2019-07-12 2019-10-22 西北工业大学 一种固定时自适应神经网络无人机航迹角控制方法
CN110311607A (zh) * 2019-07-24 2019-10-08 大连海事大学 一种反步滑模最大波能捕获方法
CN110362089A (zh) * 2019-08-02 2019-10-22 大连海事大学 一种基于深度强化学习和遗传算法的无人船自主导航的方法
CN111562794A (zh) * 2020-04-08 2020-08-21 中南大学 执行器故障和输入量化的航天器姿态控制方法
CN111880546A (zh) * 2020-08-11 2020-11-03 大连海事大学 一种基于自适应动态规划算法的虚拟引导船舶自动靠泊控制方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
丁宁: "小型水下航行器航迹跟踪控制研究", 中国优秀硕士学位论文全文数据库 *
戴巧莲: "具有死区特性的空间机器人基于干扰观测器的L2反步控制", 空间科学学报 *
沈智鹏;张晓玲;张宁;郭戈;: "基于神经网络观测器的船舶轨迹跟踪递归滑模动态面输出反馈控制", 控制理论与应用, no. 08 *
王宁: "一种小型无人船导航- 制导- 控制系统设计与验证", 大连海事大学学报 *
赵红,赵德润,王宁,郭晨: "改进型BINN算法应用在无人船优先区域覆盖路径规划的研究", 中国造船 *
魏斯行: "基于反步控制和神经动力学模型的带缆水下潜器航迹跟踪", 舰船科学技术 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113791614A (zh) * 2021-08-19 2021-12-14 广州大学 非完整轮式机器人的控制方法、系统、装置及存储介质
CN114442640A (zh) * 2022-02-28 2022-05-06 哈尔滨理工大学 一种水面无人艇轨迹跟踪控制方法
CN116690561A (zh) * 2023-05-30 2023-09-05 渤海大学 一种用于单连杆机械臂的自适应最优反步控制方法及系统
CN116690561B (zh) * 2023-05-30 2024-01-23 渤海大学 一种用于单连杆机械臂的自适应最优反步控制方法及系统
CN116819973A (zh) * 2023-08-29 2023-09-29 北京成功领行汽车技术有限责任公司 一种轨迹跟踪控制方法
CN116819973B (zh) * 2023-08-29 2023-12-12 北京成功领行汽车技术有限责任公司 一种轨迹跟踪控制方法

Also Published As

Publication number Publication date
CN112650233B (zh) 2023-11-10

Similar Documents

Publication Publication Date Title
CN110018687B (zh) 基于强化学习方法的无人水面船最优轨迹跟踪控制方法
CN112650233A (zh) 死区限制下基于反步法与自适应动态规划的无人船轨迹跟踪最优控制方法
CN111679585B (zh) 一种具有输入饱和受限的无人船强化学习自适应跟踪控制方法
CN108008628B (zh) 一种不确定欠驱动无人艇系统的预设性能控制方法
CN111308890B (zh) 一种带有指定性能的无人船数据驱动强化学习控制方法
CN109901403A (zh) 一种自主水下机器人神经网络s面控制方法
CN111290270B (zh) 一种基于Q-learning参数自适应技术的水下机器人反步速度和艏向控制方法
CN111240344B (zh) 基于强化学习技术的自主水下机器人无模型控制方法
CN111240345A (zh) 一种基于双bp网络增强学习框架的水下机器人轨迹跟踪方法
CN112859889B (zh) 基于自适应动态规划的自主式水下机器人控制方法和系统
CN112462792A (zh) 一种基于Actor-Critic算法的水下机器人运动控制方法
CN111880546A (zh) 一种基于自适应动态规划算法的虚拟引导船舶自动靠泊控制方法
Gao et al. Online optimal control for dynamic positioning of vessels via time-based adaptive dynamic programming
CN111176122A (zh) 一种基于双bp神经网络q学习技术的水下机器人参数自适应反步控制方法
Jiang et al. Neural network based adaptive sliding mode tracking control of autonomous surface vehicles with input quantization and saturation
CN114527795B (zh) 一种基于增量在线学习的飞行器智能控制方法
CN114089749A (zh) 无人艇运动控制抗扰控制器及方法
Liu et al. Event-triggered predefined-time H∞ formation control for multiple underactuated surface vessels with error constraints and input quantization
CN114237268A (zh) 一种基于深度强化学习的无人机强鲁棒姿态控制方法
Wang et al. Direct adaptive neural network control for ship manoeuvring modelling group model-based uncertain nonlinear systems in non-affine pure-feedback form
CN112327638B (zh) 一种具有指定性能并带有输入饱和限制的无人船轨迹跟踪最优控制方法
CN112558465B (zh) 一种带有输入限制的未知无人船有限时间强化学习控制方法
CN114578819B (zh) 一种基于人工势场法的多水面船分布式编队的控制方法
Wang et al. Course tracking control for smart ships based on a deep deterministic policy gradient-based algorithm
CN113189867B (zh) 一种考虑位姿与速度受限的无人船自学习最优跟踪控制方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant