CN111679585B - 一种具有输入饱和受限的无人船强化学习自适应跟踪控制方法 - Google Patents

一种具有输入饱和受限的无人船强化学习自适应跟踪控制方法 Download PDF

Info

Publication number
CN111679585B
CN111679585B CN202010638107.4A CN202010638107A CN111679585B CN 111679585 B CN111679585 B CN 111679585B CN 202010638107 A CN202010638107 A CN 202010638107A CN 111679585 B CN111679585 B CN 111679585B
Authority
CN
China
Prior art keywords
function
representing
ship
follows
unmanned
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010638107.4A
Other languages
English (en)
Other versions
CN111679585A (zh
Inventor
王宁
李堃
高颖
沈士为
杨忱
薛皓原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dalian Maritime University
Original Assignee
Dalian Maritime University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dalian Maritime University filed Critical Dalian Maritime University
Priority to CN202010638107.4A priority Critical patent/CN111679585B/zh
Publication of CN111679585A publication Critical patent/CN111679585A/zh
Application granted granted Critical
Publication of CN111679585B publication Critical patent/CN111679585B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T90/00Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明针对无人水面船系统,提供了一种具有输入饱和受限的无人船强化学习自适应跟踪控制方法,本发明方法,包括:建立无人水面船数学模型,设定无人水面船的期望轨迹数学模型;基于设定的期望轨迹数学模型,引入控制器输入饱和函数;基于引入控制器输入饱和函数的期望轨迹数学模型,设计无人船控制率;基于设计的无人船控制率,设计神经网络权重更新率。同时,本发明方法考虑控制器存在输入饱和限制,当外界干扰过大时,控制器不会因为输入饱和特性使得跟踪效果变差,更加具有实际工程意义。

Description

一种具有输入饱和受限的无人船强化学习自适应跟踪控制 方法
技术领域
本发明涉及强化学习与水面无人船的轨迹跟踪技术领域,具体而言,尤其涉及一种具有输入饱和受限的无人船强化学习自适应跟踪控制方法。
背景技术
水面无人船是具有自主导航能力,并且可自主实现环境感知、目标探测等任务的智能化、无人化水面平台,其最主要的特征便是欠驱动性,即利用两个独立的输入端同时控制三个自由渡的运动;欠驱动系统能够通过较少的驱动器来完成复杂的控制任务,不仅能够降低成本,简化控制系统结构,同事也能提高系统的可靠性与易维护性;但是在对水面无人船的跟踪控制方面仍然存在一些问题,例如:当外界存在较大的风浪流等干扰时,控制器需要较大的值来克服干扰。但当控制器中存在饱和特性时,往往不能达到控制要求,因此需要考虑在控制器存在饱和时的轨迹跟踪控制问题。
发明内容
根据上述提出的技术问题,而提供一种具有输入饱和受限的无人船强化学习自适应跟踪控制方法。本发明考虑了控制器存在输入饱和限制,当外界干扰过大时,控制器不会因为输入饱和特性使得跟踪效果变差。
本发明采用的技术手段如下:
一种具有输入饱和受限的无人船强化学习自适应跟踪控制方法,所述方法包括:
建立无人水面船数学模型,设定无人水面船的期望轨迹数学模型;
基于设定的期望轨迹数学模型,引入控制器输入饱和函数;
基于引入控制器输入饱和函数的期望轨迹数学模型,设计无人船控制率;
基于设计的无人船控制率,设计神经网络权重更新率。
进一步地,所述建立无人水面船数学模型,设定无人水面船的期望轨迹数学模型;包括:
定义北东坐标系OX0Y0Z0和附体坐标系BXYZ两个坐标系;
将北东坐标系(OX0Y0Z0)视作惯性坐标系,取地球任一点O为坐标原点,OX0指向正北,OY0指向正东,OZ0指向地球球心;
将附体坐标系BXYZ视作非惯性坐标系,船舶左右对称时,取其中心为坐标原点B,BX轴沿着船舶中线指向船艏方向,BY轴垂直指向右舷,BZ轴沿XY平面垂直指向下;
对无人水面船进行建模,得到如下船舶运动控制数学模型:
Figure BDA0002570231550000021
Figure BDA0002570231550000022
其中,η=[x,y,ψ]T表示北东坐标系下的船舶位置向量,x、y表示无人水面船运动的北东位置,ψ∈[0,2π]表示艏摇角;R(ψ)表示地球坐标系和船体坐标系之间的转换矩阵;ν=[u,v,r]T表示附体坐标系下无人水面船运动的速度向量,u、v、r分别表示其纵荡速度、横荡速度、艏摇速度;τ′=M-1τ,τ=[τuvr]T表示船舶控制输入向量,τu、τv、τr分别表示纵荡控制力、横荡控制力、艏摇控制力;f(v)表示系统动态向量,f(v)=-M-1(C(v)v+D(v)v),M(t)=MT(t)>0表示包含附加质量的惯性矩阵,C(v)表示斜对称矩阵,D(v)表示阻尼矩阵;
设定无人水面船的期望轨迹数学模型如下:
Figure BDA0002570231550000023
其中,xd=[ηd T,vd T]T,ηd=[xd,ydd]T和νd=[ud,vd,rd]T分别是无人水面船跟踪的期望位置向量及速度向量。
进一步地,所述基于设定的期望轨迹数学模型,引入控制器输入饱和函数,包括:
引入控制器输入饱和函数,其表达式如下:
Figure BDA0002570231550000024
其中,μi表示控制输入;τi,M是τi的界,τi表示具有饱和特性的控制输入;sat(μi)是μi的饱和函数;
将上述sat(μi)函数逼近为一个光滑的函数,如下表示:
Figure BDA0002570231550000031
则引入的控制器输入饱和函数最终表示如下:
sat(μi)=J(μi)+ρ(μi)
其中,ρ(μi)表示有界函数,J(μi)表示饱和函数的逼近函数。
进一步地,所述基于引入控制器输入饱和函数的期望轨迹数学模型,设计无人船控制率,包括:
构建成本函数,如下:
Figure BDA0002570231550000032
其中,t表示时间;γ表示折扣因子;z表示跟踪误差;e表示指数函数,
Figure BDA0002570231550000033
ηe表示位置误差,ηe=η-ηd,η表示船舶实际位置,ηd表示船舶参考位置;ve表示速度误差,ve=v-vd-h,v表示船舶实际速度,vd表示船舶参考速度,h表示辅助变量,满足
Figure BDA0002570231550000034
μ表示控制输入;
构建无人船轨迹跟踪动态,如下:
Figure BDA0002570231550000035
其中,
Figure BDA0002570231550000036
RT表示转换矩阵,hT表示辅助变量的转置,fT(η,v)表示系统动态向量,
Figure BDA0002570231550000037
表示参考系统的动态向量;
Figure BDA0002570231550000038
μ*表示最优控制率;
定义最优成本函数,如下:
Figure BDA0002570231550000039
其中,r(e,μ*)=eTΛee+μ*TΛμμ*,Λeμ均为正定矩阵;eT表示误差的转置;
根据上述定义的最优成本函数,得到哈密尔顿-雅克比-贝尔曼方程,如下:
Figure BDA00025702315500000310
其中,
Figure BDA00025702315500000311
表示成本函数的梯度;
得到无人船最优控制率,如下:
Figure BDA00025702315500000312
进一步地,所述基于设计的无人船控制率,设计神经网络权重更新率,包括:
根据前馈神经网络的全局逼近特性,将最优代价函数表示为:
Figure BDA0002570231550000041
其中,
Figure BDA0002570231550000042
表示评判器神经网络理想的权重向量,N表示神经元的个数,
Figure BDA0002570231550000043
表示神经网络输入向量基函数,εc表示有界神经网络函数逼近误差;
设计所述最优成本函数的逼近函数,表示如下:
Figure BDA0002570231550000044
其中,
Figure BDA0002570231550000045
表示
Figure BDA0002570231550000046
的估计;
Figure BDA0002570231550000047
表示基函数;
基于上述设计的逼近函数,得到哈密尔顿-雅克比-贝尔曼方程,如下:
Figure BDA0002570231550000048
则最优控制器为:
Figure BDA0002570231550000049
其中,
Figure BDA00025702315500000410
表示
Figure BDA00025702315500000411
的估计,通过梯度下降方法得到:
Figure BDA00025702315500000412
其中,Γc表示正定矩阵;
Figure BDA00025702315500000413
计算演员更新率
Figure BDA00025702315500000414
其计算公式如下:
Figure BDA00025702315500000415
其中,ka为常数,
Figure BDA00025702315500000416
Γa为正定矩阵。
与现有的技术相比,本方案的有益效果主要体现在:
无人船舶行驶在恶劣的环境中,如北极航道。外界有较大的风浪流等干扰因素,因此无人船需要较大的控制输入来进行控制,本方案考虑控制器存在输入饱和限制,当外界干扰过大时,控制器不会因为输入饱和特性使得跟踪效果变差,更加具有实际工程意义。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做以简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明方法流程图。
图2为本发明无人船位置跟踪图。
图3为本发明无人船速度跟踪图。
图4为本发明无人船位置误差图。
图5为本发明无人船速度误差图。
图6为本发明无人船轨迹跟踪图。
图7为本发明评论家神经网络权重更新图。
图8为本发明演员神经网络权重更新图。
图9为本发明无人船控制律图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
如图1所示,本发明提供了一种具有输入饱和受限的无人船强化学习自适应跟踪控制方法,包括如下步骤:
S1、建立无人水面船数学模型,设定无人水面船的期望轨迹数学模型;具体包括:
S11、定义北东坐标系OX0Y0Z0和附体坐标系BXYZ两个坐标系;
S12、将北东坐标系(OX0Y0Z0)视作惯性坐标系,取地球任一点O为坐标原点,OX0指向正北,OY0指向正东,OZ0指向地球球心;
S13、将附体坐标系BXYZ视作非惯性坐标系,船舶左右对称时,取其中心为坐标原点B,BX轴沿着船舶中线指向船艏方向,BY轴垂直指向右舷,BZ轴沿XY平面垂直指向下;
S14、对无人水面船进行建模,得到如下船舶运动控制数学模型:
Figure BDA0002570231550000061
Figure BDA0002570231550000062
其中,η=[x,y,ψ]T表示北东坐标系下的船舶位置向量,x、y表示无人水面船运动的北东位置,ψ∈[0,2π]表示艏摇角;R(ψ)表示地球坐标系和船体坐标系之间的转换矩阵;ν=[u,v,r]T表示附体坐标系下无人水面船运动的速度向量,u、v、r分别表示其纵荡速度、横荡速度、艏摇速度;τ′=M-1τ,τ=[τuvr]T表示船舶控制输入向量,τu、τv、τr分别表示纵荡控制力、横荡控制力、艏摇控制力;f(v)表示系统动态向量,f(v)=-M-1(C(v)v+D(v)v),M(t)=MT(t)>0表示包含附加质量的惯性矩阵,C(v)表示斜对称矩阵,D(v)表示阻尼矩阵;
S15、设定无人水面船的期望轨迹数学模型如下:
Figure BDA0002570231550000063
其中,xd=[ηd T,vd T]Tηd=[xd,ydd]T和νd=[ud,vd,rd]T分别是无人水面船跟踪的期望位置向量及速度向量。
S2、基于设定的期望轨迹数学模型,引入控制器输入饱和函数;具体包括:
S21、引入控制器输入饱和函数,其表达式如下:
Figure BDA0002570231550000064
其中,μi表示控制输入;τi,M是τi的界,τi表示含有输入饱和的控制输入;sat(μi)是μi的饱和函数;
S22、将上述sat(μi)函数逼近为一个光滑的函数,如下表示:
Figure BDA0002570231550000071
S23、引入的控制器输入饱和函数最终表示如下:
sat(μi)=J(μi)+ρ(μi)
其中,ρ(μi)表示有界函数,J(μi)表示输入饱和函数的逼近函数。
S3、基于设定的期望轨迹数学模型,引入控制器输入饱和函数;具体包括:
S31、构建成本函数,如下:
Figure BDA0002570231550000072
其中,t表示时间;γ表示折扣因子;z表示误差;e表示指数函数,
Figure BDA0002570231550000073
ηe表示位置误差,ηe=η-ηd,η表示船舶实际位置,ηd表示船舶参考位置;ve表示速度误差,ve=v-vd-h,v表示船舶实际速度,vd表示船舶参考速度,h表示辅助变量,满足
Figure BDA0002570231550000074
μ表示控制输入;
S32、构建无人船轨迹跟踪动态,如下:
Figure BDA0002570231550000075
其中,
Figure BDA0002570231550000076
ve表示速度误差,RT表示转换矩阵的转置,hT表示辅助变量的转置,fT(η,v)表示系统动态信息,
Figure BDA0002570231550000077
表示参考系统动态信息;
Figure BDA0002570231550000078
μ*表示最优控制率;
S33、定义最优成本函数,如下:
Figure BDA0002570231550000079
其中,r(e,μ*)=eTΛee+μ*TΛμμ*,Λeμ均为正定矩阵;eT表示误差的转置;
S34、根据上述定义的最优成本函数,得到哈密尔顿-雅克比-贝尔曼方程,如下:
Figure BDA00025702315500000710
其中,
Figure BDA00025702315500000711
表示成本函数的梯度;
S35、得到无人船最优控制率,如下:
Figure BDA00025702315500000712
S4、基于设计的无人船控制率,设计神经网络权重更新率。具体包括:
S41、根据前馈神经网络的全局逼近特性,将最优代价函数表示为:
Figure BDA0002570231550000081
其中,
Figure BDA0002570231550000082
表示评判器神经网络理想的权重向量,N表示神经元的个数,
Figure BDA0002570231550000083
表示神经网络输入向量基函数,εc表示有界神经网络函数逼近误差;
S42、设计所述最优成本函数的逼近函数,表示如下:
Figure BDA0002570231550000084
其中,
Figure BDA0002570231550000085
表示
Figure BDA0002570231550000086
的估计;
Figure BDA0002570231550000087
表示基函数;
S43、基于上述设计的逼近函数,得到哈密尔顿-雅克比-贝尔曼方程,如下:
Figure BDA0002570231550000088
则最优控制器为:
Figure BDA0002570231550000089
其中,
Figure BDA00025702315500000810
表示
Figure BDA00025702315500000811
的估计,通过梯度下降方法得到:
Figure BDA00025702315500000812
其中,Γc表示正定矩阵;
Figure BDA00025702315500000813
S44、计算演员更新率
Figure BDA00025702315500000814
其计算公式如下:
Figure BDA00025702315500000815
其中,ka为常数,
Figure BDA00025702315500000816
Γa为正定矩阵。
从下述附图中可以看出本方法跟踪的优越性。图2为无人船位置跟踪图,可以看出船舶在非常短的时间内跟踪上;图3为速度跟踪图,可见虽然前期的速度有波动,但是在较短的时间内也达到跟踪效果。图4和图5分别是位置误差和速度误差,从这两个误差图中可以看出误差最终都在零附近波动。图6为船舶的旋转仿真实验,船舶参考轨迹为一个圆,可以看出跟踪效果很好;图7和图8分别是评论家权重更新律和演员权重更新率,可见船舶在较短时间内进行训练然后稳定,达到跟踪效果;图9为船舶跟踪控制率,可见船舶在有饱和输入限制时,通过辅助变量的设计使得船舶在具有较大的控制律时仍可以达到跟踪效果,解决了船舶输入饱和限制。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;
尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的范围。

Claims (1)

1.一种具有输入饱和受限的无人船强化学习自适应跟踪控制方法,其特征在于,所述方法包括:
建立无人水面船数学模型,设定无人水面船的期望轨迹数学模型,包括:
定义北东坐标系OX0Y0Z0和附体坐标系BXYZ两个坐标系;
将北东坐标系(OX0Y0Z0)视作惯性坐标系,取地球任一点O为坐标原点,OX0指向正北,OY0指向正东,OZ0指向地球球心;
将附体坐标系BXYZ视作非惯性坐标系,船舶左右对称时,取其中心为坐标原点B,BX轴沿着船舶中线指向船艏方向,BY轴垂直指向右舷,BZ轴沿XY平面垂直指向下;
对无人水面船进行建模,得到如下船舶运动控制数学模型:
Figure FDA0003744096900000011
Figure FDA0003744096900000012
其中,η=[x,y,ψ]T表示北东坐标系下的船舶位置向量,x、y表示无人水面船运动的北东位置,ψ∈[0,2π]表示艏摇角;R(ψ)表示地球坐标系和船体坐标系之间的转换矩阵;ν=[u,v,r]T表示附体坐标系下无人水面船运动的速度向量,u、v、r分别表示其纵荡速度、横荡速度、艏摇速度;τ′=M-1τ,τ=[τuvr]T表示船舶控制输入向量,τu、τv、τr分别表示纵荡控制力、横荡控制力、艏摇控制力;f(v)表示系统动态向量,f(v)=-M-1(C(v)v+D(v)v),M(t)=MT(t)>0表示包含附加质量的惯性矩阵,C(v)表示斜对称矩阵,D(v)表示阻尼矩阵;
设定无人水面船的期望轨迹数学模型如下:
Figure FDA0003744096900000013
其中,xd=[ηd T,vd T]T,ηd=[xd,ydd]T和νd=[ud,vd,rd]T分别是无人水面船跟踪的期望位置向量及速度向量;
基于设定的期望轨迹数学模型,引入控制器输入饱和函数;包括:
引入控制器输入饱和函数,其表达式如下:
Figure FDA0003744096900000014
其中,μi表示控制输入;τi,M是τi的界,τi表示具有饱和特性的控制输入;sat(μi)是μi的饱和函数;
将上述sat(μi)函数逼近为一个光滑的函数,如下表示:
Figure FDA0003744096900000021
则引入的控制器输入饱和函数最终表示如下:
sat(μi)=J(μi)+ρ(μi)
其中,ρ(μi)表示有界函数,J(μi)表示饱和函数的逼近函数;
基于引入控制器输入饱和函数的期望轨迹数学模型,设计无人船控制率;包括:
构建成本函数,如下:
Figure FDA0003744096900000022
其中,t表示时间;γ表示折扣因子;z表示跟踪误差;e表示指数函数,
Figure FDA0003744096900000023
ηe表示位置误差,ηe=η-ηd,η表示船舶实际位置,ηd表示船舶参考位置;ve表示速度误差,ve=v-vd-h,v表示船舶实际速度,vd表示船舶参考速度,h表示辅助变量,满足
Figure FDA0003744096900000024
μ表示控制输入;
构建无人船轨迹跟踪动态,如下:
Figure FDA0003744096900000025
其中,
Figure FDA0003744096900000026
RT表示转换矩阵,fT(η,v)表示系统动态向量,
Figure FDA0003744096900000027
表示参考系统的动态向量;
Figure FDA0003744096900000028
μ*表示最优控制率;
定义最优成本函数,如下:
Figure FDA0003744096900000029
其中,r(e,μ*)=eTΛee+μ*TΛμμ*,Λeμ均为正定矩阵;eT表示误差的转置;
根据上述定义的最优成本函数,得到哈密尔顿-雅克比-贝尔曼方程,如下:
Figure FDA00037440969000000210
其中,
Figure FDA00037440969000000211
表示成本函数的梯度;
得到无人船最优控制率,如下:
Figure FDA00037440969000000212
基于设计的无人船控制率,设计神经网络权重更新率;包括:
根据前馈神经网络的全局逼近特性,将最优代价函数表示为:
Figure FDA0003744096900000031
其中,
Figure FDA0003744096900000032
表示评判器神经网络理想的权重向量,N表示神经元的个数,
Figure FDA0003744096900000033
表示神经网络输入向量基函数,εc表示有界神经网络函数逼近误差;
设计所述最优成本函数的逼近函数,表示如下:
Figure FDA0003744096900000034
其中,
Figure FDA0003744096900000035
表示
Figure FDA0003744096900000036
的估计;
Figure FDA0003744096900000037
表示神经网络输入向量基函数;
基于上述设计的逼近函数,得到哈密尔顿-雅克比-贝尔曼方程,如下:
Figure FDA0003744096900000038
则最优控制器为:
Figure FDA0003744096900000039
其中,
Figure FDA00037440969000000310
表示
Figure FDA00037440969000000311
的估计,通过梯度下降方法得到:
Figure FDA00037440969000000312
其中,Γc表示正定矩阵;
Figure FDA00037440969000000313
计算演员更新率
Figure FDA00037440969000000314
其计算公式如下:
Figure FDA00037440969000000315
其中,ka为常数,
Figure FDA00037440969000000316
Γa为正定矩阵。
CN202010638107.4A 2020-07-03 2020-07-03 一种具有输入饱和受限的无人船强化学习自适应跟踪控制方法 Active CN111679585B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010638107.4A CN111679585B (zh) 2020-07-03 2020-07-03 一种具有输入饱和受限的无人船强化学习自适应跟踪控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010638107.4A CN111679585B (zh) 2020-07-03 2020-07-03 一种具有输入饱和受限的无人船强化学习自适应跟踪控制方法

Publications (2)

Publication Number Publication Date
CN111679585A CN111679585A (zh) 2020-09-18
CN111679585B true CN111679585B (zh) 2022-08-26

Family

ID=72437684

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010638107.4A Active CN111679585B (zh) 2020-07-03 2020-07-03 一种具有输入饱和受限的无人船强化学习自适应跟踪控制方法

Country Status (1)

Country Link
CN (1) CN111679585B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112346454B (zh) * 2020-10-28 2023-08-18 博康智能信息技术有限公司 基于神经网络的无人船控制方法及其系统
CN112180950B (zh) * 2020-11-05 2022-07-08 武汉理工大学 一种基于强化学习的智能船舶自主避碰及路径规划方法
CN112558470A (zh) * 2020-11-24 2021-03-26 中国科学技术大学 一种执行器饱和多智能体系统最优一致性控制方法和装置
CN112327638B (zh) * 2020-12-03 2022-11-01 大连海事大学 一种具有指定性能并带有输入饱和限制的无人船轨迹跟踪最优控制方法
CN112558465B (zh) * 2020-12-03 2022-11-01 大连海事大学 一种带有输入限制的未知无人船有限时间强化学习控制方法
CN112782981B (zh) * 2020-12-30 2023-02-03 大连海事大学 一种智能船舶自动舵系统的模糊自适应输出反馈指定性能控制方法及系统
CN113189867B (zh) * 2021-03-24 2023-11-14 大连海事大学 一种考虑位姿与速度受限的无人船自学习最优跟踪控制方法
CN113534668B (zh) * 2021-08-13 2022-06-10 哈尔滨工程大学 基于最大熵的演员-评论家框架的auv运动规划方法
CN115629549B (zh) * 2022-12-21 2023-04-04 江苏云幕智造科技有限公司 一种根据输入饱和的l2增益鲁棒路径跟踪方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107065847B (zh) * 2016-03-31 2020-03-20 北京航空航天大学 一种执行器非对称饱和的水面舰船轨迹跟踪控制方法
CN108803632B (zh) * 2018-09-19 2021-03-09 哈尔滨工程大学 基于饱和补偿技术的水面无人艇全状态约束轨迹跟踪控制方法
CN110018687B (zh) * 2019-04-09 2022-03-04 大连海事大学 基于强化学习方法的无人水面船最优轨迹跟踪控制方法
CN110007606B (zh) * 2019-05-28 2021-12-10 哈尔滨工程大学 一种考虑输入饱和的水面无人艇误差约束控制方法
CN111308890B (zh) * 2020-02-27 2022-08-26 大连海事大学 一种带有指定性能的无人船数据驱动强化学习控制方法

Also Published As

Publication number Publication date
CN111679585A (zh) 2020-09-18

Similar Documents

Publication Publication Date Title
CN111679585B (zh) 一种具有输入饱和受限的无人船强化学习自适应跟踪控制方法
CN110018687B (zh) 基于强化学习方法的无人水面船最优轨迹跟踪控制方法
CN107168312B (zh) 一种补偿uuv运动学和动力学干扰的空间轨迹跟踪控制方法
CN108008628B (zh) 一种不确定欠驱动无人艇系统的预设性能控制方法
CN111308890B (zh) 一种带有指定性能的无人船数据驱动强化学习控制方法
CN108319140B (zh) 一种重定义输出式无模型自适应航向控制方法及系统
CN107544258B (zh) 自主型水下航行器自适应反演控制方法
CN111857165B (zh) 一种水下航行器的轨迹跟踪控制方法
CN112650233B (zh) 无人船轨迹跟踪最优控制方法
CN114115262B (zh) 基于方位角信息的多auv执行器饱和协同编队控制系统和方法
Zhang et al. Anti-disturbance control for dynamic positioning system of ships with disturbances
CN111798702B (zh) 无人艇路径跟踪控制方法、系统、存储介质及终端
Amin et al. Neural networks control of autonomous underwater vehicle
CN114967714A (zh) 一种自主式水下机器人抗扰运动控制方法及系统
CN112327638B (zh) 一种具有指定性能并带有输入饱和限制的无人船轨迹跟踪最优控制方法
CN113741433B (zh) 一种水面无人船的分布式编队方法
CN112558465B (zh) 一种带有输入限制的未知无人船有限时间强化学习控制方法
CN115480580A (zh) 一种基于nmpc的水下机器人路径跟踪与避障的控制方法
Ma et al. Cooperative towing for double unmanned surface vehicles connected with a floating rope via vertical formation and adaptive moment control
Ngongi et al. Design of generalised predictive controller for dynamic positioning system of surface ships
CN113189867B (zh) 一种考虑位姿与速度受限的无人船自学习最优跟踪控制方法
Dong et al. Dynamic positioning of ship using backstepping controller with nonlinear disturbance observer
Tomera Dynamic positioning system design for “Blue Lady”. Simulation tests
Le et al. Estimation of Ship Hydrodynamic Coefficients in Harbor Maneuvers and Its Applications
Le An automatic control system for ship harbour manoeuvres using decoupling control

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant