CN111880546A - 一种基于自适应动态规划算法的虚拟引导船舶自动靠泊控制方法 - Google Patents

一种基于自适应动态规划算法的虚拟引导船舶自动靠泊控制方法 Download PDF

Info

Publication number
CN111880546A
CN111880546A CN202010802450.8A CN202010802450A CN111880546A CN 111880546 A CN111880546 A CN 111880546A CN 202010802450 A CN202010802450 A CN 202010802450A CN 111880546 A CN111880546 A CN 111880546A
Authority
CN
China
Prior art keywords
ship
berthing
optimal
control
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010802450.8A
Other languages
English (en)
Other versions
CN111880546B (zh
Inventor
李铁山
刘琪
单麒赫
于仁海
肖杨
高潇阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dalian Maritime University
Original Assignee
Dalian Maritime University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dalian Maritime University filed Critical Dalian Maritime University
Priority to CN202010802450.8A priority Critical patent/CN111880546B/zh
Publication of CN111880546A publication Critical patent/CN111880546A/zh
Application granted granted Critical
Publication of CN111880546B publication Critical patent/CN111880546B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course or altitude of land, water, air, or space vehicles, e.g. automatic pilot
    • G05D1/02Control of position or course in two dimensions
    • G05D1/0206Control of position or course in two dimensions specially adapted to water vehicles

Landscapes

  • Engineering & Computer Science (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明提供一种基于自适应动态规划算法的虚拟引导船舶自动靠泊控制方法,包括:建立船舶靠泊非线性控制系统数学模型;基于建立的船舶靠泊非线性控制系统数学模型,引入虚拟引导系统,得到最优控制器,将靠泊控制问题转化为跟踪控制问题;基于最优控制器,建立靠泊最优评价指标;将跟踪控制问题转化为最优调节问题;基于自适应动态规划方法设计船舶最优靠泊控制,逼近靠泊最优评价指标;通过神经网络执行船舶最优靠泊控制,获得最优靠泊控制律。本发明的技术方案解决了模型动态未知的船舶自动靠泊问题,有效降低了控制器能量消耗,并且提高了船舶跟踪的精度,从而获得最优靠泊路径。

Description

一种基于自适应动态规划算法的虚拟引导船舶自动靠泊控制 方法
技术领域
本发明涉及船舶控制技术领域,具体而言,尤其涉及一种基于自适应动态规划算法的虚拟引导船舶自动靠泊控制方法。
背景技术
随着信息技术和人工智能技术的发展,船舶无人化、自动化程度不断提高,智能船舶技术已成为当今海洋交通运输发展的主流方向,其中,自动靠泊技术被认为是最困难、最复杂的操作之一。船舶在自主靠泊时不仅面临较大的环境干扰,还要受到速度低、岸壁效应导致的舵效差、模型动态不确定等问题,因此船舶的自主靠泊控制是船舶自动控制领域的一大难题。针对船舶自动靠泊中存在的问题,智能算法不断应用于船舶靠泊控制领域,如鲁棒控制,模糊自适应控制、迭代滑模控制等;同时一些非线性优化方法也应用靠泊领域,如基于变分法的序列共轭梯度算法、基于神经网络的最小时间操作系统以及模型预测控制等。但是这些方法在工程实践中存在需要模型动态已知以及过高的计算复杂度等问题。
发明内容
根据上述提出的技术问题,而提供一种基于自适应动态规划算法的虚拟引导船舶自动靠泊控制方法。本发明主要针对船舶靠泊系统,首先,通过引入虚拟引导系统,将靠泊控制问题转化为跟踪控制问题,然后将跟踪问题进一步转化为最优调节问题。其次,采用自适应动态规划算法求解模型未知的船舶最优调节控制问题。
本发明采用的技术手段如下:
一种基于自适应动态规划算法的虚拟引导船舶自动靠泊控制方法,包括如下步骤:
步骤S1、建立船舶靠泊非线性控制系统数学模型;
步骤S2、基于所述建立的船舶靠泊非线性控制系统数学模型,引入虚拟引导系统,得到最优控制器,将靠泊控制问题转化为跟踪控制问题;
步骤S3、基于所述最优控制器,建立靠泊最优评价指标;将所述跟踪控制问题转化为最优调节问题;
步骤S4、基于自适应动态规划方法设计船舶最优靠泊控制,逼近所述靠泊最优评价指标;
步骤S5、通过神经网络执行所述船舶最优靠泊控制,获得最优靠泊控制律。
进一步地,所述步骤S1的具体实现方式如下:
步骤S11、考虑船舶自主靠泊时通常以较低的速度运行,因此船舶靠泊数学模型表述如下:
Figure BDA0002627891410000021
Figure BDA0002627891410000022
式(1)中,
Figure BDA0002627891410000023
表示船舶位置坐标和艏向角的姿态变量;υ=[u,v,r]T表示船舶前进速度、横向速度和艏摇速度变量;
Figure BDA0002627891410000024
表示坐标转换矩阵,其表示形式如下:
Figure BDA0002627891410000025
式(2)中,M为正定惯性矩阵,D为线性阻尼矩阵,τf=[τf1f2f3]T为船舶纵向控制力τf1、横向控制力τf2以及艏摇控制力矩τf3
步骤S12、定义Δt为采样时间间隔,将式(1)和式(2)进行离散化,得到船舶靠泊非线性控制系统数学模型:
Figure BDA0002627891410000026
υ(k+1)=υ(k)+ΔtM-1f-Dυ(k)) (5)
步骤S13、定义x(k)=[η(k)T,υ(k)T]T,可以得到:
x(k+1)=f(x(k))+g(x(k))u(k) (6)
其中,
Figure BDA0002627891410000031
Figure BDA0002627891410000032
且u(k)=τf
进一步地,所述步骤S2的具体实现方式如下:
设虚拟引导系统采用直线运动形式,同时其状态xg(k)满足xg(k+1)=φ(xg(k));船舶系统状态x(k)跟踪虚拟引导系统状态xg(k),船舶跟踪误差设为ξ(k)=x(k)-xg(k),得到最优控制器为:
Figure BDA0002627891410000033
其中,
Figure BDA0002627891410000034
表示g(·)的伪逆。
进一步地,所述步骤S3的具体实现方式如下:
步骤S31、设d(k)为d(k)=u(k)-ue(k),则针对船舶时变最优跟踪控制得到如下船舶靠泊跟踪性能指标函数:
Figure BDA0002627891410000035
其中,
Figure BDA0002627891410000036
为正定矩阵;
步骤S32、令最优靠泊控制律θ(k)=d(k)-d(k-1),且θ(0)=d(0),则可以得到:
Figure BDA0002627891410000037
所以船舶跟踪性能指标函数可以描述为:
Figure BDA0002627891410000038
又由于ξ(k+1)=x(k+1)-xg(k+1),结合(6)式可得
ξ(k+1)=f(x(k))+g(x(k))u(k)-xg(k+1) (11)
步骤S33、将公式(9)、(10)和(11)转化为最优调节问题,转换之后的系统可以表示为:
Figure BDA0002627891410000041
进一步地,所述步骤S4的具体实现方式如下:
步骤S41、基于贝尔曼最优性原理,船舶最优性能指标函数满足下面的HJB方程:
Figure BDA0002627891410000042
其中,J*(ξ(k))表示最优跟踪问题的性能指标函数。
步骤S42、采用自适应动态规划算法,将船舶跟踪性能指标函数和控制律从i=0开始更新迭代,对于i=0,1,2,…可得到:
Figure BDA0002627891410000043
以及
Figure BDA0002627891410000044
其中,θi(k)表示第i次迭代的控制律;Ji(ξ(k))表示第i次迭代的性能指标函数。
步骤S43、若得到最优控制律θ(k),则原始船舶靠泊系统(6)的最优靠泊控制可以通过下式得到:
Figure BDA0002627891410000051
进一步地,所述步骤S5的具体实现方式如下:
步骤S51、在执行自适应动态规划算法之前,对未知船舶靠泊系统动态进行辨识:
Figure BDA0002627891410000052
其中,
Figure BDA0002627891410000053
为模型网络的输入,Vm表示输入层至隐含层的权值矩阵,Wm表示隐含层至输出层的权值矩阵;则模型网络误差定义为:
Figure BDA0002627891410000054
步骤S52、定义性能误差为:
Figure BDA0002627891410000055
步骤S53、采用梯度下降法,更新模型网络权重:
Figure BDA0002627891410000056
其中,αm是模型网络学习率;
步骤S54、采用评价网络近似性能指标函数Ji(ξ(k)),其输出表示为:
Figure BDA0002627891410000057
其中,Vc表示输入层至隐含层的权值矩阵,Wc表示隐含层至输出层的权值矩阵;且目标函数为:
Figure BDA0002627891410000058
步骤S55、定义评价网络误差函数为
Figure BDA0002627891410000059
则评价网络的目标是极小化
Figure BDA00026278914100000510
因此,神经网络权重更新律为:
Figure BDA00026278914100000511
其中,αc是评价网络学习率;
步骤S56、以状态误差作为输入并以最优控制的差分作为输出,则执行网络的输出表示为:
Figure BDA00026278914100000512
其中,Va表示输入层至隐含层的权值矩阵,Wa表示隐含层至输出层的权值矩阵;而且,,执行网络的目标函数由(14)式给出,θi(k)是目标函数可以表示为:
Figure BDA0002627891410000061
其中,g(x(k))可以表示为:
Figure BDA0002627891410000062
因此,执行网络的输出表示为
Figure BDA0002627891410000063
执行网络的目标是最小化
Figure BDA0002627891410000064
Figure BDA0002627891410000065
所以权值更新律为:
Figure BDA0002627891410000066
其中,βa是评价网络学习率。
较现有技术相比,本发明具有以下优点:
1、本发明方法通过引入虚拟导引系统,将原船舶的靠泊控制问题转化为船舶最优跟踪控制问题,进一步将船舶跟踪控制问题转化为船舶最优调节问题,对于转化后的船舶最优调节问题,利用输入输出数据识别浅水、低速、岸壁效应以及外界干扰引起的水动力导数变化等因素影响下的船舶未知模型,设计最优靠泊控制器。
2、本发明建立的船舶性能指标函数,解决了传统性能指标函数的无限计算问题和船舶系统可能出现的振荡问题,提高了船舶的跟踪性能。
基于上述理由本发明可在船舶控制等领域广泛推广。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做以简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明方法流程图。
图2为本发明通过神经网络执行船舶最优靠泊控制的示意图。
图3为本发明实施例提供的模型网络的输出ξ(k)仿真示意图。
图4为本发明实施例提供的模型网络成功辨识出未知系统的仿真示意图。
图5为本发明实施例提供的船舶位置矢量的跟踪误差。
图6为本发明实施例提供的船舶速度矢量的跟踪误差。
图7为本发明实施例提供的船舶靠泊时的航行轨迹路线。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
下面结合附图对本发明作进一步说明:
如图1所示,本发明提供了一种基于自适应动态规划算法的虚拟引导船舶自动靠泊控制方法,包括如下步骤:
步骤S1、建立船舶靠泊非线性控制系统数学模型;
步骤S11、考虑船舶自主靠泊时通常以较低的速度运行,因此船舶靠泊数学模型表述如下:
Figure BDA0002627891410000071
Figure BDA0002627891410000081
式(1)中,
Figure BDA0002627891410000082
表示船舶位置坐标和艏向角的姿态变量;υ=[u,v,r]T表示船舶前进速度、横向速度和艏摇速度变量;
Figure BDA0002627891410000083
表示坐标转换矩阵,其表示形式如下:
Figure BDA0002627891410000084
式(2)中,M为正定惯性矩阵,D为线性阻尼矩阵,τf=[τf1f2f3]T为船舶纵向控制力τf1、横向控制力τf2以及艏摇控制力矩τf3
步骤S12、定义Δt为采样时间间隔,将式(1)和式(2)进行离散化,得到船舶靠泊非线性控制系统数学模型:
Figure BDA0002627891410000085
υ(k+1)=υ(k)+ΔtM-1f-Dυ(k)) (5)
步骤S13、定义x(k)=[η(k)T,υ(k)T]T,可以得到:
x(k+1)=f(x(k))+g(x(k))u(k) (6)
其中,
Figure BDA0002627891410000086
Figure BDA0002627891410000087
且u(k)=τf。因为船舶速度值会受到外界干扰和装载状态的影响,所以f(·)和g(·)可以看作是未知的。
步骤S2、基于所述建立的船舶靠泊非线性控制系统数学模型,引入虚拟引导系统,得到最优控制器,将靠泊控制问题转化为跟踪控制问题;
设虚拟引导系统采用直线运动形式,同时其状态xg(k)满足xg(k+1)=φ(xg(k));船舶系统状态x(k)跟踪虚拟引导系统状态xg(k),船舶跟踪误差设为ξ(k)=x(k)-xg(k),得到最优控制器为:
Figure BDA0002627891410000088
其中,
Figure BDA0002627891410000089
表示g(·)的伪逆。
步骤S3、基于所述最优控制器,建立靠泊最优评价指标;将所述跟踪控制问题转化为最优调节问题;
步骤S31、设d(k)为d(k)=u(k)-ue(k),则针对船舶时变最优跟踪控制得到如下船舶靠泊跟踪性能指标函数:
Figure BDA0002627891410000091
其中,
Figure BDA0002627891410000092
为正定矩阵;
步骤S32、令最优靠泊控制律θ(k)=d(k)-d(k-1),且θ(0)=d(0),则可以得到:
Figure BDA0002627891410000093
所以船舶跟踪性能指标函数可以描述为:
Figure BDA0002627891410000094
又由于ξ(k+1)=x(k+1)-xg(k+1),结合(6)式可得
ξ(k+1)=f(x(k))+g(x(k))u(k)-xg(k+1) (11)
步骤S33、将公式(9)、(10)和(11)转化为最优调节问题,转换之后的系统可以表示为:
Figure BDA0002627891410000095
下一步的工作是根据(12)求出一个稳定控制θ(ξ)以使得性能指标(10)为有界的。
步骤S4、基于自适应动态规划方法设计船舶最优靠泊控制,逼近所述靠泊最优评价指标;
步骤S41、基于贝尔曼最优性原理,船舶最优性能指标函数满足下面的HJB方程:
Figure BDA0002627891410000101
其中,J*(ξ(k))表示最优跟踪问题的性能指标函数。
步骤S42、采用自适应动态规划算法,将船舶跟踪性能指标函数和控制律从i=0开始更新迭代,对于i=0,1,2,…可得到:
Figure BDA0002627891410000102
以及
Figure BDA0002627891410000103
其中,θi(k)表示第i次迭代的控制律;Ji(ξ(k))表示第i次迭代的性能指标函数。
步骤S43、若得到最优控制律θ(k),则原始船舶靠泊系统(6)的最优靠泊控制可以通过下式得到:
Figure BDA0002627891410000104
步骤S5、如图2所示,通过神经网络执行所述船舶最优靠泊控制,获得最优靠泊控制律。
步骤S51、在执行自适应动态规划算法之前,对未知船舶靠泊系统动态进行辨识:
Figure BDA0002627891410000105
其中,
Figure BDA0002627891410000106
为模型网络的输入,Vm表示输入层至隐含层的权值矩阵,Wm表示隐含层至输出层的权值矩阵;则模型网络误差定义为:
Figure BDA0002627891410000107
步骤S52、定义性能误差为:
Figure BDA0002627891410000111
步骤S53、采用梯度下降法,更新模型网络权重:
Figure BDA0002627891410000112
其中,αm是模型网络学习率;当模型网络训练完成之后,其权重保持不变。
步骤S54、采用评价网络近似性能指标函数Ji(ξ(k)),其输出表示为:
Figure BDA0002627891410000113
其中,Vc表示输入层至隐含层的权值矩阵,Wc表示隐含层至输出层的权值矩阵;且目标函数为:
Figure BDA0002627891410000114
步骤S55、定义评价网络误差函数为
Figure BDA0002627891410000115
则评价网络的目标是极小化
Figure BDA0002627891410000116
因此,神经网络权重更新律为:
Figure BDA0002627891410000117
其中,αc是评价网络学习率;
步骤S56、以状态误差作为输入并以最优控制的差分作为输出,则执行网络的输出表示为:
Figure BDA0002627891410000118
其中,Va表示输入层至隐含层的权值矩阵,Wa表示隐含层至输出层的权值矩阵;而且,执行网络的目标函数由(14)式给出,θi(k)是目标函数可以表示为:
Figure BDA0002627891410000119
其中,g(x(k))可以表示为:
Figure BDA00026278914100001110
因此,执行网络的输出表示为
Figure BDA00026278914100001111
执行网络的目标是最小化
Figure BDA0002627891410000121
Figure BDA0002627891410000122
所以权值更新律为:
Figure BDA0002627891410000123
其中,βa是评价网络学习率。
基于上述方法,以实际智能船舶模型为例,进行计算机仿真。
已知某智能船舶的参数如下:惯性矩阵和水动力阻尼矩阵分别为
Figure BDA0002627891410000124
Figure BDA0002627891410000125
初始位置和速度矢量x(0)=[10m 8m(25/180)πrad 5m/s 0m/s 0rad/s]T;期望信号xg(k+1)=xg(k)-Δtkptanh(xg(k));初始状态为xg(0)=[7m0m0πrad4m/s 0m/s 0rad/s]T。船舶跟踪性能指标中的Q和R取Q=0.01×I6×6和R=0.05×I3×3,采样间隔Δt=0.01。选择三层神经网络即模型网络、执行网络和评价网络作为神经网络,结构分别为15-20-2,6-8-3和6-20-1。选择双曲正切传递函数作为神经网络基函数。执行网络、评价网络和模型网络的初始值在[-1,1]间随机选取。
采用本发明基于自适应动态规划算法的虚拟引导船舶自动靠泊控制方法的仿真结果如图3-7所示。图3中的zi,i=1,2,...6是模型网络的输出ξ(k)。根据图4显示,经过模型网辨识之后,模型网络成功辨识出未知系统。图5和图6分别表示了船舶位置矢量和速度矢量的跟踪误差,可以看出,误差最后均趋近于0。图7是船舶靠泊时的航行轨迹路线。以上仿真结果表明了船舶具有较好的自动靠泊性能。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (6)

1.一种基于自适应动态规划算法的虚拟引导船舶自动靠泊控制方法,其特征在于,包括如下步骤:
步骤S1、建立船舶靠泊非线性控制系统数学模型;
步骤S2、基于所述建立的船舶靠泊非线性控制系统数学模型,引入虚拟引导系统,得到最优控制器,将靠泊控制问题转化为跟踪控制问题;
步骤S3、基于所述最优控制器,建立靠泊最优评价指标;将所述跟踪控制问题转化为最优调节问题;
步骤S4、基于自适应动态规划方法设计船舶最优靠泊控制,逼近所述靠泊最优评价指标;
步骤S5、通过神经网络执行所述船舶最优靠泊控制,获得最优靠泊控制律。
2.根据权利要求1所述的基于自适应动态规划算法的虚拟引导船舶自动靠泊控制方法,其特征在于,所述步骤S1的具体实现方式如下:
步骤S11、考虑船舶自主靠泊时通常以较低的速度运行,因此船舶靠泊数学模型表述如下:
Figure FDA0002627891400000011
Figure FDA0002627891400000012
式(1)中,
Figure FDA0002627891400000013
表示船舶位置坐标和艏向角的姿态变量;υ=[u,v,r]T表示船舶前进速度、横向速度和艏摇速度变量;
Figure FDA0002627891400000014
表示坐标转换矩阵,其表示形式如下:
Figure FDA0002627891400000015
式(2)中,M为正定惯性矩阵,D为线性阻尼矩阵,τf=[τf1f2f3]T为船舶纵向控制力τf1、横向控制力τf2以及艏摇控制力矩τf3
步骤S12、定义Δt为采样时间间隔,将式(1)和式(2)进行离散化,得到船舶靠泊非线性控制系统数学模型:
Figure FDA0002627891400000016
υ(k+1)=υ(k)+ΔtM-1f-Dυ(k)) (5)
步骤S13、定义x(k)=[η(k)T,υ(k)T]T,可以得到:
x(k+1)=f(x(k))+g(x(k))u(k) (6)
其中,
Figure FDA0002627891400000021
且u(k)=τf
3.根据权利要求1所述的基于自适应动态规划算法的虚拟引导船舶自动靠泊控制方法,其特征在于,所述步骤S2的具体实现方式如下:
设虚拟引导系统采用直线运动形式,同时其状态xg(k)满足xg(k+1)=φ(xg(k));船舶系统状态x(k)跟踪虚拟引导系统状态xg(k),船舶跟踪误差设为ξ(k)=x(k)-xg(k),得到最优控制器为:
Figure FDA0002627891400000022
其中,
Figure FDA0002627891400000023
表示g(·)的伪逆。
4.根据权利要求1所述的基于自适应动态规划算法的虚拟引导船舶自动靠泊控制方法,其特征在于,所述步骤S3的具体实现方式如下:
步骤S31、设d(k)为d(k)=u(k)-ue(k),则针对船舶时变最优跟踪控制得到如下船舶靠泊跟踪性能指标函数:
Figure FDA0002627891400000024
其中,
Figure FDA0002627891400000025
为正定矩阵;
步骤S32、令最优靠泊控制律θ(k)=d(k)-d(k-1),且θ(0)=d(0),则可以得到:
Figure FDA0002627891400000026
所以船舶跟踪性能指标函数可以描述为:
Figure FDA0002627891400000031
又由于ξ(k+1)=x(k+1)-xg(k+1),结合(6)式可得
ξ(k+1)=f(x(k))+g(x(k))u(k)-xg(k+1) (11)
步骤S33、将公式(9)、(10)和(11)转化为最优调节问题,转换之后的系统可以表示为:
Figure FDA0002627891400000032
5.根据权利要求1所述的基于自适应动态规划算法的虚拟引导船舶自动靠泊控制方法,其特征在于,所述步骤S4的具体实现方式如下:
步骤S41、基于贝尔曼最优性原理,船舶最优性能指标函数满足下面的HJB方程:
Figure FDA0002627891400000033
其中,J*(ξ(k))表示最优跟踪问题的性能指标函数。
步骤S42、采用自适应动态规划算法,将船舶跟踪性能指标函数和控制律从i=0开始更新迭代,对于i=0,1,2,…可得到:
Figure FDA0002627891400000034
以及
Figure FDA0002627891400000041
其中,θi(k)表示第i次迭代的控制律;Ji(ξ(k))表示第i次迭代的性能指标函数。
步骤S43、若得到最优控制律θ(k),则原始船舶靠泊系统(6)的最优靠泊控制可以通过下式得到:
Figure FDA0002627891400000042
6.根据权利要求1所述的基于自适应动态规划算法的虚拟引导船舶自动靠泊控制方法,其特征在于,所述步骤S5的具体实现方式如下:
步骤S51、在执行自适应动态规划算法之前,对未知船舶靠泊系统动态进行辨识:
Figure FDA0002627891400000043
其中,
Figure FDA0002627891400000044
为模型网络的输入,Vm表示输入层至隐含层的权值矩阵,Wm表示隐含层至输出层的权值矩阵;则模型网络误差定义为:
Figure FDA0002627891400000045
步骤S52、定义性能误差为:
Figure FDA0002627891400000046
步骤S53、采用梯度下降法,更新模型网络权重:
Figure FDA0002627891400000047
其中,αm是模型网络学习率;
步骤S54、采用评价网络近似性能指标函数Ji(ξ(k)),其输出表示为:
Figure FDA0002627891400000048
其中,Vc表示输入层至隐含层的权值矩阵,Wc表示隐含层至输出层的权值矩阵;且目标函数为:
Figure FDA0002627891400000051
步骤S55、定义评价网络误差函数为
Figure FDA0002627891400000052
则评价网络的目标是极小化
Figure FDA0002627891400000053
因此,神经网络权重更新律为:
Figure FDA0002627891400000054
其中,αc是评价网络学习率;
步骤S56、以状态误差作为输入并以最优控制的差分作为输出,则执行网络的输出表示为:
Figure FDA0002627891400000055
其中,Va表示输入层至隐含层的权值矩阵,Wa表示隐含层至输出层的权值矩阵;而且,执行网络的目标函数由(14)式给出,θi(k)是目标函数可以表示为:
Figure FDA0002627891400000056
其中,g(x(k))可以表示为:
Figure FDA0002627891400000057
因此,执行网络的输出表示为
Figure FDA0002627891400000058
执行网络的目标是最小化
Figure FDA0002627891400000059
所以权值更新律为:
Figure FDA00026278914000000510
其中,βa是评价网络学习率。
CN202010802450.8A 2020-08-11 2020-08-11 一种基于自适应动态规划算法的虚拟引导船舶自动靠泊控制方法 Active CN111880546B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010802450.8A CN111880546B (zh) 2020-08-11 2020-08-11 一种基于自适应动态规划算法的虚拟引导船舶自动靠泊控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010802450.8A CN111880546B (zh) 2020-08-11 2020-08-11 一种基于自适应动态规划算法的虚拟引导船舶自动靠泊控制方法

Publications (2)

Publication Number Publication Date
CN111880546A true CN111880546A (zh) 2020-11-03
CN111880546B CN111880546B (zh) 2023-09-19

Family

ID=73203624

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010802450.8A Active CN111880546B (zh) 2020-08-11 2020-08-11 一种基于自适应动态规划算法的虚拟引导船舶自动靠泊控制方法

Country Status (1)

Country Link
CN (1) CN111880546B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112650233A (zh) * 2020-12-15 2021-04-13 大连海事大学 死区限制下基于反步法与自适应动态规划的无人船轨迹跟踪最优控制方法
CN113110468A (zh) * 2021-04-22 2021-07-13 中国船舶重工集团公司第七0七研究所九江分部 一种应用于欠驱动双桨双舵船舶自主靠泊的控制方法
CN113110511A (zh) * 2021-05-19 2021-07-13 大连海事大学 一种基于广义模糊双曲模型的智能船舶航向控制方法
CN113536463A (zh) * 2021-07-20 2021-10-22 大连海事大学 一种基于改进梯度下降法的神经网络船舶整体模型逼近方法
CN115145282A (zh) * 2022-07-18 2022-10-04 中国船舶重工集团公司第七0七研究所九江分部 一种欠驱动船舶自动靠泊鲁棒自适应控制方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101605994B1 (ko) * 2015-07-07 2016-03-24 중앙대학교 산학협력단 미지의 스키딩과 슬리핑을 갖는 이동 로봇을 위한 적응적 선도-추종 군집 제어 방법 및 그 장치
CN109188909A (zh) * 2018-09-26 2019-01-11 大连海事大学 面向船舶航向非线性离散系统的自适应模糊最优控制方法及系统
CN109884886A (zh) * 2019-03-29 2019-06-14 大连海事大学 一种基于宽度学习的船舶运动无模型自适应最优控制方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101605994B1 (ko) * 2015-07-07 2016-03-24 중앙대학교 산학협력단 미지의 스키딩과 슬리핑을 갖는 이동 로봇을 위한 적응적 선도-추종 군집 제어 방법 및 그 장치
CN109188909A (zh) * 2018-09-26 2019-01-11 大连海事大学 面向船舶航向非线性离散系统的自适应模糊最优控制方法及系统
CN109884886A (zh) * 2019-03-29 2019-06-14 大连海事大学 一种基于宽度学习的船舶运动无模型自适应最优控制方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
HAIQING SHEN,HIROTADA HASHIMOTO,CHEN GUO: "Automatic collision avoidance of multiple ships based on deep Q-learning", 《APPLIED OCEAN RESEARCH》 *
QI LIU,TIESHAN LI,XIAOYANG GAO: "Virtual guide automatic berthing control of marine ships based on heuristic dynamic programming iteration method", 《NEUROCOMPUTING》 *
朱丽燕; 李铁山; 单麒赫: "船舶航向非线性离散系统自适应模糊最优控制", 《哈尔滨工程大学学报》 *
秦可; 卜仁祥; 李铁山; 刘勇; 郑力铭: "基于PCA和SAPSO的船舶风压差神经网络预测模型", 《上海海事大学学报》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112650233A (zh) * 2020-12-15 2021-04-13 大连海事大学 死区限制下基于反步法与自适应动态规划的无人船轨迹跟踪最优控制方法
CN112650233B (zh) * 2020-12-15 2023-11-10 大连海事大学 无人船轨迹跟踪最优控制方法
CN113110468A (zh) * 2021-04-22 2021-07-13 中国船舶重工集团公司第七0七研究所九江分部 一种应用于欠驱动双桨双舵船舶自主靠泊的控制方法
CN113110468B (zh) * 2021-04-22 2022-07-26 中国船舶重工集团公司第七0七研究所九江分部 一种应用于欠驱动双桨双舵船舶自主靠泊的控制方法
CN113110511A (zh) * 2021-05-19 2021-07-13 大连海事大学 一种基于广义模糊双曲模型的智能船舶航向控制方法
CN113110511B (zh) * 2021-05-19 2024-04-05 大连海事大学 一种基于广义模糊双曲模型的智能船舶航向控制方法
CN113536463A (zh) * 2021-07-20 2021-10-22 大连海事大学 一种基于改进梯度下降法的神经网络船舶整体模型逼近方法
CN113536463B (zh) * 2021-07-20 2024-04-02 大连海事大学 一种基于改进梯度下降法的神经网络船舶整体模型逼近方法
CN115145282A (zh) * 2022-07-18 2022-10-04 中国船舶重工集团公司第七0七研究所九江分部 一种欠驱动船舶自动靠泊鲁棒自适应控制方法

Also Published As

Publication number Publication date
CN111880546B (zh) 2023-09-19

Similar Documents

Publication Publication Date Title
CN111880546B (zh) 一种基于自适应动态规划算法的虚拟引导船舶自动靠泊控制方法
CN103592849B (zh) 一种船舶动力定位控制方法
CN101963784A (zh) 基于支持向量机和广义预测控制算法的船舶动力定位方法
Mu et al. Fuzzy-based optimal adaptive line-of-sight path following for underactuated unmanned surface vehicle with uncertainties and time-varying disturbances
CN115016496A (zh) 基于深度强化学习的水面无人艇路径跟踪方法
CN110716574B (zh) 一种基于深度q网络的uuv实时避碰规划方法
CN114115262B (zh) 基于方位角信息的多auv执行器饱和协同编队控制系统和方法
CN113821035A (zh) 无人船轨迹追踪控制方法和装置
Londhe et al. Robust proportional derivative (PD)-like fuzzy control designs for diving and steering planes control of an autonomous underwater vehicle
Wang et al. Path-following optimal control of autonomous underwater vehicle based on deep reinforcement learning
Knudsen et al. Deep learning for station keeping of AUVs
Kanazawa et al. A multiple-output hybrid ship trajectory predictor with consideration for future command assumption
CN117452827B (zh) 一种欠驱动无人艇轨迹跟踪控制方法
Chen et al. Adaptive optimal formation control for unmanned surface vehicles with guaranteed performance using actor‐critic learning architecture
CN112987741A (zh) 面向不确定干扰的船舶航向智能控制方法
Fjerdingen et al. Auv pipeline following using reinforcement learning
CN117311142A (zh) 一种融合粒子群算法与神经网络预测控制的dp船舶运动控制与推力分配协同控制方法
Li Dynamic positioning of ships using a planned neural network controller
Jose et al. Navigating the Ocean with DRL: Path following for marine vessels
Ngongi et al. Design of generalised predictive controller for dynamic positioning system of surface ships
Vianna et al. Neural Network Based Model Predictive Control for an Autonomous Vehicle
Peng et al. Online Deep Learning Control of an Autonomous Surface Vehicle Using Learned Dynamics
Sun et al. Deep learning-based trajectory tracking control forunmanned surface vehicle
Yang et al. Adaptive fuzzy modeling of hovering submarine based on on-line clustering
Cavalletti et al. A comparative study between switching and adaptive controllers for a remotely operated vehicle

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant