CN108594639B - 一种基于强化学习的全垫升气垫船航迹跟踪控制方法 - Google Patents

一种基于强化学习的全垫升气垫船航迹跟踪控制方法 Download PDF

Info

Publication number
CN108594639B
CN108594639B CN201810261836.5A CN201810261836A CN108594639B CN 108594639 B CN108594639 B CN 108594639B CN 201810261836 A CN201810261836 A CN 201810261836A CN 108594639 B CN108594639 B CN 108594639B
Authority
CN
China
Prior art keywords
hovercraft
neural network
control
learning
track
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810261836.5A
Other languages
English (en)
Other versions
CN108594639A (zh
Inventor
王元慧
佘文超
丁福光
王成龙
刘向波
张放
张博
佟海艳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Engineering University
Original Assignee
Harbin Engineering University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Engineering University filed Critical Harbin Engineering University
Priority to CN201810261836.5A priority Critical patent/CN108594639B/zh
Publication of CN108594639A publication Critical patent/CN108594639A/zh
Application granted granted Critical
Publication of CN108594639B publication Critical patent/CN108594639B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/0265Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
    • G05B13/027Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion using neural networks only
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
    • G05B13/045Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance using a perturbation signal
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • G05D1/0206Control of position or course in two dimensions specially adapted to water vehicles

Landscapes

  • Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • Health & Medical Sciences (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Feedback Control In General (AREA)
  • Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)

Abstract

本发明提供的是一种基于强化学习的全垫升气垫船航迹跟踪控制方法。1.建立全垫升气垫船四自由度运动学模型和动力学模型;2.运用PID控制实现全垫升气垫船的航向控制;3.运用滑模控制实现全垫升气垫船的航速控制。4.运用LOS法实现全垫升气垫船的航迹跟踪;5.运用RBF神经网络实现参数调优,最终实现理想的全垫升气垫船航迹跟踪控制。本发明所述的航迹跟踪控制控制方法,不依赖于被控对象和环境,方法实现简单,抗干扰能力强,控制效果出色,相较于传统的航迹跟踪控制器其算法更加智能,自适应性更强,鲁棒性能更好,跟踪效果更加平滑,跟踪误差小。

Description

一种基于强化学习的全垫升气垫船航迹跟踪控制方法
技术领域
本发明涉及的是一种船舶航迹跟踪控制方法,具体地说是一种基于强化学习的全垫升气垫船航迹跟踪控制方法。
背景技术
全垫升气垫船是一种高性能船舶,在运输领域有着其独特的应用。全垫升气垫船操控复杂且特殊,易受风浪影响,操作不当易发生横倾、侧滑、埋首等现象,因此研究关于其运动控制十分必要。
发明内容
本发明的目的在于提供一种能够使全垫升气垫船沿着预定轨迹以给定速度运动的基于强化学习的全垫升气垫船航迹跟踪控制方法。
本发明的目的是这样实现的:
步骤1.建立全垫升气垫船四自由度运动学模型和动力学模型;
步骤2.运用PID控制实现全垫升气垫船的航向控制;
步骤3.运用滑模控制实现全垫升气垫船的航速控制;
步骤4.运用LOS法实现全垫升气垫船的航迹跟踪;
步骤5.运用RBF神经网络实现参数调优,最终实现理想的全垫升气垫船航迹跟踪控制。
本发明还可以包括:
1、所述运用LOS法实现全垫升气垫船的航迹跟踪具体包括:
设全垫升气垫船当前的位置为P(x,y),当前跟踪的目标为Pk+1(xk+1,yk+1), 上一个跟踪目标为Pk(xk,yk),由于实际气垫船在转向过程中存在漂角所以气垫船所需跟踪的航向期望角即LOS角为:
Figure BDA0001610428530000011
其中β为当前漂角,
使用
Figure BDA0001610428530000012
代替β作为全垫升气垫船航向期望角的补偿角,
Figure BDA0001610428530000013
满足的一个函数为:
Figure BDA0001610428530000021
其中,k为一个常量,kmax为全垫升气垫船所能提供的最大转向空气舵舵角;
初始期望航迹点的选择和切换使用遍历法,即先找出所有航迹点中距离当前位置最近的点,下一个点就是期望航迹点;在折线处转向时使用提前转向的方法,即到距离最近的航迹点一定距离时提前跟踪下一个航迹点,起转距离根据下式确定:
Figure BDA0001610428530000022
式中,V为全垫升气垫船进入回转前的航速,T为全垫升气垫船应舵指数,t1为全垫升气垫船舵角达到制定舵角值所用的时间,
Figure BDA0001610428530000023
为全垫升气垫船回转滞后时间,K为全垫升气垫船的回转性指数,ΔC为转向角,δ0为操舵角。
2、所述运用RBF神经网络实现参数调优具体包括:
以航向偏差为输入层、每个调节参数为输出层设计控制参数神经网络系统,设置一层隐含层,所述隐含层含有10神经网络单元,共有7组神经网络,在此基础上实现神经网络参数的在线学习,
RBF神经网络隐含层的激活函数采用高斯函数,即:
Figure BDA0001610428530000024
式中,hj是第j个高斯基函数的输出值,x表示网络的输入,cj是第j个高斯基函数的中心,cj是第j个高斯基函数的宽度,
最终RBF神经网络的输出表示为:
Kp=W1·h1(ye)
Ki=W2·h2(ye)
Kd=W3·h3(ye)
μ1=W4·h4(ye)
σ1=W5·h5(ye)
k=W6·h6(ye)
DAC=W7·h7(ye)
式中,W为权重向量,h(ye)是隐含层输出向量,所构造RBF神经网络的学习参数包括各基函数的中心cj和宽度σj,以及隐含层到输出层的权重向量W,其初始参数值选取采取经验法;
根据航迹偏差值计算得到强化信号,采用强化学习算法实现RBF神经网络的参数学习,在每一个学习周期中,每个神经网络的输出会对应一个权重的变化量Δwt,权重向量W将按下式进行参数调整,
Wt+1=Wt+Δwt
式中,Wt表示t时刻权重,Wt+1为下一周期的权重,
对于Kp,定义神经网络的输出误差Et为:
Figure BDA0001610428530000031
Kpd是参数Kp的期望值,采用航迹偏差值情况来近似代替这个误差,即:
Figure BDA0001610428530000032
式中,
Figure BDA0001610428530000033
表示期望的航迹偏差值,M为当前航迹的偏差值;
因此,权重的变化量Δwt表示为:
Figure BDA0001610428530000034
其中,η1是学习率,则权重向量W的学习过程表示为:
Figure BDA0001610428530000035
同理,参数
Figure BDA0001610428530000036
和参数
Figure BDA0001610428530000037
的算法为:
Figure BDA0001610428530000041
Figure BDA0001610428530000042
当前控制技术的发展十分迅猛,人工智能技术等受到越来越广泛的关注,其在参数寻优方面有着独特的作用。本发明是一种较为简单的,综合了多种控制方法的全垫升气垫船航迹跟踪控制方法。其主要基于强化学习,以航迹偏差作为强化信号,调整RBF神经网络参数,从而得到优化的控制器参数。
本方法的有益效果为:
1.本发明引入了LOS法进行航迹跟踪控制器的设计,针对具有欠驱动特性的能够满足其航迹跟踪控制的要求。LOS法通过控制全垫升气垫船的航向达到航迹跟踪的目的,方法实现简单,抗干扰能力强,控制效果出色,且不依赖于被控对象的模型,即可以在模型参数不确定的情况下,或者外界扰动对船模影响较大的环境中设计控制器,完成对目标模型的控制。
2.神经网络参数控制算法借助神经网络的自学习,自组织能力,可实现参数的在线自整定和优化。相较于固定参数的控制器,基于强化学习的RBF神经网络控制器的自适应性更强,鲁棒性能更好,航迹跟踪更准确,效率更高,延长设备的使用寿命。
附图说明
附图1为全垫升气垫船航迹跟踪控制原理图。
具体实施方式
下面举例对本发明做更详细的描述。
步骤1.建立全垫升气垫船的运动学模型和动力学模型。
全垫升气垫船的水平面四自由度运动学模型为以下形式:
Figure BDA0001610428530000043
引用牛顿第二定律,全垫升气垫船的水平面四自由度运动动力学模型为以下形式:
Figure BDA0001610428530000051
式中,m为全垫升气垫船的质量;u为全垫升气垫船的纵向速度;v为全垫升气垫船的横向速度;r为全垫升气垫船的转艏角速度;p为全垫升气垫船的横摇角速度;Ix,Iz为全垫升气垫船对轴的转动惯量;Fx,Fy,Mx,Mz为全垫升气垫船所受到的轴向合力及绕x轴和z轴的合力矩,合力(矩)的计算需要考虑如下几种力(矩):
Figure BDA0001610428530000052
式中,下标a表示空气动力,h表示水动力,m表示空气动量力,p表示推进力,R表示舵力。
以上两组运动学模型和动力学模型方程组组成完整的气垫船四自由度操纵运动微分方程组。
步骤2.运用PID控制实现全垫升气垫船的航向控制。
其中,控制偏差为:
e(t)=r(t)-c(t)
Figure BDA0001610428530000053
位置式PID算法,根据采样时刻的偏差值来计算控制量的大小。现以采样时刻点kT代表经过的时间t,用每步误差e(k)与采样时间T乘积之和代表积分,用每步误差e(k)与采样时间T之商代表微分,则可做如下的近似变换:
t=kT(k=0,1,2…)
Figure BDA0001610428530000054
Figure BDA0001610428530000055
为了保证这样的近似变换有足够的精度,采样周期T需要足够短。将e(kT) 简化表示为e(k),即可得位置式PID的离散表达式为:
Figure BDA0001610428530000061
由于位置式PID是全局输出,每一次的输出值都与过去的状态有关,若前面的采样计算出现误差,那么其后的输出值就都会受到其影响。增量式PID采用输出控制量增量Δu(k)的办法来解决位置式PID可能带来的问题。
其算法如下,由递推原理可得:
Figure BDA0001610428530000062
相减可得
Δu(k)=Kp[e(k)-e(k-1)]+Kie(k)+Kd[e(k)-2e(k-1)]+e(k-2)]
=KpΔe(k)+Kie(k)+Kd[Δe(k)-Δe(k-1)
式中Δe(k)=e(k)-e(k-1)
步骤3.运用滑模控制实现全垫升气垫船的航速控制。
根据实际工程需要,通常假定航行器的航行速度(即纵向速度)为恒定值。由于欠驱动船舶纵向速度u常远远大于横向速度v,即u>>v。为了简化控制器设计,在纵向速度控制器设计过程中,可以忽略横向速度。设航行器的期望速度为 ud。那么,可以引入如下纵向速度误差ue=u-ud。为了镇定纵向速度误差,设计如下非奇异终端滑模面:
Figure BDA0001610428530000063
其中,μsm为待确定的正定常数,p1和q1均为奇数。对非奇异终端滑模面S1(t) 求导,能够计算得到其一阶导数为:
Figure BDA0001610428530000064
在不考虑航行器参数摄动的条件下,通过求取
Figure BDA0001610428530000065
可以得到等效控制律:
Figure BDA0001610428530000071
其中,“^”为UUV水动力系数的估计值;该估计值可以通过水池实验获得。假设航行器的水动力系数的摄动存在上界,即
Figure BDA0001610428530000072
由于存在参数摄动以及外界海流干扰的存在,等效控制律并不能保证航行器的控制效果,因此,必须引入趋近律。选取如下趋近律:
τlr=-Klsgn(S1)
其中,K1为待设计的切换增益参数,其定义为
Figure BDA0001610428530000073
其中,σsm为待确定的正定常数。
纵向速度控制器为τ1eq和τ1r之和,可以得到:
Figure BDA0001610428530000074
步骤4.运用LOS法实现全垫升气垫船的航迹跟踪。
由于LOS理论认为只要使被控船舶的速度方向对准期望到达的航迹点,被控船舶就能达到期望的位置。因此,控制好全垫升气垫船的航向就成了实现航迹跟踪的重点所在。
假设全垫升气垫船当前的位置为P(x,y),当前跟踪的目标为Pk+1 (xk+1,yk+1),上一个跟踪目标为Pk(xk,yk)。考虑到实际气垫船在转向过程中存在漂角,则气垫船所需跟踪的航向期望角(LOS角)为:
Figure BDA0001610428530000075
其中β为当前漂角,由于全垫升气垫船的漂角在实际中不好得到。这里使用
Figure BDA0001610428530000076
代替β作为全垫升气垫船航向期望角的补偿角。
Figure BDA0001610428530000077
满足的一个函数为:
Figure BDA0001610428530000078
其中,k为一个常量,kmax为全垫升气垫船所能提供的最大转向空气舵舵角。
初始期望航迹点的选择和切换使用遍历法,即先找出所有航迹点中距离当前位置最近的点,下一个点就是期望航迹点。全垫升气垫船转向不易,在选择航迹点时不宜过于密集,在折线处转向时可以使用提前转向的方法,即到距离最近的航迹点一定距离时提前跟踪下一个航迹点,起转距离与多种因素有关,工程上可根据下式确定:
Figure BDA0001610428530000081
式中,V为全垫升气垫船进入回转前的航速,T为全垫升气垫船应舵指数,t1为全垫升气垫船舵角达到制定舵角值所用的时间,
Figure BDA0001610428530000082
为全垫升气垫船回转滞后时间,K为全垫升气垫船的回转性指数,ΔC为转向角,δ0为操舵角。在实际航行中可根据经验限制起转距离大于0.2海里并小于1海里。
步骤5.运用RBF神经网络实现参数调优,最终实现理想的全垫升气垫船航迹跟踪控制。
从步骤二到步骤四中,出现了很多待定参数,例如PID参数Kp,Ki,Kd;滑模控制参数μ1,σ1;LOS法中的k,DAC。这些待定参数可以通过工程的方法确定一个初始值,但很难保证这些值是最优值。因此所设计的控制器如果有自适应性,那么系统控制性能将得到提升。
为此,设计控制参数神经网络系统以航向偏差为输入层,每个调节参数为输出层,为了便于计算机计算,这里只设置一层隐含层,隐含层含有10神经网络单元,共有7组神经网络,在此基础上实现神经网络参数的在线学习。
RBF神经网络隐含层的激活函数采用高斯函数,即:
Figure BDA0001610428530000083
式中,hj是第j个高斯基函数的输出值,x表示网络的输入,cj是第j个高斯基函数的中心,cj是第j个高斯基函数的宽度。
最终RBF神经网络的输出可表示为:
Kp=W1·h1(ye)
Ki=W2·h2(ye)
Kd=W3·h3(ye)
μ1=W4·h4(ye)
σ1=W5·h5(ye)
k=W6·h6(ye)
DAC=W7·h7(ye)
式中,W为权重向量,h(ye)是隐含层输出向量。因此,所构造RBF神经网络的学习参数包括各基函数的中心cj和宽度σj,以及隐含层到输出层的权重向量W,其初始参数值选取采取经验法。
为实现RBF神经网络的参数学习,通常采用有导师的学习算法,但对于本结构中的输出参数Kp,Ki,Kd,μ1,σ1,k,DAC的期望值并不知道,即没有明确的导师信号。强化学习算法可以采用比较粗糙的训练数据,仅仅使用“评价”信号,即强化信号,通过与环境的交互来评价控制作用的优劣,采用“奖”、“罚”算法训练网络。为此,根据航迹偏差值计算得到强化信号,采用强化学习算法实现RBF神经网络的参数学习。在每一个学习周期中,每个神经网络的输出会对应一个权重的变化量Δwt,权重向量W将按下式进行参数调整。
Wt+1=Wt+Δwt
式中,Wt表示t时刻权重,Wt+1为下一周期的权重。
以Kp为例,定义神经网络的输出误差Et为:
Figure BDA0001610428530000091
Kpd是参数Kp的期望值,显然是不可知的,但是系统的控制效果可以间接的反应参数是否合适,故采用航迹偏差值情况来近似代替这个误差,即:
Figure BDA0001610428530000101
式中,
Figure BDA0001610428530000102
表示期望的航迹偏差值,取决于设计人员对航迹跟踪的要求;M为当前航迹的偏差值。
因此,权重的变化量Δwt可表示为:
Figure BDA0001610428530000103
其中,η1是学习率。则权重向量W的学习过程可表示为:
Figure BDA0001610428530000104
同理,可得参数
Figure BDA0001610428530000105
和参数
Figure BDA0001610428530000106
的算法为:
Figure BDA0001610428530000107
Figure BDA0001610428530000108

Claims (1)

1.一种基于强化学习的全垫升气垫船航迹跟踪控制方法,其特征是:
步骤1.建立全垫升气垫船四自由度运动学模型和动力学模型;
步骤2.运用PID控制实现全垫升气垫船的航向控制;
步骤3.运用滑模控制实现全垫升气垫船的航速控制;
步骤4.运用LOS法实现全垫升气垫船的航迹跟踪;具体包括:
设全垫升气垫船当前的位置为P(x,y),当前跟踪的目标为Pk+1(xk+1,yk+1),上一个跟踪目标为Pk(xk,yk),由于实际气垫船在转向过程中存在漂角所以气垫船所需跟踪的航向期望角即LOS角为:
Figure FDA0002712224720000011
其中β为当前漂角,
使用
Figure FDA0002712224720000012
代替β作为全垫升气垫船航向期望角的补偿角,
Figure FDA0002712224720000013
满足的一个函数为:
Figure FDA0002712224720000014
其中,k为一个常量,kmax为全垫升气垫船所能提供的最大转向空气舵舵角;
初始期望航迹点的选择和切换使用遍历法,即先找出所有航迹点中距离当前位置最近的点,下一个点就是期望航迹点;在折线处转向时使用提前转向的方法,即到距离最近的航迹点一定距离时提前跟踪下一个航迹点,起转距离根据下式确定:
Figure FDA0002712224720000015
式中,V为全垫升气垫船进入回转前的航速,T为全垫升气垫船应舵指数,t1为全垫升气垫船舵角达到制定舵角值所用的时间,
Figure FDA0002712224720000016
为全垫升气垫船回转滞后时间,K为全垫升气垫船的回转性指数,ΔC为转向角,δ0为操舵角;
步骤5.运用RBF神经网络实现参数调优,最终实现理想的全垫升气垫船航迹跟踪控制;具体包括:
以航向偏差为输入层、每个调节参数为输出层设计控制参数神经网络系统,设置一层隐含层,所述隐含层含有10神经网络单元,共有7组神经网络,在此基础上实现神经网络参数的在线学习,
RBF神经网络隐含层的激活函数采用高斯函数,即:
Figure FDA0002712224720000021
式中,hj是第j个高斯基函数的输出值,x表示网络的输入,cj是第j个高斯基函数的中心,cj是第j个高斯基函数的宽度,
最终RBF神经网络的输出表示为:
Kp=W1·h1(ye)
Ki=W2·h2(ye)
Kd=W3·h3(ye)
μ1=W4·h4(ye)
σ1=W5·h5(ye)
k=W6·h6(ye)
DAC=W7·h7(ye)
式中,W为权重向量,h(ye)是隐含层输出向量,所构造RBF神经网络的学习参数包括各基函数的中心cj和宽度σj,以及隐含层到输出层的权重向量W,其初始参数值选取采取经验法;
根据航迹偏差值计算得到强化信号,采用强化学习算法实现RBF神经网络的参数学习,在每一个学习周期中,每个神经网络的输出会对应一个权重的变化量Δwt,权重向量W将按下式进行参数调整,
Wt+1=Wt+Δwt
式中,Wt表示t时刻权重,Wt+1为下一周期的权重,
对于Kp,定义神经网络的输出误差Et为:
Figure FDA0002712224720000031
Kpd是参数Kp的期望值,采用航迹偏差值情况来近似代替这个误差,即:
Figure FDA0002712224720000032
式中,
Figure FDA0002712224720000033
表示期望的航迹偏差值,M为当前航迹的偏差值;
因此,权重的变化量Δwt表示为:
Figure FDA0002712224720000034
其中,η1是学习率,则权重向量W的学习过程表示为:
Figure FDA0002712224720000035
同理,参数
Figure FDA0002712224720000036
和参数
Figure FDA0002712224720000037
的算法为:
Figure FDA0002712224720000038
Figure FDA0002712224720000039
CN201810261836.5A 2018-03-28 2018-03-28 一种基于强化学习的全垫升气垫船航迹跟踪控制方法 Active CN108594639B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810261836.5A CN108594639B (zh) 2018-03-28 2018-03-28 一种基于强化学习的全垫升气垫船航迹跟踪控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810261836.5A CN108594639B (zh) 2018-03-28 2018-03-28 一种基于强化学习的全垫升气垫船航迹跟踪控制方法

Publications (2)

Publication Number Publication Date
CN108594639A CN108594639A (zh) 2018-09-28
CN108594639B true CN108594639B (zh) 2020-12-22

Family

ID=63624720

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810261836.5A Active CN108594639B (zh) 2018-03-28 2018-03-28 一种基于强化学习的全垫升气垫船航迹跟踪控制方法

Country Status (1)

Country Link
CN (1) CN108594639B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109407682B (zh) * 2018-09-29 2021-06-15 大连海洋大学 基于图像特征深度强化学习的auv管道循管方法
CN109460041A (zh) * 2018-12-28 2019-03-12 珠海市汉图达科技有限公司 一种无人艇自动舵控制系统及方法
CN109739090A (zh) * 2019-01-15 2019-05-10 哈尔滨工程大学 一种自主式水下机器人神经网络强化学习控制方法
CN109884886B (zh) * 2019-03-29 2021-09-28 大连海事大学 一种基于宽度学习的船舶运动无模型自适应最优控制方法
CN110244077B (zh) * 2019-06-04 2021-03-30 哈尔滨工程大学 一种热式风速传感器恒功率调节与精度补偿方法
CN113110468B (zh) * 2021-04-22 2022-07-26 中国船舶重工集团公司第七0七研究所九江分部 一种应用于欠驱动双桨双舵船舶自主靠泊的控制方法
CN113156965B (zh) * 2021-04-30 2023-01-03 哈尔滨工程大学 一种基于纵向速度规划的气垫船高速回转控制方法
GB2621306A (en) * 2021-04-30 2024-02-14 Univ Harbin Eng Hovercraft high-speed rotation control method based on longitudinal speed planning
GB2618860A (en) * 2021-09-29 2023-11-22 Univ Harbin Eng Path tracking method for air cushion vehicle
CN113867352B (zh) * 2021-09-29 2024-09-06 哈尔滨工程大学 一种全垫升气垫船路径跟踪方法
CN118092188B (zh) * 2024-04-17 2024-07-02 哈尔滨工程大学三亚南海创新发展基地 一种气垫船进坞辅助控制方法及系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005031789A (ja) * 2003-07-08 2005-02-03 Univ Nihon 画像情報を利用したrbfネットワークによる物体種別形状判別方法及びそのシステム
JP2013238247A (ja) * 2013-08-21 2013-11-28 Nippon Yusen Kk 舶用機関の制御方法及びその制御装置
CN104595106A (zh) * 2014-05-19 2015-05-06 湖南工业大学 基于强化学习补偿的风力发电变桨距控制方法
CN104881040A (zh) * 2015-05-15 2015-09-02 长沙理工大学 一种主动抑制参数横摇的船舶航迹跟踪预测控制方法
CN106292287A (zh) * 2016-09-20 2017-01-04 哈尔滨工程大学 一种基于自适应滑模控制的uuv路径跟踪方法
CN106403957A (zh) * 2016-11-03 2017-02-15 哈尔滨工程大学 一种全垫升气垫船航路点导引控制方法
CN106950955A (zh) * 2017-03-17 2017-07-14 武汉理工大学 基于改进los引导算法的船舶航迹控制方法
CN107065569A (zh) * 2017-05-31 2017-08-18 哈尔滨工程大学 基于rbf神经网络补偿的船舶动力定位滑模控制系统及方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9045211B2 (en) * 2013-09-17 2015-06-02 The United States Of America, As Represented By The Secretary Of The Navy Actively controlled curvature robotic pectoral fin

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005031789A (ja) * 2003-07-08 2005-02-03 Univ Nihon 画像情報を利用したrbfネットワークによる物体種別形状判別方法及びそのシステム
JP2013238247A (ja) * 2013-08-21 2013-11-28 Nippon Yusen Kk 舶用機関の制御方法及びその制御装置
CN104595106A (zh) * 2014-05-19 2015-05-06 湖南工业大学 基于强化学习补偿的风力发电变桨距控制方法
CN104881040A (zh) * 2015-05-15 2015-09-02 长沙理工大学 一种主动抑制参数横摇的船舶航迹跟踪预测控制方法
CN106292287A (zh) * 2016-09-20 2017-01-04 哈尔滨工程大学 一种基于自适应滑模控制的uuv路径跟踪方法
CN106403957A (zh) * 2016-11-03 2017-02-15 哈尔滨工程大学 一种全垫升气垫船航路点导引控制方法
CN106950955A (zh) * 2017-03-17 2017-07-14 武汉理工大学 基于改进los引导算法的船舶航迹控制方法
CN107065569A (zh) * 2017-05-31 2017-08-18 哈尔滨工程大学 基于rbf神经网络补偿的船舶动力定位滑模控制系统及方法

Also Published As

Publication number Publication date
CN108594639A (zh) 2018-09-28

Similar Documents

Publication Publication Date Title
CN108594639B (zh) 一种基于强化学习的全垫升气垫船航迹跟踪控制方法
CN109062237B (zh) 一种无人倾转旋翼机自抗扰姿态控制方法
CN110308735B (zh) 一种针对输入时滞的欠驱动uuv轨迹跟踪滑模控制方法
CN109976349B (zh) 一种含约束无人船的路径跟踪制导与控制结构的设计方法
Kada et al. Robust PID controller design for an UAV flight control system
Cui et al. Adaptive super-twisting trajectory tracking control for an unmanned aerial vehicle under gust winds
CN107479383B (zh) 基于鲁棒设计的高超声速飞行器神经网络复合学习控制方法
CN105607473B (zh) 小型无人直升机的姿态误差快速收敛自适应控制方法
CN102411305A (zh) 单旋翼直升机/涡轴发动机综合抗扰控制系统设计方法
CN110262513B (zh) 一种海洋机器人轨迹跟踪控制结构的设计方法
CN103926839A (zh) 一种轮式移动机器人的运动分段控制方法
CN109828467B (zh) 一种数据驱动的无人船强化学习控制器结构及设计方法
CN109062055A (zh) 一种基于Back-stepping鲁棒自适应动态面的近空间飞行器控制系统
CN107203138B (zh) 一种输入输出饱和的飞行器鲁棒控制方法
An et al. Proximate time optimal for the heading control of underactuated autonomous underwater vehicle with input nonlinearities
CN109683624A (zh) 用于小型无人直升机姿态控制的非线性鲁棒控制方法
CN109856965B (zh) 一种波浪滑翔器航向跟踪控制方法
Yu et al. Analytical cooperative entry guidance for rendezvous and formation flight
Ansari et al. Retrospective cost adaptive control of generic transport model under uncertainty and failure
CN109116727B (zh) 一种基于低通滤波器的pid型一阶全格式无模型自适应航速控制算法
CN114637312A (zh) 一种基于智能变形决策的无人机节能飞行控制方法及系统
Zhao et al. Robust path following control of underactuated unmanned surface vehicle with disturbances and input saturation
CN112947073B (zh) 一种基于模型预测控制的舰载机滑行轨迹跟踪方法
Lorenz et al. A decoupled approach for trajectory generation for an unmanned rotorcraft
CN110389525B (zh) 基于极限学习机的混联机构自适应反步控制方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant