CN107346138A - 一种基于增强学习算法的无人船侧向控制方法 - Google Patents

一种基于增强学习算法的无人船侧向控制方法 Download PDF

Info

Publication number
CN107346138A
CN107346138A CN201710458496.0A CN201710458496A CN107346138A CN 107346138 A CN107346138 A CN 107346138A CN 201710458496 A CN201710458496 A CN 201710458496A CN 107346138 A CN107346138 A CN 107346138A
Authority
CN
China
Prior art keywords
unmanned boat
lateral
learning algorithm
performance
optimization
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710458496.0A
Other languages
English (en)
Other versions
CN107346138B (zh
Inventor
赵东明
周浩
朱楷
柳欣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University of Technology WUT
Original Assignee
Wuhan University of Technology WUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University of Technology WUT filed Critical Wuhan University of Technology WUT
Priority to CN201710458496.0A priority Critical patent/CN107346138B/zh
Publication of CN107346138A publication Critical patent/CN107346138A/zh
Application granted granted Critical
Publication of CN107346138B publication Critical patent/CN107346138B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • G05D1/0206Control of position or course in two dimensions specially adapted to water vehicles
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/041Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a variable is automatically adjusted to optimise the performance

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • General Physics & Mathematics (AREA)
  • Remote Sensing (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明公开了一种基于增强学习算法的无人船侧向控制方法,建立无人船行驶的动力学模型,采用简化的船体‑路径一体化模型;根据无人船侧向控制性能的要求,选择无人船侧向控制器的设计方案;无人船侧向控制器中增强学习控制器采用Actor‑Critic结构,分为执行器网络和评价器网络;设计无人船的侧向偏差参考模型;通过对性能指标的优化,实现系统状态或输出对参考模型状态的跟随,进而保证了系统的性能优化。本发明的优点在于:增强学习基于动物学习心理学的“试误法”原理,使得无人船能够在与环境的交互过程中根据评价性的反馈信号实现序贯决策的优化,从而可以用于解决某些监督学习难以应用的优化控制问题。

Description

一种基于增强学习算法的无人船侧向控制方法
技术领域
本发明涉及无人艇控制技术领域,具体涉及一种基于增强学习算法的无人 船侧向控制方法。
背景技术
海底地形地貌是一切海洋开发和利用活动的基础,其信息获取是海洋测绘 中最基础的工作。近年来,随着卫星导航定位、声学探测、数据通讯、计算机 数据处理与可视化、图像学和图形学以及现代测量数据处理理论和方法等相关 领域的发展,我国的海底地形地貌信息获取技术正在向高精度、高分辨率、自 主集成、综合化和标准化方向发展。
无人船是一种多用途的观测平台。可搭载多种海洋测量传感器用于实施多 种专业测量,无人水面测量船作为一种执行实时、无人、自动测量的综合作业 平台,将测量人员从繁重的水下地形测量工作中解脱出来、是现代海洋测量技 术装备发展的必然趋势。
无人船需要在复杂的海洋环境中自主航行和作业,因此无人船对操纵性、 控制性能和可靠性均提出了更为苛刻的要求。为了保证无人船安全、可靠、自 主地完成各种复杂任务,这就要求自主地完成各种复杂任务,这就要求它具备 灵活机动性和环境适应能力,为了更好的完成任务就需要研究更加先进的无人 船智能运动控制技术。
发明内容
本发明的目的就是要针对现有装置的不足,其能够优化无人船侧向控制器 的设计,提高无人船的控制性能,获得更好的控制效果。
为实现上述目的,本发明所涉及的一种基于增强学习算法的无人船侧向控 制方法,包括如下步骤:
步骤1:建立无人船行驶的动力学模型,采用简化的船体-路径一体化模 型;
步骤2:根据无人船侧向控制性能的要求,选择无人船侧向控制器的设计 方案;
步骤3:无人船侧向控制器中增强学习控制器采用Actor-Critic结构, 分为执行器网络和评价器网络;
步骤4:设计无人船的侧向偏差参考模型;
步骤5:通过对性能指标的优化,实现系统状态或输出对参考模型状态的 跟随,进而保证了系统的性能优化。
进一步地,所述步骤1:
采用如下简化的船体-路径一体化模型:
其中:y为路径跟踪的侧向偏差,θ为方向角偏差,即船体的纵轴方向与 期望路径切线方向的偏差;a(t)为转向舵偏角,ac(t)为转向舵偏角的控制量; τa(t)为方向控制的时间常数;ρ为路径曲率。
更进一步地,所述步骤2:
所述基于增强学习的自适应PID控制律具有如下形式:
其中:kp0,ka0,kD和kI为固定增益常数,根据手工调整的PID参数设定; Δka,Δkp为执行器神经网络的输出。
进一步地,所述步骤3:
所述评价器网络采用CMAC网络,第一层特征映射Cqn→f1是由输入状态空 间到状态空间检测器的层叠式编码映射,在状态空间检测器中有C个针对整个 状态空间量化编码结构A1,A2,A3,……,AC,第二层状态特征映射f2对每个状 态检测器单元计算唯一的物理地址,此时需要的物理地址单元总数为Cqn,最 后一层映射为输出映射,该映射通过对被激活的物理地址单元中的权值求和来 计算输出,学习算法采用TD(λ)学习算法,选择算法的关键参数折扣因子和 适合度轨迹参数;
更进一步地,所述步骤3:
所述执行器网络采用两个多层前馈神经网络,采用高斯行为分布来确定实 际控制量,多维高斯分布进行执行器网络输出的随机探索:
其中:为多个执行器网络输出构成的向量;σ为行为探索的方差,仍然 由如下公式决定:
其中:V(Δy)为评价器对当前状态的值函数估计;σ1,σ2为常数,
进一步地,所述步骤3:
所述执行器网络的学习算法采用如下近似策略梯度估计算法:
其中:称为内部回报,由评价器的时域差值信号来提供,即:
更进一步地,所述步骤4:
为实现路径跟踪性能的优化,考虑采用如下形式的侧向偏差性能参考模 型:
其中:b>0为常数。
进一步地,所述步骤4中:
所述参考模型的基础上,对回报函数的设计如下:
其中:e1、e2和c为常数,且0≤e2≤e1;k<0为回报比例系数。
更进一步地,所述步骤5:
在设计具有期望性能的参考模型的基础上,对回报函数的设计需要考虑系 统状态或输出对参考模型的跟随性能,通常可以采用如下的跟随误差线性函数 形式:rt=c|Δy|
其中:c为比例系数,可以为常数或分段常数,
由于采用了Actor-Critic结构,则增强学习控制器的优化目标是下面的 折扣回报指标:
其中:γ为折扣因子,通常选择为接近1的常数,
通过对性能指标J的优化,实现系统状态或输出对参考模型状态的跟随, 进而保证了系统的性能优化。
本发明的优点在于:增强学习基于动物学习心理学的“试误法”原理,使 得无人船能够在与环境的交互过程中根据评价性的反馈信号实现序贯决策的 优化,从而可以用于解决某些监督学习难以应用的优化控制问题。
附图说明
图1为本发明中自适应PID控制器的结构图;
图2为Actor-Critic结构图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步的详细描述:
如图1~2,一种基于增强学习算法的无人船侧向控制方法,包括如下步骤:
步骤1:建立无人船行驶的动力学模型,采用如下简化的船体-路径一体 化模型:
其中:y为路径跟踪的侧向偏差,θ为方向角偏差,即船体的纵轴方向与 期望路径切线方向的偏差;a(t)为转向舵偏角,ac(t)为转向舵偏角的控制量; τa(t)为方向控制的时间常数;ρ为路径曲率;
步骤2:根据无人船侧向控制性能的要求,选择无人船侧向控制器的设计 方案,基于增强学习的自适应PID控制律具有如下形式:
其中:kp0,ka0,kD和kI为固定增益常数,根据手工调整的PID参数设定; Δka,Δkp为执行器神经网络的输出;
步骤3:无人船侧向控制器中增强学习控制器采用Actor-Critic结构, 分为执行器网络和评价器网络;
评价器网络采用CMAC网络,第一层特征映射Cqn→f1是由输入状态空间到 状态空间检测器的层叠式编码映射,在状态空间检测器中有C个针对整个状态 空间量化编码结构A1,A2,A3,……,AC,第二层状态特征映射f2对每个状态检 测器单元计算唯一的物理地址,此时需要的物理地址单元总数为Cqn,最后一 层映射为输出映射,该映射通过对被激活的物理地址单元中的权值求和来计算 输出,学习算法采用TD(λ)学习算法,选择算法的关键参数折扣因子和适合 度轨迹参数;
执行器网络采用两个多层前馈神经网络,采用高斯行为分布来确定实际控 制量,多维高斯分布进行执行器网络输出的随机探索:
其中:为多个执行器网络输出构成的向量;σ为行为探索的方差,仍然 由如下公式决定:
其中:V(Δy)为评价器对当前状态的值函数估计;σ1,σ2为常数, 学习算法采用如下近似策略梯度估计算法:
其中:称为内部回报,由评价器的时域差值信号来提供,即:
步骤4:设计无人船的侧向偏差参考模型,为实现路径跟踪性能的优化, 考虑采用如下形式的侧向偏差性能参考模型:
其中:b>0为常数;
在参考模型的基础上,对回报函数的设计如下:
其中:e1、e2和c为常数,且0≤e2≤e1;k<0为回报比例系数;
步骤5:在设计具有期望性能的参考模型的基础上,对回报函数的设计需 要考虑系统状态或输出对参考模型的跟随性能,通常可以采用如下的跟随误差 线性函数形式:rt=c|Δy|
其中:c为比例系数,可以为常数或分段常数,
由于采用了Actor-Critic结构,则增强学习控制器的优化目标是下面的 折扣回报指标:
其中:γ为折扣因子,通常选择为接近1的常数,
通过对性能指标J的优化,可以实现系统状态或输出对参考模型状态的跟 随,进而保证了系统的性能优化。
本发明实际使用时:
对于无人船的侧向控制问题,基于增强学习的自适应PID控制律具有如下 形式:
其中:kp0,ka0,kD和kI为固定增益常数,根据手工调整的PID参数设定; Δka,Δkp为执行器神经网络的输出,分别用于对方向角偏差和侧向偏差的比例 增益进行自适应调整。
基于上述自适应PID控制律,增强学习控制器由一个评价器网络和一个执 行器网络构成。
评价器网络的输入为系统的状态,包括:侧向偏差y及其变化率方向 角偏差θ及其变化率输出为系统的状态值函数估计。评价器网络采用CMAC 网络,其结构参数如下:泛化参数C=4,每个输入的量化等级M=7,经过Hash 映射后的物理地址空间大小N=100。学习算法采用TD(λ)算法,有关参数如下: 折扣因子γ=0.95,适合度轨迹参数λ=0.6。
执行器网络的输入与评价器相同,输出用于确定PID控制器的可变增益, 采用两个多层前馈神经网络,中间层节点数为6。Δka,Δkp由高斯分布进行行 为探索,高斯分布的均值由执行器网络输出确定。设两个执行器网络的输出分 别为z1,z2(0≤z1,z2≤1),则Δka,Δkp的均值由如下公式决定:
其中:UΔp,UΔa分别可变增益kp,ka的变化范围。
为实现路径跟踪性能的优化,考虑采用如下形式的侧向偏差性能参考模 型:
其中:b>0为常数。以上参考模型对侧向偏差的变化给出了一种指数收敛 的性能指标曲线,适当地选择常数b可以进一步对系统性能进行优化。
在设计了参考模型的基础上,对回报函数的设计如下:
其中:e1、e2和c为常数,且0≤e2≤e1;k<0为回报比例系数。以上回报函 数的设计使为了尽量是系统侧向偏差的变化接近给定的参考模型,即具有指数 收敛的性能。
根据技术方案的步骤5,基于增强学习的自适应PID控制器的算法描述:
给定回报函数r(Δy),由执行器网络和评价器网络构成的增强学习控制器, 单次运行的时间长度T。
1、初始化学习控制器的参数,包括神经网络的权值,折扣因子γ,时域 差值学习算法的有关控制参数(λ,p0或α),执行器网络的学习因子β,评价 器网络权值的适合度轨迹向量,学习次数n=0。
2、循环,直到满足算法停止的条件。
(1)初始化控制对象的状态,控制时间步t=0。
(2)根据当前的控制对象状态和参考模型状态,计算模型跟随误差;
(3)根据当前时刻的模型跟随误差Δyt,计算执行器网络输出K和评价网 络的输出V(Δyt);
(4)计算实际的PID参数整定ΔK(t),从而计算PID控制器的控制量输出 u;
(5)将输出u作用于控制对象,观测下一采样时刻的对象状态和参考模 型状态,计算新的模型跟随误差,同时计算回报函数rt
(6)对评价器网络的权值,利用TD(λ)算法进行时域差值学习,对执 行器网络,计算策略梯度估计,进行权值的迭代;
(7)t=t+1,若t=T,则n=n+1,返回b),否则,返回c)。
上述算法停止的准则可以选择为系统性能指标达到给定要求或学习次数 达到给定的最大值。
最后,应当指出,以上实施例仅是本发明较有代表性的例子。显然,本发 明不限于上述实施例,还可以有许多变形。凡依据本发明的技术实质对以上实 施例所做的任何简单修改、等同变化及修饰,均应认为属于本发明的保护范围。

Claims (9)

1.一种基于增强学习算法的无人船侧向控制方法,其特征在于:包括如下步骤:
步骤1:建立无人船行驶的动力学模型,采用简化的船体-路径一体化模型;
步骤2:根据无人船侧向控制性能的要求,选择无人船侧向控制器的设计方案;
步骤3:无人船侧向控制器中增强学习控制器采用Actor-Critic结构,分为执行器网络和评价器网络;
步骤4:设计无人船的侧向偏差参考模型;
步骤5:通过对性能指标的优化,实现系统状态或输出对参考模型状态的跟随,进而保证了系统的性能优化。
2.根据权利要求1所述的一种基于增强学习算法的无人船侧向控制方法,其特征在于:所述步骤1:
采用如下简化的船体-路径一体化模型:
其中:y为路径跟踪的侧向偏差,θ为方向角偏差,即船体的纵轴方向与期望路径切线方向的偏差;a(t)为转向舵偏角,ac(t)为转向舵偏角的控制量;τa(t)为方向控制的时间常数;ρ为路径曲率。
3.根据权利要求2所述的一种基于增强学习算法的无人船侧向控制方法,其特征在于:所述步骤2:
所述基于增强学习的自适应PID控制律具有如下形式:
其中:kp0,ka0,kD和kI为固定增益常数,根据手工调整的PID参数设定;Δka,Δkp为执行器神经网络的输出。
4.根据权利要求3所述的一种基于增强学习算法的无人船侧向控制方法,其特征在于:所述步骤3:
所述评价器网络采用CMAC网络,第一层特征映射Cqn→f1是由输入状态空间到状态空间检测器的层叠式编码映射,在状态空间检测器中有C个针对整个状态空间量化编码结构A1,A2,A3,……,AC,第二层状态特征映射f2对每个状态检测器单元计算唯一的物理地址,此时需要的物理地址单元总数为Cqn,最后一层映射为输出映射,该映射通过对被激活的物理地址单元中的权值求和来计算输出,学习算法采用TD(λ)学习算法,选择算法的关键参数折扣因子和适合度轨迹参数。
5.根据权利要求4所述的一种基于增强学习算法的无人船侧向控制方法,其特征在于:所述步骤3:
所述执行器网络采用两个多层前馈神经网络,采用高斯行为分布来确定实际控制量,多维高斯分布进行执行器网络输出的随机探索:
其中:为多个执行器网络输出构成的向量;σ为行为探索的方差,仍然由如下公式决定:
其中:V(Δy)为评价器对当前状态的值函数估计;σ1,σ2为常数。
6.根据权利要求5所述的一种基于增强学习算法的无人船侧向控制方法,其特征在于:所述步骤3:
所述执行器网络的学习算法采用如下近似策略梯度估计算法:
其中:称为内部回报,由评价器的时域差值信号来提供,即:
7.根据权利要求2~6中任意一项所述的一种基于增强学习算法的无人船侧向控制方法,其特征在于:所述步骤4:
为实现路径跟踪性能的优化,考虑采用如下形式的侧向偏差性能参考模型:
其中:b>0为常数。
8.根据权利要求7所述的一种基于增强学习算法的无人船侧向控制方法,其特征在于:所述步骤4中:
所述参考模型的基础上,对回报函数的设计如下:
其中:e1、e2和c为常数,且0≤e2≤e1;k<0为回报比例系数。
9.根据权利要求8所述的一种基于增强学习算法的无人船侧向控制方法,其特征在于:所述步骤5:
在设计具有期望性能的参考模型的基础上,对回报函数的设计需要考虑系统状态或输出对参考模型的跟随性能,通常可以采用如下的跟随误差线性函数形式:rt=c|Δy|
其中:c为比例系数,可以为常数或分段常数,
由于采用了Actor-Critic结构,则增强学习控制器的优化目标是下面的折扣回报指标:
其中:γ为折扣因子,通常选择为接近1的常数,
通过对性能指标J的优化,实现系统状态或输出对参考模型状态的跟随,进而保证了系统的性能优化。
CN201710458496.0A 2017-06-16 2017-06-16 一种基于增强学习算法的无人船侧向控制方法 Active CN107346138B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710458496.0A CN107346138B (zh) 2017-06-16 2017-06-16 一种基于增强学习算法的无人船侧向控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710458496.0A CN107346138B (zh) 2017-06-16 2017-06-16 一种基于增强学习算法的无人船侧向控制方法

Publications (2)

Publication Number Publication Date
CN107346138A true CN107346138A (zh) 2017-11-14
CN107346138B CN107346138B (zh) 2020-05-05

Family

ID=60253073

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710458496.0A Active CN107346138B (zh) 2017-06-16 2017-06-16 一种基于增强学习算法的无人船侧向控制方法

Country Status (1)

Country Link
CN (1) CN107346138B (zh)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108200175A (zh) * 2018-01-04 2018-06-22 浙江大学 基于协同云控制的多无人船编队协同控制系统及方法
CN108287542A (zh) * 2018-01-04 2018-07-17 浙江大学 基于协同云控制的无人机与无人船协作控制系统与方法
CN108536005A (zh) * 2018-03-15 2018-09-14 吉林大学 一种基于模糊神经网络pid船舶航向控制器及其控制方法
CN109521669A (zh) * 2018-11-12 2019-03-26 中国航空工业集团公司北京航空精密机械研究所 一种基于强化学习的转台控制参数自整定方法
CN109719721A (zh) * 2018-12-26 2019-05-07 北京化工大学 一种仿蛇搜救机器人适应性步态自主涌现方法
CN109765916A (zh) * 2019-03-26 2019-05-17 武汉欣海远航科技研发有限公司 一种水面无人艇路径跟踪控制器设计方法
CN109948781A (zh) * 2019-03-21 2019-06-28 中国人民解放军国防科技大学 用于自动驾驶车辆的连续动作在线学习控制方法及系统
CN110471289A (zh) * 2019-08-28 2019-11-19 湖南大学 一种基于视觉导航移动设备的自适应路径跟踪方法及系统
CN110658829A (zh) * 2019-10-30 2020-01-07 武汉理工大学 一种基于深度强化学习的群无人艇智能避碰方法
CN110703792A (zh) * 2019-11-07 2020-01-17 江苏科技大学 基于增强学习的水下机器人姿态控制方法
FR3084867A1 (fr) 2018-08-07 2020-02-14 Psa Automobiles Sa Procede d’assistance pour qu’un vehicule a conduite automatisee suive une trajectoire, par apprentissage par renforcement de type acteur critique a seuil
CN111950733A (zh) * 2019-05-15 2020-11-17 阿里巴巴集团控股有限公司 信息流的排序方法、装置及计算机存储介质
CN113671962A (zh) * 2021-08-20 2021-11-19 湘潭大学 一种无人驾驶铰接式清扫车的横向控制方法
CN114237254A (zh) * 2021-12-20 2022-03-25 中国海洋大学 基于Smith预估器和粒子群算法的无人船舵向PID控制设计方法
WO2023108494A1 (zh) * 2021-12-15 2023-06-22 中国科学院深圳先进技术研究院 一种概率滤波强化学习无人船控制方法、装置及终端设备
CN116627145A (zh) * 2023-07-25 2023-08-22 陕西欧卡电子智能科技有限公司 无人游船的自主航行控制方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020198854A1 (en) * 2001-03-30 2002-12-26 Berenji Hamid R. Convergent actor critic-based fuzzy reinforcement learning apparatus and method
CN103853046A (zh) * 2014-02-14 2014-06-11 广东工业大学 一种压电陶瓷驱动器的自适应学习控制方法
CN105228158A (zh) * 2015-11-11 2016-01-06 国家电网公司 基于强化学习的认知无线网络协作节点选择方法
CN106338919A (zh) * 2016-11-02 2017-01-18 哈尔滨工程大学 基于增强学习型智能算法的无人艇航迹跟踪控制方法
CN108008627A (zh) * 2017-12-13 2018-05-08 中国石油大学(华东) 一种并行优化的强化学习自适应pid控制方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020198854A1 (en) * 2001-03-30 2002-12-26 Berenji Hamid R. Convergent actor critic-based fuzzy reinforcement learning apparatus and method
CN103853046A (zh) * 2014-02-14 2014-06-11 广东工业大学 一种压电陶瓷驱动器的自适应学习控制方法
CN105228158A (zh) * 2015-11-11 2016-01-06 国家电网公司 基于强化学习的认知无线网络协作节点选择方法
CN106338919A (zh) * 2016-11-02 2017-01-18 哈尔滨工程大学 基于增强学习型智能算法的无人艇航迹跟踪控制方法
CN108008627A (zh) * 2017-12-13 2018-05-08 中国石油大学(华东) 一种并行优化的强化学习自适应pid控制方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
ANDRES EL-FAKDI 等: "Two-step gradient-based reinforcement learning for underwater robotics behavior learning", 《ROBOTICS AND AUTONOMOUS SYSTEMS》 *
IGNACIO CARLUCHO 等: "Adaptive low-level control of autonomous underwater vehicles using deep reinforcement learning", 《ROBOTICS AND AUTONOMOUS SYSTEMS》 *
李兆斌 等: "增强学习算法的性能测试与对比分析", 《计算机应用研究》 *
陈学松 等: "基于执行器_评价器学习的自适应PID控制", 《控制理论与应用》 *

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108287542A (zh) * 2018-01-04 2018-07-17 浙江大学 基于协同云控制的无人机与无人船协作控制系统与方法
CN108200175A (zh) * 2018-01-04 2018-06-22 浙江大学 基于协同云控制的多无人船编队协同控制系统及方法
CN108287542B (zh) * 2018-01-04 2021-01-26 浙江大学 基于协同云控制的无人机与无人船协作控制系统与方法
CN108536005A (zh) * 2018-03-15 2018-09-14 吉林大学 一种基于模糊神经网络pid船舶航向控制器及其控制方法
FR3084867A1 (fr) 2018-08-07 2020-02-14 Psa Automobiles Sa Procede d’assistance pour qu’un vehicule a conduite automatisee suive une trajectoire, par apprentissage par renforcement de type acteur critique a seuil
CN109521669A (zh) * 2018-11-12 2019-03-26 中国航空工业集团公司北京航空精密机械研究所 一种基于强化学习的转台控制参数自整定方法
CN109719721A (zh) * 2018-12-26 2019-05-07 北京化工大学 一种仿蛇搜救机器人适应性步态自主涌现方法
CN109719721B (zh) * 2018-12-26 2020-07-24 北京化工大学 一种仿蛇搜救机器人适应性步态自主涌现方法
CN109948781A (zh) * 2019-03-21 2019-06-28 中国人民解放军国防科技大学 用于自动驾驶车辆的连续动作在线学习控制方法及系统
CN109765916A (zh) * 2019-03-26 2019-05-17 武汉欣海远航科技研发有限公司 一种水面无人艇路径跟踪控制器设计方法
CN111950733A (zh) * 2019-05-15 2020-11-17 阿里巴巴集团控股有限公司 信息流的排序方法、装置及计算机存储介质
CN110471289A (zh) * 2019-08-28 2019-11-19 湖南大学 一种基于视觉导航移动设备的自适应路径跟踪方法及系统
CN110658829A (zh) * 2019-10-30 2020-01-07 武汉理工大学 一种基于深度强化学习的群无人艇智能避碰方法
CN110658829B (zh) * 2019-10-30 2021-03-30 武汉理工大学 一种基于深度强化学习的群无人艇智能避碰方法
CN110703792A (zh) * 2019-11-07 2020-01-17 江苏科技大学 基于增强学习的水下机器人姿态控制方法
CN110703792B (zh) * 2019-11-07 2022-12-30 江苏科技大学 基于增强学习的水下机器人姿态控制方法
CN113671962B (zh) * 2021-08-20 2023-11-21 湘潭大学 一种无人驾驶铰接式清扫车的横向控制方法
CN113671962A (zh) * 2021-08-20 2021-11-19 湘潭大学 一种无人驾驶铰接式清扫车的横向控制方法
WO2023108494A1 (zh) * 2021-12-15 2023-06-22 中国科学院深圳先进技术研究院 一种概率滤波强化学习无人船控制方法、装置及终端设备
CN114237254A (zh) * 2021-12-20 2022-03-25 中国海洋大学 基于Smith预估器和粒子群算法的无人船舵向PID控制设计方法
CN114237254B (zh) * 2021-12-20 2024-01-09 中国海洋大学 基于Smith预估器和粒子群算法的无人船舵向PID控制设计方法
CN116627145B (zh) * 2023-07-25 2023-10-20 陕西欧卡电子智能科技有限公司 无人游船的自主航行控制方法及系统
CN116627145A (zh) * 2023-07-25 2023-08-22 陕西欧卡电子智能科技有限公司 无人游船的自主航行控制方法及系统

Also Published As

Publication number Publication date
CN107346138B (zh) 2020-05-05

Similar Documents

Publication Publication Date Title
CN107346138A (zh) 一种基于增强学习算法的无人船侧向控制方法
CN104268625B (zh) 一种基于海洋环境信息的自主式水下潜器航迹预测方法
CN101833338B (zh) 无人潜航器垂直面欠驱动运动控制方法
CN107255923B (zh) 基于rbf辨识的ica-cmac神经网络的欠驱动无人艇航迹跟踪控制方法
CN103955218B (zh) 一种基于非线性控制理论的无人艇轨迹跟踪控制装置及方法
CN106950969A (zh) 一种基于无地图运动规划器的移动机器人连续控制方法
CN110095120A (zh) 自治水下航行器在海洋环流下的生物启发自组织映射路径规划方法
Chen et al. Distributed model predictive control for cooperative floating object transport with multi-vessel systems
CN105352496A (zh) 基于声呐辅助自主导航的auv导航方法
Shafiei et al. Application of neural network and genetic algorithm in identification of a model of a variable mass underwater vehicle
CN109189103B (zh) 一种具有暂态性能约束的欠驱动auv轨迹跟踪控制方法
CN107179693A (zh) 基于Huber估计的鲁棒自适应滤波和状态估计方法
CN107255920A (zh) 基于网络优化算法的pid控制方法和装置及系统
Paramesh et al. A unified seakeeping and manoeuvring model with a PID controller for path following of a KVLCC2 tanker in regular waves
Tu et al. Adaptive dynamic positioning control for accommodation vessels with multiple constraints
Wang et al. Path-following optimal control of autonomous underwater vehicle based on deep reinforcement learning
Piao et al. Adaptive backstepping sliding mode dynamic positioning system for pod driven unmanned surface vessel based on cerebellar model articulation controller
CN109556609A (zh) 一种基于人工智能的避碰方法及装置
Moreno-Salinas et al. Semiphysical modelling of the nonlinear dynamics of a surface craft with LS-SVM
Topalov et al. Stabilization and control of the floating dock's list and trim: Algorithmic solution
Ramos et al. Technical and economic feasibility study for implementing a novel mooring-assisting methodology in offloading operations using autonomous unmanned aerial vehicles
Elnashar Dynamics modelling, performance evaluation and stability analysis of an autonomous underwater vehicle
RU134681U1 (ru) Экспертная система для анализа рисков при маневрировании танкеров в портовых водах
CN114004035B (zh) 一种水面无人艇目标跟踪控制方法
CN116047886A (zh) 一种基于神经网络的管道潜航机器人控制方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant