CN108181900A - 一种基于增强学习智能算法的航海船舶运动控制方法 - Google Patents

一种基于增强学习智能算法的航海船舶运动控制方法 Download PDF

Info

Publication number
CN108181900A
CN108181900A CN201711426992.4A CN201711426992A CN108181900A CN 108181900 A CN108181900 A CN 108181900A CN 201711426992 A CN201711426992 A CN 201711426992A CN 108181900 A CN108181900 A CN 108181900A
Authority
CN
China
Prior art keywords
ship
current
moment
motion control
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201711426992.4A
Other languages
English (en)
Other versions
CN108181900B (zh
Inventor
袁银龙
俞祝良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN201711426992.4A priority Critical patent/CN108181900B/zh
Publication of CN108181900A publication Critical patent/CN108181900A/zh
Application granted granted Critical
Publication of CN108181900B publication Critical patent/CN108181900B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • G05D1/0206Control of position or course in two dimensions specially adapted to water vehicles

Landscapes

  • Engineering & Computer Science (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明公开了一种基于增强学习智能算法的航海船舶运动控制方法,包括:利用多模态传感器采集船舶的各类重要数据;对获取的数据信息进行滤波及融合处理,得到满足精度要求的各种状态数据,包括:船舶的姿态信息,船舶实际位置、船舶速度、海面风速、洋流速度等;通过评估函数对实际状态数据进行评估,得到当前时刻的奖赏值;通过增强学习智能算法不断的学习,最终得到在不同的环境状态条件下船舶的运动控制规律。本发明船舶运动控制方法,是不依赖于环境模型的一种优化算法,相比较传统的运动控制算法,控制更加灵活,并且可以在使用中持续优化学习。

Description

一种基于增强学习智能算法的航海船舶运动控制方法
技术领域
本发明涉及航海航舶领域,具体涉及一种基于增强学习智能算法的航海船舶运动控制方法。
背景技术
随着世界经济贸易的繁荣,船舶在运输过程中起着越来越重要的作用,但是其高能耗也限制着船舶的长距离运输的发展。据测算,航运企业燃油成本占总运营成本的40%左右。一个大的船舶企业一年的燃油费用可达几十甚至上百亿。船舶在航行前要制定航行计划,并随着实时条件变化调整;但影响船舶节能减排的因素多达40多个,关系错综复杂,而对船舶实时的有效的动态控制是其中一项最重要的关键点。
船舶在航行过程中环境变化多端,控制系统要处理各种各样的环境外力影响,在此过程中保持运动控制系统实时有效的做出控制命令显得很有必要。增强学习是当今人工智能领域研究的热点之一,当外界环境模型复杂难以建立时,该算法依旧可以使得交互式代理学习得到最优的控制规律。
发明内容
为了克服现有技术存在的缺点与不足,本发明提供一种基于增强学习智能算法的航海船舶运动控制方法,使船舶能够在复杂环境下自适应节能航行,并且不依赖于外部环境模型。
本发明采用如下技术方案:
一种基于增强学习智能算法的航海船舶运动控制方法,包括如下步骤:
S1船舶上安装多模态传感器,周期性采集当前t时刻的传感器数据信息;
S2对传感器数据信息,进行滤波及归一化处理,归一化后处理后的环境状态信息为:
式中,ct为当前t时刻的船舶姿态信息,pt为当前t时刻的船舶实际位置信息,为当前t时刻的船舶速度信息,为当前t时刻的海面风速信息,为当前t时刻的洋流速度信息,σt为其他多模态传感器的数据;
S3根据动作-状态值函数Q(St,aθ)得到当前时刻t的运动控制动作at
S4执行S3得到的动作at,得到t+1时刻的状态数据信息
S5通过评估函数对t+1时刻状态数据进行评估,得到当前时刻的奖赏值:
Rt+1=f(St+1)
式中,函数f是自定义的评价函数;
S6通过最小化损失函数L(θ)来更新网络参数θ:
其中γ为折扣因子;
S7循环迭代上述步骤,直到网络参数θ达到收敛,即网络参数达到稳定,终止。
所述运动控制动作at
at=argmaxaQ(St,a|θ)。
本发明的有益效果:
本发明应用于种复杂的航海环境,是一种自主学习的控制系统。
附图说明
图1是本发明一种基于增强学习智能算法的航海船舶运动控制方法。
具体实施方式
下面结合实施例及附图,对本发明作进一步地详细说明,但本发明的实施方式不限于此。
实施例
如图1所示,一种基于增强学习智能算法的航海船舶运动控制方法,包括如下步骤:
S1船舶上相应位置安装多模态传感器,周期性的采集船舶及周围行驶环境的数据信息,所述数据信息包括船舶的姿态信息,船舶实际位置、船舶速度、海面风速、洋流速度等。
S2对获取的传感器数据信息进行滤波及融合处理,得到满足精度要求的各种状态数据,归一化处理后的环境状态信息为:
式中,ct为当前t时刻的船舶姿态信息,pt为当前t时刻的船舶实际位置信息,为当前t时刻的船舶速度信息,为当前t时刻的海面风速信息,为当前t时刻的洋流速度信息,σt为其他多模态传感器的数据;
S3根据动作-状态值函数Q(St,aθ)得到当前时刻t的运动控制动作at,其计算公式为:
at=argmaxaQ(St,a|θ);
S4执行S3得到的动作at,得到t+1时刻的状态数据信息
S5通过评估函数对t+1时刻状态数据进行评估,得到当前时刻的奖赏值:
Rt+1=f(St+1)
式中,函数f是自定义的评价函数,其目的是为了评估当前环境下控制策略的好坏程度。
S6根据S2、S3、S4及S5检测得到的数据信息,通过最小化损失函数L(θ)来更新网络参数θ:
其中γ为折扣因子;
S7通过增强学习智能算法不断的学习动作-状态值函数Q(S,a),通过迭代循环最终得到稳定的动作-状态值函数,则满足条件,终止。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受所述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

Claims (2)

1.一种基于增强学习智能算法的航海船舶运动控制方法,其特征在于,包括如下步骤:
S1船舶上安装多模态传感器,周期性采集当前t时刻的传感器数据信息;
S2对传感器数据信息,进行滤波及归一化处理,归一化后处理后的环境状态信息为:
式中,ct为当前t时刻的船舶姿态信息,pt为当前t时刻的船舶实际位置信息,为当前t时刻的船舶速度信息,为当前t时刻的海面风速信息,为当前t时刻的洋流速度信息,σt为其他多模态传感器的数据;
S3根据动作-状态值函数Q(St,a|θ)得到当前时刻t的运动控制动作at
S4执行S3得到的动作at,得到t+1时刻的状态数据信息
S5通过评估函数对t+1时刻状态数据进行评估,得到当前时刻的奖赏值:
Rt+1=f(St+1)
式中,函数f是自定义的评价函数;
S6通过最小化损失函数L(θ)来更新网络参数θ:
其中γ为折扣因子;
S7循环迭代上述步骤,直到网络参数θ达到收敛,即网络参数达到稳定,终止。
2.根据权利要求1所述的航海船舶运动控制方法,其特征在于,所述运动控制动作at
at=arg maxaQ(St,a|θ)。
CN201711426992.4A 2017-12-26 2017-12-26 一种基于增强学习智能算法的航海船舶运动控制方法 Active CN108181900B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711426992.4A CN108181900B (zh) 2017-12-26 2017-12-26 一种基于增强学习智能算法的航海船舶运动控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711426992.4A CN108181900B (zh) 2017-12-26 2017-12-26 一种基于增强学习智能算法的航海船舶运动控制方法

Publications (2)

Publication Number Publication Date
CN108181900A true CN108181900A (zh) 2018-06-19
CN108181900B CN108181900B (zh) 2020-11-24

Family

ID=62547462

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711426992.4A Active CN108181900B (zh) 2017-12-26 2017-12-26 一种基于增强学习智能算法的航海船舶运动控制方法

Country Status (1)

Country Link
CN (1) CN108181900B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111618847A (zh) * 2020-04-22 2020-09-04 南通大学 基于深度强化学习与动态运动基元的机械臂自主抓取方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1710499A (zh) * 2005-07-07 2005-12-21 上海交通大学 基于模糊自适应算法的船舶动力定位控制系统
CN103645635A (zh) * 2013-11-25 2014-03-19 大连海联自动控制有限公司 一种基于模拟退火-强化学习算法的船舶运动控制器
DE102015008449A1 (de) * 2015-06-30 2017-01-05 Audi Ag Verfahren zum Betrieb einer Start-Stop-Einrichtung eines Kraftfahrzeugs und Kraftfahrzeug
CN106657144A (zh) * 2017-01-20 2017-05-10 北京理工大学 一种基于增强学习的动态保护路径规划方法
CN106709640A (zh) * 2016-12-15 2017-05-24 华南理工大学 基于深度学习与支持向量回归的船舶能耗预测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1710499A (zh) * 2005-07-07 2005-12-21 上海交通大学 基于模糊自适应算法的船舶动力定位控制系统
CN103645635A (zh) * 2013-11-25 2014-03-19 大连海联自动控制有限公司 一种基于模拟退火-强化学习算法的船舶运动控制器
DE102015008449A1 (de) * 2015-06-30 2017-01-05 Audi Ag Verfahren zum Betrieb einer Start-Stop-Einrichtung eines Kraftfahrzeugs und Kraftfahrzeug
CN106709640A (zh) * 2016-12-15 2017-05-24 华南理工大学 基于深度学习与支持向量回归的船舶能耗预测方法
CN106657144A (zh) * 2017-01-20 2017-05-10 北京理工大学 一种基于增强学习的动态保护路径规划方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
吴南: "未知环境下移动机器人的避障路径规划", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
韦如明: "基于强化学习的移动机器人路径规划研究与实现", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111618847A (zh) * 2020-04-22 2020-09-04 南通大学 基于深度强化学习与动态运动基元的机械臂自主抓取方法
CN111618847B (zh) * 2020-04-22 2022-06-21 南通大学 基于深度强化学习与动态运动基元的机械臂自主抓取方法

Also Published As

Publication number Publication date
CN108181900B (zh) 2020-11-24

Similar Documents

Publication Publication Date Title
Li et al. A path planning strategy unified with a COLREGS collision avoidance function based on deep reinforcement learning and artificial potential field
CN106338919B (zh) 基于增强学习型智能算法的无人艇航迹跟踪控制方法
Dong et al. Heading control of unmanned marine vehicles based on an improved robust adaptive fuzzy neural network control algorithm
Deng et al. Line-of-sight-based guidance and adaptive neural path-following control for sailboats
CN108416152A (zh) 基于电子海图的无人艇蚁群能耗最优全局路径规划方法
Liu et al. Biologically inspired behaviour design for autonomous robotic fish
CN106773741A (zh) 一种无人船动力定位系统及方法
Zhu et al. Optimized support vector regression algorithm-based modeling of ship dynamics
Shao et al. Development of an artificial fish-like robot and its application in cooperative transportation
CN209241278U (zh) 用于对海洋中航行船舶清洗的设备
CN109656143A (zh) 一种海面全驱动船舶的自适应跟踪控制方法及系统
Deng et al. Parallel guidance and event-triggered robust fuzzy control for path following of autonomous wing-sailed catamaran
He et al. Dynamic adaptive intelligent navigation decision making method for multi-object situation in open water
Wang et al. Local path optimization method for unmanned ship based on particle swarm acceleration calculation and dynamic optimal control
Xu et al. Deep reinforcement learning-based path planning of underactuated surface vessels
Cai et al. A meta-heuristic assisted underwater glider path planning method
Sans-Muntadas et al. Learning an AUV docking maneuver with a convolutional neural network
Lan et al. Path planning for underwater gliders in time-varying ocean current using deep reinforcement learning
Zhou et al. An improved beetle swarm optimization algorithm for the intelligent navigation control of autonomous sailing robots
Wang et al. A restricted circle based position keeping strategy for the wave glider
Chen et al. Online modeling and prediction of maritime autonomous surface ship maneuvering motion under ocean waves
Zhang et al. Robust model predictive control of the automatic operation boats for aquaculture
Mu et al. Path following for podded propulsion unmanned surface vehicle: Theory, simulation and experiment
Zhang et al. Tracking fault-tolerant control based on model predictive control for human occupied vehicle in three-dimensional underwater workspace
CN108181900A (zh) 一种基于增强学习智能算法的航海船舶运动控制方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant