CN108181900A - 一种基于增强学习智能算法的航海船舶运动控制方法 - Google Patents
一种基于增强学习智能算法的航海船舶运动控制方法 Download PDFInfo
- Publication number
- CN108181900A CN108181900A CN201711426992.4A CN201711426992A CN108181900A CN 108181900 A CN108181900 A CN 108181900A CN 201711426992 A CN201711426992 A CN 201711426992A CN 108181900 A CN108181900 A CN 108181900A
- Authority
- CN
- China
- Prior art keywords
- ship
- current
- moment
- motion control
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 12
- 230000002708 enhancing effect Effects 0.000 title claims abstract description 11
- 230000006870 function Effects 0.000 claims abstract description 18
- 241001269238 Data Species 0.000 claims abstract description 5
- 230000007613 environmental effect Effects 0.000 claims abstract description 5
- 230000009471 action Effects 0.000 claims description 6
- 238000011156 evaluation Methods 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 2
- 238000012805 post-processing Methods 0.000 claims description 2
- 230000004927 fusion Effects 0.000 abstract description 2
- 238000005457 optimization Methods 0.000 abstract 2
- 230000001419 dependent effect Effects 0.000 abstract 1
- 230000008859 change Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 239000000446 fuel Substances 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000011217 control strategy Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 239000000686 essence Substances 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D1/00—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
- G05D1/02—Control of position or course in two dimensions
- G05D1/0206—Control of position or course in two dimensions specially adapted to water vehicles
Landscapes
- Engineering & Computer Science (AREA)
- Aviation & Aerospace Engineering (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Feedback Control In General (AREA)
Abstract
本发明公开了一种基于增强学习智能算法的航海船舶运动控制方法,包括:利用多模态传感器采集船舶的各类重要数据;对获取的数据信息进行滤波及融合处理,得到满足精度要求的各种状态数据,包括:船舶的姿态信息,船舶实际位置、船舶速度、海面风速、洋流速度等;通过评估函数对实际状态数据进行评估,得到当前时刻的奖赏值;通过增强学习智能算法不断的学习,最终得到在不同的环境状态条件下船舶的运动控制规律。本发明船舶运动控制方法,是不依赖于环境模型的一种优化算法,相比较传统的运动控制算法,控制更加灵活,并且可以在使用中持续优化学习。
Description
技术领域
本发明涉及航海航舶领域,具体涉及一种基于增强学习智能算法的航海船舶运动控制方法。
背景技术
随着世界经济贸易的繁荣,船舶在运输过程中起着越来越重要的作用,但是其高能耗也限制着船舶的长距离运输的发展。据测算,航运企业燃油成本占总运营成本的40%左右。一个大的船舶企业一年的燃油费用可达几十甚至上百亿。船舶在航行前要制定航行计划,并随着实时条件变化调整;但影响船舶节能减排的因素多达40多个,关系错综复杂,而对船舶实时的有效的动态控制是其中一项最重要的关键点。
船舶在航行过程中环境变化多端,控制系统要处理各种各样的环境外力影响,在此过程中保持运动控制系统实时有效的做出控制命令显得很有必要。增强学习是当今人工智能领域研究的热点之一,当外界环境模型复杂难以建立时,该算法依旧可以使得交互式代理学习得到最优的控制规律。
发明内容
为了克服现有技术存在的缺点与不足,本发明提供一种基于增强学习智能算法的航海船舶运动控制方法,使船舶能够在复杂环境下自适应节能航行,并且不依赖于外部环境模型。
本发明采用如下技术方案:
一种基于增强学习智能算法的航海船舶运动控制方法,包括如下步骤:
S1船舶上安装多模态传感器,周期性采集当前t时刻的传感器数据信息;
S2对传感器数据信息,进行滤波及归一化处理,归一化后处理后的环境状态信息为:
式中,ct为当前t时刻的船舶姿态信息,pt为当前t时刻的船舶实际位置信息,为当前t时刻的船舶速度信息,为当前t时刻的海面风速信息,为当前t时刻的洋流速度信息,σt为其他多模态传感器的数据;
S3根据动作-状态值函数Q(St,aθ)得到当前时刻t的运动控制动作at;
S4执行S3得到的动作at,得到t+1时刻的状态数据信息
S5通过评估函数对t+1时刻状态数据进行评估,得到当前时刻的奖赏值:
Rt+1=f(St+1)
式中,函数f是自定义的评价函数;
S6通过最小化损失函数L(θ)来更新网络参数θ:
其中γ为折扣因子;
S7循环迭代上述步骤,直到网络参数θ达到收敛,即网络参数达到稳定,终止。
所述运动控制动作at:
at=argmaxaQ(St,a|θ)。
本发明的有益效果:
本发明应用于种复杂的航海环境,是一种自主学习的控制系统。
附图说明
图1是本发明一种基于增强学习智能算法的航海船舶运动控制方法。
具体实施方式
下面结合实施例及附图,对本发明作进一步地详细说明,但本发明的实施方式不限于此。
实施例
如图1所示,一种基于增强学习智能算法的航海船舶运动控制方法,包括如下步骤:
S1船舶上相应位置安装多模态传感器,周期性的采集船舶及周围行驶环境的数据信息,所述数据信息包括船舶的姿态信息,船舶实际位置、船舶速度、海面风速、洋流速度等。
S2对获取的传感器数据信息进行滤波及融合处理,得到满足精度要求的各种状态数据,归一化处理后的环境状态信息为:
式中,ct为当前t时刻的船舶姿态信息,pt为当前t时刻的船舶实际位置信息,为当前t时刻的船舶速度信息,为当前t时刻的海面风速信息,为当前t时刻的洋流速度信息,σt为其他多模态传感器的数据;
S3根据动作-状态值函数Q(St,aθ)得到当前时刻t的运动控制动作at,其计算公式为:
at=argmaxaQ(St,a|θ);
S4执行S3得到的动作at,得到t+1时刻的状态数据信息
S5通过评估函数对t+1时刻状态数据进行评估,得到当前时刻的奖赏值:
Rt+1=f(St+1)
式中,函数f是自定义的评价函数,其目的是为了评估当前环境下控制策略的好坏程度。
S6根据S2、S3、S4及S5检测得到的数据信息,通过最小化损失函数L(θ)来更新网络参数θ:
其中γ为折扣因子;
S7通过增强学习智能算法不断的学习动作-状态值函数Q(S,a),通过迭代循环最终得到稳定的动作-状态值函数,则满足条件,终止。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受所述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
Claims (2)
1.一种基于增强学习智能算法的航海船舶运动控制方法,其特征在于,包括如下步骤:
S1船舶上安装多模态传感器,周期性采集当前t时刻的传感器数据信息;
S2对传感器数据信息,进行滤波及归一化处理,归一化后处理后的环境状态信息为:
式中,ct为当前t时刻的船舶姿态信息,pt为当前t时刻的船舶实际位置信息,为当前t时刻的船舶速度信息,为当前t时刻的海面风速信息,为当前t时刻的洋流速度信息,σt为其他多模态传感器的数据;
S3根据动作-状态值函数Q(St,a|θ)得到当前时刻t的运动控制动作at;
S4执行S3得到的动作at,得到t+1时刻的状态数据信息
S5通过评估函数对t+1时刻状态数据进行评估,得到当前时刻的奖赏值:
Rt+1=f(St+1)
式中,函数f是自定义的评价函数;
S6通过最小化损失函数L(θ)来更新网络参数θ:
其中γ为折扣因子;
S7循环迭代上述步骤,直到网络参数θ达到收敛,即网络参数达到稳定,终止。
2.根据权利要求1所述的航海船舶运动控制方法,其特征在于,所述运动控制动作at:
at=arg maxaQ(St,a|θ)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711426992.4A CN108181900B (zh) | 2017-12-26 | 2017-12-26 | 一种基于增强学习智能算法的航海船舶运动控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711426992.4A CN108181900B (zh) | 2017-12-26 | 2017-12-26 | 一种基于增强学习智能算法的航海船舶运动控制方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108181900A true CN108181900A (zh) | 2018-06-19 |
CN108181900B CN108181900B (zh) | 2020-11-24 |
Family
ID=62547462
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711426992.4A Active CN108181900B (zh) | 2017-12-26 | 2017-12-26 | 一种基于增强学习智能算法的航海船舶运动控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108181900B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111618847A (zh) * | 2020-04-22 | 2020-09-04 | 南通大学 | 基于深度强化学习与动态运动基元的机械臂自主抓取方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1710499A (zh) * | 2005-07-07 | 2005-12-21 | 上海交通大学 | 基于模糊自适应算法的船舶动力定位控制系统 |
CN103645635A (zh) * | 2013-11-25 | 2014-03-19 | 大连海联自动控制有限公司 | 一种基于模拟退火-强化学习算法的船舶运动控制器 |
DE102015008449A1 (de) * | 2015-06-30 | 2017-01-05 | Audi Ag | Verfahren zum Betrieb einer Start-Stop-Einrichtung eines Kraftfahrzeugs und Kraftfahrzeug |
CN106657144A (zh) * | 2017-01-20 | 2017-05-10 | 北京理工大学 | 一种基于增强学习的动态保护路径规划方法 |
CN106709640A (zh) * | 2016-12-15 | 2017-05-24 | 华南理工大学 | 基于深度学习与支持向量回归的船舶能耗预测方法 |
-
2017
- 2017-12-26 CN CN201711426992.4A patent/CN108181900B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1710499A (zh) * | 2005-07-07 | 2005-12-21 | 上海交通大学 | 基于模糊自适应算法的船舶动力定位控制系统 |
CN103645635A (zh) * | 2013-11-25 | 2014-03-19 | 大连海联自动控制有限公司 | 一种基于模拟退火-强化学习算法的船舶运动控制器 |
DE102015008449A1 (de) * | 2015-06-30 | 2017-01-05 | Audi Ag | Verfahren zum Betrieb einer Start-Stop-Einrichtung eines Kraftfahrzeugs und Kraftfahrzeug |
CN106709640A (zh) * | 2016-12-15 | 2017-05-24 | 华南理工大学 | 基于深度学习与支持向量回归的船舶能耗预测方法 |
CN106657144A (zh) * | 2017-01-20 | 2017-05-10 | 北京理工大学 | 一种基于增强学习的动态保护路径规划方法 |
Non-Patent Citations (2)
Title |
---|
吴南: "未知环境下移动机器人的避障路径规划", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
韦如明: "基于强化学习的移动机器人路径规划研究与实现", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111618847A (zh) * | 2020-04-22 | 2020-09-04 | 南通大学 | 基于深度强化学习与动态运动基元的机械臂自主抓取方法 |
CN111618847B (zh) * | 2020-04-22 | 2022-06-21 | 南通大学 | 基于深度强化学习与动态运动基元的机械臂自主抓取方法 |
Also Published As
Publication number | Publication date |
---|---|
CN108181900B (zh) | 2020-11-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Li et al. | A path planning strategy unified with a COLREGS collision avoidance function based on deep reinforcement learning and artificial potential field | |
CN106338919B (zh) | 基于增强学习型智能算法的无人艇航迹跟踪控制方法 | |
Dong et al. | Heading control of unmanned marine vehicles based on an improved robust adaptive fuzzy neural network control algorithm | |
Deng et al. | Line-of-sight-based guidance and adaptive neural path-following control for sailboats | |
CN108416152A (zh) | 基于电子海图的无人艇蚁群能耗最优全局路径规划方法 | |
Liu et al. | Biologically inspired behaviour design for autonomous robotic fish | |
CN106773741A (zh) | 一种无人船动力定位系统及方法 | |
Zhu et al. | Optimized support vector regression algorithm-based modeling of ship dynamics | |
Shao et al. | Development of an artificial fish-like robot and its application in cooperative transportation | |
CN209241278U (zh) | 用于对海洋中航行船舶清洗的设备 | |
CN109656143A (zh) | 一种海面全驱动船舶的自适应跟踪控制方法及系统 | |
Deng et al. | Parallel guidance and event-triggered robust fuzzy control for path following of autonomous wing-sailed catamaran | |
He et al. | Dynamic adaptive intelligent navigation decision making method for multi-object situation in open water | |
Wang et al. | Local path optimization method for unmanned ship based on particle swarm acceleration calculation and dynamic optimal control | |
Xu et al. | Deep reinforcement learning-based path planning of underactuated surface vessels | |
Cai et al. | A meta-heuristic assisted underwater glider path planning method | |
Sans-Muntadas et al. | Learning an AUV docking maneuver with a convolutional neural network | |
Lan et al. | Path planning for underwater gliders in time-varying ocean current using deep reinforcement learning | |
Zhou et al. | An improved beetle swarm optimization algorithm for the intelligent navigation control of autonomous sailing robots | |
Wang et al. | A restricted circle based position keeping strategy for the wave glider | |
Chen et al. | Online modeling and prediction of maritime autonomous surface ship maneuvering motion under ocean waves | |
Zhang et al. | Robust model predictive control of the automatic operation boats for aquaculture | |
Mu et al. | Path following for podded propulsion unmanned surface vehicle: Theory, simulation and experiment | |
Zhang et al. | Tracking fault-tolerant control based on model predictive control for human occupied vehicle in three-dimensional underwater workspace | |
CN108181900A (zh) | 一种基于增强学习智能算法的航海船舶运动控制方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |