CN102819264A - 移动机器人路径规划q学习初始化方法 - Google Patents
移动机器人路径规划q学习初始化方法 Download PDFInfo
- Publication number
- CN102819264A CN102819264A CN2012102692807A CN201210269280A CN102819264A CN 102819264 A CN102819264 A CN 102819264A CN 2012102692807 A CN2012102692807 A CN 2012102692807A CN 201210269280 A CN201210269280 A CN 201210269280A CN 102819264 A CN102819264 A CN 102819264A
- Authority
- CN
- China
- Prior art keywords
- state
- value
- potential energy
- robot
- learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Feedback Control In General (AREA)
- Manipulator (AREA)
Abstract
Description
Claims (5)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210269280.7A CN102819264B (zh) | 2012-07-30 | 2012-07-30 | 移动机器人路径规划q学习初始化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210269280.7A CN102819264B (zh) | 2012-07-30 | 2012-07-30 | 移动机器人路径规划q学习初始化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102819264A true CN102819264A (zh) | 2012-12-12 |
CN102819264B CN102819264B (zh) | 2015-01-21 |
Family
ID=47303416
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210269280.7A Expired - Fee Related CN102819264B (zh) | 2012-07-30 | 2012-07-30 | 移动机器人路径规划q学习初始化方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102819264B (zh) |
Cited By (61)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103412490A (zh) * | 2013-08-14 | 2013-11-27 | 山东大学 | 用于多机器人动态路径规划的多克隆人工免疫网络算法 |
CN104298239A (zh) * | 2014-09-29 | 2015-01-21 | 湖南大学 | 一种室内移动机器人增强地图学习路径规划方法 |
CN104680264A (zh) * | 2015-03-27 | 2015-06-03 | 青岛大学 | 一种基于多智能体强化学习的运输车路径优化方法 |
CN104932267A (zh) * | 2015-06-04 | 2015-09-23 | 曲阜师范大学 | 一种采用资格迹的神经网络学习控制方法 |
CN105139072A (zh) * | 2015-09-09 | 2015-12-09 | 东华大学 | 应用于非循迹智能小车避障系统的强化学习算法 |
CN105137967A (zh) * | 2015-07-16 | 2015-12-09 | 北京工业大学 | 一种深度自动编码器与q学习算法相结合的移动机器人路径规划方法 |
CN105700526A (zh) * | 2016-01-13 | 2016-06-22 | 华北理工大学 | 具有自主学习能力的在线序列极限学习机方法 |
CN105740644A (zh) * | 2016-03-24 | 2016-07-06 | 苏州大学 | 一种基于模型学习的清洁机器人最优目标路径规划方法 |
CN106017494A (zh) * | 2016-05-23 | 2016-10-12 | 福州华鹰重工机械有限公司 | 基于学徒学习的路径规划方法及装置 |
CN106595671A (zh) * | 2017-02-22 | 2017-04-26 | 南方科技大学 | 一种基于强化学习的无人机路径规划方法和装置 |
CN104390648B (zh) * | 2014-12-22 | 2017-07-11 | 中国矿业大学 | 一种基于人工势场的煤矿救灾机器人路径规划方法 |
CN107000223A (zh) * | 2014-12-25 | 2017-08-01 | 川崎重工业株式会社 | 臂型机械手的障碍物自动回避方法及控制装置 |
CN107024220A (zh) * | 2017-04-14 | 2017-08-08 | 淮安信息职业技术学院 | 基于强化学习蟑螂算法的机器人路径规划方法 |
CN107065881A (zh) * | 2017-05-17 | 2017-08-18 | 清华大学 | 一种基于深度强化学习的机器人全局路径规划方法 |
CN107066967A (zh) * | 2017-04-12 | 2017-08-18 | 清华大学 | 一种利用局部观测信息的主动人脸寻的方法及装置 |
CN107065890A (zh) * | 2017-06-02 | 2017-08-18 | 北京航空航天大学 | 一种无人车智能避障方法及系统 |
CN107179077A (zh) * | 2017-05-15 | 2017-09-19 | 北京航空航天大学 | 一种基于elm‑lrf的自适应视觉导航方法 |
CN107292392A (zh) * | 2017-05-11 | 2017-10-24 | 苏州大学 | 基于深度带权双q学习的大范围监控方法及监控机器人 |
CN107422733A (zh) * | 2017-07-27 | 2017-12-01 | 南京理工大学 | 一种基于两轮差速机器人的运动控制方法 |
CN107844460A (zh) * | 2017-07-24 | 2018-03-27 | 哈尔滨工程大学 | 一种基于p‑maxq的多水下机器人的围捕方法 |
CN107885086A (zh) * | 2017-11-17 | 2018-04-06 | 合肥工业大学 | 基于mcmc优化q学习的自主航行器控制参数在线调节方法 |
CN108202327A (zh) * | 2016-12-16 | 2018-06-26 | 发那科株式会社 | 机器学习装置、机器人系统以及机器学习方法 |
CN108594803A (zh) * | 2018-03-06 | 2018-09-28 | 吉林大学 | 基于q-学习算法的路径规划方法 |
CN108693851A (zh) * | 2017-03-31 | 2018-10-23 | 发那科株式会社 | 行为信息学习装置、机器人控制系统及行为信息学习方法 |
CN108762249A (zh) * | 2018-04-26 | 2018-11-06 | 常熟理工学院 | 基于近似模型多步优化的清洁机器人最优路径规划方法 |
CN108803313A (zh) * | 2018-06-08 | 2018-11-13 | 哈尔滨工程大学 | 一种基于海流预测模型的路径规划方法 |
CN108995220A (zh) * | 2018-07-17 | 2018-12-14 | 大连理工大学 | 基于强化学习的复杂薄壁结构物体3d打印路径规划方法 |
CN109146082A (zh) * | 2017-06-27 | 2019-01-04 | 发那科株式会社 | 机器学习装置、机器人控制系统和机器学习方法 |
CN109382825A (zh) * | 2017-08-08 | 2019-02-26 | 发那科株式会社 | 控制装置以及学习装置 |
CN109409592A (zh) * | 2018-10-15 | 2019-03-01 | 浙江工业大学 | 动态环境下移动机器人的最优策略解决方法 |
CN109407676A (zh) * | 2018-12-20 | 2019-03-01 | 哈尔滨工业大学 | 基于DoubleDQN网络和深度强化学习的移动机器人避障方法 |
CN109445437A (zh) * | 2018-11-30 | 2019-03-08 | 电子科技大学 | 一种无人电动车的路径规划方法 |
CN109540136A (zh) * | 2018-10-25 | 2019-03-29 | 广东华中科技大学工业技术研究院 | 一种多无人艇协同路径规划方法 |
CN109635913A (zh) * | 2018-12-16 | 2019-04-16 | 北京工业大学 | 基于自适应贪婪的q学习算法足球系统仿真方法 |
CN109663359A (zh) * | 2018-12-06 | 2019-04-23 | 广州多益网络股份有限公司 | 游戏智能体训练的优化方法、装置、终端设备与存储介质 |
CN109857107A (zh) * | 2019-01-30 | 2019-06-07 | 广州大学 | Agv小车导航方法、装置、系统、介质和设备 |
CN110046800A (zh) * | 2019-03-14 | 2019-07-23 | 南京航空航天大学 | 面向空间目标协同观测的卫星集群构形调整规划方法 |
CN110070188A (zh) * | 2019-04-30 | 2019-07-30 | 山东大学 | 一种融合交互式强化学习的增量式认知发育系统及方法 |
CN110196587A (zh) * | 2018-02-27 | 2019-09-03 | 中国科学院深圳先进技术研究院 | 车辆自动驾驶控制策略模型生成方法、装置、设备及介质 |
CN110307848A (zh) * | 2019-07-04 | 2019-10-08 | 南京大学 | 一种移动机器人导航方法 |
CN110321666A (zh) * | 2019-08-09 | 2019-10-11 | 重庆理工大学 | 基于先验知识与dqn算法的多机器人路径规划方法 |
CN110378439A (zh) * | 2019-08-09 | 2019-10-25 | 重庆理工大学 | 基于Q-Learning算法的单机器人路径规划方法 |
CN111045054A (zh) * | 2019-04-19 | 2020-04-21 | 泰州腾翔信息科技有限公司 | 基于导航数据的编号识别平台 |
CN111544888A (zh) * | 2020-04-22 | 2020-08-18 | 腾讯科技(深圳)有限公司 | 虚拟群体单位的移动方法和装置、存储介质及电子设备 |
CN111949032A (zh) * | 2020-08-18 | 2020-11-17 | 中国科学技术大学 | 一种基于强化学习的3d避障导航系统及方法 |
CN112052511A (zh) * | 2020-06-15 | 2020-12-08 | 成都蓉奥科技有限公司 | 一种基于深度随机博弈的空战机动策略生成技术 |
CN112099493A (zh) * | 2020-08-31 | 2020-12-18 | 西安交通大学 | 一种自主移动机器人轨迹规划方法、系统及设备 |
CN112507520A (zh) * | 2020-11-12 | 2021-03-16 | 深圳慧拓无限科技有限公司 | 一种基于强化学习的路径规划方法及装置 |
CN112595326A (zh) * | 2020-12-25 | 2021-04-02 | 湖北汽车工业学院 | 一种融合先验知识的改进Q-learning路径规划算法 |
CN112799386A (zh) * | 2019-10-25 | 2021-05-14 | 中国科学院沈阳自动化研究所 | 基于人工势场与强化学习的机器人路径规划方法 |
CN113639755A (zh) * | 2021-08-20 | 2021-11-12 | 江苏科技大学苏州理工学院 | 一种基于深度强化学习的火灾现场逃生-救援联合系统 |
WO2021227536A1 (en) * | 2020-05-15 | 2021-11-18 | Huawei Technologies Co., Ltd. | Methods and systems for support policy learning |
CN113677485A (zh) * | 2019-01-23 | 2021-11-19 | 谷歌有限责任公司 | 使用基于元模仿学习和元强化学习的元学习的用于新任务的机器人控制策略的高效自适应 |
CN113720346A (zh) * | 2021-09-02 | 2021-11-30 | 重庆邮电大学 | 基于势能场和隐马尔可夫模型的车辆路径规划方法及系统 |
CN113790729A (zh) * | 2021-11-16 | 2021-12-14 | 北京科技大学 | 一种基于强化学习算法的无人天车路径规划方法及装置 |
CN113848911A (zh) * | 2021-09-28 | 2021-12-28 | 华东理工大学 | 基于Q-learning和RRT*的移动机器人全局路径规划方法 |
CN114610034A (zh) * | 2022-03-10 | 2022-06-10 | 西安科技大学 | 一种移动机器人路径规划方法 |
CN115542912A (zh) * | 2022-09-29 | 2022-12-30 | 福州大学 | 一种基于改进Q-learning算法的移动机器人路径规划方法 |
CN116187611A (zh) * | 2023-04-25 | 2023-05-30 | 南方科技大学 | 一种多智能体路径规划方法及终端 |
CN116922379A (zh) * | 2023-07-10 | 2023-10-24 | 深圳进化动力数码科技有限公司 | 基于视觉的机械臂避障方法、系统、电子设备及存储介质 |
CN116922379B (zh) * | 2023-07-10 | 2024-05-31 | 深圳进化动力数码科技有限公司 | 基于视觉的机械臂避障方法、系统、电子设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2001078951A1 (en) * | 2000-04-13 | 2001-10-25 | Zhimin Lin | Semi-optimal path finding in a wholly unknown environment |
KR101048098B1 (ko) * | 2008-09-03 | 2011-07-11 | 한국과학기술원 | 로봇의 경로계획 장치 및 방법 |
CN102402712A (zh) * | 2011-08-31 | 2012-04-04 | 山东大学 | 基于神经网络的机器人强化学习初始化方法 |
-
2012
- 2012-07-30 CN CN201210269280.7A patent/CN102819264B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2001078951A1 (en) * | 2000-04-13 | 2001-10-25 | Zhimin Lin | Semi-optimal path finding in a wholly unknown environment |
KR101048098B1 (ko) * | 2008-09-03 | 2011-07-11 | 한국과학기술원 | 로봇의 경로계획 장치 및 방법 |
CN102402712A (zh) * | 2011-08-31 | 2012-04-04 | 山东大学 | 基于神经网络的机器人强化学习初始化方法 |
Non-Patent Citations (5)
Title |
---|
XIAODONG ZHUANG 等: "Robot Path Planning by Artificial Potential Field Optimization Based on Reinforcement Learning with Fuzzy State", 《PROCEEDINGS OF THE 4TH WORLD CONGRESS ON INTELLIGENT CONTROL AND AUTOMATION》 * |
张波涛 等: "基于Q-GA的人工势场的移动机器人路径规划", 《控制工程》 * |
王芳 等: "基于改进人工势场的水下机器人路径规划", 《华中科技大学学报(自然科学版)》 * |
黄炳强 等: "基于人工势场法的移动机器人路径规划研究", 《计算机工程与应用》 * |
黄鹏 等: "基于动态人工势场法的足球机器人运动策略研究", 《马特斯杯2003年中国机器人大赛及研讨会》 * |
Cited By (96)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103412490B (zh) * | 2013-08-14 | 2015-09-16 | 山东大学 | 用于多机器人动态路径规划的多克隆人工免疫网络算法 |
CN103412490A (zh) * | 2013-08-14 | 2013-11-27 | 山东大学 | 用于多机器人动态路径规划的多克隆人工免疫网络算法 |
CN104298239B (zh) * | 2014-09-29 | 2016-08-24 | 湖南大学 | 一种室内移动机器人增强地图学习路径规划方法 |
CN104298239A (zh) * | 2014-09-29 | 2015-01-21 | 湖南大学 | 一种室内移动机器人增强地图学习路径规划方法 |
CN104390648B (zh) * | 2014-12-22 | 2017-07-11 | 中国矿业大学 | 一种基于人工势场的煤矿救灾机器人路径规划方法 |
CN107000223B (zh) * | 2014-12-25 | 2019-11-01 | 川崎重工业株式会社 | 臂型机械手的障碍物自动回避方法及控制装置 |
CN107000223A (zh) * | 2014-12-25 | 2017-08-01 | 川崎重工业株式会社 | 臂型机械手的障碍物自动回避方法及控制装置 |
US10350756B2 (en) | 2014-12-25 | 2019-07-16 | Kawasaki Jukogyo Kabushiki Kaisha | Method of automatically avoiding obstacle for arm robot and control device |
CN104680264A (zh) * | 2015-03-27 | 2015-06-03 | 青岛大学 | 一种基于多智能体强化学习的运输车路径优化方法 |
CN104680264B (zh) * | 2015-03-27 | 2017-09-22 | 青岛大学 | 一种基于多智能体强化学习的运输车路径优化方法 |
CN104932267A (zh) * | 2015-06-04 | 2015-09-23 | 曲阜师范大学 | 一种采用资格迹的神经网络学习控制方法 |
CN104932267B (zh) * | 2015-06-04 | 2017-10-03 | 曲阜师范大学 | 一种采用资格迹的神经网络学习控制方法 |
CN105137967A (zh) * | 2015-07-16 | 2015-12-09 | 北京工业大学 | 一种深度自动编码器与q学习算法相结合的移动机器人路径规划方法 |
CN105137967B (zh) * | 2015-07-16 | 2018-01-19 | 北京工业大学 | 一种深度自动编码器与q学习算法相结合的移动机器人路径规划方法 |
CN105139072A (zh) * | 2015-09-09 | 2015-12-09 | 东华大学 | 应用于非循迹智能小车避障系统的强化学习算法 |
CN105700526B (zh) * | 2016-01-13 | 2018-07-27 | 华北理工大学 | 具有自主学习能力的在线序列极限学习机方法 |
CN105700526A (zh) * | 2016-01-13 | 2016-06-22 | 华北理工大学 | 具有自主学习能力的在线序列极限学习机方法 |
CN105740644B (zh) * | 2016-03-24 | 2018-04-13 | 苏州大学 | 一种基于模型学习的清洁机器人最优目标路径规划方法 |
CN105740644A (zh) * | 2016-03-24 | 2016-07-06 | 苏州大学 | 一种基于模型学习的清洁机器人最优目标路径规划方法 |
CN106017494A (zh) * | 2016-05-23 | 2016-10-12 | 福州华鹰重工机械有限公司 | 基于学徒学习的路径规划方法及装置 |
CN108202327A (zh) * | 2016-12-16 | 2018-06-26 | 发那科株式会社 | 机器学习装置、机器人系统以及机器学习方法 |
US10780577B2 (en) | 2016-12-16 | 2020-09-22 | Fanuc Corporation | Machine learning device, robot system, and machine learning method for learning operations of robot and laser scanner |
CN106595671A (zh) * | 2017-02-22 | 2017-04-26 | 南方科技大学 | 一种基于强化学习的无人机路径规划方法和装置 |
CN108693851A (zh) * | 2017-03-31 | 2018-10-23 | 发那科株式会社 | 行为信息学习装置、机器人控制系统及行为信息学习方法 |
US10730182B2 (en) | 2017-03-31 | 2020-08-04 | Fanuc Corporation | Action information learning device, robot control system and action information learning method |
CN108693851B (zh) * | 2017-03-31 | 2020-05-26 | 发那科株式会社 | 行为信息学习装置、机器人控制系统及行为信息学习方法 |
CN107066967B (zh) * | 2017-04-12 | 2020-06-02 | 清华大学 | 一种利用局部观测信息的主动人脸寻的方法及装置 |
CN107066967A (zh) * | 2017-04-12 | 2017-08-18 | 清华大学 | 一种利用局部观测信息的主动人脸寻的方法及装置 |
CN107024220A (zh) * | 2017-04-14 | 2017-08-08 | 淮安信息职业技术学院 | 基于强化学习蟑螂算法的机器人路径规划方法 |
CN107292392B (zh) * | 2017-05-11 | 2019-11-22 | 苏州大学 | 基于深度带权双q学习的大范围监控方法及监控机器人 |
CN107292392A (zh) * | 2017-05-11 | 2017-10-24 | 苏州大学 | 基于深度带权双q学习的大范围监控方法及监控机器人 |
CN107179077A (zh) * | 2017-05-15 | 2017-09-19 | 北京航空航天大学 | 一种基于elm‑lrf的自适应视觉导航方法 |
CN107065881A (zh) * | 2017-05-17 | 2017-08-18 | 清华大学 | 一种基于深度强化学习的机器人全局路径规划方法 |
CN107065881B (zh) * | 2017-05-17 | 2019-11-08 | 清华大学 | 一种基于深度强化学习的机器人全局路径规划方法 |
CN107065890A (zh) * | 2017-06-02 | 2017-08-18 | 北京航空航天大学 | 一种无人车智能避障方法及系统 |
US10596698B2 (en) | 2017-06-27 | 2020-03-24 | Fanuc Corporation | Machine learning device, robot control system, and machine learning method |
CN109146082A (zh) * | 2017-06-27 | 2019-01-04 | 发那科株式会社 | 机器学习装置、机器人控制系统和机器学习方法 |
CN107844460A (zh) * | 2017-07-24 | 2018-03-27 | 哈尔滨工程大学 | 一种基于p‑maxq的多水下机器人的围捕方法 |
CN107844460B (zh) * | 2017-07-24 | 2020-12-25 | 哈尔滨工程大学 | 一种基于p-maxq的多水下机器人的围捕方法 |
CN107422733B (zh) * | 2017-07-27 | 2020-04-21 | 南京理工大学 | 一种基于两轮差速机器人的运动控制方法 |
CN107422733A (zh) * | 2017-07-27 | 2017-12-01 | 南京理工大学 | 一种基于两轮差速机器人的运动控制方法 |
US10953538B2 (en) | 2017-08-08 | 2021-03-23 | Fanuc Corporation | Control device and learning device |
CN109382825A (zh) * | 2017-08-08 | 2019-02-26 | 发那科株式会社 | 控制装置以及学习装置 |
CN109382825B (zh) * | 2017-08-08 | 2021-03-02 | 发那科株式会社 | 控制装置以及学习装置 |
CN107885086A (zh) * | 2017-11-17 | 2018-04-06 | 合肥工业大学 | 基于mcmc优化q学习的自主航行器控制参数在线调节方法 |
CN107885086B (zh) * | 2017-11-17 | 2019-10-25 | 合肥工业大学 | 基于mcmc优化q学习的自主航行器控制参数在线调节方法 |
CN110196587A (zh) * | 2018-02-27 | 2019-09-03 | 中国科学院深圳先进技术研究院 | 车辆自动驾驶控制策略模型生成方法、装置、设备及介质 |
CN108594803B (zh) * | 2018-03-06 | 2020-06-12 | 吉林大学 | 基于q-学习算法的路径规划方法 |
CN108594803A (zh) * | 2018-03-06 | 2018-09-28 | 吉林大学 | 基于q-学习算法的路径规划方法 |
CN108762249A (zh) * | 2018-04-26 | 2018-11-06 | 常熟理工学院 | 基于近似模型多步优化的清洁机器人最优路径规划方法 |
CN108803313A (zh) * | 2018-06-08 | 2018-11-13 | 哈尔滨工程大学 | 一种基于海流预测模型的路径规划方法 |
CN108803313B (zh) * | 2018-06-08 | 2022-07-12 | 哈尔滨工程大学 | 一种基于海流预测模型的路径规划方法 |
CN108995220A (zh) * | 2018-07-17 | 2018-12-14 | 大连理工大学 | 基于强化学习的复杂薄壁结构物体3d打印路径规划方法 |
CN108995220B (zh) * | 2018-07-17 | 2020-04-28 | 大连理工大学 | 基于强化学习的复杂薄壁结构物体3d打印路径规划方法 |
CN109409592A (zh) * | 2018-10-15 | 2019-03-01 | 浙江工业大学 | 动态环境下移动机器人的最优策略解决方法 |
CN109409592B (zh) * | 2018-10-15 | 2021-08-24 | 浙江工业大学 | 动态环境下移动机器人的最优策略解决方法 |
CN109540136A (zh) * | 2018-10-25 | 2019-03-29 | 广东华中科技大学工业技术研究院 | 一种多无人艇协同路径规划方法 |
CN109445437A (zh) * | 2018-11-30 | 2019-03-08 | 电子科技大学 | 一种无人电动车的路径规划方法 |
CN109663359B (zh) * | 2018-12-06 | 2022-03-25 | 广州多益网络股份有限公司 | 游戏智能体训练的优化方法、装置、终端设备与存储介质 |
CN109663359A (zh) * | 2018-12-06 | 2019-04-23 | 广州多益网络股份有限公司 | 游戏智能体训练的优化方法、装置、终端设备与存储介质 |
CN109635913A (zh) * | 2018-12-16 | 2019-04-16 | 北京工业大学 | 基于自适应贪婪的q学习算法足球系统仿真方法 |
CN109407676A (zh) * | 2018-12-20 | 2019-03-01 | 哈尔滨工业大学 | 基于DoubleDQN网络和深度强化学习的移动机器人避障方法 |
CN113677485A (zh) * | 2019-01-23 | 2021-11-19 | 谷歌有限责任公司 | 使用基于元模仿学习和元强化学习的元学习的用于新任务的机器人控制策略的高效自适应 |
CN109857107A (zh) * | 2019-01-30 | 2019-06-07 | 广州大学 | Agv小车导航方法、装置、系统、介质和设备 |
CN110046800B (zh) * | 2019-03-14 | 2020-09-25 | 南京航空航天大学 | 面向空间目标协同观测的卫星集群构形调整规划方法 |
CN110046800A (zh) * | 2019-03-14 | 2019-07-23 | 南京航空航天大学 | 面向空间目标协同观测的卫星集群构形调整规划方法 |
CN111045054A (zh) * | 2019-04-19 | 2020-04-21 | 泰州腾翔信息科技有限公司 | 基于导航数据的编号识别平台 |
CN110070188B (zh) * | 2019-04-30 | 2021-03-30 | 山东大学 | 一种融合交互式强化学习的增量式认知发育系统及方法 |
CN110070188A (zh) * | 2019-04-30 | 2019-07-30 | 山东大学 | 一种融合交互式强化学习的增量式认知发育系统及方法 |
CN110307848A (zh) * | 2019-07-04 | 2019-10-08 | 南京大学 | 一种移动机器人导航方法 |
CN110321666B (zh) * | 2019-08-09 | 2022-05-03 | 重庆理工大学 | 基于先验知识与dqn算法的多机器人路径规划方法 |
CN110321666A (zh) * | 2019-08-09 | 2019-10-11 | 重庆理工大学 | 基于先验知识与dqn算法的多机器人路径规划方法 |
CN110378439A (zh) * | 2019-08-09 | 2019-10-25 | 重庆理工大学 | 基于Q-Learning算法的单机器人路径规划方法 |
CN112799386B (zh) * | 2019-10-25 | 2021-11-23 | 中国科学院沈阳自动化研究所 | 基于人工势场与强化学习的机器人路径规划方法 |
CN112799386A (zh) * | 2019-10-25 | 2021-05-14 | 中国科学院沈阳自动化研究所 | 基于人工势场与强化学习的机器人路径规划方法 |
CN111544888A (zh) * | 2020-04-22 | 2020-08-18 | 腾讯科技(深圳)有限公司 | 虚拟群体单位的移动方法和装置、存储介质及电子设备 |
WO2021227536A1 (en) * | 2020-05-15 | 2021-11-18 | Huawei Technologies Co., Ltd. | Methods and systems for support policy learning |
US11605026B2 (en) | 2020-05-15 | 2023-03-14 | Huawei Technologies Co. Ltd. | Methods and systems for support policy learning |
CN112052511A (zh) * | 2020-06-15 | 2020-12-08 | 成都蓉奥科技有限公司 | 一种基于深度随机博弈的空战机动策略生成技术 |
CN111949032A (zh) * | 2020-08-18 | 2020-11-17 | 中国科学技术大学 | 一种基于强化学习的3d避障导航系统及方法 |
CN112099493B (zh) * | 2020-08-31 | 2021-11-19 | 西安交通大学 | 一种自主移动机器人轨迹规划方法、系统及设备 |
CN112099493A (zh) * | 2020-08-31 | 2020-12-18 | 西安交通大学 | 一种自主移动机器人轨迹规划方法、系统及设备 |
CN112507520A (zh) * | 2020-11-12 | 2021-03-16 | 深圳慧拓无限科技有限公司 | 一种基于强化学习的路径规划方法及装置 |
CN112595326A (zh) * | 2020-12-25 | 2021-04-02 | 湖北汽车工业学院 | 一种融合先验知识的改进Q-learning路径规划算法 |
CN113639755A (zh) * | 2021-08-20 | 2021-11-12 | 江苏科技大学苏州理工学院 | 一种基于深度强化学习的火灾现场逃生-救援联合系统 |
CN113720346B (zh) * | 2021-09-02 | 2023-07-04 | 重庆邮电大学 | 基于势能场和隐马尔可夫模型的车辆路径规划方法及系统 |
CN113720346A (zh) * | 2021-09-02 | 2021-11-30 | 重庆邮电大学 | 基于势能场和隐马尔可夫模型的车辆路径规划方法及系统 |
CN113848911A (zh) * | 2021-09-28 | 2021-12-28 | 华东理工大学 | 基于Q-learning和RRT*的移动机器人全局路径规划方法 |
CN113790729A (zh) * | 2021-11-16 | 2021-12-14 | 北京科技大学 | 一种基于强化学习算法的无人天车路径规划方法及装置 |
CN113790729B (zh) * | 2021-11-16 | 2022-04-08 | 北京科技大学 | 一种基于强化学习算法的无人天车路径规划方法及装置 |
CN114610034A (zh) * | 2022-03-10 | 2022-06-10 | 西安科技大学 | 一种移动机器人路径规划方法 |
CN115542912A (zh) * | 2022-09-29 | 2022-12-30 | 福州大学 | 一种基于改进Q-learning算法的移动机器人路径规划方法 |
CN115542912B (zh) * | 2022-09-29 | 2024-06-07 | 福州大学 | 一种基于改进Q-learning算法的移动机器人路径规划方法 |
CN116187611A (zh) * | 2023-04-25 | 2023-05-30 | 南方科技大学 | 一种多智能体路径规划方法及终端 |
CN116922379A (zh) * | 2023-07-10 | 2023-10-24 | 深圳进化动力数码科技有限公司 | 基于视觉的机械臂避障方法、系统、电子设备及存储介质 |
CN116922379B (zh) * | 2023-07-10 | 2024-05-31 | 深圳进化动力数码科技有限公司 | 基于视觉的机械臂避障方法、系统、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN102819264B (zh) | 2015-01-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102819264B (zh) | 移动机器人路径规划q学习初始化方法 | |
CN102402712B (zh) | 基于神经网络的机器人强化学习初始化方法 | |
Jiang et al. | Path planning for intelligent robots based on deep Q-learning with experience replay and heuristic knowledge | |
Low et al. | Solving the optimal path planning of a mobile robot using improved Q-learning | |
Mohanty et al. | Controlling the motion of an autonomous mobile robot using various techniques: a review | |
CN111780777A (zh) | 一种基于改进a*算法和深度强化学习的无人车路径规划方法 | |
EP3863904A2 (en) | Autonomous vehicle planning | |
CN112799386B (zh) | 基于人工势场与强化学习的机器人路径规划方法 | |
Shiltagh et al. | Optimal path planning for intelligent mobile robot navigation using modified particle swarm optimization | |
JP7448683B2 (ja) | マルチタスク強化学習におけるメタ勾配を用いたアクション選択のための学習オプション | |
Babu et al. | Model predictive control for autonomous driving considering actuator dynamics | |
Ma et al. | State-chain sequential feedback reinforcement learning for path planning of autonomous mobile robots | |
EP3955082A1 (en) | Computer-implemented method and device for controlling a mobile robot based on semantic environment maps | |
Roy et al. | Adaptive firefly algorithm for nonholonomic motion planning of car-like system | |
Yan et al. | Real-world learning control for autonomous exploration of a biomimetic robotic shark | |
Wang et al. | Adaptive environment modeling based reinforcement learning for collision avoidance in complex scenes | |
Sun et al. | Event-triggered reconfigurable reinforcement learning motion-planning approach for mobile robot in unknown dynamic environments | |
Guo et al. | Optimal navigation for AGVs: A soft actor–critic-based reinforcement learning approach with composite auxiliary rewards | |
Raiesdana | A hybrid method for industrial robot navigation | |
Zhang et al. | Robot path planning method based on deep reinforcement learning | |
CN116360454A (zh) | 行人环境下基于深度强化学习的机器人路径避碰规划方法 | |
Shi et al. | Research on Path Planning Strategy of Rescue Robot Based on Reinforcement Learning | |
Guan et al. | Research on path planning of mobile robot based on improved Deep Q Network | |
Cherroun et al. | Intelligent systems based on reinforcement learning and fuzzy logic approaches," Application to mobile robotic" | |
CN115097814A (zh) | 基于改进pso算法的移动机器人路径规划方法、系统及应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
ASS | Succession or assignment of patent right |
Owner name: SHANDONG UNIVERSITY (WEIHAI) Free format text: FORMER OWNER: SHANDONG UNIVERSITY Effective date: 20150812 |
|
C41 | Transfer of patent application or patent right or utility model | ||
TR01 | Transfer of patent right |
Effective date of registration: 20150812 Address after: 264209 Weihai Cultural Road West, Shandong, No. 180 Patentee after: Shandong University, Weihai Address before: 250061 Ji'nan Province, Lixia District, Shandong by Road No. ten, No. 17923 Patentee before: Shandong University |
|
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20150121 Termination date: 20150730 |
|
EXPY | Termination of patent right or utility model |