JP2023051351A - 移動体制御装置、移動体、移動体制御方法、プログラム、および学習装置 - Google Patents
移動体制御装置、移動体、移動体制御方法、プログラム、および学習装置 Download PDFInfo
- Publication number
- JP2023051351A JP2023051351A JP2021161960A JP2021161960A JP2023051351A JP 2023051351 A JP2023051351 A JP 2023051351A JP 2021161960 A JP2021161960 A JP 2021161960A JP 2021161960 A JP2021161960 A JP 2021161960A JP 2023051351 A JP2023051351 A JP 2023051351A
- Authority
- JP
- Japan
- Prior art keywords
- moving body
- route
- moving
- mobile
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D1/00—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
- G05D1/0088—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots characterized by the autonomous decision making process, e.g. artificial intelligence, predefined behaviours
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D1/00—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
- G05D1/02—Control of position or course in two dimensions
- G05D1/021—Control of position or course in two dimensions specially adapted to land vehicles
- G05D1/0212—Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory
- G05D1/0221—Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory involving a learning process
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D1/00—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
- G05D1/02—Control of position or course in two dimensions
- G05D1/021—Control of position or course in two dimensions specially adapted to land vehicles
- G05D1/0287—Control of position or course in two dimensions specially adapted to land vehicles involving a plurality of land vehicles, e.g. fleet or convoy travelling
- G05D1/0289—Control of position or course in two dimensions specially adapted to land vehicles involving a plurality of land vehicles, e.g. fleet or convoy travelling with means for avoiding collisions between vehicles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/092—Reinforcement learning
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- General Physics & Mathematics (AREA)
- Aviation & Aerospace Engineering (AREA)
- Automation & Control Theory (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Theoretical Computer Science (AREA)
- Medical Informatics (AREA)
- Game Theory and Decision Science (AREA)
- Business, Economics & Management (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)
Abstract
Description
(1):この発明の一態様に係る移動体制御装置は、自移動体の周辺に存在する他の移動体の移動ベクトルの変化を低減するように前記自移動体の経路を決定する経路決定部と、前記経路決定部により決定された経路に沿って前記自移動体を移動させる制御部と、を備える移動体制御装置である。
上記(4)の態様によれば、パーソナルスペースを考慮して移動体の経路を決定することができる。
これらより、上記(1)~(7)の態様によれば、周囲の他の移動体の将来の動作を予測することなく、周囲の他の移動体に対して更に親和性の高い行動を、移動体にとらせることができる。
上記(8)の態様によれば、周囲の他の移動体の将来の動作を予測することなく、他の移動体の移動をなるべく阻害しないように学習することができる。この結果、周囲の他の移動体に対して親和性の高い行動を移動体にとらせることができるポリシーを生成することができる。
上記(9)の態様によれば、パーソナルスペースを考慮して学習することができる。
これらより、上記(8)~(9)の態様によれば、周囲の他の移動体の将来の動作を予測することなく、周囲の他の移動体に対して更に親和性の高い行動を、移動体にとらせるための学習を行うことができる。
図1は、実施形態のシステム構成を示す概略図である。移動体制御システム1は、学習装置100と、移動体200とを備える。学習装置100は、一以上のプロセッサにより実現される。学習装置100は、複数の移動体についてコンピュータシミュレーションにより行動を決定し、その行動によって生じた環境の変化等に基づく報酬を導出または取得し、報酬を最大化する行動(動作)を学習する装置である。動作とは、例えば、シミュレーション空間内での移動である。移動以外の動作が学習対象とされてもよいが、以下の説明では動作とは移動を意味するものとする。移動を決定するシミュレータ(後述するシミュレーション部)は、学習装置100と異なる装置において実行されてもよいが、以下の説明ではシミュレータは学習装置100が実行するものとする。学習装置100は、地図情報などの、シミュレーションの前提となる環境情報を予め記憶している。学習装置100の学習結果は、行動決定モデルMDとして移動体200に搭載される。
図6は、移動体200の構成図である。移動体200は、例えば、移動体制御装置250と、周辺検知装置210と、移動体センサ220と、作業部230と、駆動装置240とを備える。移動体200は、車両であってもよいし、ロボット等のような装置であってもよい。移動体制御装置250と、周辺検知装置210と、移動体センサ220と、作業部230と、駆動装置240とは、CAN(Controller Area Network)通信線等の多重通信線やシリアル通信線、無線通信網等によって互いに接続される。
プログラムを格納した記憶装置と、
前記記憶装置に接続されたハードウェアプロセッサと、を備え、
前記ハードウェアプロセッサが前記プログラムを実行することにより、
自移動体の周辺に存在する他の移動体の移動ベクトルの変化を低減するように前記自移動体の経路を決定し、
前記決定された経路に沿って前記自移動体を移動させる、
移動体制御装置。
プログラムを格納した記憶装置と、
前記記憶装置に接続されたハードウェアプロセッサと、を備え、
前記ハードウェアプロセッサが前記プログラムを実行することにより、
自移動体と他の移動体のそれぞれの移動動作をシミュレートし、
前記シミュレーションの結果に報酬関数を適用し、少なくとも前記自移動体の移動動作を評価し、
前記評価の結果に基づいて学習し、
前記評価する際に、前記他の移動体の移動ベクトルの変化が小さい程、前記自移動体の移動動作を高く評価する、
学習装置。
110 学習部
120 シミュレーション部
130 評価部
200 移動体
210 周辺検知装置
230 作業部
240 駆動装置
250 移動体制御装置
252 経路決定部
254 制御部
256 記憶部
256A 行動決定モデルMD
Claims (9)
- 自移動体の周辺に存在する他の移動体の移動ベクトルの変化を低減するように前記自移動体の経路を決定する経路決定部と、
前記経路決定部により決定された経路に沿って前記自移動体を移動させる制御部と、
を備える移動体制御装置。 - 前記経路決定部は、複数の前記他の移動体の移動ベクトルの変化の合計を低減するように前記自移動体の経路を決定する、
請求項1に記載の移動体制御装置。 - 前記経路決定部は、前記他の移動体の移動ベクトルの変化を独立変数として持つ報酬関数の値が良好な値となるように前記自移動体の経路を決定する、
請求項1または2記載の移動体制御装置。 - 前記経路決定部は、前記他の移動体の移動ベクトルの向く方向に大きく、前記他の移動体の移動ベクトルの向く方向の側方および反対方向に小さい領域に進入しないように前記自移動体の経路を決定する、
請求項1から3のうちいずれか1項記載の移動体制御装置。 - 請求項1から4のうちいずれかに記載の移動体制御装置と、
周辺環境を検知する周辺検知装置と、
ユーザへ所定のサービスを提供するための作業部と、
前記移動体制御装置によって制御され、移動体を移動させる駆動部と、
を備え、
前記移動体制御装置は、前記周辺環境に基づく他の移動体の状態を入力することで、前記移動体を移動させる制御パラメータを出力する、
移動体。 - コンピュータが、
自移動体の周辺に存在する他の移動体の移動ベクトルの変化を低減するように前記自移動体の経路を決定し、
前記経路に沿って前記自移動体を移動させる、
移動体制御方法。 - コンピュータに、
自移動体の周辺に存在する他の移動体の移動ベクトルの変化を低減するように前記自移動体の経路を決定させ、
前記経路に沿って前記自移動体を移動させることを行わせる、
プログラム。 - 自移動体と他の移動体のそれぞれの移動動作をシミュレートするシミュレーション部と、
前記シミュレーション部の処理結果に報酬関数を適用し、少なくとも前記自移動体の移動動作を評価する評価部と、
前記評価部の評価結果に基づいて学習する学習部と、を備え、
前記評価部は、前記他の移動体の移動ベクトルの変化が小さい程、前記自移動体の移動動作を高く評価する、
学習装置。 - 前記評価部は、前記自移動体が、前記他の移動体の移動ベクトルの向く方向に大きく、前記他の移動体の移動ベクトルの向く方向の側方および反対方向に小さい領域に進入した場合、前記自移動体の移動動作を低く評価する、
請求項8記載の学習装置。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021161960A JP7584385B2 (ja) | 2021-09-30 | 2021-09-30 | 移動体制御装置、移動体、移動体制御方法、プログラム、および学習装置 |
US17/951,140 US20230101162A1 (en) | 2021-09-30 | 2022-09-23 | Mobile body control device, mobile body, mobile body control method, program, and learning device |
CN202211186194.XA CN115903774A (zh) | 2021-09-30 | 2022-09-27 | 移动体、其控制装置及其控制方法、存储介质及学习装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021161960A JP7584385B2 (ja) | 2021-09-30 | 2021-09-30 | 移動体制御装置、移動体、移動体制御方法、プログラム、および学習装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023051351A true JP2023051351A (ja) | 2023-04-11 |
JP7584385B2 JP7584385B2 (ja) | 2024-11-15 |
Family
ID=85721498
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021161960A Active JP7584385B2 (ja) | 2021-09-30 | 2021-09-30 | 移動体制御装置、移動体、移動体制御方法、プログラム、および学習装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20230101162A1 (ja) |
JP (1) | JP7584385B2 (ja) |
CN (1) | CN115903774A (ja) |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4717105B2 (ja) | 2008-08-29 | 2011-07-06 | 株式会社日立製作所 | 自律移動ロボット装置及びかかる装置における飛び出し衝突回避方法 |
CN107111317B (zh) | 2014-12-25 | 2020-07-17 | 株式会社爱考斯研究 | 移动体 |
US11231715B2 (en) | 2018-05-22 | 2022-01-25 | King Fahd University Of Petroleum And Minerals | Method and system for controlling a vehicle |
-
2021
- 2021-09-30 JP JP2021161960A patent/JP7584385B2/ja active Active
-
2022
- 2022-09-23 US US17/951,140 patent/US20230101162A1/en active Pending
- 2022-09-27 CN CN202211186194.XA patent/CN115903774A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
CN115903774A (zh) | 2023-04-04 |
US20230101162A1 (en) | 2023-03-30 |
JP7584385B2 (ja) | 2024-11-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7479064B2 (ja) | 動的障害物を有する環境における動作計画を容易にする装置、方法及び物品 | |
Qiao et al. | Pomdp and hierarchical options mdp with continuous actions for autonomous driving at intersections | |
CN112937603A (zh) | 用于预测目标车辆的位置的系统和方法 | |
JP2019109691A (ja) | 移動体挙動予測装置および移動体挙動予測方法 | |
CN110858098A (zh) | 使用人-机器人交互的自驱动移动机器人 | |
CN114485673B (zh) | 基于深度强化学习的服务机器人人群感知导航方法及系统 | |
CN114371709A (zh) | 路径规划方法、设备、存储介质及程序产品 | |
JP2021189508A (ja) | ロボット、移動経路生成装置及びそのプログラム、並びに、移動予測装置 | |
CN114667494A (zh) | 机器人控制模型学习方法、机器人控制模型学习装置、机器人控制模型学习程序、机器人控制方法、机器人控制装置、机器人控制程序以及机器人 | |
Quinones-Ramirez et al. | Robot path planning using deep reinforcement learning | |
JP7584385B2 (ja) | 移動体制御装置、移動体、移動体制御方法、プログラム、および学習装置 | |
US12292740B2 (en) | Mobile object control device, mobile object, learning device, learning method, and storage medium | |
EP4394538A1 (en) | Trajectory correction system and method therefor | |
Tao et al. | Fast and robust training and deployment of deep reinforcement learning based navigation policy | |
JP7459238B2 (ja) | ユーザ選好による強化学習基盤の自律走行最適化方法およびシステム | |
CN117234216A (zh) | 一种机器人深度强化学习运动规划方法及计算机可读介质 | |
JP7639808B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
Raj et al. | Dynamic obstacle avoidance technique for mobile robot navigation using deep reinforcement learning | |
JP7647901B2 (ja) | 制御システム、情報処理装置、制御方法、及び制御値生成方法 | |
Tsai et al. | An autonomous vehicle-following technique for self-driving cars based on the semantic segmentation technique | |
CN114184199B (zh) | 机器人导航的方法、装置、电子设备及存储介质 | |
Afonso et al. | Deep Deterministic Policy Gradient and Computer Vision for Autonomous Wheelchair Navigation in Human-Shared Environments | |
WO2025069293A1 (ja) | フィルタ作成方法、フィルタ作成装置、プログラム、およびフィルタ装置 | |
Wu et al. | Improved particle swarm optimization and DDQN algorithm for multi-UUV path planning | |
KR20220132241A (ko) | 로봇 및 그 제어 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20231128 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240620 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240625 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240826 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20241008 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20241105 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7584385 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |