JP2023051351A - 移動体制御装置、移動体、移動体制御方法、プログラム、および学習装置 - Google Patents
移動体制御装置、移動体、移動体制御方法、プログラム、および学習装置 Download PDFInfo
- Publication number
- JP2023051351A JP2023051351A JP2021161960A JP2021161960A JP2023051351A JP 2023051351 A JP2023051351 A JP 2023051351A JP 2021161960 A JP2021161960 A JP 2021161960A JP 2021161960 A JP2021161960 A JP 2021161960A JP 2023051351 A JP2023051351 A JP 2023051351A
- Authority
- JP
- Japan
- Prior art keywords
- moving body
- route
- moving
- mobile
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 13
- 230000033001 locomotion Effects 0.000 claims abstract description 79
- 239000013598 vector Substances 0.000 claims abstract description 42
- 230000009471 action Effects 0.000 claims abstract description 33
- 238000011156 evaluation Methods 0.000 claims description 38
- 230000006870 function Effects 0.000 claims description 38
- 238000004088 simulation Methods 0.000 claims description 21
- 230000008859 change Effects 0.000 claims description 15
- 238000012545 processing Methods 0.000 claims description 7
- 230000002093 peripheral effect Effects 0.000 claims description 6
- 239000003795 chemical substances by application Substances 0.000 description 80
- 230000006399 behavior Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 10
- 230000002787 reinforcement Effects 0.000 description 10
- 238000001514 detection method Methods 0.000 description 9
- 238000004891 communication Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000001133 acceleration Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000036461 convulsion Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 241001143500 Aceraceae Species 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 229910044991 metal oxide Inorganic materials 0.000 description 1
- 150000004706 metal oxides Chemical class 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D1/00—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
- G05D1/0088—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots characterized by the autonomous decision making process, e.g. artificial intelligence, predefined behaviours
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D1/00—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
- G05D1/02—Control of position or course in two dimensions
- G05D1/021—Control of position or course in two dimensions specially adapted to land vehicles
- G05D1/0212—Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory
- G05D1/0221—Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory involving a learning process
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D1/00—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
- G05D1/02—Control of position or course in two dimensions
- G05D1/021—Control of position or course in two dimensions specially adapted to land vehicles
- G05D1/0287—Control of position or course in two dimensions specially adapted to land vehicles involving a plurality of land vehicles, e.g. fleet or convoy travelling
- G05D1/0289—Control of position or course in two dimensions specially adapted to land vehicles involving a plurality of land vehicles, e.g. fleet or convoy travelling with means for avoiding collisions between vehicles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/092—Reinforcement learning
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- General Physics & Mathematics (AREA)
- Aviation & Aerospace Engineering (AREA)
- Automation & Control Theory (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Theoretical Computer Science (AREA)
- Medical Informatics (AREA)
- Game Theory and Decision Science (AREA)
- Business, Economics & Management (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)
Abstract
Description
(1):この発明の一態様に係る移動体制御装置は、自移動体の周辺に存在する他の移動体の移動ベクトルの変化を低減するように前記自移動体の経路を決定する経路決定部と、前記経路決定部により決定された経路に沿って前記自移動体を移動させる制御部と、を備える移動体制御装置である。
上記(4)の態様によれば、パーソナルスペースを考慮して移動体の経路を決定することができる。
これらより、上記(1)~(7)の態様によれば、周囲の他の移動体の将来の動作を予測することなく、周囲の他の移動体に対して更に親和性の高い行動を、移動体にとらせることができる。
上記(8)の態様によれば、周囲の他の移動体の将来の動作を予測することなく、他の移動体の移動をなるべく阻害しないように学習することができる。この結果、周囲の他の移動体に対して親和性の高い行動を移動体にとらせることができるポリシーを生成することができる。
上記(9)の態様によれば、パーソナルスペースを考慮して学習することができる。
これらより、上記(8)~(9)の態様によれば、周囲の他の移動体の将来の動作を予測することなく、周囲の他の移動体に対して更に親和性の高い行動を、移動体にとらせるための学習を行うことができる。
図1は、実施形態のシステム構成を示す概略図である。移動体制御システム1は、学習装置100と、移動体200とを備える。学習装置100は、一以上のプロセッサにより実現される。学習装置100は、複数の移動体についてコンピュータシミュレーションにより行動を決定し、その行動によって生じた環境の変化等に基づく報酬を導出または取得し、報酬を最大化する行動(動作)を学習する装置である。動作とは、例えば、シミュレーション空間内での移動である。移動以外の動作が学習対象とされてもよいが、以下の説明では動作とは移動を意味するものとする。移動を決定するシミュレータ(後述するシミュレーション部)は、学習装置100と異なる装置において実行されてもよいが、以下の説明ではシミュレータは学習装置100が実行するものとする。学習装置100は、地図情報などの、シミュレーションの前提となる環境情報を予め記憶している。学習装置100の学習結果は、行動決定モデルMDとして移動体200に搭載される。
図6は、移動体200の構成図である。移動体200は、例えば、移動体制御装置250と、周辺検知装置210と、移動体センサ220と、作業部230と、駆動装置240とを備える。移動体200は、車両であってもよいし、ロボット等のような装置であってもよい。移動体制御装置250と、周辺検知装置210と、移動体センサ220と、作業部230と、駆動装置240とは、CAN(Controller Area Network)通信線等の多重通信線やシリアル通信線、無線通信網等によって互いに接続される。
プログラムを格納した記憶装置と、
前記記憶装置に接続されたハードウェアプロセッサと、を備え、
前記ハードウェアプロセッサが前記プログラムを実行することにより、
自移動体の周辺に存在する他の移動体の移動ベクトルの変化を低減するように前記自移動体の経路を決定し、
前記決定された経路に沿って前記自移動体を移動させる、
移動体制御装置。
プログラムを格納した記憶装置と、
前記記憶装置に接続されたハードウェアプロセッサと、を備え、
前記ハードウェアプロセッサが前記プログラムを実行することにより、
自移動体と他の移動体のそれぞれの移動動作をシミュレートし、
前記シミュレーションの結果に報酬関数を適用し、少なくとも前記自移動体の移動動作を評価し、
前記評価の結果に基づいて学習し、
前記評価する際に、前記他の移動体の移動ベクトルの変化が小さい程、前記自移動体の移動動作を高く評価する、
学習装置。
110 学習部
120 シミュレーション部
130 評価部
200 移動体
210 周辺検知装置
230 作業部
240 駆動装置
250 移動体制御装置
252 経路決定部
254 制御部
256 記憶部
256A 行動決定モデルMD
Claims (9)
- 自移動体の周辺に存在する他の移動体の移動ベクトルの変化を低減するように前記自移動体の経路を決定する経路決定部と、
前記経路決定部により決定された経路に沿って前記自移動体を移動させる制御部と、
を備える移動体制御装置。 - 前記経路決定部は、複数の前記他の移動体の移動ベクトルの変化の合計を低減するように前記自移動体の経路を決定する、
請求項1に記載の移動体制御装置。 - 前記経路決定部は、前記他の移動体の移動ベクトルの変化を独立変数として持つ報酬関数の値が良好な値となるように前記自移動体の経路を決定する、
請求項1または2記載の移動体制御装置。 - 前記経路決定部は、前記他の移動体の移動ベクトルの向く方向に大きく、前記他の移動体の移動ベクトルの向く方向の側方および反対方向に小さい領域に進入しないように前記自移動体の経路を決定する、
請求項1から3のうちいずれか1項記載の移動体制御装置。 - 請求項1から4のうちいずれかに記載の移動体制御装置と、
周辺環境を検知する周辺検知装置と、
ユーザへ所定のサービスを提供するための作業部と、
前記移動体制御装置によって制御され、移動体を移動させる駆動部と、
を備え、
前記移動体制御装置は、前記周辺環境に基づく他の移動体の状態を入力することで、前記移動体を移動させる制御パラメータを出力する、
移動体。 - コンピュータが、
自移動体の周辺に存在する他の移動体の移動ベクトルの変化を低減するように前記自移動体の経路を決定し、
前記経路に沿って前記自移動体を移動させる、
移動体制御方法。 - コンピュータに、
自移動体の周辺に存在する他の移動体の移動ベクトルの変化を低減するように前記自移動体の経路を決定させ、
前記経路に沿って前記自移動体を移動させることを行わせる、
プログラム。 - 自移動体と他の移動体のそれぞれの移動動作をシミュレートするシミュレーション部と、
前記シミュレーション部の処理結果に報酬関数を適用し、少なくとも前記自移動体の移動動作を評価する評価部と、
前記評価部の評価結果に基づいて学習する学習部と、を備え、
前記評価部は、前記他の移動体の移動ベクトルの変化が小さい程、前記自移動体の移動動作を高く評価する、
学習装置。 - 前記評価部は、前記自移動体が、前記他の移動体の移動ベクトルの向く方向に大きく、前記他の移動体の移動ベクトルの向く方向の側方および反対方向に小さい領域に進入した場合、前記自移動体の移動動作を低く評価する、
請求項8記載の学習装置。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021161960A JP2023051351A (ja) | 2021-09-30 | 2021-09-30 | 移動体制御装置、移動体、移動体制御方法、プログラム、および学習装置 |
US17/951,140 US20230101162A1 (en) | 2021-09-30 | 2022-09-23 | Mobile body control device, mobile body, mobile body control method, program, and learning device |
CN202211186194.XA CN115903774A (zh) | 2021-09-30 | 2022-09-27 | 移动体、其控制装置及其控制方法、存储介质及学习装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021161960A JP2023051351A (ja) | 2021-09-30 | 2021-09-30 | 移動体制御装置、移動体、移動体制御方法、プログラム、および学習装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023051351A true JP2023051351A (ja) | 2023-04-11 |
Family
ID=85721498
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021161960A Pending JP2023051351A (ja) | 2021-09-30 | 2021-09-30 | 移動体制御装置、移動体、移動体制御方法、プログラム、および学習装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20230101162A1 (ja) |
JP (1) | JP2023051351A (ja) |
CN (1) | CN115903774A (ja) |
-
2021
- 2021-09-30 JP JP2021161960A patent/JP2023051351A/ja active Pending
-
2022
- 2022-09-23 US US17/951,140 patent/US20230101162A1/en active Pending
- 2022-09-27 CN CN202211186194.XA patent/CN115903774A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
CN115903774A (zh) | 2023-04-04 |
US20230101162A1 (en) | 2023-03-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7479064B2 (ja) | 動的障害物を有する環境における動作計画を容易にする装置、方法及び物品 | |
Qiao et al. | Pomdp and hierarchical options mdp with continuous actions for autonomous driving at intersections | |
CN111587408B (zh) | 机器人导航和对象跟踪 | |
WO2019124001A1 (ja) | 移動体挙動予測装置および移動体挙動予測方法 | |
Sombolestan et al. | Optimal path-planning for mobile robots to find a hidden target in an unknown environment based on machine learning | |
Kato et al. | Autonomous robot navigation system with learning based on deep Q-network and topological maps | |
CN110858098A (zh) | 使用人-机器人交互的自驱动移动机器人 | |
JPWO2013011543A1 (ja) | 自律移動装置およびその制御方法 | |
CN114485673B (zh) | 基于深度强化学习的服务机器人人群感知导航方法及系统 | |
JP2021189508A (ja) | ロボット、移動経路生成装置及びそのプログラム、並びに、移動予測装置 | |
JP2021077286A (ja) | ロボット制御モデル学習方法、ロボット制御モデル学習装置、ロボット制御モデル学習プログラム、ロボット制御方法、ロボット制御装置、ロボット制御プログラム、及びロボット | |
US20230098219A1 (en) | Mobile object control device, mobile object, learning device, learning method, and storage medium | |
JP7258046B2 (ja) | 経路決定装置、ロボット及び経路決定方法 | |
JP2023051351A (ja) | 移動体制御装置、移動体、移動体制御方法、プログラム、および学習装置 | |
Raj et al. | Dynamic Obstacle Avoidance Technique for Mobile Robot Navigation Using Deep Reinforcement Learning | |
CN112585616A (zh) | 用于预测行人的至少一个将来的速度矢量和或将来的姿态的方法 | |
Tao et al. | Fast and robust training and deployment of deep reinforcement learning based navigation policy | |
CN114167856A (zh) | 一种基于人工情感的服务机器人局部路径规划方法 | |
Wang et al. | Dynamic path planning algorithm for autonomous vehicles in cluttered environments | |
EP4394538A1 (en) | Trajectory correction system and method therefor | |
JP7459238B2 (ja) | ユーザ選好による強化学習基盤の自律走行最適化方法およびシステム | |
Tsai et al. | An autonomous vehicle-following technique for self-driving cars based on the semantic segmentation technique | |
WO2024195078A1 (ja) | 制御装置、制御方法、およびプログラム | |
Abdo et al. | Obstacle Avoidance Robot Using Convolutional Neural Network | |
Dobrevski et al. | Dynamic Adaptive Dynamic Window Approach |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20231128 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240620 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240625 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240826 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20241008 |