JP6706223B2 - 移動体制御方法、移動体制御装置、及びプログラム - Google Patents
移動体制御方法、移動体制御装置、及びプログラム Download PDFInfo
- Publication number
- JP6706223B2 JP6706223B2 JP2017103409A JP2017103409A JP6706223B2 JP 6706223 B2 JP6706223 B2 JP 6706223B2 JP 2017103409 A JP2017103409 A JP 2017103409A JP 2017103409 A JP2017103409 A JP 2017103409A JP 6706223 B2 JP6706223 B2 JP 6706223B2
- Authority
- JP
- Japan
- Prior art keywords
- moving body
- control
- feature amount
- deduction
- relationship
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 29
- VJYFKVYYMZPMAB-UHFFFAOYSA-N ethoprophos Chemical compound CCCSP(=O)(OCC)SCCC VJYFKVYYMZPMAB-UHFFFAOYSA-N 0.000 title 2
- PWPJGUXAGUPAHP-UHFFFAOYSA-N lufenuron Chemical compound C1=C(Cl)C(OC(F)(F)C(C(F)(F)F)F)=CC(Cl)=C1NC(=O)NC(=O)C1=C(F)C=CC=C1F PWPJGUXAGUPAHP-UHFFFAOYSA-N 0.000 title 1
- 230000002787 reinforcement Effects 0.000 claims description 13
- 230000001133 acceleration Effects 0.000 claims description 8
- 238000000605 extraction Methods 0.000 claims description 8
- 238000011156 evaluation Methods 0.000 description 5
- 230000033001 locomotion Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
Images
Landscapes
- Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)
- Feedback Control In General (AREA)
Description
移動体の位置及び前記移動体に対する複数の減点対象を取得する状態把握手順と、
前記移動体の位置から前記移動体の現在の速度を算出し、前記移動体と前記減点対象との関係を前記減点対象ごとに数値化し、現在の前記速度及び数値化した前記関係の特徴量ベクトルを取得する特徴量抽出手順と、
前記特徴量ベクトルに対して、現在の前記速度、数値化した前記関係、及び前記移動体に加減速と方向転換の少なくとも一つをさせる制御指針を行った結果を含む報酬値を用いて強化学習を行い、新たな制御指針を算出して前記移動体の制御を行う学習制御手順と、
を行う。
移動体の位置及び前記移動体に対する複数の減点対象を取得する状態把握部と、
前記移動体の位置から前記移動体の現在の速度を算出し、前記移動体と前記減点対象との関係を前記減点対象ごとに数値化し、現在の前記速度及び数値化した前記関係の特徴量ベクトルを取得する特徴量抽出部と、
前記特徴量ベクトルに対して、現在の前記速度、数値化した前記関係、及び前記移動体に加減速と方向転換の少なくとも一つをさせる制御指針を行った結果を含む報酬値を用いて強化学習を行い、新たな制御指針を算出して前記移動体の制御を行う学習制御部と、
を備える。
移動体の位置及び前記移動体に対する複数の減点対象を取得する状態把握部11と、
前記移動体の位置から前記移動体の現在の速度を算出し、前記移動体と前記減点対象との関係を前記減点対象ごとに数値化し、現在の前記速度及び数値化した前記関係の特徴量ベクトルを取得する特徴量抽出部12と、
前記特徴量ベクトルに対して、現在の前記速度、数値化した前記関係、及び前記移動体に加減速と方向転換の少なくとも一つをさせる制御指針を行った結果を含む報酬値を用いて強化学習を行い、新たな制御指針を算出して前記移動体の制御を行う学習制御部13と、
を備える。
状態把握部11が、移動体の位置及び前記移動体に対する複数の減点対象を取得する状態把握手順S11と、
特徴量抽出部12が、前記移動体の位置から前記移動体の現在の速度を算出し、前記移動体と前記減点対象との関係を前記減点対象ごとに数値化し、現在の前記速度及び数値化した前記関係の特徴量ベクトルを取得する特徴量抽出手順S12と、
学習制御部13が、前記特徴量ベクトルに対して、現在の前記速度、数値化した前記関係、及び前記移動体に加減速と方向転換の少なくとも一つをさせる制御指針を行った結果を含む報酬値を用いて強化学習を行い、新たな制御指針を算出して前記移動体の制御を行う学習制御手順S13と、
を行う。
状態把握部11は、位置情報の取得等を既存の技術によって得る。例えば、状態把握部11は、移動体自身の位置や速度、及び移動体の前方の減点対象を移動体に取り付けられたセンサー、GPS情報及び予め入力された情報(地図やルール(例:進入禁止区域等の情報))から得ることができる。
特徴量抽出部12は、状態把握部11からの情報に基づき、移動体の現在の速度(履歴)vと、360度方向に対する各角度方向(θ1, θ2, ..., θn)にある減点対象との距離(d(θi)、i=1〜n)とを特徴量として検出する。各距離は、任意の定数より大きいものを1、小さいものを0として[0,1]に正規化する。ここで、1を超える場合は1とみなし、0を下回るものは0とみなす。なお、進入禁止区域等のルールについては、当該区域までの距離を用いる。また、時間によって変動するルール(例:時間指定の進入禁止)については、距離の次元だけでなく、時間の次元を含めた多次元空間を加味し、進入禁止になるまでの時空間距離を特徴量に利用する。特徴量(速度vと距離d(θi))のベクトルを学習制御部13に伝達する。図2は特徴量を説明する図である。
学習制御部13は、得られた特徴量ベクトルに対して、減点対象を回避するための最適な制御指針を決定するために、強化学習を用いる。強化学習では、現在(時刻t)、観測している特徴量ベクトルstに対して、制御指針atを実行した際に得られる数2の報酬値を用いて、stにおける制御指針aの価値Q(st,at)を数3のように更新する。
12:特徴量抽出部
13:学習制御部
Claims (5)
- 移動体の位置及び前記移動体に対する複数の減点対象を取得する状態把握手順と、
前記移動体の位置から前記移動体の現在の速度を算出し、前記移動体と前記減点対象との関係を前記減点対象ごとに数値化し、現在の前記速度及び数値化した前記関係の特徴量ベクトルを取得する特徴量抽出手順と、
前記特徴量ベクトルに対して、現在の前記速度、数値化した前記関係、及び前記移動体に加減速と方向転換の少なくとも一つをさせる制御指針を行った結果を含む報酬値を用いて強化学習を行い、新たな制御指針を算出して前記移動体の制御を行う学習制御手順と、
を行う移動体制御方法。 - 前記特徴量ベクトルが前記減点対象の軌跡を含むことを特徴とする請求項1に記載の移動体制御方法。
- 移動体の位置及び前記移動体に対する複数の減点対象を取得する状態把握部と、
前記移動体の位置から前記移動体の現在の速度を算出し、前記移動体と前記減点対象との関係を前記減点対象ごとに数値化し、現在の前記速度及び数値化した前記関係の特徴量ベクトルを取得する特徴量抽出部と、
前記特徴量ベクトルに対して、現在の前記速度、数値化した前記関係、及び前記移動体に加減速と方向転換の少なくとも一つをさせる制御指針を行った結果を含む報酬値を用いて強化学習を行い、新たな制御指針を算出して前記移動体の制御を行う学習制御部と、
を備える移動体制御装置。 - 前記特徴量ベクトルが前記減点対象の軌跡を含むことを特徴とする請求項3に記載の移動体制御装置。
- 請求項1又は2に記載の移動体制御方法を実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017103409A JP6706223B2 (ja) | 2017-05-25 | 2017-05-25 | 移動体制御方法、移動体制御装置、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017103409A JP6706223B2 (ja) | 2017-05-25 | 2017-05-25 | 移動体制御方法、移動体制御装置、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018198031A JP2018198031A (ja) | 2018-12-13 |
JP6706223B2 true JP6706223B2 (ja) | 2020-06-03 |
Family
ID=64663516
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017103409A Active JP6706223B2 (ja) | 2017-05-25 | 2017-05-25 | 移動体制御方法、移動体制御装置、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6706223B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20220017106A1 (en) * | 2018-12-26 | 2022-01-20 | Mitsubishi Electric Corporation | Moving object control device, moving object control learning device, and moving object control method |
JP7407401B2 (ja) * | 2019-03-04 | 2024-01-04 | パナソニックIpマネジメント株式会社 | 制御システム、及び制御方法 |
CN112162555B (zh) * | 2020-09-23 | 2021-07-16 | 燕山大学 | 混合车队中基于强化学习控制策略的车辆控制方法 |
CN116540553B (zh) * | 2023-07-05 | 2023-08-25 | 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) | 一种基于强化学习的移动机器人安全运动方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06161551A (ja) * | 1992-11-19 | 1994-06-07 | Mitsubishi Heavy Ind Ltd | 自律移動物体の障害物回避システム |
JP4269055B2 (ja) * | 2004-03-31 | 2009-05-27 | 国立大学法人広島大学 | 障害物回避装置および移動体 |
JP5052013B2 (ja) * | 2005-03-17 | 2012-10-17 | ソニー株式会社 | ロボット装置及びその制御方法 |
JP5750657B2 (ja) * | 2011-03-30 | 2015-07-22 | 株式会社国際電気通信基礎技術研究所 | 強化学習装置、制御装置、および強化学習方法 |
-
2017
- 2017-05-25 JP JP2017103409A patent/JP6706223B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2018198031A (ja) | 2018-12-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6706223B2 (ja) | 移動体制御方法、移動体制御装置、及びプログラム | |
CN110036353B (zh) | 用于控制地面车辆横向运动的方法和系统 | |
Drews et al. | Aggressive deep driving: Combining convolutional neural networks and model predictive control | |
JP6668375B2 (ja) | 比例、積分及び微分(pid)コントローラを用いた自律走行車のステアリング制御方法及びシステム | |
CN108698595A (zh) | 用于控制车辆运动的方法和车辆的控制系统 | |
CN109318890A (zh) | 一种基于动态窗口及障碍物势能场的无人车动态避障方法 | |
KR101475826B1 (ko) | 백스테핑 기법을 이용한 선도 추종자 대형제어 장치, 방법 및 이동로봇 | |
JP6959056B2 (ja) | 移動ロボットの制御装置と制御方法 | |
US11597388B2 (en) | System and method for connected vehicle lane merge | |
Drews et al. | Aggressive deep driving: Model predictive control with a cnn cost model | |
US20200285202A1 (en) | Control device, unmanned system, control method, and program | |
EP3164786B1 (en) | Apparatus and method for determining an intended target | |
CN108391429A (zh) | 用于自主车辆速度跟随的方法和系统 | |
Dobrevski et al. | Adaptive dynamic window approach for local navigation | |
US11320269B2 (en) | Information processing apparatus, information processing method, and information processing program | |
KR102303126B1 (ko) | 사용자 선호에 따른 강화학습 기반 자율주행 최적화 방법 및 시스템 | |
US11358612B2 (en) | Method for controlling an automated or autonomous locomotive device, and evaluation unit | |
KR101605994B1 (ko) | 미지의 스키딩과 슬리핑을 갖는 이동 로봇을 위한 적응적 선도-추종 군집 제어 방법 및 그 장치 | |
CN111399534B (zh) | 多无人机对空中高速运动目标的围捕方法及系统 | |
Ferrari et al. | A potential field approach to finding minimum-exposure paths in wireless sensor networks | |
CN114667494A (zh) | 机器人控制模型学习方法、机器人控制模型学习装置、机器人控制模型学习程序、机器人控制方法、机器人控制装置、机器人控制程序以及机器人 | |
van Breugel et al. | Active anemosensing hypothesis: how flying insects could estimate ambient wind direction through sensory integration and active movement | |
CN112711255A (zh) | 移动机器人避障方法、控制设备及存储介质 | |
Clark et al. | Proportional navigation based guidance laws for UAV obstacle avoidance in complex urban environments | |
JP2007178049A (ja) | 飛翔体誘導装置と目標会合時間予測方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190628 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200415 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200512 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200515 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6706223 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |