JP2019159413A - 制御装置、移動体、自律分散制御プログラム - Google Patents

制御装置、移動体、自律分散制御プログラム Download PDF

Info

Publication number
JP2019159413A
JP2019159413A JP2018041148A JP2018041148A JP2019159413A JP 2019159413 A JP2019159413 A JP 2019159413A JP 2018041148 A JP2018041148 A JP 2018041148A JP 2018041148 A JP2018041148 A JP 2018041148A JP 2019159413 A JP2019159413 A JP 2019159413A
Authority
JP
Japan
Prior art keywords
action
state
monitoring
mobile
moving
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018041148A
Other languages
English (en)
Other versions
JP7091723B2 (ja
Inventor
神保 智彦
Tomohiko Jinbo
智彦 神保
竜也 宮野
Tatsuya Miyano
竜也 宮野
一騎 柴田
Kazuki Shibata
一騎 柴田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Central R&D Labs Inc
Original Assignee
Toyota Central R&D Labs Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Central R&D Labs Inc filed Critical Toyota Central R&D Labs Inc
Priority to JP2018041148A priority Critical patent/JP7091723B2/ja
Publication of JP2019159413A publication Critical patent/JP2019159413A/ja
Application granted granted Critical
Publication of JP7091723B2 publication Critical patent/JP7091723B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)
  • Traffic Control Systems (AREA)

Abstract

【課題】特に、未知のリスクポテンシャルが点在する環境下での監視対象の追従及び探索において、追従精度向上と探索精度向上を両立させる。【解決手段】各状態行動価値関数Ψ1〜Ψ5の内、分散を最小化する行動を選択するのが最適な探索行動の選択となる。また、各状態行動価値関数Ψ1〜Ψ5の内、平均値が最大となる行動を選択するのが最適な追従行動の選択となる。行動を1つに絞るために、確定関数φを用いる。φ(s、a)は、状態行動価値関数Ψの平均値+β×状態行動価値関数Ψの分散の標準偏差で表すことができる。各行動(a1〜a5)における確定関数φ(1〜5)で得た数値の合計を分母とした、それぞれの確定関数φの演算結果を求め、行動を決定する確率として利用する。【選択図】図5

Description

本発明は、指定された監視対象が監視範囲となるように移動させる制御装置、移動体、自律分散制御プログラムに関する。
特許文献1には、監視対象に対して対処を行うのに適した位置まで飛行装置を移動制御する監視システムが記載されている。
より詳しくは、監視システムは、上空から地上を監視する飛行装置と、センタ装置を少なくとも備える。センタ装置は、制御種別ごとに監視対象に対する俯仰角を記憶する記憶部と、制御種別を含む制御信号の入力があると、記憶部を参照して制御種別に対応する俯仰角に相当する目標位置を算出する目標算出部と、目標位置に飛行装置を移動させる飛行装置制御部と、を備えている。
しかし、この特許文献1では、複数の移動体を想定したロジックになっていない。また、移動体に対してきめ細かい軌道計画を施さなければならない。
さらに、特許文献1では、センタ装置による集中処理となっているため計算負荷が高く、規模が大きくなると現実的時間内に解を求めることができない。
ここで、複数の移動体の集中管理せずに制御する技術として、ボロノイ領域を定義する分散管理技術がある。
例えば、カメラを備えた複数の移動体を、予め定めた領域内に設定されたリスクポテンシャル(監視対象領域)に移動させ、当該リスクポテンシャルを監視する場合、予め定めた領域をボロノイ領域に分割し、分割した各領域をそれぞれの移動体の担当領域として設定することで、移動体同士の衝突回避が可能となる。
ボロノイ領域を定義した技術は、複数の移動体を想定した最適なロジックを提供することができる。また、各移動体に対してきめ細かい軌道計画を施す必要がなく、各移動体が近傍とコミュニケーションをとりながら、自律分散的に意思決定することができる。
さらに、集中処理ではなく、分散処理であるため、計算負荷が小さく、規模の大きさに依存せず、現実的時間内で解を求めることができる。
なお、移動体は、移動体間の垂直二等分線で囲まれたボロノイ領域内において、リスクポテンシャルの重心位置に移動することを繰り返し行うことになる。また、ボロノイ領域の定義は、時々刻々と変化し得るものである。
さらに、本明細書において、リスクポテンシャルに対して、移動体が監視し得る監視領域の比率を「被覆率」という。被覆率は、そのままの比率(「監視領域の面積/リスクポテンシャルの面積」)でもよいし、百分率で表現してもよい(「監視領域の面積/リスクポテンシャルの面積」×100%)。ここで、センサの捕捉領域を監視領域とする。
また、参考として、非特許文献1には、移動センサ(移動体)が近傍の移動センサとの垂直二等分線で定義されるボロノイ図による領域分割を行い、自身の領域の重心へ自律分散的に移動することを繰り返す、基本的な動作が開示されている。
特開2016−118996号公報
J.Cortes,S.Martinez,T.Karatas,and F.Bullo, Coverage Control for Mobile Sensing Networks,IEEE Transactions on Robotics and Automation,20(2),pp.242-255,(2004)
しかしながら、従来のボロノイ領域を含め、特定の環境下での自律分散制御では、特にリスクポテンシャルが未知の場合、それぞれの移動体の移動動作を、探索と追従の何れを重要とするかにより、自律分散制御によるリスクポテンシャルの被覆率に多大な影響を及ぼすことなる。
すなわち、探索と追従とは二律背反の関係にある。探索を重視すれば、未知のリスクポテンシャルの領域が減少するが、既知のリスクポテンシャルに対する追従性が悪い。一方、追従を重視すれば、既知のリスクポテンシャルに対する追従性が良いが、未知のリスクポテンシャルの領域が増加する。
本発明は上記事実を考慮し、特に、未知のリスクポテンシャルが点在する環境下での監視対象の追従及び探索において、追従精度向上と探索精度向上を両立させることができる制御装置、移動体、自律分散制御プログラムを得ることが目的である。
本発明に係る制御装置は、監視機能を備えた複数の移動体で監視対象を監視する場合に、前記複数の移動体の監視情報によって学習されていく状態行動価値関数に基づいて、自律分散的に探索しかつ追従するように、前記移動体の移動を制御する制御装置であって、前記複数の移動体における状態及び行動の候補により決まる前記状態行動価値関数の値の分散を最小化するように前記複数の移動体毎に探索行動を選択する第1選択手段と、前記複数の移動体における状態及び行動の候補により決まる前記状態行動価値関数の値の平均値が最大となるように前記複数の移動体毎に追従行動を選択する第2選択手段と、前記複数の移動体毎に、前記移動体における状態及び行動の候補により決まる状態行動価値関数の平均値と分散とを用いた確定関数に基づいて、前記第1選択手段で選択した探索行動、及び前記第2選択手段で選択した追従行動を含む複数の行動の候補の何れかに確定する確定手段と、
を有している。
本発明によれば、第1選択手段が複数の移動体における状態及び行動の候補により決まる状態行動価値関数の値の分散を最小化するように複数の移動体毎に探索行動を選択する。第2選択手段が複数の移動体における状態及び行動の候補により決まる状態行動価値関数の値の平均値が最大となるように複数の移動体毎に追従行動を選択する。
確定手段では、複数の移動体毎に、移動体における状態及び行動の候補により決まる状態行動価値関数の平均値と分散とを用いた確定関数に基づいて、第1選択手段で選択した探索行動、及び第2選択手段で選択した追従行動を含む複数の行動の候補の何れかに確定する。
これにより、特に、未知のリスクポテンシャルが点在する環境下での監視対象の追従及び探索において、追従精度向上と探索精度向上を両立させることができる。
本発明の制御装置において、前記確定関数が、前記移動体が特定の状態の下で選択し得る複数の行動の候補毎に、前記複数の移動体における状態及び行動の候補により決まる前記状態行動価値関数の値の平均値と分散の線形和で決まる評価点を演算し、前記評価点の合計点を分母とする、前記移動体が特定の状態の下での行動の候補の前記状態行動価値関数の値の割合に応じた確率を、前記複数の行動の候補の何れかに確定するときの確率とすることを特徴としている。
探索及び追従の双方を考慮して、行動を確定するときの確率を決めることができる。
本発明の制御装置において、前記第1選択手段、前記第2選択手段、及び前記確定手段の一部又は全部の制御が、前記複数の移動体を総合的に管理するサーバーで実行されることを特徴としている。
複数の移動体をサーバーで総合的に管理することができる。
本発明の制御装置において、前記第1選択手段、前記第2選択手段、及び前記確定手段の制御が、前記複数の移動体の各々で実行され、当該複数の移動体が、相互に自機の移動体及び他機の移動体となり、前記自機の移動体と前記他機の移動体との間で情報交換することで自律分散的に移動することを特徴としている。
移動体間で相互に情報交換することで、自律分散的に移動させることができる。
本発明の制御装置において、前記移動体が特定の状態となったときの移動軌跡とは異なる移動軌跡によって当該特定の状態となったときの監視情報を、逆仮想行動の監視情報として、探索行動又は前記追従行動を選択するための監視情報に追加することを特徴としている。
経験の内移動軌跡であっても、逆仮想行動として監視情報を得て、次の行動を確定するための情報を増幅することができる。
本発明の制御装置において、前記移動体が特定の状態の下で選択し得る複数の行動の候補の結果、移動する次の状態候補の中で、自機及び他機を問わず、周辺で監視済の監視情報が存在する状態に対して、前記監視済の監視情報を、探索行動又は前記追従行動を選択するための監視情報に追加することを特徴としている。
既に、訪問済みの監視対象の監視情報を用いることで、次の行動を確定するための情報を増幅することができる。
本発明に係る移動体は、監視機能を備え、移動しながら監視対象を監視する移動体であって、前記監視機能による監視情報、及び他機の移動体の監視機能による監視情報によって学習されていく状態行動価値関数に基づいて、自律分散的に探索しかつ追従するように移動を制御する制御手段を有し、前記制御手段が、自機の移動体及び他機の移動体における状態及び行動の候補により決まる前記状態行動価値関数の値の分散を最小化するように前記自機の移動体及び他機の移動体の各々の探索行動を選択する第1選択手段と、自機の移動体及び他機の移動体における状態及び行動の候補により決まる前記状態行動価値関数の値の平均値が最大となるように前記自機の移動体及び他機の移動体の各々の追従行動を選択する第2選択手段と、自機の移動体における状態及び行動の候補により決まる状態行動価値関数の平均値と分散とを用いた確定関数に基づいて、前記第1選択手段で選択した探索行動、及び前記第2選択手段で選択した追従行動を含む複数の行動の候補の何れかに確定する確定手段と、備えている。
移動体が搭載する制御手段は、監視機能を備え、移動しながら監視対象を監視する移動体であって、監視機能による監視情報、及び他機の移動体の監視機能による監視情報によって学習されていく状態行動価値関数に基づいて、自律分散的に探索しかつ追従するように移動を制御する。
さらに、制御手段は、自機の移動体及び他機の移動体における状態及び行動の候補により決まる状態行動価値関数の値の分散を最小化するように自機の移動体及び他機の移動体の各々の探索行動を選択し(第1選択手段)、自機の移動体及び他機の移動体における状態及び行動の候補により決まる状態行動価値関数の値の平均値が最大となるように自機の移動体及び他機の移動体の各々の追従行動を選択し(第2選択手段)、自機の移動体における状態及び行動の候補により決まる状態行動価値関数の平均値と分散とを用いた確定関数に基づいて、第1選択手段で選択した探索行動、及び第2選択手段で選択した追従行動を含む複数の行動の候補の何れかに確定する(確定手段)。
これにより、特に、未知のリスクポテンシャルが点在する環境下での監視対象の追従及び探索において、追従精度向上と探索精度向上を両立させることができる。
本発明の移動体において、複数の移動体が、相互に自機の移動体及び他機の移動体となり、前記自機の移動体と前記他機の移動体との間で、自律分散的に情報交換することを特徴としている。
移動体間で相互に情報交換することで、自律分散的に移動させることができる。
本発明の移動体において、前記移動体が特定の状態となったときの移動軌跡とは異なる移動軌跡によって当該特定の状態となったときの監視情報を、逆仮想行動の監視情報として、探索行動又は前記追従行動を選択するための監視情報に追加することを特徴としている。
経験の内移動軌跡であっても、逆仮想行動として監視情報を得て、次の行動を確定するための情報を増幅することができる。
本発明の移動体において、前記移動体が特定の状態の下で選択し得る複数の行動の候補の結果、移動する次の状態候補の中で、自機及び他機を問わず、周辺で監視済の監視情報が存在する状態に対して、前記監視済の監視情報を、探索行動又は前記追従行動を選択するための監視情報に追加することを特徴としている。
既に、訪問済みの監視対象の監視情報を用いることで、次の行動を確定するための情報を増幅することができる。
本発明の制御装置は、コンピュータによって自律分散制御プログラムが実行される。
特に、未知のリスクポテンシャルが点在する環境下での監視対象の追従及び探索において、追従精度向上と探索精度向上を両立させることができる。
以上説明した如く本発明では、特に、未知のリスクポテンシャルが点在する環境下での監視対象の追従及び探索において、追従精度向上と探索精度向上を両立させることができるという効果を奏する。
第1の実施の形態に係る移動体の自律分散制御システムの概略図である。 第1の実施の形態に係る移動体の自律分散制御システムにおいて、移動体を動作させるための制御ブロック図である。 第1の実施の形態に係る移動体のCPUで実行される自律分散制御プログラムの実行を機能別に分類したブロック図である。 第1の実施の形態の自律分散制御に用いるマルコフ決定過程の概念図である。 第1の実施の形態に係る移動体の行動パターンを示すグリッドワールドの展開図である。 (A)及び(B)は、図5のグリッドワールドを用いたサンプリング増幅の概念を示す概略図である。 第1の実施の形態に係る自律分散制御の流れを示すフローチャートである。 第2の実施の形態に係る移動体のCPUで実行される自律分散制御プログラムの実行を機能別に分類したブロック図である。 第2の実施の形態に係る自律分散制御の流れを示すフローチャートである。 第1の実施の形態及び第2の実施の形態で適用したグリッドワールドの変形例を示す展開図である。
(第1の実施の形態)
図1は、第1の実施の形態に係る移動体分散制御システム50の概略図である。
第1の実施の形態の移動体分散制御システム50は、複数の移動体10、及び移動体10が監視するために移動する複数の領域12が示されている。
図1では、複数の移動体10が3つの群52に分類され、それぞれの群52が3ヶ所の領域12を担当して監視する構成としている。
なお、移動体10の群構成、監視領域数等は、図1の「3」に限定されるものではなく、単一の群52で単一の領域12を監視する構成であってもよいし、2及び4以上の群52及び領域12であってもよい。
図2は、第1の実施の形態に適用される移動体10(図1参照)を動作させるための制御系のブロック図である。
図2に示される如く、移動体10は、領域12の範囲内を無人で移動可能であり、当該移動を含む制御を実行するマイクロコンピュータを備えた制御装置14が搭載されている。
制御装置14のマイクロコンピュータは、CPU16A、RAM16B、ROM16C、入出力ポート(I/O)16D及びこれらを接続するデータバスやコントロールバス等のバス16Eを有している。I/O16Dには、監視モジュール18、移動モジュール20、位置認識モジュール22及び通信モジュール24が接続されている。
制御装置14は、例えば、ROM16Cに予め記憶された移動体の分散制御プログラムをCPU16Aで起動させ、監視モジュール18、移動モジュール20、位置認識モジュール22及び通信モジュール24の動作を制御する。
(監視モジュール18)
監視モジュール18に適用されるデバイスは、例えば、カメラが代表的であり、移動体10の位置から特定の監視範囲(視野)を撮像する。
なお、監視モジュール18は、カメラによる撮像に限定されず、電波(レーダー、レーザー、超音波等)照射等による地理上の特徴物(ランドマーク)の検出等であってもよい。
(移動モジュール20)
第1の実施の形態に係る移動体10は、飛行体(一例として、ドローン)であり、移動モジュール20に適用されるデバイスとして、独立した駆動源(モータ)で駆動する複数のプロペラを備えており、モータの駆動を制御することで、目的の方向に向けて飛行可能、かつ目的の位置空間で停止(ホバリング)可能である。
なお、移動体10は、飛行体に限定されず、地上や水上を移動する移動モジュール20であってもよく、複数のデバイスを併用してもよい。さらに、広い概念では、固定配置された監視カメラを、自律分散ネットワークに組み込むことで、移動モジュール20と定義してもよい。
なお、監視カメラは、撮影範囲が固定であってもよいし、首振り動作機構を備え監視モジュール18の監視範囲が変更可能であってもよい。
(位置認識モジュール22)
位置認識モジュール22は、自機の移動体10の位置を認識する機能であり、位置情報を得るために、デバイスとして、GPS、レーザー、レーダー、超音波、モーションキャプチャー、カメラ、無線通信、無線強度(距離情報)の少なくとも1つのセンサを備えている。
位置認識モジュール22は、センサで検出した結果(検出信号)に基づき、自機の移動体10の位置を三次元空間上の座標等によって認識する。
なお、位置認識モジュール22は、自機の移動体10の位置の認識以外に、後述する通信モジュール24を介して他機の移動体10の位置情報を取得し、相互の距離を演算して複数の移動体10の相対位置関係を認識する。
(通信モジュール24)
通信モジュール24は、デバイスとして、無線通信装置を備える。無線通信は、監視を統括的に管理する基地局(サーバ)54(図1参照)及び/又は移動体10間で通信する機能として、位置情報を送受信する位置情報送受信部と、指定された監視対象(「リスクポテンシャル」、「対象」という場合がある)の監視度合い(「被覆率」という。)に関する情報(被覆率情報)を送受信する被覆率送受信部と、リスクポテンシャルの分担に関する調停情報を送受信する調停情報送受信部と、を備える。なお、通信は、移動体10間のみとし、基地局(サーバ)54は無くてもよい。
なお、移動体10が相互に情報を交換し合う機能によって移動体分散制御システム50が成立するのであれば、基地局54は必須ではない。過去の情報(ビッグデータ)を管理する情報量によって、設置又は非設置を決めればよい。
調停情報とは、移動体10がリスクポテンシャルへ移動するか否かの判定を行う情報であり、リスクポテンシャルの符号(正又は負)によって使い分ける。例えば、「正」と定義されたリスクポテンシャルは監視を必要とし、「負」と定義されたリスクポテンシャルは監視を不要とすることを示す。リスクポテンシャルは、第1の実施の形態で実行される予測制御により特定される探索領域及び追従領域となり得る領域である。
また、通信モジュール24の無線通信は、監視モジュール18で監視した結果(例えば、カメラであれば撮像情報)を、基地局54へ送信する監視情報送信部を備える。
図1に示される如く、移動体10が監視する領域12は、例えば、車両56が存在する路面(駐車場等)であり、移動体10は車両56が通行する路面を監視することで、死角の無い空間データを車両56(運転者)に提供するようになっている。
図1に示す領域12において、リスクポテンシャル28として、既知のリスクポテンシャル28と未知のリスクポテンシャル28とが存在している。
既知のリスクポテンシャル28(図1では、矩形実線枠「網状」で示している。)は、移動体10を向かわせて、リスクポテンシャルを追従する必要がある領域(追従領域)である。
未知のリスクポテンシャル28(図1では、矩形点線枠「?マーク」で示している。)は、移動体10を向かわせる必要がある領域(探索領域)である。
なお、未知のリスクポテンシャル28は、既知のリスクポテンシャル28の経時によって履歴が消去され、未知のリスクポテンシャル28となる領域を含む。
(分散制御プログラムによる情報処理制御)
図3は、移動体10のCPU16A(図2参照)で実行される自律分散制御プログラムを機能別にブロック化した図(以下、自律分散制御部58という)。なお、図3の自律分散制御部58は、自律分散制御のためのハードウェア構成を限定するものではないが、マイクロコンピュータに代えて、ASIC(Application Specific Integrated Circuit)等の専用デバイスやプログラマブルロジックデバイス等のハードウェア構成で実現してもよいし、複数種類のハードウェア構成の組み合わせで実現してもよい。
図3に示される如く、自律分散制御部58は、サンプリング部60及び情報収集部62を備える。サンプリング部60は、監視モジュール18によって監視した情報に基づいて、マルコフ決定過程(Markov decision process「MDP」)における要素(状態s、行動aでの報酬r)をサンプリングする。以下、サンプリングした要素をサンプリング情報という。
図4は、第1の実施の形態においてMDPを適用した場合の概念図である。
図4に示される如く、移動体は、状態sを環境64(図1の領域12に相当)から観測し、観測した状態sから行動aに決定(選択)し、移動体10は行動後の環境64からの観測量に応じて報酬rを得る。また、移動体の行動に応じて、環境64から観測される状態sが遷移する。
マルコフ決定過程の特徴は、次の状態s’への遷移が、そのときの状態sと行動aのみに依存し、それ以前の状態や行動に関係ないことが挙げられる。
図3に示される如く、サンプリング部60は、保存部66に接続されている。
保存部66は、移動体10がサンプリングしたサンプリング情報(状態s、行動aでの報酬r)を保存する。
また、情報収集部62は、自機の移動体10に対して、所定の条件で関連する他機の移動体10がサンプリングした他機の移動体10のサンプリング情報を収集する。所定の条件とは、例えば、距離であり、予め定められた半径の範囲内に存在する他機の移動体10からサンプリング情報を収集する。
情報収集部62で収集したサンプリング情報は、サンプリング増幅部68に接続されている。サンプリング増幅部68は、例えば、自機の移動体10のサンプリング情報(保存部66に保存されたサンプリング情報)を主体として、情報収取部62で収集した他機の移動体10のサンプリング情報に基づいて、自機の移動体10でサンプリングしたサンプリング情報として利用する。すなわち、自機の移動体10でサンプリングしたサンプリング情報が増幅されることになる。
サンプリング増幅部68は、サンプリング抽出部70に接続され、増幅されたサンプリング情報の中から、状態行動価値関数Ψを学習するために必要なサンプリング情報を抽出し、抽出したサンプリング情報をフィッティング部72へ送出する。
フィッティング部72では、サンプリング情報に基づいて、状態行動価値関数Ψを学習する。
この学習の際、他機の移動体10からのサンプリング情報を取り入れることで、全体的に状態行動価値関数Ψの最適化を図ることができる(詳細後述、図6参照)。
行動確定部74は、状態行動価値関数Ψを用いて、自機の移動体10において、次に取り得る全ての行動a(状態sは固定)における状態行動価値関数Ψ(a、s)の値を演算する。
フィッティング部72は行動確定部74に接続され、フィッティング部72から、行動aに関与する状態行動価値関数Ψを取得し、自機の移動体10の次の行動aを選択する。
ここで、自機の移動体10の次の行動aは、探索行動を重視した選択と、追従行動を重視した選択とによって、選択する行動aが異なる場合がある。
そこで、第1の実施の形態では、探索行動を重視した選択と、追従行動を重視した選択とを、互いの重要度合いに応じて調整(演算式の係数調整)した上で、総合的に自機の移動体10の行動aを確定するようにした。行動確定部74の詳細については、後述する(図5及び図6参照)。
行動確定部74において、自機の移動体10の行動aが決まると(所定の確率で、行動aが決定すると)、移動制御部76により、移動モジュール20を制御して、自機の移動体10を移動させるように指示する。この移動によって移動した状態sは監視モジュール18によって監視され、報酬rが決まり、この報酬rによって、前記状態行動価値関数Ψが学習される。この状態行動価値関数Ψの学習が繰り返されることで、二律背反の関係にあった探索と追従において、未知のリスクポテンシャルの探索精度を向上させ、かつ、既知のリスクポテンシャルへの追従精度も向上させることが可能となる。
(行動確定部74の詳細)
図5に基づき、行動確定部74の詳細を説明する。
図5は、図1の領域12をグリッドワールドとした概念図であり、領域12が格子状のマス12A(一部に符号を指標)に仕切られており、各マス12Aが移動体10の1単位の行動aに対応する。
図5では、領域12の中央のマス12Aに移動体10が状態sで存在しており、行動aとしては、右へ移動(行動a1)、上へ移動(行動a2)、左へ移動(行動a3)、下へ移動(行動a4)、及び移動しない(行動a5)を設定する。
各行動a(1〜5)毎に状態行動価値関数Ψ(s、a1)、状態行動価値関数Ψ(s、a2)、状態行動価値関数Ψ(s、a3)、状態行動価値関数Ψ(s、a4)、状態行動価値関数Ψ(s、a5)を演算する。
そして、複数の移動体10の行動の候補の組み合わせのうち、複数の移動体10における状態及び行動の候補により決まる状態行動価値関数Ψの分散(VarΨ(s、a))を最小化する行動の候補の組み合わせを選択するのが最適な探索行動の選択となる。
また、複数の移動体10の行動の候補の組み合わせのうち、複数の移動体10における状態及び行動の候補により決まる状態行動価値関数Ψの平均値が最大となる行動の候補の組み合わせを選択するのが最適な追従行動の選択となる。
第1の実施の形態では、移動体10毎に、行動を1つに絞るために、確定関数φを用いている。
φ(s、a)は、状態行動価値関数Ψの平均値+β×状態行動価値関数Ψの分散の標準偏差で表すことができる(φ(s、a)=平均値+β×(分散の標準偏差))。
ここで、βは探索行動に対する、追従行動の寄与度合いであり、この係数βによって、探索行動又は追従行動の重要度合いを決定することができる。
また、分散の標準偏差は、分散の平方根であり、平均値との次元数を揃え、確定関数φにおいて、探索行動と追従行動の線形的な加算演算を実現している。
各行動(a1〜a5)における確定関数φ(1〜5)の演算結果は、以下の通り、数値L1〜L5として表現される。
次に、各確定関数φで得た数値の合計を分母とした、それぞれの確定関数φの演算結果を求め、行動を決定する確率として利用する。
すなわち、a1〜a5のそれぞれの行動を選択する確率は、以下の通りとなる。
(a1の選択確率) L1/(L1+L2+L3+L4+L5)・・・(1)
(a2の選択確率) L2/(L1+L2+L3+L4+L5)・・・(2)
(a3の選択確率) L3/(L1+L2+L3+L4+L5)・・・(3)
(a4の選択確率) L4/(L1+L2+L3+L4+L5)・・・(4)
(a5の選択確率) L5/(L1+L2+L3+L4+L5)・・・(5)
なお、上記(1)式から(5)式を総称して、選択確率式という。
図6(A)及び(B)は、図3に示すサンプリング増幅部68における、自機の移動体10(図6(A)及び(B)の中央に位置する移動体10)に影響を及ぼすサンプリング情報(マルコフ決定過程の状態s、行動a、及び報酬r)に基づいて、自機の移動体10でサンプリングしたサンプリング情報を増幅させる場合の概念図である。
図6(A)に基づき、現在の移動体10が存在するマス12Aの周辺において、実際の移動軌跡とは異なる移動軌跡によって仮想的に移動した場合(逆仮想行動)における報酬について考える。
図6(A)に示される如く、自機の移動体10が、中央のマス12Aにいるとき、図6(A)の矢印Xの方向から到達したものとする(実際の移動軌跡)。すなわち、中央のマス12Aの上側のマス12Aが移動元であり、現在のマス12Aに移動したことになる。このとき、図6(A)に星印で示した、その他のマス(中央のマス12Aの下側、左側、右側のマス12A)に、移動体10が過去に移動していなくても、図6(A)の何れかの星(状態s’)から中央のマス12A(状態s)への行動によって得られる報酬は、移動体10が中央のマス12Aにいることで既知となる。
従って、移動体120が、図6(A)の星印のマス12Aに行ったことがなくても、当該星印のマス12Aから現在の位置(中央のマス12A)への行動の結果、得られる報酬は同じ値で、移動体10での観測情報となる(報酬の増幅)。
図6(B)に基づき、現像の移動体10が次の行動を選択する場合の仮想行動について考える。
図6(B)に示される如く、自機の移動体10が状態sのとき、行動a1〜a5(ここでは、説明上、行動a5は除外する。)は、理論的には条件が同一であるが、領域12おいて、チェックマーク12Bが付与されたマス12Aは、自機の移動体10若しくは他機の移動体10が訪問済のマス12Aであることを示している。なお、ここでは、自機の移動体10が自身で訪問したマス12Aの履歴を含んでいる。
行動a1〜a4から行動を確定させた後、残りで訪問済みへの行動があれば仮想行動とする
図6(B)の場合、行動a2(上向き)及び行動a3(左向き)は、訪問済であり、選択された仮想行動となり、行動a1(右向き)が選択されなかった行動となる。
以下に、第1の実施の形態の作用を、図7のフローチャートに従い説明する。
ステップ100では、移動体10の監視モジュール18の各センサにより監視対象を観測する。すなわち、各センサで検出した情報に基づき、サンプリング情報(状態s、行動a、報酬r)をサンプリングする。
ステップ104では、自機の移動体10でサンプリングしたサンプリング情報を保存し、次いで、ステップ106へ移行して他機の移動体10からサンプリング情報を収集する。
サンプリング情報を収集する他機の移動体10は、所定の条件で関連する他機の移動体10に特定してもよい。所定の条件とは、例えば、距離であり、自機の移動体10を中心として、予め定められた半径の範囲内に存在する他機の移動体10からサンプリング情報を収集する。
また、所定条件としては、監視する領域12に、ボロノイ領域を設定して監視している場合は、自機の移動体10が監視ボロノイ領域に対して、周囲で隣接するボロノイ領域の他の移動体10として、当該隣接する他の移動体10から情報を収集するようにしてもよい。
次のステップ108では、サンプリング情報を増幅する。すなわち、他機の移動体10から収集したサンプリング情報に基づいて、実際には未知である、自機の移動体10の周辺のサンプリング情報を推定する(図6参照)。なお、サンプリング情報の増幅は、他機の移動体10からの情報に限らず、自機の移動体10が過去に観測した情報(過去に訪問した場所)に基づき、サンプリング情報を推定するようにしてもよい。
次のステップ110では、自機の移動体10が、例えば、図5の中央のマス12Aにいるときの次の行動(行動a1〜行動a5の何れか)を確定するために必要なサンプリング情報を抽出し、ステップ111へ移行する。
次のステップ111では、抽出したサンプリング情報、主として報酬rに基づき、状態行動価値関数Ψを学習し、ステップ112へ移行する。
ステップ112では、学習した状態行動価値関数Ψに基づいて、それぞれの行動a1〜行動a5における状態行動価値関数Ψ(a、s1)〜状態行動価値関数Ψ(a、s5)を演算する。なお、この場合、Ψ(a、s)の内、状態sは定数となり、行動a1〜a5が変数となる。
次のステップ114では、ステップ112において演算した状態行動価値関数Ψ1〜Ψ5の平均値及び分散をそれぞれ求め、この平均値及び分散に基づき、行動(行動a1〜行動a5の何れか)を確定する。
具体的に、状態行動価値関数Ψ1〜Ψ5の平均値及び分散を用いた行動の確定は、以下の通りである。
探索行動としては、状態行動価値関数Ψ1〜Ψ5の内、分散(VarΨ(s、a))を最小化すればよい。
一方、追従行動としては、状態行動価値関数Ψ1〜Ψ5の内、平均値(Ψ”(s、a))が最大となる行動を選択すればよい。
行動を1つに絞るためには、両者は二律背反の関係であるため、新たに確定関数φを用る。
φ(s、a)は、状態行動価値関数Ψの平均値+β×状態行動価値関数Ψの分散の標準偏差(φ(s、a)=平均値+β×(分散の標準偏差))で表現する。βを調整することで、探索行動又は追従行動の重要度合いを決定する(分散の標準偏差は、分散の平方根)。
各行動(a1〜a5)における確定関数φ(1〜5)の演算結果は、以下の通り、数値L1〜L5となり、確定関数φで得た数値の合計を分母とした、それぞれの確定関数φの演算結果を求め、行動を決定する確率として利用する。
言い換えれば、各行動a1〜行動a5は、前述した選択確率式に示される如く、相対的に選択し易さ(し難さ)がそれぞれ異なり、現時点で、探索又は追従に有利な行動に確定する。この確定による良否は、繰り返し実行される処理において、ステップ102によって状態行動価値関数が、逐次学習されることで、精度が上がる。
次のステップ114では、移動体10の移動モジュール20を制御して、ステップ116で確定した行動(行動a1〜行動a5)に基づき移動させる。
次のステップ118では、領域12におけるリスクポテンシャルの観測が完了したか否かを判断し、否定判定された場合は、ステップ100へ戻り、上記工程を繰り返す。
また、ステップ118で肯定判定された場合は、このルーチンは終了する。
(第2の実施の形態)
以下、図8に従い、第2の実施の形態について説明する。第2の実施の形態において、第1の実施の形態と同一構成については、同一の符号を付して、その構成の説明を省略する。
第2の実施の形態の特徴は、前述した第1の実施の形態が、自律分散制御部58としての制御をそれぞれの移動体10が独自に実行する構成としたのに対し、一部の制御を基地局54(図1参照)で行うようにしたことにある。言い換えれば、第1の実施の形態において、基地局54は、移動体10が自律分散的に移動して監視する制御に関しては不要であり、主として監視情報を収集となる。
図8に示される如く、自律分散制御部58Aは、サンプリング部60を備える。サンプリング部60は、監視モジュール18によって監視した情報に基づいて、マルコフ決定過程(Markov decision process「MDP」)における要素(状態s、行動aでの報酬r)をサンプリングする。以下、サンプリングした要素をサンプリング情報という。
サンプリング部60は、情報送信部80に接続されている。
情報送信部80では、サンプリングしたサンプリング情報(状態s、行動aでの報酬r)を基地局54の集約部82へ送信する。
また、集約部82は、他機の移動体10がサンプリングしたサンプリング情報を収集する。
集約部82で収集したサンプリング情報は、サンプリング増幅部68に接続されている。サンプリング増幅部68は、各移動体10のサンプリング情報に基づいて、特定の移動体10でサンプリングしたサンプリング情報から行動を確定する場合に、特定以外の移動体10のサンプリング情報を利用する。すなわち、特定の移動体10でサンプリングしたサンプリング情報が増幅されることになる。
サンプリング増幅部68は、サンプリング抽出部70に接続され、増幅されたサンプリング情報の中から、自機の移動体10の次の行動aを得るために必要なサンプリング情報を抽出し、抽出したサンプリング情報をフィッティング部72へ送出する。
フィッティング部72では、状態行動価値関数Ψを用いて、自機の移動体10において、次に取り得る全ての行動a(状態sは固定)における状態行動価値関数Ψ(a、s)を演算する。
この演算の際、他機の移動体10からのサンプリング情報を取り入れることで、最終的に確定する行動aの最適化を図ることができる(詳細後述、図6参照)。
フィッティング部72は、通信を介して移動体10の行動確定部74へ情報を送信する。行動確定部74では、フィッティング部72から、行動aに関与する状態行動価値関数Ψの演算結果を取得し、自機の移動体10の次の行動aを選択する。
ここで、自機の移動体10の次の行動aは、探索行動を重視した選択と、追従行動を重視した選択とによって、選択する行動aが異なる場合がある。
そこで、第2の実施の形態では、探索行動を重視した選択と、追従行動を重視した選択とを、互いの重要度合いに応じて調整(演算式の係数調整)した上で、総合的に自機の移動体10の行動aを確定するようにした(第1の実施の形態で説明した図5及び図6参照)。
行動確定部74において、自機の移動体10の行動aが決まると(所定の確率で、行動aが決定すると)、移動制御部76により、移動モジュール20を制御して、自機の移動体10を移動させるように指示する。この移動によって移動した状態sは監視モジュール18によって監視され、報酬rが決まり、この報酬rによって、前記状態行動価値関数Ψが学習される。この状態行動価値関数Ψの学習が繰り返されることで、二律背反の関係にあった探索と追従において、未知のリスクポテンシャルの探索精度を向上させ、かつ、既知のリスクポテンシャルへの追従精度も向上させることが可能となる。
以下に、第2の実施の形態の作用を、図9(A)及び(B)のフローチャートに従い説明する。第2の実施の形態では、移動体10と基地局54とで、自律分散制御の機能を分担しており、図9(A)は、移動体10側で実行される制御であり、図9(B)は、基地局54側で実行される制御である。
まず、図9(A)のフローチャートに従い、移動体10側で実行される制御を説明する。
ステップ200では、移動体10の監視モジュール18の各センサにより監視対象を観測する。すなわち、各センサで検出した情報に基づき、サンプリング情報(状態s、行動a、報酬r)をサンプリングする。
次のステップ202では、サンプリング情報、基地局54へ送信する(後述する、図9(B)のステップ250に対応)。
次のステップ204では、自機及び周辺の状態行動価値関数Ψの演算結果を要求し(図9(B)のステップ262に対応)、ステップ206へ移行する。
ステップ206では、ステップ204での要求によって受信した状態行動価値関数Ψ1〜Ψ5の平均値及び分散をそれぞれ求め、この平均値及び分散に基づき、行動(行動a1〜行動a5の何れか)を確定する。
次のステップ208では、移動体10の移動モジュール20を制御して、ステップ206で確定した行動(行動a1〜行動a5)に基づき移動させる。
次のステップ210では、領域12におけるリスクポテンシャルの観測が完了したか否かを判断し、否定判定された場合は、ステップ200へ戻り、上記工程を繰り返す。
また、ステップ210で肯定判定された場合は、このルーチンは終了する。
次に、図9(B)のフローチャートに従い、基地局54で実行される制御を説明する。
ステップ250では、移動体10から送信されるサンプリング情報を取得する(図9(A)のステップ202に対応)。
次のステップ254では、各移動体10でサンプリングしたサンプリング情報を集約し、次いで、ステップ256へ移行して各移動体10からサンプリング情報を増幅する。すなわち、各移動体10から収集したサンプリング情報に基づいて、実際には未知である、特定の移動体10の周辺のサンプリング情報を推定する。なお、サンプリング情報の増幅は、特定の移動体10の周辺からの情報に限らず、特定の移動体10が過去に観測した情報(過去に訪問した場所)に基づき、サンプリング情報を推定するようにしてもよい。
次のステップ258では、特定の移動体10が、次の行動を確定するために必要なサンプリング情報を抽出し、ステップ259へ移行する。
ステップ259では、主として報酬rに基づき、状態行動価値関数Ψを学習し、ステップ260へ移行する。
ステップ260では、抽出したサンプリング情報を、状態行動価値関数Ψにフィッティングし、それぞれの行動(例えば、図6に示す行動a1〜行動a5)における演算結果Ψ1(a、s)〜Ψ5(a、s)を得る。なお、この場合、Ψ(a、s)の内、状態sは定数となり、行動a1〜a5が変数となる。
次のステップ262では、ステップ260のフィッティングにおいて演算した状態行動価値関数Ψ1〜Ψ5の演算結果を、要求を受けた移動体10へ送信する(図9(A)のステップ204に対応)。
次のステップ264では、領域12におけるリスクポテンシャルの観測が完了したか否かを判断し、否定判定された場合は、ステップ250へ戻り、上記工程を繰り返す。
また、ステップ264で肯定判定された場合は、このルーチンは終了する。
なお、第1の実施の形態及び第2の実施の形態では、図5に示される如く、状態sからの行動として、行動a1〜行動a5の5方向としたが、図10に示される如く、斜め方向の行動を加え、状態sからの行動として、行動a1〜行動a9としてもよい。
また、第1の実施の形態及び第2の実施の形態における領域12(外部環境領域、担当領域)は、陸海空を問わず設定可能である。
センシングを目的別で言えば、監視、調査、レスキュー、モニタリング、及び予報等が挙げられる。より具体的には、比較的狭い領域の場合、駐車場での車両や歩行者の監視、交差点での車両の往来のモニタリング、家屋等の不審者監視等がある。また、比較的広い領域の場合、発掘調査、災害現場での遭難者の捜索(レスキュー)、山林の状況管理、天候調査による予報等がある。
また、移動体10(アクチュエータ)として、空撮可能なドローンを挙げたが、例えば、車両、ボート等の他の移動体を自律分散制御するようにしてもよい。
10 移動体
12 領域
12A マス
12B チェックマーク
16A CPU(第1選択手段、第2選択手段、確定手段)
16B RAM
16C ROM
16D 入出力ポート(I/O)
16E バス
18 監視モジュール
20 移動モジュール
22 位置認識モジュール
24 通信モジュール
28 リスクポテンシャル
50 移動体分散制御システム
52 群
54 基地局(第1選択手段、第2選択手段、確定手段)
56 車両
58 自律分散制御部
60 サンプリング部
62 情報収集部
64 環境
66 保存部
68 サンプリング増幅部
70 サンプリング抽出部
72 フィッティング部
74 行動確定部
76 移動制御部
(第2の実施の形態)
80 情報送信部
82 集約部

Claims (11)

  1. 監視機能を備えた複数の移動体で監視対象を監視する場合に、前記複数の移動体の監視情報によって学習されていく状態行動価値関数に基づいて、自律分散的に探索しかつ追従するように、前記移動体の移動を制御する制御装置であって、
    前記複数の移動体における状態及び行動の候補により決まる前記状態行動価値関数の値の分散を最小化するように前記複数の移動体毎に探索行動を選択する第1選択手段と、
    前記複数の移動体における状態及び行動の候補により決まる前記状態行動価値関数の値の平均値が最大となるように前記複数の移動体毎に追従行動を選択する第2選択手段と、
    前記複数の移動体毎に、前記移動体における状態及び行動の候補により決まる状態行動価値関数の平均値と分散とを用いた確定関数に基づいて、前記第1選択手段で選択した探索行動、及び前記第2選択手段で選択した追従行動を含む複数の行動の候補の何れかに確定する確定手段と、
    を有する制御装置。
  2. 前記確定関数が、
    前記移動体が特定の状態の下で選択し得る複数の行動の候補毎に、前記複数の移動体における状態及び行動の候補により決まる前記状態行動価値関数の値の平均値と分散の線形和で決まる評価点を演算し、
    前記評価点の合計点を分母とする、前記移動体が特定の状態の下での行動の候補の前記状態行動価値関数の値の割合に応じた確率を、前記複数の行動の候補の何れかに確定するときの確率とする、請求項1記載の制御装置。
  3. 前記第1選択手段、前記第2選択手段、及び前記確定手段の一部又は全部の制御が、前記複数の移動体を総合的に管理するサーバーで実行される、請求項1又は請求項2記載の制御装置。
  4. 前記第1選択手段、前記第2選択手段、及び前記確定手段の制御が、前記複数の移動体の各々で実行され、当該複数の移動体が、相互に自機の移動体及び他機の移動体となり、前記自機の移動体と前記他機の移動体との間で情報交換することで自律分散的に移動する、請求項1又は請求項2記載の制御装置。
  5. 前記移動体が特定の状態となったときの移動軌跡とは異なる移動軌跡によって当該特定の状態となったときの監視情報を、逆仮想行動の監視情報として、探索行動又は前記追従行動を選択するための監視情報に追加する、請求項1〜請求項4の何れか1項記載の制御装置。
  6. 前記移動体が特定の状態の下で選択し得る複数の行動の候補の結果、移動する次の状態候補の中で、自機及び他機を問わず、周辺で監視済の監視情報が存在する状態に対して、
    前記監視済の監視情報を仮想行動の監視情報として、探索行動又は前記追従行動を選択するための監視情報に追加する、請求項1〜請求項5の何れか1項記載の制御装置。
  7. 監視機能を備え、移動しながら監視対象を監視する移動体であって、
    前記監視機能による監視情報、及び他機の移動体の監視機能による監視情報によって学習されていく状態行動価値関数に基づいて、自律分散的に探索しかつ追従するように移動を制御する制御手段を有し、
    前記制御手段が、
    自機の移動体及び他機の移動体における状態及び行動の候補により決まる前記状態行動価値関数の値の分散を最小化するように前記自機の移動体及び他機の移動体の各々の探索行動を選択する第1選択手段と、
    自機の移動体及び他機の移動体における状態及び行動の候補により決まる前記状態行動価値関数の値の平均値が最大となるように前記自機の移動体及び他機の移動体の各々の追従行動を選択する第2選択手段と、
    自機の移動体における状態及び行動の候補により決まる状態行動価値関数の平均値と分散とを用いた確定関数に基づいて、前記第1選択手段で選択した探索行動、及び前記第2選択手段で選択した追従行動を含む複数の行動の候補の何れかに確定する確定手段と、備えた移動体。
  8. 複数の移動体が、相互に自機の移動体及び他機の移動体となり、前記自機の移動体と前記他機の移動体との間で、自律分散的に情報交換する、請求項7記載の移動体。
  9. 前記移動体が特定の状態となったときの移動軌跡とは異なる移動軌跡によって当該特定の状態となったときの監視情報を、逆仮想行動の監視情報として、探索行動又は前記追従行動を選択するための監視情報に追加する、請求項7又は請求項8記載の移動体。
  10. 前記移動体が特定の状態の下で選択し得る複数の行動の候補の結果、移動する次の状態候補の中で、自機及び他機を問わず、周辺で監視済の監視情報が存在する状態に対して、
    前記監視済の監視情報を、探索行動又は前記追従行動を選択するための監視情報に追加する、請求項7〜請求項9の何れか1項記載の移動体。
  11. コンピュータを、
    請求項1〜請求項6の制御装置として動作させる、自律分散制御プログラム。
JP2018041148A 2018-03-07 2018-03-07 制御装置、移動体、自律分散制御プログラム Active JP7091723B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018041148A JP7091723B2 (ja) 2018-03-07 2018-03-07 制御装置、移動体、自律分散制御プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018041148A JP7091723B2 (ja) 2018-03-07 2018-03-07 制御装置、移動体、自律分散制御プログラム

Publications (2)

Publication Number Publication Date
JP2019159413A true JP2019159413A (ja) 2019-09-19
JP7091723B2 JP7091723B2 (ja) 2022-06-28

Family

ID=67993434

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018041148A Active JP7091723B2 (ja) 2018-03-07 2018-03-07 制御装置、移動体、自律分散制御プログラム

Country Status (1)

Country Link
JP (1) JP7091723B2 (ja)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0981205A (ja) * 1995-09-11 1997-03-28 Fujitsu Ltd 学習システム
JP2004328484A (ja) * 2003-04-25 2004-11-18 Hitachi Ltd 監視システム及び監視端末
US20060015215A1 (en) * 2004-07-15 2006-01-19 Howard Michael D System and method for automated search by distributed elements
JP2006293483A (ja) * 2005-04-06 2006-10-26 Japan Aerospace Exploration Agency ロバスト最適化問題を解く問題処理方法およびその装置
JP2006344075A (ja) * 2005-06-09 2006-12-21 Sony Corp ネットワーク・システム、移動体装置及びその制御方法、並びにコンピュータ・プログラム
WO2017221859A1 (ja) * 2016-06-21 2017-12-28 日本電気株式会社 移動体、移動体制御システム、移動体制御方法、インターフェース装置、およびプログラムが記録された記録媒体
WO2018105599A1 (ja) * 2016-12-07 2018-06-14 日本電気株式会社 制御装置、制御方法およびプログラム記録媒体

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0981205A (ja) * 1995-09-11 1997-03-28 Fujitsu Ltd 学習システム
JP2004328484A (ja) * 2003-04-25 2004-11-18 Hitachi Ltd 監視システム及び監視端末
US20060015215A1 (en) * 2004-07-15 2006-01-19 Howard Michael D System and method for automated search by distributed elements
JP2006293483A (ja) * 2005-04-06 2006-10-26 Japan Aerospace Exploration Agency ロバスト最適化問題を解く問題処理方法およびその装置
JP2006344075A (ja) * 2005-06-09 2006-12-21 Sony Corp ネットワーク・システム、移動体装置及びその制御方法、並びにコンピュータ・プログラム
WO2017221859A1 (ja) * 2016-06-21 2017-12-28 日本電気株式会社 移動体、移動体制御システム、移動体制御方法、インターフェース装置、およびプログラムが記録された記録媒体
WO2018105599A1 (ja) * 2016-12-07 2018-06-14 日本電気株式会社 制御装置、制御方法およびプログラム記録媒体

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
LUCIANO C.A. PIMENTA, MAC SCHWANGER, QUENTIN LINDSEY, VIJAY KUMAR, DANIELA RUS, RENATO C. MESQUITA,: "Simultaneous Coverage and Tracking (SCAT) of Moving Targets with Robot Networks", WAFR2008, JPN6021044036, 7 December 2008 (2008-12-07), ISSN: 0004634569 *
宮野竜也、柴田一騎、神保智彦: "複数UAVによる駐車場監視制御", 計測と制御, vol. 第58巻第8号, JPN6021044035, August 2019 (2019-08-01), JP, pages 629 - 632, ISSN: 0004634570 *
飯野穣、畑中健志、藤田政之: "センサネットワークと制御理論", 計測と制御, vol. 第47巻第8号, JPN6021044033, August 2008 (2008-08-01), JP, pages 1 - 8, ISSN: 0004634571 *

Also Published As

Publication number Publication date
JP7091723B2 (ja) 2022-06-28

Similar Documents

Publication Publication Date Title
US10717435B2 (en) Adjustable object avoidance proximity threshold based on classification of detected objects
EP3735624B1 (en) Adjustable object avoidance proximity threshold
US11794731B2 (en) Waypoint prediction for vehicle motion planning
CN107943016A (zh) 用于自主车辆的群体驾驶风格学习框架
WO2019147235A1 (en) Path planning for autonomous moving devices
EP3158485B1 (en) Cooperative safe landing area determination
CN109387857B (zh) 激光雷达系统中的跨网段检测方法和设备
US20230257003A1 (en) Method and system for graph neural network based pedestrian action prediction in autonomous driving systems
US20190033460A1 (en) Apparatus for increase field of view for lidar detector and illuminator
US11380103B2 (en) Coverage device, moving body, control device, and moving body distributed control program
GB2562049A (en) Improved pedestrian prediction by using enhanced map data in automated vehicles
Shit Precise localization for achieving next-generation autonomous navigation: State-of-the-art, taxonomy and future prospects
Cardarelli et al. Multisensor data fusion for obstacle detection in automated factory logistics
JP7069632B2 (ja) 制御装置、移動体、及び移動体の分散制御プログラム
JP2019020992A (ja) カバレッジ装置、制御装置、移動体の分散制御プログラム
EP4160269A1 (en) Systems and methods for onboard analysis of sensor data for sensor fusion
Alkhalaf A robust variance information fusion technique for real-time autonomous navigation systems
JP7091723B2 (ja) 制御装置、移動体、自律分散制御プログラム
JP7069896B2 (ja) 制御装置、移動体、自律分散制御プログラム
JP2019016307A (ja) 予測制御装置、予測制御プログラム、カバレッジ装置、移動体、分散制御装置、移動体の分散制御プログラム
Melnychenko et al. A Self-Organized Automated System to Control Unmanned Aerial Vehicles for Object Detection.
KR20180078153A (ko) 자율 무인 시스템을 위한 지능 에이전트 시스템
Anand et al. AI based obstacle Avoidance and Signal Management Autonomous Car with Less Collision
Danylova et al. AUTOMATED NAVIGATION FOR UNMANNED GROUND VEHICLES IN LOGISTICS.
Hoang et al. Multiple UAV Coordination based on the Internet of Things for Real-time Surface Inspection

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210128

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20211029

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211109

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211216

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220517

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220530

R150 Certificate of patent or registration of utility model

Ref document number: 7091723

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150