JP7070673B2 - 自律動作機の制御装置、自律動作機の制御方法、及び、自律動作機の制御プログラム - Google Patents

自律動作機の制御装置、自律動作機の制御方法、及び、自律動作機の制御プログラム Download PDF

Info

Publication number
JP7070673B2
JP7070673B2 JP2020517672A JP2020517672A JP7070673B2 JP 7070673 B2 JP7070673 B2 JP 7070673B2 JP 2020517672 A JP2020517672 A JP 2020517672A JP 2020517672 A JP2020517672 A JP 2020517672A JP 7070673 B2 JP7070673 B2 JP 7070673B2
Authority
JP
Japan
Prior art keywords
autonomous
value
unmanned aerial
information
machine
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020517672A
Other languages
English (en)
Other versions
JPWO2019215838A1 (ja
Inventor
雅嗣 小川
真澄 一圓
真史 江村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2019215838A1 publication Critical patent/JPWO2019215838A1/ja
Application granted granted Critical
Publication of JP7070673B2 publication Critical patent/JP7070673B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/10Simultaneous control of position or course in three dimensions
    • G05D1/101Simultaneous control of position or course in three dimensions specially adapted for aircraft
    • G05D1/104Simultaneous control of position or course in three dimensions specially adapted for aircraft involving a plurality of aircrafts, e.g. formation flying
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/0088Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots characterized by the autonomous decision making process, e.g. artificial intelligence, predefined behaviours
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/0055Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots with safety arrangements
    • G05D1/0061Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots with safety arrangements for transition from automatic pilot to manual pilot and vice versa
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/12Target-seeking control
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/0011Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots associated with a remote control arrangement
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/10Simultaneous control of position or course in three dimensions
    • G05D1/101Simultaneous control of position or course in three dimensions specially adapted for aircraft

Landscapes

  • Engineering & Computer Science (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Automation & Control Theory (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Remote Sensing (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Artificial Intelligence (AREA)
  • Medical Informatics (AREA)
  • Game Theory and Decision Science (AREA)
  • Evolutionary Computation (AREA)
  • Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)

Description

本願発明は、ある目的を達成するために、複数の自律動作機が協調動作するように制御する技術に関する。
近年、無人機をある目的のために使用する応用例が多く提案されている。例えば、自動的に部屋の掃除を行なう清掃ロボットや、飛行する無人機(ドローン)による空撮や宅配などである。また、原子力発電所などの危険な環境において活動するロボットなどもその一例である。
上述した応用例などでは、通常1体の無人機を使用しているが、複数の無人機を使用した応用例も提案されている。例えば、Eコマース用の工場において、荷物を運搬するロボットを複数使用することによって、顧客により発注された商品を迅速に収集する応用例や、探索対象を複数の無人機を使用して探索する応用例などが知られている。
特に探索対象を複数の無人機により探索するという応用例は、防衛関連技術として近年盛んに研究されている。このような応用例において用いられる無人機は、一般的に、UxV(Unmanned x Vehicle)と呼ばれている。例えば、無人飛行機は、UAV(Unmanned Air Vehicle)、無人船は、USV(Unmanned Surface Vehicle)、無人水中船は、UUV(Unmanned Undersea Vehicle)と呼ばれている。
上述した無人機には、大別して、操作者によって遠隔操作されるものと、搭載されたプログラムによって自律的に動作するものとの2種類がある。そして、これら無人機に関する技術の方向性は、可能な限りプログラムにより自律的に動作することに向かっている。なぜなら、人間が不在である環境において、人間に代わって様々な行動、労働等を肩代わりすることが可能な無人機あるいは無人機群が望まれているからである。近年、優れた人工知能を搭載することによって、無人機が自律的に賢く動作できるようになることに対する期待等から、人工知能の研究が盛んに行なわれていることからもわかるように、上述した無人機の自律制御に関する技術への期待が高まってきている。
このような技術に関連する技術として、特許文献1には、複数の自律移動ロボットのそれぞれがより効率的にタスクを実行することができるようにした移動制御方法が開示されている。この方法では、第1の自律移動ロボットが、第1の自律移動ロボットの現在位置がタスクを実行するのに適した位置である度合いを示す第1の確信度を算出する。この方法では、第1の自律移動ロボットが、第2の自律移動ロボットの現在位置がタスクを実行するのに適した位置である度合いを示す第2の確信度を第2の自律移動ロボットから受信する。この方法では、第1の自律移動ロボットが、第1の確信度と第2の確信度と第2の自律移動ロボットの現在位置とに基づいて、第1の自律移動ロボットの移動すべき移動ベクトルを算出する。そしてこの方法では、第1の自律移動ロボットが、その移動ベクトルに基づいて第1の自律移動ロボットの移動を制御する。
また、特許文献2には、複数の移動体全体の信頼度を高い状態で維持し続けることのできるようにした自律移動体システムが開示されている。このシステムは、自己位置をセンサにより計測し目的の場所に自律的に移動する移動体を複数台備える。このシステムは、センサ情報を取得し、取得したセンサ情報に基づき自己位置を推定し、自己位置の信頼度を算出し、自己が保持する保持情報を移動体間で送信する。このシステムは、信頼度と、自己位置と、移動体を識別する識別子とを紐付けて記録し、信頼度回復行動を起こさせる移動体を選択する。そしてこのシステムは、選択した移動体が、信頼度が高い位置に移動するように制御する。
また、特許文献3には、他の移動体と協調して動作する移動体が開示されている。この移動体は、自移動体を単体で動作させるための第1の制御情報を生成する。この移動体は、自移動体及び他の移動体の状態を取得する。この移動体は、取得した状態に基づいて、自移動体を他の移動体と協調して動作させるための第2の制御情報を生成する。そしてこの移動体は、第1の制御情報と第2の制御情報とに基づいて第3の制御情報を生成し、その第3の制御情報に従って、自移動体の動作を制御する。
また、特許文献4には、安全性を低下させることなく、コストをかけずに、警報時間の短縮効果が得られる走行制御を支援する方法が開示されている。この方法では、踏切に接近した列車における車上装置は、自列車の位置及び速度情報を、所定の間隔で踏切制御装置に送信する。踏切制御装置は、車上装置から受信する列車の位置及び速度に基づいて、踏切到達予測時間及びブレーキパターン到達予測時間を算出する。踏切制御装置は、予め記憶している設計警報時間と、算出される踏切到達予測時間とを比較するとともに、予め記憶している踏切遮断完了時間と、算出される踏切遮断完了時間を比較し、その結果が所定の条件を満たす場合には警報を開始するように制御する。踏切制御装置は、警報開始後に列車を加速させる走行制御パターンを算出し、車上装置に送信する。そして、車上装置は、算出される走行制御パターンを乗務員に提示し、乗務員による走行制御を支援する。
特開2017-059217号公報 特開2017-188066号公報 国際公開第2017/221859号 特許第5559671号公報
自律的に動作する無人機(自律動作機)が賢く動作するとは、無人機が、状況によって、自律的に動作を変えることを意味する。一般的に、無人機は、ある目的を達成するために、複数の動作(ミッション)を実行し、状況によって動作を変える必要がある。例えば、防衛用の無人機は、最初に危険物を探索し、危険物を発見した場合はその危険物を追跡し(危険物が動く場合)、場合によっては最終的に危険物を捕獲する。このように無人機は、状況によって動作(上述した例では、探索、追跡、捕獲)を変える必要がある。現在の多くのシステムでは、操作者がそれらの動作を遠隔操作により切り替えていることが多いが、将来的には、無人機が自律的に判断して、自動で動作を切り替えることが望まれている。
このような動作の切り替えに関して、単体の無人機が、状態遷移図をもとに、例えば「探索→追跡→捕獲」というように、動作を切り替えることは、それほど困難ではない。しかしながら、協調(連携)して動作する複数の無人機(無人機群)の場合、各無人機は、自機の動作の切り替えが、無人機群全体としての視点から、目的を達成することに関して整合がとれている(即ち全体最適である)ことを求められるので、その動作の切り替えの判断は非常に困難である。
例えば、ある無人機が危険物の近くにいるので、その無人機が危険物に対する追跡を行なうというような単純な判断では不十分である。その理由は、自機より危険物に近い別の無人機が存在する場合、その別の無人機が追跡を行なった方が効率的であるからである。さらに、無人機群のうちの複数の無人機が追跡を行なうような場合などでは、自機がどの動作を行なえばよいのかを、状態遷移図を用いた単純なIF-THENルール等により判断したのでは、最適であるとは言えない。このため、無人機群として目的を達成するために、個々の無人機が最適に(効率的に)動作を切り替えることは困難である。上述した特許文献1乃至4が示す技術は、この問題を解決するのに十分であるとは言えない。本願発明の主たる目的は、この課題を解決する自律動作機の制御装置等を提供することである。
本願発明の一態様に係る自律動作機の制御装置は、協調して動作する第一及び第二の自律動作機が、目的を達成するために、実行可能な複数の動作のうちの少なくともいずれかを随時選択して実行する場合に、前記第一の自律動作機の動作状態を表す第一状態情報と、前記第二の自律動作機の動作状態を表す第二状態情報とを取得する取得手段と、前記第一状態情報と前記第二状態情報とに基づいて、前記第一の自律動作機が実行可能な前記複数の動作の個々に関して、前記目的の達成に向けて実行する価値の高さを表す価値情報を、価値算出基準を用いて生成する生成手段と、前記複数の動作の各々に関する前記価値情報に基づいて、前記複数の動作のうちの特定の動作を選択する選択手段と、前記特定の動作を実行するように、前記第一の自律動作機を制御する制御手段と、を備える。
上記目的を達成する他の見地において、本願発明の一態様に係る自律動作機の制御方法は、情報処理装置によって、協調して動作する第一及び第二の自律動作機が、目的を達成するために、実行可能な複数の動作のうちの少なくともいずれかを随時選択して実行する場合に、前記第一の自律動作機の動作状態を表す第一状態情報と、前記第二の自律動作機の動作状態を表す第二状態情報とを取得し、前記第一状態情報と前記第二状態情報とに基づいて、前記第一の自律動作機が実行可能な前記複数の動作の個々に関して、前記目的の達成に向けて実行する価値の高さを表す価値情報を、価値算出基準を用いて生成し、前記複数の動作の各々に関する前記価値情報に基づいて、前記複数の動作のうちの特定の動作を選択し、前記特定の動作を実行するように、前記第一の自律動作機を制御する。
また、上記目的を達成する更なる見地において、本願発明の一態様に係る自律動作機の制御プログラムは、協調して動作する第一及び第二の自律動作機が、目的を達成するために、実行可能な複数の動作のうちの少なくともいずれかを随時選択して実行する場合に、前記第一の自律動作機の動作状態を表す第一状態情報と、前記第二の自律動作機の動作状態を表す第二状態情報とを取得する取得処理と、前記第一状態情報と前記第二状態情報とに基づいて、前記第一の自律動作機が実行可能な前記複数の動作の個々に関して、前記目的の達成に向けて実行する価値の高さを表す価値情報を、価値算出基準を用いて生成する生成処理と、前記複数の動作の各々に関する前記価値情報に基づいて、前記複数の動作のうちの特定の動作を選択する選択処理と、前記特定の動作を実行するように、前記第一の自律動作機を制御する制御処理と、をコンピュータに実行させるためのプログラムである。
更に、本願発明は、係る自律動作機の制御プログラム(コンピュータプログラム)が格納された、コンピュータ読み取り可能な、不揮発性の記録媒体によっても実現可能である。
本願発明は、協調して動作する複数の自律動作機の個々が、目的を達成するために全体最適となるような動作を選択するように、自律動作機を制御することを可能とする。
本願発明の第1の実施形態に係る制御装置10の構成を示すブロック図である。 本願発明の第1の実施形態に係る複数の無人機20が協調して、目標物を、探索、追跡、捕獲するまでの無人機20の動きを例示する図である。 本願発明の第1の実施形態に係る制御装置10が、無人機20-0を自無人機21として制御する場合において、生成部12による価値情報122が示す値の算出例を示す図である。 本願発明の第1の実施形態に係る制御装置10が、無人機20-1を自無人機21として制御する場合において、生成部12による価値情報122が示す値の算出例を示す図である。 本願発明の第1の実施形態に係る制御装置10が、無人機20-2を自無人機21として制御する場合において、生成部12による価値情報122が示す値の算出例を示す図である。 本願発明の第1の実施形態に係る制御装置10が、無人機20-3を自無人機21として制御する場合において、生成部12による価値情報122が示す値の算出例を示す図である。 本願発明の第1の実施形態に係る操作端末装置30を用いて、自律制御方式から手動制御方式に切り替える無人機20を操作者が選択する際における、ユーザインタフェースの態様を例示する図である。 本願発明の第1の実施形態に係る無人機20が探索動作を行なう場合において、目標物の存在確率密度を表す関数gが示す値の分布を概念的に例示する図である。 本願発明の第1の実施形態に係る無人機20が追跡動作を行なう場合において、目標物の存在確率密度を表す関数gが示す値の分布を概念的に例示する図である。 本願発明の第1の実施形態に係る制御装置10の動作を示すフローチャートである。 本願発明の第2の実施形態に係る自律動作機の制御装置60の構成を示すブロック図である。 本願発明の各実施形態に係る制御装置あるいは自律動作機の制御装置を実行可能な情報処理装置900の構成を示すブロック図である。
以下、本願発明の実施の形態について図面を参照して詳細に説明する。
<第1の実施形態>
図1は、本願発明の第1の実施の形態に係る制御装置10の構成を概念的に示すブロック図である。制御装置10は、例えば、危険物等の目標物を、探索し、追跡し、捕獲するというような所定の目的を達成するために、協調(連携)して自律的に動作可能な複数の無人機20(自律動作機)を制御する情報処理装置である。無人機20は、当該目的を達成するために、例えば、探索、追跡、捕獲といった動作のいずれかを随時選択して実行する、例えばドローンのようなUAVである。
本実施形態に係る制御装置10は、複数の無人機20を並列に制御する。制御装置10は、後述するように、ある無人機20に対する制御を行う際に、当該無人機20とは異なる1以上の他の無人機20の状態をふまえた制御を行う。したがって、本実施形態の説明においては、図1に例示する通り、無人機20を、制御対象とする自無人機21(第一の自律動作機)と、自無人機21を制御する際にその状態を参照する、自無人機21とは異なる他無人機22(第二の自律動作機)とに区別することとする。
無人機20(自無人機21及び他無人機22)は、自機の状態を測定可能なセンサを備えている。自無人機21及び他無人機22は、例えばGNSS(Global Navigation Satellite System)センサ等を備えることによって、自機の状態の一つとして、自機の位置を、順に、状態情報210(第一状態情報)及び状態情報220(第二状態情報)として取得する。状態情報210及び状態情報220は、あるいは例えば、自機の移動速度を表す情報、自機の動作設定値を表す情報、自機に搭載されたバッテリの状態を表す情報、自機に関する障害の発生状況を表す情報などを含んでもよい。状態情報210及び状態情報220は、あるいは例えば、位置が確認できた目標物の位置を表す情報を含んでもよい。
自無人機21及び他無人機22は、無線通信装置40と通信可能であり、取得した状態情報210及び状態情報220を、適宜、無線通信装置40に送信する。無線通信装置40は、例えばインターネットなどの通信ネットワーク50に接続されている。通信ネットワーク50には、また、制御装置10及び操作端末装置30も接続されている。即ち、制御装置10及び操作端末装置30は、通信ネットワーク50を介して無線通信装置40と通信可能であるので、制御装置10及び操作端末装置30は、無線通信装置40を介して、無人機20と通信可能である。尚、操作端末装置30は、自無人機21の制御方式を、自律制御方式から手動制御方式に切り替えて、自無人機21に対する手動制御を操作者が行う際に使用する、例えばタブレット端末装置等の情報処理装置である。
図2は、本実施形態に係る複数の無人機20が、危険物等の目標物を、探索し、追跡し、捕獲することを目的とする動作を行なう場合において、制御装置10によって制御された無人機20が協調(連携)して、目標物を、探索し、追跡し、捕獲するまでの無人機20の動きを例示する図である。図2は、無人機20及び目標物の位置を、XY座標(二次元座標)により表している。
図2(a)は、無人機20が目標物を探索する探索状態を表している。図2(a)に例示する探索状態では、個々の無人機20は、均一に分散して、目標物を探索している。図2(b)は、無人機20によって目標物が発見されたのち、無人機20のうちの少なくとも一部(図2(b)において点線に囲まれた領域内に位置する無人機20)が目標物に対する追跡を開始した状態を表している。尚、図2(b)において点線に囲まれた領域の外に位置する無人機20は、例えば目標物が複数存在することを想定して、探索動作を継続する。
図2(c)は、目標物を追跡する無人機20のうち、操作者によって選択された特定の無人機20が、目標物を捕獲する(例えばネットをかける)準備を開始した状態を表している。そして図2(d)は、その特定の無人機20によって、目標物が捕獲された状態を表している。本実施形態に係る制御装置10は、後述する通り、無人機20の個々が、目的を達成するために全体最適となるように、図2に例示するような動作を実行するように制御する。
本実施形態に係る制御装置10は、例えばクラウドコンピューティングにおけるクラウド側に構築されたサーバ装置等の情報処理装置であり、上述した通信ネットワーク50及び無線通信装置40を介して無人機20と通信することによって、無人機20を制御する。制御装置10は、図1に例示する通り、取得部11、生成部12、選択部13、制御部14、及び、算出部15を備えている。
取得部11は、通信ネットワーク50及び無線通信装置40を介して、自無人機21及び他無人機22から、上述した状態情報210及び状態情報220を取得する。尚、複数の無人機20は、通常、互いに非同期に動作しているので、取得部11が状態情報210及び状態情報220を取得するタイミングも、通常、非同期となる。
生成部12は、取得部11によって取得された状態情報210と状態情報220とに基づいて、自無人機21が実行可能な複数の動作の個々に関して、目的の達成に向けて実行する価値の高さを表す価値情報122を、価値算出基準121を用いて生成する。但し、自無人機21が実行可能な複数の動作とは、例えば、危険物等の目標物に対する、探索、追跡、及び、捕獲等である。自無人機21が実行可能な複数の動作は、あるいは例えば、探索、追跡、及び、捕獲という動作の各々をさらに細かな粒度で分割した、4種類以上の動作であってもよい。尚、価値算出基準121は、制御装置10の管理者等によって事前に与えられており、制御装置10が備える、例えば電子メモリや磁気ディスク等の記憶デバイス(不図示)に格納されていることとする。
また、目的の達成に向けて実行する価値の高さとは、例えば、ある動作を実行することによって、その目的を達成できる確率の高さなどに基づく指標である。即ち、目的の達成に向けて実行する価値の高さは、例えば探索動作の場合、目標物を発見する確率の高さに基づく指標であり、例えば追跡動作の場合、発見した目標を見失わずに次第に目標に接近することができる確率の高さに基づく指標などである。
次に価値算出基準121について説明する。価値算出基準121は、例えば、自無人機21が実行可能な複数の動作の個々に関して、状態情報210に基づく評価関数A(N)(第一評価関数)と状態情報220に基づく評価関数B(N)(第二評価関数)とを含んでいる。ただしNは、複数の動作(例えば、探索、追跡、捕獲等)の個々を識別可能な識別子(動作番号)である。
より具体的には、評価関数A(N)は、例えば、状態情報210が示す状態にある自無人機21が動作Nを実行した場合における、目的の達成に向けて実行する価値の高さを表し、例えば、自無人機21が動作Nを実行するのに要する制御量(操作量)をパラメータ変数として含む。同様に評価関数B(N)は、例えば、状態情報220が示す状態にある他無人機22が動作Nを実行した場合における、目的の達成に向けて実行する価値の高さを表し、例えば、他無人機22が動作Nを実行するのに要する制御量(操作量)をパラメータ変数として含む。尚、評価関数A(N)及び評価関数B(N)の具体例(詳細)については後述する。
そして価値算出基準121は、評価関数A(N)と評価関数B(N)とに基づく、価値情報122が示す値を求める評価関数F(N)を含んでいる。評価関数F(N)は、例えば、評価関数A(N)と評価関数B(N)との差分を表す関数である。即ちこの場合、評価関数F(N)は、自無人機21が動作Nを実行する価値の高さと、他無人機22が動作Nを実行する価値の高さとの大小関係を表している。
評価関数F(N)は、あるいは、評価関数A(N)と評価関数B(N)とに含まれる、制御量を表すパラメータ変数によって、評価関数A(N)と評価関数B(N)とを微分した、評価関数A’(N)と評価関数B’(N)との差分を表す関数であってもよい。この場合、評価関数A’(N)及び評価関数B’(N)は、単位制御量当たりの、目的の達成に向けて実行する価値の高さの変化量(増分)を表している。評価関数F(N)は、評価関数A(N)と評価関数B(N)とを微分した評価関数を用いることによって、より正確に価値情報122が示す値を求めることができる。
本実施形態に係る生成部12が、上述した価値算出基準121によって示される、評価関数A’(N)、評価関数B’(N)、及び、評価関数F(N)を用いることによって、価値情報122を生成する具体例を、図3乃至図6を参照して説明する。
図3乃至図6に示す例では、図1に例示する制御装置10は、少なくとも4台の無人機20を制御することとし、それら4台の無人機を、無人機20-0乃至20-3と表すこととする。そして、図3乃至図6に示す例では、無人機20-0乃至20-3が、図2(a)に示す探索状態から図2(b)に示す目標物発見及び追跡開始状態に移行するのにあたり、制御装置10は、無人機20-0乃至20-3の個々が、探索動作の継続、あるいは、目標物に対する追跡動作の開始のいずれかを実行するように制御する。
図3は、制御装置10が、無人機20-0を図1に示す自無人機21として制御する(即ち無人機20-1乃至20-3は図1に示す他無人機22となる)場合において、生成部12による価値情報122が示す値の算出例を示す図である。この場合、無人機20-0に関する評価関数をA(N)とし、無人機20-1乃至20-3に関する評価関数を、順にB1(N)乃至B3(N)とする。
図3に示す例では、Nが「1」である動作(動作1)を探索とし、Nが「2」である動作(動作2)を追跡とする。無人機20-0乃至20-3が探索動作(動作1)を継続する場合、同じ動作を継続するので、A’(1)、B1’(1)乃至B3’(1)とも、その値は「1」という小さな値(目的の達成に向けて実行する価値の増分は小さい)となっている。一方、無人機20-0乃至20-3が目標物に対する追跡動作(動作2)を開始する場合、A’(2)、B1’(2)乃至B3’(2)の値は、順に、「10」、「3」、「5」「20」という、A’(1)、B1’(1)乃至B3’(1)と比較して大きな値となっている。これは、無人機20-1乃至20-3が行なう動作が、探索から追跡という新たな段階へ移行するのにあたり、探索動作を継続する場合と比較して、目的の達成に向けて実行する価値の増分は高いと見なされるからである。
また、図3に示す例において、A’(2)、B1’(2)乃至B3’(2)の値が互いに異なるのは、無人機20-0乃至20-3と目標物との位置関係が異なることなどによる。即ち、目標物から近い場所に位置する無人機20ほど、追跡動作を実行する価値の増分は高いと見なされるので、その評価関数(微分した関数)が示す値も大きくなる。例えば図3に示す例では、B1’(2)(その値は「3」)及びB2’(2)(その値は「5」)と比較して、A’(2)(その値は「10」)及びB3’(2)(その値は「20」)は、値が大きい。このことは、無人機20-0及び20-3は、無人機20-1及び20-2と比較して、目標物に近い場所に位置すること等を示している。
図3に示す例では、価値情報122が示す値を求める評価関数F(N)は、「A’(N)-B1’(N)+A’(N)-B2’(N)+A’(N)-B3’(N)」として定義される。即ち、評価関数F(N)は、図1に示す自無人機21に関する評価関数(微分した関数)が示す値と、1以上の他無人機22の個々に関する評価関数(微分した関数)が示す値との差分の総和を表している。したがって、評価関数F(N)は、自無人機21に関する評価関数(微分した関数)が示す値が、1以上の他無人機22の個々に関する評価関数(微分した関数)が示す値と比較して、相対的に大きければ大きいほど大きな値となる。以上のことから、評価関数F(N)は、1以上の他無人機22が動作Nを実行することと比較した、自無人機21が動作Nを実行することが有する、目的の達成に向けて実行する価値の高さの増分に関する相対的な高さを表している。
図3に示す例では、生成部12は、上述した評価関数F(N)の算出式に基づいて、F(0)を「0」、F(1)を「2」と算出する。
図4は、制御装置10が、無人機20-1を図1に示す自無人機21として制御する(即ち無人機20-0、20-2、及び、20-3は図1に示す他無人機22となる)場合において、生成部12による価値情報122が示す値の算出例を示す図である。この場合、無人機20-1に関する評価関数をA(N)とし、無人機20-0、20-2、及び、20-3に関する評価関数を、順にB0(N)、B2(N)、及び、B3(N)とする。
図4に示す例では、価値情報122が示す値を求める評価関数F(N)は、「A’(N)-B0’(N)+A’(N)-B2’(N)+A’(N)-B3’(N)」として定義されるので、生成部12は、この評価関数F(N)の算出式に基づいて、F(0)を「0」、F(1)を「-26」と算出する。
図5は、制御装置10が、無人機20-2を図1に示す自無人機21として制御する(即ち無人機20-0、20-1、及び、20-3は図1に示す他無人機22となる)場合において、生成部12による価値情報122が示す値の算出例を示す図である。この場合、無人機20-2に関する評価関数をA(N)とし、無人機20-0、20-1、及び、20-3に関する評価関数を、順にB0(N)、B1(N)、及び、B3(N)とする。
図5に示す例では、価値情報122が示す値を求める評価関数F(N)は、「A’(N)-B0’(N)+A’(N)-B1’(N)+A’(N)-B3’(N)」として定義されるので、生成部12は、この評価関数F(N)の算出式に基づいて、F(0)を「0」、F(1)を「-18」と算出する。
図6は、制御装置10が、無人機20-3を図1に示す自無人機21として制御する(即ち無人機20-0乃至20-2は図1に示す他無人機22となる)場合において、生成部12による価値情報122が示す値の算出例を示す図である。この場合、無人機20-3に関する評価関数をA(N)とし、無人機20-0乃至20-2に関する評価関数を、順にB0乃至B2(N)とする。
図6に示す例では、価値情報122が示す値を求める評価関数F(N)は、「A’(N)-B0’(N)+A’(N)-B1’(N)+A’(N)-B2’(N)」として定義されるので、生成部12は、この評価関数F(N)の算出式に基づいて、F(0)を「0」、F(1)を「42」と算出する。
生成部12は、また、各動作に関する評価関数A(N)及び評価関数B(N)が示す値に対して、所定の基準による重み付けをおこなってもよい。生成部12は、あるいはまた、ある動作の実行による価値の高さに関して、当該動作とは別の動作との間に相関関係等が存在する場合、その相関関係等が存在する別の動作に関する評価関数を参照することにより、上述した処理を行うようにしてもよい。
図1に示す選択部13は、生成部12によって上述した通り生成された、自無人機21が実行可能な複数の動作の各々に関する価値情報122に基づいて、それら複数の動作のうちの特定の動作131を選択する。選択部13は、例えば、価値情報122が示す値が所定の条件を満たす動作を、特定の動作131として選択する。当該所定の条件としては、例えば、価値情報122が示す値が閾値よりも高いことでもよいし、あるいは、価値情報122が示す値が最も高いことなどでもよい。
例えば、図3に示す例では、F(1)(その値は「2」)は、「0」(本実施形態では「0」を閾値とする)よりも高く、F(0)(その値は「0」)よりも高いので、選択部13は、無人機20-0に関して、「追跡」を特定の動作131として選択する。例えば、図4に示す例では、F(1)(その値は「-26」)は、「0」よりも低く、F(0)(その値は「0」)よりも低いので、選択部13は、無人機20-1に関して、「探索」を特定の動作131として選択する。例えば、図5に示す例では、F(1)(その値は「-18」)は、「0」よりも低く、F(0)(その値は「0」)よりも低いので、選択部13は、無人機20-2に関して、「探索」を特定の動作131として選択する。例えば、図6に示す例では、F(1)(その値は「42」)は、「0」よりも高く、F(0)(その値は「0」)よりも高いので、選択部13は、無人機20-3に関して、「追跡」を特定の動作131として選択する。
図1に示す制御部14は、選択部13によって選択された特定の動作131を実行するように、自無人機21を制御する。制御部14は、この際、自無人機21に関する状態情報210(第一状態情報)と、他無人機22に関する状態情報220(第二状態情報)とに基づいて、特定の動作131に関する制御量141を算出し、特定の動作131を、算出した制御量141が示す値分実行するように、自無人機21を制御する。制御部14は、特定の動作131に関する制御量141の算出において、例えば、上述した評価関数A(N)や、評価関数B(N)を参照してもよい。制御部14は、算出した特定の動作131に関する制御量141に基づいて、自無人機21を動作させるアクチュエータ(可動部)等の動作設定値を設定する。
(制御装置10が、自律制御方式と手動制御方式とを切り替えることにより、無人機20を制御する場合における制御装置10の動作)
本実施形態に係る制御装置10は、操作者からの要求に応じて、自無人機21に対する制御方式を、自律制御方式から操作者による手動制御方式に切り替えることが可能である。次に、制御装置10が、自律制御方式と手動制御方式とを切り替えながら、自無人機21を制御する場合における、制御装置10の動作について説明する。
制御装置10は、図1に示す通り、操作端末装置30から、通信ネットワーク50を介して手動制御指示情報301を受信する。手動制御指示情報301は、操作者が操作端末装置30に操作入力することによって、操作端末装置30によって生成された情報である。手動制御指示情報301は、制御方式を自律制御方式から手動制御方式に切り替えたい(即ち、操作者による手動制御を行いたい)無人機20(自無人機21)を識別可能な情報と、手動制御方式に切り替える自無人機21に対する動作指示を表す情報とを含んでいる。そして、手動制御方式に切り替える自無人機21に対する動作指示を表す情報は、例えば、その自無人機21がある動作を自律的に実行することを抑制することを指示する情報を含んでいる。
制御装置10が手動制御指示情報301を受信した場合、選択部13は、価値情報122と手動制御指示情報301とに基づいて、特定の動作131を選択する。生成部12及び選択部13の少なくともいずれかは、手動制御指示情報301が、ある動作Nを自律的に実行することを抑制することを指示する情報を含んでいる場合、その動作Nに関する価値情報122が示す値を低い値に設定する。
具体的には、生成部12及び選択部13の少なくともいずれかは、例えば、動作Nに関する評価関数A(N)あるいは評価関数F(N)に対して所定の演算(例えば「0」あるいは負の実数を乗算する等)を行なうことによって、動作Nに関する自律制御を抑制することが可能である。この場合、動作Nに関する自律制御を抑制された自無人機21は、動作Nに関して、複数の無人機20により構成された無人機群から外れたことになるので、自無人機21に対する制御方式が自律制御方式から手動制御方式に切り替わることが、無人機群全体に対して問題となるような影響を及ぼさないことになる。
自無人機21に対する制御方式を自律制御方式から手動制御方式に切り替える場合、生成部12は、自無人機21について、他無人機22と協調して実行する動作Nに関する評価関数A(N)を無効化(評価関数A(N)に対して上述した所定の演算を行なう)してもよい。これにより、手動制御方式に切り替えられた自無人機21は、複数の無人機20により構成された無人機群から切り離される。
尚、自無人機21が実行可能な動作には、例えば衝突回避動作など、緊急対策的な動作も含まれる。生成部12は、自無人機21に対する制御方式が手動制御方式に切り替わった後も、自無人機21がこのような緊急対策的な動作を自律的に行なうことができるように、緊急対策的な動作Nに関する評価関数A(N)を無効化せずに、例えば、有効であることを表す所定の実数(例えば「1」)を、その評価関数A(N)に設定してもよい。
また、生成部12及び選択部13の少なくともいずれかは、上述した通り、ある動作Nに関する価値情報122が示す値に対して、動作Nを抑制するような演算を行なう(例えば「0」あるいは負の実数を乗算する等)こととは逆に、動作Nを推奨するような演算を行なう(例えば「1」より大きな実数を乗算する等)ようにしてもよい。即ち、生成部12及び選択部13の少なくともいずれかは、動作Nの実行を抑制する、あるいは推奨することを指示する情報を含む手動制御指示情報301に基づいて、動作Nに関する評価関数A(N)あるいは評価関数F(N)が示す値に対して演算を行なうことによって、自無人機21が実行する動作に優先度を加えることが可能となる。
制御部14は、制御装置10が手動制御指示情報301を受信した場合、手動制御指示情報301もふまえて、特定の動作131に関する制御量141を算出し、特定の動作131を、算出した制御量141が示す値分実行するように、自無人機21を制御する。
図1に示す算出部15は、自無人機21を制御する方式を自律制御方式から手動制御方式に切り替えることが目的の達成に与える影響の大きさに基づく、手動制御への切り替えの適切度151を、生成部12により生成された価値情報122(評価関数F(N)が示す値)に基づいて算出する。算出部15は、この際、価値情報122が示す値が小さいほど値が大きくなるように、手動制御への切り替えの適切度151を算出する。算出部15は、例えば、評価関数F(N)が示す値の逆数を、手動制御への切り替えの適切度151として算出してもよい。
算出部15は、算出した手動制御への切り替えの適切度151を、自無人機21を識別可能な識別情報と関連付けて、通信ネットワーク50を介して操作端末装置30へ送信する。これにより、算出部15は、手動制御への切り替えの適切度151を、自無人機21と関連付けて、操作端末装置30が備える表示画面に表示する。
図7は、本実施形態に係る操作端末装置30を用いて、自律制御方式から手動制御方式に切り替える無人機20を操作者が選択する際における、ユーザインタフェースの態様を例示する図である。図7に例示する通り、操作端末装置30は、無人機状況表示部31と、適切度表示部32と、手動操作部33と、を備えている。
無人機状況表示部31は、各無人機20から、あるいは、各無人機20に関する状態情報210及び状態情報220を取得した制御装置10から、通信ネットワーク50を介して取得した状態情報210及び状態情報220に基づいて、各無人機20と目標物との位置を表示する。尚、目標物の位置を示す情報は、各無人機20による目標物に対する探索結果として、状態情報210及び状態情報220の少なくともいずれかに含まれていることとする。
適切度表示部32は、算出部15から上述の通り送信された情報に基づいて、各無人機20に関する手動制御への切り替えの適切度151(手動制御適切度)を表示する。図7に示す例では、追跡動作を実行している無人機20のうち、No.2の無人機20の手動制御適切度が、「98」という最も高い値となっている。
本実施形態では、目標物の捕獲は、操作者によって手動制御された無人機20によって行われることとする。図7に示す例の場合、操作者は、手動制御適切度が最も高いNo.2の無人機20を、目標物を捕獲するために自律制御方式から手動制御方式に切り替える無人機として選択する。その選択動作は、操作者が手動制御部33を操作することによって行なわれる。そして、手動制御方式に切り替えられた無人機20は、手動操作部33を介した操作者による手動制御によって、目標物を捕獲する動作を行なう。
また、上述した本実施形態では、操作者よって自律制御方式から手動制御方式に切り替えられる無人機20を1台としているが、複数の無人機20が、自律制御方式から手動制御方式に切り替えられるようにしてもよい。また、複数の操作端末装置30が通信ネットワーク50に接続され、複数の無人機20が、複数の操作者によって手動制御されるようにしてもよい。
(価値算出基準121として用いる評価関数の具体例)
次に、無人機20が、目標物に対する探索及び追跡動作を行なう場合を例として、制御装置10が価値算出基準121として用いる、上述した評価関数の具体的な例について説明する。
目標物に対する探索及び追跡動作を行なう場合、探索理論によれば、場所に対する目標物の存在確率密度(場所を変数とした存在確率密度を表す関数)と、探索努力に対する目標物の発見確率(探索努力を変数とした発見確率を表す関数)とによって、価値算出基準121(評価関数)を表すことができると考えられる。尚、探索努力とは、探索あるいは追跡活動のために、利用(投入)可能な人、物、時間、費用などの資源の総称であり、例えば、上述した制御量(操作量)なども、探索努力の一つとして見なすことができる。
三次元空間における座標(x,y,z)における、目標物の存在確率密度を、式1の通り表すこととする。

g(x,y,z,x,y,z
・・・・・・(式1)

但し、式1において、(x,y,z)は、目標物が存在することが予測される座標を表す。
図8は、本実施形態に係る無人機20が探索動作を行なう場合において、目標物の存在確率密度を表す関数gが示す値の分布を概念的に例示するである。図8に例示する通り、関数gは、無人機20が探索動作を行なう領域(探索領域)が、無人機20の数により分割された部分領域ごとに、部分領域の中心において値が最大となり(即ち、目標物が部分領域の中心付近に存在する確率が高いことを想定)、部分領域の境界に近づく(即ち部分領域の中心から遠くなる)にしたがって値が低下する特性を有する、例えばガウシアン関数などである。即ち、探索領域における座標に対して関数gをグラフ化した場合、そのグラフは部分領域ごとの山として表される。尚、図8に例示するグラフでは、説明の便宜上、一部の部分領域における山を省略して記載している。
また、図8は、探索領域における二次元座標に対する関数gのグラフを表しているが、探索領域における三次元座標に対する関数gも同様に(即ち、三次元の部分領域の中心において値が最大となり部分領域の境界に近づくにしたがって値が低下する特性を有する)考えればよい。関数gが図8に例示するような特性を有することにより、複数の無人機20は分担して、探索領域全体を網羅的かつ効率的に探索することができる。
図9は、本実施形態に係る無人機20が追跡動作を行なう場合において、目標物の存在確率密度を表す関数gが示す値の分布を概念的に例示する図である。図9に例示する通り、関数gは、直近に確認された目標物の位置において値が最大となり、直近に確認された目標物の位置から遠くなるにしたがって値が低下する特性を有する、例えばガウシアン関数などである。即ち、追跡領域における座標に対して関数gをグラフ化した場合、そのグラフは直近に確認された目標物の位置を頂とする山として表される。
関数gが図9に例示するような特性を有することにより、無人機20は、目標物を効率的に追跡することができる。尚、目標物の位置を示す情報を入手できていない無人機20は、制御装置10から目標物の位置を示す情報を入手可能である。目標物の位置を示す情報を入手できていない無人機20は、あるいは、目標物の位置を示す情報を入手している無人機20とアドホック通信を行うことによって、目標物の位置を示す情報を入手してもよい。また、関数gが示す存在確率密度の精度を向上させるために、関数gは、直近に確認された目標物の位置と目標物の動き(方向や速度等)とに基づいて予測された目標物の位置において値が最大となるような特性を有してもよい。
上述した探索努力に対する目標物の発見確率を、式2の通り表すこととする。

(ψ
・・・・・・(式2)

但し、式2において、ψは無人機20-i(iは任意の自然数)に与えられた探索努力を表す。但し、iは無人機20の個々に付与された識別子を表し、iという識別子が付与された無人機20を、無人機20-iと称することとする。
目標物の発見確率は、通常、無人機20が存在する環境に依存する。例えば、無人機20-iが、海中においてソナーを使用して目標物を探索する場合における発見確率p(ψ)は、式3の通りに表されることが知られている。

(ψ)=1-e-γiψi
・・・・・・(式3)

但し、式3において、eは、自然対数の底を表す。また、γは、電波の伝播に依存するパラメータであり、海域の特性によって異なる値である。
そして、無人機20-iによる探索あるいは追跡動作に関する評価関数fは、式4に示す通り、目標物の存在確率密度と目標物の発見確率との積により表すことができる。

=g(x,y,z,x,y,z)p(ψ
・・・・・・(式4)

但し、式4における(x,y,z)は、無人機20-iが位置する座標を表す。このように、本実施形態に係る価値算出基準121に含まれる、上述した評価関数A(N)及びB(N)の一例として、例えば式4に示す評価関数fを用いることができる。
次に図10のフローチャートを参照して、本実施形態に係る制御装置10の動作(処理)について詳細に説明する。
取得部11は、自無人機21に関する状態情報210と、他無人機22に関する状態情報220とを取得する(ステップS101)。生成部12は、状態情報210と状態情報220とに基づいて、自無人機21が実行可能な複数の動作の個々に関して、価値算出基準121を用いて価値情報122を生成する(ステップS102)。
算出部15は、価値情報122に基づいて、手動制御への切り替えの適切度151を算出し、算出した手動制御への切り替えの適切度151を、操作端末装置30に表示する(ステップS103)。制御装置10は、手動制御への切り替えの適切度151を確認した操作者によって、必要に応じて、手動制御指示情報301が入力される(ステップS104)。
選択部13は、価値情報122と手動制御指示情報301とに基づいて、複数の動作のうちの特定の動作131を選択する(ステップS105)。制御部14は、状態情報210と状態情報220と手動制御指示情報301とに基づいて、特定の動作131に関する制御量141を算出し、算出した制御量141の特定の動作131を実行するように、自無人機21を制御する(ステップS106)。
複数の無人機20が与えられた目的を達成していない場合(ステップS107でNo)、処理はステップS101へ戻る。複数の無人機20が与えられた目的を達成した場合(ステップS107でYes)、全体の処理は終了する。
本実施形態に係る制御装置10は、協調して動作する複数の自律動作機の個々が、目的を達成するために全体最適となるような動作を選択するように、自律動作機を制御することができる。その理由は、制御装置10は、自無人機21に関する状態情報210と、他無人機22に関する状態情報220とに基づいて、自無人機21が実行可能な複数の動作の個々に関して価値情報122を生成し、生成した価値情報122に基づいて複数の動作のうちの特定の動作131を決定し、その特定の動作131を実行するように自無人機21を制御するからである。
以下に、本実施形態に係る制御装置10によって実現される効果について、詳細に説明する。
無人機(自律動作機)を活用した様々な応用例が提案されている現代社会において、無人機が自律的に判断して、自動で動作(例えば、探索、追跡、捕獲等)を切り替えながら、目的を達成できるようにすることが望まれている。そして、複数の無人機が協調(連携)して動作することによって目的を達成する様々な応用例も提案されている。このような複数の無人機(無人機群)を使用する応用例では、各無人機による動作の切り替えに関して、無人機群全体としての視点から、目的を達成することに関して整合がとれている(即ち全体最適である)ことが求められる。即ち、無人機群として目的を達成するために、個々の無人機が最適に(効率的に)動作を切り替える必要があるが、その動作の切り替えの判断は非常に困難である。
このような課題に対して、本実施形態に係る制御装置10は、取得部11と、生成部12と、選択部13と、制御部14と、を備え、例えば、図1乃至図10を参照して上述した通り動作する。即ち、取得部11は、協調して動作する自無人機21(第一の自律動作機)及び他無人機22(第二の自律動作機)が、目的を達成するために、実行可能な複数の動作のうちの少なくともいずれかを随時選択して実行する場合に、自無人機21の動作状態を表す状態情報210と、他無人機22の動作状態を表す状態情報220とを取得する。生成部12は、状態情報210と状態情報220とに基づいて、自無人機21が実行可能な複数の動作の個々に関して、目的の達成に向けて実行する価値の高さを表す価値情報122を、価値算出基準121を用いて生成する。選択部13は、複数の動作の各々に関する価値情報122に基づいて、複数の動作のうちの特定の動作131を選択する。そして、制御部14は、特定の動作131を実行するように、自無人機21を制御する。
即ち、本実施形態に係る制御装置10は、自無人機21が次に行なう動作を複数の動作の中から決定する場合に、動作ごとに、自無人機21が実行する場合と他無人機22が実行する場合とについて、与えられた目的の達成に向けて実行する価値の高さを比較し、比較した結果が基準を満たす動作を、自無人機21が次に行なう動作として決定する。これにより、制御装置10は、協調して動作する複数の自律動作機の個々が、目的を達成するために全体最適となるような動作を選択するように、自律動作機を制御することができる。
また、本実施形態に係る価値算出基準121は、例えば探索理論等に基づいて、目標物の存在確率密度と目標物の発見確率等によって表される評価関数を含んでいる。例えば、複数の無人機20により構成された無人機群全体による、探索あるいは追跡動作に関する評価関数は、上述した式4を用いて、式5に示す通り表すことができる。

Σ
・・・・・・(式5)

複数の無人機20により構成された無人機群に与えることができる制御量(探索努力)は無尽蔵ではないので、制御量の最大値は、通常、所定の値である。即ち、制御装置10は、無人機群に与えることができる制御量が、式6に示す通り所定の値Ψであるという条件の下で、式5に示す評価関数が示す値が最大となるように、無人機20を制御することが求められる。

Ψ=Σψ
・・・・・・(式6)

本願発明者は、本実施形態について上述した通り、自無人機21が次に行なう動作を選択し、その制御量を算出する手法(アルゴリズム)を考案した。即ち、そのアルゴリズムでは、単位制御量(単位探索努力)あたりの、目的の達成に向けて実行する価値の増分が最も高くなるように、自無人機21及び他無人機22に関する評価関数が示す値に基づいて、自無人機21の動作及びその制御量を決定する。
当該アルゴリズムでは、例えば、ある動作に関する単位制御量を投入する場合に、他無人機22よりも自無人機21の方が価値の増分が大きい場合、当該動作に関する単位制御量を自無人機21に投入することを決定する。その逆に、自無人機21よりも他無人機22の方が価値の増分が大きい場合、当該動作に関する単位制御量を自無人機21ではなく他無人機22に投入することを決定する。
上述した単位制御量あたりの価値の増分(変化量)は、評価関数を制御量により微分することによって求められる。そして、単位制御量あたりの価値の増分が最も高くなるように当該動作の制御量を算出することを繰り返した場合、微分した評価関数が示す値が、全ての無人機20に関して等しくなることに帰着するので、例えば、微分した評価関数が示す値が等しくなるような制御量を算出するというような手法も有効である。
また、制御装置10は、当該アルゴリズムを用いて、自無人機21の動作及びその制御量を決定する場合、必ずしも、目的の達成に向けて動作する無人機群に含まれる全ての他無人機22に関する状態情報220を取得する必要はない。制御装置10は、無人機群に含まれる、自無人機21に対して影響を及ぼす度合いが大きい一部の他無人機22(例えば、自無人機21との距離が近い他無人機22等)に関する状態情報220に基づいて、自無人機21の動作及びその制御量を決定してもよい。
また、本実施形態に係る制御部14が算出する制御量141(操作量)は、スカラー量ではなく、三次元の方向を有するベクトル量である。制御部14は、例えば、以下の手順により、ベクトル量として表される制御量141を算出する。即ち、制御部14は、自無人機21の現在位置を始点とし、当該始点と目標物の位置(目標物が存在すると推測される位置)とを結ぶベクトルを生成する。制御部14は、そのベクトルを単位ベクトル化(長さが1であるベクトルに規格化)した動作ベクトルを生成する。そして制御部14は、長さが制御量141の大きさである動作ベクトルを、制御量141として算出する。
また、複数の無人機20に与えられた目的が、目標物を探索し、追加し、捕獲することとは異なる場合であっても、制御装置10は、上述した本実施形態が行なう通りに、無人機20を制御すればよい。例えば、複数の無人機20に与えられた目的が、無人機20同士の通信が途切れないように通信状況を改善することである場合、制御装置10は、価値算出基準121に含まれる評価関数として、例えば、自無人機21が通信可能な他無人機22の数を表す評価関数を用いることとし、当該評価関数は、自無人機21と通信可能な他無人機22の数が多ければ多いほど値が大きくなるような特性を有するようにすればよい。この場合、例えば、式7に示す評価関数hが考えられる。

=1-e-αimi
・・・・・・(式7)

但し、mは、無人機20-i(自無人機21)と通信可能な他無人機22の数を表す。αは、無人機20-iに関する所定の係数である。
また、本実施形態に係る制御装置10は、操作者からの要求に応じて、自無人機21に対する制御方式を、自律制御方式から操作者による手動制御方式に切り替えることが可能である。その場合、制御装置10は、操作端末装置30から入力された手動制御指示情報301もふまえて、特定の動作131を選択するとともに、その特定の動作131に関する制御量141を算出する。
近年、無人機をある目的のために使用する応用例において、無人機群が自律的に動作するだけではなく、一部の無人機について、必要に応じて自律制御方式から操作者による手動制御方式に切り替える(自律制御に手動制御を介入する)ような、マン・イン・ザ・ループ(人と無人機との協調)という概念も出てきている。本実施形態に係る制御装置10は、このような場合であっても、上述した構成を備えることによって、自律制御による無人機20と手動制御による無人機20とを含む無人機群における個々の無人機20が、目的を達成するために全体最適となるような動作を選択するように制御することができる。
また、本実施形態に係る制御装置10は、自無人機21を制御する方式を自律制御方式から手動制御方式に切り替えることが目的の達成に与える影響の大きさに基づく、手動制御への切り替えの適切度151を、価値情報122に基づいて算出する。そして、制御装置10は、算出した手動制御への切り替えの適切度151を、例えば、図7に例示する通り、操作端末装置30に表示する。これにより、本実施形態に係る制御装置10は、操作者が、いずれかの無人機20について、自律制御方式から手動制御方式に切り替える必要が生じた場合に、手動制御方式に切り替える無人機20を、適切かつ容易に選択することができるようにする。
また、上述した本実施形態では、制御装置10は、クラウドコンピューティングにおけるクラウド側(中央管理システム)に構築されることを想定しているが、制御装置10は、例えば、各無人機20に搭載されたエッジ側のシステムとして構築されてもよい。この場合、自無人機21は、他無人機22と直接通信可能な機能を備えることとする。このような各無人機20が制御装置10を搭載するシステムは、無人機20が動作する領域が、中央管理システムとの通信が困難である領域に存在する場合であっても構築することができる。このようなシステムは、また、中央管理システムが障害等によって機能を停止した場合にも、動作を継続することができる。
また、制御装置10を中央管理システムとして構築する場合、制御装置10は、例えば、無人機20が探索活動等を行なう海上の領域まで航行可能な母船の内部等に、専用システムとして構築されてもよい。
また、無人機20は、UAVであっても、USVであっても、UUVであってもよい。無人機20は、あるいは、自律動作が可能であって、自律動作の状態を監視する操作者が搭乗した有人機であってもよい。無人機20は、あるいは、協調して物を組み立てる(建設する)ような、地上に固定されたロボットなどでもよい。
また、無人機20に与えられた目的は、目標物を探索し、追跡し、捕獲することに限定されない。無人機20に与えられた目的は、例えば、無線機を搭載した無人機20が、最も広範囲に、所望の転送レートで情報を送受信可能なフォーメーションを組むことなどでもよい。即ち、本実施形態に係る制御装置10は、協調して動作する複数の無人機20が、ある目的を達成するために動作する様々な応用例に適用可能である。
<第2の実施形態>
図11は、本願発明の第2の実施形態に係る自律動作機の制御装置60の構成を概念的に示すブロック図である。自律動作機の制御装置60は、取得部61、生成部62、選択部63、及び、制御部64を備えている。
取得部61は、協調して動作する第一の自律動作機71及び第二の自律動作機72が、目的を達成するために、実行可能な複数の動作のうちの少なくともいずれかを随時選択して実行する場合に、第一の自律動作機71の動作状態を表す第一状態情報710と、第二の自律動作機72の動作状態を表す第二状態情報720とを取得する。
生成部62は、第一状態情報710と第二状態情報720とに基づいて、第一の自律動作機71が実行可能な当該複数の動作の個々に関して、目的の達成に向けて実行する価値の高さを表す価値情報622を、価値算出基準621を用いて生成する。
選択部63は、当該複数の動作の各々に関する価値情報622に基づいて、当該複数の動作のうちの特定の動作631を選択する。
制御部64は、特定の動作631を実行するように、第一の自律動作機71を制御する。
本実施形態に係る自律動作機の制御装置60は、協調して動作する複数の自律動作機の個々が、目的を達成するために全体最適となるような動作を選択するように、自律動作機を制御することができる。その理由は、自律動作機の制御装置60は、第一の自律動作機71に関する第一状態情報710と、第二の自律動作機72に関する第二状態情報720とに基づいて、第一の自律動作機71が実行可能な複数の動作の個々に関して価値情報622を生成し、生成した価値情報622に基づいて複数の動作のうちの特定の動作631を決定し、その特定の動作631を実行するように第一の自律動作機71を制御するからである。
<ハードウェア構成例>
上述した各実施形態において図1、及び、図11に示した制御装置10及び自律動作機の制御装置60における各部は、専用のHW(HardWare)(電子回路)によって実現することができる。また、図1、及び、図11において、少なくとも、下記構成は、ソフトウェアプログラムの機能(処理)単位(ソフトウェアモジュール)と捉えることができる。
・取得部11及び61、
・生成部12及び62、
・選択部13及び63、
・制御部14及び64
・算出部15。
但し、これらの図面に示した各部の区分けは、説明の便宜上の構成であり、実装に際しては、様々な構成が想定され得る。この場合のハードウェア環境の一例を、図12を参照して説明する。
図12は、本願発明の各実施形態に係る制御装置あるいは自律動作機の制御装置を実行可能な情報処理装置900(コンピュータ)の構成を例示的に説明する図である。即ち、図12は、図1、及び、図11に示した制御装置10あるいは自律動作機の制御装置60を実現可能なコンピュータ(情報処理装置)の構成であって、上述した実施形態における各機能を実現可能なハードウェア環境を表す。
図12に示した情報処理装置900は、構成要素として下記を備えている。
・CPU(Central_Processing_Unit)901、
・ROM(Read_Only_Memory)902、
・RAM(Random_Access_Memory)903、
・ハードディスク(記憶装置)904、
・外部装置との通信インタフェース905、
・バス906(通信線)、
・CD-ROM(Compact_Disc_Read_Only_Memory)等の記録媒体907に格納されたデータを読み書き可能なリーダライタ908、
・モニターやスピーカ、キーボード等の入出力インタフェース909。
即ち、上記構成要素を備える情報処理装置900は、これらの構成がバス906を介して接続された一般的なコンピュータである。情報処理装置900は、CPU901を複数備える場合もあれば、マルチコアにより構成されたCPU901を備える場合もある。
そして、上述した実施形態を例に説明した本願発明は、図12に示した情報処理装置900に対して、次の機能を実現可能なコンピュータプログラムを供給する。その機能とは、その実施形態の説明において参照したブロック構成図(図1、及び、図11)における上述した構成、或いはフローチャート(図10)の機能である。本願発明は、その後、そのコンピュータプログラムを、当該ハードウェアのCPU901に読み出して解釈し実行することによって達成される。また、当該装置内に供給されたコンピュータプログラムは、読み書き可能な揮発性のメモリ(RAM903)、または、ROM902やハードディスク904等の不揮発性の記憶デバイスに格納すれば良い。
また、前記の場合において、当該ハードウェア内へのコンピュータプログラムの供給方法は、現在では一般的な手順を採用することができる。その手順としては、例えば、CD-ROM等の各種記録媒体907を介して当該装置内にインストールする方法や、インターネット等の通信回線を介して外部よりダウンロードする方法等がある。そして、このような場合において、本願発明は、係るコンピュータプログラムを構成するコード或いは、そのコードが格納された記録媒体907によって構成されると捉えることができる。
以上、上述した実施形態を模範的な例として本願発明を説明した。しかしながら、本願発明は、上述した実施形態には限定されない。即ち、本願発明は、本願発明のスコープ内において、当業者が理解し得る様々な態様を適用することができる。
尚、上述した各実施形態の一部又は全部は、以下の付記のようにも記載されうる。しかしながら、上述した各実施形態により例示的に説明した本願発明は、以下には限られない。
(付記1)
協調して動作する第一及び第二の自律動作機が、目的を達成するために、実行可能な複数の動作のうちの少なくともいずれかを随時選択して実行する場合に、前記第一の自律動作機の動作状態を表す第一状態情報と、前記第二の自律動作機の動作状態を表す第二状態情報とを取得する取得手段と、
前記第一状態情報と前記第二状態情報とに基づいて、前記第一の自律動作機が実行可能な前記複数の動作の個々に関して、前記目的の達成に向けて実行する価値の高さを表す価値情報を、価値算出基準を用いて生成する生成手段と、
前記複数の動作の各々に関する前記価値情報に基づいて、前記複数の動作のうちの特定の動作を選択する選択手段と、
前記特定の動作を実行するように、前記第一の自律動作機を制御する制御手段と、
を備える自律動作機の制御装置。
(付記2)
前記制御手段は、前記第一状態情報と前記第二状態情報とに基づいて、前記特定の動作に関する制御量を算出し、算出した前記制御量の前記特定の動作を実行するように、前記第一の自律動作機を制御する、
付記1に記載の自律動作機の制御装置。
(付記3)
前記選択手段は、外部から入力された、前記第一の自律動作機に対する手動制御を指示する手動制御指示情報に基づいて、前記特定の動作を選択し、
前記制御手段は、前記手動制御指示情報に基づいて、前記特定の動作に関する前記制御量を算出する、
付記2に記載の自律動作機の制御装置。
(付記4)
前記生成手段及び前記選択手段の少なくともいずれかは、前記手動制御指示情報に基づいて、前記複数の動作の各々に関する前記価値情報が示す値に対して、当該動作の実行を抑制あるいは推奨する演算を実行する、
付記3に記載の自律動作機の制御装置。
(付記5)
前記第一の自律動作機を制御する方式を自律制御方式から手動制御方式に切り替えることが前記目的の達成に与える影響の大きさに基づく、前記手動制御方式に切り替えることの適切度を、前記価値情報に基づいて算出する算出手段
をさらに備える、付記3または付記4に記載の自律動作機の制御装置。
(付記6)
前記算出手段は、前記価値情報が示す値が小さいほど、前記適切度が示す値が大きくなるように、前記適切度を算出する、
付記5に記載の自律動作機の制御装置。
(付記7)
前記算出手段は、算出した前記適切度を、前記第一の自律動作機と関連付けて、前記手動制御指示情報が操作入力される操作端末装置が備える表示画面に表示する、
付記5あるいは付記6に記載の自律動作機の制御装置。
(付記8)
前記生成手段は、前記複数の動作の個々に関して、前記第一状態情報に基づいた、前記第一の自律動作機による当該動作の実行に要する前記制御量と前記価値の高さとの関係を表す第一評価関数と、前記第二状態情報に基づいた、前記第二の自律動作機による当該動作の実行に要する前記制御量と前記価値の高さとの関係を表す第二評価関数とを、前記価値算出基準として用いる、
付記2乃至付記7のいずれか一項に記載の自律動作機の制御装置。
(付記9)
前記生成手段は、前記第一評価関数と前記第二評価関数との差分、あるいは、前記第一評価関数を前記制御量により微分した値と前記第二評価関数を前記制御量により微分した値との差分を算出する、
付記8に記載の自律動作機の制御装置。
(付記10)
前記第一評価関数及び前記第二評価関数は、前記動作が目標物を探索あるいは追跡することである場合、前記第一の自律動作機と前記目標物との位置関係に基づく前記目標物の存在確率密度を表す関数と、前記制御量に基づく前記目標物の発見確率を表す関数とにより表される、
付記8または付記9に記載の自律動作機の制御装置。
(付記11)
前記存在確率密度を表す関数は、前記動作が前記目標物を探索することである場合、前記第一及び第二の自律動作機が前記目標物を探索する領域に含まれる複数の部分領域ごとに、前記部分領域の中心において値が最大となり、前記部分領域の境界に近づくにしたがって値が低下する特性を有し、前記動作が前記目標物を追跡することである場合、前記目標物が直近に発見された位置において値が最大となり、その直近に発見された位置から離れるにしたがって値が低下する特性を有する、
付記10に記載の自律動作機の制御装置。
(付記12)
前記制御手段は、前記複数の動作の個々に関して、前記第一状態情報に基づいた、前記第一の自律動作機による当該動作の実行に要する前記制御量と前記価値の高さとの関係を表す第一評価関数と、前記第二状態情報に基づいた、前記第二の自律動作機による当該動作の実行に要する前記制御量と前記価値の高さとの関係を表す第二評価関数とを用いて、前記特定の動作に関する前記制御量を算出する、
付記2乃至付記7のいずれか一項に記載の自律動作機の制御装置。
(付記13)
前記制御手段は、前記第一評価関数を前記制御量により微分した値と前記第二評価関数を前記制御量により微分した値が等しくなるような前記制御量を、前記特定の動作に関する前記制御量として算出する、
付記12に記載の自律動作機の制御装置。
(付記14)
前記取得手段、前記生成手段、前記選択手段、及び、前記制御手段は、前記第一の自律動作機、あるいは、前記第一の自律動作機と通信可能な情報処理装置に備えられている、
付記1乃至付記13のいずれか一項に記載の自律動作機の制御装置。
(付記15)
情報処理装置によって、
協調して動作する第一及び第二の自律動作機が、目的を達成するために、実行可能な複数の動作のうちの少なくともいずれかを随時選択して実行する場合に、前記第一の自律動作機の動作状態を表す第一状態情報と、前記第二の自律動作機の動作状態を表す第二状態情報とを取得し、
前記第一状態情報と前記第二状態情報とに基づいて、前記第一の自律動作機が実行可能な前記複数の動作の個々に関して、前記目的の達成に向けて実行する価値の高さを表す価値情報を、価値算出基準を用いて生成し、
前記複数の動作の各々に関する前記価値情報に基づいて、前記複数の動作のうちの特定の動作を選択し、
前記特定の動作を実行するように、前記第一の自律動作機を制御する、
自律動作機の制御方法。
(付記16)
協調して動作する第一及び第二の自律動作機が、目的を達成するために、実行可能な複数の動作のうちの少なくともいずれかを随時選択して実行する場合に、前記第一の自律動作機の動作状態を表す第一状態情報と、前記第二の自律動作機の動作状態を表す第二状態情報とを取得する取得処理と、
前記第一状態情報と前記第二状態情報とに基づいて、前記第一の自律動作機が実行可能な前記複数の動作の個々に関して、前記目的の達成に向けて実行する価値の高さを表す価値情報を、価値算出基準を用いて生成する生成処理と、
前記複数の動作の各々に関する前記価値情報に基づいて、前記複数の動作のうちの特定の動作を選択する選択処理と、
前記特定の動作を実行するように、前記第一の自律動作機を制御する制御処理と、
をコンピュータに実行させるための自律動作機の制御プログラムが格納された記録媒体。
10 制御装置
11 取得部
12 生成部
121 価値算出基準
122 価値情報
13 選択部
131 特定の動作
14 制御部
141 制御量
15 算出部
151 手動制御への切り替えの適切度
20 無人機
21 自無人機
210 状態情報
22 他無人機
220 状態情報
30 操作端末装置
301 手動制御指示情報
31 無人機状況表示部
32 適切度表示部
33 手動操作部
40 無線通信装置
50 通信ネットワーク
60 自律動作機の制御装置
61 取得部
62 生成部
621 価値算出基準
622 価値情報
63 選択部
631 特定の動作
64 制御部
71 第一の自律動作機
710 第一状態情報
72 第二の自律動作機
720 第二状態情報
900 情報処理装置
901 CPU
902 ROM
903 RAM
904 ハードディスク(記憶装置)
905 通信インタフェース
906 バス
907 記録媒体
908 リーダライタ
909 入出力インタフェース

Claims (10)

  1. 協調して動作する第一及び第二の自律動作機が、目的を達成するために、実行可能な複数の動作のうちの少なくともいずれかを随時選択して実行する場合に、前記第一の自律動作機の動作状態を表す第一状態情報と、前記第二の自律動作機の動作状態を表す第二状態情報とを取得する取得手段と、
    前記第一状態情報と前記第二状態情報とに基づいて、前記第一の自律動作機が実行可能な前記複数の動作の個々に関して、前記目的の達成に向けて実行する価値の高さを表す価値情報を、価値算出基準を用いて生成する生成手段と、
    前記複数の動作の各々に関する前記価値情報、及び、外部から入力された、前記第一の自律動作機に対する手動制御を指示する手動制御指示情報に基づいて、前記複数の動作のうちの特定の動作を選択する選択手段と、
    前記第一状態情報と前記第二状態情報と前記手動制御指示情報とに基づいて、前記特定の動作に関する制御量を算出し、算出した前記制御量の前記特定の動作を実行するように、前記第一の自律動作機を制御する制御手段と、
    前記第一の自律動作機を制御する方式を自律制御方式から手動制御方式に切り替えることが前記目的の達成に与える影響の大きさに基づく、前記手動制御方式に切り替えることの適切度を、前記価値情報に基づいて算出する算出手段と、
    を備える自律動作機の制御装置。
  2. 前記生成手段及び前記選択手段の少なくともいずれかは、前記手動制御指示情報に基づいて、前記複数の動作の各々に関する前記価値情報が示す値に対して、当該動作の実行を抑制あるいは推奨する演算を実行する、
    請求項に記載の自律動作機の制御装置。
  3. 前記算出手段は、前記価値情報が示す値が小さいほど、前記適切度が示す値が大きくなるように、前記適切度を算出する、
    請求項1または請求項2に記載の自律動作機の制御装置。
  4. 前記算出手段は、算出した前記適切度を、前記第一の自律動作機と関連付けて、前記手動制御指示情報が操作入力される操作端末装置が備える表示画面に表示する、
    請求項1乃至請求項3のいずれか一項に記載の自律動作機の制御装置。
  5. 前記生成手段は、前記複数の動作の個々に関して、前記第一状態情報に基づいた、前記第一の自律動作機による当該動作の実行に要する前記制御量と前記価値の高さとの関係を表す第一評価関数と、前記第二状態情報に基づいた、前記第二の自律動作機による当該動作の実行に要する前記制御量と前記価値の高さとの関係を表す第二評価関数とを、前記価値算出基準として用いる、
    請求項乃至請求項のいずれか一項に記載の自律動作機の制御装置。
  6. 前記生成手段は、前記第一評価関数と前記第二評価関数との差分、あるいは、前記第一評価関数を前記制御量により微分した値と前記第二評価関数を前記制御量により微分した値との差分を算出する、
    請求項5に記載の自律動作機の制御装置。
  7. 前記制御手段は、前記複数の動作の個々に関して、前記第一状態情報に基づいた、前記第一の自律動作機による当該動作の実行に要する前記制御量と前記価値の高さとの関係を表す第一評価関数と、前記第二状態情報に基づいた、前記第二の自律動作機による当該動作の実行に要する前記制御量と前記価値の高さとの関係を表す第二評価関数とを用いて、前記特定の動作に関する前記制御量を算出する、
    請求項1乃至請求項6のいずれか一項に記載の自律動作機の制御装置。
  8. 前記取得手段、前記生成手段、前記選択手段、及び、前記制御手段は、前記第一の自律動作機、あるいは、前記第一の自律動作機と通信可能な情報処理装置に備えられている、
    請求項1乃至請求項7のいずれか一項に記載の自律動作機の制御装置。
  9. 情報処理装置によって、
    協調して動作する第一及び第二の自律動作機が、目的を達成するために、実行可能な複数の動作のうちの少なくともいずれかを随時選択して実行する場合に、前記第一の自律動作機の動作状態を表す第一状態情報と、前記第二の自律動作機の動作状態を表す第二状態情報とを取得し、
    前記第一状態情報と前記第二状態情報とに基づいて、前記第一の自律動作機が実行可能な前記複数の動作の個々に関して、前記目的の達成に向けて実行する価値の高さを表す価値情報を、価値算出基準を用いて生成し、
    前記複数の動作の各々に関する前記価値情報、及び、外部から入力された、前記第一の自律動作機に対する手動制御を指示する手動制御指示情報に基づいて、前記複数の動作のうちの特定の動作を選択し、
    前記第一状態情報と前記第二状態情報と前記手動制御指示情報とに基づいて、前記特定の動作に関する制御量を算出し、算出した前記制御量の前記特定の動作を実行するように、前記第一の自律動作機を制御
    前記第一の自律動作機を制御する方式を自律制御方式から手動制御方式に切り替えることが前記目的の達成に与える影響の大きさに基づく、前記手動制御方式に切り替えることの適切度を、前記価値情報に基づいて算出する、
    自律動作機の制御方法。
  10. 協調して動作する第一及び第二の自律動作機が、目的を達成するために、実行可能な複数の動作のうちの少なくともいずれかを随時選択して実行する場合に、前記第一の自律動作機の動作状態を表す第一状態情報と、前記第二の自律動作機の動作状態を表す第二状態情報とを取得する取得処理と、
    前記第一状態情報と前記第二状態情報とに基づいて、前記第一の自律動作機が実行可能な前記複数の動作の個々に関して、前記目的の達成に向けて実行する価値の高さを表す価値情報を、価値算出基準を用いて生成する生成処理と、
    前記複数の動作の各々に関する前記価値情報、及び、外部から入力された、前記第一の自律動作機に対する手動制御を指示する手動制御指示情報に基づいて、前記複数の動作のうちの特定の動作を選択する選択処理と、
    前記第一状態情報と前記第二状態情報と前記手動制御指示情報とに基づいて、前記特定の動作に関する制御量を算出し、算出した前記制御量の前記特定の動作を実行するように、前記第一の自律動作機を制御する制御処理と、
    前記第一の自律動作機を制御する方式を自律制御方式から手動制御方式に切り替えることが前記目的の達成に与える影響の大きさに基づく、前記手動制御方式に切り替えることの適切度を、前記価値情報に基づいて算出する算出処理と、
    をコンピュータに実行させるための自律動作機の制御プログラム。
JP2020517672A 2018-05-09 2018-05-09 自律動作機の制御装置、自律動作機の制御方法、及び、自律動作機の制御プログラム Active JP7070673B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2018/017914 WO2019215838A1 (ja) 2018-05-09 2018-05-09 自律動作機の制御装置、自律動作機の制御方法、及び、自律動作機の制御プログラムが格納された記録媒体

Publications (2)

Publication Number Publication Date
JPWO2019215838A1 JPWO2019215838A1 (ja) 2021-04-22
JP7070673B2 true JP7070673B2 (ja) 2022-05-18

Family

ID=68467997

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020517672A Active JP7070673B2 (ja) 2018-05-09 2018-05-09 自律動作機の制御装置、自律動作機の制御方法、及び、自律動作機の制御プログラム

Country Status (3)

Country Link
US (1) US11740629B2 (ja)
JP (1) JP7070673B2 (ja)
WO (1) WO2019215838A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021202202A2 (en) * 2020-03-27 2021-10-07 Skygrid, Llc Utilizing unmanned aerial vehicles for emergency response
JP2022152215A (ja) 2021-03-29 2022-10-12 三菱重工業株式会社 監視計画作成装置、監視システム、監視計画作成方法及びプログラム

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009199359A (ja) 2008-02-21 2009-09-03 Yanmar Co Ltd 自律型ロボット及び自律型ロボットを複数用いる協調作業システム
US20150148951A1 (en) 2013-11-27 2015-05-28 Electronics And Telecommunications Research Institute Method and control apparatus for cooperative cleaning using multiple robots
JP2015201068A (ja) 2014-04-09 2015-11-12 日本電信電話株式会社 行動制御装置、方法及びプログラム
WO2016166983A1 (ja) 2015-04-16 2016-10-20 日本電気株式会社 制御装置、機器、情報処理システム、制御方法、および、記憶媒体
JP2017142659A (ja) 2016-02-10 2017-08-17 村田機械株式会社 自律移動体システム
WO2017221859A1 (ja) 2016-06-21 2017-12-28 日本電気株式会社 移動体、移動体制御システム、移動体制御方法、インターフェース装置、およびプログラムが記録された記録媒体
JP2018030407A (ja) 2016-08-23 2018-03-01 株式会社日立製作所 搬送システム及び搬送方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10065317B2 (en) * 2016-06-30 2018-09-04 General Electric Company Control system for coordinating robotic machines to collaborate on tasks
US7908040B2 (en) * 2004-07-15 2011-03-15 Raytheon Company System and method for automated search by distributed elements
US8186589B2 (en) * 2006-01-11 2012-05-29 Carmel-Haifa University Economic Corporation Ltd. UAV decision and control system
JP5559671B2 (ja) 2010-12-13 2014-07-23 公益財団法人鉄道総合技術研究所 走行制御支援方法及び走行制御支援装置
JP6761293B2 (ja) 2015-09-15 2020-09-23 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 移動制御方法、自律移動制御システム、自律移動ロボット及び自律移動制御プログラム
JP6799444B2 (ja) 2016-04-01 2020-12-16 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 自律移動体システム

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009199359A (ja) 2008-02-21 2009-09-03 Yanmar Co Ltd 自律型ロボット及び自律型ロボットを複数用いる協調作業システム
US20150148951A1 (en) 2013-11-27 2015-05-28 Electronics And Telecommunications Research Institute Method and control apparatus for cooperative cleaning using multiple robots
JP2015201068A (ja) 2014-04-09 2015-11-12 日本電信電話株式会社 行動制御装置、方法及びプログラム
WO2016166983A1 (ja) 2015-04-16 2016-10-20 日本電気株式会社 制御装置、機器、情報処理システム、制御方法、および、記憶媒体
JP2017142659A (ja) 2016-02-10 2017-08-17 村田機械株式会社 自律移動体システム
WO2017221859A1 (ja) 2016-06-21 2017-12-28 日本電気株式会社 移動体、移動体制御システム、移動体制御方法、インターフェース装置、およびプログラムが記録された記録媒体
JP2018030407A (ja) 2016-08-23 2018-03-01 株式会社日立製作所 搬送システム及び搬送方法

Also Published As

Publication number Publication date
US20210232139A1 (en) 2021-07-29
JPWO2019215838A1 (ja) 2021-04-22
US11740629B2 (en) 2023-08-29
WO2019215838A1 (ja) 2019-11-14

Similar Documents

Publication Publication Date Title
CN109540142B (zh) 一种机器人定位导航的方法、装置、计算设备
EP3553622B1 (en) Control device, control method, and program recording medium
US11429101B2 (en) Adaptive autonomy system architecture
US10948907B2 (en) Self-driving mobile robots using human-robot interactions
Zeng et al. Efficient path re-planning for AUVs operating in spatiotemporal currents
Sariel et al. Naval mine countermeasure missions
Yang et al. Multi-UAV cooperative search using an opportunistic learning method
WO2017221859A1 (ja) 移動体、移動体制御システム、移動体制御方法、インターフェース装置、およびプログラムが記録された記録媒体
JP7070673B2 (ja) 自律動作機の制御装置、自律動作機の制御方法、及び、自律動作機の制御プログラム
Pereira Optimal control problems in drone operations for disaster search and rescue
Goel et al. Fast exploration using multirotors: Analysis, planning, and experimentation
Varotto et al. Active sensing for search and tracking: A review
Scerri et al. Transitioning multiagent technology to UAV applications.
JP7014289B2 (ja) 移動体制御装置、移動体、移動体制御システム、移動体制御方法および移動体制御プログラム
Izhboldina et al. Approach to UAV swarm control and collision-free reconfiguration
WO2021246169A1 (ja) 情報処理装置、情報処理システム、および方法、並びにプログラム
Belbachir et al. A cooperative architecture for target localization using multiple AUVs
Chung Cooperative control of UAVs using a single master subsystem for multi-task multi-target operations
Herrmann Metareasoning for Robots
Qin et al. An environment information-driven online Bi-level path planning algorithm for underwater search and rescue AUV
US11853066B2 (en) Control device, formation determination device, control method, and program
KR20180078153A (ko) 자율 무인 시스템을 위한 지능 에이전트 시스템
EP4209857A1 (en) Conflict detection and avoidance for a robot based on perception uncertainty
Ye et al. Optimal Formation of UUV Groups Based on Shape Theory and Improved Ant Colony Algorithm Under Communication Delay
Li et al. Multi-AUV coverage path planning algorithm using side-scan sonar for maritime search

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201020

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201020

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20211020

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211102

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211223

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220405

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220418

R151 Written notification of patent or utility model registration

Ref document number: 7070673

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151