WO2021090906A1

WO2021090906A1 - 制御装置、制御ユニット、それらを有する制御システム

Info

Publication number: WO2021090906A1
Application number: PCT/JP2020/041448
Authority: WO
Inventors: パーベルサフキン; 藤原クリスティアン直人; ロクランウィルソン
Original assignee: 株式会社エスイーフォー
Priority date: 2019-11-08
Filing date: 2020-11-06
Publication date: 2021-05-14

Abstract

本発明の一実施形態によれば、１又は複数の作業機械１００，１６０を制御する制御信号を生成する制御装置３００が開示される。本実施形態に係る制御装置３００は、現実世界の作業機械の周囲環境情報に基づいて、現実世界に対応する仮想世界を生成し（Ｓ４１０）、作業機械に実行させるタスクを指示する入力操作を受け付け（Ｓ４１５）、スキル情報に基づいて、入力操作によって指示されたタスクを作業機械に実行させるために１又は複数の作業機械の各々の作業機械が実行する一連の動作タスクからなるスケジュールを生成し、作業機械をスケジュールに基づいて動作させる制御信号を生成する（Ｓ４２５）。

Description

制御装置、制御ユニット、それらを有する制御システム

　本発明は、制御装置、制御ユニット、それらを有する制御システムに関する。

　特許文献１及び２には、オペレータが、作業機械から送信されてくる画像を見ながら操作桿を操作して作業機械を遠隔操作する技術が開示されている。

特開2015-043488号公報特開2018-207244号公報

　特許文献１及び２に開示された技術には、下記のような課題が存在する。

　第１に、オペレータが遠隔操作装置の操作桿を操作して作業機械を遠隔操作するので、オペレータには実機の作業機械を操作するのと同じレベルのスキルが求められる。そのため、作業機械の操作に慣れていない初心者のオペレータが作業機械を遠隔操作することは難しい。

　また、オペレータは、作業機械から送信されてくる画像を見ながら作業機械をリアルタイムに遠隔操作するので、オペレータは、作業機械を動作させるのと同じ時間の間、遠隔操作装置での遠隔操作作業を行う必要がある。加えて、作業機械から送信された画像がオペレータに表示されるまで、また、オペレータによる操作桿での入力信号が作業機械に送られるまでにはタイムラグがある。このような条件の下、オペレータは作業機械を遠隔操作している間は集中を切らさずに作業する必要があるので、オペレータには心身共に多くの負担が求められる。一般に、作業機械を遠隔操作する場合の作業効率は、オペレータが実際の作業機械に搭乗して操作した場合の作業効率の６０％程度まで低下するとされている。

　さらには、遠隔操作装置と作業機械との間の通信に遅延が生じる環境では、オペレータが作業機械をリアルタイムに操作することは事実上不可能になる。通信に遅延が生じる環境としては、作業機械が宇宙空間のような遠隔地に送り込まれている場合や、深海、砂漠地帯、山岳地帯等の通信環境が劣悪で通信帯域幅を確保できずデータの送受信に多くの時間を要する場合などが考えられる。火星にある作業機械を地球から遠隔操作するシナリオでは、地球と火星との間の通信には片道で最大２０分、往復で最大４０分を要するため、火星にある作業機械を地球から遠隔操作しようとすると、ある１つのアクションの動作指示を地球から火星の作業機械に送信してから作業機械が動作を開始するまでの時間が約２０分であり、その後、実際にアクションを実行した後のフィードバックとして作業機械の周囲環境の画像データ等が火星から地球に届くまでにさらに約２０分の時間を要する。人間の知覚能力上の制限から、数秒以上の通信遅延がある環境では遠隔操作を行うことが困難である。

　さらに、オペレータが遠隔操作装置の操作桿を操作して作業機械を遠隔操作するシステムでは、オペレータが遠隔操作装置で遠隔操作できる作業機械は１台に限られるので、オペレータが複数台の作業機械を動作させることはできない。

　本発明の一態様によれば、１又は複数のエージェントを制御する制御信号を生成する制御装置であって、現実世界のエージェントの周囲環境情報に基づいて、現実世界に対応する仮想世界を生成することと、ユーザによって仮想世界においてなされる、エージェントに実行させるタスクを指示する入力操作を受け付けることと、各エージェントが備える１又は複数のスキルと、そのスキルが従属する他のスキルに関するスキル従属情報とを少なくとも含むスキル情報に基づいて、入力操作によって指示されたタスクをエージェントに実行させるために１又は複数のエージェントの各々のエージェントが実行する一連の動作タスクからなるスケジュールを生成することと、エージェントをスケジュールに基づいて動作させる制御信号を生成することと、を実行するように構成されたプロセッサを備えた制御装置が提供される。

　本発明の他の態様によれば、１又は複数のエージェントを制御する制御ユニットであって、各々のエージェントが実行する一連の動作タスクからなるスケジュールを含む制御信号を受信することと、制御信号に基づいて、各々のエージェントに一連の動作タスクを実行させる動作指令を生成することと、を実行するように構成されたプロセッサを備えた制御ユニットが提供される。

　本発明の他の特徴事項および利点は、例示的且つ非網羅的に与えられている以下の説明及び添付図面から理解することができる。

本発明の一実施形態に係る制御システムを示すブロック図である。作業機械の一例の構成を示す概略図である。作業機械の他の例の構成を示す概略図である。本実施形態における制御方法の第１の動作例を説明するフローチャートである。現実世界の作業機械の周囲環境を再現した仮想世界を示す図である。現実世界の作業機械の周囲環境を再現した仮想世界を示す図であり、同図（ａ）は掘削領域を指定する入力操作の様子を示し、同図（ｂ）は廃棄領域を指定する入力操作の様子を示す。制御信号を生成するプロセスを示すフローチャートである。図７に示されたプロセスにより生成されたスケジュールを表現する有向非巡回グラフである。各作業機械が実行命令に従って動作している様子を示す図である。ユーザが仮想世界内で第１の仮想作業機械の仮想バケットを操作する様子を示す図である。ユーザが仮想世界内で掘削領域及び廃棄領域を指定する入力操作を示す図である。

　以下、本発明の実施の形態を図面を参照して説明する。

　図１は、本発明の一実施形態に係る制御システムを示すブロック図である。図２は作業機械の一例の構成を示す概略図であり、図３は作業機械の他の例の構成を示す概略図である。

　図１に示すように、本実施形態に係る制御システム１は、エージェントとしての作業機械１００と、作業機械１００を制御する制御ユニット２００と、制御ユニット２００の制御を司る制御装置３００とを備えている。

　図１及び図２に示すように、本実施形態において開示する第１の作業機械１００は、一例として、移動体１１０と、移動体１１０に対して旋回可能に設けられた旋回体１２０と、旋回体１２０に支持された作業体１３０とを備えたショベルカーである。本実施形態において例示的に開示する第１の作業機械１００の作業体１３０は、旋回体１２０に支持されたアーム部１３２と、アーム部１３２の先端に備えられたバケット１３４とを有している。バケット１３４は土等を掘削することに用いられる。第１の作業機械１００は、作業機械１００の周囲環境をセンシングする環境センサ１４０を備えている。第１の作業機械１００はさらに、制御ユニット２００との間での信号・情報の送受信を行う送受信ユニット１５０を備えている。

　移動体１１０は、図１に示す例では無限軌道を備えた車両である。ただし、移動体１１０の形態はこれに限られず、複数の車輪を備えた車両、船舶、潜水機、ヘリコプターやドローン等の飛行体、その他の任意の形態であってもよい。

　環境センサ１４０は、作業機械１００の周囲環境をセンシングする。周囲環境には例えば、電磁波（可視光線、非可視光線、Ｘ線、ガンマ線等を含む）、音、温度、湿度、風速、大気組成等が含まれ、したがって環境センサ１４０は、視覚センサ、Ｘ線・ガンマ線センサ、聴覚センサ、温度センサ、湿度センサ、風速センサ、大気分析装置等を含み得るが、これらに限定されない。また、環境センサ１４０は、ＧＰＳ（ＧｒｏｂａｌＰｏｓｉｔｉｏｎｉｎｇＳｙｓｔｅｍ）センサ、高度センサ、ジャイロセンサ等を備えていることが好ましい。さらに、環境センサ１４０は、作業機械１００の屋外または屋内における位置検出のため、位置検出手段として、上記ＧＰＳセンサの他、ＷｉＦｉ測位、ビーコン測位、自立航法測位、地磁気測位、音波測位、ＵＷＢ（ＵｌｔｒａＷｉｄｅＢａｎｄ：超広帯域無線）測位、可視光・非可視光測位等を行うための構成を備えていることが好ましい。

　なお、図では環境センサ１４０が作業機械１００と一体であるように示されているが、環境センサ１４０が作業機械１００の周囲環境及び位置・姿勢等をセンシングできるのであれば、環境センサ１４０は作業機械１００とは一体でなくてもよい。例えば、環境センサ１４０は作業機械１００から離れた位置に設置されていたり、作業機械１００とは別の車両やドローン等の移動体に設置されていてもよい。

　特に視覚センサとしては、例えば、２Ｄカメラ及び深度センサ、３Ｄカメラ、ＲＧＢ－Ｄセンサ、３Ｄ－ＬｉＤＡＲセンサ、Ｋｉｎｅｃｔ（商標）センサなどを用いることができる。環境センサ１４０で得られた視覚情報は制御ユニット２００へ送られ、制御ユニット２００において処理される。環境センサ１４０で得られるその他の環境情報も制御ユニット２００へ送信し、作業機械１００の周囲環境の解析に用いることができる。

　送受信ユニット１５０は、制御ユニット２００と有線接続または無線接続によって接続することが可能であり、したがってそれらの信号・情報の送受信は有線または無線によって行うことができる。それらの信号・情報の送受信に用いられる通信プロトコル及び周波数等は、作業機械１００が用いられる用途や環境等に応じて適宜選択しうる。さらに、送受信ユニット１５０はインターネット等のネットワークに接続されていてもよい。

　また、図１及び図３に示すように、本実施形態において開示する第２の作業機械１６０は、一例として、移動体１７０と、移動体１１０に設けられた荷台１７５とを備えたダンプトラックである。本実施形態において例示的に開示する第２の作業機械１６０の荷台１７５は、駆動部（不図示）により、搬送物を積載して移動する水平姿勢（図３（ａ）参照）と、搬送物を後部から落下させるように荷台１７５の前部を情報にリフトさせたリフト姿勢（図３（ｂ）参照）との間で姿勢を変化させることができる。第２の作業機械１６０は、作業機械１６０の周囲環境をセンシングする環境センサ１８０を備えている。第２の作業機械１６０はさらに、制御ユニット２００との間での信号・情報の送受信を行う送受信ユニット１８５を備えている。

　移動体１７０は、図２に示す例では左右への移動方向を可能にする前輪と、駆動輪である後輪とを備えた車両である。ただし、移動体１６０の形態はこれに限られず、無限軌道を備えた車両、船舶、潜水機、ヘリコプターやドローン等の飛行体、その他の任意の形態であってもよい。

　第２の作業機械１６０も、第１の作業機械１００が備える環境センサ１４０及び送受信ユニット１５０と同様に構成された環境センサ１８０及び送受信ユニット１８５を備えている。なお、本例では各作業機械１００，１６０がそれぞれ環境センサ１４０，１８０を備える例を示したが、少なくとも一方の環境センサで作業機械１００，１６０の周囲環境をセンシングできる場合には環境センサ１４０，１８０のうちの一方が備えられていればよい。

　次に、本実施形態の制御システム１における制御ユニット２００について説明する。

　再び図１を参照すると、本実施形態に係るシステム１の制御ユニット２００は、プロセッサ２２０、記憶ユニット２４０および送受信ユニット２６０を備えている。

　プロセッサ２２０は主として、第１の作業機械１００の移動体１１０、旋回体１２０及び作業体１３０の各駆動部（不図示）の制御、第２の作業機械１６０の移動体１７０、荷台１７５の駆動部、環境センサ１４０，１８０の制御、環境センサ１４０，１８０から送信された情報の処理、制御装置３００との相互作用、送受信ユニット２６０の制御を司る。プロセッサ２２０は、例えば、中央演算処理装置（ＣＰＵ）、特定用途向け集積回路（ＡＳＩＣ）、組込みプロセッサ、マイクロプロセッサ、デジタル信号プロセッサ（ＤＳＰ）、あるいはそれらの組み合わせで構成される。プロセッサ２２０は、１又は２以上のプロセッサで構成されていてもよい。

　さらに、プロセッサ２２０は、例えば、制御装置３００から送られた各作業機械１００，１６０の制御信号と、それに応じて生成した動作命令と、実際に実行された各作業機械１００，１６０の動作と、動作実行後に各環境センサ１４０，１８０で取集した周囲環境データとを記憶ユニット２４０にデータとして記憶させ、そのデータを用いて機械学習を実行して学習データを生成して記憶ユニット２４０に記憶させる。プロセッサ２２０は、次回以降に制御装置３００から送信された作業機械１００，１６０の制御信号に基づいて作業機械１００，１６０に実行させるべき動作をその学習データを参照して決定して動作命令を生成することが可能である。このように、本実施形態では現実世界にある作業機械１００，１６０の制御ユニット２００がローカルに機械学習機能を備えている。

　記憶ユニット２４０は、本実施形態で説明するように作業機械１００，１６０を制御するためのコンピュータ・プログラム、環境センサ１４０，１８０から送信された情報の処理を行うコンピュータ・プログラム、制御装置３００との相互作用を行うコンピュータ・プログラム、送受信ユニット２６０を制御するコンピュータ・プログラム、機械学習を実行するプログラム等を記憶している。好ましくは、記憶ユニット２４０には、コンピュータに本実施形態で説明するような処理を行わせて制御ユニット２００としての機能を生じさせるソフトウェアまたはプログラムが記憶されている。

　さらに、記憶ユニット２４０は、作業機械１００，１６０の各部の状態、環境センサ１４０，１８０ら送信された情報、制御装置３００から送られた情報、制御信号等を少なくとも一時的に記憶する役割も有する。さらには、記憶ユニット２４０は、上述したように、作業機械１００，１６０の動作指示とそれに応じて実行された作業機械１００，１６０の動作、学習データを記憶する役割も有する。記憶ユニット２４０は、制御ユニット２００の電源がオフされても記憶状態が保持される不揮発性の記憶媒体を備えていることが好ましく、例えば、ハードディスクドライブ（ＨＤＤ）、固体記憶装置（ＳＳＤ）、コンパクトディスク（ＣＤ）・ディジタル・バーサタイル・ディスク（ＤＶＤ）・ブルーレイディスク（ＢＤ）等の光学ディスクストレージ、不揮発性ランダムアクセスメモリ（ＮＶＲＡＭ）、ＥＰＲＯＭ（ＲｒａｓａｂｌｅＰｒｏｇｒａｍｍａｂｌｅＲｅａｄＯｎｌｙＭｅｍｏｒｙ）、フラッシュメモリ等の不揮発性ストレージを備えている。なお、記憶ユニット２４０はスタティックランダムアクセスメモリ（ＳＲＡＭ）等の揮発性ストレージをさらに備えていてもよいが、上述した各コンピュータ・プログラムは記憶ユニット３４０のうち不揮発性の（非一時的な）記憶媒体に記憶される。

　送受信ユニット２６０は、各作業機械１００，１６０との間での信号・情報の送受信を行う。制御ユニット２００は、各作業機械１００，１６０と有線接続または無線接続によって接続することが可能であり、したがってそれらの信号・情報の送受信は有線または無線によって行うことができる。それらの信号・情報の送受信に用いられる通信プロトコル及び周波数等は、作業機械１００，１６０が用いられる用途や環境等に応じて適宜選択しうる。送受信ユニット２６０はインターネット等のネットワークに接続されていてもよい。

　さらに、送受信ユニット２６０は、制御装置３００との間での信号・情報の送受信を行う。制御ユニット２００は、制御装置３００と有線接続または無線接続によって接続することが可能であり、したがってそれらの信号・情報の送受信は有線または無線によって行うことができる。それらの信号・情報の送受信に用いられる通信プロトコル及び周波数等は適宜選択しうる。

　なお、図１では制御ユニット２００が作業機械１００，１６０から独立したものとして示されているが、その形態に限られない。例えば、制御ユニット２００は各作業機械１００，１６０内に設けられていてもよい。また、本システム１で用いる作業機械１００，１６０は１台に限られず、複数及び／又は異種の作業機械１００，１６０を独立して、あるいは互いに協働させて動作させてもよい。この場合、単体の制御ユニット２００で複数の作業機械１００，１６０を制御してもよく、あるいは、複数の制御ユニット２００を協働させて複数の作業機械１００，１６０を制御してもよい。

　続いて、本実施形態の制御システム１における制御装置３００について説明する。

　図１に示すように、本実施形態に係るシステム１の制御装置３００は、プロセッサ３２０、記憶ユニット３４０、入力デバイス３５０、送受信ユニット３６０、ディスプレイ３７０を備えている。

　プロセッサ３２０は主として、制御ユニット２００との相互作用、入力デバイス３５０を介してユーザによって行われる入力に基づく処理、送受信ユニット３６０の制御、ディスプレイ３７０の表示を司る。とりわけ、プロセッサ３２０は、入力デバイス３５０によって入力されたユーザ入力に基づいて制御信号を生成し、制御ユニット２００に送信する。制御ユニット２００のプロセッサ２２０は、その制御信号に基づき、作業機械１００の移動体１１０、旋回体１２０及び作業体１３０の各駆動部（不図示）や環境センサ１４０を動作させるための１つのあるいは複数の動作指令、および、作業機械１６０の移動体１７０及び荷台１７５の各駆動部（不図示）や環境センサ１８０を動作させるための１つのあるいは複数の動作指令を生成する。プロセッサ３２０は、例えば、中央演算処理装置（ＣＰＵ）、特定用途向け集積回路（ＡＳＩＣ）、組込みプロセッサ、マイクロプロセッサ、デジタル信号プロセッサ（ＤＳＰ）、あるいはそれらの組み合わせで構成される。プロセッサ３２０は、１又は２以上のプロセッサで構成されていてもよい。プロセッサ３２０は、１又は２以上のプロセッサで構成されていてもよい。

　さらに、制御装置３００のプロセッサ３２０は、ユーザに提示するＵＩ（ユーザ・インターフェース）画面を生成し、ディスプレイ３７０に表示するように構成されている。ＵＩ画面（不図示）は、例えば、複数の選択肢を階層的にユーザに提供する選択ボタンを含む。さらにプロセッサ３２０は、作業機械１００の環境センサ１４０、及び／又は、作業機械１６０の環境センサ１８０によって撮影された作業機械１００及び／又は作業機械１６０の周囲環境の現実世界の画像または動画に基づいて仮想世界（シミュレーション空間）の画像または動画を生成し、ディスプレイ３７０に表示する。プロセッサ３２０は、現実世界の画像または動画に基づいて仮想世界の画像または動画を生成する際に、例えば現実世界の座標系と仮想世界の座標系とを対応付けることにより、現実世界と仮想世界との相関関係を構築する。さらに、現実世界の画像または動画と仮想世界（シミュレーション空間）の画像または動画とを同時にディスプレイ３７０に表示してもよい。さらには、ＵＩ画面をロボット１００，１６０の周囲環境の画像または動画あるいは仮想世界の画像または動画に重ね合わせて表示してもよい。作業機械１００，１６０の周囲環境の現実世界の画像または動画に基づいて仮想世界（シミュレーション空間）の画像または動画には、作業機械１００，１６０の周囲環境に存在するオブジェクトも含まれる。プロセッサ３２０が現実世界の画像または動画に基づいて仮想世界の画像または動画を生成する際に現実世界と仮想世界との相関関係を構築することで、以下に詳しく説明するように、仮想世界におけるユーザの操作に基づいて現実世界において変化を生じさせ、かつ、現実世界における変化を仮想世界において反映させることが可能となる。

　記憶ユニット３４０は、プロセッサ３２０に本実施形態で説明する動作を実行させるためのプログラム、制御ユニット２００との相互作用を行うコンピュータ・プログラム、入力デバイス３５０を介してＵＩ画面においてユーザによってインタラクティブに行われる入力に基づく処理を行うコンピュータ・プログラム、送受信ユニット３６０の制御を行うコンピュータ・プログラム、ディスプレイ３７０の表示を行うコンピュータ・プログラム等を記憶している。好ましくは、記憶ユニット３４０には、コンピュータに後述する動作を行わせて制御装置３００としての機能を生じさせるソフトウェアまたはプログラムが記憶されている。特に、記憶ユニット３４０には、図４や図７を参照して後述する方法を実施する命令を含む、プロセッサ３２０によって実行可能なコンピュータ・プログラムが記憶されている。

　さらに、記憶ユニット３４０は、作業機械１００の環境センサ１４０及び／又は作業機械１６０の環境センサ１８０によって撮影され、制御ユニット２００を介して制御装置３００に送られた作業機械１００及び／又は作業機械１６０の周囲環境の画像または動画と、その周囲環境の画像または動画に基づいてプロセッサ３２０によって生成された仮想世界（シミュレーション空間）の画像または動画とを少なくとも一時的に記憶することが可能である。制御装置３００の記憶ユニット３４０も、制御装置３００の電源がオフされても記憶状態が保持される不揮発性の記憶媒体を備えていることが好ましく、例えば、ハードディスクドライブ（ＨＤＤ）、固体記憶装置（ＳＳＤ）、コンパクトディスク（ＣＤ）・ディジタル・バーサタイル・ディスク（ＤＶＤ）・ブルーレイディスク（ＢＤ）等の光学ディスクストレージ、不揮発性ランダムアクセスメモリ（ＮＶＲＡＭ）、ＥＰＲＯＭ（ＲｒａｓａｂｌｅＰｒｏｇｒａｍｍａｂｌｅＲｅａｄＯｎｌｙＭｅｍｏｒｙ）、フラッシュメモリ等の不揮発性ストレージを備えている。なお、記憶ユニット３４０はスタティックランダムアクセスメモリ（ＳＲＡＭ）等の揮発性ストレージをさらに備えていてもよいが、上述した各コンピュータ・プログラムは記憶ユニット３４０のうち不揮発性の（非一時的な）記憶媒体に記憶される。

　さらに記憶ユニット３４０はシステム１のデータベースとしても機能し、制御信号に基づいて動作した現実世界における作業機械１００，１６０の動作データ（制御ユニット２００が生成した動作指令を含む）と、環境センサ１４０，１８０で検出された動作結果を示す周囲環境データを記憶する。

　入力デバイス３５０として、例えば、キーボード、マウス、ジョイスティックなどを用いることができる。さらには、赤外線等を用いて位置と姿勢をトラッキングすることが可能でトリガーボタンなどを備えたトラッカーと呼ばれるデバイスを用いることもできる。また、ディスプレイ３７０がタッチパネル式のディスプレイ・デバイスを備えている場合には、そのタッチパネルを入力デバイスとして用いることができる。さらには、ディスプレイ３７０がＶＲ（仮想現実）・ＡＲ（拡張現実）あるいはＭＲ（複合現実）等の表示デバイスとして用いられるヘッドマウントディスプレイであり、かつユーザの視線追跡機能を備えている場合には、その視線追跡機能を入力デバイスとして用いることができる。あるいは、視線追跡機能を備えているがディスプレイを備えていないデバイスであっても、その視線追跡機能を入力デバイスとして用いることができる。さらには、音声入力装置を入力デバイスとして用いることもできる。これらは入力デバイス３５０の例として例示したものであり、入力デバイス３５０に用いることができる手段はこれらに限られない。また、上述したような手段を任意に組み合わせて入力デバイス３５０として使用してもよい。上記のような入力デバイス３５０を用いることにより、ユーザはディスプレイ３７０に表示されたＵＩ画面において、例えば、選択ボタンを選択したり、文字を入力したり、環境センサ１４０，１８０によって撮影された周囲環境の画像または動画中に含まれるオブジェクト、あるいは、環境センサ１４０，１８０によって撮影された周囲環境の画像または動画に基づいて生成された仮想世界（シミュレーション空間）の画像または動画中に含まれる仮想オブジェクトを選択したりすることができる。

　送受信ユニット３６０は、制御ユニット２００との間での信号・情報の送受信を行う。上述したように、制御装置３００は制御ユニット２００と有線接続または無線接続によって接続することが可能であり、したがってそれらの信号・情報の送受信は有線または無線によって行うことができる。その信号・情報の送受信に用いられる通信プロトコル及び周波数等は、システム１が用いられる用途や環境等に応じて適宜選択しうる。さらに、送受信ユニット３６０はインターネット等のネットワークに接続されていてもよい。

　ディスプレイ３７０には、ディスプレイ・モニター、コンピュータ・タブレット装置（タッチパネル式のディスプレイを備えたものを含む）、ＶＲ（仮想現実）・ＡＲ（拡張現実）あるいはＭＲ（複合現実）等の表示デバイスとして用いられるヘッドマウントディスプレイ、プロジェクター等の任意の形態の表示装置を用いることができる。

　特に、ディスプレイ３７０としてヘッドマウントディスプレイが用いられる場合、ヘッドマウントディスプレイがユーザの左右の眼にそれぞれ視差を持たせた画像または動画を提供することで、ユーザに三次元の画像または動画を知覚させることができる。さらに、ヘッドマウントディスプレイがモーション・トラッキング機能を備えている場合は、ヘッドマウントディスプレイを装着しているユーザの頭の位置、方向に応じた画像または動画を表示させることができる。さらには、上述したようにヘッドマウントディスプレイがユーザの視線追跡機能を備えている場合には、その視線追跡機能を入力デバイスとして用いることができる。

［第１の動作例］
　次に、図４～図９を参照し、本実施形態による制御方法の第１の動作例として、第１の作業機械（シャベルカー）１００と第２の作業機械（ダンプカー）１６０とを協働させて土を運ぶシナリオを例に挙げて説明する。

　図４は、本実施形態における制御方法の第１の動作例を説明するフローチャートである。

　最初に、作業機械１００，１６０の環境センサ１４０，１８０で得られた、現実世界の作業機械１００，１６０の周囲環境情報を、制御ユニット２００を介して制御装置３００へ送信する（図４のステップＳ４０５）。視覚情報は、単一の静止画、複数の画像、あるいは動画であってもよく、さらには深度情報を含むことが好ましい。制御装置３００は、送信された視覚情報を記憶ユニット３４０に保存し得る。

　次に、制御装置３００のプロセッサ３２０が、その視覚情報に基づいて、作業機械１００，１６０の周囲環境を再現した仮想世界（シミュレーション空間）を生成し、制御装置３００のディスプレイ３７０に表示する（図４のステップＳ４１０）。仮想世界では、現実世界における作業機械１００，１６０の周囲環境が表示される。

　なお、作業機械１００，１６０はシステム１の一要素であり、作業機械１００，１６０の各部の構成及び機能はシステム１において既知であり、それらの情報は記憶ユニット２４０および／または記憶ユニット３４０に記憶されている。例えば、第１の作業機械（ショベルカー）１００の移動体１１０の特性（各部寸法、最小回転半径、平均移動速度等）、旋回体１２０の特性（各部寸法、平均移動速度、回転半径等）および作業体１３０の特性（各部寸法、平均動作速度、可能作業範囲等）と、第２の作業機械（ダンプトラック）１６０の移動体１７０の特性（各部寸法、最小回転半径、平均移動速度等）および荷台１７５の特性（各部寸法、可動領域）等が記憶ユニット２４０および／または記憶ユニット３４０に記憶されている。プロセッサ３２０は、現実世界の作業機械１００，１６０に対応する仮想作業機械１００_ｖｒ，１６０_ｖｒを仮想世界中に表示する。

　図５は、現実世界の作業機械の周囲環境を再現した仮想世界を示す図である。

　ディスプレイ３７０上の仮想世界において、第１の作業機械（ショベルカー）１００をオブジェクト化して表示した第１の仮想作業機械１００_ｖｒの仮想バケット１３４＿ｖｒをトラッカー３５０で操作して、仮想バケット１３４＿ｖｒを動かすことが可能である。例えば、仮想バケット１３４＿ｖｒをトラッカーでポインティングしてトリガーボタンを押すことで、その仮想バケット１３４＿ｖｒを動かすことが可能である。図５には、仮想世界内の第１の仮想作業機械の仮想作業体の仮想アーム１３２＿ｖｒ及び仮想バケット１３４＿ｖｒが示されている。また図５には、仮想アーム１３２＿ｖｒ及び仮想バケット１３４＿ｖｒとともに、現実世界の第１の作業機械１００の状態を示すモデルＭと、トラッカー３５０に対応する仮想トラッカー３５０＿ｖｒが示されている。

　また、ディスプレイ３７０上の仮想世界において、土を掘る領域と、掘った土を廃棄する領域とをそれぞれトラッカーで指定することが可能である。

　上記のような入力デバイス３５０を用いた仮想世界内での仮想作業機械の操作及び領域指定の操作、およびそれらのディスプレイ３７０上での表示は、プロセッサ３２０によって制御される。

　次に、仮想世界においてユーザが入力デバイス３５０を用いて、ディスプレイ３７０上の仮想世界内において下記に説明する操作を行うことにより、作業機械１００，１６０に実行させるタスクを指示する（図４のステップＳ４１５）。本例では、環境中の領域１の土を掘って、領域２へ廃棄するタスクを作業機械１００，１６０に実行させる。

　図６は、現実世界の作業機械の周囲環境を再現した仮想世界を示す図である。図６に示すように、ディスプレイ３７０上の仮想世界内には、作業機械１００，１６０が存在する現実世界の作業機械１００，１６０の周囲環境が再現されている。

　まず、図６（ａ）に示すように、ディスプレイ３７０上の仮想世界の環境中において、ユーザがトラッカー３５０（図６（ａ）にはこれに対応する仮想トラッカー３５０＿ｖｒが表示されている）を用いて、ＵＩ画面において「自動モード」を選択した後に、土の掘削を行う地面の領域の上方で、希望する領域面積及び深さを成す立方体を描画し、トラッカー３５０の所定のボタンを押すなどしてこれを掘削領域として確定する。これにより、プロセッサ３２０は、土の掘削を行う地面の領域１の位置、領域および深さ（すなわち掘削すべき土の容積）を特定する。続いて、これと同様に、図６（ｂ）に示すように、ディスプレイ３７０上の仮想世界の環境中において、トラッカー３５０（図６（ｂ）にはこれに対応する仮想トラッカー３５０＿ｖｒが表示されている）を用いて、掘削した土の廃棄を行う地面の領域の上方で、希望する領域面積及び高さを成す立方体を描画し、トラッカー３５０の所定のボタンを押すなどしてこれを廃棄領域として確定する。これにより、プロセッサ３２０は、土の廃棄を行う地面の領域２の位置、領域および高さを特定する。

　これらの入力操作により、環境中の領域１の指定容積分の土を掘って、その土を環境中の領域２の上に廃棄するタスクの指示がなされる。このとき、そのタスクの実行に用いられるエージェント（本例では、第１及び第２の作業機械１００，１６０）をディスプレイ３７０上のＵＩ画面を通じて選択してもよい。特に選択を行わない場合は、システム１に存在するすべてのエージェントが自動的に選択されるようにしてもよい。本例では、第１作業機械１００がエージェント１として、第２の作業機械１６０がエージェント２として選択されたものとして説明する。これらの入力操作は、下記に示す入力情報として制御装置３００の記憶ユニット３４０に記憶される。
　　意図（ソース（Ｓｏｕｒｃｅ））－領域１－目的：掘削
　　意図（シンク（Ｓｉｎｋ））　　－領域２－目的：廃棄
　　エージェント１－第１の作業機械（ジャベルカー）
　　エージェント２－第２の作業機械（ダンプトラック）

　なお、上記の「領域１」及び「領域２」は、各領域の位置、領域および容積に関する情報を含んでいる。

　次に、記憶ユニット３４０に記憶された入力操作に基づいて、制御ユニット２００に送信する制御信号をプロセッサ３２０によって生成する（図４のステップＳ４２０）。なお、前提として、制御装置３００の記憶ユニット３４０には、各エージェント１，２が備えるスキルに関する情報が表１に示すデータ構造に格納されている。

　上記表における容積は、本例では、ショベルカーのバケットの容積を１としたとき、ダンプトラックの荷台の容積はその２倍である（すなわち、ダンプトラックはショベルカーによる２回の掘削作業分の容積の土を積載可能である）ことを示している。また、上記表における速度は、ショベルカーの平均移動速度を１としたとき、ダンプトラックの平均移動速度はその２倍であるであることを示している。

　なお、記憶されたスキル情報には、異なるエージェントにそれぞれ備えられた同じスキルが含まれることがあり（表１のスキル＃５と＃９）、また、指示されたタスクに使用されないスキルやエージェントが含まれていることがある（表１の＃１１及び＃１２）。表１に示す各エージェント１，２が備えるスキルに関する情報は一例であり、記憶されるスキル情報の内容はこれに限定されるものではない。

　以下、この制御信号を生成するプロセスを図７に示すフローチャートを参照しながら説明する。

　最初に、プロセッサ３２０は、入力情報に含まれる意図のタスクを達成するために必要なすべてのスキルを選択する（図７のステップＳ７０５）。このステップにおいて、プロセッサ３２０はまず最初に、記憶ユニット３４０に記憶された表１のデータから、入力情報に含まれる意図（掘削および廃棄）に対応する下記スキルを選択する。
　　＃７掘削（ショベルカー）
　　＃３廃棄（ダンプトラック）
　　＃６廃棄（ショベルカー）

　次に、プロセッサ３２０は、上記選択した各スキルの従属スキル情報に基づいて、上記選択した各スキルを実行するために必要なスキルを選択する。

・スキル＃７掘削（ショベルカー）：この従属スキルは「ショベルカー移動」であるので、スキル＃４ショベルカー移動（ショベルカー）が選択される。スキル＃４の従属スキルは無いため、スキル＃７の実行に必要なスキル選択はここで終了する。ここで選択されたスキルは下記の通りである。
　　＃４ショベルカー移動（ショベルカー）

・スキル＃３廃棄（ダンプトラック）：この従属スキルは「トラック搬送」であるので、スキル＃２トラック搬送（ダンプトラック）が選択される。次に、スキル＃２の従属スキルは「積込み」であるので、スキル＃８積込み（ショベルカー）が選択される。次に、スキル＃８の従属スキルは「掘削＋トラック移動」であるので、スキル＃７掘削（ショベルカー）とスキル＃１トラック移動（ダンプトラック）が選択される。次に、スキル＃７の従属スキルは「ショベルカー移動」であるので、スキル＃４ショベルカー移動（ショベルカー）が選択される。スキル＃４の従属スキルは無いため、スキル＃７の実行に必要なスキル選択はここで終了する。次に、次に、スキル＃１の従属スキルは「ショベルカー移動」であるので、スキル＃４ショベルカー移動（ショベルカー）が選択される。スキル＃４の従属スキルは無いため、スキル＃１の実行に必要なスキル選択はここで終了する。ここで選択されたスキルは下記通りである。
　　＃２トラック搬送（ダンプトラック）
　　＃８積込み（ショベルカー）
　　＃７掘削（ショベルカー）
　　＃１トラック移動（ダンプトラック）
　　＃４ショベルカー移動（ショベルカー）
　　＃４ショベルカー移動（ショベルカー）

・＃６廃棄（ショベルカー）：この従属スキルは「ショベルカー搬送＋掘削」であるので、スキル＃５ショベルカー搬送（ショベルカー）とスキル＃７掘削（ショベルカー）が選択される。なお、表１のデータには「ショベルカー搬送」としてスキル＃５と＃９が含まれるため、＃５の代わりに＃９が選択されてもよいし、それら両方が選択されてもよい。ここでは、スキル＃５が選択されたケースについて説明する。次に、スキル＃５の従属スキルは「掘削」であるので＃７掘削（ショベルカー）が選択され、さらにその従属スキル＃４ショベルカー移動（ショベルカー）が選択される。スキル＃４の従属スキルは無いため、スキル＃７の実行に必要なスキル選択はここで終了する。続いて、スキル＃７の従属スキル＃４ショベルカー移動（ショベルカー）が選択される。ここで選択されたスキルは下記通りである。
　　＃５ショベルカー搬送（ショベルカー）
　　＃７掘削（ショベルカー）
　　＃７掘削（ショベルカー）
　　＃４ショベルカー移動（ショベルカー）
　　＃４ショベルカー移動（ショベルカー）
　上記のように選択されたスキルは制御装置３００の記憶ユニット３４０に記憶される。

　次に、プロセッサ３２０により、ステップＳ７０５において上記のように選択されたスキルのうち重複するスキルを削除する（図７のステップＳ７１０）。これにより、下記のスキル・リストが生成され、制御装置３００の記憶ユニット３４０に記憶される。
　　＃１トラック移動（ダンプトラック）
　　＃２トラック搬送（ダンプトラック）
　　＃３廃棄（ダンプトラック）
　　＃４ショベルカー移動（ショベルカー）
　　＃５ショベルカー搬送（ショベルカー）
　　＃６廃棄（ショベルカー）
　　＃７掘削（ショベルカー）
　　＃８積込み（ショベルカー）

　次に、タスクを実行するためのスケジュールを生成する（図７のステップＳ７１５）。

　最初に、プロセッサ３２０は選択肢として複数のタスク・ツリーを生成する。まず、プロセッサ３２０は「意図（シンク）」に対応するスキル「廃棄」をルート・ノードとして選択する。
　　＃３廃棄（ダンプトラック）
　　＃６廃棄（ショベルカー）

　次に、プロセッサ３２０は、各スキルに従属するスキルを順次追加し、タスク・ツリーを生成する。生成した各タスク・ツリーは記憶ユニット３４０に記憶される。
１）＃３廃棄（ダンプトラック）－＃２トラック搬送－＃８積込み－＃１トラック移動－＃７掘削－＃４ショベルカー移動
２）＃６廃棄（ショベルカー）－（＃５ショベルカー搬送－＃７掘削－＃４ショベルカー移動）／（＃７掘削－＃４ショベルカー移動）

　ここでプロセッサ３２０は、掘削する領域１の容積に基づき、上記各タスク・ツリーのスキル動作をそれぞれ何回繰り返す必要があるかを計算する。

　なお、上記タスク・ツリーの表記において、例えばツリー２）中の「（＃５ショベルカー搬送－＃７掘削－＃４ショベルカー移動）／（＃７掘削－＃４ショベルカー移動）」は、＃６廃棄（ショベルカー）に従属するスキルが、「＃５ショベルカー搬送－＃７掘削－＃４ショベルカー移動」と「＃７掘削－＃４ショベルカー移動」とに分かれることを示している。

　次に、プロセッサ３２０は、仮想世界中に再現された各仮想作業機械１００＿ｖｒ，１６０＿ｖｒの位置及び各領域１，２の位置（すなわちそれらの距離関係）と、表１に示すデータに含まれる各スキルの動作速度とに基づき、上記のタスク・ツリー１）および２）のそれぞれに要する予測所要時間を計算する（図７のステップＳ７２０）。タスク・ツリーの予測所要時間は、ツリーの各スキルの所要時間を積算することで計算することができる。計算された各ツリーの予測所要時間は記憶ユニット３４０に記憶される。

　次に、プロセッサ３２０は、上記のように計算された各タスク・ツリーの予測所要時間の中から、最も時間が少ないタスク・ツリーから候補スケジュールを取得する（図７のステップＳ７２５）。例えば、掘削する領域１と廃棄する領域２とが近接していて、領域１から掘削した土をショベルカーが旋回するだけで領域２に廃棄できるシナリオでは、ダンプトラックに積込んで搬送するよりもショベルカー自身が掘削と廃棄とを繰り返した方が所要時間が短い。一方、掘削する領域１と廃棄する領域２とが離れているシナリオでは、ショベルカーが掘削した土をバケットに載せた状態で領域１と領域２との間を移動して廃棄する動作を繰り返すよりも、一定量の土をまとめてダンプトラックに積込んで搬送した方が所要時間が短くなる。本例では、タスク・ツリー１）の「＃３廃棄（ダンプトラック）－＃２トラック搬送－＃８積込み－＃１トラック移動－＃７掘削－＃４ショベルカー移動」のタスク・ツリーが最も所要時間が少ないものとして選択されるものとする。候補スケジュールは、このツリーを逆順に辿ることで、「＃４ショベルカー移動－＃７掘削－＃１トラック移動－＃８積込み－＃２トラック搬送－＃３廃棄（ダンプトラック）」のように取得することができる。

　次に、プロセッサ３２０は、取得した候補スケジュールが、意図（ソース：掘削）から意図（シンク：廃棄）を行うためのパスを備えているどうかを判断する（図７のステップＳ７３０）。本例において上記のように選択された候補スケジュールのパスは「＃４ショベルカー移動－＃７掘削－＃１トラック移動－＃８積込み－＃２トラック搬送－＃３廃棄（ダンプトラック）」であり、「掘削」と「廃棄」を含むので、次のステップＳ７３５へ進む。一方、取得した候補スケジュールが意図（ソース：掘削）から意図（シンク：廃棄）を行うためのパスを備えていないと判断した場合はステップＳ７２５に戻り、２番目に予測所要時間が少ないスケジュールを候補スケジュールとして取得する。このようにして、意図（ソース：掘削）から意図（シンク：廃棄）を行うためのパスを備えているスケジュールの中で、最も予測所要時間が少ないスケジュールを候補スケジュールとして取得する。

　なお、表１に示すデータ構造に格納される、各エージェント１，２が備えるスキルに関する情報には、各スキルのエネルギー消費率（燃料消費率、電力消費率など）が含まれていてもよい。スキルに関する情報としてエネルギー消費率を備えている場合には、各スキルの実行に要する積算された予測消費エネルギーが最も少ないタスク・ツリーを選択するようにしてもよいし、予測所要時間と予測消費エネルギーとの兼ね合いにおいて最適なタスク・ツリーを選択するようにしてもよい。

　次に、プロセッサ３２０は、掘削を行うと指定された領域１を、単一のタスクによって処理されるユニットに分割する（図７のステップＳ７３５）。本例では、掘削を行うと指定された領域１を、ショベルカーのバケットによる複数の掘削領域に分割する。本例では、掘削を行う領域１の容積がショベルカーのバケットの容積の４倍であるとすると、領域１は４つの掘削領域に分割される。

　次に、プロセッサ３２０は、領域１の掘削と、その土を廃棄するために各タスクを実行すべき回数Ｎを算出し、スケジュールを展開（ｕｎｒｏｌｌ）する（図７のステップＳ７４０）。

　本例では、掘削を行う領域１の容積がショベルカーのバケットの容積の４倍であるので、バケットによる掘削動作は４回であると算出される。また、ダンプトラックの荷台にはバケット２杯分の土を積載可能であるので、ダンプトラックの搬送動作は２回であると算出される。したがって、実行すべきスケジュールは下記のように記述される。なお、下記スケジュールにおいて［］内の数字はそのタスク動作の実行回数を示している。
　　＃４ショベルカー移動［４］－＃７掘削［４］－＃１トラック移動［４］－＃８積込み［４］－＃２トラック搬送［２］－＃３廃棄（ダンプトラック）［２］

　第１段階として、上記スケジュールは下記のように展開される。

　　＃４ショベルカー移動［２］－＃７掘削［２］－＃１トラック移動［２］－＃８積込み［２］－＃２トラック搬送［１］－＃３廃棄（ダンプトラック）［１］－＃４ショベルカー移動［２］－＃７掘削［２］－＃１トラック移動［２］－＃８積込み［２］－＃２トラック搬送［１］－＃３廃棄（ダンプトラック）［１］

　これは、「＃４ショベルカー移動［２］－＃７掘削［２］－＃１トラック移動［２］－－＃８積込み［２］－＃２トラック搬送［１］－＃３廃棄（ダンプトラック）［１］」を２回繰り返すことを意味する。

　続いて第２段階として、上記スケジュールは下記のように展開される。

　　＃４ショベルカー移動［１］－＃７掘削［１］－＃１トラック移動［１］－＃８積込み［１］－＃４ショベルカー移動［１］－＃７掘削［１］－＃１トラック移動［１］－＃８積込み［１］－＃２トラック搬送［１］－＃３廃棄（ダンプトラック）［１］－＃４ショベルカー移動［１］－＃７掘削［１］－＃１トラック移動［１］－＃８積込み［１］－＃４ショベルカー移動［１］－＃７掘削［１］－＃１トラック移動［１］－＃８積込み［１］－＃２トラック搬送［１］－＃３廃棄（ダンプトラック）［１］

　これは、「＃４ショベルカー移動［１］－＃７掘削［１］－＃１トラック移動［１］－＃８積込み［１］を２回繰り返した後に＃２トラック搬送［１］－＃３廃棄（ダンプトラック）［１］を行う」ことを２回繰り返すことを意味する。

　次に、プロセッサ３２０は、ステップＳ７４０で展開したスケジュールのクリーンアップを行う（図７のステップＳ７４５）。スケジュールのクリーンアップは、所要時間がゼロの動作タスク、すなわち、エージェントが移動したり実行したりする必要がない動作タスクを省略することで行われる。所要時間がゼロの動作タスクは、例えば以下のような動作である。

・ショベルカーが所定の掘削位置に移動した後、全ての掘削動作をその位置で行うことができる場合には、ショベルカーが一度掘削位置に移動した後は、その後の移動は必要ない（移動所要時間はゼロ）になるので、その後のショベルカー移動の動作タスクは省略することができる。

・ステップＳ７３５において領域１を４つの掘削領域に分割した結果、一番目の掘削領域が地面の上方の領域（空中）に位置する場合には、そこから掘削すべき土は存在しないので、一番目の掘削領域を掘削する動作タスクは省略することができる。

・ダンプトラックの荷台にはバケット２杯分の土を積載できるので、２回目の積込みの前にはトラック移動は不要（トラック移動の所要時間ゼロ）となるため、２回目の積込みの前のトラック移動の動作タスクは省略することができる。

　したがって、ステップＳ７４０で展開したスケジュールのうち、下記の｛｝で示した動作タスクが削除される。

　　＃４ショベルカー移動［１］－｛＃７掘削［１］｝－＃１トラック移動［１］－＃８積込み［１］－｛＃４ショベルカー移動［１］｝－＃７掘削［１］－｛＃１トラック移動［１］｝－＃８積込み［１］－＃２トラック搬送［１］－＃３廃棄（ダンプトラック）［１］－｛＃４ショベルカー移動［１］｝－＃７掘削［１］－＃１トラック移動［１］－＃８積込み［１］－｛＃４ショベルカー移動［１］｝－＃７掘削［１］－｛＃１トラック移動［１］｝－＃８積込み［１］－＃２トラック搬送［１］－＃３廃棄（ダンプトラック）［１］

　したがって、スケジュールは下記のようになる。

　　＃４ショベルカー移動［１］－＃１トラック移動［１］－｛＃８積込み［１］｝－＃７掘削［１］－＃８積込み［１］－＃２トラック搬送［１］－＃３廃棄（ダンプトラック）［１］－＃７掘削［１］－＃１トラック移動［１］－＃８積込み［１］－＃７掘削［１］－＃８積込み［１］－＃２トラック搬送［１］－＃３廃棄（ダンプトラック）［１］

　続いて、削除された動作タスクに従属する動作タスクを削除する。本例では、上記中の｛＃８積込み［１］｝の動作タスクが、その前に存在していた掘削動作タスクが削除されたため、削除される。よって、上記スケジュールは下記のようになる。

　　＃４ショベルカー移動［１］－＃１トラック移動［１］－＃７掘削［１］－＃８積込み［１］－＃２トラック搬送［１］－＃３廃棄（ダンプトラック）［１］－＃７掘削［１］－＃１トラック移動［１］－＃８積込み［１］－＃７掘削［１］－＃８積込み［１］－＃２トラック搬送［１］－＃３廃棄（ダンプトラック）［１］

　次に、連続する同一の動作タスクが存在する場合には重複するものを削除する。本例では連続する同一の動作タスクは存在しないので、ここで削除される動作タスクはない。

　このようにして、制御ユニット２００に送信する制御信号として、「＃４ショベルカー移動［１］－＃１トラック移動［１］－＃７掘削［１］－＃８積込み［１］－＃２トラック搬送［１］－＃３廃棄（ダンプトラック）［１］－＃７掘削［１］－＃１トラック移動［１］－＃８積込み［１］－＃７掘削［１］－＃８積込み［１］－＃２トラック搬送［１］－＃３廃棄（ダンプトラック）［１］」の一連の動作タスクを含むスケジュールが生成される。

　このように生成されたスケジュールは、図８に示すように、有向非巡回グラフ（ＤＡＧ:Ａｃｙｃｌｉｃ　Ｄｉｒｅｃｔｅｄ　Ｇｒａｐｈ）で表現することができる。図８のＤＡＧにおいて、上から２つの掘削の動作タスクはトラック移動タスクとは独立して実行可能であることを示している。したがって、それら２つの掘削タスクはトラック移動タスクの実行中に同時並行で実行することが可能である。
　なお、スケジュールはこの他にもビヘイビア・ツリー（Ｂｅｈａｖｉｏｒ　Ｔｒｅｅ）等の他のフォーマットで表現することができる。

　プロセッサ３２０は、このように制御信号を生成した後、記憶ユニット３４０に記憶されている各作業機械１００，１６０の各部特性を参照して、上記スケジュールを実行するための各仮想作業機械の動作を仮想世界内でシミュレートしてもよい。これにより、現実世界において各作業機械１００，１６０が想定通りに動作してスケジュールを実行することができるかどうかを予め確認することができる。例えば、プロセッサ３２０は、ショベルカーが領域１の掘削を行うためにどの位置に移動するか、トラックの荷台に土を積込むためにダンプトラックをショベルカーに対してどの位置に移動させるか、トラックの荷台の土を領域２に廃棄するためにトラックをどの位置に移動させるか、などを予めシミュレートすることができる。

　次に、プロセッサ３２０によって生成した制御信号を制御装置３００から制御ユニット２００に送信する（図４のステップＳ４２５）。

　次に、制御信号を受信した制御ユニット２００は、受信した制御信号と、記憶ユニット２４０に記憶された作業機械１００，１６０の各部の構成及び機能に関する情報と、作業機械１００，１６０の環境センサ１４０，１８０で検出した周囲環境情報とに基づいて各作業機械１００，１６０のモーション・プランニングを行い、各作業機械１００，１６０に実行させる動作命令を生成し、各作業機械１００，１６０にその動作命令を実行させる（図４のステップＳ４３０）。制御ユニット２００は、例えば、第１の作業機械（ショベルカー）１００を領域１の掘削を行う位置に移動させるための移動、第１の作業機械（ショベルカー）１００が領域１の各掘削領域を掘削するための作業体１３０の動作、第１の作業機械（ショベルカー）１００が第２の作業機械（ダンプトラック）１６０の荷台１７５に土を積込むための作業体１３０の動作等、第１の作業機械（ショベルカー）１００及び第２の作業機械（ダンプトラック）１６０が各動作タスクを実行するためのモーション・プランニングを行い、それらを実行する動作命令を生成する。これにより、各作業機械１００，１６０は指示されたスケジュールの各動作タスクを実行する。なお、制御ユニット２００は環境センサ１４０，１８０で検出した周囲環境情報を参照して各作業機械１００，１６０のモーション・プランニングを行うので、仮想世界内の環境と現実世界の環境とに際が生じている場合には、制御ユニット２００に生成される動作命令の内容は、制御装置３００のプロセッサ３２０が仮想世界においてシミュレートした動作内容とは異なる可能性がある。

　図９は、各作業機械が実行命令に従って動作している様子を示す図である。

　図９（ａ）は、ショベルカー（第１の作業機械１００）が図８のショベルカー移動８０５の後に掘削８２０を実行している様子を示している。この間にダンプトラック（第２の作業機械１６０）がショベルカー横の積込み位置に移動する（図８のトラック移動８１５）。図９（ｂ）はダンプトラックの荷台１７５にショベルカーが掘削した土を荷積みしている様子を示している（図８の荷積み８２５）。その後、ダンプトラックが廃棄領域まで土を搬送し（図８のトラック搬送８３０）、図９（ｃ）に示すようにダンプトラックの荷台１７５を上げて積載していた土を廃棄領域に廃棄する（図８の廃棄（トラック）８３５）。エージェントである作業機械１００，１６０は、図８に表現されるようなスケジュールをこのようして実行する。

　各作業機械１００，１６０がタスクを実行している間、あるいはタスクを実行した後に、その実行結果を検知するために環境センサ１４０，１６０で周囲環境を検出し、周囲環境情報を制御ユニット２００へ送信する（図４のステップＳ４３５）。その周囲環境情報は記憶ユニット２４０に記憶される。さらには、周囲環境情報は制御装置３００へ送信されて記憶ユニット３４０に記憶されてもよい。また、受信した制御信号及び生成した動作命令も記憶ユニット２４０に記憶して蓄積することができ、それらを制御装置３００へ送信して記憶ユニット３４０に記憶して蓄積してもよい。

　制御ユニット２００のプロセッサ２２０は、動作命令に従って各作業機械１００，１６０がタスクを実行している間に環境センサ１４０，１８０で検出された周囲環境情報からタスク実行中の各オブジェクトの状況を監視し、状況に応じて実行中の動作に変更を加えることも可能である。

　プロセッサ２２０は、任意の機械学習アルゴリズムやＡＩ技術を用いて、制御装置３００から受信した制御信号及びプロセッサ２２０が生成した動作命令と、タスク実行後の周囲環境情報とを比較して学習することで、生成する動作命令の質を高めることが可能である。プロセッサ２２０は、動作命令の生成・実行と、その結果とを蓄積し、それらを学習することで、例えば、より失敗の可能性の少ない動作、より運動量が少ない動作を選択できるようになる。

　一方、それらの情報が制御装置３００に送信される場合には、制御装置のプロセッサ３２０で学習することもできる。この場合、プロセッサ３２０が制御信号を生成する際に学習結果を考慮することもできる。さらには、タスク実行結果を見たユーザが、次に仮想世界で入力操作を行う際の改善に活用することも可能である。制御ユニット２００と制御装置３００とは、制御ユニット２００での学習結果のデータと、制御装置３００での学習結果のデータとを相互に交換して共有してもよい。

　以上により、本動作例における制御方法が終了する。

　以上説明したように、本実施形態によれば、ユーザが作業機械１００，１６０に実行させたいタスク（本例では領域１の土を領域２に廃棄するタスク）の指示動作が、制御装置３００の仮想世界内でユーザが各領域の領域指定入力を行うことで行われ、そのタスクを実行するためのスケジュールを含む制御信号が生成される。そして、その制御信号を受信した制御ユニット２００が、受信した制御信号と作業機械１００，１６０の周囲環境情報とに基づいて各作業機械１００，１６０のモーション・プランニングを行い、各作業機械１００，１６０の動作指令を生成し、各作業機械１００，１６０に実行させる。これにより、作業機械１００，１６０はユーザが指示したタスク（領域１の土を領域２に廃棄する）を自律的に実行する。本実施形態によれば、各作業機械１００，１６０が実行すべき動作指令がまとめて送信され、各作業機械１００，１６０がそれに基づいて自律的に動作するので、通信に遅延が生じる環境にある作業機械でも、ユーザの意図に沿った動作を行わせることができる。

　さらに、本実施形態によれば、仮想世界内でユーザが直感的に操作指示を行うことができるため、従来のように遠隔操作のオペレータが操作桿を操作して作業機械を遠隔操作することに比べて、作業効率を大幅に向上でき、かつオペレータの負担を低減することができる。さらに、上記のような従来の遠隔操作では１人のオペレータが遠隔操作を行うことができるのは１台の作業機械に限られるが、本実施形態によれば複数台・複数種類の作業機械を協働させるように遠隔操作することができる。

　なお、本実施形態の説明では作業機械の形態としてショベルカーとダンプトラックを例示したが、本発明によって遠隔操作される作業機械の形態はこれらのものに限られない。他の作業機械として、ホイールローダー、ブルドーザー、クレーン、粉砕・把持等の動作を行うアタッチメントを備えた建機等を用いることもできる。さらには、エージェントは建設機械の形態に限られず、例えば、ハンドを有するアームを備えたロボットの形態を備えたものであってもよい。また、本実施形態のシステムを用いて動作させることができる作業機械が使用される環境や用途としては、本実施形態で説明したものの他、宇宙開発、採鉱、採掘、資源採取、農業、林業、水産業、畜産業、捜索救助、災害支援、災害復旧、人道支援、爆発物処理、経路上における障害の除去、災害監視用、防犯監視等の多種多様な環境や用途がある。
［第２の動作例］

　図５を参照して説明したように、本実施形態のシステム１によれば、ディスプレイ３７０上の仮想世界において、エージェントとしての第１の作業機械（ショベルカー）１００をオブジェクト化して表示した第１の仮想作業機械１００_ｖｒの仮想バケット１３４＿ｖｒをトラッカーで操作して、仮想バケット１３４＿ｖｒを動かすことが可能である。例えば、操作対象のエンドエフェクタとして第１の作業機械（ショベルカー）１００のバケット１３４を操作する場合には、そのエンドエフェクタに対応する仮想エンドエフェクタである仮想バケット１３４＿ｖｒをトラッカーでポインティングしてトリガーボタンを押すことで、その仮想バケット１３４＿ｖｒを動かすことが可能である。そして、トラッカーを操作して仮想バケットを動かして、仮想世界内に表示されている環境中の地面の土を掘る動作を行うことができる。

　本実施形態のシステム１によれば、各作業機械１００，１６０が存在する現実世界の制御ユニット２００と、ユーザ（オペレータ）側の制御装置３００との間の通信遅延がリアルタイム遠隔操作の妨げにならない程度に少ない場合には、制御装置３００側でユーザが入力操作した動作指示の制御指令を制御ユニット２００へ即時送信して各作業機械１００，１６０を動作させ、その間に環境センサ１４０，１８０でセンシングされた周囲環境の情報を制御ユニット２００から制御装置３００へ即時送信して、ディスプレイ３７０でユーザに提示するようにすることで、いわゆるリアルタイム遠隔操作を行うことも可能である。

　仮想世界内の第１の仮想作業機械と、現実世界の第１の作業機械（ショベルカー）１００とを同期させて動作させる場合には、ユーザがトラッカーを操作して仮想世界内で仮想バケットバケット１３４＿ｖｒで仮想世界内に表示されている環境中の地面の土を掘る動作を行うことで、現実世界の第１の作業機械（ショベルカー）１００が現実世界内の対応する位置まで移動し、ユーザがトラッカーを操作して仮想世界内で仮想バケット１３４＿ｖｒを動かしたのと同様の動きを再現するように第１の作業機械（ショベルカー）１００の作業体１３０（アーム１３２及びバケット１３４）が動作して、土を掘る動作を行う。上述したように、作業機械１００，１６０の各部の構成及び機能はシステム１において既知であり、それらの情報は記憶ユニット２４０および記憶ユニット３４０に記憶されているので、制御ユニット２００のプロセッサ２２０は、その情報を参照することにより、ユーザがトラッカーを操作して仮想世界内で仮想バケット１３４＿ｖｒを動かした動作を作業機械１００の作業体１３０が再現するためのモーション・プランニングを行い、作業機械１００を動作させることができる。

　図１０は、ユーザが仮想世界内で第１の仮想作業機械の仮想バケットを操作する様子を示す図である。

　図１０には、仮想世界内の第１の仮想作業機械の仮想作業体１３０＿ｖｒ（仮想アーム１３２＿ｖｒ及び仮想バケット１３４＿ｖｒ）が示されている。この図１０には、仮想作業体１３０＿ｖｒとともに、現実世界の第１の作業機械１００の状態を示すモデルＭが示されている。第１の作業機械１００のモデルＭは、環境センサ１４０，１８０から得られる情報等に基づいて生成することができる。

　本例では、制御装置３００は、ユーザがトラッカー３５０を用いてＵＩ画面において「マニュアル・モード」を選択してから、ユーザがトラッカー３５０を用いて仮想バケット１３４＿ｖｒを指示して所定ボタンを押すと、図１０（ａ）に示すように、仮想バケット１３４＿ｖｒの先端付近に球体Ｓが表示されるように構成されている。これによりシステム１は、ユーザがトラッカー３５０を用いてその球体Ｓを操作して仮想バケット１３４＿ｖｒを動かすことで、現実世界の第１の作業機械１００をリアルタイムに操作することが可能な「マニュアル・モード」になる。

　そして、図１０（ｂ）にユーザがトラッカー３５０を用いて球体Ｓを操作して仮想バケット１３４＿ｖｒで地面の土を掘るような動作を行うと、その制御指令が制御装置３００から制御ユニット２００に即時送信され、現実世界の作業機械１００の作業体１３０（アーム１３２及びバケット１３４）がその動きを再現するように動作する。図１０（ｂ）において、作業機械のモデルＭのバケットが仮想バケット１３４＿ｖｒに追従している様子が示されている。

　従来の遠隔操作技術では、第１の作業機械（ショベルカー）１００の操作はオペレータが遠隔操作装置の操作桿を操作して行うため一定の熟練度が求められるが、本実施形態による遠隔操作装置によればトラッカーを用いて仮想世界内で直感的に仮想バケットを動かすだけで、現実世界の第１の作業機械（ショベルカー）１００を操作することができる。

　なお、本例では操作対象のエージェントのエンドエフェクタとして第１の作業機械（ショベルカー）１００のバケット１３４を操作する例を挙げて説明したが、本実施形態のシステム１によって上記のような「マニュアル・モード」で操作できるエンドエフェクタはこれに限られない。例えば、作業機械であれば、ホイールローダーのバケット、ブルドーザーのバケット、クレーンのフック、粉砕・把持等の動作を行うアタッチメントを備えた建機等のアタッチメントを操作対象のエンドエフェクタとする場合には、それらに対応する仮想エンドエフェクタを仮想世界内でトラッカー３５０を用いて操作することができる。また、エージェントとしてロボットを操作する場合には、ロボットハンドが備えるロボットハンドを操作対象のエンドエフェクタとして、それに対応する仮想ロボットハンドを仮想世界内でトラッカー３５０を用いて操作することができる。
［第３の動作例］

　図６等を参照して説明した上記の第１の動作例では、ユーザがトラッカー３５０を用いて、ＵＩ画面において「自動モード」を選択した後に、土の掘削を行う地面の領域の上方で、希望する領域面積及び深さを成す立方体を描画してこれを掘削領域（領域１）として指定し、同様に、掘削した土の廃棄を行う地面の領域の上方で、希望する領域面積及び高さを成す立方体を描画してこれを廃棄領域（領域２）として指定する入力操作により、環境中の領域１の指定容積分の土を掘って、その土を環境中の領域２の上に廃棄するタスクの指示がなされる。このような「自動モード」での入力操作は、比較的広い範囲の領域をおおまかに指定することが容易にできる一方で、ショベルカー１００のバケット１３４で掘削を行う地点を具体的に特定して指示することには対処していない。

　図１１は、ユーザが仮想世界内で掘削領域及び廃棄領域を指定する入力操作を示す図である。

　図４に示すフローチャートを参照して説明した第１の動作例のステップＳ４１５のプロセスに対応するプロセスとして、本例ではまず、ディスプレイ３７０上の仮想世界の環境中において、ユーザがトラッカー３５０（図１１（ａ）にはこれに対応する仮想トラッカー３５０＿ｖｒが表示されている）を用いて、ＵＩ画面において「半自動モード」を選択した後に、図１１（ａ）及び（ｂ）に示すように、土の掘削を行う地面の１つまたは２つ以上の任意の数の所望の掘削地点を指定する。図１１（ａ）は１つ目の掘削地点を指定した状態を示し、図１１（ｂ）はその後４つ目までの掘削地点を指定し終えた状態を示している。これらの掘削地点は、ディスプレイ３７０上において例えば青色の球体として表示される。これによりプロセッサ３２０は、１つまたは２つ以上の掘削地点からなる、土の掘削を行う地面の領域１を特定する。図１１に示す例では、領域１は４つの掘削地点からなる。本例では、各々の掘削地点について掘削すべき土の容積は、ショベルカーのバケットの容積と同じ容積とされる。ただし、各々の掘削地点について掘削すべき土の容積はこれに限られず、例えば、ショベルカーのバケットの容積の２倍、３倍のように任意の容積に設定することが可能である。

　続いて、これと同様に、図１１（ｃ）に示すように、ユーザがディスプレイ３７０上の仮想世界の環境中において、トラッカー３５０（図１１（ｂ）にはこれに対応する仮想トラッカー３５０＿ｖｒが表示されている）を用いて、掘削した土の廃棄を行う廃棄領域を指定する。これにより、プロセッサ３２０は、土の廃棄を行う地面の領域２を特定する。本例では、この廃棄領域は例えば赤色の球体として表示される。

　これらの入力操作により、環境中の領域１を成す１つまたは２つ以上の掘削地点の土を掘って、その土を環境中の領域２の上に廃棄するタスクの指示がなされる。

　本例におけるその他のプロセスは、図４及び図７を参照して説明した第１の動作例における各プロセスと同様である。ただし、第１の動作例では範囲指定した掘削領域１の容積に基づいてバケットによる掘削動作の回数を算出する工程が含まれるが（図７のステップ７４０）、本例では各々の掘削地点について掘削すべき土の容積をショベルカーのバケットの容積と同じ容積としており、指定された掘削地点の数がバケットによる掘削動作の回数に相当するため、バケットによる掘削動作の回数を算出する工程は省略される。また本例では、制御装置３００のプロセッサ３２０（図１参照）は、ユーザが掘削地点を指定した順番で各掘削地点の掘削作業を行うようにスケジュールを生成してもよく、あるいは、一連のタスクからなるスケジュールに要する予測所要時間あるいは予測消費エネルギーが少なくなるように各掘削地点の掘削作業の順番を適宜変更してもよい。

　本例に示す「半自動モード」による入力操作によれば、ユーザが所望する掘削地点を特定して掘削領域を指示することができる。そのため、複数の掘削地点を組み合わせて任意の形状の掘削領域を指示したり、あるいは、ある領域では例えば２つの掘削地点を縦方向に並べ、他の領域では掘削地点を１つとすることで領域によって掘削深さが異なるように掘削領域を指示したりすることが可能である。

　以上、発明の実施形態を通じて本発明を説明したが、上述の実施形態は、特許請求の範囲に係る発明を限定するものではない。また、本発明の実施形態の中で説明されている特徴を組み合わせた形態も本発明の技術的範囲に含まれ得る。さらに、上述の実施形態に、多様な変更または改良を加えることが可能であることも当業者に明らかである。

Claims

　１又は複数のエージェントを制御する制御信号を生成する制御装置であって、
　現実世界の前記エージェントの周囲環境情報に基づいて、前記現実世界に対応する仮想世界を生成することと、
　ユーザによって前記仮想世界においてなされる、前記エージェントに実行させるタスクを指示する入力操作を受け付けることと、
　前記各エージェントが備える１又は複数のスキルと、該スキルが従属する他のスキルに関するスキル従属情報とを少なくとも含むスキル情報に基づいて、前記入力操作によって指示された前記タスクを前記エージェントに実行させるために前記１又は複数のエージェントの各々の前記エージェントが実行する一連の動作タスクからなるスケジュールを生成することと、
　前記エージェントを前記スケジュールに基づいて動作させる制御信号を生成することと、
を実行するように構成されたプロセッサを備えた、制御装置。
　前記スケジュールを生成することは、
　前記タスクを前記エージェントに実行させるために前記１又は複数のエージェントの各々の前記エージェントが必要なスキルを前記スキル情報の中から選択することと、
　前記タスクを実行するために用いられる複数のスキルを前記スキル従属情報に基づいて順序づけてタスク・ツリーを生成することと、
　前記タスク・ツリーの前記複数のスキルを逆順に並べ替えることで、前記一連の動作タスクからなるスケジュールを生成することと、
を含む、請求項１に記載の制御装置。
　前記スキル情報は前記各エージェントが備える前記各スキルに関連付けられた速度情報をさらに含んでおり、
　前記スケジュールを生成することは、
　前記タスクを実行することを可能にする複数の前記タスク・ツリーを生成することと、
　前記タスク・ツリーの各々について、前記各タスク・ツリーが含む各スキルの実行に要する時間を積算して、前記各タスク・ツリーの予測所要時間を求めることと、
　前記複数のタスク・ツリーの中から、前記予測所要時間が最も少ない前記タスク・ツリーを選択することと、
を含む、請求項２に記載の制御装置。
　前記スキル情報は前記各エージェントが備える前記各スキルに関連付けられたエネルギー消費率情報をさらに含んでおり、
　前記スケジュールを生成することは、
　前記タスクを実行することを可能にする複数の前記タスク・ツリーを生成することと、
　前記タスク・ツリーの各々について、前記各タスク・ツリーが含む各スキルの実行に要する消費エネルギーを積算して、前記各タスク・ツリーの予測消費エネルギーを求めることと、
　前記複数のタスク・ツリーの中から、前記予測消費エネルギーが最も少ない前記タスク・ツリーを選択することと、
を含む、請求項２に記載の制御装置。
　１又は複数のエージェントを制御する制御ユニットであって、
　各々の前記エージェントが実行する一連の動作タスクからなるスケジュールを含む制御信号を受信することと、
　前記制御信号に基づいて、各々の前記エージェントに前記一連の動作タスクを実行させる動作指令を生成することと、
を実行するように構成されたプロセッサを備えた、制御ユニット。
　１又は複数のエージェントを制御する制御信号を生成する方法であって、
　現実世界の前記エージェントの周囲環境情報に基づいて、前記現実世界に対応する仮想世界を生成することと、
　ユーザによって前記仮想世界においてなされる、前記エージェントに実行させるタスクを指示する入力操作を受け付けることと、
　前記各エージェントが備える１又は複数のスキルと、該スキルが従属する他のスキルに関するスキル従属情報とを少なくとも含むスキル情報に基づいて、前記入力操作によって指示された前記タスクを前記エージェントに実行させるために前記１又は複数のエージェントの各々の前記エージェントが実行する一連の動作タスクからなるスケジュールを生成することと、
　前記エージェントを前記スケジュールに基づいて動作させる制御信号を生成することと、
を含む、方法。
　前記スケジュールを生成することは、
　前記タスクを前記エージェントに実行させるために前記１又は複数のエージェントの各々の前記エージェントが必要なスキルを前記スキル情報の中から選択することと、
　前記タスクを実行するために用いられる複数のスキルを前記スキル従属情報に基づいて順序づけてタスク・ツリーを生成することと、
　前記タスク・ツリーの前記複数のスキルを逆順に並べ替えることで、前記一連の動作タスクからなるスケジュールを生成することと、
を含む、請求項６に記載の方法。
　前記スキル情報は前記各エージェントが備える前記各スキルに関連付けられた速度情報をさらに含んでおり、
　前記スケジュールを生成することは、
　前記タスクを実行することを可能にする複数の前記タスク・ツリーを生成することと、
　前記タスク・ツリーの各々について、前記各タスク・ツリーが含む各スキルの実行に要する時間を積算して、前記各タスク・ツリーの予測所要時間を求めることと、
　前記複数のタスク・ツリーの中から、前記予測所要時間が最も少ない前記タスク・ツリーを選択することと、
を含む、請求項７に記載の方法。
　前記スキル情報は前記各エージェントが備える前記各スキルに関連付けられたエネルギー消費率情報をさらに含んでおり、
　前記スケジュールを生成することは、
　前記タスクを実行することを可能にする複数の前記タスク・ツリーを生成することと、
　前記タスク・ツリーの各々について、前記各タスク・ツリーが含む各スキルの実行に要する消費エネルギーを積算して、前記各タスク・ツリーの予測消費エネルギーを求めることと、
　前記複数のタスク・ツリーの中から、前記予測消費エネルギーが最も少ない前記タスク・ツリーを選択することと、
を含む、請求項７に記載の方法。
　１又は複数のエージェントに実行させる動作指令を生成する方法であって、
　各々の前記エージェントが実行する一連の動作タスクからなるスケジュールを含む制御信号を受信することと、
　前記制御信号に基づいて、各々の前記エージェントに前記一連の動作タスクを実行させる動作指令を生成することと、
を含む、方法。
　プロセッサによって実行可能なコンピュータ・プログラムであって、請求項６～９のいずれか１項に記載の方法を実施する命令を含む、コンピュータ・プログラム。
　非一時的なコンピュータ可読媒体であって、請求項６～９のいずれか１項に記載の方法を実施する命令を含む、前記媒体に記憶され、プロセッサによって実行することができるコンピュータ・プログラムを含む、非一時的なコンピュータ可読媒体。
　プロセッサによって実行可能なコンピュータ・プログラムであって、請求項１０に記載の方法を実施する命令を含む、コンピュータ・プログラム。
　非一時的なコンピュータ可読媒体であって、請求項１０に記載の方法を実施する命令を含む、前記媒体に記憶され、プロセッサによって実行することができるコンピュータ・プログラムを含む、非一時的なコンピュータ可読媒体。
　請求項１～４のいずれか１項に記載の制御装置と、
　請求項５に記載の制御ユニットと、
を有する制御システム。
　エンドエフェクタを有するエージェントを制御する制御信号を生成する制御装置であって、
　現実世界の前記エージェントの周囲環境情報に基づいて、前記現実世界内の前記エージェントに対応する仮想エージェントを含む、前記現実世界に対応する仮想世界を生成することと、
　ユーザによる、前記仮想世界における前記仮想エージェントの仮想エンドエフェクタを動作させる操作入力を受け付けることと、
　前記操作入力により指示された前記仮想エンドエフェクタの動作を再現するように前記エージェントを動作させる制御信号を生成することと、
を実行するように構成されたプロセッサを備えた、制御装置。
　前記操作入力を行うための入力デバイスとして、前記ユーザが前記仮想世界内で前記仮想エンドエフェクタを動作させることが可能なトラッカーを備える、請求項１６に記載の制御装置。