WO2022107207A1

WO2022107207A1 - 情報収集装置、情報収集方法及び記憶媒体

Info

Publication number: WO2022107207A1
Application number: PCT/JP2020/042805
Authority: WO
Inventors: 雅嗣小川; 博之大山; 永哉若山; 真澄一圓; 伸治加美
Original assignee: 日本電気株式会社
Priority date: 2020-11-17
Filing date: 2020-11-17
Publication date: 2022-05-27
Also published as: US20230321828A1; JP7468694B2; JPWO2022107207A1

Abstract

情報収集装置３Ｘは、主に、情報取得手段３５Ｘと、タスク識別子設定手段３６Ｘとを有する。情報取得手段３５Ｘは、ロボットの作業に関連する作業関連情報を取得する。情報取得手段３５Ｘは、例えば、第１実施形態における情報取得部３５とすることができる。タスク識別子設定手段３６Ｘは、作業関連情報に対し、ロボットが実行するタスクの識別子を設定する。

Description

情報収集装置、情報収集方法及び記憶媒体

　本開示は、ロボットの作業に関する情報を収集する情報収集装置、情報収集方法及び記憶媒体の技術分野に関する。

　ロボットの作業に関するデータ収集を行う手法が提案されている。例えば、特許文献１には、ロボットの動作データを収集する条件を定める収集条件を設定し、収集条件を満たすロボットの動作データを収集するロボット動作データ収集システムが開示されている。

特開２０２０－０４６７６４号公報

　遠隔でのロボット制御を可能とするため、ロボットの動作シーケンスの自動生成により自律性を持たせたロボット制御を行うことが考えらえる。このようなロボットシステムでは、種々の環境で活動するロボットからデータを収集し、ロボット制御に用いる情報の更新を行うことがロボット制御の精度向上のために必要となる。

　本開示の目的の１つは、上述した課題を鑑み、ロボットの作業に関する情報を好適に収集することが可能な情報収集装置、情報収集方法及び記憶媒体を提供することである。

　情報収集装置の一の態様は、
　ロボットの作業に関連する作業関連情報を取得する情報取得手段と、
　前記作業関連情報に対し、前記ロボットが実行するタスクの識別子を設定するタスク識別子設定手段と、
を有する情報収集装置である。

　情報収集方法の一の態様は、
　コンピュータが、
　ロボットの作業に関連する作業関連情報を取得し、
　前記作業関連情報に対し、前記ロボットが実行するタスクの識別子を設定する、
情報収集方法である。

　記憶媒体の一の態様は、
　ロボットの作業に関連する作業関連情報を取得し、
　前記作業関連情報に対し、前記ロボットが実行するタスクの識別子を設定する処理をコンピュータに実行させるプログラムが格納された記憶媒体である。

　ロボットの作業に関連する作業関連情報の収集を好適に行うことができる。

第１実施形態におけるロボット統括システムの構成を示す。ロボットコントローラのハードウェア構成を示す。アプリケーション情報のデータ構造の一例を示す。作業関連情報のデータ構造の一例を示す。情報収集装置の機能ブロックの一例である。ロボット動作期間におけるサブタスクの実行状況と、作業関連情報に設定されるタスク識別子との関係を表す図であるロボットコントローラの機能ブロックの一例である。ピックアンドプレイスを目的タスクとした場合の作業空間の俯瞰図を示す。目的タスクを指定するタスク指定画面の表示例を示す。第１実施形態において情報収集装置が実行する処理の概要を示すフローチャートの一例である。第２実施形態における情報収集装置の概略構成図を示す。第２実施形態において、情報収集装置が実行する処理手順を示すフローチャートの一例である。

　以下、図面を参照しながら、情報収集装置、情報収集方法、記憶媒体の実施形態について説明する。

　＜第１実施形態＞
　（１）システム構成
　図１は、第１実施形態に係るロボット統括システム１００の構成を示す。ロボット統括システム１００は、主に、指示装置２と、情報収集装置３と、複数のタスク実行システム５０（５０Ａ、５０Ｂ、…）とを有する。指示装置２と情報収集装置３とタスク実行システム５０とは、通信網６を介してデータ通信を行う。

　指示装置２は、各タスク実行システム５０においてロボット５に実行させるタスク（「目的タスク」とも呼ぶ。）に関する作業者による指示を受け付ける装置である。指示装置２は、目的タスクに関する所定の表示又は音出力を行ったり、作業者の入力に基づき生成した指示信号「Ｄ１」をタスク実行システム５０へ供給したりする。この場合、指示装置２は、例えば、目的タスクの指示が可能なタスク実行システム５０のリストを表示し、リストから選択されたタスク実行システム５０に対して目的タスクの指定等に関する入力を受け付ける。指示装置２は、入力部と表示部とを備えるタブレット端末であってもよく、据置型のパーソナルコンピュータであってもよい。

　情報収集装置３は、ロボットの作業に関連する情報（「ロボット作業関連情報Ｄ２」とも呼ぶ。）をタスク実行システム５０の各々から受信し、受信したロボット作業関連情報Ｄ２を記憶する。情報収集装置３は、機能的には、ロボット作業関連情報記憶部４２と、更新アプリケーション情報記憶部４３とを有する。ロボット作業関連情報記憶部４２は、情報収集装置３がタスク実行システム５０の各々から受信したロボット作業関連情報Ｄ２を記憶する。更新アプリケーション情報記憶部４３は、ロボット作業関連情報記憶部４２に記憶された情報を分析することで生成・更新されたアプリケーション情報を記憶する。アプリケーション情報は、ロボットが実行すべきシーケンスである動作シーケンスを目的タスクから生成するために必要な種々の情報である。情報収集装置３は、更新アプリケーション情報記憶部４３に記憶されたアプリケーション情報とタスク実行システム５０に記憶されたアプリケーション情報とを同期するために必要な更新情報「Ｄ３」を、タスク実行システム５０に送信する。

　タスク実行システム５０は、指定された目的タスクを実行するシステムであり、夫々異なる環境に設けられる。各タスク実行システム５０は、ロボットコントローラ１（１Ａ、１Ｂ、…）と、ロボット５（５Ａ、５Ｂ、…）と、計測装置７（７Ａ、７Ｂ、…）と、を備える。

　ロボットコントローラ１は、同一のタスク実行システム５０内に属するロボット５に実行させる目的タスクが指定された場合に、ロボット５の動作計画を時相論理に基づき策定し、当該動作計画に基づきロボット５を制御する。具体的には、ロボットコントローラ１は、時相論理により表した目的タスクを、ロボット５が受付可能な単位となるタスクのタイムステップ（時間刻み）毎のシーケンスに変換し、生成したシーケンスに基づきロボット５を制御する。以後では、ロボット５が受付可能な単位により目的タスクを分解したタスク（コマンド）を、「サブタスク」とも呼び、目的タスクを達成するためにロボット５が実行すべきサブタスクのシーケンスを「サブタスクシーケンス」又は「動作シーケンス」と呼ぶ。

　また、ロボットコントローラ１は、ロボット５の動作シーケンスを目的タスクから生成するために必要なアプリケーション情報を記憶するアプリケーション情報記憶部４１（４１Ａ、４１Ｂ、…）を有する。アプリケーション情報の詳細は、図３を参照しながら後述する。

　また、ロボットコントローラ１は、同一のタスク実行システム５０に属するロボット５及び計測装置７と、通信網を介し、又は、無線若しくは有線による直接通信により、データ通信を行う。例えば、ロボットコントローラ１は、ロボット５の制御に関する制御信号をロボット５に送信する。他の例では、ロボットコントローラ１は、計測装置７が生成した計測信号を受信する。

　さらに、ロボットコントローラ１は、指示装置２及び情報収集装置３と、通信網６を介してデータ通信を行う。例えば、ロボットコントローラ１は、指示装置２から、目的タスクの指定又はロボット５の動作指令等に関する指示信号Ｄ１を受信する。また、ロボットコントローラ１は、情報収集装置３に対し、ロボット５の制御において生成した各種情報、ロボット５及び計測装置７と授受を行った各種情報を含むロボット作業関連情報Ｄ２を送信する。ロボット作業関連情報Ｄ２の詳細は、図４を参照しながら後述する。また、ロボットコントローラ１は、通信網６を介して情報収集装置３から更新情報Ｄ３を受信し、受信した更新情報Ｄ３に基づき、アプリケーション情報記憶部４１に記憶するアプリケーション情報を更新する。

　なお、ロボット５又は計測装置７が生成したロボット作業関連情報Ｄ２は、ロボットコントローラ１を介して情報収集装置３に供給される代わりに、ロボットコントローラ１を介すことなく、ロボット５又は計測装置７により直接的に情報収集装置３に供給されてもよい。

　ロボット５は、タスク実行システム５０毎に１台又は複数台存在し、同一のタスク実行システム５０に属するロボットコントローラ１から供給される制御信号に基づき目的タスクに関する作業を行う。ロボット５は、例えば、組み立て工場、食品工場などの各種工場、又は、物流の現場などで動作を行うロボットである。ロボット５は、垂直多関節型ロボット、水平多関節型ロボット、又はその他の任意の種類のロボットであってもよく、ロボットアームなどの夫々が独立して動作する制御対象物を複数有してもよい。また、ロボット５は、作業空間内で動作する他のロボット、作業者又は工作機械と協働作業を行うものであってもよい。また、ロボットコントローラ１とロボット５とは、一体に構成されてもよい。

　また、ロボット５は、ロボット５の状態を示す状態信号を、同一のタスク実行システム５０に属するロボットコントローラ１に供給してもよい。この状態信号は、ロボット５全体又は関節などの特定部位の状態（位置、角度等）を検出するセンサの出力信号であってもよく、ロボット５の制御部が生成したロボット５の動作シーケンスの進捗状態を示す信号であってもよい。

　計測装置７は、各タスク実行システム５０において目的タスクが実行される作業空間内の状態を検出するカメラ、測域センサ、ソナーまたはこれらの組み合わせとなる１又は複数のセンサである。計測装置７は、生成した計測信号を、同一のタスク実行システム５０に属するロボットコントローラ１に供給する。計測装置７は、作業空間内で移動する自走式又は飛行式のセンサ（ドローンを含む）であってもよい。また、計測装置７は、ロボット５に設けられたセンサ、及び作業空間内の他の物体に設けられたセンサなどを含んでもよい。また、計測装置７は、作業空間内の音を検出するセンサを含んでもよい。このように、計測装置７は、作業空間内の状態を検出する種々のセンサであって、任意の場所に設けられたセンサを含んでもよい。

　なお、図１に示すロボット統括システム１００の構成は一例であり、当該構成に種々の変更が行われてもよい。例えば、タスク実行システム５０に夫々存在するロボットコントローラ１は、複数の装置から構成されてもよい。この場合、ロボットコントローラ１を構成する複数の装置は、予め割り当てられた処理を実行するために必要な情報の授受を、これらの複数の装置間において行う。また、アプリケーション情報記憶部４１は、ロボットコントローラ１とデータ通信を行う１または複数の外部記憶装置により記憶されてもよい。この場合、外部記憶装置は、各タスク実行システム５０で共通して参照されるアプリケーション情報記憶部４１を記憶する１又は複数のサーバ装置であってもよい。同様に、ロボット作業関連情報記憶部４２及び更新アプリケーション情報記憶部４３の少なくとも一方は、情報収集装置３とデータ通信を行う１又は複数の外部記憶装置により記憶されてもよい。また、タスク実行システム５０には、ロボット５の作業環境に関する温度、湿度等の指標の検出を行うセンサが設けられてもよい。

　（２）ハードウェア構成
　図２（Ａ）は、ロボットコントローラ１（１Ａ、１Ｂ、…）のハードウェア構成を示す。ロボットコントローラ１は、ハードウェアとして、プロセッサ１１と、メモリ１２と、インターフェース１３とを含む。プロセッサ１１、メモリ１２及びインターフェース１３は、データバス１０を介して接続されている。

　プロセッサ１１は、メモリ１２に記憶されているプログラムを実行することにより、ロボットコントローラ１の全体の制御を行うコントローラ（演算装置）として機能する。プロセッサ１１は、例えば、ＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）、ＧＰＵ（Ｇｒａｐｈｉｃｓ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）、ＴＰＵ（Ｔｅｎｓｏｒ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）などのプロセッサである。プロセッサ１１は、複数のプロセッサから構成されてもよい。プロセッサ１１は、コンピュータの一例である。

　メモリ１２は、ＲＡＭ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）、ＲＯＭ（Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）、フラッシュメモリなどの各種の揮発性メモリ及び不揮発性メモリにより構成される。また、メモリ１２には、ロボットコントローラ１が実行する処理を実行するためのプログラムが記憶される。また、メモリ１２は、アプリケーション情報記憶部４１として機能する。アプリケーション情報記憶部４１に記憶されたアプリケーション情報は、更新情報Ｄ３に基づき更新される。なお、メモリ１２が記憶する情報の一部は、ロボットコントローラ１と通信可能な１又は複数の外部記憶装置により記憶されてもよく、ロボットコントローラ１に対して着脱自在な記憶媒体により記憶されてもよい。

　インターフェース１３は、ロボットコントローラ１と他の装置とを電気的に接続するためのインターフェースである。これらのインターフェースは、他の装置とデータの送受信を無線により行うためのネットワークアダプタなどのワイアレスインタフェースであってもよく、他の装置とケーブル等により接続するためのハードウェアインターフェースであってもよい。

　なお、ロボットコントローラ１のハードウェア構成は、図２（Ａ）に示す構成に限定されない。例えば、ロボットコントローラ１は、表示装置、入力装置又は音出力装置の少なくともいずれかと接続又は内蔵してもよい。

　図２（Ｂ）は、指示装置２のハードウェア構成を示す。指示装置２は、ハードウェアとして、プロセッサ２１と、メモリ２２と、インターフェース２３と、入力部２４ａと、表示部２４ｂと、音出力部２４ｃとを含む。プロセッサ２１、メモリ２２及びインターフェース２３は、データバス２０を介して接続されている。また、インターフェース２３には、入力部２４ａと表示部２４ｂと音出力部２４ｃとが接続されている。

　プロセッサ２１は、メモリ２２に記憶されているプログラムを実行することにより、所定の処理を実行する。プロセッサ２１は、ＣＰＵ、ＧＰＵ、ＴＰＵなどのプロセッサである。プロセッサ２１は、インターフェース２３を介して入力部２４ａが生成した信号を受信することで、指示信号Ｄ１を生成し、インターフェース２３を介してロボットコントローラ１に当該指示信号Ｄ１を送信する。また、プロセッサ２１は、インターフェース２３を介してロボットコントローラ１から受信した出力制御信号に基づき、表示部２４ｂ又は音出力部２４ｃの少なくとも一方を、インターフェース２３を介して制御する。

　メモリ２２は、ＲＡＭ、ＲＯＭ、フラッシュメモリなどの各種の揮発性メモリ及び不揮発性メモリにより構成される。また、メモリ２２には、指示装置２が実行する処理を実行するためのプログラムが記憶される。

　インターフェース２３は、指示装置２と他の装置とを電気的に接続するためのインターフェースである。これらのインターフェースは、他の装置とデータの送受信を無線により行うためのネットワークアダプタなどのワイアレスインタフェースであってもよく、他の装置とケーブル等により接続するためのハードウェアインターフェースであってもよい。また、インターフェース２３は、入力部２４ａ、表示部２４ｂ、及び音出力部２４ｃのインターフェース動作を行う。入力部２４ａは、ユーザの入力を受け付けるインターフェースであり、例えば、タッチパネル、ボタン、キーボード、音声入力装置などが該当する。表示部２４ｂは、例えば、ディスプレイ、プロジェクタ等であり、プロセッサ２１の制御に基づき表示を行う。また、音出力部２４ｃは、例えば、スピーカであり、プロセッサ２１の制御に基づき音出力を行う。

　なお、指示装置２のハードウェア構成は、図２（Ｂ）に示す構成に限定されない。例えば、入力部２４ａ、表示部２４ｂ又は音出力部２４ｃの少なくともいずれかは、指示装置２と電気的に接続する別体の装置として構成されてもよい。また、指示装置２は、カメラなどの種々の装置と接続してもよく、これらを内蔵してもよい。

　図２（Ｃ）は、情報収集装置３のハードウェア構成を示す。情報収集装置３は、ハードウェアとして、プロセッサ３１と、メモリ３２と、インターフェース３３とを含む。プロセッサ３１、メモリ３２及びインターフェース３３は、データバス３０を介して接続されている。

　プロセッサ３１は、メモリ３２に記憶されているプログラムを実行することにより、情報収集装置３の全体の制御を行うコントローラ（演算装置）として機能する。プロセッサ３１は、例えば、ＣＰＵ、ＧＰＵ、ＴＰＵなどのプロセッサである。プロセッサ３１は、複数のプロセッサから構成されてもよい。プロセッサ３１は、コンピュータの一例である。

　メモリ３２は、ＲＡＭ、ＲＯＭ、フラッシュメモリなどの各種の揮発性メモリ及び不揮発性メモリにより構成される。また、メモリ３２には、ロボットコントローラ１が実行する処理を実行するためのプログラムが記憶される。また、メモリ３２は、ロボット作業関連情報記憶部４２及び更新アプリケーション情報記憶部４３として機能する。なお、メモリ３２が記憶する情報の一部は、情報収集装置３と通信可能な１又は複数の外部記憶装置により記憶されてもよく、情報収集装置３に対して着脱自在な記憶媒体により記憶されてもよい。

　インターフェース３３は、情報収集装置３と他の装置とを電気的に接続するためのインターフェースである。これらのインターフェースは、他の装置とデータの送受信を無線により行うためのネットワークアダプタなどのワイアレスインタフェースであってもよく、他の装置とケーブル等により接続するためのハードウェアインターフェースであってもよい。

　なお、情報収集装置３のハードウェア構成は、図２（Ｃ）に示す構成に限定されない。例えば、情報収集装置３は、表示装置、入力装置又は音出力装置の少なくともいずれかと接続又は内蔵してもよい。

　（３）アプリケーション情報
　次に、アプリケーション情報記憶部４１が記憶するアプリケーション情報のデータ構造について説明する。

　図３は、アプリケーション情報のデータ構造の一例を示す。図３に示すように、アプリケーション情報は、抽象状態指定情報Ｉ１と、制約条件情報Ｉ２と、動作限界情報Ｉ３と、サブタスク情報Ｉ４と、抽象モデル情報Ｉ５と、物体モデル情報Ｉ６とを含む。

　抽象状態指定情報Ｉ１は、動作シーケンスの生成にあたり定義する必要がある抽象状態を指定する情報である。この抽象状態は、作業空間内における物体の抽象的な状態であって、後述する目標論理式において使用する命題として定められる。例えば、抽象状態指定情報Ｉ１は、目的タスクの種類毎に、定義する必要がある抽象状態を指定する。

　制約条件情報Ｉ２は、目的タスクを実行する際の制約条件を示す情報である。制約条件情報Ｉ２は、例えば、目的タスクがピックアンドプレイスの場合、障害物にロボット５（ロボットアーム）が接触してはいけないという制約条件、ロボット５（ロボットアーム）同士が接触してはいけないという制約条件などを示す。なお、制約条件情報Ｉ２は、目的タスクの種類毎に夫々適した制約条件を記録した情報であってもよい。

　動作限界情報Ｉ３は、ロボットコントローラ１により制御が行われるロボット５の動作限界に関する情報を示す。動作限界情報Ｉ３は、例えば、ロボット５の速度、加速度、又は角速度の上限を規定する情報である。なお、動作限界情報Ｉ３は、ロボット５の可動部位又は関節ごとに動作限界を規定する情報であってもよい。

　サブタスク情報Ｉ４は、動作シーケンスの構成要素となるサブタスクの情報を示す。「サブタスク」は、ロボット５が受付可能な単位により目的タスクを分解したタスクであって、細分化されたロボット５の動作を指す。例えば、目的タスクがピックアンドプレイスの場合には、サブタスク情報Ｉ４は、ロボット５のロボットアームの移動であるリーチングと、ロボットアームによる把持であるグラスピングとをサブタスクとして規定する。サブタスク情報Ｉ４は、目的タスクの種類毎に使用可能なサブタスクの情報を示すものであってもよい。なお、サブタスク情報Ｉ４には、外部入力による動作指令が必要なサブタスクに関する情報が含まれてもよい。

　抽象モデル情報Ｉ５は、作業空間におけるダイナミクスを抽象化した抽象モデルに関する情報である。例えば、抽象モデルは、後述するように、現実のダイナミクスをハイブリッドシステムにより抽象化したモデルにより表されている。抽象モデル情報Ｉ５は、上述のハイブリッドシステムにおけるダイナミクスの切り替わりの条件を示す情報を含む。切り替わりの条件は、例えば、ロボット５により作業対象となる物（「対象物」とも呼ぶ。）をロボット５が掴んで所定位置に移動させるピックアンドプレイスの場合、対象物はロボット５により把持されなければ移動できないという条件などが該当する。抽象モデル情報Ｉ５は、目的タスクの種類毎に適した抽象モデルに関する情報を有している。

　物体モデル情報Ｉ６は、計測装置７が生成した計測信号から認識すべき作業空間内の各物体の物体モデルに関する情報である。上述の各物体は、例えば、ロボット５、障害物、ロボット５が扱う工具その他の対象物、ロボット５以外の作業体などが該当する。物体モデル情報Ｉ６は、例えば、上述した各物体の種類、位置、姿勢、現在実行中の動作などをロボットコントローラ１が認識するために必要な情報と、各物体の３次元形状を認識するためのＣＡＤ（Ｃｏｍｐｕｔｅｒ　Ａｉｄｅｄ　Ｄｅｓｉｇｎ）データなどの３次元形状情報とを含んでいる。前者の情報は、ニューラルネットワークなどの機械学習における学習モデルを学習することで得られた推論器のパラメータを含む。この推論器は、例えば、画像が入力された場合に、当該画像において被写体となる物体の種類、位置、姿勢等を出力するように予め学習される。また、対象物などの主要な物体に画像認識用のＡＲマーカが付されている場合には、ＡＲマーカにより物体を認識するために必要な情報が物体モデル情報Ｉ６として記憶されてもよい。

　なお、アプリケーション情報記憶部４１は、上述した情報の他、ロボット５の動作シーケンスの生成処理に関する種々の情報を記憶してもよい。

　（４）作業関連情報
　図４は、情報収集装置３が各タスク実行システム５０から受信するロボット作業関連情報Ｄ２のデータ構造の一例を示す。図４に示すように、ロボット作業関連情報Ｄ２は、ロボット構成情報Ｄ２１と、動作計画情報Ｄ２２と、計測情報Ｄ２３と、ロボット動作状況情報Ｄ２４と、作業環境情報Ｄ２５とを含んでいる。なお、図４に示すロボット作業関連情報Ｄ２は、一括して情報収集装置３に供給される代わりに、情報の種類、又は／及び、生成タイミングに応じてロボット作業関連情報Ｄ２を構成する個々の情報が逐次的に情報収集装置３に供給されてもよい。即ち、タスク実行システム５０は、ロボット作業関連情報Ｄ２として送信すべき情報を複数回に分けて情報収集装置３に供給してもよい。

　ロボット構成情報Ｄ２１は、タスク実行システム５０の各々におけるロボット５の構成を表す情報である。ロボット構成情報Ｄ２１は、例えば、ロボット５の台数、各ロボット５の配置、各ロボット５の種類などの情報を含んでいる。なお、ロボット構成情報Ｄ２１は、ロボット５の構成に加えて、計測装置７の構成（台数、配置、種類等）に関する情報をさらに含んでもよい。ロボット構成情報Ｄ２１は、ロボット作業関連情報Ｄ２として情報収集装置３に送信される他の情報より先行して情報収集装置３に供給されてもよい。

　動作計画情報Ｄ２２は、タスク実行システム５０の各々におけるロボットコントローラ１が策定するロボット５の動作計画に関する情報である。動作計画情報Ｄ２２は、例えば、ロボットコントローラ１がロボット５に供給する動作シーケンスに関する制御信号に加えて、当該制御信号を生成する過程において生成した任意の情報（中間生成情報）を含んでもよい。例えば、動作計画情報Ｄ２２は、設定された目的タスクの情報、ロボットコントローラ１が設定した抽象状態（命題を含む）に関する情報、動作シーケンスを決定する際に使用した評価関数（報酬関数、価値関数）に関する情報等を含んでもよい。また、動作計画情報Ｄ２２は、ロボットコントローラ１が使用したアプリケーション情報のバージョン情報などを含んでもよい。また、動作計画情報Ｄ２２は、動作シーケンスを生成した日時及び動作シーケンスを構成する各サブタスクの実行予定日時等を示す日時情報を含んでいる。動作計画情報Ｄ２２は、ロボットコントローラ１による動作計画の策定後に直ちに情報収集装置３に供給されてよく、ロボット作業関連情報Ｄ２として情報収集装置３に送信される他の情報と一括して情報収集装置３に供給されてもよい。

　計測情報Ｄ２３は、タスク実行システム５０の各々において設けられた計測装置７がロボット５による目的タスクの実行中において生成する計測信号である。この計測信号は、計測日時を示す日時情報と関連付けられている。

　ロボット動作状況情報Ｄ２４は、タスク実行システム５０の各々において、ロボットコントローラ１が生成した動作シーケンスの制御信号に基づきロボット５が動作している期間（「ロボット動作期間」とも呼ぶ。）におけるロボット５の動作状況を表す情報である。ロボット動作状況情報Ｄ２４は、サブタスクごとのロボット５の実行結果（成功又は失敗）を示すログ情報であってもよく、動作シーケンスを実行中のロボット５の状態に関するログ情報であってもよい。状態に関するログ情報は、例えば、ロボット５の稼働時間長、ロボット５のエンドエフェクタやアクチュエータ等の角度、角速度、角加速度、位置、速度、加速度、力、トルクなどの情報を含む。これらのログ情報は、対象となる動作の実行日時を示す日時情報と関連付けられている。ロボット動作状況情報Ｄ２４は、ロボットコントローラ１が生成する情報であってもよく、ロボット５が生成する情報であってもよく、その両方を含む情報であってもよい。

　作業環境情報Ｄ２５は、タスク実行システム５０の各々において検出された作業環境に関する検出情報である。作業環境情報Ｄ２５は、例えば、ロボット動作期間での作業空間の温度、湿度その他環境を表す指標である。

　なお、計測情報Ｄ２３、ロボット動作状況情報Ｄ２４及び作業環境情報Ｄ２５は、ロボット動作期間中において所定時間間隔ごとに情報収集装置３に供給されてもよく、ロボット動作期間終了後に一括して情報収集装置３に供給されてもよい。

　ロボット作業関連情報Ｄ２には、上述した情報に限らず、ロボット５の作業に関する任意の情報が含まれていてもよい。例えば、ロボット作業関連情報Ｄ２には、タスク実行システム５０の各々に対して割り当てられた識別情報が含まれてもよい。

　（５）情報収集装置の処理概要
　次に、情報収集装置３の処理概要について説明する。概略的には、情報収集装置３は、各タスク実行システム５０から供給されるロボット作業関連情報Ｄ２をロボット作業関連情報記憶部４２に記憶する場合に、実行対象のタスクを表す識別子（「タスク識別子」とも呼ぶ。）をロボット作業関連情報Ｄ２に設定する。これにより、情報収集装置３は、複数の環境で作業するロボット５のデータを収集する場合に、アプリケーション情報の更新等を目的とした分析、学習において好適に活用できるように、収集したデータの仕分けを行う。

　図５は、情報収集装置３の処理の概要を示す機能ブロックの一例である。情報収集装置３のプロセッサ３１は、機能的には、情報取得部３５と、タスク識別子設定部３６と、アプリケーション情報更新部３７とを有する。なお、図５では、各ブロック間で授受が行われるデータの一例が示されているが、これに限定されない。後述する他の機能ブロックの図においても同様である。

　情報取得部３５は、インターフェース３３を介してタスク実行システム５０の各々からロボット作業関連情報Ｄ２を受信し、受信したロボット作業関連情報Ｄ２又はその一部をタスク識別子設定部３６に供給する。情報取得部３５の処理の詳細については、「（６）情報取得部の詳細」のセクションにて詳しく説明する。

　なお、タスク実行システム５０の各々は、ロボット作業関連情報Ｄ２を、目的タスクの実行（動作計画を含む）の開始後から目的タスクの実行終了までの期間において、所定時間間隔毎に送信してもよく、目的タスクの実行完了時などの所定のタイミングにおいてまとめて送信してもよい。また、情報取得部３５は、ロボット作業関連情報Ｄ２を各タスク実行システム５０に対して要求することで、ロボット作業関連情報Ｄ２を受信してもよい。この場合、例えば、情報取得部３５は、指示装置２から目的タスクの指示情報等を受信することで、目的タスクの実行中のタスク実行システム５０を認識し、目的タスクの実行中のタスク実行システム５０のロボットコントローラ１にロボット作業関連情報Ｄ２の送信を要求する。

　タスク識別子設定部３６は、情報取得部３５から供給されたロボット作業関連情報Ｄ２に対してタスク識別子をタグとして設定する処理（所謂タグ付け処理）を実行し、タスク識別子を設定したロボット作業関連情報Ｄ２をロボット作業関連情報記憶部４２に記憶する。この場合、タスク識別子は、サブタスクを少なくとも識別可能な識別子である。タスク識別子設定部３６の処理の詳細については、「（７）タスク識別子設定部の詳細」のセクションにて詳しく説明する。

　アプリケーション情報更新部３７は、ロボット作業関連情報記憶部４２に記憶された情報に基づき、アプリケーション情報を更新し、更新したアプリケーション情報を更新アプリケーション情報記憶部４３に記憶する。この場合、アプリケーション情報更新部３７は、ロボット作業関連情報記憶部４２に記憶されたロボット作業関連情報を、設定されたタスク識別子が示すタスク毎に分析・学習することで、抽象状態指定情報Ｉ１、制約条件情報Ｉ２、動作限界情報Ｉ３、サブタスク情報Ｉ４、抽象モデル情報Ｉ５、又は物体モデル情報Ｉ６の少なくともいずれかを更新する。この場合、アプリケーション情報更新部３７は、管理者等による外部入力を、インターフェース３３を介した入力部により受け付け、当該外部入力に基づき上述の更新を行ってもよい。

　また、アプリケーション情報更新部３７は、更新したアプリケーション情報を表す更新情報Ｄ３を、各タスク実行システム５０に配信する。この場合、例えば、アプリケーション情報更新部３７は、更新アプリケーション情報記憶部４３に記憶した更新後の全てのアプリケーション情報を更新情報Ｄ３として各タスク実行システム５０に配信する。他の例では、アプリケーション情報更新部３７は、更新部分に該当するアプリケーション情報のみを更新情報Ｄ３として各タスク実行システム５０に配信する。その後、更新情報Ｄ３を受信した各タスク実行システム５０のロボットコントローラ１は、更新情報Ｄ３に基づきアプリケーション情報記憶部４１に記憶されたアプリケーション情報を更新する。

　ここで、情報取得部３５、タスク識別子設定部３６及びアプリケーション情報更新部３７の各構成要素は、例えば、プロセッサ３１がプログラムを実行することによって実現できる。また、必要なプログラムを任意の不揮発性記憶媒体に記録しておき、必要に応じてインストールすることで、各構成要素を実現するようにしてもよい。なお、これらの各構成要素の少なくとも一部は、プログラムによるソフトウェアで実現することに限ることなく、ハードウェア、ファームウェア、及びソフトウェアのうちのいずれかの組合せ等により実現してもよい。また、これらの各構成要素の少なくとも一部は、例えばＦＰＧＡ（Field-Programmable Gate Array）又はマイクロコントローラ等の、ユーザがプログラミング可能な集積回路を用いて実現してもよい。この場合、この集積回路を用いて、上記の各構成要素から構成されるプログラムを実現してもよい。また、各構成要素の少なくとも一部は、ＡＳＳＰ（Application Specific Standard Produce）、ＡＳＩＣ（Application Specific Integrated Circuit）又は量子コンピュータ制御チップにより構成されてもよい。このように、各構成要素は、種々のハードウェアにより実現されてもよい。以上のことは、後述する他の実施の形態においても同様である。さらに、これらの各構成要素は，例えば，クラウドコンピューティング技術などを用いて、複数のコンピュータの協働によって実現されてもよい。

　（６）情報取得部の詳細
　情報取得部３５が実行する処理の詳細について説明する。好適には、情報取得部３５は、受信したロボット作業関連情報Ｄ２について、所定の収集条件が満たされるか否かを判定し、収集条件が満たされるロボット作業関連情報Ｄ２を、タスク識別子設定部３６に供給する。これにより、タスク識別子設定部３６によるタスク識別子の設定処理による処理負荷等を好適に低減する。

　ここで、「収集条件」は、タスク識別子と関連付けてロボット作業関連情報記憶部４２に記憶する対象となるロボット作業関連情報Ｄ２を判定する条件を指す。収集条件は、例えば、ロボット作業関連情報Ｄ２をロボット作業関連情報記憶部４２に記憶するタスク実行システム５０を指定する条件であってもよく、ロボット作業関連情報Ｄ２をロボット作業関連情報記憶部４２に記憶する時間帯を指定する条件であってもよい。具体的な収集条件を指定する情報は、例えばメモリ３２等に予め記憶されている。

　また、収集条件は、タスク実行システム５０に存在するロボット５の構成を指定する条件であってもよい。この場合、情報取得部３５は、ロボット作業関連情報Ｄ２として送信されるロボット構成情報Ｄ２１に基づき、収集条件として設定したロボット５の構成を有するタスク実行システム５０を特定する。そして、情報取得部３５は、収集条件として設定したロボット５の構成を有するタスク実行システム５０から送信されたロボット作業関連情報Ｄ２を、タスク識別子設定部３６に供給する。

　なお、情報取得部３５は、収集条件が満たれさないロボット作業関連情報Ｄ２を、ロボット作業関連情報記憶部４２に記憶せずに破棄してもよく、タスク識別子の設定処理を行わずにそのままロボット作業関連情報記憶部４２に記憶してもよい。これらのいずれの場合においても、タスク識別子設定部３６によるタスク識別子の設定処理の負荷を削減することができる。この場合、例えば、収集条件が満たれさないロボット作業関連情報Ｄ２に対する対応を定めた設定情報がメモリ３２等に記憶されており、情報取得部３５は、当該設定情報に従い、収集条件が満たされないロボット作業関連情報Ｄ２への対応（破棄又はそのままロボット作業関連情報記憶部４２に記憶）を決定する。

　（７）タスク識別子設定部の詳細
　次に、タスク識別子の設定処理の詳細について説明する。タスク識別子設定部３６は、ロボット動作期間に生成されるロボット作業関連情報Ｄ２（例えば、計測情報Ｄ２３、ロボット動作状況情報Ｄ２４及び作業環境情報Ｄ２５）について、少なくとも対応するサブタスクを表すタスク識別子をタグとして設定する。具体的には、タスク識別子設定部３６は、ロボット動作期間において実行されるロボット５の各サブタスクの実行期間を認識し、認識した各サブタスクの実行期間に生成されたロボット作業関連情報Ｄ２に対し、対応するサブタスクのタスク識別子を設定する。

　図６は、あるタスク実行システム５０のロボット動作期間におけるサブタスクの実行状況と、ロボット動作期間に生成されるロボット作業関連情報Ｄ２に付されるタスク識別子との関係を表す図である。図６の例では、時刻「ｔ１」から時刻「ｔ７」までの期間がタスク実行システム５０Ａでのロボット動作期間に相当し、当該期間においてロボット５はサブタスクである「サブタスク１」～「サブタスク４」を実行している。

　タスク識別子設定部３６は、ロボット実行期間において実行される各サブタスクの実行期間を、ロボット作業関連情報Ｄ２に含まれる動作計画情報Ｄ２２又はロボット動作状況情報Ｄ２４に基づき認識する。具体的には、タスク識別子設定部３６は、タイムステップ毎に計画されたサブタスクのシーケンスの情報を示す動作計画情報Ｄ２２、又は、実際にロボット５が実行したサブタスクのログ情報を示すロボット動作状況情報Ｄ２４の少なくとも一方を参照し、各サブタスクの実行期間を認識する。そして、タスク識別子設定部３６は、ロボット動作期間において生成されるロボット作業関連情報Ｄ２を、当該ロボット作業関連情報Ｄ２に付加された時刻情報に基づき、各サブタスクの実行期間と対応付ける。

　具体的には、タスク識別子設定部３６は、時刻ｔ１から時刻「ｔ２」までの期間及び時刻「ｔ５」から時刻「ｔ６」までの期間が「サブタスク１」の実行期間であると認識する。また、タスク識別子設定部３６は、時刻ｔ２から時刻「ｔ３」までの期間及び時刻「ｔ４」から時刻「ｔ５」までの期間が「サブタスク２」の実行期間であると認識する。さらに、タスク識別子設定部３６は、時刻ｔ３から時刻ｔ４までの期間が「サブタスク３」の実行期間、時刻ｔ６から時刻ｔ７までの期間が「サブタスク４」の実行期間であると認識する。

　そして、タスク識別子設定部３６は、サブタスクの実行期間ごとに分けたロボット作業関連情報Ｄ２に対し、対応するサブタスクを少なくとも表すタスク識別子を設定する。図６の例では、タスク識別子設定部３６は、対応する目的タスクＸとサブタスクとの両方を識別するためのタスク識別子を設定する。例えば、タスク識別子設定部３６は、時刻ｔ１から時刻ｔ２までの期間に日時情報が対応付けられたロボット作業関連情報Ｄ２については、「目的タスクＸ」と「サブタスク１」を表すタスク識別子を設定する。また、タスク識別子設定部３６は、時刻ｔ２から時刻ｔ３までの期間に日時情報が対応付けられたロボット作業関連情報Ｄ２については、「目的タスクＸ」と「サブタスク２」を表すタスク識別子を設定する。なお、このタスク識別子は、対象のサブタスクに対して固有の識別子と、対象の目的タスクに対して固有の識別子との組み合わせであってもよく、サブタスクと目的タスクの組み合わせに対して固有の１つの識別子であってもよい。

　このように、タスク識別子設定部３６は、各タスク実行システム５０から供給されるロボット作業関連情報Ｄ２について、生成時において実行中であった目的タスク及びサブタスクに対応するタスク識別子を設定する。これにより、タスク識別子設定部３６は、アプリケーション情報更新部３７でのサブタスクごとの実行結果の分析等がしやすいようにタグ付けされた情報をロボット作業関連情報記憶部４２に記憶することができる。このようなタスク識別子の設定により、例えば、失敗がどのサブタスクにおいて発生したかの把握の容易化、及び、サブタスク毎の学習の容易化が期待できる。

　（８）ロボットコントローラの制御
　次に、各タスク実行システム５０においてロボットコントローラ１が実行するロボット５の制御について説明する。以下に述べるように、ロボットコントローラ１は、時相論理に基づくロボット５の動作計画を行う。

　（８－１）機能ブロック
　図７は、ロボットコントローラ１のプロセッサ１１の機能的な構成を示す機能ブロックの一例である。プロセッサ１１は、機能的には、抽象状態設定部７１と、目標論理式生成部７２と、タイムステップ論理式生成部７３と、抽象モデル生成部７４と、制御入力生成部７５と、サブタスクシーケンス生成部７６と、を有する。

　抽象状態設定部７１は、計測装置７から供給される計測信号と、目的タスクの実行を指示する指示信号Ｄ１と、抽象状態指定情報Ｉ１と、物体モデル情報Ｉ６と、に基づき、作業空間内の抽象状態を設定する。この場合、抽象状態設定部７１は、目的タスクを実行する際に考慮する必要がある作業空間内の物体を認識し、当該物体に関する認識結果Ｉｍを生成する。そして、抽象状態設定部７１は、認識結果Ｉｍに基づいて、目的タスクを実行する際に考慮する必要がある各抽象状態に対し、論理式で表すための命題を定義する。抽象状態設定部７１は、指示信号Ｄ１が供給された場合、設定した抽象状態を表す情報（「抽象状態設定情報ＩＳ」とも呼ぶ。）を、目標論理式生成部７２に供給する。

　目標論理式生成部７２は、抽象状態設定情報ＩＳに基づき、指示信号Ｄ１により指定された目的タスクを、最終的な達成状態を表す時相論理の論理式（「目標論理式Ｌｔａｇ」とも呼ぶ。）に変換する。この場合、目標論理式生成部７２は、アプリケーション情報記憶部４１から制約条件情報Ｉ２を参照することで、目的タスクの実行において満たすべき制約条件を、目標論理式Ｌｔａｇに付加する。そして、目標論理式生成部７２は、生成した目標論理式Ｌｔａｇを、タイムステップ論理式生成部７３に供給する。

　タイムステップ論理式生成部７３は、目標論理式生成部７２から供給された目標論理式Ｌｔａｇを、各タイムステップでの状態を表した論理式（「タイムステップ論理式Ｌｔｓ」とも呼ぶ。）に変換する。そして、タイムステップ論理式生成部７３は、生成したタイムステップ論理式Ｌｔｓを、制御入力生成部７５に供給する。

　抽象モデル生成部７４は、アプリケーション情報記憶部４１が記憶する抽象モデル情報Ｉ５と、抽象状態設定部７１から供給される認識結果Ｉｍとに基づき、作業空間における現実のダイナミクスを抽象化した抽象モデル「Σ」を生成する。この場合、抽象モデル生成部７４は、対象のダイナミクスを連続ダイナミクスと離散ダイナミクスとが混在したハイブリッドシステムとみなし、ハイブリッドシステムに基づく抽象モデルΣを生成する。抽象モデルΣの生成方法については後述する。抽象モデル生成部７４は、生成した抽象モデルΣを、制御入力生成部７５へ供給する。

　制御入力生成部７５は、タイムステップ論理式生成部７３から供給されるタイムステップ論理式Ｌｔｓと、抽象モデル生成部７４から供給される抽象モデルΣとを満たし、評価関数（たとえば、ロボットによって消費されるエネルギー量を表す関数）を最適化するタイムステップ毎のロボット５への制御入力を決定する。そして、制御入力生成部７５は、ロボット５へのタイムステップ毎の制御入力を示す情報（「制御入力情報Ｉｃｎ」とも呼ぶ。）を、サブタスクシーケンス生成部７６へ供給する。

　サブタスクシーケンス生成部７６は、制御入力生成部７５から供給される制御入力情報Ｉｃｎと、アプリケーション情報記憶部４１が記憶するサブタスク情報Ｉ４とに基づき、サブタスクのシーケンスであるサブタスクシーケンスＳｒを生成し、サブタスクシーケンスＳｒをロボット５へ供給する。

　（８－２）抽象状態設定部
　まず、抽象状態設定部７１は、物体モデル情報Ｉ６を参照し、作業空間の環境を認識する技術（画像処理技術、画像認識技術、音声認識技術、ＲＦＩＤ（Ｒａｄｉｏ　Ｆｒｅｑｕｅｎｃｙ　Ｉｄｅｎｔｉｆｉｅｒ）を用いる技術等）により計測信号を解析することで、認識結果Ｉｍを生成する。認識結果Ｉｍには、作業空間内の物体の種類、位置、及び姿勢などの情報が含まれている。また、作業空間内の物体は、例えば、ロボット５、ロボット５が取り扱う工具又は部品などの対象物、障害物及び他作業体（ロボット５以外に作業を行う人又はその他の物体）などである。

　次に、抽象状態設定部７１は、認識結果Ｉｍと、アプリケーション情報記憶部４１から取得した抽象状態指定情報Ｉ１とに基づき、作業空間内の抽象状態を設定する。この場合、まず、抽象状態設定部７１は、抽象状態指定情報Ｉ１を参照し、作業空間内において設定すべき抽象状態を認識する。なお、作業空間内において設定すべき抽象状態は、目的タスクの種類によって異なる。よって、目的タスクの種類毎に設定すべき抽象状態が抽象状態指定情報Ｉ１に規定されている場合には、抽象状態設定部７１は、指示信号Ｄ１により指定された目的タスクに対応する抽象状態指定情報Ｉ１を参照し、設定すべき抽象状態を認識する。

　図８は、ピックアンドプレイスを目的タスクとした場合の作業空間の俯瞰図を示す。図８に示す作業空間には、２つのロボットアーム５２ａ、５２ｂと、４つの対象物６１（６１ａ～６１ｄ）と、障害物６２と、対象物６１の目的地である領域Ｇとが存在している。

　この場合、まず、抽象状態設定部７１は、対象物６１の状態、障害物６２の存在範囲、ロボット５の状態、領域Ｇの存在範囲等を認識する。

　ここでは、抽象状態設定部７１は、対象物６１ａ～６１ｄの各々の中心の位置ベクトル「ｘ_１」～「ｘ_４」を、対象物６１ａ～６１ｄの位置として認識する。また、抽象状態設定部７１は、対象物を把持するロボットハンド５３ａの位置ベクトル「ｘ_ｒ１」と、ロボットハンド５３ｂの位置ベクトル「ｘ_ｒ２」とを、ロボットアーム５２ａとロボットアーム５２ｂの位置として認識する。

　同様に、抽象状態設定部７１は、対象物６１ａ～６１ｄの姿勢（図８の例では対象物が球状のため不要）、障害物６２の存在範囲、領域Ｇの存在範囲等を認識する。なお、抽象状態設定部７１は、例えば、障害物６２を直方体とみなし、領域Ｇを矩形とみなす場合には、障害物６２及び領域Ｇの各頂点の位置ベクトルを認識する。

　また、抽象状態設定部７１は、抽象状態指定情報Ｉ１を参照することで、目的タスクにおいて定義すべき抽象状態を決定する。この場合、抽象状態設定部７１は、作業空間内に存在する物体に関する認識結果Ｉｍ（例えば物体の種類毎の個数）と、抽象状態指定情報Ｉ１とに基づき、抽象状態を示す命題を定める。

　図８の例では、抽象状態設定部７１は、認識結果Ｉｍにより特定される対象物６１ａ～６１ｄに対し、夫々識別ラベル「１」～「４」を付す。また、抽象状態設定部７１は、対象物「ｉ」（ｉ＝１～４）が最終的に載置されるべき目標地点である領域Ｇ内に存在するという命題「ｇ_ｉ」を定義する。また、抽象状態設定部７１は、障害物６２に対して識別ラベル「Ｏ」を付し、対象物ｉが障害物Ｏに干渉しているという命題「ｏ_ｉ」を定義する。さらに、抽象状態設定部７１は、ロボットアーム５２同士が干渉するという命題「ｈ」を定義する。なお、抽象状態設定部７１は、対象物「ｉ」が作業テーブル（初期状態で対象物及び障害物が存在するテーブル）内に存在するという命題「ｖ_ｉ」、作業テーブル及び領域Ｇ以外の作業外領域に対象物が存在するという命題「ｗ_ｉ」などをさらに定めてもよい。作業外領域は、例えば、対象物が作業テーブルから落下した場合に対象物が存在する領域（床面等）である。

　このように、抽象状態設定部７１は、抽象状態指定情報Ｉ１を参照することで、定義すべき抽象状態を認識し、当該抽象状態を表す命題（上述の例ではｇ_ｉ、ｏ_ｉ、ｈ等）を、対象物６１の数、ロボットアーム５２の数、障害物６２の数、ロボット５の数等に応じてそれぞれ定義する。そして、抽象状態設定部７１は、抽象状態を表す命題を示す情報を、抽象状態設定情報ＩＳとして目標論理式生成部７２に供給する。

　（８－３）目標論理式生成部
　まず、目標論理式生成部７２は、指示信号Ｄ１により指定された目的タスクを、時相論理を用いた論理式に変換する。

　例えば、図８の例において、「最終的に対象物（ｉ＝２）が領域Ｇに存在する」という目的タスクが与えられたとする。この場合、目標論理式生成部７２は、目的タスクを線形論理式（ＬＴＬ：Ｌｉｎｅａｒ　Ｔｅｍｐｏｒａｌ　Ｌｏｇｉｃ）の「eventually」に相当する演算子「◇」と、抽象状態設定部７１により定義された命題「ｇ_ｉ」と用いて、論理式「◇ｇ_２」を生成する。また、目標論理式生成部７２は、演算子「◇」以外の任意の時相論理の演算子（論理積「∧」、論理和「∨」、否定「￢」、論理包含「⇒」、always「□」、next「○」、until「Ｕ」等）を用いて論理式を表現してもよい。また、線形時相論理に限らず、ＭＴＬ（Ｍｅｔｒｉｃ　Ｔｅｍｐｏｒａｌ　Ｌｏｇｉｃ）やＳＴＬ（Ｓｉｇｎａｌ　Ｔｅｍｐｏｒａｌ　Ｌｏｇｉｃ）などの任意の時相論理を用いて論理式を表現してもよい。

　なお、指示信号Ｄ１は、自然言語により目的タスクを指定する情報であってもよい。自然言語で表されたタスクを論理式に変換する方法は、種々の技術が存在する。

　次に、目標論理式生成部７２は、制約条件情報Ｉ２が示す制約条件を、目的タスクを示す論理式に付加することで、目標論理式Ｌｔａｇを生成する。

　例えば、図８に示すピックアンドプレイスに対応する制約条件として、「ロボットアーム５２同士が常に干渉しない」、「対象物ｉは障害物Ｏに常に干渉しない」の２つが制約条件情報Ｉ２に含まれていた場合、目標論理式生成部７２は、これらの制約条件を論理式に変換する。具体的には、目標論理式生成部７２は、図８の説明において抽象状態設定部７１により定義された命題「ｏ_ｉ」及び命題「ｈ」を用いて、上述の２つの制約条件を、夫々以下の論理式に変換する。
　　　　　　　□￢ｈ
　　　　　　　∧_ｉ□￢ｏ_ｉ

　よって、この場合、目標論理式生成部７２は、「最終的に対象物（ｉ＝２）が領域Ｇに存在する」という目的タスクに対応する論理式「◇ｇ_２」に、これらの制約条件の論理式を付加することで、以下の目標論理式Ｌｔａｇを生成する。
　　　　　　　（◇ｇ_２）∧（□￢ｈ）∧（∧_ｉ□￢ｏ_ｉ）

　なお、実際には、ピックアンドプレイスに対応する制約条件は、上述した２つに限られず、「ロボットアーム５２が障害物Ｏに干渉しない」、「複数のロボットアーム５２が同じ対象物を掴まない」、「対象物同士が接触しない」などの制約条件が存在する。このような制約条件についても同様に、制約条件情報Ｉ２に記憶され、目標論理式Ｌｔａｇに反映される。

　（８－４）タイムステップ論理式生成部
　タイムステップ論理式生成部７３は、目的タスクを完了するタイムステップ数（「目標タイムステップ数」とも呼ぶ。）を定め、目標タイムステップ数で目標論理式Ｌｔａｇを満たすような各タイムステップでの状態を表す命題の組み合わせを定める。この組み合わせは、通常複数存在するため、タイムステップ論理式生成部７３は、これらの組み合わせを論理和により結合した論理式を、タイムステップ論理式Ｌｔｓとして生成する。上述の組み合わせは、ロボット５に命令する動作のシーケンスを表す論理式の候補となり、以後では「候補φ」とも呼ぶ。

　ここで、図８の説明において例示した「最終的に対象物（ｉ＝２）が領域Ｇに存在する」という目的タスクが設定された場合のタイムステップ論理式生成部７３の処理の具体例について説明する。

　この場合、以下の目標論理式Ｌｔａｇが目標論理式生成部７２からタイムステップ論理式生成部７３へ供給される。
　　（◇ｇ_２）∧（□￢ｈ）∧（∧_ｉ□￢ｏ_ｉ）
　この場合、タイムステップ論理式生成部７３は、命題「ｇ_ｉ」をタイムステップの概念を含むように拡張した命題「ｇ_ｉ，ｋ」を用いる。ここで、命題「ｇ_ｉ，ｋ」は、「タイムステップｋで対象物ｉが領域Ｇに存在する」という命題である。ここで、目標タイムステップ数を「３」とした場合、目標論理式Ｌｔａｇは、以下のように書き換えられる。
　　（◇ｇ_２,３）∧（∧_{ｋ＝１,２,３}□￢ｈ_ｋ）∧（∧_{ｉ,ｋ＝１,２,３}□￢ｏ_ｉ，ｋ）

　また、◇ｇ_２,３は、以下の式に示すように書き換えることが可能である。

　このとき、上述した目標論理式Ｌｔａｇは、以下に示す４つの候補「φ_１」～「φ_４」の論理和（φ_１∨φ_２∨φ_３∨φ_４）により表される。

　よって、タイムステップ論理式生成部７３は、４つの候補φ_１～φ_４の論理和をタイムステップ論理式Ｌｔｓとして定める。この場合、タイムステップ論理式Ｌｔｓは、４つの候補φ_１～φ_４の少なくともいずれかが真となる場合に真となる。

　次に、目標タイムステップ数の設定方法について補足説明する。

　タイムステップ論理式生成部７３は、例えば、指示装置２から供給される指示信号Ｄ１により指定された作業の見込み時間に基づき、目標タイムステップ数を決定する。この場合、タイムステップ論理式生成部７３は、メモリ１２又は記憶装置４に記憶された、１タイムステップ当たりの時間幅の情報に基づき、上述の見込み時間から目標タイムステップ数を算出する。他の例では、タイムステップ論理式生成部７３は、目的タスクの種類毎に適した目標タイムステップ数を対応付けた情報を予めメモリ１２又は記憶装置４に記憶しておき、当該情報を参照することで、実行すべき目的タスクの種類に応じた目標タイムステップ数を決定する。

　好適には、タイムステップ論理式生成部７３は、目標タイムステップ数を所定の初期値に設定する。そして、タイムステップ論理式生成部７３は、制御入力生成部７５が制御入力を決定できるタイムステップ論理式Ｌｔｓが生成されるまで、目標タイムステップ数を徐々に増加させる。この場合、タイムステップ論理式生成部７３は、設定した目標タイムステップ数により制御入力生成部７５が最適化処理を行った結果、最適解を導くことができなかった場合、目標タイムステップ数を所定数（１以上の整数）だけ加算する。

　このとき、タイムステップ論理式生成部７３は、目標タイムステップ数の初期値を、ユーザが見込む目的タスクの作業時間に相当するタイムステップ数よりも小さい値に設定するとよい。これにより、タイムステップ論理式生成部７３は、不必要に大きな目標タイムステップ数を設定することを好適に抑制する。

　（８－５）抽象モデル生成部
　抽象モデル生成部７４は、抽象モデル情報Ｉ５と、認識結果Ｉｍとに基づき、抽象モデルΣを生成する。ここで、抽象モデル情報Ｉ５には、目的タスクの種類毎に、抽象モデルΣの生成に必要な情報が記録されている。例えば、目的タスクがピックアンドプレイスの場合には、対象物の位置や数、対象物を置く領域の位置、ロボット５の台数（又はロボットアーム５２の数）等を特定しない汎用的な形式の抽象モデルが抽象モデル情報Ｉ５に記録されている。そして、抽象モデル生成部７４は、抽象モデル情報Ｉ５に記録された、ロボット５のダイナミクスを含む汎用的な形式の抽象モデルに対し、認識結果Ｉｍを反映することで、抽象モデルΣを生成する。これにより、抽象モデルΣは、作業空間内の物体の状態と、ロボット５のダイナミクスとが抽象的に表されたモデルとなる。作業空間内の物体の状態は、ピックアンドプレイスの場合には、対象物の位置及び数、対象物を置く領域の位置、ロボット５の台数等を示す。

　なお、他作業体が存在する場合、他作業体の抽象化されたダイナミクスに関する情報が抽象モデル情報Ｉ５に含まれてもよい。この場合、抽象モデルΣは、作業空間内の物体の状態と、ロボット５のダイナミクスと、他作業体のダイナミクスとが抽象的に表されたモデルとなる。

　ここで、ロボット５による目的タスクの作業時においては、作業空間内のダイナミクスが頻繁に切り替わる。例えば、ピックアンドプレイスでは、ロボットアーム５２が対象物ｉを掴んでいる場合には、当該対象物ｉを動かすことができるが、ロボットアーム５２が対象物ｉを掴んでない場合には、当該対象物ｉを動かすことができない。

　以上を勘案し、本実施形態においては、ピックアンドプレイスの場合、対象物ｉを掴むという動作を論理変数「δ_ｉ」により抽象表現する。この場合、例えば、抽象モデル生成部７４は、図８に示す作業空間に対して設定すべき抽象モデルΣを、以下の式（１）により定めることができる。

　ここで、「ｕ_ｊ」は、ロボットハンドｊ（「ｊ＝１」はロボットハンド５３ａ、「ｊ＝２」はロボットハンド５３ｂ）を制御するための制御入力を示し、「Ｉ」は単位行列を示し、「０」は零行例を示す。なお、制御入力は、ここでは、一例として速度を想定しているが、加速度であってもよい。また、「δ_ｊ,ｉ」は、ロボットハンドｊが対象物ｉを掴んでいる場合に「１」であり、その他の場合に「０」である論理変数である。また、「ｘ_ｒ１」、「ｘ_ｒ２」は、ロボットハンドｊ（ｊ＝１、２）の位置ベクトル、「ｘ_１」～「ｘ_４」は、対象物ｉ（ｉ＝１～４）の位置ベクトルを示す。また、「ｈ（ｘ）」は、対象物を掴める程度に対象物の近傍にロボットハンドが存在する場合に「ｈ（ｘ）≧０」となる変数であり、論理変数δとの間で以下の関係を満たす。
　　　　　　　δ＝１　⇔　ｈ（ｘ）≧０
　この式では、対象物を掴める程度に対象物の近傍にロボットハンドが存在する場合には、ロボットハンドが対象物を掴んでいるとみなし、論理変数δを１に設定している。

　ここで、式（１）は、タイムステップｋでの物体の状態とタイムステップｋ＋１での物体の状態との関係を示した差分方程式である。そして、上記の式（１）では、把持の状態が離散値である論理変数により表わされ、物体の移動は連続値により表わされているため、式（１）はハイブリッドシステムを示している。

　式（１）では、ロボット５全体の詳細なダイナミクスではなく、対象物を実際に把持するロボット５の手先であるロボットハンドのダイナミクスのみを考慮している。これにより、制御入力生成部７５による最適化処理の計算量を好適に削減することができる。

　また、抽象モデル情報Ｉ５には、ダイナミクスが切り替わる動作（ピックアンドプレイスの場合には対象物ｉを掴むという動作）に対応する論理変数、及び、認識結果Ｉｍから式（１）の差分方程式を導出するための情報が記録されている。よって、抽象モデル生成部７４は、対象物の位置や数、対象物を置く領域（図８では領域Ｇ）、ロボット５の台数等が変動する場合であっても、抽象モデル情報Ｉ５と認識結果Ｉｍとに基づき、対象の作業空間の環境に即した抽象モデルΣを決定することができる。

　なお、抽象モデル生成部７４は、式（１）に示されるモデルに代えて、混合論理動的（ＭＬＤ：Ｍｉｘｅｄ　Ｌｏｇｉｃａｌ　Ｄｙｎａｍｉｃａｌ）システムまたはペトリネットやオートマトンなどを組み合わせたハイブリッドシステムのモデルを生成してもよい。

　（８－６）制御入力生成部
　制御入力生成部７５は、タイムステップ論理式生成部７３から供給されるタイムステップ論理式Ｌｔｓと、抽象モデル生成部７４から供給される抽象モデルΣとに基づき、最適となるタイムステップ毎のロボット５に対する制御入力を決定する。この場合、制御入力生成部７５は、目的タスクに対する評価関数を定義し、抽象モデルΣ及びタイムステップ論理式Ｌｔｓを制約条件として評価関数を最小化する最適化問題を解く。評価関数は、例えば、目的タスクの種類毎に予め定められ、メモリ１２又は記憶装置４に記憶されている。

　例えば、ピックアンドプレイスを目的タスクとした場合、制御入力生成部７５は、運ぶ対象となる対象物と当該対象物を運ぶ目標地点との距離「ｄ_ｋ」と制御入力「ｕ_ｋ」とが最小となる（即ちロボット５が費やすエネルギーを最小化する）ように評価関数を定める。上述の距離ｄ_ｋは、「最終的に対象物（ｉ＝２）が領域Ｇに存在する」という目的タスクの場合には、対象物（ｉ＝２）と領域Ｇとのタイムステップｋでの距離に相当する。

　この場合、制御入力生成部７５は、全タイムステップにおける距離ｄ_ｋのノルムの２乗と制御入力ｕ_ｋのノルムの２乗との和を評価関数として定める。そして、制御入力生成部７５は、抽象モデルΣ及びタイムステップ論理式Ｌｔｓ（即ち候補φ_ｉの論理和）を制約条件とする以下の式（２）に示す制約付き混合整数最適化問題を解く。

　ここで、「Ｔ」は、最適化の対象となるタイムステップ数であり、目標タイムステップ数であってもよく、後述するように、目標タイムステップ数よりも小さい所定数であってもよい。この場合、好適には、制御入力生成部７５は、論理変数を連続値に近似する（連続緩和問題とする）。これにより、制御入力生成部７５は、計算量を好適に低減することができる。なお、線形論理式（ＬＴＬ）に代えてＳＴＬを採用した場合には、非線形最適化問題として記述することが可能である。

　また、制御入力生成部７５は、目標タイムステップ数が長い場合（例えば所定の閾値より大きい場合）、最適化に用いるタイムステップ数を、目標タイムステップ数より小さい値（例えば上述の閾値）に設定してもよい。この場合、制御入力生成部７５は、例えば、所定のタイムステップ数が経過する毎に、上述の最適化問題を解くことで、逐次的に制御入力ｕ_ｋを決定する。

　好適には、制御入力生成部７５は、目的タスクの達成状態に対する中間状態に相当する所定のイベント毎に、上述の最適化問題を解き、使用すべき制御入力ｕ_ｋを決定してもよい。この場合、制御入力生成部７５は、次のイベント発生までのタイムステップ数を、最適化に用いるタイムステップ数に設定する。上述のイベントは、例えば、作業空間におけるダイナミクスが切り替わる事象である。例えば、ピックアンドプレイスを目的タスクとした場合には、ロボット５が対象物を掴む、ロボット５が運ぶべき複数の対象物のうちの１つの対象物を目的地点へ運び終える、などがイベントとして定められる。イベントは、例えば、目的タスクの種類毎に予め定められており、目的タスクの種類毎にイベントを特定する情報が記憶装置４に記憶されている。

　（８－７）サブタスクシーケンス生成部
　サブタスクシーケンス生成部７６は、制御入力生成部７５から供給される制御入力情報Ｉｃｎと、アプリケーション情報記憶部４１が記憶するサブタスク情報Ｉ４とに基づき、サブタスクシーケンスＳｒを生成する。この場合、サブタスクシーケンス生成部７６は、サブタスク情報Ｉ４を参照することで、ロボット５が受け付け可能なサブタスクを認識し、制御入力情報Ｉｃｎが示すタイムステップ毎の制御入力をサブタスクに変換する。

　例えば、サブタスク情報Ｉ４には、ピックアンドプレイスを目的タスクとする場合にロボット５が受け付け可能なサブタスクとして、ロボットハンドの移動（リーチング）とロボットハンドの把持（グラスピング）の２つのサブタスクを示す関数が定義されている。この場合、リーチングを表す関数「Ｍｏｖｅ」は、例えば、当該関数実行前のロボット５の初期状態、当該関数実行後のロボット５の最終状態、及び当該関数の実行に要する所要時間をそれぞれ引数とする関数である。また、グラスピングを表す関数「Ｇｒａｓｐ」は、例えば、当該関数実行前のロボット５の状態、及び当該関数実行前の把持対象の対象物の状態、論理変数δをそれぞれ引数とする関数である。ここで、関数「Ｇｒａｓｐ」は、論理変数δが「１」のときに掴む動作を行うこと表し、論理変数δが「０」のときに放す動作を行うこと表す。この場合、サブタスクシーケンス生成部７６は、関数「Ｍｏｖｅ」を、制御入力情報Ｉｃｎが示すタイムステップ毎の制御入力により定まるロボットハンドの軌道に基づき決定し、関数「Ｇｒａｓｐ」を、制御入力情報Ｉｃｎが示すタイムステップ毎の論理変数δの遷移に基づき決定する。

　そして、サブタスクシーケンス生成部７６は、関数「Ｍｏｖｅ」と関数「Ｇｒａｓｐ」とにより構成されるサブタスクシーケンスＳｒを生成し、当該サブタスクシーケンスＳｒをロボット５に供給する。例えば、目的タスクが「最終的に対象物（ｉ＝２）が領域Ｇに存在する」の場合、サブタスクシーケンス生成部７６は、対象物（ｉ＝２）に最も近いロボットハンドに対し、関数「Ｍｏｖｅ」、関数「Ｇｒａｓｐ」、関数「Ｍｏｖｅ」、関数「Ｇｒａｓｐ」のサブタスクシーケンスＳｒを生成する。この場合、対象物（ｉ＝２）に最も近いロボットハンドは、１回目の関数「Ｍｏｖｅ」により対象物（ｉ＝２）の位置まで移動し、１回目の関数「Ｇｒａｓｐ」により対象物（ｉ＝２）を把持し、２回目の関数「Ｍｏｖｅ」により領域Ｇまで移動し、２回目の関数「Ｇｒａｓｐ」により対象物（ｉ＝２）を領域Ｇに載置する。

　（９）タスク指定画面
　次に、指示装置２が目的タスクに関する指示を作業者から受け付ける場合に表示する画面の一例について説明する。

　図９は、指示装置２が表示する目的タスクを指定するタスク指定画面の表示例を示す。指示装置２は、例えば、タスク実行システム５０のリストから作業者が選択したタスク実行システム５０のロボットコントローラ１から、所定の表示信号を受信することで、図９に示すタスク指定画面を表示している。図９に示すタスク指定画面は、主に、タスク種類指定欄２５と、作業空間表示欄２６と、各種ボタン２８（２８ａ、２８ｂ）とを有する。

　指示装置２は、タスク種類指定欄２５において、目的タスクの種類を指定する入力を受け付ける。ここでは、一例として、タスク種類指定欄２５はプルダウンメニュー形式の入力欄であり、指示装置２は、受付可能な目的タスクの種類の候補を、タスク種類指定欄２５において選択可能に一覧表示する。ここでは、指示装置２には、ピックアンドプレイスが目的タスクの種類として指定されている。なお、目的タスクはピックアンドプレイスに限らず、ねじ回しを伴うタスク、移動型ロボットが物を移動させるタスクなど種々のタスクであってもよい。

　また、指示装置２は、作業空間表示欄２６において、計測装置７が作業空間内を撮像した画像（作業空間画像）を表示し、タスク種類指定欄２５において指定された目的タスクの実行に必要な指定を受け付ける。図９の例では、指示装置２は、作業空間表示欄２６上で対象物と目的地とを夫々指定する入力を受け付ける。ここでは、一例として、指示装置２は、対象物を指定したマーク２７ａ～２７ｄを実線により表示し、目的地を指定したマーク２７ｅを破線により表示している。そして、指示装置２は、対象物決定ボタン２８ａが選択されたことを検知した場合、ユーザが描いたマーク２７ａ～２７ｄの位置情報を、対象物の位置を特定する情報として認識する。また、指示装置２は、さらに目的地決定ボタン２８ｂが選択されたことを検知した場合、対象物決定ボタン２８ａの選択後にユーザが描いたマーク２７ｅの位置情報を、目的地を特定する情報として認識する。そして、指示装置２は、これらの対象物及び目的地を特定する情報（ここでは作業空間画像上での各マークの位置情報）を、指示信号Ｄ１として対象のタスク実行システム５０に属するロボットコントローラ１に供給する。

　このように、図９に示されるタスク指定画面によれば、指示装置２は、目的タスクの種類の指定及び目的タスクに関連する物体の指定に関するユーザ入力を好適に受け付け、目的タスクを指定する指示信号Ｄ１を好適にロボットコントローラ１に供給することができる。

　なお、指示装置２は、対象物及び目的地を丸印で囲む入力を受け付ける代わりに、タッチ操作又はクリック操作により対象物及び目的地を構成する一部の画素を夫々指定する入力を受け付けてもよい。この場合、指示装置２は、指定された各画素の位置情報を、対象物及び目的地を夫々特定する情報とみなし、指示信号Ｄ１としてロボットコントローラ１に供給する。また、指示装置２は、計測装置７が生成した作業空間画像を作業空間表示欄２６に表示する代わりに、作業空間内の環境を再現したＣＡＤ画像を作業空間表示欄２６に表示してもよい。この場合、ロボットコントローラ１は、抽象状態設定部７１が生成した認識結果Ｉｍと、対象物等に関するＣＡＤデータを記録した物体モデル情報Ｉ６とに基づき、作業空間内の環境を再現したＣＡＤ画像を表示する表示信号を指示装置２に送信する。

　（１０）処理フロー
　図１０は、第１実施形態において情報収集装置３が実行するロボット作業関連情報Ｄ２の受信及び蓄積に関する処理の概要を示すフローチャートの一例である。情報収集装置３は、図１０に示すフローチャートの処理を、指示装置２により目的タスクが指定されたタスク実行システム５０の各々を対象として実行する。

　まず、情報収集装置３の情報取得部３５は、ロボット構成情報Ｄ２１を取得する（ステップＳ１０１）。この場合、情報取得部３５は、少なくともロボット構成情報Ｄ２１を含んだロボット作業関連情報Ｄ２を対象のタスク実行システム５０から受信することで、ロボット構成情報Ｄ２１を取得する。その後、情報取得部３５は、対象のタスク実行システム５０からロボット構成情報Ｄ２１以外のロボット作業関連情報Ｄ２を受信する（ステップＳ１０２）。

　次に、情報取得部３５は、収集条件が満たされるか否かの判定を行う（ステップＳ１０３）。この場合、情報取得部３５は、対象のタスク実行システム５０から送信されるロボット作業関連情報Ｄ２について、設定した収集条件が満たされるか否か判定する。この収集条件は、ステップＳ１０１で取得したロボット構成情報Ｄ２１が示すロボット５の構成に関する条件であってもよく、ロボット５の構成以外の条件（例えば日時に関する条件）であってもよい。

　そして、タスク識別子設定部３６は、ステップＳ１０３での収集条件の判定において、収集条件が満たされたと判定した場合（ステップＳ１０４；Ｙｅｓ）、ステップＳ１０３で受信したロボット作業関連情報Ｄ２に対してタスク識別子を設定し、タスク識別子を設定したロボット作業関連情報Ｄ２をロボット作業関連情報記憶部４２に記憶する（ステップＳ１０５）。この場合、タスク識別子設定部３６は、ロボット作業関連情報Ｄ２を日時情報に基づきサブタスクの実行期間毎に区分けし、対応するサブタスクを少なくとも表すタスク識別子を、区分けしたロボット作業関連情報Ｄ２の各々に対して設定する。

　一方、ステップＳ１０２での収集条件の判定において、収集条件が満たされなかったと判定した場合（ステップＳ１０４；Ｎｏ）、情報取得部３５は、受信したロボット作業関連情報Ｄ２を破棄する、又は、タスク識別子の設定を行うことなく受信したロボット作業関連情報Ｄ２をそのままロボット作業関連情報記憶部４２に記憶する（ステップＳ１０６）。

　次に、情報収集装置３は、対象のタスク実行システム５０において目的タスクが完了したか否か判定する（ステップＳ１０７）。この場合、例えば、情報収集装置３は、ロボット作業関連情報Ｄ２を所定時間長以上受信しなくなった場合、又は、目的タスクが完了した旨の情報をタスク実行システム５０又は指示装置２から受信した場合等に、対象のタスク実行システム５０において目的タスクが完了したと判定する。そして、情報収集装置３は、目的タスクが完了したと判定した場合（ステップＳ１０７；Ｙｅｓ）、フローチャートの処理を終了する。一方、目的タスクが完了していないと判定した場合（ステップＳ１０７；Ｎｏ）、情報収集装置３は、ステップＳ１０２へ処理を戻し、引き続きロボット作業関連情報Ｄ２の受信及び蓄積に関する処理を行う。

　（１１）変形例
　次に、第１実施形態の変形例について説明する。以下の変形例は任意に組み合わせて上記の第１実施形態に適用してもよい。

　（第１変形例）
　情報収集装置３の一部の機能が各タスク実行システム５０に備わってもよい。例えば、各タスク実行システム５０のロボットコントローラ１は、情報取得部３５の一部の機能に相当する処理を実行してもよい。

　この場合、各タスク実行システム５０のロボットコントローラ１は、対象のタスク実行システム５０において生成された各種情報をロボット５及び計測装置７等から収集してロボット作業関連情報Ｄ２を生成する。また、ロボットコントローラ１は、指示装置２又は情報収集装置３等から供給された又はメモリ１２に予め記憶された収集条件が満たされるか否か判定し、収集条件が満たされると判定した場合に限り、ロボット作業関連情報Ｄ２を情報収集装置３に送信する。この態様においても、情報収集装置３は、ロボット作業関連情報Ｄ２をタスク識別子によりタグ付けした情報を蓄積してアプリケーション情報の更新等に好適に使用することができる。

　また、いずれかのロボットコントローラ１は、情報収集装置３として機能し、図１に示すロボットコントローラ１の処理と情報収集装置３の処理との両方を実行してもよい。このように、ロボット統括システム１００は、マスター／スレーブ方式により実現されてもよい。さらに別の例では、各タスク実行システム５０のロボットコントローラ１が夫々情報収集装置３として機能してもよい。この場合、ロボットコントローラ１は、自身が属するタスク実行システム５０内で生成された作業関連情報の収集、タスク識別子の設定、及びタスク識別子が設定された作業関連情報の記憶などを行う。

　（第２変形例）
　図７に示すロボットコントローラ１のブロック構成は一例であり、種々の変更がなされてもよい。

　例えば、ロボット５に命令する動作のシーケンスの候補φの情報が記憶装置４に予め記憶され、ロボットコントローラ１は、当該情報に基づき、制御入力生成部７５の最適化処理を実行する。これにより、ロボットコントローラ１は、最適な候補φの選定とロボット５の制御入力の決定を行う。この場合、ロボットコントローラ１は、サブタスクシーケンスＳｒの生成において、抽象状態設定部７１、目標論理式生成部７２及びタイムステップ論理式生成部７３に相当する機能を有しなくともよい。このように、図７に示すロボットコントローラ１の一部の機能ブロックの実行結果に関する情報が予めアプリケーション情報記憶部４１に記憶されていてもよい。

　他の例では、アプリケーション情報には、目的タスクに対応するサブタスクシーケンスＳｒを設計するためのフローチャートなどの設計情報が予め含まれており、ロボットコントローラ１は、当該設計情報を参照することで、サブタスクシーケンスＳｒを生成してもよい。なお、予め設計されたタスクシーケンスに基づきタスクを実行する具体例については、例えば特開２０１７－３９１７０号に開示されている。

　＜第２実施形態＞
　図１１は、第２実施形態における情報収集装置３Ｘの概略構成図を示す。情報収集装置３Ｘは、主に、情報取得手段３５Ｘと、タスク識別子設定手段３６Ｘとを有する。なお、情報収集装置３Ｘは、複数の装置から構成されてもよい。

　情報取得手段３５Ｘは、ロボットの作業に関連する作業関連情報を取得する。情報取得手段３５Ｘは、例えば、第１実施形態における情報取得部３５とすることができる。

　タスク識別子設定手段３６Ｘは、作業関連情報に対し、ロボットが実行するタスクの識別子を設定する。タスクの識別子が設定された作業関連情報は、情報収集装置３Ｘが備えるメモリ又は外部メモリに記憶される。タスク識別子設定手段３６Ｘは、例えば、第１実施形態におけるタスク識別子設定部３６とすることができる。

　図１２は、第２実施形態において情報収集装置３Ｘが実行するフローチャートの一例を示す。情報取得手段３５Ｘは、ロボットの作業に関連する作業関連情報を取得する（ステップＳ２０１）。タスク識別子設定手段３６Ｘは、作業関連情報に対し、ロボットが実行するタスクの識別子を設定する（ステップＳ２０２）。

　第２実施形態によれば、情報収集装置３Ｘは、ロボットの作業に関連する作業関連情報に対して、ロボットが実行するタスクの識別子を設定する。これにより、タスク毎の作業関連情報の分析・学習等を円滑化することができる。

　なお、上述した各実施形態において、プログラムは、様々なタイプの非一時的なコンピュータ可読媒体（Non-Transitory Computer Readable Medium）を用いて格納され、コンピュータであるプロセッサ等に供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記憶媒体（Tangible Storage Medium）を含む。非一時的なコンピュータ可読媒体の例は、磁気記憶媒体（例えばフレキシブルディスク、磁気テープ、ハードディスクドライブ）、光磁気記憶媒体（例えば光磁気ディスク）、ＣＤ－ＲＯＭ（Read Only Memory）、ＣＤ－Ｒ、ＣＤ－Ｒ／Ｗ、半導体メモリ（例えば、マスクＲＯＭ、ＰＲＯＭ（Programmable ROM）、ＥＰＲＯＭ（Erasable PROM）、フラッシュＲＯＭ、ＲＡＭ（Random Access Memory））を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体（Transitory Computer Readable Medium）によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。

　以上、実施形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。すなわち、本願発明は、請求の範囲を含む全開示、技術的思想にしたがって当業者であればなし得るであろう各種変形、修正を含むことは勿論である。また、引用した上記の特許文献等の各開示は、本書に引用をもって繰り込むものとする。

　１　ロボットコントローラ
　２　指示装置
　３、３Ｘ　情報収集装置
　５　ロボット
　７　計測装置
　４１　アプリケーション情報記憶部
　４２　ロボット作業関連情報記憶部
　４３　更新アプリケーション情報記憶部
　５０　タスク実行システム
　１００　ロボット統括システム

Claims

　ロボットの作業に関連する作業関連情報を取得する情報取得手段と、
　前記作業関連情報に対し、前記ロボットが実行するタスクの識別子を設定するタスク識別子設定手段と、
を有する情報収集装置。
　前記識別子は、前記ロボットが受付可能な単位のタスクであるサブタスクを少なくとも識別する情報であり、
　前記タスク識別子設定手段は、前記サブタスクの各々の実行期間に基づき区分けした前記作業関連情報の各々に対し、対応するサブタスクを表す前記識別子を設定する、請求項１に記載の情報収集装置。
　前記ロボットは、前記ロボットが実行すべき目的となる目的タスクを時相論理により表した論理式に基づき生成された前記サブタスクのシーケンスを実行する、請求項２に記載の情報収集装置。
　前記識別子は、前記サブタスクと、前記ロボットが実行すべき目的となる目的タスクとを識別する情報であり、
　前記タスク識別子設定手段は、前記サブタスクの各々の実行期間に基づき区分けした前記作業関連情報の各々に対し、対応するサブタスク及び目的タスクを表す前記識別子を設定する、請求項２または３に記載の情報収集装置。
　前記情報取得手段は、前記作業関連情報の収集に関する判定条件である収集条件が満たされるか否か判定し、
　前記タスク識別子設定手段は、当該収集条件が満たされる場合、作業関連情報に対して前記識別子を設定する、請求項１～４のいずれか一項に記載の情報収集装置。
　前記情報取得手段は、前記収集条件が満たされない場合、前記作業関連情報を破棄または前記識別子を設定せずに記憶する、請求項５に記載の情報収集装置。
　前記ロボットは、複数の環境の各々において設けられた１又は複数のロボットであり、
　前記複数の環境の各々において前記１又は複数のロボットを含むタスク実行システムが存在し、
　前記情報取得手段は、前記タスク実行システムの各々から前記作業関連情報を受信し、
　前記タスク識別子設定手段は、前記タスク実行システムの各々から受信する前記作業関連情報に対し、対応する前記１又は複数のロボットが実行するタスクを表す前記識別子を設定する、請求項１～６のいずれか一項に記載の情報収集装置。
　前記情報取得手段は、前記ロボットの構成に関するロボット構成情報を取得する、請求項１～７のいずれか一項に記載の情報収集装置。
　コンピュータが、
　ロボットの作業に関連する作業関連情報を取得し、
　前記作業関連情報に対し、前記ロボットが実行するタスクの識別子を設定する、
情報収集方法。
　ロボットの作業に関連する作業関連情報を取得し、
　前記作業関連情報に対し、前記ロボットが実行するタスクの識別子を設定する処理をコンピュータに実行させるプログラムが格納された記憶媒体。