JP7364032B2 - 制御装置、制御方法及びプログラム - Google Patents

制御装置、制御方法及びプログラム Download PDF

Info

Publication number
JP7364032B2
JP7364032B2 JP2022502363A JP2022502363A JP7364032B2 JP 7364032 B2 JP7364032 B2 JP 7364032B2 JP 2022502363 A JP2022502363 A JP 2022502363A JP 2022502363 A JP2022502363 A JP 2022502363A JP 7364032 B2 JP7364032 B2 JP 7364032B2
Authority
JP
Japan
Prior art keywords
work
motion
robot
work body
control device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022502363A
Other languages
English (en)
Other versions
JPWO2021171358A1 (ja
JPWO2021171358A5 (ja
Inventor
博之 大山
伸治 加美
雅嗣 小川
永哉 若山
峰斗 佐藤
岳大 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2021171358A1 publication Critical patent/JPWO2021171358A1/ja
Publication of JPWO2021171358A5 publication Critical patent/JPWO2021171358A5/ja
Application granted granted Critical
Publication of JP7364032B2 publication Critical patent/JP7364032B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1628Programme controls characterised by the control loop
    • B25J9/163Programme controls characterised by the control loop learning, adaptive, model based, rule based expert control
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1656Programme controls characterised by programming, planning systems for manipulators
    • B25J9/1661Programme controls characterised by programming, planning systems for manipulators characterised by task planning, object-oriented languages
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J13/00Controls for manipulators
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/39Robotics, robotics to robotics hand
    • G05B2219/39091Avoid collision with moving obstacles
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/40Robotics, robotics mapping to robotics vision
    • G05B2219/40108Generating possible sequence of steps as function of timing and conflicts
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/40Robotics, robotics mapping to robotics vision
    • G05B2219/40202Human robot coexistence
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/40Robotics, robotics mapping to robotics vision
    • G05B2219/40336Optimize multiple constraints or subtasks

Description

本発明は、ロボットに作業させるタスクに関する処理を行う制御装置、制御方法及び記録媒体の技術分野に関する。
ロボットに作業させるタスクが与えられた場合に、当該タスクを実行するために必要なロボットの制御を行う制御手法が提案されている。例えば、特許文献1には、ハンドを有するロボットにより複数の物品を把持して容器に収容する場合に、ハンドが物品を把持する順序の組み合わせを決定し、組み合わせ毎に算出した指標に基づき、収容する物品の順序を決定するロボット制御装置が開示されている。
特開2018-51684号公報
ロボットがタスクを実行する場合、与えられたタスクによっては、他のロボット又は他の作業者と同一の作業空間にて作業を行う必要がある。この場合のロボットの動作の決定について、特許文献1には何ら開示されていない。
本発明の目的の1つは、上述した課題を鑑み、ロボットの動作シーケンスを好適に生成することが可能な制御装置、制御方法及び記録媒体を提供することである。
制御装置の一の態様は、制御装置であって、タスクを実行するロボットと他作業体とが協働作業を行う作業空間内の状態を検出する検出装置が出力する検出信号を取得する取得手段と、前記検出信号に基づき認識された前記作業空間内の物体の種類及び状態に関する認識結果に基づき、前記ロボットに実行させる動作シーケンスを生成する動作シーケンス生成手段と、を有し、前記物体には、前記他作業体と、前記ロボットの作業対象となる対象物とが含まれ、前記動作シーケンス生成手段は、前記他作業体の状態と、前記対象物の状態とに関する前記認識結果に基づき、前記動作シーケンスを生成する
制御方法の一の態様は、コンピュータにより、タスクを実行するロボットと他作業体とが協働作業を行う作業空間内の状態を検出する検出装置が出力する検出信号を取得し、前記検出信号に基づき認識された前記作業空間内の物体の種類及び状態に関する認識結果に基づき、前記ロボットに実行させる動作シーケンスを生成し、前記物体には、前記他作業体と、前記ロボットの作業対象となる対象物とが含まれ、前記他作業体の状態と、前記対象物の状態とに関する前記認識結果に基づき、前記動作シーケンスを生成する、制御方法である。
プログラムの一の態様は、タスクを実行するロボットと他作業体とが協働作業を行う作業空間内の状態を検出する検出装置が出力する検出信号を取得する取得手段と、前記検出信号に基づき認識された前記作業空間内の物体の種類及び状態に関する認識結果に基づき、前記ロボットに実行させる動作シーケンスを生成する動作シーケンス生成手段としてコンピュータを機能させ、前記物体には、前記他作業体と、前記ロボットの作業対象となる対象物とが含まれ、前記動作シーケンス生成手段は、前記他作業体の状態と、前記対象物の状態とに関する前記認識結果に基づき、前記動作シーケンスを生成する、プログラムである。
本発明によれば、ロボットと他作業体とが協働作業を行う場合に、ロボットの動作シーケンスを好適に生成することができる。
ロボット制御システムの構成を示す。 制御装置のハードウェア構成を示す。 アプリケーション情報のデータ構造の一例を示す。 制御装置の機能ブロックの一例である。 認識部の機能ブロックの一例である。 動作シーケンス生成部の機能ブロックの一例である。 作業空間の俯瞰図を示す。 第1実施形態において制御装置が実行するロボット制御処理の概要を示すフローチャートの一例である。 (A)第1応用例における作業空間の俯瞰図の一例である。(B)第2応用例における作業空間の俯瞰図の一例である。(C)第3応用例における作業空間の俯瞰図の一例である。 変形例におけるロボット制御処理の概要を示すフローチャートの一例である。 第2実施形態における制御装置の概略構成図である。 第2実施形態における制御装置の処理手順を示すフローチャートの一例である。
以下、図面を参照しながら、制御装置、制御方法及び記録媒体の実施形態について説明する。
<第1実施形態>
(1)システム構成
図1は、第1実施形態に係るロボット制御システム100の構成を示す。ロボット制御システム100は、主に、制御装置1と、入力装置2と、表示装置3と、記憶装置4と、ロボット5と、検出装置7と、を備える。
制御装置1は、ロボット5に実行させるタスク(「目的タスク」とも呼ぶ。)が指定された場合に、ロボット5が受付可能な単純なタスクのタイムステップ(時間刻み)毎のシーケンスに目的タスクを変換し、当該シーケンスをロボット5に供給する。以後では、ロボット5が受付可能な単位により目的タスクを分解したタスク(コマンド)を、「サブタスク」と呼び、目的タスクを達成するためにロボット5が実行すべきサブタスクのシーケンスを「サブタスクシーケンス」とも呼ぶ。サブタスクシーケンスは、ロボット5の一連の動作を規定する動作シーケンスに相当する。
制御装置1は、入力装置2、表示装置3、記憶装置4、ロボット5及び検出装置7と、通信網を介し、又は、有線若しくは無線による直接通信により、データ通信を行う。例えば、制御装置1は、入力装置2から、目的タスクを指定するための入力信号「S1」を受信する。また、制御装置1は、表示装置3に対し、ロボット5に実行させるタスクに関する表示を行うための表示信号「S2」を送信する。また、制御装置1は、ロボット5の制御に関する制御信号「S3」をロボット5に送信する。制御装置1は、検出装置7から検出信号「S4」を受信する。
入力装置2は、ユーザの入力を受け付けるインターフェースであり、例えば、タッチパネル、ボタン、キーボード、音声入力装置などが該当する。入力装置2は、ユーザの入力に基づき生成した入力信号S1を制御装置1へ供給する。表示装置3は、例えば、ディスプレイ、プロジェクタ等であり、制御装置1から供給される表示信号S2に基づき、所定の表示を行う。
記憶装置4は、アプリケーション情報記憶部41を有する。アプリケーション情報記憶部41は、目的タスクからサブタスクシーケンスを生成するために必要なアプリケーション情報を記憶する。アプリケーション情報の詳細は、図3を参照しながら後述する。記憶装置4は、制御装置1に接続又は内蔵されたハードディスクなどの外部記憶装置であってもよく、フラッシュメモリなどの記録媒体であってもよい。また、記憶装置4は、制御装置1とデータ通信を行うサーバ装置であってもよい。この場合、記憶装置4は、複数のサーバ装置から構成されてもよい。
ロボット5は、制御装置1の制御に基づき、他作業体8と協働作業を行う。図1に示すロボット5は、一例として、物を把持可能な複数(2つ)のロボットアーム52を制御対象として有し、作業空間6内に存在する対象物61のピックアンドプレイス(摘み上げて移動させる処理)を行う。ロボット5は、ロボット制御部51を有する。ロボット制御部51は、制御信号S3によりロボットアーム52毎に指定されたサブタスクシーケンスに基づき、各ロボットアーム52の動作制御を行う。
作業空間6は、ロボット5が他作業体8と協働作業を行う作業空間である。図1では、作業空間6には、ロボット5による作業対象となる複数の対象物61と、ロボット5の作業において障害となる障害物62と、ロボットアーム52と、ロボット5と協働して作業を行う他作業体8と、が存在している。他作業体8は、作業空間6内でロボット5と共に作業を行う作業者であってもよく、作業空間6内でロボット5と共に作業を行う作業ロボットであってもよい。
検出装置7は、作業空間6内の状態を検出するカメラ、測域センサ、ソナーまたはこれらの組み合わせとなる1又は複数のセンサである。検出装置7は、生成した検出信号S4を制御装置1に供給する。検出信号S4は、作業空間6内を撮影した画像データであってもよく、作業空間6内の物体の位置を示す点群データであってもよい。検出装置7は、作業空間6内で移動する自走式又は飛行式のセンサ(ドローンを含む)であってもよい。また、検出装置7は、ロボット5に設けられたセンサ、他作業体8又は作業空間6内に存在するベルトコンベアなどの他の工作機器に設けられたセンサなどを含んでもよい。また、検出装置7は、作業空間6内の音を検出するセンサを含んでもよい。このように、検出装置7は、作業空間6内の状態を検出する種々のセンサであって、任意の場所に設けられたセンサであってもよい。
なお、他作業体8には、他作業体8の動作認識(モーションキャプチャ)を行うためのマーカ又はセンサが設けられてもよい。この場合、他作業体8の関節、手先などの他作業体8の動作認識において特徴的な箇所である特徴点に、上述のマーカ又はセンサが設けられる。特徴点に設けられたマーカの位置を検出するセンサ又は特徴点に設けられたセンサは、検出装置7の一例である。
なお、図1に示すロボット制御システム100の構成は一例であり、当該構成に種々の変更が行われてもよい。例えば、ロボット5は複数台存在してもよい。また、ロボット5は、ロボットアーム52を1つのみ又は3つ以上備えてもよい。これらの場合であっても、制御装置1は、目的タスクに基づき、ロボット5毎又はロボットアーム52毎に実行すべきサブタスクシーケンスを生成し、当該サブタスクシーケンスを示す制御信号S3を、対象のロボット5に送信する。また、検出装置7は、ロボット5の一部であってもよい。また、ロボット制御部51は、ロボット5とは別体に構成されてもよく、制御装置1に含まれてもよい。また、入力装置2及び表示装置3は、夫々、制御装置1に内蔵されるなどの態様により、制御装置1と同一の装置(例えばタブレット型端末)として構成されてもよい。また、制御装置1は、複数の装置から構成されてもよい。この場合、制御装置1を構成する複数の装置は、予め割り当てられた処理を実行するために必要な情報の授受を、これらの複数の装置間において行う。また、ロボット5には、制御装置1の機能が組み込まれていてもよい。
(2)制御装置のハードウェア構成
図2は、制御装置1のハードウェア構成を示す。制御装置1は、ハードウェアとして、プロセッサ11と、メモリ12と、インターフェース13とを含む。プロセッサ11、メモリ12及びインターフェース13は、データバス19を介して接続されている。
プロセッサ11は、メモリ12に記憶されているプログラムを実行することにより、所定の処理を実行する。プロセッサ11は、CPU(Central Processing Unit)、GPU(Graphics Processing Unit)などのプロセッサである。
メモリ12は、RAM(Random Access Memory)、ROM(Read Only Memory)などの各種のメモリにより構成される。また、メモリ12には、制御装置1が所定の処理を実行するためのプログラムが記憶される。また、メモリ12は、作業メモリとして使用され、記憶装置4から取得した情報等を一時的に記憶する。なお、メモリ12は、記憶装置4として機能してもよい。同様に、記憶装置4は、制御装置1のメモリ12として機能してもよい。なお、制御装置1が実行するプログラムは、メモリ12以外の記録媒体に記憶されてもよい。
インターフェース13は、制御装置1と外部装置とを電気的に接続するためのインターフェースである。例えば、インターフェース13は、制御装置1と入力装置2とを接続するためのインターフェース、制御装置1と表示装置3とを接続するためのインターフェース、及び制御装置1と記憶装置4とを接続するためのインターフェースを含む。また、インターフェース13は、制御装置1とロボット5とを接続するためのインターフェース、及び制御装置1と検出装置7とを接続するためのインターフェースを含む。これらの接続は、有線接続であってもよく、無線接続であってもよい。例えば、制御装置1と外部装置とを接続するためのインターフェースは、プロセッサ11の制御に基づき他の装置とデータの送受信を有線又は無線により行うための通信インターフェースであってもよい。他の例では、制御装置1と外部装置とは、ケーブル等により接続されてもよい。この場合、インターフェース13は、外部装置とデータの授受を行うためのUSB(Universal Serial Bus)、SATA(Serial AT Attachment)などに準拠したインターフェースを含む。
なお、制御装置1のハードウェア構成は、図2に示す構成に限定されない。例えば、制御装置1は、入力装置2、表示装置3及び記憶装置4の少なくとも一方を含んでもよい。また、制御装置1は、スピーカなどの音出力装置と接続又は内蔵してもよい。これらの場合、制御装置1は、入力機能及び出力機能が本体と一体となったタブレット型端末等であってもよい。
(3)アプリケーション情報
次に、アプリケーション情報記憶部41が記憶するアプリケーション情報のデータ構造について説明する。
図3は、アプリケーション情報記憶部41に記憶されるアプリケーション情報のデータ構造の一例を示す。図3に示すように、アプリケーション情報記憶部41は、抽象状態指定情報I1と、制約条件情報I2と、動作限界情報I3と、サブタスク情報I4と、抽象モデル情報I5と、物体モデル情報I6と、他作業体動作モデル情報I7と、動作認識情報I8と、動作予測情報I9と、作業効率情報I10とを含む。
抽象状態指定情報I1は、サブタスクシーケンスの生成にあたり定義する必要がある抽象状態を指定する情報である。この抽象状態は、作業空間6内における物体の抽象的な状態であって、後述する目標論理式において使用する命題として定められる。例えば、抽象状態指定情報I1は、目的タスクの種類毎に、定義する必要がある抽象状態を指定する。なお、目的タスクは、例えば、ピックアンドプレイス、移動物体の捕獲、ねじ回しなどの種々の種類のタスクであってもよい。
制約条件情報I2は、目的タスクを実行する際の制約条件を示す情報である。制約条件情報I2は、例えば、目的タスクがピックアンドプレイスの場合、障害物にロボット5(ロボットアーム52)が接触してはいけないという制約条件、ロボットアーム52同士が接触してはいけないという制約条件などを示す。なお、制約条件情報I2は、目的タスクの種類毎に夫々適した制約条件を記録した情報であってもよい。
動作限界情報I3は、制御装置1により制御が行われるロボット5の動作限界に関する情報を示す。動作限界情報I3は、例えば、図1に示すロボット5の場合には、ロボットアーム52のリーチングの最高速度等を規定する情報である。
サブタスク情報I4は、ロボット5が受付可能なサブタスクの情報を示す。例えば、目的タスクがピックアンドプレイスの場合には、サブタスク情報I4は、ロボットアーム52の移動であるリーチングと、ロボットアーム52による把持であるグラスピングとをサブタスクとして規定する。サブタスク情報I4は、目的タスクの種類毎に使用可能なサブタスクの情報を示すものであってもよい。
抽象モデル情報I5は、作業空間6におけるダイナミクスを抽象化した抽象モデルに関する情報である。抽象モデルは、ロボット5に関する現実のダイナミクスをハイブリッドシステムにより抽象化したモデルにより表されている。抽象モデル情報I5は、上述のハイブリッドシステムにおけるダイナミクスの切り替わりの条件を示す情報を含む。切り替わりの条件は、例えば、図1に示すピックアンドプレイスの場合、対象物61はロボットアーム52の手先により把持されなければ移動できないという条件などが該当する。抽象モデル情報I5は、目的タスクの種類毎に適した抽象モデルに関する情報を有している。なお、他作業体8のダイナミクスを抽象化した動的モデルに関する情報は、後述する他作業体動作モデル情報I7として、抽象モデル情報I5とは別に記憶されている。
物体モデル情報I6は、検出装置7が生成した検出信号S4から認識すべき各物体(図1の例では、ロボットアーム52、対象物61、他作業体8及び障害物62など)の物体モデルに関する情報である。物体モデル情報I6は、例えば、上述した各物体の種類、位置、又は/及び姿勢を制御装置1が認識するために必要な情報と、各物体の3次元形状を認識するためのCAD(Computer Aided Design)データなどの3次元形状情報とを含んでいる。前者の情報は、ニューラルネットワークなどの機械学習における学習モデルを学習することで得られた推論器のパラメータを含む。この推論器は、例えば、画像が入力された場合に、当該画像において被写体となる物体の種類、位置、姿勢等を出力するように予め学習される。
他作業体動作モデル情報I7は、他作業体8のダイナミクスを抽象化した動的モデルに関する情報である。本実施形態では、他作業体動作モデル情報I7は、対象とする他作業体8の想定される動作毎に、当該動作におけるダイナミクスの抽象的なモデル(「他作業体動作モデルMo1」とも呼ぶ。)を示す情報を含む。例えば、他作業体8が人(作業者)である場合には、走る、歩く、物を掴む、作業位置を変える、などの人が作業中になし得る動作毎の他作業体動作モデルMo1が他作業体動作モデル情報I7に含まれる。他作業体8がロボットである場合も同様に、ロボットが作業中になし得る動作毎の他作業体動作モデルMo1が他作業体動作モデル情報I7に含まれる。また、各他作業体動作モデルは、動作速度などの動作の態様を定めるパラメータを有する。このパラメータは、初期値を夫々有し、後述する制御装置1の学習処理により更新される。他作業体動作モデル情報I7は、他作業体8の動作毎に他作業体動作モデルMo1を記録したデータベースであってもよい。
動作認識情報I8は、他作業体8の動作を認識するために必要な情報を記憶する。動作認識情報I8は、例えば、他作業体8が被写体となる所定フレーム数の時系列の画像が入力された場合に当該被写体の動作を推論するように学習された推論器のパラメータであってもよい。他の例では、動作認識情報I8は、他作業体8の予め定められた複数個の特徴点の座標位置を示す時系列データが入力された場合に、当該被写体の動作を推論するように学習された推論器のパラメータであってもよい。これらの場合の推論器のパラメータは、例えば、深層学習に基づく学習モデル、サポートベクターマシーンなどの他の機械学習に基づく学習モデル、又はこれらの組合せの学習モデルを学習することで得られる。なお、上述の推論器は、他作業体8の種類毎又は/及び目的タスクの種類毎に学習されてもよい。この場合、動作認識情報I8は、他作業体8の種類毎又は/及び目的タスクの種類毎に予め学習された推論器のパラメータの情報を含む。
動作予測情報I9は、他作業体8の動作を予測するために必要な情報である。具体的には、動作予測情報I9は、他作業体8の現在の動作または現在の動作を含む過去の動作シーケンスから、次に他作業体8が実行する動作又は動作シーケンスを特定するための情報である。動作予測情報I9は、ルックアップテーブルであってもよく、機械学習により得られた推論器のパラメータであってもよい。他の例では、動作予測情報I9は、他作業体8が繰り返し動作を行うロボットである場合に、繰り返される動作及びその周期を示す情報であってもよい。動作予測情報I9は、目的タスクの種類毎又は/及び他作業体8の種類毎にアプリケーション情報記憶部41に記憶されてもよい。また、動作予測情報I9は、予めアプリケーション情報記憶部41に記憶される代わりに、制御装置1が実行する後述の学習処理により生成されてもよい。
作業効率情報I10は、作業空間6に存在する他作業体8の作業効率を示す情報である。この作業効率は、所定の値域を有する数値により表される。作業効率情報I10は、予めアプリケーション情報記憶部41に記憶されてもよく、制御装置1が実行する後述の学習処理により生成されてもよい。この作業効率情報I10は、好適には、他作業体8が複数存在し、かつ、他作業体8間の作業が関連することにより、他作業体8の作業の進捗度合を揃える必要がある目的タスクにおいて用いられる。よって、他作業体8が単数の場合、及び、他作業体8の作業の進捗度合を揃える必要がない目的タスクの場合には、アプリケーション情報記憶部41は、作業効率情報I10を記憶しなくともよい。
なお、アプリケーション情報記憶部41は、上述した情報の他、サブタスクシーケンスの生成処理に関する種々の情報を記憶してもよい。
(4)制御装置の処理概要
図4は、制御装置1の処理の概要を示す機能ブロックの一例である。制御装置1のプロセッサ11は、機能的には、認識部15と、学習部16と、動作シーケンス生成部17とを有する。なお、図4では、各ブロック間で授受が行われるデータの一例が示されているが、これに限定されない。後述する他の機能ブロックの図においても同様である。
認識部15は、物体モデル情報I6、動作認識情報I8及び動作予測情報I9を参照し、検出信号S4を解析することで、作業空間6内の物体(他作業体8及び障害物などを含む)の状態及び他作業体8の動作を認識する。また、認識部15は、作業効率情報I10を参照し、他作業体8の作業効率の認識を行う。そして、認識部15は、認識部15が認識したこれらの認識結果「R」を、学習部16及び動作シーケンス生成部17に夫々供給する。なお、認識部15に相当する機能を、検出装置7が備えてもよい。この場合、検出装置7は、認識結果Rを、制御装置1に供給する
学習部16は、認識部15から供給される認識結果Rに基づき、他作業体8の動作を学習することで、他作業体動作モデル情報I7、動作予測情報I9及び作業効率情報I10の更新を行う。
まず、他作業体動作モデル情報I7の更新について説明する。学習部16は、認識部15から時系列により送信される認識結果Rに基づき、認識部15が認識した他作業体8の動作に関するパラメータを学習する。このパラメータは、動作を規定する任意のパラメータであって、例えば、動作の速度、加速度、又は角速度などの情報である。この場合、学習部16は、複数回分の動作を表す認識結果Rに基づき、当該動作のパラメータを統計処理により学習してもよい。この場合、学習部16は、認識部15が認識した他作業体8の動作に関するパラメータを所定回数だけ算出し、算出した所定回数分の算出値の平均などの代表値を算出することで、当該パラメータを学習する。そして、学習部16は、学習結果に基づき、動作シーケンス生成部17が後に参照する他作業体動作モデル情報I7を更新する。これにより、他作業体動作モデルMo1のパラメータが好適に学習される。
次に、動作予測情報I9の更新について説明する。学習部16は、認識部15から時系列により送信される認識結果Rに基づき、他作業体8が一連の動作シーケンスを周期的に実行していることを認識した場合、周期的に実行される動作シーケンスに関する情報を、対象の他作業体8に対する動作予測情報I9として、アプリケーション情報記憶部41に記憶する。
作業効率情報I10の更新について説明する。学習部16は、他作業体8が複数存在する場合に、認識部15から時系列により送信される認識結果Rに基づき、各他作業体8の作業の捗り具合(進捗の度合)を示す作業効率を決定する。ここで、学習部16は、各他作業体8が1又は複数の動作を繰り返し実行する場合には、1又は複数の動作を1周期分実行するのに要する時間を計測する。そして、学習部16は、上述の時間が短い他作業体8ほど、対応する作業効率を高く設定する。
動作シーケンス生成部17は、入力信号S1により特定される目的タスクと、認識部15から供給される認識結果Rと、アプリケーション情報記憶部41が記憶する各種のアプリケーション情報とに基づき、ロボット5に実行させるサブタスクシーケンスを生成する。この場合、後述するように、動作シーケンス生成部17は、認識結果Rに基づき他作業体8のダイナミクスの抽象モデルを決定し、他作業体8及びロボット5を含む作業空間6内の全体の抽象モデルを生成する。これにより、動作シーケンス生成部17は、他作業体8と協働作業をロボット5に実行させるためのサブタスクシーケンスを好適に生成する。そして、動作シーケンス生成部17は、生成したサブタスクシーケンスを少なくとも示した制御信号S3を、ロボット5へ送信する。ここで、制御信号S3は、サブタスクシーケンスを構成する各サブタスクの実行順序及び実行タイミングを示す情報を含んでいる。また、動作シーケンス生成部17は、目的タスクを受け付ける場合に、目的タスクを入力する画面を表示するための表示信号S2を表示装置3に送信することで、表示装置3に上述の画面を表示させる。
なお、図4において説明した認識部15、学習部16及び動作シーケンス生成部17の各構成要素は、例えば、プロセッサ11がプログラムを実行することによって実現できる。より具体的には、各構成要素は、メモリ12又は記憶装置4に格納されたプログラムを、プロセッサ11が実行することによって実現され得る。また、必要なプログラムを任意の不揮発性記録媒体に記録しておき、必要に応じてインストールすることで、各構成要素を実現するようにしてもよい。なお、これらの各構成要素は、プログラムによるソフトウェアで実現することに限ることなく、ハードウェア、ファームウェア、及びソフトウェアのうちのいずれかの組み合わせ等により実現してもよい。また、これらの各構成要素は、例えばFPGA(field-programmable gate array)又はマイコン等の、ユーザがプログラミング可能な集積回路を用いて実現してもよい。この場合、この集積回路を用いて、上記の各構成要素から構成されるプログラムを実現してもよい。このように、各構成要素は、プロセッサ以外のハードウェアにより実現されてもよい。以上のことは、後述する他の実施の形態においても同様である。
(5)認識部の詳細
図5は、認識部15の機能的な構成を示すブロック図である。認識部15は、機能的には、物体識別部21と、状態認識部22と、動作認識部23と、動作予測部24と、作業効率認識部25とを有する。
物体識別部21は、検出装置7から供給される検出信号S4と、物体モデル情報I6とに基づき、作業空間6内の物体の識別を行う。そして、物体識別部21は、状態認識部22及び動作認識部23に対し、物体識別結果「R0」及び検出信号S4を供給し、作業効率認識部25に対し、物体識別結果R0を供給する。また、物体識別部21は、物体識別結果R0を、認識結果Rの一部として動作シーケンス生成部17に供給する。
ここで、物体識別部21による物体の識別について補足説明する。物体識別部21は、ロボット5(図1ではロボットアーム52)、他作業体8、ロボット5及び他作業体8が取り扱う道具、部品などの対象物、障害物などの作業空間6内の種々の物体の存在を認識する。ここで、作業空間6の各物体にマーカが付されている場合には、物体識別部21は、検出信号S4に基づきマーカを特定することで、作業空間6内の物体の識別を行ってもよい。この場合、マーカは、付される物体ごとに異なる属性(例えば、色又は反射率)を有してもよい。この場合、物体識別部21は、各マーカが付された物体を、検出信号S4から特定される反射率又は色等に基づき識別する。なお、物体識別部21は、上述のマーカを用いることなく、公知の画像認識処理などを用いて作業空間6内の物体の識別を行ってもよい。例えば、入力された画像の被写体となる物体の種類を出力するように学習された推論器のパラメータが物体モデル情報I6に記憶されている場合、物体識別部21は、当該推論器に検出信号S4を入力することで、作業空間6内の物体の識別を行う。
状態認識部22は、時系列により得られる検出信号S4に基づき、作業空間6内の物体の状態を認識する。例えば、状態認識部22は、ロボット5による作業対象となる対象物及び障害となる障害物等の位置、姿勢、速度(例えば並進速度、角速度ベクトル)などを認識する。また、状態認識部22は、他作業体8の関節などの特徴点の位置、姿勢及び速度を認識する。
ここで、他作業体8の特徴点毎にマーカが付されている場合には、状態認識部22は、検出信号S4に基づきマーカを特定することで、他作業体8の各特徴点の検出を行う。この場合、状態認識部22は、特徴点間の位置関係を示す物体モデル情報I6を参照し、検出信号S4により特定される複数のマーカ位置から、他作業体8の各特徴点を識別する。なお、状態認識部22は、画像認識処理などを用いて、上述のマーカが付されていない他作業体8の各特徴点の検出を行ってもよい。この場合、状態認識部22は、物体モデル情報I6を参照して構成した推論器に画像である検出信号S4を入力し、当該推論器の出力に基づき各特徴点の位置及び姿勢を特定してもよい。この場合、推論器は、画像である検出信号S4が入力されたときに、検出信号S4の被写体となる他作業体8の特徴点の位置及び姿勢を出力するように学習される。さらに、状態認識部22は、このように特定した特徴点の位置の推移を示す時系列データに基づき、特徴点の速度を算出する。
状態認識部22は、状態認識部22による作業空間6内の物体の状態の認識結果である状態認識結果「R1」を、認識結果Rの一部として動作シーケンス生成部17に供給する。
動作認識部23は、動作認識情報I8と、検出信号S4とに基づき、他作業体8の動作を認識する。例えば、動作認識部23は、他作業体8を被写体とする時系列の画像が検出信号S4に含まれる場合、動作認識情報I8に基づき構成した推論器に当該画像を入力することで、他作業体8の動作の推論を行う。他の例では、動作認識部23は、状態認識部22が出力する状態認識結果R1に基づき、他作業体8の動作を認識してもよい。この場合、動作認識部23は、状態認識結果R1に基づき、他作業体8の所定個数の特徴点の座標位置を示す時系列データを取得する。そして、動作認識部23は、動作認識情報I8に基づき構成した推論器にこの時系列データを入力することで、他作業体8の動作の推論を行う。そして、動作認識部23は、認識した他作業体8の動作を示す動作認識結果「R2」を、動作予測部24に供給すると共に、認識結果Rの一部として動作シーケンス生成部17に供給する。なお、動作認識部23は、他作業体8が両手により作業を行う場合には、手毎の動作を認識してもよい。
動作予測部24は、動作予測情報I9と、動作認識結果R2とに基づき、他作業体8の動作を予測する。この場合、動作予測部24は、ルックアップテーブル、推論器、又はナレッジベース等を示す動作予測情報I9を用いて、動作認識結果R2が示す直近の1以上の所定個数の動作から、他作業体8の予測される動作又は動作シーケンスを決定する。なお、動作認識部23は、他作業体8が両手により作業を行う場合には、手毎の動作を予測してもよい。そして、動作予測部24は、認識した他作業体8の予測される動作(動作シーケンス)を示す予測動作認識結果「R3」を、認識結果Rの一部として動作シーケンス生成部17に供給する。なお、動作予測部24は、動作が予測できなかった場合には、予測動作認識結果R3を動作シーケンス生成部17に供給しなくともよく、動作が予測できなかった旨を示す予測動作認識結果R3を、動作シーケンス生成部17に供給してもよい。
作業効率認識部25は、物体識別部21から供給される物体識別結果R0に基づき他作業体8が複数存在すると判定した場合に、作業効率情報I10を参照することで、各他作業体8の作業効率を認識する。そして、作業効率認識部25は、他作業体8の作業効率を示す作業効率認識結果「R4」を、認識結果Rの一部として動作シーケンス生成部17に供給する。
(6)動作シーケンス生成部の詳細
次に、動作シーケンス生成部17の詳細な処理について説明する。
(6-1)機能ブロック
図6は、動作シーケンス生成部17の機能的な構成を示す機能ブロックの一例である。動作シーケンス生成部17は、機能的には、抽象状態設定部31と、目標論理式生成部32と、タイムステップ論理式生成部33と、他作業体抽象モデル決定部34と、全体抽象モデル生成部35と、効用関数設計部36と、制御入力生成部37と、サブタスクシーケンス生成部38とを有する。
抽象状態設定部31は、認識部15から供給される物体識別結果R0及び状態認識結果R1と、アプリケーション情報記憶部41から取得した抽象状態指定情報I1とに基づき、目的タスクを実行する際に考慮する必要がある作業空間6内の抽象状態を設定する。この場合、抽象状態設定部31は、各抽象状態に対し、論理式で表すための命題を定義する。抽象状態設定部31は、設定した抽象状態を示す情報(「抽象状態設定情報IS」とも呼ぶ。)を目標論理式生成部32に供給する。
目標論理式生成部32は、目的タスクに関する入力信号S1を入力装置2から受信した場合に、抽象状態設定情報ISに基づき、入力信号S1が示す目的タスクを、最終的な達成状態を表す時相論理の論理式(「目標論理式Ltag」とも呼ぶ。)に変換する。この場合、目標論理式生成部32は、アプリケーション情報記憶部41から制約条件情報I2を参照することで、目的タスクの実行において満たすべき制約条件を、目標論理式Ltagに付加する。そして、目標論理式生成部32は、生成した目標論理式Ltagを、タイムステップ論理式生成部33に供給する。また、目標論理式生成部32は、目的タスクに関する入力を受け付ける画面を表示するための表示信号S2を生成し、当該表示信号S2を表示装置3に供給する。
タイムステップ論理式生成部33は、目標論理式生成部32から供給された目標論理式Ltagを、各タイムステップでの状態を表した論理式(「タイムステップ論理式Lts」とも呼ぶ。)に変換する。そして、タイムステップ論理式生成部33は、生成したタイムステップ論理式Ltsを、制御入力生成部37に供給する。
他作業体抽象モデル決定部34は、認識部15から供給される動作認識結果R2及び予測動作認識結果R3と、他作業体動作モデル情報I7とに基づき、他作業体8のダイナミクスを抽象的に表したモデル(「他作業体抽象モデルMo2」とも呼ぶ。)を決定する。
ここで、他作業体抽象モデルMo2の決定方法について説明する。まず、他作業体抽象モデル決定部34は、動作認識結果R2及び予測動作認識結果R3が示す各動作に対応する他作業体動作モデルMo1を、他作業体動作モデル情報I7から抽出する。そして、他作業体抽象モデル決定部34は、抽出した他作業体動作モデルMo1に基づき、他作業体抽象モデルMo2を決定する。ここで、抽出した他作業体動作モデルMo1が1つの場合(即ち認識部15により1つの動作のみが認識された場合)、他作業体抽象モデル決定部34は、当該動作に対応する他作業体動作モデルMo1を、他作業体抽象モデルMo2として定める。また、抽出した他作業体動作モデルMo1が複数の場合(即ち認識部15により現在の動作及び予測動作が認識された場合)、他作業体抽象モデル決定部34は、抽出した他作業体動作モデルMo1を時系列に組み合わせたモデルを、他作業体抽象モデルMo2として定める。この場合、他作業体抽象モデル決定部34は、他作業体8の各動作が行われると予測される各期間において各動作に対応する他作業体動作モデルMo1が適用されるように、他作業体抽象モデルMo2を定める。
全体抽象モデル生成部35は、認識部15から供給される物体識別結果R0、状態認識結果R1及び予測動作認識結果R3と、アプリケーション情報記憶部41が記憶する抽象モデル情報I5と、他作業体抽象モデルMo2とに基づき、作業空間6における現実のダイナミクスを抽象化した全体抽象モデル「Σ」を生成する。この場合、全体抽象モデル生成部35は、対象のダイナミクスを連続ダイナミクスと離散ダイナミクスとが混在したハイブリッドシステムとみなし、ハイブリッドシステムに基づく全体抽象モデルΣを生成する。全体抽象モデルΣの生成方法については後述する。全体抽象モデル生成部35は、生成した全体抽象モデルΣを、制御入力生成部37へ供給する。
効用関数設計部36は、認識部15から供給される作業効率認識結果R4に基づき、制御入力生成部37が実行する最適化処理に用いる効用関数の設計を行う。具体的には、効用関数設計部36は、他作業体8が複数存在する場合に、他作業体8の各々の作業効率に基づき他作業体8の各々の作業に対する効用を重み付けするように、効用関数のパラメータを設定する。
制御入力生成部37は、タイムステップ論理式生成部33から供給されるタイムステップ論理式Ltsと、全体抽象モデル生成部35から供給される全体抽象モデルΣとを満たし、効用関数設計部36が設計した効用関数を最適化するタイムステップ毎のロボット5への制御入力を決定する。そして、制御入力生成部37は、ロボット5へのタイムステップ毎の制御入力を示す情報(「制御入力情報Ic」とも呼ぶ。)を、サブタスクシーケンス生成部38へ供給する。
サブタスクシーケンス生成部38は、制御入力生成部37から供給される制御入力情報Icと、アプリケーション情報記憶部41が記憶するサブタスク情報I4とに基づき、サブタスクシーケンスを生成し、サブタスクシーケンスを示す制御信号S3を、ロボット5へ供給する。
(6-2)抽象状態設定部の詳細
抽象状態設定部31は、認識部15から供給される物体識別結果R0及び状態認識結果R1と、アプリケーション情報記憶部41から取得した抽象状態指定情報I1とに基づき、作業空間6内の抽象状態を設定する。この場合、まず、抽象状態設定部31は、抽象状態指定情報I1を参照し、作業空間6内において設定すべき抽象状態を認識する。なお、作業空間6内において設定すべき抽象状態は、目的タスクの種類によって異なる。よって、目的タスクの種類毎に設定すべき抽象状態が抽象状態指定情報I1に規定されている場合には、抽象状態設定部31は、入力信号S1により指定された目的タスクに対応する抽象状態指定情報I1を参照し、設定すべき抽象状態を認識する。
図7は、作業空間6の俯瞰図を示す。図7に示す作業空間6には、2つのロボットアーム52a、52bと、4つの対象物61(61a~61d)と、障害物62と、他作業体ハンド81(81a、81b)を有する他作業体8と、が存在している。
この場合、検出装置7が出力する検出信号S4に対する認識部15の認識結果である物体識別結果R0及び状態認識結果R1に基づき、抽象状態設定部31は、対象物61の状態、障害物62の存在範囲、他作業体8の状態、ゴール地点として設定される領域Gの存在範囲等を認識する。
ここでは、抽象状態設定部31は、対象物61a~61dの各々の中心の位置ベクトル「x」~「x」を、対象物61a~61dの位置として認識する。また、抽象状態設定部31は、対象物を把持するロボットハンド53aの位置ベクトル「xr1」と、ロボットハンド53bの位置ベクトル「xr2」とを、ロボットアーム52aとロボットアーム52bの位置として認識する。
また、抽象状態設定部31は、他作業体8の一方の手である他作業体ハンド81aの位置ベクトル「xh1」と、他作業体8の他方の手である他作業体ハンド81bの位置ベクトル「xh2」とを、他作業体8が物を掴む、離す、動かすなどの各種動作が行われる特徴点の位置として認識する。なお、抽象状態設定部31は、他作業体ハンド81a及び他作業体ハンド81bを夫々異なる他作業体8とみなしてもよい。この場合、抽象状態設定部31は、他作業体ハンド81a及び他作業体ハンド81bの各位置を、他作業体8の位置として認識する。
同様に、抽象状態設定部31は、対象物61a~61dの姿勢(図7の例では対象物が球状のため不要)等、障害物62の存在範囲、領域Gの存在範囲等を認識する。なお、抽象状態設定部31は、例えば、障害物62を直方体とみなし、領域Gを矩形とみなす場合には、障害物62及び領域Gの各頂点の位置ベクトルを認識する。
また、抽象状態設定部31は、抽象状態指定情報I1を参照することで、目的タスクにおいて定義すべき抽象状態を決定する。この場合、抽象状態設定部31は、物体識別結果R0及び状態認識結果R1が示す、作業空間6内に存在する物体及び領域に関する認識結果(例えば物体及び領域の種類毎の個数)と、制約条件情報I2とに基づき、抽象状態を示す命題を定める。
図7の例では、抽象状態設定部31は、物体識別結果R0により特定される対象物61a~61dに対し、夫々識別ラベル「1」~「4」を付す。また、抽象状態設定部31は、対象物「i」(i=1~4)が最終的に載置されるべき目標地点である領域G(破線枠63参照)内に存在するという命題「g」を定義する。また、抽象状態設定部31は、障害物62に対して識別ラベル「O」を付し、対象物iが障害物Oに干渉しているという命題「o」を定義する。さらに、抽象状態設定部31は、ロボットアーム52同士が干渉するという命題「h」を定義する。同様に、抽象状態設定部31は、ロボットアーム52と他作業体ハンド81a、81bとが干渉するという命題などを定義する。
このように、抽象状態設定部31は、抽象状態指定情報I1を参照することで、定義すべき抽象状態を認識し、当該抽象状態を表す命題(上述の例ではg、o、h)を、対象物61の数、ロボットアーム52の数、障害物62の数、他作業体8の数等に応じてそれぞれ定義する。そして、抽象状態設定部31は、抽象状態を表す命題を示す情報を、抽象状態設定情報ISとして目標論理式生成部32に供給する。
(6-3)目標論理式生成部
まず、目標論理式生成部32は、入力信号S1により指定された目的タスクを、時相論理を用いた論理式に変換する。なお、自然言語で表されたタスクを論理式に変換する方法は、種々の技術が存在する。例えば、図7の例において、「最終的に対象物(i=2)が領域Gに存在する」という目的タスクが与えられたとする。この場合、目標論理式生成部32は、目的タスクを線形論理式(LTL:Linear Temporal Logic)の「eventually」に相当する演算子「◇」と、抽象状態設定部31により定義された命題「g」と用いて、論理式「◇g」を生成する。なお、目標論理式生成部32は、演算子「◇」以外の任意の時相論理の演算子(論理積「∧」、論理和「∨」、否定「¬」、論理包含「⇒」、always「□」、next「○」、until「U」等)を用いて論理式を表現してもよい。また、線形時相論理に限らず、MTL(Metric Temporal Logic)やSTL(Signal Temporal Logic)などの任意の時相論理を用いて論理式を表現してもよい。
次に、目標論理式生成部32は、制約条件情報I2が示す制約条件を、目的タスクを示す論理式に付加することで、目標論理式Ltagを生成する。
例えば、ピックアンドプレイスに対応する制約条件として、「ロボット5同士が干渉しない」、「対象物iは障害物Oに干渉しない」の2つが制約条件情報I2に含まれている場合、目標論理式生成部32は、これらの制約条件を論理式に変換する。具体的には、目標論理式生成部32は、図7の説明において抽象状態設定部31により定義された命題「o」及び命題「h」を用いて、上述の2つの制約条件を、夫々以下の論理式に変換する。
□¬h
□¬o
よって、この場合、目標論理式生成部32は、「最終的に対象物(i=2)が領域Gに存在する」という目的タスクに対応する論理式「◇g」に、これらの制約条件の論理式を付加することで、以下の目標論理式Ltagを生成する。
(◇g)∧(□¬h)∧(∧□¬o
なお、実際には、ピックアンドプレイスに対応する制約条件は、上述した2つに限られず、「ロボットアーム52が障害物Oに干渉しない」、「複数のロボットアーム52が同じ対象物を掴まない」、「対象物同士が接触しない」、「ロボットアーム52が他作業体ハンド81a、81bに干渉しない」などの制約条件が存在する。このような制約条件についても同様に、制約条件情報I2に記憶され、目標論理式Ltagに反映される。
(6-4)目標論理式生成部
タイムステップ論理式生成部33は、目的タスクを完了するタイムステップ数(「目標タイムステップ数」とも呼ぶ。)を定め、目標タイムステップ数で目標論理式Ltagを満たすような各タイムステップでの状態を表す命題の組み合わせを定める。この組み合わせは、通常複数存在するため、タイムステップ論理式生成部33は、これらの組み合わせを論理和により結合した論理式を、タイムステップ論理式Ltsとして生成する。上述の組み合わせは、ロボット5に命令する動作のシーケンスを表す論理式の候補となり、以後では「候補φ」とも呼ぶ。
ここで、図7の説明において例示した「最終的に対象物(i=2)が領域Gに存在する」という目的タスクが設定された場合のタイムステップ論理式生成部33の処理の具体例について説明する。
この場合、タイムステップ論理式生成部33は、目標論理式Ltagとして、「(◇g)∧(□¬h)∧(∧□¬o)」が目標論理式生成部32から供給される。この場合、タイムステップ論理式生成部33は、命題「g」をタイムステップの概念を含むように拡張した命題「gi,k」を用いる。ここで、命題「gi,k」は、「タイムステップkで対象物iが領域Gに存在する」という命題である。ここで、目標タイムステップ数を「3」とした場合、目標論理式Ltagは、以下のように書き換えられる。
(◇g2,3)∧(∧k=1,2,3□¬h)∧(∧i,k=1,2,3□¬o
また、◇g2,3は、以下の式に示すように書き換えることが可能である。
Figure 0007364032000001
このとき、上述した目標論理式Ltagは、以下に示す4つの候補「φ」~「φ」の論理和(φ∨φ∨φ∨φ)により表される。
Figure 0007364032000002
よって、タイムステップ論理式生成部33は、4つの候補φ~φの論理和をタイムステップ論理式Ltsとして定める。この場合、タイムステップ論理式Ltsは、4つの候補φ~φの少なくともいずれかが真となる場合に真となる。
次に、目標タイムステップ数の設定方法について補足説明する。
タイムステップ論理式生成部33は、例えば、ユーザ入力により指定された作業の見込み時間に基づき、目標タイムステップ数を決定する。この場合、タイムステップ論理式生成部33は、メモリ12又は記憶装置4に記憶された、1タイムステップ当たりの時間幅の情報に基づき、上述の見込み時間から目標タイムステップ数を算出する。他の例では、タイムステップ論理式生成部33は、目的タスクの種類毎に適した目標タイムステップ数を対応付けた情報を予めメモリ12又は記憶装置4に記憶しておき、当該情報を参照することで、実行すべき目的タスクの種類に応じた目標タイムステップ数を決定する。
好適には、タイムステップ論理式生成部33は、目標タイムステップ数を所定の初期値に設定する。そして、タイムステップ論理式生成部33は、制御入力生成部37が制御入力を決定できるタイムステップ論理式Ltsが生成されるまで、目標タイムステップ数を徐々に増加させる。この場合、タイムステップ論理式生成部33は、設定した目標タイムステップ数により制御入力生成部37が最適化処理を行った結果、最適解を導くことができなかった場合、目標タイムステップ数を所定数(1以上の整数)だけ加算する。
このとき、タイムステップ論理式生成部33は、目標タイムステップ数の初期値を、ユーザが見込む目的タスクの作業時間に相当するタイムステップ数よりも小さい値に設定するとよい。これにより、タイムステップ論理式生成部33は、不必要に大きな目標タイムステップ数を設定することを好適に抑制する。
(6-5)他作業体抽象モデル決定部及び全体抽象モデル生成部
全体抽象モデル生成部35は、他作業体抽象モデルMo2と、抽象モデル情報I5と、物体識別結果R0と、状態認識結果R1とに基づき、全体抽象モデルΣを生成する。ここで、抽象モデル情報I5には、目的タスクの種類毎に、全体抽象モデルΣの生成に必要な情報が記録されている。例えば、目的タスクがピックアンドプレイスの場合には、対象物の位置や数、対象物を置く領域の位置、ロボット5の台数(又はロボットアーム52の数)等を特定しない汎用的な形式の抽象モデルが抽象モデル情報I5に記録されている。そして、全体抽象モデル生成部35は、抽象モデル情報I5に記録された、ロボット5のダイナミクスを含む汎用的な形式の抽象モデルに対し、物体識別結果R0、状態認識結果R1及び他作業体抽象モデルMo2を反映することで、全体抽象モデルΣを生成する。これにより、全体抽象モデルΣは、作業空間6内の物体の状態と、ロボット5のダイナミクスと、他作業体8のダイナミクスとが抽象的に表されたモデルとなる。なお、作業空間6内の物体の状態は、ピックアンドプレイスの場合には、対象物の位置及び数、対象物を置く領域の位置、ロボット5の台数等を示す。
ここで、ロボット5による目的タスクの作業時においては、作業空間6内のダイナミクスが頻繁に切り替わる。例えば、ピックアンドプレイスでは、ロボットアーム52が対象物iを掴んでいる場合には、当該対象物iを動かすことができるが、ロボットアーム52が対象物iを掴んでない場合には、当該対象物iを動かすことができない。
以上を勘案し、本実施形態においては、ピックアンドプレイスの場合、対象物iを掴むという動作を論理変数「δ」により抽象表現する。この場合、例えば、全体抽象モデル生成部35は、図7に示す作業空間6に対して設定すべき全体抽象モデルΣを、以下の式(1)により定めることができる。
Figure 0007364032000003
ここで、「u」は、ロボットハンドj(「j=1」はロボットハンド53a、「j=2」はロボットハンド53b)を制御するための制御入力を示す。「I」は単位行列を示す。「0」は零行例を示す。「A」は、他作業体8の他作業体ハンド81のダイナミクスを表すドリフト項であり、詳細は後述する。なお、制御入力は、ここでは、一例として速度を想定しているが、加速度であってもよい。また、「δj,i」は、ロボットハンドjが対象物iを掴んでいる場合に「1」であり、その他の場合に「0」である論理変数である。また、「xr1」、「xr2」は、ロボットハンドjの位置ベクトル、「x」~「x」は、対象物iの位置ベクトル、「xh1」、「xh2」は、他作業体ハンド81の位置ベクトルを示す。また、「h(x)」は、対象物を掴める程度に対象物の近傍にロボットハンドが存在する場合に「h(x)≧0」となる変数であり、論理変数δとの間で以下の関係を満たす。
δ=1 ⇔ h(x)≧0
この式では、対象物を掴める程度に対象物の近傍にロボットハンドが存在する場合には、ロボットハンドが対象物を掴んでいるとみなし、論理変数δを1に設定している。
また、「A」は、他作業体8の他作業体ハンド81のダイナミクスを表すドリフト項であり、以下の式(2)又は式(3)により定めることができる。
Figure 0007364032000004
Figure 0007364032000005
ここで、式(2)における「Δt」は、タイムステップ幅を示し、「∂xh1/∂t」及び「∂xh2/∂t」は、タイムステップについての他作業体ハンド81の偏微分を示す。この場合、他作業体抽象モデル決定部34は、他作業体8の現在の動作及び予測動作からなる動作シーケンスと、他作業体動作モデル情報I7とに基づき、「∂xh1/∂t」及び「∂xh2/∂t」に相当する他作業体抽象モデルMo2を決定する。そして、全体抽象モデル生成部35は、他作業体抽象モデル決定部34が決定した他作業体抽象モデルMo2に基づき、式(2)を設定する。
また、式(3)に示すように、全体抽象モデル生成部35は、1タイムステップあたりの他作業体ハンド81の位置の変位を示す「Δxh1」及び「Δxh1」を用いて、他作業体8のダイナミクスを抽象的に表してもよい。この場合、他作業体抽象モデル決定部34は、他作業体8の現在の動作及び予測動作からなる動作シーケンスと、他作業体動作モデル情報I7と、に基づき、「Δxh1」及び「Δxh1」に相当する他作業体抽象モデルMo2を決定する。そして、全体抽象モデル生成部35は、他作業体抽象モデル決定部34が決定した他作業体抽象モデルMo2に基づき、式(3)を設定する。
ここで、式(1)は、タイムステップkでの物体の状態とタイムステップ(k+1)での物体の状態との関係を示した差分方程式である。そして、上記の式(1)では、把持の状態が離散値である論理変数により表わされ、物体の移動は連続値により表わされているため、式(1)はハイブリッドシステムを示している。
式(1)では、ロボット5全体及び他作業体8全体の詳細なダイナミクスではなく、対象物を実際に把持するロボット5の手先であるロボットハンドのダイナミクス及び他作業体ハンド81のダイナミクスのみを考慮している。これにより、制御入力生成部37により最適化処理の計算量を好適に削減することができる。
また、抽象モデル情報I5には、ダイナミクスが切り替わる動作(ピックアンドプレイスの場合には対象物iを掴むという動作)に対応する論理変数、及び、物体識別結果R0及び状態認識結果R1から式(1)の差分方程式を導出するための情報が記録されている。よって、全体抽象モデル生成部35は、対象物の位置や数、対象物を置く領域(図7では領域G)、ロボット5の台数等が変動する場合であっても、抽象モデル情報I5と物体識別結果R0及び状態認識結果R1とに基づき、対象の作業空間6の環境に即した全体抽象モデルΣを決定することができる。同様に、全体抽象モデル生成部35は、他作業体抽象モデル決定部34が動作認識結果R2及び予測動作認識結果R3に基づき決定した他作業体抽象モデルMo2を用いることで、他作業体8のダイナミクスについても好適に考慮した全体抽象モデルΣを生成することができる。
なお、全体抽象モデル生成部35は、式(1)に示されるモデルに代えて、混合論理動的(MLD:Mixed Logical Dynamical)システムまたはペトリネットやオートマトンなどを組み合わせたハイブリッドシステムのモデルを生成してもよい。
(6-6)効用関数設計部及び制御入力生成部
制御入力生成部37は、タイムステップ論理式生成部33から供給されるタイムステップ論理式Ltsと、全体抽象モデル生成部35から供給される全体抽象モデルΣと、効用関数設計部36から供給される効用関数とに基づき、最適となるタイムステップ毎のロボット5に対するタイムステップ毎の制御入力を決定する。この場合、制御入力生成部37は、全体抽象モデルΣ及びタイムステップ論理式Ltsを制約条件として、効用関数設計部36が設計した効用関数を最小化する最適化問題を解く。
効用関数設計部36は、他作業体8が複数存在する場合に、他作業体の各々の作業に対する効用を、各他作業体8の作業効率に基づき重み付けした効用関数を設計する。なお、他作業体8が複数存在しない場合の効用関数は、例えば目的タスクの種類毎に予め定められ、メモリ12又は記憶装置4に記憶されている。また、他作業体8が複数存在する場合の効用関数は、各他作業体8の作業効率を示すパラメータを含む効用関数であって、例えば目的タスクの種類及び他作業体8の数毎に予め定められ、メモリ12又は記憶装置4に記憶されている。
まず、他作業体8の作業効率を考慮しない場合の効用関数の具体例について説明する。ピックアンドプレイスを目的タスクとした場合、効用関数設計部36は、運ぶ対象となる対象物と当該対象物を運ぶ目標地点との距離「d」と制御入力「u」とが最小となる(即ちロボット5が費やすエネルギーを最小化する)ように効用関数を定める。上述の距離dは、「最終的に対象物(i=2)が領域Gに存在する」という目的タスクの場合には、対象物(i=2)と領域Gとのタイムステップkでの距離に相当する。
この場合、効用関数設計部36は、たとえば、全タイムステップにおける距離dのノルムの2乗と制御入力uのノルムの2乗との和を効用関数として定める。そして、制御入力生成部37は、全体抽象モデルΣ及びタイムステップ論理式Lts(即ち候補φの論理和)を制約条件とする以下の式(4)に示す制約付き混合整数最適化問題を解く。
Figure 0007364032000006
ここで、「T」は、最適化の対象となるタイムステップ数であり、目標タイムステップ数であってもよく、後述するように、目標タイムステップ数よりも小さい所定数であってもよい。この場合、好適には、制御入力生成部37は、論理変数を連続値に近似する(連続緩和問題とする)。これにより、制御入力生成部37は、計算量を好適に低減することができる。なお、線形論理式(LTL)に代えてSTLを採用した場合には、非線形最適化問題として記述することが可能である。
次に、他作業体8の作業効率を考慮する場合の効用関数の具体例について説明する。この場合、効用関数設計部36は、複数の他作業体8の作業バランスを効用関数により調整するための作業効率を示すパラメータを効用関数に設ける。例えば、他作業体8である作業者Aと作業者Bのピックアンドプレイスを目的タスクとした場合、制御入力生成部37は、全体抽象モデルΣ及びタイムステップ論理式Ltsを制約条件とする以下の式(5)に示す制約付き混合整数最適化問題を解く。
Figure 0007364032000007
式(5)では、効用関数設計部36は、作業者Aの作業における対象物iと作業者Aとの距離ベクトル「dAik」のノルムの2乗和、作業者Bの作業における対象物jと作業者Bとの距離ベクトル「dBjk」のノルムの2乗和、及び制御入力「u」のノルムの2乗和の全タイムステップにおける重み付け合計値を、効用関数として設計している。ここで、「a」は作業者Aの作業効率を示し、「b」は作業者Bの作業効率を示す。ここで、「a」、「b」は、スカラー値であり、「0<a,b<1」を満たすように正規化されている。ここで、「a」、「b」が大きいほど、対応する作業者の作業効率が高いことを示している。
そして、式(5)によれば、作業者Aの作業に関する距離ベクトル「dAik」のノルムの2乗和と、作業者Bの作業に関する距離ベクトル「dBjk」のノルムの2乗和とは、夫々、対応する作業者の作業効率が高いほど、低い重み付けが設定される。このように、効用関数設計部36は、作業効率の悪い(即ち作業効率の低い)作業者を優先的に助けるようなロボット5の制御入力を決定するように、効用関数を好適に設計することができる。
(6-7)サブタスクシーケンス生成部
サブタスクシーケンス生成部38は、制御入力生成部37から供給される制御入力情報Icと、アプリケーション情報記憶部41が記憶するサブタスク情報I4とに基づき、サブタスクシーケンスを生成する。この場合、サブタスクシーケンス生成部38は、サブタスク情報I4を参照することで、ロボット5が受け付け可能なサブタスクを認識し、制御入力情報Icが示すタイムステップ毎の制御入力をサブタスクに変換する。
例えば、サブタスク情報I4には、ピックアンドプレイスを目的タスクとする場合にロボット5が受け付け可能なサブタスクとして、ロボットハンドの移動(リーチング)とロボットハンドの把持(グラスピング)の2つのサブタスクを示す関数が定義されている。この場合、リーチングを表す関数「Move」は、例えば、当該関数実行前のロボット5の初期状態、当該関数実行後のロボット5の最終状態、及び当該関数の実行に要する所要時間をそれぞれ引数とする関数である。また、グラスピングを表す関数「Grasp」は、例えば、当該関数実行前のロボット5の状態、及び当該関数実行前の把持対象の対象物の状態, 論理変数δをそれぞれ引数とする関数である。ここで、関数「Grasp」は、論理変数δが「1」のときに掴む動作を行うこと表し、論理変数δが「0」のときに放す動作を行うこと表す。この場合、サブタスクシーケンス生成部38は、関数「Move」を、制御入力情報Icが示すタイムステップ毎の制御入力により定まるロボットハンドの軌道に基づき決定し、関数「Grasp」を、制御入力情報Icが示すタイムステップ毎の論理変数δの遷移に基づき決定する。
そして、サブタスクシーケンス生成部38は、関数「Move」と関数「Grasp」とにより構成されるサブタスクシーケンスを生成し、当該サブタスクシーケンスを示す制御信号S3をロボット5に供給する。例えば、目的タスクが「最終的に対象物(i=2)が領域Gに存在する」の場合、サブタスクシーケンス生成部38は、対象物(i=2)に最も近いロボットハンドに対し、関数「Move」、関数「Grasp」、関数「Move」、関数「Grasp」のサブタスクシーケンスを生成する。この場合、対象物(i=2)に最も近いロボットハンドは、1つめの関数「Move」により対象物(i=2)の位置まで移動し、1つめの関数「Grasp」により対象物(i=2)を把持し、2つめの関数「Move」により領域Gまで移動し、2つめの関数「Grasp」により対象物(i=2)を領域Gに載置する。
(7)処理フロー
図8は、第1実施形態において制御装置1が実行するロボット制御処理の概要を示すフローチャートの一例である。
まず、制御装置1は、検出装置7から供給される検出信号S4を取得する(ステップS10)。そして、制御装置1の認識部15は、検出信号S4及び物体モデル情報I6に基づき、作業空間6における物体の識別及び物体の状態認識を行う(ステップS11)。これにより、認識部15は、物体識別結果R0及び状態認識結果R1を生成する。
次に、制御装置1は、物体識別結果R0に基づき、他作業体8が存在するか否か判定する(ステップS12)。そして、制御装置1は、他作業体8が存在すると判定した場合(ステップS12;Yes)、ステップS13~S16の処理を実行する。一方、制御装置1は、他作業体8が存在しないと判定した場合(ステップS12;No)、ステップS17へ処理を進める。
他作業体8が存在すると判定後(ステップS12;Yes)、認識部15は、動作認識情報I8に基づき、作業空間6に存在する他作業体8の動作を認識する(ステップS13)。これにより、認識部15は、動作認識結果R2を生成する。さらに、認識部15は、動作予測情報I9及び動作認識結果R2に基づき、他作業体8の動作を予測する(ステップS14)。これにより、認識部15は、予測動作認識結果R3を生成する。さらに、認識部15は、物体識別結果R0と、作業効率情報I10とに基づき、他作業体8の作業効率を認識し、動作シーケンス生成部17は、他作業体8の作業効率に応じた効用関数の設計を行う(ステップS15)。なお、認識部15及び動作シーケンス生成部17は、ステップS15の処理を、複数の他作業体8が検出された場合に限り実行するとよい。さらに、動作シーケンス生成部17は、動作認識結果R2及び予測動作認識結果R3と、他作業体動作モデル情報I7とに基づき、作業空間6内に存在する他作業体8の抽象的なダイナミクスを表す他作業体抽象モデルMo2を決定する(ステップS16)。
そして、ステップS17の後、又は、他作業体8が存在しないと判定後(ステップS12;No)、動作シーケンス生成部17は、ロボット5の動作シーケンスであるサブタスクシーケンスを決定し、サブタスクシーケンスを示す制御信号S3をロボット5へ出力する(ステップS17)。このとき、動作シーケンス生成部17は、ステップS25で決定した他作業体抽象モデルMo2が反映された全体抽象モデルΣに基づき、サブタスクシーケンスを生成する。これにより、動作シーケンス生成部17は、他作業体8と協調するロボット5の動作シーケンスとなるサブタスクシーケンスを、好適に生成することができる。そして、ロボット5は、制御信号S3に基づき、目的タスクを完了するための動作を開始する。
次に、制御装置1は、ロボット5の動作シーケンスであるサブタスクシーケンスの再生成の要否判定を行う(ステップS18)。この場合、例えば、制御装置1は、直前のサブタスクシーケンスの生成から所定時間経過した場合、又は、指示したサブタスクをロボット5が実行できない等の所定のイベントを検知した場合、サブタスクシーケンスの再生成が必要と判定する。そして、制御装置1は、サブタスクシーケンスの再生成が必要な場合(ステップS18;Yes)、ステップS10へ処理を戻し、サブタスクシーケンスの生成に必要な処理を開始する。
一方、サブタスクシーケンスの再生成が不要であると判定した場合(ステップS18;No)、学習部16は、学習によるアプリケーション情報の更新を行う(ステップS19)。具体的には、学習部16は、認識部15による認識結果Rに基づき、アプリケーション情報記憶部41に記憶された他作業体動作モデル情報I7、動作予測情報I9、及び作業効率情報I10の更新を行う。なお、学習部16は、ロボット5によるサブタスクシーケンスの実行中に限らず、ロボット5によるサブタスクシーケンスの実行前及び実行完了後においても、ステップS19の処理を実行してもよい。
そして、制御装置1は、目的タスクが完了したか否か判定する(ステップS20)。この場合、制御装置1は、例えば、検出信号S4に対する認識結果R又はロボット5から供給される目的タスクの完了を通知する信号に基づき、目的タスクの完了の有無を判定する。そして、制御装置1は、目的タスクが完了したと判定した場合(ステップS20;Yes)、フローチャートの処理を終了する。一方、制御装置1は、目的タスクが完了していないと判定した場合(ステップS20;No)、ステップS18へ処理を戻し、引き続きサブタスクシーケンスの再生成の要否判定を行う。
(8)応用例
次に、第1実施形態の応用例(第1応用例~第3応用例)について説明する。
第1応用例では、食品工場、組立工場、物流での作業場等において、ロボット5は、同一の作業空間6内で作業する他作業体8である作業者8Aの作業に合わせて協調動作を行う。図9(A)は、第1応用例における作業空間6の俯瞰図の一例である。図9(A)では、弁当箱90に複数の具材91を夫々所定位置に詰める作業が目的タスクとして与えられており、目的タスクを実行するために必要な事前知識の情報が予めアプリケーション情報記憶部41に記憶されている。この事前知識は、弁当箱90に詰めるべき具材91及び各具材91の配置を示す情報(所謂完成図の情報)及び目的タスクを実行する際のルールなどを含む。
この場合、制御装置1の認識部15は、検出信号S4に基づき、作業空間6内の弁当箱90などの各物体の識別及び状態認識を行う。また、認識部15は、作業者8Aが具材91を詰める動作をしていることを認識すると共に、詰める動作の後に次の具材91を取りにいく動作が行われることを予測する。そして、動作シーケンス生成部17の他作業体抽象モデル決定部34は、認識部15が認識した動作認識結果R2及び予測動作認識結果R3と、他作業体動作モデル情報I7と、に基づき、作業者8Aに対応する他作業体抽象モデルMo2を決定する。その後、動作シーケンス生成部17の全体抽象モデル生成部35は、各具材91及び弁当箱90の位置姿勢を示す状態認識結果R1、ロボット5の抽象化したダイナミクス、及び他作業体抽象モデルMo2に基づき、作業空間6全体を対象とする全体抽象モデルΣを生成する。そして、動作シーケンス生成部17のサブタスクシーケンス生成部38は、生成した全体抽象モデルΣを用いて制御入力生成部37が生成した制御入力情報Icに基づき、ロボット5が実行する動作シーケンスであるサブタスクシーケンスを生成する。この場合、動作シーケンス生成部17は、作業者8Aの具材91を詰める動作に干渉しないように、目的タスクを達成するためのサブタスクシーケンスを生成する。
第2応用例では、各種工場、医療現場、リテール業務が行われる現場等において、ロボット5は、同一の作業空間6で作業する他作業体8である作業者8Bと物の受け渡しを行う。ここで、作業者8Bとロボット5とで受け渡しが行われる物は、工具、医療機器、釣り銭、レジ袋などが該当する。図9(B)は、第2応用例における作業空間6の俯瞰図の一例である。図9(B)では、製品の組み立てを目的タスクとして与えられており、製品の組み立てに必要な部品及び道具等に関する事前知識がアプリケーション情報記憶部41に記憶されている。この事前知識には、ネジを回すには工具92が必要であるという事前知識を含む。
この場合、認識部15は、作業空間6内の物体の識別及び状態認識後、作業者8Bが「ネジを外す」という動作をしていることを認識すると共に、当該動作の後に「ネジを回す」という動作を行うことを予測する。そして、他作業体抽象モデル決定部34は、認識部15による動作認識結果R2及び予測動作認識結果R3に基づき、他作業体動作モデル情報I7から、作業者8Aによる「ネジを外す」及び「ネジを回す」の各動作に対応する他作業体動作モデルMo1を選択する。その後、全体抽象モデル生成部35は、選択された各他作業体動作モデルMo1が組み合わされた他作業体抽象モデルMo2を用いて、作業空間6全体を対象とする全体抽象モデルΣを生成する。そして、サブタスクシーケンス生成部38は、生成した全体抽象モデルΣを用いて制御入力生成部37が生成した制御入力情報Icに基づき、ロボット5が実行する動作シーケンスであるサブタスクシーケンスを生成する。
第2応用例において制御装置1が生成したサブタスクシーケンスは、ネジを回すために必要な工具92をピックアップするサブタスク及び作業者8Bにピックアップした工具92を受け渡すサブタスクを含んでいる。制御装置1は、このサブタスクシーケンスを指示する制御信号S3をロボット5に送信することで、作業者8Bの作業をロボット5により好適に支援することができる。このように、ロボット5は、他作業体8との物の受け渡しを含むサブタスクシーケンスを実行してもよい。
第3応用例では、食品工場、組み立て工場などの各種工場において、ロボット5は、同一のライン又はセルとなる作業空間6で作業する他作業体8である他ロボット8Cと共に作業を行う。図9(C)は、第3応用例における作業空間6の俯瞰図の一例である。ここでは、複数の対象物93のピックアンドプレイスが目的タスクとして与えられており、目的タスクの実行に必要な事前知識がアプリケーション情報記憶部41に記憶されている。
この場合、学習部16は、制御装置1によるサブタスクシーケンスの生成前又は生成後において、認識部15から供給される認識結果Rの時系列データに基づき、他ロボット8Cが周期的に実行している動作シーケンス、及び、当該動作シーケンスのパラメータを学習する。そして学習部16は、学習した動作シーケンス及び動作シーケンスのパラメータに基づき、他作業体動作モデル情報I7及び動作予測情報I9を更新する。そして、他作業体動作モデル情報I7及び動作予測情報I9の更新後、制御装置1は、更新された他作業体動作モデル情報I7及び動作予測情報I9を用いて、ロボット5に実行させるサブタスクシーケンスの生成を行い、当該サブタスクシーケンスを指示する制御信号S3をロボット5に送信する。
このように、第3応用例では、制御装置1は、他ロボット8Cが実行する動作シーケンスを学習することで、他ロボット8Cの動きを的確に勘案したサブタスクシーケンスをロボット5に実行させることができる。
(9)変形例
動作予測部24による他作業体8の動作予測処理、作業効率認識部25による作業効率の認識処理及び作業効率に基づく効用関数設計部36の効用関数の設計処理、及び、学習部16による学習処理は、必須の処理ではない。よって、制御装置1は、これらの処理の少なくともいずれかを実行しなくともよい。
図10は、変形例における制御装置1のロボット制御処理の概要を示すフローチャートの一例である。図10に示すフローチャートは、上述の動作予測処理、効用関数の設計処理、学習処理を全て実行しない場合のロボット制御処理の手順を示す。以後では、図8のステップS10~S13と同一処理を行う図9のステップS21~S24については説明を省略する。
ステップS24での認識部15による他作業体8の動作の認識後、動作シーケンス生成部17は、動作認識結果R2と、他作業体動作モデル情報I7とに基づき、他作業体抽象モデルMo2を決定する(ステップS25)。この場合、動作シーケンス生成部17の他作業体抽象モデル決定部34は、動作認識結果R2が示す動作に対応する他作業体動作モデルMo1を他作業体動作モデル情報I7から選択し、当該他作業体動作モデルMo1を他作業体抽象モデルMo2として決定する。
そして、ステップS25の後、又は、他作業体8が存在しないと判定後(ステップS23;No)、動作シーケンス生成部17は、ロボット5の動作シーケンスであるサブタスクシーケンスを決定し、サブタスクシーケンスを示す制御信号S3をロボット5へ出力する(ステップS26)。このとき、動作シーケンス生成部17は、ステップS25で決定した他作業体抽象モデルMo2に基づき全体抽象モデルΣを生成してサブタスクシーケンスを生成する。これにより、動作シーケンス生成部17は、他作業体8と協調するロボット5の動作シーケンスとなるサブタスクシーケンスを、好適に生成することができる。
次に、制御装置1は、ロボット5の動作シーケンスであるサブタスクシーケンスの再生成の要否判定を行う(ステップS27)。そして、制御装置1は、サブタスクシーケンスの再生成が必要な場合(ステップS27;Yes)、ステップS21へ処理を戻し、サブタスクシーケンスの生成に必要な処理を開始する。一方、サブタスクシーケンスの再生成が不要であると判定した場合(ステップS27;No)、制御装置1は、目的タスクが完了したか否か判定する(ステップS28)。そして、制御装置1は、目的タスクが完了したと判定した場合(ステップS28;Yes)、フローチャートの処理を終了する。一方、制御装置1は、目的タスクが完了していないと判定した場合(ステップS28;No)、ステップS27へ処理を戻し、引き続きサブタスクシーケンスの再生成の要否判定を行う。
このように、本変形例によっても、制御装置1は、他作業体8と協調するロボット5の動作シーケンスとなるサブタスクシーケンスに基づきロボット5を動作するようにロボット5を制御することができる。
<第2実施形態>
図11は、第2実施形態における制御装置1Aの概略構成図である。図11に示すように、制御装置1Aは、主に、動作シーケンス生成手段17Aを有する。
動作シーケンス生成手段17Aは、タスクを実行するロボットと他作業体とが協働作業を行う作業空間内の物体の種類及び状態に関する認識結果「Ra」に基づき、ロボットに実行させる動作シーケンス「Sa」を生成する。
ここで、ロボットは、制御装置1Aと別体に構成されてもよく、制御装置1Aを内蔵してもよい。また、動作シーケンス生成手段17Aは、第1実施形態において認識部15が出力する認識結果Rに基づきサブタスクシーケンスを生成する動作シーケンス生成部17とすることができる。この場合、認識部15は、制御装置1Aの一部であってもよく、制御装置1Aとは別体であってもよい。また、認識部15は、物体識別部21及び状態認識部22のみから構成されてもよい。また、動作シーケンス生成手段17Aは、動作シーケンスの生成において、他作業体のダイナミクスを考慮しなくともよい。この場合、動作シーケンス生成手段17Aは、他作業体を障害物とみなし、認識結果Rに基づき、他作業体とロボットが干渉しないような動作シーケンスを生成してもよい。
図12は、第2実施形態において制御装置1Aが実行するフローチャートの一例である。動作シーケンス生成手段17Aは、タスクを実行するロボットと他作業体とが協働作業を行う作業空間内の物体の種類及び状態に関する認識結果Raに基づき、ロボットに実行させる動作シーケンスSaを生成する(ステップS31)。
第2実施形態の構成によれば、制御装置1Aは、ロボットと他作業体とが協働作業を行う場合に、ロボットに実行させる動作シーケンスを好適に生成することができる。
なお、上述した各実施形態において、プログラムは、様々なタイプの非一時的なコンピュータ可読媒体(non-transitory computer readable medium)を用いて格納され、コンピュータであるプロセッサ等に供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体(tangible storage medium)を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体(例えばフレキシブルディスク、磁気テープ、ハードディスクドライブ)、光磁気記録媒体(例えば光磁気ディスク)、CD-ROM(Read Only Memory)、CD-R、CD-R/W、半導体メモリ(例えば、マスクROM、PROM(Programmable ROM)、EPROM(Erasable PROM)、フラッシュROM、RAM(Random Access Memory))を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体(transitory computer readable medium)によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。
その他、上記の各実施形態の一部又は全部は、以下の付記のようにも記載され得るが以下には限られない。
[付記1]
タスクを実行するロボットと他作業体とが協働作業を行う作業空間内の物体の種類及び状態に関する認識結果に基づき、前記ロボットに実行させる動作シーケンスを生成する動作シーケンス生成手段を有する制御装置。
[付記2]
前記動作シーケンス生成手段は、
前記他作業体の動作に関する認識結果に基づき、前記他作業体のダイナミクスを抽象化した他作業体抽象モデルを決定し、
当該他作業体抽象モデルと、前記物体の種類及び状態に関する認識結果とに基づき、前記動作シーケンスを生成する、付記1に記載の制御装置。
[付記3]
前記動作シーケンス生成手段は、前記他作業体のダイナミクスを動作毎に抽象化したモデルに関する他作業体動作モデル情報に基づき、前記他作業体抽象モデルを決定する、付記2に記載の制御装置。
[付記4]
前記他作業体の動作に関する認識結果に基づき、前記他作業体抽象モデルのパラメータを学習する学習手段をさらに有する、付記2または3に記載の制御装置。
[付記5]
前記他作業体の動作に関する認識結果には、前記他作業体が実行中の動作及び予測される動作に関する認識結果が含まれ、
前記動作シーケンス生成手段は、前記他作業体が実行中の動作及び予測される動作に関する認識結果に基づき、前記動作シーケンスを生成する、付記2~4のいずれか一項に記載の制御装置。
[付記6]
前記動作シーケンス生成手段は、複数存在する前記他作業体の各々の作業効率に基づき、前記動作シーケンスを生成する、付記1~5のいずれか一項に記載の制御装置。
[付記7]
前記動作シーケンス生成手段は、前記他作業体の各々の作業効率に基づき前記他作業体の各々の作業に対する効用を重み付けした効用関数を設計し、当該効用関数を最適化することで、前記動作シーケンスを生成する、付記6に記載の制御装置。
[付記8]
前記作業空間を検出対象範囲とする検出装置が出力する検出信号に基づき、前記物体の種類及び状態の認識を行う認識手段をさらに有し、
前記動作シーケンス生成手段は、前記認識手段の認識結果に基づき、前記動作シーケンスを生成する、付記1~7のいずれか一項に記載の制御装置。
[付記9]
前記動作シーケンス生成手段は、
前記ロボットに作業させるタスクである目的タスクを時相論理に基づく論理式に変換する論理式変換手段と、
前記論理式から、前記目的タスクを実行するためタイムステップ毎の状態を表す論理式であるタイムステップ論理式を生成するタイムステップ論理式生成手段と、
前記タイムステップ論理式に基づき、前記ロボットに実行させるサブタスクのシーケンスを、前記動作シーケンスとして生成するサブタスクシーケンス生成手段と、
を有する、付記1~8のいずれか一項に記載の制御装置。
[付記10]
前記動作シーケンス生成手段は、
前記作業空間におけるダイナミクスを抽象化した抽象モデルを生成する抽象モデル生成手段と、
前記目的タスクに対する効用関数を設計する効用関数設計手段と、
前記抽象モデルと、前記タイムステップ論理式と、前記効用関数とに基づき、前記ロボットを制御するためのタイムステップ毎の制御入力を決定する制御入力生成手段と、をさらに有し、
前記サブタスクシーケンス生成手段は、前記制御入力に基づき、前記サブタスクのシーケンスを生成する、付記9に記載の制御装置。
[付記11]
前記動作シーケンス生成手段は、
前記認識結果に基づき、前記作業空間における物体の抽象的な状態である抽象状態を、前記論理式において使用する命題として定める抽象状態設定手段をさらに有する、付記9または10に記載の制御装置。
[付記12]
コンピュータにより、
タスクを実行するロボットと他作業体とが協働作業を行う作業空間内の物体の種類及び状態に関する認識結果に基づき、前記ロボットに実行させる動作シーケンスを生成する、制御方法。
[付記13]
タスクを実行するロボットと他作業体とが協働作業を行う作業空間内の物体の種類及び状態に関する認識結果に基づき、前記ロボットに実行させる動作シーケンスを生成する動作シーケンス生成手段
としてコンピュータを機能させるプログラムが格納された記録媒体。
以上、実施形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。すなわち、本願発明は、請求の範囲を含む全開示、技術的思想にしたがって当業者であればなし得るであろう各種変形、修正を含むことは勿論である。また、引用した上記の特許文献等の各開示は、本書に引用をもって繰り込むものとする。
1、1A 制御装置
2 入力装置
3 表示装置
4 記憶装置
5 ロボット
6 作業空間
7 検出装置
8、8A~8C 他作業体
41 アプリケーション情報記憶部
100 ロボット制御システム

Claims (10)

  1. タスクを実行するロボットと他作業体とが協働作業を行う作業空間内の状態を検出する検出装置が出力する検出信号を取得する取得手段と、
    前記検出信号に基づき認識された前記作業空間内の物体の種類及び状態に関する認識結果に基づき、前記ロボットに実行させる動作シーケンスを生成する動作シーケンス生成手段と、
    を有し、
    前記物体には、前記他作業体と、前記ロボットの作業対象となる対象物とが含まれ、
    前記動作シーケンス生成手段は、前記他作業体の状態と、前記対象物の状態とに関する前記認識結果に基づき、前記動作シーケンスを生成する、
    制御装置。
  2. 前記動作シーケンス生成手段は、
    前記他作業体の動作に関する認識結果に基づき、前記他作業体のダイナミクスを抽象化した他作業体抽象モデルを決定し、
    当該他作業体抽象モデルと、前記物体の種類及び状態に関する認識結果とに基づき、前記動作シーケンスを生成する、請求項1に記載の制御装置。
  3. 前記動作シーケンス生成手段は、前記他作業体のダイナミクスを動作毎に抽象化したモデルに関する他作業体動作モデル情報に基づき、前記他作業体抽象モデルを決定する、請求項2に記載の制御装置。
  4. 前記他作業体の動作に関する認識結果に基づき、前記他作業体抽象モデルのパラメータを学習する学習手段をさらに有する、請求項2または3に記載の制御装置。
  5. 前記他作業体の動作に関する認識結果には、前記他作業体が実行中の動作及び予測される動作に関する認識結果が含まれ、
    前記動作シーケンス生成手段は、前記他作業体が実行中の動作及び予測される動作に関する認識結果に基づき、前記動作シーケンスを生成する、請求項2~4のいずれか一項に記載の制御装置。
  6. 前記動作シーケンス生成手段は、複数存在する前記他作業体の各々の作業効率に基づき、前記動作シーケンスを生成する、請求項1~5のいずれか一項に記載の制御装置。
  7. 前記動作シーケンス生成手段は、前記他作業体の各々の作業効率に基づき前記他作業体の各々の作業に対する効用を重み付けした効用関数を設計し、当該効用関数を最適化することで、前記動作シーケンスを生成する、請求項6に記載の制御装置。
  8. 前記検出信号に基づき、前記物体の種類及び状態の認識を行う認識手段をさらに有し、
    前記動作シーケンス生成手段は、前記認識手段の認識結果に基づき、前記動作シーケンスを生成する、請求項1~7のいずれか一項に記載の制御装置。
  9. コンピュータにより、
    タスクを実行するロボットと他作業体とが協働作業を行う作業空間内の状態を検出する検出装置が出力する検出信号を取得し、
    前記検出信号に基づき認識された前記作業空間内の物体の種類及び状態に関する認識結果に基づき、前記ロボットに実行させる動作シーケンスを生成し、
    前記物体には、前記他作業体と、前記ロボットの作業対象となる対象物とが含まれ、
    前記他作業体の状態と、前記対象物の状態とに関する前記認識結果に基づき、前記動作シーケンスを生成する、
    制御方法。
  10. タスクを実行するロボットと他作業体とが協働作業を行う作業空間内の状態を検出する検出装置が出力する検出信号を取得する取得手段と、
    前記検出信号に基づき認識された前記作業空間内の物体の種類及び状態に関する認識結果に基づき、前記ロボットに実行させる動作シーケンスを生成する動作シーケンス生成手段
    としてコンピュータを機能させ
    前記物体には、前記他作業体と、前記ロボットの作業対象となる対象物とが含まれ、
    前記動作シーケンス生成手段は、前記他作業体の状態と、前記対象物の状態とに関する前記認識結果に基づき、前記動作シーケンスを生成するプログラム。
JP2022502363A 2020-02-25 2020-02-25 制御装置、制御方法及びプログラム Active JP7364032B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2020/007448 WO2021171358A1 (ja) 2020-02-25 2020-02-25 制御装置、制御方法及び記録媒体

Publications (3)

Publication Number Publication Date
JPWO2021171358A1 JPWO2021171358A1 (ja) 2021-09-02
JPWO2021171358A5 JPWO2021171358A5 (ja) 2022-11-09
JP7364032B2 true JP7364032B2 (ja) 2023-10-18

Family

ID=77490796

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022502363A Active JP7364032B2 (ja) 2020-02-25 2020-02-25 制御装置、制御方法及びプログラム

Country Status (3)

Country Link
US (1) US20230104802A1 (ja)
JP (1) JP7364032B2 (ja)
WO (1) WO2021171358A1 (ja)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004017256A (ja) 2002-06-19 2004-01-22 Toyota Motor Corp 人間と共存するロボットの制御装置と制御方法
JP2010120139A (ja) 2008-11-21 2010-06-03 New Industry Research Organization 産業用ロボットの安全制御装置
JP2010188515A (ja) 2009-01-26 2010-09-02 Fanuc Ltd 人間とロボットとの協調動作領域を有する生産システム
JP2014094436A (ja) 2012-11-12 2014-05-22 Yaskawa Electric Corp ロボットシステム
JP2016104074A (ja) 2014-12-01 2016-06-09 富士ゼロックス株式会社 姿勢判定装置、姿勢判定システム及びプログラム
JP2017039170A (ja) 2015-08-17 2017-02-23 ライフロボティクス株式会社 ロボット装置
WO2017141569A1 (ja) 2016-02-15 2017-08-24 オムロン株式会社 制御装置、制御システム、制御方法およびプログラム
JP2017221985A (ja) 2016-06-13 2017-12-21 ファナック株式会社 ロボットシステム
JP2018030185A (ja) 2016-08-23 2018-03-01 ファナック株式会社 人とロボットが協働して作業を行うロボットの動作を学習する機械学習器、ロボットシステムおよび機械学習方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004017256A (ja) 2002-06-19 2004-01-22 Toyota Motor Corp 人間と共存するロボットの制御装置と制御方法
JP2010120139A (ja) 2008-11-21 2010-06-03 New Industry Research Organization 産業用ロボットの安全制御装置
JP2010188515A (ja) 2009-01-26 2010-09-02 Fanuc Ltd 人間とロボットとの協調動作領域を有する生産システム
JP2014094436A (ja) 2012-11-12 2014-05-22 Yaskawa Electric Corp ロボットシステム
JP2016104074A (ja) 2014-12-01 2016-06-09 富士ゼロックス株式会社 姿勢判定装置、姿勢判定システム及びプログラム
JP2017039170A (ja) 2015-08-17 2017-02-23 ライフロボティクス株式会社 ロボット装置
WO2017141569A1 (ja) 2016-02-15 2017-08-24 オムロン株式会社 制御装置、制御システム、制御方法およびプログラム
JP2017144490A (ja) 2016-02-15 2017-08-24 オムロン株式会社 制御装置、制御システム、制御方法およびプログラム
JP2017221985A (ja) 2016-06-13 2017-12-21 ファナック株式会社 ロボットシステム
JP2018030185A (ja) 2016-08-23 2018-03-01 ファナック株式会社 人とロボットが協働して作業を行うロボットの動作を学習する機械学習器、ロボットシステムおよび機械学習方法

Also Published As

Publication number Publication date
JPWO2021171358A1 (ja) 2021-09-02
WO2021171358A1 (ja) 2021-09-02
US20230104802A1 (en) 2023-04-06

Similar Documents

Publication Publication Date Title
CN109483534B (zh) 一种物体抓取方法、装置和系统
JP2015520040A (ja) 産業用ロボットを訓練および動作させること
JP7264253B2 (ja) 情報処理装置、制御方法及びプログラム
CN114516060A (zh) 用于控制机器人装置的设备和方法
JP7452619B2 (ja) 制御装置、制御方法及びプログラム
WO2022074823A1 (ja) 制御装置、制御方法及び記憶媒体
Nguyen et al. Merging physical and social interaction for effective human-robot collaboration
JP7364032B2 (ja) 制御装置、制御方法及びプログラム
JP7416197B2 (ja) 制御装置、制御方法及びプログラム
Wei A comprehensive approach to the generation of human-like arm movements on robot NAO
JP7448024B2 (ja) 制御装置、制御方法及びプログラム
Yao et al. Virtual data generation for human intention prediction based on digital modeling of human-robot collaboration
JP7416199B2 (ja) 制御装置、制御方法及びプログラム
JP7276466B2 (ja) 情報処理装置、制御方法及びプログラム
JP7468694B2 (ja) 情報収集装置、情報収集方法及びプログラム
WO2022244060A1 (ja) 動作計画装置、動作計画方法及び記憶媒体
JP7456552B2 (ja) 情報処理装置、情報処理方法及びプログラム
JP7323045B2 (ja) 制御装置、制御方法及びプログラム
WO2022074827A1 (ja) 命題設定装置、命題設定方法及び記憶媒体
WO2022049756A1 (ja) 判定装置、判定方法及び記憶媒体
JP7435814B2 (ja) 時相論理式生成装置、時相論理式生成方法及びプログラム
JP7435815B2 (ja) 動作指令生成装置、動作指令生成方法及びプログラム
Padois Control and design of robots with tasks and constraints in mind
JP7409474B2 (ja) 制御装置、制御方法及びプログラム
Nambiar et al. Automation of unstructured production environment by applying reinforcement learning

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220812

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220812

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230228

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230410

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230606

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230804

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230905

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230918

R151 Written notification of patent or utility model registration

Ref document number: 7364032

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151