JP2008000883A

JP2008000883A - ロボットの対話型挙動の制御

Info

Publication number: JP2008000883A
Application number: JP2007134071A
Authority: JP
Inventors: Michael Gienger; ミヒャエル・ギンガー
Original assignee: Honda Research Institute Europe GmbH
Current assignee: Honda Research Institute Europe GmbH
Priority date: 2006-06-22
Filing date: 2007-05-21
Publication date: 2008-01-10
Also published as: CN101092032A; US8725294B2; KR20070121574A; EP1870211A1; US20080009957A1; EP1870211B1; CN101092032B

Abstract

【課題】ロボットの対話型挙動の制御を提供すること。
【解決手段】挙動の目標をセレクタ・ユニットに定義し、セレクタ・ユニットが目標に到達するための複数の挙動命令をそれぞれ発生させ、各々の命令に対して、前記機械的システムの対応する結果として得られる動作を、機械的システムの一体化した部分であるコンピューティング・ユニットによって、内部的にシミュレートする。シミュレートされた結果として得られた動作の各々の適応度を、少なくとも１つの目的に関して評価し、最高の適応度値を有するシミュレートされた動作が得られた命令を、機械的システムの物理的アクチュエータに送り、知能的機械的システムの挙動を制御し、複数の自由度からなる異なる動作挙動を行うことができる。
【選択図】図１

Description

本発明は、動的環境に応答してロボットの反応を計算し制御する技術に関する。

この技術は、例えば動的な対話（ｉｎｔｅｒａｃｔｉｏｎ）を要する協働的な物品の引渡し、または任意の他の協働的なタスクのようなシステムと動的な対話を作り出すために、例えば使用することができる。しかしながら、本発明は、制御理論の分野に限定されず、他の機械的システムにも適用することができる。

例えばロボットなどの機械的システムの、その環境との対話を改善することが本発明の目的である。

この目的は、独立請求項の特徴を用いて達成することができる。従属請求項は、さらに本発明の中心的着想を発展させる。

本発明の第１の態様は、それぞれ複数の自由度からなる異なる動作挙動を行うことができる、例えばロボットなどの知能的機械的システム（ｉｎｔｅｌｌｉｇｅｎｔｍｅｃｈａｎｉｃａｌｓｙｓｔｅｍ）の挙動（ｂｅｈａｖｉｏｕｒ）を制御する方法に関し、この方法は以下のステップを含む：
− 挙動のための目標をセレクタ・ユニットに定義するステップ、
− セレクタ・ユニットが、定義された目標にそれぞれ到達するようになされた複数の挙動命令を発生させるステップ、
− 各々の命令に対して、前記機械的システムの対応する結果として得られる（複数の）動作を、前記機械的システムの一体化した部分であるコンピューティング・ユニットによって、内部的（ｉｎｔｅｒｎａｌｌｙ）にシミュレートするステップと、
− シミュレートされた結果として得られる動作の各々の適応度を、少なくとも１つの目的に関して評価するステップ、および
− 最高の適応度値を有するシミュレートされた動作が得られる命令を機械的システムの物理的アクチュエータに送るステップ。

「内部的にシミュレートする」は、例えば一体化されたコンピューティング・ユニットを使用して機械的システムが自立的に異なる案をシミュレートすることであると理解されるべきである。

この機械的システムは、自立的ロボットであることができる。

目標は、この機械的システムの視覚システムによって発生させることができる。

シミュレーションは、逆運動学（ｉｎｖｅｒｓｅｋｉｎｅｍａｔｉｃｓ）または逆動力学（ｉｎｖｅｒｓｅｄｙｎａｍｉｃｓ）手法を使用して行われる。

適応度（ｆｉｔｎｅｓｓ）は、費用関数（ｃｏｓｔｆｕｎｃｔｉｏｎ）を使用して計算することができる。

内部シミュレーション処理速度は、下位の機械的システムの機械的応答時間より早く設定することができる。

処理ステップは、反復方法で行うことができる。

シミュレーションは、自己コリジョン検出、自己コリジョン回避および／または外部オブジェクトの回避を含むことができる。

シミュレーションは、動作の運動学的シミュレーションまたはシステムの動きおよび力の対話を考慮する動力学的シミュレーションである。

本発明は、そのような方法を実施するように設計される制御器にも関する。

本発明はそのような制御器を有するロボットにも関する。

最後に本発明は、コンピュータ装置上で実行するとき、添付の請求項のいずれかに記載の方法を実施するコンピュータ・ソフトウェア製品にも関する。

本発明の別の特徴、態様および目的は、添付の図面の図と共に行われる実施形態の添付の詳細な説明を読むとき、技術者に明らかになるであろう。

本発明は、それぞれ複数の自由度を含む、異なる動作挙動を行うことができるロボットなどの知能的機械的システムを提案する。

「知能的（ｉｎｔｅｌｌｉｇｅｎｔ）」は、高レベルの命令を処理し、これらの命令に応答して機械的システムの物理的挙動を制御することができるコンピューティング・ユニットが装備されるシステムを意味し、（環境に関連する）高レベル命令に応答する挙動は対話型挙動（ｉｎｔｅｒａｃｔｉｖｅｂｅｈａｖｉｏｕｒ）を示す。

この機械的システムは、挙動を「切り換える（ｓｗｉｔｃｈ）」、すなわち挙動の任意選択肢の中から選択するように設計される。現実面で（かつ内部シミュレーションでのみではなく）実際に行われるこの物理的な挙動の選択は、例えば図１に示すような内部シミュレーション・アーキテクチャに基づいて行うことができる。図１に示すように、高レベルのタスクから結果として発生する高レベル命令は、選択インスタンス（セレクタ（ｓｅｌｅｃｔｏｒ））に送られる。ここで、高レベルのタスクとは、例えばロボットの視覚システムまたは他の（例えば音響的）検知システムによって処理され決められる目標などである。この目標は抽象的な形態を有することができ、必ずしもロボット特有の目標記述に対応する必要はない。

この高レベルのタスクは、ロボット自体によって（例えば物体認識を介して）、およびロボットに外部命令を供給することによっての一方または両方によって発生させることができる。

第２のステップで、この高レベル目標はセレクタによって処理される。この機構は抽象的な目標から異なる命令ｃｍｄ１、ｃｍｄ２、．．．を発生させる。個々の命令の各々は、高レベル目標を達成できるように発生させられる。これらの命令ｃｍｄ１、ｃｍｄ２、．．．は、下位にあるロボットまたは他の機械的システムによって多次元の自由度で物理的に制御できる制御入力に対応する。発生する命令ｃｍｄ１、ｃｍｄ２、．．．の数に関して上限はない。

第３のステップで、各々の個々の命令は下位ロボット／システムの内部シミュレーション機構に渡される。この内部シミュレーションはこの命令を受け取り、ロボット／システムのそれぞれの動作を計算することを介してシミュレートする。ロボット制御では、これは例えば「逆運動学」または「逆動力学」の方法で行うことができる。

さらなるステップでは次いで、この内部シミュレーションはシミュレートされた動作を評価するが、そこではそれは異なる目的（速度、消費されるリソースを最適化する、等）を示す費用関数を使用してある値を計算する。この値は、「適応度値（ｆｉｔｎｅｓｓｖａｌｕｅ）」と呼ぶこともできる。

「費用関数」および「適応度値」は、最適化の分野ではよく認知された術語である。

この費用関数値は、所与の対話型シナリオによって変わる。どのようにそのような費用関数をもたらすことができるかの考え得る例が以下の実施例で与えられる。次のステップでは、個々の内部シミュレーション・インスタンスの各々がその費用値（ｃｏｓｔｖａｌｕｅ）を選択機構に通信して戻す。選択機構は次に、例えば適応度値に「勝者がすべてを得る（ｗｉｎｎｅｒｔａｋｅｓａｌｌ）」戦略を適用することによって、特定の状況に対して最も適切なシミュレーションを選ぶ。次に選ばれたシミュレーション・インスタンスの命令が物理的なロボット／システムに送られる。

以下の点が強調されるべきである。

・内部シミュレーションの処理速度はリアルタイムより高い場合がある。これは、内部シミュレーション・インスタンスが、物理的なロボットがそのような状態に達してしまう前に戦略が適切か否かを決めることができることを意味する。これは「内部予測（ｉｎｔｅｒｎａｌｐｒｅｄｉｃｔｉｏｎ）」能力と命名することができる。
・提示された方法は、反復ステップで働くことができる。これは、セレクタ、シミュレーションおよび現実のロボット／システムの間のループが非常に短い時間間隔（例えば１ミリ秒）内でアップデートされることを意味する。これによってこの方法は、変化が現行の「高レベル命令」に反映されるであろうから、変化する環境に迅速に反応できるようになる。したがってロボットの挙動は、進行中のタスクの実行中にアップデートすることができる。
・この内部シミュレーションはロボット制御器の完全なシミュレーションを含む。これは、自己コリジョン検出、自己コリジョン回避および外部オブジェクトの回避のための方法も含むことができる。
・このシミュレーションは、（動作のみを考慮する）運動学的シミュレーションまたは（システムの力の対話も考慮する）動力学的シミュレーションであることができる。

ロボットが人間の手から物体を取るとする。人間はその物体を保持し、かつ適宜移動させることができる。「高レベル命令」は、例えばカメラ・システムによって抽出されるその物体の座標であろう。次に選択機構は図２に示すように以下の命令分離を行うことができた。

・物体の座標を左手に割り当てる、静止して立つ（選択肢１）
・物体の座標を右手に割り当てる、静止して立つ（選択肢２）
・物体の座標を左手に割り当てる、歩く（選択肢３）
・物体の座標を右手に割り当てる、歩く（選択肢４）

次に各シミュレーションが評価される。最も適切な戦略の選択は多基準費用関数（ｍｕｌｔｉ−ｃｒｉｔｅｒｉａｃｏｓｔｆｕｎｃｔｉｏｎ）（適応度関数も）に基づいている。これを示すために、人間の手から物体を握らなければならないロボットが想定されている。したがって、「物体を握っている」が高レベル命令である。

この例では、費用関数が以下の発見的方法を符号化する：立っていることが歩くことより、歩くことは何もしないことより好ましい。このために、以下の判定基準が適応度関数に組み込まれる：

・目標の到達可能性
目標に到達できない場合、高いペナルティが費用関数に加えられる。これは結果としてこの戦略は選択されないであろうことになる。
・姿勢の不快さ
関節の中心位置に対する、関節の重み付け最小二乗距離（ｗｅｉｇｈｔｅｄｌｅａｓｔｓｑｕａｒｅｓ）が、「不快（ｄｉｓｃｏｍｆｏｒｔ）」ペナルティを規定する。目標は１つの側からもう１つの側に移動するときはいつでも、このペナルティはシステムを伸ばす腕に切り換えさせる。
・「怠惰（Ｌａｚｉｎｅｓｓ）」
歩くことより立っていることの方が選ばれるように、歩く戦略の両方は一定のペナルティを受ける。
・目標までの時間
このペナルティは歩く戦略に加えられる。それは目標までの推測時間の尺度であり、その結果目標に最も効率的に到達することができる。このペナルティはロボットに、ロボットを最小の歩数を有する姿勢に向かわせる戦略を選択するようにさせる。

この実施例は簡単に見えるが、一般的な考え方はより進んだ決定機構を組み込み、任意の複雑な判断基準を策定することを可能にする。この新生ロボットの挙動は非常に興味深い（進行を示す図２を参照）：

− 物体を左から右に移動させるとき、ロボットは最初（図２の最初の期間）に右手でそれに到達しようと試み、次いで動的に左手に切り換える（第２の期間）。
− 物体が到達圏外にある場合、ロボットは歩き始め物体を追跡する（図２の第３の期間）。
− 図２の第３の期間に、ロボットは歩き、同時に左手で物体に到達しようと試みる。
− 図２の第４の期間に、ロボットは歩き、同時に右手で物体に到達しようと試みる。

図２は、最初から最後までの時間にわたる４つの費用関数の展開を示す。最低値を有する費用関数が最良であるとみなされる。それぞれの戦略が動作中である期間が時間軸の下で示されている。

図２から、高レベル命令を実施しようと試みている間、この内部シミュレーションは、この高レベル・タスクの遂行の現行の進行状況の見地から最良の挙動案を反復して計算しつづける。

以下の点に留意すべきである：上記で述べた方法で内部シミュレーションを使用する提案された選択機構は、他のロボットまたはシステムにも適用することができる。

ロボットの対話型挙動を制御するための線図である。時間に対する４つのシミュレーション・インスタンスの適応度関数の進行の図である。

Claims

それぞれ複数の自由度からなる異なる動作挙動を行うことができる、知能的機械的システムの挙動を制御するための方法であって、前記方法が、
挙動の目標をセレクタ・ユニットに定義するステップと、
前記セレクタ・ユニットが、前記定義された目標に到達するための複数の挙動命令をそれぞれ発生させるステップと、
各々の命令に対して、前記機械的システムの対応する結果として得られる動作を、前記機械的システムの一体化した部分であるコンピューティング・ユニットによって、内部的にシミュレートするステップと、
シミュレートされた結果として得られた動作の各々の適応度を、少なくとも１つの目的に関して評価するステップと、
最高の適応度値を有するシミュレートされた動作が得られた前記命令を、前記機械的システムの物理的アクチュエータに送るステップと
を含む方法。
前記機械的システムが自立的ロボットである、請求項１に記載の方法。
前記目標が前記機械的システムの視覚システムによって発生する、請求項１または２に記載の方法。
前記シミュレーションが逆運動学または逆動力学手法を使用して行われる、請求項１から３のいずれかに記載の方法。
前記適応度が費用関数を使用して計算される、請求項１から４のいずれかに記載の方法。
前記内部シミュレーション処理速度が、前記下位の機械的システムの機械的な応答時間より早く設定される、請求項１から５のいずれかに記載の方法。
前記処理ステップが反復方法で行われる、請求項１から６のいずれかに記載の方法。
前記シミュレーションが、自己コリジョン検出、自己コリジョン回避および外部オブジェクトの回避の一方または両方を含む、請求項１から７のいずれかに記載の方法。
前記シミュレーションが、動作の運動学的シミュレーションまたは前記システムの動きおよび力の対話を考慮する動力学的シミュレーションである、請求項１から８のいずれかに記載の方法。
請求項１から９のいずれかに記載の方法を実施するように設計される制御器。
請求項１０に記載の制御器を有するロボット。
コンピュータ装置で実行されるとき、請求項１から１１のいずれかに記載の方法を実施する、コンピュータ・ソフトウェア製品。