JP2010058260A

JP2010058260A - 進化アルゴリズムと模倣学習に基づくロボットの動作制御方法

Info

Publication number: JP2010058260A
Application number: JP2008302457A
Authority: JP
Inventors: Syung-Kwon Ra; 成権羅; Ga-Lam Park; ガ−ラムパク、; Shokan Kin; 昌煥金; Bum-Jae You; 凡材劉
Original assignee: Korea Advanced Institute of Science and Technology KAIST; Korea Institute of Science and Technology KIST
Current assignee: Korea Advanced Institute of Science and Technology KAIST; Korea Institute of Science and Technology KIST
Priority date: 2008-09-01
Filing date: 2008-11-27
Publication date: 2010-03-18
Also published as: KR100995933B1; US20100057255A1; KR20100026785A

Abstract

【課題】ロボットが人間の動作を学習できる進化アルゴリズムに基盤したロボットの動作制御方法を提供する。
【解決手段】本発明は進化アルゴリズムを利用したロボットの動作制御方法に関するものである。本発明は人間の動作パターンを収集してデータベースを構築する段階と、主成分分析及び逆動力学基盤の補間法を利用した遺伝演算子を利用して前記データベースを進化させる段階と、前記進化したデータベースを利用してリアルタイムでロボットの動作を生成する段階を含むロボットの動作制御方法を提供する。
本発明によると進化したデータベースを利用してロボットが人間の運動を学習し、最適化した動作をリアルタイムで制御することができる。
【選択図】図１

Description

本発明はロボットの動作制御方法に関し、特に、進化アルゴリズムを利用してロボットに人間の動作を学習させた後、リアルタイムでロボットの動作を制御する方法に関するものである。

最近の人間型ロボットは機構的構造や外形だけでなく、歩くことや走ることなどのような動作制御能力においても人間に近くなっている。それはロボットに人間の動作と類似な動作を行うようにする試みが続いているためである。

例えば、人間の動作をデータベースに貯蔵し、貯蔵された動作をロボットが再現することによって人間の動作を模倣させることもできる。しかし、ロボットが必要とする幾多の動作を全て予め記録して蓄積し、これを活用するということは物理的に不可能である。

一方、モーションキャプチャー（motion capture）システムを利用することによってロボットに人間の動作を模倣して再現させる場合、キャプチャーされた人間の動作パターンをそのままロボットに適用するとロボットが人間のような自然な動作をすることもできる。しかし、質量、質量中心または慣性質量のような物性値が人間とロボットは互いに異なるためにキャプチャーされた動作がロボットに最適化されたということではない。

このような問題を解決するために本発明は、ロボットが人間の動作を学習できる進化アルゴリズムに基づいたロボットの動作制御方法を提供する。

本発明の特徴によるロボットの動作制御方法は、（ａ）人間の動作パターンを収集してデータベースを構築する段階;（ｂ）主成分分析及び逆動力学に基づいた補間法を適用した遺伝演算子を利用して前記データベースを進化させる段階;及び（ｃ）前記進化したデータベースを利用してリアルタイムでロボットの動作を生成する段階を含むことができる。

前記（ａ）段階は人間の動作をモーションキャプチャーする段階を含むことができる。

また、前記（ｂ）段階は、（ｂ−１）ロボットが行う任意の動作と類似な動作状態を有する基本動作を前記データベースから１つ以上選択する段階;及び（ｂ−２）主成分分析による主成分抽出及び前記主成分の結合を通じて最適動作を新たに生成することによって、前記選択された基本動作を再加工する段階を含むことができる。

前記（ｂ）段階は、前記（ｂ−１）段階と前記（ｂ−２）段階を繰り返して行って前記データベースを進化させる段階を含むことができる。

前記（ｂ−１）段階で、前記任意の動作は次の式（１１）で示すことができる。
ここで、
は前記任意の動作の関節角軌跡、
は前記選択された基本動作の平均関節角軌跡、
は前記選択された基本動作の関節角軌跡の中でｉ番目主成分軌跡、
はスカラー係数である。

前記任意の動作の動作状態は次の式（１２）で示す境界条件を満足することができる。
ここで、
は開始時間
における関節角、
は開始時間
における関節角速度、
は終了時間
における関節角、
は終了時間
における関節角速度である。

前記（ｂ−２）段階で、前記選択された基本動作が１つ以上の関節角軌跡を含む時、前記関節角軌跡の平均軌跡
を次の式（１３）によって計算する。
ここで、ｋは選択された基本動作の数であり、
はｉ番目基本動作の関節角軌跡である。

また、次の式（１４）によって共分散行列（Ｓ）を計算し、
前記共分散行列から固有ベクターを得て、前記固有ベクターの中で前記関節角軌跡の主成分軌跡を得ることができる。

前記（ｂ−２）段階で、次の式（１５）を通じて前記選択された基本動作の関節トルク
を決める。
ここで、
は前記選択された基本動作の関節角、
は前記選択された基本動作の関節角速度、
は前記選択された基本動作の関節角加速度、
は質量マトリックス、
はコリオリベクターである。

また、
は重力及びその他の力を含む。

前記決められた関節トルクが次の式（１６）を最小にすると、前記選択された基本動作を前記最適動作に決めることができる。
前記（ｃ）段階は主成分分析及び機構学的補間による動作の再結合方法を利用することができる。

また、前記（ｃ）段階は、（ｃ−１）ロボットが生成する動作と類似な動作状態を有する基本動作を前記進化したデータベースから１つ以上選択する段階;及び（ｃ−２）主成分分析による主成分抽出及び前記主成分の結合を通じて最適動作を新たに生成することによって、前記選択された基本動作を再加工する段階を含むことができる。

前記（ｃ−１）段階で、前記ロボットが生成する動作は次の式（１７）で示すことができる。
ここで、
は前記ロボットが生成する動作の関節角軌跡、
は前記選択された基本動作の平均関節角軌跡、
は前記選択された基本動作の関節角軌跡の中でｉ番目主成分軌跡、
はスカラー係数である。

前記ロボットが生成する動作の動作状態は次の式（１８）で示す境界条件を満足することができる。
ここで、
は開始時間
における関節角、
は開始時間
における関節角速度、
は終了時間
における関節角、
は終了時間
における関節角速度である。

前記（ｃ−２）段階で、前記選択された基本動作が１つ以上の関節角軌跡を含む時、前記関節角軌跡の平均軌跡
を次の式（１９）によって計算する。
ここで、ｋは選択された基本動作の数であり、
はｉ番目基本動作の関節角軌跡である。

さらに次の式（２０）を通じて共分散行列（Ｓ）を計算する。
次に、前記共分散行列から固有ベクターを得て、前記固有ベクターの中で前記関節角軌跡の主成分軌跡を得ることができる。

本発明によると、人間の基本動作をロボットの特性に合わせて進化させることによってロボットに最適化した動作を行うようにすることができる。

また、本発明によると、進化した基本動作データベースに基づいてロボットがリアルタイムで動作を生成することができる。

また、本発明によると、モーションキャプチャーデータのみあればこれを容易にロボットに適用することができるので、ロボットが人間の多様な動作を模倣及び再現することができる。

以下、添付した図面を参照して本発明の実施例について本発明が属する技術分野における通常の知識を有する者が容易に実施できるように詳しく説明する。しかし、本発明は多用で相異なる形態で実現することができ、ここで説明する実施例に限られない。さらに、図面で本発明を明確に説明するために説明と関係ない部分は省略し、明細書全体にわたって類似の部分については類似の図面符号を付けた。

ロボットの動作は作業（task）と状態（condition）からなる。例えば、手をテーブル上のカップへ持っていく動作があるとすると、手をカップに持っていくことがこの動作が属した作業であり、テーブル上のカップの位置がこの動作の状態である。しかし、すべての位置のカップに手を持っていく動作をいちいち蓄積しておいて、これを活用することは物理的に不可能である。

本発明の実施例では限定された数の動作のみを貯蔵し、１つ以上の関節角軌跡からなる動作を基本動作（movement primitive）と定義する。また、本発明の実施例では基本動作の補間（interpolation）を通じてカップの位置のような多様な動作状態に対するロボットの腕の動作を生成する。

１つの基本動作が進化アルゴリズムにおける１つの個体（individual）となる。例えば、１２０Ｈｚでサンプリングされた１２０秒長さを有する基本動作があるとすると、この個体の染色体形態（genotype）は１４４００行を有する実数ベクターである（１４４００=１２０秒×１２０Ｈｚ）。また、収集されて限定された数の基本動作が集団をなして両親個体として動作する。

図１は本発明の実施例による主成分分析基盤の遺伝演算子を示す図面である。

図１を参照すると、作業Ｔに属するｎ個の個体が両親個体をなしている。各個体をｍ_１からｍ_ｎと表示すると、各個体はそれぞれ自分の動作状態を有する。つまり、個体ｍ_ｉの動作状態はｃ_ｉと表示される。

もし、動作状態ｃ_３を有する動作が必要であれば、ｎ個の両親個体の中で動作状態ｃ_３と最も近い動作状態を有する個体をｋ個選択する。これは動作状態の類似性を比較する適切な尺度（distance metric）を導入して解決することができる。

例えば、カップが特定の位置に置かれている場合、この特定の位置へ手を持っていく腕の動作が必要である。この場合、カップの３次元位置ベクターを動作状態ｃ_３に定義することができ、動作状態の類似性を比較するために、次の式（２１）の形態で距離尺度を使用する。
このように選ばれたｋ個の動作個体を
と表示する。１つの動作個体はいくつかの関節角からなる。例えば、７自由度を有するマニピュレータの動作を記述すると動作個体１つは７個の関節角軌跡で構成される。

ｋ個の動作個体
から得られた最初（又は初期）自由度の関節角軌跡をそれぞれ
と表示する。この場合、次の式（２２）を通じて平均軌跡ｑ_ｍｅａｎを得ることができる。
一方、次の式（２３）を通じて共分散行列Ｓが得られる。
共分散行列Ｓから得られた固有ベクターと固有値をそれぞれ
と
と表示する。ここで、固有値は
と整列された。

固有ベクター
を主成分とし、これら固有ベクターはそれぞれ関節角軌跡を示す。主成分分析の特性に応じてｋ個の主成分の中で支配的ないくつかの主成分のみを有して全関節角軌跡の特性を知ることができる。それは主成分分析は高次元のデータを低次源の空間に投影させて次元を減らす機能をするためである。

結果的に、最初（初期）自由度の関節角
から平均軌跡ｑ_ｍｅａｎとｋ個の主成分軌跡
を得ることができる。一方、このような過程を第２、第３などの関節に対する軌跡に対しても同一に適用し、各関節に対して平均軌跡と主成分軌跡を得ることができる。

一方、任意のロボット動作は下記式（２４）のように平均軌跡と主成分軌跡の線状結合で示すことができる。
ここでｑ（ｔ）は関節角軌跡、ｑ_ｍｅａｎ（ｔ）は平均関節角軌跡、
はｉ番目主成分軌跡である。そしてｘ_ｉ（ｉ=１、２、３、４、５）はスカラー係数である。

一般に動作状態ｃ_３は開始時刻ｔ_０での関節角ｑ_０と関節角速度
、そして終了時刻ｔ_ｆでの関節角ｑ_ｆと関節角速度
で与えられる。

一方、未知数ｘ_ｉは５個であるので、４個の境界条件を満足する未知数５個を決めるために次の式（２５）、（２６）を通じて最適化過程を行う。
ここで、
は関節トルクである。この関節トルクは関節角ｑ、関節角速度
及び関節角加速度
が決められると前記式（２６）を通じて計算することができる。最小化しようとする目的関数である式（２５）は与えられた関節軌跡を動かす時、ロボットが必要とするトルクの合計である。

このような最適化過程を通じて最小のエネルギー（トルク）を必要としながら、与えられた動作状態ｃ_３を満足する動作個体、つまり、新たなｍ_３を生成することができる。この過程を‘逆動力学基盤の最適化を通じた動作の再結合（Reconstituting motion via dynamics−based optimization）’と言う。

新たに生成された子供個体ｍ_３は両親個体ｍ_３のような動作状態ｃ_３を持っている。しかし、子供個体ｍ_３は両親個体ｍ_３を含む複数固体の主成分を分解及び再結合して生成されたものであるので、両親個体のような動作軌跡を有しない。したがって、進化アルゴリズム内で２つの個体の優秀性を判断してさらに優れた個体が次代の両親集団に属する。このような過程がｃ_０からｃ_ｎまで適用されることによってｎ個の子供集団が生成される。

一方、両親集団に属するｍ_ｉと子供集団に属するｍ_ｉの中でさらに優れた動作個体を次代の両親集団に選定するために適合度関数（fitness function）が必要であるが、これは次の式（２７）で定義される。
つまり、２つの動作個体の中でトルク（エネルギー）を少なく消費するものが次代の両親個体となる。

式（２７）は式（２５）と同一である。つまり、遺伝演算子で使用された逆動力学基盤の最適化での目的関数と進化アルゴリズムで使用された目的関数が同一である。その理由は、遺伝演算子は局部的な最適化作用（local optimizer）をして進化アルゴリズムは全域的な最適化作用（global optimizer）をするように意図されたためである。つまり、局部的最適化と全域的最適化が同時に行われることによって、集団をなしている動作個体が次第に少ないトルクを必要とするエネルギー効率的な動作パターンへ進化して行くように意図されたものである。

図２は本発明の実施例による遺伝演算子と適合度関数を利用して基本動作が進化する過程を概略的に示す図面である。

まず、人間の動作を収集して１つの作業を行う反復動作で初期両親集団を選択する。これら反復動作は多様な動作条件を包括することに選定する。

次に、初期両親集団から動作個体を抽出し、抽出された動作個体は主成分分析基盤の遺伝演算子を通じて子供集団を形成する。

また、両親集団と子供集団の動作個体をそれぞれ比較してさらに優れた動作個体が次代の両親集団を形成し、劣等な動作個体は捨てる。この過程は遺伝演算子で使用された逆動力学基盤の最適化過程の計算量のために多くの時間がかかる。

次に、このように形成された進化した基本動作を利用して、その時その時必要とする動作をロボットがリアルタイムで生成することができる。この過程もまた基本動作の主成分分析とその再結合からなる。つまり、ロボットが任意の動作状態ｃ_ｉを有する動作を生成しなければならないと、動作状態ｃ_ｉと類似の動作状態を有する動作を進化した基本動作データベースから抽出し、主成分分析を通じて平均軌跡と主成分軌跡を得る。ここまでの過程は主成分分析基盤の遺伝演算子と同一である。

しかし、主成分分析基盤の遺伝演算子とは異なって、ここではロボットの動作を構成することにおいて次の式（２８）のように平均軌跡と３つの主成分軌跡のみを使用する。
ここでｑ（ｔ）は関節角軌跡、ｑ_ｍｅａｎ（ｔ）は平均関節角軌跡、
はｉ番目主成分軌跡である。そして、ｘ_ｉ（ｉ=１、２、３、４）はスカラー係数である。

一般に動作状態ｃ_３は開始時刻ｔ_０での関節角ｑ_０と関節角速度
、そして終了時刻ｔ_ｆでの関節角ｑ_ｆと関節角速度
の４つに与えられる。

しかし、主成分分析基盤の遺伝演算子とは異なって、ここでは未知数ｘ_ｉが４つであるために４つの境界条件を満足する未知数４つを決める過程は簡単な行列演算に過ぎないので、リアルタイムで動作を生成することができる。

一方、二過程は境界での関節角及び関節角速度のみを考慮して動作を生成するので、‘機構学的補間を通じた動作の再結合（Reconstituting motion via kinematic interpolation）’と言う。

本発明の実施例では基本動作に対する主成分分析と共に、逆動力学基盤の最適化を通じた動作の再結合方法と機構学的補間を通じた動作の再結合方法を使用する。

しかし、逆動力学基盤の最適化を通じた動作の再結合方法を使用する場合、ロボットの物理的特性に最適化した動作を生成することができるという長所がある反面、最適化に時間が長くかかるためにロボットがリアルタイムで動作を生成できない短所がある。

これに反し、機構学的補間を通じた動作の再結合方法は簡単な行列演算のみを経るためにリアルタイムで動作を生成することができるが、生成された動作はキャプチャーされた人間動作の数学的、そして機構学的補間に留まるので、ロボットに最適化されたことではない。

図３は従来の方法と本発明の実施例による方法を比較するための図面である。従来の方法１と方法２は人間のモーションキャプチャーデータに直接主成分分析と動作再結合方法を適用する。

これに反し、本発明の実施例による方法３は人間のモーションキャプチャーデータを進化させてロボットの物理的特性を反映させ、この進化した基本動作に基づいてリアルタイムでロボットが必要な動作を得る。

以下、本発明のロボット動作制御方法による実験例及び比較例を記述する。しかし、本発明は以下の実験例または比較例に限定されることではない。

（実験例）
図４Ａは本実験例で使用された人間型ロボット‘マル’の外観を示す図面であり、図４Ｂは腰関節と右腕を含む７自由度のマニピュレータを概略的に示す図面である。

投げられたボールをロボットが腕で取るためには、球の位置を追跡し、ボールを取る位置を予想しなければならない。また、ロボットが予想位置に腕を動かし、指でボールを取ることもしなければならない。しかし、本実験例ではロボットが人間のような自然な動作を生成するようにすることが目的であるので、残り能力は既に与えられていると仮定した。

図５Ａは実験者が自分に投げられたボールを取る前の姿を示す図面であり、図５Ｂ及び５Ｃは実験者が自分の正面及び肩の上側に投げられたボールを取る姿をそれぞれ示す図面である。また、図６Ａ及び６Ｂは実験者がボールを受けた１４０個の地点を表示する正面図及び側面図である。

実験者の頭とボディー近くの多様な地点にボールを投げ、全１４０個のボールを受ける実験者の動作をキャプチャーした。つまり、本実験例では１４０個の基本動作が初期両親世帯を構成した。

動作状態ｃ_ｉは次の式（２９）によって定義された。
ここで、Ｒ_ｉは実験者がボールを受けた瞬間の手の平の回転行列（rotation matrix）であり、ｐ_ｉはその瞬間の手の平の位置ベクター（position vector）である。一方、この行列とベクターは全て実験者の腰に位置した基準座標系から見た時の値である。

各動作状態の間の類似性を示す距離尺度として次の式（３０）が定義された。
ここで、Ｒ_ｉとｐ_ｉは動作状態ｃ_ｉに属し、Ｒ_ｊとｐ_ｊは動作状態ｃ_ｊに属する。また、ｗ_１とｗ_２はスカラー加重値であり、本実験例では１．０と０．５に定めた。

図７Ａと図７Ｂは基本動作に対する主成分分析の例を示す。つまり、図７Ａは任意に選択した１０個の基本動作の関節角軌跡を示す図面であり、図７Ｂは７Ａに図示された基本動作から支配的な主成分４つを抽出してこれを示す図面である。

本実験例では与えられた動作状態に最も近い２０個の基本動作を選択して主成分を抽出し、この主成分を新たな動作を生成するのに使用した。

図８Ａは進化過程でさらに優れた子供個体で代替される両親個体の個数を示すグラフである。また、図８Ｂは各世帯での個体の適合度関数値の平均を示すグラフである。

図８Ａを参照すると、１世代から２世代に進化する時は１４０個の両親個体の中で３８個の個体がさらに優れた子供個体で代替された。一方、代替される両親個体の個数は進化が進められることによって次第に減少したが、これは動作個体の最適化が一定の値で収斂するということを示す。

図８Ｂを参照すると、適合度関数値の平均が１世代では５６０に至り、進化が行われた１０世代では４６０以下に減った。

一方、１世代から１０世代まで進化させるのにかかった時間は２ＧＢのＲＡＭを有するペンティアム（登録商標）４コンピュータでほぼ９時間程度であった（以下、同一なコンピュータで遂行）。

（比較例１）
図９Ａ及び９Ｂはそれぞれ従来方法１及び本発明の実施例による方法３によって生成された動作の様相を示す正面図である。また、図９Ｃ及び９Ｄはそれぞれ従来方法１及び本発明の実施例による方法３によって生成された動作の様相を示す側面図である。また、図１０は従来方法１と本発明の実施例による方法３によって生成された動作の関節角をそれぞれ示す図面である。

２つの動作とも基本的には人間のモーションキャプチャーデータを使用するために外観は人間の動作のように自然である。また、同一な動作条件を持って動作を生成したので、開始時点と終了時点での関節角及び関節角速度がそれぞれ同一である。

しかし、開始時点から終了時点へ行く軌跡は同一な様相を示さないが、その効果は下記表１に示されている。

表１を参照すると、動作生成時間は２つの方法でほぼ同一であり、リアルタイムに近い短時間がかかるだけであった。これは２つの方法が活用する基本動作データが人間動作であるか進化した動作であるかの差にあり、動作を生成するアルゴリズムは同一であるためである。

一方、適合度関数の値は方法３でさらに小さく示されるが、これは方法３によって生成された動作がより少ないトルクが所要される最適化した動作であり、エネルギー効率的であるという意味である。したがって、本発明の実施例による方法３で使用された進化した基本動作データベースが最適の動作生成に寄与したことを確認することができた。

（比較例２）
図１１Ａ及び１１Ｂはそれぞれ従来方法２及び本発明の実施例による方法３によって生成された動作の様相を示す正面図である。また、図１１Ｃ及び１１Ｄはそれぞれ従来方法２及び本発明の実施例による方法３によって生成された動作の様相を示す側面図である。

また、図１２は従来方法２と本発明の実施例による方法３によって生成された動作の関節角をそれぞれ示す図面である。

２つの動作もやはり基本的には人間のモーションキャプチャーデータを使用するために外観では人間の動作のように自然である。また、同一な動作条件を持って動作を生成したので、開始時点と終了時点での関節角及び関節角速度がそれぞれ同一である。

一方、動作の生成時間と適合度関数の値には差があるが、これは次の表２に示されている。

表２を参照すると、従来方法２による場合、動作生成に１１．３２秒がかかり、本発明の実施例による方法３による場合には０．１２７秒しかかからなかったことが判る。

従来方法２による場合、逆動力学基盤の最適化過程を経るために計算に長時間がかかった。これに反し、従来方法２による場合には適合度関数の値は３４８．７で、本発明の実施例による方法３による場合に比べて最適化した様相を示す。つまり、従来方法２によって生成されたロボット動作は最もエネルギー効率的で最適化し、人間の動作と類似しているが、動作生成に長い時間がかかるためにリアルタイム動作生成には不適であった。

これに反し、本発明の実施例による方法３によって生成されたロボット動作は従来方法２によって生成されたことよりは最適化されていないが、迅速に動作を生成するという側面からリアルタイム動作生成に適した。

（比較例３）
動作条件１０個を有して方法１、２及び３全てを使用してそれぞれ動作を生成した。表３は生成されたそれぞれの動作１０個を平均して、その性能を比較した結果を表３に示す。

表３を参照すると、従来方法１と本発明の実施例による方法３による場合、動作生成に非常に短い時間がかかるためにリアルタイム動作生成への適用が可能であった。

一方、従来方法２による場合には適合度関数の値が最も小さいために最適化した動作が作られたが、動作生成に時間が長く所要されてリアルタイム動作生成に適用することは難しかった。

要するに、本発明の実施例による方法３による場合、リアルタイムで動作を生成することができ、多くの時間が所要されて最適化させた動作と最適化側面でほぼ対等な性能を示した。

以上、本発明の実施例について説明したが、本発明の権利範囲はこれに限定されず、特許請求の範囲と発明の詳細な説明及び添付した図面の範囲内で多様に変形して実施することが可能であり、これもまた本発明の範囲に属するのは当然のことである。

本発明の実施例による主成分分析基盤の遺伝演算子を示す図である。本発明の実施例による遺伝演算子と適合度関数を利用して基本動作が進化する過程を概略的に示す図である。従来の方法と本発明の実施例による方法を比較するための図である。本実験例で使用された人間型ロボット‘マル’の外観を示す図である。腰関節と右腕を含む７自由度のマニピュレータを概略的に示す図である。実験者が自分に投げられたボールを取る前の姿を示す図である。実験者が自分の正面側に投げられたボールを取る姿を示す図である。実験者が自分の肩の上側で投げられたボールを取る姿を示す図である。実験者がボールを受けた１４０個の地点を表示する正面図である。実験者がボールを受けた１４０個の地点を表示する側面図である。任意に選択した１０個の基本動作の関節角軌跡を示す図である。図７Ａに示された基本動作から支配的な主成分４つを抽出してこれを示した図である。進化過程でさらに優れた子供個体で代替される両親個体の個数を示すグラフである。各世帯における個体の適合度関数値の平均を示すグラフである。従来方法１によって生成された動作の様相を示す正面図である。本発明の実施例による方法３によって生成された動作の様相を示す正面図である。従来方法１によって生成された動作の様相を示す側面図である。本発明の実施例による方法３によって生成された動作の様相を示す側面図である。従来方法１と本発明の実施例による方法３によって生成された動作の関節角をそれぞれ示す図面である。従来方法２によって生成された動作の様相を示す正面図である。本発明の実施例による方法３によって生成された動作の様相を示す正面図である。従来方法２によって生成された動作の様相を示す側面図である。本発明の実施例による方法３によって生成された動作の様相を示す側面図である。従来方法２と本発明の実施例による方法３によって生成された動作の関節角をそれぞれ示す図面である。

Claims

ロボットの動作制御方法において、
（ａ）人間の動作パターンを収集してデータベースを構築する段階;
（ｂ）主成分分析及び逆動力学に基づいた補間法を利用した遺伝演算子を利用して前記データベースを進化させる段階;及び
（ｃ）前記進化したデータベースを利用してリアルタイムでロボットの動作を生成する段階を含むことを特徴とするロボットの動作制御方法。
前記（ａ）段階は人間の動作をモーションキャプチャーする段階を含むことを特徴とする、請求項１に記載のロボットの動作制御方法。
前記（ｂ）段階は、
（ｂ−１）ロボットが行う任意の動作と類似の動作状態を有する基本動作を前記データベースから１つ以上選択する段階;及び
（ｂ−２）主成分分析による主成分抽出及び前記主成分の結合を通じて最適動作を新たに生成することによって、前記選択された基本動作を再加工する段階を含むことを特徴とする、請求項１に記載のロボットの動作制御方法。
前記（ｂ）段階は、
前記（ｂ−１）段階と前記（ｂ−２）段階を繰り返して行って前記データベースを進化させる段階を含むことを特徴とする、請求項３に記載のロボットの動作制御方法。
前記（ｂ−１）段階で、
前記任意の動作は、
を前記任意の動作の関節角軌跡、
を前記選択された基本動作の平均関節角軌跡、
を前記選択した基本動作の関節角軌跡の中でｉ番目主成分軌跡、
をスカラー係数とすると、
という式（１）で示されることを特徴とする、請求項３に記載のロボットの動作制御方法。
前記任意の動作の動作状態は、
を開始時間
における関節角、
を開始時間
における関節角速度、
を終了時間
における関節角、
を終了時間
における関節角速度とすると、
という式（２）に示す境界条件を満足することを特徴とする請求項５に記載のロボットの動作制御方法。
前記（ｂ−２）段階で、
前記選択された基本動作が１つ以上の関節角軌跡を含む時、前記関節角軌跡の平均軌跡
を、ｋを選択した基本動作の数とし、
をｉ番目基本動作の関節角軌跡とすると、
次の式（３）によって計算し、
さらに、次の式（４）を通じて共分散行列（Ｓ）を計算し、
この共分散行列から固有ベクターを得て、前記固有ベクターの中で前記関節角軌跡の主成分軌跡を得ることを特徴とする、請求項３に記載のロボットの動作制御方法。
前記（ｂ−２）段階で、
を前記選択された基本動作の関節角、
を前記選択された基本動作の関節角速度、
を前記選択された基本動作の関節角加速度、
を質量マトリックス、
をコリオリベクターとし、
が重力及びその他の力を含むとき、次の式（５）を通じて前記選択された基本動作の関節トルク
を決め、
前記決められた関節トルクが、次の式（６）を最小にすると、
前記選択された基本動作を前記最適動作に決めることを特徴とする、請求項３に記載のロボットの動作制御方法。
前記（ｃ）段階は、
主成分分析及び機構学的補間を通じた動作の再結合方法を利用することを特徴とする請求項１に記載のロボットの動作制御方法。
前記（ｃ）段階は、
（ｃ−１）ロボットが生成する動作と類似の動作状態を有する基本動作を前記進化したデータベースから１つ以上選択する段階;及び
（ｃ−２）主成分分析による主成分抽出及び前記主成分の結合を通じて最適動作を新たに生成することによって、前記選択された基本動作を再加工する段階を含むことを特徴とする、請求項９に記載のロボットの動作制御方法。
前記（ｃ−１）段階で、
前記ロボットが生成する動作は、
を前記ロボットが生成する動作の関節角軌跡、
を前記選択された基本動作の平均関節角軌跡、
を前記選択された基本動作の関節角軌跡の中でｉ番目主成分軌跡、
をスカラー係数とすると、
という式（７）で示すことができることを特徴とする、請求項１０に記載のロボットの動作制御方法。
前記ロボットが生成する動作の動作状態は、
を開始時間
における関節角、
を開始時間
における関節角速度、
を終了時間
における関節角、
を終了時間
における関節角速度とすると、
という式（８）で示す境界条件を満足することを特徴とする、請求項１１に記載のロボットの動作制御方法。
前記（ｃ−２）段階で、
前記選択された基本動作が１つ以上の関節角軌跡を含む時、前記関節角軌跡の平均軌跡
は、ｋを選択した基本動作の数とし、
をｉ番目基本動作の関節角軌跡とするときに、
次の式（９）によって計算され、
さらに、次の式（１０）を通じて共分散行列（Ｓ）を計算し、
前記共分散行列から固有ベクターを得て、前記固有ベクターの中で前記関節角軌跡の主成分軌跡を得ることを特徴とする、請求項１０に記載のロボットの動作制御方法。