JP2009066693A - 運動データの生成装置、方法、及びロボット装置 - Google Patents
運動データの生成装置、方法、及びロボット装置 Download PDFInfo
- Publication number
- JP2009066693A JP2009066693A JP2007236629A JP2007236629A JP2009066693A JP 2009066693 A JP2009066693 A JP 2009066693A JP 2007236629 A JP2007236629 A JP 2007236629A JP 2007236629 A JP2007236629 A JP 2007236629A JP 2009066693 A JP2009066693 A JP 2009066693A
- Authority
- JP
- Japan
- Prior art keywords
- symbol
- primitive
- state transition
- probability
- transition probability
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Manipulator (AREA)
Abstract
【課題】所定の動作パターンから様々な動作パターンを生成することができる動作パターン生成装置、動作パターン生成方法及びプログラム並びにロボット装置を提供すること。
【解決手段】原始シンボルがその隔たり量に基づいて投影されることで原始シンボル間の類似情報を保持する原始シンボル空間における2以上の原始シンボルから新たな原始シンボルを生成するシンボル生成部12と、新たな原始シンボルの状態遷移確率及び出力確率から出力時系列パターンを生成するパターン生成部13とを有する。原始シンボルは、隠れマルコフモデルを使用して状態遷移確率及び出力確率が算出された所定の動作に対応するものであり、シンボル生成部12は、2以上の原始シンボルの状態遷移確率を速度に関する情報に変換して新たな原始シンボルの状態遷移確率を算出する。
【選択図】図1
【解決手段】原始シンボルがその隔たり量に基づいて投影されることで原始シンボル間の類似情報を保持する原始シンボル空間における2以上の原始シンボルから新たな原始シンボルを生成するシンボル生成部12と、新たな原始シンボルの状態遷移確率及び出力確率から出力時系列パターンを生成するパターン生成部13とを有する。原始シンボルは、隠れマルコフモデルを使用して状態遷移確率及び出力確率が算出された所定の動作に対応するものであり、シンボル生成部12は、2以上の原始シンボルの状態遷移確率を速度に関する情報に変換して新たな原始シンボルの状態遷移確率を算出する。
【選択図】図1
Description
本発明は、隠れマルコフモデルによる運動(行動)データの生成装置、方法、及びプログラム、並びにロボット装置に関し、特にヒューマノイドロボットやコンピュータ・グラフィックスキャラクターの運動データの生成装置、方法、及びプログラム、並びにロボット装置に関する。なお、ここでは、「運動」なる用語は、適宜「行動」に読み替えることができるものと定義する。
ロボットの運動制御や実環境認識などには、時系列データの記憶と再現が必要不可欠である。この際、瞬間のデータであるキーフレーム表現を用いて記憶すると、ロボットの運動制御や環境の特徴的な要素の把握などに有効である。
このような技術として、特許文献1には、隠れマルコフモデル(HMM)によって抽象化された対象の運動の時系列データを再現することができる、隠れマルコフモデルによる運動データの認識・生成方法、それを用いた運動制御方法及びその制御システムが開示されている。
特許文献1では、HMMによる運動データの認識・生成方法において、状態遷移列候補の計算過程と、出力ベクトル列の計算過程と、最終的な出力ベクトル列の計算過程と、隠れマルコフモデルの空間への配置過程とを有し、運動認識と運動生成を隠れマルコフモデルのみによって統合するものである。
特開2004−330361号公報
しかしながら、特許文献1に記載の方法では、内挿された動作パターンにおけるヒューマノイドの各関節角度(姿勢)が、内挿に用いられた動作の各関節角度に比べて小さい値となることが問題として残されていた。たとえば、腕を思いきり上に上げて万歳をするような動作と手の動きが無い動作を合成に用いた場合、手は上まで上がらず、前方に手を伸ばすような姿勢までしか手が上がらない、という合成結果が得られていた。
本発明は、このような問題点を解決するためになされたものであり、原始シンボル空間に投影された2以上の原始シンボルを自由に合成し、新規動作の生成を可能にする動作データ生成装置、動作データ生成方法及びプログラムを提供することを目的とする。
本発明にかかる動作データの生成装置は、原始シンボルがその隔たり量に基づいて投影されることで原始シンボル間の類似情報を保持する原始シンボル空間における2以上の原始シンボルから新たな原始シンボルを生成するシンボル生成部と、前記新たな原始シンボルの状態遷移確率及び出力確率から出力時系列パターンを生成するパターン生成部とを有し、前記原始シンボルは、隠れマルコフモデルを使用して状態遷移確率及び出力確率が算出された所定の動作に対応するものであり、前記シンボル生成部は、2以上の前記原始シンボルの状態遷移確率を速度に関する情報に変換して前記新たな原始シンボルの状態遷移確率を算出する。
本発明においては、隠れマルコフモデルを使用して抽象化した動作パターン間の関連性を表現する原始シンボル空間に投影された原始シンボルの状態遷移確率を、速度に関する情報に変換して合成することにより、例えば動作が大きくなる方向などにも自由に合成することができる。
また、前記シンボル生成部は、前記状態遷移確率を、各ノードにおける滞在時間の期待値である期待滞在時間で表現し、当該期待滞在時間を合成することで新たな原始シンボルの状態遷移確率を算出することができる。期待滞在時間を導入することで、2つ又は2以上の原始シンボルをどのような比率であっても合成することができる。
さらに、前記期待滞在時間は、Left-to-Rightモデルにおける速度の逆数とすることができる。さらにまた、前記シンボル生成部は、前記期待滞在時間siを、自身のノードiに遷移する確率をaiiとしたとき、si=1/(1−aii)で表すことができる。
また、前記シンボル生成部は、原始シンボルを表す隠れマルコフモデルの示す出力確率を示すガウス分布の平均及び分散を合成することで新たな原始シンボルの出力確率を求めることができる。動作の合成として適切である合成対象は姿勢であり、その姿勢の表現に最も重要な要素がガウス分布の平均ベクトルであるため、平均及び分散を合成対象とすることができる。
さらに、連続分布型隠れマルコフモデルを使用することができる。ここで、混合数Nのガウス分布を混合数1のガウス分布に近似するか、又は混合数1の混合ガウス分布型隠れマルコフモデルを使用することが好ましい。ガウス分布が1つ又は1つに近似することができるモデルは合成に適している。
さらにまた、前記シンボル生成部は、第1及び第2の原始シンボルにおける分散、平均をそれぞれσi (1)、σi (2)、μi (1)、μi (2)、新たな原始シンボルは、第1の原始シンボルと第2の原始シンボルをc1、c2の合成比率で合成した点としたとき、当該新たな原始シンボルにおける分散σ^i、平均μ^iを、
σ^i=c1σi (1)+c2σi (2)
μ^i=c1μi (1)+c2μi (2)
とすることができる。平均及び分散を合成比率c1、c2で混合することができる。
σ^i=c1σi (1)+c2σi (2)
μ^i=c1μi (1)+c2μi (2)
とすることができる。平均及び分散を合成比率c1、c2で混合することができる。
本発明によれば、所定の動作パターンから様々な動作パターンを生成することができる動作パターン生成装置、動作パターン生成方法及びプログラム並びにロボット装置を提供することができる。
以下、本発明を適用した具体的な実施の形態について、図面を参照しながら詳細に説明する。この実施の形態は、本発明を、HMM間内のみではなく、自由に割合で合成することを可能にすることで、より表現能力の高い原始シンボル空間を構成し、従来実現できないような新規動作の生成を可能にする動作データ生成装置に適用したものである。
1.動作データ生成装置
図1は、本実施の形態にかかる動作データ生成装置を示す図である。動作データ生成装置1は、データ読出部11、原始シンボル合成部12、行動パターン生成部13及び行動データベース14を有する。原始シンボル合成部は、期待滞在時間合成部121、状態遷移確率算出部122、及び分散・平均合成部123を有する。
図1は、本実施の形態にかかる動作データ生成装置を示す図である。動作データ生成装置1は、データ読出部11、原始シンボル合成部12、行動パターン生成部13及び行動データベース14を有する。原始シンボル合成部は、期待滞在時間合成部121、状態遷移確率算出部122、及び分散・平均合成部123を有する。
行動データベース14には、原始シンボル空間中に配置された複数の動作に対応する原始シンボルの情報を有する。本実施の形態においては、原始シンボル空間に配置した所定の動作を示す原始シンボルを動作合成の対象とする。原始シンボル空間とは、隠れマルコフモデル(以下HMMという。)を用いて抽象化した動作パターン間の関連性を表現するための空間をいい、各動作パターンに対応するHMMパラメータ間の距離をカルバックライブラー情報量(Kullback-Leibler divergence)を用いて計量し、多次元尺度法で空間を構成するものである。また、原始シンボルとは、ある動作をHMMで抽象化した際の、HMMのパラメータθ={a,b,π,Q}(a:状態遷移確率(状態推移確率)、b:出力確率、π:初期分布確率、Q:状態の有限集合)のうち、状態遷移確率a、出力確率bの2つのパラメータのセットλ={a,b}をいう。なお、原始シンボルは、HMMのパラメータのうちπ、Qが同一ものを想定している。
本実施の形態においては、このような空間表現を用いることにより、未知の動作パターンであっても、ある空間内の静止点に射影することが可能となり、既存の原始シンボルに対応する静止点間の内分点であるという解釈に基づいて、既存の動作パターンの合成として認識される。これにより、動作パターン間の合成をHMMパラメータの内挿処理で近似することが可能となっている(特許文献1)。なお、原始シンボル空間の構成方法の詳細は後述する。
図2は、原始シンボル空間及びこの原始シンボル空間に投影された原始シンボルの一例を示す図である。この原始シンボル空間の構成には、モーションキャプチャシステムを用いて測定した、歩く(walk)、ストレッチ(stretch)、キック(kick)、スクワット(squat)、投げる(throw)、しゃがむ(stoop)の6種類に行動に対する原始シンボルを用いる。原始シンボル空間構成には、10次元の空間に対して多次元尺度法を用いて行なったが、4乃至10次元目の成分はほとんど用いられることがなく、3次元目までの成分で十分表現が可能である。
次に、本実施の形態にかかる動作データ生成装置についてその動作生成方法と共に詳細に説明する。図3は、本実施の形態にかかる動作生成方法を示すフローチャートである。データ読出部11は、この原始シンボル空間に射影された原始シンボルのラベル及びその合成割合が入力され、当該原始ラベルに対応する原始シンボルλ{aij,bi}を読み出す(ステップS1)。例えば、キックとスクワットを合成するなどの入力があった場合、データ読出部11は、キック及びスクワットに対応する原始シンボルλを読み出す。
2.原始シンボル合成部
原始シンボル合成部12は、合成する動作の種類とその合成割合を受け取り、2以上の動作から一の動作を生成する。この場合、原始シンボル合成部12は、原始シンボルの状態遷移確率を速度に関する情報に変換して新たな原始シンボルの状態遷移確率を算出する。具体的には、状態遷移確率を、各ノードにおける滞在時間の期待値である期待滞在時間で表現し、当該期待滞在時間を合成することで新たな原始シンボルの状態遷移確率を算出する。この期待滞在時間は、Left-to-Rightモデルにおける速度の逆数であり、期待滞在時間を、自身のノードiに遷移する確率をaiiとしたとき、si=1/(1−aii)で表すことができる。ここでは、従来の原始シンボル合成と比較しつつ本実施の形態にかかる動作合成について説明する。
原始シンボル合成部12は、合成する動作の種類とその合成割合を受け取り、2以上の動作から一の動作を生成する。この場合、原始シンボル合成部12は、原始シンボルの状態遷移確率を速度に関する情報に変換して新たな原始シンボルの状態遷移確率を算出する。具体的には、状態遷移確率を、各ノードにおける滞在時間の期待値である期待滞在時間で表現し、当該期待滞在時間を合成することで新たな原始シンボルの状態遷移確率を算出する。この期待滞在時間は、Left-to-Rightモデルにおける速度の逆数であり、期待滞在時間を、自身のノードiに遷移する確率をaiiとしたとき、si=1/(1−aii)で表すことができる。ここでは、従来の原始シンボル合成と比較しつつ本実施の形態にかかる動作合成について説明する。
2−1.従来の問題点
従来においては、パラメータλの状態遷移確率及び出力確率を合成(内挿)の対象としていた。この場合、合成された動作パターンにおけるヒューマノイドの各関節角度(姿勢)が、合成に用いられた動作の各関節角度に比べて小さい値となることが問題として残されていた。たとえば、腕を思いきり上に上げて万歳をするような動作と手の動きが無い動作を合成に用いた場合、手は上まで上がらず、前方に手を伸ばすような姿勢までしか手が上がらない、という合成結果が得られていた。
従来においては、パラメータλの状態遷移確率及び出力確率を合成(内挿)の対象としていた。この場合、合成された動作パターンにおけるヒューマノイドの各関節角度(姿勢)が、合成に用いられた動作の各関節角度に比べて小さい値となることが問題として残されていた。たとえば、腕を思いきり上に上げて万歳をするような動作と手の動きが無い動作を合成に用いた場合、手は上まで上がらず、前方に手を伸ばすような姿勢までしか手が上がらない、という合成結果が得られていた。
さらに、HMMの状態遷移確率値も合成の対象となっていたため、ある動作とある動作との外分点にあたる位置の動作を生成しようとすると、確率値が0〜1の範囲を超えてしまい、当該動作を定義できない状態にあった。しかしながらこのような合成方法では、考えられる全ての動作パターンを既知パターンとして登録する必要があるなどの問題が生じる状況であった。
そこで、本発明においては、原始シンボル間内での合成のみではなく、原始シンボル間外の合成を可能にすることで、より表現能力の高い原始シンボル空間を構成し、原始シンボル間内のみでは実現できないような新規動作の生成を可能にする手法を提案する。従来のHMMの合成手法においても現在と同様、図4に示すようなLeft-to-Right型の連続分布型HMM(CHMM)が採用していた。各離散時刻tの関節角度ベクトルθ[t]をHMMの出力ベクトルo[t]であると定義し、ノードiからjへの状態遷移確率aijと、混合ガウス分布からの出力確率bの二つのパラメータを用いてHMMの合成を行っていた。具体的には、原始シンボルλ1={aij (1),bi (1)}、λ2={aij (2),bi (1)}で抽象化されている行動の状態点を(1−α):αの比で内分する状態点に対応する原始シンボルλ^={a^ij、b^i}を次のように定義していた。
ここで、cimは各ガウス分布の混合係数、Mはガウス分布の混合数、μim、σimはノードiにおけるm番目のガウス分布の平均ベクトルおよび分散ベクトルを示す。しかしながら、式(1)では単純に状態遷移確率同士を合成の対象としているため、既知の原始シンボル間を結ぶ線分上以外の動作を求めることができなかった。原始シンボル間を結ぶ線分外の動作を求めようとすると確率がマイナスの値になることもあり、数理的に意味を失う。さらに、合成の結果生成される動作パターンの関節角度の値が小さくなる問題については、式(2)において、混合係数をある比率で線形和をとることで合成を実現していたためである。従来の合成処理は、原始シンボル空間上の内分点を求めるために導入されたものであるため、合成の結果生成される関節角度は必ず元の動作より小さい値となり、姿勢を合成するには不完全であった。動作パターンとして関節角度列が用いられているのであれば、その姿勢が混合されるような合成結果であることが望ましい。そこで、本実施の形態においては、合成の対象となるパラメータを変更し、これらの問題点を解決する。
2−2.合成アルゴリズム
2つの原始シンボルから新たな原始シンボルを生成する場合について説明する。まず、状態遷移確率の扱いについて考える。従来までは遷移確率を直接合成していたが、本実施の形態においては、以下で定義する期待滞在時間という特徴量に変換してから合成を行う。ノードiにおける滞在時間の期待値siは、自分自身のノードに遷移する確率aiiを使って次のように計算できる(ステップS2)。
2つの原始シンボルから新たな原始シンボルを生成する場合について説明する。まず、状態遷移確率の扱いについて考える。従来までは遷移確率を直接合成していたが、本実施の形態においては、以下で定義する期待滞在時間という特徴量に変換してから合成を行う。ノードiにおける滞在時間の期待値siは、自分自身のノードに遷移する確率aiiを使って次のように計算できる(ステップS2)。
この期待滞在時間siを合成の対象とする。ただし、前提条件として、合成のためのHMMのノード数は一致しているものとする。
2つの原始シンボルλ(1)={a(1)、b(1)}及びλ(2)={a(2)、b(2)}を合成する場合を考える。本実施の形態においては、2つの原始シンボルλ(1)(A点)、λ(2)(B点)について、原点からA点に向かう基底ベクトル、B点に向かう基底ベクトルとして扱う。原始シンボルA点と原始シンボルB点の合成は、これらのベクトルの合成として求めることができる。これは、原始シンボルA点、B点、原点を含む平面上の点であれば、いずれの位置であっても合成できることを示す。したがって、従来はA点とB点とで結ばれる線分内のみの合成しかできなかったのに対し、A点とB点で結ばれる線分以外の広い領域にわたって、原始シンボルの合成が可能となる。
状態遷移確率算出部122は、2つの原始シンボルλ(1)(A点)、λ(2)(B点)の合成係数を負の値も取りうるc1、c2としたとき、HMMのノードiでの期待滞在時間^siを、次式によって求める(ステップS3)。
次に、状態遷移確率算出部122は、期待滞在時間s^iから遷移確率を求める(ステップS4)。合成後のHMMのノードiにおける状態遷移確率a^iiは、次のようになる。
次に、出力確率の合成について説明する。従来手法では、混合係数が合成の対象となっていたが、本実施の形態においては、ガウス分布の平均ベクトル及び分散ベクトルを合成の対象とする。その理由は、動作の合成として適切である合成対象は姿勢であり、その姿勢の表現に最も重要な要素がガウス分布の平均ベクトルであると考えたからである。
ここで、従来まで用いてきたHMMでは混合ガウス分布モデルを採用していたが、この場合、平均・分散ベクトルが複数存在することになり、合成対象となるガウス分布を特定することが単純にはできない。そのため、1個のみのガウス分布で出力確率を表現するものとし、分散・平均合成部123は下記の演算を実行し、合成後のガウス分布を求める(ステップS5)。なお、本実施の形態においては、混合数1の混合ガウス分布型隠れマルコフモデルを使用するものとして説明するが、混合数Nのガウス分布を混合数1のガウス分布に近似して使用するようにしてもよい。
2−3.合成の一般化
以上のように、原始シンボル合成部12は、2点の原始シンボルを合成して新たな原始シンボルを生成するが、2点間の合成のみならず、3点以上の複数のHMMの合成も同等の定義で容易に拡張可能である。すなわち、m個の原始シンボル(λ1、・・・、λm)を、負の値も取り得る混合係数c1、・・・、cmで混合する時、合成後のHMMのノードiにおける状態遷移確率a^iiは、下記式(9)のように定義される。
以上のように、原始シンボル合成部12は、2点の原始シンボルを合成して新たな原始シンボルを生成するが、2点間の合成のみならず、3点以上の複数のHMMの合成も同等の定義で容易に拡張可能である。すなわち、m個の原始シンボル(λ1、・・・、λm)を、負の値も取り得る混合係数c1、・・・、cmで混合する時、合成後のHMMのノードiにおける状態遷移確率a^iiは、下記式(9)のように定義される。
出力確率b^の平均μ^iと分散σ^iは、下記式(11)、(12)と定義される。
行動パターン生成部13は、原始シンボル合成部12により合成された原始シンボルλから出力動作パターンを生成する(ステップS6)。動作パターン生成はHMMの持つ遷移確率、出力確率に従って時系列データを生成することによって行う。図5は、出力時系列データ生成方法を示すフローチャートである。このデータ生成法は確率的なゆらぎのために、試行ごとに運動の周期が異なり、関節角度にもノイズが大きく含まれる。そこで次のような方法により複数回の生成試行の平均を取ることでこの問題を解消させる。
ステップS11:遷移確率に従って状態遷移試行を1回行い、状態遷移系列Qを得る。
ステップS12:ステップS1をn回繰り返し、Q1,・・・,Qkを得る。それらの平均を取って状態遷移系列の平均Q^を得る。
ステップS13:Q^に従って各状態ノードから出力ベクトルを出力させ、出力時系列パターンOを得る。
ステップS14:ステップS11〜ステップS13をk回繰り返し、O1,・・・,Okを得る。それらの平均を取って最終的な出力時系列パターンO^を得る。
ステップS11:遷移確率に従って状態遷移試行を1回行い、状態遷移系列Qを得る。
ステップS12:ステップS1をn回繰り返し、Q1,・・・,Qkを得る。それらの平均を取って状態遷移系列の平均Q^を得る。
ステップS13:Q^に従って各状態ノードから出力ベクトルを出力させ、出力時系列パターンOを得る。
ステップS14:ステップS11〜ステップS13をk回繰り返し、O1,・・・,Okを得る。それらの平均を取って最終的な出力時系列パターンO^を得る。
なお、このm、kの値は実験的に求めることができ、例えばn=100、k=50などとすることができる。図6は、この方法で原始シンボルλから運動パターンを生成した様子を示すグラフ図である。グラフは全身の関節角のうち1次元分のデータを示している。グラフから分かるように、一回の生成試行(破線L1)、出力時系列のみに対する平均化(二点鎖線L2)では正しい時系列データが生成されないが、状態遷移系列と出力時系列パターンに対して平均化を行う(一点鎖線L3)ことで元のデータ(実線L0)とほぼ同等のデータを再現していることが分かる。以上の方法を用い、行動パターン生成部13は、空間上の点からλ^を求め、得られたλ^から運動パターンを生成する。これにより原始シンボル空間での幾何学的な原始シンボルの操作による運動パターンの操作が可能となる。
3.実施例
次に、本発明の実施例について説明する。実施例のために用いる動作パターンは、肩3自由度、肘1自由度、股関節3自由度、膝1 自由度、足首2自由度の合計20自由度からなるヒューマノイドロボットの関節角度列である。モーションキャプチャシステムを用いて、33[ms]周期のサンプリングタイムで約3秒間、人間が実演した動作パターンを用いた。図7、図8に示すようなパンチ動作とスクワット動作を、合成対象の動作パターンとして使用する。
次に、本発明の実施例について説明する。実施例のために用いる動作パターンは、肩3自由度、肘1自由度、股関節3自由度、膝1 自由度、足首2自由度の合計20自由度からなるヒューマノイドロボットの関節角度列である。モーションキャプチャシステムを用いて、33[ms]周期のサンプリングタイムで約3秒間、人間が実演した動作パターンを用いた。図7、図8に示すようなパンチ動作とスクワット動作を、合成対象の動作パターンとして使用する。
3−1.実施例1
先ず、パンチとスクワットに対応する点を1:1に内分するような中点における動作を生成するために、c1=0.5、c2=α=0.5として、式(5)〜(8)を適用した。その結果得られた動作を、図9に示す。
先ず、パンチとスクワットに対応する点を1:1に内分するような中点における動作を生成するために、c1=0.5、c2=α=0.5として、式(5)〜(8)を適用した。その結果得られた動作を、図9に示す。
3−2.実施例2
さらに、c1=1.0、c2=1.0として合成した動作を図10に示す。この姿勢列をみると分かるように、実施例1にて生成した動作にくらべ、本実施例の動作の方が、膝を深く曲げる角度が深く、手をより前に突き出している。これは従来までの合成では実現不可能だった特徴である。
さらに、c1=1.0、c2=1.0として合成した動作を図10に示す。この姿勢列をみると分かるように、実施例1にて生成した動作にくらべ、本実施例の動作の方が、膝を深く曲げる角度が深く、手をより前に突き出している。これは従来までの合成では実現不可能だった特徴である。
3−3.実施例3
スクワットを−1倍、パンチを1.5倍した動作を生成するために、c1=−1、c2=1.5として、式(5)〜(8)を適用した。その結果得られた動作を、図11に示す。
スクワットを−1倍、パンチを1.5倍した動作を生成するために、c1=−1、c2=1.5として、式(5)〜(8)を適用した。その結果得られた動作を、図11に示す。
ここで、c1=−1、c2=1.5の合成とは、スクワットとパンチの間を外挿することに相当する。この場合、右の股関節ピッチ軸に着目すると、通常のパンチ動作では股関節ピッチ軸は特に変化していないが、本実施例における姿勢列では、反り返るようにピッチ軸が動作している。これはスクワット動作において使用されるピッチ軸の動きと逆方向の姿勢であり、外挿の結果であると解釈できる。同じような効果は左膝関節にも見られる。外挿された姿勢列では、左膝関節は特に曲がっておらず、まっすぐ伸びた姿勢である。元のパンチ動作では、ある程度膝を曲げており、スクワット動作において膝がより曲がっている姿勢をとっている。この実験ではスクワットからパンチに向けて外挿するに等しい合成を行ったので、このような膝関節が伸びるような姿勢列が生じたと言える。
上記の合成実験をより定量的に示すため、実験から得られた右足股関節のピッチ軸および、左足膝関節の関節角度時系列を図12、図13にそれぞれ示す。
本実施の形態においては、HMMの状態遷移確率をLeft-to-Rightモデルにおける速度の逆数を示す期待滞在時間に置き換えることで、状態遷移確率の合成を可能とする。同様に、HMMの出力ベクトルをヒューマノイドの姿勢ベクトルに対応させている。そのため、出力確率モデルに用いられているガウス分布の平均ベクトルを合成することで姿勢の合成を実現することができる。
4.原始シンボル空間
次に、行動データベースに記憶される原始シンボル空間の構成方法について説明する(特許文献1参照)。シンボル同士の関係性からパターン同士の関係性を記述し、運動パターンの情報処理に新しい枠組みを形成する。具体的には、原始シンボル同士の関係性を幾何学的に記述できる空間を構成する。運動パターンを抽象化した原始シンボルを、その関係性に基づいて空間内に配置し、その空間における幾何学的な操作を利用することで、運動パターンの情報処理を行う。本実施の形態においてはその基礎実験として、未知の行動を既知の行動の組み合わせとして認識し、既知の行動を組み合わせることで新しい行動を生成することを目指す。
次に、行動データベースに記憶される原始シンボル空間の構成方法について説明する(特許文献1参照)。シンボル同士の関係性からパターン同士の関係性を記述し、運動パターンの情報処理に新しい枠組みを形成する。具体的には、原始シンボル同士の関係性を幾何学的に記述できる空間を構成する。運動パターンを抽象化した原始シンボルを、その関係性に基づいて空間内に配置し、その空間における幾何学的な操作を利用することで、運動パターンの情報処理を行う。本実施の形態においてはその基礎実験として、未知の行動を既知の行動の組み合わせとして認識し、既知の行動を組み合わせることで新しい行動を生成することを目指す。
4−1.隠れマルコフモデル間の隔たり量の定義
空間を構成するためには距離情報が必要となる。本実施の形態においては、原始シンボル間の隔たりをHMM間の隔たりとして取り扱う。すなわち、原始シンボル{a,b}に対応するHMMのパラメータθ間の距離を計算することで、原始シンボルλの距離とする。HMMは確率モデルであるためカルバックライブラー情報量を用いてHMM間の隔たりを表す量を定義する。カルバックライブラー情報量は確率分布関数間の隔たりを定量的に表すものである。2つの確率密度関数p1、p2間のカルバックライブラー情報量D(p1、p2)は式(17)で定義される。
空間を構成するためには距離情報が必要となる。本実施の形態においては、原始シンボル間の隔たりをHMM間の隔たりとして取り扱う。すなわち、原始シンボル{a,b}に対応するHMMのパラメータθ間の距離を計算することで、原始シンボルλの距離とする。HMMは確率モデルであるためカルバックライブラー情報量を用いてHMM間の隔たりを表す量を定義する。カルバックライブラー情報量は確率分布関数間の隔たりを定量的に表すものである。2つの確率密度関数p1、p2間のカルバックライブラー情報量D(p1、p2)は式(17)で定義される。
これをHMMに適用する場合は、対象となる2つのHMMのパラメータをθ1、θ2として次の式で表現できる。
ここで、y1 Tiはλ1の学習用に用いた長さTiの時系列データ、nは観測された時系列データの数である。この式は一般にD(θ1,θ2)≠D(θ2,θ1)とθ1,θ2に対して非対称であり、HMM間同士の距離的な量として用いるには不適切である。そこで式(18)を対称形にした次式を原始シンボル間の隔たりを表す量として用いることにする。
4−2.原始シンボル空間の構成
原始シンボルを隔たり量に基づいて空間に射影し、原始シンボル間の類似情報を保持する原始シンボル空間を構成する。距離的な情報をもとに空間への配置を行うには多次元尺度法を用いる。多次元尺度法とは対称間の距離に関するデータが与えられた時にその対象の空間上での位置関係を再現する手法である。対象i、j間の隔たり量に関する値fijをデータとして与え、fijに基づいてn個の対象を空間に射影することを考える。射影された対象iの空間での位置ベクトルをxiと表し、対象間の射影された空間上での距離をdijとする。ただし、dij=|xi−xj|2である。このとき、多次元尺度法は次式のようにfijとdijの誤差Sをxに関して最小化する問題に帰着する。
原始シンボルを隔たり量に基づいて空間に射影し、原始シンボル間の類似情報を保持する原始シンボル空間を構成する。距離的な情報をもとに空間への配置を行うには多次元尺度法を用いる。多次元尺度法とは対称間の距離に関するデータが与えられた時にその対象の空間上での位置関係を再現する手法である。対象i、j間の隔たり量に関する値fijをデータとして与え、fijに基づいてn個の対象を空間に射影することを考える。射影された対象iの空間での位置ベクトルをxiと表し、対象間の射影された空間上での距離をdijとする。ただし、dij=|xi−xj|2である。このとき、多次元尺度法は次式のようにfijとdijの誤差Sをxに関して最小化する問題に帰着する。
式(21)はxの多項式で表現できないため、最小二乗法が簡単に適用はできない。そこで
を考える。式(20)は展開するとxの多項式で表現できるため、xに関しての最小化が簡単である。またTはfij≒dijのときには、
となり、Sにほぼ一致する。そこでTをSの代わりに使用し、xに関して最小化することで対象を空間に射影する。本実施の形態においては、上述したように、HMMのパラメータθの距離の隔たりを原始シンボルλの距離の隔たりとし、fijとしてD(θ1,θ2)=Ds(λ1,λ2)を採用する。
4−3.原始シンボル空間における行動認識・生成
n個の既知の原始シンボルを射影した原始シンボル空間を用いて、未知の運動パターンを認識する手法を考える。観測された未知の運動パターンに対応するHMMのパラメータθを求める。そして、そのパラメータθに対応する原始シンボルをλ^とするとき、このλ^と既知の原始シンボルλ1,λ2,・・・,λnとの間のカルバックライブラー情報量を求めることにより、原始シンボル空間上でのλ^の状態点を決定することができる。原始シンボル空間上でのλ^の位置ベクトルをx^、既知の原始シンボルλiの位置ベクトルをxiとし、カルバックライブラー情報量D(λ^,λi)と、原始シンボル空間上でのx^とxi間の距離d(x^,xi)との誤差が最小になるように、x^を最小二乗法で求める。
n個の既知の原始シンボルを射影した原始シンボル空間を用いて、未知の運動パターンを認識する手法を考える。観測された未知の運動パターンに対応するHMMのパラメータθを求める。そして、そのパラメータθに対応する原始シンボルをλ^とするとき、このλ^と既知の原始シンボルλ1,λ2,・・・,λnとの間のカルバックライブラー情報量を求めることにより、原始シンボル空間上でのλ^の状態点を決定することができる。原始シンボル空間上でのλ^の位置ベクトルをx^、既知の原始シンボルλiの位置ベクトルをxiとし、カルバックライブラー情報量D(λ^,λi)と、原始シンボル空間上でのx^とxi間の距離d(x^,xi)との誤差が最小になるように、x^を最小二乗法で求める。
実際には未知の運動パターンが観測される毎にHMMを学習することは、学習サンプルを用意しなくてはならないこと、計算に時間がかかることなどから現実的ではない。そこでHMMを学習したと仮定してカルバックライブラー情報量を求める。非対称形を求めることは困難であるので、下記式(23)を求める。
ここで、式(20)は計算することができるので、式(21)求めれば、カルバックライブラー情報量を近似によって求めることができる。ダンス(dance)、キック(kick)、スクワット(squat)、スウィング(swing)、ウォーク(walk)という行動における式(20)、式(21)の値を表1に示す。
式(21)の値が−1000オーダなのに対し、式(20)の値は10のオーダである。したがって、式(21)の値も10のオーダであるとして計算をしても誤差が少ないという仮定を導入する。これらの仮定を用いてHMMを学習することなくD(λ^,λi)を近似によって求め、未知の行動に対する状態点を決定する。
このような原始シンボル空間上での幾何学的操作によって、観測した運動パターンの認識結果を原始シンボル空間上での状態点として表現することが可能となり、未知の運動パターンを既知の原始シンボルの組合せとして認識することができるようになる。
5.動作データ生成装置のハードウェア
次に、本実施の形態にかかる動作データ生成装置の一例について説明する。図14は、動作データ生成装置の一例を示す図である。上述した本実施の形態にかかる動作データ生成処理は、専用コンピュータ、又はパーソナルコンピュータ(PC)などのコンピュータにより実現可能である。但し、コンピュータは、物理的に単一である必要はなく、分散処理を実行する場合には、複数であってもよい。図14に示すように、コンピュータ200は、CPU201(Central Processing Unit)、ROM202(Read Only Memory)及びRAM203(Random Access Memory)を有し、これらがバス204を介して相互に接続されている。尚、コンピュータを動作させるためのOSソフトなどは、説明を省略するが、この情報処理装置を構築するコンピュータも当然備えているものとする。
次に、本実施の形態にかかる動作データ生成装置の一例について説明する。図14は、動作データ生成装置の一例を示す図である。上述した本実施の形態にかかる動作データ生成処理は、専用コンピュータ、又はパーソナルコンピュータ(PC)などのコンピュータにより実現可能である。但し、コンピュータは、物理的に単一である必要はなく、分散処理を実行する場合には、複数であってもよい。図14に示すように、コンピュータ200は、CPU201(Central Processing Unit)、ROM202(Read Only Memory)及びRAM203(Random Access Memory)を有し、これらがバス204を介して相互に接続されている。尚、コンピュータを動作させるためのOSソフトなどは、説明を省略するが、この情報処理装置を構築するコンピュータも当然備えているものとする。
バス204には又、入出力インターフェース205も接続されている。入出力インターフェース205には、例えば、キーボード、マウス、センサなどよりなる入力部206、CRT、LCDなどよりなるディスプレイ、並びにヘッドフォンやスピーカなどよりなる出力部207、ハードディスクなどより構成される記憶部208、モデム、ターミナルアダプタなどより構成される通信部209などが接続されている。
CPU201は、ROM202に記憶されている各種プログラム、又は記憶部208からRAM203にロードされた各種プログラムに従って各種の処理を実行する。本実施例においては、例えば、期待滞在時間合成処理、状態遷移確率算出処理、分散・平均合成処理等の処理を実行する。RAM103にはまた、CPU201が各種の処理を実行する上において必要なデータなども適宜記憶される。
通信部209は、例えば図示しないインターネットを介しての通信処理を行ったり、CPU201から提供されたデータを送信したり、通信相手から受信したデータをCPU201、RAM203、記憶部208に出力したりする。記憶部208はCPU201との間でやり取りし、情報の保存・消去を行う。通信部209は又、他の装置との間で、アナログ信号又はディジタル信号の通信処理を行う。
入出力インターフェース205は又、必要に応じてドライブ210が接続され、例えば、磁気ディスク211、光ディスク212、フレキシブルディスク213、又は半導体メモリ214などが適宜装着され、それらから読み出されたコンピュータプログラムが必要に応じて記憶部2108にインストールされる。
なお、本発明は上述した実施の形態のみに限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能であることは勿論である。例えば、上述の実施の形態では、ハードウェアの構成として説明したが、これに限定されるものではなく、任意の処理を、CPU(Central Processing Unit)にコンピュータプログラムを実行させることにより実現することも可能である。この場合、コンピュータプログラムは、記録媒体に記録して提供することも可能であり、また、インターネットその他の伝送媒体を介して伝送することにより提供することも可能である。
11 データ読出部、
12 原始シンボル合成部
13 行動パターン生成部
14 行動データベース
121 期待滞在時間合成部
122 状態遷移確率算出部
123 分散・平均合成部
12 原始シンボル合成部
13 行動パターン生成部
14 行動データベース
121 期待滞在時間合成部
122 状態遷移確率算出部
123 分散・平均合成部
Claims (18)
- 原始シンボルがその隔たり量に基づいて投影されることで原始シンボル間の類似情報を保持する原始シンボル空間における2以上の原始シンボルから新たな原始シンボルを生成するシンボル生成部と、
前記新たな原始シンボルの状態遷移確率及び出力確率から出力時系列パターンを生成するパターン生成部とを有し、
前記原始シンボルは、隠れマルコフモデルを使用して状態遷移確率及び出力確率が算出された所定の動作に対応するものであり、
前記シンボル生成部は、2以上の前記原始シンボルの状態遷移確率を速度に関する情報に変換して前記新たな原始シンボルの状態遷移確率を算出する動作データの生成装置。 - 前記シンボル生成部は、前記状態遷移確率を、各ノードにおける滞在時間の期待値である期待滞在時間で表現し、当該期待滞在時間を合成することで新たな原始シンボルの状態遷移確率を算出する
ことを特徴とする請求項1記載の動作データの生成装置。 - 前記期待滞在時間は、Left-to-Rightモデルにおける速度の逆数である
ことを特徴とする請求項1又は2記載の動作データの生成装置。 - 前記シンボル生成部は、前記期待滞在時間siを、自身のノードiに遷移する確率をaiiとしたとき、si=1/(1−aii)で表す
ことを特徴とする請求項2又は3記載の動作データの生成装置。 - 前記シンボル生成部は、原始シンボルを表す隠れマルコフモデルの示す出力確率を示すガウス分布の平均及び分散を合成することで新たな原始シンボルの出力確率を求める
ことを特徴とする請求項1乃至4のいずれか1項記載の動作データの生成装置。 - 前記隠れマルコフモデルは、連続分布型隠れマルコフモデルを使用する
ことを特徴とする請求項1乃至5のいずれか1項記載の動作データの生成装置。 - 前記隠れマルコフモデルは、混合数Nのガウス分布を混合数1のガウス分布に近似するか、又は混合数1の混合ガウス分布型隠れマルコフモデルを使用する
ことを特徴とする請求項6記載の動作データの生成装置。 - 前記シンボル生成部は、第1及び第2の原始シンボルにおける分散、平均をそれぞれσi (1)、σi (2)、μi (1)、μi (2)、新たな原始シンボルは、第1の原始シンボルと第2の原始シンボルをc1、c2の合成比率で合成した点としたとき、当該新たな原始シンボルにおける分散σ^i、平均μ^iを、
σ^i=c1σi (1)+c2σi (2)
μ^i=c1μi (1)+c2μi (2)
とする
ことを特徴とする請求項5乃至7のいずれか1項記載の動作データの生成装置。 - 原始シンボルがその隔たり量に基づいて投影されることで原始シンボル間の類似情報を保持する原始シンボル空間における2以上の原始シンボルから新たな原始シンボルを生成するシンボル生成工程と、
前記新たな原始シンボルの状態遷移確率及び出力確率から出力時系列パターンを生成するパターン生成工程とを有し、
前記原始シンボルは、隠れマルコフモデルを使用して状態遷移確率及び出力確率が算出された所定の動作に対応するものであり、
前記シンボル生成工程では、2以上の前記原始シンボルの状態遷移確率を速度に関する情報に変換して前記新たな原始シンボルの状態遷移確率を算出する動作データの生成方法。 - 前記生成工程では、前記状態遷移確率を、各ノードにおける滞在時間の期待値である期待滞在時間で表現し、当該期待滞在時間を合成することで新たな原始シンボルの状態遷移確率を算出する
ことを特徴とする請求項9記載の動作データの生成方法。 - 前記期待滞在時間は、Left-to-Rightモデルにおける速度の逆数である
ことを特徴とする請求項9又は10記載の動作データの生成方法。 - 前記生成工程では、前記期待滞在時間siを、自身のノードiに遷移する確率をaiiとしたとき、si=1/(1−aii)で表す
ことを特徴とする請求項10又は11記載の動作データの生成方法。 - 前記生成工程では、原始シンボルを表す隠れマルコフモデルの示す出力確率を示すガウス分布の平均及び分散を合成することで新たな原始シンボルの出力確率を求める
ことを特徴とする請求項9乃至12のいずれか1項記載の動作データの生成方法。 - 前記隠れマルコフモデルは、連続分布型隠れマルコフモデルを使用する
ことを特徴とする請求項9乃至13のいずれか1項記載の動作データの生成方法。 - 前記隠れマルコフモデルは、混合数Nのガウス分布を混合数1のガウス分布に近似するか、又は混合数1の混合ガウス分布型隠れマルコフモデルを使用する
ことを特徴とする請求項14記載の動作データの生成装置。 - 前記生成工程では、第1及び第2の原始シンボルにおける分散、平均をそれぞれσi (1)、σi (2)、μi (1)、μi (2)、新たな原始シンボルは、第1の原始シンボルと第2の原始シンボルをc1、c2の合成比率で合成した点としたとき、当該新たな原始シンボルにおける分散σ^i、平均μ^iを、
σ^i=c1σi (1)+c2σi (2)
μ^i=c1μi (1)+c2μi (2)
とする
ことを特徴とする請求項13乃至15のいずれか1項記載の動作データの生成方法。 - 所定の動作をコンピュータに実行させるためのプログラムであって、
原始シンボル空間における2以上の原始シンボルから新たな原始シンボルを生成するシンボル生成工程と、
前記新たな原始シンボルの状態遷移確率及び出力確率から出力時系列パターンを生成するパターン生成工程とを有し、
前記原始シンボルは、隠れマルコフモデルを使用して状態遷移確率及び出力確率が算出された所定の動作を示すものであり、
前記原始シンボル空間は、前記原始シンボルが、その隔たり量に基づいて射影されるものであり、当該原始シンボル間の類似情報を保持するものであって、
前記シンボル生成工程では、2以上の前記原始シンボルの状態遷移確率を速度に関する情報に変換して前記新たな原始シンボルの状態遷移確率を算出するプログラム。 - 自律的に動作を発現するロボット装置であって、
原始シンボルがその隔たり量に基づいて投影されることで原始シンボル間の類似情報を保持する原始シンボル空間における2以上の原始シンボルから新たな原始シンボルを生成するシンボル生成部と、
前記新たな原始シンボルの状態遷移確率及び出力確率から出力時系列パターンを生成するパターン生成部とを有し、
前記原始シンボルは、隠れマルコフモデルを使用して状態遷移確率及び出力確率が算出された所定の動作に対応するものであり、
前記シンボル生成部は、2以上の前記原始シンボルの状態遷移確率を速度に関する情報に変換して前記新たな原始シンボルの状態遷移確率を算出するロボット装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007236629A JP2009066693A (ja) | 2007-09-12 | 2007-09-12 | 運動データの生成装置、方法、及びロボット装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007236629A JP2009066693A (ja) | 2007-09-12 | 2007-09-12 | 運動データの生成装置、方法、及びロボット装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2009066693A true JP2009066693A (ja) | 2009-04-02 |
Family
ID=40603499
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007236629A Pending JP2009066693A (ja) | 2007-09-12 | 2007-09-12 | 運動データの生成装置、方法、及びロボット装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2009066693A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017170553A (ja) * | 2016-03-23 | 2017-09-28 | 国立大学法人 東京大学 | 制御方法 |
US10514974B2 (en) | 2015-02-17 | 2019-12-24 | Nec Corporation | Log analysis system, log analysis method and program recording medium |
-
2007
- 2007-09-12 JP JP2007236629A patent/JP2009066693A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10514974B2 (en) | 2015-02-17 | 2019-12-24 | Nec Corporation | Log analysis system, log analysis method and program recording medium |
JP2017170553A (ja) * | 2016-03-23 | 2017-09-28 | 国立大学法人 東京大学 | 制御方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Maiseli et al. | Recent developments and trends in point set registration methods | |
Holden et al. | A deep learning framework for character motion synthesis and editing | |
US9536338B2 (en) | Animating objects using the human body | |
James et al. | Precomputing interactive dynamic deformable scenes | |
Yamane et al. | Synthesizing animations of human manipulation tasks | |
US6462742B1 (en) | System and method for multi-dimensional motion interpolation using verbs and adverbs | |
US6856319B2 (en) | Interpolation using radial basis functions with application to inverse kinematics | |
JP2022028791A (ja) | 画像正則化及びリターゲティングシステム | |
Song et al. | Accurate face rig approximation with deep differential subspace reconstruction | |
Mukai et al. | Efficient dynamic skinning with low-rank helper bone controllers | |
Al Borno et al. | Robust Physics‐based Motion Retargeting with Realistic Body Shapes | |
WO2020246482A1 (ja) | 制御装置、システム、学習装置および制御方法 | |
Ahmadzadeh et al. | Trajectory-based skill learning using generalized cylinders | |
Tosun et al. | A general method for kinematic retargeting: Adapting poses between humans and robots | |
US20240135620A1 (en) | Morph target animation | |
JP4027838B2 (ja) | 隠れマルコフモデルによる運動データの認識・生成方法、それを用いた運動制御方法及びそのシステム | |
JP2009066693A (ja) | 運動データの生成装置、方法、及びロボット装置 | |
GB2512302A (en) | Animation of a virtual object | |
Mousas et al. | Efficient hand-over motion reconstruction | |
Wu et al. | Natural character posing from a large motion database | |
Yang et al. | Learning a contact potential field for modeling the hand-object interaction | |
JP4773680B2 (ja) | 情報処理装置および方法、プログラム記録媒体、並びにプログラム | |
JP2020113116A (ja) | モーション生成装置、モーション生成方法、及びプログラム | |
WO2022181253A1 (ja) | 関節点検出装置、学習モデル生成装置、関節点検出方法、学習モデル生成方法、及びコンピュータ読み取り可能な記録媒体 | |
Ong et al. | Machine learning for human design: Sketch interface for structural morphology ideation using neural networks |