JP2009066693A

JP2009066693A - 運動データの生成装置、方法、及びロボット装置

Info

Publication number: JP2009066693A
Application number: JP2007236629A
Authority: JP
Inventors: Kaiken Ri; 海妍李; Tetsuya Inamura; 哲也稲邑; Tomohiro Shibata; 智広柴田
Original assignee: Nara Institute of Science and Technology NUC; Research Organization of Information and Systems; Toyota Motor Corp
Current assignee: Nara Institute of Science and Technology NUC; Research Organization of Information and Systems; Toyota Motor Corp
Priority date: 2007-09-12
Filing date: 2007-09-12
Publication date: 2009-04-02

Abstract

【課題】所定の動作パターンから様々な動作パターンを生成することができる動作パターン生成装置、動作パターン生成方法及びプログラム並びにロボット装置を提供すること。
【解決手段】原始シンボルがその隔たり量に基づいて投影されることで原始シンボル間の類似情報を保持する原始シンボル空間における２以上の原始シンボルから新たな原始シンボルを生成するシンボル生成部１２と、新たな原始シンボルの状態遷移確率及び出力確率から出力時系列パターンを生成するパターン生成部１３とを有する。原始シンボルは、隠れマルコフモデルを使用して状態遷移確率及び出力確率が算出された所定の動作に対応するものであり、シンボル生成部１２は、２以上の原始シンボルの状態遷移確率を速度に関する情報に変換して新たな原始シンボルの状態遷移確率を算出する。
【選択図】図１

Description

本発明は、隠れマルコフモデルによる運動（行動）データの生成装置、方法、及びプログラム、並びにロボット装置に関し、特にヒューマノイドロボットやコンピュータ・グラフィックスキャラクターの運動データの生成装置、方法、及びプログラム、並びにロボット装置に関する。なお、ここでは、「運動」なる用語は、適宜「行動」に読み替えることができるものと定義する。

ロボットの運動制御や実環境認識などには、時系列データの記憶と再現が必要不可欠である。この際、瞬間のデータであるキーフレーム表現を用いて記憶すると、ロボットの運動制御や環境の特徴的な要素の把握などに有効である。

このような技術として、特許文献１には、隠れマルコフモデル（ＨＭＭ）によって抽象化された対象の運動の時系列データを再現することができる、隠れマルコフモデルによる運動データの認識・生成方法、それを用いた運動制御方法及びその制御システムが開示されている。

特許文献１では、ＨＭＭによる運動データの認識・生成方法において、状態遷移列候補の計算過程と、出力ベクトル列の計算過程と、最終的な出力ベクトル列の計算過程と、隠れマルコフモデルの空間への配置過程とを有し、運動認識と運動生成を隠れマルコフモデルのみによって統合するものである。
特開２００４−３３０３６１号公報

しかしながら、特許文献１に記載の方法では、内挿された動作パターンにおけるヒューマノイドの各関節角度（姿勢）が、内挿に用いられた動作の各関節角度に比べて小さい値となることが問題として残されていた。たとえば、腕を思いきり上に上げて万歳をするような動作と手の動きが無い動作を合成に用いた場合、手は上まで上がらず、前方に手を伸ばすような姿勢までしか手が上がらない、という合成結果が得られていた。

本発明は、このような問題点を解決するためになされたものであり、原始シンボル空間に投影された２以上の原始シンボルを自由に合成し、新規動作の生成を可能にする動作データ生成装置、動作データ生成方法及びプログラムを提供することを目的とする。

本発明にかかる動作データの生成装置は、原始シンボルがその隔たり量に基づいて投影されることで原始シンボル間の類似情報を保持する原始シンボル空間における２以上の原始シンボルから新たな原始シンボルを生成するシンボル生成部と、前記新たな原始シンボルの状態遷移確率及び出力確率から出力時系列パターンを生成するパターン生成部とを有し、前記原始シンボルは、隠れマルコフモデルを使用して状態遷移確率及び出力確率が算出された所定の動作に対応するものであり、前記シンボル生成部は、２以上の前記原始シンボルの状態遷移確率を速度に関する情報に変換して前記新たな原始シンボルの状態遷移確率を算出する。

本発明においては、隠れマルコフモデルを使用して抽象化した動作パターン間の関連性を表現する原始シンボル空間に投影された原始シンボルの状態遷移確率を、速度に関する情報に変換して合成することにより、例えば動作が大きくなる方向などにも自由に合成することができる。

また、前記シンボル生成部は、前記状態遷移確率を、各ノードにおける滞在時間の期待値である期待滞在時間で表現し、当該期待滞在時間を合成することで新たな原始シンボルの状態遷移確率を算出することができる。期待滞在時間を導入することで、２つ又は２以上の原始シンボルをどのような比率であっても合成することができる。

さらに、前記期待滞在時間は、Left-to-Rightモデルにおける速度の逆数とすることができる。さらにまた、前記シンボル生成部は、前記期待滞在時間ｓ_ｉを、自身のノードｉに遷移する確率をａ_ｉｉとしたとき、ｓ_ｉ＝１／（１−ａ_ｉｉ）で表すことができる。

また、前記シンボル生成部は、原始シンボルを表す隠れマルコフモデルの示す出力確率を示すガウス分布の平均及び分散を合成することで新たな原始シンボルの出力確率を求めることができる。動作の合成として適切である合成対象は姿勢であり、その姿勢の表現に最も重要な要素がガウス分布の平均ベクトルであるため、平均及び分散を合成対象とすることができる。

さらに、連続分布型隠れマルコフモデルを使用することができる。ここで、混合数Ｎのガウス分布を混合数１のガウス分布に近似するか、又は混合数１の混合ガウス分布型隠れマルコフモデルを使用することが好ましい。ガウス分布が１つ又は１つに近似することができるモデルは合成に適している。

さらにまた、前記シンボル生成部は、第１及び第２の原始シンボルにおける分散、平均をそれぞれσ_ｉ ^（１）、σ_ｉ ^（２）、μ_ｉ ^（１）、μ_ｉ ^（２）、新たな原始シンボルは、第１の原始シンボルと第２の原始シンボルをｃ_１、ｃ_２の合成比率で合成した点としたとき、当該新たな原始シンボルにおける分散σ＾_ｉ、平均μ＾_ｉを、
σ＾_ｉ＝ｃ_１σ_ｉ ^（１）＋ｃ_２σ_ｉ ^（２）
μ＾_ｉ＝ｃ_１μ_ｉ ^（１）＋ｃ_２μ_ｉ ^（２）
とすることができる。平均及び分散を合成比率ｃ_１、ｃ_２で混合することができる。

本発明によれば、所定の動作パターンから様々な動作パターンを生成することができる動作パターン生成装置、動作パターン生成方法及びプログラム並びにロボット装置を提供することができる。

以下、本発明を適用した具体的な実施の形態について、図面を参照しながら詳細に説明する。この実施の形態は、本発明を、ＨＭＭ間内のみではなく、自由に割合で合成することを可能にすることで、より表現能力の高い原始シンボル空間を構成し、従来実現できないような新規動作の生成を可能にする動作データ生成装置に適用したものである。

１．動作データ生成装置
図１は、本実施の形態にかかる動作データ生成装置を示す図である。動作データ生成装置１は、データ読出部１１、原始シンボル合成部１２、行動パターン生成部１３及び行動データベース１４を有する。原始シンボル合成部は、期待滞在時間合成部１２１、状態遷移確率算出部１２２、及び分散・平均合成部１２３を有する。

行動データベース１４には、原始シンボル空間中に配置された複数の動作に対応する原始シンボルの情報を有する。本実施の形態においては、原始シンボル空間に配置した所定の動作を示す原始シンボルを動作合成の対象とする。原始シンボル空間とは、隠れマルコフモデル（以下ＨＭＭという。）を用いて抽象化した動作パターン間の関連性を表現するための空間をいい、各動作パターンに対応するＨＭＭパラメータ間の距離をカルバックライブラー情報量（Kullback-Leibler divergence）を用いて計量し、多次元尺度法で空間を構成するものである。また、原始シンボルとは、ある動作をＨＭＭで抽象化した際の、ＨＭＭのパラメータθ＝{ａ，ｂ，π，Ｑ}（ａ：状態遷移確率（状態推移確率）、ｂ：出力確率、π：初期分布確率、Ｑ：状態の有限集合）のうち、状態遷移確率ａ、出力確率ｂの２つのパラメータのセットλ＝{ａ，ｂ}をいう。なお、原始シンボルは、ＨＭＭのパラメータのうちπ、Ｑが同一ものを想定している。

本実施の形態においては、このような空間表現を用いることにより、未知の動作パターンであっても、ある空間内の静止点に射影することが可能となり、既存の原始シンボルに対応する静止点間の内分点であるという解釈に基づいて、既存の動作パターンの合成として認識される。これにより、動作パターン間の合成をＨＭＭパラメータの内挿処理で近似することが可能となっている（特許文献１）。なお、原始シンボル空間の構成方法の詳細は後述する。

図２は、原始シンボル空間及びこの原始シンボル空間に投影された原始シンボルの一例を示す図である。この原始シンボル空間の構成には、モーションキャプチャシステムを用いて測定した、歩く（ｗａｌｋ）、ストレッチ（ｓｔｒｅｔｃｈ）、キック（ｋｉｃｋ）、スクワット（ｓｑｕａｔ）、投げる（ｔｈｒｏｗ）、しゃがむ（ｓｔｏｏｐ）の６種類に行動に対する原始シンボルを用いる。原始シンボル空間構成には、１０次元の空間に対して多次元尺度法を用いて行なったが、４乃至１０次元目の成分はほとんど用いられることがなく、３次元目までの成分で十分表現が可能である。

次に、本実施の形態にかかる動作データ生成装置についてその動作生成方法と共に詳細に説明する。図３は、本実施の形態にかかる動作生成方法を示すフローチャートである。データ読出部１１は、この原始シンボル空間に射影された原始シンボルのラベル及びその合成割合が入力され、当該原始ラベルに対応する原始シンボルλ{ａ_ｉｊ，ｂ_ｉ}を読み出す（ステップＳ１）。例えば、キックとスクワットを合成するなどの入力があった場合、データ読出部１１は、キック及びスクワットに対応する原始シンボルλを読み出す。

２．原始シンボル合成部
原始シンボル合成部１２は、合成する動作の種類とその合成割合を受け取り、２以上の動作から一の動作を生成する。この場合、原始シンボル合成部１２は、原始シンボルの状態遷移確率を速度に関する情報に変換して新たな原始シンボルの状態遷移確率を算出する。具体的には、状態遷移確率を、各ノードにおける滞在時間の期待値である期待滞在時間で表現し、当該期待滞在時間を合成することで新たな原始シンボルの状態遷移確率を算出する。この期待滞在時間は、Left-to-Rightモデルにおける速度の逆数であり、期待滞在時間を、自身のノードｉに遷移する確率をａ_ｉｉとしたとき、ｓ_ｉ＝１／（１−ａ_ｉｉ）で表すことができる。ここでは、従来の原始シンボル合成と比較しつつ本実施の形態にかかる動作合成について説明する。

２−１．従来の問題点
従来においては、パラメータλの状態遷移確率及び出力確率を合成（内挿）の対象としていた。この場合、合成された動作パターンにおけるヒューマノイドの各関節角度（姿勢）が、合成に用いられた動作の各関節角度に比べて小さい値となることが問題として残されていた。たとえば、腕を思いきり上に上げて万歳をするような動作と手の動きが無い動作を合成に用いた場合、手は上まで上がらず、前方に手を伸ばすような姿勢までしか手が上がらない、という合成結果が得られていた。

さらに、ＨＭＭの状態遷移確率値も合成の対象となっていたため、ある動作とある動作との外分点にあたる位置の動作を生成しようとすると、確率値が０〜１の範囲を超えてしまい、当該動作を定義できない状態にあった。しかしながらこのような合成方法では、考えられる全ての動作パターンを既知パターンとして登録する必要があるなどの問題が生じる状況であった。

そこで、本発明においては、原始シンボル間内での合成のみではなく、原始シンボル間外の合成を可能にすることで、より表現能力の高い原始シンボル空間を構成し、原始シンボル間内のみでは実現できないような新規動作の生成を可能にする手法を提案する。従来のＨＭＭの合成手法においても現在と同様、図４に示すようなLeft-to-Right型の連続分布型ＨＭＭ（ＣＨＭＭ）が採用していた。各離散時刻ｔの関節角度ベクトルθ[ｔ]をＨＭＭの出力ベクトルｏ[ｔ]であると定義し、ノードｉからｊへの状態遷移確率ａ_ｉｊと、混合ガウス分布からの出力確率ｂの二つのパラメータを用いてＨＭＭの合成を行っていた。具体的には、原始シンボルλ_１＝｛ａ_ｉｊ ^（１）,ｂ_ｉ ^（１）｝、λ_２＝｛ａ_ｉｊ ^（２）,ｂ_ｉ ^（１）｝で抽象化されている行動の状態点を（１−α）：αの比で内分する状態点に対応する原始シンボルλ＾＝{ａ＾_ｉｊ、ｂ＾_ｉ}を次のように定義していた。

ここで、ｃ_ｉｍは各ガウス分布の混合係数、Ｍはガウス分布の混合数、μ_ｉｍ、σ_ｉｍはノードｉにおけるｍ番目のガウス分布の平均ベクトルおよび分散ベクトルを示す。しかしながら、式（１）では単純に状態遷移確率同士を合成の対象としているため、既知の原始シンボル間を結ぶ線分上以外の動作を求めることができなかった。原始シンボル間を結ぶ線分外の動作を求めようとすると確率がマイナスの値になることもあり、数理的に意味を失う。さらに、合成の結果生成される動作パターンの関節角度の値が小さくなる問題については、式（２）において、混合係数をある比率で線形和をとることで合成を実現していたためである。従来の合成処理は、原始シンボル空間上の内分点を求めるために導入されたものであるため、合成の結果生成される関節角度は必ず元の動作より小さい値となり、姿勢を合成するには不完全であった。動作パターンとして関節角度列が用いられているのであれば、その姿勢が混合されるような合成結果であることが望ましい。そこで、本実施の形態においては、合成の対象となるパラメータを変更し、これらの問題点を解決する。

２−２．合成アルゴリズム
２つの原始シンボルから新たな原始シンボルを生成する場合について説明する。まず、状態遷移確率の扱いについて考える。従来までは遷移確率を直接合成していたが、本実施の形態においては、以下で定義する期待滞在時間という特徴量に変換してから合成を行う。ノードｉにおける滞在時間の期待値ｓ_ｉは、自分自身のノードに遷移する確率ａ_ｉｉを使って次のように計算できる（ステップＳ２）。

この期待滞在時間ｓ_ｉを合成の対象とする。ただし、前提条件として、合成のためのＨＭＭのノード数は一致しているものとする。

２つの原始シンボルλ^（１）＝{ａ^（１）、ｂ^（１）}及びλ^（２）＝{ａ^（２）、ｂ^（２）}を合成する場合を考える。本実施の形態においては、２つの原始シンボルλ^（１）（Ａ点）、λ^（２）（Ｂ点）について、原点からＡ点に向かう基底ベクトル、Ｂ点に向かう基底ベクトルとして扱う。原始シンボルＡ点と原始シンボルＢ点の合成は、これらのベクトルの合成として求めることができる。これは、原始シンボルＡ点、Ｂ点、原点を含む平面上の点であれば、いずれの位置であっても合成できることを示す。したがって、従来はＡ点とＢ点とで結ばれる線分内のみの合成しかできなかったのに対し、Ａ点とＢ点で結ばれる線分以外の広い領域にわたって、原始シンボルの合成が可能となる。

状態遷移確率算出部１２２は、２つの原始シンボルλ^（１）（Ａ点）、λ^（２）（Ｂ点）の合成係数を負の値も取りうるｃ_１、ｃ_２としたとき、ＨＭＭのノードｉでの期待滞在時間＾ｓ_ｉを、次式によって求める（ステップＳ３）。

次に、状態遷移確率算出部１２２は、期待滞在時間ｓ＾_ｉから遷移確率を求める（ステップＳ４）。合成後のＨＭＭのノードｉにおける状態遷移確率ａ＾_ｉｉは、次のようになる。

次に、出力確率の合成について説明する。従来手法では、混合係数が合成の対象となっていたが、本実施の形態においては、ガウス分布の平均ベクトル及び分散ベクトルを合成の対象とする。その理由は、動作の合成として適切である合成対象は姿勢であり、その姿勢の表現に最も重要な要素がガウス分布の平均ベクトルであると考えたからである。

ここで、従来まで用いてきたＨＭＭでは混合ガウス分布モデルを採用していたが、この場合、平均・分散ベクトルが複数存在することになり、合成対象となるガウス分布を特定することが単純にはできない。そのため、１個のみのガウス分布で出力確率を表現するものとし、分散・平均合成部１２３は下記の演算を実行し、合成後のガウス分布を求める（ステップＳ５）。なお、本実施の形態においては、混合数１の混合ガウス分布型隠れマルコフモデルを使用するものとして説明するが、混合数Ｎのガウス分布を混合数１のガウス分布に近似して使用するようにしてもよい。

２−３．合成の一般化
以上のように、原始シンボル合成部１２は、２点の原始シンボルを合成して新たな原始シンボルを生成するが、２点間の合成のみならず、３点以上の複数のＨＭＭの合成も同等の定義で容易に拡張可能である。すなわち、ｍ個の原始シンボル（λ_１、・・・、λ_ｍ）を、負の値も取り得る混合係数ｃ_１、・・・、ｃ_ｍで混合する時、合成後のＨＭＭのノードｉにおける状態遷移確率ａ＾_ｉｉは、下記式（９）のように定義される。

出力確率ｂ＾の平均μ＾_ｉと分散σ＾_ｉは、下記式（１１）、（１２）と定義される。

行動パターン生成部１３は、原始シンボル合成部１２により合成された原始シンボルλから出力動作パターンを生成する（ステップＳ６）。動作パターン生成はＨＭＭの持つ遷移確率、出力確率に従って時系列データを生成することによって行う。図５は、出力時系列データ生成方法を示すフローチャートである。このデータ生成法は確率的なゆらぎのために、試行ごとに運動の周期が異なり、関節角度にもノイズが大きく含まれる。そこで次のような方法により複数回の生成試行の平均を取ることでこの問題を解消させる。
ステップＳ１１：遷移確率に従って状態遷移試行を１回行い、状態遷移系列Ｑを得る。
ステップＳ１２：ステップＳ１をｎ回繰り返し、Ｑ_１，・・・，Ｑ_ｋを得る。それらの平均を取って状態遷移系列の平均Ｑ＾を得る。
ステップＳ１３：Ｑ＾に従って各状態ノードから出力ベクトルを出力させ、出力時系列パターンＯを得る。
ステップＳ１４：ステップＳ１１〜ステップＳ１３をｋ回繰り返し、Ｏ_１，・・・，Ｏ_ｋを得る。それらの平均を取って最終的な出力時系列パターンＯ＾を得る。

なお、このｍ、ｋの値は実験的に求めることができ、例えばｎ＝１００、ｋ＝５０などとすることができる。図６は、この方法で原始シンボルλから運動パターンを生成した様子を示すグラフ図である。グラフは全身の関節角のうち１次元分のデータを示している。グラフから分かるように、一回の生成試行（破線Ｌ１）、出力時系列のみに対する平均化（二点鎖線Ｌ２）では正しい時系列データが生成されないが、状態遷移系列と出力時系列パターンに対して平均化を行う（一点鎖線Ｌ３）ことで元のデータ（実線Ｌ０）とほぼ同等のデータを再現していることが分かる。以上の方法を用い、行動パターン生成部１３は、空間上の点からλ＾を求め、得られたλ＾から運動パターンを生成する。これにより原始シンボル空間での幾何学的な原始シンボルの操作による運動パターンの操作が可能となる。

３．実施例
次に、本発明の実施例について説明する。実施例のために用いる動作パターンは、肩３自由度、肘１自由度、股関節３自由度、膝１自由度、足首２自由度の合計２０自由度からなるヒューマノイドロボットの関節角度列である。モーションキャプチャシステムを用いて、３３[ｍｓ]周期のサンプリングタイムで約３秒間、人間が実演した動作パターンを用いた。図７、図８に示すようなパンチ動作とスクワット動作を、合成対象の動作パターンとして使用する。

３−１．実施例１
先ず、パンチとスクワットに対応する点を１：１に内分するような中点における動作を生成するために、ｃ１＝０．５、ｃ２＝α＝０．５として、式（５）〜（８）を適用した。その結果得られた動作を、図９に示す。

３−２．実施例２
さらに、ｃ１＝１．０、ｃ２＝１．０として合成した動作を図１０に示す。この姿勢列をみると分かるように、実施例１にて生成した動作にくらべ、本実施例の動作の方が、膝を深く曲げる角度が深く、手をより前に突き出している。これは従来までの合成では実現不可能だった特徴である。

３−３．実施例３
スクワットを−１倍、パンチを１．５倍した動作を生成するために、ｃ１＝−１、ｃ２＝１．５として、式（５）〜（８）を適用した。その結果得られた動作を、図１１に示す。

ここで、ｃ１＝−１、ｃ２＝１．５の合成とは、スクワットとパンチの間を外挿することに相当する。この場合、右の股関節ピッチ軸に着目すると、通常のパンチ動作では股関節ピッチ軸は特に変化していないが、本実施例における姿勢列では、反り返るようにピッチ軸が動作している。これはスクワット動作において使用されるピッチ軸の動きと逆方向の姿勢であり、外挿の結果であると解釈できる。同じような効果は左膝関節にも見られる。外挿された姿勢列では、左膝関節は特に曲がっておらず、まっすぐ伸びた姿勢である。元のパンチ動作では、ある程度膝を曲げており、スクワット動作において膝がより曲がっている姿勢をとっている。この実験ではスクワットからパンチに向けて外挿するに等しい合成を行ったので、このような膝関節が伸びるような姿勢列が生じたと言える。

上記の合成実験をより定量的に示すため、実験から得られた右足股関節のピッチ軸および、左足膝関節の関節角度時系列を図１２、図１３にそれぞれ示す。

本実施の形態においては、ＨＭＭの状態遷移確率をLeft-to-Rightモデルにおける速度の逆数を示す期待滞在時間に置き換えることで、状態遷移確率の合成を可能とする。同様に、ＨＭＭの出力ベクトルをヒューマノイドの姿勢ベクトルに対応させている。そのため、出力確率モデルに用いられているガウス分布の平均ベクトルを合成することで姿勢の合成を実現することができる。

４．原始シンボル空間
次に、行動データベースに記憶される原始シンボル空間の構成方法について説明する（特許文献１参照）。シンボル同士の関係性からパターン同士の関係性を記述し、運動パターンの情報処理に新しい枠組みを形成する。具体的には、原始シンボル同士の関係性を幾何学的に記述できる空間を構成する。運動パターンを抽象化した原始シンボルを、その関係性に基づいて空間内に配置し、その空間における幾何学的な操作を利用することで、運動パターンの情報処理を行う。本実施の形態においてはその基礎実験として、未知の行動を既知の行動の組み合わせとして認識し、既知の行動を組み合わせることで新しい行動を生成することを目指す。

４−１．隠れマルコフモデル間の隔たり量の定義
空間を構成するためには距離情報が必要となる。本実施の形態においては、原始シンボル間の隔たりをＨＭＭ間の隔たりとして取り扱う。すなわち、原始シンボル{ａ，ｂ}に対応するＨＭＭのパラメータθ間の距離を計算することで、原始シンボルλの距離とする。ＨＭＭは確率モデルであるためカルバックライブラー情報量を用いてＨＭＭ間の隔たりを表す量を定義する。カルバックライブラー情報量は確率分布関数間の隔たりを定量的に表すものである。２つの確率密度関数ｐ_１、ｐ_２間のカルバックライブラー情報量Ｄ（ｐ_１、ｐ_２）は式（１７）で定義される。

これをＨＭＭに適用する場合は、対象となる２つのＨＭＭのパラメータをθ_１、θ_２として次の式で表現できる。

ここで、ｙ_１ ^Ｔｉはλ_１の学習用に用いた長さＴ_ｉの時系列データ、ｎは観測された時系列データの数である。この式は一般にＤ（θ_１，θ_２）≠Ｄ（θ_２，θ_１）とθ_１，θ_２に対して非対称であり、ＨＭＭ間同士の距離的な量として用いるには不適切である。そこで式（１８）を対称形にした次式を原始シンボル間の隔たりを表す量として用いることにする。

４−２．原始シンボル空間の構成
原始シンボルを隔たり量に基づいて空間に射影し、原始シンボル間の類似情報を保持する原始シンボル空間を構成する。距離的な情報をもとに空間への配置を行うには多次元尺度法を用いる。多次元尺度法とは対称間の距離に関するデータが与えられた時にその対象の空間上での位置関係を再現する手法である。対象ｉ、ｊ間の隔たり量に関する値ｆ_ｉｊをデータとして与え、ｆ_ｉｊに基づいてｎ個の対象を空間に射影することを考える。射影された対象ｉの空間での位置ベクトルをｘ_ｉと表し、対象間の射影された空間上での距離をｄ_ｉｊとする。ただし、ｄ_ｉｊ＝｜ｘ_ｉ−ｘ_ｊ｜^２である。このとき、多次元尺度法は次式のようにｆ_ｉｊとｄ_ｉｊの誤差Ｓをｘに関して最小化する問題に帰着する。

式（２１）はｘの多項式で表現できないため、最小二乗法が簡単に適用はできない。そこで

を考える。式（２０）は展開するとｘの多項式で表現できるため、ｘに関しての最小化が簡単である。またＴはｆ_ｉｊ≒ｄ_ｉｊのときには、

となり、Ｓにほぼ一致する。そこでＴをＳの代わりに使用し、ｘに関して最小化することで対象を空間に射影する。本実施の形態においては、上述したように、ＨＭＭのパラメータθの距離の隔たりを原始シンボルλの距離の隔たりとし、ｆ_ｉｊとしてＤ（θ_１，θ_２）＝Ｄ_ｓ（λ_１，λ_２）を採用する。

４−３．原始シンボル空間における行動認識・生成
ｎ個の既知の原始シンボルを射影した原始シンボル空間を用いて、未知の運動パターンを認識する手法を考える。観測された未知の運動パターンに対応するＨＭＭのパラメータθを求める。そして、そのパラメータθに対応する原始シンボルをλ＾とするとき、このλ＾と既知の原始シンボルλ_１，λ_２，・・・，λ_ｎとの間のカルバックライブラー情報量を求めることにより、原始シンボル空間上でのλ＾の状態点を決定することができる。原始シンボル空間上でのλ＾の位置ベクトルをｘ＾、既知の原始シンボルλ^ｉの位置ベクトルをｘ^ｉとし、カルバックライブラー情報量Ｄ（λ＾，λ^ｉ）と、原始シンボル空間上でのｘ＾とｘ^ｉ間の距離ｄ（ｘ＾，ｘ^ｉ）との誤差が最小になるように、ｘ＾を最小二乗法で求める。

実際には未知の運動パターンが観測される毎にＨＭＭを学習することは、学習サンプルを用意しなくてはならないこと、計算に時間がかかることなどから現実的ではない。そこでＨＭＭを学習したと仮定してカルバックライブラー情報量を求める。非対称形を求めることは困難であるので、下記式（２３）を求める。

ここで、式（２０）は計算することができるので、式（２１）求めれば、カルバックライブラー情報量を近似によって求めることができる。ダンス（ｄａｎｃｅ）、キック（ｋｉｃｋ）、スクワット（ｓｑｕａｔ）、スウィング（ｓｗｉｎｇ）、ウォーク（ｗａｌｋ）という行動における式（２０）、式（２１）の値を表１に示す。

式（２１）の値が−１０００オーダなのに対し、式（２０）の値は１０のオーダである。したがって、式（２１）の値も１０のオーダであるとして計算をしても誤差が少ないという仮定を導入する。これらの仮定を用いてＨＭＭを学習することなくＤ（λ＾，λ_ｉ）を近似によって求め、未知の行動に対する状態点を決定する。

このような原始シンボル空間上での幾何学的操作によって、観測した運動パターンの認識結果を原始シンボル空間上での状態点として表現することが可能となり、未知の運動パターンを既知の原始シンボルの組合せとして認識することができるようになる。

５．動作データ生成装置のハードウェア
次に、本実施の形態にかかる動作データ生成装置の一例について説明する。図１４は、動作データ生成装置の一例を示す図である。上述した本実施の形態にかかる動作データ生成処理は、専用コンピュータ、又はパーソナルコンピュータ（ＰＣ）などのコンピュータにより実現可能である。但し、コンピュータは、物理的に単一である必要はなく、分散処理を実行する場合には、複数であってもよい。図１４に示すように、コンピュータ２００は、ＣＰＵ２０１（Central Processing Unit）、ＲＯＭ２０２（Read Only Memory）及びＲＡＭ２０３（Random Access Memory）を有し、これらがバス２０４を介して相互に接続されている。尚、コンピュータを動作させるためのＯＳソフトなどは、説明を省略するが、この情報処理装置を構築するコンピュータも当然備えているものとする。

バス２０４には又、入出力インターフェース２０５も接続されている。入出力インターフェース２０５には、例えば、キーボード、マウス、センサなどよりなる入力部２０６、ＣＲＴ、ＬＣＤなどよりなるディスプレイ、並びにヘッドフォンやスピーカなどよりなる出力部２０７、ハードディスクなどより構成される記憶部２０８、モデム、ターミナルアダプタなどより構成される通信部２０９などが接続されている。

ＣＰＵ２０１は、ＲＯＭ２０２に記憶されている各種プログラム、又は記憶部２０８からＲＡＭ２０３にロードされた各種プログラムに従って各種の処理を実行する。本実施例においては、例えば、期待滞在時間合成処理、状態遷移確率算出処理、分散・平均合成処理等の処理を実行する。ＲＡＭ１０３にはまた、ＣＰＵ２０１が各種の処理を実行する上において必要なデータなども適宜記憶される。

通信部２０９は、例えば図示しないインターネットを介しての通信処理を行ったり、ＣＰＵ２０１から提供されたデータを送信したり、通信相手から受信したデータをＣＰＵ２０１、ＲＡＭ２０３、記憶部２０８に出力したりする。記憶部２０８はＣＰＵ２０１との間でやり取りし、情報の保存・消去を行う。通信部２０９は又、他の装置との間で、アナログ信号又はディジタル信号の通信処理を行う。

入出力インターフェース２０５は又、必要に応じてドライブ２１０が接続され、例えば、磁気ディスク２１１、光ディスク２１２、フレキシブルディスク２１３、又は半導体メモリ２１４などが適宜装着され、それらから読み出されたコンピュータプログラムが必要に応じて記憶部２１０８にインストールされる。

なお、本発明は上述した実施の形態のみに限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能であることは勿論である。例えば、上述の実施の形態では、ハードウェアの構成として説明したが、これに限定されるものではなく、任意の処理を、ＣＰＵ（Central Processing Unit）にコンピュータプログラムを実行させることにより実現することも可能である。この場合、コンピュータプログラムは、記録媒体に記録して提供することも可能であり、また、インターネットその他の伝送媒体を介して伝送することにより提供することも可能である。

本発明の実施の形態にかかる動作データ生成装置を示す図である。本発明の実施の形態にかかる動作生成方法を示すフローチャートである。原始シンボル空間及びこの原始シンボル空間に投影された原始シンボルの一例を示す図である。 Left-to-Right型の連続分布型ＨＭＭ（ＣＨＭＭ）を示す図である。本発明の実施の形態における出力時系列データ生成方法を示すフローチャートである。本発明の実施の形態における動作データ生成方法により原始シンボルλから運動パターンを生成した様子を示すグラフ図である。ロボット装置がパンチをしている様子を示す図であるロボット装置がスクワットをしている様子を示す図であるスクワットとパンチを各動作＝０．５の割合により新たな動作を生成した様子を示す図であるスクワットとパンチを各動作＝１．０の割合により新たな動作を生成した様子を示す図である。スクワット＝１、パンチ＝１．５の割合で合成することにより新たな動作を生成した様子を示す図である。ロボット装置の右足股関節のピッチ軸の関節角度時系列データを示すグラフ図である。ロボット装置の左足膝関節のピッチ軸の関節角度時系列データを示すグラフ図である。動作データ生成装置の一例を示す図である。

符号の説明

１１データ読出部、
１２原始シンボル合成部
１３行動パターン生成部
１４行動データベース
１２１期待滞在時間合成部
１２２状態遷移確率算出部
１２３分散・平均合成部

Claims

原始シンボルがその隔たり量に基づいて投影されることで原始シンボル間の類似情報を保持する原始シンボル空間における２以上の原始シンボルから新たな原始シンボルを生成するシンボル生成部と、
前記新たな原始シンボルの状態遷移確率及び出力確率から出力時系列パターンを生成するパターン生成部とを有し、
前記原始シンボルは、隠れマルコフモデルを使用して状態遷移確率及び出力確率が算出された所定の動作に対応するものであり、
前記シンボル生成部は、２以上の前記原始シンボルの状態遷移確率を速度に関する情報に変換して前記新たな原始シンボルの状態遷移確率を算出する動作データの生成装置。
前記シンボル生成部は、前記状態遷移確率を、各ノードにおける滞在時間の期待値である期待滞在時間で表現し、当該期待滞在時間を合成することで新たな原始シンボルの状態遷移確率を算出する
ことを特徴とする請求項１記載の動作データの生成装置。
前記期待滞在時間は、Left-to-Rightモデルにおける速度の逆数である
ことを特徴とする請求項１又は２記載の動作データの生成装置。
前記シンボル生成部は、前記期待滞在時間ｓ_ｉを、自身のノードｉに遷移する確率をａ_ｉｉとしたとき、ｓ_ｉ＝１／（１−ａ_ｉｉ）で表す
ことを特徴とする請求項２又は３記載の動作データの生成装置。
前記シンボル生成部は、原始シンボルを表す隠れマルコフモデルの示す出力確率を示すガウス分布の平均及び分散を合成することで新たな原始シンボルの出力確率を求める
ことを特徴とする請求項１乃至４のいずれか１項記載の動作データの生成装置。
前記隠れマルコフモデルは、連続分布型隠れマルコフモデルを使用する
ことを特徴とする請求項１乃至５のいずれか１項記載の動作データの生成装置。
前記隠れマルコフモデルは、混合数Ｎのガウス分布を混合数１のガウス分布に近似するか、又は混合数１の混合ガウス分布型隠れマルコフモデルを使用する
ことを特徴とする請求項６記載の動作データの生成装置。
前記シンボル生成部は、第１及び第２の原始シンボルにおける分散、平均をそれぞれσ_ｉ ^（１）、σ_ｉ ^（２）、μ_ｉ ^（１）、μ_ｉ ^（２）、新たな原始シンボルは、第１の原始シンボルと第２の原始シンボルをｃ_１、ｃ_２の合成比率で合成した点としたとき、当該新たな原始シンボルにおける分散σ＾_ｉ、平均μ＾_ｉを、
σ＾_ｉ＝ｃ_１σ_ｉ ^（１）＋ｃ_２σ_ｉ ^（２）
μ＾_ｉ＝ｃ_１μ_ｉ ^（１）＋ｃ_２μ_ｉ ^（２）
とする
ことを特徴とする請求項５乃至７のいずれか１項記載の動作データの生成装置。
原始シンボルがその隔たり量に基づいて投影されることで原始シンボル間の類似情報を保持する原始シンボル空間における２以上の原始シンボルから新たな原始シンボルを生成するシンボル生成工程と、
前記新たな原始シンボルの状態遷移確率及び出力確率から出力時系列パターンを生成するパターン生成工程とを有し、
前記原始シンボルは、隠れマルコフモデルを使用して状態遷移確率及び出力確率が算出された所定の動作に対応するものであり、
前記シンボル生成工程では、２以上の前記原始シンボルの状態遷移確率を速度に関する情報に変換して前記新たな原始シンボルの状態遷移確率を算出する動作データの生成方法。
前記生成工程では、前記状態遷移確率を、各ノードにおける滞在時間の期待値である期待滞在時間で表現し、当該期待滞在時間を合成することで新たな原始シンボルの状態遷移確率を算出する
ことを特徴とする請求項９記載の動作データの生成方法。
前記期待滞在時間は、Left-to-Rightモデルにおける速度の逆数である
ことを特徴とする請求項９又は１０記載の動作データの生成方法。
前記生成工程では、前記期待滞在時間ｓ_ｉを、自身のノードｉに遷移する確率をａ_ｉｉとしたとき、ｓ_ｉ＝１／（１−ａ_ｉｉ）で表す
ことを特徴とする請求項１０又は１１記載の動作データの生成方法。
前記生成工程では、原始シンボルを表す隠れマルコフモデルの示す出力確率を示すガウス分布の平均及び分散を合成することで新たな原始シンボルの出力確率を求める
ことを特徴とする請求項９乃至１２のいずれか１項記載の動作データの生成方法。
前記隠れマルコフモデルは、連続分布型隠れマルコフモデルを使用する
ことを特徴とする請求項９乃至１３のいずれか１項記載の動作データの生成方法。
前記隠れマルコフモデルは、混合数Ｎのガウス分布を混合数１のガウス分布に近似するか、又は混合数１の混合ガウス分布型隠れマルコフモデルを使用する
ことを特徴とする請求項１４記載の動作データの生成装置。
前記生成工程では、第１及び第２の原始シンボルにおける分散、平均をそれぞれσ_ｉ ^（１）、σ_ｉ ^（２）、μ_ｉ ^（１）、μ_ｉ ^（２）、新たな原始シンボルは、第１の原始シンボルと第２の原始シンボルをｃ_１、ｃ_２の合成比率で合成した点としたとき、当該新たな原始シンボルにおける分散σ＾_ｉ、平均μ＾_ｉを、
σ＾_ｉ＝ｃ_１σ_ｉ ^（１）＋ｃ_２σ_ｉ ^（２）
μ＾_ｉ＝ｃ_１μ_ｉ ^（１）＋ｃ_２μ_ｉ ^（２）
とする
ことを特徴とする請求項１３乃至１５のいずれか１項記載の動作データの生成方法。
所定の動作をコンピュータに実行させるためのプログラムであって、
原始シンボル空間における２以上の原始シンボルから新たな原始シンボルを生成するシンボル生成工程と、
前記新たな原始シンボルの状態遷移確率及び出力確率から出力時系列パターンを生成するパターン生成工程とを有し、
前記原始シンボルは、隠れマルコフモデルを使用して状態遷移確率及び出力確率が算出された所定の動作を示すものであり、
前記原始シンボル空間は、前記原始シンボルが、その隔たり量に基づいて射影されるものであり、当該原始シンボル間の類似情報を保持するものであって、
前記シンボル生成工程では、２以上の前記原始シンボルの状態遷移確率を速度に関する情報に変換して前記新たな原始シンボルの状態遷移確率を算出するプログラム。
自律的に動作を発現するロボット装置であって、
原始シンボルがその隔たり量に基づいて投影されることで原始シンボル間の類似情報を保持する原始シンボル空間における２以上の原始シンボルから新たな原始シンボルを生成するシンボル生成部と、
前記新たな原始シンボルの状態遷移確率及び出力確率から出力時系列パターンを生成するパターン生成部とを有し、
前記原始シンボルは、隠れマルコフモデルを使用して状態遷移確率及び出力確率が算出された所定の動作に対応するものであり、
前記シンボル生成部は、２以上の前記原始シンボルの状態遷移確率を速度に関する情報に変換して前記新たな原始シンボルの状態遷移確率を算出するロボット装置。