WO2005046942A1

WO2005046942A1 - ロボットの駆動方法

Info

Publication number: WO2005046942A1
Application number: PCT/JP2004/016968
Authority: WO
Inventors: Kiyoshi Hoshino; Takanobu Tanimoto
Original assignee: Japan Science And Technology Agency
Priority date: 2003-11-13
Filing date: 2004-11-15
Publication date: 2005-05-26
Also published as: JP5209751B2; JPWO2005046942A1; US7848850B2; GB0611135D0; GB2424723A; DE112004002219T5; JP2011131376A; JP4878842B2; US20070078564A1; DE112004002219B4; GB2424723B

Description

明細書

ロボットの駆動方法

技術分野

[0001] 本発明は、ロボットの駆動方法に関するものであり、特にロボットを動作させるためにそのロボットに対応する動作物またはその擬似物に所望の動作を行わせ、その動作物または疑似物の画像データと同じ動作をロボットに行わせるのに適したロボットの駆動方法に関するものである。

背景技術

[0002] 例えば、人の動作を見まねで再現できるロボットに関する技術としては、操作者がセンサを付けて歩行したときや、操作者が複数のセンサを備えたデータグローブを手に嵌めて手を動力したときに、それらのセンサから出力される情報に基いてロボットを駆動している。非特許文献 1及び非特許文献 2には、この種の技術が開示されている非特許文献 1 :Y. Kuniyoshi著の A robotic approach to the foundation of communication and symbols と題する餘文： Proc. of 12th World C ongress of Applied Linguistics (AILA' 99) , 94頁， 1999年発行

非特許文献 2 : T. Inamura, Y. Nakamura, H. Ezaki及び I. Toshima著の" Imit ation and primitive symbol acquisition of humanoids by the integr ated mimesis loop，，と題する論文： Pro c. of Intl. Conf. on Robotics an d Automation (ICRA 2001) , 4208頁— 4213頁， 2001年発行

発明の開示

発明が解決しょうとする課題

[0003] し力しながら、上記従来の技術では、多くの場合、不良設定性 (センサの出力または認識によって正確に判別できない動き）がほとんど存在せず、解が一意に決まり、比較的容易にロボットを駆動することができる。一方，不良設定性が存在するような問題に対しては、常にロボットに対応する動作物またはその擬似物にセンサを装着しておく必要があり、汎用性に欠ける問題がある。 [0004] 本発明の目的は、実際にロボットを駆動する際に、ロボットに対応する動作物またはその擬似物にセンサを装着しておく必要のないロボットの駆動方法を提供することにめる。

[0005] 本発明の他の目的は、動作画像データを入力データとしてロボットを駆動することを可能にするロボットの駆動方法を提供することにある。

[0006] 本発明の他の目的は、動作物またはその模擬物の形状が複雑であったり、画像上の自己遮蔽が頻繁に起こる場合でも、安定して高速にロボットを駆動することを可能にするロボットの駆動方法を提供することにある。

[0007] 本発明の更に他の目的は、コンピュータグラフィック画像データを利用してロボットを駆動することが可能なロボットの駆動方法を提供することにある。

[0008] 本発明の別の目的は、入力される動作画像データの特定精度を高めることができるロボットの駆動方法を提供することにある。

[0009] 本発明の他の目的は、入力された動作画像データと事前に記憶した多数の画像データとの照合を迅速に行うことができるロボットの駆動方法を提供することにある。

[0010] 本発明の更に他の目的は、見まね学習により不良設定性を解消してロボットを駆動する方法を提供することにある。

課題を解決するための手段

[0011] 本発明のロボットの駆動方法は、次のステップ従って、動作指令によりロボットを駆動する。まずロボットに対応する動作物またはその擬似物に所定の動作と同じ動作をさせたときの動作物またはその擬似物の複数の画像データと、これら複数の画像データに対応した動作指令を得るために事前に収集された事前収集動作指令とを対応付けて画像対応動作指令記憶手段に記憶する。事前収集動作指令を事前に収集するための方法は任意である。次に、ロボットを動作させるために、動作物またはその擬似物に所望の動作を行わせ、その際に動作物またはその擬似物の動作画像データを時系列でロボット動作用画像データとして取得する。そしてロボット動作用画像データに含まれる動作画像データに対応する画像データを、画像対応動作指令記憶手段に記憶して!/、る複数の画像データから時系列で特定し、特定した画像データに対応する事前収集動作指令を動作指令としてロボットに与える。なお画像対応動作指令記憶手段に記憶する画像データは、撮影した画像に基づ、て処理を行つて得たその画像に関する特徴を示す特徴量のデータを伴うものまたは特徴量のデータそのものであってもよいのは勿論である。そしてロボット動作用画像データに含まれる動作画像データに対応する画像データの特定方法は、任意である。画像データが特徴量のデータであれば、特徴量の類似度によって、動作画像データに対応する画像データの特定を行うことができる。

[0012] 本発明の方法により実際にロボットを動かすと、ロボットに対応する動作物またはその擬似物の画像を得るだけで、センサを使用することなぐその動作物または擬似物と同じ動作を、ロボットに行わせることができる。したがって本発明によれば、画像データを入力データとしてロボットを簡単に駆動することが可能になる。

[0013] なおロボット動作用画像データに含まれる画像データと画像対応動作指令記憶手段に記憶されている複数の画像データとの対応を、両者の類似度に基づいて判断することができる。その場合には、画像対応動作指令記憶手段に記憶している複数の画像データから動作画像データに対応する画像データを特定する際に、動作画像データの特徴量を基準にして照合用の複数の画像データを選択し、照合用の複数の画像データと動作画像データとの類似度に基づいて動作画像データに対応する画像を特定することが好まし、。

[0014] 本発明のより具体的な方法では、以下の第 1乃至第 5のステップを実行することによりロボットを駆動する。第 1のステップでは、ロボットに対応する動作物と、この動作物に設けられて動作物の動きを検出する複数のセンサと、これら複数のセンサの出力に基づいて動作指令を発生する動作指令発生装置とを用いる。そして動作物に所定の動作を行わせたときの複数のセンサの出力に基づいて動作指令発生装置が発生する動作指令を事前収集動作指令として記憶する。ここで動作物とは、典型的には人間全体または人間の手や足等の動作する部位等であるが、動作物は人間以外の動物等でもよい。

[0015] 第 2のステップでは、動作物に第 1のステップにおける所定の動作を行わせたときの動作物の複数の画像データを取得するか、または動作物またはその擬似物に前記所定の動作と同じ動作をさせたときの動作物またはその擬似物の複数の画像データを時系列で取得する。ここで「動作物またはその擬似物」における「動作物」とは第 1 のステップの動作物と同じものでもよいが、同様の形状及び構造を有し (言換えると、同じ場所に同じ関節があり）且つ同じ動作を行い得るものであれば別の動作物であつてもよい。また「動作物またはその擬似物」における「その擬似物」とは、その動作物をコンピュータグラフィック技術等の擬似物生成技術を用いて作成したものや、その動作物の人形等である。この場合に得る画像データは、疑似画像データである。特にコンピュータグラフィック技術を用いる場合の疑似物の画像データは、コンピュータグラフィック画像データである。複数の画像データを時系列で取得する方法または手法は、任意であり、単眼カメラ、両眼カメラ、あるいはマルチカメラのいずれにより撮影したものであってもよい。

[0016] 動作物が人間の手である場合、第 2のステップで、複数の画像データに、人間の手に現れる個人差を考慮した画像データを含めておくと、後述する第 5のステップにおける画像データの特定精度を高めることができる。ここで個人差が生じる相違要素には、拇指以外の 4指の基節位置の曲率、拇指基節の張り出し具合、隣り合う二本の指の開き具合、開いた二本の指の基準角度の違い、拇指の反り具合等がある。このような個人差は、コンピュータグラフィック技術等の擬似物生成技術を用いて画像データ (疑似画像データ)を作成する場合には、前述の相違要素をパラメータとして既に作成した基本となる画像データを変更することにより（骨の長さや関節の可動角度 t 、つたような、前述の相違要素を生み出して、るパラメータを変更することにより）簡単に得ることができる。したがって個人差を考慮した画像データの作成は、難しいものではなぐ簡単である。

[0017] また第 2のステップで作成する複数の画像データには、複数の画像データの解像度を変えて作成した複数の解像度変更画像データを含めてもょヽ。これは画像データの解像度を変えたほうが、画像の特徴が現れやすくなるものもあるからである。画像データの解像度は、基本となる画像データがあれば、簡単に変更することは可能でめる。

[0018] なお第 2のステップでは、複数のセンサを備えた動作物の表面を、複数のセンサを含めて被覆物によって覆い、第 1のステップと同時に動作物の複数の画像データを取得するようにしてもよい。被覆物によって動作物を覆うと、動作物の表面の不要な情報を物理的に取り去ることができる。したがって被覆物は、不要な情報をできるだけ排除できる構成を有して、るのが好ま、。そのためできるだけ無地（一色で無模様：不要な凹凸がな、もの)であることが好ま U、。このような被覆物で覆った動作物の画像データからは、その画像データに含まれる特徴 (特に輪郭についての特徴)を短い時間で、し力も高精度に取得することができる。

[0019] 第 3のステップでは、第 2のステップで得た複数の画像データに含まれる各画像データと事前収集動作指令とを対応付けて第 2のステップで得た複数の画像データと事前収集動作指令とを画像対応動作指令記憶手段に記憶する。なお第 3のステップでは、実際に撮影した画像だけでなぐ第 2のステップで取得した前の画像データと後の画像データとの間の未作成 (未撮影）の画像データをコンピュータグラフィック技術により作成したものも記憶の対象とすることができる。この場合には、未作成の画像データに対応する事前収集動作指令を、前の画像データに対応する事前収集動作指令と後の画像データに対応する事前収集動作指令とに基づいて推定により作成し、これを未作成の画像データと対応付けて記憶することができる。このようにすれば、少ない実際の画像データを用いて、より多くの画像データと事前収集動作指令との対応データを得ることができ、基礎データ (画像データと事前収集動作指令とを対応付けたデータ）の収集が大幅に簡単になる。

[0020] 第 4のステップでは、ロボットを動作させるために、動作物またはその擬似物に所望の動作を行わせ、その際に動作物またはその擬似物の動作画像データを時系列でロボット動作用画像データとして取得する。この場合に、動作物にセンサを装着する必要はない。そして第 5のステップでは、ロボット動作用画像データに含まれる動作画像データに対応する画像データを画像対応動作指令記憶手段に記憶している複数の画像データ (基礎データ)から時系列で特定する。なおロボット動作用画像データに含まれる動作画像データと画像対応動作指令記憶手段に記憶されている複数の画像データとの対応は、両者の類似度に基づいて判断することが好ましい。類似度の求め方は任意であり、特定の方法に限定されるものではない。そして第 5のステップでは、特定した画像データに対応する事前収集動作指令を動作指令としてロボットに与える。

[0021] なお人間型ロボットにおいて不良設定性が多いのは、手である。したがってロボットハンドの駆動に本発明を適用すると、従来よりも簡単にロボットハンドを駆動することができる。なおこの場合、動作物としては人間の手またはその擬似物が用いられることになる。そして第 1のステップでは、人間の手に装着するデータグローブを用いる。このデータグローブは、グローブ本体にロボットの手の動作部に対応した人間の手の動作部の動きを検出する位置に複数のセンサが装着された構造を有している。

[0022] 基礎データとなる画像データが多くなるほど（画像データベースのデータ量が多くなるほど）、基礎データとなる画像データの中から、入力である動作画像データに対応した画像データを特定するには時間が力かるようになる。そこでこのような問題を解消するためには、第 3のステップで、画像データと事前収集動作指令とを対応付けて画像対応動作指令記憶手段に記憶する際に、次のようにすることができる。まず複数の画像データのそれぞれの特徴量を個々に演算する（特徴量ステップ)。次に複数の画像データのそれぞれの特徴量を主成分分析して、複数の画像データのそれぞれについて主成分ごとの主成分得点を演算し、且つ累積寄与率に基づいて第 1主成分力ゝら第 k主成分までの主成分の数を決定する（主成分決定ステップ)。そして第 1 主成分から第 k主成分までの各主成分ごとに、複数の画像データを主成分得点の大きさを基準にして並べ替えて得た k種類の画像データソース [画像情報の表 (テープル) ]を作成して記憶する（記憶ステップ)。すなわち例えば、 15, 000枚分の画像データがあるとした場合に、 10種類の主成分を決定したとすると、 15, 000枚分の画像データを 10種類の主成分ごとに、その主成分得点の大きさを基準にして並べ替えた 10種類の画像データソース（15, 000 X 10= 150, 000枚分画像データに相当）として記憶する。画像データソース内の並べ変えた各画像データは、それぞれ事前収集動作指令と対応付けられて記憶されている。このようにした場合には、第 5ステップで、入力された動作画像データについても主成分得点を求め、この主成分得点を基準にして k種類の画像データソースカゝら照合用の複数の画像データをそれぞれ選出する。動作画像データの解像度を変えた複数種類の解像度の異なる動作画像データを作り、この複数種類の解像度の異なる動作画像データにっヽて主成分得点を求め、この主成分得点を基準にして k種類の画像データソース力も照合用の複数の画像データをそれぞれ選出するようにしてもよい。この照合用の複数の画像データは、各画像データソース力ゝら各主成分ごとの主成分得点を基準にして所定枚数分ずつ選出される。このようにすると記憶されているすべての画像データと動作画像データとを照合する場合と比べて、照合対象となる画像データの数を少なくすることができるので、照合時間が短くてすむ利点が得られる。そして主成分得点を基準にして動作画像データと照合用の複数の画像データの類似度を判定し、前記類似度に基づいて動作画像データに対応する画像データを特定するようにしてもよい。このように解像度の異なる動作画像データを作成してそれらの因子負荷量も利用して類似度の判定を行うと、画像の特定精度を上げることができる。

[0023] なお第 1のステップは事前に行う作業であるため、第 1のステップを切り離して、ロボットを駆動する装置に用いられる駆動方法においては、第 2乃至第 5のステップだけを用いてロボットを駆動することができるのは当然である。

図面の簡単な説明

[0024] [図 1]発明者等が開発した本実施の形態で制御の対象とする公知の多指ロボットハンド 1の平面図である。

[図 2]図 1のロボットハンドの内部に配置されたァクチユエータの配置構成を示す図でめる。

[図 3]サイン波入力に対する追従性能を示す図である。

[図 4]サイン FM変調波入力に対する追従性能を示す図である。

[図 5]遠隔指令装置として使用するデータグローブの一例の概略構成を示す図である。

[図 6]多指ロボットハンドの制御装置及び本発明の駆動方法を実施する装置の一例の概略構成を示す図である。

[図 7]図 6の対応関係決定手段の主要部をコンピュータを用いて実現する場合に用いるソフトウェアのアルゴリズムを示すフローチャートである。

[図 8]第 1乃至第 3のステップをコンピュータを用いて実現する場合に用いるソフトゥェァのァノレゴリズムを示す図である。圆 9]第 1乃至第 3のステップを説明するたに用いる図である。

[図 10]第 4及び第 5のステップをコンピュータを用いて実現する場合に用いるソフトゥエアのアルゴリズムを示す図である。

[図 11]高次局所自己相関特徴のための局所パターンの例を示す図である。

[図 12] (A)乃至 (C)は、人の手に現れる個人差の相違要素を示している。

[図 13]コンピュータグラフィック編集ソフトのパラメータを変えて、基節位置の曲率と拇指基節の張り出し具合を変えた場合の画像データの相違を示す図である。

[図 14]解像度を変えた 3種類の画像データを示す図である。

[図 15] (A)及び（B)は、 320 X 240画素から構成された 1画面を 4 X 4画面に分割した状態と、 8 X 8画面に分割した状態を示す図である。

[図 16]画像データを並べ替えたイメージを示す図である。

[図 17]画像データのデータベース作成の手順を示すフローチャートである。

[図 18]具体的な照合手順の流れを示すフローチャートである。

圆 19]本発明の方法の別の実施の形態を説明するために用いる概念図である。

[図 20]データベースを作成するためのアルゴリズムを示すフローチャートである。

[図 21]図 20のアルゴリズムの詳細を示すフローチャートである。

圆 22]輪郭抽出した画像データを示す図である。

[図 23]データベース作成に使用する高次局所自己相関特徴のための局所パターンの例を示す図である。

[図 24]特徴量の抽出を説明するために用いる図である。

[図 25]動作画像データに対応する画像データをデータベースに記憶した画像データ力選ぶ際のアルゴリズムを示すフローチャートである。

[図 26]図 25のアルゴリズムの詳細を示すフローチャートである。

[図 27]クラスタリングを説明するために用いる図である。

発明を実施するための最良の形態

[0025] 以下図面を参照して本発明の方法の実施の形態について説明する。

[0026] なお実施の形態について説明する前に、本実施の形態で用いる技術の基礎について説明する。なお実施の形態について説明する前に、本実施の形態で用いる技術の基礎について説明する。両眼あるいは単眼カメラによるヒト手指の 3次元形状を推定する場合には、手指の形状が複雑で、しかも自己遮蔽も多ぐ形状の認識における不良設定性が存在する。そのため、赤外線レンジセンサや複数台のコンピュータを用いた並列計算装置といった周辺機器類を使用しない限り、高速で且つ高精度に推定することはできない（参考文献： E. Ueda, Y. Matsumoto, M. Imai and T.

Ogasawara: 'Hand pose estimation using multi-viewpoint silhouette images, Proc. 2001 IEEE/RSJ Intl. Conf. on Intelligent Robots and Systems (IROS'2001), pp.1989- 1996, 2001。 M. H. Jeong, Y. Kuno, N. Shimada and Y. Shirai: "Recognition of shape-changing hand gestures, IEICE Transactions Division D, E85— D, 10, pp.1678— 1687, 2002。 N. Shimada, K. Kimura, Y. Kuno and Y. Shirai: "3-D hand posture estimation by indexing monocular silhouette images, Proc. 6th Workshop on Frontier of Computer Vision, pp.150- 155, 2000)。一方、ヒト型のロボット等の上肢制御には、少なくとも軌道選択、関節角度の組み合わせ、筋張力の組み合わせなどの不良設定問題があることが知られている（Y. Uno, K. Kawato及び R. Suzuki 著の Formation and control of optimal trajectory in human multijoi nt arm movement— minimum torque— change model'，と題する餘文： Biolo gical Cybernetics, 61, pp. 89—101, 1989.；)。ところ力両方の不良設定'性を、人は巧く解決して、複雑精緻な随意運動を実現している。経験則力も言えば、自分自身の身体での運動経験、すなわち身体性 (R. Pfeifer, "Dynamics, morpholog y, and materials in the emergence of cognition, in Advances m A rtificial Intelligence, ed. W. Burgard, A. B. Cremers, and T. Christalle r, Proc. KI— 99, 23th Annual German Conference on Artificial Intelli gence, 1999. )の存在力認識における不良設定問題の重要な解決になっていると言うことちでさる。

そこで、発明者らは、認識と制御の両方における不良設定問題を同時に解決できる非常に有効な、場合によっては唯一の方法が、見まね学習であると考えて、人と同じょうな精度と処理速度で手指動作の再現が可能なロボットノヽンド 'システムの開発を行った。 [0028] 以下、このシステムに基づいて本発明のロボットの駆動方法の実施の形態の幾つ力の例を説明する。

[0029] まず本実施の形態で用いる多指ロボットハンド（ロボット）の機構につ!、て説明する。

図 1は、発明者等が開発した本実施の形態で制御の対象とする公知の多指ロボットハンド 1の平面図であり、図 2は図 1のロボットハンドの内部に配置されたァクチユエ一タ 2 (エンコーダ内蔵型超小形モータ）の配置構成を示す図である。なおこの多指口ボットハンドの詳細は、特開 2003— 117873号公報に示されている。この多指ロボットハンド 1の各関節の可動範囲は、親指の内外旋が 120° であり、内外転が 60° である。そして各 5本指の屈曲、伸展は第 2関節に連動して行われ、第 2関節の可動範囲は 112° であり、第 1関節は第 2関節の可動範囲の 7Z10倍、第 3関節は第 2関節の可動範囲の 5Z7倍となっている。指の開閉は薬指に連動して、人指し指、小指が動き、中指は動力ない。また薬指の開閉可動範囲は 15° であり、人指し指は 13° であり、小指は 31° である。これらの構成によって、拇指と小指の接触が可能になり人の手指の可動域を十分に実現できて、る。

[0030] 各関節のァクチユエータ 2には、 DCマイクロモータを使用している。各指の第 2関節、拇指の内外旋、内外転部位と拇指以外の 4指間の開閉（アブダクシヨン)用に掌の内部にそれぞれァクチユエータ 2が設置されている。各関節の制御は、図示しない制御用計算機からの指令を受けて動作し、内部に DZAコンバータや、小型サーボモータ専用ドライバー（マイクロサーボ）が配置された駆動装置 3を介して、各ァクチュエータ 2のモータにかける電圧を変化させることで行う。各ァクチユエータ 2のモータには、インクリメンタルシャフトエンコーダが内蔵されている。このエンコーダの出力は、軸速度、回転方向の検出の他に、位置制御に使用できる。各関節の角度情報は、ギヤを介して分解能を挙げたエンコーダを介して図示しない制御用計算機にフィードバックされる機構を持って、る。エンコーダ自体の分解能は 16 [PulseZRevolution ]である。指の開閉部のエンコーダには減速比 1Z400のギアが設けられており、換算分解能は 6400 [PulseZRevolution]となる。その他のエンコーダには減速比 1 Z50のギアを設けており、換算分解能は 800 [PulseZRevolution]となる。

[0031] PID制御等を用いて、サイン波、 FM変調波の時系列角度変化指令を入力したときの追従結果を図 3及び図 4に示す。図 3はサイン波入力に対する追従性能を示し、図 4はサイン FM変調波入力に対する追従性能を示す。これらの結果から、ゆっくりとした動作力比較的早い動作、変調波に対しても良好な追従特性が得られることが分かる。

[0032] 図 5は、遠隔指令装置として使用するデータグローブ 4の一例の概略構成を示す図である。このデータグローブ 4には、手袋形の本体の関節部分を中心にして約 16箇所の位置に分散して位置センサが備えられた構成を有している。具体的には、 Virtu al technologies社製の cyberglove (商標）をデータグローブとして用いて、る。このデータグローブのセンサ 5は、拇指を除く各指の MP (中手指節関節）， PIP (近位指節間関節）に一つずつ、拇指には MP、 PIP, DIP (遠位節間関節）についており、また各指の間にあるアブダクシヨンを計測するセンサと掌の中央のセンサとで計 16ケ所に設置されている各センサ 5はそれぞれ歪曲（ひずみ)度を数値ィ匕して 30— 40Hz で出力する仕様を有して、る。掌の中央に設置されて、るセンサ 5は掌全体の歪曲度を計測するものであり、対する人型ロボットハンドにはその機構は備わっていないため、この実施の形態では、この中央のセンサ 5は使用しない。

[0033] 人の手指動作を操作者が手に装着したデータグローブによりデータ化し、これを計算機に取り込んで多指型ロボットハンドの制御指令値に変換すれば、データグロ一ブを装着した操作者の手の動作と同様の動作をロボットハンドで実現させることができる。

[0034] データグローブによるロボットハンドの制御法において、一つの簡単な方法としては、サイバーグローブから出力されるデータを 3次元座標位置に変換しロボットハンドの関節と対になる部分の角度情報を時系列で取り出し、それをロボットハンドに実行させて、ロボットハンドを動作させるという手段がある。しかし、この方法を用いるとデータグローブの各センサから出力される 16個の値がそれぞれ各関節の X座標、 Y座標、 Z座標、ピッチ角、ョ一角、ロール角に変換され、一単位時刻あたり 100ものデータが生成されることとなり、これからロボットノヽンドの動作に必要な 8関節分のデータを抽出して使用することは計算効率や時間効率を考える面からも最適ではない。

[0035] 人の手指は拇指を除く四指に至って、他の四指の影響を少な力もず受ける。その特徴を定量的に表すこともこの制御方法及び装置において重要であると考える。そこでデータグローブで得られるデータ力ロボットハンド制御用の指令値への変換式に本発明の実施の形態では、重回帰式を用いる。

[0036] ロボットハンドの各関節に対し重回帰式、すなわちすべてのデータグローブからの出力の重み付き線形和によりそれぞれのロボットノヽンドの関節を記述するためには、まず重回帰分析を行い偏回帰係数を求める必要がある。そこで重回帰分析用のデータを取得するためにデータグローブ装着者は予め定めた時系列関節角度パターンに従って関節角度指令値を駆動装置 3に入力して、ロボットハンドを動作させる。なお駆動装置 3に指令を与える制御装置は、ロボットハンド 1にあら力じめ重回帰分析に有効な動作を行わせる予め定めた時系列関節角度パターンの関節角度指令値を記憶している。そしてこのロボットハンドの動作に従い即ち倣って、データグローブを装着した操作者には、データグローブを装着した手において、指の屈伸、アブダクシヨン等の動作を事前に行ってもらう。本発明では、このようにして計測したデータグローブ 4の出力と計測に用いたロボットノ、ンドの時系列関節角度パターンとを重回帰分析にかけ、各関節ごとの偏回帰係数を導き出す。下記の式は本実施の形態で用いる重回帰式である。

[数 1]

[0037] ここで、目的変数 Θ iはロボットハンド 1での制御対象となる関節各度の指令値、説明変数 X はデータグローブ 4力ゝらの出力値、 a は偏回帰係数、 a は残差である。こ m in On の重回帰式で出される値はデータグローブ 4での各指の関節角度の値であるので、この値をロボットノヽンドの角度指令値として制御を行えばよいことになる。

[0038] 図 6には、事前収集動作指令を得る際に用いる多指ロボットハンドの制御装置と本発明のロボットの駆動方法を用いてロボットハンドを駆動する装置の構成の一例の概略構成を示してある。図 6に示した動作指令を事前に収集する際に用いる制御装置では、関節角度を指示する関節角度指令値 yに応じて動作するァクチユエ一タを備えた k個（kは正の整数)の関節を有する多指ロボットノ、ンド 1を制御するものとする。そしてデータグローブ 4は、操作者の手に装着されて操作者の手の動きに応じて n個 (nは正の整数)の出力信号 xnを出力する遠隔指令装置を構成している。この多指口ボットハンドの制御装置は、対応関係決定手段 6と制御信号発生手段 7とを備えて、る。対応関係決定手段 6は、 k個の関節のための k個の関節角度指令値 yそれぞれについて、各関節角度指令値 yと n個の出力信号 xnとの間の対応関係を予め定めるように構成されている。具体的には、対応関係決定手段 6は、時系列関節角度パターン記憶手段 61と、サンプリング手段 62と、偏回帰係数導出手段 63と、重回帰式決定手段 64とを備えている。

[0039] サンプリング手段 63は、 k個の関節（実際にはァクチユエータ 2)にそれぞれ予め定めた時系列関節角度パターン記憶手段 61に記憶した時系列関節角度パターンに従つて関節角度指令値を入力して多指ロボットハンド 1を動作させた状態において、多指ロボットハンド 1の動きに倣うように操作者がデータグローブ 4を操作したときに n個の出力信号 xnを時系列で m回（mは nより大きい正の整数)サンプリングする。サンプリング手段 62はサンプリングを開始する前に時系列関節角度パターン記憶手段 61 に指令を与え、時系列関節角度パターン記憶手段 61は駆動装置 3に予め定めた関節角度指令値を出力する。なお時系列関節角度パターンは、 N次元空間をまんべんなく動くような任意の関数指令を多指ロボットハンドの関節（ァクチユエータ）に与えるように構成するのが好ましい。駆動手段 3は、これを受けて多指ロボットハンド 1を動作させる。

[0040] 偏回帰係数導出手段 63は、時系列関節角度パターン記憶手段 61に記憶した時系列関節角度パターンと、サンプリング手段 62から出力される m回のサンプリングにより求めた m組の n個の出力信号 xnとに基づいて重回帰分析を行い、 k個の関節のそれぞれにつ！/ヽて偏回帰係数を導出する。

[0041] 重回帰式決定手段 64、偏回帰係数導出手段 63が定めた k個の関節毎の偏回帰係数を用いて、 k個の関節毎の関節角度指令値 yと n個の出力信号 xnとの間の対応関係を定める k個の重回帰式を決定する。

[0042] そして制御信号発生手段 7は、対応関係決定手段 6の重回帰式決定手段 64が求めた対応関係と n個の出力信号 xnとに基づいて、 k個の関節角度指令値 yを求め、 k 個の関節角度指令値 yを示す制御信号 (動作指令)を多指ロボットハンドの k個の関節を駆動するための駆動装置 3に出力するように構成されている。この制御信号発生手段 7は、重回帰式決定手段 64が求めた k個の重回帰式を対応関係として用い、 n 個の出力信号 xnを入力として k個の関節角度指令値 yを求める。これら k個の関節角度指令値 yが動作指令となる。なおデータグローブ 4の動きに応じて制御指令発生手段 7からは処理速度に応じた時間間隔で動作指令が出力される。なお図 6の例においては、対応関係決定手段 6及び制御信号発生手段 7により動作物 (操作者の手）に所定の動作を行わせたときの複数のセンサの出力に基づ、て動作指令を発生する動作指令発生装置が構成されて!ヽる。

[0043] 重回帰式決定手段 64で決定するデータグローブ 4の出力と多指ロボットハンド 1の関節角度との対応を示す重回帰式は以下のようの形で記述することもできる。

[数 2]

HANDi = ao[n] + ∑ ai [n] · GLOVEi [n]

[0044] 上記式において HANDは、多指ロボットハンド関節値， aは偏回帰係数， GLOVE

[n]は n自由度のデータグローブ出力、 iは多指ロボットハンドの関節数である。なお上記式を用いる場合には、行が列より大きくなり優決定となる。そのため特異値分解を用いて最適解としての偏回帰係数を求めることが好まし、。

[0045] 図 7は、図 6の対応関係決定手段 6の主要部をコンピュータを用いて実現する場合に用いるソフトウェアのアルゴリズムを示すフローチャートである。まずステップ ST1では、データグローブ 4と時系列関節角度パターンのデータ対を獲得する。即ち多指口ボットノ、ンド 1の各関節可動域をまんべんなく動かすような関数を多指ロボットノ、ンド 1 に与えて駆動し、多指ロボットハンド 1に合わせて操作者の手指も同じ動作を行う。多指ロボットハンド 1のある関節角度または関節角度指令値^ yとし、 n個のデータグローブ出力を Xnとすると，次式のように時刻 1一 mまでの時系列データが得られる。

[数 3] y! = xjan + ₂aj2 + · · · + x_na_ln

y₂二 Xia₂l + 2¾22 + · · · + Xn¾2n

y_m = Xia_mi + X2¾m2 + mn

[0046] ただし上記式において、 m>nである。また前提として、 xにはシステム雑音，量子化誤差などの雑音が含まれるものとする。

[0047] 次にステップ ST2進んで、データ対をベクトルと行列の形式で表現すると、 y= [H]

Xのように表現することができる。ただしこの式における y、 X及び [H]は下記の通りでめる。

[数 4]

[0048] 次にステップ ST3で、最小二乗法による解 x—の推定を開始する。この推定の過程において、偏回帰係数が求められる。最小二乗法に用いる式は以下の式である。

[数 5]

[0049] 次にステップ ST4から、ヤコビ法による（[H] t[H])の計算を開始する。すなわち直交行列 Pを使って（[ΗΓ[Η]) (= [A])を簡単な形の類似行列 [B]に変換する。言い換えれば、すなわち， [ΡΓ ^A] [P] = [B]を計算する。

[0050] 次にステップ ST5で、行列 [A]の非対角要素のうちの絶対値最大のもの a ( = a )

kl lk を選ぶ。そして次にステップ ST6において、 a =a =cos θ , a = -sin Θ、 a = sin

kk U kl lk

Θとする単位行列 [P]を作る。

[0051] 次にステップ ST7へと進んで cと Θの値を決定する。 Θは、下記の行列により求める

[数 6]

Θ 二

[0052] ただし、上記式において k<lである。

[0053] 次にステップ ST8へと進んで、 [P]t[A] [P]を計算して新ヽ [A]とする。次にステップ ST9で、行列 [P]の積から固有ベクトル Vを下記の式で求める。

[数 7]

V = [p]t(_m) [ρ] " ' · · [Ρ]^ι(2) [Ρ] ο)

[0054] ただし、上記式において [P]t は N回目の変換に用いた行列 [P]である。

(N)

[0055] 次にステップ ST10へと進み、 [A]のどの非対角要素も収束条件 <0. 0001なら終了し、そうでなければステップ ST5へと戻る。ここで行列 [B]の対角要素が固有値となる。

[0056] 次にステップ ST11へと進んで解に含まれる雑音を抑制する。ステップ ST12では、固有値（λ , λ ,…え）を（ΐΖ(λ + ν), 1/(λ + ν),

1 2 η +υ))と置き

1 2 η

換えて逆行列（ [Η] ¹ [Η] ) ¹を求める。ただし（ [H] ¹ [Η] )— ¹ = [U] [A]— ¹ [U] ¹である。またベクトル uは [Η [Η]の固有ベクトルである。また [U] = [u , u , ---u ]である。

i 1 2 N

更に [A]—¹は下記のように表される。

[数 8]

[0057] ただし υ = σ である。ここで、雑音成分 η— ¾y= [H]xの右辺に加え、 n—

=y-[H]x と変形することで σ ² を計算することができる。また σ ² は yから直接、計算が可能である。そしてステップ ST13で最小二乗法による解 X—の推定を終了する

[0058] 上記フローチャートのアルゴリズムに従えば、偏回帰係数を導出するために最小二乗法と特異値分解とを用いて重回帰分析を行うことになる。なお上記ステップ ST4— ST10までが特異値分解を実施しているステップである。

[0059] 図 6と図 8乃至図 10を用いて、本発明の方法によりロボットハンドを駆動する実施の形態の一例の説明をする。本発明の実施の形態の第 1のステップでは、事前収集動作指令記憶装置 8が、データグローブ 4を嵌めた手 (動作物）に所定の動作を行わせたときのデータグローブ 4の複数のセンサ 5の出力に基づ、て動作指令発生装置（6 , 7)が発生する動作指令を事前収集動作指令として記憶する。この記憶動作をコンピュータを用いて実現する場合に用いるソフトウェアのアルゴリズムを図 8に示す。

[0060] 第 2のステップでは、図 9に示すように、単眼カメラまたは両眼カメラ等力なるカメラ 9によりデータグローブ 4を手に装着して事前収集動作指令を取得するときと同じ動作 (所定の動作)を人の手 Hで行う。そしてこのときの手 (動作物) Hの画像データを時系列で取得する。なおこの画像データの取得は、事前収集動作指令を取得するのと同時に行ってもよいが、後力行ってもよい。図 9の例では、手 Hで「グー」の形を作った状態の画像データをとり、この画像データに基づ、てコンピュータグラフィック技術で手の擬似物の画像データ PD1を作成する。そして手 Hで「パー」の形を作つた状態の画像データをとり、この画像データに基づ、てコンピュータグラフィック技術で手の擬似物の画像データ PDnを作成する。「グー」から「パー」まで変化するまでの間の過程の画像を実際に撮影してもよいが、図 9のようにその間の画像をコンビユータグラフィック技術で作成してもよい。このようにして作成した画像データは、画像データ記憶装置 10に記憶される。

[0061] 第 3のステップでは、第 2のステップで得た複数の画像データに含まれる各画像データと事前収集動作指令記憶装置 8に記憶された事前収集動作指令とを対応付けて画像対応動作指令記憶手段 11に記憶する。なお本例では、画像対応動作指令記憶手段 11は、実際に撮影した画像だけでなぐ時系列で取得した前の画像データ PD1と後の画像データ PDnとの間の未作成の画像データをコンピュータグラフィック技術により作成する場合には、作成した画像データに対応する事前収集動作指令を前の画像データ PD1に対応する事前収集動作指令と後の画像データ PDnに対応する事前収集動作指令とに基づいて推定により作成して未作成の画像データと対応付けて記憶することができる。このようにすれば、少ない画像データによりより多くの画像データと事前収集動作指令との対応データを得ることができ、基礎データ (画像データと事前収集動作指令とを対応付けたデータ)の収集が大幅に簡単になる。

[0062] 第 1から第 3までのステップは、ロボットノヽンドを駆動するための事前作業として実施される。なお自由度ごとに 5度刻みの精度の関節角度制御をロボットハンドの駆動において実現しょうとすると、 1億個（20の 7乗)程度の数の画像が必要となる力上述のようにコンピュータグラフィック技術を用いれば、基礎データの収集は簡単になる。この場合に用いることができる CG編集ソフトウェアとしては「Poser 5 (Curious Labs Incorporated製）」を使用することができる。このソフトウェアを用いれば、データグロ一ブ出力から得られた関節データから、撮像した手指 2次元画像と類似した理想的な手指 CG画像を補間生成することができる。そして補間生成した画像データに対応する事前収集動作指令は、関節角度の線形補間により生成することができる。なお、画像 1枚あたりの手指 CGのファイルサイズは 5kB程度である。

[0063] 第 4のステップ及び第 5のステップは、実際にロボットハンドを駆動する際のステップである。第 4のステップでは、ロボットノヽンドを動作させるために、手で所望の動作を行い。図 6に示すように、その際の手の画像データをカメラ 12を用いて時系列でロボット動作用画像データとして取得する。このロボット動作用画像データ (動作画像データ）は、ロボット動作用画像データ記憶装置 13に記憶される。そして第 5のステップでは、ロボット動作用画像データに含まれる動作画像データに対応する画像データを画像対応動作指令記憶手段 11に記憶して、る複数の画像データ力時系列で特定する。この特定作業は、画像データ特定及び動作指令発生装置 14で行う。この例では、ロボット動作用画像データに含まれる動作画像データと画像対応動作指令記憶手段に記憶されている複数の画像データとの対応は、両者の類似度に基づいて判断する。類似度の求め方は任意である。そして第 5のステップでは、特定した画像データに対応する事前収集動作指令を動作指令として駆動装置 3に与え、駆動装置 3の出力で多指ロボットハンドを駆動する。第 4及び第 5のステップの主要部をコンビユータ用いて実現する場合のソフトウェアのアルゴリズムは図 10に示す通りである。

[0064] 画像データ特定及び動作指令発生装置 14で行う画像データの特定の際に特徴量を抽出する技術として、例えば、高次局所自己相関関数を用いる特徴量抽出技術を禾 IJ用することができる。高次局所自己相関関数については、 1993年発行の電総研研究報告， j957の 126頁乃至 140に「柔らかな情報処理のための統計的手法の応用に関する研究」と題する論文に詳しく説明されている。手指 2次元画像の特徴抽出には，高次局所自己相関関数を用いた。画面内の対象画像を f (r)とすると、 N次自己相関関数は変位方向（al, a2, —an)に対して次式のように定義される。

[数 9] x^N aい α₂ , · ' α_Ν ) =

[0065] 実証試験では、高次自己相関係数の次数 Nを 2とし、また変位方向を参照点 rの周りの局所的な 3 X 3画素の領域に限定した。これより、平行移動による等価な特徴を除くと特徴 Mの数は図 11に示す 25個になる。図 11中の黒の四角は、局所パターンの対応する画素の位置に対応する。各特徴の計算は、局所パターンの対応する画素の値の積を全画素に対して足し合わせることで得られる。

[0066] 上記の方法によれば、実際にロボットノ、ンド 1を動かすために、ロボットノ、ンド 1に対応する手の画像を得るだけで、センサを使用することなぐ手の動きと同じ動作を、見まねにより不良設定性を解消してロボットノヽンドに動作させることができる。

[0067] 上記実施の形態では、第 3のステップで実際に人の手の画像を撮影して、るが、すベてコンピュータグラフィック技術により手の画像データ（手の擬似物の画像データ）を作成してもよ!/、のは勿論である。

[0068] 次に上記実施の形態を改善または改良する手法について詳しく説明する。

[0069] [個人差の考慮]

まず前述の第 2のステップにおいて、複数の画像データ（コンピュータグラフィックの画像データに、人間の手に現れる個人差を考慮した画像データを含めておくと、第 5 のステップにおける画像データの特定精度を高めることができる。図 12 (A)乃至 (C) は、人の手に現れる個人差の相違要素を示している。図 12 (A)は手をグーの形に握つた状態を示している。拇指以外の 4指の基節位置の曲率に個人差が現れる。すなわち 4指の基節位置が直線的になる手もあれば、湾曲した形状になる手もある。また拇指基節の張り出し具合にも顕著な個人差が現れる。これらの個人差は、 2つの関節間の長さの相違によって生じる。また図 12 (B)は手をチヨキの形にした場合の状態を示している。この状態においては、二本の指の開き具合と開いた二本の指の基準角度の違いに個人差が現れる。更に図 12 (C)は手をパーの形に開いた状態を示している。この状態では、拇指と人差し指との間の開き具合と拇指の反り具合に個人差が大きく現れる。このような個人差は、コンピュータグラフィック技術を用いて手の形の画像データ (疑似画像データ)を作成する場合に、相違要素をパラメータとして既に作成した基本となる画像データを変更することにより簡単に得ることができる。図 13は、コンピュータグラフィック編集ソフトのパラメータを変えて、基節位置の曲率と拇指基節の張り出し具合を変えた場合の画像データの相違を示す図である。この 2つの相違要素を変更するだけでも、かなり異なった個人差の画像データを得ることができる。なおこれらの画像データを作成する際に、新たに作成する未作成の画像データに対応する事前収集動作指令を、前の画像データに対応する事前収集動作指令と後の画像データに対応する事前収集動作指令とに基づいて推定により作成し、これを未作成の画像データと対応付けて記憶することができるのは勿論である。 [0070] [解像度の変更]

次に第 2のステップで作成する複数の画像データには、複数の画像データの解像度を変えて作成した複数の解像度変更画像データを含めてもょヽ。これは画像データの解像度を変えたほうが、画像の特徴が現れやすくなるものもあるからである。画像データの解像度は、基本となる画像データがあれば、簡単に変更することは可能である。図 14は解像度を変えた 3種類の画像データを示している。左端の画像は、原画像であり、中央の画像は、縦 2画素 X横 2画素を 1画素にして解像度を下げた状態の画像であり、右端の画像は、縦 4画素 X横 4画素を 1画素として更に解像度を下げた画像である。例えば、原画像が 15, 000枚あるとすると、解像度を 2段階変更することにより、 45, 000種類の画像データが得られることになる。手をグーの形に握っている状態では、指が重なり合うため、解像度が高いほうが特徴量を正確に把握することができる。しかし手をチヨキの形にしている状態では、立っている二本の指の部分から得られる画像の特徴量が重要である力その他の部分の特徴量はかえつて誤った判断をする原因となる。そこで解像度の異なる画像データを予め基礎データとして用意しておけば、照合の精度は高くなる。

[0071] [各画像データにおける特徴量の計算]

先に、画像データの特定のために、高次局所自己相関関数を用いる特徴量抽出技術を用いる点について説明した。従来の技術では、画像全体について特徴量を抽出しているが、精度を高めるために画像をいくつかの分割画像に分けて分割画像単位で特徴量を抽出することが好ましい。これを実現するためには、まず画像データにおける手の重心を推定する。そのためには、コンピュータグラフィックの画像データをニ値ィ匕して、白黒画像とする。そしてこの白黒画像について、下記式を用いて X軸方向、 Y軸方向のそれぞれで中心を求める。

[数 10]

y ,

κ ί二 I

[0072] 上記式においては、 xg、 ygは重心の X、 Y座標であり、 xi, yiは白画素の X、 Y座標であり、 kは白画素の数である。

[0073] このようにして画像の中心を求めた後は、この重心をもとに各画像を画面分割する。図 15 (A)及び（B)は、 320 X 240画素から構成された 1画面を 4 X 4画面に分割した状態と、 8 X 8画面に分割した状態を示している。なお上記画素数であれば、 16 X 16画面に分割することも可能である。

[0074] このようにして分割した各分割画像について、特徴量の計算を行う。即ち画面分割ごとの高次局所自己相関パターンを算出する。先に説明した高次局所自己相関バターンの求め方に従って画面分割ごとの高次局所自己相関パターンを算出すればよい。下記の式は高次局所自己相関パターンの算出に用いる式である。

[数 11]

[0075] 上記式において、 χ ¾Ν次元の参照点 rの周りの局所的な相関関数である。したがつて Nは 2である。（al, a2, - 'an)は、 N次自己相関関数の変位方向であり、 f (r)は画面内の対象画像の画素位置 rの輝度値である。図 12に示した局所パターンを用 Vヽれば 25パターンとなる力重複を認めれば 35パターンを使用してもよい。

[0076] [特徴量低減]

上記のように特徴量を計算した場合、画像データが多くなると処理すべき特徴量が多く

なりすぎる。例えば、図 14に示したように 3つの解像度の画像データを利用する場合の特徴量は、特徴量 =解像度 3 X画面分割 64 X高次局所自己相関パターン 25 =4 800 (次元）となる。そこで公知の主成分分析技術を利用して特徴量を低減することが好ましい。まず主成分分析による各主成分ごとの因子負荷量を算出する必要がある。下記の式は、主成分分析で用いる主成分得点の演算式である。

[数 12] div pnum 25

^∑kp — , / ^ , ^a kl誦 ^X phnn

[0077] 上記式において、

Zkpは第 k主成分におけるデータ pの主成分得点であり、

X はデータ pの第 1解像度 (1はアルファベットの Lの小文字)の第 m画面の第 n特徴 pimn

量であり、

a は第 k主成分の第 1解像度の第 m画面の第 n特徴量の因子負荷量であり、 klmn

divは解像度の数 (たとえば 3)で有り、 pnumは画面分割数 (たとえば 8 X 8)である。

[0078] ここで因子負荷量 a を算出して上記式に代入すれば、第 k主成分におけるデー

klmn

タ Pの主成分得点を求めることができる。なお因子負荷量 a の

klmn 求め方には、主因子法、最小 2乗法、最尤法などがある。主因子法で因子負荷量を求める場合には、次のようににする。

[0079] (1)各変量の分散を 1に標準化して，標本相関行列 C = (r )を求める。

jk

[0080] (2) xと残りの変量との相関係数のなかの最大値 r し j！ =k)を、 Cの対

j max 0) (ただ

角要素に代入して C*を作る。

[0081] (3) C*の固有値問題を解き、固有値 λ , λ , · · · , λ と、それに対応する固有べ

1 2 ρ

クトル C， C， · · ·， C を求める。この固有ベクトルが因子負荷量に相当する。

1 2 ρ

[0082] 次に特徴量低減のために、各主成分の寄与率を求める。ここで寄与率とは、各主成分が元の情報をどれだけ説明している力を表す係数であり、下記のように表すことができる。 [数 13]

[0083] ここで， Cは第 k主成分の寄与率であり、

k

b は主成分得点 Zkpと x の相関係数で，次式のように定義される.

kimn plmn

[数 14]

[0084] a は第 k主成分の第 1解像度の第 m画面の第 n特徴量の因子負荷量であり、

Jdmn

λ は k番目に大き、相関行列の固有値である。

k

[0085] 次に累積寄与率に基づいた主成分の数の決定を行う。前述の寄与率 Cは、各主

k

成分が元の情報をどれだけ説明している力を表す係数であり、以下の関係式が成り立つ。

[数 15] = (-^2 = ^3 ― ■■■ — —^k+I ― " " =し div*pnum *25

[0086] そこで，累積寄与率 95%程度を目処に，特徴量低減で使用する主成分の数を下記の式で決定する。

[数 16]

∑ Q ≥ 0.95

k =l

[0087] 本実施の形態では、累積寄与率が約 97%となる第 10主成分までを用いることにする。

[0088] 次に主成分得点に応じたデータの並び替えを行う。第 1から第 10主成分までの各主成分ごとに，主成分得点の大きさに応じて全データを並べ替え (ソート)する。この並べ替えによって 10種類の画像データソースが作成されることになる。図 16は、並ベ替えのイメージを示している。このような並べ替えによって、オリジナルの画像数が 15, 000枚とすれば、、 15, 000 X 10= 150, 000枚の画像データ力 ^記'隐されることになる。

[0089] なお未知のヒト手指画像が入力された場合に、効率よく類似画像を検索するため、範囲を限定した検索対象数をあら力じめ決めておくのが好ましい。具体的には，各主成分において未知画像と同じか，最も近い主成分得点 Zkpを持つデータと、各主成分の寄与率に応じた数の前後データを検索対象とする。各主成分の候補数は，以下の通りである.

[数 17]

[0090] ここで， dc は第 p主成分 (p=l, 2, · · · · 10)の推定候補数である。

P

[0091] Ccは推定候補数の総和で，あら力じめ決めておくものである。

[0092] そして λ ρを含む分数式は、第 10主成分中の ρ成分の寄与率である。

[0093] 上記の式によって各主成分の寄与率に応じた数の前後データが検索対象となることが決まる。例えば、図 16を参照して説明すると、照合対象となる動作画像データの第 1主成分の主成分得点 Zkpが 13点であるとすると、第 1主成分の主成分得点の得点順に並べ替えた基礎となる画像データのうち主成分得点が 13点に近い画像データを中心に含んで、前述の推定候補数の画像データが照合用画像データとして抽出される。

[0094] 上記の改良点を含めた画像データのデータベース作成の手順 (実施の形態の第 1 のステップから第 3のステップに相当）を図 17に示す。

[0095] 次に上記のようにして作成したデータベースを利用して、本発明の第 4及び第 5のステップ (照合処理)を主成分分析技術を用いて処理する処理手順につ！ヽて説明する。図 18は、具体的な照合手順の流れを示している。まず手の実画像の撮像を得る。前述の特徴量の低減技術を用いると、ビデオレート以上の速さの処理速度が出せるので、撮像には高速度カメラを使用することができる。不必要な情報を除去するために、撮像力もは背景を除去する。そのためには（手映像 +背景映像)の撮像から（背景映像)を差し引く処理を行う。

[0096] 次に撮影した画像 (動作画像データ)の特徴量を計算する。撮影したときの解像度そのままで特徴量を計算してもよいが、図 18の例では、撮像した動作画像データの解像度を変えて 3種類 (複数種類)の解像度の異なる動作画像データを得る。すなわち単純に見ると同じ動作画像データにつ、て 3倍のデータを作成する。そしてこれら解像度を変えた 3種類の動作画像データ（手画像のデータ）について、前述のデータベースの作成時と同様に、手の画像の重心推定を行い、画面を分割する。この場合も、画面を 16分割、 64分割または 246分割する。分割数は任意である。しかにあまり分割数を多くしても精度が上がらないことが確認されているので、 16分割または 64 分割程度の分割数が好ま U、。

[0097] 次に各画面分割ごとの高次局所自己相関パターンを算出する。このときの高次局所自己相関パターンの算出も前述のデータベースを作成する際に用いた高次局所自己相関パターンの算出手法と同じである。

[0098] 次に算出した高次局所自己相関パターンに基づいて主成分分析により主成分得点の計算を行う。この主成分得点の計算も前述のデータベース作成の際の主成分得点の計算方法と同じ計算方法を採用する。

[0099] 次にデータベースに記憶されている基礎となる複数の画像データとの照合を行う。

照合の候補となる照合用の複数の画像データを、計算により求めた主成分得点を基準にしてデータベース力選出する。なお各主成分力の候補数は、前述の [数 17] の式により、あらかじめ決められている。そこでそれぞれの主成分において最も近い主成分得点 Zkpを持つ画像データと、この画像データの前後の画像データを各主成分の寄与率に応じて予め定めた候補数の数分選出して照合用の画像データとする。データベースに記憶されている 10種類の主成分を基準にして並べ替えられた 10種類の画像データソースから、それぞれ予め定められた候補数の画像データが選出される。仮に各主成分について予め候補数が 20と定められているものとすると、 20 X 1 0 = 200枚の画像データがデータベース力選出されることになる。これらの画像データ中には重複して、るものがあるのは勿論である。

[0100] 次に類似度の計算を行う。具体的には、入力画像 (動作画像データ)と候補となつた複数枚の照合用の画像データ (候補 CGハンド画像）との間で、次式により、ユークリツド距離 Erの計算を行う。

[数 18]

[0101] ここで、 fi(x)は特徴量力も算出した第 i主成分の主成分得点であり、

Xは候補 rの高次局所自己相関関数による特徴量であり、

Xは時刻 tにおける高次局所自己相関関数による特徴量であり、

Erを最小にするデータ pを検索画像とし，データ pが持つ関節角度データを推定角度とする。

[0102] 時刻 tと時刻 t 1の検索結果が許容される関節角度の範囲であれば、時刻 tでの探索を終了する。そして時刻 t 1から大幅に異なる関節角度が選ばれている場合は、ユークリッド距離 Erが次に小さい次候補を選び，許容範囲かどうかを下記の式で計算する。

[数 19]

i=\

[0103] ：で， Apは許容値であり、 iはデータグローブの関節番号である（本例では i= 24)

[0104] また ang は時刻 tにおける i番目の関節角度データである。

i(t) [0105] 許容値が許容は範囲内であれば、その画像データが動作画像データに対応するものと特定される。

[0106] 次に、本発明の方法の別の実施の形態について説明する。この実施の形態では、前述の実施の形態とは異なって、図 19に示すように、データグローブを嵌めた手の上にさらに無地 (無模様：一色)の手袋 (被覆物）を嵌めて、前述の第 1のステップと第 2のステップとを同時に実施する。図 19において、下側の図がデータグローブを嵌めた手であり、上側の図がデータグローブを嵌めた手の上に手袋を嵌めた図である。図 20は、事前にデータベースを作成する際の手順を示すフローチャートであり、図 21 は図 20のフローチャートの詳細を示すフローチャートである。

[0107] まずビデオカメラ 109で、手袋を嵌めた状態の手を撮影する。本実施の形態では、高速ビデオカメラ 109で撮影した手画像データおよびデータグローブ力も得た角度データを用いてデータベースを構築する。そのために画像データと角度データとを組にして取得する。本実施の形態では、モノクロ高速度カメラ（MEGAPLUS社製、 ES 310ZT)を使い、解像度を 320* 240画素として、手指が画面内に十分な大きさで映っている状態を想定する。また角度データの測定には、 Virtual Technologies 社製の「CyberGlo_Ve」（商標）と呼ばれるデータグローブを用いた。そして手袋は、白一色で無模様のものを用いた。手袋をデータグローブの上に嵌めることにより、デ一タグローブ固有の画像特徴 (センサの形状やグローブの形状）が出るのを防止している。前の実施の形態と異なって、白手袋を撮影すると、ヒトの手とは色が違い、画像としても違うものとなる。しカゝしながら、手袋を嵌めた手の画像データであっても、後に説明するように、特徴量ィ匕により一般の手画像として扱うことができる。なおデータべース作成に際しては、背景画像が影響を及ぼさないようにするために、背面に無模様一色のスクリーンを用いて撮影を行う。そして連続する複数の画像データと一緒に、データグローブ力取得した手指角度データを組にして 1次データベースを作成する。必要十分な情報を得るために、手を連続的に動かして必要な画像データと角度データを同時に取得して、保存する。

[0108] 本実施の形態では、 1次データベースの画像データを、実際に撮影した手画像の推定に必要な特徴量へと変換する画像処理を行なう。この画像処理のために背景除去、解像度変更、エッジ抽出、輪郭抽出 (特徴量抽出）を行なう。

[0109] まず画像情報力も背景除去を行う。あらかじめ取得しておいた背景画像を用いて対象画像との差分を取る。その差分が閾値以上の場合は対象画像の画素を使い、以下ならば 0とする。

[0110] 次に背景を除去した画像の解像度を変更する。今回取得した画像は 320 X 240の画素値を持つ画像である。し力しこれをそのまま用いて各種画像処理を施して推定処理をするには、計算に時間がかかる。また人間が推定する際には、本実施の形態で用いた画像のサイズより小さくとも推定が可能である。そこで本実施の形態では、解像度を、 320 X 240の画素値から 64 X 64のサイズに変更する。解像度変更後の画素値は次式により得られる。

[数 20] gr(i, j)

=丄 ^go(i * ^{320 64} + ' ^{320 64} +！)

[0111] ここで gr (i、 j)は解像度変更後の i行 j列番目の画素値である。 go (i、 j)は、解像度変更前の i行 j列番目の画素値である。この式では、縦についても 320で計算している力これは変更後の画素値を 64 X 64にしているため縦横比を合わせるためである。また k、 1については i X 320Z64力ら（i+ 1) X 320Z64— 1まで計算し、 rは kの個数 X Iの個数とする。

[0112] 以上の操作で得られた解像度変更画像を用いてエッジ抽出を行なう。この作業で推定に必要な特徴を抜き出す。具体的にはソーベルフィルタで解像度変更画像をフィルタ処理する。その後、この画像の最外周のみをニ値ィ匕することでエッジを抽出する。

[0113] ソーベルフィルタによる処理は、次式で表現できる。

[数 21] 卩 27 (ただし fr(i ) •70)

fs(i, j)

0 ( fr i，j) '- 70) [0114] ここで fr (i、 j)は下記の式で表すことができる。

[数 22]

f^r(l' ^;)

[0115] 上記式にぉ、て、 fi (i、 j)は処理前の横 i番目、網番目の画素を示す。 f sが処理後の最終的な値となる。

[0116] ここでの画像の最外周の二値化は、輪郭抽出で輪郭が途切れないように、比較的低い閾値でニ値ィ匕することを意味する。この最後の画像処理として、エッジ抽出で得られた二値ィ匕画像上を走査することで輪郭抽出を行う。前段階のエッジ抽出により得た画像を輪郭として使用しない理由として、環境光の変化を上げることができる。実際の推定時とデータベース作成時とでは、環境光や人の肌の色等に違いがある。ましてやデータベース作成時には白手袋を使用しているため、エッジ抽出を行っても、エッジの値や幅などが実際の画像のエッジとは異なってくる。その結果、データべ一スの画像データと実際の画像データとを比較するとき (推定時）とで、両者のエッジには大幅な相違が生じる可能性がある。そこで輪郭抽出を行って、エッジの幅や値を一定にする。輪郭抽出は、データベース力得られる情報と推定時に得られる情報との差を少なくし、環境の影響などを排除することで、推定時の誤差を減少させるために採用する。図 22は、エッジ抽出後に輪郭抽出を行って得た解像度変更後の画像でめる。

[0117] なお最外周のみニ値ィ匕するための輪郭抽出アルゴリズムでは、画像を上から走査して行き、最初の 127の点を始点とした。始点カも左回りに近傍画素を探索して行き、 127の点があればそこへ移動し、値を 255に書き換える。移動後は前回の位置を参考にして探索開始地点を 8パターンに分けて探索を継続する。始点に再び戻った時点で輪郭を抽出したと判断し、探索を終了させる。最後に残りの点は輪郭ではないので 127の点は全て 0とする。

[0118] 次に輪郭抽出を行った画像データの特徴量化を実施する。本実施の形態では、 Otsu等 (N. Otsu and T. Kurita, A new scheme for practical, fiexib le and intelligent vision systems, "Proc. I APR. Workshop on Compu ter Vision, pp. 431— 435, 1998. )が提案している高次局所自己相関関数を特徴量ィ匕に使用した。高次局所自己相関特徴は、画像の認識や計測のために有効な特徴であり、下記の式で定義される高次相関関数について、参照点とその近傍につ V、ての計算をしたものである。

[数 23] 1" (a , a₂ , - ' - _y a_N ) =

JV ( / (r + ）···/( + )

[0119] 上記式で x ¾N次元での r点近傍の相関関数である。一般に自然画像を処理対象とする場合には、対象点回りの画素が重要になるため、係数 Nを 2次までとする。また、平行移動すると等価なものになるものを除くと、図 23に示す 25の特徴量で表現できる。ただし No. 1から No. 5までは、 No. 6以降の特徴量に比べスケールが小さいので、スケールを合わせる必要がある。 No. 2— No. 5までは、参照点の画素をさらにかけあわせ、 No. 1は参照点の画素の 2乗をかけることで他の特徴量にスケールを一致させる。

[0120] 本実施の形態では、図 24に示すように、画像の画面を縦 8分割、横 8分割にした。

そして、計 64分割した分割画面に対して、それぞれ画素全てを参照点として、高次局所自己相関関数によって 25の特徴量に次元低減を行なった。すなわち、全体の画像で考えれば、 25 X画面分割数の特徴量により、その全体画像の特徴量化を行うことができる。

[0121] このようにして 1つの画像データを特徴量ィ匕した画像データとデータグローブからの角度データ (事前収集動作指令に対応)を組みにした特徴データを画像対応動作指令記憶手段 (データベース）に記憶する。本実施の形態では、このデータベースを利用して、実際に撮影した画像の特定を行う。

[0122] 次に、上記のようにして作成したデータベース (画像対応動作指令記憶手段）を利用して、実際に撮影した手の画像から手指角度を推定する方法について説明する。図 25は推定時の手順を示すアルゴリズムであり、図 26はより詳細にアルゴリズムである。まず推定時には、データベース作成時と同様に高速カメラで動く手の画像 (動作画像データ）を取得する。そして取得した動作画像データに対し、データベース作成時と同様の画像処理を施し特徴量を抽出する。そしてこの動作画像データの特徴量とデータベースに記憶されている複数の画像データの特徴量とを後述の処理により比較し、動作画像データと最も近い画像データと組になる角度データを、その動作画像データに対応する動作指令として出力する。

[0123] 特に、「データベースとの照合」処理では、データベースに記憶されている画像データ全てに対して、動作画像データの特徴量との間の距離算出を行なった。距離の算出は単純なユークリッド距離で行なった。最終的な距離は、下記式より算出した。

[数 24]

25*n

E.

[0124] 上記式において、 Xは候補 rの高次局所自己相関関数による特徴量 i、 Xは時刻 t n ti での高次局所自己相関関数による特徴量 iである。 Erを最小にするデータ rの角度を、その動作画像データの推定角度とした。ただし、角度の大幅に違うものの中に特徴量の近いデータが紛れ込むことがあるので、前回 (t 1時刻）の推定角度との比較を行って角度制限を行う。具体的には、距離が近いものについて、下記式で示す評価関数 Apが規定値を超える場合には、推定候補カゝら除外した。そして評価関数 Apが規定値以内であれば、その推定角度を採用することとする。

[数 25]

[0125] ここで ang は時刻 tの i番目の角度データである。また、データグローブから得られる i(t)

角度情報は 24となっている。以上の操作により現在の推定角度を求める。

[0126] 実際の推定時に、データベースに記憶されている全ての画像データとの全てについて距離算出の処理を行なうと、データベースの大きさによっては計算コストがかかりすぎ、実時間処理が不可能になる。そこで本実施の形態では、データのクラスタリングにより推定候補数の削減を行なうことにより、実時間処理を可能にする。

[0127] 図 27は、クラスタリングを説明するための概念図である。図 27においては、一つの行は複数枚の画像データによって構成される一つの組を示している。着色の濃い行が最初の探索対象となるデータ、着色の薄、行が詳細な探索対象となるデータである。データベースに含まれるデータを、先に説明したデータベース作成時のアルゴリズムで作成すると、画像データの並びにおいて、手の形状の近いものが集まるようになる。これを利用することで距離計算の対象画像データを削減する。具体的には複数枚の画像データを一組と考える。そして、始めの距離計算時に使う画像データは、複数組の中からそれぞれ 1つを選び、選んだ画像データと距離計算を行う。これにより距離計算による計算コストは、各組に含まれる枚数 1がすべての組において削減されることになり、大幅なコスト減となる。ただし、この段階では真に近い角度の画像データも計算から除ヽて、る可能性があるので、推定結果が元のデータベースの画像データ全てと対比する場合に比べ精度が落ちる。そのため 1段階目の距離計算で距離の近いものについては、各画像データが含まれる組内のすべての画像データと動作画像データとの間の距離計算を行なう。このようにすれば各データ近傍には角度的に近いものが集まっているため、より精度の良い推定結果が得られる。クラスタリングの効果を確認する実験では、 10枚の画像データを一組と考え、 1枚の動作画像データについて 1段階目の距離計算を複数組内の 1枚の画像データとそれぞれ行つた。次にこの操作で得られた距離が近、上位の組 5組に含まれる全ての画像データについて距離計算と角度制限を行ない、最終的な角度を推定した。その結果、すべての画像データと比較を行う場合と比べて、遜色の無、比較精度が得られることが確認できた。

[0128] 上記実施の形態では、特徴量を求めるにあたって、高次局所自己相関関数を用いた。し力しながらその他の特徴量の求め方を採用することができるのは勿論である。例えば、廣池敦、武者義則著の「大規模な画像集合のための表現モデル」（日本写真学会誌、 66卷、 1号、 93— 101頁、 2003年発行）に記載の特徴量ベクトルの求め方を採用することもできる。産業上の利用可能性

本発明によれば、実際にロボットを動かすために、ロボットに対応する動作物またはその擬似物の画像を得るだけで、センサを使用することなぐその動作物または擬似物と同じ動作を、不良設定性を解消してロボットに見まね動作させることができる。したがって本発明によれば、画像データを入力データとしてロボットを簡単に駆動することが可能になる。

Claims

請求の範囲

[1] 動作指令に応じて動作するロボットの駆動方法であって、

ロボットに対応する動作物またはその擬似物に所定の動作と同じ動作をさせたときの前記動作物またはその擬似物の複数の画像データと、前記複数の画像データに対応した前記動作指令を得るために事前に収集された事前収集動作指令とを対応付けて画像対応動作指令記憶手段に記憶するステップと、

前記ロボットを動作させるために、前記動作物またはその擬似物に所望の動作を行わせ、その際に前記動作物またはその擬似物の動作画像データを時系列でロボット動作用画像データとして取得するステップと、

前記ロボット動作用画像データに含まれる前記動作画像データに対応する画像データを前記画像対応動作指令記憶手段に記憶している前記複数の画像データから時系列で特定し、特定した前記画像データに対応する前記事前収集動作指令を前記動作指令として前記ロボットに与えるステップとからなるロボットの駆動方法。

[2] 前記ロボット動作用画像データに含まれる前記画像データと前記画像対応動作指令記憶手段に記憶されている前記複数の画像データとの対応を両者の類似度に基づ、て判断する請求項 1に記載のロボットの駆動方法。

[3] 前記画像対応動作指令記憶手段に記憶している前記複数の画像データから前記動作画像データに対応する画像データを特定する際に、前記動作画像データの特徴量を基準にして照合用の複数の画像データを選択し、前記照合用の複数の画像データと前記動作画像データとの類似度に基づいて前記動作画像データに対応する画像を特定することを特徴とする請求項 1に記載のロボットの駆動方法。

[4] 動作指令に応じて動作するロボットの駆動方法であって、

ロボットに対応する動作物と、前記動作物に設けられて前記動作物の動きを検出する複数のセンサと、前記複数のセンサの出力に基づいて前記動作指令を発生する動作指令発生装置とを用い、前記動作物に所定の動作を行わせたときの前記複数のセンサの出力に基づいて前記動作指令発生装置が発生する前記動作指令を事前収集動作指令として記憶する第 1のステップと、

前記動作物に前記所定の動作を行わせたときの前記動作物の複数の画像データを取得するか、または前記動作物またはその擬似物に前記所定の動作と同じ動作を行わせたときの前記動作物またはその擬似物の複数の画像データを時系列で取得する第 2のステップと、

前記複数の画像データに含まれる画像データと前記事前収集動作指令とを対応付けて前記複数の画像データと前記事前収集動作指令とを画像対応動作指令記憶手段に記憶する第 3のステップと、

前記ロボットを動作させるために、前記動作物またはその擬似物に所望の動作を行わせ、その際に前記動作物またはその擬似物の動作画像データを時系列でロボット動作用画像データとして取得する第 4のステップと、

前記ロボット動作用画像データに含まれる前記動作画像データに対応する画像データを前記画像対応動作指令記憶手段に記憶している前記複数の画像データから特定し、特定した前記画像データに対応する前記事前収集動作指令を前記動作指令として前記ロボットに与える第 5のステップとからなるロボットの駆動方法。

[5] 前記擬似物はコンピュータグラフィック技術等の疑似物生成技術を用いて作成されたものであり、前記画像データは疑似画像データである請求項 4に記載のロボットの駆動方法。

[6] 前記擬似物はコンピュータグラフィック技術により作成されたものであり、前記擬似物の画像データはコンピュータグラフィック画像データである請求項 4に記載のロボットの駆動方法。

[7] 前記第 2のステップでは、前記複数のセンサを備えた前記動作物の表面を、前記複数のセンサを含めて被覆物によって覆い、前記第 1のステップと同時に前記動作物の前記複数の画像データを取得することを特徴とする請求項 4に記載のロボットの駆動方法。

[8] 前記動作物は人間の手であり、

前記第 2のステップで取得する前記複数の画像データには、人間の手に現れる個人差を考慮した画像データが含まれている請求項 5または 6に記載のロボットの駆動方法。

[9] 前記複数の画像データには、前記複数の画像データの解像度を変えて作成した複数の解像度変更画像データが含まれて、る請求項 5, 6または 7に記載のロボットの駆動方法。

[10] 前記第 2のステップでは、時系列で取得した前の前記画像データと後の前記画像データとの間の未作成の画像データを前記コンピュータグラフィック技術により作成し第 3のステップでは作成した前記画像データに対応する事前収集動作指令を前記前の画像データに対応する事前収集動作指令と前記後の画像データに対応する事前収集動作指令とに基づいて推定により作成して前記未作成の画像データと対応付けて記憶することを特徴とする請求項 6に記載のロボットの駆動方法。

[11] 前記第 5のステップでは、前記ロボット動作用画像データに含まれる前記画像データと前記画像対応動作指令記憶手段に記憶されている前記複数の画像データとの対応を両者の類似度に基づいて判断する請求項 4に記載のロボットの駆動方法。

[12] 前記動作物は人間の手であり、

前記第 1のステップでは、前記人間の手に装着するデータグローブが用いられ、前記データグローブはグローブ本体に前記ロボットの手の動作部に対応した人間の手の動作部の動きを検出する位置に前記複数のセンサが装着された構造を有していることを特徴とする請求項 4に記載のロボットの駆動方法。

[13] 前記動作物は人間の手であり、

前記第 1のステップでは、前記人間の手に装着するデータグローブが用いられ、前記データグローブはグローブ本体に前記ロボットの手の動作部に対応した人間の手の動作部の動きを検出する位置に前記複数のセンサが装着された構造を有しており前記第 2のステップでは、前記データグローブを装着した前記人間の手に無地の手袋を嵌め、前記第 1のステップと同時に、前記所定の動作を行う前記人間の手の前記複数の画像データを取得することを特徴とする請求項 4に記載のロボットの駆動方法。

[14] 前記第 5のステップでは、前記画像対応動作指令記憶手段に記憶して!/、る前記複数の画像データから前記動作画像データに対応する画像データを特定する際に、前記動作画像データの特徴量を基準にして照合用の複数の画像データを選択し、前記照合用の複数の画像データと前記動作画像データとの類似度に基づいて前記動作画像データに対応する画像データを特定することを特徴とする請求項 4に記載のロボットの駆動方法。

[15] 前記動作画像データの特徴量が、主成分分析により得た各主成分ごとの主成分得点である請求項 14に記載のロボットの駆動方法。

[16] 前記第 3のステップでは、前記画像データと前記事前収集動作指令とを対応付けて前記画像対応動作指令記憶手段に記憶する際に、

前記複数の画像データのそれぞれの特徴量を個々に演算する特徴量演算ステツプと、

前記複数の画像データのそれぞれの特徴量を主成分分析して、前記複数の画像データのそれぞれについて主成分得点を演算し、且つ累積寄与率に基づいて第 1 主成分力ゝら第 k主成分までの主成分の数を決定する主成分決定ステップと、前記第 1主成分から第 k主成分までの各主成分ごとに、前記複数の画像データを前記主成分得点の大きさを基準にして並べ替えて得た k種類の画像データソースを作成して記憶する記憶ステップとを実行し、

前記第 5ステップでは、前記動作画像データ及び該動作画像データの解像度が異なる複数種類の動作画像データについて求めた主成分得点を基準にして前記 k種類の画像データソース力前記照合用の複数の画像データをそれぞれ抽出することを特徴とする請求項 10に記載のロボットの駆動方法。