JP2986455B1 - 手振り認識装置 - Google Patents

手振り認識装置

Info

Publication number
JP2986455B1
JP2986455B1 JP20942398A JP20942398A JP2986455B1 JP 2986455 B1 JP2986455 B1 JP 2986455B1 JP 20942398 A JP20942398 A JP 20942398A JP 20942398 A JP20942398 A JP 20942398A JP 2986455 B1 JP2986455 B1 JP 2986455B1
Authority
JP
Japan
Prior art keywords
hand
shape
contour
image
camera
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP20942398A
Other languages
English (en)
Other versions
JP2000040147A (ja
Inventor
章 内海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
EI TEI AARU CHINO EIZO TSUSHIN KENKYUSHO KK
Original Assignee
EI TEI AARU CHINO EIZO TSUSHIN KENKYUSHO KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by EI TEI AARU CHINO EIZO TSUSHIN KENKYUSHO KK filed Critical EI TEI AARU CHINO EIZO TSUSHIN KENKYUSHO KK
Priority to JP20942398A priority Critical patent/JP2986455B1/ja
Application granted granted Critical
Publication of JP2986455B1 publication Critical patent/JP2986455B1/ja
Publication of JP2000040147A publication Critical patent/JP2000040147A/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Image Processing (AREA)
  • User Interface Of Digital Computer (AREA)
  • Image Analysis (AREA)
  • Length Measuring Devices By Optical Means (AREA)

Abstract

【要約】 【課題】 手の姿勢によらず手の形状を安定して認識で
きる手振り認識装置を提供する。 【解決手段】 互いに異なる方向から複数のカメラで手
を撮影し、そのうち手のひらを正面から撮影したカメラ
を選択する。選択されたカメラで得た画像から輪郭線抽
出部81により手の輪郭線を抽出し、抽出されかつ補正
された手の輪郭線をP型フーリエ記述部83によりP型
フーリエ記述子で記述する。特徴ベクトル算出部84で
は、P型フーリエ記述子に含まれるフーリエ係数をベク
トル成分とする特徴ベクトルVが算出される。形状選択
部86では、その特徴ベクトルが得られる確率が最も高
い既知形状が手の形状として認識される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は手振り認識装置に
関し、さらに詳しくは、複数のカメラを用いて手の形状
を実時間で認識する手振り認識装置に関する。
【0002】
【従来の技術および発明が解決しようとする課題】直観
的で使いやすいインターフェイスとして、手振りを利用
するシステムがこれまで数多く提案されている。これら
のシステムの大半は、データグローブ(登録商標)に代
表されるように、センサを付加した特殊な手袋の着用を
利用者に求めるものであり、着脱の煩雑さなど使用者の
負担が大きく、広く普及するには至っていない。同様の
システムを非接触の装置で実現するために、画像処理に
より手振りを検出する手法が提案されてきたが、速度や
安定性の面で問題があった。
【0003】本発明者は、これらの問題点を解決するた
め、既に、多数のカメラを用いた手の位置・姿勢の推定
法を提案している(特開平10−63864号公報、内
海章,宮里勉,岸野文郎,大谷淳,中津良平:距離変換
処理を用いた多視点画像による手姿勢推定法,映像情報
メディア学会誌,Vol.51, No.12, pp.2116-2125 (199
7). )。この方法では、複数の視点から得られるロバ
ストな特徴量により、手の形状変化にかかわらず位置・
姿勢を安定に求めることができる。これにより、求めら
れた位置・姿勢に基づきその後の処理に適した画像を選
択することができる。しかしながら、この方法では、手
の形状を認識することはできない。
【0004】一方、多数のカメラを用いて得た2次元特
徴により手形状を記述する場合、カメラの光軸に対する
手の姿勢変化による撮影像の変形(自己オクルージョ
ン;たとえば、人指し指を延ばした手の形状と、人指し
指と中指を延ばした手の形状とは、手を側方から観察す
る場合は識別しがたい。)が大きな問題となる。従来行
なわれてきた2次元特徴による手形状判別には、エッジ
マップによるもの(Uras, C. and Verri, A.: Hand Ges
ture Recognition from Edge Maps, Proc. of Internat
ional Workshop on Automatic Face- and Gesture-Reco
gnition, pp.116-121 (1995). )、延ばされた指の本
数によるもの(平川幹和子,松尾英明,高田雄二,手嶋
光隆:シルエット画像からの手形状認識,テレビジョン
学会技術報告VIS96-49, pp.15-20(1996). 、長嶋他:
手の機能的な構造特徴量に基づく指文字認識,テレビ
誌,Vol.48, No.8, pp.1503-1507(1994). )などがあ
ったが、いずれもカメラの光軸方向と手の姿勢について
一定の関係を仮定しており、手が回転する場合の動作に
関しては対応できていなかった。
【0005】これに対し、手指の3次元モデルを用いて
形状復元を目指す研究も行なわれてきたが(Rehg, J.M.
and Kanade, T.: Visual Tracking og High DOF Artic
ulated Structures: an Application to Human Hand Tr
acking, Computer Vision-ECCV '94, LNCS vol. 801, p
p.35-46 (1994). 、中嶋正之,柴広有:仮想現実世界
構築のための指の動き検出法,グラフィックスとCAD
67-6, pp.41-46 (1994). 、岩井儀雄,八木康史,谷
内田正彦:単眼動画像からの手の3次元運動と位置の推
定,信学論(D-II), Vol.J80-D-II, No. 1, pp.44-55
(1997). )、これらの手法は精緻な姿勢情報が得られ
ることが期待できる一方で、手指の関節の自由度が大き
く計算コストが膨大になるという問題がある。また、オ
クルージョンを回避する検討もなされておらず、処理の
前提となる画像特徴がオクルージョンにより検出できな
い場合、やはり推定が困難になるという問題がある。
【0006】それゆえに、この発明の目的は、手の姿勢
に関係なく手の形状を安定して認識することが可能な手
振り認識装置を提供することである。
【0007】
【課題を解決するための手段】この発明による手振り認
識装置は、複数のカメラと、垂直方向算出手段と、カメ
ラ選択手段と、輪郭線抽出手段と、P型フーリエ記述手
段と、形状特定手段とを備える。複数のカメラは、互い
に異なる方向から手を撮影して手の画像を得る。垂直方
向算出手段は、複数のカメラからの手の画像に基づいて
手のひらの垂直方向を算出する。カメラ選択手段は、複
数のカメラのうち垂直方向算出手段により算出された垂
直方向に最も近い方向から手を撮影したカメラを選択す
る。輪郭線抽出手段は、カメラ選択手段により選択され
たカメラからの手の画像に基づいてその画像中の手の輪
郭線を抽出する。P型フーリエ記述手段は、輪郭線抽出
手段により抽出された手の輪郭線をP型フーリエ記述子
で記述する。形状特定手段は、P型フーリエ記述手段か
らのP型フーリエ記述子に基づいて手の形状を特定す
る。
【0008】上記手振り認識装置においては、手のひら
を正面から撮影したカメラが選択され、そのカメラから
の画像に基づいて手の形状が特定されるので、オクルー
ジョンが回避され、手の姿勢によらず安定した形状認識
が可能となる。また、手の輪郭線が形状の画像内の平行
移動、拡大・縮小などに対して不変のP型フーリエ記述
子で記述されるので、より安定した形状認識が可能とな
る。
【0009】好ましくは、上記手振り認識装置はさら
に、輪郭線補正手段を備える。輪郭線補正手段は、輪郭
線抽出手段により抽出された手の輪郭線を、垂直方向算
出手段により算出された垂直方向に一致する方向から手
を撮影したならば得られたであろう手の輪郭線に補正し
てP型フーリエ記述手段に与える。
【0010】したがって、手のひらを真正面から撮影し
たカメラが存在しない場合でも、手の輪郭線をP型フー
リエ記述子で正確に記述することができる。
【0011】好ましくは、形状特定手段は、特徴ベクト
ル算出手段を含む。特徴ベクトル算出手段は、P型フー
リエ記述子に含まれる複数のフーリエ係数のうち所定次
数よりも低い次数のフーリエ係数をそれぞれベクトル成
分とする特徴ベクトルを算出する。
【0012】したがって、抽出された輪郭線に含まれる
高周波ノイズの影響を避け、より安定した形状認識が可
能となる。
【0013】好ましくは、上記形状特定手段はさらに、
形状選択手段を含む。形状選択手段は、手の複数の既知
形状に対応して予め用意された複数の特徴ベクトルを基
準として、複数の既知形状のうち特徴ベクトル算出手段
により算出された特徴ベクトルが得られる確率が最も高
い既知形状を手の形状として選択する。
【0014】
【発明の実施の形態】以下、この発明の実施の形態を図
面を参照して詳しく説明する。なお、図中同一または相
当部分には同一符号を付してその説明は繰返さない。
【0015】まず、この発明の実施の形態による手振り
認識装置で用いられる手の形状モデルについて説明す
る。この装置では、手の位置および姿勢を重心と手のひ
らの方向によって、また各指の曲げを重心と各指先点の
位置関係によって表現する。詳細は「大西ほか,手振り
認識のための手形状記述について,テレビジョン学会技
術報告 Vol.15, No.25, pp.25-29, May 1991」を援用す
る。図1において、Ohは手の重心を示し、Xhは手の
方向を示す。これらは画像中の手のひら領域の重心点、
手のひら部分のエッジの手方向でそれぞれ近似する。複
数のカメラからの情報を組合せれば、手の位置と方向が
算出できる。また、手のひらの特徴点は同一平面内にあ
ると仮定し、指先点の移動は求めた表面上への投影点の
動きとして表現する。
【0016】この実施の形態による手振り認識装置の構
成を図2に示す。この手振り認識装置は図2に示される
ように、互いに異なる方向から手を撮影して手の画像を
得る複数のカメラ1〜nと、カメラ1〜nによって得ら
れた入力画像中の肌色領域を色情報および輝度情報を用
いて分割する領域分割部11〜1nと、ソーベル(Sobe
l )フィルタの結果から平均エッジ方向を求め、それを
2次元上の手の方向(主軸)とする主軸検出部21〜2
nと、主軸検出部21〜2nで得られた手の方向に基づ
いて指先が上方を向くように画像を回転する回転変換部
31〜3nと、手の画像を構成する画素の各々から手の
画像の輪郭までの最短距離を示す距離変換値(スケルト
ン値)を算出する距離変換部41〜4nと、それらのス
ケルトン値に基づいて手の重心たり得る確信度を参照
し、手の3次元上の重心Ohを決定するとともに、複数
のカメラ1〜nで得られた手の方向をステレオマッチン
グすることより3次元上の手の方向Xhを決定する3次
元重心点・方向検出部5と、カメラ1〜nで得られた点
の重心における距離変換値(重心スケルトン値)に基づ
いて手の主軸(Xh)まわりの回転角rを決定する回転
角検出部6と、得られた重心位置、手方向および回転角
を持つ面(手平面)に対し最も垂直に近い光軸を持つカ
メラを選択するカメラ選択部7と、選択されたカメラか
ら得られた手の画像に基づいて手の形状を認識する手形
状認識部8とを備える。
【0017】ここでは特に、回転角検出部6は、手方向
Xhおよび回転角度rに基づいて手のひらの法線ベクト
ルを算出する。カメラ選択部7は、複数のカメラ1〜n
のうちその法線ベクトルに最も近い方向から手を撮影し
たカメラを選択する。
【0018】手形状認識部8の構成を図3に示す。手形
状認識部8は、図3に示されるように、カメラ選択部7
により選択されたカメラからの手の画像に基づいてその
画像中の手の輪郭線を抽出する輪郭線抽出部81と、輪
郭線抽出部81により抽出された手の輪郭線を、回転検
出部6により算出された法線ベクトルに一致する方向か
ら手を撮影したならば得られたであろう手の輪郭線に補
正する輪郭線補正部82と、輪郭線抽出部81により抽
出されかつ輪郭線補正部82により補正された手の輪郭
線をP型フーリエ記述子で記述するP型フーリエ記述部
83と、P型フーリエ記述部83からのP型フーリエ記
述子に含まれる複数のフーリエ係数のうち所定次数より
も低い次数のフーリエ係数をそれぞれベクトル成分とす
る特徴ベクトルを算出する特徴ベクトル算出部84と、
手の形状と特徴ベクトルとの関係を学習するために複数
の既知形状を有する手を撮影して得た多数のサンプル画
像に基づいてもし撮影された手の形状がある既知形状で
あったならば得られたであろう確率を定義する確率定義
部85と、確率定義部85により定義された確率に基づ
いて上記複数の既知形状のうち特徴ベクトル算出部84
により算出された特徴ベクトルが得られる確率が最も高
い既知形状を手の形状として選択する形状選択部86と
を含む。すなわち、特徴ベクトル算出部84、確率定義
部85、および形状選択部86は、P型フーリエ記述部
83からのP型フーリエ記述子に基づいて手の形状を特
定し、その形状を認識結果として出力する。
【0019】次に、このように構成された手振り認識装
置の動作を説明する。カメラ1〜nで得られた画像は領
域分割部11〜1nにそれぞれ与えられる。領域分割部
11〜1nでは、入力画像の肌色領域が色と強度の情報
を用いて他の領域から分離され、図4の(a)に示され
るような入力2値画像(シルエット画像)が得られる。
主軸検出部21〜2nでは、得られたシルエット画像に
ソーベルフィルタが適用され、手領域の平均エッジ方向
が求められ、この平均エッジ方向が図4の(b)に示さ
れるように画像内の手の指先方向とみなされる(石淵耕
一,岩崎圭介,竹村治雄,岸野文郎:画像処理を用いた
実時間手振り推定とヒューマンインタフェースへの応
用,信学論(D-II), Vol.J79-D-II, No.7, pp.1218-12
29(1996). )。以後の処理の安定化のため、回転変換
部31〜3nでは、得られた指先方向に基づき指先が上
方を向くよう画像が回転変換される。たとえば、カメラ
i(=1〜n)の画像は回転角γiだけ回転される。回
転変換された後の画像は図4の(c)に示される。距離
変換部41〜4nでは、図4の(d)に示されるような
距離変換画像が得られる。
【0020】3次元重心点・方向検出部6では、重心の
候補として距離変換された画像の極大点が抽出される。
図4の(d)では、スケルトン値が大きい画素ほど黒く
表わされ、スケルトン値が小さい画素ほど白く表わされ
ている。したがって、手の輪郭から遠ざかるにつれて画
素が徐々に濃くなっている。得られた重心候補のすべて
の画像間での対応付けから確信度処理により3次元上の
重心が決定される。3次元の重心が決定されると、各画
像上での重心スケルトン値が得られる。
【0021】回転角検出部6では、手のひらをモデル化
した所定の手のひらモデルに基づき、手の主軸まわりの
回転角rが上述した各画像上での重心スケルトン値から
最尤法により推定される。詳細は、上掲の特開平10−
63864号公報を援用する。重心点の距離変換値は前
述のとおり指曲げなどの形状変化の影響を受けにくく、
手の主軸まわりの回転角rの推定も形状変化に対して安
定である。手の指先方向(主軸)と手の主軸まわりの回
転角rを定めることにより、図5に示されるように手の
ひらの法線ベクトルNを定めることができる。回転角検
出部6は、このような法線ベクトルNを算出してカメラ
選択部7に与える。
【0022】カメラ選択部7では、カメラ1〜nの中か
ら手のひらの垂直方向に最も近い方向から手を撮影した
カメラが選択される。すなわち、図5に示されるように
カメラiの光軸ベクトルをCiとしたとき、光軸ベクト
ルCiが法線ベクトルNとなす角度θiが最小になるカ
メラiが選択される。手指間のオクルージョンは、手の
ひらを正面から撮影する場合に最も起こりにくいため、
このような視点の選択によりオクルージョンを回避する
ことができる。
【0023】続いて図3に示されるように、輪郭線抽出
部81では、選択されたカメラiの画像から手の輪郭線
が抽出される。ここでは、特に手形状を特徴付ける手指
部分の輪郭線のみが抽出される。上述したように、入力
2値画像は重心点検出の前処理として指先が上方を向く
よう角度γiの回転変換を受けているため、図6に示さ
れるように、手の領域内で重心点よりも上方部分のみの
輪郭線を抽出することで手指部分の形状が得られる。よ
り具体的には、図6に示されるようなシルエット画像上
で重心点よりも上方に位置する白色画素のうち黒色画素
に隣接する画素が輪郭線として抽出される。ここで、輪
郭線の抽出は右回りとして、抽出した各画素の座標を
(a(t),b(t))とする(t=0,…,m−1,
mは輪郭線を構成する全画素数)。
【0024】このようにして抽出された輪郭線は、手の
ひらの法線ベクトルNとカメラiの光軸ベクトルCiの
なす角θiの変化に応じて、投影による変形を受けてい
る。そこで、輪郭線補正部82では、抽出された手の輪
郭線が、手のひらを正面から撮影したならば得られたは
ずの輪郭線に補正される。より具体的には、カメラ選択
の結果、θi<<90°であると考え、弱透視変換を仮
定すると、観測される画像は、図5に示されるように手
の法線ベクトルNをカメラiの撮像面に投影したNi′
の方向(画像内の水平軸xCiとなす角をφiとする。)
にcosθi倍の縮小を受けていることになる。そこ
で、抽出された輪郭線の各画素の座標(a(t),b
(t))は、次の式(1)で補正され、(a′(t),
b′(t))となる(t=0,…,m−1)。
【0025】
【数1】
【0026】ここで、R(α)は角度αの回転変換行列
である。P型フーリエ記述部83では、抽出された輪郭
線が折れ線で近似され、P型フーリエ記述子で記述され
る。P型フーリエ記述子は、上坂によって提案されたも
ので(上坂吉則:開曲線にも適用できる新しいフーリエ
記述子,信学論(A),Vol.J67-A, No.3, PP.166-173
(1984). )、種々のパターンを少ないパラメータで記
述できる、平行移動・拡大縮小について不変である、開
曲線に適用できるといった形状認識に優れた特徴を持
ち、これまでにも部品形状の認識(伊藤豪俊,平田達
也,石井直宏:フーリエ記述子を用いた部品の形状認識
と処理,信学論(D),Vol.J71-D, No.6, pp.1065-107
3 (1988). )、文字認識(大友照彦,原健一:P型フ
ーリエ記述子を用いたオンライン手書き漢字認識,情処
学論,Vol.34, No.2, pp.281-288(1993). )、人間の
横顔認識(相原恒博,大上健二,松岡靖:人間の横顔認
識におけるP型フーリエ記述子の有効成分の個数につい
て,信学論(D-II), Vol.J74-DII, No.10, pp.1486-14
87(1991). )などに広く利用されてきたものである。
【0027】P型フーリエ記述子では、2次元の曲線を
複素平面上の点列と考え、長さの等しい線分からなる折
れ線で近似する。折れ線の各頂点をz(j)=x(j)
+iy(j)とするとき(|z(j+1)−z(j)|
=δ;j=0,…,n−1)、各折れ線をその長さδで
正規化して、次の式(2)で表わされるような折れ線の
P表現w(j)を得る。
【0028】
【数2】
【0029】w(j)の離散フーリエ展開により、フー
リエ係数c(k)が次の式(3)により求まる。
【0030】
【数3】
【0031】ここで、係数の集合{c(k);k=−
N,…,0,…,N}がN時のP型フーリエ記述子であ
る。この実施の形態では、c(k)の大きさ|c(k)
|を輪郭線の記述に利用する。
【0032】特徴ベクトル算出部84では、P型フーリ
エ記述子{c(k)}に含まれるフーリエ係数のうち所
定次数よりも低い次数の(2N+1)個(たとえばN=
4または5)のフーリエ係数を用いて次の式(4)で定
義される特徴ベクトルVが算出される。
【0033】
【数4】
【0034】ここで、At はベクトルAの転置ベクトル
を表わす。確率定義部85では、手形状の認識に先立
ち、手のいくつかの既知形状と特徴ベクトルの対応関係
が学習され、各形状sごとに特徴ベクトルVが観測され
る確率P(V|s)が次の式(5)で表わされる正規分
布により定義される。
【0035】
【数5】
【0036】ここで、Vmsは、ある既知形状の手を撮
影して得られた多数のサンプル画像に基づいて算出され
たその既知形状sの特徴ベクトルVの平均ベクトル(た
とえば多数の特徴ベクトルのベクトル成分の平均値をベ
クトル成分とするもの)である。また、Σsは行分散行
列である。このような確率関数が各既知形状ごとに予め
用意される。
【0037】形状選択部86では、算出された特徴ベク
トルVが得られる確率が最も高い既知形状が手の形状と
して選択される。すなわち、算出された特徴ベクトルV
が観測される確率P(V|s)がすべての既知形状sに
ついて求められ、その求められた確率P(V|s)が最
大になる既知形状sがこの場合の手の形状として認識さ
れる。
【0038】以上のようにこの実施の形態によれば、従
前の手法により推定した手の姿勢に基づいて形状認識に
用いる最適なカメラを選択しているため、オクルージョ
ンを回避し、手の形状を安定して認識することができ
る。また、画像から抽出した手の輪郭を記述するため
に、形状の画像内の平行移動、拡大・縮小などに対して
不変なP型フーリエ記述子を用いているため、上記カメ
ラ選択と組合せることにより手の姿勢に関係なく手形状
を安定して認識することができる。
【0039】また、抽出した手の輪郭線を手のひらの垂
直方向に一致する方向から手を撮影したならば得られた
であろう手の輪郭線に補正しているため、選択されたカ
メラが手のひらを真正面から撮影していない場合であっ
ても正確に手の形状を認識することができる。
【0040】また、相対的に低い次数のフーリエ係数を
用いて特徴ベクトルVを算出しているため、抽出された
手の輪郭線に含まれる高周波ノイズ(高次フーリエ係数
として現れる)を除去し、真の手の輪郭線(低次フーリ
エ係数として現れる)のみを正確に特定することができ
る。その結果、手形状をより安定して認識することがで
きる。
【0041】なお、上記実施の形態ではカメラ選択にお
いて手のひらの表裏の違いが考慮されておらず、そのた
め、同じ手形状について表裏2種類の画像入力があり得
る。このような輪郭線の左右の判定に対し、得られるP
型フーリエ記述子の次の式(6)で表わされる。
【0042】
【数6】
【0043】ここで、c′(k)は反転後の係数を示
し、c(−k)の上線はその共役複素数を示す。
【0044】そこで、手の表裏の判定を考慮し、次の式
(7)で表わされるように特徴ベクトルVの成分を並べ
変えたV* を定義する。
【0045】
【数7】
【0046】手形状の認識においては、P(V|s)お
よびP(V* |s)の両方を評価することで、入力画像
の表裏の違いに対応する。すなわち、選択画像から抽出
された輪郭線からV,V* を計算し、すべての形状sに
対するP(V|s)、P(V * |s)のうち最大値をと
る分布を選択し、対応する形状sを認識結果とする。
【0047】
【実施例】以下の実験のために、次のように画像の撮影
を行なった。実験に用いた環境を図7に示す。ここで
は、同心円上に中央を向けて約60°間隔で3台のカメ
ラcamera0〜2を配置し、図8に示す7種類の手形状sh
ape 1〜7それぞれについて約600フレーム分の画像
を撮影した。撮影画像は、手のひらの回転と移動を含
む。3台のカメラで得られた画像は3台の追記型ビデオ
ディスクに記録した後に、コマ送りにより1フレームご
とに処理した。全フレームのうち300フレームを学習
用に、残りを認識実験用に用いた。
【0048】パラメータ学習時には、各形状について処
理フレームの画像から上記実施の形態で述べた方法によ
り特徴ベクトルV0 を抽出した。2フレーム以降につい
ては、特徴ベクトルV,V* のうち、ユークリッド距離
が特徴ベクトルV0 に近いものを選んで記録した。形状
ごとに得られた、300サンプルの特徴ベクトルをもと
に上記実施の形態で述べた確率分布を決定した。
【0049】
【表1】
【0050】認識実験用の各形状約300フレームの画
像に対する形状認識結果を表1に示す。ここに見られる
ように、いずれの形状についても87%以上、特に形状
shape 1,2,6,7について99%以上という安定し
た認識結果が得られた。これにより、この発明による手
振り認識装置の有効性が示されたといえる。なお、形状
shape 3,4,5については自己オクルージョンによる
誤判別を起こしていると考えられるが、このようなオク
ルージョンによる誤判別は、視点数の増加により視点選
択の機会を増やすことにより回避することができる。
【0051】また、この発明による手形状認識装置で用
いたカメラ選択の効果を確認するため、カメラ選択を行
なわず同じカメラの画像を用いて形状認識を試みた。図
9に7種類の手形状shape 1〜7それぞれについての認
識結果を示す。ここで、横軸は手姿勢推定で得られた手
の法線軸とカメラの光軸のなす角度θを、縦軸はそれぞ
れのフレームについて得られた認識結果をそれぞれ表わ
している。なお、ここではθが90°近くになり得るた
め、上記実施の形態で述べた輪郭線の補正(式(3))
は行なっていない。図9から明らかなように、観測方向
による形状の変化の少ない形状shape 1,2を除き、角
度θの増加に伴って誤認識が増加している。上述した実
験結果と併せて考えることで、形状認識においてカメラ
選択が有効に作用していることがわかる。なお、形状sh
ape 3〜5は他と比べてより小さい角で誤認識を起こす
傾向がみられ、このことは上述した実験結果を裏付けて
いる。このように形状認識が困難になる角度は形状によ
って異なるため、安定した認識に必要なカメラの数は一
様には定めることができないが、今回用いた60°間隔
の配置では、いずれの形状についても87%以上の高い
認識率を得ており、次の述べる仮想空間操作システムの
操作も問題なく行なうことができた。
【0052】上述した手振り認識装置を利用し、対話的
に仮想空間を操作できるシステムを構築した。利用者
は、手振りによってコマンドを発し、仮想物体の配置・
削除・拡大縮小などの操作を行なうことができる。コマ
ンドは図8に示す7種類の手形状に対応させた。具体的
には、各コマンドは次の表2に示すように2種類の手形
状間の「形状遷移」を基本としており、形状shape 7の
提示後、他の形状shape1〜6を提示することでコマン
ドが実行あるいは開始される。
【0053】
【表2】
【0054】コンピュータグラフィックスで表示される
仮想空間には、利用者の手の3次元位置を表わす指示ポ
インタが描画されており、利用者は自分の手を動かすこ
とにより操作対象となる仮想物体の内部にポインタを移
動させることで、操作対象を直接指定することができ
る。「削除」(仮想物体を消去する)、「結合」(近接
する複数の仮想物体を結合する)、「分割」(仮想物体
の結合を解除する)の3コマンドについては、それぞれ
操作対象内にポインタを移動させた後、各コマンドに対
応する形状遷移を提示することで、当該コマンドが実行
される。
【0055】「把持・移動」(仮想物体を掴んで移動さ
せる)、「拡大・縮小」(仮想物体の大きさを変更す
る)、「色・テクスチャ変更」(仮想物体表面の色・テ
クスチャを変化させる)の3コマンドについては、ポイ
ンタによる指示、対応する形状遷移に続いて、さらに手
を移動させることで、変更対象となる物体パラメータ
(位置、大きさ、色など)が移動量に応じて変化する。
パラメータの変更は、手形状を形状shape 7に再び遷移
させることで終了する。
【0056】コマンド実行時の形状認識の例(約150
フレーム)を図10に示す。ここでは、被験者が仮想物
体の把持・移動、拡大・縮小、色・テクスチャ変更、削
除の各コマンドを順に実行したときの様子を示してい
る。本システムでは形状の遷移時などに生じる誤認識を
防ぐため、過去3フレームのうち2フレーム以上で同一
形状と認識されないと新しい手形状に遷移しないようフ
ィルタ処理を組入れている。また削除コマンドについて
は、特に10フレーム連続の形状入力がないと遷移しな
いように実装した。図10で、各点はそのフレームで認
識された形状の番号を、点線はフィルタ処理後の形状番
号を示す。図内には、コマンドが実行されたフレームを
記入している。一連の動作が安定して行なわれている様
子がわかる。本システムにより、形状認識によるインタ
ーフェイスの実現が可能であることが示された。
【0057】以上の次第で、多数カメラを用いた手振り
認識装置とそれを利用した仮想シーン生成システムにつ
いて述べた。本システムでは多視点情報による手姿勢推
定結果に基づき、手形状認識に適した画像を選択し、手
の輪郭線より得られるP型フーリエ記述子の低域成分に
より形状を判別した。検証実験により、P型フーリエ記
述子による形状認識の安定性、視点選択の有効性を示し
た。この手振り認識装置を組入れた仮想空間操作システ
ムでは、手形状の遷移により定義された6種類のコマン
ドにより、仮想物体の配置、連結、分割、削除、拡大・
縮小、色・テクスチャ指定を行ない、この手振り認識装
置を用いた対話型システムの有効性を確認することがで
きた。
【0058】今回開示された実施の形態はすべての点で
例示であって制限的なものではないと考えられるべきで
ある。本発明の範囲は上記した説明ではなくて特許請求
の範囲によって示され、特許請求の範囲と均等の意味お
よび範囲内でのすべての変更が含まれることが意図され
る。
【0059】
【発明の効果】以上のようにこの発明によれば、複数の
カメラのうち手のひらの垂直方向に最も近い方向から手
を撮影したカメラを選択するようにしているため、オク
ルージョンを回避することができ、しかも形状の画像内
の平行移動、拡大・縮小などに対して不変なP型フーリ
エ記述子で手の輪郭線を記述するようにしているため、
低計算コストで安定して手の形状を認識することができ
る。
【0060】また、抽出された手の輪郭線を手のひらの
垂直方向に一致する方向から手を撮影したならば得られ
たであろう手の輪郭線に補正するようにしているため、
手のひらを真正面から撮影したカメラが存在しない場合
でも正確に手の形状を認識することができる。
【0061】また、低い次数のフーリエ係数を用いて特
徴ベクトルを算出しているため、より安定して手の形状
を認識することができる。
【図面の簡単な説明】
【図1】この発明の実施の形態による手振り認識装置で
用いられる手の形状モデルを示す図である。
【図2】この発明の実施の形態による手振り認識装置の
全体構成を示すブロック図である。
【図3】図2中の手形状認識部の構成を示すブロック図
である。
【図4】(a)は図2中の領域分割部により得られる2
値画像を示す図であり、(b)は図2中の主軸検出部に
より検出された主軸の方向を示す図であり、(c)は図
2中の回転変換部により回転された画像を示す図であ
り、(d)は図2中の距離変換部により距離変換された
画像を示す図である。
【図5】手のひらの法線ベクトル、カメラの光軸ベクト
ル、およびカメラの撮像面の関係を示す図である。
【図6】図3中の輪郭線抽出部により抽出された輪郭線
を表わした画像を示す図である。
【図7】図2に示された手振り認識装置の実験環境を示
す図である。
【図8】図7の実験に用いた抽出輪郭線を各形状ごとに
示す図である。
【図9】手の回転角に対する手形状検出の安定性の実験
結果を示す図である。
【図10】コマンド実行時の形状認識の実験結果を示す
図である。
【符号の説明】
1,2,…,n カメラ 5 3次元重心点・方向検出部 6 回転角検出部 7 カメラ選択部 8 手形状認識部 81 輪郭線抽出部 82 輪郭線補正部 83 P型フーリエ記述部 84 特徴ベクトル算出部 86 形状選択部
フロントページの続き (56)参考文献 特開 平10−63864(JP,A) 相原恒博、大上健二、松岡靖,”人間 の横顔認識におけるP形フーリエ記述子 の有効成分の個数について”,電子情報 通信学会論文誌,1991年10月,Vol. J74−D−▲II▼,No.10,P. 1486−1487 (58)調査した分野(Int.Cl.6,DB名) G06T 1/00 G06T 7/00 - 7/60 G06T 9/20 G01B 11/24

Claims (5)

    (57)【特許請求の範囲】
  1. 【請求項1】 互いに異なる方向から手を撮影して手の
    画像を得る複数のカメラと、 前記複数のカメラからの手の画像に基づいて前記手のひ
    らの垂直方向を算出する垂直方向算出手段と、 前記複数のカメラのうち前記垂直方向算出手段により算
    出された垂直方向に最も近い方向から手を撮影したカメ
    ラを選択するカメラ選択手段と、 前記カメラ選択手段により選択されたカメラからの手の
    画像に基づいてその画像中の手の輪郭線を抽出する輪郭
    線抽出手段と、 前記輪郭線抽出手段により抽出された手の輪郭線をP型
    フーリエ記述子で記述するP型フーリエ記述手段と、 前記P型フーリエ記述手段からのP型フーリエ記述子に
    基づいて前記手の形状を特定する形状特定手段と、前記輪郭線抽出手段により抽出された手の輪郭線を、前
    記垂直方向算出手段により算出された垂直方向に一致す
    る方向から手を撮影したならば得られたであろう手の輪
    郭線に補正して前記P型フーリエ記述手段に与える輪郭
    線補正手段とを備える 、手振り認識装置。
  2. 【請求項2】 前記形状特定手段は、 前記P型フーリエ記述子に含まれる複数のフーリエ係数
    のうち所定次数よりも低い次数のフーリエ係数をそれぞ
    れベクトル成分とする特徴ベクトルを算出する特徴ベク
    トル算出手段を含む、請求項1に記載の手振り認識装
    置。
  3. 【請求項3】 前記形状特定手段はさらに、 手の複数の既知形状に対応して予め用意された複数の特
    徴ベクトルを基準として、前記複数の既知形状のうち前
    記特徴ベクトル算出手段により算出された特徴ベクトル
    が得られる確率が最も高い既知形状を前記手の形状とし
    て選択する形状選択手段を含む、請求項2に記載の手振
    り認識装置。
  4. 【請求項4】 互いに異なる方向から手を撮影して手の
    画像を得る複数のカメラと、 前記複数のカメラからの手の画像に基づいて前記手のひ
    らの垂直方向を算出する垂直方向算出手段と、 前記複数のカメラのうち前記垂直方向算出手段により算
    出された垂直方向に最も近い方向から手を撮影したカメ
    ラを選択するカメラ選択手段と、 前記カメラ選択手段により選択されたカメラからの手の
    画像に基づいてその画像中の手の輪郭線を抽出する輪郭
    線抽出手段と、 前記輪郭線抽出手段により抽出された手の輪郭線をP型
    フーリエ記述子で記述するP型フーリエ記述手段と、 前記P型フーリエ記述手段からのP型フーリエ記述子に
    基づいて前記手の形状を特定する形状特定手段とを備
    え、 前記形状特定手段は、 前記P型フーリエ記述子に含まれる複数のフーリエ係数
    のうち所定次数よりも低い次数のフーリエ係数をそれぞ
    れベクトル成分とする特徴ベクトルを算出する特徴ベク
    トル算出手段を含む 、手振り認識装置。
  5. 【請求項5】 前記形状特定手段はさらに、 手の複数の既知形状に対応して予め用意された複数の特
    徴ベクトルを基準として、前記複数の既知形状のうち前
    記特徴ベクトル算出手段により算出された特徴ベクトル
    が得られる確率が最も高い既知形状を前記手の形状とし
    て選択する形状選択手段を含む、請求項4に記載の手振
    り認識装置。
JP20942398A 1998-07-24 1998-07-24 手振り認識装置 Expired - Fee Related JP2986455B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP20942398A JP2986455B1 (ja) 1998-07-24 1998-07-24 手振り認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP20942398A JP2986455B1 (ja) 1998-07-24 1998-07-24 手振り認識装置

Publications (2)

Publication Number Publication Date
JP2986455B1 true JP2986455B1 (ja) 1999-12-06
JP2000040147A JP2000040147A (ja) 2000-02-08

Family

ID=16572630

Family Applications (1)

Application Number Title Priority Date Filing Date
JP20942398A Expired - Fee Related JP2986455B1 (ja) 1998-07-24 1998-07-24 手振り認識装置

Country Status (1)

Country Link
JP (1) JP2986455B1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110647244A (zh) * 2012-05-04 2020-01-03 三星电子株式会社 终端和基于空间交互控制所述终端的方法

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100413679B1 (ko) 2000-10-21 2003-12-31 삼성전자주식회사 형상 기술자 추출방법
JP4790113B2 (ja) * 2000-12-04 2011-10-12 ソニー株式会社 画像処理装置および方法、並びに記録媒体
JP2002190024A (ja) * 2000-12-19 2002-07-05 Namco Ltd 画像認識方法、これを用いた画像認識システム、コマンドインターフェイス、記録媒体
JP4389505B2 (ja) * 2003-08-11 2009-12-24 株式会社日立製作所 個人認証装置及び血管パターン抽出装置
US8270669B2 (en) 2008-02-06 2012-09-18 Denso Corporation Apparatus for extracting operating object and apparatus for projecting operating hand
WO2009125755A1 (ja) * 2008-04-08 2009-10-15 国立大学法人山口大学 開曲線フーリエ記述子を用いたx線画像処理方法及びシステム
JP5416489B2 (ja) * 2009-06-17 2014-02-12 日本電信電話株式会社 三次元指先位置検出方法、三次元指先位置検出装置、およびプログラム
JP5676959B2 (ja) * 2010-07-29 2015-02-25 キヤノン株式会社 情報処理装置及びその制御方法
WO2012044296A1 (en) * 2010-09-30 2012-04-05 Analogic Corporation Object classification using two-dimensional projection
JP5631700B2 (ja) * 2010-11-09 2014-11-26 株式会社竹中工務店 影画像表示システム、影画像表示方法、及び影画像表示プログラム
JP5658618B2 (ja) * 2011-05-16 2015-01-28 パナソニックIpマネジメント株式会社 操作入力装置、プログラム
CN103077381A (zh) * 2013-01-08 2013-05-01 郑州威科姆科技股份有限公司 一种基于分数阶傅里叶变换的单目动态手势识别方法
US10585486B2 (en) * 2014-01-03 2020-03-10 Harman International Industries, Incorporated Gesture interactive wearable spatial audio system
JP6603024B2 (ja) * 2015-02-10 2019-11-06 任天堂株式会社 情報処理プログラム、情報処理装置、情報処理システム、および、情報処理方法
CN106372564A (zh) * 2015-07-23 2017-02-01 株式会社理光 手势识别方法和装置
JP7280032B2 (ja) * 2018-11-27 2023-05-23 ローム株式会社 入力デバイス、自動車

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
相原恒博、大上健二、松岡靖,"人間の横顔認識におけるP形フーリエ記述子の有効成分の個数について",電子情報通信学会論文誌,1991年10月,Vol.J74−D−▲II▼,No.10,P.1486−1487

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110647244A (zh) * 2012-05-04 2020-01-03 三星电子株式会社 终端和基于空间交互控制所述终端的方法

Also Published As

Publication number Publication date
JP2000040147A (ja) 2000-02-08

Similar Documents

Publication Publication Date Title
JP2986455B1 (ja) 手振り認識装置
US10109055B2 (en) Multiple hypotheses segmentation-guided 3D object detection and pose estimation
Reale et al. A multi-gesture interaction system using a 3-D iris disk model for gaze estimation and an active appearance model for 3-D hand pointing
CN110363133B (zh) 一种视线检测和视频处理的方法、装置、设备和存储介质
WO2010073432A1 (ja) 画像処理装置および画像処理方法
JP5635736B2 (ja) 情報処理装置および情報処理方法
CN109359514B (zh) 一种面向deskVR的手势跟踪识别联合策略方法
CN107622257A (zh) 一种神经网络训练方法及三维手势姿态估计方法
JPH10214346A6 (ja) ハンドジェスチャ認識システムおよび方法
JP2010519629A (ja) 画像内の3次元物体のポーズを決定する方法及びデバイス並びに物体追跡のための少なくとも1つのキー画像を創出する方法及びデバイス
JP5598751B2 (ja) 動作認識装置
JP2000331170A (ja) 手振り認識装置
Watanabe et al. Extended dot cluster marker for high-speed 3D tracking in dynamic projection mapping
WO2013074153A1 (en) Generating three dimensional models from range sensor data
JP5468773B2 (ja) 画像処理装置および画像処理方法
JP3144400B2 (ja) ジェスチャ認識装置及び方法
JP6810442B2 (ja) カメラアセンブリ、そのカメラアセンブリを用いる手指形状検出システム、そのカメラアセンブリを用いる手指形状検出方法、その検出方法を実施するプログラム、及び、そのプログラムの記憶媒体
Liao et al. Fingertips detection algorithm based on skin colour filtering and distance transformation
JPH08212327A (ja) 身振り認識装置
JP2934190B2 (ja) 手振り認識装置
Che et al. Real-time 3d hand gesture based mobile interaction interface
JP2517531B2 (ja) ステレオ画像を用いた姿勢検出装置
Wang et al. Markerless body motion capturing for 3d character animation based on multi-view cameras
Chen et al. Real-time 3d hand shape estimation based on image feature analysis and inverse kinematics
Ukita et al. Real-time shape analysis of a human body in clothing using time-series part-labeled volumes

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19990914

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees