JP3688489B2 - 画像認識方法および画像認識装置 - Google Patents
画像認識方法および画像認識装置 Download PDFInfo
- Publication number
- JP3688489B2 JP3688489B2 JP37133298A JP37133298A JP3688489B2 JP 3688489 B2 JP3688489 B2 JP 3688489B2 JP 37133298 A JP37133298 A JP 37133298A JP 37133298 A JP37133298 A JP 37133298A JP 3688489 B2 JP3688489 B2 JP 3688489B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- distance
- predetermined time
- deformed
- pixel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
- G06T7/246—Analysis of motion using feature-based methods, e.g. the tracking of corners or segments
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/20—Movements or behaviour, e.g. gesture recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30241—Trajectory
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Psychiatry (AREA)
- Social Psychology (AREA)
- Human Computer Interaction (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
- Length Measuring Devices By Optical Means (AREA)
Description
【発明の属する技術分野】
本発明は、取得した距離画像または距離画像ストリームに基づいて画像の形状および/または動きを認識する画像認識装置及び画像認識方法に関する。
【0002】
【従来の技術】
従来、人間の手や顔の動きなどの3次元的な動きの認識を行う場合、まず、ビデオカメラなどの撮像装置を用いて、手や顔などの認識対象物を正面から撮影する。そして、その撮像された画像に現れる平面的な(奥行き情報を持たない)限られた動きの変化と、それ以外の様々な知識などを総動員して、3次元的な動きを推測することで認識を行っていた。
【0003】
それでは、その方法について幾つか説明する。
【0004】
1つ目の方法として、認識対象物の特徴点を用いて動きの推測を行う方法がある。これは、認識対象物に予め幾つかの特徴点を定めておいて、対象物の動きによって生じる特徴点どうしの位置関係の変化を用いて動きを推測する方法である。例えば、顔を左右に振っている(左右方向に回転させている)動作を認識する場合、顔の特徴点として、目や鼻など数カ所定めておき、顔の動きによって、目の位置の特徴点が左右に動いた、両目の特徴点の間隔が狭くなった、右目の特徴点が消失した(右目がカメラから見えない位置に移動したため)、などといった変化から顔を右に振っているのであろうと推測する。
【0005】
しかし、この方法を用いた場合、対応点をカメラ画像内で安定して得るためには、顔の特徴点の位置にマーカーなどを貼付しなければならないため、使用できる環境が限られているなどの問題があった。マーカーを用いないこともあるが、この場合は特徴点の抽出を安定的に行えない上に、特徴点を得るために多大な計算コストも必要としてしまう。
【0006】
また、別の方法として、運動モーメントの変化を求めることで推測する方法がある。これは、例えば、手を縦軸周りに回転させる動きの場合、手の横方向の前方投影面積が著しく変化するのに対し、縦方向はあまり変化しないというような性質を利用しており、このような場合、手の横方向の運動モーメントのみの変化が激しいことより、手を縦軸周りに回転させているのではないかと推測される。
【0007】
この方法は、確かに3次元的な動きを推測する一手法ではあるが、認識に使用できる対象物の形状に制限があったり、平面的な別の動きとの区別がつき難いため、誤認識をする可能性があるなどの問題点があった。
【0008】
また、認識対象物の幾何学的な形状の性質から推測する方法もある。例えば、さいころの3次元的な動きを認識する場合、現在、「1」の面がカメラから見えていて、それが「3」の面に変化したのだから、サイコロが回転したのだろうという推測が成り立つ。この方法は、認識対象物の幾何学的な立体情報の知識を用いているため、比較的確実に3次元的な動きを推測することが可能であるが、認識を行うことのできる物体が限られている、しかも、その物体に対する幾何学的な知識を必要とするといったように、汎用性に関する問題点がある。
【0009】
ここで挙げた以外にも様々な方法があるであろうが、何れにしても、これらの方法では、あくまでも平面的な情報のみしか持たない画像から、3次元的な動きを推測しているに過ぎず、3次元的な動きの認識を安定的に、高精度で行うことは困難である。もともと3次元的な形状の対象物をカメラで平面情報として取得した時点で、かなりの情報が欠落しているからである。
【0010】
これらの問題を回避するために、複数のビデオカメラを用いて、数カ所から同時に撮像し、各カメラの対応点を求めることで、複数の撮像画像から立体情報を計算し、それを用いて3次元的な動きを求めるということが行われていた。
【0011】
この方法では、実際に複数の撮像画像から立体情報を構成しているため、上述したような平面情報から3次元情報を推測するという問題点は解決されるが、複数のカメラからの画像を立体的に融合するための対応点の計算に大変計算時間を必要とするため、リアルタイム処理に不向きであった。また、対応点を求めるためにカメラの位置情報を必要とするため、カメラの位置に制約があったり、カメラ位置のキャリブレーションの必要があったりした。
【0012】
以上のように、従来方法では、画像から3次元的な動きの認識を行う方法には様々な問題点があった。
【0013】
【発明が解決しようとする課題】
従来の手法では、ビデオカメラなどを用いて認識対象物を2次元情報しかもたない画像として取得していたため、3次元的動きの認識を、2次元情報のみから行うしかなく、安定して、高精度で3次元的な動きの認識を行うことは困難であるという問題点があった。
【0014】
また、認識対象をあらかじめテンプレートあるいは認識辞書として準備しておく必要があり、テンプレートや認識辞書の作成の手間が煩雑であるばかりでなく、認識対象に応じて、常に作成し直すコストが膨大であるという問題点があった。
【0015】
さらに、認識時に、膨大なテンプレートとのマッチングを行う必要があり、認識処理に時間がかかるとい問題点があった。
【0016】
そこで、本発明は、対象物に対する距離画像の3次元的な変形画像を用いることにより、認識のためのテンプレートや辞書を作る手間なく、かつ3次元的な動きの認識を短時間でしかも安定して高精度に行うことができる画像認識方法およびそれを用いた画像認識装置を提供することを目的とする。
【0017】
【課題を解決するための手段】
(1)本発明の画像認識方法は、取得した距離画像に対し変形を施して得られた変形画像と新たに取得した距離画像とを比較することにより、前記距離画像中の対象物の3次元的な動きの有無を認識することを特徴とする。
【0018】
本発明によれば、対象物に対する距離画像の3次元的な変形画像を用いることにより、認識のためのテンプレートや辞書を作る手間なく、かつ3次元的な動きの有無の認識を短時間でしかも安定して高精度に行うことができる。
【0019】
(2)本発明の画像認識方法は、取得した距離画像に対し変形を施して得られた変形画像と新たに取得した距離画像とを比較することにより、前記距離画像中の対象物の3次元的な動きの有無を認識し、一連の複数の距離画像のそれぞれから認識された一連の動きを認識することを特徴とする。
【0020】
本発明によれば、対象物に対する距離画像の3次元的な変形画像を用いることにより、認識のためのテンプレートや辞書を作る手間なく、かつ3次元的な動きの認識を短時間でしかも安定して高精度に行うことができる。
【0021】
(3)好ましくは、前記認識された一連の動きに基づき前記対象物の動きを予測する。
【0022】
好ましくは、前記取得した距離画像から抽出された前記対象物の特徴量を基に前記対象物の動きを予測する。
【0023】
好ましくは、前記取得した距離画像から抽出された前記対象物の特徴量と前記認識された一連の動きとに基づき、前記対象物の動きを予測する。
【0024】
対象物の動きを予測することで、例えば、距離画像の変形態様を限定することができ、認識処理の時間短縮が図れる。
【0025】
(4)好ましくは、前記認識された対象物の動きに基づき前記画像取得手段で取得された距離画像を圧縮する。
【0026】
これにより、高い圧縮率が実現でき、距離画像を通信を用いて転送する際の通信時間が短縮できる。
【0027】
(5)本発明の画像認識装置は、距離画像を取得する画像取得手段と、
この画像取得手段で取得した距離画像に対し変形を施す画像変形手段と、
この画像変形手段で得られた変形画像と前記画像取得手段で新たに取得した距離画像とを比較することにより、対象物の3次元的な動きの有無を認識する認識手段と、
を具備する。
【0028】
本発明によれば、対象物に対する距離画像の3次元的な変形画像を用いることにより、認識のためのテンプレートや辞書を作る手間なく、かつ3次元的な動きの有無の認識を短時間でしかも安定して高精度に行うことができる。
【0029】
(6)本発明の画像認識装置は、距離画像を取得する画像取得手段と、
この画像取得手段で取得した距離画像に対し変形を施す画像変形手段と、
この画像変形手段で得られた変形画像と前記画像取得手段で新たに取得した距離画像とを比較することにより、対象物の3次元的な動きの有無を認識する第1の認識手段と、
この認識手段で一連の複数の距離画像のそれぞれから認識された一連の動きを認識する第2の認識手段と、
を具備する。
【0030】
本発明によれば、対象物に対する距離画像の3次元的な変形画像を用いることにより、認識のためのテンプレートや辞書を作る手間なく、かつ3次元的な動きの認識を短時間でしかも安定して高精度に行うことができる。
【0031】
(7)本発明の画像認識装置は、距離画像を取得する画像取得手段と、
この画像取得手段で取得した距離画像を記憶する記憶手段と、
前記画像取得手段で取得した距離画像およびまたは前記記憶手段に記憶された距離画像のうち指定された距離画像に対し変形を施す画像変形手段と、
この画像変形手段で得られた変形画像あるいは前記記憶手段に記憶された距離画像と、前記画像取得手段で新たに取得した距離画像とを比較することにより、対象物の3次元的な動きの有無を認識する認識手段と、
を具備する。
【0032】
本発明によれば、対象物に対する距離画像の3次元的な変形画像を用いることにより、認識のためのテンプレートや辞書を作る手間なく、かつ3次元的な動きの有無の認識を短時間でしかも安定して高精度に行うことができる。
【0033】
また、予め蓄えられた距離画像の変形画像をテンプレート画像とした認識を行うことにより、予め判別したい動きの距離画像を記憶手段に登録しておけば、その動作が行われたのかどうかを認識することが可能になる。
【0034】
(8)本発明の画像認識装置は、距離画像を取得する画像取得手段と、
この画像取得手段で取得した距離画像を記憶する記憶手段と、
前記画像取得手段で取得した距離画像およびまたは前記記憶手段に記憶された距離画像のうち指定された距離画像に対し変形を施す画像変形手段と、
この画像変形手段で得られた変形画像あるいは前記記憶手段に記憶された距離画像と、前記画像取得手段で新たに取得した距離画像とを比較することにより、対象物の3次元的な動きの有無を認識する第1の認識手段と、
この第1の認識手段で一連の複数の距離画像のそれぞれから認識された一連の動きを認識する第2の認識手段と、
を具備したことを特徴とする。
【0035】
本発明によれば、対象物に対する距離画像の3次元的な変形画像を用いることにより、認識のためのテンプレートや辞書を作る手間なく、かつ3次元的な動きの認識を短時間でしかも安定して高精度に行うことができる。
【0036】
また、予め蓄えられた距離画像の変形画像をテンプレート画像とした認識を行うことにより、予め判別したい動きの距離画像を記憶手段に登録しておけば、その動作が行われたのかどうかを認識することが可能になる。
(9)好ましくは、前記第2の認識手段で認識された一連の動きに基づき前記対象物の動きを予測する予測手段をさらに具備する。
【0037】
好ましくは、前記画像取得手段で取得された距離画像から前記対象物の特徴量を抽出する特徴量抽出手段と、
この特徴量抽出手段で抽出された特徴量を基に、前記対象物の動きを予測する予測手段と、
を具備さらに具備する。
【0038】
好ましくは、前記画像取得手段で取得された距離画像から前記対象物の特徴量を抽出する特徴量抽出手段と、
この特徴量抽出手段で抽出された特徴量と前記第2の認識手段で認識された一連の動きとに基づき、前記対象物の動きを予測する予測手段と、
を具備する。
【0039】
対象物の動きを予測することで、例えば、距離画像の変形態様を限定することができ、認識処理の時間短縮が図れる。
(10)好ましくは、前記認識された対象物の動きに基づき前記画像取得手段で取得された距離画像を圧縮する画像圧縮手段を具備する。
【0040】
これにより、高い圧縮率が実現でき、距離画像を通信を用いて転送する際の通信時間が短縮できる。
【0041】
【発明の実施の形態】
以下、図面を参照しながら発明の実施の形態を説明する。
【0042】
(第1の実施形態)
まず、本発明の第1の実施形態について説明する。
【0043】
図1は、本発明の第1の実施形態に係る画像認識装置の全体構成図である。
【0044】
本実施形態の画像認識装置は、距離画像ストリームを取得するための撮像手段を備えた画像取得部1と、画像取得部1で取得された任意の距離画像に3次元的な回転変形処理を施すための画像変形部2と、画像変形部2で得られた変形後の距離画像と、画像取得部1で取得された距離画像ストリーム中の任意の距離画像とを比較するための画像比較部3とから構成される。
【0045】
まず、画像取得部1および距離画像について説明する。
【0046】
画像取得部1は、認識対象物体(例えば、人間の手、顔、全身など)を、その3次元形状を反映した奥行き値を持つ画像(以降、距離画像と呼ぶ)として所定時間毎(例えば1/30秒毎など)に取得するものである(例えば、特願平8−274949号の画像取得方法などを用いて実現することができる)。
【0047】
所定時間毎に距離画像が取得されてゆくため、これらをメモリなどを用いて、画像取得部1の内部または外部で逐次保持することで、対象物の距離画像による動画像(以降、距離画像ストリームと呼ぶ)を得ることができる。このとき、距離画像ストリームは、距離画像の取得間隔をt秒としたとき、「最新の距離画像」、「最新からt秒前(以降、1フレーム前と呼ぶ)の距離画像」、「最新から2t秒前(2フレーム前、以下同様)の距離画像」、…、といった複数フレームの距離画像の集合体として得られることになる。
【0048】
画像取得部1は、図2に示すように、主に、発光部101、受光部103、反射光抽出部102、タイミング信号生成部104から構成される。
【0049】
発光部101は、タイミング信号生成部104にて生成されたタイミング信号に従って時間的に強度変動する光を発光する。この光は発光部前方にある対象物体に照射される。
【0050】
受光部103は、発光部101が発した光の対象物体による反射光の量を検出する。
【0051】
反射光抽出部102は、受光部103にて受光された反射光の空間的な強度分布を抽出する。この反射光の空間的な強度分布は画像として捉えることができるので、これを反射光画像あるいは距離画像と呼ぶ。
【0052】
受光部103は一般的に発光部101から発せられる光の対象物による反射光だけでなく、照明光や太陽光などの外光も同時に受光する。そこで、反射光抽出部102は発光部101が発光しているときに受光した光の量と、発光部101が発光していないときに受光した光の量の差をとることによって、発光部101からの光の対象物体による反射光成分だけを取り出す。
【0053】
反射光抽出部102では、受光部103にて受光された反射光から、その強度分布、すなわち、図3に示すような反射光画像(距離画像)を抽出する。
【0054】
図3では、簡単のため、256×256画素の反射光画像の一部である8×8画素の反射光画像の場合について示している。
【0055】
物体からの反射光は、物体の距離が大きくなるにつれ大幅に減少する。物体の表面が一様に光を散乱する場合、反射光画像1画素あたりの受光量は物体までの距離の2乗に反比例して小さくなる。
【0056】
反射光画像の各画素値は、その画素に対応する単位受光部で受光した反射光の量を表す。反射光は、物体の性質(光を鏡面反射する、散乱する、吸収する、など)、物体の向き、物体の距離などに影響されるが、物体全体が一様に光を散乱する物体である場合、その反射光量は物体までの距離と密接な関係を持つ。手などは、このような性質をもつため、距離画像取得部1の前方に手を差し出した場合の反射光画像は、手までの距離、手の傾き(部分的に距離が異なる)などを反映する図4に示したような3次元的なイメージを得ることができる。
【0057】
図5は、例えば、特願平9−299648号に記載されているような画像取得部1を構成する発光部101と、受光部103の外観の一例を示したもので、中央部には円形レンズとその後部にあるエリアセンサ(図示せず)から構成される受光部103が配置され、円形レンズの周囲にはその輪郭に沿って、赤外線などの光を照射するLEDから構成される発光部101が複数(例えば6個)等間隔に配置されている。
【0058】
発光部101から照射された光が物体に反射され、受光部103のレンズにより集光され、レンズの後部にあるエリアセンサで受光される。エリアセンサは、例えば256×256のマトリックス状に配列されたセンサで、マトリックス中の各センサにて受光された反射光の強度がそれぞれ画素値となる。このようにして取得された画像が、図3に示すような反射光の強度分布としての距離画像である。
【0059】
図3は、距離画像データの一部(256x256画素の一部の8x8画素)を示したものである。この例では、行列中のセルの値(画素値)は、取得した反射光の強さを256ビットで示したものである。例えば、「255」の値があるセルは、画像取得部1に最も接近した状態、「0」の値があるセルは、画像取得部1から遠くにあり、反射光が画像取得部1にまで到達しないことを示している。
【0060】
図4は、図3に示したようなマトリックス形式の距離画像データ全体を3次元的に示したものである。この例では、人間の手の距離画像データの場合を示している。
【0061】
図6に、画像取得部1により取得された手の距離画像の例を示す。距離画像は、奥行き情報を有する3次元画像で、例えば、x軸(横)方向64画素、y軸(縦)方向64画素、z軸(奥行き)方向256階調の画像になっている。図6は、距離画像の距離値、すなわちz軸方向の階調をグレースケールで表現したもので、この場合、色が黒に近いほど画像取得部1からの距離が近く、白に近くなるほど距離が遠いことを示している。また、色が完全に白のところは、画像がない、あるいはあっても遠方でないのと同じであることを示している。
【0062】
物体からの反射光の強さは当該物体までの距離の2乗に反比例して小さくなる。すなわち、距離画像中の各画素(i、j)の画素値をQ(i、j)とすると、
Q(i、j)=K/d2
と表すことができる。
【0063】
ここで、Kは、例えば、d=0.5mのときに、R(i、j)の値が「255」になるように調整された係数である。上式をdについて解くことで、距離値を求めることができる。
【0064】
次に、画像変形部2について説明する。
【0065】
画像変形部2は、画像取得部1によって取得された認識対象物体の距離画像ストリーム中に含まれる距離画像のうち、常に最新より数フレーム前(例えば、常に1フレーム前)の距離画像(以降、サンプル画像と呼ぶ)に3次元的な回転変形処理を施し、新たな距離画像(以降、変形画像と呼ぶ)を生成するものである。
【0066】
ここで、サンプル画像として何フレーム前の距離画像を用いるかは、画像取得部1の距離画像取得間隔(フレームレート)、対象物の動作速度などの情報を基に決定する。例えば、y軸回りに手を回転させる、といったような一連の動作の間に、Nフレーム取得できるならば、サンプル画像は、1ないしNフレーム前の距離画像の間で任意に選べばよい。
【0067】
それでは、画像変形部2で実際にどのようにして距離画像に3次元的な回転変形処理を行うのかを詳細に説明する。図7に画像変形部2における回転変形処理を説明するためのフローチャートを示す。
【0068】
まず、各画素(x、y)位置の距離値d(x、y)=zの時、その画素位置にはz個の立方体(以降、ボクセルと呼ぶ)が積み重なっていると見なし、図8のように距離画像をボクセル単位に分割する(ステップS1)。
【0069】
なお、以上に示したボクセル分割の方法は一例であり、図9のように対象物のボクセル分割の範囲を限定してもよい。例えば、図9(a)に示すように、下方向に無限にボクセルが続いているとみなしたり、図9(b)に示すように、ある範囲以下では、ボクセルは存在しないとみなしたり、また、図9(c)(d)に示すように、表面付近にしかボクセルがないとみなすなどしてもよい。
【0070】
次に、回転の中心(x0、y0、z0)を決定する(ステップS2)。なお、回転の中心位置は、目的により任意に定めることができる。例えば、顔の回転を求めたければ、クビの中心軸が中心になるようにすればよいし、手の回転を求めたければ、手の重心位置にすればよい。
【0071】
さらに、回転の方向(θx、θy、θz)を決定する(ステップS3)。ここで、θxはx軸に対する回転角、θyはy軸に対する回転角、θzはz軸に対する回転角である。
【0072】
この際、回転角は、認識対象物の動作速度と、画像取得部1の距離画像取得間隔(フレームレート)、および何フレーム前をサンプル画像とするかにより定めることができる。例えば、手のy軸回りの回転動作の速度が30度/秒ぐらいの動作を、1フレーム前をサンプル画像とし、フレームレートが1/30秒の撮像装置で捉えたい場合には、手は1フレーム間で1度回転することになるから、θy=1度とすればよい。
【0073】
そして、図10(a)に示す各ボクセル(x、y、z)毎に次式(1)を用いて回転後の位置(x’、y’、z’)を計算する(ステップS4)。
【0074】
【数1】
【0075】
式(1)では、図7のステップS2で求めた回転の中心位置(x0、y0、z0)を中心に、各ボクセル(x、y、z)をx軸、y軸、z軸に対し、それぞれθx、θy、θzだけ回転させる場合の計算式を示している。
【0076】
ここで、座標(x、y、z)にあるボクセルのことを、ボクセル(x、y、z)と呼ぶ。
【0077】
全てのボクセルについて、ステップS4の演算処理を行う(ステップS5)。各ボクセルを回転させた結果を図10(b)に示す。
【0078】
全てのボクセルについて終了したら、図11(a)に示すように、各画素位置(x、y)にあるボクセル(x、y、z)のzの最大値(Zmax)を求め、それを変形画像の画素(x、y)の距離値d(x、y)=Zmaxとして、距離画像を再構成する(ステップS6)。
【0079】
なお、以上の説明において、ボクセル分割と式(1)による回転変形処理の流れは、あくまでも一例であり、これに限定されるものではない。他の手法を用いて距離画像の回転変形を行っても構わない。
【0080】
以上の作業により、サンプル画像に、任意の3次元的な回転処理を施した距離画像、すなわち変形画像を生成することができる。
【0081】
図12(a)にサンプル画像と、図12(b)に画像変形部2でサンプル画像に3次元的な回転変形処理を施した変形画像の例を示す。この例では、手のサンプル画像をy軸(縦方向)回りに回転変形処理を行うことにより得られた変形画像が示されている。
【0082】
次に、画像比較部3について説明する。
【0083】
画像比較部3では、画像取得部1によって取得された最新の距離画像(以降、最新画像と呼ぶ)と、画像変形部2で得られた変形画像とを比較し、これら2画像が類似しているかどうかを判別する。
【0084】
この際、類似の判別は、最新画像と変形画像の相関を求めることにより行う。テンプレートマッチング法は、その一手法で、比較対象物の画像と、予め用意したテンプレート画像との類似度を計算することで、対象物の画像とテンプレート画像が類似しているかどうかを比較する方法である。ここでは、このテンプレートマッチング法を用いることにより、相関を求めることとする。
【0085】
具体的には、変形画像をテンプレート画像とし、それと最新画像とを、テンプレートマッチング法を用いて比較することで、両者の類似の度合いを判別する。
【0086】
図13(a)は、図12(b)に示したサンプル画像に回転処理を施して得られた変形画像で、図13(b)は、最新画像の例を示す。これら変形画像と最新画像との間の類似の度合いを判別するのである。
【0087】
図14に画像比較部3におけるテンプレートマッチング法を用いた処理の流れを説明するためのフローチャートを示す。以下、処理の流れを図14に沿って説明する。
【0088】
まず、必要であれば、最新画像とテンプレート画像の位置の正規化を行う(ステップS11)。位置の正規化は、例えば、最新画像とテンプレート画像の両者の重心位置を一致させることにより求めることができる。このようにするためには、具体的には、最新画像の重心位置を(xc 、yc 、zc)、テンプレート画像の重心位置を(xt、yt、zt)とすると、テンプレート画像をx方向にxc−xt、y方向にyc−yt、z方向にzc−ztの距離だけ平行移動すればよい。
【0089】
なお、ここでは、位置の正規化の一手法を説明したが、位置の正規化の方法はこれに限定されるものではなく、最新画像とテンプレート画像の両者の重心が特定の場所になるように、両者をそれぞれ平行移動してもよいし、重心位置以外の他の手がかりを用いることで行っても良い。
【0090】
次に、最新画像とテンプレート画像とのハミング距離を計算する(ステップS12)。ハミング距離(H)は、次式(2)より計算する。
【0091】
【数2】
【0092】
ここで、i、jはそれぞれ各画素のx、y座標、d(i、j)は最新画像の座標(i、j)での距離値、t(i、j)はテンプレート画像の座標(i、j)での距離値である。
【0093】
なお、ここでは、ハミング距離の導出の一方法を説明したが、ハミング距離の導出は、これに限定されるものではなく、他の計算式を用いても良い。
【0094】
そして、このハミング距離(H)の値が、予め定めた閾値(Th)を下回っている(すなわち、H<Th)かどうか判定する。閾値を下回っている場合は、最新画像とテンプレート画像が類似していると見なす(ステップS13〜ステップS14)。
【0095】
以上の作業により、最新画像と変形画像が類似しているかどうかを判別することができる。
【0096】
なお、ここでは、最新画像とテンプレート画像とのハミング距離を求めることで、最新画像とテンプレート画像の類似度を計算する方法について説明したが、類似度の計算は、これに限定されるものではなく、ハミング距離とは異なった定義を持つ距離の計算を用いる方法など、他の計算方法を用いても構わない。
【0097】
また、ここでは、テンプレートマッチング法を用いて相関を計算する方法について説明したが、相関の導出方法はこれに限定されるものではなく、DPマッチング法、KL変換法などを用いて求める方法、両画像をフーリエ変換し、フーリエ変換後の画像について相関解析をする方法など、考えられるあらゆる方法を用いることができる。
【0098】
以上説明したように、本実施形態では、数フレーム前(例えば、1フレーム前)の画像を回転させたものと、最新の画像が類似しているかどうかを知ることができる。つまり、対象物が数フレーム前から現在までに、回転を行ったかどうかを認識することができる。
【0099】
さらに、本実施形態では、従来の2次元画像内の2次元的な情報から、3次元的な回転を推測するといった認識手法(例えば、手のx軸方向(横方向)の投影面積が減少したから、手をy軸周りで回転したのであろうといったもの)と異なり、実際に距離画像の3次元的な回転を行い、その3次元的な情報を用いることで認識を行っているため、従来法よりも、より確実に、より安定して認識を行うことが可能である。
【0100】
また、従来のテンプレートマッチングを用いた認識では、予め多数のテンプレート画像を用意しておく必要があったが、本実施形態の方法では、常にリアルタイムに変形画像を生成し、それをテンプレート画像として用いるため、予めテンプレート画像を用意しておく必要がなく、メモリなどを消費しないため効率的である。
【0101】
また、従来のテンプレートマッチングを用いた認識の場合、予めあらゆるテンプレート画像を全て用意することは事実上不可能なので、通常は、認識対象物の代表的な形状と考えられているものを幾つか選別して用意しておくことが多い。例えば、顔の認識の場合、成人男性の顔、成人女性の顔、子供の顔、老人の顔などを何人分か用意するといったようにである。このとき、比較対象となるテンプレート画像は代表的な形状で代用されるため、現在の認識対象物と細部の面で異なることが多く、それが類似度を下げる一因になっていた。また、不特定の対象物に対して認識を行おうとする場合、テンプレート画像をなるべく多数用意しなければ、認識率を向上させることができなかった。しかし、本実施形態の方法では、認識対象物自身を変形することによりテンプレート画像を生成しているため、このような問題点は生じることがなくなった。
【0102】
以上のように、本実施形態によれば、認識対象物の数フレーム前の距離画像の3次元的な回転変形をその場で行い、その変形により得られた画像と現在の距離を比較することで、対象物の3次元的な回転動作をリアルタイムで、安定して認識することが可能となった。
【0103】
本実施形態は、上記した構成に限定されず、種々変形して実施することができる。以下では、本実施形態のいくつかの変形例を示す。
(第1の実施形態の第1の変形例)
画像取得部1で、所定時間毎に距離画像を取得するのではなく、特定のタイミング(例えば、ユーザの指示など)で距離画像を取得するようにしてもよい。
【0104】
このようにすることにより、例えばユーザが開始時と終了時をスイッチで指示し、その間に回転動作が行われたかどうかといったような、任意の時間間隔内での3次元的な回転動作認識を行うことが可能である。
【0105】
例えば、自動車では事故時の衝突を和らげるために、エアバッグ装備が法制化されている。が、エアバッグの膨張時に助手席の同乗者がどちらを向いてどのあたりに座っているかを検知して、同乗者をエアバッグで圧迫することがないようにせねばならない。このような時、座席に座って、シートベルトを装着した時点で、助手席の同乗者の顔の距離画像を取得し、それをサンプル画像として変形画像を求める。エアバッグを膨らませる直前の顔の距離画像を取得し、変形画像と比較することで、同乗者の顔の位置と向きを高精度で認識することが可能となる。
(第1の実施形態の第2の変形例)
画像変形部2で、最新のフレームではなく、過去の特定のフレームを基準として、そこから数フレーム前(例えば、1フレーム前)の距離画像の3次元的な回転変形処理により変形画像を生成し、画像比較部3で、画像変形部2で基準としたフレームと、画像変形部2で得られた変形画像とを比較し、これら2画像が類似しているかどうかを判別するようにしてもよい。
【0106】
このようにすることにより、過去の特定の時点での3次元的な回転動作認識を行うことが可能である。
(第1の実施形態の第3の変形例)
画像変形部2および画像比較部3を以下のように変更して用いることもできる。
【0107】
新たな画像変形部2では、サンプル画像に、変形パラメータが異なる複数の3次元的な回転変形処理を施し、複数の変形画像の生成を行う。
【0108】
そして、新たな画像比較部3では、画像取得部1によって取得された最新画像と、新たな画像変形手部2で得られた変形パラメータが異なる複数の変形画像とを比較し、最新画像と類似している変形画像があるか、あるならば、どの変形画像が最も類似しているかを判別する。
【0109】
それでは、本変形例の新たな画像変形部2でどのような処理を行うのかを具体的に説明する。
【0110】
例えば、図15に示したような人の顔の距離画像がサンプル画像として得られたとする。
【0111】
この顔のサンプル画像に対して、図16〜図19に示すように、例えば、上下左右方向にそれぞれ同じ角度だけ回転させた4つの変形画像を生成する。図16は、頭の重心位置を中心とし、(θx、θy、θz)=(2、0、0)だけ回転させて、顔を少し上に向かせたものである。図17は、同じく、頭の重心位置を中心とし、(θx、θy、θz)=(−2、0、0)だけ回転させて、顔を少し下に向かせたものである。図18は、同じく、頭の重心位置を中心とし、(θx、θy、θz)=(0、2、0)だけ回転させて、顔を紙面に向かって少し右に向かせたものである。図19は、同じく、頭の重心位置を中心とし、(θx、θy、θz)=(0、−2、0)だけ回転させて、顔を紙面に向かって少し左に向けたものである。なお、角度の単位は、「度」である。
【0112】
図16〜図19は、それぞれ回転変形させたことにより、画像取得部1に近づく方向に変形された部分の色が黒に近づき、遠くなる方向に変形された部分が白に近くなっている。
【0113】
次に、画像変形部2で得られた図16〜図19の4つの変形画像を全てテンプレート画像として、画像比較部3では、これら変形画像と図20に示すような最新画像とでテンプレートマッチング法を用いて、4つの変形画像中で最新画像に類似しているものがあるかどうか、あるならば、どれが一番類似しているかを調べる。
【0114】
図21に新たな画像比較部3におけるテンプレートマッチング法を用いた処理の流れを説明するためのフローチャートを示す。以下、処理の流れを図21に沿って説明する。
【0115】
まず、テンプレート画像(Ti)を1つ選択する(ステップS21)。すなわち、Tiは、図16〜図19の4つの変形画像中のどれかということになる。
【0116】
そして、必要であれば、図14の説明と同様に、位置の正規化を行う(ステップS22)。
【0117】
次に、図14の説明と同様に、最新画像とテンプレート画像(Ti)とのハミング距離を計算する(ステップS23)。
【0118】
全てのテンプレート画像についてハミング距離の計算が終わったかどうか判定する(ステップS24)。終わっていなければ、ステップS21に戻る。全てのテンプレート画像について終わったら、ハミング距離が最小(Hmin)となるテンプレート画像(Tmin)を選ぶ(ステップS25)。ここでは、例えば、図16に示した変形画像が選ばれたとする。
【0119】
そして、このハミング距離(Hmin)の値が、予め定めた閾値(Th)を下回っている(すなわち、Hmin<Th)かどうか判定する(ステップS26)。閾値を下回っている場合は、最新画像とテンプレート画像(Ti)が類似していると見なす(ステップS27)。もしこの条件に当てはまれば、図16の変形画像が最新画像に類似していることが求められた。
【0120】
以上の作業により、最新画像と最も類似している変形画像を知ることができる。(類似している変形画像がないという結果が得られる場合もある(ステップS28)。)
このようにすることで、図20に示した最新画像は、図16に示した顔を右側に向けたものと類似していることが得られたので、「顔を右側に向けた」ことが認識された。
【0121】
以上のように、本変形例では、認識対象物の回転方向(どちら側に回転したか)を認識することが可能である。
【0122】
なお、ここでは、上下左右の4方向について変形画像を作成する方法について説明したが、これは変形パラメータが異なる複数の3次元的な回転変形処理の一例であり、これに限定されるものではない。上下左右、右上、左上、右下、左下の8方向にしたり、右側だけを重点的に調べるために増やしたり、また、同じ方向でも、回転角を代えたものを複数枚用意したり、というように認識の目的に応じて自由に選択することができる。
【0123】
例えば、手の回転動作を考える。図22で示したようなサンプル画像に対し、図23〜図26に示したような手の重心位置を中心として、上下左右の4方向のそれぞれに回転させて変形画像を生成する交わりに、図27〜図30に示すように、上下左右方向にそれぞれ回転角の異なる変形画像を複数(この例では、1度と2度の2通り)生成してもよい。
【0124】
図27(a)は、(θx、θy、θz)=(1、0、0)だけ回転させて、手を少し上に向けたもので、図27(b)は、さらに1度、(θx、θy、θz)=(2、0、0)だけ回転させて、手をさらに上に向けたものである。図28(a)は、(θx、θy、θz)=(−1、0、0)だけ回転させて、手を少し下に向けたもので、図28(b)は、さらに1度、(θx、θy、θz)=(−2、0、0)だけ回転させて、手をさらに上に向けたものである。図29(a)は、(θx、θy、θz)=(0、1、0)だけ回転させて、手を紙面に向けて右に少し向けたもので、図29(b)は、さらに1度、(θx、θy、θz)=(0、2、0)だけ回転させて、手をさらに右に向けたものである。図30(a)は、(θx、θy、θz)=(0、−1、0)だけ回転させて、手を紙面に向けて左に少し向けたもので、図30(b)は、さらに1度、(θx、θy、θz)=(0、−2、0)だけ回転させて、手をさらに左に向けたものである。
【0125】
このように、上下左右方向にそれぞれ回転角の異なる変形画像を複数(この例では、1度と2度の2通り)用意することで、認識対象物の回転方向だけでなく、回転量も同時に認識することができる。
【0126】
このとき、距離画像取得のフレームレートが変化しなければ、回転量は、動作の速度に比例するので、動作方向と動作速度の認識が同時に行われたことになる。
【0127】
つまり、手をどちら側に向けたか、というような対象物の動作の認識だけでなく、その動作の速度も同時に得ることができる訳である。
(第1の実施形態の第4の変形例)
第1の実施形態の画像変形部2では、3次元的な回転変形処理を施して変形画像を生成したが、何の変形も行わないもの、つまりサンプル画像をそのまま変形画像として用いることも可能である。
【0128】
この場合、認識対象物が静止していたかどうかの認識が可能である。
(第1の実施形態の第5の変形例)
第1の実施形態の画像変形部2では、3次元的な回転変形処理を施して変形画像を生成したが、平行移動変形処理を施して変形画像を生成するようにしてもよい。
【0129】
この場合、認識対象物の3次元的な平行移動動作の認識が可能である。
【0130】
また、画像変形部2における変形手段の一手法として平行移動変形処理について説明したが、変形手段はこれに限定されるものではなく、拡大・縮小、反転(ミラーリング)、トリミングなど、その他考えられる全ての変形手法を用いることが可能である。
【0131】
このようにすることで、例えば、3次元的な拡大・縮小動作の認識などといったような、認識対象物の任意の変形に関する動作認識を行うことが可能となる。
【0132】
さらに、画像変形部2で、これらの変形処理を複数組み合わせて同時に施すことで、回転動作、平行移動動作といった単一の動作の認識のみだけでなく、任意の動作の認識を行うことが可能である。
【0133】
例えば、「手のz軸(奥行き)方向の平行移動変形」と「y軸(縦方向)周りの回転変形」を組み合わせて変形画像を生成することで、手を奥行き方向の前後に動かしながら縦軸周りに左右に回転させるなどという動作を認識することができる。
(第2の実施形態)
次に、本発明の第2の実施形態について説明する。
【0134】
図31は、本発明の第2の実施形態に係る画像認識装置の全体構成図である。
【0135】
本実施形態の画像認識装置は、第1の実施形態の画像認識装置に加え、画像比較部3での比較結果を用いて動きの認識を行うための動き認識部4が追加された構成になっている。
【0136】
それでは、動き認識部4について説明する。
【0137】
第1の実施形態に係る画像認識装置を用いることで、最新フレームとその数フレーム前との間で回転動作が行われたかどうかを判別することが可能であった。第1の実施形態における画像取得部1では、所定の間隔で、逐次距離画像の取得が行われるため、この回転動作の判別を最新フレームが得られる毎に繰り返すことで、「回転動作が行われた」および「回転動作がおこなわれなかった」という2つの選択肢のうちの1つが認識結果として逐次得られてゆくことになる。
【0138】
動き認識部4では、この画像比較部3で逐次得られた回転動作が行われたかどうかの判定結果の流れを用いて、さらに詳細に、その回転動作にどのような意味があるかという動きの認識を行うものである。
【0139】
画像比較部3では、その時点での最新フレームで回転動作が行われたかどうかの判定結果が逐次得られるので、任意の時間間隔内での回転動作が行われた回数の合計をカウントすることで、その時間間隔内に行われた動作の回数を知ることができる。
【0140】
これにより、例えば、病気や事故などで声を発することができず、手しか動かせないような人の場合でも、例えば、手を1回転させたら「はい」、2回なら「いいえ」、3回なら「なにかしたい」などというように自分の意志を伝えることが可能となる。従来、病室などにいる患者が何か異常をきたした場合には、枕元にある押しボタン式のブザーで、看護婦や医者を呼び出し、インターフォンで会話をすることで意思を伝えていた。しかし、声を発することができない場合には、看護婦や医者が病室に到着するまで意思の疎通が困難だった。このような場合に本画像認識装置をブザーやインターフォンの代わりに用いることで、前述したように医者や看護婦がその場にいなくても意思の疎通が可能となる。
【0141】
さらに、本実施形態の画像認識装置では、特定時間で回転動作を「した、した、しない、した、しない、…」といった様に、動作をしたかどうかのパターンとして得ることも可能である。
【0142】
このようにすることにより、例えば、本画像認識装置をパーソナルコンピュータ(PC)に接続し、回転動作を「しない、しない、した」という動作パターンが得られた時には、ワープロソフトを起動する、「しない、した、した」の時には、表計算ソフトを起動する、などというようにして、予め定めておいた動作パターンに応じて何が起こるかを決めておき、ユーザの手振りのアクションなどでPCを操作することが可能となる。また、同様にして、あるパターンの時は、電源ON、別のパターンの時は音量の切り替え、というようにTV・ビデオなどの家電機器を操作する、パターンによってキャラクターの動きを変えるなどというようにゲーム機の操作に用いる、といったようにハンドアクションでの様々な機器の操作などに用いることができる。
【0143】
例えば、画像比較部3で、任意の時間間内で手の回転動作の回数を計数する場合、動き認識部4は、手を1回転させた動作に対し「はい」、2回転させた動作に対し「いいえ」、3回転させた動作に対し「なにかしたい」という動きの意味(種類)を記憶したテーブルを持っている。動き認識部4では、このテーブルを参照して、画像比較部3での認識結果から得られる動き(例えば、手の回転)の回数に対応する、その動きの種類を認識して出力する。
【0144】
例えば、画像比較部3で回転動作を「する」「しない」という認識が行われるのであれば、動き認識部4には、回転動作を「しない、しない、した」という一連の動作パターンに対し「ワープロソフトを起動する」という種類の動きを、また、回転動作を「しない、した、した」という一連の動作パターンに対し「表計算ソフトを起動する」という種類の動きを予め記憶したテーブルを持っている。動き認識部4では、このテーブルを参照して、画像比較部3での認識結果から得られる予め定められた一連の動作パターンに対応する、その動きの種類を認識して出力する。
(第2実施形態の第1の変形例)
第1の実施形態の第3の変形例で説明した画像認識装置に、上で説明した動き認識部4が追加された場合、動き認識部4では、どのような動作が続けて行われたのかを知ることができる。
【0145】
例えば、顔を撮像し、「顔を右に回転した」「顔の動きはない(静止している)」、「顔を左に回転した」、「顔を左に回転した」、「顔の動きはない」、「顔を右に回転した」、…、といった動作が行われたならば、顔を左右に振っている(いいえの動作をしている)と認識することができる。
(第2の実施形態の第2の変形例)
第1の実施形態の第5の変形例に動き認識部4を追加することで、例えば、手が、まず「右に平行移動」し、次に「縦軸周りに回転」、そして「奥行き方向に移動」、…、などといったような一連の動作の認識を行うことができる。
【0146】
これにより、例えば、自分しか知らない特有のモーションをドアの自動ロック装置や銀行のATM装置などの個人認証装置に予め登録しておき、その装置の認証過程でそのモーションを実行しそれが登録されているモーションと合致しているかどうかを判定することで、登録した人物かどうかを知ることができる。このように、本画像認識装置を個人認証に用いることが可能である。
【0147】
さらに、画像変形部2で変形した際の個々の変形パラメータが分かっているため、そのパラメータを全て保持することで、任意のモーションを数式化することができる。
【0148】
これにより、従来の人間の動作は、機械などのそれと異なり、あいまい性が高いため、例えば、回転の中心、回転角度等のパラメータを用いて数式で表すことが難しかったが、これを数式で明示化できる。
(第3の実施形態)
次に、本発明の第3の実施形態について説明する。
【0149】
図32は、本発明の第3の実施形態に係る画像認識装置の全体構成図である。
【0150】
本実施形態の画像認識装置は、第1の実施形態の画像認識装置に加え、距離画像または距離画像ストリーム(所定時間おきに取得される時系列に連続した複数枚の距離画像)を保持しておくための画像保持部6と、画像保持部6に保持された距離画像または距離画像ストリームの中から、任意の距離画像または距離画像ストリームを抽出するための画像指示部5が追加された構成になっている。
【0151】
まず、画像保持部6について説明する。
【0152】
画像保持部6は、本画像認識装置の内外で得られた距離画像または距離画像ストリームを保持しておくためのものである。保持の方法としては、例えば、保持対象の距離画像または距離画像ストリームを1つの、あるいは複数のファイルとしてハードディスクやシリコンディスク、メモリなどに蓄えておく。
【0153】
なお、ここで説明した保持の方法は、一例でありこれに限定されるものではない。任意の保持方法を用いることができる。また、2種類以上の保持方法を同時に用いることも可能である。
【0154】
また、保持場所は、1カ所であるとは限らない。複数のハードディスクなどに分割して保持されていても良いし、ネットワークを介して物理的に異なる場所(例えば、東京と大阪など)に存在しているPC内のハードディスクなどに分散的に保持されていてもよい。
【0155】
さらに、画像保持部6では、外部で生成された任意の距離画像、または距離画像ストリームや、画像取得部1で取得された距離画像または距離画像ストリーム、画像変形部2で変形処理された距離画像などを任意のタイミングで保持することができる。
【0156】
次に、画像指示部5について説明する。
【0157】
画像指示部5は、画像保持部6に保持された任意の距離画像または距離画像ストリームを抽出し、画像変形部2に渡す。
【0158】
また、距離画像ストリーム中の一部のみを抽出することも可能である。例えば、10フレームから構成される距離画像ストリームがあった場合、その3フレーム目から7フレーム目までの5フレームのみを抽出し、5フレームからなる距離画像ストリームとして渡すこともできるし、距離画像ストリーム中の任意の距離画像を渡すこともできる。
【0159】
この際、画像変形部2では、画像取得部1で取得したサンプル画像ではなく、画像指示部5で抽出された距離画像をサンプル画像とした変形画像の生成が行われる。
【0160】
これにより、本実施形態では、第1の実施形態とは異なり、予め蓄えられた距離画像の変形画像をテンプレート画像とした認識が行われる。
【0161】
つまり、予め動作を判別したい距離画像を画像保持部6に登録しておけば、その動作が行われたのかどうかを認識することが可能になる。
(第3の実施形態の第1の変形例)
第2の実施形態で説明したような動き認識部4を本実施形態にさらに具備してもよい。
【0162】
この場合、本実施形態で得られる効果に加えて、第2の実施形態での効果も同時に得ることができる画像認識装置を構成することができる。
(第3実施形態の第2の変形例)
本実施形態では、画像指定部5で抽出した距離画像または距離画像ストリームを画像変形部2に入力して変形画像を生成し、それを画像比較部3での比較対象(テンプレート画像)としているが、画像指示部5で抽出した距離画像または距離画像ストリームを直接画像比較部3に入力して、比較対象としてもよい。
【0163】
こうすることで、予め認識したい動作列を示した距離画像ストリームを画像保持部部6に登録しておき、これを画像指示部5で抽出し、画像取得部1で取得された距離画像ストリームと抽出された距離画像ストリームを比較することが可能となる。
【0164】
つまり、本変形例によれば、予め登録されたモーションが行われたかどうかを認識することができる。
【0165】
また、画像変形部2で施されるのと同等な変形処理を予め施した距離画像を画像保持部5で保持しておくことにより、画像変形部2で変形処理に要する計算コストをかけることなく比較を行うことができる。こうすることで、よりリアルタイム性を高めることができる。
(第4の実施形態)
次に、本発明の第4の実施形態について説明する。
【0166】
図33は、本発明の第4の実施形態に係る画像認識装置の全体構成図である。
【0167】
本実施形態の画像認識装置は、第2の実施形態の画像認識装置に加え、未来の動きの予測を行う動き予測部7が追加された構成になっている。
【0168】
まず、動き予測部7について説明する。
【0169】
動き予測部7は、動き認識部4の結果を用いて未来の動きの予測をするものである。
【0170】
例えば、対象物が、「縦軸周りに回転」を3回連続で行っていたら、次も「縦軸周りに回転」をするか、あるいは「動きを止める」か、のどちらかの動作を次のフレーム(現在よりも1フレーム未来のフレーム)で行うのではないかなどといったような予測をする。
【0171】
この際、予測をするための手がかりとして、上述した動き認識部4での結果に加え、対象物の構造上の性質などの背景知識を考慮しても良い。例えば、人間の手の指は、その構造上、動く範囲が限られている。これらの知識などを予測のための手がかりとして考慮することもできる。
【0172】
動き予測部7には、動き認識部4で認識された動き(例えば、3回連続して縦軸周りに回転)に対応して、その後に予測される動きを記憶したテーブルを持ち、このテーブルを参照して、動き予測を行うようにしてもよい。
【0173】
このようにすることで、対象物が次にどの様に動くのかを予測することが可能となる。
(第4の実施形態の第1の変形例)
第4の実施形態では、動き認識部4での認識結果を用いて動きの予測をするための動き予測部7を具備したが、これの代わりに、図34に示すように、画像取得部1などで取得された距離画像または距離画像ストリームからその特徴量を抽出するための特徴量抽出部8および、特徴量抽出部8からの特徴量の情報を用いて動きの予測を行うため新たな動き予測部7を具備するようにしてもよい。
【0174】
この際、特徴量抽出部8では、例えば、距離画像から対象物の重心位置を抽出したり、距離画像ストリームから対象物の重心速度の値を抽出したりといった対象物の特徴量の抽出を行う。
【0175】
ここで、距離画像から対象物の重心位置Gを求める場合について説明する。
【0176】
【数3】
【0177】
【数4】
【0178】
【数5】
【0179】
なお、上式(3)〜(5)において、F(x、y)は、画素(x、y)の画素値で、C(x、y)は、次のように定義された関数である。
【0180】
・F(x、y)!=0 のとき C(x、y)=1
・それ以外のとき C(x、y)=0
また、m、nは、それぞれフレームのx方向、y方向のサイズ(画素の個数)である。
【0181】
重心位置の速度は、連続して取得された距離画像のそれぞれから抽出された対象物の重心位置の移動量と、その間の時間とから容易に求めることができる。
【0182】
なお、ここでは、特徴量の一例として、重心位置や速度を挙げたが、特徴量はこれに限定されるものではなく、対象物の面積、体積、形状の特徴などあらゆるものを用いることができる。これら特徴量は、距離画像から抽出された対象物の輪郭情報、奥行き情報等から従来からある手法を用いて容易に求めることができるので、説明は省略する。
【0183】
そして、動き予測部7で、特徴量抽出部8で得られた対象物の重心位置の変化や、重心速度などの特徴量を手がかりとして、次の動きの予測を行う。
【0184】
このようにすることでも、第4の実施形態で述べたのと同様に、対象物が次にどの様に動くのかを予測することが可能となる。
【0185】
さらに、第4の実施形態で説明したような動き認識部4での結果と、特徴量抽出部8で抽出した特徴量とを、動き予測部7で両方同時に用いることで予測を行うようにしても良い。
【0186】
こうすることで、より多くの情報を手がかりとして予測を行うことができるため、より安定した確実な予測を行うことが可能となる。
【0187】
例えば、自動車の事故時にエアバッグを膨らませる時に、大変近い距離内に、人間がいるときには、エアバッグを膨らませないようにすることが求められている。が、通常の超音波や赤外線などの距離センサでは、一定距離内に物体があるかどうかは判別できるが、その物体が蠅なのか、後部座席から子供が投げたボールなのか、人間なのかの判別ができない。が、本発明によれば、特徴量抽出部8により距離画像より求めた体積などの特徴量と、動き予測手部7が求めた人間の動きとから、人間と、それ以外の判別を高精度で行うことができるので、その効果は大きい。
(第4の実施形態の第2の変形例)
図35に示すように、動き予測部7の結果をさらに画像変形部2の変形パラメータの導出の手がかりに用いるようにしてもよい。
【0188】
例えば、第1の実施形態の第3の変形例で、対象物に対し、上下左右4方向の変形を行う方法の説明をしたが、動き予測部7を用いて動きの予測を行うことによって、可能性のある変形方法を知ることができる。それを用いることで、例えば、この状況であれば、次に右方向に回転する可能性は低いため、上下左の3方向の変形のみを行えば十分であるというように、変形の個数を絞り込むことができる。
【0189】
これにより、無駄な変形処理を施す必要が無くなり、余計な計算コストを削減することができるため、より認識のリアルタイム性が高まる。
(第4の実施形態の第3の変形例)
第3の実施形態で説明したような、画像取得部1で取得した距離画像や画像変形部2で生成された変形画像を記憶するための画像保持部6を図34、図35の構成にさらに具備してもよい。
【0190】
この場合、本実施形態で得られる効果に加えて、第3の実施形態での効果も同時に得ることができる画像認識装置を構成することができる。
(第5の実施形態)
次に、本発明の第5の実施形態について説明する。
【0191】
図36は、本発明の第5の実施形態に係る画像認識装置の構成の一例を示している。
【0192】
本実施形態の画像認識装置は、第1、第2、第3、あるいは、第4の実施形態の画像認識装置に加え、画像認識装置の認識結果に基づき画像の圧縮を行うための画像圧縮部9が追加された構成になっている。
【0193】
これにより第1、第2、第3、あるいは、第4の実施形態で得られた結果を用いて距離画像の圧縮を行うことができる。
【0194】
なお、図36では、動き認識手段4での認識結果を用いて、画像変形部2で用いた各種パラメータに基づき距離画像の圧縮を行う構成となっているが、この場合に限らず、画像比較部3での認識結果を用いて、画像変形部2で用いた各種パラメータに基づき距離画像の圧縮を行う構成であってもよい。すなわち、認識結果を用いて、画像変形部2で用いた各種パラメータ等に基づき距離画像の圧縮を行うものであれば特に限定するものではない。
【0195】
それでは、画像圧縮部9について説明する。
【0196】
画像圧縮部9は、認識結果に基づき、画像取得部1などで取得された距離画像または距離画像ストリームのデータを圧縮するものである。
【0197】
この際、画像圧縮の方法は、目的に応じて、可逆圧縮、非可逆圧縮のどちらの方法でも構わない。
【0198】
圧縮は、具体的には、次のような方法で行う。
【0199】
例えば、第2の実施形態の第2の変形例で説明した図31に示したような構成の画像認識装置に画像圧縮部9を追加した場合、動き認識部4で対象物の任意のモーションを数式化することができる。
【0200】
そこで、例えば、5フレーム間隔で実際の距離画像のデータを保持し、その間の4フレームは、実際の距離画像から画像変形部2で距離画像を変形する際に用いた変形パラメータの値のみを保持することで、圧縮画像を形成する。
【0201】
距離画像の実際のデータは、縦64画素、横64画素、奥行き256階調の距離画像の場合、1画素に対して8bitのデータ量が必要なため、全体として、64×64×8=32768bit=4096byteのデータ量が必要とされることになる。つまり、変形パラメータのデータ量がこれよりも少ないときにはデータの圧縮になることになる。例えば、回転変形の場合、パラメータは、回転中心座標(x、y、z)および回転角(θx、θy、θz)となる。x、y、zは、それぞれ0から64までの値を表現できれば良いので、それぞれ6bitを必要とし、回転角は、それぞれ0から360までの値を表現できれば良いので、整数精度の場合それぞれ9bitを必要とする(浮動小数精度なら32bitもあれば十分である)。つまり、回転変形では、パラメータの値に必要とされるデータ量は全体で45bit程度(浮動小数精度の場合でも114bit程度)しか必要とされないことになる。回転変形以外の他の変形についても同様である。これは、圧縮前の4096byteよりも遙かに小さなオーダーの量なので、本手法における画像圧縮ではかなりの圧縮率を見込めることとなる。
【0202】
なお、こうして得られた圧縮画像を復元するには、復元する際に、特定フレーム間隔で存在する実際の距離画像データをもとに、それぞれの変形パラメータの値を用いて変形画像を逐次生成していけばよい。すなわち、特定フレーム間隔で存在する実際の距離画像データと、その間の距離画像を復元するために必要な動きのパラメータとを含む圧縮画像データ(圧縮画像データの受け渡しには、フロッピーディスク等の所定の記録媒体を用いても通信を用いてもよい)を復元するための画像伸長装置には、少なくとも、前述したような画像変形部2と同様な機能を有した構成部をもつ必要がる。
【0203】
従来のMPEG(Motion Picture Experts Group)1、MPEG2、MPEG4などの画像圧縮方法では、2次元画像に対し、おのおののフレームで個別に圧縮したものを用いたり、前後のフレームからの差分信号を利用して圧縮を行っている。これに対し、本発明では、3次元の距離画像に対し、抽出された動きのパラメータを用いて圧縮を行っている点が大きく異なっている。
(第6の実施形態)
本発明の第6の実施形態について説明する。
【0204】
図37は、本発明の第6の実施形態に係る画像認識装置の構成の一例を示している。
【0205】
本実施形態の画像認識装置は、第1、第2、第3、第4、あるいは、第5の実施形態の画像認識装置に加え、外部との通信を行う通信部10を追加したものである。
【0206】
これにより第1、第2、第3、第4、あるいは、第5の実施形態で得られた結果を電話回線などの通信路を用いて外部に通信することができる。
【0207】
例えば、第5の実施形態の画像認識装置に通信部10を追加すれば、第5の実施形態で説明したような圧縮画像データのみを送信し、受信先でそれを復元することで、受信先で多大な距離画像データが得られるにも関わらず、通信路には圧縮された少量のデータのみを流すことが可能である。
【0208】
これにより、従来の動画像などの通信で常に問題となっていた、通信する際のデータ量の増大を避けることができ、本画像認識装置の認識結果をインターネットなどを介した別の場所にリアルタイムで通信するのに大変効果的である。
【0209】
例えば、離れた場所にいるユーザがじゃんけんやボクシングなどの身体を使ったゲームをする場合でも、取得した手や身体の3次元の距離画像を、圧縮して、通信することにより、互いに生の3次元画像をやりとりができる。つまり、離れた場所にいるのに、立体的な手や身体のデータが送られ、再生されるので、まるで、その場にいて、ゲームをしているような感覚を、非常に安価な装置により、得ることができるので、その効果は大きい。
(その他)
なお、以上の各実施形態やその変形例は、適宜組み合わせて実施することが可能である。
【0210】
また、以上の各実施形態やその変形例あるいはそれらを適宜組み合わせたものでは、画像取得部1を省き、与えられた距離画像もしくはそのストリームに基づいて、動作を認識し、あるいはさらにその認識結果をもとに各種の処理を行うような装置として構成することも可能である。
【0211】
以上の各構成部は、画像取得部1の撮像部分を除いて、ソフトウェアとしても実現可能である。すなわち、上記した各手順をコンピュータに実行させることのできるプログラムとして機械読みとり可能な記録媒体に記録して頒布することができる。
【0212】
本発明は、上述した実施の形態に限定されるものではなく、その技術的範囲において種々変形して実施することができる。
【0213】
【発明の効果】
以上説明したように、本発明によれば、認識対象物に対する距離画像の3次元的な変形画像を用いることにより、認識のためのテンプレートや辞書を作る手間なく、かつ3次元的な動きの認識を短時間でしかも安定して高精度に行うことができる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態に係る画像認識装置の構成例を概略的に示す図。
【図2】画像取得部の概略的な構成図。
【図3】距離画像をマトリックス状に示した図。
【図4】距離画像を3次元的に示した図。
【図5】画像取得部を構成する発光部と受光部の外観の一例を示した図。
【図6】距離画像の一具体例を示した図。
【図7】距離画像の回転変形処理の流れを示すフローチャート。
【図8】ボクセル単位の分割について説明するための図。
【図9】ボクセル単位の分割の方法について説明するための図。
【図10】ボクセル単位の回転変形処理について説明するための図で、回転変形前のボクセル位置と回転変形後のボクセル位置を示した図。
【図11】回転計算後の距離画像の再構成の仕方について説明するための図。
【図12】手のサンプル画像と、その変形画像を示した図。
【図13】手の変形画像と、最新画像を示した図。
【図14】テンプレートマッチング法の処理の流れを示すフローチャート。
【図15】顔のサンプル画像を示した図。
【図16】図15のサンプル画像から生成された変形画像を示した図で、頭の重心位置を中心とし、(θx、θy、θz)=(2、0、0)だけ回転させて、顔を少し上に向かせたものである。
【図17】図15のサンプル画像から生成された変形画像を示した図で、頭の重心位置を中心とし、(θx、θy、θz)=(−2、0、0)だけ回転させて、顔を少し下に向かせたものである。
【図18】図15のサンプル画像から生成された変形画像を示した図で、頭の重心位置を中心とし、(θx、θy、θz)=(0、2、0)だけ回転させて、顔を紙面に向かって少し右に向かせたものである。
【図19】図15のサンプル画像から生成された変形画像を示した図で、頭の重心位置を中心とし、(θx、θy、θz)=(0、−2、0)だけ回転させて、顔を紙面に向かって少し左に向けたものである。
【図20】図16〜図19に示した変形画像と比較するた顔の最新画像を示した図。
【図21】テンプレートマッチング法の処理の流れを示すフローチャート。
【図22】手のサンプル画像を示した図。
【図23】図22のサンプル画像から生成された変形画像を示した図で、手の重心位置を中心とし回転させて、上に少し向けたものである。
【図24】図22のサンプル画像から生成された変形画像を示した図で、手の重心位置を中心とし回転させて、下に少し向けたものである。
【図25】図22のサンプル画像から生成された変形画像を示した図で、手の重心位置を中心とし回転させて、紙面に向かって右に少し向けたものである。
【図26】図22のサンプル画像から生成された変形画像を示した図で、手の重心位置を中心とし回転させて、紙面に向かって左に少し向けたものである。
【図27】図22のサンプル画像から生成された2枚の変形画像を示した図で、それぞれ手の重心位置を中心とし回転角を変えて回転させて、上に少し向けたものである。
【図28】図22のサンプル画像から生成された2枚の変形画像を示した図で、それぞれ手の重心位置を中心とし回転させて、下に少し向けたものである。
【図29】図22のサンプル画像から生成された2枚の変形画像を示した図で、それぞれ手の重心位置を中心とし回転させて、紙面に向かって右に少し向けたものである。
【図30】図22のサンプル画像から生成された2枚の変形画像を示した図で、それぞれ手の重心位置を中心とし回転させて、紙面に向かって左に少し向けたものである。
【図31】本発明の第2の実施形態に係る画像認識装置の構成例を概略的に示す図。
【図32】本発明の第3の実施形態に係る画像認識装置の構成例を概略的に示す図。
【図33】本発明の第4の実施形態に係る画像認識装置の構成例を概略的に示す図。
【図34】本発明の第4の実施形態の第1の変形例に係る画像認識装置の構成例を概略的に示す図。
【図35】本発明の第4の実施形態の第2の変形例に係る画像認識装置の構成例を概略的に示す図。
【図36】本発明の第5の実施形態に係る画像認識装置の構成例を概略的に示す図。
【図37】本発明の第6の実施形態に係る画像認識装置の構成例を概略的に示す図。
【符号の説明】
1…画像取得部
2…画像変形部
3…画像比較部
4…動き認識部
5…画像指示部
6…画像保持部
7…動き予測部
8…特徴量抽出部
9…画像圧縮部
10…通信部
Claims (14)
- 各画素値により対象物までの距離及び当該対象物の3次元形状を表す距離画像を所定時間毎に取得する画像取得手段が、第1の距離画像を取得する第1のステップと、
前記第1の距離画像の前記対象物の画像領域の各画素を、当該画素位置の距離値に対応する数のボクセルに分割する第2のステップと、
前記対象物が回転中心位置を回転中心として任意の回転角で回転しているときの前記所定時間後の分割された各ボクセルの位置を算出し、当該所定時間後の各ボクセルの位置を基に各画素位置の距離値を求めることにより、前記所定時間後の前記対象物までの距離及び当該対象物の3次元形状を表した前記対象物の回転の有無を認識するための変形画像を生成する第3のステップと、
前記第1の距離画像を取得した後、前記所定時間後に前記画像取得手段が第2の距離画像を取得する第4のステップと、
前記第2の距離画像の前記対象物の画像領域と前記変形画像との間で各画素値を比較して、前記変形画像が前記第2の距離画像の前記対象物の画像領域に類似するか否かを判定することにより、前記対象物の回転の有無を認識する第4のステップと、
を有することを特徴とする画像認識方法。 - 各画素値により対象物までの距離及び当該対象物の3次元形状を表す距離画像を所定時間毎に取得する画像取得手段が、第1の距離画像を取得する第1のステップと、
前記第1の距離画像の前記対象物の画像領域の各画素を、当該画素位置の距離値に対応する数のボクセルに分割する第2のステップと、
前記対象物が回転中心位置を回転中心として任意の回転角で回転しているときの前記所定時間後の分割された各ボクセルの位置を算出し、当該所定時間後の各ボクセルの位置を基に各画素位置の距離値を求めることにより、当該対象物の回転方向及び回転量がそれぞれ異なる複数の場合のそれぞれについて、各画素値により前記所定時間後の前記対象物までの距離及び当該対象物の3次元形状を表した前記対象物の回転方向及び回転量を認識するための複数の変形画像をそれぞれ生成する第3のステップと、
前記第1の距離画像を取得した後、前記所定時間後に前記画像取得手段が第2の距離画像を取得する第4のステップと、
前記第2の距離画像の前記対象物の画像領域と前記複数の変形画像との間で各画素値を比較して、前記複数の変形画像のなかから前記第2の距離画像の前記対象物の画像領域に最も類似する変形画像を選択することにより、前記対象物の回転方向及び回転量を認識する第5のステップと、
を有することを特徴とする画像認識方法。 - 前記第5のステップは、選択された変形画像が示す前記対象物の動きの量と、前記第1の距離画像を取得した後前記第2の距離画像を取得するまでの前記所定時間とから、前記対象物の動作速度をさらに認識することを特徴とする請求項2記載の画像認識方法。
- 前記第5のステップで認識された前記対象物の回転方向に基づき前記対象物の次の回転方向を予測する第6のステップをさらに具備し、
前記対象物の次の回転方向を認識する際には、前記対象物を前記第6のステップで予測された回転方向に回転した結果をそれぞれ示す複数の変形画像を生成することを特徴とする請求項2記載の画像認識方法。 - 前記対象物の3次元空間内での平行移動の有無をさらに認識するために、前記変形画像を拡大・縮小する第7のステップをさらに有し、
前記第5のステップは、前記第2の距離画像の前記対象物の画像領域と、拡大・縮小された前記変形画像との間で各画素値を比較して、当該変形画像が前記第2の距離画像の前記対象物の画像領域に類似するか否かを判定することにより、前記認識対象の平行移動の有無をさらに認識することを特徴とする請求項1記載の画像認識方法。 - 前記対象物の3次元空間内での平行移動の有無をさらに認識するために、前記複数の変形画像を拡大・縮小する第7のステップをさらに有し、
前記第5のステップは、前記第2の距離画像の前記対象物の画像領域と、拡大・縮小された前記複数変形画像との間で各画素値を比較して、当該複数の変形画像のなかから前記第2の距離画像の前記対象物の画像領域に最も類似する変形画像を選択することにより、前記認識対象の平行移動をさらに認識することを特徴とする請求項2記載の画像認識方法。 - 各画素値により対象物までの距離及び当該対象物の3次元形状を表す距離画像を所定時間毎に取得する画像取得手段と、
前記画像取得手段で取得された第1の距離画像の前記対象物の画像領域の各画素を、当該画素位置の距離値に対応する数のボクセルに分割して、前記対象物が回転中心位置を回転中心として任意の回転角で回転しているときの前記所定時間後の分割された各ボクセルの位置を算出し、当該所定時間後の各ボクセルの位置を基に各画素位置の距離値を求めることにより、各画素値により前記所定時間後の前記対象物までの距離及び当該対象物の3次元形状を表した前記対象物の回転の有無を認識するための変形画像を生成する変形画像生成手段と、
前記画像取得手段で前記第1の距離画像取得後、前記所定時間後に取得された第2の距離画像の前記対象物の画像領域と前記変形画像との間で各画素値を比較して、前記変形画像が前記第2の距離画像の前記対象物の画像領域に類似するか否かを判定することにより、前記対象物の回転の有無を認識する認識手段と、
を具備したことを特徴とする画像認識装置。 - 各画素値により対象物までの距離及び当該対象物の3次元形状を表す距離画像を所定時間毎に取得する画像取得手段と、
前記第1の距離画像の前記対象物の画像領域の各画素を、当該画素位置の距離値に対応する数のボクセルに分割して、前記対象物が回転中心位置を回転中心として任意の回転角で回転しているときの前記所定時間後の分割された各ボクセルの位置を算出し、当該所定時間後の各ボクセルの位置を基に各画素位置の距離値を求めることにより、当該対象物の回転方向及び回転量がそれぞれ異なる複数の場合のそれぞれについて、各画素値により前記所定時間後の前記対象物までの距離及び当該対象物の3次元形状を表した前記対象物の回転方向及び回転量を認識するための複数の変形画像をそれぞれ生成する変形画像生成手段と、
前記画像取得手段で前記第1の距離画像取得後、前記所定時間後に取得された第2の距離画像の前記対象物の画像領域と前記複数の変形画像との間で各画素値を比較して、前記複数の変形画像のなかから前記第2の距離画像の前記対象物の画像領域に最も類似する変形画像を選択することにより、前記対象物の回転方向及び回転量を認識する認識手段と、
を具備したことを特徴とする画像認識装置。 - 前記認識手段は、選択された変形画像が示す前記対象物の動きの量と、前記第1の距離画像を取得した後前記第2の距離画像を取得するまでの前記所定時間とから、前記対象物の動作速度をさらに認識することを特徴とする請求項8記載の画像認識装置。
- 前記認識手段で認識された前記対象物の回転方向に基づき前記対象物の次の回転方向を予測する予測手段をさらに具備し、
前記対象物の次の回転方向を認識する際には、前記変形画像変形手段は、前記対象物を前記予測手段で予測された回転方向に回転した結果をそれぞれ示す複数の変形画像を生成することを特徴とする請求項8記載の画像認識装置。 - 各画素値により対象物までの距離及び当該対象物の3次元形状を表す距離画像を所定時間毎に取得する画像取得手段を有するコンピュータに、
前記画像取得手段で取得された第1の距離画像の前記対象物の画像領域の各画素を、当該画素位置の距離値に対応する数のボクセルに分割して、前記対象物が回転中心位置を回転中心として任意の回転角で回転しているときの前記所定時間後の分割された各ボクセルの位置を算出し、当該所定時間後の各ボクセルの位置を基に各画素位置の距離値を求めることにより、各画素値により前記所定時間後の前記対象物までの距離及び当該対象物の3次元形状を表した前記対象物の回転の有無を認識するための変形画像を生成する第1のステップと、
前記画像取得手段で前記第1の距離画像を取得した後、前記所定時間後に取得された第2の距離画像の前記対象物の画像領域と前記変形画像との間で各画素値を比較して、前記変形画像が前記第2の距離画像の前記対象物の画像領域に類似するか否かを判定することにより、前記対象物の回転の有無を認識する第2のステップと、
を含む処理を実行させるプログラムを記録した機械読み取り可能な記録媒体。 - 各画素値により対象物までの距離及び当該対象物の3次元形状を表す距離画像を所定時間毎に取得する画像取得手段を有するコンピュータに、
前記画像取得手段で取得された第1の距離画像の画像領域の各画素を、当該画素位置の距離値に対応する数のボクセルに分割して、前記対象物が回転中心位置を回転中心として任意の回転角で回転しているときの前記所定時間後の分割された各ボクセルの位置を算出し、当該所定時間後の各ボクセルの位置を基に各画素位置の距離値を求めることにより、当該対象物の回転方向及び回転量がそれぞれ異なる複数の場合のそれぞれについて、各画素値により前記所定時間後の前記対象物までの距離及び当該対象物の3次元形状を表した前記対象物の回転方向及び回転量を認識するための複数の変形画像をそれぞれ生成する第1のステップ、
前記画像取得手段で前記第1の距離画像を取得した後、前記所定時間後に取得された第2の距離画像の前記対象物の画像領域と前記複数の変形画像との間で各画素値を比較して、前記複数の変形画像のなかから前記第2の距離画像の前記対象物の画像領域に最も類似する変形画像を選択することにより、前記対象物の回転方向及び回転量を認識する第2のステップと、
を含む処理を実行させるプログラムを記録した機械読み取り可能な記録媒体。 - 対象物に発光手段により光を照射し、当該対象物からの反射光を受光手段で受光することにより、各画素値が当該受光手段で受光された反射光の強度を示し、各画素値が示す反射光の強度により当該対象物までの距離値及び当該対象物の3次元形状を表す距離画像を所定時間毎に取得する画像取得手段が、第1の距離画像を取得する第1のステップと、
前記第1の距離画像の前記対象物の画像領域の各画素を、当該画素位置の距離値に対応する数のボクセルに分割する第2のステップと、
前記対象物が回転中心位置を回転中心として任意の回転角で回転しているときの前記所定時間後の分割された各ボクセルの位置を算出し、当該所定時間後の各ボクセルの位置を基に各画素位置の距離値を求めることにより、各画素値により前記所定時間後の前記対象物までの距離及び当該対象物の3次元形状を表した前記対象物の回転の有無を認識するための変形画像を生成する第3のステップと、
前記第1の距離画像を取得した後、前記所定時間後に前記画像取得手段が第2の距離画像を取得する第4のステップと、
前記第2の距離画像の前記対象物の画像領域と前記変形画像との間で各画素値を比較して、前記変形画像が前記第2の距離画像の前記対象物の画像領域に類似するか否かを判定することにより、前記対象物の回転の有無を認識する第4のステップと、
を有することを特徴とする画像認識方法。 - 各画素値により対象物までの距離及び当該対象物の3次元形状を表す距離画像を所定時間毎に取得する画像取得手段が、第1の距離画像を取得する第1のステップと、
前記第1の距離画像の前記対象物の画像領域の各画素を、当該画素位置の距離値に対応した前記対象物表面付近でボクセルに分割する第2のステップと、
前記対象物が回転中心位置を回転中心として任意の回転角で回転しているときの前記所定時間後の分割された各ボクセルの位置を算出し、当該所定時間後の各ボクセルの位置を 基に各画素位置の距離値を求めることにより、前記所定時間後の前記対象物までの距離及び当該対象物の3次元形状を表した前記対象物の回転の有無を認識するための変形画像を生成する第3のステップと、
前記第1の距離画像を取得した後、前記所定時間後に前記画像取得手段が第2の距離画像を取得する第4のステップと、
前記第2の距離画像の前記対象物の画像領域と前記変形画像との間で各画素値を比較して、前記変形画像が前記第2の距離画像の前記対象物の画像領域に類似するか否かを判定することにより、前記対象物の回転の有無を認識する第4のステップと、
を有することを特徴とする画像認識方法。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP37133298A JP3688489B2 (ja) | 1998-12-25 | 1998-12-25 | 画像認識方法および画像認識装置 |
US09/471,497 US7035433B1 (en) | 1998-12-25 | 1999-12-23 | Image recognition method and apparatus |
US11/251,892 US7388970B2 (en) | 1998-12-25 | 2005-10-18 | Image recognition method and apparatus |
US11/349,222 US7394918B2 (en) | 1998-12-25 | 2006-02-08 | Image recognition method and apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP37133298A JP3688489B2 (ja) | 1998-12-25 | 1998-12-25 | 画像認識方法および画像認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000194860A JP2000194860A (ja) | 2000-07-14 |
JP3688489B2 true JP3688489B2 (ja) | 2005-08-31 |
Family
ID=18498526
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP37133298A Expired - Fee Related JP3688489B2 (ja) | 1998-12-25 | 1998-12-25 | 画像認識方法および画像認識装置 |
Country Status (2)
Country | Link |
---|---|
US (3) | US7035433B1 (ja) |
JP (1) | JP3688489B2 (ja) |
Families Citing this family (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7697027B2 (en) | 2001-07-31 | 2010-04-13 | Donnelly Corporation | Vehicular video system |
US9393487B2 (en) | 2002-07-27 | 2016-07-19 | Sony Interactive Entertainment Inc. | Method for mapping movements of a hand-held controller to game commands |
US8570378B2 (en) | 2002-07-27 | 2013-10-29 | Sony Computer Entertainment Inc. | Method and apparatus for tracking three-dimensional movements of an object using a depth sensing camera |
US8313380B2 (en) | 2002-07-27 | 2012-11-20 | Sony Computer Entertainment America Llc | Scheme for translating movements of a hand-held controller into inputs for a system |
US7831087B2 (en) * | 2003-10-31 | 2010-11-09 | Hewlett-Packard Development Company, L.P. | Method for visual-based recognition of an object |
US7995863B2 (en) | 2004-05-04 | 2011-08-09 | AgentSheets, Inc. | Diffusion-based interactive extrusion of two-dimensional images into three-dimensional models |
US7630580B1 (en) * | 2004-05-04 | 2009-12-08 | AgentSheets, Inc. | Diffusion-based interactive extrusion of 2D images into 3D models |
US20060088225A1 (en) * | 2004-10-26 | 2006-04-27 | The Secretary Of State For The Home Department | Comparison |
JP4734980B2 (ja) * | 2005-03-15 | 2011-07-27 | オムロン株式会社 | 顔認証装置およびその制御方法、顔認証装置を備えた電子機器、顔認証装置制御プログラム、ならびに該プログラムを記録した記録媒体 |
US8195005B2 (en) * | 2006-02-01 | 2012-06-05 | Nec Corporation | Image processing, image feature extraction and image matching apparatuses, methods and programs, and image matching system |
US7983451B2 (en) * | 2006-06-30 | 2011-07-19 | Motorola Mobility, Inc. | Recognition method using hand biometrics with anti-counterfeiting |
DE102006035232A1 (de) * | 2006-07-26 | 2008-01-31 | Robert Bosch Gmbh | Optische Messeinrichtung mit einer Bildaufnahmeeinheit |
US8781151B2 (en) | 2006-09-28 | 2014-07-15 | Sony Computer Entertainment Inc. | Object detection using video input combined with tilt angle information |
US8310656B2 (en) | 2006-09-28 | 2012-11-13 | Sony Computer Entertainment America Llc | Mapping movements of a hand-held controller to the two-dimensional image plane of a display screen |
USRE48417E1 (en) | 2006-09-28 | 2021-02-02 | Sony Interactive Entertainment Inc. | Object direction using video input combined with tilt angle information |
GB0819069D0 (en) | 2008-10-17 | 2008-11-26 | Forensic Science Service Ltd | Improvements in and relating to methods and apparatus for comparison |
GB0901263D0 (en) * | 2009-01-26 | 2009-03-11 | Mitsubishi Elec R&D Ct Europe | Detection of similar video segments |
JP5152077B2 (ja) * | 2009-04-01 | 2013-02-27 | ソニー株式会社 | 生体像提示装置、生体像提示方法及びプログラム並びに生体像提示システム |
FI20095785A (fi) * | 2009-07-13 | 2011-01-14 | Gurulogic Microsystems Oy | Menetelmä hahmon tunnistamiseksi, hahmontunnistaja ja tietokoneohjelma |
US8942439B2 (en) * | 2010-06-04 | 2015-01-27 | Nec Corporation | Fingerprint authentication system, fingerprint authentication method, and fingerprint authentication program |
US8543833B2 (en) | 2010-12-29 | 2013-09-24 | Microsoft Corporation | User identification with biokinematic input |
US8990682B1 (en) * | 2011-10-05 | 2015-03-24 | Google Inc. | Methods and devices for rendering interactions between virtual and physical objects on a substantially transparent display |
JP6242098B2 (ja) * | 2013-07-16 | 2017-12-06 | 株式会社キーエンス | 三次元画像処理装置、三次元画像処理方法及び三次元画像処理プログラム並びにコンピュータで読み取り可能な記録媒体及び記録した機器 |
US10013767B2 (en) * | 2013-11-01 | 2018-07-03 | The Research Foundation For The State University Of New York | Method for measuring the interior three-dimensional movement, stress and strain of an object |
CN106828460A (zh) * | 2017-03-02 | 2017-06-13 | 深圳明创自控技术有限公司 | 一种安全性高的汽车防撞全自动驾驶仪 |
KR20210080993A (ko) * | 2019-12-23 | 2021-07-01 | 엘지전자 주식회사 | 전자 장치 및 그의 동작 방법 |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2523369B2 (ja) * | 1989-03-14 | 1996-08-07 | 国際電信電話株式会社 | 動画像の動き検出方法及びその装置 |
JPH03252287A (ja) * | 1990-02-28 | 1991-11-11 | Victor Co Of Japan Ltd | 動画像圧縮装置 |
JPH05165968A (ja) | 1991-12-18 | 1993-07-02 | Komatsu Ltd | 物体の位置・姿勢認識装置 |
JP3244798B2 (ja) * | 1992-09-08 | 2002-01-07 | 株式会社東芝 | 動画像処理装置 |
KR100287211B1 (ko) * | 1994-08-30 | 2001-04-16 | 윤종용 | 양방향 움직임 추정방법 및 장치 |
JP3663645B2 (ja) | 1994-11-18 | 2005-06-22 | ソニー株式会社 | 動画像処理装置とその方法 |
BR9607845A (pt) * | 1995-03-22 | 1999-11-30 | Idt Deutschland Gmbh | Método e aparelho para coordenação de determinação de movimento por múltiplos quadros. |
JPH08331607A (ja) | 1995-03-29 | 1996-12-13 | Sanyo Electric Co Ltd | 三次元表示画像生成方法 |
JP3054681B2 (ja) * | 1995-07-19 | 2000-06-19 | 工業技術院長 | 画像処理方法 |
JP3673578B2 (ja) | 1995-12-28 | 2005-07-20 | 富士通株式会社 | 相関追跡システム |
JPH09265538A (ja) | 1996-03-29 | 1997-10-07 | Matsushita Electric Works Ltd | 自動追尾装置 |
US6075905A (en) * | 1996-07-17 | 2000-06-13 | Sarnoff Corporation | Method and apparatus for mosaic image construction |
US5923770A (en) * | 1996-09-30 | 1999-07-13 | Siemens Corporate Research, Inc. | 3D cardiac motion recovery system using tagged MR images |
JP2876201B2 (ja) | 1996-12-09 | 1999-03-31 | 信秀 前田 | 複合セラミックスによるハンドシャワーにおけるシャワー水の抗菌、脱臭、トリハロメタン類除去および脱塩素方法とその装置 |
US6088472A (en) * | 1996-12-20 | 2000-07-11 | Siemens Corporate Research, Inc. | Global models with parametric offsets for object recovery |
JP3512992B2 (ja) * | 1997-01-07 | 2004-03-31 | 株式会社東芝 | 画像処理装置および画像処理方法 |
US6009210A (en) * | 1997-03-05 | 1999-12-28 | Digital Equipment Corporation | Hands-free interface to a virtual reality environment using head tracking |
US6157747A (en) * | 1997-08-01 | 2000-12-05 | Microsoft Corporation | 3-dimensional image rotation method and apparatus for producing image mosaics |
US6072496A (en) * | 1998-06-08 | 2000-06-06 | Microsoft Corporation | Method and system for capturing and representing 3D geometry, color and shading of facial expressions and other animated objects |
US6493041B1 (en) * | 1998-06-30 | 2002-12-10 | Sun Microsystems, Inc. | Method and apparatus for the detection of motion in video |
US6303920B1 (en) * | 1998-11-19 | 2001-10-16 | Sarnoff Corporation | Method and apparatus for detecting salient motion using optical flow |
-
1998
- 1998-12-25 JP JP37133298A patent/JP3688489B2/ja not_active Expired - Fee Related
-
1999
- 1999-12-23 US US09/471,497 patent/US7035433B1/en not_active Expired - Fee Related
-
2005
- 2005-10-18 US US11/251,892 patent/US7388970B2/en not_active Expired - Fee Related
-
2006
- 2006-02-08 US US11/349,222 patent/US7394918B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US20060126900A1 (en) | 2006-06-15 |
US7394918B2 (en) | 2008-07-01 |
US20060034490A1 (en) | 2006-02-16 |
JP2000194860A (ja) | 2000-07-14 |
US7035433B1 (en) | 2006-04-25 |
US7388970B2 (en) | 2008-06-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3688489B2 (ja) | 画像認識方法および画像認識装置 | |
Wechsler | Reliable Face Recognition Methods: System Design, Impementation and Evaluation | |
JP4148281B2 (ja) | モーションキャプチャ装置及びモーションキャプチャ方法、並びにモーションキャプチャプログラム | |
JP4653606B2 (ja) | 画像認識装置、方法およびプログラム | |
US9330470B2 (en) | Method and system for modeling subjects from a depth map | |
US8968091B2 (en) | Scalable real-time motion recognition | |
US20150347833A1 (en) | Noncontact Biometrics with Small Footprint | |
KR101907077B1 (ko) | 자세 인식 방법 및 장치 | |
KR101647803B1 (ko) | 3차원 얼굴모델 투영을 통한 얼굴 인식 방법 및 시스템 | |
KR20110139694A (ko) | 제스쳐 인식 방법 및 시스템 | |
CN107480612A (zh) | 人物动作的识别方法、装置和终端设备 | |
Farooq et al. | A survey of human action recognition approaches that use an RGB-D sensor | |
JP2014085933A (ja) | 3次元姿勢推定装置、3次元姿勢推定方法、及びプログラム | |
CN108875586A (zh) | 一种基于深度图像与骨骼数据多特征融合的功能性肢体康复训练检测方法 | |
Krzeszowski et al. | Gait recognition based on marker-less 3D motion capture | |
JP3520050B2 (ja) | 移動物体追跡装置 | |
JP2006215743A (ja) | 画像処理装置及び画像処理方法 | |
JP3401512B2 (ja) | 移動物体追跡装置 | |
Alashkar et al. | A 3D dynamic database for unconstrained face recognition | |
CN112215928B (zh) | 基于视觉图像的动作捕捉方法及数字动画制作方法 | |
JP4525523B2 (ja) | 認証システム、認証方法およびプログラム | |
Kale et al. | Gait-based human identification from a monocular video sequence | |
Sumi et al. | Active wearable vision sensor: recognition of human activities and environments | |
Lip et al. | Human 3D reconstruction and identification using kinect sensor | |
JP7499345B2 (ja) | 複数の姿勢推定エンジンを用いた手のマーカレス運動捕捉 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20040422 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040427 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040628 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040824 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20041025 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20050111 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050314 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050314 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20050415 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20050510 |
|
TRDD | Decision of grant or rejection written | ||
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20050606 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20050607 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20050608 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090617 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090617 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100617 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100617 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110617 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120617 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120617 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130617 Year of fee payment: 8 |
|
LAPS | Cancellation because of no payment of annual fees |