JP4971114B2 - 物体認識装置、物体認識方法、物体認識プログラム、および該プログラムを格納するコンピュータ可読媒体 - Google Patents
物体認識装置、物体認識方法、物体認識プログラム、および該プログラムを格納するコンピュータ可読媒体 Download PDFInfo
- Publication number
- JP4971114B2 JP4971114B2 JP2007306778A JP2007306778A JP4971114B2 JP 4971114 B2 JP4971114 B2 JP 4971114B2 JP 2007306778 A JP2007306778 A JP 2007306778A JP 2007306778 A JP2007306778 A JP 2007306778A JP 4971114 B2 JP4971114 B2 JP 4971114B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- similarity
- hierarchical
- template
- frame image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Image Analysis (AREA)
Description
1、処理対象の画像B上(図では左上)にテンプレート画像Aを重ねる。
2、重ねた領域の双方の輝度値の相関(類似度)を求める。
3、画像Bに対して画像Aの位置を画像B1つ分だけ横の方向(図では右方向)にシフトさせる。
4、1〜3を繰り返し、横方向が終わったら、画像B1つ分だけ垂直方向(図では下方向)にシフトさせる。
4、1〜4を繰り返し、画像B全体に対して相関を調べる。
5、画像B上の一番高い相関を示す領域(図では斜線で囲んだ領域)に画像Aの部分が存在すると断定する。
図2は、本発明の一実施形態に係る物体認識装置1000のブロック図である。物体認識装置1000は、動画が撮影可能なビデオカメラなどの撮像装置とケーブルまたは無線等で接続され、該撮像装置から入力された動画像中の物体を識別し、その動きをリアルタイムで追跡する機能を有し、主に汎用コンピュータで実装される。主な機能は、図2に示すように、画像データ入力部10と、差分画像生成部20と、テンプレート画像登録部30と、フレーム画像登録部40と、階層テンプレート画像群生成部50と、階層フレーム画像群生成部60と、テンプレートマッチング部90と、類似度計算部100と、閾値判定部110と、物体特定部120と、物体識別および位置情報出力部130とから構成される。更に、類似度に関するデータを格納するためのデータベース(図示せず)を備えてもよい。このデータベースの詳細については後述する。
図3(a)〜(c)は、それぞれ第3ペアから第1ペアの階層フレーム画像および階層テンプレート画像と、該階層フレーム画像の類似度算出の例を示している。この図を参照して説明を続ける。なお、図中で左側は階層フレーム画像で、右側がテンプレート画像である。この図のそれぞれの画像の左上角を原点とし、横側をX軸、縦側をY軸と定義する。また、削減率dはフレーム全体のデータ量の削減の度合いを意味するが、この他に、幅(X)方向のデータ量の削減の度合いを「幅(width)の削減率」、Y方向のデータ量の削減の度合いを「高さ(height)の削減率」と定義する。
まず、第3のペアの階層フレーム画像と階層テンプレート画像とを用いてテンプレートマッチングを行う。図3(a)は、第3のペアの階層フレーム画像と階層テンプレート画像とを例示している。この階層フレームの削減率dは1/4、高さの削減率は1/2、幅のd削減率も1/2である。この階層フレーム画像は、それぞれ同一のデータ量を有するR1a〜R9aの計9個の類似度算出領域を有している。テンプレートマッチング部90は、階層テンプレート画像を階層フレーム画像上でスライドさせ、類似度計算部100がそれぞれの類似度計算領域に対して類似度を求める。ここで、図3(a)〜(c)に示す階層テンプレート画像上の灰色で塗りつぶした部分は、階層テンプレート画像の原点が移動する範囲である。なお、類似度の算出式については後述する。
第3のペアの場合と同様に各領域の類似度を算出するが、今度はすべての領域についてマッチングを行うのではなく、図3(b)に示す、第3のペアの階層フレーム画像で閾値よりも大きな類似度を示した領域(R5a、R6a、R8a、R9a)に相当する領域(R9b、R10b、R11b、R12b、R15b、R16b、R17b、R18b)のみマッチングを行い、その類似度を求める。そして、求めた類似度を閾値tと再び比較する。ここでは、太線で囲んだエリアの領域(R10b、R11b、R12b、R16b、R17b、R18b)が閾値よりも大きな類似度を有している。これで、第2ペアの階層フレーム画像の処理を終了する。
今度は、図3(c)に示す、第2のペアの階層フレーム画像で閾値よりも大きな類似度を示した領域(R10b、R11b、R12b、R16b、R17b、R18b)に相当する領域(R16c、R17c、R18c、R22c、R23c、R24c、R28c、R29c、R30c、R34c、R35c、R36c)のみ類似度を求める。そして、その領域内で類似度の一番高い領域(R22c)を特定して、物体特定部120はその特定した領域R22cに非検出物体が存在すると判断し、その領域の座標情報を非検出物体の情報と併せて物体識別および位置情報出力部130に送る。
また、第3のペアのすべての領域の類似度が閾値よりも小さい場合は、物体特定部120は非検出物体が処理画像中に存在しないと判断し、所定のコードを物体識別および位置情報出力部130に送る。
代替の方法としては、階層フレーム画像の各領域における類似度を求めた後に、その類似度と所定の閾値tと比較し、該閾値よりも小さい類似度を有する領域を排除した後、残った領域の中から類似度が大きい順に所定の数k個の領域を抽出し、その抽出した領域を次の階層フレーム画像における処理対象としてよい。本発明の発明者らは、この方法の方が前者の方法よりも高い確度で非検出物体を認識できることを確認している。後述する実施例ではこの方法を採用する。kは任意の正整数であり、階層フレーム画像ごとに異なる数値を用いてよい。
d=1/4n、n=5(すなわち、作成数はn+1=6)、t=0.6
k=128(@n>=3)、4(@n=2)、2(@n=1)、1(@n=0)
ここで、入力動画像のフレームレートは12fps、フレーム画像の画素数は640×480、テンプレート画像の画素数は256×192、物体認識装置1000のCPUはIntel Core Duo(登録商標)L2500、クロック周波数1.83GHz、メモリ512MBである。
これらの関係を以下の表に示す。
この処理方法によれば、従来のテンプレートマッチング処理方法に比べて高速に画像中の物体を認識することが可能となり、それゆえ、該処理方法を動画像の移動体検出に好適に適用することができる。
本実施例では、本発明の実施形態に係る物体認識装置1000をポインティングデバイスに適用した例を示す。ポインティングデバイスとは、コンピュータの入力装置であり、主に、マウス、トラップパッド、トラックボールなどに代表され、画面上のカーソルの移動や、各種のコマンドを実行する際に用いられる。本実施例のポインティングデバイスは、操作者のジェスチャによって画面上のカーソルの移動や、各種のコマンドの実行を可能とする。このデバイスは、医療または食品加工現場などで衛生上の理由でマウス等を使用できない場合や、家電リモコンなどの操作機器を取りに行く手間を省きたい状況において好適に用いることができる。
まず、図6(a)に示す背景画像をカメラ200が撮影する(ステップS1)。
まず、カメラ200のズームを調整して、図5(e)に示すように操作者の上半身が撮影できるようにする。調整後、図9のフローの手順を実行する。
残った領域が存在する場合は(ステップS34で「Yes」)、その領域から類似度が高い順にk個(この場合、k=4)の領域を抽出する(ステップS35)。抽出後、ペア番号pの値を1だけデクリメントして、ペア2の処理で進む(ステップS36、S37)。
次にp=2の場合、すなわち図6(d)の階層テンプレート画像と図7(d)の階層フレーム画像とのペアの場合について(ステップS31で「Yes」)、テンプレートマッチングを行い、前回のステップS35で抽出した領域の類似度を求める(ステップS38)。そして、閾値より小さな類似度を有する領域を除外し(ステップS33)、k個(k=2)の領域を抽出して(ステップS35)、ペア番号pの値を1だけデクリメントして(ステップS36)、ペア1の処理で進む(ステップS37)。
以上の処理を、登録したジェスチャの数(m)だけ繰り返す。
10 画像データ入力部
20 差分画像生成部
30 テンプレート画像登録部
40 フレーム画像登録部
50 階層テンプレート画像郡生成部
60 階層フレーム画像郡生成部
90 テンプレートマッチング部
100 類似度計算部
110 閾値判定部
120 物体特定部
130 物体識別および位置情報出力部
Claims (7)
- テンプレートマッチングを用いて動画像中の物体を認識する物体認識装置であって、
前記動画像から背景画像を差分することで、フレーム画像を作成する差分画像生成手段と、
テンプレート画像から、そのデータ量を段階的に変化した削減率で減少させることにより複数の階層テンプレート画像を作成する階層テンプレート生成手段と、
前記動画像を構成する複数の前記フレーム画像のそれぞれから、そのデータ量を前記削減率で減少させることにより複数の階層フレーム画像を作成する階層フレーム生成手段と、
同一の前記削減率を有する前記階層フレーム画像と前記階層テンプレート画像とを組み合わせ、前記削減率の大きい順にテンプレートマッチング処理を行うマッチング手段と、
前記テンプレートマッチング処理時に、前記階層フレーム画像の各領域における類似度を求める類似度計算手段と、
前記類似度と所定の閾値とを比較する閾値判定手段と、
を備え、
前記フレーム画像は、色情報と透明度情報を有し、
前記類似度は、前記階層フレーム画像における色分布の類似度と、透明度分布の類似度と、1つ前に処理したフレーム画像の最も高い類似度を有する領域からの距離による重みとから求められ、
前記所定の閾値よりも小さい類似度を有する領域については、以降の前記テンプレートマッチング処理を行なわず、最後に該処理を行った階層フレーム画像の最も高い類似度を有する領域に前記物体が存在すると判断することを特徴とする物体認識装置。 - 前記領域当たりの前記類似度は、該領域を構成する画素のそれぞれで類似度を求めて、その類似度の絶対値を用いて算出することを特徴とする請求項1に記載の物体認識装置。
- 請求項1または2に記載の物体認識装置を搭載したポインティングデバイス。
- テンプレートマッチングを用いて動画像中の物体を認識する物体認識方法であって、
前記動画像から背景画像を差分することで、フレーム画像を作成する差分画像生成段階と、
テンプレート画像から、そのデータ量を段階的に変化した削減率で減少させることにより複数の階層テンプレート画像を作成する階層テンプレート生成段階と、
前記動画像を構成する複数の前記フレーム画像のそれぞれから、そのデータ量を前記削減率で減少させることにより複数の階層フレーム画像を作成する階層フレーム生成段階と、
同一の前記削減率を有する前記階層フレーム画像と前記階層テンプレート画像とを組み合わせ、前記削減率の大きい順にテンプレートマッチング処理を行うマッチング段階と、
前記マッチング段階に、前記階層フレーム画像の各領域における類似度を求める類似度計算段階と、
前記類似度と所定の閾値とを比較する閾値判定段階と、
を含み、
前記フレーム画像は、色情報と透明度情報を有し、
前記類似度は、前記階層フレーム画像における色分布の類似度と、透明度分布の類似度と、1つ前に処理したフレーム画像の最も高い類似度を有する領域からの距離による重みとから求められ、
前記所定の閾値よりも小さい類似度を有する領域については、以降の前記テンプレートマッチング処理を行なわず、最後に該処理を行った階層フレーム画像の最も高い類似度を有する領域に前記物体が存在すると判断することを特徴とする物体認識方法。 - 前記領域当たりの前記類似度は、該領域を構成する画素のそれぞれで類似度を求めて、その類似度の絶対値を用いて算出することを特徴とする請求項4に記載の物体認識方法。
- 請求項4または5に記載の方法をコンピュータに実行させるためのプログラム。
- 請求項6に記載のプログラムを格納したコンピュータ可読媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007306778A JP4971114B2 (ja) | 2007-11-28 | 2007-11-28 | 物体認識装置、物体認識方法、物体認識プログラム、および該プログラムを格納するコンピュータ可読媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007306778A JP4971114B2 (ja) | 2007-11-28 | 2007-11-28 | 物体認識装置、物体認識方法、物体認識プログラム、および該プログラムを格納するコンピュータ可読媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009129388A JP2009129388A (ja) | 2009-06-11 |
JP4971114B2 true JP4971114B2 (ja) | 2012-07-11 |
Family
ID=40820200
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007306778A Active JP4971114B2 (ja) | 2007-11-28 | 2007-11-28 | 物体認識装置、物体認識方法、物体認識プログラム、および該プログラムを格納するコンピュータ可読媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4971114B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5317934B2 (ja) * | 2009-11-25 | 2013-10-16 | 富士フイルム株式会社 | オブジェクト検出装置および方法並びにプログラム |
JP5633245B2 (ja) | 2010-08-20 | 2014-12-03 | 富士ゼロックス株式会社 | 情報処理装置及び情報処理プログラム |
JP5409719B2 (ja) | 2011-07-27 | 2014-02-05 | 日立アロカメディカル株式会社 | 超音波画像処理装置 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08279044A (ja) * | 1995-03-14 | 1996-10-22 | Imeeji Joho Kagaku Kenkyusho | パターン認識装置およびジェスチャ認識装置 |
JPH1021389A (ja) * | 1996-07-03 | 1998-01-23 | Mitsubishi Electric Corp | テンプレートマッチング方法およびその装置 |
JP2003216955A (ja) * | 2002-01-23 | 2003-07-31 | Sharp Corp | ジェスチャ認識方法、ジェスチャ認識装置、対話装置及びジェスチャ認識プログラムを記録した記録媒体 |
JP2006172439A (ja) * | 2004-11-26 | 2006-06-29 | Oce Technologies Bv | 手操作を用いたデスクトップスキャン |
-
2007
- 2007-11-28 JP JP2007306778A patent/JP4971114B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2009129388A (ja) | 2009-06-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6942488B2 (ja) | 画像処理装置、画像処理システム、画像処理方法、及びプログラム | |
JP4929109B2 (ja) | ジェスチャ認識装置及びその方法 | |
US10438360B2 (en) | Video processing apparatus, video processing method, and storage medium | |
CN105830093B (zh) | 用于产生与非均匀大小的空间区相关的元数据的系统、方法及设备 | |
JP4575829B2 (ja) | 表示画面上位置解析装置及び表示画面上位置解析プログラム | |
US8379987B2 (en) | Method, apparatus and computer program product for providing hand segmentation for gesture analysis | |
JP4915655B2 (ja) | 自動追尾装置 | |
JP4855556B1 (ja) | 動体検出装置、動体検出方法、動体検出プログラム、動体追跡装置、動体追跡方法及び動体追跡プログラム | |
US9503629B2 (en) | Image processing apparatus, image processing method, and computer-readable device having instructions for generating focused image | |
EP2372654A1 (en) | Object tracking apparatus, object tracking method, and control program | |
US20150145762A1 (en) | Position-of-interest detection device, position-of-interest detection method, and position-of-interest detection program | |
US10721431B2 (en) | Method for estimating a timestamp in a video stream and method of augmenting a video stream with information | |
JP2021048617A (ja) | 情報処理システム、情報処理方法及びプログラム | |
JP2012003414A (ja) | ジェスチャ認識装置、ジェスチャ認識方法およびプログラム | |
TWI571772B (zh) | 虛擬滑鼠驅動裝置及虛擬滑鼠模擬方法 | |
JP2011076255A (ja) | ジェスチャ認識装置、ジェスチャ認識方法、およびジェスチャ認識プログラム | |
JP2014236312A (ja) | 設定装置および設定方法 | |
JP2008288684A (ja) | 人物検出装置及びプログラム | |
JP4971114B2 (ja) | 物体認識装置、物体認識方法、物体認識プログラム、および該プログラムを格納するコンピュータ可読媒体 | |
JP2008035301A (ja) | 移動体追跡装置 | |
JP2002366963A (ja) | 画像処理方法、画像処理装置、撮像装置及びコンピュータプログラム | |
JP4559375B2 (ja) | 対象物位置追跡方法、装置、およびプログラム | |
KR101281461B1 (ko) | 영상분석을 이용한 멀티 터치 입력 방법 및 시스템 | |
JP2006244272A (ja) | 手位置追跡方法、装置、およびプログラム | |
JP2006318064A (ja) | 画像センサ |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20101013 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111121 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111216 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120315 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120405 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150413 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |