JP4652698B2 - 画像認識装置、画像認識方法及びプログラム - Google Patents

画像認識装置、画像認識方法及びプログラム Download PDF

Info

Publication number
JP4652698B2
JP4652698B2 JP2004046447A JP2004046447A JP4652698B2 JP 4652698 B2 JP4652698 B2 JP 4652698B2 JP 2004046447 A JP2004046447 A JP 2004046447A JP 2004046447 A JP2004046447 A JP 2004046447A JP 4652698 B2 JP4652698 B2 JP 4652698B2
Authority
JP
Japan
Prior art keywords
layer
pattern
input pattern
processing unit
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004046447A
Other languages
English (en)
Other versions
JP2005235089A (ja
Inventor
優年 関根
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Science and Technology Agency
National Institute of Japan Science and Technology Agency
Original Assignee
Japan Science and Technology Agency
National Institute of Japan Science and Technology Agency
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Science and Technology Agency, National Institute of Japan Science and Technology Agency filed Critical Japan Science and Technology Agency
Priority to JP2004046447A priority Critical patent/JP4652698B2/ja
Publication of JP2005235089A publication Critical patent/JP2005235089A/ja
Application granted granted Critical
Publication of JP4652698B2 publication Critical patent/JP4652698B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Description

本発明は、画像認識装置、画像認識方法及びプログラムに係り、特に、Haarウェーブレット変換等のウェーブレット変換により異なる分解能レベルでカラー画像のテンプレート・マッチングを行い、粗い分解能レベルから対象領域を絞り込む画像認識装置、画像認識方法及びプログラムに関する。
一般に、背景から対象領域を分離する方法としては、色情報やコントラストの閾値で分離する方法、median filterによる境界抽出、フラクタルを利用した井田の方法、パラメトリック空間による方法、ウェーブレット変換の多重解像度やマルチ・スケールを利用する方法など多くの方法が提案されている(非特許文献1)。これらの中で、状況を大まかに捉えてから次第に詳細を得ていく方式を多重分解能原理と呼んでいる(非特許文献2)。また、画像処理の計算量を減らす一般的な手法の一つとしてcoarse to fine template matching(粗から密の分解能のテンプレート・マッチング)がある。この方法は全入力領域の入力パターンを1/kに圧縮して粗くした入力パターンに対して、同じ粗さのcoarse template(粗い分解能のテンプレート)により対象領域の選択を行う(非特許文献3)。この方法もこの多重分解能原理に基づくものといえる。
なお、本発明者等は、画像認識の前処理手法のひとつであるウェーブレット変換等の変換による信号処理及び解析を行う部分選択変換により、情報量の削減と信号処理の高密度とを同時に達成する技術を出願した(特許文献1)。
MH.Yang,D.J. Kriegman, N. Ahuja,"Detecting Facesin Images: A Survey",IEEE Trans., PA and MI,vol.24, no.1, pp.34−58, JANUARY 2002 小川英光、"パターン認識・理解の新たな展開"、電子情報通信学会、東京、1994 M.Gharavi−Alkhansari、"A Fast Globally OptimalAlgorithm for Template Matching Using Low−Resolution Pruning"、IEEE Trans. Image Process.,vo.10, no.4, pp.526−533, APRIL 2001 R.L.Hue,M.Abdel−Mottaleb, and A.K.Jain,"FaceDetection in Color Images",IEEE Trans. on PA andMI, vol24, no.5, pp696−705,MAY 2002 特開平15−124815号公報
しかしながら、従来のcoarse to fine template matchingの方法では、処理時間が1/kに減少する利点があるが、coarse templateで得られた対象領域がfine template(密な分解能のテンプレート)により得られる領域とずれてしまう場合がある。また、この方法では、対象領域の候補を生成する時の精度が全解像度で同じであり、探索の効率化には限界があった。
本発明は、以上の点に鑑み、粗い解像度レベルでの探索に使うマッチング候補を間引くことにより大幅に効率化を実現することを目的とする。また、本発明は、この間引くことによる候補漏れを防ぐために、詳細なベクトルで、新たに探索領域を再構成することで、大幅な探索時間の削減を得ると同時に、正しくマッチングが行えるようにすることを目的とする。
本発明の第1の解決手段によると、
異なる分解能で画像のテンプレート・マッチングを行い、粗い分解能から密な分解能へマッチングの対象領域を絞り込む画像認識装置において、
入力画像である密な分解能の第n層入力パターンと、第n層入力パターンを多段階に粗い分解能へ圧縮した第n−1〜0層入力パターンと、各層の入力パターンと同一の分解能のテンプレートである第n〜0層特徴パターンとを記憶した記憶部と、
前記記憶部からデータを読み取り及び前記記憶部にデータを書き込み、テンプレート・マッチングを実行する処理部と
を備え、
前記処理部は、第0層入力パターン及び第0層特徴パターンを前記記憶部から読みとる手段と、
前記処理部は、第0層入力パターン及び第0層特徴パターンとの照合を行うための、両パターンが一番一致する領域である注視領域の第0層注視領域FDを記憶部から読み出して設定する手段と、
前記処理部は、レベルの異なる層に注視領域を送るときに分解能の差異に応じた大きさを計算することで第0層注視領域FDに対応する仮の第1層注視領域FDを求めるための逆注視処理を実行し、第1層注視領域FDを前記記憶部に記憶する手段と、
前記処理部は、再帰的に層レベルj=1からj=nまでテンプレート・マッチング処理を実行する手段であって、
前記処理部は、前記記憶部から第j層入力パターン及び第j層特徴パターンを読みとる手段と、
前記処理部は、第j層での探索範囲として仮の第j層注視領域FDを前記記憶部から読みとり、設定する手段と、
前記処理部は、第j層入力パターンの仮の注視領域FD内で、第j層特徴パターンを走査して両パターンが最も一致する場所を探索し、その場所に基づき第j層特徴パターンを含む所定範囲の領域を第j層注視領域FDとして定め、該注視領域を定める情報を前記記憶部に記憶する手段と、
前記処理部は、第j層と第j+1層の分解能の差異に応じた大きさを計算することで、注視領域FDを第j+1層に逆写像して仮の第j+1層注視領域FDj+1を求めるための逆注視処理を実行し、該仮の注視領域を定める情報を前記記憶部に記憶する手段と、
前記処理部は、再帰的に照合を行い層レベルjを増加させて第n層まで進めるようにした
前記テンプレート・マッチングを実行する手段と、
前記処理部は、特定されたマッチングした領域を定める情報を表示部に表示及び/又は出力部により出力する手段と、
を含む画像認識装置が提供される。
本発明の第2の解決手段によると、
入力画像である密な分解能の第n層入力パターンと、第n層入力パターンを多段階に粗い分解能へ圧縮した第n−1〜0層入力パターンと、各層の入力パターンと同一の分解能のテンプレートである第n〜0層特徴パターンとを記憶した記憶部と、
前記記憶部からデータを読み取り及び前記記憶部にデータを書き込み、テンプレート・マッチングを実行する処理部と
を備えた画像認識装置を用いて、コンピュータが、異なる分解能で画像のテンプレート・マッチングを行い、粗い分解能から密な分解能へマッチングの対象領域を絞り込む画像認識プログラム及び画像認識方法において、
前記処理部は、第0層入力パターン及び第0層特徴パターンを前記記憶部から読みとるステップと、
前記処理部は、第0層入力パターン及び第0層特徴パターンとの照合を行うための、両パターンが一番一致する領域である注視領域の第0層注視領域FDを記憶部から読み出して設定するステップと、
前記処理部は、レベルの異なる層に注視領域を送るときに分解能の差異に応じた大きさを計算することで第0層注視領域FDに対応する仮の第1層注視領域FDを求めるための逆注視処理を実行し、第1層注視領域FDを前記記憶部に記憶するステップと、
前記処理部は、再帰的に層レベルj=1からj=nまでテンプレート・マッチング処理を実行するステップであって、
前記処理部は、前記記憶部から第j層入力パターン及び第j層特徴パターンを読みとるステップと、
前記処理部は、第j層での探索範囲として仮の第j層注視領域FDを前記記憶部から読みとり、設定するステップと、
前記処理部は、第j層入力パターンの仮の注視領域FD内で、第j層特徴パターンを走査して両パターンが最も一致する場所を探索し、その場所に基づき第j層特徴パターンを含む所定範囲の領域を第j層注視領域FDとして定め、該注視領域を定める情報を前記記憶部に記憶するステップと、
前記処理部は、第j層と第j+1層の分解能の差異に応じた大きさを計算することで、注視領域FDを第j+1層に逆写像して仮の第j+1層注視領域FDj+1を求めるための逆注視処理を実行し、該仮の注視領域を定める情報を前記記憶部に記憶するステップと、
前記処理部は、再帰的に照合を行い層レベルjを増加させて第n層まで進めるようにした
前記テンプレート・マッチングを実行するステップと、
前記処理部は、特定されたマッチングした領域を定める情報を表示部に表示及び/又は出力部により出力するステップと、
をコンピュータに実行させるための画像認識プログラム及び画像認識方法が提供される。
本発明によると、マッチング精度を大幅に向上することができ、計算量を大幅に減少し高速化することができる。
1.本実施の形態の概要
本実施の形態では、まず、Haarウェーブレット変換により入力信号を多段階に圧縮し複数の分解能レベルの画像を作る。テンプレートも同じ様に圧縮して複数の分解能レベルのものを作成する。次に、粗い分解能レベルからテンプレート・マッチングを行い、最もマッチング計算が良い場所を探し、マッチングが良くない場所は、以降、探索領域から削除する。これを繰り返して、逐次的に探索領域を削減する。本発明では、照合(マッチング)を一段階で行うのではなく、多数の分解能レベルでの多重処理として大域から局所的な領域へと処理を行う。マッチングでテンプレートを移動させる刻みとしてはそれぞれの分解能レベルに従って、粗いレベルでは、大きく取り、詳細な分解能レベルでは、細かく移動させる。入力パターンとテンプレートは多重に異なる分解能で表現され、その両者間で定義される誤差を多重に計算する。各層での入力パターンは色情報、エッジ情報の他に、これらから計算したエネルギー値を持つ。このエネルギー値を、より詳細な分解能レベルでの探索領域に対して加算する。こうすることで、粗いレベルでの探索結果を次のレベルの探索領域に反映させることができる。このエネルギー値により、細かい特徴に対する過剰な寄与を緩和する事ができ、結果的に大まかな特徴でのマッチング結果を反映させる効果を実現している。
この方式の妥当性を検討するため、後述のように、目の特徴パターンで顔の部分領域を取り出す実験を行った。照合結果を前段での照合に戻す制御の簡単な例として、前段の対象領域中の画素のエネルギー値を引き上げる簡便法を使い、大まかな領域分割処理を通じて前段での照合に影響を与える機構を組み入れた。簡単な制御例を示すことで、多重分解能原理に基づく方式の実用化の可能性を示した。
以下、2節では入力パターンと出力パターンとの多重照合を出力側から入力側に向けて行う定式化を行い、3節では、多重照合のハードウェア及びアルゴリズムを示し、一例として、Haarウェーブレット関数を使った例による実験を構成し、照合とウェーブレット変換のとの関係、出力側からの簡単な制御例を示し、4節でその効果について述べる。
2. 多重処理
2.1 入力信号空間と特徴空間
図1に、入力信号空間と特徴空間の説明図を示す。
入力信号空間では、有限個のn次元ベクトルI(k) {k=0,…,k}の組み合わせで入力パターンを構成する。この入力パターンI(k)を含む入力信号空間をU:{I(0),I(1),.,I(k)}⊆U⊆Rとする(Rは実数全体の集合)。最終段では、パターン処理は高々m(<n)個の素子で処理するとものとし、m次元ベクトルで表す。この最終パターンO:{O ,O ,...,Ok0 }⊆U⊆Rで特徴空間を構成する。中間処理での入力パターンを異なる分解能の部分空間列U⊆Rnj(...Uj−1⊆U...)で表現する。
部分空間Uで、入力パターンは異なる分解能のパターンに密から粗へと変換されて表現されている。同様に、最終パターンOからOjのパターンへと粗から密へと変換することを考え、入力パターンと特徴パターンとの間でパターン処理を部分空間Uで多重に処理することを考える。
そこで、粗い分解能のテンプレートから密な分解能のテンプレートを入力パターンの流れとは逆方向に作る。このテンプレートを特徴パターンと呼ぶ。なお、後述のアルゴリズム等の説明のように、密な分解能の入力パターンから粗な分解能の入力パターンを多段階の層で求めて予め用意しておき、それらの各層と対応して、同様に、特徴パターンについても密な分解能から粗な分解能の特徴パターンを多段階の層で求めて予め用意しておくようにしてもよい。
そこで、入力パターンを処理して、粗い分解能の入力パターンを成する関数列をf、粗い分解能の特徴パターンから密な分解能の特徴パターンを作る関数列gを、
とする。

なお、入力パターンI、特徴パターンOは画素値である。画素値としては、色の3成分であるRGB成分、それを変換したYUV成分でも構わない。さらに、途中の段階では、実際には、一例として、色成分はウェーブレット係数で表現しているので、それぞれの色成分のウェーブレット係数が画素値として入出力される。
(各パターンのフォーマット)
特徴パターンのフォーマットは、画像全体の情報として、特徴パターン毎に、(解像度の異なる特徴パターンが多数あるので)特徴パターン名(テンプレート名)のデータベースを作って記憶部5に記憶される。そのフィールド(項目)としては、以下に例示する。
{特徴パターン番号、レベル、高さ、幅、画像ファイル名}
ここで、画像ファイルには、実際の画像データが入っていて、例えば、画素ごとに、「画素値、エネルギー値、重み」の三つ組みで表すことができる。なお、特に重みは、普通は掛け合わせるが、本実施の形態では、加算量にすると計算を軽くすることができる。
入力パターンも特徴パターンと同様に構成することができる。
2.2 構成方法
図2に、変換画像と各層についての説明図を示す。
図示のように、分解能にあわせて部分空間Uが層状に配置される。層毎に格子Γ上の格子点xγに演算要素cγ を配置する。N個のウェーブレット基底関数ψα (x)を格子Γの演算要素に割り当てる。以後、記号α=1,2,...,Nは入力パターンに関係する添え字を表し、β=1,2,...,Nは特徴パターンに関係する添え字を表し、γ=1,2,...,Nは入力パターンや出力パターンに依存しない添え字を表す。
各ウェーブレット基底関数の台の大きさはUの分解能2−jに対応する。2次元のHaar関数では、台の大きさは、例えば、四角領域(x(2−jk,2−jk)、x(2−j(k+1),2−jk))、x(2−jk,2−j(k+1))、x(2−j(k+1),2−j(k+1)))で格子が表現される。なお、「台」とは基底関数が0でない値を持つ領域の事を言う。例えば、ウェーブレット関数の大きさを示すもので、Uでウェーブレット関数の大きさがL(0<x<L)とすれば、UはL/2、UはL/4の領域で0でない値、Harrでは、1/L、2/L、4/Lの値を持つ事になる。
この層状配置に沿って、Uj+1層のhj+1番目の入力パターンIh_j+1 j+1
のように圧縮されながら、U層のh番目の入力パターンIh_j となって伝播する。特徴パターンOk_j−1 j−1
のように展開されながら入力側に向かって進む。入力パターン{Ih_n }と特徴パターン{Ok_0 }は多重に異なる分解能jで{Ih_j }、{Ok_j }と記述される。
層での入力パターンI は、ウェーブレット展開係数をWα Ijとしてウェーブレット基底関数{ψα }の線形和で記述される。入力パターンI により選択されたウェーブレット基底関数を表す添え字{α}の集合をλ :{α}とする。同様に特徴パターンO に対する添え字βの集合をλ :{β}とする。両パターンは部分空間U層ではウェーブレット基底関数ψα (x)、ψβ (x)で展開され、
である。ウェーブレット関数ψα (x)、ψβ (x)は演算要素cγ で計算される。ここで、演算要素cγ は、実際の部分回路で、ウェーブレット変換を行い、ウェーブレット係数を求める演算器、その値を保持するレジスタや局所メモリの記憶要素などを含む回路要素である。なお、cγ の局所メモリには、ウェーブレット係数Wα Ij、Wβ Oj、要素エネルギーeγ 、しきい値thrγ 、cγ の内部状態や制御情報等が保持される。cγ はUj+1、Uj−1からの入力を計算しウェーブレット係数Wα Ij、jWβ Ojを出力する。また、U内で相互結線を通じて相互作用を行う。ここで、cγ の局所メモリとは、計算に必要な値を保持するメモリ素子(RAM、レジスタ、FF)などをいう。
演算要素cγ では、一例として、以下に挙げる計算・処理で実現することができるが、これに限らず、様々な実現方法によっていろいろな計算・処理を適用することができる。
(1)画素(wavelet係数)値を計算するのに画素周辺の画素値から色補正する等の色計算を行う。
(2)画素値を周辺に拡散させて滲ませる処理をする。
(3)画素値の分布からエネルギー値を計算する。
(4)次段のwavelet係数(Harrでは平均値と差分値)を計算して出力する。
(5)メモリ・アドレスを計算してデータ転送を行う。
(6)テンプレートと入力画像の画素の差分を取り一致度計算を行う。
(7)平均輝度を求め、輝度補正を行う。
(8)隣接画素との結合度を計算する。
2.3 入力と特徴パターンとの照合
各層では入力パターンと特徴パターンが入力され照合される。この照合結果は外部に出力される。同時に、入力層に向かって特徴パターンの生成制御を行う。
2.3.1 Uでのパターン変換とマッチング
関数fj+1、gの成分はUでのcγ 毎に計算され、fj+1=(...,fα j+1,...)、g=(...,gβ ,...)である。ここでは、簡単な例として、入力値がしきい値以上の値を持つとき計算が可能とする。N(x)をxの格子Γ上の隣接格子点の集合とする。cα 、cβ の入力領域を、N’α=N(f−1(xα ))、N”β=N(g−1(xβ ))とすれば、cα ,cβ でのウェーブレット係数は、
である。U層内のcα を介して前層Uj+1内のcβ j+1を制御するため、U層内での両パターンに対する一致度
の計算をする。
このDβα を生成するOβ はUの分解能で定まる特徴パターンであり、より粗いOβ j−1から誘導される。
なお、上述の式は、レベルが異なる、ウェーブレット係数W間の関係式を一般的に表したものである。ウェーブレット変換すると同時に、フィルター処理、選択処理、重み付けなど、補助的な処理も加えて考えることができる。(7)式では、入力パターンは高解像度から低解像度へと逐次的に進行することを示す。ここでは、入力パターンの中にあり、特徴パターンと一致するであろう部分パターンをN’αで暗に指定している。(8)式では、特徴パターンは逆に低解像度から高解像度へと逐次的に進行することを示す。さらに、(9)式では、各解像度レベルでは、一致度が、両パターン間で計算されることを示す。両パターンの一致はN’α、N”βで表される。
3.画像認識装置及び方法
3.1 ハードウェア
図3は、画像認識装置に関するハードウェアの構成図である。
このハードウェアは、中央処理装置(CPU)である処理部1、入力部2、インタフェース部3及び記憶部5を有する。また、処理部1、入力部2、インタフェース部3及び記憶部5は、スター又はバス等の適宜の接続手段で接続されている。記憶部5はウェーブレット変換及びテンプレートマッチング等の計算に必要な各種データを記憶したパラメータファイル51、入力パターンファイル52及び特徴パターンファイル53等の各データを含む。
3.2 アルゴリズム
図4に、多重照合には画像認識方法の処理概要についての説明図を示す。
上図は、第j−1層、中図は、第j層、下図は第n層を示し、第j層に対して、第j−1層側が粗い分解能側、n層が密な分解能側を表わす。
第j−1層では、処理部1は、外枠で示された入力パターンを、小さい四角で示された特徴パターンのテンプレートで破線のようにスキャンしてパターンマッチングする領域を求める。ここで、処理部1は、各位置における一致度を計算し、所定範囲の一致度である領域を求める。この例では領域1、2、3がそれぞれ一致する度合いの高い順に示されており、処理部1は領域1を第j−1層の注視領域として設定する(get_focus_domain)。次に、処理部1は、この領域のテンプレートを拡大し、破線の四角で示されたように、第j層でスキャンする領域(仮の注視領域)として定めて、第j層の処理に渡す(back_focus)。
第j層では、処理部1は、第j−1層から受けた仮の注視領域内を特徴パターンのテンプレートで再びスキャンして、パターンマッチングする領域を求める。この例では、領域1及び2が求められたので、上述と同様に最も一致する度合いの高い領域1を拡大して、破線の四角で示されたように、注視領域を求めて、次の層に渡す。以下、処理部1は、同様に第n層まで再帰的にテンプレートマッチングを実行する。
図5に多重照合による画像認識方法の前処理のフローチャートを示す。
処理部1は、第n層の特徴パターンを記憶部5から読み取り(S101)、その特徴パターンに基づき、第n−1層〜第0層での各特徴パターンOを事前にウェーブレット変換して求め、それらを記憶部5に記憶する(S103)。また、処理部1は、照合に先立って、第n層の入力パターンを記憶部5から読み取り(S105)、その入力パターンに基づき、第n−1層〜第0層での各入力パターンIをウェーブレット変換をして求め、それを記憶部5に記憶する(wavelet_transform)(S107)。ここで、第n層が最上の解像度、入力パターンの解像度の値を示している。なお、実際には、複数の解像度の異なる特徴パターンとある解像度での入力パターンとの解像度レベルを調節する必要がある場合が考えられるが、この実施の形態では、相互の解像度レベルが整合したと暗黙に仮定している。
図6に、多重照合による画像認識方法のフローチャートを示す。
以下のような前処理の後に、処理部1は、第0層(レベル0)での入力パターン(入力画像)Iと特徴パターン(テンプレート)Oを記録部から読みとる(S151)。次に、処理部1は、入力パターンIと特徴パターンOとの照合を行うための注視領域(focus domain)FDを定める(get_focus_domain)(S153)。ここで、注視領域とは、特徴パターンのテンプレートと一番一致したところであり、例えば、その一致したテンプレートの位置を中心にして(又はその位置を含み)テンプレートの予め定められた何倍かの大きさの領域を計算して決めることができる。
さらに、処理部1は、領域FDに対応する第1層(レベル1)の探索範囲としての仮の注視領域FDを求める逆注視(back_focus)を行う(S155)。そのためには、処理部1は、例えば、第0層から第1層への領域の伸張度合いに従って注視領域FDを拡張してFDとすることができる。また、処理部1は、領域FDに対応する第1層の領域内の演算要素cγ に対してエネルギー加算を逆注視で行う。
ここで、逆注視とは、第j−1層のFDj−1をレベルの異なる第j層に送る時に画素の解像度が異なるので、その大きさを計算して領域FDを決めるものである。なお、ここでは、圧縮の方向とは逆の方向に注視の方向があるので逆注視という。実際は、例えば、領域の四角形の頂点座標を拡大して求めることができる。この時に、第j層のFDとして指定されたことの効果を出すためには、例えば、第j層のcのエネルギー項に第j−1層の対応するcj−1のエネルギー値を加算する。
以上の前準備をした後に、処理部1は、テンプレート・マッチング処理(template_matching)を再帰的に呼び出して照合を行う。テンプレート・マッチングでは、まず、処理部1は、j=1に初期設定する。次に、処理部1は層(レベル)がnより大きくないか判断する(S201)。処理部1は、記憶部5から第j層の入力パターンと特徴パターン(テンプレート)を読みとる(S203)。つぎに、処理部1は、第j−1層の注視領域FDj−1から第j層での探索範囲として求められた、仮の注視領域FDを記憶部5から読み取って、設定する(get_focus_domain)(S205)。次に、第j層において、領域FD内で、特徴パターンと探索範囲とが一致する場所を走査等により探索して、その場所に基づきテンプレートの位置を中心として又はその位置を含む予め定められた範囲の領域を第j層の注視領域として設定し、位置情報や大きさ等の領域を定める情報を記憶部5に記憶する(S207)。ここで、処理部1は、テンプレートと入力パターンの選択された部分とが関係しているかを調べる。処理部1は、与えられた判定基準を満たさないときテンプレートと関係ないと判定する。ここで、判定基準としては、例えば、次のような処理が挙げられる。
(1)テンプレートとの一致度をしきい値により判断すること(一致度が小さい程一致しているときはしきい値以上、一致度が大きい程一致しているときはしきい値以下)
ここで、一致度については、処理部1は、各処理部1が求めた領域について、一致度に基づき、最適な第j層の注視領域FDを比較及び選択し設定する。例えば上述の(9)式のDαβ が最小になる場所Pを探し注視領域FD候補を定めることができる。
(2)処理部1が、テンプレートを作って、テンプレートと同程度の大きさのものが作れたとき成功と判断すること
ここで、処理部1は、第j層のテンプレートの中で、一番一致している画素と対応している第j層の入力画像の画素を基点にして、第j層の入力画像の画素を上下左右方向にテンプレートの大きさに応じて取り込むようにして新テンプレート領域として拡張していく。処理部1は、この領域を拡張する時に新たに含まれる画素が新テンプレート領域として妥当かどうかを評価する。この評価は与えられた計算式と閾値で行われる。たとえば、画素エネルギーの計算式とその閾値などである。こうして作成した新テンプレートと元のテンプレートとを比較して、類似のものが作成できた時、たとえば、新テンプレートの大きさや新テンプレートと元のテンプレートとの一致度などを比較する。類似性の比較としては、他に、簡単な場合としては色の類似性や変化割合の程度、明暗の類似性や変化割合の程度が考えられる。さらに、複雑な場合には、形状(縦線、横線)などの図形情報、色の組み合わせなどの統計量による判断など、様様なものが考えられる。処理部1は、求めた新テンプレートを記憶部5に、必要に応じて記憶する。なお、新テンプレートを元のテンプレートに置き換えてもよい。
次に、処理部1は、エネルギー加算を行うこと等により、注視領域FDを第j+1層に逆写像して逆注視を行い、第j+1層の仮の注視領域を定める情報等の計算結果を記憶部5に記憶する(back_focus)(S209)。処理部1は、再帰的に上述のような照合をテンプレート・マッチング(template_matching)により行いレベルを増加させて(S211)、第n層まで進めれば、照合が成功したと判定し(S201)、テンプレート・マッチング処理を終了する。
次に、処理部1は、以上の計算により特定された領域を記憶部5から読み出し、表示部4に表示及び/又は出力部3により出力する(S213)。なお、処理部1は、中間結果及び最終結果を、必要に応じて、適宜記憶部5に、書き込み及び記憶部5から読み取るようにしてもよい。
また、ステップS207において、処理部1は注視領域の候補として、不要な領域を取り除くために、一例として、非特許文献3での照合候補を刈り取る式をテンプレートの再構築(restruct_template)で使用することができる。テンプレートの再構築とは、層の間で制御情報を伝播させてテンプレートを再構築する処理である。このテンプレートの再構築は、上述の判定基準の(2)で説明したテンプレートの再構築のことであり、再構築に成功したかどうかを返り値として返す。
本実施の形態では刈り取る式の否定を取り、照合候補の選択条件を
とする。この条件式を満たせば、次に、エネルギー値の上限・下限のしきい値内に入る領域を切り出して注視領域FDの作成を試みる。一方、この式を満たさなければ、照合候補として選択しない。処理部1は、特徴パターンより大きい注視領域FDが得られれば、テンプレートの再構築(restruct_template)が成功したとする。
ここで、「刈り取る式の否定を取る」について補足する。一般に、対象候補から外す事を探索木から刈り取るという。本実施の形態では、(9)式の一致度が大きくなると似ていないことになるので、(14)式の第j−1層から第j層に変えた時にDが大きくなってしまったら、その領域を候補から外せばよいことになる。その時の不等号は、 D> Dj−1 となる。この条件の否定をとる、すなわち、不等号を反転させると(14)式になる。
図7に、多重照合システムの擬似コードを示す。このプログラムは上述のフローチャートをコード化した一例である。
なお、このコードではパラメータは次のように対応している。
入力パターン :i0、i1
特徴パターン(テンプレート) :oj、o1
第n層 :Level
第j層 :lvl
図8にテンプレート・マッチングのためのシストリック型アーキテクチャの構成図を示す。また、図9にプロッセッシングエレメントの入力出力を示す説明図を示す。
処理部1によるテンプレート・マッチングは、例えば、このようなシストリック型アーキテクチャにより、並列演算処理を行うことができる。このアーキテクチャは、デジタルクリップフロップDFF11、マルチプレクサMUX12、プロッセシングエレメントPE13、比較器14を備える。DFF11はテンプレートの開始位置をずらす。MUX12は入力画像の開始ブロックを選択する。PE13は一致計算をする。各PE13において、ainはテンプレート入力、binは入力画像の入力、sumoutは画素の計算結果(式の各項)をそれぞれ示す。入力画像データ(入力パターン)の各データ、B1、B2、B3は画像の部分並列処理のために分割してある。各PE13は、入力パターンファイル52からの入力画像データと、特徴パターンファイル53からのテンプレートとの一致計算を行う。例えば、特徴パターンのテンプレート入力ain(i)(i=1、2、・・・、256)、入力パターンの画像入力bin(i)とすると、次式により一致度の計算を行い、計算結果をsumoutに集積する。この計算は、複数PEによる並列演算処理により、実行される。比較器は、複数PEの中からこの一致度計算により得られたsumoutに対して最も一致度の高い位置を選択する。
図8で並べられたDFF11のi番目をDFFとする。DFFはPEと同数個あり、その個数分だけ並列に処理をする。テンプレート画像データainはDFF、DFFを次々に伝播して、ある時間では、DFF列に対して、a(I)、a(I−1)、a(I−2)、a(I−3)、a(I−4)、a(I−5)、・・・と値が伝播している。この状態の時に、入力画像bin(j)は並列に全PE13に対して入力される。同時に、全DFF11からも、異なるa(I−k)の値がPEに入力され、bin(j)とa(I−k)との間で(8)式による一致度の計算が行われる。これは、bin(j+k−I)にたいして、a(0)からのテンプレートとマッチング処理を行う事であり、同時に異なる位置からテンプレート・マッチングを行っている事になる。
4. 実験モデル
図10に、Lenna入力画像と目テンプレートの図を示す。
粗い分解能レベルで行った入力パターンと特徴パターンとの照合結果を用いて密な分解能での照合領域を選択する実験を行った。関数fにはHaarウェーブレット変換、関数gには逆Haar変換を用いる。Dβα で選択された領域に対して、回路のエネルギーeβ を加算して照合の制御に使用する。入力パターンIα としてはLennaカラー画像(図10(a))を用いる。そのRGB成分は各8ビットであり、RGB成分毎にウェーブレット変換を4回行う。各層(j=3〜0)でのRGB成分の(スケーリング係数を含めた)ウェーブレット係数Wα (R,G,B)を記憶する。特徴パターンOβ (図10(b))は手動で、入力画像の一部を切り出して作成し、入力画像と同様にウェーブレット変換を行い、各層毎に記憶する。
4.1 一致度計算
一致度の計算テンプレート・マッチング(template_matching)にはcγ でのRGB成分から、以下の式
に従って、輝度Y、色差Cr、Cb、エネルギーeγ を計算して使用する。特徴パターンOβ と入力画像Iα から取り出した、(左上隅の)座標xの部分パターンIα1 (x1)との一致度計算は、各成分の差の絶対値を特徴パターンの画素毎に
を計算し、混合係数Kで重み付けを行い、差分
を求める。次にcβk毎の差分Δの和を求めて一致度
を得る。この一致度が最小となる部分パターンI selected(x)がU層で最適であるとして、その領域が選ばれる。この実験で肌色(skin−color)として認識される領域はYCrCb色空間内に分布している(非特許文献4)。
この文献での肌色領域はY軸方向では210−40=170の幅に分布しているのに対し、CrCb平面に射影して得た領域の広がりは(130−80)x(170−130)=50x40である。この領域の広がりが一致度に寄与し、その比は170/50=3.4〜170/40=4.25である。そこで、dYとdCr、dCbとの寄与度を同等にするために導入したのが混合係数Kcである。このKcを変化させて実験を行いKc=4を得た。この値は肌色領域の広がりから予測される値と一致する。また、このKcは特徴パターンに依存する調整パラメータと考えられる。Lenna画像では、Kcの値を変化させてもKcの効果は小さく、いずれの場合でも照合は成功する。しかし、Lenna画像と比較して暗い領域と明るい窓領域があり輝度分布に偏りがあるgirl画像(後述の図13(a))では、Kc=1.0と輝度の効果を大きくすると輝度値が大きい窓領域が誤認識される。他方、Kc=10と色差の効果を大きくすると赤いマフラーと首の領域が誤認識される場合がある。
4.2 実験結果
非特許文献3では、候補の刈り取りを行い計算量を削減することのみが検討課題であり、生き残った候補の中から正しい候補が得られるものと考えている。したがって、層毎に独立して一致度計算を行うので、粗い特徴パターンで大まかに正しい候補を選ぶという多重分解能原理を十分に反映していない。本実施の形態の逆注視の機構は、j層の一致度計算にj−1層の一致度計算結果を直接反映させるものである。この機能を確かめるために、逆注視(back_focus)の効果がある場合と、非特許文献3と同じように無い場合との比較を行った。
図11に、目テンプレートによる注視領域の探索の図を示す。この図は、逆注視の効果を示す比較結果を表す。
この図は、注視領域設定(get_focus_domain)で最適位置を得た結果の場所に一致度計算に使用した特徴パターンを置いたものである。この図では、粗い第0層から第3層まで順に注視領域設定(get_focus_domain)で得た場所Pで、目のテンプレートを重ねて表示してある。左列(a)−(d)が逆注視が無い場合であり、右列(e)−(h)が逆注視がある場合である。左側の列は、逆注視処理(back_focus)をしないで各レベルで、各解像度の特徴パターンで探索した結果である。一方、右側の列は、その注視領域を逆注視処理(back_focus)で次のレベルの注視領域として指定して、その注視領域内で探索を注視領域設定(get_focus_domain)で行い、得られた最適位置を次のレベルのために注視領域を再計算して、また、逆注視処理(back_focus)する、と繰り返した結果である。このように、右列では前層で得られた注視領域からのエネルギー値加算により注視領域の制御が成功している。
図12は、図11の処理で得られた注視領域の再構成の説明図を示す。この図は、逆注視処理(back_focus)で次のレベルでの探索領域として指定するために再計算した結果である。左列(a)−(d)が逆注視が無い場合であり、右列(e)−(h)が逆注視がある場合である。図(f)のレベルで探索を開始する時点では、図(e)のレベルで示した注視領域で最適な位置を探す。最適な位置が定まると、図(f)で示した注視領域を特徴パターンを元に再構成して図(g)のレベルでの探索領域とする。この再構成の方法は、例えば、実際には、画像として連結している部分を切り出すアルゴリズムを独自に考案して使うことができ、この時に、エネルギー値の変化量や閾値処理をしながら、領域を拡大させる処理をする。
このように、逆注視効果がある右列の場合には入力レベル第3層の入力パターンで顔上半部の注視領域の再構成に成功している。他方、逆注視が無い非特許文献3の手法(左列)では、顔上半部の再構成に失敗している。枝刈後に残った候補の中で一致度が最小のものを選ぶだけなので、計算時間は短縮されてはいるが、候補選択には寄与していないためである。
図13に、GirlとBaloon入力画像で得た注視領域の図を示す。このアルゴリズムの頑健性を見るために、Lennaの目のテンプレートを使って、Girl及びBaloonの入力パターンに対して実験を行った。注視領域としては図(a)、(b)が期待通り得られた。
5. おわりに
get_focus_domainでは照合に最適な場所を(12)式で探しているが、輝度Yと共に色差情報C、Cによる効果が寄与している。他方、再構成時には、エネルギー値に組み込まれた輝度Yの他にエッジ成分であるウェーブレット係数が寄与している。逆注視効果無しでは、エネルギー値の変動が大きいために微小領域しか得られない。他方、逆注視効果有りでは、粗い層から平均化されたエネルギーが加算されたので、エッジ成分を含めたエネルギー変化が緩和されたと考えられる。同時に、探索範囲を限定することで多重分解能原理を反映させると共に、注視領域の全領域に対する割合だけ照合処理時間が改善されている。たとえば、図12−(g)では、ほぼ1/9程度になる。しかし、一般的には、各層での計算量のオーダーは1/k(k=2)と非特許文献3とほぼ同等かそれ以下である。今回の実験では手動で作成したテンプレートにより本発明の効果が確認できた。
本発明の画像認識方法又は画像認識の装置・システムは、その各手順をコンピュータに実行させるための画像認識プログラム、画像認識プログラムを記録したコンピュータ読み取り可能な記録媒体、画像認識プログラムを含みコンピュータの内部メモリにロード可能なプログラム製品、そのプログラムを含むサーバ等のコンピュータ、等により提供されることができる。
本発明は、画像認識、音声認識など、認識装置を必要とする分野、画像データからデータを取り出すデータ・マイニング分野、大量のシミュレーションデータを解析して分析を行う分野等に適用可能である。
入力信号空間と特徴空間の説明図である。 変換画像と各層についての説明図である。 画像認識装置に関するハードウェアの構成図である。 多重照合には画像認識方法の処理概要についての説明図である。 多重照合による画像認識方法の前処理のフローチャート図である。 多重照合による画像認識方法のフローチャート図である。 多重照合システムの擬似コードを示す図である。 テンプレート・マッチングのためのシストリック型アーキテクチャの構成図である。 プロッセッシングエレメントの入力出力を示す説明図である。 Lenna入力画像と目テンプレートの図である。 目テンプレートによる注視領域の深索図である。 図11の処理で得られた注視領域の再構成の説明図である。 GirlとBaloon入力画像で得た注視領域の図である。
符号の説明
1 処理部
2 入力部
3 出力部
4 表示部
5 記憶部
51 パラメータファイル
52 入力パターンファイル
53 特徴パターンファイル

Claims (7)

  1. 異なる分解能で画像のテンプレート・マッチングを行い、粗い分解能から密な分解能へマッチングの対象領域を絞り込む画像認識装置において、
    入力画像である密な分解能の第n層入力パターンと、第n層入力パターンを多段階に粗い分解能へ圧縮した第n−1〜0層入力パターンと、入力パターンの部分パターンに対応する予め定められたテンプレートを圧縮又は展開した、各層の入力パターンと同一の分解能の、入力パターンの部分パターンに対応する、テンプレート・マッチングのための第n〜0層特徴パターンとを記憶した記憶部と、
    前記記憶部からデータを読み取り及び前記記憶部にデータを書き込み、テンプレート・マッチングを実行する処理部と
    を備え、
    前記処理部は、第0層入力パターン及び第0層特徴パターンを前記記憶部から読みとる手段と、
    前記処理部は、第0層入力パターン内で第0層特徴パターンを走査して、走査した各位置での画素に対して、特徴パターンと入力パターンについて、ウェーブレット関数の演算要素でのRGB成分から、輝度及び色差をそれぞれ計算し、特徴パターンと入力パターンとの輝度の差の絶対値及び色差の差の絶対値を特徴パターンの画素毎に計算し、輝度の差の絶対値と色差の差の絶対値を混合係数Kcで重み付した値とを加算して画素毎の入力パターンと特徴パターンの差分を求め、特徴パターン全体の該差分の和を求めて一致度を求め、該一致度に基づき第0層入力パターン内で第0層特徴パターンが一番一致する領域である第0層注視領域FDを設定する手段と、
    前記処理部は、レベルの異なる層に注視領域を送るときに分解能の差異に従って該注視領域を拡大して第0層注視領域FDに対応する仮の第1層注視領域FDを求めるための逆注視処理を実行し、該仮の第1層注視領域FDを定める情報を前記記憶部に記憶する手段と、
    前記処理部は、再帰的に層レベルj=1からj=nまでテンプレート・マッチング処理を実行する手段であって、該テンプレート・マッチング処理を実行する手段は、
    (1)前記処理部は、前記記憶部から第j層入力パターン及び第j層特徴パターンを読みとる手段と、
    (2)前記処理部は、第j層での探索範囲として仮の第j層注視領域FDを定める情報を前記記憶部から読みとり、設定する手段と、
    (3)前記処理部は、第j層入力パターンの仮の第j層注視領域FD内で、第j層特徴パターンを走査して、走査した各位置での画素に対して、特徴パターンと入力パターンについて、ウェーブレット関数の演算要素でのRGB成分から、輝度及び色差をそれぞれ計算し、特徴パターンと入力パターンとの輝度の差の絶対値及び色差の差の絶対値を特徴パターンの画素毎に計算し、輝度の差の絶対値と色差の差の絶対値を混合係数Kcで重み付した値とを加算して画素毎の入力パターンと特徴パターンの差分を求め、特徴パターン全体の該差分の和を求めて一致度を求め、該一致度に基づき第j層入力パターン内で第j層特徴パターンが最も一致する場所を探索し、該一致する場所に基づき第j層特徴パターンを含む所定範囲の領域を第j層注視領域FDとして定め、該注視領域を定める情報を前記記憶部に記憶する手段と、
    (4)前記処理部は、第j層と第j+1層の分解能の差異に従って第j層注視領域を拡大して該第j層注視領域FDに対応する仮の第j+1層注視領域FDj+1を求めるための逆注視処理を実行し、該仮の第j+1層注視領域を定める情報を前記記憶部に記憶する手段と、
    を含み、再帰的に照合を行い層レベルjを増加させて第n層まで進めるようにした前記テンプレート・マッチング処理を実行する手段と、
    前記処理部は、第n層での探索結果に従い、マッチングした領域を定める情報を表示部に表示及び/又は出力部により出力する手段と、
    を含む画像認識装置。
  2. 前記処理部は、第n層の特徴パターンを前記記憶部から読み取る手段と、
    前記処理部は、第n−1層〜第0層での各特徴パターンを多段階にウェーブレット変換して求め、それらを前記記憶部に記憶する手段と、
    前記処理部は、第n層の入力パターンを前記記憶部から読み取る手段と、
    前記処理部は、第n−1層〜第0層での各入力パターンを多段階にウェーブレット変換をして求め、それらを前記記憶部に記憶する手段と、
    を含む請求項1に記載の画像認識装置。
  3. 前記処理部は、Haarウェーブレット変換により解像度の異なる各層の入力パターン及び特徴パターンを計算するようにした請求項1に記載の画像認識装置。
  4. 前記処理部は、第j層注視領域を、一致したテンプレートの位置を中心にして又は一致したテンプレートの位置を含み、テンプレートの予め定められた倍数の大きさの領域を計算して、仮の第j+1層注視領域を決めるようにした請求項1に記載の画像認識装置。
  5. 前記処理部は、テンプレート・マッチングのために、シストリック型アーキテクチャを用いることで、部分並列演算処理を実行する請求項1に記載の画像認識装置。
  6. 入力画像である密な分解能の第n層入力パターンと、第n層入力パターンを多段階に粗い分解能へ圧縮した第n−1〜0層入力パターンと、入力パターンの部分パターンに対応する予め定められたテンプレートを圧縮又は展開した、各層の入力パターンと同一の分解能の、入力パターンの部分パターンに対応する、テンプレート・マッチングのための第n〜0層特徴パターンとを記憶した記憶部と、
    前記記憶部からデータを読み取り及び前記記憶部にデータを書き込み、テンプレート・マッチングを実行する処理部と
    を備えた画像認識装置を用いて、異なる分解能で画像のテンプレート・マッチングを行い、粗い分解能から密な分解能へマッチングの対象領域を絞り込む画像認識方法において、
    前記処理部は、第0層入力パターン及び第0層特徴パターンを前記記憶部から読みとるステップと、
    前記処理部は、第0層入力パターン内で第0層特徴パターンを走査して、走査した各位置での画素に対して、特徴パターンと入力パターンについて、ウェーブレット関数の演算要素でのRGB成分から、輝度及び色差をそれぞれ計算し、特徴パターンと入力パターンとの輝度の差の絶対値及び色差の差の絶対値を特徴パターンの画素毎に計算し、輝度の差の絶対値と色差の差の絶対値を混合係数Kcで重み付した値とを加算して画素毎の入力パターンと特徴パターンの差分を求め、特徴パターン全体の該差分の和を求めて一致度を求め、該一致度に基づき第0層入力パターン内で第0層特徴パターンが一番一致する領域である第0層注視領域FDを設定するステップと、
    前記処理部は、レベルの異なる層に注視領域を送るときに分解能の差異に従って該注視領域を拡大して第0層注視領域FDに対応する仮の第1層注視領域FDを求めるための逆注視処理を実行し、該仮の第1層注視領域FDを定める情報を前記記憶部に記憶するステップと、
    前記処理部は、再帰的に層レベルj=1からj=nまでテンプレート・マッチング処理を実行するステップであって、該テンプレート・マッチング処理を実行するステップは、
    (1)前記処理部は、前記記憶部から第j層入力パターン及び第j層特徴パターンを読みとるステップと、
    (2)前記処理部は、第j層での探索範囲として仮の第j層注視領域FDを定める情報を前記記憶部から読みとり、設定するステップと、
    (3)前記処理部は、第j層入力パターンの仮の第j層注視領域FD内で、第j層特徴パターンを走査して、走査した各位置での画素に対して、特徴パターンと入力パターンについて、ウェーブレット関数の演算要素でのRGB成分から、輝度及び色差をそれぞれ計算し、特徴パターンと入力パターンとの輝度の差の絶対値及び色差の差の絶対値を特徴パターンの画素毎に計算し、輝度の差の絶対値と色差の差の絶対値を混合係数Kcで重み付した値とを加算して画素毎の入力パターンと特徴パターンの差分を求め、特徴パターン全体の該差分の和を求めて一致度を求め、該一致度に基づき第j層入力パターン内で第j層特徴パターンが最も一致する場所を探索し、該一致する場所に基づき第j層特徴パターンを含む所定範囲の領域を第j層注視領域FDとして定め、該注視領域を定める情報を前記記憶部に記憶するステップと、
    (4)前記処理部は、第j層と第j+1層の分解能の差異に従って第j層注視領域を拡大して該第j層注視領域FDに対応する仮の第j+1層注視領域FDj+1を求めるための逆注視処理を実行し、該仮の第j+1層注視領域を定める情報を前記記憶部に記憶するステップと
    を含み、前記処理部が、再帰的に照合を行い層レベルjを増加させて第n層まで進めるようにした前記テンプレート・マッチング処理を実行するステップと、
    前記処理部は、第n層での探索結果に従い、マッチングした領域を定める情報を表示部に表示及び/又は出力部により出力するステップと、
    を含む画像認識方法。
  7. 異なる分解能で画像のテンプレート・マッチングを行い、粗い分解能から密な分解能へマッチングの対象領域を絞り込む、コンピュータで実行される画像認識プログラムであって、
    前記コンピュータの処理部が、入力画像である密な分解能の第n層入力パターンと、第n層入力パターンを多段階に粗い分解能へ圧縮した第n−1〜0層入力パターンと、入力パターンの部分パターンに対応する予め定められたテンプレートを圧縮又は展開した、各層の入力パターンと同一の分解能の、入力パターンの部分パターンに対応する、テンプレート・マッチングのための第n〜0層特徴パターンとを記憶した記憶部から、第0層入力パターン及び第0層特徴パターンを読みとるステップと、
    前記処理部が、第0層入力パターン内で第0層特徴パターンを走査して、走査した各位置での画素に対して、特徴パターンと入力パターンについて、ウェーブレット関数の演算要素でのRGB成分から、輝度及び色差をそれぞれ計算し、特徴パターンと入力パターンとの輝度の差の絶対値及び色差の差の絶対値を特徴パターンの画素毎に計算し、輝度の差の絶対値と色差の差の絶対値を混合係数Kcで重み付した値とを加算して画素毎の入力パターンと特徴パターンの差分を求め、特徴パターン全体の該差分の和を求めて一致度を求め、該一致度に基づき第0層入力パターン内で第0層特徴パターンが一番一致する領域である第0層注視領域FDを設定するステップと、
    前記処理部が、レベルの異なる層に注視領域を送るときに分解能の差異に従って該注視領域を拡大して第0層注視領域FDに対応する仮の第1層注視領域FDを求めるための逆注視処理を実行し、該仮の第1層注視領域FDを定める情報を前記記憶部に記憶するステップと、
    前記処理部が、再帰的に層レベルj=1からj=nまでテンプレート・マッチング処理を実行するステップであって、該テンプレート・マッチング処理を実行するステップは、
    (1)前記処理部が、前記記憶部から第j層入力パターン及び第j層特徴パターンを読みとるステップと、
    (2)前記処理部が、第j層での探索範囲として仮の第j層注視領域FDを定める情報を前記記憶部から読みとり、設定するステップと、
    (3)前記処理部が、第j層入力パターンの仮の第j層注視領域FD内で、第j層特徴パターンを走査して、走査した各位置での画素に対して、特徴パターンと入力パターンについて、ウェーブレット関数の演算要素でのRGB成分から、輝度及び色差をそれぞれ計算し、特徴パターンと入力パターンとの輝度の差の絶対値及び色差の差の絶対値を特徴パターンの画素毎に計算し、輝度の差の絶対値と色差の差の絶対値を混合係数Kcで重み付した値とを加算して画素毎の入力パターンと特徴パターンの差分を求め、特徴パターン全体の該差分の和を求めて一致度を求め、該一致度に基づき第j層入力パターン内で第j層特徴パターンが最も一致する場所を探索し、該一致する場所に基づき第j層特徴パターンを含む所定範囲の領域を第j層注視領域FDとして定め、該注視領域を定める情報を前記記憶部に記憶するステップと、
    (4)前記処理部が、第j層と第j+1層の分解能の差異に従って第j層注視領域を拡大して該第j層注視領域FDに対応する仮の第j+1層注視領域FDj+1を求めるための逆注視処理を実行し、該仮の第j+1層注視領域を定める情報を前記記憶部に記憶するステップと
    を含み、前記処理部が、再帰的に照合を行い層レベルjを増加させて第n層まで進めるようにした前記テンプレート・マッチング処理を実行するステップと、
    前記処理部が、第n層での探索結果に従い、マッチングした領域を定める情報を表示部に表示及び/又は出力部により出力するステップと、
    をコンピュータに実行させるための画像認識プログラム。
JP2004046447A 2004-02-23 2004-02-23 画像認識装置、画像認識方法及びプログラム Expired - Fee Related JP4652698B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004046447A JP4652698B2 (ja) 2004-02-23 2004-02-23 画像認識装置、画像認識方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004046447A JP4652698B2 (ja) 2004-02-23 2004-02-23 画像認識装置、画像認識方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2005235089A JP2005235089A (ja) 2005-09-02
JP4652698B2 true JP4652698B2 (ja) 2011-03-16

Family

ID=35017962

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004046447A Expired - Fee Related JP4652698B2 (ja) 2004-02-23 2004-02-23 画像認識装置、画像認識方法及びプログラム

Country Status (1)

Country Link
JP (1) JP4652698B2 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4540661B2 (ja) * 2006-02-28 2010-09-08 三洋電機株式会社 物体検出装置
US8184910B2 (en) 2008-03-18 2012-05-22 Toshiba Tec Kabushiki Kaisha Image recognition device, image recognition method, and image scanning apparatus having image recognition device
JP4926116B2 (ja) * 2008-04-16 2012-05-09 株式会社日立ハイテクノロジーズ 画像検査装置
JP5083080B2 (ja) * 2008-07-11 2012-11-28 株式会社ニコン 画像マッチング装置、およびカメラ
EP2866195A4 (en) 2012-06-26 2016-06-15 Konica Minolta Inc IMAGE PROCESSING DEVICE, IMAGE PROCESSING METHOD, AND IMAGE PROCESSING PROGRAM
EP2940656B1 (en) * 2012-12-25 2024-01-31 Honda Motor Co., Ltd. Vehicle periphery monitoring device
WO2015073935A1 (en) * 2013-11-15 2015-05-21 Corista LLC Continuous image analytics
JP2019049990A (ja) * 2013-11-15 2019-03-28 コリスタ・エルエルシーCorista Llc 連続画像処理

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63223887A (ja) * 1987-03-12 1988-09-19 Shinsaibi Denki Kk 指紋照合における予備照合方法
JPH07115646A (ja) * 1993-10-20 1995-05-02 Sony Corp 画像処理装置
JP3655651B2 (ja) * 1994-09-02 2005-06-02 テキサス インスツルメンツ インコーポレイテツド データ処理装置
JP2001251632A (ja) * 1999-12-27 2001-09-14 Toshiba Corp 動きベクトル検出方法および装置並びに動きベクトル検出プログラム
JP3874985B2 (ja) * 2000-02-18 2007-01-31 富士通株式会社 画像演算装置
JP4517449B2 (ja) * 2000-05-10 2010-08-04 株式会社豊田中央研究所 画像における相関演算方法
JP2002230572A (ja) * 2000-11-28 2002-08-16 Monolith Co Ltd 映像効果方法と装置および画像補間方法と装置
JP3709158B2 (ja) * 2001-10-15 2005-10-19 独立行政法人科学技術振興機構 部分選択変換装置、部分選択変換方法及び部分選択変換プログラム

Also Published As

Publication number Publication date
JP2005235089A (ja) 2005-09-02

Similar Documents

Publication Publication Date Title
Chen et al. Learning spatial attention for face super-resolution
CN111047516B (zh) 图像处理方法、装置、计算机设备和存储介质
US6714689B1 (en) Image synthesizing method
JP4845715B2 (ja) 画像処理方法、画像処理装置、プログラム、及び記憶媒体
JP4933186B2 (ja) 画像処理装置、画像処理方法、プログラム及び記憶媒体
US8605118B2 (en) Matrix generation apparatus, method, and program, and information processing apparatus
CN112132741B (zh) 一种人脸照片图像和素描图像的转换方法及系统
CN103279936A (zh) 基于画像的人脸伪照片自动合成及修正方法
CN115147598B (zh) 目标检测分割方法、装置、智能终端及存储介质
CN110399826B (zh) 一种端到端人脸检测和识别方法
JP5210241B2 (ja) 画像検索装置及びその制御方法並びにプログラム
JP4652698B2 (ja) 画像認識装置、画像認識方法及びプログラム
JP7519127B2 (ja) ユーザのバイオメトリック特性を有する画像中の物体を識別して、画像のうちバイオメトリック特性を含む部分を他の部分から分離することにより当該ユーザのidを検証するための方法
JP5294798B2 (ja) 画像処理装置及び画像処理方法
CN112580381A (zh) 一种基于深度学习的二维码超辨率重构增强方法及系统
CN113963009B (zh) 基于可形变划块的局部自注意力的图像处理方法和系统
Yu et al. MagConv: Mask-guided convolution for image inpainting
Greeshma et al. Single image super resolution using fuzzy deep convolutional networks
Tilton Split-remerge method for eliminating processing window artifacts in recursive hierarchical segmentation
JP2775122B2 (ja) イラストデータの自動輪郭抽出ベクトル化処理方法,及びそれに使用する処理装置
JP3709158B2 (ja) 部分選択変換装置、部分選択変換方法及び部分選択変換プログラム
Miravet et al. Accurate and robust image superresolution by neural processing of local image representations
JP4575751B2 (ja) ヒストグラム近似復元装置及びヒストグラム近似復元方法、並びに画像検索装置及び画像検索方法
Zhou et al. Image description with 1d local patterns by multi-scans: An application to face recognition
Kang et al. Fast super-resolution algorithms using one-dimensional patch-based training and directional interpolation

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060523

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080902

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081028

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090106

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090305

A911 Transfer of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20090428

A912 Removal of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20090605

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101216

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131224

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees