JP4266798B2 - パターン検出装置及びパターン検出方法 - Google Patents

パターン検出装置及びパターン検出方法 Download PDF

Info

Publication number
JP4266798B2
JP4266798B2 JP2003416236A JP2003416236A JP4266798B2 JP 4266798 B2 JP4266798 B2 JP 4266798B2 JP 2003416236 A JP2003416236 A JP 2003416236A JP 2003416236 A JP2003416236 A JP 2003416236A JP 4266798 B2 JP4266798 B2 JP 4266798B2
Authority
JP
Japan
Prior art keywords
feature
model
detection
pattern
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003416236A
Other languages
English (en)
Other versions
JP2005174179A (ja
JP2005174179A5 (ja
Inventor
克彦 森
優和 真継
美絵 石井
裕輔 御手洗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2003416236A priority Critical patent/JP4266798B2/ja
Priority to US10/539,882 priority patent/US7577297B2/en
Priority to AU2003289116A priority patent/AU2003289116A1/en
Priority to PCT/JP2003/016095 priority patent/WO2004055735A1/ja
Publication of JP2005174179A publication Critical patent/JP2005174179A/ja
Publication of JP2005174179A5 publication Critical patent/JP2005174179A5/ja
Application granted granted Critical
Publication of JP4266798B2 publication Critical patent/JP4266798B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

本発明は、画像中の特定パターンの検出をパターンモデルを用いて検出するパターン検出装置及びパターン検出方法に関する。
従来より、画像認識や音声認識の分野においては、特定の認識対象に特化した認識処理アルゴリズムをコンピュータソフトウェア、或いは専用並列画像処理プロセッサを用いたハードウェアにより実行することで、認識対象及び背景を含む画像から、認識対象を検出するものが知られている。
特に、顔を特定の認識対象として検出するものとしては、以下に例示するような、特開平9−251534号公報(特許文献1)、特許2767814号公報(特許文献2)、特開平9−44676号公報(特許文献3)、特許2973676号公報(特許文献4)、又は、特開平11−283036号公報(特許文献5)に開示されているものが知られている。
まず、特許文献1に開示されている発明は、入力画像に対して、標準顔と呼ばれるテンプレートを使って、顔領域を探索し、その後、眼、鼻孔、口といった特徴点候補に対して、部分テンプレートを使用して、人物を認証するものである。また、特許文献2に開示されている発明は、顔画像から眼と口の候補群を求め、それらを組み合わせた顔候補群と予め記憶されている顔構造とを照合し、眼と口に対応する領域を発見するものである。さらに、特許文献3に開示されている発明は、眼、鼻、口の候補をそれぞれ複数求め、予め用意されている特徴点間の位置関係から、顔を検出するものである。
また、特許文献4に開示されている発明は、顔の各部品の形状データと入力画像との一致度を調べる際に、形状データを変更させるものであり、また各顔部品の探索領域は、以前に求めた部品の位置関係を基に決定するものである。また、特許文献5に開示されている発明は、複数の判定要素取得領域を設定した領域モデルを入力画像中で移動させ、各点で、それら判定要素取得領域内で、判定要素の有無を判定し、顔を認識するものである。
一方、回転した被写体を検出するものとして、特開平11−15973号公報(特許文献6)や、"Rotation Invariant Neural Network-Based Face Detection"(H.Rowley,T. Kanade,CVPR98,p38-44)(非特許文献1)に開示されているものがある。
特許文献6に開示されている発明は、被写体の回転に対応するために、被写体に対してその中心座標から曲座標変換を行い、回転をシフトに変換して回転を検出するものである。また、非特許文献1に開示されている発明は、顔の検出の前段として、顔の回転角度を検出するニューラルネットワーク(Neural Network、以下「NN」と記述する。)を用意し、そのNNの出力角度に応じて入力画像を回転させ、回転後の入力画像を顔検出を行うNNに入力するものである。
特開平9−251534号公報 特許2767814号公報 特開平9−44676号公報 特許2973676号公報 特開平11−283036号公報 特開平11−15973号公報 H.ロウレイ(H.Rowley)、T.カナデ(T. Kanade),"Rotation Invariant Neural Network-Based Face Detection"、CVPR98、p38-44
しかしながら、上述した従来技術を用いるパターン検出には、以下に示すような問題があった。
すなわち、特許文献1に記載の発明は、始めに標準顔を使用して、顔全体でマッチングして顔領域を検出するため、複数の顔のサイズや顔の向きの変化に弱いという問題がある。従って、様々なサイズや顔の向きに対応させるためには、それぞれの場合に適合した多数の標準顔を用意し、それぞれを用いて検出する必要がある。しかし、これを実現するためには、多数のテンプレートと比較しなければならないために処理コストがかかる。
また、特許文献2に記載の発明は、入力画像中の顔候補群と予め記憶した顔構造とを照合するが、対象となる入力画像中の顔の数は1つ又は少数に限定されている。また、顔の大きさについても、ある程度大きなサイズであって、入力画像中のほとんどの領域が顔領域であって背景の少ない画像が入力画像として想定されている。そのような入力画像であれば、全ての眼及び口の候補群から、顔候補を作成した場合であっても顔候補の数は限定される。しかしながら、一般的なカメラやビデオで撮影した画像の場合は、顔のサイズが小さくなったり、背景の面積が大きくなるような場合があり、その際には、背景中で眼候補や口候補を多数誤検出してしまうことになる。従って、特許文献2に記載の方法によって全ての眼と口候補群から顔候補を作成すると、その数は膨大になり、顔構造との照合に要する処理コストが増大する。
また、特許文献3、4に記載の発明では、背景に眼、鼻、口の候補が多数存在した場合には、それらの位置関係を照合するための処理コストが膨大になる。
さらに、特許文献4に記載の発明は、虹彩(眼)、口、鼻等の形状データを保持しておき、まず2つの虹彩(眼)を求め、続いて口、鼻等を求める際に、その虹彩(眼)の位置に基づいて、口、鼻等の顔部品の探索領域を限定している。すなわち、このアルゴリズムは、虹彩(眼)、口、鼻といった顔を構成する顔部品を並列的に検出するのではなく、虹彩(眼)を最初に見つけ、その結果を使用して、順に口、鼻という顔部品を検出している。この方法においては、画像中に顔が一つしかなく、さらに虹彩(眼)が正確に求まった場合を想定している。そのため、検出された虹彩(眼)が誤検出であった場合には、口や鼻等の他の特徴の探索領域を正しく設定することができない。
また、特許文献5に記載の発明では、サイズの異なった顔や回転した顔に対応させるためには、サイズの異なった領域モデルや回転した領域モデルを用意する必要がある。しかし、実際にそのサイズの顔やその回転角度の顔が存在しない場合、無駄な計算を多数行うこととなる。さらに、特許文献6に記載の発明における極座標変換では、中心座標の精度が重要である。しかし、画像中のどこに被写体が存在するのかを検出する段階では、中心座標の検出は困難である。
さらにまた、非特許文献1に記載の発明では、回転角度を検出する前段のNNの精度に後半の顔検出NNの精度が依存し、もし前段のNNの出力が誤っていると顔検出が困難になる。また、画像中に複数の被写体が存在し、それぞれの回転角度が異なる場合、複数の回転角度で入力画像を回転変換させ、その変換後の画像を顔検出NNに入力して画像全体で顔検出を行うため、回転のない画像を検出する際と比較すると処理コストが大幅に増大する。
本発明は、このような事情を考慮してなされたものであり、画像中の認識対象の大きさが画像によって異なっており、また当該認識対象が傾いて存在している場合であっても、処理コストを増加を抑えて、当該認識対象を好適に検出することができるパターン検出装置及び方法を提供することを目的とする。
上記目的を達成するため、本発明に係る装置は、
画像中の予め定められたパターンをパターンのモデルを用いて検出するパターン検出装置であって、
複数の階層の特徴に対して上位モデルが複数の下位モデルを組み合わせて構成される階層毎のモデルを各階層につき複数保持する保持手段と、
前記保持手段に保持されたモデルから各階層の特徴検出に使用するモデルとして、同一のモデルをそれぞれ複数の角度で回転させた形態の複数のモデルを設定する設定手段と、
前記設定手段により設定された各階層のモデルと前記画像の構成部分とを比較して各特徴に係る特徴量を算出し、前記複数の階層について所定値以上の特徴量に対応する特徴を下位層から順番に検出する検出手段と
前記検出手段によって特徴量を算出された複数の下位モデルのうち、予め定められた特徴量以上を有する下位モデル、または予め定められた順位以上の特徴量を有する下位モデルの回転角度を選択する角度選択手段とを備え、
前記設定手段は、少なくとも1つの階層について、当該階層の特徴検出に使用するモデルとして、前記保持手段に保持された上位モデルであって前記角度選択手段によって選択された回転角度に対応する上位モデルを設定する
ことを特徴とする。
上記目的を達成するため、本発明に係る方法は、
画像中の予め定められたパターンをパターンのモデルを用いて検出するパターン検出方法であって、
複数の階層の特徴に対して上位モデルが複数の下位モデルを組み合わせて構成される階層毎のモデルを各階層につき複数保持するモデル保持部から各階層の特徴検出に使用するモデルとして、同一のモデルをそれぞれ複数の角度で回転させた形態の複数のモデルを設定する設定工程と、
前記設定工程で設定された各階層のモデルと前記画像の構成部分とを比較して各特徴に係る特徴量を算出し、前記複数の階層について所定値以上の特徴量に対応する特徴を下位層から順番に検出する検出工程と
前記検出工程によって算出された下位モデルの特徴量のうち、予め定められた量以上または該特徴量の順で予め定められた順位以上の特徴量を有する下位モデルの回転角度を選択する角度選択工程とを有し、
前記設定工程は、少なくとも1つの階層について、当該階層の特徴検出に使用するモデルとして、前記保持手段に保持された上位モデルであって前記角度選択工程によって選択された回転角度に対応する上位モデルを設定することを特徴とする。
上記目的を達成するため、本発明に係るプログラムは、
コンピュータに、画像中の予め定められたパターンをパターンのモデルを用いて検出させるためのプログラムであって、
複数の階層の特徴に対して上位モデルが複数の下位モデルを組み合わせて構成される階層毎のモデルを各階層につき複数のモデルから各階層の特徴検出に使用するモデルとして、同一のモデルをそれぞれ複数の角度で回転させた形態の複数のモデルを設定する設定手順と、
前記設定手順で設定された各階層のモデルと前記画像の構成部分とを比較して各特徴に係る特徴量を算出し、前記複数の階層について所定値以上の特徴量に対応する特徴を下位層から順番に検出する検出手順と、
前記検出手段によって特徴量を算出された複数の下位モデルのうち、予め定められた特徴量以上を有する下位モデル、または予め定められた順位以上の特徴量を有する下位モデルの回転角度を選択する角度選択手段と、
をコンピュータに実行させ、
前記設定手順は、少なくとも1つの階層について、当該階層の特徴検出に使用するモデルとして、前記保持手段に保持された上位モデルであって前記角度選択工程によって選択された回転角度に対応する上位モデルを設定することを特徴とする。
本発明によれば、画像中の認識対象の大きさが画像によって異なっており、また当該認識対象が傾いて存在している場合であっても、処理コストを増加を抑えて、当該認識対象を好適に検出することができる。
以下、図面を参照して、本発明の好適な実施形態について説明する。
<第1の実施形態>
図1は、本発明の第1の実施形態に係るパターン検出装置の構成を示す図である。図1において、1000は信号入力部、1001は1次特徴検出部、1011は1次特徴検出フィルタ設定部、1002は2次特徴検出部、1012は2次特徴検出モデル設定部、1003は3次特徴検出部、1013は3次特徴検出モデル選択部、1023は3次特徴検出モデル保持部、1004は4次特徴検出部、1014は4次特徴検出モデル選択部、そして、1024は4次特徴検出モデル保持部を示す。尚、本実施形態では、上記のように示した各次数の特徴は、局所的に検出される局所特徴を示すものであって、上位の次数の特徴は下位の次数の特徴を含むものである。
以下、図1に示すパターン検出装置のそれぞれの構成要素の機能について説明する。信号入力部1000は、画像信号等の処理対象となる信号(例えば、画像データ)を入力する。1次特徴検出部1001は、信号入力部1000から入力された信号に対し、後述する1次の特徴を検出する処理を行い、その検出結果を2次特徴検出部1002に渡す。1次特徴検出フィルタ設定部1011は、1次特徴検出部1000で1次の特徴を検出するためのフィルタの特性を設定する。
2次特徴検出部1002は、1次特徴検出部1001で検出された結果に対して、2次特徴検出モデル設定部1012で設定された検出モデルを用いて、後述する2次の特徴を検出する処理を行い、その検出結果を3次特徴検出部1003及び3次特徴検出モデル選択部1013に渡す。2次特徴検出モデル設定部1012は、2次特徴検出部1002で2次の特徴を検出する際に使用される2つの1次特徴間の位置関係を示すモデルを設定する。このモデルは、所定の形状に関する属性を有し、最初から複数用意しておいても良いし、2次特徴検出モデル設定部1012において、回転角度をパラメータとして、1つのモデルに回転アフィン変換等を行って作成しても良い。以下、3次、4次のモデルについても同様である。尚、本実施形態では、2次特徴は2つの1次特徴間の位置関係を示すモデルとして説明しているが、3つ以上であっても同様に適用することが可能である。
3次特徴検出部1003は、3次特徴検出モデル選択部1013で選択した検出モデルを用いて、2次特徴検出部1002で検出された結果に対して後述する3次の特徴を検出する処理を行い、その検出結果を4次特徴検出部1004及び4次特徴検出モデル選択部1014に渡す。また、3次特徴検出モデル保持部1023は、3次特徴検出モデル選択部1013で選択される、回転角度の異なる(すなわち、傾きが異なる)複数のモデルを保持する。そして、3次特徴検出モデル選択部1013は、3次特徴検出部1003で特徴を検出する際に使用されるそれぞれの2次特徴間の位置関係を示すモデルを、3次特徴検出モデル保持部1023に保持されたモデルの中から2次特徴検出部1002からの検出結果に基づいて選択し設定する。
4次特徴検出部1004は、4次特徴検出モデル選択部1014で選択した検出モデルを用いて、3次特徴検出部1003で検出された結果に対して後述する4次の特徴を検出する処理を行い、その検出結果を出力する。また、4次特徴検出モデル保持部1024は、4次特徴検出モデル選択部1014で選択される、回転角度の異なる(すなわち、傾きが異なる)複数のモデルを保持する。そして、4次特徴検出モデル選択部1014は、4次特徴検出部1004で特徴を検出する際に使用されるそれぞれの3次特徴間の位置関係を示すモデルを、4次特徴検出モデル保持部1024に保持されたモデルの中から3次特徴検出部1003からの検出結果に基づいて選択し設定する。
すなわち、本実施形態に係るパターン検出装置は、信号入力部1000から入力された画像中の所定のパターンをパターンモデルである各次元ごとの検出モデルを用いて検出する。本パターン検出装置は、所定の下位モデル(例えば、2次元特徴検出モデル)を組み合わせて構成される上位モデル(例えば、3次元特徴検出モデル)を保持する各次元の検出モデル保持部(例えば、3次元特徴検出モデル保持部1023)と、上記下位モデルと画像中のパターンの構成部分とを比較して、当該下位モデルの構成部分に対する特徴量を算出する各次元の特徴検出部(例えば、2次元特徴検出部1002)と、上記検出モデル保持部に保持された上位モデルと画像中のパターンとを比較して、パターンのパターンモデル(例えば、3次元特徴検出モデル)を設定する設定部であって、上位モデルを構成するそれぞれの下位モデルが所定の特徴量を有している場合、当該上位モデルをパターンのパターンモデルとして設定する設定部(例えば、3次元特徴検出部1003)を備えることを特徴とする。
また、上記パターン検出装置は、信号入力部1000から入力された画像中からパターンの部分特徴(例えば、1次特徴)を検出する検出部(例えば、1次特徴検出部1001)と、所定の部分モデルを用いて上記下位モデル(例えば、2次元特徴検出モデル)を設定する下位モデル設定部(例えば、2次元検出モデル設定部1012)とをさらに備え、例えば、2次元特徴検出部1002等の特徴検出部は、上記下位モデルに含まれる部分モデルと画像中のパターンの部分特徴とを比較して、特徴量を算出することを特徴とする。
さらに、上記パターン検出装置は、複数個の上位モデル(例えば、3次元検出モデル)を組み合わせて構成されるさらに上位のモデル(例えば、4次元検出モデル)を保持する手段(例えば、4次元特徴検出モデル保持部1024)と、当該モデルと画像中の所定のパターンとを比較して、複数個の上位モデルがすべて所定の特徴量を有している場合、そのモデルを所定のパターンのパターンモデルとして設定する手段(例えば、4次元特徴検出部1004)とをさらに備え、階層的な構成を有するモデルを用いて画像中の所定のパターンのパターンモデルを設定することを特徴とする。
次に、上述したような図1に示す構成のパターン検出装置の動作例について説明する。図2は、第1の実施形態に係るパターン検出装置の動作例を説明するためのフローチャートである。ここで、説明を分かり易くするために、上述した本実施形態の構成において、画像を入力信号とし、その画像中の顔領域を検出する動作を例として、本実施形態に係るパターン検出装置の動作について説明する。
まず、画像入力部1000において画像信号が入力される(ステップS201)。次いで、1次特徴検出部1001において、入力された画像の各位置で1次特徴(例えば、方向性を有するエッジ成分)が検出される(ステップS202)。図3は、第1の実施形態のパターン検出装置における各特徴検出部(1次〜4次特徴検出部1001〜4)において検出される特徴の例を示す図である。すなわち、図3に示すように、1次特徴検出部1001では、縦特徴1−1、横特徴1−2、右上がり斜め特徴1−3、右下がり斜め特徴1−4といった、異なる4方向成分の特徴を検出する。尚、本実施形態では、1次特徴を上記4方向の特徴として説明しているがこれは一例であって、その他の特徴を1次特徴として、2次特徴以降の検出に用いるようにしてもよい。
1次特徴検出部1001における1次特徴の検出では、例えば、4つの特徴を検出するために使用されるフィルタの設定が、図1の1次特徴検出フィルタ設定部1011で行われる。このような特徴検出は、各方向のエッジ成分を強調するようなフィルタ、例えば、SobelフィルタやGabor関数等を用いて強調処理を行うことによって行うことができる。また、ラプラシアンフィルタ等で方向性によらないエッジ強調処理を行って、その後各方向の特徴をさらに強調するような処理を行ってもよい。尚、これらの特徴検出用フィルタは、最初から複数用意しておいても良いし、方向をパラメータとして、1次特徴検出フィルタ設定部1011で作成するようにしても良い。
1次特徴検出部1001における検出結果は、各特徴毎に、入力画像と同等の大きさを有する検出結果画像という形として出力される。すなわち、図3に示すような1次特徴の場合、縦横斜めの4種類のそれぞれの方向の特徴成分を有する4つの検出結果画像が得られる。そして、それぞれの特徴に関する検出結果画像の各位置の値である1次特徴量(例えば、当該画像中に含まれる一定値以上の画素値の個数等)を見て、入力画像のその位置に各特徴が存在するか否かを判断することができる。
また、図3には、1次特徴の他に、後述する2次特徴検出部1002、3次特徴検出部1003及び4次特徴検出部1004で検出される2次特徴、3次特徴及び4次特徴の例の一部も示されている。
図3に示すように、2次特徴としては、右空きV字特徴2−1−1〜2−1−4、左空きV字特徴2−2−1〜2−2−4、水平平行線特徴2−3−1〜2−3−4、垂直平行線特徴2−4−1〜2−4−4がある。尚、これらの特徴の名称は、画像に対して顔が正立している時の状態で決めたもので、顔の回転により特徴の名称と実際の画像中における各特徴の向きが異なることが生じる。すなわち、本実施形態では、例えば、2次特徴検出モデル設定部1011に代表される下位モデルの設定部が、同一形状を有する下位モデルのそれぞれについて複数の角度で回転させた形態の複数の下位モデルを設定することを特徴とする。
また、3次特徴の例として、眼特徴3−1−1〜3−1−4、口特徴3−2−1〜3−2−4が示されている。さらに、4次特徴の例の一部として、顔特徴4−1−1〜4−1−4、逆顔特徴4−2−1が示されている。尚、逆顔特徴として、図示はされていないが、顔特徴4−1−2〜4−1−4に対応するものも4次特徴として存在する。
上述したように、本実施形態ではステップS202の処理により、1次特徴検出部1002において、各位置において4種類の1次特徴が検出された後、2次特徴検出部1002において2次特徴の検出が行われる(ステップS203)。以下では一例として、図3に示す右空きV字特徴2−1−1を検出する場合について説明するが、その他の場合についても同様に実現することができる。
図4は、2次特徴のうち右空きV字特徴2−1−1に関するモデルを説明するための図である。この右空きV字特徴2−1−1には、図4(A)に示すように、1次特徴である右上がり斜め特徴1−3が上部に存在し、また右下がり斜め特徴1−4が下部に存在している。すなわち、右空きV字特徴2−1−1を検出するためには、ステップS202で求めた1次特徴の検出結果を利用し、上部に右上がり斜め特徴1−3があり、下部に右下がり斜め特徴1−4がある位置を求めれば良く、その位置に右空きV字特徴2−1−1が存在することとなる。このように、複数種類の1次特徴を組み合わせて、2次特徴を検出することができる。
しかしながら、画像中の顔のサイズは固定サイズではなく、また個人により眼や口の大きさが異なり、さらに眼や口は開閉動作をするので、V字の大きさも変化しまた回転もする。また、エッジ等の抽出処理による誤差等も発生する可能性がある。そこで、本実施形態では、図4(B)に示すような、右空きV字検出モデル400を考える。そして、この右空きV字検出モデル400中の403を右上がり斜め領域、404を右下がり斜め領域とする。そして、右上がり斜め領域403にステップS202で求めた1次特徴のうち、右上がり斜め1−3のみ存在し、また右下がり斜め領域404に右下がり斜め1−4のみが存在するような場合、その位置に右空きV次特徴2−1−1が存在するものとする。このようにすることで、ある程度の大きさや形状の変化、回転に対して、ロバストな処理をすることが可能となる。
本実施形態では、図4(B)の右上がり斜め領域403内に右上がり斜め特徴を有する画像の中心が存在する場合、及び、右下がり斜め領域404内に右下がり斜め特徴を有する画像の中心が存在する場合に、右空きV字特徴2−1−1が存在するものとする。尚、上述したように画像の中心が存在する場合だけに限らず、例えば、それぞれの領域内に1次特徴を有する画像全体が含まれる場合に存在するようにしてもよい。また、右上がり斜め領域403及び右下がり斜め領域404は、図4(B)に示すような矩形形状に限られず、任意の形状であってもよい。これは、他の領域についても同様である。
ここで、顔全体が大きく回転したような画像の場合(すなわち、画像の水平方向或いは垂直方向等の特定の方向から大きく傾いたような場合)は、上述したようなモデルであっても抽出することは困難である。そこで、本実施形態では、複数の回転角度用の検出モデルを用いて2次特徴の検出を行うようにする。図5は、2次特徴を検出するための回転した検出モデルの一例を示す図である。例えば、図5(A)に示す4種類の2次特徴の検出モデルを反時計方向に45度ずつ回転させて4グループに分けた2次特徴検出モデルを考える。
図5(A)は、正面正立顔を0度としたときに、ほぼ0度及び180度回転した顔の2次特徴を検出するための検出モデル群、図5(B)は同様にほぼ90度及び−90度回転した顔の2次特徴を検出するための検出モデル群、図5(C)は同様にほぼ45度及び−135度回転した顔の2次特徴を検出するための検出モデル群、図5(D)は同様にほぼ−45度及び135度回転した顔の2次特徴を検出するための検出モデル群を示す。尚、各検出モデルにおいて、1−1〜1−4はそれぞれ図3に示される同一符号の1次特徴を有する画像が含まれる領域を示している。
また、図5に示した各検出モデル群は、それぞれ右空きV字特徴2−1−1、左空きV字特徴2−2−1、水平平行線特徴2−3−1、及び、垂直平行線特徴2−4−1という4種類の2次特徴を検出するための4種類の検出モデルから成立し、各検出モデルの番号がその検出モデルで検出する図3に示した2次特徴を示す。尚、これらの右空きV字特徴、左空きV字特徴、水平平行線特徴、及び垂直平行線特徴という特徴の名称は、顔が正立している時を基準にして付けられたものである。そのため、例えば、図5(A)では2−3−1に示すように水平平行線特徴は水平方向に伸びた2本の線を示しており、その名称と一致する。しかし、図5(B)のように、90度回転した場合は水平平行線特徴という名前が示す特徴は、2−3−2に示すように、実際には垂直方向に伸びた2本の線を示すことになってしまう。このように、回転により、特徴の名称と実際の特徴が示す形状が対応しなくなることがある。
尚、図5中の符号1−1〜1−4で示されるそれぞれの矩形領域は、上記ステップS202で検出された1次特徴が存在する領域であり、それぞれの領域に付された符号及びその特徴は、図3に示した1次特徴の符号のものと同一である。すなわち、これらの矩形領域に内に当該番号が示す1次特徴のみが存在する時に、その検出モデルで検出する特徴が存在するということになる。従って、これらの全ての検出モデルを用いて2次特徴を検出することにより、回転した(傾いた)顔であってもその2次特徴を検出することができる。
2次特徴検出モデルの設定は、図1の2次特徴検出モデル設定部1012で行われる。それ以外でも、最初からこのような複数の検出モデルを用意しておいても良いし、例えば、図5中に示したほぼ0度又は180度回転した顔の2次特徴を検出するための検出モデルを用意し、これらのモデルに対して回転変換及び検出する1次特徴の種類を変更する処理を行うことにより、2次特徴検出フィルタ設定部1011で作成しても良い。尚、図5に示した2次特徴の検出モデルには同じものが存在しているが、これは説明を分かりやすくするために全て書いてあるためであり、実際の処理では同じ検出モデルを複数用意する必要はない。
2次特徴検出部1002は、上述したように、設定された検出モデルを用いて2次特徴の検出を行う。すなわち、2次特徴の検出は、2次特徴を構成する各1次特徴の値を用いて行い、検出モデルで設定される各領域の1次特徴の値がしきい値以上であるかどうかで判断することができる。例えば、0度用の右空きV字検出モデル2−1−1を用いて、所定の位置の2次特徴として右空きV字特徴を検出する場合について説明する。この場合は、図4(B)に示すように、右上がり斜め領域403中に存在する右上がり斜め特徴1−3の値の最大値がしきい値より高く、かつ右下がり斜め領域404中に存在する右下がり斜め特徴1−4の値の最大値がしきい値より高い場合に、当該位置に右空きV字特徴が存在するものとする。そして、その位置の値(2次特徴量)として、例えば、それらの最大値の平均とする。逆に、各領域における1次特徴の値(1次特徴量)が、どちらか一方でもしきい値より低い場合は、この位置には2次特徴が存在しないとして、その位置の値を0とする。
このようにして求められた検出結果は、各2次特徴毎に、入力画像と同等の大きさの検出結果画像という形で出力される。すなわち、各特徴の検出結果画像の各位置の値を見て、入力画像のその位置に各回転方向の各2次特徴が存在するか否かを判断することができる。
従って、このステップS203の処理では、2次特徴検出モデルの各領域で再度1次特徴を検出するのではない、ということが特徴である。すなわち、2次特徴の一つである右空きV字特徴2−1−1の検出では、右上がり斜め領域と右下がり斜め領域内で、再度、それぞれ1次特徴である右上がり斜め特徴1−3と右下がり斜め特徴1−4を検出するのではない。これらの1次特徴の検出はステップS202の処理で既に終了しており、ステップS203では、それらの領域に各1次特徴が存在するか否かをしきい値を使用して判断しているだけである。そして、複数の1次特徴がそれぞれの領域に存在すると判断された場合に、その位置に2次特徴が存在するとする処理を行っている。この特徴の検出の処理方法は、3次特徴及び4次特徴に関しても同様である。これによって、処理コストの減少を図ることが可能となる。
2次特徴が検出された後、3次特徴検出モデル選択部1013では、3次特徴検出モデルを選択する(ステップS204)。ここで一例として、ステップS203で検出された2次特徴から、眼特徴(図3中の符号3−1−1〜3−1−4)を検出することを考える。図7は、3次特徴検出部1003において眼特徴を検出するための眼検出モデルの一例を示す図である。
図7(A)は顔が正立の時を0度としたときに、回転がほぼ0度又は180度の眼特徴(図3に示した符号3−1−1)を検出するための眼検出モデル700を示す。回転がほぼ0度又は180度の眼特徴は、回転が0度の2次特徴量である右空きV字特徴2−1−1が左側に、左空きV字特徴2−2−1が右側に、そして水平平行線特徴2−3−1及び垂直平行線特徴2−4−1がそれらV字特徴の中間に存在するといった組み合わせが満たされることによって検出することができる。従って、眼検出モデル700も右空きV字特徴2−1−1を検出する右空きV字領域701が左側に、左空きV字特徴2−2−1を検出する左空きV字領域702が右側に、そして水平平行線特徴2−3−1を検出する水平平行領域703及び垂直平行線特徴2−4−1を検出する垂直平行領域704がそれらV字領域の中間に存在して成り立っている。
また同様に、図7(B)は回転がほぼ90度又は−90度の眼特徴(図3中の符号3−1−2)を検出するための眼検出モデル710を示す。回転がほぼ90度又は−90度の眼特徴は、回転が90度の2次特徴量である右空きV字特徴2−1−2が上側に、左空きV字特徴2−2−2が下側に、そして水平・垂直平行線特徴2−3〜4−2がそれらV字特徴の中間に存在する組み合わせが満たされることによって検出ができる。従って、眼検出モデル710も右空きV字特徴2−1−2を検出する右空きV字領域711が上側に、左空きV字特徴2−2−2を検出する左空きV字領域712が下側に、そして水平・垂直平行線特徴2−3〜4−2を検出する水平平行領域713及び垂直平行領域714がそれらV字領域の中間に存在して成り立っている。尚、45度及び135度も同様にして実現することができる。
上述したように、ステップS204では、ステップS203で検出された2次特徴の検出結果に基づいて、3次特徴検出部1003において3次特徴検出に使用される3次特徴検出モデルが、3次特徴検出モデル選択部1013で選択される。ここで、対象の回転を含んだ3次特徴(すなわち、傾斜した3次特徴)を検出するために、ステップS203で検出した全ての回転角度の2次特徴2−1−1〜2−4−4を使用して、図3に示した全ての回転角度での3次特徴3−1−1〜3−2−4を検出することも可能である。しかし、その方法では計算コストの増大が著しい。そこで、本実施形態では、ステップS203で検出した2次特徴の検出結果に基づいて、検出に使用される3次特徴モデルを3次特徴検出モデル選択部1013で選択し、検出する3次特徴の数(すなわち、対象とする回転角度)を制限することで、計算コストの増大を抑制する。すなわち、本実施形態に係るパターン検出装置には、2次特徴検出部1002によって算出された下位モデルの特徴量に基づいて、3次特徴検出部1003においてパターンと比較される上位モデル(3次元特徴検出モデル)の数を制限する3次元特徴検出モデル選択部1013をさらに備えることを特徴とする。また、4次特徴検出モデル選択部1014についても同様である。
この選択は、2次特徴の検出結果画像の各位置毎に、その位置での2次特徴量である検出結果値(相関値)に基づいて行われる。図6は、3次特徴検出モデル選択部1013におけるモデル選択の方法を示す模式図である。図6(A)のグラフは、ある位置での2次特徴の検出結果値(相関値)を示し、横軸は正立時を0度としたときの回転角度を、縦軸は相関値を示す。ここで、相関値の値域は0(相関無し)〜1(相関最大)とする。また、横軸は、0度を挟み、−45度、45度、及び90度回転した2次特徴の結果を示している。これは図5に示したように2次特徴を検出する時の回転角度を45度毎としたためである。
角度nでの相関値をSnとし、しきい値をSthとすると、選択方法の例としては、まず、Sn>Sthを満たす角度の中から最大のSnをSpとし、その時の角度θpを選択する。そして、2番目に大きいSnをSqとし、Sq>k・Spを満たす時に、その時の角度θqも選択する。さらに、3番目に大きいSnをSrとし、Sr>k'・Sqを満たす時にその時の角度θrも選択する。ここで、k、k'は係数であり、例えば、k'=k=0.7とする。
例えば、k=k'=0.7の場合、相関値がしきい値を越えており、かつ、最大相関値Spの場合の角度θpを選択する。次に、さらに最大相関値Spの7割(0.7Sp)よりも2番目の相関値の方が高ければ、すなわちSq>0.7Spであれば、2番目の相関値の角度も選択する。尚、このときの相関値はSqである。そして、さらに2番目の相関値の7割(0.7Sq)よりも3番目の相関値の方が高ければ、すなわち、Sr>0.7Sqであれば、3番目の相関値の角度も選択する。このときの相関値はSrである。
本実施形態では、上述したような選択方法で、検出する3次特徴の回転角を選択する。従って、しきい値を越えた角度が無い場合には選択する角度は0個となり、またしきい値を越えた角度が存在する場合には、各角度の相関値の分布により選択する回転角度とその数が決定される。そして、その選択された回転角に対応した検出モデルを選択する。
尚、他の選択方法として、上述したような相関値に基づいて(すなわち、所定量以上の特徴量を有するもの)3次特徴を検出する検出モデルの回転角度を選択するのではなく、相関値が上位の角度のモデルを所定数個選択するような選択方法を用いても良い。この場合の選択処理は、図1に示すパターン検出装置の3次特徴検出モデル選択部1013で行われ、選択される検出モデルは、3次特徴検出モデル保持部1023に保持されている。
例えば、眼特徴を検出する検出モデルが45度毎の回転角度で用意されていたとする。そして、図6(A)が、ある位置での2次特徴量の相関値を、各回転角度ごとに示しているとする。ここで、例えば、回転角度が−45度、0度、45度、及び90度の相関値をそれぞれ0.5、0.9、0.8、及び0.3とし、しきい値Sth=0.4、係数k=k'=0.7とする。このとき、回転角度−45度、0度、45度で相関値はしきい値Sthを越えており、0度の相関値が最大であって、Sp=0.9、θp=0度となる。また、45度の相関値が0度の相関値の7割以上を示しているので、Sq=0.8、θq=45度となる。よって、この時は、眼特徴を検出するための検出モデルは、0度の検出モデル及び45度の検出モデルが選択されることとなる。
次に、3次特徴検出部1003では、ステップS204で設定された3次特徴検出モデルを用いて3次特徴が検出される(ステップS205)。各3次特徴の検出方法は、ステップS203と同様であり、ステップS204で選択された検出モデルの検出領域内にステップS203で検出された各2次特徴が存在するか否かを調べることで3次特徴の検出を行う。例えば、ステップS204の処理に関して上述した3次特徴の一つである眼特徴の検出例では、その位置において、0度及び45度の2種類の検出モデルを用いて、3次特徴である眼特徴を検出する。
以下では、3次特徴検出処理の一例として、0度の検出モデルを用いた時の眼特徴の検出方法について説明する。0度の眼特徴の検出モデルは、前述した図7(A)に示す検出モデル700で示した通りである。すなわち、検出モデル700中の右空きV字領域701において、(1)2次特徴の0度の右空きV字特徴2−1−1の検出結果の相関値がしきい値を越えており、また他の特徴の相関値が相対的に低く、かつ、(2)左空きV字領域702において2次特徴の0度の左空きV字特徴2−2−1の検出結果の相関値がしきい値を越えており、また他の特徴の相関値が相対的に低く、かつ、(3)水平平行領域703において2次特徴の0度の水平平行線特徴2−3−1の検出結果の相関値がしきい値を越えており、また他の特徴の相関値が相対的に低く、かつ、(4)垂直平行領域704において2次特徴の0度の垂直平行線特徴2−4−1の検出結果の相関値がしきい値を越えており、また他の特徴の相関値が相対的に低い場合の上記4つの条件を同時に満たすとき、その場所に3次特徴である眼特徴が存在するものとする。
また、45度の眼特徴の検出についても、同様に、45度用の2次検出モデルを用いて検出された2次特徴の45度の検出結果を用いて検出する。そして、これらの検出結果は、4次特徴検出部1004及び4次特徴検出モデル選択部1014に対して出力される。尚、これらの処理は、図1のパターン検出装置における3次特徴検出部1003で行われる。
次いで、4次特徴検出モデル選択部1013は、4次特徴検出モデルを選択する(ステップS206)。ここでの選択方法は、ステップS204と同様に、相関値に基づいて選択するものである。例えば、ステップS205の処理の場合の説明で示した0度及び45度を選択した3次特徴の検出結果が図6(B)に示すようになったとし、回転角度0度及び45度の相関値をそれぞれ、0.9及び0.6とし、しきい値をSth=0.4とする。この場合、回転角度が0度及び45度ともにしきい値Sthを越えており、0度の相関値が最大でSp=0.9、θp=0度となる。
ここで、45度の相関値が0度の相関値の7割以下であるので、よってこの時は、顔特徴を検出するための検出モデルは、0度の顔(図3中の符号4−1−1)及び180度の逆顔検出(図3中の符号4−2−1)を検出するための検出モデルが選択される。また、別の方法として、相関値が上位の角度を既定数選択する選択方法もある。これらの処理は、図1のパターン検出装置における4次特徴検出モデル選択部1014で行われ、検出モデルは4次特徴検出モデル保持部1024に保持されている。
4次特徴検出部1004は、ステップS206で選択された4次特徴検出モデルを用いて4次特徴を検出する(ステップS207)。この場合の検出方法は、ステップS203、S205と同様である。また、4次特徴である顔特徴を検出した場合、顔の回転角度とともに、両眼と口の位置から検出した顔のサイズも検出できる。これらの処理は、図1のパターン検出装置の4次特徴検出部1004で行われる。
上述したように、本実施形態に係るパターン検出装置によれば、各特徴を検出するための検出モデルを回転角度に応じて用意し、前段の特徴の検出結果に応じて、次段の特徴の検出に使用する検出モデルを選択している。そのため、各特徴の回転によらず計算コストの増大を抑制しながら検出精度が向上し、最終的に検出するパターンの検出精度が向上するという効果が得られる。また、眼や口は開閉動作や表情により形状が変化し、例えば、右空きV字特徴の回転角度と顔の回転角度が異なることもある。そのため、2次特徴の相関値が最大となった回転角度だけで3次特徴、4次特徴の検出を行うのではなく、本実施形態で説明したように、相関値に基づいて次段に使用する回転角度の数を決定することにより、回転の検出精度も向上させることができるという効果が得られる。
次に、本実施形態の構成に係るパターン検出(認識)装置又はそれと同様の処理を行う処理手段を撮像装置に搭載させることにより、特定被写体へのフォーカシング、特定被写体の色補正、或いは露出制御を行う場合について説明する。図8は、第1の実施形態に係るパターン検出装置を用いた撮像装置の構成を示すブロック図である。
図8に示す撮像装置5101は、撮影レンズ及びズーム撮影用駆動制御機構を含む結像光学系5102、CCD又はCMOSイメージセンサ5103、撮像パラメータ計測部5104、映像信号処理回路5105、記憶部5106、撮像動作の制御、撮像条件の制御等の制御用信号を発生する制御信号発生部5107、EVF(Electronic View Finder)等のファインダーを兼ねた表示ディスプレイ5108、ストロボ発光部5109、記録媒体5110等を具備し、更に上述したパターン検出装置を被写体検出装置5111として備える。
上記構成を備える撮像装置5101では、例えば、撮影された映像中から人物の顔画像の検出(すなわち、存在位置、サイズ、回転角度の検出)を被写体検出(認識)装置5111により行う。そして、検出された人物の位置情報等が被写体検出(認識)装置5111から制御信号発生部5107に入力されると、制御信号発生部5107は、撮像パラメータ計測部5104からの出力に基づき、その人物に対するピント制御、露出条件制御、ホワイトバランス制御等を最適に行う制御信号を発生する。
このように、上述したパターン検出(認識)装置を、上記のように撮像装置に用いることで、人物検出とそれに基づく撮影の最適制御を行うことができるようになる。尚、上記説明では、上述したパターン検出装置を被写体検出(認識)装置5111として備える撮像装置5101について説明したが、当然、上述したパターン検出装置のアルゴリズムをプログラムとして実装し、CPUで動作させる処理手段として、撮像装置5101に搭載することも可能である。
また、上記の説明では、検出すべきパターンの特徴を4階層に分け、1次特徴から4次特徴を順に検出し、最後に検出すべきパターンを確認したが、4階層に限定されることはなく、例えば3階層以下であっても、5階層以上であっても良い。これは、後述する第2、第3の実施形態でも同様である。
<第2の実施形態>
図9は、本発明の第2の実施形態に係るパターン検出装置の構成を示すブロック図である。図9において、2000は信号入力部、2001は1次特徴検出部、2011は1次特徴検出フィルタ設定部、2002は2次特徴検出部、2012は2次特徴検出モデル設定部、2003は3次特徴検出部、2013は3次特徴検出モデル選択部、2023は3次特徴検出モデル保持部、2033は2次特徴計測部、2004は4次特徴検出部、2014は4次特徴検出モデル選択部、2024は4次特徴検出モデル保持部、そして2034は3次特徴計測部を示す。
図9に示すパターン検出装置のそれぞれの構成要素について、上述した第1の実施形態と異なる部分は、基本的に、2次特徴計測部2033、3次特徴計測部2034、及び3次特徴検出モデル選択部2013、及び4次特徴検出モデル選択部2014である。
上記第1の実施形態では、パターン検出装置全体の動作として、3次特徴検出モデル選択部1013は、2次特徴検出部1002の出力値に基づいて3次特徴を検出する際に使用する検出モデルを選択していた。また、4次特徴検出モデル選択部1014は、3次特徴検出部1003の出力値に基づいて4次特徴を検出する際に使用する検出モデルを選択していた。これに対し、本実施形態では、3次特徴検出モデル選択部2013は、2次特徴計測部2033の出力に基づいて3次特徴を検出する際に使用する検出モデルを選択するという点で異なる。同様に、4次特徴検出モデル選択部2014は、3次特徴計測部2034の出力値に基づいて4次特徴を検出する検出モデルを選択するという点で異なる。
次に、2次特徴計測部2033及び3次特徴計測部2034の動作について説明する。2次特徴計測部2033は、2次特徴検出部2002の出力に基づいて2次特徴の回転角度を計測する。また、3次特徴計測部2034は、3次特徴検出部2003の出力に基づいて3次特徴の回転角度を計測する。これらの回転角度θaは、例えば、式(1)に示すようにして求められる。
Figure 0004266798
ここで、θiは各角度、Siはその角度の相関値を示す。この計算に使用する角度及び相関値は、2次特徴検出部2002(又は、3次特徴検出部2003)で計算した全ての角度を用いても良いし、第1の実施形態で説明したように、しきい値以上の角度を使用したり、またさらに最大の相関値の何割か以上ということで選択してもよい。また、同時に、2次特徴計測部2033(又は、3次特徴計測部2034)は、その角度を計算するために使用した角度の中で相関値の上位2つの角度も出力する。尚、上記式(1)は、2次特徴又は3次特徴の回転角度θaを離散的な角度で検出した結果から推定するものであり、本実施形態では、特にこの計算式だけに限られることはなく、他の計算式を使用しても良い。
次に、3次特徴検出モデル選択部2013、及び4次特徴検出モデル選択部2014の動作について説明する。この2つの特徴検出モデル選択部の動作は、基本的に同じであるので、以下では3次特徴検出モデル選択部2013だけを例にとって説明する。
図10は、第2の実施形態に係るパターン検出装置の3次特徴検出モデル選択部2013の動作を説明するためのフローチャートである。まず、2次特徴計測部2033で求められた回転角度θa及びその回転角度θaの計算に使用された前段の特徴を検出した回転角度の中で、検出結果の相関値の上位2つの回転角度θb、θc(θb<θcとする。)が3次特徴検出モデル選択部2013に入力される(ステップS1001)。尚、2次特徴計測部2033での計算の際に、選択された角度が1つだった場合は、1つの角度θb(=θa)のみ入力される。
次に、3次特徴検出モデル選択部2013では、θcの入力が無いかどうかが判別される(ステップS1002)。その結果、θcの入力が無く、θbのみが入力されていれる場合(Yes)、回転角度θbの3次特徴を検出するための検出モデルが選択される(ステップS1003)。一方、2つの角度θb、θcが入力されている場合(No)、3次特徴検出モデル選択部2013では、θa、θb、θcに関する判別処理が行われる(ステップS1004)。この判別処理は、例えば、以下に示す式(2)に基づいて行われる。
Figure 0004266798
ここで、θa、θb、θcが上記式(2)を満たす場合(Yes)、回転角度θbと(θb+θc)/2の2つの角度で3次特徴を検出するための検出モデルが選択される(ステップS1005)。一方、θaが式(2)を満たす範囲にない場合(No)、θa、θb、θcに関する次の判別が行われる(ステップS1005)。この判別は、例えば、以下に示す式(3)に基づいて行われる。
Figure 0004266798
θa、θb、θcが上記式(3)を満たす場合(Yes)、3次特徴検出モデル選択部2013は、回転角度θcと(θb+θc)/2の2つの角度で3次特徴を検出するための検出モデルを選択する(ステップS1007)。一方、θaが式(3)で示す範囲にない場合(No)、3次特徴検出モデル選択部2013は、回転角度θbとθcの2つの角度を用いて3次特徴を検出するための検出モデルを選択する(ステップS1008)。
上述したように、3次特徴検出モデル選択部2013では、2次特徴計測部2033で求められた回転角度及び計算に使用された2つの角度に基づいて、3次特徴検出部2003で3次特徴を検出するための検出モデルを選択する。この動作は、4次特徴検出モデル選択部2014も同様である。
ここで、図11は、第2の実施形態における検出モデルの選択方法を説明するための模式図である。上述した図10に示すフローチャートの動作を図11の模式図を用いて説明すると、2次特徴計測部2033で求められた回転角度が、図11におけるAの範囲の時、Bの範囲の時、Cの範囲の時で、3次特徴を検出するための検出モデルを変更するものである。例えば、図11に示すように、2次特徴計測手段2033で求めた回転角度がBの範囲であれば、3次特徴検出部2003で使用する検出モデルは、0度及び45度回転した検出モデルとなる。一方、回転角度がAの範囲であれば、検出モデルは、0度及び22.5度回転した検出モデルとなる。またCの範囲であれば、22.5度及び45度回転した検出モデルとなる。
このように、計算に使用した2つの回転角度のいずれか一方に近ければ、2つの検出予定の角度間隔を狭めることで、次段の特徴検出において回転角度の計算の精度が向上する。尚、そのためには、3次特徴を検出するための検出モデルは、2次特徴を検出するための検出モデルよりも細かい角度間隔で用意する必要がある。そして、4次特徴を検出するための検出モデルは、さらに詳細な角度で用意する必要がある。
例えば、2次特徴を45度間隔で検出したときには、3次特徴は22.5度ずつ用意する必要がある。このようにすることで、被検出被写体にもよるが、図12に示したように、2次特徴、3次特徴、4次特徴と検出を進めていくことで、検出モデルの回転角度間隔が狭くなり、検出精度が向上することもある。すなわち、図12は、第2の実施形態での各階層における検出モデルの回転角度の変化を示す図である。
尚、選択された検出モデルの回転角度に対応した前段の検出結果が無い場合は、その回転角度を挟む2つの回転角度での検出結果が使用される。例えば、3次特徴検出部2003で使用する検出モデルとして22.5度回転した検出モデルが選択されると、その検出モデルを用いた検出には、2次特徴検出部2002で検出した0度及び45度回転した2次特徴が使用される。
尚、上記式(2)及び式(3)は、2次特徴計測部2033又は3次特徴計測部2034で計測した2次特徴又は3次特徴の回転角度θaと、その前段の特徴を検出した時の回転角度θiとの比較を行い、計測した回転角度θaが検出に使用した回転角度におけるある回転角度θiに近いか否かを判別するために用いられるものである。従って、上記計算式だけに限定されるものではなく、別の判別方法を使用しても良い。
上述したように、本実施形態に係るパターン検出装置によれば、各特徴を検出するための検出モデルを、高次特徴になるほど角度幅を小さくして用意し、前段の特徴の検出結果に応じて、次段の特徴の検出に使用する検出モデルを選択させる。従って、各特徴の回転によらず計算コストの増大を抑制しながら検出精度が向上し、高次特徴になるほど検出精度が向上するという効果が得られる。
また、第2の実施形態の構成に係るパターン検出(認識)装置、及びパターン検出方法が動作する処理手段を撮像装置に搭載させることによって、第1の実施形態と同様に、上記効果を有する撮像装置を実現することが可能である。
<第3の実施形態>
図13は、本発明の第3の実施形態に係るパターン検出装置の構成を示すブロック図である。図13において、3000は信号入力部、3001は1次特徴検出部、3011は1次特徴検出フィルタ設定部、3002は2次特徴検出部、3012は2次特徴検出モデル設定部、3003は3次特徴検出部、3013は3次特徴検出モデル設定部、3023は3次特徴基準モデル保持部、3033は2次特徴計測部、3004は4次特徴検出部、3014は4次特徴検出モデル設定部、3024は4次特徴基準モデル保持部、及び3034は3次特徴計測部を示す。
図13に示すパターン検出装置中のそれぞれの構成要素において、第2の実施形態と異なる部分は、基本的に3次特徴検出モデル設定部3013、4次特徴検出モデル設定部3014、3次特徴基準モデル保持部3023、及び4次特徴基準モデル保持部3024である。
上記第2の実施形態では、3次特徴検出モデル選択部2013においては、2次特徴計測部2033の出力に基づいて3次特徴を検出する際に使用する検出モデルを3次特徴検出モデル保持部2023から選択していた。同様に、4次特徴検出モデル選択部2014においては、3次特徴計測部2034の出力に基づいて4次特徴を検出する際に使用する検出モデルを4次特徴検出モデル保持部2024から選択していた。
これに対し本実施形態に係るパターン検出装置では、3次特徴検出モデル設定部3013おいて、2次特徴計測部3033の出力に基づいて3次特徴を検出する際に使用する検出モデルを3次特徴基準モデル保持部3023に保持されている基準モデルから設定するという点で異なる。また、4次特徴検出モデル設定部3014において3次特徴計測部3034の出力に基づいて4次特徴を検出する際に使用する検出モデルを4次特徴基準モデル保持部3024に保持されている基準モデルから設定するという点で異なる。
次に、3次特徴検出モデル設定部3013及び4次特徴検出モデル設定部3014の動作について説明する。尚、この2つの特徴検出モデル設定部の動作は基本的に同じであるので、以下では、3次特徴検出モデル設定部3013について例にして説明する。3次特徴検出モデル設定部3013は、まず、2次特徴計測部2033の出力をパラメータとし、以下に示す式(4)を使用してθdを計算する。
Figure 0004266798
ここで、θiは各角度、Siはその角度の相関値であり、θaは第2の実施形態で説明した式(1)による回転角度である。次に、式(5)を使用してθeを求める。
Figure 0004266798
上記式(5)において、nは階層を表し、例えば、ここでは3次特徴の検出モデルを設定するのでn=3となる。また、αは初期角度であり、例えば45度とする。さらに、Pは任意の正の実数であり、例えば2とする。次に、このθdとθeの値の大きい方を選択し、それをθfとする。そして、θa±θfで求められる2つの回転角度の検出モデルを設定する。図14は、第3の実施形態における2つの回転角度θf、θa±θfの概要を示す図である。
検出モデルの設定は、3次特徴基準モデル保持部3023に保持されている基準モデルを求めた回転角度θa±θfで回転変換させて作成する。この動作は4次特徴検出モデル選択部2014も同様である。尚、上記式(4)は、3次特徴又は4次特徴の検出モデルの回転角度間隔を、回転角度θa及び離散的な角度で検出した結果から計算するものである。しかし、式(4)の計算角度が非常に小さくなると検出精度が劣化するため、本実施形態では上記式(5)を計算し、角度の設定時には、式(4)又は式(5)の計算角度の大きい方を選択するようにしている。尚、本実施形態における検出モデルの設定は、上記方式だけに限定されるものではなく、例えば、3次特徴又は4次特徴の検出モデルの適切な回転角度間隔が設定できれば、他の方式を用いても良い。
3次特徴検出部3003(又は、4次特徴検出部3004)では、上記2つの回転角度で回転された検出モデルを用いて、3次特徴(又は、4次特徴)の検出を行う。尚、選択された検出モデルの回転角度に対応した前段の検出結果が無い場合は、第2の実施形態と同様に、その回転角度を挟む2つの回転角度での検出結果が使用される、又は一番近い回転角度での検出結果が使用される。
上述したように本実施形態によれば、各特徴を検出するための検出モデルを前段の特徴の検出結果に基づいて、次段の特徴の検出に使用する検出モデルをその検出結果の角度を必ず挟むように設定した。また、その際に検出結果値に基づいて挟む角度も調整した。従って、各特徴の回転によらず計算コストの増大を抑制しながら検出精度が向上するという効果が得られる。
尚、本実施形態で示したパターン検出(認識)装置及びパターン検出方法が動作する処理手段を、第1、第2の実施形態と同様に、撮像装置に搭載させることも可能である。
<その他の実施形態>
以上、実施形態例を詳述したが、本発明は、例えば、システム、装置、方法、プログラム若しくは記憶媒体等としての実施態様をとることが可能であり、具体的には、複数の機器から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。
尚、本発明は、前述した実施形態の機能を実現するソフトウェアのプログラム(実施形態では図に示すフローチャートに対応したプログラム)を、システムあるいは装置に直接あるいは遠隔から供給し、そのシステムあるいは装置のコンピュータが該供給されたプログラムコードを読み出して実行することによっても達成される場合を含む。
従って、本発明の機能処理をコンピュータで実現するために、該コンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明は、本発明の機能処理を実現するためのコンピュータプログラム自体も含まれる。
その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等の形態であっても良い。
プログラムを供給するための記録媒体としては、例えば、フロッピー(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、MO、CD−ROM、CD−R、CD−RW、磁気テープ、不揮発性のメモリカード、ROM、DVD(DVD−ROM,DVD−R)などがある。
その他、プログラムの供給方法としては、クライアントコンピュータのブラウザを用いてインターネットのホームページに接続し、該ホームページから本発明のコンピュータプログラムそのもの、もしくは圧縮され自動インストール機能を含むファイルをハードディスク等の記録媒体にダウンロードすることによっても供給できる。また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるWWWサーバも、本発明に含まれるものである。
また、本発明のプログラムを暗号化してCD−ROM等の記憶媒体に格納してユーザに配布し、所定の条件をクリアしたユーザに対し、インターネットを介してホームページから暗号化を解く鍵情報をダウンロードさせ、その鍵情報を使用することにより暗号化されたプログラムを実行してコンピュータにインストールさせて実現することも可能である。
また、コンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現される他、そのプログラムの指示に基づき、コンピュータ上で稼動しているOSなどが、実際の処理の一部または全部を行い、その処理によっても前述した実施形態の機能が実現され得る。
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によっても前述した実施形態の機能が実現される。
これによって、上記第1〜第3の実施形態で説明したパターン検出装置における処理によって得られる効果と同様の効果、すなわち、ある階層の1つの対象特徴を検出する際に複数の検出モデルが設定され、それらの複数の検出結果から次段の検出特徴を検出するための検出モデルを適応的に設定することによる、各特徴の検出精度の向上や、入力画像中に回転した認識対象が存在する場合に全ての認識対象を処理コストの増加を抑えて検出することができるという効果、また、回転角度も精度良く検出できるという効果が得られる。さらに、撮像装置に実装することで、上記実施形態と同様に、画像中の顔といった特定領域の色補正やフォーカスの設定、追尾が容易になるという効果が得られる。
本発明の第1の実施形態に係るパターン検出装置の構成を示す図である。 第1の実施形態に係るパターン検出装置の動作例を説明するためのフローチャートである。 第1の実施形態のパターン検出装置における各特徴検出部において検出される特徴の例を示す図である。 2次特徴のうち右空きV字特徴2−1−1に関するモデルを説明するための図である。 2次特徴を検出するための回転した検出モデルの一例を示す図である。 3次特徴検出モデル選択部1013におけるモデル選択の方法を示す模式図である。 3次特徴検出部1003において眼特徴を検出するための眼検出モデルの一例を示す図である。 第1の実施形態に係るパターン検出装置を用いた撮像装置の構成を示すブロック図である。 本発明の第2の実施形態に係るパターン検出装置の構成を示すブロック図である。 第2の実施形態に係るパターン検出装置の3次特徴検出モデル選択部2013の動作を説明するためのフローチャートである。 第2の実施形態における検出モデルの選択方法を説明するための模式図である。 第2の実施形態での各階層における検出モデルの回転角度の変化を示す図である。 本発明の第3の実施形態に係るパターン検出装置の構成を示すブロック図である。 第3の実施形態における2つの回転角度θf、θa±θfの概要を示す図である。
符号の説明
1000、2000、3000 信号入力部
1001、2001、3001 1次特徴検出部
1002、2002、3002 2次特徴検出部
1003、2003、3003 3次特徴検出部
1004、2004、3004 4次特徴検出部
1011、2011、3011 1次特徴検出フィルタ設定部
1012、2012、3012 2次特徴検出モデル設定部
1013、2013、3013 3次特徴検出モデル選択部
1014、2014、3014 4次特徴検出モデル選択部
1023、2023、3023 3次特徴検出モデル保持部
1024、2024、3024 4次特徴検出モデル保持部
2033、3033 2次特徴計測部
2034、3034 3次特徴計測部

Claims (7)

  1. 画像中の予め定められたパターンをパターンのモデルを用いて検出するパターン検出装置であって、
    複数の階層の特徴に対して上位モデルが複数の下位モデルを組み合わせて構成される階層毎のモデルを各階層につき複数保持する保持手段と、
    前記保持手段に保持されたモデルから各階層の特徴検出に使用するモデルとして、同一のモデルをそれぞれ複数の角度で回転させた形態の複数のモデルを設定する設定手段と、
    前記設定手段により設定された各階層のモデルと前記画像の構成部分とを比較して各特徴に係る特徴量を算出し、前記複数の階層について所定値以上の特徴量に対応する特徴を下位層から順番に検出する検出手段と
    前記検出手段によって特徴量を算出された複数の下位モデルのうち、予め定められた特徴量以上を有する下位モデル、または予め定められた順位以上の特徴量を有する下位モデルの回転角度を選択する角度選択手段とを備え、
    前記設定手段は、少なくとも1つの階層について、当該階層の特徴検出に使用するモデルとして、前記保持手段に保持された上位モデルであって前記角度選択手段によって選択された回転角度に対応する上位モデルを設定することを特徴とするパターン検出装置。
  2. 前記モデル設定手段において複数の角度で回転させた形態の複数のモデルが設定される際の該複数の角度の回転間隔を変更する変更手段をさらに備え、
    該変更手段が、より上位の階層におけるモデルの回転間隔をより狭くすることを特徴とする請求項に記載のパターン検出装置。
  3. 前記保持手段が基準モデルを保持し、
    前記設定手段が、前記保持手段に保持された前記基準モデルを前記検出手段によって算出された前記特徴量を用いて変換することによって前記パターンのパターンモデルを設定することを特徴とする請求項に記載のパターン検出装置。
  4. 画像中の予め定められたパターンをパターンのモデルを用いて検出するパターン検出方法であって、
    複数の階層の特徴に対して上位モデルが複数の下位モデルを組み合わせて構成される階層毎のモデルを各階層につき複数保持するモデル保持部から各階層の特徴検出に使用するモデルとして、同一のモデルをそれぞれ複数の角度で回転させた形態の複数のモデルを設定する設定工程と、
    前記設定工程で設定された各階層のモデルと前記画像の構成部分とを比較して各特徴に係る特徴量を算出し、前記複数の階層について所定値以上の特徴量に対応する特徴を下位層から順番に検出する検出工程と
    前記検出工程によって算出された下位モデルの特徴量のうち、予め定められた量以上または該特徴量の順で予め定められた順位以上の特徴量を有する下位モデルの回転角度を選択する角度選択工程とを有し、
    前記設定工程は、少なくとも1つの階層について、当該階層の特徴検出に使用するモデルとして、前記保持手段に保持された上位モデルであって前記角度選択工程によって選択された回転角度に対応する上位モデルを設定することを特徴とするパターン検出方法。
  5. コンピュータに、画像中の予め定められたパターンをパターンのモデルを用いて検出させるためのプログラムであって、
    複数の階層の特徴に対して上位モデルが複数の下位モデルを組み合わせて構成される階層毎のモデルを各階層につき複数のモデルから各階層の特徴検出に使用するモデルとして、同一のモデルをそれぞれ複数の角度で回転させた形態の複数のモデルを設定する設定手順と、
    前記設定手順で設定された各階層のモデルと前記画像の構成部分とを比較して各特徴に係る特徴量を算出し、前記複数の階層について所定値以上の特徴量に対応する特徴を下位層から順番に検出する検出手順と、
    前記検出手段によって特徴量を算出された複数の下位モデルのうち、予め定められた特徴量以上を有する下位モデル、または予め定められた順位以上の特徴量を有する下位モデルの回転角度を選択する角度選択手段と、
    をコンピュータに実行させ、
    前記設定手順は、少なくとも1つの階層について、当該階層の特徴検出に使用するモデルとして、前記保持手段に保持された上位モデルであって前記角度選択工程によって選択された回転角度に対応する上位モデルを設定することを特徴とするプログラム。
  6. 請求項に記載のプログラムを格納したことを特徴とするコンピュータ読み取り可能な記憶媒体。
  7. 請求項1からまでのいずれか1項に記載のパターン検出装置と、撮像装置とを備え、該撮像装置によって撮像された画像から予め定められたパターンを前記パターン検出装置を用いて検出することを特徴とするパターン検出機能付き撮像システム。
JP2003416236A 2002-12-16 2003-12-15 パターン検出装置及びパターン検出方法 Expired - Fee Related JP4266798B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2003416236A JP4266798B2 (ja) 2003-12-15 2003-12-15 パターン検出装置及びパターン検出方法
US10/539,882 US7577297B2 (en) 2002-12-16 2003-12-16 Pattern identification method, device thereof, and program thereof
AU2003289116A AU2003289116A1 (en) 2002-12-16 2003-12-16 Pattern identification method, device thereof, and program thereof
PCT/JP2003/016095 WO2004055735A1 (ja) 2002-12-16 2003-12-16 パターン識別方法、その装置及びそのプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003416236A JP4266798B2 (ja) 2003-12-15 2003-12-15 パターン検出装置及びパターン検出方法

Publications (3)

Publication Number Publication Date
JP2005174179A JP2005174179A (ja) 2005-06-30
JP2005174179A5 JP2005174179A5 (ja) 2007-02-08
JP4266798B2 true JP4266798B2 (ja) 2009-05-20

Family

ID=34735481

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003416236A Expired - Fee Related JP4266798B2 (ja) 2002-12-16 2003-12-15 パターン検出装置及びパターン検出方法

Country Status (1)

Country Link
JP (1) JP4266798B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006352371A (ja) 2005-06-14 2006-12-28 Matsushita Electric Ind Co Ltd 無線基地局装置
EP1780672A1 (en) * 2005-10-25 2007-05-02 Bracco Imaging, S.P.A. Method of registering images, algorithm for carrying out the method of registering images, a program for registering images using the said algorithm and a method of treating biomedical images to reduce imaging artefacts caused by object movement
JP4840066B2 (ja) * 2006-10-11 2011-12-21 セイコーエプソン株式会社 回転角度検出装置、および回転角度検出装置の制御方法
JP6337949B1 (ja) * 2016-12-15 2018-06-06 オムロン株式会社 スジ状領域検出装置およびスジ状領域検出方法

Also Published As

Publication number Publication date
JP2005174179A (ja) 2005-06-30

Similar Documents

Publication Publication Date Title
US20220138490A1 (en) Image processing apparatus, image processing method, and non-transitory computer-readable storage medium
EP1556805B1 (en) Tracking a surface in a 3-dimensional scene using natural visual features of the surface
US10964060B2 (en) Neural network-based camera calibration
JP5940453B2 (ja) 画像のシーケンス内のオブジェクトのリアルタイム表現のハイブリッド型追跡のための方法、コンピュータプログラム、および装置
US8036468B2 (en) Invariant visual scene and object recognition
US9984280B2 (en) Object recognition system using left and right images and method
CN110619628B (zh) 一种人脸图像质量评估方法
JP4353246B2 (ja) 法線情報推定装置、登録画像群作成装置および画像照合装置ならびに法線情報推定方法
Zhang et al. Detecting and extracting the photo composites using planar homography and graph cut
WO2004055735A1 (ja) パターン識別方法、その装置及びそのプログラム
JP2008234653A (ja) 目標画像検出方法及び画像検出装置
JP5468824B2 (ja) 3次元における形状の一致を判定する方法および装置
JP2008102611A (ja) 画像処理装置
Davidson et al. 360 camera alignment via segmentation
US11216961B2 (en) Aligning digital images by selectively applying pixel-adjusted-gyroscope alignment and feature-based alignment models
JP4266798B2 (ja) パターン検出装置及びパターン検出方法
Noury et al. How to overcome perceptual aliasing in ASIFT?
CN112036398B (zh) 一种文本校正方法及其系统
JP6278757B2 (ja) 特徴量生成装置、特徴量生成方法、およびプログラム
Bal et al. Image‐based locating and guiding for unmanned aerial vehicles using scale invariant feature transform, speeded‐up robust features, and oriented fast and rotated brief algorithms
KR101031369B1 (ko) 얼굴 인식 장치 및 그 방법
JP2004199200A (ja) パターン認識装置、撮像装置、情報処理システム、パターン認識方法、記録媒体、及びプログラム
Kakar Passive approaches for digital image forgery detection
Harribhai Using regions of interest to track landmarks for RGBD simultaneous localisation and mapping
Zhao et al. Defocused Image Splicing Localization by Distinguishing Multiple Cues between Raw Naturally Blur and Artificial Blur

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061215

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061218

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080613

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080811

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081003

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081202

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090206

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090217

R150 Certificate of patent or registration of utility model

Ref document number: 4266798

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120227

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130227

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140227

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees