JP2006323779A

JP2006323779A - 画像処理方法、画像処理装置

Info

Publication number: JP2006323779A
Application number: JP2005148555A
Authority: JP
Inventors: Yumi Watabe; 由美渡部
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 2005-05-20
Filing date: 2005-05-20
Publication date: 2006-11-30

Abstract

【課題】画像中の被写体を正確に検出するための技術を提供すること。
【解決手段】入力された画像の輝度画像を再帰的に縮小することで複数枚の縮小画像を生成し（Ｓ１０３）、それぞれの縮小画像について、顔とおぼしき領域を検出し（Ｓ１０６）、検出したそれぞれの領域について、この領域を包含する近傍領域を設定し（Ｓ１０７）、設定したそれぞれの近傍領域について、この近傍領域内で顔とおぼしき領域を検出する（Ｓ１１０）。
【選択図】図２

Description

本発明は、画像から検出対象を検出するための技術に関するものである。

画像から特定の被写体パターンを自動的に検出する画像処理方法は非常に有用であり、このような画像処理方法は例えば、人間の顔を検出するために利用することができる。このような方法は、通信会議、マン・マシン・インタフェース、セキュリティ、人間の顔を追跡するためのモニタ・システム、画像圧縮などの多くの分野で使用することができる。このような画像中から顔を検出する技術としては、例えば、非特許文献１に各種方式が挙げられている。その中では、いくつかの顕著な特徴（２つの目、口、鼻など）とその特徴間の固有の幾何学的位置関係とを利用するか、又は人間の顔の対称的特徴、人間の顔色の特徴、テンプレート・マッチング、ニューラル・ネットワークなどを利用することによって、人間の顔を検出する方式が示されている。

例えば、非特許文献２で提案されている方式は、ニューラル・ネットワークにより画像中の顔パターンを検出する方法である。以下、非特許文献２による顔検出の方法について簡単に説明する。

まず、顔を含む画像をメモリに読み込み、この画像から、顔と照合する所定の領域を切り出す。そして、切り出した領域を構成する各画素の画素値の分布を入力としてニューラル・ネットワークによる演算で一つの出力を得る。

このとき、ニューラル・ネットワークの重み、閾値は、膨大な顔画像パターンと非顔画像パターンによりあらかじめ学習されており、このようなニューラル・ネットワークを用いれば、例えば、ニューラル・ネットワークの出力が０以上なら顔、それ以外は非顔であると判別することができる。

そして、ニューラル・ネットワークの入力である顔と照合する画像パターンの切り出し位置を、例えば、画像全域から縦横順次に走査していくことにより、画像中から顔を検出する。

また、様々な大きさの顔の検出に対応するため、読み込んだ画像を所定の割合で順次縮小し、それぞれに対して、前述した顔検出の走査を行うようにしている。

上述の方法で１つの判別器を利用して顔検出を行った場合、本来顔でないものが顔であると判別され、誤ったパターンが検出される状況が発生する。そこで、非特許文献２では、異なるサンプルセットを用いて学習した複数の判別器を組み合わせて利用することで、誤検出パターンを減少させている。複数判別器の組合せ方法として、全ての判別器で検出されたパターンのみを正解顔パターンとするＡＮＤ接続、それぞれの判別器で検出されたパターンを全て正解顔パターンとするＯＲ接続、等が提案されている。

例えば、判別器１により顔であると判別されたパターンが図６（ａ）において実線で示した矩形部分で、判別器２により顔であると判別されたパターンが図６（ｂ）において点線で示した矩形部分である場合、複数判別器のＡＮＤ接続では、それぞれの画像を重ね合わせるのであるが、その場合には図６（ｃ）に示す如く、実線で示す矩形と点線で示す矩形とはずれてしまうことが多い。即ち、二つの判別器で共通して顔であると判別されたパターンは存在しない。図６は、様々な判別器で判別された結果を示す図である。

しかしながら、それぞれの判別器は明らかに画像中の顔を正確に検出している。このように、ＡＮＤを取った場合は、検出パターンの画像上における位置のわずかなずれによって、正確な顔パターンが落ちてしまう問題がある。

また、ＯＲ接続では、明らかに顔でない部分に検出されたパターンも残ってしまい、１つの判別器を利用した場合より誤検出が増加してしまう問題がある。
IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE, VOL.24 , NO.1, JANUARY 2002、"Detecting Faces in Images: A Survey" IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE, VOL.20 , NO.1, JANUARY 1998、"Neural network-based face detection"

本発明は以上の問題に鑑みてなされたものであり、画像中の被写体を正確に検出するための技術を提供することを目的とする。

本発明の目的を達成するために、例えば本発明の画像処理方法は以下の構成を備える。

即ち、画像から所定の被写体を検出する画像処理方法であって、
前記画像の輝度成分で構成される輝度画像を生成する生成工程と、
前記輝度画像を再帰的に縮小することで、複数枚の縮小画像を生成する縮小工程と、
それぞれの縮小画像について、所定の被写体とおぼしき領域を検出する第１の検出工程と、
前記第１の検出工程で検出したそれぞれの領域について、当該領域を包含する近傍領域を設定する設定工程と、
前記設定工程で設定したそれぞれの近傍領域について、当該近傍領域内で前記所定の被写体とおぼしき領域を検出する第２の検出工程と
を備えることを特徴とする。

本発明の目的を達成するために、例えば本発明の画像処理装置は以下の構成を備える。

即ち、画像から所定の被写体を検出する画像処理装置であって、
前記画像の輝度成分で構成される輝度画像を生成する生成手段と、
前記輝度画像を再帰的に縮小することで、複数枚の縮小画像を生成する縮小手段と、
それぞれの縮小画像について、所定の被写体とおぼしき領域を検出する第１の検出手段と、
前記第１の検出手段によって検出したそれぞれの領域について、当該領域を包含する近傍領域を設定する設定手段と、
前記設定手段によって設定したそれぞれの近傍領域について、当該近傍領域内で前記所定の被写体とおぼしき領域を検出する第２の検出手段と
を備えることを特徴とする。

本発明の構成により、画像中の被写体を正確に検出することができる。

以下添付図面を参照して、本発明を好適な実施形態に従って詳細に説明する。

本実施形態に係る画像処理装置は、ＰＣ（パーソナルコンピュータ）やＷＳ（ワークステーション）等のコンピュータにより構成されており、ディジタルカメラなどの撮像装置から入力した画像、インターネットなどのネットワークを介して外部機器からダウンロードした画像、ＣＤ−ＲＯＭやＤＶＤ−ＲＯＭなどの記憶媒体からの読み出しにより入力した画像など、様々な入力形態で入力した画像中に含まれている所定の被写体を検出する。なお、本実施形態では被写体として人間の顔を用いるが、その他の被写体を用いても良い。

先ず、このような処理を行う本実施形態に係る画像処理装置について説明する。図３は、本実施形態に係る画像処理装置に適用可能なコンピュータのハードウェア構成を示す図である。

２０１はＣＰＵで、ＲＡＭ２０２やＲＯＭ２０３に格納されているプログラムやデータを用いてコンピュータ全体の制御を行うと共に、コンピュータが行う後述の各処理を実行する。

２０２はＲＡＭで、外部記憶装置２０７や記憶媒体ドライブ装置２０８から読み出したプログラムやデータを一時的に記憶するためのエリア、Ｉ／Ｆ２０９を介して外部から受信したデータを一時的に記憶する為のエリア、ＣＰＵ２０１が各種の処理を実行する為に用いるワークエリア等、各種のエリアを適宜提供することができる。

２０３はＲＯＭで、ここにブートプログラムや本コンピュータの設定データなどを格納する。

２０４、２０５は夫々キーボード、マウスで、コンピュータの操作者が操作することで各種の指示をＣＰＵ２０１に対して入力することができる。

２０６は表示部で、ＣＲＴや液晶画面などにより構成されており、ＣＰＵ２０１による処理結果を文字や画像等でもって表示する。

２０７は外部記憶装置で、例えばハードディスクドライブ装置等の大容量情報記憶装置であって、ここにＯＳ（オペレーティングシステム）や、コンピュータが行う後述の各処理をＣＰＵ２０１に実行させるためのプログラムやデータが格納されており、これらはＣＰＵ２０１による制御に従って適宜ＲＡＭ２０２に読み出される。

２０８は記憶媒体ドライブ装置で、ＣＤ−ＲＯＭやＤＶＤ−ＲＯＭなどの記憶媒体に記録されているプログラムやデータを読み出して、ＲＡＭ２０２や外部記憶装置２０７に出力する。なお、上記外部記憶装置２０７に記憶されているプログラムやデータの一部を上記記憶媒体に記録しておいても良く、その場合には、これら記憶されているプログラムやデータを使用する際に、記憶媒体ドライブ装置２０８がこの記憶媒体に記録されているプログラムやデータを読み出して、ＲＡＭ２０２に出力する。

２０９はＩ／Ｆ（インターフェース）で、ここにディジタルカメラやインターネットやＬＡＮのネットワーク回線等を接続することができる。

２１０は上述の各部を繋ぐバスである。

なお、コンピュータへの画像の入力形態については特に限定するものではなく、様々な形態が考えられる。

図１は、本実施形態に係る画像処理装置に適用可能なコンピュータの機能構成を示すブロック図である。

１０は画像入力部で、例えばディジタルスチルカメラ、フィルムスキャナーなどの装置から出力された画像データを受け、後段の画像縮小部２０に出力するものである。なお、上述の通り、画像の入力形態については特に限定するものではない。

２０は画像縮小部で、画像入力部１０から受けた画像データに基づいて輝度画像を生成する。そして生成した輝度画像を再帰的に縮小することで、複数枚の縮小画像を生成する。生成したそれぞれの縮小画像（画像入力部１０から受けた画像データに基づいて生成したオリジナルの輝度画像も１／１の縮小画像と解釈すれば、このオリジナルもまた、縮小画像に含めることができる）は順次後段の照合パターン抽出部３０に出力する。

３０は照合パターン抽出部で、画像縮小部２０から縮小画像を受けると、この縮小画像上で所定サイズの矩形を移動させながら、この矩形に含まれる部分（画素群）を「照合対象のパターン」として順次抽出し、後段の輝度正規化部４０に出力する。このような処理は、画像縮小部２０から受けたそれぞれの縮小画像について行う。

４０は輝度正規化部で、照合パターン抽出部３０から受けた照合対象のパターンを構成する画素群の輝度分布を正規化する。

５０は第１の顔判別部で、輝度正規化部４０で正規化された照合パターンが顔パターンであるか、それとも非顔パターンであるのかを判別する処理を行う。

６０は近傍候補設定部で、第１の顔判別部５０が顔パターンと判断した照合パターンを包含する領域（近傍候補領域）を設定する。なお、近傍候補設定部６０が近傍候補領域を設定すると、設定した近傍候補領域を示す情報は照合パターン抽出部３０に入力される。すると照合パターン抽出部３０は、近傍候補設定部６０が設定した近傍候補領域（縮小画像中、顔とおぼしき領域を包含する領域）に含まれる部分（画素群）上で所定サイズの矩形を移動させながら、この矩形に含まれる部分（画素群）を「照合対象のパターン」として順次抽出し、後段の輝度正規化部４０に出力する。輝度正規化部４０はこの照合対象のパターンを構成する画素群の輝度分布を正規化する。

７０は第２の顔判別部で、輝度正規化部４０で輝度分布が正規化された照合対象のパターン（近傍候補領域中の照合パターンの輝度分布を正規化したもの）が顔パターンか非顔パターンかを判別する。第２の顔判別部７０は、第１の顔判別部５０とはあらかじめ異なるサンプルセットを用いて学習して得たものである。また、第２の顔判別部７０における顔検出処理は、第１の顔判別部５０における処理と同様に、様々な検出方法が適用可能である。

８０は顔領域出力部で、第２の顔判別部７０が顔パターンと判別した照合パターンに係る情報を出力する。

以上の各部は、例えば、ＣＰＵ２０１の一機能として動作するものである。

次に、ＣＰＵ２０１が図１に示した各部として動作することでなされる処理、即ち、画像中に含まれている被写体を検出するための処理について、同処理のフローチャートを示す図２を用いて以下説明する。なお、同図のフローチャートに従った処理をＣＰＵ２０１に実行させるためのプログラムやデータは外部記憶装置２０７（もしくは記憶媒体ドライブ装置２０８が読み取り可能な記憶媒体）に保存されており、これをＣＰＵ２０１の制御に従って適宜ＲＡＭ２０２にロードし、ＣＰＵ２０１がこれを用いて処理を実行することで、コンピュータは以下説明する各処理を実行することになる。

外部記憶装置２０７から、若しくはＩ／Ｆ２０９を介して外部から画像データが入力されると、ＣＰＵ２０１はこれをＲＡＭ２０２に一時的に格納する（ステップＳ１０１）。なお、本コンピュータに入力した画像が圧縮されている場合には、これを伸張してからＲＡＭ２０２に一時的に格納する。

本実施形態では、入力された画像データを構成する各画素は、Ｒ、Ｇ、Ｂで表現されるものであるとする。従って、ステップＳ１０１でＲＡＭ２０２に格納した画像データに基づいて、この画像の輝度成分で構成される画像（輝度画像）、即ち、この画像を構成する各画素の値をこの画素の輝度値に変換した画像を生成する（ステップＳ１０２）。しかし、ステップＳ１０１でＲＡＭ２０２に格納した画像データを構成する各画素がＹＣｒＣｂで表現されるものである場合には、ステップＳ１０２では、Ｙ成分のみを用いて輝度画像を生成する。

次に、生成した輝度画像を再帰的に縮小することで、複数枚の縮小画像を生成する（ステップＳ１０３）。例えば、元の画像の縦横のサイズを１／１．２倍した縮小画像１を生成し、次に縮小画像１の縦横のサイズを１／１．２倍した縮小画像２を生成する、というように、複数枚の縮小画像を生成する。なお、生成する縮小画像の枚数については特に限定するものではない。

そして、ステップＳ１０４以降では、生成したそれぞれの縮小画像について処理を行う。即ち、ステップＳ１０４以降の処理は、生成した縮小画像の数だけ繰り返し行うことになる。

以降の説明では、生成した縮小画像はサイズの大きい順に縮小画像１、縮小画像２、、、、縮小画像Ｎと呼称するものとし、先ず、縮小画像１について以降の処理を行うものとする。なお、処理の対象として選択する順番については特に限定するものではない。

先ず、縮小画像１上に所定サイズの矩形を配置し、矩形内の部分（画素群）を照合パターンとして抽出する（ステップＳ１０４）。この矩形は、縮小画像１上の各位置に配置した場合に、それぞれの位置における矩形内の輝度分布を得るためのものであるので、例えばこの矩形は最初は画像の左上隅に配置する。

次に、ステップＳ１０４で抽出した照合パターン内の各画素の輝度分布を正規化する処理を行う（ステップＳ１０５）。例えば、ヒストグラム平滑化などの輝度補正を行う。これは、撮像される被写体パターンはその照明条件によって輝度分布が変わるので被写体照合の精度が劣化するのを抑制するためである。

次に、ステップＳ１０５で輝度分布が正規化された照合パターン（輝度パターン）が顔のパターン（顔とおぼしきパターン）を示すものであるのかを判別する処理を行う（ステップＳ１０６）。

図５は、所定領域内のパターンを識別する為のニューラルネットワークの動作について示した図である。同図においてＲは、例えば画像上で識別する領域を示すものであり、本実施形態ではこの領域Ｒを同図に示す如く、３種類の方法にてさらに領域分割し、各ニューロン（Ｎで示す）への受容野とする。そして、分割された領域の輝度分布を各ニューロンに入力し、中間層での出力が得られる。そして、各ニューロンの出力を出力層のニューロンの入力として最終出力が得られる。

ここで、各ニューロンでは予め学習によって得られた重みと輝度分布との積和演算およびその結果のシグモイド関数による演算が行われる。本実施形態では出力層のニューロンの出力値を顔確率とした（ニューラル・ネットワークの詳細および学習の方法については、上記非特許文献２を参照されたい）。なお、顔判別処理の方法がこれに限定するものではなく、例えば、Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2001に”Rapid Object Detection using a Boosted Cascade of Simple Features”と題するViolaとJonesによる報告で提案されているAdaBoostによる方式を用いてもよい。

図４は、様々なサイズの縮小画像（本実施形態の場合には縮小画像１、縮小画像２、、、、縮小画像Ｎ）について、顔のパターンを検出するための処理を説明する図である。それぞれの縮小画像上の各位置に同じサイズの矩形を配置した場合に、それぞれの位置における矩形内の領域が顔のパターンであるのか否かを判断するために、先ず、同図左側に示す如く、縮小画像の左上隅に矩形を配置し、そこから右側に、上から下に向かって矩形の位置を移動させる。移動させる毎に矩形内の画素群は照合パターンとして顔のパターンの判別に用いられる。

図２に戻って、顔のパターンであると判別した場合には処理をステップＳ１０６からステップＳ１０７に進め、照合パターンを包含する所定のサイズの領域、即ち、上記近傍候補領域を設定する（ステップＳ１０７）。ここで近傍候補領域について図７を用いて説明する。

図７は、近傍候補領域について説明する図である。ステップＳ１０６で顔のパターンと判別された領域（照合パターン）を図７（ａ）中のＰとすると、この領域Ｐを包含する近傍候補領域は図７（ａ）中のＲである。この近傍候補領域Ｒは同図に示す如く、顔のパターンと判別された領域Ｐを所定の範囲だけ拡張したものとなる。この時、どれ位の範囲を近傍候補領域として決定するのかは、照合パターンのサイズと縮小画像１の大きさによって決定してもよい。

図２に戻って、次に、近傍候補領域上に所定サイズの矩形を配置し、矩形内の部分（画素群）を照合パターンとして抽出する（ステップＳ１０８）。この矩形は、近傍候補領域上の各位置に配置した場合に、それぞれの位置における矩形内の輝度分布を得るためのものであるので、例えばこの矩形は最初は近傍候補領域の左上隅に配置する。

そして、次に、ステップＳ１０８で抽出した照合パターン内の各画素の輝度分布を、ステップＳ１０５と同様にして正規化する処理を行う（ステップＳ１０９）。

次に、ステップＳ１０９で輝度分布が正規化された照合パターン（輝度パターン）が顔のパターン（顔とおぼしきパターン）を示すものであるのかを判別する処理をステップＳ１０６と同様にして行う（ステップＳ１１０）。

判別処理の結果、顔のパターンである場合には処理をステップＳ１１１に進め、現在の照合パターンの画像中における位置、及び縮小画像１に対する照合パターンの相対的なサイズをＲＡＭ２０２、若しくは外部記憶装置２０７に記録する処理を行う（ステップＳ１１１）。縮小画像１に対する照合パターンの相対的なサイズとは、例えば、縮小画像ｋの縮小率がｋ（０＜ｋ＜１）、照合パターンの絶対サイズがｓである場合、ｓ／ｋとなる。

なお、必要に応じて、縮小画像１を識別するための情報（例えばＩＤ）も記録するようにしても良い。そして処理をステップＳ１１４に進める。

一方、判別処理の結果、顔のパターンではない場合には処理をステップＳ１１２に進め、近傍候補領域上における矩形の移動先があるのかをチェックする（ステップＳ１１２）。即ち、近傍候補領域上における矩形の位置を移動させ、次の位置における矩形内の部分（画素群）を照合パターンとして抽出する処理を行う場合に、移動先が無い場合、例えば、現在の矩形の位置が既に近傍候補領域の右下隅の位置であれば、もう矩形の移動は行えない。一方、現在の矩形の位置が既に近傍候補領域の右下隅の位置でなければ、矩形の移動を行うことができる。

従って、移動先がある場合には処理をステップＳ１１２からステップＳ１１３に進め、近傍候補領域上における矩形の位置を移動させる（ステップＳ１１３）。矩形の移動は図７（ｂ）に示す如く、近傍候補領域内を左から右へ、上から下へ移動させる。そして矩形の移動が完了すると、処理をステップＳ１０８に進め、移動先の矩形内における照合パターンを抽出する。

一方、矩形の移動先がない場合には、この近傍候補領域内には顔のパターンは存在しないことになる。よって処理をステップＳ１１４に進める。

ステップＳ１１４では、縮小画像１上における矩形の移動先があるのかをチェックする（ステップＳ１１４）。即ち、縮小画像１上における矩形の位置を移動させ、次の位置における矩形内の部分（画素群）を照合パターンとして抽出する処理を行う場合に、移動先が無い場合、例えば、現在の矩形の位置が既に縮小画像１の右下隅の位置であれば、もう矩形の移動は行えない。一方、現在の矩形の位置が既に縮小画像１の右下隅の位置でなければ、矩形の移動を行うことができる。

従って、移動先がある場合には処理をステップＳ１１４からステップＳ１１５に進め、縮小画像１上における矩形の位置を移動させる（ステップＳ１１５）。矩形の移動は図４に示す如く、縮小画像１内を左から右へ、上から下へ移動させる。矩形の移動が終わったら、処理をステップＳ１０４に進め、移動先の矩形内における照合パターンを抽出する。

一方、矩形の移動先がない場合には、処理をステップＳ１１６に進め、全ての縮小画像について以上の処理を行ったのかを判断し（ステップＳ１１６）、まだ顔の検出処理を行っていない縮小画像がある場合には処理をステップＳ１１７に進め、縮小画像上に配置する矩形の位置を初期化（例えば縮小画像の左上隅の位置に戻す）し（ステップＳ１１７）、次の縮小画像についてステップＳ１０４以降の処理を行う。

本実施形態では現在縮小画像１について顔の検出処理を行ったので、次は縮小画像２について顔の検出処理を行う。よってこの場合には、縮小画像２上の左上隅の位置に矩形を配置し（ステップＳ１１７）、この縮小画像２についてステップＳ１０４以降の処理を行う。

よって、以上のように、異なる縮小率の縮小画像のそれぞれについて、同じサイズの照合パターンを抽出し、抽出した照合パターンを用いて顔の検出処理を行うことで、顔が画像中にどのような比率で占めていようとも、画像中における顔を検出することができる。例えば縮小率の高い縮小画像のサイズは限りなく照合パターンのサイズに近づくので、例え画像中に大きく顔が占めているような場合であっても、この顔は照合パターン内に収まる可能性が高く、この顔を検出する可能性は高い。

なお、図２のフローチャートに従って、全ての縮小画像について顔の検出処理を行うと、複数の顔のパターンが検出される可能性がある。そのような場合には、ステップＳ１１０における判別処理で、例えば、ニューラルネットワークを用いた場合には、最終層からの出力値が最も大きかったときにステップＳ１１１で記録した位置、サイズを最終的な出力としても良い。

また、本実施形態では、画像から顔とおぼしき領域を検出しても、それが顔の領域であるのかをより正確に判断するために、この領域を包含する領域を設定し、設定したこの包含領域内で更に顔とおぼしき領域の検出処理を行うので、顔とおぼしき領域の誤検出を減少させることができる。

また、本発明の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記録媒体（または記憶媒体）を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ（またはＣＰＵやＭＰＵ）が記録媒体に格納されたプログラムコードを読み出し実行することによっても、達成されることは言うまでもない。この場合、記録媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記録した記録媒体は本発明を構成することになる。

また、コンピュータが読み出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているオペレーティングシステム（ＯＳ）などが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。

さらに、記録媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張カードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた後、そのプログラムコードの指示に基づき、その機能拡張カードや機能拡張ユニットに備わるＣＰＵなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。

本発明を上記記録媒体に適用する場合、その記録媒体には、先に説明したフローチャートに対応するプログラムコードが格納されることになる。

本実施形態に係る画像処理装置に適用可能なコンピュータの機能構成を示すブロック図である。画像中に含まれている被写体を検出するための処理のフローチャートである。本発明の実施形態に係る画像処理装置に適用可能なコンピュータのハードウェア構成を示す図である。様々なサイズの縮小画像について、顔のパターンを検出するための処理を説明する図である。所定領域内のパターンを識別する為のニューラルネットワークの動作について示した図である。様々な判別器で判別された結果を示す図である。近傍候補領域について説明する図である。

Claims

画像から所定の被写体を検出する画像処理方法であって、
前記画像の輝度成分で構成される輝度画像を生成する生成工程と、
前記輝度画像を再帰的に縮小することで、複数枚の縮小画像を生成する縮小工程と、
それぞれの縮小画像について、所定の被写体とおぼしき領域を検出する第１の検出工程と、
前記第１の検出工程で検出したそれぞれの領域について、当該領域を包含する近傍領域を設定する設定工程と、
前記設定工程で設定したそれぞれの近傍領域について、当該近傍領域内で前記所定の被写体とおぼしき領域を検出する第２の検出工程と
を備えることを特徴とする画像処理方法。
前記第１の検出工程ではそれぞれの縮小画像について、
縮小画像上の各位置に所定サイズの矩形を配置した場合に、それぞれの位置における矩形内の輝度分布を正規化する第１の計算工程と、
矩形内の輝度分布を正規化した結果に基づいて、当該矩形内の領域が前記所定の被写体とおぼしき領域であるのかを判断する処理を、それぞれの位置における矩形について行う第１の判断工程と
を備えることを特徴とする請求項１に記載の画像処理方法。
前記第２の検出工程では、
前記設定工程で設定したそれぞれの近傍領域について、当該近傍領域内の輝度分布を正規化する第２の計算工程と、
輝度分布を正規化した近傍領域上の各位置に所定サイズの矩形を配置した場合に、それぞれの位置における矩形のうち、何れの矩形内の領域が前記所定の被写体とおぼしき領域であるのかを判断する第２の判断工程と
を備えることを特徴とする請求項１又は２に記載の画像処理方法。
前記所定の被写体は、人間の顔であることを特徴とする請求項１乃至３の何れか１項に記載の画像処理方法。
画像から所定の被写体を検出する画像処理装置であって、
前記画像の輝度成分で構成される輝度画像を生成する生成手段と、
前記輝度画像を再帰的に縮小することで、複数枚の縮小画像を生成する縮小手段と、
それぞれの縮小画像について、所定の被写体とおぼしき領域を検出する第１の検出手段と、
前記第１の検出手段によって検出したそれぞれの領域について、当該領域を包含する近傍領域を設定する設定手段と、
前記設定手段によって設定したそれぞれの近傍領域について、当該近傍領域内で前記所定の被写体とおぼしき領域を検出する第２の検出手段と
を備えることを特徴とする画像処理装置。
コンピュータに請求項１乃至４の何れか１項に記載の画像処理方法を実行させることを特徴とするプログラム。
請求項６に記載のプログラムを格納したことを特徴とする、コンピュータ読み取り可能な記憶媒体。