JP2007026308A - 画像処理方法、画像処理装置 - Google Patents

画像処理方法、画像処理装置 Download PDF

Info

Publication number
JP2007026308A
JP2007026308A JP2005210302A JP2005210302A JP2007026308A JP 2007026308 A JP2007026308 A JP 2007026308A JP 2005210302 A JP2005210302 A JP 2005210302A JP 2005210302 A JP2005210302 A JP 2005210302A JP 2007026308 A JP2007026308 A JP 2007026308A
Authority
JP
Japan
Prior art keywords
image
predetermined
processing
value
threshold
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2005210302A
Other languages
English (en)
Inventor
Yumi Watabe
由美 渡部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2005210302A priority Critical patent/JP2007026308A/ja
Publication of JP2007026308A publication Critical patent/JP2007026308A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

【課題】 画像中の被写体を正確に検出するための技術を提供すること。
【解決手段】 縮小画像から抽出した照合パターンの抽出位置と、この照合パターンのサイズとに基づいて閾値を求め(S109)、照合パターンが顔であると判断し(S106)、且つ求めた閾値が所定の値よりも大きい場合に、この照合パターンが顔の領域であると判断する(S110)。
【選択図】 図2

Description

本発明は、画像から検出対象を検出するための技術に関するものである。
画像から特定の被写体パターンを自動的に検出する画像処理方法は非常に有用であり、このような画像処理方法は例えば、人間の顔を検出するために利用することができる。このような方法は、通信会議、マン・マシン・インタフェース、セキュリティ、人間の顔を追跡するためのモニタ・システム、画像圧縮などの多くの分野で使用することができる。このような画像中から顔を検出する技術としては、例えば、非特許文献1に各種方式が挙げられている。その中では、いくつかの顕著な特徴(2つの目、口、鼻など)とその特徴間の固有の幾何学的位置関係とを利用するか、又は人間の顔の対称的特徴、人間の顔色の特徴、テンプレート・マッチング、ニューラル・ネットワークなどを利用することによって、人間の顔を検出する方式が示されている。
例えば、非特許文献2で提案されている方式は、ニューラル・ネットワークにより画像中の顔パターンを検出する方法である。以下、非特許文献2による顔検出の方法について簡単に説明する。
まず、顔を含む画像をメモリに読み込み、この画像から、顔と照合する所定の領域を切り出す。そして、切り出した領域を構成する各画素の画素値の分布を入力としてニューラル・ネットワークによる演算で一つの出力を得る。
このとき、ニューラル・ネットワークの重み、閾値は、膨大な顔画像パターンと非顔画像パターンによりあらかじめ学習されており、このようなニューラル・ネットワークを用いれば、例えば、ニューラル・ネットワークの出力が0以上なら顔、それ以外は非顔であると判別することができる。
そして、ニューラル・ネットワークの入力である顔と照合する画像パターンの切り出し位置を、例えば、画像全域から縦横順次に走査していくことにより、画像中から顔を検出する。
また、様々な大きさの顔の検出に対応するため、読み込んだ画像を所定の割合で順次縮小し、それぞれに対して、前述した顔検出の走査を行うようにしている。
特に、誤検出により、重なった顔の検出結果が出力される場合や、画像の周辺で背景パターンの組合せによって発生することがある。非特許文献2では、顔か非顔かを判別するための閾値は画像の内容によらず一定の値として設定されている。
しかしながら、上記手法では、適切な閾値を設定することができなければ、誤検出は減少しない。
IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE, VOL.24 , NO.1, JANUARY 2002、"Detecting Faces in Images: A Survey" IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE, VOL.20 , NO.1, JANUARY 1998、"Neural network-based face detection"
本発明は以上の問題に鑑みてなされたものであり、画像中の被写体を正確に検出するための技術を提供することを目的とする。
本発明の目的を達成するために、例えば、本発明の画像処理方法は以下の構成を備える。
即ち、画像から所定の被写体を検出する画像処理方法であって、
前記画像の輝度成分で構成される輝度画像を生成する生成工程と、
前記輝度画像を再帰的に縮小することで、複数枚の縮小画像を生成する縮小工程と、
縮小画像から所定サイズの領域毎に部分領域を抽出する抽出工程と、
前記抽出工程で抽出した部分領域の抽出位置と、当該抽出した部分領域のサイズとに基づいて閾値を求める閾値計算工程と、
前記部分領域が前記所定の被写体であるか否かを判断する第1の判断工程と、
前記第1の判断工程で前記部分領域が前記所定の被写体であると判断された場合、前記閾値と所定の値との大小比較を行い、前記閾値が当該所定の値以上であれば、前記部分領域が前記所定の被写体の領域であると判断する第2の判断工程と、
前記縮小工程で生成したそれぞれの縮小画像について、前記抽出工程による処理、前記閾値計算工程による処理、前記値計算工程による処理、前記第1,2の判断工程による処理、を繰り返す繰り返し工程と
を備えることを特徴とする。
本発明の目的を達成するために、例えば、本発明の画像処理方法は以下の構成を備える。
即ち、画像から所定の被写体を検出する画像処理方法であって、
前記画像の輝度成分で構成される輝度画像を生成する生成工程と、
前記輝度画像を再帰的に縮小することで、複数枚の縮小画像を生成する縮小工程と、
縮小画像から所定サイズの領域毎に部分領域を抽出する抽出工程と、
前記抽出工程で抽出した部分領域の抽出位置に基づいて閾値を求める閾値計算工程と、
前記部分領域が前記所定の被写体であるか否かを判断する第1の判断工程と、
前記第1の判断工程で前記部分領域が前記所定の被写体であると判断された場合、前記閾値と所定の値との大小比較を行い、前記閾値が当該所定の値以上であれば、前記部分領域が前記所定の被写体の領域であると判断する第2の判断工程と、
前記縮小工程で生成したそれぞれの縮小画像について、前記抽出工程による処理、前記閾値計算工程による処理、前記値計算工程による処理、前記第1,2の判断工程による処理、を繰り返す繰り返し工程と
を備えることを特徴とする。
本発明の目的を達成するために、例えば、本発明の画像処理方法は以下の構成を備える。
即ち、画像から所定の被写体を検出する画像処理方法であって、
前記画像の輝度成分で構成される輝度画像を生成する生成工程と、
前記輝度画像を再帰的に縮小することで、複数枚の縮小画像を生成する縮小工程と、
縮小画像から所定サイズの領域毎に部分領域を抽出する抽出工程と、
前記抽出工程で抽出した部分領域のサイズに基づいて閾値を求める閾値計算工程と、
前記部分領域が前記所定の被写体であるか否かを判断する第1の判断工程と、
前記第1の判断工程で前記部分領域が前記所定の被写体であると判断された場合、前記閾値と所定の値との大小比較を行い、前記閾値が当該所定の値以上であれば、前記部分領域が前記所定の被写体の領域であると判断する第2の判断工程と、
前記縮小工程で生成したそれぞれの縮小画像について、前記抽出工程による処理、前記閾値計算工程による処理、前記値計算工程による処理、前記第1,2の判断工程による処理、を繰り返す繰り返し工程と
を備えることを特徴とする。
本発明の目的を達成するために、例えば、本発明の画像処理装置は以下の構成を備える。
即ち、画像から所定の被写体を検出する画像処理装置であって、
前記画像の輝度成分で構成される輝度画像を生成する生成手段と、
前記輝度画像を再帰的に縮小することで、複数枚の縮小画像を生成する縮小手段と、
縮小画像から所定サイズの領域毎に部分領域を抽出する抽出手段と、
前記抽出手段によって抽出した部分領域の抽出位置と、当該抽出した部分領域のサイズとに基づいて閾値を求める閾値計算手段と、
前記部分領域が前記所定の被写体であるか否かを判断する第1の判断手段と、
前記第1の判断手段によって前記部分領域が前記所定の被写体であると判断された場合、前記閾値と所定の値との大小比較を行い、前記閾値が当該所定の値以上であれば、前記部分領域が前記所定の被写体の領域であると判断する第2の判断手段と、
前記縮小手段によって生成したそれぞれの縮小画像について、前記抽出手段による処理、前記閾値計算手段による処理、前記値計算手段による処理、前記第1,2の判断手段による処理、を繰り返す繰り返し手段と
を備えることを特徴とする。
本発明の目的を達成するために、例えば、本発明の画像処理装置は以下の構成を備える。
即ち、画像から所定の被写体を検出する画像処理装置であって、
前記画像の輝度成分で構成される輝度画像を生成する生成手段と、
前記輝度画像を再帰的に縮小することで、複数枚の縮小画像を生成する縮小手段と、
縮小画像から所定サイズの領域毎に部分領域を抽出する抽出手段と、
前記抽出手段によって抽出した部分領域の抽出位置に基づいて閾値を求める閾値計算手段と、
前記部分領域が前記所定の被写体であるか否かを判断する第1の判断手段と、
前記第1の判断手段によって前記部分領域が前記所定の被写体であると判断された場合、前記閾値と所定の値との大小比較を行い、前記閾値が当該所定の値以上であれば、前記部分領域が前記所定の被写体の領域であると判断する第2の判断手段と、
前記縮小手段によって生成したそれぞれの縮小画像について、前記抽出手段による処理、前記閾値計算手段による処理、前記値計算手段による処理、前記第1,2の判断手段による処理、を繰り返す繰り返し手段と
を備えることを特徴とする。
本発明の目的を達成するために、例えば、本発明の画像処理装置は以下の構成を備える。
即ち、画像から所定の被写体を検出する画像処理装置であって、
前記画像の輝度成分で構成される輝度画像を生成する生成手段と、
前記輝度画像を再帰的に縮小することで、複数枚の縮小画像を生成する縮小手段と、
縮小画像から所定サイズの領域毎に部分領域を抽出する抽出手段と、
前記抽出手段によって抽出した部分領域のサイズに基づいて閾値を求める閾値計算手段と、
前記部分領域が前記所定の被写体であるか否かを判断する第1の判断手段と、
前記第1の判断手段によって前記部分領域が前記所定の被写体であると判断された場合、前記閾値と所定の値との大小比較を行い、前記閾値が当該所定の値以上であれば、前記部分領域が前記所定の被写体の領域であると判断する第2の判断手段と、
前記縮小手段によって生成したそれぞれの縮小画像について、前記抽出手段による処理、前記閾値計算手段による処理、前記値計算手段による処理、前記第1,2の判断手段による処理、を繰り返す繰り返し手段と
を備えることを特徴とする。
本発明の構成により、画像中の被写体を正確に検出することができる。
以下添付図面を参照して、本発明を好適な実施形態に従って詳細に説明する。
[第1の実施形態]
本実施形態に係る画像処理装置は、PC(パーソナルコンピュータ)やWS(ワークステーション)等のコンピュータにより構成されており、ディジタルカメラなどの撮像装置から入力した画像、インターネットなどのネットワークを介して外部機器からダウンロードした画像、CD−ROMやDVD−ROMなどの記憶媒体からの読み出しにより入力した画像など、様々な入力形態で入力した画像中に含まれている所定の被写体を検出する。なお、本実施形態では被写体として人間の顔を用いるが、その他の被写体を用いても良い。
先ず、このような処理を行う本実施形態に係る画像処理装置について説明する。図3は、本実施形態に係る画像処理装置に適用可能なコンピュータのハードウェア構成を示す図である。
201はCPUで、RAM202やROM203に格納されているプログラムやデータを用いてコンピュータ全体の制御を行うと共に、コンピュータが行う後述の各処理を実行する。
202はRAMで、外部記憶装置207や記憶媒体ドライブ装置208から読み出したプログラムやデータを一時的に記憶するためのエリア、I/F209を介して外部から受信したデータを一時的に記憶する為のエリア、CPU201が各種の処理を実行する為に用いるワークエリア等、各種のエリアを適宜提供することができる。
203はROMで、ここにブートプログラムや本コンピュータの設定データなどを格納する。
204、205は夫々キーボード、マウスで、コンピュータの操作者が操作することで各種の指示をCPU201に対して入力することができる。
206は表示部で、CRTや液晶画面などにより構成されており、CPU201による処理結果を文字や画像等でもって表示する。
207は外部記憶装置で、例えばハードディスクドライブ装置等の大容量情報記憶装置であって、ここにOS(オペレーティングシステム)や、コンピュータが行う後述の各処理をCPU201に実行させるためのプログラムやデータが格納されており、これらはCPU201による制御に従って適宜RAM202に読み出される。
208は記憶媒体ドライブ装置で、CD−ROMやDVD−ROMなどの記憶媒体に記録されているプログラムやデータを読み出して、RAM202や外部記憶装置207に出力する。なお、上記外部記憶装置207に記憶されているプログラムやデータの一部を上記記憶媒体に記録しておいても良く、その場合には、これら記憶されているプログラムやデータを使用する際に、記憶媒体ドライブ装置208がこの記憶媒体に記録されているプログラムやデータを読み出して、RAM202に出力する。
209はI/F(インターフェース)で、ここにディジタルカメラやインターネットやLANのネットワーク回線等を接続することができる。
210は上述の各部を繋ぐバスである。
なお、コンピュータへの画像の入力形態については特に限定するものではなく、様々な形態が考えられる。
図1は、本実施形態に係る画像処理装置に適用可能なコンピュータの機能構成を示すブロック図である。同図に示す如く、本実施形態に係る画像処理装置は、画像入力部10、画像メモリ20、画像縮小部30、照合パターン抽出部40、輝度正規化部50、閾値設定部60、顔判別部70、顔領域出力部70により構成されている。
画像入力部10は、例えばディジタルスチルカメラ、フィルムスキャナーなどの装置から出力された画像データを受け、後段の画像メモリ20に出力するものである。なお、上述の通り、画像の入力形態については特に限定するものではない。
画像メモリ20は、画像入力部10から出力される画像データを格納するためのメモリである。
画像縮小部30は、先ず、画像メモリ20から受けた画像データの輝度成分で構成される輝度画像を生成する。そして、生成した輝度画像を再帰的に縮小することで、複数枚の縮小画像を生成する。生成したそれぞれの縮小画像(画像メモリ20から受けた画像データに基づいて生成したオリジナルの輝度画像も1/1の縮小画像と解釈すれば、このオリジナルもまた、縮小画像に含めることができる)は順次後段の照合パターン抽出部40に出力する。
照合パターン抽出部40は、画像縮小部30から縮小画像を受けると、この縮小画像上で所定サイズの矩形を移動させながら、この矩形に含まれる部分(画素群)を照合パターンとして順次抽出し、後段の輝度正規化部50に出力する。このような処理は、画像縮小部30から受けたそれぞれの縮小画像について行う。
輝度正規化部50は、照合パターン抽出部40から受けた照合パターンを構成する画素群の輝度分布を正規化する。
閾値設定部60は、照合パターン抽出部40から受けた照合パターンを抽出した縮小画像のサイズを、全ての縮小画像で共通のサイズに正規化し、更にこの正規化の為に縮小画像を変倍した変倍率分だけ照合パターンのサイズも変倍する。即ち、照合パターン抽出部40から受けた照合パターンを抽出した縮小画像のサイズをk倍するのであれば、この照合パターンのサイズもk倍する。
そして、変倍後の縮小画像上における変倍後の照合パターンの位置、及びこの変倍後の照合パターンのサイズに基づいて、顔判別部70で用いる閾値を求める処理を行う。
顔判別部70は、輝度正規化部50から受けた照合パターンが顔パターンであるか、それとも非顔パターンであるのかを判別する処理、及び、顔パターンと判別された照合パターンについて閾値設定部60から受けた閾値を用いて判別する処理を行う。
顔領域出力部80は、顔判別部70が顔パターンであると判別した照合パターンに係る情報を出力する。
以上の各部は、例えば、CPU201の一機能として動作するものである。
次に、CPU201が図1に示した各部として動作することでなされる処理、即ち、画像中に含まれている被写体を検出するための処理について、同処理のフローチャートを示す図2を用いて以下説明する。なお、同図のフローチャートに従った処理をCPU201に実行させるためのプログラムやデータは外部記憶装置207(もしくは記憶媒体ドライブ装置208が読み取り可能な記憶媒体)に保存されており、これをCPU201の制御に従って適宜RAM202にロードし、CPU201がこれを用いて処理を実行することで、コンピュータは以下説明する各処理を実行することになる。
外部記憶装置207や、I/F209を介して外部から画像データが入力されると、CPU201は、これをRAM202内の上記画像メモリ20に相当するエリアに一時的に格納する(ステップS101)。なお、本コンピュータに入力した画像が圧縮されている場合には、これを伸張してからRAM202に一時的に格納する。
本実施形態では、入力された画像データを構成する各画素は、R、G、Bで表現されるものであるとする。従って、CPU201は、ステップS101でRAM202に格納した画像データに基づいて、この画像の輝度成分で構成される画像(輝度画像)、即ち、この画像を構成する各画素の値をこの画素の輝度値に変換した画像を生成する(ステップS102)。なお、ステップS101でRAM202に格納した画像データを構成する各画素がYCrCbで表現されるものである場合には、ステップS102では、Y成分のみを用いて輝度画像を生成する。
次に、CPU201は、生成した輝度画像を再帰的に縮小することで、複数枚の縮小画像を生成する(ステップS103)。例えば、ステップS102で生成した輝度画像(以下の説明上、縮小画像1と呼称する)の縦横のサイズを1/1.2倍した縮小画像2を生成し、次に縮小画像2の縦横のサイズを1/1.2倍した縮小画像3を生成する、というように、複数枚の縮小画像を生成する。これは、以後の処理で顔を抽出する際に、様々な大きさの顔の検出に対応するため複数のサイズの画像データに対して順次検出を行うようにしたためである。なお、生成する縮小画像の枚数については特に限定するものではない。
そして、ステップS104以降では、生成したそれぞれの縮小画像について処理を行う。即ち、ステップS104以降の処理は、生成した縮小画像の数だけ繰り返し行うことになる。
以降の説明では、生成した縮小画像はサイズの大きい順に縮小画像1、縮小画像2、、、、縮小画像Nと呼称するものとし、先ず、縮小画像1について以降の処理を行うものとする。なお、処理の対象として選択する順番については特に限定するものではない。
先ず、CPU201は、縮小画像1上に所定サイズの矩形を配置し、矩形内の画素群を照合パターンとして抽出する(ステップS104)。この矩形は、縮小画像1上の各位置に配置した場合に、それぞれの位置における矩形内の画素群を得るためのものであるので、例えばこの矩形は最初は画像の左上隅に配置する。
次に、ステップS104で抽出した照合パターン内の各画素の輝度分布を正規化する処理を行う(ステップS105)。例えば、ヒストグラム平滑化などの輝度補正を行う。これは、撮像される被写体パターンはその照明条件によって輝度分布が変わるので被写体照合の精度が劣化するのを抑制するためである。
次に、ステップS105で輝度分布が正規化された照合パターン(輝度パターン)が、顔パターン(顔とおぼしきパターン)であるか非顔パターンであるかを判定する。(ステップS106)。そして、この照合パターンが顔パターンであると判定した場合には、処理をステップS107に進める。
図5は、所定領域内のパターンを識別する為のニューラルネットワークの動作について示した図である。同図においてRは、例えば画像上で識別する領域を示すものであり、本実施形態ではこの領域Rを同図に示す如く、3種類の方法にてさらに領域分割し、各ニューロン(Nで示す)への受容野とする。そして、分割された領域の輝度分布を各ニューロンに入力し、中間層での出力が得られる。そして、各ニューロンの出力を出力層のニューロンの入力として最終出力が得られる。
ここで、各ニューロンでは予め学習によって得られた重みと輝度分布との積和演算およびその結果のシグモイド関数による演算が行われる。本実施形態では出力層のニューロンの出力値を顔確率とした(ニューラル・ネットワークの詳細および学習の方法については、上記非特許文献2を参照されたい)。なお、ステップS105で輝度分布が正規化された照合パターンが顔パターンである確率(顔確率)を求める処理についてはこれに限定するものではなく、例えば、Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2001に”Rapid Object Detection using a Boosted Cascade of Simple Features”と題するViolaとJonesによる報告で提案されているAdaBoostによる方式を用いてもよい。
図4は、様々なサイズの縮小画像(本実施形態の場合には縮小画像1、縮小画像2、、、、縮小画像N)について、顔のパターンを検出するための処理を説明する図である。それぞれの縮小画像上の各位置に同じサイズの矩形を配置した場合に、それぞれの位置における矩形内の領域が顔のパターンであるのか否かを判断するために、先ず、同図左側に示す如く、縮小画像の左上隅に矩形を配置し、そこから右側に、上から下に向かって矩形の位置を移動させる。移動させる毎に矩形内の画素群は照合パターンとして顔のパターンの判別に用いられる。
図2に戻って、次に、ステップS105で輝度分布が正規化された照合パターンが顔パターンであるのか否かを判別するために用いる閾値を求めるのであるが、求める閾値は、照合パターンの縮小画像1上における位置と、この照合パターンのサイズとに応じて決まるものである。ここで、上述の通り、ステップS107以降で用いる縮小画像1のサイズは、全ての縮小画像で共通のサイズに正規化すべく、変倍されていると共に、この変倍率分だけ照合パターンのサイズも変倍していることに注意されたい。
以下、閾値を求めるための処理について説明する。
先ず、図2のフローチャートに従った処理を行う前に予め、顔が写っている画像を膨大な数用意し、それぞれの画像のサイズを正規化(正規化サイズは、縮小画像を正規化したときのサイズと略同じであることが好ましい)した上で、それぞれの画像について以下の処理を行う。
先ず、図6に示す如く、画像(人物写真)内で顔の領域をPで示す如く設定する。設定方法としては、例えば、この画像をコンピュータの表示画面上に表示させ、このコンピュータの操作者はマウスなどでもって、目、鼻、口等の顔の器官を含むような領域Pを指定する。若しくは、図7に示す如く、両目の位置より顔の領域を設定してもよい。なお、図7でhは両目の間隔の半分の長さを表す。
これにより、画像中の顔の領域が決定するので、図8に示す如く、顔の領域の中心A(矩形領域の対角線の交点)と画像の中心との距離rを求める。また、顔の領域のサイズm(本実施形態では顔の領域は正方形とするので、その一辺の長さを「サイズ」とする)を求める。
そしてこのようなr、mを求める処理を、用意した全ての画像について行う。これにより、r、mのセットが多数得られ、r、mのそれぞれの出現頻度を求めることができる。
図9Aは、求めた多数のrのヒストグラムの例を示した図である。同図では、距離rが0〜r1である頻度、r1〜r2である頻度、、、というヒストグラムを示している。
図9Bは、求めた多数のmのヒストグラムの例を示した図である。同図では、サイズmが0〜m1である頻度、m1〜m2である頻度、、、というヒストグラムを示している。
図9Aに示す如く、顔の領域は、画像の中心に近いほど多く位置している。また、図9Bに示す如く、顔の領域のサイズは、極端に大きくもなく、小さくもない。即ち、上半身ポートレートから全身のスナップ写真でなどでは様々な大きさを持つが、画像に対して小さすぎる顔や大きい顔はあまり存在しないことを示している。
次に、このようにして求めた2つのヒストグラムを用いて、rに対する閾値関数th1(r)、mに対する閾値関数th2(m)を求める。
先ず、閾値関数th1(r)を求める為の処理について説明する。先ず、図9Aに示すようなヒストグラムが得られた場合、それぞれ区間の出現頻度(区間0〜r1の出現頻度、区間r1〜r2の出現頻度、、、)を最大の出現頻度(区間0〜r1の出現頻度、区間r1〜r2の出現頻度、、、のうち最大の出現頻度)でもって除算することでそれぞれの区間の出現頻度を正規化し、正規化したそれぞれの区間の出現頻度の逆数を、それぞれの区間の関数値とする。
即ち、最大の出現頻度をRとすると、区間r(i−1)〜ri (i=2〜n)の出現頻度をRで除算し、正規化する。そして正規化した出現頻度の逆数を区間r(i−1)〜riに対する関数値とする。
図10Aは、図9Aに示したヒストグラムを用いて作成した関数値群を示す図である。図10Aにおいて点線部分は図9Aに示したヒストグラムを示しており、黒丸が各区間について求めた関数値を示している。図10Aに示す如く、出現頻度の高い区間ほど、関数値は低い。
そして、それぞれの関数値を用いて、図10Bに示す如く、曲線を求める。図10Bは、図10Aに示したそれぞれの関数値を用いて求めた曲線の例を示す図である。この曲線が閾値関数th1(r)であり、距離rを引数とする関数である。なお、それぞれの関数値を用いて曲線を求めるための手法についてはスプライン関数を用いた手法など、様々なものがあり、特に限定するものではない。
次に、閾値関数th2(m)を求める為の処理について説明する。先ず、図9Bに示すようなヒストグラムが得られた場合、それぞれの区間の出現頻度(区間0〜m1の出現頻度、区間m1〜m2の出現頻度、、、)を最大の出現頻度(区間0〜m1の出現頻度、区間m1〜m2の出現頻度、、、のうち最大の出現頻度)でもって除算することでそれぞれの区間の出現頻度を正規化し、正規化したそれぞれの区間の出現頻度の逆数を、それぞれの区間の関数値とする。
即ち、最大の出現頻度をFとすると、区間m(i−1)〜mi (i=2〜n)の出現頻度をFで除算し、正規化する。そして正規化した出現頻度の逆数を区間m(i−1)〜miに対する関数値とする。
図11Aは、図9Bに示したヒストグラムを用いて作成した関数値群を示す図である。図11Aにおいて点線部分は図9Bに示したヒストグラムを示しており、黒丸が各区間について求めた関数値を示している。図11Aに示す如く、出現頻度の高い区間ほど、関数値は低い。
そして、それぞれの関数値を用いて、図11Bに示す如く、曲線を求める。図11Bは、図11Aに示したそれぞれの関数値を用いて求めた曲線の例を示す図である。この曲線が閾値関数th2(m)であり、サイズmを引数とする関数である。なお、それぞれの関数値を用いて曲線を求めるための手法についてはスプライン関数を用いた手法など、様々なものがあり、特に限定するものではない。
このように、顔パターンであるのか否かを判別するために用いる閾値を人物写真における顔の位置及びサイズの分布から導出することにより、例えば、人物顔の出現確率が比較的高い画像の中心ほど閾値を小さく、また、出現確率が低い大きいサイズの顔ほど、閾値が大きくなるように設定することができる。
以上説明した閾値関数th1(r)、th2(m)は事前に求めておき、この関数を示すデータはステップS107における処理の開始前にはRAM202にロードされている。
図2に戻って、次に、CPU201は、ステップS105で輝度分布が正規化された照合パターン(変倍済み)の中心位置と縮小画像1(変倍済み)の中心位置との距離r1を位置情報として求める(ステップS107)。
次に、ステップS105で輝度分布が正規化された照合パターン(変倍済み)のサイズm1をサイズ情報として求める(ステップS108)。
図12は、ステップS107,S180で求めた距離r1,サイズm1を示す図である。
そして、予め求めた閾値関数th1(r)とステップS107で求めたr1とを用いて、閾値関数th1(r1)の値を求めると共に、予め求めた閾値関数th2(m)とステップS108で求めたm1とを用いて、閾値関数th2(m1)の値を求め、それぞれの積θ
θ=th1(r1)×th2(m1)
を、閾値として求める(ステップS109)。
図13Aは、閾値関数th1(r1)を説明する図で、図13Bは閾値関数th2(m1)を説明する図である。
そして、ステップS109で求めた閾値θがある値αより大きい場合には、ステップS105で輝度分布を正規化した照合パターンが顔パターンであるとすることができるので、処理をステップS111に進め、本フローチャートに従った処理の後、この照合パターンを特定する為に必要な情報をRAM202や外部記憶装置207、I/F209を介して通信可能な外部装置などに対して出力する(ステップS111)。出力する情報としては、例えば、縮小画像1をオリジナルの輝度画像のサイズに変倍すると共に、この変倍率分だけ照合パターンを変倍した場合に、変倍後の照合パターンのサイズ、及び変倍後の縮小画像1上における変倍後の照合パターンの位置、があるが、これに限定するものではない。
図2に戻って、次に処理をステップS112に進め、縮小画像1上における矩形の移動先があるのかをチェックする(ステップS112)。即ち、縮小画像1上における矩形の位置を移動させ、次の位置における矩形内の部分(画素群)を照合パターンとして抽出する処理を行う場合に、移動先が無い場合、例えば、現在の矩形の位置が既に縮小画像1の右下隅の位置であれば、もう矩形の移動は行えない。一方、現在の矩形の位置が既に縮小画像1の右下隅の位置でなければ、矩形の移動を行うことができる。
従って、移動先がある場合には処理をステップS112からステップS113に進め、縮小画像1上における矩形の位置を移動させる(ステップS113)。そして矩形の移動が完了すると、処理をステップS104に進め、移動後の矩形内における照合パターンを抽出し、以降の処理を行う。
一方、矩形の移動先がない場合には、処理をステップS114に進め、全ての縮小画像について以上の処理を行ったのかを判断し(ステップS114)、まだ処理対象となっていない縮小画像がある場合には処理をステップS115に進め、縮小画像上に配置する矩形の位置を初期化(例えば縮小画像の左上隅の位置に戻す)し(ステップS115)、次の縮小画像についてステップS104以降の処理を行う。
本実施形態では現在縮小画像1について処理を行ったので、次は縮小画像2について処理を行う。よってこの場合には、縮小画像2上の左上隅の位置に矩形を配置し(ステップS115)、この縮小画像2についてステップS104以降の処理を行う。
よって、縮小画像n(n≧2)についてステップS104以降の処理を行うことで、縮小画像n上において照合パターンを抽出した領域の位置、サイズに基づいてこの照合パターンが顔パターンであるのか否かを判別する為に用いる閾値を求めることができ、求めた閾値でもってこの判別の処理を行うことができる。
以上の説明により、本実施形態によれば、画像中の照合パターンが顔パターンであるか否かを判別する際に用いる閾値は、この画像中における照合パターンの位置、及びサイズに応じて適宜変更することができる。その結果、この閾値を用いて顔判別処理を行うことで、画像中の照合パターンの位置が「顔パターンが高い頻度で出現する位置」であるほど、また、この照合パターンのサイズが「顔パターンが高い頻度で取るサイズ」であるほど、この照合パターンが顔パターンであると判別する確率が高くなり、より正確に顔パターンであるか否かを判別することができる。
[第2の実施形態]
第1の実施形態では、ステップS106で、照合パターンが顔パターンである度合いを示す指標として「顔確率」を求めたが、この指標に適当なものは第1の実施形態でも説明したとおり、様々なものが考えられ、これに限定するものではない。
また、第1の実施形態では、閾値θを、閾値関数th1(r)と閾値関数th2(m)との積でもって求めていた。これは、距離rとサイズmとの両方を考慮したものであるが、一方のみを考慮しても良い。即ち、閾値関数th1(r)の値をそのまま閾値θとして用いるようにしても良いし、閾値関数th2(m)の値をそのまま閾値関数θとして用いるようにしても良い。
また、閾値関数を求めるための手法については様々なものが考えられ、第1の実施形態で説明した方法に限定するものではないが、距離rが大きいほど閾値が大きくなるように、且つ距離rが小さくなるほど閾値が小さくなるような閾値と距離との関係式を用いて閾値を求めればよい。また、サイズmが極端に大きい、若しくは小さいほど閾値が大きくなるように、且つサイズmがその中間であるほど閾値が小さくなるような閾値とサイズとの関係式を用いて閾値を求めればよい。
また、閾値関数th1(r)では、距離を引数としていたが、位置を引数とするようにしても良い。即ち、図14Aに示す如く、距離rの代わりに、顔の領域の位置(x、y)を求める。そして、閾値関数th3(x、y)は、図14Bに示す如く、画像中で顔の領域が位置する頻度が高い座標値に近いほど低い値(同図において暗い領域ほど、関数値は低い)を取るよう、構成される。そして、この閾値関数th3(x、y)を上記閾値関数th1(r)の代わりに用いる。
また、位置r及びサイズmの2つを引数とする関数th(r,m)として設定する方法も挙げられる。
[その他の実施形態]
また、本発明の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記録媒体(または記憶媒体)を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記録媒体に格納されたプログラムコードを読み出し実行することによっても、達成されることは言うまでもない。この場合、記録媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記録した記録媒体は本発明を構成することになる。
また、コンピュータが読み出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているオペレーティングシステム(OS)などが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
さらに、記録媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張カードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた後、そのプログラムコードの指示に基づき、その機能拡張カードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
本発明を上記記録媒体に適用する場合、その記録媒体には、先に説明したフローチャートに対応するプログラムコードが格納されることになる。
本発明の第1の実施形態に係る画像処理装置に適用可能なコンピュータの機能構成を示すブロック図である。 画像中に含まれている被写体を検出するための処理のフローチャートである。 本発明の第1の実施形態に係る画像処理装置に適用可能なコンピュータのハードウェア構成を示す図である。 様々なサイズの縮小画像(本実施形態の場合には縮小画像1、縮小画像2、、、、縮小画像N)について、顔のパターンを検出するための処理を説明する図である。 所定領域内のパターンを識別する為のニューラルネットワークの動作について示した図である。 顔の領域設定を説明する図である。 顔の領域設定を説明する図である。 顔の領域の位置、サイズを説明する図である。 求めた多数のrのヒストグラムの例を示した図である。 求めた多数のmのヒストグラムの例を示した図である。 図9Aに示したヒストグラムを用いて作成した関数値群を示す図である。 図10Aに示したそれぞれの関数値を用いて求めた曲線の例を示す図である。 図9Bに示したヒストグラムを用いて作成した関数値群を示す図である。 図11Aに示したそれぞれの関数値を用いて求めた曲線の例を示す図である。 ステップS107,S180で求めた距離r1,サイズm1を示す図である。 閾値関数th1(r1)を説明する図である。 閾値関数th2(m1)を説明する図である。 顔の領域の位置を説明する図である。 閾値関数th3(x、y)を説明する図である。

Claims (11)

  1. 画像から所定の被写体を検出する画像処理方法であって、
    前記画像の輝度成分で構成される輝度画像を生成する生成工程と、
    前記輝度画像を再帰的に縮小することで、複数枚の縮小画像を生成する縮小工程と、
    縮小画像から所定サイズの領域毎に部分領域を抽出する抽出工程と、
    前記抽出工程で抽出した部分領域の抽出位置と、当該抽出した部分領域のサイズとに基づいて閾値を求める閾値計算工程と、
    前記部分領域が前記所定の被写体であるか否かを判断する第1の判断工程と、
    前記第1の判断工程で前記部分領域が前記所定の被写体であると判断された場合、前記閾値と所定の値との大小比較を行い、前記閾値が当該所定の値以上であれば、前記部分領域が前記所定の被写体の領域であると判断する第2の判断工程と、
    前記縮小工程で生成したそれぞれの縮小画像について、前記抽出工程による処理、前記閾値計算工程による処理、前記値計算工程による処理、前記第1,2の判断工程による処理、を繰り返す繰り返し工程と
    を備えることを特徴とする画像処理方法。
  2. 前記閾値計算工程は、
    前記縮小画像のサイズを前記複数枚の縮小画像のそれぞれで共通のサイズに正規化すると共に、当該正規化のために前記縮小画像のサイズを変倍した変倍率分だけ、前記部分領域のサイズを変倍する変倍工程と、
    前記変倍工程でサイズを変倍した前記部分領域の中心位置と、前記変倍工程でサイズを変倍した前記縮小画像の中心位置との距離に基づいて決まる第1の値を求める第1の工程と、
    前記変倍工程でサイズを変倍した前記部分領域のサイズで決まる第2の値を求める第2の工程とを備え、
    前記第1の値と前記第2の値との積を、前記閾値として求めることを特徴とする請求項1に記載の画像処理方法。
  3. 前記第1の工程では、
    前記所定の被写体を含む画像に対して所定の指示手段でもって指定した前記所定の被写体の領域の中心位置と、当該画像の中心位置との距離を、前記所定の被写体を含み、サイズが同じ複数の画像について求めることで得られる、それぞれの距離と当該それぞれの距離の出現頻度との関係に基づいて、前記第1の値を求めることを特徴とする請求項2に記載の画像処理方法。
  4. 前記第2の工程では、
    前記所定の被写体を含む画像に対して所定の指示手段でもって指定した前記所定の被写体の領域のサイズを、前記所定の被写体を含み、サイズが同じ複数の画像について求めることで得られる、それぞれのサイズと当該それぞれのサイズの出現頻度との関係に基づいて、前記第2の値を求めることを特徴とする請求項2に記載の画像処理方法。
  5. 画像から所定の被写体を検出する画像処理方法であって、
    前記画像の輝度成分で構成される輝度画像を生成する生成工程と、
    前記輝度画像を再帰的に縮小することで、複数枚の縮小画像を生成する縮小工程と、
    縮小画像から所定サイズの領域毎に部分領域を抽出する抽出工程と、
    前記抽出工程で抽出した部分領域の抽出位置に基づいて閾値を求める閾値計算工程と、
    前記部分領域が前記所定の被写体であるか否かを判断する第1の判断工程と、
    前記第1の判断工程で前記部分領域が前記所定の被写体であると判断された場合、前記閾値と所定の値との大小比較を行い、前記閾値が当該所定の値以上であれば、前記部分領域が前記所定の被写体の領域であると判断する第2の判断工程と、
    前記縮小工程で生成したそれぞれの縮小画像について、前記抽出工程による処理、前記閾値計算工程による処理、前記値計算工程による処理、前記第1,2の判断工程による処理、を繰り返す繰り返し工程と
    を備えることを特徴とする画像処理方法。
  6. 画像から所定の被写体を検出する画像処理方法であって、
    前記画像の輝度成分で構成される輝度画像を生成する生成工程と、
    前記輝度画像を再帰的に縮小することで、複数枚の縮小画像を生成する縮小工程と、
    縮小画像から所定サイズの領域毎に部分領域を抽出する抽出工程と、
    前記抽出工程で抽出した部分領域のサイズに基づいて閾値を求める閾値計算工程と、
    前記部分領域が前記所定の被写体であるか否かを判断する第1の判断工程と、
    前記第1の判断工程で前記部分領域が前記所定の被写体であると判断された場合、前記閾値と所定の値との大小比較を行い、前記閾値が当該所定の値以上であれば、前記部分領域が前記所定の被写体の領域であると判断する第2の判断工程と、
    前記縮小工程で生成したそれぞれの縮小画像について、前記抽出工程による処理、前記閾値計算工程による処理、前記値計算工程による処理、前記第1,2の判断工程による処理、を繰り返す繰り返し工程と
    を備えることを特徴とする画像処理方法。
  7. 画像から所定の被写体を検出する画像処理装置であって、
    前記画像の輝度成分で構成される輝度画像を生成する生成手段と、
    前記輝度画像を再帰的に縮小することで、複数枚の縮小画像を生成する縮小手段と、
    縮小画像から所定サイズの領域毎に部分領域を抽出する抽出手段と、
    前記抽出手段によって抽出した部分領域の抽出位置と、当該抽出した部分領域のサイズとに基づいて閾値を求める閾値計算手段と、
    前記部分領域が前記所定の被写体であるか否かを判断する第1の判断手段と、
    前記第1の判断手段によって前記部分領域が前記所定の被写体であると判断された場合、前記閾値と所定の値との大小比較を行い、前記閾値が当該所定の値以上であれば、前記部分領域が前記所定の被写体の領域であると判断する第2の判断手段と、
    前記縮小手段によって生成したそれぞれの縮小画像について、前記抽出手段による処理、前記閾値計算手段による処理、前記値計算手段による処理、前記第1,2の判断手段による処理、を繰り返す繰り返し手段と
    を備えることを特徴とする画像処理装置。
  8. 画像から所定の被写体を検出する画像処理装置であって、
    前記画像の輝度成分で構成される輝度画像を生成する生成手段と、
    前記輝度画像を再帰的に縮小することで、複数枚の縮小画像を生成する縮小手段と、
    縮小画像から所定サイズの領域毎に部分領域を抽出する抽出手段と、
    前記抽出手段によって抽出した部分領域の抽出位置に基づいて閾値を求める閾値計算手段と、
    前記部分領域が前記所定の被写体であるか否かを判断する第1の判断手段と、
    前記第1の判断手段によって前記部分領域が前記所定の被写体であると判断された場合、前記閾値と所定の値との大小比較を行い、前記閾値が当該所定の値以上であれば、前記部分領域が前記所定の被写体の領域であると判断する第2の判断手段と、
    前記縮小手段によって生成したそれぞれの縮小画像について、前記抽出手段による処理、前記閾値計算手段による処理、前記値計算手段による処理、前記第1,2の判断手段による処理、を繰り返す繰り返し手段と
    を備えることを特徴とする画像処理装置。
  9. 画像から所定の被写体を検出する画像処理装置であって、
    前記画像の輝度成分で構成される輝度画像を生成する生成手段と、
    前記輝度画像を再帰的に縮小することで、複数枚の縮小画像を生成する縮小手段と、
    縮小画像から所定サイズの領域毎に部分領域を抽出する抽出手段と、
    前記抽出手段によって抽出した部分領域のサイズに基づいて閾値を求める閾値計算手段と、
    前記部分領域が前記所定の被写体であるか否かを判断する第1の判断手段と、
    前記第1の判断手段によって前記部分領域が前記所定の被写体であると判断された場合、前記閾値と所定の値との大小比較を行い、前記閾値が当該所定の値以上であれば、前記部分領域が前記所定の被写体の領域であると判断する第2の判断手段と、
    前記縮小手段によって生成したそれぞれの縮小画像について、前記抽出手段による処理、前記閾値計算手段による処理、前記値計算手段による処理、前記第1,2の判断手段による処理、を繰り返す繰り返し手段と
    を備えることを特徴とする画像処理装置。
  10. コンピュータに請求項1乃至6の何れか1項に記載の画像処理方法を実行させるためのプログラム。
  11. 請求項10に記載のプログラムを格納したことを特徴とする、コンピュータ読み取り可能な記憶媒体。
JP2005210302A 2005-07-20 2005-07-20 画像処理方法、画像処理装置 Withdrawn JP2007026308A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005210302A JP2007026308A (ja) 2005-07-20 2005-07-20 画像処理方法、画像処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005210302A JP2007026308A (ja) 2005-07-20 2005-07-20 画像処理方法、画像処理装置

Publications (1)

Publication Number Publication Date
JP2007026308A true JP2007026308A (ja) 2007-02-01

Family

ID=37786952

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005210302A Withdrawn JP2007026308A (ja) 2005-07-20 2005-07-20 画像処理方法、画像処理装置

Country Status (1)

Country Link
JP (1) JP2007026308A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011008704A (ja) * 2009-06-29 2011-01-13 Canon Inc 画像処理装置、画像処理方法、およびプログラム
US8463049B2 (en) 2007-07-05 2013-06-11 Sony Corporation Image processing apparatus and image processing method
JP2018068863A (ja) * 2016-11-02 2018-05-10 カリーナシステム株式会社 ガーゼ検出システム
CN113686867A (zh) * 2021-07-15 2021-11-23 昆山丘钛微电子科技股份有限公司 一种点胶质量检测方法、装置、介质及摄像头调焦机
US11488304B2 (en) 2018-05-01 2022-11-01 Eizo Corporation Gauze detection system and gauze detection method
WO2024111476A1 (ja) * 2022-11-25 2024-05-30 ソニーセミコンダクタソリューションズ株式会社 情報処理方法、ニューラルネットワーク、情報処理装置、情報処理システム

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8463049B2 (en) 2007-07-05 2013-06-11 Sony Corporation Image processing apparatus and image processing method
JP2011008704A (ja) * 2009-06-29 2011-01-13 Canon Inc 画像処理装置、画像処理方法、およびプログラム
US8849035B2 (en) 2009-06-29 2014-09-30 Canon Kabushiki Kaisha Image processing apparatus image processing method, and control program to perform face-detection processing
JP2018068863A (ja) * 2016-11-02 2018-05-10 カリーナシステム株式会社 ガーゼ検出システム
US11488304B2 (en) 2018-05-01 2022-11-01 Eizo Corporation Gauze detection system and gauze detection method
CN113686867A (zh) * 2021-07-15 2021-11-23 昆山丘钛微电子科技股份有限公司 一种点胶质量检测方法、装置、介质及摄像头调焦机
WO2024111476A1 (ja) * 2022-11-25 2024-05-30 ソニーセミコンダクタソリューションズ株式会社 情報処理方法、ニューラルネットワーク、情報処理装置、情報処理システム

Similar Documents

Publication Publication Date Title
US7376270B2 (en) Detecting human faces and detecting red eyes
EP3916627A1 (en) Living body detection method based on facial recognition, and electronic device and storage medium
US8401250B2 (en) Detecting objects of interest in still images
US7925093B2 (en) Image recognition apparatus
US11915518B2 (en) Facial authentication device, facial authentication method, and program recording medium
US7657086B2 (en) Method and apparatus for automatic eyeglasses detection using a nose ridge mask
US20040264744A1 (en) Speedup of face detection in digital images
US20080219558A1 (en) Adaptive Scanning for Performance Enhancement in Image Detection Systems
JP5361524B2 (ja) パターン認識システム及びパターン認識方法
US7831068B2 (en) Image processing apparatus and method for detecting an object in an image with a determining step using combination of neighborhoods of a first and second region
JP2005190400A (ja) 顔画像検出方法及び顔画像検出システム並びに顔画像検出プログラム
US20220012474A1 (en) Evaluating The Security Of A Facial Recognition System Using Light Projections
JP2007025902A (ja) 画像処理装置、画像処理方法
JP2007026308A (ja) 画像処理方法、画像処理装置
US11462052B2 (en) Image processing device, image processing method, and recording medium
JP2006323779A (ja) 画像処理方法、画像処理装置
JP2010176504A (ja) 画像処理装置、画像処理方法及びプログラム
KR20110019969A (ko) 얼굴 검출 장치
Talele et al. Face detection and geometric face normalization
JP2007025901A (ja) 画像処理装置、画像処理方法
JP4789526B2 (ja) 画像処理装置、画像処理方法
CN114038030A (zh) 图像篡改识别方法、设备及计算机存储介质
JP2013029996A (ja) 画像処理装置
JP2005209137A (ja) 対象物認識方法及び対象物認識装置、並びに顔方向識別装置
JP2008102610A (ja) 画像処理装置

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20081007