JP5389592B2 - 特定被写体検出方法及び装置 - Google Patents

特定被写体検出方法及び装置 Download PDF

Info

Publication number
JP5389592B2
JP5389592B2 JP2009226054A JP2009226054A JP5389592B2 JP 5389592 B2 JP5389592 B2 JP 5389592B2 JP 2009226054 A JP2009226054 A JP 2009226054A JP 2009226054 A JP2009226054 A JP 2009226054A JP 5389592 B2 JP5389592 B2 JP 5389592B2
Authority
JP
Japan
Prior art keywords
image
dictionary data
registered
dictionary
subject
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009226054A
Other languages
English (en)
Other versions
JP2011077753A (ja
Inventor
裕子 児玉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Corp
Original Assignee
Fujifilm Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujifilm Corp filed Critical Fujifilm Corp
Priority to JP2009226054A priority Critical patent/JP5389592B2/ja
Publication of JP2011077753A publication Critical patent/JP2011077753A/ja
Application granted granted Critical
Publication of JP5389592B2 publication Critical patent/JP5389592B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Studio Devices (AREA)

Description

本発明は、撮像された画像の一部の対象領域の画像に対して辞書データに登録した登録画像を照合して被写体の顔を検出する顔検出機能を備えたカメラの顔検出方法及び装置に関するものである。
近年、電子カメラ等の撮像装置においては、被写体の顔を認識する技術が登場したことにより、該認識された顔に対してピントを合わせたり、顔が適正露出となるように露出条件を設定する技術がある(特許文献1)。
しかしながら、従来の顔認識は、人間の顔、それも正面の顔などある特定の向きから撮像された場合のみを対象としており、横顔やサングラスの装着時などは認識することができなかった。また、人間以外の顔、例えば、猫や犬などの顔は認識することができなかった。
そこで、被写体の顔を認識する顔認識モードを複数種類備え、複数種類の顔認識モードの中からいずれかの種類の顔認識モードを予め設定するようにした撮像装置が知られている(特許文献2)。
特開2007−081991 特開2009−060379
しかしながら、特許文献2に記載の撮像装置では、顔認識モードを予め決めておかないと、所望する被写体の顔を検出することができない。また、最初に決めた顔認識モードで被写体の顔が認識されなかった場合、他の種類のモードに切り替えることが考えられる。顔認識の場合、対象領域の画像に対して登録画像(パターン画像)を照合して顔画像が存在するか否かを判断する。よって、顔認識モードを切り替える場合、被写体の種類毎に用意した辞書データを切り替えることが必要になる。辞書データは、検出精度を上げるために多くの登録画像が登録されており、大容量になっている。辞書データを順番に切り替えて読み出し、シリアル的に照合していくのは、照合処理に時間がかかる。また、辞書データを決まりなくたんに順番に切り替えるのでは、検出対象の辞書データに当たる確立が低く、検出に時間がかかる。電子カメラでは、スルー画像表示中に被写体の顔を検出して、検出結果を顔検出枠等で表示するため、顔検出に時間がかかると、スルー画像表示中の被写体の顔の位置と、顔検出枠の位置とがずれてしまうという問題が生じる。
本発明は、複数の辞書データから特定の辞書データの読み出しを迅速に行え、かつ顔検出の対象となる辞書データを迅速に選択して読み込むように工夫したカメラの顔検出方法及び装置を提供することを目的とする。
一つの観点によれば、特定被写体検出装置は、被写体を撮像する撮像手段と撮像手段により撮像して得られる撮像画像内の一部の対象領域の画像と複数の登録画像とを照合して撮像画像内に含まれる特定被写体の画像を認識する認識手段と、予め決めた被写体の種類毎に登録画像が登録されている辞書データを複数格納している辞書記憶手段と、シャッタレリーズ毎にその時点又は直前で認識手段が特定被写体の画像を認識した時に使用した登録画像を含む被写体の種類を記憶するメモリと、対象領域を撮像画像内で移動する時又撮像画像内の全部を対象領域が移動した後に辞書記憶手段に格納されている複数の辞書データの中から認識手段が照合するための辞書データとしてメモリに記憶される被写体の種類に対応する辞書データを選択する辞書入替え制御手段と、を備えたものである。
別の観点によれば、特定被写体検出方法は、予め決めた被写体の種類毎に複数の登録画像が登録されている辞書データを辞書記憶手段に複数格納しており、被写体を撮像して得られる撮像画像内の一部の対象領域の画像と辞書データに登録されている複数の登録画像とを照合して撮像画像内に含まれる特定被写体の画像を認識するとともに、シャッタレリーズ毎にその時点又は直前で特定被写体の画像を認識した時に使用した登録画像を含む被写体の種類を記憶しておき、対象領域を撮像画像内で移動する時、又は撮像画像内の全部を対象領域が移動した後に、辞書記憶手段に格納されている複数の辞書データの中から、前記記憶した被写体の種類に対応する辞書データを選択する。
また、辞書データ毎に登録画像を読み込むのではなく、各辞書データのそれぞれから登録画像を選択してもよい。この場合には、読み出した登録画像の全ての容量が辞書データのファイルサイズと略同じになるように、各辞書データから選択する登録画像の個数を決めるのが好適である。この場合、各辞書データのファイルサイズが同じで、登録画像の個数も同じと仮定し、辞書データの数を「n」、辞書データに登録している登録画像の数を「X」とすると、X/nの式から算出される個数の登録画像を各辞書データからそれぞれ選択するのが好適である。
この場合、認識手段としては、各辞書データからそれぞれ選択した少量の登録画像を照合するため、検出精度が低くなるおそれがある。そこで、最初の照合(プレ照合)では、各辞書データからそれぞれ選択した少量の登録画像を照合して、一致と判断した登録画像の個数、又は相関度に基づいて被写体の種類を特定し、後の照合(本照合)で、その種類に対応する辞書データの登録画像を全部読み込んで照合して顔検出を行うようにしてもよい。
例えば、前記辞書メモリに格納されている各辞書データから、前記辞書データと略同じファイルサイズとなるように登録画像をそれぞれ選択し、選択した登録画像と、対象領域の画像とを照合し、各照合結果により一致と判断した登録画像の個数、又は類似度に基づいて、次に照合する登録画像が属する辞書データを選択し、その選択により辞書データが一つになるまで辞書データを絞り込むプレ選択手段と;一つに絞り込まれた辞書データに登録されている登録画像を選択する本選択手段と;で構成してもよい。つまり、プレ選択手段は、認識手段での照合結果に基づいて選択した登録画像が、一つの辞書データに属する登録画像になるまでプレ選択をする。
プレ選択としては、絞り込んだ辞書データの数が複数の場合、絞り込んだ各辞書データから、前回辞書メモリから選択した登録画像を含む登録画像を、前記辞書データと略同じファイルサイズとなるようにそれぞれ選択してもよい。
さらに、プレ選択手段は、絞り込んだ辞書データの数が複数の場合、絞り込んだ各辞書データから、前回辞書メモリから選択した登録画像とは異なる登録画像を、前記辞書データと略同じファイルサイズとなるように、それぞれ選択してもよい。
また、シャッタボタンの操作が行われておらず、かつ画像をカメラの外部に設けた画面表示部に表示するスルー画像表示状態のときには、プレ選択手段により選択された登録画像に基づく照合(プレ照合)のみで顔検出を行い、シャッタボタンの半押し操作がなされたときに直前のプレ選択手段により選択された1つの辞書データの登録画像に基づく照合(本照合)を行うようにしてもよい。
本件開示の特定被写体検出方法及び装置では、複数の辞書データの中から照合対象となる辞書データを迅速に選択して特定被写体の画像を正確に検出することができる。
カメラの電気的構成を示すブロック図である。 第2辞書メモリに記録されている辞書データの種類を示す説明図である。 画像表示部に表示されているスルー画像中に顔検出枠を重ねて表示した状態を示す説明図である。 顔検出機能の動作手順を示すフローチャート図である。 対象領域の移動方向を説明する説明図である。 対象領域毎に、第1辞書メモリに読み込まれる辞書データの移り変わりを説明する説明図である。 プレ照合、本照合を行う[第2実施形態]のCPUの構成を示すブロック図である。 図7で説明した登録画像入替え制御部の構成を示すブロック図である。 プレ照合、及び本照合の動作手順を示すフローチャート図である。 プレ照合時に第1辞書メモリに読み込まれる登録画像の内容を説明する説明図である。 プレ照合により一つの辞書に絞り込まれるまでに第1辞書メモリに読み込まれる登録画像の移り変わりを簡単に説明した説明図である。 第1辞書メモリに重複しないように登録画像を読み込むようにした[第3実施形態]の動作手順を示すフローチャート図である。 [第3実施形態]において、プレ照合により一つの辞書に絞り込まれるまでに第1辞書メモリに読み込まれる登録画像の移り変わりを簡単に説明した説明図である。 スルー画像表示中はプレ照合の結果に基づいて顔領域を判定し、シャッタボタンの半押し操作に応答して直前のプレ照合により絞り込まれた辞書データに基づいて本照合を行って顔領域を判定するようにした[第4実施形態]のCPUの構成を示すブロック図である。 図14で説明した第4実施形態での顔検出の動作手順を説明するフローチャート図である。 アダブースティングアルゴリズムを用いた認識処理手段の他の例を示すブロック図である。 図16で説明した認識処理手段を構成する部分画像生成手段がサブウィンドウを走査する様子を示す説明図である。 図16で説明した認識処理手段により検出される正面顔、及び横顔の一例を示す説明図である。 図16で説明した認識処理手段を構成する顔判別器により部分画像から特徴量を抽出する様子を示す説明図である。 図16で説明した認識処理手段を構成する顔判別器が有するヒストグラムの一例を示すグラフである。
[実施形態1]
本発明の撮像装置を内蔵する電子カメラ10は、図1に示すように、撮影レンズ11、レンズ駆動ブロック12、絞り13、CCD14、ドライバ15、TG(timing generator)16、ユニット回路17、画像生成部18、CPU19、操作部20、メモリ21、DRAM22、フラッシュメモリ23、画像表示部24、バス25、第1辞書メモリ27、I/F(インターフェース)28、及び第2辞書メモリ29を備えている。
撮影レンズ11は、複数のレンズ群から構成されるフォーカスレンズ(図示なし)、ズームレンズ(図示なし)等を含む。レンズ駆動ブロック12は、フォーカスレンズ、ズームレンズをそれぞれ光軸方向に沿って駆動させるフォーカスモータ(図示なし)、ズームモータ(図示なし)、CPU19から送られてくる制御信号にしたがってフォーカスモータ、ズームモータを駆動させるフォーカスモータドライバ(図示なし)、及びズームモータドライバ(図示なし)から構成されており、撮影レンズ11の変倍及び合焦を制御する。
絞り13は、図示しない駆動回路を含み、駆動回路はCPU19から送られてくる制御信号にしたがって絞り13を動作させる。絞り13は、撮影レンズ11から入ってくる光の量を制御する。
CCD14は、ドライバ15によって駆動され、一定周期毎に被写体像のRGB値の各色の光の強さを光電変換して撮像信号としてユニット回路17に出力する。このドライバ15、ユニット回路17の動作タイミングはTG16を介してCPU19により制御される。なお、CCD14は、ベイヤー配列の色フィルターを有しており、電子シャッタとしての機能も有する。この電子シャッタのシャッタ速度は、ドライバ15、TG16を介してCPU19によって制御される。
ユニット回路17には、TG16が接続されており、CCD14から出力される撮像信号を相関二重サンプリングして保持するCDS(Correlated Double Sampling)回路、そのサンプリング後の撮像信号の自動利得調整を行なうAGC(Automatic Gain Control)回路、その自動利得調整後のアナログの撮像信号をデジタル信号に変換するA/D変換器から構成されており、CCD14から出力された撮像信号はユニット回路17を経てデジタル信号として画像生成部18に送られる。
画像生成部18は、ユニット回路17から送られてきた画像データに対してγ補正処理、ホワイトバランス処理等の画像処理を施すとともに、輝度色差信号(YUVデータ)を生成する。該生成された輝度色差信号の画像データは、DRAM(バッファメモリ)22に記憶される。
CPU19は、CCD14への撮像制御、画像データの圧縮・伸張処理、フラッシュメモリ23への記録処理、画像データの表示処理を行うスルー画像表示機能、及び顔画像検出機能の一部を有するとともに、電子カメラ10の各部を制御する。また、CPU19は、クロック回路を含み、タイマーとしての機能も有する。
操作部20は、半押し全押し可能なシャッタボタン、電源ボタン、モード切替キー、十字キー、決定キー等の複数の操作キーを含み、ユーザーのキー操作に応じた操作信号をCPU19に出力する。
DRAM22は、CCD14によって撮像された後、CPU19に送られてきた画像データを一時記憶するバッファメモリとして使用されるとともに、CPU19のワーキングメモリとして使用される。フラッシュメモリ23は、圧縮された画像データを保存する記録媒体である。
画像表示部24は、カラーLCDとその駆動回路を含み、撮影待機状態にあるときには、CCD14によって撮像された被写体をスルー画像として表示し、記録画像の再生時には、フラッシュメモリ23から読み出され、伸張された記録画像を表示させる。
顔画像検出機能は、認識処理部30、第1辞書メモリ27、辞書入替え制御部31、及び、条件判定部32、及び第2辞書メモリ29で構成されている。第1辞書メモリ27は、CPU19が直接書き込み及び読み出しが行える少容量で高速な内部メモリである。第1辞書メモリ27としては、一度書き込んだデータは電源を切らないかぎり記憶され、再書き込み(リフレッシュ)の必要がない、例えばSRAM(static random access memory)が望ましい。
第2辞書メモリ29は、第1辞書メモリ27に対して大容量で低速なメモリであり、I/F28、及びバス25を介してCPU19に接続されている。この第2辞書メモリ29としては、例えばDRAMやROMとなっている。なお、I/F28に着脱自在に接続されるカードメモリやUSB等の外部メモリを用いてもよい。第2辞書メモリ29を追記可能のメモリにすることで、記録されている辞書データに対して登録画像の更新や追加を簡便に行える。第1辞書メモリ27、及び第2辞書メモリ29は、辞書記憶手段の一例である。
第2辞書メモリ29には、被写体と検出する種類毎に予め用意した複数の辞書データ、例えば図2に示すように、人物用辞書データ35、犬用辞書データ36、猫用辞書データ37、及び花用辞書データ38等が順に記録されている。各辞書データ35〜38は、登録画像領域、インデックス領域を有している。登録画像領域には、パターンの異なる複数の登録画像(パターン画像)が登録されている。インデックス領域には、各登録画像のアドレスが記録されている。人物用辞書データ35の登録画像は、様々な人物、方向の顔で、特徴点となる瞳、鼻孔等が含まれている一定画素サイズ、例えば30×30ピクセルの登録画像が複数登録されている。犬用辞書データ36や猫用辞書データ37も同様に犬や猫の様々な種類、方向の顔で、特徴点となる目、鼻孔、耳等が含まれている一定画素サイズの登録画像が複数登録されている。花用辞書データ38は、様々な種類、方向の顔で、特徴点となる花びらの位置及び数、花びらの色等を含む一定サイズの登録画像が登録されている。
辞書入替え制御部31は、第2辞書メモリ29に記憶された辞書データ35〜38の格納先のアドレス等を管理しており、アドレスを指定することで第2辞書メモリ29から一つの辞書データ35〜38を選択し、選択した辞書データに記録されている登録画像をアドレス順、又は書き込み順に読み出して、第1辞書メモリ27に書き込む。
認識処理部30は、DRAM22から取り込んだ画像データ(以下「スルー画像」と称す)を、予め指定されたサイズの対象領域でもってラスター走査と同様に走査する。対象領域の画像に対して第1辞書メモリ27に読み込んだ登録画像を順に照合して、両者の相関値(類似度)を調べ、相関値が予め決められた閾値を越える場合に両者が一致と判断し、全照合数(登録画像の数)に対する、一致と判断した登録画像の数の割合(相関スコア)が予め決めた閾値を越える場合に、その対象領域に、辞書データの種類に該当する被写体の顔領域が存在すると認定する。なお、顔領域の大きさの変化に対応するために、前述した照合は、対象領域の画像を段階にスケール変化させて行う。被写体の顔領域は、特定被写体の画像の一例である。
条件判定部32は、電子カメラ10の電源操作を監視しており、電源ボタンがオフされることに応答して、最後の顔検出で検出した被写体の種類に対応する辞書データの種類をメモリ21に記憶し、次回電源ボタンをオンした後の、対象領域をスルー画像内の最初の位置に設定する毎(スルー画像を取り込む毎)、及び対象領域を移動する毎に、メモリ21に記憶した辞書データの種類を読み取り、それに対応する辞書データの登録画像を第1辞書メモリ27に最初に読み出すように、辞書入替え制御部31を制御する。
認識処理部30は、第1辞書メモリ27に読み込んだ登録画像に対して相関スコアが閾値を越えない場合には、辞書入替え制御部31の制御によって入れ替えられた辞書データの登録画像に対して再び照合してゆく。全ての辞書データに対して照合して相関スコアが閾値を越えない場合には、その対象領域には辞書データの種類に相当する被写体が存在しないと判断し、スルー画像の画面内で対象領域の位置を移動して照合していく。
認識処理部30は、スルー画像の画面内の全ての領域を調べた後に、スルー画像の画面内で認定した全ての顔領域の位置、及び大きさの情報を出力する。CPU19は、認識処理部30から取得した顔領域の位置、及び大きさの情報に基づいて、図3に示すように、AFやAEの対象エリアとする顔検出枠39をスルー画像40中に重ねて画像表示部24に表示するように制御する。
上記構成の作用を、図4を参照しながら説明する。電子カメラ10の電源をONにすると、CPU19は、CCD14に所定のフレームレートで被写体を撮像させる。CCD14により順次撮像された画像データは、画像生成部18に取り込まれ、画像生成部18により生成された輝度色差信号の画像データ(フレーム画像データ)がDRAM22に記憶される。DRAM22に記録された画像データに対して表示処理が行われ、表示処理が行われた画像データが画像表示部24に送られてスルー画像として表示される。
また、DRAM22に記憶した画像データに基づくスルー画像は、認識処理部30に取り込まれ、顔検出が行われる。
辞書入替え制御部31は、電子カメラ10の電源ボタンをONした後に、メモリ21に記憶した辞書データの種類、すなわち、前回最後に顔領域を認識したときに使用した辞書データの種類を読み出し、その辞書データの登録画像を第1辞書メモリ27に読み込む。
認識処理部30は、スルー画像の画面の最初の位置に設定した対象領域内の画素値を取得し、対象領域の画像に対して第1辞書メモリ27に読み込まれている登録画像を順に照合する。照合した結果、対象領域に顔画像が存在しないと判断した場合、辞書入替え制御部31が前回第1辞書メモリ27に読み出した登録画像を破棄して、次の辞書データの登録画像を第1辞書メモリ27に読み出す。
認識処理部30は、対象領域の画像に対して全ての辞書データの登録画像を照合していく。最終的に顔画像が存在しないと判断した場合には、認識処理部30が対象領域を移動してその対象領域内の画素値を取得し、次の対象領域の画像に対して辞書データの登録画像を順に照合していく。
対象領域の移動方向としては、例えば、図5に示すように、対象領域41を、スルー画像42の画面内の左上コーナから水平方向に移動して右端に到達すると、左端下方の位置に戻って水平方向に行うのが好適である。水平及び垂直方向の移動量は、対象領域の1辺のサイズの1/10程度が好適である。なお、この方向や移動量に限らない。例えば移動方句としては、スルー画像の中心から右回り、あるいは左回りに略渦巻き状に移動させてもよい。
認識処理部30での認定は、対象領域の画像と登録画像を照合し、両者の相関値を調べ、相関値が予め決めた閾値を越えている場合に両者が一致すると判断する。次に、一致する登録画像の数の全照合数に対する割合を表す相関スコア(類似度)を算出して、相関スコアが予め決めた閾値を越えない場合には、照合した登録画像が属する辞書データの種類に相当する被写体の顔画像が存在しないと判断し、辞書データを入れ替えて再び照合してゆく。越える場合には、その対象領域に被写体の顔画像が存在すると判断する。
相関値は、例えば0〜1000の範囲で出力される。一致すると判断する条件は、相関値が閾値(A)、例えば700を越えた場合とする。
相関スコアは、例えば辞書データの登録画像の数(X)に対して一致と判断された登録画像の個数(B)の割合(式:(B/X))で算出され、顔領域であるとの認定は、例えば相関スコア(B/X)が閾置(C)、例えば70%を越えた場合としている。なお、パターンマッチングの一致度の判定としては、前述した以外に、周知の正規化相関などの手法を用いてもよい。
次に読み込む辞書データの順番は、第2辞書メモリ29のアドレス順、又は記録順に基づいて選択するのが望ましい。また、各辞書データ35〜38に頻度領域を設け、頻度領域に、顔領域を認識したときに使用した使用頻度の情報を更新記録してゆき、使用頻度の高い順に辞書データを入れ替えてもよい。また、各辞書データ35〜38の頻度領域に対して、対象領域の画像に対して一致する登録画像の一致頻度の情報を記録していき、登録画像を読み込む順番を一致頻度の高い順に行うようにしてもよい。
第1辞書メモリ27に読み込んだ辞書データに対して照合を行って、相関スコア(B/X)が閾値(C)を越えた場合には、その対象領域に顔画像が存在すると認定し、残りの辞書データに対して照合を行わずに、対象領域を次の位置に移動して次の対象領域の画像に対して照合していく。このとき、第1辞書メモリ27には、前回顔領域であると認識したときに使用した辞書データの登録画像が読み込まれたままになっている。対象領域を移動した場合には、その登録画像を全て破棄して、メモリ21に記憶した種類の辞書データの登録画像を再び第1辞書メモリ27に読み込んで照合する。
例えば、メモリ21に記憶されている辞書データの種類が「人物用」となっている場合、図6に示すように、対象領域をスルー画像の最初の位置(対象領域回数「1」)にセットしたときには、人物用辞書データ35の登録画像が第1辞書メモリ27に読み込まれ、照合した結果、顔画像が存在しない場合、犬用、猫用、そして花用の辞書データの登録画像を順に読み込んで照合していく。全ての辞書データ35〜38に対して照合して顔画像が存在しないと判断した場合には、対象領域を次の位置(対象領域移動回数「2」)に移動して照合を開始する。このとき、第1辞書メモリ27には、前回の最後に利用した花用辞書データの登録画像が読み込まれているが、メモリ21に記憶した辞書データの種類が「人物用」になっているため、対象領域の移動に応答して人物用辞書データの登録画像が読み込まれる。なお、対象領域を移動する前に、人物用辞書データの登録画像を読み込んでもよい。また、図6では、対象領域の移動量を図5に示した点線枠毎に移動すると仮定しており、また、図6に示す「対象領域移動回数」の値は、図5に示すスルー画像内を対象領域が移動する順番に対応している。
認識処理部30は、スルー画像内で認識した全ての顔領域の位置、及び大きさの情報を出力し、画像表示部24には、図3に示すように、認識処理部30から取得した顔領域の位置、及び大きさの情報に基づいた範囲に顔検出枠39がスルー画像中に重ねて表示される。そして、顔検出枠39に対してAF・AE処理が実行される。シャッタボタンの半押し操作により認識処理部30で改めて前述したと同様な顔検出が行われ、顔領域に合焦しているか否かが確認される。シャッタボタンの全押し操作により静止画撮影処理を行い、撮影処理により得られた画像データが圧縮されてフラッシュメモリ23に記録される。
スルー画像の全画面に対して照合が完了して顔領域が存在しない場合には、スルー画像の画面内に対して「顔画像無し」の情報を出力し、次のスルー画像の取り込みを待つ。
[実施形態1の変形例1]
なお、スルー画像を取り込む時、及び対象領域を移動する時に、最初に読み出す登録画像が属する辞書データとしては、ユーザーがカメラの初期設定操作等により予め選択した種類の辞書データにしてもよい。この場合には、モード切替キーと十字キーの操作により「初期設定」−「最初に使用する辞書データの選択」の設定項目を指定することで、第2辞書メモリに記録されている辞書データの種類を画像表示部に表示するようにCPU19が制御し、選択枠を十字キーで操作することで複数表示されている中から所望する辞書データを選択し、決定キーの操作によりユーザーに所望する辞書データの種類を選ばせる。そして、選択された辞書データの種類をメモリ21に記録しておけばよい。
[実施形態1の変形例2]
また、撮影毎に、その時点で顔領域を認識した際に使用した辞書データの種類をメモリ21に随時記録し、最後の撮影時に使用した辞書データの登録画像を、スルー画像の取り込む時、及び対象領域を移動する時に、最初に読み込むようにしてもよい。この例では、同じ種類の被写体を連続して撮影する場合に最も適している。
[第1実施形態の変形例3]
画像表示部24にタッチセンサを設け、スルー画像を表示中に表示される顔検出枠39のいずれかを画像タッチにより選択することで、選択された顔検出枠39の被写体に相当する辞書データの種類をメモリ21に記憶し、次回のスルー画像の取り込み時からメモリ21に記憶した種類の辞書データの登録画像を最初に読み出すようにしてもよい。
[第2実施形態]
上記第1実施形態では、辞書データ毎の登録画像を読み込んで照合を行っているが、この第2実施形態では、予め決められたファイルサイズ、例えば辞書データと同じファイルサイズとなるように、各辞書データから予め決めた条件で任意の個数の登録画像をそれぞれ選択して第1辞書メモリに読み込んで照合し、辞書データの種類を絞り込むプレ照合を行い、辞書データの種類が1つに絞り込まれた後には、その辞書データのみの登録画像を読み込んで照合(以下「本照合」と称す)を行う。
図7に示すように、CPU45は、登録画像入替え制御部46、認識処理部30、及び記憶部47を有している。認識処理部30は第1実施形態で説明したと同じ構成である。記憶部47には、第2辞書メモリ29に記録されている辞書データの数、及び各辞書データ35〜38に記録されている登録画像の数、認識処理部30でパターンマッチングを処理した結果、つまり相関値や相関スコアの結果等が記憶される。
登録画像入替え制御部46は、図8に示すように、登録画像選択部48、辞書絞り込み部49、及び判定部50とから構成されている。登録画像選択部48は、予め決めたファイルサイズとなるように、辞書データ35〜38から予め決めた条件で登録画像を選択して第1辞書メモリ27に読み込む。
予め決められたファイルサイズとしては、第1辞書メモリ27に読み込めるサイズであればよく、例えば辞書データ35〜38のファイルサイズと略同じにするのが望ましい。辞書データ35〜38毎でファイルサイズが異なる場合には、そのうち最大のファイルサイズと略同じにするのが好適である。
登録画像選択部48が各辞書データ35〜38から登録画像を選択する条件には、登録画像の読み出し順番と、読み出し個数との2つの条件がある。読み出し順番としては、第2辞書メモリ29のアドレス順、又は書き込み順、あるいは一致度順で行うのが好適である。
一致度順は、各辞書データ35〜38に頻度領域を設け、頻度領域に対して、登録画像の一致した回数(頻度)の情報を記録してゆき、一致度の高い順に行う例である。このような一致度順の例は、一般的に、学習機能と呼ばれている。この学習機能は、一般的な撮影環境下ではヒット率が高いが、撮影環境が変わるとヒット率が極端に悪くなり検出速度が落ちるおそれがある。このため、学習機能を有効・無効に切り替える操作部を設けておくのが望ましい。カメラの初期設定の項目で学習機能の有効・無効を選択するようにしてもよい。
辞書絞り込み部49は、認識処理部30での照合結果により一致と判断した登録画像に基づいて次の照合で必要とされる辞書データの種類を絞り込む。判定部50は、辞書絞り込み部49で絞り込んだ辞書データの種類の個数を判定し、その結果を登録画像選択部48に送る。前述した登録画像選択部48で登録画像を選択するための予め決めた条件である読み出し個数は、判定部50で判定した辞書データの絞り込み個数に基づいて決められる。
次に、第2実施形態の作用を、図9を参照しながら説明する。画像処理部30がスルー画像を取り込むと、登録画像入替え制御部46は、第2辞書メモリ29に記録されている辞書データの数、及び各辞書データに収録されている登録画像の数を予め調べ、記憶部47に記憶しておき、各辞書データ35〜38と同じファイルサイズとなるように、各辞書データ35〜38から登録画像を第1辞書メモリ27にそれぞれ読み込む。なお、スルー画像を取り込む前に登録画像を読み込んでもよい。
各辞書データ35〜38から登録画像を読み込む個数は、第1辞書メモリ27に読み込んだ登録画像の全部のファイルサイズが、辞書データ35〜38のファイルサイズと同じになるように決められる。
例えば、各辞書データ35〜38のファイルサイズが略同じで、登録画像の全個数も同じと仮定した場合、各辞書データ35〜38から第1辞書メモリ27に読み込む登録画像の個数を、各辞書データ35〜38に登録されている登録画像の個数に合わせることで、ファイルサイズが略同じになる。各辞書データ35〜38から読み出す個数は、均等になる個数、つまり、辞書データ35〜38の登録画像の個数(X)を、絞り込んだ辞書データの数(n)で割って算出する。なお、割り切れない場合には、小数点以下を切り捨てた値とする。
詳しく説明すると、図10に示すように、個数人物用辞書データ35からX1/n個の登録画像を、犬用辞書データ35からX2/n個の登録画像を、猫用辞書データ35からX3/n個の登録画像を、そして、花用辞書データ35からX4/n個の登録画像をそれぞれ読み込む。ここで、「X1」は人物用辞書データ35に記録されている登録画像の全個数、「X2」は犬用辞書データ36に記録されている登録画像の全個数、「X3」は猫用辞書データ37に記録されている登録画像の全個数、「X4」は花用辞書データ38に記録されている登録画像の全個数、そして、「n」は辞書データ35〜38の数、この例では「4」である。
辞書データ35〜38の登録画像の全個数(X)を「16」と仮定すると、図11に示すように、各辞書データ35〜38から第1辞書メモリ27に読み込む登録画像の個数(L)が「4」に設定され、各辞書データ35〜38から4個ずつの登録画像が第1辞書メモリ27に読み込まれる。この例では、4個の登録画像は、第2辞書メモリ29のアドレス順、又は書き込み順で読み出される。同図では、読み出される登録画像を、「登録画像1」、「登録画像2」、「登録画像3」、「登録画像4」で記載している。
認識処理部30は、最初にプレ照合を行う。プレ照合は、第1実施形態で説明したと同じように、対象領域の画像に対して第1辞書メモリ27に読み込んだ登録画像を順に照合し、照合結果から得られた相関値に基づいて両者が一致しているか否かを調べる。図11には、「登録画像1」、「登録画像2」、「登録画像3」、「登録画像4」の下に「○」又は「×」で照合結果を示している。「○」は一致すると判断した登録画像、「×」は一致しないと判断した登録画像である。
相関値の判断がなされた後には、辞書絞り込み部49は、1回目のプレ照合の結果、つまり一致する登録画像の個数に基づいて次の照合で必要とする辞書データの種類を絞り込む。絞り込みは、一致と判断した登録画像の個数を辞書データ毎の照合数で割った相関スコアを辞書データ毎に算出し、相関スコア(類似度)が閾値を越えた辞書データ、つまり次の照合で必要と判断される辞書データの登録画像のみを第1辞書メモリ27に読み込む。
図11では、人物用辞書データ35の「登録画像1〜4」が全て一致すると判断されているから相関スコアが「100%」、犬用辞書データ36の場合には「登録画像1〜3」が一致すると判断されているから相関スコアが「75%」である。残り2つの辞書データ37,38に対しては、相関スコアが閾値(70%)以下であるので、不必要と判断される。これにより、次の照合で必要とする辞書データは2つに絞られる。
したがって、2回目のプレ照合の前には、辞書データのファイルサイズに合うように、絞られた人物用辞書データ35、及び犬用辞書データ36から登録画像がそれぞれ読み込まれる。このときの登録画像の読み込み個数も、ファイルサイズが辞書データ35〜38のファイルサイズと同じとなるように、各辞書データ35〜38から選択して決められる。前述したように、個数合わせで決める場合には、辞書データ35〜38の登録画像の全個数(X)が「16」、絞り込んだ辞書データの個数(n1)が「2」であるので、式「X/(n1)」から算出した値、つまり8個ずつに決められる。読み込む登録画像の数を辞書データの全個数に合わせることで、読み込む登録画像のトータルのファイルサイズが辞書データ35〜38と略同じファイルサイズになる。このときの登録画像の読み込み順も、前述したと同じに、第2辞書メモリ29のアドレス順、又は書き込み順、あるいは一致度順に基づいて読み込まれる。この場合、前回読み込んだ登録画像1〜4を再び読み込む。
2回目のプレ照合の結果では、人物用辞書データ35の登録画像1〜8が全て一致すると判断されているから相関スコアが「100%」、犬用辞書データ36の場合には登録画像1〜3のみが一致すると判断されているから相関スコアが「37.5%(3/8×100)」、つまり閾値以下であるので、不要と判断される。これにより、辞書データ35〜38の種類が1つに絞られる。なお、プレ照合は、辞書データ35〜38の種類が一つに絞り込まれるまで繰り返し行われる。
辞書データ35〜38を一つに絞り込むと、その辞書データ35の登録画像の全てを第1辞書メモリ27に読み込み、本照合を行う。この本照合の結果に基づいて対象領域に顔画像が存在するか否かを認定する。
なお、本照合の結果、顔画像が存在しないと認定された場合には、辞書データ35〜38のファイルサイズと同じになるように、各辞書データ35〜38から次の登録画像を選択して読み込む。そして、辞書データ35〜38の種類が一つに絞られるまでプレ照合が繰り返しを行われる。ここで、次の登録画像とは、前回のときに各辞書データ35〜38から登録画像1〜4を読み込んでいた場合にはアドレス順、又は書き込み順、あるいは一致度順での次の登録画像、この例では登録画像5〜8になる。
また、1回目のプレ照合の結果、顔画像が存在しない場合も、辞書データ35〜38のファイルサイズと同じになるように、各辞書データ35〜38から次の登録画像を読み込む。そして、必要な辞書データ35〜38が一つに絞られるまで再びプレ照合を行う。
全ての登録画像に対してプレ照合を行って顔画像が存在しないと判断した場合には、スルー画像の全画面に対してプレ照合しているか否かが判断され、プレ照合をしていない場合には、対象領域を次の位置に移動して再びプレ照合を行う。プレ照合をしている場合には、スルー画像の画面内に対して「顔画像無し」の情報を出力し、次のスルー画像の取り込みを待つ。
認識処理部30は、スルー画像内で認識した全ての顔領域の位置、及び大きさの情報を出力する。画像表示部24には、図3で説明したように、認識処理部30から取得した顔領域の位置、及び大きさの情報に基づいた範囲に顔検出枠39がスルー画像中に重ねて表示される。そして、顔検出枠39に対してAF・AE処理が実行される。シャッタボタンの半押し操作により認識処理部30等で改めて前述したと同様なプレ照合、及び本照合が行われ、顔領域に合焦しているか否かが確認される。シャッタボタンの全押し操作により静止画撮影処理を行い、撮影処理により得られた画像データが圧縮されてフラッシュメモリ23に記録される。
[第3実施形態]
第2実施形態では、2回目以降のプレ照合で読み込まれる登録画像には、直前のプレ照合のときに読み込んだ登録画像と重複する登録画像(図11で説明した登録画像1〜4)が再び読み込まれている。第3実施形態では、同じ対象領域での照合において、2回目以降のプレ照合、及び本照合の際に、第1辞書メモリ27に一度読み込まれた登録画像は読み込まず、残りの登録画像を読み込むようにしている。
第3実施形態の特徴を、図12及び図13に参照しながら説明すると、最初のプレ照合の結果により必要とする辞書データが2つに絞り込まれた場合、辞書データのファイルサイズに合うように、絞り込まれた2つの辞書データ、図13に示す例では人物用辞書データ35、及び犬用辞書データ36から登録画像がそれぞれ読み込まれる。読み込み個数は、第2実施例で説明したように、辞書データ35〜38の登録画像の全個数(X)を、絞り込んだ辞書データの個数(n1)で割って算出した個数、つまり、8個ずつとなっている。このとき、一度第1辞書メモリ27に読み込まれた登録画像以外の残りの登録画像から選択して読み込む。つまり、登録画像選択部48は、一度読み込んだ登録画像を記憶しており、一度も読み込まれていない登録画像の中から次に読み込む登録画像を選択する。このときも各辞書データ35〜38の記録順、又はアドレス順に基づいて読み込まれる。したがって、図13に記載のように、人物用及び犬用の辞書データ35,36から「登録画像5〜12」がそれぞれ読み込まれる。
2回目のプレ照合の結果、必要とする辞書データが1つに絞られる。辞書データが一つに絞り込まれると、本照合を行う。本照合では、絞り込んだ辞書データの登録画像のうち、一度も第1辞書メモリ27に読み込まれていない登録画像、つまり、図13に示す例では「登録画像13〜18」が選択されて第1辞書メモリ27に読み込まれる。そして、第1辞書メモリ27に読み込んだ登録画像に対して対象領域の画像と照合して、顔画像が存在するか否かの認定を行う。なお、図13に示す例では、辞書データ35〜38に登録した登録画像の個数を18個に仮定しているため、本照合では、残りの登録画像が6個しかなく、よって、本照合時に読み込んだ登録画像のトータルのファイルサイズが辞書データのサイズよりも少なくなっている。残りの登録画像が多数ある場合には、辞書データと同じファイルサイズとなるように個数が選択される。
このように、第3実施形態では、同じ対象領域での照合において、一度照合した登録画像を使用しないから、プレ照合を行えば行うほど検出精度が向上する。
[第4実施形態]
上記第2、及び第3実施形態では、スルー画像表示中、及びシャッタボタンの半押し操作時に、プレ照合と本照合との両方を必ず行って顔検出をしているが、カメラが撮影モードでスルー画像を表示している状態、つまりシャッタボタンの半押し操作、及び全押し操作を行っていない状態では、プレ照合の結果のみを利用して顔検出を行い、シャッタボタンの半押し操作時には、その直前のプレ照合の結果に基づいて本照合を行うようにしてもよい。
詳しくは、図14及び図15に示すように、CPU55は、スルー画表示中か否かの状態を監視する条件判定部56を有している。条件判定部56は、シャッタボタンの半押し操作を監視しており、シャッタボタンの半押し操作が行われていないときには、登録情報入替え制御部57、及び認識処理部58に対してスルー画像表示中の情報を送り、半押し操作が行われることに応答して半押し情報を送る。
登録情報入替え制御部57及び認識処理部58は、スルー画像表示中の情報を受け取っている間、プレ照合のみを行ってその結果により辞書データが一つに絞り込まれることで、対象領域に顔画像が存在すると認定する。スルー画像の全ての画面に対してプレ照合を行うことで、辞書データが一つに絞り込まれた領域に対して顔領域が存在すると認定し、顔領域情報を出力する。CPU55は、顔領域の情報に基づいて画像表示部24に表示中のスルー画像に重ねて顔検出枠39を表示するとともに、顔領域に対してAF・AE処理を施す。
登録情報入替え制御部57及び認識処理部58は、半押し情報を受け取ることで、直前のスルー画像に対するプレ照合の結果により絞り込まれた1つの辞書データの登録画像を、第1辞書メモリ27に全て読み出して、対象領域の画像に対して第1辞書メモリ27に読み込んだ登録画像を照合していく。CPU55は、その照合結果により認定された顔領域に対してAF・AE処理を行う。そのままシャッタボタンの全押し操作が行われると、本照合で用いたスルー画像に基づく静止画像データを記録する。シャッタボタンの全押し操作の前に半押し操作が解除されると、スルー画像を表示する状態に戻るため、再びプレ照合による顔検出が行われる。
上記各実施形態では、辞書データ35〜38の種類を人物用、犬用、猫用、及び花用としているが、本発明ではこれらに種類や数に限らず、例えば犬や猫以外の動物や、昆虫、背景等の辞書データを用意してもよい。選択する優先順位としては、例えば人物用、犬用、猫用、及び花用というように予め決めておいてもよい。
また、顔を一画面内で検出する個数を、被写体の種類、すなわち辞書データの種類に応じて制限してもよい。例えば人用辞書データを用いて一画面内で人の顔を検出する個数を10個まで、犬用辞書データを用いて一画面内で犬の顔を検出する個数を5個までというように、被写体の種類に応じて検出個数を制限すると、顔検出の処理時間を迅速にすることができる。
上記各実施形態では、複数の辞書データを第2辞書メモリに記憶する構成としているが、本発明ではこれに限らず、一つの辞書データの中に、種類の異なる登録画像を複数記憶しておき、検出対象の被写体の種類を示す種類情報を記録する領域をその辞書データに設け、その領域に記載の種類情報に基づいてその時点で読み込む対象となる種類の登録画像のみを選択して読み出すようにしてもよい。また、第2辞書メモリに、複数の登録画像データを記憶しておき、各登録画像データに被写体の種類を示す種類情報を記録した領域を設け、読み出すときに種類情報を参照しながら必要な登録画像データを読み出すようにしてもよい。
また、上記実施形態では、対象領域毎に各辞書データの登録画像を順次照合しているが、本発明ではこれに限らず、最初の辞書データに登録されている登録画像に対して画面内を対象領域でもって全スキャンして照合した後に、次の辞書データを選択し、選択した辞書データの登録画像に対して再び対象領域でもって画面内で全スキャンして照合するようにしてもよい。
さらに、上記各実施形態の認識処理部での顔検出方法としては、エッジ検出、色相検出、及び肌色検出等の公知の方法を利用することができる。また、対象領域から特徴点を抽出し、抽出した特徴点に対し被写体の種類毎に用意した辞書データに登録した複数の特徴点(基準パターン)を順に比較して顔領域が存在するか否かを調べても良い。
例えば、認識処理部としては、スルー画像の全体画像上に設定画素数の枠からなるサブウィンドウを走査させ複数の部分画像を生成する部分画像生成手段と、部分画像生成手段により生成された複数の部分画像のうち、辞書データに基づいて顔である部分画像を検出する複数の弱判別器による複数の判別結果を用いて、部分画像が顔であるか否かを判別する顔判別器とを備えたものであれば、精度良く効率的に顔の検出を行うことができる。この場合、辞書データの中身は、登録画像ではなく、特徴量を記載したデータで構成される。例えば人物用の辞書データの場合には、人の正面顔、及び横顔の特徴量を記載したデータとなる。
詳しく説明すると、認識処理部59は、図16に示すように、全体画像P上にサブウィンドウWを走査させることにより部分画像PPを生成する部分画像生成手段61と、部分画像生成手段61により生成された複数の部分画像PPから正面顔である部分画像を検出する正面顔判別手段62A、及び横顔である部分画像を検出する横顔判別手段62Bとを有している。
なお、部分画像生成手段61に入力される全体画像Pは、前処理手段60により前処理が施されている。前処理手段60は、全体画像Pに対し図17(A)〜(D)に示すように、全体画像Pを多重解像度化して解像度の異なる複数の全体画像P2、P3、P4を生成する機能を有している。さらに、前処理手段60は、生成した複数の全体画像Pに対して、局所的な領域におけるコントラストのばらつきを抑制し全体画像Pの全領域においてコントラストを所定レベルに揃える正規化(以下、局所正規化という)を施す機能を有している。
部分画像生成手段61は、図17(A)に示すように、設定された画素数(たとえば32画素×32画素)を有する対象領域(以下、「サブウィンドウ」と称す)Wを全体画像P内において走査させ、サブウィンドウWにより囲まれた領域を切り出すことにより設定画素数からなる部分画像PPを生成するようになっている。また、部分画像生成手段61は、図17(B)〜(D)に示すように、生成された低解像度画像上においてサブウィンドウWを走査させたときの部分画像PPをも生成するようになっている。
正面顔判別手段62Aおよび横顔判別手段62Bは、アダブースティングアルゴリズム(AdaboostingAlgorithm)を用いて顔画像Fを検出するものである。正面顔判別手段62Aは、面内回転している正面顔を検出する機能を有しており(図18(A)参照)、30°〜330°の範囲で回転角度が30°ずつ異なる12個の正面顔判別器63−1〜63−12を有している。なお、各正面顔判別器63−1〜63−12は、回転角度が0°を中心に−15°(=345°)〜+15°の範囲内にある顔を判別できるようになっている。横顔判別手段62Bは、面内回転している横顔を検出する機能を有しており(図18(B)参照)、例えば−90°〜+90°の範囲で30°ずつ回転角度の異なる7個の横顔判別器64−1〜64−7を有している。なお、横顔判別手段62Bは、さらに画面内の顔の向きが回転している画像(面外回転)を検出する横顔判別器をさらに備えていても良い。
正面顔判別器63−1〜63−12、及び横顔判別器64−1〜64−7は、部分画像PPが顔であるか非顔かの2値判別を行う機能を有し、複数の弱判別器CF1〜CFM(M:弱判別器の個数)を有している。各弱判別器CF1〜CFMは、それぞれ部分画像PPから特徴量xを抽出し、この特徴量xを用いて部分画像PPが顔であるか否かの判別を行う機能を備える。そして、各顔判別器62A、62Bは、弱判別器CF1〜CFMにおける判別結果を用いて顔であるか否かの最終的な判別を行うようになっている。
具体的には、各弱判別器CF1〜CFMは、図19に示すように、部分画像PP内の設定された座標P1a、P1b、P1cにおける輝度値等を抽出する。さらに、部分画像PPの低解像度画像PP2内の設定された座標位置P2a、P2b、低解像度画像PP3内の設定された座標位置P3a、P3bにおける輝度値等をそれぞれ抽出する。その後、前述した7個の座標P1a〜P3bの2つをペアとして組み合わせ、この組み合わせた輝度の差分を特徴量xとする。各弱判別器CF1〜CFM毎にそれぞれ異なる特徴量が用いられるものであり、例えば弱判別器CF1では、座標P1a、P1cにおける輝度の差分を特徴量として用い、弱判別器CF2では、座標P2a,P2bにおける輝度の差分を特徴量として用いるようになっている。
なお、各弱判別器CF1〜CFMがそれぞれ特徴量xを抽出する場合について例示しているが、複数の部分画像PPについて上述した特徴量xを予め抽出しておき、各弱判別器CF1〜CFMに入力するようにしてもよい。さらに、輝度値を用いた場合について例示しているが、コントラスト、エッジ等の情報を用いるようにしても良い。
各弱判別器CF1〜CFMは、図20に示すようなヒストグラムを有しており、このヒストグラムに基づいて特徴量xの値に応じたスコアf1(x)〜fM(x)を出力する。さらに、各弱判別器CF1〜CFMは、判別性能を示す信頼度β1〜βMを有している。各弱判別器CF1〜CFMは、スコアf1(x)〜fM(x)と信頼度β1〜βMとを用いて判定スコアβm・fm(x)を算出するようになっている。そして、各弱判別器CFmの判定スコアβm・fm(x)自体が設定しきい値Sref以上であるか否かを認識し、設定しきい値以上であるときに顔であると判別する(βm・fm(x)≧Sref)。
ここで、各弱判別器CF1〜CFMは、それぞれカスケード構造を有しており、各弱判別器CF1〜CFMのすべてが顔であると判別した部分画像PPのみを顔画像Fとして出力するようになっている。つまり、弱判別器CFmにおいて顔であると判別した部分画像PPのみ下流側の弱判別器CFm+1による判別を行い、弱判別器CFmで非顔であると判別された部分画像PPは、下流側の弱判別器CFm+1による判別は行わない。これにより、下流側の弱判別器CFm+1において判別すべき部分画像PPの量を減らすことができるため、判別作業の高速化を図ることができる。なお、カスケード構造を有する判別器の詳細は、Shihong LAO等、「高速全方向顔検出」、画像の認識・理解シンポジウム(MIRU2004)、2004年7月に開示されている。
なお、各判別器63−1〜63−12、64−1〜64−7は、それぞれ判別すべき所定の角度で面内回転された正面顔もしくは横顔を正解サンプル画像として学習された弱判別器を有しているものである。また、各弱判別器CF1〜CFMから出力された判定スコアS1〜SMをそれぞれ個別に判定スコアしきい値Sref以上であるか否かを認識するのではなく、弱判別器CFmにおいて判別を行う際、弱判別器CFmの上流側の弱判別器CF1〜CFm−1での判定スコアの和Σr=1mβr・frが判定スコアしきい値S1ref以上であるか否かにより判別を行うようにしても良い(Σr=1mβr・fr(x)≧S1ref)。これにより、上流側の弱判別器による判定スコアを考慮した判定を行うことができるため、判定精度の向上を図ることができる。
また、認識処理部30として前述した例では、アダブースティングアルゴリズムを用いて顔を検出する例を説明しているが、公知のSVM(Support Vector Machine)アルゴリズムやMing-Hsuan Yang, David J. Kriegman, Narendra Ahuja: “Detecting faces in images: a survey”, IEEE transactions on Pattern Analysis and Machine Intelligence, vol. 24, no. 1, pp. 34-58, 2002に記載された顔検出方法等の公知の顔検出アルゴリズムを用いて顔の検出を行うようにしても良い。
さらに、アダブースト(Adaboost)アルゴリズムを用いて顔認識する方法以外としては、例えば顔画像の局所特徴量を用いて顔認識する方法、グラフマッチング法、テンプレートマッチング法等の公知の顔認識技術を用いることができ、詳細については、W. Y. Zhao, R. Chellappa, A.Rosenfeld, P. J. Phillips: “Face recognition: A literature survey”, UMD CfAR Technical Report CAR-TR-948,2000.,労世紅、山口修、平山高嗣、“画像処理による顔検出と顔認識“、CVIM2005年5月(第149回)研究会、坂野鋭、“パターン認識における主成分分析“、統計数理、vol. 49, no. 1, pp. 23-42,2001等の文献に記載されている。
19 CPU
27 第1辞書メモリ
29 第2辞書メモリ
39 顔検出枠
41 対象領域

Claims (13)

  1. 被写体を撮像する撮像手段と、
    前記撮像手段により撮像して得られる撮像画像内の一部の対象領域の画像と複数の登録画像とを照合して前記撮像画像内に含まれる特定被写体の画像を認識する認識手段と、
    予め決めた被写体の種類毎に前記登録画像が登録されている辞書データを複数格納している辞書記憶手段と、
    シャッタレリーズ毎に、その時点又は直前で前記認識手段が特定被写体の画像を認定した時に使用した登録画像が含まれる被写体の種類を記憶するメモリと、
    前記対象領域を前記撮像画像内で移動する時、又は前記撮像画像内の全部を前記対象領域が移動した後に、前記辞書記憶手段に格納されている複数の辞書データの中から、前記認識手段が照合するための辞書データとして、前記メモリに記憶された被写体の種類に対応する辞書データを選択する辞書入替え制御手段と、
    を備えたことを特徴とする特定被写体検出装置。
  2. 前記撮像画像をスルー画像として画面に表示する画像表示部と、
    前記画像表示部に表示中のスルー画像内の、前記認識手段が認識した特定被写体の画像を含む範囲に検出枠を重ねて表示する検出枠表示手段と、
    前記スルー画像に重ねて表示される検出枠のうちのいずれか一つの検出枠を選択する選択手段と、を備えるとともに、
    前記メモリは、前記選択手段で選択される検出枠に含まれる特定被写体の画像を認定した時に使用した登録画像を含む被写体の種類を記憶することを特徴とする請求項1記載の特定被写体検出装置。
  3. 被写体を撮像する撮像手段と、
    前記撮像手段により撮像して得られる撮像画像内の一部の対象領域の画像に対して複数の登録画像を照合して特定被写体の画像を認識する認識手段と、
    予め決めた被写体の種類毎に前記登録画像が登録されている辞書データを複数格納している辞書記憶手段と、
    前記辞書記憶手段に格納されている複数の辞書データの中から、前記認識手段が照合するための登録画像を、前記辞書データと略同じファイルサイズとなるように各辞書データからそれぞれ選択する登録画像入替え制御手段と、
    を備えたことを特徴とする特定被写体検出装置。
  4. 前記登録画像入替え制御手段は、前記複数の辞書データのファイルサイズが異なる場合、そのうちの最大のファイルサイズとなるように各辞書データから登録画像を選択することを特徴とする請求項3記載の特定被写体検出装置。
  5. 前記辞書データの数を「n」、前記辞書データに登録されている登録画像の数を「X」とすると、前記登録画像入替え制御手段は、X/nの式から算出される個数の登録画像を各辞書データからそれぞれ選択することを特徴とする請求項3記載の特定被写体検出装置。
  6. 前記認識手段は、前記登録画像入替え制御手段により選択された複数の登録画像に基づいて照合するとともに、
    前記登録画像入替え制御手段は、
    前記認識手段が照合して略一致と判断する登録画像の数に基づいて、次の照合で選択する登録画像が含まれる被写体の種類に対応する辞書データを絞り込むプレ選択手段と、
    前記プレ選択手段の絞り込みにより辞書データが一つに絞り込まれることに応じて、一つに絞り込まれた辞書データに含まれる登録画像を選択する本選択手段と、
    を有することを特徴とする請求項3から5のいずれか1項に記載の特定被写体検出装置。
  7. 前記プレ選択手段は、絞り込まれる辞書データが複数の場合、絞り込まれる複数の辞書データから、前回選択した登録画像を含む登録画像を、前記辞書データと略同じファイルサイズとなるように、それぞれ選択することを特徴とする請求項6記載の特定被写体検出装置。
  8. 前記プレ選択手段は、絞り込まれる辞書データが複数の場合、絞り込まれる複数の辞書データから、前回選択した登録画像とは異なる登録画像を、前記辞書データと略同じファイルサイズとなるように、それぞれ選択することを特徴とする請求項6記載の特定被写体検出装置。
  9. 予め決めた被写体の種類毎に複数の登録画像が登録されている辞書データを辞書記憶手段に複数格納しており、
    被写体を撮像して得られる撮像画像内の一部の対象領域の画像と前記辞書データに登録されている複数の登録画像とを照合して前記撮像画像内に含まれる特定被写体の画像を認識するとともに、
    シャッタレリーズ毎に、その時点又は直前で前記特定被写体の画像を認定した時に使用した登録画像を含む被写体の種類を記憶しておき、
    前記対象領域を前記撮像画像内で移動する時、又は前記撮像画像内の全部を前記対象領域が移動した後に、前記辞書記憶手段に格納されている複数の辞書データの中から、前記記憶した被写体の種類に対応する辞書データを選択することを特徴とする特定被写体検出方法。
  10. 予め決めた被写体の種類毎に複数の登録画像が登録されている辞書データを辞書記憶手段に複数格納しており、
    被写体を撮像して得られる撮像画像内の一部の対象領域の画像と前記辞書データに登録されている複数の登録画像とを照合して前記撮像画像内に含まれる特定被写体の画像を認識し、
    前記認識された特定被写体の画像を含む範囲に検出枠を、前記撮像画像に基づいて生成されるスルー画像に重ねて画像表示部に表示するとともに、
    前記対象領域を前記撮像画像内で移動する時、又は前記撮像画像内の全部を前記対象領域が移動した後に、前記辞書記憶手段に格納されている複数の辞書データの中から、前記照合するための辞書データとして、前記検出枠のうちの一つに選択された検出枠に含まれる特定被写体の画像を認定した時に使用した登録画像を含む被写体の種類に対応する辞書データを選択することを特徴とする特定被写体検出方法。
  11. 予め決めた被写体の種類毎に複数の登録画像が登録されている辞書データを辞書記憶手段に複数格納しており、
    被写体を撮像して得られる撮像画像内の一部の対象領域の画像と前記辞書データに登録されている複数の登録画像とを照合して前記撮像画像内に含まれる特定被写体の画像を認識し、
    前記辞書記憶手段に格納されている複数の辞書データの中から、前記一部の対象領域の画像と照合するための登録画像を、前記辞書データと略同じファイルサイズとなるように各辞書データからそれぞれ選択することを特徴とする特定被写体検出方法。
  12. 前記複数の辞書データのファイルサイズが異なる場合には、そのうちの最大のファイルサイズとなるように前記各辞書データから前記登録画像を選択することを特徴とする請求項11に記載の特定被写体検出方法。
  13. 前記辞書データの数を「n」、前記辞書データに登録している登録画像の数を「X」とすると、「X/n」の式から算出される個数の登録画像を各辞書データからそれぞれ選択することを特徴とする請求項11に記載の特定被写体検出方法。
JP2009226054A 2009-09-30 2009-09-30 特定被写体検出方法及び装置 Expired - Fee Related JP5389592B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009226054A JP5389592B2 (ja) 2009-09-30 2009-09-30 特定被写体検出方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009226054A JP5389592B2 (ja) 2009-09-30 2009-09-30 特定被写体検出方法及び装置

Publications (2)

Publication Number Publication Date
JP2011077753A JP2011077753A (ja) 2011-04-14
JP5389592B2 true JP5389592B2 (ja) 2014-01-15

Family

ID=44021275

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009226054A Expired - Fee Related JP5389592B2 (ja) 2009-09-30 2009-09-30 特定被写体検出方法及び装置

Country Status (1)

Country Link
JP (1) JP5389592B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014073171A1 (ja) * 2012-11-06 2014-05-15 パナソニック株式会社 公開承認依頼方法、公開承認依頼システムおよび公開承認依頼サーバ
JP6493163B2 (ja) * 2015-11-06 2019-04-03 オムロン株式会社 粗密探索方法および画像処理装置
JP6587995B2 (ja) * 2016-09-16 2019-10-09 富士フイルム株式会社 画像表示制御システム,画像表示制御方法および画像表示制御プログラム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5003305B2 (ja) * 2007-06-27 2012-08-15 カシオ計算機株式会社 撮像装置、及び、特定画像検出プログラム
JP5099488B2 (ja) * 2007-08-31 2012-12-19 カシオ計算機株式会社 撮像装置、顔認識方法およびそのプログラム

Also Published As

Publication number Publication date
JP2011077753A (ja) 2011-04-14

Similar Documents

Publication Publication Date Title
US8861806B2 (en) Real-time face tracking with reference images
US8314854B2 (en) Apparatus and method for image recognition of facial areas in photographic images from a digital camera
JP4274233B2 (ja) 撮影装置、画像処理装置、および、これらにおける画像処理方法ならびに当該方法をコンピュータに実行させるプログラム
CN111402135A (zh) 图像处理方法、装置、电子设备及计算机可读存储介质
US8526742B2 (en) Image processing apparatus, method, and program that classifies data of images
US8879802B2 (en) Image processing apparatus and image processing method
US20100302595A1 (en) Image Reproducing Apparatus And Imaging Apparatus
CN102096805B (zh) 注册用于脸部识别的多个脸部图像的装置和方法
CN108259770B (zh) 图像处理方法、装置、存储介质及电子设备
KR20090045870A (ko) 촬상 장치, 그 제어 방법 및 프로그램
JP5939705B2 (ja) 被写体判定装置、被写体判定方法及びプログラム
JP2009177271A (ja) 撮像装置、その制御方法およびプログラム
US8400532B2 (en) Digital image capturing device providing photographing composition and method thereof
JP5384273B2 (ja) カメラ及びカメラの記録方法
US20160219227A1 (en) Image processing apparatus which performs image processing on photographic subject
JP5125734B2 (ja) 撮像装置、画像選択方法及び画像選択プログラム
JP5226699B2 (ja) 画像判定装置
CN102542251A (zh) 被摄体检测装置以及被摄体检测方法
CN108259769B (zh) 图像处理方法、装置、存储介质及电子设备
JP5389592B2 (ja) 特定被写体検出方法及び装置
CN108401109B (zh) 图像获取方法、装置、存储介质及电子设备
US12002279B2 (en) Image processing apparatus and method, and image capturing apparatus
JP2010146395A (ja) 画像処理装置、画像処理方法、画像処理プログラム、及び、電子機器
JP2008211534A (ja) 顔検知装置
CN107147845B (zh) 对焦方法、装置和终端设备

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120523

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130605

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130612

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130628

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130911

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131009

R150 Certificate of patent or registration of utility model

Ref document number: 5389592

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees