JP4799397B2 - 辞書データ作成装置、所定領域検出装置および撮影装置 - Google Patents

辞書データ作成装置、所定領域検出装置および撮影装置 Download PDF

Info

Publication number
JP4799397B2
JP4799397B2 JP2006351328A JP2006351328A JP4799397B2 JP 4799397 B2 JP4799397 B2 JP 4799397B2 JP 2006351328 A JP2006351328 A JP 2006351328A JP 2006351328 A JP2006351328 A JP 2006351328A JP 4799397 B2 JP4799397 B2 JP 4799397B2
Authority
JP
Japan
Prior art keywords
amount
noise
predetermined
sample images
noise amount
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006351328A
Other languages
English (en)
Other versions
JP2008165311A (ja
Inventor
友和 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Corp
Original Assignee
Fujifilm Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujifilm Corp filed Critical Fujifilm Corp
Priority to JP2006351328A priority Critical patent/JP4799397B2/ja
Publication of JP2008165311A publication Critical patent/JP2008165311A/ja
Application granted granted Critical
Publication of JP4799397B2 publication Critical patent/JP4799397B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、画像から顔領域等の所定領域を検出する際に参照する辞書データを作成するための辞書データ作成装置、画像から所定領域を検出する所定領域検出装置、および撮影により画像を取得する撮影装置に関するものである。
デジタルカメラによる撮影において、撮影により取得した画像から例えば顔領域等の所定領域を検出し、その所定領域の検出結果に応じて画像に施す画像処理の条件を変更したり、撮影時における撮影条件を変更したりすることが行われている。
このように画像から所定領域を検出するための手法が種々提案されている。例えば、画像から肌色領域を検出し、ニューラルネットワーク等により肌色領域が顔領域か否かを判断して顔領域を検出する手法が提案されている(特許文献1参照)。また、所定領域であることが分かっている複数のサンプル画像から算出された特徴量を、ニューラルネットワーク、ブースティング等のマシンラーニングの手法によりあらかじめ学習することにより得られた、特徴量の入力により画像に所定領域が含まれるか否かを判定するための基準値を出力する複数の判別器を辞書データとしてあらかじめ作成しておき、辞書データを参照して画像に所定領域が含まれるか否かを判定する手法が本出願人により提案されている(特許文献2参照)。例えば、特許文献2に記載された手法において、例えば、サンプル画像として顔領域を含む画像を用いて辞書データを作成した場合には、この辞書データを参照することにより検出対象の画像に含まれる顔領域を検出することができる。
特開2000−48184号公報 特開2005−108195号公報
しかしながら、サンプル画像にはノイズが含まれており、またノイズ量もサンプル画像に応じて異なる。このため、複数のサンプル画像を用いて辞書データを作成した場合、サンプル画像に含まれるノイズのばらつきの影響により、検出対象の画像から所定領域を精度よく検出できない場合がある。また、検出対象の画像に含まれるノイズ量も検出対象の画像に応じて異なる。このため、ノイズに影響されないように辞書データを作成したとしても、検出対象の画像のノイズ量が種々異なることから、ノイズの影響により所定領域を精度よく検出できない場合がある。
本発明は、上記事情に鑑みなされたものであり、ノイズに影響されないように所定領域を検出可能な辞書データを作成することを第1の目的とする。
また、検出対象の画像に含まれるノイズに影響されないように、所定領域を検出することを第2の目的とする。
本発明による第1の辞書データ作成装置は、所定領域を含む複数のサンプル画像に基づいて、前記所定領域の検出対象の画像から該所定領域を検出する際に参照する辞書データを作成する辞書データ作成装置において、
前記複数のサンプル画像のノイズ量を算出するノイズ量算出手段と、
前記複数のサンプル画像のノイズ量を所定量に正規化する正規化手段と、
前記ノイズ量が正規化された複数のサンプル画像から前記辞書データを作成する辞書作成手段とを備えたことを特徴とするものである。
本発明による第1の所定領域検出装置は、所定領域の検出対象となる検出対象画像の入力を受け付ける入力手段と、
ノイズ量が所定量となるように正規化された、前記所定領域を含む複数のサンプル画像から作成された辞書データを記憶する記憶手段と、
前記検出対象画像のノイズ量を前記所定量に正規化する正規化手段と、
前記辞書データを参照して、前記ノイズ量が正規化された検出対象画像から前記所定領域を検出する検出手段とを備えたことを特徴とするものである。
本発明による第1の撮影装置は、撮影により画像を取得する撮影手段と、
ノイズ量が所定量となるように正規化された、所定領域を含む複数のサンプル画像から作成された辞書データを記憶する記憶手段と、
前記画像のノイズ量を前記所定量に正規化する正規化手段と、
前記辞書データを参照して、前記ノイズ量が正規化された画像から前記所定領域を検出する検出手段とを備えたことを特徴とするものである。
本発明による第2の辞書データ作成装置は、所定領域を含む複数のサンプル画像に基づいて、前記所定領域の検出対象の画像から該所定領域を検出する際に参照する辞書データを作成する辞書データ作成装置において、
前記複数のサンプル画像のノイズ量を算出するノイズ量算出手段と、
前記複数のサンプル画像から、前記ノイズ量が所定値以下となる複数のサンプル画像を選択する選択手段と、
前記選択された複数のサンプル画像から前記辞書データを作成する辞書作成手段とを備えたことを特徴とするものである。
なお、本発明による第2の辞書データ作成装置においては、前記複数のサンプル画像のノイズ量を所定量に正規化する正規化手段をさらに備えるものとし、
前記辞書作成手段を、前記ノイズ量が正規化された複数のサンプル画像から前記辞書データを作成する手段としてもよい。
本発明による第2の所定領域検出装置は、所定領域の検出対象となる検出対象画像の入力を受け付ける入力手段と、
ノイズ量が所定値以下の、前記所定領域を含む複数のサンプル画像から作成された辞書データを記憶する記憶手段と、
前記辞書データを参照して、前記検出対象画像から前記所定領域を検出する検出手段とを備えたことを特徴とするものである。
本発明による第2の撮影装置は、撮影により画像を取得する撮影手段と、
ノイズ量が所定値以下の、所定領域を含む複数のサンプル画像から作成された辞書データを記憶する記憶手段と、
前記辞書データを参照して、前記画像から前記所定領域を検出する検出手段とを備えたことを特徴とするものである。
本発明の第1の辞書データ作成装置によれば、複数のサンプル画像のノイズ量を算出し、複数のサンプル画像のノイズ量が所定量となるようにノイズ量を正規化し、ノイズ量が正規化された複数のサンプル画像から辞書データを作成するようにしたものである。このため、辞書データの作成に使用する複数のサンプル画像のノイズのばらつきをなくすことができ、その結果、ノイズのばらつきに影響を受けることなく所定領域を精度よく検出可能な辞書データを作成することができる。
また、このような辞書データを参照して検出対象画像から所定領域を検出する際に、検出対象画像のノイズ量を算出し、ノイズ量が所定量となるようにノイズ量を正規化し、ノイズ量が正規化された検出対象画像から所定領域を検出することにより、検出対象画像のノイズに影響されることなく、精度よく検出対象画像から所定領域を検出することができる。
本発明の第2の辞書データ作成装置によれば、複数のサンプル画像のノイズ量を算出し、複数のサンプル画像のノイズ量が所定値以下となる複数のサンプル画像を選択し、選択された複数のサンプル画像から辞書データを作成するようにしたものである。このため、辞書データの作成に使用する複数のサンプル画像のノイズの影響をできるだけ小さくして、辞書データを作成することができる。
この場合、選択されたサンプル画像のノイズ量が所定量となるようにノイズ量を正規化し、ノイズ量が正規化された複数のサンプル画像から辞書データを作成することにより、さらに辞書データの作成に使用する複数のサンプル画像のノイズのばらつきをなくすことができ、その結果、ノイズのばらつきに影響を受けることなく所定領域を精度よく検出可能な辞書データを作成することができる。
以下、図面を参照して本発明の実施形態について説明する。図1は本発明の第1の実施形態による辞書データ作成装置の構成を示す概略ブロック図である。図1に示すように第1の実施形態による辞書データ作成装置1は、複数のサンプル画像の入力を受け付ける入力部2と、複数のサンプル画像のそれぞれのノイズ量を算出するノイズ量算出部3と、複数のサンプル画像のノイズ量を所定量に正規化する正規化部4と、ノイズ量が所定量となるように正規化された複数のサンプル画像から辞書データを作成する辞書作成部5とを備える。
なお、本実施形態においては、サンプル画像は人物の顔を撮影することにより取得されたものであり、人物の顔領域が含まれる。サンプル画像に含まれる顔領域の位置はオペレータが指定する等により、あらかじめ求められている。また、本実施形態において作成する辞書データは、検出対象の画像から人物の顔領域を検出する際に参照されるものである。
入力部2は、記録媒体に記録されたサンプル画像の画像データを記録媒体から読み出したり、ネットワーク経由で遠隔地に設置された画像サーバからサンプル画像の画像データを読み出すための各種インターフェースからなる。
ノイズ量算出部3は、図2に示すように、サンプル画像の顔領域からさらに目の領域E1、鼻の領域N1および口の領域M1を抽出し、目領域E1、鼻領域N1および口領域M1の位置関係から、さらに顔の頬の領域C1を抽出する。そして、下記の式(1)により頬領域C1の画素値の標準偏差σを算出し、これをサンプル画像のノイズ量とする。
σ=√(1/n×Σ(xi−xa)) (1)
但し、n:頬領域内の総画素数
xi:頬領域内の各画素の画素値(i=1〜n)
xa:頬領域内の画素値の平均値(xa=1/n×Σxi)
正規化部4は、サンプル画像のノイズ量が所定量となるように、すなわち標準偏差σが所定値Th0となるようにサンプル画像のノイズ量を正規化する。図3はノイズ量の正規化処理のフローチャートである。処理が開始されると、正規化部4は、サンプル画像のノイズ量、すなわちノイズ量算出部3が算出した標準偏差σが所定値Th0に略等しいか否かを判定する(ステップST1)。なお、ステップST1の判定の処理においては、標準偏差σが所定値Th0と完全に一致するか否かを判定する場合のみならず、多少の誤差を持って標準偏差σが所定値Th0と一致するか否かを判定する場合も含む。
ステップST1が肯定されると処理を終了する。ステップST1が否定されると、標準偏差σが所定値Th0より大きいか否かを判定する(ステップST2)。
ステップST2が肯定されると、平滑化フィルタまたはメディアンフィルタによるフィルタリング処理をサンプル画像に施し(ステップST3)、ステップST1に戻り、ステップST1が肯定されるまでステップST1以降の処理を繰り返す。これにより、サンプル画像のノイズ量が所定量となるまで低減されて正規化されることとなる。
一方、ステップST2が否定されると、ランダムノイズをサンプル画像に付加し(ステップST4)、ステップST1に戻り、ステップST1が肯定されるまでステップST1以降の処理を繰り返す。これにより、サンプル画像のノイズ量が所定量となるまで増加されて正規化されることとなる。
辞書作成部5は、ニューラルネットワーク、ブースティング等のマシンラーニングの手法を用いて、ノイズ量が正規化された複数のサンプル画像から顔検出の際に参照する辞書データを作成する。辞書データは複数の判別器からなる。各判別器は、サンプル画像に含まれる顔領域上の所定位置の複数の画素値の入力を受けて所定の値を判別結果として出力するように学習がなされる。このように学習を行うことにより、検出対象の画像に顔領域が含まれる場合には各判別器は比較的大きい値を出力し、顔領域が含まれない場合には出力が小さくなる。本実施形態において作成される辞書データは複数の判別器の出力結果を統合して、判別結果となる値を出力する。そしてこの値をしきい値と比較し、出力がしきい値より大きい場合には検出対象の画像に顔領域が含まれ、しきい値未満の場合には検出対象の画像に顔領域が含まれないと判定することができる。
次いで、第1の実施形態において行われる処理について説明する。図4は第1の実施形態において行われる処理を示すフローチャートである。入力部2が複数のサンプル画像の入力を受け付け(ステップST11)、ノイズ量算出部3がサンプル画像のノイズ量を算出する(ステップST12)。そして、正規化部4が複数のサンプル画像のノイズ量を正規化し(ステップST13)、辞書作成部5がノイズ量が正規化された複数のサンプル画像から辞書データを作成し(ステップST14)、処理を終了する。
このように、第1の実施形態によれば、複数のサンプル画像のノイズ量を算出し、複数のサンプル画像のノイズ量が所定量となるようにノイズ量を正規化し、ノイズ量が正規化された複数のサンプル画像から辞書データを作成するようにしたものである。このため、辞書データの作成に使用する複数のサンプル画像のノイズのばらつきをなくすことができ、その結果、ノイズのばらつきに影響を受けることなく顔領域を精度よく検出可能な辞書データを作成することができる。
なお、上記第1の実施形態においては、ノイズ量算出部3が顔領域から頬の領域C1を抽出し、頬の領域C1の標準偏差σをノイズ量として算出しているが、サンプル画像を複数のブロックに分割して、各ブロック毎に標準偏差σを算出し、各ブロックの標準偏差σの平均値をノイズ量として算出してもよい。
次いで、本発明の第2の実施形態について説明する。図5は本発明の第2の実施形態による辞書データ作成装置の構成を示す概略ブロック図である。図5に示すように第2の実施形態による辞書データ作成装置11は、複数のサンプル画像の入力を受け付ける入力部12と、複数のサンプル画像のそれぞれのノイズ量を算出するノイズ量算出部13と、複数のサンプル画像からノイズ量が所定値以下となる複数のサンプル画像を選択する選択部16と、選択したサンプル画像のノイズ量を所定量に正規化する正規化部14と、ノイズ量が所定量となるように正規化された複数のサンプル画像から辞書データを作成する辞書作成部15とを備える。
なお、入力部12、ノイズ量算出部13、正規化部14および辞書作成部15は、第1の実施形態における入力部2、ノイズ量算出部3、正規化部4および辞書作成部5と同一の処理を行うものであるため、ここでは詳細な説明は省略する。
選択部16は、入力部12が入力を受け付けた複数のサンプル画像のうち、ノイズ量すなわち標準偏差σがしきい値Th1以下のサンプル画像を選択する。
次いで、第1の実施形態において行われる処理について説明する。図6は第2の実施形態において行われる処理を示すフローチャートである。入力部12が複数のサンプル画像の入力を受け付け(ステップST21)、ノイズ量算出部13がサンプル画像のノイズ量を算出する(ステップST22)。次いで、選択部16がノイズ量すなわち標準偏差σがしきい値Th1以下のサンプル画像を選択し(ステップST23)、正規化部14が選択されたサンプル画像のノイズ量を正規化する(ステップST24)。そして、辞書作成部15がノイズ量が正規化された複数のサンプル画像から辞書データを作成し(ステップST25)、処理を終了する。
このように、第2の実施形態によれば、複数のサンプル画像のノイズ量を算出し、ノイズ量がしきい値Th1以下の複数のサンプル画像を選択し、選択した複数のサンプル画像のノイズ量が所定量となるようにノイズ量を正規化し、ノイズ量が正規化された複数のサンプル画像から辞書データを作成するようにしたものである。このため、辞書データの作成に使用する複数のサンプル画像のノイズを少なくできるとともにノイズのばらつきをなくすことができ、その結果、ノイズのばらつきに影響を受けることなく顔領域を精度良く検出可能な辞書データを作成することができる。
なお、上記第2の実施形態においては、選択部16が選択したサンプル画像のノイズ量を正規化しているが、正規化を行うことなく、選択部16が選択したノイズ量がしきい値Th1以下のサンプル画像をそのまま辞書データの作成に用いてもよい。
また、上記第1および第2の実施形態においては、サンプル画像として顔領域を含む画像を用いているが、サンプル画像を顔以外の被写体を含むものとすることにより、顔以外の所定の被写体の領域を検出するための辞書データを作成することが可能である。
次いで、本発明の撮影装置の実施形態について説明する。図7は本発明の撮影装置の実施形態であるデジタルカメラの構成を示す概略ブロック図である。図7に示すように本実施形態によるデジタルカメラ21は、動作モードスイッチ、ズームレバー、上下左右ボタン、レリーズボタンおよび電源スイッチ等の操作系22と、操作系22の操作内容をCPU60に伝えるためのインターフェース部分である操作系制御部23とを有している。
撮像系26としては、撮影レンズ30を構成するフォーカスレンズ30aおよびズームレンズ30bを有している。各々のレンズは、モータとモータドライバとからなるフォーカスレンズ駆動部31およびズームレンズ駆動部32によって光軸方向に移動可能である。フォーカスレンズ駆動部31はAF処理部50から出力されるフォーカス駆動量データに基づいて、ズームレンズ駆動部32はズームレバーの操作量データに基づいて、各々のレンズの移動を制御する。
また、絞り34は、モータとモータドライバとからなる絞り駆動部35によって駆動される。この絞り駆動部35は、AE/AWB処理部51から出力される絞り値データに基づいて絞り径の調整を行う。
シャッタ36は、メカニカルシャッタであり、モータとモータドライバとからなるシャッタ駆動部37によって駆動される。シャッタ駆動部37は、レリーズボタンの押下により発生する信号と、AE/AWB処理部51から出力されるシャッタスピードデータとに応じて、シャッタ36の開閉の制御を行う。
光学系の後方には撮像素子であるCCD38を有している。CCD38は、多数の受光素子を2次元的に配列した光電面を有しており、光学系を通過した被写体光がこの光電面に結像し、光電変換される。光電面の前方には、各画素に光を集光するためのマイクロレンズアレイと、R,G,B各色のフィルタが規則的に配列されたカラーフィルタアレイとが配置されている。CCD38は、CCD制御部39から供給される垂直転送クロックおよび水平転送クロックに同期して、画素毎に蓄積された電荷を1ラインずつシリアルなアナログ撮影信号として出力する。各画素において電荷を蓄積する時間、すなわち、露光時間は、CCD制御部39から与えられる電子シャッタ駆動信号によって決定される。また、CCD38はCCD制御部39により、あらかじめ定められた大きさのアナログ撮像信号が得られるようにゲインが調整されている。
なお、撮影レンズ30、絞り34、シャッタ36およびCCD38が撮像系26を構成する。
CCD38から取り込まれたアナログ撮影信号は、アナログ信号処理部40に入力される。アナログ信号処理部40は、アナログ信号のノイズを除去する相関2重サンプリング回路(CDS)と、アナログ信号のゲインを調節するオートゲインコントローラ(AGC)と、アナログ信号をデジタル信号に変換するA/Dコンバータ(ADC)とからなる。なお、アナログ信号処理部40が行う処理をアナログ信号処理とする。このデジタル信号に変換された画像データは、画素毎にR,G,Bの濃度値を持つCCD−RAWデータである。
タイミングジェネレータ41は、タイミング信号を発生させるものであり、このタイミング信号をシャッタ駆動部37、CCD制御部39、およびアナログ信号処理部40に供給することにより、レリーズボタンの操作、シャッタ36の開閉、CCD38の電荷の取込み、およびアナログ信号処理部40の処理の同期をとっている。
フラッシュ制御部43は、撮影時にフラッシュ44を発光させる。
画像入力コントローラ45は、アナログ信号処理部40から入力されたCCD−RAWデータをフレームメモリ46に書き込む。
フレームメモリ46は、画像データに対して後述の各種画像処理(信号処理)を行う際に使用する作業用メモリであり、例えば、一定周期のバスクロック信号に同期してデータ転送を行うSDRAM(Synchronous Dynamic Random Access Memory)が使用される。
表示制御部47は、フレームメモリ46に格納された画像データをスルー画像としてモニタ48に表示させたり、再生モード時に記録メディア55に保存されている画像データをモニタ48に表示させたりするためのものである。なお、スルー画像は、撮影モードが選択されている間、所定時間間隔でCCD38により撮影される。
AF処理部50およびAE/AWB処理部51は、プレ画像に基づいて撮影条件を決定する。このプレ画像とは、レリーズボタンが半押しされることによって発生する半押し信号を検出したCPU60がCCD38にプレ撮影を実行させた結果、フレームメモリ46に格納された画像データにより表される画像である。
AF処理部50は、プレ画像に基づいて焦点位置を検出し、フォーカス駆動量データを出力する(AF処理)。焦点位置の検出方式としては、例えば、所望とする被写体にピントが合った状態では画像のコントラストが高くなるという特徴を利用して合焦位置を検出するパッシブ方式が考えられる。
AE/AWB処理部51は、プレ画像に基づいて被写体輝度を測定し、測定した被写体輝度に基づいてISO感度、絞り値およびシャッタスピード等を決定し、ISO感度データ、絞り値データおよびシャッタスピードデータを露出設定値として決定するとともに(AE処理)、撮影時のホワイトバランスを自動調整する(AWB処理)。なお、露出およびホワイトバランスについては、撮影モードがマニュアルモードに設定されている場合には、デジタルカメラ21の撮影者がマニュアル操作により設定可能である。また、露出およびホワイトバランスが自動で設定された場合にも、撮影者が操作系22から指示を行うことにより、露出およびホワイトバランスをマニュアル調整することが可能である。
画像処理部52は、本画像の画像データに対して、階調補正、シャープネス補正、色補正等の画質補正処理、CCD−RAWデータを輝度信号であるYデータと、青色色差信号であるCbデータおよび赤色色差信号であるCrデータとからなるYCデータに変換するYC処理を行う。この本画像とは、レリーズボタンが全押しされることによって実行される本撮影によりCCD38から取り込まれ、アナログ信号処理部40、画像入力コントローラ45経由でフレームメモリ46に格納された画像データによる画像である。本画像の画素数の上限は、CCD38の画素数によって決定されるが、例えば、ファイン、ノーマル等の設定により、記録画素数を変更することができる。一方、スルー画像およびプレ画像の画像数は、本画像よりも少なく、例えば、本画像の1/16程度の画素数で取り込まれる。
圧縮/伸長処理部53は、画像処理部52によって補正・変換処理が行われた本画像の画像データに対して、例えば、JPEG等の圧縮形式で圧縮処理を行い、画像ファイルを生成する。この画像ファイルには、Exifフォーマット等に基づいて、撮影日時等の付帯情報が格納されたタグが付加される。また、圧縮/伸長処理部53は、再生モードの場合には、記録メディア55から圧縮された画像ファイルを読み出し、伸長処理を行う。伸長後の画像データはモニタ48に出力され、画像データの画像が表示される。
メディア制御部54は、記録メディア55にアクセスして画像ファイルの書き込みと読み込みの制御を行う。
内部メモリ56は、デジタルカメラ21において設定される各種定数、およびCPU60が実行するプログラム等を記憶する。また、上記第1または第2の実施形態による辞書データ作成装置が作成した辞書データを記憶する。
ノイズ量算出部57は、撮像系26が取得した画像をL色空間に色変換し、図8に示すようにa空間における肌色の色相範囲にある画素を肌色領域として抽出する。そして抽出した肌色領域のノイズ量を算出する。具体的には、上記第1および第2の実施形態における辞書データ作成装置1,11のノイズ量算出部3,13と同様に、肌色領域として抽出した総画素についての標準偏差σをノイズ量として算出する。
なお、この際、明るさすなわちLの値に応じて肌色の色相範囲にある画素を分類し、分類した明るさ毎に標準偏差σを算出し、さらに分類した明るさ毎に算出した標準偏差σの平均を求めることにより、より精度よくノイズ量を算出できる。また、撮像系26が取得した画像を複数のブロックに分割して、各ブロック毎に標準偏差σを算出し、各ブロックの標準偏差σの平均値をノイズ量として算出してもよい。
正規化部58は、撮像系6が取得した画像のノイズ量を正規化する。具体的には、上記第1および第2の実施形態における辞書データ作成装置1,11の正規化部4,14と同様に、標準偏差σが所定値Th0となるようにノイズ量を正規化する。
顔検出部59は、内部メモリ56に記憶された辞書データを参照して、ノイズ量が正規化された画像から顔領域を検出する。具体的には辞書データを参照してノイズ量が正規化された肌色領域が顔領域であるか否かを判定し、顔領域であると判定された場合に、肌色領域を顔領域として検出する。
なお、顔領域の検出を行う画像は、撮像系26が取得し、アナログ信号処理部40がアナログ処理を行うことにより取得されてフレームメモリ46に記憶されたCCD−RAWデータが表す画像である。
CPU60は、操作系22およびAF処理部50等の各種処理部からの信号に応じてデジタルカメラ21の本体各部を制御する。また、撮像系26が取得した画像から顔領域を検出するように、ノイズ量算出部57、正規化部58および顔検出部59を制御する。
データバス61は、画像入力コントローラ45、各種処理部、フレームメモリ46およびCPU60等に接続されており、デジタル画像データ等のやり取りを行う。
次いで、撮像装置の実施形態が行う処理について説明する。図9は本実施形態による撮像装置が行う顔検出処理のフローチャートである。なお、ここでは、レリーズボタンの押下により撮像系26が撮影を行い、アナログ信号処理部40がアナログ処理を行うことによりフレームメモリ46にCCD−RAWデータを記憶した後の処理について説明する。
フレームメモリ46にCCD−RAWデータが記憶されることによりCPU60が処理を開始し、ノイズ量算出部57が撮影によりCCD−RAWデータが表す画像(以下単に画像とする)のノイズ量を算出する(ステップST31)。そして、正規化部58がノイズ量を正規化し(ステップST32)、顔検出部59がノイズ量が正規化された画像から顔領域を検出し(ステップST33)、処理を終了する。
このように、本実施形態の撮影装置においては、上記第1または第2の実施形態による辞書データ作成装置が作成した辞書データを参照して撮影により取得した画像から顔領域を検出する際に、撮像系26が取得した画像のノイズ量を算出し、ノイズ量が所定量となるようにノイズ量を正規化し、ノイズ量が正規化された画像から顔領域を検出するようにしたものである。このため、撮像系26が取得した画像のノイズに影響されることなく、精度よく画像から顔領域を検出することができる。
次いで、本発明の所定領域検出装置の実施形態について説明する。図10は本発明の実施形態による所定領域検出装置の構成を示す概略ブロック図である。図10に示すように本実施形態による所定領域検出装置71は、検出対象となる画像(検出対象画像とする)から所定領域として顔領域を検出するものであり、検出対象画像の入力を受け付ける入力部72と、検出対象画像のノイズ量を算出するノイズ量算出部73と、検出対象画像のノイズ量を所定量に正規化する正規化部74と、上記第1または第2の実施形態による辞書データ作成装置が作成した辞書データを記憶する辞書データ記憶部75と、辞書データを参照して検出対象画像から顔領域を検出する顔検出部76とを備える。
なお、ノイズ量算出部73、正規化部74および顔検出部76は、上記撮影装置の実施形態におけるノイズ量算出部57、正規化部58および顔検出部59と同様の処理を行うものである。
次いで、所定領域検出装置の実施形態が行う処理について説明する。図11は本実施形態による所定領域検出装置が行う顔検出処理のフローチャートである。入力部72が検出対象の画像の入力を受け付けることにより処理を開始し、ノイズ量算出部73が検出対象画像のノイズ量を算出する(ステップST41)。そして、正規化部74がノイズ量を正規化し(ステップST42)、顔検出部76がノイズ量が正規化された画像から顔領域を検出し(ステップST43)、処理を終了する。
なお、上記撮影装置および所定領域検出装置の実施形態においては、画像から顔領域を検出しているが、辞書データの作成に顔以外の所定の被写体を含むサンプル画像を用いた場合には、その所定の被写体の領域を検出する辞書データを作成することができる。このため、顔以外の所定の被写体の辞書データを内部メモリ56または辞書データ記憶部75に記憶しておくことにより、撮影により取得した画像または検出対象画像から顔領域以外の所定の被写体の領域を検出することが可能となる。
以上、本発明の実施形態について説明したが、コンピュータを、上記のノイズ量算出部3,13,57,73、正規化部4,14,58,74、辞書作成部5,15、選択部16、顔検出部59,75に対応する手段として機能させ、図3,4,6,9,11に示すような処理を行わせるプログラムも、本発明の実施形態の1つである。また、そのようなプログラムを記録したコンピュータ読取り可能な記録媒体も、本発明の実施形態の1つである。
本発明の第1の実施形態による辞書データ作成装置の構成を示す概略ブロック図 頬領域の検出を説明するための図 ノイズ量の正規化処理のフローチャート 第1の実施形態において行われる処理を示すフローチャート 本発明の第2の実施形態による辞書データ作成装置の構成を示す概略ブロック図 第2の実施形態において行われる処理を示すフローチャート 本発明の撮影装置の実施形態であるデジタルカメラの構成を示す概略ブロック図 空間における肌色の色相範囲を示す図 本実施形態による撮像装置が行う顔検出処理のフローチャート 本発明の実施形態による所定領域検出装置の構成を示す概略ブロック図 本実施形態による所定領域検出装置が行う顔検出処理のフローチャート
符号の説明
1,11 辞書データ作成装置
2,12 入力部
3,13 ノイズ量算出部
4,14 正規化部
5,15 辞書作成部
16 選択部
21 デジタルカメラ
26 撮像系
56 内部メモリ
57,73 ノイズ量算出部
58,74 正規化部
59,76 顔検出部
71 所定領域検出装置
75 辞書データ記憶部

Claims (6)

  1. 所定領域を含む複数のサンプル画像に基づいて、前記所定領域の検出対象の画像から該所定領域を検出する際に参照する辞書データを作成する辞書データ作成装置において、
    前記複数のサンプル画像のそれぞれの画素値の標準偏差をノイズ量として算出するノイズ量算出手段と、
    前記複数のサンプル画像のそれぞれのノイズ量が所定量より大きい場合には、前記ノイズ量が前記所定量となるように前記ノイズ量を低減し、前記ノイズ量が前記所定量より小さい場合には、ノイズを付加することにより前記ノイズ量が前記所定量となるように前記ノイズ量を増加させることにより、前記複数のサンプル画像の前記ノイズ量を前記所定量に正規化する正規化手段と、
    前記ノイズ量が正規化された複数のサンプル画像から前記辞書データを作成する辞書作成手段とを備えたことを特徴とする辞書データ作成装置。
  2. 所定領域の検出対象となる検出対象画像の入力を受け付ける入力手段と、
    記所定領域を含む複数のサンプル画像であって、該複数のサンプル画像のそれぞれの画素値の標準偏差をノイズ量として算出し、前記複数のサンプル画像のそれぞれのノイズ量が所定量より大きい場合には、前記ノイズ量が前記所定量となるように前記ノイズ量を低減し、前記ノイズ量が前記所定量より小さい場合には、ノイズを付加することにより前記ノイズ量が前記所定量となるように前記ノイズ量を増加させることにより、前記ノイズ量が前記所定量となるように正規化された、複数のサンプル画像から作成された辞書データを記憶する記憶手段と、
    前記検出対象画像のノイズ量を前記所定量に正規化する正規化手段と、
    前記辞書データを参照して、前記ノイズ量が正規化された検出対象画像から前記所定領域を検出する検出手段とを備えたことを特徴とする所定領域検出装置。
  3. 撮影により画像を取得する撮影手段と、
    所定領域を含む複数のサンプル画像であって、該複数のサンプル画像のそれぞれの画素値の標準偏差をノイズ量として算出し、前記複数のサンプル画像のそれぞれのノイズ量が所定量より大きい場合には、前記ノイズ量が前記所定量となるように前記ノイズ量を低減し、前記ノイズ量が前記所定量より小さい場合には、ノイズを付加することにより前記ノイズ量が前記所定量となるように前記ノイズ量を増加させることにより、前記ノイズ量が前記所定量となるように正規化された、複数のサンプル画像から作成された辞書データを記憶する記憶手段と、
    前記画像のノイズ量を前記所定量に正規化する正規化手段と、
    前記辞書データを参照して、前記ノイズ量が正規化された画像から前記所定領域を検出する検出手段とを備えたことを特徴とする撮影装置。
  4. 所定領域を含む複数のサンプル画像に基づいて、前記所定領域の検出対象の画像から該所定領域を検出する際に参照する辞書データを作成する辞書データ作成装置において、
    前記複数のサンプル画像のそれぞれの画素値の標準偏差をノイズ量として算出するノイズ量算出手段と、
    前記複数のサンプル画像から、前記ノイズ量が所定値以下となる複数のサンプル画像を選択する選択手段と、
    前記選択された複数のサンプル画像のそれぞれのノイズ量が所定量より大きい場合には、前記ノイズ量が前記所定量となるように前記ノイズ量を低減し、前記ノイズ量が前記所定量より小さい場合には、ノイズを付加することにより前記ノイズ量が前記所定量となるように前記ノイズ量を増加させることにより、前記選択された複数のサンプル画像の前記ノイズ量を前記所定量に正規化する正規化手段と、
    前記ノイズ量が正規化された、選択された複数のサンプル画像から前記辞書データを作成する辞書作成手段とを備えたことを特徴とする辞書データ作成装置。
  5. 所定領域の検出対象となる検出対象画像の入力を受け付ける入力手段と、
    ノイズ量が所定値以下の、前記所定領域を含む複数のサンプル画像であって、該複数のサンプル画像のそれぞれの画素値の標準偏差をノイズ量として算出し、前記複数のサンプル画像のそれぞれのノイズ量が所定量より大きい場合には、前記ノイズ量が前記所定量となるように前記ノイズ量を低減し、前記ノイズ量が前記所定量より小さい場合には、ノイズを付加することにより前記ノイズ量が前記所定量となるように前記ノイズ量を増加させることにより、前記ノイズ量が前記所定量となるように正規化された、複数のサンプル画像から作成された辞書データを記憶する記憶手段と、
    前記辞書データを参照して、前記検出対象画像から前記所定領域を検出する検出手段とを備えたことを特徴とする所定領域検出装置。
  6. 撮影により画像を取得する撮影手段と、
    ノイズ量が所定値以下の、所定領域を含む複数のサンプル画像であって、該複数のサンプル画像のそれぞれの画素値の標準偏差をノイズ量として算出し、前記複数のサンプル画像のそれぞれのノイズ量が所定量より大きい場合には、前記ノイズ量が前記所定量となるように前記ノイズ量を低減し、前記ノイズ量が前記所定量より小さい場合には、ノイズを付加することにより前記ノイズ量が前記所定量となるように前記ノイズ量を増加させることにより、前記ノイズ量が前記所定量となるように正規化された、複数のサンプル画像から作成された辞書データを記憶する記憶手段と、
    前記辞書データを参照して、前記画像から前記所定領域を検出する検出手段とを備えたことを特徴とする撮影装置。
JP2006351328A 2006-12-27 2006-12-27 辞書データ作成装置、所定領域検出装置および撮影装置 Expired - Fee Related JP4799397B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006351328A JP4799397B2 (ja) 2006-12-27 2006-12-27 辞書データ作成装置、所定領域検出装置および撮影装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006351328A JP4799397B2 (ja) 2006-12-27 2006-12-27 辞書データ作成装置、所定領域検出装置および撮影装置

Publications (2)

Publication Number Publication Date
JP2008165311A JP2008165311A (ja) 2008-07-17
JP4799397B2 true JP4799397B2 (ja) 2011-10-26

Family

ID=39694779

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006351328A Expired - Fee Related JP4799397B2 (ja) 2006-12-27 2006-12-27 辞書データ作成装置、所定領域検出装置および撮影装置

Country Status (1)

Country Link
JP (1) JP4799397B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7157320B2 (ja) * 2018-09-19 2022-10-20 日本電信電話株式会社 学習データ生成装置、学習データ生成方法およびプログラム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5361763A (en) * 1993-03-02 1994-11-08 Wisconsin Alumni Research Foundation Method for segmenting features in an image
JPH11306325A (ja) * 1998-04-24 1999-11-05 Toshiba Tec Corp 対象物検出装置及び対象物検出方法
JP2000067164A (ja) * 1998-08-26 2000-03-03 Nippon Telegr & Teleph Corp <Ntt> パターン認識方法及び装置並びにテンプレート作成プログラムを記録した記録媒体
JP4099981B2 (ja) * 2001-12-04 2008-06-11 日本電気株式会社 画像認識システム、画像認識方法および画像認識プログラム
JP2005099903A (ja) * 2003-09-22 2005-04-14 Kddi Corp バイオメトリクス認証における認識用辞書の更新装置

Also Published As

Publication number Publication date
JP2008165311A (ja) 2008-07-17

Similar Documents

Publication Publication Date Title
JP4782725B2 (ja) 合焦装置および方法並びにプログラム
US8284264B2 (en) Imaging apparatus, method, and program
JP4819001B2 (ja) 撮影装置および方法並びにプログラム、画像処理装置および方法並びにプログラム
US8570422B2 (en) Apparatus, method, and recording medium containing program for photographing
US7944483B2 (en) Apparatus, method and program for photography
JP4861952B2 (ja) 画像処理装置及び撮像装置
JP4510768B2 (ja) 撮影装置および方法並びにプログラム
JP5180349B2 (ja) 撮影装置および方法並びにプログラム
JP2007233247A (ja) 焦点調節量決定装置、方法、およびプログラム、ならびに撮像装置
JP2008017166A (ja) 撮影装置および方法並びにプログラム
JP4818999B2 (ja) 撮影装置および方法並びにプログラム
JP5249146B2 (ja) 撮影制御装置および方法並びにプログラム
JP5027580B2 (ja) 撮影装置および方法並びにプログラム
JP2007188126A (ja) 画像明るさ算出装置および方法並びにプログラム
JP5048599B2 (ja) 撮像装置
JP2009081636A (ja) 画像記録装置及び撮影方法
JP5044472B2 (ja) 画像処理装置、撮像装置、画像処理方法及びプログラム
JP4799397B2 (ja) 辞書データ作成装置、所定領域検出装置および撮影装置
JP2007208355A (ja) 撮影装置および方法並びにプログラム
JP2013152643A (ja) 画像処理装置、画像処理方法及びプログラム
JP2008028956A (ja) 撮像装置、および、撮像装置における対象物検出用画像信号の生成方法
JP2009088843A (ja) 撮影装置および撮影装置の制御方法並びにプログラム
JP2008197763A (ja) 撮影装置および方法並びにプログラム
JP5027055B2 (ja) 画像処理装置および方法並びにプログラム
JP5153211B2 (ja) 撮像装置及びその制御方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090910

RD15 Notification of revocation of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7435

Effective date: 20110415

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110422

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110506

RD13 Notification of appointment of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7433

Effective date: 20110524

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110531

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20110524

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110712

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110802

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140812

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4799397

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees