JP4323559B2 - 撮像装置および方法並びにプログラム - Google Patents

撮像装置および方法並びにプログラム Download PDF

Info

Publication number
JP4323559B2
JP4323559B2 JP2008325571A JP2008325571A JP4323559B2 JP 4323559 B2 JP4323559 B2 JP 4323559B2 JP 2008325571 A JP2008325571 A JP 2008325571A JP 2008325571 A JP2008325571 A JP 2008325571A JP 4323559 B2 JP4323559 B2 JP 4323559B2
Authority
JP
Japan
Prior art keywords
face
image
frame
imaging
image data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2008325571A
Other languages
English (en)
Other versions
JP2009171569A (ja
Inventor
渡 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Corp
Original Assignee
Fujifilm Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujifilm Corp filed Critical Fujifilm Corp
Priority to JP2008325571A priority Critical patent/JP4323559B2/ja
Publication of JP2009171569A publication Critical patent/JP2009171569A/ja
Application granted granted Critical
Publication of JP4323559B2 publication Critical patent/JP4323559B2/ja
Expired - Lifetime legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、撮像により画像データを取得してメモリカード等の記憶手段に記憶するデジタルカメラ等の撮像装置、撮像装置における撮像方法並びに撮像方法をコンピュータに実行させるためのプログラムに関するものである。
従来より、ストロボを用いて撮影を行う場合において、人間の目が赤色または金色に光って写ってしまう、いわゆる赤目現象が問題となっている。この赤目現象は、目の瞳孔を通過したストロボの光が網膜部分で反射され、この反射光がフィルムに写ることによって発生する。
このような赤目を自動的に検出して補正するための各種システムが提案されている。とくに、デジタルカメラを用いて取得した画像データに対して、デジタルカメラ内において赤目の補正を行うようにした撮像装置も各種提案されている(例えば特許文献1〜3参照)。
特開平10−233929号公報 特開平11−127371号公報 特開2000−305141号公報
しかしながら、赤目補正処理は、まず画像データにより表される画像から人物の顔を検出し、さらに顔から目の位置の検出および赤色を黒色に補正する処理を行う必要があるため、パソコンと比較して処理能力が非常に小さいデジタルカメラにおいては処理に長時間を要する。このため、撮影後取得した画像をデジタルカメラの液晶モニタに表示したり、次の撮影を行うことを可能とする等の次の動作を行うまでの待ち時間が長くなってしまうという問題がある。
本発明は上記事情に鑑みなされたものであり、デジタルカメラ等の撮像装置において、撮像により取得した画像データに赤目補正処理等の所定の画像処理を施すに際し、画像処理の時間を短縮することを目的とする。
本発明による撮像装置は、被写体を撮像して画像データを取得する撮像手段と、
前記画像データを含む各種表示を行う表示手段と、
撮像動作を行うためのレリーズ手段と、
前記画像データを含む各種情報を記憶する記憶手段と、
該撮像手段により前記被写体を撮像し続けて前記被写体の動画像を取得して前記表示手段に表示する撮像制御手段とを備えた撮像装置において、
前記動画像を構成する一のフレームに人物の顔が含まれるか否かの判定を、所定時間間隔にて該判定が肯定されるまで行う顔判定手段と、
該顔判定手段により顔が含まれると判定された場合に、該顔が含まれると判定されたフレームからの顔の位置の検出を行う顔検出手段と、
前記検出した顔の位置を前記記憶手段に記憶し、前記所定時間経過後の次フレームに前記顔が含まれるか否かの判定を行い、該判定が肯定された場合に前記顔の位置の検出を行い、該検出した新たな顔の位置を前記記憶手段に記憶されている顔の位置に代えて該記憶手段に記憶し、前記レリーズ手段により撮像動作が行われるまで、さらに前記所定時間経過後の次フレームに顔が含まれるか否かの判定、該顔が含まれると判定された場合における顔の位置の検出および新たな顔の位置の前記記憶手段への記憶を行い、前記レリーズ手段により撮像動作が行われたときのフレームまたは該フレームに時間的に前および/または後の複数のフレームを前記画像データとして前記記憶手段に記憶するよう、前記撮像手段、前記顔判定手段、前記顔検出手段および前記記憶手段を制御する制御手段とを備えたことを特徴とするものである。
デジタルカメラ等の撮像装置により撮影を行う場合、レリーズ手段により撮像動作を行うまでは、表示手段には被写体の動画像が表示される。この動画像は1秒当たり15〜30のフレームからなるものである。したがって、「所定時間」とは、隣接するフレーム間の時間、5フレーム間の時間あるいは10フレーム間の時間のようにあらかじめ定めたフレーム間の時間とすることができる。
なお、本発明による撮像装置においては、前記次フレームと前記顔が含まれると判定されたフレームとを参照して、該2つのフレーム間の画像の変化量が所定値を超えるか否かを判定する変化量判定手段をさらに備えるものとし、
前記制御手段を、該変化量判定手段により前記変化量が所定値以下であると判定された場合、前記次フレームにおける前記記憶手段に記憶された顔の位置およびその近傍の領域においてのみ前記顔が含まれるか否かの判定を行い、前記変化量判定手段により前記変化量が所定値を超えると判定された場合、前記次フレームに前記顔が含まれるか否かの判定を行うよう前記顔判定手段を制御する手段としてもよい。
「2つのフレーム間の画像の変化量」とは、2つのフレームの間でシーンが切り替わったか否かを判断することが可能な変化量を意味し、具体的にはフレーム間の画像の画素値の平均値の差の絶対値、ヒストグラム形状の差等を用いることができる。ここで、2つのフレーム間においてシーンが切り替わった場合、2つのフレーム間の画像の変化量は比較的大きくなり、シーンが切り替わらない場合には2つのフレーム間の画像の変化量はそれほど大きくならない。したがって、「所定値」としては、シーンが切り替わったか否かを区別できる程度の値を用いることができる。なお、「所定値」は、実際にシーンが切り替わった2つのフレーム間の変化量を算出することにより実験的に求めればよい。
また、本発明による撮像装置においては、前記撮像動作が行われた後、前記記憶手段に記憶された顔の位置を参照して、前記画像データに顔に関連する所定の画像処理を施す画像処理手段をさらに備えるようにしてもよい。
「顔に関連する所定の画像処理」としては、画像データにより表される画像から検出した顔に対して施す処理であればいかなる処理をも用いることができる。例えば、赤目補正処理、顔に対するノイズの抑制処理、濃度補正処理、および階調補正処理の少なくとも1つの処理等の顔の画質を向上させる処理の他、検出した顔について目を閉じているか否かを判定し、目を閉じている場合には撮像動作が行われたときに取得したフレームに時間的に前および/または後のフレームから目を閉じていない顔を含むフレームを選択する処理、笑顔であるか否かを判定し、笑顔でない場合には撮像動作が行われたときに取得したフレームに時間的に前および/または後のフレームから笑顔のフレームを選択する処理等を「顔に関連する所定の画像処理」として用いることができる。
本発明による撮像方法は、被写体を撮像して画像データを取得する撮像手段と、
前記画像データを含む各種表示を行う表示手段と、
撮像動作を行うためのレリーズ手段と、
前記画像データを含む各種情報を記憶する記憶手段と、
該撮像手段により前記被写体を撮像し続けて前記被写体の動画像を取得して前記表示手段に表示する撮像制御手段とを備えた撮像装置における撮像方法において、
前記動画像を構成する一のフレームに人物の顔が含まれるか否かの判定を、所定時間間隔にて該判定が肯定されるまで行い、
該顔が含まれると判定された場合に、該顔が含まれると判定されたフレームからの顔の位置の検出を行い、
前記検出した顔の位置を前記記憶手段に記憶し、前記所定時間経過後の次フレームに前記顔が含まれるか否かの判定を行い、該判定が肯定された場合に前記顔の位置の検出を行い、該検出した新たな顔の位置を前記記憶手段に記憶されている顔の位置に代えて該記憶手段に記憶し、前記レリーズ手段により撮像動作が行われるまで、さらに前記所定時間経過後の次フレームに顔が含まれるか否かの判定、該顔が含まれると判定された場合における顔の位置の検出および新たな顔の位置の前記記憶手段への記憶を行い、前記レリーズ手段により撮像動作が行われたときのフレームまたは該フレームに時間的に前および/または後の複数のフレームを前記画像データとして前記記憶手段に記憶することを特徴とするものである。
なお、本発明による撮像方法をコンピュータに実行させるためのプログラムとして提供してもよい。
本発明によれば、撮像時には撮像手段により取得された被写体の動画像が表示手段に表示される。そして、動画像を構成するフレームに人物の顔が含まれるか否かの判定が所定時間間隔にてこの判定が肯定されるまで行われる。顔が含まれると判定されると、顔が含まれると判定されたフレームから顔の位置が検出され、検出された顔の位置が記憶手段に記憶される。
次いで、所定時間経過後の次のフレームに顔が含まれるか否かの判定が行われ、判定が肯定されると顔の位置の検出が行われ、検出された新たな顔の位置が、すでに記憶されている顔の位置に代えて記憶手段に記憶される。そしてレリーズ手段により撮像動作が行われるまで、所定時間経過後の次のフレームに顔が含まれるか否かの判定、顔が含まれると判定された場合における顔の位置の検出および新たな顔の位置の記憶手段への記憶が行われる。レリーズ手段により撮像動作が行われると、そのときのフレームまたはこのフレームに時間的に前および/または後の複数のフレームが画像データとして記憶手段に記憶される。
ここで、撮像時には構図を決めてからレリーズ手段を駆動させるまでに数秒の時間を要し、その間には被写体は動かないことが多い。このため、所定時間間隔でフレームに顔が含まれるか否かの判定、含まれると判定された場合の新たな顔の位置の検出および新たな顔の位置の記憶手段への記憶を行うことにより、記憶手段に記憶された顔の位置は、撮像動作により取得した画像データにより表される画像に含まれる顔の位置と対応することとなる。したがって、撮像により取得した画像データに対して顔に関連する所定の画像処理を施す際には、画像データにより表される画像から顔を検出する処理を行わなくてもよいこととなる。このため、画像処理の時間を短縮することができ、これにより、撮像により取得した画像データを表示手段に表示したり、次の画像を撮像可能とするまでの待ち時間を少なくすることができ、その結果、待ち時間が長くなることによる撮影者のストレスを軽減することができる。
また、次フレームと顔が含まれると判定されたフレームとを参照して、2つのフレーム間の画像の変化量が所定値を超えるか否かを判定し、変化量が所定値以下である場合には次フレームにおける記憶手段に記憶された顔の位置およびその近傍の領域においてのみ顔が含まれるか否かの判定を行うことにより、2つのフレーム間においてシーンが切り替わらない場合には、次フレームの全領域に対して顔が含まれるか否かの判定処理を行う必要がなくなる。したがって、顔が含まれるか否かの判定のための処理時間を短縮することができる。
以下、図面を参照して本発明の実施形態について説明する。図1は本発明の撮像装置の実施形態であるデジタルカメラの構成を示す概略ブロック図である。図1に示すように、デジタルカメラ1には、被写体像を受光面に結像させて光電変換し、画像データとして出力する撮像部10と、デジタルカメラ1全体の制御を行うとともに画像データのサンプリングタイミング制御、画像データの記録制御および表示制御等の各種制御を行うCPU12と、アナログ情報の画像データをデジタルの画像データに変換するA/D変換器14と、画像サイズの変更、赤目補正、シャープネス補正、ガンマ補正、コントラスト補正およびホワイトバランス補正等の画像処理を行う画像処理部16と、ストロボ18と、ストロボ18の操作を制御するストロボ制御部20と、撮像動作を行うためのレリーズボタン、撮影モード等のデジタルカメラ1のモードの切り替え等を行うモード切替スイッチを含む、撮影者であるユーザが各種情報を入力する際に用いる入力部22と、入力部22から入力された各種情報のインターフェースであるI/O24とが設けられいてる。
また、デジタルカメラ1には、画像データをJPEGやモーションJPEGに代表される手法で圧縮したり、圧縮した画像データを解凍する圧縮解凍部26と、メモリカードスロット28に着脱可能に装着されたメモリカード30に画像データを記録したり読み出したりするために画像データを変換するカードインターフェース32とが設けられている。メモリカード30は、半導体、磁気記録および光記録に代表される着脱可能な記録媒体である。
また、デジタルカメラ1には、後述するような画像データにより表される画像に顔が含まれるか否かの判定、この判定が肯定された場合の顔の位置の検出、顔の位置の記憶等の各種処理を行うためのプログラムを含むCPU12の動作プログラムや各定数が記憶されているROMおよびプログラム実行時の作業領域となる記憶手段であるRAMにより構成されているシステムメモリ34と、タイマ撮影時に駆動されるタイマ36と、現在の時刻を刻むカレンダ時計38と、画像データ等の各種表示を行うためのLCD40と、画像データをLCD40に表示するためのD/A変換等を行うLCD制御部42と、CPU12から指令される表示用の画像データを一時的に記憶しておくVRAM等で構成されているフレームメモリ44とが設けられている。フレームメモリ44には、レリーズボタンを押下することにより被写体の撮影を行う撮影モードが設定されている場合において、1秒間に30枚の画像データがフレームとして入力され、これにより撮影時にはLCD40に被写体の動画像が表示される。また、この状態においてユーザがレリーズボタンを押下することにより撮像動作が行われると、CPU12が撮像動作が行われたときの画像データに対して赤目補正処理を施し、処理が施された画像データをLCD40に表示するとともに、メモリカード30に記録する。
そしてCPU12が、顔が含まれるか否かの判定、顔の位置の検出等を実行するプログラムをシステムメモリ34から読み出して実行することにより、CPU12が撮像制御手段、顔判定手段、顔検出手段、制御手段および変化量判定手段として機能する。
CPU12は、撮影モードが設定されている場合において、以下に示すように、動画像を構成する一のフレームに対して顔を識別する処理を行うことにより顔が含まれるか否かの判定を行うプログラムを実行して、一のフレームに顔が含まれるか否かの判定を行う。
CPU12は、顔の識別に用いる第1の特徴量C1を一のフレームFriから算出するとともに、第2の特徴量C2を後述するようにフレームFriから抽出された顔候補内の画像から算出する。具体的には、第1の特徴量C1として、フレームFriの勾配ベクトルの方向を、第2の特徴量C2として顔候補内の画像の勾配ベクトル(すなわち方向および大きさ)を算出する。以下、勾配ベクトルの算出について説明する。まず、CPU12は、フレームFriに対して図2(a)に示す水平方向のエッジ検出フィルタによるフィルタリング処理を施してフレームFriにおける水平方向のエッジを検出する。また、CPU12は、フレームFriに対して図2(b)に示す垂直方向のエッジ検出フィルタによるフィルタリング処理を施してフレームFriにおける垂直方向のエッジを検出する。そして、フレームFri上の各画素における水平方向のエッジの大きさHおよび垂直方向のエッジの大きさVとから、図3に示すように、各画素における勾配ベクトルKを算出する。
そして、この勾配ベクトルKの方向を第1の特徴量C1とする。具体的には勾配ベクトルKの所定方向(例えば図3におけるx方向)を基準とした0から359度の値を第1の特徴量C1とする。
なお、このようにして算出された勾配ベクトルKは、図4(a)に示すような人物の顔の場合、図4(b)に示すように、目および口のように暗い部分においては目および口の中央を向き、鼻のように明るい部分においては鼻の位置から外側を向くものとなる。また、口よりも目の方が濃度の変化が大きいため、勾配ベクトルKの大きさは口よりも目の方が大きくなる。
ここで、第2の特徴量C2は顔候補内においてのみ算出される。また、第2の特徴量C2の勾配ベクトルKの大きさは正規化される。この正規化は、顔候補内の全画素における勾配ベクトルKの大きさのヒストグラムを求め、その大きさの分布が顔候補内の各画素が取り得る値(8ビットであれば0〜255)に均一に分布されるようにヒストグラムを平滑化して勾配ベクトルKの大きさを補正することにより行う。例えば、勾配ベクトルKの大きさが小さく、図5(a)に示すように勾配ベクトルKの大きさが小さい側に偏ってヒストグラムが分布している場合には、大きさが0〜255の全領域に亘るものとなるように勾配ベクトルKの大きさを正規化して図5(b)に示すようにヒストグラムが分布するようにする。なお、演算量を低減するために、図5(c)に示すように、勾配ベクトルKのヒストグラムにおける分布範囲を例えば5分割し、5分割された頻度分布が図5(d)に示すように0〜255の値を5分割した範囲に亘るものとなるように正規化することが好ましい。
ここで、デジタルカメラ1を用いて撮影を行う際には、照明の明るさや照明の方向が撮影時の条件に応じて様々であるため、明るさや照明の方向はフレームFri毎に異なる。このように明るさや照明の方向が異なるフレームFriのそれぞれについてそのまま勾配ベクトルKを求めていたのでは、同じ顔であるのに目の位置における勾配ベクトルの大きさが異なってしまい、顔候補が顔であるか否かを精度よく識別することができない。この場合、勾配ベクトルKの大きさをフレームFriの全体について正規化すればよいが、正規化は演算量が多いため処理に時間がかかる。このため、本実施形態においては、フレームFriの全体ではなく、顔候補についてのみ第2の特徴量の正規化を行うことにより、演算量を低減して処理時間を短縮している。
なお、CPU12は、後述するようにフレームFriおよび顔候補の変形の各段階において第1および第2の特徴量C1,C2を算出する。
システムメモリ34には、顔の識別のための第1および第2の参照データR1,R2が記憶されている。第1の参照データR1は、後述するサンプル画像から選択された複数画素の組み合わせからなる複数種類の画素群のそれぞれについて、各画素群を構成する各画素における第1の特徴量C1の組み合わせに対する識別条件を規定したものである。また、第2の参照データR2は、サンプル画像から選択された複数画素の組み合わせからなる複数種類の画素群のそれぞれについて、各画素群を構成する各画素における第2の特徴量C2の組み合わせに対する識別条件を規定したものである。
第1および第2の参照データR1,R2中の、各画素群を構成する各画素における第1および第2の特徴量C1,C2の組み合わせおよび識別条件は、顔であることが分かっている複数のサンプル画像と顔でないことが分かっている複数のサンプル画像とからなるサンプル画像群の学習により、あらかじめ決められたものである。
なお、本実施形態においては、顔であることが分かっているサンプル画像として、30×30画素サイズを有し、図6に示すように、1つの顔の画像について両目の中心間の距離が10画素、9画素および11画素であり、垂直に立った顔を基準として平面上±15度の範囲において3度単位で段階的に回転させた(すなわち、回転角度が−15度,−12度,−9度,−6度,−3度,0度,3度,6度,9度,12度,15度)サンプル画像を用いるものとする。したがって、1つの顔の画像につきサンプル画像は3×11=33通り用意される。ここで、顔が垂直に立った状態において上下方向における目の位置はすべてのサンプル画像において同一である。なお、図6においては−15度、0度および+15度に回転させたサンプル画像のみを示す。また、回転の中心はサンプル画像の対角線の交点である。また、顔でないことが分かっているサンプル画像としては、30×30画素サイズを有する任意の画像を用いるものとする。
ここで、顔であることが分かっているサンプル画像として、両目の中心間距離が10画素であり、平面上の回転角度が0度(すなわち顔が垂直な状態)のもののみを用いて学習を行った場合、第1および第2の参照データR1,R2を参照して顔候補または顔であると識別されるのは、両目の中心間距離が10画素で全く回転していない顔候補または顔のみである。フレームFriに含まれる可能性がある顔のサイズは一定ではないため、顔候補が含まれるか否かあるいは顔候補が顔であるか否かを識別する際には、後述するようにフレームFriを拡大縮小して、サンプル画像のサイズに適合するサイズの顔を識別できるようにしている。しかしながら、両目の中心間距離を正確に10画素とするためには、フレームFriのサイズを拡大率として例えば1.1単位で段階的に拡大縮小しつつ識別を行う必要があるため、演算量が膨大なものとなる。
また、フレームFriに含まれる可能性がある顔は、図7(a)に示すように平面上の回転角度が0度のみではなく、図7(b)、(c)に示すように回転している場合もある。しかしながら、両目の中心間距離が10画素であり、顔の回転角度が0度のサンプル画像のみを使用して学習を行った場合、顔であるにも拘わらず、図7(b)、(c)に示すように回転した顔については識別を行うことができなくなってしまう。
このため、本実施形態においては、顔であることが分かっているサンプル画像として、図6に示すように両目の中心間距離が9,10,11画素であり、各距離において平面上±15度の範囲にて3度単位で段階的に顔を回転させたサンプル画像を用いて、第1および第2の参照データR1,R2の学習に許容度を持たせるようにしたものである。これにより、フレームFriを、拡大率として11/9単位で段階的に拡大縮小すればよいため、フレームFriのサイズを例えば拡大率として1.1単位で段階的に拡大縮小する場合と比較して、演算時間を低減できる。また、図7(b)、(c)に示すように回転している顔も識別することができる。
以下、図8のフローチャートを参照しながらサンプル画像群の学習手法の一例を説明する。なお、ここでは第2の参照データR2の学習について説明する。
学習の対象となるサンプル画像群は、顔であることが分かっている複数のサンプル画像と、顔でないことが分かっている複数のサンプル画像とからなる。なお、顔であることが分かっているサンプル画像は、1つのサンプル画像につき両目の中心位置が9,10,11画素であり、各距離において平面上±15度の範囲にて3度単位で段階的に顔を回転させたものを用いる。各サンプル画像には、重みすなわち重要度が割り当てられる。まず、すべてのサンプル画像の重みの初期値が等しく1に設定される(ステップS1)。
次に、サンプル画像における複数種類の画素群のそれぞれについて識別器が作成される(ステップS2)。ここで、それぞれの識別器とは、1つの画素群を構成する各画素における第2の特徴量C2の組み合わせを用いて、顔の画像と顔でない画像とを識別する基準を提供するものである。本実施形態においては、1つの画素群を構成する各画素における第2の特徴量C2の組み合わせについてのヒストグラムを識別器として使用する。
図9を参照しながらある識別器の作成について説明する。図9の左側のサンプル画像に示すように、この識別器を作成するための画素群を構成する各画素は、顔であることが分かっている複数のサンプル画像上における、右目の中心にある画素P1、右側の頬の部分にある画素P2、額の部分にある画素P3および左側の頬の部分にある画素P4である。そして顔であることが分かっているすべてのサンプル画像について全画素P1〜P4における第2の特徴量C2の組み合わせが求められ、そのヒストグラムが作成される。ここで、第2の特徴量C2は勾配ベクトルKの方向および大きさを表すが、勾配ベクトルKの方向は0〜359の360通り、勾配ベクトルKの大きさは0〜255の256通りあるため、これをそのまま用いたのでは、組み合わせの数は1画素につき360×256通りの4画素分、すなわち(360×256)4通りとなってしまい、学習および検出のために多大なサンプルの数、時間およびメモリを要することとなる。このため、本実施形態においては、勾配ベクトルの方向を0〜359を0〜44と315〜359(右方向、値:0),45〜134(上方向値:1),135〜224(左方向、値:2),225〜314(下方向、値3)に4値化し、勾配ベクトルの大きさを3値化(値:0〜2)する。そして、以下の式を用いて組み合わせの値を算出する。
組み合わせの値=0(勾配ベクトルの大きさ=0の場合)
組み合わせの値=((勾配ベクトルの方向+1)×勾配ベクトルの大きさ(勾配ベクトルの大きさ>0の場合)
これにより、組み合わせ数が94通りとなるため、第2の特徴量C2のデータ数を低減できる。
同様に、顔でないことが分かっている複数のサンプル画像についても、ヒストグラムが作成される。なお、顔でないことが分かっているサンプル画像については、顔であることが分かっているサンプル画像上における上記画素P1〜P4の位置に対応する画素(同様に参照符号P1〜P4を用いる)が用いられる。これらの2つのヒストグラムが示す頻度値の比の対数値を取ってヒストグラムで表したものが、図9の一番右側に示す、識別器として用いられるヒストグラムである。この識別器のヒストグラムが示す各縦軸の値を、以下、識別ポイントと称する。この識別器によれば、正の識別ポイントに対応する第2の特徴量C2の分布を示す画像は顔である可能性が高く、識別ポイントの絶対値が大きいほどその可能性は高まると言える。逆に、負の識別ポイントに対応する第2の特徴量C2の分布を示す画像は顔でない可能性が高く、やはり識別ポイントの絶対値が大きいほどその可能性は高まる。ステップS2では、識別に使用され得る複数種類の画素群を構成する各画素における第2の特徴量C2の組み合わせについて、上記のヒストグラム形式の複数の識別器が作成される。
続いて、ステップS2で作成した複数の識別器のうち、画像が顔であるか否かを識別するのに最も有効な識別器が選択される。最も有効な識別器の選択は、各サンプル画像の重みを考慮して行われる。この例では、各識別器の重み付き正答率が比較され、最も高い重み付き正答率を示す識別器が選択される(ステップS3)。すなわち、最初のステップS3では、各サンプル画像の重みは等しく1であるので、単純にその識別器によって画像が顔であるか否かが正しく識別されるサンプル画像の数が最も多いものが、最も有効な識別器として選択される。一方、後述するステップS5において各サンプル画像の重みが更新された後の2回目のステップS3では、重みが1のサンプル画像、重みが1よりも大きいサンプル画像、および重みが1よりも小さいサンプル画像が混在しており、重みが1よりも大きいサンプル画像は、正答率の評価において、重みが1のサンプル画像よりも重みが大きい分多くカウントされる。これにより、2回目以降のステップS3では、重みが小さいサンプル画像よりも、重みが大きいサンプル画像が正しく識別されることに、より重点が置かれる。
次に、それまでに選択した識別器の組み合わせの正答率、すなわち、それまでに選択した識別器を組み合わせて使用して各サンプル画像が顔の画像であるか否かを識別した結果が、実際に顔の画像であるか否かの答えと一致する率が、所定の閾値を超えたか否かが確かめられる(ステップS4)。ここで、組み合わせの正答率の評価に用いられるのは、現在の重みが付けられたサンプル画像群でも、重みが等しくされたサンプル画像群でもよい。所定の閾値を超えた場合は、それまでに選択した識別器を用いれば画像が顔であるか否かを十分に高い確率で識別できるため、学習は終了する。所定の閾値以下である場合は、それまでに選択した識別器と組み合わせて用いるための追加の識別器を選択するために、ステップS6へと進む。
ステップS6では、直近のステップS3で選択された識別器が再び選択されないようにするため、その識別器が除外される。
次に、直近のステップS3で選択された識別器では顔であるか否かを正しく識別できなかったサンプル画像の重みが大きくされ、画像が顔であるか否かを正しく識別できたサンプル画像の重みが小さくされる(ステップS5)。このように重みを大小させる理由は、次の識別器の選択において、既に選択された識別器では正しく識別できなかった画像を重要視し、それらの画像が顔であるか否かを正しく識別できる識別器が選択されるようにして、識別器の組み合わせの効果を高めるためである。
続いて、ステップS3へと戻り、上記したように重み付き正答率を基準にして次に有効な識別器が選択される。
以上のステップS3からS6を繰り返して、顔が含まれるか否かを識別するのに適した識別器として、特定の画素群を構成する各画素における第2の特徴量C2の組み合わせに対応する識別器が選択されたところで、ステップS4で確認される正答率が閾値を超えたとすると、顔が含まれるか否かの識別に用いる識別器の種類と識別条件とが確定され(ステップS7)、これにより第2の参照データR2の学習を終了する。
そして、上記と同様に識別器の種類と識別条件とを求めることにより第1の参照データR1の学習がなされる。
なお、上記の学習手法を採用する場合において、識別器は、特定の画素群を構成する各画素における第1および第2の特徴量C1,C2の組み合わせを用いて顔の画像と顔でない画像とを識別する基準を提供するものであれば、上記のヒストグラムの形式のものに限られずいかなるものであってもよく、例えば2値データ、閾値または関数等であってもよい。また、同じヒストグラムの形式であっても、図9の中央に示した2つのヒストグラムの差分値の分布を示すヒストグラム等を用いてもよい。
また、学習の方法としては上記手法に限定されるものではなく、ニューラルネットワーク等他のマシンラーニングの手法を用いることができる。なお、第1および第2の参照データR1,R2は、熟練した技術者により経験的に定められたものであってもよい。
CPU12は、複数種類の画素群を構成する各画素における第1の特徴量C1の組み合わせのすべてについて第1の参照データR1が学習した識別条件を参照して、各々の画素群を構成する各画素における第1の特徴量C1の組み合わせについての識別ポイントを求め、すべての識別ポイントを総合してフレームFriに顔候補が含まれるか否かを識別する。この際、第1の特徴量C1である勾配ベクトルKの方向は第1の参照データR1を学習した場合と同様に例えば4値化される。本実施形態では、すべての識別ポイントを加算して、その加算値の正負によって識別を行うものとする。例えば、識別ポイントの総和が正の値である場合にはフレームFriには顔候補が含まれると判断し、負の値である場合には顔候補は含まれないと判断する。なお、第1の識別部8が行うフレームFriに顔候補が含まれるか否かの識別を第1の識別と称する。
ここで、フレームFriのサイズは30×30画素のサンプル画像とは異なり、各種サイズを有するものとなっている。また、顔が含まれる場合、平面上における顔の回転角度が0度であるとは限らない。このため、CPU12は、図10に示すように、フレームFriを縦または横のサイズが30画素となるまで段階的に拡大縮小するとともに平面上で段階的に360度回転させつつ(図10においては縮小する状態を示す)、各段階において拡大縮小されたフレームFri上に30×30画素サイズのマスクMを設定し、マスクMを拡大縮小されたフレームFri上において1画素ずつ移動させながら、マスク内の画像が顔の画像であるか否かの識別を行うことにより、フレームFriに顔候補が含まれるか否かを識別する。
なお、第1および第2の参照データR1,R2の生成時に学習したサンプル画像として両目の中心位置の画素数が9,10,11画素のものを使用しているため、フレームFriおよび顔候補の拡大縮小時の拡大率は11/9とすればよい。また、第1および第2の参照データR1,R2の生成時に学習したサンプル画像として、顔が平面上で±15度の範囲において回転させたものを使用しているため、フレームFriおよび顔候補は30度単位で360度回転させればよい。
ここで、CPU12は、フレームFriおよび顔候補の拡大縮小および回転という変形の各段階において第1および第2の特徴量C1,C2を算出する。
そして、フレームFriに顔候補が含まれるか否かの識別を拡大縮小および回転の全段階のフレームFriについて行い、一度でも顔候補が含まれると識別された場合には、フレームFriには顔候補が含まれると識別し、顔候補が含まれると識別された段階におけるサイズおよび回転角度のフレームFriから、識別されたマスクMの位置に対応する30×30画素の領域を顔候補として抽出する。
さらにCPU12は、抽出した顔候補上において、上記と同様に顔候補を段階的に拡大縮小しつつ回転させることにより変形し、顔候補の変形の各段階において、複数種類の画素群を構成する各画素における第2の特徴量C2の組み合わせのすべてについて第2の参照データR2が学習した識別条件を参照して、各々の画素群を構成する各画素における第2の特徴量C2の組み合わせについての識別ポイントを求め、すべての識別ポイントを総合して顔候補が顔であるか否かを識別する。この際、第2の特徴量C2である勾配ベクトルKの方向は4値化され大きさは3値化される。本実施形態では、すべての識別ポイントを加算して、その加算値の正負によって識別を行うものとする。例えば、識別ポイントの総和が正の値である場合には顔候補が顔であると判断され、負の値である場合には顔候補は顔でないと判断される。なお、顔候補が顔であるか否かの識別を第2の識別と称する。
そして、第1の識別においてフレームFriに顔候補が含まれないと識別した場合、および第1の識別においてフレームFriに顔候補が含まれると識別しても第2の識別によりその顔候補が顔でないと識別した場合に、フレームFriには顔が含まれないと判定する。この場合、所定時間後(例えば10フレーム後)のフレームFri+1に対して、上記と同様に第1および第2の識別を行って、顔が含まれるか否かの判定を行う。
一方、第2の識別により第1の識別により識別した顔候補が顔であると識別した場合、フレームFriには顔が含まれると判定する。そして、顔が含まれると判定すると、識別されたマスクMの位置に対応する30×30画素の領域の四隅の座標値を求める。ここで、顔の識別時にはフレームFriを拡大縮小していることから、元のサイズのフレームFriについて、30×30画素の領域の四隅の座標値に対応する4つの座標値を求めることにより顔の位置を検出し、これを顔の位置を表す情報Piとしてシステムメモリ34に記憶する。したがって、本実施形態においては、顔の位置を表す情報Piは、フレームFriに含まれる顔を囲む矩形の四隅の座標値となる。なお、顔の位置を表す情報Piとしてはこれに限定されるものではなく、マスクMの対角線の交点の中心位置の座標およびこれを中心とする円の半径の大きさを顔の位置を表す情報Piとして用いてもよい。
さらに、CPU12は顔の位置を表す情報Piをシステムメモリ34に記憶した後、所定時間後(例えば10フレーム後)のフレームFri+1およびフレームFriの画像の変化量を算出する。具体的には、フレームFri,Fri+1のそれぞれの全画素について画素値を加算し、これを全画素数により除算することによる画素値の平均値(以下Mi,Mi+1とする)を算出する。そして、この平均値Mi,Mi+1の差の絶対値|ΔM|を変化量として算出する。そして、変化量|ΔM|が所定の閾値Th1を超えたか否かを判定する。
ここで、2つのフレームFri,Fri+1間においてシーンが切り替わった場合、2つのフレーム間の画像の変化量|ΔM|は比較的大きくなり、シーンが切り替わらなかった場合には2つのフレーム間の画像の変化量|ΔM|はそれほど大きくならない。したがって、閾値Th1としては、シーンが切り替わったか否かを区別できる程度の値を用いることができる。なお、閾値Th1は、実際にシーンが切り替わった2つのフレーム間の変化量を算出することにより経験的に求めればよい。
そして、変化量|ΔM|が閾値Th1以下の場合には、2つのフレームFri,Fri+1についてはシーンは切り替わっていないものとして、システムメモリ34に記憶された顔の位置の情報Piを読み出し、フレームFri+1については、フレームFriについて検出した顔の位置およびその近傍の領域についてのみ、顔が含まれるか否かの判定を行う。具体的には、図11に示すように、顔の位置の情報PiはフレームFriに含まれる顔を囲む四隅の座標値であるため、この四隅の座標値により規定される矩形領域Aiを中心とし、サイズがこの矩形領域Aiの1.2倍程度の矩形領域Ai+1において、顔が含まれるか否かの判定を行う。なお、この際の顔が含まれるか否かの判定は、上記第1および第2の識別の双方を行ってもよく、第2の識別のみを行ってもよい。
そして、CPU12は、顔が含まれると判定すると、フレームFriの場合と同様に、顔の位置を表す情報Pi+1を求め、これを顔の位置を表す情報Piに代えてシステムメモリ34に記憶する。
一方、変化量|ΔM|が閾値Th1を超えた場合には、2つのフレームFri,Fri+1についてはシーンは切り替わったものとして、フレームFri+1の全体に対して、上記と同様に顔が含まれるか否かの判定を行う。なお、変化量|ΔM|が閾値Th1以下の場合において、顔が含まれると判定されなかった場合にも、2つのフレームFri,Fri+1についてはシーンは切り替わったものとして、フレームFri+1の全体に対して、上記と同様に顔が含まれるか否かの判定を行う。
CPU12は、上記顔が含まれるか否かの判定、顔が含まれると判定した場合の新たな顔の位置を表す情報Pi+1のシステムメモリ34への記憶を、ユーザがレリーズボタンを駆動して撮像動作を行うまで繰り返し行う。そして、ユーザがレリーズボタンを押下して撮像動作を行うと、撮像動作が行われたときに取得された画像データに対して、赤目補正処理を施す。
赤目補正処理は、例えば上記特許文献1に記載されている手法を用いることができる。具体的には、画像データにより表される画像から人物の顔を検出し、検出した顔の範囲内において赤色の画素値を有する画素を検出し、その画素の画素値を黒色に変更する。ここで、本実施形態においては、撮像動作が行われた際にシステムメモリ34に記憶されている顔の位置の情報Piにより、顔の位置を特定することができるため、画像データにより表される画像から人物の顔を検出する処理を行う必要がなくなる。したがって、顔の位置の情報Piにより表される矩形領域Ai内の画像についてのみ、赤色の画素値となる画素の検出および、赤色画素が検出された場合のその画素の黒色への変更の処理を行えばよいこととなる。
次いで、本実施形態において行われる処理について説明する。図12および図13は本実施形態において行われる処理を示すフローチャートである。まず、ユーザによりデジタルカメラ1のモードが撮影モードに切り替えられることにより処理が開始され、まず、CPU12は、顔が含まれるか否かの判定を行うフレームを最初のフレームFri(i=1)に設定し(ステップS11)、フレームFriに顔が含まれるか否かの判定処理を行う(ステップS12)。
図14は顔が含まれるか否かの判定処理のフローチャートである。まず、CPU12は、フレームFriの拡大縮小および回転の各段階において、フレームFriの勾配ベクトルKの方向を第1の特徴量C1として算出する(ステップS31)。そして、システムメモリ34から第1の参照データR1を読み出し(ステップS32)、フレームFriに顔候補が含まれるか否かの第1の識別を行う(ステップS33)。
ステップS33が肯定されると、CPU12はフレームFriから顔候補を抽出する(ステップS34)。なお、複数の顔候補を抽出してもよい。次いで、CPU12は顔候補の拡大縮小および回転の各段階において顔候補から第2の特徴量C2を算出し(ステップS35)、第2の特徴量C2を正規化する(ステップS36)。そして、システムメモリ34から第2の参照データR2を読み出し(ステップS37)、顔候補が顔であるか否かの第2の識別を行う(ステップS38)。
ステップS38が肯定されると、CPU12はフレームFriに顔が含まれると判定し(ステップS39)、処理を終了する。
ステップS33およびステップS38が否定されると、フレームFriには顔が含まれないと判定し(ステップS40)、処理を終了する。
顔が含まれないと判定すると、CPU12は所定時間後の次のフレームに処理対象を変更し(i=i+1、ステップS13)、ステップS12に戻る。顔が含まれると判定すると、顔の位置を検出し(ステップS14)、顔の位置を表す情報Piをシステムメモリ34に記憶する(ステップS15)。そして、CPU12はユーザがレリーズボタンを押下することにより撮像動作を行ったか否かを判定する(ステップS16)。
ステップS16が否定されると、CPU12は所定時間後の次のフレームに処理対象を変更し(ステップS17)、フレームFri+1およびフレームFriの画像の変化量|ΔM|を算出し(ステップS18)、変化量|ΔM|が閾値Th1を超えるか否かを判定する(ステップS19)。ステップS18が肯定されると、2つのフレームFri,Fri+1についてはシーンは切り替わったものとして、フレームFri+1の全体に対して、上記と同様に顔が含まれるか否かの判定を行うべく、ステップS12に戻る。
ステップS19が否定されると、2つのフレームFri,Fri+1についてはシーンは切り替わっていないものとして、システムメモリ34に記憶された顔の位置の情報Piを読み出し(ステップS20)、フレームFri+1については、フレームFriについて検出した顔の位置およびその近傍の領域についてのみ、顔が含まれるか否かの判定を行う(ステップS21)。顔が含まれないと判定すると、ステップS13に戻る。顔が含まれると判定すると、ステップS14に戻って顔の位置を検出し、ステップS15において顔の位置を表す情報Piをシステムメモリ34に記憶する。
ステップS16が肯定されると、撮像動作が行われたときに取得された画像データに対して赤目補正処理を施す(ステップS22)。そして、赤目補正処理が施された画像データをLCD40に表示し(ステップS23)、さらにメモリカード30に記録し(ステップS24)、撮像の処理を終了する。
ここで、デジタルカメラ1を用いて撮影を行う際には、構図を決めてからレリーズボタンを押下するまでに数秒の時間を要し、その間には被写体は動かないことが多い。このため、所定時間間隔でフレームに顔が含まれるか否かの判定、含まれると判定された場合の新たな顔の位置の検出および新たな顔の位置のシステムメモリ34への記憶を行うことにより、システムメモリ34に記憶された顔の位置は、撮像動作により取得した画像データにより表される画像に含まれる顔の位置と対応することとなる。したがって、撮像により取得した画像データに対して赤目補正処理を施す際には、顔の位置の情報Piを用いることにより、画像データにより表される画像から顔を検出する処理を行わなくてもよいこととなる。このため、本実施形態によれば、赤目補正処理の時間を短縮することができ、これにより、撮像により取得した画像データをLCD40に表示したり、次の画像を撮像可能とするまでの待ち時間を少なくすることができ、その結果、待ち時間が長くなることにより撮影者のストレスを軽減することができる。
また、2つのフレームFri,Fri+1間の画像の変化量|ΔM|が閾値Th1を超えるか否かを判定し、変化量|ΔM|が閾値Th1以下である場合にはフレームFri+1におけるシステムメモリ34に記憶された顔の位置およびその近傍の領域においてのみ顔が含まれるか否かの判定処理を行うことにより、2つのフレームFri,Fri+1間においてシーンが変化しない場合には、フレームFri+1の全体に対して顔が含まれるか否かの判定処理を行う必要がなくなる。したがって、顔が含まれるか否かの判定のための処理時間を短縮することができる。
なお、上記実施形態においては、フレームFri,Fri+1間の画像の変化量|ΔM|として、フレームFri,Fri+1の画素値の平均値を用いているが、図15(a),(b)に示すようにフレームFri,Fri+1の画素値と頻度との関係を表すヒストグラムHi,Hi+1を求め、ヒストグラムHi,Hi+1の形状の差(すなわち図15(c)に示す斜線部分の面積)を変化量として用いてもよい。この場合、変化量があらかじめ定めた閾値(Th2とする)を超えるか否かを判定することにより、シーンが切り替わったか否かを判定すればよい。
また、上記実施形態においては、撮像動作により取得した画像データに赤目補正処理を施しているが、画像から人物の顔を検出し、検出した顔に対するノイズを抑制する処理や濃度および階調を変更する処理のように、顔の画質を向上させる処理を施すようにしてもよい。この場合においても、システムメモリ34に記憶された顔の位置を表す情報Piを用いることにより、顔を検出する処理を行う必要がなくなるため、処理時間を短縮することができる。
また、上記実施形態においては、撮像動作により1つの画像データのみを取得しているが、撮像動作時に取得された画像データに対応するフレームに時間的に前後する複数のフレームを1つの画像データとして取得してもよい。例えば、図16に示すように撮影モード設定時には1秒間に30枚のフレームが順次取得されているが、撮像動作が行われたときに取得されるフレーム(以下基準フレームFrsとする)に時間的に前後する複数フレーム(ここでは7フレーム)を1つの画像データとして取得してもよい。また、基準フレームFrsに時間的に前のみまたは後のみの複数フレームを1つの画像データとして取得してもよいことはもちろんである。
このように、複数フレームを画像データとして取得する場合、基準フレームFrsに含まれる顔について目を閉じているか否かを判定し、目を閉じている場合には、複数のフレームから目を閉じていない顔を含むフレームを選択する処理を行うようにしてもよい。また、基準フレームFrsに含まれる顔について笑顔であるか否かを判定し、笑顔でない場合には、複数のフレームから笑顔を含むフレームを選択する処理を行うようにしてもよい。
ここで、目を閉じているか否かの判定あるいは笑顔であるか否かの判定は、画像から顔を検出する必要があるが、本発明においては、システムメモリ34に記憶された顔の位置の情報Piを用いることにより、顔を検出する処理を行う必要がなくなるため、目を閉じているか否かの判定あるいは笑顔であるか否かの判定を行うための処理時間を短縮することができる。
なお、本実施形態においては、フレームFriに顔が含まれるか否かの判定処理を、マシンラーニングの手法による学習により得られた参照データR1,R2を用いて行っているが、顔のテンプレートを用いてフレームFriにテンプレートに適合する形状が含まれるか否かを判定する等、他の手法を用いてもよいことはもちろんである。
本発明の撮像装置の実施形態であるデジタルカメラの構成を示す概略ブロック図 (a)は水平方向のエッジ検出フィルタを示す図、(b)は垂直方向のエッジ検出フィルタを示す図 勾配ベクトルの算出を説明するための図 (a)は人物の顔を示す図、(b)は(a)に示す人物の顔の目および口付近の勾配ベクトルを示す図 (a)は正規化前の勾配ベクトルの大きさのヒストグラムを示す図、(b)は正規化後の勾配ベクトルの大きさのヒストグラムを示す図、(c)は5値化した勾配ベクトルの大きさのヒストグラムを示す図、(d)は正規化後の5値化した勾配ベクトルの大きさのヒストグラムを示す図 顔であることが分かっているサンプル画像の例を示す図 顔の回転を説明するための図 参照データの学習手法を示すフローチャート 識別器の導出方法を示す図 フレームの段階的な変形を説明するための図 変化量が閾値以下の場合に顔が含まれるか否かの判定処理を行う範囲を説明するための図 本実施形態において行われる処理を示すフローチャート(その1) 本実施形態において行われる処理を示すフローチャート(その2) 顔が含まれるか否かの判定処理のフローチャート ヒストグラムの形状の差を変化量とする処理を説明するための図 撮像動作に時間的に前後するフレームを画像データとする処理を説明するための図
符号の説明
1 デジタルカメラ
10 撮像部
12 CPU
22 入力部
34 システムメモリ
40 LCD

Claims (8)

  1. 被写体を撮像して画像データを取得する撮像手段と、
    モードを撮影モード切り替えるモード切替手段と、
    前記画像データを含む各種表示を行う表示手段と、
    撮像動作を行うためのレリーズ手段と、
    前記画像データを含む各種情報を記憶する記憶手段と、
    該撮像手段により前記被写体を撮像し続けて前記被写体の動画像を取得して前記表示手段に表示する撮像制御手段とを備えた撮像装置において、
    前記動画像を構成する一のフレームに人物の顔が含まれるか否かの判定を、所定時間間隔にて該判定が肯定されるまで行う顔判定手段と、
    該顔判定手段により顔が含まれると判定された場合に、該顔が含まれると判定されたフレームからの顔の位置の検出を行う顔検出手段と、
    前記検出した顔の位置を前記記憶手段に記憶し、前記所定時間経過後の次フレームに前記顔が含まれるか否かの判定を行い、該判定が肯定された場合に前記顔の位置の検出を行い、前記レリーズ手段により撮像動作が行われるまで、さらに前記所定時間経過後の次フレームに顔が含まれるか否かの判定、該顔が含まれると判定された場合における顔の位置の検出および新たな顔の位置の前記記憶手段への記憶を行い、前記レリーズ手段により撮像動作が行われたときのフレームまたは該フレームに時間的に前および/または後の複数のフレームを前記画像データとして前記記憶手段に記憶するよう、前記撮像手段、前記顔判定手段、前記顔検出手段、および前記記憶手段を制御する制御手段と、
    前記複数のフレームから笑顔を含むフレームを選択する画像処理手段とを備えたことを特徴とする撮像装置。
  2. 前記次フレームと前記顔が含まれると判定されたフレームとを参照して、該2つのフレーム間の画像の変化量が所定値を超えるか否かを判定する変化量判定手段をさらに備え、
    前記制御手段は、該変化量判定手段により前記変化量が所定値以下であると判定された場合、前記次フレームにおける前記記憶手段に記憶された顔の位置の近傍およびその領域においてのみ前記顔が含まれるか否かの判定を行い、前記変化量判定手段により前記変化量が所定値を超えると判定された場合、前記次フレームに前記顔が含まれるか否かの判定を行うよう前記顔判定手段を制御する手段であることを特徴とする請求項1記載の撮像装置。
  3. 被写体を撮像して画像データを取得する撮像手段と、
    モードを撮影モード切り替えるモード切替手段と、
    前記画像データを含む各種表示を行う表示手段と、
    撮像動作を行うためのレリーズ手段と、
    前記画像データを含む各種情報を記憶する記憶手段と、
    該撮像手段により前記被写体を撮像し続けて前記被写体の動画像を取得して前記表示手段に表示する撮像制御手段とを備えた撮像装置における撮像方法において、
    前記動画像を構成する一のフレームに人物の顔が含まれるか否かの判定を、所定時間間隔にて該判定が肯定されるまで行い、
    該顔が含まれると判定された場合に、該顔が含まれると判定されたフレームからの顔の位置の検出を行い、
    前記検出した顔の位置を前記記憶手段に記憶し、前記所定時間経過後の次フレームに前記顔が含まれるか否かの判定を行い、該判定が肯定された場合に前記顔の位置の検出を行い、前記レリーズ手段により撮像動作が行われるまで、さらに前記所定時間経過後の次フレームに顔が含まれるか否かの判定、該顔が含まれると判定された場合における顔の位置の検出および新たな顔の位置の前記記憶手段への記憶を行い、前記レリーズ手段により撮像動作が行われたときのフレームまたは該フレームに時間的に前および/または後の複数のフレームを前記画像データとして前記記憶手段に記憶し、
    前記複数のフレームから笑顔を含むフレームを選択することを特徴とする撮像方法。
  4. 被写体を撮像して画像データを取得する撮像手段と、
    モードを撮影モード切り替えるモード切替手段と、
    前記画像データを含む各種表示を行う表示手段と、
    撮像動作を行うためのレリーズ手段と、
    前記画像データを含む各種情報を記憶する記憶手段と、
    該撮像手段により前記被写体を撮像し続けて前記被写体の動画像を取得して前記表示手段に表示する撮像制御手段とを備えた撮像装置における撮像方法をコンピュータに実行させるためのプログラムにおいて、
    前記動画像を構成する一のフレームに人物の顔が含まれるか否かの判定を、所定時間間隔にて該判定が肯定されるまで行う手順と、
    該顔が含まれると判定された場合に、該顔が含まれると判定されたフレームからの顔の位置の検出を行う手順と、
    前記検出した顔の位置を前記記憶手段に記憶し、前記所定時間経過後の次フレームに前記顔が含まれるか否かの判定を行い、該判定が肯定された場合に前記顔の位置の検出を行い、前記レリーズ手段により撮像動作が行われるまで、さらに前記所定時間経過後の次フレームに顔が含まれるか否かの判定、該顔が含まれると判定された場合における顔の位置の検出および新たな顔の位置の前記記憶手段への記憶を行い、前記レリーズ手段により撮像動作が行われたときのフレームまたは該フレームに時間的に前および/または後の複数のフレームを前記画像データとして前記記憶手段に記憶する手順と、
    前記複数のフレームから笑顔を含むフレームを選択する手順とをコンピュータに実行させるためのプログラム。
  5. 被写体を撮像して画像データを取得する撮像手段と、
    モードを撮影モード切り替るモード切替手段と、
    前記画像データを含む各種表示を行う表示手段と、
    撮像動作を行うためのレリーズ手段と、
    前記画像データを含む各種情報を記憶する記憶手段と、
    該撮像手段により前記被写体を撮像し続けて前記被写体の動画像を取得して前記表示手段に表示する撮像制御手段とを備えた撮像装置において、
    前記動画像を構成する一のフレームに人物の顔が含まれるか否かの判定を、所定時間間隔にて該判定が肯定されるまで行う顔判定手段と、
    該顔判定手段により顔が含まれると判定された場合に、該顔が含まれると判定されたフレームからの顔の位置の検出を行う顔検出手段と、
    前記検出した顔の位置を前記記憶手段に記憶し、前記所定時間経過後の次フレームに前記顔が含まれるか否かの判定を行い、該判定が肯定された場合に前記顔の位置の検出を行い、前記レリーズ手段により撮像動作が行われるまで、さらに前記所定時間経過後の次フレームに顔が含まれるか否かの判定、該顔が含まれると判定された場合における顔の位置の検出および新たな顔の位置の前記記憶手段への記憶を行い、前記レリーズ手段により撮像動作が行われたときのフレームまたは該フレームに時間的に前および/または後の複数のフレームを前記画像データとして前記記憶手段に記憶するよう、前記撮像手段、前記顔判定手段、前記顔検出手段および前記記憶手段を制御する制御手段とを備えたことを特徴とする撮像装置。
  6. メモリーカードを着脱自在に保持するスロット部とを更に備え、
    前記記憶手段が、前記撮像装置の本体内に設けられた内部メモリと、前記スロット部に保持されたメモリーカードとを有し、前記顔の位置を表す情報を前記内部メモリに記憶することを特徴とする請求項5記載の撮像装置。
  7. 被写体を撮像して画像データを取得する撮像手段と、
    モードを撮影モード切り替えるモード切替手段と、
    前記画像データを含む各種表示を行う表示手段と、
    撮像動作を行うためのレリーズ手段と、
    前記画像データを含む各種情報を記憶する記憶手段と、
    該撮像手段により前記被写体を撮像し続けて前記被写体の動画像を取得して前記表示手段に表示する撮像制御手段とを備えた撮像装置における撮像方法において、
    前記動画像を構成する一のフレームに人物の顔が含まれるか否かの判定を、所定時間間隔にて該判定が肯定されるまで行い、
    該顔が含まれると判定された場合に、該顔が含まれると判定されたフレームからの顔の位置の検出を行い、
    前記検出した顔の位置を前記記憶手段に記憶し、前記所定時間経過後の次フレームに前記顔が含まれるか否かの判定を行い、該判定が肯定された場合に前記顔の位置の検出を行い、前記レリーズ手段により撮像動作が行われるまで、さらに前記所定時間経過後の次フレームに顔が含まれるか否かの判定、該顔が含まれると判定された場合における顔の位置の検出および新たな顔の位置の前記記憶手段への記憶を行い、前記レリーズ手段により撮像動作が行われたときのフレームまたは該フレームに時間的に前および/または後の複数のフレームを前記画像データとして前記記憶手段に記憶することを特徴とする撮像方法。
  8. 被写体を撮像して画像データを取得する撮像手段と、
    モードを撮影モード切り替えるモード切替手段と、
    前記画像データを含む各種表示を行う表示手段と、
    撮像動作を行うためのレリーズ手段と、
    前記画像データを含む各種情報を記憶する記憶手段と、
    該撮像手段により前記被写体を撮像し続けて前記被写体の動画像を取得して前記表示手段に表示する撮像制御手段とを備えた撮像装置における撮像方法をコンピュータに実行させるためのプログラムにおいて、
    前記動画像を構成する一のフレームに人物の顔が含まれるか否かの判定を、所定時間間隔にて該判定が肯定されるまで行う手順と、
    該顔が含まれると判定された場合に、該顔が含まれると判定されたフレームからの顔の位置の検出を行う手順と、
    前記検出した顔の位置を前記記憶手段に記憶し、前記所定時間経過後の次フレームに前記顔が含まれるか否かの判定を行い、該判定が肯定された場合に前記顔の位置の検出を行い、前記レリーズ手段により撮像動作が行われるまで、さらに前記所定時間経過後の次フレームに顔が含まれるか否かの判定、該顔が含まれると判定された場合における顔の位置の検出および新たな顔の位置の前記記憶手段への記憶を行い、前記レリーズ手段により撮像動作が行われたときのフレームまたは該フレームに時間的に前および/または後の複数のフレームを前記画像データとして前記記憶手段に記憶する手順とをコンピュータに実行させるためのプログラム。
JP2008325571A 2008-12-22 2008-12-22 撮像装置および方法並びにプログラム Expired - Lifetime JP4323559B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008325571A JP4323559B2 (ja) 2008-12-22 2008-12-22 撮像装置および方法並びにプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008325571A JP4323559B2 (ja) 2008-12-22 2008-12-22 撮像装置および方法並びにプログラム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2008006960A Division JP4629740B2 (ja) 2008-01-16 2008-01-16 撮像装置および方法並びにプログラム

Publications (2)

Publication Number Publication Date
JP2009171569A JP2009171569A (ja) 2009-07-30
JP4323559B2 true JP4323559B2 (ja) 2009-09-02

Family

ID=40972179

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008325571A Expired - Lifetime JP4323559B2 (ja) 2008-12-22 2008-12-22 撮像装置および方法並びにプログラム

Country Status (1)

Country Link
JP (1) JP4323559B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012060529A (ja) * 2010-09-10 2012-03-22 Toshiba Corp 画像処理装置及び画像処理方法

Also Published As

Publication number Publication date
JP2009171569A (ja) 2009-07-30

Similar Documents

Publication Publication Date Title
JP4121026B2 (ja) 撮像装置および方法並びにプログラム
US10157325B2 (en) Image capture device with contemporaneous image correction mechanism
US7565073B2 (en) Photography apparatus, photography method, and photography program for obtaining an image of a subject
US8593542B2 (en) Foreground/background separation using reference images
JP4708909B2 (ja) デジタル画像の対象物検出方法および装置並びにプログラム
US8983202B2 (en) Smile detection systems and methods
JP2007065844A (ja) 顔検出方法および装置並びにプログラム
JP6098133B2 (ja) 顔構成部抽出装置、顔構成部抽出方法及びプログラム
JP4629740B2 (ja) 撮像装置および方法並びにプログラム
JP4323559B2 (ja) 撮像装置および方法並びにプログラム
JP4831344B2 (ja) 目の位置の検出方法
JP6070098B2 (ja) 閾値設定装置、閾値設定方法及びプログラム
JP6776532B2 (ja) 画像処理装置、撮像装置、電子機器及び画像処理プログラム
CN116366960A (zh) 拍摄方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090501

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090602

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090604

R150 Certificate of patent or registration of utility model

Ref document number: 4323559

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120612

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120612

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130612

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R154 Certificate of patent or utility model (reissue)

Free format text: JAPANESE INTERMEDIATE CODE: R154

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term