JP2014021901A - 被写体検出装置、被写体検出方法及びプログラム - Google Patents

被写体検出装置、被写体検出方法及びプログラム Download PDF

Info

Publication number
JP2014021901A
JP2014021901A JP2012162545A JP2012162545A JP2014021901A JP 2014021901 A JP2014021901 A JP 2014021901A JP 2012162545 A JP2012162545 A JP 2012162545A JP 2012162545 A JP2012162545 A JP 2012162545A JP 2014021901 A JP2014021901 A JP 2014021901A
Authority
JP
Japan
Prior art keywords
unit
subject
types
detection
face detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2012162545A
Other languages
English (en)
Other versions
JP2014021901A5 (ja
Inventor
Masanori Ishihara
正規 石原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Computer Co Ltd
Original Assignee
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Computer Co Ltd filed Critical Casio Computer Co Ltd
Priority to JP2012162545A priority Critical patent/JP2014021901A/ja
Priority to KR1020130085010A priority patent/KR101529384B1/ko
Priority to US13/946,791 priority patent/US9055215B2/en
Priority to CN201310308804.3A priority patent/CN103578102B/zh
Publication of JP2014021901A publication Critical patent/JP2014021901A/ja
Publication of JP2014021901A5 publication Critical patent/JP2014021901A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/61Control of cameras or camera modules based on recognised objects
    • H04N23/611Control of cameras or camera modules based on recognised objects where the recognised objects include parts of the human body
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation

Abstract

【課題】安定しない撮影環境下においても被写体の検出をより適正に行うこと。
【解決手段】本実施形態の撮像装置1は、選択部41と、取得部42と、検出部43と、を備える。選択部41は、所定の記憶部19に記憶された、特定の撮影環境に対応した被写体の学習テンプレートから、特定の学習テンプレートを選択する。取得部42は、撮像部18により撮像された画像を逐次取得する。検出部43は、選択部41により選択された特定の学習テンプレートを用いて、取得部42により逐次取得される撮像画像中の被写体画像を検出する。
【選択図】図2

Description

本発明は、被写体検出装置、被写体検出方法及びプログラムに関する。
従来から、画像に含まれる顔領域の検出(以下、「顔検出」と呼ぶ)の際に、逆光等の条件下にあっても検出の精度を向上させるための技術が開示されている(例えば、特許文献1参照)。このような技術が適用された装置は、逆光時に撮像されている撮像画像のデータに対してゲイン調整処理を施した後に、顔領域を推定している。
特開2008−108024号公報
しかしながら、特許文献1に開示された技術を適用した場合、撮影環境が逆光状態等から別の状態に変化するような撮影環境が安定しないケースでは、その都度ゲイン調整処理の内容を変更する必要があるため、結果的に顔検出処理が困難になる虞がある。
本発明は、このような状況に鑑みてなされたものであり、安定しない撮影環境下においても被写体の検出をより適正に行うことを目的とする。
上記目的を達成するため、本発明の一態様の被写体検出装置は、
画像を逐次取得する取得手段と、
所定の記憶手段に記憶された複数種の撮影環境に夫々対応した複数種の被写体の識別器から、特定の識別器を選択する選択手段と、
前記選択手段により選択された特定の識別器を用いて、前記取得手段により逐次取得される画像中の被写体画像を検出する検出手段と、
を備えることを特徴とする。
本発明によれば、安定しない撮影環境下においても被写体の検出をより適正に行うことができる。
本発明の第1実施形態に係る撮像装置のハードウェアの構成を示すブロック図である。 図1の撮像装置の機能的構成のうち、顔検出制御処理を実行するための機能的構成を示す機能ブロック図である。 図2の機能的構成を有する図1の撮像装置が実行する顔検出制御処理の流れを説明するフローチャートである。 図1の撮像装置の機能的構成のうち、第2実施形態に係る顔検出制御処理を実行するための機能的構成を示す機能ブロック図である。 図4の機能的構成を有する図1の撮像装置が実行する第2実施形態に係る顔検出制御処理の流れを説明するフローチャートである。 図2の機能的構成を有する図1の撮像装置が実行する第3実施形態に係る顔検出制御処理の流れを説明するフローチャートである。
以下、本発明の実施形態について、図面を用いて説明する。
[第1実施形態]
図1は、本発明の第1実施形態に係る撮像装置のハードウェアの構成を示すブロック図である。
撮像装置1は、例えばデジタルカメラとして構成される。
撮像装置1は、CPU(Central Processing Unit)11と、ROM(Read Only Memory)12と、RAM(Random Access Memory)13と、バス14と、入出力インターフェース15と、出力部16と、入力部17と、撮像部18と、記憶部19と、通信部20と、ドライブ21と、表示部22と、を備えている。
CPU11は、ROM12に記録されているプログラム、又は、記憶部19からRAM13にロードされたプログラムに従って各種の処理を実行する。
RAM13には、CPU11が各種の処理を実行する上において必要なデータ等も適宜記憶される。
CPU11、ROM12及びRAM13は、バス14を介して相互に接続されている。このバス14にはまた、入出力インターフェース15も接続されている。入出力インターフェース15には、出力部16、入力部17、撮像部18、記憶部19、通信部20及びドライブ21が接続されている。
出力部16は、ディスプレイやスピーカ等で構成され、画像や音声を出力する。
入力部17は、電源ボタン、シャッタボタン等各種ボタン等で構成され、ユーザの指示操作に応じて各種情報を入力する。なお、ここでいう各種ボタン等には、ハードウェアボタンのみならず、出力部16の画面に表示されるソフトウェアボタンも含まれる。即ち、入力部17は、出力部16のディスプレイに積層されるタッチパネルも含むように構成されている。
撮像部18は、被写体を撮像し、当該被写体の像を含む画像(以下、「撮像画像」と称する)のデータをCPU11に供給する。
記憶部19は、ハードディスク或いはDRAM(Dynamic Random Access Memory)等で構成され、撮像画像等の各種画像のデータを記憶する。
記憶部19はまた、特定の撮影環境に対応した顔識別器群(以下、「学習テンプレート」と呼ぶ)を撮影環境毎に複数種記憶している。学習テンプレートは、公知又は今後登場するであろう任意の技術により生成されたものが採用可能であり、本実施形態においては、逆光時、低照度時、通常時(例えば、順光時)といった各撮影環境専用の各々の学習テンプレートが採用されている。各学習テンプレートは、各撮影環境専用毎に、被写体の顔が所定の方向に向いた状態に対応した複数種の顔識別器により構成される。本実施形態においては、上述した顔識別器群として、学習テンプレートは、被写体が、撮像装置1等のカメラのレンズ側に対して正面に向いている方向(以下、「正面方向」と呼ぶ)、撮像装置1の光軸を中心にして回転した方向(以下、「ロー(roll)方向」と呼ぶ)、上下を軸として回転した方向(以下、「ヨー(yaw)方向」と呼ぶ)、左右を軸として回転した方向(以下、「ピッチ(pitch)方向」と呼ぶ)、の各方向に向いた4つの識別器により構成される。
通信部20は、インターネットを含むネットワークを介して他の装置(図示せず)との間で行う通信を制御する。
ドライブ21には、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリ等よりなる、リムーバブルメディア31が適宜装着される。ドライブ21によってリムーバブルメディア31から読み出されたプログラムは、必要に応じて記憶部19にインストールされる。また、リムーバブルメディア31は、記憶部19に記憶されている画像のデータ等の各種データも、記憶部19と同様に記憶することができる。
表示部22は、撮像部18により撮像されたライブビュー画像を表示する他、記録された画像を再生したものを表示する。また、表示部22には、本実施形態における顔検出制御処理において、検出された顔に対して顔枠が表示される。
図2は、このような撮像装置1の機能的構成のうち、顔検出制御処理を実行するための機能的構成を示す機能ブロック図である。
顔検出制御処理とは、ユーザにより入力部17のシャッタボタンが半押しされたことにより撮像装置1の動作モードが顔検出状態に変更されたことを契機として開始される、次のような処理をいう。即ち、顔検出制御処理とは、予め準備された複数の学習テンプレートを入れ換えながら顔検出処理を行い、顔検出が成功したら、それ以後の顔検出処理においては、顔検出が成功した学習テンプレートを用いて顔検出処理を行うまでの一連の処理をいう。顔検出処理は、例えば、各学習テンプレートに基づいて、ニューラルネットワーク(NN)、アダブースト(AdaBoost)、サポートベクターマシン(SVM)と呼ばれるアルゴリズムに従って顔領域を推定する処理をいう。
ニューラルネットワーク(NN)、アダブースト(AdaBoost)、サポートベクターマシン(SVM)、による顔検出処理は、公知の技術であるため、本実施例では、詳細な説明については省略する。
なお、半押しとは、入力部17のシャッタボタンの途中(下限に至らない所定の位置)まで押下する操作をいう。
CPU11においては、顔検出制御処理の実行が制御される場合、選択部41と、取得部42と、検出部43と、が機能する。
なお、図2は例示であり、撮像装置1にGA(Graphics Accelerator)等の画像処理専用のハードウェアを備えて、CPU11の機能の少なくとも一部を当該ハードウェアに委譲してもよい。
また、記憶部19は、上述したように、特定の撮影環境に対応した被写体の学習テンプレートを複数種記憶している。
選択部41は、記憶部19に記憶された複数種の学習テンプレートから特定の学習テンプレートを選択する。ここで、特定の学習テンプレートとは、通常時、逆光時、低照度時等、各々の特定の撮影環境下において被写体を検出するのに特化した学習テンプレートをいう。
詳細には、選択部41は、後述の取得部42により取得される撮像画像のデータに基づいて、当該撮像画像内の被写体を特定し、当該被写体に適合する特定の学習テンプレートを選択する。選択部41は、特定の学習テンプレートに属する複数の識別器の各々内の顔領域と、撮像画像内の被写体の顔領域との類似度を算出する。選択部41は、所定値以上の類似度を有する識別器を、被写体の顔と適合する識別器として認識する。選択部41は、特定の学習テンプレートを選択する順番として、例えば、記憶部19に記憶された通常時の学習テンプレート、逆光時の学習テンプレート、低照度時の学習テンプレート、という順番を採用して、その順番で学習テンプレートを入れ替えながら選択する。また、選択部41は、後述の検出部43から顔検出が失敗(顔検出がロスト)した旨の通知を受けた場合、更に異なる学習テンプレートに入れ替えることで、別の学習テンプレートを選択する。選択部41は、選択した学習テンプレートを特定可能な情報を生成して、検出部43へ供給する。
ここで、顔検出が失敗したときの学習テンプレートを入れ替える順番としては、入れ替える順番の初期値(通常時の学習テンプレート)から再び学習テンプレートを順に入れ替えてながら顔検出を行っても良いし、顔検出が失敗した学習テンプレートの次の学習テンプレートから再び学習テンプレートを順に入れ替えてながら顔検出を行っても良い。
取得部42は、撮像部18により撮像された撮像画像のデータを逐次取得する。取得部42は、撮像画像のデータを取得する毎に検出部43へ逐次供給する。
検出部43は、取得部42により逐次取得される撮像画像のデータを用いて顔検出処理を行う。検出部43は、取得部42により撮像画像のデータ中が逐次取得される毎に、選択部41により選択された特定の学習テンプレートを用いて、撮像画像内の被写体の顔領域を検出する。詳細には、検出部43は、選択部41により選択された特定の学習テンプレートに属する各識別器、具体的には、正面方向の識別器、ロー方向の識別器、ヨー方向の識別器、及びピッチ方向の識別器の夫々をその順番で入れ替える。検出部43は、学習テンプレートを入れ替える毎に、顔検出処理をその都度実行する。
このように、検出部43が、通常時の学習テンプレート、逆光時の学習テンプレート、低照度時の学習テンプレート等、特定の撮影環境に応じた学習テンプレートを用いて顔検出処理を行うことにより、顔検出の精度が向上する。
なお、検出部43は、顔検出が失敗(顔検出がロスト)した場合、選択部41により入り替えられた学習テンプレートを用いて、顔検出処理を再度実行する。検出部43は、検出部により顔検出ができたか(顔検出がロストしたか)否かの旨の情報を、選択部41へ通知する。
次に、図3を参照して、このような図2の機能的構成の撮像装置1が実行する顔検出制御処理について説明する。
図3は、図2の機能的構成を有する図1の撮像装置1が実行する顔検出制御処理の流れを説明するフローチャートである。
顔検出制御処理は、例えば、ユーザにより入力部17のシャッタボタンが半押しされて撮像装置1の動作モードが顔検出状態に変更されたことを契機として開始され、次のような処理が繰り返し実行される。
ステップS101において、取得部42は、撮像部18により撮像された撮像画像のデータを逐次取得する。
ステップS102において、検出部43は、学習テンプレートを入れ替えながら顔検出処理を行う。この処理では、初めに、選択部41は、取得部42により取得される撮像画像のデータに基づいて、当該撮像画像内の被写体を特定し、当該被写体に適合する特定の学習テンプレートを選択する。そして、検出部43は、選択部41により選択された学習テンプレートを用いて、撮像画像内の被写体の顔領域を検出する顔検出処理を行う。
ステップS103において、検出部43は、顔検出が成功したか否かを判定する。顔検出が成功しなかった場合には、ステップS103においてNOであると判定されて、処理はステップS102に戻る。即ち、顔検出が成功するまでの間、選択部41による学習テンプレートの選択が繰り返し行われることとなる。これに対し、顔検出が成功した場合には、ステップS103においてYESであると判定されて、処理はステップ104に進む。
ステップS104において、検出部43は、顔検出がされた学習テンプレートで以後の顔検出処理を実行する。この処理では、検出部43は、ステップS103において顔検出が成功したと判定された直前にステップS102において選択された学習テンプレートを用いて、顔検出処理を行う。これにより、顔検出処理の精度を高めることができる。
ステップS105において、検出部43は、顔検出ができなくなったか否かを判定する。顔検出が成功している場合には、ステップS105において、NOであると判定されて処理はステップS104に戻る。即ち、顔検出ができている間は、ステップS103において顔検出が成功したと判定された直前にステップS102において選択された学習テンプレートを用いた顔検出処理が継続して実行される。これに対し、顔検出ができなくなった場合には、ステップS105において、YESであると判定されて、処理はステップS106に進む。
ステップS106において、検出部43は、顔検出制御処理の終了指示を受け付けたか否かを判定する。終了指示を受け付けていない場合、ステップS106においてNOであると判定されて、処理はステップS102に戻る。即ち、顔検出制御処理の終了指示を受け付けていない場合には、検出部43は、学習テンプレートを再度入れ替えながら顔検出処理を行い、ステップS102〜S106の処理が繰り返し行われる。これに対し、顔検出制御処理の終了指示を受け付けた場合、ステップS106においてYESであると判定されて、顔検出制御処理は終了となる。
以上説明したように、本実施形態の撮像装置1は、選択部41と、取得部42と、検出部43と、を備える。選択部41は、所定の記憶部19に記憶された、特定の撮影環境に対応した被写体の学習テンプレートから、特定の学習テンプレートを選択する。取得部42は、撮像部18により撮像された画像を逐次取得する。検出部43は、選択部41により選択された特定の学習テンプレートを用いて、取得部42により逐次取得される撮像画像中の被写体画像を検出する。
これにより、特定の撮影環境に対応した学習テンプレートに基づいて被写体画像の検出を行うことができることから、変化のある撮影環境下においても被写体の検出をより適切に行うことができる。また、所定の撮影環境に対応した学習テンプレートを被写体の検出処理に適用した後に、撮影環境が異なるものに遷移した場合であっても、それ以降の撮影環境に応じた被写体の検出を行うことができる。このように、撮影環境が遷移する場合であっても、別途撮影環境を検出するためのセンサを設けずに精度の高い被写体の検出を行うことができる。
更に、本実施形態の選択部41は、記憶部19に記憶された複数種の学習テンプレートの夫々を順に用いて、取得部42により取得される撮像画像中の被写体に適合する特定の識別器を選択する。
これにより、様々な撮影環境に対応するように選択された学習テンプレートに基づいて被写体の検出を行うことができるので、被写体の検出の精度を向上することができる。
以上、本発明の第1実施形態に係る撮像装置1について説明した。
次に、本発明の第2実施形態に係る撮像装置1について説明する。
[第2実施形態]
第2実施形態に係る撮像装置1は、第1実施形態に係る撮像装置1と基本的に同様のハードウェア構成を取ることができる。
従って、図1は、第2実施形態に係る撮像装置1のハードウェアの構成を示すブロック図でもある。
ただし、第1実施形態の選択部41は、複数種の学習テンプレートを順に用いて、特定の学習テンプレートを選択しているが、第2実施形態の選択部41は、選択された学習テンプレートに属する複数種の識別器と被写体画像とが夫々適合する回数の総和が最も大きい学習テンプレートを、特定の学習テンプレートとして選択する。そこで、第2実施形態の撮像装置1は、更に算出部51を備える。そこで、以下、このような差異点について主に説明し、一致点の説明は適宜省略する。
更に、第2実施形態に係る撮像装置1が実行する顔検出制御処理は、第1実施形態に係る顔検出制御処理と基本的に同様の流れとなる。ただし、第1実施形態の顔検出制御処理は、学習テンプレートを入れ替えた後に顔検出処理がされた学習テンプレートで以後の顔検出処理を実行しているが、第2実施形態の顔検出制御処理は、顔検出処理での顔検出数の総和が最も大きい学習テンプレートを用いて顔検出処理が行われる。
図4は、このような撮像装置1の機能的構成のうち、第2実施形態の顔検出制御処理を実行するための機能的構成を示す機能ブロック図である。
CPU11においては、第2実施形態の顔検出制御処理の実行が制御される場合、選択部41と、取得部42と、検出部43と、に加えて更に算出部51が機能する。
算出部51は、記憶部19に記憶された複数種の学習テンプレートの夫々を一定期間中に循環的に顔検出処理の処理対象として用いながら、顔検出処理に使用される学習テンプレートに属する複数種の識別器と被写体画像とが適合する回数を算出する。詳細には、算出部51は、選択された各学習テンプレート中の識別器(正面方向、ロー方向、ヨー方向、ピッチ方向の各識別器)を一定時間内に順に入れ替えて顔検出処理が行われた結果の顔検出の総和を算出する。例えば、逆光時の学習テンプレートに含まれる正面方向の識別器と、ヨー方向の識別器とにおいて1回ずつ撮像画像内の被写体と適合した場合には、逆光時の学習テンプレートにおける顔画像と適合する回数を1+1=2回とする。算出部51は、学習テンプレート毎に算出した回数の情報を選択部41へ供給する。
選択部41は、算出部51により算出された回数が最も大きい学習テンプレートを、特定の学習テンプレートとして選択する。なお、各学習テンプレートの顔検出の総和が同数となった場合には、同数となった学習テンプレートのうち、先に検出した学習テンプレートを選択する。選択部41は、選択した学習テンプレートの情報を検出部43へ供給する。
次に、図5を参照して、図4の機能的構成の第2実施形態の撮像装置1が実行する顔検出制御処理について説明する。
図5は、図4の機能的構成を有する図1の第2実施形態の撮像装置1が実行する顔検出制御処理の流れを説明するフローチャートである。
顔検出制御処理は、ユーザにより入力部17のシャッタボタンが半押しされた撮像装置1の動作モードが顔検出状態に変更されたことを契機として開始され、次のような処理が繰り返し実行される。
ステップS201において、取得部42は、撮像部18により撮像された撮像画像のデータを逐次取得する。
ステップS202において、検出部43は、学習テンプレートを入れ替えながら顔検出処理を行う。この処理では、初めに、選択部41は、取得部42により取得される撮像画像のデータに基づいて、当該撮像画像内の被写体を特定し、当該被写体に適合する特定の学習テンプレートを選択する。そして、検出部43は、選択部41により選択された学習テンプレートを用いて、撮像画像内の被写体の顔領域を検出する顔検出処理を行う。
ステップS203において、算出部51は、一定時間が経過したか否かを判定する。この処理では、算出部51は、各学習テンプレートが選択部41により複数回入れ替えられるまで任意の時間nをカウントしながら、各学習テンプレートによる顔検出処理が一定時間の間行われるまで待機する。各学習テンプレートが入れ替えられる回数としては、1〜100回等任意の回数を設定することができる。一定時間が経過していない場合には、ステップS203においてNOであると判定されて、処理はステップS202に戻る。即ち、一定時間が経過するまでの間、選択部41による学習テンプレートの選択が繰り返し行われることとなる。これに対し、一定時間が経過した場合には、ステップS203においてYESであると判定されて、処理はステップS204に進む。
ステップS204において、算出部51は、ステップS202の顔検出処理において検出された各学習テンプレートでの顔検出数の総和を算出する。
ステップS205において、検出部43は、ステップS204において算出した顔検出数の総和が最も大きい学習テンプレートで顔検出処理を実行する。この処理では、検出部43は、顔検出数の総和が最も大きい、即ち、最も多く顔の検出に成功した学習テンプレートを用いて、顔検出処理を行う。これにより、顔検出処理の精度を高めることができる。
ステップS206において、検出部43は、顔検出ができなくなったか否かを判定する。顔検出が成功している場合には、ステップS206において、NOであると判定されて処理はステップS205に戻る。即ち、顔検出が成功している間は、最も多く顔の検出に成功した学習テンプレートを用いた顔検出処理が継続して実行される。これに対し、顔検出ができなくなった場合には、ステップS206において、YESであると判定されて、処理はステップS207に進む。
ステップS207において、検出部43は、顔検出制御処理の終了指示を受け付けたか否かを判定する。終了指示を受け付けていない場合、ステップS207においてNOであると判定されて、処理はステップS202に戻る。即ち、顔検出制御処理の終了指示を受け付けていない場合には、検出部43は、学習テンプレートを再度入れ替えながら顔検出処理を行い、ステップS202〜S206の処理が繰り返し行われる。これに対し、顔検出制御処理の終了指示を受け付けた場合、ステップS207においてYESであると判定されて、顔検出制御処理は終了となる。
以上説明したように、第2実施形態の撮像装置1は、算出部51を更に備える。算出部51は、記憶部19に記憶された複数種の学習テンプレートの夫々を一定期間中に循環的に用いながら、当該学習テンプレートに属する複数種の識別器と被写体画像とが適合する回数を算出する。そして、選択部41は、算出部51により算出された回数が最も大きい学習テンプレートを、特定の学習テンプレートとして選択する。
これにより、被写体画像と適合する回数が最も多い学習テンプレートに基づいて被写体画像の検出を行うことができることから、精度の高い被写体画像の検出を行うことができる。
以上、本発明の第2実施形態に係る撮像装置1について説明した。
次に、本発明の第3実施形態に係る撮像装置1について説明する。
[第3実施形態]
第3実施形態に係る撮像装置1は、第1実施形態に係る撮像装置1と基本的に同様のハードウェア構成を取ることができる。
従って、図1は、第3実施形態に係る撮像装置1のハードウェアの構成を示すブロック図でもある。
また、第3実施形態に係る撮像装置1が実行する顔検出制御処理は、第1実施形態に係る顔検出制御処理と基本的に同様の流れとなる。ただし、第3実施形態の顔検出制御処理は更に、各学習テンプレートによる顔検出結果をFIFO(First In, First Out)形式のバッファへ格納し被写体画像を統合処理する。FIFO形式のバッファとは、記憶部19に設けられた所定の格納領域を有するバッファ領域に対し、所定のバッファ領域を超える量の顔検出結果が格納された場合、一番先にバッファに格納された顔検出結果が後に格納した顔検出結果と入れ替わって格納されるバッファの形式をいう。また、統合処理とは、複数の被写体画像の検出結果をまとめる処理をいう。
図6を参照して、図2の機能的構成の第3実施形態の撮像装置1が実行する顔検出制御処理について説明する。
図6は、図2の機能的構成を有する図1の第3実施形態の撮像装置1が実行する顔検出制御処理の流れを説明するフローチャートである。
顔検出制御処理は、ユーザにより入力部17のシャッタボタンが半押しされて撮像装置1の動作モードが顔検出状態に変更されたことを契機として開始され、次のような処理が繰り返し実行される。
ステップS301において、取得部42は、撮像部18により撮像された撮像画像のデータを逐次取得する。
ステップS302において、検出部43は、学習テンプレートを入れ替えながら顔検出処理を行う。この処理では、初めに、選択部41は、取得部42により取得される撮像画像のデータに基づいて、当該撮像画像内の被写体を特定し、当該被写体に適合する特定の学習テンプレートを選択する。そして、検出部43は、選択部41により選択された学習テンプレートを用いて、撮像画像内の被写体の顔領域を検出する顔検出処理を行う。
ステップS303において、検出部43は、ステップS302において検出した夫々の学習テンプレートでの顔検出結果をFIFO形式のFIFOバッファに格納する。この処理では、検出部43は、顔検出処理で検出した顔検出結果を、記憶部19の一領域に形成されたFIFOバッファに格納する。所定のバッファ領域を超える量の顔検出結果が格納される場合は、検出部43は、FIFOバッファに対し、FIFOバッファに格納されている顔検出結果のうち、一番先に格納した顔検出結果が後に格納した顔検出結果と入れ替えて格納する。
ステップS304において、検出部43は、ステップS303において格納したFIFOバッファに格納された顔検出結果をマージしたものを1フレームでの出力結果として出力する。検出部43は、マージする方法として、FIFOバッファに格納されている被写体像の顔の位置と、顔の大きさが近似しているもの同士を平均化して1フレームにまとめる処理を行う。なお、被写体像の顔の位置と、顔の大きさとが近似するものがない場合には、FIFOバッファに記憶されている顔の位置と顔の大きさとをそのまま1フレームでの出力結果として出力する。これにより、顔検出処理の精度を高めることができる。
また、出力後の処理として、出力結果に対する顔位置や大きさに基づいて、顔の検出枠を表示部22に表示させるようにしても良い。
ステップS305において、顔検出制御処理の終了指示を受け付けたか否かを判定する。終了指示を受け付けていない場合、ステップS305においてNOであると判定されて、処理はステップS302に戻る。即ち、顔検出制御処理の終了指示を受け付けるまでの間、FIFOバッファに格納された顔検出結果をマージしたものが1フレームでの出力結果として継続して出力される。これに対し、顔検出制御処理の終了指示を受け付けた場合、ステップS305においてYESであると判定されて、顔検出制御処理は終了となる。
以上説明したように、第3実施形態の撮像装置1は、取得部42により逐次取得される撮像画像の夫々に対する検出部43の検出結果をFIFOバッファに格納することで、被写体画像を統合処理する。これにより、直近の撮影環境に基づいて検出された検出結果により被写体画像の検出行うことができることから、精度の高い被写体画像の検出を行うことができる。
なお、本発明は、上述の実施形態に限定されるものではなく、本発明の目的を達成できる範囲での変形、改良等は本発明に含まれるものである。
例えば、上述の実施形態では、顔検出制御処理において、自動で学習テンプレートを選択するようにしたが、これに限られない。
つまり、複数の顔検出モードとして「通常時の顔検出モード(通常時の学習テンプレートを用いた顔検出モード)」、「逆光時の顔検出モード(逆光時の学習テンプレートを用いた顔検出モード)」、「低照度時の顔検出モード(低照度時の学習テンプレートを用いた顔検出モード)」をユーザ自身が別個に選択できるようにすることで、ユーザ自身が撮影環境を判断して、顔検出制御で使用される学習テンプレートを設定しても良い。
また、上述の実施形態では、選択部41は、学習テンプレートを選択する順番として、記憶部19に記憶された通常時の学習テンプレート、逆光時の学習テンプレート、低照度時の学習テンプレート、とをその順番で入れ替えながら選択しているがこれに限られない。例えば、撮像装置1に撮影環境の判定手段として別途照度センサを設け、該照度センサにより検出した撮影環境に応じて、選択部41により入れ替える学習テンプレートの順序を変更することができる。例えば、選択部41は、照度センサにより撮影環境として逆光を検出した場合には、逆光時の学習テンプレートを優先して選択する。また、選択部41は、照度センサにより撮影環境として低照度を検出した場合には、低照度時の学習テンプレートを優先して選択する。
また、撮影環境の判定手段として、画像中の輝度を解析することで撮影環境を判定するようにしても良い。
また、上述の実施形態では、検出部43は、選択された各学習テンプレートに含まれる、正面方向の識別器、ロー方向の識別器、ヨー方向の識別器、ピッチ方向の識別器、を順に入れ替えながら顔検出処理を行っているがこれに限られない。例えば、検出部43は、選択された学習テンプレートに含まれる、各方向の識別器に対し同時に顔検出処理を行うことができる。
また、上述の実施形態では、各実施形態は独立して実行されているがこれに限られるものではなく、例えば、第1実施形態の撮像装置1,第2実施形態の撮像装置1,第3実施形態の撮像装置1の夫々の処理を組み合わせて実行することができる。
また、上述の実施形態では、顔検出制御処理の例としたが特にこれに限定されない。例えば、顔検出制御だけでなく、手を検出対象とした各学習テンプレートを使用すれば、上述した実施形態を手の検出に対しても適用できる。また、検出対象が人間の顔の他に、動物の顔を検出対象としても本実施形態は適用できる。つまり、学習テンプレートの設計対象を任意の被写体を対象とすることで、当該任意の被写体の検出に対して本実施形態を適用できる。
また、上述の実施形態では、本発明が適用される撮像装置1は、デジタルカメラを例として説明したが、特にこれに限定されない。
例えば、本発明は、撮像機能を有する電子機器一般に適用することができる。具体的には、例えば、本発明は、ノート型のパーソナルコンピュータ、テレビジョン受像機、ビデオカメラ、携帯型ナビゲーション装置、携帯電話機、ポータブルゲーム機等に適用可能である。
上述した一連の処理は、ハードウェアにより実行させることもできるし、ソフトウェアにより実行させることもできる。
換言すると、図2の機能的構成は例示に過ぎず、特に限定されない。即ち、上述した一連の処理を全体として実行できる機能が撮像装置1に備えられていれば足り、この機能を実現するためにどのような機能ブロックを用いるのかは特に図2の例に限定されない。
また、1つの機能ブロックは、ハードウェア単体で構成してもよいし、ソフトウェア単体で構成してもよいし、それらの組み合わせで構成してもよい。
一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、コンピュータ等にネットワークや記録媒体からインストールされる。
コンピュータは、専用のハードウェアに組み込まれているコンピュータであってもよい。また、コンピュータは、各種のプログラムをインストールすることで、各種の機能を実行することが可能なコンピュータ、例えば汎用のパーソナルコンピュータであってもよい。
このようなプログラムを含む記録媒体は、ユーザにプログラムを提供するために装置本体とは別に配布される図1のリムーバブルメディア31により構成されるだけでなく、装置本体に予め組み込まれた状態でユーザに提供される記録媒体等で構成される。リムーバブルメディア31は、例えば、磁気ディスク(フロッピディスクを含む)、光ディスク、又は光磁気ディスク等により構成される。光ディスクは、例えば、CD−ROM(Compact Disk−Read Only Memory),DVD(Digital Versatile Disk)等により構成される。光磁気ディスクは、MD(Mini−Disk)等により構成される。また、装置本体に予め組み込まれた状態でユーザに提供される記録媒体は、例えば、プログラムが記録されている図1のROM12や、図1の記憶部19に含まれるハードディスク等で構成される。
なお、本明細書において、記録媒体に記録されるプログラムを記述するステップは、その順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的或いは個別に実行される処理をも含むものである。
以上、本発明のいくつかの実施形態について説明したが、これらの実施形態は、例示に過ぎず、本発明の技術的範囲を限定するものではない。本発明はその他の様々な実施形態を取ることが可能であり、更に、本発明の要旨を逸脱しない範囲で、省略や置換等種々の変更を行うことができる。これら実施形態やその変形は、本明細書等に記載された発明の範囲や要旨に含まれると共に、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
以下に、本願の出願当初の特許請求の範囲に記載された発明を付記する。
[付記1]
画像を逐次取得する取得手段と、
所定の記憶手段に記憶された複数種の撮影環境に夫々対応した複数種の被写体の識別器から、特定の識別器を選択する選択手段と、
前記選択手段により選択された特定の識別器を用いて、前記取得手段により逐次取得される画像中の被写体画像を検出する検出手段と、
を備えることを特徴とする被写体検出装置。
[付記2]
前記記憶手段に記憶された複数種の識別器の夫々を順に用いて、当該複数種の識別器から前記取得手段により取得される画像中の被写体画像に適合する識別器を判定する判定手段を更に備え、
前記選択手段は、前記判定手段による判定結果に基づいて、前記特定の識別器を選択する、
ことを特徴とする付記1に記載の被写体検出装置。
[付記3]
前記記憶手段に記憶された複数種の識別器の夫々を一定期間中に循環的に用いながら、前記複数種の識別器と前記被写体画像とが適合する回数を算出する算出手段を更に備え、
前記選択手段は、更に、前記算出手段により算出された回数に基づいて、前記特定の識別器を選択する
ことを特徴とする付記1又は2に記載の被写体検出装置。
[付記4]
前記取得手段により逐次取得される画像の夫々に対する前記検出手段の検出結果を統合する統合手段と、
前記統合手段による統合結果に基づいて、前記画像中の被写体像の位置を決定する位置決定手段と、
を更に備えたことを特徴とする付記1から3の何れかに記載の被写体検出装置。
[付記5]
前記選択手段は、ユーザ操作に基づいて、前記特定の識別器を選択することを特徴とする付記1又は4に記載の被写体検出装置。
[付記6]
前記選択手段は、所定の記憶手段に記憶された複数種の撮影環境に夫々対応した複数種の被写体の識別器群から、特定の識別器群を選択し、
前記検出手段は、前記選択手段により選択された特定の識別器群を用いて、前記取得手段により逐次取得される画像中の被写体画像を検出する
ことを特徴とする付記1から4の何れかに記載の被写体検出装置。
[付記7]
被写体検出装置が実行する被写体検出方法において、
画像を逐次取得する取得ステップと、
所定の記憶手段に記憶された複数種の撮影環境に夫々対応した複数種の被写体の識別器から、特定の識別器を選択する選択ステップと、
前記選択ステップにより選択された特定の識別器を用いて、前記取得ステップにより逐次取得される画像中の被写体像を検出する検出ステップと、
を含む被写体検出方法。
[付記8]
コンピュータを、
画像を逐次取得する取得手段、
所定の記憶手段に記憶された複数種の撮影環境に夫々対応した複数種の被写体の識別器から、特定の識別器を選択する選択手段、
前記選択手段により選択された特定の識別器を用いて、前記取得手段により逐次取得される画像中の被写体画像を検出する検出手段、
として機能させることを特徴とするプログラム。
1・・・撮像装置、11・・・CPU、12・・・ROM、13・・・RAM、14・・・バス、15・・・入出力インターフェース、16・・・出力部、17・・・入力部、18・・・撮像部、19・・・記憶部、20・・・通信部、21・・・ドライブ、31・・・リムーバブルメディア、41・・・選択部、42・・・取得部、43・・・検出部、51・・・算出部

Claims (8)

  1. 画像を逐次取得する取得手段と、
    所定の記憶手段に記憶された複数種の撮影環境に夫々対応した複数種の被写体の識別器から、特定の識別器を選択する選択手段と、
    前記選択手段により選択された特定の識別器を用いて、前記取得手段により逐次取得される画像中の被写体画像を検出する検出手段と、
    を備えることを特徴とする被写体検出装置。
  2. 前記記憶手段に記憶された複数種の識別器の夫々を順に用いて、当該複数種の識別器から前記取得手段により取得される画像中の被写体画像に適合する識別器を判定する判定手段を更に備え、
    前記選択手段は、前記判定手段による判定結果に基づいて、前記特定の識別器を選択する、
    ことを特徴とする請求項1に記載の被写体検出装置。
  3. 前記記憶手段に記憶された複数種の識別器の夫々を一定期間中に循環的に用いながら、前記複数種の識別器と前記被写体画像とが適合する回数を算出する算出手段を更に備え、
    前記選択手段は、更に、前記算出手段により算出された回数に基づいて、前記特定の識別器を選択する
    ことを特徴とする請求項1又は2に記載の被写体検出装置。
  4. 前記取得手段により逐次取得される画像の夫々に対する前記検出手段の検出結果を統合する統合手段と、
    前記統合手段による統合結果に基づいて、前記画像中の被写体像の位置を決定する位置決定手段と、
    を更に備えたことを特徴とする請求項1から3の何れかに記載の被写体検出装置。
  5. 前記選択手段は、ユーザ操作に基づいて、前記特定の識別器を選択することを特徴とする請求項1又は4に記載の被写体検出装置。
  6. 前記選択手段は、所定の記憶手段に記憶された複数種の撮影環境に夫々対応した複数種の被写体の識別器群から、特定の識別器群を選択し、
    前記検出手段は、前記選択手段により選択された特定の識別器群を用いて、前記取得手段により逐次取得される画像中の被写体画像を検出する
    ことを特徴とする請求項1から4の何れかに記載の被写体検出装置。
  7. 被写体検出装置が実行する被写体検出方法において、
    画像を逐次取得する取得ステップと、
    所定の記憶手段に記憶された複数種の撮影環境に夫々対応した複数種の被写体の識別器から、特定の識別器を選択する選択ステップと、
    前記選択ステップにより選択された特定の識別器を用いて、前記取得ステップにより逐次取得される画像中の被写体像を検出する検出ステップと、
    を含む被写体検出方法。
  8. コンピュータを、
    画像を逐次取得する取得手段、
    所定の記憶手段に記憶された複数種の撮影環境に夫々対応した複数種の被写体の識別器から、特定の識別器を選択する選択手段、
    前記選択手段により選択された特定の識別器を用いて、前記取得手段により逐次取得される画像中の被写体画像を検出する検出手段、
    として機能させることを特徴とするプログラム。
JP2012162545A 2012-07-23 2012-07-23 被写体検出装置、被写体検出方法及びプログラム Pending JP2014021901A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2012162545A JP2014021901A (ja) 2012-07-23 2012-07-23 被写体検出装置、被写体検出方法及びプログラム
KR1020130085010A KR101529384B1 (ko) 2012-07-23 2013-07-18 피사체 검출 장치, 피사체 검출 방법 및 기록 매체
US13/946,791 US9055215B2 (en) 2012-07-23 2013-07-19 Subject detection device and subject detection method for detecting subject image from image using selected discriminator corresponding to a photographing environment
CN201310308804.3A CN103578102B (zh) 2012-07-23 2013-07-22 被摄体检测装置及被摄体检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012162545A JP2014021901A (ja) 2012-07-23 2012-07-23 被写体検出装置、被写体検出方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2014021901A true JP2014021901A (ja) 2014-02-03
JP2014021901A5 JP2014021901A5 (ja) 2015-08-20

Family

ID=49946233

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012162545A Pending JP2014021901A (ja) 2012-07-23 2012-07-23 被写体検出装置、被写体検出方法及びプログラム

Country Status (4)

Country Link
US (1) US9055215B2 (ja)
JP (1) JP2014021901A (ja)
KR (1) KR101529384B1 (ja)
CN (1) CN103578102B (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6955211B2 (ja) * 2017-12-14 2021-10-27 オムロン株式会社 識別装置、識別方法及びプログラム
JP7163578B2 (ja) * 2018-01-09 2022-11-01 いすゞ自動車株式会社 運転状態判定装置及び運転状態判定方法
JP7035890B2 (ja) * 2018-08-01 2022-03-15 オムロン株式会社 光電センサ
JP2021022057A (ja) * 2019-07-25 2021-02-18 ファナック株式会社 設置支援装置、設置支援システム及び設置支援プログラム

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005115525A (ja) * 2003-10-06 2005-04-28 Fuji Photo Film Co Ltd 識別処理に用いる特徴量の種類と識別条件を決定する装置、プログラムならびにプログラムを記録した記録媒体、および特定内容のデータを選別する装置
JP2005210288A (ja) * 2004-01-21 2005-08-04 Fuji Photo Film Co Ltd 撮像装置および方法並びにプログラム
JP2007213182A (ja) * 2006-02-08 2007-08-23 Fujifilm Corp 対象物状態認識方法および装置並びにプログラム
JP2011013838A (ja) * 2009-06-30 2011-01-20 Sumitomo Electric Ind Ltd 移動体検出装置、移動体検出方法及びコンピュータプログラム
JP2011014052A (ja) * 2009-07-03 2011-01-20 Nikon Corp 画像識別装置、画像識別方法、識別器作成装置、識別器作成方法、および撮像システム

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001357404A (ja) * 2000-06-14 2001-12-26 Minolta Co Ltd 画像抽出装置
US7920725B2 (en) * 2003-09-09 2011-04-05 Fujifilm Corporation Apparatus, method, and program for discriminating subjects
JP4572583B2 (ja) * 2004-05-31 2010-11-04 パナソニック電工株式会社 撮像装置
JP5027580B2 (ja) * 2006-07-25 2012-09-19 富士フイルム株式会社 撮影装置および方法並びにプログラム
US7893969B2 (en) * 2006-07-25 2011-02-22 Fujifilm Corporation System for and method of controlling a parameter used for detecting an objective body in an image and computer program
JP2008108024A (ja) 2006-10-25 2008-05-08 Matsushita Electric Ind Co Ltd 画像処理装置および撮像装置
JP4286292B2 (ja) * 2007-01-30 2009-06-24 三洋電機株式会社 電子カメラ
JP4911165B2 (ja) * 2008-12-12 2012-04-04 カシオ計算機株式会社 撮像装置、顔検出方法及びプログラム
JP5272886B2 (ja) * 2009-05-14 2013-08-28 ソニー株式会社 動体検出装置と動体検出方法およびコンピュータ・プログラム
JP5663923B2 (ja) * 2010-03-31 2015-02-04 カシオ計算機株式会社 撮像装置、撮像方法及びプログラム
JP2011257805A (ja) * 2010-06-04 2011-12-22 Sony Corp 情報処理装置および方法、並びにプログラム
JP5320443B2 (ja) * 2011-07-19 2013-10-23 富士フイルム株式会社 高速判別装置および高速判別装置を高速化する方法、並びに高速判別装置プログラム
CN102280030B (zh) * 2011-07-20 2013-09-25 杭州海康威视数字技术股份有限公司 夜晚车辆检测的方法及其系统
CN102332094B (zh) * 2011-10-24 2013-06-26 西安电子科技大学 半监督在线学习人脸检测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005115525A (ja) * 2003-10-06 2005-04-28 Fuji Photo Film Co Ltd 識別処理に用いる特徴量の種類と識別条件を決定する装置、プログラムならびにプログラムを記録した記録媒体、および特定内容のデータを選別する装置
JP2005210288A (ja) * 2004-01-21 2005-08-04 Fuji Photo Film Co Ltd 撮像装置および方法並びにプログラム
JP2007213182A (ja) * 2006-02-08 2007-08-23 Fujifilm Corp 対象物状態認識方法および装置並びにプログラム
JP2011013838A (ja) * 2009-06-30 2011-01-20 Sumitomo Electric Ind Ltd 移動体検出装置、移動体検出方法及びコンピュータプログラム
JP2011014052A (ja) * 2009-07-03 2011-01-20 Nikon Corp 画像識別装置、画像識別方法、識別器作成装置、識別器作成方法、および撮像システム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
林伸治, 外1名: ""低解像度画像からの顔検出"", 画像電子学会誌, vol. 第34巻, 第6号, JPN6016025228, 25 November 2005 (2005-11-25), JP, pages 726 - 737, ISSN: 0003349591 *

Also Published As

Publication number Publication date
KR101529384B1 (ko) 2015-06-16
KR20140012891A (ko) 2014-02-04
CN103578102B (zh) 2016-08-24
CN103578102A (zh) 2014-02-12
US20140022412A1 (en) 2014-01-23
US9055215B2 (en) 2015-06-09

Similar Documents

Publication Publication Date Title
US10115178B2 (en) Image processing apparatus, image capturing apparatus, image processing method, and storage medium
US9521310B2 (en) Method and apparatus for focusing on subject in digital image processing device
WO2019042419A1 (zh) 图像跟踪点获取方法、设备及存储介质
US9380206B2 (en) Image processing apparatus that combines images
US9473702B2 (en) Controlling image capture and/or controlling image processing
JP5939705B2 (ja) 被写体判定装置、被写体判定方法及びプログラム
US10382671B2 (en) Image processing apparatus, image processing method, and recording medium
WO2012137621A1 (ja) 画像処理方法及び装置
US20190230269A1 (en) Monitoring camera, method of controlling monitoring camera, and non-transitory computer-readable storage medium
WO2014074959A1 (en) Real-time face detection using pixel pairs
US8368764B2 (en) Digital photographing apparatus and method for controlling the same
JP2021176243A (ja) 画像処理装置およびその制御方法、ならびに撮像装置
JP2014186505A (ja) 視線検出装置及び撮像装置
JP2014021901A (ja) 被写体検出装置、被写体検出方法及びプログラム
JP2013017218A (ja) 画像処理装置、画像処理方法及びプログラム
US10880457B2 (en) Image processing apparatus, image capturing apparatus, image processing method, and storage medium
US20200005021A1 (en) Face detection device, control method thereof, and program
JP6003133B2 (ja) 撮像装置、撮像制御方法及びプログラム
JP6460510B2 (ja) 画像処理装置、画像処理方法及びプログラム
CN107431756B (zh) 自动图像帧处理可能性检测的方法和装置
JP2014067142A (ja) 画像処理装置、画像処理方法、撮像装置、および撮像方法
JP2013187726A (ja) 画像解析装置、画像処理装置、画像解析方法及びプログラム
JP2014057261A (ja) 画像生成装置、画像生成方法、撮像装置、および撮像方法
JP5740934B2 (ja) 被写体検出装置、被写体検出方法及びプログラム
WO2020095790A1 (ja) 被写体検知装置、システム、方法および記録媒体

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150630

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150630

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160622

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160705

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20170110