JP5843618B2 - 画像処理装置、その制御方法、及びプログラム - Google Patents

画像処理装置、その制御方法、及びプログラム Download PDF

Info

Publication number
JP5843618B2
JP5843618B2 JP2012001585A JP2012001585A JP5843618B2 JP 5843618 B2 JP5843618 B2 JP 5843618B2 JP 2012001585 A JP2012001585 A JP 2012001585A JP 2012001585 A JP2012001585 A JP 2012001585A JP 5843618 B2 JP5843618 B2 JP 5843618B2
Authority
JP
Japan
Prior art keywords
face
face recognition
person
similarity
face area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012001585A
Other languages
English (en)
Other versions
JP2013142930A (ja
JP2013142930A5 (ja
Inventor
宣和 吉田
宣和 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2012001585A priority Critical patent/JP5843618B2/ja
Publication of JP2013142930A publication Critical patent/JP2013142930A/ja
Publication of JP2013142930A5 publication Critical patent/JP2013142930A5/ja
Application granted granted Critical
Publication of JP5843618B2 publication Critical patent/JP5843618B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Studio Devices (AREA)
  • Image Analysis (AREA)

Description

本発明は、画像処理装置、その制御方法、及びプログラムに関し、特に画像内に含まれる顔画像について人物を特定する顔認識技術に関する。
デジタルカメラ等の撮像装置の中には、被写体に含まれる人物の顔を検出する顔検出機能を有するものがある。このような撮像装置は顔検出処理により、例えば人物の顔と判断するパターンが予め定められており、画像内に含まれる該パターンに一致する箇所を、人物の顔として検出することができる。検出された人物の顔は、例えば合焦制御や露出制御において参照される。
また近年では、顔検出処理により検出された人物の顔について、予め登録された顔と一致するか否かを判断する顔認識機能を有する撮像装置もある。撮像装置で行われる顔認識処理は、顔認識の基準となる顔画像あるいは該顔画像の特徴量が登録された顔認識用データを使用して行われる。具体的には顔認識処理では、予め顔認識用データ(顔辞書)に登録されている各人物について、処理対象の顔画像の類似度を算出し、最も高い類似度を有する人物が該顔画像に含まれる人物として特定される。
しかしながら、顔認識処理で算出される類似度は、被写体の状態や撮影環境に応じて変化する。即ち、環境変化等によって類似度が低下した場合、誤った顔認識結果が得られることがあった。特許文献1では、算出された類似度が人物を特定するための閾値を超えない場合に、登録されている名称ではなく、人物が属するグループ名称を表示することで、誤った顔認識結果が表示されることを回避する技術が開示されている。
特開2010−27034号公報
一方、顔認識処理では、1つの顔画像について人物を特定するための閾値を超える類似度の複数の人物が候補として現れる場合もある。このような場合、顔検出結果としていずれかの人物が特定されることになるが、所望の人物が顔認識結果として選択されないことがあった。
本発明は、上述の問題点に鑑みてなされたものであり、顔認識処理において、所望の顔認識結果を安定して得ることができる画像処理装置、その制御方法、及びプログラムを提供することを目的とする。
前述の目的を達成するために、本発明の画像処理装置は、以下の構成を備える。
録されている複数の人物の顔認識用データとの類似度に基づいて、画像内の顔領域の人物を特定し、特定した人物を示す情報を顔認識結果として出力する顔認識手段を有する画像処理装置であって、画像を順次取得する取得手段と、取得手段により取得された画像から顔領域を検出する検出手段と、検出手段により検出された顔領域と複数の人物の顔認識用データそれぞれとの類似度を判定する判定手段と、取得手段により取得された第1の画像から検出された対象顔領域について、該第1の画像よりも前に取得され第2の画像から検出された顔領域の中から、同一の人物に対応すると判断する候補顔領域を特定する特定手段と、対象顔領域と候補顔領域の人物の顔認識用データとの類似度が所定の条件を満たす場合に、第1の画像よりも後に取得される第3の画像に含まれる対象顔領域に対応するとして特定される顔領域の顔認識結果が候補顔領域の人物を示すように顔認識手段を制御する制御手段と、を有することを特徴とする。
このような構成により本発明によれば、顔認識処理において、所望の顔認識結果を安定して得ることが可能となる。
本発明の実施形態に係るデジタルカメラ100の機能構成を示したブロック図 本発明の実施形態に係る顔認識処理を例示したフローチャート 本発明の実施形態に係る顔領域詳細情報及び閾値テーブルのデータ構造を例示した図 本発明の実施形態に係る切替抑止判定処理及び安定判定処理を例示したフローチャート
以下、本発明の例示的な実施形態について、図面を参照して詳細に説明する。なお、以下に説明する一実施形態は、画像処理装置の一例としての、顔認識用データを使用した顔認識処理を実行可能なデジタルカメラに、本発明を適用した例を説明する。しかし、本発明は、顔認識用データを使用した顔認識処理を実行することが可能な任意の機器に適用可能である。
また、本明細書において「顔画像」とは、人物が含まれる画像から抽出された、人物の顔領域の画像であるものとする。また「顔辞書」とは、各人物についての1以上の顔画像と各顔画像に含まれる顔領域の特徴量のデータとを含む、顔認識処理におけるマッチング処理に用いられる顔認識用データであるものとして説明する。なお、顔辞書は、含められる顔画像の数が予め定められているものとする。
<デジタルカメラ100の構成>
図1は、本発明の実施形態に係るデジタルカメラ100の機能構成を示すブロック図である。
CPU101は、デジタルカメラ100が有する各ブロックの動作を制御する。具体的にはCPU101は、ROM102に記憶されている顔認識処理等の動作プログラムを読み出し、RAM103に展開して実行することにより、各ブロックの動作を制御する。
ROM102は、例えば書き換え可能な不揮発性メモリであり、撮影処理等の動作プログラムに加え、デジタルカメラ100が有する各ブロックの動作に必要なパラメータ等を記憶する。
RAM103は、揮発性メモリであり、顔認識処理等の動作プログラムの展開領域としてだけでなく、デジタルカメラ100が有する各ブロックの動作において出力された中間データ等を格納する格納領域としても用いられる。
撮像部105は、CCDやCMOSセンサ等の撮像素子、A/D変換部等で構成される。撮像部105は、光学系104により撮像素子上に結像された光学像を光電変換し、さらにA/D変換処理を適用した撮像画像を出力する。なお撮像部105は、入力されたアナログ画像信号に対して、サンプリング、ゲイン調整等の処理も実行する。
画像処理部106は、撮像部105から出力された撮像画像に対して、色補正や色変換等、所定の画像処理を適用する。また画像処理部106は、本実施形態では顔検出部107及び類似度算出部108を有している。
顔検出部107は、例えばYUV形式に変換された画像について、特定の被写体である人物の顔を検出する。具体的には顔検出部107は、画像内の色情報やコントラスト分布に応じて、人物の顔のパターンに対応する領域(顔領域)を検出する。顔検出部107により行われる顔検出処理は、検出結果として顔領域の位置及び画素数を出力するものとする。
類似度算出部108は、入力された顔領域の画像について特徴量の解析を行う。そして類似度算出部108は、後述する記録媒体109に記録されている顔辞書を使用し、解析された特徴量に対応する人物の特定を行う。具体的には類似度算出部108は、顔辞書に登録されている各人物ついて、登録されている顔画像あるいはその特徴量についての類似度を示すスコアを算出する。
記録媒体109は、例えばデジタルカメラ100が有する内蔵メモリや、メモリカードやHDD等のデジタルカメラ100に着脱可能に接続される記録装置である。本実施形態では記録媒体109には、撮影処理により撮影された画像や、デジタルカメラ100における顔認識処理で参照される顔辞書が記録される。記録媒体109に記録される画像は、画像内に人物が含まれる場合、顔認識処理により得られた人物が顔認識結果として関連付けられて記録される。なお、本実施形態では、顔辞書が記録媒体109に記録されているものとして説明するが、本発明の実施はこれに限られるものではない。例えば顔辞書はROM102等、書き込み可能な領域に格納されていればよい。また顔辞書は、外部装置から受信した際に、CPU101が所定の記録領域に格納する構成であってもよい。
表示部110は、例えば小型LCD等のデジタルカメラ100が有する表示装置である。表示部110には、撮像部105から出力された撮像画像や、記録媒体109に記録された画像等が表示される。なお、顔認識処理により特定された人物が表示されている画像に含まれる場合、例えばその人物名が重畳表示されることにより、顔認識結果をユーザに通知することができる。
操作入力部111は、例えば電源ボタンやシャッタボタン等の操作部材を含む、デジタルカメラ100が有するユーザインタフェースである。操作入力部111は、ユーザによる操作部材の操作がなされたことを検出すると、操作内容に対応する制御信号を生成してCPU101に伝送する。
<顔認識処理>
このような構成をもつ本実施形態のデジタルカメラ100の顔認識処理について、図2のフローチャートを用いて具体的な処理を説明する。該フローチャートに対応する処理は、CPU101が、例えばROM102に記憶されている対応する処理プログラムを読み出し、RAM103に展開して実行することにより実現することができる。なお、本顔認識処理は、例えば撮像部105により撮像された撮像画像が出力された際に開始されるものとして説明する。また本顔認識処理は、撮像部105から出力される撮像画像を順次取得して行われてもよいし、所定フレーム間隔で取得された撮像画像について順次行われてもよい。
S201で、CPU101は、撮像部105から出力された撮像画像を画像処理部106に入力し、顔検出処理を実行させる。具体的には顔検出部107は、画像処理部106に入力された撮像画像に対して、該画像に含まれる人物の顔のパターンを検出し、顔領域を特定する。
S202で、CPU101は、S201で検出した顔領域(現在の顔領域)の各々について、顔領域を検出した撮像画像(第1の画像)よりも前に顔認識処理を行なった撮像画像(第2の画像)から検出した顔領域の中から、同一の被写体であると認識する対応する候補顔領域を特定する。具体的にはCPU101は、前回の顔認識処理において検出及び含まれる人物の特定がなされた顔領域(過去顔領域)を特定する顔領域特定情報をRAM103から読み出す。顔領域情報は、本実施形態では検出した顔領域を識別する顔識別ID、及び該顔領域の位置情報(例えば中心座標)が含まれる。CPU101は、過去顔領域の各々について顔領域情報の位置情報と、現在の顔領域の各々の位置情報を参照し、現在の顔領域の各々について対応する候補顔領域を特定する。このときCPU101は、現在の顔領域の各々に、対応する候補顔領域に付与されていた顔識別IDを付与する。
なお、過去顔領域の各々については、顔認識処理により特定された該顔領域に含まれる人物を示す情報等を示す顔領域詳細情報が関連付けられてRAM103に記憶されている。また、対応する過去顔領域の特定には上述した以外にパターンマッチング等の手法が用いられてもよいが、現在の顔領域の位置と過去の顔領域の位置とを比較する方法は、処理負荷を高くすることなく実現できるため好ましい。
(顔領域詳細情報)
ここで、本実施形態の顔認識処理で用いられる顔領域詳細情報について、図3(a)を用いて説明する。図示されるように、顔領域詳細情報には関連付けられた過去顔領域に付されているものと同一の顔識別ID301に加え、安定フラグ302、切替抑止フラグ303、顔認識ID304、及び類似度履歴305が含まれる。
安定フラグ302は、順次取得された撮像画像について顔認識処理を行なった結果、対応する顔領域、即ち同一の被写体であると認識した顔領域についての顔認識結果が安定しているか否かを示す論理型の情報である。詳細な安定判断方法については後述するが、本実施形態では顔認識処理による顔認識結果が所定の回数連続して同一であり、かつ、該顔認識結果である人物について算出された類似度が該所定の回数連続して閾値以上(第2の閾値以上)である場合に、CPU101は顔認識結果が安定していると判断する。安定フラグ302は、顔認識結果が安定している場合はtrue(ON)、安定していない場合はfalse(OFF)を示す。
切替抑止フラグ303は、同一の被写体であると認識した顔領域について、顔認識処理による顔認識結果が、異なる人物に切り替わって出力されることを抑止するか否かを示す論理型の情報である。切替抑止フラグ303は、顔認識結果の切り替わりを抑止する場合はtrue、抑止しない場合はfalseを示す。
顔認識ID304は、最後に行われた顔認識処理において特定された人物を示す識別情報である。本実施形態では顔認識ID304は、記録媒体109に記録されている顔認識用データに予め登録されている人物のうち、1人の人物についての顔画像群や特徴量群を特定する識別情報と同一のものが用いられるものとする。即ち、顔認識ID304を参照することにより、CPU101は最後に行われた顔認識処理において特定された人物についての顔認識用のデータを特定することができる。
類似度履歴305は、同一の被写体であると認識した顔領域について、類似度算出部108により算出された類似度を処理順に格納する。
即ち、本ステップでは、現在の顔領域の各々について、対応する候補顔領域に付与されていた顔識別IDを付与することにより、現在の顔領域には、候補顔領域に関連付けられていた顔領域詳細情報が継承されて関連付けられる(候補取得)。つまり、S201で検出された各顔領域は、本ステップにより該顔領域に対応する候補顔領域についての顔認識結果である人物が含まれていると予測される。以下では、含まれていると予測される人物を「候補人物」として説明する。
なお、本ステップにおいて対応する候補顔領域として選択されなかった過去顔領域については、CPU101はその顔領域情報及び顔領域詳細情報をRAM103から削除するものとする。
S203で、CPU101は、S201で検出された現在の顔領域のうち、含まれる人物の特定がなされていない1つの顔領域を対象顔領域として選択する。
S204で、CPU101は、対象顔領域で示される顔画像について、類似度算出部108に顔認識用データに登録されている全ての人物の特徴量との類似度を算出させる。具体的には類似度算出部108は、対象顔領域で示される顔画像から所定の方法で特徴量を抽出し、類似度の算出を行う。
S205で、CPU101は、対象顔領域についての顔認識結果の切り替わりを抑止するかを判定する切替抑止判定処理を実行する。
(切替抑止判定処理)
ここで、S205で実行される切替抑止判定処理について、図4(a)のフローチャートを用いて詳細を説明する。
S401で、CPU101は、対象顔領域についての顔認識結果が安定していたか否かを判断する。具体的にはCPU101は、対象顔領域に関連付けられている顔領域詳細情報の安定フラグ302を参照し、顔認識結果が安定していたか否かを判断する。CPU101は、顔認識結果が安定していたと判断した場合は処理をS402に移し、安定していなかったと判断した場合は本切替抑止判定処理を完了する。
S402で、CPU101は、S204で対象顔領域について算出された、予め顔認識用データに登録されている各人物の類似度において、最大値を有する類似度が候補人物の類似度であるか否かを判断する。CPU101は、候補人物の類似度が最大値を有すると判断した場合は処理をS403に移し、異なる人物の類似度が最大値を有すると判断した場合は本切替抑止判定処理を完了する。
S403で、CPU101は、対象顔領域について算出された、予め顔認識用データに登録されている各人物の類似度において、最大値である候補人物の類似度と、次点の類似度との差が予め定められた閾値TH_WideGap(第1の閾値)を超えるか否かを判断する。CPU101は、最大値の類似度と次点の類似度との差が第1の閾値を超えると判断した場合は処理をS404に移し、超えないと判断した場合は本切替抑止判定処理を完了する。なお、第1の閾値は、類似度ベースの顔認識結果において、対象顔領域に含まれる人物が最大値を有する類似度の人物であることが確定的であると判断するために設定される。
S404で、CPU101は、対象顔領域に関連付けられている顔領域詳細情報の切替抑止フラグ303にtrueを設定する。
即ち、本切替抑止判定処理により、CPU101は、対象顔領域について顔認識結果が安定している状況で、次点の類似度とは第1の閾値以上の差がついた場合に、顔認識結果が確定的であると判断して、顔認識結果の切り替わりを抑止すると判断する。つまり、一度確定的と判断できる顔認識結果が得られた場合には、該当の顔領域について以下に説明するように切り替わりを抑止することで、安定した顔認識結果を出力することができる。
S206で、CPU101は、S204で対象顔領域について算出された、予め登録されている各人物の類似度における最大値が、該最大値の類似度に対応する人物について設定されている、顔認識成功の閾値TH_defaultを超えるか否かを判断する。なお、本実施形態では、顔認識成功の閾値については顔認識用データに登録された人物ごとに異なるものとして説明する。これは、顔認識用データに登録されている顔画像や特徴量の数が、人物ごとに異なる可能性があることに起因する。
顔認識処理においては、同一の人物についての複数の顔画像を使用して類似度の算出を行なった方が、認識制度が向上することがある。このため、顔認識用データには各人物について1以上の顔画像あるいは特徴量が含められている。しかしながら、例えば認識スコアとして各顔画像についての類似度の合計値を算出する場合等、1人の人物について複数の顔画像を利用して算出した認識スコアは、1枚の顔画像を利用して算出した認識スコアよりも高くなることが想定される。本実施形態では、登録されている顔画像あるいは特徴量の数に応じて認識スコアの算出基準が異なることに対応するよう、人物ごとに顔認識用データに登録されている顔画像あるいは特徴量の数に応じて顔認識成功の閾値を異ならせて設定している。なお、顔認識成功の閾値の情報は、顔認識用データに含まれる人物ごとに、該人物についての顔認識IDに関連付けられた閾値テーブルとして記録媒体109に記憶されていればよい。本実施形態では閾値テーブルは、図3(b)に示すように、顔認識ID311に関連付けて安定判定閾値(高)312、安定判定閾値(低)313、顔認識成功閾値314、及び安定顔認識成功閾値315の4つの閾値が示されているものとする。なお、他の閾値については、以下のステップの説明において適宜説明する。
CPU101は、最大値の類似度が、該類似度に対応する人物についての顔認識成功閾値504を超えると判断した場合は処理をS207に移し、超えないと判断した場合は処理をS212に移す。
S207で、CPU101は、対象顔領域についての顔認識結果が安定していたか否かを判断する。CPU101は、顔認識結果が安定していたと判断した場合は処理をS208に移し、安定していなかったと判断した場合は処理をS211に移す。
S208で、CPU101は、対象顔領域について顔認識結果の切り替えを抑止するか否かを判断する。具体的にはCPU101は対象顔領域に関連付けられている顔領域詳細情報の303を参照し、顔認識結果の切り替えを抑止するか否かを判断する。CPU101は、顔認識結果の切り替えを抑止すると判断した場合は処理をS209に移し、抑止しないと判断した場合は処理をS211に移す。
S209で、CPU101は、対象顔領域についての最大値の類似度が、候補人物の類似度を基準として設定された所定値であって、該候補人物の類似度よりも高い所定値を超えるか否かを判断する。具体的にはCPU101は、最大値の類似度をSC_Max、候補人物の類似度をSC_Candとした場合に、
SC_Max > SC_Cand × α (ただしα>1)
を満たすか否かを判断する。CPU101は、最大値の類似度が所定値を超えると判断した場合は処理をS210に移し、超えないと判断した場合は処理をS212に移す。
例えば、被写体の人物Aが、正面を向いた状態から横を向いた場合などに、(人物Aの認識スコア、人物Bの認識スコア)が(85,40)、(85,45)、(85,40)、(85,40)、(80,50)、(75,60)、(75,70)、(75,80)、(75,80)、(75,70)、(75,80)、(75,65)のように変化した場合を考える。人物A、人物Bの顔認識用データとして正面を向いている顔画像が登録されている場合、人物Aが正面を向いている間は人物Aの認識スコアが安定して高く(上の例では85)、横を向くと人物Aの認識スコアが下がると同時に(例では85→75)、場合によっては他の人物(人物B)の認識スコアが高くなる(例では40→80)。このとき単にスコアが最も高い認識スコアの人物であると認識してしまうと、人物Aの顔認識結果が人物Aから人物Bに変化してしまうことになる。本実施形態では人物Aの認識スコアが安定して突出した高い認識スコアである状態のうちに切替抑止フラグ303を設定しておくことで、本ステップのように同レベルの認識スコアで人物Aよりも高い人物Bの認識スコアがあった場合でも、顔検出結果の切り替わりを抑止する。
S210で、CPU101は、対象顔領域に関連付けられている顔領域詳細情報の切替抑止フラグ303にfalseを設定する。即ち、顔認識結果の切り替えを抑止中にも関わらず、確定的とされていた顔認識結果の人物についての類似度よりも、突出して高い類似度が得られた場合には、確定的とされていた顔認識結果が誤りであった可能性が考えられる。即ち、本ステップではCPU101は、より可能性が高い人物が顔認識結果として出力されるよう、trueに設定されていた切替抑止フラグ303をfalseに変更して顔検出結果の切り替えの抑止を中止し、処理をS211に移す。
S211で、CPU101は、最大値の類似度が算出された人物を、対象顔領域の顔認識結果として設定する。具体的にはCPU101は、最大値の類似度が算出された人物について顔認識用データに設定されている顔認識IDを取得して、対象顔領域に関連付けられている顔領域詳細情報の顔認識ID304に入力する。またCPU101は、対象顔領域に関連付けられている顔領域詳細情報の類似度履歴305に、最大値の類似度を追加する。
一方、S206において最大値の類似度が、該類似度に対応する人物についての顔認識成功閾値を超えないと判断した場合、あるいは、S209において最大値の類似度が所定値を超えないと判断した場合、CPU101は処理をS212に移す。
S212で、CPU101は、対象顔領域についての顔認識結果が安定していたか否かを判断する。CPU101は、顔認識結果が安定していたと判断した場合は処理をS213に移し、安定していなかったと判断した場合は処理をS214に移す。
S213で、CPU101は、顔認識成功の閾値を顔認識成功閾値314よりも低い安定顔認識成功閾値315(TH_Low)に設定する。即ち、対象顔領域についての顔認識結果が安定していた場合は、S201で検出された対象顔領域についても、同様の顔認識結果が得られても誤りではない可能性が高い。このため、顔認識成功とみなす類似度の範囲を広げるべく、CPU101は通常とは異なり、顔認識成功閾値314よりも低い安定顔認識成功閾値315を一時的な顔認識成功の閾値として設定する。このようにすることで、本実施形態のデジタルカメラ100では、同様の顔認識結果が得られるべき状況ではあるが、人物が横を向いた等の理由で類似度が低下した場合でも、安定した顔認識結果を得やすくすることができる。なお、対象顔領域についての顔認識結果が安定してなかった場合は、顔認識用の閾値は通常の顔認識成功閾値314として設定される。
S214で、CPU101は、対象顔領域についての候補人物の類似度が、顔認識成功の閾値を超えるか否かを判断する。CPU101は、候補人物の類似度が顔認識成功の閾値を超えると判断した場合は処理をS215に移し、超えないと判断した場合は処理をS216に移す。
S215で、CPU101は、候補人物を対象顔領域の顔認識結果として設定する。具体的にはCPU101は、候補人物について顔認識用データに設定されている顔認識IDを取得して、対象顔領域に関連付けられている顔領域詳細情報の顔認識ID304に入力する。またCPU101は、対象顔領域に関連付けられている顔領域詳細情報の類似度履歴305に、候補人物の類似度を追加する。なお、対象顔領域に関連付けられている顔領域詳細情報の顔認識ID304に候補人物の顔認識IDが既に入力されている場合は、顔認識IDの入力を省略してもよい。
S216で、CPU101は、対象顔領域の顔認識に失敗したことを顔認識結果として出力する。なお、顔認識に失敗した場合CPU101は、対象顔領域に関連付けられている顔領域詳細情報を削除する。なお、このとき例えばライブビュー画面として表示部110に表示される撮像画像に対して本顔認識処理を実行している場合は、CPU101は対象顔領域について顔領域詳細情報が関連付けられていないため、顔認識処理に失敗した旨を表示部110に出力して通知すればよい。
なお、本実施形態のS209において最大値の類似度が所定値を超えないと判断した場合は、最大値の類似度と候補人物についての類似度が同レベルであるとみなせる場合である。即ち、1つの顔領域に対して同レベルの類似度を有する人物が複数得られた場合は、これまで所望の顔認識結果が選択されない可能性があったが、CPU101は、顔認識結果の切り替えを抑止することで、本実施形態では所望の顔検出結果を安定的に得られるようにしている。つまり、CPU101はこのような場合にS212乃至S216の処理で、対象顔領域に候補人物の顔が含まれるか否かの判断のみを行うことで、他の人物に顔認識結果が切り替わることを回避する。
S217で、CPU101は、対象顔領域についての顔認識結果が安定しているかを判定する安定判定処理を実行する。
(安定判定処理)
ここで、S217で実行される切替抑止判定処理について、図4(b)のフローチャートを用いて詳細を説明する。
S411で、CPU101は、上述の顔認識処理のステップにおいて、対象顔領域についての顔認識結果が、前回の顔認識結果から変化したか否かを判断する。具体的にはCPU101は、対象顔領域に関連付けられた顔領域詳細情報の顔認識ID304を異なる値に変更したか否かを判断する。CPU101は、対象顔領域についての顔認識結果が前回の顔認識結果から変化していないと判断した場合は処理をS412に移し、変化したと判断した場合は本安定判定処理を完了する。
S412で、CPU101は、対象顔領域についての顔認識結果が安定していたか否かを判断する。CPU101は、顔認識結果が安定していなかったと判断した場合は処理をS413に移し、安定していたと判断した場合は本安定判定処理を完了する。
S413で、CPU101は、対象顔領域に関連付けられている顔領域詳細情報の類似度履歴305を参照し、過去M回の顔認識結果についての類似度が、全て顔認識成功閾値314より高い安定判定閾値(高)312以上であるか否かを判断する。CPU101は、過去M回の顔認識結果についての類似度が、全て安定判定閾値(高)312以上であると判断した場合は処理をS415に移し、1つでも安定判定閾値(高)312未満の類似度があると判断した場合は処理をS414に移す。
S414で、CPU101は、過去N(>M)回の顔認識結果についての類似度が、全て顔認識成功閾値314より高く、かつ、安定判定閾値(高)312より低い安定判定閾値(低)313以上であるか否かを判断する。CPU101は、過去N回の顔認識結果についての類似度が、全て安定判定閾値(低)313以上であると判断した場合は処理をS415に移し、1つでも安定判定閾値(低)313未満の類似度があると判断した場合は処理をS416に移す。
S415で、CPU101は、対象顔領域に関連付けられている顔領域詳細情報の安定フラグ302にtrueを設定して本安定判定処理を完了する。
S416で、CPU101は、対象顔領域に関連付けられている顔領域詳細情報の安定フラグ302にfalseを設定して本安定判定処理を完了する。
このようにして対象顔領域についての顔認識結果が安定しているかを判定した後、CPU101は処理をS218に移す。
S218で、CPU101は、S201で検出された現在の顔領域に、含まれる人物の特定がなされていない顔領域がまだ存在するか否かを判断する。CPU101は、含まれている人物の特定がなされていない顔領域が存在すると判断した場合は処理をS203に戻し、存在しないと判断した場合は本顔認識処理を完了する。
以上説明したように、本実施形態の画像処理装置は、顔認識処理において、所望の顔認識結果を安定して得ることができる。具体的には画像処理装置は、順次取得した画像から顔領域を検出し、検出した顔領域の各々について、顔認識用データが登録されている人物との類似度を算出する。第1の画像から検出された対象顔領域について、該第1の画像よりも前に取得し、含まれる顔領域について既に顔認識結果が出力されている第2の画像から検出した顔領域の中から、対応関係にある候補顔領域を特定する。そして画像処理装置は、対象顔領域について算出された類似度において、候補顔領域の顔認識結果である人物との類似度が最大値を有し、かつ、該最大値の類似度と次点の類似度との差が第1の閾値を超えると判断した場合に、以後に行われる顔認識処理において、候補顔領域と対応関係にある顔領域の顔認識結果を、候補顔領域の顔認識結果である人物から他の人物に切り替えることを抑止する。そして顔認識処理では、顔認識結果の切り替えが抑止されている際に、候補顔領域の顔認識結果である人物との類似度よりも高い類似度が対象顔領域について算出された場合に、該高い類似度が算出された人物ではなく候補顔領域の顔認識結果である人物を示す情報を対象顔領域の顔認識結果として出力する。
このように本実施形態の顔認識処理では、過去に検出された対応する顔領域についての顔認識結果の安定、及び顔認識結果の切り替えの抑止を判断しながら顔認識処理を行うことができるため、安定した顔認識結果を出力することができる。
[その他の実施形態]
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。

Claims (10)

  1. 録されている複数の人物の顔認識用データとの類似度に基づいて、画像内の顔領域の人物を特定し、特定した人物を示す情報を顔認識結果として出力する顔認識手段を有する画像処理装置であって、
    画像を順次取得する取得手段と、
    前記取得手段により取得された画像から顔領域を検出する検出手段と、
    前記検出手段により検出された顔領域と前記複数の人物の顔認識用データそれぞれとの類似度を判定する判定手段と、
    前記取得手段により取得された第1の画像から検出された対象顔領域について、該第1の画像よりも前に取得され第2の画像から検出された顔領域の中から、同一の人物に対応すると判断する候補顔領域を特定する特定手段と、
    前記対象顔領域と前記候補顔領域の人物の顔認識用データとの類似度が所定の条件を満たす場合に、前記第1の画像よりも後に取得される第3の画像に含まれる前記対象顔領域に対応するとして特定される顔領域の顔認識結果が前記候補顔領域の人物を示すように前記顔認識手段を制御する制御手段と、を有する
    ことを特徴とする画像処理装置。
  2. 前記制御手段は、前記対象顔領域と前記複数の人物の顔認識用データそれぞれとの類似度において、前記候補顔領域の人物の前記顔認識用データとの類似度が最大値を示し、かつ、該最大値の類似度と次点の類似度との差が第1の閾値を超えると判断した場合に、前記所定の条件を満たすと判断することを特徴とする請求項1に記載の画像処理装置。
  3. 記取得手段により順次取得された画像において、同一の人物に対応すると判断する顔領域の顔認識結果が所定の回数連続し、かつ、該人物の顔認識用データとの類似度が前記所定の回数連続して第2の閾値以上である場合に、該人物についての顔認識結果が安定していると判断する判断手段をさらに有し、
    前記制御手段は、前記判断手段により前記候補顔領域の人物についての顔認識結果が安定していると判断された場合に前記対象顔領域に対応する顔領域の顔認識結果の制御を行う
    ことを特徴とする請求項1または2に記載の画像処理装置。
  4. 前記制御手段は、前記判断手段により前記候補顔領域の人物についての顔認識結果が安定していると判断された場合に、前記顔認識手段において人物を特定したと判断する類似度の閾値を基準よりも低い第3の閾値に変更するように制御することを特徴とする請求項3に記載の画像処理装置。
  5. 前記制御手段は、前記対象顔領域に対応する顔領域と前記候補顔領域の人物の顔認識用データとの類似度が前記第3の閾値よりも高い場合に、前記対象顔領域に対応する顔領域の顔認識結果が前記候補顔領域の人物を示すように前記顔認識手段を制御することを特徴とする請求項4に記載の画像処理装置。
  6. 前記制御手段は、前記対象顔領域に対応する顔領域と前記候補顔領域の人物の顔認識用データとの類似度が前記第3の閾値より低い場合に、前記対象顔領域に対応する顔領域の人物を特定できないことを示す顔認識結果を出力するように前記顔認識手段を制御することを特徴とする請求項4または5に記載の画像処理装置。
  7. 記対象顔領域に対応する顔領域と前記複数の人物の顔認識用データとの類似度において、前記候補顔領域の人物の顔認識用データとの類似度を基準として設定された所定値であって、該類似度よりも高い所定値を超える類似度を示す人物が存在する場合に
    前記制御手段は、前記対象顔領域に対応する顔領域の顔認識結果の制御を終了し、
    前記顔認識手段は、前記所定値を超える類似度を示す人物を、前記対象顔領域に対応する顔領域の顔認識結果として出力する
    ことを特徴とする請求項1乃至6のいずれか1項に記載の画像処理装置。
  8. 前記制御手段は、前記対象顔領域に対応する顔領域と前記複数の人物の顔認識用データとの類似度において、前記候補顔領域の人物の顔認識用データとの類似度よりも高く、かつ、前記所定値よりも低い類似度を示す人物が存在する場合に、前記候補顔領域の人物であるか否かを示す情報を、前記対象顔領域に対応する顔領域の顔認識結果として出力するように前記顔認識手段を制御することを特徴とする請求項に記載の画像処理装置。
  9. 録されている複数の人物の顔認識用データとの類似度に基づいて、画像内の顔領域の人物を特定し、特定した人物を示す情報を顔認識結果として出力する顔認識手段を有する画像処理装置の制御方法であって、
    得手段が、画像を順次取得する取得工程と、
    出手段が、前記取得工程において取得された画像から顔領域を検出する検出工程と、
    判定手段が、前記検出工程において検出された顔領域と前記複数の人物の顔認識用データそれぞれとの類似度を判定する判定工程と、
    特定手段が、前記取得工程において取得された第1の画像から検出された対象顔領域について、該第1の画像よりも前に取得され第2の画像から検出された顔領域の中から、同一の人物に対応すると判断する候補顔領域を特定する特定工程と、
    制御手段が、前記対象顔領域と前記候補顔領域の人物の顔認識用データとの類似度が所定の条件を満たす場合に、前記第1の画像よりも後に取得される第3の画像に含まれる前記対象顔領域に対応するとして特定される顔領域の顔認識結果が前記候補顔領域の人物を示すように前記顔認識手段を制御する制御工程と、を有する
    ことを特徴とする画像処理装置の制御方法。
  10. コンピュータを、請求項1乃至のいずれか1項に記載の画像処理装置の各手段として機能させるためのプログラム。
JP2012001585A 2012-01-06 2012-01-06 画像処理装置、その制御方法、及びプログラム Active JP5843618B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012001585A JP5843618B2 (ja) 2012-01-06 2012-01-06 画像処理装置、その制御方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012001585A JP5843618B2 (ja) 2012-01-06 2012-01-06 画像処理装置、その制御方法、及びプログラム

Publications (3)

Publication Number Publication Date
JP2013142930A JP2013142930A (ja) 2013-07-22
JP2013142930A5 JP2013142930A5 (ja) 2015-02-19
JP5843618B2 true JP5843618B2 (ja) 2016-01-13

Family

ID=49039482

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012001585A Active JP5843618B2 (ja) 2012-01-06 2012-01-06 画像処理装置、その制御方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP5843618B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6908843B2 (ja) * 2017-07-26 2021-07-28 富士通株式会社 画像処理装置、画像処理方法、及び画像処理プログラム
CN111639493A (zh) * 2020-05-22 2020-09-08 上海微盟企业发展有限公司 一种地址信息标准化方法、装置、设备及可读存储介质

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006146413A (ja) * 2004-11-17 2006-06-08 Mitsubishi Electric Corp 対象追従装置
JP2006236216A (ja) * 2005-02-28 2006-09-07 Fuji Photo Film Co Ltd 人物認識システム、人物認識方法、及び人物認識プログラム
JP4831623B2 (ja) * 2007-03-29 2011-12-07 Kddi株式会社 動画像の顔インデックス作成装置およびその顔画像追跡方法
JP2009048490A (ja) * 2007-08-21 2009-03-05 Toshiba Corp 類似ショット検出装置、プログラムおよび方法
JP5153434B2 (ja) * 2008-04-22 2013-02-27 キヤノン株式会社 情報処理装置及び情報処理方法
JP2010140425A (ja) * 2008-12-15 2010-06-24 Hitachi Kokusai Electric Inc 画像処理システム
JP2010239507A (ja) * 2009-03-31 2010-10-21 Toshiba Corp 動画処理装置
JP5178611B2 (ja) * 2009-04-15 2013-04-10 株式会社東芝 画像処理装置、画像処理方法及びプログラム
JP5476955B2 (ja) * 2009-12-04 2014-04-23 ソニー株式会社 画像処理装置および画像処理方法、並びにプログラム
US8320644B2 (en) * 2010-06-15 2012-11-27 Apple Inc. Object detection metadata

Also Published As

Publication number Publication date
JP2013142930A (ja) 2013-07-22

Similar Documents

Publication Publication Date Title
JP5567853B2 (ja) 画像認識装置および方法
US10115178B2 (en) Image processing apparatus, image capturing apparatus, image processing method, and storage medium
JP6132490B2 (ja) 認証装置、認証方法、およびプログラム
TWI425828B (zh) 攝影裝置、圖像區域之判定方法以及電腦可讀取之記錄媒體
US20160142680A1 (en) Image processing apparatus, image processing method, and storage medium
US11004214B2 (en) Image processing apparatus, image processing method, and storage medium
CN101656830B (zh) 图像处理装置及图像处理方法
US20180122117A1 (en) Image processing apparatus, image processing method, and storage medium
JP2013074461A (ja) 画像処理装置、画像処理方法及びプログラム
JP2009087232A (ja) 人物認証装置および人物認証方法
US9070008B2 (en) Object recognition apparatus and dictionary data registration method
JP6924064B2 (ja) 画像処理装置およびその制御方法、ならびに撮像装置
JP2011134020A (ja) 画像処理装置及びその制御方法
US10148943B2 (en) Image acquisition device and method based on a sharpness measure and an image acquistion parameter
JP2009111716A (ja) 撮像装置、プログラムおよびテンプレート生成方法
JP2005149370A (ja) 画像撮影装置、個人認証装置及び画像撮影方法
JP5395650B2 (ja) 被写体領域抽出装置およびその制御方法、被写体追跡装置、並びにプログラム
JP5843618B2 (ja) 画像処理装置、その制御方法、及びプログラム
JP5499531B2 (ja) 電子カメラ
JP2011071925A (ja) 移動体追尾装置および方法
JP2013218393A (ja) 撮像装置
JP5995610B2 (ja) 被写体認識装置及びその制御方法、撮像装置、表示装置、並びにプログラム
EP2541469A2 (en) Image recognition device, image recognition method and image recognition program
JP5865069B2 (ja) 画像処理装置、その制御方法、及びプログラム
JP5918998B2 (ja) 画像処理装置、撮像装置、制御方法、及びプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141226

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20141226

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150904

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151019

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151117

R151 Written notification of patent or utility model registration

Ref document number: 5843618

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151