JP2013142930A - Image processing device, control method thereof and program - Google Patents

Image processing device, control method thereof and program Download PDF

Info

Publication number
JP2013142930A
JP2013142930A JP2012001585A JP2012001585A JP2013142930A JP 2013142930 A JP2013142930 A JP 2013142930A JP 2012001585 A JP2012001585 A JP 2012001585A JP 2012001585 A JP2012001585 A JP 2012001585A JP 2013142930 A JP2013142930 A JP 2013142930A
Authority
JP
Japan
Prior art keywords
face
face recognition
person
similarity
recognition result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012001585A
Other languages
Japanese (ja)
Other versions
JP5843618B2 (en
JP2013142930A5 (en
Inventor
Nobukazu Yoshida
宣和 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2012001585A priority Critical patent/JP5843618B2/en
Publication of JP2013142930A publication Critical patent/JP2013142930A/en
Publication of JP2013142930A5 publication Critical patent/JP2013142930A5/ja
Application granted granted Critical
Publication of JP5843618B2 publication Critical patent/JP5843618B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Studio Devices (AREA)
  • Image Analysis (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide an image processing device capable of stably obtaining desired face recognition results in face recognition processing.SOLUTION: The image processing device detects face areas from sequentially obtained first images. With respect to the detected face areas, the image processing device determines relevant candidate face areas in the face areas which are detected from second images of a person whose face recognition data are registered. In the similarity level calculated with respect to the object face area, when the similarity level of a candidate face area has a maximum value and when it is determined that a difference between the similarity level of the maximum value and the next similarity level exceeds a first threshold value, in the next face recognition processing, it is prohibited to switch from a person as a result of the face recognition in the candidate face area to another person. While switching of face recognition result is prohibited, when a similarity level higher than the similarity level of the person as the face recognition result in the candidate face area is calculated with respect to the object face area, a piece of information representing not the person whose similarity level is calculated as higher but the person as the face recognition result in the candidate face area is output as the face recognition result in the object face area.

Description

本発明は、画像処理装置、その制御方法、及びプログラムに関し、特に画像内に含まれる顔画像について人物を特定する顔認識技術に関する。   The present invention relates to an image processing apparatus, a control method thereof, and a program, and more particularly to a face recognition technique for specifying a person for a face image included in an image.

デジタルカメラ等の撮像装置の中には、被写体に含まれる人物の顔を検出する顔検出機能を有するものがある。このような撮像装置は顔検出処理により、例えば人物の顔と判断するパターンが予め定められており、画像内に含まれる該パターンに一致する箇所を、人物の顔として検出することができる。検出された人物の顔は、例えば合焦制御や露出制御において参照される。   Some imaging devices such as digital cameras have a face detection function for detecting the face of a person included in a subject. In such an imaging apparatus, for example, a pattern that is determined to be a person's face is determined in advance by face detection processing, and a portion that matches the pattern included in the image can be detected as a person's face. The detected human face is referred to, for example, in focus control and exposure control.

また近年では、顔検出処理により検出された人物の顔について、予め登録された顔と一致するか否かを判断する顔認識機能を有する撮像装置もある。撮像装置で行われる顔認識処理は、顔認識の基準となる顔画像あるいは該顔画像の特徴量が登録された顔認識用データを使用して行われる。具体的には顔認識処理では、予め顔認識用データ(顔辞書)に登録されている各人物について、処理対象の顔画像の類似度を算出し、最も高い類似度を有する人物が該顔画像に含まれる人物として特定される。   In recent years, there is also an imaging apparatus having a face recognition function for determining whether or not a person's face detected by the face detection process matches a face registered in advance. The face recognition process performed by the imaging apparatus is performed using face recognition data in which a face image serving as a reference for face recognition or a feature amount of the face image is registered. Specifically, in the face recognition process, the similarity of the face image to be processed is calculated for each person registered in the face recognition data (face dictionary) in advance, and the person having the highest similarity is the face image. Identified as a person.

しかしながら、顔認識処理で算出される類似度は、被写体の状態や撮影環境に応じて変化する。即ち、環境変化等によって類似度が低下した場合、誤った顔認識結果が得られることがあった。特許文献1では、算出された類似度が人物を特定するための閾値を超えない場合に、登録されている名称ではなく、人物が属するグループ名称を表示することで、誤った顔認識結果が表示されることを回避する技術が開示されている。   However, the similarity calculated in the face recognition process varies depending on the state of the subject and the shooting environment. That is, when the similarity is lowered due to environmental changes or the like, an incorrect face recognition result may be obtained. In Patent Document 1, when the calculated similarity does not exceed a threshold for specifying a person, an incorrect face recognition result is displayed by displaying the group name to which the person belongs instead of the registered name. A technique for avoiding this is disclosed.

特開2010−27034号公報JP 2010-27034 A

一方、顔認識処理では、1つの顔画像について人物を特定するための閾値を超える類似度の複数の人物が候補として現れる場合もある。このような場合、顔検出結果としていずれかの人物が特定されることになるが、所望の人物が顔認識結果として選択されないことがあった。   On the other hand, in the face recognition processing, a plurality of persons with similarities exceeding a threshold for specifying a person for one face image may appear as candidates. In such a case, one of the persons is specified as the face detection result, but a desired person may not be selected as the face recognition result.

本発明は、上述の問題点に鑑みてなされたものであり、顔認識処理において、所望の顔認識結果を安定して得ることができる画像処理装置、その制御方法、及びプログラムを提供することを目的とする。   The present invention has been made in view of the above-described problems, and provides an image processing apparatus, a control method thereof, and a program capable of stably obtaining a desired face recognition result in face recognition processing. Objective.

前述の目的を達成するために、本発明の画像処理装置は、以下の構成を備える。
顔認識用データが登録されている人物との類似度に基づいて、画像内の顔領域の各々に含まれる人物を特定し、特定した人物を示す情報を顔認識結果として出力する顔認識手段を有する画像処理装置であって、画像を順次取得する取得手段と、取得手段により取得された画像から顔領域を検出する検出手段と、検出手段により検出された顔領域の各々について、顔認識用データが登録されている人物との類似度を算出する算出手段と、取得手段により取得された第1の画像から検出された対象顔領域について、該第1の画像よりも前に取得され、含まれる顔領域について既に顔認識手段による顔認識結果が出力されている第2の画像から検出された顔領域の中から、対応関係にある候補顔領域を特定する候補取得手段と、対象顔領域について算出された類似度において、候補顔領域の顔認識結果である人物との類似度が最大値を有し、かつ、該最大値の類似度と次点の類似度との差が第1の閾値を超えると判断した場合に、顔認識手段により以後に行われる顔認識処理において、候補顔領域と対応関係にある顔領域の顔認識結果を、候補顔領域の顔認識結果である人物から他の人物に切り替えることを抑止する抑止手段と、を有し、顔認識手段は、抑止手段により顔認識結果の切り替えが抑止されている際に、候補顔領域の顔認識結果である人物との類似度よりも高い類似度が対象顔領域について算出された場合に、該高い類似度が算出された人物ではなく候補顔領域の顔認識結果である人物を示す情報を対象顔領域の顔認識結果として出力することを特徴とする。
In order to achieve the above object, an image processing apparatus of the present invention comprises the following arrangement.
Face recognition means for identifying a person included in each face area in an image based on a similarity to a person for which face recognition data is registered, and outputting information indicating the identified person as a face recognition result An image processing apparatus having an acquisition unit that sequentially acquires images, a detection unit that detects a face area from the image acquired by the acquisition unit, and face recognition data for each of the face areas detected by the detection unit And calculating means for calculating the degree of similarity with the registered person, and the target face area detected from the first image acquired by the acquiring means is acquired and included before the first image. Regarding the face area, candidate acquisition means for identifying a candidate face area having a correspondence relationship from the face areas detected from the second image for which the face recognition result by the face recognition means has already been output, and the target face area The similarity between the candidate and the person who is the face recognition result of the candidate face region has the maximum value, and the difference between the maximum value similarity and the next point similarity is the first threshold value. In the face recognition processing performed later by the face recognition means, the face recognition result of the face area corresponding to the candidate face area is changed from the person who is the face recognition result of the candidate face area to another person. Deterring means for deterring switching to a person, and the face recognizing means is similar to the person who is the face recognition result of the candidate face area when switching of the face recognition result is deterred by the deterring means. If a higher similarity is calculated for the target face area, information indicating the person who is the face recognition result of the candidate face area is output as the face recognition result of the target face area instead of the person for which the higher similarity is calculated It is characterized by doing.

このような構成により本発明によれば、顔認識処理において、所望の顔認識結果を安定して得ることが可能となる。   With this configuration, according to the present invention, it is possible to stably obtain a desired face recognition result in the face recognition process.

本発明の実施形態に係るデジタルカメラ100の機能構成を示したブロック図1 is a block diagram showing a functional configuration of a digital camera 100 according to an embodiment of the present invention. 本発明の実施形態に係る顔認識処理を例示したフローチャートFlowchart illustrating face recognition processing according to an embodiment of the present invention 本発明の実施形態に係る顔領域詳細情報及び閾値テーブルのデータ構造を例示した図The figure which illustrated the data structure of face area detailed information and a threshold table concerning an embodiment of the present invention 本発明の実施形態に係る切替抑止判定処理及び安定判定処理を例示したフローチャートThe flowchart which illustrated the switching suppression determination process and stability determination process which concern on embodiment of this invention

以下、本発明の例示的な実施形態について、図面を参照して詳細に説明する。なお、以下に説明する一実施形態は、画像処理装置の一例としての、顔認識用データを使用した顔認識処理を実行可能なデジタルカメラに、本発明を適用した例を説明する。しかし、本発明は、顔認識用データを使用した顔認識処理を実行することが可能な任意の機器に適用可能である。   Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the drawings. In the following embodiment, an example in which the present invention is applied to a digital camera capable of performing face recognition processing using face recognition data as an example of an image processing apparatus will be described. However, the present invention can be applied to any device capable of executing face recognition processing using face recognition data.

また、本明細書において「顔画像」とは、人物が含まれる画像から抽出された、人物の顔領域の画像であるものとする。また「顔辞書」とは、各人物についての1以上の顔画像と各顔画像に含まれる顔領域の特徴量のデータとを含む、顔認識処理におけるマッチング処理に用いられる顔認識用データであるものとして説明する。なお、顔辞書は、含められる顔画像の数が予め定められているものとする。   Further, in this specification, a “face image” is an image of a person's face area extracted from an image including a person. The “face dictionary” is face recognition data used for matching processing in face recognition processing, including one or more face images for each person and feature area data included in each face image. It will be explained as a thing. In the face dictionary, the number of face images to be included is determined in advance.

<デジタルカメラ100の構成>
図1は、本発明の実施形態に係るデジタルカメラ100の機能構成を示すブロック図である。
<Configuration of Digital Camera 100>
FIG. 1 is a block diagram showing a functional configuration of a digital camera 100 according to an embodiment of the present invention.

CPU101は、デジタルカメラ100が有する各ブロックの動作を制御する。具体的にはCPU101は、ROM102に記憶されている顔認識処理等の動作プログラムを読み出し、RAM103に展開して実行することにより、各ブロックの動作を制御する。   The CPU 101 controls the operation of each block included in the digital camera 100. Specifically, the CPU 101 controls the operation of each block by reading out an operation program such as face recognition processing stored in the ROM 102, developing it in the RAM 103 and executing it.

ROM102は、例えば書き換え可能な不揮発性メモリであり、撮影処理等の動作プログラムに加え、デジタルカメラ100が有する各ブロックの動作に必要なパラメータ等を記憶する。   The ROM 102 is, for example, a rewritable nonvolatile memory, and stores parameters necessary for the operation of each block of the digital camera 100 in addition to an operation program such as a photographing process.

RAM103は、揮発性メモリであり、顔認識処理等の動作プログラムの展開領域としてだけでなく、デジタルカメラ100が有する各ブロックの動作において出力された中間データ等を格納する格納領域としても用いられる。   The RAM 103 is a volatile memory, and is used not only as a development area for operation programs such as face recognition processing but also as a storage area for storing intermediate data output in the operation of each block of the digital camera 100.

撮像部105は、CCDやCMOSセンサ等の撮像素子、A/D変換部等で構成される。撮像部105は、光学系104により撮像素子上に結像された光学像を光電変換し、さらにA/D変換処理を適用した撮像画像を出力する。なお撮像部105は、入力されたアナログ画像信号に対して、サンプリング、ゲイン調整等の処理も実行する。   The imaging unit 105 includes an imaging element such as a CCD or CMOS sensor, an A / D conversion unit, and the like. The imaging unit 105 photoelectrically converts the optical image formed on the image sensor by the optical system 104, and outputs a captured image to which A / D conversion processing is applied. Note that the imaging unit 105 also performs processing such as sampling and gain adjustment on the input analog image signal.

画像処理部106は、撮像部105から出力された撮像画像に対して、色補正や色変換等、所定の画像処理を適用する。また画像処理部106は、本実施形態では顔検出部107及び類似度算出部108を有している。   The image processing unit 106 applies predetermined image processing such as color correction and color conversion to the captured image output from the imaging unit 105. The image processing unit 106 includes a face detection unit 107 and a similarity calculation unit 108 in the present embodiment.

顔検出部107は、例えばYUV形式に変換された画像について、特定の被写体である人物の顔を検出する。具体的には顔検出部107は、画像内の色情報やコントラスト分布に応じて、人物の顔のパターンに対応する領域(顔領域)を検出する。顔検出部107により行われる顔検出処理は、検出結果として顔領域の位置及び画素数を出力するものとする。   The face detection unit 107 detects the face of a person who is a specific subject in an image converted into, for example, a YUV format. Specifically, the face detection unit 107 detects an area (face area) corresponding to a human face pattern according to color information and contrast distribution in the image. The face detection process performed by the face detection unit 107 outputs the position of the face area and the number of pixels as the detection result.

類似度算出部108は、入力された顔領域の画像について特徴量の解析を行う。そして類似度算出部108は、後述する記録媒体109に記録されている顔辞書を使用し、解析された特徴量に対応する人物の特定を行う。具体的には類似度算出部108は、顔辞書に登録されている各人物ついて、登録されている顔画像あるいはその特徴量についての類似度を示すスコアを算出する。   The similarity calculation unit 108 analyzes the feature amount of the input face area image. Then, the similarity calculation unit 108 specifies a person corresponding to the analyzed feature amount using a face dictionary recorded in a recording medium 109 described later. Specifically, the similarity calculation unit 108 calculates a score indicating the similarity for each registered face image or its feature amount for each person registered in the face dictionary.

記録媒体109は、例えばデジタルカメラ100が有する内蔵メモリや、メモリカードやHDD等のデジタルカメラ100に着脱可能に接続される記録装置である。本実施形態では記録媒体109には、撮影処理により撮影された画像や、デジタルカメラ100における顔認識処理で参照される顔辞書が記録される。記録媒体109に記録される画像は、画像内に人物が含まれる場合、顔認識処理により得られた人物が顔認識結果として関連付けられて記録される。なお、本実施形態では、顔辞書が記録媒体109に記録されているものとして説明するが、本発明の実施はこれに限られるものではない。例えば顔辞書はROM102等、書き込み可能な領域に格納されていればよい。また顔辞書は、外部装置から受信した際に、CPU101が所定の記録領域に格納する構成であってもよい。   The recording medium 109 is a recording device that is detachably connected to the digital camera 100 such as a built-in memory of the digital camera 100, a memory card, or an HDD. In the present embodiment, the recording medium 109 records an image photographed by the photographing process and a face dictionary referred to by the face recognition process in the digital camera 100. When the image recorded on the recording medium 109 includes a person in the image, the person obtained by the face recognition process is recorded in association with the face recognition result. In this embodiment, the face dictionary is described as being recorded on the recording medium 109, but the embodiment of the present invention is not limited to this. For example, the face dictionary may be stored in a writable area such as the ROM 102. The face dictionary may be configured to be stored in a predetermined recording area by the CPU 101 when received from an external device.

表示部110は、例えば小型LCD等のデジタルカメラ100が有する表示装置である。表示部110には、撮像部105から出力された撮像画像や、記録媒体109に記録された画像等が表示される。なお、顔認識処理により特定された人物が表示されている画像に含まれる場合、例えばその人物名が重畳表示されることにより、顔認識結果をユーザに通知することができる。   The display unit 110 is a display device included in the digital camera 100 such as a small LCD. The display unit 110 displays a captured image output from the imaging unit 105, an image recorded on the recording medium 109, and the like. When the person identified by the face recognition process is included in the displayed image, the face recognition result can be notified to the user by, for example, displaying the person name superimposed.

操作入力部111は、例えば電源ボタンやシャッタボタン等の操作部材を含む、デジタルカメラ100が有するユーザインタフェースである。操作入力部111は、ユーザによる操作部材の操作がなされたことを検出すると、操作内容に対応する制御信号を生成してCPU101に伝送する。   The operation input unit 111 is a user interface that the digital camera 100 includes, for example, operation members such as a power button and a shutter button. When the operation input unit 111 detects that the operation member is operated by the user, the operation input unit 111 generates a control signal corresponding to the operation content and transmits the control signal to the CPU 101.

<顔認識処理>
このような構成をもつ本実施形態のデジタルカメラ100の顔認識処理について、図2のフローチャートを用いて具体的な処理を説明する。該フローチャートに対応する処理は、CPU101が、例えばROM102に記憶されている対応する処理プログラムを読み出し、RAM103に展開して実行することにより実現することができる。なお、本顔認識処理は、例えば撮像部105により撮像された撮像画像が出力された際に開始されるものとして説明する。また本顔認識処理は、撮像部105から出力される撮像画像を順次取得して行われてもよいし、所定フレーム間隔で取得された撮像画像について順次行われてもよい。
<Face recognition processing>
A specific process of the face recognition process of the digital camera 100 according to the present embodiment having such a configuration will be described with reference to the flowchart of FIG. The processing corresponding to the flowchart can be realized by the CPU 101 reading out a corresponding processing program stored in, for example, the ROM 102, developing it in the RAM 103, and executing it. The face recognition process will be described as being started when, for example, a captured image captured by the imaging unit 105 is output. Further, the face recognition process may be performed by sequentially acquiring captured images output from the imaging unit 105, or may be sequentially performed on captured images acquired at predetermined frame intervals.

S201で、CPU101は、撮像部105から出力された撮像画像を画像処理部106に入力し、顔検出処理を実行させる。具体的には顔検出部107は、画像処理部106に入力された撮像画像に対して、該画像に含まれる人物の顔のパターンを検出し、顔領域を特定する。   In step S <b> 201, the CPU 101 inputs the captured image output from the imaging unit 105 to the image processing unit 106 and causes the face detection process to be executed. Specifically, the face detection unit 107 detects a face pattern of a person included in the captured image input to the image processing unit 106 and specifies a face area.

S202で、CPU101は、S201で検出した顔領域(現在の顔領域)の各々について、顔領域を検出した撮像画像(第1の画像)よりも前に顔認識処理を行なった撮像画像(第2の画像)から検出した顔領域の中から、同一の被写体であると認識する対応する候補顔領域を特定する。具体的にはCPU101は、前回の顔認識処理において検出及び含まれる人物の特定がなされた顔領域(過去顔領域)を特定する顔領域特定情報をRAM103から読み出す。顔領域情報は、本実施形態では検出した顔領域を識別する顔識別ID、及び該顔領域の位置情報(例えば中心座標)が含まれる。CPU101は、過去顔領域の各々について顔領域情報の位置情報と、現在の顔領域の各々の位置情報を参照し、現在の顔領域の各々について対応する候補顔領域を特定する。このときCPU101は、現在の顔領域の各々に、対応する候補顔領域に付与されていた顔識別IDを付与する。   In S202, the CPU 101 performs, for each of the face areas detected in S201 (current face area), a captured image (second image) subjected to face recognition processing before the captured image (first image) from which the face area is detected. The corresponding candidate face area that is recognized as the same subject is identified from the face areas detected from the image of FIG. Specifically, the CPU 101 reads from the RAM 103 face area specifying information for specifying a face area (past face area) in which the person detected and included in the previous face recognition process is specified. In this embodiment, the face area information includes a face identification ID for identifying the detected face area, and position information (for example, center coordinates) of the face area. The CPU 101 refers to the position information of the face area information for each of the past face areas and the position information of each of the current face areas, and specifies a corresponding candidate face area for each of the current face areas. At this time, the CPU 101 assigns the face identification ID assigned to the corresponding candidate face area to each of the current face areas.

なお、過去顔領域の各々については、顔認識処理により特定された該顔領域に含まれる人物を示す情報等を示す顔領域詳細情報が関連付けられてRAM103に記憶されている。また、対応する過去顔領域の特定には上述した以外にパターンマッチング等の手法が用いられてもよいが、現在の顔領域の位置と過去の顔領域の位置とを比較する方法は、処理負荷を高くすることなく実現できるため好ましい。   For each past face area, detailed face area information indicating information indicating a person included in the face area specified by the face recognition process is associated and stored in the RAM 103. In addition to the above, a method such as pattern matching may be used to identify the corresponding past face area. However, the method of comparing the current face area position with the past face area position is a processing load. This is preferable because it can be realized without increasing the height.

(顔領域詳細情報)
ここで、本実施形態の顔認識処理で用いられる顔領域詳細情報について、図3(a)を用いて説明する。図示されるように、顔領域詳細情報には関連付けられた過去顔領域に付されているものと同一の顔識別ID301に加え、安定フラグ302、切替抑止フラグ303、顔認識ID304、及び類似度履歴305が含まれる。
(Face area detailed information)
Here, face area detailed information used in the face recognition processing of the present embodiment will be described with reference to FIG. As shown in the drawing, in addition to the same face identification ID 301 as that attached to the associated past face area, the stability flag 302, the switching suppression flag 303, the face recognition ID 304, and the similarity history are included in the face area detailed information. 305 is included.

安定フラグ302は、順次取得された撮像画像について顔認識処理を行なった結果、対応する顔領域、即ち同一の被写体であると認識した顔領域についての顔認識結果が安定しているか否かを示す論理型の情報である。詳細な安定判断方法については後述するが、本実施形態では顔認識処理による顔認識結果が所定の回数連続して同一であり、かつ、該顔認識結果である人物について算出された類似度が該所定の回数連続して閾値以上(第2の閾値以上)である場合に、CPU101は顔認識結果が安定していると判断する。安定フラグ302は、顔認識結果が安定している場合はtrue(ON)、安定していない場合はfalse(OFF)を示す。   The stability flag 302 indicates whether or not the face recognition result for the corresponding face area, that is, the face area recognized as being the same subject, is stable as a result of performing face recognition processing on the sequentially acquired captured images. Logical type information. Although a detailed stability determination method will be described later, in this embodiment, the face recognition result by the face recognition process is the same for a predetermined number of times, and the similarity calculated for the person who is the face recognition result is When it is equal to or greater than a threshold value (second threshold value) continuously for a predetermined number of times, the CPU 101 determines that the face recognition result is stable. The stability flag 302 indicates true (ON) when the face recognition result is stable, and false (OFF) when it is not stable.

切替抑止フラグ303は、同一の被写体であると認識した顔領域について、顔認識処理による顔認識結果が、異なる人物に切り替わって出力されることを抑止するか否かを示す論理型の情報である。切替抑止フラグ303は、顔認識結果の切り替わりを抑止する場合はtrue、抑止しない場合はfalseを示す。   The switch suppression flag 303 is logical information indicating whether or not to suppress the face recognition result by the face recognition processing from being switched to a different person for the face area recognized as the same subject. . The switching suppression flag 303 indicates true when switching of face recognition results is suppressed, and indicates false when not suppressing.

顔認識ID304は、最後に行われた顔認識処理において特定された人物を示す識別情報である。本実施形態では顔認識ID304は、記録媒体109に記録されている顔認識用データに予め登録されている人物のうち、1人の人物についての顔画像群や特徴量群を特定する識別情報と同一のものが用いられるものとする。即ち、顔認識ID304を参照することにより、CPU101は最後に行われた顔認識処理において特定された人物についての顔認識用のデータを特定することができる。   The face recognition ID 304 is identification information indicating a person specified in the last face recognition process. In this embodiment, the face recognition ID 304 is identification information for specifying a face image group or a feature amount group for one person among the persons registered in advance in the face recognition data recorded in the recording medium 109. The same thing shall be used. That is, by referring to the face recognition ID 304, the CPU 101 can specify face recognition data for the person specified in the last face recognition process.

類似度履歴305は、同一の被写体であると認識した顔領域について、類似度算出部108により算出された類似度を処理順に格納する。   The similarity history 305 stores the similarities calculated by the similarity calculating unit 108 in the order of processing for face regions recognized as being the same subject.

即ち、本ステップでは、現在の顔領域の各々について、対応する候補顔領域に付与されていた顔識別IDを付与することにより、現在の顔領域には、候補顔領域に関連付けられていた顔領域詳細情報が継承されて関連付けられる(候補取得)。つまり、S201で検出された各顔領域は、本ステップにより該顔領域に対応する候補顔領域についての顔認識結果である人物が含まれていると予測される。以下では、含まれていると予測される人物を「候補人物」として説明する。   That is, in this step, by assigning the face identification ID assigned to the corresponding candidate face area to each of the current face areas, the face area associated with the candidate face area is assigned to the current face area. Detailed information is inherited and associated (candidate acquisition). That is, each face area detected in S201 is predicted to include a person who is a face recognition result for a candidate face area corresponding to the face area by this step. In the following, a person who is predicted to be included will be described as a “candidate person”.

なお、本ステップにおいて対応する候補顔領域として選択されなかった過去顔領域については、CPU101はその顔領域情報及び顔領域詳細情報をRAM103から削除するものとする。   It should be noted that the CPU 101 deletes the face area information and the face area detailed information from the RAM 103 for the past face area that has not been selected as the corresponding candidate face area in this step.

S203で、CPU101は、S201で検出された現在の顔領域のうち、含まれる人物の特定がなされていない1つの顔領域を対象顔領域として選択する。   In step S203, the CPU 101 selects, as a target face area, one face area in which a person included in the current face area detected in step S201 is not specified.

S204で、CPU101は、対象顔領域で示される顔画像について、類似度算出部108に顔認識用データに登録されている全ての人物の特徴量との類似度を算出させる。具体的には類似度算出部108は、対象顔領域で示される顔画像から所定の方法で特徴量を抽出し、類似度の算出を行う。   In step S <b> 204, the CPU 101 causes the similarity calculation unit 108 to calculate similarities with the feature amounts of all persons registered in the face recognition data for the face image indicated by the target face area. Specifically, the similarity calculation unit 108 extracts a feature amount from a face image indicated by the target face area by a predetermined method, and calculates the similarity.

S205で、CPU101は、対象顔領域についての顔認識結果の切り替わりを抑止するかを判定する切替抑止判定処理を実行する。   In step S <b> 205, the CPU 101 executes a switching suppression determination process that determines whether to suppress switching of face recognition results for the target face area.

(切替抑止判定処理)
ここで、S205で実行される切替抑止判定処理について、図4(a)のフローチャートを用いて詳細を説明する。
(Switch suppression judgment processing)
Here, the switching suppression determination process executed in S205 will be described in detail with reference to the flowchart of FIG.

S401で、CPU101は、対象顔領域についての顔認識結果が安定していたか否かを判断する。具体的にはCPU101は、対象顔領域に関連付けられている顔領域詳細情報の安定フラグ302を参照し、顔認識結果が安定していたか否かを判断する。CPU101は、顔認識結果が安定していたと判断した場合は処理をS402に移し、安定していなかったと判断した場合は本切替抑止判定処理を完了する。   In step S401, the CPU 101 determines whether the face recognition result for the target face area is stable. Specifically, the CPU 101 refers to the stability flag 302 of the face area detailed information associated with the target face area, and determines whether or not the face recognition result is stable. If the CPU 101 determines that the face recognition result is stable, it moves the process to S402, and if it determines that the face recognition result is not stable, completes the switching inhibition determination process.

S402で、CPU101は、S204で対象顔領域について算出された、予め顔認識用データに登録されている各人物の類似度において、最大値を有する類似度が候補人物の類似度であるか否かを判断する。CPU101は、候補人物の類似度が最大値を有すると判断した場合は処理をS403に移し、異なる人物の類似度が最大値を有すると判断した場合は本切替抑止判定処理を完了する。   In S402, the CPU 101 determines whether the similarity having the maximum value is the similarity of the candidate person among the similarities of the persons registered in the face recognition data previously calculated for the target face area in S204. Judging. If the CPU 101 determines that the similarity of the candidate person has the maximum value, the CPU 101 moves the process to S403. If the CPU 101 determines that the similarity of the different person has the maximum value, the CPU 101 completes the switching inhibition determination process.

S403で、CPU101は、対象顔領域について算出された、予め顔認識用データに登録されている各人物の類似度において、最大値である候補人物の類似度と、次点の類似度との差が予め定められた閾値TH_WideGap(第1の閾値)を超えるか否かを判断する。CPU101は、最大値の類似度と次点の類似度との差が第1の閾値を超えると判断した場合は処理をS404に移し、超えないと判断した場合は本切替抑止判定処理を完了する。なお、第1の閾値は、類似度ベースの顔認識結果において、対象顔領域に含まれる人物が最大値を有する類似度の人物であることが確定的であると判断するために設定される。   In step S <b> 403, the CPU 101 calculates the difference between the similarity of the candidate person that is the maximum value and the similarity of the next point in the similarity of each person previously registered in the face recognition data calculated for the target face area. Is determined to exceed a predetermined threshold TH_WideGap (first threshold). If the CPU 101 determines that the difference between the similarity of the maximum value and the similarity of the next point exceeds the first threshold value, the CPU 101 moves the process to S404, and if it determines that the difference does not exceed the first threshold, completes the switching inhibition determination process. . Note that the first threshold value is set in order to determine that the person included in the target face area is a person having a maximum similarity having a maximum value in the similarity-based face recognition result.

S404で、CPU101は、対象顔領域に関連付けられている顔領域詳細情報の切替抑止フラグ303にtrueを設定する。   In step S <b> 404, the CPU 101 sets true to the face area detailed information switching inhibition flag 303 associated with the target face area.

即ち、本切替抑止判定処理により、CPU101は、対象顔領域について顔認識結果が安定している状況で、次点の類似度とは第1の閾値以上の差がついた場合に、顔認識結果が確定的であると判断して、顔認識結果の切り替わりを抑止すると判断する。つまり、一度確定的と判断できる顔認識結果が得られた場合には、該当の顔領域について以下に説明するように切り替わりを抑止することで、安定した顔認識結果を出力することができる。   That is, by this switching suppression determination processing, the CPU 101 determines that the face recognition result is obtained when the face recognition result is stable for the target face area and the similarity of the next point is more than the first threshold value. Is determined to be deterministic and switching of face recognition results is to be suppressed. In other words, once a face recognition result that can be determined as deterministic is obtained, a stable face recognition result can be output by suppressing switching of the corresponding face area as described below.

S206で、CPU101は、S204で対象顔領域について算出された、予め登録されている各人物の類似度における最大値が、該最大値の類似度に対応する人物について設定されている、顔認識成功の閾値TH_defaultを超えるか否かを判断する。なお、本実施形態では、顔認識成功の閾値については顔認識用データに登録された人物ごとに異なるものとして説明する。これは、顔認識用データに登録されている顔画像や特徴量の数が、人物ごとに異なる可能性があることに起因する。   In S206, the CPU 101 determines that the maximum value in the similarity of each person registered in advance calculated in S204 for the target face area is set for the person corresponding to the similarity of the maximum value. It is determined whether or not the threshold TH_default is exceeded. In the present embodiment, the threshold value for successful face recognition will be described as different for each person registered in the face recognition data. This is because the number of face images and feature quantities registered in the face recognition data may be different for each person.

顔認識処理においては、同一の人物についての複数の顔画像を使用して類似度の算出を行なった方が、認識制度が向上することがある。このため、顔認識用データには各人物について1以上の顔画像あるいは特徴量が含められている。しかしながら、例えば認識スコアとして各顔画像についての類似度の合計値を算出する場合等、1人の人物について複数の顔画像を利用して算出した認識スコアは、1枚の顔画像を利用して算出した認識スコアよりも高くなることが想定される。本実施形態では、登録されている顔画像あるいは特徴量の数に応じて認識スコアの算出基準が異なることに対応するよう、人物ごとに顔認識用データに登録されている顔画像あるいは特徴量の数に応じて顔認識成功の閾値を異ならせて設定している。なお、顔認識成功の閾値の情報は、顔認識用データに含まれる人物ごとに、該人物についての顔認識IDに関連付けられた閾値テーブルとして記録媒体109に記憶されていればよい。本実施形態では閾値テーブルは、図3(b)に示すように、顔認識ID311に関連付けて安定判定閾値(高)312、安定判定閾値(低)313、顔認識成功閾値314、及び安定顔認識成功閾値315の4つの閾値が示されているものとする。なお、他の閾値については、以下のステップの説明において適宜説明する。   In the face recognition process, the recognition system may be improved by calculating the degree of similarity using a plurality of face images of the same person. For this reason, the face recognition data includes one or more face images or feature amounts for each person. However, a recognition score calculated using a plurality of face images for one person, for example, when calculating a total value of similarities for each face image as a recognition score, uses one face image. It is assumed that it is higher than the calculated recognition score. In the present embodiment, the face image or feature value registered in the face recognition data for each person corresponds to the fact that the recognition score calculation criteria differ depending on the number of registered face images or feature values. The threshold for success in face recognition is set differently depending on the number. It should be noted that the information on the threshold value for successful face recognition may be stored in the recording medium 109 as a threshold value table associated with the face recognition ID for each person included in the face recognition data. In the present embodiment, as shown in FIG. 3B, the threshold table is associated with the face recognition ID 311, the stability determination threshold (high) 312, the stability determination threshold (low) 313, the face recognition success threshold 314, and the stable face recognition. Assume that four thresholds of success threshold 315 are shown. Other threshold values will be described as appropriate in the following description of steps.

CPU101は、最大値の類似度が、該類似度に対応する人物についての顔認識成功閾値504を超えると判断した場合は処理をS207に移し、超えないと判断した場合は処理をS212に移す。   If the CPU 101 determines that the similarity of the maximum value exceeds the face recognition success threshold 504 for the person corresponding to the similarity, the process proceeds to S207, and if it does not exceed, the process proceeds to S212.

S207で、CPU101は、対象顔領域についての顔認識結果が安定していたか否かを判断する。CPU101は、顔認識結果が安定していたと判断した場合は処理をS208に移し、安定していなかったと判断した場合は処理をS211に移す。   In step S207, the CPU 101 determines whether the face recognition result for the target face area is stable. If the CPU 101 determines that the face recognition result is stable, it moves the process to S208, and if it determines that the face recognition result is not stable, it moves the process to S211.

S208で、CPU101は、対象顔領域について顔認識結果の切り替えを抑止するか否かを判断する。具体的にはCPU101は対象顔領域に関連付けられている顔領域詳細情報の303を参照し、顔認識結果の切り替えを抑止するか否かを判断する。CPU101は、顔認識結果の切り替えを抑止すると判断した場合は処理をS209に移し、抑止しないと判断した場合は処理をS211に移す。   In step S208, the CPU 101 determines whether to suppress switching of face recognition results for the target face area. Specifically, the CPU 101 refers to the face area detailed information 303 associated with the target face area, and determines whether or not to switch the face recognition result. If the CPU 101 determines that the switching of the face recognition result is to be suppressed, it moves the process to S209, and if it determines not to suppress it, it moves the process to S211.

S209で、CPU101は、対象顔領域についての最大値の類似度が、候補人物の類似度を基準として設定された所定値であって、該候補人物の類似度よりも高い所定値を超えるか否かを判断する。具体的にはCPU101は、最大値の類似度をSC_Max、候補人物の類似度をSC_Candとした場合に、
SC_Max > SC_Cand × α (ただしα>1)
を満たすか否かを判断する。CPU101は、最大値の類似度が所定値を超えると判断した場合は処理をS210に移し、超えないと判断した場合は処理をS212に移す。
In step S209, the CPU 101 determines whether or not the maximum similarity for the target face area is a predetermined value that is set based on the similarity of the candidate person and exceeds a predetermined value that is higher than the similarity of the candidate person. Determine whether. Specifically, the CPU 101 sets SC_Max as the maximum similarity and SC_Cand as the similarity of the candidate person.
SC_Max> SC_Cand × α (where α> 1)
It is determined whether or not the above is satisfied. If the CPU 101 determines that the similarity of the maximum value exceeds the predetermined value, the process proceeds to S210. If the CPU 101 determines that the similarity does not exceed the predetermined value, the process proceeds to S212.

例えば、被写体の人物Aが、正面を向いた状態から横を向いた場合などに、(人物Aの認識スコア、人物Bの認識スコア)が(85,40)、(85,45)、(85,40)、(85,40)、(80,50)、(75,60)、(75,70)、(75,80)、(75,80)、(75,70)、(75,80)、(75,65)のように変化した場合を考える。人物A、人物Bの顔認識用データとして正面を向いている顔画像が登録されている場合、人物Aが正面を向いている間は人物Aの認識スコアが安定して高く(上の例では85)、横を向くと人物Aの認識スコアが下がると同時に(例では85→75)、場合によっては他の人物(人物B)の認識スコアが高くなる(例では40→80)。このとき単にスコアが最も高い認識スコアの人物であると認識してしまうと、人物Aの顔認識結果が人物Aから人物Bに変化してしまうことになる。本実施形態では人物Aの認識スコアが安定して突出した高い認識スコアである状態のうちに切替抑止フラグ303を設定しておくことで、本ステップのように同レベルの認識スコアで人物Aよりも高い人物Bの認識スコアがあった場合でも、顔検出結果の切り替わりを抑止する。   For example, when the subject person A turns sideways from the front side, the (person A recognition score, person B recognition score) is (85, 40), (85, 45), (85 , 40), (85, 40), (80, 50), (75, 60), (75, 70), (75, 80), (75, 80), (75, 70), (75, 80 ) And (75, 65). When face images facing front are registered as face recognition data for person A and person B, the recognition score of person A is stable and high while person A is facing front (in the above example) 85) When facing sideways, the recognition score of the person A decreases (in the example, 85 → 75), and in some cases, the recognition score of another person (person B) increases (in the example, 40 → 80). At this time, if it is simply recognized that the person has the highest recognition score, the face recognition result of person A will change from person A to person B. In the present embodiment, by setting the switch inhibition flag 303 in a state where the recognition score of the person A is a stable and prominent high recognition score, the recognition score of the same level as in this step is obtained from the person A. Even if the recognition score of person B is higher, the face detection result switching is suppressed.

S210で、CPU101は、対象顔領域に関連付けられている顔領域詳細情報の切替抑止フラグ303にfalseを設定する。即ち、顔認識結果の切り替えを抑止中にも関わらず、確定的とされていた顔認識結果の人物についての類似度よりも、突出して高い類似度が得られた場合には、確定的とされていた顔認識結果が誤りであった可能性が考えられる。即ち、本ステップではCPU101は、より可能性が高い人物が顔認識結果として出力されるよう、trueに設定されていた切替抑止フラグ303をfalseに変更して顔検出結果の切り替えの抑止を中止し、処理をS211に移す。   In step S <b> 210, the CPU 101 sets false in the switching suppression flag 303 of the face area detailed information associated with the target face area. That is, it is determined to be deterministic when the similarity is prominently higher than the similarity of the person of the face recognition result that has been determined to be definite even though the switching of the face recognition result is being suppressed. It is possible that the face recognition result was incorrect. In other words, in this step, the CPU 101 changes the switching suppression flag 303 set to true to false so that a more likely person is output as the face recognition result, and stops switching the detection of the face detection result. The process proceeds to S211.

S211で、CPU101は、最大値の類似度が算出された人物を、対象顔領域の顔認識結果として設定する。具体的にはCPU101は、最大値の類似度が算出された人物について顔認識用データに設定されている顔認識IDを取得して、対象顔領域に関連付けられている顔領域詳細情報の顔認識ID304に入力する。またCPU101は、対象顔領域に関連付けられている顔領域詳細情報の類似度履歴305に、最大値の類似度を追加する。   In step S211, the CPU 101 sets the person whose maximum similarity is calculated as the face recognition result of the target face area. Specifically, the CPU 101 acquires the face recognition ID set in the face recognition data for the person whose maximum similarity is calculated, and performs face recognition of the face area detailed information associated with the target face area. Enter the ID 304. The CPU 101 also adds the maximum similarity to the similarity history 305 of the face area detailed information associated with the target face area.

一方、S206において最大値の類似度が、該類似度に対応する人物についての顔認識成功閾値を超えないと判断した場合、あるいは、S209において最大値の類似度が所定値を超えないと判断した場合、CPU101は処理をS212に移す。   On the other hand, when it is determined in S206 that the maximum similarity is not greater than the face recognition success threshold for the person corresponding to the similarity, or in S209, the maximum similarity is determined not to exceed the predetermined value. In this case, the CPU 101 moves the process to S212.

S212で、CPU101は、対象顔領域についての顔認識結果が安定していたか否かを判断する。CPU101は、顔認識結果が安定していたと判断した場合は処理をS213に移し、安定していなかったと判断した場合は処理をS214に移す。   In step S212, the CPU 101 determines whether the face recognition result for the target face area is stable. If the CPU 101 determines that the face recognition result is stable, it moves the process to S213, and if it determines that the face recognition result is not stable, it moves the process to S214.

S213で、CPU101は、顔認識成功の閾値を顔認識成功閾値314よりも低い安定顔認識成功閾値315(TH_Low)に設定する。即ち、対象顔領域についての顔認識結果が安定していた場合は、S201で検出された対象顔領域についても、同様の顔認識結果が得られても誤りではない可能性が高い。このため、顔認識成功とみなす類似度の範囲を広げるべく、CPU101は通常とは異なり、顔認識成功閾値314よりも低い安定顔認識成功閾値315を一時的な顔認識成功の閾値として設定する。このようにすることで、本実施形態のデジタルカメラ100では、同様の顔認識結果が得られるべき状況ではあるが、人物が横を向いた等の理由で類似度が低下した場合でも、安定した顔認識結果を得やすくすることができる。なお、対象顔領域についての顔認識結果が安定してなかった場合は、顔認識用の閾値は通常の顔認識成功閾値314として設定される。   In step S <b> 213, the CPU 101 sets the face recognition success threshold to a stable face recognition success threshold 315 (TH_Low) lower than the face recognition success threshold 314. That is, if the face recognition result for the target face area is stable, it is highly possible that the same face recognition result is obtained for the target face area detected in S201, but that it is not an error. For this reason, unlike the normal case, the CPU 101 sets a stable face recognition success threshold value 315 lower than the face recognition success threshold value 314 as a temporary face recognition success threshold value in order to widen the range of similarity regarded as face recognition success. In this way, in the digital camera 100 of the present embodiment, the same face recognition result should be obtained, but even when the similarity is lowered due to the person facing sideways or the like, it is stable. It is possible to easily obtain a face recognition result. When the face recognition result for the target face area is not stable, the face recognition threshold is set as the normal face recognition success threshold 314.

S214で、CPU101は、対象顔領域についての候補人物の類似度が、顔認識成功の閾値を超えるか否かを判断する。CPU101は、候補人物の類似度が顔認識成功の閾値を超えると判断した場合は処理をS215に移し、超えないと判断した場合は処理をS216に移す。   In S <b> 214, the CPU 101 determines whether or not the candidate person's similarity with respect to the target face area exceeds the threshold value for successful face recognition. If the CPU 101 determines that the similarity of the candidate person exceeds the threshold for successful face recognition, the process proceeds to S215. If the CPU 101 determines that the similarity does not exceed the threshold, the process proceeds to S216.

S215で、CPU101は、候補人物を対象顔領域の顔認識結果として設定する。具体的にはCPU101は、候補人物について顔認識用データに設定されている顔認識IDを取得して、対象顔領域に関連付けられている顔領域詳細情報の顔認識ID304に入力する。またCPU101は、対象顔領域に関連付けられている顔領域詳細情報の類似度履歴305に、候補人物の類似度を追加する。なお、対象顔領域に関連付けられている顔領域詳細情報の顔認識ID304に候補人物の顔認識IDが既に入力されている場合は、顔認識IDの入力を省略してもよい。   In S215, the CPU 101 sets the candidate person as the face recognition result of the target face area. Specifically, the CPU 101 acquires the face recognition ID set in the face recognition data for the candidate person, and inputs it to the face recognition ID 304 of the face area detailed information associated with the target face area. Further, the CPU 101 adds the similarity of the candidate person to the similarity history 305 of the face area detailed information associated with the target face area. If the face recognition ID of the candidate person has already been input in the face recognition ID 304 of the face area detailed information associated with the target face area, the input of the face recognition ID may be omitted.

S216で、CPU101は、対象顔領域の顔認識に失敗したことを顔認識結果として出力する。なお、顔認識に失敗した場合CPU101は、対象顔領域に関連付けられている顔領域詳細情報を削除する。なお、このとき例えばライブビュー画面として表示部110に表示される撮像画像に対して本顔認識処理を実行している場合は、CPU101は対象顔領域について顔領域詳細情報が関連付けられていないため、顔認識処理に失敗した旨を表示部110に出力して通知すればよい。   In step S216, the CPU 101 outputs a face recognition result indicating that the face recognition of the target face area has failed. When face recognition fails, the CPU 101 deletes the face area detailed information associated with the target face area. At this time, for example, when the real face recognition process is performed on the captured image displayed on the display unit 110 as a live view screen, the CPU 101 does not associate the face area detailed information with respect to the target face area. What is necessary is just to output to the display part 110 and notify that the face recognition process failed.

なお、本実施形態のS209において最大値の類似度が所定値を超えないと判断した場合は、最大値の類似度と候補人物についての類似度が同レベルであるとみなせる場合である。即ち、1つの顔領域に対して同レベルの類似度を有する人物が複数得られた場合は、これまで所望の顔認識結果が選択されない可能性があったが、CPU101は、顔認識結果の切り替えを抑止することで、本実施形態では所望の顔検出結果を安定的に得られるようにしている。つまり、CPU101はこのような場合にS212乃至S216の処理で、対象顔領域に候補人物の顔が含まれるか否かの判断のみを行うことで、他の人物に顔認識結果が切り替わることを回避する。   If it is determined in S209 of the present embodiment that the maximum similarity is not greater than the predetermined value, the maximum similarity and the similarity for the candidate person can be regarded as being at the same level. That is, when a plurality of persons having the same level of similarity for one face area are obtained, the desired face recognition result may not be selected so far, but the CPU 101 switches the face recognition result. In this embodiment, a desired face detection result can be obtained stably. That is, in such a case, the CPU 101 avoids switching the face recognition result to another person by only determining whether or not the face of the candidate person is included in the target face area in the processing of S212 to S216. To do.

S217で、CPU101は、対象顔領域についての顔認識結果が安定しているかを判定する安定判定処理を実行する。   In step S217, the CPU 101 executes a stability determination process for determining whether the face recognition result for the target face area is stable.

(安定判定処理)
ここで、S217で実行される切替抑止判定処理について、図4(b)のフローチャートを用いて詳細を説明する。
(Stability judgment processing)
Here, the details of the switching suppression determination process executed in S217 will be described with reference to the flowchart of FIG.

S411で、CPU101は、上述の顔認識処理のステップにおいて、対象顔領域についての顔認識結果が、前回の顔認識結果から変化したか否かを判断する。具体的にはCPU101は、対象顔領域に関連付けられた顔領域詳細情報の顔認識ID304を異なる値に変更したか否かを判断する。CPU101は、対象顔領域についての顔認識結果が前回の顔認識結果から変化していないと判断した場合は処理をS412に移し、変化したと判断した場合は本安定判定処理を完了する。   In step S411, the CPU 101 determines whether the face recognition result for the target face area has changed from the previous face recognition result in the face recognition processing step described above. Specifically, the CPU 101 determines whether or not the face recognition ID 304 of the face area detailed information associated with the target face area has been changed to a different value. If the CPU 101 determines that the face recognition result for the target face area has not changed from the previous face recognition result, the CPU 101 moves the process to S412. If the CPU 101 determines that the face recognition result has changed, the stability determination process is completed.

S412で、CPU101は、対象顔領域についての顔認識結果が安定していたか否かを判断する。CPU101は、顔認識結果が安定していなかったと判断した場合は処理をS413に移し、安定していたと判断した場合は本安定判定処理を完了する。   In step S412, the CPU 101 determines whether the face recognition result for the target face area is stable. If the CPU 101 determines that the face recognition result is not stable, it moves the process to S413, and if it determines that the face recognition result is stable, completes the stability determination process.

S413で、CPU101は、対象顔領域に関連付けられている顔領域詳細情報の類似度履歴305を参照し、過去M回の顔認識結果についての類似度が、全て顔認識成功閾値314より高い安定判定閾値(高)312以上であるか否かを判断する。CPU101は、過去M回の顔認識結果についての類似度が、全て安定判定閾値(高)312以上であると判断した場合は処理をS415に移し、1つでも安定判定閾値(高)312未満の類似度があると判断した場合は処理をS414に移す。   In step S <b> 413, the CPU 101 refers to the similarity history 305 of the face area detailed information associated with the target face area, and the stability determination for all the past M face recognition results is higher than the face recognition success threshold 314. It is determined whether or not the threshold (high) 312 is exceeded. If the CPU 101 determines that all the similarities of the past M face recognition results are greater than or equal to the stability determination threshold (high) 312, the CPU 101 moves the process to S 415, and even one is less than the stability determination threshold (high) 312. If it is determined that there is a similarity, the process proceeds to S414.

S414で、CPU101は、過去N(>M)回の顔認識結果についての類似度が、全て顔認識成功閾値314より高く、かつ、安定判定閾値(高)312より低い安定判定閾値(低)313以上であるか否かを判断する。CPU101は、過去N回の顔認識結果についての類似度が、全て安定判定閾値(低)313以上であると判断した場合は処理をS415に移し、1つでも安定判定閾値(低)313未満の類似度があると判断した場合は処理をS416に移す。   In step S <b> 414, the CPU 101 determines that the degrees of similarity for the past N (> M) face recognition results are all higher than the face recognition success threshold 314 and lower than the stability determination threshold (high) 312. It is determined whether this is the case. If the CPU 101 determines that all the similarities of the past N face recognition results are equal to or greater than the stability determination threshold (low) 313, the CPU 101 moves the process to S415, and even one is less than the stability determination threshold (low) 313. If it is determined that there is a similarity, the process proceeds to S416.

S415で、CPU101は、対象顔領域に関連付けられている顔領域詳細情報の安定フラグ302にtrueを設定して本安定判定処理を完了する。   In step S415, the CPU 101 sets true to the stability flag 302 of the face area detailed information associated with the target face area, and completes the stability determination process.

S416で、CPU101は、対象顔領域に関連付けられている顔領域詳細情報の安定フラグ302にfalseを設定して本安定判定処理を完了する。   In step S416, the CPU 101 sets false to the stability flag 302 of the face area detailed information associated with the target face area, and completes the stability determination process.

このようにして対象顔領域についての顔認識結果が安定しているかを判定した後、CPU101は処理をS218に移す。   After determining whether the face recognition result for the target face area is stable in this way, the CPU 101 moves the process to S218.

S218で、CPU101は、S201で検出された現在の顔領域に、含まれる人物の特定がなされていない顔領域がまだ存在するか否かを判断する。CPU101は、含まれている人物の特定がなされていない顔領域が存在すると判断した場合は処理をS203に戻し、存在しないと判断した場合は本顔認識処理を完了する。   In step S218, the CPU 101 determines whether or not there is still a face area in which the included person is not specified in the current face area detected in step S201. If the CPU 101 determines that there is a face area in which no person is included, the process returns to S203, and if it does not exist, the face recognition process is completed.

以上説明したように、本実施形態の画像処理装置は、顔認識処理において、所望の顔認識結果を安定して得ることができる。具体的には画像処理装置は、順次取得した画像から顔領域を検出し、検出した顔領域の各々について、顔認識用データが登録されている人物との類似度を算出する。第1の画像から検出された対象顔領域について、該第1の画像よりも前に取得し、含まれる顔領域について既に顔認識結果が出力されている第2の画像から検出した顔領域の中から、対応関係にある候補顔領域を特定する。そして画像処理装置は、対象顔領域について算出された類似度において、候補顔領域の顔認識結果である人物との類似度が最大値を有し、かつ、該最大値の類似度と次点の類似度との差が第1の閾値を超えると判断した場合に、以後に行われる顔認識処理において、候補顔領域と対応関係にある顔領域の顔認識結果を、候補顔領域の顔認識結果である人物から他の人物に切り替えることを抑止する。そして顔認識処理では、顔認識結果の切り替えが抑止されている際に、候補顔領域の顔認識結果である人物との類似度よりも高い類似度が対象顔領域について算出された場合に、該高い類似度が算出された人物ではなく候補顔領域の顔認識結果である人物を示す情報を対象顔領域の顔認識結果として出力する。   As described above, the image processing apparatus according to the present embodiment can stably obtain a desired face recognition result in the face recognition process. Specifically, the image processing apparatus detects a face area from sequentially acquired images, and calculates the similarity between each detected face area and a person registered with face recognition data. The target face area detected from the first image is acquired before the first image, and the face recognition result for the included face area is already output from the second image that has been output. From this, a candidate face area having a correspondence relationship is identified. Then, the image processing apparatus has a maximum similarity between the similarity calculated for the target face area and the person who is the face recognition result of the candidate face area, and the similarity between the maximum value and the next point When it is determined that the difference from the similarity exceeds the first threshold value, the face recognition result of the face area corresponding to the candidate face area is converted into the face recognition result of the candidate face area. Switch from one person to another person. In the face recognition process, when switching of the face recognition result is suppressed, when a similarity higher than the similarity of the candidate face region with the person who is the face recognition result is calculated for the target face region, Information indicating the person who is the face recognition result of the candidate face area, not the person whose high similarity is calculated, is output as the face recognition result of the target face area.

このように本実施形態の顔認識処理では、過去に検出された対応する顔領域についての顔認識結果の安定、及び顔認識結果の切り替えの抑止を判断しながら顔認識処理を行うことができるため、安定した顔認識結果を出力することができる。   As described above, in the face recognition process of the present embodiment, the face recognition process can be performed while determining the stability of the face recognition result for the corresponding face area detected in the past and the suppression of the switching of the face recognition result. A stable face recognition result can be output.

[その他の実施形態]
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。
[Other Embodiments]
The present invention can also be realized by executing the following processing. That is, software (program) that realizes the functions of the above-described embodiments is supplied to a system or apparatus via a network or various storage media, and a computer (or CPU, MPU, or the like) of the system or apparatus reads the program. It is a process to be executed.

Claims (6)

顔認識用データが登録されている人物との類似度に基づいて、画像内の顔領域の各々に含まれる人物を特定し、特定した人物を示す情報を顔認識結果として出力する顔認識手段を有する画像処理装置であって、
画像を順次取得する取得手段と、
前記取得手段により取得された画像から顔領域を検出する検出手段と、
前記検出手段により検出された顔領域の各々について、前記顔認識用データが登録されている人物との類似度を算出する算出手段と、
前記取得手段により取得された第1の画像から検出された対象顔領域について、該第1の画像よりも前に取得され、含まれる顔領域について既に前記顔認識手段による顔認識結果が出力されている第2の画像から検出された顔領域の中から、対応関係にある候補顔領域を特定する候補取得手段と、
前記対象顔領域について算出された前記類似度において、前記候補顔領域の顔認識結果である人物との類似度が最大値を有し、かつ、該最大値の類似度と次点の類似度との差が第1の閾値を超えると判断した場合に、前記顔認識手段により以後に行われる顔認識処理において、前記候補顔領域と対応関係にある顔領域の顔認識結果を、前記候補顔領域の顔認識結果である人物から他の人物に切り替えることを抑止する抑止手段と、を有し、
前記顔認識手段は、前記抑止手段により前記顔認識結果の切り替えが抑止されている際に、前記候補顔領域の顔認識結果である人物との類似度よりも高い類似度が前記対象顔領域について算出された場合に、該高い類似度が算出された人物ではなく前記候補顔領域の顔認識結果である人物を示す情報を前記対象顔領域の顔認識結果として出力する
ことを特徴とする画像処理装置。
Face recognition means for identifying a person included in each face area in an image based on a similarity to a person for which face recognition data is registered, and outputting information indicating the identified person as a face recognition result An image processing apparatus comprising:
Acquisition means for sequentially acquiring images;
Detecting means for detecting a face area from the image acquired by the acquiring means;
Calculating means for calculating the degree of similarity between each face area detected by the detecting means and the person registered with the face recognition data;
The target face area detected from the first image acquired by the acquisition means is acquired before the first image, and the face recognition result by the face recognition means has already been output for the included face area. Candidate acquisition means for specifying candidate face areas in a correspondence relationship from the face areas detected from the second image,
In the similarity calculated for the target face area, the similarity with the person who is the face recognition result of the candidate face area has a maximum value, and the similarity between the maximum value and the similarity of the next point The face recognition result of the face area corresponding to the candidate face area in the face recognition process performed later by the face recognition means when the difference between the two faces exceeds the first threshold. Deterring means for deterring switching from the person who is the face recognition result to another person,
The face recognizing means has a similarity higher than the similarity of the candidate face area with a person as the face recognition result when the face recognizing result is suppressed by the suppressing means for the target face area. When the image processing is performed, image information is output as the face recognition result of the target face area, indicating information indicating a person who is the face recognition result of the candidate face area instead of the person whose high similarity is calculated apparatus.
前記検出手段により検出された1つの顔領域について、前記取得手段により順次取得された画像において対応関係にある顔領域の顔認識結果が所定の回数連続して同一であり、かつ、該顔認識結果である人物について算出された前記類似度が前記所定の回数連続して第2の閾値以上である場合に、該人物についての顔認識結果が安定していると判断する判断手段をさらに有し、
前記抑止手段は、前記判断手段により前記候補顔領域の顔認識結果である人物についての顔認識結果が安定していると判断された場合に前記抑止を行う
ことを特徴とする請求項1に記載の画像処理装置。
For one face area detected by the detection means, the face recognition results of the corresponding face areas in the images sequentially acquired by the acquisition means are the same continuously for a predetermined number of times, and the face recognition results A determination means for determining that the face recognition result for the person is stable when the similarity calculated for the person is equal to or greater than the second threshold value for the predetermined number of times;
The said suppression means performs the said suppression, when it is judged by the said judgment means that the face recognition result about the person who is a face recognition result of the said candidate face area | region is stable. Image processing apparatus.
前記抑止手段は、顔認識結果の切り替えを抑止している際に、前記対象顔領域について算出された前記類似度において、前記候補顔領域の顔認識結果である人物との類似度を基準として設定された所定値であって、該類似度よりも高い所定値を超える類似度がある場合に前記抑止を中止し、
前記顔認識手段は、前記所定値を超える類似度が算出された人物を、前記対象顔領域の顔認識結果として出力する
ことを特徴とする請求項1または2に記載の画像処理装置。
The suppression means sets the similarity calculated with respect to the target face area based on the similarity with the person who is the face recognition result of the candidate face area when switching the face recognition result is suppressed. And when there is a similarity that exceeds a predetermined value that is higher than the similarity, the suppression is stopped,
The image processing apparatus according to claim 1, wherein the face recognition unit outputs a person whose similarity exceeding the predetermined value is calculated as a face recognition result of the target face area.
前記顔認識手段は、前記抑止手段により前記顔認識結果の切り替えが抑止されている際に、前記対象顔領域について算出された前記類似度において、前記候補顔領域の顔認識結果である人物との類似度よりも高く、かつ、前記所定値よりも低い類似度が算出された場合には、前記候補顔領域の顔認識結果である人物であるか否かの情報を、前記対象顔領域の顔認識結果として出力することを特徴とする請求項3に記載の画像処理装置。   The face recognizing unit is configured to determine whether the face recognition result is a face recognition result of the candidate face region in the similarity calculated for the target face region when switching of the face recognition result is suppressed by the suppressing unit. When a similarity higher than the similarity and lower than the predetermined value is calculated, information on whether or not the person is a face recognition result of the candidate face area is displayed as the face of the target face area The image processing apparatus according to claim 3, wherein the image processing apparatus outputs the result as a recognition result. 顔認識用データが登録されている人物との類似度に基づいて、画像内の顔領域の各々に含まれる人物を特定し、特定した人物を示す情報を顔認識結果として出力する顔認識手段を有する画像処理装置の制御方法であって、
前記画像処理装置の取得手段が、画像を順次取得する取得工程と、
前記画像処理装置の検出手段が、前記取得工程において取得された画像から顔領域を検出する検出工程と、
前記画像処理装置の算出手段が、前記検出工程において検出された顔領域の各々について、前記顔認識用データが登録されている人物との類似度を算出する算出工程と、
前記画像処理装置の候補取得手段が、前記取得工程において取得された第1の画像から検出された対象顔領域について、該第1の画像よりも前に取得され、含まれる顔領域について既に前記顔認識手段による顔認識結果が出力されている第2の画像から検出された顔領域の中から、対応関係にある候補顔領域を特定する候補取得工程と、
前記画像処理装置の抑止手段が、前記対象顔領域について算出された前記類似度において、前記候補顔領域の顔認識結果である人物との類似度が最大値を有し、かつ、該最大値の類似度と次点の類似度との差が第1の閾値を超えると判断した場合に、前記顔認識手段により以後に行われる顔認識処理において、前記候補顔領域と対応関係にある顔領域の顔認識結果を、前記候補顔領域の顔認識結果である人物から他の人物に切り替えることを抑止する抑止工程と、を有し、
前記顔認識手段は、前記抑止工程において前記顔認識結果の切り替えが抑止されている際に、前記候補顔領域の顔認識結果である人物との類似度よりも高い類似度が前記対象顔領域について算出された場合に、該高い類似度が算出された人物ではなく前記候補顔領域の顔認識結果である人物を示す情報を前記対象顔領域の顔認識結果として出力する
ことを特徴とする画像処理装置の制御方法。
Face recognition means for identifying a person included in each face area in an image based on a similarity to a person for which face recognition data is registered, and outputting information indicating the identified person as a face recognition result A control method for an image processing apparatus comprising:
An acquisition step in which the acquisition unit of the image processing apparatus sequentially acquires images;
A detection step in which the detection means of the image processing device detects a face area from the image acquired in the acquisition step;
A calculation step in which the calculation means of the image processing device calculates a similarity with each person whose face recognition data is registered for each of the face areas detected in the detection step;
The candidate acquisition means of the image processing apparatus acquires the target face area detected from the first image acquired in the acquisition step before the first image, and already includes the face for the included face area. A candidate acquisition step of identifying candidate face regions in a corresponding relationship from the face regions detected from the second image from which the face recognition result by the recognition means is output;
In the similarity calculated for the target face area by the suppression unit of the image processing apparatus, the similarity with the person who is the face recognition result of the candidate face area has a maximum value, and the maximum value When it is determined that the difference between the similarity and the similarity of the next point exceeds the first threshold value, in the face recognition process performed later by the face recognition unit, the face area corresponding to the candidate face area A deterrent step of deterring a face recognition result from switching from a person who is a face recognition result of the candidate face region to another person,
The face recognizing means has a similarity higher than the similarity with a person as a face recognition result of the candidate face area for the target face area when switching of the face recognition result is suppressed in the suppressing step. When the image processing is performed, image information is output as the face recognition result of the target face area, indicating information indicating a person who is the face recognition result of the candidate face area instead of the person whose high similarity is calculated Control method of the device.
コンピュータを、請求項1乃至4のいずれか1項に記載の画像処理装置の各手段として機能させるためのプログラム。   The program for functioning a computer as each means of the image processing apparatus of any one of Claims 1 thru | or 4.
JP2012001585A 2012-01-06 2012-01-06 Image processing apparatus, control method thereof, and program Active JP5843618B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012001585A JP5843618B2 (en) 2012-01-06 2012-01-06 Image processing apparatus, control method thereof, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012001585A JP5843618B2 (en) 2012-01-06 2012-01-06 Image processing apparatus, control method thereof, and program

Publications (3)

Publication Number Publication Date
JP2013142930A true JP2013142930A (en) 2013-07-22
JP2013142930A5 JP2013142930A5 (en) 2015-02-19
JP5843618B2 JP5843618B2 (en) 2016-01-13

Family

ID=49039482

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012001585A Active JP5843618B2 (en) 2012-01-06 2012-01-06 Image processing apparatus, control method thereof, and program

Country Status (1)

Country Link
JP (1) JP5843618B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019028532A (en) * 2017-07-26 2019-02-21 富士通株式会社 Image processing apparatus, image processing method, and image processing program
CN111639493A (en) * 2020-05-22 2020-09-08 上海微盟企业发展有限公司 Address information standardization method, device, equipment and readable storage medium

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006146413A (en) * 2004-11-17 2006-06-08 Mitsubishi Electric Corp Object tracking device
JP2006236216A (en) * 2005-02-28 2006-09-07 Fuji Photo Film Co Ltd Person recognition system, person recognizing method and person recognition program
JP2008252296A (en) * 2007-03-29 2008-10-16 Kddi Corp Face index preparation apparatus for moving image and face image tracking method thereof
JP2009048490A (en) * 2007-08-21 2009-03-05 Toshiba Corp Similar shot detection device, program and method
JP2009265774A (en) * 2008-04-22 2009-11-12 Canon Inc Information processor and information processing method
JP2010140425A (en) * 2008-12-15 2010-06-24 Hitachi Kokusai Electric Inc Image processing system
JP2010239507A (en) * 2009-03-31 2010-10-21 Toshiba Corp Moving image processing apparatus
JP2010250556A (en) * 2009-04-15 2010-11-04 Toshiba Corp Apparatus and method for processing image, and program
US20110135153A1 (en) * 2009-12-04 2011-06-09 Shingo Tsurumi Image processing device, image processing method and program
US20110305394A1 (en) * 2010-06-15 2011-12-15 David William Singer Object Detection Metadata

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006146413A (en) * 2004-11-17 2006-06-08 Mitsubishi Electric Corp Object tracking device
JP2006236216A (en) * 2005-02-28 2006-09-07 Fuji Photo Film Co Ltd Person recognition system, person recognizing method and person recognition program
JP2008252296A (en) * 2007-03-29 2008-10-16 Kddi Corp Face index preparation apparatus for moving image and face image tracking method thereof
JP2009048490A (en) * 2007-08-21 2009-03-05 Toshiba Corp Similar shot detection device, program and method
JP2009265774A (en) * 2008-04-22 2009-11-12 Canon Inc Information processor and information processing method
JP2010140425A (en) * 2008-12-15 2010-06-24 Hitachi Kokusai Electric Inc Image processing system
JP2010239507A (en) * 2009-03-31 2010-10-21 Toshiba Corp Moving image processing apparatus
JP2010250556A (en) * 2009-04-15 2010-11-04 Toshiba Corp Apparatus and method for processing image, and program
US20110135153A1 (en) * 2009-12-04 2011-06-09 Shingo Tsurumi Image processing device, image processing method and program
US20110305394A1 (en) * 2010-06-15 2011-12-15 David William Singer Object Detection Metadata

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019028532A (en) * 2017-07-26 2019-02-21 富士通株式会社 Image processing apparatus, image processing method, and image processing program
CN111639493A (en) * 2020-05-22 2020-09-08 上海微盟企业发展有限公司 Address information standardization method, device, equipment and readable storage medium

Also Published As

Publication number Publication date
JP5843618B2 (en) 2016-01-13

Similar Documents

Publication Publication Date Title
JP5567853B2 (en) Image recognition apparatus and method
US10115178B2 (en) Image processing apparatus, image capturing apparatus, image processing method, and storage medium
US11004214B2 (en) Image processing apparatus, image processing method, and storage medium
US20160142680A1 (en) Image processing apparatus, image processing method, and storage medium
JP6132490B2 (en) Authentication apparatus, authentication method, and program
JP5106356B2 (en) Image monitoring device
JP2007249588A (en) Face image registration device, method, program, and storage medium
CN101656830B (en) Image processing apparatus, and image processing method
JP2008197904A (en) Person retrieving device and person retrieving method
JP2009087232A (en) Person authentication apparatus and person authentication method
US10013632B2 (en) Object tracking apparatus, control method therefor and storage medium
US20150205995A1 (en) Personal recognition apparatus that performs personal recognition using face detecting function, personal recognition method, and storage medium
JP6924064B2 (en) Image processing device and its control method, and image pickup device
US9070008B2 (en) Object recognition apparatus and dictionary data registration method
JP2005149370A (en) Imaging device, personal authentication device and imaging method
JP5395650B2 (en) Subject area extraction device and control method thereof, subject tracking device, and program
JP7074174B2 (en) Discriminator learning device, discriminator learning method and computer program
JP5843618B2 (en) Image processing apparatus, control method thereof, and program
JP5499531B2 (en) Electronic camera
JP2011071925A (en) Mobile tracking apparatus and method
JP2013218393A (en) Imaging device
JP5786544B2 (en) Image processing apparatus, imaging apparatus, and program
JP5995610B2 (en) Subject recognition device and control method therefor, imaging device, display device, and program
JP5865069B2 (en) Image processing apparatus, control method thereof, and program
US20130265465A1 (en) Image processing apparatus and image processing method

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141226

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20141226

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150904

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151019

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151117

R151 Written notification of patent or utility model registration

Ref document number: 5843618

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151