JP2009252069A - 画像処理装置、撮像装置、画像処理方法及びプログラム - Google Patents

画像処理装置、撮像装置、画像処理方法及びプログラム Download PDF

Info

Publication number
JP2009252069A
JP2009252069A JP2008101150A JP2008101150A JP2009252069A JP 2009252069 A JP2009252069 A JP 2009252069A JP 2008101150 A JP2008101150 A JP 2008101150A JP 2008101150 A JP2008101150 A JP 2008101150A JP 2009252069 A JP2009252069 A JP 2009252069A
Authority
JP
Japan
Prior art keywords
face
registered
recognition dictionary
person
face recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008101150A
Other languages
English (en)
Other versions
JP5044472B2 (ja
Inventor
Yitong Zhang
貽丹彡 張
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Corp
Original Assignee
Fujifilm Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujifilm Corp filed Critical Fujifilm Corp
Priority to JP2008101150A priority Critical patent/JP5044472B2/ja
Publication of JP2009252069A publication Critical patent/JP2009252069A/ja
Application granted granted Critical
Publication of JP5044472B2 publication Critical patent/JP5044472B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)
  • Image Processing (AREA)
  • Studio Devices (AREA)

Abstract

【課題】辞書に特定人物の顔の登録をすることなく、画像に含まれている顔の中から特定人物の顔のみを自動的に分類することができる。
【解決手段】画像の中から抽出された顔の特徴ベクトルJ0と、顔認識辞書に登録された特徴ベクトルJi(i=1…N、Nは顔認識辞書に登録された顔の数)との類似度Xiを算出し、最も大きい類似度Xk(1≦K≦N)が閾値Aより大きい場合は、画像の中から抽出された顔はK番目の顔と判断し、K番目の顔の特徴ベクトルJkと出現頻度を修正する。また、最も大きい類似度Xkが閾値Aより小さい場合は、画像の中から抽出された顔は新しい顔と判断し、顔認識辞書に特徴ベクトルJ0と出現頻度を新規登録する。類似度Xkが閾値Aより大きく、かつ出現頻度が閾値Bより大きい場合は、画像の中から抽出された顔を既知顔とする。
【選択図】 図4

Description

本発明は画像処理装置、撮像装置、画像処理方法及びプログラムに係り、特に自動的に特定人物を判断することができる画像処理装置、撮像装置、画像処理方法及びプログラムに関する。
従来、撮影した被写体像から被写体人物の顔を検出し、その顔に合わせてAE(自動露出制御)、AF(自動合焦制御)などをすることで適切な露光、合焦で人物写真を撮ることができる撮像装置(例えばデジタルカメラ)が用いられている。しかしながら、撮影された被写体像にユーザにとって無関係な人物が含まれている場合には、ユーザにとって無関係な人物に対してAE、AFなどを行ってしまう恐れがある。
このような不具合を防止するため、特定人物(知人、親族などユーザがよく撮る人物)の顔を予め辞書に登録しておくことにより、撮影された被写体像の中から特定人物の顔を認識する技術が開示されている(特許文献1参照)。
しかしながら、特許文献1に記載の方法を用いる場合には、特定人物の顔を認織する為に、特定人物の顔を事前に辞書登録しておく必要がある。また、検出対象となる人物を変更する場合には、登録した顔の削除や、顔の追加登録などの作業が必要となる。このように、様々な作業をユーザが行う必要があるため、ユーザにとっては負担が大きい上、不便である。
これに対応して、画像に含まれる顔を認識し、認識された顔が辞書に登録されていない場合には、認識された顔を自動的に辞書に登録する技術が開示されている(特許文献2、3参照)。
特開平6―259534号公報 特開2002―157596号公報 特表2007―520010号公報
しかしながら、特許文献2,3に記載された発明においては、辞書に登録されている顔の全てを検出すべき人物と見なすため、ユーザが撮影対象とした人物(特定人物)の顔(既知顔)と、被写体像に撮影された無関係な人物(未知顔)との区別ができず、撮像装置に顔を認識する技術を使用する意味がなくなってしまう。
本発明はこのような事情に鑑みてなされたもので、辞書に特定人物の顔の登録をすることなく、画像に含まれている顔の中から既知顔のみを自動的に分類することができる画像処理装置、撮像装置、画像処理方法及びプログラムを提供することを目的とする。
前記目的を達成するために、請求項1に記載の画像処理装置は、同一人物か否かを判別するための顔の特徴が人物ごとに登録される顔認識辞書と、人物を含む画像を取得する画像取得手段と、前記画像取得手段により取得された画像から顔領域を検出する顔領域検出手段と、前記顔領域検出手段により検出された顔領域に基づいて、当該顔領域の顔の特徴を抽出する特徴抽出手段と、前記特徴抽出手段により抽出された顔の特徴と、前記顔認識辞書に登録された顔の特徴とに基づいて同一人物の顔の特徴が前記顔認識辞書に登録されているか否かを判別する判別手段と、前記判別手段によって同一人物の顔の特徴が前記顔認識辞書に登録されていると判別されると、前記抽出された顔の特徴に基づいて前記登録されている顔の特徴を修正し、前記判別手段によって同一人物の顔の特徴が前記顔認識辞書に登録されていないと判別されると、前記抽出された顔の特徴を新規の人物の顔の特徴として登録する顔認識辞書修正手段と、前記判別手段によって同一人物の顔の特徴が前記顔認識辞書に登録されていると判別されると、前記画像取得手段により取得された画像中の人物の顔を既知顔として分類し、前記判別手段によって同一人物の顔の特徴が前記顔認識辞書に登録されていないと判別されると、前記画像取得手段により取得された画像中の人物の顔を未知顔として分類する分類手段と、を備えたことを特徴とする。
請求項1に記載の画像処理装置によれば、画像を取得し、画像から顔領域を検出し、検出された顔領域に基づいて、当該顔領域の顔の特徴(例えば、特徴ベクトル)を抽出し、抽出された顔の特徴と、顔認識辞書に登録された顔の特徴とに基づいて、抽出された顔と同一人物の顔の特徴が顔認識辞書に登録されているか否かを判別する。抽出された顔と同一人物の顔の特徴が前記顔認識辞書に登録されていると判別されると、抽出された顔の特徴に基づいて顔認識辞書に登録されている顔の特徴を修正し、抽出された顔を既知顔として分類する。また、抽出された顔と同一人物の顔の特徴が顔認識辞書に登録されていないと判別されると、抽出された顔の特徴を新規の人物の顔の特徴として顔認識辞書に登録し、抽出された顔を未知顔と分類する。
このように、抽出された顔と同一人物の顔の特徴が顔認識辞書に登録されていない場合には、抽出された顔の特徴を新規の人物の顔の特徴として顔認識辞書に登録することにより、顔認識辞書への登録をすることなく、ユーザの負担が軽く、便利な画像処理装置を提供することができる。また、抽出された顔の特徴に基づいて顔認識辞書に登録されている顔の特徴を修正することにより、自動的に既知顔の検出をすることができる。
請求項2に記載の画像処理装置は、請求項1に記載の画像処理装置において、前記判別手段は、前記特徴抽出手段により抽出された顔の特徴と、前記顔認識辞書に登録された顔の特徴のうちの前記抽出された顔の特徴に最も類似する特徴との類似度を算出し、前記算出した類似度が所定の閾値を越えた場合に、前記特徴抽出手段により顔の特徴が抽出された顔と同一人物の顔の特徴が前記顔認識辞書に登録されていると判別することを特徴とする。
請求項2に記載の画像処理装置によれば、抽出された顔の特徴と顔認識辞書に登録された顔の特徴との類似度であって、顔認識辞書に登録された顔の特徴のうちの抽出された顔の特徴に最も類似する特徴との類似度、すなわち最も高い類似度を算出する。最も高い類似度が所定の閾値を越えた場合には、抽出された顔と同一人物の顔が顔認識辞書に登録されていると判別する。このように、類似度を用いることにより、顔認識辞書に登録された顔と、抽出された顔とが同一であるかどうかを精度よく判断することができる。したがって、抽出された顔と同一人物の顔が顔認識辞書に登録されていない場合に、抽出された顔が顔認識辞書に登録されていると間違って判別することを防止することができる。
請求項3に記載の画像処理装置は、請求項1又は2に記載の画像処理装置において、前記顔認識辞書に登録された人物ごとに、前記顔認識辞書に登録された人物の特徴の出現頻度を管理する出現頻度管理手段を備え、前記分類手段は、前記判別手段によって同一人物の顔の特徴が前記顔認識辞書に登録されていると判別され、かつ前記出現頻度管理手段に管理された出現頻度が所定の閾値以上の場合に、前記画像取得手段により取得された画像中の人物の顔を既知顔として分類し、前記判別手段によって同一人物の顔の特徴が前記顔認識辞書に登録されていないと判別された場合、又は前記出現頻度管理手段に管理された出現頻度が前記所定の閾値未満の場合に、前記画像取得手段により取得された画像中の人物の顔を未知顔として分類することを特徴とする。
請求項3に記載の画像処理装置によれば、抽出された顔と同一人物の顔が顔認識辞書に登録されていると判別され、かつ当該顔の特徴の出現頻度が所定の閾値以上の場合には、画像中の人物の顔を既知顔と分類する。また、抽出された顔と同一人物の顔が顔認識辞書に登録されていないと判別された場合、又は当該顔の特徴の出現頻度が所定の閾値未満の場合には、画像中の人物の顔を未知顔と分類する。これにより、既知顔と未知顔とを高い精度で分類することができる。
請求項4に記載の画像処理装置は、請求項1又は2に記載の画像処理装置において、前記顔認識辞書に登録された人物ごとに、前記顔認識辞書に登録された人物の特徴の出現頻度を管理する出現頻度管理手段を備え、前記分類手段は、前記判別手段によって同一人物の顔の特徴が前記顔認識辞書に登録されていると判別され、かつ前記出現頻度管理手段に管理された出現頻度が上位の所定順位以内の場合に、前記画像取得手段により取得された画像中の人物の顔を既知顔として分類し、前記判別手段によって同一人物の顔の特徴が前記顔認識辞書に登録されていないと判別された場合、又は前記出現頻度管理手段に管理された出現頻度が前記上位の所定順位以外の場合に、前記画像取得手段により取得された画像中の人物の顔を未知顔として分類することを特徴とする。
請求項4に記載の画像処理装置によれば、抽出された顔と同一人物の顔が顔認識辞書に登録されていると判別され、かつ当該顔の特徴の出現頻度が上位の所定順位以内の場合には、画像中の人物の顔を既知顔と分類する。また、抽出された顔と同一人物の顔が顔認識辞書に登録されていないと判別された場合、又は当該顔の特徴の出現頻度が上位の所定順位以外の場合には、画像中の人物の顔を未知顔と分類する。これにより、既知顔と未知顔とを高い精度で分類することができる。特に、顔認識辞書に多数の顔が登録されていない場合においても、既知顔と未知顔とを分類することができる。
請求項5に記載の画像処理装置は、請求項3又は4のいずれかに記載の画像処理装置において、前記出現頻度管理手段は、前記判別手段によって同一人物の顔の特徴が前記顔認識辞書に登録されていると判別されると、前記同一人物の特徴の出現頻度に1を追加したものを該同一人物の特徴の新たな出現頻度とし、前記判別手段によって同一人物の顔の特徴が前記顔認識辞書に登録されていないと判別されると、前記新規の人物の顔の特徴の出現頻度を1とすることを特徴とする。
請求項5に記載の画像処理装置によれば、抽出された顔と同一人物の顔が顔認識辞書に登録されていると判別された場合には、顔認識辞書に登録されている顔の特徴の出現頻度に1を追加し、抽出された顔と同一人物の顔が顔認識辞書に登録されていないと判別された場合には、新たに顔認識辞書に登録された新規の人物の顔の特徴の出現頻度を1とする。これにより、出現頻度に応じて既知顔と未知顔とを分類することができる。
請求項6に記載の画像処理装置は、請求項1〜5のいずれかに記載の画像処理装置において、顔認識辞書修正手段は、前記判別手段によって同一人物の顔の特徴が前記顔認識辞書に登録されていると判別されると、前記顔認識辞書に登録された前記同一人物の顔の特徴に代えて、前記抽出手段により抽出された顔の特徴と、前記顔認識辞書に登録された前記同一人物の顔の特徴との重み付け平均値が前記同一人物の顔の特徴となるように、前記顔認識辞書を修正することを特徴とする。
請求項6に記載の画像処理装置によれば、抽出された顔と同一人物の顔の特徴が顔認識辞書に登録されていると判別されると、抽出された顔の特徴と、顔認識辞書に登録された特徴との重み付け平均値を、新たな顔の特徴として顔認識辞書を修正する。これにより、使用回数が増えるのに伴って、顔認識辞書に登録された顔の特徴を本来あるべき値に収束させることができる。したがって、使用回数が増えると共に、自動的に顔認識の精度を上げることができる。
請求項7に記載の撮像装置は、請求項1〜6のいずれかに記載の画像処理装置と、被写体像を撮像する撮像手段と、前記撮像手段により撮像された被写体像を表示する表示手段と、前記表示手段に表示された被写体像に、前記顔領域検出手段により検出された顔領域を示す枠を重ねて表示する表示制御手段であって、前記既知顔と前記未知顔とを区別して表示する表示制御手段と、を備えたことを特徴とする。
請求項7に記載の撮像装置によれば、撮影された被写体像から自動的に既知顔と未知顔を分類し、既知顔、未知顔それぞれの顔領域に異なる枠を被写体像に重ねて表示する。これにより、ユーザは既知顔が自動的に検出されたことを確認することができる。
請求項8に記載の撮像装置は、請求項7に記載の撮像装置において、前記表示制御手段は、前記分類手段において前記画像取得手段により取得された画像中の人物の顔が既知顔として分類された場合には所定色の枠を表示し、前記分類手段において前記画像取得手段により取得された画像中の人物の顔が未知顔として分類された場合には前記所定色と異なる色の枠を表示することを特徴とする。
請求項8に記載の撮像装置によれば、既知顔の顔領域には所定色の枠を表示し、未知顔の顔領域には所定色と異なる色の枠を表示する。これにより、ユーザが既知顔を撮影する回数が増えることなどにより、未知顔と分類された顔が既知顔と分類されるようになると、顔領域に重ねて表示される枠の色が自動的に変化し、撮像装置が自動的に学習しているということをユーザに認識させることができる。
請求項9に記載の撮像装置は、請求項7又は8に記載の撮像装置において、前記分類手段により分類された既知顔に対して、自動露出制御、自動合焦制御及び自動ホワイトバランス制御のうちの少なくとも1つを行う制御手段を備えたことを特徴とする。
請求項9に記載の撮像装置によれば、既知顔に対して自動露出制御、自動合焦制御及び自動ホワイトバランス制御等を行うことで、既知顔が適切に合焦、露出された被写体像を撮像することができる。
請求項10に記載の画像処理方法は、人物を含む画像を取得するステップと、前記取得された画像から顔領域を検出するステップと、前記検出された顔領域に基づいて、当該顔領域の顔の特徴を抽出するステップと、前記抽出された顔の特徴と、同一人物か否かを判別するための顔の特徴が人物ごとに登録される顔認識辞書に登録された顔の特徴とに基づいて、同一人物の顔の特徴が前記顔認識辞書に登録されているか否かを判別するステップと、前記同一人物の顔の特徴が前記顔認識辞書に登録されているか否かを判別するステップにおいて前記同一人物の顔の特徴が前記顔認識辞書に登録されていると判別されると、前記抽出された顔の特徴に基づいて前記登録されている顔の特徴を修正するステップと、前記同一人物の顔の特徴が前記顔認識辞書に登録されているか否かを判別するステップにおいて前記同一人物の顔の特徴が前記顔認識辞書に登録されていないと判別されると、前記抽出された顔の特徴を新規の人物の顔の特徴として登録するステップと、を含むことを特徴とする。
請求項11に記載の画像処理方法は、請求項10に記載の画像処理方法において、前記顔認識辞書に登録された人物ごとに、前記顔認識辞書に登録された人物の特徴の出現頻度を算出するステップと、前記同一人物の顔の特徴が前記顔認識辞書に登録されているか否かを判別するステップにおいて前記同一人物の顔の特徴が前記顔認識辞書に登録されていると判別され、かつ前記顔認識辞書に登録された人物の特徴の出現頻度を算出するステップにおいて算出された出現頻度が所定の閾値以上の場合に、前記取得された画像中の人物の顔を既知顔として分類するステップと、前記同一人物の顔の特徴が前記顔認識辞書に登録されているか否かを判別するステップにおいて前記判別手段によって同一人物の顔の特徴が前記顔認識辞書に登録されていないと判別された場合、又は前記顔認識辞書に登録された人物の特徴の出現頻度を算出するステップにおいて算出された出現頻度が前記所定の閾値未満の場合に、前記取得された画像中の人物の顔を未知顔として分類するステップと、を含むことを特徴とする。
請求項12に記載の画像処理方法は、請求項10に記載の画像処理方法において、前記顔認識辞書に登録された人物ごとに、前記顔認識辞書に登録された人物の特徴の出現頻度を算出するステップと、前記同一人物の顔の特徴が前記顔認識辞書に登録されているか否かを判別するステップにおいて前記同一人物の顔の特徴が前記顔認識辞書に登録されていると判別され、かつ前記顔認識辞書に登録された人物の特徴の出現頻度を算出するステップにおいて算出された出現頻度が上位の所定順位以内の場合に、前記取得された画像中の人物の顔を既知顔として分類するステップと、前記同一人物の顔の特徴が前記顔認識辞書に登録されているか否かを判別するステップにおいて前記判別手段によって同一人物の顔の特徴が前記顔認識辞書に登録されていないと判別された場合、又は前記顔認識辞書に登録された人物の特徴の出現頻度を算出するステップにおいて算出された出現頻度が前記上位の所定順位以外の場合に、前記取得された画像中の人物の顔を未知顔として分類するステップと、を含むことを特徴とする。
請求項13に記載のプログラムは、請求項10から12のいずれかに記載の画像処理方法を演算装置に実行させる。
本発明によれば、辞書に特定人物の顔の登録をすることなく、画像に含まれている顔の中から特定人物の顔のみを自動的に分類することができる画像処理装置、撮像装置、画像処理方法及びプログラムを提供することができる。
以下、添付図面に従って本発明が適用された画像処理装置、撮像装置、画像処理方法及びプログラムを実施するための最良の形態について詳細に説明する。
図1は第1の実施の形態の撮像装置のデジタルカメラ1を示す正面斜視図である。図2は、上記デジタルカメラ1の一実施形態を示す背面図である。この撮像装置は、レンズを通った光を撮像素子で受け、デジタル信号に変換して記憶メディアに記録するデジタルカメラである。
デジタルカメラ1のカメラボディ12は、横長の四角い箱状に形成されており、その正面には、図1に示すように、レンズ14、ストロボ16、ファインダ窓18、セルフタイマランプ20、AF補助光ランプ22、ストロボ調光センサ24等が配設されている。また、カメラボディ12の上面にはシャッターボタン26、電源/モードスイッチ28、モードダイヤル30等が配設されている。
一方、カメラボディ12の背面には、図2に示すように、モニタ32、ファインダ接眼部34、スピーカ36、ズームボタン38、十字ボタン40、MENU/OKボタン42、DISPボタン44、BACKボタン46等が配設されている。
なお、図示しないカメラボディ12の下面には、三脚ネジ穴と、開閉自在なカバーを介してバッテリ挿入部とメモリカードスロットとが設けられており、このバッテリ挿入部とメモリカードスロットにバッテリとメモリカードが装填される。
レンズ14は、沈胴式のズームレンズで構成されており、電源/モードスイッチ28によってカメラのモードを撮影モードに設定することにより、カメラボディ12から繰り出される。なお、レンズ14のズーム機構や沈胴機構については、公知の技術なので、ここでは、その具体的な構成についての説明は省略する。
ストロボ16は、主要被写体に向けてストロボ光を照射できるように、その発光部が水平方向及び垂直方向に揺動できるように構成されている。なお、このストロボ16の構成については、後に詳述する。
ファインダ窓18は、撮影する被写体を決めるのぞき窓の部分である。
セルフタイマランプ20は、たとえばLED構成されており、後述するシャッターボタン26を押した後、一定時間を経過した後で撮影を行うセルフタイマ機能を用いて撮影を行うときに発光される。
AF補助光ランプ22は、たとえば高輝度LED構成されており、AF時に必要に応じて発光される。
ストロボ調光センサ24は、後述するようにストロボ16の発光量を調整するものである。
シャッターボタン26は、いわゆる「半押し」と「全押し」とからなる2段ストローク式のスイッチで構成されている。デジタルカメラ1は、このシャッターボタン26が「半押し」されることにより、AE/AFが作動し、「全押し」されることにより、撮影を実行する。
電源/モードスイッチ28は、デジタルカメラ1の電源をON/OFFする電源スイッチとしての機能と、デジタルカメラ1のモードを設定するモードスイッチとしての機能とを併せ持っており、「OFF位置」と「再生位置」と「撮影位置」との間をスライド自在に配設されている。デジタルカメラ1は、電源/モードスイッチ28をスライドさせて、「再生位置」又は「撮影位置」に合わせることにより、電源がONになり、「OFF位置」に合わせることにより、電源がOFFになる。そして、電源/モードスイッチ28をスライドさせて、「再生位置」に合わせることにより、「再生モード」に設定され、「撮影位置」に合わせることにより、「撮影モード」に設定される。
モードダイヤル30は、デジタルカメラ1の撮影モードを設定する撮影モード設定手段として機能し、このモードダイヤルの設定位置により、デジタルカメラ1の撮影モードが様々なモードに設定される。例えば、絞り、シャッタースピード等がデジタルカメラ1によって自動的に設定される「オート撮影モード」、動画撮影を行う「動画撮影モード」、人物撮影に適した「人物撮影モード」、動体撮影に適した「スポーツ撮影モード」、風景の撮影に適した「風景撮影モード」、夕景及び夜景の撮影に適した「夜景撮影モード」、絞りの目盛りをユーザが設定し、シャッタースピードをデジタルカメラ1が自動的に設定する「絞り優先撮影モード」、シャッタースピードをユーザが設定し、絞りの目盛りをデジタルカメラ1が自動的に設定する「シャッタースピード優先撮影モード」、絞り、シャッタースピード等をユーザが設定する「マニュアル撮影モード」等である。
モニタ32は、カラー表示が可能な液晶ディスプレイで構成されている。このモニタ32は、再生モード時に撮影済み画像を表示するための画像表示パネルとして利用されるとともに、各種設定操作を行なう際のユーザインターフェース表示パネルとして利用される。また、撮影モード時には、必要に応じてスルー画像が表示されて、画角確認用の電子ファインダとして利用される。
ズームボタン38は、ズームを指示するズーム指示手段として機能し、望遠側へのズームを指示するズームテレボタン38Tと、広角側へのズームを指示するズームワイドボタン38Wとからなる。デジタルカメラ1は、撮影モード時に、このズームテレボタン38Tとズームワイドボタン38Wとが操作されることにより、レンズ14の焦点距離が変化する。また、再生モード時に、このズームテレボタン38Tとズームワイドボタン38Wとが操作されることにより、再生中の画像が拡大、縮小する。
十字ボタン40は、上下左右4方向の指示を入力する方向指示手段として機能し、たとえば、メニュー画面でメニュー項目の選択などに使用される。
MENU/OKボタン42は、各モードの通常画面からメニュー画面への遷移を指示するボタン(MENUボタン)として機能するととともに、選択内容の確定、処理の実行等を指示するボタン(OKボタン)として機能する。
DISPボタン44は、モニタ32の表示切り替えを指示するボタンとして機能し、撮影中、このDISPボタン44が押されると、モニタ32の表示が、ON→フレーミングガイド表示→OFFに切り替えられる。また、再生中、このDISPボタン44が押されると、通常再生→文字表示なし再生→マルチ再生に切り替えられる。
BACKボタン46は、入力操作のキャンセルや一つ前の操作状態に戻すことを指示するボタンとして機能する。
図3は、デジタルカメラ1内部の概略構成を示すブロック図である。
同図に示すように、デジタルカメラ1は、CPU110、メモリ112、VRAM114、ROM116、EEPROM118、操作部(シャッターボタン26、電源/モードスイッチ28、モードダイヤル30、ズームボタン38、十字ボタン40、MENU/OKボタン42、DISPボタン44、BACKボタン46等)120、タイミングジェネレータ(TG)122、撮像素子124、アナログ処理部(CDS/AMP)128、A/D変換器130、画像入力制御部132、画像信号処理部134、圧縮伸張処理部136、AF検出部140、AE/AWB検出部142、絞り駆動部144、レンズ駆動部146、ストロボ制御部148、メディア制御部150、ビデオエンコーダ152、記憶メディア35、顔検出部154、顔認識辞書記憶部156、既知顔分類部158、顔認識辞書修正部160等で構成されている。
CPU110は、操作部120から入力される操作信号に基づき所定の制御プログラムに従ってデジタルカメラ1の全体を統括制御する。
バスを介してCPU110と接続されたROM116には、このCPU110が実行する制御プログラム及び制御に必要な各種データ等が格納されており、EEPROM118には、ユーザ設定情報等のデジタルカメラ1の動作に関する各種設定情報等が格納されている。また、メモリ(SDRAM)112は、CPU110の演算作業用領域として利用されるとともに、画像データ等の一時記憶領域として利用され、VRAM114は、画像データ専用の一時記憶領域として利用される。
撮像素子124は、たとえば、所定のカラーフィルタ配列のカラーCCDで構成されており、レンズ14によって結像された被写体の画像を電子的に撮像する。タイミングジェネレータ(TG)122は、CPU110からの指令に応じて、この撮像素子124を駆動するためのタイミング信号を出力する。
アナログ処理部128は、撮像素子124から出力された画像信号に対して、画素ごとのR、G、B信号をサンプリングホールド(相関二重サンプリング処理)するとともに、増幅してA/D変換器130に出力する。
A/D変換器130は、アナログ処理部128から出力されたアナログのR、G、B信号をデジタルのR、G、B信号に変換して出力する。
画像入力制御部132は、A/D変換器130から出力されたデジタルのR、G、B信号をメモリ112に出力する。
画像信号処理部134は、同時化回路(単板CCDのカラーフィルタ配列に伴う色信号の空間的なズレを補間して色信号を同時式に変換する処理回路)、ホワイトバランス補正回路、ガンマ補正回路、輪郭補正回路、輝度・色差信号生成回路等を含み、CPU110からの指令に従い、入力された画像信号に所要の信号処理を施して、輝度データ(Yデータ)と色差データ(Cr,Cbデータ)とからなる画像データ(YUVデータ)を生成する。
圧縮伸張処理部136は、CPU110からの指令に従い、入力された画像データに所定形式の圧縮処理を施し、圧縮画像データを生成する。また、CPU110からの指令に従い、入力された圧縮画像データに所定形式の伸張処理を施し、非圧縮の画像データを生成する。
AF検出部140は、G信号の高周波成分のみを通過させるハイパスフィルタ、絶対値化処理部、所定のフォーカスエリア(たとえば、画面中央部)内の信号を切り出すAFエリア検出部及びAFエリア内の絶対値データを積算する積算部から構成される。
AE/AWB検出部142は、CPU110からの指令に従い、入力された画像信号からAE制御及びAWB制御に必要な物理量を算出する。たとえば、AE制御に必要な物理量として、1画面を複数のエリア(たとえば16×16)に分割し、分割したエリアごとにR、G、Bの画像信号の積算値を算出する。
絞り駆動部144及びレンズ駆動部146は、CPU110からの指令に応じて、撮影レンズ14、絞り15の動作を制御する。
ストロボ制御部148は、CPU110からの指令に従い、ストロボ16の発光を制御する。
メディア制御部150は、CPU110からの指令に従い、メディアスロットに装填された記憶メディア35に対してデータの読み/書きを制御する。
ビデオエンコーダ152は、CPU110からの指令に従い、モニタ32への表示を制御する。すなわち、CPU110からの指令に従い、入力された画像信号をモニタ32に表示するための映像信号(たとえば、NTSC信号やPAL信号、SCAM信号)に変換してモニタ32に出力するとともに、必要に応じてCPU110で合成された、所定の文字、図形情報をモニタ32に出力する。
顔検出部154は、CPU110からの指令に従い、入力された画像データから画像内の顔領域を抽出し、その位置(たとえば、顔領域の重心)を検出する。この顔領域の抽出は、たとえば、原画像から肌色データを抽出し、肌色範囲と判断された測光点のクラスタを顔として抽出する。この他、画像から顔領域を抽出する方法としては、測光データを色相と彩度に変換し、変換した色相・彩度の二次元ヒストグラムを作成し、解析することで、顔領域を判断する方法や、人の顔の形状に相当する顔候補領域を抽出し、その領域内の特徴量から顔領域を決定する方法、画像から人の顔の輪郭を抽出し、顔領域を決定する方法、複数の顔の形状をしたテンプレートを用意し、そのテンプレートと画像との相関を計算し、この相関値により顔候補領域とすることで人の顔を抽出する方法等が知られており、これらの方法を用いて抽出することができる。
顔認識辞書記憶部156は、顔の特徴を示す指標と出現頻度とが関連付けて登録された顔認識辞書が記憶されたものである。顔の特徴を示す指標とは、例えば特徴ベクトルJi(i=1…N、Nは顔認識辞書に登録された顔の数)であり、顔の大きさの正規化、雑音除去、方向性抽出フィルタなどの変換が行なわれた後で、主成分分析により算出される。
主成分分析により特徴ベクトルJiを算出する方法等は公知の技術であるため、ここでは特徴ベクトルJiについて簡単に説明する。複数枚の顔の画像I=(I1,I2,I3…IN)に基づいて数式1に示す相関行列を計算し、数式2に示す固有値問題を解くことにより固有ベクトルΓを算出する。
Figure 2009252069
Figure 2009252069
上位k個の固有ベクトルΓ1,Γ2,…Γkを用いたサブ空間行列S=(Γ1,Γ2,…Γk)を用いて特徴ベクトルJiを作成する。
Figure 2009252069
これにより、冗長成分が除去され、顔画像認識のために有効な特徴が抽出された特徴ベクトルJnが算出される。例えば、20×20画素の画像であるとすると、Iiは400次元となるが、サブ空間行列S=(Γ1,Γ2,…Γk)を用いることにより特徴ベクトルJiをk次元、例えば20次元まで圧縮することができる。
なお、顔の特徴を示す指標として、特徴ベクトルJi以外に、目や口などの顔を構成する各部位の間の距離や位置関係を用いることもできる。
次に、出現頻度について説明する。出現頻度とは、既知顔分類部158(後で詳述)において、顔認識辞書記憶部156に登録された所定の顔(例えば、a番目の顔)が、被写体像から顔検出部154において検出された顔(以下、入力顔という)であると判断された頻度である。
例えば、過去に、顔検出部154で検出された顔が、顔認識辞書記憶部156に登録されたa番目の顔であると判断された回数がn回である場合には、a番目の顔の出現頻度はn回である。次に顔検出部154で検出された顔が、顔認識辞書記憶部156に登録されたa番目の顔であると判断された場合には、a番目の顔の出現頻度はn+1回となる。
既知顔分類部158は、顔検出部154で検出された顔のなかから特定人物の顔(既知顔)を分類する。具体的には、まず顔検出部154で検出された顔の特徴ベクトルJ0を算出し、次に数式4を用いて、特徴ベクトルJ0と、顔認識辞書記憶部156に登録された顔の特徴ベクトルJiとの類似度Xiを算出する。なお、算出された類似度Xiは、1に近いほど顔検出部154で検出された顔と、顔認識辞書記憶部156に登録された顔とが類似しており、1の場合は顔検出部154で検出された顔と、顔認識辞書記憶部156に登録された顔とが一致していることを意味する。
Figure 2009252069
顔認識辞書記憶部156に登録された全ての顔の特徴ベクトルとの類似度Xkのうちの最も高い類似度Xk(1≦K≦N)を求め、類似度Xkの値に基づいて顔検出部154で検出された顔が特定人物の顔(既知顔)であるかどうかを判断する。特定人物の顔(既知顔)を分類する方法については、後に詳述する。
なお、類似度としては、特徴ベクトルJ0、Ji間のユークリッド距離の2乗E=‖Ji−J0‖2を用いることもできる。Eが0に近いほど類似度が高いことを意味し、1/Eが1に近いほど類似度が高いことを意味する。
顔認識辞書修正部160は、既知顔分類部158で算出された類似度に基づいて、顔認識辞書記憶部156に記憶された顔認識辞書を修正する。顔認識辞書修正部160において、顔認識辞書を修正する方法については、後に詳述する。
次に、以上のように構成された本実施の形態のデジタルカメラ1の作用について説明する。
電源/モードスイッチ28を撮影位置に合わせることで、撮影モードに設定され、撮影が可能になる。そして、撮影モードに設定されることにより、レンズ14が繰り出され、撮影スタンバイ状態になる。
この撮影モードの下、レンズ14を通過した被写体光は、絞り15を介して撮像素子124の受光面に結像される。撮像素子124の受光面には、所定の配列構造(ベイヤー、Gストライプなど)で配列された赤(R)、緑(G)、青(B)のカラーフィルタを介して多数のフォトダイオード(受光素子)が二次元的に配置されている。レンズ14を通過した被写体光は、各フォトダイオードによって受光され、入射光量に応じた量の信号電荷に変換される。
各フォトダイオードに蓄積された信号電荷は、タイミングジェネレータ(TG)122から与えられる駆動パルスに基づいて信号電荷に応じた電圧信号(画像信号)として順次読み出され、アナログ処理部(CDS/AMP)128に加えられる。
アナログ処理部128から出力されたアナログのR、G、B信号は、A/D変換器130でデジタルのR、G、B信号に変換され、画像入力制御部132に加えられる。画像入力制御部132は、A/D変換器130から出力されたデジタルのR、G、B信号をメモリ112に出力する。
撮影画像をモニタ32に出力する場合は、画像入力制御部132からメモリ112に出力された画像信号より画像信号処理部134で輝度/色差信号が生成され、その信号がビデオエンコーダ152に送られる。ビデオエンコーダ152は、入力された輝度/色差信号を表示用の信号形式(たとえばNTSC方式のカラー複合映像信号)に変換し、モニタ32に出力する。これにより、撮像素子124で撮像された画像がモニタ32に表示される。
撮像素子124から画像信号を定期的に取り込み、その画像信号から生成される輝度/色差信号によってVRAM114内の画像データを定期的に書き換え、モニタ32に出力することにより、撮像素子124で撮像される画像がリアルタイムに表示される。ユーザは、このモニタ32にリアルタイムに表示される画像(スルー画像)を見ることにより、撮影画角を確認することができる。
スルー画像の表示と同時に、既知顔分類部158は、既知顔の分類を行う。既知顔分類部158が既知顔の分類を行う処理の流れについて、図4(ステップS10〜S18)を用いて説明する。
既知顔分類部158は、顔認識辞書に登録されている顔の特徴ベクトル及び出現頻度を顔認識辞書記憶部156から取得する(ステップS10)。
CPU110は、メモリ112から画像信号を取得し(ステップS11)、顔検出部154に出力する。顔検出部154は、この画像信号に基づいて、画像に含まれる顔領域を検出する(ステップS12)。ステップS12で検出された結果は、既知顔分類部158に入力される。
既知顔分類部158は、顔検出部154において顔領域が検出されたか、すなわち画像に顔が含まれるかどうかを判断する(ステップS13)。画像に顔が含まれていない場合には(ステップS13でNO)には、処理を終了する。
画像に顔が含まれている場合には(ステップS13でYES)には、既知顔分類部158は、入力顔の特徴抽出、すなわち入力顔の特徴ベクトルJ0の算出を行う(ステップS14)。
既知顔分類部158は、入力顔の特徴ベクトルJ0と、ステップS10で取得した特徴ベクトルJi(i=1…N、Nは顔認識辞書に登録された顔の数)との類似度Xiを算出する(ステップS15)。
顔認識辞書記憶部156には、N個の顔が登録されているため、N個の顔それぞれに対して類似度Xiが算出される。そして、既知顔分類部158は、N個の類似度Xiのうちの最も高い類似度Xk(1≦K≦N)を求める(ステップS16)。これにより、入力顔の候補として、K番目の顔が求められる。
次に、ステップS16で算出された類似度Xkに応じて顔認識辞書の修正を行う(ステップS17)。図5は、顔認識辞書の修正処理(ステップS17)の一連の処理の流れを示すフローチャートである。
既知顔分類部158は、ステップS16で算出された類似度Xkが閾値A(0から1の間の値、例えば0.9)より大きいかどうかを判断する(ステップS171)。類似度Xkが閾値Aより大きい場合(ステップS171でYES)には、既知顔分類部158は、顔検出部154で検出された顔はK番目の顔と判断し、顔認識辞書に登録されたK番目の顔の特徴ベクトルJkと出現頻度とを修正する(ステップS172)。このように、類似度を用いることにより、入力顔の候補としてあげられたK番目の顔が入力顔であるかどうかを精度よく、確実に判断することができる。したがって、入力顔が顔認識辞書に登録されていない場合に、入力顔が顔認識辞書に登録されていると間違って判別することを防止することができる。
図6は、K番目の顔の特徴ベクトルJkと出現頻度とを修正する処理(ステップS172)の一連の処理の流れを示すフローチャートである。まず、顔認識辞書修正部160は、入力顔の特徴ベクトルJ0と、顔認識辞書に登録されたK番目の顔の特徴ベクトルJkとの重み付け平均を、修正後の顔認識辞書の特徴ベクトルJkとして算出する(ステップS1721,S1722)。すなわち、顔認識辞書修正部160は、数式5を用いて重み付け係数を算出し(ステップS1721)、数式6を用いて重み付け平均を算出する(ステップS1722)。
Figure 2009252069
Figure 2009252069
このように、入力顔の特徴ベクトルJ0と顔認識辞書に登録された特徴ベクトルJkとの重み付け平均値を求めることにより、顔認識辞書に登録された特徴ベクトルJkを本来あるべき値に収束させることができる。したがって、使用回数が増えると共に、自動的に顔認識の精度を上げることができる。
次に、顔認識辞書修正部160は、数式7に示すように、顔認識辞書に登録された出現頻度に1を加えたものを、修正後の顔認識辞書の出現頻度として算出する(ステップS1723)。
〔数7〕
出現頻度(修正後)=出現頻度(修正前)+1
そして、顔認識辞書修正部160は、ステップS1722、S1723で算出された結果を、それぞれK番目の顔の修正後の特徴ベクトルJk、出現頻度として顔認識辞書記憶部156に記憶された顔認識辞書に再登録(上書き)する。これにより、顔認識辞書に登録されたK番目の顔の特徴ベクトルJk及び出現頻度を修正する処理(ステップS172)が終了する。
類似度Xkが閾値Aより大きくない場合(ステップS171でNO)には、既知顔分類部158は、顔検出部154で検出された顔は顔認識辞書に登録されていない新たな顔であると判断し、顔認識辞書に顔を新規登録する(ステップS173)。
図7は、顔認識辞書に顔を新規登録する処理(ステップS173)の一連の処理の流れを示すフローチャートである。現在、顔認識辞書には、N個の特徴ベクトル及び出現頻度が登録されているため、入力顔の特徴ベクトルJ0をN+1番目の顔の特徴ベクトルとして顔認識辞書に登録し(ステップS1731)、N+1番目の顔の出現頻度を1として顔認識辞書に登録し(ステップS1732)、顔認識辞書の登録数をNからN+1に修正する(ステップS1733)。このように、顔認識辞書に新しい顔が追加されることにより、ユーザが登録操作などを行う必要がないため、ユーザの負担が軽く、便利である。
以上により、顔認識辞書の修正処理(ステップS17)が終了すると、既知顔分類部158は、顔検出部154で検出された顔を既知顔と未知顔(特定人物以外の顔)とに分類する(ステップS18)。図8は、既知顔と未知顔との分類処理(ステップS18)の一連の処理の流れを示すフローチャートである。
既知顔分類部158は、ステップS16で算出された類似度Xkが閾値A(0から1の間の値、例えば0.9)より大きいかどうかを判断する(ステップS181)。類似度Xkが閾値Aより大きい場合(ステップS181でYES)には、ステップS1723又はステップS1732で算出された出現頻度が所定の閾値Bより大きいかどうかを判断する(ステップS182)。
出現頻度が所定の閾値Bより大きい場合(ステップS182でYES)には、入力顔は既知顔とし(ステップS183)、出現頻度が所定の閾値Bより大きくない場合(ステップS182でNO)には、入力顔は未知顔とする(ステップS184)。
これにより、顔検出部154で検出された顔を既知顔と未知顔とに分類する処理(ステップS18)を終了する。このように、出現頻度を用いて既知顔と未知顔とに分類することで、顔認識辞書に登録された顔全てを既知顔とすることなく、既知顔と未知顔とを分類することができる。
既知顔分類部158が既知顔の分類を行う処理(ステップS10〜S18)が終了したら、顔検出部154で検出された顔領域を示す枠をスルー画に重ねて表示する。この時、ステップS18での分類結果に基づき、既知顔と未知顔とを区別して表示する(ステップS19)。例えば、図9に示すように、ステップS18において既知顔と分類された顔の顔領域には、色1(例えば赤色)の枠を画像に重ねて表示する。また、ステップS18においてと分類された顔の顔領域には、色2(例えば緑色)の枠を画像に重ねて表示する。
これにより、ユーザは既知顔が自動的に検出されたことを確認することができる。また、ステップS17において顔認識辞書の修正、追加をするため、ユーザが既知顔を撮影する回数が増えることで、枠の色が緑から赤に変化する。これにより、ユーザは、デジタルカメラ1が自動的に学習しているということを認識することができる。
撮影はシャッターボタン26の押下によって行なわれる。シャッターボタン26が半押しされると、S1ON信号がCPU110に入力され、CPU110は、以下のようにしてAE/AF処理及びAWB処理を実施する(ステップS20)。
まず、画像入力制御部132を介して撮像素子124から取り込まれた画像信号がAF検出部140並びにAE/AWB検出部142に入力される。
ステップS18で既知顔に分類された顔が撮像素子124から取り込まれた画像信号に含まれる場合には、CPU110は既知顔の領域に対してAE/AF処理を実施する。
また、ステップS18で既知顔に分類された顔が撮像素子124から取り込まれた画像信号に含まれない場合において、画像信号に未知顔が含まれる場合には、CPU110は未知顔の領域(複数の未知顔が含まれる場合には画角中央付近にある最も大きさの大きい未知顔の領域)に対してAE/AF処理を実施する。
なお、画像信号に未知顔が含まれない場合には、CPU110は画角中央近辺の任意の領域に対してAE/AF処理を実施する。
CPU110は、AF検出部140で算出された積算値のデータに基づいて、レンズ駆動部146を制御してレンズ14を含む撮影光学系のフォーカスレンズ群を移動させながら、複数のAF検出ポイントで焦点評価値(AF評価値)を演算し、評価値が極大となるレンズ位置を合焦位置として決定する。そして、求めた合焦位置にフォーカスレンズ群が移動するように、レンズ駆動部146を制御する。
CPU110は、AE/AWB検出部142から得た積算値に基づいて被写体の明るさ(被写体輝度)を検出し、撮影に適した露出値(撮影EV値)を算出する。そして、求めた撮影EV値と所定のプログラム線図から絞り値とシャッタースピードを決定し、これに従い撮像素子124の電子シャッターと絞り駆動部144を制御して適正な露光量を得る。同時に、検出された被写体輝度より、ストロボの発光が必要かどうかを判断する。
また、AE/AWB検出部142は、自動ホワイトバランス調整時、分割エリアごとにR、G、B信号の色別の平均積算値を算出し、その算出結果をCPU110に提供する。すなわち、AE/AWB検出部142は、ステップS18で既知顔に分類された顔が撮像素子124から取り込まれた画像信号に含まれる場合には、CPU110は既知顔の領域に対して自動ホワイトバランス調整を実施する。
また、ステップS18で既知顔に分類された顔が撮像素子124から取り込まれた画像信号に含まれない場合において、画像信号に未知顔が含まれる場合には、AE/AWB検出部142は未知顔の領域(複数の未知顔が含まれる場合には画角中央付近にある最も大きさの大きい未知顔の領域)に対して自動ホワイトバランス調整を実施する。
なお、画像信号に未知顔が含まれない場合には、AE/AWB検出部142は画角中央近辺の任意の領域に対して自動ホワイトバランス調整を実施する。
CPU110は、得られたRの積算値、Bの積算値、Gの積算値から分割エリアごとにR/G及びB/Gの比を求め、求めたR/G、B/Gの値のR/G、B/Gの色空間における分布等に基づいて光源種判別を行う。そして、判別された光源種に適したホワイトバランス調整値に従って、たとえば、各比の値がおよそ1(つまり、1画面においてRGBの積算比率がR:G:B≒1:1:1)になるように、ホワイトバランス調整回路のR、G、B信号に対するゲイン値(ホワイトバランス補正値)を制御し、各色チャンネルの信号に補正をかける。
以上のように、シャッターボタン26の半押しによって、AE/AF処理及びAWB処理が行なわれる。この間、ユーザは、必要に応じてズームボタン38を操作し、レンズ14をズーミングさせて画角を調整し、CPU110は、AE/AF処理及びAWB処理を継続して行う。
この後、シャッターボタン26が全押しされると、CPU110にS2ON信号が入力され、CPU110は、撮影、記録処理を開始する。すなわち、測光結果に基づき決定されたシャッター速度、絞り値で撮像素子124を露光する。
この際、ストロボ16を発光させる場合は、ストロボ制御部148を介してストロボ16を発光させる。ストロボ制御部148は、ストロボ調光センサ24での受光量が所定量に達すると、ストロボ16への通電を遮断し、ストロボ16の発光を停止させる。
撮像素子124から出力された画像信号は、アナログ処理部128、A/D変換器130、画像入力制御部132を介してメモリ112に取り込まれ、画像信号処理部134において輝度/色差信号に変換されたのち、メモリ112に格納される。
メモリ112に格納された画像データは、圧縮伸張処理部136に加えられ、所定の圧縮フォーマット(たとえばJPEG形式)に従って圧縮された後、メモリ112に格納され、所定の画像記録フォーマット(たとえばExif形式)の画像ファイルとされたのち、メディア制御部150を介して記憶メディア35に記録される。
本実施の形態によれば、入力顔が顔認識辞書に登録された顔であると判断された場合に、顔認識辞書に登録された顔全てを検出すべき人物と見なすことなく、その顔の出現頻度に基づいて既知顔と未知顔とに分類するため、既知顔と未知顔とを精度よく分類することができる。
また、本実施の形態によれば、入力顔が顔認識辞書に登録されていない顔であると判断された場合に、入力顔が顔認識辞書に追加されるので、ユーザが登録操作などを行う必要がないため、ユーザの負担が軽く、便利な撮像装置を提供することができる。
さらに、本実施の形態によれば、入力顔が顔認識辞書に登録された顔であると判断された場合に、顔認識辞書に登録された特徴ベクトルJiを入力顔の特徴ベクトルJ0を用いて修正することにより、使用回数が増えるのに伴い、特徴ベクトルJiを本来あるべき値に収束させ、顔認識の精度を上げることができる。
また、検出された既知顔に対してAE、AF、AWB処理等を行うことにより、既知顔が適切に合焦、露出された被写体像を撮像することができる。
なお、本実施の形態では、既知顔/未知顔の分類処理(ステップS18)として出現頻度が所定の閾値Bより大きい場合を既知顔とした(図8参照)が、既知顔/未知顔の分類処理(ステップS18)の変形例として、図10に示すような分類処理を行なってもよい。
既知顔分類部158は、ステップS16で算出された類似度Xkが閾値A(0から1の間の値、例えば0.9)より大きいかどうかを判断する(ステップS181)。類似度Xkが閾値Aより大きい場合(ステップS181でYES)には、ステップS1723又はステップS1732で算出された出現頻度が、顔認識辞書に登録されたN個の顔の出現頻度のうちの上位C番(例えば20番)以内であるかどうかを判断する(ステップS185)。顔認識辞書は、特徴ベクトルJiと出現頻度とがカテゴリー分類されており、出現頻度が上位C番以内の顔はカテゴリー1に分類されており、それ以外の顔はカテゴリー2に分類されている。
出現頻度が所定の閾値Bより大きい、すなわち入力顔がカテゴリー1に分類されている場合(ステップS185でYES)には、入力顔は既知顔とし(ステップS183)、出現頻度が所定の閾値Bより大きくない、すなわち入力顔がカテゴリー2に分類されている場合(ステップS182でNO)には、入力顔は未知顔とする(ステップS184)。
それと共に、顔認識辞書修正部160は、顔認識辞書の出現頻度の修正と共にカテゴリー分類をしなおす。これにより、常に精度の高い既知顔/未知顔の分類をすることができる。
このように、顔認識辞書に登録されたN個の顔の出現頻度のうちの上位C番以内の場合のみ既知顔とすることにより、使い始めなど顔認識辞書に多数の顔が登録されていない場合においても、既知顔と未知顔とを区別することができる。
なお、上位C番以内の一例として20番としたのは、顔の向き、照明の色などが原因で同一人物の顔が複数登録される可能性を考慮したためである。
更に、既知顔/未知顔の分類処理(ステップS18)の変形例として、図8に示す方法と図10に示す方法とを組み合わせて使用するようにしても良い。例えば、顔認識辞書に登録されている顔の数Nが所定の閾値より少ない場合には、図10に示すような処理を使用し、顔認識辞書に登録されている顔の数Nが所定の閾値以上となった場合には、図8に示すような処理を使用しても良い。
また、本実施の形態では、顔認識辞書の修正処理(ステップS17)、既知顔/未知顔の分類処理(ステップS18)において、ステップS16で算出された類似度Xkが閾値A(0から1の間の値、例えば0.9)より大きいかどうかを判断した。この閾値Aは、例えば0.9として予め設定しておいてもよいし、類似度Xkの値(例えば、Xkの平均値)に応じて0から1の間の値で変化させてもよい。閾値B(ステップS182で使用)についても、閾値Aと同様に、予め設定された値を用いてもよいし、出現頻度等に応じて変化させてもよい。
なお、本発明の適用は、デジタルカメラに限定されるものではなく、カメラつき携帯電話機やビデオカメラ等の撮像装置や、撮像装置で撮像された画像の処理をおこなうPCなどの画像処理装置にも同様に適用することができる。また、PCなどの装置に適用するプログラムとして提供することもできる。
本発明が適用されたデジタルカメラ1の外観構成を示す正面斜視図である。 上記デジタルカメラ1の外観構成を示す背面斜視図である。 上記デジタルカメラ1の電気的構成を示すブロック図である。 上記デジタルカメラ1の処理の流れを示すフローチャートである。 顔認識辞書の修正処理(ステップS17)の処理の流れを示すフローチャートである。 顔認識辞書の修正処理(ステップS17)の処理の流れを示すフローチャートである。 顔認識辞書の修正処理(ステップS17)の処理の流れを示すフローチャートである。 既知顔/未知顔の分類処理(ステップS18)の処理の流れを示すフローチャートである。 既知顔/未知顔を分類して表示する表示例である。 既知顔/未知顔の分類処理(ステップS18)の処理の流れを示すフローチャートである。
符号の説明
1:デジタルカメラ、12:カメラボディ、14:レンズ、16:ストロボ、18:ファインダ窓、32:モニタ、35:記憶メディア、110:CPU、112:メモリ、114:VRAM、116:ROM、118:EEPROM、120:操作部、122:タイミングジェネレータ(TG)、124:撮像素子、128:アナログ処理部(CDS/AMP)、130:A/D変換器、132:画像入力制御部、134:画像信号処理部、136:圧縮伸張処理部、140:AF検出部、142:AE/AWB検出部、144:絞り駆動部、146:レンズ駆動部、148:ストロボ制御部、150:メディア制御部、152:ビデオエンコーダ、154:顔検出部、156:顔認識辞書記憶部、158:既知顔分類部、160:顔認識辞書修正部

Claims (13)

  1. 同一人物か否かを判別するための顔の特徴が人物ごとに登録される顔認識辞書と、
    人物を含む画像を取得する画像取得手段と、
    前記画像取得手段により取得された画像から顔領域を検出する顔領域検出手段と、
    前記顔領域検出手段により検出された顔領域に基づいて、当該顔領域の顔の特徴を抽出する特徴抽出手段と、
    前記特徴抽出手段により抽出された顔の特徴と、前記顔認識辞書に登録された顔の特徴とに基づいて、同一人物の顔の特徴が前記顔認識辞書に登録されているか否かを判別する判別手段と、
    前記判別手段によって同一人物の顔の特徴が前記顔認識辞書に登録されていると判別されると、前記抽出された顔の特徴に基づいて前記登録されている顔の特徴を修正し、前記判別手段によって同一人物の顔の特徴が前記顔認識辞書に登録されていないと判別されると、前記抽出された顔の特徴を新規の人物の顔の特徴として登録する顔認識辞書修正手段と、
    前記判別手段によって同一人物の顔の特徴が前記顔認識辞書に登録されていると判別されると、前記画像取得手段により取得された画像中の人物の顔を既知顔として分類し、前記判別手段によって同一人物の顔の特徴が前記顔認識辞書に登録されていないと判別されると、前記画像取得手段により取得された画像中の人物の顔を未知顔として分類する分類手段と、
    を備えたことを特徴とする画像処理装置。
  2. 前記判別手段は、前記特徴抽出手段により抽出された顔の特徴と、前記顔認識辞書に登録された顔の特徴のうちの前記抽出された顔の特徴に最も類似する特徴との類似度を算出し、前記算出した類似度が所定の閾値を越えた場合に、前記特徴抽出手段により顔の特徴が抽出された顔と同一人物の顔の特徴が前記顔認識辞書に登録されていると判別することを特徴とする請求項1に記載の画像処理装置。
  3. 前記顔認識辞書に登録された人物ごとに、前記顔認識辞書に登録された人物の特徴の出現頻度を管理する出現頻度管理手段を備え、
    前記分類手段は、前記判別手段によって同一人物の顔の特徴が前記顔認識辞書に登録されていると判別され、かつ前記出現頻度管理手段に管理された出現頻度が所定の閾値以上の場合に、前記画像取得手段により取得された画像中の人物の顔を既知顔として分類し、前記判別手段によって同一人物の顔の特徴が前記顔認識辞書に登録されていないと判別された場合、又は前記出現頻度管理手段に管理された出現頻度が前記所定の閾値未満の場合に、前記画像取得手段により取得された画像中の人物の顔を未知顔として分類することを特徴とする請求項1又は2に記載の画像処理装置。
  4. 前記顔認識辞書に登録された人物ごとに、前記顔認識辞書に登録された人物の特徴の出現頻度を管理する出現頻度管理手段を備え、
    前記分類手段は、前記判別手段によって同一人物の顔の特徴が前記顔認識辞書に登録されていると判別され、かつ前記出現頻度管理手段に管理された出現頻度が上位の所定順位以内の場合に、前記画像取得手段により取得された画像中の人物の顔を既知顔として分類し、前記判別手段によって同一人物の顔の特徴が前記顔認識辞書に登録されていないと判別された場合、又は前記出現頻度管理手段に管理された出現頻度が前記上位の所定順位以外の場合に、前記画像取得手段により取得された画像中の人物の顔を未知顔として分類することを特徴とすることを特徴とする請求項1又は2に記載の画像処理装置。
  5. 前記出現頻度管理手段は、前記判別手段によって同一人物の顔の特徴が前記顔認識辞書に登録されていると判別されると、前記同一人物の特徴の出現頻度に1を追加したものを該同一人物の特徴の新たな出現頻度とし、前記判別手段によって同一人物の顔の特徴が前記顔認識辞書に登録されていないと判別されると、前記新規の人物の顔の特徴の出現頻度を1とすることを特徴とする請求項3又は4のいずれかに記載の画像処理装置。
  6. 顔認識辞書修正手段は、前記判別手段によって同一人物の顔の特徴が前記顔認識辞書に登録されていると判別されると、前記顔認識辞書に登録された前記同一人物の顔の特徴に代えて、前記抽出手段により抽出された顔の特徴と、前記顔認識辞書に登録された前記同一人物の顔の特徴との重み付け平均値が前記同一人物の顔の特徴となるように、前記顔認識辞書を修正することを特徴とする請求項1から5のいずれかに記載の画像処理装置。
  7. 請求項1から6のいずれかに記載の画像処理装置と、
    被写体像を撮像する撮像手段と、
    前記撮像手段により撮像された被写体像を表示する表示手段と、
    前記表示手段に表示された被写体像に、前記顔領域検出手段により検出された顔領域を示す枠を重ねて表示する表示制御手段であって、前記既知顔と前記未知顔とを区別して表示する表示制御手段と、
    を備えたことを特徴とする撮像装置。
  8. 前記表示制御手段は、前記分類手段において前記画像取得手段により取得された画像中の人物の顔が既知顔として分類された場合には所定色の枠を表示し、前記分類手段において前記画像取得手段により取得された画像中の人物の顔が未知顔として分類された場合には前記所定色と異なる色の枠を表示することを特徴とする請求項7に記載の撮像装置。
  9. 前記分類手段により分類された既知顔に対して、自動露出制御、自動合焦制御及び自動ホワイトバランス制御のうちの少なくとも1つを行う制御手段を備えたことを特徴とする請求項7又は8に記載の撮像装置。
  10. 人物を含む画像を取得するステップと、
    前記取得された画像から顔領域を検出するステップと、
    前記検出された顔領域に基づいて、当該顔領域の顔の特徴を抽出するステップと、
    前記抽出された顔の特徴と、同一人物か否かを判別するための顔の特徴が人物ごとに登録される顔認識辞書に登録された顔の特徴とに基づいて、同一人物の顔の特徴が前記顔認識辞書に登録されているか否かを判別するステップと、
    前記同一人物の顔の特徴が前記顔認識辞書に登録されているか否かを判別するステップにおいて前記同一人物の顔の特徴が前記顔認識辞書に登録されていると判別されると、前記抽出された顔の特徴に基づいて前記登録されている顔の特徴を修正するステップと、
    前記同一人物の顔の特徴が前記顔認識辞書に登録されているか否かを判別するステップにおいて前記同一人物の顔の特徴が前記顔認識辞書に登録されていないと判別されると、前記抽出された顔の特徴を新規の人物の顔の特徴として登録するステップと、
    を含むことを特徴とする画像処理方法。
  11. 前記顔認識辞書に登録された人物ごとに、前記顔認識辞書に登録された人物の特徴の出現頻度を算出するステップと、
    前記同一人物の顔の特徴が前記顔認識辞書に登録されているか否かを判別するステップにおいて前記同一人物の顔の特徴が前記顔認識辞書に登録されていると判別され、かつ前記顔認識辞書に登録された人物の特徴の出現頻度を算出するステップにおいて算出された出現頻度が所定の閾値以上の場合に、前記取得された画像中の人物の顔を既知顔として分類するステップと、
    前記同一人物の顔の特徴が前記顔認識辞書に登録されているか否かを判別するステップにおいて前記判別手段によって同一人物の顔の特徴が前記顔認識辞書に登録されていないと判別された場合、又は前記顔認識辞書に登録された人物の特徴の出現頻度を算出するステップにおいて算出された出現頻度が前記所定の閾値未満の場合に、前記取得された画像中の人物の顔を未知顔として分類するステップと、
    を含むことを特徴とする請求項10に記載の画像処理方法。
  12. 前記顔認識辞書に登録された人物ごとに、前記顔認識辞書に登録された人物の特徴の出現頻度を算出するステップと、
    前記同一人物の顔の特徴が前記顔認識辞書に登録されているか否かを判別するステップにおいて前記同一人物の顔の特徴が前記顔認識辞書に登録されていると判別され、かつ前記顔認識辞書に登録された人物の特徴の出現頻度を算出するステップにおいて算出された出現頻度が上位の所定順位以内の場合に、前記取得された画像中の人物の顔を既知顔として分類するステップと、
    前記同一人物の顔の特徴が前記顔認識辞書に登録されているか否かを判別するステップにおいて前記判別手段によって同一人物の顔の特徴が前記顔認識辞書に登録されていないと判別された場合、又は前記顔認識辞書に登録された人物の特徴の出現頻度を算出するステップにおいて算出された出現頻度が前記上位の所定順位以外の場合に、前記取得された画像中の人物の顔を未知顔として分類するステップと、
    を含むことを特徴とする請求項10に記載の画像処理方法。
  13. 請求項10から12のいずれかに記載の画像処理方法を演算装置に実行させるためのプログラム。
JP2008101150A 2008-04-09 2008-04-09 画像処理装置、撮像装置、画像処理方法及びプログラム Expired - Fee Related JP5044472B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008101150A JP5044472B2 (ja) 2008-04-09 2008-04-09 画像処理装置、撮像装置、画像処理方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008101150A JP5044472B2 (ja) 2008-04-09 2008-04-09 画像処理装置、撮像装置、画像処理方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2009252069A true JP2009252069A (ja) 2009-10-29
JP5044472B2 JP5044472B2 (ja) 2012-10-10

Family

ID=41312695

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008101150A Expired - Fee Related JP5044472B2 (ja) 2008-04-09 2008-04-09 画像処理装置、撮像装置、画像処理方法及びプログラム

Country Status (1)

Country Link
JP (1) JP5044472B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8595233B2 (en) 2009-04-27 2013-11-26 Panasonic Corporation Data processing apparatus, data processing method, program, and integrated circuit
JP2014010752A (ja) * 2012-07-02 2014-01-20 Glory Ltd 帳票登録支援方法及び装置並びにプログラム
JP2015028778A (ja) * 2014-07-06 2015-02-12 洋彰 宮崎 自律学習型パターン認識機
WO2022270000A1 (ja) * 2021-06-25 2022-12-29 ソニーグループ株式会社 制御装置、制御方法、およびプログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11175718A (ja) * 1997-12-12 1999-07-02 Toshiba Corp 人物認識装置及びその方法
JP2004062868A (ja) * 2002-07-10 2004-02-26 Hewlett-Packard Development Co Lp 画像内の人物を識別するデジタル・カメラ及び方法
JP2007087253A (ja) * 2005-09-26 2007-04-05 Fujifilm Corp 画像補正方法および装置
JP2007279601A (ja) * 2006-04-11 2007-10-25 Nikon Corp カメラ

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11175718A (ja) * 1997-12-12 1999-07-02 Toshiba Corp 人物認識装置及びその方法
JP2004062868A (ja) * 2002-07-10 2004-02-26 Hewlett-Packard Development Co Lp 画像内の人物を識別するデジタル・カメラ及び方法
JP2007087253A (ja) * 2005-09-26 2007-04-05 Fujifilm Corp 画像補正方法および装置
JP2007279601A (ja) * 2006-04-11 2007-10-25 Nikon Corp カメラ

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8595233B2 (en) 2009-04-27 2013-11-26 Panasonic Corporation Data processing apparatus, data processing method, program, and integrated circuit
JP2014010752A (ja) * 2012-07-02 2014-01-20 Glory Ltd 帳票登録支援方法及び装置並びにプログラム
JP2015028778A (ja) * 2014-07-06 2015-02-12 洋彰 宮崎 自律学習型パターン認識機
WO2022270000A1 (ja) * 2021-06-25 2022-12-29 ソニーグループ株式会社 制御装置、制御方法、およびプログラム

Also Published As

Publication number Publication date
JP5044472B2 (ja) 2012-10-10

Similar Documents

Publication Publication Date Title
US8462228B2 (en) Image processing method, apparatus and computer program product, and imaging apparatus, method and computer program product
KR101142316B1 (ko) 화상 선택 장치 및 화상 선택 방법
US8395694B2 (en) Apparatus and method for blurring image background in digital image processing device
US7791668B2 (en) Digital camera
US8570422B2 (en) Apparatus, method, and recording medium containing program for photographing
JP4254873B2 (ja) 画像処理装置及び画像処理方法、撮像装置、並びにコンピュータ・プログラム
US8786760B2 (en) Digital photographing apparatus and method using face recognition function
KR100944908B1 (ko) 촬상장치, 포커스 제어방법 및 포커스 제어프로그램을기록한 기록매체
KR101155406B1 (ko) 화상 처리 장치, 화상 처리 방법 및 컴퓨터 기억 매체
JP4819001B2 (ja) 撮影装置および方法並びにプログラム、画像処理装置および方法並びにプログラム
JP4668956B2 (ja) 画像処理装置および方法並びにプログラム
US20090002509A1 (en) Digital camera and method of controlling same
JP2011010275A (ja) 画像再生装置及び撮像装置
JP4974812B2 (ja) 電子カメラ
US9055212B2 (en) Imaging system, image processing method, and image processing program recording medium using framing information to capture image actually intended by user
JP5180349B2 (ja) 撮影装置および方法並びにプログラム
JP2008109344A (ja) 特定被写体像の検出方法およびデジタルカメラ
JP4818999B2 (ja) 撮影装置および方法並びにプログラム
JP5027580B2 (ja) 撮影装置および方法並びにプログラム
JP5044472B2 (ja) 画像処理装置、撮像装置、画像処理方法及びプログラム
KR101613617B1 (ko) 디지털 영상 촬영 장치 및 그 제어 방법
JP2010141609A (ja) 撮像装置
JP5160655B2 (ja) 画像処理装置および方法並びにプログラム
JP2007208355A (ja) 撮影装置および方法並びにプログラム
JP2008028956A (ja) 撮像装置、および、撮像装置における対象物検出用画像信号の生成方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110204

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120305

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120307

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120501

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120703

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120713

R150 Certificate of patent or registration of utility model

Ref document number: 5044472

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150720

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees