JP2012099943A - 画像処理装置、画像処理方法及びプログラム - Google Patents
画像処理装置、画像処理方法及びプログラム Download PDFInfo
- Publication number
- JP2012099943A JP2012099943A JP2010244310A JP2010244310A JP2012099943A JP 2012099943 A JP2012099943 A JP 2012099943A JP 2010244310 A JP2010244310 A JP 2010244310A JP 2010244310 A JP2010244310 A JP 2010244310A JP 2012099943 A JP2012099943 A JP 2012099943A
- Authority
- JP
- Japan
- Prior art keywords
- face
- image processing
- image data
- determined
- image quality
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Studio Devices (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Focusing (AREA)
- Automatic Focus Adjustment (AREA)
Abstract
【課題】登録済みの顔、及び当該顔の人物と関連のある人物の未登録の顔に対して、高画質化処理を行うことができるようにする。
【解決手段】登録済み顔認識データ記録部402には顔画像データが記憶されており、顔認識部402は、顔検出部401により検出された顔が登録済み顔認識データ記録部402に記憶されている顔画像データの顔と同一であるか否かを判定する。そして、顔画像データの顔と同一であると判定された顔と同一でないと判定された顔とが映像信号に含まれている場合に、高画質化対象顔設定部404は、前記同一であると判定された顔、及び前記同一でないと判定された顔を高画質化対象顔の設定し、高画質化対象顔情報を出力する。
【選択図】図4
【解決手段】登録済み顔認識データ記録部402には顔画像データが記憶されており、顔認識部402は、顔検出部401により検出された顔が登録済み顔認識データ記録部402に記憶されている顔画像データの顔と同一であるか否かを判定する。そして、顔画像データの顔と同一であると判定された顔と同一でないと判定された顔とが映像信号に含まれている場合に、高画質化対象顔設定部404は、前記同一であると判定された顔、及び前記同一でないと判定された顔を高画質化対象顔の設定し、高画質化対象顔情報を出力する。
【選択図】図4
Description
本発明は、顔検出及び顔認識を行うために用いて好適な画像処理装置、画像処理方法及びプログラムに関する。
近年、顔検出機能や顔認識機能を搭載したデジタルビデオカメラやデジタルカメラ等の撮像装置が数多く製品化されている。これらの撮像装置の中には、顔検出機能により検出した顔に対して、自動的にフォーカスを合わせたり、検出した顔を高画質に処理したりすることができるものがある。
さらに、顔認識機能により、例えば、撮像装置内部の記憶媒体(データベース)に予め登録しておいた顔画像や顔の特徴量といった顔認識用データを用いて、顔検出機能により検出した顔が、登録済みの顔と一致するかどうかを判断できるものもある。そして、このような機能により、顔認識の結果として、登録人物の名前を表示したり、登録人物だけに特殊な処理を実行したりする。例えば、撮像画像に対してある登録人物に限定した高画質化処理を行って記録することも可能である。
このように撮像装置で撮影された画像の顔認識を行い、登録済みの顔に対し高画質化処理する技術として、圧縮符号化する際に顔認識した顔に対して多くの符号量を与え、高画質に圧縮符号化を行う技術が開示されている(例えば、特許文献1参照)。
前述したように、顔認識機能を搭載した撮像装置を用いて撮影を行うことにより、顔認識用データベースに予め登録されている顔と一致した顔に対し、高画質化処理して記録することができる。しかしながら、このような撮像装置を用いて撮影する場合において、顔認識用データベースに予め登録されていない顔に対しては高画質化処理して記録できない。例えば、顔が登録されている人物と一緒に知人が撮影され、知人の顔が顔認識用データベースに登録されていないような場合は、知人の顔に対しては高画質化処理して記録することができない。このような場合、符号化後の画像においてそれぞれの顔に対して画質に差が生じ、視覚的に違和感が生じてしまう。
本発明は前述の問題点に鑑み、登録済みの顔とともに撮影された未登録の顔に対して、高画質化処理を行うことができるようにすることを目的としている。
本発明に係る画像処理装置は、顔画像データを記憶する記憶手段と、映像信号から顔を検出する顔検出手段と、前記顔検出手段により検出された顔が前記記憶手段に記憶されている顔画像データに含まれているか否かを判定する顔認識手段と、前記顔認識手段により前記記憶手段に記憶されている顔画像データに含まれていると判定された顔と含まれていないと判定された顔とが前記映像信号から検出された場合に、前記顔画像データに含まれていると判定された顔、及び前記顔画像データに含まれていないと判定された顔の領域を、他の領域よりも高画質化した画像処理を行う画像処理手段とを備える。
本発明によれば、顔認識用のデータベースに予め登録されている顔だけではなく、登録済みの顔と一緒に撮影されている知人などの未登録の顔に対しても高画質化処理を行うことができる。
(第1の実施形態)
以下、図面を参照しながら本発明の好適な実施形態について説明する。
図1は、本実施形態における撮像装置100の機能構成例を示すブロック図である。
本実施形態における撮像装置100は、顔認識データベースに登録された顔が認識された場合に、登録済みの顔及び一緒に撮影されている未登録の顔に対し高画質化処理を行う。以下、本実施形態の構成例について図1を参照しながら説明する。
以下、図面を参照しながら本発明の好適な実施形態について説明する。
図1は、本実施形態における撮像装置100の機能構成例を示すブロック図である。
本実施形態における撮像装置100は、顔認識データベースに登録された顔が認識された場合に、登録済みの顔及び一緒に撮影されている未登録の顔に対し高画質化処理を行う。以下、本実施形態の構成例について図1を参照しながら説明する。
図1において、本実施形態における撮像装置100は、カメラ部101、符号化部102、符号化ストリーム記録部103、及び高画質化対象顔判定部104を備えている。
カメラ部101は、被写体光を撮像し、映像信号を出力する。符号化部102は、カメラ部101から出力された映像信号を圧縮符号化し、符号化ストリームを出力する。符号化ストリーム記録部103は、符号化部102から出力された符号化ストリームを記録する。高画質化対象顔判定部104は、カメラ部101から出力された映像信号に含まれる顔を認識し、高画質化処理の対象となる顔(以下、高画質化処理対象顔)を判定する。そして、高画質化対象と判定された顔に関しての中心座標及び大きさを表す高画質化対象顔情報をカメラ部101及び符号化部102に出力する。なお、高画質化対象顔情報の詳細については後述する。カメラ部101及び符号化部102は、高画質化対象顔情報に応じてそれぞれ高画質化対象顔に対して高画質化処理を行う。
次に、カメラ部101、符号化部102、及び高画質化対象顔判定部104について詳しく説明する。
(カメラ部101)
まず、カメラ部101の構成例について、図2を参照しながら詳しく説明する。
図2は、本実施形態におけるカメラ部101の詳細な構成例を示すブロック図である。
図2に示すように、カメラ部101は、レンズ201、撮像部202、A/D(アナログ−ディジタル)変換部203、カメラ信号処理部204、及びカメラ制御部205を備えている。
まず、カメラ部101の構成例について、図2を参照しながら詳しく説明する。
図2は、本実施形態におけるカメラ部101の詳細な構成例を示すブロック図である。
図2に示すように、カメラ部101は、レンズ201、撮像部202、A/D(アナログ−ディジタル)変換部203、カメラ信号処理部204、及びカメラ制御部205を備えている。
続いて、カメラ部101の動作について説明する。
レンズ201は、被写体光を撮像部202に導く。また、レンズ201は、後述のカメラ制御部205から出力される制御信号に従ってズーム動作や焦点整合動作などを行う。撮像部202は、CCDやCMOS等の撮像素子により被写体を撮像し、得られた被写体光を電気信号に変換してA/D変換部203に出力する。
レンズ201は、被写体光を撮像部202に導く。また、レンズ201は、後述のカメラ制御部205から出力される制御信号に従ってズーム動作や焦点整合動作などを行う。撮像部202は、CCDやCMOS等の撮像素子により被写体を撮像し、得られた被写体光を電気信号に変換してA/D変換部203に出力する。
A/D変換部203は、アナログ信号をディジタル信号に変換し、カメラ信号処理部204に出力する。カメラ信号処理部204は、A/D変換部203より出力されたディジタル信号に対して、ガンマ補正、露出調整、平滑化フィルタ処理による美肌処理、ホワイトバランス等の画像処理を行い、その映像信号を出力する。
カメラ制御部205は、高画質化対象顔判定部104から出力される高画質化対象顔情報に応じてカメラ部101全体を制御する。例えば、カメラ制御部205は、高画質化対象顔情報に記述されている顔の中心座標に対して焦点が整合するようにレンズ201を制御する。本実施形態では、カメラ制御部205は、高画質化対象顔情報に記述されている顔の中心座標及び大きさから算出される顔領域に対して美肌処理を行い、露出及びホワイトバランスが適正になるようにカメラ信号処理部204を制御する。このように、カメラ制御部205は、高画質化対象顔判定部104により高画質化対象顔と判定された顔に対して、高画質な映像信号となるように制御する。
(符号化部102)
次に、図3を参照しながら符号化部102の構成例について説明する。本実施形態では、符号化方式としてMPEG符号化方式を用いた例について説明するが符号化方式はこれに限ったものではなく、例えば、H.264符号化方式を用いてもよい。
図3は、本実施形態における符号化部102の詳細な構成例を示すブロック図である。
図3に示すように、符号化部102は、入力バッファ部301、減算器302、離散コサイン変換部303、量子化部304、可変長符号化部305、及び出力バッファ部306を備えている。さらに、逆量子化部307、逆離散コサイン変換部308、加算器309、フレームメモリ310、動き補償部311、動き検出部312、及び符号量制御部313を備えている。
次に、図3を参照しながら符号化部102の構成例について説明する。本実施形態では、符号化方式としてMPEG符号化方式を用いた例について説明するが符号化方式はこれに限ったものではなく、例えば、H.264符号化方式を用いてもよい。
図3は、本実施形態における符号化部102の詳細な構成例を示すブロック図である。
図3に示すように、符号化部102は、入力バッファ部301、減算器302、離散コサイン変換部303、量子化部304、可変長符号化部305、及び出力バッファ部306を備えている。さらに、逆量子化部307、逆離散コサイン変換部308、加算器309、フレームメモリ310、動き補償部311、動き検出部312、及び符号量制御部313を備えている。
続いて、符号化部102の動作について図3を参照しながら説明する。
入力バッファ部301は、入力された映像信号を格納する。減算器302は、フレーム内符号化処理の場合は、映像信号をそのまま出力し、フレーム間符号化処理の場合は、映像信号から予測画像データを減算し、画像残差データを出力する。なお、予測画像データを生成する手順については後述する。
入力バッファ部301は、入力された映像信号を格納する。減算器302は、フレーム内符号化処理の場合は、映像信号をそのまま出力し、フレーム間符号化処理の場合は、映像信号から予測画像データを減算し、画像残差データを出力する。なお、予測画像データを生成する手順については後述する。
離散コサイン変換部303は、減算器302から出力された画像残差データを直交変換して変換係数を出力する。そして、量子化部304は前記変換係数を量子化スケールに基づいて量子化する。ここで、この量子化スケールを変化させることによって量子化後の変換係数は大きく変化し、発生符号量及び画質が変化する。また、この量子化スケールは画面内の小領域(例えば、16画素×16画素のマクロブロック領域)毎に変化させることが可能である。
可変長符号化部305は、量子化部304で量子化された変換係数を入力し、この変換係数を可変長符号化して符号化ストリームとする。そして、符号化ストリームは、符号量を制御するために出力バッファ部306に一旦格納され、その後、符号化ストリーム記録部103に出力される。
符号量制御部313は、高画質化対象顔判定部104から出力される高画質化対象顔情報と出力バッファ部306から得られる符号量の情報とを用いて、高画質化対象顔情報に記述されている顔領域の量子化スケールを他領域よりも小さくするよう符号量を制御する。このように、符号量制御部313は、高画質化対象顔判定部104により高画質化対象顔と判定された顔に対して、高画質に符号化できるよう符号量を制御する。なお、登録済み顔及び未登録顔が高画質化対象顔として設定されている場合に、登録済み顔には未登録顔よりも多くの符号量を与え、登録済み顔を未登録顔よりもさらに高画質に符号化するようにしてもよい。
一方、量子化部304で量子化された変換係数は予測画像データを生成する際にも用いられる。逆量子化部307は、量子化部304で量子化された変換係数を逆量子化する。さらに、逆離散コサイン変換部308は、逆量子化部307で逆量子化された変換係数を逆離散コサイン変換し、復号画像残差データとして加算器309に出力する。加算器309は、復号画像残差データと予測画像データとを加算し、加算したデータは再構成画像データとしてフレームメモリ310に記録される。なお、再構成画像データのうち、以降の予測で参照される可能性があるデータは、フレームメモリ310にしばらくの間格納される。
動き補償部311は、フレームメモリ310に記録された再構成画像データを用いて動き検出部312によって検出された動きベクトル情報に基づいて動き補償を行い、予測画像データを生成する。動き検出部312は、映像信号における動きベクトルを検出し、検出した動きベクトル情報を動き補償部311及び可変長符号化部305へ出力する。
(高画質化対象顔判定部104)
次に、図4を参照しながら高画質化対象顔判定部104の構成例について説明する。
図4は、本実施形態における高画質化対象顔判定部104の詳細な構成例を示すブロック図である。
図4に示すように、高画質化対象顔判定部104は、顔検出部401、登録済み顔認識データ記録部402、顔認識部403、及び高画質化対象顔設定部404を備えている。
次に、図4を参照しながら高画質化対象顔判定部104の構成例について説明する。
図4は、本実施形態における高画質化対象顔判定部104の詳細な構成例を示すブロック図である。
図4に示すように、高画質化対象顔判定部104は、顔検出部401、登録済み顔認識データ記録部402、顔認識部403、及び高画質化対象顔設定部404を備えている。
続いて、高画質化対象顔判定部104の動作について図4を参照しながら説明する。
顔検出部401は、カメラ部101から出力された映像信号に含まれる被写体の顔をフレーム毎に検出し、顔を検出するたびにフレーム内における顔の中心座標及び大きさを表す情報を顔認識部403に出力する。登録済み顔認識データ記録部402は、顔認識部403において顔認識を行うために用いる顔画像データやその顔の人物名などの識別情報を記録する。例えば、ユーザーが高画質化したい顔を撮影し、その顔の人物の名前を設定すると、登録済み顔認識データ記録部402に顔画像データと識別情報である人物の名前とが記録される。
顔検出部401は、カメラ部101から出力された映像信号に含まれる被写体の顔をフレーム毎に検出し、顔を検出するたびにフレーム内における顔の中心座標及び大きさを表す情報を顔認識部403に出力する。登録済み顔認識データ記録部402は、顔認識部403において顔認識を行うために用いる顔画像データやその顔の人物名などの識別情報を記録する。例えば、ユーザーが高画質化したい顔を撮影し、その顔の人物の名前を設定すると、登録済み顔認識データ記録部402に顔画像データと識別情報である人物の名前とが記録される。
顔認識部403は、顔検出部401から出力された顔の中心座標、大きさを表す情報を基に、入力した映像信号における被写体の顔が、登録済み顔認識データ記録部402に記録されている顔と一致するか否かを判定する。そして、その判定結果と、判定した顔の中心座標及び大きさとを顔情報として高画質化対象顔設定部404に出力する。高画質化対象顔設定部404は、顔認識部403から出力された顔情報を基に、登録済み顔と、一緒に撮影されている未登録顔とを高画質化の対象とする顔と判定し、高画質化の対象と判定された顔のみの顔情報を高画質化対象顔情報として出力する。
なお、顔検出部401による顔検出の方法は、例えば、オブジェクト検出等の既知の方式を用いるものとし、詳細な説明は省略する。顔認識部403による顔認識の方法は、例えば、登録済み顔認識データ記録部402に記録されている顔画像データと映像信号に含まれる顔との相関性を評価する既知のオブジェクト認識を用いるものとし、詳細な説明は省略する。
次に、顔検出部401及び顔認識部403について図5及び図6を参照しながら説明する。
図5(a)は、フレーム番号「0」の映像信号を示した図であり、図5(b)は、登録済み顔認識データ記録部402に記録されている顔画像及び識別情報である人物の名前の一例を示す図である。また、図6は、顔認識部403からフレーム毎に出力される顔情報の一例を示す図であり、例として、フレーム番号「0」から得られた顔情報を示している。
図5(a)は、フレーム番号「0」の映像信号を示した図であり、図5(b)は、登録済み顔認識データ記録部402に記録されている顔画像及び識別情報である人物の名前の一例を示す図である。また、図6は、顔認識部403からフレーム毎に出力される顔情報の一例を示す図であり、例として、フレーム番号「0」から得られた顔情報を示している。
例えば、図5(a)に示すようなフレーム番号「0」の映像信号において、顔検出部401は、点線内の顔を検出し、顔を検出するたびに顔の中心座標及び大きさの情報を出力する。図5(a)に示す例では3つの顔が存在するため、3つの顔に対応する中心座標及び大きさの情報を出力する。すなわち、一番左側の顔については、中心座標(x,y)=(250,500)、大きさ(x_size,y_size)=(400,500)の情報を出力する。そして、中央の顔については、中心座標(x,y)=(960,500)、大きさ(x_size,y_size)=(400,500)の情報を出力する。さらに、一番右側の顔については、中心座標(x,y)=(1800,200)、大きさ(x_size,y_size)=(200,300)の情報を出力する。
次に、顔認識部403は、登録済み顔認識データ記録部402に記録されている顔画像データの顔と顔検出部401により検出された顔とが一致するか否かを判定する。図5の例では、図5(a)に示す中央の顔は、登録済み顔認識データ記録部402に記録されている図5(b)に示す「太郎」の顔と一致すると判定し、この顔を登録済み顔と判定する。また、図5(a)に示すその他の顔については、登録済み顔認識データ記録部402に記録されている図5(b)に示す顔と一致しないと判定し、未登録顔と判定する。そして、顔認識部403は、判定結果と、判定した顔の中心座標及び大きさとについて、図6に示すような顔情報として高画質化対象顔設定部404に出力する。
次に、高画質化対象顔設定部404の処理について図7を参照しながら説明する。
図7(a)及び図7(b)は、高画質化対象顔設定部404による高画質化対象顔の設定状況を被撮影状況と共に時系列的に示した図である。ここで、被撮影状況とは、登録済み顔又は未登録顔が撮影され、顔認識部403により顔認識されているか否かを示し、図7(a)及び図7(b)の斜線に示した期間が顔認識されている期間を示している。
図7(a)及び図7(b)は、高画質化対象顔設定部404による高画質化対象顔の設定状況を被撮影状況と共に時系列的に示した図である。ここで、被撮影状況とは、登録済み顔又は未登録顔が撮影され、顔認識部403により顔認識されているか否かを示し、図7(a)及び図7(b)の斜線に示した期間が顔認識されている期間を示している。
また、図7(a)及び図7(b)に示す例では、時刻t0に撮影及び映像の記録を開始して、時刻t5に撮影及び映像の記録を終了している。撮影期間中は、顔認識部403により、撮影されている顔が登録済み顔か未登録顔かが判定される。図7(a)及び図7(b)に示す例では、最上段に示す登録済み顔は、時刻t0から時刻t3の期間撮影されている。登録済み顔に関しては、撮影されている全ての期間(時刻t0からt3の期間)において、高画質化対象顔設定部404は高画質化対象顔として設定する。
図7(a)に示す例の場合、未登録顔(1)は、時刻t4からt5の期間撮影されており、未登録顔(2)は時刻t0からt4の期間撮影されている。高画質化対象顔設定部404は、登録済み顔と一緒に撮影されている未登録顔に関しては高画質化対象顔として設定する。つまり、映像信号の1フレーム内に登録済み顔と未登録済み顔とが混在する場合は、登録済み顔及び未登録顔を高画質化対象顔として設定する。図7(a)において、未登録顔(2)は時刻t0からt3の期間において、登録済み顔と一緒に撮影されているため、高画質化対象顔設定部404は、時刻t0からt3の期間、未登録顔(2)を高画質化対象顔として設定する。
一方、図7(a)において、時刻t4からt5の期間に撮影されている未登録顔(1)に関しては登録済み顔と一緒に撮影されていないため、高画質化対象顔設定部404は、高画質化対象顔として設定しない。
また、図7(b)に示す例では、未登録顔(3)は時刻t0からt4の期間撮影されており、未登録顔(4)は時刻t0からt5の期間撮影されている。そこで、図7(b)に示す未登録顔(3)のように、登録済み顔と未登録顔とが所定の期間以上検出(例えば時刻t0からt1の期間)されてから未登録顔を高画質化対象顔として設定してもよい。このように設定することにより、通行人など注目度の低い未登録顔を除外することができる。
また、未登録顔(4)のように、未登録顔が高画質化対象顔と一旦設定されると、登録済み顔が撮影されなくなった以降も高画質化対象顔として所定期間設定し続けるようにしてもよい。図7(b)に示す未登録顔(4)の例では、登録済み顔が撮影されていない時刻t3からt5の期間まで高画質化顔と設定している。このように過去に登録済み顔とともに撮影され、登録済み顔が撮影されなくなった直後にそれまで高画質化処理されていた未登録顔の画質が急に低下するといったことを防ぐことができる。
このように設定された高画質化対象顔に対し、前述のようにカメラ部101においては、フォーカス、美肌処理、ホワイトバランス、露出が適正になるように調整を行い、符号化部102においては、符号量を他の領域より多く与えることにより高画質化処理を行う。
以上のように、顔認識部403から出力される顔情報により、登録済み顔だけではなく、登録済み顔と一緒に撮影されている未登録顔も高画質化対象顔として設定することができる。これにより、例えば、登録済み顔の人物とともに撮影者の知人ではあるが登録済み顔認識データ記録部402に記録されていない顔の人物も高画質に記録することが可能となる。
なお、高画質化対象顔設定部404は、登録済み顔と一緒に撮影されている未登録顔のうち、顔の大きさが所定サイズよりも小さい未登録顔については、高画質化対象顔として設定しないようにしてもよい。また、高画質化対象顔設定部404は、登録済み顔と一緒に撮影されている未登録顔のうち、登録済み顔と所定の距離以上離れている未登録顔について、高画質化対象顔として設定しないようにしてもよい。このように、未登録顔の顔の大きさや登録済み顔からの距離など、注目度を目安として高画質化対象顔を設定してもよい。
この場合、顔の大きさについては、例えば、図6に示すような顔情報に含まれる「大きさ」から顔の面積を算出して所定サイズよりも小さいか否かを判定することができる。また、登録済み顔と未登録顔との距離については、例えば、図6に示すような顔情報に含まれる「座標」から距離を算出して所定の距離以上離れているか否かを判定することができる。また、顔の大きさが所定サイズよりも小さい、もしくは登録済み顔と所定の距離以上離れている場合に、顔の大きさや距離に比例して高画質化の度合いを低く制御するといったような多値の制御を行ってもよい。
以上のように、登録済み顔と一緒に撮影されている未登録顔であっても、例えば、登録済み顔の背後を通過する通行人等などのように、登録済み顔から離れた場所に位置する未登録顔に関しては、高画質化対象顔から除外することが可能となる。そのため、登録済み顔と近い場所に位置する未登録顔を重点的に高画質化対象顔と設定することが可能となる。
図8は、高画質化対象顔設定部404により高画質化対象顔に設定する処理手順の一例を示すフローチャートである。
図8において、顔認識部403から顔情報が入力されることにより処理を開始する。そして、ステップS801において、入力された顔情報に登録済み顔が含まれているか否かを判定する。この判定の結果、登録済み顔が含まれていない場合は、ステップS803に進み、登録済み顔が含まれている場合は、ステップS802に進む。
図8において、顔認識部403から顔情報が入力されることにより処理を開始する。そして、ステップS801において、入力された顔情報に登録済み顔が含まれているか否かを判定する。この判定の結果、登録済み顔が含まれていない場合は、ステップS803に進み、登録済み顔が含まれている場合は、ステップS802に進む。
次に、ステップS802において、全ての登録済み顔を高画質化対象顔に設定する。そして、ステップS803において、入力された顔情報に未登録顔が含まれるか否かを判定する。この判定の結果、未登録顔が含まれていない場合は、そのフレームについては処理を終了する。このとき、高画質化の対象であると判定された顔(登録済み顔)が含まれている場合は、高画質化の対象であると判定された顔のみの顔情報を高画質化対象顔情報としてカメラ部101及び符号化部102に出力する。なお、例えば図6に示すような顔情報に、高画質化対象顔か否かを示す情報を付加することによって高画質化対象顔情報を生成してもよい。
一方、ステップS803の判定の結果、未登録顔が含まれている場合は、ステップS804において、ある未登録顔に関して高画質化対象顔とする条件に合致するか否かを判定する。この判定の結果、条件に合致していない場合は、ステップS806に進む。なお、図7(a)に示す例のように、登録済み顔が検出されていない期間では高画質化対象顔としないような設定の場合は、ステップS801でNOと判定されると、ステップS804では、全ての未登録顔が条件に合致しないことになる。
一方、ステップS804の判定の結果、条件に合致した場合は、ステップS805において、その未登録顔を高画質化対象顔に設定する。なお、高画質化対象顔とする条件とは、前述のように、例えば、顔の大きさが所定サイズ以上であることや、図7(b)の未登録顔(4)に示す設定の場合に、登録済み顔が撮影されなくなった以降も顔検出されていることなどの条件が挙げられる。
次に、ステップS806において、全ての未登録顔に対してステップS804の判定を行ったか否かを判定する。この判定の結果、まだ判定を行っていない未登録顔がある場合は、ステップS804に戻り、全ての未登録顔について判定を行った場合は、そのフレームについては処理を終了する。このとき、高画質化の対象であると判定された顔が含まれている場合は、前述と同様に、高画質化対象顔情報としてカメラ部101及び符号化部102に出力する。このように、ステップS801〜S806の処理をフレーム毎に繰り返し、登録済み顔及び高画質化対象顔とする条件に合致した未登録顔を高画質化対象顔に設定し、高画質化対象顔情報を出力する。
以上のように本実施形態によれば、所定の条件を満たす未登録顔に対しても高画質化処理を行うようにした。これにより、例えば、登録済み顔の人や撮影者の知人ではあるが登録済み顔認識データ記録部402に記録されていないような顔も高画質に記録することが可能となる。さらに、登録済み顔と一緒に撮影されている未登録顔であっても、顔が小さい未登録顔や登録済み顔から離れた位置にある未登録顔に関しては、高画質化対象顔と設定しないようにした。これにより、例えば、偶然撮影されてしまった人物の顔等を高画質化対象顔から除外することが可能となる。
(第2の実施形態)
次に、本発明の第2の実施形態について説明する。特に顔が多く含まれる画像では符号量割り当てが困難になり、顔以外の画質の低下が目立ってしまう恐れがある。また、図7(a)に示すような設定の場合、全く無関係な人までも高画質にしてしまうことがある。そこで、本実施形態では、撮影頻度が所定値未満の未登録顔については高画質化しないようにする。
次に、本発明の第2の実施形態について説明する。特に顔が多く含まれる画像では符号量割り当てが困難になり、顔以外の画質の低下が目立ってしまう恐れがある。また、図7(a)に示すような設定の場合、全く無関係な人までも高画質にしてしまうことがある。そこで、本実施形態では、撮影頻度が所定値未満の未登録顔については高画質化しないようにする。
本実施形態では、高画質化対象顔判定部104の構成及び動作が第1の実施形態と異なっている。したがって、図1に示した他の構成については第1の実施形態と同様であるため、説明は省略する。また、以下の説明では、第1の実施形態で説明したものと同じ符号が付されているものも第1の実施形態と同様の動作、処理を行うものであるため、説明は省略する。
まず、図9を参照しながら高画質化対象顔判定部104の構成例について説明する。
図9は、本実施形態における高画質化対象顔判定部104の詳細な構成例を示すブロック図である。
図9に示すように、本実施形態における高画質化対象顔判定部104は、顔検出部401、登録済み顔認識データ記録部402、未登録顔認識データ記録部901、顔認識部902、及び高画質化対象顔設定部903を備えている。
図9は、本実施形態における高画質化対象顔判定部104の詳細な構成例を示すブロック図である。
図9に示すように、本実施形態における高画質化対象顔判定部104は、顔検出部401、登録済み顔認識データ記録部402、未登録顔認識データ記録部901、顔認識部902、及び高画質化対象顔設定部903を備えている。
続いて、本実施形態における高画質化対象顔判定部104の動作について図9を参照しながら説明する。
未登録顔認識データ記録部901は、登録済み顔認識データ記録部402に記録されていない顔(未登録顔)に関して、顔認識部902で顔認識するために用いる顔画像データや識別情報を記録する。さらに、未登録顔が撮影された頻度(検出頻度)も記録する。ここで、撮影された頻度とは、例えば、未登録顔が撮影されたフレーム数や撮影時間である。
未登録顔認識データ記録部901は、登録済み顔認識データ記録部402に記録されていない顔(未登録顔)に関して、顔認識部902で顔認識するために用いる顔画像データや識別情報を記録する。さらに、未登録顔が撮影された頻度(検出頻度)も記録する。ここで、撮影された頻度とは、例えば、未登録顔が撮影されたフレーム数や撮影時間である。
顔認識部902は、顔検出部401から出力された顔の中心座標、大きさを表す情報を基に、入力した映像信号における被写体の顔が、登録済み顔認識データ記録部402又は未登録顔認識データ記録部901に記録されている顔と一致するか否かを判定する。そして、その判定結果と、判定した顔の中心座標、大きさ及び撮影頻度とを顔情報として高画質化対象顔設定部903に出力する。高画質化対象顔設定部903は、顔認識部902から出力された顔情報を基に、登録済み顔と、一緒に撮影されている未登録顔のうち、撮影頻度が所定値以上の未登録顔とを高画質化の対象とする顔と判定する。そして、高画質化の対象と判定された顔のみの顔情報を高画質化対象顔情報として出力する。
次に、顔認識部902について図10を参照しながら説明する。
図10は、顔認識部902からフレーム毎に出力される顔情報の一例を示す図であり、例として、フレーム番号「0」から得られた顔情報を示している。
図10に示すように、入力した映像信号における被写体の顔が登録済み顔認識データ記録部402に記録されている顔と一致する場合は、登録済み顔という判定結果と、判定した顔の中心座標及び大きさとを顔情報として出力する。また、入力した映像信号における被写体の顔が未登録顔認識データ記録部901に記録されている顔と一致する場合は、未登録顔という判定結果と、判定した顔の中心座標、大きさ及び撮影頻度とを顔情報として出力する。その後、未登録顔認識データ記録部901に記録されている撮影頻度情報を更新する。例えば、図10に示すように、x=250、y=500の位置に存在する顔の場合は、撮影頻度を12345フレームから12346フレームにカウントアップする。
図10は、顔認識部902からフレーム毎に出力される顔情報の一例を示す図であり、例として、フレーム番号「0」から得られた顔情報を示している。
図10に示すように、入力した映像信号における被写体の顔が登録済み顔認識データ記録部402に記録されている顔と一致する場合は、登録済み顔という判定結果と、判定した顔の中心座標及び大きさとを顔情報として出力する。また、入力した映像信号における被写体の顔が未登録顔認識データ記録部901に記録されている顔と一致する場合は、未登録顔という判定結果と、判定した顔の中心座標、大きさ及び撮影頻度とを顔情報として出力する。その後、未登録顔認識データ記録部901に記録されている撮影頻度情報を更新する。例えば、図10に示すように、x=250、y=500の位置に存在する顔の場合は、撮影頻度を12345フレームから12346フレームにカウントアップする。
一方、入力した映像信号における被写体の顔が登録済み顔認識データ記録部402に記録されている顔、及び未登録顔認識データ記録部901に記録されている顔のいずれにも一致しない場合もある。この場合は、未登録顔という判定結果と、判定した顔の中心座標、大きさ及び0フレームとした撮影頻度とを顔情報として出力する。その後、顔認識部902は、判定した映像信号に含まれる顔を、識別情報及び1フレームとした撮影頻度の情報とともに顔画像データとして未登録顔認識データ記録部901に記録する。
このように顔認識部902から出力された顔情報を基に、高画質化対象顔設定部903は、登録済み顔と、一緒に撮影されている未登録顔のうち、撮影頻度が所定値以上の未登録顔とを高画質化の対象とする顔と判定する。そして、高画質化の対象と判定された顔のみの顔情報を高画質化対象顔情報としてカメラ部101及び符号化部102に出力する。例えば、図10に示すような顔情報が入力された場合、登録済み顔と撮影頻度が12345フレームの未登録顔とを高画質化対象顔として設定し、この2つの顔の顔情報を高画質化対象顔情報として出力する。
以上のように本実施形態によれば、顔認識部902から出力される顔情報により、登録済み顔だけではなく、登録済み顔と一緒に撮影されている未登録顔のうち、撮影頻度が高い未登録顔も高画質化対象顔として設定することができる。これにより、例えば、登録済み顔の人や撮影者の知人ではあるが登録済み顔認識データ記録部402に記録されていないような顔も高画質に記録することが可能となる。さらに、登録済み顔と一緒に撮影されている未登録顔であっても、撮影頻度が低い未登録顔に関しては、高画質化対象顔と設定しないことにより、例えば、登録済み顔の背後を通過する通行人等を高画質化対象顔から除外することが可能となる。そのため、撮影頻度が高い未登録顔を重点的に高画質化対象顔と設定することが可能となる。
(その他の実施形態)
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。
401 顔検出部
402 登録済み顔認識データ記録部
403 顔認識部
404 高画質化対象顔設定部
402 登録済み顔認識データ記録部
403 顔認識部
404 高画質化対象顔設定部
Claims (14)
- 顔画像データを記憶する記憶手段と、
映像信号から顔を検出する顔検出手段と、
前記顔検出手段により検出された顔が前記記憶手段に記憶されている顔画像データに含まれているか否かを判定する顔認識手段と、
前記顔認識手段により前記記憶手段に記憶されている顔画像データに含まれていると判定された顔と含まれていないと判定された顔とが前記映像信号から検出された場合に、前記顔画像データに含まれていると判定された顔、及び前記顔画像データに含まれていないと判定された顔の領域を、他の領域よりも高画質化した画像処理を行う画像処理手段とを備えることを特徴とする画像処理装置。 - 前記顔認識手段により前記顔画像データに含まれていないと判定された顔の注目度が所定の条件を満たすか否かを判定する判定手段をさらに備え、
前記画像処理手段は、前記顔画像データに含まれていると判定された顔、及び前記判定手段により前記注目度が所定の条件を満たすと判定された場合は前記注目度が所定の条件を満たす顔の領域を、他の領域よりも高画質化した画像処理を行うことを特徴とする請求項1に記載の画像処理装置。 - 前記判定手段は、前記注目度として、前記顔画像データに含まれていないと判定された顔の大きさを判定し、
前記画像処理手段は、前記顔画像データに含まれていると判定された顔、及び前記判定手段により前記顔の大きさが所定値以上であると判定された場合は前記顔の大きさが所定値以上である顔の領域を、他の領域よりも高画質化した画像処理を行うことを特徴とする請求項2に記載の画像処理装置。 - 前記判定手段は、前記注目度として、前記顔画像データに含まれていると判定された顔との距離を判定し、
前記画像処理手段は、前記顔画像データに含まれていると判定された顔、及び前記判定手段により前記距離が所定値未満であると判定された場合は前記距離が所定値未満である顔の領域を、他の領域よりも高画質化した画像処理を行うことを特徴とする請求項2に記載の画像処理装置。 - 前記判定手段は、前記注目度として、前記顔検出手段により検出されている期間を判定し、
前記画像処理手段は、前記顔画像データに含まれていると判定された顔、及び前記判定手段により所定の期間以上検出されていると判定された場合は前記所定の期間以上検出されている顔の領域を、他の領域よりも高画質化した画像処理を行うことを特徴とする請求項2に記載の画像処理装置。 - 前記顔認識手段により前記記憶手段に記憶されている顔画像データに含まれていないと判定された顔の顔画像データを記録部に記録する記録手段と、
前記記録手段により記録された顔画像データの顔の検出頻度を算出する算出手段とをさらに備え、
前記判定手段は、前記注目度として、前記算出手段により算出される検出頻度を判定し、
前記画像処理手段は、前記顔画像データに含まれていると判定された顔、及び前記判定手段により前記検出頻度が所定値以上であると判定された場合は前記検出頻度が所定値以上の顔の領域を、他の領域よりも高画質化した画像処理を行うことを特徴とする請求項2に記載の画像処理装置。 - 前記検出頻度とは、フレーム数であることを特徴とする請求項6に記載の画像処理装置。
- 前記検出頻度とは、撮影時間であることを特徴とする請求項6に記載の画像処理装置。
- 前記顔認識手段により前記記憶手段に記憶された顔画像データに含まれていないと判定された場合であって、前記顔画像データに含まれていないと判定された顔が過去に前記記憶手段に記憶された顔画像データに含まれていると判定された顔とともに検出されている場合、前記画像処理手段は、前記顔画像データに含まれていないと判定された顔の領域を、他の領域よりも高画質化した画像処理を行うことを特徴とする請求項1〜8の何れか1項に記載の画像処理装置。
- 前記画像処理手段は、前記映像信号を圧縮符号化する符号化手段を有し、
前記符号化手段は、前記画像処理として、前記顔画像データに含まれていると判定された顔、及び前記顔画像データに含まれていないと判定された顔の領域に対して符号量を他の領域よりも多く与えて圧縮符号化することを特徴とする請求項1〜9の何れか1項に記載の画像処理装置。 - 前記符号化手段は、さらに、前記顔画像データに含まれていると判定された顔の領域に対して、前記顔画像データに含まれていないと判定された顔の領域よりも多くの符号量を与えて圧縮符号化することを特徴とする請求項10に記載の画像処理装置。
- 被写体を撮像して前記映像信号を生成する撮像手段をさらに備え、
前記画像処理手段は、前記画像処理として、前記撮像手段により生成される映像信号に対するホワイトバランス、露出、フォーカス、平滑化フィルタ処理のうち、少なくとも1つを高画質化することを特徴とする請求項1〜11の何れか1項に記載の画像処理装置。 - 映像信号から顔を検出する顔検出工程と、
前記顔検出工程において検出された顔が記憶手段に記憶されている顔画像データに含まれているか否かを判定する顔認識工程と、
前記顔認識工程において前記記憶手段に記憶されている顔画像データに含まれていると判定された顔と含まれていないと判定された顔とが前記映像信号から検出された場合に、前記顔画像データに含まれていると判定された顔、及び前記顔画像データに含まれていないと判定された顔の領域を、他の領域よりも高画質化した画像処理を行う画像処理工程とを備えることを特徴とする画像処理方法。 - 映像信号から顔を検出する顔検出工程と、
前記顔検出工程において検出された顔が記憶手段に記憶されている顔画像データに含まれているか否かを判定する顔認識工程と、
前記顔認識工程において前記記憶手段に記憶されている顔画像データに含まれていると判定された顔と含まれていないと判定された顔とが前記映像信号から検出された場合に、前記顔画像データに含まれていると判定された顔、及び前記顔画像データに含まれていないと判定された顔の領域を、他の領域よりも高画質化した画像処理を行う画像処理工程とをコンピュータに実行させることを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010244310A JP2012099943A (ja) | 2010-10-29 | 2010-10-29 | 画像処理装置、画像処理方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010244310A JP2012099943A (ja) | 2010-10-29 | 2010-10-29 | 画像処理装置、画像処理方法及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2012099943A true JP2012099943A (ja) | 2012-05-24 |
Family
ID=46391398
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010244310A Pending JP2012099943A (ja) | 2010-10-29 | 2010-10-29 | 画像処理装置、画像処理方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2012099943A (ja) |
-
2010
- 2010-10-29 JP JP2010244310A patent/JP2012099943A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8494306B2 (en) | Method and an apparatus for creating a combined image | |
JP4799438B2 (ja) | 画像記録装置、画像記録方法、画像符号化装置、及びプログラム | |
JP4693522B2 (ja) | 撮像装置 | |
US20100214445A1 (en) | Image capturing method, image capturing apparatus, and computer program | |
JP2012257198A (ja) | 立体画像符号化装置、その方法、および立体画像符号化装置を有する撮像装置 | |
JP2007295370A (ja) | 符号化装置および方法、並びにプログラム | |
KR100951637B1 (ko) | 스테레오 비전 시스템 및 이의 영상 처리 방법 | |
JP4310282B2 (ja) | 画像符号化装置および符号化方法 | |
JP2023052939A (ja) | 符号化装置、復号装置、符号化方法、復号方法、符号化プログラム、および復号プログラム | |
JP2015023498A (ja) | 画像符号化装置、画像符号化方法およびプログラム | |
JP2018137542A (ja) | 符号化装置、符号化方法、及び、プログラム | |
JP5111317B2 (ja) | デジタルカメラ | |
JP2005260467A (ja) | 画像処理装置 | |
JP2007214886A (ja) | 画像処理装置 | |
JP5165084B2 (ja) | 画像符号化装置 | |
JP2000209590A (ja) | 画像符号化装置及び方法、記憶媒体並びに撮像装置 | |
JP2012099943A (ja) | 画像処理装置、画像処理方法及びプログラム | |
US10516896B2 (en) | Encoding device, encoding method, and storage medium | |
KR101780444B1 (ko) | 영상 신호의 노이즈 제거 방법 | |
JP2014110509A (ja) | 画像符号化装置及び画像符号化方法 | |
JP2016082395A (ja) | 符号化装置、符号化方法及びプログラム | |
JP2013175803A (ja) | 画像処理装置およびカメラ | |
JP2014220546A (ja) | 画像記録装置及びその方法 | |
KR101694293B1 (ko) | 카메라의 메타 데이터를 이용한 영상 압축 방법 | |
JP5025804B2 (ja) | 撮像装置 |