以下に添付図面を参照しながら、本発明の好適な実施形態について詳細に説明する。かかる実施形態に示す寸法、材料、その他具体的な数値などは、発明の理解を容易とするための例示にすぎず、特に断る場合を除き、本発明を限定するものではない。なお、本明細書及び図面において、実質的に同一の機能、構成を有する要素については、同一の符号を付することにより重複説明を省略し、また本発明に直接関係のない要素は図示を省略する。
小型軽量化が望まれる近年の撮像装置においては、液晶モニターやビューファインダも小型化され、その画像中の人物を特定するのが困難である。このようなモニターでは遠く離れた複数の被写体から、自分の子供など撮像したい人物を特定して追跡して撮像することは難しい。また、既存の画像信号再生装置では、画面が切り換わる度に所望する人物を見つけ出すのに時間を要したり、画面内の部分ズーム機能を利用する場合においてその対象を特定し難かったりした場合があった。
以下の実施形態では、上述のようにモニター上に複数の人物が小さく表示されていても、特定の人物を容易に識別することが可能な撮像装置、撮像方法、画像信号再生装置および画像信号再生方法を提供することを目的としている。以下、実施形態の撮像装置の構成とその撮像装置を用いた撮像方法を述べ、その後で、画像信号再生装置の構成とその画像信号再生装置を用いた画像信号再生方法を述べる。
(第1の実施形態:撮像装置100)
図1は、第1の実施形態における撮像装置100の一例を示した外観図である。撮像装置100は、携帯性を有し、本体102と、撮像レンズ104と、操作部106と、モニターとしての液晶モニター108とを含んで構成される。
本体102は、撮像レンズ104を通じて撮像された画像データを再視聴可能に記録すると共に、操作部106へのユーザ入力に応じてその記録タイミングや画角が調整される。また、野外、屋内、夜景等の撮像モードの切り換え入力などをユーザから受け付ける。さらに、ユーザはその液晶モニター108に表示された画像を参照し、実録される画像データを視認することができ、被写体を所望する位置および占有面積で捉えることが可能となる。本実施形態では、モニター(ディスプレイ)として液晶モニターを例に挙げたが、液晶モニターに限らず、有機EL(Electro Luminescence)、LED(Light Emitting Diode)ディスプレイなどで構成されてもよい。
図2は、第1の実施形態における撮像装置100の構成を示すブロック図である。撮像装置100は、撮像部120と、信号処理部122と、画像記憶部124と、画像処理部126と、記録I/F部128と、画像出力部130と、メモリ装置132と、撮像制御部134とを含んで構成される。なお、画像記憶部124、画像処理部126、記録I/F部128、画像出力部130および撮像制御部134はシステムバス136を介して接続されている。
撮像部120は、撮像レンズ104を通じて被写体を撮像し画像データを生成する。撮像部120は、具体的に、近赤外光を遮るIRカットフィルタ140、焦点調整に用いられるフォーカスレンズ142、露光調整に用いられる絞り144、撮像レンズ104を通じて入射する被写体像などの光を光電変換し画像信号を生成するCCD(Charge Coupled Devices)等で構成される撮像素子(撮像回路)146、撮像素子146からの画像信号を増幅する増幅器148、増幅された画像信号をデジタルの画像データに変換するA/D変換器150、フォーカスレンズ142および絞り144の駆動を制御する駆動制御部152とその駆動回路154と、を含んで構成される。
信号処理部122は、入力された信号に対して輝度信号や色信号を形成するなどの信号処理を行ってカラー映像信号を形成し、画像記憶部124に伝達する。また、画面の平均輝度を求めるなどして、その制御信号を駆動制御部152へ出力する。
画像記憶部124は、SDRAM(Synchronous-DRAM)等のバッファメモリで構成され、画像データを一時的に記憶し、画像処理部126等にその画像データを参照させることができる。
画像処理部126は、画像記憶部124からの画像データをMPEG−2、MPEG−4、MPEG−4/AVC等の形式で圧縮して記録用のデータを生成する。また、画像処理部126は、撮像制御部134の指示により画像データを縮小して表示用画像(ビュー画像)を生成する。一方、記録用のデータを再生する際には、画像処理部126は、圧縮された記憶用データを伸長復元する処理を実行する。
記録I/F部128は、符号化処理を通じ画像データを符号化して記録信号(データストリーム)を生成し、その記憶信号を任意の記録媒体156に記録する。任意の記録媒体156としては、DVDやBDといった電源不要な媒体や、RAM、EEPROM、不揮発性RAM、フラッシュメモリ、HDD等の電源を要する媒体を適用することができる。また、外部から接続可能な別体の記録媒体を用いることもできる。
メモリ装置132は、撮像制御部134で処理されるプログラムなどを記憶する。またメモリ装置132は、特徴量記憶部160としても機能し、指標テーブル162も有している。かかる特徴量記憶部160は、ユーザが予め撮像した特定の人物の顔に関する特徴量を記憶する。指標テーブル162については後ほど詳述する。以下、単に「顔」とするところは画像信号から切り出し可能な顔全体を指し、「顔の位置」は顔の任意の点の画面内の相対位置を示し、「顔の占有面積」は顔が画面内を占有する面積を示す。
撮像制御部134は、半導体集積回路により撮像装置100全体を管理および制御し、撮像などに必要となる各種演算を実行する。また、撮像制御部134は、顔抽出部180、類似度算出部182、類似度比較部184、座標特定部186、タイマー部188としても機能する。
顔抽出部180は、撮像部120が取得した撮像画像のデータから顔を抽出する。そして、顔抽出部180は、抽出した顔からその顔の画面内における座標および占有面積と特徴点を導出し、顔の画面内における座標と占有面積の情報は、メモリ装置132に格納し、特徴点は、類似度算出部182に伝達する。抽出方法は、例えば、特開2001−16573号公報などに記載された特徴点抽出処理によって顔の占有領域を抽出する。かかる特徴点の抽出処理は、顔抽出部180において実行する場合に限らず、後述する類似度算出部182などで処理することとしてもよい。
類似度算出部182は、まず、顔抽出部180で抽出された顔と顔の特徴点からその顔の特徴量を算出する。特徴量は、顔を特徴付ける情報であり、顔の特徴点(目、口、鼻、耳等の特徴部分の相対位置)、特徴点同士の離間距離、特徴部分の大きさ、顔の輪郭、肌の色、髪の色、髪の量等を用いて顔を特定する。次に、類似度算出部182は、ユーザに指定された特定の人物の顔の特徴量を特徴量記憶部160から読み出し、特徴量を算出した1または複数の顔とそれぞれ比較して、特定の人物の顔と撮像された人物の顔との類似度を求める。類似度は2つの顔の画像の類比を示し、例えば0〜100の値で表され、0だと別人、100だと同一人物と判断することができる。
図3は、指標テーブル162を説明するための説明図である。指標テーブル162は、類似度と特定の人物を示す指標(ここでは矢印)の色を関連付けている。例えば、類似度算出部182で算出された類似度が70〜80であった場合白で示し、81〜90であった場合青で示し、91〜100であった場合赤で示す。ここでは、後述する所定閾値を70としているので、類似度が70より小さい場合は別人として何らの色とも対応させないとする。また、本実施形態では、指標として矢印を挙げて説明するが、指差しマーク等矢印以外のマークや顔の輪郭に沿ったライン等様々な特定表示を用いることができる。
類似度比較部184は、類似度算出部182が算出した類似度と予め設定された所定閾値とを比較し、所定閾値よりも類似度が大きな場合、当該顔の類似度を座標特定部186に伝達する。本実施形態では所定閾値を70としたが、かかる値に限定されずユーザは数値を任意に設定することができる。
座標特定部186は、類似度比較部184から受け取った所定閾値よりも大きい類似度と指標テーブル162を参照して対応する色データを取得し、前述の顔抽出部180がメモリ装置132に保存した各顔の位置と占有面積のデータを参照して、その撮像人物の顔の近傍で全ての撮像人物の顔を除いた領域の座標データを画像重畳部190に送信する。
画像出力部130は、画像重畳部190、D/A変換器192を含んで構成される。画像重畳部190は、類似度算出部182から取得した色データの色に着色された例えば矢印(指標)を、画像信号の座標特定部186から取得した座標に重畳する。かかる構成により、ユーザは複数の顔の候補から、直感的かつ確実に適切な被写体を選択することが可能となる。また、特定の人物によく似た顔が複数存在し、その判別がつかない場合であっても、ユーザは、その彩色が施された複数の顔を全て画面内に収める等の処理を通じて、所望する人物を欠落させることなくより確実に撮像することができる。
本実施形態では、矢印の色で類似度の高さを示したが、矢印の模様または形状を変化させるようにしてもよい。また、複数の指標を準備して類似度に対応した指標を表示してもよいし、類似度をそのまま数字で表示するようにしてもよい。また、人物や顔自体の色や明るさを変えるなどして、類似度の高さを示してもよい。
さらに、類似度算出部182から取得した座標データは、矢印を画面内の人物の顔と重ならない位置になるように計算した値のため、画像重畳部190は矢印を画面内の全ての人物の顔と重ならない位置に重畳する。かかる構成により、その矢印が他の人物の顔に重なってしまい他の人物の顔を視認できなくなってしまう事態を回避することができ、全ての顔を認識できる状態で安定した撮像が可能となる。
D/A変換器192は、画像記憶部124から取得したデジタルの画像データを視聴可能な画像信号に加工して、液晶モニター108に出力する。その画像データは、画像重畳部190が重畳した矢印などの画像信号を含む。撮像者(ユーザ)は、かかる液晶モニター108の映像を視認しながら撮像対象を特定することができる。ここでは、画像信号の出力先を液晶モニター108としたが、画像出力部130は、外部に画像出力を行うための映像端子を有しているため、別体のモニター等様々な画像表示装置に接続することも可能である。
以下、撮像装置100の具体的な処理動作を説明する。
図4は、液晶モニター108における人物判別のための指標の重畳について説明した説明図である。ここでは、撮像対象としてサッカーの試合が想定され、撮像した画像を映し出す液晶モニター108には4人のサッカー選手である人物202A、202B、202C、202Dが映し出されている。実際に撮像された画像信号は解像度が高いが、ここでは、液晶モニター108が小さいため、かかる人物202A、202B、202C、202Dの識別が困難であったとする。
ユーザは、予め撮像したい特定の人物202Cの画像を撮像装置100に登録しておき、撮像する前に操作部106を通じてその人物202Cを探し出すように撮像装置100に指示を与える。撮像装置100は、撮像部120で撮像した画像を、信号処理部122を通して画像記憶部124のバッファメモリに記憶すると共に、画像出力部130および顔抽出部180に伝達する。
顔抽出部180は、特徴点抽出処理により人物202A、202B、202C、202Dの4つの顔を抽出し、その顔の位置、占有面積および特徴点を導出して、顔の位置と占有面積の情報をメモリ装置132に格納し、顔と特徴点を類似度算出部182に伝達する。
類似度算出部182は、ユーザに指定された特定の人物の特徴量を特徴量記憶部160から読み出し、さらに、顔抽出部180から伝達された顔と特徴点に基づいて特徴量を算出し、算出結果の各人の特徴量と特定の人物の特徴量とを比較して、特定の人物の顔の画像との類比を示した類似度を算出し、顔毎にメモリ装置132に格納する。ここで、各人の類似度は、人物202Aが85、人物202Bが65、人物202Cが95、人物202Dが45であったとする。
次に、類似度比較部184は、予め設定された所定閾値と顔毎の類似度を比較する。この所定閾値は、ユーザ入力に応じて値を変更できるようにしても良いし、固定の値としても良い。ここでは、所定閾値が70であるとする。
まず、人物202Aの顔について、算出された類似度85と所定閾値70を比較し、類似度の方が大きいと判断する。そして座標特定部186は、指標テーブル162を参照しこの類似度85に応じた青の色データと、人物202Aの顔の近傍で人物202A、202B、202C、202Dの顔の占有領域を除いた領域の座標データを画像重畳部190に送信する。画像重畳部190では、送信された色データと座標データから、青色の矢印図形を画像データに重畳して液晶モニター108に表示する(矢印300A)。
同様に、類似度比較部184は、人物202Bの顔の類似度65を所定閾値70と比較し類似度の方が小さいと判断し、人物202Bに関しては処理を行わず次の顔の処理に移行する。
同様に、人物202Cの顔の類似度95を所定閾値70と比較し、類似度の方が大きいと判断し、指標テーブル162を参照しこの類似度95に応じた赤の色データとCの顔の近傍で人物202A、202B、202C、202Dの顔の占有領域を除いた領域の座標データを画像重畳部190に送信する。画像重畳部190では、送信された色データと座標データから、赤色の矢印図形を画像データに重畳して液晶モニター108に表示する(矢印300B)。
同様に、人物202Dの顔の類似度45を所定閾値70と比較し、類似度の方が小さいと判断して人物202Dに関しては特別な処理を行わない。
以上の処理は、撮像中の毎フレームで行われるとしてもよい。撮像制御部134は、フレームに同期したパルス信号をトリガに処理を遂行してもよいし、フレーム周期をカウントするタイマー部188(図2参照)のカウント値に基づいて処理を遂行してもよい。
(撮像方法)
図5は、第1の実施形態における撮像方法の処理の流れを説明したフローチャートである。
ユーザが予め登録しておいた人物202の画像から1または複数の特定の人物202を指定し(S300)、撮像を開始すると(S302)、撮像部120で取得した画像信号は信号処理部122、画像記憶部124を経て撮像制御部134の顔抽出部180に伝達され、顔抽出部180は画像データから顔を抽出する(S304)。
顔が1つも抽出されない場合(S306NO)処理を終了する。顔が少なくとも1つ以上抽出されると(S306YES)、抽出された各顔全てについて、以下の処理を繰り返し実行する。
まず、類似度算出部182は、抽出した顔から特徴量を算出する(S308)。以下、ユーザが指定した特定の人物202が複数ある場合はそのうちの1人について、1人しか指定されていなければその1人の特定の人物202について、特徴量を特徴量記憶部160から取得し、両者の特徴量から類似度を算出する(S310)。
類似度が予め設定された所定閾値より大きければ(S312YES)、指標テーブル162を参照して類似度に対応する色データを取得し(S314)、当該顔の座標近傍で他の顔の重ならない座標を算出する(S316)。画像重畳部190は、液晶モニター108に表示する画面内の、算出された座標位置に色データで指定された色の矢印を重畳する(S318)。
算出した類似度が所定閾値以下であれば(S312NO)、当該顔について特別な処理は行わない。
ユーザが指定した特定の人物202が複数であり、まだ上述の類似度算出(S310)から矢印描画(S318)までの処理を行っていない特定の人物202が残っている場合(S320YES)、当該残っている特定の人物202のうちの1人について、類似度算出(S310)以下のステップを実行する。この処理はユーザが指定した特定の人物202が全員終わるまで繰り返される。
未処理の特定の人物が0人の場合(S320NO)、特徴量算出(S308)以下の処理を行っていない顔が残っているかどうか判断され(S322)、残っていれば、各顔について上述の処理を繰り返す。未処理の顔が無くなると(S322NO)、当該撮像方法を終了する。以上の処理を、フレーム毎に実行する。
本実施形態によれば、ユーザは撮像する際に所定の人物を撮像装置の液晶モニター108で容易に探し出して確認することができ、誤って想定していない人物をズームして撮像してしまうなどわずらわしい思いを感じることなく適切な被写体を撮像できる。また、液晶モニター108上に似通った顔の人物が複数表示されていても、それぞれの類似度の高さを色で判別できるため、特定の人物の判別をより確実に実行できる。
(第2の実施形態:撮像装置400)
第1の実施形態では、フレーム毎に類似度を算出して、その結果に基づいて液晶モニター108の画像に指標を重畳していた。この方法では、顔の向きや表情の変化に応じてフレーム毎に類似度が変化する場合があり、その変化とともに類似度に応じた指標(矢印や色、数字など)が変化し、ユーザがわずらわしい思いをする可能性がある。
第2の実施形態では、現在のフレーム(画面)のみならず、直前の所定数前からの複数のフレーム(画面)を参照して安定した類似度を算出し、表示させる指標の変化を抑え、ユーザに与えるわずらわしさを軽減することができる。
図6は、第2の実施形態における撮像装置400の構成を示すブロック図である。撮像装置100は、撮像部120と、信号処理部122と、画像記憶部124と、画像処理部126と、記録I/F部128と、画像出力部130と、メモリ装置132と、撮像制御部402とを含んで構成される。なお、画像記憶部124、画像処理部126、記録I/F部128、画像出力部130および撮像制御部402はシステムバス136を介して接続されている。
上記撮像部120、信号処理部122、画像記憶部124、画像処理部126、記録I/F部128、画像出力部130、メモリ装置132は、第1の実施形態において述べた構成要素と実質的に機能が同一なので、重複説明を省略し、ここでは、構成が相異する撮像制御部402を主に説明する。
撮像装置400は、撮像装置100と異なり撮像制御部402に距離算出部404と同一性判断部406とが設けられている。距離算出部404は、メモリ装置132から前フレームと現フレームの顔の画面内における位置(具体的には座標で表される)と占有面積の情報を読み出し、現フレームの顔の位置と前フレームの全ての顔の位置との距離を算出する。例えば、液晶モニター108の左下隅を原点として、原点から水平方向にX1画素、垂直方向にY1画素の座標にある顔と、同じく原点から水平方向にX2画素、垂直方向にY2画素の座標にある顔の距離Dは、D=√((X1−X2)2+(Y1−Y2)2)で算出される。
同一性判断部406は、撮像した時刻が前後する例えばフレームA、フレームB(撮像時刻順)について、フレームAに含まれる全ての顔と、フレームBに含まれる全ての顔について同一性を判断する。同一性は、撮像した時間の異なる2つのフレームに含まれる顔がそれぞれ同一人物であると見なせるかどうかを示す。
また、本実施形態において同一性は、フレーム間の1または複数の顔と顔の画面内における距離、および1または複数の顔のフレーム間の画面内における占有面積に基づいても判断される。ここでは、前者を距離の同一性、後者を面積の同一性とする。
距離の同一性は、距離算出部404が算出したフレーム間における顔の画面内における距離から判断され、フレームBに含まれるある顔と、フレームAの全ての顔との距離が、予め設定された第1所定値より大きい場合、距離の同一性がないと判断され、その顔は同一ではない、またはフレームAには存在しなかった顔とする。かかる顔に関する既存の類似度はそのフレームBの人物の類似度算出の際には参照されない。
フレーム間における顔の画面内における距離が第1所定値以下であった場合、同一性判断部406は、2つの顔の面積の同一性を判断する。面積の同一性は、顔抽出部180が導出したフレームA、フレームBそれぞれの画面内における各人物の顔の占有面積の差分の絶対値から判断される。顔の占有面積の差分の絶対値が予め設定された第2所定値よりも大きい場合、面積の同一性がないと判断され、その顔に関する既存の類似度はフレームBの人物の類似度算出の際には参照されない。顔の占有面積の差分の絶対値が予め設定された第2所定値よりも小さい場合、面積の同一性があると判断され、2つの顔は同一人物の顔とされ、その顔に関する既存の類似度はフレームBの人物の類似度算出の際に参照される。
面積の同一性を使用することで、例えば、フレームAにおいて被写体が撮像装置400から遠くに離れて位置しており、フレームBにおいて同じ位置であるが、撮像装置400に近い位置に別の被写体が現れた場合でも、遠近法に従い画面内における顔の占有面積が異なるため、同一性判断部406は同一性がないと判断し、正しく別人と判断できる。
このように、フレーム間の画面内における1または複数の顔と顔の距離が所定値より小さく、かつ画面内における占有面積の差分の絶対値が所定値よりも小さい場合、フレーム間の顔同士を同一人物と判断することができる。かかる構成により、フレーム間で同一と見なすことができる顔を確実に抽出することができ、結果、安定した撮像を遂行することが可能となる。
また、同一性判断部406は、画面内における顔の距離や占有面積に限らず、フレーム間の顔の光量や特徴量等も考慮に入れて同一性を判断してもよい。かかる構成により、人物の追跡性能を向上させることが可能となる。
図7は、第2の実施形態における指標の重畳について説明した説明図である。図7(a)は、ある時間に撮像された画像である。図7(b)は、図7(a)から1フレーム後の時間に撮像された画像である。ここでは、図7(a)の画像をフレームAとし、図7(b)の画像をフレームBとし、フレームBに撮像されている人物202それぞれについての類似度を算出する際の手順を説明する。ただし、距離を明確に示すため1フレームの時間を長くとっている。
距離算出部404は、フレームBに含まれる人物202E、202F、202G、202H、202Iそれぞれについて、フレームAに含まれる人物202A、202B、202C、202Dそれぞれとの画面内における距離を算出する。
続いて同一性判断部406は、距離算出部404が算出した画面内における各距離と第1所定値とを比較して距離の同一度を判断する。人物202Eの顔の場合、人物202A、202B、202C、202Dのどの顔の位置とも離れており、距離が第1所定値より大きいため、距離の同一性はないと判断される。そのためフレームAには人物202Eと同一人物はいないと判断し、人物202Eの類似度を算出する際、フレームAの類似度は参照しない。
同様にフレームBの人物202Fの顔の位置とフレームAの人物202A、202B、202C、202Dの顔の位置との画面内の距離を算出して、それぞれ所定距離と比較する。人物202Fの顔の位置とフレームAの人物202Aの顔の位置との画面内における距離が第1所定値よりも小さくなる。従って、フレームA、B間で顔がほとんど移動していないこととなり、距離の同一性があると判断される。
次に人物202Fの画面内における顔の占有面積と人物202Aの画面内における顔の占有面積の差の絶対値を計算し、面積の同一性を判断する。面積の差分の絶対値が第2所定値よりも小さいため面積の同一性があると判断され、人物202Fの顔と人物202Aの顔は同一人物の顔であると判断することができる。
ここでは、距離の同一性と面積の同一性との条件を両方満たしているため、同一性判断部406は、フレームBの人物202FとフレームAの人物202Aは同一人物であると判断し、人物202Fに関連付けて人物202Aの類似度をメモリ装置132に記憶する。
同様に、同一性判断部406は、人物202Gの顔と人物202Bの顔、人物202Hの顔と人物202Cの顔、人物202Iの顔と人物202Dの顔がそれぞれ同一人物の顔であると判断し、それぞれの類似度を関連付けてメモリ装置132に記憶する。
同一性判断部406は、現在のフレームから例えば29フレーム前のフレームまで、連続する2つのフレームを比較して、撮像時刻が新しいものから古いものへ順次、同様の処理を繰り返す。ここでは説明を簡単にするため、2フレームより前の処理は省略する。
例えば、処理を進めていく中でフレームB(現在のフレーム)に含まれる人物202と同一と判断される人物202が存在しないフレームCがあった場合、フレームC以前にはその人物202は存在しないと判断し、当該人物202についての距離算出部404による距離算出処理、同一性判断部406による同一性判断処理は行わない。
従って、類似度算出部182は、フレームBの人物202Eの類似度を算出する際、29フレーム前までの類似度を参照するが、同一人物と判断される人物がいなかったため、類似度は、フレームBの人物202Eのみが持つ特徴量から算出された値となる。
一方、人物202Fの類似度は、フレームAやそれ以前のフレームで同一人物と判断される人物202Aが存在するため、メモリ装置132に登録されている人物202Aの類似度やそれ以前のフレームで同一人物と判断された人物202の類似度を全て参照して算出される。類似度算出部182は、参照した全ての類似度から最大値となる類似度(最大類似度)を算出し、その最大類似度をフレームBの人物202Fの類似度とする。
類似度比較部184は、類似度算出部182が算出した最大類似度を参照して、所定閾値と比較する。人物202Fの顔の場合、最大類似度が所定閾値よりも大きいので、座標特定部186は、この最大類似度に応じた色データ(青色)と、人物202Fの顔の近傍で人物202E、202F、202G、202H、202Iの顔の占有領域を除いた領域の座標データを画像重畳部190に送信する。画像重畳部190は、送られてきた色データと座標データから、青色の矢印図形を画像データに重畳して液晶モニターに表示する(矢印300A)。
同様に、人物202GはフレームAの人物202Bやそれ以前のフレームで同一人物と判断された人物202の顔の類似度を参照し、その最大値をフレームBの類似度とするが、人物202Gの顔の場合、最大類似度が所定閾値よりも小さいため、特別な処理は行われない。人物202Hの顔については最大類似度が95となるので、赤色の矢印図形を画像データに重畳して液晶モニターに表示する(矢印300B)。人物202Iは、人物202Gと同様に、過去のフレームを参照しても類似度が低いため、人物202Iの顔の場合には特別な処理を行わない。
このように、現在のフレームのみならず、直前の29フレーム前からの複数のフレームを参照して画面内の顔の類似度を算出し、被写体の類似度の算出精度を向上させる。かかる構成により、例えば被写体が顔の向きを変えた場合などの細かな動作によって、本来の類似度が不意に落ち込んでしまい指標が煩雑に変化する現象を回避することができ、安定した類似度を通じた安定した指標によって適切かつ確実に所望する被写体を撮像することが可能となる。
さらに、類似度算出の際、距離の同一性と面積の同一性があると判断された、直前の29のフレームにおける1または複数の顔の類似度と現在のフレームにおける顔の類似度との最大値を類似度として算出することで、被写体の動作や外的要因で瞬時的に類似度が落ち込むような場合においても、所定数前からのフレーム内で最大となる類似度を維持することができ、その類似度変動の影響を排除することができる。
なお、本実施例ではフレーム間での人物の同一性の判断に、距離の同一性および面積の同一性を用いた。人物の同一性の判断には、これ以外にも、非特許文献「映像情報メディア学会誌Vol.62,No.6,pp849〜855」に解説されている物体追跡法(例えば、Particl Filterによる物体追跡)を用いて、追跡が有効にできている場合を同一人物と判断するようにしても良い。
(撮像方法)
図8は、第2の実施形態における撮像方法の処理の流れを説明したフローチャートである。第1の実施形態において図5を用いて既に説明した処理に関しては、同一の符号を付しその説明を省略する。
図5における類似度算出ステップ(S310)、類似度と所定閾値とを比較するステップ(S312)は、図8では、それぞれ最大類似度算出ステップ(S500)、最大の類似度と所定閾値とを比較するステップ(S518)に置き換えている。
第1の実施形態における撮像方法と異なり、第2の実施形態における撮像方法では、直前の複数フレームと現在のフレームのうち最大の類似度と所定閾値を比較して(S518)、矢印描画の対象となる顔を判断する。こうして、本来の類似度が不意に落ち込んでしまい指標が煩雑に変化する現象を回避することができ、安定した類似度を通じた安定した指標によって適切かつ確実に所望する被写体を撮像することが可能となる。
図9は、図8における最大類似度算出ステップ(S500)の具体的な処理の流れを示したフローチャートである。
第1の実施形態と同様に、ユーザが指定した特定の人物の特徴量を特徴量記憶部160から取得し、現在のフレームの顔の1つから取得した特徴量との類似度を算出する(S502)。
さらに、メモリ装置132から1つ前のフレームの各顔の画面内における座標や占有面積などの情報を取得する(S504)。距離算出部404は、当該顔と各顔の相対距離をその座標から算出し(S506)、距離の同一性を判断する。距離の同一性がある顔があった場合(S508YES)、距離の同一性がある顔すべてについて、占有面積の差の絶対値から面積の同一性を判断する。面積の同一性があれば(S510YES)、面積の同一性がある顔すべてを同一人物と判断し、それぞれ対応する顔の1つ前のフレームの類似度を最新のフレームの類似度と関連付けて保存する(S512)。
1つ前のフレームに含まれるすべての顔との距離の同一性がなかったり(S508NO)、すべての顔との占有面積の同一性がなかったりした場合(S510NO)、その前フレームには当該人物は存在せず、最新のフレームから当該人物が現れたと判断しそれ以上過去のフレームは参照しない。
前のフレームの類似度を保存した(S512)後、その時点で現在のフレームから29フレーム前のフレームまで処理を行ったかどうか判定され(S514)、29フレームに至っていない場合(S514YES)、さらに1つ前のフレームの情報を取得し(S504)、直前まで処理していた2フレームのうち古いフレームと比較して、最大29フレーム分の類似度を導出する。
現在のフレームから29フレーム前のフレームまで処理を完了した場合(S514NO)、または同一人物がフレームに存在せず29より少ないフレームまでで処理を終えた場合は、S514でメモリ装置132に登録した類似度を全て参照し、類似度の最大値を算出する。
(第3の実施形態:画像信号再生装置600)
図10は、本実施形態にかかる画像信号再生装置600の構成を示すブロック図である。画像信号再生装置600は、操作部602と、メモリ装置132と、画像記憶部124と、画像出力部130と、画像取得部604と、画像処理部606と、再生制御部608とを含んで構成される。なお、画像記憶部124、画像取得部604、画像処理部606、再生制御部608、画像出力部130は、システムバス136を介して接続されている。上記画像記憶部124、画像出力部130、メモリ装置132は、第1の実施形態において既に述べたメモリ装置132と実質的に機能が同一なので重複説明を省略し、ここでは画像信号再生装置600で構成が相違する点を主に説明する。
上述した撮像装置100および400は、自機と一体に構成された液晶モニター108を通じて画像を表示したが、画像信号再生装置600は、別体としての構成される外部のモニター622を通じて、画像を表示する。また、操作部602は、ユーザ入力に応じて再生、停止、早送り、巻き戻しなどの操作を受け付ける。また、本実施形態では、撮像装置100と同様に、ユーザが画面内で探し出したい特定の人物を指定する際にも用いられる。
画像取得部604は、DVDやHDなどの記録媒体156からMPEG−2、MPEG−4、MPEG−4/AVC等の形式で圧縮された画像データを取得する。画像処理部606は、画像取得部604から圧縮された画像データを取得し、伸長復元する処理を実行する。
再生制御部608は、半導体集積回路により画像信号再生装置600全体を管理および制御し、再生などに必要となる各種演算を実行する。また、第2の実施形態における撮像装置400の撮像制御部402と同様に、顔抽出部180、類似度算出部182、類似度比較部184、座標特定部186、タイマー部188、距離算出部402、同一性判断部404として機能する。
(画像信号再生方法)
図11は、本実施形態における画像信号再生方法の流れを示したフローチャートである。ユーザが予め登録しておいた人物202の画像から1または複数の特定の人物202を指定し(S300)画像信号の再生を開始する(S700)。以降の処理の流れは、図8で示した第2の実施形態における撮像方法の流れを示したフローチャートと実質的に同様であり、説明は省略する。
また、本実施形態において、第1の実施形態や第2の実施形態と同様、直前の複数のフレーム間の同一性をフレーム内の距離や占有面積などから判断し、同一性があると判断された場合、直前の複数のフレームにおける類似度を用いて、例えば最大値となる類似度を現在のフレームの類似度とする。さらに、指標を、1または複数の顔の類似度に応じて、色彩、模様または形状を変化させ、画面内の人物の1または複数の顔と重ならない位置に重畳する。
既存の画像信号再生装置では、画面が切り換わる度に所望する人物を見つけ出すのに時間を要したり、人物像が小さい場合など画面内の部分ズーム機能を使う場所を特定できなかったりした場合があった。しかし、本実施形態において画像信号再生装置600は、画面内の顔の特徴量と予め記憶された特定人物の顔の特徴量との類似度を算出し、所定閾値よりも高い場合に指標を用いてその顔を指し示す。
かかる構成により、例えば、ドラマ映像などの再生時において、予め所望する俳優の画像などを登録しておけば、場面転換で急に暗い場所の映像に切り替わった場合においても、目や口の相対位置などの顔の特徴点を元に顔を認識するため、人間の目では確認できないような視認性の悪い映像でも、ユーザは、指標に基づいて迅速にその俳優を見つけ出すことができる。
特に、著名な監督や俳優が意外なエキストラとして出演している場合に、確実にその監督や俳優を捕捉することができる。
また、画面内の部分ズーム機能を利用する場合においても、特に見たい対象の人物の候補を1つに絞らずに画面内の複数の人物の顔に指標を表示させ、実際にどの人物像を再生対象とするかの判断をユーザに委ねる。ここでは、その判断をユーザに敢えて委ねることで、機械が万が一誤った人物像を最も確からしい人物と判断したとしても、最終的な人物の選択をユーザに実行させるので、ユーザの意志を確実に反映することが可能となる。
さらに、予め再生して類似度が最も高い顔の人物像が、特に見たい対象の人物であることを確認した上で、ズーム機能と本実施形態の機能を併用し、最も類似度の高い人物像を継続してズーム表示することも可能である。
以上、添付図面を参照しながら本発明の好適な実施形態について説明したが、本発明はかかる実施形態に限定されないことは言うまでもない。当業者であれば、特許請求の範囲に記載された範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。
なお、本明細書の撮像方法や画像信号再生方法における各工程は、必ずしもフローチャートとして記載された順序に沿って時系列に処理する必要はなく、並列的あるいはサブルーチンによる処理を含んでもよい。