JP2008277903A - 撮像装置及びフォーカス対象決定方法 - Google Patents
撮像装置及びフォーカス対象決定方法 Download PDFInfo
- Publication number
- JP2008277903A JP2008277903A JP2007115878A JP2007115878A JP2008277903A JP 2008277903 A JP2008277903 A JP 2008277903A JP 2007115878 A JP2007115878 A JP 2007115878A JP 2007115878 A JP2007115878 A JP 2007115878A JP 2008277903 A JP2008277903 A JP 2008277903A
- Authority
- JP
- Japan
- Prior art keywords
- face
- face area
- unit
- registered
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Image Analysis (AREA)
- Focusing (AREA)
- Automatic Focus Adjustment (AREA)
- Image Processing (AREA)
- Studio Devices (AREA)
Abstract
【課題】本発明は、簡易な操作でユーザ所望の検出顔領域をフォーカス対象に決定することができる。
【解決手段】本発明のカムコーダ1は、撮像対象の中から選定されたフォーカス対象に対して自動的にレンズの焦点を合わせるオートフォーカス機能を有しており、レンズ群7を介して取得した撮像光に基づいて生成された映像データから人物の顔領域FAを検出顔領域として検出し、検出顔領域に対応するテキスト情報を映像データに重畳することにより、当該映像データに基づく撮像画像における検出顔領域に順位テキスト情報TMを付加し、検出顔領域のうち、ユーザ所望の一の検出顔領域である選択顔領域に対応するテキスト情報を表す音声が入力された場合、当該テキスト情報に対応する検出顔領域をフォーカス対象に決定するようにした。
【選択図】図9
【解決手段】本発明のカムコーダ1は、撮像対象の中から選定されたフォーカス対象に対して自動的にレンズの焦点を合わせるオートフォーカス機能を有しており、レンズ群7を介して取得した撮像光に基づいて生成された映像データから人物の顔領域FAを検出顔領域として検出し、検出顔領域に対応するテキスト情報を映像データに重畳することにより、当該映像データに基づく撮像画像における検出顔領域に順位テキスト情報TMを付加し、検出顔領域のうち、ユーザ所望の一の検出顔領域である選択顔領域に対応するテキスト情報を表す音声が入力された場合、当該テキスト情報に対応する検出顔領域をフォーカス対象に決定するようにした。
【選択図】図9
Description
本発明は、撮像装置及びフォーカス対象決定方法に関し、例えば動画像でなる撮像データを記録するカムコーダに適用して好適なものである。
従来、カムコーダでは、撮像対象となる人物の動きに合わせて焦点や露出、色補正などを自動的に調整するオートフォーカス機能を有するものがある。このオートフォーカス機能を有するカムコーダでは、例えば撮像データの中に複数の人物が存在し、その中の一の人物を中心にして撮像する場合には、ユーザ所望の一の人物の顔領域(以下、これを選択顔領域と呼ぶ)をオートフォーカス機能の対象となるフォーカス対象として設定する必要がある。
このカムコーダの中には、タッチパネル機能を有する表示部に撮像データに基づく撮像画像を表示してユーザに選択顔領域を触れさせ、ユーザが触れた部分から検出した人物の顔領域をフォーカス対象に決定するようになされたものがある(例えば、特許文献1参照)。
特開2006−101186公報
ところでかかる構成のカムコーダでは、ユーザに選択顔領域を入力させるために、ユーザに片手でカムコーダを保持して選択顔領域を撮像させながら、ユーザに表示部を触れさせる必要があるため、ユーザに選択顔領域を入力させる操作が煩雑になってしまうという問題があった。
本発明は以上の点を考慮してなされたもので、簡易な操作でユーザ所望の一の検出顔領域をフォーカス対象に決定することができる撮像装置及びフォーカス対象決定方法を提案しようとするものである。
かかる課題を解決するため本発明においては、撮像対象の中から選定されたフォーカス対象に対して自動的にレンズの焦点を合わせるオートフォーカス部と、レンズを介して取得した撮像光に基づいて映像データを生成する映像データ生成部と、映像データに基づく撮像画像を表示する表示部と、映像データから人物の顔領域を検出顔領域として検出する顔領域検出部と、検出顔領域に対応するテキスト情報を映像データに重畳することにより、撮像画像における検出顔領域に対してテキスト情報を対応付けた状態で表示部に撮像画像を表示させるテキスト情報重畳部と、音声を入力する音声入力部と、検出顔領域のうち、ユーザ所望の一の検出顔領域に対応するテキスト情報を表す音声が音声入力部に入力された場合、当該テキスト情報に対応する検出顔領域をフォーカス対象に決定するフォーカス対象決定部とを設けるようにした。
これにより、ユーザの手を使用させることなく、ユーザに音声の入力によってユーザ所望の一の検出顔領域を入力させることができる。
また本発明においては、撮像対象の中から選定されたフォーカス対象に対して自動的にレンズの焦点を合わせ、レンズを介して取得した撮像光に基づいて映像データを生成し、映像データから人物の顔領域を検出顔領域として検出する顔領域検出ステップと検出顔領域に対応するテキスト情報を映像データに重畳することにより、撮像画像における検出顔領域に対してテキスト情報を対応付けた状態で映像データに基づく撮像画像を表示し、検出顔領域のうち、ユーザ所望の一の検出顔領域に対応するテキスト情報を表す音声が入力された場合、当該テキスト情報に対応する検出顔領域をフォーカス対象に決定するようにした。
これにより、ユーザの手を使用させることなく、ユーザに音声の入力によってユーザ所望の一の検出顔領域を入力させることができる。
本発明によれば、ユーザの手を使用させることなく、ユーザに音声の入力によってユーザ所望の一の検出顔領域を入力させることができ、かくして簡易な操作でユーザ所望の一の検出顔領域をフォーカス対象に決定することができる撮像装置及びフォーカス対象決定方法を実現できる。
以下、図面について、本発明の一実施の形態を詳述する。
(1)全体構成
(1−1)カムコーダの回路構成
図1において1は、全体としてカムコーダの回路構成ブロックを示し、図示しないCPU(Central Processing Unit )、ROM(Read Only Memory)及びRAM(Random Access Memory)から構成される制御部2がカムコーダ1の全体を統括的に制御するようになされている。制御部2は、ROM又はフラッシュメモリ4に格納されている各種基本プログラムやフォーカス対象決定プログラム等をRAMに展開することによって、これらのプログラムに基づいて各種処理や後述するフォーカス対象決定処理を実行するようになされている。
(1−1)カムコーダの回路構成
図1において1は、全体としてカムコーダの回路構成ブロックを示し、図示しないCPU(Central Processing Unit )、ROM(Read Only Memory)及びRAM(Random Access Memory)から構成される制御部2がカムコーダ1の全体を統括的に制御するようになされている。制御部2は、ROM又はフラッシュメモリ4に格納されている各種基本プログラムやフォーカス対象決定プログラム等をRAMに展開することによって、これらのプログラムに基づいて各種処理や後述するフォーカス対象決定処理を実行するようになされている。
カムコーダ1は、レンズ群7を介して取得した撮像光に基づいて映像データを生成する際に露光条件、焦点及びホワイトバランスなどの画像調整処理がユーザ所望の撮像対象に対して最適になるように自動制御するオートフォーカス機能を有している。
カムコーダ1は、このオートフォーカス機能を用いて撮像された映像データを音声データと共に撮像データとしてデータ記録部15に記録する。またカムコーダ1は、データ記録部15に記録された撮像データを再生したり、外部インターフェース17を介して外部装置に送出するようになされている。
具体的に制御部2は、図示しない電源ボタンが押下されると、ユーザから記録開始指示を待ち受ける記録準備処理を実行する。
制御部2は、図示しない測距センサを用いて撮像対象までの距離を測定することにより、焦点が撮像対象に合致するようにレンズ群7を制御してレンズ群7から撮像光を取り込むと共に、当該レンズ群7を通過してイメージセンサ8上で結像した撮像光を当該イメージセンサ8によって光電変換し、映像信号として映像データ生成部9へ送出する。
制御部2は、図示しない光量検出センサに基づいてシャッタ速度や絞りなどの露光条件が最適になるような値を算出し、これを次の露光条件として設定し、図示しないシャッタ機構及びレンズ群7を制御する。
制御部2は、供給された撮像信号に対して、映像データ生成部9によってAGC(Auto Gain Control)処理、及びガンマ補正処理やホワイトバランス調整処理、カラープロセス処理などの画像調整処理を施すことにより、映像データを生成する。
さらに制御部2は、映像データを表示部10へ送出することにより、表示部10に当該映像データに基づく撮像画像を表示させる。これにより制御部2は、ユーザに撮像画像を視認させることができ、ユーザに撮像データの記録を開始する準備をさせ得るようになされている。
そしてユーザの操作部5を介した操作入力により、記録を開始する旨の要求信号が供給されると、制御部2は記録処理を開始し、映像データを画像RAM11に一時記憶すると共に、当該画像RAM11から当該映像データを読み出して圧縮処理部12に供給する。
さらに制御部2は、マイク13によって集音されたカムコーダ1周辺の音声を音声信号として音声信号処理部14へ供給する。制御部2は、音声信号処理部14によって音声信号に対して各種補正処理、AGC処理及びアナログデジタル変換処理などを施すことにより音声データを生成し、当該音声データを圧縮処理部12へ送出する。
制御部2は、圧縮処理部12によって映像データ及び音声データに対してそれぞれ所定の圧縮処理を実行することにより撮像データを生成し、これをハードディスクドライブなどでなるデータ記録部15に供給して記録するようになされている。
一方制御部2は、ユーザの操作部5に対する操作入力に応じて、撮像データを再生する旨の表示要求信号が操作部5から供給されると、再生処理を開始し、データ記録部15から撮像データを読み出して圧縮処理部12へ送出する。
制御部2は、圧縮処理部12によって圧縮画像データを伸長して映像データ及び音声データをそれぞれ生成すると、当該映像データを表示部10に供給する。この結果、表示部10には、撮像データに基づく撮像画像が表示される。
さらに制御部2は、音声出力部16によって音声データに対してデジタルアナログ変換処理などを施し、図示しないスピーカから当該音声データに基づく音声を出力させる。
他方制御部2は、外部インターフェース17に例えばテレビジョンなどの外部機器(図示せず)が接続された状態で、撮像データを供給する旨の供給要求信号が当該外部インターフェース17から供給されると、データ記録部15から撮像データを読み出し、外部インターフェース17を介して当該撮像データを外部機器に供給するようになされている。
また制御部2は、タッチパネル機能を有する表示部10を介してユーザの要求を認識することができる。制御部2は、当該制御部2内の図示しないROMから読み出した画像データを表示部10に送出することにより、選択ボタンを有する図示しない選択画面を表示部10に表示する。
このとき制御部2は、表示部10から供給されるユーザの接触を検出した旨を表す操作入力信号により、ユーザが表示部10に表示された選択ボタンを介して操作入力したこと認識する。
また制御部2は、例えば表示部10に表示された選択ボタンにカーソルが重ねられた状態で操作部5の図示しない決定ボタンが操作されることにより、操作部5から操作入力信号が供給されると、ユーザが表示部10に表示された選択ボタンを介して操作入力したこと認識するようになされている。
(1−2)撮像対象モード
カムコーダ1では、風景や人物などの撮像対象となる撮像対象の種類に応じた複数の撮像対象モードを有している。カムコーダ1では、操作部5又は表示部10に対する操作入力によりユーザに撮像対象モードを選択させる。そしてカムコーダ1は、当該撮像対象モードにおいて撮像されると想定される種類の撮像対象に対して最適になるように焦点や露光条件を設定すると共に、当該撮像対象に対して最適になるように画像調整処理を施して上述したオートフォーカス機能を実行するようになされている。
カムコーダ1では、風景や人物などの撮像対象となる撮像対象の種類に応じた複数の撮像対象モードを有している。カムコーダ1では、操作部5又は表示部10に対する操作入力によりユーザに撮像対象モードを選択させる。そしてカムコーダ1は、当該撮像対象モードにおいて撮像されると想定される種類の撮像対象に対して最適になるように焦点や露光条件を設定すると共に、当該撮像対象に対して最適になるように画像調整処理を施して上述したオートフォーカス機能を実行するようになされている。
例えば撮像対象モードとして風景撮像対象モードが選択されていた場合、カムコーダ1は、映像データの全体をオートフォーカス機能の対象となるフォーカス対象に決定し、焦点深度が深くなるように露光条件を設定すると共に映像データの中心付近にある撮像対象に焦点を合わせ、さらに当該映像データの全体に対して最適になるように画像調整処理を施す。
これに対して撮像対象モードとして人物撮像対象モードが選択されていた場合には、カムコーダ1は、撮像対象としてユーザによって選択された一の人物の顔領域(以下、これを選択顔領域と呼ぶ)をフォーカス対象に決定し、当該フォーカス対象に対して最適な露光条件を設定すると共に、当該フォーカス対象に対して焦点を合わせ、当該フォーカス対象に対して最適になるように画像調整処理を施すようになされている。
本実施の形態では、撮像対象モードとして人物撮像対象モードが選択されていた場合、撮像データの記録処理を開始する際に、映像データから人物の顔領域を検出し、検出された顔領域(以下、これを検出顔領域と呼ぶ)に対してテキスト情報を対応付けて表示すると共に、選択顔領域に付加されたテキスト情報に基づいた音声をユーザに入力させることにより、当該選択顔領域をフォーカス対象に決定するようにしている。次に、かかるフォーカス対象決定処理について説明する。
(2)フォーカス対象決定処理
カムコーダ1の制御部2は、映像データから検出された各検出顔領域間の相対的な値である顔領域重要度に基づいて当該検出顔領域の順位付けを実行し、当該検出顔領域に対して対応付けられた順位をテキスト情報として表示する順位表示モードと、予め顔領域と当該顔領域の名称(以下、これを登録顔名称と呼ぶ)を対応付けて登録しておき、検出顔領域が当該登録された顔領域(以下、これを登録顔画像データと呼ぶ)と合致する場合に、当該登録顔画像データと対応付けられた登録顔名称を検証顔領域に対するテキスト情報として表示する顔名称表示モードとの2つの表示モードを有している。
カムコーダ1の制御部2は、映像データから検出された各検出顔領域間の相対的な値である顔領域重要度に基づいて当該検出顔領域の順位付けを実行し、当該検出顔領域に対して対応付けられた順位をテキスト情報として表示する順位表示モードと、予め顔領域と当該顔領域の名称(以下、これを登録顔名称と呼ぶ)を対応付けて登録しておき、検出顔領域が当該登録された顔領域(以下、これを登録顔画像データと呼ぶ)と合致する場合に、当該登録顔画像データと対応付けられた登録顔名称を検証顔領域に対するテキスト情報として表示する顔名称表示モードとの2つの表示モードを有している。
制御部2は、記録準備処理を実行中に、撮像対象モードが人物撮像対象モードに設定されると、人物撮像対象モードに移行し、例えば表示部10に2つの表示モード(順位表示モード及び顔名称表示モード)にそれぞれ対応する選択ボタンを表示させることにより、2つの表示モードからいずれかを選択するようにユーザに対して要求する。
制御部2は、ユーザの操作部5又は表示部10に対する操作入力により、一の表示モードが選択されると、選択された表示モードに移行し、フォーカス対象決定処理を開始する。
(2−1)顔角度の定義
カムコーダ1の制御部2は、フォーカス対象決定処理として、まず映像データから顔領域を検出する顔領域検出処理を実行する。ここで制御部2は、映像データから検出顔領域を検出する際に、検出顔領域が表す顔の角度である顔角度を検出顔領域の撮像対象としての重要性を表すパラメータPとして使用するようになされている。まず、この顔角度の定義について説明する。
カムコーダ1の制御部2は、フォーカス対象決定処理として、まず映像データから顔領域を検出する顔領域検出処理を実行する。ここで制御部2は、映像データから検出顔領域を検出する際に、検出顔領域が表す顔の角度である顔角度を検出顔領域の撮像対象としての重要性を表すパラメータPとして使用するようになされている。まず、この顔角度の定義について説明する。
図2(A)及び(B)に示すように、顔角度のうち、映像データに基づく撮像画像が表示部10に表示されたときに、当該撮像画像を有するXZ平面に垂直なY軸を中心に回転するロール(Roll)方向の角度をロール顔角度とする。
すなわち図3(A)に示すように、ロール顔角度は、鉛直方向の鉛直軸SPに対する顔領域FAの2つの目の中間と口の中心を結ぶ上下方向の軸(以下、これを顔上下軸FPと呼ぶ)の角度である。なお、当該顔上下軸FPが鉛直軸SPから時計回りに回転したときのロール顔角度を正、反時計回りに回転したときのロール顔角度を負とする。
例えば図3(B)に示すように、撮像画像におけるロール顔角度が時計回りに70°回転しているため、このときのロール顔角度は+70°となる。
また図2に示すように、顔上下軸FPを中心として回転する方向をヨー(Yaw)方向と定義し、このヨー方向における顔角度をヨー顔角度とする。このヨー顔角度は、目及び口を含んだ平面である顔領域FAとXZ平面との成す角度と定義する。
すなわち図4(A)に示すようにヨー顔角度は、顔領域FAが正面を向いている(当該顔領域FAがXZ平面上に存在する)ときに基準の0°となり、図2の顔領域FAより下方向からみて時計回りに回転したときに正、反時計回りに回転したときに負の角度となる。なおこのヨー顔角度は顔上下軸FPを回転軸としているため、図4(B)に示すように、上述したロール顔角度の変化に応じて顔上下軸FPの方向がXZ平面内で変化することになる。
例えば図4(C)に示すように、−40°のヨー角度を有する顔領域FA(破線で示す仮想平面YP上に存在)では、当該顔領域FAの正面が実線で示すXZ平面と比してヨー方向に−40°回転している。また、図4(D)に示すように、同じ−40°のヨー顔角度を有する顔領域FAであっても、顔上下軸FPが変化するとその回転方向(ヨー方向)も同様に変化することになる。
(2−2)順位表示モード
(2−2−1)顔領域の検出
カムコーダ1の制御部2(図1)は、ユーザの表示部10に対する操作入力により順位表示モードを選択する旨の要求がなされると、順位表示モードに移行し、フォーカス対象決定処理を開始する。
(2−2−1)顔領域の検出
カムコーダ1の制御部2(図1)は、ユーザの表示部10に対する操作入力により順位表示モードを選択する旨の要求がなされると、順位表示モードに移行し、フォーカス対象決定処理を開始する。
具体的に制御部2は、まず映像データから人物の顔領域を検出する顔領域検出処理を開始し、映像データ生成部9によって生成される映像データを表示部10ではなく、顔検出ブロック20の画像サイズ変換部22(図5)へ供給する。
顔検出ブロック20では、制御部2から供給される各種制御信号などに基づいてコントローラ21が画像サイズ変換部22、画像メモリ23、相関判別部24及び基準顔データ記憶部25を制御することにより、映像データから人物の顔領域FAを検出顔領域として検出する。
すなわち映像データ生成部9から撮像画像データが供給されると、画像サイズ変換部22は、コントローラ21から供給される倍率を表す画像サイズ信号に従って、撮像画像データが表す撮像画像を様々な画像サイズに変換してサイズ変換画像データを生成し、さらにこのサイズ変換画像データから例えば任意に抽出された基準点からの輝度差を算出することにより特徴画像データを生成する。
さらに画像サイズ変換部22は、特徴画像データを中心部分から順に所定のサイズに切り出して、切出特徴画像データを生成し、元の特徴画像データにおける当該切出特徴画像データの位置を表す座標情報及び当該切出特徴画像データの拡大率又は縮小率を表す倍率情報を当該切出特徴画像データに付加し、当該切出特徴画像データを画像メモリ23に送出する。
画像メモリ23は、コントローラ21から供給されるメモリアドレスに従って切出特徴画像データを一時記憶すると共に、当該コントローラ21から供給されるタイミング信号及びメモリアドレスに従って当該切出特徴画像データを読み出し、相関判別部24に送出する。
また基準顔データ記憶部25には、切出特徴画像データの比較対象となる基準顔データとして、様々な顔角度(ただしロール顔角度は0°)でなる複数の基準顔データと、当該基準顔データのヨー顔角度(以下、これを基準顔角度情報と呼ぶ)及び当該基準顔データにおける人物の顔領域FAの面積を表す基準顔面積情報とが対応付けられて記憶されている。この基準顔データは、例えば任意に抽出された基準点からの輝度差を表す特徴データとして記憶されている。
相関判別部24は、基準顔データ記憶部25に対して基準顔データを取得する旨の取得コマンドを送出する。基準顔データ記憶部25は、要求された基準顔データを相関判別部24に送出する。
そして相関判別部24は、基準顔データ記憶部25から基準顔データを順次取得すると共に、各基準顔データをロール方向における正又は負の方向(XZ平面上で時計回り及び反時計回り)に例えば1°刻みの回転角度で±90°まで回転させ、画像メモリ23から取得した切出特徴画像データと比較する。相関判別部24は、相関値が所定の一致閾値以上となる基準顔データが存在した場合には、この切出特徴画像データから検出顔領域が検出されたと判別する。
このように顔検出ブロック20は、切出特徴画像データの基準顔データに対する相関値に基づいて、当該切出特徴画像データに検出顔領域が存在するか否かを判別し得るようになされている。
このとき相関判別部24は、後述する顔領域重要度の算出に用いられるパラメータPとして、倍率情報と基準顔面積情報とから検出顔領域の面積(以下、これを顔領域面積と呼ぶ)P1を算出する。また相関判別部24は、倍率情報と切出特徴画像データの座標情報とを用いて、特徴画像データにおける中心から検出顔領域の中心点までの距離(以下、これを顔領域中心距離と呼ぶ)P2を算出する。さらに相関判別部24は、基準顔データに付加された基準顔角度情報及び相関値を顔領域重要度のパラメータP(P3及びP4)としてそれぞれ使用する。
そして相関判別部24は、検出顔領域が検出されたこと表す判別結果を制御部2に送出し、画像メモリ23から次の切出特徴画像データを取得して基準顔データとの比較を継続する。このとき制御部2は、判別結果と共に相関判別部24から供給された顔領域面積P1と、顔領域中心距離P2と、基準顔角度情報P3と、相関値P4と、座標情報と、検出顔領域が検出された切出特徴画像データ(以下、これを検出画像データと呼ぶ)とを対応付けて制御部2内の図示しないRAMに記憶する。
これに対して全ての基準顔データ及び当該基準顔データを回転させて比較したにも拘らず、相関値が所定の一致閾値以上となる基準顔データが存在しない場合には、相関判別部24は、当該特徴画像データに人物の顔領域が存在しないと判別し、画像メモリ23から次の切出特徴画像データを取得して各基準顔データとの比較を継続する。
そして相関判別部24は、全ての切出特徴画像データについて、基準顔データとの比較を終了すると、供給された映像データに対する人物の顔領域の検出を終了する。
このように顔検出ブロック20は、基準顔データと映像データを比較して、当該映像データから基準顔データと合致する部分を検出することにより、映像データから検出顔領域を検出し得るようになされている。
なお制御部2は、図6に示すように、1つの撮像画像データに多数(11人以上)の顔が存在する場合には、10人の顔を検出した時点で顔領域検出処理を終了し、次の処理へ移行することにより、顔の検出に過大な時間を要してしまうことを防止するようになされている。なお、図では検出顔領域を斜線で示しており、以下に示す図7及び図8についても同様とする。
(2−2−2)顔領域重要度の算出
次に、パラメータP(P1〜P4)を用いて、検出顔領域の順位付けに用いられる顔領域重要度を算出する顔領域重要度算出処理について説明する。
次に、パラメータP(P1〜P4)を用いて、検出顔領域の順位付けに用いられる顔領域重要度を算出する顔領域重要度算出処理について説明する。
すなわちカムコーダ1における制御部2の重要度算出部2A(図1)は、検出顔領域が検出された検出画像データに対応付けられた顔領域面積P1、顔領域中心距離P2、基準顔角度情報P3及び相関値P4を制御部2内の図示しないRAMから読み出す。
複数の人物が同時に撮像された映像データにおいては、図7に示すように、一般的に撮像の優先度が高い(すなわち撮像対象として撮像したい)人物がより手前にくることが多く、必然的に検出顔領域の面積が大きくなる。
従って、面積が大きい検出顔領域は他の検出顔領域と比較して、ユーザ(撮像者)が主に撮像したいと意図している可能性が高く、撮像対象としての重要性が高いと考えられる。そこで重要度算出部2Aは、顔領域面積P1が大きい検出顔領域に対する値が高くなるように面積評価値を算出する。
すなわち重要度算出部2Aは、顔領域面積P1に対して所定の重み付け係数W1を乗算することにより、各検出顔領域についての面積評価値を算出する。
また、複数の人物が同時に撮像された映像データにおいては、図7に示したように、一般的に撮像の主対象たる人物(図では人物B)が中心に位置することが多く、この主対象たる人物の検出顔領域の縦横方向は他の検出顔領域と比較して、ユーザが主に撮像したいと意図している可能性が高く、撮像対象としての重要性が高いと考えられる。
そこで重要度算出部2Aは、映像データが表す当該映像データの中心点から検出顔領域の中心までの距離を表す顔領域中心距離P2を用い、当該中心点に近い検出顔領域に対する値が高くなるように中心評価値を算出する。
すなわち重要度算出部2Aは、中心点に近い検出顔領域に対するレベルが高くなるように顔領域中心距離P2を例えば10段階にレベル分けし、当該レベルに対して所定の重み付け係数W2を乗算することにより、各検出顔領域についての中心評価値を算出する。
さらに複数の人物が同時に撮像された映像データにおいては、図7に示したように、一般的に撮像の主対象たる人物が正面(カムコーダ1の方向)を向いているとき(すなわちヨー顔角度が0°のとき、図では人物B)に合わせて撮像されている可能性が高く、一方でただの通行人など、撮像しようとしていない人物(図では人物A)は、全く異なる方向を向いている場合が多い。
従ってヨー顔角度の接待値が小さい検出顔領域は他の検出顔領域と比較して、ユーザが主に撮像したいと意図している可能性が高く、撮像対象としての重要性が高いと考えられる。そこで重要度算出部2Aは、基準顔角度情報P3が表す検出顔領域のヨー顔角度を用い、当該ヨー角度が0°に近く、検出顔領域が正面に向いているほど高くなるように正面評価値を算出する。
すなわち重要度算出部2Aは、検出顔領域が正面に向いているほど高くなるようにヨー顔角度の絶対値を例えば10段階にレベル分けし、当該レベルに対して所定の重み付け係数W3を乗算することにより、各検出顔領域についての正面評価値を算出する。
またカムコーダ1は、基準顔データとの一致率を表す相関値P4が高いほど、検出顔領域が間違いなく人物の顔である可能性(すなわち人物の顔らしさ)が高くなり、撮像対象としての重要性が高いと考えられる。そこで重要度算出部2Aは、検出顔領域についての相関値P4を用い、当該相関値P4が高いほど値が高くなるように相関評価値を算出する。
すなわち重要度算出部2Aは、相関値P4に対して所定の重み付け係数W4を乗算することにより、各検出顔領域についての相関評価値を算出する。
なお重要度算出部2Aは、各値に重み付け係数W1、W2、W3及びW4を乗算することにより、各評価値(面積評価値、中心評価値、相関評価値及び正面評価値)の水準を揃えると共に、各評価値を各評価値間における相対的な重要度に応じて重み付けするように重み付け係数W1、W2、W3及びW4の値を調整している。
そして重要度算出部2Aは、各評価値を加算することにより、検出画像データが表す各検出顔領域ごとに、映像データにおける他の検出顔領域と比較したときの当該検出顔領域の撮像対象としての重要性を総合的に表す顔領域重要度を算出することができる。
例えば図7では、中心に最も近くて顔面積が最も大きく、かつ正面を向いている人物Bは、人物Aや人物Cと相関値P4がほぼ同程度であれば、当該人物Aや人物Cよりも高い顔領域重要度を得ることになる。
(2−2−3)順位の表示及び音声入力
次に、上述した顔領域重要度に基づいて検出顔領域を順位付けすると共に、検出顔領域に対して順位を表示し、この順位をユーザに音声入力させる順位音声入力処理について、3つの検出顔領域が検出された場合を表す図8を例にとって説明する。
次に、上述した顔領域重要度に基づいて検出顔領域を順位付けすると共に、検出顔領域に対して順位を表示し、この順位をユーザに音声入力させる順位音声入力処理について、3つの検出顔領域が検出された場合を表す図8を例にとって説明する。
カムコーダ1の制御部2は、フォーカス対象決定部2Bによって検出顔領域を顔領域重要度の高い順に並べ替え、検出顔領域の順位付けを行う。フォーカス対象決定部2Bは、例えば図8の検出顔領域に対して、第1順位が人物B、第2順位が人物C、第3順位が人物Aというように順位付け、制御部2内のRAMに記憶する。
フォーカス対象決定部2Bは、顔領域重要度に基づいて順位付けを実行することにより、撮像対象としての重要性が高く、ユーザが選択顔領域として選択する可能性の高い検出顔領域の順位を高くすることができる。
そしてフォーカス対象決定部2Bは、最高順位(第1順位)に順位付けされた検出顔領域を選択顔領域の第1候補として選定すると共に、各検出顔領域に対する順位を対応付けた状態で撮像画像を表示部10に表示する。
すなわちフォーカス対象決定部2Bは、フラッシュメモリ4から検出顔領域に対応する顔領域面積P1及び座標情報を読み出し、当該顔領域面積P1及び座標情報に基づいて各検出顔領域よりも一回り大きくなるように枠画像データを生成すると共に、各検出顔領域の順位に応じて順位画像データを生成する。さらにフォーカス対象決定部2Bは、制御部2内の図示しないROMから選択要求画像データを読出し、当該枠画像データ、順位画像データ及び選択要求画像データを映像データに重畳して表示部10に供給する。
この結果図9に示すように、表示部10には、順位枠表示画面50が表示される。この順位枠表示画面50では、枠画像データに基づいて撮像画像における各検出顔領域(以下、これを検出顔画像と呼ぶ)DF(DFa〜DFc)の周囲を囲むほぼ正方形でなる枠画像FR(FRa〜FRc)が表示されると共に、順位画像データに基づいて各検出顔領域に付された順位を数字で示す順位テキストOP(OPa〜OPc)が枠画像FRa〜FRcと対応付けられて表示される。
また順位枠表示画面50は、選択要求画像データに基づいて、「フォーカスする顔を音声で選択してください。」という文字列を有する選択要求メッセージCTが表示される。これによりフォーカス対象決定部2Bは、選択顔領域を音声によって選択可能であることをユーザに対して確実に認識させ得るようになされている。
順位枠表示画面50は、検出顔画像DFを囲む枠画像FRの上中央に順位テキストOPが表示されている。これによりフォーカス対象決定部2Bは、枠画像FRの端部分に順位テキストOPを表示する場合と比較して、近接する検出顔領域に付された枠と最大限離れた位置に当該順位を表示することができるため、多数の検出顔領域が存在するような場合であっても、各検出顔領域に対する順位をユーザに極力誤認識させずに済む。
また順位枠表示画面50では、順位テキストOPとして数字のみが表示される。これによりフォーカス対象決定部2Bは、撮像画像を隠す領域を最小限に抑えることができる。
順位枠表示画面50では、検出顔画像DFに対して枠画像FRが表示されている。これによりフォーカス対象決定部2Bは、どの人物の顔領域を選択顔領域として選択可能であるかをユーザに一目で認識させることができる。
順位枠表示画面50では、第1順位である人物Bを除く他の人物A及びCに対する枠画像FR及び順位テキストOPが「赤色」及び「細枠」で表示されると共に、第1順位である枠画像FRbが他の枠画像FRa及びFRcよりも太い「太枠」、かつ「青色」で表示されている。
フォーカス対象決定部2Bは、第1順位となる検出顔領域に対応する枠画像FRを一つだけ異なる色や太さで表示することにより、第1順位の検出顔領域を他よりも目立たせ、選択顔領域の第1候補として選択されていることをユーザに認識させ得るようになされている。
フォーカス対象決定部2Bは、所定の選択時間(例えば5秒間)に渡って音声信号処理部14(図1)によって生成される音声データを音声判別部37に供給する。音声判別部37は、所定の音声認識処理により、入力された音声が順位枠表示画面50に表示中の順位(イチ、ニ、サン)に所定の語句「バン」を付加した文字列を表す「イチバン」、「ニバン」、「サンバン」であるか否かについて判別する。
音声判別部37は、表示中の順位テキストOPに対応する順位を表す音声が入力されたと判別すると、この入力された順位を表す順位信号をフォーカス対象決定部2Bに送出する一方、選択時間中に順位を表す音声が入力されなかったと判別すると、表示中の順位テキストOPに対応する順位を表す音声が入力されなかった旨を表す無入力信号をフォーカス対象決定部2Bに送信する。
フォーカス対象決定部2Bは、順位信号が供給されると、当該順位信号が表す順位に対応する検出顔領域をフォーカス対象に決定し、入力された順位でなる検出顔領域に対して「青色」及び「太枠」で表示するように枠画像データを生成すると共に、制御部2内のROMから決定通知画像データを読み出し、これらを映像データに重畳して表示部10に供給する。
この結果表示部10には、図10に示すように、決定通知画面51が表示される。この決定通知画面51は、例えばユーザによって「サンバン」と入力された場合を示しており、フォーカス対象が第3順位の人物Aの検出顔領域に決定されたため、人物Aの検出顔画像DFaに対する枠画像FRaが「青色」の「太枠」で表示されている一方、第1順位の人物Bの検出顔画像DFbに対する枠画像FRbが「細枠」の「赤色」で表示されている。さらに決定通知画面51には、決定画像データに基づいて、「3番をフォーカスします。」という文字列を有する決定通知メッセージDTが表示される
フォーカス対象決定部2Bは、フォーカス対象として決定した顔検出領域(人物A)についての枠画像FRaを「青色」及び「太枠」で表示することにより、フォーカス対象が決定されたことをユーザに対して感覚的に認識させると共に、決定通知メッセージDTに表示された文字列によりフォーカス対象が決定されたことをユーザに対して確実に通知することができる。
またフォーカス対象決定部2Bは、選択時間中に順位テキストOPに対応する順位を表す音声が入力されず、音声判別部37から無入力信号が供給された場合、第1順位である人物Bの検出顔領域をそのままフォーカス対象に決定する。このときフォーカス対象決定部2Bは、制御部2内のROMから決定画像データを読み出し、枠画像FR及び順位テキストOPを変更しないまま映像データに重畳することにより、「1番をフォーカスします。」という文字列を有するフォーカス対象決定画面(図示せず)を表示部10に表示させるようになされている。
これによりフォーカス対象決定部2Bは、一の検出顔領域を選択顔領域の第1候補として選定し、ユーザによる音声入力がない場合に当該第1候補である人物Aの検出顔領域をフォーカス対象として決定するため、当該第1候補をユーザが選択顔領域として選択する場合にユーザに何ら操作をさせることなく、フォーカス対象を決定し得るようになされている。
またフォーカス対象決定部2Bは、顔領域重要度に基づいて撮像対象としての重要性が高く、選択顔領域として選択される可能性の高い検出顔領域を当該選択顔領域の第1候補として選定するため、ユーザが選択顔領域を当該第1候補から変更するための音声入力を極力省略させ得るようになされている。
なおフォーカス対象決定部2Bは、ユーザに「イチ」、「ニ」、「サン」というように単に順位を表す数字をそのまま音声入力させるのではなく、「イチバン」、「ニバン」、「サンバン」というように数字に「バン」という短い語句を付加して入力させることにより、音声入力させる文字数を増加させて音声判別部37による音声認識処理の精度を向上させるようになされている。
このように、カムコーダ1では、映像データから検出された検出顔領域を撮像対象としての重要性を表す顔領域重要度に基づいて順位付けした上で、各検出顔領域に対して順位を対応付けて順位テキストOPとして表示すると共に、表示された順位テキストOPをユーザに音声入力させることにより、簡易な操作でユーザに選択顔領域を選択させ得るようになされている。
(2−3)顔名称表示モード
次に、顔名称表示モードにおけるフォーカス対象決定処理について説明する。この顔名称表示モードでは、予め撮像対象情報として顔領域及び当該顔領域の名称を対応付けて登録しておき、検出顔領域が当該登録された顔領域(以下、これを登録顔画像データと呼ぶ)であった場合、当該登録顔画像データに対応付けられた名称(以下、これを登録顔名称と呼ぶ)をテキスト情報である顔名称テキストNMとして表示する。
次に、顔名称表示モードにおけるフォーカス対象決定処理について説明する。この顔名称表示モードでは、予め撮像対象情報として顔領域及び当該顔領域の名称を対応付けて登録しておき、検出顔領域が当該登録された顔領域(以下、これを登録顔画像データと呼ぶ)であった場合、当該登録顔画像データに対応付けられた名称(以下、これを登録顔名称と呼ぶ)をテキスト情報である顔名称テキストNMとして表示する。
またこの顔名称表示モードでは、ユーザ(撮像者)の登録顔名称を表す音声(以下、これを顔名称音声と呼ぶ)を予め登録しておき、所定の音声識別処理によって入力された音声がユーザの音声と合致するか否かを判別するようになされている。
(2−3−1)撮像対象データベースへの登録
まず、フォーカス対象決定処理に先立って実行される撮像対象情報登録処理について説明する。
まず、フォーカス対象決定処理に先立って実行される撮像対象情報登録処理について説明する。
この顔領域登録処理では、まずユーザに優先順位を表す登録優先順位RNを選択させ、当該登録優先順位RNに対応付けて「登録顔名称」を登録すると共に、当該登録優先順位RNに対応付けて「登録顔画像データ」及び「顔名称音声」をそれぞれ登録するようになされている。
カムコーダ1のフラッシュメモリ4に(図1)は、撮像対象データベース(図示しない)が記録されている。この撮像対象データベースには、登録優先順位RNに対して、登録顔画像データに付されたファイル名と、当該登録顔画像データの名称などを表す登録顔名称と、顔名称音声に付されたファイル名とが撮像対象情報として登録される。なおこの撮像対象データベースはユーザごとに作成されるようになされている。
カムコーダ1の制御部2(図1)は、ユーザによる操作部5又は表示部10を介した操作入力により、撮像対象情報を登録する旨の要求がなされると、撮像対象登録処理を開始する。まず制御部2は、撮像対象情報登録部2Cによって撮像対象情報を対応付ける登録優先順位RNをユーザに選択させる。
具体的に撮像対象情報登録部2Cは、フラッシュメモリ4から撮像対象データベースを読み出すと、当該撮像対象データベースに基づいて登録番号画像データを生成し、表示部10に供給する。
この結果表示部10には、図11に示すように、登録番号画像データに基づく登録優先順位画面55が表示される。登録優先順位画面55では、登録優先順位RNが表示情報として表示される登録優先順位欄SNと、顔名称テキストNM若しくは登録顔名称が未登録であることを表示情報として表示するテキスト表示欄STと、登録顔画像データの登録の有無が表示情報として表示される顔登録有無表示欄SPと、顔名称音声の登録の有無が表示情報として表示される音声登録有無表示欄SVとが設けられており、登録優先順位RNごとにそれぞれ対応する表示情報が表示される。なお図11では、撮像対象データベースにいずれの情報も登録されていない場合を示している。
また登録優先順位画面55では、第1登録優先順位の登録優先順位RNに対応する表示情報にカーソルCNが重ねられており、当該第1登録優先順位の登録優先順位RNに対応する表示情報の周囲の色を他の登録優先順位RNとは異なる色で表示している。撮像対象情報登録部2Cは、操作部5又は表示部10を介してユーザにカーソルCNを移動させ、当該カーソルを任意の登録優先順位RNに移動させるようになされている。
撮像対象情報登録部2Cは、一の登録優先順位RNに対応する表示情報にカーソルCNが重ねられた状態で、操作部5又は表示部10を介してユーザから当該一の登録優先順位RNに顔領域を登録する旨の要求がなされると、ユーザに当該一の登録優先順位(以下、これを選択登録順位と呼ぶ)に対応する登録顔名称を登録させる。すなわち撮像対象情報登録部2Cは、制御部2内のROMからキーボード画像データを読み出し、これを表示部10に供給する。
なお撮像対象情報登録部2Cは、撮像対象データベースにおける選択登録順位に既に他の撮像対象情報が登録されている場合には、当該選択登録順位以降に登録されている撮像対象情報の登録優先順位RNを1つずつ繰り下げることにより、撮像対象情報を消去しないようになされている。
そして表示部10には、キーボード画像データに基づくキーボード画面(図示しない)が表示される。このキーボード画面には、50音順でなる平仮名がそれぞれに表示されたキーボードボタンと、入力されたテキストを登録顔名称として確定する旨を表す選択ボタンとが表示される。
撮像対象情報登録部2Cは、ユーザが表示部10に表示されたキーボードボタンを押下することによりユーザがこれから登録しようとしている顔領域に対する名称が入力された後、選択ボタンが押下されたことを認識すると、入力された名称を選択登録順位に対応付け、登録顔名称として撮像対象データベースに登録する。
また撮像対象情報登録部2Cは、ユーザに選択登録順位に対応する顔領域を撮像させ、これを登録顔画像データとして登録するようになされている。
すなわち撮像対象情報登録部2Cは、制御部2内のROMから撮像確認画像データを読み出し、これを映像データに重畳して表示部10に撮像確認画面(図示しない)を表示する。この撮像確認画面には、例えば「登録する顔の撮像を実行しますか」というユーザの登録顔画像データを撮像する意思を確認する文字列と、顔の撮像を実行する旨を表す選択ボタン及び顔の撮像を実行しない旨を表す選択ボタンが表示される。
撮像対象情報登録部2Cは、操作部5又は表示部10を介してユーザが顔の撮像を実行する旨を表す選択ボタンを押下したことを認識すると、制御部2内のROMから撮像用画像データを読み出し、これを映像データに重畳して表示部10に送出する。
この結果表示部10には、図12に示すように、登録顔撮像画面56が表示される。この登録顔撮像画面56では、撮像用画像データに基づいて、所定のサイズでなるほぼ正方形の枠である撮像用フレーム画像FSと「枠内に顔が入るように撮像してください。」という、枠内に顔が入った状態で撮像するようにユーザを促す文字列を有する撮像要請画像PTが表示される。
これにより撮像対象情報登録部2Cは、撮像要請画像PTによって表示された枠内に人物の顔が入った状態で撮像するようにユーザを促すことができるため、撮像される顔領域の画像サイズを一定範囲内に収めることができ、登録するのに適した画像サイズでなる顔領域が含まれる映像データを取得できる。また、映像データのどの部分に顔領域が存在するかを推定できるため、当該映像データから顔領域をわざわざ検出しなくても、顔領域を有する画像データを切出すことができる。
なお撮像対象情報登録部2Cは、操作部5又は表示部10を介して上述した撮像確認画面(図示しない)における顔の撮像を実行しない旨を表す選択ボタンが押下されたことを認識すると、顔領域の登録を中止し、ユーザに顔名称音声を登録させる(詳しくは後述する)。
そして操作部5を介してユーザから登録用の顔領域を撮像する旨の要求がなされると、撮像対象情報登録部2Cは、映像データから撮像用フレーム画像FSよりも一回り大きいサイズで画像データを切り出すと共に、制御部2内のROMから登録顔確認画像データを読み出し、切り出した顔領域(以下、これを切出顔領域と呼ぶ)を重畳して表示部10へ供給する。
この結果表示部10には、図13に示すように、登録顔確認画面57が表示される。登録顔確認画面57には、登録顔確認画像データに基づく登録顔確認画像CRに対して、切出顔領域画像RFが重ねられて表示される。
この登録顔画像データ確認画像CRには、「この顔を登録しますか?」という登録の可否をユーザに確認する確認文字列RTと、選択ボタンとしての了承ボタンYB及び非了承ボタンNBとが表示されている。
撮像対象情報登録部2Cは、操作部5又は表示部10からユーザが了承ボタンYBを押下したことを表す操作入力信号が供給されると、切出顔領域から例えば任意に抽出された基準点からの2点間の輝度差でなる特徴データを抽出し、これを登録顔画像データとしてフラッシュメモリ4に登録すると共に、当該登録顔画像データにファイル名を付し、当該登録顔画像データのファイル名を撮像対象データベースに登録する。
また撮像対象情報登録部2Cは、表示部10からユーザが非了承ボタンNBを押下したことを表す操作入力信号が供給されると、登録顔画像データ撮像画面56(図12)を再表示してユーザに登録用の顔領域を撮像させ直すようになされている。
さらに撮像対象情報登録部2Cは、ユーザ(撮像者)に対し、選択登録順位にテキスト情報として登録している登録顔名称に対応する顔名称テキストNMを表示し、当該顔名称テキストNMを読み上げさせることによりユーザに音声入力させ、このときのユーザの音声に基づく音声データを顔名称音声として選択登録順位に対応付けて登録するようになされている。
すなわち撮像対象情報登録部2Cは、制御部2内のROMから音声登録確認画像データを読み出し、これを表示部10に送出することにより音声入力確認画面(図示しない)を表示する。この音声入力確認画面には、例えば「音声データの登録を実行しますか」という顔名称音声を登録するユーザの意思を確認する文字列と、音声データの登録を実行する旨を表す選択ボタンと、音声データの登録を中止する旨を表す選択ボタンとが表示される。
撮像対象情報登録部2Cは、操作部5又は表示部10を介して音声入力確認画面における実行ボタンが押下されたことを認識すると、撮像対象データベースに登録されている登録顔名称に基づいて音声入力要求画像データを生成し、表示部10へ供給する。
この結果表示部10には、音声入力要求画像データに基づく音声入力要求画面(図示しない)が表示される。この音声入力要求画面では、例えば登録顔名称が「たろう」であった場合、「たろうと言ってください」というように「たろう」を表す音声を入力するようにユーザを促す文字列が表示される。
このとき撮像対象情報登録部2Cは、音声信号処理部14によって生成される音声データを音声判別部37に供給することにより、音声判別部37に所定の音声認識処理により、音声データから「たろう」という音声を表す部分を検出させる。
撮像対象情報登録部2Cは、検出された部分を顔名称音声としてフラッシュメモリ4に記録すると共に、当該顔名称音声にファイル名を付し、当該顔名称音声のファイル名を撮像対象データベースに登録して当該撮像対象データベースを更新する。撮像対象情報登録部2Cは、更新された撮像対象データベースに基づいて表示部10に登録順位表示画面55(図11)を表示する。
なお撮像対象情報登録部2Cは、操作部5又は表示部10を介して上述した音声入力確認画面に表示された中止を表す選択ボタンが押下されたことを認識した場合、顔名称音声の登録を中止し、音声の登録が終了したときと同様に撮像対象データベースに基づいて表示部10に登録順位表示画面55(図11)を表示する。
このとき撮像対象情報登録部2Cは、ユーザに操作部5を介して新たに選択登録順位を選択させ、当該新たな選択登録順位に対応する「登録顔名称」「登録顔画像データ」「顔名称音声」を引き続き登録させ得るようになされている。
なお図14に示す登録順位表示画面58では、第1〜第3登録優先順位に対して、顔名称テキストNM(「こうじ」、「たろう」及び「まま」)に対応する登録顔名称、登録画像データ及び顔名称音声がそれぞれ登録されている場合について示している。
そして撮像対象情報登録部2Cは、登録順位表示画面58が表示部10に表示された状態において、ユーザの操作部5を介した操作入力により、撮像対象情報の登録を終了する旨の要求がなされると、撮像対象情報登録処理を終了し、記録準備処理を再開するようになされている。
(2−3−2)ユーザの順位音声の登録
またこの顔名称表示モードにおいてカムコーダ1は、上述した登録顔画像データとして登録されていない顔領域を検出顔領域として検出した場合には、順位表示モードと同様に順位を表示する。この顔名称表示モードにおいてカムコーダ1は、ユーザ(撮像者)の順位を表す順位音声を予め登録しておき、所定の音声識別処理によって入力された音声が当該ユーザの音声と合致するか否かを判別するようになされている。次に、かかるユーザの順位音声の登録について説明する。
またこの顔名称表示モードにおいてカムコーダ1は、上述した登録顔画像データとして登録されていない顔領域を検出顔領域として検出した場合には、順位表示モードと同様に順位を表示する。この顔名称表示モードにおいてカムコーダ1は、ユーザ(撮像者)の順位を表す順位音声を予め登録しておき、所定の音声識別処理によって入力された音声が当該ユーザの音声と合致するか否かを判別するようになされている。次に、かかるユーザの順位音声の登録について説明する。
カムコーダ1の制御部2(図1)は、ユーザによる操作部5又は表示部10を介した操作入力により、順位音声を登録する旨の要求がなされると、順位音声登録処理を開始する。
フラッシュメモリ4は、ユーザによって入力される音声に基づく音声データのファイル名と、順位とが対応付けられて登録される順位音声ベースを有している。
具体的に撮像対象情報登録部2Cは、フラッシュメモリ4から順位音声ベースを読み出すと、当該順位音声ベースに基づいて順位音声登録画像データを生成し、表示部10に供給する。
この結果表示部10には、図15(A)に示すように、順位音声登録画像データに基づく順位音声登録画面60が表示される。順位音声登録画面60では、「“いちばん”といってください」という、ユーザに対して音声の入力を要求する文字列を有する音声入力要求メッセージETが表示されていると共に、順位を数字で表す順位数字を表示する順位数字表示欄ENと、順位音声の登録有無を表す順位音声登録有無表示欄EVとが表示されている。なお図15(A)では、順位音声ベースにいずれの情報も登録されていない場合を示している。
このとき撮像対象情報登録部2Cは、音声信号処理部14によって生成される音声データを音声判別部37に供給する。撮像対象情報登録部2Cは、所定の音声認識処理により、音声判別部37に音声データから「イチバン」という音声を表す部分を検出させる。
撮像対象情報登録部2Cは、検出された部分を順位音声としてフラッシュメモリ4に記録すると共に、当該順位音声にファイル名を付し、当該順位音声のファイル名を順位音声ベースに登録する。
撮像対象情報登録部2Cは、図15(B)に示すように、順位数字「1」に対応する順位音声登録有無表示欄EVに「登録済み」と表示すると共に、「“にばん”といってください」という音声入力要求メッセージETを表示することにより、次の順位数字についてユーザに音声の入力を順次要求する。
そして撮像対象情報登録部2Cは、ユーザによって例えば「1」〜「10」までの順位数字を表す順位音声が入力されると、順位音声登録処理を終了する。
(2−3−3)顔名称表示モードにおけるフォーカス対象決定処理
カムコーダ1の制御部2(図1)は、記録準備処理中において、ユーザによる操作部5を介した操作入力により顔名称表示モードを選択する旨の要求がなされると、顔名称表示モードに移行し、フォーカス対象決定処理を開始する。
カムコーダ1の制御部2(図1)は、記録準備処理中において、ユーザによる操作部5を介した操作入力により顔名称表示モードを選択する旨の要求がなされると、顔名称表示モードに移行し、フォーカス対象決定処理を開始する。
(2−3−3−1)登録顔画像データの検出
顔名称表示モードにおいてカムコーダの制御部2は、順位モードのときと同様に顔検出ブロック20(図1)によって顔領域検出処理を実行し検出顔領域を検出すると、登録顔画像データ判別ブロック30によって顔領域検出処理で検出した検出顔領域の中で、登録顔画像データとして登録されているものが存在するか否かについて判別する。
顔名称表示モードにおいてカムコーダの制御部2は、順位モードのときと同様に顔検出ブロック20(図1)によって顔領域検出処理を実行し検出顔領域を検出すると、登録顔画像データ判別ブロック30によって顔領域検出処理で検出した検出顔領域の中で、登録顔画像データとして登録されているものが存在するか否かについて判別する。
具体的に制御部2は、検出顔領域が検出された検出画像データを制御部2内のRAMから読み出し、これを登録顔判別ブロック30の画像サイズ変換部32(図16)に供給する。
顔検出ブロック30では、制御部2から供給される各種制御信号などに基づいてコントローラ31が画像サイズ変換部32、画像メモリ33、相関判別部34及び登録顔データ記憶部35を制御することにより、検出画像データから登録顔画像データを検出する。
すなわち制御部2内のRAMからコントローラ31を介して検出画像データ及び調整倍率情報が供給されると、画像サイズ変換部32は、当該調整倍率情報に従って、サイズ変換検出画像データを生成し、検出顔領域の画像サイズを登録顔画像データの画像サイズに合わせる。
画像メモリ33は、コントローラ31から供給されるメモリアドレスに従ってサイズ変換検出画像データを一時記憶すると共に、当該コントローラ21から供給されるタイミング信号及びメモリアドレスに従って当該サイズ変換検出画像データを読み出し、相関判別部34に送出する。
また制御部2は、フラッシュメモリ4から登録顔画像データを読み出し、登録顔データ記憶部35に供給する。
相関判別部24は、登録顔データ記憶部35に対して登録顔画像データを取得する旨の取得コマンドを送出する。登録顔データ記憶部35は、取得要求された登録顔画像データを相関判別部24に送出する。
そして相関判別部24は、登録顔データ記憶部35から登録顔画像データを順次取得すると共に、各登録顔画像データをロール方向における正及び負の方向(XZ平面上で時計回り及び反時計回り)に例えば1°刻みの回転角度で±90°まで回転させ、画像メモリ33から取得したサイズ変換検出画像データと比較する。
相関判別部34は、相関値が所定の登録閾値以上となるサイズ変換検出画像データが存在した場合には、サイズ変換検出画像データが表す検出顔領域と登録顔画像データとが合致したと判別し、合致判別結果を合致したと判別された登録顔画像データ(以下、これを合致登録顔画像データと呼ぶ)のファイル名と共に制御部2に送出する。
制御部2は、相関判別部24から供給された合致登録顔画像データと当該合致登録顔画像データと合致した検出顔領域(以下、これを合致判別検出顔領域と呼ぶ)とを対応付けてフラッシュメモリ4に記憶する。
これに対してサイズ変換検出画像データを回転させて比較したにも拘らず、相関値が所定の登録閾値以上となる登録顔画像データが存在しない場合には、相関判別部34は、当該サイズ変換検出画像データに合致する登録顔画像データが存在しないと判別し、画像メモリ33から次のサイズ変換検出画像データを取得して各登録顔画像データとの比較を継続する。
そしてコントローラ31は、全てのサイズ変換検出画像データと登録顔画像データとの比較を終了すると、登録顔画像データ検出処理を終了し、その旨を表す通知信号を制御部2に通知する。
(2−3−3−2)テキスト情報の表示及び音声の入力
顔名称表示モードにおいて、カムコーダ1の制御部2は、検出顔領域と合致すると判別された合致登録顔画像データに対応付けられた登録顔名称を顔名称テキストNMとして表示することにより、ユーザに登録顔名称を音声入力させ、当該登録顔名称に対応する検出顔領域をフォーカス対象に決定する。またこの顔名称表示モードでは、所定の音声識別処理により、音声入力された登録顔名称を表す音声が合致登録顔画像データに対応付けられたユーザの顔名称音声と合致する場合のみ当該登録顔名称に基づいてフォーカス対象を決定するようになされている。
顔名称表示モードにおいて、カムコーダ1の制御部2は、検出顔領域と合致すると判別された合致登録顔画像データに対応付けられた登録顔名称を顔名称テキストNMとして表示することにより、ユーザに登録顔名称を音声入力させ、当該登録顔名称に対応する検出顔領域をフォーカス対象に決定する。またこの顔名称表示モードでは、所定の音声識別処理により、音声入力された登録顔名称を表す音声が合致登録顔画像データに対応付けられたユーザの顔名称音声と合致する場合のみ当該登録顔名称に基づいてフォーカス対象を決定するようになされている。
すなわち制御部2は、登録顔判別ブロック30のコントローラ31から処理終了を表す通知信号が供給されると、フォーカス対象決定部2Bによって顔領域検出処理で検出された検出顔領域の全てが登録顔画像データであるか否かについて判別する。
フォーカス対象決定部2Bは、全ての検出顔領域が登録顔画像データであると判別した場合、撮像対象データベースから合致登録顔画像データに対応する登録顔名称を読み出すと共に、登録優先順位RNに従って各検出顔領域を順位付けし、第1順位の検出顔領域を選択顔領域の第1候補に選定する。
これによりフォーカス対象決定部2Bは、ユーザが主に撮像したいと意図する機会が多く、撮像対象としての重要性が高いと判別したため、高い登録優先順位RNに登録されている合致登録顔画像データに対応する合致判別検出顔領域を最高順位に順位付することができる。
フォーカス対象決定部2Bは、合致判別検出顔領域の顔領域面積P1及び倍率情報に基づいて、当該合致判別検出顔領域よりも一回り大きくなるように枠画像データを生成すると共に、読み出された登録顔名称に基づいて名称画像データを生成する。さらにフォーカス対象決定部2Bは、図示しないROMから選択要求画像データを読出し、当該枠画像データ、名称画像データ及び選択要求画像データを映像データに重畳して表示部10に供給する。
この結果図17に示すように、表示部10には、名前枠表示画面65が表示される。この名前枠表示画面65では、順位枠表示画面50と同様に枠画像データに基づいて、各検出顔画像DFの周囲を囲むほぼ正方形でなる枠画像FR(FRa〜FRc)が表示されると共に、名称画像データに基づいて顔名称テキストNMが表示されている。また順位枠表示画面50と同様に、第1順位である枠画像FRbが他の枠画像FRa及びFRcよりも太く、かつ異なる色で表示され、選択顔領域の選択を要求する選択要求メッセージCTが表示されている。
これによりフォーカス対象決定部2Bは、登録顔画像データの名称など、当該登録顔画像データに関連する顔関連情報である登録顔名称を顔名称テキストNMとして検出顔画像DFに対応付けて表示するため、各検出顔領域に無機的な数字を付加する場合と比較して、ユーザに対して機械的な印象を与えないようになされている。
フォーカス対象決定部2Bは、所定の選択時間(例えば5秒間)に渡って音声信号処理部14(図1)によって生成される音声データを音声判別部37に供給する。またフォーカス対象決定部2Bは、フラッシュメモリ4から顔名称音声を読み出して音声判別部37に供給する。
音声判別部37は、所定の音声識別処理により音声信号処理部14から入力される音声データから顔名称音声と合致する部分を検出する。ここで音声判別部37は、入力された音声データの一部が顔名称音声と合致したと判別すると、合致判別結果及び合致した顔名称音声のファイル名をフォーカス対象決定部2Bに送出する。
フォーカス対象決定部2Bは、撮像対象データベースを読み出して顔名称音声が表す登録顔名称を特定し、当該登録顔名称に対応する検出顔領域をフォーカス対象に決定し、順位表示モードのときと同様にフォーカス対象についての枠画像FRを「青色」の「太枠」で表示する。例えば図18では、ユーザによって「たろう」と音声入力された場合の例を示している。
また音声判別部37は、入力された音声データがいずれの顔名称音声とも合致しなかった場合、音声が入力されなかった旨を表す無入力信号をフォーカス対象決定部2Bに送出する。
フォーカス対象決定部2Bは、無入力信号が供給されると、第1順位である「こうじ」の検出顔領域をそのままフォーカス対象に決定すると、制御部2内のROMから決定画像データを読み出し、枠画像FR及び順位テキストOPを変更しないまま映像データに重畳することにより、「こうじをフォーカスします。」という文字列を有するフォーカス対象決定画面(図示せず)を表示部10に表示させるようになされている。
このときフォーカス対象決定部2Bは、ユーザによって設定された登録顔名称を顔名称テキストNMとして表示し、これをユーザに音声入力させる。すなわち表示される顔名称テキストNMを予めユーザが知っているため、フォーカス対象決定部2Bは、例えば近接する検出顔画像DFに対応付けられた顔名称テキストNMを読み上げさせることなく、ユーザが誤って音声入力してしまうことを防止でき、ユーザに登録顔名称を簡易に音声入力させ得るようになされている。
またフォーカス対象決定部2Bは、登録顔画像データと合致しない検出顔領域(以下、これを非合致判別検出顔領域と呼ぶ)が存在すると判別した場合、順位表示モードと同様にして顔領域重要度を算出し、当該顔領域重要度に基づいて当該非合致判別検出顔領域を順位付し、付された順位を当該非合致判別検出顔領域に対応する検出顔画像DFに対応付け、順位テキストOPとして表示するようになされている。
この場合フォーカス対象決定部2Bは、上述した重要度算出処理によって各検出顔領域に対する顔領域重要度を算出する。そしてフォーカス対象決定部2Bは、合致判別検出顔領域を非合致判別検出顔領域よりも優先して各検出顔領域の順位付けを実行する。
すなわちフォーカス対象決定部2Bは、合致判別検出顔領域を撮像対象データベースに登録された登録優先順位RNに従って並べ替え、非合致判別検出顔領域を顔領域重要度に従って並べ替える。
フォーカス対象決定部2Bは、非合致判別検出顔領域が合致判別検出顔領域の後になるように順位付けし、第1順位の検出顔領域を選択顔領域の第1候補として選定する。例えば合致判別検出顔領域が1つ、非合致判別検出顔領域が9つ存在する場合、フォーカス対象決定部2Bは、合致判別検出顔領域を第1順位とし、非合致判別検出顔領域を第2位〜第10位に順位付けする。
これによりフォーカス対象決定部2Bは、複数の検出顔領域のうち、ユーザ(撮像者)にとって撮像対象としての重要性が高いため、わざわざ登録顔画像データとして登録されており、ユーザによって選択顔領域として選定される可能性の高い検出顔領域の順位を高くすることができる。
さらにフォーカス対象決定部2Bは、撮像対象データベースから合致判別検出顔領域に対応する登録顔名称を読み出すと、検出顔領域の顔領域面積P1、座標情報、読み出された登録顔名称及び順位に応じ、各検出顔領域に対して枠画像データ及び順位画像データを生成すると共に、制御部2内のROMから選択要求画像データを読出し、当該枠画像データ、名称画像データ、順位画像データ及び選択要求画像データを映像データに重畳して表示部10に供給する。
この結果図19に示すように、表示部10に図6に対応する混合枠画面67が表示される。この混合枠画面67では、名前枠表示画面65と同様に、合致判別検出顔領域に対しては名称画像データに基づく顔名称テキストNMが表示される一方、非合致判別検出顔領域に対しては順位画像データに基づく順位テキストOPが表示される。
フォーカス対象決定部2Bは、所定の選択時間(例えば5秒間)に渡って音声信号処理部14(図1)によって生成される音声データを音声判別部37に供給する。またフォーカス対象決定部2Bは、フラッシュメモリ4から顔名称音声を読み出して音声判別部37に供給し、入力された音声データが撮像対象データベースに登録されている顔名称音声と合致するか、若しくは入力された音声データが順位音声データベースに登録されている順位音声と合致するか否かについて判別させる。
フォーカス対象決定部2Bは、ユーザによって顔名称テキストNMを表す音声が入力されたことにより、音声判別部37から入力される音声データが顔名称音声と合致したことを表す合致判別結果及び顔名称音声のファイル名が供給された場合、合致した顔名称音声に対応する登録画像データに合致した合致判別検出顔領域をフォーカス対象に決定する。
一方フォーカス対象決定部2Bは、ユーザによって順位テキストOPを表す音声が入力されたことにより、音声判別部37から入力される音声データが順位音声と合致したことを表す合致判別結果及び順位音声のファイル名が供給された場合、合致した順位音声に対応する登録画像データを特定し、当該登録画像データに対応する合致判別検出顔領域をフォーカス対象に決定する。
またフォーカス対象決定部2Bは、ユーザによる音声入力がなされなかったことにより、音声判別部37から音声入力がなかった旨の無入力判別結果が供給された場合、最高順位の検出顔領域(図では「たろう」)をフォーカス対象に決定する。
これによりフォーカス対象決定部2Bは、ユーザによって予め設定された登録優先順位RNに従って、ユーザが撮像する機会が多いため撮像対象としての重要性の高い人物の顔領域を選択顔領域の第1候補に選定でき、ユーザの音声入力を極力省略させることができる。
またフォーカス対象決定部2Bは、顔名称テキストNMだけでなく、非合致判別検出顔領域に対する順位テキストOPを表示するため、選択顔領域の選択肢を限定することなく、簡易な操作でユーザに選択顔領域を選択させることができる。
このように、カムコーダ1では、映像データから検出された検出顔領域のうち、合致判別検出顔領域に対し、撮像対象としての重要性を表す登録優先順位RNに基づいて順位付けした上で、各検出顔領域に対応する検出顔画像DFに対してユーザによって設定された登録顔名称に対応する顔名称テキストNMを付して表示すると共に、表示された顔名称テキストNMをユーザに音声入力させることにより、簡易な操作でユーザに選択顔領域を選択させ得るようになされている。
(3)フォーカス対象決定処理の手順
次に、フォーカス対象決定プログラムに従って実行される撮像対象情報登録処理及びフォーカス対象決定処理について、図20、図21、図22及び図23に示すフローチャートを用いて説明する。
次に、フォーカス対象決定プログラムに従って実行される撮像対象情報登録処理及びフォーカス対象決定処理について、図20、図21、図22及び図23に示すフローチャートを用いて説明する。
(3−1)撮像対象情報登録処理手順
まず、顔名称表示モードに使用される撮像対象情報を撮像対象データベースに登録する撮像対象情報登録処理手順RT1(図20)について説明する。
まず、顔名称表示モードに使用される撮像対象情報を撮像対象データベースに登録する撮像対象情報登録処理手順RT1(図20)について説明する。
カムコーダ1における制御部2の撮像対象情報登録部2Cは、記録準備処理中において、ユーザから撮像対象情報(登録顔画像データ、登録顔名称及び顔名称音声)を登録する旨の要求がなされたことを認識すると、ステップSP1へ移り、登録順位表示画面55(図11)を表示し、撮像対象情報を対応付ける一の登録優先順位RNが選択登録順位としてユーザによって選択されると、次のステップSP2へ移る。
ステップSP2において、撮像対象情報登録部2Cは、選択登録順位に既に撮像対象情報が登録済みか否かについて判別し、否定結果が得られた場合、次のステップSP4へ移る一方、肯定結果が得られた場合、ステップSP3へ移って登録されている撮像対象情報を1順位ずつ繰り下げ、次のステップSP4へ移る。
ステップSP4において、撮像対象情報登録部2Cは、登録する予定の人物に対する名称をテキスト情報としてユーザに入力させると、このテキスト情報を登録顔名称として撮像対象データベースに登録し、次のステップSP5へ移る。
ステップSP5において、撮像対象情報登録部2Cは、実行及び中止を表す選択ボタンを有する撮像確認画面(図示しない)を表示することにより、ユーザに登録顔画像データの撮像を実行する意思があるか否かを判別する。
ここでユーザによって中止を表す選択ボタンが押下されると、このことはユーザに登録顔画像データの撮像を実行する意思がないことを表しており、このとき撮像対象情報登録部2Cは、次のステップSP9へ移る。
これに対してステップSP5において実行を表す選択ボタンが押下されると、このことはユーザに登録顔画像データの撮像を実行する意思があることを表しており、このとき撮像対象情報登録部2Cは、次のステップSP6へ移る。
ステップSP6において、撮像対象情報登録部2Cは、登録顔撮像画面56(図12)を表示してユーザに登録顔画像データとして登録したい顔領域を撮像させると、次のステップSP7へ移る。
ステップSP7において、撮像対象情報登録部2Cは、映像データから顔領域を切出顔領域として切り出し、この切出顔領域を了承ボタンYB及び非了承ボタンNBを有する登録顔領域確認画面57(図13)に表示することにより、ユーザに当該切出顔領域を登録する意思があるか否かを判別する。
ここで否定結果が得られた場合、このことは切出顔領域を登録すべきでないことを表しており、このとき撮像対象情報登録部2Cは、ステップSP6へ戻り、顔領域の撮像をやり直す。
これに対してステップSP7において肯定結果が得られた場合、このことは切出顔領域を登録するべきであることを表しており、このとき撮像対象情報登録部2Cは、次のステップSP8へ移る。
ステップSP8において、撮像対象情報登録部2Cは、切出顔領域を登録顔画像データとして、撮像対象データベースにおける選択登録順位に対応付けて記録すると、次のステップSP9へ移る。
ステップSP9において、撮像対象情報登録部2Cは、顔名称音声の入力を実行する旨を表す選択ボタン及び顔名称音声の入力を中止する旨を表す選択ボタンを有する音声入力確認画面(図示せず)を表示することにより、ユーザに顔名称音声を入力する意思があるか否かについて判別する。
ここで否定結果が得られた場合、このことはユーザに音声を入力させる必要がないことを表しており、このとき撮像対象情報登録部2Cは、次のステップSP11へ移る。
これに対してステップSP9において肯定結果が得られた場合、このことはユーザに音声を入力させる必要があることを表しており、このとき撮像対象情報登録部2Cは、次のステップSP10へ移る。
ステップSP10において、撮像対象情報登録部2Cは、ステップSP4において選択登録順位に対応付けて登録した登録顔名称を顔名称テキストNMとして音声入力要求画面(図示しない)に表示し、ユーザに顔名称テキストNMを音声で入力させると、次のステップSP11へ移る。
ステップSP11において、撮像対象情報登録部2Cは、登録順位表示画面(図14)を表示し、ユーザによって別の登録優先順位RNが継続して選択されるか否かについて判別する。
ここで肯定結果が得られた場合、このことはユーザが撮像対象情報の登録を継続する意思を有していることを表しており、このとき撮像対象情報登録部2Cは、ステップSP1へ戻り、処理を継続する。
これに対してステップSP11において否定結果が得られた場合、このことはユーザが撮像対象情報の登録を終了する意思を有していることを表しており、このとき撮像対象情報登録部2Cは、終了ステップへ移り、撮像対象情報登録処理手順RT1を終了する。
(3−2)順位音声登録処理手順
次に、顔名称表示モードに使用される順位音声を順位音声ベースに登録する順位音声登録処理手順RT2(図21)について説明する。
次に、顔名称表示モードに使用される順位音声を順位音声ベースに登録する順位音声登録処理手順RT2(図21)について説明する。
カムコーダ1における制御部2の撮像対象情報登録部2Cは、記録準備処理中において、ユーザから順位音声を登録する旨の要求がなされたことを認識すると、ステップSP15へ移り、順位音声登録画面(図15)を表示し、ユーザによって音声が入力されると、次のステップSP16へ移る。
ステップSP16において、撮像対象情報登録部2Cは、入力された音声に基づく音声データから登録対象となる順位数字を表す順位音声を検出できたか否かを判別し、否定結果が得られた場合にはステップSP15へ戻り、処理を継続する。
これに対してステップSP16において肯定結果が得られた場合、検出された順位音声をフラッシュメモリ4に記録すると共に、当該順位音声のファイル名を順位音声ベースに登録し、次のステップSP17に移る。
ステップSP17において、撮像対象情報登録部2Cは、1〜10までの全ての順位数字について順位音声の登録が終了したか否かについて判別し、否定結果が得られた場合、ステップSP15に戻って処理を継続する一方、肯定結果が得られた場合には、終了ステップへ移り、順位音声登録処理手順RT2を終了する。
(3−3)順位表示モードにおけるフォーカス対象決定処理手順
次に、顔領域重要度に基づく順位を表示する順位表示モードにおけるフォーカス対象決定処理手順RT3(図22)について説明する。
次に、顔領域重要度に基づく順位を表示する順位表示モードにおけるフォーカス対象決定処理手順RT3(図22)について説明する。
カムコーダ1の制御部2は、記録準備処理中において撮像対象モードが人物撮像対象モードに設定されると、順位表示モード又は顔名称表示モードのいずれかを選択するようにユーザに対して要求し、ステップSP21へ移り、順位表示モードが選択されたか否かについて判別し、否定結果が得られた場合、終了ステップへ移る。
ここで肯定結果が得られた場合、制御部2は、ステップSP22へ移り、顔領域検出ブロック20によって映像データから人物の顔領域を検出顔領域として検出すると、次のステップSP23へ移る。
ステップSP23において、制御部2は、映像データから人物の顔領域として検出された検出顔領域が存在するか否かについて判別し、否定結果が得られた場合には終了ステップへ移る一方、肯定結果が得られた場合には、次のステップSP24へ移る。
ステップSP24において、制御部2は、顔領域重要度算出部2Aによって各検出顔領域の面積(すなわち検出顔領域の大きさ)を表す顔領域面積P1、撮像画像の中心から各検出顔領域までの距離(すなわち映像データにおける検出顔領域の位置)を表す顔領域中心距離P2、各検出顔領域の顔上下軸FPを軸とした回転(すなわち検出顔領域の正面度)を表すヨー顔角度(基準顔角度情報P3)、各検出顔領域の基準顔データに対する一致率(すなわち人物の顔らしさ)を表す相関値P4に基づいて、各評価値(面積評価値、中心評価値、正面評価値及び相関評価値)の値を算出すると、次のステップSP25へ移る。
ステップSP25において、制御部2は、顔領域重要度算出部2Aによって各評価値を加算することにより、検出顔領域ごとに当該検出顔領域の撮像対象としての総合的な重要性を各検出顔領域間の相対値として表す顔領域重要度を算出すると、次のステップSP26へ移る。
ステップSP26において、制御部2は、フォーカス対象決定部2Bによって顔領域重要度に従って各検出顔領域を順位付けし、次のステップSP27へ移る。
ステップSP27において、制御部2は、フォーカス対象決定部2Bによって撮像画像における各検出顔領域である検出顔画像DFに対して、順位を表す順位テキストOPを対応付けた順位枠表示画面50(図9)を表示部10に表示すると、次のステップSP28へ移る。
ステップSP28において、フォーカス対象決定部2Bは、所定の選択時間に渡って待ち受けた結果、表示された順位テキストOPを表す音声が入力されたか否かについて判別する。
ここで肯定結果が得られた場合、このことは入力された音声が表す順位に対応する検出顔領域をユーザが選択顔領域として選択したことを表しており、このとき制御部2は、次のステップSP29へ移り、音声に応じた検出顔領域をフォーカス対象に決定し、終了ステップに移る。
これに対してステップSP28において否定結果が得られた場合、このことはステップSP26において最高順位に順位付けた検出顔領域をユーザが選択顔領域として選択している可能性が高いことを表しており、このとき制御部2は、次のステップSP30へ移り、最高順位でなる検出顔領域をフォーカス対象に決定し、終了ステップに移る。
そして終了ステップにおいて、制御部2は、順位表示モードにおけるフォーカス対象決定処理手順RT3を終了する。
(3−4)顔名称表示モードにおけるフォーカス対象決定処理手順
次に、ユーザによって予め登録された顔名称テキストNMを表示する顔名称表示モードにおけるフォーカス対象決定処理手順RT4(図21)について説明する。
次に、ユーザによって予め登録された顔名称テキストNMを表示する顔名称表示モードにおけるフォーカス対象決定処理手順RT4(図21)について説明する。
カムコーダ1の制御部2(図1)は、記録準備処理中において撮像対象モードが人物撮像対象モードに設定されると、順位表示モード又は顔名称表示モードのいずれかを選択するようにユーザに対して要求し、ステップSP41へ移り、顔名称表示モードが選択されたか否かについて判別し、否定結果が得られた場合には、終了ステップへ移る。
ここで肯定結果が得られた場合、制御部2は、次のステップSP42へ移り、顔領域検出ブロック20によって映像データから人物の顔領域を検出顔領域として検出すると、次のステップSP43へ移る。
ステップSP43において、制御部2は、映像データから人物の顔領域として検出された検出顔領域が存在するか否かについて判別し、否定結果が得られた場合には終了ステップへ移る一方、肯定結果が得られた場合には、次のステップSP44へ移る。
ステップSP44において、制御部2は、登録顔判別ブロック30(図16)によって登録顔画像データと合致する検出顔領域を検出する。さらに制御部2は、全ての検出顔領域が登録顔画像データと合致した合致判別検出顔領域であるか否かについて判別する。
ここで肯定結果が得られた場合、このことは全ての検出顔領域が登録優先順位RNを用いて順位付け可能であるため、顔領域重要度を算出する必要がないことを表しており、このとき制御部2は、次のステップSP47へ移る。
これに対してステップSP44において否定結果が得られた場合、このことは登録顔画像データと合致しない非合致判別検出顔領域に対して顔領域重要度による順位付けを要することを表しており、このとき制御部2は、次のステップSP45へ移る。
ステップSP45において、制御部2は、顔領域重要度算出部2Aによって顔領域面積P1、顔領域中心距離P2、ヨー顔角度(基準顔角度情報P3)、相関値P4に基づいて、各評価値(面積評価値、中心評価値、正面評価値及び相関評価値)の値を算出すると、次のステップSP46へ移る。
ステップSP46において、制御部2は、顔領域重要度算出部2Aによって各評価値を加算することにより、検出顔領域ごとに顔領域重要度を算出すると、次のステップSP47へ移る。
ステップSP47において、制御部2は、フォーカス対象決定部2Bによって非合致判別検出顔領域よりも合致判別検出顔領域の順位が高くなるように、登録優先順位RNを顔領域重要度よりも優先させて順位付けすると、次のステップSP48へ移る。
ステップSP48において、制御部2は、フォーカス対象決定部2Bによって撮像画像における各検出顔領域である検出顔画像DFに順位を表す順位テキストOP又は登録顔名称を表す顔名称テキストNMを対応付けて表示すると、次のステップSP49へ移る。
ステップSP49において、制御部2は、フォーカス対象決定部2Bによって所定の選択時間の間に音声入力がなされた否かを判別し、否定結果が得られた場合には、ステップSP54へ移る一方、肯定結果が得られた場合には、ステップSP50へ移る。
ステップSP50において、制御部2は、フォーカス対象決定部2Bによって音声判別部37によって音声識別処理を実行し、次のステップSP51へ移る。
ステップSP51において、制御部2は、フォーカス対象決定部2BによってステップSP49において入力された音声に基づく音声データが顔名称テキストNMを表す顔名称音声と合致するか否かについて判別し、否定結果が得られた場合、次のステップSP52へ移る。
ステップSP52において、制御部2は、フォーカス対象決定部2Bによって入力された音声が検出顔画像DFに対して表示した順位テキストOPを表すユーザの顔名称音声と合致するか否かについて判別する。
これに対してステップSP52において肯定結果が得られた場合、このことは入力された音声が表す順位に対応する検出顔領域をユーザが選択顔領域として選択したことを表しており、このとき制御部2は、次のステップSP53へ移る。
またステップSP51において肯定結果が得られた場合、このことは入力された音声が表す登録顔名称に対応する登録画像データと合致した合致判別検出顔領域を、ユーザが選択顔領域として選択したことを表しており、このとき制御部2は、次のステップSP53へ移る。
ステップSP53において、制御部2は、フォーカス対象決定部2Bによって音声に応じた検出顔領域をフォーカス対象に決定し、終了ステップに移る。
これに対してステップSP52において否定結果が得られた場合、このことは入力された音声が登録されたユーザの音声でないことを表しており、このとき制御部2は次のステップSP54へ移る。
ステップSP54において、制御部2は、フォーカス対象決定部2Bによってユーザが選択顔領域として選択している可能性が高い最高順位に順位付けた検出顔領域をフォーカス対象に決定すると、終了ステップへ移る。
そして終了ステップにおいて、制御部2は、顔名称表示モードにおけるフォーカス対象決定処理手順RT4を終了する。
(4)動作及び効果
以上の構成において、カムコーダ1は、撮像対象の中から選定されたフォーカス対象に対して自動的にレンズの焦点を合わせるオートフォーカス機能を有し、レンズ群7を介して取得した撮像光に基づいて生成された映像データから人物の顔領域FAを検出顔領域として検出し、検出顔領域に対応するテキスト情報を映像データに重畳することにより、当該映像データに基づく撮像画像における検出顔領域にテキスト情報を対応付けた状態で撮像画像を表示させ、検出顔領域のうち、ユーザ所望の一の検出顔領域である選択顔領域に対応するテキスト情報を表す音声が入力された場合、当該テキスト情報に対応する検出顔領域をフォーカス対象に決定するようにした。
以上の構成において、カムコーダ1は、撮像対象の中から選定されたフォーカス対象に対して自動的にレンズの焦点を合わせるオートフォーカス機能を有し、レンズ群7を介して取得した撮像光に基づいて生成された映像データから人物の顔領域FAを検出顔領域として検出し、検出顔領域に対応するテキスト情報を映像データに重畳することにより、当該映像データに基づく撮像画像における検出顔領域にテキスト情報を対応付けた状態で撮像画像を表示させ、検出顔領域のうち、ユーザ所望の一の検出顔領域である選択顔領域に対応するテキスト情報を表す音声が入力された場合、当該テキスト情報に対応する検出顔領域をフォーカス対象に決定するようにした。
これによりカムコーダ1は、従来のカムコーダ1を保持して撮像対象を撮像しているユーザに対して撮像画像が表示された表示部10を触れさせたり、操作部5を操作させる方法と比較して、手を用いた操作入力を必要としないため、選択顔領域に対応するテキスト情報をユーザに音声入力させるだけの簡易な操作で選択顔領域をフォーカス対象に決定することができるため、選択顔領域を入力する際のユーザの誤操作を防止することができる。
またカムコーダ1は、検出顔領域を撮像対象としての重要性に基づいて順位付けし、テキスト情報を表す音声が入力されなかった場合に、最高順位に順位付した検出顔領域をフォーカス対象に決定するようにしたことにより、ユーザが主に撮像したいと考える撮像対象としての重要性が高く、選択顔領域としてユーザに選択される可能性の高い検出顔領域を最高順位に順位付けすることができ、ユーザに音声を入力させる操作を極力省略させることができる。
さらにカムコーダ1は、各検出顔領域間における撮像対象としての重要性の相対的な値である顔領域重要度に基づいて検出顔領域を順位付けし、当該検出顔領域に付された順位をテキスト情報である順位テキストOPとして対応付けて表示することにより、検出顔領域の中でユーザが主に撮像したかった可能性の高い検出顔領域を最高順位に順位付することができ、ユーザによって音声入力されない場合であっても、ユーザの意思に合う可能性の高い撮像対象をフォーカス対象に決定することができる。
またカムコーダ1は、撮像対象として予め登録された登録顔画像データと当該顔画像データに関する文字情報としての顔関連情報である登録顔名称とを対応付けて記録しておき、検出顔領域が登録顔画像データと合致するか否かを判別し、登録顔画像データと合致すると判別された合致判別検出顔領域に対応する登録顔名称をテキスト情報である顔名称テキストNMとして表示するようにした。
これによりカムコーダ1は、ユーザ自身によって設定された登録顔名称をユーザに音声入力させれば良いため、ユーザが画面に表示された文字(顔名称テキストNM)を正確に読んでいなくても人物の名前を呼ぶだけでフォーカス対象を決定することができるため、ユーザにわざわざ表示部10を注視させて選択顔領域に付されたテキスト情報を読み上げさせる必要がなく、例えば老眼で細かい文字を認識しづらいユーザに対してテキスト情報を認識させる負荷を軽減することができる。
またカムコーダ1は、登録顔名称として任意の名称をユーザに登録させることができるため、例えば「まま」のように、登録顔名称としてユーザが人物に対して日常使用している呼称や愛称を登録させることができる。これによりカムコーダ1は、ユーザに登録顔名称を表す顔名称テキストNMを違和感なく音声入力させることができる。
さらにカムコーダ1は、ユーザによって設定された登録顔画像データの優先順位を表す登録優先順位RNを登録顔画像データと対応付けて記録し、合致判別検出顔領域に対応する登録優先順位RNに従って検出顔領域を順位付することにより、ユーザ所望の選択顔領域を最高順位に順位付することができる。
またカムコーダ1は、合致判別検出顔領域に対しては当該合致判別検出顔領域に対応する登録優先順位RNに基づいて顔名称テキストNMを表示し、登録顔画像データと合致しないと判別された非合致判別検出顔領域に対しては、顔領域重要度に基づいて順位テキストOPを表示することにより、合致判別検出顔領域に対応する顔名称テキストNMのみを表示する場合と比較して、選択顔領域として選択可能な検出顔領域を制限しないでユーザ自身によって設定された顔名称テキストNMをユーザに音声入力させることができる。
さらにカムコーダ1は、非合致判別検出顔領域よりも合致判別検出顔領域を優先して順位付することにより、合致判別検出顔領域の撮像対象としての重要性を非合致判別検出顔領域よりも高く設定したため、例えば運動会や合唱発表会のように多数の人物を撮像するような場合であっても、予め登録された撮像機会の多い合致判別検出顔領域を最高順位にすることができ、ユーザが音声を入力する操作を極力省略させることができる。
以上の構成によれば、カムコーダ1は、検出顔領域に対してテキスト情報を対応付けて表示し、ユーザ所望の選択顔領域に対応する当該テキスト情報をユーザに読み上げさせることにより音声が入力されると、当該音声が表すテキスト情報に対応する検出顔領域をフォーカス対象に決定することにより、撮像中のユーザに手を使用させることなく選択顔領域を入力させることができるため、簡易な操作でユーザ所望の選択顔領域をフォーカス対象に決定することができる撮像装置及びフォーカス対象決定方法を実現することができる。
(5)他の実施の形態
なお上述の実施の形態においては、撮像対象の重要性である顔領域重要度又は登録優先順位RNに基づいて検出顔領域を順位付けするようにした場合について述べたが、本発明はこれに限らず、必ずしも検出顔領域を順位付ける必要はなく、例えば検出顔領域の右端から順に番号を振るようにしても良い。
なお上述の実施の形態においては、撮像対象の重要性である顔領域重要度又は登録優先順位RNに基づいて検出顔領域を順位付けするようにした場合について述べたが、本発明はこれに限らず、必ずしも検出顔領域を順位付ける必要はなく、例えば検出顔領域の右端から順に番号を振るようにしても良い。
また上述の実施の形態においては、順位表示モードにおいて、音声認識処理によって入力された音声データから順位を表す音声データを検出するようにした場合について述べたが、本発明はこれに限らず、順位音声登録処理によって入力された音声がフラッシュメモリ4に記録された順位音声と合致するか否かを判別し、合致した場合にのみ当該音声が表す順位をフォーカス対象とするようにしても良い。
さらに上述の実施の形態においては、顔名称表示モードにおいて、入力された音声が予め登録された順位音声と合致するか否かを判別するようにした場合について述べたが、本発明はこれに限らず、例えば音声認識処理により、入力された音声から登録された登録顔名称を表す音声が入力されたか否かを判別し、入力されたと判別した場合にのみ当該音声が表す順位をフォーカス対象とするようにしても良い。
さらに上述の実施の形態においては、顔名称表示モードにおいて、登録優先順位RNに従って合致判別検出顔領域を順位付けするようにした場合について述べたが、本発明はこれに限らず、顔領域重要度に基づいて順位付けしても良い。
さらに上述の実施の形態においては、顔名称表示モードにおいて、合致判別検出顔領域を非合致判別検出顔領域よりも優先して順位付けするようにした場合について述べたが、本発明はこれに限らず、例えば登録優先順位RNの逆数に対して所定の重み付け係数Kを乗算し、当該乗算値と顔領域重要度とに従って順位付するようにしても良く、このとき重み付け係数Kの設定によって、合致判別検出顔領域の重要性を非合致判別検出顔領域よりも高く設定することができる。
さらに上述の実施の形態においては、決定したフォーカス対象に対して自動的に焦点、露出条件及び画像調整処理を合わせるようにした場合について述べたが、本発明はこれに限らず、例えば図24に示すように、レンズ群7を制御することにより、フォーカス対象を自動的にズームアップするようにしても良い。また、例えばフォーカス対象に焦点のみを合わせるようにすることもできる。
さらに上述の実施の形態においては、順位枠表示画面50に枠画像FRを表示し、当該枠画像FRの上に順位テキストOPを表示するようにした場合について述べたが、本発明はこれに限らず、必ずしも枠画像FRを表示する必要はなく、検出顔領域の近傍に順位テキストOPのみを表示するようにしても良い。
またカムコーダ1は、例えば図25に示す順位枠表示画面70のように、枠画像FRzの端、右上部分に順位テキストOPを表示しても良い。これにより、順位テキストOPと検出顔領域とを同じ枠画像FRzの内部に表示することができるため、図19のように多数の検出顔領域が存在する場合であっても、ユーザが順位を誤認識することを確実に防止することができる。
さらにカムコーダ1は、例えば図26に示す順位枠表示画面71のように、真円又は楕円でなる枠画像FRyを表示しても良い。このときカムコーダ1のフォーカス対象決定部2Bは、枠画像FRyの外側部分にフェーズ処理を施した映像データに対して枠画像データ、順位テキストデータ及び選択要求画像データを重畳しても良い。これによりカムコーダ1は、検出顔領域、順位テキストOP及び選択要求画像CTを明確に、他の部分を曇らせて表示することができるため、検出顔領域、順位テキストOP及び選択要求画像CTを順位枠表示画面71から浮き立たせ、ユーザに視認させやすくできる。また順位テキストOPとして、ユーザに音声入力させる「イチバン」「ニバン」と同じ音声を表す「1番」「2番」を表示しても良い。
さらに上述の実施の形態においては、順位を表す「イチ、ニ、サン」に対して「バン」を付加した音声をユーザに入力させるようにした場合について述べたが、本発明はこれに限らず、順位を表す「イチ、ニ、サン」をそのままユーザに音声入力させるようにしても良い。
さらに上述の実施の形態においては、ユーザ(撮像者)ごとに撮像対象情報データベース及び順位音声ベースを有するようにした場合について述べたが、本発明はこれに限らず、各一つの撮像対象情報データベース及び順位音声ベース内に音声を入力するユーザを対応付けるようにしても良い。
さらに上述の実施の形態においては、顔関連情報として、登録顔画像データの名称である登録顔名称をユーザに登録させるようにした場合について述べたが、本発明はこれに限らず、例えば登録顔画像データを連想させる言葉や、当該登録顔画像データの略称など、登録顔画像データに関連するようなテキスト情報をユーザに登録させるようにしても良い。
さらに上述の実施の形態においては、順位音声登録処理において、1番〜10番までの順位音声を登録するようにした場合について述べたが、本発明はこれに限らず、例えば「“バン”と言ってください。」と表示された図示しない音声登録画面を表示部10に表示することにより、ユーザに「バン」と発音させ、これをフラッシュメモリ4に登録するようにしても良い。このときカムコーダ1は、順位数字部分(イチ、ニ・・・)を音声認識処理によって検出すると共に、「バン」部分が登録されているユーザの音声データと合致するか否かを判別することができる。これによりカムコーダ1は、ユーザの音声入力の回数を低減させることができる。
さらに上述の実施の形態においては、10以上の検出顔領域が存在する映像データについては、10までの検出顔領域を検出するようにした場合について述べたが、本発明はこれに限らず、例えば5までの検出顔領域を検出したり、全ての検出顔領域を検出するようにしても良い。
さらに上述の実施の形態においては、基準顔データに予め付加された円又は楕円状でなる顔領域FAを検出するようにした場合について述べたが、本発明はこれに限らず、例えば顔の一部分でなる顔領域FAを四角形状に検出したり、顔よりも大きい顔領域FAを顔領域FAとして検出するようにしても良い。
さらに上述の実施の形態においては、検出顔領域の大きさと、映像データにおける検出顔領域の位置と、検出顔領域の正面度(ヨー顔角度)と、人物の顔らしさとに基づいて、検出顔領域の重要度を総合的に表す顔領域重要度を算出するようにした場合について述べたが、本発明はこれに限らず、少なくともいずれか一つに基づいて顔領域重要度を算出すれば良く、その組み合わせに制限はない。また、他の重要度の因子(例えばロール顔角度など)を用いて顔領域重要度を算出するようにしても良い。
さらに上述の実施の形態においては、検出顔領域の大きさとして、検出顔領域の面積を用いるようにした場合について述べたが、本発明はこれに限らず、例えば検出顔領域の縦又は横の最大長さなどを用いるようにしても良い。
さらに上述の実施の形態においては、映像データにおける検出顔領域の位置として撮像画像の中心から各検出顔領域までの中心距離を用いるようにした場合について述べたが、本発明はこれに限らず、例えば検出顔領域の座標などを用いるようにしても良い。
さらに上述の実施の形態においては、検出顔領域の正面度として、ヨー顔角度を用いるようにした場合について述べたが、本発明はこれに限らず、例えば検出顔領域が有する2つの目における黒目部分及び白目部分の相対的な位置関係(すなわち黒目が目全体のどの位置にあるか)とヨー顔角度から、当該検出顔領域を有する人物が実際に見ている方向を目線角度として算出し、これを検出顔領域の正面度として用いるようにしても良い。
さらに上述の実施の形態においては、人物の顔らしさとして基準顔データとの一致率を表す相関値P4を用いるようにした場合について述べたが、本発明はこれに限らず、例えば検出顔領域と人物の顔と比較的類似している犬、猫などの顔データとを比較し、これらとの一致率を相関値P4から減算するようにしても良い。
さらに上述の実施の形態においては、フォーカス対象決定プログラムをROM又はフラッシュメモリ4に予め格納するようにした場合について述べたが、本発明はこれに限らず、メモリースティック(ソニー株式会社の登録商標)などの外部記憶媒体からフラッシュメモリ4などにインストールするようにしても良い。また、フォーカス対象決定プログラムをUSB(Universal Serial Bus)やEthernet(登録商標)、IEEE(Institute of Electrical and Electronics Engineers)802.11a/b/gなどの無線LAN(Local Area Network)を介して外部から取得するようにしても良い。
さらに上述の実施の形態においては、オートフォーカス部としての制御部2と、映像データ生成部としての映像データ生成部9と、表示部としての表示部10と、顔領域検出部としての顔検出ブロック20と、テキスト情報重畳部及びフォーカス対象決定部としてのフォーカス対象決定部2Bと、音声入力部としてのマイク13とによって撮像装置としてのカムコーダ1を構成するようにした場合について述べたが、本発明はこれに限らず、その他種々の構成でなるオートフォーカス部と、映像データ生成部と、表示部と、顔領域検出部と、テキスト情報重畳部と、フォーカス対象決定部とによって本発明の撮像装置を構成するようにしても良い。
本発明は、例えばデジタルスチルカメラ及び携帯電話など撮像機能を有する種々の電子機器に利用することができる。
1……カムコーダ、2……制御部、2A……顔領域重要度算出部、2B……フォーカス対象決定部、2C……撮像対象情報登録部、4……フラッシュメモリ、5……操作部、7……レンズ群、8……イメージセンサ、9……映像データ生成部、10……表示部、12……圧縮処理部、13……マイク、14……音声信号処理部、20……顔検出ブロック、30……登録顔判別ブロック、37……音声判別部、NM……顔名称テキスト、FR……枠画像、OP……順位テキスト、FP……顔上下軸。
Claims (17)
- 撮像対象の中から選定されたフォーカス対象に対して自動的にレンズの焦点を合わせるオートフォーカス部と、
上記レンズを介して取得した撮像光に基づいて映像データを生成する映像データ生成部と、
上記映像データに基づく撮像画像を表示する表示部と、
上記映像データから人物の顔領域を検出顔領域として検出する顔領域検出部と、
上記検出顔領域に対応するテキスト情報を上記映像データに重畳することにより、上記撮像画像における上記検出顔領域に対して上記テキスト情報を対応付けた状態で上記表示部に上記撮像画像を表示させるテキスト情報重畳部と、
音声を入力する音声入力部と、
上記検出顔領域のうち、ユーザ所望の一の検出顔領域に対応する上記テキスト情報を表す音声が上記音声入力部に入力された場合、当該テキスト情報に対応する上記検出顔領域を上記フォーカス対象に決定するフォーカス対象決定部と
を具えることを特徴とする撮像装置。 - 上記検出顔領域を上記撮像対象としての重要性に基づいて順位付けする順位付部
を具え、
上記フォーカス対象決定部は、
所定の選択時間内に上記音声入力部に上記テキスト情報を表す音声が入力されなかった場合、上記順位付けした検出顔領域のうち、最高順位に順位付けした検出顔領域を上記フォーカス対象に決定する
ことを特徴とする請求項1に記載の撮像装置。 - 各上記検出顔領域間における上記重要性の相対的な値である顔領域重要度を算出する算出部
を具え、
上記順位付部は、
上記顔領域重要度に基づいて上記検出顔領域を順位付けし、
上記テキスト情報重畳部は、
各上記検出顔領域に付された順位に基づいて上記テキスト情報を対応付ける
ことを特徴とする請求項2に記載の撮像装置。 - 上記撮像対象として予め登録された登録顔画像データと当該登録顔画像データに関する文字情報である顔関連情報とを対応付けて記憶する記憶部と、
上記検出顔領域が上記登録顔画像データと合致するか否かを判別する登録顔判別部と
を具え、
上記テキスト情報表示部は、
上記登録顔画像データと合致すると判別された上記検出顔領域に対して、上記顔関連情報に基づく上記テキスト情報を対応付ける
ことを特徴とする請求項1に記載の撮像装置。 - 上記撮像対象として予め登録された登録顔画像データと上記ユーザによって設定された当該登録顔画像データの優先順位を表す登録優先順位とを対応付けて記憶する記憶部と、
上記検出顔領域が上記登録顔画像データと合致するか否かを判別する登録顔判別部と
を具え、
上記順位付部は、
上記登録顔画像データに対応する上記登録優先順位に従って上記検出顔領域を順位付けする
ことを特徴とする請求項2に記載の撮像装置。 - 上記撮像対象として予め登録された上記テキスト情報を表す上記ユーザの音声データを記憶する記憶部と、
上記検出顔領域が上記登録顔画像データと合致するか否かを判別する登録顔判別部と、
上記音声入力部に入力された入力音声が上記ユーザの音声データと合致するか否かを判別する音声判別部と
を具え、
上記フォーカス対象決定部は、
上記入力音声が上記ユーザの音声データと合致した場合、当該音声が表す上記テキスト情報に対応する上記検出顔領域をフォーカス対象に決定する
ことを特徴とする請求項2に記載の撮像装置。 - 上記フォーカス対象決定部は、
所定の選択時間内に入力された上記入力音声が上記ユーザの音声データと合致しない場合、上記順位付けした顔領域のうち、最高順位に順位付けした顔領域を上記フォーカス対象に決定する
ことを特徴とする請求項6に記載の撮像装置。 - 撮像対象として予め登録された登録顔画像データとユーザによって設定された当該登録顔画像データの優先順位を表す登録優先順位と、当該登録顔画像データに関連する顔関連情報とを対応付けて記憶する記憶部と、
上記検出顔領域が上記登録顔画像データであるか否かを判別する登録顔判別部と
を具え、
上記テキスト情報重畳部は、
上記登録顔画像データであると判別された上記検出顔領域に対しては上記登録顔画像データに対応する顔関連情報を対応付け、上記登録顔画像データでないと判別された上記検出顔領域に対しては、各上記検出顔領域間における上記重要性の相対的な値である顔領域重要度に基づいて上記テキスト情報を対応付ける
ことを特徴とする請求項2に記載の撮像装置。 - 上記順位付部は、
上記登録顔画像データと合致すると判別された上記検出顔領域に対する上記重要性を上記登録顔画像データと合致しないと判別された上記検出顔領域に対する上記重要性よりも高く設定する
を具えることを特徴とする請求項8に記載の撮像装置。 - 上記テキスト情報重畳部は、
上記撮像画像における上記検出顔領域の周囲を囲む枠画像を付加した状態で上記表示部に上記撮像画像を表示させる
ことを特徴とする請求項1に記載の撮像装置。 - 上記順位付部は、
上記検出顔領域の大きさに基づいて上記顔領域重要度を算出する
を具えることを特徴とする請求項3に記載の撮像装置。 - 上記順位付部は、
上記映像データにおける上記検出顔領域の位置に基づいて上記顔領域重要度を算出する
ことを特徴とする請求項3に記載の撮像装置。 - 上記順位付部は、
上記検出顔領域の正面度に基づいて上記顔領域重要度を算出する
ことを特徴とする請求項3に記載の撮像装置。 - 上記順位付部は、
上記検出顔領域の顔らしさに基づいて上記顔領域重要度を算出する
ことを特徴とする請求項3に記載の撮像装置。 - 上記テキスト情報重畳部は、
上記撮像画像における上記検出顔領域の周囲を囲む枠画像を上記撮像画像に付加した状態で上記表示部に上記撮像画像を表示させ、上記最高順位に順位付けした上記検出顔領域についての上記枠画像として、他の検出顔領域についての上記枠画像と異なる枠画像を付加する
ことを特徴とする請求項2に記載の撮像装置。 - 上記フォーカス対象決定部は、
上記テキスト情報を表す音声として、上記テキスト情報に対して所定の語句が付加された文字列に応じた音声が上記音声入力部に入力された場合、当該テキスト情報に対応する上記検出顔領域を上記フォーカス対象に決定する
ことを特徴とする請求項1に記載の撮像装置。 - 撮像対象の中から選定されたフォーカス対象に対して自動的にレンズの焦点を合わせ、上記レンズを介して取得した撮像光に基づいて映像データを生成する映像データ生成ステップと、
上記映像データから人物の顔領域を検出顔領域として検出する顔領域検出ステップと、
上記検出顔領域に対応するテキスト情報を上記映像データに重畳することにより、上記撮像画像における上記検出顔領域に対して上記テキスト情報を対応付けた状態で上記映像データに基づく撮像画像を表示するテキスト情報重畳ステップと、
上記検出顔領域のうち、ユーザ所望の一の検出顔領域に対応する上記テキスト情報を表す音声が入力された場合、当該テキスト情報に対応する上記検出顔領域を上記フォーカス対象に決定するフォーカス対象決定ステップと
を具えることを特徴とするフォーカス対象決定方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007115878A JP2008277903A (ja) | 2007-04-25 | 2007-04-25 | 撮像装置及びフォーカス対象決定方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007115878A JP2008277903A (ja) | 2007-04-25 | 2007-04-25 | 撮像装置及びフォーカス対象決定方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008277903A true JP2008277903A (ja) | 2008-11-13 |
Family
ID=40055386
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007115878A Pending JP2008277903A (ja) | 2007-04-25 | 2007-04-25 | 撮像装置及びフォーカス対象決定方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2008277903A (ja) |
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010117663A (ja) * | 2008-11-14 | 2010-05-27 | Fujinon Corp | オートフォーカスシステム |
JP2010183200A (ja) * | 2009-02-03 | 2010-08-19 | Toshiba Corp | 撮像機能を備えた携帯端末 |
JP2010187145A (ja) * | 2009-02-12 | 2010-08-26 | Sony Corp | 画像処理装置、画像処理方法およびプログラム |
JP2010271776A (ja) * | 2009-05-19 | 2010-12-02 | Akita Univ | 被写体の重要度判定方法及び装置、重要度判定プログラム、画像検索方法及び装置、並びに、画像検索プログラム |
JP2012094101A (ja) * | 2010-09-28 | 2012-05-17 | Nintendo Co Ltd | 画像処理プログラム、画像処理装置、画像処理システム、および画像処理方法 |
JP2013135446A (ja) * | 2011-12-27 | 2013-07-08 | Canon Inc | 撮像装置及びその制御方法 |
WO2013136792A1 (ja) * | 2012-03-15 | 2013-09-19 | パナソニック株式会社 | コンテンツ処理装置、コンテンツ処理方法およびプログラム |
JP2013190756A (ja) * | 2012-03-15 | 2013-09-26 | Omron Corp | 撮影装置、撮影装置の制御方法、撮影装置制御プログラム、および該プログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2015018365A (ja) * | 2013-07-10 | 2015-01-29 | ソニー株式会社 | 情報処理装置、情報処理方法およびプログラム |
KR20150099880A (ko) * | 2012-02-06 | 2015-09-01 | 퀄컴 인코포레이티드 | 무인 이미지 캡쳐를 위한 방법 및 장치 |
US9282319B2 (en) | 2010-06-02 | 2016-03-08 | Nintendo Co., Ltd. | Image display system, image display apparatus, and image display method |
US9278281B2 (en) | 2010-09-27 | 2016-03-08 | Nintendo Co., Ltd. | Computer-readable storage medium, information processing apparatus, information processing system, and information processing method |
JP2016058888A (ja) * | 2014-09-09 | 2016-04-21 | カシオ計算機株式会社 | 検出装置、検出方法、及びプログラム |
US9591207B2 (en) | 2008-09-05 | 2017-03-07 | Lg Electronics Inc. | Mobile terminal and method of performing multi-focusing and photographing image including plurality of objects using the same |
US10015473B2 (en) | 2010-06-11 | 2018-07-03 | Nintendo Co., Ltd. | Computer-readable storage medium, image display apparatus, image display system, and image display method |
JP2019053732A (ja) * | 2017-09-15 | 2019-04-04 | ソニー株式会社 | シーン内に存在する不要なオブジェクトの除去に基づくシーンの画像の動的生成 |
US10469738B2 (en) | 2008-09-05 | 2019-11-05 | Telefonaktiebolaget Lm Ericsson (Publ) | Mobile terminal and method of performing multi-focusing and photographing image including plurality of objects using the same |
KR102057581B1 (ko) * | 2013-04-16 | 2019-12-19 | 삼성전자 주식회사 | 카메라를 구비하는 장치의 자동 포커싱 장치 및 방법 |
CN111052185A (zh) * | 2017-08-29 | 2020-04-21 | 小猫星球 | 影像配准方法及其装置 |
JP2020154055A (ja) * | 2019-03-19 | 2020-09-24 | 株式会社昭和テック | 撮像装置 |
-
2007
- 2007-04-25 JP JP2007115878A patent/JP2008277903A/ja active Pending
Cited By (35)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9591207B2 (en) | 2008-09-05 | 2017-03-07 | Lg Electronics Inc. | Mobile terminal and method of performing multi-focusing and photographing image including plurality of objects using the same |
US11601585B2 (en) | 2008-09-05 | 2023-03-07 | Telefonaktiebolaget Lm Ericsson (Publ) | Mobile terminal and method of performing multi-focusing and photographing image including plurality of objects using the same |
US11290636B2 (en) | 2008-09-05 | 2022-03-29 | Telefonaktiebolaget Lm Ericsson (Publ) | Mobile terminal and method of performing multi-focusing and photographing image including plurality of objects using the same |
US10972653B2 (en) | 2008-09-05 | 2021-04-06 | Telefonaktiebolaget Lm Ericsson (Publ) | Mobile terminal and method of controlling auto focusing of camera on object in preview image at user selected position on touch screen |
US10972654B2 (en) | 2008-09-05 | 2021-04-06 | Telefonaktiebolaget Lm Ericsson (Publ) | Controlling image capturing setting of camera based on direction objected is dragged along touch screen |
US10827115B2 (en) | 2008-09-05 | 2020-11-03 | Telefonaktiebolaget Lm Ericsson (Publ) | Mobile terminal and method of performing multi-focusing and photographing image including plurality of objects using the same |
US10819901B2 (en) | 2008-09-05 | 2020-10-27 | Telefonaktiebolaget Lm Ericsson (Publ) | Mobile terminal and method of adjusting image capturing settings while previewing images on touch screen |
US10469738B2 (en) | 2008-09-05 | 2019-11-05 | Telefonaktiebolaget Lm Ericsson (Publ) | Mobile terminal and method of performing multi-focusing and photographing image including plurality of objects using the same |
US9888168B2 (en) | 2008-09-05 | 2018-02-06 | Lg Electronics | Mobile terminal and method of performing multi-focusing and photographing image including plurality of objects using the same |
JP2010117663A (ja) * | 2008-11-14 | 2010-05-27 | Fujinon Corp | オートフォーカスシステム |
US8570431B2 (en) | 2009-02-03 | 2013-10-29 | Fujitsu Mobile Communications Limited | Mobile electronic device having camera |
JP2010183200A (ja) * | 2009-02-03 | 2010-08-19 | Toshiba Corp | 撮像機能を備えた携帯端末 |
JP2010187145A (ja) * | 2009-02-12 | 2010-08-26 | Sony Corp | 画像処理装置、画像処理方法およびプログラム |
JP2010271776A (ja) * | 2009-05-19 | 2010-12-02 | Akita Univ | 被写体の重要度判定方法及び装置、重要度判定プログラム、画像検索方法及び装置、並びに、画像検索プログラム |
US9282319B2 (en) | 2010-06-02 | 2016-03-08 | Nintendo Co., Ltd. | Image display system, image display apparatus, and image display method |
US10015473B2 (en) | 2010-06-11 | 2018-07-03 | Nintendo Co., Ltd. | Computer-readable storage medium, image display apparatus, image display system, and image display method |
US9278281B2 (en) | 2010-09-27 | 2016-03-08 | Nintendo Co., Ltd. | Computer-readable storage medium, information processing apparatus, information processing system, and information processing method |
JP2012094101A (ja) * | 2010-09-28 | 2012-05-17 | Nintendo Co Ltd | 画像処理プログラム、画像処理装置、画像処理システム、および画像処理方法 |
JP2013135446A (ja) * | 2011-12-27 | 2013-07-08 | Canon Inc | 撮像装置及びその制御方法 |
KR102014578B1 (ko) * | 2012-02-06 | 2019-08-26 | 퀄컴 인코포레이티드 | 무인 이미지 캡쳐를 위한 방법 및 장치 |
KR20150099880A (ko) * | 2012-02-06 | 2015-09-01 | 퀄컴 인코포레이티드 | 무인 이미지 캡쳐를 위한 방법 및 장치 |
WO2013136792A1 (ja) * | 2012-03-15 | 2013-09-19 | パナソニック株式会社 | コンテンツ処理装置、コンテンツ処理方法およびプログラム |
US9253408B2 (en) | 2012-03-15 | 2016-02-02 | Omron Corporation | Photographing device, photographing device controlling method, photographing device controlling program, and computer-readable recording medium in which photographing device controlling program is recorded |
JPWO2013136792A1 (ja) * | 2012-03-15 | 2015-08-03 | パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America | コンテンツ処理装置、コンテンツ処理方法およびプログラム |
JP2013190756A (ja) * | 2012-03-15 | 2013-09-26 | Omron Corp | 撮影装置、撮影装置の制御方法、撮影装置制御プログラム、および該プログラムを記録したコンピュータ読み取り可能な記録媒体 |
US9372874B2 (en) | 2012-03-15 | 2016-06-21 | Panasonic Intellectual Property Corporation Of America | Content processing apparatus, content processing method, and program |
CN103535025A (zh) * | 2012-03-15 | 2014-01-22 | 松下电器产业株式会社 | 内容数据处理装置、内容数据处理方法以及程序 |
KR102057581B1 (ko) * | 2013-04-16 | 2019-12-19 | 삼성전자 주식회사 | 카메라를 구비하는 장치의 자동 포커싱 장치 및 방법 |
JP2015018365A (ja) * | 2013-07-10 | 2015-01-29 | ソニー株式会社 | 情報処理装置、情報処理方法およびプログラム |
JP2016058888A (ja) * | 2014-09-09 | 2016-04-21 | カシオ計算機株式会社 | 検出装置、検出方法、及びプログラム |
US10027878B2 (en) | 2014-09-09 | 2018-07-17 | Casio Computer Co., Ltd. | Detection of object in digital image |
JP2020535499A (ja) * | 2017-08-29 | 2020-12-03 | キッテン プラネット カンパニー、リミテッド. | 映像アライメント方法及びその装置 |
CN111052185A (zh) * | 2017-08-29 | 2020-04-21 | 小猫星球 | 影像配准方法及其装置 |
JP2019053732A (ja) * | 2017-09-15 | 2019-04-04 | ソニー株式会社 | シーン内に存在する不要なオブジェクトの除去に基づくシーンの画像の動的生成 |
JP2020154055A (ja) * | 2019-03-19 | 2020-09-24 | 株式会社昭和テック | 撮像装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2008277903A (ja) | 撮像装置及びフォーカス対象決定方法 | |
JP5056061B2 (ja) | 撮像装置 | |
JP4440964B2 (ja) | 撮影システム | |
CN102783136B (zh) | 用于拍摄自我肖像图像的成像装置 | |
JP4720167B2 (ja) | 電子カメラおよびプログラム | |
JP4577275B2 (ja) | 撮像装置、画像記録方法、および、プログラム | |
US8264583B2 (en) | Information processing apparatus, method and computer program product | |
US8164644B2 (en) | Method and apparatus for generating media signal by using state information | |
US20080152197A1 (en) | Information processing apparatus and information processing method | |
JP5401420B2 (ja) | 撮像装置 | |
CN101262561B (zh) | 成像设备及其控制方法 | |
JPWO2008133237A1 (ja) | 撮像装置、その制御プログラムを記録したコンピュータ読取り可能な記録媒体、ならびに制御方法 | |
US20050185063A1 (en) | Digital camera | |
US20130100329A1 (en) | Image pickup apparatus | |
JP7144571B2 (ja) | 情報機器、及びカメラ画像共有システム | |
JP4577445B2 (ja) | 撮像装置、画像記録方法、および、プログラム | |
JP2007148691A (ja) | 画像処理装置 | |
JP4895205B2 (ja) | 画像処理装置及びそのプログラム | |
JP5120716B2 (ja) | 撮像装置、撮像制御方法及びプログラム | |
JP2008017169A (ja) | 電子カメラ | |
CN110365910B (zh) | 一种自拍方法、装置及电子设备 | |
JP2018081662A (ja) | 画像プリントシステム | |
JP5434718B2 (ja) | 画像処理装置及び画像処理方法 | |
JP4633527B2 (ja) | 認証装置、認証システム、認証装置の制御方法、プログラム、および、プログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP2010041527A (ja) | 撮影支援方法、システム、プログラム |