WO2020209097A1

WO2020209097A1 - 画像表示装置、画像表示方法、及びプログラム

Info

Publication number: WO2020209097A1
Application number: PCT/JP2020/013937
Authority: WO
Inventors: 優馬小宮; 雄大阿部; 智大島田; 修也楠本
Original assignee: 富士フイルム株式会社
Priority date: 2019-04-10
Filing date: 2020-03-27
Publication date: 2020-10-15
Also published as: JPWO2020209097A1

Abstract

安定的でかつ追従性のよい対象枠の表示を行うことができる画像表示装置、画像表示方法、及びプログラムを提供する。画像表示装置は、画像表示装置であって、連続する画像を取得する画像取得部（１０１）と、画像の各々において、一の対象に対する候補となる複数の対象候補を検出する対象候補検出部（１０３）と、一の対象に対する候補となる複数の対象候補を一つの最終対象候補まで絞り込む絞込部（１０５）と、複数の対象候補の位置の代表位置を算出する代表位置算出部（１０７）と、代表位置算出部で算出された代表位置に基づいて、最終対象候補の対象枠を表示する表示制御部（１０９）と、を備える。

Description

画像表示装置、画像表示方法、及びプログラム

　本発明は、画像表示装置、画像表示方法、及びプログラムに関し、特に検出した対象を示す対象枠を表示する画像表示装置、画像表示方法、及びプログラムに関する。

　特許文献１には、パターンマッチング法により複数の顔領域候補を抽出し、その複数の顔領域候補の絞り込み、その複数の顔領域候補について顔部品パターンマッチングを行い、絞り込みの結果及び顔部品パターンマッチングの結果に基づいて顔領域の判定を行う構成が記載されている。

　特許文献２には、対象枠の表示を連続する３つのフレームの平均値に基づいて、対象枠の表示を行うことにより、対象枠を滑らかに表示する構成が記載されている。

特開２００９－１２３０８１号公報特開２００８－２８８８６８号公報

　本開示の技術に係る１つの実施形態は、安定的でかつ追従性のよい対象枠を表示した画像表示装置、画像表示方法、及びプログラムを提供する。

　上記目的を達成するための本発明の一の態様である画像表示装置は、画像表示装置であって、連続する画像を取得する画像取得部と、画像の各々において、一の対象に対する候補となる複数の対象候補を検出する対象候補検出部と、一の対象に対する候補となる複数の対象候補を一つの最終対象候補まで絞り込む絞込部と、複数の対象候補の位置の代表位置を算出する代表位置算出部と、代表位置算出部で算出された代表位置に基づいて、最終対象候補の対象枠を表示する表示制御部と、を備える。

　本態様によれば、複数の対象候補の位置の代表位置が算出され、その算出された代表位置に基づいて、最終対象候補の対象枠が表示されるので、安定的で且つ追従性のよい対象枠の表示を行うことができる。

　好ましくは、代表位置算出部は、最終対象候補の位置に基づいて、代表位置を算出するための対象候補を選択する。

　好ましくは、代表位置算出部は、最終対象候補の位置を中心にして、代表位置を算出するための対象候補を選択する範囲を決定する。

　好ましくは、代表位置算出部は、最終対象候補のサイズに基づいて、代表位置を算出するための対象候補を選択する範囲を決定する。

　好ましくは、代表位置算出部は、選択された対象候補が有する重み付けに応じて、代表位置を算出する。

　好ましくは、画像表示装置は、複数の対象候補のサイズの代表である代表サイズを算出する代表サイズ算出部を備え、表示制御部は、代表サイズと代表位置とに基づいて、最終対象候補の対象枠を表示する。

　好ましくは、代表サイズ算出部は、複数の対象候補のサイズの平均値、中央値、又は最頻値に基づいて、代表サイズを算出する。

　好ましくは、対象候補検出部が検出する対象は、物体である。

　好ましくは、対象候補検出部が検出する対象は、顔又は瞳である。

　好ましくは、代表位置算出部は、複数の対象候補の位置の平均値、中央値、又は最頻値に基づいて、代表位置を算出する。

　好ましくは、画像表示装置は、対象候補検出部によって検出された対象候補の位置情報を画像に記録する情報追加部を備える。

　本発明の他の態様である画像表示装置は、画像表示装置であって、連続する画像であって、画像の各々において、一の対象に対する候補となる複数の対象候補の位置情報を有する画像を取得する画像取得部と、一の対象に対する候補となる複数の対象候補を一つの最終対象候補まで絞り込む絞込部と、複数の対象候補の位置の代表位置を算出する代表位置算出部と、代表位置算出部で算出された代表位置に基づいて、最終対象候補の対象枠を表示する表示制御部と、を備える。

　本発明の他の態様である画像表示方法は、画像表示方法であって、連続する画像を取得するステップと、画像の各々において、一の対象に対する候補となる複数の対象候補を検出するステップと、一の対象に対する候補となる複数の対象候補を一つの最終対象候補まで絞り込むステップと、複数の対象候補の位置の代表位置を算出するステップと、代表位置に基づいて、最終対象候補の対象枠を表示するステップと、を含む。

　本発明の他の態様であるプログラムは、画像表示工程をコンピュータに実行させるプログラムであって、連続する画像を取得するステップと、画像の各々において、一の対象に対する候補となる複数の対象候補を検出するステップと、一の対象に対する候補となる複数の対象候補を一つの最終対象候補まで絞り込むステップと、複数の対象候補の位置の代表位置を算出するステップと、代表位置に基づいて、最終対象候補の対象枠を表示するステップと、を含む画像表示工程をコンピュータに実行させる。

図１は、画像表示装置を搭載する撮像装置の一例を示す斜視図である。図２は、画像表示装置を搭載する撮像装置の一例を示す背面図である。図３は、撮像装置の構成を示す図である。図４は、画像表示装置の主な機能構成例を示すブロック図である。図５は、対象枠の表示態様を示す図である。図６は、異なる位置に最終対象候補Ｔが検出される場合について説明する図である。図７は、対象枠の表示形態を示す図である。図８は、異なる位置に最終対象候補Ｔが検出される場合について説明する図である。図９は、対象候補及び絞り込まれた最終対象候補を示す図である。図１０は、最終対象候補のサイズと選択範囲の関係を示した図である。図１１は、画像表示方法を示したフローチャートである。図１２は、画像表示装置の主な機能構成例を示すブロック図である。図１３は、代表サイズ算出部が算出する代表サイズに関して説明する図である。図１４は、スマートフォンの外観を示す図である。図１５は、スマートフォンの構成を示すブロック図である。

　［撮像装置］
　図１及び図２は、それぞれ本発明の画像表示装置を搭載する撮像装置の一例（デジタルカメラ）を示す斜視図及び背面図である。

　本発明の画像表示装置１１（図４を参照）は、撮像装置１０に搭載され、撮像装置１０で撮像されたライブビュー画像（スルー画像）を表示する。なお、画像表示装置１１は、記録された動画も表示することができる。

　撮像装置１０は、レンズを通った光を撮像素子２１０で受け、デジタル信号に変換して静止画又は動画の画像データとして記録メディアに記録するデジタルカメラである。

　図１に示すように撮像装置１０は、その正面に撮影レンズ１２、ストロボ１等が配設され、上面にはシャッタボタン２、電源／モードスイッチ３、モードダイヤル４等が配設されている。一方、図２に示すように、カメラ背面には、モニタ（ＬＣＤ：Liquid Crystal Display）３０、ズームボタン５、十字ボタン６、ＭＥＮＵ／ＯＫボタン７、再生ボタン８、ＢＡＣＫボタン９等が配設されている。

　撮影レンズ１２は、沈胴式のズームレンズで構成されており、電源／モードスイッチ３によってカメラの作動モードを撮影モードに設定することにより、カメラ本体から繰り出される。ストロボ１は、主要被写体にストロボ光を照射するものである。

　シャッタボタン２は、いわゆる「半押し」と「全押し」とからなる２段ストローク式のスイッチで構成され、撮影準備指示部として機能するとともに、画像の記録指示部として機能する。

　撮像装置１０は、撮影モードとして静止画撮影モードが選択され、シャッタボタン２が「半押し」されると、ＡＦ（Autofocus）／ＡＥ（Auto Exposure)制御を行う撮影準備動作を行い、シャッタボタン２が「全押し」されると、静止画の撮像及び記録を行う。

　また、撮像装置１０は、撮影モードとして動画撮影モードが選択され、シャッタボタン２が「全押し」されると、動画の録画を開始し、シャッタボタン２が再度「全押し」されると、録画を停止して待機状態になる。

　電源／モードスイッチ３は、撮像装置１０の電源をＯＮ／ＯＦＦする電源スイッチとしての機能と、撮像装置１０のモードを設定するモードスイッチとしての機能とを併せ持っており、「ＯＦＦ位置」と「再生位置」と「撮影位置」との間をスライド自在に配設されている。撮像装置１０は、電源／モードスイッチ３をスライドさせて、「再生位置」又は「撮影位置」に合わせることにより、電源がＯＮになり、「ＯＦＦ位置」に合わせることにより、電源がＯＦＦになる。そして、電源／モードスイッチ３をスライドさせて、「再生位置」に合わせることにより、「再生モード」に設定され、「撮影位置」に合わせることにより、「撮影モード」に設定される。

　モードダイヤル４は、撮像装置１０の撮影モードを設定するモード切替部として機能し、このモードダイヤル４の設定位置により、撮像装置１０の撮影モードが様々なモードに設定される。例えば、静止画撮影を行う「静止画撮影モード」、動画撮影を行う「動画撮影モード」等である。

　モニタ３０は、表示部として機能し、撮影モード時のライブビュー画像の表示、再生モード時の静止画又は動画の表示を行うとともに、メニュー画面の表示等を行うことでグラフィカルユーザーインターフェースの一部として機能する。

　ズームボタン５は、ズームを指示するズーム指示手段として機能し、望遠側へのズームを指示するテレボタン５Ｔと、広角側へのズームを指示するワイドボタン５Ｗとからなる。撮像装置１０は、撮影モード時に、このテレボタン５Ｔとワイドボタン５Ｗとが操作されることにより、撮影レンズ１２の焦点距離が変化する。また、再生モード時に、このテレボタン５Ｔとワイドボタン５Ｗとが操作されることにより、再生中の画像が拡大、縮小する。

　十字ボタン６は、上下左右の４方向の指示を入力する操作部２５０であり、メニュー画面から項目を選択したり、各メニューから各種設定項目の選択を指示したりするボタン（カーソル移動操作手段）として機能する。左／右キーは再生モード時のコマ送り（順方向／逆方向送り）ボタンとして機能する。

　ＭＥＮＵ／ＯＫボタン７は、モニタ３０の画面上にメニューを表示させる指令を行うためのメニューボタンとしての機能と、選択内容の確定及び実行などを指令するＯＫボタンとしての機能とを兼備した操作ボタンである。

　再生ボタン８は、撮影記録した静止画又は動画をモニタ３０に表示させる再生モードに切り替えるためのボタンである。

　ＢＡＣＫボタン９は、入力操作のキャンセルや一つ前の操作状態に戻すことを指示するボタンとして機能する。

　なお、本実施形態にかかる撮像装置１０において、ボタン／スイッチ類に対して固有の部材を設けるのではなく、タッチパネルを設けこれを操作することでそれらボタン／スイッチ類の機能を実現するようにしてもよい。

　［撮像装置の内部構成］
　図３は、撮像装置１０の構成を示す図である。撮像装置１０は撮影レンズ１２により被写体像（光学像）を撮像素子２１０に結像させる。

　撮影レンズ１２はズームレンズ１１０とフォーカスレンズ１５０とから構成される。また、撮像装置１０は、絞り１３０と、レンズ駆動部１４０とを備える。レンズ駆動部１４０は、制御部としてのＣＰＵ２４０からの指令に応じてズームレンズ１１０、フォーカスレンズ１５０を進退駆動してズーム（光学ズーム）調整、フォーカス調整を行う。ズーム調整及びフォーカス調整は、ＣＰＵ２４０からの指令に応じて行う他に、ユーザが行ったズーム操作、フォーカス操作に応じて行ってもよい。また、レンズ駆動部１４０はＣＰＵ２４０からの指令に応じて絞り１３０を制御して、露出を調整する。一方、ズームレンズ１１０及びフォーカスレンズ１５０の位置、絞り１３０の開放度等の情報がＣＰＵ２４０に入力される。

　撮像装置１０は、撮像素子２１０、ＡＦＥ２２０（ＡＦＥ：Analog Front End）、Ａ／Ｄ変換器２３０（Ａ／Ｄ：Analog to Digital）、ＣＰＵ２４０、操作部２５０、記憶部２６０、及びモニタ３０を備える。撮像装置１０は、撮像素子２１０に透過させる光を遮光するためのシャッター（不図示）を有する。撮像素子２１０は、多数の受光素子がマトリクス状に配列された受光面を備え、ズームレンズ１１０、フォーカスレンズ１５０、及び絞り１３０を透過した被写体光が撮像素子２１０の受光面上に結像され、各受光素子によって電気信号に変換される。撮像素子２１０の受光面上にはＲ（赤），Ｇ（緑），又はＢ（青）のカラーフィルタが設けられており、各色の信号に基づいて被写体のカラー画像を取得することができる。なお、撮像素子２１０としては、ＣＭＯＳ（Complementary Metal-Oxide Semiconductor）、ＣＣＤ（Charge-Coupled Device）等の様々な光電変換素子を用いることができる。ＡＦＥ２２０は撮像素子２１０から出力されるアナログ画像信号のノイズ除去、増幅等を行い、Ａ／Ｄ変換器２３０は、取り込んだアナログ画像信号を階調幅があるデジタル画像信号に変換する。なお、シャッターは、メカニカルシャッターでも電子シャッターでもよい。電子シャッターの場合、ＣＰＵ２４０によって撮像素子２１０の電荷蓄積期間を制御することで露光時間（シャッタースピード）を調節することができる。

　記憶部２６０は各種の光磁気記録媒体、半導体メモリ等の非一時的記録媒体及びその制御回路により構成され、動画（ライブビュー画像を含む）及び静止画を記憶する。記録媒体は撮像装置１０に対し着脱できるタイプを用いることができる。また、記憶部２６０にはプログラム及びＣＰＵ２４０の各種制御に用いる情報等が記憶される。

　モニタ３０は、動画（ライブビュー画像、記録動画）及び静止画を表示することができる。撮像装置１０はファインダを備えていてもよく、ファインダはモニタ３０として機能する。ファインダは、例えば液晶表示パネル、プリズム、レンズ等により構成され、ユーザは図示せぬ接眼部を介して動画、静止画を視認することができる。ファインダとしては「光学式ビューファインダ（ＯＶＦ：Optical View Finder）」、「電子式ビューファインダ（ＥＶＦ：Electronic View Finder）」、あるいはこれらの組合せである「ハイブリッド式ビューファインダ（ＨＶＦ：Hybrid View Finder）」を用いることができる。

　ＣＰＵ２４０は、記憶部２６０から必要なプログラム及び各種制御に用いる情報を読み出して、ＣＰＵ２４０で行われる各種処理及び各種制御を行う。

　ＣＰＵ２４０は各種制御を実行する。ハードウェア的な構造は、次に示すような各種のプロセッサ（processor）である。各種のプロセッサには、ソフトウェア（プログラム）を実行して各種の機能部として作用する汎用的なプロセッサであるＣＰＵ（Central Processing Unit）、ＦＰＧＡ（Field Programmable Gate Array）などの製造後に回路構成を変更可能なプロセッサであるプログラマブルロジックデバイス（Programmable Logic Device：ＰＬＤ）、ＡＳＩＣ（Application Specific Integrated Circuit）などの特定の処理を実行させるために専用に設計された回路構成を有するプロセッサである専用電気回路などが含まれる。

　１つの処理部は、これら各種のプロセッサのうちの１つで構成されていてもよいし、同種又は異種の２つ以上のプロセッサ（例えば、複数のＦＰＧＡ、あるいはＣＰＵとＦＰＧＡの組み合わせ）で構成されてもよい。また、複数の機能部を１つのプロセッサで構成してもよい。複数の機能部を１つのプロセッサで構成する例としては、第１に、クライアントやサーバなどのコンピュータに代表されるように、１つ以上のＣＰＵとソフトウェアの組合せで１つのプロセッサを構成し、このプロセッサが複数の機能部として作用させる形態がある。第２に、システムオンチップ（System On Chip：ＳｏＣ）などに代表されるように、複数の機能部を含むシステム全体の機能を１つのＩＣ（Integrated Circuit）チップで実現するプロセッサを使用する形態がある。このように、各種の機能部は、ハードウェア的な構造として、上記各種のプロセッサを１つ以上用いて構成される。

　＜第１の実施形態＞
　次に、本発明の第１の実施形態に関して説明する。本実施形態では、複数の対象候補の位置から代表位置が算出され、その代表位置に基づいて対象枠の表示が行われる。

　図４は、画像表示装置１１の主な機能構成例を示すブロック図である。画像表示装置１１は、画像取得部１０１、対象候補検出部１０３、絞込部１０５、代表位置算出部１０７、表示制御部１０９、情報追加部１１１、及びモニタ３０を備える。画像取得部１０１、対象候補検出部１０３、絞込部１０５、代表位置算出部１０７、表示制御部１０９及び情報追加部１１１は、ＣＰＵ２４０で実現される。

　画像取得部１０１は連続する画像を取得する。具体的には、画像取得部１０１は、Ａ／Ｄ変換器２３０から出力される時系列的に連続する画像を取得する。例えば画像取得部１０１は、撮像装置１０で撮影された複数のフレーム（画像）で構成されたライブビュー画像を取得する。ここで、ライブビュー画像は、撮影された画像が間引き処理等が行われ縮小された画像で構成される動画である。

　対象候補検出部１０３は、一つのフレーム（画像）において、一の対象に対する候補となる複数の対象候補を検出する。例えば、一の対象が人の顔である場合、対象候補検出部１０３は、パターンマッチング法により複数の対象候補を以下に説明するように検出する。対象候補検出部１０３は、記憶部２６０に記憶されている顔パターンのテンプレートを取り出し、一つのフレーム上でこの顔パターンのテンプレートを走査しながら、顔パターンのテンプレートと顔パターンテンプレートに対応する画像上の部分画像との相関値を算出する。例えば、対象候補検出部１０３は、所定の閾値α以上の部分画像を、対象候補として複数検出する。なお、記憶部２６０に複数の顔パターンのテンプレートが記憶されている場合には、複数の顔パターンのテンプレートを画像上に走査させてもよい。このように、対象候補検出部１０３は、一の対象を検出するための複数の対象候補を検出する。そして、対象候補検出部１０３は、例えば対象候補の中心の座標や対象候補のサイズを出力する。

　絞込部１０５は、一の対象に対する候補となる複数の対象候補を一つの最終対象候補まで絞り込む。絞込部１０５は、対象の特性に応じて様々な観点から、一つの最終対象候補まで絞り込みを行う。例えば、絞込部１０５は、対象が人の顔である場合には、対象候補の肌色判定を行って複数の対象候補から一つの最終対象候補を絞り込む。肌色判定は、例えば以下のように行う。絞込部１０５は、一つのフレーム（画像）の各分割領域（例えば、８×８＝６４の分割領域）ごとにＲ、Ｇ、Ｂの色信号の積算値をそれぞれ算出することで各分割領域の色相を求める。そして、絞込部１０５は、複数の対象候補の各々について色相をそれぞれ算出し、所定の色相（肌色）との相関値を算出する。そして、絞込部１０５はその相関値にもとづいてスコアを算出しスコアに基づいて最終対象候補を絞り込む。なお、絞込部１０５で行われる絞り込みの手法は肌色判定に限定されず、他の手法によって絞り込みが行われる。このように、絞込部１０５は、複数の対象候補から一つの最終対象候補の絞り込みを行う。

　代表位置算出部１０７は、複数の対象候補の位置の代表位置を算出する。代表位置算出部１０７は、複数の対象候補の位置の平均値、中央値又は最頻値に基づいて、代表位置を算出する。例えば、代表位置算出部１０７は、対象が人の顔である場合には、顔の中心の位置を各対象候補の位置として、対象候補検出部１０３で検出された全ての対象候補の位置の平均値を代表位置として算出する。ここで、複数の対象候補の位置の平均値を算出することにより、安定的で最終対象候補への追従性のよい位置を求めることができる。また例えば、人の顔の向きが正面、右向き、正面、左向きのように変化する場合には、最頻値を採用することにより安定的な位置を算出することができる。また代表位置算出部１０７は、対象候補検出部１０３が検出した一部の対象候補の位置から代表位置を算出することもできる。なお、一部の対象候補の位置から代表位置が算出される場合の、代表位置算出部１０７により行われる対象候補の選択については後で説明する。

　表示制御部１０９は、代表位置算出部１０７で算出された代表位置に基づいて、最終対象候補の検出枠をモニタ３０に表示する。例えば、表示制御部１０９は、対象が顔である場合には、顔の位置又は領域を示す検出枠をフレーム（画像）に重畳して表示させる。なお、検出枠の形状は様々な形状が採用される。例えば、検出枠は、枠形状、括弧形状又は丸形状が採用される。

　情報追加部１１１は、対象候補検出部１０３によって検出された対象候補の位置情報を画像に記録する。例えば、情報追加部１１１は、検出された対象候補の位置情報を、その対象候補が検出された画像又は動画ファイルに添付する。このように、情報追加部１１１が検出された対象候補の位置情報を画像又は動画ファイルに添付することにより、この画像又は動画ファイルに対しての再度の対象候補の検出を省略することができる。

　［対象枠の表示の例］
　次に、対象が顔の場合の対象枠の表示の具体例に関して説明する。先ず従来から行われている対象枠の表示態様に関して説明し、その後に本発明の対象枠の表示態様の一例を説明する。

　図５は、従来から行われてきた対象枠の表示態様を示す図である。図５に示す場合では、最終対象候補Ｔに基づいて、対象枠Ｆが表示されている。具体的には、最終対象候補Ｔの中心と対象枠Ｆの中心は点Ｐによって重なっている。このように、従来では対象枠Ｆの中心と最終対象候補Ｔの中心とが重なるように対象枠Ｆが表示される。このように表示された対象枠Ｆは、最終対象候補Ｔの動きが不安定であると、最終対象候補Ｔの動きに対象枠Ｆの動きが一致するために、以下に説明するように対象枠Ｆの動きが不安定となる。

　図６は、図５で説明した対象枠Ｆが最終対象候補Ｔに基づいて表示される場合であり、連続するフレーム（画像）において、異なる位置に最終対象候補Ｔが検出される場合について説明する図である。

　図６（Ａ）には、ｎ－１番目のフレームで検出された対象候補の中心Ｖ１～Ｖ３が示されており、かつ絞り込まれた最終対象候補Ｔの中心Ｖ１（図５での点Ｐ）が示されている。図６（Ｂ）には、ｎ番目のフレームで検出された対象候補の中心Ｖ１～Ｖ３が示されており、かつ絞り込まれた最終対象候補Ｔの中心Ｖ２（図５での点Ｐ）が示されている。図６（Ｃ）には、ｎ＋１番目のフレームで検出された対象候補の中心Ｖ１～Ｖ３が示されており、かつ絞り込まれた最終対象候補Ｔの中心Ｖ３（図５での点Ｐ）が示されている。また、ｎ－１番目のフレームで表示する中心Ｖ１に対応する対象枠Ｆ１、ｎ番目のフレームで表示する中心Ｖ２に対応する対象枠Ｆ２、ｎ＋１番目のフレームで表示する中心Ｖ３に対応する対象枠Ｆ３が示されており、各対象枠の中心は中心Ｖ１～Ｖ３に重なっている。

　図６（Ａ）～（Ｃ）に示すように、最終対象候補Ｔの位置がｎ－１番目、ｎ番目、ｎ＋１番目のフレームでそれぞれ移動すると、最終対象候補Ｔの移動に伴って対象枠（Ｆ１～Ｆ３）は各フレームにおいて異なる位置に表示される。したがって、最終対象候補Ｔの中心と対象枠の中心を重ねて表示させると、対象枠（Ｆ１～Ｆ３）の表示は不安定となってしまう。

　そこで、本発明では対象枠の表示位置は、複数の対象候補の位置から算出される代表位置に基づいて行う。

　図７は、最終対象候補Ｔに対して、代表位置である複数の対象候補の位置の平均値（座標）に基づいて行われる対象枠ＦＣの表示形態を示す図である。なお、図７には、参考のために図５で説明をした最終対象候補Ｔの中心に基づいて表示される対象枠Ｆを点線で示している。

　図７に示す場合では、対象枠ＦＣの中心は、複数の対象候補の位置の平均値Ｑとされる。このように、対象枠ＦＣの中心の位置を、最終対象候補の中心Ｐではなく、複数の対象候補の平均値Ｑにすることにより、最終対象候補Ｔの動きと対象枠ＦＣの動きは一致せずに動くために、最終対象候補Ｔが移動する場合であっても対象枠ＦＣの表示は安定的となる。

　図８は、図７で説明した対象枠ＦＣが平均値Ｑに基づいて表示される場合であり、連続するフレーム（画像）において、異なる位置に最終対象候補Ｔが検出される場合について説明する図である。図８では、図７と同様に３つの対象候補（対象候補の中心はＶ１～Ｖ３）が検出され、ｎ－１番目のフレームにおいて最終対象候補Ｔ（中心Ｖ１）が絞り込まれ、ｎ番目のフレームにおいて最終対象候補Ｔ（中心Ｖ２）が絞り込まれ、ｎ＋１番目のフレームにおいて最終対象候補Ｔ（中心Ｖ３）が絞り込まれる場合を示す。

　図８に示すように、対象候補の位置の平均値Ｑに対応する対象枠ＦＣを表示することによって、最終対象候補Ｔがｎ－１、ｎ、ｎ＋１番目のフレームにおいて移動した場合であっても、対象枠ＦＣの位置を変えることなく表示することができる。また、対象枠ＦＣは、最終対象候補Ｔの候補である対象候補の中心Ｖ１、Ｖ２、Ｖ３の平均値Ｑに基づいて表示されるので、最終対象候補Ｔへの追従性がよい。

　［対象候補の選択］
　次に、代表位置算出部１０７が代表位置を算出する場合の対象候補の選択に関して説明する。

　代表位置算出部１０７は、対象候補検出部１０３で検出された全ての複数の対象候補を使用して代表位置を算出してもよいが、選択した一部の対象候補を使用して代表位置を算出してもよい。以下に、代表位置算出部１０７が行う対象候補の選択の例について説明する。

　図９は、一つのフレーム（画像）において検出された対象候補及び絞り込まれた最終対象候補を示す図である。横軸はフレームのＸ軸を示しており、縦軸はフレームのＹ軸を示している。

　また、最終対象候補Ｔの中心を「＋」で、対象候補Ｖの中心を「×」で示している。また、「＋」及び「×」の右横には、最終対象候補Ｔ及び対象候補Ｖの確からしさのスコアが示されている。この顔検出の確からしさは、例えば、上述した肌色判定により算出されるスコアである。図９に示す場合には、スコアが最も高い「３.５」を有する対象候補が最終対象候補Ｔとして絞り込まれている。

　また、代表位置算出部１０７は、枠Ｇの範囲内の対象候補Ｖの位置に関して平均値を算出する。枠Ｇは、最終対象候補Ｔの中心から所定の選択範囲を示している。ここで、例えば、枠Ｇの選択範囲は最終対象候補Ｔの領域のサイズに応じて決定される。

　図１０は、最終対象候補（顔）のサイズと選択範囲の関係を示した図である。なお、最終対象候補のサイズは、絞込部１０５により取得され、代表位置算出部１０７に送られる。顔サイズは「０段階」から「１１段階」まであり、「０段階」が最も顔サイズが小さく「１２段階」が最も顔サイズが大きい。また、各段階に応じて、選択範囲の大きさが予め設定されており、画角に対してのパーセンテージにより選択範囲が示されている。例えば、図９に示す場合では、最終対象候補（顔）サイズが「５段階」であり、画角に対して７％の一辺を有する正方形の範囲（枠Ｇ）内に存在する対象候補Ｖの位置に基づいて代表位置が算出される。なお、選択範囲の中心は最終対象候補の中心に設定されている。これにより、代表位置算出部１０７は最終対象候補Ｔの近傍での対象候補Ｖに関しての代表値を算出することができる。なお、図１０に示した顔サイズと選択範囲の関係は一例であり、代表位置算出部１０７の対象候補Ｖの選択はこれに限定されるものではない。

　このように、代表位置算出部１０７は、一部の対象候補Ｖを選択して代表位置を算出することにより、より適切な代表位置を算出することができる。

　［画像表示方法］
　図１１は、画像表示装置１１を利用した画像表示方法（画像表示工程）を示したフローチャートである。なお、以下では、代表位置算出部１０７により一部の対象候補が選択される場合について説明する。

　先ず、画像取得部１０１により、連続するフレーム（連続する画像）が取得される（ステップＳ１０）。次に、対象候補検出部１０３により、各フレームにおいて複数の対象候補が検出される（ステップＳ１１）。その後、絞込部１０５により、複数の対象候補から最終対象候補を絞り込む（ステップＳ１２）。この場合、絞込部１０５は最終対象候補の位置及びサイズに関する情報を代表位置算出部１０７に送る。その後、代表位置算出部１０７は、最終対象候補の顔の位置及び顔のサイズの情報を取得する（ステップＳ１３）。次に、代表位置算出部１０７は、最終対象候補の顔のサイズに応じた選択範囲内にある対象候補を選択する（ステップＳ１４）。その後、代表位置算出部１０７は選択した対象候補の顔の位置の平均値を算出する（ステップＳ１５）。そして、表示制御部１０９は算出した平均値に基づいて、対象枠の表示を行う（ステップＳ１６）。

　上述の各構成及び機能は、任意のハードウェア、ソフトウェア、或いは両者の組み合わせによって適宜実現可能である。例えば、上述の処理ステップ（処理手順）をコンピュータに実行させるプログラム、そのようなプログラムを記録したコンピュータ読み取り可能な記録媒体（非一時的記録媒体）、或いはそのようなプログラムをインストール可能なコンピュータに対しても本発明を適用することが可能である。

　以上で説明したように、複数の対象候補の位置に基づいて代表位置が算出され、その代表位置に基づいて、表示される最終対象候補の対象枠が表示されるので、対象枠を安定的にかつ対象に対して追従性が良く表示することができる。

　＜第２の実施形態＞
　次に第２の実施形態に関して説明する。第１の実施形態では、対象枠を表示する位置を代表位置に基づいて表示することに関して説明してきたが、第２の実施形態では、対象枠のサイズが代表サイズで表示されることを説明する。

　図１２は、撮像装置１０に搭載される画像表示装置１１の主な機能構成例を示すブロック図である。なお、図４で既に説明を行った箇所は同じ符号を付し説明は省略する。画像表示装置１１は、画像取得部１０１、対象候補検出部１０３、絞込部１０５、代表位置算出部１０７、代表サイズ算出部１１３、表示制御部１０９、情報追加部１１１、及びモニタ３０を備える。画像取得部１０１、対象候補検出部１０３、絞込部１０５、代表位置算出部１０７、代表サイズ算出部１１３、表示制御部１０９及び情報追加部１１１は、ＣＰＵ２４０で実現される。

　対象候補検出部１０３は、対象候補の位置及びサイズを検出する。ここで対象候補のサイズとは、例えば検出された対象候補の領域（面積）、又は検出された対象候補の長さ（直径）であり、対象候補検出部１０３は、検出した対象候補の領域又は長さを出力する。

　代表サイズ算出部１１３は、複数の対象候補のサイズの代表である代表サイズを算出する。具体的には、代表サイズ算出部１１３は、対象候補検出部１０３で検出された複数の対象候補のサイズを取得し、その取得した対象候補のサイズの平均値、中央値、又は最頻値を算出して、代表サイズとする。

　表示制御部１０９は、代表サイズと代表位置とに基づいて、最終対象候補の検出枠を表示する。具体的に、表示制御部１０９は、代表サイズ算出部１１３で算出されたサイズの対象枠を、代表サイズ算出部１１３で算出された代表位置に表示する。なお、対象候補（最終対象候補）のサイズに応じて、予め決められたサイズの対象枠が表示されるものとする。

　図１３は、代表サイズ算出部１１３が算出する代表サイズに関して説明する図である。

　図１３では、対象候補検出部１０３により、対象候補Ｒ１、Ｒ２及びＲ３が検出された場合が示されている。対象候補検出部１０３は、これらの対象候補Ｒ１、Ｒ２及びＲ３のサイズを算出する。具体的には、対象候補検出部１０３は、対象候補Ｒ１はａ、対象候補Ｒ２はｂ及び対象候補Ｒ３はｃと算出する。代表サイズ算出部１１３は、対象候補Ｒ１～Ｒ３のサイズを取得して、平均値（ａ＋ｂ＋ｃ）／３により、代表サイズＲＳを得る。そして、表示制御部１０９は、代表サイズＲＳに基づいて対象枠ＦＳを最終対象候補Ｔに重畳して表示する。なお、図１３に示す場合には、絞込部１０５により、対象候補Ｒ２が最終対象候補Ｔに絞り込まれている。

　このように、代表サイズに基づいて対象枠を表示させることにより、対象枠のサイズに関して、安定的で最終対象候補への追従性のよい対象枠の表示を行うことができる。

　＜その他＞
　上述した実施形態では、検出される対象として人の顔である場合について説明したが、これに限定されるものではない。対象候補検出部１０３が検出する対象は、物体であれば特に限定されない。例えば、対象候補検出部１０３が検出する対象は、瞳であってもよい。

　上述した実施形態では、画像表示装置１１において、各画像において対象候補が検出される場合について説明をしてきたが、本発明ではこれに限定されるものではない。例えば画像取得部１０１は、連続する画像であって、画像の各々において、複数の対象候補の位置情報が添付された画像を取得してもよい。この場合には、代表位置算出部１０７は、画像に添付された対象候補の位置情報に基づいて代表位置を算出することができる。

　また、代表位置算出部１０７は、各対象候補の位置に重み付けを行って、代表位置を算出してもよい。例えば、代表位置算出部１０７は、最終対象候補の中心に近い対象候補の位置は係数を大きくすることにより、代表位置を算出する。また、代表サイズ算出部１１３も同様にして、各対象候補のサイズに重み付けを行って、代表サイズを算出してもよい。

　＜スマートフォンの構成＞
　上述の説明では、図１において撮像装置１０の一例として、デジタルカメラを用いて説明をしたが、本発明の適用はこれに限定されるものではない。本発明を適用可能な他の態様としては、例えば、カメラ機能を有する携帯電話機やスマートフォン、ＰＤＡ（Personal Digital Assistants）、携帯型ゲーム機が挙げられる。以下、本発明を適用可能なスマートフォンの一例について説明する。なお、図４におけるＣＰＵ２４０は主制御部５０１に対応し、記憶部２６０は記憶部５５０に対応し、モニタ３０は表示パネル５２１に対応する。

　図１４は、スマートフォン５００の外観を示す図である。図１４に示すスマートフォン５００は、平板状の筐体５０２を有し、筐体５０２の一方の面に表示部としての表示パネル５２１と、入力部としての操作パネル５２２とが一体となった表示入力部５２０を備えている。また、かかる筐体５０２は、スピーカ５３１と、マイクロホン５３２、操作部５４０と、カメラ部５４１とを備えている。なお、筐体５０２の構成はこれに限定されず、例えば、表示部と入力部とが独立した構成を採用したり、折り畳み構造やスライド機構を有する構成を採用することもできる。

　図１５は、図１４に示すスマートフォン５００の構成を示すブロック図である。図１５に示すように、スマートフォン５００の主たる構成要素として、基地局と移動通信網とを介した移動無線通信を行う無線通信部５１０と、表示入力部５２０と、通話部５３０と、操作部５４０と、カメラ部５４１と、記憶部５５０と、外部入出力部５６０と、ＧＰＳ（Global Positioning System）受信部５７０と、モーションセンサ部５８０と、電源部５９０と、主制御部５０１とを備える。

　無線通信部５１０は、主制御部５０１の指示にしたがって、移動通信網に収容された基地局に対し無線通信を行うものである。この無線通信を使用して、音声データ、画像データ等の各種ファイルデータ、電子メールデータなどの送受信、Ｗｅｂデータ及びストリーミングデータなどの受信を行う。

　表示入力部５２０は、主制御部５０１の制御により、画像（静止画及び動画）や文字情報などを表示して視覚的にユーザに情報を伝達し、表示した情報に対するユーザ操作を検出する、いわゆるタッチパネルであって、表示パネル５２１と、操作パネル５２２とを備える。

　表示パネル５２１は、ＬＣＤ（Liquid Crystal Display）、ＯＥＬＤ（Organic Electro-Luminescence Display）などを表示デバイスとして用いたものである。操作パネル５２２は、表示パネル５２１の表示面上に表示される画像を視認可能に載置され、ユーザの指や尖筆によって操作される一又は複数の座標を検出するデバイスである。かかるデバイスをユーザの指や尖筆によって操作すると、操作に起因して発生する検出信号を主制御部５０１に出力する。次いで、主制御部５０１は、受信した検出信号に基づいて、表示パネル５２１上の操作位置（座標）を検出する。

　図１４に示すように、本発明の撮像装置１０の一実施形態として例示しているスマートフォン５００の表示パネル５２１と操作パネル５２２とは一体となって表示入力部５２０を構成しているが、操作パネル５２２が表示パネル５２１を完全に覆うような配置となっている。かかる配置を採用した場合、操作パネル５２２は、表示パネル５２１外の領域についても、ユーザ操作を検出する機能を備えてもよい。換言すると、操作パネル５２２は、表示パネル５２１に重なる重畳部分についての検出領域（以下、表示領域と称する）と、それ以外の表示パネル５２１に重ならない外縁部分についての検出領域（以下、非表示領域と称する）とを備えていてもよい。

　なお、表示領域の大きさと表示パネル５２１の大きさとを完全に一致させてもよいが、両者を必ずしも一致させる必要は無い。また、操作パネル５２２が、外縁部分と、それ以外の内側部分の２つの感応領域を備えていてもよい。さらに、外縁部分の幅は、筐体５０２の大きさなどに応じて適宜設計されるものである。また、操作パネル５２２で採用される位置検出方式としては、マトリクススイッチ方式、抵抗膜方式、表面弾性波方式、赤外線式、電磁誘導方式、静電容量方式などが挙げられ、いずれの方式を採用することもできる。

　通話部５３０は、スピーカ５３１やマイクロホン５３２を備え、マイクロホン５３２を通じて入力されたユーザの音声を主制御部５０１にて処理可能な音声データに変換して主制御部５０１に出力したり、無線通信部５１０あるいは外部入出力部５６０により受信された音声データを復号してスピーカ５３１から出力するものである。また、図１４に示すように、例えば、スピーカ５３１、マイクロホン５３２を表示入力部５２０が設けられた面と同じ面に搭載することができる。

　操作部５４０は、キースイッチなどを用いたハードウェアキーであって、ユーザからの指示を受け付けるものである。例えば、図１４に示すように、操作部５４０は、スマートフォン５００の筐体５０２の側面に搭載され、指などで押下されるとオンとなり、指を離すとバネなどの復元力によってオフ状態となる押しボタン式のスイッチである。

　記憶部５５０は、主制御部５０１の制御プログラム、制御データ、アプリケーションソフトウェア、通信相手の名称及び電話番号などを対応づけたアドレスデータ、送受信した電子メールのデータ、ＷｅｂブラウジングによりダウンロードしたＷｅｂデータ、及びダウンロードしたコンテンツデータを記憶し、又ストリーミングデータなどを一時的に記憶するものである。また、記憶部５５０は、スマートフォン内蔵の内部記憶部５５１と着脱自在な外部メモリスロットを有する外部記憶部５５２により構成される。なお、記憶部５５０を構成するそれぞれの内部記憶部５５１と外部記憶部５５２は、フラッシュメモリタイプ（flash memory type）、ハードディスクタイプ（hard disk type）、マルチメディアカードマイクロタイプ（multimedia card micro type）、カードタイプのメモリ（例えば、Micro SD（登録商標）メモリ等）、ＲＡＭ（Random Access Memory）、ＲＯＭ（Read Only Memory）などの記録媒体を用いて実現される。

　外部入出力部５６０は、スマートフォン５００に連結される全ての外部機器とのインターフェースの役割を果たすものであり、他の外部機器に通信等（例えば、ユニバーサルシリアルバス（ＵＳＢ）、及びＩＥＥＥ１３９４など）又はネットワーク（例えば、インターネット、無線ＬＡＮ（Local Area Network）、ブルートゥース（Bluetooth）（登録商標）、ＲＦＩＤ（Radio Frequency Identification）、赤外線通信（Infrared Data Association：ＩｒＤＡ）（登録商標）、ＵＷＢ（Ultra Wideband）（登録商標）、ジグビー（ZigBee）（登録商標）など）により直接的又は間接的に接続するためのものである。

　スマートフォン５００に連結される外部機器としては、例えば、有／無線ヘッドセット、有／無線外部充電器、有／無線データポート、カードソケットを介して接続されるメモリカード（Memory card）、ＳＩＭ（Subscriber Identity Module Card）／ＵＩＭ（UserIdentity Module Card）カード、又はオーディオ・ビデオＩ／Ｏ（Input/Output）端子を介して接続される外部オーディオビデオ機器、無線接続される外部オーディオビデオ機器、有／無線接続されるスマートフォン、有／無線接続されるパーソナルコンピュータ、有／無線接続されるＰＤＡ、及びイヤホンなどがある。外部入出力部５６０は、このような外部機器から伝送を受けたデータをスマートフォン５００の内部の各構成要素に伝達し、又はスマートフォン５００の内部のデータを外部機器に伝送することが可能である。

　ＧＰＳ受信部５７０は、主制御部５０１の指示にしたがって、ＧＰＳ衛星ＳＴ１～ＳＴｎから送信されるＧＰＳ信号を受信し、受信した複数のＧＰＳ信号に基づく測位演算処理を実行し、スマートフォン５００の緯度、経度、及び高度からなる位置を検出する。ＧＰＳ受信部５７０は、無線通信部５１０や外部入出力部５６０（例えば、無線ＬＡＮ）から位置情報を取得できる時には、その位置情報を用いて位置を検出することもできる。

　モーションセンサ部５８０は、例えば、３軸の加速度センサ及びジャイロセンサなどを備え、主制御部５０１の指示にしたがって、スマートフォン５００の物理的な動きを検出する。スマートフォン５００の物理的な動きを検出することにより、スマートフォン５００の動く方向や加速度が検出される。この検出結果は、主制御部５０１に出力されるものである。

　電源部５９０は、主制御部５０１の指示にしたがって、スマートフォン５００の各部に、バッテリ（図示しない）に蓄えられる電力を供給するものである。

　主制御部５０１は、マイクロプロセッサを備え、記憶部５５０が記憶する制御プログラム及び制御データにしたがって動作し、スマートフォン５００の各部を統括して制御するものである。また、主制御部５０１は、無線通信部５１０を通じて、音声通信やデータ通信を行うために、通信系の各部を制御する移動通信制御機能及びアプリケーション処理機能を備える。

　アプリケーション処理機能は、記憶部５５０が記憶するアプリケーションソフトウェアにしたがって主制御部５０１が動作することにより実現するものである。アプリケーション処理機能としては、例えば、外部入出力部５６０を制御して対向機器とデータ通信を行う赤外線通信機能や、電子メールの送受信を行う電子メール機能、Ｗｅｂページを閲覧するＷｅｂブラウジング機能、本発明にかかる圧縮処理を行う画像処理機能などがある。

　また、主制御部５０１は、受信データやダウンロードしたストリーミングデータなどの画像データ（静止画や動画のデータ）に基づいて、映像を表示入力部５２０に表示する等の画像処理機能を備える。画像処理機能とは、主制御部５０１が、上記画像データを復号し、かかる復号結果に画像処理を施して、画像を表示入力部５２０に表示する機能のことをいう。

　さらに、主制御部５０１は、表示パネル５２１に対する表示制御と、操作部５４０、操作パネル５２２を通じたユーザ操作を検出する操作検出制御を実行する。

　表示制御の実行により、主制御部５０１は、アプリケーションソフトウェアを起動するためのアイコン及びスクロールバーなどのソフトウェアキーを表示したり、或いは電子メールを作成するためのウィンドウを表示する。なお、スクロールバーとは、表示パネル５２１の表示領域に収まりきれない大きな画像などについて、画像の表示部分を移動する指示を受け付けるためのソフトウェアキーのことをいう。

　また、操作検出制御の実行により、主制御部５０１は、操作部５４０を通じたユーザ操作を検出したり、操作パネル５２２を通じてアイコンに対する操作、及びウィンドウの入力欄に対する文字列の入力を受け付け、或いはスクロールバーを通じた表示画像のスクロール要求を受け付ける。

　さらに、操作検出制御の実行により主制御部５０１は、操作パネル５２２に対する操作位置が、表示パネル５２１に重なる重畳部分（表示領域）か、それ以外の表示パネル５２１に重ならない外縁部分（非表示領域）かを判定し、操作パネル５２２の感応領域及びソフトウェアキーの表示位置を制御するタッチパネル制御機能を備える。

　また、主制御部５０１は、操作パネル５２２に対するジェスチャ操作を検出し、検出したジェスチャ操作に応じて、予め設定された機能を実行することもできる。ジェスチャ操作とは、従来の単純なタッチ操作ではなく、指などによって軌跡を描いたり、複数の位置を同時に指定したり、或いはこれらを組合せて、複数の位置から少なくとも１つについて軌跡を描く操作を意味する。

　カメラ部５４１は、ＣＭＯＳ（Complementary Metal Oxide Semiconductor）やＣＣＤ（Charge-Coupled Device）などの撮像素子を用いて電子撮影するデジタルカメラであり、図１に示した撮像装置１０に相当する。また、カメラ部５４１は、主制御部５０１の制御により、撮影によって得た静止画の画像データを、例えばＪＰＥＧ（Joint Photographic coding Experts Group）で圧縮し、又は動画の画像データを、例えばＨ．２６４／ＡＶＣで圧縮して記憶部５５０に記録したり、外部入出力部５６０や無線通信部５１０を通じて出力することができる。図１４に示すようにスマートフォン５００において、カメラ部５４１は表示入力部５２０と同じ面に搭載されているが、カメラ部５４１の搭載位置はこれに限らず、表示入力部５２０の背面に搭載されてもよいし、或いは、複数のカメラ部５４１が搭載されてもよい。なお、複数のカメラ部５４１が搭載されている場合、撮影に供するカメラ部５４１を切り替えて単独にて撮影したり、或いは、複数のカメラ部５４１を同時に使用して撮影することもできる。

　また、カメラ部５４１はスマートフォン５００の各種機能に利用することができる。例えば、表示パネル５２１にカメラ部５４１で取得した画像を表示することや、操作パネル５２２の操作入力のひとつとして、カメラ部５４１の画像を利用することができる。また、ＧＰＳ受信部５７０が位置を検出する際に、カメラ部５４１からの画像を参照して位置を検出することもできる。さらには、カメラ部５４１からの画像を参照して、３軸の加速度センサを用いずに、或いは、３軸の加速度センサ（ジャイロセンサ）と併用して、スマートフォン５００のカメラ部５４１の光軸方向を判断することや、現在の使用環境を判断することもできる。勿論、カメラ部５４１からの画像をアプリケーションソフトウェア内で利用することもできる。

　その他、静止画又は動画の画像データにＧＰＳ受信部５７０により取得した位置情報、マイクロホン５３２により取得した音声情報（主制御部等により、音声テキスト変換を行ってテキスト情報となっていてもよい）、モーションセンサ部５８０により取得した姿勢情報等などを付加して記憶部５５０に記録したり、外部入出力部５６０や無線通信部５１０を通じて出力することもできる。

　以上で本発明の例に関して説明してきたが、本発明は上述した実施の形態に限定されず、本発明の精神を逸脱しない範囲で種々の変形が可能であることは言うまでもない。

１　　　　：ストロボ
２　　　　：シャッタボタン
３　　　　：モードスイッチ
４　　　　：モードダイヤル
５　　　　：ズームボタン
５Ｔ　　　：テレボタン
５Ｗ　　　：ワイドボタン
６　　　　：十字ボタン
７　　　　：ＭＥＮＵ／ＯＫボタン
８　　　　：再生ボタン
９　　　　：ＢＡＣＫボタン
１０　　　：撮像装置
１１　　　：画像表示装置
１２　　　：撮影レンズ
３０　　　：モニタ
１０１　　：画像取得部
１０３　　：対象候補検出部
１０５　　：絞込部
１０７　　：代表位置算出部
１０９　　：表示制御部
１１０　　：ズームレンズ
１１１　　：情報追加部
１１３　　：代表サイズ算出部
１３０　　：絞り
１４０　　：レンズ駆動部
１５０　　：フォーカスレンズ
２１０　　：撮像素子
２３０　　：Ａ／Ｄ変換器
２４０　　：ＣＰＵ
２５０　　：操作部
２６０　　：記憶部

Claims

　画像表示装置であって、
　連続する画像を取得する画像取得部と、
　前記画像の各々において、一の対象に対する候補となる複数の対象候補を検出する対象候補検出部と、
　前記一の対象に対する候補となる前記複数の対象候補を一つの最終対象候補まで絞り込む絞込部と、
　前記複数の対象候補の位置の代表位置を算出する代表位置算出部と、
　前記代表位置算出部で算出された前記代表位置に基づいて、前記最終対象候補の対象枠を表示する表示制御部と、
　を備える画像表示装置。
　前記代表位置算出部は、前記最終対象候補の位置に基づいて、前記代表位置を算出するための前記対象候補を選択する請求項１に記載の画像表示装置。
　前記代表位置算出部は、前記最終対象候補の位置を中心にして、前記代表位置を算出するための前記対象候補を選択する範囲を決定する請求項２に記載の画像表示装置。
　前記代表位置算出部は、前記最終対象候補のサイズに基づいて、前記代表位置を算出するための前記対象候補を選択する範囲を決定する請求項３に記載の画像表示装置。
　前記代表位置算出部は、選択された前記対象候補が有する重み付けに応じて、前記代表位置を算出する請求項２から４のいずれか１項に記載の画像表示装置。
　前記複数の対象候補のサイズの代表である代表サイズを算出する代表サイズ算出部を備え、
　前記表示制御部は、前記代表サイズと前記代表位置とに基づいて、前記最終対象候補の対象枠を表示する請求項１から５のいずれか１項に記載の画像表示装置。
　前記代表サイズ算出部は、前記複数の対象候補のサイズの平均値、中央値、又は最頻値に基づいて、前記代表サイズを算出する請求項６に記載の画像表示装置。
　前記対象候補検出部が検出する前記対象は、物体である請求項１から７のいずれか１項に記載の画像表示装置。
　前記対象候補検出部が検出する前記対象は、顔又は瞳である請求項８に記載の画像表示装置。
　前記代表位置算出部は、前記複数の対象候補の位置の平均値、中央値、又は最頻値に基づいて、前記代表位置を算出する請求項１から９のいずれか１項に記載の画像表示装置。
　前記対象候補検出部によって検出された前記対象候補の位置情報を前記画像に記録する情報追加部を備える請求項１から１０のいずれか１項に記載の画像表示装置。
　画像表示装置であって、
　連続する画像であって、前記画像の各々において、一の対象に対する候補となる複数の対象候補の位置情報を有する画像を取得する画像取得部と、
　前記一の対象に対する候補となる前記複数の対象候補を一つの最終対象候補まで絞り込む絞込部と、
　前記複数の対象候補の位置の代表位置を算出する代表位置算出部と、
　前記代表位置算出部で算出された前記代表位置に基づいて、前記最終対象候補の対象枠を表示する表示制御部と、
　を備える画像表示装置。
　画像表示方法であって、
　連続する画像を取得するステップと、
　前記画像の各々において、一の対象に対する候補となる複数の対象候補を検出するステップと、
　前記一の対象に対する候補となる前記複数の対象候補を一つの最終対象候補まで絞り込むステップと、
　前記複数の対象候補の位置の代表位置を算出するステップと、
　前記代表位置に基づいて、前記最終対象候補の対象枠を表示するステップと、
　を含む画像表示方法。
　画像表示工程をコンピュータに実行させるプログラムであって、
　連続する画像を取得するステップと、
　前記画像の各々において、一の対象に対する候補となる複数の対象候補を検出するステップと、
　前記一の対象に対する候補となる前記複数の対象候補を一つの最終対象候補まで絞り込むステップと、
　前記複数の対象候補の位置の代表位置を算出するステップと、
　前記代表位置に基づいて、前記最終対象候補の対象枠を表示するステップと、
　を含む画像表示工程をコンピュータに実行させるプログラム。
　非一時的かつコンピュータ読取可能な記録媒体であって、前記記録媒体に格納された指令がコンピュータによって読み取られた場合に、
　連続する画像を取得するステップと、
　前記画像の各々において、一の対象に対する候補となる複数の対象候補を検出するステップと、
　前記一の対象に対する候補となる前記複数の対象候補を一つの最終対象候補まで絞り込むステップと、
　前記複数の対象候補の位置の代表位置を算出するステップと、
　前記代表位置に基づいて、前記最終対象候補の対象枠を表示するステップと、
　を含む画像表示工程をコンピュータに実行させる記録媒体。