JP2009123020A

JP2009123020A - 情報処理装置、情報処理方法、プログラム及び記憶媒体

Info

Publication number: JP2009123020A
Application number: JP2007297197A
Authority: JP
Inventors: Kenichi Abe; 健一阿部
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 2007-11-15
Filing date: 2007-11-15
Publication date: 2009-06-04

Abstract

【課題】メタデータから得られる情報を利用し、画像の集合の中から適切な代表画像の選定を行なうこと。
【解決手段】情報処理方法は、メモリに格納されている複数の画像のそれぞれに設定されているメタデータに基づいて、複数の画像を分類するためのカテゴリを取得し、複数の画像をカテゴリに従った画像の集合に分類する。画像の集合を構成するそれぞれの画像について、画像中に含まれる人物を示す人物領域を抽出し、画像に占める人物領域の割合に基づき、代表画像としての適合度を示す代表画像スコアをカテゴリに応じて算出し、算出結果に基づいてカテゴリに対応した代表画像を選定する。
【選択図】図７

Description

本発明は、メタデータから得られる情報を利用し、画像の集合の中から適切な代表画像の選定を行なう情報処理技術に関する。

近年、デジタルカメラやデジタルビデオ、画像を格納するに十分な容量の記憶媒体の普及により、一般のユーザが簡単に画像を収集し編集することができるようになっている。このような状況においては、膨大な数の画像から参照した画像を効率よく探すための手段が不可欠である。このために、画像の集合の中からその画像集合を最も良く表す画像を代表画像としてユーザに提示する機能が広く使用されている。

特許文献１は、動画像から代表画像を選定する処理を実行する構成を開示している。特許文献１では、画像に写っている人物の顔の向きを判定し、正面を向いている度合いの大きいものを高評価として代表画像を決定する。
特開２００４−３６１９８９号公報

通常、メタデータは、撮影した日付・時刻・場所等の情報、撮影時のイベント名・被写体となっている人物名、印刷指示情報等があり、撮影機器が自動で付与或いはユーザによって任意の情報を撮影後に付与される。また、画像に付与されるメタデータとは別に様々なメタデータを画像に関連付けて記憶し、関連づけられたメタデータを基に画像を分類する、あるいは画像を検索することで大量の画像をより効率よく扱うことが可能である。

しかしながら、特許文献１の手法では、画像にメタデータが付与されていた場合の利点を生かすことができない。

そこで、本発明は、メタデータから得られる情報を利用し、画像の集合の中から適切な代表画像の選定を可能にする情報処理技術の提供を目的とする。

本発明に係る情報処理装置は、記憶手段に格納されている複数の画像のそれぞれに設定されているメタデータに基づいて、前記複数の画像を分類するためのカテゴリを取得する取得手段と、
前記複数の画像を前記カテゴリに従った画像の集合に分類する分類手段と、
前記画像の集合を構成するそれぞれの画像について、当該画像に含まれる人物を示す人物領域を抽出する抽出手段と、
前記画像に占める前記人物領域の割合に基づき、代表画像としての適合度を示す代表画像スコアを前記カテゴリに応じて算出する算出手段と、
前記算出手段による算出結果に基づいて、前記カテゴリに対応した代表画像を選定する選定手段と、を備えることを特徴とする。

本発明によれば、メタデータから得られる情報を利用し、画像の集合の中から適切な代表画像の選定を行なうことが可能になる。

以下、図面を参照して、本発明の好適な実施形態を例示的に詳しく説明する。ただし、この実施の形態に記載されている構成要素はあくまで例示であり、本発明の技術的範囲は、特許請求の範囲によって確定されるのであって、以下の個別の実施形態によって限定されるわけではない。

図１は、本発明の実施形態にかかる情報処理装置の構成を示すブロック図である。図１において、マイクロプロセッサ（CPU）１１は、代表画像を選定するための演算、論理判断等を行なう。また、マイクロプロセッサ（CPU）１１は、アドレスバスAB、コントロールバスCB、データバスDBを介して、それらのバスに接続された各構成要素を制御する。

アドレスバスABは、CPU11が制御の対象とする構成要素を指定するためのアドレス信号を転送する。コントロールバスCBは、CPU１１が制御の対象とする各構成要素に対してCPU１１から印加されるコントロール信号を転送する。データバスDBは、各構成要素相互間のデータ転送を行なう。

読出し専用の固定メモリROM１２は、本実施形態で実行される処理プログラム等の制御プログラムコードを記憶する。書き込み可能なランダムアクセスメモリRAM１３は、各構成要素から送られた各種データの一時記憶に用いられる。外部メモリ（ＤＩＳＫ）１４には、文書要約処理を実行するプログラムコード等、各種アプリケーションプログラムが格納される。

キーボード（ＫＢ）１５は、アルファベットキー、ひらがなキー、カタカナキー、句読点等の文字記号入力キー、カーソル移動を支持するカーソル移動キー等の各種の機能キーを備えている。表示用ビデオメモリ（ＶＲＡＭ）１６は、表示すべきデータの表示パターンを蓄える。ＣＲＴコントローラ（ＣＲＴＣ）１７は、表示用ビデオメモリ（ＶＲＡＭ）１６に蓄えられた内容を後述の表示装置（ＣＲＴ）１８に表示する役割を担う。陰極線管、液晶パネル等の表示装置（CRT）１８には、ドット構成の表示パターン及びカーソルが、ＣＲＴコントローラ（ＣＲＴＣ）１７による制御によって表示される。

ネットワークコントローラ（ＮＩＣ）１９は、情報処理装置をＥｔｈｅｒｎｅｔ（登録商標）などのネットワークに接続する役割を担う。

かかる各構成要素からなる情報処理装置は、キーボード（ＫＢ）１５からの各種の入力及びネットワークコントローラ（ＮＩＣ）１９から供給されるネットワーク経由の各種の入力に応じて作動する。キーボード（ＫＢ）１５からの入力またはネットワークコントローラ（ＮＩＣ）１９からの入力が供給されると、まず、インタラプト信号がマイクロプロセッサ（ＣＰＵ）１１に送られる。マイクロプロセッサ（ＣＰＵ）１１は、外部メモリ（ＤＩＳＫ）１４内に記憶してある各種の制御信号を読み出し、それらの制御信号に従って各種の制御が行われる。

図２は、画像表示例を示す図である。この画像表示例は、ユーザがフォルダ等の管理単位を指定し、同フォルダ内で管理されている複数の画像データの一覧表示を指示することで実行される。

図示された一覧表示では、９枚の代表画像を３つの列に分けて表示している。それぞれの行は、他の行とは異なった観点で画像が選定され、それぞれソートされた結果を表示している。各観点に含まれる画像は他の観点にも含まれる可能性があり、観点の分類は各画像に付与されているメタデータにより行われる。

２００は、ＣＲＴ１８上に表示される画像の一覧表示画面である。

２０１は、その行に格納されている画像がどの観点により分類ソートされているかを表示する表示領域である。この行の観点は「人物」であり、画像が人物名によってソートされ、同じ名前の人物が写っている画像の中から1枚の代表画像が選ばれ表示される。

２０２は、代表画像２０３に写っている人物名を表示する。２０２は「○○太郎」という名前の人物が写っている画像集合であることを示す。２０２にはリンクが張ってあり、リンク先には、図３のように「○○太郎」が被写体となっている全ての画像が格納されている。２０３は、「○○太郎」が被写体となっている画像集合の中から最も良く人物を判定しやすい画像として選定された代表画像である。２０４は、同様に、「△△次郎」という人物を示す代表画像である。

２０５は、この行に表示されている画像が「イベント」という観点に基づいて分類、ソートされていることを表示する表示領域である。２０６は、「誕生会」を示す画像集合の代表画像である。

同様に、２０７は、この行に表示されている画像が「場所」という観点に基づき分類、ソートされていることを示す表示領域である。

「人物」を示す観点に格納される代表画像は人物がはっきりと視認できる画像を選定する必要があり、「イベント」を示す観点に格納される代表画像はイベントの全体像が把握できる画像であることが望ましい。

図３は、図２における「○○太郎」２０２が被写体となっている全ての画像を表示する表示部の例である。「○○太郎」２０２に設定されているリンクをマウスポインタでクリックする、或いは代表画像２０３をダブルクリックすると、図３に示す一覧表示画面に到達する。

３０１は、人物が被写体となっている全ての画像がＣＲＴ１８上に表示される一覧表示画面である。３０２は、人物名を示す表示領域であり、一覧表示されている画像のメタデータには「○○太郎」という人物の情報が付与されていることを示す。３０３は、「○○太郎」が非常に小さく写っている画像の一例である。３０４は、「○○太郎」が大きく写っている画像の一例である。

図２の代表画像２０３は、人物を観点として選定されているため、一覧表示画面３０１に含まれている全ての画像の中から最も「○○太郎」という人物が見やすい画像を選ぶ必要がある。例えば、画像３０３と画像３０４を比較した場合、画像３０３では人物領域が小さく人物の判定がしづらい。画像３０４は人物領域が大きく人物の確認がしやすい。本実施形態にかかる情報処理装置は、図２の２０３に表示される代表画像として画像３０３ではなく画像３０４のような人物を視認しやすい画像を選定する。

本実施形態では、人物の観点で表示される代表画像の選定基準に人物領域の大きさを使用しているが、本発明の趣旨はこれに限定されるものではない。例えば、人物の表示領域の輝度が低いもの、顔領域に影のあるもの、焦点距離が遠いものなどは代表画像として選定しないなどの観点から、人物を視認しやすい画像を選定することも可能である。

図４は、図２の「イベント」の観点により分類された「誕生会」をイベント情報として含む全ての画像の一覧表示画面である。

図２の「誕生会」に設定されているリンクをマウスポインタでクリックする、或いは「誕生会」の代表画像２０６をダブルクリックすると、図４の一覧表示画面に到達する。

４０１は、メタデータに４０２にイベント情報を有する全ての画像がＣＲＴ１８上に表示される一覧表示画面である。４０２は、イベント名を示す表示領域であり、一覧表示されている画像のメタデータには「誕生会」というイベントの情報が付与されていることを示す。４０３は、「誕生会」において人物が非常に大きく写っている画像の一例である。４０４は、「誕生会」において人物とケーキが写っている画像の一例である。

図２の代表画像２０６は、「イベント」を観点として選定されているため、一覧表示画面４０１に含まれている全ての画像の中から最も何のイベントであるかわかりやすい画像を選ぶ必要がある。例えば、画像４０３と画像４０４を比較した場合、画像４０３では人物領域が大部分を占めておりイベントの判定がしづらい。画像４０４は遠景になっておりイベントの確認がしやすい。本実施形態にかかる情報処理装置は、図２の２０６に表示される代表画像として画像４０３ではなく画像４０４のようなイベントの内容を確認しやすい画像を選定する。

図５は、図２で示した画像データに関連付けられて記憶されているメタデータ情報を例示的に示す図である。

メタデータには、＜撮影日＞、＜撮影時間＞、＜撮影場所＞、＜被写体＞、＜イベント＞などの情報が格納されており、これらの情報を用いて観点の分類を行なうことが可能である。

５０１は、画像に付与されているメタデータの例であり、図３の画像３０４に付与されているメタデータを例示的に示すものである。これらのデータにより、「人物」の観点では「○○太郎」に、「イベント」の観点では「国内旅行」に、「撮影場所」の観点では「富士裾野」に分類される。

５０２は、図４の画像４０４に付与されているメタデータを例示的に示すものである。これらのデータにより、この画像は「人物」の観点では「△△次郎」に、「イベント」の観点では「誕生会」に、「撮影場所」の観点では「自宅」に分類される。

図６は、代表画像の選定方法の処理の流れを説明するフローチャートであり、本処理は、ＣＰＵ１１の全体的な制御の下に実行される。代表画像の選定方法において、図２乃至図４で説明したように観点によって適切な代表画像を選定するために、分類するべき観点に応じて異なる代表画像選定ルールを適用することが可能である。

ステップＳ６０１において、代表画像を選定し、表示するために、ＣＰＵ１１は、画像集合を分類するカテゴリ（観点）を取得する。ＣＰＵ１１は、ＲＡＭ１３または外部メモリ（ＤＩＳＫ）１４に格納されている複数の画像（画像集合）の中から、各画像に設定されているメタデータに基づき、複数の画像を分類するカテゴリを取得する。ここで、カテゴリ（観点）の例として、被写体として特定される「人物」、被写体に関連した「イベント」、被写体の「撮影場所」の３つとして、以下、代表画像の選定処理を説明する。

ステップＳ６０２において、ＣＰＵ１１は、Ｓ６０１で取得されたカテゴリ（観点）が「人物」を示すカテゴリ（観点）であるか判定する。「人物」を示すカテゴリ（観点）であればステップＳ６０３に進み、「人物」を示すカテゴリ（観点）でなければステップＳ６０４に処理を進める。

ステップＳ６０３において、ＣＰＵ１１は、画像集合を分類するカテゴリ（観点）が「人物」の場合の代表画像選定処理を実行する。本ステップの詳細は後述する。

ステップＳ６０４において、ＣＰＵ１１は、Ｓ６０１で取得された画像集合を分類するカテゴリ（観点）が「イベント」であるか判定する。カテゴリ（観点）が「イベント」であればステップＳ６０５に進み、「イベント」を示すカテゴリ（観点）でなければステップＳ６０６に処理を進める。

ステップＳ６０５において、ＣＰＵ１１は、画像集合を分類するカテゴリ（観点）が「イベント」の場合の代表画像選定処理を実行する。本ステップの詳細は後述する。

ステップＳ６０６において、ＣＰＵ１１は、画像集合を分類するカテゴリ（観点）が「撮影場所」の場合の代表画像選定処理を実行する。本ステップの詳細は後述する。

（カテゴリ（観点）が「人物」の場合の代表画像選定処理１）
図７は、カテゴリ（観点）が「人物」の場合の代表画像選定処理１（図６のＳ６０３）の流れを説明するフローチャートである。本処理は、ＣＰＵ１１の全体的な制御に下に実行される。ここでは、全ての画像に対して被写体となっている人物毎に分類を行い、それぞれの人物の代表画像を選定する処理を説明する。

ステップＳ７０１において、ＣＰＵ１１は、全ての画像に対して被写体となっている人物を特定する。被写体となる人物は、例えば、図５のメタデータ内の＜被写体＞タグから得られる。また、たとえ＜被写体＞タグに記載されていない人物であっても、例えば＜メモ＞等のメタデータに対して言語的な解析を行い、ＣＰＵ１１は、被写体となる人物を抽出することもできる。

ステップＳ７０２において、ＣＰＵ１１は、ステップＳ７０１で特定された人物ごとに画像を分類する。ＣＰＵ１１は、分類された人物ごとに代表画像を選定する。

ステップＳ７０３において、ＣＰＵ１１は、ステップＳ７０２で分類された人物ごとの画像集合から先頭の画像を入力（セット）する。

ステップＳ７０４において、ＣＰＵ１１は、セットされた画像から人物領域を抽出する。

ステップＳ７０５において、ＣＰＵ１１は、ステップＳ７０４で人物領域が検出されたか否かを判定する。人物領域が検出されなかった場合、カテゴリ（観点）を「人物」とする代表画像としてふさわしくないので、その画像は、代表画像の候補から除外される。そして、ステップＳ７０８に処理を進め、次の画像のについて人物領域が含まれているか否かの判定を行なう。Ｓ７０５の判定で人物領域が検出された場合、Ｓ７０６に処理を進める。

ステップＳ７０６において、ＣＰＵ１１は、人物領域が検出された画像に対して、代表画像としての適合度を示す代表画像スコアを算出する。画像中に占める人物領域の割合が大きくなるのに応じて、大きい値の代表画像スコアが算出される。本実施形態では、人物の観点で表示される代表画像スコアの基準に人物領域の比率を使用しているが、本発明の趣旨はこの例に限定されるものでないことはいうまでもない。例えば、人物領域の輝度が低いもの、人物領域（顔領域）に影のあるもの、焦点距離が遠いものなどは、代表画像スコアを小さくするなどの方法により人物が視認しやすい画像を選定することも可能である。また、人物領域の輝度が高いもの、焦点距離が近いものなどは、輝度や焦点距離に応じて代表画像スコアを大きくすることも可能である。

ステップＳ７０７において、ＣＰＵ１１は、先のＳ７０６の処理により代表画像スコアが計算された画像を代表画像候補に追加する。

ステップＳ７０８において、ＣＰＵ１１は、全ての画像が検査し終わったかどうかを判定する。全ての画像が調査済みならばステップＳ７０９へ進み、そうでなければステップＳ７１０へ進み次の画像をセットして、Ｓ７０４以降の処理を同様に実行する。ステップＳ７０４からＳ７１０を繰り返すことによって、それぞれの人物に分類される全ての画像から代表画像スコアを持つ代表画像候補が選定される。

ステップＳ７０９において、ＣＰＵ１１は、代表画像スコアの算出結果に基づき、代表画像候補の中から最も代表候補スコアの高いものを該当する人物の代表画像として選定する。

ステップＳ７１１において、ＣＰＵ１１は、ステップＳ７０２で分類された全ての人物に対して代表画像の選定が終了したか否か判定する。全ての人物に対して代表画像の選定が終了していない場合は、Ｓ７０３に処理を戻し、次の人物に対する画像集合から代表画像を選定する処理を実行する。Ｓ７１１の判定で、全ての人物に対して、代表画像の選定が終了した場合は、処理を終了する。このようにして選定された人物の代表画像は、図２の代表画像２０３や代表画像２０４に示すように人物領域が大きく人物の確認に適した画像となる。

（カテゴリが「イベント」、「撮影場所」の場合の代表画像選定処理２、３）
図８は、カテゴリ（観点）が「イベント」、「撮影場所」の場合の代表画像選定処理２、３（Ｓ６０５、Ｓ６０６）の流れを説明するフローチャートである。本処理は、ＣＰＵ１１の全体的な制御に下に実行される。

ステップＳ８０１において、ＣＰＵ１１は、画像集合から先頭の画像を入力（セット）する。

ステップＳ８０２において、ＣＰＵ１１は、セットされた画像から人物領域を抽出する。

ステップＳ８０３において、ＣＰＵ１１は、代表画像としての適合度を示す代表画像スコアを計算する。ステップＳ８０２で抽出された人物領域が画像全体に占める割合が大きくなるのに応じて、小さい値の代表画像スコアが算出される。画像中に占める人物領域の割合が予め定められた閾値を超える場合、画像を代表画像の候補から除外される。

代表画像選定処理２、３（Ｓ６０５、Ｓ６０６）は、基本的には、図８のフローチャートに従った同様の処理の流れとなる。閾値の設定や人物領域の占有面積が画像全体に占める割合等に応じて、代表画像スコアを代表画像選定処理２と、代表画像選定処理３と、で異なるように算出する。例えば、人物領域が全く含まれない画像に関しては、代表画像選定処理３における代表画像スコアを代表画像選定処理２における代表画像スコアよりも高くすることで、撮影場所を表示するのにより適した代表画像を選定することが可能になる。

また、代表画像スコアの算出において、人物領域が画像全体に対してＡ％以下の場合、代表画像選定処理２における代表画像スコアをａ２、代表画像選定処理３における代表画像スコアをａ３とする。また、人物領域が画像全体に対してＡ％より大きい場合、代表画像選定処理２における代表画像スコアをｂ２、代表画像選定処理３における代表画像スコアをｂ３とするなど、代表画像スコアの算出処理を切り替えることも可能である。

ステップＳ８０４において、ＣＰＵ１１は、全ての画像に対して、人物領域の抽出と、代表画像スコアの計算処理とが終了したか判定し、処理が終了していない場合は、ステップＳ８０６に処理を進め、次の画像をセットする。そして、ＣＰＵ１１は、処理をステップＳ８０２に進め、セットされた画像に対して、Ｓ８０２以降の処理を同様に実行する。

Ｓ８０４の判定で、全ての画像の処理が終了している場合には、ステップＳ８０５において、ＣＰＵ１１は、代表画像候補の中から最も代表候補スコアの高いものを代表画像として選定する。このようにして選定された代表画像は、図２の代表画像２０６に示すように人物領域が大きすぎずイベントや撮影場所の確認に適した画像となる。

図８に示した処理において、代表画像スコアの計算には、人物領域の大きさを利用したが、人物領域以外のオブジェクトの大きさを利用しても良い。また、メタデータから焦点距離を取得して代表画像スコアに加味してもよい。以上説明した手順を経ることにより、画像の集合のうち、各画像に設定されているメタデータから得られたカテゴリ（観点）に分類し、各カテゴリ（観点）に応じた代表画像を選定することができる。

上述した実施形態においては、デジタルカメラ等で撮影された静止画像を対象としていたが、デジタルビデオカメラ等で撮影された動画像におけるフレーム画像を対象とすることも可能である。この場合、各フレーム画像をカテゴリに分類し、それぞれのカテゴリに応じた代表画像スコアを算出することで、代表画像に対応するフレーム画像を選定することが可能になる。

代表画像スコアの算出は、図６乃至図８と同様に、分類されたカテゴリ、人物領域の面積、人物領域の輝度または焦点距離に基づき、代表画像スコアの算出処理を切り替えることが可能である。

本実施形態によれば、メタデータから得られる情報を利用し、画像の集合の中から適切な代表画像の選定を行なうことが可能になる。

（他の実施形態）
なお、本発明の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録したコンピュータ可読の記憶媒体を、システムあるいは装置に供給することによっても、達成されることは言うまでもない。また、システムあるいは装置のコンピュータ（またはＣＰＵやＭＰＵ）が記憶媒体に格納されたプログラムコードを読出し実行することによっても、達成されることは言うまでもない。

この場合、記憶媒体から読出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。

プログラムコードを供給するための記憶媒体としては、例えば、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、ＣＤ−ＲＯＭ、ＣＤ−Ｒ、不揮発性のメモリカード、ＲＯＭなどを用いることができる。

また、コンピュータが読出したプログラムコードを実行することにより、前述した実施形態の機能が実現される。また、プログラムコードの指示に基づき、コンピュータ上で稼働しているＯＳ（オペレーティングシステム）などが実際の処理の一部または全部を行い、その処理によって前述した実施形態が実現される場合も含まれることは言うまでもない。

本発明の実施形態にかかる情報処理装置の構成を示すブロック図である。本発明の実施形態に係る画像表示例を示す図である。本発明の実施形態に係る画像表示例を示す図である。本発明の実施形態に係る画像表示例を示す図である。画像データに関連付けられて記憶されているメタデータ情報を例示的に示す図である。代表画像の選定方法の処理の流れを説明するフローチャートである。カテゴリが「人物」の場合の代表画像選定処理１の流れを説明するフローチャートである。カテゴリが「イベント」、「撮影場所」の場合の代表画像選定処理２、３の流れを説明するフローチャートである。

符号の説明

１１ＣＰＵ
１２ＲＯＭ
１３ＲＡＭ
１４外部メモリ
１５キーボード（ＫＢ）
１６表示用ビデオメモリ（ＶＲＡＭ）
１７ＣＲＴコントローラ（ＣＲＴＣ）
１８表示装置（ＣＲＴ）
１９ネットワークコントローラ（ＮＩＣ）

Claims

記憶手段に格納されている複数の画像のそれぞれに設定されているメタデータに基づいて、前記複数の画像を分類するためのカテゴリを取得する取得手段と、
前記複数の画像を前記カテゴリに従った画像の集合に分類する分類手段と、
前記画像の集合を構成するそれぞれの画像について、当該画像に含まれる人物を示す人物領域を抽出する抽出手段と、
前記画像に占める前記人物領域の割合に基づき、代表画像としての適合度を示す代表画像スコアを前記カテゴリに応じて算出する算出手段と、
前記算出手段による算出結果に基づいて、前記カテゴリに対応した代表画像を選定する選定手段と、
を備えることを特徴とする情報処理装置。
前記算出手段は、前記取得手段で取得された前記カテゴリに応じて、前記代表画像スコアの算出処理を切り替えることを特徴とする請求項１に記載の情報処理装置。
前記選定手段は、前記算出手段により算出された最も大きい値の代表画像スコアの画像を前記代表画像として選定することを特徴とする請求項１に記載の情報処理装置。
前記カテゴリには、被写体として特定される人物、前記被写体に関連したイベント、前記被写体の撮影場所が含まれることを特徴とする請求項１または請求項２に記載の情報処理装置。
前記被写体として特定される人物のカテゴリに分類された画像に対して、前記算出手段は、前記画像に占める前記人物領域の割合が大きくなるのに応じて、大きい値の代表画像スコアを算出することを特徴とする請求項４に記載の情報処理装置。
前記被写体に関連したイベントまたは前記被写体の撮影場所に分類された画像に対して、前記算出手段は、前記画像に占める前記人物領域の割合が大きくなるのに応じて、小さい値の代表画像スコアを算出することを特徴とする請求項４に記載の情報処理装置。
前記被写体として特定される人物のカテゴリに分類された画像に関して前記人物領域が抽出されない場合、前記抽出手段は、前記画像を代表画像の候補から除外することを特徴とする請求項４に記載の情報処理装置。
前記被写体に関連したイベントまたは前記被写体の撮影場所に分類された画像に関して、前記画像に占める前記人物領域の割合が予め定められた閾値を超える場合、前記抽出手段は、前記画像を代表画像の候補から除外することを特徴とする請求項４に記載の情報処理装置。
取得手段が、記憶手段に格納されている複数の画像のそれぞれに設定されているメタデータに基づいて、前記複数の画像を分類するためのカテゴリを取得する取得工程と、
分類手段が、前記複数の画像を前記カテゴリに従った画像の集合に分類する分類工程と、
抽出手段が、前記画像の集合を構成するそれぞれの画像について、当該画像に含まれる人物を示す人物領域を抽出する抽出工程と、
算出手段が、前記人物領域に対して、代表画像としての適合度を示す代表画像スコアを前記カテゴリに応じて算出する算出工程と、
選定手段が、前記算出手段による算出結果に基づいて、前記カテゴリに対応した代表画像を選定する選定工程と、
を備えることを特徴とする情報処理方法。
前記算出工程では、前記取得工程で取得された前記カテゴリに応じて、前記代表画像スコアの算出処理を切り替えることを特徴とする請求項９に記載の情報処理方法。
前記選定工程では、前記算出工程により算出された最も大きい値の代表画像スコアの画像を前記代表画像として選定することを特徴とする請求項９に記載の情報処理方法。
前記カテゴリには、被写体として特定される人物、前記被写体に関連したイベント、前記被写体の撮影場所が含まれることを特徴とする請求項９または請求項１０に記載の情報処理方法。
前記被写体として特定される人物のカテゴリに分類された画像に対して、前記算出工程では、前記画像に占める前記人物領域の割合が大きくなるのに応じて、大きい値の代表画像スコアを算出することを特徴とする請求項１２に記載の情報処理方法。
前記被写体に関連したイベントまたは前記被写体の撮影場所に分類された画像に対して、前記算出工程は、前記画像に占める前記人物領域の割合が大きくなるのに応じて、小さい値の代表画像スコアを算出することを特徴とする請求項１２に記載の情報処理方法。
前記被写体として特定される人物のカテゴリに分類された画像に関して前記人物領域が抽出されない場合、前記抽出工程では、前記画像を代表画像の候補から除外することを特徴とする請求項１２に記載の情報処理方法。
前記被写体に関連したイベントまたは前記被写体の撮影場所に分類された画像に関して、前記画像に占める前記人物領域の割合が予め定められた閾値を超える場合、前記抽出工程では、前記画像を代表画像の候補から除外することを特徴とする請求項１２に記載の情報処理方法。
請求項９乃至請求項１６のいずれか１項に記載の情報処理方法をコンピュータに実行させることを特徴とするプログラム。
請求項１７に記載のプログラムを格納したことを特徴とするコンピュータ可読の記憶媒体。