<実施の形態1>
以下、本発明に係る画像分類装置の一実施形態として、複数枚の画像からなる画像グループ単位でその画像グループの特徴を示す画像グループ特徴情報を算出し、算出した画像グループ特徴情報と、画像グループの分類先であるイベントの特徴を示す情報とに基づいて、画像グループ単位で画像を互いに異なるイベントのうちのいずれかのイベントに分類する画像分類装置について説明する。
ここで画像グループとは、ユーザによって指定された複数の画像からなる画像の集合のことであって、例えば、2009年初夏に六甲山にピクニックにいった際に撮影された画像の集合や、例えば、2008年冬に志賀高原にスキーに行った際に撮影された画像の集合等である。
また、ここで、イベントとは、共通の特徴を持つ画像グループの内容を表すものであって、例えば、ピクニックに行った際に撮影された画像からなる画像グループの集合はピクニックというイベントに、スキーに行った際に撮影された画像からなる画像グループの集合はスキーというイベント等に分類される。
<構成>
<画像分類装置100のハードウエア構成>
図1は、画像分類装置100の主要なハードウエア構成を示すハードウエアブロック図である。
画像分類装置100は、デジタル写真である画像を、JPEG(Joint Photographic Experts Group)方式で符号化されたデータとして記憶し、記憶する画像を分類する。
画像分類装置100は、デジタルスチルカメラ192に代表される、画像を記録している機器と、着脱可能なUSBケーブル195を介して接続し、画像を表示するためのディスプレイ193と、モニタケーブル196を介して接続し、ネットワーク194と接続し、ユーザからの操作コマンドを受け付けるリモコン197と無線通信を行い、SDメモリカード191等で代表される外部記録媒体に対して、データの読み出しと書き込みとを行う。
画像分類装置100は、システムLSI(Large Scale Integrated circuit)110と、ハードディスク装置130と、外部記録媒体読取書込装置140と、USB制御装置150と、出力装置160と、入力装置170と、通信装置180とから構成される。
システムLSI110は、CPU101と、ROM102と、RAM103と、ハードディスク装置インターフェース104と、外部記録媒体読取書込装置インターフェース105と、USB(Universal Serial Bus)制御装置インターフェース106と、出力装置インターフェース107と、入力装置インターフェース108と、通信装置インターフェース109と、デコーダ111と、バスライン120とを1つの集積回路に統合したLSIであって、ハードディスク装置130、外部記録媒体読取書込装置140、USB制御装置150、出力装置160、入力装置170、通信装置180と接続する。
CPU101は、バスライン120と接続し、ROM102又はRAM103に記憶されているプログラムを実行することで、ROM102、RAM103、ハードディスク装置130、外部記録媒体読取書込装置140、USB制御装置150、出力装置160、入力装置170、通信装置180、デコーダ111を制御して、様々な機能、例えば、ハードディスク装置130から符号化された画像データを読み出して復号し、復号した画像データをディスプレイ193に出力する機能等を実現する。
ROMはバスライン120と接続し、CPU101の動作を規定するプログラムと、CPUが利用するデータとを記憶している。
RAM103は、バスライン120と接続し、CPU101がプログラムを実行することに伴って発生するデータを一時的に記憶し、また、ハードディスク装置130、外部記録媒体読取書込装置140から読み取ったデータや書き込むデータ、通信装置180が受信したデータや送信するデータ等を一時的に記憶する。
デコーダ111は、符号化された画像データを復号する機能を有するDSP(Digital Signal Processor)であって、バスライン120と接続し、CPU101によって制御され、JPEGデコード機能を有する。
ハードディスク装置インターフェース104は、ハードディスク装置130とバスライン120とに接続し、ハードディスク装置130とバスライン120との信号のやり取りを仲介するものである。
外部記録媒体読取書込装置インターフェース105は、外部記録媒体読取書込装置140とバスライン120とに接続し、外部記録媒体読取書込装置140とバスライン120との信号のやり取りを仲介するものである。
USB制御装置インターフェース106は、USB制御装置150とバスライン120とに接続し、USB制御装置150とバスライン120との信号のやり取りを仲介するものである。
出力装置インターフェース107は、出力装置160とバスライン120とに接続し、出力装置160とバスライン120との信号のやり取りを仲介するものである。
入力装置インターフェース108は、入力装置170とバスライン120とに接続し、入力装置170とバスライン120との信号のやり取りを仲介するものである。
通信装置インターフェース109は、通信装置180とバスライン120とに接続し、通信装置180とバスライン120との信号のやり取りを仲介するものである。
ハードディスク装置130は、ハードディスク装置インターフェース104と接続し、CPU101によって制御され、内蔵するハードディスクにデータを書き込む機能と、内蔵するハードディスクに書き込まれているデータを読み取る機能を有する。
外部記録媒体読取書込装置140は、外部記録媒体読取書込装置インターフェース105と接続し、CPU101によって制御され、外部記録媒体にデータを書き込む機能と、外部記録媒体に書き込まれているデータを読み取る機能とを有する。
ここで、外部記録媒体とは、DVD(Digital Versatile Disc)、DVD−R、DVD−RAM、BD(Blu-ray Disc)、BD−R、BD−RE、SDメモリカード191等であって、外部記録媒体読取書込装置140は、これら、DVD、BD等からのデータの読み取りや、DVD−R、BD−R、BD−RE、SDメモリカード等へのデータの書き込みと読み取りとをすることができる。
USB制御装置150は、USB制御装置インターフェース106と接続し、CPU101によって制御され、着脱可能なUSBケーブル195を介して外部機器にデータを書き込む機能と、外部機器に書き込まれているデータを読み取る機能とを有する。
ここで、外部機器とは、デジタルスチルカメラ192、パーソナルコンピュータ、カメラ機能付き携帯電話機等の、画像を記憶する機器であって、USB制御装置150は、USBケーブル195を介してこれら外部機器へのデータの書き込みと読み取りとをすることができる。
出力装置160は、出力装置インターフェース107と、モニタケーブル196とに接続し、CPU101によって制御され、モニタケーブル196を介してディスプレイ193に表示させるデータを出力する。
入力装置170は、入力装置インターフェース108と接続し、CPU101によって制御され、リモコン197から無線で送信されるユーザからの操作コマンドを受け付け、受け付けた操作コマンドをCPU101に送信する機能を有する。
通信装置180は、通信装置インターフェース109と、ネットワーク194とに接続し、CPU101によって制御され、ネットワーク194を介して、外部通信機器とデータの送受信を行う機能を有する。
ここで、ネットワーク194とは、光通信回線、電話回線、無線回線等によって実現されており、外部通信機器や、インターネット等と接続している。
また、外部通信機器とは、外部ハードディスク装置等といった、画像や、CPU101の動作を規定するプログラム等を記憶する機器であって、通信装置180は、ネットワーク194を介してこれら外部通信機器からデータの読み取りとすることができる。
以上のようなハードウエアで実現される画像分類装置100は、CPU101が、ROM102又はRAM103に記憶されているプログラムを実行し、ROM102、RAM103、ハードディスク装置130、外部記録媒体読取書込装置140、USB制御装置150、出力装置160、入力装置170、通信装置180、デコーダ111を制御することで様々な機能を実現する。
以下、図面を用いて、画像分類装置100の機能構成を説明する。
<画像分類装置100の機能構成>
図2は、画像分類装置100の主要な機能ブロックの構成を示す機能ブロック図である。
画像分類装置100は、画像グループデータ受付部201、画像書込読出部202、画像特徴情報書込読出部203、画像グループ特徴情報書込読出部204、画像特徴算出部205、画像グループ特徴算出部206、イベント特徴算出部207、画像グループ分類部208、イベント特徴情報書込読出部209、分類結果出力部210、画像グループ情報受付部211、イベント情報受付部212、画像記憶部231、画像特徴情報記憶部232、画像グループ特徴情報記憶部233、イベント特徴情報記憶部234とから構成される。
画像特徴算出部205は、さらに、画像特徴算出制御部221、顔特徴量抽出部222、色特徴量抽出部223、物体特徴量抽出部224とから構成される。
画像グループデータ受付部201は、画像書込読出部202と接続し、2枚以上の画像からなる画像グループ241の画像の指定を受け付け、指定された画像群を、1つの画像グループに含まれる画像群として読み込む機能を有する。
画像グループデータ受付部201が画像を受け付ける場合には、外部記録媒体読取書込装置140経由で外部記録媒体から画像を受け付ける場合と、USB制御装置150経由で外部機器から画像を受け付ける場合と、通信装置180経由で外部通信機器から画像を受け付ける場合とがある。
また、画像グループデータ受付部201は、画像を受け付ける際に、その画像を特定するための画像IDを付与する機能を有する。
画像記憶部231は、画像としてのデジタル写真を、JPEG方式で符号化された画像データとして記憶するための記憶領域であって、ハードディスク装置130に内蔵されているハードディスクの一部の領域として実装されている。
画像記憶部231に記憶される各データは、ファイルシステム配下において、論理的にディレクトリ構造により管理されている。
図3は画像記憶部231のディレクトリ構造を示すディレクトリ構造図である。
同図に示されているように、画像記憶部231のディレクトリ構造は、最上位階層310と、第1ディレクトリ階層320と、第2ディレクトリ階層330との合計3階層からなっている。
第1ディレクトリ階層320には、花火イベントディレクトリ321、ピクニックイベントディレクトリ322、スキーイベントディレクトリ323等の複数のイベントディレクトリと、実データ保管ディレクトリ324とが存在する。
ここで、イベントディレクトリとは、画像グループの分類先であるイベントと同じ名前を持つディレクトリであって、同じ名前のディレクトリは1つしか存在しない。
実データ保管ディレクトリ324は、画像を保持するディレクトリであって、画像のデータはこの実データ保管ディレクトリ324のみに保持される。
第2ディレクトリ階層330には、Y川花火大会2004画像グループディレクトリ331、P社花火大会2005画像グループディレクトリ332、六甲山2009初夏画像グループディレクトリ等の複数の画像グループディレクトリが存在する。
画像グループディレクトリは、画像グループデータ受付部201が受け付けた画像群からなる画像グループに対応するディレクトリであって、実データ保管ディレクトリ324に保持されているデータのうち、その画像グループに属する全ての画像のデータのアドレスを示す情報が保持されることによって、その画像のデータがリンクされている状態となっているディレクトリである。
各画像グループディレクトリは、対応する画像グループが分類されているイベントに対応するイベントディレクトリの下に存在している。
もし、複数のイベントに分類されている画像グループが存在する場合には、分類されているイベントの数だけ、同一名称で同一の画像がリンクされているディレクトリが存在する。
再び図2に戻って、画像分類装置100の機能構成の説明を続ける。
画像書込読出部202は、画像特徴算出部205と、画像特徴算出制御部221と、画像グループ分類部208とに接続し、画像記憶部231に記憶されている画像を読み出す機能と、画像記憶部231に画像を書き込む機能と、画像記憶部231のディレクトリ構造を変更する機能と、画像データのリンクを変更する機能とを有する。
顔特徴量抽出部222は、画像特徴算出制御部221と接続し、人の顔の特徴を示す予め定められた顔のモデルを保持し、保持する顔のモデルを参照することで、1枚の画像に含まれる顔の認識を試み、認識した顔の個数と、認識した顔の領域の面積に対する画像全体の面積の面積比率とを、顔特徴量として算出する機能と、認識した認識顔それぞれに、その認識顔を特定するための顔IDを、シーケンシャルに付与する機能とを有する。
ここで、顔のモデルとは、例えば、目、鼻、口等の顔を形成するパーツの輝度や、相対的な位置関係に関する情報等である。
色特徴量抽出部223は、画像特徴算出制御部221と接続し、画像に含まれる各画素について、その画素を構成する色成分、例えば、Red、Green、Blueの各輝度から、その画素の色が、例えば、黒、青、緑、白等のうちのいずれの色であるかを特定する機能と、特定された色のそれぞれに対して、その色に特定された画素数に対する画像に含まれる全画素数の比率とを、色特徴量として算出する機能を有する。
ここで、ある画素が、例えば、黒であると特定する方法としては、例えば、その画素のRedの輝度と、Greenの輝度と、Blueの輝度とが、全て10%未満である場合に、その画素を黒であると特定するといった方法がある。
物体特徴量抽出部224は、画像特徴算出制御部221と接続し、物の特徴を示す予め定められた物のモデルと、そのモデルに対応する物の名称とを保持し、保持する物のモデルを参照することで、1枚の画像に含まれる物の認識を試み、物の認識に成功した場合に、その認識した物のモデルに対応する物の名称を、物体特徴量として算出する機能を有する。
ここで、物のモデルとは、例えば、車のモデルであれば、例えば、フロントガラス、タイヤ、ヘッドライト等の車を形成するパーツの輝度や、相対的な位置関係に関する情報等である。
画像特徴算出制御部221は、画像書込読出部202と、画像特徴情報書込読出部203と、顔特徴量抽出部222と、色特徴量抽出部223と、物体特徴量抽出部224とに接続する。
画像特徴算出制御部221は、画像書込読出部202を介して、画像記憶部231から1枚の画像を読み出し、読み出した1枚の画像に対して、顔特徴量抽出部222と、色特徴量抽出部223と、物体特徴量抽出部224とを用いて、画像特徴情報を算出する機能を有する。
画像特徴情報の詳細については後述する。
画像特徴情報記憶部232は、画像特徴情報を記憶するための記憶領域であって、ハードディスク装置130に内蔵されているハードディスクの一部の領域として実装されている。
図4は、画像特徴情報記憶部232に記憶されている画像特徴情報のデータ構造を示す図である。
同図に示されているように、画像特徴情報記憶部232に記憶されている各画像特徴情報は、対応する画像を示す画像ID401と、対応する画像の色の特徴を示す色特徴量403と、対応する画像に含まれる、顔特徴量抽出部222によって認識顔(以下、認識顔という。)の特徴を示す顔特徴量404と、対応する画像に含まれる認識された物の特徴を示す物体特徴量405とから構成される。
色特徴量403は、色特徴量抽出部223によって算出された各色の画素数比率からなり、その画像に含まれる色の特徴を示すものである。
例えば、画像ID401が01001である画像に対応する画像特徴情報の色特徴量403は、黒431が10%、青432が20%、緑433が60%、白435が10%の画像であることを示している。
顔特徴量404は、顔特徴量抽出部222によって算出された、各画像に含まれる認識顔毎のその認識顔の顔IDとその認識顔の領域の面積比率とその認識顔の領域の座標との組と、その画像に含まれる認識顔の数である顔数444と、その画像に含まれる認識顔の中で最も面積比率の高い顔の面積比率である最大顔面積445とからなり、その画像に含まれる認識顔の特徴を示すものである。
ここで、認識顔の領域の座標は、顔特徴量抽出部222によって認識顔の領域を取り囲む長方形のうち、最小面積の長方形の左上の頂点の座標と右下の頂点の座標との組からなる。
例えば、画像ID401が01001である画像に対応する画像特徴情報の顔特徴量404は、面積比率30%の顔0001と、面積比率10%の顔0002と、面積比率20%の顔0003等の顔が認識され、認識顔の数は5つで、認識顔の中で最も高い顔の面積比率は0.3であることを示している。
物体特徴量405は、物体特徴量抽出部224によって算出された、各画像に含まれる認識された物の名称を示すものである。
例えば、画像ID401が01001である画像に対応する画像特徴情報の物体特徴量405は、その画像に車の画像が含まれていることが認識されていることを示している。
再び図2に戻って、画像分類装置100の機能構成の説明を続ける。
画像特徴情報書込読出部203は、画像特徴算出制御部221と、画像グループ特徴算出部206とに接続し、画像特徴情報記憶部232に対して、画像特徴情報の読み出し、書き込みを行う機能を有する。
画像グループ情報受付部211は、画像グループ特徴算出部206と接続し、画像グループの名称を受け付ける機能を有する。
画像グループ特徴算出部206は、画像グループ情報受付部211と、画像特徴情報書込読出部203と、画像グループ特徴情報書込読出部204と接続する。
画像グループ特徴算出部206は、画像特徴情報書込読出部203を介して、画像特徴情報記憶部232から、1つの画像グループに属する全ての画像に対応する画像特徴情報を読み出し、読み出した画像特徴情報と、画像グループ情報受付部211から入力される画像グループの名称とを用いて、画像グループ特徴情報を算出する機能を有する。
画像グループ特徴情報の詳細については後述する。
また、画像グループ特徴算出部206は、算出した画像グループ特徴情報に、その画像グループ特徴情報を特定するための画像グループIDを付与する機能を有する。
画像グループ特徴情報記憶部233は、画像グループ特徴情報を記憶するための記憶領域であって、ハードディスク装置130に内蔵されているハードディスクの一部の領域として実装されている。
図5は、画像グループ特徴情報記憶部233に記憶されている各画像グループ特徴情報のデータ構造を示す図である。
同図に示されているように、画像グループ特徴情報記憶部233に記憶されている各画像グループ特徴情報は、対応する画像グループを示す画像グループID501と、対応する画像グループに属する画像の色の特徴を示す色特徴量平均502と、対応する画像グループに属する画像の認識顔の特徴を示す顔特徴量503と、対応する画像グループに属する画像の物の名称を示す物体特徴量504と、対応する画像グループに属する画像の枚数を示す総枚数505と、対応する画像グループの名称を示すグループ名506と、対応する画像グループが分類されているイベントのイベント名を示すイベント名507とから構成される。
色特徴量平均502は、対応する画像グループに属する画像の色特徴量の平均値であり、その画像グループの色の特徴を示すものである。
例えば、画像グループIDが0001である画像グループに対応する色特徴量平均502は、黒421が10%、青522が20%、緑523が40%、白524が30%という画像グループであることを示している。
顔特徴量503は、対応する画像グループに属する画像に含まれる認識顔のIDからなる顔ID531と、対応する画像グループに属する画像の最大顔面積445のうち最も大きなものである総最大顔面積532と、対応する画像グループに属する画像の顔数444の総和である合計顔数533と、認識顔を含む画像の枚数である顔枚数534と、対応する画像グループに属する画像の顔数444のうち最も大きなものである最大顔数535とからなり、その画像グループに含まれる認識顔の特徴を示すものである。
例えば、画像グループIDが0001である画像グループに対応する顔特徴量503は、顔0001、0002、0003等の顔が認識され、総最大顔面積は40%であり、合計顔数533は7で、顔枚数534は2枚であって、最大顔数535が5であることを示している。
物体特徴量504は、対応する画像グループに属する画像に含まれる認識された物体の特徴を示すものである。
例えば、画像グループIDが0001である画像グループに対応する物体特徴量504は、対応する画像グループに属する画像には、認識された車と認識された花とが存在することを示している。
グループ名506は、対応する画像グループの名前を示しており、ユーザによって指定されるものである。前述した画像グループディレクトリのディレクトリ名は、このグループ名506によって決定されたものである。
イベント名507は、対応する画像グループの分類先のイベントの名前を示しており、グループ名506によって決定された画像グループディレクトリ名のディレクトリの所属するイベントディレクトリは、このイベント名507によって決定されたものである。
再び図2に戻って、画像分類装置100の機能構成の説明を続ける。
画像グループ特徴情報書込読出部204は、画像グループ特徴算出部206と、イベント特徴算出部207と、画像グループ分類部208と接続し、画像グループ特徴情報記憶部233に対して画像グループ特徴情報の読み出し、書き込みを行う機能を有する。
イベント情報受付部212は、イベント特徴情報書込読出部209と接続し、イベント特徴情報を受け付ける機能を有する。
ここで、イベント特徴情報とは、画像グループをイベントに分類するための基準となる情報であって、詳細については後述する。
イベント特徴情報記憶部234は、イベント特徴情報を記憶するための記憶領域であって、ハードディスク装置130に内蔵されているハードディスクの一部の領域として実装されている。
図6は、イベント特徴情報記憶部234に記憶されているイベント特徴情報のデータ構造を示す図である。
同図に示されているように、イベント特徴情報は、画像グループを分類するための基準を示す基準情報601と、その基準情報601によって分類される分類先のイベントを示すイベント名611との組によって構成されている。
以下、個々の基準情報601とイベント名611との組について説明する。
黒0.4以上602という基準情報と、花火というイベント名との組は、花火というイベントに分類するという基準は、色特徴量平均502において黒が40%以上であるということを示す。
青0.4以上603という基準情報と、スキューバダイビングというイベント名との組は、スキューバダイビングというイベントに分類するという基準は、色特徴量平均502において青が40%以上であるということを示す。
緑0.4以上604という基準情報と、ピクニックというイベント名との組は、ピクニックというイベントに分類するという基準は、色特徴量平均502において緑が40%以上であるということを示す。
白0.4以上605という基準情報とスキーと、いうイベント名との組は、スキーというイベントに分類するという基準は、色特徴量平均502において白が40%以上であるということを示す。
人数5人以上606という基準情報と、大人数というイベント名との組は、大人数というイベントに分類するという基準は、合計顔数533が5以上であるということを示す。
人数4人以下607という基準情報と、小人数というイベント名との組は、小人数というイベントに分類するという基準は、合計顔数533が4以下であるとういうことを示す。
イベント特徴情報書込読出部209は、イベント情報受付部212と、イベント特徴算出部207と、画像グループ分類部208と接続し、イベント特徴情報記憶部234に対して、イベント特徴情報の読み出し、書き込みを行う機能を有する。
画像グループ分類部208は、画像書込読出部202と、画像グループ特徴情報書込読出部204と、イベント特徴情報書込読出部209と、分類結果出力部210とに接続する。
画像グループ分類部208は、画像グループ特徴情報書込読出部204を介して、画像グループ特徴情報記憶部233から画像グループ特徴情報を読み出し、読み出した画像グループ特徴情報と、イベント特徴情報記憶部234に記憶されているイベント特徴情報とに基づいて、読み出した画像グループ特徴情報に対応する画像グループを、イベントに分類する機能を有する。
イベント特徴算出部207は、画像グループ特徴情報書込読出部204と、イベント特徴情報書込読出部209と接続する。
イベント特徴算出部207は、画像グループ特徴情報書込読出部204を介して、画像グループ特徴情報記憶部233から1以上の画像グループ特徴情報を読み出し、読み出した画像グループ特徴情報を用いて、イベント特徴情報を作成する機能を有する。
分類結果出力部210は、画像グループ分類部208と接続し、画像グループ分類部が画像グループを分類した場合に、分類結果をディスプレイ193に表示させる機能を有する。
以上のように構成される画像分類装置100の行う動作について、以下、図面を用いて説明する。
<動作>
画像分類装置100の行う主な動作として、画像グループに属する画像を入力され、入力された画像グループをイベントに分類する画像グループ分類動作と、2以上の画像グループを指定され、指定された画像グループに共通の特徴を抽出することによって、新たにイベント特徴情報を生成するイベント特徴情報生成動作とがある。
以下、それぞれの動作について、図面を用いて説明する。
<画像グループ分類動作>
図7は、画像分類装置100の行う画像グループ分類動作のフローチャートである。
リモコン197が、ユーザから画像グループ分類動作を開始する旨の操作を受け付けることで、画像分類装置100は画像グループ分類動作の処理を開始する。
画像グループ分類動作の処理が開始されると、画像グループデータ受付部201は、1つの画像グループの画像の読み込みを開始し、画像グループ情報受付部211は、その画像グループの名称の受け付けを開始する(ステップS700)。
画像グループデータ受付部201は、外部記録媒体読取書込装置140に装着された外部記録媒体から、又は、USB制御装置150に接続されたUSBケーブル195を介して外部機器から、もしくは、ネットワーク194に接続された通信装置180から、画像を読み込むことができる。
ここでは、例えば、外部記憶媒体としてのSDメモリカード191に記録されている画像グループの画像を、外部記録媒体読取書込装置140から読み込むものとする。
画像グループデータ受付部201は、SDメモリカード191に記録されている画像を1枚ずつ読み込んで、読み込んだ画像に対して、シーケンシャルに画像IDを付与し、画像書込読出部を用いて、画像記憶部231の実データ保管ディレクトリ324に書き込む。
画像グループ情報受付部211は、ユーザからのリモコン197の操作によって、画像グループの名称を受け付ける。
画像を画像記憶部231に画像グループに属する画像が全て書き込まれると、画像特徴算出制御部221は、画像書込読出部202を用いて、画像グループデータ受付部201によって受け付けられた画像グループに属する画像を1枚ずつ読み出していく(ステップS705)。
顔特徴量抽出部222は、画像特徴算出制御部221によって読み出された1枚の画像について、保持する顔のモデルを参照することで、1枚の画像に含まれる顔の認識を試み、認識した顔の個数と、画像全体の面積に対する認識した顔の領域の面積の比率とを顔特徴量として算出する(ステップS710)。
色特徴量抽出部223は、顔特徴量抽出部222によって顔特徴量が算出されると、画像に含まれる各画素について、その画素の色成分の各輝度から、その画素の色を特定し、特定された色のそれぞれに対して、画像に含まれる全画素数に対するその色に特定された画素数の比率とを色特徴量として算出する(ステップS715)。
物体特徴量抽出部224は、色特徴量抽出部223によって色特徴量が算出されると、保持する物のモデルを参照することで、1枚の画像に含まれる物の認識を試み、物の認識に成功した場合に、その認識した物の名称を物体特徴量として算出する(ステップS720)。
その後、画像特徴算出制御部221は、算出された顔特徴量と、色特徴量と、物体特徴量とから画像特徴情報を算出して、画像特徴情報書込読出部203を用いて、算出した画像特徴情報を画像特徴情報記憶部232に書き込む(ステップS725)。
画像特徴算出制御部221は、画像グループデータ受付部201が受け付けた1つの画像グループの全ての画像に対して、画像特徴情報の算出を終了していない場合(ステップS730:No)には、まだ画像特徴情報の算出を終了していない画像に対して、再びステップS705の処理を開始する。
画像特徴算出制御部221は、画像グループデータ受付部201が受け付けた全ての画像に対して、画像特徴情報の算出を終了した場合(ステップS730:Yes)には、画像グループ特徴算出部206は、画像特徴情報記憶部232が記憶している、画像グループデータ受付部201が読み込んだ画像グループに属する画像に対応する全ての画像特徴情報を、画像特徴情報書込読出部203を用いて読み出す。
画像グループ特徴算出部206は、画像グループに属する画像に対応する全ての画像特徴情報を読み出すと、画像グループに属する画像の全ての認識顔のIDからなる顔IDと、画像グループに属する画像の最大顔面積のうち最も大きなものである総最大顔面積と、画像グループに属する画像の顔数の総和である合計顔数と、認識顔を含む画像の枚数である顔枚数と、画像グループに属する画像の顔数のうち最も大きなものである最大顔数とからなる画像グループの顔特徴量を算出する(ステップS735)。
画像グループ特徴算出部206は、さらに、画像グループに属する画像の色特徴量の色毎の平均値を計算し、計算した色毎の平均値からなる画像グループの色特徴量平均を算出し(ステップS740)、画像グループに属する画像に含まれる認識された物体の全ての名称からなる画像グループの物体特徴量を算出する(ステップS745)。
その後、画像グループ特徴算出部206は、算出した画像グループの顔特徴量と、算出した画像グループの色特徴量平均と、算出した物体特徴量と、画像グループ情報受付部211によって受け付けられた画像グループの名称とを用いて、画像グループ特徴情報を算出して、算出した画像グループ特徴情報を、画像グループ特徴情報書込読出部204を用いて、画像グループ特徴情報記憶部233に書き込む(ステップS750)。
画像グループ分類部208は、画像グループ特徴情報書込読出部204を用いて、先ほど書き込まれた画像グループ特徴情報を読み出し、イベント特徴情報書込読出部209を用いて、イベント特徴情報記憶部234に記録されているイベント特徴情報を読み出す。
さらに、画像グループ分類部208は、読み出された画像グループ特徴情報とイベント特徴情報とを比較して(ステップS755)、画像グループ特徴情報を構成する構成要素の中に、イベント特徴情報を構成する基準情報を満たすものを見つける場合には、その読み出された画像グループ特徴情報に対応する画像グループが分類されるべきイベントは、その見つけた基準情報に対応するイベントであるとする。
画像グループ分類部208は、該当するイベント特徴情報を見つけなかった場合には、その読み出された画像グループ特徴情報に対応する画像グループが分類されるべきイベントは、その他のイベントというイベントであるとする。
画像グループ分類部208は、分類されるべきイベントを決定すると、画像書込読出部202を用いて、画像記憶部231の分類されるべきイベントに対応するイベントディレクトリの下に、画像グループの名称と同一名称の画像グループディレクトリを作成して、その画像グループディレクトリの下に、画像グループに属する全ての画像のデータのアドレスを示す情報を保持させることで、その画像グループに属する全ての画像のデータがリンクされている状態とすることで、画像グループを分類する(ステップS760)。
その後、分類結果出力部210は、画像グループ分類部208によって算出された分類されるべきイベントのイベント名を、画像グループ情報受付部211が受け付けた画像グループの名称と共にディスプレイ193に表示させて、画像分類装置100は、その画像グループ分類動作を終了する。
<画像グループ分類動作の具体例>
以下、画像グループ分類動作についての具体例について、特にステップS755、ステップS760において、画像グループ分類部208が行う、画像グループを分類する処理について図面を用いて説明する。
図8(a)に、ユーザによって撮影された写真である画像801〜804を構成要素とする画像グループ800を示す。
この画像グループ800は、例えば、画像グループの名称を箱根2008夏とする画像グループであって、画像グループIDが0010であるものとする。
画像801〜804は、森の中で撮影されたものが多く、中には湖のほとりで撮影された画像804も含まれているが、木々の葉の色が示す面積が大きいので、画像グループ800に含まれる画像に含まれる色としては緑が多く含まれている。
図8(b)に、ユーザによって撮影された写真である画像821〜823を構成要素とする画像グループ820を示す。
この画像グループ820は、例えば、画像グループの名称をニセコ2009冬とする画像グループであって、画像グループIDが0011であるものとする。
画像821〜823は雪が積もっているスキー場を背景として撮影されたものが多いので、画像グループ820に含まれる画像の色としては雪の色である白が多く含まれている。
図8(c)に、ユーザによって撮影された写真である画像841、842を構成要素とする画像グループ840を示す。
この画像グループ840は、例えば、画像グループの名称を宮古島2009夏とする画像グループであって、画像グループIDが0012であるものとする。
画像841、842は海の中で撮影されたものが多いので、画像グループ840に含まれる画像の色としては海の水の色である青が多く含まれている。
図9は、画像グループ特徴情報記憶部233に記憶されている、画像グループIDが0010、0011、0012の画像グループに対応する画像グループ特徴情報のデータ構造を示す図である。
ステップS755において、画像グループ分類部208が、画像グループ特徴情報記憶部233から、画像グループIDが0010である画像グループ特徴情報を読み出した場合には、読み出した画像グループIDが0010である画像グループ特徴情報とイベント特徴情報記憶部234から読み出したイベント特徴情報(図6参照)とを比較する。
画像グループID0010の画像グループ特徴情報は、色特徴量平均502において緑523が0.4であって、顔特徴量503において合計顔数533が7であるため、画像グループ分類部208は、画像グループID0010である画像グループ特徴情報が、緑0.4以上604という基準情報601と、人数5人以上606という基準情報601とに該当すると判断し、画像グループID0010である画像グループは、図6に示される、ピクニックというイベントと、大人数というイベントとに分類されるべきであると算出する。
その後、画像グループ分類部208は、画像書込読出部202を用いて、画像記憶部231のピクニックイベントディレクトリ322というイベントディレクトリの下に、箱根2008夏という名称の画像グループディレクトリを作成し、作成した箱根2008夏というディレクトリの下に、画像801〜804に対応する画像データへのリンクを作成する。
また、画像グループ分類部208は、画像書込読出部202を用いて、画像記憶部231の図示していない大人数というイベントディレクトリの下に、箱根2008夏という名称の画像グループディレクトリを作成し、作成した箱根2008夏というディレクトリの下に、画像801〜804に対応する画像データへのリンクを作成する。
ステップS755において、画像グループ分類部208が、画像グループ特徴情報記憶部233から、画像グループIDが0011である画像グループ特徴情報を読み出した場合には、読み出した画像グループIDが0011である画像グループ特徴情報とイベント特徴情報記憶部234から読み出したイベント特徴情報とを比較する。
画像グループID0011の画像グループ特徴情報は、色特徴量平均502において白524が0.5であって、顔特徴量503において合計顔数533が4であるため、画像グループ分類部208は、画像グループID0010である画像グループ特徴情報が、白0.4以上605という基準情報601と、人数4人以下607という基準情報601とに該当すると判断し、画像グループID0011である画像グループは、スキーというイベントと、小人数というイベントとに分類されるべきであると算出する。
その後、画像グループ分類部208は、画像書込読出部202を用いて、画像記憶部231のスキーイベントディレクトリ323というイベントディレクトリの下に、ニセコ2009冬という名称の画像グループディレクトリを作成し、作成したニセコ2009冬というディレクトリの下に、画像821〜823に対応する画像データへのリンクを作成する。
また、画像グループ分類部208は、画像書込読出部202を用いて、画像記憶部231の図示していない小人数というイベントディレクトリの下に、ニセコ2009冬という名称の画像グループディレクトリを作成し、作成したニセコ2009冬というディレクトリの下に、画像821〜823に対応する画像データへのリンクを作成する。
ステップS755において、画像グループ分類部208が、画像グループ特徴情報記憶部233から、画像グループIDが0012である画像グループ特徴情報を読み出した場合には、読み出した画像グループIDが0012である画像グループ特徴情報とイベント特徴情報記憶部234から読み出したイベント特徴情報とを比較する。
画像グループID0012の画像グループ特徴情報は、色特徴量平均502において青522が0.8であって、顔特徴量503において合計顔数533が2であるため、画像グループ分類部208は、画像グループID0012である画像グループ特徴情報が、青0.4以上603という基準情報601と、人数4人以下607という基準情報601(図6参照)とを満たすと判断し、画像グループID0012である画像グループは、スキューバダイビングというイベントと、小人数というイベントとに分類されるべきであると算出する。
その後、画像グループ分類部208は、画像書込読出部202を用いて、画像記憶部231の図示していないスキューバダイビングイベントというイベントディレクトリの下に、宮古島2009夏という名称の画像グループディレクトリを作成し、作成した宮古島2009夏というディレクトリの下に、画像841、842に対応する画像データへのリンクを作成する。
また、画像グループ分類部208は、画像書込読出部202を用いて、画像記憶部231の図示していない小人数というイベントディレクトリの下に、宮古島2009夏という名称の画像グループディレクトリを作成し、作成した宮古島2009夏というディレクトリの下に、画像841、842に対応する画像データへのリンクを作成する。
次に、画像分類装置100の行う、イベント特徴情報生成動作について、図面を用いて説明する。
<イベント特徴情報生成動作>
図10は、画像分類装置100の行うイベント特徴情報生成動作のフローチャートである。
リモコン197が、ユーザからイベント特徴情報生成動作を開始する旨の操作を受け付けることで、イベント特徴情報生成動作を開始する。
イベント特徴情報生成動作が開始されると、画像グループ情報受付部211は、ユーザから、画像グループIDの指定を受け付け(ステップS1000)、イベント情報受付部212は、新たに作成するイベント特徴情報に対応するイベント名を受け付ける。
画像グループ特徴算出部206は、画像グループ特徴情報書込読出部204を用いて、画像グループ特徴情報記憶部233から、受け付けた画像グループIDに対応する画像グループ特徴情報を読み出し、読み出した画像グループ特徴情報をイベント特徴算出部207に送る。
イベント特徴算出部207は、受け取った画像グループ特徴情報から、共通する特徴の算出を試みる(ステップS1010)。
ここで、イベント特徴算出部207の行う共通する特徴の算出とは、例えば、画像グループ特徴情報の色特徴量平均502のうち、ある色の値が、全ての画像グループにおいて0.4以上である場合に、その色を共通特徴とすることである。
ステップS1010において、指定された全ての画像グループに対応する画像グループ特徴情報において、色特徴量平均502のうち、0.4以上の割合の色が同じ色(例えば、仮にX色とする)である場合に(ステップS1010:Yes)、新たに、基準情報601として、X色0.4以上という基準情報を作成し、イベント情報受付部212によって受け付けられたイベント名を対応するイベント名とする。
イベント特徴算出部207は、作成した基準情報を、イベント名と対応付けて、イベント特徴情報書込読出部209を用いて、イベント特徴情報記憶部234に記憶させる(ステップS1020)。
ステップS1010において、共通する特徴を算出しなかった場合(ステップS1010:No)と、ステップS1020の処理が終了した場合には、画像分類装置100は、そのイベント特徴情報生成動作を終了する。
<イベント特徴情報生成動作の具体例>
以下、イベント特徴情報生成動作についての具体例について、図面を用いて説明する。
図11は、画像グループ特徴情報記憶部233に記憶されている、画像グループIDが0001、0010の画像グループに対応する画像グループ特徴情報のデータ構造を示す図である。
ステップS1000において、画像グループ情報受付部211は、ユーザから、画像グループID0001と0010との指定を受け付け、イベント情報受付部212は、新たに作成するイベント特徴情報に対応するイベント名として、例えば、ピクニックを受け付けた場合に、イベント特徴算出部は207、画像グループ特徴情報記憶部233に記憶されている画像グループID0001と0010との画像グループ特徴情報を受け取る。
以下図10を用いてイベント特徴情報生成動作の具体例を説明する。
イベント特徴算出部207は、受け取った画像グループ特徴情報から、共通する特徴の算出を試みる(ステップS1010)と、画像グループIDが0001の画像グループ特徴情報における色特徴量平均502の緑523の割合が0.4であり、画像グループIDが0010の画像グループ特徴情報における色特徴量平均502の緑523の割合が0.4であることから(ステップS1010:Yes)、共通特徴として、緑0.4以上という基準情報を作成する。
その後、イベント特徴算出部207は、緑0.4以上という基準情報と、ピクニックというイベント名と対応付けて、イベント特徴情報書込読出部209を用いて、イベント特徴情報記憶部234に記憶させる(ステップS1020)。
ステップS1020の処置が終了すると、画像分類装置100は、そのイベント特徴情報生成動作を終了する。
<実施の形態2>
以下、本発明に係る画像分類装置の一実施形態として、実施の形態1で説明した画像分類装置100の一部を変形し、記憶する全ての画像に含まれる認識される顔を、家族、友人、他人のいずれか1つに判定する機能が追加されている画像分類装置1200について説明する。
また、この画像分類装置1200の記憶する画像グループ特徴情報には、家族、友人、他人という判定に基づいた顔特徴量が含まれている。
<構成>
<画像分類装置1200のハードウエア構成>
画像分類装置1200のハードウエア構成は、画像分類装置100のハードウエア構成と同一である。従って、ここでは説明を省略する。
<画像分類装置1200の機能構成>
図12は、画像分類装置1200の主要な機能ブロック構成を示す機能ブロック図である。
実施の形態1における画像分類装置100との相違点は、新たに、顔対応表(後述)を記憶するための記憶領域である顔対応表記憶部1201が追加され、画像グループ特徴情報記憶部233が、実施の形態1の画像グループ特徴情報とその構成要素の一部が異なる画像グループ特徴情報を記憶するためのものである画像グループ特徴情報記憶部1233に変形され、イベント特徴情報記憶部234が、実施の形態1のイベント特徴情報とその構成要素の一部が異なるイベント特徴情報を記憶するためのものであるイベント特徴情報記憶部1234に変形され、画像グループ特徴算出部206が、新たな機能(後述)を追加された画像グループ特徴算出部1206に変形されている点である。
以下、実施の形態1における画像分類装置100と同一の部分の説明を省略し、上述の相違点について説明する。
画像グループ特徴算出部1206は、実施の形態1における画像グループ特徴算出部206に、新たに顔区分機能と、顔集団判定機能と、顔対応表更新機能と、顔対応表読み出し機能等とを付け加えるように変形されたものである。
顔区分機能とは、画像特徴情報記憶部232に記録されている画像特徴情報に含まれる全ての顔IDによって示される認識顔に対して、顔の特徴を抽出し、抽出された顔の特徴に基づいて、同一人物であると判断される認識顔が同一の集合になるように、認識顔を区分し、区分された各認識顔群の集合に、その集合を特定するためのラベルを付与する機能である。
ここで、顔の特徴とは、例えば、目、鼻、口等の顔を形成するパーツの相対的な位置関係や、これらパーツの面積比率等のことである。
顔集団判定機能とは、顔区分機能が実行されることによって同一人物として区分された顔の集団が、家族、友人、又は、他人のうちのいずれかであると判定する機能である。
同一人物として区分された認識顔を家族であると判定する基準は、その同一人物として区分された認識顔が、複数の画像グループに存在する場合である。
また、同一人物として区分された認識顔を友人であると判定する基準は、その同一人物として区分された認識顔が、単一の画像グループにのみ存在し、かつ、同一人物として区分された認識顔の数が2つ以上存在する場合である。
さらに、同一人物として区分された認識顔を他人であると判定する基準は、家族でないと判定され、かつ、友人でないと判定された同一人物として区分された認識顔であって、すなわち、その同一人物として区分された認識顔が、1つしか存在しない場合である。
顔対応表更新機能とは、顔区分機能と顔集団判定機能とが実行された場合に、顔区分機能と顔集団判定機能との実行結果に基づいて、後述の顔対応表を作成し、作成した顔対応表で、顔対応表記憶部1201に記憶されている顔対応表を更新する機能である。
顔対応表読み出し機能とは、顔対応表記憶部1201に記憶されている顔対応表を読み出す機能である。
顔対応表記憶部1201は、顔対応表を記憶するための記憶領域であって、ハードディスク装置130に内蔵されているハードディスクの一部の領域として実装されている。
図13は顔対応表記憶部1201に記憶されている顔対応表のデータ構造を示す図である。
同図に示されるように、顔対応表記憶部1201に記憶されている顔対応表は、同一人物であるとして区分された認識顔の集団を特定するためのラベル1301と、同一人物であると区分された認識顔の集団が、家族、友人、又は、他人のうちのいずれかであると判定されたかを示す判定結果1302と、同一人物であるとして区分された認識顔の集団に属する認識顔のIDを示す顔ID1303〜1305とから構成される。
例えば、ラベル1301がAであるとして区分された認識顔の集団は、家族であると判定された人物の顔として区分されたものであって、顔ID0001、顔ID0003、顔ID0101等によって示される認識顔が属するものであることを示している。
図14は、画像グループ特徴情報記憶部1233に記憶されている各画像グループ特徴情報のデータ構造を示す図である。
同図に示されているように、画像グループ特徴情報記憶部1233に記憶されている各画像グループ特徴情報は、対応する画像グループを示す画像グループID1401と、対応する画像グループに属する画像がグループの認識顔の特徴を示す顔特徴量1402と、対応する画像グループに属する画像の枚数を示す総枚数1403と、対応する画像グループの名称を示すグループ名1404と、対応する画像グループが分類されているイベントのイベント名を示すイベント名1405とから構成される。
顔特徴量1402は、家族であると判定された人物の認識顔(以後、家族の顔とよぶ。)に係る情報と、友人であると判定された人物の認識顔(以後、友人の顔とよぶ。)に係る情報と、他人であると判定された人物の認識顔(以後、他人の顔とよぶ。)に関する情報とによって構成されている。
家族の顔に係る情報は、対応する画像グループに属する画像に含まれる家族の顔の顔IDである家族顔ID1421と、対応する画像グループに属する画像に含まれる家族の顔のうち、最も顔面積率の大きなものである家族最大顔面積1422と、1枚の画像の中に含まれる家族の顔の数のうち、最大の数である家族最大顔数1423と、対応する画像グループに属する画像の枚数に対する、家族の顔を含む画像の枚数の比率である家族顔枚数率1424と、1枚の画像に含まれる家族の顔の数の平均である家族顔数率1425と、各画像における家族の顔のうち、最も顔面積率の大きなものである家族最大顔面積率を、家族の顔を含む画像の枚数で除算したものである家族顔面積率1426とからなる。
もし、画像グループに属する画像の中に、家族の顔が存在しない場合には、家族顔ID1421は該当IDなしとなり、家族最大顔面積1422と、家族最大顔数1423と、家族顔枚数率1424と、家族顔数率1425と、家族顔面積率1426とは0となる。
友人の顔に係る情報は、対応する画像グループに属する画像に含まれる友人の顔の顔IDである友人顔ID1431と、対応する画像グループに属する画像に含まれる友人の顔のうち、最も顔面積率の大きなものである友人最大顔面積1432と、1枚の画像の中に含まれる友人の顔の数のうち、最大の数である友人最大顔数1433と、対応する画像グループに属する画像の枚数に対する、友人の顔を含む画像の枚数の比率である友人顔枚数率1434と、1枚の画像に含まれる友人の顔の数の平均である友人顔数率1435と、各画像における友人の顔のうち、最も顔面積率の大きなものである友人最大顔面積率を、友人の顔を含む画像の枚数で除算したものである友人顔面積率1436とからなる。
もし、画像グループに属する画像の中に、友人の顔が存在しない場合には、友人顔ID1431は該当IDなしとなり、友人最大顔面積1432と、友人最大顔数1433と、友人顔枚数率1434と、友人顔数率1435と、友人顔面積率1436とは0となる。
他人の顔に係る情報は、対応する画像グループに属する画像に含まれる他人の顔の顔IDである他人顔ID1441と、対応する画像グループに属する画像に含まれる他人の顔のうち、最も顔面積率の大きなものである他人最大顔面積1442と、1枚の画像の中に含まれる他人の顔の数のうち、最大の数である他人最大顔数1443と、対応する画像グループに属する画像の枚数に対する、他人の顔を含む画像の枚数の比率である他人顔枚数率1444と、1枚の画像に含まれる他人の顔の数の平均である他人顔数率1445と、各画像における友人の顔のうち、最も顔面積率の大きなものである他人最大顔面積率を、他人の顔を含む画像の枚数で除算したものである他人顔面積率1446とからなる。
もし、画像グループに属する画像の中に、他人の顔が存在しない場合には、他人顔ID1441は該当IDなしとなり、他人最大顔面積1442と、他人最大顔数1443と、他人顔枚数率1444と、他人顔数率1445と、他人顔面積率1446とは0となる。
例えば、画像グループIDが0020である画像グループに対応する顔特徴量1402は、家族顔ID0001、0002の顔が認識され、家族最大顔面積は40%であり、家族最大顔数は2枚であり、家族顔枚数率は100%であり、家族顔枚数率は1.5であり、家族顔面積率は30%であり、友人の顔と他人の顔とが存在していないことを示している。
図15は、イベント特徴情報記憶部1234に記録されているイベント特徴情報のデータ構造を示す図である。
同図に示されているように、イベント特徴情報は、画像グループを分類するための基準を示す基準情報1501と、その基準情報1501によって分類される分類先のイベントを示すイベント名1511との組によって構成されている。
以下、個々の基準情報1501とイベント名1511との組について説明する。
家族顔面積率0.1以上という基準情報と、誕生会というイベント名との組は、誕生会というイベントに分類するという基準は、家族顔面積率1426が10%以上であるということを示す。
この基準は、誕生会とは、家族の誕生日を祝う場合が多く、また、誕生日を迎えた家族の顔のアップが多くなるであると想定されることに基づいている。
家族以外の顔枚数率0.5未満、家族以外の顔数率1未満、家族以外の最大顔数3未満という基準情報と、昆虫採集というイベント名との組は、昆虫採集というイベントに分類するという基準は、家族以外の顔枚数率が50%未満で、かつ、家族以外の顔数率が1未満で、かつ、家族以外の最大顔数が3未満であるということを示す。
この基準は、昆虫採集とは、撮影対象が昆虫や背景である草木である場合が多く、撮影対象に同行する家族が入っている可能性があるが、撮影対象に家族以外の人物が入っている可能性は低いと想定されることに基づいている。
家族以外の顔枚数率0.8以上、家族以外の顔数率1.5以上、家族以外の最大顔数3以上という基準情報と、運動会というイベント名との組は、運動会というイベントに分類するという基準は、家族以外の顔枚数率が80%以上で、かつ、家族以外の顔数率が1.5以上で、かつ、家族以外の最大顔数が3以上であるということを示す。
この基準は、運動会とは、学校で行われる行事なので、家族も撮影対象に含まれている可能性があるが、少なくとも、学校のクラスメート等といった家族以外の人物が多数撮影されていると想定されることに基づいている。
以下、上述のように構成される画像分類装置1200の行う動作について説明する。
<動作>
画像分類装置1200の行う主な動作として、実施の形態1の画像分類装置100の行う主な動作に加えて、画像特徴情報記憶部232に記録されている全ての画像特徴情報に含まれる全ての顔IDによって示される認識顔に対して、顔の特徴を抽出し、抽出された顔の特徴に基づいて、同一人物である顔に同一のラベルを付与し、同一のラベルを付与された顔の集団が、家族、友人、又は、他人のうちのいずれかであると判定することで顔対応表を生成し、生成した顔対応表で、顔対応表記憶部1201で記憶されている顔対応表を更新する顔対応表生成動作がある。
また、画像分類装置1200の行う主な動作のうちの1つである画像グループ分類動作は、実施の形態1の画像分類装置100の行う動作の一部が変更されたものとなっている。
以下、それぞれの動作について、図面を用いて説明する。
<顔対応表生成動作>
図16は、画像分類装置1200が行う顔対応表生成動作のフローチャートである。
画像分類装置1200は、画像グループ分類動作において、画像グループデータ受付部201によって読み込まれた画像が、画像記憶部231に記録され、対応する画像特徴情報が、画像特徴情報記憶部232に記録されると、顔対応表生成動作を開始する。
顔対応表生成動作が開始されると、画像グループ特徴算出部1206は、画像特徴情報書込読出部203を用いて、画像特徴情報記憶部232に記憶されている全ての画像特徴情報を読み出す。
画像グループ特徴算出部1206は、読み出した全ての画像特徴情報から、認識顔の顔IDと、その顔IDによって特定される顔の領域の座標と、その顔IDを含む画像特徴情報に対応する画像IDとを抽出する(ステップS1600)。
画像グループ特徴算出部1206は、画像書込読出部202を用いて画像記憶部231から、顔IDを含む画像特徴情報に含まれる画像IDによって特定される画像を読み出して、抽出された顔IDに対応する顔の領域の座標によって特定される顔の領域の全てに対して、顔の特徴を抽出する(ステップS1603)。
画像グループ特徴算出部1206は、抽出した顔の特徴のうち、同じ顔の特徴を持つ顔の集団を同一人物の顔であると判断し、同一人物であると判断される認識顔が同一の集合になるように、認識顔を区分し、区分された各認識顔群の集合に、その集合を特定するためのラベルを付与する(ステップS1605)。
その後、画像グループ特徴算出部1206は、1つの画像グループを選択し(ステップS1610)、その画像グループの中に含まれる認識顔に付与されているラベルのうちの1つのラベルを選択し(ステップS1615)、選択したラベルが付与されている認識顔が、他の画像グループに存在するか否かを検索する(ステップS1620)。
検索した結果、選択したラベルが付与されている認識顔が、他の画像グループに存在する場合に(ステップS1620:Yes)、画像グループ特徴算出部1206は、その選択したラベルが付与されている、同一人物として区分された認識顔を家族であると判定する(ステップS1625)。
ステップS1620において、検索した結果、選択したラベルが付与されている認識顔が、他の画像グループに存在しない場合に(ステップS1620:No)、画像グループ特徴算出部1206は、さらに、その選択したラベルが付与されている認識顔が、複数存在するか否かを検索する(ステップS1630)。
検索した結果、その選択したラベルが付与されている認識顔が、複数存在する場合に(ステップS1630:Yes)、画像グループ特徴算出部1206は、その選択したラベルが付与されている、同一人物として区分された認識顔を友人であると判定する(ステップS1635)。
ステップS1630において、検索した結果、選択したラベルが付与されている認識顔が、1つしか存在しない場合に(ステップS1630:No)、画像グループ特徴算出部1206は、その選択したラベルが付与されている顔を他人であると判定する(ステップS1640)。
ステップS1625の処理が終了した場合、ステップS1635の処理が終了した場合、又は、ステップS1640の処理が終了した場合に、画像グループ特徴算出部1206は、選択した画像グループのラベルの中に、未選択のラベルが残っているか否かを調べ(ステップS1645)、未選択のラベルが残っている場合に(ステップS1645:No)、画像分類装置1200は、未選択のラベルが無くなるまで、ステップS1615〜ステップS1645:Noの処理を繰り返す。
ステップS1645において、未選択のラベルが残っていない場合に(ステップS1645:Yes)、画像グループ特徴算出部1206は、未選択の画像グループが残っているか否かを調べ(ステップS1650)、未選択の画像グループが残っている場合に(ステップS1650:No)、画像分類装置1200は、未選択の画像グループが無くなるまで、ステップS1610〜ステップS1650:Noの処理を繰り返す。
ステップS1650において、未選択の画像グループが残っていない場合に(ステップS1640:Yes)、画像特徴情報記憶部232は、ラベル毎に、そのラベルと、そのラベルに区分された顔の集団が家族、友人、又は、他人のうちのいずれかであると判断したかを示す判定結果と、そのラベルを付与された顔IDとを関連付けて顔対応表を作成し、作成した顔対応表で、顔対応表記憶部1201に記憶されている顔対応表を更新する(ステップS1655)。
ステップS1655の処理が終了すると、画像分類装置1200は、その顔対応表生成動作を終了する。
以下、同一人物であると区分された認識顔の集団が、家族である場合と、友人である場合と、他人である場合について、具体例を用いて補足説明を行う。
図17は、画像グループ1700と、画像グループ1720と、画像グループ1740とに属する画像を示す図である。
画像1701〜画像1704は、画像グループ1700に属する画像であり、画像1721〜画像1724は、画像グループ1720に属する画像であり、画像1741、画像1742は、画像グループ1740に属する画像である。
画像に含まれる認識顔のうち、顔1711、顔1712、顔1715、顔1732、顔1739、顔1751は、画像グループ特徴算出部1206によって同一人物であると判定された認識顔であって、例えば、ラベルEが付与されているものであるとする。
画像に含まれる認識顔のうち、顔1713、顔1731は、画像グループ特徴算出部1206によって同一人物であると判定された認識顔であって、例えば、ラベルFが付与されているものであるとする。
画像に含まれる認識顔のうち、顔1733、顔1736、顔1737は、画像グループ特徴算出部1206によって同一人物であると判定された認識顔であって、例えば、ラベルGが付与されているものであるとする。
画像に含まれる認識顔のうち、顔1714と、顔1734と、顔1735と、顔1738と、顔1752とは、それぞれ、画像グループ特徴算出部1206によって同一人物であると区分された認識顔が、他に存在しないものである。
以下、画像分類装置1200に記憶されている画像が、仮に、画像1701〜画像1704、画像1721〜画像1724、画像1741、画像1742のみであるとして話を進める。
ラベルEが付与された認識顔は、画像グループ1700と、画像グループ1720と、画像グループ1740とに含まれているため、画像グループ特徴算出部1206によって、家族であると判定される。
ラベルFが付与された認識顔は、画像グループ1700と、画像グループ1720とに含まれているため、画像グループ特徴算出部1206によって、家族であると判定される。
ラベルGが付与された認識顔は、画像グループ1720の中にのみ存在し、かつ、同一人物として区分された顔が複数あるため、画像グループ特徴算出部1206によって、友人であると判定される。
顔1714と、顔1734と、顔1735と、顔1738と、顔1752とは、それぞれ、画像グループ特徴算出部1206によって同一人物であると区分された認識顔が、他に存在しないものであるため、画像グループ特徴算出部1206によって、他人であると判定される。
次に、画像分類装置1200の行う、画像グループ分類動作について、図面を用いて説明する。
<画像グループ分類動作>
図18は、画像分類装置1200の行う、画像グループ分類動作のフローチャートである。
リモコン197が、ユーザから画像グループ分類動作を開始する旨の操作を受け付けることで、画像分類装置1200は画像グループ分類動作を開始する。
ステップS1800〜ステップS1830:Yesまでの動作は、実施の形態1の画像分類装置100の行う画像グループ分類動作におけるステップS700〜ステップS730:Yes(図7参照)までの動作と同一であるため、ここでは説明を省略する。
ステップS1830において、画像グループデータ受付部201が受け付けた全ての画像に対して、画像特徴情報の算出を終了した場合(ステップS1830:Yes)に、画像分類装置1200は、上述の顔対応表生成動作を行う(ステップS1833)。
顔対応表生成動作が終了すると、画像グループ特徴算出部1206は、画像特徴情報記憶部232が記憶している、画像グループデータ受付部201が読み込んだ画像グループに属する画像に対応する全ての画像特徴情報を、画像特徴情報書込読出部203を用いて読み出す。
画像グループ特徴算出部1206は、画像グループに属する画像に対応する全ての画像特徴情報を読み出すと、顔対応表記憶部1201に記憶されている顔対応表を参照しながら、家族の顔特徴量として、対応する画像グループに属する画像に含まれる家族の顔の顔IDである家族顔ID1421と、対応する画像グループに属する画像に含まれる家族の顔のうち、最も顔面積率の大きなものである家族最大顔面積1422と、1枚の画像の中に含まれる家族の顔の数のうち、最大の数である家族最大顔数1423と、対応する画像グループに属する画像の枚数に対する、家族の顔を含む画像の枚数の比率である家族顔枚数率1424と、1枚の画像に含まれる家族の顔の数の平均である家族顔数率1425と、各画像における家族の顔のうち、最も顔面積率の大きなものである家族最大顔面積率を、家族の顔を含む画像の枚数で除算したものである家族顔面積率1426とを算出する(ステップS1835)。
次に、画像グループ特徴算出部1206は、顔対応表記憶部1201に記憶されている顔対応表を参照しながら、友人の顔特徴量として、対応する画像グループに属する画像に含まれる友人の顔の顔IDである友人顔ID1431と、対応する画像グループに属する画像に含まれる友人の顔のうち、最も顔面積率の大きなものである友人最大顔面積1432と、1枚の画像の中に含まれる友人の顔の数のうち、最大の数である友人最大顔数1433と、対応する画像グループに属する画像の枚数に対する、友人の顔を含む画像の枚数の比率である友人顔枚数率1434と、1枚の画像に含まれる友人の顔の数の平均である友人顔数率1435と、各画像における友人の顔のうち、最も顔面積率の大きなものである友人最大顔面積率を、友人の顔を含む画像の枚数で除算したものである友人顔面積率1436とを算出する(ステップS1840)。
さらに、画像グループ特徴算出部1206は、顔対応表記憶部1201に記憶されている顔対応表を参照しながら、他人の顔特徴量として、対応する画像グループに属する画像に含まれる他人の顔の顔IDである他人顔ID1441と、対応する画像グループに属する画像に含まれる他人の顔のうち、最も顔面積率の大きなものである他人最大顔面積1442と、1枚の画像の中に含まれる他人の顔の数のうち、最大の数である他人最大顔数1443と、対応する画像グループに属する画像の枚数に対する、他人の顔を含む画像の枚数の比率である他人顔枚数率1444と、1枚の画像に含まれる他人の顔の数の平均である他人顔数率1445と、各画像における友人の顔のうち、最も顔面積率の大きなものである他人最大顔面積率を、他人の顔を含む画像の枚数で除算したものである他人顔面積率1446とを算出する(ステップS1845)。
その後、画像グループ特徴算出部1206は、算出した家族の顔特徴量と、算出した友人の顔特徴量と、算出した他人の顔特徴量と、画像グループ情報受付部211によって受け付けられた画像グループの名称とを用いて、画像グループ特徴情報を算出し、算出した画像グループ特徴情報を、画像グループ特徴情報書込読出部204を用いて、画像グループ特徴情報記憶部1233に書き込む(ステップS1850)。
画像グループ分類部208は、画像グループ特徴情報書込読出部204を用いて、先ほど書き込まれた画像グループ特徴情報を読み出し、イベント特徴情報書込読出部209を用いて、イベント特徴情報記憶部234に記録されているイベント特徴情報を読み出す。
さらに、画像グループ分類部208は、読み出された画像グループ特徴情報とイベント特徴情報とを比較して(ステップS1855)、画像グループ特徴情報の中に該当するイベント特徴情報を見つけることで、その画像グループ特徴情報に対応する画像グループが分類されるべきイベントを算出する。
画像グループ分類部208は、該当するイベント特徴情報を見つけることができなかった場合には、その画像グループ特徴情報に対応する画像グループが、その他のイベントという画像グループに分類されるべきであると算出する。
画像グループ分類部208は、分類されるべきイベントを算出すると、画像書込読出部202を用いて、画像記憶部231の分類されるべきイベントに対応するイベントディレクトリの下に、画像グループの名称と同一名称の画像グループディレクトリを作成して、その画像グループディレクトリの下に、画像グループに属する画像へのリンクを作成することで、画像グループを分類する(ステップS1860)。
その後、分類結果出力部210は、画像グループ分類部208によって算出された分類されるべきイベントのイベント名を、ディスプレイ193に表示させて、画像分類装置1200は、その画像グループ分類動作を終了する。
<画像グループ分類動作の具体例>
以下、画像グループ分類動作についての具体例について、特にステップS1855、ステップS1860において、画像グループ分類部208が行う、画像グループを分類する処理について図面を用いて説明する。
図19は、ユーザによって撮影された16枚の写真である画像を構成要素とする画像グループ1900である。
この画像グループ1900は、例えば、画像グループの名称を甲山昆虫採集とする画像グループであって、画像グループIDが0021であるとする。
これらの画像は、撮影対象としての昆虫を撮影されたものが多いため、撮影されている人の数が比較的少ないという特徴がある。
画像グループ1900に対応する画像グループ特徴情報は、例えば、図14中の画像グループID1401が0021である画像グループ特徴情報となっているとする。
ここで、画像グループID1401が0021である画像グループ特徴情報のイベント名1405が、昆虫採集となっているが、イベント名が決定されるまでは、このイベント名は空欄となっていて、イベント名が決定された後に初めて決定されたイベント名が付与される。
図20は、ユーザによって撮影された3枚の写真である画像を構成要素とする画像グループ2000である。
この画像グループ2000は、例えば、画像グループの名称をT川小運動会2009とする画像グループであって、画像グループIDが0022であるとする。
これらの画像は、撮影対象として運動会に参加している小学生が多いため、撮影されている人の数は比較的多いという特徴がある。
画像グループ2000に対応する画像グループ特徴情報は、例えば、図14中の画像グループID1401が0022である画像グループ特徴情報となっているとする。
ここで、画像グループID1401が0022である画像グループ特徴情報のイベント名1405が、運動会となっているが、イベント名が決定されるまでは、このイベント名は空欄となっていて、イベント名が決定された後に初めて決定されたイベント名が付与される。
図21は、ユーザによって撮影された写真である画像2101と画像2103を構成要素とする画像グループ2100である。
この画像グループ2100は、例えば、画像グループの名称をA男3才誕生日とする画像グループであって、画像グループIDが0020であるとする。
認識顔2102と認識顔2104は、同一人物A男であって、画像2101と画像2103とは、A男の誕生パーティにおいて撮影された写真である画像である。
ここで、画像グループ特徴算出部1206によって、A男は家族であると判定されているとする。
これらの画像は、A男の顔をズームアップして撮影された画像であるため、画像に含まれる認識顔のうち、最大の面積の顔についての顔面積率は大きいという特徴がある。
画像グループ2100に対応する画像グループ特徴情報は、例えば、図14中の画像グループID1401が0020である画像グループ特徴情報となっているとする。
ここで、画像グループID1401が0020である画像グループ特徴情報のイベント名1405が、A男3才誕生日となっているが、イベント名が決定されるまでは、このイベント名は空欄となっていて、イベント名が決定された後に初めて決定されたイベント名が付与される。
ステップS1855において、画像グループ分類部208が、画像グループ特徴情報記憶部233から、画像グループIDが0021である画像グループ特徴情報を読み出した場合には、読み出した画像グループIDが0021である画像グループ特徴情報とイベント特徴情報記憶部1234から読み出したイベント特徴情報とを比較する。
画像グループID0021の画像グループ特徴情報は、家族以外の顔枚数率として、友人顔枚数率が0.44であって、家族以外の顔数率として、友人顔数率が0.56であって、家族以外の最大顔数として、友人最大顔数が2であるため、画像グループID0021である画像グループ特徴情報は、家族以外の顔枚数率が0.5未満で、かつ、家族以外の顔数率が1未満で、かつ、家族以外の最大顔数が3未満であるという基準情報1501に該当すると判断し、画像グループID0021である画像グループは、昆虫採集というイベントに分類されるべきであると判断する。
その後、画像グループ分類部208は、画像書込読出部202を用いて、画像記憶部231の図示していない昆虫採集イベントディレクトリというイベントディレクトリの下に、甲山昆虫採集という名称の画像グループディレクトリを作成し、作成した甲山昆虫採集というディレクトリの下に、画像グループID0021に属する画像の画像データへのリンクを作成する。
ステップS1855において、画像グループ分類部208が、画像グループ特徴情報記憶部233から、画像グループIDが0022である画像グループ特徴情報を読み出した場合には、読み出した画像グループIDが0022である画像グループ特徴情報とイベント特徴情報記憶部1234から読み出したイベント特徴情報とを比較する。
画像グループID0022の画像グループ特徴情報は、家族以外の顔枚数率として、他人顔枚数率が1であって、家族以外の顔数率として、他人顔数率が3であって、家族以外の最大顔数として、他人最大顔数が4であるため、画像グループID0022である画像グループ特徴情報は、家族以外の顔枚数率が0.8以上で、かつ、家族以外の顔数率が1.5以上で、かつ、家族以外の最大顔数が3以上であるという基準情報1501に該当すると判断し、画像グループID0022である画像グループは、運動会というイベントに分類されるべきであると判断する。
その後、画像グループ分類部208は、画像書込読出部202を用いて、画像記憶部231の図示していない運動会イベントディレクトリというイベントディレクトリの下に、T川小運動会2009という名称の画像グループディレクトリを作成し、作成したT川小運動会2009というディレクトリの下に、画像グループID0022に属する画像の画像データへのリンクを作成する。
ステップS1855において、画像グループ分類部208が、画像グループ特徴情報記憶部233から、画像グループIDが0020である画像グループ特徴情報を読み出した場合には、読み出した画像グループIDが0020である画像グループ特徴情報とイベント特徴情報記憶部1234から読み出したイベント特徴情報とを比較する。
画像グループID0020の画像グループ特徴情報は、家族顔面積率が0.3であるため、画像グループ分類部208は、画像グループID0020である画像グループ特徴情報が、家族顔面積率0.1以上という基準情報1501に該当すると判断し、画像グループID0021である画像グループは、誕生会というイベントに分類されるべきであると判断する。
その後、画像グループ分類部208は、画像書込読出部202を用いて、画像記憶部231の図示していない誕生日イベントディレクトリというイベントディレクトリの下に、A男3才誕生日という名称の画像グループディレクトリを作成し、作成したA男3才誕生日というディレクトリの下に、画像グループID0020に属する画像の画像データへのリンクを作成する。
<実施の形態3>
以下、本発明に係る画像分類装置の一実施形態として、実施の形態1で説明した画像分類装置100の一部を変形し、イベント特徴情報を用いずに、画像グループを分類する画像分類装置2200について説明する。
<構成>
<画像分類装置2200のハードウエア構成>
画像分類装置2200のハードウエア構成は、画像分類装置100のハードウエア構成と同一である。従って、ここでは説明を省略する。
<画像分類装置2200の機能構成>
図22は、画像分類装置2200の主要な機能ブロック構成を示す機能ブロック図である。
実施の形態1における画像分類装置100との相違点は、イベント情報受付部212と、イベント特徴算出部207と、画像グループ分類部208と、イベント特徴情報書込読出部209と、イベント特徴情報記憶部234とが削除され、新たに、画像グループ特徴情報のみに基づいて画像グループを分類する機能を有するクラスタリング部2207が追加されている点である。
以下、実施の形態1における画像分類装置100と同一の部分の説明を省略し、上述の相違点について説明する。
クラスタリング部2207は、画像書込読出部202と、画像グループ特徴情報書込読出部204と、分類結果出力部210とに接続する。
クラスタリング部2207は、画像グループ特徴情報書込読出部204を用いて、画像グループ特徴情報記憶部233から、複数の画像グループ特徴情報を読み出し、読み出した複数の画像グループ特徴情報に含まれる色特徴量平均における各色の画素数比率に基づいて、読み出した画像グループ特徴情報に対応する画像グループを、イベントに分類するクラスタリング機能を有する。
このクラスタリング部2207のクラスタリング機能の詳細については、後程、クラスタリング動作として、図面を用いて説明する。
以上のように構成される画像分類装置2200の行う動作について、以下、図面を用いて説明する。
<動作>
画像分類装置2200の行う主な動作として、実施の形態1の画像分類装置100の行う主な動作で説明した動作以外に、イベント特徴情報を用いずに、画像グループをイベントに分類するクラスタリング動作がある。
画像分類装置2200の行うクラスタリング動作とは、クラスタリング部2207が、(1)色特徴量平均における1つの色について互いに類似する値を持つ画像グループが同じクラスタになるように、画像グループ群をクラスタに分類し、(2)分類されたクラスタ毎に、未選択の色について(1)と同様の分類を行い、(3)未選択の色が無くなるまで(2)を繰り返し、(4)画像グループ群の分類先である各クラスタにイベント名を付与するという動作である。
以下、このクラスタリング動作について、図面を用いて詳細に説明する。
<クラスタリング動作>
図23は、画像分類装置2200が行うクラスタリング動作のフローチャートである。
リモコン197が、ユーザから、クラスタリング動作の対象となる複数の画像グループを示す複数の画像グループIDの指定と、クラスタリング動作を開始する旨の操作とを受け付けることで、画像分類装置2200はクラスタリング動作の処理を開始する。
クラスタリング動作が開始されると、クラスタリング部2207は、ユーザによって指定された画像グループIDに対応する画像グループ特徴情報を、画像グループ特徴情報書込読出部204を用いて、画像グループ特徴情報記憶部233から読み出す(ステップS2400)。
クラスタリング部2207は、読み出した画像グループ特徴情報のうち、色特徴量平均の黒の値を用いて、読み出した画像グループ特徴情報をクラスタリング(以後、黒色によるクラスタリングという。)する(ステップS2405)。
この黒色によるクラスタリングとは、(1)黒の値のうちの最小値を見つけ出し、見つけ出した最小値以上で、最小値+クラスタリング値(ここでは仮に0.25とし、以後、クラスタリング値とは書かずに直接0.25の数値を記入する。)以下である黒の値を持つ画像グループを1つ目のクラスタに分類し、(2)黒の値のうちの最大値を見つけ出し、最大値−0.25以上で、最大値以下である黒の値を持つ画像グループ特徴情報を2つ目のクラスタに分類し、(3)1つ目のクラスタ、又は、2つ目のクラスタに分類されない画像グループを3つ目のクラスタに分類することである。
ここで、クラスタリング値とは、色特徴量平均の色(ここでは黒)の値が互いに類似しているか否かを判断するための基準値であって、クラスタリング部2207によって予め保持されているものである。
黒色によるクラスタリングが終了すると、クラスタリング部2007は、黒色によるクラスタリングによってクラスタリングされたクラスタのうちの1つを選択する(ステップS2410)。
クラスタリング部2007は、選択したクラスタに含まれる画像グループ特徴情報のうち、色特徴量平均の青の値を用いて、選択したクラスタに含まれる画像グループ特徴情報をクラスタリング(以後、青色によるクラスタリングという。)する(ステップS2415)。
この青色によるクラスタリングとは、上述の黒色によるクラスタリングと同様のものであって、黒を青に入れ替えたものである。
青色によるクラスタリングが終了すると、クラスタリング部2007は、青色によるクラスタリングによってクラスタリングされたクラスタのうちの1つを選択する(ステップS2420)。
クラスタリング部2007は、選択したクラスタに含まれる画像グループ特徴情報のうち、色特徴量平均の緑の値を用いて、選択したクラスタに含まれる画像グループ特徴情報をクラスタリング(以後、緑色によるクラスタリングという。)する(ステップS2425)。
この緑色によるクラスタリングとは、上述の黒色によるクラスタリングと同様のものであって、黒を緑に入れ替えたものである。
緑色によるクラスタリングが終了すると、クラスタリング部2007は緑色によるクラスタリングによってクラスタリングされたクラスタのうちの1つを選択する(ステップS2430)。
クラスタリング部2007は、選択したクラスタに含まれる画像グループ特徴情報のうち、色特徴量平均の白の値を用いて、選択したクラスタに含まれる画像グループ特徴情報をクラスタリング(以後、白色によるクラスタリングという。)し(ステップS2435)、分類された各クラスタを、これ以上クラスタリングされることのない分類クラスタとする(ステップS2440)。
この白色によるクラスタリングとは、上述の黒色によるクラスタリングと同様のものであって、黒を白に入れ替えたものである。
ステップS2240の処理が終了すると、クラスタリング部2207は、緑色によるクラスタリングによるクラスタのうち、選択されていないクラスタが存在するか否かを検索し(ステップS2450)、未選択のクラスタが存在する場合には(ステップS2450:Yes)、その未選択のクラスタのうちの1つを選択し、未選択のクラスタが無くなるまで、ステップS2430〜ステップS2450までの処理を繰り返し実行する。
ステップS2450において、緑色によるクラスタリングによるクラスタのうち、選択されていないクラスタが存在しない場合には(ステップS2450:No)、クラスタリング部2207は、青色によるクラスタリングによるクラスタのうち、選択されていないクラスタが存在するか否かを検索し(ステップS2455)、未選択のクラスタが存在する場合には(ステップS2455:Yes)、その未選択のクラスタのうちの1つを選択し、未選択のクラスタが無くなるまで、ステップS2420〜ステップS2455までの処理を繰り返し実行する。
ステップS2455において、青色によるクラスタリングによるクラスタのうち、選択されていないクラスタが存在しない場合には(ステップS2455:No)、クラスタリング部2207は、黒色によるクラスタリングによるクラスタのうち、選択されていないクラスタが存在するか否かを検索し(ステップS2460)、未選択のクラスタが存在する場合には(ステップS2460:Yes)、その未選択のクラスタのうちの1つを選択し、未選択のクラスタが無くなるまで、ステップS2410〜ステップS2460までの処理を繰り返し実行する。
ステップS2460において、黒色によるクラスタリングによるクラスタのうち、選択されていないクラスタが存在しない場合には(ステップS2460:No)、分類対象の画像グループが、いずれかの分類クラスタに分類されていることになる。
従って、ステップS2400〜ステップS2650:Noまでの処理で、画像グループの分類は完了しているが、さらに、各分類クラスタのイベント名を決定するために、クラスタリング部2207は、以下の処理を行う。
ステップS2460において、黒色によるクラスタリングによるクラスタのうち、選択されていないクラスタが存在しない場合には(ステップS2460:No)、クラスタリング部2207は、分類クラスタ毎に、その分類クラスタに分類されている画像グループにおける各色の値の平均値を算出し(ステップS2465)、分類クラスタ毎に、算出した平均値のうち、最大の平均値の色を抽出する(ステップS2470)。
その後、クラスタリング部2207は、分類クラスタ毎に、抽出した最大の平均値の色を、その分類クラスタのイベント名として決定し(ステップS2475)、画像分類装置2200は、そのクラスタリング動作を終了する。
<クラスタリング動作の具体例>
以下、クラスタリング動作についての具体例について、図面を用いて説明する。
図24は、画像分類装置2200が行うクラスタリング動作を模式的に示す、クラスタリング動作の模式図である。
同図は、クラスタリング部2207が、画像グループ特徴情報記憶部が記憶する画像グループ特徴情報のうち、クラスタリング動作の対象である画像グループの色特徴量平均2301を用いて、クラスタリング動作の対象である画像グループを、黒イベント2302と、青イベント2303と、緑イベント2304と、白イベント2305とに分類することを模式的に示すものである。
同図を用いて、前述の各色によるクラスタリングについて具体的に説明する。
まず、クラスタリング部2207は、黒色によるクラスタリングを行う。
色特徴量平均2301の黒の値のうちの最小値は、画像グループ1008に対応する0.0であるので、クラスタリング部2207は、0.0以上で0.25以下の黒の値を持つ、画像グループID1001に対応する画像グループ特徴情報(以下、画像グループ1001という。他も同様。)と、画像グループ1001と、画像グループ1003と、画像グループ1005と、画像グループ1006と、画像グループ1007と、画像グループ1008とを、例えば、黒第1クラスタに分類する。
色特徴量平均2301の黒の値のうちの最大値は、画像グループ1002に対応する0.6であるので、クラスタリング部2207は、0.35以上で0.6以下の黒の値を持つ、画像グループ1002と、画像グループ1004とを、例えば、黒第2クラスタに分類する。
ここでは、3つ目のクラスタに分類される画像グループ情報は存在しない。
次に、クラスタリング部2207は、黒第1クラスタを選択し、青色によるクラスタリングを行う。
画像グループ1001と、画像グループ1003と、画像グループ1005と、画像グループ1006と、画像グループ1007と、画像グループ1008とが黒第1クラスタに分類されているので、これらの中で、色特徴量平均2301の青の値のうちの最小値は、画像グループ1003と、画像グループ1006と、画像グループ1008とに対応する0.1であるので、クラスタリング部2207は、0.1以上で0.35以下の青の値を持つ画像グループ1003と、画像グループ1006と、画像グループ1007と、画像グループ1008とを、例えば、青第1クラスタに分類する。
黒第1クラスタに分類されている画像グループのうち、色特徴量平均2301の青の値のうちの最大値は、画像グループ1005に対応する0.7であるので、クラスタリング部2207は、0.45以上0.7以下の青の値を持つ、画像グループ1001と画像グループ1005とを、例えば、青第2クラスタに分類する。
ここでは3つ目のクラスタに分類される画像グループは存在しない。
このようにして、黒色、青色、緑色、白色によるクラスタリングを繰り返すと、詳細については省略するが、全ての画像グループは、画像グループID1006からなる第1分類クラスタと、画像グループID1003、1007、1008からなる第2分類クラスタと、画像グループID1001、1005からなる第3分類クラスタと、画像グループID1002、1004からなる第4分類クラスタとに分類される。
第1分類クラスタは、その最大の平均値の色は、白の0.7となるので、第1分類クラスタのイベント名は、白イベントとなる。
第2分類クラスタは、その最大の平均値の色は、緑の0.63となるので、第2分類クラスタのイベント名は、緑イベントとなる。
第3分類クラスタは、その最大の平均値の色は、青の0.65となるので、第3分類クラスタのイベント名は、青イベントとなる。
第4分類クラスタは、その最大の平均値の色は、黒の0.5となるので、第4分類クラスタのイベント名は、黒イベントとなる。
このようにして、図23に示されるように、画像分類装置2200は、画像グループID1001〜画像グループID1008に対応する画像を、黒イベント2302、青イベント2303、緑イベント2304、白イベント2305のいずれかに分類することができる。
<補足>
以上、本発明に係る画像分類装置の一実施形態について、画像グループ分類動作と、イベント特徴情報生成動作と、顔対応表生成動作と、クラスタリング動作等を行う例について説明したが、以下のように変形することも可能であり、本発明は上述した実施の形態に示した通りの画像分類装置に限られないことはもちろんである。
(1)実施の形態1において、画像分類装置100が記憶する画像として、JPEG方式で符号化されたデータとしたが、デジタル写真をデータとして記憶することができるものであれば、JPEG方式以外の符号化方式、例えばPNG(Portable Network Graphics)方式やGIF(Graphics Interchange Format)方式等で符号化されたものであっても構わないし、符号化されないビットマップ方式のデータであっても構わない。
また、コンテンツとしてデジタル写真を例として示したが、デジタルデータとして記憶することができる画像であれば、例えば、スキャナで読み取った絵画のデータ等であっても構わない。
(2)実施の形態1において、CPU101と、ROM102と、RAM103と、ハードディスク装置インターフェース104と、外部記録媒体読取書込装置インターフェース105と、USB制御装置インターフェース106と、出力装置インターフェース107と、入力装置インターフェース108と、通信装置インターフェース109と、デコーダ111と、バスライン120とが、システムLSI110に統合されているとしたが、必ずしも1つのLSIに統合されている必要はなく、複数の集積回路等で実現されていても構わない。
(3)実施の形態1において、デコーダ111は、DSPであるとしたが、符号化されたデータを復号する機能があれば、必ずしもDSPである必要はなく、例えば、CPU101が兼用する構成であっても構わないし、CPU101とは異なるCPUであっても構わないし、ASIC等で構成される専用回路であっても構わない。
(4)実施の形態1において、入力装置170は、リモコン197から無線で送信されるユーザからの操作コマンドを受け付ける機能を有する構成であるとしたが、ユーザからの操作コマンドを受け付ける機能があれば、必ずしもリモコン197から無線で送信される操作コマンドを受け付ける機能を有する構成でなくても、例えば、キーボードとマウスとを備え、キーボードとマウスとを介してユーザからの操作コマンドを受け付ける機能を有する構成であっても構わないし、ボタン群を備え、ボタン群を介してユーザからの操作コマンドを受け付ける機能を有する構成等であっても構わない。
(5)実施の形態1において、画像グループデータ受付部201が、2枚以上の画像の指定を受け付け、指定された画像群を、1つの画像グループに含まれる画像群とするとしたが、画像と画像グループとの対応付けを取ることができれば、例えば、画像グループデータ受付部201は、画像データと、画像グループに属する画像のリストとを受け取り、受け取ったリストに基づいて、画像と画像グループとを対応付けるといった構成であっても構わないし、例えば、画像グループデータ受付部201は、画像データと、その画像データが撮影された撮影時刻の情報と、撮影時刻の情報と画像グループとの対応関係の情報とを受け取り、受け取った撮影時刻の情報に基づいて、画像と画像グループとを対応付けるといった構成であっても構わない。
また、画像と画像グループとの対応付けを取ることができれば、必ずしもユーザによって指定されることによって対応付けを取る必要はなく、既存の技術を利用して、自動で画像と画像グループとの対応付けを行う構成としても構わない。
(6)実施の形態1において、画像グループデータ受付部201は、読み込んだ画像に対して、シーケンシャルに画像IDを付与するとしたが、画像に、画像と1対1に対応する画像IDを付与することができれば、必ずしもシーケンシャルに画像IDを付与しなくても構わない。
(7)実施の形態1において、色特徴量抽出部223が特定する色として、黒、青、緑、白としたが、これらの色に限られる必要はなく、例えば、赤、黄等であっても構わない。
(8)実施の形態1において、画像特徴算出部205は、顔特徴量を算出した後に色特徴量を算出し、その後、物体特徴量を算出するとしたが、顔特徴量と、色特徴量と、物体特徴量とを算出することができれば、必ずしもこの順番で各特徴量の算出を開始する必要はなく、例えば、色特徴量、顔特徴量、物体特徴量の順番で特徴量の算出を開始しても構わないし、例えば、同時に各特徴量の算出を開始するとしても構わない。
(9)実施の形態1において、色特徴量抽出部223は、画像に含まれる全ての画素を対象として色特徴量を算出するとしていたが、色特徴量を算出することができれば、必ずしも画像に含まれる全ての画素を対象として色特徴量を算出する必要はなく、例えば、各画素について色を特定した後、互いに同じ色に特定される画素が互いに隣接して下限閾値数以上存在する場合に限って、それらの画素を対象として、色特徴量を算出するとしても構わない。
図26は、画像グループに属する画像を示す図である。
画像2600は、黒に特定される下限閾値数未満の画素からなる画素群2601〜画素群2609を含んでいる。これら画素群以外に、黒に特定される画素はない。
画像2610は、黒に特定される下限閾値数以上の画素からなる画素群2611を含んでいる。
この画像グループにおいて、画像2600に対して黒は色特徴量として抽出されないが、画像2610に対して黒は色特徴量として抽出される。
一般に、同じ色に特定される画素がある程度固まっている領域は、例えば、空や地面といった画像における背景の領域である場合が多い。また、画像における背景の領域には、分類先であるイベントの特徴が含まれている場合が多い。
このような構成の色特徴量抽出部223は、色特徴量を、画像における背景に含まれる色に基づいて算出することができるようになる。
(10)実施の形態1において、顔のモデルは、例えば、目、鼻、口等の顔を形成するパーツの輝度や、相対的な位置関係に関する情報等であるとしたが、顔を認識することができる情報であれば、これら以外の情報であっても構わない。
(11)実施の形態1において、画像グループ分類部208が行う画像グループの分類は、該当するイベントが複数ある場合には、該当するイベントの全てを分類すべきイベントとする分類であったが、例えば、イベントに優先順位を設けて、優先順位の高いイベントから順に該当するイベントを見つけていき、最初にみつかった該当するイベントのみを分類すべきイベントとするといったような、分類すべきイベントを1つのみとする分類であっても構わない。
(12)実施の形態1において、イベント特徴算出部207が行う、共通する特徴の算出とは、例えば、各画像グループにおける色特徴量平均502のうち、0.4以上の割合の色が同じ色である場合に、その色を共通特徴とすることであるとしたが、共通する特徴の算出をすることができれば、これ以外の方法、例えば、ロジスティック回帰分析法や、SVM(Support Vector Machine)法等の方法を用いることによって共通特徴を算出するとしても構わない。
例えば、ロジスティック回帰分析法であれば、イベント特徴算出部207は、画像グループとその色特徴量平均とその画像が分類されるべきイベントのイベント名(以後、正解イベントという。)との集合を受け取り、受け取った色特徴量平均を用いて正解イベントに対して学習し、正解イベント毎に、正解イベントに対応する基準情報を算出することになる。
また、ロジスティック解析法を用いると、基準情報を、例えば、色特徴量平均のうち緑色の値が0.4以上であれば、緑色イベントに80%の確率で分類されるといったように、確率の概念を含むものとすることができる。
(13)実施の形態2において、画像グループ特徴算出部1206が抽出する顔の特徴は、例えば、目、鼻、口等の顔を形成するパーツの相対的な位置関係や、これらパーツの面積比率等のことであるとしたが、顔を区分することができる顔の特徴を示すものであれば、これら以外、例えば、目の色や、ほくろの位置、肌の色等といった顔の特徴を示すものであっても構わないし、複数の顔の特徴を表すものの組み合わせであっても構わない。
(14)実施の形態2において、同一人物として区分された認識顔を家族であると判定する基準は、その同一人物として区分された認識顔が、複数の画像グループに存在する場合であって、友人であると判定する基準は、その同一人物として区分された認識顔が、単一の画像グループにのみ存在し、かつ、同一人物として区分された認識顔の数が2つ以上存在する場合であって、他人であると判定する基準は、家族でないと判定され、かつ、友人でないと判定された同一人物として区分された認識顔であるとしたが、必ずしもこのような判定基準でなくても、例えば、同一人物として区分された認識顔を家族であると判定する基準は、その同一人物として区分された認識顔が、3つ以上の画像グループに存在する場合であって、友人であると判断する基準は、その同一人物として区分された認識顔が、2つの画像グループに存在する場合であって、他人であると判定する基準は、家族でないと判定され、かつ、友人でないと判定された同一人物として区分された認識顔であるとしても構わない。
また、区分の名称として、家族、友人、他人という名称を用いたが、必ずしも家族、友人、他人といった名称に限られる必要もない
また、例えば、予め家族に区分されるべき人物の顔の画像を登録しておいて、この登録された家族に区分されるべき人物顔の画像と同じ特徴を持つ顔の人物を家族に区分するといった方法で家族を区分しても構わないし、ユーザよる目視によって、画像に写っている人物を家族に区分するといった方法で家族を区分しても構わない。
(15)実施の形態1において、イベント特徴情報が、図6で示されるイベント特徴情報であるとしたが、図6で示される基準情報以外の基準情報や、図6で示されるイベント名以外のイベント名を含んでいるイベント特徴情報であっても構わない。
また、実施の形態2において、イベント特徴情報が、図15で示されるイベント特徴情報であるとしたが、図15で示される基準情報以外の基準情報や、図15で示されるイベント名以外のイベント名を含んでいるイベント特徴情報であっても構わない。
図6で示されるイベント特徴情報と図15で示されるイベント特徴情報以外のイベント特徴情報の一例としてのイベント特徴情報を、図25に示す。
同図に示されるイベント特徴情報は、(a)キャンプファイヤーというイベントに分類する基準は、黒0.4以上2501であって、かつ、他人5人以上2511という条件を満たす場合であり、(b)花火というイベントに分類する条件は、黒0.4以上2501であって、かつ、他人5人未満2512という条件を満たす場合であり、(c)プールというイベントに分類する基準は、青0.4以上0.8未満2502であって、かつ、他人5人以上2511という条件を満たす場合であり、(d)釣りというイベントに分類する条件は、青0.4以上0.8未満2502であって、かつ、他人5人未満2512という条件を満たす場合であり、(e)ピクニックというイベントに分類する基準は、緑0.4以上2503であって、かつ、他人5人以上2511という条件を満たす場合であり、(f)昆虫採集というイベントに分類する条件は、緑0.4以上2503であって、かつ、他人5人未満2512という条件を満たす場合であり、(g)アイススケートというイベントに分類する基準は、白0.4以上2504であって、かつ、他人5人以上2511という条件を満たす場合であり、(h)スキーというイベントに分類する条件は、白0.4以上2504であって、かつ、他人5人未満2512という条件を満たす場合であり、(i)海水浴というイベントに分類する基準は、青0.8以上2505であって、かつ、他人5人以上2511という条件を満たす場合であり、(j)スキューバダイビングというイベントに分類する条件は、青0.8以上2505であって、かつ、他人5人未満2512という条件を満たす場合であり、(k)運動会というイベントに分類する基準は、画像の上半分の領域において青0.4以上2506であって、かつ、他人5人以上2511という条件を満たす場合であり、(l)ローラスケートというイベントに分類する条件は、画像の上半分の領域において青0.4以上2506であって、かつ、他人5人未満2512という条件を満たす場合であり、(m)剣道というイベントに分類する基準は、画像の上半分の領域において青0.4未満2507であって、かつ、他人5人以上2511という条件を満たす場合であり、(n)家の日常というイベントに分類する条件は、画像の上半分の領域において青0.4未満2507であって、かつ、他人5人未満2512という条件を満たす場合である。
(16)実施の形態3において、クラスタリング部2207が行うイベントに分類する方法の一例として、分類対象である画像グループの色特徴量を用いて行うクラスタリング動作について説明したが、分類対象である画像グループを分類することができれば、どのような分類方法であっても構わない。例えば、色特徴量以外の特徴量を用いて行うクラスタリング動作であっても構わないし、例えば、K−means法等の方法を用いることによって、分類対象である画像グループを分類するとしても構わない。
(17)実施の形態3において、クラスタリング値は0.25であるとしたが、色特徴量平均の色の値が互いに類似しているか否かを判断するための基準となるものであれば、例えば、0.1といったように、0.25以外の値であっても構わない。
また、クラスタリング値は、クラスタリング部2207が予め保持するとしたが、これ以外の構成、例えば、ユーザによってクラスタリング値は指定されるという構成であっても構わない。
(18)実施の形態3において、クラスタリング部2207は、各画像グループが、1つのクラスタにのみ分類する例について説明したが、例えば、1つの画像グループを、互いに異なる2つのクラスタに分類するとしても構わない。
(19)実施の形態1乃至3で示した、画像グループ分類動作等(図7、図10、図16、図18、図23参照)を画像分類装置のCPU、及びそのCPUに接続された各種回路に実行させるためのプログラムコードからなる制御プログラムを、記録媒体に記録すること、又は各種通信路等を介して流通させ頒布することもできる。このような記録媒体には、ICカード、ハードディスク、光ディスク、フレキシブルディスク、ROM等がある。流通、頒布された制御プログラムはCPUに読み出だされ得るメモリ等に格納されることにより利用に供され、そのCPUがその制御プログラムを実行することにより各実施形態で示したような各種機能が実現されるようになる。なお、制御プログラムの一部を画像分類装置とは別個のプログラム実行可能な装置(CPU)に各種通信路等を介して送信して、その別個のプログラム実行可能な装置においてその制御プログラムの一部を実行させることとしてもよい。
(20)実施の形態1において、顔特徴量抽出部222は、認識した顔それぞれに、その認識顔を特定するための顔IDを、シーケンシャルに付与するとしたが、重複を避けて付与することができれば、必ずしもシーケンシャルに付与しなくても構わない。
(21)実施の形態1において、色特徴量は、画像全体に対して特徴を示すものであるとしたが、画像の色の特徴を示すものであれば、例えば、画像の上半分といったような一部分に対すものであっても構わないし、画像の左10%の部分と画像の右10%の部分といったように複数の一部分に対するものであっても構わない。
(22)実施の形態2において、イベント特徴情報は、例として、図15に示されている基準情報と、イベント名との組によって構成されるものについて示したが、図15に示されるイベント特徴情報に限られるものではなく、例えば、家族や友人や他人の様々なパラメータを基準情報に用いたものであっても構わない。
(23)実施の形態3において、クラスタリング部は、色特徴量平均の値によって決定されるクラスタリング値に基づいて画像グループを分類するとしたが、画像グループを分類することができれば、必ずしも、色特徴量平均の値によって決定されるクラスタリング値に基づいて分類する必要はない。
一例として、クラスタリング部は、分類先カテゴリーの各々に分類される画像グループの数が均等となるように決定されるクラスタリング値に基づいて、画像グループを分類するとしても構わない。
(24)以下、さらに本発明の一実施形態に係る画像分類装置の構成及びその変形例と各効果について説明する。
(a)本発明の一実施形態に係る画像分類装置は、1つの画像グループに属する画像のうち全部又は一部の2枚以上の画像についての、画像の特徴を示す画像特徴情報に基づいて、画像グループの特徴を示す画像グループ特徴情報を算出する画像グループ特徴算出部と、1つの画像グループの画像グループ特徴情報と、分類用の基準情報とに基づいて、当該画像グループを、互いに異なる複数の分類先のうちのいずれかの分類先に分類する画像グループ分類部とを備えることを特徴とする。
このような構成にすることによって、画像の撮影時刻の情報に限られない画像の特徴に基づいて算出された画像グループ特徴情報に基づいて、画像グループ単位で画像を分類することができる。
従って、この画像分類装置は、撮影時刻以外の画像の特徴に基づいて、同一の画像グループに属する画像が、互いに異なるカテゴリに分類されてしまうことがないように画像を+分類することができるという効果を有する。
図27は、上述の変形例における画像分類装置2700の機能構成を示す機能ブロック図である。
同図に示される通り、画像分類装置2700は、画像グループ特徴算出部2701と、画像グループ分類部2702とから構成される。
画像グループ特徴算出部2701は、画像グループ分類部2702と接続され、1つの画像グループに属する画像のうち全部又は一部の2枚以上の画像についての、画像の特徴を示す画像特徴情報に基づいて、画像グループの特徴を示す画像グループ特徴情報を算出する機能を有する。
この画像グループ特徴算出部2701は、一例として、実施の形態1(図2参照)における、画像グループ特徴情報書込読出部204と画像グループ特徴算出部206と画像グループ情報受付部211と画像グループ特徴情報記憶部233として実現される。
画像グループ分類部2702は、画像グループ特徴算出部2701と接続され、1つの画像グループの画像グループ特徴情報と、分類用の基準情報とに基づいて、当該画像グループを、互いに異なる複数の分類先のうちのいずれかの分類先に分類する機能を有する。
この画像グループ分類部2702は、一例として、実施の形態1(図2参照)における、画像グループ分類部208とイベント特徴情報書込読出部209と分類結果出力部210とイベント情報受付部212とイベント特徴情報記憶部234として実現される。
(b)また、複数の画像グループ特徴情報に基づいて、前記分類用の基準情報を作成する基準情報作成部を備えるとしてもよい。
このような構成にすることによって、分類用の基準情報を自ら作成することができるようになるため、外部から基準情報を与えられなくても、画像グループを分類することができるようになるという効果を有する。
(c)また、1枚の画像から当該画像の特徴を示す画像特徴情報を算出する画像特徴算出部を備え、前記画像グループ特徴算出部は、前記画像グループ特徴情報の算出を、前記画像特徴算出部によって算出された画像特徴情報に基づいて行うとしてもよい。
このような構成にすることによって、画像グループに属する画像の画像特徴情報を自ら作成することができるようになるため、外部から画像特徴情報を与えられなくても、画像グループを分類することができるようになるという効果を有する。
(d)また、前記画像特徴算出部は、顔の特徴を示す予め定められた顔のモデルと照合することで画像に含まれる顔の検出を試み、画像に含まれる顔に係る情報である顔情報を算出する顔特徴算出部を含み、前記画像特徴算出部によって算出される画像特徴情報は、前記顔特徴算出部によって算出された顔情報を含み、前記画像グループ特徴算出部は、算出する画像グループ特徴情報に、顔に係る情報を含ませ、前記分類用の基準情報は、顔に係る情報を、互いに異なる分類先のうち、いずれの分類先に分類されるかを決定するための情報である顔基準情報を含み、前記画像グループ分類部は、前記画像グループの分類を、1つの画像グループの画像グループ特徴情報に含まれる顔に係る情報と、分類用の基準情報に含まれる顔基準情報とに基づいて行うとしてもよい。
このような構成にすることによって、画像グループに属する画像の被写体である人物に注目した画像グループの分類を行うことができるようになるという効果を有する。
(e)また、前記顔特徴算出部は、算出する顔情報に、画像に含まれる検出した顔の領域の面積に係る情報を含ませ、前記画像グループ特徴算出部は、算出する画像グループ特徴情報に、当該画像グループ特徴情報に対応する画像グループに属する画像に含まれる、前記顔特徴算出部によって検出された顔の領域の面積に係る情報を含ませ、前記顔基準情報は、顔の領域の面積に係る情報を、互いに異なる分類先のうち、いずれの分類先に分類されるかを決定するための顔面積基準情報を含み、前記画像グループ分類部は、前記画像グループの分類を、1つの画像グループの画像グループ特徴情報に含まれる顔の領域の面積に係る情報と、分類用の基準情報に含まれる顔基準情報に含まれる顔面積基準情報とに基づいて行うとしてもよい。
人物の画像を撮影する撮影者には、関心の高い人物の顔が大きくなり、関心のあまり高くない人物の顔が小さくなるように撮影する傾向がある。
よって、顔の領域の面積は、その人物に対する、撮影者にとっての関心度を反映したものであると考えることができる。
従って、このような構成にすることによって、画像グループに属する画像の被写体である人物に対する関心度に注目した画像グループの分類を行うことができるようになるという効果を有する。
(f)また、前記顔情報の検出された顔の領域の面積に係る情報とは、顔を検出された画像に含まれる認識顔の領域のうち、面積が最大の顔の領域である最大顔領域の面積を示す情報であって、前記画像グループ特徴情報に含まれる顔の領域の面積に係る情報とは、当該画像グループ特徴情報に対応する画像グループに属する画像のうちの顔を検出された画像において、当該顔を検出された画像の最大顔領域の面積の総和を、当該顔を検出された画像の枚数で除算することで得られる値を示す情報であるとしてもよい。
最大顔領域の顔は、1枚の画像の被写体である人物群のうち、撮影者にとって最も注目している人物である撮影中心人物であると考えられる。
よって、顔を検出された画像の最大顔領域の面積の総和を、当該顔を検出された画像の枚数で除算することで得られる値は、顔を検出された画像における、最も関心の高い人物に対する関心度を平均したものであると考えられる。
従って、このような構成にすることによって、画像グループに属する画像の被写体である撮影中心人物に対する関心度の平均値に注目した画像グループの分類を行うことができるようになるという効果を有する。
(g)また、複数の画像グループに属する画像を記憶するための画像記憶部を備え、前記顔特徴算出部は、前記画像記憶部に記憶されている全ての画像について顔の検出を試み、前記画像記憶部に記憶されている全ての画像において前記顔特徴算出部によって検出された顔を、当該検出された顔の特徴に基づいて、複数の顔グループのうちのいずれかの顔グループに分類する顔クラスタリング部と、前記顔クラスタリング部によって同一の顔グループに分類された顔が2つ以上の画像グループに存在する顔グループを第1人物群に区分し、前記顔クラスタリング部によって同一の顔グループにクラスタリングされた顔が1つの画像グループにのみ存在し、かつ、複数存在する顔グループを第2人物群に区分し、前記第1人物群と前記第2人物群とのいずれにも属さない顔グループを第3人物群に区分する人物群区分部とを備え、前記画像グループ特徴算出部は、算出する画像グループ特徴情報に、当該画像グループ特徴情報に対応する画像グループに属する画像に含まれる、前記顔特徴算出部によって検出された顔の領域の面積のうち、前記第1人物群に属する顔の領域の面積、前記第2人物群に属する顔の領域面積、及び、前記第3人物群に属する顔の領域の面積のうち、少なくとも1つに係る情報を含ませ、前記顔基準情報は、顔の領域の面積のうち、前記第1人物群に属する顔の領域の面積、前記第2人物群に属する顔の領域面積、及び、前記第3人物群に属する顔の領域の面積のうち、少なくとも1つに係る情報を、互いに異なる分類先のうち、いずれの分類先に分類されるかを決定するための顔面積基準情報を含むとしてもよい。
このような構成にすることによって、被写体である人物を、2つ以上の画像グループに存在する第1人物群と、1つの画像グループにのみ存在し、かつ、複数存在する第2人物群と、前記第1人物群と前記第2人物群とのいずれにも属さない第3人物群とに区分し、このように区分された人物群毎の人物に対する関心度に注目した画像グループの分類を行うことができるようになるという効果を有する。
(h)また、前記顔特徴算出部は、算出する顔情報に、画像に含まれる検出した顔の数に係る情報を含ませ、前記画像グループ特徴算出部は、算出する画像グループ特徴情報に、当該画像グループ特徴情報に対応する画像グループに属する画像に含まれる、前記顔特徴算出部によって検出された顔の数に係る情報を含ませ、前記顔基準情報は、顔の数に係る情報を、互いに異なる分類先のうち、いずれの分類先に分類されるかを決定するための顔数基準情報を含み、前記画像グループ分類部は、前記画像グループの分類を、1つの画像グループの画像グループ特徴情報に含まれる顔の数に係る情報と、分類用の基準情報に含まれる顔基準情報に含まれる顔数基準情報とに基づいて行うとしてもよい。
このような構成にすることによって、画像グループに属する画像の被写体である人物の数に注目した画像グループの分類を行うことができるようになるという効果を有する。
(i)また、前記顔情報の検出された顔の数に係る情報とは、顔を検出された画像に含まれる検出された顔の数を示す情報であって、前記画像グループ特徴情報に含まれる顔の数に係る情報とは、当該画像グループ特徴情報に対応する画像グループに属する画像の枚数と、当該画像グループ特徴情報に対応する画像グループに属する画像のうち検出された顔を含む画像の枚数との比率を示す情報と、当該画像グループ特徴情報に対応する画像グループに属する画像のうち検出された顔を含む画像において検出された顔の数の総和を、当該画像グループ特徴情報に対応する画像グループに属する画像のうち検出された顔を含む画像の枚数で除算した値を示す情報と、当該画像グループ特徴情報に対応する画像グループに属する画像のうち検出された顔の数が最も多い画像に含まれる検出された顔の数を示す情報とのうちの、少なくとも1つの情報であるとしてもよい。
画像グループに属する画像の枚数と、検出された顔を含む画像の枚数との比率は、画像グループに属する画像のうちの、検出された顔が写っている画像の割合である。
また、検出された顔を含む画像において検出された顔の数の総和を、検出された顔を含む画像の枚数で除算した値は、検出された顔が写っている画像において、写っている検出された顔の数の平均値である。
従って、このような構成にすることによって、画像グループに属する画像のうちの、検出された顔が写っている画像の割合と、検出された顔が写っている画像において、写っている検出された顔の数の平均値と、顔の数が最も多い画像に含まれる検出された顔の数とのうちの、少なくとも1つの値に注目した画像グループの分類を行うことができるようになるという効果を有する。
(j)また、複数の画像グループに属する画像を記憶するための画像記憶部を備え、前記顔特徴算出部は、前記画像記憶部に記憶されている全ての画像について顔の検出を試み、前記画像記憶部に記憶されている全ての画像において前記顔特徴算出部によって検出された顔を、当該検出された顔の特徴に基づいて、複数の顔グループのうちのいずれかの顔グループに分類する顔クラスタリング部と、前記顔クラスタリング部によって同一の顔グループに分類された顔が2つ以上の画像グループに存在する顔グループを第1人物群に区分し、前記顔クラスタリング部によって同一の顔グループにクラスタリングされた顔が1つの画像グループにのみ存在し、かつ、複数存在する顔グループを第2人物群に区分し、前記第1人物群と前記第2人物群とのいずれにも属さない顔グループを第3人物群に区分する人物群区分部とを備え、前記画像グループ特徴算出部は、算出する画像グループ特徴情報に、当該画像グループ特徴情報に対応する画像グループに属する画像に含まれる、前記顔特徴算出部によって検出された顔数のうち、前記第1人物群に属する顔の数、前記第2人物群に属する顔の数、及び、前記第3人物群に属する顔の数のうち、少なくとも1つに係る情報を含ませ、前記顔基準情報は、顔の数のうち、前記第1人物群に属する顔の数、前記第2人物群に属する顔の数、及び、前記第3人物群に属する顔の数のうち、少なくとも1つに係る情報を、互いに異なる分類先のうち、いずれの分類先に分類されるかを決定するための顔数基準情報を含むとしてもよい。
このような構成にすることによって、被写体である人物を、2つ以上の画像グループに存在する第1人物群と、1つの画像グループにのみ存在し、かつ、複数存在する第2人物群と、前記第1人物群と前記第2人物群とのいずれにも属さない第3人物群とに区分し、このように区分された人物群毎の人物の数に注目した画像グループの分類を行うことができるようになるという効果を有する。
(k)また、前記画像特徴算出部は、画像に含まれる色に係る情報である色情報を算出する色特徴算出部を含み、前記画像特徴算出部によって算出される画像特徴情報は、前記色特徴算出部によって算出された色情報を含み、前記画像グループ特徴算出部は、算出する画像グループ特徴情報に、色に係る情報を含ませ、前記分類用の基準情報は、色に係る情報を、互いに異なる分類先のうち、いずれの分類先に分類されるかを決定するための情報である色基準情報を含み、前記画像グループ分類部は、前記画像グループの分類を、1つの画像グループの画像グループ特徴情報に含まれる色に係る情報と、分類用の基準情報に含まれる色基準情報とに基づいて行うとしてもよい。
このような構成にすることによって、画像グループに属する画像の色の特徴に基づいた画像グループの分類を行うことができるようになるという効果を有する。
(l)また、前記画像特徴算出部は、前記色情報へ反映させる画素値を、予め定められた数以上の、互いに同じ色である、互いに隣接する画素からなる画素群を構成する画素に限って、前記算出を行うとしてもよい。
このような構成にすることによって、同じ色である画素がある程度固まって出現する、例えば、空や地面といった背景の色を、同じ色である画素がある程度固まって出現することのない、例えば、人の服といった背景以外の色から区別して色特徴量を抽出することができるという効果を有する。
(m)また、本発明の一実施形態に係る画像分類装置は、画像グループに属する全部又は一部の2枚以上の画像についての、画像の特徴を示す画像特徴情報に基づいて、画像グループの特徴を示す画像グループ特徴情報を算出する画像グループ特徴算出部と、複数の画像グループの画像グループ特徴情報に基づいて、互いに類似する特徴を有する画像グループが同じ分類先に分類されるように、当該複数の画像グループを分類する画像グループ分類部とを備えることを特徴とする。
上述の構成を備える本実施の形態に係る画像分類装置は、画像の撮影時刻の情報に限られない画像の特徴に基づいて算出された画像グループ特徴情報に基づいて、画像グループ単位で画像を分類することができる。
従って、この画像分類装置は、撮影時刻以外の画像の特徴に基づいて、同一の画像グループに属する画像が、互いに異なるカテゴリに分類されてしまうことがないように画像を分類することができるという効果を有する。