JP5890325B2 - 画像データ処理装置、方法、プログラム及び集積回路 - Google Patents

画像データ処理装置、方法、プログラム及び集積回路 Download PDF

Info

Publication number
JP5890325B2
JP5890325B2 JP2012554676A JP2012554676A JP5890325B2 JP 5890325 B2 JP5890325 B2 JP 5890325B2 JP 2012554676 A JP2012554676 A JP 2012554676A JP 2012554676 A JP2012554676 A JP 2012554676A JP 5890325 B2 JP5890325 B2 JP 5890325B2
Authority
JP
Japan
Prior art keywords
image
face
area
information
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012554676A
Other languages
English (en)
Other versions
JPWO2012102015A1 (ja
Inventor
山口 晃一郎
晃一郎 山口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Intellectual Property Corp of America
Original Assignee
Panasonic Intellectual Property Corp of America
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Intellectual Property Corp of America filed Critical Panasonic Intellectual Property Corp of America
Priority to JP2012554676A priority Critical patent/JP5890325B2/ja
Publication of JPWO2012102015A1 publication Critical patent/JPWO2012102015A1/ja
Application granted granted Critical
Publication of JP5890325B2 publication Critical patent/JP5890325B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Description

本発明は、画像を分類するための画像特徴情報を算出する画像データ処理装置に関する。
デジタルスチルカメラやカメラ機能付き携帯電話機等のデジタル画像撮影機器が普及し、撮影された画像を記録するためのハードディスク等の記録媒体が安価に提供されている。
一般に、デジタル画像撮影機器等のユーザ(以下、単にユーザという。)は、撮影した各画像を、大容量のハードディスク等の記録媒体に蓄積している。
蓄積している画像が大量になると、蓄積している画像の中から目的の画像を探すのが難しくなるため、ユーザによる画像の検索を容易にする目的で、各画像をいくつかの分類先カテゴリに分類することがある。例えば、運動会で撮影された画像を、運動会という分類先カテゴリに分類する場合等が考えられる。
画像を分類する技術として、例えば、特許文献1に記載されているように、蓄積されているそれぞれの画像からその画像の特徴である画像特徴情報を算出し、算出された画像特徴情報を用いてそれぞれの画像をそれぞれの分類先カテゴリに分類する技術が知られ、また、特許文献2に記載されているように、画像に写っている顔の数や大きさを用いてその画像を分類する技術が知られている。
特許第4232774号公報 特許第4315344号公報
ところで、ユーザが画像を撮影する機会は、例えば、海水浴やスキー旅行といった行事である場合が多く、また、ユーザが画像を鑑賞する場合には、ある行事で撮影された画像群を単位として画像を鑑賞する場合が多い。
従って、一つの行事において撮影された画像群に属する画像は、同一の分類先カテゴリに分類されることが望まれる。
しかしながら、互いに異なる行事で撮影された画像から抽出された画像特徴情報の中に、互いに類似したものが存在する場合には、それら画像のそれぞれを、本来分類されるべき分類先カテゴリに分類することが難しくなってしまうことがある。
例として、従来の画像データ処理装置が画像に多く含まれる主要色(例えば、黒、青、緑、白等)に基づき画像特徴情報を算出する場合において、海水浴で撮影された画像群Aの画像とスキー旅行で撮影された画像群Bの画像とが分類対象となるときを考える。
海水浴で撮影された画像には、海の青色と砂浜の白色とが多く写り、スキー旅行で撮影された画像には、空の青色と雪の白色とが多く写ることとなる場合が多くなる。よって、この画像データ処理装置によって算出される、海水浴で撮影された画像の画像特徴情報とスキー旅行で撮影された画像の画像特徴情報とが、互いに類似したものとなってしまうことがある。
このような場合において、この従来の画像データ処理装置によって算出される画像特徴情報に基づいて画像を分類しようとするときには、海水浴で撮影された画像群Aの画像と、スキー旅行で撮影された画像群Bの画像とを、互いに異なる分類先カテゴリに分類することが難しくなってしまう。
そこで、本発明は係る問題に鑑みてなされたものであり、画像を分類するための画像特徴情報を算出する画像データ処理装置であって、この画像データ処理装置から算出される画像特徴情報を用いて画像を分類する場合において、一つの行事で撮影された画像群の画像のそれぞれを同じ分類先カテゴリに分類する分類精度を、従来よりも向上させ得る画像データ処理装置を提供することを目的とする。
上記課題を解決するために本発明に係る画像データ処理装置は、画像を分類するための画像特徴情報を算出する画像データ処理装置であって、一画像に含まれる顔の領域を特定する顔特定部と、一画像の少なくとも一部の画素に基づいて算出される画像特徴量から、当該画像における画像特徴情報を算出する画像特徴算出部とを備え、前記画像特徴算出部は、前記顔特定部によって特定された顔の領域の周囲の一定領域に含まれる画素に基づいて算出される画像特徴量の方が、当該一定領域に含まれない画素に基づいて算出される画像特徴量よりも、前記画像特徴情報へ大きく反映されるように、前記画像特徴情報の算出を行うことを特徴とする。
一般に、画像の撮影者は、ある行事において人の顔を含めた画像を撮影する場合に、その行事の特徴が、その人の顔の周囲の領域に現れるように撮影する傾向がある。例えば、海水浴において、撮影者は、人の顔の周囲の領域に海の青色が多くなるように画像が撮影する傾向があり、スキー旅行においては、人の顔の周囲の領域に雪の白色が多くなるように画像が撮影する傾向がある。
上述の構成を備える本発明に係る画像データ処理装置は、行事の特長が現れやすい傾向のある人の顔の周囲の領域の画素に基づいて算出される画像特徴量を、行事の特長が表れにくい傾向のある人の顔から離れた領域の画素に基づいて算出される画像特徴量よりも、より大きく反映させて画像特徴情報を抽出する。これにより、この画像データ処理装置は、従来の画像データ処理装置よりも、行事の特長がより大きく反映された画像特徴情報を算出し得ることとなる。
従って、この画像データ処理装置は、この画像データ処理装置から算出される画像特徴情報を用いて画像を分類する場合における分類精度を、従来よりも向上させ得ることができるようになる。
画像データ処理装置100のハードウエア構成を示すハードウエアブロック図 画像データ処理装置100の機能構成を示す機能ブロック図 画像記憶部231のディレクトリ構造を示すディレクトリ構造図 各種領域を視覚的に示す模式図 特殊な状況における人周囲領域を視覚的に示す模式図 画像特徴情報のデータ構造図 画像家族シーン情報のデータ構造図 画像グループ家族シーン情報のデータ構造図 イベント特徴情報のデータ構造図 画像特徴情報生成処理のフローチャート 画像家族シーン情報生成処理のフローチャート 画像グループ家族シーン情報生成処理のフローチャート 画像グループ分類処理のフローチャート 家族のメンバーが参加する行事で撮影された画像群を示す図 従来の画像データ処理装置が生成する画像グループシーン情報のデータ構造図 2枚の画像を示す図 画像データ処理装置1700の機能構成を示す機能ブロック図 画像記憶部1731のディレクトリ構造を示すディレクトリ構造図 イベント特徴情報のデータ構造図 変形画像特徴情報生成処理のフローチャート 画像分類処理のフローチャート 画像データ処理装置2200の機能構成を示す機能ブロック図 画像データ処理装置2300の機能構成を示す機能ブロック図
<実施の形態1>
以下、本発明に係る画像データ処理装置の一実施形態として、画像に写る人物の周囲の画素の特徴を示す人周囲特徴量を算出し、算出した人周囲特徴量に基づいて、一つの行事であるイベントに関連して撮影された複数枚の画像からなる画像グループ単位で、画像を互いに異なる予め定められた複数の分類先イベントのうちのいずれかの分類先イベントに分類する画像データ処理装置100について説明する。
ここで画像グループとは、ユーザによって指定された複数の画像からなる画像の集合のことであって、例えば、2009年冬の北海道への旅行というイベントにて撮影された画像の集合や、例えば、2010年の夏の沖縄への旅行というイベントにて撮影された画像の集合等である。また、分類先イベントとは、画像グループの分類先となる分類先カテゴリのことであって、例えば、スキーに関連する画像グループの分類先となる分類先カテゴリや、例えば、海水浴に関連する画像グループの分類先となる分類先カテゴリ等がある。
<構成>
<画像データ処理装置100のハードウエア構成>
図1は、画像データ処理装置100の主要なハードウエア構成を示すハードウエアブロック図である。
画像データ処理装置100は、システムLSI(Large Scale Integrated circuit)110と、ハードディスク装置130と、外部記録媒体読取書込装置140と、USB制御装置150と、出力装置160と、入力装置170と、通信装置180とから構成され、デジタル写真である画像を、JPEG(Joint Photographic Experts Group)方式で符号化されたデータとして記憶し、記憶する画像を分類する機能を有する。
また、画像データ処理装置100は、デジタルスチルカメラ192に代表される、画像を記録している機器と着脱可能なUSBケーブル195を介して接続し、画像を表示するためのディスプレイ193とモニタケーブル196を介して接続し、ネットワーク194と接続し、ユーザからの操作コマンドを受け付けるリモコン197と無線通信を行い、SDメモリカード191等で代表される外部記録媒体に対して、データの読み出しと書き込みとを行う機能を有する。
システムLSI110は、CPU101と、ROM102と、RAM103と、ハードディスク装置インターフェース104と、外部記録媒体読取書込装置インターフェース105と、USB(Universal Serial Bus)制御装置インターフェース106と、出力装置インターフェース107と、入力装置インターフェース108と、通信装置インターフェース109と、デコーダ111と、バスライン120とを1つの集積回路に集積したLSIである。このシステムLSI110は、ハードディスク装置130、外部記録媒体読取書込装置140、USB制御装置150、出力装置160、入力装置170、通信装置180と接続する。
CPU101は、バスライン120と接続し、ROM102又はRAM103に記憶されているプログラムを実行することで、ROM102、RAM103、ハードディスク装置130、外部記録媒体読取書込装置140、USB制御装置150、出力装置160、入力装置170、通信装置180、デコーダ111を制御して、様々な機能、例えば、ハードディスク装置130に記憶されている画像データを、RAM103のメモリ領域に読み出す機能等を実現する。
から符号化された画像データを読み出して復号し、復号した画像データをディスプレイ193に出力する機能等を実現する。
ROM102はバスライン120と接続し、CPU101の動作を規定するプログラムと、CPUが利用するデータとを記憶する。
RAM103は、バスライン120と接続し、CPU101がプログラムを実行することに伴って発生するデータを一時的に記憶し、また、ハードディスク装置130、外部記録媒体読取書込装置140から読み取ったデータや書き込むデータ、通信装置180が受信したデータや送信するデータ等を一時的に記憶する。
デコーダ111は、符号化された画像データを復号する機能を有するDSP(Digital Signal Processor)であって、バスライン120と接続し、CPU101によって制御され、JPEGデコード機能を有する。
ハードディスク装置インターフェース104、外部記録媒体読取書込装置インターフェース105、USB制御装置インターフェース106、出力装置インターフェース107、入力装置インターフェース108、通信装置インターフェース109は、それぞれ、ハードディスク装置130、外部記録媒体読取書込装置140、USB制御装置150、出力装置160、入力装置170、通信装置180と、バスライン120との信号のやり取りを仲介するインターフェースである。
ハードディスク装置130は、ハードディスク装置インターフェース104と接続し、CPU101によって制御され、内蔵するハードディスクにデータを書き込む機能と、内蔵するハードディスクに書き込まれているデータを読み取る機能を有する。画像データは、このハードディスク装置130に内蔵されるハードディスクに記憶される。
外部記録媒体読取書込装置140は、外部記録媒体読取書込装置インターフェース105と接続し、CPU101によって制御され、外部記録媒体にデータを書き込む機能と、外部記録媒体に書き込まれているデータを読み取る機能とを有する。
ここで、外部記録媒体とは、DVD(Digital Versatile Disc)、DVD−R、DVD−RAM、BD(Blu-ray Disc)、BD−R、BD−RE、SDメモリカード191等であって、外部記録媒体読取書込装置140は、これら、DVD、BD等からのデータの読み取りや、DVD−R、BD−R、BD−RE、SDメモリカード等へのデータの書き込みと読み取りとをすることができる。
USB制御装置150は、USB制御装置インターフェース106と接続し、CPU101によって制御され、着脱可能なUSBケーブル195を介して外部機器にデータを書き込む機能と、外部機器に書き込まれているデータを読み取る機能とを有する。
ここで、外部機器とは、デジタルスチルカメラ192、パーソナルコンピュータ、カメラ機能付き携帯電話機等の、画像を記憶する機器であって、USB制御装置150は、USBケーブル195を介してこれら外部機器へのデータの書き込みと読み取りとをすることができる。
出力装置160は、出力装置インターフェース107と、モニタケーブル196とに接続し、CPU101によって制御され、モニタケーブル196を介してディスプレイ193に表示させるデータを出力する機能を有する。
入力装置170は、入力装置インターフェース108と接続し、CPU101によって制御され、リモコン197から無線で送信されるユーザからの操作コマンドを受け付け、受け付けた操作コマンドをCPU101に送信する機能を有する。
通信装置180は、通信装置インターフェース109と、ネットワーク194とに接続し、CPU101によって制御され、ネットワーク194を介して、外部通信機器とデータの送受信を行う機能を有する。
ここで、ネットワーク194とは、光通信回線、電話回線、無線回線等によって実現されており、外部通信機器や、インターネット等と接続している。
また、外部通信機器とは、外部ハードディスク装置等といった、画像や、CPU101の動作を規定するプログラム等を記憶する機器であって、通信装置180は、ネットワーク194を介してこれら外部通信機器からデータの読み取りをすることができる。
以上のようなハードウエアで実現される画像データ処理装置100は、CPU101が、ROM102又はRAM103に記憶されているプログラムを実行し、ROM102、RAM103、ハードディスク装置130、外部記録媒体読取書込装置140、USB制御装置150、出力装置160、入力装置170、通信装置180、デコーダ111を制御することで様々な機能を実現する。
以下、図面を用いて、CPU101がプログラムを実行することで実現される、画像データ処理装置100の機能構成を説明する。
<画像データ処理装置100の機能構成>
図2は、画像データ処理装置100の主要な機能ブロックの構成を示す機能ブロック図である。
画像データ処理装置100は、画像グループデータ受付部201、画像書込読出部202、画像特徴情報書込読出部203、家族シーン情報書込読出部204、顔抽出部205、家族シーン情報算出部206、人周囲特徴量抽出部207、画像グループ分類部208、イベント特徴情報書込読出部209、分類結果出力部210、イベント名情報受付部211、イベント特徴情報受付部212、サンプル画像受付部213、サンプル画像書込部214、イベント特徴情報記憶部234、サンプル画像記憶部236とから構成される。
画像グループデータ受付部201は、CPU101がプログラムを実行することで実現されるブロックであって、画像書込読出部202と接続し、ユーザからの、2枚以上の画像からなる画像グループ241の画像の指定を受け付け、受け付けた画像群を、1つの画像グループに含まれる画像群として、RAM103のメモリ領域に読み込む機能と、画像を読み込む際に、その画像を特定するための画像IDを付与する機能とを有する。
画像グループデータ受付部201が画像を読み込む場合には、外部記録媒体読取書込装置140経由で外部記録媒体から画像を読み込む場合と、USB制御装置150経由で外部機器から画像を読み込む場合と、通信装置180経由で外部通信機器から画像を読み込む場合とがある。
画像記憶部231は、画像としてのデジタル写真を、JPEG方式で符号化された画像データとして記憶するための記憶領域であって、画像書込読出部202に接続され、ハードディスク装置130に内蔵されているハードディスクの一部の領域として実装されている。
画像記憶部231に記憶される各画像データは、画像ファイルとして、ファイルシステム配下において、論理的にディレクトリ構造により管理されている。
図3は画像記憶部231のディレクトリ構造を示すディレクトリ構造図である。
同図に示されているように、画像記憶部231のディレクトリ構造は、最上位階層310と、第1ディレクトリ階層320と、第2ディレクトリ階層330との合計3階層からなっている。
第1ディレクトリ階層320には、スキーディレクトリ321、海水浴ディレクトリ322、ピクニックディレクトリ323等の複数の分類先イベントディレクトリと、実データ保管ディレクトリ324とが存在する。
分類先イベントディレクトリは、画像グループの分類先である分類先イベントと同じ名前を持つディレクトリであって、同じ名前のディレクトリは1つしか存在しない。
実データ保管ディレクトリ324は、画像データを保持するディレクトリであって、画像のデータはこの実データ保管ディレクトリ324のみに保持される。
第2ディレクトリ階層330には、2010年冬信州旅行ディレクトリ331、2009年冬北海道旅行ディレクトリ332、2010年夏沖縄旅行ディレクトリ等の複数のイベントディレクトリが存在する。
イベントディレクトリは、画像グループデータ受付部201が受け付けた画像群からなる画像グループに対応するディレクトリであって、実データ保管ディレクトリ324に保持されているデータのうち、その画像グループに属する全ての画像のデータのアドレスを示す情報が保持されることによって、その画像のデータがリンクされている状態となっているディレクトリである。
各イベントディレクトリは、対応する画像グループが分類されている分類先イベントに対応する分類先イベントディレクトリの下に存在している。
もし、複数の分類先イベントに分類されている画像グループが存在する場合には、分類されている分類先イベントの数だけ、同一名称で同一の画像がリンクされているディレクトリが存在する。
ここで、各イベントディレクトリの名称は、画像データ処理装置100を利用するユーザによって、そのイベントディレクトリに対応する画像グループについて指定されるイベント名となっている。各イベントディレクトリの生成方法については後程<画像グループ分類処理>で説明する。
再び図2に戻って、画像データ処理装置100の機能構成の説明を続ける。
画像書込読出部202は、CPU101がプログラムを実行することで実現されるブロックであって、画像記憶部231と、画像グループデータ受付部201と、顔抽出部205と、家族シーン情報算出部206と、画像グループ分類部208とに接続し、画像記憶部231に記憶されている画像を読み出す機能と、画像記憶部231に画像を書き込む機能と、画像記憶部231のディレクトリ構造を変更する機能と、画像記憶部231の画像データのリンクを変更する機能とを有する。
サンプル画像記憶部236は、特定の人物(例えば家族)の顔が写っているデジタル写真であるサンプル画像を、JPEG方式で符号化された画像データとして記憶するための記憶領域であって、サンプル画像書込部214と、顔抽出部205とに接続され、ハードディスク装置130に内蔵されているハードディスクの一部の領域として実装されている。
サンプル画像書込部214は、CPU101がプログラムを実行することで実現されるブロックであって、サンプル画像受付部213と接続し、サンプル画像受付部213によって受け付けられたサンプル画像と人物を特定する対応顔IDとを、サンプル画像記憶部236に書き込む機能を有する。
サンプル画像受付部213は、CPU101がプログラムを実行することで実現されるブロックであって、サンプル画像書込部214と接続し、ユーザから、特定の人物の顔が写っているサンプル画像とその人物を特定する対応顔IDとを受け付け、受け付けたサンプル画像と対応顔とを対応付けて、RAM103のメモリ領域に読み込む機能と、読み込んだサンプル画像を、サンプル画像書込部214を用いて、サンプル画像記憶部236に記憶させる機能を有する。
サンプル画像受付部213が画像を読み込む場合には、外部記録媒体読取書込装置140経由で外部記録媒体から画像を読み込む場合と、USB制御装置150経由で外部機器から画像を読み込む場合と、通信装置180経由で外部通信機器から画像を読み込む場合とがある。
顔抽出部205は、CPU101がプログラムを実行することで実現されるブロックであって、画像書込読出部202と、人周囲特徴量抽出部207と、サンプル画像記憶部236とに接続し、以下の3つの機能を有する。
機能1:人の顔の特徴を示す予め定められた顔のモデルを保持し、保持する顔のモデルを参照することで、1枚の画像に含まれる顔の認識を試み、顔を認識した場合に、認識した顔の領域の面積と、認識した顔の位置とを算出し、認識した顔それぞれに、その認識した顔を特定するための顔IDを、シーケンシャルに付与する機能。
ここで、顔のモデルとは、例えば、目、鼻、口等の顔を形成するパーツの輝度や、相対的な位置関係に関する情報等であり、認識した顔の領域とは、例えば、認識した顔を含む、画像における水平方向の辺と画像における垂直方向の辺とを有する矩形のうち、面積が最小となる矩形の領域である。
顔抽出部205は、予め定められた顔のモデルとして、例えばハードディスク装置130の内部に保持されているものを用いる場合、外部に格納されているものを参照する場合等が考えられる。
機能2:顔を認識した場合に、画像から、その認識した顔の特徴と、サンプル画像記憶部236に記憶されているサンプル画像に含まれる顔の特徴とを抽出し、サンプル画像記憶部236に記憶されているサンプル画像の中に、その認識した顔の特徴と同じ顔の特徴を持つ画像があるとき、その認識した顔の人物を、そのサンプル画像に写っている人物と同一人物であると判断する機能。
ここで、顔の特徴とは、例えば、目、鼻、口等の顔を形成するパーツの相対的な位置関係や、これらパーツの面積比率等のことである。
機能3:顔を認識した場合に、その認識した顔の領域の下方に、体の領域を、その認識した顔の領域に対して所定のアルゴリズムで定められる矩形の領域として算出し、算出した体の領域の面積と、算出した体の領域の位置とを算出し、算出した体の領域のそれぞれに、その算出した体の領域を特定するための体IDを、シーケンシャルに付与する機能。
ここで、体の領域を定める所定のアルゴリズムとは、例えば、認識した顔の領域の下方の、顔の領域の画像における水平方向の幅を1.5倍し、顔の領域の画像における垂直方向の幅を2倍した矩形の領域であって、その中心点の画像における水平方向の座標が、顔の領域の中心の画像における水平方向の座標と一致する矩形の領域を、体の領域とするアルゴリズムである。
人周囲特徴量抽出部207は、CPU101がプログラムを実行することで実現されるブロックであって、顔抽出部205と、画像特徴情報書込読出部203とに接続し、以下の5つの機能を有する。
機能1:顔周囲領域を、顔抽出部205によって算出された顔の領域の位置に対して所定のアルゴリズムで定められる矩形の領域として算出し、算出した顔周囲領域の位置を算出する機能。
ここで、顔周囲領域を定める所定のアルゴリズムとは、例えば、顔の領域に対して、画像における水平方向の左右のそれぞれに、顔の領域の、画像における水平方向の幅を加え、画像における垂直方向の上方に、顔の領域の、画像における垂直方向の幅を加えた矩形の領域を、顔周囲領域とするアルゴリズムである。
機能2:体周囲領域を、顔抽出部205によって算出された顔の領域の位置に対して所定のアルゴリズムで定められる矩形の領域として算出し、算出した体周囲領域の位置を算出する機能。
ここで、体周囲領域を定める所定のアルゴリズムとは、例えば、体の領域に対して、画像における水平方向の左右のそれぞれに、顔の領域の、画像における水平方向の幅を加え、画像における垂直方向の上下のそれぞれに、顔の領域の、画像における垂直方向の幅の半分の幅を加えた矩形の領域を、体周囲領域とするアルゴリズムである。
機能3:人周囲領域を、算出した顔周囲領域と体周囲領域とに対して所定のアルゴリズムで定められる領域として算出する機能。
ここで、人周囲領域を定める所定のアルゴリズムとは、例えば、顔周囲領域と体周囲領域との少なくとも一方に含まれる領域から、顔の領域と体の領域とを除外した領域を、人周囲領域とするアルゴリズムのことである。
機能4:人周囲領域に含まれる各画素について、その画素を構成する色成分、例えば、R(Red)、G(Green)、B(Blue)の各輝度値から、その画素の色が、予め定めているN個の主要色(例えば、黒、青、緑、白等)のうちのいずれの色に類似しているかを特定し、特定された色のそれぞれについて、人周囲領域に含まれる全画素数に対するその色に特定された画素数の比率を、人周囲特徴量として算出する機能。
ある画素の色がいずれの主要色に類似しているかを特定する方法としては、例えば、それぞれの主要色毎に、予め、対応するRの輝度値の範囲とGの輝度値の範囲とBの輝度値の範囲とを定めておき、特定対象となる画素の、R、G、Bの輝度値と比較することで、その画素がいずれの主要色に類似しているかを特定する方法がある。
機能5:画像特徴情報(後述)を生成する機能。
図4は、上述の各種領域を視覚的に示す模式図である。
同図において、画像401は、顔412と体413とからなる人物411が撮影された画像である。
第1変形画像402には、画像401における、顔抽出部205によって算出された顔の領域422が示されている。第2変形画像403には、画像401における、顔抽出部205によって算出された体の領域423が示されている。第3変形画像404には、画像401における、人周囲特徴量抽出部207によって算出された顔周囲領域424が示されている。第4変形画像405には、画像401における、人周囲特徴量抽出部207によって算出された体周囲領域425が示されている。第5変形画像406には、画像401における、人周囲特徴量抽出部207によって算出された人周囲領域426が示されている。
このように、画像401から、顔の領域422、体の領域423、顔周囲領域424、体周囲領域425、人周囲領域426が算出される。
図5は、特殊な状況における人周囲領域を視覚的に示す模式図である。
同図において、画像501は、認識された顔を複数含む画像の例であって、ここでは、顔A512と体A513とからなる人物511と、顔B562と体B563とからなる人物561との2人の人物の認識された顔が含まれた画像となっている。
変形画像502には、画像501における、人周囲特徴量抽出部207によって算出された人周囲領域526が示されている。
変形画像502に示されるように、人周囲特徴量抽出部207は、顔A512に対応する顔周囲領域と顔B562に対応する顔周囲領域と体A513に対応する体周囲領域と体B563に対応する体周囲領域との少なくとも一つに含まれる領域から、顔A512に対応する顔の領域と顔B562に対応する顔の領域と体A513に対応する体の領域と体B563に対応する体の領域とを除外した領域を、人周囲領域として算出する。
このように、人周囲特徴量抽出部207は、一枚の画像に認識された顔が複数含まれている場合には、いずれかの顔周囲領域といずれかの体周囲領域との少なくとも一つに含まれる領域から、全ての顔の領域と全ての体の領域とを除外した領域を人周囲領域とする。
画像503は、顔周囲領域の一部又は体周囲領域の一部が画像からはみ出してしまう認識された顔を含む画像の例であって、ここでは、顔592と体593とからなる人物591が含まれた画像となっている。
変形画像504には、画像503における、人周囲特徴量抽出部207によって算出された人周囲領域596が示されている。
変形画像504に示されるように、人周囲特徴量抽出部207は、画像内の領域のうち、顔周囲領域と体周囲領域との少なくとも一つに含まれる領域から、顔の領域と体の領域と画像503に含まれない領域とを除外した領域を、人周囲情報として算出する。
再び図2に戻って、画像データ処理装置100の機能構成の説明を続ける。
画像特徴情報記憶部232は、画像特徴情報を記憶するための記憶領域であって、画像特徴情報書込読出部203に接続され、ハードディスク装置130に内蔵されているハードディスクの一部の領域として実装されている。
図6は、画像特徴情報記憶部232に記憶されている画像特徴情報のデータ構造の一例を示す図である。
同図に示されるように、画像特徴情報は、画像ID600と、顔特徴量610と、体特徴量620と、顔周囲領域630と、体周囲領域640と、人周囲特徴量650とが対応付けられて構成されている。
また、顔特徴量610は、さらに、顔ID611と、顔面積612と、顔位置613と、対応顔ID614とが対応付けられて構成され、体特徴量620は、さらに、体ID621と、体面積622と、体位置623とが対応付けられて構成され、人周囲特徴量650は、さらに、黒比率651と、青比率652と、緑比率653と、白比率654とが対応付けられて構成されている。
画像ID600は、画像グループデータ受付部201によって各画像に付与された、画像を特定するためのIDである。
顔ID611は、顔抽出部205によって各認識された顔に付与された、認識された顔を特定するためのIDである。
顔面積612は、顔抽出部205によって算出された、画像の面積に対する顔の領域の面積の比率であって、顔の領域が画像全体となる場合に1となるように正規化されている。
顔位置613は、顔抽出部205によって算出された、顔の領域の位置を示す座標であって、画像における、矩形である顔の領域の左上の座標と右下の座標とで構成される。
対応顔ID614は、サンプル画像記憶部236に記憶されている画像に含まれる人物を特定するIDである。ここでは、例えば、対応顔ID614が“01”であれば、その人物は息子、“02”であれば父、“03”であれば母であることを示している。また、例えば、顔ID611と同じ顔の特徴を持つ、サンプル画像記憶部236に記憶されている画像に含まれる人物がない場合には、対応顔ID614は“99”であるとしている。また、例えば、対応顔ID614が“01”又は“02”又は“03”である場合に、その人物は、家族であるとする。
体ID621は、顔抽出部205によって算出された体の領域に付与された、体の領域を特定するためのIDである。
体面積622は、顔抽出部205によって算出された、画像の面積に対する体の領域の面積の比率であって、体の領域が画像全体となる場合に1となるように正規化されている。
体位置623は、顔抽出部205によって算出された、体の領域の位置を示す座標であって、画像における、矩形である体の領域の左上の座標と右下の座標とで構成される。
顔周囲領域630は、人周囲特徴量抽出部207によって算出された、顔周囲領域の位置を示す座標であって、画像における、顔周囲領域の左上の座標と右下の座標とで構成される。ここで、座標とは、画像の左上の座標を(0、0)とした場合のX、Y座標である。
体周囲領域640は、人周囲特徴量抽出部207によって算出された、体周囲領域の位置を示す座標であって、画像における、矩形である体周囲領域の左上の座標と右下の座標とで構成される。
黒比率651は、人周囲特徴量抽出部207によって算出された、人周囲領域に含まれる全画素数に対する、人周囲領域に含まれる黒色と特定された画素の数の比率である。
青比率652は、人周囲特徴量抽出部207によって算出された、人周囲領域に含まれる全画素数に対する、人周囲領域に含まれる青色と特定された画素の数の比率である。
緑比率653は、人周囲特徴量抽出部207によって算出された、人周囲領域に含まれる全画素数に対する、人周囲領域に含まれる緑色と特定された画素の数の比率である。
白比率654は、人周囲特徴量抽出部207によって算出された、人周囲領域に含まれる全画素数に対する、人周囲領域に含まれる白色と特定された画素の数の比率である。
再び図2に戻って、画像データ処理装置100の機能構成の説明を続ける。
画像特徴情報書込読出部203は、CPU101がプログラムを実行することで実現されるブロックであって、人周囲特徴量抽出部207と、家族シーン情報算出部206と、画像特徴情報記憶部232とに接続し、画像特徴情報記憶部232に対して、画像特徴情報の読み出し、書き込みを行う機能を有する。
イベント名情報受付部211は、CPU101がプログラムを実行することで実現されるブロックであって、家族シーン情報算出部206に接続し、画像データ処理装置100を利用するユーザによって入力される、画像グループの名称であるイベント名を受け付ける機能を有する。
家族シーン情報算出部206は、CPU101がプログラムを実行することで実現されるブロックであって、画像書込読出部202と、画像特徴情報書込読出部203と、家族シーン情報書込読出部204と、イベント名情報受付部211とに接続し、以下の2つの機能を有する。
機能1:認識された顔を含む画像について、画像家族シーン特徴量(後述)を、人周囲特徴量に対して所定のアルゴリズムで定められる値として算出する機能。
ここで、画像家族シーン特徴量を定める所定のアルゴリズムとは、例えば、人周囲特徴量の各色比率の値を、顔面積の値で除算することで画像家族シーン特徴量の各画像家族シーン色比率を算出するアルゴリズムのことである。このアルゴリズムによれば、算出される画像家族シーン特徴量は、画像における顔の領域の面積がより小さな画像の方が、その画像の画像家族シーン特徴量の値がより大きな値となるように重み付けされることとなる。
機能2:画像グループに対して、画像グループ家族シーン特徴量(後述)を、その画像グループに含まれる画像の画像家族シーン特徴量に対して所定のアルゴリズムで定められる値として算出する機能。
ここで、画像グループ家族シーン特徴量を定める所定のアルゴリズムとは、例えば、画像グループに含まれる画像のうち、家族の顔として認識された顔を含む画像に対応する画像家族シーン特徴量の各画像家族シーン色比率の値についての平均値を、画像グループ家族シーン特徴量の各画像グループ家族シーン色比率の値とするアルゴリズムのことである。
また、ここで、家族の顔とは、対応する対応顔IDが家族を示す顔である。
機能3:画像家族シーン情報(後述)と画像グループ家族シーン情報(後述)とを生成する機能。
家族シーン情報記憶部233は、画像家族シーン情報と画像グループ家族シーン情報とを記憶するための記憶領域であって、家族シーン情報書込読出部204に接続され、ハードディスク装置130に内蔵されているハードディスクの一部の領域として実装されている。
図7は、家族シーン情報記憶部233に記憶されている画像家族シーン情報のデータ構造の一例を示す図である。
同図に示されるように、画像家族シーン情報は、画像ID700と、顔ID710と、対応顔ID720と、画像家族シーン特徴量730とが対応付けられて構成されている。
また、画像家族シーン特徴量730は、さらに、画像家族シーン黒比率731と、画像家族シーン青比率732と、画像家族シーン緑比率733と、画像家族シーン白比率734とが対応付けられて構成されている。
画像ID700と顔ID710と対応顔ID720とは、それぞれ、図6中の画像ID600と顔ID611と対応顔ID614と同等のものである。よって、説明を省略する。
画像家族シーン黒比率731は、対応する画像の黒比率651(図6参照)の値に重み付けがなされることで算出される値であって、家族シーン情報算出部206が、黒比率651の値を、対応する顔面積612の値で除算することによって算出されたものである。
画像家族シーン青比率732は、対応する画像の青比率652の値に重み付けがなされることで算出される値であって、家族シーン情報算出部206が、青比率652の値を、対応する顔面積612の値で除算することによって算出されたものである。
画像家族シーン緑比率733は、対応する画像の緑比率653の値に重み付けがなされることで算出される値であって、家族シーン情報算出部206が、緑比率653の値を、対応する顔面積612の値で除算することによって算出されたものである。
画像家族シーン白比率734は、対応する画像の白比率654の値に重み付けがなされることで算出される値であって、家族シーン情報算出部206が、白比率654の値を、対応する顔面積612の値で除算することによって算出されたものである。
図8は、家族シーン情報記憶部233に記憶されている画像グループ家族シーン情報のデータ構造の一例を示す図である。
同図に示されるように、画像グループ家族シーン情報は、画像グループID800と、イベント名810と、画像グループ家族シーン特徴量820とが対応付けられて構成されている。
また、画像グループ家族シーン特徴量820は、さらに、画像グループ家族シーン黒比率821と、画像グループ家族シーン青比率822と、画像グループ家族シーン緑比率823と、画像グループ家族シーン白比率824とが対応付けられて構成されている。
画像グループID800は画像グループを特定するためのIDである。
イベント名810は、画像データ処理装置100を利用するユーザによって、イベント名情報受付部211を介して入力される、画像グループの名称であるイベント名である。
画像グループ家族シーン黒比率821は、対応する画像グループを構成する画像のうち、家族の顔として認識された顔を含む画像における画像家族シーン黒比率731(図7参照)の値の平均値であって、家族シーン情報算出部206によって算出されたものである。
画像グループ家族シーン青比率822は、対応する画像グループを構成する画像のうち、家族の顔として認識された顔を含む画像における画像家族シーン青比率732の値の平均値であって、家族シーン情報算出部206によって算出されたものである。
画像グループ家族シーン緑比率823は、対応する画像グループを構成する画像のうち、家族の顔として認識された顔を含む画像における画像家族シーン緑比率733の値の平均値であって、家族シーン情報算出部206によって算出されたものである。
画像グループ家族シーン白比率824は、対応する画像グループを構成する画像のうち、家族の認識された顔を含む画像における画像家族シーン白比率734の値の平均値であって、家族シーン情報算出部206によって算出されたものである。
再び図2に戻って、画像データ処理装置100の機能構成の説明を続ける。
家族シーン情報書込読出部204は、CPU101がプログラムを実行することで実現されるブロックであって、家族シーン情報算出部206と、画像グループ分類部208と、家族シーン情報記憶部233とに接続し、家族シーン情報記憶部233に対して、画像家族シーン情報と画像グループ家族シーン情報との読み出し、書き込みを行う機能を有する。
イベント特徴情報記憶部234は、イベント特徴情報を記憶するための記憶領域であって、イベント特徴情報書込読出部209に接続され、ハードディスク装置130に内蔵されているハードディスクの一部の領域として実装されている。
図9は、イベント特徴情報記憶部234に記憶されているイベント特徴情報のデータ構造の一例を示す図である。
同図に示されるように、イベント特徴情報は、画像グループ家族シーン黒比率1.5以上901、画像グループ家族シーン青比率1.5以上902、画像グループ家族シーン比率緑1.5以上903、画像グループ家族シーン比率白1.5以上904等といった分類条件900のそれぞれを、花火911、海水浴912、ピクニック913、スキー914等といった分類先イベント910のそれぞれに対応付けているものである。
再び図2に戻って、画像データ処理装置100の機能構成の説明を続ける。
イベント特徴情報書込読出部209は、CPU101がプログラムを実行することで実現されるブロックであって、画像グループ分類部208と、イベント特徴情報受付部212と、イベント特徴情報記憶部234とに接続し、イベント特徴情報記憶部234に対して、イベント特徴情報の読み出し、書き込みを行う機能を有する。
イベント特徴情報受付部212は、CPU101がプログラムを実行することで実現されるブロックであって、イベント特徴情報書込読出部209と接続し、画像データ処理装置100を利用するユーザによって入力される、イベント特徴情報を受け付け、受け付けたイベント特徴情報を、イベント特徴情報書込読出部209を用いて、イベント特徴情報記憶部234に記憶させる機能を有する。
イベント特徴情報受付部212がイベント特徴情報を受け付ける場合には、ユーザからのリモコン197の操作によって受け付ける場合と、外部記録媒体読取書込装置140経由で外部記録媒体から受け付ける場合と、USB制御装置150経由で外部機器から受け付ける場合と、通信装置180経由で外部通信機器から受け付ける場合とがある。
画像グループ分類部208は、CPU101がプログラムを実行することで実現されるブロックであって、画像書込読出部202と、家族シーン情報書込読出部204と、イベント特徴情報書込読出部209と、分類結果出力部210とに接続し、家族シーン情報記憶部233に記憶されている画像グループ家族シーン情報と、イベント特徴情報記憶部234に記憶されているイベント特徴情報とに基づいて、画像グループを、分類先イベントに分類する機能を有する。
画像グループ分類部208が行う画像グループの分類方法の詳細については、後程<画像グループ分類処理>で説明する。
分類結果出力部210は、CPU101がプログラムを実行することで実現されるブロックであって、画像グループ分類部208と接続し、画像グループ分類部208が画像グループを分類した場合に、分類結果をディスプレイ193に表示させる機能を有する。
以上のように構成される画像データ処理装置100の行う動作について、以下、図面を用いて説明する。
<動作>
画像データ処理装置100の行う特徴的な動作に、画像特徴情報生成処理と、画像家族シーン情報生成処理と、画像グループ家族シーン情報生成処理と、画像グループ分類処理とがある。
以下、それぞれの処理について、図面を用いて説明する。
<画像特徴情報生成処理>
画像特徴情報生成処理は、画像データ処理装置100が、画像グループ単位で画像を読み込み、読み込んだ画像のそれぞれに対して、画像特徴情報を生成する処理である。
図10は、画像データ処理装置100の行う画像特徴情報生成処理のフローチャートである。
画像特徴情報生成処理は、リモコン197が、ユーザから画像特徴情報生成処理を開始する旨の操作を受け付けることで開始される。
画像特徴情報生成処理が開始されると、画像グループデータ受付部201は、1つの画像グループの画像の読み込みを開始し、イベント名情報受付部211は、その画像グループに属する画像が撮影されたイベントのイベント名の受け付けを開始する(ステップS1000)。
画像グループデータ受付部201は、外部記録媒体読取書込装置140に装着された外部記録媒体から、又は、USB制御装置150に接続されたUSBケーブル195を介して外部機器から、又は、ネットワーク194に接続された通信装置180から、画像を読み込むことができる。
ここでは、例えば、外部記憶媒体としてのSDメモリカード191に記録されている画像グループの画像を、外部記録媒体読取書込装置140から読み込むものとする。
画像グループデータ受付部201は、SDメモリカード191に記録されている画像を1つずつ読み込んで、読み込んだ画像に対して、シーケンシャルに画像IDを付与し、画像データと画像IDとを対応付けて、画像書込読出部202を用いて、画像記憶部231の実データ保管ディレクトリ324に書き込む。
イベント名情報受付部211は、ユーザからのリモコン197の操作によって、画像グループに属する画像が撮影されたイベントのイベント名を受け付ける。
画像グループに属する画像が全て画像記憶部231に書き込まれると、顔抽出部205は、画像書込読出部202を用いて、画像記憶部231から、画像グループデータ受付部201によって受け付けられた画像グループに属する画像を1枚ずつ選択して読み出して(ステップS1010)、読み出した画像をJPEG方式で復号する。
顔抽出部205は、読み出された1枚の画像について、保持する顔のモデルを参照することで、1枚の画像に含まれる顔の認識を試みる(ステップS1020)。
顔抽出部205は、顔を認識した場合に(ステップS1020:Yes)、認識した顔のそれぞれについて、顔特徴量を算出する(ステップS1030)。すなわち、認識した顔の領域の面積と、認識した顔の位置とを算出し、認識した顔それぞれに、その認識した顔を特定するための顔IDを、シーケンシャルに付与し、その認識した顔の特徴と、サンプル画像記憶部236に記憶されているサンプル画像に含まれる顔の特徴とを抽出し、サンプル画像記憶部236に記憶されているサンプル画像の中に、その認識した顔の特徴と同じ顔の特徴を持つ画像があるとき、その認識した顔の対応顔IDに、そのサンプル画像に対応する対応顔IDを付与する。もし、サンプル画像記憶部236に記憶されているサンプル画像の中に、その認識した顔の特徴と同じ顔の特徴を持つ画像がなければ、その認識した顔の対応顔IDに、他人である旨を意味する“99”を付与する。
ステップS1030の処理が終わると、顔抽出部205は、認識した顔のそれぞれについて、認識した顔の領域の下方に体の領域を算出し、算出した体の領域のそれぞれについて、体特徴量を算出する(ステップS1040)。すなわち、算出した体の領域の面積と、算出した体の領域の位置とを算出し、算出した体の領域のそれぞれに、その算出した体の領域を特定するための体IDを、シーケンシャルに付与する。
ステップS1040の処理が終わると、人周囲特徴量抽出部207は、顔の領域に基づいて顔周囲領域を算出し、体の領域に基づいて体周囲領域を算出し、算出した顔周囲領域と算出した体周囲領域とから人周囲領域を算出する(ステップS1050)。
さらに、人周囲特徴量抽出部207は、人周囲領域に含まれる画素の画素値に基づいて、人周囲特徴量を算出する(ステップS1060)。すなわち、人周囲領域に含まれる各画素について、その画素を構成する色成分であるR、G、Bの各輝度から、その画素の色を特定し、特定された色のそれぞれについて、人周囲領域に含まれる全画素数に対するその色に特定された画素数の比率をその色の色比率として算出する。
ステップS1020の処理において、顔抽出部205が顔を認識しなかった場合には(ステップS1020:No)、顔抽出部205は、顔特徴量の各構成要素の値としてヌル値を設定し、体特徴量の各構成要素の値としてヌル値を設定し、人周囲特徴量抽出部207は、顔周囲領域の値としてヌル値を設定し、体周囲領域の値としてヌル値を設定し、人周囲特徴量の各構成要素の値としてヌル値を設定する(ステップS1070)。
ステップS1060の処理が終わった場合、又はステップS1070の処理が終わった場合に、人周囲特徴量抽出部207は、対象となっている画像についての画像特徴情報を生成し、生成した画像特徴情報を、画像特徴情報書込読出部203を用いて、画像特徴情報記憶部232に記憶させる(ステップS1080)。
ステップS1080の処理が終わると、顔抽出部205は、画像グループデータ受付部201によって受け付けられた画像グループに属する画像の中に、未だ選択していない画像があるか否かを調べる(ステップS1090)。
ステップS1090の処理において、未選択の画像が存在する場合に(ステップS1090:No)、画像データ処理装置100は、再びステップS1010の処理に戻って、ステップS1010以降の処理を続ける。
ステップS1090の処理において、未選択の画像が存在しない場合に(ステップS1090:Yes)、画像データ処理装置100は、その画像特徴情報生成処理を終了する。
<画像家族シーン情報生成処理>
画像家族シーン情報生成処理は、画像データ処理装置100が、画像特徴情報に基づいて、画像家族シーン情報を生成する処理である。
図11は、画像データ処理装置100が行う画像家族シーン情報生成処理のフローチャートである。
画像家族シーン情報生成処理は、画像データ処理装置100が画像特徴情報生成処理を終了することで開始される。
画像家族シーン情報生成処理が開始されると、家族シーン情報算出部206は、画像特徴情報書込読出部203を用いて、画像特徴情報記憶部232から、画像特徴情報生成処理で処理対象となった画像グループに属する画像の画像特徴情報を読み出す(ステップS1100)。
家族シーン情報算出部206は、読み出した画像特徴情報の中から、1つの画像特徴情報を選択し(ステップS1110)、選択した画像特徴情報に対応する画像に認識された顔が含まれているか否かを調べる(ステップS1120)。ここで、認識された顔が含まれているか否かは、顔特徴量を構成する各構成要素がヌル値でないかあるかを調べることで調べられる。
家族シーン情報算出部206は、認識された顔が含まれている場合に(ステップS1120:Yes)、顔面積612(図6参照)と人周囲特徴量650とから、画像家族シーン特徴量を算出する(ステップS1130)。すなわち、人周囲特徴量650を構成する各色比率の値のそれぞれを顔面積612の値で除算することで、それぞれの画像家族シーン色比率の値を算出する。
ステップS1120の処理において、認識された顔が含まれていない場合には(ステップS1120:No)、家族シーン情報算出部206は、画像家族シーン特徴量の値としてヌル値を設定する(ステップS1140)。すなわち、画像家族シーン特徴量を構成するそれぞれの画像家族シーン色比率の値を、それぞれヌル値とする。
ステップS1130の処理が終わった場合、又はステップS1140の処理が終わった場合に、家族シーン情報算出部206は、対象となっている画像特徴情報についての画像家族シーン情報を生成し、生成した画像家族シーン情報を、家族シーン情報書込読出部204を用いて、家族シーン情報記憶部233に記憶させる(ステップS1150)。
ステップS1150の処理が終わると、家族シーン情報算出部206は、対象となる画像グループに属する画像の画像特徴情報の中に、未だ選択していない画像特徴情報があるか否かを調べる(ステップS1160)。
ステップS1160の処理において、未選択の画像特徴情報が存在する場合に(ステップS1160:No)、画像データ処理装置100は、再びステップS1110の処理に戻って、ステップS1110以降の処理を続ける。
ステップS1160の処理において、未選択の画像特徴情報が存在しない場合に(ステップS1160:Yes)、画像データ処理装置100は、その画像家族シーン情報生成処理を終了する。
<画像グループ家族シーン情報生成処理>
画像グループ家族シーン情報生成処理は、画像データ処理装置100が、画像グループに属する各画像の画像家族シーン情報に基づいて、その画像グループの画像グループ家族シーン情報を生成する処理である。
図12は、画像データ処理装置100が行う画像グループ家族シーン情報生成処理のフローチャートである。
画像グループ家族シーン情報生成処理は、画像データ処理装置100が画像家族シーン情報生成処理を終了することで開始される。
画像グループ家族シーン情報生成処理が開始されると、家族シーン情報算出部206は、家族シーン情報書込読出部204を用いて、家族シーン情報記憶部233から、画像家族シーン情報生成処理で対象となった画像グループに属する画像の画像家族シーン情報を読み出す(ステップS1200)。
家族シーン情報算出部206は、読み出した画像家族シーン情報のうち、対応顔ID720(図7参照)が家族を示すものについての画像家族シーン特徴量の平均値を画像グループ家族シーン特徴量として算出する(ステップS1210)。すなわち、対応顔ID720が家族を示す画像家族シーン情報について、画像家族シーン特徴量730を構成する各画像家族シーン色比率のそれぞれの平均値を算出することで、それぞれの画像グループ家族シーン色比率の値を算出する。
ここで、対応顔ID720が家族を示す画像家族シーン情報が存在しない場合には、家族シーン情報算出部206は、画像グループ家族シーン特徴量を構成するそれぞれの画像グループ家族シーン色比率の値を、それぞれヌル値とする。
ステップS1210の処理が終わると、家族シーン情報算出部206は、対象となっている画像グループについての画像グループ家族シーン情報を生成し、生成した画像グループ家族シーン情報を、家族シーン情報書込読出部204を用いて、家族シーン情報記憶部233に記憶させ(ステップS1220)、画像データ処理装置100は、その画像グループ家族シーン情報生成処理を終了する。画像グループ家族シーン情報生成の際に、イベント名810(図8参照)は、画像特徴情報生成処理のステップS1000において、イベント名情報受付部211がユーザから受け付けたイベント名が用いられる。
<画像グループ分類処理>
画像グループ分類処理は、画像データ処理装置100が、画像グループを、分類先イベントのいずれかに分類する処理である。
図13は、画像データ処理装置100が行う画像グループ分類処理のフローチャートである。
画像グループ分類処理は、画像データ処理装置100が画像グループ家族シーン情報生成処理を終了することで開始される。
画像グループ分類処理が開始されると、画像グループ分類部208は、家族シーン情報書込読出部204を用いて、家族シーン情報記憶部233から、画像グループ家族シーン情報生成処理で対象となった画像グループに属する画像グループ家族シーン情報を読み出し、イベント特徴情報書込読出部209を用いて、イベント特徴情報記憶部234にから、イベント特徴情報を読み出す(ステップS1300)。
ステップS1300の処理が終わると、画像グループ分類部208は、読み出された画像グループ家族シーン情報と、読み出されたイベント特徴情報とを比較して(ステップS1310)、その画像グループの分類先イベントを算出する(ステップS1320)。すなわち、画像グループ家族シーン情報に含まれる画像グループ家族シーン色比率(図8参照)の中に、イベント特徴情報に含まれる分類条件900(図9参照)に一致するものがあるか否かを調べ、イベント特徴情報に含まれる分類条件900に一致するものを見つけた場合には、その一致する分類条件900に対応する分類先イベント910を、その画像グループが分類されるべき分類先イベントとして算出し、イベント特徴情報に含まれる分類条件900に一致するものを見つけない場合には、その他のイベントという分類先イベントを、その画像グループが分類されるべき分類先イベントとして算出する。
ここで、画像グループ家族シーン情報に含まれる画像グループ家族シーン色比率がヌル値である場合には、その他のイベントという分類先イベントを、その画像グループが分類されるべき分類先イベントとして算出する。
また、一致する分類先イベント910が複数ある場合には、一致する分類先イベント910の全てを、画像グループが分類されるべき分類先イベントとして算出する。
ステップS1320の処理が終了すると、画像グループ分類部208は、画像書込読出部202を用いて、画像記憶部231の分類されるべき分類先イベントに対応する分類先イベントディレクトリの下に、画像グループに対応付けられているイベント名と同一名称のイベントディレクトリを作成して、そのイベントディレクトリの下に、画像グループに属する全ての画像のデータのアドレスを示す情報を保持させて、その画像グループに属する全ての画像のデータがリンクされている状態とすることで、画像グループを分類する(ステップS1330)。
その後、分類結果出力部210は、画像グループ分類部208によって算出された分類されるべき分類先イベントの分類先イベント名を、画像グループに対応付けられたイベント名と共にディスプレイ193に表示させて、画像データ処理装置100は、その画像グループ分類処理を終了する。
<具体例>
以下、具体例を用いて、画像データ処理装置100の特徴について補足説明を行う。
図14は、家族のメンバーが参加する行事で撮影された画像群の一例である。
画像グループ1400は、家族で行ったスキー旅行において撮影された画像群からなる画像グループであって、画像1401と画像1402とから構成され、対応付けられているイベント名が“2010年冬信州旅行”となっている。
画像1401には、スキーを楽しむ息子が含まれ、画像1402には、スキーを楽しむ父が含まれている。これらの画像は、空の青色と雪の白色とが多く含まれているが、人物の周囲には、スキーという行事を象徴する雪の白色が多く含まれているという特徴がある。
画像1401の画像特徴情報は、例えば、図6中の画像ID600が“0001”に対応するものであり、画像1401の画像家族シーン情報は、例えば、図7中の画像ID700が“0001”に対応するものであるとする。
画像1402の画像特徴情報は、例えば、図6中の画像ID600が“0002”に対応するものであり、画像1402の画像家族シーン情報は、例えば、図7中の画像ID700が“0002”に対応するものであるとする。
また、画像グループ1400の画像グループ家族シーン情報は、図8中の画像グループID800が、“001”に対応するものであるとする。
画像グループ1410は、家族で行った海水浴旅行において撮影された画像群からなる画像グループであって、画像1411と画像1412とから構成され、対応付けられているイベント名が“2010年夏沖縄旅行”となっている。
画像1411には、海水浴を楽しむ息子が含まれ、画像1412には、海水浴を楽しむ父と母とが含まれている。これらの画像は、海の青色と砂浜の白色とが多く含まれているが、人物の周囲には、海水浴という行事を象徴する海の青色が多く含まれているという特徴がある。
画像1411の画像特徴情報は、例えば、図6中の画像ID600が“0003”に対応するものであり、画像1411の画像家族シーン情報は、例えば、図7中の画像ID700が“0003”に対応するものであるとする。
画像1412の画像特徴情報は、例えば、図6中の画像ID600が“0004”に対応するものであり、画像1412の画像家族シーン情報は、例えば、図7中の画像ID700が“0004”に対応するものであるとする。
また、画像グループ1410の画像グループ家族シーン情報は、図8中の画像グループID800が、“002”に対応するものであるとする。
画像グループ1400の画像グループ家族シーン特徴量820(図8参照)と、画像グループ1410の画像グループ家族シーン特徴量820とを比較すると、画像グループ家族シーン青比率822と、画像グループ家族シーン白比率824とにおいて、互いに有意な差があるので、例えば、図9に示されるイベント特徴情報を用いることで、画像グループ1400と画像グループ1410とを、互いに異なる分類先イベントに分類する、すなわち、画像グループ1400を“スキー”に分類し、画像グループ1410を“海水浴”に分類することができる。
このように、画像データ処理装置100は、互いに異なる画像グループに属する画像のそれぞれが、画像全体の特徴において互いに類似している場合であっても、画像の特徴を人の周囲の領域である人周囲領域から抽出ことで、これらの画像グループを互いに異なる分類先イベントに分類することができる。
これに対して、画像全体から画像の特徴を抽出する従来の画像データ処理装置が、画像グループ1400と画像グループ1410とを分類対象とする場合について考える。
従来の画像データ処理装置は、画像全体から画像の特徴を抽出するため、画像グループに属する画像の特徴を示す特徴量を画像グループシーン特徴量と呼ぶとすると、画像グループ1400の画像グループシーン特徴量と、画像グループ1410の画像グループシーン特徴量とは、互いに類似したものとなる。
図15は、従来の画像データ処理装置が生成する画像グループシーン情報のデータ構造の一例を示す図である。
同図に示されるように、画像グループシーン情報は、画像グループID1500と、イベント名1510と、画像グループシーン特徴量1520とが対応付けられて構成されている。
また、画像グループシーン特徴量1520は、さらに、画像グループシーン黒比率1521と、画像グループシーン青比率1522と、画像グループシーン緑比率1523と、画像グループシーン白比率1524とが対応付けられて構成されている。
画像グループID1500は画像グループを特定するためのIDである。
ここでは、画像グループID1500が“001”である画像グループは、画像グループ1400であり、画像グループID1500が“002”である画像グループは、画像グループ1410であるとする。
イベント名1510は、画像グループの名称であるイベント名である。
画像グループシーン黒比率1521は、対応する画像グループを構成する画像それぞれにおける、画像全体の画素数に対する、黒と特定された画素の数の比率それぞれについての平均値である。
画像グループシーン青比率1522は、対応する画像グループを構成する画像それぞれにおける、画像全体の画素数に対する、青と特定された画素の数の比率それぞれについての平均値である。
画像グループシーン緑比率1523は、対応する画像グループを構成する画像それぞれにおける、画像全体の画素数に対する、緑と特定された画素の数の比率それぞれについての平均値である。
画像グループシーン白比率1524は、対応する画像グループを構成する画像それぞれにおける、画像全体の画素数に対する、白と特定された画素の数の比率それぞれについての平均値である。
画像グループ1400、すなわち、画像グループID1500が“001”の画像グループシーン特徴量1520と、画像グループ1410、すなわち、画像グループID1500が“002”の画像グループシーン特徴量1520とを比較すると、各画像グループシーン色比率において、互いに有意な差がみられない。
従って、従来の画像データ処理装置では、画像グループ1400と画像グループ1410とを互いに異なる分類先イベントに分類することが難しい。
<人物が含まれる画像についての考察>
図16は、2枚の画像を示す図である。
画像1601は、家族で行ったスキー旅行において撮影された画像であって、スキーを楽しむ息子が含まれている。この画像は、家族で行ったスキー旅行という行事が意識されて撮影された画像であって、雪山を背景に、息子の全身が含まれるように撮影されたものである。
画像1602は、街中で撮影された画像であって、大きな母親の顔が含まれている、母親の顔のアップの画像である。この画像は、母親の顔が意識されて撮影された画像であって、背景には特にこだわりなく撮影されたものである。
一般に、人物を含めた画像を撮影する場合に、撮影者は、その人物に撮影対象としての興味があるときには、その人物の面積が大きくなるように画像を撮影し、その人物の背景に撮影対象としての興味があるときには、その人物の面積が小さくなるように画像を撮影する傾向がある。このことから、顔面積の値が大きい場合には、その人物の背景にはその画像が撮影された行事の特徴が表れにくくなる傾向があり、顔面積の値が小さい場合には、その人物の背景にはその画像が撮影された行事の特徴が現れやすくなる傾向があると考えられる。
本実施の形態において、画像家族シーン特徴量の各画像家族シーン色比率の値のそれぞれは、人周囲特徴量の各色比率の値それぞれを、対応する顔面積の値で除算することで算出されるとしている。これにより、算出される画像家族シーン特徴量は、画像における顔の領域の面積がより小さな画像の方が、その画像の画像家族シーン特徴量の値がより大きな値となるように重み付けされたものになっている。
従って、本実施の形態における、画像家族シーンの算出方法は、前述の、顔面積の値が大きい場合には、その人物の背景にはその画像が撮影された行事の特徴が表れにくくなる傾向があり、顔面積の値が小さい場合には、その人物の背景にはその画像が撮影された行事の特徴が現れやすくなるという傾向を反映していると考えることができる。
<実施の形態2>
以下、本発明に係る画像データ処理装置の一実施形態として、実施の形態1に係る画像データ処理装置100の一部を変形した画像データ処理装置1700について図17を用いて説明する。
この画像データ処理装置1700は、そのハードウエア構成が実施の形態1に係る画像データ処理装置100と同一のものであるが、実行されるプロクラムの一部が実施の形態1に係る画像データ処理装置100と異なっている。
実施の形態1に係る画像データ処理装置100は、画像グループ単位で画像を分類する場合の例であったが、実施の形態2に係る画像データ処理装置1700は、画像単位で画像を分類する場合の例となっている。すなわち、この画像データ処理装置1700は、画像に写る人物の周囲の画素の特徴を示す人周囲特徴量を算出して、算出した人周囲特徴量に基づいて、一つの画像を、互いに異なる分類先イベントのうちのいずれかの分類先イベントに分類する。
以下、本実施の形態2に係る画像データ処理装置1700の構成について、図面を参照しながら、実施の形態1に係る画像データ処理装置100の構成との相違点を中心に説明する。
<構成>
<画像データ処理装置1700のハードウエア構成>
画像データ処理装置1700のハードウエア構成は、実施の形態1に係る画像データ処理装置100の構成と同一のものである。よって、説明を省略する。
<画像データ処理装置1700の機能構成>
図17は、画像データ処理装置1700の主要な機能ブロックの構成を示す機能ブロック図である。
同図に示されるように、画像データ処理装置1700は、実施の形態1に係る画像データ処理装置100から、家族シーン情報書込読出部204と、家族シーン情報算出部206と、イベント名情報受付部211と、家族シーン情報記憶部233とが削除され、画像グループデータ受付部201が画像データ受付部1701に変更され、画像グループ分類部208が画像分類部1708に変更され、画像記憶部231が画像記憶部1731に変更され、イベント特徴情報記憶部234がイベント特徴情報記憶部1734に変更されたものとなっている。
画像データ受付部1701は、実施の形態1に係る画像グループデータ受付部201の機能の一部が変形されたものであって、CPU101がプログラムを実行することで実現され、画像書込読出部202と接続し、ユーザからの、1枚の画像の指定を受け付け、指定された画像を読み込む機能と、画像を読み込む際に、その画像を特定するための画像IDを付与する機能とを有する。
画像データ受付部1701が画像を読み込む場合には、外部記録媒体読取書込装置140経由で外部記録媒体から画像を読み込む場合と、USB制御装置150経由で外部機器から画像を読み込む場合と、通信装置180経由で外部通信機器から画像を読み込む場合とがある。
画像分類部1708は、CPU101がプログラムを実行することで実現され、実施の形態1に係る画像グループ分類部208の機能の一部が変形されたものであって、画像書込読出部202と、画像特徴情報書込読出部203と、イベント特徴情報書込読出部209と、分類結果出力部210とに接続し、画像特徴情報記憶部232に記憶されている画像特徴情報と、イベント特徴情報記憶部234に記憶されているイベント特徴情報とに基づいて、画像を、分類先イベントに分類する機能を有する。
画像分類部1708が行う画像の分類方法の詳細については、後程<画像分類処理>で説明する。
画像記憶部1731は、実施の形態1に係る画像記憶部231から、そのディレクトリ構造の一部が変更されたものであって、画像書込読出部202に接続される。
図18は画像記憶部1731のディレクトリ構造を示すディレクトリ構造図である。
同図に示されているように、画像記憶部1731のディレクトリ構造は、最上位階層1810と、第1ディレクトリ階層1820との合計2階層からなっている。
第1ディレクトリ階層320には、スキーディレクトリ1821、海水浴ディレクトリ1822、ピクニックディレクトリ1823等の複数の分類先イベントディレクトリと、実データ保管ディレクトリ1824とが存在する。
実データ保管ディレクトリ324は、画像データを保持するディレクトリであって、画像のデータはこの実データ保管ディレクトリ324のみに保持される。
分類先イベントディレクトリは、画像の分類先である分類先イベントと同じ名前を持つディレクトリであって、同じ名前のディレクトリは1つしか存在しない。
各分類先イベントディレクトリは、その分類先イベントディレクトリと同じ名称の分類先イベントに分類されている画像データのアドレスを示す情報が保持されることによって、その画像のデータがリンクされている状態となっているディレクトリである。
再び図17に戻って、画像データ処理装置1700の機能構成の説明を続ける。
イベント特徴情報記憶部1734は、実施の形態1に係るイベント特徴情報記憶部234から、その記憶するイベント特徴情報の一部が変更されたものであって、イベント特徴情報書込読出部209に接続される。
図19は、イベント特徴情報記憶部1734に記憶されているイベント特徴情報のデータ構造の一例を示す図である。
同図に示されるように、イベント特徴情報は、画像グループ家族シーン黒比率0.5以上1901、画像グループ家族シーン青比率0.5以上1902、画像グループ家族シーン比率緑0.5以上1903、画像グループ家族シーン比率白0.5以上1904等といった分類条件1900のそれぞれを、花火1911、海水浴1912、ピクニック1913、スキー1914等といった分類先イベント1910のそれぞれに対応付けているものである。
以上のように構成される画像データ処理装置1700の行う動作について、以下、図面を用いて説明する。
<動作>
画像データ処理装置1700の行う特徴的な動作に、変形画像特徴情報生成処理と、画像分類処理とがある。
以下、それぞれの処理について、図面を用いて説明する。
<変形画像特徴情報生成処理>
画像特徴情報生成処理は、画像データ処理装置1700が、画像を読み込み、読み込んだ画像に対して、画像特徴情報を生成する処理である。
図20は、画像データ処理装置1700の行う変形画像特徴情報生成処理のフローチャートである。
変形画像特徴情報生成処理は、リモコン197が、ユーザから変形画像特徴情報生成処理を開始する旨の操作を受け付けることで開始される。
変形画像特徴情報生成処理が開始されると、画像データ受付部1701は、画像の読み込みを開始する(ステップS2000)。
画像データ受付部1701は、外部記録媒体読取書込装置140に装着された外部記録媒体から、又は、USB制御装置150に接続されたUSBケーブル195を介して外部機器から、又は、ネットワーク194に接続された通信装置180から、画像を読み込むことができる。
ここでは、例えば、外部記憶媒体としてのSDメモリカード191に記録されている画像を、外部記録媒体読取書込装置140から読み込むものとする。
画像データ受付部1701は、SDメモリカード191に記録されている画像を読み込んで、読み込んだ画像に対して、ユニークな画像IDを付与し、画像データと画像IDとを対応付けて、画像書込読出部202を用いて、画像記憶部1731の実データ保管ディレクトリ1824に書き込む。
画像が画像記憶部1731に書き込まれると、顔抽出部205は、画像書込読出部202を用いて、画像記憶部231から、画像グループデータ受付部201によって受け付けられた画像を読み出し、読み出した画像をJPEG方式で復号する。
顔抽出部205は、読み出された画像について、保持する顔のモデルを参照することで、1枚の画像に含まれる顔の認識を試みる(ステップS2010)。
顔抽出部205は、顔を認識した場合に(ステップS2010:Yes)、認識した顔のそれぞれについて、顔特徴量を算出する(ステップS2020)。すなわち、認識した顔の領域の面積と、認識した顔の位置とを算出し、認識した顔それぞれに、その認識した顔を特定するための顔IDを、シーケンシャルに付与し、その認識した顔の特徴と、サンプル画像記憶部236に記憶されているサンプル画像に含まれる顔の特徴とを抽出し、サンプル画像記憶部236に記憶されているサンプル画像の中に、その認識した顔の特徴と同じ顔の特徴を持つ画像があるとき、その認識した顔の対応顔IDに、そのサンプル画像に対応する対応顔IDを付与する。もし、サンプル画像記憶部236に記憶されているサンプル画像の中に、その認識した顔の特徴と同じ顔の特徴を持つ画像がなければ、その認識した顔の対応顔IDに、他人である旨を意味する“99”を付与する。
ステップS2020の処理が終わると、顔抽出部205は、認識した顔のそれぞれについて、認識した顔の領域の下方に体の領域を算出し、算出した体の領域のそれぞれについて、体特徴量を算出する(ステップS2030)。すなわち、算出した体の領域の面積と、算出した体の領域の位置とを算出し、算出した体の領域のそれぞれに、その算出した体の領域を特定するための体IDを、シーケンシャルに付与する。
ステップS2030の処理が終わると、人周囲特徴量抽出部207は、顔の領域に基づいて顔周囲領域を算出し、体の領域に基づいて体周囲領域を算出し、算出した顔周囲領域と算出した体周囲領域とから人周囲領域を算出する(ステップS2040)。
さらに、人周囲特徴量抽出部207は、人周囲領域に含まれる画素の画素値に基づいて、人周囲特徴量を算出する(ステップS2050)。すなわち、人周囲領域に含まれる各画素について、その画素を構成する色成分であるR、G、Bの各輝度から、その画素の色を特定し、特定された色のそれぞれについて、人周囲領域に含まれる全画素数に対するその色に特定された画素数の比率をその色の色比率として算出する。
ステップS2010の処理において、顔抽出部205が顔を認識なかった場合には(ステップS2010:No)、顔抽出部205は、顔特徴量の各構成要素の値としてヌル値を設定し、体特徴量の各構成要素の値としてヌル値を設定し、人周囲特徴量抽出部207は、顔周囲領域の値としてヌル値を設定し、体周囲領域の値としてヌル値を設定し、人周囲特徴量の各構成要素の値としてヌル値を設定する(ステップS2060)。
ステップS2050の処理が終わった場合、又はステップS2060の処理が終わった場合に、人周囲特徴量抽出部207は、対象となっている画像についての画像特徴情報を生成し、生成した画像特徴情報を、画像特徴情報書込読出部203を用いて、画像特徴情報記憶部1732に記憶させて(ステップS2070)、画像データ処理装置1700は、その変形画像特徴情報生成処理を終了する。
<画像分類処理>
画像分類処理は、画像データ処理装置1700が、画像を、分類先イベントのいずれかに分類する処理である。
図21は、画像データ処理装置1700が行う画像分類処理のフローチャートである。
画像グループ分類処理は、画像データ処理装置1700が変形画像特徴情報生成処理を終了することで開始される。
画像分類処理が開始されると、画像分類部1708は、画像特徴情報書込読出部203を用いて、画像特徴情報記憶部232から、変形画像特徴情報生成処理で対象となった画像の画像特徴情報を読み出し、イベント特徴情報書込読出部209を用いて、イベント特徴情報記憶部1734にから、イベント特徴情報を読み出す(ステップS2100)。
ステップS2100の処理が終わると、画像分類部1708は、読み出された画像特徴情報と、読み出されたイベント特徴情報とを比較して(ステップS2110)、その画像の分類先イベントを算出する(ステップS2120)。すなわち、画像特徴情報に含まれる色比率(図6参照)の中に、イベント特徴情報に含まれる分類条件1900(図19参照)に一致するものがあるか否かを調べ、イベント特徴情報に含まれる分類条件1900に一致するものを見つけた場合には、その一致する分類条件1900に対応する分類先イベント1910を、その画像が分類されるべき分類先イベントとして算出し、イベント特徴情報に含まれる分類条件1900に一致するものを見つけない場合には、その他のイベントという分類先イベントを、その画像グループが分類されるべき分類先イベントとして算出する。
ここで、画像特徴情報に含まれる色比率がヌル値である場合には、その他のイベントという分類先イベントを、その画像が分類されるべき分類先イベントとして算出する。
また、一致する分類先イベント1910が複数ある場合には、一致する分類先イベント1910の全てを、画像が分類されるべき分類先イベントとして算出する。
ステップS2120の処理が終了すると、画像分類部1708は、画像書込読出部202を用いて、画像記憶部1731の分類されるべき分類先イベントに対応する分類先イベントディレクトリの下に、対象である画像のデータのアドレスを示す情報を保持させて、その画像のデータがリンクされている状態とすることで、画像を分類する(ステップS2130)。
その後、分類結果出力部210は、画像グループ分類部208によって算出された分類されるべき分類先イベントの分類先イベント名を、画像グループに対応付けられたイベント名と共にディスプレイ193に表示させて、画像データ処理装置100は、その画像グループ分類処理を終了する。
<補足>
以上、本発明に係る画像データ処理装置の一実施形態として、実施の形態1、実施の形態2において、画像の分類を行う画像データ処理装置の例について説明したが、以下のように変形することも可能であり、本発明は上述した実施の形態で示した通りの画像データ処理装置に限られないことはもちろんである。
(1)実施の形態1において、画像データ処理装置100が記憶する画像として、JPEG方式で符号化されたデータとしたが、デジタル写真をデータとして記憶することができるものであれば、JPEG方式以外の符号化方式、例えば、PNG(Portable Network Graphics)方式やGIF(Graphics Interchange Format)方式等で符号化されたものであっても構わないし、符号化されないビットマップ方式のデータであっても構わない。
また、コンテンツとしてデジタル写真を例として示したが、デジタルデータとして記憶することができる画像であれば、例えば、スキャナで読み取った絵画のデータ等であっても構わない。
(2)実施の形態1において、CPU101と、ROM102と、RAM103と、ハードディスク装置インターフェース104と、外部記録媒体読取書込装置インターフェース105と、USB制御装置インターフェース106と、出力装置インターフェース107と、入力装置インターフェース108と、通信装置インターフェース109と、デコーダ111と、バスライン120とが、システムLSI110に集積されているとしたが、システムLSI110と同じ機能を実現することができれば、必ずしも1つのLSIに統合されている必要はなく、例えば、複数の集積回路等で実現されていても構わない。
(3)実施の形態1において、デコーダ111は、DSPであるとしたが、符号化されたデータを復号する機能があれば、必ずしもDSPである必要はなく、例えば、CPU101が兼用する構成であっても構わないし、CPU101とは異なるCPUであっても構わないし、ASIC等で構成される専用回路であっても構わない。
(4)実施の形態1において、入力装置170は、リモコン197から無線で送信されるユーザからの操作コマンドを受け付ける機能を有する構成であるとしたが、ユーザからの操作コマンドを受け付ける機能があれば、必ずしもリモコン197から無線で送信される操作コマンドを受け付ける機能を有する構成でなくても、例えば、キーボードとマウスとを備え、キーボードとマウスとを介してユーザからの操作コマンドを受け付ける機能を有する構成であっても構わないし、ボタン群を備え、ボタン群を介してユーザからの操作コマンドを受け付ける機能を有する構成等であっても構わない。
(5)実施の形態1において、画像グループデータ受付部201が、ユーザからの、2枚以上の画像の指定を受け付け、指定された画像群を、1つの画像グループに含まれる画像群とするとしたが、画像と画像グループとの対応付けを取ることができれば、例えば、画像グループデータ受付部201は、画像データと、画像グループに属する画像のリストとを受け取り、受け取ったリストに基づいて、画像と画像グループとを対応付けるといった構成であっても構わない。
(6)実施の形態1において、画像グループデータ受付部201は、読み込んだ画像に対して、シーケンシャルに画像IDを付与するとしたが、重複を避けて付与することができれば、必ずしもシーケンシャルに画像IDを付与しなくても構わない。
(7)実施の形態1において、顔のモデルは、例えば、目、鼻、口等の顔を形成するパーツの輝度や、相対的な位置関係に関する情報等であるとしたが、顔を認識することができる情報であれば、これら以外、例えば、ガボールフィルタを用いて算出された特徴量を用いるものであっても構わないし、目の色や、ほくろの位置、肌の色等といった顔の特徴を示すものであっても構わないし、複数の顔の特徴を表すものの組み合わせであっても構わない。
(8)実施の形態1において、人周囲特徴量抽出部207が特定する主要色として、黒、青、緑、白を例示したが、これらの色に限られる必要はなく、例えば、赤、黄等であっても構わない。また、色空間としてRGBやL*a*b等を用いても良い。
(9)実施の形態1において、人周囲特徴量は、画像に含まれる色に基づいたもので構成されているとしたが、画像の特徴を示すものであれば、必ずしも、画像に含まれる色に基づいたもので構成されている必要はなく、例えば、輝度やテクスチャ特徴に基づいたもので構成されていても構わないし、写る物体に基づいたものであっても構わない。
(10)実施の形態1において、人周囲特徴量抽出部207は、人周囲特徴量を、人周囲領域に含まれる各画素に基づいて算出する場合の例について説明したが、顔の領域の周囲の一定領域に含まれる画素の画素値の方が、顔の領域の周囲の一定領域に含まれない画素の画素値よりも、人周囲特徴量へ大きく反映されるように、人周囲特徴量の算出を行うことができれば、必ずしも、人周囲特徴量を、人周囲領域に含まれる各画素に基づいて算出する場合に限られない。
例として、人周囲特徴量抽出部207は、画像に含まれる全ての画素について、顔の領域からの距離に応じて、顔の領域からの距離が短いほど、より大きな重み付けがされるように、重み付けがされた画素値に基づいて算出する場合等が考えられる。
(11)実施の形態1において、人周囲領域は、顔周囲領域と体周囲領域との少なくとも一方に含まれる領域から顔の領域と体の領域とを除外した領域であるとしたが、顔の領域の周囲の一定領域であれば、必ずしも、顔周囲領域と体周囲領域との少なくとも一方に含まれる領域から顔の領域と体の領域とを除外した領域である必要はなく、例えば、顔周囲領域から顔の領域を除外した領域であるとしても構わないし、体領域そのものであるとしても構わないし、体周囲領域から顔領域を除外した領域と体領域とからなる領域であるとしても構わない。
また、人周囲領域の形状も、矩形に限定される必要はなく、例えば、六角形や円であっても構わない。
(12)実施の形態1において、顔周囲領域は、顔の領域に対して、画像における水平方向の左右のそれぞれに、顔の領域の、画像における水平方向の幅を加え、画像における垂直方向の上方に、顔の領域の、画像における垂直方向の幅を加えた矩形の領域であるとしたが、顔の領域の周囲の一定領域であれば、必ずしも、顔の領域に対して、画像における水平方向の左右のそれぞれに、顔の領域の、画像における水平方向の幅を加え、画像における垂直方向の上方に、顔の領域の、画像における垂直方向の幅を加えた矩形の領域に限定される必要はなく、例えば、顔の領域に対して、画像における水平方向の左右のそれぞれに、顔の領域の、画像における水平方向の幅の半分を加え、画像における垂直方向の上下のそれぞれに、顔の領域の、画像における垂直方向の幅の半分を加えた矩形の領域等であっても構わないし、さらには、矩形以外の形状の領域であっても構わない。
(13)実施の形態1において、認識した顔の領域は、認識した顔を含む、画像における水平方向の辺と画像における垂直方向の辺とを有する矩形のうち、面積が最小となる矩形の領域である場合の例について説明したが、認識した顔を含む領域であれば、必ずしも、画像における水平方向の辺と画像における垂直方向の辺とを有する矩形のうち、面積が最小となる矩形の領域に限定される必要はなく、例えば、顔の輪郭にそった曲線で囲まれた領域であっても構わない。
(14)実施の形態1において、体の領域は、認識した顔の領域の下方の、顔の領域の画像における水平方向の幅を1.5倍し、顔の領域の画像における垂直方向の幅を2倍した矩形の領域であるとしたが、体があると推定される領域であれば、必ずしも、認識した顔の領域の下方の、顔の領域の画像における水平方向の幅を1.5倍し、顔の領域の画像における垂直方向の幅を2倍した矩形の領域に限定される必要はなく、例えば、認識した顔の領域の下方の、顔の領域の画像における水平方向の幅を2倍し、顔の領域の画像における垂直方向の幅を1.5倍した矩形の領域であっても構わないし、さらには、画像認識処理により体を検出して、その認識された体によって示される領域であるとしても構わないし、さらには、矩形以外の形状の領域であっても構わない。
(15)実施の形態1において、体周囲領域は、体の領域に対して、画像における水平方向の左右のそれぞれに、顔の領域の、画像における水平方向の幅を加え、画像における垂直方向の上下のそれぞれに、顔の領域の、画像における垂直方向の幅の半分の幅を加えた矩形の領域であるとしたが、体の領域の周囲の一定領域であれば、必ずしも、体の領域に対して、画像における水平方向の左右のそれぞれに、顔の領域の、画像における水平方向の幅を加え、画像における垂直方向の上下のそれぞれに、顔の領域の、画像における垂直方向の幅の半分の幅を加えた矩形の領域に限定される必要はなく、例えば、体の領域に対して、画像における水平方向の左右のそれぞれに、体の領域の、画像における水平方向の幅の半分の幅を加え、画像における垂直方向の上下のそれぞれに、体の領域の、画像における垂直方向の幅を加えた矩形の領域であるとしても構わないし、さらには、矩形以外の形状の領域であっても構わない。
(16)実施の形態1において、画像家族シーン特徴量は、人周囲特徴量の各色比率の値を、顔面積の値で除算することで算出されるとしたが、画像における人物の面積の大きさがより小さな画像の方が、その画像の画像家族シーン特徴量の値がより大きな値となるように重み付けされることとなれば、必ずしも、人周囲特徴量の各色比率の値を、顔面積の値で除算することで算出される必要はなく、例えば、人周囲特徴量の各色比率の値を、顔面積の値と体面積の値との和で除算することで算出されるとしても構わない。
(17)実施の形態1において、画像グループ家族シーン特徴量は、家族の顔として認識された顔を含む画像に対応する画像家族シーン特徴量の平均値であるとしたが、認識された顔を含まない画像の画像家族シーン特徴量を含めないで算出されるものであれば、必ずしも、家族の顔として認識された顔を含む画像に対応する画像家族シーン特徴量の平均値である必要はなく、例えば、認識された顔を含む全ての画像の画像家族シーン特徴量の平均値であっても構わないし、特定の人物を示す認識された顔を含む画像の画像家族シーン特徴量の平均値であっても構わない。
さらには、画像グループ家族シーン特徴量は、対応する画像群における画像家族シーン特徴量の平均値でなく、画像に含まれる認識された顔に応じて重み付けされたものとして算出されるとしても構わない。例えば、認識された顔の特徴と同じ顔の特徴を持つ顔が、画像記憶部231により多く記憶されているものほど、より大きく重み付けられて算出される場合、予め定められた特定人物が含まれる画像が、より大きく重み付けされて算出される場合等が考えられる。
(18)実施の形態1において、画像グループ分類部208は、画像グループ家族シーン情報とイベント特徴情報とに基づいて画像グループを分類するとしたが、少なくとも画像グループ家族情報に基づいて画像グループを分類すれば、必ずしも、イベント特徴情報に基づいて画像グループを分類する必要はなく、例えば、画像グループ家族シーン情報を教師として学習し、その学習結果に基づいて、画像グループを分類しても構わない。学習方法は、例えば、ロジスティック回帰分析法、SVM(Support Vector Machine)法等の学習モデルを用いて行う手法によって実現できる。
(19)実施の形態1において、認識された顔に対応する対応顔IDが家族を示す場合にその認識された顔の人物が家族であるとしたが、認識された顔が家族であると類推される場合にその認識された顔の人物が家族であるとすれば、必ずしも、認識された顔に対応する対応顔IDが家族を示す場合にその認識された顔の人物が家族であるとする必要はなく、例えば、その認識された顔の特徴と同じ顔の特徴を持つ顔を含む画像が、画像記憶部231に所定の枚数(例えば10枚)以上含まれている場合に、その認識された顔の人物が家族であるとしても構わない。
(20)実施の形態1において、人周囲特徴量抽出部207は、一枚の画像に認識された顔が複数含まれている場合に、1つの人周囲領域を算出するとしたが、少なくとも1つの人周囲領域を算出すれば、必ずしも算出する人周囲領域は1つに限定される必要はない。
一例として、認識された顔それぞれについて、人周囲領域をそれぞれ算出して、人周囲領域のそれぞれについて、人周囲特徴量を算出する場合等が考えられる。
また、一枚の画像について、複数の人周囲特徴量が算出される場合には、その画像の画像家族シーン特徴量の算出の方法についても、様々な方法が考えられる。
例えば、人周囲特徴量それぞれについて、その人物に対応する画像家族シーン特徴量(以下、「人周囲画像家族シーン特徴量」と呼ぶ。)を算出し、算出したそれら人周囲画像家族シーン特徴量の平均値を、その画像の画像家族シーン特徴量とする方法、特定の顔IDで示される人物の人周囲情報のみから、画像家族シーン特徴量を算出する方法、特定の位置(例えば画面中央、画面右端等)の人物の人周囲情報から、画像家族シーン特徴量を算出する方法、予め定められた優先順位に従って、それぞれの人周囲画像家族シーン特徴量に重み付けをして、画像家族シーン特徴量を算出する方法等が考えられる。
(21)実施の形態1において、サンプル画像記憶部236は、特定の人物を含む画像の画像データを記憶するとしているが、顔抽出部205が、特定の人物の顔の特徴を抽出することができるものを記憶していれば、必ずしも、特定の人物を含む画像を記憶する必要はなく、例えば、特定の人物の顔の特徴そのものを記憶するとしても構わない。
(22)実施の形態1において、画像グループ分類部208は、分類されるべき分類先イベントを決定すると、分類されるべき分類先イベントに対応するイベントディレクトリの下に、画像グループに対応付けられているイベント名と同一名称のイベントディレクトリを作成して、そのイベントディレクトリの下に、画像グループに属する全ての画像のデータのリンクを張ることで、画像グループを分類するとしたが、画像グループに属する画像が同じ分類先イベントに対応付けられていれば、必ずしもリンクを張ることで画像グループを分類するとする必要はなく、例えば、画像グループに属する画像に、分類先イベントを特定するためのタグを付与するとしても構わない。
(23)実施の形態1において、画像データ処理装置100は、画像グループの分類を、画像グループ家族シーン情報とイベント特徴情報とに基づいて行うとしたが、少なくとも、画像グループ家族シーン情報とイベント特徴情報とに基づいて行うことができれば、必ずしも、画像グループ家族シーン情報とイベント特徴情報とだけに基づいて行う必要はない。
一例として、画像データ処理装置100は、さらに、画像全体の特長量に基づいて、画像グループに属する画像の特長を示す画像グループシーン特徴情報を算出する機能を有し、この画像グループシーン特徴情報と画像グループ家族シーン情報とイベント特徴情報に基づいて、画像グループを分類する場合等が考えられる。ここで、例えば、画像データ処理装置100は、画像グループシーン特徴情報とイベント特徴情報とに基づいて、1段階目の分類を行った後、さらに、画像グループ家族シーン情報とイベント特徴情報とに基づいて、より詳細に2段階目の分類を行うとしても良い。
(24)実施の形態1において、画像グループ分類部208は、一致する分類先イベント910が複数ある場合には、一致する分類先イベント910の全てを、画像グループが分類されるべき分類先イベントとして算出するとしたが、画像グループが分類されるべき分類先イベントを少なくとも1つ算出することができれば、必ずしも、一致する分類先イベント910の全てを、画像グループが分類されるべき分類先イベントとして算出する必要はない。
画像グループが分類されるべき分類先イベントを算出する方法の一例として、画像グループ分類部208が、分類条件900に一致する画像グループ家族シーン色比率のうち、最も値の大きい画像グループ家族シーン色比率と一致する分類条件に対応する分類先イベントを、画像グループが分類されるべき分類先イベントとして算出する方法等が考えられる。
(25)さらに、上記の実施の形態で説明した手法をネットワークサービスとして提供するサーバ装置とすることも可能である。この場合、画像データ処理装置を、ネットワークサービスを提供するサーバ装置とする。そして、このサーバ装置が、コンテンツが蓄積されたAV機器、パーソナルコンピュータ、デジタルカメラなどからネットワークを介してコンテンツを受信すると、受信したコンテンツに対して上記の実施の形態で説明した手法による画像データ処理を行い、その処理結果を、ネットワークを介してAV機器、パーソナルコンピュータ、デジタルカメラなどに送信するようにすればよい。なお、処理結果の送信先は、コンテンツを受信した機器に対してであってもそれ以外の機器に対してであってもよい。具体的には、コンテンツを受信した機器のユーザが所有する他の機器、コンテンツを受信した機器のユーザの家族や友人が所有する機器、SNSや画像共有サービスなどのネットワークサービスを提供するサーバ装置などが挙げられる。また、処理結果を送信する代わりに、あるいは処理結果を送信することに加えて、処理結果を、上記の実施の形態で説明した手法をネットワークサービスとして提供するサーバ装置自身に保存することとしてもよい。
(26)実施の形態1、実施の形態2で示した、画像グループ分類動作等を画像データ処理装置のCPU、及びそのCPUに接続された各種回路に実行させるためのプログラムコードからなる制御プログラムを、記録媒体に記録すること、又は各種通信路等を介して流通させ頒布することもできる。このような記録媒体には、ICカード、ハードディスク、光ディスク、フレキシブルディスク、ROM等がある。流通、頒布された制御プログラムはCPUに読み出され得るメモリ等に格納されることにより利用に供され、そのCPUがその制御プログラムを実行することにより各実施形態で示したような各種機能が実現されるようになる。なお、制御プログラムの一部を画像分類装置とは別個のプログラム実行可能な装置(CPU)に各種通信路等を介して送信して、その別個のプログラム実行可能な装置においてその制御プログラムの一部を実行させることとしてもよい。
(27)以下、さらに本発明の一実施形態に係る画像データ処理装置の構成及びその変形例と各効果について説明する。
(a)本発明の一実施形態に係る画像分類装置は、画像を分類するための画像特徴情報を算出する画像データ処理装置であって、一画像に含まれる顔の領域を特定する顔特定部と、一画像の少なくとも一部の画素に基づいて算出される画像特徴量から、当該画像における画像特徴情報を算出する画像特徴算出部とを備え、前記画像特徴算出部は、前記顔特定部によって特定された顔の領域の周囲の一定領域に含まれる画素に基づいて算出される画像特徴量の方が、当該一定領域に含まれない画素に基づいて算出される画像特徴量よりも、前記画像特徴情報へ大きく反映されるように、前記画像特徴情報の算出を行うことを特徴とする。
一般に、画像の撮影者は、ある行事において人の顔を含めた画像を撮影する場合に、その行事の特徴が、その人の顔の周囲の領域に現れるように撮影する傾向がある。例えば、海水浴において、撮影者は、人の顔の周囲の領域に海の青色が多くなるように画像が撮影する傾向があり、スキー旅行においては、人の顔の周囲の領域に雪の白色が多くなるように画像が撮影する傾向がある。
上述の構成を備える本実施の形態に係る画像データ処理装置は、行事の特長が現れやすい傾向のある人の顔の周囲の領域の画素に基づいて算出される画像特徴量の方を、行事の特長が表れにくい傾向のある人の顔から離れた領域の画素に基づいて算出される画像特徴量よりも重視して画像特徴情報を抽出する。これにより、この画像データ処理装置は、従来の画像データ処理装置よりも、行事の特長がより反映された画像特徴情報を算出し得ることとなる。
従って、この画像データ処理装置は、この画像データ処理装置から算出される画像特徴情報を用いて画像を分類する場合における分類精度を、従来よりも向上させ得ることができるようになる。
図22は、上記変形例における画像データ処理装置2200の機能構成を示す機能ブロック図である。
この画像データ処理装置2200は、画像を分類するための画像特徴情報を算出するためのものであって、図22に示されるように、顔特定部2201と画像特徴算出部2202とから構成される。
顔特定部2201は、画像特徴算出部2202に接続され、一画像に含まれる顔の領域を特定する機能を有する。一例として、実施の形態1における顔抽出部205として実現される。
画像特徴算出部2202は、顔特定部2201に接続され、一画像の少なくとも一部の画素に基づいて算出される画像特徴量から、当該画像における画像特徴情報を算出する機能を有する。そして、この画像特徴算出部2202は、顔特定部2201によって特定された顔の領域の周囲の一定領域に含まれる画素に基づいて算出される画像特徴量の方が、当該一定領域に含まれない画素に基づいて算出される画像特徴量よりも、前記画像特徴情報へ大きく反映されるように、前記画像特徴情報の算出を行うという特徴を有している。一例として、実施の形態1における人周囲特徴量抽出部207として実現される。
(b)また、前記画像特徴算出部は、前記画像特徴情報の算出を、前記顔特定部によって特定された顔の領域に含まれる画素と前記一定領域に含まれない画素と以外の画素に基づいて算出された画像特徴量から行うとしてもよい。
このような構成にすることによって、顔の領域に含まれる画素に基づいて算出される画像特徴量と、一定領域に含まれない画素に基づいて算出される画像特徴量とが、画像特徴情報に反映されないようにすることができる。
(c)また、前記顔特定部は、顔を含む、画像における水平方向の辺と画像における垂直方向の辺とを有する矩形の領域を、前記顔の領域として特定し、前記画像特徴算出部は、前記顔特定部によって特定された顔の領域に対して、少なくとも、画像における上方向と画像における右方向と画像における左方向とのそれぞれの方向に、それぞれ所定のアルゴリズムで定められる幅だけ拡大された矩形の拡張顔領域を、前記一定領域として、前記画像特徴情報の算出を行うとしてもよい。
このような構成にすることによって、顔の領域の特定を、矩形において対角となる2つの角の座標を用いて特定することができるようになり、また、顔の周囲の一定領域を、矩形において対角となる2つの角の座標を用いて特定することができるようになる。
(d)また、本発明の一実施形態に係る画像分類装置は、画像を分類するための画像特徴情報を算出する画像データ処理装置であって、一画像に含まれる顔の領域を特定する顔特定部と、一画像の少なくとも一部の画素に基づいて算出される画像特徴量から、当該画像における画像特徴情報を算出する画像特徴算出部と、前記顔特定部によって特定された顔の領域の下方に、当該顔の領域に対して所定のアルゴリズムで定められる領域を体領域として特定する体特定部とを備え、前記画像特徴算出部は、前記体特定部によって特定された体領域に含まれる画素に基づいて算出される画像特徴量の方が、当該体領域に含まれない画素に基づいて算出される画像特徴量よりも、前記画像特徴情報へ大きく反映されるように、前記画像特徴情報の算出を行うことを特徴とする。
一般に、画像の撮影者は、ある行事において人の顔を含めた画像を撮影する場合に、その行事の特徴が、その人の体の周囲の領域に現れるように撮影する傾向がある。例えば、海水浴において、撮影者は、人の体の周囲の領域に海の青色が多くなるように画像が撮影する傾向があり、スキー旅行においては、人の体の周囲の領域に雪の白色が多くなるように画像が撮影する傾向がある。
上述の構成を備える本実施の形態に係る画像データ処理装置は、行事の特長が現れやすい傾向のある人の体の周囲の領域の画素に基づいて算出される画像特徴量の方を、行事の特長が表れにくい傾向のある人の体から離れた領域の画素に基づいて算出される画像特徴量よりも重視して画像特徴情報を抽出する。これにより、この画像データ処理装置は、従来の画像データ処理装置よりも、行事の特長がより反映された画像特徴情報を算出し得ることとなる。
従って、この画像データ処理装置は、この画像データ処理装置から算出される画像特徴情報を用いて画像を分類する場合における分類精度を、従来よりも向上させ得ることができるようになる。
図23は、上記変形例における画像データ処理装置2300の機能構成を示すブロック図である。
この画像データ処理装置2300は、画像を分類するための画像特徴情報を算出するためのものであって、図23に示されるように、顔特定部2301と体特定部2302と画像特徴算出部2303とから構成される。
顔特定部2301は、体特定部2302に接続され、一画像に含まれる顔の領域を特定する機能を有する。一例として、実施の形態1における顔抽出部205のうちの、機能1と機能2とを実現する部分として実現される。
体特定部2302は、顔特定部2301と画像特徴算出部2303とに接続され、顔特定部2301によって特定された顔の領域の下方に、当該顔の領域に対して所定のアルゴリズムで定められる領域を体領域として特定する機能を有する。一例として、実施の形態1における顔抽出部205のうちの、機能3を実現する部分として実現される。
画像特徴算出部2303は、体特定部2302に接続され、一画像の少なくとも一部の画素に基づいて算出される画像特徴量から、当該画像における画像特徴情報を算出する機能を有する。そして、この画像特徴算出部2303は、体特定部2302によって特定された体領域に含まれる画素に基づいて算出される画像特徴量の方が、当該体領域に含まれない画素に基づいて算出される画像特徴量よりも、前記画像特徴情報へ大きく反映されるように、前記画像特徴情報の算出を行うという特徴を有している。一例として、実施の形態1における人周囲特徴量抽出部207のうちの、機能4と機能5とを実現する部分として実現される。
(e)また、前記画像特徴算出部は、前記画像特徴情報の算出を、前記顔特定部によって特定された前記体領域にのみ含まれる画素に基づいて算出された画像特徴量から行うとしてもよい。
このような構成にすることによって、体領域に含まれる画素以外の画素を、画像特徴量に反映させないようにすることができる。
(f)また、前記画像特徴算出部は、前記体特定部によって特定された体領域に対して、少なくとも、画像における上方向と画像における右方向と画像における左方向とのそれぞれの方向に、それぞれ所定のアルゴリズムで定められる幅だけ拡大された領域から、前記顔特定部によって特定された顔の領域が除外された拡張体領域を、前記体領域に含ませて、前記画像特徴情報の算出を行うとしてもよい。
このような構成にすることによって、体領域に、その体領域に対応する人物の体の周囲の領域を含めることができるようになる。
(g)また、前記画像特徴算出部は、前記顔特定部が1つの画像に対して第1の顔の領域と第2の顔の領域とを特定した場合に、前記画像特徴情報の算出を、当該第1の顔の領域に対応する前記一定領域と当該第2の顔の領域に対応する前記一定領域との少なくとも一方に含まれない画素と、当該第1の顔の領域に含まれる画素と、当該第2の顔の領域に含まれる画素と以外の画素の画素値から行うとしてもよい。
このような構成にすることによって、1つの画像に第1の顔の領域と第2の顔の領域とが含まれる場合に、第1の顔の領域に含まれる画素の画素値と第2の顔の領域に含まれる画素の画素値との双方の画素値が、画像特徴情報に反映されないようにすることができる。
(h)また、前記画像特徴算出部は、前記体特定部が1つの画像に対して第1の体領域と第2の体領域とを特定した場合に、前記画像特徴情報の算出を、当該第1の体領域と当該第2の体領域に含まれる画素に基づいて算出される画像特徴量から行うとしてもよい。
このような構成にすることによって、1つの画像に第1の体領域と第2の体領域とが含まれる場合に、第1の体領域に含まれる画素の画素値と第2の体領域に含まれる画素の画素値との双方の画素値を、画像特徴情報に反映させることができる。
(i)また、一画像グループに属する画像の一部又は全部の2枚以上の画像についての、画像特徴算出部によって算出された画像特徴情報に基づいて、当該画像グループを分類するための画像グループ特徴情報を算出する画像グループ特徴算出部とを備え、前記顔特定部は、さらに、画像の面積に対する、特定する顔の領域の面積の比率である面積率を示す顔面積情報を算出し、前記画像グループ特徴算出部は、前記顔特定部によって顔面積情報を算出された第1の画像と、前記顔特定部によって、当該第1の画像の顔面積情報によって示される顔の領域の面積率よりも大きい面積率を示す顔面積情報を算出された第2の画像とについて、当該第1の画像の画像特徴情報の方が、当該第2の画像の画像特徴情報よりも、前記画像グループ特徴情報へ大きく反映されるように、前記画像特徴情報の算出を行うとしてもよい。
このような構成にすることによって、画像を画像グループ単位で分類するための画像グループ特徴情報を、画像に含まれる顔の領域の面積がより小さい画像の画像特徴情報程、より大きく反映されたものとなるように、算出することができるようになる。
(j)また、画像グループを、複数の分類先カテゴリのうちのいずれかに分類する画像グループ分類部を備え、前記画像グループ分類部は、前記画像グループ特徴情報によって画像グループ特徴情報を算出された画像グループに対して、前記画像グループの分類を、前記複数の分類先カテゴリそれぞれにおける、画像グループ特徴情報の示す特徴の範囲を示す基準情報と、前記画像グループ特徴算出部によって算出された画像グループ特徴情報とに基づいて行うとしてもよい。
このような構成にすることによって、画像を画像グループ単位で分類することができるようになる。
(k)また、前記画像特徴算出部は、算出する画像特徴情報に、画像に含まれる色に係る情報を含ませ、前記画像グループ特徴算出部は、算出する画像グループ特徴情報に、画像グループに属する画像に含まれる色に係る情報を含ませ、前基準情報は、前記複数の分類先カテゴリそれぞれにおける、画像グループ特徴情報の示す色の特徴の範囲を示す色基準情報を含み、前記画像グループ分類部は、前記画像グループ特徴情報によって画像グループ特徴情報を算出された画像グループに対して行う前記画像グループの分類を、前記基準情報に含まれる色基準情報と、前記画像グループ特徴算出部によって算出された画像グループ特徴情報に含まれる前記色に係る情報とに基づいて行うとしてもよい。
このような構成にすることによって、色に係る情報に基づいて、画像を画像グループ単位で分類することができるようになる。
本発明に係る画像データ処理装置は、複数のデジタル画像を記憶する機能を有する機器に広く適用することができる。
100 画像データ処理装置
201 画像グループデータ受付部
202 画像書込読出部
203 画像特徴情報書込読出部
204 家族シーン情報書込読出部
205 顔抽出部
206 家族シーン情報算出部
207 人周囲特徴量抽出部
208 画像グループ分類部
209 イベント特徴情報書込読出部
210 分類結果出力部
211 イベント名情報受付部
212 イベント特徴情報受付部
213 サンプル画像受付部
214 サンプル画像書込部
231 画像記憶部
232 画像特徴情報記憶部
233 家族シーン情報記憶部
234 イベント特徴情報記憶部
236 サンプル画像記憶部

Claims (12)

  1. 画像を分類するための画像特徴情報を算出する画像データ処理装置であって、
    一画像に含まれる顔の領域を特定する顔特定部と、
    一画像の少なくとも一部の画素に基づいて算出される画像特徴量から、当該画像における画像特徴情報を算出する画像特徴算出部と、
    一画像グループに属する画像の一部又は全部の2枚以上の画像についての、画像特徴算出部によって算出された画像特徴情報に基づいて、当該画像グループを分類するための画像グループ特徴情報を算出する画像グループ特徴算出部とを備え、
    前記顔特定部は、さらに、画像の面積に対する、特定する顔の領域の面積の比率である面積率を示す顔面積情報を算出し、
    前記画像グループ特徴算出部は、前記顔特定部によって顔面積情報を算出された第1の画像と、前記顔特定部によって、当該第1の画像の顔面積情報によって示される顔の領域の面積率よりも大きい面積率を示す顔面積情報を算出された第2の画像とについて、当該第1の画像の画像特徴情報の方が、当該第2の画像の画像特徴情報よりも、前記画像グループ特徴情報へ大きく反映されるように、前記画像特徴情報の算出を行い、
    前記画像特徴算出部は、前記画像特徴情報の算出を、前記顔特定部によって特定された顔の領域の周囲の一定領域に含まれる画素に基づいて算出された画像特徴量から行う
    ことを特徴とする画像データ処理装置。
  2. 前記顔特定部は、顔を含む、画像における水平方向の辺と画像における垂直方向の辺とを有する矩形の領域を、前記顔の領域として特定し、
    前記画像特徴算出部は、前記顔特定部によって特定された顔の領域に対して、少なくとも、画像における上方向と画像における右方向と画像における左方向とのそれぞれの方向に、それぞれ所定のアルゴリズムで定められる幅だけ拡大された矩形の拡張顔領域を、前記一定領域として、前記画像特徴情報の算出を行う
    ことを特徴とする請求項1記載の画像データ処理装置。
  3. 画像を分類するための画像特徴情報を算出する画像データ処理装置であって、
    一画像に含まれる顔の領域を特定する顔特定部と、
    一画像の少なくとも一部の画素に基づいて算出される画像特徴量から、当該画像における画像特徴情報を算出する画像特徴算出部と、
    一画像グループに属する画像の一部又は全部の2枚以上の画像についての、画像特徴算出部によって算出された画像特徴情報に基づいて、当該画像グループを分類するための画像グループ特徴情報を算出する画像グループ特徴算出部と、
    前記顔特定部によって特定された顔の領域の下方に、当該顔の領域に対して所定のアルゴリズムで定められる領域を体領域として特定する体特定部とを備え、
    前記顔特定部は、さらに、画像の面積に対する、特定する顔の領域の面積の比率である面積率を示す顔面積情報を算出し、
    前記画像グループ特徴算出部は、前記顔特定部によって顔面積情報を算出された第1の画像と、前記顔特定部によって、当該第1の画像の顔面積情報によって示される顔の領域の面積率よりも大きい面積率を示す顔面積情報を算出された第2の画像とについて、当該第1の画像の画像特徴情報の方が、当該第2の画像の画像特徴情報よりも、前記画像グループ特徴情報へ大きく反映されるように、前記画像特徴情報の算出を行い、
    前記画像特徴算出部は、前記体特定部によって特定された体領域の周囲の一定領域に含まれる画素に基づいて算出される画像特徴量の方が、当該体領域の周囲の一定領域に含まれない画素に基づいて算出される画像特徴量よりも、前記画像特徴情報へ大きく反映されるように、前記画像特徴情報の算出を行う
    ことを特徴とする画像データ処理装置。
  4. 前記画像特徴算出部は、前記体特定部によって特定された体領域に対して、少なくとも、画像における上方向と画像における右方向と画像における左方向とのそれぞれの方向に、それぞれ所定のアルゴリズムで定められる幅だけ拡大された領域から、前記顔特定部によって特定された顔の領域が除外された拡張体領域を、前記体領域に含ませて、前記画像特徴情報の算出を行う
    ことを特徴とする請求項3記載の画像データ処理装置。
  5. 画像を分類するための画像特徴情報を算出する画像データ処理装置であって、
    一画像に含まれる顔の領域を特定する顔特定部と、
    一画像の少なくとも一部の画素に基づいて算出される画像特徴量から、当該画像における画像特徴情報を算出する画像特徴算出部と、
    一画像グループに属する画像の一部又は全部の2枚以上の画像についての、画像特徴算出部によって算出された画像特徴情報に基づいて、当該画像グループを分類するための画像グループ特徴情報を算出する画像グループ特徴算出部とを備え、
    前記顔特定部は、さらに、画像の面積に対する、特定する顔の領域の面積の比率である面積率を示す顔面積情報を算出し、
    前記画像グループ特徴算出部は、前記顔特定部によって顔面積情報を算出された第1の画像と、前記顔特定部によって、当該第1の画像の顔面積情報によって示される顔の領域の面積率よりも大きい面積率を示す顔面積情報を算出された第2の画像とについて、当該第1の画像の画像特徴情報の方が、当該第2の画像の画像特徴情報よりも、前記画像グループ特徴情報へ大きく反映されるように、前記画像特徴情報の算出を行い、
    前記画像特徴算出部は、前記顔特定部が1つの画像に対して第1の顔の領域と第2の顔の領域とを特定した場合に、前記画像特徴情報の算出を、当該第1の顔の領域の周囲の一定領域と当該第2の顔の領域の周囲の一定領域との少なくとも一方に含まれる画素のうち、当該第1の顔の領域と当該第2の顔の領域とのいずれにも含まれない画素に基づいて算出される画像特徴量から行う
    ことを特徴とする画像データ処理装置。
  6. 前記画像特徴算出部は、前記体特定部が1つの画像に対して第1の体領域と第2の体領域とを特定した場合に、前記画像特徴情報の算出を、当該第1の体領域と当該第2の体領域に含まれる画素に基づいて算出される画像特徴量から行う
    ことを特徴とする請求項3記載の画像データ処理装置。
  7. 画像グループを、複数の分類先カテゴリのうちのいずれかに分類する画像グループ分類部を備え、
    前記画像グループ分類部は、前記画像グループ特徴情報によって画像グループ特徴情報を算出された画像グループに対して、前記画像グループの分類を、前記複数の分類先カテゴリそれぞれにおける、画像グループ特徴情報の示す特徴の範囲を示す基準情報と、前記画像グループ特徴算出部によって算出された画像グループ特徴情報とに基づいて行う
    ことを特徴とする請求項1記載の画像データ処理装置。
  8. 前記画像特徴算出部は、算出する画像特徴情報に、画像に含まれる色に係る情報を含ませ、
    前記画像グループ特徴算出部は、算出する画像グループ特徴情報に、画像グループに属する画像に含まれる色に係る情報を含ませ、
    前基準情報は、前記複数の分類先カテゴリそれぞれにおける、画像グループ特徴情報の示す色の特徴の範囲を示す色基準情報を含み、
    前記画像グループ分類部は、前記画像グループ特徴情報によって画像グループ特徴情報を算出された画像グループに対して行う前記画像グループの分類を、前記基準情報に含まれる色基準情報と、前記画像グループ特徴算出部によって算出された画像グループ特徴情報に含まれる前記色に係る情報とに基づいて行う
    ことを特徴とする請求項記載の画像データ処理装置。
  9. 画像を分類するための画像特徴情報を算出する画像データ処理装置を用いて行う画像データ処理方法であって、
    一画像に含まれる顔の領域を特定する顔特定ステップと、
    一画像の一部又は全部の画素に基づいて算出される画像特徴量から、当該画像における画像特徴情報を算出する画像特徴算出ステップと、
    一画像グループに属する画像の一部又は全部の2枚以上の画像についての、画像特徴算出ステップにおいて算出された画像特徴情報に基づいて、当該画像グループを分類するための画像グループ特徴情報を算出する画像グループ特徴算出ステップとを備え、
    前記顔特定ステップでは、さらに、画像の面積に対する、特定する顔の領域の面積の比率である面積率を示す顔面積情報を算出し、
    前記画像グループ特徴算出ステップでは、前記顔特定ステップにおいて顔面積情報を算出された第1の画像と、前記顔特定ステップにおいて、当該第1の画像の顔面積情報によって示される顔の領域の面積率よりも大きい面積率を示す顔面積情報を算出された第2の画像とについて、当該第1の画像の画像特徴情報の方が、当該第2の画像の画像特徴情報よりも、前記画像グループ特徴情報へ大きく反映されるように、前記画像特徴情報の算出を行い、
    前記画像特徴算出ステップでは、前記画像特徴情報の算出を、前記顔特定ステップによって特定された顔の領域の周囲の一定領域に含まれる画素に基づいて算出された画像特徴量から行う
    ことを特徴とする画像データ処理方法。
  10. コンピュータを、画像を分類するための画像特徴情報を算出する画像データ処理装置として機能させるための画像データ処理プログラムであって、
    前記コンピュータを、
    一画像に含まれる顔の領域を特定する顔特定部と、
    一画像の少なくとも一部の画素に基づいて算出される画像特徴量から、当該画像における画像特徴情報を算出する画像特徴算出部と、
    一画像グループに属する画像の一部又は全部の2枚以上の画像についての、画像特徴算出部によって算出された画像特徴情報に基づいて、当該画像グループを分類するための画像グループ特徴情報を算出する画像グループ特徴算出部とを備え、
    前記顔特定部は、さらに、画像の面積に対する、特定する顔の領域の面積の比率である面積率を示す顔面積情報を算出し、
    前記画像グループ特徴算出部は、前記顔特定部によって顔面積情報を算出された第1の画像と、前記顔特定部によって、当該第1の画像の顔面積情報によって示される顔の領域の面積率よりも大きい面積率を示す顔面積情報を算出された第2の画像とについて、当該第1の画像の画像特徴情報の方が、当該第2の画像の画像特徴情報よりも、前記画像グループ特徴情報へ大きく反映されるように、前記画像特徴情報の算出を行い、
    前記画像特徴算出部は、前記画像特徴情報の算出を、前記顔特定部によって特定された顔の領域の周囲の一定領域に含まれる画素に基づいて算出された画像特徴量から行うことを特徴とする画像データ処理装置として機能させる
    ことを特徴とする画像データ処理プログラム。
  11. 画像を分類するための画像特徴情報を算出する半導体集積回路であって、
    一画像に含まれる顔の領域を特定する顔特定部と、
    一画像の少なくとも一部の画素に基づいて算出される画像特徴量から、当該画像における画像特徴情報を算出する画像特徴算出部と、
    一画像グループに属する画像の一部又は全部の2枚以上の画像についての、画像特徴算出部によって算出された画像特徴情報に基づいて、当該画像グループを分類するための画像グループ特徴情報を算出する画像グループ特徴算出部とを備え、
    前記顔特定部は、さらに、画像の面積に対する、特定する顔の領域の面積の比率である面積率を示す顔面積情報を算出し、
    前記画像グループ特徴算出部は、前記顔特定部によって顔面積情報を算出された第1の画像と、前記顔特定部によって、当該第1の画像の顔面積情報によって示される顔の領域の面積率よりも大きい面積率を示す顔面積情報を算出された第2の画像とについて、当該第1の画像の画像特徴情報の方が、当該第2の画像の画像特徴情報よりも、前記画像グループ特徴情報へ大きく反映されるように、前記画像特徴情報の算出を行い、
    前記画像特徴算出部は、前記画像特徴情報の算出を、前記顔特定部によって特定された顔の領域の周囲の一定領域に含まれる画素に基づいて算出された画像特徴量から行う
    ことを特徴とする半導体集積回路。
  12. 画像を分類するための画像特徴情報を算出する画像データ処理装置であって、
    一画像に含まれる顔の領域を特定する顔特定部と、
    一画像の少なくとも一部の画素に基づいて算出される画像特徴量から、当該画像における画像特徴情報を算出する画像特徴算出部と、
    一画像グループに属する画像の一部又は全部の2枚以上の画像についての、画像特徴算出部によって算出された画像特徴情報に基づいて、当該画像グループを分類するための画像グループ特徴情報を算出する画像グループ特徴算出部とを備え、
    前記顔特定部は、さらに、画像の面積に対する、特定する顔の領域の面積の比率である面積率を示す顔面積情報を算出し、
    前記画像グループ特徴算出部は、前記顔特定部によって顔面積情報を算出された第1の画像と、前記顔特定部によって、当該第1の画像の顔面積情報によって示される顔の領域の面積率よりも大きい面積率を示す顔面積情報を算出された第2の画像とについて、当該第1の画像の画像特徴情報の方が、当該第2の画像の画像特徴情報よりも、前記画像グループ特徴情報へ大きく反映されるように、前記画像特徴情報の算出を行い、
    前記画像特徴算出部は、前記顔特定部によって特定された顔の領域の周囲の一定領域に含まれる画素に基づいて算出される画像特徴量の方が、当該一定領域に含まれない画素に基づいて算出される画像特徴量よりも、前記画像特徴情報へ大きく反映されるように、前記画像特徴情報の算出を行う
    ことを特徴とする画像データ処理装置。
JP2012554676A 2011-01-28 2012-01-24 画像データ処理装置、方法、プログラム及び集積回路 Active JP5890325B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012554676A JP5890325B2 (ja) 2011-01-28 2012-01-24 画像データ処理装置、方法、プログラム及び集積回路

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2011016483 2011-01-28
JP2011016483 2011-01-28
PCT/JP2012/000410 WO2012102015A1 (ja) 2011-01-28 2012-01-24 画像データ処理装置、方法、プログラム及び集積回路
JP2012554676A JP5890325B2 (ja) 2011-01-28 2012-01-24 画像データ処理装置、方法、プログラム及び集積回路

Publications (2)

Publication Number Publication Date
JPWO2012102015A1 JPWO2012102015A1 (ja) 2014-06-30
JP5890325B2 true JP5890325B2 (ja) 2016-03-22

Family

ID=46580591

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012554676A Active JP5890325B2 (ja) 2011-01-28 2012-01-24 画像データ処理装置、方法、プログラム及び集積回路

Country Status (4)

Country Link
US (1) US8737726B2 (ja)
JP (1) JP5890325B2 (ja)
CN (1) CN102893304B (ja)
WO (1) WO2012102015A1 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8565482B2 (en) * 2011-02-28 2013-10-22 Seiko Epson Corporation Local difference pattern based local background modeling for object detection
JP6212878B2 (ja) * 2013-02-21 2017-10-18 株式会社リコー 画像処理装置、画像処理システム及びプログラム
US9569440B2 (en) * 2013-02-22 2017-02-14 Sony Corporation Method and apparatus for content manipulation
JP6387700B2 (ja) * 2014-06-18 2018-09-12 ソニー株式会社 情報処理装置、情報処理システム、情報処理装置の制御方法およびプログラム
US20160110381A1 (en) * 2014-10-17 2016-04-21 Fuji Xerox Co., Ltd. Methods and systems for social media-based profiling of entity location by associating entities and venues with geo-tagged short electronic messages
TWI579718B (zh) * 2016-06-15 2017-04-21 陳兆煒 圖形資源管理系統及方法與內儲圖形資源管理程式之電腦程式產品
KR20180065135A (ko) * 2016-12-07 2018-06-18 삼성전자주식회사 셀프 구조 분석을 이용한 구조 잡음 감소 방법 및 장치
JP7129383B2 (ja) * 2019-07-03 2022-09-01 富士フイルム株式会社 画像処理装置,画像処理方法,画像処理プログラムおよびそのプログラムを格納した記録媒体

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007317077A (ja) * 2006-05-29 2007-12-06 Fujifilm Corp 画像分類装置および方法ならびにプログラム
JP2010250634A (ja) * 2009-04-17 2010-11-04 Seiko Epson Corp 画像サーバー、画像検索システム、画像検索方法およびインデックス作成方法
JP2010273328A (ja) * 2009-04-20 2010-12-02 Fujifilm Corp 画像処理装置、画像処理方法およびプログラム

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04232774A (ja) 1990-12-28 1992-08-21 Mitsubishi Paper Mills Ltd 改ざん防止用感圧記録シート
JPH04315344A (ja) 1991-04-15 1992-11-06 Nippon Telegr & Teleph Corp <Ntt> 符号誤り監視装置
US7508961B2 (en) * 2003-03-12 2009-03-24 Eastman Kodak Company Method and system for face detection in digital images
JP4315344B2 (ja) 2003-11-27 2009-08-19 富士フイルム株式会社 画像編集装置および方法並びにプログラム
JP2006295890A (ja) * 2005-03-15 2006-10-26 Fuji Photo Film Co Ltd アルバム作成装置、アルバム作成方法、及びプログラム
JP4232774B2 (ja) 2005-11-02 2009-03-04 ソニー株式会社 情報処理装置および方法、並びにプログラム
JP4466585B2 (ja) * 2006-02-21 2010-05-26 セイコーエプソン株式会社 対象物が表現された画像の数の算出
CN101334780A (zh) * 2007-06-25 2008-12-31 英特维数位科技股份有限公司 人物影像的搜寻方法、系统及存储影像元数据的记录媒体
JP5739428B2 (ja) * 2010-08-04 2015-06-24 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 画像分類装置、方法、プログラム、プログラムを記録する記録媒体及び集積回路

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007317077A (ja) * 2006-05-29 2007-12-06 Fujifilm Corp 画像分類装置および方法ならびにプログラム
JP2010250634A (ja) * 2009-04-17 2010-11-04 Seiko Epson Corp 画像サーバー、画像検索システム、画像検索方法およびインデックス作成方法
JP2010273328A (ja) * 2009-04-20 2010-12-02 Fujifilm Corp 画像処理装置、画像処理方法およびプログラム

Also Published As

Publication number Publication date
WO2012102015A1 (ja) 2012-08-02
US20130004064A1 (en) 2013-01-03
CN102893304B (zh) 2016-02-10
US8737726B2 (en) 2014-05-27
JPWO2012102015A1 (ja) 2014-06-30
CN102893304A (zh) 2013-01-23

Similar Documents

Publication Publication Date Title
JP5890325B2 (ja) 画像データ処理装置、方法、プログラム及び集積回路
JP5469181B2 (ja) 画像分類装置、方法、プログラム、プログラムを記録する記録媒体及び集積回路
US9058342B2 (en) Image classification device, method, program, recording media with program thereon, and integrated circuit
US10474931B2 (en) Image group title assigning device, image grouping device, representative image determination device for image group, image display device, camera, and image display program
US7995106B2 (en) Imaging apparatus with human extraction and voice analysis and control method thereof
US8515137B2 (en) Generating a combined image from multiple images
JP5686673B2 (ja) 画像処理装置、画像処理方法およびプログラム
JP4490214B2 (ja) 電子アルバム表示システム、電子アルバム表示方法、及び電子アルバム表示プログラム
JP2005303991A (ja) 撮像装置、撮像方法、及び撮像プログラム
JP2011511358A (ja) 自動赤目検出
JP4474885B2 (ja) 画像分類装置及び画像分類プログラム
CN112424792A (zh) 基于美学的肖像图像评估
JP2006081021A (ja) 電子アルバム表示システム、電子アルバム表示方法、電子アルバム表示プログラム、画像分類装置、画像分類方法、及び画像分類プログラム
JP2006079460A (ja) 電子アルバム表示システム、電子アルバム表示方法、電子アルバム表示プログラム、画像分類装置、画像分類方法、及び画像分類プログラム
JP5381498B2 (ja) 画像処理装置、画像処理プログラムおよび画像処理方法
JP6027745B2 (ja) 画像処理装置
JP5871293B2 (ja) 携帯端末及び画像分類方法
JP2013093667A (ja) 写真画像毎の再生時間を最適化する画像再生装置、プログラム及び方法
JP5683819B2 (ja) 携帯端末及び画像分類方法
JP2003208615A (ja) 画像処理装置、及びプログラム
JP2016048586A (ja) 携帯端末及び画像分類方法

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20140606

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20140606

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140718

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150929

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151016

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151221

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160126

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160218

R150 Certificate of patent or registration of utility model

Ref document number: 5890325

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150