JP5890325B2 - 画像データ処理装置、方法、プログラム及び集積回路 - Google Patents
画像データ処理装置、方法、プログラム及び集積回路 Download PDFInfo
- Publication number
- JP5890325B2 JP5890325B2 JP2012554676A JP2012554676A JP5890325B2 JP 5890325 B2 JP5890325 B2 JP 5890325B2 JP 2012554676 A JP2012554676 A JP 2012554676A JP 2012554676 A JP2012554676 A JP 2012554676A JP 5890325 B2 JP5890325 B2 JP 5890325B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- face
- area
- information
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims description 167
- 238000000034 method Methods 0.000 title description 111
- 238000004364 calculation method Methods 0.000 claims description 90
- 210000000746 body region Anatomy 0.000 claims description 55
- 239000003086 colorant Substances 0.000 claims description 9
- 238000003672 processing method Methods 0.000 claims 2
- 239000004065 semiconductor Substances 0.000 claims 2
- 230000006870 function Effects 0.000 description 79
- 238000000605 extraction Methods 0.000 description 68
- 238000010586 diagram Methods 0.000 description 32
- 238000004891 communication Methods 0.000 description 31
- 230000001815 facial effect Effects 0.000 description 26
- 238000013500 data storage Methods 0.000 description 9
- 238000003287 bathing Methods 0.000 description 8
- 240000003173 Drymaria cordata Species 0.000 description 5
- 210000000887 face Anatomy 0.000 description 5
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 235000021178 picnic Nutrition 0.000 description 4
- 230000009182 swimming Effects 0.000 description 4
- 238000007796 conventional method Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000000386 athletic effect Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 239000004576 sand Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Description
以下、本発明に係る画像データ処理装置の一実施形態として、画像に写る人物の周囲の画素の特徴を示す人周囲特徴量を算出し、算出した人周囲特徴量に基づいて、一つの行事であるイベントに関連して撮影された複数枚の画像からなる画像グループ単位で、画像を互いに異なる予め定められた複数の分類先イベントのうちのいずれかの分類先イベントに分類する画像データ処理装置100について説明する。
<画像データ処理装置100のハードウエア構成>
図1は、画像データ処理装置100の主要なハードウエア構成を示すハードウエアブロック図である。
から符号化された画像データを読み出して復号し、復号した画像データをディスプレイ193に出力する機能等を実現する。
図2は、画像データ処理装置100の主要な機能ブロックの構成を示す機能ブロック図である。
画像データ処理装置100の行う特徴的な動作に、画像特徴情報生成処理と、画像家族シーン情報生成処理と、画像グループ家族シーン情報生成処理と、画像グループ分類処理とがある。
画像特徴情報生成処理は、画像データ処理装置100が、画像グループ単位で画像を読み込み、読み込んだ画像のそれぞれに対して、画像特徴情報を生成する処理である。
画像家族シーン情報生成処理は、画像データ処理装置100が、画像特徴情報に基づいて、画像家族シーン情報を生成する処理である。
画像グループ家族シーン情報生成処理は、画像データ処理装置100が、画像グループに属する各画像の画像家族シーン情報に基づいて、その画像グループの画像グループ家族シーン情報を生成する処理である。
画像グループ分類処理は、画像データ処理装置100が、画像グループを、分類先イベントのいずれかに分類する処理である。
以下、具体例を用いて、画像データ処理装置100の特徴について補足説明を行う。
図16は、2枚の画像を示す図である。
<実施の形態2>
以下、本発明に係る画像データ処理装置の一実施形態として、実施の形態1に係る画像データ処理装置100の一部を変形した画像データ処理装置1700について図17を用いて説明する。
<画像データ処理装置1700のハードウエア構成>
画像データ処理装置1700のハードウエア構成は、実施の形態1に係る画像データ処理装置100の構成と同一のものである。よって、説明を省略する。
図17は、画像データ処理装置1700の主要な機能ブロックの構成を示す機能ブロック図である。
画像データ処理装置1700の行う特徴的な動作に、変形画像特徴情報生成処理と、画像分類処理とがある。
画像特徴情報生成処理は、画像データ処理装置1700が、画像を読み込み、読み込んだ画像に対して、画像特徴情報を生成する処理である。
画像分類処理は、画像データ処理装置1700が、画像を、分類先イベントのいずれかに分類する処理である。
<補足>
以上、本発明に係る画像データ処理装置の一実施形態として、実施の形態1、実施の形態2において、画像の分類を行う画像データ処理装置の例について説明したが、以下のように変形することも可能であり、本発明は上述した実施の形態で示した通りの画像データ処理装置に限られないことはもちろんである。
(1)実施の形態1において、画像データ処理装置100が記憶する画像として、JPEG方式で符号化されたデータとしたが、デジタル写真をデータとして記憶することができるものであれば、JPEG方式以外の符号化方式、例えば、PNG(Portable Network Graphics)方式やGIF(Graphics Interchange Format)方式等で符号化されたものであっても構わないし、符号化されないビットマップ方式のデータであっても構わない。
(2)実施の形態1において、CPU101と、ROM102と、RAM103と、ハードディスク装置インターフェース104と、外部記録媒体読取書込装置インターフェース105と、USB制御装置インターフェース106と、出力装置インターフェース107と、入力装置インターフェース108と、通信装置インターフェース109と、デコーダ111と、バスライン120とが、システムLSI110に集積されているとしたが、システムLSI110と同じ機能を実現することができれば、必ずしも1つのLSIに統合されている必要はなく、例えば、複数の集積回路等で実現されていても構わない。
(3)実施の形態1において、デコーダ111は、DSPであるとしたが、符号化されたデータを復号する機能があれば、必ずしもDSPである必要はなく、例えば、CPU101が兼用する構成であっても構わないし、CPU101とは異なるCPUであっても構わないし、ASIC等で構成される専用回路であっても構わない。
(4)実施の形態1において、入力装置170は、リモコン197から無線で送信されるユーザからの操作コマンドを受け付ける機能を有する構成であるとしたが、ユーザからの操作コマンドを受け付ける機能があれば、必ずしもリモコン197から無線で送信される操作コマンドを受け付ける機能を有する構成でなくても、例えば、キーボードとマウスとを備え、キーボードとマウスとを介してユーザからの操作コマンドを受け付ける機能を有する構成であっても構わないし、ボタン群を備え、ボタン群を介してユーザからの操作コマンドを受け付ける機能を有する構成等であっても構わない。
(5)実施の形態1において、画像グループデータ受付部201が、ユーザからの、2枚以上の画像の指定を受け付け、指定された画像群を、1つの画像グループに含まれる画像群とするとしたが、画像と画像グループとの対応付けを取ることができれば、例えば、画像グループデータ受付部201は、画像データと、画像グループに属する画像のリストとを受け取り、受け取ったリストに基づいて、画像と画像グループとを対応付けるといった構成であっても構わない。
(6)実施の形態1において、画像グループデータ受付部201は、読み込んだ画像に対して、シーケンシャルに画像IDを付与するとしたが、重複を避けて付与することができれば、必ずしもシーケンシャルに画像IDを付与しなくても構わない。
(7)実施の形態1において、顔のモデルは、例えば、目、鼻、口等の顔を形成するパーツの輝度や、相対的な位置関係に関する情報等であるとしたが、顔を認識することができる情報であれば、これら以外、例えば、ガボールフィルタを用いて算出された特徴量を用いるものであっても構わないし、目の色や、ほくろの位置、肌の色等といった顔の特徴を示すものであっても構わないし、複数の顔の特徴を表すものの組み合わせであっても構わない。
(8)実施の形態1において、人周囲特徴量抽出部207が特定する主要色として、黒、青、緑、白を例示したが、これらの色に限られる必要はなく、例えば、赤、黄等であっても構わない。また、色空間としてRGBやL*a*b等を用いても良い。
(9)実施の形態1において、人周囲特徴量は、画像に含まれる色に基づいたもので構成されているとしたが、画像の特徴を示すものであれば、必ずしも、画像に含まれる色に基づいたもので構成されている必要はなく、例えば、輝度やテクスチャ特徴に基づいたもので構成されていても構わないし、写る物体に基づいたものであっても構わない。
(10)実施の形態1において、人周囲特徴量抽出部207は、人周囲特徴量を、人周囲領域に含まれる各画素に基づいて算出する場合の例について説明したが、顔の領域の周囲の一定領域に含まれる画素の画素値の方が、顔の領域の周囲の一定領域に含まれない画素の画素値よりも、人周囲特徴量へ大きく反映されるように、人周囲特徴量の算出を行うことができれば、必ずしも、人周囲特徴量を、人周囲領域に含まれる各画素に基づいて算出する場合に限られない。
(11)実施の形態1において、人周囲領域は、顔周囲領域と体周囲領域との少なくとも一方に含まれる領域から顔の領域と体の領域とを除外した領域であるとしたが、顔の領域の周囲の一定領域であれば、必ずしも、顔周囲領域と体周囲領域との少なくとも一方に含まれる領域から顔の領域と体の領域とを除外した領域である必要はなく、例えば、顔周囲領域から顔の領域を除外した領域であるとしても構わないし、体領域そのものであるとしても構わないし、体周囲領域から顔領域を除外した領域と体領域とからなる領域であるとしても構わない。
(12)実施の形態1において、顔周囲領域は、顔の領域に対して、画像における水平方向の左右のそれぞれに、顔の領域の、画像における水平方向の幅を加え、画像における垂直方向の上方に、顔の領域の、画像における垂直方向の幅を加えた矩形の領域であるとしたが、顔の領域の周囲の一定領域であれば、必ずしも、顔の領域に対して、画像における水平方向の左右のそれぞれに、顔の領域の、画像における水平方向の幅を加え、画像における垂直方向の上方に、顔の領域の、画像における垂直方向の幅を加えた矩形の領域に限定される必要はなく、例えば、顔の領域に対して、画像における水平方向の左右のそれぞれに、顔の領域の、画像における水平方向の幅の半分を加え、画像における垂直方向の上下のそれぞれに、顔の領域の、画像における垂直方向の幅の半分を加えた矩形の領域等であっても構わないし、さらには、矩形以外の形状の領域であっても構わない。
(13)実施の形態1において、認識した顔の領域は、認識した顔を含む、画像における水平方向の辺と画像における垂直方向の辺とを有する矩形のうち、面積が最小となる矩形の領域である場合の例について説明したが、認識した顔を含む領域であれば、必ずしも、画像における水平方向の辺と画像における垂直方向の辺とを有する矩形のうち、面積が最小となる矩形の領域に限定される必要はなく、例えば、顔の輪郭にそった曲線で囲まれた領域であっても構わない。
(14)実施の形態1において、体の領域は、認識した顔の領域の下方の、顔の領域の画像における水平方向の幅を1.5倍し、顔の領域の画像における垂直方向の幅を2倍した矩形の領域であるとしたが、体があると推定される領域であれば、必ずしも、認識した顔の領域の下方の、顔の領域の画像における水平方向の幅を1.5倍し、顔の領域の画像における垂直方向の幅を2倍した矩形の領域に限定される必要はなく、例えば、認識した顔の領域の下方の、顔の領域の画像における水平方向の幅を2倍し、顔の領域の画像における垂直方向の幅を1.5倍した矩形の領域であっても構わないし、さらには、画像認識処理により体を検出して、その認識された体によって示される領域であるとしても構わないし、さらには、矩形以外の形状の領域であっても構わない。
(15)実施の形態1において、体周囲領域は、体の領域に対して、画像における水平方向の左右のそれぞれに、顔の領域の、画像における水平方向の幅を加え、画像における垂直方向の上下のそれぞれに、顔の領域の、画像における垂直方向の幅の半分の幅を加えた矩形の領域であるとしたが、体の領域の周囲の一定領域であれば、必ずしも、体の領域に対して、画像における水平方向の左右のそれぞれに、顔の領域の、画像における水平方向の幅を加え、画像における垂直方向の上下のそれぞれに、顔の領域の、画像における垂直方向の幅の半分の幅を加えた矩形の領域に限定される必要はなく、例えば、体の領域に対して、画像における水平方向の左右のそれぞれに、体の領域の、画像における水平方向の幅の半分の幅を加え、画像における垂直方向の上下のそれぞれに、体の領域の、画像における垂直方向の幅を加えた矩形の領域であるとしても構わないし、さらには、矩形以外の形状の領域であっても構わない。
(16)実施の形態1において、画像家族シーン特徴量は、人周囲特徴量の各色比率の値を、顔面積の値で除算することで算出されるとしたが、画像における人物の面積の大きさがより小さな画像の方が、その画像の画像家族シーン特徴量の値がより大きな値となるように重み付けされることとなれば、必ずしも、人周囲特徴量の各色比率の値を、顔面積の値で除算することで算出される必要はなく、例えば、人周囲特徴量の各色比率の値を、顔面積の値と体面積の値との和で除算することで算出されるとしても構わない。
(17)実施の形態1において、画像グループ家族シーン特徴量は、家族の顔として認識された顔を含む画像に対応する画像家族シーン特徴量の平均値であるとしたが、認識された顔を含まない画像の画像家族シーン特徴量を含めないで算出されるものであれば、必ずしも、家族の顔として認識された顔を含む画像に対応する画像家族シーン特徴量の平均値である必要はなく、例えば、認識された顔を含む全ての画像の画像家族シーン特徴量の平均値であっても構わないし、特定の人物を示す認識された顔を含む画像の画像家族シーン特徴量の平均値であっても構わない。
(18)実施の形態1において、画像グループ分類部208は、画像グループ家族シーン情報とイベント特徴情報とに基づいて画像グループを分類するとしたが、少なくとも画像グループ家族情報に基づいて画像グループを分類すれば、必ずしも、イベント特徴情報に基づいて画像グループを分類する必要はなく、例えば、画像グループ家族シーン情報を教師として学習し、その学習結果に基づいて、画像グループを分類しても構わない。学習方法は、例えば、ロジスティック回帰分析法、SVM(Support Vector Machine)法等の学習モデルを用いて行う手法によって実現できる。
(19)実施の形態1において、認識された顔に対応する対応顔IDが家族を示す場合にその認識された顔の人物が家族であるとしたが、認識された顔が家族であると類推される場合にその認識された顔の人物が家族であるとすれば、必ずしも、認識された顔に対応する対応顔IDが家族を示す場合にその認識された顔の人物が家族であるとする必要はなく、例えば、その認識された顔の特徴と同じ顔の特徴を持つ顔を含む画像が、画像記憶部231に所定の枚数(例えば10枚)以上含まれている場合に、その認識された顔の人物が家族であるとしても構わない。
(20)実施の形態1において、人周囲特徴量抽出部207は、一枚の画像に認識された顔が複数含まれている場合に、1つの人周囲領域を算出するとしたが、少なくとも1つの人周囲領域を算出すれば、必ずしも算出する人周囲領域は1つに限定される必要はない。
(21)実施の形態1において、サンプル画像記憶部236は、特定の人物を含む画像の画像データを記憶するとしているが、顔抽出部205が、特定の人物の顔の特徴を抽出することができるものを記憶していれば、必ずしも、特定の人物を含む画像を記憶する必要はなく、例えば、特定の人物の顔の特徴そのものを記憶するとしても構わない。
(22)実施の形態1において、画像グループ分類部208は、分類されるべき分類先イベントを決定すると、分類されるべき分類先イベントに対応するイベントディレクトリの下に、画像グループに対応付けられているイベント名と同一名称のイベントディレクトリを作成して、そのイベントディレクトリの下に、画像グループに属する全ての画像のデータのリンクを張ることで、画像グループを分類するとしたが、画像グループに属する画像が同じ分類先イベントに対応付けられていれば、必ずしもリンクを張ることで画像グループを分類するとする必要はなく、例えば、画像グループに属する画像に、分類先イベントを特定するためのタグを付与するとしても構わない。
(23)実施の形態1において、画像データ処理装置100は、画像グループの分類を、画像グループ家族シーン情報とイベント特徴情報とに基づいて行うとしたが、少なくとも、画像グループ家族シーン情報とイベント特徴情報とに基づいて行うことができれば、必ずしも、画像グループ家族シーン情報とイベント特徴情報とだけに基づいて行う必要はない。
(24)実施の形態1において、画像グループ分類部208は、一致する分類先イベント910が複数ある場合には、一致する分類先イベント910の全てを、画像グループが分類されるべき分類先イベントとして算出するとしたが、画像グループが分類されるべき分類先イベントを少なくとも1つ算出することができれば、必ずしも、一致する分類先イベント910の全てを、画像グループが分類されるべき分類先イベントとして算出する必要はない。
(25)さらに、上記の実施の形態で説明した手法をネットワークサービスとして提供するサーバ装置とすることも可能である。この場合、画像データ処理装置を、ネットワークサービスを提供するサーバ装置とする。そして、このサーバ装置が、コンテンツが蓄積されたAV機器、パーソナルコンピュータ、デジタルカメラなどからネットワークを介してコンテンツを受信すると、受信したコンテンツに対して上記の実施の形態で説明した手法による画像データ処理を行い、その処理結果を、ネットワークを介してAV機器、パーソナルコンピュータ、デジタルカメラなどに送信するようにすればよい。なお、処理結果の送信先は、コンテンツを受信した機器に対してであってもそれ以外の機器に対してであってもよい。具体的には、コンテンツを受信した機器のユーザが所有する他の機器、コンテンツを受信した機器のユーザの家族や友人が所有する機器、SNSや画像共有サービスなどのネットワークサービスを提供するサーバ装置などが挙げられる。また、処理結果を送信する代わりに、あるいは処理結果を送信することに加えて、処理結果を、上記の実施の形態で説明した手法をネットワークサービスとして提供するサーバ装置自身に保存することとしてもよい。
(26)実施の形態1、実施の形態2で示した、画像グループ分類動作等を画像データ処理装置のCPU、及びそのCPUに接続された各種回路に実行させるためのプログラムコードからなる制御プログラムを、記録媒体に記録すること、又は各種通信路等を介して流通させ頒布することもできる。このような記録媒体には、ICカード、ハードディスク、光ディスク、フレキシブルディスク、ROM等がある。流通、頒布された制御プログラムはCPUに読み出され得るメモリ等に格納されることにより利用に供され、そのCPUがその制御プログラムを実行することにより各実施形態で示したような各種機能が実現されるようになる。なお、制御プログラムの一部を画像分類装置とは別個のプログラム実行可能な装置(CPU)に各種通信路等を介して送信して、その別個のプログラム実行可能な装置においてその制御プログラムの一部を実行させることとしてもよい。
(27)以下、さらに本発明の一実施形態に係る画像データ処理装置の構成及びその変形例と各効果について説明する。
201 画像グループデータ受付部
202 画像書込読出部
203 画像特徴情報書込読出部
204 家族シーン情報書込読出部
205 顔抽出部
206 家族シーン情報算出部
207 人周囲特徴量抽出部
208 画像グループ分類部
209 イベント特徴情報書込読出部
210 分類結果出力部
211 イベント名情報受付部
212 イベント特徴情報受付部
213 サンプル画像受付部
214 サンプル画像書込部
231 画像記憶部
232 画像特徴情報記憶部
233 家族シーン情報記憶部
234 イベント特徴情報記憶部
236 サンプル画像記憶部
Claims (12)
- 画像を分類するための画像特徴情報を算出する画像データ処理装置であって、
一画像に含まれる顔の領域を特定する顔特定部と、
一画像の少なくとも一部の画素に基づいて算出される画像特徴量から、当該画像における画像特徴情報を算出する画像特徴算出部と、
一画像グループに属する画像の一部又は全部の2枚以上の画像についての、画像特徴算出部によって算出された画像特徴情報に基づいて、当該画像グループを分類するための画像グループ特徴情報を算出する画像グループ特徴算出部とを備え、
前記顔特定部は、さらに、画像の面積に対する、特定する顔の領域の面積の比率である面積率を示す顔面積情報を算出し、
前記画像グループ特徴算出部は、前記顔特定部によって顔面積情報を算出された第1の画像と、前記顔特定部によって、当該第1の画像の顔面積情報によって示される顔の領域の面積率よりも大きい面積率を示す顔面積情報を算出された第2の画像とについて、当該第1の画像の画像特徴情報の方が、当該第2の画像の画像特徴情報よりも、前記画像グループ特徴情報へ大きく反映されるように、前記画像特徴情報の算出を行い、
前記画像特徴算出部は、前記画像特徴情報の算出を、前記顔特定部によって特定された顔の領域の周囲の一定領域に含まれる画素に基づいて算出された画像特徴量から行う
ことを特徴とする画像データ処理装置。 - 前記顔特定部は、顔を含む、画像における水平方向の辺と画像における垂直方向の辺とを有する矩形の領域を、前記顔の領域として特定し、
前記画像特徴算出部は、前記顔特定部によって特定された顔の領域に対して、少なくとも、画像における上方向と画像における右方向と画像における左方向とのそれぞれの方向に、それぞれ所定のアルゴリズムで定められる幅だけ拡大された矩形の拡張顔領域を、前記一定領域として、前記画像特徴情報の算出を行う
ことを特徴とする請求項1記載の画像データ処理装置。 - 画像を分類するための画像特徴情報を算出する画像データ処理装置であって、
一画像に含まれる顔の領域を特定する顔特定部と、
一画像の少なくとも一部の画素に基づいて算出される画像特徴量から、当該画像における画像特徴情報を算出する画像特徴算出部と、
一画像グループに属する画像の一部又は全部の2枚以上の画像についての、画像特徴算出部によって算出された画像特徴情報に基づいて、当該画像グループを分類するための画像グループ特徴情報を算出する画像グループ特徴算出部と、
前記顔特定部によって特定された顔の領域の下方に、当該顔の領域に対して所定のアルゴリズムで定められる領域を体領域として特定する体特定部とを備え、
前記顔特定部は、さらに、画像の面積に対する、特定する顔の領域の面積の比率である面積率を示す顔面積情報を算出し、
前記画像グループ特徴算出部は、前記顔特定部によって顔面積情報を算出された第1の画像と、前記顔特定部によって、当該第1の画像の顔面積情報によって示される顔の領域の面積率よりも大きい面積率を示す顔面積情報を算出された第2の画像とについて、当該第1の画像の画像特徴情報の方が、当該第2の画像の画像特徴情報よりも、前記画像グループ特徴情報へ大きく反映されるように、前記画像特徴情報の算出を行い、
前記画像特徴算出部は、前記体特定部によって特定された体領域の周囲の一定領域に含まれる画素に基づいて算出される画像特徴量の方が、当該体領域の周囲の一定領域に含まれない画素に基づいて算出される画像特徴量よりも、前記画像特徴情報へ大きく反映されるように、前記画像特徴情報の算出を行う
ことを特徴とする画像データ処理装置。 - 前記画像特徴算出部は、前記体特定部によって特定された体領域に対して、少なくとも、画像における上方向と画像における右方向と画像における左方向とのそれぞれの方向に、それぞれ所定のアルゴリズムで定められる幅だけ拡大された領域から、前記顔特定部によって特定された顔の領域が除外された拡張体領域を、前記体領域に含ませて、前記画像特徴情報の算出を行う
ことを特徴とする請求項3記載の画像データ処理装置。 - 画像を分類するための画像特徴情報を算出する画像データ処理装置であって、
一画像に含まれる顔の領域を特定する顔特定部と、
一画像の少なくとも一部の画素に基づいて算出される画像特徴量から、当該画像における画像特徴情報を算出する画像特徴算出部と、
一画像グループに属する画像の一部又は全部の2枚以上の画像についての、画像特徴算出部によって算出された画像特徴情報に基づいて、当該画像グループを分類するための画像グループ特徴情報を算出する画像グループ特徴算出部とを備え、
前記顔特定部は、さらに、画像の面積に対する、特定する顔の領域の面積の比率である面積率を示す顔面積情報を算出し、
前記画像グループ特徴算出部は、前記顔特定部によって顔面積情報を算出された第1の画像と、前記顔特定部によって、当該第1の画像の顔面積情報によって示される顔の領域の面積率よりも大きい面積率を示す顔面積情報を算出された第2の画像とについて、当該第1の画像の画像特徴情報の方が、当該第2の画像の画像特徴情報よりも、前記画像グループ特徴情報へ大きく反映されるように、前記画像特徴情報の算出を行い、
前記画像特徴算出部は、前記顔特定部が1つの画像に対して第1の顔の領域と第2の顔の領域とを特定した場合に、前記画像特徴情報の算出を、当該第1の顔の領域の周囲の一定領域と当該第2の顔の領域の周囲の一定領域との少なくとも一方に含まれる画素のうち、当該第1の顔の領域と当該第2の顔の領域とのいずれにも含まれない画素に基づいて算出される画像特徴量から行う
ことを特徴とする画像データ処理装置。 - 前記画像特徴算出部は、前記体特定部が1つの画像に対して第1の体領域と第2の体領域とを特定した場合に、前記画像特徴情報の算出を、当該第1の体領域と当該第2の体領域に含まれる画素に基づいて算出される画像特徴量から行う
ことを特徴とする請求項3記載の画像データ処理装置。 - 画像グループを、複数の分類先カテゴリのうちのいずれかに分類する画像グループ分類部を備え、
前記画像グループ分類部は、前記画像グループ特徴情報によって画像グループ特徴情報を算出された画像グループに対して、前記画像グループの分類を、前記複数の分類先カテゴリそれぞれにおける、画像グループ特徴情報の示す特徴の範囲を示す基準情報と、前記画像グループ特徴算出部によって算出された画像グループ特徴情報とに基づいて行う
ことを特徴とする請求項1記載の画像データ処理装置。 - 前記画像特徴算出部は、算出する画像特徴情報に、画像に含まれる色に係る情報を含ませ、
前記画像グループ特徴算出部は、算出する画像グループ特徴情報に、画像グループに属する画像に含まれる色に係る情報を含ませ、
前基準情報は、前記複数の分類先カテゴリそれぞれにおける、画像グループ特徴情報の示す色の特徴の範囲を示す色基準情報を含み、
前記画像グループ分類部は、前記画像グループ特徴情報によって画像グループ特徴情報を算出された画像グループに対して行う前記画像グループの分類を、前記基準情報に含まれる色基準情報と、前記画像グループ特徴算出部によって算出された画像グループ特徴情報に含まれる前記色に係る情報とに基づいて行う
ことを特徴とする請求項7記載の画像データ処理装置。 - 画像を分類するための画像特徴情報を算出する画像データ処理装置を用いて行う画像データ処理方法であって、
一画像に含まれる顔の領域を特定する顔特定ステップと、
一画像の一部又は全部の画素に基づいて算出される画像特徴量から、当該画像における画像特徴情報を算出する画像特徴算出ステップと、
一画像グループに属する画像の一部又は全部の2枚以上の画像についての、画像特徴算出ステップにおいて算出された画像特徴情報に基づいて、当該画像グループを分類するための画像グループ特徴情報を算出する画像グループ特徴算出ステップとを備え、
前記顔特定ステップでは、さらに、画像の面積に対する、特定する顔の領域の面積の比率である面積率を示す顔面積情報を算出し、
前記画像グループ特徴算出ステップでは、前記顔特定ステップにおいて顔面積情報を算出された第1の画像と、前記顔特定ステップにおいて、当該第1の画像の顔面積情報によって示される顔の領域の面積率よりも大きい面積率を示す顔面積情報を算出された第2の画像とについて、当該第1の画像の画像特徴情報の方が、当該第2の画像の画像特徴情報よりも、前記画像グループ特徴情報へ大きく反映されるように、前記画像特徴情報の算出を行い、
前記画像特徴算出ステップでは、前記画像特徴情報の算出を、前記顔特定ステップによって特定された顔の領域の周囲の一定領域に含まれる画素に基づいて算出された画像特徴量から行う
ことを特徴とする画像データ処理方法。 - コンピュータを、画像を分類するための画像特徴情報を算出する画像データ処理装置として機能させるための画像データ処理プログラムであって、
前記コンピュータを、
一画像に含まれる顔の領域を特定する顔特定部と、
一画像の少なくとも一部の画素に基づいて算出される画像特徴量から、当該画像における画像特徴情報を算出する画像特徴算出部と、
一画像グループに属する画像の一部又は全部の2枚以上の画像についての、画像特徴算出部によって算出された画像特徴情報に基づいて、当該画像グループを分類するための画像グループ特徴情報を算出する画像グループ特徴算出部とを備え、
前記顔特定部は、さらに、画像の面積に対する、特定する顔の領域の面積の比率である面積率を示す顔面積情報を算出し、
前記画像グループ特徴算出部は、前記顔特定部によって顔面積情報を算出された第1の画像と、前記顔特定部によって、当該第1の画像の顔面積情報によって示される顔の領域の面積率よりも大きい面積率を示す顔面積情報を算出された第2の画像とについて、当該第1の画像の画像特徴情報の方が、当該第2の画像の画像特徴情報よりも、前記画像グループ特徴情報へ大きく反映されるように、前記画像特徴情報の算出を行い、
前記画像特徴算出部は、前記画像特徴情報の算出を、前記顔特定部によって特定された顔の領域の周囲の一定領域に含まれる画素に基づいて算出された画像特徴量から行うことを特徴とする画像データ処理装置として機能させる
ことを特徴とする画像データ処理プログラム。 - 画像を分類するための画像特徴情報を算出する半導体集積回路であって、
一画像に含まれる顔の領域を特定する顔特定部と、
一画像の少なくとも一部の画素に基づいて算出される画像特徴量から、当該画像における画像特徴情報を算出する画像特徴算出部と、
一画像グループに属する画像の一部又は全部の2枚以上の画像についての、画像特徴算出部によって算出された画像特徴情報に基づいて、当該画像グループを分類するための画像グループ特徴情報を算出する画像グループ特徴算出部とを備え、
前記顔特定部は、さらに、画像の面積に対する、特定する顔の領域の面積の比率である面積率を示す顔面積情報を算出し、
前記画像グループ特徴算出部は、前記顔特定部によって顔面積情報を算出された第1の画像と、前記顔特定部によって、当該第1の画像の顔面積情報によって示される顔の領域の面積率よりも大きい面積率を示す顔面積情報を算出された第2の画像とについて、当該第1の画像の画像特徴情報の方が、当該第2の画像の画像特徴情報よりも、前記画像グループ特徴情報へ大きく反映されるように、前記画像特徴情報の算出を行い、
前記画像特徴算出部は、前記画像特徴情報の算出を、前記顔特定部によって特定された顔の領域の周囲の一定領域に含まれる画素に基づいて算出された画像特徴量から行う
ことを特徴とする半導体集積回路。 - 画像を分類するための画像特徴情報を算出する画像データ処理装置であって、
一画像に含まれる顔の領域を特定する顔特定部と、
一画像の少なくとも一部の画素に基づいて算出される画像特徴量から、当該画像における画像特徴情報を算出する画像特徴算出部と、
一画像グループに属する画像の一部又は全部の2枚以上の画像についての、画像特徴算出部によって算出された画像特徴情報に基づいて、当該画像グループを分類するための画像グループ特徴情報を算出する画像グループ特徴算出部とを備え、
前記顔特定部は、さらに、画像の面積に対する、特定する顔の領域の面積の比率である面積率を示す顔面積情報を算出し、
前記画像グループ特徴算出部は、前記顔特定部によって顔面積情報を算出された第1の画像と、前記顔特定部によって、当該第1の画像の顔面積情報によって示される顔の領域の面積率よりも大きい面積率を示す顔面積情報を算出された第2の画像とについて、当該第1の画像の画像特徴情報の方が、当該第2の画像の画像特徴情報よりも、前記画像グループ特徴情報へ大きく反映されるように、前記画像特徴情報の算出を行い、
前記画像特徴算出部は、前記顔特定部によって特定された顔の領域の周囲の一定領域に含まれる画素に基づいて算出される画像特徴量の方が、当該一定領域に含まれない画素に基づいて算出される画像特徴量よりも、前記画像特徴情報へ大きく反映されるように、前記画像特徴情報の算出を行う
ことを特徴とする画像データ処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012554676A JP5890325B2 (ja) | 2011-01-28 | 2012-01-24 | 画像データ処理装置、方法、プログラム及び集積回路 |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011016483 | 2011-01-28 | ||
JP2011016483 | 2011-01-28 | ||
PCT/JP2012/000410 WO2012102015A1 (ja) | 2011-01-28 | 2012-01-24 | 画像データ処理装置、方法、プログラム及び集積回路 |
JP2012554676A JP5890325B2 (ja) | 2011-01-28 | 2012-01-24 | 画像データ処理装置、方法、プログラム及び集積回路 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2012102015A1 JPWO2012102015A1 (ja) | 2014-06-30 |
JP5890325B2 true JP5890325B2 (ja) | 2016-03-22 |
Family
ID=46580591
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012554676A Active JP5890325B2 (ja) | 2011-01-28 | 2012-01-24 | 画像データ処理装置、方法、プログラム及び集積回路 |
Country Status (4)
Country | Link |
---|---|
US (1) | US8737726B2 (ja) |
JP (1) | JP5890325B2 (ja) |
CN (1) | CN102893304B (ja) |
WO (1) | WO2012102015A1 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8565482B2 (en) * | 2011-02-28 | 2013-10-22 | Seiko Epson Corporation | Local difference pattern based local background modeling for object detection |
JP6212878B2 (ja) * | 2013-02-21 | 2017-10-18 | 株式会社リコー | 画像処理装置、画像処理システム及びプログラム |
US9569440B2 (en) * | 2013-02-22 | 2017-02-14 | Sony Corporation | Method and apparatus for content manipulation |
JP6387700B2 (ja) * | 2014-06-18 | 2018-09-12 | ソニー株式会社 | 情報処理装置、情報処理システム、情報処理装置の制御方法およびプログラム |
US20160110381A1 (en) * | 2014-10-17 | 2016-04-21 | Fuji Xerox Co., Ltd. | Methods and systems for social media-based profiling of entity location by associating entities and venues with geo-tagged short electronic messages |
TWI579718B (zh) * | 2016-06-15 | 2017-04-21 | 陳兆煒 | 圖形資源管理系統及方法與內儲圖形資源管理程式之電腦程式產品 |
KR20180065135A (ko) * | 2016-12-07 | 2018-06-18 | 삼성전자주식회사 | 셀프 구조 분석을 이용한 구조 잡음 감소 방법 및 장치 |
JP7129383B2 (ja) * | 2019-07-03 | 2022-09-01 | 富士フイルム株式会社 | 画像処理装置,画像処理方法,画像処理プログラムおよびそのプログラムを格納した記録媒体 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007317077A (ja) * | 2006-05-29 | 2007-12-06 | Fujifilm Corp | 画像分類装置および方法ならびにプログラム |
JP2010250634A (ja) * | 2009-04-17 | 2010-11-04 | Seiko Epson Corp | 画像サーバー、画像検索システム、画像検索方法およびインデックス作成方法 |
JP2010273328A (ja) * | 2009-04-20 | 2010-12-02 | Fujifilm Corp | 画像処理装置、画像処理方法およびプログラム |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04232774A (ja) | 1990-12-28 | 1992-08-21 | Mitsubishi Paper Mills Ltd | 改ざん防止用感圧記録シート |
JPH04315344A (ja) | 1991-04-15 | 1992-11-06 | Nippon Telegr & Teleph Corp <Ntt> | 符号誤り監視装置 |
US7508961B2 (en) * | 2003-03-12 | 2009-03-24 | Eastman Kodak Company | Method and system for face detection in digital images |
JP4315344B2 (ja) | 2003-11-27 | 2009-08-19 | 富士フイルム株式会社 | 画像編集装置および方法並びにプログラム |
JP2006295890A (ja) * | 2005-03-15 | 2006-10-26 | Fuji Photo Film Co Ltd | アルバム作成装置、アルバム作成方法、及びプログラム |
JP4232774B2 (ja) | 2005-11-02 | 2009-03-04 | ソニー株式会社 | 情報処理装置および方法、並びにプログラム |
JP4466585B2 (ja) * | 2006-02-21 | 2010-05-26 | セイコーエプソン株式会社 | 対象物が表現された画像の数の算出 |
CN101334780A (zh) * | 2007-06-25 | 2008-12-31 | 英特维数位科技股份有限公司 | 人物影像的搜寻方法、系统及存储影像元数据的记录媒体 |
JP5739428B2 (ja) * | 2010-08-04 | 2015-06-24 | パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America | 画像分類装置、方法、プログラム、プログラムを記録する記録媒体及び集積回路 |
-
2012
- 2012-01-24 JP JP2012554676A patent/JP5890325B2/ja active Active
- 2012-01-24 US US13/578,392 patent/US8737726B2/en active Active
- 2012-01-24 WO PCT/JP2012/000410 patent/WO2012102015A1/ja active Application Filing
- 2012-01-24 CN CN201280001015.9A patent/CN102893304B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007317077A (ja) * | 2006-05-29 | 2007-12-06 | Fujifilm Corp | 画像分類装置および方法ならびにプログラム |
JP2010250634A (ja) * | 2009-04-17 | 2010-11-04 | Seiko Epson Corp | 画像サーバー、画像検索システム、画像検索方法およびインデックス作成方法 |
JP2010273328A (ja) * | 2009-04-20 | 2010-12-02 | Fujifilm Corp | 画像処理装置、画像処理方法およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
WO2012102015A1 (ja) | 2012-08-02 |
US20130004064A1 (en) | 2013-01-03 |
CN102893304B (zh) | 2016-02-10 |
US8737726B2 (en) | 2014-05-27 |
JPWO2012102015A1 (ja) | 2014-06-30 |
CN102893304A (zh) | 2013-01-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5890325B2 (ja) | 画像データ処理装置、方法、プログラム及び集積回路 | |
JP5469181B2 (ja) | 画像分類装置、方法、プログラム、プログラムを記録する記録媒体及び集積回路 | |
US9058342B2 (en) | Image classification device, method, program, recording media with program thereon, and integrated circuit | |
US10474931B2 (en) | Image group title assigning device, image grouping device, representative image determination device for image group, image display device, camera, and image display program | |
US7995106B2 (en) | Imaging apparatus with human extraction and voice analysis and control method thereof | |
US8515137B2 (en) | Generating a combined image from multiple images | |
JP5686673B2 (ja) | 画像処理装置、画像処理方法およびプログラム | |
JP4490214B2 (ja) | 電子アルバム表示システム、電子アルバム表示方法、及び電子アルバム表示プログラム | |
JP2005303991A (ja) | 撮像装置、撮像方法、及び撮像プログラム | |
JP2011511358A (ja) | 自動赤目検出 | |
JP4474885B2 (ja) | 画像分類装置及び画像分類プログラム | |
CN112424792A (zh) | 基于美学的肖像图像评估 | |
JP2006081021A (ja) | 電子アルバム表示システム、電子アルバム表示方法、電子アルバム表示プログラム、画像分類装置、画像分類方法、及び画像分類プログラム | |
JP2006079460A (ja) | 電子アルバム表示システム、電子アルバム表示方法、電子アルバム表示プログラム、画像分類装置、画像分類方法、及び画像分類プログラム | |
JP5381498B2 (ja) | 画像処理装置、画像処理プログラムおよび画像処理方法 | |
JP6027745B2 (ja) | 画像処理装置 | |
JP5871293B2 (ja) | 携帯端末及び画像分類方法 | |
JP2013093667A (ja) | 写真画像毎の再生時間を最適化する画像再生装置、プログラム及び方法 | |
JP5683819B2 (ja) | 携帯端末及び画像分類方法 | |
JP2003208615A (ja) | 画像処理装置、及びプログラム | |
JP2016048586A (ja) | 携帯端末及び画像分類方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20140606 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20140606 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140718 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150929 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20151016 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20151221 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160126 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160218 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5890325 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |