JP5848336B2 - 画像処理装置 - Google Patents
画像処理装置 Download PDFInfo
- Publication number
- JP5848336B2 JP5848336B2 JP2013511884A JP2013511884A JP5848336B2 JP 5848336 B2 JP5848336 B2 JP 5848336B2 JP 2013511884 A JP2013511884 A JP 2013511884A JP 2013511884 A JP2013511884 A JP 2013511884A JP 5848336 B2 JP5848336 B2 JP 5848336B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- subject
- shooting
- information
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/70—Labelling scene content, e.g. deriving syntactic or semantic representations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/51—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
- H04N5/765—Interface circuits between an apparatus for recording and another apparatus
- H04N5/77—Interface circuits between an apparatus for recording and another apparatus between a recording apparatus and a television camera
- H04N5/772—Interface circuits between an apparatus for recording and another apparatus between a recording apparatus and a television camera the recording apparatus and the television camera being placed in the same enclosure
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
- H04N5/91—Television signal processing therefor
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N9/00—Details of colour television systems
- H04N9/79—Processing of colour television signals in connection with recording
- H04N9/80—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
- H04N9/82—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only
- H04N9/8205—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
- H04N5/765—Interface circuits between an apparatus for recording and another apparatus
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Library & Information Science (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Processing Or Creating Images (AREA)
- Image Analysis (AREA)
- Television Signal Processing For Recording (AREA)
- Studio Devices (AREA)
Description
以下、図面を参照してこの発明の実施形態について説明する。本実施の形態1は、家庭内等のユーザのローカルな多くの画像や動画データからなる画像群を整理する画像分類装置において、画像群について共通する属性を利用することにより、各画像内に含まれる被写体オブジェクト(物体)を精度良く自動分類する仕組みに関するものである。
図1は、画像分類装置(画像処理装置)1の構成を示すブロック図である。図1において、画像分類装置1は、ローカルデータ蓄積手段11と、画像特徴量算出手段12と、共通属性抽出手段13と、分類手段14と、分類辞書作成手段15と、分類モデル情報蓄積手段16と、画像属性情報蓄積手段17とから構成されている。
ローカルデータ蓄積手段11は、一定の限られたユーザが保有する家庭内等のファイルデータを蓄積する記録媒体である。例えば、家族内の写真画像や動画像データが記憶されている。ローカルデータ蓄積手段は、HDDやDVD等の大容量メディアディスクや半導体メモリ等のストレージデバイス等である。
画像特徴量算出手段12は、画像特徴としてエッジや色やテクスチャ等の画像の基本的な低次特徴量から物体に特異な高次特徴量を算出するものである。
共通属性抽出手段13は、ローカルデータ蓄積手段11に格納されている複数の画像からなる画像群について、1つ以上の共通の属性を抽出するものである。
画像情報抽出手段131は、分類対象となる画像群に含まれる画像それぞれから画像情報であるメタデータ情報やタグ情報を取得する。
撮影ユニット抽出手段132は、画像情報抽出手段131で抽出された画像情報を利用して、ユーザが同じ撮影イベントとして撮影したと考えられる一連の複数の画像を一ユニットとするグループに画像群を分割する。以下において、分割されたグループを撮影ユニットを呼ぶ。
共通属性判定手段133は、撮影ユニット抽出手段132で判定された撮影ユニット単位毎に、当該撮影ユニットに含まれる画像それぞれについて画像情報抽出手段131で抽出された画像情報を用いて、当該撮影ユニットについての共通属性を抽出する。
撮影ユニット抽出手段132で抽出された撮影ユニット毎に共通属性を抽出する具体的な処理内容について説明する。ここでは、短期的(1日)に撮影された画像群から撮影ユニット抽出手段132において抽出された撮影ユニットの一例を図5に示す。
分類手段14は、分類対象とである画像について、当該画像から算出された特徴量と、分類辞書作成手段15で作成された分類辞書で示される1つ以上のモデル情報とを分類器を用いた判定処理を行い、当該画像内に含まれるモデルを判定するものである。
分類モデル情報蓄積手段16は、物体カテゴリ(オブジェクト)毎に、当該オブジェクトに対応するモデル情報を蓄積する記憶媒体である。例えば、画像の特徴量と各特徴量の重要性などの重み付けを行った結果をそのままモデル情報とすること等が考えられる。モデル情報としての画像の特徴量の算出手法は、上述したように、GMMやSVMがある。また、他の手法としては、ADABOOSTがある。これら手法は既知の技術であるので、ここでの説明は省略する。ここで、物体カテゴリ毎の特徴量であるモデル情報を格納するテーブルT10の一例を図7に示す。テーブルT10は、物体カテゴリ名とモデル情報とからなる組を複数記憶するための領域を有している。例えば、物体カテゴリ名が「桜」であれば、桜の画像についての特徴量と対応付けられている。
分類辞書作成手段15は、共通属性抽出手段13で抽出された共通属性に基づいて、複数のイベントのうち1つの候補イベントを特定し、特定した候補イベントに含まれるイベント関連物体に関連する1つ以上の物体カテゴリからなる分類辞書を作成するものである。
画像属性情報蓄積手段17は、分類手段14で分類判定された結果の情報である分類モデルの判別結果及びその判別信頼度としての尤度等を蓄積する記憶媒体である。
ここでは、画像分類装置1の動作について、説明する。
画像分類装置1は、ユーザにより分類対象の画像群が選択される、又は自動的に分類可能な全ローカルデータや一定の画像数や動画数に達した場合に、画像内の被写体オブジェクトに対する分類処理を開始する。分類処理が開始されると、分類対象の画像群から共通属性を抽出し、抽出した共通属性に基づいて分類辞書を作成して、画像群に含まれる各画像内の被写体オブジェクトの分類を行う。
ここでは、図13に示すステップS4における分類辞書を作成する処理について、図14に示す流れ図を用いて説明する。
以上のように、実施の形態1における画像分類装置1は、従来のように一般的なオブジェクト全てを対象に画像内特徴量を中心に利用して分類するのではなく、ユーザが保有する画像群内の共通属性により分類に用いるモデル情報を限定して分類処理を行う。そのため、ユーザが保有する画像や動画像に対して精度よく分類を行うことが可能となり、ユーザが保有する画像や動画像に対して自動的にタグ付けし自動整理することやユーザが所望する画像を効率的に探す事ができる。
以下、図面を参照して本発明に係る実施の形態2について説明する。本実施の形態2は、家庭内等のユーザのローカルな多くの画像や動画データからなる画像群を整理する画像分類装置において、共通属性を利用すると共に分類結果を用いて再帰的に分類処理を行うことで、各画像内に含まれる被写体オブジェクトを精度良く自動分類する仕組みに関するものである。なお、本実施の形態2において、実施の形態1と同じ機能を有する構成には同じ符号を付し、その説明が適用できるため説明を省略する。
図15は、本実施の形態2に係る画像分類装置1000の構成を示すブロック図である。図15において、画像分類装置1000は、ローカルデータ蓄積手段11と、画像特徴量算出手段12と、共通属性抽出手段13と、分類手段1400と、分類辞書作成手段1500と、分類モデル情報蓄積手段16と、画像属性情報蓄積手段17とから構成されている。
分類手段1400は、上記実施の形態1で示す分類手段14と同様の機能に加えて、以下の機能を有する。
分類辞書作成手段1500は、上記実施の形態1で示す分類辞書作成手段15と同様の機能に加えて、以下の機能を有する。
ここでは、画像分類装置1000の動作について、図16に示す流れ図を用いて説明する。
ここでは、再帰的に分類辞書を作成する別の実施形態について説明する。
図17は、本変形例に係る画像分類装置1000Aの構成を示すブロック図である。図17において、画像分類装置1000Aは、ローカルデータ蓄積手段11と、画像特徴量算出手段12と、共通属性抽出手段13と、分類手段1400Aと、分類辞書作成手段1500Aと、分類モデル情報蓄積手段16と、画像属性情報蓄積手段17と、軸オブジェクト抽出手段1800とから構成されている。
軸オブジェクト抽出手段1800は、分類手段1400Aによって分類された結果、信頼度の高い軸となる物体カテゴリを抽出するものである。
例えば、分類手段1400Aは、分類対象となる複数の物体カテゴリのうち何れかの物体カテゴリが存在すると判断された画像が20枚あり、そのうち一の物体カテゴリ(例えば、「桜」)について18枚検出される様な場合には、一の物体カテゴリに偏っていると判断し、軸オブジェクトとして偏っている当該一の物体カテゴリ(「桜」)を特定する。
分類辞書作成手段1500Aは、上記分類辞書作成手段1500と同様の機能に加えて、以下の機能を有する。
分類手段1400Aは、上記分類手段1400と同様の機能に加えて、分類辞書作成手段1500が軸オブジェクトに基づいて作成した分類辞書を用いた分類を行う。
ここでは、画像分類装置1000Aの動作、特に軸オブジェクトを用いた分類について、図18に示す流れ図を用いて説明する。
以上のように、画像分類装置1000及び画像分類装置1000Aは、一般的なオブジェクト全てを対象に分類処理をするのではなく、ユーザが保有する画像群から抽出される共通属性及び再帰的に物体カテゴリを限定して分類処理を行うため、ユーザが保有する画像や動画像に対してより精度よく分類を行うことが可能となり、ユーザが保有する画像や動画像に対して自動的にタグ付けし自動整理することやユーザが所望する画像を効率的に探す事ができる。
以下、図面を参照して本発明に係る実施の形態3について説明する。本実施の形態3は、家庭内等のユーザのローカルな多くの画像や動画データからなる画像群を整理する画像分類装置において、分類対象となる画像について当該画像から得られる領域情報を用いて共通情報を取得し、分類を行うことで、各画像内の領域別に含まれる被写体オブジェクトを精度良く自動分類する仕組みに関するものである。ここで、領域情報とは、例えば、人物の顔が検出された顔検出領域や、人体が検出された人体検出領域や、検出された人体検出領域について手足周辺領域等を含めた人物周辺領域や、これら領域以外の領域である背景検出領域をいう。なお、本実施の形態3において、実施の形態1、又は実施の形態2と同じ機能を有する構成には同じ符号を付し、その説明が適用できるため説明を省略する。
図19は本実施の形態3における画像分類装置2000の構成を示すブロック図である。図19において、画像分類装置2000は、ローカルデータ蓄積手段11と、画像特徴量算出手段12と、共通属性抽出手段13と、分類手段14と、分類辞書作成手段15と、分類モデル情報蓄積手段16と、画像属性情報蓄積手段17と、領域情報算出手段2800とから構成されている。
領域情報算出手段2800は、ローカルデータ蓄積手段11の分類対象である画像群の各画像に対して画像内に含まれる特定の領域情報を算出する。
ここでは、画像分類装置2000の動作について、図21に示す流れ図を用いて説明する。
上記実施の形態3においては、画像特徴量を抽出する前に、領域情報を算出したが、これに限定されない。画像特徴量を抽出した後に、領域情報を抽出してもよい。
この場合における画像分類装置2000Aの構成を図22に示す。
領域情報算出手段2800Aは、ローカルデータ蓄積手段11の分類対象である画像群の各画像に対して、画像特徴量算出手段12で算出された各特徴量を用いて領域情報を算出する。
分類手段2400Aは、図22に示すように、服装/帽子分類部2411、季節もの分類部2412、場所もの分類部2413、一般もの分類部2414を有している。
画像分類装置2000Aの動作は、図21に示すステップS41とステップS42とを入れ替えることで実現できるので、ここでの説明は省略する。
以上のように、一般的なオブジェクト全てを対象に分類処理をするのではなく、ユーザが保有する画像群から抽出される共通属性を用いて画像内の一定領域別に分類に用いるモデル情報を限定して分類処理を行うため、ユーザが保有する画像や動画像に対してより精度よく分類することが可能となり、ユーザの保有する画像や動画像に対して自動的にタグ付けし自動整理することやユーザの所望画像を効率的に探す事ができる。
以下、図面を参照して本発明に係る実施の形態4について説明する。本実施の形態4は、家庭内等のユーザのローカルな多くの画像や動画データからなる画像群を整理する画像分類装置において、ユーザが分類したい対象を登録した際にその分類対象に関連する共通属性を併せて登録しておくことで、新しく登録された分類対象であっても予め登録した共通属性を利用して各画像内に含まれる被写体オブジェクトを精度良く自動分類する仕組みに関するものである。なお、本実施の形態において、実施の形態1、2、3と同じ機能を有する構成には同じ符号を付し、その説明が適用できるため説明を省略する。
図23は、本実施の形態4における画像分類装置3000の構成を示すブロック図である。図23において、画像分類装置3000は、ローカルデータ蓄積手段11と、画像特徴量算出手段12と、共通属性抽出手段13と、分類手段14と、分類辞書作成手段3815と、分類モデル情報蓄積手段16と、画像属性情報蓄積手段17と、入力手段3800と、登録手段3801とから構成されている。ローカルデータ蓄積手段11と、画像特徴量算出手段12と、共通属性抽出手段13と、分類手段14と、分類モデル情報蓄積手段16と、画像属性情報蓄積手段17については、実施の形態1と同様であるので、ここでの説明は省略する。
入力手段3800は、ローカルデータ蓄積手段11に蓄積されているローカルデータに対して行われる登録処理のためのユーザ操作の入力を受け付ける。
登録手段3801は、入力手段3800の入力に基づいて、タグ付け処理や登録処理を行う。
分類辞書作成手段3815は、実施の形態1で示す機能に加えて、以下の機能を有する。
ここでは、登録手段3801が行う動作について、図24に示す流れ図を用いて説明する。なお、画像群に対する分類処理については、実施の形態1で示す処理(図13、14参照)と同様であるので、ここでの説明は省略する。
以上により、登録する物体カテゴリに属する共通属性として予め対応付けて登録しておく事で、新しい画像群に対する分類処理時または既に蓄積されている画像群に対する再分類処理時に、対応付けされた共通属性に基づいて制限される物体カテゴリを分類対象として用いることができるため、よりユーザの意図に則した画像分類処理を行うことが可能となる。
以下、図面を参照して本発明に係る実施の形態5について説明する。実施の形態1では、1つの装置内にて全ての構成要素を含むものとしたが、本実施の形態5では、構成要素の一部をネットワークを介して接続された外部の装置が有するものとしている。なお、本実施の形態5において、実施の形態1と同じ機能を有する構成には同じ符号を付し、その説明が適用できるため説明を省略する。
画像分類システム4000は、図25に示すように、画像分類装置4100とサーバ装置4500とから構成されており、画像分類装置4100とサーバ装置4500とは、インターネット等のネットワーク4001を介して接続されている。
画像分類装置4100は、図26に示すように、ローカルデータ蓄積手段11と、画像特徴量算出手段12と、共通属性抽出手段13と、分類手段14と、画像属性情報蓄積手段17と、分類辞書作成手段4115と、イベント関連情報蓄積手段4116と送受信手段4110とから構成されている。
イベント関連情報蓄積手段4116は、実施の形態1で示す基本イベントオブジェクト表T20、属性情報テーブルT30及びイベント情報テーブルT40を蓄積している。
分類辞書作成手段4115は、実施の形態1で示す分類辞書作成手段15と同様に、特定した候補イベントを特徴付ける関連イベント物体のうち、優先度が所定の閾値以上であり、互いに異なる類似属性となる1つ以上の関連イベント物体(物体カテゴリ)からなる分類辞書を作成する。
送受信手段4110は、分類辞書作成手段4115から要求情報を受け取ると、ネットワーク4001を介してサーバ装置4500へ受け取った要求情報を送信する。
サーバ装置4500は、図27に示すように、モデル情報蓄積手段4510、制御手段4511及び送受信手段4512から構成されている。
モデル情報蓄積手段4510は、実施の形態1に示す物体カテゴリ毎の特徴量であるモデル情報を格納しているテーブルT10を蓄積している。
制御手段4511は、送受信手段4512を介して画像分類装置4100から要求情報を受け取る。
送受信手段4512は、ネットワーク4001を介して画像分類装置4100から要求情報を受信すると、受信した要求情報を制御手段4511へ出力する。
ここでは、画像分類システム4000の動作として、画像分類装置4100及びサーバ装置4500それぞれの動作について説明する。
画像分類装置4100の動作について、図13に示す流れ図を用いて、実施の形態1と本実施の形態5との差異についてのみ説明する。
サーバ装置4500の動作について、図28に示す流れ図を用いて説明する。
上記実施の形態5では、モデル情報を外部の装置(サーバ装置4500)に蓄積する画像分類システム4000について、説明したが、システムの構成はこれに限られない。
画像分類システム4000Aは、図29に示すように、画像分類装置4100Aと端末装置4600とから構成されており、画像分類装置4100Aと端末装置4600とは、インターネット等のネットワーク4001を介して接続されている。
画像分類装置4100Aは、図26に示すように、画像特徴量算出手段12と、共通属性抽出手段13と、分類手段14と、分類辞書作成手段15と、分類モデル情報蓄積手段16と、画像属性情報蓄積手段17と受信手段4150とから構成されている。
端末装置4600は、図31に示すように、データ蓄積手段4610と、制御手段4611と、送信手段4612とから構成されている。
ここでは、画像分類システム4000Aの動作、特に画像分類装置4100Aの動作について、実施の形態1と異なる点を説明する。
本変形例では、端末装置4600は、画像群を蓄積でき、ネットワーク接続できる装置であればよく、例えば、パーソナルコンピュータや、デジタルカメラ、デジタルビデオカメラ等である。
以上、各実施の形態に基づいて説明したが、本発明は上記の実施の形態に限られない。例えば、以下のような変形例が考えられる。
(1)本発明の一実施態様である、画像処理装置は、複数のイベント毎に、当該イベントに係る画像を撮影する際に満たされることが推定される撮影条件を示す撮影属性を対応付けて記憶する属性記憶手段と、複数のイベント毎に、当該イベントについて撮影された画像に含まれ得る被写体を予め記憶する被写体情報記憶手段と、撮影された複数の画像からなる画像群について、前記複数の画像それぞれに対応する撮影に係る情報に基づいて、所定数の画像に共通する撮影属性を抽出する抽出手段と、抽出された撮影属性に対応付けられたイベントについて、前記被写体情報記憶手段に記憶されている被写体を特定する特定手段と、前記画像群に含まれる前記複数の画像それぞれについて、当該画像が前記特定手段で特定された被写体を含む場合には当該被写体との対応付けを行う対応付手段とを備えることを特徴とする。
11 ローカルデータ蓄積手段
12 画像特徴量算出手段
13 共通属性抽出手段
14、1400、2400 分類手段
15、1500、3815、4115 分類辞書作成手段
16 分類モデル情報蓄積手段
17 画像属性情報蓄積手段
131 画像情報抽出手段
132 撮影ユニット抽出手段
133 共通属性判定手段
1800 軸オブジェクト抽出手段
2800 領域情報算出手段
3800 入力手段
3801 登録手段
3815 分類辞書作成手段
4000 画像分類システム
4110、4512 送受信手段
4116 イベント関連情報蓄積手段
4150 受信手段
4500 サーバ装置
4510 モデル情報蓄積手段
4511、4611 制御手段
4600 端末装置
4610 データ蓄積手段
4612 送信手段
Claims (24)
- 複数のイベント毎に、当該イベントに係る画像を撮影する際に満たされることが推定される撮影条件を示す撮影属性を対応付けて記憶する属性記憶手段と、
複数のイベント毎に、当該イベントについて撮影された画像に含まれ得る被写体を記憶する被写体情報記憶手段と、
撮影された複数の画像からなる画像群について、前記複数の画像それぞれに対応する撮影に係る情報に基づいて、所定数の画像に共通する撮影属性を抽出する抽出手段と、
抽出された撮影属性に対応付けられたイベントについて、前記被写体情報記憶手段に記憶されている被写体を特定する特定手段と、
前記画像群に含まれる前記複数の画像それぞれについて、当該画像が前記特定手段で特定された被写体を含む場合には当該被写体との対応付けを行う対応付手段とを備える
ことを特徴とする画像処理装置。 - 前記抽出手段は、
前記画像群を当該画像群に含まれる前記複数の画像それぞれに対応する撮影に係る情報に基づいて1以上の画像集合に分割し、分割した画像集合毎に、1以上の前記撮影属性を抽出する
ことを特徴とする請求項1に記載の画像処理装置。 - 前記撮影に係る情報は、画像撮影時の時間を示す時間情報、場所を示す場所情報、被写体である人物の人物情報、撮影方法を示す撮影情報及び撮影時の環境を示す環境情報のうち、少なくとも1つの情報を含むものである
ことを特徴とする請求項2に記載の画像処理装置。 - 前記抽出手段は、
前記分割に用いる各情報間の類似度を算出し、算出した類似度を用いて類似する各画像を含むよう前記分割を行う
ことを特徴とする請求項3に記載の画像処理装置。 - 前記抽出手段は、
前記属性に含まれる各情報のうち、少なくとも1の情報を用いて取得される統計量情報を前記撮影属性とする
ことを特徴とする請求項3に記載の画像処理装置。 - 前記抽出手段は、前記画像集合毎に、当該画像集合における1つ以上の人物情報から一の人物の家族が特定される場合には当該家族を示す家族構成情報を前記統計量情報として、又は当該画像集合における1つ以上の人物情報それぞれから得られる人物の性別若しくは年齢の分布を示す人物被写体情報を前記統計量情報として取得する
ことを特徴とする請求項5に記載の画像処理装置。 - 前記家族構成情報、又は前記被写体情報には、時間経過による顔や体の変化度合いとしての経年変化性を示す時間変遷情報が含まれる
ことを特徴とする請求項6に記載の画像処理装置。 - 前記イベントには、複数の被写体が対応付けられており、
前記撮影属性と、イベントについて撮影された画像に含まれ得る被写体とを対応付けることで、前記撮影属性とイベントとの対応付けがなされており、
前記特定手段は、
前記撮影属性それぞれについて、当該撮影属性に対応する被写体について優先度を計上し、前記複数のイベントのうち、被写体に対する優先度の合計が最も高いイベントを候補イベントとして特定し、特定した前記候補イベントに関連する複数のオブジェクトのうち、所定の値以上の優先度を有する被写体を特定する
ことを特徴とする請求項2に記載の画像処理装置。 - 撮影属性毎に当該撮影属性に応じた優先度が割り当てられており、
前記特定手段は、
前記撮影属性それぞれについて、当該撮影属性に対応する被写体について当該撮影属性に割り当てられた優先度を計上する
ことを特徴とする請求項8に記載の画像処理装置。 - 複数の被写体について類似する被写体の集合毎に、当該集合を識別する類似識別情報が対応付けられており、
前記特定手段は、
前記類似する被写体の集合毎に、所定の値以上の優先度のうち最も高い優先度を有する被写体を特定する
ことを特徴とする請求項8に記載の画像処理装置。 - 前記対応付手段は、
前記分類の結果により再度の分類が必要であるか否かを判断し、
前記特定手段は、
再度の分類が必要であると判断される場合に、当該分類に用いた前記被写体からなる集合を含まない他の集合、前記被写体を全て含む集合、又は前記被写体からなる集合の一部を含む他の集合を特定する
ことを特徴とする請求項8に記載の画像処理装置。 - 前記対応付手段は、
分類結果により、一の被写体に分類される画像の枚数が所定数以上である場合には、再度の分類が必要であると判断し、
前記特定手段は、前記一の被写体を含む他のイベントを特定し、特定した他のイベントについて対応する複数の被写体のうち、前記所定の値以上の優先度を有する被写体を特定する
ことを特徴とする請求項11に記載の画像処理装置。 - 被写体毎に撮影の難易度に応じた値が割り当てられており、
前記特定手段は、
前記撮影属性それぞれについて、当該撮影属性に対応する被写体について当該被写体に割り当てられた難易度に応じた値を優先度として計上する
ことを特徴とする請求項8に記載の画像処理装置。 - 前記画像処理装置は、さらに、
前記抽出手段による前記抽出に先立って、前記画像群に含まれる前記複数の画像それぞれについて、当該画像内の構成に応じて、複数の領域に分割する領域分割手段を備え、
前記抽出手段は、分割した領域毎に1以上の撮影属性を抽出する
ことを特徴とする請求項1に記載の画像処理装置。 - 前記領域分割手段は、
画像内における人物の領域とその他の領域とに分割する
ことを特徴とする請求項14に記載の画像処理装置。 - 前記画像処理装置は、さらに、
ユーザから、同一イベントに属する一の画像群について被写体の抽出指示を受け付ける受付手段と、
前記抽出指示が受け付けられると、前記一の画像群から前記一の画像群が属するイベントにおける被写体を抽出し、抽出した被写体を前記一の画像群が属するイベントと対応付け、前記被写体情報記憶手段に登録する登録手段とを備える
ことを特徴とする請求項1に記載の画像処理装置。 - 前記登録手段は、
前記一の画像群から撮影属性を抽出し、抽出した撮影属性を、前記一の画像群が属するイベントと対応付ける
ことを特徴とする請求項16に記載の画像処理装置。 - 前記画像処理装置は、さらに、
前記特定手段で特定された被写体に対応付けられ、当該被写体の特徴量からなるモデル情報を外部の装置からネットワークを介して取得する取得手段を備え、
前記対応付手段は、
前記複数の画像それぞれに対して、当該画像の特徴量とから前記取得手段で取得したモデル情報が示す特徴量とから当該画像に前記特定手段で特定された被写体が含まれるか否かを判定する
ことを特徴とする請求項1に記載の画像処理装置。 - 前記画像処理装置は、さらに、
前記画像群を、外部の装置からネットワークを介して取得する取得手段を備える
ことを特徴とする請求項1に記載の画像処理装置。 - 複数のイベント毎に、当該イベントに係る画像を撮影する際に満たされることが推定される撮影条件を示す撮影属性を対応付けて記憶する属性記憶手段と、複数のイベント毎に、当該イベントについて撮影された画像に含まれ得る被写体を予め記憶する被写体情報記憶手段と、抽出手段と、特定手段と対応付手段とを備える画像処理装置で用いられる処理方法であって、
前記抽出手段が、撮影された複数の画像からなる画像群について、前記複数の画像それぞれに対応する撮影に係る情報に基づいて、所定数の画像に共通する撮影属性を抽出する抽出ステップと、
前記特定手段が、抽出された撮影属性に対応付けられたイベントについて、前記被写体情報記憶手段に記憶されている被写体を特定する特定ステップと、
前記対応付手段が、前記画像群に含まれる前記複数の画像それぞれについて、当該画像が前記特定手段で特定された被写体を含む場合には当該被写体との対応付けを行う対応付ステップとを含む
ことを特徴とする処理方法。 - 複数のイベント毎に、当該イベントに係る画像を撮影する際に満たされることが推定される撮影条件を示す撮影属性を対応付けて記憶する属性記憶手段と、複数のイベント毎に、当該イベントについて撮影された画像に含まれ得る被写体を予め記憶する被写体情報記憶手段と、抽出手段と、特定手段と対応付手段とを備える画像処理装置で用いられるコンピュータプログラムであって、
前記抽出手段に、撮影された複数の画像からなる画像群について、前記複数の画像それぞれに対応する撮影に係る情報に基づいて、所定数の画像に共通する撮影属性を抽出する抽出ステップと、
前記特定手段に、抽出された撮影属性に対応付けられたイベントについて、前記被写体情報記憶手段に記憶されている被写体を特定する特定ステップと、
前記対応付手段に、前記画像群に含まれる前記複数の画像それぞれについて、当該画像が前記特定手段で特定された被写体を含む場合には当該被写体との対応付けを行う対応付ステップとを実行させる
ことを特徴とするコンピュータプログラム。 - 画像処理装置に用いられる集積回路であって、
複数のイベント毎に、当該イベントに係る画像を撮影する際に満たされることが推定される撮影条件を示す撮影属性を対応付けて記憶する属性記憶手段と、
複数のイベント毎に、当該イベントについて撮影された画像に含まれ得る被写体を予め記憶する被写体情報記憶手段と、
撮影された複数の画像からなる画像群について、前記複数の画像それぞれに対応する撮影に係る情報に基づいて、所定数の画像に共通する撮影属性を抽出する抽出手段と、
抽出された撮影属性に対応付けられたイベントについて、前記被写体情報記憶手段に記憶されている被写体を特定する特定手段と、
前記画像群に含まれる前記複数の画像それぞれについて、当該画像が前記特定手段で特定された被写体を含む場合には当該被写体との対応付けを行う対応付手段とを備える
ことを特徴とする集積回路。 - 画像処理装置と、当該画像処理装置とネットワークを介して接続されたサーバ装置とからなる画像処理システムであって、
前記画像処理装置は、
複数のイベント毎に、当該イベントに係る画像を撮影する際に満たされることが推定される撮影条件を示す撮影属性を対応付けて記憶する属性記憶手段と、
複数のイベント毎に、当該イベントについて撮影された画像に含まれ得る被写体を記憶する被写体情報記憶手段と、
撮影された複数の画像からなる画像群について、前記複数の画像それぞれに対応する撮影に係る情報に基づいて、所定数の画像に共通する撮影属性を抽出する抽出手段と、
抽出された撮影属性に対応付けられたイベントについて、前記被写体情報記憶手段に記憶されている被写体を特定する特定手段と、
前記特定手段で特定された被写体に対応付けられ、当該被写体の特徴量からなるモデル情報を前記サーバ装置から前記ネットワークを介して取得する取得手段と、
前記画像群に含まれる前記複数の画像それぞれについて、当該画像の特徴量とから前記取得手段で取得したモデル情報が示す特徴量とから当該画像に前記特定手段で特定された被写体が含まれるか否かを判定し、当該画像が当該被写体を含むと判定する場合には当該画像と当該被写体との対応付けを行う対応付手段とを備え、
前記サーバ装置は、
前記被写体情報記憶手段で記憶されるべき被写体それぞれについて、当該被写体の特徴量からなるモデル情報を当該被写体と対応付けて記憶しているモデル情報記憶手段と、
前記画像処理装置で特定された被写体に対応するモデル情報を前記ネットワークを介して前記画像処理装置へ送信する送信手段とを備える
ことを特徴とする画像処理システム。 - 画像処理装置と、当該画像処理装置とネットワークを介して接続された端末装置とからなる画像処理システムであって、
前記端末装置は、
撮影された複数の画像からなる画像群を記憶している画像記憶手段と、
前記画像群を前記ネットワークを介して前記画像処理装置へ送信する送信手段とを備え、
前記画像処理装置は、
複数のイベント毎に、当該イベントに係る画像を撮影する際に満たされることが推定される撮影条件を示す撮影属性を対応付けて記憶する属性記憶手段と、
複数のイベント毎に、当該イベントについて撮影された画像に含まれ得る被写体を記憶する被写体情報記憶手段と、
前記画像群を前記ネットワークを介して前記端末装置から取得する取得手段と、
前記取得手段で取得した前記画像群について、前記複数の画像それぞれに対応する撮影に係る情報に基づいて、所定数の画像に共通する撮影属性を抽出する抽出手段と、
抽出された撮影属性に対応付けられたイベントについて、前記被写体情報記憶手段に記憶されている被写体を特定する特定手段と、
前記画像群に含まれる前記複数の画像それぞれについて、当該画像が前記特定手段で特定された被写体を含む場合には当該被写体との対応付けを行う対応付手段とを備える
ことを特徴とする画像処理システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013511884A JP5848336B2 (ja) | 2011-04-25 | 2012-02-29 | 画像処理装置 |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011097669 | 2011-04-25 | ||
JP2011097669 | 2011-04-25 | ||
PCT/JP2012/001392 WO2012147256A1 (ja) | 2011-04-25 | 2012-02-29 | 画像処理装置 |
JP2013511884A JP5848336B2 (ja) | 2011-04-25 | 2012-02-29 | 画像処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2012147256A1 JPWO2012147256A1 (ja) | 2014-07-28 |
JP5848336B2 true JP5848336B2 (ja) | 2016-01-27 |
Family
ID=47071792
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013511884A Active JP5848336B2 (ja) | 2011-04-25 | 2012-02-29 | 画像処理装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US9008438B2 (ja) |
JP (1) | JP5848336B2 (ja) |
CN (1) | CN102959551B (ja) |
WO (1) | WO2012147256A1 (ja) |
Families Citing this family (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102013583B1 (ko) * | 2012-11-13 | 2019-08-23 | 에스케이하이닉스 주식회사 | 반도체 시스템 |
JP6025522B2 (ja) * | 2012-11-27 | 2016-11-16 | キヤノン株式会社 | 画像処理装置、画像処理方法、画像処理システム及びプログラム |
JP5859471B2 (ja) * | 2013-03-19 | 2016-02-10 | 富士フイルム株式会社 | 電子アルバム作成装置および電子アルバムの製造方法 |
KR20150007723A (ko) * | 2013-07-12 | 2015-01-21 | 삼성전자주식회사 | 복수의 오브젝트들 사이에 공통된 오브젝트 속성에 대응하는 작업을 수행하는 전자 장치 제어 방법 |
KR20150100113A (ko) * | 2014-02-24 | 2015-09-02 | 삼성전자주식회사 | 영상 처리 장치 및 이의 영상 처리 방법 |
JP6338437B2 (ja) * | 2014-04-30 | 2018-06-06 | キヤノン株式会社 | 画像処理装置、画像処理方法及びプログラム |
WO2016069496A1 (en) * | 2014-10-26 | 2016-05-06 | Galileo Group, Inc. | Swarm approach to consolidating and enhancing smartphone target imagery by virtually linking smartphone camera collectors across space and time using machine-to-machine networks |
US10049273B2 (en) * | 2015-02-24 | 2018-08-14 | Kabushiki Kaisha Toshiba | Image recognition apparatus, image recognition system, and image recognition method |
US10255703B2 (en) | 2015-12-18 | 2019-04-09 | Ebay Inc. | Original image generation system |
US10902043B2 (en) | 2016-01-03 | 2021-01-26 | Gracenote, Inc. | Responding to remote media classification queries using classifier models and context parameters |
TWI579718B (zh) * | 2016-06-15 | 2017-04-21 | 陳兆煒 | 圖形資源管理系統及方法與內儲圖形資源管理程式之電腦程式產品 |
CN106485199A (zh) * | 2016-09-05 | 2017-03-08 | 华为技术有限公司 | 一种车身颜色识别的方法及装置 |
US11681942B2 (en) | 2016-10-27 | 2023-06-20 | Dropbox, Inc. | Providing intelligent file name suggestions |
US9852377B1 (en) * | 2016-11-10 | 2017-12-26 | Dropbox, Inc. | Providing intelligent storage location suggestions |
US10554909B2 (en) | 2017-01-10 | 2020-02-04 | Galileo Group, Inc. | Systems and methods for spectral imaging with a transmitter using a plurality of light sources |
US10893182B2 (en) | 2017-01-10 | 2021-01-12 | Galileo Group, Inc. | Systems and methods for spectral imaging with compensation functions |
WO2018163906A1 (ja) * | 2017-03-06 | 2018-09-13 | 株式会社ミックウェア | 情報処理装置、情報処理システム及び情報処理プログラム |
JP6785181B2 (ja) | 2017-04-12 | 2020-11-18 | 株式会社日立製作所 | 物体認識装置、物体認識システム、及び物体認識方法 |
JP6869809B2 (ja) * | 2017-05-29 | 2021-05-12 | 株式会社Nttドコモ | 画像推定装置 |
US10970552B2 (en) * | 2017-09-28 | 2021-04-06 | Gopro, Inc. | Scene classification for image processing |
CN108090503B (zh) * | 2017-11-28 | 2021-05-07 | 东软集团股份有限公司 | 多分类器的在线调整方法、装置、存储介质及电子设备 |
JP7143599B2 (ja) * | 2018-03-09 | 2022-09-29 | オムロン株式会社 | メタデータ評価装置、メタデータ評価方法、およびメタデータ評価プログラム |
EP3635513B1 (en) * | 2018-05-04 | 2021-07-07 | Google LLC | Selective detection of visual cues for automated assistants |
CN108848306B (zh) * | 2018-06-25 | 2021-03-02 | Oppo广东移动通信有限公司 | 图像处理方法和装置、电子设备、计算机可读存储介质 |
CN108881740B (zh) * | 2018-06-28 | 2021-03-02 | Oppo广东移动通信有限公司 | 图像方法和装置、电子设备、计算机可读存储介质 |
JP6812387B2 (ja) * | 2018-07-02 | 2021-01-13 | キヤノン株式会社 | 画像処理装置及び画像処理方法、プログラム、記憶媒体 |
KR20200017306A (ko) * | 2018-08-08 | 2020-02-18 | 삼성전자주식회사 | 카테고리에 기반하여 아이템에 관한 정보를 제공하는 전자 장치 |
US11055539B2 (en) * | 2018-09-27 | 2021-07-06 | Ncr Corporation | Image processing for distinguishing individuals in groups |
CN109151320B (zh) * | 2018-09-29 | 2022-04-22 | 联想(北京)有限公司 | 一种目标对象选取方法及装置 |
CN111382296B (zh) * | 2018-12-28 | 2023-05-12 | 深圳云天励飞技术有限公司 | 数据处理方法、装置、终端及存储介质 |
JP7129383B2 (ja) * | 2019-07-03 | 2022-09-01 | 富士フイルム株式会社 | 画像処理装置,画像処理方法,画像処理プログラムおよびそのプログラムを格納した記録媒体 |
CN112069344A (zh) * | 2020-09-03 | 2020-12-11 | Oppo广东移动通信有限公司 | 图片处理方法、装置、电子设备及存储介质 |
WO2022190618A1 (ja) * | 2021-03-09 | 2022-09-15 | 富士フイルム株式会社 | レコメンド情報提示装置、レコメンド情報提示装置の作動方法、レコメンド情報提示装置の作動プログラム |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002010178A (ja) * | 2000-06-19 | 2002-01-11 | Sony Corp | 画像管理システム及び画像管理方法、並びに、記憶媒体 |
JP2003016448A (ja) * | 2001-03-28 | 2003-01-17 | Eastman Kodak Co | 前景/背景セグメント化を用いた画像のイベント・クラスタリング |
JP2006203574A (ja) * | 2005-01-20 | 2006-08-03 | Matsushita Electric Ind Co Ltd | 画像表示装置 |
JP2007213183A (ja) * | 2006-02-08 | 2007-08-23 | Seiko Epson Corp | デジタル画像データの分類装置、デジタル画像データの分類方法およびデジタル画像データの分類プログラム |
WO2011001587A1 (ja) * | 2009-07-01 | 2011-01-06 | 日本電気株式会社 | コンテンツ分類装置、コンテンツ分類方法及びコンテンツ分類プログラム |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030210808A1 (en) * | 2002-05-10 | 2003-11-13 | Eastman Kodak Company | Method and apparatus for organizing and retrieving images containing human faces |
US20050104976A1 (en) * | 2003-11-17 | 2005-05-19 | Kevin Currans | System and method for applying inference information to digital camera metadata to identify digital picture content |
US7756866B2 (en) * | 2005-08-17 | 2010-07-13 | Oracle International Corporation | Method and apparatus for organizing digital images with embedded metadata |
JP2007058532A (ja) * | 2005-08-24 | 2007-03-08 | Sony Corp | 情報処理システム、情報処理装置および方法、プログラム、並びに、記録媒体 |
US20080208791A1 (en) * | 2007-02-27 | 2008-08-28 | Madirakshi Das | Retrieving images based on an example image |
JP4798042B2 (ja) | 2007-03-29 | 2011-10-19 | オムロン株式会社 | 顔検出装置、顔検出方法及び顔検出プログラム |
US8611677B2 (en) * | 2008-11-19 | 2013-12-17 | Intellectual Ventures Fund 83 Llc | Method for event-based semantic classification |
JP5063632B2 (ja) | 2009-03-10 | 2012-10-31 | 株式会社豊田中央研究所 | 学習モデル生成装置、対象物検出システム、及びプログラム |
JP5471749B2 (ja) * | 2010-04-09 | 2014-04-16 | ソニー株式会社 | コンテンツ検索装置および方法、並びにプログラム |
US8655893B2 (en) * | 2010-07-16 | 2014-02-18 | Shutterfly, Inc. | Organizing images captured by multiple image capture devices |
-
2012
- 2012-02-29 CN CN201280001795.7A patent/CN102959551B/zh active Active
- 2012-02-29 JP JP2013511884A patent/JP5848336B2/ja active Active
- 2012-02-29 US US13/805,153 patent/US9008438B2/en active Active
- 2012-02-29 WO PCT/JP2012/001392 patent/WO2012147256A1/ja active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002010178A (ja) * | 2000-06-19 | 2002-01-11 | Sony Corp | 画像管理システム及び画像管理方法、並びに、記憶媒体 |
JP2003016448A (ja) * | 2001-03-28 | 2003-01-17 | Eastman Kodak Co | 前景/背景セグメント化を用いた画像のイベント・クラスタリング |
JP2006203574A (ja) * | 2005-01-20 | 2006-08-03 | Matsushita Electric Ind Co Ltd | 画像表示装置 |
JP2007213183A (ja) * | 2006-02-08 | 2007-08-23 | Seiko Epson Corp | デジタル画像データの分類装置、デジタル画像データの分類方法およびデジタル画像データの分類プログラム |
WO2011001587A1 (ja) * | 2009-07-01 | 2011-01-06 | 日本電気株式会社 | コンテンツ分類装置、コンテンツ分類方法及びコンテンツ分類プログラム |
Also Published As
Publication number | Publication date |
---|---|
WO2012147256A1 (ja) | 2012-11-01 |
CN102959551A (zh) | 2013-03-06 |
CN102959551B (zh) | 2017-02-08 |
JPWO2012147256A1 (ja) | 2014-07-28 |
US20130101223A1 (en) | 2013-04-25 |
US9008438B2 (en) | 2015-04-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5848336B2 (ja) | 画像処理装置 | |
US20120301032A1 (en) | Image classification apparatus, image classification method, program, recording medium, integrated circuit, and model creation apparatus | |
JP6023058B2 (ja) | 画像処理装置、画像処理方法、プログラム、集積回路 | |
KR101417548B1 (ko) | 사진 콜렉션에서 이벤트들을 생성하고 라벨링하는 방법 및 시스템 | |
JP5537557B2 (ja) | 事象毎に意味論的に分類する方法 | |
US8055081B2 (en) | Image classification using capture-location-sequence information | |
US9082013B2 (en) | Image recognition device, image recognition method, program, and integrated circuit | |
US20130111373A1 (en) | Presentation content generation device, presentation content generation method, presentation content generation program, and integrated circuit | |
US20110184953A1 (en) | On-location recommendation for photo composition | |
US20160179846A1 (en) | Method, system, and computer readable medium for grouping and providing collected image content | |
US20140093174A1 (en) | Systems and methods for image management | |
US8320609B2 (en) | Device and method for attaching additional information | |
JP2014093058A (ja) | 画像管理装置、画像管理方法、プログラム及び集積回路 | |
US20070070217A1 (en) | Image analysis apparatus and image analysis program storage medium | |
JP2014092955A (ja) | 類似コンテンツ検索処理装置、類似コンテンツ検索処理方法、およびプログラム | |
US20140233811A1 (en) | Summarizing a photo album | |
US8270731B2 (en) | Image classification using range information | |
US8533196B2 (en) | Information processing device, processing method, computer program, and integrated circuit | |
CN112069342A (zh) | 图像分类方法、装置、电子设备及存储介质 | |
JP2012058926A (ja) | キーワード付与装置及びプログラム | |
WO2014186392A2 (en) | Summarizing a photo album | |
US11210829B2 (en) | Image processing device, image processing method, program, and recording medium | |
JP7485893B2 (ja) | 情報処理装置、制御プログラム、及び制御方法 | |
JP5834950B2 (ja) | 写真系列の類似度算出装置、方法、及びプログラム | |
AU2013254921A1 (en) | Method, apparatus and system for determining a label for a group of individuals represented in images |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20140606 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20141029 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20151104 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20151126 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5848336 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |