WO2012073421A1 - 画像分類装置、画像分類方法、プログラム、記録媒体、集積回路、モデル作成装置 - Google Patents
画像分類装置、画像分類方法、プログラム、記録媒体、集積回路、モデル作成装置 Download PDFInfo
- Publication number
- WO2012073421A1 WO2012073421A1 PCT/JP2011/005639 JP2011005639W WO2012073421A1 WO 2012073421 A1 WO2012073421 A1 WO 2012073421A1 JP 2011005639 W JP2011005639 W JP 2011005639W WO 2012073421 A1 WO2012073421 A1 WO 2012073421A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- image
- feature
- feature amount
- images
- model data
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
Definitions
- the image is tagged with a combination of a predetermined ambiguous keyword and a specific keyword determined by the user.
- An image classification device is an image classification device that classifies images using model data, and includes a receiving unit that receives a selection of an image from a plurality of stored images, and a received image First extracting means for extracting the first feature amount, specifying means for specifying a related image among the plurality of images for each received image, and a second feature amount for each of the specified related images Second extraction means for extracting the image data, and calculation means for calculating a third feature quantity indicating a characteristic specific to the object of the received image based on the extracted locality of the first feature quantity and the second feature quantity.
- Model creating means for creating model data based on the calculated third feature amount; It is characterized by having.
- a flowchart showing details of processing for calculating a characteristic amount specific to the selected image Image center and surrounding image The figure which shows the example of matching with the registration object and related image group in the center of the selection image The figure which shows the example of matching with the background object in the periphery of a selection image, and a related image group
- Example of model data Functional block diagram of image classification apparatus 2 in Embodiment 2
- Flow chart showing standard feature calculation processing Flow chart showing standardity determination processing Table showing standardity information
- Example of UI screen Flow chart showing the modification process of registered model data Schematic diagram of color histogram in image Functional block diagram of the image classification device 4
- Functional block diagram of the model creation device 5 Image diagram that uses region division to calculate features specific to the selected image Figure showing an example of the main area
- a flowchart showing details of processing for calculating a characteristic amount specific to the selected image A diagram showing a cloud-based server, etc.
- an image having a shooting date close to that of the selected image is specified as a related image.
- the model learning unit 30 creates model data using the unique feature amount calculated by the unique feature amount calculation unit 16 and stores the created model data in the model storage unit 32.
- step S22 Since the extraction method and contents are the same as in step S22, description thereof is omitted.
- the target is a user's favorite target, so there is a high possibility that the target image is shot near the center in the image.
- the standard feature calculation unit 60 calculates standard features for all or a specific image group from among the images stored in the local data storage unit 10 and stores the calculation results in the standard feature storage unit 62.
- M M matching or random sampling is performed to obtain N groups, and then N: N matching is performed or a clustering technique such as kmeans is used to group them into P groups.
- feature quantities are represented in multiple dimensions such as “feature quantity 1”, “feature quantity 2”, “feature quantity 3”, etc., and “standardity” is represented for each “feature quantity”. "Is associated.
- the model data is updated by accepting a correction operation from the user, and the registration target
- the present invention relates to a mechanism for accurately classifying an image group including the.
- the user intends to instruct the creation of model data for a pet as a registration target, but in the frame 175a, images showing objects other than pets are also classified.
- the image information that can be extracted from the correction image group and the non-selected image group is used.
- the user can easily modify and register the target that the user wants to classify at any time, and the user can easily search for a group of images including the registration target by subject registration with a higher degree of freedom. Can do.
- a region to be a positive sample / negative sample may be determined using image metadata.
- zoom in may be determined by comparing both the digital zoom ratio included in the metadata and the digital zoom ratio included in the metadata of the image X (the image is taken immediately before the image C).
- An image classification method for classifying images using model data A reception step for receiving image selection from the user from among the plurality of stored images, a first extraction step for extracting a first feature amount of each received image, and the plurality of images for each received image
- An image classification including: a calculation step for calculating a third feature amount indicating a characteristic peculiar to the object of the received image, and a model creation step for generating model data based on the calculated third feature amount
- the image classification device extracts information related to the image group from the user's local data and is standard in the local data even when the image group including the registration target selected by the user is small.
- the image classification device extracts information related to the image group from the user's local data and is standard in the local data even when the image group including the registration target selected by the user is small.
Landscapes
- Engineering & Computer Science (AREA)
- Library & Information Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Processing Or Creating Images (AREA)
Abstract
Description
を備えることを特徴としている。
実施の形態1は、画像や動画データ群を整理する画像分類装置において、ユーザにより選択された画像を基にモデルデータを作成する。そして、この作成に際しては、ユーザにより選択された画像に特有な特徴量を算出し、算出した特有な特徴量をモデルデータの作成に用いる。これにより、ユーザの意向に沿ったモデルデータを作成し、このモデルデータを用いた分類の際にはユーザの満足度の高い分類結果が得られるようにする。
図3(a)(b)は、ユーザがペット(ネコの「タマ」)を含む画像を選択しているUI画面を示すものである。
ここで、具体的な重み付けの計算手法について一例を説明する。
(実施の形態2)
本実施の形態2は、画像分類装置において、ユーザが分類したい対象を含む画像群を選択し登録する際に、ローカルデータ群に標準的に存在する特徴を利用することで登録された対象を含む画像群を精度良く分類する仕組みに関するものである。
本実施の形態3は、画像分類装置において、ユーザが分類したい画像を選択して、選択画像などからモデルデータを作成した際に、ユーザから修正操作を受け付けることによりモデルデータを更新し、登録対象を含む画像群を精度良く分類する仕組みに関するものである。
修正画像群の選択又は登録画像群の再選択後に修正更新処理が開始されると、その選択画像から実施の形態1または2に記載の手法と同様の手法でモデルデータを再生成する。
以上、本実施の形態について説明したが、本発明は上記の内容に限定されず、本発明の目的とそれに関連又は付随する目的を達成するための各種形態においても実施可能であり、例えば、以下であっても構わない。
・"Superpixel: Empirical Studies and Applications", (http://www.cs.washington.edu/homes/xren/research/superpixel,http://www.stat.ucla.edu/~yuille/courses/canton/day5/day5examples/Superpixels.pdf)
・Pedro F. Felzenszwalb and Daniel P. Huttenlocher:"Efficient Graph-Based Image Segmentation", International Journal of Computer Vision, Volume 59, Number 2, September 2004(http://people.cs.uchicago.edu/~pff/segment/ , http://people.cs.uchicago.edu/~pff/papers/seg-ijcv.pdf)
などに詳しい。
本実施の形態は、以下の態様を含むものである。
(1)モデルデータを用いて画像を分類する画像分類装置であって、蓄積された複数の画像の中から、画像の選択をユーザから受け付ける受付手段と、受け付けた画像それぞれの第1特徴量を抽出する第1抽出手段と、前記受け付けた画像毎に、前記複数の画像の中から関連する関連画像を特定する特定手段と、特定された関連画像それぞれの第2特徴量を抽出する第2抽出手段と、抽出された第1特徴量および第2特徴量の局所性に基づいて、受け付けた画像の対象物に特有な特徴を示す第3特徴量を算出する算出手段と、算出された第3特徴量に基づいてモデルデータを作成するモデル作成手段と、を備えることを特徴とする画像分類装置。
(2)前記算出手段は、受け付けた画像毎に、当該画像の前記第1特徴量と当該画像の関連画像の第2特徴量とを照合することにより、前記第3特徴量を算出するとしても構わない。
(3)前記第1抽出手段が抽出する前記第1特徴量および前記第2抽出手段が抽出する前記第2特徴量は、抽出対象とする画像内の複数の領域各々についての特徴量であるとしても構わない。
(4)前記算出手段は、前記照合に際して、
画像内の中央の領域に対応する第1特徴量と第2特徴量とが一致していれば、受け付けた画像の一致点における第1特徴量の重み付けを高くし、画像内の前記中央の領域でない領域に対応する第1特徴量と第2特徴量とが一致していれば、受け付けた画像の不一致点における第1特徴量の重み付けを低くして前記第3特徴量を算出するとしても構わない。
(5)前記局所特徴量は、キーポイント記述子、エッジ特徴量および特定物体認識を示す情報の少なくともひとつを表す量であるとしても構わない。
(6)前記算出手段は、前記受け付けた画像および前記関連画像それぞれに付加されたメタデータに基づいて、受け付けた画像における主エリアを決定し、前記照合に際して、決定された主エリアに対応する第1特徴量と第2特徴量とが一致していれば、受け付けた画像の一致点における第1特徴量の重み付けを高くし、画像内の前記主エリアではない領域に対応する第1特徴量と第2特徴量とが一致していれば、受け付けた画像の不一致点における第1特徴量の重み付けを低くして前記第3特徴量を算出するとしても構わない。
(7)前記局所特徴量は、カラーヒストグラムであり、前記算出手段は、前記照合に先立って、前記受け付けた画像毎に、画像の色分布と当該画像の関連画像の色分布とを比較し、比較の結果、色分布が不一致である関連画像の領域に対応する第2特徴量については、前記照合の対象から除外するとしても構わない。
(8)前記第1抽出手段および前記第2抽出手段は、抽出に先立って、それぞれ前記受け付けた画像および前記関連画像を複数の領域に分割し、分割した領域各々から前記第1特徴量または第2特徴量を抽出し、前記算出手段による前記照合は、分割した領域単位で行うとしても構わない。
(9)前記特定手段は、前記受け付けた画像毎に、同じイベントに属する画像群を前記関連画像として特定するとしても構わない。
(10)前記特定手段は、前記受け付けた画像毎に、同じ撮影パターンに属する画像群を前記関連画像として特定するとしても構わない。
(11)前記複数の画像を構成する画像毎の特徴量を基に、標準的な特徴量を計算する計算手段と、計算された標準的な特徴量を用いて、第1抽出手段により抽出された第1特徴量それぞれの標準性の高低を判定する判定手段とを備え、前記算出手段は、標準性が低い第1特徴量については重み付けを高くし、かつ、標準性が高い第1特徴量については重み付けを低くすることにより前記第3特徴量を算出するとしても構わない。
(12)前記計算手段は、前記全画像毎の特徴量を、分類器を用いて一定の類似性を持つ特徴群に分類し、その特徴群内の特徴量数が一定数または一定頻度以上で存在している特徴量を前記標準的な特徴量とみなすとしても構わない。
(13)前記計算手段は、前記全画像毎の特徴量を、各画像のイベント単位で特徴群に分類し、その特徴群内の特徴量数が一定数または一定頻度以上で存在している特徴量を用いて、前記標準的な特徴量を計算するとしても構わない。
(14)前記イベントとは、非撮影時の時間間隔、一定時間内の撮影頻度、一定時間内の登場人物数、一定時間内の物体数、一定時間内の登場人物、一定時間内の物体の頻度、のうちの少なくとも1つに基づいて規定されたものであるか、撮影時のカメラパラメータ、撮影場所の地理情報、遷移情報、画像の構図情報、画像内における特徴量の出現位置に関する情報、のうちの少なくとも1つに基づいて規定されたものであるとしても構わない。
(15)作成されたモデルデータへの適合性を判定することにより、前記複数の画像を分類する分類手段と、モデルデータの識別子と、当該モデルデータに適合する画像群を表示する表示手段と、表示された画像群について、モデルデータの修正に関する内容を受け付ける修正受付手段とを備え、前記モデル作成手段は、前記受付手段が受け付けた内容に基づき、前記作成したモデルデータを更新するとしても構わない。
(16)モデルデータを用いて画像を分類する画像分類方法であって、
蓄積された複数の画像の中から、画像の選択をユーザから受け付ける受付ステップと、受け付けた画像それぞれの第1特徴量を抽出する第1抽出ステップと、前記受け付けた画像毎に、前記複数の画像の中から関連する関連画像を特定する特定ステップと、特定された関連画像それぞれの第2特徴量を抽出する第2抽出ステップと、抽出された第1特徴量および第2特徴量の局所性に基づいて、受け付けた画像の対象物に特有な特徴を示す第3特徴量を算出する算出ステップと、算出された第3特徴量に基づいてモデルデータを作成するモデル作成ステップと、を含む画像分類方法
(17)画像分類処理を画像分類装置に実行させるプログラムであって、前記画像分類処理は、蓄積された複数の画像の中から、画像の選択をユーザから受け付ける受付ステップと、受け付けた画像それぞれの第1特徴量を抽出する第1抽出ステップと、前記受け付けた画像毎に、前記複数の画像の中から関連する関連画像を特定する特定ステップと、特定された関連画像それぞれの第2特徴量を抽出する第2抽出ステップと、抽出された第1特徴量および第2特徴量の局所性に基づいて、受け付けた画像の対象物に特有な特徴を示す第3特徴量を算出する算出ステップと、算出された第3特徴量に基づいてモデルデータを作成するモデル作成ステップの各ステップを含むことを特徴とするプログラム。
(18)画像分類装置に画像分類処理を実行させるプログラムを記録した記録媒体であって、前記画像分類処理は、蓄積された複数の画像の中から、画像の選択をユーザから受け付ける受付ステップと、受け付けた画像それぞれの第1特徴量を抽出する第1抽出ステップと、前記受け付けた画像毎に、前記複数の画像の中から関連する関連画像を特定する特定ステップと、特定された関連画像それぞれの第2特徴量を抽出する第2抽出ステップと、抽出された第1特徴量および第2特徴量の局所性に基づいて、受け付けた画像の対象物に特有な特徴を示す第3特徴量を算出する算出ステップと、算出された第3特徴量に基づいてモデルデータを作成するモデル作成ステップの各ステップを含むことを特徴とする記録媒体
(19)モデルデータを用いて画像を分類する集積回路であって、蓄積された複数の画像の中から、画像の選択をユーザから受け付ける受付手段と、受け付けた画像それぞれの第1特徴量を抽出する第1抽出手段と、前記受け付けた画像毎に、前記複数の画像の中から関連する関連画像を特定する特定手段と、特定された関連画像それぞれの第2特徴量を抽出する第2抽出手段と、抽出された第1特徴量および第2特徴量の局所性に基づいて、受け付けた画像の対象物に特有な特徴を示す第3特徴量を算出する算出手段と、算出された第3特徴量に基づいてモデルデータを作成するモデル作成手段と、を備えることを特徴とする集積回路
(20)蓄積された複数の画像の中から、画像の選択をユーザから受け付ける受付手段と、受け付けた画像それぞれの第1特徴量を抽出する第1抽出手段と、前記受け付けた画像毎に、前記複数の画像の中から関連する関連画像を特定する特定手段と、特定された関連画像それぞれの第2特徴量を抽出する第2抽出手段と、抽出された第1特徴量および第2特徴量の局所性に基づいて、受け付けた画像に特有な特徴を示す第3特徴量を算出する算出手段と、算出された第3特徴量に基づいてモデルデータを作成するモデル作成手段と、を備えることを特徴とするモデル作成装置。
(21)クラウドベースなサーバにおいて、モデルデータを用いた画像の分類をする画像分類方法であって、サーバにおいて、ユーザ装置から画像を取得する取得ステップと、サーバにおいて、取得した画像を蓄積する蓄積ステップと、サーバにおいて、蓄積された画像の中から、一の画像と前記一の画像に関連する関連画像を特定する特定ステップと、サーバにおいて、前記一の画像の第1特徴量を抽出し、前記関連画像それぞれの第2特徴量を抽出する抽出ステップと、サーバにおいて、抽出された第1特徴量および第2特徴量の局所性に基づいて、受け付けた画像の対象物に特有な特徴を示す第3特徴量を算出する算出ステップと、サーバにおいて、算出された第3特徴量に基づいてモデルデータを作成するモデルステップと、サーバにおいて、蓄積された画像を、作成されたモデルデータを用いて分類する分類ステップとを含むことを特徴とする画像分類方法。
5 モデル作成装置
10 ローカルデータ蓄積部
12 選択受付部
13 修正受付部
14 特徴量情報抽出部(第1抽出部)
16 特有特徴量算出部
22 関連画像特定部
24 特徴量情報抽出部(第2抽出部)
30 モデル学習部
32 モデル蓄積部
34 分類部
36 画像表示部
250 サーバ
Claims (21)
- モデルデータを用いて画像を分類する画像分類装置であって、
蓄積された複数の画像の中から、画像の選択をユーザから受け付ける受付手段と、
受け付けた画像それぞれの第1特徴量を抽出する第1抽出手段と、
前記受け付けた画像毎に、前記複数の画像の中から関連する関連画像を特定する特定手段と、
特定された関連画像それぞれの第2特徴量を抽出する第2抽出手段と、
抽出された第1特徴量およ び第2特徴量の局所性に基づいて、受け付けた画像の対象物に特有な特徴を示す第3特徴量を算出する算出手段と、
算出された第3特徴量に基づいてモデルデータを作成するモデル作成手段と、
を備えることを特徴とする画像分類装置。 - 前記算出手段は、受け付けた画像毎に、当該画像の前記第1特徴量と当該画像の関連画像の第2特徴量とを照合することにより、前記第3特徴量を算出する
ことを特徴とする請求項1に記載の画像分類装置。 - 前記第1抽出手段が抽出する前記第1特徴量および前記第2抽出手段が抽出する前記第2特徴量は、抽出対象とする画像内の複数の領域各々についての特徴量である
ことを特徴とする請求項2に記載の画像分類装置。 - 前記算出手段は、前記照合に際して、
画像内の中央の領域に対応する第1特徴量と第2特徴量とが一致していれば、受け付けた画像の一致点における第1特徴量の重み付けを高くし、
画像内の前記中央の領域でない領域に対応する第1特徴量と第2特徴量とが一致していれば、受け付けた画像の不一致点における第1特徴量の重み付けを低くして前記第3特徴量を算出する
ことを特徴とする請求項3に記載の画像分類装置。 - 前記局所特徴量は、キーポイント記述子、エッジ特徴量および特定物体認識を示す情報の少なくともひとつを表す量である
ことを特徴とする請求項3に記載の画像分類装置。 - 前記算出手段は、前記受け付けた画像および前記関連画像それぞれに付加されたメタデータに基づいて、受け付けた画像における主エリアを決定し、
前記照合に際して、決定された主エリアに対応する第1特徴量と第2特徴量とが一致していれば、受け付けた画像の一致点における第1特徴量の重み付けを高くし、
画像内の前記主エリアではない領域に対応する第1特徴量と第2特徴量とが一致していれば、受け付けた画像の不一致点における第1特徴量の重み付けを低くして前記第3特徴量を算出する
ことを特徴とする請求項3に記載の画像分類装置。 - 前記局所特徴量は、カラーヒストグラムであり、
前記算出手段は、前記照合に先立って、前記受け付けた画像毎に、画像の色分布と当該画像の関連画像の色分布とを比較し、比較の結果、色分布が不一致である関連画像の領域に対応する第2特徴量については、前記照合の対象から除外する
ことを特徴とする請求項3に記載の画像分類装置。 - 前記第1抽出手段および前記第2抽出手段は、抽出に先立って、それぞれ前記受け付けた画像および前記関連画像を複数の領域に分割し、分割した領域各々から前記第1特徴量または第2特徴量を抽出し、
前記算出手段による前記照合は、分割した領域単位で行う
ことを特徴とする請求項2に記載の画像分類装置。 - 前記特定手段は、前記受け付けた画像毎に、同じイベントに属する画像群を前記関連画像として特定する
ことを特徴とする請求項1に記載の画像分類装置。 - 前記特定手段は、前記受け付けた画像毎に、同じ撮影パターンに属する画像群を前記関連画像として特定する
ことを特徴とする請求項1に記載の画像分類装置。 - 前記複数の画像を構成する画像毎の特徴量を基に、標準的な特徴量を計算する計算手段と、
計算された標準的な特徴量を用いて、第1抽出手段により抽出された第1特徴量それぞれの標準性の高低を判定する判定手段とを備え、
前記算出手段は、
標準性が低い第1特徴量については重み付けを高くし、かつ、
標準性が高い第1特徴量については重み付けを低くすることにより前記第3特徴量を算出する
ことを特徴とする請求項1に記載の画像分類装置。 - 前記計算手段は、前記全画像毎の特徴量を、分類器を用いて一定の類似性を持つ特徴群に分類し、その特徴群内の特徴量数が一定数または一定頻度以上で存在している特徴量を前記標準的な特徴量とみなす
ことを特徴とする請求項11に記載の画像分類装置。 - 前記計算手段は、前記全画像毎の特徴量を、各画像のイベント単位で特徴群に分類し、その特徴群内の特徴量数が一定数または一定頻度以上で存在している特徴量を用いて、前記標準的な特徴量を計算する
ことを特徴とする請求項11に記載の画像分類装置。 - 前記イベントとは、
非撮影時の時間間隔、一定時間内の撮影頻度、一定時間内の登場人物数、一定時間内の物体数、一定時間内の登場人物、一定時間内の物体の頻度、のうちの少なくとも1つに基づいて規定されたものであるか、
撮影時のカメラパラメータ、撮影場所の地理情報、遷移情報、画像の構図情報、画像内における特徴量の出現位置に関する情報、のうちの少なくとも1つに基づいて規定されたものである
ことを特徴とする請求項13に記載の画像分類装置。 - 作成されたモデルデータへの適合性を判定することにより、前記複数の画像を分類する分類手段と、
モデルデータの識別子と、当該モデルデータに適合する画像群を表示する表示手段と、
表示された画像群について、モデルデータの修正に関する内容を受け付ける修正受付手段とを備え、
前記モデル作成手段は、前記受付手段が受け付けた内容に基づき、前記作成したモデルデータを更新する
ことを特徴とする請求項1に記載の画像分類装置。 - モデルデータを用いて画像を分類する画像分類方法であって、
蓄積された複数の画像の中から、画像の選択をユーザから受け付ける受付ステップと、
受け付けた画像それぞれの第1特徴量を抽出する第1抽出ステップと、
前記受け付けた画像毎に、前記複数の画像の中から関連する関連画像を特定する特定ステップと、
特定された関連画像それぞれの第2特徴量を抽出する第2抽出ステップと、
抽出された第1特徴量および第2特徴量の局所性に基づいて、受け付けた画像の対象物に特有な特徴を示す第3特徴量を算出する算出ステップと、
算出された第3特徴量に基づいてモデルデータを作成するモデル作成ステップと、
を含む画像分類方法。 - 画像分類処理を画像分類装置に実行させるプログラムであって、
前記画像分類処理は、
蓄積された複数の画像の中から、画像の選択をユーザから受け付ける受付ステップと、
受け付けた画像それぞれの第1特徴量を抽出する第1抽出ステップと、
前記受け付けた画像毎に、前記複数の画像の中から関連する関連画像を特定する特定ステップと、
特定された関連画像それぞれの第2特徴量を抽出する第2抽出ステップと、
抽出された第1特徴量および第2特徴量の局所性に基づいて、受け付けた画像の対象物に特有な特徴を示す第3特徴量を算出する算出ステップと、
算出された第3特徴量に基づいてモデルデータを作成するモデル作成ステップの各ステップを含むことを特徴とするプログラム。 - 画像分類装置に画像分類処理を実行させるプログラムを記録した記録媒体であって、
前記画像分類処理は、
蓄積された複数の画像の中から、画像の選択をユーザから受け付ける受付ステップと、
受け付けた画像それぞれの第1特徴量を抽出する第1抽出ステップと、
前記受け付けた画像毎に、前記複数の画像の中から関連する関連画像を特定する特定ステップと、
特定された関連画像それぞれの第2特徴量を抽出する第2抽出ステップと、
抽出された第1特徴量および第2特徴量の局所性に基づいて、受け付けた画像の対象物に特有な特徴を示す第3特徴量を算出する算出ステップと、
算出された第3特徴量に基づいてモデルデータを作成するモデル作成ステップの各ステップを含むことを特徴とする記録媒体。 - モデルデータを用いて画像を分類する集積回路であって、
蓄積された複数の画像の中から、画像の選択をユーザから受け付ける受付手段と、
受け付けた画像それぞれの第1特徴量を抽出する第1抽出手段と、
前記受け付けた画像毎に、前記複数の画像の中から関連する関連画像を特定する特定手段と、
特定された関連画像それぞれの第2特徴量を抽出する第2抽出手段と、
抽出された第1特徴量および第2特徴量の局所性に基づいて、受け付けた画像の対象物に特有な特徴を示す第3特徴量を算出する算出手段と、
算出された第3特徴量に基づいてモデルデータを作成するモデル作成手段と、
を備えることを特徴とする集積回路。 - 蓄積された複数の画像の中から、画像の選択をユーザから受け付ける受付手段と、
受け付けた画像それぞれの第1特徴量を抽出する第1抽出手段と、
前記受け付けた画像毎に、前記複数の画像の中から関連する関連画像を特定する特定手段と、
特定された関連画像それぞれの第2特徴量を抽出する第2抽出手段と、
抽出された第1特徴量および第2特徴量の局所性に基づいて、受け付けた画像に特有な特徴を示す第3特徴量を算出する算出手段と、
算出された第3特徴量に基づいてモデルデータを作成するモデル作成手段と、
を備えることを特徴とするモデル作成装置。 - クラウドベースなサーバにおいて、モデルデータを用いた画像の分類をする画像分類方法であって、
サーバにおいて、ユーザ装置から画像を取得する取得ステップと、
サーバにおいて、取得した画像を蓄積する蓄積ステップと、
サーバにおいて、蓄積された画像の中から、一の画像と前記一の画像に関連する関連画像を特定する特定ステップと、
サーバにおいて、前記一の画像の第1特徴量を抽出し、前記関連画像それぞれの第2特徴量を抽出する抽出ステップと、
サーバにおいて、抽出された第1特徴量および第2特徴量の局所性に基づいて、受け付けた画像の対象物に特有な特徴を示す第3特徴量を算出する算出ステップと、
サーバにおいて、算出された第3特徴量に基づいてモデルデータを作成するモデルステップと、
サーバにおいて、蓄積された画像を、作成されたモデルデータを用いて分類する分類ステップ
とを含むことを特徴とする画像分類方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201180007696.5A CN102741882B (zh) | 2010-11-29 | 2011-10-06 | 图像分类装置、图像分类方法、集成电路、模型制作装置 |
US13/574,878 US8953895B2 (en) | 2010-11-29 | 2011-10-06 | Image classification apparatus, image classification method, program, recording medium, integrated circuit, and model creation apparatus |
JP2012546673A JP5934653B2 (ja) | 2010-11-29 | 2011-10-06 | 画像分類装置、画像分類方法、プログラム、記録媒体、集積回路、モデル作成装置 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010265625 | 2010-11-29 | ||
JP2010-265625 | 2010-11-29 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2012073421A1 true WO2012073421A1 (ja) | 2012-06-07 |
Family
ID=46171398
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/JP2011/005639 WO2012073421A1 (ja) | 2010-11-29 | 2011-10-06 | 画像分類装置、画像分類方法、プログラム、記録媒体、集積回路、モデル作成装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US8953895B2 (ja) |
JP (1) | JP5934653B2 (ja) |
CN (1) | CN102741882B (ja) |
WO (1) | WO2012073421A1 (ja) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014022837A (ja) * | 2012-07-13 | 2014-02-03 | Nippon Hoso Kyokai <Nhk> | 学習装置、及びプログラム |
WO2016075978A1 (ja) * | 2014-11-12 | 2016-05-19 | ソニー株式会社 | 情報処理装置、情報処理方法およびプログラム |
WO2017060894A1 (en) * | 2015-10-06 | 2017-04-13 | Agent Video Intelligence Ltd. | Method and system for classifying objects from a stream of images |
JP2018005500A (ja) * | 2016-06-30 | 2018-01-11 | オムロン株式会社 | 画像処理システム、画像処理方法、および画像処理プログラム |
JP2019067076A (ja) * | 2017-09-29 | 2019-04-25 | 劉謹銘 | 多重画像源の処理方法 |
WO2019218459A1 (zh) * | 2018-05-14 | 2019-11-21 | 平安科技(深圳)有限公司 | 一种照片存储方法、存储介质、服务器和装置 |
WO2020045598A1 (ja) * | 2018-08-31 | 2020-03-05 | ソニーセミコンダクタソリューションズ株式会社 | 電子機器及び固体撮像装置 |
JPWO2020194961A1 (ja) * | 2019-03-28 | 2020-10-01 | ||
JP2021528715A (ja) * | 2019-05-15 | 2021-10-21 | シェンチェン センスタイム テクノロジー カンパニー リミテッドShenzhen Sensetime Technology Co.,Ltd | 画像処理方法及び装置、電子機器並びに記憶媒体 |
WO2023058155A1 (ja) * | 2021-10-06 | 2023-04-13 | 日本電気株式会社 | 運転手監視装置、運転手監視方法及びプログラム |
Families Citing this family (43)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5771442B2 (ja) * | 2011-05-09 | 2015-08-26 | オリンパス株式会社 | 画像処理装置、画像処理方法、及び画像処理プログラム |
TWI534721B (zh) * | 2011-10-19 | 2016-05-21 | 致伸科技股份有限公司 | 具有人臉辨識功能之相片分享系統 |
US9305084B1 (en) | 2012-08-30 | 2016-04-05 | deviantArt, Inc. | Tag selection, clustering, and recommendation for content hosting services |
US8849050B2 (en) * | 2012-11-08 | 2014-09-30 | Seiko Epson Corporation | Computer vision methods and systems to recognize and locate an object or objects in one or more images |
US8867865B2 (en) * | 2012-11-14 | 2014-10-21 | Seiko Epson Corporation | Point set matching with outlier detection |
CN103034868B (zh) * | 2012-11-29 | 2015-07-08 | 中国地质大学(武汉) | 一种针对小样本以及高维图像的分类方法 |
CN103870798B (zh) * | 2012-12-18 | 2017-05-24 | 佳能株式会社 | 对象检测方法、对象检测设备以及图像拾取设备 |
US20140193077A1 (en) * | 2013-01-08 | 2014-07-10 | Canon Kabushiki Kaisha | Image retrieval apparatus, image retrieval method, query image providing apparatus, query image providing method, and program |
CN104253825B (zh) * | 2013-06-25 | 2018-04-13 | 腾讯科技(深圳)有限公司 | 网络数据浏览方法和装置 |
CN104349045B (zh) * | 2013-08-09 | 2019-01-15 | 联想(北京)有限公司 | 一种图像采集方法及电子设备 |
KR102203810B1 (ko) | 2013-10-01 | 2021-01-15 | 삼성전자주식회사 | 사용자 입력에 대응되는 이벤트를 이용한 유저 인터페이싱 장치 및 방법 |
US10371561B2 (en) * | 2013-11-01 | 2019-08-06 | Iowa State University Research Foundation, Inc. | Yield measurement and base cutter height control systems for a harvester |
US9544655B2 (en) * | 2013-12-13 | 2017-01-10 | Nant Holdings Ip, Llc | Visual hash tags via trending recognition activities, systems and methods |
CN104915344B (zh) * | 2014-03-10 | 2019-04-26 | 联想(北京)有限公司 | 一种信息处理方法及电子设备 |
EP3118813B1 (en) * | 2014-03-14 | 2021-06-02 | Omron Corporation | Image recognition device, image sensor, and image recognition method |
JP6532190B2 (ja) * | 2014-03-26 | 2019-06-19 | キヤノン株式会社 | 画像検索装置、画像検索方法 |
US10268886B2 (en) | 2015-03-11 | 2019-04-23 | Microsoft Technology Licensing, Llc | Context-awareness through biased on-device image classifiers |
US10055672B2 (en) | 2015-03-11 | 2018-08-21 | Microsoft Technology Licensing, Llc | Methods and systems for low-energy image classification |
CA2930190C (en) * | 2015-05-16 | 2019-09-24 | Tata Consultancy Services Limited | Method and system for planogram compliance check based on visual analysis |
CN105117399B (zh) * | 2015-07-03 | 2020-01-03 | 深圳码隆科技有限公司 | 一种图像搜索方法和装置 |
JP6631712B2 (ja) * | 2015-08-28 | 2020-01-15 | 日本電気株式会社 | 解析装置、解析方法、及びプログラム |
CN105205181A (zh) * | 2015-10-28 | 2015-12-30 | 上海斐讯数据通信技术有限公司 | 一种照片管理方法及管理系统 |
JP2017130794A (ja) * | 2016-01-20 | 2017-07-27 | 株式会社ソニー・インタラクティブエンタテインメント | 情報処理装置、評価用チャート、評価システム、および性能評価方法 |
JP6798183B2 (ja) * | 2016-08-04 | 2020-12-09 | 株式会社リコー | 画像解析装置、画像解析方法およびプログラム |
CN106503741A (zh) * | 2016-10-31 | 2017-03-15 | 深圳前海弘稼科技有限公司 | 植物种类的识别方法、识别装置和服务器 |
US10311288B1 (en) | 2017-03-24 | 2019-06-04 | Stripe, Inc. | Determining identity of a person in a digital image |
JP6726641B2 (ja) * | 2017-05-26 | 2020-07-22 | 日東電工株式会社 | 画像分類プログラム、分類データ作成プログラム、及び、分類データ作成方法 |
EP3647236B1 (en) * | 2017-06-30 | 2023-07-05 | Panasonic Intellectual Property Management Co., Ltd. | Projection instruction device, parcel sorting system, and projection instruction method |
CN107609463B (zh) * | 2017-07-20 | 2021-11-23 | 百度在线网络技术(北京)有限公司 | 活体检测方法、装置、设备及存储介质 |
US10289932B2 (en) | 2017-07-31 | 2019-05-14 | Google Llc | Object recognition state indicators |
JP7032623B2 (ja) * | 2017-10-31 | 2022-03-09 | 株式会社デンソー | 推論装置、推論方法及びプログラム |
KR102499203B1 (ko) | 2017-11-06 | 2023-02-13 | 삼성전자 주식회사 | 신뢰도에 기반하여 객체를 인식하는 전자 장치 및 방법 |
US11182424B2 (en) | 2018-05-08 | 2021-11-23 | Spotify Ab | Image based content search and recommendations |
EP3753241A1 (en) | 2018-10-09 | 2020-12-23 | Google LLC | System and method for performing a rewind operation with a mobile image capture device |
WO2020095909A1 (ja) * | 2018-11-07 | 2020-05-14 | 株式会社 東芝 | 画像処理装置、画像処理方法及びプログラム |
CN109992568B (zh) * | 2019-03-31 | 2021-07-16 | 联想(北京)有限公司 | 一种信息处理方法及装置 |
US11263493B2 (en) | 2019-06-25 | 2022-03-01 | Spotify Ab | Automatic metadata detector based on images |
WO2021033021A1 (en) * | 2019-08-19 | 2021-02-25 | Atul Kailash Shrivastava | System and method for associating identifiers to real-world objects |
CN110874584B (zh) * | 2019-11-21 | 2021-08-31 | 河北工业大学 | 一种基于改进原型聚类的叶片故障诊断方法 |
US11100319B2 (en) * | 2020-01-27 | 2021-08-24 | Salesforce.Com, Inc. | Object detection and image classification based optical character recognition |
US11868393B2 (en) | 2020-12-18 | 2024-01-09 | Capital One Services, Llc | Methods and systems for determining color labeling for a vehicle search service |
US11631252B1 (en) * | 2022-01-03 | 2023-04-18 | Brian Lawrence Repper | Visual media management for mobile devices |
WO2024196058A1 (ko) * | 2023-03-23 | 2024-09-26 | 에스케이 주식회사 | 이미지 태깅 기반의 반려동물 사진 분류 방법 및 시스템 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004078939A (ja) * | 2002-07-30 | 2004-03-11 | Fuji Photo Film Co Ltd | オブジェクト識別方法および装置ならびにプログラム |
JP2009217828A (ja) * | 2009-04-10 | 2009-09-24 | Konica Minolta Holdings Inc | 画像検索装置 |
WO2010087451A1 (ja) * | 2009-01-29 | 2010-08-05 | 株式会社東芝 | 画像表示装置、画像表示方法、および画像表示プログラム |
JP2010262531A (ja) * | 2009-05-08 | 2010-11-18 | Canon Inc | 画像情報処理装置、画像情報処理方法及びプログラム |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7620246B2 (en) | 2002-07-30 | 2009-11-17 | Fujifilm Corporation | Method and apparatus for image processing |
US20050234896A1 (en) * | 2004-04-16 | 2005-10-20 | Nobuyuki Shima | Image retrieving apparatus, image retrieving method and image retrieving program |
CN100416596C (zh) * | 2006-10-12 | 2008-09-03 | 上海交通大学 | 用贝叶斯网络分类器图像判别特征点位置的方法 |
JP4798042B2 (ja) | 2007-03-29 | 2011-10-19 | オムロン株式会社 | 顔検出装置、顔検出方法及び顔検出プログラム |
CN101295305B (zh) | 2007-04-25 | 2012-10-31 | 富士通株式会社 | 图像检索装置 |
JP2009031991A (ja) | 2007-07-26 | 2009-02-12 | Omron Corp | 顔照合装置 |
US7991715B2 (en) * | 2007-12-27 | 2011-08-02 | Arbor Labs, Inc. | System and method for image classification |
JP2010067014A (ja) | 2008-09-11 | 2010-03-25 | Ricoh Co Ltd | 画像分類装置及び画像分類方法 |
GB0818089D0 (en) * | 2008-10-03 | 2008-11-05 | Eastman Kodak Co | Interactive image selection method |
WO2010070804A1 (ja) * | 2008-12-19 | 2010-06-24 | パナソニック株式会社 | 画像検索装置及び画像検索方法 |
CN101625722B (zh) * | 2009-08-11 | 2012-01-11 | 中国农业大学 | 载物识别图像的分类方法 |
US8732180B2 (en) * | 2009-11-12 | 2014-05-20 | Apple Inc. | Recommending media items |
-
2011
- 2011-10-06 CN CN201180007696.5A patent/CN102741882B/zh active Active
- 2011-10-06 WO PCT/JP2011/005639 patent/WO2012073421A1/ja active Application Filing
- 2011-10-06 JP JP2012546673A patent/JP5934653B2/ja active Active
- 2011-10-06 US US13/574,878 patent/US8953895B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004078939A (ja) * | 2002-07-30 | 2004-03-11 | Fuji Photo Film Co Ltd | オブジェクト識別方法および装置ならびにプログラム |
WO2010087451A1 (ja) * | 2009-01-29 | 2010-08-05 | 株式会社東芝 | 画像表示装置、画像表示方法、および画像表示プログラム |
JP2009217828A (ja) * | 2009-04-10 | 2009-09-24 | Konica Minolta Holdings Inc | 画像検索装置 |
JP2010262531A (ja) * | 2009-05-08 | 2010-11-18 | Canon Inc | 画像情報処理装置、画像情報処理方法及びプログラム |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014022837A (ja) * | 2012-07-13 | 2014-02-03 | Nippon Hoso Kyokai <Nhk> | 学習装置、及びプログラム |
WO2016075978A1 (ja) * | 2014-11-12 | 2016-05-19 | ソニー株式会社 | 情報処理装置、情報処理方法およびプログラム |
US11189024B2 (en) | 2014-11-12 | 2021-11-30 | Sony Corporation | Information processing apparatus and information processing method |
WO2017060894A1 (en) * | 2015-10-06 | 2017-04-13 | Agent Video Intelligence Ltd. | Method and system for classifying objects from a stream of images |
JP2018005500A (ja) * | 2016-06-30 | 2018-01-11 | オムロン株式会社 | 画像処理システム、画像処理方法、および画像処理プログラム |
JP2019067076A (ja) * | 2017-09-29 | 2019-04-25 | 劉謹銘 | 多重画像源の処理方法 |
WO2019218459A1 (zh) * | 2018-05-14 | 2019-11-21 | 平安科技(深圳)有限公司 | 一种照片存储方法、存储介质、服务器和装置 |
JPWO2020045598A1 (ja) * | 2018-08-31 | 2021-09-24 | ソニーセミコンダクタソリューションズ株式会社 | 電子機器及び固体撮像装置 |
WO2020045598A1 (ja) * | 2018-08-31 | 2020-03-05 | ソニーセミコンダクタソリューションズ株式会社 | 電子機器及び固体撮像装置 |
TWI820194B (zh) * | 2018-08-31 | 2023-11-01 | 日商索尼半導體解決方案公司 | 電子機器及固體攝像裝置 |
JP7386792B2 (ja) | 2018-08-31 | 2023-11-27 | ソニーセミコンダクタソリューションズ株式会社 | 電子機器及び固体撮像装置 |
US11889177B2 (en) | 2018-08-31 | 2024-01-30 | Sony Semiconductor Solutions Corporation | Electronic device and solid-state imaging device |
JPWO2020194961A1 (ja) * | 2019-03-28 | 2020-10-01 | ||
JP7390628B2 (ja) | 2019-03-28 | 2023-12-04 | パナソニックIpマネジメント株式会社 | 識別情報付与装置、識別情報付与方法、及びプログラム |
JP2021528715A (ja) * | 2019-05-15 | 2021-10-21 | シェンチェン センスタイム テクノロジー カンパニー リミテッドShenzhen Sensetime Technology Co.,Ltd | 画像処理方法及び装置、電子機器並びに記憶媒体 |
JP7128906B2 (ja) | 2019-05-15 | 2022-08-31 | シェンチェン センスタイム テクノロジー カンパニー リミテッド | 画像処理方法及び装置、電子機器並びに記憶媒体 |
WO2023058155A1 (ja) * | 2021-10-06 | 2023-04-13 | 日本電気株式会社 | 運転手監視装置、運転手監視方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
US20120301032A1 (en) | 2012-11-29 |
US8953895B2 (en) | 2015-02-10 |
CN102741882A (zh) | 2012-10-17 |
CN102741882B (zh) | 2015-11-25 |
JPWO2012073421A1 (ja) | 2014-05-19 |
JP5934653B2 (ja) | 2016-06-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5934653B2 (ja) | 画像分類装置、画像分類方法、プログラム、記録媒体、集積回路、モデル作成装置 | |
US10025950B1 (en) | Systems and methods for image recognition | |
CN100517328C (zh) | 显示控制装置和方法 | |
JP6023058B2 (ja) | 画像処理装置、画像処理方法、プログラム、集積回路 | |
US8571358B2 (en) | Methods and apparatuses for facilitating content-based image retrieval | |
US9116924B2 (en) | System and method for image selection using multivariate time series analysis | |
CN100456305C (zh) | 图像处理系统、装置和方法 | |
JP5848336B2 (ja) | 画像処理装置 | |
US20020140843A1 (en) | Camera meta-data for content categorization | |
US8731308B2 (en) | Interactive image selection method | |
US20140093174A1 (en) | Systems and methods for image management | |
US20180089228A1 (en) | Interactive image selection method | |
CN101013434A (zh) | 图像处理系统、装置、方法、程序及其记录介质 | |
CN112000024B (zh) | 用于控制家电设备的方法及装置、设备 | |
JP2014092955A (ja) | 類似コンテンツ検索処理装置、類似コンテンツ検索処理方法、およびプログラム | |
Mao et al. | Visual arts search on mobile devices | |
Yang et al. | Segmentation and recognition of multi-model photo event | |
Farhat et al. | CAPTAIN: Comprehensive composition assistance for photo taking | |
US20180189602A1 (en) | Method of and system for determining and selecting media representing event diversity | |
JP4692784B2 (ja) | 画像記述システムにおける特徴量選択プログラム、特徴量選択方法および装置 | |
Cavalcanti et al. | A survey on automatic techniques for enhancement and analysis of digital photography | |
JP4336813B2 (ja) | 画像記述システムおよび方法 | |
CN109992568B (zh) | 一种信息处理方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
WWE | Wipo information: entry into national phase |
Ref document number: 201180007696.5 Country of ref document: CN |
|
WWE | Wipo information: entry into national phase |
Ref document number: 13574878 Country of ref document: US |
|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 11845157 Country of ref document: EP Kind code of ref document: A1 |
|
WWE | Wipo information: entry into national phase |
Ref document number: 2012546673 Country of ref document: JP |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 11845157 Country of ref document: EP Kind code of ref document: A1 |