JP4926266B2 - 学習データ作成装置、学習データ作成方法及びプログラム - Google Patents
学習データ作成装置、学習データ作成方法及びプログラム Download PDFInfo
- Publication number
- JP4926266B2 JP4926266B2 JP2010158360A JP2010158360A JP4926266B2 JP 4926266 B2 JP4926266 B2 JP 4926266B2 JP 2010158360 A JP2010158360 A JP 2010158360A JP 2010158360 A JP2010158360 A JP 2010158360A JP 4926266 B2 JP4926266 B2 JP 4926266B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- area
- learning data
- cluster
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 25
- 238000009826 distribution Methods 0.000 claims description 26
- 238000001514 detection method Methods 0.000 claims description 11
- 230000008569 process Effects 0.000 claims description 6
- 230000000007 visual effect Effects 0.000 description 96
- 239000013598 vector Substances 0.000 description 41
- 238000013507 mapping Methods 0.000 description 13
- 238000012545 processing Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 101150013335 img1 gene Proteins 0.000 description 5
- 230000008859 change Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 101150071665 img2 gene Proteins 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
- DQJCHOQLCLEDLL-UHFFFAOYSA-N tricyclazole Chemical compound CC1=CC=CC2=C1N1C=NN=C1S2 DQJCHOQLCLEDLL-UHFFFAOYSA-N 0.000 description 1
Images
Landscapes
- Image Analysis (AREA)
Description
以下、本発明の実施の形態を図面に基づいて説明する。
図1は、本発明を適用した学習データ作成装置1の機能ブロック図である。学習データ作成装置1は、通信ネットワークを介して接続されたインターネットに接続され、該インターネットを介してウェブ上から画像データを収集可能となっている。この収集したデータの中からオブジェクトを含む画像領域の切り出しや選定を行ってオブジェクト認識に用いる学習データを作成する。
・Sivic and Zisserman:“Efficient visual search for objects in videos”, Proceedings of the IEEE, Vol.96,No.4.,pp.548-566,Apr 2008.
・Yang and Hauptmann:“A text categorization approach to video scene classification using keypoint features”,Carnegie Mellon University Technical Report,pp.25,Oct 2006.
・Jiang and Ngo:“Bag-of-visual-words expansion using visual relatedness for video indexing”,Proc.31st ACM SIGIR Conf.,pp.769-770,Jul 2008.
・Jiang, Ngo, andYang:“Towards optimal bag-of-features for object categorization and semantic video retrieval”,Proc.6th ACM CIVR Conf.,pp.494-501,Jul.2007.
・Yang, Jiang, Hauptmann, and Ngo:“Evaluating bag-of-visual-words representations in scene classification”,Proc.15th ACM MM Conf., Workshop onMMIR,pp.197-206,Sep. 2007.
等が挙げられる。
・Harris−affine
・Hessian−affine
・Maximally stable extremal regions(MSER)
・Difference of Gaussians(DoG)
・Laplacian of Gaussian(LoG)
・Determinant of Hessian(DoH)
等がある。
・gradient location and orientation histogram
・shape context
・PCA−SIFT
・spin images
・steerable filters
・differential invariants
・complex filters
・moment invariants
次に、図4のフローチャートと、図5の概念図とを用いて、非共通領域特定部50、品質判定部60及び学習データ作成部70により実行される学習データ作成処理を説明する。
先ず、ビジュアルキーワードの画像の分布の度合いとして、上述例では、元画像分布数を算出したが、各ビジュアルキーワードにマッピングされた画像領域の枚数を算出して、非共通領域の特定を行うこととしてもよい。
また、上述例では、非共通領域として特定されたビジュアルキーワードに属する領域画像を元画像から除去することで学習データを作成することとして説明しているが、その非共通領域と特定されたビジュアルキーワードに属する領域画像の元画像内での位置に基づいて実際に除去する領域を求めることとしてもよい。
10 画像収集部
15 画像DB
20 ビジュアルキーワード生成部
25 ビジュアルキーワードDB
30 特徴ベクトル生成部
35 領域管理DB
40 特徴ベクトルDB
50 非共通領域特定部
60 品質判定部
70 学習データ作成部
75 学習データDB
Claims (6)
- キーワードに基づくウェブ検索により収集された複数の画像データからオブジェクト認識用の学習データを作成する学習データ作成装置において、
前記収集された複数の画像データから検出される領域画像の特徴量に基づいて該領域画像を所定のクラスタに分類し、各画像データの領域画像が属するクラスタと、該クラスタに属する領域画像の数とを該画像データ毎に生成するクラスタ分類手段と、
前記各クラスタに属する領域画像の数に基づく前記各クラスタに対する前記領域画像の分類状態から、前記領域画像の分布が少ないクラスタを特定する非共通領域特定手段と、
前記特定されたクラスタに属する領域画像を、該領域画像を検出した前記画像データから除去することにより学習データを作成する学習データ作成手段と、
を備えることを特徴とする学習データ作成装置。 - 前記非共通領域特定手段は、
前記領域画像が分類されたクラスタのうちの、該クラスタに分類された領域画像の検出元の画像データの枚数に基づいて前記領域画像の分布が少ないクラスタを特定することを特徴とする請求項1に記載の学習データ作成装置。 - 前記各画像データから検出した領域画像の数に対する前記非共通領域特定手段により特定されたクラスタに属する該画像データの領域画像の数の比率に基づいて、前記領域画像を除去した場合の画像データが前記学習データに適しているか否かを判定する品質判定手段を更に備え、
前記学習データ作成手段は、
前記品質判定手段により前記学習データに適していると判定された画像データから前記領域画像の除去を行って前記学習データを作成することを特徴とする請求項1又は2に記載の学習データ作成装置。 - 前記学習データ作成手段は、
前記特定されたクラスタに分類された領域画像の前記画像データに対する検出位置に基づいて、前記画像データに対して外側から前記領域画像を除去することを特徴とする請求項1〜3の何れかに記載の学習データ作成装置。 - コンピュータが、キーワードに基づくウェブ検索により収集された複数の画像データからオブジェクト認識用の学習データを作成する学習データ作成方法において、
前記収集された複数の画像データから検出される領域画像の特徴量に基づいて該領域画像を所定のクラスタに分類し、各画像データの領域画像が属するクラスタと、該クラスタに属する領域画像の数とを該画像データ毎に生成するクラスタ工程と、
前記各クラスタに属する領域画像の数に基づく前記各クラスタに対する前記領域画像の分類状態から、前記領域画像の分布が少ないクラスタを特定する非共通領域特定工程と、
前記特定されたクラスタに属する領域画像を、該領域画像を検出した前記画像データから除去することにより学習データを作成する学習データ作成工程と、
を前記コンピュータが行うことを特徴とする学習データ作成方法。 - 請求項5に記載の学習データ作成方法をコンピュータに実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010158360A JP4926266B2 (ja) | 2010-07-13 | 2010-07-13 | 学習データ作成装置、学習データ作成方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010158360A JP4926266B2 (ja) | 2010-07-13 | 2010-07-13 | 学習データ作成装置、学習データ作成方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012022419A JP2012022419A (ja) | 2012-02-02 |
JP4926266B2 true JP4926266B2 (ja) | 2012-05-09 |
Family
ID=45776687
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010158360A Active JP4926266B2 (ja) | 2010-07-13 | 2010-07-13 | 学習データ作成装置、学習データ作成方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4926266B2 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5870014B2 (ja) * | 2012-12-06 | 2016-02-24 | 日本電信電話株式会社 | 画像辞書生成装置、画像辞書生成方法及びコンピュータプログラム |
JP6283308B2 (ja) * | 2014-12-24 | 2018-02-21 | 日本電信電話株式会社 | 画像辞書構成方法、画像表現方法、装置、及びプログラム |
KR102444518B1 (ko) * | 2015-03-16 | 2022-09-16 | 한화테크윈 주식회사 | 영상 검색 방법 및 장치 |
JP6787831B2 (ja) * | 2017-03-30 | 2020-11-18 | Kddi株式会社 | 検索結果による学習が可能な対象検出装置、検出モデル生成装置、プログラム及び方法 |
CN113646800A (zh) * | 2018-09-27 | 2021-11-12 | 株式会社OPTiM | 物体状况判断系统、物体状况判断方法以及程序 |
KR102002024B1 (ko) * | 2018-12-06 | 2019-07-22 | 주식회사 아임클라우드 | 객체 라벨링 처리 방법 및 객체 관리 서버 |
WO2021229786A1 (ja) * | 2020-05-15 | 2021-11-18 | 日本電信電話株式会社 | 学習装置、検出装置、学習方法、検出方法、学習プログラムおよび検出プログラム |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3398182B2 (ja) * | 1993-06-15 | 2003-04-21 | クニミネ工業株式会社 | 汚泥の処理方法及びそれに用いる処理材 |
JP2009123234A (ja) * | 2002-07-30 | 2009-06-04 | Fujifilm Corp | オブジェクト識別方法および装置ならびにプログラム |
JP2011054081A (ja) * | 2009-09-04 | 2011-03-17 | Sony Corp | 画像処理装置および方法、並びにプログラム |
JP4906900B2 (ja) * | 2009-09-24 | 2012-03-28 | ヤフー株式会社 | 画像検索装置、画像検索方法及びプログラム |
-
2010
- 2010-07-13 JP JP2010158360A patent/JP4926266B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2012022419A (ja) | 2012-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10102443B1 (en) | Hierarchical conditional random field model for labeling and segmenting images | |
JP5916886B2 (ja) | 画像特徴の類似性に基づく画像索引作成 | |
JP4926266B2 (ja) | 学習データ作成装置、学習データ作成方法及びプログラム | |
US9754177B2 (en) | Identifying objects within an image | |
US9251434B2 (en) | Techniques for spatial semantic attribute matching for location identification | |
Zou et al. | Harf: Hierarchy-associated rich features for salient object detection | |
JP5121917B2 (ja) | 画像検索装置、画像検索方法及びプログラム | |
Esmaeili et al. | Fast-at: Fast automatic thumbnail generation using deep neural networks | |
WO2012073421A1 (ja) | 画像分類装置、画像分類方法、プログラム、記録媒体、集積回路、モデル作成装置 | |
US8200010B1 (en) | Image segmentation by clustering web images | |
US9626585B2 (en) | Composition modeling for photo retrieval through geometric image segmentation | |
JP4937395B2 (ja) | 特徴ベクトル生成装置、特徴ベクトル生成方法及びプログラム | |
CN104850822B (zh) | 基于多特征融合的简单背景下的叶片识别方法 | |
JP5094830B2 (ja) | 画像検索装置、画像検索方法及びプログラム | |
Zhang et al. | Salient object detection via compactness and objectness cues | |
Lian et al. | Weakly supervised road segmentation in high-resolution remote sensing images using point annotations | |
Yang et al. | Tree detection from aerial imagery | |
KR100647337B1 (ko) | 지역 분할 템플릿을 이용한 카테고리 기반 사진 클러스터링방법 및 시스템 | |
JP5014479B2 (ja) | 画像検索装置、画像検索方法及びプログラム | |
CN113673607A (zh) | 图像标注模型的训练及图像标注的方法及装置 | |
Devareddi et al. | Review on content-based image retrieval models for efficient feature extraction for data analysis | |
Zhang et al. | Dataset-driven unsupervised object discovery for region-based instance image retrieval | |
Kim et al. | Classification and indexing scheme of large-scale image repository for spatio-temporal landmark recognition | |
Zhou et al. | Modeling perspective effects in photographic composition | |
Choudhuri et al. | Object localization on natural scenes: A survey |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120110 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120207 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150217 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4926266 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |