JP2014115737A - 画像辞書生成装置、画像辞書生成方法及びコンピュータプログラム - Google Patents
画像辞書生成装置、画像辞書生成方法及びコンピュータプログラム Download PDFInfo
- Publication number
- JP2014115737A JP2014115737A JP2012267627A JP2012267627A JP2014115737A JP 2014115737 A JP2014115737 A JP 2014115737A JP 2012267627 A JP2012267627 A JP 2012267627A JP 2012267627 A JP2012267627 A JP 2012267627A JP 2014115737 A JP2014115737 A JP 2014115737A
- Authority
- JP
- Japan
- Prior art keywords
- image
- learning
- topic
- image dictionary
- topic model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Image Analysis (AREA)
Abstract
【解決手段】複数の意味ラベルそれぞれに対応付けられた複数の学習画像について特徴量を抽出し、特徴量をクラスタリングし、クラスタ毎にそのクラスタに含まれる特徴量に基づいてトピックモデルを生成し、トピックモデルと学習画像との類似度に基づいて、各トピックモデルに対して複数の学習画像を対応付けし、トピックモデルと複数の学習画像との対応付けに基づいて複数のトピックモデルの識別器を生成し、複数の識別器の組み合わせを意味ラベルの画像辞書として取得する。
【選択図】図1
Description
まず、ある意味ラベルに関する画像を学習データとして収集する。次に、学習データから色や形状などの特徴量を抽出する。最後に、機械学習手法を用いて、識別モデルを構築する。以上の処理により、学習データから求めた識別モデルを、任意の意味ラベルの画像辞書として生成することができる。(非特許文献1参照)
意味ラベルが、画像における複数の要素(以下、「トピック」という。)の組み合わせで構成されることがある。例えば、“ビーチ”という意味ラベルは、“海”、“太陽”、“砂”、“人”などの複数のトピックの組み合わせで構成される。ところが、画像全体から抽出された一つの特徴量(例えば色や形状のヒストグラム)は、複数のトピックと意味ラベルとの対応関係を明確に規定できない。そのため、画像全体から抽出された一つの特徴量を用いる非特許文献1の方法では、画像辞書の精度が低くなってしまうという問題がある。
図1は、画像辞書生成装置10の構成を示す概略ブロック図である。画像辞書生成装置10は、バスで接続されたCPU(Central Processing Unit)やメモリや補助記憶装置などを備え、画像辞書生成プログラムを実行する。画像辞書生成装置10は、画像辞書生成プログラムの実行によって、蓄積部1、学習画像群収集部2、特徴量抽出部3、トピックモデル生成部4、学習画像対応付け部5及び画像辞書生成部6を備える装置として機能する。なお、画像辞書生成装置10の各機能の全て又は一部は、ASIC(Application Specific Integrated Circuit)やPLD(Programmable Logic Device)やFPGA(Field Programmable Gate Array)等のハードウェアを用いて実現されても良い。画像辞書生成プログラムは、コンピュータ読み取り可能な記録媒体に記録されても良い。コンピュータ読み取り可能な記録媒体とは、例えばフレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置である。
また、意味ラベルが大量に存在する場合や、意味ラベル付与対象となる画像が大量に存在する場合、より効率よく意味ラベルを付与することが可能となる。
図3のフローチャートのステップS306の処理において、学習画像対応付け部5は、類似度に基づいて他の基準でトピックと学習画像との対応付けを行っても良い。例えば、学習画像対応付け部5は、各トピックについて、予め定められた閾値を超える類似度の画像を全てそのトピックに対応付けても良い。
Claims (4)
- 複数の意味ラベルそれぞれに対応付けられた複数の学習画像について特徴量を抽出する特徴量抽出部と、
前記特徴量をクラスタリングし、クラスタ毎にそのクラスタに含まれる前記特徴量に基づいてトピックモデルを生成するトピックモデル生成部と、
前記トピックモデルと前記学習画像との類似度に基づいて、各トピックモデルに対して複数の学習画像を対応付ける学習画像対応付け部と、
前記トピックモデルと複数の学習画像との対応付けに基づいて複数のトピックモデルの識別器を生成し、複数の識別器の組み合わせを前記意味ラベルの画像辞書として取得する画像辞書生成部と、
を備える画像辞書生成装置。 - 前記画像辞書生成部は、前記複数の意味ラベルのうち処理の対象となっている意味ラベルについて、前記意味ラベルに対応付けられており且つトピックモデルに対応付けられた前記学習画像をトピックラベル毎に取得し、取得された学習画像に基づいてトピックモデル毎に識別器を生成し、生成された複数の識別器の組み合わせを、前記処理の対象となっている意味ラベルの画像辞書として取得する、請求項1に記載の画像辞書生成装置。
- 複数の意味ラベルそれぞれに対応付けられた複数の学習画像について特徴量を抽出する特徴量抽出ステップと、
前記特徴量をクラスタリングし、クラスタ毎にそのクラスタに含まれる前記特徴量に基づいてトピックモデルを生成するトピックモデル生成ステップと、
前記トピックモデルと前記学習画像との類似度に基づいて、各トピックモデルに対して複数の学習画像を対応付ける学習画像対応付けステップと、
前記トピックモデルと複数の学習画像との対応付けに基づいて複数のトピックモデルの識別器を生成し、複数の識別器の組み合わせを前記意味ラベルの画像辞書として取得する画像辞書生成ステップと、
を有する画像辞書生成方法。 - コンピュータを請求項1又は2に記載の画像辞書生成装置として機能させるためのコンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012267627A JP5870014B2 (ja) | 2012-12-06 | 2012-12-06 | 画像辞書生成装置、画像辞書生成方法及びコンピュータプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012267627A JP5870014B2 (ja) | 2012-12-06 | 2012-12-06 | 画像辞書生成装置、画像辞書生成方法及びコンピュータプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014115737A true JP2014115737A (ja) | 2014-06-26 |
JP5870014B2 JP5870014B2 (ja) | 2016-02-24 |
Family
ID=51171695
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012267627A Expired - Fee Related JP5870014B2 (ja) | 2012-12-06 | 2012-12-06 | 画像辞書生成装置、画像辞書生成方法及びコンピュータプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5870014B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018005638A (ja) * | 2016-07-04 | 2018-01-11 | 日本電信電話株式会社 | 映像認識モデル学習装置、映像認識装置、方法、及びプログラム |
CN107657276A (zh) * | 2017-09-15 | 2018-02-02 | 赤峰学院 | 一种基于寻找语义类簇的弱监督语义分割方法 |
CN111427996A (zh) * | 2020-03-02 | 2020-07-17 | 云知声智能科技股份有限公司 | 一种人机交互文本中抽取日期时间的方法和装置 |
JP7470016B2 (ja) | 2020-11-10 | 2024-04-17 | 株式会社日立製作所 | 機械学習を用いた物体検出用識別モデル生成装置およびプログラム |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009193183A (ja) * | 2008-02-13 | 2009-08-27 | Nippon Telegr & Teleph Corp <Ntt> | 画像辞書生成装置,画像辞書生成方法,画像辞書生成プログラムおよびその記録媒体 |
JP2009258953A (ja) * | 2008-04-16 | 2009-11-05 | Univ Of Electro-Communications | 画像処理方法、その方法を実行するプログラム、記憶媒体、撮像機器、画像処理システム |
JP2010017274A (ja) * | 2008-07-09 | 2010-01-28 | Fuji Xerox Co Ltd | 画像処理装置及び画像処理プログラム |
JP2012022419A (ja) * | 2010-07-13 | 2012-02-02 | Yahoo Japan Corp | 学習データ作成装置、学習データ作成方法及びプログラム |
-
2012
- 2012-12-06 JP JP2012267627A patent/JP5870014B2/ja not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009193183A (ja) * | 2008-02-13 | 2009-08-27 | Nippon Telegr & Teleph Corp <Ntt> | 画像辞書生成装置,画像辞書生成方法,画像辞書生成プログラムおよびその記録媒体 |
JP2009258953A (ja) * | 2008-04-16 | 2009-11-05 | Univ Of Electro-Communications | 画像処理方法、その方法を実行するプログラム、記憶媒体、撮像機器、画像処理システム |
JP2010017274A (ja) * | 2008-07-09 | 2010-01-28 | Fuji Xerox Co Ltd | 画像処理装置及び画像処理プログラム |
JP2012022419A (ja) * | 2010-07-13 | 2012-02-02 | Yahoo Japan Corp | 学習データ作成装置、学習データ作成方法及びプログラム |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018005638A (ja) * | 2016-07-04 | 2018-01-11 | 日本電信電話株式会社 | 映像認識モデル学習装置、映像認識装置、方法、及びプログラム |
CN107657276A (zh) * | 2017-09-15 | 2018-02-02 | 赤峰学院 | 一种基于寻找语义类簇的弱监督语义分割方法 |
CN111427996A (zh) * | 2020-03-02 | 2020-07-17 | 云知声智能科技股份有限公司 | 一种人机交互文本中抽取日期时间的方法和装置 |
CN111427996B (zh) * | 2020-03-02 | 2023-10-20 | 云知声智能科技股份有限公司 | 一种人机交互文本中抽取日期时间的方法和装置 |
JP7470016B2 (ja) | 2020-11-10 | 2024-04-17 | 株式会社日立製作所 | 機械学習を用いた物体検出用識別モデル生成装置およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP5870014B2 (ja) | 2016-02-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Turcot et al. | Better matching with fewer features: The selection of useful features in large database recognition problems | |
Lee et al. | Adaboost for text detection in natural scene | |
WO2012032788A1 (ja) | 排他的分類器による一般物体の画像認識装置及び方法 | |
JP2016517291A5 (ja) | ||
Lim et al. | Context by region ancestry | |
Marini et al. | Bird species classification based on color features | |
Lei et al. | Saliency-driven image classification method based on histogram mining and image score | |
JP5870014B2 (ja) | 画像辞書生成装置、画像辞書生成方法及びコンピュータプログラム | |
CN108764302A (zh) | 一种基于颜色特征和词袋特征的票据图像分类方法 | |
CN103745207A (zh) | 一种人脸识别的特征提取方法及装置 | |
CN103995864B (zh) | 一种图像检索方法和装置 | |
CN104317946A (zh) | 一种基于多张关键图的图像内容检索方法 | |
Khan et al. | Scale coding bag-of-words for action recognition | |
JP2015109024A (ja) | 画像辞書生成装置、画像辞書生成方法及びコンピュータプログラム | |
Shekar et al. | An unification of inner distance shape context and local binary pattern for shape representation and classification | |
Ramanathan et al. | Quadtree decomposition based extended vector space model for image retrieval | |
Hao et al. | Improved bags-of-words algorithm for scene recognition | |
Cun-Zhao et al. | Multi-scale graph-matching based kernel for character recognition from natural scenes | |
JP2016081472A (ja) | 画像処理装置、画像処理方法及びプログラム | |
Sahoo et al. | Indian sign language recognition using a novel feature extraction technique | |
Mimaroglu et al. | ASOD: Arbitrary shape object detection | |
Meng et al. | A new co-saliency model via pairwise constraint graph matching | |
Ghildiyal et al. | Image-based monument classification using bag-of-word architecture | |
JP2017215784A (ja) | 物体検出装置、方法、及びプログラム | |
Gupta et al. | The semantic multinomial representation of images obtained using dynamic kernel based pseudo-concept SVMs |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150218 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20151120 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160105 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160108 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5870014 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |