JP5754306B2 - 画像識別情報付与プログラム及び画像識別情報付与装置 - Google Patents
画像識別情報付与プログラム及び画像識別情報付与装置 Download PDFInfo
- Publication number
- JP5754306B2 JP5754306B2 JP2011190967A JP2011190967A JP5754306B2 JP 5754306 B2 JP5754306 B2 JP 5754306B2 JP 2011190967 A JP2011190967 A JP 2011190967A JP 2011190967 A JP2011190967 A JP 2011190967A JP 5754306 B2 JP5754306 B2 JP 5754306B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- identification information
- label
- unit
- images
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Processing Or Creating Images (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Description
図1は、本発明の第1の実施の形態に係る画像識別情報付与装置の構成例を示すブロック図である。この画像識別情報付与装置1は、画像受付部2、特徴抽出部3、ラベル事後確率計算部4、量子化部5、ノード接合部6、ラベル推定部7、ラベル付与部8、アノテーション情報出力部9及び記憶部10を有して概略構成されている。
従来のMRFやCRFを用いた画像アノテーション技術では、例えば非特許文献“Word co-occurrence and Markov Random Field for Improving Automatic Image Annotation ”H.J.Escalante, M.Montes and L.E.Sucar, BMVC,2007に開示されているように、ラベルの共起を用いてMRFモデルを構築し、ラベルの確率を観測値として入力し、入力画像に対してラベルを推定する。この従来技術では、画像のラベルを推定する隠れノードは複数のラベルから一つのラベルを選択するノードであり、したがって、1つの画像全体又は画像領域に対して1つのラベルしか付与できず、画像全体に複数のラベルを付与するアノテーションには適用できない。
本実施の形態のノード接合部6は、画像間の相関情報に基づいて事後確率計算ノード72及び推定事後確率計算ノード73間を接合する接合リンク76の位置情報(リンク情報)150を生成し、生成したリンク情報150を記憶部10に格納する。入力側リンク75及び出力側リンク77は、予め付けられている。画像間の相関情報として、例えば画像の撮影時間、画像特徴量の類似度等を用いることができる。相関情報としてアノテーション(ラベル)間の相関を用いる例は、後述する。
図2は、ラベル推定部7の概略の構成例を示す図である。ラベル推定部7は、ラベル毎に設けられたMRFモデル701〜70Nを有し、対応するMRFモデル701〜70Nのノード隠れ変数の初期状態の設定及びノードを繋げるリンク情報150を入力して、グラフカットメッセージ・パッシング方法(Yuri Boykov, O.Veksler, R.Zabih, “Fast Approximate Energy Minimization via Graph Cuts”,PAMI2001)により、ラベルの量子化状態を最適化する。
図3は、第1の実施の形態の動作例を示すフローチャートである。本実施の形態は、画像の相関情報に基づき、MRFモデル701〜70Nに接合リンク76を付けるのが特徴である。
第1の実施の形態によれば、複数の画像間の相関情報に基づいてMRFモデルを最適化しているので、本構成を採用しない場合と比べて画像に対して高い精度で複数のラベルを付与することができる。
図4は、本発明の第2の実施の形態に係る画像識別情報付与装置の構成例を示すブロック図である。本実施の形態の画像識別情報付与装置1は、第1の実施の形態と同様に、画像受付部2、特徴抽出部3、ラベル事後確率計算部4、量子化部5、ノード接合部6、ラベル推定部7、ラベル付与部8、アノテーション情報出力部9及び記憶部10を有して概略構成されている。本実施の形態は、第1の実施の形態とは、ノード接合部6が異なり、他は第1の実施の形態と同様に構成され、同様の作用を奏するので、その説明を省略する。
第2の実施の形態によれば、複数のラベル間の相関情報に基づいてMRFモデルを最適化しているので、本構成を採用しない場合と比べて画像に対して高い精度で複数のラベルを付与することができる。
なお、本発明は、上記実施の形態に限定されず、本発明の要旨を変更しない範囲で種々に変形が可能である。例えば、画像受付部2、特徴抽出部3、ラベル事後確率計算部4、量子化部5、ノード接合部6、ラベル推定部7、ラベル付与部8及びアノテーション情報出力部9の各機能は、コンピュータ読み取り可能な画像識別情報付与プログラム110に従ってCPUが動作することにより実現してもよい。また、上記実施の形態の画像受付部2、特徴抽出部3、ラベル事後確率計算部4、量子化部5、ノード接合部6、ラベル推定部7、ラベル付与部8及びアノテーション情報出力部9の全て又は一部をASIC等のハードウエアによって実現してもよい。
Claims (4)
- コンピュータを、
複数の画像からそれぞれ特徴量を抽出する抽出手段と、
前記抽出手段によって抽出された前記特徴量から学習モデルを用いて前記画像に付与すべき複数の識別情報に対してそれぞれ第1の評価値を計算する計算手段と、
前記識別情報の数に対応した数の確率場モデルを有し、前記複数の画像について前記計算手段によって計算された前記識別情報毎の前記第1の評価値を前記複数の確率場モデルに入力し、前記画像毎に前記複数の識別情報に対する第2の評価値を出力する出力手段として機能されるための画像識別情報付与プログラム。 - 前記出力手段の前記確率場モデルを前記複数の画像間の相関情報に基づいて最適化する最適化手段を、さらに備えた請求項1に記載の画像識別情報付与プログラム。
- 前記出力手段の前記確率場モデルを前記複数の識別情報間の相関情報に基づいて最適化する最適化手段を、さらに備えた請求項1に記載の画像識別情報付与プログラム。
- 複数の画像からそれぞれ特徴量を抽出する抽出手段と、
前記抽出手段によって抽出された前記特徴量から学習モデルを用いて前記画像に付与すべき複数の識別情報に対してそれぞれ第1の評価値を計算する計算手段と、
前記識別情報の数に対応した数の確率場モデルを有し、前記複数の画像について前記計算手段によって計算された前記識別情報毎の前記第1の評価値を前記複数の確率場モデルに入力し、前記画像毎に前記複数の識別情報に対する第2の評価値を出力する出力手段とを備えた画像識別情報付与装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011190967A JP5754306B2 (ja) | 2011-09-01 | 2011-09-01 | 画像識別情報付与プログラム及び画像識別情報付与装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011190967A JP5754306B2 (ja) | 2011-09-01 | 2011-09-01 | 画像識別情報付与プログラム及び画像識別情報付与装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013054458A JP2013054458A (ja) | 2013-03-21 |
JP5754306B2 true JP5754306B2 (ja) | 2015-07-29 |
Family
ID=48131413
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011190967A Active JP5754306B2 (ja) | 2011-09-01 | 2011-09-01 | 画像識別情報付与プログラム及び画像識別情報付与装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5754306B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104680209A (zh) * | 2015-01-22 | 2015-06-03 | 广东工业大学 | 一种符合epc c1g2标准的基于时隙状态的射频识别标签数量估计方法 |
JP6911798B2 (ja) * | 2018-03-15 | 2021-07-28 | オムロン株式会社 | ロボットの動作制御装置 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006155340A (ja) * | 2004-11-30 | 2006-06-15 | Konica Minolta Holdings Inc | 画像管理装置、画像管理方法、および画像管理プログラム |
JP2008217706A (ja) * | 2007-03-07 | 2008-09-18 | Tokyo Institute Of Technology | ラベリング装置、ラベリング方法及びプログラム |
JP5152918B2 (ja) * | 2008-11-27 | 2013-02-27 | 日本電信電話株式会社 | 固有表現抽出装置、その方法およびプログラム |
US8645287B2 (en) * | 2010-02-04 | 2014-02-04 | Microsoft Corporation | Image tagging based upon cross domain context |
-
2011
- 2011-09-01 JP JP2011190967A patent/JP5754306B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2013054458A (ja) | 2013-03-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US12079269B2 (en) | Visually guided machine-learning language model | |
US11604822B2 (en) | Multi-modal differential search with real-time focus adaptation | |
US11748619B2 (en) | Image feature learning device, image feature learning method, image feature extraction device, image feature extraction method, and program | |
JP7360497B2 (ja) | クロスモーダルな特徴の抽出方法、抽出装置、ならびに、プログラム | |
US8126274B2 (en) | Visual language modeling for image classification | |
US10783402B2 (en) | Information processing apparatus, information processing method, and storage medium for generating teacher information | |
US8150170B2 (en) | Statistical approach to large-scale image annotation | |
US9792492B2 (en) | Extracting gradient features from neural networks | |
US9400918B2 (en) | Compact face representation | |
US8254699B1 (en) | Automatic large scale video object recognition | |
JP5281156B2 (ja) | 画像の注釈付け | |
JP5506722B2 (ja) | マルチクラス分類器をトレーニングするための方法 | |
US20170132493A1 (en) | Image processing apparatus, image processing method, and storage medium | |
US20150356199A1 (en) | Click-through-based cross-view learning for internet searches | |
JP2003256441A (ja) | 文書分類方法及び装置 | |
CN106557728B (zh) | 查询图像处理和图像检索方法和装置以及监视系统 | |
Son et al. | Spectral clustering with brainstorming process for multi-view data | |
Li et al. | Fusing semantic aspects for image annotation and retrieval | |
US20230055263A1 (en) | Stratification in non-classified heterogeneous object labels | |
JP5754306B2 (ja) | 画像識別情報付与プログラム及び画像識別情報付与装置 | |
JP2010282276A (ja) | 映像認識理解装置、映像認識理解方法、及びプログラム | |
CN111984812B (zh) | 一种特征提取模型生成方法、图像检索方法、装置及设备 | |
JP6427480B2 (ja) | 画像検索装置、方法、及びプログラム | |
KR20150124825A (ko) | 화상분류 기반의 나이브 베이즈 분류기 | |
CN110851633B (zh) | 一种实现同时定位和哈希的细粒度图像检索方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140822 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150325 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150428 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150511 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5754306 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |