JP2009193183A - 画像辞書生成装置,画像辞書生成方法,画像辞書生成プログラムおよびその記録媒体 - Google Patents
画像辞書生成装置,画像辞書生成方法,画像辞書生成プログラムおよびその記録媒体 Download PDFInfo
- Publication number
- JP2009193183A JP2009193183A JP2008031210A JP2008031210A JP2009193183A JP 2009193183 A JP2009193183 A JP 2009193183A JP 2008031210 A JP2008031210 A JP 2008031210A JP 2008031210 A JP2008031210 A JP 2008031210A JP 2009193183 A JP2009193183 A JP 2009193183A
- Authority
- JP
- Japan
- Prior art keywords
- image
- representative
- cluster
- region
- learning data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Image Analysis (AREA)
Abstract
【解決手段】ある意味に関する画像群を学習データとして収集しておく。領域分割部102は,学習データの各画像を特徴量に従って領域に分割し,代表領域クラスタ抽出部103は,分割によって得られた領域群に対してクラスタリングを行って,その中で意味をよく表現できる複数オブジェクトに対応する代表領域クラスタを抽出する。代表領域クラスタモデル学習部104は,各代表領域クラスタに含まれるサンプルを学習データとして代表領域クラスタモデルを構築し,重み付け係数算出部105は,代表領域クラスタモデルの意味に対する重要度を表す重み付け係数を算出する。これらの代表領域クラスタモデルと重み付け係数の情報を画像辞書として画像辞書記憶部106に格納する。
【選択図】図1
Description
A.Yanagawa,S.-F.Chang,L.Kennedy ,and W.Hsu ,"Columbia University's Baseline detectors for 374 LSCOM Semantic Visual Concepts ",Columbia University ADVENT Technical Report #222-2006-8 ,March 20,2007. Yongqing Sun,Satoshi Shimada ,Masashi Morimoto,"Visual pattern discovery using web images ",ACM MIR workshop,2006. Yongqing Sun,Shinji Ozawa ,"HIRBIR: A Hierarchical Approach for Region-based Image Retrieval",ACM Multimedia Systems Journal,10(6): 559-569 (2005) .
(1)画像の意味を表した基本的な単位は画像の領域と考えられる。ここで,画像の領域は,実世界のオブジェクト(例:芝生,人,山など)に対応する。
(2)画像の意味は,画像における代表オブジェクトを表した複数の代表領域で表現される。
・特徴空間における学習データの平均ベクトルυ,
・特徴空間における学習データの分散共分散行列Σ,
であり,次のように算出される。
υ=Σj=1 L (Xj )/L
分散共分散行列Σ:
Σ={Σj=1 L (Xj −υ)(Xj −υ)T }/L
ここで,Σj=1 L f(j)は,j=1からj=Lまでのf(j)の総和を表す。
ここで,xmax (s)は,R個の領域iの中でのs番目の特徴量の最大値,xmin (s)はR個の領域iの中でのs番目の特徴量の最小値である。
μs =Σj=1 L (xjs)/L
(ただし,Σs=1 n はs=1からnまでの総和,Σj=1 L はj=1からLまでの総和を表す。)
なお,このばらつきδm の算出方法は一例であり,他に分散や標準偏差値等を用いることもできる。ばらつきδm は,代表領域クラスタに含まれる各領域の特徴量の平均値からのズレの量を表しているものであればよい。
〔観点1〕代表領域クラスタに属する領域数が多ければ,画像の意味を表現するのに重要となる再現性の高いオブジェクトに対応するクラスタであると考えられる。
〔観点2〕ばらつきが小さい代表領域クラスタは,画像の意味の表現に重要となる代表的なオブジェクトに対応するクラスタと考えられる。例えば,“tiger”という意味に関する画像群において,虎の頭,体というオブジェクトは再現性が高く,画像間の類似性が高いと考えられる。
(5)ステップS405:すべてのM個の代表領域クラスタに対して,ステップS403,S404の処理を行ったかを判定する。行っていなければ,m=m+1として,ステップS403へ戻り,次の代表領域クラスタに対して同様に処理を繰り返す。すべて行ったならば,重み付け係数の算出処理を終了する。
100 学習データ記憶部
101 学習データ取得部
102 領域分割部
103 代表領域クラスタ抽出部
104 代表領域クラスタモデル学習部
105 重み付け係数算出部
106 画像辞書記憶部
Claims (6)
- 画像の意味の解析に用いる画像辞書を生成する画像辞書生成装置であって,
ある意味に関する意味ラベルが付与された画像群を学習データとして取得する学習データ取得手段と,
取得した学習データの画像を,画像の特徴量に基づいて複数の領域に分割する領域分割手段と,
前記領域分割手段で得られた学習データの領域群に対して類似する特徴量を持つ領域を統合することによりクラスタリングを行い,クラスタリング結果の領域クラスタの中から,少なくとも領域クラスタにおける領域の数または領域の面積を条件として含む所定の代表領域クラスタの選定条件に基づき,代表領域クラスタを抽出する代表領域クラスタ抽出手段と,
抽出した各代表領域クラスタに対し,代表領域クラスタに含まれる画像サンプルを学習データとして代表領域クラスタモデルを構築し,構築した代表領域クラスタモデルを表すモデルパラメータを出力する代表領域クラスタモデル学習手段と,
前記各代表領域クラスタモデルの意味に対する重要度を表す重み付け係数を,前記代表領域クラスタに属する領域群の特徴量に基づいて算出する重み付け係数算出手段とを備え,
前記学習データの画像群に付与された意味ラベル毎に,前記各代表領域クラスタモデルのモデルパラメータと前記重み付け係数とを画像辞書として格納する
ことを特徴とする画像辞書生成装置。 - 前記重み付け係数算出手段は,
前記各代表領域クラスタに属する領域群の領域の数と,該代表領域クラスタに属する領域群の特徴量の分布のばらつきに基づいて,前記領域の数が多いほど重み付け係数の値が大きく,前記ばらつきが大きいほど重み付け係数の値が小さくなるように重み付け係数を算出する
ことを特徴とする請求項1記載の画像辞書生成装置。 - 画像辞書生成装置が画像の意味の解析に用いる画像辞書を生成する画像辞書生成方法であって,
ある意味に関する意味ラベルが付与された画像群を学習データとして取得する学習データ取得過程と,
取得した学習データの画像を,画像の特徴量に基づいて複数の領域に分割する領域分割過程と,
前記領域分割過程で得られた学習データの領域群に対して類似する特徴量を持つ領域を統合することによりクラスタリングを行い,クラスタリング結果の領域クラスタの中から,少なくとも領域クラスタにおける領域の数または領域の面積を条件として含む所定の代表領域クラスタの選定条件に基づき,代表領域クラスタを抽出する代表領域クラスタ抽出過程と,
抽出した各代表領域クラスタに対し,代表領域クラスタに含まれる画像サンプルを学習データとして代表領域クラスタモデルを構築し,構築した代表領域クラスタモデルを表すモデルパラメータを出力する代表領域クラスタモデル学習過程と,
前記各代表領域クラスタモデルの意味に対する重要度を表す重み付け係数を,前記代表領域クラスタに属する領域群の特徴量に基づいて算出する重み付け係数算出過程とを有し,
前記学習データの画像群に付与された意味ラベル毎に,前記各代表領域クラスタモデルのモデルパラメータと前記重み付け係数とを画像辞書として格納する
ことを特徴とする画像辞書生成方法。 - 前記重み付け係数算出過程では,
前記各代表領域クラスタに属する領域群の領域の数と,該代表領域クラスタに属する領域群の特徴量の分布のばらつきに基づいて,前記領域の数が多いほど重み付け係数の値が大きく,前記ばらつきが大きいほど重み付け係数の値が小さくなるように重み付け係数を算出する
ことを特徴とする請求項3記載の画像辞書生成方法。 - 請求項3または請求項4記載の画像辞書生成方法を,コンピュータに実行させるための画像辞書生成プログラム。
- 請求項5記載の画像辞書生成プログラムを記録したコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008031210A JP4964798B2 (ja) | 2008-02-13 | 2008-02-13 | 画像辞書生成装置,画像辞書生成方法,画像辞書生成プログラムおよびその記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008031210A JP4964798B2 (ja) | 2008-02-13 | 2008-02-13 | 画像辞書生成装置,画像辞書生成方法,画像辞書生成プログラムおよびその記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009193183A true JP2009193183A (ja) | 2009-08-27 |
JP4964798B2 JP4964798B2 (ja) | 2012-07-04 |
Family
ID=41075158
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008031210A Expired - Fee Related JP4964798B2 (ja) | 2008-02-13 | 2008-02-13 | 画像辞書生成装置,画像辞書生成方法,画像辞書生成プログラムおよびその記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4964798B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013109389A (ja) * | 2011-11-17 | 2013-06-06 | Nippon Telegr & Teleph Corp <Ntt> | 画像辞書生成装置、画像辞書生成方法および画像辞書生成プログラム |
JP2014115737A (ja) * | 2012-12-06 | 2014-06-26 | Nippon Telegr & Teleph Corp <Ntt> | 画像辞書生成装置、画像辞書生成方法及びコンピュータプログラム |
JP2015041225A (ja) * | 2013-08-21 | 2015-03-02 | 日本電信電話株式会社 | 情報処理装置、情報抽出装置、及びプログラム |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003087772A (ja) * | 2001-09-10 | 2003-03-20 | Fujitsu Ltd | 画像制御装置 |
-
2008
- 2008-02-13 JP JP2008031210A patent/JP4964798B2/ja not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003087772A (ja) * | 2001-09-10 | 2003-03-20 | Fujitsu Ltd | 画像制御装置 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013109389A (ja) * | 2011-11-17 | 2013-06-06 | Nippon Telegr & Teleph Corp <Ntt> | 画像辞書生成装置、画像辞書生成方法および画像辞書生成プログラム |
JP2014115737A (ja) * | 2012-12-06 | 2014-06-26 | Nippon Telegr & Teleph Corp <Ntt> | 画像辞書生成装置、画像辞書生成方法及びコンピュータプログラム |
JP2015041225A (ja) * | 2013-08-21 | 2015-03-02 | 日本電信電話株式会社 | 情報処理装置、情報抽出装置、及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP4964798B2 (ja) | 2012-07-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106815481B (zh) | 一种基于影像组学的生存期预测方法及装置 | |
Ugarriza et al. | Automatic image segmentation by dynamic region growth and multiresolution merging | |
US8391618B1 (en) | Semantic image classification and search | |
EP3065084A1 (en) | Image recognition method, image recognition device, and recording medium | |
US9563822B2 (en) | Learning apparatus, density measuring apparatus, learning method, computer program product, and density measuring system | |
CA3013048A1 (en) | Automated image analysis to assess reproductive potential of human oocytes and pronuclear embryos | |
JP5333589B2 (ja) | 代表特徴抽出システムおよび方法 | |
JP2014029732A (ja) | 画像の検索および読み出しに関する基準を用いて画像内容の描写を生成する方法 | |
US20130063468A1 (en) | Image processing apparatus, image processing method, and program | |
Seetharaman et al. | Texture characterization, representation, description, and classification based on full range Gaussian Markov random field model with Bayesian approach | |
CN104820841B (zh) | 基于低阶互信息和光谱上下文波段选择的高光谱分类方法 | |
CN112949772A (zh) | 基于影像组学的胃癌多维特征提取与分析系统 | |
JP4926266B2 (ja) | 学習データ作成装置、学習データ作成方法及びプログラム | |
JP2019153092A (ja) | 位置特定装置、位置特定方法及びコンピュータプログラム | |
CN110334628B (zh) | 一种基于结构化随机森林的室外单目图像深度估计方法 | |
JP4964798B2 (ja) | 画像辞書生成装置,画像辞書生成方法,画像辞書生成プログラムおよびその記録媒体 | |
CN116415020A (zh) | 一种图像检索的方法、装置、电子设备及存储介质 | |
CN112687079A (zh) | 灾害预警方法、装置、设备及存储介质 | |
JP4477439B2 (ja) | 画像分割処理システム | |
Fan et al. | Pulmonary nodule detection using improved faster R-CNN and 3D Resnet | |
CN115641317B (zh) | 面向病理图像的动态知识回溯多示例学习及图像分类方法 | |
JP5382786B2 (ja) | 特徴量生成装置、特徴量生成方法および特徴量生成プログラム、ならびにクラス判別装置、クラス判別方法およびクラス判別プログラム | |
Chalup et al. | A computational approach to fractal analysis of a cityscape's skyline | |
JP4434868B2 (ja) | 画像分割処理システム | |
JP5391876B2 (ja) | 代表特徴抽出システム、方法およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100114 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20100331 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110909 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110927 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111109 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120327 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120328 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150406 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |