JP2009193183A - 画像辞書生成装置,画像辞書生成方法,画像辞書生成プログラムおよびその記録媒体 - Google Patents

画像辞書生成装置,画像辞書生成方法,画像辞書生成プログラムおよびその記録媒体 Download PDF

Info

Publication number
JP2009193183A
JP2009193183A JP2008031210A JP2008031210A JP2009193183A JP 2009193183 A JP2009193183 A JP 2009193183A JP 2008031210 A JP2008031210 A JP 2008031210A JP 2008031210 A JP2008031210 A JP 2008031210A JP 2009193183 A JP2009193183 A JP 2009193183A
Authority
JP
Japan
Prior art keywords
image
representative
cluster
region
learning data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008031210A
Other languages
English (en)
Other versions
JP4964798B2 (ja
Inventor
Yongqing Sun
泳青 孫
Satoshi Shimada
聡 嶌田
Yukinobu Taniguchi
行信 谷口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2008031210A priority Critical patent/JP4964798B2/ja
Publication of JP2009193183A publication Critical patent/JP2009193183A/ja
Application granted granted Critical
Publication of JP4964798B2 publication Critical patent/JP4964798B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

【課題】画像に対して自動的に画像の意味を示すラベルを付与するときに用いる精度のよい画像辞書を生成することができるようにする。
【解決手段】ある意味に関する画像群を学習データとして収集しておく。領域分割部102は,学習データの各画像を特徴量に従って領域に分割し,代表領域クラスタ抽出部103は,分割によって得られた領域群に対してクラスタリングを行って,その中で意味をよく表現できる複数オブジェクトに対応する代表領域クラスタを抽出する。代表領域クラスタモデル学習部104は,各代表領域クラスタに含まれるサンプルを学習データとして代表領域クラスタモデルを構築し,重み付け係数算出部105は,代表領域クラスタモデルの意味に対する重要度を表す重み付け係数を算出する。これらの代表領域クラスタモデルと重み付け係数の情報を画像辞書として画像辞書記憶部106に格納する。
【選択図】図1

Description

本発明は,画像に対して自動的に画像の意味を示すラベルを付与するようなときに用いる画像辞書を生成する技術に係り,特に,画像の領域情報を用いて画像辞書を生成する装置,方法,プログラムおよびそのプログラムの記録媒体に関する。
従来の画像辞書生成方法として,次のような方法がある。
(1)まず,ある意味に関する画像群を学習データとして収集する。次に,学習データから色,テクスチャ,形状などの特徴量(L個)を別々に抽出する。最後に,学習手法を用いて,個々の特徴空間において特徴識別モデル(L個)を構築する。以上の処理により,学習データから求めた特徴識別モデル(L個)と各モデルの重み付け係数で構成した画像辞書を生成することができる(非特許文献1参照)。
(2)画像における画像の意味を表す基本単位は領域と考えられるので,まず,収集した学習データに対して領域分割を行う。次に,学習データの領域群におけるクラスタリングをし,領域数が最大となる領域クラスタを画像の意味を表す最大領域クラスタとして抽出する。最後に,最大領域クラスタから求めた領域モデルを学習することで画像辞書を生成することができる(非特許文献2参照)。
なお,非特許文献3には,本発明の実施例で用いることができる画像を領域分割する方法の一例が記載されている。
A.Yanagawa,S.-F.Chang,L.Kennedy ,and W.Hsu ,"Columbia University's Baseline detectors for 374 LSCOM Semantic Visual Concepts ",Columbia University ADVENT Technical Report #222-2006-8 ,March 20,2007. Yongqing Sun,Satoshi Shimada ,Masashi Morimoto,"Visual pattern discovery using web images ",ACM MIR workshop,2006. Yongqing Sun,Shinji Ozawa ,"HIRBIR: A Hierarchical Approach for Region-based Image Retrieval",ACM Multimedia Systems Journal,10(6): 559-569 (2005) .
上記の非特許文献1に示されるような画像辞書生成方法は,学習データの画像全体に対する色,テクスチャ,形状などの物理特徴量を用いて画像辞書を求めるので,画像の物理的な特徴と画像の意味との対応関係を明確に規定できない。そのため,精度が低いという問題がある。
また,上記の非特許文献2にされるような画像辞書生成方法は,一つの領域クラスタだけで画像をモデル化しているので,複数の領域で構成される画像に対して,精度が悪くなる。例えば,“ビーチ”という画像の意味は,“海”,“太陽”,“砂”などの複数の代表オブジェクトを表した複数の代表領域の集合で表現されるので,一つのオブジェクト(例えば,海)に対応する領域モデルだけで“ビーチ”の意味を表現することは不十分である。
本発明は上記問題点の解決を図り,精度のよい画像辞書を生成する手段を提供することを目的とする。
画像の意味の表現には,以下の二つの観点がある。
(1)画像の意味を表した基本的な単位は画像の領域と考えられる。ここで,画像の領域は,実世界のオブジェクト(例:芝生,人,山など)に対応する。
(2)画像の意味は,画像における代表オブジェクトを表した複数の代表領域で表現される。
上記の点を踏まえて,本発明は,画像辞書の精度が低いという従来技術の問題を解決するために,学習データから意味をよく表現できる代表オブジェクトに対応する代表領域クラスタを抽出し,個々の代表領域クラスタに対して代表領域クラスタモデルを構築して,各代表領域クラスタモデルに適切な重み付け係数を求めることにより,複数の代表領域クラスタモデルとそれに対応する重み付け係数で構成した画像辞書を生成する手段を設ける。これにより,画像辞書の精度を向上させる。ここで,オブジェクトとは,画像中の意味的にまとまりのある撮像対象のことをいう。
具体的には,本発明は,ある意味に関する画像群を学習データとして取得する学習データ取得手段と,前記収集した学習データに対して領域を分割する領域分割手段と,前記領域分割手段で得られた学習データの領域群に対してクラスタリングを行って,意味をよく表現できる複数オブジェクトに対応する代表領域クラスタを抽出する代表領域クラスタ抽出手段と,前記抽出した各代表領域クラスタに対し,代表領域クラスタに含まれる画像サンプルを学習データとして代表領域クラスタモデルを構築する代表領域クラスタモデル学習手段と,前記複数の代表領域クラスタモデルの意味に対する重要度を表す重み付け係数を算出する重み付け係数算出手段とを用い,これらにより算出した情報から画像辞書を生成する。
本発明において,前記重み付け係数算出手段では,各代表領域クラスタに属する,代表領域クラスタの領域数と代表領域クラスタにおける分布のばらつきに基づいて,重み付け係数を算出することができる。
本発明では,学習データから画像の意味を表すオブジェクトに対応する複数の代表領域クラスタを抽出し,個々の代表領域クラスタに対して代表領域クラスタモデルを構築して,各代表領域クラスタに適切な重み付け係数を求めることにより,複数の代表領域クラスタモデルとそれに対応する重み付け係数で構成した画像辞書を生成する手段を設けることで,高精度な画像辞書を生成することができる。
本発明の実施の形態を以下に説明する。本発明の一実施形態に係る画像辞書生成装置の構成例を図1に示す。同図における画像辞書生成装置10は,学習データ記憶部100と,学習データ取得部101と,領域分割部102と,代表領域クラスタ抽出部103と,代表領域クラスタモデル学習部104と,重み付け係数算出部105と,画像辞書記憶部106とから構成される。各部の処理内容について,以下に説明する。
学習データ記憶部100は,あらかじめ意味ラベルとそれに関連する画像を手動で収集し,それらを格納する。すなわち,学習データ記憶部100には,多数の画像と各画像に対して人間が付与した意味ラベルとの対応情報が格納されている。学習データ記憶部100は,学習データ取得部101から意味ラベルを指定した学習データ取得要求に対し,格納している画像群の中から,指定された意味ラベルを持つ画像を収集して,学習データとして学習データ取得部101へ出力する。
学習データ取得部101は,学習データ記憶部100に意味ラベルを指定して学習データ取得要求を出すことにより,学習データ記憶部100から同じ意味ラベルを持つ代表画像を学習データとして取得する。取得した学習データを領域分割部102へ出力する。
領域分割部102は,学習データ取得部101から意味に関する学習データを受け取ると,個々の画像に対して,領域分割を行う。全部の学習データから得られた領域で構成した領域群を代表領域クラスタ抽出部103へ出力する。
代表領域クラスタ抽出部103は,領域分割部102から学習データの領域群を受け取ると,領域群に対してクラスタリングを行い,画像の意味をよく表現できる代表的なオブジェクトに対応する複数の領域クラスタを代表領域クラスタとして抽出する。抽出した複数の代表領域クラスタを代表領域クラスタモデル学習部104へ出力する。この処理の詳細については,図3を用いて後述する。
代表領域クラスタモデル学習部104は,代表領域クラスタ抽出部103から複数の代表領域クラスタを受け取ると,学習手法により個々の代表領域クラスタに対して,代表領域クラスタモデルを求める。代表領域クラスタと求めた代表領域クラスタモデルを重み付け係数算出部105へ出力する。
重み付け係数算出部105は,代表領域クラスタモデル学習部104から代表領域クラスタと求めた代表領域クラスタモデルを受け取る。複数の代表領域クラスタを用いて,各代表領域クラスタの重要度に応じた重み付け係数を算出する。代表領域クラスタモデルと算出した重み付け係数を画像辞書記憶部106に出力する。この処理の詳細については,図4を用いて後述する。
画像辞書記憶部106は,重み付け係数算出部105より受け取った複数の代表領域クラスタモデルとそれらに対応付ける重み付け係数を画像辞書として記憶する。以上の構成により,画像辞書が生成できる。
次に,上記の構成における基本動作を説明する。図2は,本発明の一実施形態に係る画像辞書生成装置10の基本動作を示すフローチャートである。
(1)ステップS201:学習データ取得部101は,ある意味に関する学習データを学習データ記憶部100から取得する。
(2)ステップS202:次に,領域分割部102は,ステップS201で学習データ取得部101が取得した学習データに対して,領域分割を行う。領域分割の手法については,例えば非特許文献3に記載されているような従来の技術を用いればよい。領域分割の手法については種々の方法が知られているので,ここでの詳細な説明は省略する。
(3)ステップS203:代表領域クラスタ抽象部103は,ステップS202で得られた学習データの領域群において,意味をよく表現できる複数の代表的なオブジェクトに対応する代表領域クラスタを抽出する(図3により後述)。抽出された代表領域クラスタの個数をMとする。また,抽出された各代表領域クラスタの番号(インデックス)をm(m=1,2,…,M)とする。
(4)ステップS204:代表領域クラスタモデル学習部104は,まずm=1として,最初の代表領域クラスタを処理対象として選択する。
(5)ステップS205:代表領域クラスタモデル学習部104は,代表領域クラスタ毎に,クラスタに属する領域の特徴空間での分布をモデル化する。モデル化の実施例として,学習手法は“Gassian Bayes Classifier”を用いればよい。Gassian Bayes Classifierで求めた代表領域クラスタモデルに関するモデルパラメータは,
・特徴空間における学習データの平均ベクトルυ,
・特徴空間における学習データの分散共分散行列Σ,
であり,次のように算出される。
m番目の代表領域クラスタに属する領域の個数をL個とする。これらの各領域の学習データから得られた特徴量をXj とする(j=1,2,…,L)。特徴量Xj は,n次元の特徴空間におけるベクトルデータとして表されるものである。
平均ベクトルυ:
υ=Σj=1 L (Xj )/L
分散共分散行列Σ:
Σ={Σj=1 L (Xj −υ)(Xj −υ)T }/L
ここで,Σj=1 L f(j)は,j=1からj=Lまでのf(j)の総和を表す。
(6)ステップS206:すべてのM個の代表領域クラスタにおいて,ステップS205の処理を行ったかを判定する。行っていなければ,m=m+1とし,次の代表領域クラスタについて,ステップS205の処理を繰り返す。M個の代表領域クラスタについて処理を終えたならば,ステップS207へ移行する。
(7)ステップS207:重み付け係数算出部105は,代表領域クラスタモデル学習部104がステップS205で求めた複数の代表領域クラスタモデルに対して,各代表領域クラスタモデルに対応付ける重み付け係数を算出する。具体的な算出方法の例は,図4を参照して後述する。
(8)ステップS208:ステップS207で得られたM個の代表領域クラスタモデルとそれらに各々対応付ける重み付け係数を,ある意味に関する画像辞書のデータベースとして画像辞書記憶部106に格納する。
図3は,代表領域クラスタ抽出部103の処理フローチャートであり,図2のステップS203の詳細な処理を示している。
(1)ステップS301:領域分割部102で検出した学習データの領域群を読み込む。
(2)ステップS302:領域毎に特徴量を抽出する。例えば,色ヒストグラムを領域の特徴量として抽出すればよい。
(3)ステップS303:クラスタリングを精度よく行うために,学習データの各領域から抽出した特徴量の正規化を行う。ここで,正規化は以下の手法で行えばよい。特徴空間はn次元であるとする。
学習データの画像を領域分割して得られたR個の各領域i(i=1,2,…,R)の特徴量を(xi1,…,xis,…,xin),s=1,2,…,nとすると,それを正規化した特徴量(x′i1,…,x′is…,x′in)は,次式で求められる。
x′is={xis−xmin (s)}/{xmax (s)−xmin (s)}
ここで,xmax (s)は,R個の領域iの中でのs番目の特徴量の最大値,xmin (s)はR個の領域iの中でのs番目の特徴量の最小値である。
(4)ステップS304:正規化後の特徴空間において学習データの領域群に対して,適当なクラスタリング手法を用いてN個の領域クラスタに分類する。クラスタリング手法の一例として,従来技術のFuzzy K−meansというアルゴリズムを用いることができる。クラスタリング手法としては,この他にも周知の種々の方法を用いることができる。クラスタリングは,基本的には特徴量が類似する領域群を反覆的または階層的に統合する処理である。
(5)ステップS305:次に,ステップS306からS309までを,各領域クラスタに対して繰り返すことにより,N個の領域クラスタから代表領域クラスタを選定する。このため,まず,n=1として,最初の領域クラスタを処理対象として選択する。
(6)ステップS306:n番目の領域クラスタにおける領域の数が予め設定しておいた一定の閾値以上になっているかを判定し,閾値以上になっている場合には,ステップS307へ移行する。そうでなければ,ステップS309に移行する。
(7)ステップS307:領域クラスタにおける領域の平均面積が予め設定しておいた一定の閾値以上になるかを判定し,閾値以上になる場合,ステップS308へ移行する。そうでなければ,ステップS309へ移行する。
(8)ステップS308:現在処理対象となっているn番目の領域クラスタを,代表領域クラスタとして選定する。
(9)ステップS309:すべてのN個の領域クラスタにおいて上記ステップS306からS308までの処理を行ったかを判定する。未処理の領域クラスタがあれば,n=n+1として,ステップS306へ移行し,次の領域クラスタについて同様に処理を繰り返す。すべての領域クラスタに対して処理を行ったならば代表領域クラスタの抽出処理を終了する。
以上のステップS301からS309に至る処理により,N個の領域クラスタに対して領域クラスタの領域数と領域平均面積が予め設定した閾値以上になるM個の領域クラスタを代表領域クラスタとして抽出することができる。なお,ステップS307においては,領域平均面積ではなく,領域クラスタにおける全領域の面積を所定の閾値との比較対象としてもよい。また,領域の面積は,領域の画素数を単位とした値でもよく,また画像の全面積に対する領域の面積の割合として算出した値でもよい。
ここでは,代表領域クラスタを選定する条件として,領域クラスタにおける領域の数および領域の面積を用いたが,意味をよく表現できる複数オブジェクトに対応する領域クラスタを代表領域クラスタとするための条件として,さらに他の条件を用いてもよい。
図4は,重み付け係数算出部105の処理フローチャートであり,図2のステップS207の詳細な処理を示している。
(1)ステップS401:重み付け係数算出部105は,代表領域クラスタ(M個)を読み込む。
(2)ステップS402:M個の各代表領域クラスタに対する重み付け係数を算出するため,まずm=1として,最初の代表領域クラスタを処理対象として選択する。
(3)ステップS403:代表領域クラスタにおける特徴量の分布のばらつきδm を求める。ばらつきδm の値の算出例としては,例えば以下の方法が挙げられる。
m番目(m=1,2,…,M)の代表領域クラスタにおける各領域j(j=1,2,…,L)の特徴量Xj を,(xj1,…,xjs,…,xjn),s=1,2,…,nとする。
m番目の代表領域クラスタのばらつきδm は,次式により算出される。
δm ={Σs=1 n Σj=1 L (xjs−μs 2 }/(n×L)
μs =Σj=1 L (xjs)/L
(ただし,Σs=1 n はs=1からnまでの総和,Σj=1 L はj=1からLまでの総和を表す。)
なお,このばらつきδm の算出方法は一例であり,他に分散や標準偏差値等を用いることもできる。ばらつきδm は,代表領域クラスタに含まれる各領域の特徴量の平均値からのズレの量を表しているものであればよい。
(4)ステップS404:代表領域クラスタモデルの重み付け係数を算出する。代表領域クラスタの重み付けを算出するときに,二つの観点がある。
〔観点1〕代表領域クラスタに属する領域数が多ければ,画像の意味を表現するのに重要となる再現性の高いオブジェクトに対応するクラスタであると考えられる。
〔観点2〕ばらつきが小さい代表領域クラスタは,画像の意味の表現に重要となる代表的なオブジェクトに対応するクラスタと考えられる。例えば,“tiger”という意味に関する画像群において,虎の頭,体というオブジェクトは再現性が高く,画像間の類似性が高いと考えられる。
以上の観点を鑑みると,m番目(m=1,2,…,M)の代表領域クラスタに対応付ける重み付け係数wm は,m番目の代表領域クラスタの領域数Lm とばらつきδm を用いて次式で算出できる。
m =(Lm /Σm=1 M m )×(eの−δm 乗)
(5)ステップS405:すべてのM個の代表領域クラスタに対して,ステップS403,S404の処理を行ったかを判定する。行っていなければ,m=m+1として,ステップS403へ戻り,次の代表領域クラスタに対して同様に処理を繰り返す。すべて行ったならば,重み付け係数の算出処理を終了する。
図5は,学習データ記憶部100に格納されている学習データの例を示している。学習データ記憶部100には,予め収集されたある意味に関する画像データが多数格納されている。例えば,「虎」を表す意味ラベル“tiger”毎に,図5(A),(B)に示されるような種々の虎の画像データ(通常はカラー画像)が学習データ記憶部100に多数格納されている。
図6は,図5(A),(B)の意味ラベル“tiger”を持つ画像データから,学習データ取得部101,領域分割部102,代表領域クラスタ抽出部103の処理によって得られた代表領域クラスタの例を示している。
図6(A)は,図5(A)の画像から得られた代表領域クラスタであり,黒で塗りつぶした部分以外の領域が,代表領域クラスタである。また,図6(B1),(B2)は,図5(B)の画像から得られた代表領域クラスタである。図5(B)の学習データでは,1枚の画像から複数の代表領域クラスタが得られている。
この代表領域クラスタの例から明らかなように,本発明では,代表領域クラスタを用い,画像の意味を“画像の中で広い領域を占め,かつ,頻繁に出てくる画像の構成要素の組み合わせ”で表現することを主要な特徴としている。
図7は,画像辞書記憶部106に記憶される画像辞書のデータ構造の例を示している。図7(A)のように,画像辞書記憶部106には,代表オブジェクト数:Mと,M個の代表オブジェクトモデルi(i=1,2,…,M)のデータが格納される。各代表オブジェクトモデルiのデータは,代表領域クラスタモデル学習部104で算出された平均ベクトルυi と分散共分散行列Σi のモデルパラメータである。また,重み付け係数wi は,重み付け係数算出部105で算出された重み付け係数である。
代表オブジェクト数は,ある意味に関する画像群から得られた代表領域クラスタの数である。代表領域クラスタは,画像中の特徴的な領域のかたまりであり,画像中に撮影されている何らかの意味のある対象(オブジェクト)に対応していると考えられる。そこで,ここでは代表領域クラスタの画像情報を代表オブジェクトと称している。
図6に示した代表領域クラスタの例では,“tiger”に関する画像辞書として,画像辞書記憶部106には,図7(B)に示すような代表オブジェクト数(代表領域クラスタ数)と,図6(A)の代表領域クラスタのモデルパラメータυ1 ,Σ1 および重み付け係数w1 と,図6(B1)の代表領域クラスタのモデルパラメータυ2 ,Σ2 および重み付け係数w2 と,図6(B2)の代表領域クラスタのモデルパラメータυ3 ,Σ3 および重み付け係数w3 などの情報が格納されることになる。
画像辞書生成装置10で生成した画像辞書は,未知画像に対する意味ラベルの付与などに用いることができる。図8に,画像辞書を用いて未知画像に対して意味ラベルを付与する処理のフローチャートを示す。以下,図8に従って未知画像への意味ラベル付与の処理の流れを説明する。
(1)ステップS501:意味ラベル付与の対象となる新しい画像(未知画像という)を入力する。
(2)ステップS502:入力した未知画像を,画像辞書生成時における領域分割部102と同じ手法により領域分割する(図2のステップS202の説明を参照)。
(3)ステップS503:未知画像をT個の領域に分割したとする。その分割した各領域のn次元特徴空間における特徴量Rt (t=1,2,…,T)を抽出する。
(4)ステップS504:意味ラベルに応じて図7(A)に示されるような情報が格納された,ある意味に関する画像辞書から代表オブジェクトモデルのモデルパラメータである平均ベクトルυm ,分散共分散行列Σm および重み付け係数wm (m=1,2,…,M)を読み出す。
(5)ステップS505:読み出した代表オブジェクトモデルと未知画像との類似度Simを,次式に従って算出する。未知画像における各領域の特徴量を,R1 ,R2 ,…,Rt ,…,RT とする。また,ある意味に関する画像辞書から読み出されたモデル情報が,(υ1 ,Σ1 ,w1 ),(υ2 ,Σ2 ,w3 ),…,(υm ,Σm ,wm ),…,(υM ,ΣM ,wM )であったとする。
Figure 2009193183
式中,‖Σm ‖はΣm のノルム,(Rt −υm T は(Rt −υm )の転置行列,Σm -1はΣm の逆行列を表している。
(6)ステップS506:算出した類似度Simと予め設定された閾値とを比較し,類似度Simが閾値より大きければ,現在の画像辞書が持つ意味ラベルを未知画像に付与する。類似度Simが閾値より小さければ,意味ラベルは付与しない。
(7)ステップS507:他の意味ラベルを持つ画像辞書がある場合,ステップS504へ戻り,その画像辞書について同様に処理を繰り返す。
なお,上記処理において,意味ラベルに関連付けられたすべての画像辞書について類似度Simを算出し,その中で最大の類似度Simとなる画像辞書の意味ラベルを未知画像に付与するようにしてもよいし,最大の類似度Simがある閾値以上である場合にだけ,その意味ラベルを付与するような実施も可能である。
ここでは,画像辞書を未知画像への意味ラベル付与に用いる例を説明したが,例えば大量な画像群の中から「虎」の画像を検索するというような画像検索に,本発明により生成した画像辞書を用いることもできる。このときにも上記類似度Simの算出を行い,目的とする画像であるかどうかの判定を行う。
以上の画像辞書の生成処理は,コンピュータとソフトウェアプログラムとによって実現することができ,そのプログラムをコンピュータ読み取り可能な記録媒体に記録して提供することも,ネットワークを通して提供することも可能である。
本発明の一実施形態に係る画像辞書生成装置の構成例を示す図である。 画像辞書生成装置の基本動作を示すフローチャートである。 代表領域クラスタ抽出部の処理フローチャートである。 重み付け係数算出部の処理フローチャートである。 学習データの例を示す図である。 代表領域クラスタの例を示す図である。 画像辞書のデータ構造の例を示す図である。 画像辞書の利用例を示すフローチャートである。
符号の説明
10 画像辞書生成装置
100 学習データ記憶部
101 学習データ取得部
102 領域分割部
103 代表領域クラスタ抽出部
104 代表領域クラスタモデル学習部
105 重み付け係数算出部
106 画像辞書記憶部

Claims (6)

  1. 画像の意味の解析に用いる画像辞書を生成する画像辞書生成装置であって,
    ある意味に関する意味ラベルが付与された画像群を学習データとして取得する学習データ取得手段と,
    取得した学習データの画像を,画像の特徴量に基づいて複数の領域に分割する領域分割手段と,
    前記領域分割手段で得られた学習データの領域群に対して類似する特徴量を持つ領域を統合することによりクラスタリングを行い,クラスタリング結果の領域クラスタの中から,少なくとも領域クラスタにおける領域の数または領域の面積を条件として含む所定の代表領域クラスタの選定条件に基づき,代表領域クラスタを抽出する代表領域クラスタ抽出手段と,
    抽出した各代表領域クラスタに対し,代表領域クラスタに含まれる画像サンプルを学習データとして代表領域クラスタモデルを構築し,構築した代表領域クラスタモデルを表すモデルパラメータを出力する代表領域クラスタモデル学習手段と,
    前記各代表領域クラスタモデルの意味に対する重要度を表す重み付け係数を,前記代表領域クラスタに属する領域群の特徴量に基づいて算出する重み付け係数算出手段とを備え,
    前記学習データの画像群に付与された意味ラベル毎に,前記各代表領域クラスタモデルのモデルパラメータと前記重み付け係数とを画像辞書として格納する
    ことを特徴とする画像辞書生成装置。
  2. 前記重み付け係数算出手段は,
    前記各代表領域クラスタに属する領域群の領域の数と,該代表領域クラスタに属する領域群の特徴量の分布のばらつきに基づいて,前記領域の数が多いほど重み付け係数の値が大きく,前記ばらつきが大きいほど重み付け係数の値が小さくなるように重み付け係数を算出する
    ことを特徴とする請求項1記載の画像辞書生成装置。
  3. 画像辞書生成装置が画像の意味の解析に用いる画像辞書を生成する画像辞書生成方法であって,
    ある意味に関する意味ラベルが付与された画像群を学習データとして取得する学習データ取得過程と,
    取得した学習データの画像を,画像の特徴量に基づいて複数の領域に分割する領域分割過程と,
    前記領域分割過程で得られた学習データの領域群に対して類似する特徴量を持つ領域を統合することによりクラスタリングを行い,クラスタリング結果の領域クラスタの中から,少なくとも領域クラスタにおける領域の数または領域の面積を条件として含む所定の代表領域クラスタの選定条件に基づき,代表領域クラスタを抽出する代表領域クラスタ抽出過程と,
    抽出した各代表領域クラスタに対し,代表領域クラスタに含まれる画像サンプルを学習データとして代表領域クラスタモデルを構築し,構築した代表領域クラスタモデルを表すモデルパラメータを出力する代表領域クラスタモデル学習過程と,
    前記各代表領域クラスタモデルの意味に対する重要度を表す重み付け係数を,前記代表領域クラスタに属する領域群の特徴量に基づいて算出する重み付け係数算出過程とを有し,
    前記学習データの画像群に付与された意味ラベル毎に,前記各代表領域クラスタモデルのモデルパラメータと前記重み付け係数とを画像辞書として格納する
    ことを特徴とする画像辞書生成方法。
  4. 前記重み付け係数算出過程では,
    前記各代表領域クラスタに属する領域群の領域の数と,該代表領域クラスタに属する領域群の特徴量の分布のばらつきに基づいて,前記領域の数が多いほど重み付け係数の値が大きく,前記ばらつきが大きいほど重み付け係数の値が小さくなるように重み付け係数を算出する
    ことを特徴とする請求項3記載の画像辞書生成方法。
  5. 請求項3または請求項4記載の画像辞書生成方法を,コンピュータに実行させるための画像辞書生成プログラム。
  6. 請求項5記載の画像辞書生成プログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2008031210A 2008-02-13 2008-02-13 画像辞書生成装置,画像辞書生成方法,画像辞書生成プログラムおよびその記録媒体 Expired - Fee Related JP4964798B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008031210A JP4964798B2 (ja) 2008-02-13 2008-02-13 画像辞書生成装置,画像辞書生成方法,画像辞書生成プログラムおよびその記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008031210A JP4964798B2 (ja) 2008-02-13 2008-02-13 画像辞書生成装置,画像辞書生成方法,画像辞書生成プログラムおよびその記録媒体

Publications (2)

Publication Number Publication Date
JP2009193183A true JP2009193183A (ja) 2009-08-27
JP4964798B2 JP4964798B2 (ja) 2012-07-04

Family

ID=41075158

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008031210A Expired - Fee Related JP4964798B2 (ja) 2008-02-13 2008-02-13 画像辞書生成装置,画像辞書生成方法,画像辞書生成プログラムおよびその記録媒体

Country Status (1)

Country Link
JP (1) JP4964798B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013109389A (ja) * 2011-11-17 2013-06-06 Nippon Telegr & Teleph Corp <Ntt> 画像辞書生成装置、画像辞書生成方法および画像辞書生成プログラム
JP2014115737A (ja) * 2012-12-06 2014-06-26 Nippon Telegr & Teleph Corp <Ntt> 画像辞書生成装置、画像辞書生成方法及びコンピュータプログラム
JP2015041225A (ja) * 2013-08-21 2015-03-02 日本電信電話株式会社 情報処理装置、情報抽出装置、及びプログラム

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003087772A (ja) * 2001-09-10 2003-03-20 Fujitsu Ltd 画像制御装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003087772A (ja) * 2001-09-10 2003-03-20 Fujitsu Ltd 画像制御装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013109389A (ja) * 2011-11-17 2013-06-06 Nippon Telegr & Teleph Corp <Ntt> 画像辞書生成装置、画像辞書生成方法および画像辞書生成プログラム
JP2014115737A (ja) * 2012-12-06 2014-06-26 Nippon Telegr & Teleph Corp <Ntt> 画像辞書生成装置、画像辞書生成方法及びコンピュータプログラム
JP2015041225A (ja) * 2013-08-21 2015-03-02 日本電信電話株式会社 情報処理装置、情報抽出装置、及びプログラム

Also Published As

Publication number Publication date
JP4964798B2 (ja) 2012-07-04

Similar Documents

Publication Publication Date Title
CN106815481B (zh) 一种基于影像组学的生存期预测方法及装置
Ugarriza et al. Automatic image segmentation by dynamic region growth and multiresolution merging
US8391618B1 (en) Semantic image classification and search
EP3065084A1 (en) Image recognition method, image recognition device, and recording medium
US9563822B2 (en) Learning apparatus, density measuring apparatus, learning method, computer program product, and density measuring system
CA3013048A1 (en) Automated image analysis to assess reproductive potential of human oocytes and pronuclear embryos
JP5333589B2 (ja) 代表特徴抽出システムおよび方法
JP2014029732A (ja) 画像の検索および読み出しに関する基準を用いて画像内容の描写を生成する方法
US20130063468A1 (en) Image processing apparatus, image processing method, and program
Seetharaman et al. Texture characterization, representation, description, and classification based on full range Gaussian Markov random field model with Bayesian approach
CN104820841B (zh) 基于低阶互信息和光谱上下文波段选择的高光谱分类方法
CN112949772A (zh) 基于影像组学的胃癌多维特征提取与分析系统
JP4926266B2 (ja) 学習データ作成装置、学習データ作成方法及びプログラム
JP2019153092A (ja) 位置特定装置、位置特定方法及びコンピュータプログラム
CN110334628B (zh) 一种基于结构化随机森林的室外单目图像深度估计方法
JP4964798B2 (ja) 画像辞書生成装置,画像辞書生成方法,画像辞書生成プログラムおよびその記録媒体
CN116415020A (zh) 一种图像检索的方法、装置、电子设备及存储介质
CN112687079A (zh) 灾害预警方法、装置、设备及存储介质
JP4477439B2 (ja) 画像分割処理システム
Fan et al. Pulmonary nodule detection using improved faster R-CNN and 3D Resnet
CN115641317B (zh) 面向病理图像的动态知识回溯多示例学习及图像分类方法
JP5382786B2 (ja) 特徴量生成装置、特徴量生成方法および特徴量生成プログラム、ならびにクラス判別装置、クラス判別方法およびクラス判別プログラム
Chalup et al. A computational approach to fractal analysis of a cityscape's skyline
JP4434868B2 (ja) 画像分割処理システム
JP5391876B2 (ja) 代表特徴抽出システム、方法およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100114

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20100331

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110909

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110927

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111109

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120327

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120328

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150406

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees