JP6194260B2 - 画像分類装置、画像分類方法及び画像分類プログラム - Google Patents

画像分類装置、画像分類方法及び画像分類プログラム Download PDF

Info

Publication number
JP6194260B2
JP6194260B2 JP2014032197A JP2014032197A JP6194260B2 JP 6194260 B2 JP6194260 B2 JP 6194260B2 JP 2014032197 A JP2014032197 A JP 2014032197A JP 2014032197 A JP2014032197 A JP 2014032197A JP 6194260 B2 JP6194260 B2 JP 6194260B2
Authority
JP
Japan
Prior art keywords
partial region
image
input image
partial
category
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2014032197A
Other languages
English (en)
Other versions
JP2015158739A (ja
Inventor
之人 渡邉
之人 渡邉
豪 入江
豪 入江
新井 啓之
啓之 新井
行信 谷口
行信 谷口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2014032197A priority Critical patent/JP6194260B2/ja
Publication of JP2015158739A publication Critical patent/JP2015158739A/ja
Application granted granted Critical
Publication of JP6194260B2 publication Critical patent/JP6194260B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、教師データがなくとも画像に写る被写体の部分的な差異を自動検出し、検出した部分的な差異に基づく精細な画像カテゴリ分類を実現する画像分類装置、画像分類方法及び画像分類プログラムに関する。
デジタルカメラ、スマートホン等の携帯撮影デバイスの普及により、一個人が撮影するデジタル写真の枚数が急速に増大した。それに伴い、画像を利用したコミュニケーションが発達し、WWW(World Wide Web)上には大量の画像が蓄積されている。
計算機上の画像は通常、ファイル名、作成日時や画像サイズの情報を用いた分類を行うことができる。しかし、目的の画像を探す場合等は、画像がいったい何を写しているのか、どのようなカテゴリの画像なのかといった情報が重要となる。ここでカテゴリとは、例えば、被撮影物体の種別を表す。ユーザが画像をカテゴリに分類するためには、人手によって付けられた文章によるタグによって行われることが一般的である。
また画像の特徴とカテゴリとの関係を計算機に学習させることで、画像を自動分類することも可能である。カテゴリ毎に画像の特徴を学習させるためには、学習用画像のカテゴリが既知である必要がある。従って学習用画像を用意するために、例えば予め目視で画像のカテゴリを判別しておく等、人手を必要とする。しかし、画像に対して1枚ずつ手作業で判別を行うことは、極めて手間のかかる作業である。さらに、世界中には膨大な数の物体があり、その種類は増え続けている。そのためあらゆる物体に対して、予め画像を収集し、目視でカテゴリを判別し、計算機によって学習を行うということは非常に困難である。
このように、近年のデジタル画像の作成や取得の容易化と比較し、画像のカテゴリ分類の自動化は困難であり、画像の内容に従った分類等、画像情報のみを用いた画像のカテゴリ分類が望まれている。
現在のところ、画像をカテゴリに分類する方法としては、例えば、テキストと画像で表現された情報に対して、テキストによって画像をカテゴリ情報毎に分類し、画像特徴量を用いて分類された画像をさらにグループ化する手法が知られている(例えば、特許文献1参照)。ここでカテゴリ情報は、予めカテゴリ分類したデータを学習データとして自動分類されたものであり、例えばWWW上の単語を利用して分類する。この手法の処理手順を以下に説明する。
(1)入力された文字列を取得する。
(2)取得した文字列が、例えば画像ファイル名やカテゴリ情報等、予め画像に関連付けられたテキスト情報中に存在する場合、文字列を関連テキスト情報に含む画像を取得し、関連テキストとして含むカテゴリ情報毎に分類する。
(3)関連テキストに含むカテゴリ情報毎に分類された画像群に対して、画像特徴量に基づいてグループ化する。ここで画像特徴とは、例えばColor Histogramを用いる。また画像特徴量に基づくグループ化の方法は、例えば、画像特徴量で、各画像間のユークリッド距離を求め、その距離に基づいて凝集法によりクラスタリングする。
(4)グループ化された画像を提示する。
以上により、カテゴリに分類された画像群を取得することができる。
この手法では、画像に付随するテキストやカテゴリ情報が既知でなくてはならない。しかし現在、WWW、計算機、携帯電話等に蓄積されている画像全てがこれらの情報を持つわけではなく、画像情報のみから画像を分類することは、実用上大きな課題となっている。
画像情報のみから画像を分類する手法としては、例えば非特許文献1に記載があるK平均法等の、クラスタリング手法が知られている。クラスタリングは学習データを必要とせず、画像を類似したグループへ分類することができる。K平均法等のクラスタリング法によって画像を分類する手法には、例えば特許文献2に記載のものが知られている。この手法の処理手順を以下に説明する。
(1)画像データから特徴量を抽出する。抽出特徴量としては、例えば画像全体の色調、縦横比、輝度や色の分布状態、エッジの分布状態、平坦なエリアの分布状態等を用いる。
(2)複数の画像データから抽出した特徴量について互いの関連性を評価する。関連性とは、例えば、各々の画像データに関連付けられた特徴量ベクトル間の距離および角度の合計が小さいものを関連性大として評価する。
(3)取得した関連性を基に、画像データの特徴量によってクラスタリングを行う。クラスタリング手法については、公知の手法を用いる。
(4)クラスタリング結果を出力する。
以上により、学習データを用いることなく、画像を分類することができる。
しかしながら、この手法では、画像全体を特徴量ベクトルで記述し、この特徴量ベクトルに基づいてクラスタリングを実施することになるため、飽くまで画像全体の類似性を反映した分類結果しか得ることができない。すなわち、例えば図9に示すカテゴリ1とカテゴリ2のような、全体像が類似していながら、細部が異なるようなカテゴリを区別することが困難である。図9は、全体像が類似していながら細部が異なるようなカテゴリの例を示す図である。また、同じカテゴリに属する被写体であっても、サイズや画像中の位置の変化によって全体像の類似性が損なわれると、同じカテゴリであると判定することは難しい。カテゴリを区別するためには、カテゴリ間の差異を精細に検出し、差異に基づいてクラスタを生成する必要がある。
複数画像中の特徴的な細部を発見する手法としては、例えば非特許文献2に記載のある手法が知られる。この手法では、入力画像を、WWWから無造作に取得した画像と比較し、特徴的な細部を発見する。細部を発見後、発見した細部を、例えば非特許文献3に記載のある、bag of visual wordsにおけるvisual wordsとして用いる。そして、学習データをvisual wordsに分解し、visual wordsのヒストグラムを作成する。このヒストグラムを画像を表す特徴ベクトルとして、画像の分類を行う。従って、非特許文献2に記載の手法では、カテゴリ間の差異を検出する際には学習データが必要ないが、差異に基づいて画像を分類する際には学習データが必要となる。
特開2006−350655号公報 特開2001−256244号公報
Charles E.: Using the Triangle Inequality to Accelerate k-Means, 20th ICML, pp.147-153,2003. Saurabh S., Abhinav G. and Alexei A. Efros: Unsupervised Discovery of Mid-Level Discriminative Patches.In European Conference on Computer Vision,2012. Lazebnik, S., Schmid, C., Ponce, J.: Beyond bags of features: Spatial pyramid matching for recognizing natural scene categories. In: CVPR, 2006.
このように、従来から、テキスト情報やカテゴリのラベルが付与された画像を収集し、画像の特徴を計算機に学習させることで、対象物ごとに画像を分類する手法が知られている。しかし、画像のみが蓄積されている場合には、予め目視でカテゴリを判定しておく等の人手が必要となり、実用上課題となる。特に、蓄積される画像が爆発的に増加している現在において、あらゆる画像に対して人手を介することは現実的ではなく、画像情報のみから画像を分類する手法が必要となる。
また、画像情報のみから画像を分類する手法であるクラスタリングは、画像全体の類似性を反映した分類結果しか得ることができない。すなわち、全体像が類似していながら、細部が異なるようなカテゴリを区別することが困難である。また、同じカテゴリに属する被写体であっても、サイズや画像中の位置の変化によって全体像の類似性が損なわれると、同じカテゴリであると判定することは難しい。カテゴリを区別するためには、カテゴリ間の差異を精細に検出し、差異に基づいてクラスタを生成する必要がある
本発明は、このような事情に鑑みてなされたもので、教師データがなくとも画像に写る被写体の部分的な差異を自動検出し、検出した部分的な差異に基づく精細な画像カテゴリ分類を実現する画像分類装置、画像分類方法及び画像分類プログラムを提供することを目的とする。
本発明は、画像の分類を行う画像分類装置であって、分類対象の入力画像から部分領域を算出する部分領域算出手段と、前記部分領域を分類対象画像を走査することにより前記部分領域の有無情報を取得する部分領域検出手段と、前記入力画像と部分領域をグループ化することにより前記入力画像のカテゴリを検出するカテゴリ分類手段とを備えることを特徴とする。
本発明は、前記部分領域算出手段は、前記入力画像を複数のデータセットに分割し、データセットに含まれる画像から特徴量を算出する手段と、前記データセットに含まれる画像から初期部分領域を生成し、前記初期部分領域をクラスタに分割する手段と、前記クラスタ毎にクラスタ識別器を生成し、他のデータセットに含まれる画像の部分領域へ各クラスタ識別器を適用した結果検出された部分領域を該クラスタに追加して新たなクラスタを生成して、該クラスタに含まれる前記部分領域を出力する手段とを備えることを特徴とする。
本発明は、前記部分領域検出手段は、前記部分領域毎に部分領域識別器を生成し、該部分領域識別器を用いて、前記入力画像に対してレスポンスマップを生成し、該レスポンスマップから、画像中に部分領域が存在するか否かを判定した結果に基づいて前記領域有無情報を取得することを特徴とする。
本発明は、前記カテゴリ分類手段は、前記入力画像と、前記部分領域と、前記入力画像中の部分領域の前記領域有無情報とを用いて、二部グラフを生成し、該二部グラフをグループ化することにより前記入力画像のカテゴリを検出することを特徴とする。
本発明は、画像の分類を行う画像分類装置が行う画像分類方法であって、分類対象の入力画像から部分領域を算出する部分領域算出ステップと、前記部分領域を分類対象画像を走査することにより前記部分領域の有無情報を取得する部分領域検出ステップと、前記入力画像と部分領域をグループ化することにより前記入力画像のカテゴリを検出するカテゴリ分類ステップとを有することを特徴とする。
本発明は、コンピュータを、前記画像分類装置として機能させるための画像分類プログラムである。
本発明によれば、入力画像に対して、画像情報のみから精度よくカテゴリを検出すると同時に、カテゴリに対して特徴的な部分領域を検出することができるという効果が得られる。例えば、WWW上の通信販売における商品の詳細分類に利用できる。
本発明の一実施形態の構成を示すブロック図である。 図1に示す画像分類装置の処理動作を示すフローチャートである。 図1に示す部分領域算出部6の処理動作を示すフローチャートである。 図1に示す部分領域検出部8の処理動作を示すフローチャートである。 レスポンスマップの一例を示す説明図である。 図1に示すカテゴリ分類部9の処理動作を示すフローチャートである。 生成した二部グラフの一例を示す説明図である。 二部グラフのグループ化の一例を示す説明図である。 全体像が類似していながら細部が異なるようなカテゴリの例を示す図である。
以下、図面を参照して、本発明の一実施形態による画像分類装置を説明する。図1は同実施形態の構成を示すブロック図である。この図に示すように、画像分類装置1は、画像入力部4と、画像記憶部5と、部分領域算出部6と、部分領域記憶部7と、部分領域検出部8と、カテゴリ分類部9と、出力部10とを備える。
画像入力部4は、入力画像である画像2を入力して、画像記憶部5に記憶する。部分領域算出部6は、画像記憶部5に記憶されている画像を参照して部分領域を算出し、算出結果を部分領域記憶部7に記憶する。部分領域検出部8は、画像記憶部5に記憶されている画像と、部分領域記憶部7に記憶されている部分領域を読み込み、読み込んだ画像において、読み込んだ部分領域が存在するか否かを特定する。この特定した情報を領域有無情報と呼ぶ。カテゴリ分類部9は、読み込んだ画像と部分領域をノード、領域有無情報をリンクとする二部グラフとして表現される形でグループ化を行い、カテゴリを取得する。カテゴリは、グループ化された画像と部分領域を1個以上持つ。出力部10は、カテゴリ分類部9で取得したカテゴリ3(グループ化された画像と部分領域)を出力する。
次に、図2を参照して、図1に示す画像分類装置の処理動作を説明する。図2は、図1に示す画像分類装置の処理動作を示すフローチャートである。まず、画像入力部4は、1枚以上の入力画像である画像2を取得し、画像記憶部5へ記憶する(ステップS1)。続いて、部分領域算出部6は、画像記憶部5に記憶されている全ての画像を読み込み、特徴的な部分領域を算出し、算出結果を部分領域記憶部7へ記憶する(ステップS2)。
次に、部分領域検出部8は、画像記憶部5に記憶されている画像と、部分領域記憶部7に記憶されている部分領域とを読み込み、画像中に部分領域が存在するかどうかを検出する(ステップS3)。続いて、カテゴリ分類部9は、画像、部分領域、領域有無情報の3つを用いて、同じ部分領域が共起する複数の画像を一つのカテゴリとしてグループ化する(ステップS4)。そして、出力部10は、グループ化された画像と部分領域をカテゴリ3として出力する(ステップS5)。
次に、図3を参照して、図1に示す部分領域算出部6における動作を詳細に説明する。図3は、図1に示す部分領域算出部6の処理動作を示すフローチャートである。部分領域算出部6における部分領域算出処理は、非特許文献2を改良している。非特許文献2は、入力画像における特徴的な部分領域を算出する手法である。特徴的な部分領域とは、非特許文献2では、十分頻繁に現れ、かつ他の領域と十分に異なる部分領域としている。非特許文献2では、入力画像における特徴的な部分領域を算出するための比較対象として、WWW上から無作為に抽出した多量の画像データを用いている。
そのため、入力画像に加えて多量のデータが必要となる。そして、無作為に抽出した画像との比較において特徴的な部分領域を算出するため、物体の全体像が類似した画像を入力画像とした場合には、カテゴリを分ける微細な個所を捉えることができず、誤ってカテゴリを検出してしまう恐れがあった。そのため部分領域算出部6においては、入力画像データセットに対する比較対象として、入力画像データセット自身を用いる。この改良によれば、入力として必要とする画像数を大きく削減することができる、物体の全体像が類似した画像であっても、その精細な差異を検出することができる。
まず、部分領域算出部6は、X枚の画像をI個の重複のない画像の集合(データセット)D1、D2、…、DIに分割する(ステップS21)。ここで、分割数Iは1以上X以下の任意の自然数を用いてよいが、例えば2などとしてもよい。簡単のため、以降では分割数I=2であるとして説明を行う。
次に、部分領域算出部6は、データセットDiについて、Diの全ての画像に対して特徴量を算出する(ステップS22)。iは1以上I以下の任意の自然数とする。画像から算出する特徴量としては、例えば、文献1に記載のSIFT(Scale Invariant Feature Transform)、GLOH(Gradient Location and Orientation Histogram)、PCA−SIFT、SURF(Speeded Up Robust Features)や、文献2に記載のHOG(Histograms of Oriented Gradients)等を用いることができる。
文献1「本道貴行,黄瀬浩一,“大規模画像認識のための局所特徴量の性能比較”,画像の認識・理解シンポジウム(MIRU2008)論文集,IS5−6,pp.550−555,2008.」
文献2「Dalal N., Triggs B.: Histograms of oriented gradients for human detection.In CVPR,2005.」
以降では、画像から算出する特徴量にはHOGを用いるものとして説明する。これにより、画像はそれぞれ、例えば4096次元の実数値ベクトルとして表現できる。また、4096次元の実数値ベクトルはDiの要素数だけ作成されることになる。
次に、部分領域算出部6は、Diの全ての画像から初期部分領域を生成する(ステップS23)。初期部分領域の生成は、ランダムに行えばよい。この場合、例えば、任意の大きさの長方形を画像に対して1ピクセルずつずらしながら当てはめ、順に一様乱数の確率で、部分領域として生成すればよい。各部分領域は、ステップS22で用いた特徴量で表現することにする。例えばDiの画像群を前述の特徴量(4096次元実数値ベクトル)で表現する場合、画像群が部分領域を10000含むときは、4096×10000の実数値の行列形式で部分領域の集合を表すことができる。抽出する初期部分領域の数は1画像当たり150くらいあればよい。
次に、部分領域算出部6は、初期部分領域をクラスタリングし、初期クラスタを生成する(ステップS24)。ここで用いるクラスタリング手法は公知の手法が適用でき、例えば非特許文献2のK平均法を用いることができる。この場合、初期クラスタがK個生成される。クラスタ数Kの決定は、例えば、1以上の任意の自然数、事前の検証を行い良好な結果が得られた値等を設定すればよい。また、例えば特徴量が4096次元実数値ベクトル、部分領域を100含むクラスタを、4096×100の実数値の行列形式で表すこともできる。
次に、部分領域算出部6は、クラスタに含まれる部分領域数が一定数以下のクラスタを削除する(ステップS25)。ここで、一定数とは1以上の自然数を用いることができる。
次に、部分領域算出部6は、クラスタ毎に学習し各クラスタ識別器を生成する(ステップS26)。クラスタ識別器は1つのクラスタに対して1つ用意する。クラスタ識別器は、クラスタに含まれる部分領域の特徴量(正例)と、クラスタに含まれない全ての部分領域の特徴量(負例)との関係を学習することによって生成する。クラスタ識別器としては、例えばSVM(Support Vector Machine)を用いればよい。
次に、部分領域算出部6は、他のデータセットに含まれる画像の部分領域へ各クラスタ識別器を適用し、その結果検出された部分領域を当該クラスタに追加して新たなクラスタを生成する(ステップS27)。ステップS27では、データセットDi+1を用いてクラスタを再生成する。ただし、iがIである場合には、Di+1をD1とする。ステップS26で生成した各クラスタ識別器によって、データセットDi+1の全画像から部分領域の検出を行う。
検出は、画像に対してT種類の任意の大きさの長方形をずらしながら当てはめ、各長方形領域から抽出した特徴量に対してクラスタ識別器によって識別する。クラスタ識別器毎に得られた長方形領域を、部分領域として新たにクラスタに追加する。検出した部分領域すべてを用いて新たなクラスタを生成してもよい。また、これらの部分領域は、ステップS26で用いたクラスタ識別器、例えばSVMの識別スコアを持つ。そこで、スコア上位m個の部分領域のみを新たなクラスタに追加しクラスタを生成することもできる。ここで、mは1以上の自然数とする。
次に、部分領域算出部6は、クラスタが収束したか否かの判定を行う(ステップS28)。クラスタが収束したとは、クラスタに含まれる要素に変動がないような状態になることであり、クラスタの収束条件としては、例えば1以上の任意の自然数jに対して、繰り返しがj回行われる、クラスタのスコア上位j個の部分領域に変動がないなどとすればよい。クラスタが収束している場合、ステップS29へ進む。それ以外の場合、iの値を1増加させてステップS25へ戻り処理を繰り返す。ただし、iがIの場合にはi=1とする。
次に、部分領域算出部6は、各クラスタに含まれる部分領域を出力する(ステップS29)。出力する部分領域は、例えば、各クラスタに含まれる全ての部分領域、各クラスタから代表する1個の部分領域(例えば、識別スコアが最も高い部分領域)とすればよい。
次に、図4を参照して、図1に示す部分領域検出部8における動作を詳細に説明する。図4は、図1に示す部分領域検出部8の処理動作を示すフローチャートである。まず、部分領域検出部8は、部分領域毎に学習して部分領域識別器を生成する(ステップS31)。部分領域識別器は、1つの部分領域に対して1つ用意される。部分領域識別器は、例えば、識別する対象の部分領域から抽出した特徴量(正例)と、識別対象である部分領域を除くすべての部分領域から抽出した特徴量(負例)との関係を学習することによって生成することができる。学習器としては、例えば文献3に記載のExemplar SVMを用いることができる。
文献3「Tomasz M., Abhinav G., Alexei A. Efros.: Ensemble ofExemplar-SVMs for Object Detection and Beyond. In ICCV, 2011.」
次に、部分領域検出部8は、全ての画像に対して、各部分領域がどの程度反応するかを識別し、レスポンスマップを生成する(ステップS32)。レスポンスマップとは、次のようにして画像ごとに生成されるマップである。まず、画像に対してU種類の任意の大きさの長方形をずらしながら当てはめ、各長方形領域から抽出した特徴量を取得する。Uは1以上の自然数とする。次に、抽出した特徴量を部分領域識別器によって識別する。識別の結果、上記長方形を当てはめた領域に対して、識別器の学習に用いた識別器、例えばExemplar SVMのスコアが付与される。この長方形領域に対するスコアを抽出元の画像に当てはめることで、レスポンスマップが生成できる。レスポンスマップの例を、図5に示す。図5は、レスポンスマップの一例を示す説明図である。1枚の画像に対して生成されるレスポンスマップの数は、U×部分領域数となる。
次に、部分領域検出部8は、生成したレスポンスマップから、画像中に部分領域が存在するかどうかを判定し、領域有無情報を出力する(ステップS33)。1枚の画像と1個の部分領域との関係に対して、U枚のレスポンスマップを入力として、判定を行うことにより領域有無情報を出力する。判定は、例えば、レスポンスマップのスコアが任意の一定値以上の場合に、部分領域が画像中に存在するとし、それ以外の場合には存在しないとすることができる。また、文献4に記載のNon−Maximum Suppressionを用いて判定を行うこともできる。
文献4「Neubeck A., Van L. Gool: Efficient non-maximum suppression, in: ICPR, 2006.」
次に、図6を参照して、図1に示すカテゴリ分類部9における動作を詳細に説明する。図6は、図1に示すカテゴリ分類部9の処理動作を示すフローチャートである。まず、カテゴリ分類部9は、画像、部分領域と画像中の部分領域の領域有無情報を用いて、二部グラフを生成する(ステップS41)。三者の関係性はグラフ表現ではなくても表現することは可能であり、例えば有無情報を0、1とした特徴ベクトル、部分領域の個数からなる特徴ベクトルを用いることができる。簡単のため、以降では二部グラフ表現を選択したものとして説明する。図7は、生成した二部グラフの一例を示す説明図である。二部グラフは、頂点集合を二つの部分集合A、Bに分割し、全ての辺はAの頂点とBの頂点を結ぶグラフである。例えば、画像、部分領域をA、Bとし、画像中に部分領域が存在する場合に、対応する頂点間を辺で結ぶグラフを生成することができる。
次に、カテゴリ分類部9は、同じ部分領域が共起する複数の画像を一つのカテゴリとしてグループ化する(ステップS42)。すなわち二部グラフのグループ化を行う。図8は、二部グラフのグループ化の一例を示す説明図である。グループ化は、例えば、それぞれ文献5、6、7に記載のSpectral Co−clustering、Bayesian Co−clustering、Information−Theoretical Co−clustering等を用いることができる。
文献5「Dhillon S.:Co-clustering documents and words using bipartite spectral graph partitioning. In Proceedings of the 7th International Conference on Knowledge Discovery and Data Mining, pp.269-274, 2001.」
文献6「Shan H., Banerjee A.: Bayesian co-clustering. IEEE International Conference on Data Mining, 2008.」
文献7「Dhillon S., Mallela S., and Modha S.: Information-Theoretical Coclustering, Proc. Ninth ACM SIGKDD Int‘l Conf.Knowledge Discovery and Data Mining, pp. 89-98, 2003.」
クラスタ数Cの決定には、例えば、2以上の任意の自然数を設定すればよい。また、多くの画像中に存在する部分領域は、どのような画像に対しても頻出する部分領域であって、画像をカテゴリに分類できるほど特徴的ではない可能性が高い。そこで、M以上の画像との間に辺がある部分領域を除いてもよい。ここで、Mは、例えば、0以上の任意の実数αに対してα×C/|A|、等とすればよい。
以上説明したように、画像を分類する際に、複数の画像に一定数出現する部分領域を抽出したうえで、この部分領域をある画像が含むか含まないかの関係に基づいて画像と部分領域の組としてカテゴライズするようにした。この構成により、特徴的な部分領域に基づく形での画像分類を可能とし、結果画像に関連するテキストやカテゴリを示すラベルの付与を不要とすることができる。
前述した実施形態における画像分類装置をコンピュータで実現するようにしてもよい。その場合、この機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現してもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでもよい。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよく、PLD(Programmable Logic Device)やFPGA(Field Programmable Gate Array)等のハードウェアを用いて実現されるものであってもよい。
以上、図面を参照して本発明の実施の形態を説明してきたが、上記実施の形態は本発明の例示に過ぎず、本発明が上記実施の形態に限定されるものではないことは明らかである。したがって、本発明の技術思想及び範囲を逸脱しない範囲で構成要素の追加、省略、置換、その他の変更を行ってもよい。
本発明は、WWW上の画像を検索する際の表示画像分類技術に適用可能である。
1…画像分類装置、2…画像、3…グループ化された画像と部分領域(カテゴリ)、4…画像入力部、5…画像記憶部、6…部分領域算出部、7…部分領域記憶部、8…部分領域検出部、9…カテゴリ分類部、10…出力部

Claims (7)

  1. 画像の分類を行う画像分類装置であって、
    分類対象の入力画像から部分領域を算出する部分領域算出手段と、
    前記部分領域を分類対象画像を走査することにより前記部分領域の領域有無情報を取得する部分領域検出手段と、
    前記入力画像と部分領域をグループ化することにより前記入力画像のカテゴリを検出するカテゴリ分類手段と
    を備え
    前記部分領域算出手段は、
    前記入力画像を複数の入力画像データセットに分割し、前記入力画像データセットに含まれる画像から特徴量を算出する手段と、
    前記入力画像データセットに含まれる画像から初期部分領域を生成し、前記初期部分領域をクラスタに分割する手段と、
    前記クラスタ毎にクラスタ識別器を生成し、他の入力画像データセットに含まれる画像の部分領域へ各クラスタ識別器を適用した結果検出された部分領域を該クラスタに追加して新たなクラスタを生成して、該クラスタに含まれる前記部分領域を出力する手段と
    を備えることを特徴とする画像分類装置。
  2. 画像の分類を行う画像分類装置であって、
    分類対象の入力画像から部分領域を算出する部分領域算出手段と、
    前記部分領域を分類対象画像を走査することにより前記部分領域の領域有無情報を取得する部分領域検出手段と、
    前記入力画像と部分領域をグループ化することにより前記入力画像のカテゴリを検出するカテゴリ分類手段と
    を備え、
    前記部分領域検出手段は、前記部分領域毎に部分領域識別器を生成し、該部分領域識別器を用いて、前記入力画像に対して前記部分領域数に応じたレスポンスマップを生成し、該レスポンスマップから、画像中に部分領域が存在するか否かを判定した結果に基づいて前記領域有無情報を取得することを特徴とする画像分類装置。
  3. 画像の分類を行う画像分類装置であって、
    分類対象の入力画像から部分領域を算出する部分領域算出手段と、
    前記部分領域を分類対象画像を走査することにより前記部分領域の領域有無情報を取得する部分領域検出手段と、
    前記入力画像と部分領域をグループ化することにより前記入力画像のカテゴリを検出するカテゴリ分類手段と
    を備え、
    前記カテゴリ分類手段は、前記入力画像と、前記部分領域と、前記入力画像中の部分領域の前記領域有無情報とを用いて、二部グラフを生成し、該二部グラフをグループ化することにより前記入力画像のカテゴリを検出することを特徴とする画像分類装置。
  4. 画像の分類を行う画像分類装置が行う画像分類方法であって、
    分類対象の入力画像から部分領域を算出する部分領域算出ステップと、
    前記部分領域を分類対象画像を走査することにより前記部分領域の領域有無情報を取得する部分領域検出ステップと、
    前記入力画像と部分領域をグループ化することにより前記入力画像のカテゴリを検出するカテゴリ分類ステップと
    を有し、
    前記部分領域算出ステップは、
    前記入力画像を複数の入力画像データセットに分割し、前記入力画像データセットに含まれる画像から特徴量を算出するステップと、
    前記入力画像データセットに含まれる画像から初期部分領域を生成し、前記初期部分領域をクラスタに分割するステップと、
    前記クラスタ毎にクラスタ識別器を生成し、他の入力画像データセットに含まれる画像の部分領域へ各クラスタ識別器を適用した結果検出された部分領域を該クラスタに追加して新たなクラスタを生成して、該クラスタに含まれる前記部分領域を出力するステップと
    を有することを特徴とする画像分類方法。
  5. 画像の分類を行う画像分類装置が行う画像分類方法であって、
    分類対象の入力画像から部分領域を算出する部分領域算出ステップと、
    前記部分領域を分類対象画像を走査することにより前記部分領域の領域有無情報を取得する部分領域検出ステップと、
    前記入力画像と部分領域をグループ化することにより前記入力画像のカテゴリを検出するカテゴリ分類ステップと
    を有し、
    前記部分領域検出ステップは、前記部分領域毎に部分領域識別器を生成し、該部分領域識別器を用いて、前記入力画像に対して前記部分領域数に応じたレスポンスマップを生成し、該レスポンスマップから、画像中に部分領域が存在するか否かを判定した結果に基づいて前記領域有無情報を取得
    することを特徴とする画像分類方法。
  6. 画像の分類を行う画像分類装置が行う画像分類方法であって、
    分類対象の入力画像から部分領域を算出する部分領域算出ステップと、
    前記部分領域を分類対象画像を走査することにより前記部分領域の領域有無情報を取得する部分領域検出ステップと、
    前記入力画像と部分領域をグループ化することにより前記入力画像のカテゴリを検出するカテゴリ分類ステップと
    を有し、
    前記カテゴリ分類ステップは、前記入力画像と、前記部分領域と、前記入力画像中の部分領域の前記領域有無情報とを用いて、二部グラフを生成し、該二部グラフをグループ化することにより前記入力画像のカテゴリを検出することを特徴とする画像分類方法。
  7. コンピュータを、請求項1からのいずれか1項に記載の画像分類装置として機能させるための画像分類プログラム。
JP2014032197A 2014-02-21 2014-02-21 画像分類装置、画像分類方法及び画像分類プログラム Expired - Fee Related JP6194260B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014032197A JP6194260B2 (ja) 2014-02-21 2014-02-21 画像分類装置、画像分類方法及び画像分類プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014032197A JP6194260B2 (ja) 2014-02-21 2014-02-21 画像分類装置、画像分類方法及び画像分類プログラム

Publications (2)

Publication Number Publication Date
JP2015158739A JP2015158739A (ja) 2015-09-03
JP6194260B2 true JP6194260B2 (ja) 2017-09-06

Family

ID=54182699

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014032197A Expired - Fee Related JP6194260B2 (ja) 2014-02-21 2014-02-21 画像分類装置、画像分類方法及び画像分類プログラム

Country Status (1)

Country Link
JP (1) JP6194260B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6749775B2 (ja) * 2016-03-28 2020-09-02 清水建設株式会社 クラス判定装置、クラス判定方法、および、クラス判定プログラム
JP6993250B2 (ja) * 2018-02-01 2022-01-13 日本電信電話株式会社 コンテンツ特徴量抽出装置、方法、及びプログラム
WO2019193762A1 (ja) * 2018-04-06 2019-10-10 三菱電機株式会社 案内標識認識装置および案内標識認識方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4376145B2 (ja) * 2004-07-22 2009-12-02 日立ソフトウエアエンジニアリング株式会社 画像分類学習処理システム及び画像識別処理システム
EP2395452A1 (en) * 2010-06-11 2011-12-14 Toyota Motor Europe NV/SA Detection of objects in an image using self similarities
JP5572120B2 (ja) * 2011-05-02 2014-08-13 日本放送協会 構図データ生成装置及び構図データ生成プログラム
CN103207879B (zh) * 2012-01-17 2016-03-30 阿里巴巴集团控股有限公司 图像索引的生成方法及设备

Also Published As

Publication number Publication date
JP2015158739A (ja) 2015-09-03

Similar Documents

Publication Publication Date Title
Chaudhuri et al. Multilabel remote sensing image retrieval using a semisupervised graph-theoretic method
US11416710B2 (en) Feature representation device, feature representation method, and program
Li et al. A positive and unlabeled learning algorithm for one-class classification of remote-sensing data
RU2668717C1 (ru) Генерация разметки изображений документов для обучающей выборки
Caetano et al. A mid-level video representation based on binary descriptors: A case study for pornography detection
Mehra et al. Image analysis for identifying mosquito breeding grounds
Wang et al. Observing the natural world with Flickr
CN110458078A (zh) 一种人脸图像数据聚类方法、系统及设备
US11816946B2 (en) Image based novelty detection of material samples
Intwala et al. Indian sign language converter using convolutional neural networks
Chen et al. Inferring unseen views of people
Aslam et al. Image classification based on mid-level feature fusion
Forczmański et al. Stamps detection and classification using simple features ensemble
JP6713162B2 (ja) 画像認識装置、画像認識方法、及び画像認識プログラム
Roy et al. Face sketch-photo recognition using local gradient checksum: LGCS
JP6194260B2 (ja) 画像分類装置、画像分類方法及び画像分類プログラム
Mirrashed et al. Domain adaptive classification
Kavitha et al. Multiple Object Recognition Using OpenCV
Mareta et al. Herbal leaf classification using images in natural background
Bhattacharya et al. A survey of landmark recognition using the bag-of-words framework
Khayeat et al. Improved DSIFT descriptor based copy-rotate-move forgery detection
JP5959446B2 (ja) コンテンツをバイナリ特徴ベクトルの集合で表現することによって高速に検索する検索装置、プログラム及び方法
Neycharan et al. Edge color transform: a new operator for natural scene text localization
Soni et al. Image copy-move forgery detection using deep convolutional neural networks
Shri et al. Video Analysis for Crowd and Traffic Management

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160128

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20161124

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170110

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170306

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170808

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170814

R150 Certificate of patent or registration of utility model

Ref document number: 6194260

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees