JP4703487B2

JP4703487B2 - 画像分類方法及び装置及びプログラム

Info

Publication number: JP4703487B2
Application number: JP2006148896A
Authority: JP
Inventors: 泳青孫; 聡嶌田; 正志森本
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 2006-05-29
Filing date: 2006-05-29
Publication date: 2011-06-15
Anticipated expiration: 2026-05-29
Also published as: JP2007317133A

Description

本発明は、画像分類方法及び装置及びプログラムに係り、特に、テキストと画像で表現されたマルチメディア情報を対象として、キーワードにより画像を検索したときに検索結果の画像を画像内容に従って分類する画像分類方法及び装置及びプログラムに関する。

コンピュータとインターネット技術の進歩に伴い、実世界中に画像データを生成・蓄積することが容易になっている。その一方、膨大な画像データの効率よい管理技術が求められるようになった。このコア技術の一つとして、インターネット画像の分類技術が注目されている。従来の画像分類方法は、次の３つのアプローチに分類される。

（１）テキスト照合による分類：
画像にキーワードを手動で事前に付与しておき、キーワードの照合により画像の類似性を判定することで画像を分類する方法である。

（２）画像の照合による分類：
画像から色、テクスチャ、形状などの特徴量を抽出し、これらの特徴量を用いた照合による画像を分類する方法がある（例えば、非特許文献１参照）。

（３）テキストと画像の統合処理による分類：
インターネット画像をテキストで検索するときに、クエリワードに関係する画像を検索結果として提示するときに画像内容が似ているものを分類して提示する方法が検討されている（例えば、非特許文献２参照）。この方法は次の２つのステップにより実現される。インターネット画像を含むＷｅｂサイトでは、画像とその画像を説明する説明テキストから構成されていることが多いので、まず、クエリのワードと説明テキストの照合により、クエリワードに関係のある画像を収集する。次に、画像の色やテクスチャに関する特徴量を用いて収集した画像を分類する。この方法は、説明テキストを用いて関連のある画像を収集したものを分類対象とするので、内容が似ているものが多い画像を分類対象とできる点が上記の（２）の技術と異なる。
Yixin Chen, James Z Wang, Robert Krovets, "content-based image retrieval by clustering", Multimedia Information Retrieval 2003, pp.193-200 Deng Cai, Xiaofei He, Zhiwei Li, Wei-Ying Ma and Ji-rong Wen, "Hierarchical Clustering of WWW Image Search Results Using Visual, Textual and Link Analysis", 12th ACM International conference on Multimedia, New York City, USA, Oct. 2004

しかしながら、上記従来技術（１）のテキストによる照合では、各画像に、その画像の意味や内容を表すテキスト（インデックス）を手動で事前に付与しておく必要があり、大量の画像に対して手動で付与するためのコストと時間がかかることが問題である。

従来技術（２）の画像による照合では、画像から抽出した色、テクスチャ、形状などの物理的な特徴量だけで分類するが、画像の物理的な特徴と画像内容を表す意味レベルの分類基準との対応関係を明確に規定できないため、画像の意味的な分類を行うことが困難である。

従来技術（３）のテキストと画像の統合による分類は、まず、テキスト照合で画像を取得し、次に、画像による照合で分類するという順で行われる。画像による照合では、従来技術（２）と同じ課題を持つので、最初に行うテキスト照合でできるだけ分類しやすい画像を収集することが必要になる。しかし、簡易なテキスト照合による画像収集では、クエリワードに含まれる多様な概念に対応する画像がすべて収集されるので、従来技術（２）と同様に、画像内容に基づいた画像分類は困難であり、その分類精度は低くなる。

本発明は、上記の点に鑑みなされたもので、概念に対応した画像を精度よく分類することが可能な画像分類方法及び装置及びプログラムを提供することを目的とする。

図１は、本発明の原理を説明するための図である。

本発明（請求項１）は、テキストと画像で表現されたマルチメディア情報を対象として、キーワードにより画像を検索したときに検索結果の画像を画像内容に従って分類する画像分類方法であって、
概念・シソーラス取得手段が、入力されたクエリキーワードに基づいて、ワードの持つ複数の概念と各概念のシソーラスを記憶したワード辞書を検索し、ｎ個の概念と該概念のシソーラスを取得する概念・シソーラス取得ステップ（ステップ１）と、
画像収集手段が、概念のシソーラスとクエリキーワードのＡＮＤ条件によりウェブ検索し、画像の周辺にある説明テキストを照合し、該クエリキーワードと該シソーラスに関連する画像を収集して記憶手段に格納する画像収集ステップ（ステップ２）と、
画像フィルタリング手段が、各概念ｎ（ｎ＝１，２，…，Ｎ）について、記憶手段の収集された画像群から、クエリキーワードと概念のシソーラスとのＡＮＤ検索したときの類似度が高いＭ個の画像を正事例候補、それ以外の画像をラベル無し画像として抽出する画像フィルタリングステップ（ステップ３）と、
正事例生成手段が、正事例候補について、Ｐ個の特徴量のそれぞれについて標準偏差を求め、該標準偏差が最小となる特徴量を代表特徴量とし、該代表特徴量の特徴空間における正事例候補画像の中心Ｃを求め、正事例候補画像と該中心Ｃとの距離を算出し、該距離が所定の閾値以下である場合は、該正事例候補画像を正事例とする正事例生成ステップ（ステップ４）と、
負事例生成手段が、ラベル無し画像から代表特徴量を求め、該ラベル無し画像の中で中心Ｃからの距離が所定の閾値よりも大きいものを負事例とする負事例生成ステップ（ステップ５）と、
識別関数算出手段が、正事例生成ステップで求めた正事例と、負事例生成ステップで求めた負事例を学習データとして正事例と負事例を識別するための識別関数を求める識別関数算出ステップ（ステップ６）と、
識別手段が、正事例候補と、ラベル無し画像群とから、識別関数を用いて、概念ｎに対応する画像を求める識別ステップ（ステップ７）と、
全ての概念ｎに対して、画像収集ステップ以降の処理を繰り返す（ステップ８）。

図２は、本発明の原理構成図である。

本発明（請求項２）は、テキストと画像で表現されたマルチメディア情報を対象として、キーワードにより画像を検索したときに検索結果の画像を画像内容に従って分類する画像分類装置であって、
ワードの持つ複数の概念と各概念のシソーラスを記憶したワード辞書１０７と、
入力されたクエリキーワードに基づいて、ワード辞書１０７を検索し、ｎ個の概念と該概念のシソーラスを取得する概念・シソーラス取得手段１００と、
概念のシソーラスとクエリキーワードのＡＮＤ条件によりウェブ検索し、画像の周辺にある説明テキストを照合し、該クエリキーワードと該シソーラスに関連する画像を収集して記憶手段に格納する画像収集手段１０１と、
各概念ｎ（ｎ＝１，２，…，Ｎ）について、記憶手段の収集された画像群を、クエリキーワードと概念のシソーラスとのＡＮＤ検索したときの類似度が高いＭ個の画像を正事例候補、それ以外の画像をラベル無し画像とする画像フィルタリング手段１０２と、
正事例候補について、Ｐ個の特徴量のそれぞれについて標準偏差を求め、該標準偏差が最小となる特徴量を代表特徴量とし、該代表特徴量の特徴空間における正事例候補画像の中心Ｃを求め、正事例候補画像と該中心Ｃとの距離を算出し、該距離が所定の閾値以下である場合は、該正事例候補画像を正事例とする正事例生成手段１０３と、
ラベル無し画像から代表特徴量を求め、該ラベル無し画像の中で中心Ｃからの距離が所定の閾値よりも大きいものを負事例とする負事例生成手段１０４と、
正事例生成手段１０３で求めた正事例と、負事例生成手段１０４で求めた負事例を学習データとして正事例と負事例を識別するための識別関数を求める識別関数算出手段１０５と、
正事例候補と、ラベル無し画像群とから、識別関数を用いて、概念ｎに対応する画像を求める識別手段と、
全ての概念ｎに対して、画像収集手段１０１、画像フィルタリング手段１０２、正事例生成手段１０３、負事例生成手段１０４、識別関数算出手段１０５、識別手段１０６を繰り返す手段と、を有する。

本発明（請求項３）は、コンピュータに、請求項２記載の画像分類装置の各手段を実行させる画像分類プログラムである。

本発明では、インターネット画像が、
・様々な人が様々な目的でとった多種多様な画像；
・画像の意味は周辺テキスト情報と画像情報で表現される：
という特徴を有していることにより、まず、クエリとなるキーワードが与えられたときに、そのキーワードが持つ複数概念に応じた画像を、当該画像の周辺の説明テキストの照合により収集し、画像から抽出した特徴量で構成される特徴空間において、各概念に対応する画像を識別するための識別関数を各概念に対応する画像群から適切な学習データを抽出することにより求め、当該識別関数に基づいて各概念に対応した画像を分類する。これにより、概念に対応した画像を精度よく分類することができる。

以下、図面と共に本発明の実施の形態を説明する。

図３は、本発明の一実施の形態におけるシステム構成を示す。

同図に示すシステムは、クライアント端末１と、ウェブ画像検索エンジン２と、ウェブサイト３がインターネット４に接続されている構成である。

クライアント端末１は、ユーザの検索要求であるクエリとなるキーワードを受け付け、クエリワードに基づいて検索された画像を提示する。

ウェブ画像検索エンジン２は、クエリワードと、ウェブサイト３の説明テキストとのテキスト照合を行い、クエリワードと関連するウェブ画像を検索する。

ウェブサイト３は、インターネット上で公開されている数多くのウェブサイトであり、公開されている情報は、画像と周辺の説明テキストとから構成されている。

上記の図３に示すシステムを前提としたときの、クライアント装置１を画像分類装置をとして説明する。

図４は、本発明の一実施の形態における画像分類装置の構成を示す。

同図に示す画像分類装置は、概念・シソーラス取得部１００、画像収集部１０１、画像フィルタリング部１０２、正事例生成部１０３、負事例生成部１０４、識別関数算出部１０５、識別処理部１０６、ワード辞書記憶部１０７から構成される。

概念・シソーラス取得部１００は、ユーザから入力されたクエリキーワードに基づいて、ワード辞書記憶部１０７に記憶してあるワード辞書から、クエリキーワードの持つ各概念と各概念のシソーラスを読み取り、クエリワード、及び読み取った各概念とシソーラスを画像収集部１０１へ出力する。

ワード辞書記憶部１０７は、ワードの持つ複数の概念と各概念のシソーラスをまとめた電子辞書で、概念・シソーラス取得部１００からワードを受け取ると、そのワードが持つ概念とシソーラスを概念・シソーラス取得部１００に出力する。ワード辞書の例を図５に示す。

画像収集部１０１は、概念・シソーラスの取得部１００からクエリキーワードと各概念に関するシソーラスを受け取ると、クエリキーワードと各概念に関するシソーラスを検索条件（ＡＮＤ条件）として、ウェブ検索エンジンによりウェブ画像の周辺にある説明テキストとの照合を行い、クエリワードとシソーラスとに関連する画像を収集し、メモリ等の記憶手段（図示せず）に格納する。収集した画像と、ウェブ画像検索エンジン２で検索したときの説明テキストとの照合におけるテキスト類似度を画像フィルタリング部１０２へ出力する。

画像フィルタリング部１０２は、画像取得部１０１から画像とテキスト類似度を受け取ると、テキスト類似度が高いＭ個の画像を正事例候補画像、その他の画像をラベルなし画像の２つのグループに分ける。正事例候補画像を正事例生成部１０３と識別処理部１０６に出力し、ラベルなし画像を負事例生成部１０４と識別処理部１０６に出力する。

正事例生成部１０３は、画像フィルタリング部１０２から正事例候補画像を受け取ると、正事例画像を特徴付ける代表特徴量を抽出し、抽出した当該代表特徴量を用いて正事例画像を検出する。検出した正事例画像を識別関数算出部１０５に、抽出した正事例特徴量（代表特徴量）を負事例生成部１０４にそれぞれ出力する。正事例画像の抽出の詳細は、図６のフローチャートで後述する。

負事例生成部１０４は、画像フィルタリング部１０２からラベルなし画像を、正事例生成部１０３から代表特徴量をそれぞれ受け取ると、当該代表特徴量を用いて画像フィルタリング部１０２から受け取ったラベルなし画像から負事例画像を抽出し、抽出した負事例画像を識別関数算出部１０５へ出力する。詳細は、図７の処理フローで後述する。

識別関数算出部１０５は、正事例生成部１０３から受け取った正事例画像と負事例生成部１０４から受け取った負事例画像を学習データとして、負事例と正事例を識別するための識別関数を求め、求めた識別関数を識別処理部１０６へ出力する。識別関数の算出は例えば、従来技術であるＢＤＡという分類器を用いて求めればよい（文献１：Xiang Sean Zhou, Thomas S. Huang, “Comparing Discriminating transformations and SVM for learning during multimedia retrieval”, ACM Multimedia 2001, pp. 137-146参照）。

識別処理部１０６は、画像フィルタリング部１０２から入力される正事例候補画像とラベルなし画像を、識別関数算出部１０５から入力される識別関数に基づいて分類する。正事例として分類された結果をクエリキーワードの該当する概念に対応する画像として出力する。

次に、上記の構成における動作を説明する。

図６は、本発明の一実施の形態における画像分類装置の処理のフローチャートである。

ステップ２０１）概念・シソーラス取得部１００において、クエリとなるキーワードを取得する。

ステップ２０２）概念・シソーラス取得部１００は、クエリキーワードに基づいてワード辞書記憶部１０７にアクセスして、クエリワードが持つＮ個の概念と、各概念に対応するシソーラスを読み取る。

ステップ２０３）画像収集部１０１において、クエリワードにｎ番目の概念シソーラスを追加した検索条件（ＡＮＤ条件）で、インターネット４を介してウェブ画像検索エンジン２を用いて画像の検索を行い、画像を収集し、当該画像と類似度をメモリ等の記憶手段（図示せず）に格納する。画像の検索は、ウェブ画像の周辺の説明テキストやタイトルなどと検索条件とのテキスト照合を行い、類似度の高い順にインターネットの画像を検出すればよい。

ステップ２０４）画像フィルタリング部１０２は、画像収集部１０１で収集された画像のテキスト照合の類似度の高い上位Ｍ枚の画像を正事例候補画像、その他の画像をラベルなし画像として分類する。

ステップ２０５）正事例生成部１０３は、画像フィルタリング部１０２から入力された正事例候補画像から正事例画像を求める。処理内容を図７に基づいて説明する。

まず、正事例生成部１０３は、正事例候補画像を読み込む（ステップ３０１）。次に、取得した正事例候補画像について、色（ｆ^Ｃ）、テクスチャ（ｆ^Ｔ），形状（ｆ^Ｓ）などのＰ個の特徴量を抽出する（ステップ３０２）。ここで、各色、テクスチャ、形状の特徴量は従来技術で得られている多次元の特徴ベクトルである。

Ｐ個の特徴量のそれぞれについて、正事例候補画像全体のばらつきを求める（ステップ３０３）。まず、色の特徴空間について、正事例候補画像全体における標準偏差を以下の関数で求める

Ｃは、正事例候補画像全体の中心、Ｍは正事例候補画像の総数、ｆ_m ^Cはｐ次元色特徴ベクトルである。

同様に、テクスチャや形状などＰ個の特徴空間についても、正事例候補画像全体における標準偏差を計算する。この処理によりＰ通りの標準偏差が求められる。

次に、Ｐ通りの標準偏差が最小となる特徴量を検出し、代表特徴量（Ｉ）とする（ステップ３０４）。例えば、色（ｆ^Ｃ），テクスチャ（ｆ^Ｔ）、形状（ｆ^Ｓ）などのＰ個の特徴量の中で、色特徴量（ｆ^Ｃ）の標準偏差が一番小さければ、代表特徴量（Ｉ）は色特徴量となる。

ステップ３０４で決めた代表特徴量（Ｉ）の特徴空間における正事例候補画像の中心Ｃを求める（ステップ３０５）。

次に、代表特徴量（Ｉ）の特徴空間における正事例候補画像ｎと中心Ｃとの距離を算出する（ステップ３０６）。ここでは、距離の計算は一般のユークリッド距離計算式を用いて求められる。

ステップ３０６で求めた距離が予め設定しておいた閾値以下であるかを判定する。閾値以下の場合は、ステップ３０８に移行し、閾値より大きい場合はステップ３０９へ移行する。

閾値以下の場合は、正事例候補画像ｎを正事例に振り分ける（ステップ３０８）。

閾値より大きい場合は、すべての正事例候補画像において上記のステップ３０６〜ステップ３０８に至る処理を行ったかを判定し、行っていなければステップ３１０に移行し、そうでなければ処理を終了する。

ｎをインクリメントし、ステップ３０６へ移行する（ステップ３１０）。

ステップ２０６）負事例生成部１０４は、負事例画像を抽出する。以下、図８を用いて詳細に負事例生成部１０４の動作を説明する。

まず、負事例生成部１０４は、ラベルなし画像から代表特徴量（Ｉ）を抽出する。例えば、ステップ２０５で求めた代表特徴量（Ｉ）が色特徴量であれば、ラベルなし画像からも色特徴量を抽出する（ステップ４１）。

ラベルなし画像の中で、ステップ３０５で求めた代表特徴量（Ｉ）の特徴空間における正事例候補画像の中心Ｃから距離が閾値より大きいものを負事例として検出する（ステップ４２）。

ステップ２０７）識別関数算出部１０５は、正事例生成部１０３で生成された正事例画像と、負事例生成部１０４で生成された負事例画像とを正事例と負事例学習データとして、負事例と正事例を識別するための識別関数を求める。識別関数を求める一例として、従来技術のＢＤＡ(Biased Discriminate Analysis)という分類器を用いる方法が有効である（文献１参照）。ＢＤＡ分類器は、正事例グループの分散を最小化し、かつ、負事例グループと正事例グループの分散を最大化する重み係数を求める。図９にＢＤＡ分類器の例を示す。代表特徴量（Ｉ）の各次元に対する重み付け係数を表す行列をＷ、代表特徴量（Ｉ）で表した正事例画像をｆ_l、正事例画像の総数をＬ、代表特徴量（Ｉ）で表した負事例画像をｎｆ_ｊ、負事例画像の総数をＪ、代表特徴量空間（Ｉ）における正事例画像の中心をＣとすると、上記の目標を達成するための最適な重み係数は式（２）で定義され、

式（１）より、Ｗは、

により求められる。

ステップ２０８）識別処理部１０６において、学習した識別器を用いて、正事例候補画像とラベルなし画像の識別を行い、正事例として判別されたサンプルをクエリキーワードのｎ番目の概念に対する画像として出力する。学習したＢＤＡ分類器で得られた重み付けＷを画像特徴量にかけて、以下の式で分類度Ｓを求める。Ｓは、予め設定しておいた閾値以下になれば、ｎ番目概念に対する画像とする。

Ｓ＝Ｗ^Ｔ・ｆ_ｉ
ステップ２０９）識別処理部１０６は、全てのクエリキーワードに関連するＮ個の概念において、上記のステップ２０３からステップ２０８に至る画像分類処理を行ったかを判定する。行っていなければ、ステップ２０３からステップ２０８の処理を繰り返す。そうでなければステップ２１０に移行する。

ステップ２１０）識別処理部１０６は、クエリキーワードに関連するＮ個の概念に対応する画像を結果として提示する。

また、本発明は、上記の図４に示す画像分類装置の構成の各機能をプログラムとして構築し、画像分類装置として利用されるコンピュータにインストールして実行させる、または、ネットワークを介して流通させることが可能である。

また、構築されたプログラムを、ハードディスクや、フレキシブルディスク・ＣＤ−ＲＯＭ等の可搬記憶媒体に格納し、画像分類装置として利用されるコンピュータにインストールする、または、配布することが可能である。
なお、本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において種々変更・応用が可能である。

本発明は、インターネット上に存在する画像を分類する技術に適用可能である。

本発明の原理を説明するための図である。本発明の原理構成図である。本発明の一実施の形態におけるシステム構成図である。本発明の一実施の形態における画像分類装置の構成図である。本発明の一実施の形態におけるワード辞書の例である。本発明の一実施の形態における画像分類装置の処理のフローチャートである。本発明の一実施の形態における正事例画像抽出ｓ２０５の詳細な処理のフローチャートである。本発明の一実施の形態における負事例画像抽出ｓ２０６の処理のフローチャートである。本発明の一実施の形態におけるＢＤＡ分類器を説明する図である。

符号の説明

１クライアント端末
２ウェブ画像検索エンジン
３ウェブサイト
４インターネット
１００概念・シソーラス取得手段、概念・シソーラス取得部
１０１画像収集手段、画像収集部
１０２画像フィルタリング手段、画像フィルタリング部
１０３正事例生成手段、正事例生成部
１０４負事例生成手段、負事例生成部
１０５識別関数算出手段、識別関数算出部
１０６識別手段、識別処理部
１０７ワード辞書、ワード辞書記憶部

Claims

テキストと画像で表現されたマルチメディア情報を対象として、キーワードにより画像を検索したときに検索結果の画像を画像内容に従って分類する画像分類方法であって、
概念・シソーラス取得手段が、入力されたクエリキーワードに基づいて、ワードの持つ複数の概念と各概念のシソーラスを記憶したワード辞書を検索し、ｎ個の概念と該概念のシソーラスを取得する概念・シソーラス取得ステップと、
画像収集手段が、前記概念のシソーラスと前記クエリキーワードのＡＮＤ条件によりウェブ検索し、画像の周辺にある説明テキストを照合し、該クエリキーワードと該シソーラスに関連する画像を収集して記憶手段に格納する画像収集ステップと、
画像フィルタリング手段が、前記各概念ｎ（ｎ＝１，２，…，Ｎ）について、前記記憶手段の収集された画像群から、前記クエリキーワードと前記概念のシソーラスとのＡＮＤ検索したときの類似度が高いＭ個の画像を正事例候補、それ以外の画像をラベル無し画像として抽出する画像フィルタリングステップと、
正事例生成手段が、前記正事例候補について、Ｐ個の特徴量のそれぞれについて標準偏差を求め、該標準偏差が最小となる特徴量を代表特徴量とし、該代表特徴量の特徴空間における正事例候補画像の中心Ｃを求め、正事例候補画像と該中心Ｃとの距離を算出し、該距離が所定の閾値以下である場合は、該正事例候補画像を正事例とする正事例生成ステップと、
負事例生成手段が、前記ラベル無し画像から前記代表特徴量を求め、該ラベル無し画像の中で前記中心Ｃからの距離が所定の閾値よりも大きいものを負事例とする負事例生成ステップと、
識別関数算出手段が、前記正事例生成ステップで求めた前記正事例と、前記負事例生成ステップで求めた前記負事例を学習データとして正事例と負事例を識別するための識別関数を求める識別関数算出ステップと、
識別手段が、前記正事例候補と、前記ラベル無し画像群とから、前記識別関数を用いて、前記概念ｎに対応する画像を求める識別ステップと、
全ての概念ｎに対して、前記画像収集ステップ以降の処理を繰り返す
ことを特徴とする画像分類方法。
テキストと画像で表現されたマルチメディア情報を対象として、キーワードにより画像を検索したときに検索結果の画像を画像内容に従って分類する画像分類装置であって、
ワードの持つ複数の概念と各概念のシソーラスを記憶したワード辞書と、
入力されたクエリキーワードに基づいて、前記ワード辞書を検索し、ｎ個の概念と該概念のシソーラスを取得する概念・シソーラス取得手段と、
前記概念のシソーラスと前記クエリキーワードのＡＮＤ条件によりウェブ検索し、画像の周辺にある説明テキストを照合し、該クエリキーワードと該シソーラスに関連する画像を収集して記憶手段に格納する画像収集手段と、
前記各概念ｎ（ｎ＝１，２，…，Ｎ）について、前記記憶手段の収集された画像群を、前記クエリキーワードと前記概念のシソーラスとのＡＮＤ検索したときの類似度が高いＭ個の画像を正事例候補、それ以外の画像をラベル無し画像とする画像フィルタリング手段と、
前記正事例候補について、Ｐ個の特徴量のそれぞれについて標準偏差を求め、該標準偏差が最小となる特徴量を代表特徴量とし、該代表特徴量の特徴空間における正事例候補画像の中心Ｃを求め、正事例候補画像と該中心Ｃとの距離を算出し、該距離が所定の閾値以下である場合は、該正事例候補画像を正事例とする正事例生成手段と、
前記ラベル無し画像から前記代表特徴量を求め、該ラベル無し画像の中で前記中心Ｃからの距離が所定の閾値よりも大きいものを負事例とする負事例生成手段と、
前記正事例生成手段で求めた前記正事例と、前記負事例生成手段で求めた前記負事例を学習データとして正事例と負事例を識別するための識別関数を求める識別関数算出手段と、
前記正事例候補と、前記ラベル無し画像群とから、前記識別関数を用いて、前記概念ｎに対応する画像を求める識別手段と、
全ての概念ｎに対して、前記画像収集手段、前記画像フィルタリング手段、前記正事例生成手段、前記負事例生成手段、前記識別関数算出手段、前記識別手段を繰り返す手段と、
を有することを特徴とする画像分類装置。
コンピュータに、
請求項２記載の画像分類装置の各手段を実行させることを特徴とする画像分類プログラム。