JP2014228995A

JP2014228995A - 画像特徴学習装置、画像特徴学習方法及びプログラム

Info

Publication number: JP2014228995A
Application number: JP2013106950A
Authority: JP
Inventors: 井上　俊明; Toshiaki Inoue; 俊明井上
Original assignee: Pioneer Electronic Corp
Current assignee: Pioneer Corp
Priority date: 2013-05-21
Filing date: 2013-05-21
Publication date: 2014-12-08

Abstract

【課題】ノイズに対するロバスト性を確保しつつ、学習時の計算量を増加させることなく分類性能を改善することが可能な画像特徴学習装置を提供する。【解決手段】画像特徴学習装置は、入力画像から特徴ベクトルを抽出する特徴抽出手段と、特徴ベクトルの集合をクラスタリングして量子化ベクトルを抽出するクラスタリング手段と、特徴ベクトルの集合を量子化ベクトルで量子化して入力画像ごとのヒストグラムを生成するヒストグラム生成手段と、入力画像の属性を示す属性情報に基づいて、ヒストグラムの集合を統計的に学習し、確率ベクトル又は確率密度分布を求める学習手段と、を備える。【選択図】図１

Description

本発明は、画像から抽出した特徴量を統計的に学習する技術分野に関する。

この種の技術が、例えば非特許文献１及び特許文献１に開示されている。非特許文献１には、学習画像を入力として特徴ベクトルを出力する特徴抽出手段と、特徴ベクトルを入力として量子化ベクトルを出力する量子化手段と、量子化ベクトル及び特徴ベクトルを入力としてヒストグラムを出力するヒストグラム生成手段と、ヒストグラム及び教師情報を入力として学習結果を出力するＳＶＭ（Support Vector Machine）手段とを用いて、画像をカテゴリごとに分類する技術が開示されている。特許文献１には、文書データを入力として確率分布を出力する確率分布算出手段と、確率分布を入出力する確率分布記憶手段と、確率分布を入力として確率分布モデルを出力する確率分布モデル算出手段と、確率分布モデル記憶手段の確率分布モデルを逐次更新を行う確率分布モデル更新手段と、確率分布モデルを入力としてクラスタを出力するクラスタ決定手段とを用いて、文書データをカテゴリごとに分類する技術が開示されている。

特開２０１１−２２１６６６号公報

八木康史他、「コンピュータビジョン最先端ガイド３」、アドコムメディア社、２０１０年１０月８日

非特許文献１に記載の技術では、学習手段として２クラス分類を行うＳＶＭ手段を用いているため、２クラスを超える分類を行うためにはＳＶＭ手段を多段に接続する必要があり、学習時に計算コストが増大する傾向にあった。また、最適な識別を行うためには、学習画像のヒストグラム（多次元ベクトル）に関する２次計画問題を解く必要があり、学習画像数の増加とともに計算量が大幅に増大する傾向にあった。更に、非特許文献１に記載の技術では、ＳＶＭ手段の追加学習（オンライン学習）への対応が困難であった。つまり、学習画像が新たに追加された場合は、以前の学習画像を含めて再度学習を実施しなければならず、学習画像を追加しながら効率良く分類性能を改善していくことが困難であった。

他方で、特許文献１に記載の技術では、学習手段として教師情報を用いないため、ノイズに影響されやすかった。

本発明が解決しようとする課題としては、上記のものが一例として挙げられる。本発明は、ノイズに対するロバスト性を確保しつつ、学習時の計算量を増加させることなく分類性能を改善することが可能な画像特徴学習装置、画像特徴学習方法及びプログラムを提供することを目的とする。

請求項に記載の発明では、画像特徴学習装置は、入力画像から特徴ベクトルを抽出する特徴抽出手段と、前記特徴ベクトルの集合をクラスタリングして量子化ベクトルを抽出するクラスタリング手段と、前記特徴ベクトルの集合を前記量子化ベクトルで量子化して前記入力画像ごとのヒストグラムを生成するヒストグラム生成手段と、前記入力画像の属性を示す属性情報に基づいて、前記ヒストグラムの集合を統計的に学習し、確率ベクトル又は確率密度分布を求める学習手段と、を備えることを特徴とする。

また、請求項に記載の発明では、画像特徴学習装置によって実行される画像特徴学習方法は、入力画像から特徴ベクトルを抽出する特徴抽出工程と、前記特徴ベクトルの集合をクラスタリングして量子化ベクトルを抽出するクラスタリング工程と、前記特徴ベクトルの集合を前記量子化ベクトルで量子化して前記入力画像ごとのヒストグラムを生成するヒストグラム生成工程と、前記入力画像の属性を示す属性情報に基づいて、前記ヒストグラムの集合を統計的に学習し、確率ベクトル又は確率密度分布を求める学習工程と、を備えることを特徴とする。

また、請求項に記載の発明では、コンピュータを有する画像特徴学習装置によって実行されるプログラムは、前記コンピュータを、前記特徴ベクトルの集合をクラスタリングして量子化ベクトルを抽出するクラスタリング手段、前記特徴ベクトルの集合を前記量子化ベクトルで量子化して前記入力画像ごとのヒストグラムを生成するヒストグラム生成手段、前記入力画像の属性を示す属性情報に基づいて、前記ヒストグラムの集合を統計的に学習し、確率ベクトル又は確率密度分布を求める学習手段、として機能させることを特徴とする。

第１実施例に係る画像特徴学習装置の概略構成を示す。第１実施例に係る競合学習手段によって実行されるフローチャートを示す。ステップＳ１０の処理の具体例を説明するための図を示す。第２実施例に係る画像特徴学習装置の概略構成を示す。第２実施例に係る分岐型競合学習手段によって実行されるフローチャートを示す。変形例２の第１の例に係る画像特徴学習装置の概略構成を示す。変形例２の第２の例に係る画像特徴学習装置の概略構成を示す。変形例２の第３の例に係る画像特徴学習装置の概略構成を示す。変形例３に係る画像特徴学習装置の概略構成を示す。

本発明の１つの観点では、画像特徴学習装置は、入力画像から特徴ベクトルを抽出する特徴抽出手段と、前記特徴ベクトルの集合をクラスタリングして量子化ベクトルを抽出するクラスタリング手段と、前記特徴ベクトルの集合を前記量子化ベクトルで量子化して前記入力画像ごとのヒストグラムを生成するヒストグラム生成手段と、前記入力画像の属性を示す属性情報に基づいて、前記ヒストグラムの集合を統計的に学習し、確率ベクトル又は確率密度分布を求める学習手段と、を備える。

上記の画像特徴学習装置では、特徴抽出手段は、１枚以上の画像（入力画像）が入力され、入力画像ごとに特徴ベクトルの集合を抽出し、クラスタリング手段は、全ての入力画像について特徴抽出手段によって抽出された特徴ベクトルの集合から、１以上の量子化ベクトル（クラスタ）を抽出し、ヒストグラム生成手段は、入力画像ごとに特徴ベクトルの集合を量子化ベクトルで量子化して、量子化ベクトルの出現頻度を示すヒストグラムを生成する。そして、学習手段は、入力画像についての属性情報に基づいて、全入力画像に関するヒストグラムの集合を統計的に学習して学習結果を求める。この場合、学習手段は、属性情報を教師情報として用いて、同一カテゴリ（類似の入力画像）ごとの平均的な確率ベクトル（量子化ベクトルの出現確率を要素とするベクトル）又は確率密度関数（確率ベクトルの分布）を、学習結果として求める。上記の画像特徴学習装置によれば、ノイズに対するロバスト性を確保しつつ、学習時の計算量を増加させることなく分類性能を改善することが可能となる。

上記の画像特徴学習装置の一態様では、前記学習手段は、前記ヒストグラムの確率モデルを生成し、前記確率モデル及び前記属性情報に基づいて、前記確率ベクトル又は前記確率密度分布を求める。

この態様では、学習手段は、学習画像ごとに、ヒストグラムから量子化ベクトルの出現確率を示す確率モデル（量子化ベクトルを確率変数とする確率分布）を生成し、確率モデル及び属性情報に基づいて学習結果を求める。好適には、学習手段は、確率モデルの集合をクラスタリングすることで確率ベクトル又は確率密度分布を求める。これにより、学習時の計算量を削減しつつ、効率良く分類性能の改善することができる。

上記の画像特徴学習装置の他の一態様では、前記学習手段は、初期状態ではクラスタ数を１とし、ヒストグラム空間上でデータ密度が高い箇所に順次クラスタを割り当てていく分岐型競合学習を行う。

この態様によれば、ｋ−ｍｅａｎｓ法など他のクラスタリング手段で問題となる劣悪な局所解への収束を防ぐことができ、計算量を大幅に増加させることなく分類性能を改善することが可能となる。

本発明の他の観点では、画像特徴学習装置によって実行される画像特徴学習方法は、入力画像から特徴ベクトルを抽出する特徴抽出工程と、前記特徴ベクトルの集合をクラスタリングして量子化ベクトルを抽出するクラスタリング工程と、前記特徴ベクトルの集合を前記量子化ベクトルで量子化して前記入力画像ごとのヒストグラムを生成するヒストグラム生成工程と、前記入力画像の属性を示す属性情報に基づいて、前記ヒストグラムの集合を統計的に学習し、確率ベクトル又は確率密度分布を求める学習工程と、を備える。

本発明の更に他の観点では、コンピュータを有する画像特徴学習装置によって実行されるプログラムは、前記コンピュータを、前記特徴ベクトルの集合をクラスタリングして量子化ベクトルを抽出するクラスタリング手段、前記特徴ベクトルの集合を前記量子化ベクトルで量子化して前記入力画像ごとのヒストグラムを生成するヒストグラム生成手段、前記入力画像の属性を示す属性情報に基づいて、前記ヒストグラムの集合を統計的に学習し、確率ベクトル又は確率密度分布を求める学習手段、として機能させる。

以下、図面を参照して本発明の好適な実施例について説明する。

１．第１実施例
まず、本発明の第１実施例について説明する。

１−１．全体構成
図１は、第１実施例に係る画像特徴学習装置１０ａの概略構成を示すブロック図である。図１に示すように、第１実施例に係る画像特徴学習装置１０ａは、主に、特徴抽出手段１と、クラスタリング手段２と、ヒストグラム生成手段３と、確率モデル生成手段４と、競合学習手段５ａと、を備える。例えば、画像特徴学習装置１０ａは、パーソナルコンピュータ内のＣＰＵ（Central Processing Unit）によって実現される。

特徴抽出手段１は、学習画像が入力されて特徴ベクトルを出力する。具体的には、特徴抽出手段１は、学習画像ごとに特徴ベクトルの集合を抽出する。例えば、特徴抽出手段１は、ＳＩＦＴ法（Scale Invariant Feature Transform）やＨＯＧ法（Histograms Of Gradient）などを用いて、特徴ベクトルを抽出する。なお、学習画像は、任意の階調値で表現された画素からなる画像であり、本発明における「入力画像」の一例に相当する。特徴抽出手段１には、そのような学習画像が１枚以上入力される。また、特徴ベクトルは、多次元のベクトル構造をもつ情報である。

クラスタリング手段２は、特徴抽出手段１で抽出された特徴ベクトルが入力されて量子化ベクトルを出力する。具体的には、クラスタリング手段２は、全ての学習画像について特徴抽出手段１によって抽出された特徴ベクトルの集合から、１以上の量子化ベクトル（クラスタ）を抽出する。つまり、クラスタリング手段２は、特徴ベクトルの集合をクラスタリングして量子化ベクトルを抽出する。例えば、クラスタリング手段２は、ｋ−ｍｅａｎｓ法（Ｋ平均法）などを用いて、量子化ベクトルを抽出する。なお、量子化ベクトルは、多次元のベクトル構造をもつ情報である。

ヒストグラム生成手段３は、特徴抽出手段１で抽出された特徴ベクトル及びクラスタリング手段２で抽出された量子化ベクトルが入力されてヒストグラムを出力する。具体的には、ヒストグラム生成手段３は、学習画像ごとに特徴ベクトルの集合を量子化ベクトルで量子化して、量子化ベクトルの出現頻度を示すヒストグラムを生成する。つまり、ヒストグラム生成手段３は、学習画像ごとのヒストグラムを生成する。例えば、ヒストグラム生成手段３は、幾何学距離基準やマハラビノス距離基準などを用いて、ヒストグラムを生成する。なお、ヒストグラムは、多次元のベクトル構造をもつ情報である。

確率モデル生成手段４は、ヒストグラム生成手段３で生成されたヒストグラムが入力されて確率モデルを出力する。具体的には、確率モデル生成手段４は、学習画像ごとに、ヒストグラムから量子化ベクトルの出現確率を示す確率モデルを生成する。例えば、確率モデル生成手段４は、正規化法やＧＭＭ法（Gaussian Mixture Model）などを用いて、確率モデルを生成する。なお、確率モデルは、量子化ベクトルを確率変数とする確率分布である。

競合学習手段５ａは、確率モデル生成手段４で生成された確率モデルが入力されると共に、教師情報が入力されて、学習結果を出力する。具体的には、競合学習手段５ａは、学習画像ごとの教師情報及び確率モデルに基づいて、全学習画像に関するヒストグラムの集合を統計的に学習して学習結果を求める。この場合、競合学習手段５ａは、学習結果として、同一カテゴリ（類似の学習画像）ごとの平均的な確率ベクトル（量子化ベクトルの出現確率を要素とするベクトル）又は確率密度関数（確率ベクトルの分布）を求める。なお、教師情報は、対応する学習画像の属性（所属するカテゴリなど）を示す情報であり、本発明における「属性情報」の一例に相当する。教師情報は、画像特徴学習装置１０ａの外部から与えられるものである。例えば、教師情報は、予め生成されて所定の記憶手段に記憶されている。

なお、確率モデル生成手段４及び競合学習手段５ａは、本発明における「学習手段」の一例に相当する。

１−２．競合学習手段の動作
次に、図２を参照して、上記した競合学習手段５ａの具体的な動作について説明する。図２は、第１実施例に係る競合学習手段５ａによって実行されるフローチャートを示している。

まず、ステップＳ１０では、競合学習手段５ａは、教師情報に基づいて、各クラスタ（同種の画像の集合を意味する）に属する学習画像の確率モデルＷｋをランダムに１つずつ選択する。ここで、「ｋ」は１〜Ｋまでの自然数の集合に属するクラスタ番号を示しており、「Ｋ」はクラスタ総数を示している。ステップＳ１０の後、処理はステップＳ１１に進む。

ここで、図３を参照して、ステップＳ１０の処理の具体例について説明する。図３（ａ）は、クラスタ１「犬」の画像集合を模式的に示しており、図３（ｂ）は、クラスタ２「人」の画像集合を模式的に示しており、図３（ｃ）は、クラスタＫ「車」の画像集合を模式的に示しており、図３（ｄ）は、量子化ベクトル（特徴量）の出現確率を示す確率モデルＷの一例を示している。例えば、ステップＳ１０では、競合学習手段５ａは、「犬」といった教師情報に基づいて、クラスタ１「犬」の画像集合からランダムに１つの確率モデルＷ１を選択し、「人」といった教師情報に基づいて、クラスタ２「人」の画像集合からランダムに１つの確率モデルＷ２を選択するといった処理を、全てのクラスタのそれぞれに対して行う。

図２に戻って、ステップＳ１１以降の処理を説明する。ステップＳ１１では、競合学習手段５ａは、各学習画像ｉの確率モデルＰｉと全クラスタの確率モデルＷｋとの類似度を評価し、最も近いクラスタ番号ｃ（確率モデルＷｃ）を確定する。ここで、「ｉ」は１〜Ｎまでの自然数の集合に属する学習画像番号を示しており、「Ｎ」は全学習画像数を示している。また、確率モデルＰｉは、確率モデルＷ１、Ｗ２、…、ＷＫ以外の各学習画像の確率モデルである。例えば、競合学習手段５ａは、幾何学的距離最小基準や、クロスエントロピー最小基準（Ｋｕｌｌｂａｃｋ−Ｌｅｉｂｌｅｒ情報量、Ｊｅｎｓｅｎ−Ｓｈａｎｎｏｎダイバージェンス、ｓｋｅｗダイバージェンスなど）を用いて、類似度の評価を行う。幾何学的距離最小基準を用いる場合には、競合学習手段５ａは、ベクトルＰｉとベクトルＷｋとのＬ２ノルムを示す「（Ｐｉ−Ｗｋ）^２」が最小となる確率モデルＷｋを、確率モデルＷｃとして決定する。ステップＳ１１の後、処理はステップＳ１２に進む。

ステップＳ１２では、競合学習手段５ａは、学習画像ｉ（確率モデルＰｉ）の教師情報と、ステップＳ１１で確定した確率モデルＷｃの教師情報とが一致するか否かを判定する。確率モデルＰｉの教師情報と確率モデルＷｃの教師情報とが一致する場合（ステップＳ１２：Ｙｅｓ）、競合学習手段５ａは、学習画像ｉを正しく分類可能なサンプルとみなして、確率モデルＰｉで確率モデルＷｃを重み付き更新する（ステップＳ１３）。例えば、競合学習手段５ａは、学習率γ（０＜γ＜１）を用いて表された式（１）に従って、確率モデルＷｃを重み付き更新する。そして、処理はステップＳ１４に進む。

Ｗｃ←（１−γ）Ｗｃ＋γＰｉ式（１）
他方で、確率モデルＰｉの教師情報と確率モデルＷｃの教師情報とが一致しない場合（ステップＳ１２：Ｎｏ）、処理はステップＳ１４に進む。この場合には、競合学習手段５ａは、学習画像ｉを正しく分類できないサンプル（ノイズ）とみなして、確率モデルＷｃを更新しない。

ステップＳ１４では、競合学習手段５ａは、全学習画像の評価が完了したか否かを判定する。全学習画像の評価が完了した場合（ステップＳ１４：Ｙｅｓ）、処理は終了する。この場合、最後に得られた確率モデルＷｃが学習結果に相当するものとなる。他方で、全学習画像の評価が完了していない場合（ステップＳ１４：Ｎｏ）、処理はステップＳ１１に戻る。この場合には、競合学習手段５ａは、ステップＳ１１以降の処理を再度行う。こうして、競合学習手段５ａは、全学習画像の評価が完了するまで、ステップＳ１１〜Ｓ１３の処理を繰り返し行う。

１−３．第１実施例の作用・効果
以下では、上記した第１実施例の作用・効果について説明する。ここでは、第１実施例と前述した非特許文献１及び特許文献１に記載の技術とを比較しながら、第１実施例の作用・効果について説明する。

１−３−１．非特許文献１との対比
非特許文献１に記載の技術では、学習画像を入力として特徴ベクトルを出力する特徴抽出手段と、特徴ベクトルを入力として量子化ベクトルを出力する量子化手段と、量子化ベクトルおよび特徴ベクトルを入力としてヒストグラムを出力するヒストグラム生成手段と、ヒストグラムおよび教師情報を入力として学習結果を出力するＳＶＭ（Support Vector Machine）手段とを用いて、画像をカテゴリごとに分類する。ＳＶＭ手段は、教師情報を利用してヒストグラムの分布を２つのカテゴリに分離する学習手段である。

このような非特許文献１に記載の技術では、学習手段として２クラス分類を行うＳＶＭ手段を用いているため、２クラスを超える分類を行うためにはＳＶＭ手段を多段に接続する必要があり、学習時に計算コストが増大してしまう。また、最適な（最大マージンで）識別を行うためには、学習画像のヒストグラム（多次元ベクトル）に関する２次計画問題を解く必要があり、全学習画像数Ｎの増加とともに計算量が最悪Ｎの３乗のオーダーで急速に増大してしまう。これに対して、上記した第１実施例では、クラスタの確率モデルＷｋを学習画像の確率モデルＰｉで遂次重み付け更新していくため、学習時の計算量は全学習画像数Ｎとクラスタ総数数Ｋとの積のオーダーに収まる。

更に、非特許文献１に記載の技術では、ＳＶＭ手段の追加学習（オンライン学習）への対応が困難である。つまり、学習画像が新たに追加された場合は、以前の学習画像を含めて再度学習を実施しなければならないため、学習画像を追加しながら効率良く分類性能を改善していくことが困難である。これに対して、上記した第１実施例では、追加された学習画像の確率モデルＰｉでクラスタの確率モデルＷｋを重み付け更新するだけで良く、学習画像を追加しながら効率良く分類性能の改善していくことが容易である。

１−３−２．特許文献１との対比
次に、特許文献１に記載の技術では、文書データを入力として確率分布を出力する確率分布算出手段と、確率分布を入出力する確率分布記憶手段と、確率分布を入力として確率分布モデルを出力する確率分布モデル算出手段と、確率分布モデル記憶手段の確率分布モデルを逐次更新を行う確率分布モデル更新手段と、確率分布モデルを入力としてクラスタを出力するクラスタ決定手段とを用いて、文書データをカテゴリごとに分類する。確率分布モデル更新手段は、教師情報を用いずに（無条件で）、以下の式（２）に従って確率分布モデルを更新する。

ｑ_ｍ ^ｋ＝（１−γ）ｑ_ｍ ^ｋ＋γｐ_ｍ式（２）
式（２）において、「ｑ」はクラスタの確率モデル（第１実施例で示した確率モデルＷｋに相当する）であり、「ｐ」は文書データの確率モデル（第１実施例で示した確率モデルＰｉに相当する）、「ｍ」は確率変数の要素（単語）であり、「ｋ」はクラスタ番号であり、「γ」は学習率である。

このような特許文献１に記載の技術では、学習手段として教師情報を用いないため、ノイズに影響されやすい。つまり、学習画像（確率モデルＰｉ）をクラスタ（確率モデルＷｋ）に分類する際に、確率モデルＰｉと確率モデルＷｋとの類似性（幾何学的距離最小基準やクロスエントロピー最小基準）を評価した結果のみに基づいて行うので、たとえ類似と判定されたクラスタが学習画像の属性と異なっていても（判定が誤っていても）、式（２）に従って確率モデルＰｉで確率モデルＷｋを更新してしまうためである。この場合、判定を誤った確率モデルＰｉは確率モデルＷｋに対してノイズとなり、その影響度は学習率γに依存する。

これに対して、上記した第１実施例では、類似性の判定結果だけでなく、教師情報（学習画像の正しい属性を示す情報）を用いることにより、判定を誤った確率モデルＰｉで確率モデルＷｋを更新してしまうことを抑制している。そのため、ノイズに対するロバスト性を容易に確保することができる。

２．第２実施例
次に、本発明の第２実施例について説明する。なお、以下では、第１実施例と異なる構成について主に説明を行い、第１実施例と同様の構成については適宜説明を省略する。つまり、特に説明しない構成要素や動作や処理などについては、第１実施例と同様であるものとする。

２−１．全体構成
図４は、第２実施例に係る画像特徴学習装置１０ｂの概略構成を示すブロック図である。図４に示すように、第２実施例に係る画像特徴学習装置１０ｂは、競合学習手段５ａの代わりに、分岐型競合学習手段５ｂを有する点で、第１実施例に係る画像特徴学習装置１０ａと構成が異なる。例えば、画像特徴学習装置１０ｂは、パーソナルコンピュータ内のＣＰＵによって実現される。

分岐型競合学習手段５ｂは、確率モデル生成手段４で生成された確率モデルが入力されると共に、教師情報が入力されて、確率ベクトル又は確率密度関数を学習結果として出力する。この場合、分岐型競合学習手段５ｂは、競合学習手段５ａと異なり、分岐型競合学習を行う。具体的には、分岐型競合学習手段５ｂは、学習画像の教師情報による既知のクラスタ総数を使用せずに、初期状態においてクラスタ総数Ｋを「１」とし、ヒストグラム空間上でデータ密度の高いところに順次クラスタを配置（分岐）させていく。そして、分岐型競合学習手段５ｂは、学習画像の教師情報で決まる既知のクラスタ数Ｋに達した後に、競合学習手段５ａと同様の競合学習を行う。

２−２．分岐型競合学習手段の動作
次に、図５を参照して、上記した分岐型競合学習手段５ｂの具体的な動作について説明する。図５は、第２実施例に係る分岐型競合学習手段５ｂによって実行されるフローチャートを示している。

まず、ステップＳ２０では、分岐型競合学習手段５ｂは、初期状態として、学習画像ｉ（確率モデルＰｉ）をランダムに１つ選択して、これを１番目のクラスタ（確率モデルＷ１）とし、現在のクラスタ数ｕを「１」に設定すると共に（ｕ＝１）、確率モデルＷ１の勝数ｖｃを「０」に設定する（ｖ１＝０）。そして、処理はステップＳ２１に進む。

ステップＳ２１では、分岐型競合学習手段５ｂは、学習画像ｉ（確率モデルＰｉ）をランダムに１つ選択し、その確率モデルＰｉと全クラスタの確率モデルＷｋ（初期状態ではＷ１のみ）との類似度を評価し、最も近いクラスタ番号ｃ（確率モデルＷｃ）を確定する。類似度を評価する手法は、第１実施例で示したものと同様である。ステップＳ２１の後、処理はステップＳ２２に進む。

ステップＳ２２では、分岐型競合学習手段５ｂは、学習画像ｉ（確率モデルＰｉ）の教師情報と、ステップＳ２１で確定した確率モデルＷｃの教師情報とが一致するか否かを判定する。確率モデルＰｉの教師情報と確率モデルＷｃの教師情報とが一致する場合（ステップＳ２２：Ｙｅｓ）、分岐型競合学習手段５ｂは、学習画像ｉを正しく分類可能なサンプルとみなして、確率モデルＰｉで確率モデルＷｃを重み付き更新する（ステップＳ２３）。例えば、分岐型競合学習手段５ｂは、上記した式（１）に従って、確率モデルＷｃを重み付き更新する。そして、処理はステップＳ２４に進む。他方で、確率モデルＰｉの教師情報と確率モデルＷｃの教師情報とが一致しない場合（ステップＳ２２：Ｎｏ）、処理はステップＳ２８に進む。この場合には、分岐型競合学習手段５ｂは、学習画像ｉを正しく分類できないサンプル（ノイズ）とみなして、確率モデルＷｃを更新しない。

ステップＳ２４では、分岐型競合学習手段５ｂは、現在のクラスタ数ｕがクラスタ総数Ｋに到達したか否かを判定する。現在のクラスタ数ｕがクラスタ総数Ｋに到達していない場合（ステップＳ２４：Ｎｏ）、処理はステップＳ２５に進む。ステップＳ２５では、分岐型競合学習手段５ｂは、クラスタｃの勝数ｖｃをインクリメントする（ｖｃ←ｖｃ＋１）。そして、分岐型競合学習手段５ｂは、勝数ｖｃが所定値Ｎｖに到達したか否かを判定する（ステップＳ２６）。勝数ｖｃが所定値Ｎｖに到達した場合（ステップＳ２６：Ｙｅｓ）、分岐型競合学習手段５ｂは、現在のクラスタ数ｕをインクリメントし（ｕ←ｕ＋１）、クラスタｕの勝数ｖｕとクラスタｃの勝数ｖｃとを０に初期化することで、クラスタを分岐する（ステップＳ２７）。そして、処理はステップＳ２８に進む。

他方で、現在のクラスタ数ｕがクラスタ総数Ｋに到達した場合（ステップＳ２４：Ｙｅｓ）、及び、勝数ｖｃが所定値Ｎｖに到達していない場合（ステップＳ２６：Ｎｏ）、処理はステップＳ２８に進む。

ステップＳ２８では、分岐型競合学習手段５ｂは、ステップＳ２１〜Ｓ２７の繰り返し実行回数を示す評価回数ｒをインクリメントする（ｒ←ｒ＋１）。そして、分岐型競合学習手段５ｂは、評価回数ｒが所定値Ｎｒに到達し、且つ、全学習画像のクラスタ番号が確定したか否かを判定する（ステップＳ２９）。評価回数ｒが所定値Ｎｒに到達していない場合、若しくは全学習画像のクラスタ番号が確定していない場合には（ステップＳ２９：Ｎｏ）、処理はステップＳ２１に戻る。この場合には、分岐型競合学習手段５ｂは、ステップＳ２１以降の処理を再度行う。例えば、現在のクラスタ数ｕがクラスタ総数Ｋに到達している場合には（ステップＳ２４：Ｙｅｓ）、分岐型競合学習手段５ｂは、残りの学習サンプルのクラスタ番号が確定するまで、ステップＳ２１〜Ｓ２３の処理を繰り返す。また、勝数ｖｃが所定値Ｎｖに到達していない場合には（ステップＳ２６：Ｎｏ）、分岐型競合学習手段５ｂは、勝数ｖｃが所定値Ｎｖに到達するまで、ステップＳ２１〜Ｓ２５の処理を繰り返す。

他方で、評価回数ｒが所定値Ｎｒに到達し、且つ、全学習画像のクラスタ番号が確定した場合（ステップＳ２９：Ｙｅｓ）、処理は終了する。この場合、最後に得られた確率モデルＷｃが学習結果に相当するものとなる。

２−３．第２実施例の作用・効果
次に、上記した第２実施例の作用・効果について説明する。ここでは、第１実施例と異なる作用・効果のみを説明する。

第２実施例では、分岐型競合学習手段５ｂは、学習画像の教師情報による既知のクラスタ総数を使用せずに、初期状態においてクラスタ総数Ｋを１とし、ヒストグラム空間上でデータ密度の高いところに順次クラスタを配置（分岐）させていき、学習画像の教師情報で決まる既知のクラスタ数Ｋに達した後は第１実施例と同様の競合学習を行う。これにより、ｋ−ｍｅａｎｓ法など他のクラスタリング手段で問題となる劣悪な局所解への収束を防ぐことができ、計算量を大幅に増加させることなく分類性能を改善することが可能となる。

３．変形例
以下では、上記の実施例に好適な変形例について説明する。なお、下記の変形例は、任意に組み合わせて上述の実施例に適用することができる。

３−１．変形例１
上記した第１及び第２実施例では、式（１）を用いて確率モデルＷｃを重み付き更新していたが、変形例１では、式（１）の代わりに、以下の式（３）を用いて確率モデルＷｃを重み付き更新する。

Ｗｃ←（１−Ｓ・γ）Ｗｃ＋Ｓ・Ｐｉ式（３）
式（３）において、「Ｓ」は、学習画像（確率モデルＰｉ）の教師情報（学習画像が属する正しいクラスタ番号）と、当該確率モデルＰｉと類似と判定され重み付け更新の対象となったクラスタ（確率モデルＷｃ）のクラスタ番号ｃとが等しい場合に「１」に設定され、そうでない場合に「０」に設定される。つまり、「Ｓ」は、類似性が正しく判定された場合に「１」に設定され、類似性が正しく判定されなかった場合に「０」に設定される。

このような式（３）を第１実施例に係る競合学習手段５ａに適用することで、図２に示したステップＳ１２とステップＳ１３とを統合することができ、処理を簡素化することができる。同様に、第２実施例に係る分岐型競合学習手段５ｂに式（３）を適用することで、図５に示したステップＳ２２とステップＳ２３とを統合することができ、処理を簡素化することができる。

３−２．変形例２
変形例２では、画像特徴学習装置は、主成分分析を行って次元数を削減したパラメータを用いる。以下では、変形例２の具体例（第１乃至第３の例）を提示する。

図６は、変形例２の第１の例に係る画像特徴学習装置１０ｃの概略構成を示すブロック図である。図６に示すように、当該画像特徴学習装置１０ｃは、特徴抽出手段１とクラスタリング手段２との間に主成分分析手段６ｃが設けられている点で、第１実施例に係る画像特徴学習装置１０ａと構成が異なる。主成分分析手段６ｃは、特徴抽出手段１で抽出された特徴ベクトルを主成分分析により変換して、異なる特徴ベクトル空間に写像した特徴ベクトルをクラスタリング手段２に出力する。この場合、主成分分析手段６ｃは、特徴抽出手段１で抽出された多次元の特徴ベクトル集合に対して主成分分析を行うことで、その次元数を削減する。

図７は、変形例２の第２の例に係る画像特徴学習装置１０ｄの概略構成を示すブロック図である。図７に示すように、当該画像特徴学習装置１０ｄは、ヒストグラム生成手段３と確率モデル生成手段４との間に主成分分析手段６ｄが設けられている点で、第１実施例に係る画像特徴学習装置１０ａと構成が異なる。主成分分析手段６ｄは、ヒストグラム生成手段３で生成されたヒストグラムを主成分分析により変換して、異なるヒストグラムベクトル空間に写像したヒストグラムを確率モデル生成手段４に出力する。この場合、主成分分析手段６ｄは、ヒストグラム生成手段３で生成された多次元のヒストグラム集合に対して主成分分析を行うことで、その次元数を削減する。

図８は、変形例２の第３の例に係る画像特徴学習装置１０ｅの概略構成を示すブロック図である。図８に示すように、当該画像特徴学習装置１０ｅは、確率モデル生成手段４と競合学習手段５ａとの間に主成分分析手段６ｅが設けられている点で、第１実施例に係る画像特徴学習装置１０ａと構成が異なる。主成分分析手段６ｅは、確率モデル生成手段４で生成された確率モデルを主成分分析により変換して、異なる確率ベクトル空間に写像した確率モデルを競合学習手段５ａに出力する。この場合、主成分分析手段６ｅは、確率モデル生成手段４で生成された多次元の確率モデル集合に対して主成分分析を行うことで、その次元数を削減する。

以上説明した変形例２によれば、主成分分析によって次元数を削減することで、当該主成分分析の以降の処理において、計算量や記憶容量を削減することができる。

なお、上記した変形例２の第１乃至第３の例に係る画像特徴学習装置１０ｃ、１０ｄ、１０ｅでは、第１実施例に係る競合学習手段５ａが適用されていたが、競合学習手段５ａの代わりに、第２実施例に係る分岐型競合学習手段５ｂを適用しても良い。

３−３．変形例３
変形例３では、画像特徴学習装置は、特徴抽出手段１で抽出された特徴ベクトルから確率モデルを直接生成する。

図９は、変形例３に係る画像特徴学習装置１０ｆの概略構成を示すブロック図である。図９に示すように、変形例３に係る画像特徴学習装置１０ｆは、クラスタリング手段２及びヒストグラム生成手段３を具備せずに、特徴抽出手段１、確率モデル生成手段４及び競合学習手段５ａのみを具備する点で、第１実施例に係る画像特徴学習装置１０ａと構成が異なる。

変形例３に係る画像特徴学習装置１０ｆでは、確率モデル生成手段４には、特徴抽出手段１で抽出された特徴ベクトルがそのまま入力される、つまりクラスタリング手段２及びヒストグラム生成手段３による処理が施されていない特徴ベクトルが入力される。この場合、確率モデル生成手段４は、特徴抽出手段１で抽出された特徴ベクトルから特徴ベクトルごとの確率モデルを生成し、競合学習手段５ａは、そのように生成された確率モデルに基づいて学習結果を求める。

以上説明した変形例３によれば、画像特徴学習装置１０ｆの構成を簡素化することができる。

なお、上記した変形例３に係る画像特徴学習装置１０ｆでは、第１実施例に係る競合学習手段５ａが適用されていたが、競合学習手段５ａの代わりに、第２実施例に係る分岐型競合学習手段５ｂを適用しても良い。

４．適用例
本発明は、種々の画像認識技術（特に画像から特徴を抽出して分類する技術）に適用可能である。本発明をソフトウェアやハードウェアで実現することにより、例えば車載関連機器や、道路交通情報システム（ＩＴＳ）や、医療診断や、オーディオビジュアルや、家電や、ゲームや、ＦＡや、セキュリティや、ディジタルサイネージや、リモートセンシングや、バイオメトリクスや、トレーサビリティや、コンピュータシステムなどへの応用が可能である。

１特徴抽出手段
２クラスタリング手段
３ヒストグラム生成手段
４確率モデル生成手段
５ａ競合学習手段
５ｂ分岐型競合学習手段
１０ａ、１０ｂ画像特徴学習装置

Claims

入力画像から特徴ベクトルを抽出する特徴抽出手段と、
前記特徴ベクトルの集合をクラスタリングして量子化ベクトルを抽出するクラスタリング手段と、
前記特徴ベクトルの集合を前記量子化ベクトルで量子化して前記入力画像ごとのヒストグラムを生成するヒストグラム生成手段と、
前記入力画像の属性を示す属性情報に基づいて、前記ヒストグラムの集合を統計的に学習し、確率ベクトル又は確率密度分布を求める学習手段と、
を備えることを特徴とする画像特徴学習装置。
前記学習手段は、前記ヒストグラムの確率モデルを生成し、前記確率モデル及び前記属性情報に基づいて、前記確率ベクトル又は前記確率密度分布を求めることを特徴とする請求項１に記載の画像特徴学習装置。
前記学習手段は、前記確率モデルの集合をクラスタリングすることで前記確率ベクトル又は前記確率密度分布を求めることを特徴とする請求項２に記載の画像特徴学習装置。
前記学習手段は、初期状態ではクラスタ数を１とし、ヒストグラム空間上でデータ密度が高い箇所に順次クラスタを割り当てていく分岐型競合学習を行うことを特徴とする請求項２又は３に記載の画像特徴学習装置。
画像特徴学習装置によって実行される画像特徴学習方法であって、
入力画像から特徴ベクトルを抽出する特徴抽出工程と、
前記特徴ベクトルの集合をクラスタリングして量子化ベクトルを抽出するクラスタリング工程と、
前記特徴ベクトルの集合を前記量子化ベクトルで量子化して前記入力画像ごとのヒストグラムを生成するヒストグラム生成工程と、
前記入力画像の属性を示す属性情報に基づいて、前記ヒストグラムの集合を統計的に学習し、確率ベクトル又は確率密度分布を求める学習工程と、
を備えることを特徴とする画像特徴学習方法。
コンピュータを有する画像特徴学習装置によって実行されるプログラムであって、
前記コンピュータを、
前記特徴ベクトルの集合をクラスタリングして量子化ベクトルを抽出するクラスタリング手段、
前記特徴ベクトルの集合を前記量子化ベクトルで量子化して前記入力画像ごとのヒストグラムを生成するヒストグラム生成手段、
前記入力画像の属性を示す属性情報に基づいて、前記ヒストグラムの集合を統計的に学習し、確率ベクトル又は確率密度分布を求める学習手段、
として機能させることを特徴とするプログラム。