JP2011154500A

JP2011154500A - 学習装置、学習方法、識別装置、識別方法、及びプログラム

Info

Publication number: JP2011154500A
Application number: JP2010015087A
Authority: JP
Inventors: Yoshiaki Iwai; 嘉昭岩井; Shunichi Honma; 俊一本間; Takayuki Ashigahara; 隆之芦ヶ原
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2010-01-27
Filing date: 2010-01-27
Publication date: 2011-08-11
Also published as: US20110182515A1; CN102147868A; US8340403B2

Abstract

【課題】識別対象の識別に用いる特徴量を、異なる識別対象間で共有する。
【解決手段】特徴点抽出部２４は、複数の生成用画像それぞれから特徴点を抽出し、特徴量抽出部２５は、生成用画像から、抽出された特徴点の特徴を表す特徴点特徴量を抽出し、全体特徴量算出部２６は、異なる識別対象をそれぞれ識別する識別器の生成に共通して用いられる生成用特徴量を含む共有コードブックに基づいて、生成用画像の特徴点特徴量から、生成用画像全体の特徴を表す全体特徴量を算出し、識別器生成部２７は、生成用画像の全体特徴量と、生成用画像がポジティブ画像であるかネガティブ画像であるかを表す正解ラベルとに基づいて、識別器を生成する。本発明は、例えば、所定の識別対象を識別する識別器を生成するための学習装置に適用できる。
【選択図】図１

Description

本発明は、学習装置、学習方法、識別装置、識別方法、及びプログラムに関し、特に、画像上に存在する被写体が所定の識別対象であるか否かを識別する場合に用いて好適な学習装置、学習方法、識別装置、識別方法、及びプログラムに関する。

カメラで取得した画像から、その画像上に存在する識別対象としての物体を識別（認識）する従来の識別方法として、識別対象を大局的に記述したテンプレートを用いたマッチングを行う識別方法が存在する。

この識別方法では、識別対象を大局的に記述したテンプレート、具体的には、識別対象全体のテクスチャのテンプレートを用意しておき、そのテンプレートと、識別を行う対象の画像（処理対象画像）とのマッチングが行われる。

しかしながら、識別対象を大局的に記述したテンプレートを用いたマッチングでは、処理対象画像上に存在する識別対象の部分的な隠れや歪み等に対して対応することが困難であった。

そこで、処理対象画像の局所領域に注目して、各局所領域から特徴量を抽出し、各局所領域の特徴量を組み合わせたもの（局所領域の特徴量の集合）、すなわち、例えば、各局所領域の特徴量を要素とするベクトルを用いて、識別を行う識別方法が提案されている。

局所領域の特徴量の集合を用いる識別方法によれば、識別対象を大局的に記述したテンプレートを用いる識別方法では対応することが困難であった、識別対象の部分的な隠れや歪み等の問題を、ある程度解消し、精度の高い識別を行うことができる。

局所領域の特徴量は、個別の物体の識別の他、物体のカテゴリの識別にも用いられる。例えば、局所領域の特徴量を用いて、人の顔等の特定のカテゴリを識別する識別方法が提案されている（例えば、非特許文献１を参照）。

また、カテゴリの識別には、様々な識別方法が提案されている。カテゴリの識別に提案されている識別方法としては、例えば、BoF(Bag of Features)ヒストグラムを用いる識別方法（例えば、非特許文献２を参照）や、特徴量の相関を用いる識別方法(例えば、特許文献１を参照)等がある。

例えば、BoFヒストグラムを用いる識別方法では、Visual codebookと呼ばれる代表的な特徴量を用いることで、画像表現の次元を抑制するようにしている。

しかしながら、このようなVisual codebookを用いる場合には、画像領域における特徴量の出現位置の情報が失われるため、識別の精度が低下することが生じ得る。

そこで、このような問題を解決するために、画像領域をグリッド（grid、格子）状に分割することで、弱い位置拘束を与える方法（例えば、非特許文献３を参照）が提案されている。

特開２００７−１２８１９５号公報

P.Viola, M. Jones. Robust Real-time Face Detection, cvpr2001 G. Csurka, C. Bray, C. Dance, and L. Fan. Visual categorization with bags of keypoint, ECCV2004 S.Lazebnik, C.Schmid, J.Ponce "Beyond Bags of Features: Spatial Pyramid Matching for Recognizing Natural Scene Categories", CVPR2006

しかしながら、上述したVisual codebookを用いて画像表現の次元を抑制するようにしても、複数のカテゴリ（マルチクラス）の識別に適用する場合には、カテゴリ別に、カテゴリの識別に用いる複数の特徴量の集合である特徴量プールを作成する必要があり、カテゴリ数が多くなった場合に、各カテゴリに対応する特徴量が膨大となってしまう。

このため、Visual codebookを用いてカテゴリの識別を行なう場合には、例えば、Visual codebookを記憶するためのメモリの容量が増加してしまっていた。

また、画像領域をグリッド状に分割して弱い位置拘束を与える方法では、位置拘束が各カテゴリで共通であるため、識別対象を識別する精度が低下してしまう。

この場合、識別の精度の低下を抑止するために、各カテゴリ固有のVisual codebookを生成して識別の精度を向上させる必要があり、特徴量が膨大となってしまい、やはり、Visual codebookを記憶するためのメモリの容量が増加してしまっていた。

本発明は、このような状況に鑑みてなされたものであり、個別の物体や識別対象のカテゴリの識別に用いる特徴量を識別対象どうしで共通化（共有）することにより、特徴量の増加を抑止し、識別対象を精度良く検出するものである。

本発明の第１の側面の学習装置は、画像上に存在する被写体が所定の識別対象であるか否かを識別するための識別器を生成するために用いられる複数の生成用画像であって、且つ、前記識別対象が画像上に存在するポジティブ画像と、前記識別対象が画像上に存在しないネガティブ画像とにより構成される前記複数の生成用画像それぞれから特徴点を抽出する特徴点抽出手段と、前記生成用画像から、前記特徴点の特徴を表す特徴点特徴量を抽出する特徴点特徴量抽出手段と、異なる識別対象をそれぞれ識別する識別器の生成に共通して用いられる生成用特徴量を含む共有コードブックに基づいて、前記生成用画像の前記特徴点特徴量から、前記生成用画像全体の特徴を表す全体特徴量を算出する全体特徴量算出手段と、前記生成用画像の前記全体特徴量と、前記生成用画像が前記ポジティブ画像であるか前記ネガティブ画像であるかを表す正解ラベルとに基づいて、前記識別器を生成する識別器生成手段とを含む学習装置である。

本発明の第１の側面の学習装置において、複数の前記生成用特徴量それぞれを、前記生成用特徴量を識別するための識別子に対応づけて保持するコードブックと、異なる識別対象をそれぞれ識別する識別器毎に作成された複数の共有情報であって、且つ、前記複数の生成用特徴量のうち、前記全体特徴量を算出する際に用いる前記生成用特徴量の前記識別子を有する共有情報とにより構成される共有コードブックを記憶している共有コードブック記憶手段をさらに設けることができ、前記全体特徴量算出手段では、前記コードブックが保持する前記複数の生成用特徴量のうち、前記識別器生成手段により生成される前記識別器について作成された前記共有情報が有する前記識別子に対応付けられている生成用特徴量を用いて、前記全体特徴量を算出することができる。

本発明の第１の側面の学習装置において、前記複数の共有情報のうちの所定の共有情報は、他の共有情報が有する前記識別子と同一の識別子を有しているようにすることができる。

本発明の第１の側面の学習装置において、前記所定の共有情報は、前記ポジティブ画像であるモデル画像から抽出された特徴点も対応付けられた前記識別子を有しており、前記全体特徴量算出手段では、前記識別子に対応付けられている生成用特徴量と、前記生成用画像上の全範囲のうち、前記識別子に対応付けられている前記特徴点に基づき決定される範囲上に存在する特徴点の特徴点特徴量とを用いて、前記全体特徴量を算出することができる。

本発明の第１の側面の学習装置において、前記所定の共有情報が有する前記識別子には、前記他の共有情報が有する同一の前記識別子に対応付けられている特徴点とは異なる特徴点が対応付けられているようにすることができる。

前記ポジティブ画像であるモデル画像から特徴点を抽出するモデル画像特徴点抽出手段と、前記モデル画像の特徴点における頻度分布に基づいて、前記特徴点を量子化する量子化手段とをさらに設けることができ、前記共有情報は、量子化後の前記特徴点が対応付けられた前記識別子を有するようにすることができる。

本発明の第１の側面の学習装置において、前記全体特徴量算出手段では、前記全体特徴量として、前記共有コードブックに含まれる前記生成用特徴量と、前記生成用画像の前記特徴点特徴量との相関を表す相関値を算出することができる。

本発明の第１の側面の学習装置において、前記識別器生成手段では、複数の次元のベクトルにより表される前記全体特徴量の各次元の要素である複数の次元特徴量のうち、前記ポジティブ画像、及び前記ネガティブ画像の識別を誤る度合いを表すエラー値を小さくする前記次元特徴量を用いて識別を行なう前記識別器と、前記エラー値を小さくする前記次元特徴量の次元を表す次元情報とを生成することができる。

本発明の第１の側面の学習方法は、所定の識別対象を識別するための識別器を学習する学習装置の学習方法であって、前記学習装置は、特徴点抽出手段と、特徴点特徴量抽出手段と、全体特徴量算出手段と、識別器生成手段とを含み、前記特徴点抽出手段が、画像上に存在する被写体が所定の識別対象であるか否かを識別するための識別器を生成するために用いられる複数の生成用画像であって、且つ、前記識別対象が画像上に存在するポジティブ画像と、前記識別対象が画像上に存在しないネガティブ画像とにより構成される前記複数の生成用画像それぞれから特徴点を抽出し、前記特徴点特徴量抽出手段が、前記生成用画像から、前記特徴点の特徴を表す特徴点特徴量を抽出し、前記全体特徴量算出手段が、異なる識別対象をそれぞれ識別する識別器の生成に共通して用いられる生成用特徴量を含む共有コードブックに基づいて、前記生成用画像の前記特徴点特徴量から、前記生成用画像全体の特徴を表す全体特徴量を算出し、前記識別器生成手段が、前記生成用画像の前記全体特徴量と、前記生成用画像が前記ポジティブ画像であるか前記ネガティブ画像であるかを表す正解ラベルとに基づいて、前記識別器を生成するステップを含む学習方法である。

本発明の第１の側面の第１のプログラムは、コンピュータを、画像上に存在する被写体が所定の識別対象であるか否かを識別するための識別器を生成するために用いられる複数の生成用画像であって、且つ、前記識別対象が画像上に存在するポジティブ画像と、前記識別対象が画像上に存在しないネガティブ画像とにより構成される前記複数の生成用画像それぞれから特徴点を抽出する特徴点抽出手段と、前記生成用画像から、前記特徴点の特徴を表す特徴点特徴量を抽出する特徴点特徴量抽出手段と、異なる識別対象をそれぞれ識別する識別器の生成に共通して用いられる生成用特徴量を含む共有コードブックに基づいて、前記生成用画像の前記特徴点特徴量から、前記生成用画像全体の特徴を表す全体特徴量を算出する全体特徴量算出手段と、前記生成用画像の前記全体特徴量と、前記生成用画像が前記ポジティブ画像であるか前記ネガティブ画像であるかを表す正解ラベルとに基づいて、前記識別器を生成する識別器生成手段として機能させるためのプログラムである。

本発明の第１の側面によれば、画像上に存在する被写体が所定の識別対象であるか否かを識別するための識別器を生成するために用いられる複数の生成用画像であって、且つ、前記識別対象が画像上に存在するポジティブ画像と、前記識別対象が画像上に存在しないネガティブ画像とにより構成される前記複数の生成用画像それぞれから特徴点が抽出され、前記生成用画像から、前記特徴点の特徴を表す特徴点特徴量が抽出され、異なる識別対象をそれぞれ識別する識別器の生成に共通して用いられる生成用特徴量を含む共有コードブックに基づいて、前記生成用画像の前記特徴点特徴量から、前記生成用画像全体の特徴を表す全体特徴量が算出され、前記生成用画像の前記全体特徴量と、前記生成用画像が前記ポジティブ画像であるか前記ネガティブ画像であるかを表す正解ラベルとに基づいて、前記識別器が生成される。

本発明の第２の側面の識別装置は、画像上に存在する被写体が所定の識別対象であるか否かを識別する処理の対象とする処理対象画像から特徴点を抽出する特徴点抽出手段と、前記処理対象画像から、前記特徴点の特徴を表す特徴点特徴量を抽出する特徴点特徴量抽出手段と、異なる識別対象をそれぞれ識別する識別器の生成に共通して用いられた生成用特徴量を含む共有コードブックに基づいて、前記処理対象画像の特徴点特徴量から、前記処理対象画像全体の特徴を表す全体特徴量を算出する全体特徴量算出手段と、画像上に存在する被写体が所定の識別対象であるか否かを識別する識別器と、前記全体特徴量とに基づいて、前記処理対象画像上に存在する被写体が所定の識別対象であるか否かを識別する識別手段とを含む識別装置である。

本発明の第２の側面の識別装置において、複数の前記生成用特徴量それぞれを、前記生成用特徴量を識別するための識別子に対応づけて保持するコードブックと、異なる識別対象をそれぞれ識別する識別器毎に作成された複数の共有情報であって、且つ、前記複数の生成用特徴量のうち、前記全体特徴量を算出する際に用いる前記生成用特徴量の前記識別子を有する共有情報とにより構成される共有コードブックを記憶している共有コードブック記憶手段をさらに設けることができ、前記全体特徴量算出手段では、前記コードブックが保持する前記複数の生成用特徴量のうち、前記識別手段で用いられる前記識別器について作成された前記共有情報が有する前記識別子に対応付けられている生成用特徴量を用いて、前記全体特徴量を算出することができる。

本発明の第２の側面の識別装置において、前記複数の共有情報のうちの所定の共有情報は、他の共有情報が有する前記識別子と同一の識別子を有しているようにすることができる。

本発明の第２の側面の識別装置において、前記所定の共有情報は、前記所定の識別対象が画像上に存在するモデル画像から抽出された特徴点も対応付けられた前記識別子を有しており、前記全体特徴量算出手段では、前記識別子に対応付けられている生成用特徴量と、前記処理対象画像上の全範囲のうち、前記識別子に対応付けられている前記特徴点に基づき決定される範囲上に存在する特徴点の特徴点特徴量とを用いて、前記全体特徴量を算出することができる。

本発明の第２の側面の識別装置において、前記共有情報が有する前記識別子には、前記他の共有情報が有する同一の前記識別子に対応付けられている特徴点とは異なる特徴点が対応付けられているようにすることができる。

本発明の第２の側面の識別装置において、前記全体特徴量算出手段では、前記全体特徴量として、前記共有コードブックに含まれる前記生成用特徴量と、前記処理対象画像の前記特徴点特徴量との相関を表す相関値を算出することができる。

本発明の第２の側面の識別装置において、前記全体特徴量算出手段では、前記共有コードブックに基づいて、前記処理対象画像の特徴点特徴量から、前記処理対象画像全体の特徴を表す全体特徴量であって、且つ、複数の次元特徴量により構成される前記全体特徴量を算出し、前記識別手段では、画像上に存在する被写体が所定の識別対象であるか否かを識別する識別器に対して、前記全体特徴量を構成する前記複数の次元特徴量のうち、所定の次元特徴量を入力として与えることで、前記処理対象画像上に存在する被写体が所定の識別対象であるか否かを識別することができる。

本発明の第２の側面の識別装置において、前記識別手段では、画像上に存在する被写体が所定の識別対象であるか否かを識別する識別器に対して、前記全体特徴量を構成する前記複数の次元特徴量のうち、次元情報が表す次元の次元特徴量を入力として与えることで、前記処理対象画像に写っている被写体が所定の識別対象であるか否かを識別し、前記識別器は、前記全体特徴量を表す前記複数の次元特徴量のうち、前記識別対象が画像上に存在するポジティブ画像、及び前記識別対象が画像上に存在しないネガティブ画像の識別を誤る度合いを表すエラー値を小さくする前記次元特徴量を用いて識別を行なうものであり、前記次元情報は、前記エラー値を小さくする前記次元特徴量の次元を表すものであるようにすることができる。

本発明の第２の側面の識別方法は、画像に写っている被写体が所定の識別対象であるか否かを識別する識別装置の識別方法であって、前記識別装置は、特徴点抽出手段と、特徴点特徴量抽出手段と、全体特徴量算出手段と、識別手段とを含み、前記特徴点抽出手段が、画像上に存在する被写体が所定の識別対象であるか否かを識別する処理の対象とする処理対象画像から特徴点を抽出し、前記特徴点特徴量抽出手段が、前記処理対象画像から、前記特徴点の特徴を表す特徴点特徴量を抽出し、前記全体特徴量算出手段が、異なる識別対象をそれぞれ識別する識別器の生成に共通して用いられた生成用特徴量を含む共有コードブックに基づいて、前記処理対象画像の特徴点特徴量から、前記処理対象画像全体の特徴を表す全体特徴量を算出し、前記識別手段が、画像上に存在する被写体が所定の識別対象であるか否かを識別する識別器と、前記全体特徴量とに基づいて、前記処理対象画像上に存在する被写体が所定の識別対象であるか否かを識別するステップを含む識別方法である。

本発明の第２の側面の第２のプログラムは、コンピュータを、画像上に存在する被写体が所定の識別対象であるか否かを識別する処理の対象とする処理対象画像から特徴点を抽出する特徴点抽出手段と、前記処理対象画像から、前記特徴点の特徴を表す特徴点特徴量を抽出する特徴点特徴量抽出手段と、異なる識別対象をそれぞれ識別する識別器の生成に共通して用いられた生成用特徴量を含む共有コードブックに基づいて、前記処理対象画像の特徴点特徴量から、前記処理対象画像全体の特徴を表す全体特徴量を算出する全体特徴量算出手段と、画像上に存在する被写体が所定の識別対象であるか否かを識別する識別器と、前記全体特徴量とに基づいて、前記処理対象画像上に存在する被写体が所定の識別対象であるか否かを識別する識別手段として機能させるためのプログラムである。

本発明の第２の側面によれば、画像上に存在する被写体が所定の識別対象であるか否かを識別する処理の対象とする処理対象画像から特徴点が抽出され、前記処理対象画像から、前記特徴点の特徴を表す特徴点特徴量が抽出され、異なる識別対象をそれぞれ識別する識別器の生成に共通して用いられた生成用特徴量を含む共有コードブックに基づいて、前記処理対象画像の特徴点特徴量から、前記処理対象画像全体の特徴を表す全体特徴量が算出され、画像上に存在する被写体が所定の識別対象であるか否かを識別する識別器と、前記全体特徴量とに基づいて、前記処理対象画像上に存在する被写体が所定の識別対象であるか否かが識別される。

本発明によれば、画像上に存在する被写体が所定の識別対象であるか否かを識別する場合において、識別に用いる特徴量の増加を抑止し、識別対象を精度良く検出することが可能となる。

本発明を適用した学習装置の第１の構成例を示すブロック図である。共有コードブック生成部の構成例を示すブロック図である。特徴量置換部及び量子化部が行なう処理の一例を説明するための図である。共有コードブックの一例を示す図である。量子化部が行なう処理の一例を説明するための図である。図１の全体特徴量算出部が行う処理の一例を説明するための図である。識別器の生成方法の一例を説明するための図である。図１の学習装置が行う学習処理を説明するためのフローチャートである。共有コードブック生成処理を説明するためのフローチャートである。コードブック生成処理を説明するためのフローチャートである。識別器生成処理を説明するためのフローチャートである。図１の学習装置の学習により生成された識別器を用いて識別対象を識別する第１の識別装置の構成例を示すブロック図である。図１２の識別装置が行なう識別処理を説明するためのフローチャートである。本発明を適用した学習装置の第２の構成例を示すブロック図である。範囲決定部が行なう処理の一例を説明するための図である。図１４の全体特徴量算出部が行う処理の一例を説明するための図である。図１４の学習装置が行なう学習処理を説明するためのフローチャートである。範囲決定処理を説明するためのフローチャートである。図１４の学習装置の学習により生成された識別器を用いて識別対象を識別する第２の識別装置の構成例を示すブロック図である。図１９の識別装置が行なう識別処理を説明するためのフローチャートである。コンピュータの構成例を示すブロック図である。

以下、発明を実施するための形態（以下、実施の形態という）について説明する。なお、説明は以下の順序で行う。
１．第１の実施の形態（特徴点特徴量を異なる識別対象で共通して用いる例）
２．第２の実施の形態（識別対象毎に異なる検索範囲を用いる例）
３．変形例

＜１．第１の実施の形態＞
[学習装置１の構成例]
図１は、本発明を適用した学習装置１の構成例を示している。

この学習装置１は、学習用画像を用いて、画像上に存在する被写体が所定の識別対象であるか否かを識別する識別器（関数）と、後述する次元情報とを生成する。

ここで、学習用画像は、識別器の生成（学習）に用いられる画像であり、複数のモデル画像、複数のプリミティブ画像、及び複数の生成用画像を含む。

モデル画像は、識別対象とされ得る被写体（例えば、ノート型パーソナルコンピュータ（ノートパソコン）や自動車等）が画像上に存在する画像である。また、プリミティブ画像は、特定の識別対象に依存しない複数の特徴量を有する画像、すなわち、特定の識別対象の特徴量に限らず、様々な特徴量を抽出するために用いられる画像である。

なお、プリミティブ画像としては、例えば、人工のオブジェクトや、風景等の自然物が画像上に存在する画像が採用される。

また、生成用画像は、識別対象（例えば、ノートパソコン）が画像上に存在するポジティブ画像と、識別対象が画像上に存在しないネガティブ画像との両方を含む。

さらに、生成用画像には、正解ラベルが付加されている。この正解ラベルは、生成用画像毎に存在し、各生成用画像が、ポジティブ画像、又はネガティブ画像のいずれかであるかを表す。

すなわち、この学習装置１は、複数のプリミティブ画像から抽出した特徴量を、識別対象となり得る被写体（例えば、ノートパソコンや自動車等）の特徴量として共有する共有コードブックを生成する。

そして、学習装置１は、生成した共有コードブックを用いて、画像上に存在する被写体が所定の識別対象（例えば、自動車）であるか否かを識別する識別器と、対応する次元情報とを生成する。

学習装置１は、入力部２１、共有コードブック生成部２２、共有コードブック記憶部２３、特徴点抽出部２４、特徴量抽出部２５、全体特徴量算出部２６、及び識別器生成部２７により構成される。

入力部２１には、学習用画像として、複数のモデル画像、複数のプリミティブ画像、及び複数の生成用画像が供給される。入力部２１は、供給される複数のモデル画像、及び複数のプリミティブ画像を、共有コードブック生成部２２に入力（供給）する。

また、入力部２１は、供給される複数の生成用画像を、特徴点抽出部２４に入力する。

共有コードブック生成部２２は、入力部２１からの複数のモデル画像、及び複数のプリミティブ画像に基づいて、識別対象となり得る被写体の特徴量を共有する共有コードブックを生成し、共有コードブック記憶部２３に供給して記憶させる。

なお、共有コードブック生成部２２の詳細については、図２を参照して後述する。

共有コードブック記憶部２３は、共有コードブック生成部２２からの共有コードブックを記憶する。

特徴点抽出部２４は、入力部２１からの複数の生成用画像それぞれを、順次、注目生成用画像とし、注目生成用画像から特徴点を抽出する。そして、特徴点抽出部２４は、抽出した特徴点を、注目生成用画像とともに、特徴量抽出部２５に供給する。

ここで、画像の局所的な情報は、コーナ（corner）点に含まれることが多いため、特徴点抽出部２４は、コーナ点（となっている画素）を、特徴点として抽出する。

コーナ点の抽出は、ハリーズコーナ検出器(Harris Corner Detector)を用いて行うことができる。ハリーズコーナ検出器では、ある位置(x,y)の画素の画素値（例えば、輝度）を、I(x,y)と表すとすると、次式（１）により求められる輝度勾配の２次モーメントLの２つの固有値が所定の閾値以上の画素が、コーナ点として検出される。

・・・（１）

なお、式（１）では、画素値I(x,y)を、(x,y)を省略して、Iと記述している。

また、特徴点抽出部２４は、特徴点として、コーナ点の他、例えば、エッジとなっている画素や、所定の固定の位置の画素等を採用するようにしてもよい。

特徴量抽出部２５は、特徴点抽出部２４からの注目生成用画像から、特徴点抽出部２４からの特徴点の特徴を表す特徴点特徴量を抽出し、全体特徴量算出部２６に供給する。また、特徴量抽出部２５は、特徴点抽出部２４からの注目生成用画像に付加されている正解ラベルを抽出し、全体特徴量算出部２６に供給する。

全体特徴量算出部２６は、共有コードブック記憶部２３に記憶されている共有コードブックに基づいて、特徴量抽出部２５からの特徴点特徴量から、その注目生成用画像全体の特徴を表す全体特徴量を算出する。

ここで、全体特徴量とは、例えば、複数の次元のベクトル（複数の値を要素として有するベクトル）により表される。

全体特徴量算出部２６は、算出した注目生成用画像の全体特徴量を、特徴量抽出部２５からの、注目生成用画像の正解ラベルとともに、識別器生成部２７に供給する。

識別器生成部２７は、全体特徴量算出部２６から、複数の生成用画像それぞれについて、対応する全体特徴量及び正解ラベルが供給されたことに対応して、複数の生成用画像それぞれの全体特徴量と、複数の生成用画像それぞれの正解ラベルとを用いて、識別器を生成する（識別器を規定するパラメータを算出する学習を行う）。

ここで、全体特徴量としての複数の次元のベクトルの要素を、次元特徴量ということとすると、全体特徴量は、複数（ベクトルの次元に等しい数）の次元特徴量から構成される。

識別器生成部２７は、全体特徴量を構成する次元特徴量のすべてではなく、全体特徴量を構成する次元特徴量の中から選択した一部の次元特徴量を用いて識別を行なう識別器を生成する。

また、識別器生成部２７は、この識別器が識別に用いる次元特徴量の次元を表す情報（次元特徴量が、全体特徴量としてのベクトルの何番目の要素であるかを表す情報）を、次元情報として生成する。

[共有コードブック生成部２２の構成例]
図２は、共有コードブック生成部２２の詳細な構成例を示している。

この共有コードブック生成部２２は、特徴点抽出部４１、特徴量抽出部４２、コードブック生成部４３、コードブック記憶部４４、特徴点抽出部４５、特徴量抽出部４６、特徴量置換部４７、及び量子化部４８により構成される。

特徴点抽出部４１には、入力部２１から複数のプリミティブ画像が入力される。特徴点抽出部４１は、入力部２１からの複数のプリミティブ画像それぞれを、順次、注目プリミティブ画像とする。そして、特徴点抽出部４１は、注目プリミティブ画像から特徴点を抽出し、注目プリミティブ画像とともに、特徴量抽出部４２に供給する。

特徴量抽出部４２は、特徴点抽出部４１からの注目プリミティブ画像から、同じく特徴点抽出部４１からの特徴点の特徴を表す特徴点特徴量を抽出して、コードブック生成部４３に供給する。

すなわち、特徴量抽出部４２は、特徴点抽出部４１において注目プリミティブ画像とされる複数のプリミティブ画像それぞれから抽出した複数の特徴点特徴量を、コードブック生成部４３に供給する。

コードブック生成部４３は、特徴量抽出部４２から供給される複数の特徴点特徴量を、特徴量空間において、例えばk-means方法等のクラスタリング方法により、幾つかのグループにグループ分けする。そして、コードブック生成部４３は、グループ分けにより得られる幾つかのグループ毎に、そのグループに属する特徴点特徴量のセントロイド（重心）を、グループを代表する特徴点特徴量に決定する。

コードブック生成部４３は、幾つかのグループ毎に決定した特徴点特徴量に、その特徴点特徴量を一意に識別する識別子Cbn（n=1,2,..,N）を対応付ける。また、コードブック生成部４３は、識別子Cbnが対応付けられた特徴点特徴量を含むコードブックを生成し、コードブック記憶部４４に供給して記憶させる。

コードブック記憶部４４は、識別子Cbnと、識別子Cbnにより識別される特徴点特徴量とが対応付けられたコードブックを記憶する。

特徴点抽出部４５には、入力部２１から複数のモデル画像が入力される。特徴点抽出部４５は、入力部２１から入力される複数のモデル画像を、モデル画像上に存在する被写体のカテゴリ別に、複数のグループにグループ分けする。なお、モデル画像には、画像上に存在する被写体のカテゴリを表すカテゴリ情報が含まれており、特徴点抽出部４５は、モデル画像に含まれるカテゴリ情報に基づいてグループ分けを行なうものとする。

そして、特徴点抽出部４５は、カテゴリ別にグループ分けされた複数のグループそれぞれを、順次、注目グループとする。

さらに、特徴点抽出部４５は、注目グループに含まれる複数のモデル画像それぞれを、順次、注目モデル画像とする。そして、特徴点抽出部４５は、注目モデル画像から特徴点を抽出し、注目モデル画像とともに、特徴量抽出部４６に供給する。

特徴量抽出部４６は、特徴点抽出部４５からの注目モデル画像から、同じく特徴点抽出部４５からの特徴点の特徴を表す特徴点特徴量を抽出する。そして、特徴量抽出部４６は、抽出した特徴点特徴量に、特徴点抽出部４５からの特徴点を対応付ける。

これにより、特徴量抽出部４６は、注目グループに含まれる複数のモデル画像それぞれから抽出した複数の特徴点特徴量であって、且つ、対応する特徴点が対応付けられた特徴点特徴量を含む初期特徴量プールを取得する。

特徴量抽出部４６は、取得した初期特徴量プールを、特徴量置換部４７に供給する。

特徴量置換部４７は、特徴量抽出部４６からの初期特徴量プールに含まれる特徴点特徴量を、コードブック記憶部４４に記憶されているコードブックが有する識別子Cbnに置き換える（置換する）。

すなわち、例えば、特徴量置換部４７は、コードブック記憶部４４からコードブックを読み出す。そして、特徴量置換部４７は、特徴量抽出部４６からの初期特徴量プールに含まれる特徴点特徴量を、読み出したコードブックが含む複数の特徴点特徴量のうち、最も類似する特徴点特徴量を識別する識別子Cbnに置き換える。

このようにして、特徴量置換部４７は、特徴量抽出部４６からの初期特徴量プールに含まれる複数の特徴点特徴量それぞれを、コードブック記憶部４４に記憶されているコードブックが含む識別子Cbnに置き換える。

これにより、特徴量置換部４７は、特徴点が対応付けられた特徴点特徴量を含む初期特徴量プールから、特徴点が対応付けられた識別子Cbnを含む特徴量プールを生成する。特徴量置換部４７は、生成した特徴量プールを、量子化部４８に供給する。

また、特徴量置換部４７は、コードブック記憶部４４から読み出したコードブックを、量子化部４８に供給する。

量子化部４８は、特徴量置換部４７からの特徴量プールに含まれる識別子Cbnに対応付けられた特徴点を量子化し、その結果得られる量子化特徴量プールを取得する。

また、量子化部４８は、取得した量子化特徴量プールが含む識別子Cbnのうち、同一の識別子Cbnどうしをグループ化して得られる共有情報を取得する。

そして、量子化部４８は、カテゴリ毎に取得した共有情報と、特徴量置換部４７からのコードブックとの組合せを、共有コードブックとして、共有コードブック記憶部２３に供給して記憶させる。

[特徴量置換部４７及び量子化部４８が行なう処理の一例]
次に、図３は、特徴量置換部４７及び量子化部４８が行なう処理の一例を示している。

なお、図３に示されるコードブック６１は、コードブック記憶部４４に記憶されているコードブックであって、識別子Cbnと、識別子Cbnにより識別される特徴点特徴量fvecとを含む。

特徴量置換部４７は、コードブック記憶部４４からコードブック６１を読み出す。また、特徴量置換部４７は、特徴量抽出部４６から供給される、所定のカテゴリにおける複数の特徴点特徴量（十文字で示す）を含む初期特徴量プール６２から、所定の特徴点特徴量を抽出し、順次、注目特徴点特徴量fvec'とする。

そして、特徴量置換部４７は、注目特徴点特徴量fvec'を、読み出したコードブック６１が含む識別子Cbnに置き換える。すなわち、例えば、特徴量置換部４７は、注目特徴点特徴量fvec'を、読み出したコードブック６１が含む複数の特徴点特徴量のうち、注目特徴点特徴量fvec'と最も類似する特徴点特徴量fvecを識別する識別子Cbnに置き換える。

特徴量置換部４７は、初期特徴量プール６２が含む複数の特徴点特徴量すべてを、注目特徴点特徴量fvec’とすることにより、初期特徴量プール６２が含む複数の特徴点特徴量fvec'すべてを、識別子Cbnに置き換える。

これにより、特徴量置換部４７は、注目特徴点特徴量fvec'に、対応する特徴点(x,y)が対応付けられた初期特徴量プール６２を、識別子Cbnに、注目特徴点特徴量fvec'に対応する特徴点（x,y）が対応付けられた特徴量プール６３に変換する。

特徴量置換部４７は、変換後の特徴量プール６３を、コードブック記憶部４４から読み出したコードブック６１とともに、量子化部４８に供給する。

量子化部４８は、特徴量置換部４７からの特徴量プール６３が含む幾つかの特徴点を、１点の特徴点に変換する量子化を行い、その結果得られる量子化特徴量プール６４を取得する。なお、量子化部４８が行なう量子化の詳細は、図４を参照して後述する。

また、量子化部４８は、取得した量子化特徴量プール６４が含む識別子Cbnのうち、同一の識別子Cbnどうしをグループ化し、その結果得られる共有情報６５を、共有コードブック記憶部２３に供給して記憶させる。

すなわち、例えば、量子化部４８は、量子化特徴量プール６４に含まれる識別子Cbnのうち、同一の識別子Cbnが対応付けられた特徴点をグループ化することにより、識別子Cbn毎に、１又は複数の特徴点が対応付けられた共有情報６５を生成する。

そして、量子化部４８は、生成した共有情報６５と、特徴量置換部４７からのコードブック６１との組合せを、共有コードブック８１として、共有コードブック記憶部２３に供給して記憶させる。

なお、共有情報６５は、複数のカテゴリ毎に、そのカテゴリにおける初期特徴量プール６２に基づいて生成される。したがって、共有コードブック記憶部２３には、複数のカテゴリ毎に生成された共有情報６５_mと、コードブック６１とにより構成される共有コードブック８１が記憶されることとなる。

また、量子化部４８は、上述したように、量子化特徴量プール６４が含む識別子Cbnのうち、同一の識別子Cbnどうしをグループ化することにより共有情報６５を取得するようにしたが、これに限定されない。

すなわち、例えば、量子化部４８は、特徴量置換部４７からの特徴量プール６３を量子化せずに、量子化特徴量プール６４ではなく特徴量プール６３が含む識別子Cbnのうち、同一の識別子Cbnどうしをグループ化することにより共有情報６５を取得することができる。

[共有コードブックの一例]
次に、図４は、共有コードブック生成部２２により生成されて、共有コードブック記憶部２３に記憶される共有コードブック８１の一例を示している。

図４に示される共有コードブック８１は、コードブック６１、ノートパソコンが属するカテゴリAにおける共有情報６５₁、自動車が属するカテゴリBにおける共有情報６５₂等により構成される。

共有情報６５₁は、カテゴリAにおける複数の特徴点特徴量を含む初期特徴量プール６２に基づいて生成された共有情報である。

共有情報６５₁においては、識別子Cb₂に、特徴点（x₁,y₁）及び（x₂,y₂）が対応付けられている。また、共有情報６５₁においては、識別子Cb₃₀に、特徴点（x₃,y₃）が対応付けられている。

共有情報６５₂は、カテゴリBにおける複数の特徴点特徴量を含む初期特徴量プール６２に基づいて生成された共有情報である。

共有情報６５₂においては、識別子Cb₃₀に、特徴点（x₄,y₄）及び（x₅,y₅）が対応付けられている。また、共有情報６５₂においては、識別子Cb₄₅に、特徴点（x₆,y₆）及び（x₇,y₇）が対応付けられている。

すなわち、コードブック６１に含まれる、特徴点特徴量fvecと特徴点特徴量fvecを識別するための識別子Cb₃₀との組合せ６１aにおいて、組合せ６１aの識別子Cb₃₀には、カテゴリAにおける特徴点（x₃,y₃）、並びにカテゴリBにおける特徴点（x₄,y₄）及び（x₅,y₅）が対応付けられている。

したがって、カテゴリAを識別する場合と、カテゴリBを識別する場合とのいずれの場合にも、識別子Cb₃₀により識別される特徴点特徴量fvecが共通して用いられることとなる。

また、例えば、カテゴリAにおけるモデル画像、及びカテゴリBにおけるモデル画像それぞれから抽出される特徴点は、一般的に異なる。このため、カテゴリAにおける識別子Cb₃₀に対応付けられている特徴点（x₃,y₃）と、カテゴリBにおける識別子Cb₃₀に対応付けられている特徴点（x₄,y₄）及び（x₅,y₅）とは異なるものとなっている。

したがって、カテゴリAを識別する場合と、カテゴリBを識別する場合とで、それぞれ異なる特徴点が用いられることとなる。

[量子化部４８が行なう量子化の一例]
次に、図５を参照して、量子化部４８が行なう量子化の詳細を説明する。図５は、量子化部４８が行なう量子化の詳細を説明するための図である。

図５Aには、例えば、被写体としてノートパソコンが画像上に存在する４枚のモデル画像が示されている。なお、図５Aに示されている４枚のモデル画像には、特徴点として、例えばコーナ点（十文字で示す）が示されている。

図５Bには、図５Aに示される４枚のモデル画像において、特徴点が存在する頻度（度合い）を輝度値として有する画素により構成されている特徴点頻度画像１０１が示されている。

図５Cには、図５Bに示される特徴点頻度画像１０１において、周囲の画素よりも輝度値が大きい画素（の位置）を特徴点（十文字で示す）として選択した様子の一例を示している。

量子化部４８は、特徴量置換部４７からの特徴量プール６３に含まれる特徴点、すなわち、例えば、図５Aに示されるモデル画像それぞれのコーナ点（十文字で示す）を、順次、注目特徴点とする。

また、量子化部４８は、図５Aに示されるモデル画像と同一の大きさであって、且つ、いずれの画素の輝度値も０である特徴点頻度画像１０１を用意する。

そして、量子化部４８は、用意した特徴点頻度画像１０１を構成する複数の画素のうち、注目特徴点に対応する画素、及びその画素の周囲の画素の輝度値に、ガウス重み（ガウス分布に従った重み）に応じた値を投票（加算）する。

これにより、特徴点頻度画像１０１において、注目特徴点に対応する画素の輝度値には１が投票され、その画素の位置から離れた位置に存在する画素ほど、小さな値が投票されることとなる。

量子化部４８は、特徴量プール６３に含まれる特徴点すべてを注目特徴点とし、投票を行なうことにより、図５Bに示されるような、特徴点が存在する頻度に応じて明るさが異なる特徴点頻度画像１０１を生成する。

そして、量子化部４８は、生成した特徴点頻度画像１０１に対して、周囲の画素よりも輝度値が大きい画素に対応する特徴点を、代表特徴点として抽出するnon maximum suppression処理を行なう。

すなわち、例えば、量子化部４８は、特徴点頻度画像１０１を構成する画素の輝度値のうち、最大の輝度値を有する画素の位置を、代表特徴点として抽出する。そして、量子化部４８は、抽出した代表特徴点を含む、その代表特徴点の周囲の領域を、新たな代表特徴点を抽出する処理対象から除外する。

次に、量子化部４８は、抽出した代表特徴点の周囲の領域を処理対象から除外後の特徴点頻度画像１０１を構成する画素の輝度値のうち、最大の輝度値を有する画素の位置を、代表特徴点として抽出する。そして、量子化部４８は、抽出した代表特徴点を含む、その代表特徴点の周囲の領域を処理対象から除外して、それ以降同様の処理を繰り返す。

このように、量子化部４８は、図５Cに示されるように、特徴点頻度画像１０１から所定数の代表特徴点（十文字で示す）を抽出した場合に、non maximum suppression処理を終了する。

量子化部４８は、特徴量プール６３が含む特徴点を、non maximum suppression処理により抽出した複数の代表特徴点のうちのいずれかに量子化する。

すなわち、例えば、量子化部４８は、特徴量プール６３が含む特徴点を、順次、注目特徴点とする。そして、量子化部４８は、注目特徴点を、複数の代表特徴点のうち、注目特徴点と最も近い位置に存在する代表特徴点に変換する量子化を行う。

量子化部４８は、特徴量プール６３が含む特徴点すべてを、複数の代表特徴点のうちのいずれかに量子化し、その量子化により得られる量子化特徴量プール６４を取得する。

そして、量子化部４８は、上述したように、量子化特徴量プール６４が含む複数の識別子Cbnを、同一の識別子Cbnどうしでグループ化する。また、量子化部４８は、そのグループ化により得られる共有情報６５と、特徴量置換部４７からのコードブック６１との組合せを、共有コードブック８１として、共有コードブック記憶部２３に供給して記憶させる。

[相関値の算出の一例]
次に、図６を参照して、全体特徴量算出部２６が行う、全体特徴量を算出する処理の一例を説明する。

図６では、識別対象が自動車のカテゴリBに属するものであるか否かを識別するための識別器及び次元情報を生成するための全体特徴量として、例えば、相関値を算出する全体特徴量算出部２６について説明する。

すなわち、図６は、全体特徴量算出部２６が、共有コードブック記憶部２３に記憶されている共有コードブック８１において、自動車のカテゴリBにおける共有情報６５₂と、コードブック６１とを用いて、生成用画像の全体特徴量を算出する場合の一例を示している。

図６上側には、共有コードブック８１に含まれるコードブック６１が有する複数の特徴点特徴量のうち、共有情報６５₂が有する識別子Cbnそれぞれに対応する特徴点特徴量１２１₁乃至１２１₁₀が示されている。

また、図６下側には、特徴点抽出部２４において特徴点が抽出され、特徴量抽出部２５において特徴点特徴量が抽出された生成用画像１４１乃至１４５が示されている。

全体特徴量算出部２６は、共有コードブック８１に含まれる共有情報６５₂が有する識別子Cbnそれぞれに対応する特徴点特徴量１２１₁乃至１２１₁₀それぞれと、生成用画像１４１乃至１４５それぞれとの相関値を、全体特徴量として算出する。

具体的には、例えば、全体特徴量算出部２６は、生成用画像１４１を構成する全領域のうち、特徴点特徴量１２１_n(nは１から１０までの自然数)に対応する特徴点に基づく所定の領域（例えば、特徴点特徴量１２１_nの特徴点に対応する位置を中心とした矩形領域等）を、検索範囲とする。

全体特徴量算出部２６は、特徴点特徴量１２１_nと、生成用画像１４１の検索範囲上に存在する特徴点の特徴点特徴量それぞれとの相関値を算出し、その算出により得られる複数の相関値のうち、最大の相関値を、注目特徴点特徴量１２１_nと生成用画像１４１との最終的な相関値１６１_nとする。

全体特徴量算出部２６は、生成用画像１４１について、特徴点特徴量１２１₁乃至１２１₁₀それぞれとの相関値１６１₁乃至１６１₁₀を算出し、算出した相関値１６１₁乃至１６１₁₀を要素とするベクトルを、生成用画像１４１の全体特徴量とする。

全体特徴量算出部２６は、生成用画像１４１の全体特徴量を算出した場合と同様にして、生成用画像１４２乃至１４５それぞれの全体特徴量を算出する。

全体特徴量算出部２６は、複数の生成用画像１４１乃至１４５それぞれの全体特徴量を、識別器生成部２７に供給する。

[識別器生成部２７が行なう処理]
次に、図７は、識別器生成部２７が行なう処理の概要を示している。

識別器生成部２７は、例えば、ブースティング(Boosting)のアルゴリズムに従い、全体特徴量算出部２６からの全体特徴量を構成する次元特徴量の中から、識別に用いる次元特徴量（の次元）を選択するとともに、その次元特徴量を用いて識別を行う識別器を生成する。

すなわち、識別器生成部２７は、全体特徴量算出部２６（図１）からの全体特徴量を構成する複数の次元特徴量（ベクトルの要素）のうち、ポジティブ画像、及びネガティブ画像の識別を誤る度合いを表すエラー値を小さくする次元特徴量を用いて識別を行う識別器と、エラー値を小さくする次元特徴量の次元を表す次元情報とを生成する。

具体的には、いま、生成用画像として、複数であるN枚の画像が存在し、全体特徴量算出部２６において、図７に示すように、N枚の生成用画像のNサンプルの全体特徴量x₁,x₂,・・・,x_Nとしてのベクトルが得られたこととする。

さらに、全体特徴量x_i(i=1,2,・・・,N)は、図７に示すように、複数であるM個の要素（次元特徴量）x_i,1，x_i,2，・・・，x_i,Mを有するM次元のベクトルであるとする。

また、識別器生成部２７には、図１で説明したように、全体特徴量算出部２６から正解ラベルが供給されるが、第iサンプルx_i（i枚目の生成用画像）の正解ラベルを、y_iと表す。正解ラベルy_iは、i枚目の生成用画像がポジティブ画像である場合に、例えば、+1になっており、i枚目の生成用画像がネガティブ画像である場合に、例えば、-1になっていることとする。

識別器生成部２７が生成する識別器は、全体特徴量x_iを構成するM個の次元特徴量x_i,1乃至x_i,Mのうちの、ポジティブ画像、及びネガティブ画像の識別を誤る度合いを表すエラー値を小さくする次元特徴量x_i,dを用いて識別を行う関数であり、複数の弱仮説器(Weak learner)h_t,d(x_i,d)から構成される。

ここで、弱仮説器h_t,d(x_i,d)のサフィックスtは、弱仮説器h_t,d(x_i,d)の個数をカウントする変数であり、識別器は、複数であるT個の弱仮説器h_1,d(x_i,d)，h_2,d(x_i,d)，・・・，h_T,d(x_i,d)から構成されることとする。

弱仮説器h_t,d(x_i,d)の個数Tとしては、例えば、経験的に、あるいは、識別器による識別の識別率がある程度の値以上となるように、M以下の値が設定される。

弱仮説器h_t,d(x_i,d)は、生成用画像の全体特徴量x_iの第d次元の次元特徴量（全体特徴量x_iとしてのベクトルのd番目の要素）x_i,dを入力として、生成用画像が、ポジティブ画像、又はネガティブ画像である旨の識別結果を出力する関数であり、ポジティブ画像である旨の識別結果としては、例えば、+1を、ネガティブ画像である旨の識別結果としては、例えば、-1を、それぞれ出力する。

いま、弱仮説器h_t,d(x_i,d)の識別結果のエラー値を、ε_t,dと表すこととすると、識別器生成部２７は、弱仮説器h_t,d(x_i,d)を、エラー値ε_t,dを小さくするように決定する。

なお、ここでは、説明を簡単にするため、弱仮説器h_t,d(x_i,d)として、例えば、引数である第d次元の次元特徴量x_i,dが、所定の閾値以上である場合に、ポジティブ画像である旨の識別結果を表す+1を出力し、第d次元の次元特徴量x_i,dが、所定の閾値未満である場合に、ネガティブ画像である旨の識別結果を表す-1を出力する関数を採用することとする。

この場合、エラー値ε_t,dを小さくするように、弱仮説器h_t,d(x_i,d)を決定するとは、弱仮説器h_t,d(x_i,d)の閾値を決定することを意味する。弱仮説器h_t,d(x_i,d)の閾値には、引数となりうるN個の第d次元の次元特徴量x_1,d，x_2,d，・・・，x_N,dのうちの最小値以上で、且つ、最大値以下の値が決定される。

識別器生成部２７は、エラー値ε_t,1，ε_t,2，・・・，ε_t,Mそれぞれを小さくするように、弱仮説器h_t,1(x_i,1)，h_t,2(x_i,2)，・・・，h_t,M(x_i,M)それぞれを決定し、エラー値ε_t,1乃至ε_t,Mのうちの最小値が得られる次元（以下、最小エラー次元という）d(t)を求める。

また、識別器生成部２７は、弱仮説器h_t,d(x_i,d)によるi番目の生成用画像の識別結果が、正解ラベルy_iと一致するか否か、つまり、式h_t,d(x_i,d)＝y_iが成り立つか、又は、式h_t,d(x_i,d)≠y_iが成り立つかによって、生成用画像の識別結果の誤りをエラー値ε_t,dに影響させる重みD_t(i)を、生成用画像ごとに求める。

ここで、エラー値ε_t,dは、N枚の生成用画像のうち、弱仮説器h_t,d(x_i,d)による識別結果が誤る生成用画像の重みD_t(i)を加算することで求められる。

識別器生成部２７は、以上の、弱仮説器h_t,d(x_i,d)を、エラー値ε_t,dを小さくするように決定すること、弱仮説器h_t,d(x_i,d)による生成用画像の識別結果のエラー値ε_t,1乃至ε_t,Mのうちの最小値が得られる次元（最小エラー次元）d(t)を求めること、及び、エラー値ε_t,dを計算するのに用いる重みD_t(i)を求めることを、T回だけ繰り返すことで、T個の弱仮説器h_1,d(x_i,d)，h_2,d(x_i,d)，・・・，h_T,d(x_i,d)から構成される識別器H(x)と、最小エラー次元d(1)，d(2)，・・・，d(T)を表す次元情報とを生成する。

[学習装置１の動作説明]
次に、図８のフローチャートを参照して、学習装置１が行う学習処理（以下、第１の学習処理という）について説明する。

この第１の学習処理は、入力部２１に学習用画像が供給されたときに開始される。このとき、入力部２１は、供給される学習用画像としての生成用画像、プリミティブ画像、及びモデル画像のうち、プリミティブ画像及びモデル画像を、共有コードブック生成部２２に供給し、生成用画像を特徴点抽出部２４に供給する。

ステップＳ１において、共有コードブック生成部２２は、入力部２１からのプリミティブ画像及びモデル画像に基づいて、共有コードブック８１を生成して共有コードブック記憶部２３に記憶させる共有コードブック生成処理を行なう。なお、共有コードブック生成処理の詳細は、図９のフローチャートを参照して後述する。

ステップＳ２において、特徴点抽出部２４は、入力部２１からの複数の生成用画像それぞれを、順次、注目生成用画像とする。

ステップＳ３において、特徴点抽出部２４は、注目生成用画像から特徴点を抽出し、注目生成用画像とともに、特徴量抽出部２５に供給する。

ステップＳ４において、特徴量抽出部２５は、特徴点抽出部２４からの注目生成用画像から、同じく特徴点抽出部２４からの特徴点の特徴を表す特徴点特徴量を抽出し、特徴点抽出部２４からの特徴点に対応付けて、全体特徴量算出部２６に供給する。

また、特徴量抽出部２５は、特徴点抽出部２４からの注目生成用画像に付加されている正解ラベルを抽出し、全体特徴量算出部２６に供給する。

ステップＳ５において、全体特徴量算出部２６は、共有コードブック記憶部２３に記憶されている共有コードブック８１に基づいて、特徴量抽出部２５からの特徴点特徴量から、その注目生成用画像全体の特徴を表す全体特徴量を算出する。

すなわち、例えば、図６を参照して説明したように、全体特徴量算出部２６は、共有コードブック８１に含まれる共有情報６５（例えば、識別対象が、自動車のカテゴリBに属するものであるか否かを識別する識別器及び次元情報を生成する場合には共有情報６５₂）が有する識別子Cbnそれぞれに対応付けられている特徴点特徴量に基づき、注目生成用画像の全体特徴量を算出する。

全体特徴量算出部２６は、算出した注目生成用画像の全体特徴量を、特徴量抽出部２５からの正解ラベルとともに、識別器生成部２７に供給する。

ステップＳ６において、特徴点抽出部２４は、入力部２１からの複数の生成用画像すべてを、注目生成用画像としたか否かを判定し、入力部２１からの複数の生成用画像すべてを、まだ注目生成用画像としていないと判定した場合、処理をステップＳ２に戻す。

そして、ステップＳ２では、特徴点抽出部２４は、入力部２１からの複数の生成用画像のうち、まだ注目生成用画像とされていない生成用画像を、新たに注目生成用画像とし、処理はステップＳ３に進められ、それ以降、同様の処理が行なわれる。

また、ステップＳ６において、特徴点抽出部２４は、入力部２１からの複数の生成用画像すべてを、注目生成用画像としたと判定した場合、処理はステップＳ７に進められる。

ステップＳ７において、識別器生成部２７は、全体特徴量算出部２６から、複数の生成用画像それぞれについて、対応する全体特徴量及び正解ラベルが供給されたことに対応して、複数の生成用画像それぞれの全体特徴量と、複数の生成用画像それぞれの正解ラベルとを用いて、識別器及び次元情報を生成する識別器生成処理を行なう。以上で第１の学習処理は終了される。なお、識別器生成処理の詳細は、図１１のフローチャートを参照して後述する。

[共有コードブック生成処理の詳細]
次に、図９のフローチャートを参照して、図８のステップＳ１における共有コードブック生成処理の詳細について説明する。

ステップＳ２１において、共有コードブック生成部２２の特徴点抽出部４１乃至コードブック生成部４３は、入力部２１からの複数のプリミティブ画像から抽出した特徴点特徴量に、その特徴点特徴量を一意に識別する識別子Cbを対応付けたコードブックを生成し、コードブック記憶部４４に供給して記憶させるコードブック生成処理を行なう。なお、コードブック生成処理の詳細は、図１０のフローチャートを参照して後述する。

ステップＳ２２において、特徴点抽出部４５は、入力部２１からの複数のモデル画像のうち、所定のカテゴリに属する識別対象（例えば、ノートパソコン）が画像上に存在するモデル画像を取得する。

ステップＳ２３において、特徴点抽出部４５は、ステップＳ２２の処理で取得したモデル画像それぞれを、順次、注目モデル画像とする。

ステップＳ２４において、特徴点抽出部４５は、注目モデル画像から特徴点を抽出し、注目モデル画像とともに、特徴量抽出部４６に供給する。

ステップＳ２５において、特徴量抽出部４６は、特徴点抽出部４５からの注目モデル画像から、同じく特徴点抽出部４５からの特徴点の特徴を表す特徴点特徴量を抽出する。そして、特徴量抽出部４６は、抽出した特徴点特徴量に、特徴点抽出部４５からの特徴点を対応付ける。

ステップＳ２６において、特徴点抽出部４５は、ステップＳ２２の処理で取得したモデル画像すべてを、注目モデル画像としたか否かを判定し、ステップＳ２２の処理で取得したモデル画像すべてを、まだ注目モデル画像としていないと判定した場合、処理をステップＳ２３に戻す。

そして、ステップＳ２３では、特徴点抽出部４５は、ステップＳ２２の処理で取得したモデル画像のうち、まだ注目モデル画像とされていないモデル画像を、新たに注目モデル画像とし、処理をステップＳ２４に進め、それ以降、同様の処理が行なわれる。

また、ステップＳ２６において、特徴点抽出部４５は、ステップＳ２２の処理で取得したモデル画像すべてを、注目モデル画像としたと判定した場合、その旨を特徴量抽出部４６に通知する。

特徴量抽出部４６は、特徴点抽出部４５からの通知に応じて、ステップＳ２５の処理で抽出した特徴点特徴量を含む初期特徴量プール６２を生成し、特徴量置換部４７に供給して、処理をステップＳ２７に進める。

ステップＳ２７において、特徴量置換部４７は、特徴量抽出部４６からの初期特徴量プール６２が含む特徴点特徴量を、コードブック記憶部４４に記憶されているコードブック６１が含む識別子Cbnに置き換える。

すなわち、例えば、特徴量置換部４７は、コードブック記憶部４４からコードブック６１を読み出す。そして、特徴量置換部４７は、特徴量抽出部４６からの初期特徴量プール６２が含む特徴点特徴量fvec'を、読み出したコードブック６１が含む複数の特徴点特徴量のうち、特徴点特徴量fvec'と最も類似する特徴点特徴量fvecを識別する識別子Cbnに置き換える。

このようにして、特徴量置換部４７は、特徴量抽出部４６からの初期特徴量プール６２が含む複数の特徴点特徴量それぞれを、コードブック記憶部４４に記憶されているコードブック６１が含む識別子Cbnに置き換える。

これにより、特徴量置換部４７は、特徴点が対応付けられた特徴点特徴量fvec'を含む初期特徴量プール６２から、特徴点が対応付けられた識別子Cbnを含む特徴量プール６３を生成する。特徴量置換部４７は、生成した特徴量プール６３を、量子化部４８に供給する。

また、特徴量置換部４７は、コードブック記憶部４４から読み出したコードブック６１を、量子化部４８に供給する。

ステップＳ２８において、量子化部４８は、特徴量置換部４７からの特徴量プール６３が含む識別子Cbnに対応付けられた特徴点を量子化し、その結果得られる量子化特徴量プール６４を取得する。

そして、量子化部４８は、取得した量子化特徴量プール６４が含む識別子Cbnのうち、同一の識別子Cbnどうしをグループ化して得られる共有情報６５を取得する。

ステップＳ２９において、特徴点抽出部４５は、入力部２１からの複数のモデル画像のうち、すべてのカテゴリについてのモデル画像を、ステップＳ２２の処理で取得したか否かを判定し、すべてのカテゴリについてのモデル画像を取得していないと判定した場合、処理をステップＳ２２に戻す。

そして、ステップＳ２２では、特徴点抽出部４５は、入力部２１からの複数のモデル画像のうち、まだ取得していないカテゴリに属する識別対象（例えば、自動車）のモデル画像を取得し、処理をステップＳ２３に進め、それ以降、同様の処理が行なわれる。

また、ステップＳ２９において、特徴点抽出部４５は、入力部２１からの複数のモデル画像のうち、すべてのカテゴリについてのモデル画像を取得したと判定した場合、処理をステップＳ３０に進める。

ステップＳ３０において、量子化部４８は、カテゴリ毎に、ステップＳ２８の処理で取得した共有情報６５（例えば、カテゴリAの共有情報６５₁や、カテゴリBの共有情報６５₂等）と、特徴量置換部４７からのコードブック６１とを、共有コードブック８１として、共有コードブック記憶部２３に供給して記憶させ、処理を、図８のステップＳ１にリターンする。

[コードブック生成処理の詳細]
次に、図１０のフローチャートを参照して、図９のステップＳ２１において、共有コードブック生成部２２の特徴点抽出部４１乃至コードブック生成部４３が行なう、コードブック６１を生成するコードブック生成処理の詳細について説明する。

ステップＳ５１において、特徴点抽出部４１は、入力部２１からの複数のプリミティブ画像それぞれを、順次、注目プリミティブ画像とする。

ステップＳ５２において、特徴点抽出部４１は、注目プリミティブ画像から特徴点を抽出し、注目プリミティブ画像とともに、特徴量抽出部４２に供給する。

ステップＳ５３において、特徴量抽出部４２は、特徴点抽出部４１からの注目プリミティブ画像から、同じく特徴点抽出部４１からの特徴点の特徴を表す特徴点特徴量を抽出して、コードブック生成部４３に供給する。

ステップＳ５４において、特徴点抽出部４１は、入力部２１からの複数のプリミティブ画像すべてを、注目プリミティブ画像としたか否かを判定し、入力部２１からの複数のプリミティブ画像すべてを、まだ注目プリミティブ画像としていないと判定した場合、処理をステップＳ５１に戻す。

そして、ステップＳ５１では、特徴点抽出部４１は、入力部２１からの複数のプリミティブ画像のうち、まだ注目プリミティブ画像とされていないプリミティブ画像を、新たに注目プリミティブ画像とし、処理をステップＳ５２に進め、それ以降、同様の処理が行なわれる。

また、ステップＳ５４において、特徴点抽出部４１は、入力部２１からの複数のプリミティブ画像すべてを、注目プリミティブ画像としたと判定した場合、処理をステップＳ５５に進める。

ステップＳ５５において、コードブック生成部４３は、特徴量抽出部４２から供給される複数の特徴点特徴量に基づいて、複数の特徴点特徴量それぞれがグループ分けされたグループを代表する特徴点特徴量からなるコードブックを生成する。

すなわち、例えば、コードブック生成部４３は、特徴量抽出部４２から供給される複数の特徴点特徴量を、特徴量空間において、k-means方法等のクラスタリング方法により、幾つかのグループにグループ分けする。そして、コードブック生成部４３は、グループ分けにより得られる幾つかのグループ毎に、そのグループに属する特徴点特徴量のセントロイド（重心）を、グループを代表する特徴点特徴量に決定する。

また、コードブック生成部４３は、幾つかのグループ毎に決定した特徴点特徴量に、その特徴点特徴量を一意に識別する識別子Cbnを対応付ける。さらに、コードブック生成部４３は、識別子Cbnを対応付けた特徴点特徴量を含むコードブック６１を生成し、コードブック記憶部４４に供給して記憶させ、処理を図９のステップＳ２１にリターンする。

[識別器生成処理の詳細]
次に、図１１のフローチャートを参照して、図８のステップＳ７において、識別器生成部２７が行なう、識別器と次元情報とを生成する識別器生成処理の詳細について説明する。

ステップＳ７１において、識別器生成部２７は、弱仮説器h_t,d(x_i,d)が識別を誤る度合いを表すエラー値ε_t,dに、i番目の生成用画像の識別結果の誤りを影響させる重みD_t(i)の初期値D₁(1)，D₁(2)，・・・，D₁(N)を、例えば、次式（２）に従って設定し、処理を、ステップＳ７２に進める。

・・・（２）

ステップＳ７２において、識別器生成部２７は、識別器H(x)を構成する弱仮説器h_t,d(x_i,d)の個数をカウントする変数tを、1に初期化して、処理を、ステップＳ７３に進める。

ステップＳ７３において、識別器生成部２７は、全体特徴量x_iの次元d=1,2,・・・,Mのそれぞれについて、重みD_t(i)を用いて求められるエラー値ε_t,dが最小となるように、弱仮説器h_t,d(x_i,d)（の閾値TH_t,d)を決定し、処理を、ステップＳ７４に進める。

ここで、ステップＳ７３では、識別器生成部２７は、例えば、次式（３）に従って計算されるエラー値ε_t,dが最小となるように、弱仮説器h_t,d(x_i,d)の閾値TH_t,dを決定する。

・・・（３）

式（３）において、［y_i≠h_t,d(x_i,d)］は、指示関数であり、式y_i≠h_t,d(x_i,d)が成り立つ場合は、1となり、成り立たない場合は、0となる。

したがって、式（３）によれば、エラー値ε_t,dは、N枚の生成用画像のうち、弱仮説器h_t,d(x_i,d)による識別結果が誤る生成用画像（式y_i≠h_t,d(x_i,d)が成り立つ生成用画像）の重みD_t(i)のみを加算することで求められる。

ステップＳ７４において、識別器生成部２７は、直前のステップＳ７３の処理で、次元d=1,2,・・・,Mのそれぞれについて決定された弱仮説器h_t,d(x_i,d)を用いて、式（３）に従って計算されるエラー値ε_t,1，ε_t,2，・・・，ε_t,Mの中の最小値ε_tを求める。さらに、識別器生成部２７は、エラー値ε_t,1乃至ε_t,Mの中の最小値ε_tが得られる次元（最小エラー次元）d(t)（1乃至Mの範囲の整数値）を求め、処理を、ステップＳ７５に進める。

ここで、最小エラー次元d(t)が、全体特徴量を構成する次元特徴量のうち、識別器H(x)による識別に用いられる次元特徴量の次元である。したがって、識別器H(x)による識別では、全体特徴量を構成する次元特徴量のうち、最小エラー次元d(t)の次元特徴量が選択されて、識別に用いられる。

また、エラー値ε_t,1，ε_t,2，・・・，ε_t,Mの中の最小値ε_tを、最小エラー値ε_tということとすると、その最小エラー値ε_tが得られる弱仮説器h_t,d(t)(x_i,d(t))が、識別器H(x)を構成するt番目の弱仮説器となる。

ステップＳ７５において、識別器生成部２７は、直前のステップＳ７４の処理で求めた最小エラー値ε_tを用い、識別器H(x)を構成するt番目の弱仮説器h_t,d(t)(x_i,d(t))による生成用画像の識別の信頼性を表す信頼度α_tを、次式（４）に従って求め、処理を、ステップＳ７６に進める。

・・・（４）

ここで、式（４）において、lnは自然対数を表しており、式（４）によれば、最小エラー値ε_tが大（、又は小）であるほど、値が小（、又は大）の信頼度α_tが求められる。

ステップＳ７６において、識別器生成部２７は、重みD_t(i)を、次式（５）に従い、重みD_t+1(i)に更新して、処理をステップＳ７７に進める。

・・・（５）

ここで、式（５）において、係数Z_tは、重みD_t+1(i)の正規化のための係数であり、次式（６）で表される。

・・・（６）

式（６）によれば、弱仮説器h_t,d(t)(x_i,d(t))による識別結果が正しいi枚目の生成用画像、つまり、識別結果が正解ラベルy_iに一致する生成用画像については、重みD_t(i)は、より小さい値の重みD_t+1(i)に更新される。その結果、次のステップＳ７３において、重みD_t(i)を用いて計算されるエラー値ε_t,dは、小さくなる。

一方、弱仮説器h_t,d(t)(x_i,d(t))による識別結果が誤りとなるi枚目の生成用画像、つまり、識別結果が正解ラベルy_iに一致しない生成用画像については、重みD_t(i)は、より大きい値の重みD_t+1(i)に更新される。その結果、次のステップＳ７３において、重みD_t(i)を用いて計算されるエラー値ε_t,dは、大きくなる。

ステップＳ７７において、識別器生成部２７は、変数tが、識別器H(x)を構成する弱仮説器h_t,d(x_i,d)の個数（以下、弱仮説器数ともいう）Tに等しいかどうかを判定する。

ステップＳ７７において、識別器生成部２７は、変数tが弱仮説器数Tに等しくないと判定した場合、処理をステップＳ７８に進め、変数tを１だけインクリメントして、処理をステップＳ７８からステップＳ７３に戻し、以下、同様の処理が行なわれる。

また、ステップＳ７７において、識別器生成部２７は、変数tが弱仮説器数Tに等しいと判定した場合、すなわち、識別器H(x)を構成するT個の弱仮説器h_1,d(1)(x_i,d(1))，h_2,d(2)(x_i,d(2))，・・・，h_T,d(T)(x_i,d(T))と、T個の最小エラー次元d(1)，d(2)，・・・，d(T)とを生成した場合、処理を、ステップＳ７９に進める。

ステップＳ７９において、識別器生成部２７は、T個の弱仮説器h_1,d(1)(x_i,d(1))，h_2,d(2)(x_i,d(2))，・・・，h_T,d(T)(x_i,d(T))と、T個の信頼度α₁，α₂，・・・，α_Tを、識別器H(x)（を規定するパラメータ）として出力する。

さらに、ステップＳ７９では、識別器生成部２７は、T個の最小エラー次元d(1)，d(2)，・・・，d(T)を、次元情報として出力し、識別器生成処理を終了して、処理を図８のステップＳ７にリターンする。

識別器生成部２７では、以上のような、ブースティングによる統計学習（第１の学習処理）によって、全体特徴量を構成する次元特徴量の中で、識別対象を識別するのにより有効なT個の次元特徴量を表す次元（最小エラー次元）d(1)乃至d(T)と、その最小エラー次元d(t)の次元特徴量を用いて識別を行う識別器H(x)が求められる。

このように、学習装置１が行う第１の学習処理では、次元情報としての最小エラー次元d(1)乃至d(T)と、識別器H(x)を生成する場合において、コードブック６１に含まれる特徴点特徴量（例えば、識別子Cb₃₀により識別される特徴点特徴量fvec）を、異なる識別対象のカテゴリ（例えば、カテゴリA及びB）間で共有する共有コードブック８１を用いるようにしている。

このため、第１の学習処理では、カテゴリ毎に生成されたコードブックを用いて、識別器等を生成する場合と比較して、共有コードブック８１に含まれるコードブック６１が有する特徴点特徴量を増やすことなく、異なる識別対象をそれぞれ識別する複数の識別器を生成することが可能となる。

また、第１の学習処理において、共有コードブック６１が有する共有情報６５は、各カテゴリ毎のモデル画像から抽出された特徴点を保持するようにしている。すなわち、例えば、共有情報６５₁は、カテゴリAに属するノートパソコンが存在するモデル画像から抽出した特徴点を、共有情報６５₂は、カテゴリBに属する自動車が存在するモデル画像から抽出した特徴点を、それぞれ保持するようにしている。

ここで、カテゴリAに属するノートパソコンが存在するモデル画像から抽出した特徴点と、カテゴリBに属する自動車が存在するモデル画像から抽出した特徴点とは、一般的に異なるものとなる。

したがって、共有コードブック６１が有する共有情報６５は、各カテゴリ毎に異なる特徴点を保持していることとなる。

このため、第１の学習処理のステップＳ５において、全体特徴量算出部２６が全体特徴量を算出する場合、共有情報６５が保持する特徴点に基づいて決定される、生成用画像上の検索範囲が存在する位置は、識別対象のカテゴリ毎に異なるものとなる。

このため、全体特徴量算出部２６では、例えば、生成用画像上の全領域をグリッド状の検索範囲に分割して、カテゴリ間で共通の検索範囲（同一の位置に存在する検索範囲）を用いる場合と比較して、識別器の生成に用いられる全体特徴量を、より正確に算出することができる。

よって、第１の学習処理のステップＳ７において、識別器生成部２７は、算出した全体特徴量に基づいて、より識別の精度が高い識別器（及び次元情報）を生成することが可能となる。

[識別装置１８１の構成例]
図１２は、学習装置１により得られた識別器H(x)及び次元情報d(1)，d(2)，・・・，d(T)を用いて識別を行う識別装置１８１の構成例を示している。

この識別装置１８１は、学習装置１により得られた識別器H(x)と、次元情報としての最小エラー次元d(1)乃至d(T)とを用いて、処理対象画像上に存在する被写体が所定の識別対象であるか否か、具体的には、例えば、処理対象画像上に存在する被写体が所定のカテゴリに属するものであるか否かを識別する。

すなわち、この識別装置１８１は、共有コードブック記憶部２０１、次元情報記憶部２０２、識別器記憶部２０３、特徴点抽出部２０４、特徴量抽出部２０５、全体特徴量算出部２０６、及び識別部２０７により構成される。

共有コードブック記憶部２０１は、学習装置１の共有コードブック記憶部２３（図１）に記憶されているのと同一の共有コードブック８１を予め記憶している。

次元情報記憶部２０２は、学習装置１の識別器生成部２７で所定の識別対象について得られた次元情報としての最小エラー次元d(1)乃至d(T)を予め記憶している。

識別器記憶部２０３は、学習装置１の識別器生成部２７で所定の識別対象について得られた識別器H(x)としてのT個の弱仮説器h_1,d(1)(x_i,d(1))，h_2,d(2)(x_i,d(2))，・・・，h_T,d(T)(x_i,d(T))と、T個の信頼度α₁，α₂，・・・，α_Tとを予め記憶している。

特徴点抽出部２０４には、画像上に存在する被写体が所定の識別対象であるか否かを識別する処理対象である処理対象画像が供給される。特徴点抽出部２０４は、学習装置１の特徴点抽出部２４と同様にして、供給される処理対象画像から、特徴点を抽出し、処理対象画像とともに、特徴量抽出部２０５に供給する。

特徴量抽出部２０５は、学習装置１の特徴量抽出部２５と同様にして、特徴点抽出部２０４からの処理対象画像から、同じく特徴点抽出部２０４からの特徴点の特徴点特徴量を抽出する。

そして、特徴量抽出部２０５は、抽出した特徴点特徴量を、特徴点抽出部２０４からの特徴点に対応付けて、全体特徴量算出部２０６に供給する。

全体特徴量算出部２０６は、学習装置１の全体特徴量算出部２６と同様にして、共有コードブック記憶部２０１に記憶された共有コードブック８１に含まれる共有情報６５（例えば、識別対象が自動車のカテゴリBに属するものであるか否かを識別する場合には、カテゴリBの共有情報６５₂）が有する識別子Cbnそれぞれに対応する特徴点特徴量に基づき、特徴量抽出部２０５からの処理対象画像の特徴点特徴量から、その処理対象画像の全体特徴量を構成する次元特徴量を求める。

但し、全体特徴量算出部２０６では、処理対象画像の全体特徴量を構成するM個（M次元）の次元特徴量すべてではなく、そのM個の次元特徴量のうち、次元情報記憶部２０２に記憶された次元情報としての最小エラー次元d(1)乃至d(T)の次元特徴量が、選択的に求められる。

なお、全体特徴量算出部２０６では、最初から、処理対象画像の全体特徴量のうち、次元情報としての最小エラー次元d(1)乃至d(T)の次元特徴量だけを求めてもよいし、処理対象画像の全体特徴量を求め、その全体特徴量の中から、最小エラー次元d(1)乃至d(T)の次元特徴量を抽出してもよい。

ここで、M個の次元特徴量から構成される、処理対象画像の全体特徴量としての、例えば、M個の次元特徴量を要素とするベクトルを、x'と表す。また、処理対象画像の全体特徴量x'のM個の次元特徴量のうちのm番目を、x_m'と表す。

この場合、処理対象画像の全体特徴量x'のM個の次元特徴量のうち、最小エラー次元d(1)乃至d(T)の次元特徴量は、x_d(1)'，x_d(2)'，・・・，x_d(T)'と表される。

全体特徴量算出部２０６は、処理対象画像の全体特徴量x'のM個の次元特徴量のうち、最小エラー次元d(1)乃至d(T)のT個の次元特徴量x_d(1)'乃至x_d(T)'を選択し（選択的に求めて）、識別部２０７に供給する。

識別部２０７は、識別器記憶部２０３に記憶された識別器H(x')に対して、全体特徴量算出部２０６からの、処理対象画像の最小エラー次元d(1)乃至d(T)の次元特徴量x_d(1)'乃至x_d(T)'を、入力x'として与えることで、処理対象画像上に存在する被写体が所定の識別対象であるか否かを識別し、その識別結果を出力する。

すなわち、識別部２０７は、識別器記憶部２０３に記憶された識別器H(x')としてのT個の弱仮説器h_1,d(1)(x_d(1)')，h_2,d(2)(x_d(2)')，・・・，h_T,d(T)(x_d(T)')と、T個の信頼度α₁，α₂，・・・，α_Tとを用いて、識別器H(x')としての次式（７）の関数H(x')を演算する。

・・・（７）

ここで、式（７）において、sign()は、かっこ（）内の符号が正の場合は、例えば、+1を、符号が負の場合は、例えば、-1を、それぞれ出力する関数である。したがって、式（７）の関数H(x')の値は、+1又は-1となる。

式（７）の関数H(x')の値が+1である場合、処理対象画像上に存在する被写体が所定の識別対象であるという識別結果を表し、式（７）の関数H(x')の値が-1である場合、処理対象画像上に存在する被写体が所定の識別対象でないという識別結果を表す。

[識別装置１８１の動作説明]
次に、図１３のフローチャートを参照して、識別装置１８１が行う識別処理（以下、第１の識別処理という）について説明する。

この第１の識別処理は、例えば、処理対象画像が、識別装置１８１の特徴点抽出部２０４に供給されたときに開始される。

ステップＳ９１において、特徴点抽出部２０４は、供給される処理対象画像から、特徴点を抽出し、処理対象画像とともに、特徴量抽出部２０５に供給して、処理をステップＳ９２に進める。

ステップＳ９２において、特徴量抽出部２０５は、特徴点抽出部２０４から供給される処理対象画像から、同じく特徴点抽出部２０４からの特徴点の特徴点特徴量を抽出し、全体特徴量算出部２０６に供給して、処理をステップＳ９３に進める。

ステップＳ９３において、全体特徴量算出部２０６は、共有コードブック記憶部２０１に記憶されている共有コードブック８１に基づき、特徴量抽出部２０５から供給される処理対象画像の特徴点特徴量から、その処理対象画像の全体特徴量を構成する次元特徴量のうち、次元情報記憶部２０２に記憶された次元情報としての最小エラー次元d(1)乃至d(T)の次元特徴量x_d(1)'乃至x_d(T)'を求める。

すなわち、例えば、全体特徴量算出部２０６は、共有コードブック８１に含まれる共有情報６５（例えば、識別対象が、自動車のカテゴリBに属するものであるか否かを識別する場合には共有情報６５₂）が有する識別子Cbnそれぞれに対応付けられている特徴点特徴量に基づき、最小エラー次元d(1)乃至d(T)の次元特徴量x_d(1)'乃至x_d(T)'を求める。

そして、全体特徴量算出部２０６は、最小エラー次元d(1)乃至d(T)の次元特徴量x_d(1)'乃至x_d(T)'を、識別部２０７に供給して、処理をステップＳ９４に進める。

ステップＳ９４において、識別部２０７は、識別器記憶部２０３に記憶されている、式（７）で表される識別器H(x')に対して、全体特徴量算出部２０６からの、処理対象画像の最小エラー次元d(1)乃至d(T)の次元特徴量x_d(1)'乃至x_d(T)'を、入力x'として与えることで、処理対象画像上に存在する被写体が所定の識別対象であるか否かを識別し、その識別結果を出力して、第１の識別処理は終了される。

以上説明したように、識別装置１８１が行う第１の識別処理では、ステップＳ９３において、全体特徴量算出部２０６が、次元特徴量x_d(1)'乃至x_d(T)'を求める場合に、コードブック６１が有する特徴点特徴量（例えば、識別子Cb₃₀により識別される特徴点特徴量fvec）を、異なる識別対象のカテゴリ（例えば、カテゴリA及びB）間で共有する共有コードブック８１を用いるようにしている。

したがって、例えば、識別装置１８１において、識別対象とするカテゴリが複数存在する場合でも、複数のカテゴリ毎に異なるコードブックを生成する場合とは異なり、共有コードブック８１に含まれるコードブック６１が有する特徴点特徴量の増加を防止することが可能となる。

また、第１の識別処理のステップＳ９３において、全体特徴量算出部２０６は、第１の学習処理のステップＳ５における全体特徴量算出部２６と同様にして、処理対象画像の全体特徴量を構成する次元特徴量のうち、最小エラー次元d(1)乃至d(T)の次元特徴量x_d(1)'乃至x_d(T)'を算出するようにしている。

このため、全体特徴量算出部２０６では、全体特徴量算出部２６と同様に、例えば、処理対象画像上の全領域をグリッド状の検索範囲に分割して、カテゴリ間で共通の検索範囲（同一の位置に存在する検索範囲）を用いる場合と比較して、処理対象画像の全体特徴量を構成する次元特徴量のうち、最小エラー次元d(1)乃至d(T)の次元特徴量x_d(1)'乃至x_d(T)'を、より正確に算出することができる。

よって、第１の識別処理のステップＳ９４において、識別部２０７では、識別対象のカテゴリ間で共通の検索範囲を用いる場合と比較して、全体特徴量算出部２０６により算出された次元特徴量x_d(1)'乃至x_d(T)'に基づいて、識別対象をより正確に識別することが可能となる。

第１の実施の形態において、学習装置１の全体特徴量算出部２６では、全体特徴量の要素（次元特徴量）として、例えば相関値を算出する場合に、識別対象の種類に拘らず、いずれの識別対象に対しても同一の大きさの検索範囲で、生成用画像の全体特徴量を算出するようにしたが、検索範囲の大きさは、識別対象に応じて異なる大きさとすることが望ましい。

すなわち、例えば、識別対象の形状が決まっている自動車等の場合には、比較的小さな検索範囲とするようにし、識別対象の形状が決まっていない動物等の場合には、比較的大きな検索範囲とすること等が考えられる。

また、識別対象が、比較的高い場所に存在する屋根である場合には、検索範囲を、特徴点を基準として上方向に大きくとることが考えられる。

このように、識別対象毎に適切な検索範囲を決定すれば、生成用画像の全体特徴量を、より正確に算出することができるので、全体特徴量に基づいて生成される識別器の識別の精度をより向上させることが可能となる。

＜２．第２の実施の形態＞
[学習装置２２１の構成例]
次に、図１４は、共有コードブック８１に含まれる共有情報６５が有する特徴点毎に、検索範囲を決定して全体特徴量を算出する学習装置２２１について説明する。図１４は、本発明を適用した学習装置２２１の構成例を示している。

なお、この学習装置２２１は、第１の実施の形態における図１の学習装置１と同様に構成される部分については同一の符号を付しているため、それらの説明は以下省略する。

すなわち、学習装置２２１は、新たに範囲決定部２４１が設けられているとともに、共有コードブック記憶部２３及び全体特徴量算出部２６に代えて、共有コードブック記憶部２４２及び全体特徴量算出部２４３が設けられている他は、学習装置１と同様に構成されている。

範囲決定部２４１には、入力部２１から生成用画像が供給される。範囲決定部２４１は、共有コードブック記憶部２４２に記憶されている共有コードブック８１を読み出す。

そして、範囲決定部２４１は、共有コードブック８１に含まれる共有情報６５が有する特徴点毎に、入力部２１からの生成用画像との相関値を求めるために検索する生成用画像上の範囲を表す検索範囲を決定する範囲決定処理を行なう。なお、範囲決定部２４１が行なう範囲決定処理の詳細は、図１５を参照して後述する。

範囲決定部２４１は、共有コードブック８１に基づいて、決定した検索範囲を、共有コードブック８１に含まれる共有情報６５が有する特徴点に対応付けた共有コードブック８１’を生成し、共有コードブック記憶部２４２に供給して記憶させる。

共有コードブック記憶部２４２は、共有コードブック生成部２２からの共有コードブック８１を記憶している。また、共有コードブック記憶部２４２は、範囲決定部２４１により生成されて供給されてくる共有コードブック８１'を記憶する。

なお、共有コードブック生成部２２が、生成した共有コードブック８１を、共有コードブック記憶部２４２ではなく、範囲決定部２４１に供給するようにして、範囲決定部２４１が、共有コードブック生成部２２からの共有コードブック８１に基づいて、共有コードブック８１'を生成し、共有コードブック記憶部２４２に供給して記憶させるようにしてもよい。

この場合、共有コードブック記憶部２４２は、範囲決定部２４１からの共有コードブック８１'のみを記憶することとなる。

全体特徴量算出部２４３には、全体特徴量算出部２６と同様に、特徴量抽出部２５から、注目生成用画像の正解ラベル、及び注目生成用画像から抽出された特徴点特徴量が供給される。

全体特徴量算出部２４３は、共有コードブック記憶部２４２に記憶されている共有コードブック８１'に基づいて、特徴量抽出部２５からの特徴点特徴量から、その注目生成用画像全体の特徴を表す全体特徴量を算出する。なお、全体特徴量算出部２４３が行う処理については、図１６を参照して後述する。

そして、全体特徴量算出部２４３は、算出した注目生成用画像の全体特徴量を、特徴量抽出部２５からの、注目生成用画像の正解ラベルとともに、識別器生成部２７に供給する。

[範囲決定部２４１が行う範囲決定処理]
図１５は、範囲決定部２４１が行なう範囲決定処理の一例を示している。

図１５左側には、共有コードブック８１に含まれる共有情報６５、及び生成用画像２６１₁乃至２６１₅が示されている。なお、生成用画像２６１₁乃至２６１₅のうち、生成用画像２６１₁乃至２６１₃はポジティブ画像を表しており、生成用画像２６１₄及び２６１₅はネガティブ画像を表している。

図１５中央には、生成用画像２６１₁乃至２６１₅それぞれから算出される所定の次元の次元特徴量である相関値ｘ_i（Corr_1乃至Corr_5）、及び生成用画像２６１₁乃至２６１₅それぞれの正解ラベルｙ_i（ｙ_iは+１又は−１のいずれかの値）が示されている。

図１５右側には、検索範囲の候補である候補範囲毎に、生成用画像２６１₁乃至２６１₅それぞれが、ポジティブ画像であるか、又はネガティブ画像であるかの識別を誤る度合いを表す誤り率Error（矩形で示す）を保持するエラーマップ２８１が示されている。

なお、エラーマップ２８１において、横軸Search xは、候補範囲の横方向（x方向）における長さを表しており、縦軸Search yは、候補範囲の縦方向（y方向）における長さを表している。

したがって、エラーマップ２８１において、複数の矩形のうち、例えば矩形３０１は、１０×１０画素（横×縦）の候補範囲における誤り率Errorを示している。

ここで、誤り率Errorは、上述したエラー値と同様に、生成用画像（ポジティブ画像又はネガティブ画像）の識別を誤る度合いを表すエラー情報である点で一致する。

しかしながら、エラー値は、識別器及び次元情報を生成するために用いられるものであり、誤り率Errorは、複数の候補範囲の中から、検索範囲を決定するために用いられる点で異なるため、本明細書では、誤り率Errorとエラー値とを区別して記載するようにしている。

範囲決定部２４１は、共有コードブック記憶部２４２に記憶されている共有コードブック８１を、共有コードブック記憶部２４２から読み出す。

範囲決定部２４１は、読み出した共有コードブック８１に含まれる共有情報６５それぞれ（例えば、共有情報６５₁及び６５₂）が有する複数の特徴点を、順次、注目特徴点とする。

そして、範囲決定部２４１は、注目特徴点の検索範囲の候補である複数の候補範囲毎に、誤り率Errorを計算する。

すなわち、例えば、範囲決定部２４１は、生成用画像２６１₁について、注目特徴点に対応する、生成用画像２６１₁上の位置２６１C₁を中心とする１０×１０画素（横×縦）の候補範囲２６１S₁で、注目特徴点に対応する特徴点特徴量との相関値ｘ_i（=Corr_1）を算出する。

範囲決定部２４１は、生成用画像２６１₁の場合と同様にして、生成用画像２６１₂乃至２６１₅それぞれについて、注目特徴点に対応する特徴点特徴量との相関値ｘ_i（=Corr_2乃至Corr_5）を算出する。

そして、範囲決定部２４１は、生成用画像２６１₁乃至２６１₅それぞれについて算出した相関値ｘ_i（=Corr_1乃至Corr_5）と、生成用画像２６１₁乃至２６１₅それぞれの正解ラベルｙ_iとに基づいて、１０×１０画素の検索範囲における誤り率を、次式（８）を用いて計算する。

・・・（８）

なお、式（８）において、f(ｘ_i)は、相関値ｘ_iに基づいて生成用画像２６１₁乃至２６１₅それぞれがポジティブ画像であるのかネガティブ画像であるのかを識別するための関数である。

関数f(ｘ_i)は、相関値ｘ_iが閾値Thresh以上である場合に、対応する生成用画像をポジティブ画像として識別したことを表す値１を出力し、相関値ｘ_iが閾値Thresh未満である場合に、対応する生成用画像をネガティブ画像として識別したことを表す値−１を出力する。

なお、閾値Threshは、相関値ｘ_iのうちの最小値以上であって最大値以下の値とされ、正解ラベルｙ_iと、対応する関数f(ｘ_i)の値との誤差が最小となる値、つまり、誤り率Errorが最小となる値とされる。

具体的には、例えば、算出した相関値ｘ_i（=Corr_1乃至Corr_5）を、それぞれ、閾値Threshの候補となる候補閾値とし、式（８）による誤り率Errorを算出する。そして、複数の候補閾値のうち、正解ラベルｙ_iと、対応する関数f(ｘ_i)の値との誤差が最小となる候補閾値を、閾値Threshとする。

また、式（８）において、関数Ew[l((ｙ_i≠f(ｘ_i)))]は、正解ラベルｙ_iと関数f(ｘ_i)の出力値とが一致しない場合に値１とされ、正解ラベルｙ_iと関数f(ｘ_i)の出力値とが一致する場合に値０とされる。

範囲決定部２４１は、式（８）を用いて算出した、１０×１０画素の候補範囲における誤り率Errorを、対応するエラーマップ２８１に記憶させる。これにより、エラーマップ２８１は、１０×１０画素の候補範囲における誤り率Error（矩形３０１で示す）を保持することとなる。

範囲決定部２４１は、１０×１０画素の候補範囲における誤り率Errorを算出した場合と同様にして、１０×２０画素の候補範囲、２０×３０画素の候補範囲等の他の候補範囲における誤り率Errorを算出し、対応するエラーマップ２８１の誤り保持領域に保持する。

このようにして、範囲決定部２４１は、図１５右側に示されるような、それぞれ異なる候補範囲毎の誤り率Errorを保持するエラーマップ２８１を生成する。

そして、範囲決定部２４１は、生成したエラーマップ２８１が有する複数の誤り率Errorのうち、最小の誤り率Errorに対応する候補範囲を、注目特徴点における検索範囲に決定する。

範囲決定部２４１は、決定した検索範囲（を表す情報）を、注目特徴点に対応付ける。このようにして、範囲決定部２４１は、検索範囲を対応付けた特徴点を有する共有情報６５を含む共有コードブック８１'を生成し、共有コードブック記憶部２４２に供給して記憶させる。

全体特徴量算出部２４３では、共有コードブック記憶部２４２に記憶されている共有コードブック８１'を用いて、生成用画像の全体特徴量を算出することとなる。

[全体特徴量算出部２４３が行う相関値の算出の一例]
次に、図１６は、全体特徴量算出部２４３が行う処理の一例を説明するための図である。

なお、図６と同様に構成されている部分については、同一の符号を付しているため、それらの説明は以下適宜省略する。

すなわち、共有コードブック８１に代えて、共有コードブック８１'が示されている他は、図６の場合と同様に構成されている。

全体特徴量算出部２４３は、共有コードブック８１'に含まれる共有情報６５₂が有する識別子Cbnそれぞれに対応する特徴点特徴量１２１₁乃至１２１₁₀毎に、決定された検索範囲で、生成用画像１４１乃至１４５の相関値を算出する。

具体的には、例えば、全体特徴量算出部２４３は、生成用画像１４１を構成する全領域（全範囲）のうち、特徴点特徴量１２１_n(nは１から１０までの自然数)に対応する特徴点に対応付けられている検索範囲を、共有コードブック８１'に含まれる共有情報６５₂から読み出す。

そして、全体特徴量算出部２４３は、特徴点特徴量１２１_nと、読み出した生成用画像１４１の検索範囲上に存在する特徴点の特徴点特徴量それぞれとの相関値を算出し、その算出により得られる複数の相関値のうち、最大の相関値を、注目特徴点特徴量１２１_nと生成用画像１４１との最終的な相関値１６１_nとする。

全体特徴量算出部２４３は、生成用画像１４１について、特徴点特徴量１２１₁乃至１２１₁₀それぞれとの相関値１６１₁乃至１６１₁₀を算出し、算出した相関値１６１₁乃至１６１₁₀を要素とするベクトルを、生成用画像１４１の全体特徴量とする。

全体特徴量算出部２４３は、生成用画像１４１の全体特徴量を算出した場合と同様にして、生成用画像１４２乃至１４５それぞれの全体特徴量を算出する。

全体特徴量算出部２４３は、複数の生成用画像１４１乃至１４５それぞれの全体特徴量を、識別器生成部２７に供給する。

[学習装置２２１の動作説明]
次に、図１７のフローチャートを参照して、学習装置２２１が行う学習処理（以下、第２の学習処理という）について説明する。

この第２の学習処理は、入力部２１に学習用画像が供給されたときに開始される。このとき、入力部２１は、供給される学習用画像としての生成用画像、プリミティブ画像、及びモデル画像のうち、プリミティブ画像及びモデル画像を、共有コードブック生成部２２に供給し、生成用画像を特徴点抽出部２４及び範囲決定部２４１に供給する。

ステップＳ１１１において、図８のステップＳ１と同様の処理が行なわれる。

ステップＳ１１２において、範囲決定部２４１は、共有コードブック記憶部２４２に記憶されている共有コードブック８１を読み出す。

そして、範囲決定部２４１は、共有コードブック８１に含まれる共有情報６５が有する特徴点毎に、入力部２１からの生成用画像との相関値を求めるために検索する生成用画像上の範囲を表す検索範囲を決定する範囲決定処理を行なう。なお、範囲決定部２４１が行なう範囲決定処理の詳細は、図１８のフローチャートを参照して後述する。

ステップＳ１１３乃至ステップＳ１１５において、図８のステップＳ２乃至ステップＳ４と同様の処理が行なわれる。

ステップＳ１１６において、全体特徴量算出部２４３は、共有コードブック記憶部２４２に記憶されている共有コードブック８１'に基づいて、特徴量抽出部２５からの特徴点特徴量から、その注目生成用画像全体の特徴を表す全体特徴量を算出する。

すなわち、例えば、図１６において説明したように、全体特徴量算出部２４３は、共有コードブック８１'に含まれる共有情報６５（例えば、識別対象が、自動車のカテゴリBに属するものであるか否かを識別する識別器及び次元情報を生成する場合には共有情報６５₂）が有する特徴点それぞれに対応付けられている検索範囲、及び共有情報６５が有する識別子Cbnそれぞれに対応付けられている特徴点特徴量に基づき、注目生成用画像の全体特徴量を算出する。

ステップＳ１１７において、特徴点抽出部２４は、入力部２１からの複数の生成用画像すべてを、注目生成用画像としたか否かを判定する。そして、特徴点抽出部２４は、入力部２１からの複数の生成用画像すべてを、まだ注目生成用画像としていないと判定した場合、処理をステップＳ１１３に戻す。

ステップＳ１１３では、特徴点抽出部２４は、入力部２１からの複数の生成用画像のうち、まだ注目生成用画像とされていない生成用画像を、新たに注目生成用画像とし、処理をステップＳ１１４に進め、それ以降、同様の処理が行なわれる。

また、ステップＳ１１７において、特徴点抽出部２４は、入力部２１からの複数の生成用画像すべてを、注目生成用画像としたと判定した場合、処理をステップＳ１１８に進める。

ステップＳ１１８において、ステップＳ７と同様の処理が行なわれる。以上で、第２の学習処理は終了される。

[範囲決定部２４１の動作説明]
次に、図１８のフローチャートを参照して、図１７のステップＳ１１２における、範囲決定部２４１が行なう範囲決定処理について説明する。

ステップＳ１３１において、範囲決定部２４１は、共有コードブック記憶部２４２に記憶されている共有コードブック８１を、共有コードブック記憶部２４２から読み出す。

そして、範囲決定部２４１は、読み出した共有コードブック８１に含まれる共有情報６５（例えば、共有情報６５₁や共有情報６５₂）それぞれが有する複数の特徴点を、順次、注目特徴点とする。

ステップＳ１３２において、範囲決定部２４１は、入力部２１からの複数の生成用画像（例えば、生成用画像２６１₁乃至２６１₅）に基づいて、注目特徴点における検索範囲の候補である複数の候補範囲のうちの１つを指定する。

すなわち、例えば、範囲決定部２４１は、複数の生成用画像について、注目特徴点に対応する候補範囲として、１０×１０画素（横×縦）の候補範囲を指定する。

ステップＳ１３３において、範囲決定部２４１は、複数の生成用画像それぞれにおいて、指定した候補範囲上に存在する特徴点の特徴点特徴量と、注目特徴点に対応する特徴点特徴量との相関値ｘ_iを算出する。

ステップＳ１３４において、範囲決定部２４１は、複数の生成用画像について算出した相関値ｘ_iと、複数の生成用画像の正解ラベルｙ_iとに基づいて、直前のステップＳ１３２の処理で指定された検索範囲における誤り率を、式（８）を用いて計算する。

そして、範囲決定部２４１は、式（８）を用いて算出した、１０×１０画素の候補範囲における誤り率Errorを、対応するエラーマップ２８１の誤り保持領域（例えば、誤り保持領域３０１）に保持する。

ステップＳ１３５において、範囲決定部２４１は、複数の候補範囲すべてを指定したか否かを判定し、複数の候補範囲すべてを指定していないと判定した場合、処理をステップＳ１３２に戻す。

そして、ステップＳ１３２において、範囲決定部２４１は、複数の候補範囲のうち、まだ指定されていない候補範囲を指定して、処理をステップＳ１３３に進め、それ以降、同様の処理を行なう。

また、ステップＳ１３５において、範囲決定部２４１は、複数の候補範囲すべてを指定したと判定した場合、処理をステップＳ１３６に進める。

ステップＳ１３６において、範囲決定部２４１は、共有コードブック８１に含まれる共有情報６５それぞれが有する複数の特徴点すべてを、注目特徴点としたか否かを判定し、複数の特徴点すべてを、まだ注目特徴点としていないと判定した場合、処理を、ステップＳ１３１に戻す。

そして、ステップＳ１３１では、範囲決定部２４１は、共有情報６５それぞれが有する複数の特徴点のうち、まだ注目特徴点とされていない特徴点を、新たに注目特徴点とし、処理をステップＳ１３２に進め、それ以降、同様の処理を行なう。

また、ステップＳ１３６において、範囲決定部２４１は、共有コードブック８１に含まれる共有情報６５それぞれが有する複数の特徴点すべてを、注目特徴点としたと判定した場合、処理を、図１７のステップＳ１１２にリターンさせ、ステップＳ１１３に進ませ、ステップＳ１１３において、図１７のフローチャートを参照して説明した処理が行なわれる。

以上説明したように、学習装置２２１が行う第２の学習処理では、共有コードブック８１'に含まれる共有情報６５（例えば、共有情報６５₂）が有する特徴点毎に、生成用画像の識別を誤る誤り率Errorが最小となる大きさの範囲を検索範囲として決定し、決定した検索範囲を用いて、生成用画像の全体特徴量を構成する次元特徴量を算出するようにした。

したがって、第２の学習処理では、共有情報６５が有する特徴点毎に、同一の大きさの検索範囲を用いて、生成用画像の全体特徴量を構成する次元特徴量を算出する場合と比較して、より正確な全体特徴量を算出することができる。このため、算出した全体特徴量を用いて、識別対象をより正確に識別することが可能な識別器を生成することが可能となる。

[識別装置３２１の構成例]
図１９は、学習装置２２１の学習により得られた識別器及び次元情報に基づいて、処理対象画像上に存在する被写体の識別を行う識別装置３２１の構成例を示している。

この識別装置３２１は、学習装置２２１（図１４）により得られた識別器H(x)、及び次元情報としての最小エラー次元d(1)乃至d(T)の他、範囲決定部２４１において決定された検索範囲を用いて、処理対象画像上に存在する被写体が所定の識別対象であるか否かを識別する。

なお、図１２の識別装置１８１と同様に構成されている部分については、同一の符号を付しているため、それらの説明については以下省略する。

すなわち、図１９の識別装置３２１は、共有コードブック記憶部２０１及び全体特徴量算出部２０６に代えて、共有コードブック記憶部３４１及び全体特徴量算出部３４２が設けられている他は、図１２の識別装置１８１と同様に構成されている。

共有コードブック記憶部３４１は、学習装置２２１の共有コードブック記憶部２４２（図１４）に記憶されているのと同一の共有コードブック８１’を予め記憶している。

全体特徴量算出部３４２には、特徴量抽出部２０５から、処理対象画像の特徴点特徴量が供給される。

全体特徴量算出部３４２は、学習装置２２１の全体特徴量算出部２４３と同様にして、共有コードブック記憶部３４１に記憶された共有コードブック８１'に基づき、特徴量抽出部２０５からの処理対象画像の特徴点特徴量から、その処理対象画像の全体特徴量を構成する次元特徴量を求める。

[識別装置３２１の動作説明]
次に、図２０のフローチャートを参照して、識別装置３２１が行う識別処理（以下、第２の識別処理という）について説明する。

この第２の識別処理は、例えば、処理対象画像が、特徴点抽出部２０４に供給されたときに開始される。

ステップＳ１５１及びステップＳ１５２では、それぞれ、図１３のステップＳ９１及びステップＳ９２と同様の処理が行なわれる。

ステップＳ１５３では、全体特徴量算出部３４２は、共有コードブック記憶部３４１に記憶された共有コードブック８１'に基づいて、特徴量抽出部２０５からの処理対象画像の特徴点特徴量から、その処理対象画像の全体特徴量を構成する次元特徴量のうち、次元情報記憶部２０２に記憶された次元情報としての最小エラー次元d(1)乃至d(T)の次元特徴量x_d(1)'乃至x_d(T)'を求める。

すなわち、例えば、全体特徴量算出部３４２は、共有コードブック８１'に含まれる共有情報６５（例えば、識別対象が、自動車のカテゴリBに属するものであるか否かを識別する場合には共有情報６５₂）が有する特徴点それぞれに対応付けられている検索範囲、及び共有情報６５が有する識別子Cbnそれぞれに対応付けられている特徴点特徴量に基づき、最小エラー次元d(1)乃至d(T)の次元特徴量x_d(1)'乃至x_d(T)'を求める。

そして、全体特徴量算出部３４２は、最小エラー次元d(1)乃至d(T)の次元特徴量x_d(1)'乃至x_d(T)'を、識別部２０７に供給して、処理をステップＳ１５４に進める。

ステップＳ１５４では、図１３のステップＳ９４と同様の処理が行なわれる。以上で、第２の識別処理は終了される。

以上説明したように、第２の識別処理では、共有コードブック８１'に含まれる共有情報６５（例えば、共有情報６５₂）が有する特徴点毎に、生成用画像の識別を誤る誤り率Errorが最小となる大きさの範囲を検索範囲として決定し、決定した検索範囲を用いて、最小エラー次元d(1)乃至d(T)の次元特徴量x_d(1)'乃至x_d(T)'を求めるようにした。

したがって、第２の識別処理では、共有情報６５が有する特徴点毎に、同一の大きさの検索範囲を用いて次元特徴量x_d(1)'乃至x_d(T)'を求める場合と比較して、識別対象をより正確に識別することが可能となる。

＜３．変形例＞
第１の実施の形態では、全体特徴量算出部２６が、相関値を次元特徴量とする全体特徴量を算出するようにしたが、全体特徴量は、これに限定されず、その他、例えば、全体特徴量として、生成用画像のヒストグラムを算出するようにしてもよい。

全体特徴量算出部２６が、全体特徴量として、生成用画像のヒストグラムを算出する場合には、例えば、識別対象が属するカテゴリのK個の特徴点特徴量の値を階数とする。

そして、全体特徴量算出部２６は、そのK個の階数のうち、生成用画像において注目している特徴点（注目特徴点）の特徴点特徴量の値との差分絶対値が最も小さい階数の頻度を、１だけ増加するようにして、生成用画像のヒストグラムを算出することとなる。

第１の実施の形態では、図７の識別器生成部２７が、次元特徴量を選択するとともに、識別器を生成するために従うアルゴリズムとして、ブースティングのアルゴリズムを採用することとしたが、これに限定されない。

すなわち、識別器生成部２７は、次元特徴量を選択するとともに、識別器を生成することが可能であれば、ブースティングのアルゴリズムの他、どのようなアルゴリズムに従うようにしてもよい。

また、第１の実施の形態では、学習装置１において、識別対象のカテゴリを識別するための次元情報を選択するとともに、識別器を生成し、識別装置１８１において、識別対象が、所定のカテゴリに属する識別対象であるか否かを識別するようにしたが、これに限定されない。

すなわち、例えば、学習装置１において、所定の物体そのものであるか否かを識別するための次元情報を選択するとともに、識別器を生成し、識別装置１８１において、識別対象が、所定の物体そのものであるか否かを識別するように構成することができる。この場合、共有コードブック８１における共有情報６５は、カテゴリ毎ではなく、物体毎に生成されることとなる。このことは、第２の実施の形態における学習装置２２１及び識別装置３２１についても同様のことが言える。

また、第１の実施の形態では、学習装置１と識別装置１８１とを別々の装置として構成するようにしたが、学習装置１と識別装置１８１とを１つの装置として構成するようにしてもよい。このことは、第２の実施の形態における学習装置２２１及び識別装置３２１についても同様である。

第２の実施の形態では、共有コードブック８１に含まれる共有情報６５が有する特徴点毎に検索範囲を決定するようにして、共有コードブック８１'を生成するようにしたが、検索範囲を決定する対象は、これに限定されない。

すなわち、例えば、検索範囲を決定する対象としては、検索範囲を決定する必要があって、共有コードブック８１と同様に用いられるものであれば、どのようなものでもよい。

ところで、上述した一連の処理は、専用のハードウエアにより実行させることもできるし、ソフトウエアにより実行させることもできる。一連の処理をソフトウエアにより実行させる場合には、そのソフトウエアを構成するプログラムが、いわゆる組み込み型のコンピュータ、又は、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータ等に、記録媒体からインストールされる。

[コンピュータの構成例]
次に、図２１は、上述した一連の処理をプログラムにより実行するパーソナルコンピュータの構成例を示している。

CPU（Central Processing Unit）３６１は、ROM（Read Only Memory）３６２、又は記憶部３６８に記憶されているプログラムに従って各種の処理を実行する。RAM（Random Access Memory）３６３には、CPU３６１が実行するプログラムやデータ等が適宜記憶される。これらのCPU３６１、ROM３６２、及びRAM３６３は、バス３６４により相互に接続されている。

CPU３６１にはまた、バス３６４を介して入出力インタフェース３６５が接続されている。入出力インタフェース３６５には、キーボード、マウス、マイクロホン等よりなる入力部３６６、ディスプレイ、スピーカ等よりなる出力部３６７が接続されている。CPU３６１は、入力部３６６から入力される指令に対応して各種の処理を実行する。そして、CPU３６１は、処理の結果を出力部３６７に出力する。

入出力インタフェース３６５に接続されている記憶部３６８は、例えばハードディスクからなり、CPU３６１が実行するプログラムや各種のデータを記憶する。通信部３６９は、インターネットやローカルエリアネットワーク等のネットワークを介して外部の装置と通信する。

また、通信部３６９を介してプログラムを取得し、記憶部３６８に記憶してもよい。

入出力インタフェース３６５に接続されているドライブ３７０は、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリ等のリムーバブルメディア３７１が装着されたとき、それらを駆動し、そこに記録されているプログラムやデータ等を取得する。取得されたプログラムやデータは、必要に応じて記憶部３６８に転送され、記憶される。

コンピュータにインストールされ、コンピュータによって実行可能な状態とされるプログラムを記録（記憶）する記録媒体は、図２１に示すように、磁気ディスク（フレキシブルディスクを含む）、光ディスク（CD-ROM(Compact Disc-Read Only Memory),DVD(Digital Versatile Disc)を含む）、光磁気ディスク（ＭＤ（Mini-Disc）を含む）、もしくは半導体メモリ等よりなるパッケージメディアであるリムーバブルメディア３７１、又は、プログラムが一時的もしくは永続的に格納されるROM３６２や、記憶部３６８を構成するハードディスク等により構成される。記録媒体へのプログラムの記録は、必要に応じてルータ、モデム等のインタフェースである通信部３６９を介して、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線又は無線の通信媒体を利用して行われる。

なお、本明細書において、上述した一連の処理を記述するステップは、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。

また、本発明の実施の形態は、上述した本実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。

１学習装置，２１入力部，２２共有コードブック生成部，２３共有コードブック記憶部，２４特徴点抽出部，２５特徴量抽出部，２６全体特徴量算出部，２７識別器生成部，４１特徴点抽出部，４２特徴量抽出部，４３コードブック生成部，４４コードブック記憶部，４５特徴点抽出部，４６特徴量抽出部，４７特徴量置換部，４８量子化部，１８１識別装置，２０１共有コードブック記憶部，２０２次元情報記憶部，２０３識別器記憶部，２０４特徴点抽出部，２０５特徴量抽出部，２０６全体特徴量算出部，２０７識別部，２２１学習装置，２４１範囲決定部，２４２共有コードブック記憶部，２４３全体特徴量算出部，３２１識別装置，３４１共有コードブック記憶部，３４２全体特徴量算出部

Claims

画像上に存在する被写体が所定の識別対象であるか否かを識別するための識別器を生成するために用いられる複数の生成用画像であって、且つ、前記識別対象が画像上に存在するポジティブ画像と、前記識別対象が画像上に存在しないネガティブ画像とにより構成される前記複数の生成用画像それぞれから特徴点を抽出する特徴点抽出手段と、
前記生成用画像から、前記特徴点の特徴を表す特徴点特徴量を抽出する特徴点特徴量抽出手段と、
異なる識別対象をそれぞれ識別する識別器の生成に共通して用いられる生成用特徴量を含む共有コードブックに基づいて、前記生成用画像の前記特徴点特徴量から、前記生成用画像全体の特徴を表す全体特徴量を算出する全体特徴量算出手段と、
前記生成用画像の前記全体特徴量と、前記生成用画像が前記ポジティブ画像であるか前記ネガティブ画像であるかを表す正解ラベルとに基づいて、前記識別器を生成する識別器生成手段と
を含む学習装置。
複数の前記生成用特徴量それぞれを、前記生成用特徴量を識別するための識別子に対応づけて保持するコードブックと、
異なる識別対象をそれぞれ識別する識別器毎に作成された複数の共有情報であって、且つ、前記複数の生成用特徴量のうち、前記全体特徴量を算出する際に用いる前記生成用特徴量の前記識別子を有する共有情報と
により構成される共有コードブックを記憶している共有コードブック記憶手段をさらに含み、
前記全体特徴量算出手段は、前記コードブックが保持する前記複数の生成用特徴量のうち、前記識別器生成手段により生成される前記識別器について作成された前記共有情報が有する前記識別子に対応付けられている生成用特徴量を用いて、前記全体特徴量を算出する
請求項１に記載の学習装置。
前記複数の共有情報のうちの所定の共有情報は、他の共有情報が有する前記識別子と同一の識別子を有している
請求項２に記載の学習装置。
前記所定の共有情報は、前記ポジティブ画像であるモデル画像から抽出された特徴点も対応付けられた前記識別子を有しており、
前記全体特徴量算出手段は、前記識別子に対応付けられている生成用特徴量と、前記生成用画像上の全範囲のうち、前記識別子に対応付けられている前記特徴点に基づき決定される範囲上に存在する特徴点の特徴点特徴量とを用いて、前記全体特徴量を算出する
請求項３に記載の学習装置。
前記所定の共有情報が有する前記識別子には、前記他の共有情報が有する同一の前記識別子に対応付けられている特徴点とは異なる特徴点が対応付けられている
請求項４に記載の学習装置。
前記ポジティブ画像であるモデル画像から特徴点を抽出するモデル画像特徴点抽出手段と、
前記モデル画像の特徴点における頻度分布に基づいて、前記特徴点を量子化する量子化手段と
をさらに含み、
前記共有情報は、量子化後の前記特徴点が対応付けられた前記識別子を有する
請求項５に記載の学習装置。
前記全体特徴量算出手段は、前記全体特徴量として、前記共有コードブックに含まれる前記生成用特徴量と、前記生成用画像の前記特徴点特徴量との相関を表す相関値を算出する
請求項１に記載の学習装置。
前記識別器生成手段は、複数の次元のベクトルにより表される前記全体特徴量の各次元の要素である複数の次元特徴量のうち、前記ポジティブ画像、及び前記ネガティブ画像の識別を誤る度合いを表すエラー値を小さくする前記次元特徴量を用いて識別を行なう前記識別器と、前記エラー値を小さくする前記次元特徴量の次元を表す次元情報とを生成する
請求項１に記載の学習装置。
所定の識別対象を識別するための識別器を学習する学習装置の学習方法において、
前記学習装置は、
特徴点抽出手段と、
特徴点特徴量抽出手段と、
全体特徴量算出手段と、
識別器生成手段と
を含み、
前記特徴点抽出手段が、画像上に存在する被写体が所定の識別対象であるか否かを識別するための識別器を生成するために用いられる複数の生成用画像であって、且つ、前記識別対象が画像上に存在するポジティブ画像と、前記識別対象が画像上に存在しないネガティブ画像とにより構成される前記複数の生成用画像それぞれから特徴点を抽出し、
前記特徴点特徴量抽出手段が、前記生成用画像から、前記特徴点の特徴を表す特徴点特徴量を抽出し、
前記全体特徴量算出手段が、異なる識別対象をそれぞれ識別する識別器の生成に共通して用いられる生成用特徴量を含む共有コードブックに基づいて、前記生成用画像の前記特徴点特徴量から、前記生成用画像全体の特徴を表す全体特徴量を算出し、
前記識別器生成手段が、前記生成用画像の前記全体特徴量と、前記生成用画像が前記ポジティブ画像であるか前記ネガティブ画像であるかを表す正解ラベルとに基づいて、前記識別器を生成する
ステップを含む学習方法。
コンピュータを、
画像上に存在する被写体が所定の識別対象であるか否かを識別するための識別器を生成するために用いられる複数の生成用画像であって、且つ、前記識別対象が画像上に存在するポジティブ画像と、前記識別対象が画像上に存在しないネガティブ画像とにより構成される前記複数の生成用画像それぞれから特徴点を抽出する特徴点抽出手段と、
前記生成用画像から、前記特徴点の特徴を表す特徴点特徴量を抽出する特徴点特徴量抽出手段と、
異なる識別対象をそれぞれ識別する識別器の生成に共通して用いられる生成用特徴量を含む共有コードブックに基づいて、前記生成用画像の前記特徴点特徴量から、前記生成用画像全体の特徴を表す全体特徴量を算出する全体特徴量算出手段と、
前記生成用画像の前記全体特徴量と、前記生成用画像が前記ポジティブ画像であるか前記ネガティブ画像であるかを表す正解ラベルとに基づいて、前記識別器を生成する識別器生成手段と
して機能させるためのプログラム。
画像上に存在する被写体が所定の識別対象であるか否かを識別する処理の対象とする処理対象画像から特徴点を抽出する特徴点抽出手段と、
前記処理対象画像から、前記特徴点の特徴を表す特徴点特徴量を抽出する特徴点特徴量抽出手段と、
異なる識別対象をそれぞれ識別する識別器の生成に共通して用いられた生成用特徴量を含む共有コードブックに基づいて、前記処理対象画像の特徴点特徴量から、前記処理対象画像全体の特徴を表す全体特徴量を算出する全体特徴量算出手段と、
画像上に存在する被写体が所定の識別対象であるか否かを識別する識別器と、前記全体特徴量とに基づいて、前記処理対象画像上に存在する被写体が所定の識別対象であるか否かを識別する識別手段と
を含む識別装置。
複数の前記生成用特徴量それぞれを、前記生成用特徴量を識別するための識別子に対応づけて保持するコードブックと、
異なる識別対象をそれぞれ識別する識別器毎に作成された複数の共有情報であって、且つ、前記複数の生成用特徴量のうち、前記全体特徴量を算出する際に用いる前記生成用特徴量の前記識別子を有する共有情報と
により構成される共有コードブックを記憶している共有コードブック記憶手段をさらに含み、
前記全体特徴量算出手段は、前記コードブックが保持する前記複数の生成用特徴量のうち、前記識別手段で用いられる前記識別器について作成された前記共有情報が有する前記識別子に対応付けられている生成用特徴量を用いて、前記全体特徴量を算出する
請求項１１に記載の識別装置。
前記複数の共有情報のうちの所定の共有情報は、他の共有情報が有する前記識別子と同一の識別子を有している
請求項１２に記載の識別装置。
前記所定の共有情報は、前記所定の識別対象が画像上に存在するモデル画像から抽出された特徴点も対応付けられた前記識別子を有しており、
前記全体特徴量算出手段は、前記識別子に対応付けられている生成用特徴量と、前記処理対象画像上の全範囲のうち、前記識別子に対応付けられている前記特徴点に基づき決定される範囲上に存在する特徴点の特徴点特徴量とを用いて、前記全体特徴量を算出する
請求項１３に記載の識別装置。
前記共有情報が有する前記識別子には、前記他の共有情報が有する同一の前記識別子に対応付けられている特徴点とは異なる特徴点が対応付けられている
請求項１４に記載の識別装置。
前記全体特徴量算出手段は、前記全体特徴量として、前記共有コードブックに含まれる前記生成用特徴量と、前記処理対象画像の前記特徴点特徴量との相関を表す相関値を算出する
請求項１１に記載の識別装置。
前記全体特徴量算出手段は、前記共有コードブックに基づいて、前記処理対象画像の特徴点特徴量から、前記処理対象画像全体の特徴を表す全体特徴量であって、且つ、複数の次元特徴量により構成される前記全体特徴量を算出し、
前記識別手段は、画像上に存在する被写体が所定の識別対象であるか否かを識別する識別器に対して、前記全体特徴量を構成する前記複数の次元特徴量のうち、所定の次元特徴量を入力として与えることで、前記処理対象画像上に存在する被写体が所定の識別対象であるか否かを識別する
請求項１１に記載の識別装置。
前記識別手段は、画像上に存在する被写体が所定の識別対象であるか否かを識別する識別器に対して、前記全体特徴量を構成する前記複数の次元特徴量のうち、次元情報が表す次元の次元特徴量を入力として与えることで、前記処理対象画像に写っている被写体が所定の識別対象であるか否かを識別し、
前記識別器は、前記全体特徴量を表す前記複数の次元特徴量のうち、前記識別対象が画像上に存在するポジティブ画像、及び前記識別対象が画像上に存在しないネガティブ画像の識別を誤る度合いを表すエラー値を小さくする前記次元特徴量を用いて識別を行なうものであり、
前記次元情報は、前記エラー値を小さくする前記次元特徴量の次元を表すものである
請求項１７に記載の識別装置。
画像に写っている被写体が所定の識別対象であるか否かを識別する識別装置の識別方法において、
前記識別装置は、
特徴点抽出手段と、
特徴点特徴量抽出手段と、
全体特徴量算出手段と、
識別手段と
を含み、
前記特徴点抽出手段が、画像上に存在する被写体が所定の識別対象であるか否かを識別する処理の対象とする処理対象画像から特徴点を抽出し、
前記特徴点特徴量抽出手段が、前記処理対象画像から、前記特徴点の特徴を表す特徴点特徴量を抽出し、
前記全体特徴量算出手段が、異なる識別対象をそれぞれ識別する識別器の生成に共通して用いられた生成用特徴量を含む共有コードブックに基づいて、前記処理対象画像の特徴点特徴量から、前記処理対象画像全体の特徴を表す全体特徴量を算出し、
前記識別手段が、画像上に存在する被写体が所定の識別対象であるか否かを識別する識別器と、前記全体特徴量とに基づいて、前記処理対象画像上に存在する被写体が所定の識別対象であるか否かを識別する
ステップを含む識別方法。
コンピュータを、
画像上に存在する被写体が所定の識別対象であるか否かを識別する処理の対象とする処理対象画像から特徴点を抽出する特徴点抽出手段と、
前記処理対象画像から、前記特徴点の特徴を表す特徴点特徴量を抽出する特徴点特徴量抽出手段と、
異なる識別対象をそれぞれ識別する識別器の生成に共通して用いられた生成用特徴量を含む共有コードブックに基づいて、前記処理対象画像の特徴点特徴量から、前記処理対象画像全体の特徴を表す全体特徴量を算出する全体特徴量算出手段と、
画像上に存在する被写体が所定の識別対象であるか否かを識別する識別器と、前記全体特徴量とに基づいて、前記処理対象画像上に存在する被写体が所定の識別対象であるか否かを識別する識別手段と
して機能させるためのプログラム。