JP2015125662A

JP2015125662A - 物体識別プログラム及び装置

Info

Publication number: JP2015125662A
Application number: JP2013270744A
Authority: JP
Inventors: 史紘佐々木; Fumihiro Sasaki
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 2013-12-27
Filing date: 2013-12-27
Publication date: 2015-07-06

Abstract

【課題】物体識別処理において、特性差異による識別精度の劣化を解決する。【解決手段】まず、特性差異毎に学習画像を粗分類する。以下、各特性の分類画像特徴群・学習辞書・識別器を含む概念を「実ドメイン」と定義する。次に、実ドメイン間の画像特徴の中間表現を、辞書学習を用いて自動的に抽出する。以下、実ドメイン間の中間表現特徴群・学習辞書・識別器を含む概念を「仮想ドメイン」と定義する。次に、実ドメインの学習画像を用いて、実ドメイン・仮想ドメインの識別器に学習させる。【選択図】図７

Description

本発明は、物体識別プログラム及び装置に関し、特に、特性差異に起因する識別精度の劣化を防止する技術に関する。

近年、様々なイメージングデバイスにおいて顔認識をはじめとする物体識別アルゴリズムが搭載されている。物体識別アルゴリズムとして、予め用意した識別対象物体画像から画像特徴量を抽出・学習することで識別器を生成し、生成した識別器にテスト画像を入力して識別結果を得るアルゴリズムが既に知られている。例えば、識別対象の物体画像が人物画像である場合、画像特徴量を抽出するアルゴリズムとしてＨＯＧ（Histogram of Oriented Gradients）が、学習するアルゴリズムとしてAdaBoostが知られている。

しかし、今までの物体識別アルゴリズムは、学習画像上の識別対象物体と、テスト画像上の識別対象物体の特性が違うことで、識別精度が劣化するという問題が広く知られている。識別精度を劣化させる画像の特性差異として、解像度、照明環境、撮影視点等が挙げられる。上記識別精度劣化を解決する手段として従来、主に２つの手段がなされている。

１つ目の手段として、特性差異を網羅した学習画像を用意し、特性差異がある識別対象画像間で共通する画像特徴を抽出・学習する手段が挙げられる。例えば特性差異が撮影視点の違いであれば、各視点の画像を学習画像として用意し、全学習画像を用いて一つの識別器を生成する、すなわち撮影視点に対してジェネラリストの識別器を生成する手段として解釈できる。ただし特性差異がある画像特徴間の差異（ある特性状態固有の画像特徴）を学習できないため、識別精度の向上は限定的であるという問題点がある。

２つ目の手段として、特性差異毎に分類した学習画像を用意し、特性差異毎に識別器を生成する手段が挙げられる。例えば特性差異が撮影視点の違いであれば、各撮影視点の画像を学習画像として用意し、視点毎に学習画像を分類し、分類した学習画像毎に識別器を生成する、すなわち各撮影視点に対してスペシャリストの識別器群を生成する手段として解釈できる。しかしながら、下記２つの問題点があった。

第１に、一般的に識別器の生成に使用する学習画像の枚数が多いほど、識別器の識別精度が良いという傾向がある。本手段において、特性差異毎に学習画像を分類する程、一つの識別器の生成に使用する学習画像の枚数が少なくなり、各識別器の識別精度は低下する傾向にある。

第２に、人手により特性差異を細かい粒度で（精度良く）分類することには限界がある。例えば特性差異が撮影視点の違いであれば、人物の撮影角度の違いを目視により細かい粒度で判断することは困難である。すなわち、生成した識別器群の各撮影視点に対するスペシャリティは限定的となる。

顔認識を高精度で行うために莫大な量のデータを必要とする。例えば様々な視点（viewpoint）のテンプレートを用意する場合、それに応じたデータ量がそのまま増えることになる。特許文献１には、この莫大なデータ量を緩和する目的で、高精度の視点非依存性顔認識システムを構築する手法が開示されている。

特許文献１は、本発明とは確かに学習画像を特性差異（視点毎）に分類する点では似ている点がある。しかし、学習画像の特性差異を細かい粒度で（精度良く）分類することには言及されておらず、生成した識別器群の特性差異毎のスペシャリティが限定的となるという問題点が解消できていない。

非特許文献１には、学習画像とテスト画像間の特性差異を緩和する目的で、学習画像・テスト画像間の特徴量の中間表現を、辞書学習（Dictionary Learning）を用いて自動抽出する手法が開示されている。

非特許文献１は、本発明とは確かに特徴量の中間表現を、辞書学習を用いて抽出する点では似ている点がある。しかし、学習画像を特性差異毎に分類し識別器を生成するフレームワークを採用していないため、識別精度の向上が限定的であるという問題点は解消できていない。

本発明は、上記実情に鑑みてなされたものであって、物体識別処理において、特性差異による識別精度の劣化を解決することを目的とする。

上記目的を達成するために本発明は、一態様として、コンピュータを、同一の識別対象が写った学習画像群であって特性差異毎に分類された学習画像群に基づいて第１の辞書群を生成する実ドメイン辞書生成部と、２つの前記第１の辞書に基づいて、１以上複数の第２の辞書群を生成する仮想ドメイン辞書生成部と、前記識別対象が写った学習画像群とラベルと前記第１の辞書群を用いて、第１の識別器群を生成し、前記識別対象が写った学習画像群と前記ラベルと前記第２の辞書群を用いて、第２の識別器群を生成する識別器学習・生成部と、評価画像を、前記第１の識別器群及び前記第２の識別器群を用いて評価する識別機能部として機能させるための物体識別プログラムを提供する。

本発明によれば、物体識別処理において、特性差異による識別精度の劣化を解決することができる。

実施形態における実ドメインの生成の概念を説明するための図である。実施形態における仮想ドメインの生成の概念を説明するための図である。実施形態における識別器学習フローを示すフローチャート図である。実施形態における識別フローを示すフローチャート図である。実施形態における連結ベクター最頻値探索の概念を説明するための図である。実施例のハードウェア構成例を示す図である。第１の実施例のソフトウェア機能ブロック図である。第２の実施例のソフトウェア機能ブロック図である。

以下に開示される発明は、物体識別処理に際して、以下の特徴を有する。
要するに、以下の処理により識別器の学習を行うことが特徴になっている。
まず、特性差異毎に学習画像を粗分類する。以下、各特性の分類画像特徴群・学習辞書・識別器を含む概念を「実ドメイン」と定義する。
次に、実ドメイン間の画像特徴の中間表現を、辞書学習を用いて自動的に抽出する。以下、実ドメイン間の中間表現特徴群・学習辞書・識別器を含む概念を「仮想ドメイン」と定義する。
次に、実ドメインの学習画像を用いて、実ドメイン・仮想ドメインの識別器に学習させる。

このように識別器の学習を行うことにより、仮想ドメインが学習した学習画像の数は、実ドメインの学習画像の数と同じになるので、一つの識別器に学習させる学習画像の枚数が少なくなり物体識別精度が劣化するという問題が起きない。また、仮想ドメイン群を生成することにより、粒度の細かい特性差異分類が可能となる。
これらの特徴を備える実施形態について、添付の図面を用いて以下、詳細に解説する。

本実施形態に係る物体識別プログラムのアルゴリズムは、学習フローと識別フローに分かれる。図１乃至図３を参照して学習フローについて説明し、次に図４、図５を参照して識別フローについて説明する。その後、本実施形態に係る物体識別プログラムのアルゴリズムを用いた実施例を図６乃至図８を参照しながら説明する。

＜学習フロー＞
図３のフローに沿って、学習フローを説明する。
・Ｌ１：図１に示すように、学習画像群（識別対象したい対象が写った画像群）を特性差異毎にＮ個に粗分類し、実ドメイン１〜Ｎを形成する。
粗分類の手法は手作業、あるいは学習画像群から特徴量を抽出し分類アルゴリズムにかける手法がある。

・Ｌ２：実ドメイン毎の学習画像群を用いて、実ドメイン毎の辞書を学習・生成する。
例えば、実ドメイン１の辞書を生成する場合、実ドメイン１の学習画像群を学習して生成する。なお、辞書学習手法の例として、ＫＳＶＤ（K Singular Value Decomposition）等が存在する。

ＫＳＶＤによる辞書学習においては、例えば、Ｙ∈Ｒⁱを学習画像、Ａ∈Ｒⁱ×^jを辞書、学習画像のＸ∈Ｒ^jを学習画像のスパースコードだとすると、学習画像群に対して式：Ｙ＝ＡＸが成立するような（ＹとＡＸの差がないような）辞書を学習する。

・Ｌ３：Ｌ２にて学習した実ドメインの辞書群を用いて、各実ドメイン間の仮想ドメインの辞書をＭ個学習・生成する。
図２に示すように、実ドメイン１と実ドメイン２の間の仮想ドメイン１−１〜１−Ｍに対する辞書を生成する場合、実ドメイン１の辞書と、実ドメイン２の辞書を学習して生成する。仮想ドメインの辞書学習方法については、非特許文献に記載の方法を採用することができる。当該方法は、仮想ドメインの辞書自体が中間表現特徴の抽出に関する設計を表し、辞書により得られるスパースコードが中間表現特徴というように捉えることができる。

・Ｌ４：Ｌ３にて学習された辞書により、実ドメイン毎の画像群（識別したい対象が写った画像群）、及びどのドメインにも属さない画像群（識別したい対象以外が写った画像群）の、スパースコードＸを生成し、スパースコードＸ自体、あるいはスパースコードＸを用いた記述子（例：ヒストグラム）を特徴ベクターとし、特徴ベクター及び画像ラベル（例：１＝識別したい対象が写った画像／０＝識別したい対象以外が写った画像）を学習することにより、ドメイン毎の識別器を生成する。

例えば、実ドメイン１の識別器を生成する場合、実ドメイン１の画像群（識別したい対象が写った画像群）、及びどのドメインにも属さない画像群（識別したい対象以外が写った画像群）のスパースコードを実ドメイン１の辞書を用いて生成し、生成されたスパースコードから特徴ベクターを生成し、特徴ベクター及び画像ラベル（例：１＝識別したい対象が写った画像／０＝識別したい対象以外が写った画像）を学習し、識別器を生成する。

例えば、仮想ドメイン１−１の識別器を生成する場合、実ドメイン１の学習画像群（識別したい対象が写った画像群）、及びどのドメインにも属さない画像群（識別したい対象以外が写った画像群）のスパースコードを仮想ドメイン１−１の辞書を用いて生成すると共に、実ドメイン２の学習画像群（識別したい対象が写った画像群）、及びどのドメインにも属さない画像群（識別したい対象以外が写った画像群）のスパースコードを仮想ドメイン１−２の辞書を用いて生成する。そして、生成した全てのスパースコードからそれぞれ特徴ベクターを生成し、特徴ベクター及び画像ラベル（例：１＝識別したい対象が写った画像／０＝識別したい対象以外が写った画像）を学習し、識別器を生成する。

＜識別フロー＞
前提として、中間特徴表現により生成した識別器群が出力する識別スコア値において、以下の特性があるという仮定を置く。
・ドメイン毎に距離が近ければ、近い識別スコア値を出力する。
・識別スコア値に外れ値が存在する。
本実施形態の識別フローは、１つ目の特性を活かし、２つ目の特性を低減するように、以下に述べるように構成される。図４のフローに沿って識別フローを説明する。

・Ｄ１：評価画像を入力し、各辞書によりスパースコード・特徴ベクターを生成し、各識別器に各辞書により生成した特徴ベクターを入力し、各識別器からの識別スコアを生成する。

・Ｄ２：各ドメインの辞書と識別スコアを連結したベクターを生成する。
辞書Ａ∈Ｒⁱ×^jだとすると、連結ベクターの次元数は（ｉ×ｊ＋１）となる。
そこで、辞書ベクターの類似度（内積の大きさ）がドメインの近さを表すと仮定すると、辞書ベクター部分空間（ｉ×ｊ）次元の各ベクターの分布を観測することで、ドメイン間の距離を観測することが可能となる。
辞書ベクター部分空間に識別スコアの次元を加え（ｉ×ｊ＋１）次元の連結ベクターを観測することで、距離の近いドメインの識別スコア値の近さを観測することが可能となる。

・Ｄ３：各ドメインの連結ベクターの密度分布を推定し、最頻値探索（密度分布の頂点）を実施する。
密度分布推定手法の例としては、カーネル密度推定等を採用することができる。また、最頻値探索手法の例としては、平均値シフト等を採用することができる。

・Ｄ４：最頻値点に一番近い連結ベクターを抽出し、抽出された連結ベクターの１要素である識別スコアを閾値判定し、最終検出結果とする。
例えば、図５中の一番突出した凸領域に近い連結ベクターを持つドメインの識別スコア値は、真判定される。一方、図５中のその他の凸領域に近い連結ベクターを持つドメインの識別スコア値は、偽判定される。
各識別器の識別スコアを閾値判定にかけると外れ値を真の結果として誤判定する場合があるが、閾値判定にかける識別スコアとして最頻値点に近いものを選ぶことで、（外れ値は推定密度分布上で疎であるはずなので）外れ値による誤判定を防ぐ事ができる。

上記実施形態によれば、仮想ドメイン群を生成することにより、学習画像分類コストの抑止が可能になり、また、粒度の細かい特性差異分類が可能となる。また、実ドメインの学習画像を用いて実ドメインの識別器のみならず仮想ドメインの識別器の学習も行うことにより、仮想ドメインが学習した学習画像の数が、実ドメインの学習画像の数と同じになるので、一つの識別器に学習させる学習画像の枚数が少なくなり物体識別精度が劣化するという問題が起きない。

＜実施例＞
以下、第１、第２の実施例を説明する。

図６に、実施例のハードウェア構成例を示す。実施例に係る物体識別装置１は、一般的な情報処理端末と同様の構成を有する。即ち、実施例に係る物体識別装置１は、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）１０、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）１１、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）１２、ＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）１３及びＩ／Ｆ１４がバスを介して接続されている。また、Ｉ／Ｆ１４にはＬＣＤ（ＬｉｑｕｉｄＣｒｙｓｔａｌＤｉｓｐｌａｙ）１５及び操作部１６が接続されている。

ＣＰＵ１０は演算手段であり、装置全体の動作を制御する。ＲＡＭ１１は、情報の高速な読み書きが可能な揮発性の記憶媒体であり、ＣＰＵ１０が情報を処理する際の作業領域として用いられる。ＲＯＭ１２は、読み出し専用の不揮発性記憶媒体であり、ファームウェア等のプログラムが格納されている。ＨＤＤ１３は、情報の読み書きが可能な不揮発性の記憶媒体であり、ＯＳ（ＯｐｅｒａｔｉｎｇＳｙｓｔｅｍ）や各種の制御プログラム、アプリケーション・プログラム等が格納されている。Ｉ／Ｆ１４は、バスと各種のハードウェアやネットワーク等を接続し制御する。ＬＣＤ１５は、ユーザが装置の状態を確認するための視覚的ユーザインタフェースである。操作部１６は、キーボードやマウス等、ユーザが装置に情報を入力するためのユーザインタフェースである。

上述のようなハードウェア資源を用いたソフトウェアプログラムによる情報処理により、以下に述べるような機能の構成がＣＰＵ１０などで形作られる制御部に実現する。以下、第１及び第２の実施例について述べる。

＜第１の実施例＞
図７に、第１の実施例に係る物体識別装置１のソフトウェア機能ブロック図を示す。図示のように、物体識別装置１は、識別器学習機能部１１０と識別機能部１２０の他、各種保存部を備える。

識別器学習機能部１１０は、図３に示した識別器学習機能を担う機能ブロックである。
識別器学習機能部１１０は、学習画像入力部１１１、実ドメイン辞書生成部１１２、仮想ドメイン辞書生成部１１３、学習画像・ラベル入力部１１４、スパースコード生成部１１５、特徴ベクター生成部１１６、識別器学習・生成部１１７を備える。

学習画像入力部１１１は、Ｌ１処理にて分類した画像群を後段ブロックに出力する。
実ドメイン辞書生成部１１２は、学習画像入力部１１１からの入力画像に対しＬ２処理を実施し、生成した辞書を辞書保存部１１８に保存する。

仮想ドメイン辞書生成部１１３は、辞書保存部１１８から複数の実ドメインの辞書を参照し、学習画像入力部１１１からの入力画像に対しＬ３処理を実施し、生成した辞書を辞書保存部１１８に保存する。

学習画像・ラベル入力部１１４は、Ｌ４処理に必要な画像群とそのラベル群を、後段ブロックに出力する。

スパースコード生成部１１５は、辞書保存部１１８から辞書を参照し、学習画像入力部１１１からの入力画像に対しＬ４処理中のスパースコード生成処理を実施し、後段ブロックに出力する。

特徴ベクター生成部１１６は、スパースコード生成部１１５からの入力スパースコードに対し、Ｌ４処理中の特徴ベクター処理を実施する。

識別器学習・生成部１１７は、特徴ベクター生成部１１６からの入力特徴ベクター、及びそれに対応するラベルに対し、Ｌ４処理中の識別器学習・生成処理を実施し、生成した識別器を識別器保存部１１９に保存する。

辞書保存部１１８は、実ドメイン辞書生成部１１２、仮想ドメイン辞書生成部１１３にて生成された辞書を保存する。
識別器保存部１１９は、識別器学習・生成部１１７にて生成された識別器を保存する。

識別機能部１２０は、図４、５に示した識別処理機能を担う機能ブロックである。
識別機能部１２０は、評価画像入力部１２１、スパースコード生成部１２２、特徴ベクター生成部１２３、識別スコア算出部１２４、連結ベクター生成部１２５、最頻値探索部１２６、閾値判定部１２７を備える。

評価画像入力部１２１は、評価画像を後段のブロックへ出力する。
スパースコード生成部１２２は、評価画像入力部１２１からの入力画像に対し、辞書保存部１１８から辞書を参照し、Ｄ１処理中のスパースコード生成処理を実施し、生成したスパースコードを後段ブロックへ出力する。

特徴ベクター生成部１２３は、スパースコード生成部１２２からの入力スパースコードに対し、Ｄ１処理中の特徴ベクター生成処理を実施し、生成した特徴ベクターを後段ブロックへ出力する。

識別スコア算出部１２４は、特徴ベクター生成部１２３からの入力特徴ベクターに対し、Ｄ１処理中の識別スコア生成処理を実施し、生成した識別スコアを後段ブロックへ出力する。
連結ベクター生成部１２５は、識別スコア算出部１２４からの入力識別スコアに対し、識別器保存部１１９から辞書を参照し、Ｄ２処理中の連結ベクター生成処理を実施し、生成した連結ベクターを連結ベクター保存部１２８へ保存する。

最頻値探索部１２６は、連結ベクター保存部１２８から連結ベクターを取得し、Ｄ３処理を実施する。また、推定密度分布、最頻値探索中間結果の保存取得を最頻値探索結果保存部１２９に対して繰り返し、最頻値探索最終結果を最頻値探索結果保存部１２９に保存する。

閾値判定部１２７は、最頻値探索結果保存部１２９から最頻値探索最終結果を取得してＤ４処理を実施し、生成された最終検出結果を最終検出結果保存部１３０に保存する。

連結ベクター保存部１２８は、連結ベクター生成部１２５にて生成された連結ベクターを保存する。
最頻値探索結果保存部１２９は、最頻値探索部１２６にて生成された推定密度分布、最頻値探索中間結果、最頻値探索最終結果を保存する。
最終検出結果保存部１３０は、閾値判定部１２７にて生成された最終検出結果を保存する。

なお、識別機能部１２０が、閾値判定部１２７による判定結果において真判定された連結ベクターに係るドメインの識別器の識別対象を、識別した物体として出力してもよい。

＜第２の実施例＞
評価画像は、静止画像に限定されず、動画像でもよい。動画像から物体を識別する場合は、識別機能部１２０がフレーム毎に物体を識別するとよい。しかしながら、物体識別処理は、フレーム数の規模に応じて非常に時間がかかってしまうという課題がある。そこで本実施例では、以下に述べるような構成によりこの問題を解決する。

図８に、第２の実施例に係る物体識別装置１のソフトウェア構成ブロック図を示す。第１の実施例のものと異なる点は、識別機能部１２０が領域特定部１３１を備える点である。領域特定部１３１は、Ｄ４処理を実施する閾値判定部１２７の処理の結果を利用して、抽出した連結ベクターの１要素である識別スコアが前記所定の閾値以下であり、Ｄ３処理を実施する最頻値探索部１２６の処理の結果を利用して、密度が所定の密度以上の領域を特定する。また、領域特定部１３１は、特定した領域内に連結ベクターを持つドメインを特定する機能も備える。領域特定部１３１による処理は、任意のフレームに対する物体識別処理の際に行う。

領域特定部１３１により特定した領域の情報と、特定したドメインの情報は、最終検出結果保存部１３０に一時的に記憶される。そして、上記条件に合う領域が特定された場合、次のフレームにおける物体識別処理の際、最終検出結果保存部１３０は、特定された領域内に連結ベクターを持つドメインの識別器の、Ｄ３処理をスキップする。すなわち、Ｄ３処理において、そのような識別器の連結ベクターのマッピングをしない。

本実施例の構成及び処理は、評価画像の特性から遠いドメインの識別器の処理をスキップすることにより、物体識別処理速度を高めることができる。

１物体識別装置
１１０識別器学習機能部
１１１学習画像入力部
１１２実ドメイン辞書生成部
１１３仮想ドメイン辞書生成部
１１４学習画像・ラベル入力部
１１５スパースコード生成部
１１６特徴ベクター生成部
１１７識別器学習・生成部
１１８辞書保存部
１１９識別器保存部
１２０識別機能部
１２１評価画像入力部
１２２スパースコード生成部
１２３特徴ベクター生成部
１２４識別スコア算出部
１２５連結ベクター生成部
１２６最頻値探索部
１２７閾値判定部
１２８連結ベクター保存部
１２９最頻値探索結果保存部
１３０最終検出結果保存部
１３１領域特定部

特許４５７１６２８号公報

Ni, Jie, Qiang Qiu, and Rama Chellappa. "Subspace Interpolation via Dictionary Learning for Unsupervised Domain Adaptation.", CVPR 2013

Claims

コンピュータを、
同一の識別対象が写った学習画像群であって特性差異毎に分類された学習画像群に基づいて第１の辞書群を生成する実ドメイン辞書生成部と、
２つの前記第１の辞書に基づいて、１以上複数の第２の辞書群を生成する仮想ドメイン辞書生成部と、
前記識別対象が写った学習画像群とラベルと前記第１の辞書群を用いて、第１の識別器群を生成し、前記識別対象が写った学習画像群と前記ラベルと前記第２の辞書群を用いて、第２の識別器群を生成する識別器学習・生成部と、
評価画像を、前記第１の識別器群及び前記第２の識別器群を用いて評価する識別機能部
として機能させるための物体識別プログラム。
前記識別機能部が、
第１の辞書群及び第２の辞書群の個々の辞書毎に、当該辞書から生成される辞書ベクターと、当該辞書に対応する識別器を前記評価画像に用いた識別スコアと、を連結させた連結ベクターを生成する連結ベクター生成部と、
前記連結ベクターの密度分布に基づいて最頻値探索を行う最頻値探索部と、
最頻値点に近い前記連結ベクターの前記識別スコアが、所定の閾値以上であるか否かを判定する閾値判定部と、
を備えるように機能させるための請求項１に記載の物体識別プログラム。
前記識別機能部が、前記所定の閾値を超えた連結ベクターに係る識別対象を、識別した物体とするように機能させるための請求項２に記載の物体識別プログラム。
前記評価画像が動画像であり、
前記コンピュータをさらに、
あるフレームにおいて、前記識別スコアが、前記所定の閾値以下であり、密度が所定の密度以上の領域を特定する領域特定手段として機能させ、
前記識別機能部が、前記あるフレームの次フレームにおける、特定された領域内に存在する前記連結ベクターに係る識別器による評価をスキップする
ように機能させるための請求項２又は３に記載の物体識別プログラム。
同一の識別対象が写った学習画像群であって特性差異毎に分類された学習画像群に基づいて第１の辞書群を生成する実ドメイン辞書生成部と、
２つの前記第１の辞書に基づいて、１以上複数の第２の辞書群を生成する仮想ドメイン辞書生成部と、
前記識別対象が写った学習画像群とラベルと前記第１の辞書群を用いて、第１の識別器群を生成し、前記識別対象が写った学習画像群と前記ラベルと前記第２の辞書群を用いて、第２の識別器群を生成する識別器学習・生成部と、
評価画像を、前記第１の識別器群及び前記第２の識別器群を用いて評価する識別機能部と、
を備えることを特徴とする、物体識別装置。
前記識別機能部は、
第１の辞書群及び第２の辞書群の個々の辞書毎に、当該辞書から生成される辞書ベクターと、当該辞書に対応する識別器を前記評価画像に用いた識別スコアと、を連結させた連結ベクターを生成する連結ベクター生成部と、
前記連結ベクターの密度分布に基づいて最頻値探索を行う最頻値探索部と、
最頻値点に近い前記連結ベクターの前記識別スコアが、所定の閾値以上であるか否かを判定する閾値判定部と、
を備えることを特徴とする請求項５に記載の物体識別装置。
前記識別機能部は、前記所定の閾値を超えた連結ベクターに係る識別対象を、識別した物体とすることを特徴とする請求項６に記載の物体識別装置。
前記評価画像が動画像であり、
さらに、
あるフレームにおいて、前記識別スコアが、前記所定の閾値以下であり、密度が所定の密度以上の領域を特定する領域特定手段を備え、
前記識別機能部は、前記あるフレームの次フレームにおける、特定された領域内に存在する前記連結ベクターに係る識別器による評価をスキップする
ことを特徴とする請求項６又は７に記載の物体識別装置。