JP2014203132A

JP2014203132A - 情報処理装置、情報処理方法

Info

Publication number: JP2014203132A
Application number: JP2013076448A
Authority: JP
Inventors: 佐藤　博; Hiroshi Sato; 博佐藤
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 2013-04-01
Filing date: 2013-04-01
Publication date: 2014-10-27

Abstract

【課題】画像中に写っているオブジェクトをより高精度に識別するための技術を提供すること。
【解決手段】統合類似度をθ（Ｎ）に応じて減少させ、該減少後の類似度を出力する。θ（Ｎ）は、Ｎ枚の画像中の対象オブジェクトの識別処理を行った場合に、ＦＡＲとＦＲＲとの比が予め定められた比となるように、該識別処理において対象オブジェクトの特徴ベクトルとの類似度判定に用いる閾値である。
【選択図】図１

Description

本発明は、オブジェクト識別技術に関するものである。

パターン認識における識別技術、典型的には、画像データ中の被写体であるオブジェクトが、別の画像中の被写体であるオブジェクトと同一のものであると識別する技術として、個人の顔を識別する顔識別技術がある。以下、本明細書では、オブジェクトの識別とは、オブジェクトの個体の違い（例えば、個人としての人物の違い）を判定することを意味する。一方、オブジェクトの検出とは、個体を区別せず同じ範疇に入るものを判定する（例えば、個人を区別せず、顔を検出する）ことを意味するものとする。顔識別における従来の技術例として、特許文献１がある。

特開2009-163555号公報

上記のような、パターン（具体的には画像中のオブジェクト、より具体的には、人物の顔）の識別を行う装置および方法において、識別性能を低下させる要因として、登録用パターンと認証用パターン間の変動が挙げられる。即ち、識別対象であるオブジェクト（人物の顔）の変動、具体的には、照明条件、向き・姿勢、他のオブジェクトによる隠れや、表情による変動などである。登録用パターンと認証用パターンとで変動が大きくなると、識別性能が大幅に低下してしまう。

この問題に対して、一般的に、予め登録用パターンに十分な変動を含ませることが有効と考えられている。例えば人物の顔の場合、登録人物ごとに、照明条件、向き・姿勢、隠れや表情などによる変動をもつ画像を登録しておけばよい。撮影時に起こりうる条件を予め登録画像に含めておけば、認識精度の向上が期待できる。

しかしながら、予め多数の登録画像を準備することは実用上難しい上に、さらに以下のような問題がある。即ち、登録人物１人当たりの登録画像を増やすと、他人と類似する登録画像が増える確率が高まり、平均的に類似度スコアが高くなってしまう。特に、登録人物ごとに登録画像の枚数にばらつきがあると、登録画像の枚数が多い人物との類似度スコアが平均的に高くなってしまう問題がある。

上記問題に対して、特許文献１では、登録人物の人数に応じて、類似度スコアを調整する方法を提案している。しかしながら、上記のようにした場合、類似度スコアを登録人数に応じて一括で変換するため、上記のように、登録人物で登録画像数にばらつきがある場合には、有効に働かない可能性がある、という課題があった。

本発明はこのような問題に鑑みてなされたものであり、画像中に写っているオブジェクトをより高精度に識別するための技術を提供することを目的とする。

本発明の目的を達成するために、例えば、本発明の情報処理装置は、着目オブジェクトのＮ（Ｎは自然数）枚の画像のそれぞれから予め抽出された、該画像中の該着目オブジェクトの部分領域ごとの特徴ベクトル、を保持する手段と、前記Ｎ枚の画像のそれぞれに対し、該画像から予め抽出されている前記着目オブジェクトの部分領域ごとの特徴ベクトルと、入力画像中のオブジェクトの部分領域ごとの特徴ベクトルと、で対応する部分領域の特徴ベクトル間の類似度を求める算出手段と、前記算出手段が求めた類似度群から１つの類似度を求め、該求めた１つの類似度を、前記Ｎ枚の画像中の対象オブジェクトの識別処理の誤り率に基づいて予め設定されている値に応じて減少させ、該減少後の類似度を、前記入力画像中のオブジェクトと、前記着目オブジェクトと、の類似度として出力する出力手段とを備えることを特徴とする。

本発明の構成により、画像中に写っているオブジェクトをより高精度に識別することができる。

オブジェクト識別装置の構成例を示すブロック図。オブジェクト識別装置が行う処理の概要を示すフローチャート。オブジェクト登録部５の機能構成例を示すブロック図。登録オブジェクト辞書データ生成部２１の機能構成例を示すブロック図。特徴ベクトル抽出部３２及び特徴ベクトル変換部３３で行う処理のフローチャート。入力オブジェクト識別部６の機能構成例を示すブロック図。入力オブジェクト識別部６が行う処理のフローチャート。入力オブジェクト識別用データ生成部４１の機能構成例を示すブロック図。入力オブジェクト識別演算部４３の機能構成例を示すブロック図。図９の各部により行う処理のフローチャート。 θ（Ｎ）を決定するための処理のフローチャート。入力オブジェクト識別部６が行う処理のフローチャート。 θ（Ｎ）を決定するための処理のフローチャート。

以下、添付図面を参照し、本発明の好適な実施形態について説明する。なお、以下説明する実施形態は、本発明を具体的に実施した場合の一例を示すもので、特許請求の範囲に記載の構成の具体的な実施例の１つである。

［第１の実施形態］
＜オブジェクト識別装置の概要について＞
本実施形態では、情報処理装置として機能するオブジェクト識別装置は、撮像機能を有し、該撮像機能により撮像した画像中のオブジェクトを識別する撮像装置であるものとして説明する。しかし、以下に説明するオブジェクト識別処理を実現することができるのであれば、オブジェクト識別装置は撮像装置以外の機器であっても良い。先ず、このオブジェクト識別装置の構成例について、図１のブロック図を用いて説明する。

結像光学系１は、ズーム機構を備えた光学レンズで構成され、外界の光は、結像光学系１を介して撮像部２に入光する。なお、結像光学系１は、パン・チルト軸方向の駆動機構を備えてもよい。

撮像部２は、典型的にはＣＣＤやＣＭＯＳイメージセンサにより構成され、不図示のセンサ駆動回路からの読出制御信号により、結像光学系１を介して入光した光に応じた映像信号（例えば、サブサンプリング、ブロック読み出しして得られる信号）を出力する。

撮像制御部３は、撮像部２の動作制御を行うものであり、本装置の操作者（撮影者）による操作指示（画角調整指示、シャッター押下など）、オブジェクト登録部５や入力オブジェクト識別部６から得られる情報、を元に、撮像部２の撮影タイミングを制御する。

画像記録部４は、半導体メモリ等で構成され、撮像制御部３によって制御された撮影タイミングで撮像部２から出力された映像信号に基づく画像を撮像画像として記録するためのメモリである。画像記録部４に記録されている画像のデータは、オブジェクト登録部５や入力オブジェクト識別部６からの要求に応じてこれらの機能部に適宜転送される。

オブジェクト登録部５は、画像記録部４に記録されている画像から、該画像中に写っているオブジェクトを識別するための係る各種の情報を抽出し、該抽出した情報を該オブジェクトの辞書データとして記録・保持する。入力オブジェクト識別部６は、オブジェクト登録部５に登録されている辞書データを用いて、画像記録部４に記録されている画像中のオブジェクトを識別する。

なお、オブジェクト登録部５及び入力オブジェクト識別部６は、それぞれ専用回路（ＡＳＩＣ）、プロセッサ（リコンフィギュラブルプロセッサ、ＤＳＰ、ＣＰＵなど）であってもよい。また、単一の専用回路および汎用回路（PC用CPU）内部において実行されるコンピュータプログラムとして実装してもよい。

外部出力部７は、典型的には、CRTやTFT液晶などのモニタであり、撮像部２からの映像信号に基づく映像や、画像記録部４から読み出した撮像画像を表示する。また、この外部出力部７には、オブジェクト登録部５や入力オブジェクト識別部６による処理結果を重畳させて表示してもよい。なお、外部出力部７は、モニタ以外の出力機器であってもよく、外部の機器に対してデータ転送を行う機器であってもよい。

上記の撮像部２、撮像制御部３、画像記録部４、オブジェクト登録部５、入力オブジェクト識別部６、外部出力部７はいずれも、接続バス８に接続されており、これらの機能部はこの接続バス８を介して互いに通信することができる。

次に、オブジェクト識別装置が行う処理の概要について、図２のフローチャートを用いて説明する。以下の説明では、画像中のオブジェクトを識別する処理の一例として、画像中に写っている人の顔が誰の顔であるのかを識別する処理を実行するケースについて説明する。

ステップＳ２００では、入力オブジェクト識別部６は、画像記録部４から処理対象となる画像を読み出す。そしてステップＳ２０１では、入力オブジェクト識別部６は、読み出した画像から人の顔を検出する処理を行う。画像から人の顔を検出する処理では、公知の技術を用いればよい。例えば、以下の文献に記されている技術が適用可能である。

P. Viola and M. Jones，“Robust real-time face detection”, pp.747, Eighth International Conference on Computer Vision (ICCV’01) − Volume 2, 2001.
画像から人の顔を検出することができた場合には、処理はステップＳ２０２を介してステップＳ２０３に進み、検出することができなかった場合には、処理はステップＳ２０２を介して終了する。ステップＳ２０３では、入力オブジェクト識別部６は、検出した人の顔のうちまだ識別していない顔を１つ選択し、該選択した顔を識別する処理を実行する。

ステップＳ２０４では、入力オブジェクト識別部６は、ステップＳ２０３で識別した顔が、オブジェクト登録部５に登録済みの人の顔の何れかに該当するか否か（例えば登録済みの顔との類似度が規定値以上か否か）を判断する。この判断結果、オブジェクト登録部５に登録済みのそれぞれの顔のうち、ステップＳ２０３で識別した顔に該当するものがあったと判断した場合には、処理はステップＳ２０７に進み、該当する顔がなかったと判断した場合には、処理はステップＳ２０５に進む。

ステップＳ２０５では、オブジェクト登録部５は、ステップＳ２０３で識別した顔を登録するか否かを判断する。登録するか否かは予め定められていてもよいし、本装置の操作者が外部インターフェースやＧＵＩなどを操作して、登録するか否かを指示してもよい。いずれにせよ、登録する場合には、処理はステップＳ２０６に進み、登録しない場合には、処理はステップＳ２０７に進む。ステップＳ２０６では、オブジェクト登録部５は、ステップＳ２０３で識別した顔を登録する。

ステップＳ２０７では、入力オブジェクト識別部６は、ステップＳ２０１で検出したすべての顔について識別処理を行ったか否かを判断する。この判断の結果、すべての顔について識別処理を行った場合には、処理はステップＳ２０８に進み、まだ識別していない顔が残っている場合には、処理はステップＳ２０３に戻る。

ステップＳ２０８では、入力オブジェクト識別部６は、すべての顔の識別結果を外部出力部７に対して出力する。出力先はこれに限るものではなく、例えば、適当なメモリであってもよい。

＜オブジェクト登録部５＞
オブジェクト登録部５の機能構成例について、図３のブロック図を用いて説明する。登録オブジェクト辞書データ生成部２１は画像記録部４から読み出した画像から、オブジェクトの個体を識別する為に必要な情報を登録オブジェクト辞書データとして生成し、該登録オブジェクト辞書データを登録オブジェクト辞書データ保持部２２に登録する。

例えば、上記の非特許文献１にあるようなintra-classおよびextra-classの２クラス問題を判別する場合、典型的には、人の顔画像を登録オブジェクト辞書データとすればよい。顔検出処理によって検出された人の顔画像を、大きさや向き（面内回転方向）などを正規化したのち、登録オブジェクト辞書データ保持部２２に格納するようにしてもよい。

また、画像そのものではなく、識別時に必要なデータのみを登録オブジェクト辞書データとして保持するようにすることによって、辞書データ量を削減することも出来る。該オブジェクトの部分領域のベクトル相関をとって識別演算を行う場合、予めその部分領域のみを切り出しておけばよい。

このように、適宜必要な情報を画像から抽出し、後述する所定の変換を行った後、オブジェクトの識別を行うための特徴ベクトルを、登録オブジェクト辞書データとして登録オブジェクト辞書データ保持部２２に格納する。登録オブジェクト辞書データ生成部２１のより詳細な構成及びその動作については、後述する。

登録オブジェクト辞書データ選択部２３は、登録オブジェクト辞書データ保持部２２から、入力オブジェクト識別部６からの要求に応じた登録オブジェクト辞書データを読み出し、読み出した登録オブジェクト辞書データを入力オブジェクト識別部６に転送する。

＜登録オブジェクト辞書データ生成部２１＞
登録オブジェクト辞書データ生成部２１の機能構成例について、図４のブロック図を用いて説明する。部分特徴抽出部３０は、画像記録部４から読み出した画像から特徴ベクトルを抽出する処理を行う機能部である。部分領域設定部３１は、この読み出した画像に対して、特徴ベクトル抽出部３２が特徴ベクトルを抽出する部分領域（より詳しくは部分領域の位置及び範囲）を設定する。部分領域の位置と範囲は、機械学習の方法を用いて予め決めておくとよい。例えば、部分領域の候補を複数設定しておき、該複数候補から、AdaBoostを用いて選択するようにしてもよい。また、部分領域の数は、処理時間などに応じて予め所定の数を決めておくとよい。また、予め用意した学習用サンプルに対して、十分な識別性能を得られる数を計測して決める、などとしてもよい。

特徴ベクトル抽出部３２は、部分領域設定部３１が設定した部分領域から、該部分領域内のオブジェクトの特徴ベクトル（部分特徴）を抽出する。該オブジェクトが画像中の人の顔である場合、典型的には、顔を含む画像から、識別に必要なデータを取り出す処理を行う。識別に必要なデータは、部分領域設定部３１によって設定された部分領域から、その輝度値を特徴ベクトルの１つとして抽出する。輝度値の特徴ベクトル以外に、オブジェクトの部分領域の位置に対して不変な特徴量もしくは位置の変動に頑健な特徴量、例えば、輝度の頻度分布などを特徴ベクトルとして抽出してもよい。部分領域の位置の変動に不変、もしくは頑健な特徴量として、オブジェクトが含まれる画像をフーリエ変換した位相情報を特徴ベクトルとすることも考えられる。上記のような位置の変動に対してロバストな特徴の他に、画像のエッジ情報を抽出するような、フィルタ演算結果を特徴ベクトルとして抽出してもよい。具体的には、ゾーベルフィルタやガボアフィルタなど代表的な空間フィルタ演算を課した結果を特徴ベクトルとして抽出するとよい。さらに、上記のような空間フィルタによるエッジ情報の頻度分布をとり、それを特徴ベクトルとすることも出来る。頻度分布は、位置の変動に対して比較的頑健であり、エッジ情報に由来する特徴を位置ずれに対して頑健にする効果がある。

特徴ベクトル変換部３３は、特徴ベクトル抽出部３２によって抽出された特徴ベクトルに所定の変換を施す。特徴ベクトルの変換では、例えば、主成分分析（PCA）による次元圧縮や、独立成分分析（ICA）による次元圧縮などが行われる。また、局所性保存射影（LPP）や、局所フィッシャー判別分析（LFDA）による次元圧縮を行ってもよい。

特徴ベクトルの変換方法にPCAなどを用いた場合、その基底数（特徴ベクトルの次元削減数）や、どの基底を用いるか、などのパラメータが存在する。基底数の代わりに、基底ベクトルに対応する固有値の和、すなわち累積寄与率を指標としてもよい。これらのパラメータを、部分領域ごとに異なったものにすることもできる。実際にどのようなパラメータを設定するかは、予め機械学習によって、精度と処理時間を調整することによって決めることができる。そして特徴ベクトル変換部３３は、１つのオブジェクトの各部分領域から抽出した特徴ベクトル群をこのように変換したものを、該オブジェクトの登録オブジェクト辞書データとして、上記の登録オブジェクト辞書データ保持部２２に登録する。

特徴ベクトル変換用データ保持部３４は、特徴ベクトル変換部３３において、特徴ベクトルの変換を行う際に必要なデータや変換パラメータを保持している。ここで、特徴ベクトルの変換に必要なデータや変換パラメータとは、上述のような、基底数（次元削減数）などの設定情報や、予め学習によって求めておいた基底ベクトルの数値データなどである。

次に、特徴ベクトル抽出部３２および特徴ベクトル変換部３３で行われる処理の一例について、同処理のフローチャートを示す図５を用いて説明する。ステップＳ１０では、特徴ベクトル抽出部３２は、部分領域設定部３１が設定した部分領域の情報（位置及び範囲を示す情報）を部分領域設定情報として、部分領域設定部３１から取得する。

ステップＳ１１では、特徴ベクトル抽出部３２は、画像記録部４から画像を読み出す。そしてステップＳ１２では、特徴ベクトル抽出部３２は、この読み出した画像中の、部分領域設定情報が示す部分領域から、エッジ情報に関する特徴ベクトルを取得する。ステップＳ１３では、特徴ベクトル抽出部３２は、エッジ情報に関する頻度分布を計測し、特徴ベクトルとして取得する。

ここで、エッジ情報とその頻度分布に関する特徴ベクトルは、複数種類のものを抽出するとよい。上述のように、画像に対して複数のフィルタ演算した結果から取得した特徴ベクトルと、その頻度分布を特徴ベクトルとしたものを取得する。典型的には、LBP（Local Binary Pattern）変換や微分エッジ検出などを行う。さらに、LBP変換後の各要素での値の頻度分布（ヒストグラム）を算出し、特徴ベクトルとして取得する。また、輝度勾配画像のヒストグラムをとっても良い。これはHOG（Histogram of Oriented Gradient）と等価になる。このように、エッジ情報とその頻度分布など、性質の異なる複数の特徴量を取得するとよい。後述するように、大きく性質の異なる特徴量を組み合わせて、識別に用いることで、登録オブジェクトと入力オブジェクト間に変動がある場合にも、頑健に対応することが可能になる。

ステップＳ１４では、特徴ベクトル変換部３３は、ステップＳ１２及びステップＳ１３で取得した特徴ベクトルに対し、特徴ベクトル変換用データ保持部３４から取得した設定に従って所定の変換を行う。すでに述べたように、典型的には、PCAによる次元削減や、ICAによる次元削減、などを特徴ベクトルに対して行う。この際、取得した特徴ベクトルに対して、所定の統計値、典型的には、平均ベクトルや、要素の最大値などを求めておいてもよい。また、部分特徴として、画像から切り出した位置の情報を記録するようにしてもよい。後述するように、辞書として登録されているオブジェクトの部分特徴と、入力画像から抽出したオブジェクトの部分特徴と、の間で対応する部分特徴の比較・評価を行うために、対応関係を示す識別子を記録するようにしてもよい。これらの情報は、登録オブジェクト辞書データ生成部２１の出力として、特徴ベクトルとともに出力するようにするとよい。

以上のような処理を行って、部分領域を設定し、該部分領域から特徴ベクトルを抽出した後に、該特徴ベクトルを変換したデータを、登録オブジェクト辞書データ生成部２１の出力として、登録オブジェクト辞書データ保持部２２に格納する。これにより登録オブジェクト辞書データ保持部２２には、画像中のオブジェクトから抽出された特徴ベクトル群（該オブジェクトのそれぞれの部分領域から抽出された特徴ベクトルの集合）を該オブジェクトの登録オブジェクト辞書データとして登録することができる。

＜入力オブジェクト識別部６＞
入力オブジェクト識別部６の機能構成例について、図６のブロック図を用いて説明する。入力オブジェクト識別用データ生成部４１は、画像記録部４から読み出した画像から、オブジェクトの識別に必要な情報の抽出を行う。登録オブジェクト辞書データ取得部４２は、オブジェクト登録部５から登録オブジェクト辞書データを取得する。

入力オブジェクト識別演算部４３は、入力オブジェクト識別用データ生成部４１が抽出した情報（識別用データ）と、登録オブジェクト辞書データ取得部４２が取得した登録オブジェクト辞書データと、を用いて、画像中のオブジェクトの識別を行う。

次に、入力オブジェクト識別部６が行う識別処理について、同処理のフローチャートを示す図７を用いて説明する。

ステップＳ２０では、登録オブジェクト辞書データ取得部４２は、オブジェクト登録部５から登録オブジェクト辞書データを取得する。ステップＳ２１では、入力オブジェクト識別用データ生成部４１は、画像記録部４から画像を読み出す。

ステップＳ２２では、入力オブジェクト識別用データ生成部４１は、読み出した画像中のオブジェクトから、該オブジェクトの識別に必要なデータ（入力オブジェクト識別用データ）を生成（抽出）する。即ち、入力オブジェクト識別用データ生成部４１は、読み出した画像中のオブジェクトのそれぞれの部分領域から特徴ベクトルを抽出し、抽出した特徴ベクトルの集合を、該オブジェクトの入力オブジェクト識別用データとする。このデータ生成処理は、登録オブジェクト辞書データ生成部２１が、画像からオブジェクトの個体を識別する為に必要な辞書データを生成する処理と同様である。

ステップＳ２３では、入力オブジェクト識別演算部４３は、ステップＳ２２で抽出した入力オブジェクト識別用データと、ステップＳ２０で取得した登録オブジェクト辞書データと、を用いて、画像中のオブジェクトの識別を行う。該識別の結果、出力として、登録済みデータ（辞書データ）との一致／不一致をバイナリ（０もしくは１）で出力する場合と、正規化した出力値を尤度（例えば０〜１の実数値）として出力する場合が考えられる。さらに、登録オブジェクト（登録者）が複数（複数人）ある場合には、それぞれの登録オブジェクト（登録者）に対して尤度を出力しても良いが、最も良く一致した登録オブジェクトに対する結果だけを出力しても良い。また、登録オブジェクトに対する尤度ではなく、登録オブジェクトが属するクラスに対しての尤度を出力してもよい。すなわち、人物の場合には、個々の登録顔画像への結果ではなく、人物のID（名前）に対する尤度を出力するようにする。

＜入力オブジェクト識別用データ生成部４１＞
入力オブジェクト識別用データ生成部４１の機能構成例について、図８のブロック図を用いて説明する。参照番号５０〜５４が付されたそれぞれの機能部は、参照番号３０〜３４が付された機能部と同様の動作を行うものであるため、これらに関する説明は省略する。

＜入力オブジェクト識別演算部４３＞
入力オブジェクト識別演算部４３の機能構成例について、図９のブロック図を用いて説明する。ここでは一例として、次のようなケースについて説明する。即ち画像記録部４から読み出した画像中のオブジェクト（入力オブジェクト）の識別をオブジェクト登録部５中の辞書データに対応するオブジェクト（登録オブジェクト）と入力オブジェクトとで対応する部分特徴間の類似性を基に判定する場合について説明する。図９に示した各部により行う処理について、同処理のフローチャートを示す図１０を用いて説明する。

ステップＳ３０では、入力オブジェクト識別用データ取得部６１は、入力オブジェクト識別用データ生成部４１から入力オブジェクト識別用データを取得する。ステップＳ３１では、登録オブジェクト辞書データ取得部６２は、登録オブジェクト辞書データ取得部４２から登録オブジェクト辞書データを取得する。

次に、ステップＳ３２では、部分特徴類似度算出部６３は、登録オブジェクト辞書データと、入力オブジェクト識別用データと、を比較し、対応する部分領域ごとに特徴ベクトル間の類似度を算出する。類似度は、次のようにして求める。先ず、登録オブジェクト辞書データに登録されているオブジェクトの各特徴ベクトルと、入力オブジェクト識別用データ中の各特徴ベクトルと、で対応する部分領域ごとに特徴ベクトル間のユークリッド距離を求める。そして、求めたユークリッド距離の逆数を類似度とする。また、ユークリッド距離ではなく、特徴ベクトル間の内積を求め、そのなす角を類似度としてもよい。さらに一般的な距離として、以下の数で表されるミンコフスキー距離の逆数を採用してもよい。

ｄ＝^ｂ√（|ｘ１−ｙ１｜^ａ＋｜ｘ２−ｙ２｜^ａ＋…＋｜ｘｎ−ｙｎ｜^ａ）（１）
ここで、２つの特徴ベクトルｘ、ｙはそれぞれｎ次元であるとする。この際、必要な２つのパラメータａ，ｂは予め、評価用のサンプルで、最も識別性能が良くなるように定めておけばよい。

ステップＳ３３で部分特徴類似度算出部６３は、次のような判断を行う。即ち、ステップＳ３１で取得した登録オブジェクト辞書データに対応するオブジェクトと同じオブジェクト（同一ID）について登録されている全ての登録オブジェクト辞書データに対して部分領域ごとの類似度を求めたか否かを判断する。例えば、ステップＳ３１で取得した登録オブジェクト辞書データがＩＤ＝１のオブジェクトの辞書データである場合、ステップＳ３３では、ＩＤ＝１のオブジェクトの全ての登録オブジェクト辞書データに対して、部分領域ごとの類似度を求めたか否かを判断する。

この判断の結果、求めたと判断した場合には、処理はステップＳ３４に進む。一方、求めていないと判断した場合には、処理はステップＳ３１に戻り、登録オブジェクト辞書データ取得部６２は、先に取得した登録オブジェクト辞書データに対応するオブジェクトと同じオブジェクトの未取得登録オブジェクト辞書データを取得する。

ステップＳ３４では、部分特徴類似度統合部６４は、ステップＳ３２で求めた類似度群を、部分領域ごとに統合する。例えば、１つのオブジェクトに対して、３つの登録画像（登録オブジェクト辞書データ）があった場合、入力オブジェクトと登録オブジェクトに関して、１つの部分領域について、３つの類似度が求められることになる。この同一部分領域に対する３つの類似度の平均値、最大値、中央値のうち何れか１つを求め、求めた値を該３つの類似度を統合した値とすることで、部分領域類似度単位で類似度を統合することが出来る。さらに、部分特徴類似度統合部６４は、部分特徴ごとに統合した類似度を、同様にして１つの類似度に統合し、これを統合類似度として求める。

統合の方法は、例えば、上記のように単純な平均でもよいし、最大値や中央値を取るようにしてもよい。また、類似度が大きい値が上位に来るようにソートして、全体に対して所定の割合で上位にある類似度だけを平均（以下、降順ソート上位平均と呼ぶ）して、統合類似度としてもよい。このようにすることによって、複数枚の登録画像がある場合に、より類似度が高いところだけを用いて統合することが可能になり、認識性能を向上させることができる。

ステップＳ３５では、統合類似度変換部６５は、ステップＳ３４で最終的に統合した１つの統合類似度を変換する。ここで、統合類似度の変換は以下のようにして行う。例えばＩＤ＝１のオブジェクトに対してＮ枚の登録画像（Ｎ個の登録オブジェクト辞書データ）がある場合に、以下の式によって統合類似度から登録画像の枚数に応じた所定値を減じる。

Ｓ’＝Ｓ−θ（Ｎ）（２）
ここで、Ｓは変換前の統合類似度、Ｓ’は変換後の統合類似度、θ（Ｎ）は、登録画像数（登録オブジェクト辞書データ数）Ｎに応じて変わる所定値である。統合類似度の変換は以下の式に従って行ってもよい。

Ｓ’＝Ｓ／θ（Ｎ）（３）
このように、統合類似度は、θ（Ｎ）の値が大きいほどより小さい値に変換される。θ（Ｎ）はＮが決まると一意に値が決まる関数（テーブル）であり、このθ（Ｎ）の決定方法については後述する。

ステップＳ３１〜Ｓ３５の処理が、オブジェクト登録部５に登録されている全ての登録オブジェクト辞書データについて行われた場合（すべての登録オブジェクト辞書データについて統合類似度を求めた場合）には、処理はステップＳ３６を介して終了する。一方、ステップＳ３１〜Ｓ３５の処理が、オブジェクト登録部５に登録されている全ての登録オブジェクト辞書データについて行われていない場合には、処理はステップＳ３６を介してステップＳ３１に戻る。そして登録オブジェクト辞書データ取得部６２は、未取得の登録オブジェクト辞書データをオブジェクト登録部５から取得し、以降の処理を行う。

以上の処理により、オブジェクト登録部５に登録されているそれぞれの登録オブジェクト（実際には該登録オブジェクトに対する１以上の辞書データ）に対して変換済み統合類似度を求めることができる。

また、上記のように、同一オブジェクトに対する登録画像数に応じて変換を行うことによって、登録画像数のばらつきがある場合に、類似度も登録画像数に依存して、ばらついてしまうことを防ぐことが出来る。

一般的に、登録画像が多いオブジェクトの類似度は、それと異なるオブジェクトであっても、たまたま似てしまう確率が高まり、結果的に他の登録画像が少ないオブジェクトより類似度が高めに出てしまう確率も高まる。さらに、上記例で説明したように、部分領域ごとの類似度を、複数登録画像をまたいで最大値をとって統合する方式を用いた場合、この傾向はより顕著となる。即ち、登録画像の多いオブジェクトの方が、より大きい類似度をもつ部分領域を用いて判定する確率が高まり、登録枚数の少ないオブジェクトとの類似度より、値が高めになる傾向が強まる。

このような現象を防ぐために、上記のように登録枚数に応じて、類似度を適切に変換することによって、登録枚数が多いオブジェクトでも、少ないオブジェクトでも公平な比較が可能になる。

＜θ（Ｎ）の決定方法＞
以下で説明するθ（Ｎ）の決定処理は、オブジェクト識別装置内で行うこともできるが、典型的には、予めオフラインで行う。いずれにせよ、θ（Ｎ）は予め求めておき、使用時にはオブジェクト識別装置にすでに格納されている。以下の式は、θ（Ｎ）の決定に関係する式である。

FAR：FRR ＝１：（α＋βＮ^ａ）（４）
ここで、α、βは任意の係数であり、Ｎ^ａは、登録画像枚数Ｎのａ乗（ａは任意の実数）を意味する。FARは入力オブジェクトに対応する登録オブジェクトとは異なる登録オブジェクトを、入力オブジェクトと同一オブジェクトであると誤って受け入れてしまう誤り率（False Acceptance Rate）を意味する。FRRは入力オブジェクトに対応する登録オブジェクトを、入力オブジェクトとは異なるオブジェクトであると誤って拒否する誤り率（False Reject Rate）を意味する。

上記の式（２）や式（３）で用いるθ（Ｎ）は、予め評価用の画像に対して、式（４）を満たすように定めると良い。θ（Ｎ）を決定するための処理について、同処理のフローチャートを示す図１１を用いて説明する。この処理をオブジェクト識別装置が実行する場合には、該オブジェクト識別装置が有するＣＰＵなどの実行部がこの処理を実行することになる。また、この処理をオブジェクト識別装置以外の他装置が実行する場合には、該他装置が有するＣＰＵなどの実行部がこの処理を実行することになる。

ステップＳ４０では、オブジェクトが写っている評価用の画像を取得する。ステップＳ４１では、目標となるFARとFRRとを設定する。これは、式（４）で登場した係数α、β、aを定めることに相当する。一般に、これらの適切な値は、認識対象や、使用目的（セキュリティ向けや検索向けなど）によって異なる。例えば人の顔による個人認証を、セキュリティ目的で使用することを考える場合は、FRR、即ち本人拒否誤りに対して、FAR、即ち他人受け入れ誤りを出来るだけ小さくする必要があるので、αは比較的大きい値に設定する。セキュリティ用途では、αを100程度にするとよい。βとaは登録画像数に応じてFARとFRRの比率を変動させる度合いを決めるパラメータなので、典型的には、βの絶対値はαに比べて小さく（αの百分の１程度）し、aは1.0や0.5など比較的小さな値にすると良い。また、登録画像数Ｎが増加すると、一般に類似度が増加する傾向があり、したがってFARが増加し、FRRが減少することになるので、βをマイナスの値にするとよい。

ステップＳ４２では、評価用の画像群のうち、登録画像数を設定する。例えば、評価用の画像群を、登録用の画像と入力用の画像に分けた場合、登録用の画像を、実際に何枚登録するか設定する。この際、複数種類のオブジェクト（人間の顔の場合は、異なる人物）の画像を登録する場合、全て登録画像数を統一する（人物が異なっても、全て同じ数の画像を登録する）。

次に、ステップＳ４３では、評価用の画像に対してFARとFRRを計測し、θ（Ｎ）を探索する。これは、以下のようにして行う。例えば、ステップＳ４２で登録画像数をＭと設定した場合、Ｍ毎の評価用画像のそれぞれに対し、既に説明した手順で識別評価を行って、類似度を計測する。その際、類似度変換は行わないようにする。

そして、登録画像数がＭの登録オブジェクト（オブジェクトＡとする）との類似度が、ある値（φとする）より大きければ、入力オブジェクトはオブジェクトＡ、小さければオブジェクトＡではない、など判定を行い、FARとFRRを計算する。このφをさまざまな値に設定して、同様にFAR、FRRを計測し、φとFAR、FRRの対応表をつくる。その対応表から、ステップＳ４１で設定したFAR、FRRの比率を満たすφに対応するものをθ（Ｍ）とする。

次に、ステップＳ４４では、予定した登録画像数に達したか判定する。例えば、ステップＳ４２の処理を最初に行った場合には、登録画像数を１とし、２回目に行った場合には登録画像数を２とし、Ｎ回目に行った場合には登録画像数をＮとする。ここで、予定した登録画像数をＮとすると、上記の処理によれば、θ（１）、θ（２）、…、θ（Ｎ）を生成することができる。

予定数に達した場合、処理を終了し、そうでない場合、ステップＳ４２以降の処理を繰り返す。登録画像数の上限は、一般にいくつでもよいが、典型的には100程度まで行えば十分である。それ以上の場合はθ（Ｎ）を一定値にすればよい。

上記の処理例では、予めα、β、aを定め、登録画像数Ｎに関わらず、一定としてθ（Ｎ）を求めたが、変形例として、登録画像数Ｎに応じて、α、β、aを変えながら、θ（Ｎ）を探索するようにしてもよい。

なお、以上で説明した構成は、次のような第１の構成の一例に過ぎず、第１の構成の一例には様々な構成が考え得る。第１の構成では、着目オブジェクトのＮ（Ｎは自然数）枚の画像のそれぞれから予め抽出された、該画像中の該着目オブジェクトの部分領域ごとの特徴ベクトル、を保持しておく。そして、Ｎ枚の画像のそれぞれに対し、該画像から予め抽出されている着目オブジェクトの部分領域ごとの特徴ベクトルと、入力画像中のオブジェクトの部分領域ごとの特徴ベクトルと、で対応する部分領域の特徴ベクトル間の類似度を求める（算出）。そして、該求めた類似度群から１つの類似度を求め、該求めた１つの類似度を、上記Ｎ枚の画像中の対象オブジェクトの識別処理の誤り率に基づいて予め設定されている値に応じて減少させる。そして、該減少後の類似度を、入力画像中のオブジェクトと、着目オブジェクトと、の類似度として出力する。ここで、予め設定されている値は、次のような条件を満たす値である。

・Ｎ枚の画像中の対象オブジェクトの識別処理を行った場合に、該対象オブジェクトとは異なるオブジェクトを該対象オブジェクトとして識別する率と、該対象オブジェクトと同一のオブジェクトを該対象オブジェクトは異なるオブジェクトとして識別する率と、の比が予め定められた比となるように、該識別処理において対象オブジェクトの特徴ベクトルとの類似度判定に用いる閾値
［第２の実施形態］
第１の実施形態では、部分特徴ごとに統合した類似度をさらに１つの類似度に統合し、該１つの類似度に対して、登録画像数に応じた変換を行っていたが、本実施形態では、統合前のそれぞれの類似度に対して変換を行う点が第１の実施形態と異なる。以下では、第１の実施形態との差分のみについて説明し、以下で特にふれない限りは、第１の実施形態と同様であるとする。また、本実施形態で使用するオブジェクト識別装置の構成については第１の実施形態で説明したものと同様であるため、これに係る説明は省略する。

以下では、第１の実施形態との大きな差分である、入力オブジェクト識別部６の動作について説明する。本実施形態に係る入力オブジェクト識別部６が行う処理について、同処理のフローチャートを示す図１２を用いて説明する。なお、本実施形態では、入力オブジェクト識別演算部４３において、部分特徴類似度統合部６４及び統合類似度変換部６５の配置が逆となり、且つそれぞれの機能部における処理は第１の実施形態と若干異なる。

ステップＳ１３０では、入力オブジェクト識別用データ取得部６１は、入力オブジェクト識別用データ生成部４１から入力オブジェクト識別用データを取得する。ステップＳ１３１では、登録オブジェクト辞書データ取得部６２は、登録オブジェクト辞書データ取得部４２から登録オブジェクト辞書データを取得する。

次に、ステップＳ１３２では、部分特徴類似度算出部６３は、登録オブジェクト辞書データと、入力オブジェクト識別用データと、を比較して、対応する部分領域ごとに特徴ベクトルの類似度を算出する。類似度の算出方法は第１の実施形態で説明したとおりである。

ステップＳ１３３では、統合類似度変換部６５は、ステップＳ１３２で求めたそれぞれの類似度を変換する。類似度の変換方法については第１の実施形態と同様、所定値を減じる方法や所定値で除算する方法がある。

ここで、所定値の決め方は、第１の実施形態で説明した手順と同じ手順を部分領域ごとに行うことで実現できる。しかし、処理量が増大するので、部分領域ごとに所定値を決定する場合に適した方法を取るのが望ましい。この部分領域ごとに所定値を決める場合に適した方法については後述する。

ステップＳ１３４で部分特徴類似度算出部６３は、次のような判断を行う。即ち、ステップＳ１３１で取得した登録オブジェクト辞書データに対応するオブジェクトと同じオブジェクト（同一ID）について登録されている全ての登録オブジェクト辞書データに対して部分領域ごとの類似度を求めたか否かを判断する。この判断の結果、求めたと判断した場合には、処理はステップＳ１３５に進む。一方、求めていないと判断した場合には、処理はステップＳ１３１に戻り、登録オブジェクト辞書データ取得部６２は、先に取得した登録オブジェクト辞書データに対応するオブジェクトと同じオブジェクトの未取得登録オブジェクト辞書データを取得する。

ステップＳ１３５では、部分特徴類似度統合部６４は、ステップＳ１３３で変換した類似度群を、部分領域ごとに統合する。そして部分特徴類似度統合部６４は、部分領域ごとに統合した類似度を１つの類似度に統合し、これを統合類似度とする。類似度の統合方法は第１の実施形態と同様である。

ステップＳ１３１〜Ｓ１３５の処理が、オブジェクト登録部５に登録されている全ての登録オブジェクト辞書データについて行われた場合には、処理はステップＳ１３６を介して終了する。一方、ステップＳ１３１〜Ｓ１３５の処理が、オブジェクト登録部５に登録されている全ての登録オブジェクト辞書データについて行われていない場合には、処理はステップＳ１３６を介してステップＳ１３１に戻る。

本実施形態では、部分特徴の類似度ごとに登録画像数に応じて、類似度変換を行ったが、これにより、よりきめ細かい類似度変換の制御が可能になり、登録画像数のばらつきによる認識性能への影響を抑えることが可能になる。具体的には、登録画像数に依存しやすい部分領域とそうでない部分領域とで、変換方法を変えることが出来るので、より好適に類似度変換を制御することが可能になると考えられる。

＜θ（Ｎ）の決定方法＞
以下では、登録画像数に応じて、部分領域間における特徴ベクトルの類似度を変換するために用いるθ（Ｎ）を決定する方法について説明する。本実施形態にように、部分領域ごとにθ（Ｎ）を決定する場合でも、第１の実施形態と同じように、予め性能評価用の画像群を用意し、部分領域ごとにFARとFRRを計測することによって、θ（Ｎ）を決定することも可能である。しかし、部分領域ごと、さらに登録画像枚数ごとにFARとFRRを求めると、処理量が大幅に増加するので、ここでは違う方法について説明する。具体的には、θ（Ｎ）の決定に必要な性能測定を少数の条件で行い、残りは補間、ないし、補外によって求める。

θ（Ｎ）を決定するための処理について、同処理のフローチャートを示す図１３を用いて説明する。この処理をオブジェクト識別装置が実行する場合には、該オブジェクト識別装置が有するＣＰＵなどの実行部がこの処理を実行することになる。また、この処理をオブジェクト識別装置以外の他装置が実行する場合には、該他装置が有するＣＰＵなどの実行部がこの処理を実行することになる。

ステップＳ１４０では、対象となる全部分領域のうち未選択の部分領域を選択する。この選択処理では、ユーザが適当なユーザインターフェースを操作することで指定した部分領域を選択してもよいし、予め定められた部分領域を選択してもよい。

ステップＳ１４１では、オブジェクトが写っている評価用の画像を取得する。ステップＳ１４２では、１枚の評価用画像において、ステップＳ１４０で選択した部分領域について求めた類似度のヒストグラムを作成する。ここでは、入力オブジェクトと同じオブジェクトが写っている１枚の評価用画像からのヒストグラムＨＳ１、入力オブジェクトと異なるオブジェクトが写っている１枚の評価用画像からのヒストグラムＨＤ１、の２つを作成することができる。同様に、Ｎ枚の評価用画像において、ステップＳ１４０で選択した部分領域について求めた類似度のヒストグラムを作成する。ここでは、入力オブジェクトと同じオブジェクトが写っているＮ枚の評価用画像からのヒストグラムＨＳＮ、入力オブジェクトと異なるオブジェクトが写っているＮ枚の評価用画像からのヒストグラムＨＤＮ、の２つを作成することができる。

ヒストグラムの計測条件として、登録画像数があるが、典型的には、上記のように、登録画像数が１枚である場合と、θ（Ｎ）を求めたい最大の登録画像数（ここではＮ）の２つの場合を計測する。後述するように、この２つの場合の類似度ヒストグラムを評価することによって、部分領域の類似度変換式に関するθ（Ｎ）を推定することができる。

ステップＳ１４３では、評価用画像群のうち、登録画像数を設定する。例えば、評価用の画像群を、登録用の画像と入力用の画像に分けた場合、登録用の画像を、実際に何枚登録するか設定する。この際、複数種類のオブジェクト（人間の顔の場合は、異なる人物）の画像を登録する場合、全て登録画像数を統一する（人物が異なっても、全て同じ数の画像を登録する）。

次に、ステップＳ１４４では、ステップＳ１４２で作成したヒストグラムからFARとFRRを推定し、θ（１）、θ（Ｎ）を探索する。ヒストグラムからFARおよびFRRを推定する為には様々な手法が考えられるが、最も単純には、以下のような手法がある。以下、これを説明する。

まず、ＨＳ１，ＨＤ１，ＨＳＮ，ＨＤＮの４つのヒストグラムに対して、ある値（φとする）を閾値として判定を行う。例えば、ＨＤ１，ＨＤＮで、φ以上になっているビンの値は全てFARになる。同様に、ＨＳ１，ＨＳＮでφ以下の類似度になっている場合は、全てFRRになる。このように計測済みの全てのヒストグラムから閾値がφである場合のFARとFRRをそれぞれ求める。そして、このφをさまざまな値に設定して、同様にFAR、FRRを推定し、φとFAR、FRRの対応表をつくる。このように、登録画像数とφ、FAR、FRRの組合せを取得することが出来るので、この組合せから、第１の実施形態と同様に、式（４）の関係を持つようにθ（１）、θ（Ｎ）を決定することが出来る。本実施形態では、θ（１）とθ（Ｎ）とを求めることができるので、θ（２）〜θ（Ｎ−１）は、θ（１）とθ（Ｎ）とを用いた線形補間で求めることができる。ステップＳ４２で登録画像数をＭと設定した場合、本ステップではこのような線形補間により、θ（Ｍ）を求める。

次に、ステップＳ１４５では、予定した登録画像数に達したか判定する。予定数に達した場合、処理を終了し、そうでない場合、ステップＳ１４３以降の処理を繰り返す。登録画像数の上限は、一般にいくつでもよいが、典型的には100程度まで行えば十分である。それ以上の場合はθ（Ｎ）を一定値にすればよい。

ステップＳ１４６では、全ての部分領域を選択したのか否かを判断する。この判断の結果、全ての部分領域を選択したのであれば、本処理は終了し、未選択の部分領域が残っている場合には、処理はステップＳ１４０に戻る。このように、本実施形態では、θ（Ｎ）は、着目部分領域及びＮに対して予め設定されている値であり、以下のような性質を有する値である。

・Ｎ枚の画像中の対象オブジェクトの識別処理を行った場合に、着目部分領域に関し、該対象オブジェクトとは異なるオブジェクトを該対象オブジェクトとして識別する率と、該対象オブジェクトと同一のオブジェクトを該対象オブジェクトは異なるオブジェクトとして識別する率と、の比が予め定められた比となるように、該識別処理において対象オブジェクトの特徴ベクトルとの類似度判定に用いる閾値
このように、第１，２の実施形態によれば、辞書画像と評価画像との比較結果である類似度スコアに対して、登録枚数に応じた所定の変換を施すことによって、登録人物によって登録画像のばらつきがある場合でも高精度な識別を行うことができる。

（その他の実施例）
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア（プログラム）を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ（またはＣＰＵやＭＰＵ等）がプログラムを読み出して実行する処理である。

Claims

着目オブジェクトのＮ（Ｎは自然数）枚の画像のそれぞれから予め抽出された、該画像中の該着目オブジェクトの部分領域ごとの特徴ベクトル、を保持する手段と、
前記Ｎ枚の画像のそれぞれに対し、該画像から予め抽出されている前記着目オブジェクトの部分領域ごとの特徴ベクトルと、入力画像中のオブジェクトの部分領域ごとの特徴ベクトルと、で対応する部分領域の特徴ベクトル間の類似度を求める算出手段と、
前記算出手段が求めた類似度群から１つの類似度を求め、該求めた１つの類似度を、前記Ｎ枚の画像中の対象オブジェクトの識別処理の誤り率に基づいて予め設定されている値に応じて減少させ、該減少後の類似度を、前記入力画像中のオブジェクトと、前記着目オブジェクトと、の類似度として出力する出力手段と
を備えることを特徴とする情報処理装置。
前記予め設定されている値は、
Ｎ枚の画像中の対象オブジェクトの識別処理を行った場合に、該対象オブジェクトとは異なるオブジェクトを該対象オブジェクトとして識別する率と、該対象オブジェクトと同一のオブジェクトを該対象オブジェクトは異なるオブジェクトとして識別する率と、の比が予め定められた比となるように、該識別処理において前記対象オブジェクトの特徴ベクトルとの類似度判定に用いる閾値
であることを特徴とする請求項１に記載の情報処理装置。
前記出力手段は、
部分領域ごとに、該部分領域について求めた類似度群から１つの類似度を求める手段と、
部分領域ごとに求めた前記１つの類似度から１つの類似度を統合類似度として求める手段と、
前記統合類似度を、前記予め設定されている値に応じて減少させ、該減少後の類似度を、前記入力画像中のオブジェクトと、前記着目オブジェクトと、の類似度として出力する手段と
を備えることを特徴とする請求項１又は２に記載の情報処理装置。
前記出力手段は、
部分領域ごとに、該部分領域について求めた類似度群の、平均値、最大値、中央値の何れか１つを求め、部分領域ごとに求めた該１つのうち、平均値、最大値、中央値を前記統合類似度として求めることを特徴とする請求項３に記載の情報処理装置。
着目オブジェクトのＮ（Ｎは自然数）枚の画像のそれぞれから予め抽出された、該画像中の該着目オブジェクトの部分領域ごとの特徴ベクトル、を保持する手段と、
前記Ｎ枚の画像のそれぞれに対し、該画像から予め抽出されている前記着目オブジェクトの部分領域ごとの特徴ベクトルと、入力画像中のオブジェクトの部分領域ごとの特徴ベクトルと、で対応する部分領域の特徴ベクトル間の類似度を求める算出手段と、
前記算出手段が求めたそれぞれの類似度を、該類似度を求めた部分領域及び前記Ｎ枚の画像中の対象オブジェクトの識別処理の誤り率に基づいて予め設定されている値に応じて減少させ、該減少後のそれぞれの類似度から１つの類似度を求め、該求めた１つの類似度を、前記入力画像中のオブジェクトと、前記着目オブジェクトと、の類似度として出力する出力手段と
を備えることを特徴とする情報処理装置。
着目部分領域及び前記予め設定されている値は、
Ｎ枚の画像中の対象オブジェクトの識別処理を行った場合に、前記着目部分領域に関し、該対象オブジェクトとは異なるオブジェクトを該対象オブジェクトとして識別する率と、該対象オブジェクトと同一のオブジェクトを該対象オブジェクトは異なるオブジェクトとして識別する率と、の比が予め定められた比となるように、該識別処理において前記対象オブジェクトの特徴ベクトルとの類似度判定に用いる閾値
であることを特徴とする請求項５に記載の情報処理装置。
前記出力手段は、
部分領域ごとに、該部分領域について求めた前記減少後の類似度群から１つの類似度を求める手段と、
部分領域ごとに求めた前記１つの類似度から１つの類似度を統合類似度として求める手段と、
前記統合類似度を、前記入力画像中のオブジェクトと、前記着目オブジェクトと、の類似度として出力する手段と
を備えることを特徴とする請求項５に記載の情報処理装置。
前記出力手段は、
部分領域ごとに、該部分領域について求めた前記減少後の類似度群の、平均値、最大値、中央値の何れか１つを求め、部分領域ごとに求めた該１つのうち、平均値、最大値、中央値を前記統合類似度として求めることを特徴とする請求項７に記載の情報処理装置。
着目オブジェクトのＮ（Ｎは自然数）枚の画像のそれぞれから予め抽出された、該画像中の該着目オブジェクトの部分領域ごとの特徴ベクトル、を保持する情報処理装置が行う情報処理方法であって、
前記情報処理装置の算出手段が、前記Ｎ枚の画像のそれぞれに対し、該画像から予め抽出されている前記着目オブジェクトの部分領域ごとの特徴ベクトルと、入力画像中のオブジェクトの部分領域ごとの特徴ベクトルと、で対応する部分領域の特徴ベクトル間の類似度を求める算出工程と、
前記情報処理装置の出力手段が、前記算出工程で求めた類似度群から１つの類似度を求め、該求めた１つの類似度を、前記Ｎ枚の画像中の対象オブジェクトの識別処理の誤り率に基づいて予め設定されている値に応じて減少させ、該減少後の類似度を、前記入力画像中のオブジェクトと、前記着目オブジェクトと、の類似度として出力する出力工程と
を備えることを特徴とする情報処理方法。
前記予め設定されている値は、
Ｎ枚の画像中の対象オブジェクトの識別処理を行った場合に、該対象オブジェクトとは異なるオブジェクトを該対象オブジェクトとして識別する率と、該対象オブジェクトと同一のオブジェクトを該対象オブジェクトは異なるオブジェクトとして識別する率と、の比が予め定められた比となるように、該識別処理において前記対象オブジェクトの特徴ベクトルとの類似度判定に用いる閾値
であることを特徴とする請求項９に記載の情報処理方法。
着目オブジェクトのＮ（Ｎは自然数）枚の画像のそれぞれから予め抽出された、該画像中の該着目オブジェクトの部分領域ごとの特徴ベクトル、を保持する情報処理装置が行う情報処理方法であって、
前記情報処理装置の算出手段が、前記Ｎ枚の画像のそれぞれに対し、該画像から予め抽出されている前記着目オブジェクトの部分領域ごとの特徴ベクトルと、入力画像中のオブジェクトの部分領域ごとの特徴ベクトルと、で対応する部分領域の特徴ベクトル間の類似度を求める算出工程と、
前記情報処理装置の出力手段が、前記算出工程で求めたそれぞれの類似度を、該類似度を求めた部分領域及び前記Ｎ枚の画像中の対象オブジェクトの識別処理の誤り率に基づいて予め設定されている値に応じて減少させ、該減少後のそれぞれの類似度から１つの類似度を求め、該求めた１つの類似度を、前記入力画像中のオブジェクトと、前記着目オブジェクトと、の類似度として出力する出力工程と
を備えることを特徴とする情報処理方法。
着目部分領域及び前記予め設定されている値は、
Ｎ枚の画像中の対象オブジェクトの識別処理を行った場合に、前記着目部分領域に関し、該対象オブジェクトとは異なるオブジェクトを該対象オブジェクトとして識別する率と、該対象オブジェクトと同一のオブジェクトを該対象オブジェクトは異なるオブジェクトとして識別する率と、の比が予め定められた比となるように、該識別処理において前記対象オブジェクトの特徴ベクトルとの類似度判定に用いる閾値
であることを特徴とする請求項１１に記載の情報処理方法。
コンピュータを、請求項１ないし８の何れか１項に記載の情報処理装置の各手段として機能させるためのコンピュータプログラム。