JP2013161109A

JP2013161109A - 情報処理装置、情報処理方法、及びプログラム

Info

Publication number: JP2013161109A
Application number: JP2012019827A
Authority: JP
Inventors: Shunsuke Mochizuki; 俊助望月; Tomohiko Goto; 智彦後藤
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2012-02-01
Filing date: 2012-02-01
Publication date: 2013-08-19

Abstract

【課題】少ない計算量で、識別対象を精度良く識別する。
【解決手段】特徴量抽出部は、コンテンツから、第１の識別対象と同一の対象であるか否かが識別される第２の識別対象を抽出し、抽出した第２の識別対象から、第２の識別対象の特徴量を抽出し、スコア算出部は、第１の識別対象との類似の程度を表す第１の類似スコアが算出される算出対象の特徴量と、第２の識別対象の特徴量に基づいて、算出対象と第２の識別対象との類似の程度を表す第２の類似スコアを算出し、識別部は、複数の異なる算出対象毎に、第１の類似スコアと第２の類似スコアを比較して得られる比較結果に基づいて、第１の識別対象と第２の識別対象とが同一の対象であるか否かを識別する。本開示は、例えばコンテンツを記憶するコンピュータなどに適用できる。
【選択図】図２

Description

本開示は、情報処理装置、情報処理方法、及びプログラムに関し、特に、例えば、少ない計算量で、識別対象を精度良く識別できるようにした情報処理装置、情報処理方法、及びプログラムに関する

従来、例えば、予め行われる学習により得られた識別器（関数）を用いて、画像上に存在する顔などが、所定の人物の顔であるか否かを識別する識別方法が存在する（例えば、特許文献１乃至３参照）。

なお、識別器は、例えば、大量の学習用画像を用いて、ブースティング(boosting)やバギング(bagging)などの機械学習により学習される。

特開２０１１−３４５８１号公報特開２０１０−２７１８６１号公報特開２００９―８０６７８号公報

上述したように、従来の識別方法では、大量の学習用画像を用いて識別器を学習させる必要があり、この学習には、膨大な計算量が必要であった。

特に、例えば、ブースティングによる機械学習では、所定の処理が再帰的に繰り返されて識別器が学習されるため、計算量がより膨大となってしまっていた。

本開示は、このような状況に鑑みてなされたものであり、例えば、学習に膨大な計算を要する識別器を用いることなく、少ない計算量で識別対象を精度良く識別できるようにするものである。

本開示の一側面の情報処理装置は、コンテンツから、第１の識別対象と同一の対象であるか否かが識別される第２の識別対象を抽出する識別対象抽出部と、抽出された前記第２の識別対象から、前記第２の識別対象の特徴量を抽出する特徴量抽出部と、前記第１の識別対象との類似の程度を表す第１の類似スコアが算出される算出対象の特徴量と、前記第２の識別対象の特徴量に基づいて、前記算出対象と前記第２の識別対象との類似の程度を表す第２の類似スコアを算出する類似スコア算出部と、複数の異なる前記算出対象毎に、前記第１の類似スコアと前記第２の類似スコアを比較して得られる比較結果に基づいて、前記第１の識別対象と前記第２の識別対象とが同一の対象であるか否かを識別する識別部とを含む情報処理装置である。

特徴量を定義する特徴量空間上における、前記第１の識別対象の特徴量と前記第２の識別対象の特徴量との距離を算出する距離算出部をさらに設けることができ、前記識別部は、前記距離にも基づいて、前記第１の識別対象と前記第２の識別対象とが同一の対象であるか否かを識別することができる。

前記識別部は、前記距離が第１の閾値以下である場合、前記第１の識別対象と前記第２の識別対象とが同一の対象であると識別し、前記距離が前記第１の閾値よりも大である場合、前記比較結果に基づいて、前記第１の識別対象と前記第２の識別対象とが同一の対象であるか否かを識別することができる。

前記識別部は、前記第１の類似スコア又は前記第２の類似スコアの少なくとも一方が第２の閾値以上とされた前記複数の異なる算出対象毎に、前記第１の類似スコアと前記第２の類似スコアを比較して得られる比較結果に基づいて、前記第１の識別対象と前記第２の識別対象とが同一の対象であるか否かを識別することができる。

前記識別部は、前記第１の類似スコア又は前記第２の類似スコアの少なくとも一方が前記第２の閾値以上とされた前記算出対象の個数が予め決められた個数以上である場合のみ、前記比較結果に基づいて、前記第１の識別対象と前記第２の識別対象とが同一の対象であるか否かを識別することができる。

前記類似スコア算出部は、前記算出対象の特徴量と、前記第２の識別対象の特徴量に基づいて、予め決められた複数の値のいずれかを、前記第２の類似スコアとして算出し、前記識別部は、前記第１の類似スコアと前記第２の類似スコアとが一致する回数を、前記第１の類似スコア又は前記第２の類似スコアの少なくとも一方が予め決められた類似スコア以上とされた回数で除算した除算結果が、第３の閾値以上であるとの比較結果に基づいて、前記第１の識別対象と前記第２の識別対象とが同一の対象であると識別することができる。

前記類似スコア算出部は、ユーザの指示操作により、前記算出対象と前記第２の識別対象とが同一の対象であるか否かが指示されている場合、前記第２の類似スコアの算出結果に拘らず、前記第２の類似スコアをユーザの指示操作に応じた値とすることができる。

前記類似スコア算出部は、特徴量を定義する特徴量空間上における、第１の前記算出対象の特徴量と第２の前記算出対象の特徴量との距離が、予め決められた距離未満である場合、前記第１の算出対象、及び前記第２の算出対象を、１個の算出対象として、前記第２の類似スコアを算出することができる。

前記コンテンツは、複数の画像により構成される動画であり、前記識別対象抽出部は、前記動画を構成する前記複数の画像のうちの所定の画像から、前記第２の識別対象を抽出した後、前記所定の画像よりも未来方向の画像を対象として、前記第２の識別対象をトラッキングし、トラッキングしている前記第２の識別対象を抽出の対象から除外することができる。

本開示の一側面の情報処理方法は、所定の識別対象を識別する情報処理装置の情報処理方法であって、前記情報処理装置による、コンテンツから、第１の識別対象と同一の対象であるか否かが識別される第２の識別対象を抽出する識別対象抽出ステップと、抽出された前記第２の識別対象から、前記第２の識別対象の特徴量を抽出する特徴量抽出ステップと、前記第１の識別対象との類似の程度を表す第１の類似スコアが算出される算出対象の特徴量と、前記第２の識別対象の特徴量に基づいて、前記算出対象と前記第２の識別対象との類似の程度を表す第２の類似スコアを算出する類似スコア算出ステップと、複数の異なる前記算出対象毎に、前記第１の類似スコアと前記第２の類似スコアを比較して得られる比較結果に基づいて、前記第１の識別対象と前記第２の識別対象とが同一の対象であるか否かを識別する識別ステップとを含む情報処理方法である。

本開示の一側面のプログラムは、コンピュータを、コンテンツから、第１の識別対象と同一の対象であるか否かが識別される第２の識別対象を抽出する識別対象抽出部と、抽出された前記第２の識別対象から、前記第２の識別対象の特徴量を抽出する特徴量抽出部と、前記第１の識別対象との類似の程度を表す第１の類似スコアが算出される算出対象の特徴量と、前記第２の識別対象の特徴量に基づいて、前記算出対象と前記第２の識別対象との類似の程度を表す第２の類似スコアを算出する類似スコア算出部と、複数の異なる前記算出対象毎に、前記第１の類似スコアと前記第２の類似スコアを比較して得られる比較結果に基づいて、前記第１の識別対象と前記第２の識別対象とが同一の対象であるか否かを識別する識別部として機能させるためのプログラムである。

本開示によれば、コンテンツから、第１の識別対象と同一の対象であるか否かが識別される第２の識別対象が抽出され、抽出された前記第２の識別対象から、前記第２の識別対象の特徴量が抽出され、前記第１の識別対象との類似の程度を表す第１の類似スコアが算出される算出対象の特徴量と、前記第２の識別対象の特徴量に基づいて、前記算出対象と前記第２の識別対象との類似の程度を表す第２の類似スコアが算出され、複数の異なる前記算出対象毎に、前記第１の類似スコアと前記第２の類似スコアを比較して得られる比較結果に基づいて、前記第１の識別対象と前記第２の識別対象とが同一の対象であるか否かが識別される。

本開示によれば、例えば、学習に膨大な計算を要する識別器を用いることなく、少ない計算量で識別対象を精度良く識別することが可能となる。

第１の実施の形態の概要を説明するための図である。第１の実施の形態である情報処理装置の構成例を示すブロック図である。特徴量抽出部が行う特徴量抽出処理の一例を示す図である。スコア算出部が算出した類似スコアの一例を示す図である。スコア算出部の２値化により得られた２値化スコアの一例を示す図である。識別部が行う識別処理の一例を示す図である。識別部が行う識別処理の他の一例を示す図である。識別部による分類結果が、表示画面に表示されたときの一例を示す図である。スコア算出部の３値化により得られた３値化スコアの一例を示す図である。図２の情報処理装置が行う第１のコンテンツ分類処理を説明するためのフローチャートである。図１０のステップＳ１における特徴量抽出処理の詳細を説明するためのフローチャートである。図１０のステップＳ２におけるスコア算出処理の詳細を説明するためのフローチャートである。図１０のステップＳ３における識別処理の詳細を説明するためのフローチャートである。第２の実施の形態の概要を説明するための図である。第２の実施の形態である情報処理装置の構成例を示すブロック図である。図１５の距離算出部が算出した距離の算出結果の一例を示す図である。図１５の情報処理装置が行う第２のコンテンツ分類処理を説明するためのフローチャートである。特徴量抽出部が、動画から識別対象を抽出するときの一例を示す図である。コンピュータの構成例を示すブロック図である。

以下、本開示における実施の形態（以下、実施の形態という）について説明する。なお、説明は以下の順序で行う。
１．第１の実施の形態（類似スコアどうしの比較結果に基づいて、識別対象を識別するときの一例）
２．第２の実施の形態（特徴量空間上の距離にも基づいて、識別対象を識別するときの一例）
３．変形例

<１．第１の実施の形態>
[第１の実施の形態の概要]
図１は、第１の実施の形態の概要を示している。

なお、図１には、図中水平方向と垂直方向に、それぞれ、顔a1,a2,b1,b2,b3が示されている。顔a1,a2は、人物Aの顔を表しており、顔b1,b2,b3は、人物Aとは異なる人物Bの顔を表している。

また、図１には、図中水平方向に並ぶ顔a1,a2,b1,b2,b3と、図中垂直方向に並ぶ顔a1,a2,b1,b2,b3とが、それぞれ、同一の人物の顔であるか否かを表す数字（０又は１）が示されている。ここで、数字「0」は同一の人物の顔ではないことを表し、数字「1」は同一の人物の顔であることを表す。

すなわち、図１において、１行目には、顔a1が、顔a1,a2,b1,b2,b3のそれぞれと同一であるか否かを表す数字「1,1,0,0,0」が、２行目には、顔a2が、顔a1,a2,b1,b2,b3のそれぞれと同一であるか否かを表す数字「1,1,1,0,0」が示されている。

また、図１において、３行目には、顔b1が、顔a1,a2,b1,b2,b3のそれぞれと同一であるか否かを表す数字「0,1,1,1,1」が、４行目には、顔b2が、顔a1,a2,b1,b2,b3のそれぞれと同一であるか否かを表す数字「0,0,1,1,1」が示されている。さらに、図１において、５行目には、顔b3が、顔a1,a2,b1,b2,b3のそれぞれと同一であるか否かを表す数字「0,0,1,1,1」が示されている。

本開示では、例えば、顔a1,a2,b1,b2,b3から特徴量を抽出し、抽出した特徴量に基づいて、図中水平方向に並ぶ顔a1,a2,b1,b2,b3と、図中垂直方向に並ぶ顔a1,a2,b1,b2,b3どうしの類似の程度を表す類似スコアを算出する。

また、例えば、本開示では、算出した類似スコアが、予め決められた閾値Th1以上であるか否かに応じて、類似スコアを０又は１の一方に２値化する。

ここで、閾値Th1は、例えば、情報処理装置１や後述の情報処理装置１０１を製造する製造業者等が行う実験などにより、最も識別の精度が高くなるような値に予め設定される。また、閾値Th1は、ユーザの設定操作等により設定（又は変更）するようにしてもよい。このことは、後述するその他の閾値（例えば、閾値Th_ts,Th2,Th3,Th_k,Th_dなど）についても同様である。

さらに、本開示では、例えば、顔a1と顔a2が同一の人物Aの顔であるか否かを識別する場合、１行目に示された顔a1の類似スコア1,1,0,0,0と、２行目に示された顔a2の類似スコア1,1,1,0,0とを比較する。

そして、本開示では、その比較結果に基づいて、顔a1と顔a2が同一の人物Aの顔であるか否かを識別する。

すなわち、例えば、図１に示されるように、顔a1の類似スコア1,1,0,0,0と、顔a2の類似スコア1,1,1,0,0との対応する類似スコアどうしを比較し、対応する類似スコアどうしが、いずれも１となる回数Num1（いまの場合、Num1=2）を算出する。

さらに、例えば、顔a1の類似スコア1,1,0,0,0と、顔a2の類似スコア1,1,1,0,0との対応する類似スコアどうしの少なくとも一方の類似スコアが１となる回数Num2（いまの場合、Num2=3）を算出する。

また、回数Num1を回数Num2で除算し、その除算結果Num1/Num2（いまの場合、Num1/Num2=2/3）を、顔a1と顔a2との類似の程度を総合的に表す総合スコアTS(a1,a2)として算出する。

そして、算出された統合スコアTS(a1,a2)が、予め決められた閾値Th_ts以上である場合に、顔a1と顔a2は同一の人物Aの顔であると識別し、統合スコアTS(a1,a2)が、閾値Th_ts未満である場合に、顔a1と顔a2は同一の人物Aの顔ではないと識別する。

[情報処理装置１の構成例]
図２は、第１の実施の形態である情報処理装置１の構成例を示している。

この情報処理装置１は、コンテンツ記憶部２１、特徴量抽出部２２、スコア算出部２３、識別部２４、表示部２５、操作部２６、及び制御部２７から構成される。

コンテンツ記憶部２１は、コンテンツとして、例えば静止画を記憶（保持）する。なお、コンテンツとしては、静止画に限定されず、動画や、音楽、音声等を採用することができる。第１の実施の形態では、説明を簡単にするために、コンテンツ記憶部２１には、コンテンツとして、静止画が記憶されているものとして説明する。

特徴量抽出部２２は、コンテンツ記憶部２１に保持されているコンテンツから、識別対象の特徴量を抽出する特徴量抽出処理を行う。

すなわち、例えば、特徴量抽出部２２は、コンテンツ記憶部２１に保持されているコンテンツとしての静止画を読み出し、読み出した静止画から、その静止画に写っている識別対象としての顔（を表す画像）を抽出する。そして、特徴量抽出部２２は、抽出した顔から、その顔の特徴を表す特徴量を抽出し、スコア算出部２３に供給する。

なお、特徴量抽出部２２が、例えば、コンテンツ記憶部２１に保持されているコンテンツとしての動画から、顔を抽出する抽出方法の一例については、図１８を参照して詳述する。

次に、図３は、特徴量抽出部２２が行う特徴量抽出処理の一例を示している。

なお、図３A乃至図３Dには、それぞれ、顔a1が写っている静止画４１、顔a2及び顔b1が写っている静止画４２、顔b2が写っている静止画４３、又は顔b3が写っている静止画４４が示されている。

特徴量抽出部２２は、例えば、コンテンツ記憶部２１から、静止画４１乃至４４を読み出す。また、特徴量抽出部２２は、図３Aに示されるように、静止画４１から、顔a1を抽出し、抽出した顔a1（を表す画像）から、顔a1の特徴量x1を抽出して、スコア算出部２３に供給する。

さらに特徴量抽出部２２は、同様にして、図３B乃至図３Dに示されるように、静止画４２から顔a2及び顔b1を、静止画４３から顔b2を、静止画４４から顔b3をそれぞれ抽出する。

そして、特徴量抽出部２２は、抽出した顔a2から顔a2の特徴量x2を、抽出した顔b1から顔b1の特徴量x3を、抽出した顔b2から顔b2の特徴量x4を、抽出した顔b3から顔b3の特徴量x5をそれぞれ抽出して、スコア算出部２３に供給する。

図２に戻る。スコア算出部２３は、特徴量抽出部２２からの特徴量に基づいて、静止画から抽出された顔どうしの類似の程度（度合い）を表す類似スコアScoreを算出し、算出した類似スコアを０又は１の一方の値である２値化スコアScore'に２値化するスコア算出処理を行う。

なお、このスコア算出処理において、類似スコアScoreを算出する処理の詳細は、図４を参照して詳述し、算出した類似スコアScoreを２値化スコアScore'に２値化する処理の詳細は、図５を参照して詳述する。

次に、図４は、スコア算出部２３が行うスコア算出処理において、類似スコアScoreを算出したときの算出結果の一例を示している。

図４には、複数の顔a1,a2,b1,b2,b3のうち、任意の２個の異なる顔どうしの類似スコアScoreが示されている。なお、類似スコアScoreは、例えば、０から１００までの値とされる。

スコア算出部２３は、特徴量抽出部２２から供給される特徴量x1乃至x5に基づいて、図４に示されるような類似スコアScoreを算出する。

具体的には、例えば、スコア算出部２３は、特徴量抽出部２２から供給される特徴量x1乃至x5のうち、顔a1の特徴量x1と顔a2の特徴量x2とに基づいて、顔a1と顔a2との類似スコアScore(x1,x2)=30を算出する。

同様にして、スコア算出部２３は、顔a1と顔b1との類似スコアScore(x1,x3)=10, 顔a1と顔b2との類似スコアScore(x1,x4)=5,顔a1と顔b3との類似スコアScore(x1,x5)=6を算出する。

また、スコア算出部２３は、顔a2と顔b1との類似スコアScore(x2,x3)=12, 顔a2と顔b2との類似スコアScore(x2,x4)=8,顔a2と顔b3との類似スコアScore(x2,x5)=9を算出する。

さらに、スコア算出部２３は、顔b1と顔b2との類似スコアScore(x3,x4)=40, 顔b1と顔b3との類似スコアScore(x3,x5)=30を算出し、顔b2と顔b3との類似スコアScore(x4,x5)=50を算出する。

なお、同一の顔どうし（例えば、顔a1と顔a1）の類似スコアScore(x1,x1)は、スコア算出部２３において算出するまでもなく、１００とされる。このため、スコア算出部２３では、図４において、同一の顔どうしの類似スコアScore(xi,xi)を算出していない。

また、類似スコアScore(x2,x1),Score(x3,x1),Score(x4,x1),Score(x5,x1)は、それぞれ、類似スコアScore(x1,x2)=30,Score(x1,x3)=10,Score(x1,x4)=5,Score(x1,x5)=6と同一となる。

さらに、類似スコアScore(x3,x2),Score(x4,x2),Score(x5,x2)は、それぞれ、類似スコアScore(x2,x3)=12,Score(x2,x4)=8,Score(x2,x5)=9と同一となる。また、類似スコアScore(x4,x3),Score(x5,x3)は、それぞれ、類似スコアScore(x3,x4)=40,Score(x3,x5)=30と同一となり、類似スコアScore(x5,x4)は、類似スコアScore(x4,x5)=50と同一となる。

このため、スコア算出部２３では、図４において、類似スコアScore(x2,x1),Score(x3,x1),Score(x4,x1),Score(x5,x1),Score(x3,x2),Score(x4,x2),Score(x5,x2),Score(x4,x3),Score(x5,x3),Score(x5,x4)を算出していない。

すなわち、類似スコアScore(xi,xj)と類似スコアScore(xj,xi)は同一の値となる。したがって、スコア算出部２３は、例えばN個の特徴量x1乃至xNのうち、異なる２個の特徴量xi及びxjに基づいて、_NC₂個(=N(N-1)/2)の類似スコアScore(xi,xj)を算出すればよく、N個の特徴量x1乃至xNの総当りの個数であるN²個の類似スコアScore(xi,xj)を算出する必要がない。

具体的には、例えば、スコア算出部２３は、図４において、₅C₂個(=10個)の類似スコアScore(x1,x2)乃至Score(x1,x5)，Score(x2,x3)乃至Score(x2,x5)，Score(x3,x4)乃至Score(x3,x5)，Score(x4,x5)のみを算出すればよい。

したがって、スコア算出部２３によれば、少ない計算量で迅速に、識別に必要な類似スコアScore(xi,xj)を算出することが可能となる。

次に、図５は、スコア算出部２３が行うスコア算出処理において、類似スコアScoreを０又は１の一方である２値化スコアScore'に２値化するときの一例を示している。

図５Aには、特徴量xiと特徴量xjに基づいて算出された複数の類似スコアScore(xi,xj)が示されている。なお、i及びjは、１から５までの自然数とされる。

また、図５Bには、類似スコアScore(xi,xj)が閾値Th1に応じて２値化された２値化スコアScore(xi,xj)'が示されている。

スコア算出部２３は、算出した類似スコアScore(xi,xj)が閾値Th1（いまの場合、例えばTh1=10）以上である場合、類似スコアScore(xi,xj)を１とし、算出した類似スコアScore(xi,xj)が閾値Th1未満である場合、類似スコアScore(xi,xj)を値０とする２値化を行う。そして、スコア算出部２３は、２値化後の類似スコアScore(xi,xj)を、２値化スコアScore(xi,xj)'として、識別部２４に供給する。

ところで、図５では、スコア算出部２３が、類似スコアScore(xi,xj)を、０又は１の一方である２値化スコアScore(xi,xj)'に変換するようにした。しかしながら、類似スコアScore(xi,xj)を、３つ以上の異なる値のいずれかとするp値化(pは３以上の自然数)を行うようにしてもよい。

なお、後述する図９では、類似スコアScore(xi,xj)を、例えば0,0.5又は1のいずれかとする３値化を行う場合について説明する。

図２に戻る。識別部２４は、スコア算出部２３からの２値化スコアScore(xi,xj)'に基づいて、例えば、顔a1と顔a2とが同一の人物Aの顔であるか否かなどを識別する識別処理を行う。

この識別処理において、例えば、顔a1と顔a2とが同一の人物Aの顔であると認識されるときの一例を、図６を参照して詳述する。また、例えば、顔a2と顔b1とが同一の人物Aの顔ではないと認識されるときの一例を、図７を参照して詳述する。

図６は、識別部２４が行う識別処理において、例えば、スコア算出部２３からの２値化スコアScore(xi,xj)'に基づいて、顔a1,a2,b1,b2,b3のうち、例えば、顔a1と顔a2が同一の人物Aの顔であると識別されるときの様子の一例を示している。

なお、図６には、図５Bと同様の図が示されている。このことは、後述する図７についても同様である。

識別部２４は、スコア算出部２３からの２値化スコアScore(xi,xj)'に基づいて、識別対象である顔の擬似ベクトルを生成する。

すなわち、例えば、識別部２４は、スコア算出部２３からの２値化スコアScore(xi,xj)'のうち、２値化スコアScore(x1,x1)',Score(x1,x2)',Score(x1,x3)',Score(x1,x4)'及びScore(x1,x5)'を要素とする、顔a1の擬似ベクトルVa1=（1,1,0,0,0）を生成する。

また、識別部２４は、同様にして、顔a2の擬似ベクトルVa2=(1,1,1,0,0)、顔b1の擬似ベクトルVb1=(0,1,1,1,1)、顔b2の擬似ベクトルVb2=(0,0,1,1,1)、及び顔b3の擬似ベクトルVb3=(0,0,1,1,1)を生成する。

そして、識別部２４は、生成した擬似ベクトルどうしを比較し、その比較結果に基づいて、識別対象とされた顔どうしが同一の人物の顔であるか否かを識別する。

すなわち、例えば、識別部２４は、２値化スコアScore(x1,xj)'と２値化スコアScore(x2,xj)'との比較結果に基づいて、２値化スコアScore(x1,xj)'と２値化スコアScore(x2,xj)'がいずれも１となる回数Num1と、２値化スコアScore(x1,xj)'と２値化スコアScore(x2,xj)'の少なくとも一方が１となる回数Num2を算出する。

また、識別部２４は、算出した回数Num1を、同じく算出した回数Num2で除算した除算結果Num1/Num2を、顔a1と顔a2との総合的な類似の程度を表す総合スコアTS(a1,a2)として算出する。

そして、識別部２４は、算出した総合スコアTS(a1,a2)が予め決められた閾値Th_ts以上であるか否かを判定し、統合スコアが閾値Th_ts以上であると判定した場合、顔a1と顔a2とを同一の人物の顔であると識別する。

また、識別部２４は、算出した総合スコアが予め決められた閾値Th_ts未満であると判定した場合、顔a1と顔a2とを異なる人物の顔と識別する。

図６では、２値化スコアScore(x1,x1)',Score(x1,x2)',Score(x2,x1)',Score(x2,x2)'及びScore(x2,x3)'が１となり、２値化スコアScore(x1,x3)',Score(x1,x4)',Score(x1,x5)',Score(x2,x4)'及びScore(x2,x5)'が０となる。

この場合、Num1=2,Num2=3となり、したがって、識別部２４は、２値化スコアScore(x1,xj)'と２値化スコアScore(x2,xj)'の比較結果に基づいて、統合スコアTS(a1,a2)として2/3を算出する。いま、閾値Th_ts=0.6とすれば、統合スコアTS(a1,a2)=2/3=0.666…≧Th_tsとなるため、識別部２４は、顔a1と顔a2とを同一の人物の顔であると識別する。

なお、図６において、顔a1と顔a2とが同一の顔であるか否かを識別する場合、顔a1の２値化スコアScore(x1,x4)'及び２値化スコアScore(x1,x5)'と、それに対応する顔a2の２値化スコアScore(x2,x4)'及び２値化スコアScore(x2,x5)'は、いずれも０である。

したがって、顔a1の２値化スコアScore(x1,x4)'及び２値化スコアScore(x1,x5)'と、それに対応する顔a2の２値化スコアScore(x2,x4)'及び２値化スコアScore(x2,x5)'は、統合スコアTS(a1,a2)(=Num1/Num2)の算出に用いられない。すなわち、顔a1と顔a2とが同一の顔であるか否かを識別する際には用いられない。

次に、図７は、識別部２４が行う識別処理において、例えば、スコア算出部２３からの２値化スコアScore(xi,xj)'に基づいて、顔a1,a2,b1,b2,b3のうち、例えば、顔a2と顔b1が同一の人物の顔ではないと識別されるときの様子の一例を示している。

図７では、２値化スコアScore(x2,x1)',Score(x2,x2)',Score(x2,x3)',Score(x3,x2)',Score(x3,x3)',Score(x3,x4)'及びScore(x3,x5)'が１となり、２値化スコアScore(x2,x4)',Score(x2,x5)'及びScore(x3,x1)'が０となる。

この場合、Num1=2,Num2=5となり、したがって、識別部２４は、２値化スコアScore(x2,xj)'と２値化スコアScore(x3,xj)'の比較結果に基づいて、統合スコアTS(a2,b1)として2/5を算出する。いま、閾値Th_ts=0.6とすれば、統合スコアTS(a2,b1)=2/5=0.4<Th_tsとなるため、識別部２４は、顔a2と顔b1とを別の人物の顔であると識別する。

図２に戻る。識別部２４は、コンテンツ記憶部２１から、静止画４１乃至４４を読み出す。そして、識別部２４は、顔の識別結果に基づいて、人物毎に、その人物の顔が写っていると識別された静止画を分類し、コンテンツ記憶部２１に供給して記憶させる。

また、識別部２４は、静止画４１乃至４４の分類結果を、表示部２５に供給して表示させる。

次に、図８は、識別部２４による分類結果が、表示部２５の表示画面に表示されたときの一例を示している。

表示部２５の表示画面には、図８に示されるように、顔の識別結果を表すウインドウ画面６１が表示される。

ウインドウ画面６１には、図８左側に示されるように、コンテンツ記憶部２１に保持される複数のフォルダ８１乃至８６が表示される。

フォルダ８１は、コンテンツを格納するためのフォルダであり、フォルダ８１の下位階層には、コンテンツとしての静止画を格納するためのフォルダ８２、コンテンツとしての動画を格納するためのフォルダ８３が格納されている。

また、フォルダ８２の下位階層には、所定の人物１が写っている静止画を格納するためのフォルダ８４、人物１とは異なる人物２が写っている静止画を格納するためのフォルダ８５、及び分類できなかった静止画を格納するためのフォルダ８６が格納されている。

識別部２４は、例えば、フォルダ８１の直下に格納されていた静止画４１乃至４４を分類する際、コンテンツ記憶部２１から、フォルダ８１内の静止画４１乃至４４を読み出す。そして、識別部２４は、顔の識別結果に基づいて、静止画４１乃至４４を、フォルダ８４乃至８６のうち少なくとも１のフォルダに分類して得られる分類結果を、コンテンツ記憶部２１に供給して記憶させる。

図８において、例えば、フォルダ８４には、静止画４１及び４２が格納され、フォルダ８５には、静止画４２乃至４４が格納される。

なお、フォルダ８１の下位階層に格納されるフォルダ８２乃至フォルダ８６等は、識別部２４による分類が行なわれる際に、識別部２４により適宜作成される。

また、例えば、ユーザが、操作部２６を用いて、ウインドウ画面６１上のフォルダ８４を指定する指定操作を行った場合、ウインドウ画面６１には、図８右側に示されるように、フォルダ８４に分類（格納）された静止画４１及び４２が表示される。

図２に戻る。表示部２５は、識別部２４からの制御に従い、図８に示したような、識別部２４による分類結果などを表示する。

また、表示部２５は、識別部２４による分類の途中結果として、例えば顔の抽出結果や類似スコアScoreの算出結果も表示することができる。具体的には、例えば、表示部２５は、識別部２４からの制御に従い、図１に示したような、顔a1,a2,b1,b2,b3の抽出結果、及び0又は1で表される類似スコアScoreの算出結果を表示する。なお、図１では、顔の抽出結果として、抽出された顔a1,a2,b1,b2,b3が、抽出された順序で、上から下に並んでいる。

操作部２６は、ユーザにより操作されるボタン等であり、ユーザの操作に応じて、ユーザの操作に対応する操作信号を、制御部２７に供給する。

ここで、例えば、ユーザは、表示部２５に表示された顔の抽出結果や類似スコアScoreの算出結果（図１）を参照しながら、操作部２６を用いて、顔a1,a2,b1,b2,b3のうち、例えば顔a2と顔b1とは異なる人物の顔である旨を指示する指示操作を行うことができる。この場合、操作部２６は、ユーザの指示操作に対応する操作信号を、制御部２７に供給する。制御部２７は、操作部２６からの操作信号に応じて、スコア算出部２３を制御する。

スコア算出部２３は、制御部２７からの制御にしたがって、顔a2と顔b1との類似スコアScore(x2,x3)を、特徴量x2及びx3により算出される類似スコアScore(x2,x3)の値に拘らず、閾値Th1未満の値に設定する。

これにより、２値化スコアScore(x2,x3)'は、ユーザの指示操作に応じた値0とされる。なお、この値0は、顔a2と顔b1とは異なる人物の顔である旨を表す。

その他、例えば、ユーザは、操作部２６を用いて、顔a1,a2,b1,b2,b3のうち、例えば顔a1と顔a2とは同一の顔である旨を指示する指示操作を行うことができる。この場合、顔a1と顔a2との類似スコアScore(x1,x2)は、特徴量x1及びx2により算出される類似スコアScore(x1,x2)の値に拘らず、閾値Th1以上の値とされ、２値化スコアScore(x1,x2)'は、ユーザの指示操作に応じた値１とされる。なお、この値1は、顔a1と顔a2とは同一の人物の顔である旨を表す。

このように、情報処理装置１では、ユーザからの指示操作も加味することにより、より正確な類似スコアScoreを得ることができ、ひいては識別の精度をより向上させることが可能となる。

制御部２７は、例えば、操作部２６からの操作信号に基づいて、特徴量抽出部２２乃至識別部２４を制御する。

[スコア算出部２３が行うスコア算出処理の他の例]
次に、図９は、スコア算出部２３が行うスコア算出処理において、類似スコアScore(xi,xj)を３値化スコアScore(xi,xj)''に３値化したときの結果の一例を示している。

図９Aには、特徴量xiと特徴量xjとに基づいて算出された複数の類似スコアScore(xi,xj)が示されている。

また、図９Bには、類似スコアScore(xi,xj)が閾値Th2及び閾値Th3(Th2<Th3)に応じて値0,0.5又は1のいずれかに変換された３値化スコアScore(xi,xj)''が示されている。なお、図９では、例えば、閾値Th2=50とされ、閾値Th3=75とされる。

スコア算出部２３は、算出した類似スコアScore(xi,xj)が閾値Th3以上である場合、類似スコアScore(xi,xj)を１とし、閾値Th2以上であって閾値Th3未満である場合、類似スコアScore(xi,xj)を0.5とし、閾値Th2未満である場合、類似スコアScore(xi,xj)を0とする３値化を行う。そして、スコア算出部２３は、３値化後の類似スコアScore(xi,xj)を、３値化スコアScore(xi,xj)''として、識別部２４に供給する。

なお、例えば、３値化スコアScore(xi,xj)''において、値１は類似していることを表し、値0.5は類似している可能性が高いことを表し、値0は類似していないことを表す。

この場合、識別部２４は、３値化スコアScore(x1,xj)''と３値化スコアScore(x2,xj)''との比較結果に基づいて、３値化スコアScore(x1,xj)''と３値化スコアScore(x2,xj)''がいずれも0.5又は１の一方となる回数Num1と、３値化スコアScore(x1,xj)''と３値化スコアScore(x2,xj)''の少なくとも一方が0.5又は１となる回数Num2を算出する。

そして、識別部２４は、算出した回数Num1を、同じく算出した回数Num2で除算した除算結果Num1/Num2を、顔a1と顔a2との総合的な類似の程度を表す総合スコアTS（a1,a2）として算出する。

スコア算出部２３において、類似スコアScore(xi,xj)を３値化スコア(xi,xj)''に３値化した場合、例えば２値化する場合と比較して、３値化スコア(xi,xj)''により、類似の状態をより詳細に表すことができる。よって、識別部２４において、識別対象を識別する際の精度をより向上させることができる。

なお、第１の実施の形態では、スコア算出部２３は、２値化により、類似スコアScore(xi,xj)を２値化スコアScore(xi,xj)'に２値化するものとして、以下説明する。

[情報処理装置１の動作説明]
次に、図１０のフローチャートを参照して、情報処理装置１が行う第１のコンテンツ分類処理の詳細を説明する。

なお、この第１のコンテンツ分類処理は、例えば、ユーザが操作部２６を操作して、第１のコンテンツ分類処理の開始を指示したときに開始される。このとき、制御部２７は、操作部２６からの操作信号に応じて、特徴量抽出部２２乃至識別部２４を制御して、第１のコンテンツ分類処理を行わせる。

ステップＳ１では、例えば、特徴量抽出部２２は、コンテンツ記憶部２１に保持されているコンテンツとしての静止画４１乃至４４から、識別対象としての顔a1,a2,b1,b2,b3の特徴量x1乃至x5を抽出する特徴量抽出処理を行う。そして、特徴量抽出部２２は、特徴量抽出処理により抽出した特徴量x1乃至x5を、スコア算出部２３に供給する。

なお、ステップＳ１における特徴量抽出処理の詳細は、図１１のフローチャートを参照して詳述する。

ステップＳ２では、スコア算出部２３は、特徴量抽出部２２からの特徴量x1乃至x5に基づいて、識別対象としての顔どうしの類似の程度（度合い）を表す類似スコアScore(xi,xj)を算出し、算出した類似スコアScore(xi,xj)を０又は１の一方の値である２値化スコアScore(xi,xj)'に２値化するスコア算出処理を行う。そして、スコア算出部２３は、スコア算出処理により得られた２値化スコアScore(xi,xj)'を、識別部２４に供給する。

なお、ステップＳ２におけるスコア算出処理の詳細は、図１２のフローチャートを参照して詳述する。

ステップＳ３では、識別部２４は、スコア算出部２３からの２値化スコアScore(xi,xj)'に基づいて、顔a1,a2,b1,b2,b3のうち、任意の２個の顔どうしが同一の人物の顔であるか否かを識別する識別処理を行う。

なお、ステップＳ３における識別処理の詳細は、図１３のフローチャートを参照して詳述する。

ステップＳ４では、識別部２４は、識別処理により得られた識別結果に基づいて、コンテンツ記憶部２１に保持されている静止画４１乃至４４を分類し、その分類結果を、表示部２５に供給して表示させ、第１のコンテンツ分類処理は終了される。

[特徴量抽出部２２が行う特徴量抽出処理の詳細]
次に、図１１を参照して、図１０のステップＳ１における特徴量抽出処理の詳細を説明する。

ステップＳ２１では、特徴量抽出部２２は、コンテンツ記憶部２１から、例えば、分類の対象である複数の静止画４１乃至４４を読み出す。

ステップＳ２２では、特徴量抽出部２２は、コンテンツ記憶部２１から読み出した複数の静止画４１乃至４４に順次注目し、注目している静止画（以下、注目静止画という）から、顔の抽出を試みる。

なお、特徴量抽出部２２は、注目静止画から、識別対象とされる顔を抽出できなかった場合、複数の静止画のうち、まだ注目静止画とされていない静止画を、新たな注目静止画とし、新たな注目静止画から顔の抽出を試みる処理を繰り返す。

特徴量抽出部２２は、注目静止画から顔fnを抽出した場合、ステップＳ２３に進み、抽出した顔fn（を表す画像）から、顔fnの特徴を表す特徴量xnを抽出し、スコア算出部２３に供給する。

なお、顔fnは、特徴量抽出部２２において、n番目に抽出された顔を表す。したがって、例えば、顔f1,f2,f3,f4,f5は、それぞれ、図１に示した顔a1,a2,b1,b2,b3に対応する。

特徴量抽出部２２は、ステップＳ２２の処理で、コンテンツ記憶部２１から読み出した複数の静止画４１乃至４４の全てに注目して顔fnを抽出し、ステップＳ２３の処理で、顔fnの特徴量xnを抽出した後、処理を、ステップＳ１に戻す。そして、特徴量抽出部２２は、抽出した特徴量xn（いまの場合、特徴量x1乃至x5）をスコア算出部２３に供給する。

[スコア算出部２３が行うスコア算出処理の詳細]
次に、図１２を参照して、図１０のステップＳ２におけるスコア算出処理の詳細を説明する。

ステップＳ４１では、スコア算出部２３は、変数iに１を代入する。また、ステップＳ４２では、スコア算出部２３は、変数jにi+1を代入する。なお、変数i及び変数jは、いずれも、スコア算出部２３が内蔵する図示せぬメモリに保持されているものとする。

ステップＳ４３において、スコア算出部２３は、特徴量抽出部２２からの特徴量xiと特徴量xjとに基づいて、顔fiと顔fjの類似スコアScore(xi,xj)を算出する。

ステップＳ４４において、スコア算出部２３は、変数jに１を加算（インクリメント）する。そして、ステップＳ４５では、スコア算出部２３は、変数jが、抽出された顔fnの総数Nよりも大であるか否かを判定し、変数jが総数Nよりも大ではないと判定した場合、処理をステップＳ４３に戻し、それ以降同様の処理を行う。

また、ステップＳ４５では、スコア算出部２３は、変数jが総数Nよりも大であると判定した場合、処理をステップＳ４６に進め、スコア算出部２３は、変数iに１を加算する。

ステップＳ４７では、スコア算出部２３は、変数iが総数N以上であるか否かを判定し、変数iが総数N以上ではないと判定した場合、処理をステップＳ４２に戻し、それ以降、同様の処理を行う。

また、ステップＳ４７では、スコア算出部２３は、変数iが総数N以上であると判定した場合、処理をステップＳ４８に進める。そして、スコア算出部２３は、ステップＳ４１乃至ステップＳ４７の処理で算出した類似スコアScore(xi,xj)が、予め決められた閾値Th1以上であるか否かを判定し、類似スコアScore(xi,xj)が閾値Th1以上であると判定した場合、その類似スコアScore(xi.xj)を１に変換する。

また、ステップＳ４８では、スコア算出部２３は、類似スコアScore(xi,xj)が閾値Th1以上ではない（閾値Th1未満である）と判定した場合、その類似スコアScore(xi,xj)を０に変換する。以上でスコア算出処理は終了され、処理は、図１０のステップＳ２に戻り、スコア算出部２３は、０又は１の一方に変換後の類似スコアScore(xi,xj)を、２値化スコアScore(xi,xj)'として、識別部２４に供給して、処理はステップＳ３に進められる。

[識別部２４が行う識別処理の詳細]
次に、図１３を参照して、図１０のステップＳ３における識別処理の詳細を説明する。

ステップＳ６１では、識別部２４は、変数kに０を代入する。ステップＳ６２では、識別部２４は、変数ｍに１を代入する。なお、識別部２４は、図示せぬ内蔵のメモリに、変数k及びmを予め保持しているものとする。

また、以下では、識別部２４は、顔fiと顔fj（i≠j）が同一の人物の顔であるか否かを識別するものとする。

ステップＳ６３では、識別部２４は、スコア算出部２３からの２値化スコアScore(xi,xm)'が１であるか否かを判定し、２値化スコアScore(xi,xm)'が１であると判定した場合、処理をステップＳ６４に進める。

なお、ステップＳ６３の処理は、類似スコアScore(xi,xm)が閾値Th1以上であるか否かを判定する処理と、実質的に等価の処理であると言える。このことは、後述するステップＳ６６の処理についても同様である。

ステップＳ６４では、識別部２４は、特徴量xmを有する顔fmを利用軸に設定し、ステップＳ６５において、変数kに１を加算する。なお、利用軸は、後述するステップＳ７０の処理において、顔fiの擬似ベクトル、及び顔fjの擬似ベクトルの生成時に利用される。

また、ステップＳ６３では、識別部２４は、スコア算出部２３からの２値化スコアScore(xi,xm)'が１ではない（０である）と判定した場合、処理をステップＳ６６に進める。

ステップＳ６６では、識別部２４は、スコア算出部２３からの２値化スコアScore(xj,xm)'が１であるか否かを判定し、２値化スコアScore(xj,xm)'が１であると判定した場合、処理をステップＳ６４に進め、それ以降同様の処理を行う。

また、ステップＳ６６では、識別部２４は、スコア算出部２３からの２値化スコアScore(xj,xm)'が１ではない（０である）と判定した場合、処理をステップＳ６７に進める。

ステップＳ６７では、識別部２４は、変数mに１を加算し、処理をステップＳ６８に進め、ステップＳ６７の処理後の変数mが、顔fnの総数Nよりも大であるか否かを判定し、変数mが総数Nよりも大ではないと判定した場合、処理をステップＳ６３に戻し、それ以降同様の処理を行う。

またステップＳ６８では、識別部２４は、変数mが総数Nよりも大であると判定した場合、処理をステップＳ６９に進め、変数kが予め決められた閾値Th_k以上であるか否かを判定する。

なお、閾値Th_kは、顔fiと顔fjが同一の人物の顔であるか否かを精度良く識別するために、最低限、必要な利用軸の個数を表す。

ステップＳ６９において、識別部２４は、変数kが閾値Th_k以上であると判定した場合、処理をステップＳ７０に進め、i番目に抽出された顔fiの擬似ベクトルvi、及びj番目に抽出された顔fjの擬似ベクトルvjを生成する。

ここで、擬似ベクトルviは、i番目に抽出された顔fiの特徴量xiと、ステップＳ６４の処理で利用軸として設定されたk個の特徴量xmとの２値化スコアScore(xi,xm)'を要素とするベクトルを表す。

また、擬似ベクトルvjは、j番目に抽出された顔fjの特徴量xjと、ステップＳ６４の処理で利用軸として設定されたk個の特徴量xmとの２値化スコアScore(xj,xm)'を要素とするベクトルを表す。

なお、擬似ベクトルviを、i番目に抽出された顔fiの特徴量xiと、N個の特徴量x1乃至xNとの２値化スコアScore(xi,xm)'を要素とするベクトルとするようにしてもよい。しかしながら、この場合、擬似ベクトルviの要素として、統合スコアTS(fi,fj)の算出に用いられない２値化スコアScore(xi,xm)'も含まれることが生じ得る。

そこで、ステップＳ７０では、識別部２４は、ステップＳ６３乃至ステップＳ６８の処理により設定された利用軸に基づいて、統合スコアTS(fi,fj)の算出に用いられる２値化スコアScore(xi,xm)'のみを要素として含む擬似ベクトルviを生成するようにしている。このことは、識別部２４が、擬似ベクトルvjを生成する場合についても同様である。

ステップＳ７１では、識別部２４は、生成した擬似ベクトルvi及び擬似ベクトルvjの、対応する各要素を比較し、その比較結果に基づいて、顔fiと顔fjとの総合スコアTS(fi,fj)を算出する。

ステップＳ７２では、識別部２４は、算出した統合スコアTS(fi,fj)が予め決められた閾値Th_ts以上であるか否かを判定し、その判定結果に基づいて、顔fiと顔fjが同一の顔であるか否かを識別する。

すなわち、ステップＳ７２では、識別部２４は、算出した統合スコアTS(fi,fj)が閾値Th_ts以上であると判定した場合、処理をステップＳ７３に進め、顔fiと顔fjが同一の顔であると識別する。また、識別部２４は、算出した統合スコアTS(fi,fj)が閾値Th_ts以上ではないと判定した場合、処理をステップＳ７４に進め、顔fiと顔fjが異なる顔であると識別する。

なお、ステップＳ６９において、識別部２４は、変数kが閾値Th_k以上ではないと判定した場合、上述したステップＳ７０乃至ステップＳ７４の処理（顔fiと顔fjとが同一であるか否かを識別する処理）をスキップする。

これは、利用軸の個数k、すなわち、擬似ベクトルvi及び擬似ベクトルvjの要素の個数kが、顔の識別に十分でないことによる。

また、ステップＳ６９において、識別部２４は、変数kが閾値Th_k以上ではないと判定した場合、処理をステップＳ７４に進め、顔fiと顔fjが異なる顔であると識別するようにしてもよい。

ステップＳ６９において、上述したステップＳ７０乃至ステップＳ７４の処理がスキップされた後、ステップＳ７３の処理の終了後、又はステップＳ７４の処理の終了後に、識別部２４は、以下の処理を行う。

すなわち、例えば、識別部２４は、識別対象とされる、顔fiと顔fjの異なる全ての組合せ(fi,fj)のうち、まだ識別していない組合せ(fi,fj)が存在する場合、処理をステップＳ６１に戻し、まだ識別していない組合せ(fi,fj)について識別を行う。

また、例えば、識別部２４は、識別対象とされる、顔fiと顔fjの異なる全ての組合せ（fi,fj）について識別を行った後、識別処理を終了し、処理を図１０のステップＳ３に戻し、ステップＳ４に進め、ステップＳ４の処理の終了後、第１のコンテンツ分類処理は終了される。

以上説明したように、第１のコンテンツ分類処理によれば、顔fiと顔fjの、対応する２値化スコアScore(xi,xj)'どうしを比較し、その比較結果に基づいて、顔fiと顔fjが同一人物の顔であるか否かを識別するようにした。

このため、例えば、識別器等を用いる場合と比較して、より少ない計算量で、精度良く識別を行うことが可能となる。

<２．第２の実施の形態>
[第２の実施の形態の概要]
次に、図１４を参照して、第２の実施の形態の概要を説明する。

図１４は、特徴量を定義する特徴量空間の一例を示している。

図１４において、バツ（×）印は、それぞれ、人物Aの顔a1乃至a5の特徴量を表している。また、三角（△）印は、それぞれ、人物Aとは異なる人物Bの顔b1乃至b6の特徴量を表している。なお、図１４には、図面が煩雑になるのを避けるため、特徴量空間として、２次元の座標空間を表している。しかしながら、特徴量空間の次元数は、２次元に限定されず、３次元以上であってもよい。

図１４において、円Ra1は、顔a1の特徴量を中心とする円を表しており、円Rb1は、顔b1の特徴量を中心とする円を表している。また、円Ra5は、顔a5の特徴量を中心とする円を表している。円Ra1,Rb1,Ra5の半径は、いずれも同一であり、半径d（以下、距離dともいう）とされる。

さらに、図１４において、円Ra1'は、顔a1の特徴量を中心とする円であって、円Ra1よりも半径Th_d(以下、閾値Th_dともいう)が小さい円である。

例えば、顔a1と顔a2が同一の人物Aの顔であるか否かを識別する場合、特徴量空間における、顔a1の特徴量と顔a2の特徴量との距離が予め決められた距離d以下であるか否か、すなわち、顔a2の特徴量が円Ra1の範囲内に含まれるか否かに基づいて、顔a1と顔a2が同一の人物Aの顔であるか否かを識別する距離判定方法も考えられる。

この距離判定方法は、顔a2の特徴量が円Ra1内に含まれるか否かを判定するだけでよいため、計算量を少なくできる。

しかしながら、上述の距離判定方法によれば、例えば、顔a1と顔a5が同一の人物Aの顔であるか否かを識別する場合、顔a5の特徴量が円Ra1の範囲内に含まれないため、顔a1と顔a5は同一の人物Aの顔ではないと誤って識別されてしまう。

また、上述の距離判定方法によれば、例えば、顔b1の特徴量が円Ra1の範囲内に含まれてしまうため、顔a1と顔b1は同一の人物Aの顔であると誤って認識されてしまう。

そこで、第２の実施の形態では、例えば、顔a1と顔a5などが同一の人物Aの顔であるか否かを識別する場合、顔a5の特徴量が、距離dよりも短い距離を表す閾値Th_d以下であるか否か、すなわち、円Ra1よりも小さな円Ra1'の範囲内に含まれるか否かを識別することにより、誤って識別される事態を抑止するようにしている。

第２の実施の形態では、例えば、顔a2,a3の特徴量が、円Ra1よりも小さな円Ra1'の範囲内に含まれるため、顔a1と顔a2は同一の人物Aの顔であると識別するとともに、顔a1と顔a3は同一の人物Aの顔であると識別する。

また、第２の実施の形態では、例えば、顔a4,a5の特徴量が、円Ra1よりも小さな円Ra1'の範囲内に含まれない。この場合、円Ra1'の範囲外に存在する顔a4,a5についても、人物Aの顔であると識別できるように、上述した第１の実施の形態と同様の方法を用いて識別する。

これは、上述した第１の実施の形態による方法が、距離dを用いた上述の距離判定方法では誤って識別してしまう顔a5や顔b1についても、精度良く識別することができることによる。

[情報処理装置１０１の構成例]
次に、図１５は、第２の実施の形態である情報処理装置１０１の構成例を示している。

なお、図１５において、第１の実施の形態である情報処理装置１（図２）と同様に構成される部分について同一の符号を付すようにしているため、それらの説明は以下、適宜省略する。

すなわち、情報処理装置１０１において、新たに距離算出部１２１が設けられているとともに、図２の識別部２４に代えて識別部１２２が設けられている他は、図２の情報処理装置１と同様に構成される。

距離算出部１２１には、特徴量抽出部２２から、例えば特徴量x1乃至x5が供給される。距離算出部１２１は、特徴量抽出部２２からの特徴量x1乃至x5のうち、任意の異なる特徴量xi及びxjに基づいて、特徴量xi及びxjどうしの距離D(xi,xj)を算出する。

ここで、例えば、特徴量xi及びxjは、特徴量空間上に定義されるベクトルであり、距離D(xi,xj)は、ベクトルとしての特徴量xiの終点から、ベクトルとしての特徴量xjの終点までの距離を表す。

次に、図１６は、距離算出部１２１が、距離D(xi,xj)を算出したときの算出結果の一例を示している。

図１６には、特徴量x1乃至x5のうち、任意の２個の異なる特徴量xi及びxjどうしの距離D(xi,xj)が示されている。

距離算出部１２１は、図１６に示されるように、特徴量抽出部２２からの特徴量x1乃至x5のうち、特徴量xi及びxjに基づいて、距離D(xi,xj)を算出し、図１５の識別部１２２に供給する。

なお、距離D(xi,xj)と距離D(xj,xi)は等距離となる。このため、距離算出部１２１は、図４で説明したスコア算出部２３と同様に、₅C₂個(=10個)の距離D(x1,x2)乃至D(x1,x5)，D(x2,x3)乃至D(x2,x5)，D(x3,x4)乃至D(x3,x5)，D(x4,x5)のみを算出するようにしている。

したがって、距離算出部１２１によれば、図４で説明したスコア算出部２３の場合と同様に、少ない計算量で迅速に、識別に必要な距離D(xi,xj)を算出することが可能となる。

図１５に戻り、識別部１２２は、距離算出部１２１からの距離D(xi,xj)が、予め決められた閾値Th_d以下であるか否かを判定し、距離D(xi,xj)が閾値Th_d以下であると判定した場合、顔fiと顔fjが同一人物の顔であると識別する。

ここで、閾値Th_dは、距離D(xi,xj)が閾値Th_d以下である場合に、非常に高い確率で、顔fiと顔fjが同一の人物の顔となるような値とされる。

また、識別部１２２は、距離D(xi,xj)が閾値Th_d以下ではないと判定した場合、スコア算出部２３を制御し、スコア算出部２３に２値化スコアScore(xi,xm)'及び２値化スコアScore(xj,xm)'を算出させ、識別部１２２に供給させる。

すなわち、例えば、図１６において、距離算出部１２１により算出された距離D(xi,xj)のうち、距離D(x1,x2)のみが、閾値Th_d以下ではない場合、識別部１２２は、スコア算出部２３を制御し、スコア算出部２３に２値化スコアScore(x1,xm)'及び２値化スコアScore(x2,xm)'を算出させ、識別部１２２に供給させる。

そして、識別部１２２は、図２の識別部２４と同様に、スコア算出部２３からの２値化スコアScore(x1,xm)'及び２値化スコアScore(x2,xm)'に基づいて、図１３に示したような識別処理を行うことにより、顔f1と顔f2が同一人物の顔であるか否かを識別する。

[情報処理装置１０１の動作説明]
次に、図１７のフローチャートを参照して、情報処理装置１０１が行う第２のコンテンツ分類処理について説明する。

なお、この第２のコンテンツ分類処理は、例えば、ユーザが操作部２６を操作して、第２のコンテンツ分類処理の開始を指示したときに開始される。このとき、制御部２７は、操作部２６からの操作信号に応じて、特徴量抽出部２２、スコア算出部２３、距離算出部１２１、及び識別部１２２を制御して、第２のコンテンツ分類処理を行わせる。

ステップＳ９１では、特徴量抽出部２２は、例えば、図１０のステップＳ１の処理と同様に、コンテンツ記憶部２１に保持されている静止画４１乃至４４から、特徴量x1乃至x5を抽出する特徴量抽出処理を行う。そして、特徴量抽出部２２は、特徴量抽出処理により抽出した特徴量x1乃至x5を、スコア算出部２３及び距離算出部１２１に供給する。

ステップＳ９２では、距離算出部１２１は、特徴量抽出部２２からの特徴量x1乃至x5のうち、任意の異なる特徴量xi及び特徴量xjに基づいて、図１６に示したように10個の距離D(xi,xj)を算出し、識別部１２２に供給する。

ステップＳ９３では、識別部１２２は、距離算出部１２１からの距離D(xi,xj)が予め決められた閾値Th_d以下であるか否かを判定する。そして、ステップＳ９４において、識別部１２２は、距離D(xi,xj)が閾値Th_d以下であると判定した場合、顔fiと顔fjは同一の人物の顔であると識別する。

なお、ステップＳ９４において、識別部１２２は、距離算出部１２１からの距離D(xi,xj)全てが閾値Th_d以下であると判定した場合、ステップＳ９５及びステップＳ９６をスキップして、処理をステップＳ９７に進め、図１０のステップＳ４と同様の処理を行う。

また、ステップＳ９４では、識別部１２２は、距離算出部１２１からの距離D(xi,xj)のうち、少なくとも１個の距離D(xi,xj)が閾値Th_d以下ではないと判定した場合、スコア算出部２３を制御し、スコア算出部２３に２値化スコアScore(xi,xm)'及び２値化スコアScore(xj,xm)'を算出させ、識別部１２２に供給させ、処理をステップＳ９５に進める。

そして、ステップＳ９５及びＳ９６において、距離D(xi,xj)が閾値Th_d以下ではないと判定された顔どうし（顔fiと顔fj）が同一の人物の顔であるか否かを識別するための処理が行われる。

すなわち、ステップＳ９５では、スコア算出部２３は、識別部１２２からの制御にしたがって、図１０のステップＳ２と同様の処理を行う。またステップＳ９６では、識別部１２２は、スコア算出部２３からの２値化スコアScore(xi,xm)'及び２値化スコアScore(xj,xm)'に基づいて、図１０のステップＳ３と同様の処理を行う。

その後、処理はステップＳ９７に進められ、識別部１２２は、図１０のステップＳ４と同様の処理を行う。以上で第２のコンテンツ分類処理は終了される。

以上説明したように、第２のコンテンツ分類処理によれば、識別部１２２は、ステップＳ９３において距離D(xi,xj)が閾値Th_d以下であると判定した場合、ステップＳ９５及びステップＳ９６の処理を行うことなく、顔fiと顔fjが同一人物の顔であると識別するようにした。

また、識別部１２２は、ステップＳ９３において距離D(xi,xj)が閾値Th_d以下ではないと判定した場合、ステップＳ９５及びステップＳ９６の処理により、顔fiと顔fjが同一人物の顔であると識別するようにした。

したがって、例えば、第２のコンテンツ分類処理によれば、ステップＳ９５のスコア算出処理において、距離D(xi,xj)が閾値Th_d以下ではない顔（顔fiと顔fj）どうしの識別に用いる類似スコアScoreのみを算出すればよいものとなる。よって、類似スコアScoreの算出に要する計算量を抑えつつ、精度良く識別を行うことが可能となる。

次に、図１８は、特徴量抽出部２２が、複数の画像により構成される動画から、識別対象としての顔を抽出するときの一例を示している。

図１８A乃至図１８Eには、動画を構成する各画像のうち、時間的に連続する複数の画像１４１乃至１４５が示されている。

すなわち、例えば、複数の画像１４１乃至１４５は、人物Aをビデオカメラで撮影（撮像）している状態から、ビデオカメラを図中左方向に移動したときに得られる画像を表している。

なお、画像１４１及び１４２には、人物Aが写っており、画像１４３には、いずれの人物も写っていない。また、画像１４４及び１４５には、人物Aとは異なる人物Bが写っている。

特徴量抽出部２２は、コンテンツ記憶部２１に記憶されているコンテンツとしての動画から、識別対象とされる顔を抽出する場合、例えば、動画を構成する各画像１４１乃至１４５を対象として、顔を抽出することができる。

しかしながら、この場合、特徴量抽出部２２は、画像１４１から人物Aの顔f1を抽出し、画像１４２から人物Aの顔f2を抽出し、画像１４４から人物Bの顔f3を抽出し、画像１４５から人物Bの顔f4を抽出することとなる。

この場合、特徴量抽出部２２は、例えば、複数の画像１４１乃至１４５を構成する動画から、複数の、人物Aの顔を抽出する必要があり、処理の負担が大となることが生じ得る。

そこで、特徴量抽出部２２は、例えば、画像１４１から抽出した顔f1をトラッキング（追跡）し、顔f1としてトラッキングされている顔については抽出しないようすることができる。

すなわち、例えば、特徴量抽出部２２は、画像１４１から、人物Aの顔f1を抽出し、抽出した顔f1を、画像１４１よりも未来方向の画像（例えば、画像１４２乃至１４５）を対象としてトラッキングする。

画像１４２には、人物Aの顔が写っているため、特徴量抽出部２２は、トラッキングにより、画像１４１から抽出した顔f1が、画像１４２にも写っていることを識別し、画像１４２に写っている顔f1を抽出の対象から除外する。

また、画像１４３には、人物Aの顔が写っていないため、特徴量抽出部２２は、画像１４３においてトラッキングを中止する。

そして、特徴量抽出部２２は、例えば、抽出対象の画像に新たな顔が写っている場合に、その顔を抽出し、抽出した顔についてトラッキングを開始する。

すなわち、例えば、顔が写っていない画像１４３の次の画像１４４には、人物Bの顔が写っている。このため、特徴量抽出部２２は、画像１４４から、新たに現れた人物Bの顔f2を抽出し、抽出した顔f2を、画像１４４よりも未来方向の画像（例えば、画像１４５以降の画像）を対象としてトラッキングする。

画像１４５には、人物Bの顔f2が写っているため、特徴量抽出部２２は、トラッキングにより、画像１４４から抽出した顔f2が、画像１４５にも写っていることを識別し、画像１４５に写っている顔f2を抽出の対象から除外する。

例えば、コンテンツが動画である場合、特徴量抽出部２２は、上述したトラッキングによる技術を用いることにより、動画を構成する各画像に表示される同一人物の顔が、全て抽出される事態を防止できる。

これにより、動画を構成する各画像に表示される同一人物の顔を全て抽出する場合と比較して、第１及び第２のコンテンツ分類処理の計算量を少なくすることが可能となる。

<３．変形例>
上述した第１及び第２の実施の形態では、例えば、顔fiと顔fjが同一人物の顔であるか否かを識別するようにしたが、識別対象は顔に限定されず、静止画上のどのような対象を識別対象とするようにしてもよい。

また例えば、利用軸として設定された特徴量xmのうち、特徴量xm1及びxm2どうしが殆ど同一の特徴量である場合、すなわち、例えば、特徴量xm1及びxm2どうしの距離D(xm1,xm2)が非常に短い（距離D(xm1,xm2)が予め決められた閾値ε未満である）場合、特徴量xm1及びxm2のうち、一方の特徴量のみを利用軸とし、特徴量xm1及びxm2とは異なる特徴量を新たな利用軸として採用してもよい。

この場合、利用軸として、異なる特徴量を採用することができるので、そのような利用軸を用いて生成される擬似ベクトルどうしを比較して行われる識別の精度を、より向上させることが可能となる。

その他、例えば、人物Aの顔として識別された複数の顔を対象として、さらに識別処理を行うようにしてもよい。この場合、例えば、人物Aの顔として誤って識別された顔が、再度の識別処理により検出できる可能性があるため、識別の精度をより向上できる。

なお、情報処理装置１及び１０１としては、例えばパーソナルコンピュータを採用することができる。また、例えば、情報処理装置１が行う第１のコンテンツ分類処理を、例えばインターネット等のネットワークを介して接続された複数のコンピュータが分担して行うようにしてもよい。このことは、情報処理装置１０１が行う第２のコンテンツ分類処理についても同様である。

ところで、本技術は、以下の構成をとることができる。
（１）コンテンツから、第１の識別対象と同一の対象であるか否かが識別される第２の識別対象を抽出する識別対象抽出部と、抽出された前記第２の識別対象から、前記第２の識別対象の特徴量を抽出する特徴量抽出部と、前記第１の識別対象との類似の程度を表す第１の類似スコアが算出される算出対象の特徴量と、前記第２の識別対象の特徴量に基づいて、前記算出対象と前記第２の識別対象との類似の程度を表す第２の類似スコアを算出する類似スコア算出部と、複数の異なる前記算出対象毎に、前記第１の類似スコアと前記第２の類似スコアを比較して得られる比較結果に基づいて、前記第１の識別対象と前記第２の識別対象とが同一の対象であるか否かを識別する識別部とを含む情報処理装置。
（２）特徴量を定義する特徴量空間上における、前記第１の識別対象の特徴量と前記第２の識別対象の特徴量との距離を算出する距離算出部をさらに含み、前記識別部は、前記距離にも基づいて、前記第１の識別対象と前記第２の識別対象とが同一の対象であるか否かを識別する前記（１）に記載の情報処理装置。
（３）前記識別部は、前記距離が第１の閾値以下である場合、前記第１の識別対象と前記第２の識別対象とが同一の対象であると識別し、前記距離が前記第１の閾値よりも大である場合、前記比較結果に基づいて、前記第１の識別対象と前記第２の識別対象とが同一の対象であるか否かを識別する前記（２）に記載の情報処理装置。
（４）前記識別部は、前記第１の類似スコア又は前記第２の類似スコアの少なくとも一方が第２の閾値以上とされた前記複数の異なる算出対象毎に、前記第１の類似スコアと前記第２の類似スコアを比較して得られる比較結果に基づいて、前記第１の識別対象と前記第２の識別対象とが同一の対象であるか否かを識別する前記（１）乃至（３）に記載の情報処理装置。
（５）前記識別部は、前記第１の類似スコア又は前記第２の類似スコアの少なくとも一方が前記第２の閾値以上とされた前記算出対象の個数が予め決められた個数以上である場合のみ、前記比較結果に基づいて、前記第１の識別対象と前記第２の識別対象とが同一の対象であるか否かを識別する前記（４）に記載の情報処理装置。
（６）前記類似スコア算出部は、前記算出対象の特徴量と、前記第２の識別対象の特徴量に基づいて、予め決められた複数の値のいずれかを、前記第２の類似スコアとして算出し、前記識別部は、前記第１の類似スコアと前記第２の類似スコアとが一致する回数を、前記第１の類似スコア又は前記第２の類似スコアの少なくとも一方が予め決められた類似スコア以上とされた回数で除算した除算結果が、第３の閾値以上であるとの比較結果に基づいて、前記第１の識別対象と前記第２の識別対象とが同一の対象であると識別する前記（１）乃至（５）に記載の情報処理装置。
（７）前記類似スコア算出部は、ユーザの指示操作により、前記算出対象と前記第２の識別対象とが同一の対象であるか否かが指示されている場合、前記第２の類似スコアの算出結果に拘らず、前記第２の類似スコアをユーザの指示操作に応じた値とする前記（１）乃至（６）に記載の情報処理装置。
（８）前記類似スコア算出部は、特徴量を定義する特徴量空間上における、第１の前記算出対象の特徴量と第２の前記算出対象の特徴量との距離が、予め決められた距離未満である場合、前記第１の算出対象、及び前記第２の算出対象を、１個の算出対象として、前記第２の類似スコアを算出する前記（１）乃至（７）に記載の情報処理装置。
（９）前記コンテンツは、複数の画像により構成される動画であり、前記識別対象抽出部は、前記動画を構成する前記複数の画像のうちの所定の画像から、前記第２の識別対象を抽出した後、前記所定の画像よりも未来方向の画像を対象として、前記第２の識別対象をトラッキングし、トラッキングしている前記第２の識別対象を抽出の対象から除外する前記（１）乃至（８）に記載の情報処理装置。

上述した一連の処理は、例えばハードウェアにより実行することもできるし、ソフトウェアにより実行することもできる。一連の処理をソフトウェアにより実行する場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ、又は、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のコンピュータなどに、プログラム記録媒体からインストールされる。

[コンピュータの構成例]
図１９は、上述した一連の処理をプログラムにより実行するコンピュータのハードウェアの構成例を示している。

CPU（Central Processing Unit）２０１は、ROM（Read Only Memory）２０２、又は記憶部２０８に記憶されているプログラムに従って各種の処理を実行する。RAM（Random Access Memory）２０３には、CPU２０１が実行するプログラムやデータ等が適宜記憶される。これらのCPU２０１、ROM２０２、及びRAM２０３は、バス２０４により相互に接続されている。

CPU２０１にはまた、バス２０４を介して入出力インタフェース２０５が接続されている。入出力インタフェース２０５には、キーボード、マウス、マイクロホン等よりなる入力部２０６、ディスプレイ、スピーカ等よりなる出力部２０７が接続されている。CPU２０１は、入力部２０６から入力される指令に対応して各種の処理を実行する。そして、CPU２０１は、処理の結果を出力部２０７に出力する。

入出力インタフェース２０５に接続されている記憶部２０８は、例えばハードディスクからなり、CPU２０１が実行するプログラムや各種のデータを記憶する。通信部２０９は、インターネットやローカルエリアネットワーク等のネットワークを介して外部の装置と通信する。

また、通信部２０９を介してプログラムを取得し、記憶部２０８に記憶してもよい。

入出力インタフェース２０５に接続されているドライブ２１０は、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリ等のリムーバブルメディア２１１が装着されたとき、それらを駆動し、そこに記録されているプログラムやデータ等を取得する。取得されたプログラムやデータは、必要に応じて記憶部２０８に転送され、記憶される。

コンピュータにインストールされ、コンピュータによって実行可能な状態とされるプログラムを記録（記憶）する記録媒体は、図１９に示すように、磁気ディスク（フレキシブルディスクを含む）、光ディスク（CD-ROM(Compact Disc-Read Only Memory),DVD(Digital Versatile Disc)を含む）、光磁気ディスク（ＭＤ（Mini-Disc）を含む）、もしくは半導体メモリ等よりなるパッケージメディアであるリムーバブルメディア２１１、又は、プログラムが一時的もしくは永続的に格納されるROM２０２や、記憶部２０８を構成するハードディスク等により構成される。記録媒体へのプログラムの記録は、必要に応じてルータ、モデム等のインタフェースである通信部２０９を介して、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線又は無線の通信媒体を利用して行われる。

なお、本明細書において、上述した一連の処理を記述するステップは、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。

さらに、本開示は、上述した第１及び第２の実施の形態に限定されるものではなく、本開示の要旨を逸脱しない範囲において種々の変更が可能である。

１情報処理装置，２１コンテンツ記憶部，２２特徴量抽出部，２３スコア算出部，２４識別部，２５表示部，２６操作部，２７制御部, １０１情報処理装置, １２１距離算出部, １２２識別部

Claims

コンテンツから、第１の識別対象と同一の対象であるか否かが識別される第２の識別対象を抽出する識別対象抽出部と、
抽出された前記第２の識別対象から、前記第２の識別対象の特徴量を抽出する特徴量抽出部と、
前記第１の識別対象との類似の程度を表す第１の類似スコアが算出される算出対象の特徴量と、前記第２の識別対象の特徴量に基づいて、前記算出対象と前記第２の識別対象との類似の程度を表す第２の類似スコアを算出する類似スコア算出部と、
複数の異なる前記算出対象毎に、前記第１の類似スコアと前記第２の類似スコアを比較して得られる比較結果に基づいて、前記第１の識別対象と前記第２の識別対象とが同一の対象であるか否かを識別する識別部と
を含む情報処理装置。
特徴量を定義する特徴量空間上における、前記第１の識別対象の特徴量と前記第２の識別対象の特徴量との距離を算出する距離算出部をさらに含み、
前記識別部は、前記距離にも基づいて、前記第１の識別対象と前記第２の識別対象とが同一の対象であるか否かを識別する
請求項１に記載の情報処理装置。
前記識別部は、
前記距離が第１の閾値以下である場合、前記第１の識別対象と前記第２の識別対象とが同一の対象であると識別し、
前記距離が前記第１の閾値よりも大である場合、前記比較結果に基づいて、前記第１の識別対象と前記第２の識別対象とが同一の対象であるか否かを識別する
請求項２に記載の情報処理装置。
前記識別部は、前記第１の類似スコア又は前記第２の類似スコアの少なくとも一方が第２の閾値以上とされた前記複数の異なる算出対象毎に、前記第１の類似スコアと前記第２の類似スコアを比較して得られる比較結果に基づいて、前記第１の識別対象と前記第２の識別対象とが同一の対象であるか否かを識別する
請求項１に記載の情報処理装置。
前記識別部は、前記第１の類似スコア又は前記第２の類似スコアの少なくとも一方が前記第２の閾値以上とされた前記算出対象の個数が予め決められた個数以上である場合のみ、前記比較結果に基づいて、前記第１の識別対象と前記第２の識別対象とが同一の対象であるか否かを識別する
請求項４に記載の情報処理装置。
前記類似スコア算出部は、前記算出対象の特徴量と、前記第２の識別対象の特徴量に基づいて、予め決められた複数の値のいずれかを、前記第２の類似スコアとして算出し、
前記識別部は、前記第１の類似スコアと前記第２の類似スコアとが一致する回数を、前記第１の類似スコア又は前記第２の類似スコアの少なくとも一方が予め決められた類似スコア以上とされた回数で除算した除算結果が、第３の閾値以上であるとの比較結果に基づいて、前記第１の識別対象と前記第２の識別対象とが同一の対象であると識別する
請求項１に記載の情報処理装置。
前記類似スコア算出部は、ユーザの指示操作により、前記算出対象と前記第２の識別対象とが同一の対象であるか否かが指示されている場合、前記第２の類似スコアの算出結果に拘らず、前記第２の類似スコアをユーザの指示操作に応じた値とする
請求項１に記載の情報処理装置。
前記類似スコア算出部は、特徴量を定義する特徴量空間上における、第１の前記算出対象の特徴量と第２の前記算出対象の特徴量との距離が、予め決められた距離未満である場合、前記第１の算出対象、及び前記第２の算出対象を、１個の算出対象として、前記第２の類似スコアを算出する
請求項１に記載の情報処理装置。
前記コンテンツは、複数の画像により構成される動画であり、
前記識別対象抽出部は、前記動画を構成する前記複数の画像のうちの所定の画像から、前記第２の識別対象を抽出した後、前記所定の画像よりも未来方向の画像を対象として、前記第２の識別対象をトラッキングし、トラッキングしている前記第２の識別対象を抽出の対象から除外する
請求項１に記載の情報処理装置。
所定の識別対象を識別する情報処理装置の情報処理方法において、
前記情報処理装置による、
コンテンツから、第１の識別対象と同一の対象であるか否かが識別される第２の識別対象を抽出する識別対象抽出ステップと、
抽出された前記第２の識別対象から、前記第２の識別対象の特徴量を抽出する特徴量抽出ステップと、
前記第１の識別対象との類似の程度を表す第１の類似スコアが算出される算出対象の特徴量と、前記第２の識別対象の特徴量に基づいて、前記算出対象と前記第２の識別対象との類似の程度を表す第２の類似スコアを算出する類似スコア算出ステップと、
複数の異なる前記算出対象毎に、前記第１の類似スコアと前記第２の類似スコアを比較して得られる比較結果に基づいて、前記第１の識別対象と前記第２の識別対象とが同一の対象であるか否かを識別する識別ステップと
を含む情報処理方法。
コンピュータを、
コンテンツから、第１の識別対象と同一の対象であるか否かが識別される第２の識別対象を抽出する識別対象抽出部と、
抽出された前記第２の識別対象から、前記第２の識別対象の特徴量を抽出する特徴量抽出部と、
前記第１の識別対象との類似の程度を表す第１の類似スコアが算出される算出対象の特徴量と、前記第２の識別対象の特徴量に基づいて、前記算出対象と前記第２の識別対象との類似の程度を表す第２の類似スコアを算出する類似スコア算出部と、
複数の異なる前記算出対象毎に、前記第１の類似スコアと前記第２の類似スコアを比較して得られる比較結果に基づいて、前記第１の識別対象と前記第２の識別対象とが同一の対象であるか否かを識別する識別部と
して機能させるためのプログラム。