JP6278276B2

JP6278276B2 - 物体識別装置、物体識別方法、及びプログラム

Info

Publication number: JP6278276B2
Application number: JP2014531523A
Authority: JP
Inventors: 亮太間瀬
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 2012-08-23
Filing date: 2013-05-21
Publication date: 2018-02-14
Anticipated expiration: 2033-05-21
Also published as: US20150220810A1; TWI505201B; JPWO2014030400A1; CN104584071B; EP2889834A4; US9679221B2; EP2889834A1; WO2014030400A1; TW201415380A; CN104584071A

Description

本発明は、画像中の物体を正確に識別する装置、方法、及びプログラムに関する。

画像内の被写体を、撮影サイズや角度の変化、オクルージョンに対して頑健に識別可能とするために、画像内の特徴的な点（特徴点）を多数検出し、各特徴点周辺の局所領域の特徴量（局所特徴量）を抽出する方式が提案されている。その代表的な方式として、特許文献１や非特許文献１には、ＳＩＦＴ（ＳｃａｌｅＩｎｖａｒｉａｎｔＦｅａｔｕｒｅＴｒａｎｓｆｏｒｍ）特徴量を用いる局所特徴量抽出装置が開示されている。

従来、局所特徴量抽出装置では、まず画像の各画素から輝度に関する情報のみを抽出し、抽出した輝度情報から特徴的な点（特徴点）を多数検出し、各特徴点に関する情報である特徴点情報を出力する。ここで、特徴点情報とは、例えば、検出された局所特徴点の座標位置やスケール、特徴点のオリエンテーション等を示すものである。そして、検出された各特徴点の座標値、スケール、及びオリエンテーション等の特徴点情報から、特徴量抽出を行う局所領域を取得して、局所特徴量を生成（記述）する。

例えば、非特許文献１に記載されているように、撮影した画像内の被写体と同一の被写体が写っている画像を識別するために、撮影した画像すなわち入力画像から抽出される局所特徴量１と、参照する画像から生成される局所特徴量２とを比較する。具体的には、まず、局所特徴量１を構成する特徴点付近の領域についての各特徴量と、局所特徴量２を構成する特徴点付近の領域についての各特徴量との全組み合わせについて、特徴空間上での距離計算を行い、最も近傍にある特徴量を対応している特徴量と判定する。対応している特徴量については、特徴量生成の元となっている特徴点についても対応していると判定する。その後、対応していると判定された特徴点の組み合わせに関して、入力画像における特徴点の座標位置を特定の幾何変換に従って移動したときの座標位置と、参照画像における特徴点の座標位置とが一致するか否かに基づいて、対応している特徴点の正誤を決定する。ここで正しく対応していると判定される特徴点数が一定値以上であるとき、同一の被写体が写っている（すなわち、入力画像内の被写体と参照画像内の被写体とが一致する）と判定される。

米国特許第６７１１２９３号明細書特開２０１０−７９５４５号公報

David G. Lowe著、「Distinctive image features from scale-invariant keypoints」、（米国）、International Journal of Computer Vision、60(2)、2004年、p. 91-110

従来の局所特徴量を利用する物体識別方式は、入力画像の輝度情報から抽出される局所特徴量と、参照画像の輝度情報から抽出される局所特徴量との対応関係に基づいて物体の識別を行っている。このような識別方法では、入力画像に写っている物体と参照画像に写っている物体とは異なるものであるが、両者の間にわずかな差異しか存在しない場合、対応する特徴点が多数存在するため、同一物体を写した画像であると誤って識別してしまう問題点がある。

本発明は、上記に鑑みてなされたものであり、その課題は、画像に写っている物体と同一の物体が写された画像をより正確に識別する技術を提供することにある。

本発明の物体識別装置は、入力画像から抽出した特徴点のそれぞれの特徴量と、参照画像から抽出した特徴点のそれぞれの特徴量とが正しく対応しているか否かを判定する局所特徴量照合手段と、前記局所特徴量照合手段によって正しく対応していると判定された特徴量の組み合わせ数に基づくスコアが所定値以上である場合、前記入力画像と前記参照画像との間の幾何的なずれを補正する幾何変換を前記参照画像の所定の領域に対して行うことによって得られた画像領域の位置に対応する前記入力画像における領域の特徴量を抽出する入力画像差異領域特徴量抽出手段と、前記入力画像差異領域特徴量抽出手段によって抽出された特徴量と、前記参照画像の前記所定の領域から抽出された特徴量とを照合し、照合結果を出力する特徴量照合手段とを備えたことを特徴とする。

本発明の物体識別方法は、入力画像から抽出した特徴点のそれぞれの特徴量と、参照画像から抽出した特徴点のそれぞれの特徴量とが正しく対応しているか否かを判定する局所特徴量照合ステップと、前記局所特徴量照合ステップによって正しく対応していると判定された特徴量の組み合わせ数に基づくスコアが所定値以上である場合、前記入力画像と前記参照画像との間の幾何的なずれを補正する幾何変換を前記参照画像の所定の領域に対して行うことによって得られた画像領域の位置に対応する前記入力画像における領域の特徴量を抽出する入力画像差異領域特徴量抽出ステップと、前記入力画像差異領域特徴量抽出ステップによって抽出された特徴量と、前記参照画像の前記所定の領域から抽出された特徴量とを照合し、照合結果を出力する特徴量照合ステップとを備えることを特徴とする。

本発明のプログラムは、コンピュータを、入力画像から抽出した特徴点のそれぞれの特徴量と、参照画像から抽出した特徴点のそれぞれの特徴量とが正しく対応しているか否かを判定する局所特徴量照合手段、前記局所特徴量照合手段によって正しく対応していると判定された特徴量の組み合わせ数に基づくスコアが所定値以上である場合、前記入力画像と前記参照画像との間の幾何的なずれを補正する幾何変換を前記参照画像の所定の領域に対して行うことによって得られた画像領域の位置に対応する前記入力画像における領域の特徴量を抽出する入力画像差異領域特徴量抽出手段、前記入力画像差異領域特徴量抽出手段によって抽出された特徴量と、前記参照画像の前記所定の領域から抽出された特徴量とを照合し、照合結果を出力する特徴量照合手段、として機能させることを特徴とする。

本発明によれば、画像に写っている物体と同一の物体が写された画像をより正確に識別する技術を提供することができる。

第１の実施の形態における物体識別装置の構成例を表すブロック図である。入力画像差異領域決定部１３の動作例を示すフローチャートである。局所特徴量抽出部１１の構成例を表すブロック図である。局所特徴量照合部１２の構成例を表すブロック図である。入力画像差異領域特徴量抽出部１４の構成例を表すブロック図である。特徴量照合部１５の構成例を表すブロック図である。第１の実施の形態の変形例における物体識別装置の構成例を表すブロック図である。参照画像に対する差異領域、入力画像に対する入力画像差異領域の関係を示したイメージ図である。参照画像に対する差異領域、入力画像に対する入力画像差異領域の関係を示したイメージ図である。参照画像に対する差異領域、入力画像に対する入力画像差異領域の関係を示したイメージ図である。参照画像に対する差異領域、入力画像に対する入力画像差異領域の関係を示したイメージ図である。第２の実施の形態における物体識別装置の構成例を表すブロック図である。局所特徴量照合部１６の構成例を表すブロック図である。差異領域推定部１７の構成例を表すブロック図である。差異領域特徴量抽出部１８の構成例を表すブロック図である。第３の実施の形態における物体識別装置の構成例を表すブロック図である。差異領域推定部１９の構成例を表すブロック図である。第４の実施の形態における物体識別装置の構成例を表すブロック図である。差異領域推定部２０の構成例を表すブロック図である。第５の実施の形態における物体識別装置の構成例を表すブロック図である。差異領域推定部２１の構成例を表すブロック図である。差異領域推定部２１の構成例を表すブロック図である。差異領域推定部２１の構成例を表すブロック図である。差異領域推定部２１の構成例を表すブロック図である。第６の実施の形態における物体識別装置の構成例を表すブロック図である。差異領域推定部２２の構成例を表すブロック図である。差異領域推定部２２の構成例を表すブロック図である。第７の実施の形態における物体識別装置の構成例を表すブロック図である。差異領域推定部２３の構成例を表すブロック図である。差異領域推定部２３の構成例を表すブロック図である。差異領域推定部２３の構成例を表すブロック図である。第８の実施の形態における物体識別装置の構成例を表すブロック図である。差異領域推定部２４の構成例を表すブロック図である。差異領域推定部２４の構成例を表すブロック図である。差異領域推定部２４の構成例を表すブロック図である。第９の実施の形態における物体識別装置の構成例を表すブロック図である。差異領域推定部２５の構成例を表すブロック図である。差異領域推定部２５の構成例を表すブロック図である。第１０の実施の形態における物体識別装置の構成例を表すブロック図である。入力画像差異領域特徴量抽出部２６の構成例を表すブロック図である。特徴量照合部２７の構成例を表すブロック図である。第１１の実施の形態における物体識別装置の構成例を表すブロック図である。局所特徴量照合部２８の構成例を表すブロック図である。特徴量照合部２９の構成例を表すブロック図である。識別スコア統合判定部３０の構成例を表すブロック図である。

（第１の実施の形態）
本発明の第１実施の形態について図面を参照して説明する。

図１は第１の実施の形態における物体識別装置の構成を示すブロック図である。物体識別装置は、局所特徴量抽出部１１、局所特徴量照合部１２、入力画像差異領域決定部１３、入力画像差異領域特徴量抽出部１４、及び特徴量照合部１５を備える。物体識別装置は、例えば、パーソナルコンピュータや携帯情報端末等の情報処理装置を用いて構成することができる。そして、物体識別装置を構成する各部の機能は、例えば、プロセッサが、記憶領域に格納されているプログラムをメモリに展開して実行することによって実現される。なお、後述する他の実施形態における構成要素についても同様に実現することができる。

局所特徴量抽出部１１は、入力画像から特徴点を検出し、検出された特徴点とその付近の領域である局所領域の特徴量を局所特徴量として抽出する。局所特徴量抽出部１１による処理の詳細については後述する。

局所特徴量照合部１２は、局所特徴量抽出部１１において入力画像から抽出された局所特徴量１と、参照画像から抽出された局所特徴量２とを照合して対応する局所特徴量を特定する。対応する局所特徴量を特定する方法についての詳細は、図４を参照して後述する。局所特徴量照合部１２は、局所特徴量が対応する局所領域を幾何変換したときの位置に応じて、入力画像と参照画像との間で対応する局所領域を特定する。例えば、入力画像における局所領域を、画像の中心を軸として所定の角度だけ回転移動したときの局所領域の座標位置が、参照領域における局所特徴量が対応する局所領域の座標位置と一致する場合、入力画像及び参照画像において座標位置が一致した局所領域は、対応する局所領域として特定される。すなわち、上記の幾何変換は参照画像と入力画像との間の幾何的なずれが補正されるように行われる。また、局所特徴量照合部１２は、対応する局所領域が特定された場合、用いられた幾何変換についての情報（幾何変換情報）と、局所領域が対応すると判定された参照画像の画像ＩＤである局所特徴識別画像ＩＤとを出力する。

参照画像から抽出された局所特徴量２は、あらかじめ複数の参照画像から抽出しておき、図１に示す局所特徴量ＤＢなどのデータベースに記憶しておいても良いし、オンザフライで参照画像から局所特徴量抽出部１１を利用して抽出しても良い。データベースに記憶しておく場合、類似するオブジェクトを含む（類似する物体を被写体とする）参照画像から抽出される局所特徴量を関連付けて登録しておいても良い。局所特徴量照合部１２の詳細については後述する。

入力画像差異領域決定部１３は、局所特徴量照合部１２から出力された局所特徴識別画像ＩＤに対応する参照画像、又は局所特徴識別画像ＩＤに関連付いた参照画像群の差異領域に対し、局所特徴量照合部１２から出力された幾何変換情報が示す幾何変換を行い、入力画像差異領域情報を出力する。

ここで、本実施形態において、参照画像の差異領域とは、入力画像に写っている物体と参照画像に写っている物体とでわずかに差異が生じ得ることが予測されている場合に、参照画像においてその差異が生じ得る部分が写された領域である。参照画像の差異領域の情報は、例えば差異領域が矩形である場合、その矩形の４隅の座標値情報であっても良い。または、差異領域を構成する参照画像中の画素群の座標値を表す情報であっても良い。

入力画像差異領域情報は、参照画像における差異領域の４隅の座標値のそれぞれに対して幾何変換を行うことによって得られる入力画像における座標値とすることができる。または、参照画像の差異領域の情報がその差異領域を構成する画素群の座標値情報である場合、それらの画素群のそれぞれに対して、幾何変換情報に対応する幾何変換を行い、入力画像における差異領域を構成する画素群の座標値情報を入力画像差異領域情報とすることができる。

参照画像の差異領域情報は、事前にデータベースに記憶されている。例えば、局所特徴量２を図１の局所特徴量ＤＢなどのデータベースに記憶しておく場合には、参照画像の差異領域情報を局所特徴量２とともに局所特徴量ＤＢに記憶しても良い。

入力画像差異領域特徴量抽出部１４は、入力画像差異領域決定部１３から出力された入力画像差異領域情報が示す入力画像における領域（入力画像中の差異領域）から特徴量を抽出する。入力画像差異領域特徴量抽出部１４の詳細については後述する。

特徴量照合部１５は、入力画像差異領域特徴量抽出部１４において入力画像中の差異領域から抽出された特徴量１と、参照画像中の差異領域から抽出された特徴量２とを照合して、照合結果を出力する。特徴量照合部１５は、当該照合において、入力画像に含まれるオブジェクトと参照画像に含まれるオブジェクトが同一であるか（入力画像と参照画像とが同一の物体を被写体としているか）を判定する。同一であると判定された場合、特徴量照合部１５は、同一であると判定された入力画像の画像ＩＤを差異領域識別画像ＩＤとして出力する。

特徴量２は、図１のように、あらかじめ複数の参照画像から抽出しておきデータベースに記憶しておいても良いし、オンザフライで参照画像から抽出しても良い。データベースに記憶しておく場合、類似する物体を関連付けて登録しておいても良い。特徴量照合部１５の詳細については後述する。

図２は、図１に示した入力画像差異領域決定部１３による処理のフローを示すフローチャートである。図２に示すように、まず、Ｓ１３１で処理を制御するための変数ｉの初期化が行われる。

Ｓ１３２においては、局所特徴量照合部１２から出力された幾何変換情報が取得される。Ｓ１３３においては、局所特徴量ＤＢから参照画像の差異領域情報が取得される。ここで取得する差異領域情報は、参照画像の差異領域が矩形である場合、その矩形の４隅の座標値情報であっても良いし、差異領域を構成する参照画像中の画素群の座標値を表す情報であっても良い。

Ｓ１３４では、Ｓ１３２で取得した幾何変換情報が示す幾何変換を、Ｓ１３３で取得した差異領域情報に対して行う。ここで、差異領域情報が、４隅の座標値情報である場合は、４つの座標値のうちの１つに幾何変換を行う。また、差異領域情報が、差異領域を構成する参照画像中の画素群の座標値情報である場合は、画素群のうちの１つの画素に幾何変換を行う。この時点で変数ｉが一定数Ｎ未満である場合、Ｓ１３５において変数ｉの値を更新し、変数ｉの値がＮ以上になるまでＳ１３３とＳ１３４の処理を継続する。Ｓ１３３において取得する差異領域情報が、４隅の参照画像における座標値情報である場合にはＮ＝４とし、差異領域情報が、差異領域を構成する参照画像中の画素群の座標値情報である場合には、差異領域を構成する参照画像中の画素群の数がＮの値として設定される。最後に、Ｓ１３６では、Ｓ１３４で算出した入力画像差異領域情報を出力し、処理を終了する。

次に、図３を参照して、局所特徴量抽出部１１について詳述する。図３は、局所特徴量抽出部１１の構成例を表すブロック図である。局所特徴量抽出部１１は、輝度情報抽出部１０１、局所特徴点検出部１０２、及び局所特徴量生成部１０３を備える。

輝度情報抽出部１０１は、入力画像を受け取り、その入力画像の各画素から輝度に関する情報のみを抽出し出力する。ここで受け取る入力画像は、デジタルカメラやデジタルビデオカメラ、携帯電話等の撮像機器で撮影された画像や、スキャナー等を通して取り込まれた画像などである。また、画像は、ＪＰＥＧ（ＪｏｉｎｔＰｈｏｔｏｇｒａｐｈｉｃＥｘｐｅｒｔｓＧｒｏｕｐ）のように圧縮された画像であってもよいし、ＴＩＦＦ（ＴａｇｇｅｄＩｍａｇｅＦｉｌｅＦｏｒｍａｔ）のように圧縮されていない画像であってもよい。

局所特徴点検出部１０２は、画像から特徴的な点（特徴点）を多数検出し、各特徴点に関する情報である特徴点情報を出力する。ここで、特徴点情報とは、例えば、検出された特徴点の座標位置やスケール、特徴点のオリエンテーション、特徴点に対して割り当てられた固有のＩＤ（Ｉｄｅｎｔｉｆｉｃａｔｉｏｎ）である「特徴点番号」等を示すものである。なお、局所特徴点検出部１０２は、特徴点情報を、各特徴点のオリエンテーションの方向毎に別々の特徴点情報として出力しても良い。例えば、局所特徴点検出部１０２は、各特徴点における最も主たるオリエンテーションの方向についてのみ特徴点情報を出力することとしてもよいし、２番目以降の主たるオリエンテーションの方向についての特徴点情報も出力することとしてもよい。また、局所特徴点検出部１０２は、２番目以降の主たるオリエンテーションの方向についての特徴点情報も出力する場合、各特徴点におけるオリエンテーションの方向ごとに異なる特徴点番号を付与することができる。局所特徴点検出部１０２は、画像から特徴点を検出して特徴点情報を抽出する際に、例えば、ＤｏＧ（Ｄｉｆｆｅｒｅｎｃｅ−ｏｆ−Ｇａｕｓｓｉａｎ）処理を用いることができる。具体的には、局所特徴点検出部１０２は、ＤｏＧ処理を用いてスケールスペースにおける極値探索をすることで特徴点の位置とスケールを決定することができる。さらに局所特徴点検出部１０２は、決定した特徴点の位置およびスケールと周辺領域の勾配情報とを用いて各特徴点のオリエンテーションを算出することができる。なお、局所特徴点検出部１０２は、画像から特徴点を検出して特徴点情報を抽出する際に、ＤｏＧではなく、Ｆａｓｔ−ＨｅｓｓｉａｎＤｅｔｅｃｔｏｒ等の他の手法を用いてもよい。局所特徴点検出部１０２は、その内部で検出された特徴点の中から重要な特徴点のみを選び出し、その特徴点に関する情報のみを特徴点情報として出力しても良い。

局所特徴量生成部１０３は、局所特徴点検出部１０２から出力される特徴点情報を受け取り、各特徴点に対する局所領域（特徴点とその周辺の領域）の特徴量である局所特徴量を生成（記述）する。なお、局所特徴量生成部１０３は、ＺＩＰやＬＺＨ等の可逆圧縮で圧縮された形式で局所特徴量を出力してもよい。局所特徴量生成部１０３は、局所特徴点検出部１０２において、検出する特徴点の重要度を決めている場合、その特徴点の重要度順に局所特徴量を生成して出力することができる。また、局所特徴量生成部１０３は、特徴点の座標位置順に局所特徴量を生成して出力してもよい。局所特徴量生成部１０３では、まず、特徴点情報に基づいて、検出された各特徴点の座標値、スケール、及びオリエンテーションから、特徴量抽出を行う局所領域を取得する。なお、１つの特徴点に対してオリエンテーションの異なる複数の特徴点情報が存在する場合、各特徴点情報に対して局所領域を取得することができる。次に、局所領域を特徴点のオリエンテーション方向に応じて回転させて正規化した後、サブ領域に分割する。例えば、局所領域を１６ブロック（４×４ブロック）に分割することができる。次に、局所領域のサブ領域ごとに特徴ベクトルを生成する。サブ領域の特徴ベクトルとしては、例えば、勾配方向ヒストグラムを用いることができる。具体的には、各サブ領域の画素ごとに勾配方向を算出し、それを８方向に量子化して、サブ領域ごとに量子化された８方向の頻度を集計し、勾配方向ヒストグラムを生成する。この時、各特徴点に対して生成される１６ブロック×８方向の勾配方向ヒストグラムにより構成される特徴ベクトルを局所特徴量として出力する。出力される局所特徴量には、特徴点の座標位置情報を含めて出力する。

次に、図４を参照して、局所特徴量照合部１２について詳述する。図４は、局所特徴量照合部１２の構成例を表すブロック図である。図４に示すように、局所特徴量照合部１２は、対応特徴点決定部２０１、誤対応点除去部２０２、識別スコア算出部２０３、及び閾値判定部２０４を備える。

対応特徴点決定部２０１は、局所特徴量抽出部１１で入力画像から抽出される局所特徴量１と、参照画像から抽出される局所特徴量２とを受け取る。対応特徴点決定部２０１は、局所特徴量１と局所特徴量２が対応するか否かを判定し、対応する場合、局所特徴量１と局所特徴量２は対応するものであるとして、対応特徴点情報を出力する。例えば、前記局所特徴量１と前記局所特徴量２がそれぞれ特徴点周辺の勾配ヒストグラムを記述した特徴量の集合である場合、まず、特徴量空間における距離計算を局所特徴量の全組み合わせについて行う。最小となる距離値が次に小さい距離値に対して十分に小さくなる場合に限り、その距離値が最小となる局所特徴量の組み合わせに関して、その局所特徴量及びその局所特徴量の局所特徴領域は対応していると判断し、局所特徴領域の位置情報と対応する局所特徴領域の位置情報を対応特徴点情報として出力する。

誤対応点除去部２０２は、対応特徴点決定部２０１から対応特徴点情報を受け取り、それらの対応特徴点の中から、正しく対応している特徴点と誤って対応している特徴点を判別して、その判別した特徴点情報をそれぞれ出力すると共に、その判別に使用する幾何変換情報もあわせて出力する。例えば、対応特徴点決定部２０１から受け取った対応特徴点情報に対し、ＲＡＮＳＡＣ等の手法を適用して、参照画像中の座標を入力画像中の座標へ移動させる幾何変換についての情報を幾何変換情報として推定する。ここで推定された幾何変換情報を、対応特徴点の参照画像側の特徴点に対しそれぞれ作用させ、それらが入力画像側の特徴点にほぼ一致する場合は正しく対応している特徴点であると判断し、逆に入力側の特徴点に一致しない場合は誤って対応している特徴点であると判断する。

識別スコア算出部２０３は、誤対応点除去部２０２から対応特徴点情報を受け取り、識別スコアを出力する。出力する識別スコアは、例えば、誤対応点除去部２０２から受け取った対応特徴点情報の中から、正しく対応した特徴点の組み合わせ数をカウントし、その数を０から１の間のスコアにマッピングさせるためのテーブルをあらかじめ用意しておき、そのテーブルを参照して識別スコアを出力しても良い。または、正しく対応した特徴点の組み合わせ数がｃである場合、あらかじめ定められた特徴点の最低対応数をｍとして、ｍ／（ｃ＋ｍ）を識別スコアとして算出しても良い。閾値判定部２０４は、識別スコア算出部２０３から出力された識別スコアを閾値処理し、閾値以上である場合は同一の物体を写した画像であると判定し、その参照画像のＩＤを局所特徴識別画像ＩＤとして出力する。この閾値判定部２０４で設定される閾値は、事前に決定され内部に保持された値であっても良いし、外部から与える値であっても良い。

次に、図５を参照して、入力画像差異領域特徴量抽出部１４について詳述する。図５は、入力画像差異領域特徴量抽出部１４の構成例を表すブロック図である。図５に示すように、入力画像差異領域特徴量抽出部１４は、差異領域画像生成部４０１、及び差異領域特徴量算出部４０２を備える。

差異領域画像生成部４０１は、入力画像と、入力画像差異領域決定部１３から入力画像差異領域情報を受け取り、その入力画像差異領域情報が、入力画像における差異領域の４隅の座標値情報である場合、４隅のうち隣り合う２隅をそれぞれ直線で結んだ時にその直線上の画素を順に読み取る。読み取られた画素群に囲まれた領域について、入力画像中からその値を読み取っていく画素とその順序を決定する事により、入力画像中の差異領域画像を生成し出力する。または、入力画像差異領域決定部１３から受け取る入力画像差異領域情報が、入力画像における差異領域を構成する画素群の座標値を表す情報である場合、差異領域画像生成部４０１は、その順序で入力画像を読み取り、入力画像中の差異領域画像として出力する。

差異領域特徴量算出部４０２は、差異領域画像生成部４０１で生成された差異領域画像から特徴量を抽出し、その特徴量を出力する。差異領域特徴量算出部４０２で抽出する特徴量として、例えば、入力画像の差異領域と参照画像の差異領域の色情報に関する解析を行うため「色配置」「色ヒストグラム」等の特徴量を抽出しても良い。あるいは、入力画像の差異領域と参照画像の差異領域の細かな文字の違いを解析するため、「文字らしさ」を表現可能な特徴量を抽出しても良い。

次に、図６を参照して、特徴量照合部１５について詳述する。図６は、特徴量照合部１５の構成例を表すブロック図である。図６に示すように、特徴量照合部１５は、差異領域識別スコア算出部５０１、及び閾値判定部５０２を備える。

差異領域識別スコア算出部５０１は、入力画像の差異領域から抽出される特徴量を特徴量１として、参照画像の差異領域から抽出される特徴量を特徴量２として、それぞれ受け取る。差異領域識別スコア算出部５０１は、受け取った２つの特徴量から決定される識別スコアを差異領域識別スコアとして出力する。差異領域識別スコアは、特徴量１と特徴量２が類似している程、その値が高くなるような尺度である。例えば、特徴量１と特徴量２の特徴量空間上での距離を計算し、その逆数を差異領域識別スコアとして出力しても良い。または、特徴量１と、複数の参照画像群からそれぞれ抽出した特徴量２を照合する場合、特徴量の全組み合わせの中で特徴量空間上での距離の最小値を見つけ、その最小値で、特徴量の全組み合わせにおける特徴量空間上での距離を割った値の逆数を差異領域識別スコアとして出力しても良い。または、特徴量１と特徴量２の特徴量空間上での距離値を、０〜１の間のスコアにマッピングさせるためのテーブルをあらかじめ用意しておき、そのテーブルを参照して差異領域識別スコアを出力しても良い。

閾値判定部５０２は、差異領域識別スコア算出部５０１から出力された差異領域識別スコアを閾値と比較し、閾値以上である場合は同一の物体を写した画像であると判定し、その参照画像のＩＤを差異領域識別画像ＩＤとして出力する。この閾値判定部５０２で設定される閾値は、事前に決定され内部に保持された値であっても良いし、外部から与える値であっても良い。

図７は、本実施の形態の変形例における物体識別装置の構成を示している。図７に示す物体識別装置は、差異領域情報のみを格納したデータベースである差異領域情報ＤＢを設けている点で、図１に示す物体識別装置と異なる。局所特徴量２がデータベースとして記憶されておらず、参照画像からオンザフライで抽出される場合、この図７の構成で本実施の形態が実現できる。

図８から図１１は、それぞれ、参照画像における差異領域と、入力画像における差異領域との間の関係として考えられるパターンを示したイメージ図である。

図８は、物体が参照画像全体に表示され、差異領域が参照画像全体に対して設定される場合の例を示している。この例は、同一銘柄で味付けが異なるお菓子パッケージ等でよく見られるように、物体に刻まれている文字・模様等はほぼ同一だが、その物体の色が異なる場合等が該当する。すなわち、この例では、入力画像の全体が参照画像の全体と異なりうることが考えられるため、参照画像の全体が差異領域として設定される。

図９は、物体が参照画像全体に表示され、差異領域が参照画像の一部に対して設定される場合の例を示している。この例は、同一シリーズで巻が異なる本の背表紙等でよく見られるように、物体はほぼ同一なのだが、物体の一部分のみ、色や文字や模様が異なる場合が該当する。すなわち、この例では、入力画像の一部が参照画像の一部と異なりうることが考えられるため、参照画像の一部が差異領域として設定される。図１０及び図１１に示す例は、図８及び図９に示した例とそれぞれほぼ同様だが、参照画像が画像全体ではなくその一部にしか写っていない点が異なる。

いずれの例においても、本実施の形態では、その差異領域として設定された領域の情報が事前にデータベース登録されている。本実施形態において、登録されている参照画像中の差異領域及び入力画像中の差異領域は、それぞれ、差異が生じ得ることが予測されている必要最小限の領域を参照画像及び入力画像のそれぞれから抽出したものである。そのため、参照画像の全体の局所特徴量と入力画像の全体の局所特徴量とを比較したときに、差異がわずかであるために同一の画像であると判定されてしまった場合であっても、参照画像及び入力画像の差異画像の特徴量のみを再度比較することによって、物品の違いに起因する細かな差異を見分けることができる。その結果、局所特徴量のみを使った場合に問題となっていた誤判定を抑制する事が可能となる。

以上のように本実施形態によれば、局所特徴量照合部１２は、入力画像から抽出した特徴点のそれぞれの特徴量と、参照画像から抽出した特徴点のそれぞれの特徴量とが対応するかを判定する。入力画像差異領域特徴量抽出部１４は、局所特徴量照合部１２によって対応すると判定された特徴量の組み合わせ数に基づくスコアが所定値以上の場合、入力画像と参照画像との間の幾何的なずれを補正する幾何変換を参照画像の所定の領域（差異領域）に対して行うことによって得られた画像領域の位置に対応する入力画像における領域から特徴量を抽出する。なお、本実施形態において参照画像の差異領域は、入力画像差異領域決定部１３によって決定される。特徴量照合部１５は、入力画像差異領域特徴量抽出部１４によって抽出された特徴量と、参照画像の差異領域から抽出された特徴量とを照合し、照合結果を出力する。その結果、参照画像に写っている物体と同一の物体が写された入力画像をより正確に識別することができる。

（第２の実施の形態）
本発明の第２の実施の形態について図面を参照して説明する。第２の実施の形態では、参照画像中の差異領域を事前にデータベース登録せずに、参照画像中の差異領域を推定して識別を行う。

図１２は、本発明の第２の実施の形態における物体識別装置の構成を示すブロック図である。図１２に示すように、本実施形態の物体識別装置は、局所特徴量抽出部１１、局所特徴量照合部１６、入力画像差異領域決定部１３、入力画像差異領域特徴量抽出部１４、差異領域推定部１７、差異領域特徴量抽出部１８、及び特徴量照合部１５を備える。このように、第２の実施の形態の物体識別装置では、第１の実施の形態の物体識別装置の局所特徴量照合部１２が局所特徴量照合部１６に変更され、差異領域情報を格納したデータベースである差異領域情報ＤＢが差異領域推定部１７及び差異領域特徴量抽出部１８に変更されている点で、第１の実施の形態と異なる。局所特徴量照合部１６、差異領域推定部１７、差異領域特徴量抽出部１８の詳細については後述する。その他の構成要素については第１の実施の形態と同様であるため同一の符号を付して詳細な説明は省略する。

図１３は、局所特徴量照合部１６の構成例を表すブロック図である。図１３に示すように、局所特徴量照合部１６は、対応特徴点決定部２０１、誤対応点除去部２０２、識別スコア算出部２０３、及び閾値判定部２０４を備える。すなわち、図１３に示される局所特徴量照合部１６の構成要素は、図４に示される局所特徴量照合部１２の構成要素と同一である。しかし、図１３に示される局所特徴量照合部１６は、誤対応点除去部２０２から幾何変換情報が出力され、閾値判定部２０４から局所特徴識別画像ＩＤが出力されることに加え、誤対応点除去部２０２から出力される対応特徴点情報が局所特徴量照合部１６から出力されている点が図４の局所特徴量照合部１２とは異なっている。

図１４は、差異領域推定部１７の構成を表すブロック図である。図１４に示すように、差異領域推定部１７は、誤対応特徴点密集度探索部７０１を備える。誤対応特徴点密集度探索部７０１は、局所特徴量照合部１６から対応特徴点情報を受け取り、参照画像中の差異領域に関する情報である差異領域情報を出力する。局所特徴量照合部１６から受け取る対応特徴点情報は、正しく対応している特徴点の情報と、誤って対応している特徴点の情報とが含まれている。そのため、対応特徴点情報に含まれている誤って対応している特徴点の情報を用いて、誤って対応している特徴点が密集している領域を参照画像中から探索する事によって、参照画像中の差異領域を推定する事が可能である。誤って対応している特徴点が密集している領域の探索は、例えば、一定の大きさの矩形窓を規定し、差分画像中でこの矩形窓を動かしていき、誤って対応している特徴点の数が矩形窓内で一定数以上である場合、その矩形窓の領域を差異領域とすることができる。参照画像中の差異領域を推定する方法はこれに限定されず、誤って対応している特徴点が密集している領域に基づいて推定する方法であれば、任意の方法で実施することができる。すなわち、参照画像の差異領域（所定の領域）は、局所特徴量照合部１６によって、参照画像において誤って対応している特徴点が密集していると判定された領域を含む領域である。

図１５は、差異領域特徴量抽出部１８の構成例を表すブロック図である。図１５に示すように、差異領域特徴量抽出部１８は、差異領域画像生成部８０１、及び差異領域特徴量算出部４０２を備える。

差異領域画像生成部８０１は、図５に示した入力画像差異領域特徴量抽出部１４の構成要素である差異領域画像生成部４０１とほぼ同一である。しかしながら、差異領域画像生成部８０１は、入力画像及び入力画像差異領域情報の代わりに、参照画像及び差異領域情報がそれぞれ入力される点で差異領域画像生成部４０１とは異なる。また、差異領域画像生成部８０１で生成される差異画像は、入力画像差異領域情報に基づいて入力画像から生成されるのではなく、参照画像中の差異領域情報に基づいて参照画像から生成される点が異なっている。

差異領域特徴量算出部４０２は、図５に示した入力画像差異領域特徴量抽出部１４の構成要素である差異領域特徴量算出部４０２と同一であるため、詳細な説明は省略する。なお、図５と図１５における差異領域特徴量算出部４０２で算出する特徴量は、同一の処理で算出される特徴量でなければならない。

以上のように本実施の形態では、参照画像中の差異領域を事前にデータベース登録しておかなくても、参照画像中の差異領域を推定する事ができるため、物体識別を利用した検品システムで、差異が生じ得ることが予測される領域を差異領域として事前に登録しておく事ができない場合（例えば、多数の製品の中からどこかに傷を持つ製品だけを見分ける場合など）に効果的である。そして、本実施の形態で行われる参照画像中の差異領域の推定は、差異領域が物体全体の場合であっても、物体の一部の場合であっても可能であるため、図８から図１１に示したいずれの例の場合に対しても、本実施の形態は有効である。

（第３の実施の形態）
本発明の第３の実施の形態について図面を参照して説明する。

図１６は、本発明の第３の実施の形態である物体識別装置の構成を示すブロック図である。図１６に示すように、第３の実施の形態の物体識別装置は、局所特徴量抽出部１１、局所特徴量照合部１６、入力画像差異領域決定部１３、入力画像差異領域特徴量抽出部１４、特徴量照合部１５、差異領域推定部１９、及び差異領域特徴量抽出部１８を備える。

このように、第３の実施の形態の物体識別装置では、第２の実施の形態の物体識別装置の差異領域推定部１７が差異領域推定部１９に変更されている点が第２の実施の形態と異なる。差異領域推定部１９の詳細については後述する。その他の構成要素については、第２の実施の形態と同様であり、同一の符号を付して詳細な説明は省略する。

図１７は、差異領域推定部１９の構成例を表すブロック図である。図１７に示すように、差異領域推定部１９は、物体領域推定部９０１、及び誤対応特徴点密集度探索部９０２を備える。

物体領域推定部９０１は、局所特徴量照合部１６から出力される局所特徴識別画像ＩＤに対応する参照画像、あるいはその局所特徴識別画像ＩＤに関連付いた参照画像群を受け取り、参照画像中で物体が存在している領域を表す情報である物体領域情報を出力する。ここで受け取る参照画像は、図１６のように、あらかじめデータベースに記憶しておいても良いし、物体識別装置の外部から取得しても良い。物体領域推定部９０１における処理としては、例えば、参照画像中のエッジ強度を解析することで物体領域を大まかに推定する方法や、背景領域の画像パターンをあらかじめ学習しておき背景以外の領域として物体領域を大まかに推定する方法等が考えられる。

誤対応特徴点密集度探索部９０２は、図１４に示した差異領域推定部１７の構成要素である誤対応特徴点密集度探索部７０１と類似している。しかしながら、誤対応特徴点密集度探索部９０２は、局所特徴量照合部１６から受け取る対応特徴点情報に加えて、物体領域推定部９０１から出力される物体領域情報が入力される点が第２の実施の形態とは異なっている。誤対応特徴点密集度探索部９０２は、対応特徴点のうち、物体領域の内部に存在する点のみに着目し、誤って対応している特徴点が密集している領域を探索する。

すなわち、誤対応特徴点密集度探索部９０２は、参照画像中の物体領域の内部から差異領域を推定する。そのため、本実施の形態において、物体以外の領域から出現する誤った対応の特徴点の影響を受けることなく、参照画像中の差異領域を推定する事が可能である。つまり、参照画像における差異領域（所定の領域）は、参照画像において物品が写った領域のうち、誤って対応している特徴点が密集していると局所特徴量照合部１６によって判定された領域を含む領域となる。また、誤対応特徴点密集度探索部９０２は、参照画像中で誤って対応している特徴点が密集している領域を探索する範囲が限定されるため、探索範囲が参照画像全体である誤対応特徴点密集度探索部７０１と比べて高速な処理が可能である。

本実施の形態では、実施の形態２と同様、参照画像中の差異領域を事前にデータベース登録しておかなくても、参照画像中の差異領域を推定する事ができるため、物体識別を利用した検品システムで、事前に差異領域に関する情報を登録しておく事ができない場合（例えば、多数の製品の中からどこかに傷を持つ製品だけを見分ける場合など）に効果的である。そして、本実施の形態で行われる参照画像中の差異領域の推定は、差異領域が物体全体の場合であっても、物体の一部の場合であっても可能であるが、物体以外の領域から出現する誤った対応の特徴点の影響を受けることなく差異領域を高精度に推定する事が可能であるため、図１０及び図１１に示した例の場合に特に有効である。

（第４の実施の形態）
本発明の第４の実施の形態について図面を参照して説明する。第４の実施の形態では、差異領域の推定方法として他の方法を用いた場合について説明する。

図１８は、本発明の第４の実施の形態である物体識別装置の構成を示すブロック図である。図１８に示すように、第４の実施の形態の物体識別装置は、局所特徴量抽出部１１、局所特徴量照合部１２、入力画像差異領域決定部１３、入力画像差異領域特徴量抽出部１４、特徴量照合部１５、差異領域推定部２０、及び差異領域特徴量抽出部１８を備える。このように、第４の実施の形態の物体識別装置では、第３の実施の形態の物体識別装置の局所特徴量照合部１６及び差異領域推定部１９が、局所特徴量照合部１２及び差異領域推定部２０に変更されている点が第３の実施の形態と異なる。局所特徴量照合部１２は、第１の実施の形態の物体識別装置の局所特徴量照合部１２と同様であり、詳細な説明は省略する。差異領域推定部２０の詳細については後述する。その他の構成要素については、第３の実施の形態と同様であり、同一の符号を付して詳細な説明は省略する。

図１９は、差異領域推定部２０の構成例を表すブロック図である。図１９に示すように、差異領域推定部２０は、変換画像生成部２００１、差分画像生成部２００２、物体領域推定部２００３、及び大差分領域検出部２００４を備える。

変換画像生成部２００１は、入力画像と、局所特徴量照合部１２から出力される幾何変換情報とを受け取り、入力画像に対して幾何変換情報が示す幾何変換を行い、変換画像を出力する。ここで出力される変換画像は、例えば、入力画像の各画素に対して、幾何変換情報が示す幾何変換を行い、入力画像の各画素を参照画像と同じ大きさの画像上に投影させていくことで、変換画像を生成する。このとき、投影先の画像において、入力画像中の画素が投影されない画素については、その画素値を０等で埋めて変換画像を生成する。また、局所特徴量照合部１２から出力される幾何変換情報が、参照画像中の座標から入力画像中の座標へ変換する情報である場合、この変換画像生成部２００１で作用させる幾何変換情報は、その逆の変換を行う情報になっている必要がある。すなわち、局所特徴量照合部１２から出力される幾何変換情報が、参照画像中の座標から入力画像中の座標へ変換する３×３の行列である場合、変換画像生成部２００１で作用させる幾何変換情報は、その逆行列を用いる。

差分画像生成部２００２は、局所特徴量照合部１２から出力される局所特徴識別画像ＩＤに対応する参照画像（又はその局所特徴識別画像ＩＤに関連付いた参照画像群）と、変換画像生成部２００１から出力される変換画像とを受け取る。差分画像生成部２００２は、参照画像と変換画像の差分を取った画像を差分画像として出力する。なお、参照画像と変換画像の差分を取る際、例えば、両方の画像の輝度の平均値が一致するよう、一方の画像の輝度を補正してから差分を取っても良い。ここで受け取る参照画像は、図１８のように、あらかじめデータベースに記憶しておいても良いし、物品識別装置の外部から取得しても良い。

物体領域推定部２００３は、差分画像生成部２００２から差分画像を受け取り、当該差分画像中の物体領域情報（参照画像中で物体が存在している領域を表す情報）を推定して出力する。ここで出力される物体領域情報は、例えば、差分画像の中でその差分値が小さい領域を画像中から探索する事によって推定する事が可能である。これは、差分画像の中で差分値が小さい領域は、参照画像と変換画像で同一の物体が写っている可能性が高い領域と考えられるためである。物体領域の推定は、例えば、一定の大きさの矩形窓を考え、差分画像中でこの矩形窓を動かしていき、矩形窓内で画素値の小さい画素が一定数以上あった場合、その矩形窓の領域を物体領域とすることもできるし、他の方法であっても良い。

大差分領域検出部２００４は、差分画像生成部２００２から出力される差分画像と、物体領域推定部２００３から出力される物体領域情報とを受け取る。大差分領域検出部２００４は、物体領域において、差分画像内の差分値が大きくなっている箇所は、参照画像に写っている物体と変換画像に写っている物体とで差異が存在している箇所である可能性が高いと判断する。従って、大差分領域検出部２００４は、差分値が大きい箇所を画像内から探索し、その領域情報を差異領域情報として出力する。差分値が大きい箇所（すなわち差異領域）の探索は、例えば、一定の大きさの矩形窓を規定し、差分画像内の物体領域中でこの矩形窓を動かしていき、矩形窓内で画素値の大きい画素が一定数以上あった場合、その矩形窓の領域を差異領域とすることもできるし、他の方法で探索しても良い。

以上のように本実施の形態では、変換画像生成部２００１は、入力画像と参照画像との間の幾何的なずれを補正する幾何変換を入力画像に対して行って、変換画像を出力する。大差分領域検出部２００４は、変換画像と参照画像との差分が所定値以上である領域を含む領域についての情報を差分領域情報として出力する。また、大差分領域検出部２００４は、参照画像中で物体が存在している領域のうち、変換画像と参照画像との差分が所定値以上である領域を含む領域についての情報を差分領域情報として出力することができる。

本実施の形態では、実施の形態２、３と同様、参照画像中の差異領域を事前にデータベース登録しておかなくても、参照画像中の差異領域を推定する事ができるため、物体識別を利用した検品システムで、事前に差異領域に関する情報を登録しておく事ができない場合（例えば、多数の製品の中からどこかに傷を持つ製品だけを見分ける場合など）に効果的である。そして、本実施の形態で行われる参照画像中の差異領域の推定は、差異領域が物体全体の場合であっても、物体の一部の場合であっても可能であるが、実施の形態３と同様、まず物体領域を推定することにより背景の影響を取り除いた上で、改めて差異領域を推定するため、差異領域を高精度に推定する事ができ、図１０や図１１に示した例のような場合に特に有効である。

（第５の実施の形態）
本発明の第５の実施の形態について図面を参照して説明する。

図２０は、本発明の第５の実施の形態である物体識別装置の構成を示すブロック図である。図２０に示すように、第５の実施の形態の物体識別装置は、局所特徴量抽出部１１、局所特徴量照合部１６、入力画像差異領域決定部１３、入力画像差異領域特徴量抽出部１４、特徴量照合部１５、差異領域推定部２１、及び差異領域特徴量抽出部１８を備える。このように、第５の実施の形態の物体識別装置では、第３の実施の形態の物体識別装置と第４の実施の形態の物体識別装置をあわせた構成になっている。第３の実施の形態の物体識別装置との比較では、差異領域推定部１９が差異領域推定部２１に変更されている点が異なる。差異領域推定部２１の詳細については後述する。その他の構成要素については、第３の実施の形態と同様であり、同一の符号を付して詳細な説明は省略する。

図２１から図２４は、差異領域推定部２１の構成例を表すブロック図であり、以下に各図について説明する。

図２１に示す差異領域推定部２１は、変換画像生成部２００１、差分画像生成部２００２、物体領域推定部２００３、及び誤対応特徴点密集度探索部９０２を備える。図２１の変換画像生成部２００１、差分画像生成部２００２、物体領域推定部２００３は、図１９で示される差異領域推定部２０の構成要素である変換画像生成部２００１、差分画像生成部２００２、物体領域推定部２００３と同一であり、詳細な説明は省略する。また、図２１の誤対応特徴点密集度探索部９０２は、図１７で示される差異領域推定部１９の構成要素である誤対応特徴点密集度探索部９０２と同一であり、詳細な説明は省略する。

すなわち、差異領域推定部２１は、差異領域推定部１９のように、参照画像だけを利用して推定した物体領域から誤対応の特徴点が密集している領域を探索するのではなく、変換した入力画像と参照画像の差分を利用して推定した物体領域から誤対応の特徴点が密集している領域を探索することで、差分領域を推定する。

また、図２２に示す差異領域推定部２１は、変換画像生成部２００１、差分画像生成部２００２、物体領域推定部２００３、大差分領域検出部２１０１、及び誤対応特徴点密集度探索部２１０２を備える。図２２の変換画像生成部２００１、差分画像生成部２００２、物体領域推定部２００３は、図１９で示される差異領域推定部２０の構成要素である変換画像生成部２００１、差分画像生成部２００２、物体領域推定部２００３と同一であり、詳細な説明は省略する。

図２２の大差分領域検出部２１０１は、図１９で示される差異領域推定部２０の構成要素である大差分領域検出部２００４とほぼ同一であるが、差異領域情報ではなく差異候補領域情報を出力する点が異なっている。この大差分領域検出部２１０１が出力する差異候補領域情報は、大差分領域検出部２００４で出力される差異領域情報と同一であっても良いし、その差異領域情報よりもわずかに広げた領域として捉え、その領域情報としても良い。

図２２の誤対応特徴点密集度探索部２１０２は、図１７で示される差異領域推定部１９の構成要素である誤対応特徴点密集度探索部９０２と類似しているが、物体領域情報の代わりに差異候補領域情報が入力される点が異なっている。誤対応特徴点密集度探索部２１０２から出力される差異領域情報は、変換画像生成部２００１、差分画像生成部２００２、物体領域推定部２００３、大差分領域検出部２１０１の４つの組み合わせで推定される差異候補領域の中から、さらに誤対応特徴点密集度探索部２１０２で差異領域を絞りこむため、信頼性の高い差異領域情報が出力される。

また、図２３に示す差異領域推定部２１は、変換画像生成部２００１、誤対応特徴点密集度探索部２１０３、差分画像生成部２１０４、大差分領域検出部２１０５を備える。図２３の変換画像生成部２００１は、図１９で示される差異領域推定部２０の構成要素である変換画像生成部２００１と同一であり、詳細な説明は省略する。

図２３の誤対応特徴点密集度探索部２１０３は、図１４で示される差異領域推定部１７の構成要素である誤対応特徴点密集度探索部７０１とほぼ同一であるが、差異領域情報ではなく差異候補領域情報を出力する点が異なっている。この誤対応特徴点密集度探索部２１０３が出力する差異候補領域情報は、誤対応特徴点密集度探索部７０１で出力される差異領域情報と同一であっても良いし、その差異領域情報よりもわずかに広げた領域として捉え、その領域情報としても良い。

図２３の差分画像生成部２１０４は、図１９で示される差異領域推定部２０の構成要素である差分画像生成部２００２と類似しているが、参照画像と変換画像に加えて差異候補領域情報が入力される点が異なっている。差分画像生成部２１０４では、参照画像と変換画像の差分を取る事によって生成される差分画像から、差異候補領域情報で示される領域の画像を差分画像として出力する。

図２３の大差分領域検出部２１０５は、図１９で示される差異領域推定部２０の構成要素である大差分領域検出部２００４と類似しているが、差分画像のみが入力される点が異なっている。大差分領域検出部２１０５に入力される差分画像は、誤対応特徴点密集度探索部２１０３で既に差異候補領域として推定された領域に関してのみ出力された差分画像であるため、既にこの段階で、物体領域の全体あるいはその一部を表す領域の画像となっている。大差分領域検出部２１０５から出力される差異領域情報は、誤対応特徴点密集度探索部２１０３で推定される差異候補領域の中から、さらに大差分領域検出部２４０２で差異領域を絞り込むため、信頼性の高い差異領域情報が出力される。

また、図２４に示す差異領域推定部２１は、変換画像生成部２００１、差分画像生成部２００２、物体領域推定部２００３、大差分領域検出部２１０１、誤対応特徴点密集度探索部２１０３、差異候補領域重複検出部２１０６を備える。図２４の変換画像生成部２００１、差分画像生成部２００２、物体領域推定部２００３は、図１９で示される差異領域推定部２０の構成要素である変換画像生成部２００１、差分画像生成部２００２、物体領域推定部２００３と同一であり、詳細な説明は省略する。図２４の大差分領域検出部２１０１は、図２２の大差分領域検出部２１０１と同一であり、詳細な説明は省略する。また、図２４の誤対応特徴点密集度探索部２１０３は、図２３の誤対応特徴点密集度探索部２１０３と同一であり、詳細な説明は省略する。

図２４の差異候補領域重複検出部２１０６は、大差分領域検出部２１０１から出力される差異候補領域情報、誤対応特徴点密集度探索部２１０３から出力される差異候補領域情報を受け取り、これらの２つの差異候補領域が重複している領域を差異領域と判断し、その差異領域情報を出力する。差異候補領域重複検出部２１０６から出力される差異領域情報は、大差分領域検出部２１０１と誤対応特徴点密集度探索部２１０３でいずれも差異候補領域として判定される領域の情報となっているため、信頼性の高い差異領域情報が出力される。

本実施の形態では、実施の形態２、３、４と同様、参照画像中の差異領域を事前にデータベース登録しておかなくても、参照画像中の差異領域を推定する事ができるため、物体識別を利用した検品システムで、多数の製品の中からどこかに傷を持つ製品だけを見分ける場合のように、事前に差異領域に関する情報を登録しておく事ができない場合に効果的である。また、本実施の形態では、そして、本実施の形態で行われる参照画像中の差異領域の推定は、差異領域が物体全体の場合であっても、物体の一部の場合であっても可能であるが、第２の実施の形態等と比べて、信頼性の高い差異領域が得られるため、高精度の識別を実現できる。なお、本実施の形態では、差異領域推定部２１が図２３や図２４の構成の場合、誤対応特徴点密集度探索部２１０３の前に物体領域推定部を加える事ができ、その場合、推定された物体領域の中から誤対応特徴点密集度探索を行って差異候補領域を推定することになる。この時、実施の形態３、４と同様、まず背景の影響を取り除いた上で、改めて差異領域を推定する事が可能であるため、図１０及び図１１に示した例のような場合に特に有効である。

（第６の実施の形態）
本発明の第６の実施の形態について図面を参照して説明する。

図２５は、本発明の第６の実施の形態である物体識別装置の構成を示すブロック図である。図２５に示すように、第６の実施の形態の物体識別装置は、局所特徴量抽出部１１、局所特徴量照合部１２、入力画像差異領域決定部１３、入力画像差異領域特徴量抽出部１４、特徴量照合部１５、差異領域推定部２２、差異領域特徴量抽出部１８を備える。このように、第６の実施の形態の物体識別装置では、第４の実施の形態の物体識別装置の差異領域推定部２０が差異領域推定部２２に変更されている点が第４の実施の形態と異なる。差異領域推定部２２の詳細については後述する。その他の構成要素については、第４の実施の形態と同様であり、同一の符号を付して詳細な説明は省略する。

図２６及び図２７は、差異領域推定部２２の構成例を表すブロック図であり、以下に各図について説明する。

図２６に示すように、差異領域推定部２２は、テンプレートマッチング部２２０１を備える。テンプレートマッチング部２２０１は、局所特徴量照合部１２から出力される局所特徴識別画像ＩＤに対応する参照画像（あるいはその局所特徴識別画像ＩＤに関連付いた参照画像群）を受け取ると共に、局所特徴量照合部１２から出力される局所特徴識別画像ＩＤに対応する差異領域のテンプレート画像（あるいはその局所特徴識別画像ＩＤに関連付いたテンプレート画像群）も受け取り、受け取った画像群に基づいて、差異領域情報を出力する。具体的には、このテンプレート画像は、差異領域周辺で典型的に見られる画像パターンである。テンプレートマッチング部２２０１は、参照画像中の各領域とこのテンプレート画像とをマッチングし、テンプレート画像に最も類似する領域を探すテンプレートマッチング処理を行うことによって、参照画像中の差異領域を推定する。すなわち、参照画像中において所定のパターン画像との類似度が所定値以上である領域が、参照画像中の差異領域として設定される。テンプレート画像は、図２５のように、あらかじめデータベースに記憶しておいても良いし、物体識別装置の外部から取得しても良い。

また、変形例として、図２７に示すように、差異領域推定部２２は、物体領域推定部９０１、及びテンプレートマッチング部２２０２を備えてもよい。図２７の物体領域推定部９０１は、図１７で示される差異領域推定部１９の構成要素である物体領域推定部９０１と同一であり、詳細な説明は省略する。

テンプレートマッチング部２２０２は、図２６で示される差異領域推定部２２の構成要素であるテンプレートマッチング部２２０１と類似している。テンプレートマッチング部２２０２は、局所特徴量照合部１２から出力される局所特徴識別画像ＩＤに対応する参照画像と、局所特徴量照合部１２から出力される局所特徴識別画像ＩＤに対応する差異領域のテンプレート画像とに加えて、物体領域推定部９０１から出力される物体領域情報が入力される点がテンプレートマッチング部２２０１と異なっている。テンプレートマッチング部２２０２は、参照画像中の物体領域についてのみ、テンプレート画像を用いたテンプレートマッチングを行う事により、参照画像中の差異領域を推定する事が可能である。また、テンプレートマッチング部２２０２は、テンプレート画像とマッチングする参照画像中の領域の範囲が限定されるため、テンプレート画像とマッチングする領域の範囲が参照画像全体であるテンプレートマッチング部２２０１と比べて高速な処理が可能である。

本実施の形態では、実施の形態２〜５と同様、参照画像中の差異領域を事前にデータベース登録しておく必要はないが、差異領域に見られる典型的な画像パターンが事前にわかれば、その画像パターンをテンプレート画像として利用する事で、差異領域を推定する事ができる。例えば、同一の封筒で宛名だけが異なる複数の郵便画像の中から特定の郵便だけを識別しようとする場合には、宛名が記載された領域は郵便番号・住所・宛名といったように文字列のレイアウトがある程度決まった画像パターンとして定義できるので効果的である。そして、本実施の形態で行われる参照画像中の差異領域の推定は、差異領域が物体全体の場合であっても、物体の一部の場合であっても可能であるが、差異領域推定部２２の構成が図２７の場合は、実施の形態３〜５と同様、まず物体領域を推定することにより背景の影響を取り除いた上で、改めて差異領域を推定する事が可能になるため、差異領域を高精度に推定する事ができ、図１０及び図１１に示した例のような場合に特に有効である。

（第７の実施の形態）
本発明の第７の実施の形態について図面を参照して説明する。

図２８は、本発明の第７の実施の形態である物体識別装置の構成を示すブロック図である。図２８に示すように、第７の実施の形態の物体識別装置は、局所特徴量抽出部１１、局所特徴量照合部１６、入力画像差異領域決定部１３、入力画像差異領域特徴量抽出部１４、特徴量照合部１５、差異領域推定部２３、差異領域特徴量抽出部１８を備える。このように、第７の実施の形態の物体識別装置では、第２の実施の形態の物体識別装置と第６の実施の形態の物体識別装置をあわせた構成になっている。第２の実施の形態の物体識別装置との比較では、差異領域推定部１７が差異領域推定部２３に変更されている点が第２の実施の形態とは異なる。差異領域推定部２３の詳細については後述する。その他の構成要素については、第２の実施の形態と同様であり、同一の符号を付して詳細な説明は省略する。

図２９、図３０及び図３１は、差異領域推定部２３の構成例を表すブロック図であり、以下に各図について説明する。

図２９に示す差異領域推定部２３は、誤対応特徴点密集度探索部２１０３、及びテンプレートマッチング部２３０１を備える。図２９の誤対応特徴点密集度探索部２１０３は、図２３に示した差異領域推定部２１の構成要素である誤対応特徴点密集度探索部２１０３と同一であり、詳細な説明は省略する。

また、図２９のテンプレートマッチング部２３０１は、図２７で示される差異領域推定部２２の構成要素であるテンプレートマッチング部２２０２と類似しているが、物体領域情報の代わりに差異候補領域情報が入力される点が異なっている。すなわち、図２９のテンプレートマッチング部２３０１は、誤対応特徴点密集度探索部２１０３で推定された参照画像中の差異候補領域についてのみ、テンプレート画像を用いたテンプレートマッチングを行い、参照画像中の差異領域を推定する。テンプレートマッチング部２３０１から出力される差異領域情報は、誤対応特徴点密集度探索部２１０３で推定される差異候補領域の中から、さらにテンプレートマッチング部２３０１によって差異領域を絞りこむため、信頼性の高い差異領域情報が出力される。

また、図３０に示す差異領域推定部２３は、テンプレートマッチング部２３０２、誤対応特徴点密集度探索部２１０２で構成する事も可能である。図３０のテンプレートマッチング部２３０２は、図２６に示した差異領域推定部２２の構成要素であるテンプレートマッチング部２２０１とほぼ同一であるが、差異領域情報ではなく差異候補領域情報を出力する点がテンプレートマッチング部２２０１とは異なっている。このテンプレートマッチング部２３０２が出力する差異候補領域情報は、テンプレートマッチング部２２０１で出力される差異領域情報と同一であっても良いし、その差異領域情報よりもわずかに広げた領域として捉え、その領域情報としても良い。

また、図３０の誤対応特徴点密集度探索部２１０２は、図２２で示される差異領域推定部２１の構成要素である誤対応特徴点密集度探索部２１０２と同一であり、詳細な説明は省略する。すなわち、図３０の誤対応特徴点密集度探索部２１０２は、対応特徴点のうち、テンプレートマッチング部２３０２で推定された参照画像中の差異候補領域の内部に存在する点のみに着目し、誤って対応している特徴点が密集している領域を探索し、差異領域を推定する。誤対応特徴点密集度探索部２１０２から出力される差異領域情報は、テンプレートマッチング部２３０２で推定される差異候補領域の中から、さらに誤対応特徴点密集度探索部２１０２によって差異領域を絞りこむため、信頼性の高い差異領域情報が出力される。

また、図３１に示す差異領域推定部２３は、誤対応特徴点密集度探索部２１０３、テンプレートマッチング部２３０２、差異候補領域重複検出部２１０６を備える。図３１の誤対応特徴点密集度探索部２１０３は、図２３で示される差異領域推定部２１の構成要素である誤対応特徴点密集度探索部２１０３と同一であり、詳細な説明は省略する。図３１のテンプレートマッチング部２３０２は、図３０で示される差異領域推定部２３の構成要素であるテンプレートマッチング部２３０２と同一であり、詳細な説明は省略する。差異候補領域重複検出部２１０６は、図２４で示される差異領域推定部２１の構成要素である差異候補領域重複検出部２１０６と同一であり、詳細な説明は省略する。

図３１の構成で差異候補領域重複検出部２１０６から出力される差異領域情報は、誤対応特徴点密集度探索部２１０３とテンプレートマッチング部２３０２でいずれも差異候補領域として判定される領域の情報となっているため、信頼性の高い差異領域情報が出力される。

本実施の形態では、実施の形態２〜６と同様、参照画像中の差異領域を事前にデータベース登録しておく必要はないが、実施の形態６と同様、差異領域に見られる典型的な画像パターンが事前にわかれば、その画像パターンをテンプレート画像として利用する事で、差異領域を推定する事ができる。例えば、同一の封筒で宛名だけが異なる複数の郵便画像の中から特定の郵便だけを識別しようとする場合には、宛名が記載された領域は郵便番号・住所・宛名といったように文字列のレイアウトがある程度決まった画像パターンとして定義できるので効果的である。そして、本実施の形態で行われる参照画像中の差異領域の推定は、差異領域が物体全体の場合であっても、物体の一部の場合であっても可能であるが、第５の実施の形態と同様、第２の実施の形態等と比べて、信頼性の高い差異領域が得られるため、高精度の識別を実現できる。なお、ここまで述べてきた本実施の形態は、第２の実施の形態の物体識別装置と第６の実施の形態の物体識別装置をあわせた構成の場合であるが、図２８の構成は、第３の実施の形態の物体識別装置と第６の実施の形態の物体識別装置をあわせた構成と捉えることもできる。すなわち、差異領域推定部２３が図２９、図３０、図３１の構成の場合、誤対応特徴点密集度探索部２１０３とテンプレートマッチング部２３０２の前に物体領域推定部を加える事ができ、この場合、背景の影響を取り除いた上で物体領域の中から差異領域を推定することになるため、図１０及び図１１に示した例のような場合に特に有効な構成となる。

（第８の実施の形態）
本発明の第８の実施の形態について図面を参照して説明する。

図３２は、本発明の第８の実施の形態である物体識別装置の構成を示すブロック図である。図３２に示すように、第８の実施の形態の物体識別装置は、局所特徴量抽出部１１、局所特徴量照合部１２、入力画像差異領域決定部１３、入力画像差異領域特徴量抽出部１４、特徴量照合部１５、差異領域推定部２４、差異領域特徴量抽出部１８を備える。このように、第８の実施の形態の物体識別装置では、第４の実施の形態の物体識別装置と第６の実施の形態の物体識別装置をあわせた構成になっており、第４の実施の形態の物体識別装置との比較では、差異領域推定部２０が差異領域推定部２４に変更されている点が異なる。差異領域推定部２４の詳細については後述する。その他の構成要素については、第４の実施の形態と同様であり、同一の符号を付して詳細な説明は省略する。

図３３から図３５は、差異領域推定部２４の構成例を表すブロック図であり、以下に各図について説明する。

図３３に示す差異領域推定部２４は、変換画像生成部２００１、差分画像生成部２００２、物体領域推定部２００３、大差分領域検出部２１０１、及びテンプレートマッチング部２３０１を備える。図３３の変換画像生成部２００１、差分画像生成部２００２、物体領域推定部２００３は、図１９で示される差異領域推定部２０の構成要素である変換画像生成部２００１、差分画像生成部２００２、物体領域推定部２００３と同一であり、詳細な説明は省略する。図３３の大差分領域検出部２１０１は、図２２で示される差異領域推定部２１の構成要素である大差分領域検出部２１０１と同一であり、詳細な説明は省略する。また、図３３のテンプレートマッチング部２３０１は、図２９で示される差異領域推定部２３の構成要素であるテンプレートマッチング部２３０１と同一であり、詳細な説明は省略する。

すなわち、図３３のテンプレートマッチング部２３０１は、大差分領域検出部２１０１で推定された参照画像中の差異候補領域についてのみテンプレート画像を用いたテンプレートマッチングを行い、参照画像中の差異領域を推定する。テンプレートマッチング部２３０１から出力される差異領域情報は、大差分領域検出部２１０１で推定される差異候補領域の中から、さらにテンプレートマッチング部２３０１によって差異領域を絞り込むため、信頼性の高い差異領域情報が出力される。

また、図３４に示す差異領域推定部２４は、変換画像生成部２００１、テンプレートマッチング部２３０２、差分画像生成部２１０４、及び大差分領域検出部２１０５を備える。図３４の変換画像生成部２００１は、図１９で示される差異領域推定部２０の構成要素である変換画像生成部２００１と同一であり、詳細な説明は省略する。また、図３４のテンプレートマッチング部２３０２は、図３０で示される差異領域推定部２３の構成要素であるテンプレートマッチング部２３０２と同一であり、詳細な説明は省略する。図３４の差分画像生成部２１０４及び大差分領域検出部２１０５は、それぞれ、図２３で示される差異領域推定部２１の構成要素である差分画像生成部２１０４及び大差分領域検出部２１０５と同一であり、詳細な説明は省略する。

大差分領域検出部２１０５から出力される差異領域情報は、テンプレートマッチング２３０２で推定される差異候補領域の中から、さらに大差分領域検出部２１０５によって差異領域を絞り込むため、信頼性の高い差異領域情報が出力される。

また、図３５に示す差異領域推定部２４は、変換画像生成部２００１、差分画像生成部２００２、物体領域推定部２００３、大差分領域検出部２１０１、テンプレートマッチング部２３０２、及び差異候補領域重複検出部２１０６を備える。

図３５の変換画像生成部２００１、差分画像生成部２００２、物体領域推定部２００３は、図１９で示される差異領域推定部２０の構成要素である変換画像生成部２００１、差分画像生成部２００２、物体領域推定部２００３と同一であり、詳細な説明は省略する。また、図３５の大差分領域検出部２１０１は、図２２で示される差異領域推定部２１の構成要素である大差分領域検出部２１０１と同一であり、詳細な説明は省略する。また、図３５のテンプレートマッチング部２３０２は、図３０で示される差異領域推定部２３の構成要素であるテンプレートマッチング部２３０２と同一であり、詳細な説明は省略する。また、図３５の差異候補領域重複検出部２１０６は、図２４で示される差異領域推定部２１の構成要素である差異候補領域重複検出部２１０６と同一であり、詳細な説明は省略する。

図３５の構成で差異候補領域重複検出部２１０６から出力される差異領域情報は、大差分領域検出部２１０１とテンプレートマッチング部２３０２でいずれも差異候補領域として判定される領域の情報となっているため、信頼性の高い差異領域情報が出力される。

本実施の形態では、実施の形態２〜７と同様、参照画像中の差異領域を事前にデータベース登録しておく必要はなく、実施の形態６や７と同様、差異領域に見られる典型的な画像パターンが事前にわかれば、その画像パターンをテンプレート画像として利用する事で、差異領域を推定する事ができる。例えば、同一の封筒で宛名だけが異なる複数の郵便画像の中から特定の郵便だけを識別しようとする場合には、宛名が記載された領域は郵便番号・住所・宛名といったように文字列のレイアウトがある程度決まった画像パターンとして定義できるので効果的である。そして、本実施の形態で行われる参照画像中の差異領域の推定は、差異領域が物体全体の場合であっても、物体の一部の場合であっても可能であるが、第５及び第７の実施の形態と同様、第２の実施の形態等と比べて、信頼性の高い差異領域が得られるため、高精度の識別を実現できる。なお、本実施の形態では、差異領域推定部２４が図３４や図３５の構成の場合、テンプレートマッチング部２３０２の前に物体領域推定部を加える事ができ、その場合、背景の影響を取り除いた上で物体領域の中から差異領域を推定することになるため、図１０や図１１の場合に特に有効な構成となる。

（第９の実施の形態）
本発明の第９の実施の形態について図面を参照して説明する。

図３６は、本発明の第９の実施の形態である物体識別装置の構成を示すブロック図である。図３６に示すように、第９の実施の形態の物体識別装置は、局所特徴量抽出部１１、局所特徴量照合部１６、入力画像差異領域決定部１３、入力画像差異領域特徴量抽出部１４、特徴量照合部１５、差異領域推定部２５、及び差異領域特徴量抽出部１８を備える。

このように、第９の実施の形態の物体識別装置では、第５の実施の形態の物体識別装置と第６の実施の形態の物体識別装置をあわせた構成になっている。第９の実施の形態の物体識別装置は、第５の実施の形態の物体識別装置との比較では、差異領域推定部２１が差異領域推定部２５に変更されている点が異なる。差異領域推定部２５の詳細については後述する。その他の構成要素については、第５の実施の形態と同様であり、同一の符号を付して詳細な説明は省略する。

差異領域推定部２５は、図１４のように誤対応特徴点密集度探索部７０１のみで差異領域を推定する構成と、図１９のように変換画像生成部２００１、差分画像生成部２００２、物体領域推定部２００３、及び大差分領域検出部２００４で差異領域を推定する構成と、図２６のようにテンプレートマッチング部２２０１のみで差異領域を推定する構成の組み合わせとして構成する事ができる。これら３つの差異領域を推定する構成に関して、ある１つの構成でまず差異候補領域を推定した後、別の構成でその差異候補領域を更に絞り込んでいく構成にする場合、３つの差異領域を推定する構成をどのような順番で構成しても良い。また、これら３つの差異領域を推定する構成に関して、各構成で差異候補領域をそれぞれ推定し、その各構成で推定された差異候補領域の重複領域を最終的な差異領域として出力するような構成にしても良い。また、これら３つの差異領域を推定する構成に関して、ある１つの構成でまず差異候補領域を推定した後、その差異候補領域の中から、残り２つの各構成で差異候補領域をそれぞれ絞り込み、その２つの構成で推定された差異候補領域の重複領域を最終的な差異領域として出力するような構成にしても良い。また、これら３つの差異領域を推定する構成に関して、まず２つの構成で差異候補領域をそれぞれ推定し、その２つの構成で推定された差異候補領域の重複領域の中から、残り１つの構成で差異候補領域を絞り込み、そこで絞り込まれた領域を最終的な差異領域として出力するような構成にしても良い。

図３７及び図３８は、差異領域推定部２５の構成例を表すブロック図であり、以下に各図について説明する。

図３７に示すように、差異領域推定部２５は、変換画像生成部２００１、差分画像生成部２００２、物体領域推定部２００３、大差分領域検出部２１０１、テンプレートマッチング部２５０１、及び誤対応特徴点密集度探索部２１０２を備える。

図３７の変換画像生成部２００１、差分画像生成部２００２、物体領域推定部２００３は、図１９で示される差異領域推定部２０の構成要素である変換画像生成部２００１、差分画像生成部２００２、物体領域推定部２００３と同一であり、詳細な説明は省略する。図３７の大差分領域検出部２１０１は、図２２の大差分領域検出部２１０１と同一であり、詳細な説明は省略する。

図３７のテンプレートマッチング部２５０１は、図２９で示される差異領域推定部２３の構成要素であるテンプレートマッチング部２３０１とほぼ同一であるが、差分領域情報ではなく差分候補領域情報を出力する点が異なっている。

図３７の誤対応特徴点密集度探索部２１０２は、図２２で示される差異領域推定部２１の構成要素である誤対応特徴点密集度探索部２１０２と同一であり、詳細な説明は省略する。すなわち、図３７の誤対応特徴点密集度探索部２１０２は、対応特徴点のうち、テンプレートマッチング部２５０１で推定された参照画像中の差異候補領域の内部に存在する点のみに着目し、誤って対応している特徴点が密集している領域を探索し、差異領域を推定する。そして、このテンプレートマッチング部２５０１も、大差分領域検出部２１０１で推定された参照画像中の差異候補領域についてのみテンプレート画像を用いたテンプレートマッチングを行い、参照画像中の差異領域候補を推定する。誤対応特徴点密集度探索部２１０２から出力される差異領域情報は、大差分領域検出部２１０１及びテンプレートマッチング部２５０１で推定される差異候補領域の中から、さらに誤対応特徴点密集度探索部２１０２によって差異領域を絞りこむため、信頼性の高い差異領域情報が出力される。

また、図３８に示すように、差異領域推定部２５は、変換画像生成部２００１、差分画像生成部２００２、物体領域推定部２００３、大差分領域検出部２１０１、テンプレートマッチング部２３０２、誤対応特徴点密集度探索部２１０３、及び差異候補領域重複検出部２５０２で構成する事も可能である。図３８の変換画像生成部２００１、差分画像生成部２００２、物体領域推定部２００３は、図１９で示される差異領域推定部２０の構成要素である変換画像生成部２００１、差分画像生成部２００２、物体領域推定部２００３と同一であり、詳細な説明は省略する。また、図３８の大差分領域検出部２１０１は、図２２で示される差異領域推定部２１の構成要素である大差分領域検出部２１０１と同一であり、詳細な説明は省略する。また、図３８のテンプレートマッチング部２３０２は、図３０で示される差異領域推定部２３の構成要素であるテンプレートマッチング部２３０２と同一であり、詳細な説明は省略する。また、図３８の誤対応特徴点密集度探索部２１０３は、図２３で示される差異領域推定部２１の構成要素である誤対応特徴点密集度探索部２１０３と同一であり、詳細な説明は省略する。

図３８の差異候補領域重複検出部２５０２は、図２４で示される差異領域推定部２１の構成要素である差異候補領域重複検出部２１０６と類似している。図３８の差異候補領域重複検出部２５０２は、大差分領域検出部２１０１、テンプレートマッチング部２３０２、誤対応特徴点密集度探索部２１０３からそれぞれ出力される３つの差異候補領域情報を受け取り、これらの３つの差異候補領域が重複している領域を差異領域と判断し、その差異領域情報を出力するという点が差異候補領域重複検出部２１０６と異なっている。差異候補領域重複検出部２５０２から出力される差異領域情報は、大差分領域検出部２１０１とテンプレートマッチング２３０２と誤対応特徴点密集度探索部２１０３でいずれも差異候補領域として判定される領域の情報となっているため、信頼性の高い差異領域情報が出力される。

なお、差異領域推定部２５は、図３７や図３８以外でも構成することができる。例えば、まず誤対応特徴点密集度探索部２１０３で推定された差異候補領域に対して、テンプレートマッチング部２５０１でさらに差異候補領域を絞り込む。この絞り込まれた差異候補領域の中からさらに、変換画像生成部２００１、差分画像生成部２１０４、大差分領域検出部２１０５の組み合わせで最終的な差異領域情報を推定しても良い。また、誤対応特徴点密集度探索を用いた差異候補領域の推定、テンプレートマッチングを用いた差異候補領域の推定、大差分領域検出を用いた差異候補領域の推定の処理順は、ここまで述べてきた構成例以外の順序であっても良い。

本実施の形態では、実施の形態２〜８と同様、参照画像中の差異領域を事前にデータベース登録しておく必要はないが、実施の形態６〜８と同様、差異領域に見られる典型的な画像パターンが事前にわかれば、その画像パターンをテンプレート画像として利用する事で、差異領域を推定する事ができる。例えば、同一の封筒で宛名だけが異なる複数の郵便画像の中から特定の郵便だけを識別しようとする場合には、宛名が記載された領域は郵便番号・住所・宛名といったように文字列のレイアウトがある程度決まった画像パターンとして定義できるので効果的である。そして、本実施の形態で行われる参照画像中の差異領域の推定は、差異領域が物体全体の場合であっても、物体の一部の場合であっても可能であるが、第５、７、８の実施の形態と同様、第２の実施の形態等と比べて、信頼性の高い差異領域が得られるため、高精度の識別を実現できる。なお、本実施の形態では、例えば、差異領域推定部２５が図３８の構成の場合、テンプレートマッチング部２３０２や誤対応特徴点密集度探索部２１０３の前に物体領域推定部を加える事ができ、その場合、背景の影響を取り除いた上で物体領域の中から差異領域を推定することになるため、図１０や図１１の場合に特に有効な構成となる。

（第１０の実施の形態）
本発明の第１０の実施の形態について図面を参照して説明する。

図３９は、本発明の第１０の実施の形態である物体識別装置の構成例を示すブロック図である。図３９に示すように、第１０の実施の形態の物体識別装置は、局所特徴量抽出部１１、局所特徴量照合部１２、入力画像差異領域決定部１３、入力画像差異領域特徴量抽出部２６、特徴量照合部２７を備える。

このように、第１０の実施の形態の物体識別装置では、第１の実施の形態の物体識別装置の入力画像差異領域特徴量抽出部１４及び特徴量照合部１５が、入力画像差異領域特徴量抽出部２６及び特徴量照合部２７に変更されている点が異なる。入力画像差異領域特徴量抽出部２６と特徴量照合部２７の詳細については後述する。その他の構成要素については、第１の実施の形態と同様であり、同一の符号を付して詳細な説明は省略する。

図４０は、入力画像差異領域特徴量抽出部２６の構成例を表すブロック図である。図４０に示すように、入力画像差異領域特徴量抽出部２６は、差異領域局所特徴量抽出部２６０１を備える。

差異領域局所特徴量抽出部２６０１は、入力画像差異領域決定部１３から出力される入力画像差異領域情報と、局所特徴量抽出部１１において入力画像から抽出される局所特徴量である局所特徴量１とを受け取り、受け取った入力画像差異領域情報及び局所特徴量に基づいて特徴量１を抽出する。ここで抽出される特徴量１は、局所特徴量１を記述する際の基となっている特徴点の座標情報に基づき、入力画像の差異領域内に存在する特徴点を探索し、その特徴点周辺の情報を局所特徴量として記述した特徴量を特徴量１として出力する。すなわち、ここで出力される特徴量１は、局所特徴量１の一部を切り出して生成した特徴量である。本実施の形態において、特徴量照合部２７で特徴量１と照合する特徴量２は、特徴量１と同様、参照画像から抽出された局所特徴量である局所特徴量２の一部を切り出して生成した特徴量である。

図４１は、特徴量照合部２７の構成例を表すブロック図である。図４１に示すように、特徴量照合部２７は、対応特徴点決定部２０１、誤対応点除去部２７０１、識別スコア算出部２０３、及び閾値判定部２７０２を備える。図４１の対応特徴点決定部２０１、識別スコア算出部２０３は、図４で示される局所特徴量照合部１２の構成要素である対応特徴点決定部２０１、識別スコア算出部２０３と同一であり、詳細な説明は省略する。

図４１の誤対応点除去部２７０１は、図４で示される局所特徴量照合部１２の構成要素である誤対応点除去部２０２とほぼ同一だが、幾何変換情報は出力せず、対応特徴点情報のみを出力する点が異なっている。図４１の閾値判定部２７０２は、図４で示される局所特徴量照合部１２の構成要素である閾値判定部２０４とほぼ同一だが、局所特徴識別画像ＩＤではなく差異領域識別画像ＩＤを出力している点が異なっている。

以上のように本実施の形態では、特徴量照合部２７による照合で用いられる入力画像の特徴量と参照画像の特徴量はそれぞれ、局所特徴量照合部１２による照合（判定）で用いられた入力画像の特徴量と参照画像の特徴量のそれぞれの一部である。

本実施の形態では、実施の形態１〜９とは異なり、局所特徴量の一部を切り出して生成した特徴量を差異領域の識別に使用するので、入力画像差異領域特徴量抽出部において特徴量を生成する際は、入力画像から抽出された局所特徴量が入力されれば良く、入力画像そのものを必要としない。そのため、局所特徴量の抽出のみをクライアント側で行い、その他の処理をサーバー側で行うようなサーバークライアントシステムとして物体識別装置が構成されている場合、本実施の形態では、入力画像よりも軽量な局所特徴量のみをサーバー側に伝送すれば良く、識別結果を得るまでの処理時間を短縮させる事が可能となる。また、本実施の形態における特徴量照合部では、局所特徴量照合部とほぼ同一の処理を行うが、差異領域以外から検出される特徴点の対応による影響を除外し、差異領域のみでの照合を行う事ができるため、画像全体から抽出された局所特徴量を全て用いる従来の方式と比べて、物体内の差異をより見分ける事ができ、結果的に高精度の識別を実現可能となる。なお、本実施の形態の構成例として、ここまで順番に説明してきた図３９は、第１の実施の形態を基にした構成であるが、同様に、第２〜９の実施の形態をそれぞれ基にした構成にする事も可能である。すなわち、第２〜９の実施の形態の構成例における入力画像差異領域特徴量抽出部１４への入力を、入力画像ではなく局所特徴量１にして構成する事も可能である。

（第１１の実施の形態）
本発明の第１１の実施の形態について図面を参照して説明する。

図４２は、本発明の第１１の実施の形態である物体識別装置の構成例を示すブロック図である。図４２に示すように、第１１の実施の形態の物体識別装置は、局所特徴量抽出部１１、局所特徴量照合部２８、入力画像差異領域決定部１３、入力画像差異領域特徴量抽出部１４、特徴量照合部２９、及び識別スコア統合判定部３０を備える。

このように、第１１の実施の形態の物体識別装置では、第１の実施の形態の物体識別装置の局所特徴量照合部１２及び特徴量照合部１５が、局所特徴量照合部２８及び特徴量照合部２９に変更され、識別スコア統合判定部３０が新たな構成要素として加わっている点が第１の実施の形態とは異なる。局所特徴量照合部２８、特徴量照合部２９、識別スコア統合判定部３０の詳細については後述する。その他の構成要素については、第１の実施の形態と同様であり、同一の符号を付して詳細な説明は省略する。

図４３は、局所特徴量照合部２８の構成例を表すブロック図である。図４３に示すように、局所特徴量照合部２８は、対応特徴点決定部２０１、誤対応点除去部２０２、識別スコア算出部２０３、及び閾値判定部２８０１を備える。

図４３の対応特徴点決定部２０１、誤対応点除去部２０２、識別スコア算出部２０３は、図４に示した局所特徴量照合部１２の構成要素である対応特徴点決定部２０１、誤対応点除去部２０２、識別スコア算出部２０３と同一であり、詳細な説明は省略する。

図４３の閾値判定部２８０１は、図４に示した局所特徴量照合部１２の構成要素である閾値判定部２０４とほぼ同一だが、局所特徴識別画像ＩＤだけではなく、その局所特徴識別画像ＩＤに対応する参照画像（あるいはそれと関連付いた参照画像群）から抽出した局所特徴との識別スコアを出力している点が異なっている。この閾値判定部２８０１で設定される閾値は、閾値判定部２０４で設定される閾値よりも緩めにして、局所特徴識別画像ＩＤと識別スコアが多数出力されるようにしても良い。

図４４は、特徴量照合部２９の構成例を表すブロック図である。図４４に示すように、特徴量照合部２９は、差異領域識別スコア算出部５０１、及び閾値判定部２９０１を備える。図４４の差異領域識別スコア算出部５０１は、図６に示した特徴量照合部１５の構成要素である差異領域識別スコア算出部５０１と同一であり、詳細な説明は省略する。

図４４の閾値判定部２９０１は、図６で示される特徴量照合部１５の構成要素である閾値判定部５０２とほぼ同一だが、差異領域識別画像ＩＤだけではなく、その差異領域識別画像ＩＤに対応する参照画像あるいはそれと関連付いた参照画像群の差異領域から抽出した特徴量との差異領域識別スコアを出力している点が異なっている。この閾値判定部２９０１で設定される閾値は、閾値判定部５０２で設定される閾値よりも緩めにして、差異領域識別画像ＩＤと差異領域識別スコアが多数出力されるようにしても良い。

図４５は、識別スコア統合判定部３０の構成例を表すブロック図である。図４５に示すように、識別スコア統合判定部３０は、識別スコア統合部３００１、及び閾値判定部３００２を備える。

識別スコア統合部３００１は、局所特徴量照合部２８から出力された識別スコアと、特徴量照合部２９から出力された差異領域識別スコアとを受け取り、受け取ったスコアに基づいて統合スコアを算出して出力する。この時、例えば同一の画像ＩＤに対応する識別スコアと差異領域識別スコアの積を求め、その値を統合スコアとして出力しても良い。

図４５の閾値判定部３００２は、図４で示される局所特徴量照合部１２の構成要素である閾値判定部２０４や図６で示される特徴量照合部１５の構成要素である閾値判定部５０２とほぼ同一である。閾値判定部２０４及び閾値判定部５０２と異なる点として、閾値判定部３００２は、識別スコア統合部３００１から出力された統合スコアを所定の閾値と比較し、閾値以上となる場合、その入力画像と参照画像は、同一の物体を被写体とする画像であると判定し、その入力画像の画像ＩＤを識別画像ＩＤとして出力し、閾値未満の場合、その入力画像と参照画像は、同一の物体を被写体とする画像ではないと判定する。すなわち、閾値判定部３００２は、局所特徴量照合部２８による照合の結果と、特徴量照合部２９による照合の結果とに基づいて、入力画像と参照画像は、同一の物体を被写体とする画像であるか否かを判定する。

本実施の形態では、実施の形態１〜１０とは異なり、差異領域識別スコアだけで最終的な識別結果を決定するのではなく、これらを局所特徴量による識別スコアと統合したスコアから最終的な識別結果を判定する。同一物体を写した画像が悪環境（例えば、暗い環境）で、他の類似物体は理想的な環境で撮影されているような場合、それらの類似物体がテクスチャだけでなく色味も類似しているとしたら、差異領域から抽出した特徴量だけでは正しい識別ができないが、局所特徴量による識別結果とあわせることで、同一物体に対する識別結果を相対的に上げる事ができる。なお、本実施の形態の構成例として、ここまで順番に説明してきた図４２は、第１の実施の形態を基にした構成であり、同様に、第２〜１０の実施の形態をそれぞれ基にした構成にする事も可能である。すなわち、第２〜１０の実施の形態の構成例において、局所特徴量照合部から識別スコアを、特徴量照合部から差異領域識別スコアを、それぞれ出力するようにし、それらを識別スコア統合判定部に入力させる事で構成する事が可能である。

本発明の具体的な構成は前述の実施の形態に限られるものではなく、この発明の要旨を逸脱しない範囲の変更があってもこの発明に含まれる。

この出願は、２０１２年８月２３日に出願された日本出願特願２０１２−８１４５３４を基礎とする優先権を主張し、その開示の全てをここに取り込む。

以上、実施形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。

上記の実施の形態の一部または全部は、以下の付記のようにも記載されうるが、以下には限られない。

（付記１）入力画像から抽出した特徴点のそれぞれの特徴量と、参照画像から抽出した特徴点のそれぞれの特徴量とが正しく対応しているか否かを判定する局所特徴量照合手段と、
前記局所特徴量照合手段によって正しく対応していると判定された特徴量の組み合わせ数に基づくスコアが所定値以上である場合、前記入力画像と前記参照画像との間の幾何的なずれを補正する幾何変換を前記参照画像の所定の領域に対して行うことによって得られた画像領域の位置に対応する前記入力画像における領域の特徴量を抽出する入力画像差異領域特徴量抽出手段と、
前記入力画像差異領域特徴量抽出手段によって抽出された特徴量と、前記参照画像の前記所定の領域から抽出された特徴量とを照合し、照合結果を出力する特徴量照合手段と
を備えたことを特徴とする物体識別装置。

（付記２）前記参照画像の前記所定の領域についての情報を記憶した記憶手段を備えることを特徴とする付記１に記載の物体識別装置。

（付記３）前記参照画像の前記所定の領域は、前記局所特徴量照合手段によって特徴量が誤って対応していると判定された参照画像における特徴点を含む領域であることを特徴とする付記１に記載の物体識別装置。

（付記４）前記参照画像の前記所定の領域は、物品が写った領域のうち、前記局所特徴量照合手段によって特徴量が誤って対応していると判定された参照画像における特徴点を含む領域であることを特徴とする付記１に記載の物体識別装置。

（付記５）前記参照画像の前記所定の領域は、前記入力画像と前記参照画像との間の幾何的なずれを補正する幾何変換を前記入力画像に対して行うことで得られた画像と前記参照画像との間の差分が所定値以上である領域を含むことを特徴とする付記１に記載の物体識別装置。

（付記６）前記参照画像の前記所定の領域は、物品が写った領域のうち前記局所特徴量照合手段によって特徴量が誤って対応していると判定された特徴点を含み、かつ、前記入力画像と前記参照画像との間の幾何的なずれを補正する幾何変換を前記入力画像に対して行うことで得られた画像と前記参照画像との間の差分が所定値以上である領域を含む領域であることを特徴とする付記１に記載の物体識別装置。

（付記７）前記参照画像の前記所定の領域は、前記参照画像中において所定のパターン画像との類似度が所定値以上である領域を含む領域であることを特徴とする付記１に記載の物体識別装置。

（付記８）前記参照画像の前記所定の領域は、前記参照画像中において、前記局所特徴量照合手段によって特徴量が誤って対応していると判定され、かつ、所定のパターン画像との類似度が所定値以上である領域を含む領域であることを特徴とする付記１に記載の物体識別装置。

（付記９）前記参照画像の前記所定の領域は、前記入力画像と前記参照画像との間の幾何的なずれを補正する幾何変換を前記入力画像に対して行うことで得られた画像と前記参照画像との間の差分が所定値以上であり、かつ、前記参照画像中において所定のパターン画像との類似度が所定値以上である領域を含む領域であることを特徴とする付記１に記載の物体識別装置。

（付記１０）前記参照画像の前記所定の領域は、前記局所特徴量照合手段によって特徴量が誤って対応していると判定された特徴点を含み、かつ、前記入力画像と前記参照画像との間の幾何的なずれを補正する幾何変換を前記入力画像に対して行うことで得られた画像と前記参照画像との間の差分が所定値以上であり、かつ、前記参照画像中において所定のパターン画像との類似度が所定値以上である領域を含む領域であることを特徴とする付記１に記載の物体識別装置。

（付記１１）前記特徴量照合手段による照合で用いられる前記入力画像の特徴量と前記参照画像の特徴量はそれぞれ、前記局所特徴量照合手段による判定で用いられた前記入力画像の特徴量と前記参照画像の特徴量のそれぞれの一部であることを特徴とする付記１から１０のいずれか１つに記載の物体識別装置。

（付記１２）前記局所特徴量照合手段による前記判定の結果と、前記特徴量照合手段による前記照合の結果とに基づいて、前記入力画像と前記参照画像は、同一の物体を被写体とする画像であるか否かを判定する統合判定手段を備えることを特徴とする付記１から１１のいずれか１つに記載の物体識別装置。

（付記１３）入力画像から抽出した特徴点のそれぞれの特徴量と、参照画像から抽出した特徴点のそれぞれの特徴量とが正しく対応しているか否かを判定する局所特徴量照合ステップと、
前記局所特徴量照合ステップによって正しく対応していると判定された特徴量の組み合わせ数に基づくスコアが所定値以上である場合、前記入力画像と前記参照画像との間の幾何的なずれを補正する幾何変換を前記参照画像の所定の領域に対して行うことによって得られた画像領域の位置に対応する前記入力画像における領域の特徴量を抽出する入力画像差異領域特徴量抽出ステップと、
前記入力画像差異領域特徴量抽出ステップによって抽出された特徴量と、前記参照画像の前記所定の領域から抽出された特徴量とを照合し、照合結果を出力する特徴量照合ステップと
を備えたことを特徴とする物体識別方法。

（付記１４）コンピュータを
入力画像から抽出した特徴点のそれぞれの特徴量と、参照画像から抽出した特徴点のそれぞれの特徴量とが正しく対応しているか否かを判定する局所特徴量照合手段、
前記局所特徴量照合手段によって正しく対応していると判定された特徴量の組み合わせ数に基づくスコアが所定値以上である場合、前記入力画像と前記参照画像との間の幾何的なずれを補正する幾何変換を前記参照画像の所定の領域に対して行うことによって得られた画像領域の位置に対応する前記入力画像における領域の特徴量を抽出する入力画像差異領域特徴量抽出手段、
前記入力画像差異領域特徴量抽出手段によって抽出された特徴量と、前記参照画像の前記所定の領域から抽出された特徴量とを照合し、照合結果を出力する特徴量照合手段
として機能させるためのプログラム。

従来の局所特徴量のみを用いた物体識別では、同一銘柄でパッケージの色や一部の文字のみが異なる製品の正確な識別、同一封筒で宛名だけが異なる郵便物の正確な識別は困難であるが、本発明によれば、従来の局所特徴量による照合だけでは識別できなかった細かな差異を見分け、同一の物体を写した画像のみを識別する事が可能になり、バーコードレスのPOSシステム、検品システム、郵便物自動仕分けシステム等に適用可能である。

１１局所特徴量抽出部
１２局所特徴量照合部
１３入力画像差異領域決定部
１４入力画像差異領域特徴量抽出部
１５特徴量照合部
１６局所特徴量照合部
１７差異領域推定部
１８差異領域特徴量抽出部
１９、２０、２１、２２、２３、２４、２５差異領域推定部
２６入力画像差異領域特徴量抽出部
２７特徴量照合部
２８局所特徴量照合部
２９特徴量照合部
３０識別スコア統合判定部
１０１輝度情報抽出部
１０２局所特徴点検出部
１０３局所特徴量生成部
２０１対応特徴点決定部
２０２誤対応点除去部
２０３識別スコア算出部
２０４閾値判定部
４０１差異領域画像生成部
４０２差異領域特徴量算出部
５０１差異領域識別スコア算出部
５０２閾値判定部
７０１誤対応特徴点密集度探索部
８０１差異領域画像生成部
８０２差異領域特徴量算出部
９０１物体領域推定部
９０２誤対応特徴点密集度探索部
２００１変換画像生成部
２００２差分画像生成部
２００３物体領域推定部
２００４、２１０１大差分領域検出部
２１０２、２１０３誤対応特徴点密集度探索部
２１０４差分画像生成部
２１０５大差分領域検出部
２１０６差異候補領域重複検出部
２２０１、２２０２、２３０１、２３０２、２５０１テンプレートマッチング部
２５０２差異候補領域重複検出部
２６０１差異領域局所特徴量抽出部
２７０１誤対応点除去部
２７０２、２８０１、２９０１、３００２閾値判定部
３００１識別スコア統合部

Claims

入力画像から抽出した特徴点のそれぞれの特徴量と、参照画像から抽出した特徴点のそれぞれの特徴量とが正しく対応しているか否かを判定する局所特徴量照合手段と、
前記局所特徴量照合手段によって正しく対応していると判定された特徴量の組み合わせ数に基づくスコアが所定値以上である場合、前記入力画像と前記参照画像との間の幾何的なずれを補正する幾何変換を前記参照画像の所定の領域に対して行うことによって得られた画像領域の位置に対応する前記入力画像における領域の特徴量を抽出する入力画像差異領域特徴量抽出手段と、
前記入力画像差異領域特徴量抽出手段によって抽出された特徴量と、前記参照画像の前記所定の領域から抽出された特徴量とを照合し、照合結果を出力する特徴量照合手段と
を備え、
前記特徴量照合手段による照合で用いられる前記入力画像の特徴量と前記参照画像の特徴量はそれぞれ、前記局所特徴量照合手段による判定で用いられた前記入力画像の特徴量と前記参照画像の特徴量のそれぞれの一部であることを特徴とする物体識別装置。
前記参照画像の前記所定の領域についての情報を記憶した記憶手段を備えることを特徴とする請求項１に記載の物体識別装置。
前記参照画像の前記所定の領域は、前記局所特徴量照合手段によって特徴量が誤って対応していると判定された参照画像における特徴点を含む領域であることを特徴とする請求項１に記載の物体識別装置。
前記参照画像の前記所定の領域は、物品が写った領域のうち、前記局所特徴量照合手段によって特徴量が誤って対応していると判定された参照画像における特徴点を含む領域であることを特徴とする請求項１に記載の物体識別装置。
前記参照画像の前記所定の領域は、前記入力画像と前記参照画像との間の幾何的なずれを補正する幾何変換を前記入力画像に対して行うことで得られた画像と前記参照画像との間の差分が所定値以上である領域を含むことを特徴とする請求項１に記載の物体識別装置。
前記参照画像の前記所定の領域は、物品が写った領域のうち前記局所特徴量照合手段によって特徴量が誤って対応していると判定された特徴点を含み、かつ、前記入力画像と前記参照画像との間の幾何的なずれを補正する幾何変換を前記入力画像に対して行うことで得られた画像と前記参照画像との間の差分が所定値以上である領域を含む領域であることを特徴とする請求項１に記載の物体識別装置。
前記参照画像の前記所定の領域は、前記参照画像中において所定のパターン画像との類似度が所定値以上である領域を含む領域であることを特徴とする請求項１に記載の物体識別装置。
入力画像から抽出した特徴点のそれぞれの特徴量と、参照画像から抽出した特徴点のそれぞれの特徴量とが正しく対応しているか否かを判定する局所特徴量照合ステップと、
前記局所特徴量照合ステップによって正しく対応していると判定された特徴量の組み合わせ数に基づくスコアが所定値以上である場合、前記入力画像と前記参照画像との間の幾何的なずれを補正する幾何変換を前記参照画像の所定の領域に対して行うことによって得られた画像領域の位置に対応する前記入力画像における領域の特徴量を抽出する入力画像差異領域特徴量抽出ステップと、
前記入力画像差異領域特徴量抽出ステップによって抽出された特徴量と、前記参照画像の前記所定の領域から抽出された特徴量とを照合し、照合結果を出力する特徴量照合ステップと
を備え、
前記特徴量照合ステップによる照合で用いられる前記入力画像の特徴量と前記参照画像の特徴量はそれぞれ、前記局所特徴量照合ステップによる判定で用いられた前記入力画像の特徴量と前記参照画像の特徴量のそれぞれの一部であることを特徴とする物体識別方法。
コンピュータを
入力画像から抽出した特徴点のそれぞれの特徴量と、参照画像から抽出した特徴点のそれぞれの特徴量とが正しく対応しているか否かを判定する局所特徴量照合手段、
前記局所特徴量照合手段によって正しく対応していると判定された特徴量の組み合わせ数に基づくスコアが所定値以上である場合、前記入力画像と前記参照画像との間の幾何的なずれを補正する幾何変換を前記参照画像の所定の領域に対して行うことによって得られた画像領域の位置に対応する前記入力画像における領域の特徴量を抽出する入力画像差異領域特徴量抽出手段、
前記入力画像差異領域特徴量抽出手段によって抽出された特徴量と、前記参照画像の前記所定の領域から抽出された特徴量とを照合し、照合結果を出力する特徴量照合手段
として機能させ、
前記特徴量照合手段による照合で用いられる前記入力画像の特徴量と前記参照画像の特徴量はそれぞれ、前記局所特徴量照合手段による判定で用いられた前記入力画像の特徴量と前記参照画像の特徴量のそれぞれの一部である、プログラム。