JP6143111B2 - 物体識別装置、物体識別方法、及びプログラム - Google Patents

物体識別装置、物体識別方法、及びプログラム Download PDF

Info

Publication number
JP6143111B2
JP6143111B2 JP2014531522A JP2014531522A JP6143111B2 JP 6143111 B2 JP6143111 B2 JP 6143111B2 JP 2014531522 A JP2014531522 A JP 2014531522A JP 2014531522 A JP2014531522 A JP 2014531522A JP 6143111 B2 JP6143111 B2 JP 6143111B2
Authority
JP
Japan
Prior art keywords
feature amount
feature
region
unit
input image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014531522A
Other languages
English (en)
Other versions
JPWO2014030399A1 (ja
Inventor
亮太 間瀬
亮太 間瀬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2014030399A1 publication Critical patent/JPWO2014030399A1/ja
Application granted granted Critical
Publication of JP6143111B2 publication Critical patent/JP6143111B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/10Selection of transformation methods according to the characteristics of the input images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/751Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/759Region-based matching

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Description

本発明は、画像中の物体を正確に識別する装置及び方法及びプログラムに関する。
画像内の被写体を、撮影サイズや角度の変化、オクルージョンに対して頑健に識別可能とするために、画像内の特徴的な点(特徴点)を多数検出し、各特徴点周辺の局所領域の特徴量(局所特徴量)を抽出する方式が提案されている。その代表的な方式として、特許文献1や非特許文献1には、SIFT(Scale Invariant Feature Transform)特徴量を用いる局所特徴量抽出装置が開示されている。
従来、局所特徴量抽出装置では、まず画像の各画素から輝度に関する情報のみを抽出し、抽出した輝度情報から特徴的な点(特徴点)を多数検出し、各特徴点に関する情報である特徴点情報を出力する。ここで、特徴点情報とは、例えば、検出された局所特徴点の座標位置やスケール、特徴点のオリエンテーション等を示すものである。そして、検出された各特徴点の座標値、スケール、及びオリエンテーション等の特徴点情報から、特徴量抽出を行う局所領域を取得して、局所特徴量を生成(記述)する。
例えば、非特許文献1に記載されているように、撮影した画像内の被写体と同一の被写体が写っている画像を識別するために、撮影した画像(すなわち入力画像)から抽出される局所特徴量1と、参照する画像から生成される局所特徴量2とを比較する。具体的には、まず、局所特徴量1を構成する複数の特徴点についての各特徴量と、局所特徴量2を構成する複数の特徴点についての各特徴量との全組み合わせについて、特徴空間上での距離計算を行い、最も近傍にある特徴量を対応している特徴量と判定する。対応している特徴量については、特徴量生成の元となっている特徴点についても対応していると判定する。その後、対応していると判定された特徴点の組み合わせに関して、入力画像における特徴点の座標位置を特定の幾何変換に従って移動したときの座標位置と、参照画像における特徴点の座標位置とが一致するか否かに基づいて、対応している特徴点の正誤を決定する。ここで正しく対応していると判定される特徴点数が一定値以上であるとき、同一の被写体が写っている(すなわち、入力画像内の被写体と参照画像内の被写体とが一致する)と判定される。
米国特許第6711293号明細書 特開2010−79545号公報
David G. Lowe著、「Distinctive image features from scale-invariant keypoints」、(米国)、International Journal of Computer Vision、60(2)、2004年、p. 91-110
従来の局所特徴量を利用する物体識別方式は、入力画像の輝度情報から抽出される局所特徴量と、参照画像の輝度情報から抽出される局所特徴量との対応関係に基づいて物体の識別を行っている。このような識別方法では、入力画像に写っている物体と参照画像に写っている物体とは異なるものであるが、両者の間にわずかな差異しか存在しない場合、対応する特徴点が多数存在するため、同一物体を写した画像であると誤って識別してしまう問題点がある。
本発明は、上記に鑑みてなされたものであり、その課題は、画像に写っている物体と同一の物体が写された画像をより正確に識別する技術を提供することにある。
本発明の物体識別装置は、入力画像から抽出した特徴点のそれぞれの特徴量と、参照画像から抽出した特徴点のそれぞれの特徴量とが正しく対応しているか否かを判定する局所特徴量照合手段と、前記入力画像を分割した各分割領域から特徴量を抽出する入力画像分割領域特徴量抽出手段と、前記局所特徴量照合手段によって正しく対応していると判定された特徴量の組み合わせ数に基づくスコアが所定値以上である場合、前記入力画像と前記参照画像との間の幾何的なずれを補正する幾何変換を前記参照画像の所定の領域に対して行うことによって得られた画像領域の位置に対応する前記入力画像における領域に含まれる前記分割領域の特徴量を取得する入力画像分割領域特徴量変換手段と、前記入力画像分割領域特徴量変換手段によって取得された特徴量と、前記参照画像の前記所定の領域から抽出された特徴量とを照合し、照合結果を出力する特徴量照合手段とを備えたことを特徴とする。
本発明の物体識別方法は、入力画像から抽出した特徴点のそれぞれの特徴量と、参照画像から抽出した特徴点のそれぞれの特徴量とが正しく対応しているか否かを判定する局所特徴量照合ステップと、前記入力画像を分割した各分割領域から特徴量を抽出する入力画像分割領域特徴量抽出ステップと、前記局所特徴量照合ステップによって正しく対応していると判定された特徴量の組み合わせ数に基づくスコアが所定値以上である場合、前記入力画像と前記参照画像との間の幾何的なずれを補正する幾何変換を前記参照画像の所定の領域に対して行うことによって得られた画像領域の位置に対応する前記入力画像における領域に含まれる前記分割領域の特徴量を取得する入力画像分割領域特徴量変換ステップと、前記入力画像分割領域特徴量変換ステップによって取得された特徴量と、前記参照画像の前記所定の領域から抽出された特徴量とを照合し、照合結果を出力する特徴量照合ステップとを備えたことを特徴とする。
本発明のプログラムは、コンピュータを、入力画像から抽出した特徴点のそれぞれの特徴量と、参照画像から抽出した特徴点のそれぞれの特徴量とが正しく対応しているか否かを判定する局所特徴量照合手段、前記入力画像を分割した各分割領域から特徴量を抽出する入力画像分割領域特徴量抽出手段、前記局所特徴量照合手段によって正しく対応していると判定された特徴量の組み合わせ数に基づくスコアが所定値以上である場合、前記入力画像と前記参照画像との間の幾何的なずれを補正する幾何変換を前記参照画像の所定の領域に対して行うことによって得られた画像領域の位置に対応する前記入力画像における領域に含まれる前記分割領域の特徴量を取得する入力画像分割領域特徴量変換手段、前記入力画像分割領域特徴量変換手段によって取得された特徴量と、前記参照画像の前記所定の領域から抽出された特徴量とを照合し、照合結果を出力する特徴量照合手段として機能させることを特徴とする。
本発明によれば、画像に写っている物体と同一の物体が写された画像をより正確に識別する技術を提供することができる。
第1の実施の形態における物体識別装置の構成例を表すブロック図である。 入力画像差異領域決定部14の動作例を示すフローチャートである。 局所特徴量抽出部11の構成例を表すブロック図である。 局所特徴量照合部12の構成例を表すブロック図である。 入力画像分割領域特徴量抽出部13の構成例を表すブロック図である。 分割領域の生成パターンの例を示した図である。 入力画像分割領域特徴量変換部15の構成例を表すブロック図である。 特徴量照合部16の構成例を表すブロック図である。 第1の実施の形態の変形例における物体識別装置の構成例を表すブロック図である。 参照画像に対する差異領域、入力画像に対する入力画像差異領域の関係を示したイメージ図である。 参照画像に対する差異領域、入力画像に対する入力画像差異領域の関係を示したイメージ図である。 参照画像に対する差異領域、入力画像に対する入力画像差異領域の関係を示したイメージ図である。 参照画像に対する差異領域、入力画像に対する入力画像差異領域の関係を示したイメージ図である。 ネットワークを介して第1の実施の形態における物体識別装置を構成する場合におけるクライアント側の構成例を表すブロック図である。 ネットワークを介して第1の実施の形態における物体識別装置を構成する場合におけるサーバー側の構成例を表すブロック図である。 ネットワークを介して第1の実施の形態における物体識別装置を構成する場合における全体の構成例を表すブロック図である。 第2の実施の形態における物体識別装置の構成例を示すブロック図である。 局所特徴量照合部17の構成例を表すブロック図である。 差異領域推定部18の構成例を表すブロック図である。 差異領域特徴量抽出部19の構成例を表すブロック図である。 第3の実施の形態における物体識別装置の構成例を示すブロック図である。 差異領域推定部20の構成例を表すブロック図である。 第4の実施の形態における物体識別装置の構成例を示すブロック図である。 差異領域推定部21の構成例を表すブロック図である。 差異領域推定部21の構成例を表すブロック図である。 第5の実施の形態における物体識別装置の構成例を示すブロック図である。 差異領域推定部22の構成例を表すブロック図である。 差異領域推定部22の構成例を表すブロック図である。 差異領域推定部22の構成例を表すブロック図である。 第6の実施の形態における物体識別装置の構成例を示すブロック図である。 分割領域特徴量抽出部23の構成例を表すブロック図である。 分割領域特徴量変換部24の構成例を表すブロック図である。 第7の実施の形態における物体識別装置の構成例を示すブロック図である。 入力画像分割領域特徴量変換部25の構成例を表すブロック図である。 選択分割領域特徴量抽出部26の構成例を表すブロック図である。 入力画像中の入力画像選択分割領域と参照画像中の選択分割領域の関係を示した図である。 第8の実施の形態における物体識別装置の構成例を示すブロック図である。 局所特徴量照合部27の構成例を表すブロック図である。 特徴量照合部28の構成例を表すブロック図である。 識別スコア統合判定部29の構成例を表すブロック図である。
(第1の実施の形態)
本発明の第1の実施の形態について図面を参照して説明する。
図1は本発明の第1の実施の形態である物体識別装置の構成を示すブロック図である。物体識別装置は、局所特徴量抽出部11、局所特徴量照合部12、入力画像分割領域特徴量抽出部13、入力画像差異領域決定部14、入力画像分割領域特徴量変換部15、及び特徴量照合部16を備える。物体識別装置は、例えば、パーソナルコンピュータや携帯情報端末等の情報処理装置を用いて構成することができる。そして、物体識別装置を構成する各部の機能は、例えば、プロセッサが記憶部に格納されているプログラムをメモリに展開して実行することによって実現される。なお、後述する他の実施形態における構成要素についても同様に実現することができる。
局所特徴量抽出部11は、入力画像から特徴点を検出し、検出された特徴点とその付近の領域である局所領域の特徴量を局所特徴量として抽出する。局所特徴量抽出部11による処理の詳細については後述する。
局所特徴量照合部12は、局所特徴量抽出部11において入力画像から抽出された局所特徴量1と、参照画像から抽出された局所特徴量2とを照合して対応する局所特徴量を特定する。対応する局所特徴量を特定する方法についての詳細は、図4を参照して後述する。局所特徴量照合部12は、局所特徴量が対応する局所領域を幾何変換したときの位置に応じて、入力画像と参照画像との間で対応する局所領域を特定する。例えば、入力画像における局所領域を、画像の中心を軸として所定の角度だけ回転移動したときの局所領域の座標位置が、参照領域における局所特徴量が対応する局所領域の座標位置と一致する場合、入力画像及び参照画像において座標位置が一致した局所領域は、対応する局所領域として特定される。すなわち、上記の幾何変換は参照画像と入力画像との間の幾何的なずれが補正されるように行われる。また、局所特徴量照合部12は、対応する局所領域が特定された場合、用いられた幾何変換についての情報(幾何変換情報)と、局所領域が対応すると判定された参照画像の画像IDである局所特徴識別画像IDとを出力する。
参照画像から抽出された局所特徴量2は、あらかじめ複数の参照画像から抽出しておき、図1に示す局所特徴量DBなどのデータベースに記憶しておいても良いし、オンザフライで参照画像から局所特徴量抽出部11を利用して抽出しても良い。データベースに記憶しておく場合、類似するオブジェクトを含む(類似する物体を被写体とする)参照画像から抽出される局所特徴量を関連付けて登録しておいても良い。局所特徴量照合部12の詳細については後述する。
入力画像分割領域特徴量抽出部13は、入力画像を受け取り、当該入力画像に基づいて、入力画像分割領域特徴量と入力画像分割領域情報を出力する。入力画像分割領域特徴量抽出部13による処理の詳細については後述する。
入力画像差異領域決定部14は、局所特徴量照合部12から出力された局所特徴識別画像IDに対応する参照画像、又は局所特徴識別画像IDに関連付いた参照画像群の差異領域に対し、局所特徴量照合部12から出力された幾何変換情報が示す幾何変換を行い、入力画像差異領域情報を出力する。
ここで、本実施形態において、参照画像の差異領域とは、入力画像に写っている物体と参照画像に写っている物体とでわずかに差異が生じ得ることが予測されている場合に、参照画像においてその差異が生じ得る部分が写された領域である。参照画像の差異領域情報は、例えば差異領域が矩形である場合、その矩形の4隅の座標値情報であっても良い。または、差異領域を構成する参照画像中の画素群の座標値を表す情報であっても良い。
入力画像差異領域情報は、参照画像における差異領域の4隅の座標値のそれぞれに対して幾何変換を行うことによって得られる入力画像における座標値とすることができる。または、参照画像の差異領域の情報がその差異領域を構成する画素群の座標値情報である場合、それらの画素群のそれぞれに対して、幾何変換情報に対応する幾何変換を行い、入力画像における差異領域を構成する画素群の座標値情報を入力画像差異領域情報とすることができる。
参照画像の差異領域情報は、事前にデータベースに記憶されている。例えば、局所特徴量2を図1の局所特徴量DBなどのデータベースに記憶しておく場合には、参照画像の差異領域情報を局所特徴量2とともに局所特徴量DBに記憶しても良い。
入力画像分割領域特徴量変換部15は、入力画像差異領域決定部14から出力される入力画像差異領域情報と、入力画像分割領域特徴量抽出部13から出力される入力画像分割領域特徴量及び入力画像分割領域情報を受け取り、受け取った情報に基づいて、入力画像中の差異領域から抽出された特徴量である特徴量1を出力する。入力画像分割領域特徴量変換部15による処理の詳細については後述する。
特徴量照合部16は、入力画像分割領域特徴量変換部15から出力される特徴量1と、参照画像中の差異領域から抽出された特徴量である特徴量2とを照合して、照合結果を出力する。特徴量照合部16は、当該照合において、入力画像に含まれるオブジェクトと参照画像に含まれるオブジェクトが同一であるか(入力画像と参照画像とが同一の物体を被写体としているか)を判定する。同一であると判定された場合、特徴量照合部16は、同一であると判定された入力画像の画像IDを差異領域識別画像IDとして出力する。
特徴量2は、図1のように、あらかじめ複数の参照画像から抽出しておきデータベースに記憶しておいても良いし、オンザフライで参照画像から抽出しても良い。データベースに記憶しておく場合、類似する物体を関連付けて登録しておいても良い。特徴量照合部16の詳細については後述する。
図2は、図1に示した入力画像差異領域決定部14による処理のフローを示すフローチャートである。図2に示すように、まず、S141で処理を制御するための変数iの初期化が行われる。
S142においては、局所特徴量照合部12から出力された幾何変換情報が取得される。S143においては、局所特徴量DBから参照画像の差異領域情報が取得される。ここで取得する差異領域情報は、参照画像の差異領域が矩形である場合、その矩形の4隅の座標値情報であっても良いし、差異領域を構成する参照画像中の画素群の座標値を表す情報であっても良い。
S144では、S142で取得した幾何変換情報を、S143で取得した差異領域情報に対して行う。ここで、差異領域情報が、4隅の座標値情報である場合は、4つの座標値のうちの1つに幾何変換を行う。また、差異領域情報が、差異領域を構成する参照画像中の画素群の座標値情報である場合は、画素群のうちの1つの画素に幾何変換を行う。この時点で変数iが一定数N未満である場合、S145において変数iの値を更新し、変数iの値がN以上になるまでS143とS144の処理を継続する。S143において取得する差異領域情報が、4隅の参照画像における座標値情報である場合にはN=4とし、差異領域情報が、差異領域を構成する参照画像中の画素群の座標値情報である場合には、差異領域を構成する参照画像中の画素群の数がNの値として設定される。最後に、S146では、S144で算出した入力画像差異領域情報を出力し、処理を終了する。
次に、図3を参照して、局所特徴量抽出部11について詳述する。図3は、局所特徴量抽出部11の構成例を表すブロック図である。局所特徴量抽出部11は、輝度情報抽出部101、局所特徴点検出部102、及び局所特徴量生成部103を備える。
輝度情報抽出部101は、入力画像を受け取り、その入力画像の各画素から輝度に関する情報のみを抽出し出力する。ここで受け取る入力画像は、デジタルカメラやデジタルビデオカメラ、携帯電話等の撮像機器で撮影された画像や、スキャナー等を通して取り込まれた画像などである。また、画像は、JPEG(Joint Photographic Experts Group)のように圧縮された画像であってもよいし、TIFF(Tagged Image File Format)のように圧縮されていない画像であってもよい。
局所特徴点検出部102は、画像から特徴的な点(特徴点)を多数検出し、各特徴点に関する情報である特徴点情報を出力する。ここで、特徴点情報とは、例えば、検出された局所特徴点の座標位置やスケール、特徴点のオリエンテーション、特徴点に対して割り当てられた固有のID(Identification)である「特徴点番号」等を示すものである。なお、局所特徴点検出部102は、特徴点情報を、各特徴点のオリエンテーションの方向毎に別々の特徴点情報として出力しても良い。例えば、局所特徴点検出部102は、各特徴点における最も主たるオリエンテーションの方向についてのみ特徴点情報を出力することとしてもよいし、2番目以降の主たるオリエンテーションの方向についての特徴点情報も出力することとしてもよい。また、局所特徴点検出部102は、2番目以降の主たるオリエンテーションの方向についての特徴点情報も出力する場合、各特徴点におけるオリエンテーションの方向ごとに異なる特徴点番号を付与することができる。局所特徴点検出部102は、画像から特徴点を検出して特徴点情報を抽出する際に、例えば、DoG(Difference−of−Gaussian)処理を用いることができる。具体的には、局所特徴点検出部102は、DoG処理を用いてスケールスペースにおける極値探索をすることで特徴点の位置とスケールを決定することができる。さらに局所特徴点検出部102は、決定した特徴点の位置およびスケールと周辺領域の勾配情報とを用いて各特徴点のオリエンテーションを算出することができる。なお、局所特徴点検出部102は、画像から特徴点を検出して特徴点情報を抽出する際に、DoGではなく、Fast−Hessian Detector等の他の手法を用いてもよい。局所特徴点検出部102は、その内部で検出された特徴点の中から重要な特徴点のみを選び出し、その特徴点に関する情報のみを特徴点情報として出力しても良い。
局所特徴量生成部103は、局所特徴点検出部102から出力される特徴点情報を受け取り、各特徴点に対する局所領域(特徴点とその周辺の領域)の特徴量である局所特徴量を生成(記述)する。なお、局所特徴量生成部103は、ZIPやLZH等の可逆圧縮で圧縮された形式で局所特徴量を出力してもよい。局所特徴量生成部103は、局所特徴点検出部102において、検出する特徴点の重要度を決めている場合、その特徴点の重要度順に局所特徴量を生成して出力することができる。また、局所特徴量生成部103は、特徴点の座標位置順に局所特徴量を生成して出力してもよい。局所特徴量生成部103では、まず、特徴点情報に基づいて、検出された各特徴点の座標値、スケール、及びオリエンテーションから、特徴量抽出を行う局所領域を取得する。なお、1つの特徴点に対してオリエンテーションの異なる複数の特徴点情報が存在する場合、各特徴点情報に対して局所領域を取得することができる。次に、局所領域を特徴点のオリエンテーション方向に応じて回転させて正規化した後、サブ領域に分割する。例えば、局所領域を16ブロック(4×4ブロック)に分割することができる。次に、局所領域のサブ領域ごとに特徴ベクトルを生成する。サブ領域の特徴ベクトルとしては、例えば、勾配方向ヒストグラムを用いることができる。具体的には、各サブ領域の画素ごとに勾配方向を算出し、それを8方向に量子化して、サブ領域ごとに量子化された8方向の頻度を集計し、勾配方向ヒストグラムを生成する。この時、各特徴点に対して生成される16ブロック×8方向の勾配方向ヒストグラムにより構成される特徴ベクトルを局所特徴量として出力する。出力される局所特徴量には、特徴点の座標位置情報を含めて出力する。
次に、図4を参照して、局所特徴量照合部12について詳述する。図4は、局所特徴量照合部12の構成例を表すブロック図である。図4に示すように、局所特徴量照合部12は、対応特徴点決定部201、誤対応点除去部202、識別スコア算出部203、及び閾値判定部204を備える。
対応特徴点決定部201は、局所特徴量抽出部11で入力画像から抽出される局所特徴量1と、参照画像から抽出される局所特徴量2とを受け取る。対応特徴点決定部201は、局所特徴量1と局所特徴量2が対応するか否かを判定し、対応する場合、局所特徴量1と局所特徴量2は対応するものであるとして、対応特徴点情報を出力する。例えば、前記局所特徴量1と前記局所特徴量2がそれぞれ特徴点周辺の勾配ヒストグラムを記述した特徴量の集合である場合、まず、特徴量空間における距離計算を局所特徴量の全組み合わせについて行う。最小となる距離値が次に小さい距離値に対して十分に小さくなる場合に限り、その距離値が最小となる局所特徴量の組み合わせに関して、その局所特徴量及びその局所特徴量の局所特徴領域は対応していると判断し、局所特徴領域の位置情報と対応する局所特徴領域の位置情報を対応特徴点情報として出力する。
誤対応点除去部202は、対応特徴点決定部201から対応特徴点情報を受け取り、それらの対応特徴点の中から、正しく対応している特徴点と誤って対応している特徴点を判別して、その判別した特徴点情報をそれぞれ出力すると共に、その判別に使用する幾何変換情報もあわせて出力する。例えば、対応特徴点決定部201から受け取った対応特徴点情報に対し、RANSAC等の手法を適用して、参照画像中の座標を入力画像中の座標へ移動させる幾何変換を推定し、当該幾何変換についての情報を幾何変換情報とする。ここで推定された幾何変換を、対応特徴点の参照画像側の特徴点に対しそれぞれ作用させ、それらが入力画像側の特徴点にほぼ一致する場合は正しく対応している特徴点であると判断し、逆に入力側の特徴点に一致しない場合は誤って対応している特徴点であると判断する。
識別スコア算出部203は、誤対応点除去部202から対応特徴点情報を受け取り、識別スコアを出力する。出力する識別スコアは、例えば、誤対応点除去部202から受け取った対応特徴点情報の中から、正しく対応した特徴点の組み合わせ数をカウントし、その数を0から1の間のスコアにマッピングさせるためのテーブルをあらかじめ用意しておき、そのテーブルを参照して識別スコアを出力しても良い。または、正しく対応した特徴点の組み合わせ数がcである場合、あらかじめ定められた特徴点の最低対応数をmとして、m/(c+m)を識別スコアとして算出しても良い。閾値判定部204は、識別スコア算出部203から出力された識別スコアを閾値処理し、閾値以上である場合は同一の物体を写した画像であると判定し、その参照画像のIDを局所特徴識別画像IDとして出力する。この閾値判定部204で設定される閾値は、事前に決定され内部に保持された値であっても良いし、外部から与える値であっても良い。
次に、図5を参照して、入力画像分割領域特徴量抽出部13について詳述する。図5は、入力画像分割領域特徴量抽出部13の構成例を表すブロック図である。入力画像分割領域特徴量抽出部13は、分割領域画像生成部301、及び特徴量抽出部302を備える。
分割領域画像生成部301は、入力画像を受け取り、あらかじめ定められた規則に従って入力画像を分割する。分割領域画像生成部301は、その分割された各領域の画像である分割領域画像と、各領域の座標情報及び各領域の領域IDを含む情報である入力画像分割領域情報とを出力する。各領域の座標情報は、例えば、各領域が矩形である場合は、各領域の4隅の座標情報とすることができる。
図6は、分割領域の生成パターンの例を示した図である。図6(a)、(b)に示すように、入力画像を上下左右方向や斜め方向で均一な大きさの領域に分割して分割領域を生成しても良い。または、図6(c)に示すように、不均一な大きさの領域に分割して分割領域を生成しても良い。図6(d)に示すように、複数の分割領域生成パターンを用いて階層的に分割領域を生成しても良い。
特徴量抽出部302は、分割領域画像生成部301で生成された分割領域画像のそれぞれから特徴量を抽出し、その抽出された特徴量を入力画像分割領域特徴量として出力する。特徴量抽出部302で出力する入力画像分割領域特徴量として、例えば、入力画像の差異領域と参照画像の差異領域の色情報に関する解析を行うため「色配置」「色ヒストグラム」等の特徴量を抽出しても良い。あるいは、入力画像の差異領域と参照画像の差異領域の細かな文字の違いを解析するため、「文字らしさ」を表現可能な特徴量を抽出しても良い。
次に、図7を参照して、入力画像分割領域特徴量変換部15について詳述する。図7は、入力画像分割領域特徴量変換部15の構成例を表すブロック図である。図7に示すように、入力画像分割領域特徴量変換部15は、差異領域内分割領域特徴量統合部501を備える。
差異領域内分割領域特徴量統合部501は、入力画像差異領域決定部14から入力画像差異領域情報を受け取り、入力画像分割領域特徴量抽出部13から入力画像分割領域特徴量及び入力画像分割領域情報を受け取る。差異領域内分割領域特徴量統合部501は、受け取った情報に基づいて、入力画像の差異領域における特徴量である特徴量1を出力する。
具体的には、差異領域内分割領域特徴量統合部501は、まず、入力画像差異領域情報と入力画像分割領域情報とに基づき、差異領域内に含まれる分割領域を特定する。特定された分割領域のそれぞれから抽出された特徴量である入力画像分割領域特徴量を統合して、差異領域における特徴量を表す特徴量1の値を決定する。例えば、入力画像分割領域特徴量抽出部13から出力される入力画像分割領域特徴量が「色ヒストグラム」である場合、差異領域内に含まれる分割領域に関して、その色ヒストグラムを足し合わせ正規化した値を特徴量1として出力しても良い。また、差異領域内に含まれる分割領域の中でも、差異領域の中に完全に含まれる分割領域と、一部しか差異領域の中に含まれていない分割領域が存在する事に着目し、完全に含まれる分割領域については特徴量を統合する際の重みを上げ、一部しか差異領域の中に含まれていない分割領域については重みを下げるようにしても良い。この場合、重みは、例えば、「各分割領域の面積に対する、その分割領域の中で差異領域内に含まれている面積の割合」に基づいて設定しても良い。各分割領域の大きさが差異領域よりも大きい場合は、差異領域と最も重複している分割領域から抽出された特徴量を特徴量1としてそのまま出力しても良い。なお、入力画像分割領域特徴量抽出部13から出力される入力画像分割領域特徴量が、複数の分割領域生成パターンを用いて階層的に生成された分割領域から抽出された特徴量である場合、差異領域内分割領域特徴量統合部501では、階層的な分割領域生成パターンのうち、入力画像の差異領域内に完全に含まれる分割領域数が最も多くなるパターンだけを用いて、入力画像分割領域特徴量の統合を行っても良い。
次に、図8を参照して、特徴量照合部16について詳述する。図8は、特徴量照合部16の構成例を表すブロック図である。特徴量照合部16は、差異領域識別スコア算出部601、及び閾値判定部602を備える。
差異領域識別スコア算出部601は、入力画像の差異領域から抽出される特徴量を特徴量1として、参照画像の差異領域から抽出される特徴量を特徴量2として、それぞれ受け取る。差異領域識別スコア算出部601は、受け取った2つの特徴量から決定される識別スコアを差異領域識別スコアとして出力する。差異領域識別スコアは、特徴量1と特徴量2が類似している程、その値が高くなるような尺度である。例えば、特徴量1と特徴量2の特徴量空間上での距離を計算し、その逆数を差異領域識別スコアとして出力しても良い。または、特徴量1と、複数の参照画像群からそれぞれ抽出した特徴量2を照合する場合、特徴量の全組み合わせの中で特徴量空間上での距離の最小値を見つけ、その最小値で、特徴量の全組み合わせにおける特徴量空間上での距離を割った値の逆数を差異領域識別スコアとして出力しても良い。または、特徴量1と特徴量2の特徴量空間上での距離値を、0〜1の間のスコアにマッピングさせるためのテーブルをあらかじめ用意しておき、そのテーブルを参照して差異領域識別スコアを出力しても良い。
閾値判定部602は、差異領域識別スコア算出部601から出力された差異領域識別スコアを閾値と比較し、閾値以上である場合は同一の物体を写した画像であると判定し、その参照画像のIDを差異領域識別画像IDとして出力する。この閾値判定部602で設定される閾値は、事前に決定され内部に保持された値であっても良いし、外部から与える値であっても良い。
図9は、本実施の形態の変形例における物体識別装置の構成を示している。図9に示す物体識別装置は、差異領域情報のみを格納したデータベースである差異領域情報DBを設けている点で、図1に示す物体識別装置と異なる。局所特徴量2がデータベースとして記憶されておらず、参照画像からオンザフライで抽出される場合には、この図9の構成で本実施の形態が実現できる。
図10から図13は、それぞれ、参照画像における差異領域、入力画像における入力画像差異領域との間の関係として考えられるパターンを示したイメージ図である。
図10は、物体が参照画像全体に表示され、差異領域が参照画像全体に対して設定されている場合の例を示している。この例は、同一銘柄で味付けが異なるお菓子パッケージ等でよく見られるように、物体に刻まれている文字・模様等はほぼ同一だが、その物体の色が異なる場合等が該当する。すなわち、この例では、入力画像の全体が参照画像の全体と異なりうることが考えられるため、参照画像の全体が差異領域として設定される。
図11は、物体が参照画像全体に表示され、差異領域が参照画像の一部に対して設定される場合の例を示している。この例は、同一シリーズで巻が異なる本の背表紙等でよく見られるように、物体はほぼ同一なのだが、物体の一部分のみ、色や文字や模様が異なる場合が該当する。すなわち、この例では、入力画像の一部が参照画像の一部と異なりうることが考えられるため、参照画像の一部が差異領域として設定される。図12及び図13に示す例は、図10及び図11に示した例とそれぞれほぼ同様だが、参照画像が画像全体ではなくその一部にしか写っていない点が異なる。
いずれの例においても、本実施の形態では、その差異領域として設定された領域の情報が事前にデータベース登録されている。本実施形態において、登録されている参照画像中の差異領域及び入力画像中の差異領域は、それぞれ、差異が生じ得ることが予測されている必要最小限の領域を参照画像及び入力画像のそれぞれから抽出したものである。そのため、参照画像の全体の局所特徴量と入力画像の全体の局所特徴量とを比較したときに、差異がわずかであるために同一の画像であると判定されてしまった場合であっても、参照画像及び入力画像の差異画像の特徴量のみを再度比較することによって、物品の違いに起因する細かな差異を見分けることができる。その結果、局所特徴量のみを使った場合に問題となっていた誤判定を抑制する事が可能となる。
また、図14から図16は、本実施の形態の物体識別装置を、ネットワークを介したサーバークライアントシステムとして構成した場合の例を示している。図14はクライアント側の構成例、図15はサーバー側の構成例、図16は全体の構成例をそれぞれ示すブロック図である。
図14に示すように、クライアント側は、局所特徴量抽出部11及び入力画像分割領域特徴量抽出部13を備える。局所特徴量抽出部11で出力される局所特徴量1と、入力画像分割領域特徴量抽出部13で出力される入力画像分割領域特徴量及び入力画像分割領域情報とが、クライアント側からサーバー側に伝送される。
図15に示すように、サーバー側は、局所特徴量照合部12、入力画像差異領域決定部14、入力画像分割領域特徴量変換部15、及び特徴量照合部16を備える。サーバー側では、クライアント側から伝送されてくる局所特徴量1、入力画像分割領域特徴量、及び入力画像分割領域情報を用いて、入力画像に写った物体を識別する。
図16に示すように、図14と図15に示した構成をネットワーク越しに連結させる事で、本実施の形態の物体識別装置をサーバークライアントシステムが構成される。この構成では、入力画像を直接サーバー側に伝送する必要はなく、入力画像よりも軽量な局所特徴量、分割領域特徴量、及び分割領域情報を伝送すれば良い。そのため、本実施の形態では、クライアント側では処理をすることなくサーバー側に入力画像を伝送するだけの構成にした場合と比べて、サーバー側で識別処理を行い、その識別結果をクライアント側が得るまでの時間を短縮させる事が可能となる。
以上のように本実施形態によれば、局所特徴量照合部12は、入力画像から抽出した特徴点のそれぞれの特徴量と、参照画像から抽出した特徴点のそれぞれの特徴量とが対応するかを判定する。入力画像分割領域特徴量抽出部13は、入力画像を分割した各分割領域から特徴量を抽出する。入力画像分割領域特徴量変換部15は、局所特徴量照合部12によって対応すると判定された特徴量の組み合わせ数に基づくスコアが所定値以上である場合、入力画像と参照画像との間の幾何的なずれを補正する幾何変換を参照画像の所定の領域(差異領域)に対して行うことによって得られた画像領域の位置に対応する入力画像における領域に含まれる分割領域の特徴量を取得する。なお、本実施形態において参照画像の差異領域は、入力画像差異領域決定部14によって決定される。特徴量照合部16は、入力画像分割領域特徴量変換部15によって取得された特徴量と、参照画像の差異領域から抽出された特徴量とを照合し、照合結果を出力する。その結果、参照画像に写っている物体と同一の物体が写された入力画像をより正確に識別することができる。
(第2の実施の形態)
本発明の第2の実施の形態について図面を参照して説明する。第2の実施の形態では、参照画像中の差異領域を事前にデータベース登録せずに、参照画像中の差異領域を推定して識別を行う。
図17は、本発明の第2の実施の形態における物体識別装置の構成を示すブロック図である。図17に示すように、第2の実施の形態の物体識別装置は、局所特徴量抽出部11、局所特徴量照合部17、入力画像分割領域特徴量抽出部13、入力画像差異領域決定部14、入力画像分割領域特徴量変換部15、特徴量照合部16、差異領域推定部18、及び差異領域特徴量抽出部19を備える。
このように、第2の実施の形態の物体識別装置では、第1の実施の形態の物体識別装置の局所特徴量照合部12が局所特徴量照合部17に変更され、差異領域情報を格納したデータベースである差異領域情報DBが差異領域推定部18及び差異領域特徴量抽出部19に変更されている点で第1の実施の形態と異なる。局所特徴量照合部17、差異領域推定部18、差異領域特徴量抽出部19による処理の詳細については後述する。その他の構成要素については第1の実施の形態と同様であるため第1の実施の形態と同一の符号を付して詳細な説明は省略する。
図18は、局所特徴量照合部17の構成例を表すブロック図である。図18に示すように、局所特徴量照合部17は、対応特徴点決定部201、誤対応点除去部202、識別スコア算出部203、及び閾値判定部204を備える。すなわち、図18に示される局所特徴量照合部17の構成要素は、図4に示される局所特徴量照合部12の構成要素と同一である。しかし、図18に示される局所特徴量照合部17は、誤対応点除去部202から幾何変換情報が出力され、閾値判定部204から局所特徴識別画像IDが出力されることに加え、誤対応点除去部202から出力される対応特徴点情報が局所特徴量照合部17から出力されている点が図18の局所特徴量照合部17とは異なっている。
図19は、差異領域推定部18の構成を表すブロック図である。図19に示すように、差異領域推定部18は、誤対応特徴点密集度探索部801を備える。誤対応特徴点密集度探索部801は、局所特徴量照合部17から対応特徴点情報を受け取り、参照画像中の差異領域に関する情報である差異領域情報を出力する。局所特徴量照合部17から受け取る対応特徴点情報は、正しく対応している特徴点の情報と、誤って対応している特徴点の情報とが含まれている。そのため、対応特徴点情報に含まれている誤って対応している特徴点の情報を用いて、誤って対応している特徴点が密集している領域を参照画像中から探索する事によって、参照画像中の差異領域を推定する事が可能である。誤って対応している特徴点が密集している領域の探索は、例えば、一定の大きさの矩形窓を規定し、差分画像中でこの矩形窓を動かしていき、誤って対応している特徴点の数が矩形窓内で一定数以上である場合、その矩形窓の領域を差異領域とすることができる。参照画像中の差異領域を推定する方法はこれに限定されず、誤って対応している特徴点が密集している領域に基づいて推定する方法であれば、任意の方法で実施することができる。すなわち、参照画像の差異領域(所定の領域)は、局所特徴量照合部17によって、参照画像において誤って対応している特徴点が密集していると判定された領域を含む領域である。
図20は、差異領域特徴量抽出部19の構成例を表すブロック図である。図20に示すように、差異領域特徴量抽出部19は、差異領域画像生成部901、及び差異領域特徴量算出部902を備える。
差異領域画像生成部901は、参照画像DBから参照画像を受け取り、差異領域推定部18から差異領域情報を受け取る。受け取った差異領域情報が、参照画像における差異領域の4隅の座標値情報である場合、4隅のうち隣り合う2隅を直線で結んだ線上に位置する画素を順に読み取る等して、参照画像中からその値を読み取っていく画素とその順序を決定する事により、入力画像中の差異領域画像を生成し出力する。または、差異領域推定部18から受け取る差異領域情報が、参照画像における差異領域を構成する画素群の座標値を表す情報である場合、差異領域画像生成部901は、その順序で参照画像を読み取り、入力画像中の差異領域画像として出力する。
差異領域特徴量算出部902は、差異領域画像生成部901で生成された差異領域画像から特徴量を抽出し、その特徴量を出力する。差異領域特徴量算出部902で抽出する特徴量として、例えば、「色配置」「色ヒストグラム」等の特徴量を抽出しても良いし、あるいは、「文字らしさ」を表現可能な特徴量を抽出しても良い。ここで抽出される特徴量は、図5で示される、入力画像分割領域特徴量抽出部13の構成要素である特徴量抽出部302と同一の処理で抽出される特徴量でなければならない。
以上のように本実施の形態では、参照画像中の差異領域を事前にデータベース登録しておかなくても、参照画像中の差異領域を推定する事ができるため、物体識別を利用した検品システムで、差異が生じ得ることが予測される領域を差異領域として事前に登録しておく事ができない場合(例えば、多数の製品の中からどこかに傷を持つ製品だけを見分ける場合など)に効果的である。そして、本実施の形態で行われる参照画像中の差異領域の推定は、差異領域が物体全体の場合であっても、物体の一部の場合であっても可能であるため、図10から図13に示したいずれの例の場合に対しても、本実施の形態は有効である。
また、本実施の形態を、ネットワークを介したサーバークライアントシステムとして構成しようとする場合、第1の実施の形態と同様、入力画像を直接サーバー側に伝送する必要はなく、入力画像よりも軽量な局所特徴量、分割領域特徴量、分割領域情報のみを伝送すれば良い。そのため、本実施の形態では、クライアント側では処理をすることなくサーバー側に画像を伝送するだけの構成にした場合と比べて、サーバー側で識別処理を行い、その識別結果をクライアント側が得るまでの時間を短縮させる事が可能となる。
(第3の実施の形態)
本発明の第3の実施の形態について図面を参照して説明する。
図21は、本発明の第3の実施の形態における物体識別装置の構成を示すブロック図である。図21に示すように、第3の実施の形態の物体識別装置は、局所特徴量抽出部11、局所特徴量照合部17、入力画像分割領域特徴量抽出部13、入力画像差異領域決定部14、入力画像分割領域特徴量変換部15、特徴量照合部16、差異領域推定部20、及び差異領域特徴量抽出部19を備える。
このように、第3の実施の形態の物体識別装置では、第2の実施の形態の物体識別装置の差異領域推定部18が差異領域推定部20に変更されている点が第2の実施の形態と異なる。差異領域推定部20による処理の詳細については後述する。その他の構成要素については、第2の実施の形態と同様であり、同一の符号を付して詳細な説明は省略する。
図22は、差異領域推定部20の構成例を表すブロック図である。図22に示すように、差異領域推定部20は、物体領域推定部2001、及び誤対応特徴点密集度探索部2002を備える。
物体領域推定部2001は、局所特徴量照合部17から出力される局所特徴識別画像IDに対応する参照画像、あるいはその局所特徴識別画像IDに関連付いた参照画像群を受け取り、参照画像中で物体が存在している領域を表す情報である物体領域情報を出力する。ここで受け取る参照画像は、図21のように、あらかじめデータベースに記憶しておいても良いし、物体識別装置の外部から取得してもよい。物体領域推定部2001における処理としては、例えば、参照画像中のエッジ強度を解析することで物体領域を大まかに推定する方法や、背景領域の画像パターンをあらかじめ学習しておき背景以外の領域として物体領域を大まかに推定する方法等が考えられる。
誤対応特徴点密集度探索部2002は、図19に示した差異領域推定部18の構成要素である誤対応特徴点密集度探索部801と類似している。しかしながら、誤対応特徴点密集度探索部2002は、局所特徴量照合部17から受け取る対応特徴点情報に加えて、物体領域推定部2001から出力される物体領域情報が入力される点が第2の実施の形態とは異なっている。誤対応特徴点密集度探索部2002は、対応特徴点のうち、物体領域の内部に存在する点のみに着目し、誤って対応している特徴点が密集している領域を探索する。
すなわち、誤対応特徴点密集度探索部2002は、参照画像中の物体領域の内部から差異領域を推定する。そのため、本実施の形態において、物体以外の領域から出現する誤った対応の特徴点の影響を受けることなく、参照画像中の差異領域を推定する事が可能である。つまり、参照画像における差異領域(所定の領域)は、参照画像において物品が写った領域のうち、誤って対応している特徴点が密集していると局所特徴量照合部17によって判定された領域を含む領域となる。また、誤対応特徴点密集度探索部2002は、参照画像中で誤って対応している特徴点が密集している領域を探索する範囲が限定されるため、探索範囲が参照画像全体である誤対応特徴点密集度探索部801と比べて高速な処理が可能である。
本実施の形態では、実施の形態2と同様、参照画像中の差異領域を事前にデータベース登録しておかなくても、参照画像中の差異領域を推定する事ができるため、物体識別を利用した検品システムで、事前に差異領域に関する情報を登録しておく事ができない場合(例えば、多数の製品の中からどこかに傷を持つ製品だけを見分ける場合など)に効果的である。そして、本実施の形態で行われる参照画像中の差異領域の推定は、差異領域が物体全体の場合であっても、物体の一部の場合であっても可能であるが、物体以外の領域から出現する誤った対応の特徴点の影響を受けることなく差異領域を高精度に推定する事が可能であるため、図12及び図13に示した例のような場合に特に有効である。
また、本実施の形態を、ネットワークを介したサーバークライアントシステムとして構成しようとする場合、第1、2の実施の形態と同様、入力画像を直接サーバー側に伝送する必要はなく、入力画像よりも軽量な局所特徴量、分割領域特徴量、分割領域情報のみを伝送すれば良い。そのため、本実施の形態では、クライアント側では処理をすることなくサーバー側に画像を伝送するだけの構成にした場合と比べて、サーバー側で識別処理を行い、その識別結果をクライアント側が得るまでの時間を短縮させる事が可能となる。
(第4の実施の形態)
本発明の第4の実施の形態について図面を参照して説明する。第4の実施の形態では、差異領域の推定方法として他の方法を用いる。
図23は、本発明の第4の実施の形態における物体識別装置の構成を示すブロック図である。図23に示すように、第4の実施の形態の物体識別装置は、局所特徴量抽出部11、局所特徴量照合部12、入力画像分割領域特徴量抽出部13、入力画像差異領域決定部14、入力画像分割領域特徴量変換部15、特徴量照合部16、差異領域推定部21、及び差異領域特徴量抽出部19を備える。
このように、第4の実施の形態の物体識別装置では、第3の実施の形態の物体識別装置の局所特徴量照合部17及び差異領域推定部20が、局所特徴量照合部12及び差異領域推定部21に変更されている点が第3の実施の形態と異なる。局所特徴量照合部12は、第1の実施の形態の物体識別装置の局所特徴量照合部12と同様であり、詳細な説明は省略する。差異領域推定部21の詳細については後述する。その他の構成要素については、第3の実施の形態と同様であり、同一の符号を付して詳細な説明は省略する。
図24及び図25は、差異領域推定部21の構成例を表すブロック図であり、以下に各図について説明する。
図24に示す差異領域推定部21は、テンプレートマッチング部2101を備える。テンプレートマッチング部2101は、局所特徴量照合部12から出力される局所特徴識別画像IDに対応する参照画像(あるいはその局所特徴識別画像IDに関連付いた参照画像群)を受け取ると共に、局所特徴量照合部12から出力される局所特徴識別画像IDに対応する差異領域のテンプレート画像(あるいはその局所特徴識別画像IDに関連付いたテンプレート画像群)も受け取り、受け取った画像群に基づいて、差異領域情報を出力する。具体的には、このテンプレート画像は、差異領域周辺で典型的に見られる画像パターンである。テンプレートマッチング部2101は、参照画像中の各領域とこのテンプレート画像とをマッチングし、テンプレート画像に最も類似する領域を探すテンプレートマッチング処理を行うことによって、参照画像中の差異領域を推定する。すなわち、参照画像中において所定のパターン画像との類似度が所定値以上である領域が、参照画像中の差異領域として設定される。テンプレート画像は、図23のように、あらかじめデータベースに記憶しておいても良いし、物体識別装置の外部から取得しても良い。
また、変形例として、図25に示すように、差異領域推定部21は、物体領域推定部2001、及びテンプレートマッチング部2102を備えても良い。図25の物体領域推定部2001は、図20で示される差異領域推定部20の構成要素である物体領域推定部2001と同一であり、詳細な説明は省略する。
テンプレートマッチング部2102は、図24で示される差異領域推定部21の構成要素であるテンプレートマッチング部2101と類似している。テンプレートマッチング部2102は、局所特徴量照合部12から出力される局所特徴識別画像IDに対応する参照画像と、局所特徴量照合部12から出力される局所特徴識別画像IDに対応する差異領域のテンプレート画像とに加えて、物体領域推定部2001から出力される物体領域情報が入力される点が異なっている。テンプレートマッチング部2102は、参照画像中の物体領域についてのみ、テンプレート画像を用いたテンプレートマッチングを行う事により、参照画像中の差異領域を推定する事が可能である。また、テンプレートマッチング部2102は、テンプレート画像とマッチングする参照画像中の領域の範囲が限定されるため、テンプレート画像とマッチングする領域の範囲が参照画像全体であるテンプレートマッチング部2101と比べて高速な処理が可能である。
本実施の形態では、実施の形態2、3と同様、参照画像中の差異領域を事前にデータベース登録しておく必要はないが、差異領域に見られる典型的な画像パターンが事前にわかれば、その画像パターンをテンプレート画像として利用する事で、差異領域を推定する事ができる。例えば、同一の封筒で宛名だけが異なる複数の郵便画像の中から特定の郵便だけを識別しようとする場合には、宛名が記載された領域は郵便番号・住所・宛名といったように文字列のレイアウトがある程度決まった画像パターンとして定義できるので効果的である。そして、本実施の形態で行われる参照画像中の差異領域の推定は、差異領域が物体全体の場合であっても、物体の一部の場合であっても可能であるが、差異領域推定部21の構成が図25の場合は、実施の形態3と同様、まず物体領域を推定することにより背景の影響を取り除いた上で、改めて差異領域を推定する事が可能になるため、差異領域を高精度に推定する事ができ、図12及び図13に示した例のような場合に特に有効である。
また、本実施の形態を、ネットワークを介したサーバークライアントシステムとして構成しようとする場合、第1〜3の実施の形態と同様、入力画像を直接サーバー側に伝送する必要はなく、入力画像よりも軽量な局所特徴量、分割領域特徴量、分割領域情報のみを伝送すれば良い。そのため、本実施の形態では、クライアント側では処理をすることなくサーバー側に画像を伝送するだけの構成にした場合と比べて、サーバー側で識別処理を行い、その識別結果をクライアント側が得るまでの時間を短縮させる事が可能となる。
(第5の実施の形態)
本発明の第5の実施の形態について図面を参照して説明する。
図26は、本発明の第5の実施の形態における物体識別装置の構成を示すブロック図である。図26に示すように、第5の実施の形態の物体識別装置は、局所特徴量抽出部11、局所特徴量照合部17、入力画像分割領域特徴量抽出部13、入力画像差異領域決定部14、入力画像分割領域特徴量変換部15、特徴量照合部16、差異領域推定部22、及び差異領域特徴量抽出部19を備える。
このように、第5の実施の形態の物体識別装置では、第2の実施の形態の物体識別装置と第4の実施の形態の物体識別装置をあわせた構成になっている。第2の実施の形態の物体識別装置との比較では、差異領域推定部18が差異領域推定部22に変更されている点が異なる。差異領域推定部22による処理の詳細については後述する。その他の構成要素については、第2の実施の形態と同様であり、同一の符号を付して詳細な説明は省略する。
図27から図29は、差異領域推定部22の構成例を表すブロック図であり、以下に各図について説明する。
図27に示す差異領域推定部22は、誤対応特徴点密集度探索部2201、及びテンプレートマッチング部2202を備える。図27の誤対応特徴点密集度探索部2201は、図19に示した差異領域推定部18の構成要素である誤対応特徴点密集度探索部801とほぼ同一であるが、差異領域情報ではなく差異候補領域情報を出力する点が異なっている。この誤対応特徴点密集度探索部2201が出力する差異候補領域情報は、誤対応特徴点密集度探索部801で出力される差異領域情報と同一であっても良いし、その差異領域情報よりもわずかに広げた領域として捉え、その領域情報としても良い。
また、図27のテンプレートマッチング部2202は、図25で示される差異領域推定部21の構成要素であるテンプレートマッチング部2102と類似しているが、物体領域情報の代わりに差異候補領域情報が入力される点が異なっている。すなわち、図27のテンプレートマッチング部2202は、誤対応特徴点密集度探索部2201で推定された参照画像中の差異候補領域についてのみ、テンプレート画像を用いたテンプレートマッチングを行い、参照画像中の差異領域を推定する。テンプレートマッチング部2202から出力される差異領域情報は、誤対応特徴点密集度探索部2201で推定される差異候補領域の中から、さらにテンプレートマッチング部2202によって差異領域を絞りこむため、信頼性の高い差異領域情報が出力される。
また、図28に示す差異領域推定部22は、テンプレートマッチング部2203、誤対応特徴点密集度探索部2204で構成する事も可能である。図28のテンプレートマッチング部2203は、図24に示した差異領域推定部21の構成要素であるテンプレートマッチング部2101とほぼ同一であるが、差異領域情報ではなく差異候補領域情報を出力する点が異なっている。このテンプレートマッチング部2203が出力する差異候補領域情報は、テンプレートマッチング部2101で出力される差異領域情報と同一であっても良いし、その差異領域情報よりもわずかに広げた領域として捉え、その領域情報としても良い。
また、図28の誤対応特徴点密集度探索部2204は、図22で示される差異領域推定部20の構成要素である誤対応特徴点密集度探索部2002と類似しているが、物体領域情報の代わりに差異候補領域情報が入力される点が異なっている。誤対応特徴点密集度探索部2204から出力される差異領域情報は、テンプレートマッチング部2203で推定される差異候補領域の中から、さらに誤対応特徴点密集度探索部2204によって差異領域を絞りこむため、信頼性の高い差異領域情報が出力される。
また、図29に示す差異領域推定部22は、誤対応特徴点密集度探索部2201、テンプレートマッチング部2203、及び差異候補領域重複検出部2205を備える。図29の誤対応特徴点密集度探索部2201は、図27で示される差異領域推定部22の構成要素である誤対応特徴点密集度探索部2201と同一であり、詳細な説明は省略する。図29のテンプレートマッチング部2203は、図28で示される差異領域推定部22の構成要素であるテンプレートマッチング部2203と同一であり、詳細な説明は省略する。
差異候補領域重複検出部2205は、誤対応特徴点密集度探索部2201から出力される差異候補領域情報と、テンプレートマッチング部2203から出力される差異候補領域情報とを受け取り、これらの2つの差異候補領域が重複している領域を差異領域と判断し、その差異領域情報を出力する。差異候補領域重複検出部2205から出力される差異領域情報は、誤対応特徴点密集度探索部2201とテンプレートマッチング部2203でいずれも差異候補領域として判定される領域の情報となっているため、信頼性の高い差異領域情報が出力される。
本実施の形態では、実施の形態2〜4と同様、参照画像中の差異領域を事前にデータベース登録しておく必要はないが、実施の形態4と同様、差異領域に見られる典型的な画像パターンが事前にわかれば、その画像パターンをテンプレート画像として利用する事で、差異領域を推定する事ができる。例えば、同一の封筒で宛名だけが異なる複数の郵便画像の中から特定の郵便だけを識別しようとする場合には、宛名が記載された領域は郵便番号・住所・宛名といったように文字列のレイアウトがある程度決まった画像パターンとして定義できるので効果的である。そして、本実施の形態で行われる参照画像中の差異領域の推定は、差異領域が物体全体の場合であっても、物体の一部の場合であっても可能であるが、第2の実施の形態等と比べて、信頼性の高い差異領域が得られるため、高精度の識別を実現できる。なお、ここまで述べてきた本実施の形態は、第2の実施の形態の物体識別装置と第4の実施の形態の物体識別装置をあわせた構成の場合であるが、図26の構成は、第3の実施の形態の物体識別装置と第4の実施の形態の物体識別装置をあわせた構成と捉えることもできる。すなわち、差異領域推定部22が図27、図28、図29の構成の場合、誤対応特徴点密集度探索部2201とテンプレートマッチング部2203の前に物体領域推定部を加える事ができ、この場合、背景の影響を取り除いた上で物体領域の中から差異領域を推定することになるため、図12や図13の場合に特に有効な構成となる。
また、本実施の形態を、ネットワークを介したサーバークライアントシステムとして構成しようとする場合、第1〜4の実施の形態と同様、入力画像を直接サーバー側に伝送する必要はなく、入力画像よりも軽量な局所特徴量、分割領域特徴量、分割領域情報のみを伝送すれば良い。そのため、本実施の形態では、クライアント側では処理をすることなくサーバー側に画像を伝送するだけの構成にした場合と比べて、サーバー側で識別処理を行い、その識別結果をクライアント側が得るまでの時間を短縮させる事が可能となる。
(第6の実施の形態)
本発明の第6の実施の形態について図面を参照して説明する。
図30は、本発明の第6の実施の形態における物体識別装置の構成例を示すブロック図である。図30に示すように、第6の実施の形態の物体識別装置は、局所特徴量抽出部11、局所特徴量照合部17、入力画像分割領域特徴量抽出部13、入力画像差異領域決定部14、入力画像分割領域特徴量変換部15、特徴量照合部16、差異領域推定部18、分割領域特徴量抽出部23、及び分割領域特徴量変換部24を備える。
このように、第6の実施の形態の物体識別装置では、第2の実施の形態の物体識別装置の差異領域特徴量抽出部19が、分割領域特徴量抽出部23及び分割領域特徴量変換部24に変更されている点が異なる。分割領域特徴量抽出部23と分割領域特徴量変換部24の詳細については後述する。その他の構成要素については、第2の実施の形態と同様であるため、第2の実施の形態と同一の符号を付して詳細な説明は省略する。
図31は、分割領域特徴量抽出部23の構成例を表すブロック図である。図31に示すように、分割領域特徴量抽出部23は、分割領域画像生成部2301、及び特徴量抽出部2302を備える。
分割領域画像生成部2301は、図5で示される入力画像分割領域特徴量抽出部13の構成要素である分割領域画像生成部301とほぼ同一である。分割領域画像生成部2301は、入力画像ではなく参照画像を受け取る点と、入力画像分割領域情報ではなく分割領域情報が出力される点が分割領域画像生成部301とは異なっている。
特徴量抽出部2302も、図5で示される入力画像分割領域特徴量抽出部13の構成要素である特徴量抽出部302とほぼ同一である。特徴量抽出部2302は、入力画像分割領域特徴量ではなく分割領域特徴量を出力している点が特徴量抽出部302と異なっている。
図32は、分割領域特徴量変換部24の構成例を表すブロック図である。図32に示すように、分割領域特徴量変換部24は、差異領域内分割領域特徴量統合部2401を備える。
差異領域内分割領域特徴量統合部2401は、図7で示される入力画像分割領域特徴量変換部15の構成要素である差異領域内分割領域特徴量統合部501とほぼ同一である。差異領域内分割領域特徴量統合部2401は、入力画像差異領域情報ではなく差異領域情報を受け取り、入力画像分割領域特徴量ではなく分割領域特徴量を受け取り、入力画像分割領域情報ではなく分割領域情報を受け取る点が差異領域内分割領域特徴量統合部501と異なっている。すなわち、図31及び図32で示される分割領域特徴量抽出部23、分割領域特徴量変換部24では、上述の入力画像の分割と同様に、参照画像を分割し、差異領域内に含まれる分割領域画像から抽出された特徴量を統合することによって、参照画像の差異領域における特徴量である特徴量2を生成する。
本実施の形態では、実施の形態1〜5のように、差異領域情報で示される参照画像中の領域から特徴量2を直接抽出するのではなく、一度画像を分割して分割した各領域から特徴量を抽出しておき、差異領域内に含まれる分割領域の特徴量を統合して特徴量2の値を決定する。入力画像の差異領域における特徴量を表す特徴量1と、参照画像の差異領域における特徴量を表す特徴量2とを、同じ条件で抽出する事で、より正確な特徴量照合が実現可能となる。
なお、本実施の形態の構成例として図30に示した構成は、第2の実施の形態を基にした構成であるが、同様に、第3〜5の実施の形態における構成をそれぞれ基にした構成にする事も可能である。すなわち、第3〜5の実施の形態の構成例において、差異領域特徴量抽出部を、分割領域特徴量抽出部23及び分割領域特徴量変換部24に置換する事で構成する事が可能である。第1の実施の形態についても、特徴量2を、図1のようにあらかじめ複数の参照画像から抽出しておきデータベースに記憶しておくのではなく、オンザフライで参照画像から抽出する場合は、分割領域特徴量抽出部23及び分割領域特徴量変換部24を備える構成とする事が可能である。
また、本実施の形態を、ネットワークを介したサーバークライアントシステムとして構成しようとする場合、第1〜5の実施の形態と同様、入力画像を直接サーバー側に伝送する必要はなく、入力画像よりも軽量な局所特徴量、分割領域特徴量、分割領域情報のみを伝送すれば良い。そのため、本実施の形態では、クライアント側では処理をすることなくサーバー側に画像を伝送するだけの構成にした場合と比べて、サーバー側で識別処理を行い、その識別結果をクライアント側が得るまでの時間を短縮させる事が可能となる。
(第7の実施の形態)
本発明の第7の実施の形態について図面を参照して説明する。
図33は、本発明の第7の実施の形態である物体識別装置の構成例を示すブロック図である。図33に示すように、第7の実施の形態の物体識別装置は、局所特徴量抽出部11、局所特徴量照合部17、入力画像分割領域特徴量抽出部13、入力画像差異領域決定部14、入力画像分割領域特徴量変換部25、特徴量照合部16、差異領域推定部18、及び選択分割領域特徴量抽出部26を備える。
このように、第7の実施の形態の物体識別装置では、第2の実施の形態の物体識別装置の入力画像分割領域特徴量変換部15及び差異領域特徴量抽出部19が、入力画像分割領域特徴量変換部25及び選択分割領域特徴量抽出部26に変更されている点が異なる。入力画像分割領域特徴量変換部25、選択分割領域特徴量抽出部26の詳細については後述する。その他の構成要素については第2の実施の形態と同様であり、同一の符号を付して詳細な説明は省略する。
図34は、入力画像分割領域特徴量変換部25の構成例を表すブロック図である。図34に示すように、入力画像分割領域特徴量変換部25は、分割領域特徴量選択部2501を備える。
分割領域特徴量選択部2501は、図7で示される入力画像分割領域特徴量変換部15の構成要素である差異領域内分割領域特徴量統合部501と類似している。分割領域特徴量選択部2501は、特徴量1に加えて、入力画像選択分割領域情報を出力する点が差異領域内分割領域特徴量統合部501と異なっている。分割領域特徴量選択部2501は、入力画像の差異領域内に完全に収まっている分割領域に関する情報を入力画像選択分割領域情報として出力すると同時に、入力画像分割領域特徴量の中で、入力画像の差異領域内に完全に収まっている分割領域の特徴量のみを選択し、それを特徴量1として出力する。この入力画像選択分割領域情報は、入力画像の差異領域内に完全に収まっている分割領域の4隅の座標情報及び領域IDを含む情報である。
図35は、選択分割領域特徴量抽出部26の構成例を表すブロック図である。図35に示すように、選択分割領域特徴量抽出部26は、選択分割領域決定部2601、選択分割領域画像生成部2602、及び特徴量抽出部2603を備える。
選択分割領域決定部2601は、入力画像分割領域特徴量変換部25から受け取る入力画像選択分割領域情報に対し、局所特徴量照合部17から受け取る幾何変換情報が示す幾何変換を行い、参照画像中で、入力画像中の入力画像選択分割領域に対応する領域の情報を示す選択分割領域情報を出力する。ただし、ここで使用する幾何変換情報は、入力画像中の座標から参照画像中の座標へ変換する情報となっていなければならない。
図36は、入力画像中の入力画像選択分割領域と参照画像中の選択分割領域の関係を示した図である。図36に示すように、選択分割領域決定部2601では、入力画像分割領域特徴量変換部25から受け取る入力画像選択分割領域情報が示す入力画像の差異領域内に完全に収まっている分割領域の4隅の座標値に対し、幾何変換情報が示す幾何変換を行い、参照画像中で特徴量を抽出する対象とする領域を選択分割領域として決定する。
選択分割領域画像生成部2602は、図20に示された差異領域特徴量抽出部19の構成要素である差異領域画像生成部と類似している。選択分割領域画像生成部2602は、差異領域情報ではなく選択分割領域情報が入力され、差異領域画像ではなく選択分割領域画像を出力する点が異なっている。
特徴量抽出部2603は、図20で示される差異領域特徴量抽出部19の構成要素である差異領域特徴量算出部902と類似している。特徴量抽出部2603は、差異領域画像ではなく選択分割領域画像が入力される点が異なっている。この特徴量抽出部2603で抽出される特徴量は、差異領域特徴量算出部902と同様、図5で示される、入力画像分割領域特徴量抽出部13の構成要素である特徴量抽出部302と同一の処理で抽出される特徴量でなければならない。
本実施の形態では、実施の形態1〜5のように、参照画像の差異領域における特徴量2を入力画像と独立して抽出するのではなく、特徴量1を生成する元となった分割領域に関する情報を幾何変換情報によって変換し、参照画像中で特徴量を生成する領域を決定した上で、その領域から特徴量2を生成する。このような処理を行う事で、入力画像と参照画像の物体の写っている向きや大きさの違いを補正した上で、対応する分割領域からそれぞれ抽出した特徴量同士を比較する事ができるため、より正確な特徴量照合が実現可能となる。なお、本実施の形態の構成例として、ここまで順番に説明してきた図33は、第2の実施の形態を基にした構成であり、同様に、第3〜5の実施の形態をそれぞれ基にした構成にする事も可能である。すなわち、第3〜5の実施の形態の構成例において、差異領域特徴量抽出部を選択分割領域特徴量抽出部に変更し、入力画像分割領域特徴量変換部から選択分割領域情報を出力させ、その選択分割領域情報を選択分割領域特徴量抽出部に入力する事で構成する事が可能である。第1の実施の形態についても、特徴量2を、図1のようにあらかじめ複数の参照画像から抽出しておきデータベースに記憶しておくのではなく、オンザフライで参照画像から抽出する場合は、入力画像分割領域特徴量変換部25及び選択分割領域特徴量抽出部26を備える事で構成する事が可能である。
また、本実施の形態を、ネットワークを介したサーバークライアントシステムとして構成しようとする場合、第1〜6の実施の形態と同様、入力画像を直接サーバー側に伝送する必要はなく、入力画像よりも軽量な局所特徴量、分割領域特徴量、分割領域情報のみを伝送すれば良い。そのため、本実施の形態では、クライアント側では処理をすることなくサーバー側に画像を伝送するだけの構成にした場合と比べて、サーバー側で識別処理を行い、その識別結果をクライアント側が得るまでの時間を短縮させる事が可能となる。
(第8の実施の形態)
本発明の第8の実施の形態について図面を参照して説明する。
図37は、本発明の第8の実施の形態における物体識別装置の構成例を示すブロック図である。図37に示すように、第8の実施の形態の物体識別装置は、局所特徴量抽出部11、局所特徴量照合部27、入力画像分割領域特徴量抽出部13、入力画像差異領域決定部14、入力画像分割領域特徴量変換部15、特徴量照合部28、及び識別スコア統合判定部29を備える。
このように、第8の実施の形態の物体識別装置では、第1の実施の形態の物体識別装置の局所特徴量照合部12及び特徴量照合部16が、局所特徴量照合部27及び特徴量照合部28に変更され、識別スコア統合判定部29が新たな構成要素として加わっている点が第1の実施の形態とは異なる。局所特徴量照合部27、特徴量照合部28、識別スコア統合判定部29の詳細については後述する。その他の構成要素については、第1の実施の形態と同様であり、同一の符号を付して詳細な説明は省略する。
図38は、局所特徴量照合部27の構成例を表すブロック図である。図38に示すように、局所特徴量照合部27は、対応特徴点決定部201、誤対応点除去部202、識別スコア算出部203、及び閾値判定部2701を備える。
図38の対応特徴点決定部201、誤対応点除去部202、識別スコア算出部203は、図4に示した局所特徴量照合部12の構成要素である対応特徴点決定部201、誤対応点除去部202、識別スコア算出部203と同一であり、詳細な説明は省略する。
図38の閾値判定部2701は、図4に示した局所特徴量照合部12の構成要素である閾値判定部204とほぼ同一だが、局所特徴識別画像IDだけではなく、その局所特徴識別画像IDに対応する参照画像(あるいはそれと関連付いた参照画像群)から抽出した局所特徴との識別スコアを出力している点が異なっている。この閾値判定部2701で設定される閾値は、閾値判定部204で設定される閾値よりも緩めにして、局所特徴識別画像IDと識別スコアが多数出力されるようにしても良い。
図39は、特徴量照合部28の構成例を表すブロック図である。図39に示すように、特徴量照合部28は、差異領域識別スコア算出部601、及び閾値判定部2801を備える。図39の差異領域識別スコア算出部601は、図8に示した特徴量照合部16の構成要素である差異領域識別スコア算出部601と同一であり、詳細な説明は省略する。
図39の閾値判定部2801は、図8で示される特徴量照合部16の構成要素である閾値判定部602とほぼ同一だが、差異領域識別画像IDだけではなく、その差異領域識別画像IDに対応する参照画像あるいはそれと関連付いた参照画像群の差異領域から抽出した特徴量との差異領域識別スコアを出力している点が異なっている。この閾値判定部2801で設定される閾値は、閾値判定部602で設定される閾値よりも緩めにして、差異領域識別画像IDと差異領域識別スコアが多数出力されるようにしても良い。
図40は、識別スコア統合判定部29の構成例を表すブロック図である。図40に示すように、識別スコア統合判定部29は、識別スコア統合部2901、及び閾値判定部2902を備える。
識別スコア統合部2901は、局所特徴量照合部27から出力された識別スコアと、特徴量照合部28から出力された差異領域識別スコアとを受け取り、受け取ったスコアに基づいて統合スコアを算出して出力する。この時、例えば同一の画像IDに対応する識別スコアと差異領域識別スコアの積を求め、その値を統合スコアとして出力しても良い。
図40の閾値判定部2902は、図4で示される局所特徴量照合部12の構成要素である閾値判定部204や図8で示される特徴量照合部16の構成要素である閾値判定部602とほぼ同一である。閾値判定部204及び閾値判定部602と異なる点として、閾値判定部2902は、識別スコア統合部2901から出力された統合スコアを所定の閾値と比較し、閾値以上となる場合、その入力画像と参照画像は、同一の物体を被写体とする画像であると判定し、その入力画像の画像IDを識別画像IDとして出力し、閾値未満の場合、その入力画像と参照画像は、同一の物体を被写体とする画像ではないと判定する。すなわち、閾値判定部2902は、局所特徴量照合部27による照合の結果と、特徴量照合部28による照合の結果とに基づいて、入力画像と参照画像は、同一の物体を被写体とする画像であるか否かを判定する。
本実施の形態では、実施の形態1〜7とは異なり、差異領域識別スコアだけで最終的な識別結果を決定するのではなく、これらを局所特徴量による識別スコアと統合したスコアから最終的な識別結果を判定する。同一物体を写した画像が悪環境(例えば、暗い環境)で、他の類似物体は理想的な環境で撮影されているような場合、それらの類似物体がテクスチャだけでなく色味も類似しているとしたら、差異領域から抽出した特徴量だけでは正しい識別ができないが、局所特徴量による識別結果とあわせることで、同一物体に対する識別結果を相対的に上げる事ができる。なお、本実施の形態の構成例として、ここまで順番に説明してきた図37は、第1の実施の形態を基にした構成であり、同様に、第2〜7の実施の形態をそれぞれ基にした構成にする事も可能である。すなわち、第2〜7の実施の形態の構成例において、局所特徴量照合部から識別スコアを、特徴量照合部から差異領域識別スコアを、それぞれ出力するようにし、それらを識別スコア統合判定部に入力させる事で構成する事が可能である。
また、本実施の形態を、ネットワークを介したサーバークライアントシステムとして構成しようとする場合、第1〜7の実施の形態と同様、入力画像を直接サーバー側に伝送する必要はなく、入力画像よりも軽量な局所特徴量、分割領域特徴量、分割領域情報のみを伝送すれば良い。そのため、本実施の形態では、クライアント側では処理をすることなくサーバー側に画像を伝送するだけの構成にした場合と比べて、サーバー側で識別処理を行い、その識別結果をクライアント側が得るまでの時間を短縮させる事が可能となる
この出願は、2012年8月23日に出願された日本出願特願2012−184536を基礎とする優先権を主張し、その開示の全てをここに取り込む。
以上、実施形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
上記の実施の形態の一部または全部は、以下の付記のようにも記載されうるが、以下には限られない。
(付記1)入力画像から抽出した特徴点のそれぞれの特徴量と、参照画像から抽出した特徴点のそれぞれの特徴量とが正しく対応しているか否かを判定する局所特徴量照合手段と、
前記入力画像を分割した各分割領域から特徴量を抽出する入力画像分割領域特徴量抽出手段と、
前記局所特徴量照合手段によって正しく対応していると判定された特徴量の組み合わせ数に基づくスコアが所定値以上である場合、前記入力画像と前記参照画像との間の幾何的なずれを補正する幾何変換を前記参照画像の所定の領域に対して行うことによって得られた画像領域の位置に対応する前記入力画像における領域に含まれる前記分割領域の特徴量を取得する入力画像分割領域特徴量変換手段と、
前記入力画像分割領域特徴量変換手段によって取得された特徴量と、前記参照画像の前記所定の領域から抽出された特徴量とを照合し、照合結果を出力する特徴量照合手段と
を備えたことを特徴とする物体識別装置。
(付記2)前記参照画像の前記所定の領域についての情報を記憶した記憶手段を備えることを特徴とする付記1に記載の物体識別装置。
(付記3)前記参照画像の前記所定の領域は、前記局所特徴量照合手段によって特徴量が誤って対応していると判定された参照画像における特徴点を含む領域であることを特徴とする付記1に記載の物体識別装置。
(付記4)前記参照画像の前記所定の領域は、物品が写った領域のうち、前記局所特徴量照合手段によって特徴量が誤って対応していると判定された参照画像における特徴点を含む領域であることを特徴とする付記1に記載の物体識別装置。
(付記5)前記参照画像の前記所定の領域は、前記参照画像中において所定のパターン画像との類似度が所定値以上である領域を含む領域であることを特徴とする付記1に記載の物体識別装置。
(付記6)前記参照画像の前記所定の領域は、前記参照画像中において、前記局所特徴量照合手段によって特徴量が誤って対応していると判定され、かつ、所定のパターン画像との類似度が所定値以上である領域を含む領域であることを特徴とする付記1に記載の物体識別装置。
(付記7)前記参照画像を分割した各分割領域から特徴量を抽出する分割領域特徴量抽出手段と、
前記参照画像の所定の領域に含まれる前記分割領域の特徴量を取得する分割領域特徴量変換手段と
を備え、
前記特徴量照合手段による照合に用いられる前記参照画像の前記所定の領域から抽出された特徴量は、前記分割領域特徴量変換手段により取得された特徴量であることを特徴とする付記1から6のいずれか1つに記載の物体識別装置。
(付記8)前記入力画像分割領域特徴量変換手段により特徴量が取得された前記入力画像における前記分割領域に対応する前記参照画像における領域の特徴量を抽出する選択分割領域特徴量抽出手段を備え、
前記特徴量照合手段による照合に用いられる前記参照画像の前記所定の領域から抽出された特徴量は、前記選択分割領域特徴量抽出手段により抽出された特徴量であることを特徴とする付記3から6のいずれか1項に記載の物体識別装置。
(付記9)前記局所特徴量照合手段による前記判定の結果と、前記特徴量照合手段による前記照合の結果とに基づいて、前記入力画像と前記参照画像は、同一の物体を被写体とする画像であるか否かを判定する統合判定手段を備えることを特徴とする付記1から8のいずれか1つに記載の物体識別装置。
(付記10)入力画像から抽出した特徴点のそれぞれの特徴量と、参照画像から抽出した特徴点のそれぞれの特徴量とが正しく対応しているか否かを判定する局所特徴量照合ステップと、
前記入力画像を分割した各分割領域から特徴量を抽出する入力画像分割領域特徴量抽出ステップと、
前記局所特徴量照合ステップによって正しく対応していると判定された特徴量の組み合わせ数に基づくスコアが所定値以上である場合、前記入力画像と前記参照画像との間の幾何的なずれを補正する幾何変換を前記参照画像の所定の領域に対して行うことによって得られた画像領域の位置に対応する前記入力画像における領域に含まれる前記分割領域の特徴量を取得する入力画像分割領域特徴量変換ステップと、
前記入力画像分割領域特徴量変換ステップによって取得された特徴量と、前記参照画像の前記所定の領域から抽出された特徴量とを照合し、照合結果を出力する特徴量照合ステップと
を備えたことを特徴とする物体識別方法。
(付記11)コンピュータを、
入力画像から抽出した特徴点のそれぞれの特徴量と、参照画像から抽出した特徴点のそれぞれの特徴量とが正しく対応しているか否かを判定する局所特徴量照合手段、
前記入力画像を分割した各分割領域から特徴量を抽出する入力画像分割領域特徴量抽出手段、
前記局所特徴量照合手段によって正しく対応していると判定された特徴量の組み合わせ数に基づくスコアが所定値以上である場合、前記入力画像と前記参照画像との間の幾何的なずれを補正する幾何変換を前記参照画像の所定の領域に対して行うことによって得られた画像領域の位置に対応する前記入力画像における領域に含まれる前記分割領域の特徴量を取得する入力画像分割領域特徴量変換手段、
前記入力画像分割領域特徴量変換手段によって取得された特徴量と、前記参照画像の前記所定の領域から抽出された特徴量とを照合し、照合結果を出力する特徴量照合手段
として機能させるためのプログラム。
従来の局所特徴量のみを用いた物体識別では、同一銘柄でパッケージの色や一部の文字のみが異なる製品の正確な識別、同一封筒で宛名だけが異なる郵便物の正確な識別は困難であるが、本発明によれば、従来の局所特徴量による照合だけでは識別できなかった細かな差異を見分け、同一の物体を写した画像のみを識別する事が可能になり、バーコードレスのPOSシステム、検品システム、郵便物自動仕分けシステム等に適用可能である。
11 局所特徴量抽出部
12 局所特徴量照合部
13 入力画像分割領域特徴量抽出部
14 入力画像差異領域決定部
15 入力画像分割領域特徴量変換部
16 特徴量照合部
17 局所特徴量照合部
18 差異領域推定部
19 差異領域特徴量抽出部
20、21、22 差異領域推定部
23、24 分割領域特徴量抽出部
25 入力画像分割領域特徴量変換部
26 選択分割領域特徴量抽出部
27 局所特徴量照合部
28 特徴量照合部
29 識別スコア統合判定部
101 輝度情報抽出部
102 局所特徴点検出部
103 局所特徴量生成部
201 対応特徴点決定部
202 誤対応点除去部
203 識別スコア算出部
204 閾値判定部
301 分割領域画像生成部
302 特徴量抽出部
501 差異領域内分割領域特徴量統合部
601 差異領域識別スコア算出部
602 閾値判定部
801 誤対応特徴点密集度探索部
901 差異領域画像生成部
902 差異領域特徴量算出部
2001 物体領域推定部
2002 誤対応特徴点密集度探索部
2101、2102 テンプレートマッチング部
2201 誤対応特徴点密集度探索部
2202、2203 テンプレートマッチング部
2204 誤対応特徴点密集度探索部
2205 差異候補領域重複検出部
2301 分割領域画像生成部
2302 特徴量抽出部
2401 差異領域内分割領域特徴量統合部
2501 分割領域特徴量選択部
2601 選択分割領域決定部
2602 選択分割領域画像生成部
2603 特徴量抽出部
2701、2801 閾値判定部
2901 識別スコア統合部
2902 閾値判定部

Claims (10)

  1. 入力画像から抽出した特徴点のそれぞれの特徴量と、参照画像から抽出した特徴点のそれぞれの特徴量とが正しく対応しているか否かを判定する局所特徴量照合手段と、
    前記入力画像を分割した各分割領域から特徴量を抽出する入力画像分割領域特徴量抽出手段と、
    前記局所特徴量照合手段によって正しく対応していると判定された特徴量の組み合わせ数に基づくスコアが所定値以上である場合、前記入力画像と前記参照画像との間の幾何的なずれを補正する幾何変換を前記参照画像の所定の領域に対して行うことによって得られた画像領域の位置に対応する前記入力画像における領域に含まれる前記分割領域の特徴量を取得する入力画像分割領域特徴量変換手段と、
    前記入力画像分割領域特徴量変換手段によって取得された特徴量と、前記参照画像の前記所定の領域から抽出された特徴量とを照合し、照合結果を出力する特徴量照合手段と
    を備えたことを特徴とする物体識別装置。
  2. 前記参照画像の前記所定の領域についての情報を記憶した記憶手段を備えることを特徴とする請求項1に記載の物体識別装置。
  3. 前記参照画像の前記所定の領域は、前記局所特徴量照合手段によって特徴量が誤って対応していると判定された参照画像における特徴点を含む領域であることを特徴とする請求項1に記載の物体識別装置。
  4. 前記参照画像の前記所定の領域は、物品が写った領域のうち、前記局所特徴量照合手段によって特徴量が誤って対応していると判定された参照画像における特徴点を含む領域であることを特徴とする請求項1に記載の物体識別装置。
  5. 前記参照画像の前記所定の領域は、前記参照画像中において所定のパターン画像との類似度が所定値以上である領域を含む領域であることを特徴とする請求項1に記載の物体識別装置。
  6. 前記参照画像の前記所定の領域は、前記参照画像中において、前記局所特徴量照合手段によって特徴量が誤って対応していると判定され、かつ、所定のパターン画像との類似度が所定値以上である領域を含む領域であることを特徴とする請求項1に記載の物体識別装置。
  7. 前記参照画像を分割した各分割領域から特徴量を抽出する分割領域特徴量抽出手段と、
    前記参照画像の所定の領域に含まれる前記分割領域の特徴量を取得する分割領域特徴量変換手段と
    を備え、
    前記特徴量照合手段による照合に用いられる前記参照画像の前記所定の領域から抽出された特徴量は、前記分割領域特徴量変換手段により取得された特徴量であることを特徴とする請求項1から6のいずれか1項に記載の物体識別装置。
  8. 前記入力画像分割領域特徴量変換手段により特徴量が取得された前記入力画像における前記分割領域に対応する前記参照画像における領域の特徴量を抽出する選択分割領域特徴量抽出手段を備え、
    前記特徴量照合手段による照合に用いられる前記参照画像の前記所定の領域から抽出された特徴量は、前記選択分割領域特徴量抽出手段により抽出された特徴量であることを特徴とする請求項3から6のいずれか1項に記載の物体識別装置。
  9. 入力画像から抽出した特徴点のそれぞれの特徴量と、参照画像から抽出した特徴点のそれぞれの特徴量とが正しく対応しているか否かを判定する局所特徴量照合ステップと、
    前記入力画像を分割した各分割領域から特徴量を抽出する入力画像分割領域特徴量抽出ステップと、
    前記局所特徴量照合ステップによって正しく対応していると判定された特徴量の組み合わせ数に基づくスコアが所定値以上である場合、前記入力画像と前記参照画像との間の幾何的なずれを補正する幾何変換を前記参照画像の所定の領域に対して行うことによって得られた画像領域の位置に対応する前記入力画像における領域に含まれる前記分割領域の特徴量を取得する入力画像分割領域特徴量変換ステップと、
    前記入力画像分割領域特徴量変換ステップによって取得された特徴量と、前記参照画像の前記所定の領域から抽出された特徴量とを照合し、照合結果を出力する特徴量照合ステップと
    を備えたことを特徴とする物体識別方法。
  10. コンピュータを、
    入力画像から抽出した特徴点のそれぞれの特徴量と、参照画像から抽出した特徴点のそれぞれの特徴量とが正しく対応しているか否かを判定する局所特徴量照合手段、
    前記入力画像を分割した各分割領域から特徴量を抽出する入力画像分割領域特徴量抽出手段、
    前記局所特徴量照合手段によって正しく対応していると判定された特徴量の組み合わせ数に基づくスコアが所定値以上である場合、前記入力画像と前記参照画像との間の幾何的なずれを補正する幾何変換を前記参照画像の所定の領域に対して行うことによって得られた画像領域の位置に対応する前記入力画像における領域に含まれる前記分割領域の特徴量を取得する入力画像分割領域特徴量変換手段、
    前記入力画像分割領域特徴量変換手段によって取得された特徴量と、前記参照画像の前記所定の領域から抽出された特徴量とを照合し、照合結果を出力する特徴量照合手段
    として機能させるためのプログラム。
JP2014531522A 2012-08-23 2013-05-20 物体識別装置、物体識別方法、及びプログラム Active JP6143111B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2012184536 2012-08-23
JP2012184536 2012-08-23
PCT/JP2013/063982 WO2014030399A1 (ja) 2012-08-23 2013-05-20 物体識別装置、物体識別方法、及びプログラム

Publications (2)

Publication Number Publication Date
JPWO2014030399A1 JPWO2014030399A1 (ja) 2016-07-28
JP6143111B2 true JP6143111B2 (ja) 2017-06-07

Family

ID=50149717

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014531522A Active JP6143111B2 (ja) 2012-08-23 2013-05-20 物体識別装置、物体識別方法、及びプログラム

Country Status (6)

Country Link
US (1) US20150213328A1 (ja)
EP (2) EP2889835A4 (ja)
JP (1) JP6143111B2 (ja)
CN (1) CN104584073B (ja)
TW (1) TW201419169A (ja)
WO (1) WO2014030399A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190096755A (ko) * 2018-02-09 2019-08-20 한화정밀기계 주식회사 대형 부품 인식 방법

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6168303B2 (ja) * 2012-01-30 2017-07-26 日本電気株式会社 情報処理システム、情報処理方法、情報処理装置およびその制御方法と制御プログラム、通信端末およびその制御方法と制御プログラム
CN104584071B (zh) * 2012-08-23 2018-01-26 日本电气株式会社 物体识别装置、物体识别方法
KR20150015680A (ko) * 2013-08-01 2015-02-11 씨제이씨지브이 주식회사 특징점의 생성을 이용한 이미지 보정 방법 및 장치
US11615460B1 (en) 2013-11-26 2023-03-28 Amazon Technologies, Inc. User path development
WO2015197029A1 (zh) * 2014-06-27 2015-12-30 北京奇虎科技有限公司 一种人脸相似度识别方法和系统
US10679177B1 (en) 2015-03-25 2020-06-09 Amazon Technologies, Inc. Using depth sensing cameras positioned overhead to detect and track a movement of a user within a materials handling facility
US11205270B1 (en) * 2015-03-25 2021-12-21 Amazon Technologies, Inc. Collecting user pattern descriptors for use in tracking a movement of a user within a materials handling facility
US10586203B1 (en) 2015-03-25 2020-03-10 Amazon Technologies, Inc. Segmenting a user pattern into descriptor regions for tracking and re-establishing tracking of a user within a materials handling facility
US10810539B1 (en) 2015-03-25 2020-10-20 Amazon Technologies, Inc. Re-establishing tracking of a user within a materials handling facility
JP6333871B2 (ja) * 2016-02-25 2018-05-30 ファナック株式会社 入力画像から検出した対象物を表示する画像処理装置
US20170323149A1 (en) * 2016-05-05 2017-11-09 International Business Machines Corporation Rotation invariant object detection
US10861184B1 (en) * 2017-01-19 2020-12-08 X Development Llc Object pose neural network system
US10242291B2 (en) * 2017-02-08 2019-03-26 Idemia Identity & Security Device for processing images of people, the device seeking to sort these images as a function of contextual information
US11328513B1 (en) 2017-11-07 2022-05-10 Amazon Technologies, Inc. Agent re-verification and resolution using imaging
US10846562B2 (en) * 2018-01-12 2020-11-24 Arizona Board Of Regents On Behalf Of Arizona State University Systems and methods for image matching
US11386306B1 (en) * 2018-12-13 2022-07-12 Amazon Technologies, Inc. Re-identification of agents using image analysis and machine learning
JP6686122B1 (ja) * 2018-12-21 2020-04-22 株式会社モルフォ 画像処理装置、画像処理方法およびプログラム
JP7229795B2 (ja) * 2019-02-01 2023-02-28 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ アノテーション装置、アノテーション方法、及び、プログラム
JP7441654B2 (ja) * 2020-01-21 2024-03-01 セコム株式会社 認識装置、学習装置、認識システム、認識方法、認識プログラム、学習方法、及び学習プログラム
JP7441656B2 (ja) * 2020-01-23 2024-03-01 セコム株式会社 認識装置、学習装置、認識システム、認識方法、及び認識プログラム
US20220262263A1 (en) * 2021-02-16 2022-08-18 Flir Unmanned Aerial Systems Ulc Unmanned aerial vehicle search and rescue systems and methods

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6711293B1 (en) 1999-03-08 2004-03-23 The University Of British Columbia Method and apparatus for identifying scale invariant features in an image and use of same for locating an object in an image
JP4196302B2 (ja) * 2006-06-19 2008-12-17 ソニー株式会社 情報処理装置および方法、並びにプログラム
US20090322860A1 (en) * 2006-11-17 2009-12-31 Dong-Qing Zhang System and method for model fitting and registration of objects for 2d-to-3d conversion
US8861834B2 (en) * 2007-03-09 2014-10-14 Omron Corporation Computer implemented method for recognizing an object based on a correspondence relationship between object feature points and pre-registered model feature points
JP5183392B2 (ja) 2008-09-25 2013-04-17 キヤノン株式会社 画像処理装置、画像処理方法およびプログラム
CN101493935B (zh) * 2008-11-10 2012-05-09 西安电子科技大学 基于剪切波隐马尔可夫模型的合成孔径雷达图像分割方法
IT1394181B1 (it) * 2009-05-07 2012-06-01 Marchesini Group Spa Metodo di segmentazione basato sulle caratteristiche per segmentare una pluralita' di articoli duplicati disposti alla rinfusa e gruppo che attua tale metodo per alimentare una macchina confezionatrice
JP5430243B2 (ja) * 2009-06-17 2014-02-26 キヤノン株式会社 画像検索装置及びその制御方法並びにプログラム
US8280196B2 (en) * 2009-05-12 2012-10-02 Canon Kabushiki Kaisha Image retrieval apparatus, control method for the same, and storage medium
US9019349B2 (en) * 2009-07-31 2015-04-28 Naturalpoint, Inc. Automated collective camera calibration for motion capture
JP5385105B2 (ja) * 2009-11-25 2014-01-08 Kddi株式会社 画像検索方法およびシステム
JP2012033022A (ja) * 2010-07-30 2012-02-16 Panasonic Corp 空間における変化領域検出装置及び方法
CN102073878B (zh) * 2010-11-15 2012-11-07 上海大学 非穿戴指势视觉识别方法
JP5922428B2 (ja) 2011-02-16 2016-05-24 綜合警備保障株式会社 複写防止用紙

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190096755A (ko) * 2018-02-09 2019-08-20 한화정밀기계 주식회사 대형 부품 인식 방법
KR102484353B1 (ko) 2018-02-09 2023-01-04 한화정밀기계 주식회사 대형 부품 인식 방법

Also Published As

Publication number Publication date
TW201419169A (zh) 2014-05-16
US20150213328A1 (en) 2015-07-30
EP2889835A4 (en) 2016-06-08
EP3693893A1 (en) 2020-08-12
WO2014030399A1 (ja) 2014-02-27
CN104584073A (zh) 2015-04-29
JPWO2014030399A1 (ja) 2016-07-28
EP2889835A1 (en) 2015-07-01
CN104584073B (zh) 2017-04-05

Similar Documents

Publication Publication Date Title
JP6143111B2 (ja) 物体識別装置、物体識別方法、及びプログラム
JP6278276B2 (ja) 物体識別装置、物体識別方法、及びプログラム
JP6354589B2 (ja) 物体識別装置、方法及びプログラム
JP6619634B2 (ja) 画像処理装置及び画像処理方法
US8792715B2 (en) System and method for forms classification by line-art alignment
KR101617681B1 (ko) 히스토그램들을 갖는 다중 층 연결 요소들을 사용하는 텍스트 검출
US20070242882A1 (en) Image processing apparatus for identifying the position of a process target within an image
JP2021057054A (ja) 画像認識装置
JP2020030858A (ja) 画像処理装置及び画像処理方法
US20100158375A1 (en) Signal processing apparatus, signal processing method, computer-readable medium and computer data signal
JP6831951B2 (ja) 画像認識システム
WO2017179728A1 (ja) 画像認識装置、画像認識方法および画像認識プログラム
JP2007140729A (ja) 物品の位置及び姿勢を検出する方法および装置
JP5712415B2 (ja) 帳票処理システム及び帳票処理方法
JP6941331B2 (ja) 画像認識システム
JP4221960B2 (ja) 帳票識別装置及びその識別方法
KR102557912B1 (ko) 관심영역 이미지 추출장치 및 이를 포함하는 로봇 프로세스 자동화 시스템
JP2019046184A (ja) 画像処理装置、訓練画像処理装置、画像識別装置、訓練画像処理方法、画像識別方法、及びプログラム
CN114565750A (zh) 一种纸质试题的处理方法和系统
JP2023028563A (ja) 画像処理プログラム、画像処理装置、及び画像処理方法
JP2011043870A (ja) 画像処理方法、プログラム、及び、画像処理装置

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170413

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170426

R150 Certificate of patent or registration of utility model

Ref document number: 6143111

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150