JP4348353B2 - パターン認識装置,パターン認識方法及びその方法を実現したプログラムを格納した記録媒体 - Google Patents

パターン認識装置,パターン認識方法及びその方法を実現したプログラムを格納した記録媒体 Download PDF

Info

Publication number
JP4348353B2
JP4348353B2 JP2006185065A JP2006185065A JP4348353B2 JP 4348353 B2 JP4348353 B2 JP 4348353B2 JP 2006185065 A JP2006185065 A JP 2006185065A JP 2006185065 A JP2006185065 A JP 2006185065A JP 4348353 B2 JP4348353 B2 JP 4348353B2
Authority
JP
Japan
Prior art keywords
similarity
image data
distance
feature point
calculated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006185065A
Other languages
English (en)
Other versions
JP2007299364A (ja
Inventor
慎吾 安藤
良規 草地
章 鈴木
貴之 安野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2006185065A priority Critical patent/JP4348353B2/ja
Publication of JP2007299364A publication Critical patent/JP2007299364A/ja
Application granted granted Critical
Publication of JP4348353B2 publication Critical patent/JP4348353B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/757Matching configurations of points or features

Description

本発明は、パターン認識装置,パターン認識方法及びその方法を実現したプログラムを格納した記録媒体であって、例えば、画像認識技術に関するものである。
近年、携帯電話にカメラ機能が搭載され、いつでも手軽に画像データを取得または保存できるようになった。このカメラ機能をさらに活用するサービスとして、画像データに記録された3次元物体を該画像データから認識し、その3次元物体に関連したデータを提供するというサービスが知られている。
例えば、3次元物体を効率よく画像認識するために、特徴点を利用した手法がよく使われる。特徴ある点(例えば、コーナーなど)を画像から自動抽出し、予め3次元物体から抽出しておいた特徴点を3次元マップに対応付けし、その対応付けの妥当性を検証して一定以上の妥当性を持つ物体を適合物体として認識する手法(例えば、特許文献1参照)である。この手法は、特別なパーツ(例えば、マーカなど)を物体に付与する必要がない上に、特徴点の対応関係が未知の場合にも対処できる。
画像認識技術では、幾つかの方法が広く知られており、それらを以下に挙げておく。
画像認識処理では、ボロノイ図作成処理が利用されることがある。このボロノイ図作成処理を高速化する方法として、例えば、逐次添加法など(例えば、非特許文献1参照)が知られている。
また、画像認識技術における特徴点抽出方法には、Harris作用素、Kanade−Lucas−Tomasi法、Moravec作用素、など様々な方法(例えば、非特許文献2参照)が知られている。
特開2002−109539号公報(段落[0021]〜[0025]等)。 Xuehou Tan,平田富夫、「計算幾何学入門」、森北出版、2001年10月25日。 金澤靖,金谷健一、「コンピュータビジョンのための画像の特徴点の抽出」、電子情報通信学会誌、2004年、Vol.87、No.12、pp.1043−1048。
前述のような手法は、対応点探索を積極的に行うものではなく、3次元物体から予め抽出しておいた特徴点と新たに入力された特徴点からそれぞれランダムに数点ずつ選択し、それらの点が対応していると仮定した上で、妥当性評価(即ち、妥当性評価処理)まで一気に行う手法である。
前記手法では、仮定が正しいと見做されるのは、対応の妥当性が高く評価されたときのみのため、高い妥当性が算出されるまで何回も、前記妥当性評価処理を繰り返さなくてはならない。
また、一般に対応点探索は不安定な処理となりがちなため、その不安定さを回避できる前記手法は高い安定性を保てる。
しかし、結果の信頼性向上のためには、妥当性評価処理の回数を出来る限り増やさねばならないため、非常に時間のかかる作業となる。
本発明は、前記課題に基づいてなされたものであって、3次元物体を撮影した画像から特徴点を自動抽出し、予め蓄えられた物体の特徴点と照合し、物体認識を高速に実行するパターン認識装置,パターン認識方法及びその方法を実現したプログラムを格納した記録媒体を提供する。
本発明は、前記課題の解決を図るために、請求項1記載の発明は、画像データに含まれる物体を識別するパターン認識装置であって、画像取得手段から取得した画像データを登録用画像データと見做し、該登録用画像データを入力する登録用画像データ入力手段と、その登録用画像データに撮像された物体に関する第1特徴点を、その登録用画像データから抽出する第1特徴点抽出手段と、その第1特徴点の位置情報を蓄積手段に蓄積する学習マップ記憶手段と、画像データを認識用画像データと見做し、該認識用画像データを入力する認識用画像データ入力手段と、その認識用画像データから第2特徴点を抽出する第2特徴点抽出手段と、前記認識用画像データ上の任意位置から最も近い第2特徴点までの距離を計算し、該任意位置,最も近い第2特徴点,任意位置から最も近い第2特徴点までの距離を含むデータをテーブル化する距離参照テーブル作成手段と、前記学習マップ記憶手段で蓄積された第1特徴点の位置の情報を呼び出し、その第1特徴点の位置の情報に基づいて最小の第1類似度を計算し、その距離参照テーブル作成手段で作成された距離参照テーブルを用いて、最小の第2類似度を計算し、その第1類似度と第2類似度に基づいて第3類似度を算出し、その第3類似度に基づいて、前記物体に関して最も類似している特徴点を求める識別手段と、その最も類似している特徴点を認識結果と見做し、その認識結果を出力する出力手段と、を有することを特徴とする。
請求項2記載の発明は、請求項1記載の発明において、前記距離参照テーブル作成手段が、前記第2特徴点に基づいてボロノイ図を作成し、前記認識用画像データ上の任意位置から最も近い第2特徴点までの距離を該ボロノイ図を用いて計算する、ことを特徴とする。
請求項3記載の発明は、請求項1または2記載の発明において、前記識別手段が、前記認識用画像データ上の任意位置から最も近い第2特徴点までの距離が、登録用画像データから抽出された第1特徴点の総数n,第2類似度S1,類似度閾値Sthreに基づいた以下の式で表される距離pより短くなる場合、その第2類似度S1に関する第3類似度の計算をスキップしつつ、第2類似度S1が最小となる位置を探索し、その第2類似度S1が最小となる位置における第1類似度を求める、ことを特徴とする。
請求項4記載の発明は、請求項1乃至3のいずれかに記載の発明において、前記学習マップ記憶手段が、さらに、該第1特徴点の位置情報を任意の幾何的変形に基づいて変形し、その変形された複数の第1特徴点の位置情報も、前記蓄積手段に蓄積し、学習マップa及びb間の距離を以下の式[2]で計算される学習マップ間距離Sm(a,b)と見做し、全ての学習マップ間の組合せを計算して相互学習マップ間テーブルを作成する相互学習マップ間テーブル作成手段を備え、前記識別手段が、学習マップaから抽出された第1特徴点の総数n,第2類似度S1,類似度閾値Sthreに基づいた以下の式[3]で表される距離paを計算し、その計算された距離paに基づいた以下の式[4]で計算して距離値qa,bを求め、その距離値qa,bが正になる場合に、前記学習マップbを用いた前記第2類似度が最小となる位置の探索を省略し、更に、前記第3類似度を算出する計算も省略する、ことを特徴とする。
請求項5記載の発明は、画像データに含まれる物体を識別するパターン認識方法であって、画像取得手段から取得した画像データを登録用画像データと見做し、該登録用画像データを入力する登録用画像データ入力ステップと、その登録用画像データに撮像された物体に関する第1特徴点を、その登録用画像データから抽出する第1特徴点抽出ステップと、その第1特徴点の位置情報を蓄積手段に蓄積する学習マップ記憶ステップと、画像データを認識用画像データと見做し、該認識用画像データを入力する認識用画像データ入力ステップと、その認識用画像データから第2特徴点を抽出する第2特徴点抽出ステップと、前記認識用画像データ上の任意位置から最も近い第2特徴点までの距離を計算し、該任意位置,最も近い第2特徴点,任意位置から最も近い第2特徴点までの距離を含むデータをテーブル化する距離参照テーブル作成ステップと、前記学習マップ記憶ステップで蓄積された第1特徴点の位置の情報を呼び出し、その第1特徴点の位置の情報に基づいて最小の第1類似度を計算し、その距離参照テーブル作成ステップで作成された距離参照テーブルを用いて、最小の第2類似度を計算し、その第1類似度と第2類似度に基づいて第3類似度を算出し、その第3類似度に基づいて、前記物体に関して最も類似している特徴点を求める識別ステップと、その最も類似している特徴点を認識結果と見做し、その認識結果を出力する出力ステップと、を含むことを特徴とする。
請求項6記載の発明は、請求項5記載の発明において、前記距離参照テーブル作成ステップが、前記第2特徴点に基づいてボロノイ図を作成し、前記認識用画像データ上の任意位置から最も近い第2特徴点までの距離を該ボロノイ図を用いて計算する、ことを特徴とする。
請求項7記載の発明は、請求項5または6記載の発明において、前記識別ステップにおいて、前記認識用画像データ上の任意位置から最も近い第2特徴点までの距離が、登録用画像データから抽出された第1特徴点の総数n,第2類似度S1,類似度閾値Sthreに基づいた以下の式で表される距離pより短くなる場合、その第2類似度S1に関する第3類似度の計算をスキップしつつ、第2類似度S1が最小となる位置を探索し、その第2類似度S1が最小となる位置における第1類似度を求める、ことを特徴とする。
請求項8記載の発明は、請求項5乃至7のいずれかに記載の発明において、前記学習マップ記憶ステップが、さらに、該第1特徴点の位置情報を任意の幾何的変形に基づいて変形し、その変形された複数の第1特徴点の位置情報も、前記蓄積手段に蓄積し、学習マップa及びb間の距離を以下の式[2]で計算される学習マップ間距離Sm(a,b)と見做し、全ての学習マップ間の組合せを計算して相互学習マップ間テーブルを作成する相互学習マップ間テーブル作成ステップを備え、前記識別ステップが、学習マップaから抽出された第1特徴点の総数n,第2類似度S1,類似度閾値Sthreに基づいた以下の式[3]で表される距離paを計算し、その計算された距離paに基づいた以下の式[4]で計算して距離値qa,bを求め、その距離値qa,bが正になる場合に、前記学習マップbを用いた前記第2類似度が最小となる位置の探索を省略し、更に、前記第3類似度を算出する計算も省略する、ことを特徴とする。
請求項9記載の発明は、記録媒体であって、請求項5乃至8のいずれかに記載のパターン認識方法を、コンピュータで実行可能なコンピュータプログラムとして記述し、そのコンピュータプログラムを記録したことを特徴とする。
前記の請求項1,5の発明によれば、物体の特徴点を蓄積(即ち、学習マップを蓄積)できる。距離参照テーブルを作成し用いることができる。
前記の請求項2,6の発明によれば、第2特徴点に基づいたボロノイ図を取得できる。
前記の請求項3,7の発明によれば、前記類似度閾値に基づいた距離を条件に処理をスキップできる。
前記の請求項4,8の発明によれば、前記距離値を条件に第3類似度を求める処理をスキップできる。
前記の請求項9の発明によれば、請求項5乃至8のいずれかに記載のパターン認識方法をコンピュータプログラムとして記載できる。
以上示したように請求項1,5の発明によれば、3次元物体を撮影した画像から特徴点を自動抽出し、予め蓄えられた物体の特徴点(即ち、学習マップ)と照合する物体認識方式を、距離参照テーブルを用いて高速に実行できる。即ち、距離参照テーブルを用いないパターン認識装置よりも、パターン認識処理を高速に実行できる。
請求項2,6の発明によれば、前記ボロノイ図に基づいて第2類似度を高速に算出できる。
請求項3,7の発明によれば、類似度の計算処理をスキップできるため、第3類似度を高速に算出できる。
請求項4,8の発明によれば、物体の平面上に存在する記号等に関する特徴点を高速に識別できる。
請求項9の発明によれば、パターン認識方法を実装したコンピュータプログラムを記録した記録媒体を提供できる。
これらを以って画像認識技術分野に貢献できる。
以下、本発明の実施形態を図面等に基づいて詳細に説明する。
本発明における基本画像認識(或いは、基本的なパターン認識)手法を図7に基づいて以下に説明する。
まず、予め物体をさまざまな方向から撮影した画像(即ち、登録用画像)から特徴点を抽出し、その特徴点の2次元マップ(以下、学習マップと称する)群1を用意しておく。
次に、入力画像(即ち、認識用画像)2から特徴点3を抽出し、前記学習マップが含まれているか否かを、ずらしマッチング処理によって探索し画像認識を行う。
なお、そのずらしマッチング処理に基づく類似度は、学習マップと入力画像の一部分(例えば、図7中の符号4の部分)から切り出された特徴点の位置関係が近いほど高くなるように設定するものとする。
前記探索はナイーブに解けば時間のかかるものであるが、ずらしマッチング時のスキップ処理(或いは、枝刈り処理)及びボロノイ図作成アルゴリズムの利用によって高速化できる。
ずらしマッチング時のスキップ処理は、特定の場所で類似度を算出した後、どの程度まで次の位置をスキップさせることができるかを先回りして計算するというものである。
ボロノイ図作成アルゴリズムは、入力画像から特徴点を抽出した後、それらの特徴点をノードと見做したボロノイ図を描画し、その結果であるボロノイ図を利用して任意の位置の最近点までの距離を計算しテーブルを作成するものである。
なお、ボロノイ図作成処理は、前述の逐次添加法など、さまざまな高速化法が提案されているものである。また、前記テーブルを参照することによって、類似度算出の速度を劇的に向上できる。
[第1実施形態]
第1実施形態を図1乃至図3に基づいて以下に説明する。
なお、図1は、第1実施形態におけるパターン認識装置の構成図である。図2Aは、第1実施形態における登録用画像データの登録過程を示すフローチャートである。図2Bは、第1実施形態におけるパターン認識方法を示すフローチャートである。図3は、第1実施形態における最小の類似度を計算する処理(以下、単に、最小類似度計算処理という)の手順を示すフローチャートである。
図1中の登録用画像データ入力部11は、認識対象の登録に用いるため、画像取得(例えば、撮像装置(例えば、デジタルカメラ等)によって撮像する)手段によって3次元物体の画像データ(即ち、登録用画像データ)を取得し、3次元物体の画像データ(即ち、登録用画像データ)を入力し、特徴点抽出部12に伝送する。なお、その3次元物体の撮像では、さまざまな見え方の画像(例えば、アングルや大きさを変えた画像)を撮像するものとする。例えば、撮像する対象が2次元的な物体である場合、計算機内で透視投影変換によって擬似的に画像を作ることも出来る。
特徴点抽出部12は、登録用画像データ入力部11から伝送された登録用画像データから特徴点を抽出する。なお、特徴点を抽出する方法には、前述の特徴点抽出方法を利用できる。
学習マップ記憶部13は、抽出された特徴点の位置(即ち、学習マップ)を蓄積手段(例えば、メモリ,HDD(Hard Disk Drive)装置)に全て蓄積する。なお、前記学習マップは、一つの登録物体(即ち、登録用画像に撮像された3次元物体)に対し、撮像した画像の枚数分保存される。
認識用画像データ入力部14は、認識したい物体を撮像した画像データ(即ち、認識用画像データ)を特徴点抽出部15に伝送する。
特徴点抽出部15は、認識用画像データ入力部14から伝送された認識用画像データから特徴点を抽出する。
距離参照テーブル作成部16は、次の手順を実行する。
まず、特徴点抽出部15で抽出された特徴点を使って、ボロノイ図を作成する。なお、ボロノイ図作成には、前述の逐次添加法などが利用できる。
そして、任意位置から最も近い特徴点(即ち、最近傍特徴点)までの距離を参照できるテーブル(以下、距離参照テーブルと称する)を作成する。なお、前記距離参照テーブルは、例えば、任意位置,最近傍特徴点,任意位置から最近傍特徴点までの距離を1データと見做すテーブルである。また、前記距離参照テーブルの要素数は、認識用画像の画素数と同じものとする。
先ほどのボロノイ図を参照することによって、最近傍の特徴点を瞬時に知ることができるため、距離参照テーブルの作成処理は非常に高速に処理できる。なお、前記距離参照テーブルに対し高速にアクセスするために、例えば、該距離参照テーブルを高速アクセス可能な記憶領域(例えば、バッファ)に格納しても良い。
識別部17は、学習マップ記憶部13で蓄積した特徴点位置の情報を呼出し、距離参照テーブル作成部16で作成した距離参照テーブルを利用して物体識別(即ち、物体に関する特徴点の識別)を行う。
第1実施形態では、物体識別に利用する物体の類似度Sを以下の式で表すことにする。なお、類似度Sは「0」に近いほど類似しているといえる。
ただし、Vは登録用画像データから抽出された特徴点の集合、xkはk番目の特徴点の2次元位置座標ベクトル、nは登録用画像データから抽出された特徴点の総数、Uは認識用画像データから抽出された特徴点の集合、ylは所定範囲から抽出されたl番目の特徴点の2次元位置座標ベクトル、mは認識用画像データの所定範囲から抽出された特徴点の総数である。
また、S1は登録用画像データの各特徴点を起点と見做し、その起点から最近傍点までの距離の和を類似度と見做したもの(以後、類似度S1と称する)である。S2は認識用画像データの各特徴点を起点と見做し、その起点から最近傍点までの距離の和を類似度と見做したもの(以後、類似度S2と称する)である。
従って、類似度Sは、次のように言える。認識用画像データ領域内で登録用画像データ領域(テンプレートと見做しても良い)と重なっている部分の領域において、認識用画像データの特徴点と登録用画像データの特徴点を合わせた数を総特徴点数と見做す。そして、その総特徴点数当たりの平均類似度をSと見做すことができる。
なお、所定範囲とは、登録用画像データから特徴点を抽出したときの画像上の範囲を、認識用画像データ上で任意に移動させたときの範囲を示す。この範囲は、図7に示すように、認識用画像データより小さいものとする。
類似度S1を計算するとき、距離参照テーブルを参照すれば、最近点までの距離計算が瞬時に行えるため、非常に高速に類似度を計算できる。
所定範囲を所定量ずらしながら最小となる類似度Sを求める処理(以下、最小類似度計算処理と称する)を高速化するために、次の手順を行う。
まず、類似度S1が最小となる位置を探索する。
次に、その類似度S1が最小となる位置における類似度S2を求めて類似度Sを算出する。なお、最小の類似度S1となる位置を探索するときに特定の位置の類似度を求めた場合、その特定の位置を起点とした距離pの範囲内は、類似度Sthreより小さくならないことが保証されるものとする。
従って、類似度Sthre(即ち、類似度閾値)を適切に設定することによって、この距離pより近い位置は全て類似度計算をスキップできる。
次に、画像の探索範囲と同じ大きさのテーブルを用意する。
前記テーブルは、2次元配列のフラグFLAG(x,y)であって、ON(例えば、値「1」)かOFF(例えば、値「0」)が設定される。
前記テーブルの初期状態は、全てのフラグFLAG(x,y)をOFFにしておき、式(4)で計算された範囲(即ち、距離p)のフラグFLAG(x,y)はONに切り替えるようにする。
また、該当するテーブル位置のフラグFLAG(x,y)が、ONに設定されている場合、類似度計算を行わないものとする。
そして、最終的に得られる最小の類似度S1の位置で類似度S2を計算し、両者を足し合わせて類似度Sを算出する。
以上の手順によって、最小類似度計算処理を高速化できる。
なお、最小類似度計算処理の手順は、後で詳述する。また、前記最小類似度計算処理において、最小の類似度S1の位置は必ずしも最小の類似度Sの位置と一致しないが、第1実施形態では、近似として最小の類似度S1の位置で求められた類似度Sを最小の類似度Sと見做すことにする。
類似度Sは、一つの登録物体に対し、撮像した画像の枚数分算出できる。そのため、一つの登録物体の類似度は、その撮像した画像中で最小の類似度を採用することにする。
そして、類似度Scの最も小さい登録物体cに関する特徴点をパターン識別の結果と見做し、さらに、登録物体cを識別物体cと見做す。
出力部18は、識別部17で決定された識別物体cに関する特徴点をパターン認識結果と見做し、そのパターン認識結果を表示装置(例えば、ディスプレイ装置)に出力する。あるいは、識別物体cに関連する情報へのURL(Uniform Resource Locator)にリンクづけされたHTML(HyperText Markup Language)ファイルを出力する部である。
第1実施形態における画像の登録過程,画像認識過程,最小類似度計算処理の手順を以下に説明する。なお、以下の説明で、図1及び図7中の符号と同じものの説明は省略する。
前記画像の登録過程を図2Aに基づいて以下に説明する。
まず、登録用画像データ入力部11によって、登録用画像データを入力する(S101)。
次に、特徴点抽出部12によって、前記登録用画像データから特徴点を抽出する(S102)。
そして、学習マップ記憶部13によって、抽出された特徴点の位置(即ち、学習マップ)を蓄積手段に全て蓄積する(S103)。
前記画像認識過程を図2Bに基づいて以下に説明する。
まず、認識用画像データ入力部14によって、認識用画像データを入力する(S104)。
次に、特徴点抽出部15によって、認識用画像データから特徴点を抽出する(S105)。
次に、距離参照テーブル作成部16によって、距離参照テーブルを作成する(S106)。
次に、識別物体番号(以後、クラスと称する)iを「1」に初期化する。(S1061)。
次に、識別部17によって、類似度を計算し、識別物体に関する特徴点を取得する(S107)。
次に、クラスiの類似度計算が完了しているか否かをチェックする(S108)。クラスiの類似度計算が完了している場合、ステップS1081へ進む。クラスiの類似度計算が完了していない場合、ステップS107へ戻る。
ステップS1081では、クラスiに「1」を加算する。
次に、全登録データの類似度計算が完了したか否かをチェックする(S109)。全登録データの類似度計算が完了した場合、ステップS110へ進む。全登録データの類似度計算が完了していない場合、ステップS107へ戻る。
そして、出力部18によって、画像認識結果を表示装置に出力する(S110)。
前記最小類似度計算処理の手順を図3に基づいて以下に詳細説明する。
まず、2次元の配列のフラグFLAG(x,y)(以下、単にFLAG(x,y)という)の全要素をOFFに設定し初期化する(S201)。
次に、x,yを「0」に設定する(S2011)。
次に、FLAG(x,y)の値をチェックする(S202)。FLAG(x,y)の値がOFFの場合、ステップS203に進む。FLAG(x,y)の値がONの場合、ステップS2051に進む。
ステップS203では、類似度S1が最小となる位置を探索し、類似度S1を求める。
次に、式(4)によって範囲pを計算する(S204)。
次に、前記範囲p内のFLAG(x,y)をONに設定する(S205)。
次に、xに「1」を加算する(S2051)。
次に、前記xが、画像の横幅(横画素数)以上が否かをチェックする(S206)。
前記xが画像の横幅以上の場合、ステップS2061へ進む。前記xが画像の横幅より小さい場合、ステップS202に戻る。
次に、yに「1」を加算する(S2061)。
次に、ステップS207では、前記yが、画像の縦幅(縦画素数)以上か否かをチェックする。
前記yが画像の縦幅以上の場合、ステップS208へ進む。前記yが画像の縦幅より小さい場合、ステップS202に戻る。
そして、最終的に得られる最小の類似度S1の位置で類似度S2を計算し、両者を足し合わせて類似度Sを算出する(S208)。
以上のように、第1実施形態は、登録用画像(即ち、パターン認識を行うためのパターン画像)データに撮像された物体に関する第1特徴点を、その登録用画像データから抽出し、その第1特徴点の位置情報を蓄積手段に蓄積する。また、認識用画像(即ち、物体が撮像された認識対象画像)データを入力し、その認識用画像データから第2特徴点を抽出し、その認識用画像データから距離参照テーブル(例えば、任意の位置,最も近い第2特徴点,任意の位置から最も近い第2特徴点までの距離を含むデータをテーブル)を作成する。その第1特徴点の位置の情報に基づいて最小の第1類似度を計算し、距離参照テーブルを用いて、最小の第2類似度を計算し、その第1類似度と第2類似度に基づいて第3類似度を算出し、前記物体に関して最も類似している特徴点を求める。そして、その最も類似している特徴点を認識結果と見做し、その認識結果を出力するものである。
[第2実施形態]
第2実施形態を図4乃至図6に基づいて以下に説明する。
なお、図4は、第2実施形態におけるパターン認識装置の構成図である。図5Aは、第2実施形態における登録用画像データの登録過程を示すフローチャートである。図5Bは、第2実施形態におけるパターン認識方法を示すフローチャートである。図6は、第2実施形態における最小の類似度を計算する処理(以下、単に、最小類似度計算処理という)の手順を示すフローチャートである。
図4中のパターン認識装置の構成と図1中のパターン認識装置の違いは、学習マップ記憶部23,相互学習マップ間距離テーブル作成・記憶部24,識別部28である。
学習マップ記憶部23は、抽出された特徴点の位置(即ち、学習マップ)を蓄積手段(例えば、メモリ,HDD(Hard Disk Drive)装置)に全て蓄積する。また、その学習マップを特定の方法で幾何的変形(あるいは、幾何的変換)し、その変形されて複数に増えた学習マップも蓄積する。例えば、対象が平面上に存在する記号等の場合は、アフィン変換や射影変換等を用いて新たな学習マップを追加できる。なお、前記学習マップは、一つの登録物体(即ち、登録用画像に撮像された3次元物体)に対し、撮像した画像の枚数分保存される。学習マップ記憶部23は、前記幾何的変形方法を選択する手段を備えていても良い。
相互学習マップ間距離テーブル作成・記憶部24は、学習マップ記憶部23に記憶された学習マップから相互学習間距離テーブルTを作成し記憶する。なお、作成した相互学習間距離テーブルTは、例えば、前記蓄積手段に蓄積(記憶)して良い。
相互学習間距離テーブルTは、次のように作成する。
対象が平面上に存在する記号等の場合、相互の学習マップ同士の距離を以下の式で計算できる。
ここで、2つの学習マップa,b間の距離をSm(a,b)、学習マップaにおけるk番目の特徴点の2次元位置座標ベクトルをxa,k、学習マップbにおけるk番目の特徴点の2次元位置座標ベクトルをxb,k、学習マップa及びbの特徴点の数をnとする。
この距離Sm(a,b)を全ての学習マップ間の組み合わせで求めたテーブルTを利用して、さらに識別処理を高速化できる。
なお、前記テーブルTには、全ての学習マップ間までの距離Sm(a,b)が格納される。
識別部28は、学習マップ記憶部13で蓄積した特徴点位置の情報を呼出し、距離参照テーブル作成部16で作成した距離参照テーブルと相互学習マップ間距離テーブル作成・記憶部24で作成した相互学習マップ間距離テーブルを利用して、物体に関する特徴点の識別を行う。
まず、上述のFLAG(x,y)と別にもう一つのテーブルFLAG2(z)を用意する。このテーブルは、FLAG(x,y)と同様に、ONまたはOFFが設定され、zは学習マップの通し番号に相当する。
初期状態として、全てのフラグFLAG2(z)をOFFにしておき、以下の式で計算された距離qa,bが正となる学習マップbのフラグFLAG2(b)は全てONにする。
ここで、学習マップaによる式4にて定義された距離pをpaとする(以下の式4’を参照)。min(pa)は、学習マップを用いて画像上の最小類似度S1を求めたときの距離Paである。Sm(a,b)は、予め作成された相互学習マップ間テーブルTから参照できる。
また、該当する学習マップのフラグFLAG2(z)がONに設定されている場合は、学習マップzの類似度計算を行わなくても良い。なぜなら、学習マップzを用いたときの類似度S1は、類似度Sthreより小さくならないことが保証されるからである。即ち、類似度S2を求める計算も行わなくて良い。
従って、学習マップzによる類似度計算Sを省略することによって、識別部28における処理を識別部17より高速化できる。
第2実施形態における登録用画像データの登録過程を図5Aに基づいて説明する。なお、図5Aで図2A中と同じステップ番号の説明は省略する。
ステップS102に続いて、学習マップ記憶部23を用いて、抽出された特徴点の位置(即ち、学習マップ)を蓄積手段に全て蓄積する。また、その学習マップを特定の方法で幾何的変形(あるいは、幾何的変換)し、変形し増えた学習マップも蓄積する。(S1031)。
そして、相互学習マップ間距離テーブル作成・記憶部24を用いて、学習マップ記憶部23に記憶された学習マップから相互学習間距離テーブルTを作成し記憶する(S1032)。
第2実施形態におけるパターン認識方法を図5Bに基づいて説明する。なお、図5Bで図2B中と同じステップ番号の説明は省略する。
ステップS1061に続いて、識別部28によって、類似度を計算し、識別物体に関する特徴点を取得する(S1071)。
第2実施形態における最小類似度計算処理の手順を図6に基づいて説明する。なお、図6で図3と同じステップ番号の説明は省略する。
まず、配列のフラグFLAG2(z)(以下、単にFLAG2(z)という)の全要素をOFFに設定し、その後、式6で計算された距離qa,bが正となる学習マップbのフラグFLAG2(b)を全てONに設定する(S301)。
次に、zを「0」に設定する(S302)。
次に、FLAG2(z)の値をチェックする(S303)。FLAG2(z)の値がOFFの場合、ステップS201〜S208の処理を行う。FLAG2(z)の値がONの場合、ステップS304に進む。
ステップS304では、zに「1」を加算する。
そして、前記zが所定の学習マップ数以上か否かをチェックする(S305)。前記zが所定の学習マップ数以上の場合、当該処理を終了する。前記zが所定の学習マップ数より小さい場合、ステップS303に戻る。
第1及び第2実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のCPU(Central Processing Unit)(MPU(Microprocessing Unit))が記憶媒体に格納されたプログラムコードを読み出し実行することによっても、実現できる。
その場合、記憶媒体から読み出されたプログラムコード自体が上述した第1及び第2実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体、例えば、CD−ROM(Compact Disk Read Only Memory)、DVD−ROM(Digital Versatile Disk Read Only Memory)、CD−R(Compact Disk Recordable)、CD−RW(Compact Disk ReWritable)、MO(Magneto−Optical disk)、HDD等は、第1及び第2実施形態を構成する。
以上のように、第2実施形態においては、対象が平面上に存在する記号等の場合に、2つの学習マップ間で、特徴量の数が変わらず、1対1に対応付けられているため、式4’が適応できる。そのため、対象が平面上に存在する記号等の場合に、物体に関する特徴点を高速に識別できる。
また、第1及び第2実施形態によれば、3次元物体をさまざまな方向から予め撮影した画像から特徴点を自動抽出した学習マップを蓄積し、認識用画像から抽出した特徴点に該当する学習マップが含まれているか否かを探索処理できる。
さらに、前記探索処理は高速化が可能であり、結果として、特徴点照合による物体認識を高速に実行できる。
以上、本発明において、記載された具体例に対してのみ詳細に説明したが、本発明の技術思想の範囲で多彩な変形および修正が可能であることは、当業者にとって明白なことであり、このような変形および修正が特許請求の範囲に属することは当然のことである。
例えば、第1及び第2実施形態の変形例としては、登録用画像データに関する特徴抽出と認識用画像データに関する特徴抽出を1つの特徴抽出部で行っても良い。
第1実施形態におけるパターン認識装置の構成図。 第1実施形態における登録用画像データの登録過程(A)及びパターン認識方法(B)を示すフローチャート。 第1実施形態における最小類似度計算処理の手順を示すフローチャート。 第2実施形態におけるパターン認識装置の構成図。 第2実施形態における登録用画像データの登録過程(A)及びパターン認識方法(B)を示すフローチャート。 第2実施形態における最小類似度計算処理の手順を示すフローチャート。 基本的なパターン認識の原理説明図。
符号の説明
1…2次元マップ
2…入力画像
3…特徴点
4…学習マップと入力画像の一部分であって、学習マップに最も類似している位置
11…登録用画像データ入力部
12…特徴点抽出部
13…学習マップ記憶部
14…認識用画像データ入力部
15…特徴点抽出部
16…距離参照テーブル作成部
17…識別部
18…出力部
23…学習マップ記憶部
24…相互学習マップ間距離テーブル作成・記憶部
28…識別部

Claims (9)

  1. 画像データに含まれる物体を識別するパターン認識装置であって、
    画像取得手段から取得した画像データを登録用画像データと見做し、該登録用画像データを入力する登録用画像データ入力手段と、
    その登録用画像データに撮像された物体に関する第1特徴点を、その登録用画像データから抽出する第1特徴点抽出手段と、
    その第1特徴点の位置情報を蓄積手段に蓄積する学習マップ記憶手段と、
    画像データを認識用画像データと見做し、該認識用画像データを入力する認識用画像データ入力手段と、
    その認識用画像データから第2特徴点を抽出する第2特徴点抽出手段と、
    前記認識用画像データ上の任意位置から最も近い第2特徴点までの距離を計算し、該任意位置,最も近い第2特徴点,任意位置から最も近い第2特徴点までの距離を含むデータをテーブル化する距離参照テーブル作成手段と、
    前記学習マップ記憶手段で蓄積された第1特徴点の位置の情報を呼び出し、その第1特徴点の位置の情報に基づいて最小の第1類似度を計算し、その距離参照テーブル作成手段で作成された距離参照テーブルを用いて、最小の第2類似度を計算し、その第1類似度と第2類似度に基づいて第3類似度を算出し、その第3類似度に基づいて、前記物体に関して最も類似している特徴点を求める識別手段と、
    その最も類似している特徴点を認識結果と見做し、その認識結果を出力する出力手段と、
    を有することを特徴とするパターン認識装置。
  2. 前記距離参照テーブル作成手段において、
    前記第2特徴点に基づいてボロノイ図を作成し、
    前記認識用画像データ上の任意位置から最も近い第2特徴点までの距離を該ボロノイ図を用いて計算する、
    ことを特徴とする請求項1に記載のパターン認識装置。
  3. 前記識別手段において、
    前記認識用画像データ上の任意位置から最も近い第2特徴点までの距離が、登録用画像データから抽出された第1特徴点の総数n,第2類似度S1,類似度閾値Sthreに基づいた以下の式で表される距離pより短くなる場合、その第2類似度S1に関する第3類似度の計算をスキップしつつ、第2類似度S1が最小となる位置を探索し、
    その第2類似度S1が最小となる位置における第1類似度を求める、
    ことを特徴とする請求項1または2に記載のパターン認識装置。
  4. 前記学習マップ記憶手段が、さらに、該第1特徴点の位置情報を任意の幾何的変形に基づいて変形し、その変形された複数の第1特徴点の位置情報も、前記蓄積手段に蓄積し、
    学習マップa及びb間の距離を以下の式[2]で計算される学習マップ間距離Sm(a,b)と見做し、全ての学習マップ間の組合せを計算して相互学習マップ間テーブルを作成する相互学習マップ間テーブル作成手段を備え、
    前記識別手段が、学習マップaから抽出された第1特徴点の総数n,第2類似度S1,類似度閾値Sthreに基づいた以下の式[3]で表される距離paを計算し、その計算された距離paに基づいた以下の式[4]で計算して距離値qa,bを求め、その距離値qa,bが正になる場合に、
    前記学習マップbを用いた前記第2類似度が最小となる位置の探索を省略し、更に、前記第3類似度を算出する計算も省略する、
    ことを特徴とする請求項1乃至3のいずれかに記載のパターン認識装置。
  5. 画像データに含まれる物体を識別するパターン認識方法であって、
    画像取得手段から取得した画像データを登録用画像データと見做し、該登録用画像データを入力する登録用画像データ入力ステップと、
    その登録用画像データに撮像された物体に関する第1特徴点を、その登録用画像データから抽出する第1特徴点抽出ステップと、
    その第1特徴点の位置情報を蓄積手段に蓄積する学習マップ記憶ステップと、
    画像データを認識用画像データと見做し、該認識用画像データを入力する認識用画像データ入力ステップと、
    その認識用画像データから第2特徴点を抽出する第2特徴点抽出ステップと、
    前記認識用画像データ上の任意位置から最も近い第2特徴点までの距離を計算し、該任意位置,最も近い第2特徴点,任意位置から最も近い第2特徴点までの距離を含むデータをテーブル化する距離参照テーブル作成ステップと、
    前記学習マップ記憶ステップで蓄積された第1特徴点の位置の情報を呼び出し、その第1特徴点の位置の情報に基づいて最小の第1類似度を計算し、その距離参照テーブル作成ステップで作成された距離参照テーブルを用いて、最小の第2類似度を計算し、その第1類似度と第2類似度に基づいて第3類似度を算出し、その第3類似度に基づいて、前記物体に関して最も類似している特徴点を求める識別ステップと、
    その最も類似している特徴点を認識結果と見做し、その認識結果を出力する出力ステップと、
    を含むことを特徴とするパターン認識方法。
  6. 前記距離参照テーブル作成ステップにおいて、
    前記第2特徴点に基づいてボロノイ図を作成し、
    前記認識用画像データ上の任意位置から最も近い第2特徴点までの距離を該ボロノイ図を用いて計算する、
    ことを特徴とする請求項5に記載のパターン認識方法。
  7. 前記識別ステップにおいて、
    前記認識用画像データ上の任意位置から最も近い第2特徴点までの距離が、登録用画像データから抽出された第1特徴点の総数n,第2類似度S1,類似度閾値Sthreに基づいた以下の式で表される距離pより短くなる場合、その第2類似度S1に関する第3類似度の計算をスキップしつつ、第2類似度S1が最小となる位置を探索し、
    その第2類似度S1が最小となる位置における第1類似度を求める、
    ことを特徴とする請求項5または6に記載のパターン認識方法。
  8. 前記学習マップ記憶ステップが、さらに、該第1特徴点の位置情報を任意の幾何的変形に基づいて変形し、その変形された複数の第1特徴点の位置情報も、前記蓄積手段に蓄積し、
    学習マップa及びb間の距離を以下の式[2]で計算される学習マップ間距離Sm(a,b)と見做し、全ての学習マップ間の組合せを計算して相互学習マップ間テーブルを作成する相互学習マップ間テーブル作成ステップを備え、
    前記識別ステップが、学習マップaから抽出された第1特徴点の総数n,第2類似度S1,類似度閾値Sthreに基づいた以下の式[3]で表される距離paを計算し、その計算された距離paに基づいた以下の式[4]で計算して距離値qa,bを求め、その距離値qa,bが正になる場合に、
    前記学習マップbを用いた前記第2類似度が最小となる位置の探索を省略し、更に、前記第3類似度を算出する計算も省略する、
    ことを特徴とする請求項5乃至7のいずれかに記載のパターン認識方法。
  9. 請求項5乃至8のいずれかに記載のパターン認識方法を、コンピュータで実行可能なコンピュータプログラムとして記述し、そのコンピュータプログラムを記録したことを特徴とする記録媒体。
JP2006185065A 2006-04-04 2006-07-05 パターン認識装置,パターン認識方法及びその方法を実現したプログラムを格納した記録媒体 Expired - Fee Related JP4348353B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006185065A JP4348353B2 (ja) 2006-04-04 2006-07-05 パターン認識装置,パターン認識方法及びその方法を実現したプログラムを格納した記録媒体

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2006102967 2006-04-04
JP2006185065A JP4348353B2 (ja) 2006-04-04 2006-07-05 パターン認識装置,パターン認識方法及びその方法を実現したプログラムを格納した記録媒体

Publications (2)

Publication Number Publication Date
JP2007299364A JP2007299364A (ja) 2007-11-15
JP4348353B2 true JP4348353B2 (ja) 2009-10-21

Family

ID=38768781

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006185065A Expired - Fee Related JP4348353B2 (ja) 2006-04-04 2006-07-05 パターン認識装置,パターン認識方法及びその方法を実現したプログラムを格納した記録媒体

Country Status (1)

Country Link
JP (1) JP4348353B2 (ja)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8286171B2 (en) 2008-07-21 2012-10-09 Workshare Technology, Inc. Methods and systems to fingerprint textual information using word runs
US8555080B2 (en) 2008-09-11 2013-10-08 Workshare Technology, Inc. Methods and systems for protect agents using distributed lightweight fingerprints
US9092636B2 (en) 2008-11-18 2015-07-28 Workshare Technology, Inc. Methods and systems for exact data match filtering
US8406456B2 (en) 2008-11-20 2013-03-26 Workshare Technology, Inc. Methods and systems for image fingerprinting
US8473847B2 (en) 2009-07-27 2013-06-25 Workshare Technology, Inc. Methods and systems for comparing presentation slide decks
US11030163B2 (en) 2011-11-29 2021-06-08 Workshare, Ltd. System for tracking and displaying changes in a set of related electronic documents
US20120136862A1 (en) 2010-11-29 2012-05-31 Workshare Technology, Inc. System and method for presenting comparisons of electronic documents
US10783326B2 (en) 2013-03-14 2020-09-22 Workshare, Ltd. System for tracking changes in a collaborative document editing environment
US9948676B2 (en) 2013-07-25 2018-04-17 Workshare, Ltd. System and method for securing documents prior to transmission
US9170990B2 (en) 2013-03-14 2015-10-27 Workshare Limited Method and system for document retrieval with selective document comparison
US10963584B2 (en) 2011-06-08 2021-03-30 Workshare Ltd. Method and system for collaborative editing of a remotely stored document
US9613340B2 (en) 2011-06-14 2017-04-04 Workshare Ltd. Method and system for shared document approval
US10911492B2 (en) 2013-07-25 2021-02-02 Workshare Ltd. System and method for securing documents prior to transmission
KR102120864B1 (ko) * 2013-11-06 2020-06-10 삼성전자주식회사 영상 처리 방법 및 장치
US11182551B2 (en) 2014-12-29 2021-11-23 Workshare Ltd. System and method for determining document version geneology
US11763013B2 (en) 2015-08-07 2023-09-19 Workshare, Ltd. Transaction document management system and method

Also Published As

Publication number Publication date
JP2007299364A (ja) 2007-11-15

Similar Documents

Publication Publication Date Title
JP4348353B2 (ja) パターン認識装置,パターン認識方法及びその方法を実現したプログラムを格納した記録媒体
JP5183392B2 (ja) 画像処理装置、画像処理方法およびプログラム
US8126206B2 (en) Image processing apparatus, image processing method, and program
CN110648397B (zh) 场景地图生成方法、装置、存储介质及电子设备
JP6597914B2 (ja) 画像処理装置、画像処理方法、及びプログラム
JP5210241B2 (ja) 画像検索装置及びその制御方法並びにプログラム
JP5656768B2 (ja) 画像特徴量抽出装置およびそのプログラム
KR20120023052A (ko) 3 차원에 있어서의 형상의 일치를 판정하는 방법 및 장치
JP2014102810A (ja) 被写体認識装置、被写体認識方法および被写体認識プログラム
KR20190124436A (ko) 영상 기반 건물 검색 방법 및 장치
JP5192437B2 (ja) 物体領域検出装置、物体領域検出方法および物体領域検出プログラム
WO2012133371A1 (ja) 撮像位置および撮像方向推定装置、撮像装置、撮像位置および撮像方向推定方法ならびにプログラム
CN111149101A (zh) 一种目标图案查找方法及计算机可读存储介质
JP4570995B2 (ja) マッチング方法およびマッチング装置ならびにプログラム
JP2020052977A (ja) 情報処理装置、情報処理方法、およびプログラム
JP5310402B2 (ja) 画像変換パラメータ算出装置、画像変換パラメータ算出方法およびプログラム
JP2018180646A (ja) 物体候補領域推定装置、物体候補領域推定方法、及び物体候補領域推定プログラム
JPH10111946A (ja) 画像追跡装置
CN113298871B (zh) 地图生成方法、定位方法及其系统、计算机可读存储介质
CN115222789A (zh) 实例深度估计模型的训练方法、装置及设备
JP7370759B2 (ja) 画像処理装置、画像処理方法およびプログラム
JP2018194366A (ja) 位置推定装置、方法、及びプログラム
JP2011170554A (ja) 物体認識装置、物体認識方法及び物体認識プログラム
JP2018124740A (ja) 画像検索システム、画像検索方法及び画像検索プログラム
KR101373397B1 (ko) 증강현실의 호모그래피 정확도 향상을 위한 csp 기반의 ransac 샘플링 방법

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20090605

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090706

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090714

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090717

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120724

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130724

Year of fee payment: 4

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees