JP2015026093A - 画像処理装置及びそのプログラム - Google Patents

画像処理装置及びそのプログラム Download PDF

Info

Publication number
JP2015026093A
JP2015026093A JP2013112323A JP2013112323A JP2015026093A JP 2015026093 A JP2015026093 A JP 2015026093A JP 2013112323 A JP2013112323 A JP 2013112323A JP 2013112323 A JP2013112323 A JP 2013112323A JP 2015026093 A JP2015026093 A JP 2015026093A
Authority
JP
Japan
Prior art keywords
image
feature point
feature vector
processing apparatus
local
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013112323A
Other languages
English (en)
Other versions
JP5500404B1 (ja
Inventor
林 建一
Kenichi Hayashi
建一 林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qoncept Inc
Original Assignee
Qoncept Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qoncept Inc filed Critical Qoncept Inc
Priority to JP2013112323A priority Critical patent/JP5500404B1/ja
Priority to JP2014552105A priority patent/JP6332865B2/ja
Priority to PCT/JP2013/083531 priority patent/WO2014092193A1/ja
Application granted granted Critical
Publication of JP5500404B1 publication Critical patent/JP5500404B1/ja
Publication of JP2015026093A publication Critical patent/JP2015026093A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)

Abstract

【課題】スケール不変性及び回転不変性を持つ局所特徴ベクトルを、より低い計算コストで求められるようにする。【解決手段】第1特徴点から距離が小さい順の4個の特徴点を第2特徴点とし、第1特徴点と、第2特徴点のそれぞれとのペア特徴点を選択し(S1)、特徴点間距離Lを算出し、第1、第2特徴点を中心とする距離Lに比例した半径の第1、第2サンプリング円を決定し(S3)、各円周上の16個の画素のそれぞれを中心とする矩形画素領域のそれぞれの平均輝度I(Pi)、I(Qi)、i=0〜fを、直線Lの方向を基準として順にサンプリングし、これらのそれぞれと、第1、第2特徴点を中心とする矩形画素領域の平均輝度との差を、局所特徴ベクトルの成分としてこの順に並べる(S4)。【選択図】図2

Description

本発明は、輝度画像上の自然特徴点を中心とする局所領域のスケール不変性かつ回転不変性特徴ベクトルを求める機能を備えた画像処理装置及びそのプログラムに関する。
カメラを備えたスマートフォンの性能向上とFAST(Features from Accelerated Segment Test)コーナ検出法などの画像処理技術の向上に伴い、マーカレスAR(Augmented Reality:拡張現実)をスマートフォンで実現可能になった。
FASTコーナ検出法によれば、1画像内の自然特徴点を多数、高速に検出することができる。これら特徴点を、予め求めた参照データ内の特徴点とマッチングすることにより、3次元座標をカメラ画像の2次元座標に投影するカメラパラメータを推定することができ、このパラメータに基づき、3Dモデルをカメラ画像に投影した(カメラ画像にCG画像を重畳した)AR画像を生成することができる。このマッチングを行うために、各特徴点を中心とする局所特徴ベクトルを記述する必要がある。
下記特許文献1には、スケール不変性及び回転不変性を有する局所特徴ベクトルを、コントラストによらずに算出することができる局所特徴ベクトル算出方法が開示されている。
また、下記非特許文献1には、そこでのテストの結果、下記非特許文献2のBRIEF(Binary Robust Independent Elementary Features)という手法が最速であると記載されている。
特開2012−38290号公報
特徴記述子比較レポート:http://computer-vision-talks.com/2011/08/feature-descriptor-comparison-report/ BRIEF:http://cvlab.epfl.ch/~lepetit/papers/calonder_pami11.pdf ランダムフォレスト:http://link.springer.com/article/10.1023%2FA%3A1010933404324?LI=true
しかしながら、スケール不変性及び回転不変性を有する局所特徴ベクトルを求める処理は、計算コストが比較的大きく、特に、スケール不変性を持たせるためには複数の画像スケールのそれぞれで画像処理を行う必要があるので、計算コストが増大する原因となる。
より具体的には、特許文献1では、特徴点を中心とするp個の円の円周上の画素データを検出する同心円検出部と、各画素データにおける画素値の勾配の角度と支配的勾配との差分値に円の半径の平方根を乗じた重み付き差分値をそれぞれ算出する重み付き差分値算出部と、重み付き差分値についてのq個の階級を有する度数分布を作成する度数分布作成
部と、各円についての各度数を成分とするq次元のベクトルから、p×q次元の記述子ベクトルを算出する記述子ベクトル算出部とを設ける必要があるので、SIFT(Scale Invariant Feature Transform)や、これよりも高速なSURFよりも計算コストを低減できるものの、計算コストが比較的大きくなる。
また、非特許文献2のBRIEFでは、特徴点を中心とする円内の2画素の輝度差を2値化したものを局所特徴ベクトルの成分とするので、局所特徴ベクトルの次元数とビット長とが等しくなって省メモリにはなるものの、高速化の点では、次の理由により、充分とは言えない。すなわち、例えば128次元の局所特徴ベクトルを生成する場合、BRIEFでは局所特徴ベクトルを128ビットで表現できるものの、例えば640x480画素の画像中の該円内のランダムな128回の画素サンプリングが必要になり、キャッシング回数が増え、重い処理となるからである。また、BRIEFは回転不変性を有しない。さらに、上記2値化により、接近した局所特徴ベクトル間の区別が困難になるので、カメラ画像から取得した局所特徴ベクトルと参照局所特徴ベクトルとのマッチングの精度及び安定性、すなわち特徴点識別性が低下する。
さらに、例えば文字や記号などの画像に関する情報をデータベースで検索する場合、従来法では特徴点間の局所特徴ベクトルによる識別性が比較的低いので、画像認識率が低くなる。
本発明の目的は、このような問題点に鑑み、スケール不変性及び回転不変性を持つ局所特徴ベクトルを、より低い計算コストで求める構成を備えた画像処理装置及びそのプログラムを提供することにある。
本発明の他の目的は、画像から生成した局所特徴ベクトルの識別性をより向上させる構成を備えた画像処理装置及びそのプログラムを提供することにある。
本発明の第1態様では、プロセッサと、データ及びプログラムが格納される記憶装置とを備え、該データは濃淡画像を含み、該プログラムは該プロセッサに対し該データに含まれる複数の局所特徴量を生成させる特徴ベクトル生成プログラムを含む画像処理装置において、
該特徴ベクトル生成プログラムは該プロセッサに対し、
(a)該濃淡画像に対しコーナポイントである特徴点の座標を検出させ、
(b)検出された各特徴点である第1特徴点から近い順の所定数の第2特徴点のそれぞれと該第1特徴点とのペア特徴点を選択させ、
(c)各ペア特徴点について、該第1特徴点と該第2特徴点との間の距離Lを求めさせ、
(d)該第1特徴点を中心とし該距離Lに比例した第1半径の円周上の画素のうち等画素間隔のn個(n≧4)の画素のそれぞれを含む画素領域Pi、i=0〜n−1の平均第1輝度I(Pi)を、該距離Lの線方向を基準として所定順にサンプリングさせ、それぞれと該第1特徴点を含む画素領域の輝度との差と、
該第2特徴点を中心とし該距離Lに比例した第2半径の円周上の画素のうち等画素間隔のm個(m≧4)の画素のそれぞれを含む画素領域Qi、i=0〜m−1の平均第2輝度I(Qj)を、該距離Lの線方向を基準として所定順にサンプリングさせ、それぞれと該第2特徴点を含む画素領域の輝度との差と、
を成分とする、正規化された局所特徴ベクトルを求めさせ、
該画素領域の画素数の平方根は該距離Lに略比例している。
ここに、濃淡画像は、例えばグレースケール画像又はカラー画像の単色成分画像であり
、RGB画像のR,G,Bチャネルの1つ以上のチャンネルのそれぞれの濃淡画像であってもよい。コーナポイントは、例えばFASTコーナ検出法又はHarrisオペレータを用いたコーナ検出法により検出される。平均輝度は累積加算輝度を含む概念である。また、局所特徴ベクトルの表現は、上記距離Lの線方向に関し成分が所定順に配置されておればよく、前者の輝度差成分と後者の輝度差成分を交互に配置したものなどであってもよい。
本発明による画像処理装置の第2態様では、第1態様において、m及びnはいずれも8、16又は32である。
上記第1態様の構成によれば、上記のようにペア特徴点を選択し局所特徴ベクトルを求めるので、スケール不変性及び回転不変性を持つ局所特徴ベクトルを、従来より低い計算コストで求めることができるという効果を奏する。
また、画像の特徴点間に基づく局所特徴ベクトルを生成するので、文字や記号などのフレーム画像であっても、局所特徴ベクトルの識別性が向上し、結果としてフレーム画像の識別性等を向上させることが可能となるという効果を奏する。
上記第2態様の構成によれば、m及びnはいずれも2の冪乗であるので、実施例2で述べるように、局所特徴ベクトルをより高速に求めることができるという効果を奏する。
本発明の他の目的、特徴的な構成及び効果は、以下の説明を特許請求の範囲及び図面の記載と関係づけて読むことにより明らかになる。
本発明の実施例1に係る画像処理装置10のハードウェア構成を示す概略ブロック図である。 1フレーム画像内の局所特徴ベクトルを生成する処理手順を示すフローチャートである。 (A)は、文字画像と、その上に各特徴点に関するペア特徴点の特徴点間を直線で連結したものとを示す図であり、(B)は(A)の一部を拡大したペア特徴点説明図である。 図2のステップS3の処理説明図であって、図3(A)中の一部を拡大した局所特徴ベクトル生成処理説明図である。 図2のステップS4の処理説明図である。 (A)〜(D)は何れも、第1特徴点を共通にする特徴点ペアを点で示す局所領域画像であり、(E)〜(H)はそれぞれ(A)〜(D)の特徴点ペアに関する局所特徴ベクトルの棒グラフによる成分表示図である。 実施例2に係る画像処理装置の概略機能ブロック図である。 図7中の主処理部40で実行されるメインルーチンの概略フローチャートである。 図7中のマッチング処理部46での、局所特徴ベクトル記憶部M3内の1つの局所特徴ベクトルVに対するクラスID推定処理を示す概略フローチャートである。 (A)は、クラスID及びフレーム画像IDでラベルされた同一ペア特徴点に関する局所特徴ベクトルの説明図であり、(B)は、参照データ内の局所特徴ベクトルの全集合からランダムに抽出した部分集合毎のツリーからなるランダムフォレストの識別器をその入出力と対応付けて示す説明図である。 白鳥の写真と「Swan」の文字列とを含む印刷物の撮影画像に対し図7の処理を行いその途中結果を可視化したものを含む図であって、該画像と該画像から抽出された特徴点ペアと、各ペアの特徴点間を接続した直線とを示す図である。 白鳥の写真と「Swan」の文字列とを含む印刷物の撮影画像に対し図7の処理を行いその途中結果を可視化したものを含む図であって、該画像を縮小し回転した参照画上の特徴点と認識対象である図11中の画像上の特徴点とをマッチング部でマッチングさせ、マッチングした特徴点間を直線で接続した図である。 白鳥の写真と「Swan」の文字列とを含む印刷物の撮影画像に対し図7の処理を行いその途中結果を可視化したものを含む図であって、該画像を縮小し回転し射影変換した参照画上の特徴点と認識対象である図11中の画像上の特徴点とをマッチング部でマッチングさせ、マッチングした特徴点間を直線で接続した図である。 白鳥の写真と「Swan」の文字列とを含む印刷物の撮影画像に対し図7の処理を行いその途中結果を可視化したものを含む図であって、該画像を回転し図12の場合よりも縮小した参照画上の特徴点と認識対象である図11中の画像上の特徴点とをマッチング部でマッチングさせ、マッチングした特徴点間を直線で接続した図である。
図1は、本発明の実施例1に係る画像処理装置10のハードウェア構成を示す概略ブロック図であって、この実施例1で必要な構成要素のみを示す。画像処理装置10は例えば、カメラを備えたスマートフォンやPDA等の携帯端末装置、ノートパソコン又はデスクトップパソコンなどである。
画像処理装置10は、その本体部20において、プロセッサ21がバス22を介して記憶装置23、入力インターフェイス24、カメラインターフェイス25及びディスプレインターフェイス26に結合されている。プロセッサ21は、内部キャッシュメモリを備えている。入力インターフェイス24には入力装置30が結合され、カメラインターフェイス25にはカメラ31が結合され、ディスプレインターフェイス26には出力装置としての表示装置32が結合され、他の出力装置としての通信部27にはアンテナ33が結合されている。
入力装置30は、対話型入力装置であって、タッチパネル、ポインティングデバイス若しくはキーボード又はこれらの組み合わせで構成されている。通信部27は、電波を介して外部モニタ又はインターネットと結合するためのインターフェイスを備えている。
記憶装置23にはプログラム及びデータが格納され、このプログラムは、プロセッサ21に対し、入力装置30から入力インターフェイス24を介したユーザの指示又は設定値の選択若しくは入力を受け付け、この入力に応じて、アプリケーションを起動させ、カメラ31で被写体、例えば、図書館の本の表紙又は看板を撮像させてそのフレーム画像(静止画)を記憶装置23内に格納させ、このフレーム画像から複数の局所特徴ベクトルを生成し、これらと記憶装置23内の参照データとに基づいて、このフレーム画像を識別し、このフレーム画像に関する情報、例えば、該図書館に蔵書されている関連する本の情報又は看板に関する詳細情報を記憶装置23から読み出してディスプレインターフェイス26を介し表示装置32に表示させる。或いは、カメラ31で店内又は通販カタログの商品を撮像させ、同様にして、この商品に関する情報を表示装置32に表示させる。
本実施例1の特徴は、図2に示す、1フレーム画像内の局所特徴ベクトルを生成する処理である。以下、括弧内は図中のステップ識別符号を示す。
(S0)1フレーム画像内で注目画素をラスタースキャンしながら特徴点をFASTコーナ検出法により検出する。
このFASTコーナ検出法は、注目画素を中心とし、正の閾値をthとし、例えば半径
3画素の円周上における16個の画素の輝度値を、(注目画素の輝度値)−thより小さければ暗い、(注目画素の輝度値)+thより大きければ明るい、これらの間の値であれば類似と3値化し、連続して例えば9画素以上が明るい又は暗いと判定された場合に、注目画素がコーナの特徴点であると判定するものである。
(S1)以下、ステップS0で検出した各特徴点(注目特徴点)について、S5迄の処理を行う。
(S2)注目特徴点(第1特徴点)について、この特徴点から距離が小さい順の所定数nの特徴点を第2特徴点とし、第1特徴点と、第2特徴点のそれぞれとのn組のペア特徴点を選択する。nは、n≧1であって、各第1特徴点について共通の値である。
図3(A)は、各特徴点について、n=4とし、第1特徴点とそれぞれの第2特徴点との間を直線で連結(ペアを連結)したものである。図4は、図3中の一部拡大説明図である。
このステップS2で求めた各ペア特徴点についてステップS3及びステップS4の処理を行う。
(S3)ペア特徴点の特徴点間距離Lを算出し、例えば図4に示すように第1特徴点350と第2特徴点351との間の距離Lを算出し、第1特徴点350を中心とする距離Lに比例した半径の第1サンプリング円352、及び、第2特徴点351を中心とする距離Lに比例した半径の第2サンプリング円353を決定する。
図4での比例定数は、1であり、各特徴点について共通である。第1サンプリング円352と第2サンプリング円353の半径に関する該比例定数は、互いに異なるものを用いてもよい。
図5は、図4と異なる第1特徴点36、第2特徴点37及び該比例定数が上記と異なる第1サンプリング円C1及び第2サンプリング円C2を示している。
(S4)第1サンプリング円C1上の画素のうち、等画素間隔のN個(N≧4)、例えば16個の画素のそれぞれを中心とする矩形画素領域P0〜P9、Pa〜Pfのそれぞれの平均輝度I(Pi)、i=0〜fを、第1特徴点36から第2特徴点37へ向かう方向ベクトル(又は直線Lの方向)を基準として所定順、例えばこの方向ベクトルを基準として反時計回りの方向にサンプリング、図5では平均輝度I(P1),I(P2)、・・・、I(Pf)、I(P0)をこの順にサンプリングし、これらのそれぞれと、第1特徴点36を中心とする矩形画素領域(ハッチングで示す領域)の平均輝度I1との差を、この順に並べ、同様に、第2特徴点37から第1特徴点36へ向かう方向ベクトル(又は直線Lの方向)を基準として所定順、例えばこの方向ベクトルを基準として反時計回りの方向にサンプリング、図5では平均輝度I(Q9),I(Qa)、・・・、I(Qf)、I(Q0)、・・・、I(Q8)をこの順にサンプリングし、これらのそれぞれと、第2特徴点37を中心とする矩形画素領域(ハッチングで示す領域)の平均輝度I2との差を、この順に並べ、かつ、正規化したものを、ペア特徴点の36に関する局所特徴ベクトルとして求める。すなわち、この局所特徴ベクトルVを、
V=α(I(P1)−I1,I(P2)−I1,・・・,I(Pf)−I1、I(P0)−I1,I(Q9),I(Qa)−I2,・・・,I(Qf),I(Q0),・・・,I(Q8))
として求める。αは、特徴ベクトルVのノルムの値を、例えば符号付8ビット整数の最大値である127(ノルムの平方が16129)に正規化するための係数である。また、各
成分の符号は、上記と逆であっても、また、第2サンプリング円C2に関してのみ上記と逆であってもよい。
上記各矩形画素領域は、正方形領域であって、その一辺の長さが距離Lに略比例している。ここに略比例とは、量子化誤差が含まれることを意味している。
1フレーム内の全特徴点のそれぞれについて、ステップS1〜S5の処理を行うので、上記第2特徴点37と第1特徴点とを互いに入れ替えたものの局所特徴ベクトルも算出することになる。
このようにして求めた局所特徴ベクトルは、カメラ31の光軸及び位置を一定にし、光軸の回りにカメラ31を回転させても不変であり、かつ、この光軸方向へカメラ31をスライドさせても不変である。すなわち、この局所特徴ベクトルは、スケール不変性及び回転不変性を持っている。
図6(A)〜(D)は何れも、第1特徴点を共通にする互いに異なる特徴点ペアを点で示す局所領域画像であり、(E)〜(H)はそれぞれ(A)〜(D)の特徴点ペアに関する局所特徴ベクトルの棒グラフによる成分表示図である。
上記の正規化前の局所特徴ベクトルVの第k成分をV[k]、輝度I(Pi)をR[i]、第1特徴点36の輝度をI1、計算開始位置の輝度配列要素をR[o](図5の場合、o=1)とし、16進数の前に0xを付加して表記すると、C言語の場合、ベクトルVの第1サンプリング円C1に関する成分を次のような簡単なループ処理で計算することができる。
for (i=0; i<16; i++) { V[i] = S[(i+o)&0x1f] − I1 };
ここに、&は論理積演算子である。一般に、剰余(mode)演算子を%、とすると、nが2の冪乗である場合、i=(j+o)%nはi=(j+o)&(n−1)で計算できるので、上記ループ処理のように、iの値を決定するためi=nであるか否かでジャンプする余分な条件ジャンプ命令を用いずに論理積演算子&を用いてインデックスiを高速計算できる。
ベクトルVの第2サンプリング円C2に関する成分についても上記と同様である。
局所特徴ベクトルVは、各成分が輝度値の差であるので、照明の変化に影響されにくい。また、局所特徴ベクトルVのノルムが正規化されているので、さらに照明の変化に影響されにくい。さらに、局所特徴ベクトルVの各成分が画素領域の平均輝度値(後でベクトルVが正規化されるので、これは累積加算値でよい)を用いたものであるので、局所特徴ベクトルVのSN比を比較的大きくすることができる。
上記のような正規化された局所特徴ベクトルVは、以下のような実施例2で用いられる。
図7は、実施例1の方法を用いた実施例2に係る画像処理装置の概略機能ブロック図である。この画像処理装置のハードウェア構成は、実施例1の図1に示すものと同一である。
図7中、角丸矩形のブロックMi及びバッファ領域M0〜M5は、図1の記憶装置23内のデータ領域の一部である。
主処理部40は、フレーム画像及びその輝度画像を画像処理するメインルーチンである。図8は、この主処理部40による処理を示す概略フローチャートであり、ステップS4i、S41、S43、S45〜S48でそれぞれ図7中のブロック4i、41、43、45〜48をサブルーチンとして呼び出して処理する。
図7において、画像入力部4i、バッファ領域Mi、グレースケール化部41、バッファ領域M0、特徴点検出部43、2次元座標記憶部M1及び局所特徴ベクトル生成部45は、実施例1においても用いられる。すなわち、画像入力部4iは、オペレーティングシステムを介しカメラ31から、シャッターオン時のカラーフレーム画像G0(例えば640x480画素)を取得してバッファ領域Miに格納する。また、グレースケール化部41は、バッファ領域Mi内のフレーム画像G0を、グレースケール化して8ビット1チャンネルの輝度画像(フレーム画像)G1に変換しながら、これをバッファ領域M0に格納する。特徴点検出部43は、図2のステップS0と同じ処理を行って、各特徴点の2次元座標を取得し、2次元座標記憶部M1に格納する。局所特徴ベクトル生成部45は、2次元座標記憶部M1内の各特徴点に対し図2のステップS1〜S5の処理を行って局所特徴ベクトルを生成し、局所特徴ベクトル記憶部M3に追加する。
次に、参照データ記憶部M4には、予め、検索で用いられる参照データが格納されている。この参照データ記憶部M4は、参照データ作成部42、アフィン変換部44、局所領域画像記憶部M2及び局所特徴ベクトルを生成する上記の構成を用いて、以下のようにして生成される。
すなわち、参照データ作成部42は、フレーム画像G1から、各ペア特徴点の図5に示すような第1サンプリング円C1及び第2サンプリング円C2を含む局所領域画像を切り出し、局所領域画像群G2として局所領域画像記憶部M2に追加し、局所特徴ベクトル生成部45での図2のステップS1〜S5の処理により、局所領域画像群G2の各ペア特徴点の局所特徴ベクトル(参照局所特徴ベクトル)を求め、参照データ記憶部M4に追加する。
参照データ作成部42はまた、局所領域画像群G2のそれぞれの画像から、カメラの奥行き及び姿勢を変えたものに相当する複数の局所領域画像をアフィン変換で自動生成し、局所領域画像群G2に加えるとともに各局所領域画像について上記同様にして局所特徴ベクトルを求め、参照データ記憶部M4に追加する。
すなわち、アフィン変換部44を介し、局所領域画像群G2の各局所領域画像を、奥行きを変えずに光軸方向を変えることに相当する複数のマトリックスのそれぞれでアフィン変換して新たな局所領域画像群を生成し、これらを局所領域画像群G2に追加し、変換された各画像について局所特徴ベクトル生成部45を介し同様にして局所特長ベクトルを求め、参照データ記憶部M4に追加する。参照データ作成部42はさらに、局所領域画像群G2のそれぞれを、奥行きのみ長くすることに相当する複数のマトリックスのそれぞれでアフィン変換した画像群、すなわち、縮小した局所領域画像、例えば、幅及び高さをそれぞれ1/√2倍し、さらに1/√2倍し、さらに1/√2倍したそれぞれの局所領域画像群G3、G4及びG5を生成し、それぞれの局所領域画像について、局所特徴ベクトル生成部45を介し同様にして局所特長ベクトルを求め、参照データ記憶部M4に追加する。
参照データ作成部42は、参照データ記憶部M4において、アフィン変換の有無に拘わらず同一のペア特徴点に関する局所特長ベクトルのそれぞれに同一のクラスID(CID)を対応付ける。すなわち、参照データ記憶部M4には、例えば図10(A)に示すように、1つのペア特徴点に対し異なる複数のカメラ視点のそれぞれの局所特徴ベクトル、例
えばV0101、V0102、V0103、・・・が同一クラスID、例えばCID01でクラス分けされている。
参照データ記憶部M4にはさらに、各CIDが属するフレーム画像ID(FID)が対応付けられている。例えば、CID01はFID01、FID12が対応付けられている。これは、FID01、FID12のそれぞれのフレーム画像にCID01が含まれていることを意味する。
参照データ記憶部M4にはまた、各FIDに対応付けられた上記情報、例えば関連する本の情報、看板の詳細情報又は商品情報などが含まれている。
マッチング部46は、決定木を局所特徴ベクトルの識別器(分類器)として備えている。識別器は、局所特徴ベクトルVを入力としクラスIDを出力とする。決定木として、本実施例では、複数のツリーを用いたランダムフォレスト(Random Forest)を用いる。その理由は、使用時に高速動作すること、マルチクラス識別器であること、識別精度が比較的高いこと、識別精度とメモリ使用量がトレードオフになるがそのパラメータがほぼツリーの数で調整できること(ツリーが少数(多数)だと識別精度が低い(高い)がメモリ使用量が小(大))である。
局所特徴ベクトルの各成分を2値化しないのは、決定木を用いることにより、2値化とは無関係にマッチングを高速に行うことができることと、2値化による局所特徴ベクトルの識別力低下を避けるためである。
マッチング部46は、ランダムフォレスト識別器を学習しておく。すなわち、参照データ記憶部M4内の局所特徴ベクトルの全集合から、クラスIDが同一であるか否かを考慮せずにランダムに複数の部分集合(各部分集合の要素数は互いに同一)を決め、図10(B)に示すように部分集合をツリーの分岐ノードで分割する分割関数f(V)と分割の境界を定める閾値tとをランダムに決定し、情報利得が最大になるように学習して分割関数f(V)のパラメータと閾値tとを更新し、また、各ツリーの各リーフノードに、クラスID毎の確率Prを対応付けておく(リーフノードに対応付けられていないIDはその確率が0)。
マッチング部46は、各局所特徴ベクトルVについて、ランダムフォレストの各ツリーを辿って、リーフノードでクラスID毎の確率を取得し、全ツリーでのクラスID毎の確率の総和が最大になるIDを、ランダムフォレスト識別器の出力とする。
すなわち、マッチング部46は、局所特徴ベクトル記憶部M3内の各局所特徴ベクトルVに対し、図9に示すようなステップS10〜S15の処理を行って局所特徴ベクトルVのクラスIDを推定する。
(S10)横軸をクラスIDとし、縦軸を頻度(正確には確率値の累積加算値)とする空のヒストグラムをフレーム画像IDヒストグラム記憶部M5に生成する。以下、ランダムフォレストの各ツリーについて、ステップS11〜S14の処理を行う。
(S12)局所特徴ベクトルVに対し、ツリーを上から下へ辿り、その際、ツリーの各ノードにおいて、局所特徴ベクトルVの対応する成分と、その閾値tと、分割関数f(V)とに基づいて、どちらの子ノードへ分岐するかを決定し、リーフノードで得られるクラスIDの確率分布から、確率値が大きい順の、例えば3つのクラスIDを決定する。
(S13)これらの3つのクラスIDの確率値を、ステップS10のヒストグラムに追
加する。
(S15)ヒストグラム上の最頻値を、この局所特徴ベクトルVの特徴点のクラスIDと推定する(図10(B)参照)。
(S16)マッチング部46は、推定したクラスID(CID)に対応するフレーム画像ID(FID)、例えば図10(A)の左側のクラスIDであるID01に対応したFID01及びFID12を、参照データ記憶部M4から取得し、フレーム画像IDヒストグラム記憶部M5内のフレーム画像IDで識別されるカウンタを1だけインクリメントする。
マッチング部46が局所特徴ベクトル記憶部M3内の各局所特徴ベクトルVに対し図9の処理を行った後、フレーム画像ID推定部47は、フレーム画像IDヒストグラム記憶部M5内のカウンタ値が最大のフレーム画像IDを、バッファ領域Mi内のフレーム画像のIDと推定する。
フレーム画像IDの情報出力部48は、このフレーム画像IDに対応した情報を参照データ記憶部M4から取り出して、表示装置32に出力する。
次に、マッチング部46による処理の試験結果を説明する。
図11〜図14はいずれも、白鳥の写真と「Swan」の文字列とを含む印刷物の入力画像に対し図7の処理を行いその途中結果を可視化したものを含む図であって、図11は、該入力画像と該画像から抽出された特徴点ペアと、各ペアの特徴点間を接続した直線とを示す可視化画像の図であり、図12〜図14はいずれも、参照画像上の特徴点と図11中の入力画像上の特徴点とをマッチング部46でマッチングさせ、マッチングした特徴点間を直線で接続した図であり、図12は該参照画像が該入力画像を縮小し回転したものに相当し、図13は該参照画像が該入力画像を縮小し回転し射影変換したものに相当し、図14は該参照画像が該入力画像を回転し図12の場合よりも縮小したものに相当する図である。ここに参照画像は、この画像から上記参照データが得られる画像である。
図12及び図13の参照画像上の特徴点ペアはいずれも137対であり、このうち、図12では111対(81%)がマッチングに成功し、図13では93対(68%)がマッチングに成功した。図14の参照画像上の特徴点ペアは36対であり、このうち29対(80%)がマッチングに成功した。
以上において、本発明の好適な実施例を説明したが、本発明には他にも種々の変形例が含まれ、上記各構成要素の機能を実現する他の構成を用いたもの、当業者であればこれらの構成又は機能から想到するであろう他の構成も、本発明に含まれる。
例えば、マッチング部46で用いる識別器は、高速かつある程度以上マッチング精度が得られるものであればよく、ランダムフォレスト識別器に限定されず、バギングやブースティングなどのアンサンブル学習アルゴリズムを用いたものや単一の決定木を用いた識別器であってもよい。
また、参照データ記憶部M4は、アプリケーション起動後に上記のような参照データを参照データ作成部42で自動生成する構成であってもよい。
さらに、本発明は、拡張現実(AR)表示装置などにも適用することができる。
10 画像処理装置
20 本体部
21 プロセッサ
22 バス
23 記憶装置
24 入力インターフェイス
25 カメラインターフェイス
26 ディスプレインターフェイス
27 通信部
30 入力装置
31 カメラ
32 表示装置
33 アンテナ
4i 画像入力部
40 主処理部
41 グレースケール化部
42 参照データ作成部
43 特徴点検出部
44 アフィン変換部
45 局所特徴ベクトル生成部
46 マッチング部
47 フレーム画像ID推定部
48 フレーム画像IDの情報出力部
340、350,36 第1特徴点
341〜344、351、37 第2特徴点
352、C1 第1サンプリング円
353、C2 第2サンプリング円
P0〜Pf、Q0〜Qf 領域
Mi、M0 バッファ領域
M1 2次元座標記憶部
M2 局所領域画像記憶部
M3 局所特徴ベクトル記憶部
M4 参照データ記憶部
M5 フレーム画像IDヒストグラム記憶部

Claims (7)

  1. プロセッサと、データ及びプログラムが格納される記憶装置とを備え、該データは濃淡画像を含み、該プログラムは該プロセッサに対し該データに含まれる複数の局所特徴量を生成させる特徴ベクトル生成プログラムを含む画像処理装置において、
    該特徴ベクトル生成プログラムは該プロセッサに対し、
    (a)該濃淡画像に対しコーナポイントである特徴点の座標を検出させ、
    (b)検出された各特徴点である第1特徴点から近い順の所定数の第2特徴点のそれぞれと該第1特徴点とのペア特徴点を選択させ、
    (c)各ペア特徴点について、該第1特徴点と該第2特徴点との間の距離Lを求めさせ、
    (d)該第1特徴点を中心とし該距離Lに比例した第1半径の円周上の画素のうち等画素間隔のn個(n≧4)の画素のそれぞれを含む画素領域Pi、i=0〜n−1の平均第1輝度I(Pi)を、該距離Lの線方向を基準として所定順にサンプリングさせ、それぞれと該第1特徴点を含む画素領域の輝度との差と、
    該第2特徴点を中心とし該距離Lに比例した第2半径の円周上の画素のうち等画素間隔のm個(m≧4)の画素のそれぞれを含む画素領域Qi、i=0〜m−1の平均第2輝度I(Qj)を、該距離Lの線方向を基準として所定順にサンプリングさせ、それぞれと該第2特徴点を含む画素領域の輝度との差と、
    を成分とする、正規化された局所特徴ベクトルを求めさせ、
    該画素領域の画素数の平方根は該距離Lに略比例していることを特徴とする画像処理装置。
  2. m及びnはいずれも8、16又は32であることを特徴とする請求項1に記載の画像処理装置。
  3. カメラをさらに備え、
    該濃淡画像は、該カメラで撮像されたフレーム画像をグレースケール化した画像であることを特徴とする請求項1又は2に記載の画像処理装置。
  4. 該データはさらに、各参照濃淡画像について、該特徴ベクトル生成プログラムで生成した局所特徴ベクトルを参照局所特徴ベクトルとしてクラスIDと対応付けたものと該参照濃淡画像に関する情報とを含み、該プログラムはさらに画像検索プログラムを含み、
    該画像検索プログラムは、該プロセッサに対し、
    (e)検索濃淡画像に対しステップ(d)で求めた各局所特徴ベクトルについて、該局所特徴ベクトルに対応する、該参照データ内のクラスIDを、該局所特徴ベクトルと該参照データ内の参照局所特徴ベクトルとのマッチングにより決定させ、該クラスIDが属する参照濃淡画像のカウンタをインクリメントさせ、
    (f)カウンタ値が最大の参照濃淡画像に関する、該参照データ内の情報を、該検索濃淡画像の情報として出力させる、
    ことを特徴とする請求項1乃至3のいずれか1つに記載の画像処理装置。
  5. 該画像検索プログラムは、該プロセッサに対し、ステップ(e)において、局所特徴ベクトルを入力としクラスIDを出力とする識別器により、該クラスIDを決定させる、
    ことを特徴とする請求項4に記載の画像処理装置。
  6. 拡張現実表示装置であることを特徴とする請求項1又は2に記載の画像処理装置。
  7. 請求項1乃至6のいずれか1つに記載の画像処理装置を構成するプログラム。
JP2013112323A 2012-12-14 2013-05-28 画像処理装置及びそのプログラム Active JP5500404B1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2013112323A JP5500404B1 (ja) 2013-05-28 2013-05-28 画像処理装置及びそのプログラム
JP2014552105A JP6332865B2 (ja) 2013-05-28 2013-12-13 画像処理装置、画像処理方法、画像処理プログラム、プログラム及びカメラ付き移動端末装置
PCT/JP2013/083531 WO2014092193A1 (ja) 2012-12-14 2013-12-13 画像処理装置、画像処理方法、画像処理プログラム、プログラム及びカメラ付き移動端末装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013112323A JP5500404B1 (ja) 2013-05-28 2013-05-28 画像処理装置及びそのプログラム

Publications (2)

Publication Number Publication Date
JP5500404B1 JP5500404B1 (ja) 2014-05-21
JP2015026093A true JP2015026093A (ja) 2015-02-05

Family

ID=50941745

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013112323A Active JP5500404B1 (ja) 2012-12-14 2013-05-28 画像処理装置及びそのプログラム

Country Status (1)

Country Link
JP (1) JP5500404B1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2572624A (en) * 2018-04-05 2019-10-09 Imagination Tech Ltd Descriptor generation

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106651878B (zh) * 2016-12-21 2019-06-11 福建师范大学 一种用于从局部不变特征点中提取直线的方法
CN108846403B (zh) * 2018-06-04 2023-04-07 武汉恒宇科教仪器设备研发有限公司 一种刻面宝石图像特征提取方法
CN111369531B (zh) * 2020-03-04 2023-09-01 浙江大华技术股份有限公司 图像清晰度的评分方法、设备及存储装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4868530B2 (ja) * 2007-09-28 2012-02-01 Kddi株式会社 画像認識装置
JP2011008687A (ja) * 2009-06-29 2011-01-13 Sharp Corp 画像処理装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2572624A (en) * 2018-04-05 2019-10-09 Imagination Tech Ltd Descriptor generation
GB2572624B (en) * 2018-04-05 2020-12-16 Imagination Tech Ltd Descriptor generation
US11798257B2 (en) 2018-04-05 2023-10-24 Imagination Technologies Limited Generating feature descriptors for image analysis

Also Published As

Publication number Publication date
JP5500404B1 (ja) 2014-05-21

Similar Documents

Publication Publication Date Title
US10762376B2 (en) Method and apparatus for detecting text
Martinel et al. Kernelized saliency-based person re-identification through multiple metric learning
US8538164B2 (en) Image patch descriptors
WO2014092193A1 (ja) 画像処理装置、画像処理方法、画像処理プログラム、プログラム及びカメラ付き移動端末装置
US20140226906A1 (en) Image matching method and apparatus
US9626552B2 (en) Calculating facial image similarity
CN108875487B (zh) 行人重识别网络的训练及基于其的行人重识别
EP4085369A1 (en) Forgery detection of face image
CN111783770B (zh) 图像的矫正方法、装置和计算机可读存储介质
JP5361524B2 (ja) パターン認識システム及びパターン認識方法
JP6997369B2 (ja) プログラム、測距方法、及び測距装置
Ruf et al. Mobile museum guide based on fast SIFT recognition
US20130315490A1 (en) Feature point matching device, feature point matching method, and non-transitory computer readable medium storing feature matching program
JP5500400B1 (ja) 画像処理装置、画像処理方法及び画像処理プログラム
JP5500404B1 (ja) 画像処理装置及びそのプログラム
US9342753B2 (en) Image processing apparatus, image processing method, and computer program product
US9836666B2 (en) High speed searching for large-scale image databases
CN112001389A (zh) 一种多场景视频中文本信息识别方法、装置及电子设备
JP6332865B2 (ja) 画像処理装置、画像処理方法、画像処理プログラム、プログラム及びカメラ付き移動端末装置
CN111798376A (zh) 图像识别方法、装置、电子设备及存储介质
US9189693B2 (en) Information processing apparatus and information processing method
Zhang et al. Augmented visual feature modeling for matching in low-visibility based on cycle-labeling of Superpixel Flow
JP6218237B2 (ja) 撮影画像を平行化する画像変換プログラム、装置及び方法
JP2015170205A (ja) 特徴量生成装置、特徴量生成方法、およびプログラム
Cuong et al. SIFT Application Separates Motion Characteristics and Identifies Symbols on Tires

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130917

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20130930

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131030

TRDD Decision of grant or rejection written
A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20131122

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131217

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131219

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140226

R150 Certificate of patent or registration of utility model

Ref document number: 5500404

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250