JP4547639B2 - 画像処理装置および方法、並びにプログラム - Google Patents

画像処理装置および方法、並びにプログラム Download PDF

Info

Publication number
JP4547639B2
JP4547639B2 JP2008216986A JP2008216986A JP4547639B2 JP 4547639 B2 JP4547639 B2 JP 4547639B2 JP 2008216986 A JP2008216986 A JP 2008216986A JP 2008216986 A JP2008216986 A JP 2008216986A JP 4547639 B2 JP4547639 B2 JP 4547639B2
Authority
JP
Japan
Prior art keywords
luminance gradient
distribution
local region
feature point
gradient histogram
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008216986A
Other languages
English (en)
Other versions
JP2010055195A (ja
Inventor
宜邦 野村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2008216986A priority Critical patent/JP4547639B2/ja
Priority to US12/545,389 priority patent/US8369621B2/en
Priority to CN2009101684924A priority patent/CN101661622B/zh
Publication of JP2010055195A publication Critical patent/JP2010055195A/ja
Application granted granted Critical
Publication of JP4547639B2 publication Critical patent/JP4547639B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/758Involving statistics of pixels or of feature values, e.g. histogram matching

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Description

本発明は画像処理装置および方法、並びにプログラムに関し、特に、計算コストが低く、簡易に利用できる特徴量を画像から抽出できるようにした画像処理装置および方法、並びにプログラムに関する。
画像中の対象物体を認識する画像認識技術は、広い応用範囲を持つ画像処理技術であり、幅広い画像認識手法が研究されてきた。従来、画像認識に関する技術として、画像における特徴点の位置を検出する技術と、検出された特徴点の位置における特徴量を検出する技術とがある。
例えば、特徴点の位置を検出する技術として、「Harris corner detector」、「SUSAN corner detector」、「KLT corner detector」などの検出方法が提案されている(例えば、非特許文献1、特許文献1、および非特許文献2参照)。
また、特徴量を検出する技術として、「Steerable filters」や「Complex filters」を用いて検出する方法、「SIFT descriptor」、「PCA-SIFT」などの検出方法が提案されている(例えば、非特許文献3、非特許文献4、特許文献2、および非特許文献5参照)。
C. Harris and M. Stephens, "A combined corner and edge detector," Proc. 4th Alvey Vision Conf., pp.147-151, Manchester, U.K., Aug. 1988 英国特許第GB2272285号明細書 C.Tomasi and T.Kanade, "Detection and Tracking of Point Features" Technical Report CMU-CS-91-132 W. Freeman and E. Adelson, "The Design and Use of Steerable Filters," IEEE Trans. Pattern Analysis and Machine Intelligence, vol. 13, no. 9, pp. 891-906, Sept. 1991. F. Schaffalitzky and A. Zisserman, "Multi-View Matching for Unordered Image Sets," Proc. Seventh European Conf. Computer Vision, pp. 414-431, 2002. 米国特許第6711293号明細書 Y. Ke and R. Sukthankar, "PCA-SIFT: A More Distinctive Representation for Local Image Descriptors", Computer Vision and Pattern Recognition, 2004
ところで、画像認識に用いられる特徴量は、異なる画像のそれぞれに、同一の物体が含まれる場合に、その物体の同一性を示すことのできる何らかの記述子であり、この記述子は、通常、ベクトル量とされる。
特徴量を画像認識に用いる場合、特徴量に対しては、物体(特徴点)への視点や照明が変化しても特徴量に変化が生じないという性能上の要求に加え、特徴量が如何に少ないデータ量で簡易に表現されるかという記述上の要求がなされる。
特に、特徴量に対する記述上の要求は、計算能力やデータ容量に制限の多い携帯型の機器や、高速な処理速度が要求されるリアルタイム性の高い機器で、特徴量を用いた処理を行う場合に、より厳しくなる。
しかしながら、上述した技術では、性能上の要求と記述上の要求とを充分に満たす特徴量を抽出することは困難であった。
例えば、従来提案されてきた特徴量は、性能面での向上を目的とするものが多く、上述した「SIFT descriptor」と呼ばれる特徴量の検出方法では、画像から検出される、1つの特徴点における特徴量は128次元のベクトルで表される。したがって、2つの画像のそれぞれから検出された特徴点における特徴量間の類似度を求めて比較する場合、特徴量は、次元の大きなベクトルであるため、計算コストが高くなってしまう。なお、特徴量間の類似度は、ベクトル間のユークリッド距離で表される。
また、「PCA-SIFT」と呼ばれる特徴量の検出方法では、「SIFT descriptor」により検出された特徴量に対して、主成分分析を行うことによって、特徴量の次元数が削減されるが、この次元の削減のための主成分分析の計算コストが高くなってしまう。つまり、最終的に利用する特徴量を算出する段階での処理量が多くなってしまう。このように、特徴量の検出における計算コストを考える場合、特徴量の検出そのものに必要な処理量と、検出された特徴量を利用して画像認識を行うのに必要な処理の処理量との2つの側面に対する考慮が必要となる。
本発明は、このような状況に鑑みてなされたものであり、視点や照明の変化に対してロバストであり、かつ計算コストが低く、簡易に利用できる特徴量を画像から検出することができるようにするものである。
本発明の一側面の画像処理装置は、画像上の特徴点を含む第1の局所領域における、輝度勾配ベクトルの分布を求める第1の分布算出手段と、前記画像上の前記特徴点の近傍にある第2の局所領域における、前記輝度勾配ベクトルの分布を求める第2の分布算出手段と、前記第1の局所領域の前記勾配ベクトルの分布と、前記第2の局所領域の前記勾配ベクトルの分布とを比較して、複数の前記第2の局所領域の前記勾配ベクトルの分布のうち、前記第1の局所領域の前記勾配ベクトルの分布と最も分布が異なる前記第2の局所領域の前記勾配ベクトルの分布を選択する選択手段と、前記第1の局所領域の前記勾配ベクトルの分布と、前記選択手段により選択された前記第2の局所領域の前記勾配ベクトルの分布とに基づいて、前記特徴点における特徴量を算出する特徴量算出手段とを備える。
前記輝度勾配ベクトルの分布として、前記輝度勾配ベクトルの方向ごとに求められた、前記方向を有する前記輝度勾配ベクトルの出現頻度を示す輝度勾配ヒストグラムが求められるようにし、前記選択手段には、前記第2の局所領域の前記輝度勾配ヒストグラムについて、前記第1の局所領域の前記輝度勾配ヒストグラムとの類似度を求めさせ、前記複数の前記第2の局所領域の前記輝度勾配ヒストグラムのうち、前記類似度により示される類似の度合いの最も低い前記第2の局所領域の前記輝度勾配ヒストグラムを選択させることができる。
本発明の一側面の画像処理方法またはプログラムは、画像上の特徴点を含む第1の局所領域における、輝度勾配ベクトルの分布を求め、前記画像上の前記特徴点の近傍にある第2の局所領域における、前記輝度勾配ベクトルの分布を求め、前記第1の局所領域の前記勾配ベクトルの分布と、前記第2の局所領域の前記勾配ベクトルの分布とを比較して、複数の前記第2の局所領域の前記勾配ベクトルの分布のうち、前記第1の局所領域の前記勾配ベクトルの分布と最も分布が異なる前記第2の局所領域の前記勾配ベクトルの分布を選択し、前記第1の局所領域の前記勾配ベクトルの分布と、選択された前記第2の局所領域の前記勾配ベクトルの分布とに基づいて、前記特徴点における特徴量を算出するステップを含む。
本発明の一側面においては、画像上の特徴点を含む第1の局所領域における、輝度勾配ベクトルの分布が求められ、前記画像上の前記特徴点の近傍にある第2の局所領域における、前記輝度勾配ベクトルの分布が求められ、前記第1の局所領域の前記勾配ベクトルの分布と、前記第2の局所領域の前記勾配ベクトルの分布とが比較されて、複数の前記第2の局所領域の前記勾配ベクトルの分布のうち、前記第1の局所領域の前記勾配ベクトルの分布と最も分布が異なる前記第2の局所領域の前記勾配ベクトルの分布が選択され、前記第1の局所領域の前記勾配ベクトルの分布と、選択された前記第2の局所領域の前記勾配ベクトルの分布とに基づいて、前記特徴点における特徴量が算出される。
本発明の一側面によれば、画像から特徴量を検出することができる。特に、本発明の一側面によれば、視点や照明の変化に対してロバストであり、かつ計算コストが低く、簡易に利用できる特徴量を画像から検出することができる。
以下、図面を参照して、本発明を適用した実施の形態について説明する。
図1は、本発明を適用した画像処理装置の一実施の形態の構成例を示すブロック図である。
画像処理装置11は、特徴点検出部21、輝度勾配ヒストグラム生成部22、輝度勾配ヒストグラム生成部23、輝度勾配ヒストグラム選択部24、および特徴量生成部25から構成される。
特徴点検出部21には、特徴量の検出対象となる入力画像が供給される。特徴点検出部21は、供給された入力画像から、入力画像の特徴的な画素である特徴点の位置を検出し、入力画像と、検出した特徴点位置とを輝度勾配ヒストグラム生成部22に供給する。
輝度勾配ヒストグラム生成部22は、特徴点検出部21からの入力画像および特徴点位置に基づいて、特徴点位置ごとに輝度勾配ヒストグラムを生成する。この輝度勾配ヒストグラムは、特徴点を含む局所領域における、各画素の輝度勾配ベクトルの分布を示す情報、すなわち輝度勾配ベクトルの方向ごとに求められた、各方向を有する輝度勾配ベクトルの出現頻度を示す情報である。
輝度勾配ヒストグラム生成部22は、輝度勾配ベクトル算出部41、輝度勾配ヒストグラム更新部42、代表方向算出部43、および画像回転部44から構成される。
輝度勾配ベクトル算出部41は、特徴点検出部21から供給された入力画像および特徴点位置、または画像回転部44から供給された入力画像に基づいて、入力画像における特徴点位置を含む局所領域内の各画素の輝度勾配ベクトルを算出し、輝度勾配ヒストグラム更新部42に供給する。
輝度勾配ヒストグラム更新部42は、輝度勾配ベクトル算出部41から供給された輝度勾配ベクトルを用いて、保持している輝度勾配ヒストグラムを更新し、最終的な輝度勾配ヒストグラムを生成する。輝度勾配ヒストグラム更新部42は、生成した輝度勾配ヒストグラムを代表方向算出部43または輝度勾配ヒストグラム選択部24に供給する。
代表方向算出部43は、輝度勾配ヒストグラム更新部42から供給された輝度勾配ヒストグラムに基づいて、特徴点位置を含む局所領域内の画素の代表的な輝度勾配ベクトルの方向を代表方向として求め、画像回転部44に供給する。画像回転部44は、特徴点検出部21から供給された入力画像および特徴点位置と、代表方向算出部43から供給された代表方向とに基づいて入力画像を回転させ、回転された入力画像を輝度勾配ベクトル算出部41および輝度勾配ヒストグラム生成部23に供給する。
なお、以下、画像回転部44により回転された入力画像を、回転入力画像とも称する。また、輝度勾配ヒストグラム更新部42から輝度勾配ヒストグラム選択部24には、特徴点検出部21から供給された入力画像に基づいて生成された輝度勾配ヒストグラムではなく、回転入力画像から生成された輝度勾配ヒストグラムが供給される。
輝度勾配ヒストグラム生成部23は、画像回転部44から供給された回転入力画像に基づいて、各特徴点位置について、回転入力画像における特徴点近傍の位置を含む局所領域の輝度勾配ヒストグラムを生成する。輝度勾配ヒストグラム生成部23は、近傍位置選択部45、輝度勾配ベクトル算出部46、輝度勾配ヒストグラム更新部47から構成される。
近傍位置選択部45は、画像回転部44から供給された回転入力画像における特徴点について、回転入力画像の特徴点近傍にある位置をいくつか選択し、選択された位置である近傍位置と、回転入力画像とを輝度勾配ベクトル算出部46に供給する。例えば、1つの特徴点に対して、その特徴点近傍の4つの近傍位置が選択される。
輝度勾配ベクトル算出部46は、近傍位置選択部45から供給された特徴点の近傍位置、および回転入力画像を用いて、各近傍位置を含む局所領域内の各画素の輝度勾配ベクトルを算出し、輝度勾配ヒストグラム更新部47に供給する。
輝度勾配ヒストグラム更新部47は、輝度勾配ベクトル算出部46から供給された輝度勾配ベクトルを用いて、保持している輝度勾配ヒストグラムを更新し、最終的な輝度勾配ヒストグラムを生成する。輝度勾配ヒストグラム更新部47では、近傍位置を含む局所領域ごとに輝度勾配ヒストグラムが生成されて、輝度勾配ヒストグラム更新部47から輝度勾配ヒストグラム選択部24に供給される。
輝度勾配ヒストグラム選択部24は、輝度勾配ヒストグラム更新部42から供給された輝度勾配ヒストグラムと、輝度勾配ヒストグラム更新部47から供給された輝度勾配ヒストグラムとを比較する。すなわち、輝度勾配ヒストグラム選択部24は、1つの特徴点の近傍に位置する複数の近傍位置の輝度勾配ヒストグラムのうち、特徴点の輝度勾配ヒストグラムと、最も輝度勾配ベクトルの分布の異なる輝度勾配ヒストグラムを選択する。そして、輝度勾配ヒストグラム選択部24は、特徴点の輝度勾配ヒストグラムと、その特徴点に対して選択された1つの近傍位置の輝度勾配ヒストグラムとを特徴量生成部25に供給する。
特徴量生成部25は、輝度勾配ヒストグラム選択部24から供給された、特徴点の輝度勾配ヒストグラムと、その特徴点の近傍にある近傍位置の輝度勾配ヒストグラムとを用いて、特徴点における特徴量を生成し、出力する。
このようにして入力画像から検出された特徴量は、例えば、複数の画像から同一の被写体を検出する画像認識に用いられる。画像認識は、例えば、視差を持った画像群において、同一の被写体が映っている領域を認識し、その結果得られた情報に基づいて奥行き情報を算出するステレオビジョン技術に用いられる。また、画像認識は、事前に撮影しておいた対象物、例えば、人物や交通標識を所定の画像から検出する技術や、動画像において、特定の物体を追跡し続けるトラッキング技術にも用いられる。
ところで、画像処理装置11は、入力画像が供給されて、入力画像からの特徴量の検出が指示されると、入力画像から特徴量を検出(抽出)して出力する処理である特徴量生成処理を開始する。以下、図2のフローチャートを参照して、画像処理装置11による特徴量生成処理について説明する。
ステップS11において、特徴点検出部21は、供給された入力画像から特徴点の位置を検出し、検出した特徴点の位置である特徴点位置および入力画像を、輝度勾配ベクトル算出部41および画像回転部44に供給する。例えば、特徴点検出部21は、「Harris corner detector」と呼ばれる検出方法により入力画像から特徴点を検出する。
ステップS12において、輝度勾配ベクトル算出部41は、特徴点検出部21から供給された入力画像上の複数の特徴点のうちの1つを選択する。
ステップS13において、輝度勾配ヒストグラム生成部22は、特徴点位置における輝度勾配ヒストグラム生成処理を行って、ステップS12の処理において選択した特徴点を含む局所領域の輝度勾配ヒストグラムを生成する。
ここで、図3のフローチャートを参照して、ステップS13の処理に対応する、特徴点位置における輝度勾配ヒストグラム生成処理について説明する。
ステップS51において、輝度勾配ベクトル算出部41は、注目している特徴点、つまりステップS12の処理において選択された特徴点(以下、注目特徴点とも称する)に対して、局所領域を設定する。具体的には、輝度勾配ベクトル算出部41は、入力画像上において、注目特徴点を中心とし、半径をr画素とする円内に含まれる領域を、注目特徴点の局所領域とする。
以下では、局所領域に含まれる画素の数はm個(但し、mは自然数)であるとし、局所領域内の画素Gi(但し、1≦i≦m)の位置が、画素位置(xi,yi)で表されるものとする。ここで、画素位置(xi,yi)における「xi」および「yi」は、入力画像上において、互いに直交する所定の方向をx方向およびy方向としたxy座標系における、画素Giの画素位置のx座標およびy座標を示している。
また、より詳細には、輝度勾配ベクトル算出部41により、入力画像全体の領域のうちの、注目特徴点を中心とする所定の大きさの領域が切り出されて、その切り出された入力画像の領域が用いられて、輝度勾配ヒストグラムを生成する処理が行われる。
ステップS52において、輝度勾配ベクトル算出部41は、局所領域内の処理対象となっている画素Giを特定するためのループカウンタiを初期化し、i=1とする。
ステップS53において、輝度勾配ベクトル算出部41は、画素位置(xi,yi)における画素Giの輝度勾配ベクトルを算出して、輝度勾配ヒストグラム更新部42に供給する。具体的には、輝度勾配ベクトル算出部41は、次式(1)および式(2)を計算することにより、画素Giの画素値のx方向の一次微分Ix(xi,yi)と、画素値のy方向の一次微分Iy(xi,yi)とを求める。
Ix(xi,yi)=I(xi+1,yi)−I(xi−1,yi) ・・・(1)
Iy(xi,yi)=I(xi,yi+1)−I(xi,yi−1) ・・・(2)
なお、式(1)および式(2)において、I(x,y)は、画素位置が(x,y)である画素の画素値を示している。したがって、画素Giにx方向に隣接する画素の画素値と、画素Giにx方向とは反対方向に隣接する画素の画素値との差分が、画素Giのx方向の一次微分Ix(xi,yi)とされる。同様に、画素Giにy方向に隣接する画素の画素値と、画素Giにy方向とは反対方向に隣接する画素の画素値との差分が、画素Giのy方向の一次微分Iy(xi,yi)とされる。
この一次微分Ix(xi,yi)および一次微分Iy(xi,yi)は、画素Giにおける所定の方向の輝度の勾配、つまり画素値の変化量を示している。輝度勾配ベクトル算出部41は、このようにして得られた、一次微分Ix(xi,yi)、および一次微分Iy(xi,yi)からなるベクトルを、画素Giの輝度勾配ベクトルとする。なお、この輝度勾配ベクトルの大きさn(xi,yi)および方向θ(xi,yi)は、次式(3)および式(4)により表される。
n(xi,yi)=((Ix(xi,yi))2+(Iy(xi,yi))21/2 ・・・(3)
θ(xi,yi)=tan-1(Iy(xi,yi)/Ix(xi,yi)) ・・・(4)
ステップS54において、輝度勾配ヒストグラム更新部42は、輝度勾配ベクトル算出部41から供給された輝度勾配ベクトルに基づいて、保持している局所領域の輝度勾配ヒストグラムを更新する。
具体的には、輝度勾配ヒストグラム更新部42は、処理対象となっている局所領域の輝度勾配ヒストグラムを保持している。この輝度勾配ヒストグラムは、縦軸に度数(輝度勾配ベクトルの出現頻度)、横軸に、画素における輝度勾配ベクトルの角度を取ったヒストグラムであり、輝度勾配ベクトルの方向からヒストグラムのビンが決定され、そのビンに追加される度数として、輝度勾配ベクトルの大きさが用いられる。
ここで、ビンとは、輝度勾配ヒストグラムの横軸により示される輝度勾配ベクトルの方向の取り得る値の範囲を、いくつかの数に分割したときの、分割された1つの方向の範囲をいう。例えば、輝度勾配ヒストグラムの横軸の範囲が[0,2π)、つまり0から2πまでの範囲(但し、2πは含まれない)であり、ビンの数がP個であるとすると、輝度勾配ベクトルの方向θ(xi,yi)に対して、ビンは、次式(5)により定められる。
Figure 0004547639
すなわち、輝度勾配ベクトルの方向θ(xi,yi)を(2π/P)で除算して得られる数を超えない最大の整数が、方向がθ(xi,yi)である輝度勾配ベクトルのビンとされる。このようにして、各輝度勾配ベクトルに対して、P個のビンのうちの何れかが定められる。輝度勾配ヒストグラム更新部42は、保持している局所領域の輝度勾配ヒストグラムのビンのうち、輝度勾配ベクトル算出部41から供給された輝度勾配ベクトルの方向により定まるビンの度数に、その輝度勾配ベクトルの大きさn(xi,yi)を加算して、保持している輝度勾配ヒストグラムを更新する。
つまり、輝度勾配ヒストグラム更新部42は、P個の各ビンの度数からなるベクトルを、輝度勾配ヒストグラムとして保持しており、輝度勾配ベクトル算出部41から輝度勾配ベクトルが供給されるたびに、その輝度勾配ベクトルに対応するビンの度数に輝度勾配ベクトルの大きさを加算する。
輝度勾配ヒストグラムの更新時においては、各ビンの度数に、輝度勾配ベクトルの出現頻度ではなく、輝度勾配ベクトルの大きさが加算されることにより、輝度勾配ベクトルの大きさに応じた輝度勾配ヒストグラムの度数への重み付けが行われる。このような重み付けが行われるのは、輝度勾配ベクトルの大きさが小さい画素よりも、輝度勾配ベクトルの大きさが大きい画素の方が、より入力画像の特徴を表しているからである。
このようにして、処理対象の局所領域の輝度勾配ヒストグラムが更新されると、ステップS55において、輝度勾配ベクトル算出部41は、ループカウンタiの値がmであるか否かを判定する。
ステップS55において、ループカウンタiの値がmでないと判定された場合、まだ局所領域内のm個の画素全てが処理対象とされていないので、輝度勾配ベクトル算出部41は、ループカウンタiの値をインクリメントする。その後、処理はステップS53に戻り、局所領域内の次の画素が選択されて、その画素の輝度勾配ベクトルが求められる。
これに対して、ステップS55において、ループカウンタiの値がmであると判定された場合、局所領域内の画素が全て処理対象とされて、輝度勾配ヒストグラムの更新が行われたので、輝度勾配ヒストグラム更新部42は、保持している輝度勾配ヒストグラムを、局所領域の輝度勾配ヒストグラムとして代表方向算出部43に供給する。
このようにして、1つの特徴点を含む局所領域の輝度勾配ヒストグラムが生成されると、特徴点位置における輝度勾配ヒストグラム生成処理は終了し、その後、処理は、図2のステップS14に進む。
図2のフローチャートの説明に戻り、ステップS14において、代表方向算出部43は、輝度勾配ヒストグラム更新部42から供給された輝度勾配ヒストグラムを用いて、処理対象となっている局所領域における、輝度勾配ベクトルの代表方向を求める。
例えば、代表方向算出部43は、供給された輝度勾配ヒストグラムのビンのうち、度数の最も大きいビンを選択し、その選択したビンにより示される輝度勾配ベクトルの方向の範囲の中央値を、特徴点を含む局所領域の輝度勾配ベクトルの代表方向θ0とする。そして、代表方向算出部43は、求めた代表方向θ0を画像回転部44に供給する。
ステップS15において、画像回転部44は、特徴点検出部21から供給された入力画像および特徴点位置と、代表方向算出部43から供給された代表方向とに基づいて入力画像を回転させる。
具体的には、画像回転部44は、入力画像全体の領域のうちの注目特徴点を中心とする所定の大きさの領域を切り出し、切り出した領域を、注目特徴点を中心として局所領域の代表方向θ0とは反対方向に、代表方向θ0の大きさの角度だけ回転させる。そして、画像回転部44は、回転により得られた入力画像を回転入力画像として、輝度勾配ベクトル算出部41および近傍位置選択部45に供給する。
ここで、各画素の輝度勾配ベクトルの方向は、入力画像における所定の基準となる方向(以下、基準方向とも称する)に対する回転角度、つまり、基準方向と、輝度勾配ベクトルとのなす角度を示している。また、代表方向θ0は、局所領域内の画素の輝度勾配ベクトルの方向のうち、最も多い方向ということができる。
例えば、入力画像上の被写体が回転した場合、被写体上の特徴点を含む局所領域の代表方向θ0も、被写体の回転方向に、その回転角度と同じ角度だけ変化することになる。そのため、特徴点を中心として、代表方向θ0に示される角度だけ入力画像を回転させて回転入力画像とすると、回転入力画像の特徴点における代表方向θ0は、常に基準方向となる。したがって、その回転入力画像から再度、特徴点を含む局所領域の輝度勾配ヒストグラムを求めると、被写体の回転に対して不変な輝度勾配ヒストグラムを得ることができる。
なお、入力画像の回転時において、xy座標系は回転せずにそのままとされる。また、入力画像上における被写体が並進移動しても、輝度勾配ベクトルは変化しないので、輝度勾配ヒストグラムは、被写体の並進移動に対して不変である。さらに、局所領域は半径r画素の円形の領域であり、入力画像の回転中心は特徴点であるため、局所領域は入力画像の回転に対して不変である。
画像回転部44は、入力画像を代表方向θ0に基づいて回転させ、これにより得られた回転入力画像から輝度勾配ヒストグラムを生成させる。
なお、特徴点近傍の近傍位置における輝度勾配ヒストグラムの生成時には、特徴点の局所領域における代表方向が、近傍位置の局所領域における代表方向として用いられる。すなわち、近傍位置の輝度勾配ヒストグラムの生成には、代表方向に基づいて入力画像を回転させて得られた回転入力画像が用いられる。
ステップS16において、輝度勾配ヒストグラム生成部22は、回転入力画像を処理対象として、特徴点位置における輝度勾配ヒストグラム生成処理を行い、輝度勾配ヒストグラムを生成する。なお、この特徴点位置における輝度勾配ヒストグラム生成処理は、図3を参照して説明した処理と同様の処理であるため、その説明は、省略する。
但し、処理対象の画像が回転入力画像とされる。すなわち、輝度勾配ベクトル算出部41は、画像回転部44からの回転入力画像を用いて輝度勾配ベクトルを算出する。そして、輝度勾配ヒストグラム更新部42は、回転入力画像から得られた輝度勾配ベクトルの大きさを度数とし、輝度勾配ベクトルの方向を角度として、輝度勾配ベクトルの大きさを輝度勾配ヒストグラムの各ビンに振り分ける。これにより、局所領域内での輝度勾配ベクトルの分布を示す輝度勾配ヒストグラムが得られる。
ステップS17において、輝度勾配ヒストグラム更新部42は、ステップS16の処理により生成された輝度勾配ヒストグラムを正規化して、輝度勾配ヒストグラム選択部24に供給する。具体的には、輝度勾配ヒストグラム更新部42は、輝度勾配ヒストグラムを構成する各ビンの度数の総和が1となるように、輝度勾配ヒストグラムを正規化する。
例えば、輝度勾配ヒストグラムが、ビンB1乃至ビンBP(但し、Pは自然数)のP個のビンから構成され、ビンBp(但し、1≦p≦P)の度数がH(p)であるものとすると、正規化されたビンBpの度数H’(p)は、次式(6)により表される。
Figure 0004547639
すなわち、ビンBpの度数H(p)を、各ビンの度数H(1)乃至度数H(P)の総和で除算して得られる値が、正規化されたビンBpの度数H’(p)とされる。このように、輝度勾配ヒストグラムを正規化することにより、輝度勾配ヒストグラムを、入力画像上の被写体に照射される照明の強度に対して不変なものとすることができる。これは、輝度勾配ベクトルの大きさが、被写体を照らす照明の強度の変化に応じて変化するため、各ビンの度数を正規化すれば、各ビンの度数が、他のビンの度数に対する相対的な大きさを示すものとなり、照明強度の変化に対して不変量となるからである。
ステップS18において、輝度勾配ヒストグラム生成部23は、画像回転部44から供給された回転入力画像を用いて、特徴点の近傍位置における、輝度勾配ヒストグラム生成処理を行い、近傍位置の輝度勾配ヒストグラムを生成する。
ここで、図4のフローチャートを参照して、ステップS18の処理に対応する、特徴点の近傍位置における輝度勾配ヒストグラム生成処理について説明する。
ステップS81において、近傍位置選択部45は、画像回転部44から供給された回転入力画像に基づいて、回転入力画像上の注目特徴点の近傍の複数の近傍位置のうちの1つを選択し、その選択結果および回転入力画像を輝度勾配ベクトル算出部46に供給する。
例えば、近傍位置選択部45は、図5に示すように、回転入力画像81の中心に位置する特徴点位置C11の近傍にある4つの近傍位置A11乃至近傍位置A14のうちの1つを選択する。図5では、特徴点位置C11の画素(特徴点)を始点とする矢印B11は、特徴点の輝度勾配ベクトルの代表方向を示しており、特徴点位置C11を中心とする円形の領域R11は、特徴点の局所領域を示している。
また、近傍位置A11乃至近傍位置A14のそれぞれは、特徴点位置C11を中心とする同一円周上の画素の位置であって、その円周を等分割する位置とされる。つまり、近傍位置A11乃至近傍位置A14のそれぞれは、特徴点位置C11から互いに等距離にある位置とされる。
図5の例では、特徴点位置C11の図中、上下左右の各方向に近傍位置A11乃至近傍位置A14が位置し、それらの近傍位置によって、特徴点位置C11を中心とする円の円周が4つに等分割されている。そして、近傍位置A11乃至近傍位置A14のそれぞれを中心とする半径r画素の円内の領域R12乃至領域R15のそれぞれが、近傍位置A11乃至近傍位置A14の局所領域とされる。なお、特徴点位置C11および近傍位置A11乃至近傍位置A14の局所領域である、領域R11乃至領域R15のそれぞれは、同じ大きさ(面積)の領域とされる。
回転入力画像では、いくつかの画素位置が近傍位置とされ、これらの近傍位置の輝度勾配ヒストグラムが生成される。そして、これらの近傍位置の輝度勾配ヒストグラムのうち、最も特徴点の輝度勾配ヒストグラムと分布が異なるものと、特徴点の輝度勾配ヒストグラムとから特徴点における特徴量が生成されることになる。
ここで、特徴点の近傍の局所領域の輝度勾配ヒストグラムを生成するにあたり、特徴点近傍の画素は複数あるが、それら全ての画素位置で輝度勾配ヒストグラムを生成するのは無駄である。なぜなら、特徴点の近傍位置が特徴点と近すぎると、これら2点の輝度勾配ヒストグラムは、ほぼ同じものとなるため、特徴点に近すぎる画素位置の輝度勾配ヒストグラムは、特徴量の生成に用いるのには不適切だからである。
そこで、特徴点から充分に離れた距離をr画素として、特徴点を中心とし、半径r画素の円の円周上の画素の位置を近傍位置とすることで、特徴量を求めるのに適した位置を近傍位置とすることができる。また、近傍位置が、特徴点を中心とする円の円周を等分割する位置とされるのは、円周上の全ての画素位置の輝度勾配ヒストグラムを求めるのは無駄であり、近傍位置とされる位置は、適当な間隔を空けて選ばれるべきだからである。
このように、近傍位置選択部45は、画像回転部44から、例えば、図5の回転入力画像81が供給されると、近傍位置A11乃至近傍位置A14のうちの1つを選択する。
図4のフローチャートの説明に戻り、ステップS82において、輝度勾配ベクトル算出部46は、近傍位置選択部45からの選択結果および回転入力画像を用いて、選択された近傍位置の局所領域を設定する。これにより、例えば、選択された図5の近傍位置A11に対して、局所領域R12が設定される。
近傍位置の局所領域が設定されると、その後、ステップS83乃至ステップS86の処理が行われるが、これらの処理は、図3のステップS52乃至ステップS55の処理のそれぞれと同様であるので、その説明は省略する。
すなわち、設定された近傍位置の局所領域内の各画素について、輝度勾配ベクトル算出部46により、上述した式(1)および式(2)が計算されて輝度勾配ベクトルが求められる。そして、輝度勾配ヒストグラム更新部47により、局所領域内の各画素の輝度勾配ベクトルから輝度勾配ヒストグラムが更新されて、選択された近傍位置の輝度勾配ヒストグラムが生成される。
ステップS86において、ループカウンタiの値がmであると判定された場合、つまり選択された近傍位置の局所領域内の全ての画素の輝度勾配ベクトルにより、輝度勾配ヒストグラムが更新された場合、処理はステップS87に進む。
ステップS87において、輝度勾配ヒストグラム更新部47は、ステップS81乃至ステップS86の処理により得られた輝度勾配ヒストグラムを正規化して、輝度勾配ヒストグラム選択部24に供給する。
具体的には、輝度勾配ヒストグラム更新部47は、上述した式(6)を計算して、輝度勾配ヒストグラムを構成する各ビンの度数の総和が1となるように、輝度勾配ヒストグラムを正規化する。なお、この場合、式(6)において、近傍位置の輝度勾配ヒストグラムのビンの度数がH(p)とされる。この正規化により、選択された近傍位置の輝度勾配ヒストグラムは、被写体の回転や照明強度の変化に対して不変の値となる。
ステップS88において、近傍位置選択部45は、注目特徴点の近傍にある全ての近傍位置を選択したか否かを判定する。例えば、図5の近傍位置A11乃至近傍位置A14の全てが選択されて、それらの近傍位置の輝度勾配ヒストグラムが求められた場合、全ての近傍位置を選択したと判定される。
ステップS88において、まだ全ての近傍位置が選択されていないと判定された場合、処理はステップS81に戻り、上述した処理が繰り返される。すなわち、新たな近傍位置が選択され、その近傍位置の輝度勾配ヒストグラムが求められる。
これに対して、ステップS88において、全ての近傍位置を選択したと判定された場合、特徴点の近傍位置における輝度勾配ヒストグラム生成処理は終了し、処理は図2のステップS19に進む。特徴点の近傍位置における輝度勾配ヒストグラム生成処理が行われると、注目特徴点近傍にある複数の近傍位置の輝度勾配ヒストグラムのそれぞれが、輝度勾配ヒストグラム更新部47から輝度勾配ヒストグラム選択部24に供給される。
図2のフローチャートの説明に戻り、ステップS19において、輝度勾配ヒストグラム選択部24は、輝度勾配ヒストグラム更新部47から供給された複数の近傍位置の輝度勾配ヒストグラムのうち、輝度勾配ヒストグラム更新部42から供給された、特徴点の輝度勾配ヒストグラムと最も分布の異なるものを選択する。
例えば、特徴点の近傍のK箇所の近傍位置A1乃至近傍位置AKのそれぞれの輝度勾配ヒストグラムが得られたとする。また、各輝度勾配ヒストグラムがP個のビンから構成され、特徴点の輝度勾配ヒストグラムの各ビンの度数がHc(j)(但し、1≦j≦P)とされ、近傍位置Ak(但し、1≦k≦K)の輝度勾配ヒストグラムの各ビンの度数がHk(j)(但し、1≦j≦P)とされるとする。
そのような場合、輝度勾配ヒストグラム選択部24は、次式(7)を計算することにより、特徴点の輝度勾配ヒストグラムと、近傍位置Akの輝度勾配ヒストグラムとの類似度Skを求める。
Figure 0004547639
すなわち、特徴点の輝度勾配ヒストグラムと、近傍位置の輝度勾配ヒストグラムとの対応するビンの度数Hc(j)および度数Hk(j)の差分の自乗和が類似度Skとされる。
この類似度Skは、その値が大きいほど、特徴点の輝度勾配ヒストグラムと、近傍位置の輝度勾配ヒストグラムとの輝度勾配ベクトルの分布がより異なることを示している。つまり、類似度Skは、近傍位置の輝度勾配ヒストグラムの、特徴点の輝度勾配ヒストグラムとの類似の度合いを示しており、類似度Skの値が大きいほど、より特徴点の輝度勾配ヒストグラムとの類似の度合いが低いことを示している。
輝度勾配ヒストグラム選択部24は、K個の近傍位置の輝度勾配ヒストグラムのうち、類似度Skが最大のものを、特徴点の輝度勾配ヒストグラムと最も輝度勾配ベクトルの分布が異なる輝度勾配ヒストグラムとして選択する。そして、輝度勾配ヒストグラム選択部24は、選択した近傍位置の輝度勾配ヒストグラムと、特徴点の輝度勾配ヒストグラムとを特徴量生成部25に供給する。
ステップS20において、特徴量生成部25は、輝度勾配ヒストグラム選択部24から供給された、特徴点の輝度勾配ヒストグラムと、近傍位置の輝度勾配ヒストグラムとを用いて、特徴点における特徴量を生成し、出力する。
輝度勾配ヒストグラムは、各ビンの度数をベクトルの要素と考えることができ、それらの複数の度数を並べることで、輝度勾配ヒストグラムをベクトル表現することができる。そこで、特徴量生成部25は、特徴点の輝度勾配ヒストグラムおよび近傍位置の輝度勾配ヒストグラムから得られた2つのベクトルを連結し、その結果得られた1つのベクトルを特徴点における特徴量とする。
このようにして生成された特徴点の特徴量は、特徴点の輝度勾配ヒストグラムおよび近傍位置の輝度勾配ヒストグラムから生成されたものであるから、被写体の回転、つまり視点の変化や、被写体への照明強度の変化に対してロバストなものとなる。
また、生成された特徴量は、後段において、複数の画像から同一の被写体を検出する画像認識処理などに用いられる。例えば、被写体の検出は、異なる画像上の特徴点のそれぞれにおける特徴量同士を比較することにより行われる。この特徴量の比較は、特徴量としてのベクトル間のユークリッド距離などにより類似度が求められ、その類似度により、特徴点同士が類似しているか否かが評価される。そして、特徴点同士が類似していると判定された場合には、それらの特徴点は、同じ被写体の同じ部位であるとの認識がなされる。
1つの特徴点の特徴量が生成されて出力されると、処理はステップS20からステップS21に進む。
ステップS21において、画像処理装置11は、入力画像から検出された全ての特徴点について特徴量を生成したか否かを判定する。ステップS21において、まだ全ての特徴点の特徴量が生成されていないと判定された場合、処理はステップS12に戻り、上述した処理が繰り返される。すなわち、入力画像上の新たな特徴点が選択されて、選択された特徴点における特徴量が生成される。
一方、ステップS21において、全ての特徴点について特徴量を生成したと判定された場合、特徴量生成処理は終了する。
以上のようにして、画像処理装置11は、入力画像から特徴点を検出し、特徴点の輝度勾配ヒストグラムと、特徴点近傍の複数の近傍位置の輝度勾配ヒストグラムとを生成する。そして、画像処理装置11は、生成した複数の近傍位置の輝度勾配ヒストグラムのうち、特徴点の輝度勾配ヒストグラムと最も輝度勾配ベクトルの分布の異なるものを選択し、選択した輝度勾配ヒストグラムと、特徴点の輝度勾配ヒストグラムとから特徴点の特徴量を生成する。
このように、特徴点の輝度勾配ヒストグラムと、最も輝度勾配ベクトルの分布の異なる近傍位置の輝度勾配ヒストグラムとを連結して特徴量とすることにより、視点や照明の変化に対してロバストであり、かつ検出に必要な計算コストが低く、簡易に利用できる特徴量を画像から検出することができる。
すなわち、特徴点の輝度勾配ヒストグラムと、最も輝度勾配ベクトルの分布の異なる近傍位置の輝度勾配ヒストグラムとを用いて特徴量を生成することで、単に特徴点における輝度勾配ヒストグラムのみを特徴量とする場合よりも、特徴量の性能の向上を図ることができる。
具体的には、局所領域内における輝度勾配ベクトルの分布をヒストグラムで表すと、輝度勾配ベクトルの空間的な情報が失われることになる。つまり、複数の輝度勾配ベクトルが与えられた場合、どのような順番で輝度勾配ヒストグラムのビンに輝度勾配ベクトルを振り分けても、結果として得られる輝度勾配ヒストグラムは同一のものになる。逆に言えば、同一の輝度勾配ヒストグラムであっても、その輝度勾配ヒストグラムが得られた局所領域における空間的な輝度勾配ベクトルの分布には、様々な可能性があり得る。
そのため、特徴点における輝度勾配ヒストグラムのみを特徴量とした場合、異なる被写体を同一のものであると誤認識する可能性が大きい。そこで、誤認識の可能性を下げる一つの方法として、特徴点近傍の複数の画素位置で輝度勾配ヒストグラムを算出し、画素位置の空間的な配置順と同じ順序で輝度勾配ヒストグラムを並べることにより、特徴量の性能を上げる方法が考えられる。
このような方法は、「SIFT descriptor」と呼ばれる特徴量の検出方法で用いられているが、特徴量の次元数が大きく増えてしまうという問題がある。この特徴量の次元数を下げるために主成分分析が有効であるということは「PCA-SIFT」と呼ばれる検出方法で示されている。つまり、単に複数の輝度勾配ヒストグラムを並べるだけでは、特徴量の記述法としては冗長であることが分かる。
そこで、画像処理装置11では、特徴点近傍の複数の画素位置(近傍位置)で得られた輝度勾配ヒストグラムのうちの1つを選び、特徴点における輝度勾配ヒストグラムと合わせたものが、冗長性を減らした特徴量とされる。
ここで、特徴点における輝度勾配ヒストグラムをHcとし、複数の近傍位置のうちの選択された近傍位置の輝度勾配ヒストグラムをHnとし、最終的に生成された特徴量を(Hc,Hn)とする。
画像処理装置11では、特徴点の近傍から近傍位置が選択されることから、それらの近傍位置から得られる輝度勾配ヒストグラムには、特徴点の輝度勾配ヒストグラムHcと類似しているものが多いことが予想される。
特徴量(Hc,Hn)を生成する場合に、輝度勾配ヒストグラムHcと、その輝度勾配ヒストグラムHcと類似した、近傍位置の輝度勾配ヒストグラムとを組み合わせて特徴量を生成しても、殆ど情報量が増えない。そのため、輝度勾配ヒストグラムHnとして、輝度勾配ヒストグラムHcと最も似ていないものが選択されることが妥当である。
輝度勾配ヒストグラムは、正規化されており、自然数をNとしてN次元のベクトルで表すことができるので、幾何学的に考えれば輝度勾配ヒストグラムHcはN次元空間の超球上の1点となり、輝度勾配ヒストグラムHnも同様に、N次元空間の超球上の1点となる。
仮に、輝度勾配ヒストグラムHnとして、輝度勾配ヒストグラムHcと類似したものが選択されたとすると、これらの輝度勾配ヒストグラムを示す超球上の2点は、超球上で近傍に位置する。逆に、輝度勾配ヒストグラムHnとして、輝度勾配ヒストグラムHcと類似していないものが選択されたとすると、これらの輝度勾配ヒストグラムを示す超球上の2点は、互いに超球上において離れて位置することになる。
ここで、互いに異なる画像から検出された2つの特徴量(Hc0,Hn0)および特徴量(Hc1,Hn1)が与えられたとする。この場合、輝度勾配ヒストグラムHnとして、輝度勾配ヒストグラムHcと類似したものが選択されると、例え2つの特徴量が異なる被写体から得られたものであっても、超球上において、Hc0,Hn0,Hc1,Hn1の4つの点は、一箇所に集中して存在することになる。そのような場合、2つの特徴量を比較しても、それらの特徴量が得られた特徴点が、同じ被写体上から検出されたか否かを判定することは困難である。
これに対して、輝度勾配ヒストグラムHnとして、輝度勾配ヒストグラムHcと類似していないものが選択されたとする。この場合、2つの特徴量が異なる被写体から得られたものであれば、超球上において、Hc0とHc1が互いに近い位置に存在していたとしても、Hn0およびHn1は、Hc0およびHc1から離れた位置に存在することが期待される。そのため、それらの特徴量が得られた特徴点が、同じ被写体上から検出されたか否かを容易に判定することができるようになる。
したがって、画像処理装置11において、特徴点の輝度勾配ヒストグラムと、最も輝度勾配ベクトルの分布の異なる近傍位置の輝度勾配ヒストグラムと組み合わせることで、より少ない次元数で簡単に利用することができ、かつより確実に被写体を検出できる特徴量を提供することができる。しかも、特徴点における輝度勾配ヒストグラムと、その特徴点近傍のいくつかの画素位置における輝度勾配ヒストグラムとを求めるだけという簡単な処理で、つまり低い計算コストで特徴量を得ることができる。
画像処理装置11により得られる特徴量は、簡単な処理で求めることができ、かつ求めた特徴量を用いて画像認識を行えば、簡易に安定した認識結果を得ることができるので、このような特徴量は、特に、携帯型の機器においての利用に好適である。
上述した一連の処理は、ハードウェアにより実行することもできるし、ソフトウェアにより実行することもできる。一連の処理をソフトウェアにより実行する場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどに、プログラム記録媒体からインストールされる。
図6は、上述した一連の処理をプログラムにより実行するコンピュータのハードウェアの構成例を示すブロック図である。
コンピュータにおいて、CPU(Central Processing Unit)201,ROM(Read Only Memory)202,RAM(Random Access Memory)203は、バス204により相互に接続されている。
バス204には、さらに、入出力インターフェース205が接続されている。入出力インターフェース205には、キーボード、マウス、マイクロホンなどよりなる入力部206、ディスプレイ、スピーカなどよりなる出力部207、ハードディスクや不揮発性のメモリなどよりなる記録部208、ネットワークインターフェースなどよりなる通信部209、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブルメディア211を駆動するドライブ210が接続されている。
以上のように構成されるコンピュータでは、CPU201が、例えば、記録部208に記録されているプログラムを、入出力インターフェース205及びバス204を介して、RAM203にロードして実行することにより、上述した一連の処理が行われる。
コンピュータ(CPU201)が実行するプログラムは、例えば、磁気ディスク(フレキシブルディスクを含む)、光ディスク(CD-ROM(Compact Disc-Read Only Memory),DVD(Digital Versatile Disc)等)、光磁気ディスク、もしくは半導体メモリなどよりなるパッケージメディアであるリムーバブルメディア211に記録して、あるいは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供される。
そして、プログラムは、リムーバブルメディア211をドライブ210に装着することにより、入出力インターフェース205を介して、記録部208にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部209で受信し、記録部208にインストールすることができる。その他、プログラムは、ROM202や記録部208に、あらかじめインストールしておくことができる。
なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。
なお、本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。
本発明を適用した画像処理装置の一実施の形態の構成例を示す図である。 特徴量生成処理を説明するフローチャートである。 特徴点位置における輝度勾配ヒストグラム生成処理を説明するフローチャートである。 特徴点の近傍位置における輝度勾配ヒストグラム生成処理を説明するフローチャートである。 特徴点の近傍位置について説明する図である。 コンピュータの構成例を示すブロック図である。
符号の説明
11 画像処理装置, 22 輝度勾配ヒストグラム生成部, 23 輝度勾配ヒストグラム生成部, 24 輝度勾配ヒストグラム選択部, 25 特徴量生成部, 41 輝度勾配ベクトル算出部, 42 輝度勾配ヒストグラム更新部, 43 代表方向算出部, 44 画像回転部, 45 近傍位置選択部, 46 輝度勾配ベクトル算出部, 47 輝度勾配ヒストグラム更新部

Claims (6)

  1. 画像上の特徴点を含む第1の局所領域における、輝度勾配ベクトルの分布を求める第1の分布算出手段と、
    前記画像上の前記特徴点の近傍にある第2の局所領域における、前記輝度勾配ベクトルの分布を求める第2の分布算出手段と、
    前記第1の局所領域の前記勾配ベクトルの分布と、前記第2の局所領域の前記勾配ベクトルの分布とを比較して、複数の前記第2の局所領域の前記勾配ベクトルの分布のうち、前記第1の局所領域の前記勾配ベクトルの分布と最も分布が異なる前記第2の局所領域の前記勾配ベクトルの分布を選択する選択手段と、
    前記第1の局所領域の前記勾配ベクトルの分布と、前記選択手段により選択された前記第2の局所領域の前記勾配ベクトルの分布とに基づいて、前記特徴点における特徴量を算出する特徴量算出手段と
    を備える画像処理装置。
  2. 前記複数の前記第2の局所領域の中心位置のそれぞれは、前記特徴点を中心とする円の円周上に位置する
    請求項1に記載の画像処理装置。
  3. 前記中心位置のそれぞれは、複数の前記中心位置により、前記円周が等分割される位置とされる
    請求項2に記載の画像処理装置。
  4. 前記輝度勾配ベクトルの分布として、前記輝度勾配ベクトルの方向ごとに求められた、前記方向を有する前記輝度勾配ベクトルの出現頻度を示す輝度勾配ヒストグラムが求められ、
    前記選択手段は、前記第2の局所領域の前記輝度勾配ヒストグラムについて、前記第1の局所領域の前記輝度勾配ヒストグラムとの類似度を求め、前記複数の前記第2の局所領域の前記輝度勾配ヒストグラムのうち、前記類似度により示される類似の度合いの最も低い前記第2の局所領域の前記輝度勾配ヒストグラムを選択する
    請求項1に記載の画像処理装置。
  5. 画像上の特徴点を含む第1の局所領域における、輝度勾配ベクトルの分布を求める第1の分布算出手段と、
    前記画像上の前記特徴点の近傍にある第2の局所領域における、前記輝度勾配ベクトルの分布を求める第2の分布算出手段と、
    前記第1の局所領域の前記勾配ベクトルの分布と、前記第2の局所領域の前記勾配ベクトルの分布とを比較して、複数の前記第2の局所領域の前記勾配ベクトルの分布のうち、前記第1の局所領域の前記勾配ベクトルの分布と最も分布が異なる前記第2の局所領域の前記勾配ベクトルの分布を選択する選択手段と、
    前記第1の局所領域の前記勾配ベクトルの分布と、前記選択手段により選択された前記第2の局所領域の前記勾配ベクトルの分布とに基づいて、前記特徴点における特徴量を算出する特徴量算出手段と
    を備える画像処理装置の画像処理方法であって、
    前記第1の分布算出手段が、前記画像を用いて前記第1の局所領域の前記輝度勾配ベクトルの分布を求め、
    前記第2の分布算出手段が、前記画像を用いて前記第2の局所領域の前記輝度勾配ベクトルの分布を求め、
    前記選択手段が、前記第1の局所領域の前記勾配ベクトルの分布と最も分布が異なる前記第2の局所領域の前記勾配ベクトルの分布を選択し、
    前記特徴量算出手段が、前記特徴点における特徴量を算出する
    ステップを含む画像処理方法。
  6. 画像上の特徴点を含む第1の局所領域における、輝度勾配ベクトルの分布を求め、
    前記画像上の前記特徴点の近傍にある第2の局所領域における、前記輝度勾配ベクトルの分布を求め、
    前記第1の局所領域の前記勾配ベクトルの分布と、前記第2の局所領域の前記勾配ベクトルの分布とを比較して、複数の前記第2の局所領域の前記勾配ベクトルの分布のうち、前記第1の局所領域の前記勾配ベクトルの分布と最も分布が異なる前記第2の局所領域の前記勾配ベクトルの分布を選択し、
    前記第1の局所領域の前記勾配ベクトルの分布と、選択された前記第2の局所領域の前記勾配ベクトルの分布とに基づいて、前記特徴点における特徴量を算出する
    ステップを含む処理をコンピュータに実行させるプログラム。
JP2008216986A 2008-08-26 2008-08-26 画像処理装置および方法、並びにプログラム Expired - Fee Related JP4547639B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2008216986A JP4547639B2 (ja) 2008-08-26 2008-08-26 画像処理装置および方法、並びにプログラム
US12/545,389 US8369621B2 (en) 2008-08-26 2009-08-21 Image processing apparatus, image processing method and program
CN2009101684924A CN101661622B (zh) 2008-08-26 2009-08-26 图像处理装置和图像处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008216986A JP4547639B2 (ja) 2008-08-26 2008-08-26 画像処理装置および方法、並びにプログラム

Publications (2)

Publication Number Publication Date
JP2010055195A JP2010055195A (ja) 2010-03-11
JP4547639B2 true JP4547639B2 (ja) 2010-09-22

Family

ID=41725552

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008216986A Expired - Fee Related JP4547639B2 (ja) 2008-08-26 2008-08-26 画像処理装置および方法、並びにプログラム

Country Status (3)

Country Link
US (1) US8369621B2 (ja)
JP (1) JP4547639B2 (ja)
CN (1) CN101661622B (ja)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102740756B (zh) * 2010-06-30 2014-12-31 奥林巴斯医疗株式会社 图像处理装置和图像处理方法
JP5652227B2 (ja) * 2011-01-25 2015-01-14 ソニー株式会社 画像処理装置および方法、並びにプログラム
JP5843474B2 (ja) * 2011-05-09 2016-01-13 キヤノン株式会社 画像処理装置、画像処理方法、及び、プログラム
JP5801598B2 (ja) * 2011-05-09 2015-10-28 キヤノン株式会社 画像処理装置、画像処理方法、及び、プログラム
JP6168303B2 (ja) * 2012-01-30 2017-07-26 日本電気株式会社 情報処理システム、情報処理方法、情報処理装置およびその制御方法と制御プログラム、通信端末およびその制御方法と制御プログラム
US9418314B2 (en) * 2012-01-30 2016-08-16 Nec Corporation Information processing apparatus and control method and control program thereof, and communication terminal and control method and control program thereof
US8655029B2 (en) * 2012-04-10 2014-02-18 Seiko Epson Corporation Hash-based face recognition system
ITTO20120602A1 (it) 2012-07-09 2014-01-10 Sisvel Technology Srl Method for transforming an image descriptor based on a gradient histogram and relative image processing apparatus.
JP5464244B2 (ja) 2012-08-24 2014-04-09 富士ゼロックス株式会社 画像処理装置、プログラム及び画像処理システム
JP5651659B2 (ja) * 2012-08-31 2015-01-14 株式会社東芝 物体検出システムおよびプログラム
JP5533988B2 (ja) * 2012-11-30 2014-06-25 株式会社デンソーアイティーラボラトリ 画像処理システム
JP6017335B2 (ja) * 2013-02-06 2016-10-26 株式会社東芝 パターン認識装置、その方法、及び、そのプログラム
JP6225460B2 (ja) * 2013-04-08 2017-11-08 オムロン株式会社 画像処理装置、画像処理方法、制御プログラムおよび記録媒体
JP2014225108A (ja) * 2013-05-16 2014-12-04 ソニー株式会社 画像処理装置、画像処理方法およびプログラム
JP6234107B2 (ja) * 2013-08-08 2017-11-22 オリンパス株式会社 特徴量生成装置、特徴量生成方法、およびプログラム
JP6278757B2 (ja) * 2014-03-07 2018-02-14 オリンパス株式会社 特徴量生成装置、特徴量生成方法、およびプログラム
JP6253467B2 (ja) 2014-03-24 2017-12-27 東芝アルパイン・オートモティブテクノロジー株式会社 画像処理装置および画像処理プログラム
JP6303090B2 (ja) 2014-03-24 2018-04-04 アルパイン株式会社 画像処理装置および画像処理プログラム
JP6473571B2 (ja) 2014-03-24 2019-02-20 アルパイン株式会社 Ttc計測装置およびttc計測プログラム
US9798950B2 (en) 2015-07-09 2017-10-24 Olympus Corporation Feature amount generation device, feature amount generation method, and non-transitory medium saving program
US10474672B2 (en) * 2015-08-25 2019-11-12 Schlafender Hase GmbH Software & Communications Method for comparing text files with differently arranged text sections in documents
US20190205693A1 (en) * 2017-12-28 2019-07-04 MorphoTrak, LLC Scale-Invariant Feature Point Extraction in Edge Map
US11238577B2 (en) * 2019-04-05 2022-02-01 Project Giants, Llc Video dynamic range analysis
CN113642552B (zh) * 2020-04-27 2024-03-08 上海高德威智能交通系统有限公司 一种图像中目标对象的识别方法、装置、系统及电子设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005074562A (ja) * 2003-08-29 2005-03-24 Sony Corp ロボット装置、ロボット装置の制御方法、及び記録媒体
JP2008077626A (ja) * 2006-03-31 2008-04-03 Sony Corp 物体認識装置、物体認識方法、物体認識プログラム、特徴量登録装置、特徴量登録方法、及び特徴量登録プログラム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2272285B (en) 1992-06-10 1997-01-15 Secr Defence Method for digitally processing images to determine the position of edges and/or corners therein for guidance of unmanned vehicle
US6711293B1 (en) * 1999-03-08 2004-03-23 The University Of British Columbia Method and apparatus for identifying scale invariant features in an image and use of same for locating an object in an image
KR100450793B1 (ko) * 2001-01-20 2004-10-01 삼성전자주식회사 영역 분할된 영상의 영역 특징치 정합에 기초한객체추출장치 및 그 방법
JP4595733B2 (ja) * 2005-08-02 2010-12-08 カシオ計算機株式会社 画像処理装置
JP4196302B2 (ja) * 2006-06-19 2008-12-17 ソニー株式会社 情報処理装置および方法、並びにプログラム
JP2008191816A (ja) * 2007-02-02 2008-08-21 Sony Corp 画像処理装置、および画像処理方法、並びにコンピュータ・プログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005074562A (ja) * 2003-08-29 2005-03-24 Sony Corp ロボット装置、ロボット装置の制御方法、及び記録媒体
JP2008077626A (ja) * 2006-03-31 2008-04-03 Sony Corp 物体認識装置、物体認識方法、物体認識プログラム、特徴量登録装置、特徴量登録方法、及び特徴量登録プログラム

Also Published As

Publication number Publication date
JP2010055195A (ja) 2010-03-11
US20100054611A1 (en) 2010-03-04
US8369621B2 (en) 2013-02-05
CN101661622A (zh) 2010-03-03
CN101661622B (zh) 2012-02-15

Similar Documents

Publication Publication Date Title
JP4547639B2 (ja) 画像処理装置および方法、並びにプログラム
US9552642B2 (en) Apparatus and method for tracking object using feature descriptor, and apparatus and method for removing garbage feature
US8582889B2 (en) Scale space normalization technique for improved feature detection in uniform and non-uniform illumination changes
JP2014056572A (ja) 勾配方位のヒストグラムによるテンプレート・マッチング
US10204284B2 (en) Object recognition utilizing feature alignment
US10832030B2 (en) Method and apparatus of selecting candidate fingerprint image for fingerprint recognition
JP2015001982A (ja) 画像類似度確定装置及び方法並びに画像特徴取得装置及び方法
Yang et al. Large-scale and rotation-invariant template matching using adaptive radial ring code histograms
Ouamane et al. Robust multimodal 2D and 3D face authentication using local feature fusion
JP2018018330A (ja) データ検索プログラム、データ検索方法およびデータ検索装置
KR20170066014A (ko) 시점 변화에 강인한 특징점 정합 방법
EP2695106B1 (en) Feature descriptor for image sections
JP2011221689A (ja) 学習装置、学習方法、認識装置、認識方法、およびプログラム
Zhou et al. Person re-identification based on nonlinear ranking with difference vectors
JP5290915B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP4983539B2 (ja) 情報処理装置および方法、並びにプログラム
US20110150344A1 (en) Content based image retrieval apparatus and method
Tang et al. Modified sift descriptor for image matching under interference
JP2015007919A (ja) 異なる視点の画像間で高精度な幾何検証を実現するプログラム、装置及び方法
Tao et al. Research Progress of the Scale Invariant Feature Transform (SIFT) Descriptors.
JP6278757B2 (ja) 特徴量生成装置、特徴量生成方法、およびプログラム
El-Mashad et al. A more robust feature correspondence for more accurate image recognition
KR101627974B1 (ko) 영상 블러에 강인한 영상 특징 기술자 생성 방법 및 장치
Mohammed et al. Upright FAST-Harris Filter
JP6095559B2 (ja) 特徴抽出装置、方法、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100216

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100603

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100610

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100623

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130716

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees