JP6543062B2 - 画像処理装置、画像処理方法 - Google Patents

画像処理装置、画像処理方法 Download PDF

Info

Publication number
JP6543062B2
JP6543062B2 JP2015060016A JP2015060016A JP6543062B2 JP 6543062 B2 JP6543062 B2 JP 6543062B2 JP 2015060016 A JP2015060016 A JP 2015060016A JP 2015060016 A JP2015060016 A JP 2015060016A JP 6543062 B2 JP6543062 B2 JP 6543062B2
Authority
JP
Japan
Prior art keywords
image
feature
feature amount
pixel
image processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015060016A
Other languages
English (en)
Other versions
JP2016181051A (ja
Inventor
昌弘 松下
昌弘 松下
椎山 弘隆
弘隆 椎山
日出来 空門
日出来 空門
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2015060016A priority Critical patent/JP6543062B2/ja
Priority to US15/075,736 priority patent/US9916521B2/en
Publication of JP2016181051A publication Critical patent/JP2016181051A/ja
Application granted granted Critical
Publication of JP6543062B2 publication Critical patent/JP6543062B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/64Three-dimensional objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • G06T3/18
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/50Depth or shape recovery
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/1607Correcting image deformation, e.g. trapezoidal deformation caused by perspective

Description

本発明は、画像から特徴量を算出するための技術に関するものである。
画像の局所的な特徴量(局所特徴量)を用いて、類似画像を検索する方法が提案されている。この方法では、まず、画像から特徴的な点(局所特徴点)を抽出する(例えば、非特許文献1参照)。次に、該局所特徴点とその周辺の画像情報とに基づいて、該局所特徴点に対応する特徴量(局所特徴量)を計算する(例えば、非特許文献2参照)。
局所特徴量を利用する手法においては、局所特徴量を、平面内回転不変、拡大・縮小不変となる複数の要素で構成される情報として定義する。これにより、画像を平面内で回転させたり、拡大又は縮小させたりした場合であっても、検索を可能にする。局所特徴量は一般的にベクトルとして表現される。
平面内回転不変の局所特徴量抽出のために、例えば非特許文献2では、局所特徴点周辺の局所領域の画素パターンから主方向を算出し、局所特徴量算出時に該主方向を基準に局所領域を平面内で回転させて方向の正規化を行う。また、拡大・縮小不変の局所特徴量を算出するために、異なるスケールの画像を内部で生成し、各スケールの画像からそれぞれ局所特徴点の抽出と局所特徴量の算出を行う。ここで、内部で生成した一連の異なるスケールの画像集合は、一般的にスケールスペースと呼ばれる。更に、平面内ではない3次元空間内で物体を回転(面外回転)させた画像の検索を可能にするための改良研究も行われている(例えば、非特許文献3参照)。
上述の方式により、1枚の画像から複数の局所特徴点が抽出される。局所特徴量を用いた画像検索では、それぞれの局所特徴点から算出した局所特徴量同士の比較を行うことによりマッチングを行う。多く利用されている投票方式(例えば、特許文献1参照)は、比較元画像から抽出された、各特徴点の局所特徴量に類似する特徴量を持つ特徴点が登録画像(以下、比較先画像とも言う)に存在すれば、その比較先の登録画像に対して1票を投票する。その投票数の多い登録画像ほど比較元画像と類似するとするものである。
特開2000-57377号公報
C.Harris and M.J. Stephens,"A combined corner and edge detector," In Alvey Vision Conference,pages 147-152, 1988. David G. Lowe, "Distinctive Image Features from Scale-Invariant Keypoints," International Journal of Computer Vision, 60, 2 (2004), pp.91-110. Jean-Michel Morel and Guoshen Yu, "ASIFT: A New Framework for Fully Affine Invariant Image Comparison", SIAM J. Imaging Sciences, Vol. 2, No. 2, pp. 438?469, 2009. J.J.Koenderink and A.J.van Doorn, "Representation of local geometry in the visual system," Riological Cybernetics, vol.55, pp.367-375, 1987.
非特許文献2に記載の局所特徴量を用いて面外回転した画像の検索を行うと、30度程度までの面外回転した画像の検索は可能であるが、それ以上に面外回転している画像の検索精度は低くなるという課題があった。
また、非特許文献3に記載の方法では、面外回転を想定した多数の画像変換を行い、それぞれの画像から局所特徴量を抽出することで、非特許文献2の許容範囲よりも大きな面外回転をしている画像の検索も可能にしている。しかしながら、多数の画像変換を行うため、処理速度が遅くなるという課題があった。また、多数の画像変換を行った画像のそれぞれから局所特徴量を抽出するため、局所特徴量数が多くなり、データ登録サイズが大きくなるという課題があった。また、結果的にノイズとなる局所特徴量も多くなり、誤検出により検索精度を下げる可能性があった。
図1は、局所特徴量を算出する際に使用する画素範囲の一例を説明する図である。図1を用いて、面外回転している画像の検索精度が低くなる原因の説明を行う。図1(a)は、物体を正面から撮影した画像の模式図であり、図1(b)は、図1(a)の状態から物体を反時計回りに60度回転させ、同じ場所から撮影した画像の模式図である。ここで、101は図1(a)の画像から抽出された局所特徴点の1つを中心とし、その局所特徴点から局所特徴量を算出する際に使用する画素範囲の一例を示したものである。102は同様に図1(b)の画像から抽出された局所特徴点の1つを中心とし、その局所特徴点から局所特徴量を算出する際に使用する画素範囲の一例を示したものである。また、図1(c)は、図1(a)の画素範囲101の周辺を拡大した図であり、図1(d)は、図1(b)の画素範囲102の周辺を拡大した図である。
ここで、103と104は、「B」という文字の左下の角から抽出された局所特徴点を中心とする局所特徴量算出範囲である。局所特徴量算出範囲103の左端は「A」の文字に少しかかっており、右端は「B」の文字のほぼ中間である。一方、局所特徴量算出範囲104の左端は「A」の文字の半分以上にかかっており、右端は「B」の右端と同程度である。局所特徴量算出範囲103と局所特徴量算出範囲104とでは、ほぼ同じ個所から局所特徴点が抽出されているにもかかわらず、局所特徴量算出に利用される画素が大きく異なっていることがわかる。これにより、局所特徴量が変質し、画像検索の精度を低下させている。このように、従来の平面内回転不変の局所特徴量では、面外回転させた画像を高精度に検索することは難しかった。
本発明はこのような問題に鑑みてなされたものであり、面外回転の影響を受けにくい局所特徴量を算出するための技術を提供する。本発明は更に、面外回転している画像間の照合、検索が可能な技術を提供する。
本発明の一様態は、画素の奥行き値が連続的に変化している画像領域を含む入力画像から特徴点を抽出する抽出手段と、
前記特徴点の周囲の画素の奥行き値を正規化するような変換を正規化変換とし、前記特徴点の画素位置を該正規化変換によって変換した変換済み画素位置の周辺画素位置に該正規化変換によって変換される前記入力画像上の画素位置を特定し、該特定した画素位置における画素若しくはその周辺の画素の画素値、に基づいて、特徴量算出用の画像を生成する生成手段と、
前記生成手段によって生成された画像から特徴量を算出する算出手段と
を備え
前記生成手段は、前記特徴点の周囲の画素の奥行き値の差異に基づいて、前記特徴量算出用の画像を生成するか否かを決定することを特徴とする。
本発明の構成によれば、面外回転の影響を受けにくい局所特徴量を算出することが可能となる。また、本発明の構成によれば、面外回転している画像間の照合、検索が可能となる。
局所特徴量を算出する際に使用する画素範囲の一例を説明する図。 コンピュータ装置のハードウェア構成例を示すブロック図。 画像処理装置の機能構成例を示すブロック図。 画像から特徴量を算出するために行う処理のフローチャート。 ステップS402における処理の詳細を示すフローチャート。 ステップS502における処理の具体例を示す図。 ステップS408における処理の詳細を示すフローチャート。 ステップS702の処理を説明する図。 ステップS411の処理による画像の変換例の模式図。 画像処理装置の機能構成例を示すブロック図。 画像から特徴量を算出するために行う処理のフローチャート。 ステップS1111の処理による特徴量算出領域の設定例の模式図。 画像から特徴量を算出するために行う処理のフローチャート。 画像処理装置の機能構成例を示すブロック図。 画像に固有の情報及び該画像から算出した局所特徴量の登録処理のフローチャート。 ステップS1504における量子化について説明する図。 記憶部1409における特徴量ID及び画像IDの管理例を示す図。 画像検索処理のフローチャート。 ステップS1805における処理の詳細を示すフローチャート。
以下、添付図面を参照し、本発明の好適な実施形態について説明する。なお、以下説明する実施形態は、本発明を具体的に実施した場合の一例を示すもので、特許請求の範囲に記載した構成の具体的な実施例の1つである。
[第1の実施形態]
本実施形態では、画素の奥行き値が連続的に変化している画像領域を含む入力画像から特徴点(局所特徴点)を抽出し、特徴点の周囲の画素の奥行き値を正規化するような変換を正規化変換とし、特徴点の画素位置を該正規化変換によって変換した変換済み画素位置の周辺画素位置に該正規化変換によって変換される入力画像上の画素位置を特定し、該特定した画素位置における画素若しくはその周辺の画素の画素値、に基づいて、特徴量算出用の画像を生成し、該生成された画像から特徴量を算出する画像処理装置の一例について説明する。このような画像処理装置は、例えば、物体の平面から抽出された局所特徴点における局所特徴量を算出する場合に有効である。
なお、この「画素の奥行き値が連続的に変化している画像領域」とは、入力画像の一部であっても良いし、全部であっても良い。例えば、ある画像にこのような画像領域が含まれていた場合に、該画像領域から抽出した部分画像を上記の入力画像としても良い。
先ず、本実施形態に係る画像処理装置の機能構成例について、図3のブロック図を用いて説明する。
画像入力部301は、原画像を入力する。なお、原画像には、該原画像を構成する各画素の奥行き値を表す情報が含まれているものとして説明する。
特徴点抽出部302は、画像入力部301が入力した原画像の輝度成分を表す輝度成分画像を生成すると共に、該輝度成分画像を再帰的に複数回縮小することで複数枚の縮小画像を生成し、該輝度成分画像及び該複数枚の縮小画像のそれぞれから局所特徴点を抽出する。
画像生成部303は、特徴点抽出部302が抽出したそれぞれの局所特徴点について、該局所特徴点を含む画像領域に対応する「奥行き値が正規化された画素群による画像」を生成する。
算出部304は、画像生成部303によって生成された画像から特徴量を算出し、該算出した特徴量を出力する。特徴量の出力先については特定の出力先に限るものではなく、記憶部305に対して出力しても構わないし、外部のメモリに対して出力しても構わないし、該特徴量を用いて処理を行う外部の機器に対して出力しても構わない。
記憶部305は、画像入力部301、特徴点抽出部302、画像生成部303、算出部304のそれぞれが動作のために使用するメモリであって、例えば、算出部304は、算出した特徴量を記憶部305に格納する。
次に、本実施形態に係る画像処理装置が、画像から特徴量を算出するために行う処理について、同処理のフローチャートを示す図4を用いて説明する。
<ステップS401>
画像入力部301は、外部から入力された原画像を記憶部305に格納する。なお、原画像の取得元については外部に限るものではなく、例えば、画像処理装置が有する不図示の内部メモリから原画像を取得するようにしても構わない。
<ステップS402>
特徴点抽出部302は、ステップS401において記憶部305に格納された原画像を読み出し、該読み出した原画像に基づいて局所特徴点を抽出する。ステップS402における処理の詳細について、同処理のフローチャートを示す図5を用いて説明する。
<ステップS501>
特徴点抽出部302は、記憶部305に格納された原画像を読み出し、該原画像を構成する各画素の輝度成分を表す輝度成分画像を生成する。すなわち、輝度成分画像上の画素位置(x、y)における輝度成分(画素値)は、原画像上の画素位置(x、y)における画素の輝度成分(輝度値)である。
<ステップS502>
特徴点抽出部302は、ステップS501で生成した輝度成分画像を予め設定された縮小率p(0<p<1)に従って再帰的に規定回数だけ繰り返して縮小することで、輝度成分画像に対する複数枚の縮小画像を生成する。ここまでの処理により、オリジナルのサイズの画像(輝度成分画像)から段階的に縮小した、オリジナルの画像を含めてn(nは2以上の整数)枚の画像を生成する。
ステップS502における処理の具体例を図6に示す。図6では、倍率pが「2の−(1/4)乗」、画像の枚数nが「9」である。もちろん、倍率pは必ずしも「2の−(1/4)乗」で無くとも良い。図6において、601はステップS501で生成された輝度成分画像である。602は輝度成分画像601から倍率pに従って再帰的に4回の縮小処理を行って得られた縮小画像である。603は輝度成分画像601から倍率pに従って8回縮小された縮小画像である。
この例では、縮小画像602は輝度成分画像601の縦横サイズを1/2に縮小した画像となり、縮小画像603は輝度成分画像601の縦横サイズを1/4に縮小した画像となる。なお、画像を縮小する方法については、本実施形態では、線形補間による縮小方法により縮小画像を生成するものとする。しかし、縮小画像の生成方法については特定の方法に限るものではなく、如何なる方法を採用しても構わない。
<ステップS503>
特徴点抽出部302は、輝度成分画像及び複数枚の縮小画像のそれぞれを入力画像とし、該入力画像から、画像の回転があってもロバスト(robust)に抽出されるような局所的な特徴点(局所特徴点)を抽出する。この局所特徴点の抽出方法として、本実施形態ではHarris作用素を用いる(非特許文献1参照)。
具体的には、Harris作用素を作用させて得られた出力画像H上の画素について、該画素及び該画素の8近傍にある画素(合計9画素)の画素値を調べる。そして、該画素が局所極大になる(該9画素の中で該画素の画素値が最大になる)点を局所特徴点として抽出する。ここで、該画素が局所極大になったときでも、該画素の値がしきい値以下の場合には局所特徴点として抽出しないようにする。
なお、局所特徴点を抽出可能な方法であれば、上述のHarris作用素による特徴点抽出方法に限らず、どのような特徴点抽出方法でも適用可能である。
<ステップS403>
ステップS402の処理が完了した時点で、輝度成分画像及び複数枚の縮小画像から抽出した局所特徴点群が得られているので、画像生成部303は、この局所特徴点群のうち未選択のうちの1つを処理対象特徴点として選択する。また、以下では、処理対象特徴点が抽出された抽出元の画像を対象画像と呼称する。例えば、処理対象特徴点が輝度成分画像から抽出されたものである場合には、対象画像は輝度成分画像であるし、処理対象特徴点が複数枚の縮小画像のうちの1つから抽出されたものである場合には、対象画像は該1つの縮小画像である。
<ステップS404>
画像生成部303は、処理対象特徴点の周囲において直線上に並んでいない3点を決定し、該決定した3点のそれぞれの画像座標を取得する。画像座標とは、例えば、対象画像の左上隅の位置を原点とし、水平方向にx座標、垂直方向にy座標を設定することで定義される座標系における座標のことであり、各画素の対象画像上における座標はこの画像座標によって表される。
ここで、「処理対象特徴点の周囲」とは、処理対象特徴点を中心とする領域であって、そのサイズが、後述する特徴量算出領域のサイズに基づいて予め設定されたサイズ、若しくは予め定められた固定サイズ、であるような領域である。
また、ここで決定する3点とは、局所特徴点を含んでいても良いが、「処理対象特徴点の周囲において直線上に並んでいない3点」であれば、如何なる点であっても構わない。すなわち、「処理対象特徴点の周囲において直線上に並んでいない3点」とは、換言すれば、三角形の頂点となりうる3点である。ステップS404で決定する3点を結んでできる図形が直線にならずに三角形を成していれば、数学的に後の処理は可能であるが、誤差等の影響を軽くするため、お互いにある程度離れている3点を選ぶことが好ましい。また、一旦、3点よりも多い数の点を抽出し、何らかの基準に従ってそれらの点の中から3点を選ぶようにしてもよい。例えば、奥行き値が互いにある程度離れている3点を選ぶようにするなどの方法がある。また、3点の中に、処理対象特徴点自身が含まれているようにしてもよい。
以下では、ステップS404で決定した3点の画像座標をそれぞれ、(x,y)、(x,y)、(x,y)と表記する。なお、3点をまとめて、その画像座標を(x、y)(n=1,2,3)のように表記する場合もある。
<ステップS405>
画像生成部303は、ステップS404で決定した3点の画素における奥行き値を取得する。以下では、画像座標(x,y)における画素の奥行き値をz、画像座標(x,y)における画素の奥行き値をz、画像座標(x,y)における画素の奥行き値をzと表記する。
<ステップS406>
画像生成部303は、z〜zのうち最大の奥行き値zmax、最小の奥行き値zminを特定し、Δz=zmax−zminを計算する。そして画像生成部303は、Δzが所定値以上であるか否かを判断する。この判断の結果、Δzが所定値以上であれば、処理はステップS408に進み、Δzが所定値未満であれば、処理はステップS407に進む。
なお、ステップS406における判断基準は、Δzと所定値との大小関係に限るものではなく、3点の奥行き値の分散や標準偏差のような統計情報を利用して判断するようにしてもよい。その際、3点の奥行き値を用いるのではなく、3点より多くの点の奥行き値を用いて判断し、その後に3点を選別するようにしてもよい。
<ステップS407>
処理がステップS407に進んだということは、ステップS404で決定した3点における画素の奥行き値の差異が小さいということになり、そのような場合には、処理対象特徴点周辺の領域(後述する特徴量算出領域)は、面外回転の影響を受けにくい局所特徴量を算出することができる領域となる。このような場合、以下に説明するような、「奥行き値が正規化された画素群による画像」を生成する必要はない。そこで、画像生成部303は、対象画像を特徴量算出画像に設定する。
<ステップS408>
画像生成部303は、z〜zを同じ値にする(正規化)ための変換行列Tを求める。ステップS408における処理の詳細について、図7のフローチャートを用いて説明する。
<ステップS701>
画像生成部303は、透視投影逆変換により、対象画像上における上記の3点に対応する現実空間上の3点の座標に変換する(対象画像上の2次元座標を3次元座標に変換する)。対象画像は、3次元空間上の物体をある投影面に対して投影してできたものである。視点(例えば、画像を撮像した撮像画像の視点位置)から投影面までの距離をdとすると、対象画像上における上記の3点に対応する現実空間上の3点の座標(xrn、yrn、zrn)(n=1,2,3)は以下の式(1)〜(3)に従って求めることが出来る。
Figure 0006543062
<ステップS702>
画像生成部303は、対象画像上における上記の3点に対応する現実空間上の3点を含む平面の法線ベクトルVを求める。図8は、対象画像上における上記の3点に対応する現実空間上の3点(801,802,803)、3点(801,802,803)を含む平面804、該平面804の法線ベクトルV805、の一例を示す図である。
法線ベクトルV=(v、v、v)とすると、v、v、vのそれぞれは、3点(801,802,803)の3次元座標(xr1、yr1、zr1)、(xr2、yr2、zr2)、(xr3、yr3、zr3)を用いて以下の式(4)〜(6)に従って求めることが出来る。
Figure 0006543062
<ステップS703>
画像生成部303は、法線ベクトルVをZ軸(投影面から奥行き方向に規定されている軸であり、奥行き値はZ軸上の値)に重ねるようにする変換行列Tを求める。ベクトルVをZ軸と重なるように変換した場合、対象画像上における上記の3点に対応する現実空間上の3点を含む平面は、投影面(対象画像)と平行な状態に変換されることになり、その結果、変換後の平面上の上記の3点のz座標値は全て同じ値(投影面から変換後の平面までの距離)となる。図8の場合、ベクトルVをZ軸と重なるように変換した場合、平面804は、XY平面(投影面)と平行な状態に変換されることになる。ステップS703では、このような変換、すなわち、上記の3点の奥行き値を正規化する変換を実現する変換行列Tを求める。以下では、変換行列Tを求めるための具体的な処理について説明する。
ここでは、法線ベクトルVとZ軸方向のベクトルとの法線ベクトルPを回転軸としてθ回転させることにより、法線ベクトルVとZ軸とを重ねる。ここでθを、座標変換するときの変換量という。
まず、以下の式(7)〜(9)により、法線ベクトルVの単位ベクトルV1(v1x、v1y、v1z)を求める。
Figure 0006543062
次に、単位ベクトルV1とZ軸方向の単位ベクトルZ1(0,0,1)との法線ベクトルP(p、p、p)を求める。ベクトル間の法線ベクトルはベクトルの外積で表わされるので、以下の式(10)〜(12)で求められる。
Figure 0006543062
更に、以下の式(13)〜(15)により、ベクトルPの単位ベクトルP1(p1x、p1y、p1z)を求める。
Figure 0006543062
次に、以下の式(16)〜(18)により、単位ベクトルP1とZ軸方向の単位ベクトルZ1との法線ベクトルQ(q、q、q)を求める。
Figure 0006543062
更に、以下の式(19)〜(21)により、ベクトルQの単位ベクトルQ1(q1x、q1y、q1z)を求める。
Figure 0006543062
ここで、単位ベクトルQ1、P1、Z1を基底ベクトルとした正規直交座標が定められる。この座標空間上で、単位ベクトルP1を回転軸としてθ回転させることにより、法線ベクトルVをZ軸と一致させる。その際の変換行列Rは、以下の式(22)で表される。
Figure 0006543062
また、単位ベクトルQ1、P1、Z1を基底ベクトルとした正規直交座標の座標系をXYZ座標系に変換する行列をSとし、その逆行列をS−1とすると、それらの行列は、以下の式(23)、(24)で表される。
Figure 0006543062
然るに変換行列Tは、このような行列S,S−1,Rを用いて以下の式(25)のように表すことが出来る。また、このような変換行列Tを用いれば、式(26)に示す如く、座標(xrn、yrn、zrn)を座標(xtn、ytn、ztn)に変換することができる。座標(xtn、ytn、ztn)は、変換後の平面上の上記の3点の座標である。
Figure 0006543062
<ステップS409>
画像生成部303は、変換量θが所定量θTH以上であるか否かを判断する。この判断の結果、変換量θが所定量θTH以上であれば、処理はステップS410に進み、変換量θが所定量θTH未満であれば、処理はステップS411に進む。
<ステップS410>
画像生成部303は、上記の変換行列Tを再度計算するのであるが、その際、上記のθを所定量θTHとして変換行列Tを再計算する。変換量θは、奥行き方向に勾配のある部分が正面を向くように回転させる量であり、回転量が大きい場合は、画素補間量が多くなり、画質が低下する。したがって、ステップS409及びS410により、画素補間量が多くなりすぎないように制限を設ける。しかし、ステップS410の処理は省略しても構わず、その場合、ステップS409の処理を省き、ステップS408の処理の後はステップS411に処理が進むようにすればよい。
<ステップS411>
画像生成部303は、処理対象特徴点を中心とする領域内の画像を変換行列Tによって変換した画像を変換画像として生成する。この処理では先ず、処理対象特徴点の画像座標(x、y)と処理対象特徴点の奥行き値zとを用いて上記の式(1)〜(3)を用いた透視投影逆変換を行うことで(x、y、zをそれぞれx、y、zと読み替える)3次元座標(xr、yr、zr)を求め、該3次元座標(xr、yr、zr)を変換行列Tを用いて変換した3次元座標(xt、yt、zt)求め、該3次元座標(xt、yt、zt)を用いて、投影面への透視投影変換を行うことで、該3次元座標(xt、yt、zt)に対応する対象画像上の2次元座標(x’、y’)に変換する。この透視投影変換は、以下の式(27)、(28)に従って行われる。
Figure 0006543062
そして、変換画像の中心画素位置を(x’、y’)とした場合に、該中心画素位置における画素値に、対象画像において処理対象特徴点における画素値をセットする。
そして、変換画像において(x’、y’)以外の各画素位置ptについて、対象画像上の対応する画素位置pqを、画素位置ptに対して(x’、y’)を求めるための上記の変換の逆変換を行うことで求め、画素位置ptにおける画素値として、対象画像における画素位置pqの画素値をセットする。なお、画素位置pqが非整数である場合には、その周辺の画素の画素値から平均和等の補間により求めた画素値をセットする。
図9は、ステップS411の処理による画像の変換例の模式図である。図9(a)に示した画像は、対象物を正面から撮像したものであって、3点における奥行き値に差がないものである。然るにこのような場合には、図9(a)の画像そのものを特徴量算出画像とする。図9(c)に示した画像903は、処理対象特徴点の周囲901、すなわち、特徴量算出領域内の画像である。図9(b)に示した画像は、対象物が撮像装置に対して反時計回りに60度回転した状態で撮像されたものである。このような場合、処理対象特徴点の周囲902における3点の奥行き値には差があるため、本実施形態では、これらの差を軽減するように周囲902内の画像を変換する。この変換したものが図9(d)に示した画像904である。3点における奥行き値を軽減するために変換した画像を生成した場合には、この生成した画像そのものが特徴量算出領域となる。
このように、処理対象特徴点の周囲における3点の奥行き値に差があろうとなかろうと、図9(c)、(d)に示す如く、特徴量を抽出する対象となる画像は類似したものとなる。
<ステップS412>
算出部304は、ステップS411において生成した変換画像を特徴量算出画像に設定する。
<ステップS413>
算出部304は、特徴量算出画像全体に特徴量算出領域を設定する。もちろん、特徴量算出画像の一部に特徴量算出領域を設定しても構わない。この特徴量算出領域の範囲は、従来の特徴量算出領域と同じ範囲である。
<ステップS414>
算出部304は、特徴量算出領域内の画像から、平面内の画像の回転があっても不変となるように定義された特徴量(局所特徴量)を算出する。この局所特徴量の算出方法として、本実施形態ではLocal Jet及びそれらの導関数の組み合わせを用いる(非特許文献4参照)。
具体的には、以下の式(29)により局所特徴量Vを算出する。
Figure 0006543062
ただし、式(29)の右辺で用いている変数は、以下に示す式(30)〜式(35)で定義される。ここで、式(30)右辺のG(x,y)はガウス関数、I(x,y)は画像座標(x,y)における画素値であり、“*”は畳み込み演算を表す記号である。また、式(31)は式(30)で定義された変数Lのxに関する偏導関数、式(32)は変数Lのyに関する偏導関数である。式(33)は式(31)で定義された変数Lxのyに関する偏導関数、式(34)は式(31)で定義された変数Lxのxに関する偏導関数、式(35)は式(32)で定義されたLyのyに関する偏導関数である。
Figure 0006543062
なお、局所特徴量を算出可能な方法であれば、上述したような特徴量算出方法に限らず、どのような特徴量算出方法でも適用可能である。例えば、SIFT特徴量、SURF特徴量などである。SIFT特徴量は、局所特徴点周辺の所定範囲を4×4の16ブロックに分割し、それぞれのブロックについて、それぞれ45度ずつ異なる8方向の勾配方向ヒストグラムを作成し、その128次元の特徴ベクトルを局所特徴量としている。
そして算出部304は、求めた局所特徴量を記憶部305等の適当な出力先に対して出力する。
<ステップS415>
画像生成部303は、輝度成分画像及び複数枚の縮小画像から抽出した局所特徴点群の全てを選択したか否かを判断する。この判断の結果、全てを選択した場合には、図4のフローチャートに従った処理は終了し、未選択の局所特徴点が未だ残っている場合には、処理はステップS416に進む。
<ステップS416>
画像生成部303は、輝度成分画像及び複数枚の縮小画像から抽出した局所特徴点群のうち未選択のうちの1つを処理対象特徴点として選択する。そして処理はステップS404に移行する。
このように、本実施形態によれば、面外回転の影響を受けにくい局所特徴量を算出することが可能となる。
[第2の実施形態]
本実施形態では、画素の奥行き値が連続的に変化している画像領域を含む入力画像から特徴点(局所特徴点)を抽出し、特徴点の周囲の画素の奥行き値を正規化するような変換を正規化変換とし、該正規化変換によって特徴点の画素位置が変換される画素位置を特定し、該特定した画素位置を囲む領域に該正規化変換によって変換される入力画像上の領域を特徴量算出領域として特定し、該特徴量算出領域から特徴量を算出する画像処理装置の一例について説明する。すなわち、第1の実施形態では、処理対象特徴点の周囲の3点における奥行き値を正規化するように画像の変換を行って変形画像を生成したが、本実施形態では、このような画像の変形は行わずに、処理対象特徴点に対して設定された特徴量算出領域の形状を、処理対象特徴点の周囲の3点における奥行き値を正規化するように変形する。以下では、第1の実施形態との差分について重点的に説明し、以下で特に触れない限りは第1の実施形態と同様であるものとする。
先ず、本実施形態に係る画像処理装置の機能構成例について、図10のブロック図を用いて説明する。
画像入力部1001は、原画像を入力する。なお、原画像には、該原画像を構成する各画素の奥行き値を表す情報が含まれているものとして説明する。
特徴点抽出部1002は、画像入力部1001が入力した原画像の輝度成分を表す輝度成分画像を生成すると共に、該輝度成分画像を再帰的に複数回縮小することで複数枚の縮小画像を生成し、該輝度成分画像及び該複数枚の縮小画像のそれぞれから局所特徴点を抽出する。
領域設定部1003は、特徴点抽出部1002が抽出したそれぞれの局所特徴点について特徴量算出領域を設定する。
算出部1004は、特徴点抽出部1002が抽出したそれぞれの局所特徴点について領域設定部1003が設定した特徴量算出領域から特徴量を算出し、該算出した特徴量を出力する。特徴量の出力先については特定の出力先に限るものではなく、記憶部1005に対して出力しても構わないし、外部のメモリに対して出力しても構わないし、該特徴量を用いて処理を行う外部の機器に対して出力しても構わない。
記憶部1005は、画像入力部1001、特徴点抽出部1002、領域設定部1003、算出部1004のそれぞれが動作のために使用するメモリであって、例えば、算出部1004は、算出した特徴量を記憶部1005に格納する。
次に、本実施形態に係る画像処理装置が、画像から特徴量を算出するために行う処理について、同処理のフローチャートを示す図11を用いて説明する。なお、ステップS1101〜S1106、S1108〜S1110、S1113〜S1115の各ステップにおける処理はそれぞれ、処理の主体は異なるものの、その処理の内容は、図4のステップS401〜S406、S408〜S410、S414〜S416と同じであるため、これらのステップに係る説明は省略する。
<ステップS1107>
領域設定部1003は、処理対象特徴点の周囲に特徴量算出領域を設定する。この場合における特徴量算出領域の設定方法については従来から行われている方法を採用する。
<ステップS1111>
領域設定部1003は先ず、処理対象特徴点の画像座標(x、y)と処理対象特徴点の奥行き値zとを用いて上記の式(1)〜(3)を用いた透視投影逆変換を行うことで(x、y、zをそれぞれx、y、zと読み替える)3次元座標(xr、yr、zr)を求め、該3次元座標(xr、yr、zr)を変換行列Tを用いて変換した3次元座標(xt、yt、zt)求め、該3次元座標(xt、yt、zt)を用いて、式(27)、(28)に従った透視投影変換を行うことで、2次元座標(x’、y’)に変換する。
次に、領域設定部1003は、2次元座標(x’、y’)を囲む領域(例えば、2次元座標(x’、y’)を中心とする領域)を設定する。以下では説明を簡単にするために、この設定する領域は矩形であるものとして説明するが、領域の形状を規定する情報が用意されているのであれば、その形状は如何なる形状であっても構わない。
次に、領域設定部1003は、この設定した領域の四隅の2次元座標に対して、2次元座標(x’、y’)を求めるための上記の変換の逆変換を行う。
<ステップS1112>
領域設定部1003は、ステップS1111で求めた「設定した領域の四隅の2次元座標に対して2次元座標(x’、y’)を求めるための上記の変換の逆変換を行うことで得られた四隅の2次元座標で規定される形状の領域」を特徴量算出領域として設定する。
図12は、ステップS1111の処理による特徴量算出領域の設定例の模式図である。図12(a)に示した画像は、対象物を正面から撮像したものであって、3点における奥行き値に差がないものである。然るにこのような場合には、図12(a)の領域1201内に処理対象特徴点がある場合には、図12(c)に示す如く、領域1203を特徴量算出領域として設定する。図12(b)に示した画像は、対象物が撮像装置に対して反時計回りに60度回転した状態で撮像されたものである。このような場合、処理対象特徴点の周囲1202における3点の奥行き値には差があるため、本実施形態では、これらの差を軽減するように図12(d)の特徴量算出領域1204を求める。
このように、処理対象特徴点の周囲における3点の奥行き値に差があろうとなかろうと、図12(c)、(d)に示す如く、特徴量算出領域内の画像は類似したものとなる。
このように、本実施形態によれば、面外回転の影響を受けにくい局所特徴量を算出することが可能となる。
[第3の実施形態]
第1の実施形態では、1つの局所特徴点について1つの変換画像を生成していたが、本実施形態では、局所特徴点を囲む領域を複数の領域に分割し、該分割したそれぞれの領域について変換画像を生成する。すなわち、局所特徴点ごとに、該局所特徴点に対応するそれぞれの分割領域についての変換画像を生成する。すなわち、第1の実施形態では、1つの平面を特定して奥行き値を正規化するよう画像の変換を行ったが、本実施形態では、複数の平面を特定して奥行き値を正規化するよう画像の変換を行う。本実施形態は、局所特徴量算出範囲に複数の奥行き勾配がある場合に有効である。
以下では、第1の実施形態との差分について重点的に説明し、以下で特に触れない限りは第1の実施形態と同様であるものとする。また、本実施形態では、第1の実施形態と同様の構成(図3)を有する画像処理装置を適用する。
次に、本実施形態に係る画像処理装置が、画像から特徴量を算出するために行う処理について、同処理のフローチャートを示す図13を用いて説明する。なお、ステップS1301〜S1303、S1308〜S1310、S1315〜S1318の各ステップにおける処理はそれぞれ、処理の主体は異なるものの、その処理の内容は、図4のステップS401〜S403、S408〜S410、S413〜S416と同じであるため、これらのステップに係る説明は省略する。
<ステップS1304>
画像生成部303は、処理対象特徴点を囲む領域を複数の領域に分割する。例えば、特徴点を囲む領域として従来技術でも設定していた特徴量算出領域の2倍のサイズの領域を処理対象特徴点を囲む領域として設定し、該設定した領域を4×4のブロックに分割する。もちろん、分割元の領域サイズや領域の分割数についてはこれらの例に限るものではない。また、領域分割方法は、矩形のメッシュブロック分割に限定するものではなく、三角形や六角形などの多角形による分割や、セグメンテーションを行って分割する方法なども考えられる。
<ステップS1305>
画像生成部303は、ステップS1304において分割したそれぞれの分割領域のうち未選択の分割領域を処理対象領域として選択する。
<ステップS1306>
画像生成部303は、処理対象領域から直線上に並んでいない3点を決定し、該決定した3点のそれぞれの画像座標を取得する。
<ステップS1307>
画像生成部303は、ステップS1306で決定した3点の画素における奥行き値を取得する。
<ステップS1311>
画像生成部303は、処理対象領域内(分割領域内)の画像を変換行列Tによって変換した画像を変換画像として生成する。以下では説明を簡単にするために、処理対象領域は矩形であるものとして説明するが、処理対象領域の形状を規定する情報が用意されているのであれば、その形状は如何なる形状であっても構わない。
画像生成部303は先ず、処理対象領域の四隅の画像座標(x、y)と該四隅の奥行き値zとを用いて上記の式(1)〜(3)を用いた透視投影逆変換を行うことで(x、y、zをそれぞれx、y、zと読み替える)3次元座標(xr、yr、zr)を求め、該3次元座標(xr、yr、zr)を変換行列Tを用いて変換した3次元座標(xt、yt、zt)求め、該3次元座標(xt、yt、zt)を用いて、式(27)、(28)に従った透視投影変換を行うことで、2次元座標(x’、y’)に変換する。そして、画像生成部303は、四隅の変換後の2次元座標で囲まれている領域内の各画素ptについて、対象画像上の対応する画素位置pqを、画素位置ptに対して(x’、y’)を求めるための上記の変換の逆変換を行うことで求め、画素位置ptにおける画素値として、対象画像における画素位置pqの画素値をセットする。なお、画素位置pqが非整数である場合には、その周辺の画素の画素値から平均和等の補間により求めた画素値をセットする。
<ステップS1312>
画像生成部303は、ステップS1304において分割した分割領域の全てがステップS1305において選択されたか否かを判断する。この判断の結果、全ての分割領域がステップS1305において選択されている場合には、処理はステップS1314に進み、未だ未選択の分割領域が残っている場合には、処理はステップS1313に進む。
<ステップS1313>
画像生成部303は、ステップS1304において分割したそれぞれの分割領域のうち未選択の分割領域を処理対象領域として選択する。そして処理はステップS1306に移行する。
<ステップS1314>
画像生成部303は、それぞれの分割領域について生成した変換画像の補正を行う。領域を分割して処理を行うことにより、領域と領域との間に隙間があったり、重なっていたりする場合があるため、それらを補正する。それらの領域が存在する場合は、処理対象特徴点に近い方の領域の変換行列を使用する、などのルールを定め、適用する。
このように、本実施形態によれば、単純な平面ではない物体の撮影画像から面外回転の影響を受けにくい局所特徴量を算出することが可能となる。
[第4の実施形態]
本実施形態では、第1〜3の実施形態の何れかの実施形態に係る特徴量算出技術を用いて算出した特徴量を用いて画像検索を行い、その検索結果を類似順に並べて表示する。先ず、本実施形態に係る画像処理装置の機能構成例について、図14のブロック図を用いて説明する。
画像入力部1401、特徴点抽出部1402、画像生成部1403、算出部1404はそれぞれ、図3に示した画像入力部301、特徴点抽出部302、画像生成部303、算出部304と同じであるため、これらの機能部に係る説明は省略する。記憶部1409については、基本的な機能については記憶部305と同じであるが、記憶部1409には更に、比較先画像について予め第1〜3の実施形態の何れかの実施形態に係る特徴量算出技術を用いて算出した特徴量と、該特徴量の取得元である画像に固有の情報と、が関連づけて登録される。
量子化部1405は、算出部1404によって算出されたそれぞれの局所特徴量を量子化する。
登録部1406は、量子化部1405によって量子化された局所特徴量と、該局所特徴量の算出元である画像に固有の情報と、を関連づけて記憶部1409に登録する。
検索部1407は、クエリ画像として入力された比較元画像と類似する比較先画像に固有の情報を記憶部1409から検索する。
表示部1408は、検索部1407による検索結果をCRTや液晶画面などの表示装置に表示させる。
次に、記憶部1409に、様々な画像(比較先画像)に固有の情報と、該画像から算出したそれぞれの局所特徴量と、を関連づけて登録するために画像処理装置が行う処理について、同処理のフローチャートを示す図15を用いて説明する。
なお、ステップS1501,S1502の各ステップにおける処理は、それぞれステップS401,S402と同様であるため、これらのステップに係る説明は省略する。また、ステップS1503では、第1の実施形態に係る特徴量算出処理(ステップS403〜S416の処理)、第2の実施形態に係る特徴量算出処理(ステップS1103〜S1115)、第3の実施形態に係る特徴量算出処理(ステップS1303〜S1318)の何れかを実行することで、比較先画像から抽出したそれぞれの局所特徴点に対する局所特徴量(ベクトル)を算出する。
<ステップS1504>
量子化部1405は、ステップS1503で算出されたそれぞれの局所特徴量を量子化する。ここで求めている局所特徴量、すなわち、Local Jetおよびそれらの導関数の組み合わせにより各局所特徴点から算出される局所特徴量は、N次元のベクトルである。ここでは、N次元のうちのn(1≦n≦N)番目の次元の特徴量について、Kn階調に量子化を行う。ここで、NおよびKnはあらかじめ決められているものとする。
具体的には以下の式(36)により、量子化を行う。
Figure 0006543062
Qnは、N次元のうちのn番目の次元の特徴量Vnを量子化した値である。Vn_maxとVn_minはそれぞれn番目の次元の特徴量の取りうる値の最大値、最小値である。
各次元の量子化値をひとまとめにすることで量子化局所特徴量を得ることができ、対象画像のすべての量子化局所特徴量をひとまとめにすることで量子化局所特徴量群を得ることができる。
尚、上記の量子化では、次元ごとに量子化階調数を定めているが、全次元、もしくは、いくつかの次元で共通の階調数にしてもよい。この量子化方法は、図16(a)に示すように、特徴量空間を格子状に分割する方法であるが、図16(b)のような格子形状に分割するような方法を採用してもよい。図16(a)の格子1601は特徴量空間における量子化領域、点1602は各特徴を表している。量子化領域に特徴が対応付けられている。図16(a)、(b)ともに、便宜的に二次元の特徴量空間を量子化分割している例である。局所特徴量は例えば128次元のような多次元のため、実際は多次元の特徴量空間で分割を行う。
また、特徴量空間を分割可能な方法であれば、上述したような規則に基づいて量子化する方法に限らずに、どのような分割方法でも適用可能である。例えば、複数の画像を機械学習させることによりクラスタリングのルールを作成し、そのルールに則って特徴量空間を分割し、量子化するようにしてもよい。
また、各次元についての量子化を行った後、以下の式(37)により、量子化値群のラベル化を行うことで、実質的に一次元の特徴量と同等に扱うことも可能である。
Figure 0006543062
また、全次元の階調数が共通の場合は、以下の式(38)により、量子化値群のラベル化が可能である。ここで、Kは階調数である。
Figure 0006543062
尚、ラベル化可能な算出方法であれば、上述したような算出方法に限らずに、どのようなラベル化方法でも適用可能である。
<ステップS1505>
登録部1406は、ステップS1504で求めたそれぞれの局所特徴量を特徴量IDとして記憶部1409に登録すると共に、該局所特徴量の算出元の画像に対して固有に発行された画像IDを、該特徴量IDと関連づけて登録する。すなわち、記憶部1409には、それぞれの局所特徴量について、対応する特徴量IDと、該局所特徴量の算出元の画像の画像IDと、が関連づけて登録されることになる。
記憶部1409における特徴量ID及び画像IDの管理例を図17に示す。なお、同じ画像について特徴量IDを登録する場合や、類似する画像について特徴量IDを登録する場合など、1つの特徴量IDに複数の画像IDが関連付けられることもある。また、使用されない特徴量IDが存在することもある。
次に、クエリ画像として入力された比較元画像と類似する比較先画像の画像IDを検索して一覧表示するために画像処理装置が行う処理について、同処理のフローチャートを示す図18を用いて説明する。
ステップS1801,S1802、S1803、S1804の各ステップにおける処理はそれぞれ、ステップS401,S402、S1503、S1504と同様であるため、これらのステップに係る説明は省略する。なお、ステップS1803では、ステップS1503において採用した特徴量算出技術と同じ特徴量算出技術を用いるものとする。
<ステップS1805>
検索部1407は、比較元画像から算出された、量子化された局所特徴量に基づいて、類似する画像の画像IDを記憶部1409から検索する。ステップS1805における処理の詳細について、図19のフローチャートを用いて説明する。
<ステップS1901>
検索部1407は、記憶部1409に、それぞれの画像IDに対応するメモリ領域(投票箱として使用するメモリ領域)を確保する。例えば、画像ID=1に対応する投票箱1、画像ID=2に対応する投票箱2、…、画像ID=Nに対応する投票箱N、を記憶部1409に確保する。
<ステップS1902>
検索部1407は、それぞれの投票箱に対して設けられている、該投票箱への投票数を示す変数cを0に初期化する。
<ステップS1903>
検索部1407は、変数kの値に1をセットする。
<ステップS1904>
検索部1407は、比較元画像から算出した量子化済み局所特徴量を表す特徴量IDのうちk番目の特徴量IDを取得する。
<ステップS1905>
検索部1407は、記憶部1409に登録されている特徴量IDのうちステップS1904で取得した特徴量IDと同じもの若しくは類似しているものを特定し、該特定した特徴量IDと関連づけて登録されている画像IDを特定する。なお、ステップS1904で取得した特徴量IDと同じもの若しくは類似しているものと関連づけて登録されている画像IDが複数の場合には、該複数の画像IDを特定することになる。本ステップで特定する1以上の画像IDを基準画像IDリストと呼称する場合がある。
<ステップS1906>
検索部1407は、ステップS1905で特定した画像IDに対応する投票箱に対応する変数cの値を1つインクリメントする。なお、インクリメントする数は1に限るものではない。例えば、特徴量IDの類似度に応じた数(特徴量IDの類似度が高いほど大きい数)だけインクリメントするようにしても構わないし、局所特徴点の座標に基づく数だけインクリメントするようにしても構わない。
<ステップS1907>
検索部1407は、変数kの値を1つインクリメントする。
<ステップS1908>
検索部1407は、変数kの値が、比較元画像から抽出した局所特徴点の数以下であるか否かを判断する。この判断の結果、変数kの値が、比較元画像から抽出した局所特徴点の数以下であれば、処理はステップS1904に戻り、変数kの値が、比較元画像から抽出した局所特徴点の数を超えた場合には、処理はステップS1909に進む。
<ステップS1909>
検索部1407は、投票数(変数cの値)が大きい順に画像IDをソートする。
なお、局所特徴量を量子化した際に、局所特徴量は類似していても、量子化値が異なる場合があり、その場合は、特徴量IDが異なってしまう。その対策として、ステップS1905では、ステップS1904で取得した特徴量IDと同じものだけでなく、ステップS1904で取得した特徴量IDと類似する特徴量IDをも特定し、ステップS1904で取得した特徴量IDと同じ特徴量ID、ステップS1904で取得した特徴量IDと類似する特徴量ID、のそれぞれに対応する画像IDを特定する。
<ステップS1806>
表示部1408は、ステップS1909でソートした画像IDをCRTや液晶画面などにより構成されている表示装置に表示する。なお、表示対象は画像IDに限るものではなく、該画像IDに対応する画像や該画像の属性情報(ファイル名や作成日時、ファイルサイズなど)を合わせて表示しても構わない。
このように、本実施形態によれば、面外回転されている物体が写っている場合でも画像検索を可能にする。なお、本実施形態では、投票方式に従った画像検索処理を採用したが、他の方式による画像検索処理を行うようにしても構わない。
[第5の実施形態]
第1〜4の実施形態では、局所特徴点周辺の奥行き値を利用して、1つ若しくは複数の平面を特定し、奥行き値を正規化するような変換方法を定めている。しかしながら、平面を特定するのではなく、ハフ変換等により曲面を推定するようにしてもよい。その場合は、その曲面を展開画像に変換することにより奥行き値を正規化する方法が考えられる。展開画像への変換は周知技術であり、例えば、特許文献1記載の既存の手法を用いることにより実現できる。
[第6の実施形態]
図3,10,14に示した各機能部は全てハードウェアで構成しても構わないが、一部をソフトウェアで構成しても構わない。後者の場合、例えば、記憶部305,1005,1409として機能するメモリ装置(ハードディスクやRAM,ROMなど)を有し、且つ記憶部305,1005,1409以外の各機能部の機能を実現可能なコンピュータプログラムを実行可能なプロセッサを有するコンピュータ装置であれば、上記の各実施形態に係る画像処理装置に適用することができる。このようなコンピュータ装置のハードウェア構成例について、図2のブロック図を用いて説明する。
CPU201はROM202やRAM203に格納されているコンピュータプログラムやデータを用いて処理を実行することで、コンピュータ装置200全体の動作制御を行うと共に、コンピュータ装置200を適用する画像処理装置が行うものとして上述した各処理を実行する。
ROM202には、コンピュータ装置200の設定データやブートプログラムなどが格納されている。ROM202は、記憶部305,1005,1409の機能の一部を兼ねる。
RAM203は、外部記憶装置204からロードされたコンピュータプログラムやデータ、通信インターフェース207を介して外部から受信したデータ、などを格納するためのエリアを有する。また、RAM203は、CPU201が各種の処理を実行する際に用いるワークエリアを有する。このように、RAM203は、各種のエリアを適宜提供することが出来る。また、RAM203は、記憶部305,1005,1409の機能の一部を兼ねる。
外部記憶装置204は、ハードディスクドライブ装置に代表される大容量情報記憶装置である。外部記憶装置204には、OS(オペレーティングシステム)や、画像処理装置が行うものとして上述した各処理をCPU201に実行させるためのコンピュータプログラムやデータが保存されている。このコンピュータプログラムには、図3,10,14において記憶部305,1005,1409以外の各機能部が行うものとして上述した各処理をCPU201に実行させるためのコンピュータプログラムが含まれている。また、このデータには、上述の処理において既知の情報として説明したものや、記憶部305,1005,1409が保持しているものとして上述したデータ、が含まれている。外部記憶装置204に保存されているコンピュータプログラムやデータは、CPU201による制御に従って適宜RAM203にロードされ、CPU201による処理対象となる。
なお、外部記憶装置204には、コンピュータ装置200から着脱可能なフレキシブルディスク(FD)やCompact Disk(CD)等の光ディスク、磁気や光カード、ICカード、メモリカードなどを適用しても構わない。
また、外部記憶装置204は、記憶部305,1005,1409の機能の一部を兼ねる。
入力デバイス209は、キーボードやマウスなどのユーザインターフェースにより構成されており、ユーザが操作することで各種の指示をCPU201に対して入力することが出来る。入力デバイス209は、入力デバイスインターフェース205に接続される。
モニタ210は、CRTや液晶画面などにより構成されており、CPU201による処理結果を画像や文字などでもって表示することが出来る。モニタ210は、出力デバイスインターフェース206に接続される。
ネットワーク回線211は、LANやインターネット等を含むものであり、有線回線であっても無線回線であっても、またそれらの組み合わせであっても構わない。
通信インターフェース207は、このようなネットワーク回線211を介してデータの送受信を行うものである。また、通信インターフェース207には、デジタルカメラ212、デジタルビデオカメラ213、スマートフォン214、などの機器を接続することができ、これらの機器とのデータ通信をも行う。例えば、デジタルカメラ212、デジタルビデオカメラ213、スマートフォン214などによって撮像された画像(静止画像や動画像の各フレーム)を通信インターフェース207を介して外部記憶装置204やRAM203に転送し、特徴量の算出対象として用いても構わない。
CPU201、ROM202、RAM203、外部記憶装置204、入力デバイスインターフェース205、出力デバイスインターフェース206、通信インターフェース207は何れも、システムバス208に接続されている。
なお、第1〜5の実施形態に係る画像処理装置を実現するために、図2の構成を有する1台のコンピュータ装置200を用いても構わないが、同様の構成を有する複数台のコンピュータ装置を用いて実現させても構わない。第1〜5の実施形態に係る画像処理装置を複数台のコンピュータ装置で構成する場合は、互いに通信可能なようにLocal Area Network(LAN)などで接続される。コンピュータ装置は、パーソナルコンピュータ(PC)やワークステーション(WS)等の情報処理装置によって実現することができる。
また、CPU201によって、記憶部305,1005,1409以外の各機能部の機能を実現させるようにしても構わないが、CPU201と協調して動作するASICなどの制御回路が記憶部305,1005,1409以外の各機能部の機能を実現させるようにしても構わない。また、CPUと画像処理装置の動作を制御する制御回路との協調によって、記憶部305,1005,1409以外の各機能部の機能を実現させるようにしても構わない。また、CPUは単一のものである必要はなく、複数であってもよい。この場合、複数のCPUは分散して処理を実行することが可能である。また、複数のCPUは単一のコンピュータ装置に配置されていてもよいし、物理的に異なる複数台のコンピュータ装置に配置されていてもよい。
また、第1〜5の実施形態に係る画像処理装置は、ディジタルカメラなどの撮像装置への組み込み機器として実装しても構わない。このとき、該撮像装置は、自身で撮像した画像の局所特徴量を第1〜5の実施形態で説明した方法でもって算出することができ、またこのような局所特徴量を用いて、第4の実施形態に係る画像検索を行うことが出来る。
(その他の実施例)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
302:特徴点抽出部 303:画像生成部 304:算出部

Claims (11)

  1. 画素の奥行き値が連続的に変化している画像領域を含む入力画像から特徴点を抽出する抽出手段と、
    前記特徴点の周囲の画素の奥行き値を正規化するような変換を正規化変換とし、前記特徴点の画素位置を該正規化変換によって変換した変換済み画素位置の周辺画素位置に該正規化変換によって変換される前記入力画像上の画素位置を特定し、該特定した画素位置における画素若しくはその周辺の画素の画素値、に基づいて、特徴量算出用の画像を生成する生成手段と、
    前記生成手段によって生成された画像から特徴量を算出する算出手段と
    を備え
    前記生成手段は、前記特徴点の周囲の画素の奥行き値の差異に基づいて、前記特徴量算出用の画像を生成するか否かを決定することを特徴とする画像処理装置。
  2. 前記生成手段は、
    前記特徴点の周囲の画素の座標と該画素の奥行き値とによって表される該画素の3次元座標を含む平面の法線ベクトルを、前記入力画像の奥行き方向と平行にする変換を前記正規化変換として決定することを特徴とする請求項1に記載の画像処理装置。
  3. 前記生成手段は、
    前記特徴点の周囲の画素の奥行き値のうち最大の奥行き値と最小の奥行き値との差が所定値以上であれば前記特徴量算出用の画像を生成することを特徴とする請求項1又は2に記載の画像処理装置。
  4. 前記差が所定値未満である場合、
    前記生成手段は、前記特徴量算出用の画像を生成せず、前記算出手段は、前記特徴点の周囲の領域から特徴量を算出することを特徴とする請求項3に記載の画像処理装置。
  5. 画素の奥行き値が連続的に変化している画像領域を含む入力画像から特徴点を抽出する抽出手段と、
    前記特徴点の周囲の画素の奥行き値を正規化するような変換を正規化変換とし、該正規化変換によって前記特徴点の画素位置が変換される画素位置を特定し、該特定した画素位置を囲む領域に該正規化変換によって変換される前記入力画像上の領域を特徴量算出領域として特定する特定手段と、
    前記特徴量算出領域から特徴量を算出する算出手段と
    を備え
    前記特定手段は、前記特徴点の周囲の画素の奥行き値の差異に基づいて、前記特徴量算出領域の特定を行うか否かを決定することを特徴とする画像処理装置。
  6. 更に、
    前記算出手段により算出された特徴量と、該特徴量の取得元である画像に固有の情報と、を関連づけてメモリに登録する登録手段を備えることを特徴とする請求項1乃至の何れか1項に記載の画像処理装置。
  7. 更に、
    比較元画像について前記算出手段が算出したそれぞれの特徴量について、該特徴量と同じ若しくは類似している特徴量と関連づけて前記メモリに登録されている情報を検索する検索手段と、
    前記検索手段が検索した情報に基づいて、前記比較元画像と特徴量が類似する画像に固有の情報を表示する表示手段と
    を備えることを特徴とする請求項に記載の画像処理装置。
  8. 前記抽出手段は、原画像を再帰的に縮小することで生成した複数の縮小画像と、該原画像と、のそれぞれを前記入力画像とし、該入力画像から特徴量を抽出することを特徴とする請求項1乃至の何れか1項に記載の画像処理装置。
  9. 画像処理装置が行う画像処理方法であって、
    前記画像処理装置の抽出手段が、画素の奥行き値が連続的に変化している画像領域を含む入力画像から特徴点を抽出する抽出工程と、
    前記画像処理装置の生成手段が、前記特徴点の周囲の画素の奥行き値を正規化するような変換を正規化変換とし、前記特徴点の画素位置を該正規化変換によって変換した変換済み画素位置の周辺画素位置に該正規化変換によって変換される前記入力画像上の画素位置を特定し、該特定した画素位置における画素若しくはその周辺の画素の画素値、に基づいて、特徴量算出用の画像を生成する生成工程と、
    前記画像処理装置の算出手段が、前記生成工程で生成された画像から特徴量を算出する算出工程と
    を備え
    前記生成工程では、前記特徴点の周囲の画素の奥行き値の差異に基づいて、前記特徴量算出用の画像を生成するか否かを決定することを特徴とする画像処理方法。
  10. 画像処理装置が行う画像処理方法であって、
    前記画像処理装置の抽出手段が、画素の奥行き値が連続的に変化している画像領域を含む入力画像から特徴点を抽出する抽出工程と、
    前記画像処理装置の特定手段が、前記特徴点の周囲の画素の奥行き値を正規化するような変換を正規化変換とし、該正規化変換によって前記特徴点の画素位置が変換される画素位置を特定し、該特定した画素位置を囲む領域に該正規化変換によって変換される前記入力画像上の領域を特徴量算出領域として特定する特定工程と、
    前記画像処理装置の算出手段が、前記特徴量算出領域から特徴量を算出する算出工程と
    を備え
    前記特定工程では、前記特徴点の周囲の画素の奥行き値の差異に基づいて、前記特徴量算出領域の特定を行うか否かを決定することを特徴とする画像処理方法。
  11. コンピュータを、請求項1乃至の何れか1項に記載の画像処理装置の各手段として機能させるためのコンピュータプログラム。
JP2015060016A 2015-03-23 2015-03-23 画像処理装置、画像処理方法 Active JP6543062B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2015060016A JP6543062B2 (ja) 2015-03-23 2015-03-23 画像処理装置、画像処理方法
US15/075,736 US9916521B2 (en) 2015-03-23 2016-03-21 Depth normalization transformation of pixels

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015060016A JP6543062B2 (ja) 2015-03-23 2015-03-23 画像処理装置、画像処理方法

Publications (2)

Publication Number Publication Date
JP2016181051A JP2016181051A (ja) 2016-10-13
JP6543062B2 true JP6543062B2 (ja) 2019-07-10

Family

ID=56976368

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015060016A Active JP6543062B2 (ja) 2015-03-23 2015-03-23 画像処理装置、画像処理方法

Country Status (2)

Country Link
US (1) US9916521B2 (ja)
JP (1) JP6543062B2 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017033547A (ja) 2015-08-05 2017-02-09 キヤノン株式会社 情報処理装置及びその制御方法及びプログラム
JP6775343B2 (ja) 2015-09-11 2020-10-28 キヤノン株式会社 情報処理装置及びその制御方法及びプログラム
JP6595880B2 (ja) 2015-10-22 2019-10-23 キヤノン株式会社 画像処理装置、画像処理方法
CN106910210B (zh) * 2017-03-03 2018-09-11 百度在线网络技术(北京)有限公司 用于生成图像信息的方法和装置
JP6835665B2 (ja) * 2017-05-25 2021-02-24 Kddi株式会社 情報処理装置及びプログラム
JP7087681B2 (ja) * 2018-05-30 2022-06-21 ヤマハ株式会社 画像処理方法、画像処理装置およびプログラム
JP7163079B2 (ja) * 2018-06-22 2022-10-31 株式会社エビデント 撮像システム、画像構築方法
CN110770794A (zh) * 2018-08-22 2020-02-07 深圳市大疆创新科技有限公司 图像深度估计方法、装置、可读存储介质及电子设备
JP7431563B2 (ja) 2019-11-28 2024-02-15 キヤノン株式会社 画像検索装置、画像検索方法、及びプログラム
US20230005213A1 (en) * 2020-01-23 2023-01-05 Sony Group Corporation Imaging apparatus, imaging method, and program
US20220051372A1 (en) * 2020-08-12 2022-02-17 Niantic, Inc. Feature matching using features extracted from perspective corrected image
JP2022043631A (ja) * 2020-09-04 2022-03-16 キヤノン株式会社 情報処理装置、情報処理方法及びプログラム
CN117475380A (zh) * 2023-09-12 2024-01-30 四川弘和数智集团有限公司 一种加能站排队检测方法、装置、电子设备和存储介质

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000057377A (ja) 1998-06-02 2000-02-25 Sony Corp 画像処理装置および画像処理方法、並びに媒体
JP4735361B2 (ja) * 2006-03-23 2011-07-27 日産自動車株式会社 車両乗員顔向き検出装置および車両乗員顔向き検出方法
JP4950787B2 (ja) * 2007-07-12 2012-06-13 株式会社東芝 画像処理装置及びその方法
US20100026897A1 (en) * 2008-07-30 2010-02-04 Cinnafilm, Inc. Method, Apparatus, and Computer Software for Modifying Moving Images Via Motion Compensation Vectors, Degrain/Denoise, and Superresolution
JP5248236B2 (ja) * 2008-08-08 2013-07-31 パナソニック株式会社 画像処理装置および画像処理方法
EP2340534B1 (en) * 2008-10-03 2013-07-24 RealD Inc. Optimal depth mapping
US9047681B2 (en) * 2011-07-07 2015-06-02 Samsung Electronics Co., Ltd. Depth image conversion apparatus and method
JP5767887B2 (ja) * 2011-08-02 2015-08-26 エヌ・ティ・ティ・コムウェア株式会社 画像処理装置、画像処理方法及び画像処理プログラム
JP5820236B2 (ja) * 2011-10-28 2015-11-24 キヤノン株式会社 画像処理装置及びその制御方法
JP2013131801A (ja) * 2011-12-20 2013-07-04 Nakabayashi Co Ltd 情報端末装置、撮像画像処理システム、方法、プログラムおよび記録媒体
JP6280382B2 (ja) 2013-03-08 2018-02-14 キヤノン株式会社 画像処理装置および画像処理方法
US9322647B2 (en) * 2013-03-28 2016-04-26 International Business Machines Corporation Determining camera height using distributions of object heights and object image heights
US9842423B2 (en) * 2013-07-08 2017-12-12 Qualcomm Incorporated Systems and methods for producing a three-dimensional face model
WO2015029982A1 (ja) * 2013-08-29 2015-03-05 日本電気株式会社 画像処理装置、画像処理方法、及びプログラム
US9594981B2 (en) 2014-04-14 2017-03-14 Canon Kabushiki Kaisha Image search apparatus and control method thereof
JP6431302B2 (ja) 2014-06-30 2018-11-28 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム

Also Published As

Publication number Publication date
US9916521B2 (en) 2018-03-13
US20160284092A1 (en) 2016-09-29
JP2016181051A (ja) 2016-10-13

Similar Documents

Publication Publication Date Title
JP6543062B2 (ja) 画像処理装置、画像処理方法
Riaz et al. Texture classification using rotation-and scale-invariant gabor texture features
JP6431302B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP4989308B2 (ja) 画像処理装置及び画像検索方法
Lian et al. CM-BOF: visual similarity-based 3d shape retrieval using clock matching and bag-of-features
US20150146989A1 (en) Image processing apparatus, image processing method, and program
US20170337733A1 (en) Method and apparatus for searching a database of 3d items using descriptors
US8117183B2 (en) Accurate content-based indexing and retrieval system
EP2172856A2 (en) Image processing apparatus, image processing method and program
US9076195B2 (en) Methods and apparatus to identify components from images of the components
JP5283088B2 (ja) 画像検索装置および同画像検索装置に適用される画像検索用コンピュータプログラム
JP6351350B2 (ja) 三次元モデル検索システム、及び三次元モデル検索方法
JP2017138744A (ja) 画像処理装置、画像処理方法及びプログラム
Janu et al. Query-based image retrieval using SVM
JP3993423B2 (ja) 電子出版物閲覧装置、電子出版物閲覧プログラム及びそのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2001117936A (ja) 3次元類似画像検索装置
JP6598480B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP6017005B2 (ja) 画像検索装置、画像検索方法及びプログラム
Gallo et al. Breast shape parametrization through planar projections
Pickup et al. An evaluation of canonical forms for non-rigid 3D shape retrieval
Rauber et al. 2-D FORM DESCRIPTORS BASED ON A NORMALIZED PARAMETRIC POLAR TRANSFORM (UNZ TFUNSFORM)
KR20160127369A (ko) 이미지 검색 시스템 및 방법
Tiagrajah et al. An enhanced shape descriptor based on radial distances
JP3706603B2 (ja) データ特徴抽出装置及びデータ照合装置
JP5836728B2 (ja) 画像検索装置、画像検索方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180220

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190206

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190222

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190423

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190517

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190614

R151 Written notification of patent or utility model registration

Ref document number: 6543062

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151