JP5414620B2 - 画像処理装置、画像処理方法、プログラム、及び集積回路 - Google Patents

画像処理装置、画像処理方法、プログラム、及び集積回路 Download PDF

Info

Publication number
JP5414620B2
JP5414620B2 JP2010118605A JP2010118605A JP5414620B2 JP 5414620 B2 JP5414620 B2 JP 5414620B2 JP 2010118605 A JP2010118605 A JP 2010118605A JP 2010118605 A JP2010118605 A JP 2010118605A JP 5414620 B2 JP5414620 B2 JP 5414620B2
Authority
JP
Japan
Prior art keywords
vectors
luminance gradient
vector
origin
voting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010118605A
Other languages
English (en)
Other versions
JP2011248463A (ja
Inventor
育規 石井
政夫 平本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2010118605A priority Critical patent/JP5414620B2/ja
Priority to CN201180002958.9A priority patent/CN102473306B/zh
Priority to US13/386,500 priority patent/US8520950B2/en
Priority to PCT/JP2011/001609 priority patent/WO2011148549A1/ja
Publication of JP2011248463A publication Critical patent/JP2011248463A/ja
Application granted granted Critical
Publication of JP5414620B2 publication Critical patent/JP5414620B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/30Determination of transform parameters for the alignment of images, i.e. image registration
    • G06T7/33Determination of transform parameters for the alignment of images, i.e. image registration using feature-based methods
    • G06T7/337Determination of transform parameters for the alignment of images, i.e. image registration using feature-based methods involving reference images or patches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2101/00Still video cameras

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)
  • Studio Devices (AREA)

Description

本発明は、画像中から指定された物体を検出し、認識する画像処理装置及び画像処理方法に関するものである。
近年、撮像素子の進化によって、デジタルスチルカメラ及びデジタルムービーの画素数がますます増加してきている。画素数が増えることによって、撮影者は、観たままの風景を高解像度、且つ広視野で撮影できる。このような高解像度で広視野の画像は、約10億もの画素を有するギガピクセル画像と呼ばれ、ギガピクセル画像に関する研究、開発が進められている。
ギガピクセル画像の課題は、撮影時と閲覧時とでそれぞれ異なっている。撮影時は、手ぶれによる画像ブレの問題、フォーカスの調整が難しいといった問題がある。しかし、ギガピクセル画像は視野の広い画像であるため、据え置きで撮影すれば、撮影時の課題を回避することができる。
一方、閲覧時は、画素数が多いために、ギガピクセル画像中から観たいものを見つけることが難しいという課題がある。全てを一度に閲覧しようとすると、ディスプレイが大きくなり、専用のシステムが必要になる。また、一般に使われるディスプレイを利用する場合、画像の縮小率が大きくなるため、観たい物体を見つけることが難しい。
このような背景のもと、画素数の多い画像であるギガピクセル画像において、画像から物体検出を行い、観たい物体を自動で見つけることで、閲覧を簡便にすることへの要求が高まっている。
従来、画像から物体を検出する方法として、例えば、特許文献1のSIFT(Scale−Invariant Feature Transform)、又は非特許文献1のSURF(Speeded Up Robust Features)と呼ばれる特徴記述子を利用する方法がある。
SIFTは、特徴点の検出及び特徴量の記述を行うアルゴリズムである。そのアルゴリズムについて簡単に述べる。SIFTの処理は、スケール及びキーポイントの検出を行う処理(detection)と、オリエンテーションの算出及び特徴量の記述とを行う処理(description)とを含む。スケールとキーポイントとは、Difference Of Gaussian(DoG)処理により検出される。次に、回転に不変な特徴を得るために、キーポイントのオリエンテーションを求める。最後に、オリエンテーションに基づいて、キーポイントの特徴量を記述する。以下詳細について述べる。
スケール及びキーポイントの検出のために、DoG処理を行う。DoG処理は、分散係数の異なる二つのGaussianフィルタによりフィルタ処理を施した画像をそれぞれ二枚算出し、その差分を求める処理である。この差分画像をDoG画像と呼ぶ。複数の分散係数によってフィルタ処理することで、複数のDoG画像が得られる。ある一点について、分散係数を変えて生成したDoG画像の出力値を観測すると、その出力値には極値が存在する。この極値は、画像サイズが二倍になれば、分散の大きさが二倍になったときのDoG画像の出力値に対応するという関係がある。
このように、SIFTは、極値によって相対的なスケール変化を記述することができる。そのため、実際の物体サイズを知らなくても、DoG画像から極値を求めるだけで、物体のスケールを知ることができる。このような特徴は、拡大又は縮小に対して不変な特徴と呼ばれる。ここで、得られる極値は複数あるため、コントラスト又は輝度値の曲率によって認識に有効でない極値が排除される。
次に、オリエンテーションの算出について説明する。オリエンテーションは、キーポイントが得られた画像の勾配強度と勾配方向とを求める処理である。キーポイントの周辺の勾配強度と勾配方向とから重み付きヒストグラムを求める。例えば、36方向に勾配方向を分割し、ヒストグラムを構築する。このとき、最大値から80%以上となる方向成分がキーポイントのオリエンテーションとして割り当てられる。
特徴量の記述には、キーポイント周辺の勾配情報を用いる。まず、キーポイント周辺の領域をキーポイント方向の座標軸に合わせるため、キーポイントの方向が垂直方向になるようにキーポイント周辺の領域を回転する。回転した領域を4x4の16ブロックに分け、ブロックごとに8方向(45度ずつ)の勾配方向ヒストグラムを作成する。オリエンテーションの方向に座標軸を合わせた領域で特徴を記述するため、回転に不変な特徴量となる。
以上の処理によって、画像からSIFT記述子を求める方法があるが、DoG算出処理の処理量が多いという課題があった。そこで、SURF特徴量が提案されている。
SURF記述子は、DoG画像の極値を求めるのではなく、Fast−Hessian Detectorによって極値を求める。Fast−Hessian Detectorは、ヘシアン行列を矩形で近似したものである。
異なる解像度のヘシアン行列を用いて行列式を求める。このとき、ヘシアン行列を求めるために、Integral Imageを用いることにより、あらゆるサイズの矩形の総和が、4点の画素の加減算で処理できる。
Integral Imageについて説明する。理解を容易にするため、1次元で説明する。1次元の画像が図27(a)のように格納されているとする。このときIntegral Imageは、次のように作られる。ある画素iのIntegral Imageの画素値は、図27(b)に示されるように、1番目から(i−1)画素目までの画素の画素値を加算して得られる値に、i番目の画素の画素値を加算することで算出される。2つ目の要素から6つ目の要素までの和がIntegral Imageにおける6つ目の要素と1つ目の要素との差になる(図27(c))。
以上のように、SURFはSIFTと異なりDoG画像を求めないため、高速に処理ができるという特徴がある。しかし、SURFは画素値の和(Integral Image)を格納する必要があるため、多くのメモリ量が必要となる。例えば、1次元上に複数の画素が並んだ画像のIntegral Imageを作成する場合を考える。1画素の画素値を1Byteとすると、Integral Imageの2つ目の要素には2Byte、3つ目の要素には3Byteが必要となる。このように、画素の数に応じて徐々に必要になるメモリの容量が増えてくる。ギガピクセル画像を考えると、1G番目の要素には1GByteのメモリ容量が必要になる。さらに、全要素について同じ要領を確保すると、1GByte*1G個のメモリ量が必要になる。したがって、SURFのギガピクセル画像への適用は現実的ではない。
そこで、メモリ量が少なく処理量も小さい方法として、従来までに特許文献2、特許文献3、特許文献4、非特許文献2がある。これらは、画像から輝度の勾配を求め、その勾配に基づいて認識用の画像(以下、認識画像)から、物体を検出する。
米国特許第6711293号明細書 特開2008−243175号公報 特開2008−250950号公報 特許第3606430号公報
Herbert Bay ,Tinne Tuytelaars and Luc Van Gool "SURF: Speeded up robust features", ECCV 2006, pp404-417. 平本 政夫、小川 貴弘、長谷川 美紀、「輝度こう配ベクトルを用いた画像識別方法」 電子情報通信学会論文誌D、2006年6月1日(P1348−P1358)
従来の特許文献2の方法では、特徴量の抽出時に、ある勾配の点(ベース点と呼ぶ)からその近傍にあるサポート点を選択し、必要最低限の点数を選択する。参照画像と認識画像とから勾配点を選択し、勾配点同士の対応関係を求めることで、検出を行っていた。しかし、回転又はスケールの変化に対応するためには、回転させた参照画像又はスケールを変えた参照画像を用いる必要があるため、任意の回転又はスケールの変化に対応する場合、多くの処理量が必要になる。
また、従来の特許文献3の方法では、勾配の方向を、方向を持つものと無方向のものとに分けることで照合の効率化が行われている。検出は、勾配方向の一致する画素数と、勾配方向のパターン合致度とによって判定が行われている。勾配方向のパターンは回転によって異なる。したがって、この方法でも勾配方向のパターン合致度を求めるために、回転又はスケールの変化に対応した複数の参照画像が必要となる。
さらに、従来の特許文献4の方法では、輝度の勾配を垂直方向及び水平方向のそれぞれで求めて輝度勾配ベクトルとし、輝度勾配ベクトルの類似性を利用して検出を行っている。このとき、基準ベクトルを定め、そのベクトルからの相対的な角度差及び距離の比例関係を利用することで、回転又はスケールの変化にロバストな物体検出を行っている。
また、非特許文献2でも同様に、輝度勾配ベクトルを用いて検出処理を行っている。非特許文献2では、原点と輝度勾配ベクトルまでの距離と角度とが定義され、原点から輝度勾配ベクトルまでの距離と角度とを表すベクトルを位置ベクトルという。この距離と角度とを保持した位置ベクトル及び位置ベクトルの逆方向を向くベクトルである投票ベクトルが検出に用いられる。参照画像と認識画像とで対応する輝度勾配ベクトルが見つかった場合、投票ベクトルが指す位置へ投票を行う。正しい対応関係が見つかった場合、投票数が最大となるのは原点である。
この方法も原点を基準とした相対角度と位置とを利用しているため、回転とスケール変化とにロバストである。しかしながら、特許文献4及び非特許文献2は、参照画像と認識画像とから輝度勾配ベクトルの対応関係を求める必要がある。ギガピクセル画像の場合、輝度勾配ベクトル数が膨大になる。例えば、参照画像からM個、認識画像からN個の輝度勾配ベクトルが算出される場合、全体の処理量はO(M*N)になる。
本発明は、上記従来の課題を解決するもので、画素数の多い画像に対しても、高速な物体の認識を可能とした画像処理装置及び画像処理方法を提供することを目的とする。
本発明の一形態に係る画像処理装置は、探索画像内における参照画像の位置を特定する。具体的には、前記参照画像を構成する複数の画素間の輝度値の勾配を示す複数の輝度勾配ベクトルVrと、前記参照画像平面内に設定された原点から前記複数の輝度勾配ベクトルVrそれぞれの始点位置に向かう複数のベクトルであって、第1の2次元座標系で表現される複数の位置ベクトルRrと、前記複数の輝度勾配ベクトルVrそれぞれの始点位置から前記原点に向かう複数のベクトルであって、前記複数の輝度勾配ベクトルVrそれぞれの方向を基準軸とする第2の2次元座標系で表現される複数の投票ベクトルUrとを、互いに対応付けて記憶する記憶部と、前記探索画像を構成する複数の画素間の輝度値の勾配を示す複数の輝度勾配ベクトルVsを算出する輝度勾配ベクトル算出部と、前記輝度勾配ベクトル算出部で算出された前記複数の輝度勾配ベクトルVsと、前記記憶部に記憶されている前記複数の位置ベクトルRr及び前記複数の投票ベクトルUrとに基づいて、前記探索画像平面上における前記原点に対応する位置を特定することによって、前記探索画像内における前記参照画像の位置を特定する位置特定部とを備える。そして、前記位置特定部は、前記輝度勾配ベクトル算出部で算出された前記複数の輝度勾配ベクトルVs、及び前記記憶部に記憶されている前記複数の投票ベクトルUrのうちの少なくとも一方からベクトルの一部を間引くことによって、処理対象の前記輝度勾配ベクトルVs及び処理対象の前記投票ベクトルUrを抽出するサンプリング部と、前記処理対象の輝度勾配ベクトルVsそれぞれの始点位置に、前記輝度勾配ベクトルVsと前記基準軸とが一致するように回転させた前記処理対象の投票ベクトルUrを配置し、前記投票ベクトルUrの終点位置を、前記探索画像平面上における前記原点に対応する位置である候補点と推定する原点位置推定部と、前記原点位置推定部で推定された候補点それぞれに前記複数の位置ベクトルRrを配置し、前記複数の位置ベクトルRrそれぞれの終点位置に存在する前記輝度勾配ベクトルVsが最も多い前記候補点を、前記原点に対応する位置と特定する再検証部とを備える。
上記構成によれば、輝度勾配ベクトルVs及び投票ベクトルUrの少なくとも一方を間引いてから原点位置推定処理(投票)を実行するので、処理量を削減することができる。また、再検証処理を実行することにより、処理精度の劣化を防止することができる。
さらに、前記再検証部は、前記原点位置推定部で推定された前記候補点それぞれに対して、当該候補点を指し示す前記投票ベクトルUrの始点位置に存在する前記輝度勾配ベクトルVsと、前記投票ベクトルUrに対応付けられて前記記憶部に記憶されている前記輝度勾配ベクトルVrとのなす角である回転角を算出し、前記回転角だけ回転させた前記複数の位置ベクトルRrそれぞれの終点位置に存在する前記輝度勾配ベクトルVsが最も多い前記候補点を、前記原点に対応する位置と特定してもよい。これにより、探索画像中の探索物体の回転に対してロバストな処理を実現することができる。
さらに、前記再検証部は、前記原点位置推定部で推定された前記候補点それぞれに対して、前記複数の位置ベクトルRrそれぞれの終点位置に存在する前記輝度勾配ベクトルVsのうち、当該位置ベクトルRrに対応付けられて前記記憶部に記憶されている前記輝度勾配ベクトルVrと大きさが実質的に一致するか、又方向が実質的に一致する前記輝度勾配ベクトルVsの数を算出し、算出された前記輝度勾配ベクトルVsが最も多い前記候補点を、前記原点に対応する位置と特定してもよい。
さらに、前記位置特定部は、特定の画素の画素値と、当該特定の画素の周囲に位置する複数の画素の画素値の平均値との差分値である特徴量を算出する特徴量算出部を備えてもよい。そして、前記再検証部は、さらに、前記原点位置推定部で推定された前記候補点それぞれに対して、前記複数の位置ベクトルRrそれぞれの終点位置の画素のうち、前記特徴量が、前記参照画像において対応する画素の前記特徴量と実質的に一致する画素の数を算出し、算出された画素の数が最も多い前記候補点を、前記原点に対応する位置と特定してもよい。
上記の各形態における再検証処理のように、輝度勾配ベクトルVsの有無だけでなく、その妥当性を検証することにより、より精度の高い画像認識が可能となる。なお、「実質的に一致」とは、例えば、±10%、より好ましくは、±5%程度の誤差を許容することを指す。
また、前記原点位置推定部は、前記投票ベクトルの終点位置が予め定めた閾値以上集まる位置のみを、前記候補点と推定してもよい。これにより、処理精度を劣化させることなく、処理量を削減することが可能となる。
さらに、原点位置推定部は、前記処理対象の輝度勾配ベクトルVsそれぞれの始点位置に、所定の倍率に拡大又は縮小した前記処理対象の投票ベクトルUrを配置してもよい。これにより、探索画像中の探索物体の拡大又は縮小に対してロバストな処理を実現することができる。
本発明の一形態に係る画像処理方法は、参照画像を構成する複数の画素間の輝度値の勾配を示す複数の輝度勾配ベクトルVrと、前記参照画像平面内に設定された原点から前記複数の輝度勾配ベクトルVrそれぞれの始点位置に向かう複数のベクトルであって、第1の2次元座標系で表現される複数の位置ベクトルRrと、前記複数の輝度勾配ベクトルVrそれぞれの始点位置から前記原点に向かう複数のベクトルであって、前記複数の輝度勾配ベクトルVrそれぞれの方向を基準軸とする第2の2次元座標系で表現される複数の投票ベクトルUrとを、互いに対応付けて記憶する記憶部を備える画像処理装置に、探索画像内における前記参照画像の位置を特定させる方法である。具体的には、前記探索画像を構成する複数の画素間の輝度値の勾配を示す複数の輝度勾配ベクトルVsを算出する輝度勾配ベクトル算出ステップと、前記輝度勾配ベクトル算出ステップで算出された前記複数の輝度勾配ベクトルVsと、前記記憶部に記憶されている前記複数の位置ベクトルRr及び前記複数の投票ベクトルUrとに基づいて、前記探索画像平面上における前記原点に対応する位置を特定することによって、前記探索画像内における前記参照画像の位置を特定する位置特定ステップとを含む。そして、前記位置特定ステップは、前記輝度勾配ベクトル算出ステップで算出された前記複数の輝度勾配ベクトルVs、及び前記記憶部に記憶されている前記複数の投票ベクトルUrのうちの少なくとも一方からベクトルの一部を間引くことによって、処理対象の前記輝度勾配ベクトルVs及び処理対象の前記投票ベクトルUrを抽出するサンプリングステップと、前記処理対象の輝度勾配ベクトルVsそれぞれの始点位置に、前記輝度勾配ベクトルVsと前記基準軸とが一致するように回転させた前記処理対象の投票ベクトルUrを配置し、前記投票ベクトルUrの終点位置を、前記探索画像平面上における前記原点に対応する位置である候補点と推定する原点位置推定ステップと、前記原点位置推定ステップで推定された候補点それぞれに前記複数の位置ベクトルRrを配置し、前記複数の位置ベクトルRrそれぞれの終点位置に存在する前記輝度勾配ベクトルVsが最も多い前記候補点を、前記原点に対応する位置と特定する再検証ステップとを含む。
本発明の一形態に係るプログラムは、参照画像を構成する複数の画素間の輝度値の勾配を示す複数の輝度勾配ベクトルVrと、前記参照画像平面内に設定された原点から前記複数の輝度勾配ベクトルVrそれぞれの始点位置に向かう複数のベクトルであって、第1の2次元座標系で表現される複数の位置ベクトルRrと、前記複数の輝度勾配ベクトルVrそれぞれの始点位置から前記原点に向かう複数のベクトルであって、前記複数の輝度勾配ベクトルVrそれぞれの方向を基準軸とする第2の2次元座標系で表現される複数の投票ベクトルUrとを、互いに対応付けて記憶する記憶部を備えるコンピュータに、探索画像内における前記参照画像の位置を特定させる。具体的には、前記探索画像を構成する複数の画素間の輝度値の勾配を示す複数の輝度勾配ベクトルVsを算出する輝度勾配ベクトル算出ステップと、前記輝度勾配ベクトル算出ステップで算出された前記複数の輝度勾配ベクトルVsと、前記記憶部に記憶されている前記複数の位置ベクトルRr及び前記複数の投票ベクトルUrとに基づいて、前記探索画像平面上における前記原点に対応する位置を特定することによって、前記探索画像内における前記参照画像の位置を特定する位置特定ステップとを、コンピュータに実行させてる。そして、前記位置特定ステップは、前記輝度勾配ベクトル算出ステップで算出された前記複数の輝度勾配ベクトルVs、及び前記記憶部に記憶されている前記複数の投票ベクトルUrのうちの少なくとも一方からベクトルの一部を間引くことによって、処理対象の前記輝度勾配ベクトルVs及び処理対象の前記投票ベクトルUrを抽出するサンプリングステップと、前記処理対象の輝度勾配ベクトルVsそれぞれの始点位置に、前記輝度勾配ベクトルVsと前記基準軸とが一致するように回転させた前記処理対象の投票ベクトルUrを配置し、前記投票ベクトルUrの終点位置を、前記探索画像平面上における前記原点に対応する位置である候補点と推定する原点位置推定ステップと、前記原点位置推定ステップで推定された候補点それぞれに前記複数の位置ベクトルRrを配置し、前記複数の位置ベクトルRrそれぞれの終点位置に存在する前記輝度勾配ベクトルVsが最も多い前記候補点を、前記原点に対応する位置と特定する再検証ステップとを、コンピュータに実行させる。
本発明の一形態に係る集積回路は、参照画像を構成する複数の画素間の輝度値の勾配を示す複数の輝度勾配ベクトルVrと、前記参照画像平面内に設定された原点から前記複数の輝度勾配ベクトルVrそれぞれの始点位置に向かう複数のベクトルであって、第1の2次元座標系で表現される複数の位置ベクトルRrと、前記複数の輝度勾配ベクトルVrそれぞれの始点位置から前記原点に向かう複数のベクトルであって、前記複数の輝度勾配ベクトルVrそれぞれの方向を基準軸とする第2の2次元座標系で表現される複数の投票ベクトルUrとを、互いに対応付けて記憶する記憶部を備える画像処理装置に搭載されて、探索画像内における前記参照画像の位置を特定する。具体的には、前記探索画像を構成する複数の画素間の輝度値の勾配を示す複数の輝度勾配ベクトルVsを算出する輝度勾配ベクトル算出部と、前記輝度勾配ベクトル算出部で算出された前記複数の輝度勾配ベクトルVsと、前記記憶部に記憶されている前記複数の位置ベクトルRr及び前記複数の投票ベクトルUrとに基づいて、前記探索画像平面上における前記原点に対応する位置を特定することによって、前記探索画像内における前記参照画像の位置を特定する位置特定部とを備える。そして、前記位置特定部は、前記輝度勾配ベクトル算出部で算出された前記複数の輝度勾配ベクトルVs、及び前記記憶部に記憶されている前記複数の投票ベクトルUrのうちの少なくとも一方からベクトルの一部を間引くことによって、処理対象の前記輝度勾配ベクトルVs及び処理対象の前記投票ベクトルUrを抽出するサンプリング部と、前記処理対象の輝度勾配ベクトルVsそれぞれの始点位置に、前記輝度勾配ベクトルVsと前記基準軸とが一致するように回転させた前記処理対象の投票ベクトルUrを配置し、前記投票ベクトルUrの終点位置を、前記探索画像平面上における前記原点に対応する位置である候補点と推定する原点位置推定部と、前記原点位置推定部で推定された候補点それぞれに前記複数の位置ベクトルRrを配置し、前記複数の位置ベクトルRrそれぞれの終点位置に存在する前記輝度勾配ベクトルVsが最も多い前記候補点を、前記原点に対応する位置と特定する再検証部とを備える。
本発明によれば、画素数の多い画像に対しても高速な物体の認識を可能とした画像処理装置及び画像処理方法を得ることができる。
本発明の実施の形態1に係る撮像装置のブロック図である。 図1の画像処理部のブロック図である。 参照画像の一例を示す図である。 探索画像の一例を示す図である。 参照画像データ作成処理を示すフローチャートである。 輝度勾配ベクトルVrの一例を示す図である。 位置ベクトルRrの一例を示す図である。 投票ベクトルUrの一例を示す図である。 基準軸の方向を揃えた状態の投票ベクトルUrを示す図である。 原点O’を揃えた状態の投票ベクトルUrを示す図である。 投票方式による画像認識の概念を示す図である。 探索画像内における参照画像の位置特定処理を示すフローチャートである。 輝度勾配ベクトルVsの一例を示す図である。 サンプリング処理の結果の一例を示す図である。 投票処理の結果の一例を示す図である。 再検証処理の結果の一例を示す図である。 探索画像内の探索物体を拡大した場合の処理結果の一例を示す図である。 探索画像内の探索物体を縮小した場合の処理結果の一例を示す図である。 探索物体を回転させた場合における図13に対応する図である。 探索物体を回転させた場合における図14に対応する図である。 探索物体を回転させた場合における図15に対応する図である。 探索物体を回転させた場合における図16に対応する図である。 探索物体を40°回転させた場合の処理結果の一例を示す図である。 探索物体を80°回転させた場合の処理結果の一例を示す図である。 回転方向の影響を受けない特徴量の一例を示す図である。 拡大又は縮小の影響を受けない特徴量の一例を示す図である。 Integral Imageを説明するための図である。
以下本発明の実施の形態について、図面を参照しながら説明する。
(実施の形態1)
本実施の形態では、処理量が少なく、回転、拡大、又は縮小にロバストな物体の認識を可能にする画像処理装置、及び、画像処理方法について述べる。
図1及び図2を参照して、本発明の実施の形態1に係る撮像装置10を説明する。図1は、撮像装置10全体のブロック図である。図2は、画像処理部210のブロック図である。
本実施の形態1に係る撮像装置10は、図1に例示するように、撮像部100と、各種信号処理を行う信号処理部200と、撮像部100によって取得された画像を表示する表示部300と、画像データを記録する記録部400と、各部を制御するシステム制御部500とを備える。
撮像部100は、光学レンズ110と、撮像素子120とを備える。光学レンズ110は、光軸方向に移動して焦点位置又は拡大率の調整等を行う。撮像素子120は、光学レンズ110を通過した光を光電変換して、探索画像データを信号処理部200に出力する。撮像素子120は、典型的には、CCD(Charge Coupled Device)等で実現できる。
信号処理部200は、画像処理部210と、メモリ220と、IF(InterFace)230とを備える。画像処理部210は、撮像部100から取得した探索画像中における参照画像の位置を特定する処理を実行する。メモリ220は、画像処理部210で処理され、表示部300に表示される画像データを一時的に記憶する記憶領域である。IF230は、記録部400との間でデータの入出力を行う。
表示部300は、画像処理部210で処理された画像データを表示する。表示部300の具体的な構成は特に限定されないが、例えば、液晶ディスプレイ、プラズマディスプレイ、又は有機EL(ElectroLuminescence)ディスプレイ等を採用することができる。
記録部400は、信号処理部200で処理された画像データ、及びその他のデータを記憶する。記録部400の具体的な構成は特に限定されないが、例えば、DRAM(Dynamic random access memory)、SDRAM(Static random access memory)、フラッシュメモリ、又はHDD(Hard Disc Drive)等のデータを記憶可能なあらゆる記憶媒体を採用することができる。後述する記憶部211も同様である。
システム制御部500は、撮像装置10の各構成要素を制御する。システム制御部500は、例えば、プログラムを読み出して実行するCPU(Central Processing Unit)で実現してもよいし、集積回路で実現してもよい。
本実施の形態1の画像処理装置が公知の画像処理装置と異なる主な点は、主に画像処理部210の動作にある。したがって、以下の説明では、主として、画像処理部210を詳しく説明する。
画像処理部210は、図2に示されるように、記憶部211と、輝度勾配ベクトル算出部212と、位置特定部213とを備える。
記憶部211は、参照画像から生成された複数の輝度勾配ベクトルVr、複数の位置ベクトルRr、及び複数の投票ベクトルUrとを互いに対応付けて記憶している。輝度勾配ベクトルVrは、参照画像を構成する複数の画素間の輝度値の勾配を示すベクトルである。位置ベクトルRrは、参照画像平面内に設定された原点から複数の輝度勾配ベクトルVrの始点位置に向かうベクトルである。投票ベクトルUrは、輝度勾配ベクトルVrの始点位置から原点に向かうベクトルである。
ここで、対応する位置ベクトルRrと投票ベクトルUrとを図示すると、絶対値が同じで方向が反対となる。しかしながら、位置ベクトルRrは、第1の2次元座標系で表現されるベクトルであり、投票ベクトルUrは、対応する輝度勾配ベクトルVrの方向を基準軸とする第2の2次元座標系(第1の2次元座標系と異なる)で表現されるベクトルである。
輝度勾配ベクトル算出部212は、探索画像を構成する複数の画素間の輝度値の勾配を示す複数の輝度勾配ベクトルVsを算出する。なお、輝度勾配ベクトルVr、Vsの算出方法は同一であり、後述する。
位置特定部213は、輝度勾配ベクトル算出部212で算出された複数の輝度勾配ベクトルVsと、記憶部211に記憶されている複数の位置ベクトルRr及び複数の投票ベクトルUrとに基づいて、探索画像平面上における原点に対応する位置を特定することによって、探索画像内における参照画像の位置を特定する。より具体的には、位置特定部213は、サンプリング部214と、原点位置推定部215と、再検証部216とを備える。
サンプリング部214は、輝度勾配ベクトル算出部212で算出された複数の輝度勾配ベクトルVs、及び記憶部211に記憶されている複数の投票ベクトルUrのうちの少なくとも一方からベクトルの一部を間引くことによって、処理対象の輝度勾配ベクトルVs及び処理対象の投票ベクトルUrを抽出する。サンプリング手法の典型例は、ランダムサンプリングである。また、以下の例では、複数の輝度勾配ベクトルVsのうちの一部を間引く例を説明する。
原点位置推定部215は、処理対象の輝度勾配ベクトルVsそれぞれの始点位置に、輝度勾配ベクトルVsと基準軸とが一致するように回転させた処理対象の投票ベクトルUrを配置し、投票ベクトルUrの終点位置を、探索画像平面上における原点に対応する位置である候補点と推定する。
再検証部216は、原点位置推定部215で推定された候補点それぞれに複数の位置ベクトルRrを配置し、複数の位置ベクトルRrそれぞれの終点位置に存在する輝度勾配ベクトルVsが最も多い候補点を、原点に対応する位置と特定する。
図3〜図16を参照して、画像処理部210の動作を説明する。まず、図3は、参照画像の一例を示す図である。図4は、探索画像の一例を示す図である。
本実施の形態1では、輝度勾配ベクトルに基づく画像認識を行う。輝度勾配ベクトルに基づく画像認識とは、参照画像の輝度勾配ベクトルと探索画像の輝度勾配ベクトルとの関係性を利用して、探索画像中から参照画像に一致する画像を探索する処理である。
輝度勾配ベクトルに基づく画像認識では、画像データを輝度勾配ベクトルデータ群に変換する。そして、その輝度勾配ベクトルデータ群から識別用データを求める。識別用のデータは、各輝度勾配ベクトルデータの位置から任意の位置に設定された原点に向かう投票ベクトルである。その後、探索画像の輝度勾配ベクトルを求め、探索画像内において、投票ベクトルを用いて投票を行うことで物体認識を行う。
まず、図5〜図10を参照して、図3に示される参照画像から、輝度勾配ベクトルデータVrと、位置ベクトルRrと、投票ベクトルUrとを含む参照画像データを求める参照画像データ作成処理を説明する。図5は、参照画像データ作成処理を示すフローチャートである。図6〜図10は、参照画像データ作成処理の各ステップにおける各種ベクトルのイメージ図である。
参照画像データ生成処理について述べる。参照画像とは、図3に示されるように、探したい物体(探索物体)が大きく写った画像である。また、探索物体のみが写っている画像でもよい。認識処理では、探索画像中において、探索物体が存在する場所を調べる。
まず、参照画像の輝度勾配ベクトルVri(i=1〜4)を算出する(S11)。
参照画像を平滑化する。これにより、ノイズを減らすことができる。その結果、後述する輝度勾配(エッジともいう)の抽出処理において、不要な輝度勾配成分を除去することができる。式1に、平滑化フィルタの例を示す。
ここでは、平滑化フィルタとして、参照画像を構成する各画素に、式1に示すようなガウシアンフィルタを施す。式1から例えば、3×3のガウシアンカーネルを作る。これに限らず平均値フィルタでもよい。このとき、平均値フィルタは計算量が小さいという効果がある。
次に、参照画像の輝度勾配の抽出を行う。輝度勾配の抽出は、x方向及びy方向それぞれについて行う。輝度勾配抽出オペレータは、例えば、Sobelオペレータを用いた抽出を行なえばよい。
輝度勾配検出オペレータについて、以下に一例を述べる。輝度勾配検出オペレータは様々あるが、ここでは一例として、一般的に輝度勾配を抽出するために用いられるSobelオペレータについて説明する。プレウィットフィルタ又は隣接する画素値の差分フィルタなど他の手法でも構わない。式2及び式3に、Sobelフィルタの例を示す。
式2は、参照画像のx方向の輝度勾配を抽出するフィルタである。一方、式3は、参照画像のy方向の輝度勾配を抽出するフィルタであるこれらのフィルタそれぞれを、参照画像の各画素値に適用することで、輝度勾配ベクトルのx方向のデータ群とy方向のデータ群とを獲得することができる。図3に示される参照画像から算出された輝度勾配ベクトルVr1〜Vr4の例を図6に示す。
次に、各輝度勾配ベクトルVri(i=1〜4)に対応する位置ベクトルRriを算出する(S12)。なお、輝度勾配ベクトルVri及び位置ベクトルRriは、共に原点Oを中心とするx−y座標系で表現されるベクトルである。
位置ベクトルの算出方法について述べる。距離ベクトルRriは、参照画像のx−y平面上に設定された原点Oから各輝度勾配ベクトルVriの始点位置に向かって延びるベクトルである。
輝度勾配ベクトルVriと位置ベクトルRriとの関係を図7に示す。図7に示されるように、参照画像上に定義した原点O(例えば、参照画像の中心座標)から位置ベクトルRriが張られており、そこから輝度勾配ベクトルVriが張られる。
これらの情報を用いて識別用データである投票ベクトルUriを作成する(S13)。投票ベクトルUriは、例えば、式4及び式5によって作られる。なお、ここでは、参照画像データの生成に式4及び式5を用いる例を説明しているが、これらの式は識別用データの生成にも利用できる。そこで、式4及び式5では、輝度勾配ベクトルVriをViと、位置ベクトルRriをRiと、投票ベクトルUriをUiと一般化して表記している。
投票ベクトルUriは、図8に示すように、各輝度勾配ベクトルVriの始点位置から原点Oに向かって延びるベクトルである。そして、投票ベクトルUriは、各輝度勾配ベクトルVriの始点位置の座標を原点とし、その方向を水平基準軸(x’軸)とした2次元座標系(x’−y’座標系)で表現される。特徴として、投票ベクトルUriが指し示す位置(投票ベクトルUriの終点位置)が全て原点Oに一致する。
ここで、x’軸が輝度勾配ベクトルVr1の方向を向くように投票ベクトルUr1〜Ur4を回転させると、図9に示すような状態となる。さらに、原点O’の位置が一致するように、図9に示す投票ベクトルUr1〜Ur4を重ね合わせると、図10に示すような状態となる。つまり、投票ベクトルUr1〜Ur4は、x’−y’座標系の原点O’から放射状に延びるベクトルとして表現することができる。
そして、以上までの処理によって生成された輝度勾配ベクトルVri、位置ベクトルRri、及び投票ベクトルUriは、互いに対応付けられた状態で記憶部211に記憶される(S14)。これにより、参照画像において、識別ためのデータ準備ができた。なお、上記の処理は、参照画像を取得した画像処理部210が行ってもよいし、外部装置が算出した輝度勾配ベクトルVri、位置ベクトルRri、及び投票ベクトルUriを記憶部211に格納してもよい。
次に、識別の原理について述べる。まず、従来の非特許文献2の方法と課題とを論じた後、本発明の方法を述べる。
まず、識別対象の画像(探索画像)の輝度勾配ベクトルVsi及び位置ベクトルRsi(iは1〜n:nはベクトル数)と、参照画像の輝度勾配ベクトルVrj及び投票ベクトルUrj(jは、1〜m:mはベクトル数)とを用意する。本手法では、図11に示すように、探索画像において参照画像の識別データに基づき投票するので、投票用の空間が必要になる。実際には、二次元空間で考え、比較する二つの画像サイズより大きい平面(以下、投票平面)を考える。
投票平面上に原点を設定し、探索画像の輝度勾配ベクトルVsiと位置ベクトルRsiとを配置する。次に、探索画像の輝度勾配ベクトルVsiと参照画像の輝度勾配ベクトルVrjとを、全て比較する。従来の非特許文献2においては、探索画像の輝度勾配ベクトルVsi及び参照画像の輝度勾配ベクトルVrjの絶対値が等しい場合に、投票平面において、位置ベクトルRsiが指し示す位置に投票ベクトルUrjを配置し、投票ベクトルUrjが指し示す位置に一票投票していた。もし、参照画像と探索画像とが等しいならば最多得票点は原点であり、その得票数はnである。そこで、この値が決められた閾値より大きいとき、探索画像中に探索物体(参照画像)が存在すると判定していた。
しかしながら、ギガピクセル画像では、探索画像の輝度勾配ベクトルVsiの数が多く、対応点を探索する計算量も多くなる。そこで、本実施の形態1では、以下に示すような輝度勾配ベクトルVsiのサンプリングと、投票結果の再検証とを行うことで、処理負荷を軽減する方法を説明する。
図12〜図16を参照して、本実施の形態1に係る探索画像内における参照画像の位置特定処理を説明する。図12は、位置特定処理のフローチャートである。図13〜図16は、位置特定処理の各ステップにおけるベクトルのイメージを示す図である。
まず、探索画像の輝度勾配ベクトルVsi(i=1〜10)を算出する。輝度勾配ベクトルVsiの算出方法は、上述の輝度勾配ベクトルVriの算出方法と共通するので、説明を省略する。図4に示される探索画像から算出された輝度勾配ベクトルVr1〜Vr10を図13に示す。
次に、探索画像の輝度勾配ベクトルVsiをランダムにサンプリングする(S22)。これにより、不要なデータの投票を削減できるので、ノイズと計算量とを同時に削減できる。ここでは、図14に示されるように、輝度勾配ベクトルVs3、Vs5、Vs6が間引かれて、輝度勾配ベクトルVs1〜Vs3、Vs7〜Vs10が処理対象として抽出されたものとする。
なお、サンプリングレートは任意に設定することができる。一般的には、サンプリングレートが低くなる程、処理量は少なくなるが、認識精度は低下する。しかしながら、後述の再検証処理を行うことで認識精度の低下を抑制することができるので、例えば、サンプリングレートを25%以下に設定したとしても、十分な認識精度を得ることができる。
そして、サンプリングした輝度勾配ベクトルVsiそれぞれに対して、全ての投票ベクトルUrjを用いて投票を行う(S13)。具体的には、図10のx’軸が各輝度勾配ベクトルVsiの方向に一致するように回転させた投票ベクトルUr1〜Ur4を、各投票ベクトルUr1〜Ur4の始点位置が原点O’に一致するように、探索画像上に配置する。このときの状態を図15に示す。
図15において、各投票ベクトルUr1〜Ur4の終点位置が、探索画像中における原点Oに対応する位置の候補点となる。ここで、各投票ベクトルUr1〜Ur4の指し示す全ての位置を候補点としてもよいが、処理量を軽減する観点からは、1つの投票ベクトルUriのみによって指し示される点(孤立点)を除去し、投票ベクトルUriの終点が所定の閾値(例えば、2個)以上集まる点のみを候補点としてもよい。図15の例では、3つの投票ベクトルUr1、Ur2、Ur3が指し示す候補点O1と、2つの投票ベクトルUr1、Ur4が指し示す候補点O2とを抽出する。
具体的には、次に述べる方法で孤立点の除去を行ってもよい。孤立点は、その点の近傍に投票された点が閾値より少ない点である。そこで、ある点の近傍に、投票された点が何点あるかを計測することで孤立点の判定を行う。判定式を式6に示す。
式6のPは、孤立点を判定する点の近傍点の集合であり、pは近傍点である。また、f(p)は、近傍点pが投票されていれば1を、そうでなければ0を返す関数であり、f(p)によって、点pに投票点が存在するか否かを判定している。
以上をまとめると、ランダムにサンプリングした輝度勾配ベクトルVsiが、参照画像の輝度勾配ベクトルVrjのいずれかに対応しているという仮説のもとで投票を行う。仮説が正しければ投票平面の原点Oに投票点の集合ができる。また、対応しているものがなければ、それらには関連性がなく集合をつくらない。したがって、投票平面において投票数が多い点(候補点)が現れる。このことからランダムにサンプリングし、投票を行い、投票平面において、一定以上の得点が得られた点を原点の候補と考えることができる。
しかしながら、ここで得られる候補は、ランダムにサンプリングして得られる結果によるものであるので、その投票結果にはノイズ成分が含まれている。そのため、投票平面の分布は分散が大きくなる傾向にある。そこで、本実施の形態1では、このデータ群を再検証することで、投票されたデータ群の再検証を図る(S24)。
投票点(候補点O1、O2)からm(m=1〜4)個の位置ベクトルRri(逆投票ベクトル)を用いて逆投票を行う。正しい投票点の場合は、位置ベクトルRriの指し示す終点位置に合計m個の輝度勾配ベクトルVsiがあるはずである。逆に誤った投票点では、位置ベクトルRriの終点位置に存在する輝度勾配ベクトルVsiは少ない。これにより、最大値がmとなる「類似度」を定義することができる。この類似度によって各候補点を評価することで、複数の候補点のうちから正しい原点Oの位置を特定することができる。
具体的には、図16に示されるように、各候補点O1、O2と原点Oとが一致するように、図7に示される位置ベクトルRr1〜Rr4を探索画像上に配置する。そして、各位置ベクトルRr1〜Rr4の終点位置に輝度勾配ベクトルVsiが存在するか否かを判定する。なお、再検証処理においては、サンプリング処理(S22)で間引いた輝度勾配ベクトルVr3、Vr5、Vr6も処理対象とする。
図16の例においては、候補点O1から延びる位置ベクトルRr1〜Rr4の指し示す先には、4つの輝度勾配ベクトルVr1〜Vr4が存在する。つまり、候補点O1における類似度は、4となる。一方、候補点O2から延びる位置ベクトルRr1〜Rr4の指し示す先には、2つの輝度勾配ベクトルVr9、Vr10が存在する。つまり、候補点O2における類似度は、2となる。そして、再検証部216は、複数の候補点O1、O2のうち、類似度が最も大きい候補点O1を原点Oに対応する位置と特定する。すなわち、探索画像中の候補点O1を含む領域に、図3に示す参照画像と実質的に同一の画像が存在することが分かる。
以上の方法によれば、ランダムサンプリングにより画像認識に利用する輝度勾配ベクトルVsiの数を削減できるため、ベクトルの対応関係を求める処理を削減できる。具体的には、参照画像の輝度勾配ベクトルVriの数がM個で、認識画像の輝度勾配ベクトルVsiの数がN個の場合、従来の処理量はO(M*N)であったが、本発明の処理量はO(M*N/m)となる。ここで1/mは、探索画像の輝度勾配ベクトルVsiのサンプリングレートを示す。
しかしながら、従来の非特許文献2のように、回転、拡大、又は縮小といった幾何学的変換の際、画素値が補間されると、探索画像の輝度勾配ベクトルVsi及び参照画像の輝度勾配ベクトルVrjの絶対値が等しくならないため、対応関係を見つけることが難しいという課題がある。
そこで、拡大又は縮小に対応するために、図12のS23において、投票ベクトルUrjの倍率を変えて投票する(例えば、0.7〜1.3倍することで、探索画像中の探索物体と参照画像とのサイズが0.7〜1.3倍の範囲で異なる場合においても対応できる)。
より具体的には、図12のS23において、倍率1倍の投票ベクトルUrjと、倍率0.7倍の投票ベクトルUrjと、倍率1.3倍の投票ベクトルUrjとを、処理対象の各輝度勾配ベクトルVsiの位置に配置する。そして、同一の倍率の投票ベクトルUrjが所定の閾値以上集まる点を、候補点とする。さらに、図12のS24において、各候補点上に配置される位置ベクトルRrjは、候補点を指し示す投票ベクトルUrjと同じ倍率だけ拡大又は縮小される。
ここで、倍率の幅を小さくする程、拡大又は縮小に対するロバスト性は高くなるが、処理量は増大する。そこで、倍率の幅を小さくするのに応じて、サンプリング処理におけるサンプリングレート、又は孤立点除去処理における閾値を大きくすることによって、処理量の増加を抑制するのが望ましい。
図17及び図18は、探索画像中の探索物体と参照画像との倍率が異なる場合における処理結果を示す図である。図17(a)に示すように、探索画像中の探索物体を参照画像の130%に拡大すると、図17(b)に示すように、候補点は中心付近に集まる。一方、図18(a)に示すように、探索画像中の探索物体を参照画像の70%に縮小すると、図18(b)に示すように、候補点が分散する。これは、画像を縮小する際に画素の一部が間引かれることによる誤差である。
しかしながら、図17及び図18のように、拡大又は縮小がある場合においても、意図した位置で投票点の数が多くなっており、拡大又は縮小にロバストであるという効果が確認できた。
また、探索画像中の探索物体が参照画像に対して回転している場合には、投票点の再検証において、参照画像と投票画像中の探索物体との角度差推定が必要になる。
参照画像と探索画像中の探索物体との角度差の推定について図19〜図22を用いて説明する。なお、図19〜図22は、それぞれ図13〜図16に対応する図であって、探索画像中の探索物体が参照画像に対して時計回りにθだけ回転している点が異なる図である。つまり、図19〜図22の輝度勾配ベクトルVs1’〜Vs4’は、図13〜図16の輝度勾配ベクトルVs1〜Vs4をそれぞれ時計回りにθだけ回転させたベクトルである。
探索画像中の探索物体が参照画像に対して回転している場合であっても、図12のS21〜S23の処理は同じように実行することができる。但し、S23の終了後に、以下に示す角度差推定処理を実行する必要がある。
具体的には、図21に示されるように、候補点O1を指し示す投票ベクトルUr1、Ur2、Ur4の始点位置に存在する輝度勾配ベクトルVs1’、Vs2’、Vs4’と、投票ベクトルUr1、Ur2、Ur4に対応付けられて記憶部211に記憶されている輝度勾配ベクトルVs1、Vs2、Vs4とのなす角度をそれぞれ算出する。
対応する輝度勾配ベクトルVri、Vsiのなす角度は、式7のようにして求めることができる。
これにより、一組の輝度勾配ベクトルVri、Vsiについて、参照画像と探索画像中の探索物体との角度差を求めることができる。さらに、全ての投票ベクトルUriの始点位置に存在する輝度勾配ベクトルVri、Vsiに対して、上記の方法で角度差が求められる。そして、例えば、角度差の最頻値を参照画像(参照画像中の対象物体)と探索画像との角度差θとする。
次に、類似度の算出について説明する。類似度は、先述した認識物体の回転を考慮した位置ベクトルRri’の指し示す終点位置に輝度勾配ベクトルVsiが存在するか否かによって求める。つまり、図7に示される位置ベクトルRr1〜Rr4を角度差θだけ回転させて得られる位置ベクトルRr1’〜Rr4’を用いて、再検証処理を実行する。回転を考慮するため、位置ベクトルRr1’〜Rr4’は式8のようになる。
ここで、Rixは位置ベクトルRriのx成分、Riyは位置ベクトルRriのy成分とする。これを回転逆投票ベクトルと呼ぶ。投票点からm個の回転逆投票ベクトルを用いて逆投票を行う。正しい投票点の場合は、回転逆投票ベクトルの指し示す終点位置に、合計m個の輝度勾配ベクトルVsiあるはずである。逆に誤った投票点では、逆投票の位置に存在する輝度勾配ベクトルVsiは少ない。回転を考慮して類似度を算出することにより、認識物体の幾何学的変化にロバストな認識が可能になる。
図23及び図24は、探索画像中の探索物体と参照画像との角度が異なる場合における処理結果を示す図である。図23(a)に示すように、探索画像中の探索物体を参照画像に対して40°回転させると、図23(b)に示すように、候補点は中心付近に集まる。一方、図24(a)に示すように、探索画像中の探索物体を参照画像に対して80°回転させると、図24(b)に示すように、候補点が分散する。つまり、回転角が大きいほど、検出精度が若干低下する。しかしながら、図23及び図24のように、回転がある場合においても、意図した位置で投票点数が多くなっており、回転にロバストであるという効果が確認できた。
(実施の形態2)
本実施の形態2で用いる画像処理装置の構成は、実施の形態1と同じであるため、詳細な説明は省略する。
実施の形態2に係る再検証部216は、さらに、原点位置推定部215で推定された候補点それぞれに対して、複数の位置ベクトルRrそれぞれの終点位置に存在する輝度勾配ベクトルVsのうち、当該位置ベクトルRrに対応付けられて記憶部211に記憶されている輝度勾配ベクトルVrと大きさが実質的に一致するか、又方向が実質的に一致する輝度勾配ベクトルVsの数を算出し、算出された輝度勾配ベクトルVsが最も多い候補点を、原点に対応する位置と特定する。
または、実施の形態2に係る位置特定部213は、さらに、特定の画素の画素値と、当該特定の画素の周囲に位置する複数の画素の画素値の平均値との差分値である特徴量を算出する特徴量算出部(図示省略)を備える。そして、再検証部216は、さらに、原点位置推定部215で推定された候補点それぞれに対して、複数の位置ベクトルRrそれぞれの終点位置の画素のうち、特徴量が、参照画像において対応する画素の特徴量と実質的に一致する画素の数を算出し、算出された画素の数が最も多い候補点を、原点に対応する位置と特定する。 実施の形態1で述べた画像認識では、ランダムにサンプリングした輝度勾配ベクトルVsiに対して投票を行い、その投票結果に対して逆投票をした結果、そこに輝度勾配ベクトルVsiが存在すれば、類似度のカウントを1追加していた。
実施の形態2では、逆投票した位置にある輝度勾配ベクトルVsiの確からしさを評価する基準を設ける。これにより、ただ輝度勾配ベクトルVsiが存在するというだけでなく、誤った輝度勾配ベクトルVsiにおいて、類似度をカウントしないことにより、精度をさらに上げることが可能になる。
以下、詳細について説明する。
実施の形態1で述べたように、投票した結果を回転逆投票ベクトルによって、再検証することができる。そこに存在する輝度勾配ベクトルは、参照画像と探索画像とで強度が完全に一致するとは限らない。しかしながら、認識する物体において、全く異なる場所を選んでいるわけではないため、一定の類似性を保持している。そこで、輝度勾配ベクトルVsi、Vriの絶対値に幅を持たせて、絶対値の類似性が高いときのみ類似度としてカウントする。つまり、実施の形態1では、回転逆投票ベクトルによって輝度勾配ベクトルVsiが見つかれば類似度をカウントしていたが、本実施の形態2は、探索画像の輝度勾配ベクトルVsiが参照画像の輝度勾配ベクトルVriの絶対値のN%(例えば、5%)以内に存在するとき、類似度が高いとしてカウントする。
これにより、輝度勾配ベクトルVsiが存在するだけではなく、その絶対値の類似性により、ありえない対応をカウントしないため、ノイズ成分の影響を受けにくく、精度の高い物体認識が可能になる。
また、再検証の際に、以下に述べる幾何学的な性質を導入することにより、再投票結果の評価を行うことができる。回転のみの変化、あるいは、拡大又は縮小のみの変化であれば、次の性質がある。
回転の変化が生じると、参照画像と探索画像とで、輝度勾配ベクトルVri、Vsiを求めるための画素対が異なる。通常、水平方向の画素対の差分、垂直方向の画素対の差分によって輝度勾配ベクトルを求めるが、回転すると、水平、垂直方向の基準が変わるため、勾配の方向性が異なる。そこで、勾配の方向性を無くす特徴量を用いることで、逆投票をした結果の信頼性を高める。方向性を無くす特徴量として、図25に示す特徴量を考える。
ここでは、特徴量を抽出するフィルタを目にあてはめた例を示している。このフィルタはある画素(x,y)と、その近傍画素(x−1,y−1)、(x,y−1),(x+1,y−1),(x−1,y),(x+1,y),(x−1,y+1),(x,y+1),(x+1,y+1)の平均値との差分を特徴量としたものである。これは、回転に対して不変な特徴量である。このため、探索画像中の探索物体が参照画像に対して回転しているのみであれば、逆投票した場所の輝度勾配ベクトル位置において、この特徴量が一致する。したがって、この一致する場所のみカウントすることで、精度をさらに上げることができる。もしくは、完全に一致しなくても誤差N%以内であれば、カウントするようにしてもよい。
また、拡大又は縮小のみの変化を考える。このとき、図26(a)及び図26(b)に示すように、参照画像と探索画像との対応する点における輝度勾配ベクトルVri、Vsiのなす角度は、拡大又は縮小に対して不変である。そこで、逆投票した位置において、対応する輝度勾配ベクトルVri、Vsiのなす角度を求める。そして、この角度が実質的に0になる位置(すなわち、輝度勾配ベクトルVri、Vsiの方向が実質的に一致する)のみをカウントすることで、精度をさらにあげることができる。もしくは、輝度勾配ベクトルVri、Vsiの方向が完全に一致しなくても誤差N%以内であれば、カウントするようにしてもよい。
(その他変形例)
なお、本発明を上記実施の形態に基づいて説明してきたが、本発明は、上記の実施の形態に限定されないのはもちろんである。以下のような場合も本発明に含まれる。
上記の各装置は、具体的には、マイクロプロセッサ、ROM、RAM、ハードディスクユニット、ディスプレイユニット、キーボード、マウスなどから構成されるコンピュータシステムである。RAMまたはハードディスクユニットには、コンピュータプログラムが記憶されている。マイクロプロセッサが、コンピュータプログラムにしたがって動作することにより、各装置は、その機能を達成する。ここでコンピュータプログラムは、所定の機能を達成するために、コンピュータに対する指令を示す命令コードが複数個組み合わされて構成されたものである。
上記の各装置を構成する構成要素の一部または全部は、1個のシステムLSI(Large Scale Integration:大規模集積回路)から構成されているとしてもよい。システムLSIは、複数の構成要素を1個のチップ上に集積して製造された超多機能LSIであり、具体的には、マイクロプロセッサ、ROM、RAMなどを含んで構成されるコンピュータシステムである。RAMには、コンピュータプログラムが記憶さている。マイクロプロセッサが、コンピュータプログラムにしたがって動作することにより、システムLSIは、その機能を達成する。
上記の各装置を構成する構成要素の一部または全部は、各装置に脱着可能なICカードまたは単体のモジュールから構成されているとしてもよい。ICカードまたはモジュールは、マイクロプロセッサ、ROM、RAMなどから構成されるコンピュータシステムである。ICカードまたはモジュールは、上記の超多機能LSIを含むとしてもよい。マイクロプロセッサが、コンピュータプログラムにしたがって動作することにより、ICカードまたはモジュールは、その機能を達成する。このICカードまたはこのモジュールは、耐タンパ性を有するとしてもよい。
本発明は、上記に示す方法であるとしてもよい。また、これらの方法をコンピュータにより実現するコンピュータプログラムであるとしてもよいし、コンピュータプログラムからなるデジタル信号であるとしてもよい。
また、本発明は、コンピュータプログラムまたはデジタル信号をコンピュータ読み取り可能な記録媒体、例えば、フレキシブルディスク、ハードディスク、CD−ROM、MO、DVD、DVD−ROM、DVD−RAM、BD(Blu−ray Disc)、半導体メモリなどに記録したものとしてもよい。また、これらの記録媒体に記録されているデジタル信号であるとしてもよい。
また、本発明は、コンピュータプログラムまたはデジタル信号を、電気通信回線、無線または有線通信回線、インターネットを代表とするネットワーク、データ放送等を経由して伝送するものとしてもよい。
また、本発明は、マイクロプロセッサとメモリを備えたコンピュータシステムであって、メモリは、上記コンピュータプログラムを記憶しており、マイクロプロセッサは、コンピュータプログラムにしたがって動作するとしてもよい。
また、プログラムまたはデジタル信号を記録媒体に記録して移送することにより、またはプログラムまたはデジタル信号をネットワーク等を経由して移送することにより、独立した他のコンピュータシステムにより実施するとしてもよい。
上記実施の形態及び上記変形例をそれぞれ組み合わせてもよい。
以上、図面を参照してこの発明の実施形態を説明したが、この発明は、図示した実施形態のものに限定されない。図示した実施形態に対して、この発明と同一の範囲内において、あるいは均等の範囲内において、種々の修正や変形を加えることが可能である。
本発明は、ディジタルカメラやムービーの物体認識AE、AF、多画素画像の閲覧機能等として有用である。また監視カメラ・ドアフォン等の用途にも応用できる。
10 撮像装置
100 撮像部
110 光学レンズ
120 撮像素子
200 信号処理部
210 画像処理部
211 記憶部
212 輝度勾配ベクトル算出部
213 位置特定部
214 サンプリング部
215 原点位置推定部
216 再検証部
300 表示部
400 記録部
500 システム制御部

Claims (9)

  1. 探索画像内における参照画像の位置を特定する画像処理装置であって、
    前記参照画像を構成する複数の画素間の輝度値の勾配を示す複数の輝度勾配ベクトルVrと、前記参照画像平面内に設定された原点から前記複数の輝度勾配ベクトルVrそれぞれの始点位置に向かう複数のベクトルであって、第1の2次元座標系で表現される複数の位置ベクトルRrと、前記複数の輝度勾配ベクトルVrそれぞれの始点位置から前記原点に向かう複数のベクトルであって、前記複数の輝度勾配ベクトルVrそれぞれの方向を基準軸とする第2の2次元座標系で表現される複数の投票ベクトルUrとを、互いに対応付けて記憶する記憶部と、
    前記探索画像を構成する複数の画素間の輝度値の勾配を示す複数の輝度勾配ベクトルVsを算出する輝度勾配ベクトル算出部と、
    前記輝度勾配ベクトル算出部で算出された前記複数の輝度勾配ベクトルVsと、前記記憶部に記憶されている前記複数の位置ベクトルRr及び前記複数の投票ベクトルUrとに基づいて、前記探索画像平面上における前記原点に対応する位置を特定することによって、前記探索画像内における前記参照画像の位置を特定する位置特定部とを備え、
    前記位置特定部は、
    前記輝度勾配ベクトル算出部で算出された前記複数の輝度勾配ベクトルVs、及び前記記憶部に記憶されている前記複数の投票ベクトルUrのうちの少なくとも一方からベクトルの一部を間引くことによって、処理対象の前記輝度勾配ベクトルVs及び処理対象の前記投票ベクトルUrを抽出するサンプリング部と、
    前記処理対象の輝度勾配ベクトルVsそれぞれの始点位置に、前記輝度勾配ベクトルVsと前記基準軸とが一致するように回転させた前記処理対象の投票ベクトルUrを配置し、前記投票ベクトルUrの終点位置を、前記探索画像平面上における前記原点に対応する位置である候補点と推定する原点位置推定部と、
    前記原点位置推定部で推定された候補点それぞれに前記複数の位置ベクトルRrを配置し、前記複数の位置ベクトルRrそれぞれの終点位置に存在する前記輝度勾配ベクトルVsが最も多い前記候補点を、前記原点に対応する位置と特定する再検証部とを備える
    画像処理装置。
  2. 前記再検証部は、さらに、前記原点位置推定部で推定された前記候補点それぞれに対して、当該候補点を指し示す前記投票ベクトルUrの始点位置に存在する前記輝度勾配ベクトルVsと、前記投票ベクトルUrに対応付けられて前記記憶部に記憶されている前記輝度勾配ベクトルVrとのなす角である回転角を算出し、前記回転角だけ回転させた前記複数の位置ベクトルRrそれぞれの終点位置に存在する前記輝度勾配ベクトルVsが最も多い前記候補点を、前記原点に対応する位置と特定する
    請求項1に記載の画像処理装置。
  3. 前記再検証部は、さらに、前記原点位置推定部で推定された前記候補点それぞれに対して、前記複数の位置ベクトルRrそれぞれの終点位置に存在する前記輝度勾配ベクトルVsのうち、当該位置ベクトルRrに対応付けられて前記記憶部に記憶されている前記輝度勾配ベクトルVrと大きさが実質的に一致するか、又方向が実質的に一致する前記輝度勾配ベクトルVsの数を算出し、算出された前記輝度勾配ベクトルVsが最も多い前記候補点を、前記原点に対応する位置と特定する
    請求項1又は2に記載の画像処理装置。
  4. 前記位置特定部は、さらに、特定の画素の画素値と、当該特定の画素の周囲に位置する複数の画素の画素値の平均値との差分値である特徴量を算出する特徴量算出部を備え、
    前記再検証部は、さらに、前記原点位置推定部で推定された前記候補点それぞれに対して、前記複数の位置ベクトルRrそれぞれの終点位置の画素のうち、前記特徴量が、前記参照画像において対応する画素の前記特徴量と実質的に一致する画素の数を算出し、算出された画素の数が最も多い前記候補点を、前記原点に対応する位置と特定する
    請求項1〜3のいずれか1項に記載の画像処理装置。
  5. 前記原点位置推定部は、前記投票ベクトルの終点位置が予め定めた閾値以上集まる位置のみを、前記候補点と推定する
    請求項1〜4のいずれか1項に記載の画像処理装置。
  6. 原点位置推定部は、さらに、前記処理対象の輝度勾配ベクトルVsそれぞれの始点位置に、所定の倍率に拡大又は縮小した前記処理対象の投票ベクトルUrを配置する
    請求項1〜5のいずれか1項に記載の画像処理装置。
  7. 参照画像を構成する複数の画素間の輝度値の勾配を示す複数の輝度勾配ベクトルVrと、前記参照画像平面内に設定された原点から前記複数の輝度勾配ベクトルVrそれぞれの始点位置に向かう複数のベクトルであって、第1の2次元座標系で表現される複数の位置ベクトルRrと、前記複数の輝度勾配ベクトルVrそれぞれの始点位置から前記原点に向かう複数のベクトルであって、前記複数の輝度勾配ベクトルVrそれぞれの方向を基準軸とする第2の2次元座標系で表現される複数の投票ベクトルUrとを、互いに対応付けて記憶する記憶部を備える画像処理装置に、探索画像内における前記参照画像の位置を特定させる画像処理方法であって、
    前記探索画像を構成する複数の画素間の輝度値の勾配を示す複数の輝度勾配ベクトルVsを算出する輝度勾配ベクトル算出ステップと、
    前記輝度勾配ベクトル算出ステップで算出された前記複数の輝度勾配ベクトルVsと、前記記憶部に記憶されている前記複数の位置ベクトルRr及び前記複数の投票ベクトルUrとに基づいて、前記探索画像平面上における前記原点に対応する位置を特定することによって、前記探索画像内における前記参照画像の位置を特定する位置特定ステップとを含み、
    前記位置特定ステップは、
    前記輝度勾配ベクトル算出ステップで算出された前記複数の輝度勾配ベクトルVs、及び前記記憶部に記憶されている前記複数の投票ベクトルUrのうちの少なくとも一方からベクトルの一部を間引くことによって、処理対象の前記輝度勾配ベクトルVs及び処理対象の前記投票ベクトルUrを抽出するサンプリングステップと、
    前記処理対象の輝度勾配ベクトルVsそれぞれの始点位置に、前記輝度勾配ベクトルVsと前記基準軸とが一致するように回転させた前記処理対象の投票ベクトルUrを配置し、前記投票ベクトルUrの終点位置を、前記探索画像平面上における前記原点に対応する位置である候補点と推定する原点位置推定ステップと、
    前記原点位置推定ステップで推定された候補点それぞれに前記複数の位置ベクトルRrを配置し、前記複数の位置ベクトルRrそれぞれの終点位置に存在する前記輝度勾配ベクトルVsが最も多い前記候補点を、前記原点に対応する位置と特定する再検証ステップとを含む
    画像処理方法。
  8. 参照画像を構成する複数の画素間の輝度値の勾配を示す複数の輝度勾配ベクトルVrと、前記参照画像平面内に設定された原点から前記複数の輝度勾配ベクトルVrそれぞれの始点位置に向かう複数のベクトルであって、第1の2次元座標系で表現される複数の位置ベクトルRrと、前記複数の輝度勾配ベクトルVrそれぞれの始点位置から前記原点に向かう複数のベクトルであって、前記複数の輝度勾配ベクトルVrそれぞれの方向を基準軸とする第2の2次元座標系で表現される複数の投票ベクトルUrとを、互いに対応付けて記憶する記憶部を備えるコンピュータに、探索画像内における前記参照画像の位置を特定させるプログラムであって、
    前記探索画像を構成する複数の画素間の輝度値の勾配を示す複数の輝度勾配ベクトルVsを算出する輝度勾配ベクトル算出ステップと、
    前記輝度勾配ベクトル算出ステップで算出された前記複数の輝度勾配ベクトルVsと、前記記憶部に記憶されている前記複数の位置ベクトルRr及び前記複数の投票ベクトルUrとに基づいて、前記探索画像平面上における前記原点に対応する位置を特定することによって、前記探索画像内における前記参照画像の位置を特定する位置特定ステップとを、コンピュータに実行させ、
    前記位置特定ステップは、
    前記輝度勾配ベクトル算出ステップで算出された前記複数の輝度勾配ベクトルVs、及び前記記憶部に記憶されている前記複数の投票ベクトルUrのうちの少なくとも一方からベクトルの一部を間引くことによって、処理対象の前記輝度勾配ベクトルVs及び処理対象の前記投票ベクトルUrを抽出するサンプリングステップと、
    前記処理対象の輝度勾配ベクトルVsそれぞれの始点位置に、前記輝度勾配ベクトルVsと前記基準軸とが一致するように回転させた前記処理対象の投票ベクトルUrを配置し、前記投票ベクトルUrの終点位置を、前記探索画像平面上における前記原点に対応する位置である候補点と推定する原点位置推定ステップと、
    前記原点位置推定ステップで推定された候補点それぞれに前記複数の位置ベクトルRrを配置し、前記複数の位置ベクトルRrそれぞれの終点位置に存在する前記輝度勾配ベクトルVsが最も多い前記候補点を、前記原点に対応する位置と特定する再検証ステップとを、コンピュータに実行させる
    プログラム。
  9. 参照画像を構成する複数の画素間の輝度値の勾配を示す複数の輝度勾配ベクトルVrと、前記参照画像平面内に設定された原点から前記複数の輝度勾配ベクトルVrそれぞれの始点位置に向かう複数のベクトルであって、第1の2次元座標系で表現される複数の位置ベクトルRrと、前記複数の輝度勾配ベクトルVrそれぞれの始点位置から前記原点に向かう複数のベクトルであって、前記複数の輝度勾配ベクトルVrそれぞれの方向を基準軸とする第2の2次元座標系で表現される複数の投票ベクトルUrとを、互いに対応付けて記憶する記憶部を備える画像処理装置に搭載されて、探索画像内における前記参照画像の位置を特定する集積回路であって、
    前記探索画像を構成する複数の画素間の輝度値の勾配を示す複数の輝度勾配ベクトルVsを算出する輝度勾配ベクトル算出部と、
    前記輝度勾配ベクトル算出部で算出された前記複数の輝度勾配ベクトルVsと、前記記憶部に記憶されている前記複数の位置ベクトルRr及び前記複数の投票ベクトルUrとに基づいて、前記探索画像平面上における前記原点に対応する位置を特定することによって、前記探索画像内における前記参照画像の位置を特定する位置特定部とを備え、
    前記位置特定部は、
    前記輝度勾配ベクトル算出部で算出された前記複数の輝度勾配ベクトルVs、及び前記記憶部に記憶されている前記複数の投票ベクトルUrのうちの少なくとも一方からベクトルの一部を間引くことによって、処理対象の前記輝度勾配ベクトルVs及び処理対象の前記投票ベクトルUrを抽出するサンプリング部と、
    前記処理対象の輝度勾配ベクトルVsそれぞれの始点位置に、前記輝度勾配ベクトルVsと前記基準軸とが一致するように回転させた前記処理対象の投票ベクトルUrを配置し、前記投票ベクトルUrの終点位置を、前記探索画像平面上における前記原点に対応する位置である候補点と推定する原点位置推定部と、
    前記原点位置推定部で推定された候補点それぞれに前記複数の位置ベクトルRrを配置し、前記複数の位置ベクトルRrそれぞれの終点位置に存在する前記輝度勾配ベクトルVsが最も多い前記候補点を、前記原点に対応する位置と特定する再検証部とを備える
    集積回路。
JP2010118605A 2010-05-24 2010-05-24 画像処理装置、画像処理方法、プログラム、及び集積回路 Expired - Fee Related JP5414620B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2010118605A JP5414620B2 (ja) 2010-05-24 2010-05-24 画像処理装置、画像処理方法、プログラム、及び集積回路
CN201180002958.9A CN102473306B (zh) 2010-05-24 2011-03-18 图像处理装置、图像处理方法、程序以及集成电路
US13/386,500 US8520950B2 (en) 2010-05-24 2011-03-18 Image processing device, image processing method, program, and integrated circuit
PCT/JP2011/001609 WO2011148549A1 (ja) 2010-05-24 2011-03-18 画像処理装置、画像処理方法、プログラム、及び集積回路

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010118605A JP5414620B2 (ja) 2010-05-24 2010-05-24 画像処理装置、画像処理方法、プログラム、及び集積回路

Publications (2)

Publication Number Publication Date
JP2011248463A JP2011248463A (ja) 2011-12-08
JP5414620B2 true JP5414620B2 (ja) 2014-02-12

Family

ID=45003551

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010118605A Expired - Fee Related JP5414620B2 (ja) 2010-05-24 2010-05-24 画像処理装置、画像処理方法、プログラム、及び集積回路

Country Status (4)

Country Link
US (1) US8520950B2 (ja)
JP (1) JP5414620B2 (ja)
CN (1) CN102473306B (ja)
WO (1) WO2011148549A1 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103473543B (zh) * 2012-06-07 2016-10-05 富士通株式会社 用于提取图像中对象边界的装置、方法以及电子设备
JP5533988B2 (ja) * 2012-11-30 2014-06-25 株式会社デンソーアイティーラボラトリ 画像処理システム
CN104166977B (zh) * 2013-05-17 2017-10-10 中国航空工业集团公司洛阳电光设备研究所 一种图像匹配相似性测度方法及其图像匹配方法
KR102601732B1 (ko) * 2016-05-31 2023-11-14 삼성디스플레이 주식회사 영상 부호화 방법 및 영상 복호화 방법
FR3069087B1 (fr) * 2017-07-11 2019-08-23 Commissariat A L'energie Atomique Et Aux Energies Alternatives Procede de traitement d'une image
JP6590329B1 (ja) * 2019-06-26 2019-10-16 株式会社ラディウス・ファイブ 画像表示システム及びプログラム
CN112333903B (zh) * 2020-10-28 2023-04-07 浙江大华技术股份有限公司 灯光场景下的聚焦方法及装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3606430B2 (ja) * 1998-04-14 2005-01-05 松下電器産業株式会社 画像整合性判定装置
US6711293B1 (en) 1999-03-08 2004-03-23 The University Of British Columbia Method and apparatus for identifying scale invariant features in an image and use of same for locating an object in an image
JP2005228150A (ja) * 2004-02-13 2005-08-25 Matsushita Electric Ind Co Ltd 画像照合装置
JP4187704B2 (ja) * 2004-08-31 2008-11-26 三洋電機株式会社 手ぶれ補正装置
JP4348441B2 (ja) * 2007-01-22 2009-10-21 国立大学法人 大阪教育大学 位置検出装置、位置検出方法、データ判定装置、データ判定方法、コンピュータプログラム及び記憶媒体
JP2010525299A (ja) * 2007-02-09 2010-07-22 ジーイー・ヘルスケア・バイオサイエンス・コーポレイション 生体物質の動きを追跡するシステム及び方法
US8103115B2 (en) * 2007-02-26 2012-01-24 Sony Corporation Information processing apparatus, method, and program
JP4378660B2 (ja) 2007-02-26 2009-12-09 ソニー株式会社 情報処理装置および方法、並びにプログラム
JP4790653B2 (ja) * 2007-03-30 2011-10-12 シャープ株式会社 画像処理装置、制御プログラム、コンピュータ読み取り可能な記録媒体、電子機器及び画像処理装置の制御方法
US8321144B2 (en) * 2008-10-23 2012-11-27 Microsoft Corporation Non-contiguous regions processing

Also Published As

Publication number Publication date
CN102473306A (zh) 2012-05-23
JP2011248463A (ja) 2011-12-08
CN102473306B (zh) 2015-04-01
US20120121189A1 (en) 2012-05-17
WO2011148549A1 (ja) 2011-12-01
US8520950B2 (en) 2013-08-27

Similar Documents

Publication Publication Date Title
JP5414620B2 (ja) 画像処理装置、画像処理方法、プログラム、及び集積回路
JP5384746B2 (ja) プルーニング機能、画像スケーリング、および、空間制約付き特徴マッチングによる画像認識アルゴリズムの性能の改善
JP5602940B2 (ja) 事前計算されたスケール空間からのデイジー記述子生成
US20130208997A1 (en) Method and Apparatus for Combining Panoramic Image
US20100033584A1 (en) Image processing device, storage medium storing image processing program, and image pickup apparatus
CN106469455B (zh) 图像处理方法、图像处理设备以及记录介质
US9058655B2 (en) Region of interest based image registration
EP3093822B1 (en) Displaying a target object imaged in a moving picture
JP2011511340A (ja) 画像識別のための特徴ベースの識別特性(signature)
US20190279022A1 (en) Object recognition method and device thereof
KR101868740B1 (ko) 파노라마 이미지 생성 방법 및 장치
CN105208263B (zh) 图像处理装置及其控制方法
CN114187333A (zh) 一种图像对齐方法、图像对齐装置及终端设备
JP2014186520A (ja) 画像処理装置、画像処理方法およびプログラム
JP6171660B2 (ja) 情報処理装置、情報処理システム及びプログラム
JP6080424B2 (ja) 対応点探索装置、そのプログラムおよびカメラパラメータ推定装置
JP4966080B2 (ja) 対象物検出装置
US11232323B2 (en) Method of merging images and data processing device
EP4124015A1 (en) Information processing device, information processing method, and information processing program
JP6716769B1 (ja) 画像検査方法、画像検査装置、及び画像検査プログラム
JP6265641B2 (ja) 画像処理装置、画像処理方法及び画像処理プログラム
JP5865687B2 (ja) 画像特徴量抽出装置およびそのプログラム
WO2015159585A1 (ja) 画像処理装置、撮像装置、画像処理方法およびプログラム
KR101636481B1 (ko) 컴파운드뷰 이미지 생성 방법 및 장치
KR101627974B1 (ko) 영상 블러에 강인한 영상 특징 기술자 생성 방법 및 장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120921

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131015

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131112

R150 Certificate of patent or registration of utility model

Ref document number: 5414620

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees