JP5602940B2 - 事前計算されたスケール空間からのデイジー記述子生成 - Google Patents

事前計算されたスケール空間からのデイジー記述子生成 Download PDF

Info

Publication number
JP5602940B2
JP5602940B2 JP2013506283A JP2013506283A JP5602940B2 JP 5602940 B2 JP5602940 B2 JP 5602940B2 JP 2013506283 A JP2013506283 A JP 2013506283A JP 2013506283 A JP2013506283 A JP 2013506283A JP 5602940 B2 JP5602940 B2 JP 5602940B2
Authority
JP
Japan
Prior art keywords
scale
points
orientation
scale space
smoothed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2013506283A
Other languages
English (en)
Other versions
JP2013525905A (ja
Inventor
ハムシシー、オヌル
ホン、ジョン・エイチ.
レズニク、ユリー
バドダディー、サンディープ
リー、チョン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2013525905A publication Critical patent/JP2013525905A/ja
Application granted granted Critical
Publication of JP5602940B2 publication Critical patent/JP5602940B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Description

米国特許法第119条による優先権の主張
本特許出願は、両方とも本出願の譲受人に譲渡され、参照により本明細書に明確に組み込まれる、2010年4月20日に出願された「Extracting Daisy Descriptor in Scale-Space」と題する米国仮出願第61/326,087号と、2010年11月11日に出願された「Fast Descriptor Extraction in Scale-Space」と題する米国仮出願第61/412,759号との優先権を主張する。
1つの特徴は、コンピュータビジョンに関し、より詳細には、画像の認識及び検索性能、処理、及び/又は圧縮を改善するための方法及び技法に関する。
様々な適用例は、視覚表現(例えば、画像又はピクチャ)中の対象物を識別することが可能である機械又はプロセッサを有することから恩恵を受け得る。コンピュータビジョンの分野は、画像中の対象物又は特徴を識別することを可能にする技法及び/又はアルゴリズムを提供することを試みており、対象物又は特徴は、一つ以上のポイント(例えば、全ての画素ポイント、注目するキーポイントなど)を識別する記述子によって特徴づけられ得る。これらの技法及び/又はアルゴリズムはまた、しばしば、適用例の中でも、顔認識、対象物検出、画像マッチング、3次元構造構築、ステレオ対応、及び/又は動き追跡に適用される。概して、対象物又は特徴認識は、特徴識別、画像検索、及び/又は対象物認識の目的で画像中の注目するポイントを識別することを伴い得る。好ましくは、ポイントは、それらが画像スケール変化及び/又は回転に対して不変(invariant)であり、歪み、視点の変化、及び/又はノイズ及び照明の変化の実質的な範囲にわたってロバストなマッチングを与えるように、選択及び/又は処理され得る。さらに、画像検索及び対象物認識などのタスクのために好適であるように、特徴記述子は、好ましくは、単一の特徴が、複数のターゲット画像からの特徴の大規模データベースに対して高い確率で正しくマッチングされ得るという意味において特徴的であり得る。
例えば、注目するポイントの位置を特定するために、ガウスピラミッドを使用して局所画像計算が実行され得る。SIFT(スケール不変特徴変換(scale invariant feature transform))など、幾つかのコンピュータビジョンアルゴリズムが、そのようなポイントを計算するために使用され、次いで、シーン中の特定の対象物の検出又は特徴に基づくクエリ対象物の分類への最初のステップとして、それらのポイントの周りの局在特徴を抽出することに進む。
画像中の一つ以上のポイントが検出され、位置を特定された後、それらのポイントは、様々な記述子を使用することによって識別又は記述され得る。例えば、記述子は、画像特性の中でも、形状、色、テクスチャ、回転、及び/又は動きなど、画像中のコンテンツの視覚特徴を表し得る。記述子は、ポイントと、そのポイントの周りの局所近傍とを表し得る。記述子抽出の目的は、ポイントの周りの局所情報について、ロバストで、ノイズのない表現を獲得することである。
ポイントに対応し、記述子によって表される個々の特徴は、既知の対象物からの特徴のデータベースにマッチングされる。従って、対応探索システムは、ポイント検出器と、特徴記述子と、対応ロケータという、3つのモジュールに分離され得る。これらの3つの論理モジュールでは、記述子の構築複雑さ及び次元数(dimensionality)が特徴マッチングシステムの性能に直接著しい影響を及ぼす。
そのような特徴記述子は、リアルタイム対象物認識、拡張現実、3D再構成、パノラマステッチング、ロボットマッピング、ビデオ追跡、及び同様のタスクに適用例をますます見出している。適用例によっては、特徴記述子(又は等価物)の送信及び/又は記憶は、対象物検出の計算の速度及び/又は画像データベースのサイズを制限することがある。モバイルデバイス(例えば、カメラフォン、モバイルフォンなど)又は分散カメラネットワークのコンテキストでは、ノード間での記述子抽出にかなりの通信及び処理リソースが費やされ得る。記述子抽出の計算集約的プロセスは、モバイルフォンなど、リソースの限られたデバイスに対するそれの適用を妨げるか又は複雑にする傾向がある。
様々な記述子が提案されており、各々が異なる利点を有する。スケール不変特徴変換(SIFT)は、ポイントの近傍にある(画素勾配の)支配的配向と整合され、検出されたポイントのスケールレベルに比例してサイズ決定された方形パッチを開く。この領域中の勾配値はセル中にまとめられ、各セル中には複数のビン配向ヒストグラムがある。デイジー記述子(Daisy descriptor)は、高密度マッチング及びパッチ対応問題においてSIFTよりも良好で高速のマッチング性能を示している。SIFT記述子に勝るデイジー記述子の重要な利点は、デイジー記述子を構築する際に、配向微分の空間ビニング(spatial binning)が異なる解像度を表すということである。より詳細には、ビンがポイントからさらに離れて位置するほど、空間ビンサイズはより大きくなる(即ち、より粗くなる)。異なる解像度を使用することにより、デイジー記述子は回転及びスケール変化に対してよりロバストになる。ただし、高速空間ビニングデイジー記述子を計算するには、画像微分ごとに3つのスケールのスケール空間を構築するための追加メモリが必要になる。(SIFTに対して)デイジー記述子アルゴリズムの別の重要な制限は、記憶のために必要とされる追加メモリである。例えば、8つの配向微分の各々について3つのスケールレベルが必要とされる。デイジー記述子を使用するとき、合計追加メモリはM×N画像について(即ち、平滑化画素ごとに1バイトのダイナミックレンジを仮定して)24×M×Nバイトである。メモリ複雑さは、Sスケールレベルをもつスケール空間では、さらに24×M×N×Sに増加する。これは、スケール不変デイジー記述子、即ちスケール空間中のデイジー記述子の抽出を制限する。
従って、スケール空間中のデイジー記述子を生成及び/又は記憶するために必要とされるメモリの量を低減するための方法が必要とされる。
以下で、幾つかの実施形態の基本的な理解を与えるために、一つ以上の実施形態の簡略化された概要を提示する。この概要は、全ての企図される実施形態の包括的な概観ではなく、全ての実施形態の主要又は重要な要素を識別するものでも、いずれか又は全ての実施形態の範囲を定めるものでもない。その唯一の目的は、後で提示するより詳細な説明の導入として、一つ以上の実施形態の幾つかの概念を簡略化された形式で提示することである。
画像のための局所特徴記述子を生成するための方法が提供される。画像は、複数のスケール空間を取得するために漸進的に平滑化され得る。画像のための複数のスケール空間からの第1のスケール空間内のポイントが識別される。次いで、複数のスケール空間の各々について複数の画像微分が取得され、複数の配向マップの各々が、対応する画像微分の非負値から取得される。次いで、複数のスケール空間中のスケール空間ごとに複数の配向マップが取得される。各スケール空間のための複数の配向マップは、複数の異なる配向のための配向マップを含み得る。各配向マップは、単一の対応する平滑化配向マップに分解し得る。対応する複数の平滑化配向マップを取得するために複数の配向マップの各々が平滑化される。複数の平滑化配向マップ内の配向マップの平滑化は配向マップのスケール空間レベルに比例し得る。次いで、複数のスケール空間からの2つ以上のスケール空間に対応する複数の平滑化配向マップをばらばらにサンプリング(スパースサンプリング)することによって、ポイントについての局所特徴記述子が生成又は取得され得る。例えば、局所特徴記述子は、ポイントの中心上に分散されたサンプルポイントの空間プーリングによって定義されたカーネルプーリング構成を有し得る。幾つかの事例では、局所特徴記述子は、複数の平滑化配向マップのばらばらのサンプリングからの配向勾配から構築された複数のヒストグラムを備え得る。
一例では、ポイントは、複数のスケール空間内の位置のサブセットからのサンプルポイントであり得る。例えば、位置のサブセットは、対象物についての予想パターンに基づいて選択され得る。別の例では、位置のサブセットは、画像内の識別キーポイントに基づいて選択され得、キーポイントは、イメージング条件の変化に対してロバストであると識別されているポイントである。
一例では、2つ以上のスケール空間は、第1のスケール空間と、第1のスケール空間よりも低い解像度の一つ以上の追加のスケール空間とを含む。例えば、複数の平滑化配向マップをばらばらにサンプリングすることは、(a)第1の平滑化配向マップ上の第1の複数のポイントをサンプリングすることであって、第1の複数のポイントが、ポイントの位置と同心の第1のリングに配置された、サンプリングすること、(b)第2の平滑化配向マップ上の第2の複数のポイントをサンプリングすることであって、第2の複数のポイントが、ポイントの位置と同心の第2のリングに配置され、第2の平滑化配向マップが、第1のスケール空間よりも低い解像度の第2のスケール空間に対応する、サンプリングすること、及び/又は(c)第3の平滑化配向マップ上の第3の複数のポイントをサンプリングすることであって、第3の複数のポイントが、ポイントの位置と同心の第3のリングに配置され、第3の平滑化配向マップが、第1のスケール空間よりも低い解像度の第3のスケール空間に対応する、サンプリングすることを含み得る。一例では、第2のリングは、第1のリングの第1の半径よりも大きい第2の半径を有し得、第3のリングは、第2のリングの第2の半径よりも大きい第3の半径を有する。
一態様によれば、複数の配向マップは、同じ平滑化係数を使用して平滑化され得、第1のスケール空間は、2つ以上のスケール空間のうちの1つであり、第2のスケール空間は、第1のスケール空間に対して所望の平滑化を達成するように選択される。
画像のための局所特徴記述子を生成するための画像処理装置が提供される。画像処理装置は、入力インターフェース/機器、記憶装置、及び/又は処理回路を含み得る。入力インターフェースは、画像を取得、撮像、及び/又は受信するように働くか若しくは適応され得る。記憶装置は、一つ以上の画像についての局所特徴記述子を記憶するように働き得る。処理回路は、入力インターフェースと記憶装置とに結合され、(a)複数のスケール空間を取得するために画像を漸進的に平滑化すること、(b)複数のスケール空間からの第1のスケール空間内のポイントを識別すること、(c)複数のスケール空間の各々について複数の画像微分を取得すること、(d)複数のスケール空間中のスケール空間ごとに複数の配向マップを取得することであって、複数の配向マップの各々が、対応する画像微分の非負値から取得される、取得すること、(e)対応する複数の平滑化配向マップを取得するために複数の配向マップの各々を平滑化すること、及び/又は(f)ポイントについての局所特徴記述子を生成するために、複数のスケール空間からの2つ以上のスケール空間に対応する複数の平滑化配向マップをばらばらにサンプリングすることを行うための演算を実行するように適応され得、及び/又はそのための一つ以上の回路を含み得る。局所特徴記述子は、ポイントの中心上に分散されたサンプルポイントの空間プーリングによって定義されたカーネルプーリング構成を有し得る。
2つ以上のスケール空間は、第1のスケール空間と、第1のスケール空間よりも低い解像度の一つ以上の追加のスケール空間とを含み得る。ポイントは、複数のスケール空間内の位置のサブセットからのサンプルポイントであり得る。
複数の平滑化配向マップをまばらにサンプリングすることは、(a)第1の平滑化配向マップ上の第1の複数のポイントをサンプリングすることであって、第1の複数のポイントが、ポイントの位置と同心の第1のリングに配置された、サンプリングすること、(b)第2の平滑化配向マップ上の第2の複数のポイントをサンプリングすることであって、第2の複数のポイントが、ポイントの位置と同心の第2のリングに配置され、第2の平滑化配向マップが、第1のスケール空間よりも低い解像度の第2のスケール空間に対応する、サンプリングすること、及び/又は(c)第3の平滑化配向マップ上の第3の複数のポイントをサンプリングすることを含み、第3の複数のポイントが、ポイントの位置と同心の第3のリングに配置され、第3の平滑化配向マップが、第1のスケール空間よりも低い解像度の第3のスケール空間に対応する。処理装置は、複数の平滑化配向マップのばらばらのサンプリングから複数の配向勾配ヒストグラムを構築するように構成でき、局所特徴記述子が複数のヒストグラムを備える。一例では、複数の配向マップは、同じ平滑化係数を使用して平滑化され、第1のスケール空間は、2つ以上のスケール空間のうちの1つであり、第2のスケール空間は、第1のスケール空間に対して所望の平滑化を達成するように選択される。
様々な特徴、性質、及び利点は、全体を通じて同様の参照符号が同様のものを指す図面とともに、以下に記載する詳細な説明を読めば明らかになろう。
効率的に生成されたデイジー記述子を使用することによってクエリ画像上で対象物認識を実行するための機能段階を示すブロック図。 一例による、デイジー記述子を生成するために使用されるスケール空間と配向マップとの生成を示す図。 スケール空間のスケールレベルが、配向マップを定義するために複数の勾配配向を有する画素をどのように含み得るかを示す図。 配向マップがスケール空間レベルからどのように生成され得るかを示す図。 配向マップがスケール空間レベルからどのように生成され得るかを示す図。 配向マップがスケール空間レベルからどのように生成され得るかを示す図。 デイジー記述子の典型的な生成を示す図。 配向マップごとに複数の平滑化(畳み込み)配向マップを生成する必要を回避するより効率的な一例による、修正デイジー記述子を生成するために使用されるスケール空間と配向マップとの生成を示す図。 デイジー記述子が、スケール空間ピラミッドの複数のレベルを使用することによってどのように生成され得るかを示す図。 スケール空間上の修正デイジー記述子と比較した、典型的なデイジー記述子の生成の比較を示す図。 複数のスケール空間レベルにわたって記述子を生成する記述子生成デバイスの一例を示すブロック図。 複数のスケール空間レベルにわたって局所特徴記述子を生成するための方法を示す流れ図。 スケール空間の複数のレベルにわたって生成された局所記述子を使用して画像又は対象物認識のために画像処理を実行するように適応された例示的なモバイルデバイスを示すブロック図。
次に、図面を参照しながら様々な実施形態について説明する。図面全体にわたって、同様の要素を指すのに同様の参照番号を使用する。以下の記述では、説明のために、一つ以上の実施形態の完全な理解を与えるために多数の具体的な詳細を記載する。ただし、そのような(一つ又は複数の)実施形態は、これらの具体的な詳細なしに実施され得ることは明らかであろう。他の例では、一つ以上の実施形態の説明を円滑にするために、よく知られている構造及びデバイスをブロック図の形態で示す。
概観
デイジー記述子の生成を改善するための技法が提供される。平滑化(畳み込み)配向マップの数を3から1に低減し、それによって、デイジー記述子を生成するために必要とされるメモリの量を低減する、修正デイジー記述子方法が提供される。具体的には、各配向マップから複数の平滑化配向マップを生成する代わりに、各スケール空間レベルの(即ち、対応する配向画像微分の非負値を含む)配向マップごとにただ1つの平滑化配向マップが生成される。次いで、デイジー記述子の生成においてより高いスケール空間の平滑化配向マップが使用される。これを行うために、スケール空間ピラミッドのより高いスケールは、通常ならば、元のデイジー記述子を生成する際に使用された配向マップごとの複数の平滑化配向マップによって取得されたであろう解像度を近似するように特に選択され得る。
さらに他の実装形態では、スケール空間ピラミッドのより高いスケールは、従来のデイジー記述子プロセスによって採用されたであろう解像度を顧慮せずに選択され得る。
スケール空間ピラミッドの複数のレベルにわたって修正デイジー記述子を生成することにより、そのような修正デイジー記述子がノイズに対してよりロバストにもなることに留意されたい。元のデイジー記述子アルゴリズムは、より細かい(現在のスケール)及びより粗い(より高いスケール)平滑化配向マップを導出するために単一のスケール空間レベルを使用し、それによってスケール空間ピラミッドの単一のレベルを利用する。対照的に、本手法は、ピラミッドのスケール空間レベルが高いほどノイズのより少ない勾配値が生成されるので、ノイズに対してより安定している。この理由は、より大きいカーネルを用いて画像を平滑化することにより、配向マップを生成する微分演算によって増幅され得る高周波ノイズが除去されるからである。
例示的な対象物認識プロセス
図1は、効率的に生成されたデイジー記述子を使用することによってクエリ画像上で対象物認識を実行するための機能段階を示すブロック図である。画像キャプチャ段階102において、クエリ画像108が撮像されるか又は他の方法で取得され得る。例えば、クエリ画像108は、デジタルキャプチャ画像を取得するために、一つ以上の画像センサ及び/又はアナログデジタル変換器を含み得る、撮像装置によって撮像され得る。画像センサ(例えば、電荷結合装置(CCD)、相補型金属半導体(CMOS))は光を電子に変換し得る。電子はアナログ信号を形成し得、次いで、そのアナログ信号は、アナログデジタル変換器によってデジタル値に変換される。このようにして、画像I(x,y)を、例えば、対応する色、照度、及び/又は他の特性をもつ複数の画素として定義し得るデジタルフォーマットで画像108は撮像され得る。
次いで、画像処理段階104において、撮像された画像108は、対応するスケール空間(例えば、ガウススケール空間)を生成し(120)、特徴/ポイント検出を実行し(122)、スケール空間ごとに配向画像微分を取得し(119)、画像微分から配向マップ生成を実行し(121)、及び/又はスケール空間中の局所特徴記述子(例えば、修正デイジー記述子)生成を実行する(128)ことによって処理される。画像比較段階106において、取得された記述子128を使用して、既知の記述子のデータベース131との特徴マッチング130を実行する。記述子データベース131中の記述子は、スケール空間中の局所特徴記述子を抽出することによって同様に生成され得る。即ち、複数のテスト画像について、記述子が事前に生成され、記述子データベース131に記憶され得る。次いで、特徴マッチングが正しいことを確認するために、ポイントマッチングに対する幾何学的検証又は整合性検査132が(例えば、マッチングしている記述子に基づいて)実行されて、マッチング結果134を与え得る。このようにして、クエリ画像(又はそのクエリ画像中の対象物)が、ターゲット画像109(又は対象物)のデータベースと比較され及び/又はそれから識別され得る。
画像中の特徴検出を実行するために、スケール不変特徴変換(SIFT)を含む、幾つかのアルゴリズムが開発されている。画像中の特定の対象物の検出への第1のステップは、それの局所特徴に基づいてクエリ対象物を分類することである。その目的は、例えば、照明、画像ノイズ、回転、スケーリング、及び/又は視点の小さい変化に対して不変及び/又はロバストである特徴を識別し、選択することである。即ち、クエリ画像と比較ターゲット画像との間には照明、画像ノイズ、回転、スケール、及び/又は視点の差があるにもかかわらず、これらの2つの画像間のマッチングが発見されなければならない。
デイジー記述子は、高密度マッチング及びパッチ対応問題においてSIFT記述子よりも良好で高速のマッチング性能を示している。SIFT記述子に勝るデイジー記述子の重要な利点は、デイジー記述子が、異なる解像度において配向微分の空間ビニングを使用することである。詳細には、デイジー記述子生成の際に、ビンがポイントからさらに離れて位置するほど、空間ビンサイズはより大きくなる。これにより、デイジー記述子は回転及びスケール変化に対してよりロバストになる。
例示的で典型的なデイジー記述子生成
デイジー記述子は、対象物の2つの視点間の対応を発見するために定義される。マッチングには2つの画像中のあらゆる画素が対応することが望まれるので、これを達成するための効率的な方法は、次いで比較され得る画像のための一つ以上の記述子を定義することである。スケール不変特徴変換(SIFT)並びに勾配位置及び配向ヒストグラム(GLOH)など、従来の記述子は、最初に画像の配向微分をとり、次いで、配向ヒストグラムを用いて指定された空間領域における配向微分を表すことによって記述子を構築する。この手順は、対応するヒストグラムビンのあらゆる画素勾配について3線補間(即ち、空間に対して2、及び配向に対して1)を計算することを必要とするので、計算量的に厳しい。デイジー記述子は、配向微分の線形補間の代わりに平滑化(例えば、ガウス平滑化)を使用することによってこの問題を克服する。さらに、デイジー記述子を生成するために使用される空間ビニングレイアウト(即ち、複数のレベルの平滑化配向マップにわたってポイントから出るより大きいビン)は、スケール、位置、及び配向変化に対するさらなるロバストネスを与える。
概して、典型的なデイジー記述子を生成するために、画像は、まず処理されて、スケール空間が取得される。スケール空間は処理されて、対応する配向微分(即ち、配向マップ)が取得される。複数の異なる平滑化係数を使用して各配向微分が平滑化されて、配向微分ごとに複数の平滑化(畳み込み)配向マップが取得される。次いで、複数の平滑化配向マップが使用されてデイジー記述子が生成される。
図2に、一例による、デイジー記述子を生成するために使用されるスケール空間と配向マップとの生成を示す。最初に、デジタル画像I(x,y)201が漸進的に平滑化/ぼかされて、スケール空間ピラミッド202が構築され得る。画像スケール空間ピラミッド202は、スケール空間が空間とスケールの両方においてサンプリングされる離散的表現である。ぼかし(平滑化)は、概して、スケールcσにおいてぼかし/平滑化関数G(x,y,ciσ)(平滑化関数gciσとしても表される)を用いて元の画像I(x,y)を畳み込むことに関与し、従って、スケール空間L(x,y,ciσ)は次式のように定義される。
Figure 0005602940
一例では、スケール空間ピラミッド202はガウススケール空間ピラミッドであり得る。従って、平滑化/ぼかし関数Gはガウスカーネルであり得、ciσは、画像I(x,y)をぼかすために使用されるガウス関数Gのスケーリング又は平滑化係数を示す。乗数ciが変化するにつれて(ci:c0<c1<c2<c3<c4)、スケーリング係数ciσが変化し、画像I(x,y)の漸進的なぼかし/平滑化が得られる。ここで、標準偏差σ(ステップサイズ)は、スケーリング/平滑化係数(例えば、ガウスカーネルの幅)を取得する際に使用され、従って、スケーリング/平滑化係数ciσはσiによって表される(即ち、σi=ciσ)。
ぼけた画像スケール空間Lを生成するために画像I(x,y)201が平滑化関数Gを用いて増分的に畳み込まれるとき、ぼけた画像スケール空間Lは、スケール空間において一定ファクタcだけ分離される。ぼけた(平滑化)画像スケール空間Lの数が増加し、スケール空間ピラミッド202のために与えられる近似が連続的空間に近づくにつれて、2つの隣接するスケールは1つのスケールに近づく。一例では、画像スケール空間Lはオクターブによってグループ化され得、オクターブは、標準偏差σの値の倍化に対応し得る。さらに、乗数ci(例えば、c0<c1<c2<c3<c4...)の値は、オクターブごとに固定数の画像スケール空間Lが取得されるように選択される。スケール空間及びスケールの比は、インパルス応答がピラミッド202の全てのレベルにおいて同じになるように、一定に保持され得る。一例では、スケーリングの各オクターブは、明示的な画像サイズ変更に対応し得る。従って、画像I(x,y)201が漸進的ぼかし/平滑化関数Gによってぼかされる/平滑化されるにつれて、画素の数は漸進的に低減される。スケール空間について、スケールレベルは、指数関数的に構成され得、例えば整数2のべき乗として構成され得る(例えば、σi=2i、i=0、0.25、0.5、0.75、1、1.25、1.5、1.75、2、...、3、...)。他の例では、2の平方根又はさらにより小さいスケーリングステップなど、より近接したスケール間隔が必要とされ得る。別の例では、ピラミッドのスケール空間レベルは、2s/Sとして定義され得、ただし、Sは各オクターブの解像度を定義し、sは、正の整数kについて、1とkとの間のスケールレベルである。例えば、上記の例ではS=4であり、従って、k={1,2,3,4}について、オクターブ0スケールレベル標準偏差はσi={0,0.25,0.5,0.75,1}である。
従来のデイジー記述子アルゴリズムでは、スケール空間ピラミッド202は実際に生成されないことに留意されたい。代わりに、画像201は単にぼかされ/平滑化され、デイジー記述子は画像201の平滑化バージョンから生成される。例えば、スケール空間ピラミッド202の他のレベルを生成することなしに平滑化画像204のみが生成され得る。
Figure 0005602940
この例では、複数の画像微分203は複数の画像微分を含み得る。スケール空間204ごとに、異なる配向(例えば、X、Y、Z、W配向)に対応する、複数の画像微分δX221、δY223、δZ225、及びδW227が生成されることに留意されたい。
第3に、次いで、対応する配向マップ206を取得するために画像微分203が処理される。ここに示す例では、対応する配向マップを生成するために、画像微分の各値に(・)+演算子が適用される。例えば、…(・)+演算子は、任意の負値δをとり、そのδを次式のように0に設定し得る。
Figure 0005602940
例えば、第1の画像微分δX221は、対応する配向マップγX208を有し、第2の画像微分δY223は、対応する配向マップγY210を有し、第3の画像微分δZ225は、対応する配向マップγZ212を有し、第4の画像微分δW227は、対応する配向マップγW213を有する。図3に、複数の画像微分203の画像微分221が、複数の勾配配向を有する画素をどのように含み得るかを示す。
Figure 0005602940
(・)+演算子又は関数は、対応する画像微分の負の画素勾配値を0に設定するクリッピング関数であり得る。
図4、図5、及び図6に、配向マップがスケール空間レベルからどのように生成され得るかを示す。スケール空間レベル204は画像201の平滑化バージョンであり得る。
Figure 0005602940
この例では、n画素×m画素の画像空間が使用され得る(例えば、n=m及び/又はn≠m)。
図4に、x配向に沿った配向マップの生成を示す。複数の値δx ijを有する対応する画像微分221を生成するために、スケール空間レベル204の画素勾配値βijにx配向に沿ってxフィルタ[−1 0 1]が適用される。xフィルタは、画像スケール空間レベル204の各行に沿ってx配向にシフト様式で適用され、xフィルタ[−1 0 1]の「0」値を中心とする。例えば、画素勾配値β11では、x配向値δx 11は0xβ11+1xβ12=β12に等しい。同様に、画素勾配値β12では、x配向値δx 12は−1xβ11+0xβ12+1xβ13に等しい。同様に、画素勾配値β13では、x配向値δx 13は−1xβ12+0xβ13+1xβ14に等しい。画像微分221を生成するために、このプロセスは、スケール空間レベル204の各行にわたってxフィルタを移動することによって繰り返される。
次いで、複数の値γxを有する対応する配向マップ208を取得するために、画像微分221の各値δxに(・)+演算子が適用される。(・)+演算子を使用して各配向マップ値γを計算する際に、配向に沿った正の微分のみが使用されることに留意されたい。
Figure 0005602940
例えば、δ12=−4である場合、γ12=0である。一般に、特定の画素勾配値δij<0である場合、γij=0である。従って、画素勾配値δij>0のみが配向値の計算に寄与する。
図5に、y配向に沿った配向マップの生成を示す。
Figure 0005602940
yフィルタは、スケール空間レベル204の各列に沿ってy配向にシフト様式で適用され、yフィルタ[−1 0 1]の「0」値を中心とする。例えば、画素勾配値β11では、y配向値δy 11は0xβ11+1xβ21=β21に等しい。同様に、画素勾配値β21では、y配向値δy 21は−1xβ11+0xβ21+1xβ31に等しい。同様に、画素勾配値β31では、y配向値δy 31は−1xβ21+0xβ31+1xβ41に等しい。画像微分223を生成するために、このプロセスは、スケール空間レベル204の各列にわたってyフィルタを移動することによって繰り返される。次いで、複数の値γyを有する対応する配向マップ210を取得するために、画像微分223の各値δyに(・)+演算子が適用される。
一例では、x配向は0度であり得、y配向は90度であり得る。異なる配向について複数の追加の画像微分が生成され得る。例えば、0度画像微分の負数をとることによって180度配向画像微分が取得され得る。同様に、90度画像微分の負数をとることによって270度配向画像微分が取得され得る。このようにして、4つの配向マップが取得され得る(即ち、0度、90度、180度、及び270度)。さらに他の実装形態では、45度、135度、225度、及び415度など、他の配向について追加の配向マップが取得され得る。
図6に、z配向に沿った配向マップの生成を示す。そのようなz配向は、例えば、x配向とy配向との間にあり得る。幾つかの実装形態では、そのようなz配向マップ212は、フィルタ(例えば、[−1 0 1])を対角線方向にシフトすることによって生成され得る。しかしながら、代替的に、z配向マップ212を取得するためにステアラブルフィルタ602が使用され得る。ステアラブルフィルタ602は、z方向に沿って画像微分225を取得するために、2つの他の画像微分(例えば、x配向画像微分221及びy配向画像微分223)を線形的に結合し得る。具体的には、そのような線形結合は、対応するz配向画像微分値δzを取得するために、対応する配向画像微分値δxとδyとを結合する。x配向画像微分221とy配向画像微分223の特定の線形結合は、探索されている特定の画像微分配向に依存し得る。例えば、45度画像微分配向が探索されている場合、対応する微分値δz ijを取得するために、x配向画像微分221の画像微分値δx ijとy配向画像微分223の画像微分値δy ijとが結合され得る。このようにして、45度の様々な倍数が取得され得る。同様に、(15度又は30度の倍数などの)他の配向マップが取得され得る。概して、角度φについて、対応する画像微分値は次式ように取得され得る。
Figure 0005602940
前述のように、次いで、複数の値γzを有する対応する配向マップ212を取得するために、画像微分225の各値δzに(・)+演算子が適用される。
従って、複数の配向マップが取得され得、配向マップの数は、探索される精度、利用可能な処理リソース、及び/又は利用可能なメモリリソースの関数であり得る。例えば、様々な実装形態は、4個、8個、12個、16個、20個、24個などの配向マップを使用し得る。幾つかの実装形態では、配向マップ間の角度は同じであり得る(例えば、90度、45度、30度、20度、15度、10度など)。
再び図2を参照すると、1つの手法によれば、スケール空間レベル204ごとに複数の配向マップ206が生成された後、
Figure 0005602940
Figure 0005602940
Figure 0005602940
Figure 0005602940
平滑化(畳み込み)配向マップ214、216、及び218中の各画素は、ガウス重みをもつ配向微分の空間プーリングに対応する。Z配向のこの例では、配向マップ212ごとに3つの平滑化配向マップ214、216、及び218が生成される。畳み込み演算は、配向マップの値をスケーリングする/ぼかす平滑化係数αiを効果的に適用する。
Figure 0005602940
この例では、そのような平滑化ファクタは、第1のスケーリングファクタσj(例えば、対応するスケール空間のスケーリングファクタ)と、第2のスケーリングファクタαi(例えば、平滑化配向マップのレベルごとに変化するスケーリングファクタ)との積として表され得る。同様の様式で、平滑化配向マップは、異なる配向(例えば、配向X、Y、Z、W、...)を有する対応する配向マップごとに生成され得る。
Figure 0005602940
図7に、デイジー記述子の典型的な生成を示す。
Figure 0005602940
Figure 0005602940
スケール空間204中の識別ポイント702(例えば、キーポイント、サンプルポイント、画素など)について、平滑化配向マップ215、217、及び219をばらばらにサンプリングすることによってデイジー記述子が取得され得る。これは、ポイント702の中心上に分散された空間プーリング構成(例えば、ガウスプーリング)によって達成され得る。この例では、空間プーリング構成は、異なる平滑化配向マップ215、217、及び219上の複数の同心リング704、706、及び708として定義され得る。同心リング704、706、及び708は、識別ポイント702に対応するサンプルポイント703に対して同心である。各同心リング704、706、及び708は、リングの外周に沿った複数のばらばらにサンプリングされたポイント710、712、及び714を含み得る。各ばらばらにサンプリングされたポイント710、712、及び714は、セル716、718、及び720(即ち、円)の中心として働き得、サンプルポイントがポイント702からさらに離れて移動するにつれてセルサイズ(即ち、半径)がサイズ増加する。一例では、空間プーリング構成は、3つの同心リング704、706、及び708に沿って24個のポイントを含み得、45度だけ分離されたリング704、706、及び708ごとに8つのサンプルポイント(例えば、従って8つのセル)がある。(x)マークは、デイジー記述子を構築するためのポイント(o)702の周りのサンプリングポイント又は位置に対応する。この演算は配向ごとに行われ、配向勾配ヒストグラム(HOG:histogram of oriented gradients)をもたらす。次いで、デイジー記述子(例えば、配向ヒストグラム)が、サンプルポイントの各々に関する情報を含めることによって構築され得る。
図7において、各円は、半径が平滑化係数の標準偏差に比例する領域を表し得、「x」符号は、平滑化配向マップ中の各円の中心にあるサンプリングポイント又は画素位置を表す。これらの円の領域を重複させることによって、領域間の平滑な遷移が達成され得、並進、回転及びスケール誤差に対するある程度のロバストネスが獲得され得る。
図2〜図7の平滑化配向マップによって示すようにポイント702及び対応するサンプルポイントを定義しているので、デイジー記述子が構築され得る。画像座標(u0,v0)に位置するポイント702のヒストグラムhΣ(u,v)は次式のようにベクトルとして表され得る。
Figure 0005602940
あるポイントについてのデイジー記述子は、そのポイントの位置を中心とする同心円上にあり、平滑化の量が円の半径に比例し得る、平滑化配向マップからの値から作られたベクトルによって定義され得る。従って、位置(u,v)におけるポイントについてのデイジー記述子は次式として与えられ得る。
Figure 0005602940
但し、lj(u,v,Ri)は、jによって与えられる方向/配向(例えば、4方向、8方向など)における位置(u,v)におけるポイント702からの距離がRjである画素位置である。ここで、下付き「V」は、単一の平滑化配向マップレベルにおけるヒストグラムの数を表す。図7における例では、これはレイヤごとに8つのヒストグラムである。式4A、式4B、式4C、及び式5は、3つの平滑化(畳み込み)配向マップレベルが使用されることを仮定しているが、他の実装形態では追加の数のレベルが使用され得ることに留意されたい。
図7に示すように平滑化配向マップをばらばらにサンプリングすることは、SIFTと比較して計算時間を節約させるが、デイジー記述子を記憶するために必要とされるメモリのサイズを増加させる。特に、スケール空間ピラミッド202上で検出されたポイントではメモリ複雑さがより不良になる。M×N画像では、SIFT記述子と比較して、デイジー記述子のために24×M×Nの合計追加メモリが必要とされる。この理由は、デイジー記述子を計算するために、スケール空間ピラミッド202のスケールレベルごとに24個の追加の平滑化(畳み込み)配向マップ(即ち、3つの平滑化配向マップスケール×平滑化配向マップ当たりの8つの配向)が必要とされるからである。メモリ複雑さは、Sスケールレベルをもつスケール空間では、さらに24×M×N×Sに増加する。従って、デイジー記述子を生成するために必要とされるメモリのサイズを低減するための方法が有益であろう。
一態様によれば、スケール不変デイジー記述子抽出のメモリ複雑さは、すでに構築されているガウススケール空間を使用することによって8×M×N×Sに低減され得る。デイジー記述子のパラメータは、スケール空間ピラミッドの複数のスケール空間レベルからデイジー記述子を抽出するように調整される。
例示的な改善されたスケール空間上デイジー記述子
デイジー記述子を生成するために必要とされるメモリのサイズのそのような低減を達成するための1つの方法は、配向マップ208、210、212及び213の各々について複数(例えば、3つ)の平滑化(畳み込み)配向マップを計算することを回避することである。
Figure 0005602940
Figure 0005602940
Figure 0005602940
式6、式7、及び式8において、式1の平滑化フィルタgΣ1は、全体的な又は得られた平滑化/スケーリングを表し得る。
Figure 0005602940
しかしながら、(スケール空間ピラミッドの)スケール空間のスケーリング係数σjを適切に選択することによって、デイジー記述子は、配向マップごとに複数の平滑化配向マップを計算する必要なしに、スケール空間ピラミッドのすでに計算されているスケール空間を使用して計算され得る。
図8に、配向マップごとに複数の平滑化配向マップを生成する必要を回避するより効率的な一例による、修正デイジー記述子を生成するために使用されるスケール空間と配向マップとの生成を示す。画像I(x,y)801が、(異なるカーネル幅において)平滑化カーネルを用いて畳み込まれて、スケール空間ピラミッド802が取得される。図2の場合のように、ピラミッド802の各スケール空間レベル804の配向微分が生成されて、複数の画像微分δx821、δy823、δz825、及びδw827が取得される。次いで、画像微分ごとに、図2の場合のように、対応する配向マップが取得される。
画像の微分をとり、平滑化することは、平滑化し、次いで微分をとることに等価であることがわかる。この性質を使用して、後続の平滑化配向マップが配向マップごとに3つから1つに低減され得るような方法で画像I(x,y)801の平滑化を実行することによって図2及び図7に示すデイジー記述子プロセスを簡略化する。配向マップを取得するために、画像微分は非線形(.)+関数を通過されることに留意されたい。(典型的なデイジーの場合のような)平滑化の前の配向マップは、平滑化の後の配向マップ、及び図8に示す修正デイジー記述子の場合のような別の平滑化と厳密に同じではないが、実際には、これらの手法は両方とも同様の記述子を生成することがわかっている。従って、スケール空間ピラミッド802のスケール空間レベルのスケーリング係数又は平滑化係数は、デイジー記述子が複数のスケール空間レベルの平滑化配向マップに基づくように特に選択される。
画像I(x,y)801が1次元画像である場合、スケール空間カーネルgσを用いた画像の微分の畳み込みは次式によって与えられる。
Figure 0005602940
このプロセスは、配向マップごとに単一の平滑化配向マップが生成されるようにスケール空間ピラミッド802の全てのスケール空間レベルについて繰り返される。
Figure 0005602940
Figure 0005602940
ここで、「得られた平滑化」及び/又は「全体的な平滑化」という用語は、平滑化配向マップのスケーリング/ぼかしの量を指し得る。
Figure 0005602940
従って、図8のスケール空間上の修正デイジー記述子では、(スケール空間ピラミッドのための)1次平滑化係数σ及び/又は(平滑化配向マップを生成するために使用される)2次平滑化係数αが知られているので、第2及び第3の平滑化配向マップをそこから取得すべき(スケール空間ピラミッド802の)特定のより高いスケール空間が選択されて、図2の平滑化とほぼ等価な全体的な平滑化が与えられ得る。例えば、2次平滑化係数αは、スケール空間の全てのレベルについて定数(α=α1)であり得る。従って、達成されるスケーリング/平滑化はスケーリング空間レベルに比例する。平滑化カーネル標準偏差α1σiをスケール空間レベルに比例させることは、スケール不変性を達成するのに役立つ。
図8から、第1のスケール空間804は、第1の平滑化/スケーリング係数σ1を使用して生成されることが諒解できよう。図2の場合のように、複数の画像微分803が生成され、各スケール空間レベル804は、異なる配向に関連する複数の対応する画像微分δx821、δy823、δz825、及びδw827を有し得る。次いで、画像微分の値の各々に(・)+演算子を適用することによって第1の複数の配向マップ806が取得され得る。
Figure 0005602940
第2のスケール空間805は、第3の平滑化/スケーリング係数σiを使用して生成され得、ただし、この例ではσi=σ2である。第2のスケール空間805の配向微分をとることによって、第2の複数の画像微分δ’x、δ’y、δ’z、及びδ’w811が取得される。次いで、第2の複数の画像微分δ’x、δ’y、δ’z、及びδ’w811に()+演算子を適用することによって第2の複数の配向マップ815が取得され得る。
Figure 0005602940
全てのスケール空間レベルにおいて同じ平滑化係数が使用されるように、第4の平滑化係数αjは第2の平滑化係数α1と同じであり得る(例えば、αj=α1)。他の実装形態では、第4の平滑化係数αjはあらゆるスケール空間レベルについて異なり得る(例えば、αj=α2又はαj=α3)。
Figure 0005602940
同様に、スケール空間ピラミッド802のより高いスケール空間に関連する複数の配向マップ中の配向マップごとに、対応する平滑化配向マップが取得され得る。
Figure 0005602940
第5の平滑化係数αhは、第1の平滑化係数α1と同じであり得るか(例えば、αh=α1)、或いはあらゆるスケール空間レベルについて異なり得る(例えば、αh=α4又はαh=α5)。
Figure 0005602940
Figure 0005602940
図8に示す実装形態は、デイジー記述子を生成すべき近似的畳み込みスケール空間平滑化を与えるスケール空間ピラミッド802のより高いレベルにあるスケール空間レベルを特に選択する。
スケール空間ピラミッド802からより高いスケール空間を適切に選択するために、平滑化配向マップは次式として表され得ることがわかる。
Figure 0005602940
上式で、σ1及びσ2は、スケール空間ピラミッドの異なるスケール空間のためのスケーリング/平滑化係数であり、σ2は、σ1よりも大きい平滑化/スケーリングを与える。同様に、α1及びα2は、2つの異なる平滑化配向マップを生成するために使用されるスケーリング/平滑化係数であり、α2は、α1よりも大きい平滑化/スケーリングを与える。
記述子を構築するために、(・)+演算子を適用して、対応する画像微分から負成分をクリッピングすることによって平滑化配向マップが取得される。
Figure 0005602940
実際には、微分が画像のより平滑なバージョン(即ち、より高いスケール)に適用されるほど、この近似はよりロバストな記述子を生成する。
Figure 0005602940
従って、式13及び式14は、次のように平滑化カーネルパラメータ(例えば、スケーリング係数σ及びα)を調整することによって求められ得る。
Figure 0005602940
ここで、λ1は、スケール空間ピラミッドの2つのスケール空間レベルの平滑化係数σ2とσ1との間の比に対応する。式14.1及び式18から、第1のスケール空間の第1の平滑化配向マップについて、スケール空間ピラミッド上の第1のスケール空間から第2のスケール空間にλ1レベルだけ上がることによって第2の平滑化配向マップが選択され得ることが諒解できよう。
Figure 0005602940
図8に示す例では、スケール空間ピラミッド802の全てのレベルの配向マップを平滑化するために同じスケーリング係数α1が使用され得ることに留意されたい。
λ2に基づいてα1とα3との間の関係を定義するために同じプロシージャが使用され得る。即ち、α13=λ2である場合、
Figure 0005602940
図9に、デイジー記述子が、スケール空間ピラミッドの複数のレベルを使用することによってどのように生成され得るかを示す。
Figure 0005602940
各同心リング904、906、及び908は、リングの外周に沿った複数のばらばらにサンプリングされたポイント910、912、及び914を含み得る。各ばらばらにサンプリングされたポイント910、912、及び914は、セル916、918、及び920(即ち、円)の中心として働き得、サンプルポイントがポイント902からさらに離れて移動するにつれてセルサイズ(即ち、半径)がサイズ増加する。一例では、空間プーリング構成は、3つの同心リング904、906、及び908に沿って24個のポイントを含み得、45度だけ分離されたリング904、906、及び908ごとに8つのサンプルポイント(例えば、従って8つのセル)がある。
Figure 0005602940
この演算は配向ごとに行われ、配向勾配ヒストグラム(HOG)をもたらす。次いで、デイジー記述子(例えば、配向ヒストグラム)が、サンプルポイントの各々に関する情報を含めることによって構築され得る。例えば、画像座標(u0,v0)に位置するポイント902のヒストグラムhΣ(u,v)は次式のようにベクトルとして表され得る。
Figure 0005602940
ポイントについてのデイジー記述子は、ポイント902の位置を中心とする同心円上にあり、平滑化の量が円の半径に比例し得る、平滑化配向マップからの値から作られたベクトルによって定義され得る。従って、位置(u,v)におけるポイントについてのデイジー記述子は次式として与えられ得る。
Figure 0005602940
但し、lj(u,v,Ri)は、jによって与えられる方向/配向(例えば、4方向、8方向など)における位置(u,v)におけるポイント902からの距離がRjである画素位置である。ここで、下付き「V」は、単一の平滑化配向マップレベルにおけるヒストグラムの数を表す。図9における例では、これはレイヤごとに8つのヒストグラムである。式21A、式21B、式21C、及び式22は、3つの平滑化配向マップレベルが使用されることを仮定しているが、他の実装形態では追加の数のレベルが使用され得ることに留意されたい。
一例では、ピラミッド802のスケール空間レベルは2k/Sとして定義され得、ただし、Sは各オクターブの解像度(即ち、オクターブ当たりのスケールレベルの数)を定義し、sはスケール空間ピラミッド802内のスケール空間レベルであり、その場合、λ1は、何らかの正の整数kについて、2k/Sから選択され得る。例えば、図8では、オクターブ解像度Sはi+1(即ち、スケールレベル0からiまで)であり、ただし、「i」は整数(例えば、2、3、4、5、6、7など)であるが、スケールレベルsは、1とr+1(即ち、ピラミッド802中で最も高いスケールレベル)との間にあり得る。ピラミッドスケール空間レベルを定義する他の方法が使用され得ることに留意されたい。
他のスケール空間の平滑化配向マップを再利用することによってデイジー記述子を生成する手法は、メモリ記憶空間の節約だけでなく、精度の改善をも達成する。この手法の1つの特徴は、平滑化のどのレベルが微分演算子に適用されたかを判断することである。この手法では、微分演算子は、ガウスピラミッドのより高いスケールレベルにおいて画像に適用される。従って、この手法はノイズに対してよりロバストである。この理由は、より大きいカーネルを用いて画像を平滑化することにより、微分演算によって増幅され得る高周波ノイズが除去されるからである。このことは、全てのよく知られているエッジ検出アルゴリズムによって使用されている。
典型的なデイジー記述子と修正デイジー記述子との間の例示的な比較
図10に、スケール空間上の修正デイジー記述子と比較した、典型的なデイジー記述子の生成の比較を示す。画像解像度がピラミッド1002のより低いスケールからより高いスケールに低下するように、様々なスケーリング係数に従って画像をぼかす/平滑化することによって、スケール空間ピラミッド1002が生成される。第1のスケール空間1006の配向微分をとることによって(第1のスケーリング係数σ1によって生成された)第1のスケール空間1006におけるポイント1004についての典型的なデイジー記述子が生成されて、配向マップのセット1008が取得され得る。配向マップのセット1008は、異なる配向についての複数の配向マップを備える。次いで、配向マップのセット1008は、複数の異なるスケーリング/平滑化係数を用いて畳み込むことによって平滑化されて、デイジー記述子の3つのレベルが取得される。
Figure 0005602940
Figure 0005602940
各同心リング1020、1022、及び1024は、リングの外周に沿った複数のばらばらにサンプリングされたポイントを含み得る。各ばらばらにサンプリングされたポイントは、セル(即ち、円)の中心として働き得、サンプルポイントがポイント1004からさらに離れて移動するにつれてセルサイズ(即ち、半径)がサイズ増加する。この例では、(それぞれ平滑化配向マップ1014、1016、及び1018のための)3つの異なる平滑化係数α1、α2、及びα3は、値α1=2.5、α2=5.0、及びα3=7.5を有し得る。セル(即ち、円)の各々の半径はその平滑化配向マップの平滑化係数に比例し得る。例えば、第1の平滑化配向マップ1014では、各セル又は円の半径R1はR1=2.5であり得、平滑化係数α1=2.5で1対1の比例関係がある。同様に、第2の平滑化配向マップ1016では、各セル又は円の半径R2はR2=5.0であり得、平滑化係数α2=5.0で1対1の比例関係がある。同様に、第3の平滑化配向マップ1018では、各セル又は円の半径R3はR3=7.5であり得、平滑化係数α3=7.5で1対1の比例関係がある。この例では、半径の合計R1+R2+R3=15.0画素であることに留意されたい。次いで、式3、式4A、式4B、式4C、及び式5に従ってデイジー記述子が生成され得る。典型的なデイジー記述子の構築により、M×N画素の画像、Sレベルのスケール空間ピラミッド、及び8つの配向では、8つの配向微分(例えば、配向マップ)について3つの平滑化配向マップのための情報を記憶するために24×M×N×Sのメモリが必要となる。
デイジー記述子を生成するための典型的な方法と比較して、本手法は、スケール空間上でデイジー記述子を生成するためにスケール空間ピラミッド1002の複数のレベルを使用する。
Figure 0005602940
Figure 0005602940
第1の平滑化配向マップ1014及び第2の平滑化配向マップ1026を生成するために同じ平滑化係数α1が使用されるので、比λ1=σ2/σ1を満たす第2のスケール空間1010の選択は、対応する第2の平滑化配向マップ1026において同じ又はほぼ同じ全体的な平滑化を達成する効果を有することになる。比λ1は、修正デイジー記述子のための所望の空間サンプリングを達成するか又は典型的なデイジー記述子にほぼマッチングするようにあらかじめ決定されていることがある。従って、比λ1と平滑化係数σ1とがわかれば、第2のスケール空間1010は、比λ1を満たすそれの対応する平滑化係数σ2に基づいて選択され得る。スケール空間ピラミッド1010についてスケール空間はあらかじめ決定され得るので、この比λ1を最も厳密に満たす第2のスケール空間1010が選択される。細かく離間したスケール空間を用いてスケール空間ピラミッド1002を構築することは、比λ1を満たす平滑化係数σ2を有する第2のスケール空間1010を選択可能になるのを助けることに留意されたい。
Figure 0005602940
第1の平滑化配向マップ1014及び第3の平滑化配向マップ1028を生成するために同じ平滑化係数α1が使用されるので、比λ2=σ3/σ1を満たす第2のスケール空間1016の選択は、対応する第3の平滑化配向マップ1028において同じ又はほぼ同じ全体的な平滑化を達成する効果を有することになる。比λ2は、修正デイジー記述子のための所望の空間サンプリングを達成するか又は典型的なデイジー記述子にほぼマッチングするようにあらかじめ決定されていることがある。従って、比λ2と平滑化係数σ1とがわかれば、第3のスケール空間1016は、比λ2を満たすそれの対応する平滑化係数σ3に基づいて選択され得る。スケール空間ピラミッド1010についてスケール空間はあらかじめ決定され得るので、この比λ2を最も厳密に満たす第3のスケール空間1016が選択される。
Figure 0005602940
この例では、第1の平滑化配向マップ1014では、各セル又は円の半径R1はR1=α1=2.5であり得、平滑化係数α1=2.5で1対1の比例関係がある。ここで、(第2の平滑化配向マップ1026及び第3の平滑化配向マップ1028の)半径R’2及びR’3は、第2のスケール空間1010及び第3のスケール空間1016の選択の結果として達成される全体的な平滑化に依存する。
Figure 0005602940
この例では、半径の合計R1+R’2+R’3=16.27画素であることに留意されたい。次いで、式20、式21A、式21B、式21C、及び式22に従ってデイジー記述子が生成され得る。この修正デイジー記述子の構築により、M×N画素の画像、Sレベルのスケール空間ピラミッド、及び8つの配向では、8つの配向微分(例えば、配向マップ)について平滑化配向マップのための情報を記憶するために8×M×N×Sのメモリが必要となる。
例示的な記述子生成デバイス
図11は、複数のスケール空間レベルにわたって記述子を生成する記述子生成デバイスの一例を示すブロック図である。記述子生成デバイス1100は、処理回路1102、撮像装置1106、及び/又は記憶装置1108を含み得る。撮像装置1106は、例えば、クエリ画像をキャプチャすることができるデジタルカメラ、一つ以上のデジタル画像を記憶する記憶メディア、及び/又は一つ以上のデジタル画像を与える通信インターフェースであり得る。
記憶装置1108は、記述子データベース1118、特徴/ポイント検出演算のセット1115、画像微分演算のセット1119、配向マップ生成演算のセット1111、配向マップ平滑化演算のセット1118、及び/又はスケール空間演算上記述子生成のセット1117を一時的又は永続的に記憶するように働き得る。
処理回路1102は、画像を処理し、その画像及び/又はその画像内の特徴を識別する一つ以上の記述子を生成するように適応され得る。この目的のために、処理回路1102はまた、スケール空間生成回路1110、特徴/ポイント検出回路1114、画像微分生成回路1121、配向マップ生成回路1112、配向マップ平滑化回路1113、及び/又はスケール空間上記述子生成回路(descriptor generation over scale space circuit)1116を含むか又は実装し得る。処理回路1102は、図8〜図10及び図12で説明する一つ以上の特徴及び/又は方法を実装し得る。一例では、処理回路1102は、記憶装置中の様々なモジュールに記憶された演算を単に実装し得る。別の例では、処理回路1102内の回路の各々は、記憶装置1108内に記憶された対応するモジュール中の演算を行うように適応され得る。
スケール空間生成回路1110は、例えば、図8に示すように、複数の異なるスケール空間を生成するためにぼかし/平滑化関数を用いて画像を畳み込むように働き得る。一例では、スケール空間生成回路1110は、ガウススケール空間ピラミッドを生成するように働き得る。特徴/ポイント検出回路1114は、画像のための各スケール空間において一部又は全部のポイント又は特徴を識別するように働き得る。画像導出生成回路1121は、スケール空間の各々について複数の配向微分を生成するように働き得る。配向マップ生成回路1112は、画像微分ごとに配向マップを生成するように働き得る。次いで、配向マップ平滑化回路1113は、配向マップの各々を(例えば、畳み込み演算によって)平滑化し得る。スケール空間上記述子生成回路1116は、複数の異なるスケール空間のための複数の平滑化配向マップ上のサンプリングポイントを使用することによってポイントについての記述子を生成する。例えば、スケール空間上記述子生成回路1116は、図8〜図10及び図12に示す修正デイジー記述子を生成し得る。
図12は、複数のスケール空間レベルにわたって局所特徴記述子を生成するための方法を示す流れ図である。この方法は、ポイントについての局所特徴記述子を生成するために、図11の記述子生成デバイス1100を含む様々なデバイスにおいて実装され得る。複数のスケール空間L(σ1)、L(σ2)、...L(σn)を取得するために画像I(x,y)を漸進的に平滑化する(1202)。
複数のスケール空間からの第1のスケール空間内のポイントを識別し得る(1204)。ポイントは、複数のスケール空間内の位置のサブセットからのサンプルポイントであり得る。位置のサブセットの選択は特定の実装形態に依存し得る。一例では、位置のサブセットは、対象物についての予想パターンに基づいて選択され得る。例えば、顔検出適用例では、これらの位置は、顔の中心などの基準位置に対する眼、口、鼻の位置に対応するであろう。別の例では、位置のサブセットは、画像内の識別キーポイントに基づいて選択され得、キーポイントは、回転及びスケール変化に対してロバストであると識別されているポイントである。例えば、画像からの形状抽出を実装するために、位置は形状の輪郭からサンプリングされたポイントに対応し得る。
複数のスケール空間の各々について配向画像微分を取得する(1206)。
Figure 0005602940
例えば、(例えば、配向マップにクリッピング関数/演算子(・)+を適用することによって)対応する画像微分の負値を0に設定することによって複数の配向マップの各々を取得し得る。
Figure 0005602940
次いで、ポイントのための局所特徴記述子を生成するために、複数のスケール空間からの2つ以上のスケール空間に対応する複数の平滑化配向マップをばらばらにサンプリングする(1212)。2つ以上のスケール空間は、第1のスケール空間と、第1のスケール空間よりも低い解像度の一つ以上の追加のスケール空間とを含み得る。局所特徴記述子は、ポイントの中心上に分散されたサンプルポイントの空間プーリングによって定義されたカーネルプーリング構成を有し得る。各スケール空間のための複数の配向マップは、複数の異なる配向(例えば、配向/次元X、Y、Z、及びW)のための配向マップを含み得る。
Figure 0005602940
複数の配向勾配ヒストグラムは、複数の平滑化配向マップのばらばらのサンプリングから構築され得、局所特徴記述子は複数のヒストグラムを備える。
一例では、複数の平滑化配向マップをばらばらにサンプリングすることは、(a)第1の平滑化配向マップ上の第1の複数のポイントをサンプリングすることであって、第1の複数のポイントが、ポイントの位置と同心の第1のリングに配置された、サンプリングすること、(b)第2の平滑化配向マップ上の第2の複数のポイントをサンプリングすることであって、第2の複数のポイントが、ポイントの位置と同心の第2のリングに配置され、第2の平滑化配向マップが、第1のスケール空間よりも低い解像度の第2のスケール空間に対応する、サンプリングすること、及び/又は(c)第3の平滑化配向マップ上の第3の複数のポイントをサンプリングすることであって、第3の複数のポイントが、ポイントの位置と同心の第3のリングに配置され、第3の平滑化配向マップが、第1のスケール空間よりも低い解像度の第3のスケール空間に対応する、サンプリングすることを含む。第2のリングは、第1のリングの第1の半径よりも大きい第2の半径を有し得、第3のリングは、第2のリングの第2の半径よりも大きい第3の半径を有し得る。
1つの事例によれば、複数の配向マップは、同じ平滑化係数を使用して平滑化され得、第1のスケール空間は、2つ以上のスケール空間のうちの1つであり得、第2のスケール空間は、第1のスケール空間に対して所望の平滑化を達成するように選択され得る。
例示的なモバイルデバイス
図13は、スケール空間の複数のレベルにわたって生成された局所記述子を使用して画像又は対象物認識のために画像処理を実行するように適応された例示的なモバイルデバイスを示すブロック図である。モバイルデバイス1300は、撮像装置1304に結合された処理回路1302と、ワイヤレス通信インターフェース1310と、記憶装置1308とを含み得る。撮像装置1304(例えば、デジタルカメラ)は、注目するクエリ画像1306をキャプチャし、撮像されたクエリ画像を処理回路1302に供給するように適応され得る。
記憶装置1308(例えば、揮発性及び/又は不揮発性メモリ)は、画像のための画像スケール空間1316及び/又はスケール空間上で局所特徴記述子を生成するための演算1314を記憶し得る。これらの演算は、例えば、スケール空間生成演算1321(例えば、画像のスケール空間を取得するために様々な平滑化係数/関数に従って画像を漸進的にぼかす演算)、配向画像微分演算1327(例えば、特定のスケール空間レベルから複数の配向微分を生成する演算)、配向マップ生成演算1323(例えば、配向マップを取得するために画像微分の画素勾配値にクリッピング関数(.)+を適用する演算)、平滑化(畳み込み)配向マップ生成演算1325(例えば、配向マップに第2の平滑化係数を適用する)、及び/又はスケール空間上局所記述子生成演算(local descriptor generation over scale space operation)1329(例えば、複数のスケール空間からの2つ以上のスケール空間に対応する複数の平滑化配向マップをばらばらにサンプリングする)を含み得る。これらの演算は、例えば処理回路1302によって実行され得る。
処理回路1302は、撮像された画像を処理して、画像/対象物認識のために後で送信又は使用され得る局所特徴記述子を生成するように適応され得る。例えば、処理回路1302は、スケール空間生成器1320、特徴/ポイント検出器1326、配向画像微分生成器配向マップ生成器1322、平滑化配向マップ生成器1324、及び/又はスケール空間上局所特徴記述子生成器1328を含むか又は実装し得る。スケール空間生成器1320は、例えば、図8に示すように、複数の異なるスケール空間を生成するためにぼかし関数(例えば、ガウスカーネル)を用いて画像を畳み込むように働き得る。次いで、特徴/ポイント検出器1326は、(例えば、極大値及び極小値を使用することによって)画像のための異なるスケール空間中の一つ以上のポイントを識別し得る。次いで、配向画像微分生成器1330は、スケール空間の配向微分をとって複数の画像微分を生成し得る。配向マップ生成器1322は、画像微分の値にクリッピング関数(・)+を適用することによって画像微分ごとに配向マップを生成し得る。次いで、平滑化配向マップ生成器1324は、各配向マップをさらに畳み込んで、対応する平滑化配向マップを取得する。局所特徴/ポイント記述子生成器1328は、複数のスケール空間のための平滑化配向マップを使用することによって(例えば、図8、図9、及び図10に示す)注目するポイントごとに記述子(例えば、デイジー記述子)を生成する。モバイルデバイス1300は、それらの図で説明する一つ以上の特徴及び/又は方法を実装し得る。
次いで、処理回路1302は、一つ以上の局所特徴/ポイント記述子を記憶装置1308に記憶し得、及び/又はさらに局所特徴/ポイント記述子をワイヤレス通信インターフェース1310(例えば、トランシーバ又は回路)を介して通信ネットワーク1312を通して画像マッチングサーバに送信し得、その画像マッチングサーバは特徴記述子を使用して画像又はその画像中の対象物を識別する。即ち、画像マッチングサーバは、特徴記述子をサーバ自体の特徴記述子のデータベースと比較して、それのデータベース中のいずれかの画像が同じ特徴を有するかどうかを判断し得る。
図に示す構成要素、ステップ、特徴及び/又は機能のうちの1つ又は複数は、単一の構成要素、ステップ、特徴又は機能に再構成され及び/又は組み合わされ得、或いは幾つかの構成要素、ステップ、又は機能で実施され得る。また、本明細書で開示する新規の特徴から逸脱することなく追加の要素、構成要素、ステップ、及び/又は機能が追加され得る。ある図に示した装置、デバイス、及び/又は構成要素は、別の図で説明する方法、特徴、又はステップのうちの1つ又は複数を実行するように構成され得る。本明細書で説明するアルゴリズムはまた、効率的にソフトウェアで実装され及び/又はハードウェアに組み込まれ得る。
また、実施形態について、フローチャート、流れ図、構造図、又はブロック図として示されたプロセスとして説明することがあることに留意されたい。フローチャートは動作を逐次プロセスとして説明することがあるが、動作の多くは並行して又は同時に実行され得る。さらに、動作の順序は並び替えられ得る。プロセスは、その動作が完了すると終了する。プロセスは、メソッド、関数、プロシージャ、サブルーチン、サブプログラムなどに対応し得る。プロセスが関数に対応する場合、その終了は呼び出し関数又はメイン関数への関数の復帰に対応する。
さらに、記憶媒体は、読取り専用メモリ(ROM)、ランダムアクセスメモリ(RAM)、磁気ディスク記憶媒体、光記憶媒体、フラッシュメモリデバイス、及び/又は情報を記憶するための他の機械可読媒体、プロセッサ可読媒体、及び/又はコンピュータ可読媒体を含む、データを記憶するための一つ以上のデバイスを表し得る。「機械可読媒体」、「コンピュータ可読媒体」、及び/又は「プロセッサ可読媒体」という用語は、限定はしないが、ポータブル又は固定記憶装置、光記憶装置、並びに(一つ以上の)命令及び/又はデータを記憶、含有又は担持することが可能な様々な他の媒体などの非一時的媒体を含み得る。従って、本明細書で説明する様々な方法は、「機械可読媒体」、「コンピュータ可読媒体」、及び/又は「プロセッサ可読媒体」に記憶され、一つ以上のプロセッサ、機械及び/又はデバイスによって実行され得る命令及び/又はデータによって完全に又は部分的に実装され得る。
さらに、実施形態は、ハードウェア、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード、又はそれらの任意の組合せによって実装され得る。ソフトウェア、ファームウェア、ミドルウェア又はマイクロコードで実装される場合、必要なタスクを実行するためのプログラムコード又はコードセグメントは記憶媒体或いは(一つ以上の)他の記憶装置などの機械可読媒体に記憶され得る。プロセッサは必要なタスクを実行し得る。コードセグメントは、プロシージャ、関数、サブプログラム、プログラム、ルーチン、サブルーチン、モジュール、ソフトウェアパッケージ、クラス、又は命令、データ構造、若しくはプログラムステートメントの任意の組合せを表し得る。コードセグメントは、情報、データ、引数、パラメータ、又はメモリ内容をパス及び/又は受信することによって、別のコードセグメント又はハードウェア回路に結合され得る。情報、引数、パラメータ、データなどは、メモリ共有、メッセージパッシング、トークンパッシング、ネットワーク送信などを含む適切な手段を介してパス、フォワーディング、又は送信され得る。
本明細書に開示する例に関連して説明する様々な例示的な論理ブロック、モジュール、回路、要素、及び/又は構成要素は、汎用プロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、又は他のプログラマブルロジック構成要素、個別ゲート若しくはトランジスタ論理、個別ハードウェア構成要素、又は本明細書で説明する機能を実行するように設計されたそれらの任意の組合せを用いて実装又は実行され得る。汎用プロセッサはマイクロプロセッサであり得るが、代替として、プロセッサは、任意の従来のプロセッサ、コントローラ、マイクロコントローラ、又は状態機械であり得る。プロセッサはまた、コンピューティング構成要素の組合せ、例えば、DSPとマイクロプロセッサの組合せ、複数のマイクロプロセッサ、DSPコアと連携する一つ以上のマイクロプロセッサ、或いは任意の他のそのような構成として実装され得る。
本明細書に開示する例に関連して説明する方法又はアルゴリズムは、ハードウェア、プロセッサによって実行可能なソフトウェアモジュール、又は両方の組合せで、処理ユニット、プログラム命令、又は他の指令の形で直接実施され得、単一のデバイスに含まれるか又は複数のデバイスにわたって分散され得る。ソフトウェアモジュールは、RAMメモリ、フラッシュメモリ、ROMメモリ、EPROMメモリ、EEPROMメモリ、レジスタ、ハードディスク、リムーバブルディスク、CD−ROM、又は当技術分野で知られている任意の他の形態の記憶媒体中に常駐し得る。記憶媒体は、プロセッサがその記憶媒体から情報を読み取り、その記憶媒体に情報を書き込むことができるようにプロセッサに結合され得る。代替として、記憶媒体はプロセッサに一体化され得る。
さらに、本明細書で開示する実施形態に関連して説明する様々な例示的な論理ブロック、モジュール、回路、及びアルゴリズムステップは、電子ハードウェア、コンピュータソフトウェア、又は両方の組合せとして実装され得ることを、当業者は諒解されよう。ハードウェアとソフトウェアのこの互換性を明確に示すために、様々な例示的な構成要素、ブロック、モジュール、回路、及びステップを、上記では概してそれらの機能に関して説明した。そのような機能をハードウェアとして実装するか、ソフトウェアとして実装するかは、特定の適用例及び全体的なシステムに課される設計制約に依存する。
本明細書で説明する本発明の様々な特徴は、本発明から逸脱することなく様々なシステムで実装され得る。上記の実施形態は例にすぎず、本発明を限定するものと解釈すべきではないことに留意されたい。実施形態についての説明は、例示的なものであり、特許請求の範囲を限定するものではない。従って、本教示は、他のタイプの装置、並びに多くの代替形態、修正形態、及び変更形態に容易に適用できることが当業者には明らかであろう。

Claims (34)

  1. 画像のための局所特徴記述子を生成するための方法であって、
    画像のための複数のスケール空間からの第1のスケール空間内のポイントを識別することと、
    前記複数のスケール空間中のスケール空間ごとに複数の配向マップを取得することと、
    対応する複数の平滑化配向マップを取得するために前記複数の配向マップの各々を平滑化することと、
    前記ポイントのための局所特徴記述子を生成するために、前記複数のスケール空間からの2つ以上のスケール空間に対応する複数の平滑化配向マップをばらばらにサンプリングすることと、
    を含む、方法。
  2. 前記複数のスケール空間を取得するために前記画像を漸進的に平滑化することを更に含み、前記複数の平滑化配向マップ内の配向マップの前記平滑化が前記配向マップのスケール空間レベルに比例する、請求項1に記載の方法。
  3. 前記複数の配向マップの各々が、対応する画像微分の非負値から取得される場合に、前記複数のスケール空間の各々について複数の画像微分を取得することをさらに含む、請求項1に記載の方法。
  4. 前記ポイントが、前記複数のスケール空間内の位置のサブセットからのサンプルポイントである、請求項1に記載の方法。
  5. 位置の前記サブセットが、対象物についての予想パターンに基づいて選択される、請求項4に記載の方法。
  6. 前記位置のサブセットが、前記画像内の識別キーポイントに基づいて選択され、キーポイントが、イメージング条件の変化に対してロバストであると識別されているポイントである、請求項4に記載の方法。
  7. 前記2つ以上のスケール空間が、前記第1のスケール空間と、前記第1のスケール空間よりも低い解像度の一つ以上の追加のスケール空間とを含む、請求項1に記載の方法。
  8. 前記局所特徴記述子が、前記ポイントの中心上に分散されたサンプルポイントの空間プーリングによって定義されたカーネルプーリング構成を有する、請求項1に記載の方法。
  9. 複数の平滑化配向マップをばらばらにサンプリングすることは、
    第1の平滑化配向マップ上の第1の複数のポイントをサンプリングすること、
    第2の平滑化配向マップ上の第2の複数のポイントをサンプリングすること、を含み、
    前記第1の複数のポイントが、前記ポイントの位置と同心の第1のリングに配置され、前記第2の複数のポイントが、前記ポイントの前記位置と同心の第2のリングに配置され、前記第2の平滑化配向マップが、前記第1のスケール空間よりも低い解像度の第2のスケール空間に対応する、請求項1に記載の方法。
  10. 複数の平滑化配向マップをばらばらにサンプリングすることは、
    第3の平滑化配向マップ上の第3の複数のポイントをサンプリングすることを含み、前記第3の複数のポイントが、前記ポイントの前記位置と同心の第3のリングに配置され、前記第3の平滑化配向マップが、前記第1のスケール空間よりも低い解像度の第3のスケール空間に対応する、請求項に記載の方法。
  11. 前記第2のリングが、前記第1のリングの第1の半径よりも大きい第2の半径を有し、前記第3のリングが、前記第2のリングの前記第2の半径よりも大きい第3の半径を有する、請求項10に記載の方法。
  12. 各スケール空間のための前記複数の配向マップが、複数の異なる配向のための配向マップを含む、請求項1に記載の方法。
  13. 各配向マップが、単一の対応する平滑化配向マップに分解する、請求項1に記載の方法。
  14. 前記複数の平滑化配向マップの前記ばらばらのサンプリングから複数の配向勾配ヒストグラムを構築することを更に含み、前記局所特徴記述子が前記複数のヒストグラムを含む、請求項1に記載の方法。
  15. 前記複数の配向マップが、同じ平滑化係数を使用して平滑化され、前記第1のスケール空間が、前記2つ以上のスケール空間のうちの1つであり、第2のスケール空間が、前記第1のスケール空間に対して所望の平滑化を達成するように選択される、請求項1に記載の方法。
  16. 画像を取得するように適応された入力インターフェースと、
    一つ以上の画像についての局所特徴記述子を記憶する記憶装置と、
    前記入力インターフェースと前記記憶装置とに結合された処理回路と、
    を具備し、
    画像のための複数のスケール空間からの第1のスケール空間内のポイントを識別することと、
    前記複数のスケール空間中のスケール空間ごとに複数の配向マップを取得することと、
    対応する複数の平滑化配向マップを取得するために前記複数の配向マップの各々を平滑化することと、
    前記ポイントのための局所特徴記述子を生成するために、前記複数のスケール空間からの2つ以上のスケール空間に対応する複数の平滑化配向マップをばらばらにサンプリングすることと、
    を行うように構成された、画像処理装置。
  17. 前記2つ以上のスケール空間が、前記第1のスケール空間と、前記第1のスケール空間よりも低い解像度の一つ以上の追加のスケール空間とを含む、請求項16に記載の画像処理装置。
  18. 前記処理装置は、
    前記複数のスケール空間の各々について複数の画像微分を取得するように更に構成され、前記複数の配向マップの各々が、対応する画像微分の非負値から取得される、請求項16に記載の画像処理装置
  19. 前記ポイントが、前記複数のスケール空間内の位置のサブセットからのサンプルポイントである、請求項16に記載の画像処理装置。
  20. 前記局所特徴記述子が、前記ポイントの中心上に分散されたサンプルポイントの空間プーリングによって定義されたカーネルプーリング構成を有する、請求項16に記載の画像処理装置。
  21. 複数の平滑化配向マップをばらばらにサンプリングすることは、
    第1の平滑化配向マップ上の第1の複数のポイントをサンプリングすること、た、サンプリングすることと、
    第2の平滑化配向マップ上の第2の複数のポイントをサンプリングすること、
    を含み、前記第1の複数のポイントが、前記ポイントの位置と同心の第1のリングに配置され、前記第2の複数のポイントが、前記ポイントの前記位置と同心の第2のリングに配置され、前記第2の平滑化配向マップが、前記第1のスケール空間よりも低い解像度の第2のスケール空間に対応する、請求項16に記載の画像処理装置
  22. 複数の平滑化配向マップをばらばらにサンプリングすることは、
    第3の平滑化配向マップ上の第3の複数のポイントをサンプリングすることを更に含み、前記第3の複数のポイントが、前記ポイントの前記位置と同心の第3のリングに配置され、前記第3の平滑化配向マップが、前記第1のスケール空間よりも低い解像度の第3のスケール空間に対応する、請求項21に記載の画像処理装置
  23. 前記処理装置は、
    前記複数の平滑化配向マップの前記ばらばらのサンプリングから複数の配向勾配ヒストグラムを構築するように更に構成され、前記局所特徴記述子が前記複数のヒストグラムを含む、請求項16に記載の画像処理装置。
  24. 前記複数の配向マップが、同じ平滑化係数を使用して平滑化され、前記第1のスケール空間が、前記2つ以上のスケール空間のうちの1つであり、第2のスケール空間が、前記第1のスケール空間に対して所望の平滑化を達成するように選択される、請求項16に記載の画像処理装置。
  25. 画像のための複数のスケール空間からの第1のスケール空間内のポイントを識別するための手段と、
    前記複数のスケール空間中のスケール空間ごとに複数の配向マップを取得するための手段と、
    対応する複数の平滑化配向マップを取得するために前記複数の配向マップの各々を平滑化するための手段と、
    前記ポイントのための局所特徴記述子を生成するために、前記複数のスケール空間からの2つ以上のスケール空間に対応する複数の平滑化配向マップをばらばらにサンプリングするための手段と、
    を具備する、画像処理装置。
  26. 前記複数のスケール空間の各々について複数の画像微分を取得するための手段を更に含み、前記複数の配向マップの各々が、対応する画像微分の非負値から取得される、請求項25に記載の画像処理装置。
  27. 前記ポイントが、前記複数のスケール空間内の位置のサブセットからのサンプルポイントである、請求項25に記載の画像処理装置。
  28. 前記2つ以上のスケール空間が、前記第1のスケール空間と、前記第1のスケール空間よりも低い解像度の一つ以上の追加のスケール空間とを含む、請求項25に記載の画像処理装置。
  29. 前記局所特徴記述子が、前記ポイントの中心上に分散されたサンプルポイントの空間プーリングによって定義されたカーネルプーリング構成を有する、請求項25に記載の画像処理装置。
  30. 複数の平滑化配向マップをばらばらにサンプリングするための手段は、
    第1の平滑化配向マップ上の第1の複数のポイントをサンプリングするための手段と、
    第2の平滑化配向マップ上の第2の複数のポイントをサンプリングするための手段と、を含み、
    前記第1の複数のポイントが、前記ポイントの位置と同心の第1のリングに配置され、前記第2の複数のポイントが、前記ポイントの前記位置と同心の第2のリングに配置され、前記第2の平滑化配向マップが、前記第1のスケール空間よりも低い解像度の第2のスケール空間に対応する、請求項25に記載の画像処理装置。
  31. 複数の平滑化配向マップをばらばらにサンプリングするための手段は、
    第3の平滑化配向マップ上の第3の複数のポイントをサンプリングするための手段を更に含み、前記第3の複数のポイントが、前記ポイントの前記位置と同心の第3のリングに配置され、前記第3の平滑化配向マップが、前記第1のスケール空間よりも低い解像度の第3のスケール空間に対応する、請求項30に記載の画像処理装置。
  32. 前記複数の平滑化配向マップの前記ばらばらのサンプリングから複数の配向勾配ヒストグラムを構築するための手段を更に含み、前記局所特徴記述子が前記複数のヒストグラムを含み、請求項25に記載の画像処理装置。
  33. 装置中で動作可能な一つ以上の命令を備えるプロセッサ可読媒体であって、処理回路によって実行されたとき、
    画像のための複数のスケール空間からの第1のスケール空間内のポイントを識別することと、
    前記複数のスケール空間中のスケール空間ごとに複数の配向マップを取得することと、
    対応する複数の平滑化配向マップを取得するために前記複数の配向マップの各々を平滑化することと、
    前記ポイントのための局所特徴記述子を生成するために、前記複数のスケール空間からの2つ以上のスケール空間に対応する複数の平滑化配向マップをばらばらにサンプリングすることと、
    を前記処理回路に行わせる、プロセッサ可読記憶媒体。
  34. 前記2つ以上のスケール空間が、前記第1のスケール空間と、前記第1のスケール空間よりも低い解像度の一つ以上の追加のスケール空間とを含む、請求項33に記載のプロセッサ可読記憶媒体。
JP2013506283A 2010-04-20 2011-04-20 事前計算されたスケール空間からのデイジー記述子生成 Expired - Fee Related JP5602940B2 (ja)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US32608710P 2010-04-20 2010-04-20
US61/326,087 2010-04-20
US41275910P 2010-11-11 2010-11-11
US61/412,759 2010-11-11
US13/090,180 2011-04-19
US13/090,180 US9530073B2 (en) 2010-04-20 2011-04-19 Efficient descriptor extraction over multiple levels of an image scale space
PCT/US2011/033316 WO2011133714A1 (en) 2010-04-20 2011-04-20 Daisy descriptor generation from precomputed scale - space

Publications (2)

Publication Number Publication Date
JP2013525905A JP2013525905A (ja) 2013-06-20
JP5602940B2 true JP5602940B2 (ja) 2014-10-08

Family

ID=44788244

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013506283A Expired - Fee Related JP5602940B2 (ja) 2010-04-20 2011-04-20 事前計算されたスケール空間からのデイジー記述子生成

Country Status (6)

Country Link
US (1) US9530073B2 (ja)
EP (1) EP2561467A1 (ja)
JP (1) JP5602940B2 (ja)
KR (1) KR101470112B1 (ja)
CN (1) CN102859535B (ja)
WO (1) WO2011133714A1 (ja)

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8897572B2 (en) 2009-12-02 2014-11-25 Qualcomm Incorporated Fast subspace projection of descriptor patches for image recognition
US9530073B2 (en) * 2010-04-20 2016-12-27 Qualcomm Incorporated Efficient descriptor extraction over multiple levels of an image scale space
US8274508B2 (en) * 2011-02-14 2012-09-25 Mitsubishi Electric Research Laboratories, Inc. Method for representing objects with concentric ring signature descriptors for detecting 3D objects in range images
JP6103243B2 (ja) * 2011-11-18 2017-03-29 日本電気株式会社 局所特徴量抽出装置、局所特徴量抽出方法、及びプログラム
ITTO20120602A1 (it) 2012-07-09 2014-01-10 Sisvel Technology Srl Method for transforming an image descriptor based on a gradient histogram and relative image processing apparatus.
US20140233859A1 (en) * 2013-02-15 2014-08-21 Samsung Electronics Co., Ltd. Electronic device and method of determining descriptor thereof
US20140238338A1 (en) 2013-02-22 2014-08-28 Hyundai Motor Company Variable compression engine
JP2014186520A (ja) * 2013-03-22 2014-10-02 Toshiba Corp 画像処理装置、画像処理方法およびプログラム
JP2014230251A (ja) * 2013-05-27 2014-12-08 ソニー株式会社 画像処理装置、および画像処理方法
GB2516037A (en) * 2013-07-08 2015-01-14 Univ Surrey Compact and robust signature for large scale visual search, retrieval and classification
ITMI20131244A1 (it) * 2013-07-24 2015-01-25 Telecom Italia Spa Identificazione di keypoint
JP6113018B2 (ja) * 2013-08-01 2017-04-12 セコム株式会社 対象検出装置
KR101491461B1 (ko) * 2013-08-02 2015-02-23 포항공과대학교 산학협력단 공분산 기술자를 이용하는 물체 인식 방법 및 장치
JP2015032211A (ja) * 2013-08-05 2015-02-16 株式会社東芝 画像処理装置、方法およびプログラム
US9129189B2 (en) 2013-08-14 2015-09-08 Qualcomm Incorporated Performing vocabulary-based visual search using multi-resolution feature descriptors
KR102018046B1 (ko) * 2014-02-24 2019-09-04 한국전자통신연구원 이미지 특징 추출 장치 및 방법
US9558426B2 (en) * 2014-04-24 2017-01-31 Nant Holdings Ip, Llc Robust feature identification for image-based object recognition
CN104008400A (zh) * 2014-06-16 2014-08-27 河南科技大学 结合sift和bp网络进行物体识别的方法
CN105224582B (zh) * 2014-07-03 2018-11-09 联想(北京)有限公司 信息处理方法和设备
CN104156696B (zh) * 2014-07-23 2017-04-12 华南理工大学 基于双方向图的快速局部不变特征描述子的构造方法
KR102302621B1 (ko) * 2015-03-09 2021-09-16 한국전자통신연구원 고차 라플라시안 오브 가우시안 커널을 이용한 이미지의 특징점 추출 장치 및 방법
US10839487B2 (en) * 2015-09-17 2020-11-17 Michael Edwin Stewart Methods and apparatus for enhancing optical images and parametric databases
US10592729B2 (en) * 2016-01-21 2020-03-17 Samsung Electronics Co., Ltd. Face detection method and apparatus
JP6873600B2 (ja) * 2016-03-04 2021-05-19 キヤノン株式会社 画像認識装置、画像認識方法及びプログラム
US11010630B2 (en) * 2017-04-27 2021-05-18 Washington University Systems and methods for detecting landmark pairs in images
GB2582072B (en) * 2018-04-05 2021-06-30 Imagination Tech Ltd Sampling for feature detection
GB2572756B (en) * 2018-04-05 2020-05-06 Imagination Tech Ltd Sampling for feature detection
US10769474B2 (en) * 2018-08-10 2020-09-08 Apple Inc. Keypoint detection circuit for processing image pyramid in recursive manner
US11189020B2 (en) 2019-02-06 2021-11-30 Thanh Phuoc Hong Systems and methods for keypoint detection
US11507105B2 (en) * 2019-06-27 2022-11-22 Sensable Inc. Method and system for using learning to generate metrics from computer vision-derived video data
CN112037128B (zh) * 2020-08-21 2023-11-03 苏州巨能图像检测技术有限公司 一种全景视频拼接方法
CN112215751A (zh) * 2020-10-13 2021-01-12 Oppo广东移动通信有限公司 图像缩放方法、图像缩放装置及终端设备
US20220171959A1 (en) * 2020-11-27 2022-06-02 Samsung Electronics Co., Ltd. Method and apparatus with image processing
US11475240B2 (en) * 2021-03-19 2022-10-18 Apple Inc. Configurable keypoint descriptor generation
KR20230017549A (ko) * 2021-07-28 2023-02-06 주식회사 넥스트칩 특징점에 대한 기술자를 생성하기 위한 전자 장치 및 그 동작 방법

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5481621A (en) 1992-05-28 1996-01-02 Matsushita Electric Industrial Co., Ltd. Device and method for recognizing an image based on a feature indicating a relative positional relationship between patterns
US6975755B1 (en) 1999-11-25 2005-12-13 Canon Kabushiki Kaisha Image processing method and apparatus
US7194134B2 (en) 2001-01-02 2007-03-20 Microsoft Corporation Hierarchical, probabilistic, localized, semantic image classifier
US6678874B1 (en) 2001-11-28 2004-01-13 Unisys Corporation Computer-aided design (CAD) tool
US7054468B2 (en) 2001-12-03 2006-05-30 Honda Motor Co., Ltd. Face recognition using kernel fisherfaces
JP4613617B2 (ja) * 2005-01-07 2011-01-19 ソニー株式会社 画像処理システム、学習装置および方法、並びにプログラム
US7734107B2 (en) 2006-02-24 2010-06-08 Sony Corporation System and method for performing wavelet-based texture feature extraction and classification
US7949186B2 (en) 2006-03-15 2011-05-24 Massachusetts Institute Of Technology Pyramid match kernel and related techniques
EP1850270B1 (en) * 2006-04-28 2010-06-09 Toyota Motor Europe NV Robust interest point detector and descriptor
JP4883649B2 (ja) 2006-08-31 2012-02-22 公立大学法人大阪府立大学 画像認識方法、画像認識装置および画像認識プログラム
US8233716B2 (en) 2008-06-27 2012-07-31 Palo Alto Research Center Incorporated System and method for finding stable keypoints in a picture image using localized scale space properties
US8363973B2 (en) 2008-10-01 2013-01-29 Fuji Xerox Co., Ltd. Descriptor for image corresponding point matching
US8374442B2 (en) * 2008-11-19 2013-02-12 Nec Laboratories America, Inc. Linear spatial pyramid matching using sparse coding
US8315465B1 (en) * 2009-01-12 2012-11-20 Google Inc. Effective feature classification in images
DE102009022834A1 (de) * 2009-05-27 2010-12-09 Siemens Aktiengesellschaft Verfahren zur automatischen Analyse von Bilddaten einer Struktur
JP4844657B2 (ja) * 2009-07-31 2011-12-28 カシオ計算機株式会社 画像処理装置及び方法
US20120014578A1 (en) * 2010-07-19 2012-01-19 Qview Medical, Inc. Computer Aided Detection Of Abnormalities In Volumetric Breast Ultrasound Scans And User Interface
US8705876B2 (en) * 2009-12-02 2014-04-22 Qualcomm Incorporated Improving performance of image recognition algorithms by pruning features, image scaling, and spatially constrained feature matching
US8897572B2 (en) * 2009-12-02 2014-11-25 Qualcomm Incorporated Fast subspace projection of descriptor patches for image recognition
US8798377B2 (en) * 2010-02-08 2014-08-05 Telefonica, S.A. Efficient scale-space extraction and description of interest points
US8948515B2 (en) * 2010-03-08 2015-02-03 Sightera Technologies Ltd. Method and system for classifying one or more images
US9189137B2 (en) * 2010-03-08 2015-11-17 Magisto Ltd. Method and system for browsing, searching and sharing of personal video by a non-parametric approach
US9639949B2 (en) * 2010-03-15 2017-05-02 Analog Devices, Inc. Edge orientation for second derivative edge detection methods
US9530073B2 (en) * 2010-04-20 2016-12-27 Qualcomm Incorporated Efficient descriptor extraction over multiple levels of an image scale space

Also Published As

Publication number Publication date
KR101470112B1 (ko) 2014-12-05
US20110255781A1 (en) 2011-10-20
US9530073B2 (en) 2016-12-27
EP2561467A1 (en) 2013-02-27
KR20130019430A (ko) 2013-02-26
WO2011133714A1 (en) 2011-10-27
JP2013525905A (ja) 2013-06-20
CN102859535B (zh) 2016-04-06
CN102859535A (zh) 2013-01-02

Similar Documents

Publication Publication Date Title
JP5602940B2 (ja) 事前計算されたスケール空間からのデイジー記述子生成
JP5714599B2 (ja) イメージ認識のための記述子パッチの高速部分空間射影
JP6448767B2 (ja) 画像物体認識におけるロバスト特徴特定
JP5384746B2 (ja) プルーニング機能、画像スケーリング、および、空間制約付き特徴マッチングによる画像認識アルゴリズムの性能の改善
JP4838532B2 (ja) マルチスケールの有向パッチ(multi−scaleorientedpatches)を使用したマルチ画像特徴(feature)のマッチング
JP5503018B2 (ja) 一様なおよび一様でない照明の変化の中での特徴検出を改善するための尺度空間正規化技術
US8798377B2 (en) Efficient scale-space extraction and description of interest points
JP5431362B2 (ja) 画像識別のための特徴ベースの識別特性(signature)
JP2010086540A (ja) 特徴記述子ベクトル生成方法、システムおよびプログラム
WO2018179338A1 (ja) 機械学習装置及び画像認識装置
US20150302270A1 (en) A method of providing a feature descriptor for describing at least one feature of an object representation
CN109063776B (zh) 图像再识别网络训练方法、装置和图像再识别方法及装置
WO2022267939A1 (zh) 图像处理方法及装置、计算机可读存储介质
CN111179270A (zh) 基于注意力机制的图像共分割方法和装置
Shyam et al. Lightweight hdr camera isp for robust perception in dynamic illumination conditions via fourier adversarial networks
Roth et al. Wide-baseline image matching with projective view synthesis and calibrated geometric verification
CN110827301A (zh) 用于处理图像的方法和装置
JP6056354B2 (ja) 画像処理装置、画像処理方法および画像処理プログラム
Hamlin et al. Isift: Extracting incremental results from sift
Srija et al. Image Forgery Detection
CN112862732A (zh) 多分辨率图像融合方法、装置、设备、介质及产品
Mehrish et al. Comprehensive Analysis And Efficiency Comparison Of Image Stitching Techniques
Saxena Enhancement in Time for Feature Extraction & Blending for Panoramic View Generation

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131025

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131112

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140212

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140722

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140820

R150 Certificate of patent or registration of utility model

Ref document number: 5602940

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees