JP5944406B2 - 最近傍を見つけ出すための方法および装置 - Google Patents

最近傍を見つけ出すための方法および装置 Download PDF

Info

Publication number
JP5944406B2
JP5944406B2 JP2013543532A JP2013543532A JP5944406B2 JP 5944406 B2 JP5944406 B2 JP 5944406B2 JP 2013543532 A JP2013543532 A JP 2013543532A JP 2013543532 A JP2013543532 A JP 2013543532A JP 5944406 B2 JP5944406 B2 JP 5944406B2
Authority
JP
Japan
Prior art keywords
vector
distance
group
specific
vectors
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013543532A
Other languages
English (en)
Other versions
JP2013546091A (ja
Inventor
シェハイバー モアタセム
シェハイバー モアタセム
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
IVISYS APS
Original Assignee
IVISYS APS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by IVISYS APS filed Critical IVISYS APS
Publication of JP2013546091A publication Critical patent/JP2013546091A/ja
Application granted granted Critical
Publication of JP5944406B2 publication Critical patent/JP5944406B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24147Distances to closest patterns, e.g. nearest neighbour classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Library & Information Science (AREA)
  • Multimedia (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、最近傍(ニアレスト・ネイバー)を見つけ出すための方法および装置に関する。特に、本発明は、最近傍を見つけ出すために、ベクトルのような多次元データを記憶し、探索し、マッチングすることに関する。この方法は、SIFTアルゴリズムの一部として特に有用である。
米国特許第6711293号の発明者であるロウエ(Lowe)は、限られた計算量のみを用いて高い確率で最近傍を識別できる最適ビン優先探索法として知られているk−d木アルゴリズムの改良を使用した。
米国特許出願公開2010/0067745は、ビデオにおけるオブジェクトのクラスタ化および識別のための方法を開示する。特に、この方法は、顔画像の識別に関わる。この方法は、同一人物に関連していると推定されるビデオオブジェクトのクラスターを使用する。新しい画像は、そのクラスターまでの距離が、予め決められた第1閾値距離よりも小さいとき、既存のクラスターに属するものと見なされる。新しい画像は、その距離が、(第1閾値距離よりも小さい)第2閾値距離よりも大きいとき、クラスターの一部になる。
イエ、エル(Ye, L.)等の"Autocannibalistic
and Anyspace Indexing Algorithms with Applications to Sensor date Mining",
Dept. of Computer Science & Eng., University of California, Riverside, USA,
85-96は、変更されたオーチャードアルゴリズムを提供する。ここで、メモリーへの負荷を軽減するために速度が犠牲となる。メモリーを節約するために速度をどれだけ犠牲にするかは、設計上の選択である。しかしながら、いかなる場合においても、アルゴリズムは、最小限のスペースを要求する。オーチャードアルゴリズムにおいて、データセットにおける各アイテムについて、その近傍(ネイバー)の記憶されたリストが計算される。これは、大きなデータセットのための大量のメモリーを必要とする。変更されたオーチャードアルゴリズムにおいて、互いに近接するアイテムの列は、スペースを節約するために削除される。かくして、探索アルゴリズムは、メモリースペースのために速度を犠牲にする。イエ(Ye)等は、さらに、アルゴリズムを最適化するための動的メモリー割当てを提案する。
ビダル・ルイズ、イー(Vidal Ruiz, E.)の"An algorithm for finding nearest neighbours in
(approximately) constant average time", Patten Recognition Letters 4
(1986), 145-157は、ほぼ一定の平均時間計算量において(即ち、データセットサイズとは無関係に)、所定のサンプルの最近傍を見つけ出すためのアルゴリズムに関する。
最近傍探索問題(近接探索としても知られている最近傍探索、類似探索、または最近接点探索)は、多くの適用分野で生じている。適用分野としては、これらに限定される訳ではないが、パターン認識(特に工学文字認識)、統計分類(k近傍法)、コンピュータビジョン、データベースにおける内容型画像検索、符号理論、データ圧縮、レコメンデーションシステム、インターネットマーケティング、DNAシーケンシング、スペルチェック(正しいスペルの提示)、剽窃検知、プロスポーツ選手のキャリアパスを予測するための類似スコア、クラスター分析(通常はユークリッド距離に基づいて、同じクラスターにおける観察が、ある意味で類似するように、サブセット、即ちクラスターの中に観察のセットを割り当てること)、多変量密度推定およびパターン分類、および機会学習が含まれる。
本発明の発明者は、探索時間を短縮することができ、追加的に探索時間を短縮することを可能にしつつ、更に容易に並行処理に適合できる方法を考え出した。
本発明の一つの態様によれば、それは、複数のベクトルから成るデータセットの中から特定のベクトルをマッチングするための方法に関し、この方法は、
i. 参照点ベクトルを選択する工程と、
ii. 前記参照点ベクトルと前記データセットの前記ベクトルとの間の距離dを計算する工程と、
iii. 前記データセットの前記ベクトルを、前記参照点ベクトルから同じ距離dgroupを持つベクトルのグループにソートする工程であって、
a. その後、2つよりも多くのベクトルを含む、前記グループの各々を、前記グループの第2ベクトルが前記グループの第1ベクトルまで最小距離を有し、前記グループの次の各ベクトルが前記グループの以前のベクトルまで最小距離を有するように、再編成する、工程と、
iv. 前記特定のベクトルの最適マッチングを、
a. 前記参照点ベクトルと前記特定のベクトルとの間の距離dspecificを計算する工程と、
b. 計算された前記距離dspecificに最も近い距離dを備えたベクトルを持つ1つまたは複数の前記グループを識別する工程と、
c. 前記特定のベクトルに最も近い距離dminimumを持つ1つまたは複数の識別された前記グループの中の1つまたは複数の前記ベクトルを識別する工程と、
d. ゼロよりも大きく、dspecific−dminimumからdspecific+dminimumのインターバルの中の前記参照点ベクトルから、距離dを備えた任意の追加のグループを識別する工程と、
e. 前記インターバルの中のすべてのグループが検討されるまで、工程iv.c.および工程iv.d.を繰り返す工程と、
によって識別する工程と、を備える。
当業者は、本方法がマトリクスおよびテンソルにも適合可能であることを理解するであろう。
より良いマッチングのための探索が、並行処理に適合可能である。
当業者は、さらに、この方法が、第2の最良適合、第3の最良適合等を見つけ出すために容易に適合可能であることを理解するであろう。
本発明の一つの態様によれば、それは、複数のベクトルから成るデータセットの中から特定のベクトルをマッチングするための方法であって、前記ベクトルは、少なくとも1つの画像におけるスケール不変特徴を識別するために、スケール不変特徴を表す、方法において、
i. 参照点ベクトルを選択する工程と、
ii. 前記参照点ベクトルと前記データセットの前記ベクトルとの間の距離dを計算する工程と、
iii. 前記データセットの前記ベクトルを、前記参照点ベクトルから同じ距離dgroupを持つベクトルのグループにソートする工程であって、
a. その後、2つよりも多くのベクトルを含む、前記グループの各々を、前記グループの第2ベクトルが前記グループの第1ベクトルまで最小距離を有し、前記グループの次の各ベクトルが前記グループの以前のベクトルまで最小距離を有するように、再編成する、工程と、
iv. 前記特定のベクトルの最適マッチングを、
a. 前記参照点ベクトルと前記特定のベクトルとの間の距離dspecificを計算する工程と、
b. 計算された前記距離dspecificに最も近い距離dを備えたベクトルを持つ1つまたは複数の前記グループを識別する工程と、
c. 前記特定のベクトルに最も近い距離dminimumを持つ1つまたは複数の識別された前記グループの中の1つまたは複数の前記ベクトルを識別する工程と、
d. ゼロよりも大きく、dspecific−dminimumからdspecific+dminimumのインターバルの中の前記参照点ベクトルから、距離dを備えた任意の追加のグループを識別する工程と、
e. 前記インターバルの中のすべてのグループが検討されるまで、工程iv.c.および工程iv.d.を繰り返す工程と、
によって識別する工程と、を備えた方法に関する。
本発明の一つの態様によれば、それは、複数のベクトルから成るデータセットの中から特定のベクトルを次にマッチングするために前記データセットを編成するための方法であって、
i. 参照点ベクトルを選択する工程と、
ii. 前記参照点ベクトルと前記データセットの前記ベクトルとの間の距離dを計算する工程と、
iii. 前記データセットの前記ベクトルを、前記参照点ベクトルから同じ距離dgroupを持つベクトルのグループにソートする工程と、
iv. その後、2つよりも多くのベクトルを含む、前記グループの各々を、前記グループの第2ベクトルが前記グループの第1ベクトルまで最小距離を有し、前記グループの次の各ベクトルが前記グループの以前のベクトルまで最小距離を有するように、再編成する工程と、を備えた方法に関する。
この特徴は、データセットの中からの特定のベクトルの迅速な次のマッチングを可能とする。
本発明の一つの態様によれば、それは、複数のベクトルから成るデータセットの中から特定のベクトルを次にマッチングするために前記データセットを編成するための方法であって、前記ベクトルは、少なくとも1つの画像におけるスケール不変特徴を次に識別するために、少なくとも1つの画像におけるスケール不変特徴を表す、方法において、
i. 参照点ベクトルを選択する工程と、
ii. 前記参照点ベクトルと前記データセットの前記ベクトルとの間の距離dを計算する工程と、
iii. 前記データセットの前記ベクトルを、前記参照点ベクトルから同じ距離dgroupを持つベクトルのグループにソートする工程と、
iv. その後、2つよりも多くのベクトルを含む、前記グループの各々を、前記グループの第2ベクトルが前記グループの第1ベクトルまで最小距離を有し、前記グループの次の各ベクトルが前記グループの以前のベクトルまで最小距離を有するように、再編成する工程と、を備えた方法に関する。
本発明の一つの態様によれば、それは、複数の画素によって画成された原画像において、異なるスケールにわたって安定している画像特徴を識別するための方法であって、
a. 程度の異なるボケを前記原画像に適用することによって得られた差分を計算することによって、前記原画像から、多数の差分画像を取得する工程と、
b. 前記多数の差分画像において画素幅極値を配置する工程と、
c. 各差分画像において各画素について画素勾配ベクトルを生成する工程と、
d. 請求項1乃至9のいずれか一項に記載の方法を適用して、ベクトルの方位を、各差分画像に関連付けられた実際の最大および最小幅画素のそれぞれに関連付ける工程と、を備えた方法に関する。
本発明の一つの態様によれば、それは、複数の画素によって画成された画像におけるスケール不変特徴を識別するための画像処理装置であって、本発明による方法を実施するように構成されたプロセッサ回路を備えた、画像処理装置に関する。
本発明の一つの態様によれば、それは、本発明による方法を実行するソフトウェアプログラムに関する。
本発明の一つの態様によれば、それは、コンピュータプログラムであって、前記プログラムがコンピュータ上で実行されたときに、方法に関する請求項のいずれか一つのすべての工程を実行するためのプログラムコード手段を備えた、コンピュータプログラムに関する。
本発明の一つの態様によれば、それは、コンピュータプログラム製品であって、前記プログラム製品がコンピュータ上で実行されたときに、方法に関する請求項のいずれか一つの方法を実行するためのコンピュータ読取り可能な媒体上に記憶されたプログラムコード手段を備えたコンピュータプログラム製品に関する。
追加的な態様および実施形態を以下に示す。
本発明の一つの態様によれば、それは、複数のベクトルから成るデータセットの中から特定のベクトルをマッチングするための方法であって、
i. 参照点ベクトルを選択する工程と、
ii. 前記参照点ベクトルと前記データセットの前記ベクトルとの間の距離dを計算する工程と、
iii. 前記データセットの前記ベクトルを、前記参照点ベクトルから同じ距離dgroupを持つベクトルのグループにソートする工程と、
iv. その後、2つよりも多くのベクトルを含む、前記グループの各々を、前記グループの第2ベクトルが前記グループの第1ベクトルまで最小距離を有し、前記グループの次の各ベクトルが前記グループの以前のベクトルまで最小距離を有するように、再編成する工程と、
v. 前記特定のベクトルの最適マッチングを、
a. 前記参照点ベクトルと前記特定のベクトルとの間の距離dspecificを計算する工程と、
b. 計算された前記距離dspecificに最も近い距離dを備えたベクトルを持つ1つまたは複数の前記グループを識別する工程と、
c. 前記特定のベクトルに最も近い距離dminimumを持つ1つまたは複数の識別された前記グループの中の1つまたは複数の前記ベクトルを識別する工程と、
d. ゼロよりも大きく、dspecific−dminimumからdspecific+dminimumのインターバルの中の前記参照点ベクトルから、距離dを備えた任意の追加のグループを識別する工程と、
e. 前記インターバルの中のすべてのグループが検討されるまで、工程v.c.および工程v.d.を繰り返す工程と、
によって識別する工程と、を備えた方法に関する。
specific−dminimumはゼロよりも小さいかも知れないので、ゼロおよびdspecific−dminimumの大きい方を採用する必要がある。
好ましくは、インターバル全体が使用され、このインターバル全体は、i) ゼロおよびdspecific−dminimumの大きい方、およびii) dspecific+dminimumの制限値の前記参照点ベクトルからの距離を持つグループを含んでいる。好ましさではより劣る方法において、良好な候補が求められる場合にのみ、例えば時間を節約するために、このインターバルの中のグループのみが使用される。
より良いマッチングが識別されるにつれて、距離dminimumが短くなる。故に、dspecific−dminimumからdspecific+dminimumのインターバルがより短くなり、検討すべき追加のグループの数が減少する。
より良いマッチングのための探索が、並行処理に適合可能であり、例えば、dspecificよりも短い距離dを持つグループについて、およびdspecificよりも長い距離dを持つグルーブについて独立に、探索が実施されるかも知れない。そのような独立の探索は、これまでに識別された最短距離dminimumについて適切に比較し、それに続いて分配することを可能とする。
この方法は、さらに、第2の最良適合、第3の最良適合等を見つけ出すために容易に適合可能である。
本発明の一つの実施形態によれば、それは、複数のベクトルから成るデータセットの中から特定のベクトルをマッチングするための方法であって、前記ベクトルは、少なくとも1つの画像におけるスケール不変特徴を識別するために、スケール不変特徴を表す、方法において、
i. 参照点ベクトルを選択する工程と、
ii. 前記参照点ベクトルと前記データセットの前記ベクトルとの間の距離dを計算する工程と、
iii. 前記データセットの前記ベクトルを、前記参照点ベクトルから同じ距離dgroupを持つベクトルのグループにソートする工程と、
iv. その後、2つよりも多くのベクトルを含む、前記グループの各々を、前記グループの第2ベクトルが前記グループの第1ベクトルまで最小距離を有し、前記グループの次の各ベクトルが前記グループの以前のベクトルまで最小距離を有するように、再編成する工程と、
v. 前記特定のベクトルの最適マッチングを、
a. 前記参照点ベクトルと前記特定のベクトルとの間の距離dspecificを計算する工程と、
b. 計算された前記距離dspecificに最も近い距離dを備えたベクトルを持つ1つまたは複数の前記グループを識別する工程と、
c. 前記特定のベクトルに最も近い距離dminimumを持つ1つまたは複数の識別された前記グループの中の1つまたは複数の前記ベクトルを識別する工程と、
d. ゼロよりも大きく、dspecific−dminimumからdspecific+dminimumのインターバルの中の前記参照点ベクトルから、距離dを備えた任意の追加のグループを識別する工程と、
e. 前記インターバルの中のすべてのグループが検討されるまで、工程v.c.および工程v.d.を繰り返す工程と、
によって識別する工程と、を備える方法に関する。
本発明の一つの実施形態によれば、それは、検討されるべき次のグループが、dspecificに最も近い距離dを持つ未検討のグループである、方法に関する。未検討のグループとは、そのグループのベクトルが、dminimumよりも特定のベクトルに近いベクトルの識別のための検討が未だ行われていないグループである。
これに代えて、探索は、例えば、dspecificに最も近い距離dを持つグループからスタートし、未検討のグループの中を下降しまたは上昇するように行われるかも知れないし、或いは、好ましくは、並行処理を用いることによって、下降と上昇が同時に行われる。
本発明の一つの実施形態によれば、それは、ベクトルが少なくとも1つの画像の中の特徴を表す、方法に関する。
本発明の一つの実施形態によれば、それは、ベクトルが少なくとも1つの画像の中のスケール不変特徴を表す、方法に関する。
本発明の一つの実施形態によれば、それは、少なくとも1つの画像の中のスケール不変特徴を識別するために使用される方法に関する。
本発明の一つの実施形態によれば、それは、ベクトルが多次元である、方法に関する。
本発明の一つの実施形態によれば、それは、前記距離d、dgroup、dspecificおよびdminimumは、ユークリッド距離、マハラノビス距離、マンハッタン距離、チェビシェフ距離、およびミンコフスキー距離から成るグループの中から選択される距離として計算される、方法に関する。マハラノビス距離は、距離メトリックスケール不変量を作成するための共分散マトリックスの基づく正規化を意味する。マンハッタン距離は、軸整列された方向のみに従う距離の測定を意味する。チェビシェフ距離は、最も重要なディメンション(dimension)のみが関連すると仮定した距離の測定を意味する。ミンコフスキー距離は、ユークリッド距離、マンハッタン距離、およびチェビシェフ距離を統合する一般化を意味する。
本発明の一つの実施形態によれば、それは、前記距離d、dgroup、dspecificおよびdminimumは、ユークリッド距離として計算される、方法に関する。
本発明の一つの実施形態によれば、それは、前記参照点ベクトルがデータセットの中から選択される、方法に関する。
本発明の一つの実施形態によれば、それは、前記参照点ベクトルがデータセットの中点として選択される、方法に関する。
本発明の一つの態様によれば、それは、複数のベクトルから成るデータセットの中から特定のベクトルを次にマッチングするために前記データセットを編成するための方法において、
i. 参照点ベクトルを選択する工程と、
ii. 前記参照点ベクトルと前記データセットの前記ベクトルとの間の距離dを計算する工程と、
iii. 前記データセットの前記ベクトルを、前記参照点ベクトルから同じ距離dgroupを持つベクトルのグループにソートする工程と、
iv. その後、2つよりも多くのベクトルを含む、前記グループの各々を、前記グループの第2ベクトルが前記グループの第1ベクトルまで最小距離を有し、前記グループの次の各ベクトルが前記グループの以前のベクトルまで最小距離を有するように、再編成する工程と、を備えた方法に関する。
本発明の一つの態様によれば、それは、複数のベクトルから成るデータセットの中から特定のベクトルを次にマッチングするために前記データセットを編成するための方法であって、前記ベクトルは、少なくとも1つの画像におけるスケール不変特徴を次に識別するために、少なくとも1つの画像におけるスケール不変特徴を表す、方法において、
i. 参照点ベクトルを選択する工程と、
ii. 前記参照点ベクトルと前記データセットの前記ベクトルとの間の距離dを計算する工程と、
iii. 前記データセットの前記ベクトルを、前記参照点ベクトルから同じ距離dgroupを持つベクトルのグループにソートする工程と、
iv. その後、2つよりも多くのベクトルを含む、前記グループの各々を、前記グループの第2ベクトルが前記グループの第1ベクトルまで最小距離を有し、前記グループの次の各ベクトルが前記グループの以前のベクトルまで最小距離を有するように、再編成する工程と、を備えた方法に関する。
本発明の一つの実施形態によれば、それは、好ましくは少なくとも1つの画像におけるスケール不変特徴を識別するために、複数のベクトルから成るデータセットの中から特定のベクトルをマッチングするために使用される方法の特徴に関し、この方法は、
v. 前記特定のベクトルの最適マッチングを、
a. 前記参照点ベクトルと前記特定のベクトルとの間の距離dspecificを計算する工程と、
b. 計算された前記距離dspecificに最も近い距離dを備えたベクトルを持つ1つまたは複数の前記グループを識別する工程と、
c. 前記特定のベクトルに最も近い距離dminimumを持つ1つまたは複数の識別された前記グループの中の1つまたは複数の前記ベクトルを識別する工程と、
d. ゼロよりも大きく、dspecific−dminimumからdspecific+dminimumのインターバルの中の前記参照点ベクトルから、距離dを備えた任意の追加のグループを識別する工程と、
e. 前記インターバルの中のすべてのグループが検討されるまで、工程v.c.および工程v.d.を繰り返す工程と、
によって識別する工程と、をさらに備える。
この実施形態は、この方法の特徴が、最初にデータセットを編成し、続いて各マッチングが急速に完了することを許容するかも知れないことを示す。
本発明の一つの実施形態によれば、それは、複数の画素によって画成された原画像において、異なるスケールにわたって安定している画像特徴を識別するための、本発明による方法であって、
a. 程度の異なるボケを前記原画像に適用することによって得られた差分を計算することによって、前記原画像から、多数の差分画像を取得する工程と、
b. 前記多数の差分画像において画素幅極値を配置する工程と、
c. 各差分画像において各画素について画素勾配ベクトルを生成する工程と、
d. 請求項1乃至9のいずれか一項に記載の方法を適用して、ベクトルの方位を、各差分画像に関連付けられた実際の最大および最小幅画素のそれぞれに関連付ける工程と、を備えた方法に関する。
本発明の一つの実施形態によれば、それは、複数の画素によって画成された画像におけるスケール不変特徴を識別するための画像処理装置であって、本発明による方法を実施するように構成されたプロセッサ回路を備えた、画像処理装置に関する。
本発明の一つの実施形態によれば、それは、本発明の画像処理装置に関し、前記画像処理装置は多数のチップを備え、各チップは、特定のベクトルの前記最適マッチングの識別の一部を実行するように構成されている。
本発明の一つの実施形態によれば、それは、本発明の画像処理装置に関し、前記画像処理装置は、GPU、DSP、FPGAおよびASICから成るグループの中から選択された少なくとも1つの要素を備える。
本発明の一つの実施形態によれば、それは、本発明の画像処理装置に関し、前記画像処理装置は、前記参照点ベクトルを記憶するための手段、前記データセットの、記憶された前記ベクトル、前記距離dおよびdgroup、および前記特定のベクトルを受け取るための手段を備える。
本発明の一つの実施形態によれば、それは、コンピュータプログラムであって、前記プログラムがコンピュータ上で実行されたときに請求項のいずれか一項のすべての工程を実行するためのプログラムコード手段を備えた、コンピュータプログラムに関する。
本発明の一つの実施形態によれば、それは、コンピュータプログラム製品であって、前記プログラム製品がコンピュータ上で実行されたときに請求項のいずれか一項の方法を実行するためのコンピュータ読取り可能な媒体上に記憶されたプログラムコード手段を備えたコンピュータプログラム製品に関する。
本発明の一つの実施形態によれば、それは、本発明による方法を実行するためのソフトウェアプログラムに関する。
本発明の一つの実施形態によれば、それは、複数の画素によって画成された画像におけるスケール不変特徴を識別するように成された、本発明によるソフトウェアプログラムに関する。
すべての引用文献は、参照により組み込まれたものとする。
添付の図面および例は、本発明を限定するのではなく説明するために提供される。当業者において、本発明の態様、実施形態、および請求項を組み合わせ可能であることは明らかである。
以下に図面が紹介されており、続いて幾つかの図面がさらに説明されている。
図1は、データベースサイズの関数としての、予想される探索の数を示す。 図2は、再編成されたメモリーの図解例を示す。 図3は、ユークリッド空間における円状の点マッピングの図解例を示す。 図4は、ソートされたFIFOロケーション・データ・フィールド 図5は、拡張されたFIFOにおけるデータ配列の図解例を示す。 図5Bは、データソートプロセスの実施形態を概説する。 図5Cは、ベクトルマッチングプロセスの実施形態を概説する。 図5Dは、粗いフェッチの実施形態を概説する。 図5Eは、細かいフェッチの実施形態を概説する。 図5Fは、細かいフェッチの実施形態を概説する。 図6は、第1のソート法を表すフローチャートを示す。 図7は、第2のソート法を表すフローチャートを示す。 図8は、粗いフェッチングおよびデータベクトルマッチング法を表すフローチャートを示す。 図9は、小さなデータベースのための粗いフェッチングおよびデータベクトルマッチング法を表すフローチャートを示す。 図10は、図9の続きを示す。 図11は、図9の続きを示す。 図12は、図9の続きを示す。 図13は、本発明の方法のための模式的なハードウェア実装例を示す。 図14は、ユークリッド空間におけるマッピングの図解例を示す。参照点ベクトル(矢印1の先端によって示される)が選択されている。図14において、それは、軸の原点にて示されている。参照点ベクトルまで等距離のベクトルは、一緒にグループ化される。これは、図14において円で示されており、このグループについての参照点ベクトルからの等距離は、dgroupである。マッチングされるべき、参照点ベクトルと特定のベクトル(矢印2の先端によって示される)の間の距離dspecificが計算される。dspecificに最も近いdgroupを持つベクトルのグループが選択される。これらの中から、特定のベクトルまでの最小距離dminimumを備えたベクトルが見つけ出される。続いて、ゼロよりも大きく、dspecific−dminimumからdspecific+dminimumのインターバルの中の距離を備えた未検討のグループのみが検討される必要がある。より小さな最小距離dminimumを備えたベクトルが識別されるにつれて、より良いマッチングを識別するために探索が必要となる未検討のグループが少なくなる。
本例は、メモリー要素にてn次元データベクトルを組織化し、探索することにより、高速データベクトルマッチングについての本発明の実施形態を実施する方法に関する。この方法は、多次元探索キー(例えば、レンジ探索および最近傍探索)を含む探索のような、幾つかの適用にとって有益である。この方法は、探索をスピードアップするような方法で特別なメモリー・コンストラクションにおいて参照データベクトルを静的に構築し、動的に入力されたデータベクトルをリアルタイムでマッチングすることに依存している。
この方法および本発明は、log2(サイズ)のファクターまでのデータベクトル間のマッチングを見つけ出すためのデータベース内の探索数を潜在的に低減する。ここで、「サイズ」とは、データベクトルの数における参照データベースのサイズである。これは図1に図解されている。
この方法は、FPGAおよびASICのようなGPU、DSPおよび並列処理ハードウェアにおいて実行され得る。
この方法は、適応性のある加速された探索を可能とする特別の編成に参照データベクトル構築し、来入データベクトルにスキームをマッチングすることによって機能する。この方法は、ソートフェーズ、並びに探索およびマッチングフェーズを含む。
メモリー要素内に任意に編成されたn次元参照データベクトルのデータベースを仮定すれば、この方法は、参照データベクトルの中から、マッチングまたは新しく来入データベクトルまでの最近傍参照データベクトルを見つけ出すという問題を解決する。マッチングデータベクトルは、この文脈においては、来入データベクトルまで最小距離(例えばユークリッド距離)を持つベクトルとして定義される。
この方法では、参照データベクトルは、共通の参照データベクトルまでの昇順距離の関数としてメモリー内で最初に再編成される。共通の参照データベクトルは、既存のデータベクトルのセットから、任意または明確な基準のいずれかによって選択される。再編成が終了すると、編成されたメモリーの最初の位置でのデータベクトルは、共通の参照ベクトルまでの最小距離を持つデータベクトルを含む。ソートされたメモリー内の次のアドレスは、参照までの同じ最小距離を持つデータベクトルの残りを、そのようなベクトルが存在する場合にはこれを保持する。さもなければ、これらの昇順アドレスは、共通の参照ベクトルまでの昇順距離を備えた参照データベクトルを保持する。共通の参照までの同じ距離を持つベクトルは、以下の方法にて編成される。すなわち、もしメモリー内のアドレス「X」が、共通の参照までの距離「Y」を備えたデータベクトル「A」を保持している場合、位置「X+1」は、参照データベクトルのデータベクトル「B」を保持し、このときの参照データベクトルは、共通の参照までの同じ距離「Y」を持ち、同時に「A」までの最小距離を持つベクトル(そのようなベクトルが存在する場合には)である。そして、位置「X+2」は、共通の参照までの距離「Y」および「B」までの最小距離を持つベクトル「C」を(ここでもまた、そのようなベクトルが存在する場合には)保持する。図2は、ソートされたメモリー編成の図解例を提供する。この図において、点「D」は、共通の参照までの絶対的な最小距離を有し、それ故に最初のメモリーアドレスに配置されている、単一データベクトルを表している。点「S」は、共通の参照までの、次に最も短い距離を持つデータベクトルを表しており、以下同様である。この図において、点「A」、「B」、「C」は、共通の参照点までの等しい距離を持つ3つのデータベクトルを表している。点「B」は、「A」によって表される参照データベクトルまでの最も短い距離を持つデータベクトルを表し、同様に、点「C」は、「B」によって表される参照データベクトルまでの最も短い距離を備えた参照データベクトルを表している。
ソートを行う際に、繰り返しのデータベクトルが除去される。結果として得られるアレイの中の各データベクトルは、共通の参照点までのその距離と一緒に、同じメモリー位置において、インデックス化および探索を容易にする他のデータフィールドと一緒に保存される。これは図4に例示されている。
上述の方法でデータベクトルが再編成されると、既存の参照データベクトルの中からの、外来データベクトルへの最適マッチングまたは最近傍の迅速な決定が、連続近似法を用いて可能となる。この方法では、共通の参照ベクトルまでの外来データベクトルの距離が最初に計算され、編成されたアレイの中央位置に保存された距離と比較される。計算された距離が、保存された距離よりも小さい場合には、メモリースペースの下半分にて最適マッチングが見つけ出されると推定される。この場合、次の探索は、計算された距離を、メモリースペースの下半分の中央のメモリー位置に保存されたデータベクトルと比較することによって起こる。それとは逆に、計算された距離が、メモリースペースの中央にある保存された距離よりも大きいことが分かった場合には、最近傍は、編成されたメモリーの上半分の位置に見つけ出されると推定される。この場合、次の探索は、計算された距離を、メモリースペースの上半分の中央位置に保存された距離と比較することによって行われる。最後に、計算された距離が、保存された距離に等しい場合は、最近傍は、中央メモリー位置の周囲に保存された参照データベクトルの一つであると推定される。
この方法においては、n次元データベクトルが、粗く保存されており、データベクトルによって表された、単一の、任意に選択された参照点までの距離の昇順にてFIFOの中に保存されている。かくして、図3の例に示されているように、すべての参照データベクトルが共通の参照点までの距離の関数として点にマッピングされたユークリッド空間が生成される。保存された参照点の共通の参照点までのそれぞれの距離は、フェッチングプロセスの際にこれらを再度計算しなければならない事態を回避するために、同じメモリーアドレスにおいて参照点と一緒に随意に保存され、これのコストは、メモリーサイズへの追加的な要求であろう。
参照点は、保存されたデータベクトルの一つであり、かくして、保存されたメモリー要素、例えばFIFOの中の最初の点は、参照までの最小距離を持つデータベクトルである。保存されたメモリーの中の次のアドレスは、任意に編成され、参照までの次の最小距離を持つベクトルがこれに続く、参照までの同じ最小距離を持つすべてのデータベクトルを保持し、以下同様である。故に、保存されたメモリー内の最後のアドレスは、参照データベクトルまでの最大距離を持つデータベクトルのセットを保持する。図3の例においては、中心参照点の周囲の内側円が、その周囲に、参照までの最小距離を持つデータベクトルを表す点を含んでおり、太い黒い周囲の外側円が、例参照データセットの中から参照までの最大距離のデータベクトルを表す点を含んでいる。
図3に示されているように、参照点までの等しい距離を備えたデータ点は、円の周囲を形成しており、この円は、参照点に中心が置かれており、該距離に等しい半径を備えている。粗いソートに続く細かいソートにおいては、これらの点もまた、以下の方法にて、それらの相互距離の関数としてFIFO内に編成される。すなわち、連続メモリーアドレスは、互いに最も近い点を含んでおり、それらの間の最も短い距離によって識別される(例えば、もしアドレス「x」が、共通の参照点までの距離「y」を備えたデータ点「A」を含む場合、アドレス「x+1」は、「A」まで最も短い距離を持ち、共通の参照データ点まで同じ距離「y」を持つ、データ点「B」を、そのような点が、マッピングされた参照点のセットの中に存在する場合には、含むであろう(図3参照)。)図6および図7は、粗いソートプロセスおよび細かいソートプロセスをそれぞれ例示している。
粗いソートフェーズおよび細かいソートフェーズは、来入データベクトルとのマッチングのために迅速な探索参照データベクトルを助けるFIFO/メモリーおよびデータ構造を提供する。単一の、ソートされたFIFO/メモリー位置でのデータ構造が図4に例示されており、結果として得られるFIFO/メモリー構造が図5に例示されている。
これらの図によって示されているように、拡張FIFO/メモリー内の各位置は、以下のデータフィールドを含んでいる(下線付与):
データ・ベクトル・フィールド
参照点から成るn次元データベクトルを表すデータフィールド。
距離フィールド(随意)
本明細書中で共通の参照点と呼ばれている、選択された共通の参照データベクトルまでの特定のデータベクトルの計算された距離を表すデータフィールド。これは、随意のフィールドである。これは、メモリーサイズへの要求を軽減するために除去することができる。除去された場合には、オンザフライで必要に応じて距離が計算される。
サイズ/インデックスフィールドおよび繰返しフラグフィールド
サイズ/インデックス(sz/ndx)フィールドは、サイズまたはインデックスを表す2つの値のうちの1つを含む。FIFO/メモリー位置が、距離フィールドにて与えられた距離を備えた最初のデータベクトルを含む場合、フィールドは、共通の参照までの同じ距離を持つデータベクトルセットのサイズを表す値を含むか、さもなければ、フィールドは、参照までの同じ距離を備えた連続データベクトルの増大されたインデックスを表す数を含んでいるだろう。
繰返しフラグフィールドは、距離フィールドが以前のFIFO位置から繰り返される場合に「1」にセットされ、それ以外は「0」にリセットされるフィールドである。図5の例において、アドレス「00000」でのサイズ/インデックスフィールド内の数「3」は、選択された参照点までの距離「xxxx」を持つ参照データベクトルの全体の数が3つであることを示している。アドレス「00000」での繰返しフラグフィールド内の「0」は、データベクトルフィールド内のデータベクトルが、参照点までの距離「xxxx」を持つFIFO内の最初のものであることを示している。アドレス「00001」において、繰返しフラグは、この位置でのデータベクトルが、参照点まで、先行するアドレス(この場合は「00000」)でのデータベクトルと同じ距離を持っていることを示すために、「1」にセットされ、サイズ/インデックスフィールド内のインデックス値「1」は、手元にあるものと同じ参照までの距離を備えた参照データベクトルを持つFIFO内の以前の位置が1つのみであることを示し、アドレス「00003」での値「3」は、このアドレスでのデータベクトルと同じ参照点までの距離を持つ参照データベクトルを保存する、以前のFIFO位置が、全体で3つであることを示している。
来入データベクトルの、共通の参照点までの距離は、オンザフライで計算され、ソートされたFIFO内の保存された距離と粗く比較され−或いは、ここでもまたオンザフライで計算され−、来入点を取り囲むかも知れない円の周囲に最も近い円周囲を見つけ出す。最も近い円周囲は、図8のフローチャートによって例示されたように見つけ出される。同図においては、以下の略語が使用されている。
・Addr.:用語FIFOアドレスを短縮したもの。
・Strt.:スタートの略語である(即ち、「strt Addr」は、FIFO内の探索スタートアドレスであるスタートアドレスの略語である。End Addr.は、探索エンドアドレスである)。略語「strt」が単独で使用される場合、それは探索スタートアドレスを意味する。
・End:探索エンドアドレスを意味する。
・Dist:距離(ディスタンス)の略語である。
・Eucl.:ユークリッドの略語である。図において、ユークリッド距離が例として使用されており、「Eucl.Dist.」のように示されている。
・Res:結果(リザルト)の略字である。図において、resはレジスターとして扱われている。
・Crnt.:現在(カレント)を意味している。この略語が単独で使用される場合、それは現在のFIFOアドレスを意味する。
・Ndx.:インデックスの略語であり、本明細書中で先に説明したように、ndxデータフィールドによって表されるインデックスを意味している。図5参照。
・Rev.:用語リバースの略語である。ここで、rev.はフラグであり、セット時にFIFOからの読み込みが現在の円の最後の点から起こるようにする。図3を参照すれば、それは点「D」であろう。ここで、このアイデアは、比較点の無関係を飛び越える。
・Rd.は読み込み(リード)の略語である。ここでは、FIFO読込みアドレスを示すために使用され、FIFO書込みアドレスと区別される。
・サイズは、図5に例示されているように、「sz」フィールド内の値を参照している。
・繰返しフラグ:これは、図5に例示されているように、Rep.flagの値である。
・最初:これは、粗い探索によって見つけ出される最初のFIFO探索アドレスである。
そして、最初は最も近い円周囲および隣接の周囲上の点の中から、来入点までの最小距離を備えた最も近い点を見つけ出すために、比較がリファインされる。図9、図10、図11、および図12は、細かい探索およびマッチングのプロセスを例示している。
付録
SIFT特徴のような画像特徴は、ベクトルによって表されるかも知れない。これは、以下に示す引用によって本付録の中に例示されている。
当業者は、例えば米国特許第6711293号およびWikipediaから、SIFT法に精通している。米国特許第6711293号は、「サブ領域記述子のセット(sets of subregion descriptors)」という用語を用いており、Wikipediaは、これに代えて、「記述子ベクトル(descriptor vector)」、「ベクトル(vector)」、「記述子(descriptor)」という用語を用いている。本件特許請求の範囲および明細書の残余部分においては、「ベクトル(vector)」の用語を用いている。
Wikipediaからの引用「スケール不変特徴変換」(以下強調付加)。
キーポイント記述子
以前の工程は、キーポイント位置を特定のスケールにて見つけ出し、それらに方位を割り当てた。これにより、画像位置、スケールおよび回転への不変性を確保する。さて、我々は、イルミネーション、3D視点などの残余の変量に対して記述子はその弁別性が高く且つ部分的に不変であるように、各キーポイントについて記述子ベクトルを算定することを欲する。この工程は、スケールにおいてキーポイントスケールに最も近い画像上で実施される。
最初に、方位ヒストグラムのセットが、各8ビンを備えた4×4ピクセル近傍上で生成される。これらのヒストグラムは、各ヒストグラムが原近傍領域の4×4サブ領域からのサンプルを含むように、キーポイントの周りの16×16領域の中のサンプルの大きさおよび方位の値から算定する。この大きさは、さらに、記述子窓の幅の半分に等しいσを備えたガウス関数によって重み付される。そして、記述子は、これらヒストグラムの値のすべてのベクトルになる。各8ビンを備えた4×4=16ヒストグラムがあるので、ベクトルは128要素を持つ。そして、このベクトルは、不変性を高めてイルミネーション内の変化をアフィンするために、単位長さに正規化される。非線形イルミネーションの影響を低減するために、0.2の閾値が適用され、ベクトルが再び正規化される。
記述子のディメンション、即ち128は、高いように見えるけれど、これよりも低いディメンションを備えた記述子は、マッチングタスクの範囲にわたって同様に機能することができず・・・および、最近傍を見つけ出すために使用される概算BBF(下記参照)法の故に演算コストが抑制される。より長い記述子は、より良い働きをするが、ずっと良い訳でなく、歪みおよび閉塞の感度が増大するという追加の危険がある。それはまた、特徴マッチング精度が、50度までの視点変化について50%よりも高いことを示している。それ故、SIFT記述子は、小さなアフィン変化に対して不変である。SIFT記述子の弁別性を試験するために、試験データベース内のキーポイントの数を変化させて、マッチング精度もまた測定された。そして、非常に大きなデータベースサイズに対して、マッチング精度は非常に僅かしか低下しないことが示されており、かくして、SIFT特徴の弁別性が高いことが示されている。
米国特許第6711293号、段落[0071]の記述からの引用
もし、ブロック198において、サブ領域内の対象の最後の点が検討されると、ブロック202は、プロセッサー22に対して、角コンポーネントセットおよびこれらの関連するコンポーネント記述子要素を、領域と関連して保存するように指示する。かくして、各全領域について、8セットのコンポーネントサブ領域記述子が、全数で128あり、極値について全領域を表している、ということが分かる。8セットのコンポーネントサブ領域記述子は、画像の1つのスケール不変特徴を表す。・・・

Claims (17)

  1. 複数のベクトルから成るデータセットの中から特定のベクトルをマッチングするための方法であって、前記ベクトルは、少なくとも1つの画像におけるスケール不変特徴を識別するために、スケール不変特徴を表す、ソフトウェアプログラムを用いてコンピュータが実行する方法において、
    i. 選択された参照点ベクトルと前記データセットの前記ベクトルとの間の距離dを計算する工程と、
    ii. 前記データセットの前記ベクトルを、前記参照点ベクトルから同じ距離dgroupを持つベクトルのグループにソートする工程と、
    iii. その後、2つよりも多くのベクトルを含む、前記グループの各々を、前記グループの第2ベクトルが前記グループの第1ベクトルまで最小距離を有し、前記グループの次の各ベクトルが前記グループの以前のベクトルまで最小距離を有するように、再編成する工程と、
    iv. 前記特定のベクトルの最適マッチングを、
    a. 前記参照点ベクトルと前記特定のベクトルとの間の距離dspecificを計算する工程と、
    b. 計算された前記距離dspecificに最も近い距離dを備えたベクトルを持つ1つまたは複数の前記グループを識別する工程と、
    c. 前記特定のベクトルに最も近い距離dminimumを持つ1つまたは複数の識別された前記グループの中の1つまたは複数の前記ベクトルを識別する工程と、
    d. ゼロよりも大きく、dspecific−dminimumからdspecific+dminimumのインターバルの中の前記参照点ベクトルから、距離dを備えた任意の追加のグループを識別する工程と、
    e. 前記インターバルの中のすべてのグループが検討されるまで、工程iv.c.および工程iv.d.を繰り返す工程と、
    によって識別する工程と、を備えた方法。
  2. 検討されるべき次のグループは、dspecificに最も近い距離dを持つ未検討のグループである、請求項1記載の方法。
  3. 前記ベクトルは、多次元である、請求項1または2に記載の方法。
  4. 前記距離d、dgroup、dspecificおよびdminimumは、ユークリッド距離、マハラノビス距離、マンハッタン距離、チェビシェフ距離、およびミンコフスキー距離から成るグループの中から選択される距離として計算される、請求項1乃至3のいずれか一項に記載の方法。
  5. 前記距離d、dgroup、dspecificおよびdminimumは、ユークリッド距離として計算される、請求項1乃至4のいずれか一項に記載の方法。
  6. 前記参照点ベクトルは、前記データセットの中から選択される、請求項1乃至5のいずれか一項に記載の方法。
  7. 前記参照点ベクトルは、前記データセットの中点として選択される、請求項1乃至5のいずれか一項に記載の方法。
  8. 複数のベクトルから成るデータセットの中から特定のベクトルを次にマッチングするために前記データセットを編成するための方法であって、前記ベクトルは、少なくとも1つの画像におけるスケール不変特徴を次に識別するために、少なくとも1つの画像におけるスケール不変特徴を表す、ソフトウェアプログラムを用いてコンピュータが実行する方法において、
    i. 選択された参照点ベクトルと前記データセットの前記ベクトルとの間の距離dを計算する工程と、
    ii. 前記データセットの前記ベクトルを、前記参照点ベクトルから同じ距離dgroupを持つベクトルのグループにソートする工程と、
    iii. その後、2つよりも多くのベクトルを含む、前記グループの各々を、前記グループの第2ベクトルが前記グループの第1ベクトルまで最小距離を有し、前記グループの次の各ベクトルが前記グループの以前のベクトルまで最小距離を有するように、再編成する工程と、を備えた方法。
  9. 少なくとも1つの画像におけるスケール不変特徴を識別するために、複数のベクトルから成るデータセットの中から特定のベクトルをマッチングするために使用される、請求項8記載の方法であって、
    iv. 前記特定のベクトルの最適マッチングを、
    a. 前記参照点ベクトルと前記特定のベクトルとの間の距離dspecificを計算する工程と、
    b. 計算された前記距離dspecificに最も近い距離dを備えたベクトルを持つ1つまたは複数の前記グループを識別する工程と、
    c. 前記特定のベクトルに最も近い距離dminimumを持つ1つまたは複数の識別された前記グループの中の1つまたは複数の前記ベクトルを識別する工程と、
    d. ゼロよりも大きく、dspecific−dminimumからdspecific+dminimumのインターバルの中の前記参照点ベクトルから、距離dを備えた任意の追加のグループを識別する工程と、
    e. 前記インターバルの中のすべてのグループが検討されるまで、工程iv.c.および工程iv.d.を繰り返す工程と、
    によって識別する工程と、をさらに備えた方法。
  10. 複数の画素によって画成された原画像において、異なるスケールにわたって安定している画像特徴を識別するための、請求項1乃至9のいずれか一項に記載の方法であって、
    a. 程度の異なるボケを前記原画像に適用することによって得られた差分を計算することによって、前記原画像から、多数の差分画像を取得する工程と、
    b. 前記多数の差分画像において画素幅極値を配置する工程と、
    c. 各差分画像において各画素について画素勾配ベクトルを生成する工程と、
    d. 請求項1乃至9のいずれか一項に記載の方法を適用して、ベクトルの方位を、各差分画像に関連付けられた実際の最大および最小幅画素のそれぞれに関連付ける工程と、を備えた方法。
  11. 複数の画素によって画成された画像におけるスケール不変特徴を識別するための画像処理装置であって、
    請求項1乃至10のいずれか一項に記載の方法を実施するように構成されたプロセッサ回路を備えた、画像処理装置。
  12. 前記画像処理装置は多数のチップを備え、各チップは、請求項1の工程iv.の前記特定のベクトルの前記最適マッチングの識別の一部を実行するように構成されている、請求項11記載の画像処理装置。
  13. 前記画像処理装置は、GPU、DSP、FPGAおよびASICから成るグループの中から選択された少なくとも1つの要素を備える、請求項11または12に記載の画像処理装置。
  14. 前記画像処理装置は、前記参照点ベクトルを記憶するための手段、前記データセットの、記憶された前記ベクトル、前記距離dおよびdgroup、および前記特定のベクトルを受け取るための手段を備える、請求項11乃至13のいずれか一項に記載の画像処理装置。
  15. コンピュータプログラムであって、前記プログラムがコンピュータ上で実行されたときに請求項1乃至10のいずれか一項のすべての工程を実行するためのプログラムコード手段を備えた、コンピュータプログラム。
  16. 請求項1乃至10のいずれか一項に記載の方法を実行するソフトウェアプログラム。
  17. 複数の画素によって画成された画像におけるスケール不変特徴を識別するように成された、請求項16記載のソフトウェアプログラム。
JP2013543532A 2010-12-17 2011-12-15 最近傍を見つけ出すための方法および装置 Active JP5944406B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
DKPA201070560A DK177161B1 (en) 2010-12-17 2010-12-17 Method and device for finding nearest neighbor
DKPA201070560 2010-12-17
US201161429268P 2011-01-03 2011-01-03
US61/429,268 2011-01-03
PCT/DK2011/050487 WO2012079588A1 (en) 2010-12-17 2011-12-15 Method and device for finding nearest neighbor

Publications (2)

Publication Number Publication Date
JP2013546091A JP2013546091A (ja) 2013-12-26
JP5944406B2 true JP5944406B2 (ja) 2016-07-05

Family

ID=45804277

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013543532A Active JP5944406B2 (ja) 2010-12-17 2011-12-15 最近傍を見つけ出すための方法および装置

Country Status (7)

Country Link
US (1) US9177227B2 (ja)
EP (2) EP3382574A1 (ja)
JP (1) JP5944406B2 (ja)
CN (1) CN103403704B (ja)
CA (1) CA2819925C (ja)
DK (1) DK177161B1 (ja)
WO (1) WO2012079588A1 (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015099898A1 (en) 2013-12-26 2015-07-02 Intel Corporation Efficient method and hardware implementation for nearest neighbor search
US10032244B2 (en) * 2014-08-21 2018-07-24 Intel Corporation Method and apparatus for implementing a nearest neighbor search on a graphics processing unit (GPU)
US9830532B1 (en) * 2014-08-22 2017-11-28 Matrox Electronic Systems Ltd. Object detection in images using distance maps
US9953065B2 (en) 2015-02-13 2018-04-24 International Business Machines Corporation Method for processing a database query
US9754182B2 (en) * 2015-09-02 2017-09-05 Apple Inc. Detecting keypoints in image data
US10089353B2 (en) 2015-10-29 2018-10-02 International Business Machines Corporation Approximate string matching optimization for a database
US10360240B2 (en) 2016-08-08 2019-07-23 International Business Machines Corporation Providing multidimensional attribute value information
US10311057B2 (en) 2016-08-08 2019-06-04 International Business Machines Corporation Attribute value information for a data extent
US10846562B2 (en) * 2018-01-12 2020-11-24 Arizona Board Of Regents On Behalf Of Arizona State University Systems and methods for image matching
US10331753B1 (en) * 2018-04-04 2019-06-25 The Florida International University Board Of Trustees Efficient progressive continuous k-nearest neighbor query algorithm for moving objects with a tree-like index
US11989233B2 (en) * 2019-11-01 2024-05-21 Baidu Usa Llc Transformation for fast inner product search on graph
US11771367B1 (en) * 2019-11-07 2023-10-03 Amazon Technologies, Inc. Sleep scores
US11914669B2 (en) 2019-11-25 2024-02-27 Baidu Usa Llc Approximate nearest neighbor search for single instruction, multiple thread (SIMT) or single instruction, multiple data (SIMD) type processors
US11526956B2 (en) * 2020-02-14 2022-12-13 Accenture Global Solutions Limited Skill acquisition platform

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3573755B2 (ja) 1996-01-15 2004-10-06 シーメンス アクチエンゲゼルシヤフト 画像処理プロセッサ
US5963675A (en) 1996-04-17 1999-10-05 Sarnoff Corporation Pipelined pyramid processor for image processing systems
GB9903697D0 (en) * 1999-02-19 1999-04-14 Pattern Computing Limited A computer-based method for matching patterns
US6711293B1 (en) 1999-03-08 2004-03-23 The University Of British Columbia Method and apparatus for identifying scale invariant features in an image and use of same for locating an object in an image
JP2004046612A (ja) * 2002-07-12 2004-02-12 Techno Network Shikoku Co Ltd データマッチング方法、データマッチング装置、データマッチングプログラムおよびコンピュータで読み取り可能な記録媒体
AU2003286332A1 (en) 2002-12-18 2004-07-09 Koninklijke Philips Electronics N.V. Multi-resolution processing of image strips
JP2004326636A (ja) * 2003-04-28 2004-11-18 Hitachi Ltd 近傍事例探索方法及びその実施装置
WO2006083277A2 (en) 2004-05-25 2006-08-10 Sarnoff Corporation Low latency pyramid processor for image processing systems
JP4556120B2 (ja) * 2005-01-07 2010-10-06 ソニー株式会社 情報処理装置および方法、並びにプログラム
US7477794B2 (en) 2005-06-30 2009-01-13 Microsoft Corporation Multi-level image stack of filtered images
JP5155025B2 (ja) * 2008-06-04 2013-02-27 株式会社日立製作所 類似データ検索システム
US8233716B2 (en) 2008-06-27 2012-07-31 Palo Alto Research Center Incorporated System and method for finding stable keypoints in a picture image using localized scale space properties
US8150169B2 (en) 2008-09-16 2012-04-03 Viewdle Inc. System and method for object clustering and identification in video
US8441489B2 (en) 2008-12-31 2013-05-14 Intel Corporation System and method for SIFT implementation and optimization
US8478052B1 (en) * 2009-07-17 2013-07-02 Google Inc. Image classification

Also Published As

Publication number Publication date
US9177227B2 (en) 2015-11-03
CN103403704B (zh) 2016-12-28
US20130251269A1 (en) 2013-09-26
DK177161B1 (en) 2012-03-12
CN103403704A (zh) 2013-11-20
JP2013546091A (ja) 2013-12-26
CA2819925A1 (en) 2012-06-21
EP2652642A1 (en) 2013-10-23
EP3382574A1 (en) 2018-10-03
WO2012079588A1 (en) 2012-06-21
CA2819925C (en) 2018-04-17

Similar Documents

Publication Publication Date Title
JP5944406B2 (ja) 最近傍を見つけ出すための方法および装置
JP4556120B2 (ja) 情報処理装置および方法、並びにプログラム
CN113420640B (zh) 红树林高光谱图像分类方法、装置、电子设备及存储介质
Murty et al. Nearest neighbour based classifiers
Li et al. Hashing with dual complementary projection learning for fast image retrieval
US11995121B2 (en) Automated image retrieval with image graph
CN110942473A (zh) 一种基于特征点网格化匹配的运动目标跟踪检测方法
CN113298146A (zh) 一种基于特征检测的图像匹配方法、装置、设备及介质
CN111125408A (zh) 基于特征提取的搜索方法、装置、计算机设备和存储介质
Takacs et al. Descriptor generation and optimization for a specific outdoor environment
CN110083731B (zh) 图像检索方法、装置、计算机设备及存储介质
JP2017129990A (ja) 画像認識装置、画像認識方法、及び画像認識プログラム
Retsinas et al. Nonlinear manifold embedding on keyword spotting using t-SNE
Nickfarjam et al. Binary image matching using scale invariant feature and hough transforms
US9189693B2 (en) Information processing apparatus and information processing method
Yang et al. Isometric hashing for image retrieval
Aldana-Murillo et al. Evaluation of local descriptors for vision-based localization of humanoid robots
CN111401252A (zh) 一种基于视觉的图书盘点系统的书脊匹配方法和设备
CN107886100B (zh) 一种基于阶阵列的brief特征描述子
JP4556121B2 (ja) 情報処理装置および方法、並びにプログラム
Chen et al. Trademark image retrieval system based on SIFT algorithm
Nayef et al. Efficient symbol retrieval by building a symbol index from a collection of line drawings
CN115841579A (zh) 图像识别方法、电子设备以及存储介质
Wada et al. Fast Keypoint Reduction for Image Retrieval by Accelerated Diverse Density Computation
CN114298153A (zh) 一种数据处理方法、装置及设备

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20141127

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20151030

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151104

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20160203

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160214

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20160331

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160503

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160524

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160525

R150 Certificate of patent or registration of utility model

Ref document number: 5944406

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: R3D02

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250