JP2011519090A - 画像識別のためのスケールにロバストな特徴に基づく識別子 - Google Patents

画像識別のためのスケールにロバストな特徴に基づく識別子 Download PDF

Info

Publication number
JP2011519090A
JP2011519090A JP2011505582A JP2011505582A JP2011519090A JP 2011519090 A JP2011519090 A JP 2011519090A JP 2011505582 A JP2011505582 A JP 2011505582A JP 2011505582 A JP2011505582 A JP 2011505582A JP 2011519090 A JP2011519090 A JP 2011519090A
Authority
JP
Japan
Prior art keywords
image
feature points
scale
representation
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011505582A
Other languages
English (en)
Other versions
JP5427883B2 (ja
JP2011519090A5 (ja
Inventor
ボバー、ミロスロー
ブラスネット、ポール
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric R&D Centre Europe BV Netherlands
Original Assignee
Mitsubishi Electric R&D Centre Europe BV Netherlands
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric R&D Centre Europe BV Netherlands filed Critical Mitsubishi Electric R&D Centre Europe BV Netherlands
Publication of JP2011519090A publication Critical patent/JP2011519090A/ja
Publication of JP2011519090A5 publication Critical patent/JP2011519090A5/ja
Application granted granted Critical
Publication of JP5427883B2 publication Critical patent/JP5427883B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/48Extraction of image or video features by mapping characteristic values of the pattern into a parameter space, e.g. Hough transformation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

画像識別子を導出する方法は、画像のスケール空間表現を導出することと、そのスケール空間表現を処理して極大値又は極小値である値を有する複数の特徴点を検出することとを含む。表現は、検出された複数の特徴点のうちの1つ又は複数に関連付けられるスケール依存の画像領域について導出される。一つの実施形態では、画像領域のサイズは、対応する特徴点に関連付けられるスケールに依存する。画像識別子は、スケール依存の画像領域について導出された表現を使用して導出される。この画像識別子を、画像を比較する方法において使用することができる。

Description

本発明は、ロバストな画像識別の問題に関し、以前に出願された同時継続特許出願である、欧州特許出願第06255239.3号、英国特許出願第0700468.2号、英国特許出願第0712388.8号、英国特許出願第0719833.6号、及び英国特許出願第0800364.2号において開示されている方法のような従来技術の方法に勝る利点を提供する新たな方法を開示する。
[関連技術]
マルチメディアコンテンツのロバストな識別の目的は、そのマルチメディアコンテンツに対して行われる可能性のある典型的な変更の下で保持される情報を抽出することである。この変更は、悪意のない目的或いは悪意のある目的であり得る。画像の場合、ロバストな識別子は、特に、圧縮、グレースケール変換、回転、ノイズ、色変更、クロップ、及び平行移動を受けたときに実質的に保持されなくてはならない。さらに、独立したコンテンツが十分に異なる識別子を有するように、識別子は弁別力(discrimination power)を提供しなくてはならない。
欧州特許出願第06255239.3号、並びに、英国特許出願第0700468.2号、英国特許出願第0712388.8号、及び英国特許出願第0719833.6号は、それらが全て大域情報に基づいて識別子を抽出するという点で類似している。大域情報とは、全体画像に関する情報である。これらに係る識別子のファミリーは、非常に低い誤検出率(false alarm rate)で100%に近いロバスト性を提供し(これは、それらが高い弁別能力を提供することを意味する)、通常の誤検出率は0.1百万分率未満である。
多数の画像が様々な画像データベース内に存在し、ウェブページ、プレゼンテーション、及び文書内に埋め込まれる。主要なウェブサイトの調査によると、Flickrは20億を超える画像を有し、Photobucketは40億を超える画像を有し、Facebookは17億の画像を有することがわかっている。消費者は多くの場合に自身の個人的なコレクション内に数千枚の写真を有し、専門家ははるかに多くを有する。サイズの大きなデータセットを仮定して実用性のあるものとするためには、識別子は非常に高速な探索も可能にしなくてはならない。欧州特許出願第06255239.3号、英国特許出願第0700468.2号、英国特許出願第0712388.8号、及び英国特許出願第0719833.6号に開示されている技法は、1秒あたり1000万画像を超える検索速度を可能にすることができる。
欧州特許出願第06255239.3号、英国特許出願第0700468.2号、英国特許出願第0712388.8号、及び英国特許出願第0719833.6号に開示されている従来技術の識別子は、多くの一般的な画像変更に対する高レベルのロバスト性にもかかわらず、画像コンテンツの大部分が失われるか又は置き換えられる平行移動及びクロップのような或る種の画像変更に対しては、要求されるレベルのロバスト性を提供することができない。英国特許出願第0800364.2号において開示されている技法は、この種の画像変更の下での大幅に改善されたロバスト性を提供する。これは、i)特徴検出及び特徴選択、ii)特徴領域及び識別子の抽出、iii)照合、を含むプロセスである。本発明は、従来技術の画像識別子のロバスト性に対する改善を提案する。
従来技術における特徴点手法は、コンピュータビジョン及びオブジェクト認識の分野において開発されてきた[文末の参考文献2、3]。これらの手法は、非常に多数の点に依存する:
「この手法の重要な側面は、画像を密に覆う多数の特徴を生成することである..。サイズ500×500ピクセルの典型的な画像によって約2000個の特徴が生じる。」[文末の参考文献2]
多数の特徴を抽出する結果、探索及び照合の計算が非常に低速になり、単純なケースでは、問い合わせ画像からの全ての特徴がデータベース内の全ての画像からの全ての特徴と比較されなくてはならない。探索時間を低減するために、従来技術の方法は様々な形態のデータベース構造を使用する。しかしながら、これらの構造は、さらなるデータベース初期化時間、さらなるストレージ及びメモリ要件を費やして成り立ち、多くの場合に、改善された探索速度をより低い検出率と引き換えにする何らかの概算(approximation)が行われる。
本発明は、画像及びその画像の変更されたバージョンを検出することに関する。これは、従来技術の多くの適用分野とは異なる。特に、画像重複検出は、たとえばクロップされた画像、圧縮された画像等の画像の変更されたバージョンを見つけることに関する。対照的に、ほとんどの従来技術の方法は、画像内の特定のオブジェクト或いはオブジェクトのクラス、たとえばFord Focus車或いは自動車を検出することに関する。これらの問題を区別することは些細なこと或いは僅かなことに見える場合があるが、これは重要である。たとえば、ロンドンのセント・ポール大聖堂の2つの画像を考えると、これらの画像は2つの異なる視点から撮られている。ここで、オブジェクト認識タスクの下では、これらの画像間の類似性が検出されるはずであるが、画像重複検出の下では類似性は検出されないはずである。これを考慮に入れると、2つの異なる問題を扱うために異なる技法が必要である。
英国特許出願第0800364.2号において開示されている方法は、トレース変換に基づくバイナリ特徴点記述子を開発する。バイナリ記述子を使用する利点は、ハミング距離が特徴照合に使用されることにあり、これによって探索プロセスが非常に高速になる。さらに、選択プロセスは、特徴の数を小さなセットに制限し、これはクロップ及び平行移動のような困難な画像変更に対して非常にロバストであることがわかっている。ロバスト性は良好であるが、さらなる改善を提供することが望ましい。
第1の態様によると、本発明は、画像に対応する信号を処理することによって、その画像の表現、すなわち画像記述子を導出する方法を提供する。この方法は、画像のスケール空間表現(scale-space representation)を導出することを含む。スケール空間表現は、振幅の極値(すなわち、極大値又は極小値)を有するスケール空間表現内の複数の特徴点を検出するように処理される。この方法は、検出された複数の特徴点のうちの1つ又は複数について、対応する特徴点に関連付けられるスケール依存の画像領域を確定する。そして、確定されたスケール依存の各画像領域についての表現が導出される。
このため、最も高い特徴強度を有する画像の特徴に基づいて、画像記述子を導出することができる。
一つの実施形態では、複数の特徴点は、画像のスケール空間表現に対して二次画像勾配に基づく第1の演算子を適用し、その結果としてスケール空間表現内において最も高い値を有する特徴点を識別することによって検出される。次に、第2の演算子を検出された複数の特徴点に対して適用することができ、第2の演算子は一次画像勾配に基づき、その結果として閾値未満の値を有する特徴点が取り除かれる。第1の演算子及び第2の演算子を適用することによって検出される複数の特徴点から所定の数の特徴点を選択することができる。
他の実施形態では、複数の特徴点は、所望の用途に従って、異なる順序で演算子を使用するか又は異なる技法を使用して検出されてもよい。
好ましくは、選択された1つ又は複数の検出された特徴点について、特徴点の空間位置に関連付けられる画像の空間領域を確定することによって、スケール依存の画像領域が確定される。ここで、空間領域のサイズは特徴点のスケールに基づく。
確定されたスケール依存の各画像領域についての表現は、トレース変換又はその均等物を使用すること等によって、画像領域にわたる線投影に基づいて導出することができる。
1つの例では、1つ又は複数の確定されたスケール依存の各画像領域について、画像領域の少なくとも一部分の関数が導出される。ここで、画像領域の平行移動、拡大縮小、又は回転されたバージョンの関数は、画像領域の関数の平行移動又は拡大縮小されたバージョンである。画像領域の少なくとも一部分の関数を導出することは、画像領域にわたる線に沿って第1の汎関数を適用することを含んでもよい。この方法は、第2の汎関数を導出された関数に適用して画像領域の少なくとも一部分の中間表現を得ることをさらに含んでもよい。
確定されたスケール依存の各画像領域についての表現は、バイナリ画像記述子を含んでもよい。
画像の表現は、スケール依存の画像領域の導出された表現のうちの2つ以上から導出されてもよい。
第2の態様によれば、本発明は、本発明の第1の態様による方法によって導出される画像の記述子を使用して画像を比較する方法を提供する。この方法は、第1の画像の記述子に関連付けられる1つ又は複数のスケール依存の画像領域の表現を、第2の画像の記述子に関連付けられる1つ又は複数のスケール依存の画像領域の表現と比較することを含む。
本発明のさらなる態様は、本発明の第1の態様による方法によって導出される画像の表現の送信又は受信を含む使用と、本発明の第1の態様若しくは第2の態様又は双方による方法を実行するための装置と、コンピュータによって実行されると本発明の第1の態様若しくは第2の態様又は双方による方法を実行する命令を備えるコンピュータ可読ストレージ媒体とを含む。
本発明の他の特徴及び利点は、以下の説明及び添付の特許請求の範囲から明らかとなろう。
本発明は、要求通りにロバスト性を改善する2つの主な態様、すなわち、i)領域スケールが特徴の選択及び抽出のプロセスに組み込まれること、及び、ii)計算コストを最小にしながらロバスト性を維持する最大4つの段階の照合プロセスが展開されること、を含む。
特徴検出プロセスを使用して、空間及びスケールにおける位置を有する複数の特徴を選択する。特徴選択は、タスクに適しており且つトレース変換に基づく特徴記述子と共に良好に機能することが実験的に示された特徴を選択するための新規のプロセスを使用する。
画像照合の場合、検出性能と、独立性と、計算時間と、メモリ要件との間でのトレードオフが必要とされる。開示される実施の形態では、4ステップの照合プロセスが導入される。このプロセスは、計算時間及びメモリ要件の双方を最小にしながら、検出率及び独立性を最大にすることを目的とする。第1のステージでは、高い確率を有する仮説(すなわち候補)を迅速に確定し、確率の低い一致を除去する。第2のステージでは、これらの仮説を検定し、多数の誤った仮説を取り除く。第3のステージは、さらなる誤った仮説を除去する。各ステージは、前のステージに勝る増大されたレベルの複雑度を伴うため、プロセスの可能な限り早いうちに誤った仮説を除去することによって複雑度が管理され、最小にされる。
上述した態様と同様に、本発明の他の態様は、画像の選択及び抽出された特徴に基づいて画像の表現を導出すること、並びに、本発明の1つ又は複数の態様に従ってプロセスを実行するための装置及びコンピュータプログラムを含む。
ここで、添付の図面を参照して本発明の実施形態を説明する。
図1aは、画像を示す図である。図1bは、図1aの画像を縮小したバージョンを示す図である。図1cは、図1aの画像を回転させたバージョンを示す図である。図1dは、図1aの画像をぼかしたバージョンを示す図である。図1eは、図1aの画像を(左右に)反転させたバージョンを示す図である。図1fは、図1aの画像を高圧縮したバージョンを示す図である。図1gは、図1aの画像をクロップしたバージョンを示す図である。 従来技術による画像とそのビット列表現を示す図である。 特徴検出器によって検出された画像の特徴点のセットの例を示す図である。 特徴の最終セットが選択された画像を示す図であり、特徴のスケールは円のサイズによって示され、特徴の方向は線によって示される。 原画像(a)と、(a)の回転させたバージョンである(b)とに基づくハミング距離を使用して一致することがわかった関心点を示す図であり、関心点の間の線の長さを使用して幾何学的制約を適用する。 本発明の一つの実施形態による装置のブロック図である。 本発明の一つの実施形態による特徴識別子(a)及び画像識別子(b)の構造を示す図である。
画像の表現(representation of an image)、具体的には画像識別子(image identifier)を導出し、そのような表現/識別子を、例えば1つ又は複数の画像の識別、照合、或いは検証のために使用する様々な実施形態を以下に説明する。本発明は、画像を識別するために特に有用であるが、画像の識別に限定されるものではない。説明する実施形態において、「画像識別子」(「識別子」、「記述子」、「画像記述子」、「シグネチャ」、又は「画像シグネチャ」とも称される)は画像の表現の一例であり、この用語は単に画像の表現又は記述子を表すのに使用される。
当業者であれば、本発明の一実施形態による画像識別装置及び画像識別方法の具体的設計の詳細、並びに、画像識別において使用するための画像識別子の導出は、ロバストであるべき画像変更の種類、識別子のサイズ、抽出及び照合の複雑度、目標誤検出率等に関連する要件によって確定されることを理解するであろう。
以下の例では、画像に対する以下の変更に対してロバストな識別子をもたらす一般的設計を示す(これは網羅的なリストではない):
・減色
・ぼかし
・輝度値変更
・反転(左右及び上下)
・グレースケール変換
・ヒストグラム等化
・JPEG圧縮
・ノイズ
・回転
・クロップ
・スケーリング
・平行移動
・スキュー
・視点変更
提案される設計は通常、広範な画像に対して1ppm(百万分率)未満の低い誤検出率を達成することができ、検出率は通常、98.0%を超えることができることがわかっている。
図1は、画像の一例とその画像の変更バージョンを示す。より具体的には、図1aは原画像であり、図1bは図1aの画像を縮小した(スケーリングした)バージョンであり、図1cは図1aの画像を回転させたバージョンであり、図1dは図1aの画像をぼかしたバージョンであり、図1eは図1aの画像を反転させたバージョンであり、図1fは図1aの画像を圧縮したバージョンであり、図1gは図1aの画像をクロップしたバージョンである。
本発明の実施形態は、画像の表現を導出する。より具体的には、画像に対応する信号及び/又は画像データを処理することによって画像識別子を導出する。
特徴点の検出及び選択
欧州特許出願第06255239.3号、英国特許出願第0700468.2号、英国特許出願第0712388.8号、英国特許出願第0719833.6号、及び英国特許出願第0800364.2号と同じく、画像識別子の抽出の初期段階において、画像はサイズ変更及びフィルタリングによって任意選択で前処理される。サイズ変更ステップは、画像を処理前に正規化するために使用される。フィルタリングステップは、エイリアシング等の効果を除去するためのフィルタリングを含むことができ、また領域選択及びテーパリングも含むことができる。一つの実施形態では、画像は256×N又はN×256の解像度にサイズ変更される。ここでN≧256であり、画像の縦横比を維持する。別の実施形態では、画像は256×256の正方形にサイズ変更される。次に、画像は3×3のガウスカーネルを使用してローパスフィルタリングされる。前処理ステップは任意選択であり、上記のものの任意の組み合わせを含むことができる。
次の段階において、画像において特徴点が検出される。一つの実施形態では、特徴検出器を使用して、画像勾配の測定に基づいて画像内の潜在的な特徴とそれらの強度を検出する。一次の画像勾配に基づく1つの適切な画像特徴検出器は、英国特許出願第0800364.2号において使用されるようなハリスである。
ここで、Ix(x,y)は位置(x,y)における画像強度I(x,y)の一次導関数であり、αは特徴検出を制御するパラメータである。
代替的な二次検出器は、ラプラシアン(二次の偏導関数ヘッセ行列のトレースに対応する)である。
ここで、Ixx(x,y)は位置(xy)における画像の二次導関数である。
英国特許出願第0800364.2号では、特徴は単一のスケールおいてのみ選択され、これは原画像の正規化されたバージョンである。さらに、特徴の周囲のエリア(特徴シグネチャが抽出される画像領域を形成する)が固定されている。しかしながら、クロップによる変更の下では、画像の一部分が失われる。画像が(上述した前処理のように又はユーザによって)幾何学的に正規化されるとき、或る領域は原画像内の同じ領域よりも大きくなる。大量のクロップの下では、これら2つの領域のトレース変換に基づく記述子が受容不可能なほどに異なることになる。すなわち、距離が類似性を示す閾値を超える場合がある。
この問題に対処するために、本発明の第1の態様に従って、「スケール推定」を使用することができる。スケール推定は、各特徴の分析のための適切なスケールを選択しようと試みる。各特徴は、その特徴固有のスケールに関連付けられることに留意されたい。
まず、画像のスケール空間表現(scale-space representation)が導出される。実施形態では、画像のスケール空間表現は2つの方法のうちの1つで構築することができる(ただし、他の技法も可能であり検討される)。第1の方法では、原画像を連続して平滑化及びサンプリングする。第2の方法では、フィルタサイズを増加させながら反復的に画像を平滑化する。次に、位置スケール空間(location-scale space)における極大値を見つけることによって特徴が検出される。平滑化フィルタのための最適な選択は、ガウシアン(フィルタ)であることがわかっており、ガウシアン(フィルタ)によって平滑化された画像は以下によって表される。
ここで、*は畳み込み演算子であり、G(σD)はガウシアンフィルタであり、σDはスケールを確定する平滑化フィルタの標準偏差である。
一つの実施形態では、2つの検出器を使用してスケール空間表現における特徴の位置及びスケールの良好な検出を提供する。一方の検出器は一次の勾配を使用し、他方は二次の勾配を使用する。
第1番目では、ガウシアン演算子の修正型スケール補正ラプラシアン(modified scale corrected Laplacian)
を使用して、複数の特徴の位置及びスケール(すなわちスケール空間表現における特徴点)を検出する。ここで、G(σI)は導関数を平均化する積分に使用されるガウシアンフィルタであり、σIは積分スケールであり、γはスケール正規化パラメータである。スケールに適合したラプラシアンに積分平滑化を導入することは、特徴検出器の性能を改善するのに役立つ。
第2の検出器は、スケールに適合したハリス演算子(scale-adapted Harris operator)である。
ここで、
である。
したがって、ラプラシアンの式(4)がスケール空間において適用され、最も高い値を有する位置及びスケールが潜在的な特徴として選択される。そして、重要でない(すなわち閾値未満の)ハリス検出器応答を有する特徴は潜在的な特徴のセットから取り除かれる。下記で説明されるような選択手順が適用され、2つの検出器を使用した結果として生じる潜在的な特徴のセットから、特徴の代表的なセットが選択される。一つの実施形態では、所定の数に達するまで特徴が選択される。
検出された複数の特徴の中の許容可能な特徴から、ラプラシアン検出器の式(4)に従って最も強い特徴が最初に選択される。特徴は、その特徴が、特徴スケールから計算される半径rよりも画像のエッジに近い場合には拒否される。式(7)を参照されたい。後続の特徴は、その特徴が以前に選択された任意の特徴の周囲の除外ゾーン内にある場合には選択されないという制約を用いて、強度順に選択される。一つの実施形態では、半径10ピクセルの円形領域が除外ゾーンとして使用される。選択プロセスは、所定の数の代表的な特徴(たとえば32個の特徴)が選択されるか、これ以上特徴が残っていない場合に終了する。
図2の画像における図3に示すように検出された特徴から選択された特徴のセットが図4に示されている。スケールは円のサイズによって表され、特徴の方向は線によって表されている。検出される特徴とそれらを取り囲む画像領域は、全体としての画像を代表するもの、すなわち全体としての画像にとって重要なものであることが理解されるであろう。
特徴点(又は関心点)の位置が選択されると、それらの位置は、好ましくは、例えばhttp://opencvlibrary.sourceforge.net/CvReference、文末の参考文献[1])においてインターネット上で入手することができるOpenCV(FindCornerSubPix)03/01/2008.に記載されているような方法を使用して、選択されたスケールでサブピクセル解像度に精緻化される。
特徴領域及び識別子の抽出
参照により本明細書に援用される英国特許出願第0719833.6号では、バイナリ画像識別子又は画像表現を抽出するための方法が開示されている。本発明の一つの実施形態では、英国特許出願第0719833.6号の方法を適用して、特徴点の周囲の領域からバイナリ「特徴識別子」を抽出する。それゆえ、各特徴識別子は、検出された特徴に関連付けられる画像領域のバイナリ表現である。画像領域は所定のサイズを有することができる。たとえば、一つの実施形態では、或る特徴点を中心とする半径32ピクセル円形画像領域が選択され、その画像領域に関してバイナリシグネチャが計算される。円形領域は、例えばキュービック補間法を使用して、好ましくはサブピクセルレベルの精度まで抽出される。
好ましくは、固定された特徴領域半径を使用する代わりに、特徴が検出されるスケールを用いて領域サイズを適宜適合させる。スケールsにおいて選択される領域の半径は以下によって与えられる。
ここで、r0は基礎半径であり、σ0は初期スケールであり、κは設計パラメータであり定数である。積分スケールの良好な選択が以下であることも注目に値する。
好ましい実施形態では、κ=0.6、σ0=1.14、r0=20、s∈(0,1,...,S)であり、S=14である。特徴位置(x,y)と半径rによって確定される領域は、キュービック補間法を使用して、サブピクセルの精度まで抽出される。次に、領域は、好ましい実施形態では32である正規化された半径
によって与えられる所定のサイズに正規化される。次に、抽出された領域を処理して、英国特許出願第0719833.6号による方法を使用することによって対応する画像識別子を導出する。この方法の概要が下記に提供される。
d、θによってパラメータ化された全ての可能な線を画像に射影し、これらの線にわたって第1の汎関数Tを適用することによって、画像領域のトレース変換T(d,θ)を行う。英国特許出願第0700468.2号において開示されている方法に従って、トレース変換の結果を分解して、その次元d、θのうちのいずれか又は双方における解像度を低減することができる。欧州特許出願第06255239.3号及び英国特許出願第0700468.2号の方法におけるように、トレース変換の列に第2の汎関数Pを適用して、実数値ベクトル(すなわち一次元関数)を得ることができる。この第2の汎関数Pは、ダイアメトリック汎関数(diametrical functional)として知られ、結果として得られるベクトルはサーカス関数(circus function)として知られている。
第3の汎関数であるサーカス汎関数(circus functional)をサーカス関数に適用して、単一の数を得ることもができるが、このステップは好ましい実施形態では使用されない。
代替的に、英国特許出願第0719833.6号の方法によれば、上記で論考したサーカス関数の代替として、いわゆる「帯状サーカス(band-circus)」関数を得ることができる。「帯状サーカス」関数は、トレース変換の一部分の値のみを選択して処理することによって、トレース変換を画像の線のサブセットに制限する。
第1の汎関数、第2の汎関数、及び/又は第3の汎関数(トレース汎関数、ダイアメトリック汎関数、及びサーカス汎関数)の適切な選択によって、結果の特性を制御することができる。
画像領域のためバイナリ識別子が、周波数表現を介してサーカス関数(又は帯域サーカス関数)から抽出される。例えば、フーリエ変換の係数の大きさに対して、関数c(ω)を定義することができる。この関数の1つの例示は、近傍の係数の差分をとることである。
結果として得られるベクトルに以下のような閾値を適用することによって、バイナリ列を抽出することができる。
Sの適切な選択には、S=0及びS=mean(c)が含まれる。次に、これらのバイナリ列の値B={b0.....bn}から画像領域のバイナリ表現が構成される。
本発明の一つの実施形態では、(英国特許出願第0719833.6号においては画像全体であるのに対して)局所画像領域が使用されるため、そこに記載されているシグネチャ抽出技法に対して変更を行う必要がある。特に、欧州特許出願第06255239.3号において開示されている方法に従って、汎関数
及び
を使用した、フルトレース変換の(2つの)サーカス関数から2つの識別子が抽出される。
英国特許出願第0700468.2号に開示されている方法に従って、トレース変換の距離(d)パラメータを、8分の1、16分の1、及び32分の1に分解(又はサブサンプリング)して式(10)及び(11)の双方を適用することによって得られる(6つの)サーカス関数から、さらなる6つの「多重解像度」識別子を抽出することができる。
英国特許出願第0712388.8号に開示されている方法に従って、トレース変換における(3つの)帯からさらなる3つの関数が選択され、英国特許出願第0719833.6号に開示されている方法に従って、(2つの)トレース環形関数(trace-annulus function)から2つの関数が抽出され、トレース円形関数(trace-circular function)から1つの関数が抽出される。
これらの14個の成分識別子のそれぞれは8ビットであり、各特徴識別子について計112ビットとなる。
さらに、各特徴の近傍にわたって積分することによって、スケールに適合した特徴方向が計算される。
方向θは、好ましくは16個のレベルに量子化される。これは4ビットのデータによって表すことができる。
画像識別子又は画像記述子は、特徴シグネチャの全て又は幾つかから形成される。特徴点の完全なセットのための画像識別子は、多数の形で表すことができる。好ましい実施形態では、画像記述子は多数の情報フィールドを含むビットストリームであり、その第1のフィールドは特徴の数である。そして、ビットストリームにおいて各特徴は、正規化された特徴点座標(x及びy)、量子化された特徴方向、それに続くバイナリ特徴シグネチャとして表される。任意選択で、特徴数を格納するのではなく、使用されていないフィールドを表すためのフラグをセットしてパディングを使用することもできる。バイナリ特徴シグネチャは、112ビット全てを含むか、又は任意選択で112ビットのサブセットを選択、導出、若しくは格納することもできる。特徴識別子の構造が図7(a)に示され、画像シグネチャの構造が図7(b)に示される。
特徴識別子を使用する画像照合
画像照合は、画像識別子の一部分を形成する特徴シグネチャを比較又は照合することによって行うことができる。上述したように、効率性のために、特徴シグネチャを比較することによる画像ペア間の全照合手順は、4つのステージから構成される。ステージ1及び3において仮説(hypothesis)が形成される。ステージ2及び4において一連の幾何学的検定(geometric test)が実施される。仮説が次のステージへと進むためには、これらの検定に通らなくてはならない。ステージごとに計算の複雑度を増していくため、各ステージは後続の処理に受容される仮説の数を最小にすることを目的とする。
第1のステップは、1つの画像からのN個の特徴シグネチャのうちの最初のM個を、第2の画像からのN個の特徴シグネチャのうちの最初のM個と比較することによって、潜在的に一致する特徴のための仮説を形成することを含む。M個から成るサブセットを使用することの利点は、ロバスト性を維持しながら高速化することである。好ましい実施形態では、Nは32でありMは24である。
2つのシグネチャB1とB2の間で照合を行うために、ハミング距離がとられる。
ここで、
は排他的OR(XOR)演算子である。
好ましい実施形態では、一致する特徴の3つのペアの全ての組み合わせについて仮説のセット(潜在的に一致する特徴の候補ペア)が生成される。特徴点の3つのペアから成るセット(a1,a2,a3,b1,b2,b3)から仮説が構成される。特徴の3つのペアから成るセットは、各特徴ペアの距離が一定の閾値TA未満であり、且つ、累積距離が何らかの第2の一定の閾値TB未満である場合に、一致であると宣言される。好ましい仮説では、TA=0.06、TB=0.2である。仮説のセットは、それらの累積距離の順に、最も小さい距離(すなわち一致である確率が最も高い)を先頭にして並べられる。複雑度を最小にするために、仮説の数を最も小さい距離に対応するK個の仮説に限定することもできる。好ましい実施形態では、Kは18である。
第2のステップは、ステージ1で生成されたそれぞれに幾何学的制約を適用する。誤った一致を低減するために、2つの幾何学的制約、すなわち、i)特徴方向、ii)線長比が適用される。
上述したように、各特徴には方向が関連付けられ、特徴anにおける方向はθanと表される。同一の画像からの特徴に対応する角の間の差分が取られ、角度距離計量値(angle distance measure)が回転の影響を受けないようにする。距離計量値は左右及び上下の反転変更の問題に対処しなくてはならず、ここでは角度距離のこれら2つの計量値を使用して行われる。
2つの角度距離計量値Ω1、Λ1に閾値を適用して、それらが許容可能な間隔にあるか否かを検定する。角度距離における許容可能な値は、角度量子化Qのレベル数に依存し、以下によって与えられる。
ここで、qは角度の変化に対する感度を変動させるのに使用することができる定数である。好ましい実施形態では、qは1にセットされ、Qは16である。
図5に示すように、各仮説において選択された特徴の位置を用いることによって、特徴間の線の長さの比が制約として使用される。|a12|によって、特徴a1の位置と特徴a2の位置とをつなぐ線の長さを表す。3つの特徴点|a12|、|a23|、及び|a31|が線長比を求めるのに使用される。3つの線長比が以下のように計算される。
2つの画像AとBの線長比の間の類似度の計量値(G1,G2,G3)は、以下のように定義される。
有利には、上記の幾何学的制約が、回転、平行移動、及び拡大縮小のような幾何学的変換を受けた画像を照合するのに適するように、画像内に定義された点の間の線長比は、そのような幾何学的変換に対して不変である。しかしながら、設計要件に合う他の適切な幾何学的制約を使用してもよい。
一つの実施形態では、2つの閾値が距離計量値に適用される。一方は個々の計量値の大きさを制約するためのものであり、他方は距離の合計を制約するためのものである。
上述した検定のうちの1つ又は複数に通らない仮説は、有効な仮説のセットから取り除かれる。全ての仮説を試験した後にセットが空になった場合、画像は非一致であると宣言される。仮説が全ての検定に通った場合、その仮説は次のステージに進み、4つの特徴仮説が生成される。
照合の第3のステージでは、第1の画像からのN個の全ての特徴を、第2の画像からのN個の全ての特徴と比較する。ここでは、3つの特徴ペアに関する仮説が既に存在するため、4つのペアについての仮説のセットを見つけることが目的であり、その仮説は現在の3つの特徴ペアの仮説に対してさらに1つの特徴を付け加える。ステージ1と同様に、シグネチャ距離に基づいて潜在的な特徴が見つけられる。仮説のセットは4番目の特徴の距離の順に並べられる。
ステージ4において、誤受入率をさらに低減するために、4つの特徴仮説から成るセットに対して幾何学的分析が実行される。第1の幾何学的制約は、3つの特徴についての特徴方向の式(14)及び(15)に基づく。先ほど使用された線の比は相似変換に対して不変である。下記で説明するように面積の比を使用することによって、特徴が4つの際の不変性をより一般的なアフィン変換に緩和することができる。これは、誤った一致を拒否しながら真の一致を受容するより厳密な閾値を設定することを可能にする。
4つの特徴のセット(a1,a2,a3,a4)から、4つの三角形を構築することができる(a123,a234,a341,a412)。これらの三角形の面積は以下から求めることができる。
ここで、s=(|a12|+|a23|+|a31|)/2である。面積比は以下のように計算することができる。
続いて、画像Aの面積比と画像Bの面積比との間の距離を、以下によって求めることができる。
2つの閾値Tc及びTDが特徴セット間の4つの面積比距離のセットに適用される。第1の閾値は、第1の閾値Tcを超える任意の面積比距離を有する仮説を拒絶する。第2の閾値は、距離の合計が閾値TDよりも大きい仮説を拒絶する。好ましい実施形態では、Tc=0.15、TD=0.4である。
本発明の上述した実施形態の画像照合技法は、英国特許出願第0719833.6号において開示されている方法のような他の画像照合技法と組み合わせることができる。記述子は、個々の識別子の全てを含む各画像について生成される。好ましい実施形態では、識別子ビットストリームは、英国特許出願第0719833.6号に基づく2つの識別子、及び本発明による1つの記述子を含む。英国特許出願第0719833.6号に基づく2つの識別子のうち、第1の識別子は画像の縦横比を維持するために画像を前処理することによって生成され、他方はその画像を正方形に処理するときに生成される。
好ましくは、照合は、最初に英国特許出願第0719833.6号のより高速なアルゴリズムを用いて、非常に低い誤検出閾値で実行される。閾値未満の任意の画像ペアは一致であると見なされ、次に、閾値を超えるペア(英国特許出願第0719833.6号では一致であるとみなされない)が本発明に従って処理される。
上記の方法を実行するための、一実施形態による、本発明を実施するための装置が図6に示されている。この実施態様は、画像データベース230内に格納される画像のための識別子のデータベース240を構築することを伴う。2つのデータベース230及び240は、同じデータベースであってもよいし、別個のデータベースであってもよい。本装置は、問い合わせ画像250から抽出される識別子260を探索することよって、識別子データベース140内において一致するものを見つけることを可能にする。場合によっては順序付けされた画像のリストが、ユーザ290又は問い合わせアプリケーションに返される。
当業者であれば、説明した実施形態に対して多くの変形及び変更を行うことができることを理解するであろう。たとえば、説明した実施形態では、画像シグネチャが導出される画像領域を特徴検出に基づいて識別するが、他の技法を使用して画像を代表する或いは画像内で重要な画像領域を識別してもよい。さらに、説明した実施形態では、画像勾配法に基づく特徴検出器を使用するが、多くの他の適切な方法を画像内の関心点又は領域の検出に使用することができる。同様に、最も良好な又は最も強力な検出された特徴点又は関心点を選択するために他の技法も使用可能である。
加えて、説明された実施形態において使用された3つの特徴点のセットに関連付けられる線長比に関連する距離計量値とは異なる、様々な幾何学的制約のうちの1つ又は複数を使用することが可能である。たとえば、任意の数の特徴点を距離計量値とあわせて使用することができる。代替的に、他の幾何学的制約は、特徴点間の角度に基づいてもよい。さらに、幾何学的制約を定義するためにアフィンモデルを使用してもよい。
本発明の精神及び範囲内に入る全ての変形、変更、及び均等物を含むことが意図されている。
代替的な実施態様
上記の説明は仮説を生成するのに総当り探索を使用したが、幾つかの状況では、ハミング距離の近似計算を可能にする構造を使用することが有益である場合がある。これは、或るレベルの検出と引き替えに検索速度の増大を提供するであろう。
提示された特徴照合手法は、[下記の参考文献4]に示されているようなやり方で確率モデルに当てはめるのが容易である。
参考文献
1.Open CV Reference Manual, Chapter 1: Image Processing Gradients, Edge and Corners - "FindCornerSubPix": http://opencvlibrary.sourceforge.net/CvReference2.D.G. Lowe「Distinctive Image Features from Scale Invariant Keypoints」(International Journal of Computer Vision, 60, 2, 2004. pp. 91-110)
3.D.G. Lowe「Method and apparatus for identifying scale invariant features in an image and use of same for locating an object in an image」(2000年3月、米国特許第6,711,293号)
4.C. Schmid「A Structured Probabilistic Model for Recognition」(Proc. Computer Vision and Pattern Recognition, 2, 485-490, Jun. 1999)

Claims (36)

  1. 画像に対応する信号を処理することによって該画像の表現を導出する方法であって、
    前記画像のスケール空間表現を導出することと、
    前記スケール空間表現を処理することによって、振幅の極値を有する複数の特徴点を検出することと、
    前記検出された複数の特徴点のうちの1つ又は複数について、対応する特徴点に関連付けられるスケール依存の画像領域を確定することと、
    前記確定されたスケール依存の各画像領域についての表現を導出することと
    を含む、画像の表現を導出する方法。
  2. 前記複数の特徴点は、前記画像のスケール空間表現に対して二次画像勾配に基づく演算子を適用し、その結果として前記スケール空間表現内において最も高い値を有する特徴点を識別することによって検出される、請求項1に記載の方法。
  3. 前記検出された複数の特徴点から所定の数の特徴点を選択することと、
    前記選択された特徴点のそれぞれに関連付けられるスケール依存の画像領域を確定することと
    をさらに含む、請求項1又は2に記載の方法。
  4. 前記選択することは、前記検出された複数の特徴点から、前記スケール空間表現内において最も低い振幅値又は前記スケール空間表現内において閾値未満の振幅値を有する特徴点を取り除くことを含む、請求項3に記載の方法。
  5. 前記選択することは、前記検出された複数の特徴点から、前記画像内におけるそれらの空間位置に従って特徴点を取り除くことを含む、請求項3又は4に記載の方法。
  6. 前記選択された特徴点の空間位置は前記画像にわたって実質的に分散され、好ましくは、前記選択された特徴点の空間位置のそれぞれは、前記画像内において少なくとも所定の距離だけ他の選択された特徴点から離れている、請求項5に記載の方法。
  7. 前記選択することは、前記検出された複数の特徴点に対して一次画像勾配に基づく演算子を適用し、その結果として閾値未満の値を有する特徴点を取り除くことを含む、請求項3、4、5又は6に記載の方法。
  8. 前記演算子は、スケールに適合したハリス演算子である、請求項7に記載の方法。
  9. 前記スケール空間表現内の特徴点についてスケール依存の画像領域を確定することは、前記特徴点の空間位置に関連付けられる前記画像の空間領域を確定することを含み、該空間領域のサイズは前記特徴点のスケールに基づく、請求項1〜8のいずれか一項に記載の方法。
  10. スケール依存の画像領域を確定する前に、好ましくは三次補間法を使用して、前記1つ又は複数の特徴点の空間位置をサブピクセル解像度まで精緻化することをさらに含む、請求項1〜10のいずれか一項に記載の方法。
  11. 前記確定されたスケール依存の各画像領域についての表現を導出することは、好ましくはトレース変換又は均等物を使用して、前記画像領域にわたる線投影に基づいて表現を導出することを含む、請求項1〜11のいずれか一項に記載の方法。
  12. 前記確定されたスケール依存の各画像領域についての表現を導出することは、
    前記画像領域の少なくとも一部分の関数を導出することと、
    該関数を使用して前記画像領域の少なくとも一部分の中間表現を得ることと
    を含む、請求項1〜12のいずれか一項に記載の方法。
  13. 1つ又は複数の前記確定されたスケール依存の各画像領域について、
    前記画像領域の少なくとも一部分の関数を導出することを含み、ここで、画像領域の平行移動、拡大縮小、又は回転されたバージョンの関数は、該画像領域の関数の平行移動又は拡大縮小されたバージョンである、請求項13に記載の方法。
  14. 前記画像領域の少なくとも一部分の関数を導出することは、
    前記画像領域にわたる線に沿って第1の汎関数を適用することを含み、
    該方法は好ましくは、
    第2の汎関数を前記導出された関数に適用することによって、前記画像領域の前記少なくとも一部分の中間表現を得ることをさらに含む、請求項13又は14に記載の方法。
  15. 前記画像の表現を、前記スケール依存の画像領域の2つ以上の前記導出された表現から導出することをさらに含む、請求項1〜15のいずれか一項に記載の方法。
  16. 前記複数の特徴点のうちの1つ又は複数について、好ましくは該特徴点の近傍にわたって積分することによって、該特徴点の特徴方向を確定することをさらに含む、請求項1〜16のいずれか一項に記載の方法。
  17. 前記特徴方向は以下の式を使用することによって求められ、
    ここで、θは空間位置(x,y)における前記特徴点の前記特徴方向である、請求項17に記載の方法。
  18. 前記確定されたスケール依存の各画像領域についての表現を導出することは、該スケール依存の画像領域のためのバイナリ画像記述子を導出することを含む、請求項1〜18のいずれか一項に記載の方法。
  19. 請求項1〜20のいずれか一項に記載の方法によって導出された画像の記述子を使用して画像を比較する方法であって、
    第1の画像の前記記述子に関連付けられる1つ又は複数のスケール依存の画像領域の表現を、第2の画像の前記記述子に関連付けられる1つ又は複数のスケール依存の画像領域の表現と比較することを含む、画像を比較する方法。
  20. 第1の画像の前記記述子の前記画像領域の表現のサブセットを、第2の画像の前記記述子の前記画像領域の表現の対応するサブセットと比較することによって、一致する画像領域の候補ペアを識別することを含む、請求項21に記載の方法。
  21. 前記第1の画像の前記記述子において表される画像領域に関連付けられる所定の数の特徴点から成る第1の複数のセットを確定することと、
    前記第2の画像の前記記述子において表される画像領域に関連付けられる所定の数の特徴点から成る第2の複数のセットを確定することと、
    照合アルゴリズムを使用することによって、前記確定された第1の複数のセットから成るセットを前記確定された第2の複数のセットから成るセットと比較することと
    を含む、請求項21又は22に記載の方法。
  22. 前記所定の数は3であり、前記照合アルゴリズムは、前記第1の画像及び前記第2の画像内の特徴点に関連付けられる画像領域の表現のペアの間のハミング距離、並びに、前記第1の画像及び前記第2の画像内の特徴点に関連付けられる画像領域の表現の3つのペアの間の累積ハミング距離に基づく、請求項23に記載の方法。
  23. 前記ハミング距離が第1の閾値未満であり、且つ
    前記累積ハミング距離が第2の閾値未満であるときに、
    前記第1の画像及び前記第2の画像内の特徴点の一致候補セットを確定することをさらに含む、請求項24に記載の方法。
  24. 前記一致候補セットそれぞれの幾何学的情報に対して幾何学的制約を適用することによって、前記候補セットから誤一致を除去することをさらに含む、請求項25に記載の方法。
  25. 前記幾何学的制約を適用することは、
    前記候補セット内の前記特徴点のそれぞれの間の空間線の長さを求めることと、
    前記第1の画像及び前記第2の画像の前記候補セット内の前記線のペアの間の比を求めることと、
    前記第1の画像に関連付けられる前記求められた線長比と、前記第2の画像に関連付けられる前記求められた線長比との間の類似度の少なくとも1つの計量値を導出することと
    を含む、請求項26に記載の方法。
  26. 前記特徴点に関連付けられる前記画像領域の表現は特徴方向情報を含み、前記幾何学的制約は特徴方向を考慮に入れる、請求項26又は27に記載の方法。
  27. 類似度の計量値が閾値未満である場合、前記候補セットから特徴点の一致候補セットを除去することをさらに含む、請求項26、27又は28に記載の方法。
  28. 前記一致候補セットが存在しない場合、前記第1の画像及び前記第2の画像が一致しないことを確定することをさらに含む、請求項26、27、28又は29に記載の方法。
  29. 前記一致候補セットが残っている場合、
    第1の画像の前記記述子の全ての前記画像領域の表現を、第2の画像の前記記述子の全ての前記画像領域の表現と比較することによって、前記候補セット内に存在しない、特徴点のさらなる一致セットを確定することをさらに含む、請求項30に記載の方法。
  30. 前記候補セット内に存在しない、前記特徴点のさらなる一致セットは、前記第1の画像及び前記第2の画像の特徴点の間の最も小さいハミング距離に基づいて確定される、請求項31に記載の方法。
  31. 前記確定された特徴点のさらなる一致セットを前記候補セットに加えることによって、更新された候補セットを作成することと、
    4つの特徴点から成る更新された一致候補セットそれぞれの幾何学的情報に対して幾何学的制約を適用することによって、前記候補セットから誤一致をさらに除去することと
    をさらに含む、請求項31又は32に記載の方法。
  32. たとえば、請求項1〜20のいずれか一項に記載の方法によって導出された画像の表現の送信又は受信を含む、使用。
  33. 請求項1〜33のいずれか一項に記載の方法を実行するための装置。
  34. 請求項1〜20及び/又は請求項21〜33のいずれか一項に記載の方法を実行するための装置の動作を制御するための制御デバイスを備える、請求項35に記載の装置。
  35. 画像及び/又は画像の表現を格納するためのストレージ手段、たとえば、画像データベース及び/又は記述子データベース、表示手段、並びに、画像選択手段のうちの1つ又は複数をさらに備える、請求項36に記載の装置。
  36. コンピュータによって実行されると、請求項1〜20及び/又は請求項21〜33のいずれか一項に記載の方法を実施する命令を備えるコンピュータストレージ媒体。
JP2011505582A 2008-04-23 2009-04-21 画像識別のためのスケールにロバストな特徴に基づく識別子 Active JP5427883B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GB0807411.4 2008-04-23
GBGB0807411.4A GB0807411D0 (en) 2008-04-23 2008-04-23 Scale robust feature-based indentfiers for image identification
PCT/GB2009/001016 WO2009130451A1 (en) 2008-04-23 2009-04-21 Scale robust feature-based identifiers for image identification

Publications (3)

Publication Number Publication Date
JP2011519090A true JP2011519090A (ja) 2011-06-30
JP2011519090A5 JP2011519090A5 (ja) 2012-06-07
JP5427883B2 JP5427883B2 (ja) 2014-02-26

Family

ID=39494114

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011505582A Active JP5427883B2 (ja) 2008-04-23 2009-04-21 画像識別のためのスケールにロバストな特徴に基づく識別子

Country Status (7)

Country Link
US (1) US8831355B2 (ja)
EP (1) EP2294531B1 (ja)
JP (1) JP5427883B2 (ja)
KR (1) KR101649766B1 (ja)
CN (1) CN102016880B (ja)
GB (1) GB0807411D0 (ja)
WO (1) WO2009130451A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015118473A (ja) * 2013-12-17 2015-06-25 日本電信電話株式会社 特徴抽出装置、方法、及びプログラム

Families Citing this family (75)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140156901A1 (en) 2005-10-26 2014-06-05 Cortica Ltd. Computing device, a system and a method for parallel processing of data streams
US11604847B2 (en) 2005-10-26 2023-03-14 Cortica Ltd. System and method for overlaying content on a multimedia content element based on user interest
US20160321253A1 (en) 2005-10-26 2016-11-03 Cortica, Ltd. System and method for providing recommendations based on user profiles
US11032017B2 (en) 2005-10-26 2021-06-08 Cortica, Ltd. System and method for identifying the context of multimedia content elements
US8326775B2 (en) 2005-10-26 2012-12-04 Cortica Ltd. Signature generation for multimedia deep-content-classification by a large-scale matching system and method thereof
US10848590B2 (en) 2005-10-26 2020-11-24 Cortica Ltd System and method for determining a contextual insight and providing recommendations based thereon
US20160085733A1 (en) 2005-10-26 2016-03-24 Cortica, Ltd. System and method thereof for dynamically associating a link to an information resource with a multimedia content displayed in a web-page
US11019161B2 (en) 2005-10-26 2021-05-25 Cortica, Ltd. System and method for profiling users interest based on multimedia content analysis
US11361014B2 (en) 2005-10-26 2022-06-14 Cortica Ltd. System and method for completing a user profile
US11386139B2 (en) 2005-10-26 2022-07-12 Cortica Ltd. System and method for generating analytics for entities depicted in multimedia content
US11216498B2 (en) 2005-10-26 2022-01-04 Cortica, Ltd. System and method for generating signatures to three-dimensional multimedia data elements
US11403336B2 (en) 2005-10-26 2022-08-02 Cortica Ltd. System and method for removing contextually identical multimedia content elements
US9646005B2 (en) 2005-10-26 2017-05-09 Cortica, Ltd. System and method for creating a database of multimedia content elements assigned to users
US11620327B2 (en) 2005-10-26 2023-04-04 Cortica Ltd System and method for determining a contextual insight and generating an interface with recommendations based thereon
US10742340B2 (en) 2005-10-26 2020-08-11 Cortica Ltd. System and method for identifying the context of multimedia content elements displayed in a web-page and providing contextual filters respective thereto
US10949773B2 (en) 2005-10-26 2021-03-16 Cortica, Ltd. System and methods thereof for recommending tags for multimedia content elements based on context
US11537636B2 (en) 2007-08-21 2022-12-27 Cortica, Ltd. System and method for using multimedia content as search queries
KR101323439B1 (ko) 2008-11-12 2013-10-29 보드 오브 트러스티스 오브 더 리랜드 스탠포드 주니어 유니버시티 특징 디스크립터를 표현하고 식별하는 방법, 장치 및 컴퓨터 판독가능 저장 매체
US9710491B2 (en) * 2009-11-02 2017-07-18 Microsoft Technology Licensing, Llc Content-based image search
EP2502184A4 (en) * 2009-11-19 2017-03-22 Nokia Corporation Method and apparatus for tracking and recognition with rotation invariant feature descriptors
KR101117239B1 (ko) * 2010-01-12 2012-03-20 키위플 주식회사 객체 인식시스템 및 이를 이용하는 객체 인식 방법
JP5578965B2 (ja) * 2010-07-02 2014-08-27 富士フイルム株式会社 オブジェクト推定装置および方法ならびにプログラム
US8483427B2 (en) * 2010-09-28 2013-07-09 Futurewei Technologies, Inc. System and method for image authentication
US20120137377A1 (en) * 2010-11-30 2012-05-31 ZOO Digital Limited, a Limited Company Method and system for safeguarding digital objects consisting of digital assets
BR112013019031B1 (pt) 2011-01-25 2021-03-09 Telecom Italia S.P.A. método e aparelho para comparar uma primeira imagem com uma segunda imagem, e, sistema para comparar imagens.
JP2012234258A (ja) * 2011-04-28 2012-11-29 Sony Corp 画像処理装置と画像処理方法およびプログラム
KR101833953B1 (ko) 2012-01-02 2018-03-02 텔레콤 이탈리아 소시에떼 퍼 아찌오니 이미지들을 비교하는 방법 및 시스템
KR20140102038A (ko) * 2013-02-13 2014-08-21 삼성전자주식회사 영상 정합 장치 및 영상 정합 방법
WO2014175481A1 (ko) * 2013-04-24 2014-10-30 전자부품연구원 서술자 생성 방법 및 이를 구현하는 하드웨어 장치
KR101418524B1 (ko) * 2013-04-24 2014-08-06 전자부품연구원 하드웨어 장치 및 적분 이미지 생성 방법
WO2014175480A1 (ko) * 2013-04-24 2014-10-30 전자부품연구원 하드웨어 장치 및 적분 이미지 생성 방법
CN104123532B (zh) * 2013-04-28 2017-05-10 浙江大华技术股份有限公司 对目标对象进行检测、确定目标对象数量的方法和设备
CN104182719B (zh) * 2013-05-21 2017-06-30 宁波华易基业信息科技有限公司 一种图像识别方法及装置
EP2884427B1 (en) * 2013-12-12 2021-10-20 Fundacion Centro de Tecnologias de Interaccion Visual y comunicaciones Vicomtech Method and system for describing an image
JP6448767B2 (ja) 2014-04-24 2019-01-09 ナント・ホールデイングス・アイ・ピー・エル・エル・シー 画像物体認識におけるロバスト特徴特定
CN105224582B (zh) * 2014-07-03 2018-11-09 联想(北京)有限公司 信息处理方法和设备
US9805099B2 (en) * 2014-10-30 2017-10-31 The Johns Hopkins University Apparatus and method for efficient identification of code similarity
CN104933434A (zh) * 2015-06-16 2015-09-23 同济大学 一种结合LBP特征提取和surf特征提取方法的图像匹配方法
US9390315B1 (en) * 2015-06-25 2016-07-12 A9.Com, Inc. Image match for featureless objects
CN105069403B (zh) * 2015-07-20 2018-10-26 同济大学 一种基于分块统计特征与字典学习稀疏表示分类的三维人耳识别
CN105005794B (zh) * 2015-07-21 2018-06-05 太原理工大学 融合多粒度上下文信息的图像像素语义标注方法
US9727800B2 (en) * 2015-09-25 2017-08-08 Qualcomm Incorporated Optimized object detection
US11037015B2 (en) 2015-12-15 2021-06-15 Cortica Ltd. Identification of key points in multimedia data elements
CN105574528B (zh) * 2015-12-15 2019-01-22 安徽工业大学 一种基于多相互斥水平集的黏连细胞图像分割方法
US11195043B2 (en) 2015-12-15 2021-12-07 Cortica, Ltd. System and method for determining common patterns in multimedia content elements based on key points
AU2017229500A1 (en) 2016-03-08 2018-08-30 Nant Holdings Ip, Llc Image feature combination for image-based object recognition
CN106302124A (zh) * 2016-08-18 2017-01-04 北京奇虎科技有限公司 一种添加特效的方法及电子设备
KR101870355B1 (ko) * 2017-01-31 2018-06-22 서울대학교병원 영상 처리 방법
US11760387B2 (en) 2017-07-05 2023-09-19 AutoBrains Technologies Ltd. Driving policies determination
US11899707B2 (en) 2017-07-09 2024-02-13 Cortica Ltd. Driving policies determination
US10740431B2 (en) * 2017-11-13 2020-08-11 Samsung Electronics Co., Ltd Apparatus and method of five dimensional (5D) video stabilization with camera and gyroscope fusion
US10846544B2 (en) 2018-07-16 2020-11-24 Cartica Ai Ltd. Transportation prediction system and method
US11613261B2 (en) 2018-09-05 2023-03-28 Autobrains Technologies Ltd Generating a database and alerting about improperly driven vehicles
US20200133308A1 (en) 2018-10-18 2020-04-30 Cartica Ai Ltd Vehicle to vehicle (v2v) communication less truck platooning
US10839694B2 (en) 2018-10-18 2020-11-17 Cartica Ai Ltd Blind spot alert
US11904863B2 (en) 2018-10-26 2024-02-20 AutoBrains Technologies Ltd. Passing a curve
US11244176B2 (en) 2018-10-26 2022-02-08 Cartica Ai Ltd Obstacle detection and mapping
US10748038B1 (en) 2019-03-31 2020-08-18 Cortica Ltd. Efficient calculation of a robust signature of a media unit
US11392738B2 (en) 2018-10-26 2022-07-19 Autobrains Technologies Ltd Generating a simulation scenario
US10789535B2 (en) 2018-11-26 2020-09-29 Cartica Ai Ltd Detection of road elements
US11170647B2 (en) 2019-02-07 2021-11-09 Cartica Ai Ltd. Detection of vacant parking spaces
US11643005B2 (en) 2019-02-27 2023-05-09 Autobrains Technologies Ltd Adjusting adjustable headlights of a vehicle
US11285963B2 (en) 2019-03-10 2022-03-29 Cartica Ai Ltd. Driver-based prediction of dangerous events
US11694088B2 (en) 2019-03-13 2023-07-04 Cortica Ltd. Method for object detection using knowledge distillation
US11132548B2 (en) 2019-03-20 2021-09-28 Cortica Ltd. Determining object information that does not explicitly appear in a media unit signature
US10776669B1 (en) 2019-03-31 2020-09-15 Cortica Ltd. Signature generation and object detection that refer to rare scenes
US11908242B2 (en) 2019-03-31 2024-02-20 Cortica Ltd. Efficient calculation of a robust signature of a media unit
US11222069B2 (en) 2019-03-31 2022-01-11 Cortica Ltd. Low-power calculation of a signature of a media unit
CN112150533A (zh) * 2019-06-28 2020-12-29 顺丰科技有限公司 物体体积计算方法、装置、设备、及存储介质
US11704292B2 (en) 2019-09-26 2023-07-18 Cortica Ltd. System and method for enriching a concept database
CN111008955B (zh) * 2019-11-06 2023-05-26 重庆邮电大学 多尺度图像块匹配的快速复制粘贴篡改检测方法
US11593662B2 (en) 2019-12-12 2023-02-28 Autobrains Technologies Ltd Unsupervised cluster generation
US11590988B2 (en) 2020-03-19 2023-02-28 Autobrains Technologies Ltd Predictive turning assistant
US11827215B2 (en) 2020-03-31 2023-11-28 AutoBrains Technologies Ltd. Method for training a driving related object detector
CN112966694A (zh) * 2021-02-02 2021-06-15 哈尔滨商业大学 一种应用于图像匹配的尺度不变特征点提取方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001067462A (ja) * 1999-07-09 2001-03-16 Korea Electronics Telecommun 周波数空間上における質感表現方法及び質感ベースの検索方法
JP2003250804A (ja) * 2002-03-05 2003-09-09 Toshiba Corp 画像処理装置及び超音波診断装置
JP2005208979A (ja) * 2004-01-23 2005-08-04 Fuji Xerox Co Ltd 特徴量抽出装置および特徴量抽出方法、ならびに文書ファイリング装置
JP2005317020A (ja) * 2004-04-27 2005-11-10 Microsoft Corp マルチスケールの有向パッチ(multi−scaleorientedpatches)を使用したマルチ画像フィーチャ(feature)のマッチング
JP2008077626A (ja) * 2006-03-31 2008-04-03 Sony Corp 物体認識装置、物体認識方法、物体認識プログラム、特徴量登録装置、特徴量登録方法、及び特徴量登録プログラム

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1995010820A1 (en) * 1993-10-15 1995-04-20 At & T Corp. Methods and apparatus for classification of images using distribution maps
KR100215450B1 (ko) * 1996-05-17 1999-08-16 윤종용 불규칙메쉬들을 이용한 대상물 지향 화상표현방법및그장치
US6215898B1 (en) * 1997-04-15 2001-04-10 Interval Research Corporation Data processing system and method
JP3568732B2 (ja) * 1997-04-18 2004-09-22 シャープ株式会社 画像処理装置
US6711293B1 (en) * 1999-03-08 2004-03-23 The University Of British Columbia Method and apparatus for identifying scale invariant features in an image and use of same for locating an object in an image
US6975755B1 (en) * 1999-11-25 2005-12-13 Canon Kabushiki Kaisha Image processing method and apparatus
AU2002312182A1 (en) * 2001-05-30 2002-12-09 Nptest, Inc. Sub-resolution alignment of images
US7542036B2 (en) * 2003-02-19 2009-06-02 California Institute Of Technology Level set surface editing operators
JP4392584B2 (ja) * 2003-06-27 2010-01-06 ソニー株式会社 信号処理装置および信号処理方法、並びにプログラムおよび記録媒体
JP2006293949A (ja) * 2005-03-17 2006-10-26 Sharp Corp 画像照合装置、画像照合方法、画像照合プログラムおよび画像照合プログラムを記録したコンピュータ読取り可能な記録媒体
JP4791233B2 (ja) 2006-04-10 2011-10-12 三菱電機株式会社 画像処理装置、画像処理方法、画像出力装置、画像処理システム
US7680341B2 (en) * 2006-05-05 2010-03-16 Xerox Corporation Generic visual classification with gradient components-based dimensionality enhancement
EP2315161A1 (en) 2006-10-11 2011-04-27 Mitsubishi Electric Information Technology Centre Europe B.V. Image descriptor for image recognition
GB0700468D0 (en) 2007-01-10 2007-02-21 Mitsubishi Electric Inf Tech Improved image identification
WO2008123969A1 (en) * 2007-04-02 2008-10-16 The Trustees Of The University Of Pennsylvania Combined feature ensemble mutual information image registration
GB0712388D0 (en) 2007-06-26 2007-08-01 Mitsubishi Electric Inf Tech High Performance Image Identification
GB0719833D0 (en) 2007-10-10 2007-11-21 Mitsubishi Electric Inf Tech Enhanced image identification
US8064679B2 (en) * 2007-12-27 2011-11-22 Cytyc Corporation Targeted edge detection method and apparatus for cytological image processing applications
GB0800364D0 (en) 2008-01-09 2008-02-20 Mitsubishi Electric Inf Tech Feature-based signatures for image identification

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001067462A (ja) * 1999-07-09 2001-03-16 Korea Electronics Telecommun 周波数空間上における質感表現方法及び質感ベースの検索方法
JP2003250804A (ja) * 2002-03-05 2003-09-09 Toshiba Corp 画像処理装置及び超音波診断装置
JP2005208979A (ja) * 2004-01-23 2005-08-04 Fuji Xerox Co Ltd 特徴量抽出装置および特徴量抽出方法、ならびに文書ファイリング装置
JP2005317020A (ja) * 2004-04-27 2005-11-10 Microsoft Corp マルチスケールの有向パッチ(multi−scaleorientedpatches)を使用したマルチ画像フィーチャ(feature)のマッチング
JP2008077626A (ja) * 2006-03-31 2008-04-03 Sony Corp 物体認識装置、物体認識方法、物体認識プログラム、特徴量登録装置、特徴量登録方法、及び特徴量登録プログラム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CSNG200700763006; 中河秀仁 外2名: '全方位動画像からの自己位置識別' 情報処理学会研究報告 Vol.2007 No.42 第2007巻 第42号, 20070514, 頁65〜72, 社団法人情報処理学会 *
JPN6013014091; 中河秀仁 外2名: '全方位動画像からの自己位置識別' 情報処理学会研究報告 Vol.2007 No.42 第2007巻 第42号, 20070514, 頁65〜72, 社団法人情報処理学会 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015118473A (ja) * 2013-12-17 2015-06-25 日本電信電話株式会社 特徴抽出装置、方法、及びプログラム

Also Published As

Publication number Publication date
GB0807411D0 (en) 2008-05-28
KR101649766B1 (ko) 2016-08-19
EP2294531B1 (en) 2014-07-02
US20110038545A1 (en) 2011-02-17
CN102016880A (zh) 2011-04-13
EP2294531A1 (en) 2011-03-16
WO2009130451A1 (en) 2009-10-29
CN102016880B (zh) 2014-04-09
JP5427883B2 (ja) 2014-02-26
US8831355B2 (en) 2014-09-09
KR20110002043A (ko) 2011-01-06

Similar Documents

Publication Publication Date Title
JP5427883B2 (ja) 画像識別のためのスケールにロバストな特徴に基づく識別子
Wu et al. Busternet: Detecting copy-move image forgery with source/target localization
JP5431362B2 (ja) 画像識別のための特徴ベースの識別特性(signature)
US9275311B2 (en) Efficient image matching for large sets of images
JP5175854B2 (ja) 画像認識のための画像記述子
US8798377B2 (en) Efficient scale-space extraction and description of interest points
US20110007940A1 (en) Automated target detection and recognition system and method
Anand et al. A copy move forgery detection to overcome sustained attacks using dyadic wavelet transform and SIFT methods
KR20140102038A (ko) 영상 정합 장치 및 영상 정합 방법
Shreyas et al. Fingerprint authentication using geometric features
CN110738222B (zh) 图像匹配方法、装置、计算机设备和存储介质
Gueham et al. Automatic recognition of shoeprints using Fourier-Mellin transform
Isaac et al. Image forgery detection using region–based Rotation Invariant Co-occurrences among adjacent LBPs
Isaac et al. Copy-Move forgery detection based on Harris Corner points and BRISK
Vinay et al. A double filtered GIST descriptor for face recognition
Rodrigues et al. A simple approach for biometrics: Finger-knuckle prints recognition based on a sobel filter and similarity measures
CN115527244A (zh) 一种指纹图像匹配方法、装置、计算机设备及存储介质
Bakshi et al. Score level fusion of SIFT and SURF for iris
CN113077410A (zh) 图像检测方法、装置方法、芯片及计算机可读存储介质
Lee et al. An identification framework for print-scan books in a large database
Shi et al. Visual attention based image zero watermark scheme with ensemble similarity
Bakshi et al. Postmatch pruning of SIFT pairs for iris recognition
Fattahi et al. Detection of Copy-Move Forgery in Digital Images Using Scale Invariant Feature Transform Algorithm and the Spearman Relationship.
Bahroun et al. Local query on satellite images based on interest points
Miao et al. A wide baseline matching method based on scale invariant feature descriptor

Legal Events

Date Code Title Description
A524 Written submission of copy of amendment under article 19 pct

Free format text: JAPANESE INTERMEDIATE CODE: A524

Effective date: 20120420

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120420

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130301

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130326

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130614

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131119

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131202

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5427883

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250