JP5384746B2 - プルーニング機能、画像スケーリング、および、空間制約付き特徴マッチングによる画像認識アルゴリズムの性能の改善 - Google Patents
プルーニング機能、画像スケーリング、および、空間制約付き特徴マッチングによる画像認識アルゴリズムの性能の改善 Download PDFInfo
- Publication number
- JP5384746B2 JP5384746B2 JP2012542205A JP2012542205A JP5384746B2 JP 5384746 B2 JP5384746 B2 JP 5384746B2 JP 2012542205 A JP2012542205 A JP 2012542205A JP 2012542205 A JP2012542205 A JP 2012542205A JP 5384746 B2 JP5384746 B2 JP 5384746B2
- Authority
- JP
- Japan
- Prior art keywords
- keypoint
- cluster
- image
- query
- match
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
- G06V10/757—Matching configurations of points or features
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本明細書に記述される様々な特徴は、画像認識の速度および/または効率を改善することに関する。
図1は、クエリ画像に対してオブジェクト認識を実行するための機能的なステージを示すブロック図である。画像取込ステージ102において、対象となる画像108(すなわち、クエリ画像)が取り込まれうる。次に、画像処理ステージ104において、対応するスケール空間110(例えば、ガウススケール空間)を生成し、特徴検出112を実行し、特徴記述子抽出116を実行することによって、取込画像108が処理される。特徴検出112は、複数の記述子を取得するために、後に特徴記述子抽出116で使用されうる、取込画像108についての高度に特異的なキーポイント、および/または、幾何学的に関心をひくキーポイントを識別しうる。画像比較ステージ106では、既知の記述子のデータベースとの特徴マッチング122(例えば、キーポイントおよび/またはキーポイントの別の特徴、あるいは、キーポイントの周りのパッチを比較することによって)を実行するためにこれらの記述子が使用されうる。次に、正確な特徴マッチを確実にし、マッチ結果126を提供するために、幾何学的検証または一貫性検査124がキーポイントマッチに対して行われる。この方法で、クエリ画像は、ターゲット画像のデータベースと比較され、および/または、それから識別されうる。
幾何学的検証は、偽陽性キーポイントマッチ(すなわち、アウトライア)を除外するための後処理ステップとして用いられる。幾何学的検証(一貫性検査とも呼ばれる)を行う際、クエリ画像と候補ターゲット画像との間での最良の仮説的変換が推定され、この変換と一貫しないキーポイントマッチは、偽陽性(すなわち、アウトライア)として除去される。しかしながら、幾何学的検証は、計算的に高価である。1つのアプローチに従って、幾何学的検証を除去すること、あるいは、幾何学的検証の収束速度を改善することは、特徴マッチングプロセスと同時にキーポイントマッチに制約を課すことを含む。すなわち、特徴マッチングの後に幾何学的検証を適用するよりはむしろ、偽陽性マッチは、特徴マッチングステップ自体の間に、削除、阻止、および/または、除去されうる。このアプローチは、幾何学的検証技術の収束速度が遅くならないように、インライア対アウトライア比を増やす。
図10は、クラスタリングを用いたキーポイントマッチングを行うための方法を示すフローチャートである。最初に、参照画像のデータベースを作るために、ターゲット画像がオフラインで処理されうる。例えば、1または複数のターゲット画像内のキーポイントが識別されうる(1002)。各ターゲット画像についてキーポイントのクラスタが識別または定義されうる(1004)。同様に、クエリ画像のリアルタイム処理のために、キーポイントが識別され(1008)、キーポイントのクラスタが定義される(1010)。本明細書に記述されるクラスタリングプロセスが、画像内の全ての画素のクラスタリングに基づくのではなく、キーポイントとして分類された画素にだけ基づくことに注意されたい。
クエリ画像とターゲット画像との間でキーポイントマッチングを行う前に、クエリ画像のスケールは、推定あるいはおおまかに確かめられる必要があり、それによって、キーポイント比較は、クエリ画像とターゲット画像の両方に対して、ほぼ同じスケールで行われる。同一のシーンまたはオブジェクトのターゲット画像とはわずかに異なる視点のクエリ画像を考慮する。ここで、2つの画像にはスケール誤差がある。同一のガウスカーネルサイズ「R」(ガウスピラミッド内の)について、クエリ画像およびターゲット画像内で検出されたクラスタは、カーネルが画像の異なるサイズの部分をカバーするという事実のため、異なりうる。1対1のクラスタ対応は確立されない可能性がある。クエリ画像のスケールを決定することは、カーネルサイズ「R」の選択を可能にする。「スケール」は、所与の画像についての解像度を指しうる。
いくつかの例において、利用可能なキーポイントのサブセットにのみ基づいて、クエリ画像からの特徴をターゲット画像にマッチングさせることが可能である。例えば、500個のキーポイントが1つの画像に対して識別されうるが、実際には、100個あるいは200個しか画像またはオブジェクトマッチングを行なうために必要とされない可能性がある。キーポイントの数を減らすことは、オブジェクト/画像認識に必要な処理の削減を促進する。キーポイントを減らすための2つのアプローチは、クラスタ密度に基づいてキーポイントをプルーニングすること、および、スケールに基づいてキーポイントをプルーニングすることを含む。
図21は、画像マッチングデバイスの例を示すブロック図である。画像マッチングデバイス2100は、通信インタフェース2104、画像取込デバイス2106、および/または、記憶デバイス2108に結合された処理回路2102を含みうる。通信インタフェース2104は、有線/無線ネットワークを通っての通信し、画像および/または1または画像についての特徴記述子を受信することに適応しうる。画像取込デバイス2106は、例えば、クエリ画像を取り込むことができるデジタルカメラでありうる。処理回路2102は、画像から特徴を抽出するための画像処理回路2114、および、この抽出された特徴を使用して、クエリ画像をターゲット画像のデータベース2110に、および/または、クエリ画像記述子を記述子データベース2112にマッチングするための画像マッチング回路2116を含みうる。1つの例示的なインプリメンテーションに従って、画像マッチングアプリケーションは、画像データベース内の1または複数の画像へのクエリ画像のマッチングを試みる。画像データベースは、データベース2110に記憶された1または複数の画像と関連付けられた何百万もの特徴記述子を含みうる。
図22は、画像またはオブジェクト認識のために、画像処理を行なうのに適した例示的なモバイルデバイスを示すブロック図である。モバイルデバイス2200は、画像取込デバイス2204、通信インタフェース2210、および、記憶デバイス2208に結合された処理回路2202を含みうる。画像取込デバイス2204(例えば、デジタルカメラ)は、関心の対象であるクエリ画像2206を取り込み、それを処理回路2202に供給することに適応しうる。処理回路2202は、取込画像を処理して、画像/オブジェクト認識のために後で送信または使用されうる特徴記述子を生成することに適応しうる。例えば、処理回路2202は、スケール空間生成器2222、特徴検出器2224、画像スケーリング回路2226、特徴プルーニング回路2228、および/または、特徴記述子抽出器2230を含む特徴識別回路2220を含むか、それを実施しうる。スケール空間生成器2222は、例えば、図3に示されるように、複数の異なるスケール空間(例えば、ガウススケール空間ピラミッド)を生成するために、ぼやかし関数を用いて画像を畳み込むように機能しうる。次に、特徴検出器2224は、画像に対して、異なるスケール空間で1または複数のキーポイントを識別しうる(例えば、図4で示されるような局所極大および極小を使用することによって)。画像スケーリング回路2226は、特徴検出および/またはクラスタリングを行なう適切なカーネルサイズを選択するために、画像のスケールに接近するように機能しうる。特徴プルーニング回路2228は、より高い密度クラスタ内のキーポイントだけを使用/選択すること(図17)、および/または、より高いスケールで検出されたキーポイントを好むこと(図19)によって、マッチングされるキーポイントの数を減らす。特徴記述子生成器2230は、各キーポイントおよび/またはその周囲のパッチの記述子を生成する(例えば、図5で示される)。
Claims (33)
- 画像認識における特徴マッチングのための方法であって、
クエリ画像について複数のキーポイントを取得することと、
キーポイントの配置に基づいて、前記クエリ画像についてキーポイントクラスタのセットを定義することと、
前記クエリ画像についてのキーポイントの少なくとも1つのサブセットを、1または複数のターゲット画像についてのキーポイントにマッチングすることによって、前記クエリ画像についてのアンカーマッチを確立することと、ここで、前記アンカーマッチは、1または複数のターゲット画像内のキーポイントと閾値を超えてマッチングされたキーポイントマッチであり、前記閾値を下回るキーポイントマッチは、前記対応する1または複数のターゲット画像に係る部分マッチであり、
前記ターゲットキーポイントクラスタについてのアンカーマッチに基づいてクエリキーポイントクラスタをターゲットキーポイントクラスタにマッチングすることと、
クラスタマッチングの目的のために部分マッチとして前記クエリキーポイントクラスタから前に除外されたキーポイントを、後続の幾何学的検証動作のための前記クエリキーポイントクラスタの一部として保存することと、
を備える方法。 - 前記閾値は、アウトライアマッチを除外するように選択され、アウトライアマッチは偽陽性キーポイントマッチである、請求項1に記載の方法。
- アンカーマッチは、前記クエリ画像についてのスケール空間レベルの選択されたサブセットの中で生じる、前記クエリ画像内のキーポイントについてのキーポイントマッチである、請求項1に記載の方法。
- 前記部分的にマッチングされたキーポイントは、部分マッチが前記キーポイントについて見つかり、そのようなマッチが前記ターゲットキーポイントクラスタ内であるか否かについてのバイナリ決定に基づいて、前記クエリキーポイントクラスタ内に保持される、
請求項1に記載の方法。 - アンカーマッチは、前記クエリ画像についてのキーポイントのサブセットの各々の周りの局所画素情報に基づいて少なくとも部分的にマッチングされるキーポイントマッチである、請求項1に記載の方法。
- 前記局所画素情報は、画素勾配、画素色彩、クラスタ形状、あるいは、キーポイント配置のうちの少なくとも1つを含む、請求項5に記載の方法。
- アンカーマッチを確立することは、
前記クエリ画像内のキーポイントを前記ターゲット画像内のキーポイントにマッチングすることと、
クラスタマッチングの目的のために、前記クエリキーポイントクラスタからの部分的にマッチングされたキーポイントを除外することと、
キーポイントがその対応するキーポイントクラスタから除外されるべきか否かに関する以後のバイナリ決定のために、前記クエリ画像内のキーポイントについてのキーポイントマッチ情報を保持することと、
を含む、請求項1に記載の方法。 - クエリキーポイントクラスタからのキーポイントを、該キーポイントがマッチングされないか、前記ターゲットキーポイントクラスタ以外のクラスタ内のキーポイントとマッチングされる場合に除外することをさらに備える、請求項1に記載の方法。
- キーポイントは、前記クエリ画像についてのスケール空間内の局所極大画素または局所極小画素である、請求項1に記載の方法。
- キーポイントは、前記クエリ画像のぼやかされたバージョンに対応する複数のスケール空間にわたって確かめられる、請求項1に記載の方法。
- キーポイントは、キーポイントマッチングに使用される記述子で表される、請求項1に記載の方法。
- 前記クエリ画像についてのスケール空間にわたる前記キーポイントの空間位置;
前記キーポイントが検出される前記スケール空間におけるスケールレベル;
のうちの少なくとも1つに基づいて、キーポイントがクラスタリングされる、請求項1に記載の方法。 - 前記クエリ画像についての前記キーポイントは、複数の画像スケール空間にわたって取得され、さらに、
前記キーポイントクラスタのセットからの1または複数のより低い密度のクラスタをプルーニングすることと;
前記キーポイントクラスタのセット内の前記クラスタのうちの少なくともいくつかから前記クエリ画像のスケール空間のより低いレベルで検出されたキーポイントをプルーニングすることと;
のいずれか1つによって前記クエリ画像についてのキーポイントの数を減らすことを備える、請求項1に記載の方法。 - 前記クエリ画像についての前記数が減ったキーポイントに係る記述子を生成することをさらに備える、請求項13に記載の方法。
- 記述子を生成する前に前記プルーニングされたキーポイントおよびクラスタを破棄することをさらに備える、請求項14に記載の方法。
- 前記クエリ画像または前記クエリ画像内のオブジェクトをターゲット画像にマッチングするために、前記数が減ったキーポイントに係る前記記述子を特徴マッチングデバイスに送信することをさらに備える、請求項14に記載の方法。
- 前記キーポイントクラスタのセット内の前記クラスタの各々についてのキーポイント密度を取得することをさらに備える、請求項13に記載の方法。
- 前記クエリ画像についての複数のスケール空間にわたるキーポイントの配置を取得することと、
前記キーポイントの配置に基づいて前記クエリ画像についてのスケールを推定することと
をさらに備える、請求項1に記載の方法。 - カットオフスケールが、該カットオフスケールまでの空間スケールの中にキーポイントの閾値割合を維持するように、前記画像スケールが、前記スケール空間上の前記キーポイントの配置から推定される、請求項18に記載の方法。
- 前記推定されたクエリ画像スケールに基づいてキーポイントをクラスタリングするためにカーネルサイズを選択することをさらに備える、請求項18に記載の方法。
- キーポイントクラスタリングを実行するために、前記選択されたカーネルサイズで前記クエリ画像のぼやかされたバージョンを利用することをさらに備える、請求項20に記載の方法。
- 複数のターゲット画像についての情報を記憶する記憶デバイスと、
前記記憶デバイスに結合された処理回路と
を備え、
前記処理回路は、
クエリ画像についての複数のキーポイントを取得し、
キーポイント配置に基づいて前記クエリ画像についてのキーポイントクラスタのセットを定義し、
前記クエリ画像についてのキーポイントの少なくとも1つのサブセットを、1または複数のターゲット画像についてのキーポイントにマッチングすることによって、前記クエリ画像についてのアンカーマッチを確立し、ここで、前記アンカーマッチは、1または複数のターゲット画像内のキーポイントと閾値を超えてマッチングされたキーポイントマッチであり、前記閾値を下回るキーポイントマッチは、前記対応する1または複数のターゲット画像に係る部分マッチであり、
前記ターゲットキーポイントクラスタについてのアンカーマッチに基づいて、クエリキーポイントクラスタをターゲットキーポイントクラスタにマッチングし、
クラスタマッチングの目的のために部分マッチとして前記クエリキーポイントクラスタから前に除外されたキーポイントを、後続の幾何学的検証動作のための前記クエリキーポイントクラスタの一部として保持する、
ことに適応する、
特徴マッチングデバイス。 - 前記閾値は、アウトライアマッチを除外するように選択され、アウトライアマッチは偽陽性キーポイントマッチである、請求項22に記載の特徴マッチングデバイス。
- アンカーマッチは、前記クエリ画像に係るスケール空間レベルの選択されたサブセット内で生じる、前記クエリ画像内のキーポイントについてのキーポイントマッチである、請求項22に記載の特徴マッチングデバイス。
- 前記処理回路は、さらに、
前記キーポイントについての部分マッチが見つかり、当該マッチが前記ターゲットキーポイントクラスタ内であるかどうかについてのバイナリ決定に基づいて前記クエリキーポイントクラスタ内の部分的にマッチングされたキーポイントを保持することに適応する、請求項23に記載の特徴マッチングデバイス。 - 前記処理回路は、
前記クエリ画像内のキーポイントを前記ターゲット画像内のキーポイントにマッチングすることと、
クラスタマッチングの目的のために、前記クエリキーポイントクラスタから部分的にマッチングされたキーポイントを除外すること、
キーポイントがその対応するキーポイントクラスタから除外されるべきか否かに関する以後のバイナリ決定のために、前記クエリ画像内のキーポイントについてのキーポイントマッチ情報を保持することと
によって前記アンカーマッチを確立することに適応する、請求項22に記載の特徴マッチングデバイス。 - 前記クエリ画像を取得するための画像取得デバイスをさらに備える、請求項22に記載の特徴マッチングデバイス。
- 前記クエリ画像についてのキーポイントは、複数の画像スケール空間にわたって取得され、
前記処理回路は、
前記キーポイントクラスタのセットからの1または複数のより低い密度のクラスタをプルーニングすることと;
前記キーポイントクラスタのセット内の前記クラスタのうちの少なくともいくつかから前記クエリ画像のスケール空間のより低いレベルで検出されるキーポイントをプルーニングすることと;
のいずれか1つのよって前記クエリ画像についてのキーポイントの数を減らすことにさらに適応する、請求項22に記載の特徴マッチングデバイス。 - 前記処理回路は、前記クエリ画像の前記数が減ったキーポイントについての記述子を生成することにさらに適応する、請求項28に記載の特徴マッチングデバイス。
- 前記クエリ画像または前記クエリ画像内のオブジェクトをターゲット画像にマッチングするために、前記数が減ったキーポイントについての前記記述子を特徴マッチングデバイス送信することに適応した送信機をさらに備える、請求項28に記載の特徴マッチングデバイス。
- 前記処理回路は、
前記クエリ画像についての複数のスケール空間にわたるキーポイントの配置を取得することと、
前記キーポイントの配置に基づいて前記クエリ画像についてのスケールを推定することと、
にさらに適応する、請求項22に記載の特徴マッチングデバイス。 - クエリ画像に対して複数のキーポイントを取得するための手段と、
キーポイント配置に基づいて前記クエリ画像についてのキーポイントクラスタのセットを定義するための手段と、
前記クエリ画像についてのキーポイントの少なくともサブセットを、1または複数のターゲット画像についてのキーポイントにマッチングすることによって、前記クエリ画像についてのアンカーマッチを確立するための手段と、ここで、前記アンカーマッチは、1または複数のターゲット画像内のキーポイントと閾値を超えてマッチングされたキーポイントマッチであり、前記閾値を下回るキーポイントマッチは、前記対応する1または複数のターゲット画像に係る部分マッチであり、
前記ターゲットキーポイントクラスタについてのアンカーマッチに基づいてクエリキーポイントクラスタをターゲットキーポイントクラスタにマッチングするための手段と
クラスタマッチングために部分マッチとして前記クエリキーポイントクラスタから前に除外されたキーポイントを、後続の幾何学的検証動作のための前記クエリキーポイントクラスタの一部として保持するための手段と、
を備える特徴マッチングデバイス。 - 特徴マッチングデバイス上で動作可能な1または複数の命令を備えるプロセッサ可読媒体であって、前記複数の命令は、処理回路によって実行されると、前記処理回路に対して、
クエリ画像に対して複数のキーポイントを取得させ、
キーポイントの配置に基づいて前記クエリ画像についてのキーポイントクラスタのセットを定義させ、
前記クエリ画像についてのキーポイントの少なくとも1つのサブセットを、1または複数のターゲット画像についてのキーポイントにマッチングすることによって、前記クエリ画像についてのアンカーマッチを確立させ、ここで、前記アンカーマッチは、1または複数のターゲット画像内のキーポイントと閾値を超えてマッチングされたキーポイントマッチであり、前記閾値を下回るキーポイントマッチは、前記対応する1または複数のターゲット画像に係る部分マッチであり、
前記ターゲットキーポイントクラスタについてのアンカーマッチに基づいてクエリキーポイントクラスタをターゲットキーポイントクラスタにマッチングさせ、
クラスタマッチングために部分マッチとして前記クエリキーポイントクラスタから前に除外されたキーポイントを、後続の幾何学的検証動作のための前記クエリキーポイントクラスタの一部として保持させる、プロセッサ可読媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US26595509P | 2009-12-02 | 2009-12-02 | |
US61/265,955 | 2009-12-02 | ||
PCT/US2010/058805 WO2011069021A2 (en) | 2009-12-02 | 2010-12-02 | Improving performance of image recognition algorithms by pruning features, image scaling, and spatially constrained feature matching |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013513167A JP2013513167A (ja) | 2013-04-18 |
JP5384746B2 true JP5384746B2 (ja) | 2014-01-08 |
Family
ID=43734069
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012542205A Expired - Fee Related JP5384746B2 (ja) | 2009-12-02 | 2010-12-02 | プルーニング機能、画像スケーリング、および、空間制約付き特徴マッチングによる画像認識アルゴリズムの性能の改善 |
Country Status (6)
Country | Link |
---|---|
US (1) | US8705876B2 (ja) |
EP (1) | EP2507744A2 (ja) |
JP (1) | JP5384746B2 (ja) |
KR (1) | KR101420549B1 (ja) |
CN (1) | CN102763123B (ja) |
WO (1) | WO2011069021A2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11650597B2 (en) | 2019-07-09 | 2023-05-16 | Samsung Electronics Co., Ltd. | Electronic apparatus for identifying object through warped image and control method thereof |
Families Citing this family (110)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8520949B1 (en) * | 2008-06-20 | 2013-08-27 | Google Inc. | Self-similar descriptor filtering |
US10116972B2 (en) | 2009-05-29 | 2018-10-30 | Inscape Data, Inc. | Methods for identifying video segments and displaying option to view from an alternative source and/or on an alternative device |
US10375451B2 (en) | 2009-05-29 | 2019-08-06 | Inscape Data, Inc. | Detection of common media segments |
US8595781B2 (en) | 2009-05-29 | 2013-11-26 | Cognitive Media Networks, Inc. | Methods for identifying video segments and displaying contextual targeted content on a connected television |
US9449090B2 (en) | 2009-05-29 | 2016-09-20 | Vizio Inscape Technologies, Llc | Systems and methods for addressing a media database using distance associative hashing |
US10949458B2 (en) | 2009-05-29 | 2021-03-16 | Inscape Data, Inc. | System and method for improving work load management in ACR television monitoring system |
US9094715B2 (en) | 2009-05-29 | 2015-07-28 | Cognitive Networks, Inc. | Systems and methods for multi-broadcast differentiation |
WO2011069023A2 (en) | 2009-12-02 | 2011-06-09 | Qualcomm Incorporated | Fast subspace projection of descriptor patches for image recognition |
US9530073B2 (en) * | 2010-04-20 | 2016-12-27 | Qualcomm Incorporated | Efficient descriptor extraction over multiple levels of an image scale space |
US10192138B2 (en) | 2010-05-27 | 2019-01-29 | Inscape Data, Inc. | Systems and methods for reducing data density in large datasets |
US9838753B2 (en) | 2013-12-23 | 2017-12-05 | Inscape Data, Inc. | Monitoring individual viewing of television events using tracking pixels and cookies |
US8842191B2 (en) * | 2010-06-03 | 2014-09-23 | Recognition Robotics, Inc. | System and method for visual recognition |
EP2407803A1 (en) * | 2010-07-15 | 2012-01-18 | The European Atomic Energy Community (EURATOM), represented by the European Commission | Method for safely identifying moving objects |
US8965130B2 (en) * | 2010-11-09 | 2015-02-24 | Bar-Ilan University | Flexible computer vision |
DE102010055974A1 (de) * | 2010-12-23 | 2012-06-28 | Giesecke & Devrient Gmbh | Verfahren und Vorrichtung zur Bestimmung eines Klassenreferenzdatensatzes für die Klassifizierung von Wertdokumenten |
US8565482B2 (en) * | 2011-02-28 | 2013-10-22 | Seiko Epson Corporation | Local difference pattern based local background modeling for object detection |
CN102930493B (zh) * | 2011-08-12 | 2017-08-08 | 索尼公司 | 防篡改的图像处理方法和装置 |
US8666169B2 (en) * | 2011-10-24 | 2014-03-04 | Hewlett-Packard Development Company, L.P. | Feature descriptors |
US9412020B2 (en) * | 2011-11-09 | 2016-08-09 | Board Of Regents Of The University Of Texas System | Geometric coding for billion-scale partial-duplicate image search |
WO2013100790A1 (en) * | 2011-12-30 | 2013-07-04 | Intel Corporation | Coarse-to-fine multple disparity candidate stereo matching |
JP5848833B2 (ja) * | 2012-01-02 | 2016-01-27 | テレコム・イタリア・エッセ・ピー・アー | 画像を比較するための方法およびシステム |
US9031326B2 (en) * | 2012-02-16 | 2015-05-12 | Sony Corporation | System and method for effectively performing an image categorization procedure |
US9153061B2 (en) * | 2012-05-04 | 2015-10-06 | Qualcomm Incorporated | Segmentation of 3D point clouds for dense 3D modeling |
US9430876B1 (en) * | 2012-05-10 | 2016-08-30 | Aurasma Limited | Intelligent method of determining trigger items in augmented reality environments |
US20130328760A1 (en) * | 2012-06-08 | 2013-12-12 | Qualcomm Incorporated | Fast feature detection by reducing an area of a camera image |
US9727586B2 (en) * | 2012-10-10 | 2017-08-08 | Samsung Electronics Co., Ltd. | Incremental visual query processing with holistic feature feedback |
WO2014056537A1 (en) | 2012-10-11 | 2014-04-17 | Longsand Limited | Using a probabilistic model for detecting an object in visual data |
US8861793B1 (en) * | 2012-11-05 | 2014-10-14 | Pixelworks, Inc. | Depth map generation based on vanishing lines and vanishing points |
US9235780B2 (en) * | 2013-01-02 | 2016-01-12 | Samsung Electronics Co., Ltd. | Robust keypoint feature selection for visual search with self matching score |
US9338461B2 (en) * | 2013-02-04 | 2016-05-10 | Mitsubishi Electric Research Laboratories, Inc | Method and system for encoding collections of images and videos |
JP6144826B2 (ja) | 2013-06-11 | 2017-06-07 | クアルコム,インコーポレイテッド | データベース作成のための対話型および自動的3dオブジェクト走査方法 |
US9158988B2 (en) * | 2013-06-12 | 2015-10-13 | Symbol Technclogies, LLC | Method for detecting a plurality of instances of an object |
GB2516037A (en) * | 2013-07-08 | 2015-01-14 | Univ Surrey | Compact and robust signature for large scale visual search, retrieval and classification |
US9355123B2 (en) | 2013-07-19 | 2016-05-31 | Nant Holdings Ip, Llc | Fast recognition algorithm processing, systems and methods |
ITMI20131244A1 (it) * | 2013-07-24 | 2015-01-25 | Telecom Italia Spa | Identificazione di keypoint |
US10249029B2 (en) | 2013-07-30 | 2019-04-02 | Apple Inc. | Reconstruction of missing regions of images |
GB2517730A (en) * | 2013-08-29 | 2015-03-04 | Mediaproduccion S L | A method and system for producing a video production |
CA2924764C (en) | 2013-10-21 | 2020-03-10 | Microsoft Technology Licensing, Llc | Mobile video search |
US9839409B2 (en) | 2013-11-21 | 2017-12-12 | Samsung Medison Co., Ltd. | Image display system and method of fitting multiple models to image |
US9230159B1 (en) * | 2013-12-09 | 2016-01-05 | Google Inc. | Action recognition and detection on videos |
US9466009B2 (en) | 2013-12-09 | 2016-10-11 | Nant Holdings Ip. Llc | Feature density object classification, systems and methods |
US9280560B1 (en) * | 2013-12-18 | 2016-03-08 | A9.Com, Inc. | Scalable image matching |
US9955192B2 (en) | 2013-12-23 | 2018-04-24 | Inscape Data, Inc. | Monitoring individual viewing of television events using tracking pixels and cookies |
CN103678660B (zh) * | 2013-12-24 | 2017-01-11 | 北京邮电大学 | 一种图像检索方法 |
US9558712B2 (en) * | 2014-01-21 | 2017-01-31 | Nvidia Corporation | Unified optimization method for end-to-end camera image processing for translating a sensor captured image to a display image |
US9454806B2 (en) * | 2014-01-21 | 2016-09-27 | Nvidia Corporation | Efficient approximate-nearest-neighbor (ANN) search for high-quality collaborative filtering |
CN106415606B (zh) * | 2014-02-14 | 2019-11-08 | 河谷控股Ip有限责任公司 | 一种基于边缘的识别、系统和方法 |
WO2015123647A1 (en) | 2014-02-14 | 2015-08-20 | Nant Holdings Ip, Llc | Object ingestion through canonical shapes, systems and methods |
WO2015123646A1 (en) * | 2014-02-14 | 2015-08-20 | Nant Holdings Ip, Llc | Edge-based recognition, systems and methods |
CN107148632B (zh) * | 2014-04-24 | 2020-10-27 | 河谷控股Ip有限责任公司 | 用于基于图像的目标识别的稳健特征识别 |
JP6537332B2 (ja) * | 2014-04-28 | 2019-07-03 | キヤノン株式会社 | 画像処理方法および撮影装置 |
JP6334735B2 (ja) * | 2014-05-06 | 2018-05-30 | ナント・ホールデイングス・アイ・ピー・エル・エル・シー | エッジベクトルを利用した画像特徴検出 |
JP6431302B2 (ja) | 2014-06-30 | 2018-11-28 | キヤノン株式会社 | 画像処理装置、画像処理方法及びプログラム |
JP6620755B2 (ja) | 2014-10-23 | 2019-12-18 | 日本電気株式会社 | 画像処理装置、表示制御装置、画像処理方法、および、プログラム |
KR101644586B1 (ko) | 2014-11-18 | 2016-08-02 | 상명대학교서울산학협력단 | 인체 미동에 의한 hrp 기반 사회 관계성 측정 방법 및 시스템 |
US9792675B1 (en) * | 2014-12-05 | 2017-10-17 | Matrox Electronic Systems, Ltd. | Object recognition using morphologically-processed images |
AU2016211254B2 (en) | 2015-01-30 | 2019-09-19 | Inscape Data, Inc. | Methods for identifying video segments and displaying option to view from an alternative source and/or on an alternative device |
EP3259914A1 (en) * | 2015-02-19 | 2017-12-27 | Magic Pony Technology Limited | Interpolating visual data |
JP6336932B2 (ja) * | 2015-03-03 | 2018-06-06 | 富士フイルム株式会社 | 細胞群検出装置および方法並びにプログラム |
US9305228B1 (en) | 2015-03-20 | 2016-04-05 | Bank Of America Corporation | Processing damaged items using image data lift |
GB201604672D0 (en) | 2016-03-18 | 2016-05-04 | Magic Pony Technology Ltd | Generative methods of super resolution |
EP3278559B1 (en) | 2015-03-31 | 2021-05-05 | Magic Pony Technology Limited | Training end-to-end video processes |
GB201603144D0 (en) | 2016-02-23 | 2016-04-06 | Magic Pony Technology Ltd | Training end-to-end video processes |
KR101713197B1 (ko) * | 2015-04-01 | 2017-03-09 | 주식회사 씨케이앤비 | 서버 컴퓨팅 장치 및 이를 이용한 콘텐츠 인식 기반의 영상 검색 시스템 |
US9679431B2 (en) | 2015-04-15 | 2017-06-13 | Bank Of America Corporation | Detecting duplicate deposit items at point of capture |
WO2016168556A1 (en) | 2015-04-17 | 2016-10-20 | Vizio Inscape Technologies, Llc | Systems and methods for reducing data density in large datasets |
US9747516B2 (en) * | 2015-05-12 | 2017-08-29 | Qualcomm Incorporated | Keypoint detection with trackability measurements |
US9613273B2 (en) * | 2015-05-19 | 2017-04-04 | Toyota Motor Engineering & Manufacturing North America, Inc. | Apparatus and method for object tracking |
EP3113069A1 (en) * | 2015-06-30 | 2017-01-04 | Thomson Licensing | Method and apparatus for deriving a feature point based image similarity measure |
EP3113076A1 (en) * | 2015-06-30 | 2017-01-04 | Thomson Licensing | Method and apparatus for deriving an image similarity measure based on repetitive feature points |
WO2017011792A1 (en) | 2015-07-16 | 2017-01-19 | Vizio Inscape Technologies, Llc | Prediction of future views of video segments to optimize system resource utilization |
EP3323245B1 (en) | 2015-07-16 | 2021-08-25 | Inscape Data, Inc. | Detection of common media segments |
US10080062B2 (en) | 2015-07-16 | 2018-09-18 | Inscape Data, Inc. | Optimizing media fingerprint retention to improve system resource utilization |
AU2016291674B2 (en) | 2015-07-16 | 2021-08-26 | Inscape Data, Inc. | Systems and methods for partitioning search indexes for improved efficiency in identifying media segments |
US9754182B2 (en) | 2015-09-02 | 2017-09-05 | Apple Inc. | Detecting keypoints in image data |
US9734587B2 (en) * | 2015-09-30 | 2017-08-15 | Apple Inc. | Long term object tracker |
US10937168B2 (en) | 2015-11-02 | 2021-03-02 | Cognex Corporation | System and method for finding and classifying lines in an image with a vision system |
DE102016120775A1 (de) | 2015-11-02 | 2017-05-04 | Cognex Corporation | System und Verfahren zum Erkennen von Linien in einem Bild mit einem Sichtsystem |
US9975241B2 (en) * | 2015-12-03 | 2018-05-22 | Intel Corporation | Machine object determination based on human interaction |
US9846808B2 (en) * | 2015-12-31 | 2017-12-19 | Adaptive Computation, Llc | Image integration search based on human visual pathway model |
US10861129B2 (en) | 2016-03-08 | 2020-12-08 | Nant Holdings Ip, Llc | Image feature combination for image-based object recognition |
EP3298579B1 (en) | 2016-04-12 | 2021-07-21 | Magic Pony Technology Limited | Visual data processing using energy networks |
GB201607994D0 (en) | 2016-05-06 | 2016-06-22 | Magic Pony Technology Ltd | Encoder pre-analyser |
US10282607B2 (en) | 2016-10-28 | 2019-05-07 | The Nielsen Company (Us), Llc | Reducing scale estimate errors in shelf images |
CN106910210B (zh) * | 2017-03-03 | 2018-09-11 | 百度在线网络技术(北京)有限公司 | 用于生成图像信息的方法和装置 |
US10983984B2 (en) | 2017-04-06 | 2021-04-20 | Inscape Data, Inc. | Systems and methods for improving accuracy of device maps using media viewing data |
IT201700058961A1 (it) * | 2017-05-30 | 2018-11-30 | Artglass S R L | Metodo e sistema di fruizione di un contenuto editoriale in un sito preferibilmente culturale o artistico o paesaggistico o naturalistico o fieristico o espositivo |
US11334086B2 (en) * | 2017-09-27 | 2022-05-17 | Intel Corporation | Autonomous robots and methods of operating the same |
CN109949218B (zh) * | 2017-12-21 | 2023-04-18 | 富士通株式会社 | 图像处理装置和方法 |
KR102092086B1 (ko) | 2018-04-27 | 2020-03-23 | 이석재 | 에어 블라스트 머신 |
KR102184626B1 (ko) | 2018-07-16 | 2020-11-30 | 이석재 | 블라스트머신 주행장치 |
US11238070B1 (en) * | 2018-07-17 | 2022-02-01 | A9.Com, Inc. | Dense cluster filtering |
KR102592450B1 (ko) * | 2018-10-25 | 2023-10-23 | 현대모비스 주식회사 | 자율주행을 위한 영상인식 알고리즘의 성능 강화 장치 및 그 제어 방법 |
TWI703535B (zh) * | 2018-10-25 | 2020-09-01 | 南茂科技股份有限公司 | 邊緣缺陷檢查方法 |
CN111626082A (zh) * | 2019-02-28 | 2020-09-04 | 佳能株式会社 | 检测装置和方法及图像处理装置和系统 |
US11386636B2 (en) | 2019-04-04 | 2022-07-12 | Datalogic Usa, Inc. | Image preprocessing for optical character recognition |
US11012675B2 (en) | 2019-04-16 | 2021-05-18 | At&T Intellectual Property I, L.P. | Automatic selection of viewpoint characteristics and trajectories in volumetric video presentations |
US10970519B2 (en) | 2019-04-16 | 2021-04-06 | At&T Intellectual Property I, L.P. | Validating objects in volumetric video presentations |
US11074697B2 (en) | 2019-04-16 | 2021-07-27 | At&T Intellectual Property I, L.P. | Selecting viewpoints for rendering in volumetric video presentations |
US11153492B2 (en) | 2019-04-16 | 2021-10-19 | At&T Intellectual Property I, L.P. | Selecting spectator viewpoints in volumetric video presentations of live events |
KR102444544B1 (ko) * | 2019-05-24 | 2022-09-19 | 한국전자통신연구원 | 영상의 전처리 방법 및 장치 |
CN110309060B (zh) * | 2019-05-24 | 2021-08-17 | 平安科技(深圳)有限公司 | 识别算法更新的检测方法、装置、存储介质及计算机设备 |
CN110517461B (zh) * | 2019-08-30 | 2022-03-04 | 成都智元汇信息技术股份有限公司 | 一种防止人携带包裹逃避安检的方法 |
CN110879987B (zh) * | 2019-11-21 | 2023-06-09 | 成都东方闻道科技发展有限公司 | 一种识别试题作答内容的方法 |
US11257230B2 (en) | 2020-02-04 | 2022-02-22 | Nio Usa, Inc. | Adaptive feature map anchor pruning |
US11397869B2 (en) * | 2020-03-04 | 2022-07-26 | Zerofox, Inc. | Methods and systems for detecting impersonating social media profiles |
CN111625665B (zh) * | 2020-05-27 | 2023-08-25 | 安徽淘云科技股份有限公司 | 阈值确定和图像检索方法、装置、电子设备和存储介质 |
US11475240B2 (en) * | 2021-03-19 | 2022-10-18 | Apple Inc. | Configurable keypoint descriptor generation |
CN113408569B (zh) * | 2021-04-27 | 2022-07-19 | 中国人民解放军陆军军医大学 | 基于密度聚类的图像配准方法 |
CN113591937B (zh) * | 2021-07-09 | 2023-09-26 | 国家电网有限公司 | 一种基于局部距离编码的电力系统关键节点识别方法 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2004111931A2 (en) | 2003-06-10 | 2004-12-23 | California Institute Of Technology | A system and method for attentional selection |
US7382897B2 (en) | 2004-04-27 | 2008-06-03 | Microsoft Corporation | Multi-image feature matching using multi-scale oriented patches |
US7706603B2 (en) | 2005-04-19 | 2010-04-27 | Siemens Corporation | Fast object detection for augmented reality systems |
US7680748B2 (en) | 2006-02-02 | 2010-03-16 | Honda Motor Co., Ltd. | Creating a model tree using group tokens for identifying objects in an image |
US7949186B2 (en) | 2006-03-15 | 2011-05-24 | Massachusetts Institute Of Technology | Pyramid match kernel and related techniques |
US8150098B2 (en) | 2007-12-20 | 2012-04-03 | Eastman Kodak Company | Grouping images by location |
CN101299217B (zh) * | 2008-06-06 | 2010-09-08 | 北京搜狗科技发展有限公司 | 一种地图信息处理的方法、装置和系统 |
US8144947B2 (en) * | 2008-06-27 | 2012-03-27 | Palo Alto Research Center Incorporated | System and method for finding a picture image in an image collection using localized two-dimensional visual fingerprints |
CN100590658C (zh) * | 2008-07-11 | 2010-02-17 | 北京航空航天大学 | 双向约束的二维物点与像点匹配方法 |
US8254697B2 (en) * | 2009-02-02 | 2012-08-28 | Microsoft Corporation | Scalable near duplicate image search with geometric constraints |
US9635251B2 (en) * | 2010-05-21 | 2017-04-25 | Qualcomm Incorporated | Visual tracking using panoramas on mobile devices |
US8554021B2 (en) * | 2010-10-19 | 2013-10-08 | Palo Alto Research Center Incorporated | Finding similar content in a mixed collection of presentation and rich document content using two-dimensional visual fingerprints |
-
2010
- 2010-12-02 CN CN201080054072.4A patent/CN102763123B/zh not_active Expired - Fee Related
- 2010-12-02 US US12/959,056 patent/US8705876B2/en not_active Expired - Fee Related
- 2010-12-02 WO PCT/US2010/058805 patent/WO2011069021A2/en active Application Filing
- 2010-12-02 JP JP2012542205A patent/JP5384746B2/ja not_active Expired - Fee Related
- 2010-12-02 EP EP10788467A patent/EP2507744A2/en not_active Withdrawn
- 2010-12-02 KR KR1020127017098A patent/KR101420549B1/ko not_active IP Right Cessation
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11650597B2 (en) | 2019-07-09 | 2023-05-16 | Samsung Electronics Co., Ltd. | Electronic apparatus for identifying object through warped image and control method thereof |
Also Published As
Publication number | Publication date |
---|---|
EP2507744A2 (en) | 2012-10-10 |
US20110299770A1 (en) | 2011-12-08 |
KR101420549B1 (ko) | 2014-07-16 |
CN102763123A (zh) | 2012-10-31 |
WO2011069021A3 (en) | 2011-08-18 |
KR20120099111A (ko) | 2012-09-06 |
CN102763123B (zh) | 2015-03-25 |
WO2011069021A2 (en) | 2011-06-09 |
JP2013513167A (ja) | 2013-04-18 |
US8705876B2 (en) | 2014-04-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5384746B2 (ja) | プルーニング機能、画像スケーリング、および、空間制約付き特徴マッチングによる画像認識アルゴリズムの性能の改善 | |
JP5602940B2 (ja) | 事前計算されたスケール空間からのデイジー記述子生成 | |
JP5503018B2 (ja) | 一様なおよび一様でない照明の変化の中での特徴検出を改善するための尺度空間正規化技術 | |
KR101420550B1 (ko) | 이미지 인식을 위한 기술자 패치들의 고속 서브스페이스 투영을 위한 방법, 디바이스 및 컴퓨터-판독가능 저장 매체 | |
JP5940453B2 (ja) | 画像のシーケンス内のオブジェクトのリアルタイム表現のハイブリッド型追跡のための方法、コンピュータプログラム、および装置 | |
US20150029222A1 (en) | Dynamically configuring an image processing function | |
WO2022170844A1 (zh) | 一种视频标注方法、装置、设备及计算机可读存储介质 | |
Psyllos et al. | M-SIFT: A new method for Vehicle Logo Recognition | |
Hao et al. | Efficient 2D-to-3D correspondence filtering for scalable 3D object recognition | |
JP5468824B2 (ja) | 3次元における形状の一致を判定する方法および装置 | |
Patterson et al. | Object detection from large-scale 3d datasets using bottom-up and top-down descriptors | |
CN104520878A (zh) | 提供用于描述对象表示的至少一个特征的特征描述符的方法 | |
CN111507908A (zh) | 图像矫正处理方法、装置、存储介质及计算机设备 | |
CN111046845A (zh) | 活体检测方法、装置及系统 | |
CN114187333A (zh) | 一种图像对齐方法、图像对齐装置及终端设备 | |
Zhao et al. | MOCC: A fast and robust correlation-based method for interest point matching under large scale changes | |
Groeneweg et al. | A fast offline building recognition application on a mobile telephone | |
CN108304838B (zh) | 一种图片信息识别方法及终端 | |
Noury et al. | How to overcome perceptual aliasing in ASIFT? | |
US20210034915A1 (en) | Method and apparatus for object re-identification | |
WO2017042852A1 (en) | Object recognition appratus, object recognition method and storage medium | |
Liang et al. | A panoramic image registration algorithm based on SURF | |
CN110348454B (zh) | 匹配局部图像特征描述符 | |
TWI776668B (zh) | 影像處理方法及影像處理系統 | |
Yamao et al. | A sequential online 3d reconstruction system using dense stereo matching |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130827 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130903 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131002 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |