JP5518856B2 - 改良された画像認識用の支援装置 - Google Patents
改良された画像認識用の支援装置 Download PDFInfo
- Publication number
- JP5518856B2 JP5518856B2 JP2011514083A JP2011514083A JP5518856B2 JP 5518856 B2 JP5518856 B2 JP 5518856B2 JP 2011514083 A JP2011514083 A JP 2011514083A JP 2011514083 A JP2011514083 A JP 2011514083A JP 5518856 B2 JP5518856 B2 JP 5518856B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- dij
- descriptors
- descriptor
- memory
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000013598 vector Substances 0.000 claims description 78
- 238000012545 processing Methods 0.000 claims description 13
- 239000011159 matrix material Substances 0.000 claims description 12
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000005259 measurement Methods 0.000 claims description 5
- 230000006870 function Effects 0.000 claims description 4
- 238000012795 verification Methods 0.000 claims description 2
- 238000009499 grossing Methods 0.000 claims 1
- 238000011524 similarity measure Methods 0.000 claims 1
- 238000000034 method Methods 0.000 description 16
- 238000011002 quantification Methods 0.000 description 15
- 230000000694 effects Effects 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5838—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
- G06V10/751—Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
- G06V10/7515—Shifting the patterns to accommodate for positional errors
Description
- 各セットが画像に対応する、記述子(dij)の複数のセットを格納可能なメモリと、
- 画像の指定領域に関連し、ベクトル型の第1のデータ(xij)、角度型の第2のデータ(aij)、およびスカラ型の第3のデータ(sij)を備える各記述子(dij)と、
- 2つの記述子(dij)の指定を受取可能であり、かつ、これらの記述子の第1のデータの間の比較から、記述子のベクトル(xij)の類似度基準の検証結果を反映するブール変数を設定可能な第1の演算器(operator)と、
- 2つの記述子(dij)の指定を受取可能であり、かつ、両記述子(dij)のそれぞれの第2のデータ(aij)から、回転角度パラメータ(DeltaA)を設定可能な第2の演算器と、
- 2つの記述子(dij)の指定を受取可能であり、かつ、これらの記述子の第3のデータ(sij)から、スケールファクタパラメータ(DeltaS)を設定可能な第3の演算器と、
- 記述子(dij)の第1のセットの指定および第2のセットの指定を受取可能であり、ならびに、第1のセットの記述子(dij)および第2のセットの記述子(dij)により形成される各ペアに対し、そこから類似する記述子のペアのリストを推定するように、第1の演算器を適用するように構成される制御器(controller)と、
- 前記リストの記述子のペアのそれぞれに対し、第2の演算器および第3の演算器を呼出し、ならびに、得られたパラメータの全体をメモリに格納するステップと、
- 前記パラメータのセットへの統計処理からの、記述子(dij)の第1のセットおよび第2のセットにそれぞれ対応する画像間の類似性の推定器(estimator)と
を備えることができる。
- 画像jの関心領域iの特徴ベクトルxijを示す、ベクトル型の第1のデータ、
- 画像jの前記関心領域iの特徴角度aijを示す、スカラ型の第2のデータ、
- 画像jの前記関心領域iの特徴スケールsijを示す、スカラ型の第3のデータ、
- 画像jのこの関心領域iの中心位置cijを示す第4のデータ
をグループ化する。これらの第4のデータは、ベクトル型の第1のデータへの追加分、すなわち第1の追加のデータと考えることもできる。
- メモリの21ビットが、画像(IDk)の識別用に予約される、
- メモリの6ビットが、定量化特徴角度値Aklの格納用に予約される、
- メモリの5ビットが、特徴スケールSklの対数の格納用に予約される、
および
- 64ビットが、バイナリ署名Bklの格納用に予約される。
- 第1、第2、および第3の演算器は、同じ機能性を有する同じ演算器で実施することができる。
- 第1、第2、および第3の格納構造は、同じメモリ3に属するように示されていた。これらの構造のそれぞれは、物理的に異なる、または技術的にさえも異なる装置にわたって、局所化または分配することが可能なことが理解される。例えば、第1のメモリ構造は、ハードディスク上に構成することができ、第2のメモリ構造は、特にそれが転置リストの構造の形式(コンパクトさ)で作成される場合、RAMメモリ内に構成することができる。
- 第1、第2、および第3の演算器は、特に第1の演算器の第2の実施形態では、相互に独立に使用することができる。
- 本発明はまた、画像の認識を支援するための方法と考えることもでき、そのステップは、説明した種々の実施形態の中に見つけられる。これらの方法は、この説明の趣旨に従って生成可能である。
- 処理装置50は、任意のコンピュータ計算手段、特にコンピュータプログラム製品を実行可能なマイクロプロセッサを用いて作製することができる。
2 処理装置
3 メモリ
5 第1の格納構造、第1のメモリ構造
7 第2の格納構造、第2のメモリ構造
9 定量化器
10 特徴づけ装置
11 署名装置
13 第1の演算器
15 第2の演算器
17 第3の演算器
19 質問器
20 第3の格納構造
21 推定器
Claims (21)
- 画像認識用の支援装置であって、
記述子(dij)の複数のセットを格納可能なメモリ(3)を備え、
各セットは画像に対応し、
前記装置は、
前記画像の指定領域に関連し、かつ、ベクトル型の第1のデータ(xij)、角度型の第2のデータ(aij)、およびスカラ型の第3のデータ(sij)を備える各記述子(dij)と、
2つの記述子(dij)の指定を受取可能であり、かつ、これらの記述子の前記第1のデータの間の比較から、前記記述子のベクトル(xij)の類似度基準の検証結果を反映するブール変数を設定可能な第1の演算器(13)と、
2つの記述子(dij)の指定を受取可能であり、かつ、両記述子(dij)の前記第2のそれぞれのデータ(aij)から、回転角度パラメータ(DeltaA)を設定可能な第2の演算器(15)と、
2つの記述子(dij)の指定を受取可能であり、かつ、これらの記述子の前記第3のデータ(sij)から、スケールファクタパラメータ(DeltaS)を設定可能な第3の演算器(17)と、
記述子(dij)の第1および第2のセットの指定を受取可能であり、ならびに、前記第1のセットの記述子(dij)および前記第2のセットの記述子(dij)により形成される各ペアに対して、類似する記述子のペアのリストを推定するように、前記第1の演算器(13)を適用するように構成された制御器(19)と、
前記リストの記述子のペアのそれぞれに対して、前記第2の演算器(15)および前記第3の演算器(17)を呼出し、ならびに、前記得られたパラメータの全体をメモリに格納することと、
前記パラメータのセットへの統計処理からの、記述子(dij)の前記第1のセットおよび前記第2のセットにそれぞれ対応する前記画像間の類似性の推定器(21)と
を備える装置。 - 前記第2の演算器(15)は、両記述子(dij)の唯一のそれぞれの第2のデータ(aij)から、前記回転角度パラメータ(DeltaA)を設定するように構成され、前記第3の演算器(17)は、これらの記述子の唯一の第3のデータ(sij)から、スケールファクタパラメータ(DeltaS)を設定するように構成される、請求項1に記載の装置。
- 前記メモリは、前記記述子(dij)のそれぞれと、前記記述子の前記特徴ベクトルデータ(xij)から、所定の規則に応じて選択される、スカラ型の追加の第1のデータのセットの特定のデータとの間の整合関係をメモリに格納する特定の格納構造(7)を備える、請求項1または2に記載の装置。
- 前記第1の演算器(13)は、前記記述子(dij)に対応する前記特定のデータ(q(xij))の比較に基づいて、少なくとも部分的に指定される前記記述子(dij)の前記第1のデータを比較するように構成される、請求項3に記載の装置。
- 前記特定の格納構造(7)は、前記記述子(dij)のそれぞれ、前記記述子(dij)に対して選択された前記特定のデータ、ならびに前記記述子(dij)の前記第2のデータ(aij)および前記第3のデータ(sij)の少なくとも一部の表現との間の整合関係をメモリに格納するように構成される、請求項3また4に記載の装置。
- 前記第2の演算器(15)または前記第3の演算器(17)の少なくとも1つは、前記特定の格納構造(7)内の前記第2のデータ(aij)または前記第3のデータ(sij)の表現から、前記回転角度パラメータ(DeltaA)または前記スケールファクタパラメータ(DeltaS)を設定するように構成される、請求項5に記載の装置。
- 前記特定の格納構造は、第1の追加のデータのセットの前記特定のデータのそれぞれと、前記特定のデータが選択される前記記述子(dij)のそれぞれの指定データ、または前記記述子のセットの指定データとの間の整合関係をメモリに格納するように構成される、請求項3または6に記載の装置。
- 前記特定の格納構造(7)は、複数のリスト(Li)として構成され、これらのリスト(Li)のそれぞれは、前記第1の追加のデータ(q)のセットの特定のデータ(q)と関連し、かつ、前記指定データをエントリ(Ekl)として含む、請求項7に記載の装置。
- エントリのそれぞれは、前記指定された記述子(dij)の前記第2のデータ(aij)および前記第3のデータ(sij)の少なくとも一部の表現データをさらに含む、請求項8に記載の装置。
- 第1の追加のデータの前記セットは、前記特定の格納構造に対するインデックスを形成する、請求項3から9のいずれか1項に記載の装置。
- 前記得られたパラメータ(DeltaA、DeltaS)は、スケールファクタパラメータ値および回転角度パラメータ値で毎回形成されるペアのセットとして格納され、前記メモリ(3)は、形成されたペアのそれぞれと、前記ペアが設定された前記第2のセットの記述子(dij)の識別子、または前記記述子(dij)のセットの識別子との間の整合関係をさらに格納する、請求項1から10のいずれか1項に記載の装置。
- 前記得られたパラメータは、角度パラメータのセットおよびスケールファクタパラメータのセットとして格納され、前記メモリは、前記角度パラメータのセットおよびスケールファクタパラメータのセットのそれぞれと、前記得られたパラメータが設定された前記第2のセットの記述子の識別子、または前記記述子(dij)のセットの識別子との間の整合関係をさらに格納する、請求項1から11のいずれか1項に記載の装置。
- 前記得られたパラメータは、それぞれ値のクラスと関連づけられ、前記推定器(21)は、これらの値のクラスの母集団への統計処理に基づいて類似度測定結果を設定する、請求項1から12のいずれかに1項に記載の装置。
- 前記統計処理は、前記類似度測定結果を設定する前に、前記値のクラスへの平滑化フィルタの適用を含む、請求項13に記載の装置。
- 前記統計処理は、角度パラメータおよび/またはスケールファクタパラメータの特定の値に対する重みづけ関数の適用を含む、請求項1から14のいずれか1項に記載の装置。
- 前記メモリ3は、前記記述子(dij)のそれぞれの指定と、第1のデータ(xij)から決定された整数値のグループから、前記記述子(dij)に対して選択される整数値(q(xij))との間の整合関係を格納し、前記第1の演算器(13)は、記述子の前記ベクトルの前記類似度基準が、割当てられた整数値の同一性を含むように構成される、請求項1から15のいずれか1項に記載の装置。
- 署名装置を備え、記述子(dij)を受取可能であり、前記記述子(dij)の前記第1のデータから、多次元バイナリ署名型の第4のデータを設定し、前記メモリ(3)は、前記記述子のそれぞれの識別子、または前記記述子のセットの識別子と、前記記述子(dij)のために設定された前記第4のデータとの間の整合関係を維持するように構成される、請求項1から16のいずれか1項に記載の装置。
- 前記リスト(il)の各エントリは、バイナリ署名データをさらに含む、請求項8に関連する請求項17に記載の装置。
- 前記第1の演算器(13)は、両記述子(dij)に対応するバイナリ署名を取得するように構成され、これらのバイナリ署名から距離の測定結果を設定し、前記第1の演算器(13)は、記述子の前記ベクトルの前記類似度基準が、前記得られた距離の測定結果が第1の決定されたしきい値(ht)よりも小さいという事実をさらに含むように構成される、請求項17または18に記載の装置。
- 前記署名装置(11)は、
決定された投影行列(P)から、および前記記述子(dij)のベクトルから、ベクトル型の第5のデータを設定し、
投影ベクトルの成分のそれぞれの値を、決定された第2のしきい値(Tq(xij))と比較し、
ブール変数で形成されるセットをバイナリ署名として設定し、各ブール変数は前記投影ベクトルの成分に対する前記比較の結果を反映するように構成される、請求項17から19のいずれか1項に記載の装置。 - 前記メモリは、前記記述子(dij)のそれぞれと、前記記述子の前記特徴ベクトルデータ(xij)から、所定の規則に応じて選択される、スカラ型の追加の第1のデータのセットの特定のデータとの間の整合関係をメモリに格納する特定の格納構造(7)を備え、前記特定の格納構造(7)内に存在する前記記述子の全体は、転置リストの構造として格納される、請求項1から20のいずれかに記載の装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR0803345A FR2932586B1 (fr) | 2008-06-16 | 2008-06-16 | Dispositif d'aide a la reconnaissance d'images ameliore |
FR0803345 | 2008-06-16 | ||
PCT/FR2009/000702 WO2009153445A1 (fr) | 2008-06-16 | 2009-06-12 | Dispositif d'aide a la reconnaissance d'images ameliore |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011524583A JP2011524583A (ja) | 2011-09-01 |
JP5518856B2 true JP5518856B2 (ja) | 2014-06-11 |
Family
ID=40229959
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011514083A Active JP5518856B2 (ja) | 2008-06-16 | 2009-06-12 | 改良された画像認識用の支援装置 |
Country Status (7)
Country | Link |
---|---|
US (1) | US8687899B2 (ja) |
EP (1) | EP2289009B1 (ja) |
JP (1) | JP5518856B2 (ja) |
CA (1) | CA2727747A1 (ja) |
ES (1) | ES2725787T3 (ja) |
FR (1) | FR2932586B1 (ja) |
WO (1) | WO2009153445A1 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1850270B1 (en) | 2006-04-28 | 2010-06-09 | Toyota Motor Europe NV | Robust interest point detector and descriptor |
ES2384928B1 (es) * | 2010-06-25 | 2013-05-20 | Telefónica, S.A. | Método y sistema para la identificación rápida y robusta de productos específicos en imágenes. |
TWI446276B (zh) * | 2011-09-14 | 2014-07-21 | Ind Tech Res Inst | 影像特徵描述處理裝置及影像特徵描述處理方法 |
US9483642B2 (en) * | 2012-10-30 | 2016-11-01 | Gabriel Kedma | Runtime detection of self-replicating malware |
US20140222474A1 (en) * | 2013-02-04 | 2014-08-07 | Hsc Acquisition, Llc Dba Healthstar Communications | System and method for certifying attendance at a promotional event |
US9697233B2 (en) * | 2014-08-12 | 2017-07-04 | Paypal, Inc. | Image processing and matching |
US10031925B2 (en) * | 2014-10-15 | 2018-07-24 | Thinkcx Technologies, Inc. | Method and system of using image recognition and geolocation signal analysis in the construction of a social media user identity graph |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2001291175A1 (en) * | 2000-09-21 | 2002-04-02 | Md Online Inc. | Medical image processing systems |
JP2003281190A (ja) * | 2002-03-22 | 2003-10-03 | Fumiyoshi Adachi | 汎用データ検索方法 |
-
2008
- 2008-06-16 FR FR0803345A patent/FR2932586B1/fr active Active
-
2009
- 2009-06-12 EP EP09766007.0A patent/EP2289009B1/fr active Active
- 2009-06-12 US US12/999,560 patent/US8687899B2/en active Active
- 2009-06-12 JP JP2011514083A patent/JP5518856B2/ja active Active
- 2009-06-12 ES ES09766007T patent/ES2725787T3/es active Active
- 2009-06-12 WO PCT/FR2009/000702 patent/WO2009153445A1/fr active Application Filing
- 2009-06-12 CA CA2727747A patent/CA2727747A1/fr not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
EP2289009A1 (fr) | 2011-03-02 |
EP2289009B1 (fr) | 2019-02-27 |
ES2725787T3 (es) | 2019-09-27 |
US8687899B2 (en) | 2014-04-01 |
US20110164822A1 (en) | 2011-07-07 |
CA2727747A1 (fr) | 2009-12-23 |
WO2009153445A1 (fr) | 2009-12-23 |
FR2932586A1 (fr) | 2009-12-18 |
JP2011524583A (ja) | 2011-09-01 |
FR2932586B1 (fr) | 2010-08-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Leng et al. | Person re-identification with content and context re-ranking | |
JP5518856B2 (ja) | 改良された画像認識用の支援装置 | |
Chum et al. | Geometric min-hashing: Finding a (thick) needle in a haystack | |
CN110866181B (zh) | 资源推荐的方法、装置及存储介质 | |
Leibe et al. | Efficient clustering and matching for object class recognition. | |
JP4545641B2 (ja) | 類似画像検索方法,類似画像検索システム,類似画像検索プログラム及び記録媒体 | |
US20120221572A1 (en) | Contextual weighting and efficient re-ranking for vocabulary tree based image retrieval | |
US9177226B2 (en) | Object detection in images based on affinity determinations | |
WO2013129580A1 (ja) | 近似最近傍探索装置、近似最近傍探索方法およびそのプログラム | |
Lepsøy et al. | Statistical modelling of outliers for fast visual search | |
Meng et al. | Interactive visual object search through mutual information maximization | |
Pickup et al. | Euclidean-distance-based canonical forms for non-rigid 3D shape retrieval | |
CN111859004A (zh) | 检索图像的获取方法、装置、设备及可读存储介质 | |
CN110083731B (zh) | 图像检索方法、装置、计算机设备及存储介质 | |
Romberg et al. | Bundle min-Hashing: Speeded-up object retrieval | |
WO2015134310A1 (en) | Cross indexing with grouplets | |
JP6017277B2 (ja) | 特徴ベクトルの集合で表されるコンテンツ間の類似度を算出するプログラム、装置及び方法 | |
dos Santos et al. | A signature-based bag of visual words method for image indexing and search | |
Chen et al. | Spatially aware feature selection and weighting for object retrieval | |
Aly et al. | Scaling object recognition: Benchmark of current state of the art techniques | |
Takaishi et al. | Free-form feature classification for finite element meshing based on shape descriptors and machine learning | |
Nguyen et al. | Video instance search via spatial fusion of visual words and object proposals | |
WO2011155288A1 (ja) | データのインデックスの次元削減方法及びそれを利用したデータ検索方法並びに装置 | |
Grebhahn et al. | Challenges in Finding an Appropriate Multi-Dimensional Index Structure with Respect to Specific Use Cases. | |
CN113159211A (zh) | 用于相似图像检索的方法、计算设备和计算机存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120509 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130326 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130625 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20130924 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20131001 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20131025 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140303 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140402 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5518856 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |