JP2018527656A - 画像の高次元特徴の類似性を比較するための方法及びデバイス - Google Patents

画像の高次元特徴の類似性を比較するための方法及びデバイス Download PDF

Info

Publication number
JP2018527656A
JP2018527656A JP2018502395A JP2018502395A JP2018527656A JP 2018527656 A JP2018527656 A JP 2018527656A JP 2018502395 A JP2018502395 A JP 2018502395A JP 2018502395 A JP2018502395 A JP 2018502395A JP 2018527656 A JP2018527656 A JP 2018527656A
Authority
JP
Japan
Prior art keywords
low
dimensional
image
eigenvector
segment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018502395A
Other languages
English (en)
Other versions
JP6544756B2 (ja
Inventor
シードン リン,
シードン リン,
ツヮン モウ,
ツヮン モウ,
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Century Trading Co Ltd
Original Assignee
Beijing Jingdong Century Trading Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Century Trading Co Ltd filed Critical Beijing Jingdong Century Trading Co Ltd
Publication of JP2018527656A publication Critical patent/JP2018527656A/ja
Application granted granted Critical
Publication of JP6544756B2 publication Critical patent/JP6544756B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2255Hash tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/316Indexing structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/53Querying
    • G06F16/532Query formulation, e.g. graphical querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/7715Feature extraction, e.g. by transforming the feature space, e.g. multi-dimensional scaling [MDS]; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Algebra (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Library & Information Science (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本発明は、局所性鋭敏型ハッシュ(LSH)コードに基づく大量画像からの類似性検索において検索速度及び検索精度を改善することができる、画像の高次元特徴の類似性を比較するための方法及びデバイスを提供する。本発明による画像の高次元特徴の類似性を比較するための方法は、LSHアルゴリズムによって画像の抽出された固有ベクトルの次元を低減して、低次元固有ベクトルを取得するステップと、前記低次元固有ベクトルを平均的にセグメント化し、セグメント索引テーブルを確立するステップと、クエリされた画像のセグメント化された低次元固有ベクトルをセグメント索引テーブルから検索して、候補サンプル集合を取得するステップと、クエリされた画像の候補サンプル集合と低次元固有ベクトルとにおけるサンプル間の類似性メトリックを実施するステップとを含む。【選択図】図3

Description

本出願は、コンピュータの技術分野に関し、詳細には、画像の高次元特徴の類似性を比較するための方法及びデバイスに関する。
今日のインターネット環境において、インターネットユーザは、テキスト検索の必要性に加えて、音声、画像及び動画などのマルチメディアコンテンツも検索したいと思っている。画像検索に関しては、ユーザは、自分自身がクエリするために提供した画像に類似した候補画像の集合をインターネットサービスプロバイダが見つけ出すことを期待している。該当するシナリオの例には、ユーザによって提供された商品画像に基づく同じ又は類似のスタイルの商品を推奨する電子商取引企業、ユーザによって提供された風景画像により類似画像を表示する検索サイトなどが含まれる。
従来の画像検索は、手動で指定された画像特徴に基づく類似性メトリックを実施することによって一般に行われる。画像データの意味的に非構造化された特性により、代表的特徴を手動で発見することは困難である。Hintonらによって提案されたニューラルネットワークのための深層学習の技法により、特徴抽出、すなわち、自己学習による、原画像の高次元固有ベクトル空間から低次元固有ベクトル空間への効率的なマッピングが可能となり、それにより、画像フィールドにおける特徴表現の効率が大幅に改善される。
インターネット産業において、サービス会社は、しばしば、大量の画像を保管している。検索結果を第2レベルの応答時間内で取得する必要がある場合、ユーザからの検索の必要性に関しては、大規模な並列計算技術を使用することに加えて、次元縮小、索引作成、及び照合アルゴリズムの速度を増加させることも必要である。局所性鋭敏型ハッシュ(LSH:Locality Sensitive Hash)アルゴリズムは、一種の次元縮小コーディング技法であり、それは生成されたハッシュコードにおいて相対位置を元の固有ベクトル空間に保持することを特徴とし、したがって、画像の迅速検索に使用することができる。
従来技術において、画像検索のためのLSHアルゴリズムは、以下のステップを主に含む。
1.画像のLSHコーディング
画像のLSHコーディングのプロセスを図1に示す。原画像は、RGBチャンネルのn次元ベクトルとして表され、次いで、畳み込みニューラルネットワーク(CNN)によってn次元ベクトルをコード化することにより取得した隠れ層の出力(通常、最後から2番目の層から、最下部から14番目の層までの)は、画像のm次元固有ベクトルと解釈される(次元の典型的な長さは4096である)。次いで、固有ベクトルは、m次元固有ベクトルにLSHベクトル演算の集合を適用した後、k次元(kはmよりもずっと小さい)LSHコードに変換される。この方法によれば、サービス企業は、画像のすべてをそのようなコードに変換し、次いで、その後の画像の類似性検索がそのような画像表現に基づいて行われる。
2.画像の類似性検索
画像の類似性検索のプロセスを図2に示す。まず、クエリするためにユーザによってアップロードされた画像のLSHコード(ベクトルA)が前述のステップ1を通して取得され、次いで、LSHベクトルテーブルにおける各ベクトル(ベクトルB)に対して、ベクトルAとBとの間のハミング距離が計算される。続いて、ベクトルは、計算された距離により昇順でソートされ、最後に、いくつかの最上位ベクトルに対応する原画像が類似性検索の結果としてユーザに返される。
しかし、既存のLSHアルゴリズムを画像検索方法に適用することは、使用の際に以下の不利点を有する。
1.LSHコーディングに基づく類似性検索の速度が、画像の集合が相対的に大きい(例えば、数百万、数千万以上の画像を含む)場合に依然として相対的に遅い。
2.計算速度の適切な観点から、ハミング距離メトリックは、ユークリッド距離メトリック及びマンハッタン距離メトリックなどよりも速いが、その精度はかなり低下し、検索結果は不満足である。
この点から見て、本発明は、画像の高次元特徴の類似性を比較するための方法及びデバイスを提供する。画像のセグメント索引作成及びセグメント検索LSHコードの方法によって、並びにマンハッタン距離を類似性メトリックに適用することによって、検索速度及び検索精度は、LSHコーディングに基づく大量画像からの類似性検索において改善される。
上記の目的を達成するために、本発明の一態様により、画像の高次元特徴の類似性を比較するための方法が提供される。
本発明による画像の高次元特徴の類似性を比較するための方法は、局所性鋭敏型ハッシュ(LSH)アルゴリズムによって画像の抽出された固有ベクトルの次元を低減して、低次元固有ベクトルを取得するステップと、低次元固有ベクトルを平均的にセグメント化し、セグメント索引テーブルを確立するステップと、クエリされた画像のセグメント化された低次元固有ベクトルをセグメント索引テーブルから検索して、候補サンプル集合を取得するステップと、クエリされた画像の低次元固有ベクトルと候補サンプル集合とにおける各サンプル間の類似性メトリックを実施するステップと、を含む。
任意選択で、画像の固有ベクトルは、深層学習技法を使用して構築されたニューラルネットワークを用いて抽出される。
任意選択で、ニューラルネットワークは、畳み込みニューラルネットワークである。
任意選択で、低次元固有ベクトルを平均的にセグメント化するステップの前に、方法は、より小さい検証集合による最適セグメント長を実験的に決定するステップをさらに含む。
任意選択で、低次元固有ベクトルを平均的にセグメント化し、セグメント索引テーブルを確立するステップは、低次元固有ベクトルを平均的にセグメント化し、セグメント化された固有ベクトルを索引項目として使用し、索引項目のそれぞれのフィンガープリントを計算するステップと、セグメント索引テーブルに含まれる所定の数のエントリに最も近い素数を用いてフィンガープリントに対する剰余演算を実施して、索引項目に対するエントリアドレスを取得するステップと、取得したエントリアドレスに応じて低次元固有ベクトルをセグメント索引テーブルに挿入して、セグメント索引テーブルを確立するステップとを含む。
任意選択で、クエリされた画像のセグメント化された低次元固有ベクトルをセグメント索引テーブルから検索して、候補サンプルの集合を取得するステップは、クエリされた画像のセグメント化された低次元固有ベクトルのエントリアドレスにアクセスして、競合集合を取得するステップと、クエリされた画像のセグメント化された低次元固有ベクトルのフィンガープリントと同じフィンガープリントを有する、競合集合のノードに対応する低次元固有ベクトルを候補集合として抽出するステップと、それぞれのセグメント検索によって取得した候補集合を組み合わせ、重複した低次元固有ベクトルをそれから除去して、候補サンプル集合を取得するステップとを含む。
任意選択で、クエリされた画像の低次元固有ベクトルと候補サンプル集合とにおける各サンプル間の類似性メトリックを実施するステップは、クエリされた画像の候補サンプル集合と低次元固有ベクトルとにおける各サンプル間のマンハッタン距離のスコアを計算するステップと、スコアを昇順によりソートし、クエリされた画像の類似画像として所定の数の最上位スコアを有するサンプルに対応する画像を選ぶステップとを含む。
本発明の別の態様によれば、画像の高次元特徴の類似性を比較するためのデバイスが提供される。
本発明による、画像の高次元特徴の類似性を比較するためのデバイスが、LSHアルゴリズムによって画像の抽出された固有ベクトルの次元を低減して、低次元固有ベクトルを取得するための特徴次元低減モジュールと、低次元固有ベクトルを平均的にセグメント化し、セグメント索引テーブルを確立するためのセグメント索引作成モジュールと、クエリされた画像のセグメント化された低次元固有ベクトルをセグメント索引テーブルから検索して、候補サンプル集合を取得するための類似性クエリモジュールと、クエリされた画像の低次元固有ベクトルと候補サンプル集合とにおける各サンプル間の類似性メトリックを実施するための比較メトリックモジュールとを備える。
任意選択で、画像の固有ベクトルは、深層学習技法を使用して構築されたニューラルネットワークを用いて抽出される。
任意選択で、ニューラルネットワークは、畳み込みニューラルネットワークである。
任意選択で、低次元固有ベクトルを平均的にセグメント化するステップの前に、セグメント索引作成モジュールは、さらに、より小さい検証集合により最適セグメント長を実験的に決定する。
任意選択で、セグメント索引作成モジュールは、さらに、低次元固有ベクトルを平均的にセグメント化し、セグメント化された固有ベクトルを索引項目として使用し、索引項目のそれぞれのフィンガープリントを計算することと、セグメント索引テーブルに含まれる所定の数のエントリに最も近い素数を用いてフィンガープリントに対する剰余演算を実施して、索引項目に対するエントリアドレスを取得することと、取得したエントリアドレスに応じて低次元固有ベクトルをセグメント索引テーブルに挿入して、セグメント索引テーブルを確立することとを行う。
任意選択で、類似性クエリモジュールは、さらに、クエリされた画像のセグメント化された低次元固有ベクトルのエントリアドレスにアクセスして、競合集合を取得することと、クエリされた画像のセグメント化された低次元固有ベクトルのフィンガープリントと同じフィンガープリントを有する、競合集合のノードに対応する低次元固有ベクトルを候補集合として抽出することと、それぞれのセグメント検索によって取得した候補集合を組み合わせ、重複した低次元固有ベクトルをそれから除去して、候補サンプル集合を取得することとを行う。
任意選択で、比較メトリックモジュールは、さらに、クエリされた画像の低次元固有ベクトルと候補サンプル集合とにおける各サンプル間のマンハッタン距離のスコアを計算することと、スコアを昇順によりソートし、クエリされた画像の類似画像として所定の数の最上位スコアを有するサンプルに対応する画像を選ぶこととを行う。
本発明の技術的解決策によれば、画像のLSHコードの次元低減された固有ベクトルに対するセグメント索引を確立することによって、検索速度を速めて、検索効率を改善することができる。画像の類似性検索において、従来のハミング距離メトリックの代わりにマンハッタン距離メトリックを使用することによって、LSHコードに含まれる定量化可能な距離情報を十分に利用して、セグメント検索における検索精度を改善することができる。
図面は、本発明をよりよく理解するためであり、本発明の不適切な限定を構成しない。
従来技術における画像のLSHコードを生成するプロセスの概略図である。 従来技術における画像類似性検索プロセスの概略図である。 本発明の実施形態による、画像の高次元特徴の類似性を比較するための方法の主要ステップの概略図である。 本発明の実装形態による、画像のLSHコードを生成し、セグメント索引を確立するプロセスの概略図である。 本発明の実装形態による、セグメントハッシュ索引テーブルの構造図である。 本発明の実装形態による、セグメント索引に基づく画像類似性検索プロセスの概略図である。 本発明の実施形態による、画像の高次元特徴の類似性を比較するためのデバイスの主要モジュールの概略図である。
好ましい実施形態
本発明の例示的な実施形態を添付の図面を参照して以下に説明するが、添付の図面には、本発明の実施形態の様々な詳細が理解を容易にするために含まれており、単に例示的であると考えるべきである。したがって、当業者は、本発明の範囲及び精神から逸脱することなく様々な変更及び修正を本明細書に説明する実施形態に加えることができることを理解する。また、明確及び簡潔にするために、周知の機能及び構成の説明は以下の説明から省略される。
本発明の実装形態を図3〜図6を参照して以下に説明する。図3は、本発明の実施形態による、画像の高次元特徴の類似性を比較するための方法の主要ステップの概略図である。図3に示すように、本発明による、画像の高次元特徴の類似性を比較するための方法は、以下のステップS31〜S34を含む。
ステップS31:LSHアルゴリズムによって画像の抽出された固有ベクトルの次元を低減して、低次元固有ベクトルを取得するステップ。このステップにおける画像の固有ベクトルは、深層学習技法を使用して構築されたニューラルネットワークを用いて抽出してもよい。一般に、使用されるニューラルネットワークは、畳み込みニューラルネットワークCNNである。図4に示すように、本発明の実装形態による、画像のLSHコードを生成し、セグメント索引を確立するプロセスの概略図を次に参照すると、原画像が畳み込みニューラルネットワークCNNを通して抽出する特徴を受けて、CNNのm次元固有ベクトルを取得する。続いて、m次元固有ベクトルは、LSHを通して次元低減を受けて、より低い(例えば、mよりもずっと小さいk)次元の固有ベクトルのLSHコードを取得する。
ステップS32:低次元固有ベクトルを平均的にセグメント化し、セグメント索引テーブルを確立するステップ。LSHコードを平均的にセグメント化し、セグメント索引を確立するステップの前に、最適セグメント長をより小さい検証集合により実験的に決定してもよい、したがって、本発明の技術的解決策は、検索速度と検索精度との相対的に満足すべき妥協点を取得する。続いて、LSHコードの低次元ベクトルが、決定された最適セグメント長dにより、平均的にセグメント化される。例として、1001と番号付けされたサンプルのLSHコードは、
[0,1,1,0,0,3,1,0,1,0,2,1,0,1,2,1,1,0,1,−1,2,1,0,1,1,1,0,0]
である。
最適セグメント長dが7である場合、それは4つのセグメントに分割する必要があり、取得したセグメント索引項目は、
1[0,1,1,0,0,3,1],2[0,1,0,2,1,0,1],3[2,1,1,0,1,−1,2],4[1,0,1,1,1,0,0]
である。各セグメントの前の数は、最初のセグメントが1であり、2番目のセグメントが2であるなどの位置決め番号を表す。
LSHコードの低次元固有ベクトルが平均的にセグメント化された後、セグメントハッシュ索引テーブルが低次元固有ベクトルのためにメモリ内に確立される。主要ステップは以下のようにまとめることができる。
ステップS321:低次元固有ベクトルを平均的にセグメント化し、セグメント化された固有ベクトルを索引項目として使用し、索引項目のそれぞれのフィンガープリントを計算するステップ、
ステップS322:セグメント索引テーブルに含まれる所定の数のエントリに最も近い素数を用いてフィンガープリントに対する剰余演算を実施して、索引項目に対するエントリアドレスを取得するステップ、及び
ステップS323:取得したエントリアドレスに応じて低次元固有ベクトルをセグメント索引テーブルに挿入して、セグメント索引テーブルを確立するステップ。
図5に示す、本発明の実装形態による、セグメント化されたハッシュ索引テーブルの構造図を参照すると、前述の1001と番号付けされたサンプルが、説明のための例として挙げられる。サンプルが4つのセグメントに分割された後、セグメント化された固有ベクトルは、索引項目として使用され、各セグメント索引項目のフィンガープリントが計算される。例えば、各索引項目のフィンガープリントは、メッセージダイジェストアルゴリズムの第5世代(すなわち、MD5関数)を用いて計算することによって取得することができる。次いで、セグメント索引テーブルに含まれる所定の数のエントリに最も近い素数を用いてこれらのフィンガープリントに対する剰余演算を実施して、索引項目のそれぞれに対するエントリアドレスを取得する。セグメント索引テーブルのエントリNの数は、必要に応じて、例えば、マシンのメモリのサイズ又は機能を実現するための要件などにより設定してもよい。実際には、セグメント索引項目の数が大きいので、索引項目のエントリアドレスは、重複することがあり、これは一般に「主要競合」と呼ばれる。主要競合を有する索引項目は、競合集合の連結リストの形で保存される。最後に、LSHコードの低次元固有ベクトルは、取得したエントリアドレスに応じてセグメント索引テーブルに挿入されて、セグメント索引テーブルを確立する。
上記のステップS31及びS32を通して、本発明の実装形態による、画像のLSHコードを生成し、セグメント索引を確立するプロセスを実施することができる。セグメント索引に基づく画像類似性検索プロセスを添付の図面を参照して以下に説明する。
ステップS33:クエリされた画像のセグメント化された低次元固有ベクトルをセグメント索引テーブルから検索して、候補サンプル集合を取得するステップ。類似画像検索プロセスは、以下のステップに基づいて実装してもよい。
ステップS331:クエリされた画像のセグメント化された低次元固有ベクトルのエントリアドレスにアクセスして、競合集合を取得するステップ、
ステップS332:クエリされた画像のセグメント化された低次元固有ベクトルのフィンガープリントと同じフィンガープリントを有する、競合集合のノードに対応する低次元固有ベクトルを候補集合として抽出するステップ、及び
ステップS333:セグメント検索でそれぞれ検索することによって取得した候補集合を組み合わせ、重複した低次元固有ベクトルをそれから除去して、候補サンプル集合を取得するステップ。
図5に示すセグメントハッシュ索引テーブルの構造を参照すると、候補サンプル集合に対する検索するプロセスが、前述の1001と番号付けされたサンプルを例として挙げることによって紹介される。例えば、ステップS331では、まず、各セグメント索引項目のフィンガープリントを計算して、索引テーブル内で各セグメント索引項目のエントリアドレスSを見つけ、競合集合の対応する連結リストをエントリアドレスSにアクセスすることによって取得する。競合集合の連結リスト内の各ノードの右向きのポインタは、競合集合の連結リストを示すのに使用され、下向きのポインタは、候補集合の連結リストを示すのに使用される。いわゆる候補集合は、ノードのセグメント索引項目に対応する候補サンプル集合用であり、それは特定の距離比較を受け、ノードの「セグメントLSHコード」(セグメント索引項目)のフィンガープリントは、あるクエリされた画像のセグメント索引項目のフィンガープリントと同じである。本明細書における候補サンプルは、対応する低次元固有ベクトルである。ステップS332で述べたように、候補集合が抽出される。最後に、ステップS333で述べたように、すべてのセグメント検索が完了した後、すべての取得した候補集合は組み合わされ、重複した低次元固有ベクトルは、距離比較のための候補サンプル集合を最終的に取得するために除去される。
ステップS34:クエリされた画像の低次元固有ベクトルと候補サンプル集合とにおける各サンプル間の類似性メトリックを実施するステップ。類似性メトリックにおいて、まず、候補サンプル集合内の各サンプル間のマンハッタン距離のスコア及びクエリされた画像の低次元固有ベクトルが計算され、スコアは昇順によりソートされ、所定の数の最上位スコアを有するサンプルに対応する画像が、クエリされた画像の類似画像として選ばれる。
マンハッタン距離原理によれば、スコアが小さければ小さいほど、類似性が高くなる。したがって、計算されたマンハッタン距離スコアに基づいて、類似性を比較し、ソートすることができる。実際には、表示される類似画像の数は、適用例の必要性に応じてあらかじめ設定してもよいし、又はユーザ自身によって選択してもよい。
図6に示す、本発明の実装形態による、セグメント索引に基づく画像類似性検索のプロセスは、上記のステップS33及びステップS34を通して実装することができる。すなわち、クエリされた画像の低次元固有ベクトルと、セグメントLSHコードのベクトル集合の各1つとの類似性は、それぞれセグメント索引及びマンハッタン距離に基づいて判別される。最後に、類似のLSHコードを有するレコードの集合が、対応する類似画像を得るために取得される。
本発明の技術的解決策は、上記のステップS31〜S34を通して実装することができる。実験を通して、100万の画像の集合に関しては、512ビットのLSHコードが、畳み込みニューラルネットワークの最下部から3番目の層の固有ベクトルから取得される。画像類似性検索に関して24ビットのセグメント長dが選ばれ、索引が確立された場合、検索速度は、セグメントなしの直接一対比較よりも約1000倍速い。すなわち、セグメント索引を用いた検索速度は、元のLSHコードに直接基づく比較に対して大幅に改善されている。さらに、LSHコードが定量化可能な距離情報を含むので、マンハッタン距離が類似性メトリックに使用されるとき、距離情報を十分に利用することができるが、その一方で、ハミング距離は、桁の均等性を比較するのより適切である。したがって、マンハッタン距離に基づく類似性メトリックの検索精度は、ハミング距離に基づく類似性メトリックの検索精度よりも高い。数多くの実験データがその検索精度が約5%高いことを示している。
図7は、本発明の実施形態による、画像の高次元特徴の類似性を比較するためのデバイスの主要モジュールの概略図である。図7に示すように、本発明の実施形態における画像の高次元特徴の類似性を比較するためのデバイス70は、特徴次元低減モジュール71と、セグメント索引作成モジュール72と、類似性クエリモジュール73と、比較メトリックモジュール74とを主に備える。
特徴次元低減モジュール71は、LSHアルゴリズムによって画像の抽出された固有ベクトルの次元を低減して、低次元固有ベクトルを取得する。
セグメント索引作成モジュール72は、低次元固有ベクトルを平均的にセグメント化し、セグメント索引テーブルを確立する。低次元固有ベクトルを平均的にセグメント化するステップの前に、セグメント索引作成モジュール72は、さらに、より小さい検証集合による最適セグメント長を実験的に決定する。
セグメント索引作成モジュール72は、さらに、低次元固有ベクトルを平均的にセグメント化し、セグメント化された固有ベクトルを索引項目として使用し、索引項目のそれぞれのフィンガープリントを計算することと、セグメント索引テーブルに含まれる所定の数のエントリに最も近い素数を用いてフィンガープリントに対する剰余演算を実施して、索引項目に対するエントリアドレスを取得することと、取得したエントリアドレスに応じて低次元固有ベクトルをセグメント索引テーブルに挿入して、セグメント索引テーブルを確立することとを行う。
類似性クエリモジュール73は、クエリされた画像のセグメント化された低次元固有ベクトルをセグメント索引テーブルから検索して、候補サンプル集合を取得する。
類似性クエリモジュール73は、さらに、クエリされた画像のセグメント化された低次元固有ベクトルのエントリアドレスにアクセスして、競合集合を取得することと、クエリされた画像のセグメント化された低次元固有ベクトルのフィンガープリントと同じフィンガープリントを候補集合として有する競合集合のノードに対応する低次元固有ベクトルを抽出することと、それぞれのセグメント検索によって取得した候補集合を組み合わせ、重複した低次元固有ベクトルをそれから除去して、候補サンプル集合を取得することとを行う。
比較メトリックモジュール74は、クエリされた画像の低次元固有ベクトルと候補サンプル集合とにおける各サンプル間の類似性メトリックを実施する。
比較メトリックモジュール74は、さらに、クエリされた画像の候補サンプル集合と低次元固有ベクトルとにおける各サンプル間のマンハッタン距離のスコアを計算することと、スコアを昇順によりソートし、クエリされた画像の類似画像として所定の数の最上位スコアを有するサンプルに対応する画像を選ぶこととを行う。
本発明の実施形態の技術的解決策によれば、画像のLSHコードの次元低減された固有ベクトルのセグメント索引を確立することによって、検索速度を速めて、検索効率を改善することができる。画像の類似性検索において、従来のハミング距離メトリックの代わりにマンハッタン距離メトリックを使用することによって、LSHコードに含まれる定量化可能な距離情報を十分に利用して、セグメント検索における検索精度を改善することができる。
さらに、本発明の技術的解決策におけるセグメント索引を確立するプロセスは、1つのマシンで実施されることに限定しなくてもよく、分散スケジューリングシステムにおいて並列に実行してもよい。このように、より大きな規模におけるデータを処理することができる。
上記の具体的な実装形態は、本発明の保護範囲に対するいかなる限定も構成しない。当業者は、様々な変更、組合せ、部分的組合せ、及び改変を設計要件及び他の要因に応じて行ってよいことを理解するはずである。本発明の精神及び原理内で行われる任意の変更、同等の交換、改善などは、本発明の保護範囲に含めるべきである。

Claims (14)

  1. 画像の高次元特徴の類似性を比較するための方法において、
    局所性鋭敏型ハッシュ(LSH)アルゴリズムによって前記画像の抽出された固有ベクトルの次元を低減して、低次元固有ベクトルを取得するステップと、
    前記低次元固有ベクトルを平均的にセグメント化し、セグメント索引テーブルを確立するステップと、
    クエリされた画像の前記セグメント化された低次元固有ベクトルを前記セグメント索引テーブルから検索して、候補サンプル集合を取得するステップと、
    前記クエリされた画像の前記低次元固有ベクトルと前記候補サンプル集合とにおける各サンプル間の類似性メトリックを実施するステップと、
    を含むことを特徴とする、方法。
  2. 前記画像の固有ベクトルが、深層学習技法を使用して構築されたニューラルネットワークを用いて抽出されることを特徴とする、請求項1に記載の方法。
  3. 前記ニューラルネットワークが、畳み込みニューラルネットワークであることを特徴とする、請求項2に記載の方法。
  4. 前記低次元固有ベクトルを平均的にセグメント化するステップの前に、
    より小さい検証集合により最適セグメント長を実験的に決定するステップをさらに含むことを特徴とする、請求項1に記載の方法。
  5. 前記低次元固有ベクトルを平均的にセグメント化し、セグメント索引テーブルを確立する前記ステップが、
    前記低次元固有ベクトルを平均的にセグメント化し、前記セグメント化された固有ベクトルを索引項目として使用し、前記索引項目のそれぞれのフィンガープリントを計算するステップと、
    前記セグメント索引テーブルに含まれる所定の数のエントリに最も近い素数を用いて前記フィンガープリントに対する剰余演算を実施して、前記索引項目に対するエントリアドレスを取得するステップと、
    前記取得したエントリアドレスに応じて前記低次元固有ベクトルを前記セグメント索引テーブルに挿入して、前記セグメント索引テーブルを確立するステップと、
    を含むことを特徴とする、請求項1に記載の方法。
  6. クエリされた画像の前記セグメント化された低次元固有ベクトルを前記セグメント索引テーブルから検索して、候補サンプル集合を取得する前記ステップが、
    前記クエリされた画像の前記セグメント化された低次元固有ベクトルのエントリアドレスにアクセスして、競合集合を取得するステップと、
    前記クエリされた画像の前記セグメント化された低次元固有ベクトルのフィンガープリントと同じフィンガープリントを有する、前記競合集合のノードに対応する前記低次元固有ベクトルを候補集合として抽出するステップと、
    それぞれのセグメント検索によって取得した前記候補集合を組み合わせ、重複した低次元固有ベクトルをそれから除去して、候補サンプル集合を取得するステップと、
    を含むことを特徴とする、請求項1に記載の方法。
  7. 前記クエリされた画像の前記低次元固有ベクトルと前記候補サンプル集合とにおける各サンプル間の類似性メトリックを実施する前記ステップが、
    前記クエリされた画像の前記低次元固有ベクトルと前記候補サンプル集合とにおける各サンプル間のマンハッタン距離のスコアを計算するステップと、
    前記スコアを昇順によりソートし、前記クエリされた画像の類似画像として所定の数の最上位スコアを有する前記サンプルに対応する画像を選ぶステップと、
    を含むことを特徴とする、請求項1に記載の方法。
  8. 画像の高次元特徴の類似性を比較するためのデバイスにおいて、
    LSHアルゴリズムによって前記画像の抽出された固有ベクトルの次元を低減して、低次元固有ベクトルを取得するための特徴次元低減モジュールと、
    前記低次元固有ベクトルを平均的にセグメント化し、セグメント索引テーブルを確立するためのセグメント索引作成モジュールと、
    クエリされた画像の前記セグメント化された低次元固有ベクトルを前記セグメント索引テーブルから検索して、候補サンプル集合を取得するための類似性クエリモジュールと、
    前記クエリされた画像の前記低次元固有ベクトルと前記候補サンプル集合とにおける各サンプル間の類似性メトリックを実施するための比較メトリックモジュールとを含むことを特徴する、デバイス。
  9. 前記画像の固有ベクトルが、深層学習技法を使用して構築されたニューラルネットワークを用いて抽出されることを特徴とする、請求項8に記載のデバイス。
  10. 前記ニューラルネットワークが、畳み込みニューラルネットワークであることを特徴とする、請求項9に記載のデバイス。
  11. 前記低次元固有ベクトルを平均的にセグメント化するステップの前に、前記セグメント索引作成モジュールが、さらに、
    より小さい検証集合により最適セグメント長を実験的に決定することを特徴とする、請求項8に記載のデバイス。
  12. 前記セグメント索引作成モジュールが、さらに、
    前記低次元固有ベクトルを平均的にセグメント化し、前記セグメント化された固有ベクトルを索引項目として使用し、前記索引項目のそれぞれのフィンガープリントを計算することと、
    前記セグメント索引テーブルに含まれる所定の数のエントリに最も近い素数を用いて前記フィンガープリントに対する剰余演算を実施して、前記索引項目に対するエントリアドレスを取得することと、
    前記取得したエントリアドレスに応じて前記低次元固有ベクトルを前記セグメント索引テーブルに挿入して、前記セグメント索引テーブルを確立することと、
    を行うことを特徴とする、請求項8に記載のデバイス。
  13. 前記類似性クエリモジュールが、さらに、
    前記クエリされた画像の前記セグメント化された低次元固有ベクトルのエントリアドレスにアクセスして、競合集合を取得することと、
    前記クエリされた画像の前記セグメント化された低次元固有ベクトルのフィンガープリントと同じフィンガープリントを有する、前記競合集合のノードに対応する前記低次元固有ベクトルを候補集合として抽出することと、
    それぞれのセグメント検索によって取得した前記候補集合を組み合わせ、重複した低次元固有ベクトルをそれから除去して、候補サンプル集合を取得することと、
    を行うことを特徴とする、請求項8に記載のデバイス。
  14. 前記比較メトリックモジュールが、さらに、
    前記クエリされた画像の前記低次元固有ベクトルと前記候補サンプル集合とにおける各サンプル間のマンハッタン距離のスコアを計算することと、
    前記スコアを昇順によりソートし、前記クエリされた画像の類似画像として所定の数の最上位スコアを有する前記サンプルに対応する画像を選ぶことと、
    を行うことを特徴とする、請求項8に記載のデバイス。
JP2018502395A 2015-07-23 2016-07-13 画像の高次元特徴の類似性を比較するための方法及びデバイス Active JP6544756B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201510436176.6A CN105095435A (zh) 2015-07-23 2015-07-23 一种图像高维特征的相似比较方法及装置
CN201510436176.6 2015-07-23
PCT/CN2016/089866 WO2017012491A1 (zh) 2015-07-23 2016-07-13 一种图像高维特征的相似比较方法及装置

Publications (2)

Publication Number Publication Date
JP2018527656A true JP2018527656A (ja) 2018-09-20
JP6544756B2 JP6544756B2 (ja) 2019-07-17

Family

ID=54575872

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018502395A Active JP6544756B2 (ja) 2015-07-23 2016-07-13 画像の高次元特徴の類似性を比較するための方法及びデバイス

Country Status (5)

Country Link
US (1) US11048966B2 (ja)
JP (1) JP6544756B2 (ja)
CN (1) CN105095435A (ja)
RU (1) RU2686590C1 (ja)
WO (1) WO2017012491A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022134143A (ja) * 2021-03-03 2022-09-15 三菱電機インフォメーションシステムズ株式会社 検知装置、検知方法、検知プログラム及び検知システム

Families Citing this family (55)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105095435A (zh) 2015-07-23 2015-11-25 北京京东尚科信息技术有限公司 一种图像高维特征的相似比较方法及装置
CN105512273A (zh) * 2015-12-03 2016-04-20 中山大学 一种基于可变长深度哈希学习的图像检索方法
CN105721933A (zh) * 2016-03-23 2016-06-29 Tcl集团股份有限公司 广告视频信息库的创建方法、广告视频识别方法及装置
CN105844667A (zh) * 2016-03-25 2016-08-10 中国矿业大学 一种紧凑颜色编码的结构化目标跟踪方法
CN107423309A (zh) * 2016-06-01 2017-12-01 国家计算机网络与信息安全管理中心 基于模糊哈希算法的海量互联网相似图片检测系统及方法
CN106227851B (zh) * 2016-07-29 2019-10-01 汤一平 基于深度卷积神经网络的分层深度搜索的图像检索方法
CN108629345B (zh) 2017-03-17 2021-07-30 北京京东尚科信息技术有限公司 高维图像特征匹配方法和装置
CN108629233A (zh) 2017-03-20 2018-10-09 华为技术有限公司 一种行人检索方法及装置
CN107220325A (zh) * 2017-05-22 2017-09-29 华中科技大学 一种基于卷积神经网络的app相似图标检索方法和系统
CN107273471A (zh) * 2017-06-07 2017-10-20 国网上海市电力公司 一种基于Geohash的二元电力时序数据索引构建方法
CN110019905B (zh) * 2017-10-13 2022-02-01 北京京东尚科信息技术有限公司 信息输出方法和装置
CN108876864B (zh) * 2017-11-03 2022-03-08 北京旷视科技有限公司 图像编码、解码方法、装置、电子设备及计算机可读介质
CN107992892A (zh) * 2017-12-05 2018-05-04 奕响(大连)科技有限公司 一种像素灰度图片相似判定方法
CN108038436A (zh) * 2017-12-05 2018-05-15 奕响(大连)科技有限公司 一种局部像素灰度图片相似判定方法
CN108021693A (zh) * 2017-12-18 2018-05-11 北京奇艺世纪科技有限公司 一种图像检索方法和装置
WO2019140548A1 (zh) * 2018-01-16 2019-07-25 深圳中兴力维技术有限公司 海量特征向量数据的相似检索方法及设备、存储介质
CN108959441A (zh) * 2018-06-13 2018-12-07 新华智云科技有限公司 一种基于局部敏感哈希的近相似快速查找方法
CN109271545B (zh) * 2018-08-02 2022-06-03 深圳市商汤科技有限公司 一种特征检索方法及装置、存储介质和计算机设备
CN109165307B (zh) * 2018-09-19 2021-02-02 腾讯科技(深圳)有限公司 一种特征检索方法、装置和存储介质
CN111126102A (zh) * 2018-10-30 2020-05-08 富士通株式会社 人员搜索方法、装置及图像处理设备
CN110149529B (zh) * 2018-11-01 2021-05-28 腾讯科技(深圳)有限公司 媒体信息的处理方法、服务器及存储介质
CN109543057A (zh) * 2018-11-20 2019-03-29 广州逗号智能零售有限公司 基于智能收银台的商品识别方法、装置、设备及存储介质
CN109582674B (zh) * 2018-11-28 2023-12-22 亚信科技(南京)有限公司 一种数据存储方法及系统
CN109753576A (zh) * 2018-12-25 2019-05-14 上海七印信息科技有限公司 一种相似图像检索方法
CN111460088A (zh) * 2019-01-22 2020-07-28 阿里巴巴集团控股有限公司 相似文本的检索方法、装置和系统
US10810726B2 (en) 2019-01-30 2020-10-20 Walmart Apollo, Llc Systems and methods for detecting content in images using neural network architectures
CN111506756B (zh) * 2019-01-30 2024-05-17 北京京东尚科信息技术有限公司 相似图片的查找方法及系统、电子设备、存储介质
US10922584B2 (en) 2019-01-30 2021-02-16 Walmart Apollo, Llc Systems, methods, and techniques for training neural networks and utilizing the neural networks to detect non-compliant content
CN110059634B (zh) * 2019-04-19 2023-04-18 山东博昂信息科技有限公司 一种大场景人脸抓拍方法
CN110209895B (zh) * 2019-06-06 2023-09-05 创新先进技术有限公司 向量检索方法、装置和设备
KR20210033774A (ko) 2019-09-19 2021-03-29 삼성전자주식회사 이미지 분석 방법 및 이를 수행하는 전자 장치
CN110795432B (zh) * 2019-10-29 2024-08-30 腾讯云计算(北京)有限责任公司 一种特征数据的检索方法、装置及存储介质
CN111143597B (zh) * 2019-12-13 2023-06-20 浙江大华技术股份有限公司 图像检索方法、终端及存储装置
CN111008301B (zh) * 2019-12-19 2023-08-15 新华智云科技有限公司 一种以图搜视频的方法
CN111191058B (zh) * 2019-12-27 2023-08-29 青岛海洋科技中心 一种图片检索方法
US11758069B2 (en) 2020-01-27 2023-09-12 Walmart Apollo, Llc Systems and methods for identifying non-compliant images using neural network architectures
CN111325245B (zh) * 2020-02-05 2023-10-17 腾讯科技(深圳)有限公司 重复图像识别方法、装置、电子设备及计算机可读存储介质
CN111324760B (zh) * 2020-02-19 2023-09-26 创优数字科技(广东)有限公司 一种图像检索方法及装置
CN111581413B (zh) * 2020-04-03 2023-02-28 北京联合大学 一种面向高维图像数据检索的数据过滤方法及系统
CN111738194B (zh) * 2020-06-29 2024-02-02 深圳力维智联技术有限公司 一种用于人脸图像相似性的评价方法和装置
CN111737586B (zh) * 2020-08-19 2020-12-04 腾讯科技(深圳)有限公司 信息推荐方法、装置、设备及计算机可读存储介质
CN112100412B (zh) * 2020-09-01 2024-04-12 深圳市欢太科技有限公司 图片检索方法、装置、计算机设备和存储介质
CN112000940B (zh) * 2020-09-11 2022-07-12 支付宝(杭州)信息技术有限公司 一种隐私保护下的用户识别方法、装置以及设备
CN112307248B (zh) * 2020-11-26 2023-11-03 国网数字科技控股有限公司 一种图像检索方法及装置
CN112417381B (zh) * 2020-12-11 2021-06-22 中国搜索信息科技股份有限公司 应用于图像版权保护的快速定位侵权图像的方法及装置
CN113127515A (zh) * 2021-04-12 2021-07-16 中国电力科学研究院有限公司 面向电网的调控数据高速缓存方法、装置、计算机设备和存储介质
CN113436188B (zh) * 2021-07-28 2023-02-03 北京计算机技术及应用研究所 一种利用卷积计算图像哈希值的方法
CN114595350B (zh) * 2021-12-08 2024-04-26 拓尔思信息技术股份有限公司 一种百亿级图像快速搜索的方法
CN114445811B (zh) * 2022-01-30 2024-10-01 北京百度网讯科技有限公司 一种图像处理方法、装置及电子设备
CN114795468B (zh) * 2022-04-19 2022-11-15 首都医科大学附属北京天坛医院 一种血管内治疗的术中导航方法及其系统
CN114943090B (zh) * 2022-07-22 2022-11-22 图灵人工智能研究院(南京)有限公司 一种基于同态加密大规模人脸库隐匿查询的方法
CN114978783B (zh) * 2022-08-02 2022-11-11 暗链科技(深圳)有限公司 零知识身份验证方法、验证客户端、用户客户端及系统
CN115357747B (zh) * 2022-10-18 2024-03-26 山东建筑大学 一种基于序数哈希的图像检索方法及系统
CN117390013A (zh) * 2023-09-12 2024-01-12 博瀚智能(深圳)有限公司 数据存储方法、检索方法、系统、设备及存储介质
CN117938591B (zh) * 2024-01-31 2024-09-06 中南大学 一种低复杂度单载波时域均衡方法与装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103345496A (zh) * 2013-06-28 2013-10-09 新浪网技术(中国)有限公司 多媒体信息检索方法和系统
CN103440292A (zh) * 2013-08-16 2013-12-11 新浪网技术(中国)有限公司 基于比特向量的多媒体信息检索方法和系统
JP2015111339A (ja) * 2013-12-06 2015-06-18 株式会社デンソーアイティーラボラトリ 画像検索システム、画像検索装置、検索サーバ装置、画像検索方法、及び画像検索プログラム

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7353224B2 (en) * 2001-12-04 2008-04-01 Hewlett-Packard Development Company, L.P. System and method for efficiently finding near-similar images in massive databases
US20070276733A1 (en) * 2004-06-23 2007-11-29 Frank Geshwind Method and system for music information retrieval
US7657126B2 (en) * 2005-05-09 2010-02-02 Like.Com System and method for search portions of objects in images and features thereof
CN101710334B (zh) * 2009-12-04 2012-01-25 大连理工大学 基于图像哈希的大规模图像库检索方法
US20110142335A1 (en) * 2009-12-11 2011-06-16 Bernard Ghanem Image Comparison System and Method
US8488883B2 (en) * 2009-12-28 2013-07-16 Picscout (Israel) Ltd. Robust and efficient image identification
US8515964B2 (en) * 2011-07-25 2013-08-20 Yahoo! Inc. Method and system for fast similarity computation in high dimensional space
RU2480831C1 (ru) * 2011-11-24 2013-04-27 Общество с ограниченной ответственностью "КБК Групп" Способ выборки изображений из базы изображений
US9208219B2 (en) 2012-02-09 2015-12-08 Stroz Friedberg, LLC Similar document detection and electronic discovery
US20150169644A1 (en) * 2013-01-03 2015-06-18 Google Inc. Shape-Gain Sketches for Fast Image Similarity Search
US9201958B2 (en) * 2013-10-24 2015-12-01 TCL Research America Inc. Video object retrieval system and method
US9412031B2 (en) 2013-10-16 2016-08-09 Xerox Corporation Delayed vehicle identification for privacy enforcement
CN104035949B (zh) * 2013-12-10 2017-05-10 南京信息工程大学 一种基于局部敏感哈希改进算法的相似性数据检索方法
CN104050247B (zh) * 2014-06-04 2017-08-08 上海赛特斯信息科技股份有限公司 实现海量视频快速检索的方法
CN105095435A (zh) * 2015-07-23 2015-11-25 北京京东尚科信息技术有限公司 一种图像高维特征的相似比较方法及装置
US11100073B2 (en) * 2015-11-12 2021-08-24 Verizon Media Inc. Method and system for data assignment in a distributed system

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103345496A (zh) * 2013-06-28 2013-10-09 新浪网技术(中国)有限公司 多媒体信息检索方法和系统
CN103440292A (zh) * 2013-08-16 2013-12-11 新浪网技术(中国)有限公司 基于比特向量的多媒体信息检索方法和系统
JP2015111339A (ja) * 2013-12-06 2015-06-18 株式会社デンソーアイティーラボラトリ 画像検索システム、画像検索装置、検索サーバ装置、画像検索方法、及び画像検索プログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
XIA, RONGKAI ET AL.: "Supervised Hashing for Image Retrieval via Image Representation Learning", PROCEEDINGS OF THE TWENTY-EIGHTH AAAI CONFERENCE ON ARTIFICIAL INTELLIGENCE, JPN6019001709, 21 June 2014 (2014-06-21), pages 2156 - 2162, ISSN: 0003962200 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022134143A (ja) * 2021-03-03 2022-09-15 三菱電機インフォメーションシステムズ株式会社 検知装置、検知方法、検知プログラム及び検知システム
JP7200279B2 (ja) 2021-03-03 2023-01-06 三菱電機インフォメーションシステムズ株式会社 検知装置、検知方法、検知プログラム及び検知システム

Also Published As

Publication number Publication date
WO2017012491A1 (zh) 2017-01-26
US11048966B2 (en) 2021-06-29
CN105095435A (zh) 2015-11-25
JP6544756B2 (ja) 2019-07-17
RU2686590C1 (ru) 2019-04-29
US20180349735A1 (en) 2018-12-06

Similar Documents

Publication Publication Date Title
JP6544756B2 (ja) 画像の高次元特徴の類似性を比較するための方法及びデバイス
Wu et al. Semi-supervised nonlinear hashing using bootstrap sequential projection learning
Zhu et al. Sparse hashing for fast multimedia search
CN106202256B (zh) 基于语义传播及混合多示例学习的Web图像检索方法
US8781255B2 (en) Methods and apparatus for visual search
JP5749279B2 (ja) アイテム関連付けのための結合埋込
US10482146B2 (en) Systems and methods for automatic customization of content filtering
Zhen et al. Spectral multimodal hashing and its application to multimedia retrieval
WO2020114100A1 (zh) 一种信息处理方法、装置和计算机存储介质
JP7149976B2 (ja) 誤り訂正方法及び装置、コンピュータ読み取り可能な媒体
JPWO2013129580A1 (ja) 近似最近傍探索装置、近似最近傍探索方法およびそのプログラム
US11574004B2 (en) Visual image search using text-based search engines
CN112817916A (zh) 基于ipfs的数据获取方法及系统
CN110738042B (zh) 纠错词典创建方法、装置、终端及计算机存储介质
CN110083731B (zh) 图像检索方法、装置、计算机设备及存储介质
Tian et al. Deep cross-modal face naming for people news retrieval
CN112836008B (zh) 基于去中心化存储数据的索引建立方法
CN110209895B (zh) 向量检索方法、装置和设备
CN105975643B (zh) 一种基于文本索引的实时图像检索方法
JP5833499B2 (ja) 高次元の特徴ベクトル集合で表現されるコンテンツを高精度で検索する検索装置及びプログラム
US10824811B2 (en) Machine learning data extraction algorithms
CN117435685A (zh) 文档检索方法、装置、计算机设备、存储介质和产品
CN117171393A (zh) 一种面向多模态检索的自适应半配对询问哈希方法
CN114090801B (zh) 深度对抗注意力跨模态哈希检索方法及系统
Liu et al. Multiview Cross-Media Hashing with Semantic Consistency

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190116

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190129

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190425

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190521

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190611

R150 Certificate of patent or registration of utility model

Ref document number: 6544756

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250