JP2014505313A - 類似画像を識別する方法および装置 - Google Patents

類似画像を識別する方法および装置 Download PDF

Info

Publication number
JP2014505313A
JP2014505313A JP2013552013A JP2013552013A JP2014505313A JP 2014505313 A JP2014505313 A JP 2014505313A JP 2013552013 A JP2013552013 A JP 2013552013A JP 2013552013 A JP2013552013 A JP 2013552013A JP 2014505313 A JP2014505313 A JP 2014505313A
Authority
JP
Japan
Prior art keywords
image
hash
signature
images
binary vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013552013A
Other languages
English (en)
Other versions
JP5926291B2 (ja
Inventor
フイ シュエ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Publication of JP2014505313A publication Critical patent/JP2014505313A/ja
Application granted granted Critical
Publication of JP5926291B2 publication Critical patent/JP5926291B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5854Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using shape and object relationship
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/751Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/758Involving statistics of pixels or of feature values, e.g. histogram matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/761Proximity, similarity or dissimilarity measures

Abstract

ユーザは、画像を提出し、提出した画像に類似する1つ以上の画像をサーバから要求してよい。サーバは、提出された画像のコンテンツに基づいて画像シグナチャを生成してよい。サーバは、画像シグナチャに対しハッシュ演算を実行して、1つ以上のハッシュ値を生成してよい。これらのハッシュ値は、ハッシュ表中の画像に類似した1つ以上の候補画像を識別するために使用されてよい。これらの候補画像は、類似度に基づいてソートされ、ユーザに出力されてよい。候補画像のそれぞれと画像との間の類似度は、ハミング距離またはユークリッド距離の内の少なくとも1つを使用して決定されてよい。

Description

(関連出願の相互参照)
本願は、参照によりその全体が本明細書に組み込まれる、「METHOD AND DEVICE OF SIMILAR IMAGE RECOGNITION(類似画像認識の方法および装置)」と題する2011年1月28日に出願された中国特許出願第201110031701.8号に対する優先権を主張する。
本開示は、マルチメディア画像認識の分野に関する。さらに詳細には、本開示は画像認識の方法および装置に関する。
マルチメディア認識技術の一種としての類似画像検索は急成長を遂げている。類似画像検索は、特徴抽出、インデックス構築、問い合わせ、および類似点ソーティングを含んでよい。
しかしながら、従来の画像シグナチャには画像のコンテンツ情報が含まれないために、従来の類似画像検索技術はいくつかの問題(たとえば、不十分な互換性およびフォールトトレランスの問題)を起こすことがある。たとえば、同一のコンテンツを有するが、異なるフォーマット(たとえば、bmp、jpeg、png、またはgif)で保存される2つの画像は、異なる画像と見なされることがある。
本開示は、類似画像を識別するための方法および装置を提供する。一部の実施形態では、ユーザは、画像を提出し、提出した画像に類似する画像のセットをサーバから要求することがある。サーバは、提出された画像を受け取ると、その画像のコンテンツに基づいて画像シグナチャを生成してよい。また、サーバは画像シグナチャに対しハッシュ演算を実行して、1つ以上のハッシュ値を生成してもよい。1つ以上の値は、画像に類似する候補画像を識別するために使用されてよい。サーバは、次いでこれらの候補画像のそれぞれと画像との間の画像類似点を決定してよい。
一部の実施形態では、画像シグナチャを生成するために、サーバは、画像を濃淡画像に変換し、次いで濃淡画像を複数のサブ画像に分割してよい。サーバは、次いで複数のサブ画像のそれぞれのエッジヒストグラムを計算してよい。エッジヒストグラムに基づいて、サーバは画像シグナチャを生成してよい。一部の実施形態では、1つ以上のハッシュ値を生成するために、サーバは、局所性鋭敏型ハッシュ関数を使用して画像シグナチャに対しハッシュ演算を実行して1つ以上の第1のハッシュ値を生成してよい。サーバは、次いで、1つ以上の第1のハッシュ値のそれぞれにハッシュ演算を実行して1つ以上の第2のハッシュ値を生成してよい。1つ以上の第2のハッシュ値は、候補画像を識別するために使用されてよい。一部の実施形態では、画像類似点を決定するために、サーバは、ハミング距離またはユークリッド距離の内の少なくとも1つを使用して、画像と1つ以上の候補画像のそれぞれとの間の類似点を決定してよい。
添付の図を参照して詳細な説明が説明される。異なる図中での同じ参照番号の使用は、類似する項目または同一の項目を示す。
類似画像を識別するための例示的な環境を示す概略図である。 図1の画像サーバ(複数の場合がある)の例示を示す概略ブロック図である。 図1の画像サーバ(複数の場合がある)の別の例示を示す概略ブロック図である。 類似画像を識別する例示的なプロセスを示すフローチャートである。 画像シグナチャを取得する例示的なプロセスを示すフローチャートである。 画像インデックスを作成する例示的なプロセスを示すフローチャートである。 類似画像を識別する別の例示的なプロセスを示すフローチャートである。
通信制御プロトコル(TCP)の方法およびサーバの詳細な説明が、添付の図を参照して説明される。
図1は、類似画像を識別するための例示的な環境100を示す概略図である。環境100は、ユーザ104およびユーザ106と対話する画像サーバ102を含んでよい。画像サーバ102は、アップロードサーバ108、画像データベース装置110、インデックスサーバ112、画像計算サーバ114、および画像検索フロントサーバ116を含んでよい。
ユーザ104は、画像インデックスデータベースを作成するためにアップロードサーバ108に画像をアップロードしてよい。アップロードサーバ108は、画像の画像シグナチャを計算し、画像データベース装置110に画像シグナチャを送ってよい。一部の実施形態では、画像は、クローラシステムを使用してインターネットから取得され、アップロードサーバ108に保存されてよい。一部の実施形態では、アップロードサーバ108は、画像のコンテンツ情報に基づいて画像の画像シグナチャを計算し、したがってコンフリクトの確率を削減してよい。たとえば、画像のコンテンツ情報は、非バイトストリームの代わりにメタデータ(たとえば、色、グレイン等)を含んでよい。
画像データベース装置110は、画像シグナチャ受信後に局所性鋭敏型ハッシュ(LSH)を使用することによって画像に対しハッシュ演算を実行してよい。結果として生じる値は、次いでインデックスサーバ112にインデックス情報として送られる。
ユーザ106は、画像検索フロントサーバ116に画像を送り、画像サーバに、提出した画像に類似する画像のセットを返すように要求してよい。画像検索フロントサーバ116は、画像計算サーバ114に画像を送信し、類似画像または類似画像のリストを要求してよい。一部の実施形態では、画像シグナチャは画像のコンテンツ情報に基づいて生成されてよく、次いでインデックスサーバ112が画像シグナチャに基づいて類似画像を検索する。一部の実施形態では、画像計算サーバ114は、インデックスサーバ112上のこれらの類似画像のハッシュ値に基づいて類似画像(たとえば、ID)を検索してよい。たとえば、画像計算サーバ114は、画像と同じハッシュ値を有する画像と関連付けられたIDを識別してよい。類似画像または類似画像のリストは、画像検索フロントサーバ116に返され、ユーザ106に表示されてよい。
図2は、図1の例示的な画像サーバ102の詳細を示す概略ブロック図である。画像サーバ102は、どのような適切なサーバとして構成されてもよい。1つの例示的な構成では、画像サーバ102は、プロセッサ202、入力/出力インタフェース204、ネットワークインタフェース206、およびメモリ208を含む。
メモリ208は、ランダムアクセスメモリ(RAM)等の揮発性メモリ、および/または読取り専用メモリ(ROM)またはフラッシュRAM等の不揮発性メモリの形をとるコンピュータ可読媒体を含んでよい。メモリ208は、コンピュータ可読媒体の例である。
コンピュータ可読媒体は、コンピュータ可読命令、データ構造体、プログラムモジュール、または他のデータ等の情報の記憶のための任意の方法または技術で実装される揮発性および不揮発性、取外し可能および取外し不可能な媒体を含む。コンピュータ記憶媒体の例は、相変化メモリ(PRAM)、スタティックランダムアクセスメモリ(SRAM)、ダイナミックランダムアクセスメモリ(DRAM)、他の種類のランダムアクセスメモリ(RAM)、読取り専用メモリ(ROM)、電気的消去可能PROM(EEPROM)、フラッシュメモリもしくは他のメモリ技術、コンパクトディスク読取り専用メモリ(CD−ROM)、デジタル多用途ディスク(DVD)もしくは他の光記憶装置、磁気カセット、磁気テープ、磁気ディスク記憶装置もしくは他の磁気記憶装置、またはコンピューティング装置によるアクセスのための情報を記憶するために使用できる任意の他の非伝送媒体を含むが、これらに限定されない。本明細書に定義されるように、コンピュータ可読媒体は、変調されたデータ信号および搬送波等の一時的な媒体は含まない。
メモリ208をより詳しく見ると、メモリ208は、出力部210、認識部212、検索部214、取得部216、ハッシュ演算部218、およびハッシュ表作成部220を含む、任意の数のソフトウェアモジュールまたはソフトウェアユニットを記憶してよい。取得部216は、ユーザ106によって提出される画像の画像シグナチャを取得してよい。ハッシュ演算部218は、画像シグナチャに対しハッシュ演算を実行してよい。検索部214は、所定のハッシュ表中で候補画像を検索してよい。認識部212は、候補画像から画像に類似する画像(複数の場合がある)を識別し、取り出してよい。
一部の実施形態では、画像サーバ102は、画像のコンテンツから生成される画像シグナチャに基づいて画像の類似点を決定してよい。たとえば、画像が類似するほど、画像の画像シグナチャも類似する。一部の実施形態では、類似点は、ハミング距離またはユークリッド距離に関連付けられてよい。たとえば、これらの距離が短いほど、画像はより類似している。したがって、同じであるが、異なるフォーマットで保存される画像は、同じ画像シグナチャを有することがある。また、従来の技術でのフォールトトレランスの問題も解決され得る。
一部の実施形態では、出力部210は、類似点に基づいて候補画像を出力してよい。一部の実施形態では、ハッシュ表作成部220は、画像シグナチャに対しハッシュ演算を実行することによってL個のハッシュ表を作成して、LSH関数を使用することによってL個のハッシュ値を取得してよく、Lは整数である。また、ハッシュ表作成部220は、L個の第1のハッシュ値に対しハッシュ演算を実行して、総合ハッシュ関数を使用することによってL個の第2のハッシュ値を取得してもよい。ハッシュ表作成部220は、jth番目の第2のハッシュ値、画像識別および画像シグナチャを、jth番目のハッシュ表に記録してよく、j=1,...,Lである。
図3は、図1および図2の画像サーバ102と同様に、認識部212、検索部214、取得部216、およびハッシュ演算部218を含んでよい画像サーバ300の別の例示を示す概略ブロック図である。
取得部216は、変換モジュール302、計算モジュール304、および生成モジュール306を含んでよい。変換モジュール302は、ユーザ106によって提出される画像を濃淡画像に変換してよい。次いで、計算モジュール304は、濃淡画像をNxN個のサブ画像に分割し、サブ画像のそれぞれにM個の方向からエッジヒストグラムを計算し、NxNxM個の計算結果を取得してよく、NおよびMは整数である。生成モジュール306は、画像シグナチャのNxNxM次元ベクトルとしてNxNxM個の計算結果をアセンブルしてよい。一部の実施形態では、人間の目の感度に基づいた非一様定量技術をNxNxM次元ベクトルに適用できる。一部の実施形態では、エッジヒストグラムの統計データが画像シグナチャの基本特徴として使用されてよい。画像分割および人間の目の感度に基づいた非一様定量技術と組み合わされる統計データは、異なる色、スケール、または部分的なファジーおよびひずみによって引き起こされる解決された問題であってよい。一部の実施形態では、濃淡画像はNxP個のサブ画像に分割されてよい。
一部の実施形態では、計算モジュール304は、サブ画像に含まれる画像ブロックごとに、M個の方向のそれぞれでの勾配値を計算してよい。計算モジュール304は、次いで統計のために対応する画像ブロックの方向として最大の勾配値を有する、M個の方向の内の1つを選択してよい。計算モジュール304はさらに、M個の方向のそれぞれに選択された方向の数を計算し、サブ画像のヒストグラムとして統計値を取得してよい。
サブ画像が1000個の画像ブロックを有し、MがA、B、C、D、およびEを含む5つの方向を有する(つまり、M=5)と仮定する。さらに、統計データのための方向Aが100個の画像ブロックであり、方向Bが200個の画像ブロックを有し、方向Cが300個の画像ブロックを有し、方向Dが400個の画像ブロックを有し、方向Eが画像ブロックを有さないと仮定する。結果として、サブ画像の統計値(つまり、ヒストグラム)は、ベクトル(100,200,300,400,0)によって表されてよい。
一部の実施形態では、ハッシュ演算部218は、第1のハッシュ演算モジュール308および第2のハッシュ演算モジュール310を含んでよい。第1のハッシュ演算モジュール308は、画像シグナチャに対しハッシュ演算を実行し、L個のLSH関数を使用することによってL個の第1のハッシュ値を取得してよく、Lは整数である。第2のハッシュ演算モジュール310は、L個の第1のハッシュ値に対しハッシュ演算を実行して、総合ハッシュ関数を使用することによってL個の第2のハッシュ値を取得してよい。一部の実施形態では、LSH技術に基づいた質量類似画像インデックスの方法が、検索時間の複雑度を非線形レベルまで削減するために使用されてよい。
一部の実施形態では、検索部214は、検索モジュール312および追加モジュール314を含んでよい。検索モジュール312は、ハッシュ表に第2のハッシュ値を記録するエントリを検索してよい。ハッシュ表の各エントリが、画像のハッシュ値および画像識別を記録する。各エントリは、さらに画像シグナチャを含んでよい。追加モジュール314は、ハッシュ表の中の第2のハッシュ値を有するエントリを識別すると、候補画像に画像を追加してよい。一部の実施形態では、i番目の第2のハッシュ値がith番目のハッシュ表に対応してよく、i=1,...,Lである。
一部の実施形態では、第1のハッシュ演算モジュール308は、画像シグナチャをR次元バイナリベクトルに変換してよく、Rは整数である。第1のハッシュ演算モジュール308は、次いでR次元バイナリベクトルを使用することによってL個のLSH関数を生成してよい。たとえば、LSH関数のそれぞれは、R次元バイナリベクトルの一次元バイナリベクトルまたは多次元バイナリベクトルに基づいて生成される。
一部の実施形態では、第1のハッシュ演算モジュール308は、LSH関数の入力パラメータをKとして代入し、R次元バイナリベクトルからK次元バイナリベクトルを無作為に選択し、K次元バイナリベクトルをLSH関数の戻り値として結合してよく、K<Rである。
一部の実施形態では、認識部212は、計算モジュール316および認識モジュール318を含んでよい。計算モジュール316は、提出された画像の画像シグナチャと候補画像の画像シグナチャとの間の空間距離(たとえば、ハミング距離またはユークリッド距離)を計算してよい。認識モジュール318は、次いで空間距離に基づいて、候補画像と提出された画像との間の類似点を決定してよい。たとえば、空間距離が小さいほど、候補画像は提出された画像に類似している。
図4から図7は、類似画像を識別する例示的なプロセスを示すフローチャートである。プロセスは、ハードウェア、ソフトウェア、または組み合わせで実装できる一連の演算を表す、論理フローチャート中のブロックの集合体として示される。説明のために、プロセスは、図1から図3に示される画像サーバ102を参照して説明される。ただし、プロセスは異なる環境および装置を使用して実行されてよい。さらに、本明細書に説明される環境および装置は、異なるプロセスを実行するために使用されてよい。
図4は、類似画像を識別する例示的なプロセス400を示すフローチャートである。プロセス400は、1つ以上のマイクロコントローラ(MCU)または1つ以上のフィールドプログラマブルゲートアレイ(FPGA)を含むことがある画像サーバの1つ以上のプロセッサによって実行されてよい。
402で、画像サーバは、たとえばUSB伝送インタフェース、ブルートゥース伝送インタフェース、またはイーサネット(登録商標)伝送インタフェースを介してユーザ106によって提出される画像を受け取ってよい。404で、取得部216は、提出された画像の画像シグナチャを生成する、またはそれ以外の場合、画像シグナチャを取得してよい。たとえば、取得部216は、画像シグナチャを計算するためにMCUまたはFPGAを関与させてよい。
406で、ハッシュ演算部218は、画像シグナチャに対しハッシュ演算を実行してよい。一部の実施形態では、ハッシュ演算部218は、ハッシュ演算を実行するように構成されたMCUまたはFPGAを含んでよい。一部の実施形態では、ハッシュ演算部218および取得部216によって実行される関数は、同じプロセッサ(複数の場合がある)によって実装されてよい。
408で、検索部214は、候補画像を識別するために、所定のハッシュ表中のハッシュ演算の結果に対応するエントリを検索してよい。410で、認識部212は、エントリに対応する候補画像から、提出画像に類似する画像を認識してよい。一部の実施形態では、画像計算サーバ114が、局所的にまたはサードパーティの装置から、インデックスサーバ112によって返される類似画像のIDに基づいて候補画像を取得し、エントリに基づいた候補画像から提出画像に類似する画像を認識する。一部の実施形態では、認識部212が、局所的にまたはサードパーティの装置から、検索部214によって返される類似画像のIDに基づいて候補画像を取得してよく、エントリに基づいた候補画像から提出画像に類似する画像を認識する。
一部の実施形態では、出力部210は、識別された類似画像を出力し、ユーザ106に表示するためにブルートゥース伝送モジュール、赤外線伝送モジュール、および/またはイーサネット伝送モジュールを含んでよい。
図5は、画像シグナチャを取得する例示的なプロセス500を示すフローチャートである。プロセス500は、エッジヒストグラムのグレイン特徴に基づいて画像シグナチャを生成してよい。
502で、画像サーバは、ユーザ106によって提出された画像を濃淡画像に変換して、色および/または光に敏感ではない最終結果を作成する。504で、計算モジュール304は、濃淡画像をNxN個のサブ画像に分割してよい。506で、計算モジュール304は、サブ画像のそれぞれを固定数の画像ブロックにさらに分割してよい。各画像ブロックの領域は、提出画像の領域に依存する。508で、計算モジュール304は、次いでサブ画像のそれぞれに1つ以上の方向からエッジヒストグラムを計算してよい。たとえば、計算モジュール304は、5つの方向に対して画像ブロックの勾配値を計算して、統計のための画像ブロックの方向となるために最大の勾配値を有する方向を選択してよい。計算モジュール304は、5つの方向のそれぞれが、1つのサブ画像で統計のための方向として選択される頻度を計算してよい。頻度は、サブ画像のヒストグラムとして使用されてよい。
サブ画像が1000個の画像ブロックに分割され、1つ以上の方向が、A、B、C、D、およびEの5つの方向を含むと仮定する。さらに、方向Aが統計のための100個の画像ブロックの方向として選択され、方向Bが200個の画像ブロックを有していた、方向Cが300個の画像ブロックを有し、方向Dが400個の画像ブロックを有し、および方向Eが0個の画像ブロックを有すると仮定する。結果として、サブ画像の統計値(つまり、対応するヒストグラム)は、ベクトル(100,200,300,400,0)である。
510で、生成モジュール306は、各サブ画像のベクトルを、ユーザ106によって提出された画像の画像シグナチャとして多次元ベクトルに結合してよい。N=4の場合、画像シグナチャは、4x4x5=80次元ベクトルとして提示されてよい。一部の実施形態では、512で、人間の目の感度の非一様な特性を前提として非一様定量方法が採用されてよい。生成モジュール306は、たとえば、80次元ベクトルに対し定量圧縮を実施してより優れた空間活用を達成してよい。たとえば、画像シグナチャは、量的プロセスのための0と7の間の8デジタルが使用される場合、約240ビット(つまり、30バイト)となるだろう。プロセスは、記憶領域の90%を節約してよい。
514で、画像サーバ102は、圧縮プロセス後に画像シグナチャを取得してよい。一部の実施形態では、変換モジュール302、計算モジュール304および生成モジュール306がMCUに実装されてよい。
図6は、画像インデックスを作成する例示的なプロセス600を示すフローチャートである。602で、第1のハッシュ演算モジュール308が、プロセス500で取得されたベクトルを、ハミング空間の高次元バイナリベクトル(つまり、各次元が1または0である)に変換してよい。たとえば、一次元ベクトル値がXであり、最大値がCであると仮定する。結果として、ハミング空間で提示されるベクトルは、C−X個の連続0の直後のX個の連続1を含むC次元バイナリベクトルである。
604で、第1のハッシュ演算モジュール308は、演算602で取得されたベクトルからK次元バイナリベクトルを無作為に選択することによってハッシュ関数Gを定め、結果を結合後、値を返してよい。これらの例では、ベクトル間の類似度が大きいほど、同じハッシュ値を生成する確率も大きくなる。
606で、第1のハッシュ演算モジュール308は、演算602で取得された高次元ベクトルに対しL個のハッシュ関数を実施して、類似点検索の誤差を削減してよく、Lは整数である。608で、第2のハッシュ演算モジュール310は、従来のハッシュ関数(たとえば、メッセージ‐ダイジェストアルゴリズム5(MD5))を用いて演算606からの結果に対しハッシュ演算を実行してよい。610で、第2のハッシュ演算モジュール310は、対応するL個のハッシュ表中の画像のキーおよび一意のIDとして演算608のハッシュ結果を保存してよく、Lは整数である。一部の実施形態では、同じ画像シグナチャが付いた画像は同じビンに保存されてよい。一方、異なる画像シグナチャが付いた画像は異なるビンに保存される可能性がより高い。一部の実施形態では、第1のハッシュ演算モジュール308および第2のハッシュ演算モジュール310は、同じ符号化チップまたは同じMCUによって実装されてよい。
一部の実施形態では、精度および再現率は、異なるKおよびLによって著しく影響を受けることがあるため、シミュレーションが予想のために事前に実施されてよい。適切なハードウェアによってサポートされている画像インデックスは、検索での効率を高めるためにメモリに記憶されてよい。一部の実施形態では、画像インデックス文書は、ローカルディスクに記憶されてよいか、または質量サンプルデータベースのための分散の途中で処理されてよい。
図7は、類似画像を識別する例示的なプロセス700を示すフローチャートである。702で、取得部216は、ユーザ106によって提出される画像の画像シグナチャを計算してよい。704で、ハッシュ演算部218は、画像シグナチャに基づいてLSH関数を定めてよい。706で、画像シグナチャのハッシュコードが、無作為に選択される複数のLSH関数を使用して計算されてよい。708で、ハッシュ演算(たとえば、MD5)が、取得された結果に対して実施されてよい。710で、検索部214は、演算708で取得された結果をキーとして使用してL個のハッシュ表を検索してよい。
712で、検索部214は、候補画像アレイに、検索結果に基づく候補画像を追加してよい。714で、認識部212は、候補画像アレイ内の各画像シグナチャと、ユーザ106によって提出された画像の画像シグナチャとの間の空間距離(たとえば、ハミング距離またはユークリッド距離)を計算してよい。一部の実施形態では、距離は、候補画像と提出画像との間の類似度を示してよい。
716で、出力部210は、距離に基づいて候補画像をソートし、出力してよい。これらの例では、候補アレイ内の画像シグナチャの数は、データベース内の画像シグナチャの数よりもはるかに小さい。したがって、従来の技術に比較すると、計算費用は大幅に削減できる。
一部の実施形態では、ハッシュ演算部218は、MCUまたはFPGAであってよい。一部の実施形態では、ハッシュ演算部218および取得部216によって操作される関数は、同じプロセッサ(複数可)によって実装されてよい。一部の実施形態では、検索部214は内部バスを通してデータベースと通信してよく、検索部214および認識部212は同じMCUによって実装されてよい。
本開示では、画像シグナチャは、画像のコンテンツに基づいて決定されてよい。画像シグナチャの類似度は、画像コンテンツの類似度に依存する。たとえば、2つの画像が類似するほど、画像の画像シグナチャも類似する。類似度は、空間距離(たとえば、ハミング距離またはユークリッド距離)によって表されてよい。したがって、2つの同一であるが、異なるフォーマットで保存された画像は同じ画像シグナチャを有し、従来の類似画像認識技術に存在するフォールトトレランスの問題を解決し得る。また、本開示は、LSHハッシュ技術に基づいて質量類似画像インデックスを作成する方法も紹介する。方法は、検索の複雑度を削減し、非線形レベルまで時間を節約し、類似点に基づいて結果をソートし、出力してよい。また、本開示は、画像シグナチャ、画像分割、および人間の目の感度に基づいた非一様定量技法の基本特徴としてエッジヒストグラム統計も提供する。
本開示の実施形態は単に説明を目的とするものに過ぎず、本開示の範囲を限定することは意図されていない。当業者は、本開示に提示される実施形態に変更および改変を加えることができるだろう。当業者が理解するだろうあらゆる変更および改変が、本開示の範囲内に含まれる。

Claims (20)

  1. 類似画像を識別するためのコンピュータ実施方法であって、
    画像を受け取ることと、
    前記画像のコンテンツに基づいて前記画像の画像シグナチャを生成することと、
    前記画像シグナチャに対しハッシュ演算を実行して、値を生成することと、
    1つ以上のハッシュ表の中で、前記値に基づいた1つ以上の候補画像を識別することと、
    前記画像と前記1つ以上の候補画像のそれぞれとの間の画像類似点を決定することと、
    を含む方法。
  2. 前記画像シグナチャを生成することが、
    前記画像を濃淡画像に変換することと、
    前記濃淡画像を1つ以上のサブ画像に分割することと、
    前記1つ以上のサブ画像のそれぞれに複数の方向からエッジヒストグラムを計算することと、
    前記エッジヒストグラムに基づいて前記画像シグナチャを生成することと、
    を含む、請求項1に記載のコンピュータ実施方法。
  3. 前記ハッシュ演算を実行することが、
    1つ以上の局所性鋭敏型ハッシュ(LSH)関数を使用して前記画像シグナチャに対し1つ以上のハッシュ演算を実行して、1つ以上の第1のハッシュ値を生成することと、
    前記1つ以上の第1のハッシュ値のそれぞれに対し別のハッシュ演算を実行して、1つ以上の第2のハッシュ値を生成することと、
    を含む、請求項1に記載のコンピュータ実施方法。
  4. 前記1つ以上の候補画像の前記識別することが、前記1つ以上の第2のハッシュ値に基づいて識別することを含む、請求項3に記載のコンピュータ実施方法。
  5. 前記1つ以上のハッシュ表が1つ以上のエントリを含んでいた、各エントリがハッシュ値、1つの画像の画像識別、または1つの画像の画像シグナチャの内の少なくとも1つを含み、前記1つ以上の第2のハッシュ値のそれぞれが前記1つ以上のハッシュ表の内の1つに対応する、請求項4に記載のコンピュータ実施方法。
  6. 前記1つ以上のハッシュ演算を実行することが、
    前記画像シグナチャを複数の次元を有するバイナリベクトルに変換することと、
    1つ以上のLSH関数のそれぞれが、前記バイナリの単一次元バイナリベクトル、または前記バイナリベクトルの多次元バイナリベクトルの内の少なくとも1つに基づいて生成されるように、前記バイナリベクトルに基づいて前記1つ以上のLSH関数を生成することと、
    前記1つ以上のLSH関数を使用することによって、前記バイナリベクトルに対し前記1つ以上のハッシュ演算を実行することと、
    を含む、請求項3に記載のコンピュータ実施方法。
  7. 前記1つ以上のLSH関数を生成することが、
    前記1つ以上のLSH関数の各入力パラメータに、前記複数の次元の数よりも低い特定の数を代入することと、
    前記バイナリベクトルから前記特定の数の次元を有するバイナリベクトルを選択して、前記1つ以上のLSH関数のそれぞれに戻り値を生成することと、
    を含む、請求項6に記載の方法。
  8. 前記画像類似点を決定することが、
    前記画像の前記画像シグナチャと前記1つ以上の候補画像のそれぞれの画像シグナチャとの間の空間距離を計算することと、
    前記空間距離に基づいて前記画像類似点を決定することと、
    を含む、請求項1に記載の方法。
  9. 前記空間距離に基づいて前記候補画像のそれぞれを出力すること、
    をさらに含む、請求項8に記載の方法。
  10. 前記1つ以上の候補画像のそれぞれの画像シグナチャに対し前記1つ以上のハッシュ演算を実行して、前記1つ以上のLSH関数に基づいて1つ以上の第3のハッシュ値を生成することと、
    前記1つ以上の第3のハッシュ値のそれぞれに対し他のハッシュ演算を実行して、1つ以上の第4のハッシュ値を生成することと、
    対応するハッシュ表に、前記1つ以上の第4のハッシュ値、対応する画像識別、および対応する画像シグナチャのそれぞれを記録することと、
    をさらに含む、請求項3に記載の方法。
  11. メモリと、
    前記メモリに結合される1つ以上のプロセッサと、
    画像を受け取り、
    前記画像のコンテンツに基づいて前記画像の画像シグナチャを生成する
    ように構成された取得部と、
    前記画像シグナチャに対しハッシュ演算を実行して値を生成するように構成されたハッシュ演算部と、
    1つ以上のハッシュ表中で、前記値に基づいて1つ以上の候補画像を識別するように構成された検索部と、
    前記画像と前記1つ以上の候補画像のそれぞれとの間の画像類似点を決定するように構成された認識部と、
    を備える1つ以上のサーバ。
  12. 前記取得部が、
    前記画像を濃淡画像に変換し、
    前記濃淡画像を1つ以上のサブ画像に分割し、
    前記1つ以上のサブ画像のそれぞれに複数の方向からエッジヒストグラムを計算し、
    前記エッジヒストグラムに基づいて前記画像シグナチャを生成する、
    ための演算を実行することによって前記画像シグナチャを生成するように構成される、
    請求項11に記載の1つ以上のサーバ。
  13. 前記ハッシュ演算部が、
    1つ以上のLSH関数を使用して前記画像シグナチャに対し1つ以上のハッシュ演算を実行して、1つ以上の第1のハッシュ値を生成し、
    前記1つ以上の第1のハッシュ値のそれぞれに対し別のハッシュ演算を実行して、1つ以上の第2のハッシュ値を生成する、
    ための演算を実行することによって前記ハッシュ演算を実行するように構成される、
    請求項11に記載の1つ以上のサーバ。
  14. 前記検索部が、前記1つ以上の第2のハッシュ値に基づいて、それぞれハッシュ値、1つの画像の画像識別、または1つの画像の画像シグナチャの内の少なくとも1つを含む1つ以上のレコードを含む前記1つ以上のハッシュ表を識別することによって、前記1つ以上の候補画像を識別するように構成される、請求項13に記載の1つ以上のサーバ。
  15. 前記ハッシュ演算部が、
    Rが固定された整数である、R次元バイナリベクトルに前記画像シグナチャを変換し、
    前記R次元バイナリベクトルに基づいて、前記R次元バイナリベクトルの単一次元バイナリベクトル、または前記R次元バイナリベクトルの多次元バイナリベクトルの内の少なくとも1つに基づいて1つ以上のLSH関数を生成し、
    前記1つ以上のLSH関数を使用することによって、前記前記1つ以上のハッシュ演算を実行する、
    ための演算を実行することによって、前記1つ以上のハッシュ演算を実行するように構成される、請求項13に記載の1つ以上のサーバ。
  16. 前記ハッシュ演算部が、
    前記1つ以上のLSH関数の各入力パラメータに、別の固定整数であり、Rより小さいKを代入し、
    R次元バイナリベクトルからK次元バイナリベクトルを選択して、前記1つ以上のLSH関数のそれぞれに戻り値を生成すること、
    によって前記1つ以上のLSH関数を生成するようにさらに構成される、
    請求項15に記載の1つ以上のサーバ。
  17. 前記認識部が、
    前記画像の前記画像シグナチャと前記1つ以上の候補画像のそれぞれの画像シグナチャとの間の空間距離を計算し、
    前記空間距離に基づいて前記画像類似点を決定する、
    ための演算を実行することによって前記画像類似点を決定するように構成される、
    請求項11に記載の1つ以上のサーバ。
  18. 前記空間距離に基づいて前記候補画像のそれぞれを出力するように構成された出力部をさらに備える、請求項17に記載の1つ以上のサーバ。
  19. 前記1つ以上の候補画像のそれぞれの画像シグナチャに対し1つ以上の第3のハッシュ演算を実行して、前記1つ以上のLSH関数に基づいて1つ以上の第3のハッシュ値を取得し、
    前記1つ以上の第3のハッシュ値のそれぞれに対し第4のハッシュ演算を実行して、1つ以上の第4のハッシュ値を取得し、
    対応するハッシュ表に、前記1つ以上の第4のハッシュ値、対応する画像識別、および対応する画像シグナチャのそれぞれを記録する、
    ように構成されたハッシュ表作成部をさらに備える、請求項13に記載の1つ以上のサーバ。
  20. サーバのプロセッサによって実行されるときに
    画像を受け取ることと、
    前記画像に関連付けられたエッジヒストグラムに基づいて前記画像の画像シグナチャを示す多次元ベクトルを生成することと、
    前記画像シグナチャに対しハッシュ演算を実行し、前記多次元ベクトルに基づいて定められるLSH関数を使用して第1のハッシュ値を生成することと、
    メッセージ‐ダイジェストアルゴリズムを使用して前記第1のハッシュ値に別のハッシュ演算を実行して、第2のハッシュ値を生成することと、
    ハッシュ表から前記第2のハッシュ値に基づいて1つ以上の候補画像を取り出すことと、
    ハミング距離またはユークリッド距離の内の少なくとも1つを使用して、前記画像と前記1つ以上の候補画像のそれぞれとの間の類似点を決定することと、
    を含む行為を実行する命令で符号化された1つ以上のコンピュータ可読媒体。
JP2013552013A 2011-01-28 2012-01-18 類似画像を識別する方法および装置 Active JP5926291B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201110031701.8A CN102622366B (zh) 2011-01-28 2011-01-28 相似图像的识别方法和装置
CN201110031701.8 2011-01-28
PCT/US2012/021722 WO2012102926A1 (en) 2011-01-28 2012-01-18 Method and apparatus of identifying similar images

Publications (2)

Publication Number Publication Date
JP2014505313A true JP2014505313A (ja) 2014-02-27
JP5926291B2 JP5926291B2 (ja) 2016-05-25

Family

ID=46562289

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013552013A Active JP5926291B2 (ja) 2011-01-28 2012-01-18 類似画像を識別する方法および装置

Country Status (7)

Country Link
US (1) US9053386B2 (ja)
EP (1) EP2668619A4 (ja)
JP (1) JP5926291B2 (ja)
CN (1) CN102622366B (ja)
HK (1) HK1168919A1 (ja)
TW (1) TWI528196B (ja)
WO (1) WO2012102926A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101998200B1 (ko) * 2018-11-26 2019-07-10 주식회사 아임클라우드 동일 이미지 식별정보 생성 시스템
JP2021528714A (ja) * 2018-04-13 2021-10-21 ライン プラス コーポレーションLINE Plus Corporation アバター生成装置およびコンピュータプログラム

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI470549B (zh) * 2012-04-20 2015-01-21 Insyde Software Corp A method of using an image recognition guide to install an application, and an electronic device
CN103324650A (zh) * 2012-10-23 2013-09-25 深圳市宜搜科技发展有限公司 一种图像检索方法及系统
CN103902595B (zh) * 2012-12-27 2017-02-08 北京新媒传信科技有限公司 一种构建数据库的方法和装置
CN103761483A (zh) * 2014-01-27 2014-04-30 百度在线网络技术(北京)有限公司 恶意代码的检测方法及装置
CN103955914A (zh) * 2014-02-27 2014-07-30 西安电子科技大学 基于随机投影和Signature/EMD框架的SAR图像分割方法
CN103984776B (zh) * 2014-06-05 2017-05-03 北京奇虎科技有限公司 一种识别重复图片的方法、图片搜索去重方法及其装置
CN105224569B (zh) * 2014-06-30 2018-09-07 华为技术有限公司 一种数据过滤、构造数据滤波器的方法及装置
CN104199827B (zh) * 2014-07-24 2017-08-04 北京大学 基于局部敏感哈希的大规模多媒体数据的高维索引方法
KR101713197B1 (ko) * 2015-04-01 2017-03-09 주식회사 씨케이앤비 서버 컴퓨팅 장치 및 이를 이용한 콘텐츠 인식 기반의 영상 검색 시스템
CN106302202B (zh) * 2015-05-15 2020-07-28 阿里巴巴集团控股有限公司 数据限流方法和装置
US11169964B2 (en) * 2015-12-11 2021-11-09 Hewlett Packard Enterprise Development Lp Hash suppression
CN105589938A (zh) * 2015-12-13 2016-05-18 公安部第三研究所 基于fpga的图像检索系统及检索方法
CN106991095B (zh) * 2016-01-21 2021-09-28 阿里巴巴集团控股有限公司 机器异常的处理方法、学习速率的调整方法及装置
CN107464268A (zh) * 2016-06-02 2017-12-12 国家计算机网络与信息安全管理中心 一种利用全局和局部特征的联合编码方法
CN108154072A (zh) * 2016-12-02 2018-06-12 天津工业大学 基于深度卷积神经网络的航拍绝缘子故障自动检测
CN108011956A (zh) * 2017-12-06 2018-05-08 易居(中国)企业集团股份有限公司 基于文件内容哈希值的分布式存储方法
CN108121806A (zh) * 2017-12-26 2018-06-05 湖北工业大学 一种基于局部特征匹配的图像搜索方法及系统
CN108629049A (zh) * 2018-05-14 2018-10-09 芜湖岭上信息科技有限公司 一种基于哈希算法的图像实时存储及查找装置及方法
US11126649B2 (en) 2018-07-11 2021-09-21 Google Llc Similar image search for radiology
US11556581B2 (en) * 2018-09-04 2023-01-17 Inception Institute of Artificial Intelligence, Ltd. Sketch-based image retrieval techniques using generative domain migration hashing
US20200364516A1 (en) * 2019-05-15 2020-11-19 EMC IP Holding Company LLC Data compression using nearest neighbor cluster
WO2020258101A1 (zh) * 2019-06-26 2020-12-30 深圳市欢太科技有限公司 用户相似度计算方法、装置、服务端及存储介质
CN110909791B (zh) * 2019-11-20 2023-02-28 车智互联(北京)科技有限公司 一种相似图像识别方法及计算设备
US11645323B2 (en) 2020-02-26 2023-05-09 Samsung Electronics Co.. Ltd. Coarse-to-fine multimodal gallery search system with attention-based neural network models
CN111414527B (zh) * 2020-03-16 2023-10-10 腾讯音乐娱乐科技(深圳)有限公司 相似项目的查询方法、装置及存储介质
CN111818236A (zh) * 2020-07-08 2020-10-23 山东省肿瘤防治研究院(山东省肿瘤医院) 核磁共振图像的同步采集与回放方法
CN112614187B (zh) * 2020-12-31 2024-03-26 深圳市优必选科技股份有限公司 回环检测方法、装置、终端设备和可读存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007012024A (ja) * 2005-06-03 2007-01-18 Canon Inc 画像検索装置、画像検索方法、プログラム及び記憶媒体
JP2008262424A (ja) * 2007-04-12 2008-10-30 Canon Inc 画像処理装置及びその制御方法、並びにコンピュータプログラム
US20080313140A1 (en) * 2007-06-18 2008-12-18 Zeitera, Llc Method and Apparatus for Multi-Dimensional Content Search and Video Identification
WO2009031297A1 (ja) * 2007-09-07 2009-03-12 Mitsubishi Electric Corporation 画像検索装置、画像分類装置及び方法並びにプログラム
JP2009277045A (ja) * 2008-05-15 2009-11-26 Sharp Corp 画像処理装置、画像形成装置、画像処理システム、画像処理方法、画像処理プログラムおよびその記録媒体
US20100166339A1 (en) * 2005-05-09 2010-07-01 Salih Burak Gokturk System and method for enabling image recognition and searching of images
JP2010277522A (ja) * 2009-06-01 2010-12-09 Nippon Telegr & Teleph Corp <Ntt> 局所性検知可能ハッシュの構築装置、類似近傍検索処理装置及びプログラム

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6671407B1 (en) 1999-10-19 2003-12-30 Microsoft Corporation System and method for hashing digital images
US8037310B2 (en) * 2004-11-30 2011-10-11 Ricoh Co., Ltd. Document authentication combining digital signature verification and visual comparison
JP4284288B2 (ja) 2005-03-10 2009-06-24 株式会社東芝 パターン認識装置及びその方法
US20060242418A1 (en) * 2005-04-25 2006-10-26 Xerox Corporation Method for ensuring the integrity of image sets
US7783135B2 (en) * 2005-05-09 2010-08-24 Like.Com System and method for providing objectified image renderings using recognition information from images
US7519200B2 (en) * 2005-05-09 2009-04-14 Like.Com System and method for enabling the use of captured images through recognition
US7457825B2 (en) * 2005-09-21 2008-11-25 Microsoft Corporation Generating search requests from multimodal queries
US7647331B2 (en) 2006-03-28 2010-01-12 Microsoft Corporation Detecting duplicate images using hash code grouping
US20080059461A1 (en) * 2006-08-29 2008-03-06 Attributor Corporation Content search using a provided interface
EP2315161A1 (en) * 2006-10-11 2011-04-27 Mitsubishi Electric Information Technology Centre Europe B.V. Image descriptor for image recognition
US8265345B2 (en) 2006-11-20 2012-09-11 Sharp Kabushiki Kaisha Image processing method, image processing apparatus, image forming apparatus, and image reading apparatus
US8055079B2 (en) 2007-03-06 2011-11-08 Sharp Kabushiki Kaisha Image processing method, image processing apparatus, and image forming apparatus
JP2009031876A (ja) 2007-07-24 2009-02-12 Sharp Corp 画像処理装置およびそれを備えた画像形成装置、画像読取装置、画像処理方法、画像処理プログラム、画像処理プログラムを記録した記録媒体
JP5098504B2 (ja) 2007-08-09 2012-12-12 富士通株式会社 文字認識プログラム、文字認識装置および文字認識方法
TWI506565B (zh) * 2008-03-03 2015-11-01 Avo Usa Holding 2 Corp 動態物件分類
JP4538507B2 (ja) 2008-05-02 2010-09-08 シャープ株式会社 画像照合方法、画像照合装置、画像データ出力処理装置、プログラム及び記憶媒体
US8144947B2 (en) * 2008-06-27 2012-03-27 Palo Alto Research Center Incorporated System and method for finding a picture image in an image collection using localized two-dimensional visual fingerprints
US8233722B2 (en) * 2008-06-27 2012-07-31 Palo Alto Research Center Incorporated Method and system for finding a document image in a document collection using localized two-dimensional visual fingerprints
CN101354728B (zh) * 2008-09-26 2010-06-09 中国传媒大学 一种基于区间权值的相似性度量方法
US8533848B2 (en) * 2009-02-18 2013-09-10 Korea Advanced Institute Of Science And Technology Method and system for producing multimedia fingerprint based on quantum hashing
US20100268628A1 (en) * 2009-04-15 2010-10-21 Attributor Corporation Managing controlled content on a web page having revenue-generating code
US8467631B2 (en) * 2009-06-30 2013-06-18 Red Hat Israel, Ltd. Method and apparatus for identification of image uniqueness
US9233399B2 (en) * 2010-02-09 2016-01-12 Xerox Corporation Document separation by document sequence reconstruction based on information capture
US9183173B2 (en) * 2010-03-02 2015-11-10 Microsoft Technology Licensing, Llc Learning element weighting for similarity measures
US8452106B2 (en) 2010-03-23 2013-05-28 Microsoft Corporation Partition min-hash for partial-duplicate image determination
CN101887457B (zh) * 2010-07-02 2012-10-03 杭州电子科技大学 基于内容的复制图像检测方法
US8498473B2 (en) 2010-08-24 2013-07-30 Compuware Corporation System for computationally quantifying similarities between images

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100166339A1 (en) * 2005-05-09 2010-07-01 Salih Burak Gokturk System and method for enabling image recognition and searching of images
JP2007012024A (ja) * 2005-06-03 2007-01-18 Canon Inc 画像検索装置、画像検索方法、プログラム及び記憶媒体
JP2008262424A (ja) * 2007-04-12 2008-10-30 Canon Inc 画像処理装置及びその制御方法、並びにコンピュータプログラム
US20080313140A1 (en) * 2007-06-18 2008-12-18 Zeitera, Llc Method and Apparatus for Multi-Dimensional Content Search and Video Identification
WO2009031297A1 (ja) * 2007-09-07 2009-03-12 Mitsubishi Electric Corporation 画像検索装置、画像分類装置及び方法並びにプログラム
JP2009277045A (ja) * 2008-05-15 2009-11-26 Sharp Corp 画像処理装置、画像形成装置、画像処理システム、画像処理方法、画像処理プログラムおよびその記録媒体
JP2010277522A (ja) * 2009-06-01 2010-12-09 Nippon Telegr & Teleph Corp <Ntt> 局所性検知可能ハッシュの構築装置、類似近傍検索処理装置及びプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021528714A (ja) * 2018-04-13 2021-10-21 ライン プラス コーポレーションLINE Plus Corporation アバター生成装置およびコンピュータプログラム
JP7031009B2 (ja) 2018-04-13 2022-03-07 ライン プラス コーポレーション アバター生成装置およびコンピュータプログラム
KR101998200B1 (ko) * 2018-11-26 2019-07-10 주식회사 아임클라우드 동일 이미지 식별정보 생성 시스템

Also Published As

Publication number Publication date
WO2012102926A1 (en) 2012-08-02
EP2668619A1 (en) 2013-12-04
CN102622366B (zh) 2014-07-30
US9053386B2 (en) 2015-06-09
CN102622366A (zh) 2012-08-01
JP5926291B2 (ja) 2016-05-25
HK1168919A1 (en) 2013-01-11
US20130301935A1 (en) 2013-11-14
TW201232302A (en) 2012-08-01
EP2668619A4 (en) 2016-12-14
TWI528196B (zh) 2016-04-01

Similar Documents

Publication Publication Date Title
JP5926291B2 (ja) 類似画像を識別する方法および装置
CN111198959B (zh) 一种基于卷积神经网络的两阶段图像检索方法
Liu et al. Collaborative hashing
Jégou et al. Aggregating local image descriptors into compact codes
Paulevé et al. Locality sensitive hashing: A comparison of hash function types and querying mechanisms
CA2814401C (en) Vector transformation for indexing, similarity search and classification
Zhou et al. Scalar quantization for large scale image search
KR101732754B1 (ko) 콘텐츠 기반 이미지 검색
KR101565265B1 (ko) 피쳐 위치 정보의 코딩
US20160267351A1 (en) Compact and robust signature for large scale visual search, retrieval and classification
US10949467B2 (en) Random draw forest index structure for searching large scale unstructured data
US20190272341A1 (en) Layered locality sensitive hashing (lsh) partition indexing for big data applications
Negrel et al. Web-scale image retrieval using compact tensor aggregation of visual descriptors
JP5592337B2 (ja) コンテンツ変換方法、コンテンツ変換装置及びコンテンツ変換プログラム
Zhang et al. OMCBIR: Offline mobile content-based image retrieval with lightweight CNN optimization
JP6017277B2 (ja) 特徴ベクトルの集合で表されるコンテンツ間の類似度を算出するプログラム、装置及び方法
CN110442749B (zh) 视频帧处理方法及装置
JP5833499B2 (ja) 高次元の特徴ベクトル集合で表現されるコンテンツを高精度で検索する検索装置及びプログラム
JP2017040972A (ja) 特徴量生成装置、方法、及びプログラム
CN111090743B (zh) 一种基于词嵌入和多值形式概念分析的论文推荐方法及装置
CN115129915A (zh) 重复图像检索方法、装置、设备及存储介质
Zhao et al. MapReduce-based clustering for near-duplicate image identification
Chiu et al. Video query reformulation for near-duplicate detection
Zhou et al. Multimedia Content-Based Visual Retrieval
KR20230045866A (ko) 영상 검색 장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150107

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20151120

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151201

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160226

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160322

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160421

R150 Certificate of patent or registration of utility model

Ref document number: 5926291

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250