JP2015056077A - Image retrieval device, system, program, and method using image based binary feature vector - Google Patents

Image retrieval device, system, program, and method using image based binary feature vector Download PDF

Info

Publication number
JP2015056077A
JP2015056077A JP2013189872A JP2013189872A JP2015056077A JP 2015056077 A JP2015056077 A JP 2015056077A JP 2013189872 A JP2013189872 A JP 2013189872A JP 2013189872 A JP2013189872 A JP 2013189872A JP 2015056077 A JP2015056077 A JP 2015056077A
Authority
JP
Japan
Prior art keywords
bit
image
hash
hash value
bit number
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013189872A
Other languages
Japanese (ja)
Other versions
JP6041439B2 (en
Inventor
祐介 内田
Yusuke Uchida
祐介 内田
茂之 酒澤
Shigeyuki Sakasawa
茂之 酒澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2013189872A priority Critical patent/JP6041439B2/en
Publication of JP2015056077A publication Critical patent/JP2015056077A/en
Application granted granted Critical
Publication of JP6041439B2 publication Critical patent/JP6041439B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

PROBLEM TO BE SOLVED: To provide an image retrieval device, program, and method capable of minimizing the capacity of a reference information database and also reducing the amount of arithmetic operation performed during image retrieval.SOLUTION: The image retrieval device comprises: hash codebook storage means for storing a hash codebook for each hash value; bit number codebook storage means for storing a high-entropy bit number set for each hash value; local feature extraction means for extracting a binary feature vector set from an image; hash means for outputting a hash value most resembling the binary feature vector by using the hash codebook storage means; bit string generation means for generating a new bit string from a hash value bit number set by using the bit number codebook storage means; transposition index storage means for storing a reference image bit string for each hash value in correlation with each other; and retrieval means for retrieving a reference image from a query image bit string.

Description

本発明は、バイナリ特徴ベクトルを用いて画像を検索する技術に関する。   The present invention relates to a technique for retrieving an image using a binary feature vector.

近年、局所特徴点に基づいた画像認識や検索技術が注目されている。物体認識に用いる特徴ベクトルの抽出アルゴリズムとしては、回転やスケールの変化にロバストな、例えばSIFT(Scale-Invariant Feature Transform)(例えば非特許文献1参照)やSURF(Speeded Up Robust Features)が用いられる。例えばSIFTの場合、1枚の画像からは128次元の特徴ベクトルの集合が抽出される。SIFTとは、スケールスペースを用いて特徴的な局所領域を解析し、そのスケール変化及び回転に不変となる特徴ベクトルを記述する技術である。一方で、SURFの場合、SIFTよりも高速処理が可能であって、1枚の画像から64次元の特徴ベクトルの集合が抽出される。SIFTは、処理コストが高く且つリアルタイムマッチングが困難であるのに対し、SURFは、積分画像を利用することによって処理を高速化している。   In recent years, image recognition and search techniques based on local feature points have attracted attention. As a feature vector extraction algorithm used for object recognition, for example, SIFT (Scale-Invariant Feature Transform) (see, for example, Non-Patent Document 1) or SURF (Speeded Up Robust Features), which is robust to changes in rotation and scale, is used. For example, in the case of SIFT, a set of 128-dimensional feature vectors is extracted from one image. SIFT is a technique for analyzing a characteristic local region using a scale space and describing a feature vector that is invariant to scale change and rotation. On the other hand, in the case of SURF, higher-speed processing is possible than SIFT, and a set of 64-dimensional feature vectors is extracted from one image. While SIFT has a high processing cost and is difficult to perform real-time matching, SURF uses an integral image to speed up the processing.

一方で、スマートフォンやタブレット端末のような携帯端末が普及する中で、コンテンツ検索処理に対して、更なる省メモリ化及び高速マッチング化が要求されてきている。特に、拡張現実感(Augmented Reality, AR)の用途における画像認識の技術分野によれば、リアルタイムに処理するべく、SIFTやSURFよりも更に高速にコンテンツを検索することが要求される。このため、バイナリ特徴ベクトル抽出アルゴリズムであるFAST(Features from Accelerated Segment Test)(例えば非特許文献2参照)やFREAK(Fast Retina Keypoint)(例えば非特許文献3参照)が注目されている。これは、SIFTやSURFよりも高速に特徴ベクトルが抽出でき、更に抽出される特徴ベクトルもコンパクトにすることができる。   On the other hand, while portable terminals such as smartphones and tablet terminals are widespread, further memory saving and faster matching have been required for content search processing. In particular, according to the technical field of image recognition in the use of augmented reality (Augmented Reality), it is required to search for content at higher speed than SIFT or SURF in order to perform real-time processing. For this reason, FAST (Features from Accelerated Segment Test) (for example, see Non-Patent Document 2) and FRAK (Fast Retina Keypoint) (for example, see Non-Patent Document 3), which are binary feature vector extraction algorithms, are attracting attention. This makes it possible to extract feature vectors at a higher speed than SIFT and SURF, and to further reduce the extracted feature vectors.

特開2010−282581号公報JP 2010-282581 A

J. Sivic et al., "Video Google: A Text Retrieval Approach toObject Matching in Videos," in Proc. ICCV, 2003.J. Sivic et al., "Video Google: A Text Retrieval Approach to Object Matching in Videos," in Proc. ICCV, 2003. E. Rublee, V. Rabaud, K. Konolige, and G. Bradski, "ORB: Anefficient alternative to SIFT or SURF," in Proc. ICCV, 2011.E. Rublee, V. Rabaud, K. Konolige, and G. Bradski, "ORB: Anefficient alternative to SIFT or SURF," in Proc. ICCV, 2011. A. Alahi, R. Ortiz, and P. Vandergheynst, "FREAK: Fast RetinaKeypoint," in Proc. CVPR, 2012.A. Alahi, R. Ortiz, and P. Vandergheynst, "FREAK: Fast RetinaKeypoint," in Proc. CVPR, 2012. 「相関係数」、[online]、[平成25年8月31日検索]、インターネット<URL:http://ja.wikipedia.org/wiki/%E7%9B%B8%E9%96%A2%E4%BF%82%E6%95%B0>“Correlation coefficient”, [online], [searched August 31, 2013], Internet <URL: http://en.wikipedia.org/wiki/%E7%9B%B8%E9%96%A2% E4% BF% 82% E6% 95% B0>

スマートフォンのような携帯端末によれば、撮影したクエリ画像に類似するリファレンス画像を直ぐに検索できるアプリケーションがある。一方で、画像検索(認識)技術によれば、認識対象となる大量のリファレンス情報を、データベースとして予め保持しておく必要がある。そのために、スマートフォンにインストールされる画像検索用アプリケーション自体も、リファレンス情報のデータベースを持つ必要がある。   According to a portable terminal such as a smartphone, there is an application that can immediately search for a reference image similar to a captured query image. On the other hand, according to the image search (recognition) technique, a large amount of reference information to be recognized needs to be stored in advance as a database. Therefore, the image search application itself installed in the smartphone needs to have a reference information database.

しかしながら、大量のリファレンス画像を認識しようとするほど、そのデータベースも大容量となり、結果的にそのアプリケーションのサイズ自体も大きくなる。これに対し、ユーザとしては、比較的メモリ容量が小さいスマートフォンに、大容量のアプリケーションをインストールすることに抵抗感を生じやすい。また、データベースが大容量となるほど、画像検索アプリケーションで検索に要する演算処理量(及び演算時間)も大きくなる。   However, the larger the number of reference images that are recognized, the larger the database becomes, and as a result, the size of the application itself increases. On the other hand, the user tends to feel resistance to installing a large-capacity application on a smartphone having a relatively small memory capacity. In addition, as the capacity of the database increases, the amount of computation processing (and computation time) required for retrieval by the image retrieval application increases.

勿論、スマートフォンにインストールされた画像検索用アプリケーションが、ネットワークを介して逐次にデータベースファイルのみをダウンロードすることもできる。しかしながら、データベースファイルの容量が大きくなるほど、そのダウンロードに要する時間も長くなり、結果的にユーザビリティを損なう可能性がある。   Of course, the image search application installed in the smartphone can also download only the database file sequentially via the network. However, the larger the capacity of the database file, the longer it takes to download it, which may result in a loss of usability.

そこで、本発明によれば、リファレンス情報のデータベースをできる限り小容量とすると共に、画像検索時の演算処理量も少なくすることができる画像検索装置、プログラム及び方法を提供することを目的とする。   Accordingly, an object of the present invention is to provide an image search apparatus, program, and method that can reduce the reference information database as much as possible and reduce the amount of calculation processing during image search.

本発明によれば、多数のリファレンス画像の中から、クエリ画像に類似したリファレンス画像を検索する画像検索装置であって、
ハッシュ値毎に、バイナリ特徴ベクトルの量子化に用いるハッシュコードブックを記憶するハッシュコードブック記憶手段と、
ハッシュ値毎に、情報量(エントロピー)の高いビット番号集合を記憶するビット番号コードブック記憶手段と、
クエリ画像及びリファレンス画像からバイナリ特徴ベクトルの集合を抽出する局所特徴抽出手段と、
ハッシュコードブック記憶手段を用いて、バイナリ特徴ベクトルに、最も類似するハッシュ値を出力するハッシュ手段と、
ビット番号コードブック記憶手段における当該ハッシュ値のビット番号集合を参照して、バイナリ特徴ベクトルから部分ビット列を選択するビット列生成手段と、
ハッシュ値毎に、リファレンス画像のビット列を対応付けて記憶する転置インデックス記憶手段と、
転置インデックス記憶手段を用いて、クエリ画像のビット列からリファレンス画像を検索する検索手段と
を有することを特徴とする。
According to the present invention, an image search device for searching a reference image similar to a query image from a number of reference images,
Hash codebook storage means for storing a hash codebook used for quantization of a binary feature vector for each hash value;
Bit number codebook storage means for storing a set of bit numbers having a high amount of information (entropy) for each hash value;
Local feature extraction means for extracting a set of binary feature vectors from a query image and a reference image;
Hashing means for outputting a hash value most similar to a binary feature vector using a hash codebook storage means;
A bit string generation unit that selects a partial bit string from a binary feature vector with reference to a bit number set of the hash value in the bit number codebook storage unit;
For each hash value, transposed index storage means for storing a bit string of a reference image in association with each other,
Search means for searching for a reference image from a bit string of a query image using transposed index storage means.

本発明の画像検索装置における他の実施形態によれば、
多数のリファレンス画像における大量のバイナリ特徴ベクトルをクラスタリングし、クラスタ毎の代表バイナリ特徴ベクトルと、その識別子であるハッシュ値とを、ハッシュコードブック記憶手段へ記憶させるハッシュコードブック生成手段を更に有することも好ましい。
According to another embodiment of the image search device of the present invention,
It may further comprise a hash codebook generating means for clustering a large number of binary feature vectors in a large number of reference images and storing the representative binary feature vector for each cluster and a hash value as an identifier thereof in a hash codebook storage means. preferable.

本発明の画像検索装置における他の実施形態によれば、
ハッシュコードブック生成手段は、クラスタリングに、k-means法又はk-medoids法を用いることも好ましい。
According to another embodiment of the image search device of the present invention,
It is also preferable that the hash codebook generating means uses a k-means method or a k-medoids method for clustering.

本発明の画像検索装置における他の実施形態によれば、
同一ハッシュ値の1つのクラスタに含まれる多数のバイナリ特徴ベクトルについて、当該ビットの情報量が高く、且つ、当該ビットと他のビットとの間で相関が小さいビット番号を並べたビット番号列を導出し、ハッシュ値毎のそのビット番号列をビット番号コードブック記憶手段へ記憶させるビット番号コードブック生成手段を更に有することも好ましい。
According to another embodiment of the image search device of the present invention,
For a number of binary feature vectors included in one cluster of the same hash value, a bit number sequence in which bit numbers with a high amount of information of the bit and a small correlation between the bit and other bits are arranged. It is also preferable to further include a bit number code book generating means for storing the bit number string for each hash value in the bit number code book storage means.

本発明の画像検索装置における他の実施形態によれば、
ビット番号コードブック生成手段は、ビット番号列に、1つのビット番号ずつ収容するために、
同一ハッシュ値の1つのクラスタに含まれる多数のバイナリ特徴ベクトルについて、各ビット(0/1)の平均値が0.5に近いビット(情報量が高いビット)から順に並べた仮ビット番号列を生成し、
仮ビット番号列の上位ビットから順に、既にビット番号列に収容された他のビットと間の相関係数の絶対値が所定閾値以下であれば、当該上位ビットのビット番号をビット番号列に収容し、これをビット番号列が所定数となるまで収容することも好ましい。
According to another embodiment of the image search device of the present invention,
The bit number code book generating means stores the bit number one by one in the bit number string.
For a large number of binary feature vectors included in one cluster of the same hash value, a temporary bit number sequence in which the average value of each bit (0/1) is arranged in order from the bit close to 0.5 (the bit with the highest amount of information) Generate and
If the absolute value of the correlation coefficient with other bits already accommodated in the bit number sequence is less than or equal to a predetermined threshold, the bit number of the upper bit is accommodated in the bit number sequence in order from the upper bit of the temporary bit number sequence It is also preferable to accommodate this until the bit number string reaches a predetermined number.

本発明の画像検索装置における他の実施形態によれば、
転置インデックス記憶手段は、リファレンス画像について、ハッシュ値LIDn毎に、リファレンス画像識別子とビット列との複数の組を、リスト形式で対応付けた転置インデックスを登録したものであることも好ましい。
According to another embodiment of the image search device of the present invention,
Preferably, the transposed index storage means registers a transposed index in which a plurality of sets of reference image identifiers and bit strings are associated in a list format for each hash value LIDn for the reference image.

本発明の画像検索装置における他の実施形態によれば、
検索手段は、
クエリ画像についてハッシュ値LIDn及びの複数の組を入力し、
クエリ画像のハッシュ値とビット列の各組について、当該ハッシュ値に対応する転置インデックスのリストを取得し、
クエリ画像ビット列と、取得したリスト中に含まれるリファレンス画像のビット列との間の非類似度を算出し、
非類似度が低いほど高くなるスコア値を算出し、
当該リファレンス画像毎に該スコア値を累積加算し、
スコア値が最も高くなるリファレンス画像を検索結果として出力することも好ましい。
According to another embodiment of the image search device of the present invention,
Search means are
Enter multiple sets of hash values LIDn and the query image,
For each set of hash value and bit string of query image, obtain a list of transposed indexes corresponding to the hash value,
Calculate the dissimilarity between the query image bit string and the reference image bit string included in the acquired list,
Calculate the score value that increases as the dissimilarity is lower,
The score value is cumulatively added for each reference image,
It is also preferable to output a reference image having the highest score value as a search result.

本発明の画像検索装置における他の実施形態によれば、
検索手段は、非類似度が小さい上位所定件数(K)に相当するスコア値のみを当該リファレンス画像に累積加算することも好ましい。
According to another embodiment of the image search device of the present invention,
It is also preferable that the search means cumulatively add only the score value corresponding to the upper predetermined number (K) having a low dissimilarity to the reference image.

本発明の画像検索装置における他の実施形態によれば、
検索手段について、上位所定件数(K)は、予め設定された固定数か、又は、予め設定された非類似度に関する閾値THに基づいて当該非類似度が閾値TH以下となる非類似度の数であることも好ましい。
According to another embodiment of the image search device of the present invention,
For the search means, the upper predetermined number (K) is a preset fixed number or the number of dissimilarities whose dissimilarity is equal to or less than the threshold TH based on a preset threshold TH related to dissimilarity It is also preferable.

本発明の画像検索装置における他の実施形態によれば、
検索手段における、上位所定件数(K)のうちi件目に対応する加算スコアについて、K番目の非類似度が、i番目の非類似度と比較して大きい場合に、加算スコアの値が大きく設定されることも好ましい。
According to another embodiment of the image search device of the present invention,
In the search means, for the addition score corresponding to the i-th item in the top predetermined number (K), if the K-th dissimilarity is larger than the i-th dissimilarity, the value of the addition score is large It is also preferable that it is set.

本発明の画像検索装置における他の実施形態によれば、
検索手段について、上位所定件数(K)のうちi件目に対応する加算スコアは、
(1)K番目の非類似度の二乗からi番目の非類似度の二乗を引いたものとするか、
(2)K番目の非類似度の二乗とi番目の非類似度の二乗の比から1を引いたものとするか、
(3)K番目の非類似度とi番目の非類似度の比の二乗から1を引いたものとするか、又は、
(4)K番目の非類似度とi番目の非類似度の比から1を引いたものの二乗とする
ことも好ましい。
According to another embodiment of the image search device of the present invention,
Regarding the search means, the addition score corresponding to the i-th item in the top predetermined number (K) is
(1) Whether the square of the i-th dissimilarity is subtracted from the square of the K-th dissimilarity,
(2) Whether 1 is subtracted from the ratio of the square of the Kth dissimilarity and the square of the ith dissimilarity,
(3) Subtract 1 from the square of the ratio of the Kth dissimilarity and the ith dissimilarity, or
(4) It is also preferable to set the square of the ratio of the Kth dissimilarity and the ith dissimilarity minus one.

本発明の画像検索装置における他の実施形態によれば、
局所特徴抽出手段は、ORB(Oriented FAST and Rotated BRIEF)、FREAK(Fast Retina Keypoint)、又はBRISK(Binary Robust Independent Elementary Features)に基づくバイナリ特徴ベクトルを抽出することも好ましい。
According to another embodiment of the image search device of the present invention,
The local feature extraction means preferably extracts a binary feature vector based on ORB (Oriented FAST and Rotated BRIEF), FREK (Fast Retina Keypoint), or BRISK (Binary Robust Independent Elementary Features).

本発明によれば、多数のリファレンス画像の中から、クエリ画像に類似したリファレンス画像を検索する装置に搭載されたコンピュータを機能させるプログラムであって、
ハッシュ値毎に、バイナリ特徴ベクトルの量子化に用いるハッシュコードブックを記憶するハッシュコードブック記憶手段と、
ハッシュ値毎に、情報量(エントロピー)の高いビット番号集合を記憶するビット番号コードブック記憶手段と、
クエリ画像及びリファレンス画像からバイナリ特徴ベクトルの集合を抽出する局所特徴抽出手段と、
ハッシュコードブック記憶手段を用いて、バイナリ特徴ベクトルに、最も類似するハッシュ値を出力するハッシュ手段と、
ビット番号コードブック記憶手段における当該ハッシュ値のビット番号集合を参照して、バイナリ特徴ベクトルから部分ビット列を選択するビット列生成手段と、
ハッシュ値毎に、リファレンス画像のビット列を対応付けて記憶する転置インデックス記憶手段と、
転置インデックス記憶手段を用いて、クエリ画像のビット列からリファレンス画像を検索する検索手段と
してコンピュータを機能させることを特徴とする。
According to the present invention, there is provided a program for causing a computer mounted on an apparatus for searching a reference image similar to a query image to function from among a large number of reference images,
Hash codebook storage means for storing a hash codebook used for quantization of a binary feature vector for each hash value;
Bit number codebook storage means for storing a set of bit numbers having a high amount of information (entropy) for each hash value;
Local feature extraction means for extracting a set of binary feature vectors from a query image and a reference image;
Hashing means for outputting a hash value most similar to a binary feature vector using a hash codebook storage means;
A bit string generation unit that selects a partial bit string from a binary feature vector with reference to a bit number set of the hash value in the bit number codebook storage unit;
For each hash value, transposed index storage means for storing a bit string of a reference image in association with each other,
Using the transposed index storage means, the computer functions as search means for searching for a reference image from a bit string of a query image.

本発明によれば、装置を用いて、多数のリファレンス画像の中から、クエリ画像に類似したリファレンス画像を検索する方法であって、
当該装置は、
ハッシュ値毎に、バイナリ特徴ベクトルの量子化に用いるハッシュコードブックを記憶するハッシュコードブック記憶部と、
ハッシュ値毎に、情報量(エントロピー)の高いビット番号集合を記憶するビット番号コードブック記憶部と、
ハッシュ値毎に、リファレンス画像のビット列を対応付けて記憶する転置インデックス記憶部と
を有し、
クエリ画像及びリファレンス画像からバイナリ特徴ベクトルの集合を抽出する第1のステップと、
ハッシュコードブック記憶部を用いて、バイナリ特徴ベクトルに、最も類似するハッシュ値を出力する第2のステップと、
ビット番号コードブック記憶部における当該ハッシュ値のビット番号集合を参照して、バイナリ特徴ベクトルから部分ビット列を選択する第3のステップと、
転置インデックス記憶部を用いて、クエリ画像のビット列からリファレンス画像を検索する第4のステップと
を有することを特徴とする。
According to the present invention, a method for searching a reference image similar to a query image from among a large number of reference images using an apparatus,
The device is
For each hash value, a hash codebook storage unit that stores a hash codebook used for quantization of binary feature vectors;
A bit number codebook storage unit for storing a set of bit numbers having a high amount of information (entropy) for each hash value;
For each hash value, it has a transposed index storage unit that stores a bit string of a reference image in association with each other,
A first step of extracting a set of binary feature vectors from a query image and a reference image;
A second step of outputting a hash value most similar to the binary feature vector using the hash codebook storage unit;
A third step of selecting a partial bit string from a binary feature vector with reference to a set of bit numbers of the hash value in the bit number codebook storage unit;
And a fourth step of searching the reference image from the bit string of the query image using the transposed index storage unit.

本発明の画像検索装置、プログラム及び方法によれば、リファレンス情報のデータベースをできる限り小容量とすると共に、画像検索時の演算処理量も少なくすることができる。   According to the image search apparatus, program, and method of the present invention, the reference information database can be made as small as possible, and the amount of calculation processing during image search can be reduced.

本発明における画像検索装置の機能構成図である。It is a functional block diagram of the image search device in the present invention. 本発明における検索情報配信サーバの機能構成図である。It is a function block diagram of the search information delivery server in this invention. 図2の検索情報配信サーバと通信可能な端末の機能構成図である。It is a function block diagram of the terminal which can communicate with the search information delivery server of FIG. 本発明における画像検索処理を表す説明図である。It is explanatory drawing showing the image search process in this invention. 本発明におけるビット列の生成を表す説明図である。It is explanatory drawing showing the production | generation of the bit string in this invention. 転置インデックス登録部のデータ構造を表す説明図である。It is explanatory drawing showing the data structure of a transposed index registration part. 検索部における処理を表す説明図である。It is explanatory drawing showing the process in a search part. 本発明における検索部の処理を表すフローチャートである。It is a flowchart showing the process of the search part in this invention.

以下、本発明の実施の形態について、図面を用いて詳細に説明する。   Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.

図1は、本発明における画像検索装置の機能構成図である。
図2は、本発明における検索情報配信サーバの機能構成図である。
図3は、図2の検索情報配信サーバと通信可能な端末の機能構成図である。
FIG. 1 is a functional configuration diagram of an image search apparatus according to the present invention.
FIG. 2 is a functional configuration diagram of the search information distribution server in the present invention.
FIG. 3 is a functional configuration diagram of a terminal capable of communicating with the search information distribution server of FIG.

画像検索装置1は、大量のリファレンス画像(検索対象画像)を予め入力し、データベース(コードブックやインデックス)を生成し蓄積している。そのために、以下のように2つの実施の形態に区分できる。
(1)画像検索装置(単体):図1のように、画像検索装置1は、ユーザから多数のリファレンス画像を入力し、そのリファレンス画像に対するデータベースを生成し蓄積する。そして、画像検索装置1は、ユーザからクエリ画像(検索キー画像)を入力し、データベースを用いてそのクエリ画像に対するリファレンス画像を検索し、そのリファレンス画像の検索結果をユーザに対して出力する。
The image search apparatus 1 inputs a large amount of reference images (search target images) in advance, and generates and accumulates a database (codebook or index). Therefore, it can be divided into two embodiments as follows.
(1) Image Retrieval Device (Single Unit): As shown in FIG. 1, the image retrieval device 1 inputs a large number of reference images from a user, and generates and accumulates a database for the reference images. Then, the image search device 1 inputs a query image (search key image) from the user, searches a reference image for the query image using a database, and outputs a search result of the reference image to the user.

(2)サーバ−クライアント・システム:図2のように、検索情報配信サーバ2は、大量のリファレンス画像を入力し、そのリファレンス画像に対するデータベースを生成し蓄積する。
クライアントとしての端末1は、ネットワークを介して検索情報配信サーバ2から、そのデータベース情報をダウンロードする。そのデータベース情報は、端末1の記憶領域(メモリ空間やディスク空間)に蓄積される。
そして、図3のように、端末1は、ユーザからクエリ画像を入力し、データベースを用いてそのクエリ画像に対するリファレンス画像を検索し、そのリファレンス画像の検索結果をユーザに対して出力する。
(2) Server-client system: As shown in FIG. 2, the search information distribution server 2 inputs a large amount of reference images, and generates and stores a database for the reference images.
The terminal 1 as a client downloads the database information from the search information distribution server 2 via the network. The database information is stored in a storage area (memory space or disk space) of the terminal 1.
Then, as illustrated in FIG. 3, the terminal 1 inputs a query image from the user, searches a reference image for the query image using a database, and outputs a search result of the reference image to the user.

図1と、図2及び図3とは、異なるシステム構成となるが、各機能構成部は全く同じである。以下では、代表的に図1を参照して説明する。   Although FIG. 1 differs from FIG. 2 and FIG. 3 in system configuration, each functional component is completely the same. The following description will be made with reference to FIG.

図1によれば、画像検索装置1は、ハッシュコードブック記憶部101と、ビット番号コードブック記憶部102と、転置インデックス記憶部103と、局所特徴抽出部11と、ハッシュ部12と、ビット列生成部13と、検索部14と、ハッシュコードブック生成部15と、ビット番号コードブック生成部16とを有する。これら機能構成部は、装置に搭載されたコンピュータを機能させる画像検索用プログラムを実行することによって実現される。例えばスマートフォンで画像を検索する場合、画像検索装置1は、インストール可能な画像検索アプリケーションであってもよい。また、これら機能構成部の処理の流れは、装置を用いた画像検索方法としても理解できる。   According to FIG. 1, the image search apparatus 1 includes a hash codebook storage unit 101, a bit number codebook storage unit 102, a transposed index storage unit 103, a local feature extraction unit 11, a hash unit 12, and a bit string generation. Section 13, search section 14, hash codebook generation section 15, and bit number codebook generation section 16. These functional components are realized by executing an image search program that causes a computer installed in the apparatus to function. For example, when searching for an image with a smartphone, the image search device 1 may be an installable image search application. Further, the processing flow of these functional components can be understood as an image search method using the apparatus.

図4は、本発明における画像検索処理を表す説明図である。以下では、適宜、図4を参照して説明する。   FIG. 4 is an explanatory diagram showing image search processing in the present invention. Hereinafter, description will be made with reference to FIG. 4 as appropriate.

[局所特徴抽出部11]
局所特徴抽出部11は、クエリ画像及びリファレンス画像から、局所特徴のバイナリ特徴ベクトルの集合を抽出する。本発明によれば、バイナリ特徴ベクトルの抽出アルゴリズムとして、ORB(Oriented FAST and Rotated BRIEF)又はFREAK(Fast Retina Keypoint)を用いる。ORBの場合、1つのコンテンツから256ビットのバイナリ特徴ベクトルの集合が抽出される。例えば、高速にマッチングを実行するべく、バイナリコードによる特徴記述としてBRIEF(Binary Robust Independent Elementary Features)がある。本発明によれば、BRIEFに回転不変性を導入した特徴記述をすることができる「ORB」を用いる。特に、ORBによれば、SIFTやSURFと比較して、同等以上の精度を保持すると共に、数百倍の高速化を実現することができる。
[Local feature extraction unit 11]
The local feature extraction unit 11 extracts a set of binary feature vectors of local features from the query image and the reference image. According to the present invention, ORB (Oriented FAST and Rotated BRIEF) or FRAK (Fast Retina Keypoint) is used as the binary feature vector extraction algorithm. In the case of ORB, a set of 256-bit binary feature vectors is extracted from one content. For example, in order to execute matching at high speed, there is BRIEF (Binary Robust Independent Elementary Features) as a feature description by a binary code. According to the present invention, “ORB” is used which can describe a feature in which rotation invariance is introduced into BRIEF. In particular, according to the ORB, it is possible to maintain an accuracy equal to or higher than that of SIFT or SURF and realize a speed increase of several hundred times.

ORBは、「特徴点検出処理」と「特徴ベクトル記述処理」との2つのステップから構成される。   The ORB is composed of two steps of “feature point detection processing” and “feature vector description processing”.

(特徴点検出処理)
ORBの特徴点検出処理によれば、高速にキーポイントを検出するためにFASTを用いる。また、FASTでは、スケール変化に対してロバストではないため、画像を複数のサイズに変換し、それぞれのサイズの画像から特徴点を抽出する。
また、既存のFASTには、回転不変性を得るためのキーポイントのオリエンテーション算出のアルゴリズムがない。そのために、ORBでは、回転不変性を得るべくOriented FASTを採用している。オリエンテーションを基準として特徴記述をすることによって、入力画像が回転していても、同一なキーポイントは同一な特徴量となって検出することができる。そのために、キーポイントの中心とパッチの輝度の重心の方向ベクトルを用いる。
(Feature point detection processing)
According to the ORB feature point detection process, FAST is used to detect key points at high speed. In addition, since FAST is not robust to scale changes, an image is converted into a plurality of sizes, and feature points are extracted from images of each size.
Further, the existing FAST does not have an algorithm for calculating the key point orientation for obtaining rotation invariance. Therefore, ORB adopts Oriented FAST in order to obtain rotational invariance. By describing the features based on the orientation, even if the input image is rotated, the same key point can be detected as the same feature amount. Therefore, the direction vector of the center of the key point and the center of gravity of the brightness of the patch is used.

(特徴ベクトル記述処理)
次に、ORBにおける特徴ベクトル記述処理によれば、検出された特徴点毎に、BRIEF特徴ベクトル記述子によってバイナリ特徴ベクトルが抽出される。これらは、特徴点周辺の2箇所のピクセルの輝度の大小関係から求められる。
BRIEFは、バイナリコードによってキーポイントの特徴量記述を実行することができる。SIFTやSURFによれば、特徴量記述に高次元の実数を用いていた。しかしながら、高次元の実数を用いた場合、メモリ容量の増加と類似度計算の増加と問題となる。そこで、ORBに基づくBRIEFを用いることによって、バイナリコードによって特徴記述することで省メモリ化し、類似度計算にハミング距離を用いることで処理コストの抑制を実現する。
BRIEFによれば、パッチ内においてランダムに選択された2点の輝度差の符号からバイナリコードを生成する。選択するピクセルは、キーポイント位置を中心としたガウス分布に従ってランダムに選択する。ここで、ORBは、更に高精度にマッチングをさせるために、学習を用いてピクセルを選択している。選択するピクセル位置は、ペアのビット分散が大きく且つN組のペアの相関が低い場合に、特徴記述能力が高いバイナリコードとして、特徴記述に使用する。N組のペアは、Greedyアルゴリズムを用いて絞り込む。
(Feature vector description processing)
Next, according to the feature vector description processing in the ORB, a binary feature vector is extracted for each detected feature point using the BRIEF feature vector descriptor. These are obtained from the magnitude relationship of the luminance of two pixels around the feature point.
BRIEF can execute keypoint feature description by binary code. According to SIFT and SURF, high-dimensional real numbers are used for feature description. However, when a high-dimensional real number is used, there is an increase in memory capacity and similarity calculation. Therefore, by using BREF based on ORB, it is possible to save memory by describing features by binary code, and it is possible to reduce processing costs by using a Hamming distance for similarity calculation.
According to BRIEF, a binary code is generated from the sign of the luminance difference between two points randomly selected in the patch. The pixels to be selected are randomly selected according to a Gaussian distribution centered on the key point position. Here, the ORB selects pixels using learning in order to perform matching with higher accuracy. The selected pixel position is used for feature description as a binary code with high feature description capability when the bit variance of the pair is large and the correlation of N pairs is low. N pairs are narrowed down using the Greedy algorithm.

[ハッシュコードブック記憶部101]
ハッシュコードブック記憶部101は、ハッシュ値s毎に、バイナリ特徴ベクトルの量子化に用いるハッシュコードブックを記憶する。図4によれば、コードブックは、バイナリ特徴ベクトルBと同一ビット長のコードベクトルB1〜BSを保存したものである。ORBのバイナリ特徴ベクトルの場合、例えば256ビット長である。
[Hash codebook storage unit 101]
The hash codebook storage unit 101 stores a hash codebook used for quantization of the binary feature vector for each hash value s. According to FIG. 4, the code book stores code vectors B 1 to B S having the same bit length as the binary feature vector B. In the case of an ORB binary feature vector, it is, for example, 256 bits long.

[ハッシュコードブック生成部15]
ハッシュコードブック生成部15は、多数のリファレンス画像における大量のバイナリ特徴ベクトルをクラスタリングする。クラスタリングには、ハミング距離を用いたk-medoids法を用いてもよいし、単純にk-means法を用いてもよい。ハッシュコードブック生成部15は、クラスタ毎の代表バイナリ特徴ベクトルをコードベクトルとし、その識別子であるハッシュ値を対応付けて、ハッシュコードブック記憶部101へ記憶させる。
[Hash codebook generator 15]
The hash codebook generation unit 15 clusters a large number of binary feature vectors in a large number of reference images. For clustering, the k-medoids method using the Hamming distance may be used, or the k-means method may be simply used. The hash codebook generation unit 15 uses a representative binary feature vector for each cluster as a code vector, associates a hash value as an identifier thereof, and stores the hash value in the hash codebook storage unit 101.

[ハッシュ部12]
ハッシュ部12は、ハッシュコードブック記憶部101を用いて、局所特徴抽出部11から出力されたバイナリ特徴ベクトルBに、最も類似するコードベクトルBsのハッシュ値LIDを出力する。ハッシュ部12は、バイナリ特徴ベクトルが類似していれば高い確率で同一のハッシュ値を返すことができる。そのために、同一のハッシュ値を持つバイナリ特徴ベクトルのみをマッチングすることによって高速化を実現できる。
[Hash part 12]
Using the hash codebook storage unit 101, the hash unit 12 outputs the hash value LID of the code vector B s most similar to the binary feature vector B output from the local feature extraction unit 11. If the binary feature vectors are similar, the hash unit 12 can return the same hash value with a high probability. Therefore, speeding up can be realized by matching only binary feature vectors having the same hash value.

「最も類似した」とは、例えばハミング距離が最も近いものであってもよい。
LID=argmins ham(B,Bs
ham(x,y):xとyとのハミング距離
ハッシュ部12は、クエリ画像のn(n=1〜N)番目のバイナリ特徴ベクトルのハッシュ値LIDn(=s)を、ビット列生成部13へ出力する。
“The most similar” may be, for example, the one having the shortest Hamming distance.
LID = argmin s ham (B, B s )
ham (x, y): Hamming distance between x and y The hash unit 12 uses the hash value LID n (= s) of the n (n = 1 to N) -th binary feature vector of the query image as the bit string generation unit 13. Output to.

データベースの検索時間は、特徴ベクトルのマッチングに多くの時間がかかることを考慮して、最も類似した特徴ベクトルとのみマッチングすることで高速化を実現する。   The database search time is increased by matching only the most similar feature vector in consideration of the fact that much time is required for feature vector matching.

[ビット番号コードブック記憶部102]
ビット番号コードブック記憶部102は、ハッシュ値s毎に、情報量(エントロピー)の高いビット番号集合を記憶する。ビット番号集合は、例えば64個である。図4によれば、ハッシュ値毎に、バイナリ特徴ベクトルのビット位置を表すビット番号が、情報量の高い順に登録されている。尚、ここで、情報量が高いビット番号の集合が登録されていればよく、必ずしも情報量が高い順である必要はない。
[Bit Number Codebook Storage Unit 102]
The bit number codebook storage unit 102 stores a set of bit numbers having a high information amount (entropy) for each hash value s. The number of bit number sets is 64, for example. According to FIG. 4, for each hash value, bit numbers representing the bit positions of the binary feature vectors are registered in descending order of information amount. Here, it is sufficient that a set of bit numbers having a high information amount is registered, and it is not always necessary that the information amount is in descending order.

[ビット列生成部13]
ビット列生成部13は、ビット番号コードブック記憶部102における当該ハッシュ値sのビット番号集合Cを参照して、バイナリ特徴ベクトルBから部分ビット列(例えば64ビット)を選択する。このビット列は、ビット番号集合Csに記述されているビット番号の位置のビットのみを、バイナリ特徴ベクトルBから取り出して並べたものである。これによって、入力されたバイナリ特徴ベクトルよりも短いビット列が生成されることとなる。これは、バイナリ特徴ベクトル間の識別に寄与するビット列のみを生成し、それ以外のビットを捨てることを意味する。そのビット列のみをコードブックとしてデータベースに保存することによって、データベース自体の容量を小さくすることができると共に、画像検索時の演算処理量も少なくすることができる。
[Bit string generation unit 13]
The bit string generation unit 13 refers to the bit number set C s of the hash value s in the bit number codebook storage unit 102 and selects a partial bit string (for example, 64 bits) from the binary feature vector B. In this bit string, only the bit at the position of the bit number described in the bit number set C s is extracted from the binary feature vector B and arranged. As a result, a bit string shorter than the input binary feature vector is generated. This means that only a bit string that contributes to discrimination between binary feature vectors is generated and the other bits are discarded. By storing only the bit string as a code book in the database, the capacity of the database itself can be reduced, and the amount of calculation processing at the time of image search can be reduced.

バイナリ特徴ベクトルBから、ハッシュ値LIDとビット列RCとの組が得られる。
(LID, RC)
LID:log2Sビット(Sは、ハッシュコードブック記憶部のコードブック数)
RC:L・log2Fビット(Fは、ビット番号コードブック記憶部のコードブック数)
From the binary feature vector B, a set of a hash value LID and a bit string RC is obtained.
(LID, RC)
LID: log 2 S bits (S is the number of codebooks in the hash codebook storage unit)
RC: L·log 2 F bit (F is the number of codebooks in the bit number codebook storage unit)

そして、ビット列生成部13は、以下の2つの方向で出力する。
(1)当該クエリ画像のバイナリ特徴ベクトルについては、ハッシュ値LIDn毎に、ビット列RCの複数の組を、検索部14へ出力する。
(2)当該リファレンス画像のバイナリ特徴ベクトルについては、ハッシュ値LIDn毎に、ビット列RCの複数の組を、転置インデックス登録部103へ出力する。
尚、LIDnにおけるnは、入力画像のn(n=1〜N)番目のバイナリ特徴ベクトルを表す。
Then, the bit string generation unit 13 outputs in the following two directions.
(1) For the binary feature vector of the query image, a plurality of sets of bit strings RC are output to the search unit 14 for each hash value LIDn.
(2) For the binary feature vector of the reference image, a plurality of sets of bit strings RC are output to the transposed index registration unit 103 for each hash value LIDn.
Note that n in LIDn represents the n (n = 1 to N) th binary feature vector of the input image.

[ビット番号コードブック生成部16]
ビット番号コードブック生成部16は、ハッシュ値毎にビット番号列を生成し、そのビット番号列を、ビット番号コードブック記憶部102へ記憶させる。ハッシュ値毎にビット列の分布が異なるため、それらの分布に適したビット番号列のコードブックを作成する。その「ビット番号列」は、同一ハッシュ値の1つのクラスタに含まれる多数のバイナリ特徴ベクトルについて、当該ビットの情報量が高く、且つ、当該ビットと他のビットとの間で相関が小さいビット番号を並べたものである。
[Bit Number Codebook Generation Unit 16]
The bit number code book generating unit 16 generates a bit number string for each hash value, and stores the bit number string in the bit number code book storage unit 102. Since the distribution of bit strings differs for each hash value, a code book of bit number strings suitable for those distributions is created. The “bit number sequence” is a bit number that has a high information amount of the bit and a small correlation between the bit and other bits for a number of binary feature vectors included in one cluster of the same hash value. Are arranged.

図5は、本発明におけるビット列の生成を表す説明図である。   FIG. 5 is an explanatory diagram showing generation of a bit string in the present invention.

ハッシュ値毎に、以下のステップでビット番号列が生成される。
(S51)バイナリ特徴ベクトルの全ビットの総当たりで、ビット間の相関係数を算出する。例えばORBの場合、図5のように256ビットの総当たりの相関係数が算出される(例えば非特許文献4参照)。相関係数は、−1〜1の値を取る。i番目のビットとj番目のビットと間の相関係数を、例えば以下では8つのベクトルを用いて算出する例を表す。
(0, 0, 0, 0, 1, 1, 1, 1)
↑ベクトル1のiビット目
↑ベクトル2のiビット目
↑ベクトル3のiビット目
・・・・・
↑ベクトル8のiビット目
(1, 1, 1, 1, 0, 0, 0, 0)
↑ベクトル1のjビット目
↑ベクトル2のjビット目
↑ベクトル3のjビット目
・・・・・
↑ベクトル8のjビット目
この場合、以下のように相関係数が算出される。
(0, 0, 0, 0, 1, 1, 1, 1)<->(1, 1, 1, 1, 0, 0, 0, 0) 相関係数=-1
同様に、他の例によれば、以下のように相関係数が算出される。
(0, 0, 0, 0, 1, 1, 1, 1)<->(0, 0, 0, 1, 1, 1, 1, 0) 相関係数=0.5
(0, 0, 0, 0, 1, 1, 1, 1)<->(0, 0, 1, 1, 1, 1, 0, 0) 相関係数=0
For each hash value, a bit number string is generated by the following steps.
(S51) A correlation coefficient between bits is calculated for all the bits of the binary feature vector. For example, in the case of ORB, a 256-bit round-robin correlation coefficient is calculated as shown in FIG. 5 (see, for example, Non-Patent Document 4). The correlation coefficient takes a value of −1 to 1. In the following, for example, the correlation coefficient between the i-th bit and the j-th bit is calculated using eight vectors.
(0, 0, 0, 0, 1, 1, 1, 1)
↑ i-th bit of vector 1
↑ i-th bit of vector 2
↑ Bit i of vector 3
...
↑ i-th bit of vector 8 (1, 1, 1, 1, 0, 0, 0, 0)
↑ jth bit of vector 1
↑ jth bit of vector 2
↑ jth bit of vector 3
...
↑ jth bit of vector 8 In this case, the correlation coefficient is calculated as follows.
(0, 0, 0, 0, 1, 1, 1, 1) <-> (1, 1, 1, 1, 0, 0, 0, 0) Correlation coefficient = -1
Similarly, according to another example, the correlation coefficient is calculated as follows.
(0, 0, 0, 0, 1, 1, 1, 1) <-> (0, 0, 0, 1, 1, 1, 1, 0) Correlation coefficient = 0.5
(0, 0, 0, 0, 1, 1, 1, 1) <-> (0, 0, 1, 1, 1, 1, 0, 0) Correlation coefficient = 0

(S52)同一ハッシュ値の1つのクラスタに含まれる多数のバイナリ特徴ベクトルについて、ビット番号毎の平均値を算出する。ここで、平均値から、以下のような関係が想定される。
平均値が0に近いほど、両方のビットが”0”である確率が高い。
平均値が0.5に近いほど、両方のビットが反転する確率が高い。
(一方のビットが”1”である場合に、他方のビットが”0”となりやすい)
平均値が1に近いほど、両方のビットが”1”である確率が高い。
(S52) The average value for each bit number is calculated for a number of binary feature vectors included in one cluster of the same hash value. Here, the following relationship is assumed from the average value.
The closer the average value is to 0, the higher the probability that both bits are “0”.
The closer the average value is to 0.5, the higher the probability that both bits are inverted.
(When one bit is “1”, the other bit is likely to be “0”)
The closer the average value is to 1, the higher the probability that both bits are “1”.

(S53)各ビット(0/1)の平均値が0.5に近いビット(情報量が高いビット)から順に並べた「仮ビット番号列」を生成する。 (S53) A “provisional bit number sequence” is generated in which the average value of each bit (0/1) is arranged in order from the bits close to 0.5 (bits with a large amount of information).

(S54)仮ビット番号列の上位ビットから順に、既にビット番号列に収容された他のビットと間の相関係数の絶対値が所定閾値以下であれば、当該上位ビットのビット番号をビット番号列に1ビットずつ収容する。これは、ビット間の相関が高いビット同士を選択しないようにすることを意味する。これをビット番号列が所定数(例えば64ビット)となるまで収容する。 (S54) If the absolute value of the correlation coefficient with other bits already accommodated in the bit number sequence is not more than a predetermined threshold in order from the upper bit of the temporary bit number sequence, the bit number of the upper bit is changed to the bit number. One bit is stored in the column. This means that bits having high correlation between bits are not selected. This is accommodated until the bit number string reaches a predetermined number (for example, 64 bits).

[転置インデックス記憶部103]
転置インデックス記憶部103は、ハッシュ値LIDn毎に、画像識別子RIDとビット列RCとの組(RID,RCn)をリストとして登録したものである。
[Transposed index storage unit 103]
The transposed index storage unit 103 registers a set (RID, RC n ) of an image identifier RID and a bit string RC as a list for each hash value LIDn.

図6は、転置インデックス登録部のデータ構造を表す説明図である。   FIG. 6 is an explanatory diagram showing the data structure of the inverted index registration unit.

リファレンス画像RIDには、ハッシュ値LIDnとビット列RCnとの複数の組が対応付けられている。
RID -> (LID1,RC1)(LID2,RC2)・・・(LIDn,RCn)・・・(LIDN,RCN
組(LID,RC)毎に、その画像識別子RIDとビット列RCとの組(RID,RC)を、転置インデックスにおけるそのハッシュ値LIDに連結して登録する。
LID1 -> (RID,RC)(RID,RC)(RID,RC)・・・
LID2 -> (RID,RC)(RID,RC)(RID,RC)・・・
・・・
LIDn -> (RID,RC)(RID,RC)(RID,RC)・・・
・・・
A plurality of sets of hash values LIDn and bit strings RCn are associated with the reference image RID.
RID-> (LID 1 , RC 1 ) (LID 2 , RC 2 ) ... (LID n , RC n ) ... (LID N , RC N )
For each pair (LID, RC), the pair (RID, RC) of the image identifier RID and the bit string RC is registered by being linked to the hash value LID in the transposed index.
LID 1- > (RID, RC) (RID, RC) (RID, RC) ...
LID 2- > (RID, RC) (RID, RC) (RID, RC) ...
...
LID n- > (RID, RC) (RID, RC) (RID, RC) ...
...

[検索部14]
検索部14は、転置インデックス記憶部103を用いて、クエリ画像のビット列からリファレンス画像を検索する。入力されるクエリ画像は、ハッシュ値LIDn及びビット列QCnの複数の組からなる。
クエリ符号 ->(LID1,QC1)(LID2,QC2)・・・(LIDn,QCn)・・・(LIDN,QCN
[Search unit 14]
The search unit 14 uses the transposed index storage unit 103 to search for a reference image from the bit string of the query image. The input query image is composed of a plurality of sets of hash values LID n and bit strings QC n .
Query code-> (LID 1 , QC 1 ) (LID 2 , QC 2 ) ... (LID n , QC n ) ... (LID N , QC N )

図7は、検索部における処理を表す説明図である。
図8は、本発明における検索部の処理を表すフローチャートである。
FIG. 7 is an explanatory diagram illustrating processing in the search unit.
FIG. 8 is a flowchart showing the processing of the search unit in the present invention.

検索部14は、以下の処理ステップを、リファレンス画像毎に実行し(S4)、最終的に、最も高いスコア値のリファレンス画像を検索結果として出力する(S5)。
score[]=0 (S0)
for each i=1〜N
転置インデックスのLIDi番目のリストを取得 (S1)
リスト中の組(RID1, RC1)〜(RIDM, RCM)について
クエリ画像に基づく組(QCi, RCj)の距離Dijを算出し、
距離と画像識別子の組(Dij, RIDj)を作成する (S2)
ijを昇順にソートする (S3)
上位K番目までの組Di'j'を選択する
for each k=1〜K
k番目のDi'j'について、score[RCj']+=S(Di'j',D)
end for
end for
The search unit 14 executes the following processing steps for each reference image (S4), and finally outputs the reference image having the highest score value as a search result (S5).
score [] = 0 (S0)
for each i = 1 to N
Get LID i- th list of inverted index (S1)
About pairs (RID 1 , RC 1 ) to (RID M , RC M ) in the list
The distance D ij of the pair (QC i , RC j ) based on the query image is calculated,
A pair of distance and image identifier (D ij , RID j ) is created (S2)
Sort D ij in ascending order (S3)
Select the top K-th set D i'j '
for each k = 1 ~ K
For the k-th D i′j ′ , score [RC j ′ ] + = S (D i′j ′ , D)
end for
end for

(S80)最初に、初期設定として、変数score[]=0とする。 (S80) First, as an initial setting, a variable score [] = 0 is set.

検索部14は、以下のS1〜S3の処理を、入力されたクエリ画像に基づくハッシュ値とビット列の組(LIDi, QCi)毎に、繰り返し実行する(i=1〜N)。 The search unit 14 repeatedly executes the following processes S1 to S3 for each set of hash values and bit strings (LID i , QC i ) based on the input query image (i = 1 to N).

(S81)クエリ画像の各ハッシュ値とビット列の組(LIDi,QCi)について、当該ハッシュ値LIDiに対応する転置インデックスのリスト(RIDj,RCj)・・・を取得する。 (S81) For each hash value and bit string pair (LID i , QC i ) of the query image, a transposed index list (RID j , RC j )... Corresponding to the hash value LID i is acquired.

(S82)転置インデックスの当該ハッシュ値LIDiに並ぶリストの分だけ、以下の処理を繰り返し実行する(j=1〜M)。
クエリ画像のビット列QCiと、取得したリスト中のリファレンス画像の各ビット列RCjとの間の距離Dijを算出する。そして、その距離Dijと画像識別子RIDjとの組(Dij, RIDj)を作成する。
(S82) The following processing is repeatedly executed for the list arranged in the hash value LID i of the inverted index (j = 1 to M).
A distance D ij between the bit string QC i of the query image and each bit string RC j of the reference image in the acquired list is calculated. Then, a set (D ij , RID j ) of the distance D ij and the image identifier RID j is created.

(S83)次に、距離Dijと画像識別子RIDjとの組(Dij, RIDj)を、距離が短い順(昇順)にソートする。 (S83) Next, the sets (D ij , RID j ) of the distance D ij and the image identifier RID j are sorted in ascending order of distance (ascending order).

そして、距離が短い上位所定件数(K)のみを選択する。距離が短いとは、類似度が高いことを意味する。また、上位所定件数(K)は、予め設定された固定数であってもよい。又は、予め設定された距離に関する閾値THに基づいて当該距離が閾値TH以下となる距離の数であってもよい。   Then, only the upper predetermined number (K) having a short distance is selected. A short distance means a high degree of similarity. The upper predetermined number (K) may be a fixed number set in advance. Alternatively, the distance may be the number of distances where the distance is equal to or less than the threshold TH based on a preset threshold TH related to the distance.

具体的には、上位K件の複数の組(Dij, RIDj)について、距離が短いほど高くなるスコア値を算出し、それらスコア値を累積加算する。具体的には、k番目の距離Di'j'及びK番目の距離Dを用いて、以下のいずれかによって、スコア値を算出する。
S(Di'j',D):k番目の距離を持つ画像への投票スコア値
(1)k番目の距離の二乗から、i番目の距離の二乗を引いたものとする
S(Di'j',D)=D2−Di'j' 2
(2)k番目の距離の二乗とi番目の距離の二乗の比から、1を引いたものとする
S(Di'j',D)=D2/Di'j' 2−1
(3)k番目の距離とi番目の距離の比の二乗から、1を引いたものとする
S(Di'j',D)=(D/Di'j')2−1
(4)k番目の距離とi番目の距離の比から1を引いたものの二乗とする
S(Di'j',D)=(D/Di'j'−1)2
Specifically, for a plurality of sets (D ij , RID j ) of the top K, a score value that increases as the distance is shorter is calculated, and the score values are cumulatively added. Specifically, using the kth distance D i′j ′ and the Kth distance D, the score value is calculated by either of the following.
S (D i′j ′ , D): Vote score value for image having k-th distance (1) The square of i-th distance is subtracted from the square of k-th distance S (D i 'j' , D) = D 2 -D i'j ' 2
(2) It is assumed that 1 is subtracted from the ratio of the square of the kth distance and the square of the ith distance. S (D i′j ′ , D) = D 2 / D i′j ′ 2 −1
(3) It is assumed that 1 is subtracted from the square of the ratio of the kth distance and the ith distance. S (D i′j ′ , D) = (D / D i′j ′ ) 2 −1
(4) S (D i′j ′ , D) = (D / D i′j ′ −1) 2, which is the square of 1 minus the ratio of the kth distance and the ith distance

(S84)当該リファレンス画像毎に該スコア値を累積加算する。次のリファレンス画像について、S1〜S3を繰り返す。 (S84) The score values are cumulatively added for each reference image. S1 to S3 are repeated for the next reference image.

(S85)最終的に、スコア値が最も高くなるリファレンス画像を、検索結果として出力する。 (S85) Finally, the reference image with the highest score value is output as the search result.

以上、詳細に説明したように、本発明の画像検索装置、システム、プログラム及び方法によれば、リファレンス情報のデータベースをできる限り小容量とすると共に、画像検索時の演算処理量も少なくすることができる。   As described above in detail, according to the image search apparatus, system, program, and method of the present invention, the reference information database can be made as small as possible and the amount of calculation processing during image search can be reduced. it can.

前述した本発明の種々の実施形態について、本発明の技術思想及び見地の範囲の種々の変更、修正及び省略は、当業者によれば容易に行うことができる。前述の説明はあくまで例であって、何ら制約しようとするものではない。本発明は、特許請求の範囲及びその均等物として限定するものにのみ制約される。   Various changes, modifications, and omissions of the above-described various embodiments of the present invention can be easily made by those skilled in the art. The above description is merely an example, and is not intended to be restrictive. The invention is limited only as defined in the following claims and the equivalents thereto.

1 画像検索装置、端末
101 ハッシュコードブック記憶部
102 ビット番号コードブック記憶部
103 転置インデックス記憶部
11 局所特徴抽出部
12 ハッシュ部
13 ビット列生成部
14 検索部
15 ハッシュコードブック生成部
16 ビット番号コードブック生成部
2 検索情報配信サーバ
DESCRIPTION OF SYMBOLS 1 Image search device, terminal 101 Hash code book storage unit 102 Bit number code book storage unit 103 Transposed index storage unit 11 Local feature extraction unit 12 Hash unit 13 Bit string generation unit 14 Search unit 15 Hash code book generation unit 16 Bit number code book Generation unit 2 Search information distribution server

Claims (14)

多数のリファレンス画像の中から、クエリ画像に類似したリファレンス画像を検索する画像検索装置であって、
ハッシュ値毎に、バイナリ特徴ベクトルの量子化に用いるハッシュコードブックを記憶するハッシュコードブック記憶手段と、
前記ハッシュ値毎に、情報量(エントロピー)の高いビット番号集合を記憶するビット番号コードブック記憶手段と、
前記クエリ画像及び前記リファレンス画像からバイナリ特徴ベクトルの集合を抽出する局所特徴抽出手段と、
前記ハッシュコードブック記憶手段を用いて、前記バイナリ特徴ベクトルに、最も類似するハッシュ値を出力するハッシュ手段と、
前記ビット番号コードブック記憶手段における当該ハッシュ値のビット番号集合を参照して、前記バイナリ特徴ベクトルから部分ビット列を選択するビット列生成手段と、
前記ハッシュ値毎に、前記リファレンス画像のビット列を対応付けて記憶する転置インデックス記憶手段と、
前記転置インデックス記憶手段を用いて、前記クエリ画像のビット列からリファレンス画像を検索する検索手段と
を有することを特徴とする画像検索装置。
An image search device for searching a reference image similar to a query image from a large number of reference images,
Hash codebook storage means for storing a hash codebook used for quantization of a binary feature vector for each hash value;
Bit number codebook storage means for storing a set of bit numbers having a high amount of information (entropy) for each hash value;
Local feature extraction means for extracting a set of binary feature vectors from the query image and the reference image;
Hashing means for outputting the most similar hash value to the binary feature vector using the hash codebook storage means;
A bit string generation means for selecting a partial bit string from the binary feature vector with reference to a bit number set of the hash value in the bit number codebook storage means;
For each hash value, transposed index storage means for storing a bit string of the reference image in association with each other,
An image search apparatus comprising: search means for searching for a reference image from a bit string of the query image using the transposed index storage means.
多数のリファレンス画像における大量のバイナリ特徴ベクトルをクラスタリングし、クラスタ毎の代表バイナリ特徴ベクトルと、その識別子であるハッシュ値とを、前記ハッシュコードブック記憶手段へ記憶させるハッシュコードブック生成手段を更に有することを特徴とする請求項1に記載の画像検索装置。   A hash codebook generating means for clustering a large number of binary feature vectors in a large number of reference images and storing a representative binary feature vector for each cluster and a hash value as an identifier thereof in the hash codebook storage means; The image search device according to claim 1. 前記ハッシュコードブック生成手段は、クラスタリングに、k-means法又はk-medoids法を用いることを特徴とする請求項2に記載の画像検索装置。   The image search apparatus according to claim 2, wherein the hash codebook generating unit uses a k-means method or a k-medoids method for clustering. 同一ハッシュ値の1つのクラスタに含まれる多数のバイナリ特徴ベクトルについて、当該ビットの情報量が高く、且つ、当該ビットと他のビットとの間で相関が小さいビット番号を並べたビット番号列を導出し、ハッシュ値毎のそのビット番号列を前記ビット番号コードブック記憶手段へ記憶させるビット番号コードブック生成手段を更に有することを特徴とする請求項2又は3に記載の画像検索装置。   For a number of binary feature vectors included in one cluster of the same hash value, a bit number sequence in which bit numbers with a high amount of information of the bit and a small correlation between the bit and other bits are arranged. 4. The image search apparatus according to claim 2, further comprising a bit number code book generating unit that stores the bit number string for each hash value in the bit number code book storage unit. 前記ビット番号コードブック生成手段は、前記ビット番号列に、1つのビット番号ずつ収容するために、
同一ハッシュ値の1つのクラスタに含まれる多数のバイナリ特徴ベクトルについて、各ビット(0/1)の平均値が0.5に近いビット(情報量が高いビット)から順に並べた仮ビット番号列を生成し、
前記仮ビット番号列の上位ビットから順に、既にビット番号列に収容された他のビットと間の相関係数の絶対値が所定閾値以下であれば、当該上位ビットのビット番号を前記ビット番号列に収容し、これを前記ビット番号列が所定数となるまで収容する
ことを特徴とする請求項4に記載の画像検索装置。
The bit number code book generating means stores the bit number string one bit number at a time in the bit number string.
For a large number of binary feature vectors included in one cluster of the same hash value, a temporary bit number sequence in which the average value of each bit (0/1) is arranged in order from the bit close to 0.5 (the bit with the highest amount of information) Generate and
If the absolute value of the correlation coefficient between other bits already contained in the bit number sequence in order from the upper bit of the temporary bit number sequence is less than or equal to a predetermined threshold, the bit number of the upper bit is changed to the bit number sequence. The image search apparatus according to claim 4, wherein the image search apparatus stores the data until the bit number string reaches a predetermined number.
前記転置インデックス記憶手段は、リファレンス画像について、ハッシュ値LIDn毎に、リファレンス画像識別子と前記ビット列との複数の組を、リスト形式で対応付けた転置インデックスを登録したものである
ことを特徴とする請求項1から5のいずれか1項に記載の画像検索装置。
The transposed index storage unit registers a transposed index in which a plurality of pairs of a reference image identifier and the bit string are associated in a list format for each hash value LIDn with respect to a reference image. Item 6. The image search device according to any one of Items 1 to 5.
前記検索手段は、
クエリ画像についてハッシュ値LIDn及びの複数の組を入力し、
前記クエリ画像のハッシュ値とビット列の各組について、当該ハッシュ値に対応する転置インデックスのリストを取得し、
前記クエリ画像ビット列と、取得したリスト中に含まれるリファレンス画像のビット列との間の非類似度を算出し、
前記非類似度が低いほど高くなるスコア値を算出し、
当該リファレンス画像毎に該スコア値を累積加算し、
前記スコア値が最も高くなるリファレンス画像を検索結果として出力する
ことを特徴とする画像検索装置。
The search means includes
Enter multiple sets of hash values LIDn and the query image,
For each set of hash value and bit string of the query image, obtain a list of transposed indexes corresponding to the hash value,
Calculating the dissimilarity between the query image bit string and the bit string of the reference image included in the acquired list;
Calculate a score value that increases as the dissimilarity is lower,
The score value is cumulatively added for each reference image,
An image search apparatus that outputs a reference image having the highest score value as a search result.
前記検索手段は、非類似度が小さい上位所定件数(K)に相当するスコア値のみを当該リファレンス画像に累積加算することを特徴とする請求項7に記載の画像検索装置。   The image search apparatus according to claim 7, wherein the search means cumulatively adds only a score value corresponding to the upper predetermined number (K) having a low dissimilarity to the reference image. 前記検索手段について、前記上位所定件数(K)は、予め設定された固定数か、又は、予め設定された非類似度に関する閾値THに基づいて当該非類似度が閾値TH以下となる非類似度の数であることを特徴とする請求項7に記載の画像検索装置。   For the search means, the upper predetermined number (K) is a preset fixed number, or a dissimilarity in which the dissimilarity is equal to or less than a threshold TH based on a preset threshold TH related to dissimilarity The image search device according to claim 7, wherein 前記検索手段における、前記上位所定件数(K)のうちi件目に対応する加算スコアについて、K番目の非類似度が、i番目の非類似度と比較して大きい場合に、加算スコアの値が大きく設定される
ことを特徴とする請求項7に記載の画像検索装置。
In the search means, when the K-th dissimilarity is larger than the i-th dissimilarity for the i-th added score corresponding to the i-th among the upper predetermined number (K), the value of the added score The image search device according to claim 7, wherein a large value is set.
前記検索手段について、前記上位所定件数(K)のうちi件目に対応する加算スコアは、
(1)K番目の非類似度の二乗からi番目の非類似度の二乗を引いたものとするか、
(2)K番目の非類似度の二乗とi番目の非類似度の二乗の比から1を引いたものとするか、
(3)K番目の非類似度とi番目の非類似度の比の二乗から1を引いたものとするか、又は、
(4)K番目の非類似度とi番目の非類似度の比から1を引いたものの二乗とする
ことを特徴とする請求項7に記載の画像検索装置。
For the search means, the addition score corresponding to the i-th among the upper predetermined number (K) is:
(1) Whether the square of the i-th dissimilarity is subtracted from the square of the K-th dissimilarity,
(2) Whether 1 is subtracted from the ratio of the square of the Kth dissimilarity and the square of the ith dissimilarity,
(3) Subtract 1 from the square of the ratio of the Kth dissimilarity and the ith dissimilarity, or
(4) The image search apparatus according to claim 7, wherein the ratio is obtained by subtracting 1 from the ratio of the Kth dissimilarity and the ith dissimilarity to the square.
前記局所特徴抽出手段は、ORB(Oriented FAST and Rotated BRIEF)、FREAK(Fast Retina Keypoint)、又はBRISK (Binary Robust Independent Elementary Features)に基づくバイナリ特徴ベクトルを抽出する、
ことを特徴とする請求項1から11のいずれか1項に記載の画像検索装置。
The local feature extraction means extracts a binary feature vector based on ORB (Oriented FAST and Rotated BRIEF), FREK (Fast Retina Keypoint), or BRISK (Binary Robust Independent Elementary Features).
The image search apparatus according to claim 1, wherein the image search apparatus is an image search apparatus.
多数のリファレンス画像の中から、クエリ画像に類似したリファレンス画像を検索する装置に搭載されたコンピュータを機能させるプログラムであって、
ハッシュ値毎に、バイナリ特徴ベクトルの量子化に用いるハッシュコードブックを記憶するハッシュコードブック記憶手段と、
前記ハッシュ値毎に、情報量(エントロピー)の高いビット番号集合を記憶するビット番号コードブック記憶手段と、
前記クエリ画像及び前記リファレンス画像からバイナリ特徴ベクトルの集合を抽出する局所特徴抽出手段と、
前記ハッシュコードブック記憶手段を用いて、前記バイナリ特徴ベクトルに、最も類似するハッシュ値を出力するハッシュ手段と、
前記ビット番号コードブック記憶手段における当該ハッシュ値のビット番号集合を参照して、前記バイナリ特徴ベクトルから部分ビット列を選択するビット列生成手段と、
前記ハッシュ値毎に、前記リファレンス画像のビット列を対応付けて記憶する転置インデックス記憶手段と、
前記転置インデックス記憶手段を用いて、前記クエリ画像のビット列からリファレンス画像を検索する検索手段と
してコンピュータを機能させることを特徴とするプログラム。
A program for causing a computer mounted on a device for searching a reference image similar to a query image to function from among a large number of reference images,
Hash codebook storage means for storing a hash codebook used for quantization of a binary feature vector for each hash value;
Bit number codebook storage means for storing a set of bit numbers having a high amount of information (entropy) for each hash value;
Local feature extraction means for extracting a set of binary feature vectors from the query image and the reference image;
Hashing means for outputting the most similar hash value to the binary feature vector using the hash codebook storage means;
A bit string generation means for selecting a partial bit string from the binary feature vector with reference to a bit number set of the hash value in the bit number codebook storage means;
For each hash value, transposed index storage means for storing a bit string of the reference image in association with each other,
A program that causes a computer to function as search means for searching a reference image from a bit string of the query image using the transposed index storage means.
装置を用いて、多数のリファレンス画像の中から、クエリ画像に類似したリファレンス画像を検索する方法であって、
当該装置は、
ハッシュ値毎に、バイナリ特徴ベクトルの量子化に用いるハッシュコードブックを記憶するハッシュコードブック記憶部と、
前記ハッシュ値毎に、情報量(エントロピー)の高いビット番号集合を記憶するビット番号コードブック記憶部と、
前記ハッシュ値毎に、前記リファレンス画像のビット列を対応付けて記憶する転置インデックス記憶部と
を有し、
前記クエリ画像及び前記リファレンス画像からバイナリ特徴ベクトルの集合を抽出する第1のステップと、
前記ハッシュコードブック記憶部を用いて、前記バイナリ特徴ベクトルに、最も類似するハッシュ値を出力する第2のステップと、
前記ビット番号コードブック記憶部における当該ハッシュ値のビット番号集合を参照して、前記バイナリ特徴ベクトルから部分ビット列を選択する第3のステップと、
前記転置インデックス記憶部を用いて、前記クエリ画像のビット列からリファレンス画像を検索する第4のステップと
を有することを特徴とする方法。
A method of searching for a reference image similar to a query image from a number of reference images using an apparatus,
The device is
For each hash value, a hash codebook storage unit that stores a hash codebook used for quantization of binary feature vectors;
A bit number codebook storage unit for storing a set of bit numbers having a high amount of information (entropy) for each hash value;
A transposed index storage unit that stores a bit string of the reference image in association with each hash value;
A first step of extracting a set of binary feature vectors from the query image and the reference image;
A second step of outputting a hash value most similar to the binary feature vector using the hash codebook storage unit;
A third step of selecting a partial bit string from the binary feature vector by referring to a bit number set of the hash value in the bit number codebook storage unit;
And a fourth step of searching for a reference image from a bit string of the query image using the transposed index storage unit.
JP2013189872A 2013-09-12 2013-09-12 Image search apparatus, system, program, and method using binary feature vector based on image Active JP6041439B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013189872A JP6041439B2 (en) 2013-09-12 2013-09-12 Image search apparatus, system, program, and method using binary feature vector based on image

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013189872A JP6041439B2 (en) 2013-09-12 2013-09-12 Image search apparatus, system, program, and method using binary feature vector based on image

Publications (2)

Publication Number Publication Date
JP2015056077A true JP2015056077A (en) 2015-03-23
JP6041439B2 JP6041439B2 (en) 2016-12-07

Family

ID=52820424

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013189872A Active JP6041439B2 (en) 2013-09-12 2013-09-12 Image search apparatus, system, program, and method using binary feature vector based on image

Country Status (1)

Country Link
JP (1) JP6041439B2 (en)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017045291A (en) * 2015-08-27 2017-03-02 ムラタオフィス株式会社 Similar image searching system
JP2017084087A (en) * 2015-10-28 2017-05-18 Kddi株式会社 Screen specifying system, screen specifying apparatus, and screen specifying method
CN109712210A (en) * 2018-12-17 2019-05-03 重庆长安汽车股份有限公司 Image generation method based on block chain
WO2019085765A1 (en) * 2017-11-06 2019-05-09 北京三快在线科技有限公司 Image retrieval
CN109783667A (en) * 2019-01-14 2019-05-21 西安电子科技大学 A kind of method, client and the system of image storage and retrieval
CN109840525A (en) * 2017-11-27 2019-06-04 中国科学院沈阳计算技术研究所有限公司 The extraction of circumference binary features with match searching method
CN110083731A (en) * 2019-03-12 2019-08-02 平安科技(深圳)有限公司 Image search method, device, computer equipment and storage medium
CN110188223A (en) * 2019-06-06 2019-08-30 腾讯科技(深圳)有限公司 Image processing method, device and computer equipment
JP2019537128A (en) * 2016-10-20 2019-12-19 コルティカル.アイオー アーゲー Method and system for identifying similarities between multiple data representations
KR102058393B1 (en) 2017-11-30 2019-12-23 국민대학교산학협력단 Sketch-based media plagiarism inspection method and apparatus
CN110895573A (en) * 2018-08-24 2020-03-20 华为技术有限公司 Retrieval method and device
JP2020173640A (en) * 2019-04-11 2020-10-22 株式会社日立ソリューションズ Image search device and image search method
CN111814807A (en) * 2020-07-16 2020-10-23 北京字节跳动网络技术有限公司 Method, apparatus, electronic device, and computer-readable medium for processing image
CN111832706A (en) * 2020-07-08 2020-10-27 西安电子科技大学 Hash center-based continuous learning method
CN111897982A (en) * 2020-06-17 2020-11-06 昆明理工大学 Medical CT image storage and retrieval method
US11734332B2 (en) 2020-11-19 2023-08-22 Cortical.Io Ag Methods and systems for reuse of data item fingerprints in generation of semantic maps
CN113704532B (en) * 2020-11-25 2024-04-26 天翼数字生活科技有限公司 Method and system for improving picture retrieval recall rate

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109710656A (en) * 2018-11-12 2019-05-03 清华大学 Approximate enquiring method and device
CN111382298B (en) * 2018-12-30 2021-04-20 北京房江湖科技有限公司 Image retrieval method and device based on picture content and electronic equipment

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012043397A (en) * 2010-07-21 2012-03-01 Nippon Telegr & Teleph Corp <Ntt> Feature amount acquisition device, feature amount acquisition method, similar image retrieval method and program
JP2012160047A (en) * 2011-02-01 2012-08-23 Denso It Laboratory Inc Corresponding reference image retrieval device and method thereof, content superimposing apparatus, system, method, and computer program
JP2013012076A (en) * 2011-06-29 2013-01-17 Kddi Corp Retrieval device and program for retrieving high dimensional feature vector with high accuracy

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012043397A (en) * 2010-07-21 2012-03-01 Nippon Telegr & Teleph Corp <Ntt> Feature amount acquisition device, feature amount acquisition method, similar image retrieval method and program
JP2012160047A (en) * 2011-02-01 2012-08-23 Denso It Laboratory Inc Corresponding reference image retrieval device and method thereof, content superimposing apparatus, system, method, and computer program
JP2013012076A (en) * 2011-06-29 2013-01-17 Kddi Corp Retrieval device and program for retrieving high dimensional feature vector with high accuracy

Cited By (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017045291A (en) * 2015-08-27 2017-03-02 ムラタオフィス株式会社 Similar image searching system
JP2017084087A (en) * 2015-10-28 2017-05-18 Kddi株式会社 Screen specifying system, screen specifying apparatus, and screen specifying method
JP2019537128A (en) * 2016-10-20 2019-12-19 コルティカル.アイオー アーゲー Method and system for identifying similarities between multiple data representations
JP7032397B2 (en) 2016-10-20 2022-03-08 コルティカル.アイオー アーゲー Methods and systems for identifying similarities between multiple data representations
US11216248B2 (en) 2016-10-20 2022-01-04 Cortical.Io Ag Methods and systems for identifying a level of similarity between a plurality of data representations
US11714602B2 (en) 2016-10-20 2023-08-01 Cortical.Io Ag Methods and systems for identifying a level of similarity between a plurality of data representations
US11281714B2 (en) 2017-11-06 2022-03-22 Beijing Sankuai Online Technology Co., Ltd Image retrieval
WO2019085765A1 (en) * 2017-11-06 2019-05-09 北京三快在线科技有限公司 Image retrieval
CN109840525A (en) * 2017-11-27 2019-06-04 中国科学院沈阳计算技术研究所有限公司 The extraction of circumference binary features with match searching method
CN109840525B (en) * 2017-11-27 2022-09-20 中国科学院沈阳计算技术研究所有限公司 Extraction and matching search method of circumferential binary features
KR102058393B1 (en) 2017-11-30 2019-12-23 국민대학교산학협력단 Sketch-based media plagiarism inspection method and apparatus
CN110895573A (en) * 2018-08-24 2020-03-20 华为技术有限公司 Retrieval method and device
CN110895573B (en) * 2018-08-24 2022-04-05 华为技术有限公司 Retrieval method and device
CN109712210B (en) * 2018-12-17 2023-03-28 重庆长安汽车股份有限公司 Block chain-based graph generation method
CN109712210A (en) * 2018-12-17 2019-05-03 重庆长安汽车股份有限公司 Image generation method based on block chain
CN109783667B (en) * 2019-01-14 2023-10-27 西安电子科技大学 Image storage and retrieval method, client and system
CN109783667A (en) * 2019-01-14 2019-05-21 西安电子科技大学 A kind of method, client and the system of image storage and retrieval
CN110083731A (en) * 2019-03-12 2019-08-02 平安科技(深圳)有限公司 Image search method, device, computer equipment and storage medium
JP2020173640A (en) * 2019-04-11 2020-10-22 株式会社日立ソリューションズ Image search device and image search method
JP7118920B2 (en) 2019-04-11 2022-08-16 株式会社日立ソリューションズ Image retrieval device and image retrieval method
CN110188223B (en) * 2019-06-06 2022-10-04 腾讯科技(深圳)有限公司 Image processing method and device and computer equipment
CN110188223A (en) * 2019-06-06 2019-08-30 腾讯科技(深圳)有限公司 Image processing method, device and computer equipment
CN111897982A (en) * 2020-06-17 2020-11-06 昆明理工大学 Medical CT image storage and retrieval method
CN111897982B (en) * 2020-06-17 2023-03-14 昆明理工大学 Medical CT image storage and retrieval method
CN111832706A (en) * 2020-07-08 2020-10-27 西安电子科技大学 Hash center-based continuous learning method
CN111814807A (en) * 2020-07-16 2020-10-23 北京字节跳动网络技术有限公司 Method, apparatus, electronic device, and computer-readable medium for processing image
CN111814807B (en) * 2020-07-16 2023-10-24 抖音视界有限公司 Method, apparatus, electronic device, and computer-readable medium for processing image
US11734332B2 (en) 2020-11-19 2023-08-22 Cortical.Io Ag Methods and systems for reuse of data item fingerprints in generation of semantic maps
CN113704532B (en) * 2020-11-25 2024-04-26 天翼数字生活科技有限公司 Method and system for improving picture retrieval recall rate

Also Published As

Publication number Publication date
JP6041439B2 (en) 2016-12-07

Similar Documents

Publication Publication Date Title
JP6041439B2 (en) Image search apparatus, system, program, and method using binary feature vector based on image
US11048966B2 (en) Method and device for comparing similarities of high dimensional features of images
US10482336B2 (en) Face recognition and image search system using sparse feature vectors, compact binary vectors, and sub-linear search
CN102549603B (en) Relevance-based image selection
Zhang et al. Edge-SIFT: Discriminative binary descriptor for scalable partial-duplicate mobile search
Amato et al. Visual recognition of ancient inscriptions using convolutional neural network and fisher vector
Roy et al. Deep metric and hash-code learning for content-based retrieval of remote sensing images
Li et al. Hashing with dual complementary projection learning for fast image retrieval
JP6042778B2 (en) Retrieval device, system, program and method using binary local feature vector based on image
Boix et al. Sparse quantization for patch description
Zhang et al. Dataset-driven unsupervised object discovery for region-based instance image retrieval
Sun et al. Search by detection: Object-level feature for image retrieval
CN114490923A (en) Training method, device and equipment for similar text matching model and storage medium
Zhou et al. Visual word expansion and BSIFT verification for large-scale image search
Zhang et al. A prior-free weighting scheme for binary code ranking
CN110442749B (en) Video frame processing method and device
JP5959446B2 (en) Retrieval device, program, and method for high-speed retrieval by expressing contents as a set of binary feature vectors
JP6601965B2 (en) Program, apparatus and method for quantizing using search tree
Pourian et al. Pixnet: A localized feature representation for classification and visual search
CN112307248B (en) Image retrieval method and device
Kuo et al. Dehashing: Server-side context-aware feature reconstruction for mobile visual search
Liu et al. Selection of canonical images of travel attractions using image clustering and aesthetics analysis
Amanatiadis et al. Word spotting as a service for handwritten documents
KR20210058157A (en) Apparatus and method for identificating user based on face image
Orhei et al. Urban landmark detection using A-KAZE features and vector of aggregated local descriptors

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160119

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20161014

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161107

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161107

R150 Certificate of patent or registration of utility model

Ref document number: 6041439

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150