JP6041439B2 - 画像に基づくバイナリ特徴ベクトルを用いた画像検索装置、システム、プログラム及び方法 - Google Patents
画像に基づくバイナリ特徴ベクトルを用いた画像検索装置、システム、プログラム及び方法 Download PDFInfo
- Publication number
- JP6041439B2 JP6041439B2 JP2013189872A JP2013189872A JP6041439B2 JP 6041439 B2 JP6041439 B2 JP 6041439B2 JP 2013189872 A JP2013189872 A JP 2013189872A JP 2013189872 A JP2013189872 A JP 2013189872A JP 6041439 B2 JP6041439 B2 JP 6041439B2
- Authority
- JP
- Japan
- Prior art keywords
- bit
- image
- hash
- hash value
- dissimilarity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
ハッシュ値毎に、バイナリ特徴ベクトルの量子化に用いるハッシュコードブックを記憶するハッシュコードブック記憶手段と、
ハッシュ値毎に、情報量(エントロピー)の高いビット番号集合を記憶するビット番号コードブック記憶手段と、
クエリ画像及びリファレンス画像からバイナリ特徴ベクトルの集合を抽出する局所特徴抽出手段と、
ハッシュコードブック記憶手段を用いて、バイナリ特徴ベクトルに、最も類似するハッシュ値を出力するハッシュ手段と、
ビット番号コードブック記憶手段における当該ハッシュ値のビット番号集合を参照して、バイナリ特徴ベクトルから部分ビット列を選択するビット列生成手段と、
ハッシュ値毎に、リファレンス画像のビット列を対応付けて記憶する転置インデックス記憶手段と、
転置インデックス記憶手段を用いて、クエリ画像のビット列からリファレンス画像を検索する検索手段と
を有することを特徴とする。
多数のリファレンス画像における大量のバイナリ特徴ベクトルをクラスタリングし、クラスタ毎の代表バイナリ特徴ベクトルと、その識別子であるハッシュ値とを、ハッシュコードブック記憶手段へ記憶させるハッシュコードブック生成手段を更に有することも好ましい。
ハッシュコードブック生成手段は、クラスタリングに、k-means法又はk-medoids法を用いることも好ましい。
同一ハッシュ値の1つのクラスタに含まれる多数のバイナリ特徴ベクトルについて、当該ビットの情報量が高く、且つ、当該ビットと他のビットとの間で相関が小さいビット番号を並べたビット番号列を導出し、ハッシュ値毎のそのビット番号列をビット番号コードブック記憶手段へ記憶させるビット番号コードブック生成手段を更に有することも好ましい。
ビット番号コードブック生成手段は、ビット番号列に、1つのビット番号ずつ収容するために、
同一ハッシュ値の1つのクラスタに含まれる多数のバイナリ特徴ベクトルについて、各ビット(0/1)の平均値が0.5に近いビット(情報量が高いビット)から順に並べた仮ビット番号列を生成し、
仮ビット番号列の上位ビットから順に、既にビット番号列に収容された他のビットと間の相関係数の絶対値が所定閾値以下であれば、当該上位ビットのビット番号をビット番号列に収容し、これをビット番号列が所定数となるまで収容することも好ましい。
転置インデックス記憶手段は、リファレンス画像について、ハッシュ値LIDn毎に、リファレンス画像識別子とビット列との複数の組を、リスト形式で対応付けた転置インデックスを登録したものであることも好ましい。
検索手段は、
クエリ画像についてハッシュ値LIDn及びの複数の組を入力し、
クエリ画像のハッシュ値とビット列の各組について、当該ハッシュ値に対応する転置インデックスのリストを取得し、
クエリ画像ビット列と、取得したリスト中に含まれるリファレンス画像のビット列との間の非類似度を算出し、
非類似度が低いほど高くなるスコア値を算出し、
当該リファレンス画像毎に該スコア値を累積加算し、
スコア値が最も高くなるリファレンス画像を検索結果として出力することも好ましい。
検索手段は、非類似度が小さい上位所定件数(K)に相当するスコア値のみを当該リファレンス画像に累積加算することも好ましい。
検索手段について、上位所定件数(K)は、予め設定された固定数か、又は、予め設定された非類似度に関する閾値THに基づいて当該非類似度が閾値TH以下となる非類似度の数であることも好ましい。
検索手段における、上位所定件数(K)のうちi件目に対応する加算スコアについて、K番目の非類似度が、i番目の非類似度と比較して大きい場合に、加算スコアの値が大きく設定されることも好ましい。
検索手段について、上位所定件数(K)のうちi件目に対応する加算スコアは、
(1)K番目の非類似度の二乗からi番目の非類似度の二乗を引いたものとするか、
(2)K番目の非類似度の二乗とi番目の非類似度の二乗の比から1を引いたものとするか、
(3)K番目の非類似度とi番目の非類似度の比の二乗から1を引いたものとするか、又は、
(4)K番目の非類似度とi番目の非類似度の比から1を引いたものの二乗とする
ことも好ましい。
局所特徴抽出手段は、ORB(Oriented FAST and Rotated BRIEF)、FREAK(Fast Retina Keypoint)、又はBRISK(Binary Robust Independent Elementary Features)に基づくバイナリ特徴ベクトルを抽出することも好ましい。
ハッシュ値毎に、バイナリ特徴ベクトルの量子化に用いるハッシュコードブックを記憶するハッシュコードブック記憶手段と、
ハッシュ値毎に、情報量(エントロピー)の高いビット番号集合を記憶するビット番号コードブック記憶手段と、
クエリ画像及びリファレンス画像からバイナリ特徴ベクトルの集合を抽出する局所特徴抽出手段と、
ハッシュコードブック記憶手段を用いて、バイナリ特徴ベクトルに、最も類似するハッシュ値を出力するハッシュ手段と、
ビット番号コードブック記憶手段における当該ハッシュ値のビット番号集合を参照して、バイナリ特徴ベクトルから部分ビット列を選択するビット列生成手段と、
ハッシュ値毎に、リファレンス画像のビット列を対応付けて記憶する転置インデックス記憶手段と、
転置インデックス記憶手段を用いて、クエリ画像のビット列からリファレンス画像を検索する検索手段と
してコンピュータを機能させることを特徴とする。
当該装置は、
ハッシュ値毎に、バイナリ特徴ベクトルの量子化に用いるハッシュコードブックを記憶するハッシュコードブック記憶部と、
ハッシュ値毎に、情報量(エントロピー)の高いビット番号集合を記憶するビット番号コードブック記憶部と、
ハッシュ値毎に、リファレンス画像のビット列を対応付けて記憶する転置インデックス記憶部と
を有し、
クエリ画像及びリファレンス画像からバイナリ特徴ベクトルの集合を抽出する第1のステップと、
ハッシュコードブック記憶部を用いて、バイナリ特徴ベクトルに、最も類似するハッシュ値を出力する第2のステップと、
ビット番号コードブック記憶部における当該ハッシュ値のビット番号集合を参照して、バイナリ特徴ベクトルから部分ビット列を選択する第3のステップと、
転置インデックス記憶部を用いて、クエリ画像のビット列からリファレンス画像を検索する第4のステップと
を有することを特徴とする。
図2は、本発明における検索情報配信サーバの機能構成図である。
図3は、図2の検索情報配信サーバと通信可能な端末の機能構成図である。
(1)画像検索装置(単体):図1のように、画像検索装置1は、ユーザから多数のリファレンス画像を入力し、そのリファレンス画像に対するデータベースを生成し蓄積する。そして、画像検索装置1は、ユーザからクエリ画像(検索キー画像)を入力し、データベースを用いてそのクエリ画像に対するリファレンス画像を検索し、そのリファレンス画像の検索結果をユーザに対して出力する。
クライアントとしての端末1は、ネットワークを介して検索情報配信サーバ2から、そのデータベース情報をダウンロードする。そのデータベース情報は、端末1の記憶領域(メモリ空間やディスク空間)に蓄積される。
そして、図3のように、端末1は、ユーザからクエリ画像を入力し、データベースを用いてそのクエリ画像に対するリファレンス画像を検索し、そのリファレンス画像の検索結果をユーザに対して出力する。
局所特徴抽出部11は、クエリ画像及びリファレンス画像から、局所特徴のバイナリ特徴ベクトルの集合を抽出する。本発明によれば、バイナリ特徴ベクトルの抽出アルゴリズムとして、ORB(Oriented FAST and Rotated BRIEF)又はFREAK(Fast Retina Keypoint)を用いる。ORBの場合、1つのコンテンツから256ビットのバイナリ特徴ベクトルの集合が抽出される。例えば、高速にマッチングを実行するべく、バイナリコードによる特徴記述としてBRIEF(Binary Robust Independent Elementary Features)がある。本発明によれば、BRIEFに回転不変性を導入した特徴記述をすることができる「ORB」を用いる。特に、ORBによれば、SIFTやSURFと比較して、同等以上の精度を保持すると共に、数百倍の高速化を実現することができる。
ORBの特徴点検出処理によれば、高速にキーポイントを検出するためにFASTを用いる。また、FASTでは、スケール変化に対してロバストではないため、画像を複数のサイズに変換し、それぞれのサイズの画像から特徴点を抽出する。
また、既存のFASTには、回転不変性を得るためのキーポイントのオリエンテーション算出のアルゴリズムがない。そのために、ORBでは、回転不変性を得るべくOriented FASTを採用している。オリエンテーションを基準として特徴記述をすることによって、入力画像が回転していても、同一なキーポイントは同一な特徴量となって検出することができる。そのために、キーポイントの中心とパッチの輝度の重心の方向ベクトルを用いる。
次に、ORBにおける特徴ベクトル記述処理によれば、検出された特徴点毎に、BRIEF特徴ベクトル記述子によってバイナリ特徴ベクトルが抽出される。これらは、特徴点周辺の2箇所のピクセルの輝度の大小関係から求められる。
BRIEFは、バイナリコードによってキーポイントの特徴量記述を実行することができる。SIFTやSURFによれば、特徴量記述に高次元の実数を用いていた。しかしながら、高次元の実数を用いた場合、メモリ容量の増加と類似度計算の増加と問題となる。そこで、ORBに基づくBRIEFを用いることによって、バイナリコードによって特徴記述することで省メモリ化し、類似度計算にハミング距離を用いることで処理コストの抑制を実現する。
BRIEFによれば、パッチ内においてランダムに選択された2点の輝度差の符号からバイナリコードを生成する。選択するピクセルは、キーポイント位置を中心としたガウス分布に従ってランダムに選択する。ここで、ORBは、更に高精度にマッチングをさせるために、学習を用いてピクセルを選択している。選択するピクセル位置は、ペアのビット分散が大きく且つN組のペアの相関が低い場合に、特徴記述能力が高いバイナリコードとして、特徴記述に使用する。N組のペアは、Greedyアルゴリズムを用いて絞り込む。
ハッシュコードブック記憶部101は、ハッシュ値s毎に、バイナリ特徴ベクトルの量子化に用いるハッシュコードブックを記憶する。図4によれば、コードブックは、バイナリ特徴ベクトルBと同一ビット長のコードベクトルB1〜BSを保存したものである。ORBのバイナリ特徴ベクトルの場合、例えば256ビット長である。
ハッシュコードブック生成部15は、多数のリファレンス画像における大量のバイナリ特徴ベクトルをクラスタリングする。クラスタリングには、ハミング距離を用いたk-medoids法を用いてもよいし、単純にk-means法を用いてもよい。ハッシュコードブック生成部15は、クラスタ毎の代表バイナリ特徴ベクトルをコードベクトルとし、その識別子であるハッシュ値を対応付けて、ハッシュコードブック記憶部101へ記憶させる。
ハッシュ部12は、ハッシュコードブック記憶部101を用いて、局所特徴抽出部11から出力されたバイナリ特徴ベクトルBに、最も類似するコードベクトルBsのハッシュ値LIDを出力する。ハッシュ部12は、バイナリ特徴ベクトルが類似していれば高い確率で同一のハッシュ値を返すことができる。そのために、同一のハッシュ値を持つバイナリ特徴ベクトルのみをマッチングすることによって高速化を実現できる。
LID=argmins ham(B,Bs)
ham(x,y):xとyとのハミング距離
ハッシュ部12は、クエリ画像のn(n=1〜N)番目のバイナリ特徴ベクトルのハッシュ値LIDn(=s)を、ビット列生成部13へ出力する。
ビット番号コードブック記憶部102は、ハッシュ値s毎に、情報量(エントロピー)の高いビット番号集合を記憶する。ビット番号集合は、例えば64個である。図4によれば、ハッシュ値毎に、バイナリ特徴ベクトルのビット位置を表すビット番号が、情報量の高い順に登録されている。尚、ここで、情報量が高いビット番号の集合が登録されていればよく、必ずしも情報量が高い順である必要はない。
ビット列生成部13は、ビット番号コードブック記憶部102における当該ハッシュ値sのビット番号集合Csを参照して、バイナリ特徴ベクトルBから部分ビット列(例えば64ビット)を選択する。このビット列は、ビット番号集合Csに記述されているビット番号の位置のビットのみを、バイナリ特徴ベクトルBから取り出して並べたものである。これによって、入力されたバイナリ特徴ベクトルよりも短いビット列が生成されることとなる。これは、バイナリ特徴ベクトル間の識別に寄与するビット列のみを生成し、それ以外のビットを捨てることを意味する。そのビット列のみをコードブックとしてデータベースに保存することによって、データベース自体の容量を小さくすることができると共に、画像検索時の演算処理量も少なくすることができる。
(LID, RC)
LID:log2Sビット(Sは、ハッシュコードブック記憶部のコードブック数)
RC:L・log2Fビット(Fは、ビット番号コードブック記憶部のコードブック数)
(1)当該クエリ画像のバイナリ特徴ベクトルについては、ハッシュ値LIDn毎に、ビット列RCの複数の組を、検索部14へ出力する。
(2)当該リファレンス画像のバイナリ特徴ベクトルについては、ハッシュ値LIDn毎に、ビット列RCの複数の組を、転置インデックス登録部103へ出力する。
尚、LIDnにおけるnは、入力画像のn(n=1〜N)番目のバイナリ特徴ベクトルを表す。
ビット番号コードブック生成部16は、ハッシュ値毎にビット番号列を生成し、そのビット番号列を、ビット番号コードブック記憶部102へ記憶させる。ハッシュ値毎にビット列の分布が異なるため、それらの分布に適したビット番号列のコードブックを作成する。その「ビット番号列」は、同一ハッシュ値の1つのクラスタに含まれる多数のバイナリ特徴ベクトルについて、当該ビットの情報量が高く、且つ、当該ビットと他のビットとの間で相関が小さいビット番号を並べたものである。
(S51)バイナリ特徴ベクトルの全ビットの総当たりで、ビット間の相関係数を算出する。例えばORBの場合、図5のように256ビットの総当たりの相関係数が算出される(例えば非特許文献4参照)。相関係数は、−1〜1の値を取る。i番目のビットとj番目のビットと間の相関係数を、例えば以下では8つのベクトルを用いて算出する例を表す。
(0, 0, 0, 0, 1, 1, 1, 1)
↑ベクトル1のiビット目
↑ベクトル2のiビット目
↑ベクトル3のiビット目
・・・・・
↑ベクトル8のiビット目
(1, 1, 1, 1, 0, 0, 0, 0)
↑ベクトル1のjビット目
↑ベクトル2のjビット目
↑ベクトル3のjビット目
・・・・・
↑ベクトル8のjビット目
この場合、以下のように相関係数が算出される。
(0, 0, 0, 0, 1, 1, 1, 1)<->(1, 1, 1, 1, 0, 0, 0, 0) 相関係数=-1
同様に、他の例によれば、以下のように相関係数が算出される。
(0, 0, 0, 0, 1, 1, 1, 1)<->(0, 0, 0, 1, 1, 1, 1, 0) 相関係数=0.5
(0, 0, 0, 0, 1, 1, 1, 1)<->(0, 0, 1, 1, 1, 1, 0, 0) 相関係数=0
平均値が0に近いほど、両方のビットが”0”である確率が高い。
平均値が0.5に近いほど、両方のビットが反転する確率が高い。
(一方のビットが”1”である場合に、他方のビットが”0”となりやすい)
平均値が1に近いほど、両方のビットが”1”である確率が高い。
転置インデックス記憶部103は、ハッシュ値LIDn毎に、画像識別子RIDとビット列RCとの組(RID,RCn)をリストとして登録したものである。
RID -> (LID1,RC1)(LID2,RC2)・・・(LIDn,RCn)・・・(LIDN,RCN)
組(LID,RC)毎に、その画像識別子RIDとビット列RCとの組(RID,RC)を、転置インデックスにおけるそのハッシュ値LIDに連結して登録する。
LID1 -> (RID,RC)(RID,RC)(RID,RC)・・・
LID2 -> (RID,RC)(RID,RC)(RID,RC)・・・
・・・
LIDn -> (RID,RC)(RID,RC)(RID,RC)・・・
・・・
検索部14は、転置インデックス記憶部103を用いて、クエリ画像のビット列からリファレンス画像を検索する。入力されるクエリ画像は、ハッシュ値LIDn及びビット列QCnの複数の組からなる。
クエリ符号 ->(LID1,QC1)(LID2,QC2)・・・(LIDn,QCn)・・・(LIDN,QCN)
図8は、本発明における検索部の処理を表すフローチャートである。
score[]=0 (S0)
for each i=1〜N
転置インデックスのLIDi番目のリストを取得 (S1)
リスト中の組(RID1, RC1)〜(RIDM, RCM)について
クエリ画像に基づく組(QCi, RCj)の距離Dijを算出し、
距離と画像識別子の組(Dij, RIDj)を作成する (S2)
Dijを昇順にソートする (S3)
上位K番目までの組Di'j'を選択する
for each k=1〜K
k番目のDi'j'について、score[RCj']+=S(Di'j',D)
end for
end for
クエリ画像のビット列QCiと、取得したリスト中のリファレンス画像の各ビット列RCjとの間の距離Dijを算出する。そして、その距離Dijと画像識別子RIDjとの組(Dij, RIDj)を作成する。
S(Di'j',D):k番目の距離を持つ画像への投票スコア値
(1)k番目の距離の二乗から、i番目の距離の二乗を引いたものとする
S(Di'j',D)=D2−Di'j' 2
(2)k番目の距離の二乗とi番目の距離の二乗の比から、1を引いたものとする
S(Di'j',D)=D2/Di'j' 2−1
(3)k番目の距離とi番目の距離の比の二乗から、1を引いたものとする
S(Di'j',D)=(D/Di'j')2−1
(4)k番目の距離とi番目の距離の比から1を引いたものの二乗とする
S(Di'j',D)=(D/Di'j'−1)2
101 ハッシュコードブック記憶部
102 ビット番号コードブック記憶部
103 転置インデックス記憶部
11 局所特徴抽出部
12 ハッシュ部
13 ビット列生成部
14 検索部
15 ハッシュコードブック生成部
16 ビット番号コードブック生成部
2 検索情報配信サーバ
Claims (14)
- 多数のリファレンス画像の中から、クエリ画像に類似したリファレンス画像を検索する画像検索装置であって、
ハッシュ値毎に、バイナリ特徴ベクトルの量子化に用いるハッシュコードブックを記憶するハッシュコードブック記憶手段と、
前記ハッシュ値毎に、情報量(エントロピー)の高いビット番号集合を記憶するビット番号コードブック記憶手段と、
前記クエリ画像及び前記リファレンス画像からバイナリ特徴ベクトルの集合を抽出する局所特徴抽出手段と、
前記ハッシュコードブック記憶手段を用いて、前記バイナリ特徴ベクトルに、最も類似するハッシュ値を出力するハッシュ手段と、
前記ビット番号コードブック記憶手段における当該ハッシュ値のビット番号集合を参照して、前記バイナリ特徴ベクトルから部分ビット列を選択するビット列生成手段と、
前記ハッシュ値毎に、前記リファレンス画像のビット列を対応付けて記憶する転置インデックス記憶手段と、
前記転置インデックス記憶手段を用いて、前記クエリ画像のビット列からリファレンス画像を検索する検索手段と
を有することを特徴とする画像検索装置。 - 多数のリファレンス画像における大量のバイナリ特徴ベクトルをクラスタリングし、クラスタ毎の代表バイナリ特徴ベクトルと、その識別子であるハッシュ値とを、前記ハッシュコードブック記憶手段へ記憶させるハッシュコードブック生成手段を更に有することを特徴とする請求項1に記載の画像検索装置。
- 前記ハッシュコードブック生成手段は、クラスタリングに、k-means法又はk-medoids法を用いることを特徴とする請求項2に記載の画像検索装置。
- 同一ハッシュ値の1つのクラスタに含まれる多数のバイナリ特徴ベクトルについて、当該ビットの情報量が高く、且つ、当該ビットと他のビットとの間で相関が小さいビット番号を並べたビット番号列を導出し、ハッシュ値毎のそのビット番号列を前記ビット番号コードブック記憶手段へ記憶させるビット番号コードブック生成手段を更に有することを特徴とする請求項2又は3に記載の画像検索装置。
- 前記ビット番号コードブック生成手段は、前記ビット番号列に、1つのビット番号ずつ収容するために、
同一ハッシュ値の1つのクラスタに含まれる多数のバイナリ特徴ベクトルについて、各ビット(0/1)の平均値が0.5に近いビット(情報量が高いビット)から順に並べた仮ビット番号列を生成し、
前記仮ビット番号列の上位ビットから順に、既にビット番号列に収容された他のビットと間の相関係数の絶対値が所定閾値以下であれば、当該上位ビットのビット番号を前記ビット番号列に収容し、これを前記ビット番号列が所定数となるまで収容する
ことを特徴とする請求項4に記載の画像検索装置。 - 前記転置インデックス記憶手段は、リファレンス画像について、ハッシュ値LIDn毎に、リファレンス画像識別子と前記ビット列との複数の組を、リスト形式で対応付けた転置インデックスを登録したものである
ことを特徴とする請求項1から5のいずれか1項に記載の画像検索装置。 - 前記検索手段は、
クエリ画像についてハッシュ値LIDn及びの複数の組を入力し、
前記クエリ画像のハッシュ値とビット列の各組について、当該ハッシュ値に対応する転置インデックスのリストを取得し、
前記クエリ画像ビット列と、取得したリスト中に含まれるリファレンス画像のビット列との間の非類似度を算出し、
前記非類似度が低いほど高くなるスコア値を算出し、
当該リファレンス画像毎に該スコア値を累積加算し、
前記スコア値が最も高くなるリファレンス画像を検索結果として出力する
ことを特徴とする画像検索装置。 - 前記検索手段は、非類似度が小さい上位所定件数(K)に相当するスコア値のみを当該リファレンス画像に累積加算することを特徴とする請求項7に記載の画像検索装置。
- 前記検索手段について、前記上位所定件数(K)は、予め設定された固定数か、又は、予め設定された非類似度に関する閾値THに基づいて当該非類似度が閾値TH以下となる非類似度の数であることを特徴とする請求項7に記載の画像検索装置。
- 前記検索手段における、前記上位所定件数(K)のうちi件目に対応する加算スコアについて、K番目の非類似度が、i番目の非類似度と比較して大きい場合に、加算スコアの値が大きく設定される
ことを特徴とする請求項7に記載の画像検索装置。 - 前記検索手段について、前記上位所定件数(K)のうちi件目に対応する加算スコアは、
(1)K番目の非類似度の二乗からi番目の非類似度の二乗を引いたものとするか、
(2)K番目の非類似度の二乗とi番目の非類似度の二乗の比から1を引いたものとするか、
(3)K番目の非類似度とi番目の非類似度の比の二乗から1を引いたものとするか、又は、
(4)K番目の非類似度とi番目の非類似度の比から1を引いたものの二乗とする
ことを特徴とする請求項7に記載の画像検索装置。 - 前記局所特徴抽出手段は、ORB(Oriented FAST and Rotated BRIEF)、FREAK(Fast Retina Keypoint)、又はBRISK (Binary Robust Independent Elementary Features)に基づくバイナリ特徴ベクトルを抽出する、
ことを特徴とする請求項1から11のいずれか1項に記載の画像検索装置。 - 多数のリファレンス画像の中から、クエリ画像に類似したリファレンス画像を検索する装置に搭載されたコンピュータを機能させるプログラムであって、
ハッシュ値毎に、バイナリ特徴ベクトルの量子化に用いるハッシュコードブックを記憶するハッシュコードブック記憶手段と、
前記ハッシュ値毎に、情報量(エントロピー)の高いビット番号集合を記憶するビット番号コードブック記憶手段と、
前記クエリ画像及び前記リファレンス画像からバイナリ特徴ベクトルの集合を抽出する局所特徴抽出手段と、
前記ハッシュコードブック記憶手段を用いて、前記バイナリ特徴ベクトルに、最も類似するハッシュ値を出力するハッシュ手段と、
前記ビット番号コードブック記憶手段における当該ハッシュ値のビット番号集合を参照して、前記バイナリ特徴ベクトルから部分ビット列を選択するビット列生成手段と、
前記ハッシュ値毎に、前記リファレンス画像のビット列を対応付けて記憶する転置インデックス記憶手段と、
前記転置インデックス記憶手段を用いて、前記クエリ画像のビット列からリファレンス画像を検索する検索手段と
してコンピュータを機能させることを特徴とするプログラム。 - 装置を用いて、多数のリファレンス画像の中から、クエリ画像に類似したリファレンス画像を検索する方法であって、
当該装置は、
ハッシュ値毎に、バイナリ特徴ベクトルの量子化に用いるハッシュコードブックを記憶するハッシュコードブック記憶部と、
前記ハッシュ値毎に、情報量(エントロピー)の高いビット番号集合を記憶するビット番号コードブック記憶部と、
前記ハッシュ値毎に、前記リファレンス画像のビット列を対応付けて記憶する転置インデックス記憶部と
を有し、
前記クエリ画像及び前記リファレンス画像からバイナリ特徴ベクトルの集合を抽出する第1のステップと、
前記ハッシュコードブック記憶部を用いて、前記バイナリ特徴ベクトルに、最も類似するハッシュ値を出力する第2のステップと、
前記ビット番号コードブック記憶部における当該ハッシュ値のビット番号集合を参照して、前記バイナリ特徴ベクトルから部分ビット列を選択する第3のステップと、
前記転置インデックス記憶部を用いて、前記クエリ画像のビット列からリファレンス画像を検索する第4のステップと
を有することを特徴とする方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013189872A JP6041439B2 (ja) | 2013-09-12 | 2013-09-12 | 画像に基づくバイナリ特徴ベクトルを用いた画像検索装置、システム、プログラム及び方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013189872A JP6041439B2 (ja) | 2013-09-12 | 2013-09-12 | 画像に基づくバイナリ特徴ベクトルを用いた画像検索装置、システム、プログラム及び方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015056077A JP2015056077A (ja) | 2015-03-23 |
JP6041439B2 true JP6041439B2 (ja) | 2016-12-07 |
Family
ID=52820424
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013189872A Active JP6041439B2 (ja) | 2013-09-12 | 2013-09-12 | 画像に基づくバイナリ特徴ベクトルを用いた画像検索装置、システム、プログラム及び方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6041439B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108090117A (zh) * | 2017-11-06 | 2018-05-29 | 北京三快在线科技有限公司 | 一种图像检索方法及装置,电子设备 |
CN109710656A (zh) * | 2018-11-12 | 2019-05-03 | 清华大学 | 近似查询方法及装置 |
CN111382298A (zh) * | 2018-12-30 | 2020-07-07 | 贝壳技术有限公司 | 基于图片内容的图像检索方法、装置与电子设备 |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7019137B2 (ja) * | 2015-08-27 | 2022-02-15 | ムラタオフィス株式会社 | 類似画像検索システム |
JP6574681B2 (ja) * | 2015-10-28 | 2019-09-11 | Kddi株式会社 | 画面特定システム、画面特定装置及び画面特定方法 |
US10572221B2 (en) | 2016-10-20 | 2020-02-25 | Cortical.Io Ag | Methods and systems for identifying a level of similarity between a plurality of data representations |
CN109840525B (zh) * | 2017-11-27 | 2022-09-20 | 中国科学院沈阳计算技术研究所有限公司 | 圆周二进制特征的提取与匹配搜索方法 |
KR102058393B1 (ko) | 2017-11-30 | 2019-12-23 | 국민대학교산학협력단 | 스케치 기반의 영상표절 검사 방법 및 장치 |
CN110895573B (zh) * | 2018-08-24 | 2022-04-05 | 华为技术有限公司 | 一种检索方法和装置 |
CN109712210B (zh) * | 2018-12-17 | 2023-03-28 | 重庆长安汽车股份有限公司 | 基于区块链的图形生成方法 |
CN109783667B (zh) * | 2019-01-14 | 2023-10-27 | 西安电子科技大学 | 一种图像存储和检索的方法、客户端及系统 |
JP7118920B2 (ja) * | 2019-04-11 | 2022-08-16 | 株式会社日立ソリューションズ | 画像検索装置および画像検索方法 |
CN110188223B (zh) * | 2019-06-06 | 2022-10-04 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置及计算机设备 |
CN111897982B (zh) * | 2020-06-17 | 2023-03-14 | 昆明理工大学 | 一种医学ct图像存储与检索方法 |
CN111832706A (zh) * | 2020-07-08 | 2020-10-27 | 西安电子科技大学 | 基于哈希中心的连续学习方法 |
CN111814807B (zh) * | 2020-07-16 | 2023-10-24 | 抖音视界有限公司 | 用于处理图像的方法、装置、电子设备和计算机可读介质 |
US11734332B2 (en) | 2020-11-19 | 2023-08-22 | Cortical.Io Ag | Methods and systems for reuse of data item fingerprints in generation of semantic maps |
CN113704532B (zh) * | 2020-11-25 | 2024-04-26 | 天翼数字生活科技有限公司 | 一种提升图片检索召回率的方法和系统 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012043397A (ja) * | 2010-07-21 | 2012-03-01 | Nippon Telegr & Teleph Corp <Ntt> | 特徴量取得装置、特徴量取得方法、類似画像検索方法およびプログラム。 |
JP5563494B2 (ja) * | 2011-02-01 | 2014-07-30 | 株式会社デンソーアイティーラボラトリ | 対応参照画像検索装置及び方法、コンテンツ重畳装置、システム、及び方法、並びにコンピュータプログラム |
JP5598925B2 (ja) * | 2011-06-29 | 2014-10-01 | Kddi株式会社 | 高次元の特徴ベクトルを高精度で検索する検索装置及びプログラム |
-
2013
- 2013-09-12 JP JP2013189872A patent/JP6041439B2/ja active Active
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108090117A (zh) * | 2017-11-06 | 2018-05-29 | 北京三快在线科技有限公司 | 一种图像检索方法及装置,电子设备 |
CN108090117B (zh) * | 2017-11-06 | 2019-03-19 | 北京三快在线科技有限公司 | 一种图像检索方法及装置,电子设备 |
US11281714B2 (en) | 2017-11-06 | 2022-03-22 | Beijing Sankuai Online Technology Co., Ltd | Image retrieval |
CN109710656A (zh) * | 2018-11-12 | 2019-05-03 | 清华大学 | 近似查询方法及装置 |
CN111382298A (zh) * | 2018-12-30 | 2020-07-07 | 贝壳技术有限公司 | 基于图片内容的图像检索方法、装置与电子设备 |
CN111382298B (zh) * | 2018-12-30 | 2021-04-20 | 北京房江湖科技有限公司 | 基于图片内容的图像检索方法、装置与电子设备 |
Also Published As
Publication number | Publication date |
---|---|
JP2015056077A (ja) | 2015-03-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6041439B2 (ja) | 画像に基づくバイナリ特徴ベクトルを用いた画像検索装置、システム、プログラム及び方法 | |
US11048966B2 (en) | Method and device for comparing similarities of high dimensional features of images | |
US10482336B2 (en) | Face recognition and image search system using sparse feature vectors, compact binary vectors, and sub-linear search | |
CN102549603B (zh) | 基于相关性的图像选择 | |
Zhang et al. | Edge-SIFT: Discriminative binary descriptor for scalable partial-duplicate mobile search | |
JP6042778B2 (ja) | 画像に基づくバイナリ局所特徴ベクトルを用いた検索装置、システム、プログラム及び方法 | |
Mehmood et al. | Effect of complementary visual words versus complementary features on clustering for effective content-based image search | |
Shalunts | Architectural style classification of building facade towers | |
Boix et al. | Sparse quantization for patch description | |
Zhang et al. | Dataset-driven unsupervised object discovery for region-based instance image retrieval | |
Zhou et al. | Visual word expansion and BSIFT verification for large-scale image search | |
Sun et al. | Search by detection: Object-level feature for image retrieval | |
Xue et al. | Mobile image retrieval using multi-photos as query | |
CN114490923A (zh) | 相似文本匹配模型的训练方法、装置、设备及存储介质 | |
Zhang et al. | A prior-free weighting scheme for binary code ranking | |
CN110442749B (zh) | 视频帧处理方法及装置 | |
JP5959446B2 (ja) | コンテンツをバイナリ特徴ベクトルの集合で表現することによって高速に検索する検索装置、プログラム及び方法 | |
JP6601965B2 (ja) | 探索木を用いて量子化するプログラム、装置及び方法 | |
Pourian et al. | Pixnet: A localized feature representation for classification and visual search | |
CN112307248B (zh) | 一种图像检索方法及装置 | |
Kuo et al. | Dehashing: Server-side context-aware feature reconstruction for mobile visual search | |
Liu et al. | Selection of canonical images of travel attractions using image clustering and aesthetics analysis | |
KR20210058157A (ko) | 얼굴 이미지 기반 사용자 식별 장치 및 방법 | |
Orhei et al. | Urban landmark detection using A-KAZE features and vector of aggregated local descriptors | |
Chougrad et al. | Soft assignment vs hard assignment coding for bag of visual words |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160119 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20161014 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20161107 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20161107 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6041439 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |