JP2013011920A - 少ないコードブックの情報量によって高次元の特徴ベクトルを検索する検索装置及びプログラム - Google Patents
少ないコードブックの情報量によって高次元の特徴ベクトルを検索する検索装置及びプログラム Download PDFInfo
- Publication number
- JP2013011920A JP2013011920A JP2011142458A JP2011142458A JP2013011920A JP 2013011920 A JP2013011920 A JP 2013011920A JP 2011142458 A JP2011142458 A JP 2011142458A JP 2011142458 A JP2011142458 A JP 2011142458A JP 2013011920 A JP2013011920 A JP 2013011920A
- Authority
- JP
- Japan
- Prior art keywords
- residual
- vector
- codebook
- function
- representative
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- Y02P90/14—
-
- Y02P90/28—
-
- Y02P90/285—
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】検索装置における学習部は、残差コードブック生成手段を有する。これは、代表ベクトルfnと学習ベクトルfとの間の残差ベクトルfrを導出することによってN個の残差クラスタを作成し(S71)、frをT個に区分した残差部分ベクトル集合Rn,tを生成し(S72)、残差コードブック識別子テーブルT[n][t]に、いずれかのラベル値mを割り当て(S73)、mそれぞれについて、当該mが割り当てられた全ての残差部分ベクトル集合Rn,tを用いて、当該m番目の残差コードブックを生成し(S74)、M個の残差コードブックそれぞれで量子化した際の量子化誤差が最も小さくなるm'番目の残差コードブックを用いてT[n][t]を更新する(S75)。
【選択図】図7
Description
粗量子化における代表識別値n(=1〜N)に割り当てられた学習ベクトルfと、それに対応する代表ベクトルfnとの間の残差ベクトルfr(=f−fn)を、T個の残差部分ベクトルに分割し、t番目の残差部分ベクトルの集合Rn,tをクラスタリングし、各クラスタから直積量子化のためのコードブックを作成する残差コードブック生成手段を有することを特徴とする。
残差コードブック生成手段は、
残差コードブック及び残差コードブック識別子テーブルT[n][t]を生成するものであり、
代表ベクトルfnと、当該代表ベクトルfnに属する学習ベクトルfとの間の残差ベクトルfr(=f−fn)を導出することによってN個の残差クラスタを作成する第1の機能と、
残差ベクトルfrをT個の残差部分ベクトルに分割し、残差部分ベクトル集合Rn,t(1≦n≦N,1≦t≦T)を生成する第2の機能と、
残差部分ベクトル集合Rn,tそれぞれについて、残差コードブック識別子テーブルT[n][t]に、いずれかのラベル値m(m=1,2,..,M)を割り当てる第3の機能と、
ラベル値mそれぞれについて、当該ラベル値mが割り当てられた全ての残差部分ベクトル集合Rn,tを用いて、当該m番目の残差コードブックを生成する第4の機能と、
残差部分ベクトル集合Rn,tそれぞれについて、M個の残差コードブックそれぞれで量子化した際の量子化誤差が最も小さくなるm'番目の残差コードブックを用いて残差コードブック識別子テーブルT[n][t]を更新する第5の機能と
を有し、第4及び第5の機能を繰り返し実行する
ことも好ましい。
コードブックを生成するコードブック生成手段を更に有し、
コードブック生成手段は、
学習ベクトルの集合を、N個のクラスタにクラスタリングする第1の機能と、
クラスタ毎に、代表ベクトルを導出する第2の機能と、
各代表ベクトルに、一意の代表識別値n(=1〜N)を割り当てたコードブックを生成する第3の機能とを実行することも好ましい。
登録ベクトルfを量子化するために、代表識別値n(=1〜N)と代表ベクトルfnとを対応付けたコードブックを記憶するコードブック記憶手段と、
登録ベクトルfを、コードブックを用いて、代表識別値nに量子化するベクトル量子化手段と、
登録ベクトルfから代表ベクトルfnを引いた残差ベクトルfrを導出する残差ベクトル導出手段と、
残差ベクトルをT個の残差部分ベクトルfr 1, fr 2, ..., fr Tに分割する残差ベクトル分割手段と、
各残差部分ベクトルfr tを更に量子化するために、残差識別値l(=1〜L)と残差部分代表ベクトルflとを対応付けた残差コードブックをM個記憶すると共に、代表識別値nに対応付けられた登録ベクトルfの残差部分ベクトルfrtが、M個の残差コードブックのどれで量子化すべきかを示す残差コードブック識別子テーブルT[n][t]を記憶する残差コードブック記憶手段と、
残差部分ベクトルfr tを、T[n][t]番目の残差コードブックで量子化する残差部分ベクトル量子化手段と、
登録ベクトルfの代表識別値n毎に、複数の残差部分ベクトルfr tの残差識別値lt(1≦t≦T)の集合と、登録ベクトルfに関する付加情報とを、各登録ベクトルfの登録情報として登録した転置インデックスを生成する転置インデックス生成手段と、
転置インデックスを、登録ベクトルの集合として記憶する転置インデックス記憶手段と
を有することも好ましい。
残差コードブック生成手段における第3の機能について、残差コードブック識別子テーブルT[n][t]に、ランダムに、いずれかのラベル値m(m=1,2,..,M)を割り当てることも好ましい。
残差コードブック生成手段における第3の機能について、
残差部分ベクトル集合Rn,tの中から、ランダムにいずれか1つの残差部分ベクトル集合Rn,tを選択する第31の機能と、
選択された当該残差部分ベクトル集合Rn,t内の残差部分ベクトルをクラスタリングし、1つの残差コードブックを生成する第32の機能と、
残差部分ベクトル集合Rn,tそれぞれについて、既に作成された全ての残差コードブックそれぞれで量子化した際に、量子化誤差の総和が最小となる残差コードブック及び量子化誤差Dn,tを求める第33の機能と、
全ての残差部分ベクトル集合Rn,t(1≦n≦N,1≦t≦T)の中からDn,tに比例する確率で1つの残差部分ベクトル集合を選択し、その残差部分ベクトル集合内の残差部分ベクトルをクラスタリングすることで、1つの残差コードブックを生成する第34の機能と、
M個の残差コードブックが生成されるまで、第33及び第34の機能を繰り返す第35の機能と、
残差部分ベクトル集合Rn,tそれぞれについて、M個の残差コードブックそれぞれで量子化した際に、量子化誤差が最小となる当該残差コードブックのラベル値mを、当該残差部分ベクトル集合Rn,tに割り当てる第36の機能と
を有することも好ましい。
転置インデックス記憶手段を用いて、クエリベクトルに類似したベクトルを検索するために、
ベクトル量子化手段は、クエリベクトルfを、コードブックを用いて、代表識別値nに量子化し、
残差ベクトル導出手段は、クエリベクトルfから代表ベクトルfnを引いたクエリ残差ベクトルfrを導出し、
残差ベクトル分割手段は、クエリ残差ベクトルをT個のクエリ残差部分ベクトルに分割する
と共に、
クエリ残差部分ベクトルfr tと、残差コードブック識別子テーブルT[n][t]により指定される残差コードブックの各残差代表ベクトルft,l(1≦l≦L)とのLp距離を算出し参照テーブルD[t][l]に保持する残差ベクトル距離算出手段と、
登録ベクトルの登録情報である残差識別値lt(1≦t≦T)を基に、テーブルD[t][l]を参照することで、クエリベクトルと登録ベクトルのLp距離の推定値を、参照テーブルの重み付き和d(=Σt=1 Twt・D[t][lt])として算出する登録ベクトル距離算出手段と、
距離の重み付き和dが、所定閾値以下となる登録ベクトルを、又は、距離の重み付き和dが小さいものから順に所定個数となる登録ベクトルを、検索結果として出力する検索判定手段と
を有することも好ましい。
登録ベクトルは、画像の局所特徴領域から抽出された局所特徴ベクトルであり、
登録ベクトルの付加情報は、画像識別子(IDentifier)、局所特徴領域のスケール、局所特徴領域の角度のいずれか1つを含むことも好ましい。
粗量子化における代表識別値n(=1〜N)に割り当てられた学習ベクトルfと、それに対応する代表ベクトルfnとの間の残差ベクトルfr(=f−fn)を、T個の残差部分ベクトルに分割し、t番目の残差部分ベクトルの集合Rn,tをクラスタリングし、各クラスタから直積量子化のためのコードブックを作成する残差コードブック生成手段としてコンピュータを機能させることを特徴とする。
残差コードブック生成手段は、
残差コードブック及び残差コードブック識別子テーブルT[n][t]を生成するものであり、
代表ベクトルfnと、当該代表ベクトルfnに属する学習ベクトルfとの間の残差ベクトルfr(=f−fn)を導出することによってN個の残差クラスタを作成する第1の機能と、
残差ベクトルfrをT個の残差部分ベクトルに分割し、残差部分ベクトル集合Rn,t(1≦n≦N,1≦t≦T)を生成する第2の機能と、
残差部分ベクトル集合Rn,tそれぞれについて、残差コードブック識別子テーブルT[n][t]に、いずれかのラベル値m(m=1,2,..,M)を割り当てる第3の機能と、
ラベル値mそれぞれについて、当該ラベル値mが割り当てられた全ての残差部分ベクトル集合Rn,tを用いて、当該m番目の残差コードブックを生成する第4の機能と、
残差部分ベクトル集合Rn,tそれぞれについて、M個の残差コードブックそれぞれで量子化した際の量子化誤差が最も小さくなるm'番目の残差コードブックを用いて残差コードブック識別子テーブルT[n][t]を更新する第5の機能と
を有し、第4及び第5の機能を繰り返し実行する
ようにコンピュータを機能させることも好ましい。
コードブックを生成するコードブック生成手段を更に有し、
コードブック生成手段は、
学習ベクトルの集合を、N個のクラスタにクラスタリングする第1の機能と、
クラスタ毎に、代表ベクトルを導出する第2の機能と、
各代表ベクトルに、一意の代表識別値n(=1〜N)を割り当てたコードブックを生成する第3の機能とを実行する
ようにコンピュータを機能させることも好ましい。
登録ベクトルfを量子化するために、代表識別値n(=1〜N)と代表ベクトルfnとを対応付けたコードブックを記憶するコードブック記憶手段と、
登録ベクトルfを、コードブックを用いて、代表識別値nに量子化するベクトル量子化手段と、
登録ベクトルfから代表ベクトルfnを引いた残差ベクトルfrを導出する残差ベクトル導出手段と、
残差ベクトルをT個の残差部分ベクトルfr 1, fr 2, ..., fr Tに分割する残差ベクトル分割手段と、
各残差部分ベクトルfr tを更に量子化するために、残差識別値l(=1〜L)と残差部分代表ベクトルflとを対応付けた残差コードブックをM個記憶すると共に、代表識別値nに対応付けられた登録ベクトルfの残差部分ベクトルfrtが、M個の残差コードブックのどれで量子化すべきかを示す残差コードブック識別子テーブルT[n][t]を記憶する残差コードブック記憶手段と、
残差部分ベクトルfr tを、T[n][t]番目の残差コードブックで量子化する残差部分ベクトル量子化手段と、
登録ベクトルfの代表識別値n毎に、複数の残差部分ベクトルfr tの残差識別値lt(1≦t≦T)の集合と、登録ベクトルfに関する付加情報とを、各登録ベクトルfの登録情報として登録した転置インデックスを生成する転置インデックス生成手段と、
転置インデックスを、登録ベクトルの集合として記憶する転置インデックス記憶手段と
してコンピュータを更に機能させることも好ましい。
残差コードブック生成手段における第3の機能について、残差コードブック識別子テーブルT[n][t]に、ランダムに、いずれかのラベル値m(m=1,2,..,M)を割り当てるようにコンピュータを機能させることも好ましい。
残差コードブック生成手段における第3の機能について、
残差部分ベクトル集合Rn,tの中から、ランダムにいずれか1つの残差部分ベクトル集合Rn,tを選択する第31の機能と、
選択された当該残差部分ベクトル集合Rn,t内の残差部分ベクトルをクラスタリングし、1つの残差コードブックを生成する第32の機能と、
残差部分ベクトル集合Rn,tそれぞれについて、既に作成された全ての残差コードブックそれぞれで量子化した際に、量子化誤差の総和が最小となる残差コードブック及び量子化誤差Dn,tを求める第33の機能と、
全ての残差部分ベクトル集合Rn,t(1≦n≦N,1≦t≦T)の中からDn,tに比例する確率で1つの残差部分ベクトル集合を選択し、その残差部分ベクトル集合内の残差部分ベクトルをクラスタリングすることで、1つの残差コードブックを生成する第34の機能と、
M個の残差コードブックが生成されるまで、第33及び第34の機能を繰り返す第35の機能と、
残差部分ベクトル集合Rn,tそれぞれについて、M個の残差コードブックそれぞれで量子化した際に、量子化誤差が最小となる当該残差コードブックのラベル値mを、当該残差部分ベクトル集合Rn,tに割り当てる第36の機能と
してコンピュータを更に機能させることも好ましい。
転置インデックス記憶手段を用いて、クエリベクトルに類似したベクトルを検索するために、
ベクトル量子化手段は、クエリベクトルfを、コードブックを用いて、代表識別値nに量子化し、
残差ベクトル導出手段は、クエリベクトルfから代表ベクトルfnを引いたクエリ残差ベクトルfrを導出し、
残差ベクトル分割手段は、クエリ残差ベクトルをT個のクエリ残差部分ベクトルに分割する
と共に、
クエリ残差部分ベクトルfr tと、残差コードブック識別子テーブルT[n][t]により指定される残差コードブックの各残差代表ベクトルft,l(1≦l≦L)とのLp距離を算出し参照テーブルD[t][l]に保持する残差ベクトル距離算出手段と、
登録ベクトルの登録情報である残差識別値lt(1≦t≦T)を基に、テーブルD[t][l]を参照することで、クエリベクトルと登録ベクトルのLp距離の推定値を、参照テーブルの重み付き和d(=Σt=1 Twt・D[t][lt])として算出する登録ベクトル距離算出手段と、
距離の重み付き和dが、所定閾値以下となる登録ベクトルを、又は、距離の重み付き和dが小さいものから順に所定個数となる登録ベクトルを、検索結果として出力する検索判定手段と
してコンピュータを更に機能させることも好ましい。
登録ベクトルは、画像の局所特徴領域から抽出された局所特徴ベクトルであり、
登録ベクトルの付加情報は、画像識別子(IDentifier)、局所特徴領域のスケール、局所特徴領域の角度のいずれか1つを含むようにコンピュータを機能させることも好ましい。
図2は、登録部における処理内容の説明図である。以下では、図2を参照しつつ、図1の登録部11の各機能が説明される。また、図3は、クラスタFに含まれるベクトルを代表ベクトルfnに対応付けた説明図である。
代表識別値n: 代表ベクトルfn
1: f1=(f11,f12,・・・,f1D)
2: f2=(f21,f22,・・・,f2D)
3: f3=(f31,f32,・・・,f3D)
・・・
N: fN=(fN1,fN2,・・・,fND)
登録ベクトルf: f=(f1,f2,・・・,fD)
そして、ベクトル量子化部111は、登録ベクトルfを、コードブック記憶部101に記憶されたコードブックを用いて、代表識別値n(=1〜N、n:整数値)に量子化する(図2のベクトル量子化部111参照)。
n=q(f)=argminn||f−fn||2
(登録ベクトルfの量子化関数q(f)は、||f−fn||2が最小となるnを導出
する)
q:RD->N(量子化を意味する)
fn:代表ベクトル
fr=f−fn(=q(f)):残差ベクトル
fr 1=(fr 1,1 ,fr 1,2 ,・・・,fr 1,D')
fr 2=(fr 2,D'+1 ,fr 2,D'+2 ,・・・,fr 2,D'+D')
・・・・・
fr T=(fr T,(T-1)・D'+1,fr T,(T-1)・D'+2,・・・,fr T,(T-1)・D'+D')
<< M << N×Tの関係にすることが重要となる。
lt=qr T[n][t](fr t)
検索部12は、登録部11と同様に、ベクトル量子化部111と、残差ベクトル導出部112と、残差ベクトル分割部113とを有し、更に、残差ベクトル距離算出部124と、登録ベクトル距離算出部125と、検索判定部126とを有する。
XI=(xi1, xi2, ・・・, xiD)T i=1,2,3,・・・,n
このとき、多次元空間上の2点XIとXKとのLp距離は、次元数D及びパラメータpを用いて、以下のように表す。
Lp(I,K)=(Σj=1 D|xij−xkj|p)1/p
図5は、本発明における学習部を含む検索装置の機能構成図である。
F
-> F1,F2,・・・,FN
例えばk-means又はk-means++のようなクラスタリングアルゴリズムが用いられる。
(S62)クラスタ毎に、代表ベクトルfnを導出する。
f1,f2,・・・,fN
(S63)各代表ベクトルに、一意の代表識別値n(=1〜N)を割り当てたコードブックを生成する。が得られる。
残差ベクトル集合:Fr n={f−fn|f∈Fn}
[第1のラベル値割当方法]
残差コードブック識別子テーブルT[n][t]に、ランダムに、いずれかのラベル値mを割り当てる。
[第2のラベル値割当方法]
残差コードブック識別子テーブルT[n][t]に、残差コードブックによって導出したラベル値mを割り当てる。この方法については、図10及び図11を用いて後述する。
R1,1:m=2
R1,2:m=7
R1,3:m=1
・・・
図10は、本発明における第2のラベル値割当方法の処理ステップを表すフローチャートである。
図11は、第2のラベル値割当方法の処理内容の説明図である。
残差部分ベクトル集合毎:Dn,t/ΣDn,t
即ち、確率Dn,t/ΣDn,tで、残差部分ベクトル集合Rn,tが選択される。
101 コードブック記憶部
102 残差コードブック記憶部
103 転置インデックス記憶部
11 登録部
111 ベクトル量子化部
112 残差ベクトル導出部
113 残差ベクトル分割部
114 残差部分ベクトル量子化部
115 転置インデックス生成部
12 検索部
124 残差ベクトル距離算出部
125 登録ベクトル距離算出部
126 検索判定部
Claims (16)
- 粗量子化及び直積量子化を用いて符号化された高次元の登録ベクトルの集合からクエリベクトルに類似したベクトルを検索する検索装置であって、
粗量子化における代表識別値n(=1〜N)に割り当てられた学習ベクトルfと、それに対応する代表ベクトルfnとの間の残差ベクトルfr(=f−fn)を、T個の残差部分ベクトルに分割し、t番目の残差部分ベクトルの集合Rn,tをクラスタリングし、各クラスタから直積量子化のためのコードブックを作成する残差コードブック生成手段を有することを特徴とする検索装置。 - 前記残差コードブック生成手段は、
残差コードブック及び残差コードブック識別子テーブルT[n][t]を生成するものであり、
代表ベクトルfnと、当該代表ベクトルfnに属する学習ベクトルfとの間の残差ベクトルfr(=f−fn)を導出することによってN個の残差クラスタを作成する第1の機能と、
前記残差ベクトルfrをT個の残差部分ベクトルに分割し、残差部分ベクトル集合Rn,t(1≦n≦N,1≦t≦T)を生成する第2の機能と、
前記残差部分ベクトル集合Rn,tそれぞれについて、前記残差コードブック識別子テーブルT[n][t]に、いずれかのラベル値m(m=1,2,..,M)を割り当てる第3の機能と、
前記ラベル値mそれぞれについて、当該ラベル値mが割り当てられた全ての残差部分ベクトル集合Rn,tを用いて、当該m番目の残差コードブックを生成する第4の機能と、
前記残差部分ベクトル集合Rn,tそれぞれについて、M個の残差コードブックそれぞれで量子化した際の量子化誤差が最も小さくなるm'番目の残差コードブックを用いて残差コードブック識別子テーブルT[n][t]を更新する第5の機能と
を有し、第4及び第5の機能を繰り返し実行する
ことを特徴とする請求項1に記載の検索装置。 - コードブックを生成するコードブック生成手段を更に有し、
前記コードブック生成手段は、
前記学習ベクトルの集合を、N個のクラスタにクラスタリングする第1の機能と、
前記クラスタ毎に、代表ベクトルを導出する第2の機能と、
各代表ベクトルに、一意の代表識別値n(=1〜N)を割り当てたコードブックを生成する第3の機能とを実行する
ことを特徴とする請求項2に記載の検索装置。 - 前記登録ベクトルfを量子化するために、代表識別値n(=1〜N)と代表ベクトルfnとを対応付けたコードブックを記憶するコードブック記憶手段と、
前記登録ベクトルfを、前記コードブックを用いて、代表識別値nに量子化するベクトル量子化手段と、
前記登録ベクトルfから代表ベクトルfnを引いた残差ベクトルfrを導出する残差ベクトル導出手段と、
前記残差ベクトルをT個の残差部分ベクトルfr 1, fr 2, ..., fr Tに分割する残差ベクトル分割手段と、
各残差部分ベクトルfr tを更に量子化するために、残差識別値l(=1〜L)と残差部分代表ベクトルflとを対応付けた残差コードブックをM個記憶すると共に、前記代表識別値nに対応付けられた登録ベクトルfの残差部分ベクトルfrtが、前記M個の残差コードブックのどれで量子化すべきかを示す残差コードブック識別子テーブルT[n][t]を記憶する残差コードブック記憶手段と、
前記残差部分ベクトルfr tを、T[n][t]番目の前記残差コードブックで量子化する残差部分ベクトル量子化手段と、
前記登録ベクトルfの代表識別値n毎に、複数の残差部分ベクトルfr tの残差識別値lt(1≦t≦T)の集合と、登録ベクトルfに関する付加情報とを、各登録ベクトルfの登録情報として登録した転置インデックスを生成する転置インデックス生成手段と、
前記転置インデックスを、登録ベクトルの集合として記憶する転置インデックス記憶手段と
を有することを特徴とする請求項3に記載の検索装置。 - 前記残差コードブック生成手段における第3の機能について、前記残差コードブック識別子テーブルT[n][t]に、ランダムに、いずれかのラベル値m(m=1,2,..,M)を割り当てることを特徴とする請求項3又は4に記載の検索装置。
- 前記残差コードブック生成手段における第3の機能について、
前記残差部分ベクトル集合Rn,tの中から、ランダムにいずれか1つの残差部分ベクトル集合Rn,tを選択する第31の機能と、
選択された当該残差部分ベクトル集合Rn,t内の残差部分ベクトルをクラスタリングし、1つの残差コードブックを生成する第32の機能と、
前記残差部分ベクトル集合Rn,tそれぞれについて、既に作成された全ての残差コードブックそれぞれで量子化した際に、量子化誤差の総和が最小となる残差コードブック及び量子化誤差Dn,tを求める第33の機能と、
全ての残差部分ベクトル集合Rn,t(1≦n≦N,1≦t≦T)の中から前記Dn,tに比例する確率で1つの残差部分ベクトル集合を選択し、その残差部分ベクトル集合内の残差部分ベクトルをクラスタリングすることで、1つの残差コードブックを生成する第34の機能と、
M個の残差コードブックが生成されるまで、第33及び第34の機能を繰り返す第35の機能と、
前記残差部分ベクトル集合Rn,tそれぞれについて、M個の残差コードブックそれぞれで量子化した際に、量子化誤差が最小となる当該残差コードブックのラベル値mを、当該残差部分ベクトル集合Rn,tに割り当てる第36の機能と
を有することを特徴とする請求項3又は4に記載の検索装置。 - 前記転置インデックス記憶手段を用いて、クエリベクトルに類似したベクトルを検索するために、
前記ベクトル量子化手段は、前記クエリベクトルfを、前記コードブックを用いて、代表識別値nに量子化し、
前記残差ベクトル導出手段は、前記クエリベクトルfから代表ベクトルfnを引いたクエリ残差ベクトルfrを導出し、
前記残差ベクトル分割手段は、前記クエリ残差ベクトルをT個のクエリ残差部分ベクトルに分割する
と共に、
前記クエリ残差部分ベクトルfr tと、前記残差コードブック識別子テーブルT[n][t]により指定される残差コードブックの各残差代表ベクトルft,l(1≦l≦L)とのLp距離を算出し参照テーブルD[t][l]に保持する残差ベクトル距離算出手段と、
前記登録ベクトルの登録情報である残差識別値lt(1≦t≦T)を基に、前記テーブルD[t][l]を参照することで、クエリベクトルと登録ベクトルのLp距離の推定値を、参照テーブルの重み付き和d(=Σt=1 Twt・D[t][lt])として算出する登録ベクトル距離算出手段と、
前記距離の重み付き和dが、所定閾値以下となる登録ベクトルを、又は、距離の重み付き和dが小さいものから順に所定個数となる登録ベクトルを、検索結果として出力する検索判定手段と
を有することを特徴とする請求項2から6のいずれか1項に記載の検索装置。 - 前記登録ベクトルは、画像の局所特徴領域から抽出された局所特徴ベクトルであり、
前記登録ベクトルの付加情報は、画像識別子(IDentifier)、局所特徴領域のスケール、局所特徴領域の角度のいずれか1つを含むことを特徴とする請求項1から7のいずれか1項に記載の検索装置。 - 粗量子化及び直積量子化を用いて符号化された高次元の登録ベクトルの集合からクエリベクトルに類似したベクトルを検索する装置に搭載されたコンピュータを機能させるプログラムであって、
粗量子化における代表識別値n(=1〜N)に割り当てられた学習ベクトルfと、それに対応する代表ベクトルfnとの間の残差ベクトルfr(=f−fn)を、T個の残差部分ベクトルに分割し、t番目の残差部分ベクトルの集合Rn,tをクラスタリングし、各クラスタから直積量子化のためのコードブックを作成する残差コードブック生成手段としてコンピュータを機能させることを特徴とする検索プログラム。 - 前記残差コードブック生成手段は、
残差コードブック及び残差コードブック識別子テーブルT[n][t]を生成するものであり、
代表ベクトルfnと、当該代表ベクトルfnに属する学習ベクトルfとの間の残差ベクトルfr(=f−fn)を導出することによってN個の残差クラスタを作成する第1の機能と、
前記残差ベクトルfrをT個の残差部分ベクトルに分割し、残差部分ベクトル集合Rn,t(1≦n≦N,1≦t≦T)を生成する第2の機能と、
前記残差部分ベクトル集合Rn,tそれぞれについて、前記残差コードブック識別子テーブルT[n][t]に、いずれかのラベル値m(m=1,2,..,M)を割り当てる第3の機能と、
前記ラベル値mそれぞれについて、当該ラベル値mが割り当てられた全ての残差部分ベクトル集合Rn,tを用いて、当該m番目の残差コードブックを生成する第4の機能と、
前記残差部分ベクトル集合Rn,tそれぞれについて、M個の残差コードブックそれぞれで量子化した際の量子化誤差が最も小さくなるm'番目の残差コードブックを用いて残差コードブック識別子テーブルT[n][t]を更新する第5の機能と
を有し、第4及び第5の機能を繰り返し実行する
ようにコンピュータを機能させることを特徴とする請求項9に記載の検索プログラム。 - コードブックを生成するコードブック生成手段を更に有し、
前記コードブック生成手段は、
前記学習ベクトルの集合を、N個のクラスタにクラスタリングする第1の機能と、
前記クラスタ毎に、代表ベクトルを導出する第2の機能と、
各代表ベクトルに、一意の代表識別値n(=1〜N)を割り当てたコードブックを生成する第3の機能とを実行する
ようにコンピュータを機能させることを特徴とする請求項10に記載の検索プログラム。 - 前記登録ベクトルfを量子化するために、代表識別値n(=1〜N)と代表ベクトルfnとを対応付けたコードブックを記憶するコードブック記憶手段と、
前記登録ベクトルfを、前記コードブックを用いて、代表識別値nに量子化するベクトル量子化手段と、
前記登録ベクトルfから代表ベクトルfnを引いた残差ベクトルfrを導出する残差ベクトル導出手段と、
前記残差ベクトルをT個の残差部分ベクトルfr 1, fr 2, ..., fr Tに分割する残差ベクトル分割手段と、
各残差部分ベクトルfr tを更に量子化するために、残差識別値l(=1〜L)と残差部分代表ベクトルflとを対応付けた残差コードブックをM個記憶すると共に、前記代表識別値nに対応付けられた登録ベクトルfの残差部分ベクトルfrtが、前記M個の残差コードブックのどれで量子化すべきかを示す残差コードブック識別子テーブルT[n][t]を記憶する残差コードブック記憶手段と、
前記残差部分ベクトルfr tを、T[n][t]番目の前記残差コードブックで量子化する残差部分ベクトル量子化手段と、
前記登録ベクトルfの代表識別値n毎に、複数の残差部分ベクトルfr tの残差識別値lt(1≦t≦T)の集合と、登録ベクトルfに関する付加情報とを、各登録ベクトルfの登録情報として登録した転置インデックスを生成する転置インデックス生成手段と、
前記転置インデックスを、登録ベクトルの集合として記憶する転置インデックス記憶手段と
してコンピュータを更に機能させることを特徴とする請求項11に記載の検索プログラム。 - 前記残差コードブック生成手段における第3の機能について、前記残差コードブック識別子テーブルT[n][t]に、ランダムに、いずれかのラベル値m(m=1,2,..,M)を割り当てるようにコンピュータを機能させることを特徴とする請求項11又は12に記載の検索プログラム。
- 前記残差コードブック生成手段における第3の機能について、
前記残差部分ベクトル集合Rn,tの中から、ランダムにいずれか1つの残差部分ベクトル集合Rn,tを選択する第31の機能と、
選択された当該残差部分ベクトル集合Rn,t内の残差部分ベクトルをクラスタリングし、1つの残差コードブックを生成する第32の機能と、
前記残差部分ベクトル集合Rn,tそれぞれについて、既に作成された全ての残差コードブックそれぞれで量子化した際に、量子化誤差の総和が最小となる残差コードブック及び量子化誤差Dn,tを求める第33の機能と、
全ての残差部分ベクトル集合Rn,t(1≦n≦N,1≦t≦T)の中から前記Dn,tに比例する確率で1つの残差部分ベクトル集合を選択し、その残差部分ベクトル集合内の残差部分ベクトルをクラスタリングすることで、1つの残差コードブックを生成する第34の機能と、
M個の残差コードブックが生成されるまで、第33及び第34の機能を繰り返す第35の機能と、
前記残差部分ベクトル集合Rn,tそれぞれについて、M個の残差コードブックそれぞれで量子化した際に、量子化誤差が最小となる当該残差コードブックのラベル値mを、当該残差部分ベクトル集合Rn,tに割り当てる第36の機能と
してコンピュータを更に機能させることを特徴とする請求項11又は12に記載の検索プログラム。 - 前記転置インデックス記憶手段を用いて、クエリベクトルに類似したベクトルを検索するために、
前記ベクトル量子化手段は、前記クエリベクトルfを、前記コードブックを用いて、代表識別値nに量子化し、
前記残差ベクトル導出手段は、前記クエリベクトルfから代表ベクトルfnを引いたクエリ残差ベクトルfrを導出し、
前記残差ベクトル分割手段は、前記クエリ残差ベクトルをT個のクエリ残差部分ベクトルに分割する
と共に、
前記クエリ残差部分ベクトルfr tと、前記残差コードブック識別子テーブルT[n][t]により指定される残差コードブックの各残差代表ベクトルft,l(1≦l≦L)とのLp距離を算出し参照テーブルD[t][l]に保持する残差ベクトル距離算出手段と、
前記登録ベクトルの登録情報である残差識別値lt(1≦t≦T)を基に、前記テーブルD[t][l]を参照することで、クエリベクトルと登録ベクトルのLp距離の推定値を、参照テーブルの重み付き和d(=Σt=1 Twt・D[t][lt])として算出する登録ベクトル距離算出手段と、
前記距離の重み付き和dが、所定閾値以下となる登録ベクトルを、又は、距離の重み付き和dが小さいものから順に所定個数となる登録ベクトルを、検索結果として出力する検索判定手段と
してコンピュータを更に機能させることを特徴とする請求項9から14のいずれか1項に記載の検索プログラム。 - 前記登録ベクトルは、画像の局所特徴領域から抽出された局所特徴ベクトルであり、
前記登録ベクトルの付加情報は、画像識別子(IDentifier)、局所特徴領域のスケール、局所特徴領域の角度のいずれか1つを含むようにコンピュータを機能させることを特徴とする請求項9から15のいずれか1項に記載の検索プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011142458A JP5637939B2 (ja) | 2011-06-28 | 2011-06-28 | 少ないコードブックの情報量によって高次元の特徴ベクトルを検索する検索装置及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011142458A JP5637939B2 (ja) | 2011-06-28 | 2011-06-28 | 少ないコードブックの情報量によって高次元の特徴ベクトルを検索する検索装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013011920A true JP2013011920A (ja) | 2013-01-17 |
JP5637939B2 JP5637939B2 (ja) | 2014-12-10 |
Family
ID=47685774
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011142458A Active JP5637939B2 (ja) | 2011-06-28 | 2011-06-28 | 少ないコードブックの情報量によって高次元の特徴ベクトルを検索する検索装置及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5637939B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015022383A (ja) * | 2013-07-16 | 2015-02-02 | Kddi株式会社 | 画像に基づくバイナリ局所特徴ベクトルを用いた検索装置、システム、プログラム及び方法 |
KR20180110959A (ko) * | 2017-03-30 | 2018-10-11 | 오드컨셉 주식회사 | 벡터 양자화의 혼합에 기초한 부호화 방법 및 이를 이용한 최근접 이웃 검색(nns) 방법 |
CN110309294A (zh) * | 2018-03-01 | 2019-10-08 | 优酷网络技术(北京)有限公司 | 内容集合的标签确定方法及装置 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6640896B2 (ja) | 2018-02-15 | 2020-02-05 | 株式会社東芝 | データ処理装置、データ処理方法およびプログラム |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11010A (en) * | 1854-06-06 | William w | ||
JPH0359700A (ja) * | 1989-07-28 | 1991-03-14 | Toshiba Corp | 予測残差信号のベクトル量子化方式 |
JPH0475100A (ja) * | 1990-07-17 | 1992-03-10 | Sharp Corp | 符号化装置 |
JPH09154138A (ja) * | 1995-05-31 | 1997-06-10 | Toshiba Corp | 動画像符号化/復号化装置 |
JP2002163272A (ja) * | 2000-11-15 | 2002-06-07 | Samsung Electronics Co Ltd | 特徴ベクトル空間のインデクシング方法及び検索方法 |
JP2009020769A (ja) * | 2007-07-13 | 2009-01-29 | Toshiba Corp | パターン探索装置及びその方法 |
-
2011
- 2011-06-28 JP JP2011142458A patent/JP5637939B2/ja active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11010A (en) * | 1854-06-06 | William w | ||
JPH0359700A (ja) * | 1989-07-28 | 1991-03-14 | Toshiba Corp | 予測残差信号のベクトル量子化方式 |
JPH0475100A (ja) * | 1990-07-17 | 1992-03-10 | Sharp Corp | 符号化装置 |
JPH09154138A (ja) * | 1995-05-31 | 1997-06-10 | Toshiba Corp | 動画像符号化/復号化装置 |
JP2002163272A (ja) * | 2000-11-15 | 2002-06-07 | Samsung Electronics Co Ltd | 特徴ベクトル空間のインデクシング方法及び検索方法 |
JP2009020769A (ja) * | 2007-07-13 | 2009-01-29 | Toshiba Corp | パターン探索装置及びその方法 |
Non-Patent Citations (3)
Title |
---|
CSNG201100090009; 内田 祐介 他: '大域・局所画像特徴および音響特徴を用いた高精度なコピー検出手法' 電子情報通信学会技術研究報告 Vol.110,No.414, 20110210, pp.49-54., 社団法人電子情報通信学会 * |
JPN6014036659; 内田 祐介 他: '大域・局所画像特徴および音響特徴を用いた高精度なコピー検出手法' 電子情報通信学会技術研究報告 Vol.110,No.414, 20110210, pp.49-54., 社団法人電子情報通信学会 * |
JPN6014036661; Herve Jegou et al: 'Product Quantization for Nearest Neighbor Search' IEEE Transactions on Pattern Analysis and Machine Intelligence Vol.33,Issue 1, 201101, pp.117-128., IEEE * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015022383A (ja) * | 2013-07-16 | 2015-02-02 | Kddi株式会社 | 画像に基づくバイナリ局所特徴ベクトルを用いた検索装置、システム、プログラム及び方法 |
KR20180110959A (ko) * | 2017-03-30 | 2018-10-11 | 오드컨셉 주식회사 | 벡터 양자화의 혼합에 기초한 부호화 방법 및 이를 이용한 최근접 이웃 검색(nns) 방법 |
KR101958939B1 (ko) | 2017-03-30 | 2019-03-15 | 오드컨셉 주식회사 | 벡터 양자화의 혼합에 기초한 부호화 방법 및 이를 이용한 최근접 이웃 검색(nns) 방법 |
US11436228B2 (en) * | 2017-03-30 | 2022-09-06 | Odd Concepts Inc. | Method for encoding based on mixture of vector quantization and nearest neighbor search using thereof |
CN110309294A (zh) * | 2018-03-01 | 2019-10-08 | 优酷网络技术(北京)有限公司 | 内容集合的标签确定方法及装置 |
CN110309294B (zh) * | 2018-03-01 | 2022-03-15 | 阿里巴巴(中国)有限公司 | 内容集合的标签确定方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
JP5637939B2 (ja) | 2014-12-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5436346B2 (ja) | 高次元の特徴ベクトルの集合から類似した特徴ベクトルを検索する検索装置及びプログラム | |
WO2020182019A1 (zh) | 图像检索方法、装置、设备及计算机可读存储介质 | |
Baranchuk et al. | Revisiting the inverted indices for billion-scale approximate nearest neighbors | |
CN107085607B (zh) | 一种图像特征点匹配方法 | |
CN109697451B (zh) | 相似图像聚类方法及装置、存储介质、电子设备 | |
US20080301133A1 (en) | Location recognition using informative feature vocabulary trees | |
US11106708B2 (en) | Layered locality sensitive hashing (LSH) partition indexing for big data applications | |
JP5637939B2 (ja) | 少ないコードブックの情報量によって高次元の特徴ベクトルを検索する検索装置及びプログラム | |
Chiu et al. | Learning to index for nearest neighbor search | |
US9940100B2 (en) | Shortlist computation for searching high-dimensional spaces | |
JP7006966B2 (ja) | ベクトル量子化の混合に基づく符号化方法及びこれを用いた最近傍探索(nns)方法 | |
EP3115908A1 (en) | Method and apparatus for multimedia content indexing and retrieval based on product quantization | |
CN111597371A (zh) | 外观专利的多模态图像检索方法及系统 | |
CN113495965A (zh) | 一种多媒体内容检索方法、装置、设备及存储介质 | |
Chen et al. | Robustiq: A robust ann search method for billion-scale similarity search on gpus | |
Feng et al. | A novel ECOC algorithm with centroid distance based soft coding scheme | |
Sun et al. | Automating nearest neighbor search configuration with constrained optimization | |
CN109446408B (zh) | 检索相似数据的方法、装置、设备及计算机可读存储介质 | |
Li et al. | Embedding Compression in Recommender Systems: A Survey | |
JP2018055618A (ja) | 確率モデルに基づく階層的なコードブックを用いて量子化するプログラム、装置及び方法 | |
CN113536020B (zh) | 数据查询的方法、存储介质和计算机程序产品 | |
JP2013140494A (ja) | 高次元の特徴ベクトルを検索する検索装置及びプログラム | |
CN115129949A (zh) | 向量范围检索的方法、装置、设备、介质及程序产品 | |
Li et al. | Hubness-based sampling method for nyström spectral clustering | |
CN113609313A (zh) | 数据处理方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140213 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140709 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140828 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140908 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20141021 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20141021 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5637939 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |