JP7006966B2 - ベクトル量子化の混合に基づく符号化方法及びこれを用いた最近傍探索(nns)方法 - Google Patents

ベクトル量子化の混合に基づく符号化方法及びこれを用いた最近傍探索(nns)方法 Download PDF

Info

Publication number
JP7006966B2
JP7006966B2 JP2019554379A JP2019554379A JP7006966B2 JP 7006966 B2 JP7006966 B2 JP 7006966B2 JP 2019554379 A JP2019554379 A JP 2019554379A JP 2019554379 A JP2019554379 A JP 2019554379A JP 7006966 B2 JP7006966 B2 JP 7006966B2
Authority
JP
Japan
Prior art keywords
vector
order
query
residual
codeword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019554379A
Other languages
English (en)
Other versions
JP2020515986A (ja
Inventor
ヂャオ、ワンレイ
ムン、サンファン
Original Assignee
オ-ディーディー コンセプツ インク.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by オ-ディーディー コンセプツ インク. filed Critical オ-ディーディー コンセプツ インク.
Publication of JP2020515986A publication Critical patent/JP2020515986A/ja
Application granted granted Critical
Publication of JP7006966B2 publication Critical patent/JP7006966B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24553Query execution of query operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2237Vectors, bitmaps or matrices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Complex Calculations (AREA)

Description

特許法第30条第2項適用 ウェブサイトの掲載年月日:平成29年1月30日、ウェブサイトのアドレス:https://arxiv.org/abs/1701.08475
本発明は、情報検索、マルチメディア検索に関し、より詳細には、ベクトル量子化の混合に基づく符号化方法及びこれを用いた最近傍探索(NNS)方法に関する。
最近傍探索(NNS)方法は、多くのコンピュータ分野で重点的に研究されている方法であり、これは、データベース、機械学習、コンピュータ起動、及び情報検索のような広範囲な分野で基礎的な役割を果たす。最近傍探索(NNS)問題は、次のように簡単に定義することができる。クエリq∈R及びクエリと同じ次元の候補ベクトルn個が与えられた時、最近傍探索(NNS)問題は特定メトリック(一般に、l1-距離、又はl2-距離)によって空間的に最も近いクエリに対するサンプルを返さなければならない。
最近傍は、全候補セットを線形スキャン(探索)することによって識別することができるが、線形探索の時間複雑度はO(n・D)である。線形探索の時間複雑度は次元及びデータセットの規模のいずれにも線形的に増加するが、次元及びデータの両方とも増加する場合、時間複雑度は実際に2次的に増加する。したがって、実時間検索は高次元、大規模、高密度ベクトル空間ではほぼ不可能である。このような場合、K-Dツリー、R-ツリー、及びLSH(Locality Sensitive Hashing)などの大部分の伝統的な方法では満足すべき結果が得られない。
ここ数年でベクトル量子化に基づく方法が、簡単な計算、遥かに低い空間複雑度、及び高次元データにおける良好な結果によって益々大衆化しつつある。代表的な方法には、積量子化器(Product Quantizer;PQ)、加算量子化器(Additive Quantizer;AQ)、及び結合量子化器(Combined Quantizer;CQ)がある。
PQは高次元ベクトルを複数のセグメントに分解する。各セグメント(サブ-ベクトル)は該当のサブ-空間で訓練された量子化器によって量子化される。最後に、原ベクトルはそれらのサブ-空間量子化器から一連の最近接コードワードの連結によって近似化される。クエリと候補ベクトルとの間の距離は、クエリとサブ-空間における最近接コードワードとの間の距離によって近似化される。
PQとは違い、AQ及びCQはベクトルをセグメントに分けない。両方とも同一次元にある複数の要素ベクトルの和でベクトルを示す。このような要素ベクトルは、一連の事前訓練されたコードブックの中から選択される(最大で一つのベクトルが一つのコードブックから選択される。)
PQと類似に、クエリと候補ベクトルとの間の距離は、クエリと選択された要素ベクトルとの間の距離の和によって近似化され、これは、ルックアップテーブルを確認して効率的に計算することができる。
量子化接近法には2つの長所がある。一つは、候補ベクトルが圧縮(一般的にメモリー消費が1桁だけ減少)されて迅速な検索を支援するために全参照セットをメモリーにロードできるという点である。もう一つは、クエリと全候補との間の距離の計算は、クエリとコードブックコードワードとの間の距離の計算によって近似化されるときに非常に効率的であるという点である。
しかし、このような量子化に基づく方法においてはインデクシングされるべきデータに暗示的仮定が与えられなければならない。計算費用の問題のためごく限られた数のコードワードしか量子化に使用されず、量子化は、広いエネルギースペクトルにわたっている全てのベクトルの正確な近似値を求めることができない。
例えば、与えられたベクトル[0.1,0.03,---]1×128及び[55,122,---]1×128のベクトル長は非常に異なる。大きいエネルギー差のため、既存の方法では上のいずれか一方のベクトルしか近似できず、他方のベクトルは近似できなくなる。結果的に、AQ、CQ及びPQに対して、エネルギー分布が広い範囲にわたっている一般的な場合には、低い近似誤差を達成することがほぼ困難である。しかも、AQ、CQ及びPQのような現在の圧縮方式は、ベクトル符号化イシューだけを言及している。これら方法のいずれか一つで最近傍探索(NNS)を行うとき、クエリと符号化された候補との比較は不回避であり、このような方法を大規模の検索作業に拡張することは難しい。
本発明は、前述した問題を解決するためのものであり、エネルギー値の範囲が非常に大きいデータセットを効果的に近似し、より高い精密度が得られる符号化方法を提供することを目的とする。
また、本発明は、逆リストのインデックスを構築できる符号化方法を提供することを他の目的とする。
また、本発明は、ベクトル量子化のための符号化訓練及び量子化過程を簡素化し、高い符号化正確性が得られる符号化方法を提供することを他の目的とする。
また、本発明は、クエリと候補ベクトルとの距離の計算を簡素化し、検索速度を改善できる最近傍探索方法を提供することをさらに他の目的とする。
このような目的を達成するための本発明は、候補データセットからクエリの最近傍を検索するための候補ベクトルの符号化方法であって、入力ベクトル(この時、最初の入力ベクトルは前記候補ベクトル)を正規化して方向ベクトル及びベクトルエネルギーを取得する正規化段階、前記方向ベクトルを量子化してコードワード及び残差ベクトルを取得する量子化段階、前記残差ベクトルを前記入力ベクトルとして、前記正規化段階及び前記量子化段階を、予め設定された符号化次数だけ反復する段階、及び前記反復による一つ以上のコードワード及び一つ以上のベクトルのエネルギーを用いて前記候補ベクトルを符号化する段階を含むことを特徴とする。
また、本発明は、候補データセットからクエリの最近傍を検索する方法であって、前記クエリを正規化及び量子化して取得した一つ以上のコードワードを含む逆リストのインデクシングキーと前記クエリ間の距離を計算する段階、前記計算された距離を昇順に整列し、整列された距離が上位の特定百分位数以内である逆リストを候補連結リストに設定する段階、及び前記候補連結リストに含まれた候補ベクトルと前記クエリ間の距離を計算して前記最近傍を取得する段階を含むことを特徴とする。
前述したような本発明によれば、エネルギー値の範囲が非常に大きいデータセットを効果的に近似し、より高い精密度を得ることができる。
また、本発明によれば、逆リストのインデックスを構築することができる。
また、本発明によれば、ベクトル量子化のための符号化訓練及び量子化過程を簡素化し、高い符号化正確性を得ることができる。
また、本発明によれば、クエリと候補ベクトルとの距離の計算を簡素化し、検索速度を改善することができる。
本発明の一実施例による最近傍探索方法を概略的に説明するための順序図である。 本発明の一実施例による正規化ベクトル量子化を説明するための図である。 本発明の一実施例による再帰的近似化を説明するための図である。 本発明の一実施例によるベクトル量子化の混合に基づく符号化結果をHKMと比較するための図である。 ベクトル量子化の混合に基づくベクトル符号化方法を説明するための順序図である。 本発明の一実施例によるベクトル符号化方法を説明するための図である。 SIFT1M及びGIST1Mデータセットにおいて本発明の一実施例によるベクトル量子化の混合に基づく符号化による結果をIVFPQ、IVFRVQ、IMIの結果と対比するための図である。 本発明の一実施例によるベクトル量子化の混合に基づく符号化を用いた最近傍探索方法を説明するための順序図である。
前述した目的、特徴及び長所が添付図面を参照して詳細に後述され、これに基づいて、本発明の属する技術分野における通常の知識を有する者にとって本発明の技術的思想が容易に実施可能であろう。本発明の説明において、本発明に関連している公知技術の具体的な説明が本発明の要旨を余分に曖昧にし得ると判断される場合には詳細な説明を省略する。
図面中、同一の参照符号は同一又は類似の構成要素を表し、明細書及び特許請求の範囲に記載された全ての組み合わせは、任意の方式で組み合わせることができる。そして、特に規定しない限り、単数と記載したものは一つ以上を含むことができ、単数表現に対する言及は複数表現をも含み得ると理解されるべきである。
前述した問題を解決するために、本発明は、残差ベクトル量子化(Residual Vector Quantization;RVQ)に基づく方法を提案している。本発明は、2つの側面、符号化及びインデクシング段階の両方において最近傍探索(NNS)の問題を解決することを目的とする。
RVQは、前段階のベクトル量子化から得た残差ベクトルを再帰量子化して原ベクトルに接近する方法である。試験結果によれば、簡単な訓練で簡単なRVQを行う場合にも、複雑な訓練が要求されるAQ、CQ及びSQと略同一の結果が得られるという事実がわかった。
また、本発明は従来のRVQを改善して、ベクトルのエネルギーが広い範囲にわたってインデクシングされた場合にも適用可能である。
本発明の一実施例による再帰正規化されたベクトル量子化(Recursive Normalized Vector Quantization;以下、‘RNQ’という。)方法は、ベクトルと残差ベクトルを量子化する前に正規化を行い、ベクトルの方向及びエネルギーを得た後に、ベクトルの方向及びエネルギーをそれぞれ量子化(符号化)する。
本発明に係る速い最近傍探索(NNS)方法は、RVQ及びRNQを混合した符号化方式を利用している。具体的に、相対的に低い次数の残差ベクトルはRVQによって符号化される。残りの相対的に高い次数の残差ベクトルはRNQで符号化される。このデザインは、RVQの低い次数の符号化効率性及びRNQの低い符号化誤差という両方の長所を有する。オンライン検索において低い次数のRVQコードは逆リスト(inverted list)のインデクシングキーとして結合される。
本発明は、区別されるインデクシングキー値を生成して最近傍探索(NNS)の速度を上げるためにRVQコードブック設定(符号化設定)に対する包括的な研究を行った結果に関する。
各次数のコードブックサイズを慎重に構成すると符号化誤りが非常に減少する。本発明は、精巧な加重値体系よりも重要である。本発明の内容と関連して、我々は小さいコードブックの多重次数(multiple orders)から反転されたキー(inverted key)を作ることが、大きいコードブックの単一次数(single order)からキーを作ることに比べてより有利であることを発見した。前者は顕著に低い量子化費用と符号化誤差につながるためである。また、このような多次元キー生成方式(multi-order key generation scheme)を用いて兆(trillion)単位レベルの検索作業に拡張することが非常に便利であることが明らかになった。
ツリー分割接近法の主な短所は、多いメモリーを要求するという点である。一方では、速い比較を支援するために全候補ベクトルがメモリーにロードされるが、他方では、インデクシングに用いられるツリーノードが相当な量の追加メモリーを占める。全般的にメモリー消費が参照セットのサイズよりも大きい。
ツリー分割接近法とは別に、最近傍探索(NNS)に局所性鋭敏型ハッシュ(LSH)を適用しようとするいくつかの試みがあった。一般に、検索段階には2つの段階がある。段階1は、クエリと同一又は類似のハッシュキーを共有する候補を収集し、段階2は、最近傍を探すためにクエリと全ての選択された候補とをいちいち比較する。局所性鋭敏型ハッシュ(LSH)は、大量の最近傍を要求するアプリケーションに適する。また、段階2において速い比較を支援するために全参照セットをメモリーにロードしなければならず、多くのメモリーが消費される。
ここ数年、NNSの問題はベクトル量子化によって扱われた。積量子化器を適用する技術は、数十年間解けずにいた問題を解決する新しい方法を提示した。
本発明に係るクエリの最近傍探索は、大略的に、図1に示すように、候補ベクトルをベクトル量子化(RVQ及びRNQ)の混合に基づく符号化によって圧縮し(S10)、圧縮された候補ベクトルを用いてクエリの最近傍を検索(S20)することを含むことができる。また、段階20において、圧縮された候補ベクトルとクエリとの間の距離はコードワードとクエリとの間の距離によって近似化され得る。
以下では、図2~図7を参照して、本発明の一実施例による段階10におけるベクトル量子化の混合に基づく符号化について説明し、これを用いた最近傍探索方法について、図8を参照してより詳しく説明する。
ベクトル量子化の混合に基づく符号化を説明するために、本明細書では、まず、残差ベクトル量子化(RVQ)を検討し、次に、残差ベクトルが各段階で量子化される前に正規化されるRVQの変形(RNQ)を提示する。さらに、圧縮されないクエリとRVQ及びRNQで圧縮された候補ベクトル間の距離の計算方法が提示される。
A.残差ベクトル量子化(RVQ)
複数のベクトルの合成によってベクトルを近似化するアイデアは、“2段階残差ベクトル量子化”の設計に遡ることができる。この方法において、入力ベクトルは量子化器によって符号化され、それの残差(量子誤差)は他の量子化器によって順次に符号化される。この手法は、以前の量子化段階で残された残差ベクトルが再帰的に量子化される複数の次数(段階)に拡張された。
候補ベクトル(以下、ベクトルという。)をv∈R、一連のコードブックをV,V,...Vとすれば、ベクトルvはこのようなコードブックのコードワード構成によって近似化される。特に、1コードワードは1段階のコードブックの中から選択される。この再帰的量子化がk番目の段階まで反復されると、ベクトルvは次の式1のように近似化される。
Figure 0007006966000001
式1において、段階mにおけるVは、m-1段階で収集された残差
Figure 0007006966000002
で訓練されたものである。
いくつかの手法がRVQの量子化誤差を減少させるために提案された。C.F.Barnes,S.A.Rizvi,and N.M.Nasrabadi,“Advances in residual vector quantization:a review.,”IEEE Transactions on Image Processing,vol.5,no.2,pp.226262,1996.と特定される文献(以下、先行文献1)、及びW.-Y.Chan and A.Gersho,“Enhanced multistage vector quantization with constrained storage,” in Twenty-Fourth Asilomar Conference on Signals,System and Computing,pp.659663,Nov.1990.と特定される文献(以下、先行文献2)によれば、多重段階のコードブックはこれらを共同で訓練することによって最適化された。
本発明の一実施例において、我々はRVQの単純実施だけを考慮し、各段階におけるコードブックは、以前段階で収集した残差から独立して訓練されたものである。先行文献1及び先行文献2で提案された共同最適化は、性能をより強化させることができる。
単純であるが、RVQはAQ及びCQのような最近の構成的圧縮接近法に比べて長所がある。RVQの方法では、ベクトルのエネルギーは個別の量子化器に無作為に分配される。AQ、CQ又はPQとは違い、RVQは、低い段階の量子化器においてより多い原ベクトルのエネルギーを維持する。
RVQは実際に原ベクトルに対して粗密(coarse-to-fine)圧縮を形成する。言い換えると、相対的に低い段階のコードは相対的に高い段階のコードよりも多い情報を伝達する。結果的に、下位段階のコードは逆ファイル(inverted files)を生成するインデクシングキーとして使用するのに特に適合するので、速いANN検索を可能にする。
一方、これらのコードは、他の逆リストにベクトルがバラバラに分布するように空間を最大限に分割することができる。他方では、インデクシングキーの長さは最小限に抑えられ、逆ファイル構造の規模を可能な限り小さくさせる。
B.再帰的正規化ベクトル量子化(RNQ)
一つの量子化段階で使用可能なコードワードの数が制限されているため、各段階における残余空間が正しく量子化されないことがある。これは残差のエネルギーが広い範囲にわたっている時に特にそうである。この問題を解決するために、本発明の一実施例によれば、量子化に提供する前に残差ベクトルをl2-正規化することが好ましい。言い換えると、ベクトルのエネルギーとその単位長ベクトルは別々に量子化されるので、量子化が容易となる。
ベクトルv∈Rとすれば、
Figure 0007006966000003
であり、
Figure 0007006966000004
はベクトルのエネルギーを維持する。AQ、PQ、及びCQとは違い、ベクトルのエネルギーeと正規化されたベクトル(すなわち、方向ベクトル)
Figure 0007006966000005
は個別に符号化されるだろう。eがスカラー値であるので、eは、符号化及びインデクシングが容易である。
以下では単位長ベクトル
Figure 0007006966000006
をどのように符号化するかについて重点的に説明する。
既に訓練されたコードブック
Figure 0007006966000007
であり、
Figure 0007006966000008
である。量子化関数Q(x,V)は、ベクトルxのためのコードブックVから最近傍を返還する。したがって、ベクトルuは次の式2のように表される。
Figure 0007006966000009
Figure 0007006966000010
であり、
Figure 0007006966000011
がベクトルQ(u,V)に直交(orthogonal)する残差ベクトルである場合、
Figure 0007006966000012
であることを考慮すれば、上記の式2を式3のように整理することができる。
Figure 0007006966000013
図2は、(a)はベクトルu
Figure 0007006966000014

Figure 0007006966000015
及びそれらの関係を2次元空間に示すものである。残差ベクトル
Figure 0007006966000016
は同一の方式でさらに近似化され得る。
Figure 0007006966000017
であることを考慮して、e
Figure 0007006966000018
のエネルギーを維持し、uがl-正規化ベクトルである場合、uは次の式4のように近似化される。
Figure 0007006966000019
Figure 0007006966000020
が他のコードブックVでuに最近接したコードワードである場合、uは次の式5のように表される。
Figure 0007006966000021
同様に、符号化プロセスを式6のようにさらに高い次元に拡張させることは非常に自然である。
Figure 0007006966000022
4次数で近似化を止めた場合、次の式7を得ることができた。
Figure 0007006966000023
このベクトルuの近似は
Figure 0007006966000024
と表示される。式7でpとeはベクトルui-1とコードワードw間のコサインとサインである。結果的に、それらは結合される。そのいずれか一方が知られると、他方が固定されるという意味であり、これは符号化便宜性を提供する。符号化において装置はpシリーズとeシリーズのいずれか一方でのみスカラー量子化を行えばいい。
式7において、pとeはいずれも[0,1]の範囲内にあるため、m番目の次数に維持される実際エネルギーは
Figure 0007006966000025
であり、これは、以前次数に維持されたエネルギーよりも大きくない。したがって、RNQの多重次数(multiple orders)はベクトル空間に対して粗密(coarse-to-fine)分割を形成するRVQに類似している。
図3は、1次数から4次数までの近似を示す図である。原ベクトルvは
Figure 0007006966000026
と表現される。
全般的に、本発明の一実施例による符号化とRVQとの主な差異点は、本発明がコードブックコードワードに代えて、コードブックコードワードに投影してベクトルを近似化するという点である。
従来の構成接近法と比較すれば、本発明は、エネルギーを符号化するための余分のビットを必要とする。しかし、これは多量のメモリーを消費しない。本発明の一実施例による実験結果によれば、一般に、各次数のエネルギーを符号化するのには4ビットで十分である。
n次量子化器でベクトルを近似化するためにはn個のコードブックが必要である。このようなコードブックは、以前段階で正規化された残差を収集して訓練される。
各次数における訓練にはk-平均法(k-means)クラスタリングを用いることができる。k-平均法クラスタリング後にはクラスタリングの中心は単位長にl-正規化され、符号化コードワードとして使用され得る。
前述した新しい符合化方法を再帰的正規化ベクトル量子化(RNQ)という。
C.RNQとRVQとの混合に基づく符号化
RNQの場合、符号化誤りはRVQに比べて非常に小さいが、各次数に4ビットがさらに必要である。一般に、速いNNSのために、RNQ/RVQコードの初めの2つの次数で逆インデクシングキーを生成する。結果的に、逆変換されたキーはRVQよりも8ビット長くなる。インデクシングキーがRVQよりも明確であるが、キースペースキーのボリュームは、ベクトル空間を不要に低い密度に分けるRVQに比べて256倍さらに大きい。この理由から、速いNNSにおいて本発明に係る装置は、与えられたベクトルに対する混合符号化を選好する。一般に、RVQは符号化の初めの2つの次数に用いられ、インデクシングキーを生成するために用いられる。
2次数RVQで残った残差はRNQでさらに符号化される。結果的に、ベクトルは4次数に近似され、近似値は次の式8の通りである。
Figure 0007006966000027
混合符号化方法は、図5及び図6に示す通りであり、前述したA~Cを含むベクトルの符号化方法を、図5を参照して整理すると次の通りである。
まず、入力ベクトル
Figure 0007006966000028
を正規化すれば、スカラー値を有するベクトルエネルギー
Figure 0007006966000029
と方向ベクトル
Figure 0007006966000030
を取得することができる(S100)。
次に、方向ベクトルを量子化して(S200)、m次コードワードとm次残差ベクトルを取得することができる(S300)。段階200は、前述したB.再帰的ベクトル量子化において説明した通りである。
例えば、最初に候補ベクトルvを入力すると、正規化によって方向ベクトルuを取得し、方向ベクトルを量子化してコードワード
Figure 0007006966000031
と残差ベクトル
Figure 0007006966000032
を取得することができる。
量子化関数は方向ベクトルが入力されると、当該方向ベクトルに対応するコードブックに含まれたコードワードのうち、前記方向ベクトルの最近傍(コードワード)を返還する。量子化段階で残される量子誤差を残差ベクトルといい、これは、上述した式2で
Figure 0007006966000033
に該当する。残差ベクトルは量子化関数が返還するコードワードに直交するものであり得る。参考として、本発明では残差ベクトルを複数の次数で再帰的に量子化し、本明細書では反復される全次数を符号化次数と命名し、符号化次数nは近似化設定によって変わり得る。
次の段階で、現在次数mが符号化次数nよりも小さい場合(S400)、次数mはm+1と1次数増加し、m次残差ベクトルは段階100~段階300で正規化及び量子化過程を経る。したがって、符号化次数nだけ段階100~段階300は反復され、本発明の一実施例によるRNQにはn個のコードブックが要求され、RNQによってn個のコードワードを取得することができる。
段階600は、段階100~段階300の反復実行による一つ以上のコードワード及び一つ以上のベクトルのエネルギーを用いて候補ベクトルを符号化することができる。
図6を用いて段階600についてより詳しく述べる。図6は、インデクシング及び符号化の便宜性を向上させるRVQ及びRNQの混合符号化フレームワークである。説明の明確性のために図6にはそれぞれに対して4個の符号化次数だけを表示した。高いNNS品質を達成するために、より高い次数に拡張されてもよい。図6でhは一つの次数のエネルギーに対するスカラー量子化値である。
まず、符号化次数の数nは、予め設定された基準によって低次数iと高次数jに分類できる。すなわち、n=i+jであり、このうち、jは具体的な問題によって決定され、検索すべき候補データセットが大きい場合、iの値が大きくなり得る。その理由は、低次数iが逆インデクシング構造のインデックスに活用されるためであり、iの値が大きいほど生成されたインデックス値も多くなり、インデクシング可能なデータ数も大きくなる。これは、可能な限りデータセットを散らして、毎度、最近傍クエリで少数の候補ベクトルだけをアクセスするためである。
次に、低次数の入力ベクトルに対応するコードワードを用いて逆リストのインデクシングキーを生成することができる。例えば、n=4、i=2、j=2である図5の例示において、候補ベクトルは式7のように近似化できるが、低次数は、i=2であるので、1次、2次を意味し、よって、低次数の入力ベクトルに対応するコードワードは
Figure 0007006966000034

Figure 0007006966000035
である。すなわち、インデクシングキーは、
Figure 0007006966000036

Figure 0007006966000037
を組み合わせてCに設定することができる。
ここで、
Figure 0007006966000038
は第1次コードブック(V)で正規化された候補ベクトルと最近接したコードワードであり、
Figure 0007006966000039
は第2次コードブック(V)で残差ベクトルと最近接したコードワードを意味する。
次に、高次数の入力ベクトルに対応するコードワード及び低次数の入力ベクトルに対応するベクトルエネルギーを用いてRNQコードを生成することができる。上記の例示において、j=2なので、高次数は3次、4次を意味し、よって、RNQコードの生成にはコードワード
Figure 0007006966000040

Figure 0007006966000041
を用いることができる。
Figure 0007006966000042
は第3次コードブック(V)で残差ベクトルの方向ベクトルとの最近接コードワード、
Figure 0007006966000043
は第4次コードブック(V)で残差ベクトルの方向ベクトルとの最近接コードワードを意味する。また、ベクトルエネルギー値を用いることができるが、eは候補ベクトルのエネルギー(スカラー値)であって、第3残差ベクトルのエネルギー(スカラー値)でよく、eは第4残差ベクトルのエネルギー(スカラー値)でよい。
とpは、B.で前述したように、
Figure 0007006966000044

Figure 0007006966000045
でよく、これはそれぞれ3次、4次方向ベクトルの最近接コードワードへの投影(projection)であり得る。すなわち、pとpは、
Figure 0007006966000046

Figure 0007006966000047
の残差方向ベクトルの投影であり得る。
上述したスカラー量子化値と高次数のベクトル量子化値とを組み合わせてRNQコード(符号化コード)を生成でき、図6の例示によれば、RNQコードはCであり得る。
すなわち、候補ベクトルはインデクシングキーと前記RNQコードとの組合せであるCと符号化できる。上述したように、C、Cは残差ベクトルを量子化した後のコードであり、この2つのコードは逆リストのインデクシングキー値として合わせられる。残ったコードであるCは、逆リストの該当のインデクシングキー値に対応する連結リストに保存され、連結リストの各項目には候補ベクトルの識別情報及びRNQコードが保存され得る。例えば、n=4の上の実施例において、連結リストの各候補項目は<ID,C>であり得る。
図7に示すように、大部分の配置状況においてベクトル量子化混合(MXQ)のリコール率が最も高く、特にGISTIMデータセットにおいて他の方法に比べて優れていた。IVFRVQとMXQの符号化は類似であるが、MXQの結果はIVFRVQに比べて優れており、これは、残存ベクトルの方向及びエネルギーを個別に符号化することが、RVQに比べて効果的であるという事実を示している。
IVFPQに対応する方法は、H.Jegou等が提案した方法である(Product quantization for neighbor search,in:IEEE transactions on pattern analysis and machine intelligence,2011,33(1):117-128)。
IVFRVQに対応する方法は、Y.Chen等が提案した方法である(Approximate nearest neighbor search by residual vector quantization,in:Sensors,vol.10,pp.11259-11273,2010.)。
IMIに対応する方法は、A.Babenko等が提案した方法である(The inverted multi-index,in:Computer Vision and Pattern Recognition(CVPR)、2012 IEEE,2012:3069-3076.)。
最近傍探索方法
図8を参照して、等級剪定に基づくオンライン検索戦略について説明する。候補データセットからクエリqの最近傍を検索するために、段階1000において逆リストのインデックスキーとクエリとの間の距離を計算する。このとき、インデックスキー値IをCとCとに分割できる。CとCは第1次コードブックのベクトル(第1コードワード
Figure 0007006966000048
)及び第2次コードブックのベクトル(第2コードワード
Figure 0007006966000049
)のそれぞれに対応し、クエリqとI間の距離を計算することは、クエリq及び合成ベクトル
Figure 0007006966000050
間の距離を計算することに転換することができる。
例えば、qと合成ベクトルI間の距離は、下記の式のように表現できる。
Figure 0007006966000051
計算速度を上げる段階
上記の式9において、計算速度を上げるために、クエリqと第1コードワード
Figure 0007006966000052
の距離をまず計算することができる(式9のterm1)。これによって、クエリq及び1次数の各符号化コード間の距離を得ることができ、距離はサイズによって整列され得る。後ろにある95%の1次符号化コードに対応するインデックス項目は無視してもよく、残り5%の1次符号化コードに対して続けてクエリq及び2次符号化コードから得られた合成ベクトルIとの距離を計算することができる。同様の方法により、クエリq及び全ての2次符号化コード間の距離を計算した後、インデックス項目を距離によって整列し、後ろにある90%のインデックス項目を無視することができる。すなわち、逆リストのうち、上位の特定百分位数以内の連結リストだけを考慮して検索することができる。このような方式は、i>2の場合へと拡張できる。
式9において、
Figure 0007006966000053

Figure 0007006966000054

Figure 0007006966000055
は、あらかじめ計算でき、次にリストを照会すれば式9による計算が速く行われ得る。これは、図8の段階2000において距離を昇順に整列し、整列された距離が既に設定された上位百分位数以内である逆リストを候補連結リストに設定することに対応する。
次に、候補連結リストに含まれた候補ベクトルvとクエリq間の距離を計算して最近傍を取得することができる(S3000)。
段階3000において候補ベクトルvとクエリq間の距離の計算は、下記の式10によって行うことができ、したがって、ベクトル量子化の混合に基づく符号化方法で符号化された候補ベクトルvとクエリq間の距離を取得することによって、クエリqの最近傍ベクトルを取得することができる。
Figure 0007006966000056
本発明に係るベクトル量子化混合に基づく符号化方法は、既存の量子化方法と比較すれば、前の2つの次数はRVQ符号化を使用し、後ろ2つの次数は残差ベクトルのエネルギーと方向ベクトルをそれぞれ符号化する。したがって、本発明によれば、逆リストのインデックスを構築可能である他、エネルギー値の範囲が非常に大きいデータセットもより効果的に近似することができ、より高い精密度を得ることができる。
また、本発明の等級剪定による最近傍探索戦略によれば、クエリポイントと距離計算が必要な候補項目の数が効果的に減少し、検索過程を加速化することができる。
本発明は、既存の他の量子化方法と比較した時、当該方法の符号化訓練及び量子化過程がいずれも既存方法に比べて簡単であり、比較的優れた符号化正確性も得ることができる。
本明細書で説明される方法は、一つ以上のプロセッサによって実行される一つ以上のコンピュータプログラムによって具現することができる。コンピュータプログラムは非一時的な類型のコンピュータ読取り可能媒体に格納されるプロセッサ実行可能命令を含む。コンピュータプログラムはまた、格納されたデータを含むことができる。非一時的な類型のコンピュータ読取り可能媒体(non-transitory tangible computer readable medium)の非限定的な例は、不揮発性メモリーシステム、磁気格納所及び光学格納所である。
(付記)
(付記1)
候補データセットからクエリの最近傍を検索するための候補ベクトルの符号化方法であって、
入力ベクトル(この時、最初の入力ベクトルは前記候補ベクトル)を正規化して方向ベクトル及びベクトルエネルギーを取得する正規化段階と、
前記方向ベクトルを量子化してコードワード及び残差ベクトルを取得する量子化段階と、
前記残差ベクトルを前記入力ベクトルとして、前記正規化段階及び前記量子化段階を予め設定された符号化次数だけ反復する段階と、
前記反復による一つ以上のコードワード及び一つ以上のベクトルのエネルギーを用いて前記候補ベクトルを符号化する段階と、
を含むベクトル符号化方法。
(付記2)
前記量子化段階は、前記方向ベクトルの次数に対応するコードブックで前記方向ベクトルに最近接したワードを前記コードワードとして返還する段階を含む、付記1に記載のベクトル符号化方法。
(付記3)
前記符号化する段階は、
前記符号化次数を予め設定された基準によって低次数と高次数とに分類する段階と、
前記低次数の入力ベクトルに対応するコードワードを用いて逆リストのインデクシングキーを生成する段階と、
前記高次数の入力ベクトルに対応するコードワード及び低次数の入力ベクトルに対応するベクトルエネルギーを用いてRNQコードを生成する段階とを含み、
符号化された候補ベクトルは、前記インデクシングキーと前記RNQコードとの組合せであり、前記符号化次数は、前記低次数と前記高次数との和である、
付記1に記載のベクトル符号化方法。
(付記4)
前記RNQコードは、前記逆リストにおいて前記インデクシングキーに対応する連結リストに保存され、前記連結リストの各項目は、候補ベクトルの識別情報及びRNQコードを含むことを特徴とする、付記3に記載のベクトル符号化方法。
(付記5)
前記符号化次数を分類する段階は、前記候補データセットのサイズが大きくなるほど、前記低次数に分類される値のサイズを増加させる段階をさらに含む、付記3に記載のベクトル符号化方法。
(付記6)
前記符号化次数を4、前記低次数iを2、前記高次数jを2に設定した場合、前記候補ベクトルは下記の式のように近似化され、
Figure 0007006966000057
前記インデクシングキーは、前記
Figure 0007006966000058
に対応するC及び前記
Figure 0007006966000059
に対応するCを用いて次のように生成され、
インデクシングキー:C
前記RNQコードは、前記eに対応するh及び前記eに対応するh及び前記
Figure 0007006966000060
に対応するC及び前記
Figure 0007006966000061
に対応するCを用いて次のように生成される、付記3に記載のベクトル符号化方法。
RNQコード:C
Figure 0007006966000062
:第1次コードブック(V)で残差ベクトルの方向ベクトルとの最近接コードワード
Figure 0007006966000063
:第2次コードブック(V)で残差ベクトルの方向ベクトルとの最近接コードワード
Figure 0007006966000064
:第3次コードブック(V)で残差ベクトルの方向ベクトルとの最近接コードワード
Figure 0007006966000065
:第4次コードブック(V)で残差ベクトルの方向ベクトルとの最近接コードワード
:第3残差ベクトルのエネルギー(スカラー値)
:第4残差ベクトルのエネルギー(スカラー値)

Figure 0007006966000066
残差方向ベクトルの投影

Figure 0007006966000067
残差方向ベクトルの投影
(付記7)
付記1~6のいずれかに記載の方法を実行させるためにコンピュータ読取り可能媒体に格納されたベクトル符号化応用プログラム。
(付記8)
候補データセットからクエリの最近傍を検索する方法であって、
前記クエリを正規化及び量子化して取得した一つ以上のコードワードを含む逆リストのインデクシングキーと前記クエリ間の距離を計算する段階と、
前記計算された距離を昇順に整列し、整列された距離が上位の特定百分位数以内である逆リストを候補連結リストに設定する段階と、
前記候補連結リストに含まれた候補ベクトルと前記クエリ間の距離を計算して前記最近傍を取得する段階と、
を含む最近傍探索方法。
(付記9)
前記距離を計算する段階は、
1次コードブックに含まれる第1コードワード
Figure 0007006966000068
及び2次コードブックに含まれる第2コードワード
Figure 0007006966000069
の合成ベクトル
Figure 0007006966000070
と前記クエリq間の距離dを計算する段階を含む、付記8に記載の最近傍探索方法。
(付記10)
前記距離を計算する段階は、前記距離dの計算が次の式によってなされることを特徴とする、付記9に記載の最近傍探索方法。
Figure 0007006966000071
(付記11)
前記距離を計算する段階は、
前記クエリと第1コードワード間の距離を計算して昇順に整列する段階と、
前記クエリと第2コードワード間の距離を計算して昇順に整列する段階と、
前記整列された距離が上位の特定百分位数以内である第1コードワード及び第2コードワードを用いて前記合成ベクトルIとクエリq間の距離を計算する段階と、
を含む、付記10に記載の最近傍探索方法。
(付記12)
前記最近傍を取得する段階は、前記候補ベクトルvと前記クエリq間の距離を下記の式を用いて計算する段階を含む、付記8に記載の最近傍探索方法。
Figure 0007006966000072
(付記13)
付記8~12のいずれかに記載の方法を実行させるためにコンピュータ読取り可能媒体に格納された最近傍探索応用プログラム。

Claims (13)

  1. 候補データセットからクエリの最近傍を検索するための候補ベクトルの符号化方法であって、
    入力ベクトル(この時、最初の入力ベクトルは前記候補ベクトル)を正規化して方向ベクトル及びベクトルエネルギーを取得する正規化段階と、
    前記方向ベクトルを量子化してコードワード及び残差ベクトルを取得する量子化段階と、
    前記残差ベクトルを前記入力ベクトルとして、前記正規化段階及び前記量子化段階を予め設定された符号化次数だけ反復する段階と、
    前記反復による前記符号化次数を予め設定された基準に沿って低次数と高次数とに分類し、前記低次数の入力ベクトルに対応する一つ以上のコードワード及び前記高次数の入力ベクトルに対応する一つ以上のベクトルのエネルギーを用いて前記候補ベクトルを符号化する段階と、
    を含むベクトル符号化方法。
  2. 前記量子化段階は、前記方向ベクトルの次数に対応するコードブックで前記方向ベクトルに最近接したワードを前記コードワードとして返還する段階を含む、請求項1に記載のベクトル符号化方法。
  3. 前記符号化する段階は、
    前記符号化次数を予め設定された基準によって低次数と高次数とに分類する段階と、
    前記低次数の入力ベクトルに対応するコードワードを用いて逆リストのインデクシングキーを生成する段階と、
    前記高次数の入力ベクトルに対応するコードワード及び低次数の入力ベクトルに対応するベクトルエネルギーを用いてRNQコードを生成する段階とを含み、
    符号化された候補ベクトルは、前記インデクシングキーと前記RNQコードとの組合せであり、前記符号化次数は、前記低次数と前記高次数との和である、
    請求項1に記載のベクトル符号化方法。
  4. 前記RNQコードは、前記逆リストにおいて前記インデクシングキーに対応する連結リストに保存され、前記連結リストの各項目は、候補ベクトルの識別情報及びRNQコードを含むことを特徴とする、請求項3に記載のベクトル符号化方法。
  5. 前記符号化次数を分類する段階は、前記候補データセットのサイズが大きくなるほど、前記低次数に分類される値のサイズを増加させる段階をさらに含む、請求項3に記載のベクトル符号化方法。
  6. 前記符号化次数を4、前記低次数iを2、前記高次数jを2に設定した場合、前記候補ベクトルは下記の式のように近似化され、
    Figure 0007006966000073
    前記インデクシングキーは、前記
    Figure 0007006966000074
    に対応するC及び前記
    Figure 0007006966000075
    に対応するCを用いて次のように生成され、
    インデクシングキー:C
    前記RNQコードは、前記eに対応するh及び前記eに対応するh及び前記
    Figure 0007006966000076
    に対応するC及び前記
    Figure 0007006966000077
    に対応するCを用いて次のように生成される、請求項3に記載のベクトル符号化方法。
    RNQコード:C
    Figure 0007006966000078
    :第1次コードブック(V)で残差ベクトルの方向ベクトルとの最近接コードワード
    Figure 0007006966000079
    :第2次コードブック(V)で残差ベクトルの方向ベクトルとの最近接コードワード
    Figure 0007006966000080
    :第3次コードブック(V)で残差ベクトルの方向ベクトルとの最近接コードワード
    Figure 0007006966000081
    :第4次コードブック(V)で残差ベクトルの方向ベクトルとの最近接コードワード
    :第3残差ベクトルのエネルギー(スカラー値)
    :第4残差ベクトルのエネルギー(スカラー値)

    Figure 0007006966000082
    残差方向ベクトルの投影

    Figure 0007006966000083
    残差方向ベクトルの投影
  7. 請求項1~6のいずれかに記載の方法を実行させるためにコンピュータ読取り可能媒体に格納されたベクトル符号化応用プログラム。
  8. 候補データセットからクエリの最近傍を検索する方法であって、
    前記クエリを正規化及び量子化して取得した一つ以上のコードワードを含む逆リストのインデクシングキーと前記クエリ間の距離を計算する段階と、
    前記計算された距離を昇順に整列し、整列された距離が上位の特定百分位数以内である逆リストを候補連結リストに設定する段階と、
    前記候補連結リストに含まれた候補ベクトルと前記クエリ間の距離を計算して前記最近傍を取得する段階と、
    を含む最近傍探索方法。
  9. 前記距離を計算する段階は、
    1次コードブックに含まれる第1コードワード
    Figure 0007006966000084
    及び2次コードブックに含まれる第2コードワード
    Figure 0007006966000085
    の合成ベクトル
    Figure 0007006966000086
    と前記クエリq間の距離dを計算する段階を含む、請求項8に記載の最近傍探索方法。
  10. 前記距離を計算する段階は、前記距離dの計算が次の式によってなされることを特徴とする、請求項9に記載の最近傍探索方法。
    Figure 0007006966000087
    q:クエリベクトル
    :クエリベクトルの残差
    I:逆リストのインデクシングキー
  11. 前記距離を計算する段階は、
    前記クエリと第1コードワード間の距離を計算して昇順に整列する段階と、
    前記クエリと第2コードワード間の距離を計算して昇順に整列する段階と、
    前記整列された距離が上位の特定百分位数以内である第1コードワード及び第2コードワードを用いて前記合成ベクトルIとクエリq間の距離を計算する段階と、
    を含む、請求項10に記載の最近傍探索方法。
  12. 前記最近傍を取得する段階は、前記候補ベクトルvと前記クエリq間の距離を下記の式を用いて計算する段階を含む、請求項8に記載の最近傍探索方法。
    Figure 0007006966000088
    q:クエリベクトル
    :クエリベクトルの残差
    v:候補ベクトル
    :候補ベクトルの残差
    I:逆リストのインデクシングキー
    Figure 0007006966000089
    :第1次コードブック(V )で残差ベクトルの方向ベクトルとの最近接コードワード
    Figure 0007006966000090
    :第2次コードブック(V )で残差ベクトルの方向ベクトルとの最近接コードワード
    Figure 0007006966000091
    :第3次コードブック(V )で残差ベクトルの方向ベクトルとの最近接コードワード
    Figure 0007006966000092
    :第4次コードブック(V )で残差ベクトルの方向ベクトルとの最近接コードワード
    :第3残差ベクトルのエネルギー(スカラー値)
    :第4残差ベクトルのエネルギー(スカラー値)

    Figure 0007006966000093
    残差方向ベクトルの投影

    Figure 0007006966000094
    残差方向ベクトルの投影
  13. 請求項8~12のいずれかに記載の方法を実行させるためにコンピュータ読取り可能媒体に格納された最近傍探索応用プログラム。
JP2019554379A 2017-03-30 2017-06-20 ベクトル量子化の混合に基づく符号化方法及びこれを用いた最近傍探索(nns)方法 Active JP7006966B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR1020170041017A KR101958939B1 (ko) 2017-03-30 2017-03-30 벡터 양자화의 혼합에 기초한 부호화 방법 및 이를 이용한 최근접 이웃 검색(nns) 방법
KR10-2017-0041017 2017-03-30
PCT/KR2017/006450 WO2018182093A1 (ko) 2017-03-30 2017-06-20 벡터 양자화의 혼합에 기초한 부호화 방법 및 이를 이용한 최근접 이웃 검색(nns) 방법

Publications (2)

Publication Number Publication Date
JP2020515986A JP2020515986A (ja) 2020-05-28
JP7006966B2 true JP7006966B2 (ja) 2022-01-24

Family

ID=63678276

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019554379A Active JP7006966B2 (ja) 2017-03-30 2017-06-20 ベクトル量子化の混合に基づく符号化方法及びこれを用いた最近傍探索(nns)方法

Country Status (4)

Country Link
US (1) US11436228B2 (ja)
JP (1) JP7006966B2 (ja)
KR (1) KR101958939B1 (ja)
WO (1) WO2018182093A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11308152B2 (en) * 2018-06-07 2022-04-19 Canon Kabushiki Kaisha Quantization method for feature vector, search method, apparatus and storage medium
CN110727769B (zh) * 2018-06-29 2024-04-19 阿里巴巴(中国)有限公司 语料库生成方法及装置、人机交互处理方法及装置
CN109325240A (zh) * 2018-12-03 2019-02-12 中国移动通信集团福建有限公司 指标查询的方法、装置、设备和介质
CN112800268B (zh) * 2021-03-02 2022-08-26 安庆师范大学 图像视觉特征的量化与近似最近邻搜索方法
CN117037913B (zh) * 2023-10-07 2024-01-26 之江实验室 一种蛋白质多序列比对方法、装置、存储介质及电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002163272A (ja) 2000-11-15 2002-06-07 Samsung Electronics Co Ltd 特徴ベクトル空間のインデクシング方法及び検索方法
JP2009020769A (ja) 2007-07-13 2009-01-29 Toshiba Corp パターン探索装置及びその方法
JP5637939B2 (ja) 2011-06-28 2014-12-10 Kddi株式会社 少ないコードブックの情報量によって高次元の特徴ベクトルを検索する検索装置及びプログラム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100429792B1 (ko) * 2000-11-15 2004-05-03 삼성전자주식회사 특징 벡터 공간의 인덱싱 방법 및 검색 방법
KR101116663B1 (ko) * 2010-04-15 2012-03-07 성균관대학교산학협력단 고차원 데이터의 유사도 검색을 위한 데이터 분할방법
US9263053B2 (en) * 2012-04-04 2016-02-16 Google Technology Holdings LLC Method and apparatus for generating a candidate code-vector to code an informational signal
CN103269429B (zh) * 2012-11-01 2016-05-25 重庆邮电大学 一种超光谱信号快速矢量量化编码方法
CN107193938A (zh) * 2017-05-19 2017-09-22 厦门大学 基于混合向量量化的最近邻搜索方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002163272A (ja) 2000-11-15 2002-06-07 Samsung Electronics Co Ltd 特徴ベクトル空間のインデクシング方法及び検索方法
JP2009020769A (ja) 2007-07-13 2009-01-29 Toshiba Corp パターン探索装置及びその方法
JP5637939B2 (ja) 2011-06-28 2014-12-10 Kddi株式会社 少ないコードブックの情報量によって高次元の特徴ベクトルを検索する検索装置及びプログラム

Also Published As

Publication number Publication date
JP2020515986A (ja) 2020-05-28
WO2018182093A1 (ko) 2018-10-04
US20200226137A1 (en) 2020-07-16
KR20180110959A (ko) 2018-10-11
US11436228B2 (en) 2022-09-06
KR101958939B1 (ko) 2019-03-15

Similar Documents

Publication Publication Date Title
JP7006966B2 (ja) ベクトル量子化の混合に基づく符号化方法及びこれを用いた最近傍探索(nns)方法
Baranchuk et al. Revisiting the inverted indices for billion-scale approximate nearest neighbors
Wu et al. Multiscale quantization for fast similarity search
CN105912611B (zh) 一种基于cnn的快速图像检索方法
Ai et al. Optimized residual vector quantization for efficient approximate nearest neighbor search
Wei et al. Projected residual vector quantization for ANN search
Pan et al. Product quantization with dual codebooks for approximate nearest neighbor search
US11874866B2 (en) Multiscale quantization for fast similarity search
EP3115908A1 (en) Method and apparatus for multimedia content indexing and retrieval based on product quantization
Ozan et al. K-subspaces quantization for approximate nearest neighbor search
Chen et al. Robustiq: A robust ann search method for billion-scale similarity search on gpus
Gao et al. Squish: Near-optimal compression for archival of relational datasets
Jain et al. Approximate search with quantized sparse representations
JP2011525728A (ja) 数値データの処理方法
Wang et al. A new cell-level search based non-exhaustive approximate nearest neighbor (ann) search algorithm in the framework of product quantization
Hong et al. Asymmetric mapping quantization for nearest neighbor search
Yuan et al. Product tree quantization for approximate nearest neighbor search
Sun et al. A novel fractal coding method based on MJ sets
Fan et al. Codebook-softened product quantization for high accuracy approximate nearest neighbor search
Liu et al. Generalized residual vector quantization and aggregating tree for large scale search
Zhao et al. Scalable nearest neighbor search based on KNN graph
Chen et al. Hierarchical quantization for billion-scale similarity retrieval on gpus
JP2013140494A (ja) 高次元の特徴ベクトルを検索する検索装置及びプログラム
André et al. Derived codebooks for high-accuracy nearest neighbor search
Song et al. SqueezeBlock: A Transparent Weight Compression Scheme for Deep Neural Networks

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191001

A80 Written request to apply exceptions to lack of novelty of invention

Free format text: JAPANESE INTERMEDIATE CODE: A80

Effective date: 20200106

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200311

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210420

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20210719

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210818

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211221

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211224

R150 Certificate of patent or registration of utility model

Ref document number: 7006966

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150