JP2009116592A - ベクトル検索装置、ベクトル検索方法、プログラムおよびプログラムを記録した記録媒体 - Google Patents

ベクトル検索装置、ベクトル検索方法、プログラムおよびプログラムを記録した記録媒体 Download PDF

Info

Publication number
JP2009116592A
JP2009116592A JP2007288652A JP2007288652A JP2009116592A JP 2009116592 A JP2009116592 A JP 2009116592A JP 2007288652 A JP2007288652 A JP 2007288652A JP 2007288652 A JP2007288652 A JP 2007288652A JP 2009116592 A JP2009116592 A JP 2009116592A
Authority
JP
Japan
Prior art keywords
character string
search
vector
search target
approximate value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007288652A
Other languages
English (en)
Inventor
Katsuto Bessho
克人 別所
Toshiro Uchiyama
俊郎 内山
Tadashi Uchiyama
匡 内山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2007288652A priority Critical patent/JP2009116592A/ja
Publication of JP2009116592A publication Critical patent/JP2009116592A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】検索キーベクトルにマッチする検索対象ベクトルを特定する場合、検索対象ベクトルの数が多くても、検索処理時間が短いベクトル検索装置を提供することを目的とする。
【解決手段】各座標毎に、特定の桁数の文字列が対応している近似値の集合である近似値集合が付随している近似値集合情報と、検索対象ベクトルを入力とし、上記検索対象ベクトルの各座標の値に対し、上記座標に対応する上記近似値集合における最も差の小さい近似値を求め、上記近似値の対応する文字列を、全座標にわたって連結することにより、上記検索対象ベクトルに対応する文字列である検索対象文字列を生成し、上記検索対象文字列をキーとして、対応する上記検索対象ベクトルとともに検索インデックスに格納する検索対象文字列生成手段とを有することを特徴とするベクトル検索装置である。
【選択図】図1

Description

本発明は、検索対象と検索キーがベクトルである場合に、高速に検索対象ベクトルを検索するベクトル検索装置、ベクトル検索方法、プログラムおよびプログラムを記録した記録媒体に関する。
ベクトル検索の手法として、ベクトルの長さを1に正規化した上で、ベクトル間の関連度をベクトルの内積として算出する方法がある(たとえば、非特許文献1参照)。
この他に、ベクトル間の関連度をユークリッド距離として算出することが一般的に行われている。
このようにして算出した関連度の大きい順に、検索結果を提示する。
熊本睦、島田茂夫、加藤恒昭著「概念ベースの情報検索への適用―概念ベースを用いた検索の特性評価―」情報処理学会研究報告、Vol.SIG-ICS 115、pp.9-16、1999.
検索キーベクトルにマッチする検索対象ベクトルを特定するにあたり、ベクトルの各座標は実数なので、上記従来手法のように、内積やユークリッド距離のような数値演算により、ベクトル間の関連度を算出している。このやり方では、全検索対象ベクトルとの関連度を算出する必要がある。
検索対象ベクトルの数が極めて多い場合、全検索対象ベクトルとの関連度算出は時間がかかり、検索処理時間がかかるという問題があった。
上記課題を解決するために、本発明におけるベクトル検索装置は、
各座標毎に、特定の桁数の文字列が対応している近似値の集合である近似値集合が付随している近似値集合情報と、
検索対象ベクトルを入力とし、上記検索対象ベクトルの各座標の値に対し、上記座標に対応する上記近似値集合における最も差の小さい近似値を求め、上記近似値の対応する文字列を、全座標にわたって連結することにより、上記検索対象ベクトルに対応する文字列である検索対象文字列を生成し、上記検索対象文字列をキーとして、対応する上記検索対象ベクトルとともに検索インデックスに格納する検索対象文字列生成手段とを有する。
また、検索キーベクトルを入力とし、上記検索キーベクトルの各座標の値に対し、上記座標に対応する上記近似値集合における最も差の小さい近似値を求め、上記近似値の対応する文字列を、全座標にわたって連結することにより、上記検索キーベクトルに対応する文字列である検索キー文字列を生成する検索キー文字列生成手段と、
上記検索キー文字列と、上記検索インデックス中の検索対象文字列とを文字列照合し、一致する検索対象文字列に対応付けられている検索対象ベクトルの集合を取得する文字列照合手段とをさらに併せ持つ。
また、上記検索キーベクトルと、上記文字列照合手段で取得した検索対象ベクトルの集合の中の各検索対象ベクトルとの関連度を計算する関連度算出手段をさらに併せ持つ。
検索対象ベクトルを検索対象文字列に変換し検索インデックスに格納し、検索キーベクトルを検索キー文字列に変換し、検索キー文字列と検索対象文字列とを文字列照合するので、検索キー文字列と一致する検索対象文字列に対応付けられている検索対象ベクトルの集合を即座に取得することができる。検索キーベクトルと近い検索対象ベクトルの集合を正確に取得はできず、近似的に近い検索対象ベクトルの集合を取得するが、全ての検索対象ベクトルとの関連度を計算する必要がないため、検索処理にかかる時間が問題とならなくなる。
また、取得した検索対象ベクトルに対して関連度を算出するので、この関連度を利用して、ある閾値以上の関連度を持つ検索対象ベクトルを表示したり、関連度の大きい順に検索対象ベクトルをランキング表示したりできる。取得した検索対象ベクトルは少数なので、大幅に短い時間で、このような検索結果を表示することが可能となる。
発明を実施するための最良の形態は、以下の実施例である。
以下、図面とともに本発明の実施例を説明する。
図1は、本発明の実施例におけるベクトル検索装置の構成例を示す。
ベクトル検索装置は、各座標毎に、特定の桁数の文字列が対応している近似値の集合である近似値集合が付随している近似値集合情報を持つ。
ここで、各座標毎の近似値集合とは、たとえば、0から0.01の倍数だけ間隔の空いた数列
{…,−0.03,−0.02,−0.01,0.00,0.01,0.02,0.03,…} …(1)
や、0から0.05の倍数だけ間隔の空いた数列
{…,−0.15,−0.10,−0.05,0.00,0.05,0.10,0.15,…} …(2)
が挙げられる。
各近似値には、座標毎に定まる桁数の文字列が対応し、異なる近似値には異なる文字列が対応するようにする。たとえば、数列(1)、(2)の近似値には、プラスマイナスの符号と小数点以下第一位と第二位を並べた3桁の文字列とする。これにより、数列(1)、(2)中の各近似値に対応する文字列の列は、それぞれ(1)’、(2)’のようになる。
{…,−03,−02,−01,+00,+01,+02,+03,…} …(1)’
{…,−15,−10,−05,+00,+05,+10,+15,…} …(2)’
もちろん、全ての座標について、同じ近似値集合をとってもよい。
この近似値集合情報は、それに関して定義した情報を、ファイルやメモリ、プログラムのコード中等に保持しているものとする。
検索対象文字列生成手段11は、検索対象ベクトルを入力とし、上記検索対象ベクトルの各座標の値に対し、上記座標に対応する上記近似値集合における最も差の小さい近似値を求め、上記近似値の対応する文字列を、全座標にわたって連結することにより、上記検索対象ベクトルに対応する文字列である検索対象文字列を生成し、上記検索対象文字列をキーとして、対応する上記検索対象ベクトルとともに検索インデックス15に格納する。
以下では、いずれの座標も、近似値とその対応文字列として(1)、(1)’をとっているものとして説明をする。
検索対象となるベクトルは、一定次元数の、各座標値が一般に実数のベクトルである。検索対象ベクトルは、一般に複数個ある。図2のv〜vは、3次元の検索対象ベクトルの例である。
各検索対象ベクトルに対し、以下の処理を行う。
上記検索対象ベクトルの各座標の値に対し、上記座標に対応する上記近似値集合における最も差の小さい近似値を求める。たとえば、vについては、座標1は0.5234…なので、最も差の小さい近似値は0.52となる。このようにして、vから導出される各座標値が近似値のベクトルは、
(0.52,−0.40,0.81) …(3)
となる。
次に、導出した各近似値の対応する文字列を、全座標にわたって連結する。(3)からは、
+52−40+81 …(4)
という文字列が得られる。このようにして得られた文字列を上記検索対象ベクトルに対応する検索対象文字列とする。
各座標毎に、対応する文字列の桁数は定まっているので、各座標が、連結された文字列の何桁目から何桁目までに相当するかは一意に定まる。したがって、連結された文字列に対して、元の近似値ベクトルも一意に定まる。したがって、導出した連結文字列が同一である検索対象ベクトルや検索キーベクトルは、同一の近似値ベクトルを導出し、互いに近い関係にある。
検索対象文字列をキーとして、対応する検索対象ベクトルとともに検索インデックス15に格納する。検索インデックスのキーは、たとえば、ハッシュとして実装する。この例では、(4)を検索キーとして、それに対応する検索対象ベクトルとしてvを対応付ける。
複数の検索対象ベクトルから同一の検索対象文字列が生成された場合は、上記検索対象文字列に、生成源となった検索対象ベクトルの全てを対応付ける。図3は、図2の検索対象ベクトルをもとに生成された検索インデックスである。v、v、vから(4)が生成されたので、(4)には、v、v、vが対応付けられている。
検索キー文字列生成手段12は、検索キーベクトルを入力とし、上記検索キーベクトルの各座標の値に対し、上記座標に対応する上記近似値集合における最も差の小さい近似値を求め、上記近似値の対応する文字列を、全座標にわたって連結することにより、上記検索キーベクトルに対応する文字列である検索キー文字列を生成する。
検索キーとなるベクトルは、検索対象ベクトルと同一次元数の、各座標値が一般に実数のベクトルである。図4のqは、検索キーベクトルの例である。
検索キー文字列生成手段12の処理は、検索対象文字列生成手段11における文字列生成と同じである。図4のqから導出される各座標値が近似値のベクトルは(3)となり、(3)から検索キー文字列として(4)が得られる。
検索キー文字列生成手段12をなくし、検索キー文字列生成手段12の処理を、検索対象文字列生成手段11における文字列生成処理で行うという構成にすることも可能である。
文字列照合手段13は、上記検索キー文字列と、上記検索インデックス15中の検索対象文字列とを文字列照合し、一致する検索対象文字列に対応付けられている検索対象ベクトルの集合を取得する。
検索キー文字列としての(4)は、検索インデックス中の検索対象文字列の(4)と一致するので、対応する検索対象ベクトルv、v、vが得られる。
関連度算出手段14は、上記検索キーベクトルと、上記文字列照合手段13で取得した検索対象ベクトルの集合の中の各検索対象ベクトルとの関連度を計算する。この関連度を利用して、ある閾値以上の関連度を持つ検索対象ベクトルを表示したり、関連度の大きい順に検索対象ベクトルをランキング表示したりすることも可能である。
図4のqと、取得した検索対象ベクトルv、v、vそれぞれとの関連度を、たとえば、両ベクトル間のユークリッド距離として算出する。図5は、距離の小さい順に、検索対象ベクトルを対応する距離値とともに表示したものである。
つまり、上記実施例は、各座標毎に、特定の桁数の文字列が対応している近似値の集合である近似値集合が付随している近似値集合情報と、検索対象ベクトルを入力とし、上記検索対象ベクトルの各座標の値に対し、上記座標に対応する上記近似値集合における最も差の小さい近似値を求め、上記近似値の対応する文字列を、全座標にわたって連結することにより、上記検索対象ベクトルに対応する文字列である検索対象文字列を生成し、上記検索対象文字列をキーとして、対応する上記検索対象ベクトルとともに検索インデックスに格納する検索対象文字列生成手段とを有することを特徴とするベクトル検索装置の例である。
この場合、検索キーベクトルを入力とし、上記検索キーベクトルの各座標の値に対し、上記座標に対応する上記近似値集合における最も差の小さい近似値を求め、上記近似値の対応する文字列を、全座標にわたって連結することにより、上記検索キーベクトルに対応する文字列である検索キー文字列を生成する検索キー文字列生成手段と、上記検索キー文字列と、上記検索インデックス中の検索対象文字列とを文字列照合し、一致する検索対象文字列に対応付けられている検索対象ベクトルの集合を取得する文字列照合手段とを有する。
また、上記検索対象文字列生成手段が、検索キーベクトルを入力とし、上記検索キーベクトルの各座標の値に対し、上記座標に対応する上記近似値集合における最も差の小さい近似値を求め、上記近似値の対応する文字列を、全座標にわたって連結することにより、上記検索キーベクトルに対応する文字列である検索キー文字列を生成し、上記検索キー文字列と、上記検索インデックス中の検索対象文字列とを文字列照合し、一致する検索対象文字列に対応付けられている検索対象ベクトルの集合を取得する文字列照合手段を有する。
さらに、上記検索キーベクトルと、上記文字列照合手段で取得した検索対象ベクトルの集合の中の各検索対象ベクトルとの関連度を計算する関連度算出手段を有する。
また、上記実施例を方法の発明として把握することができる。つまり、上記実施例は、各座標毎に、特定の桁数の文字列が対応している近似値の集合である近似値集合が付随している近似値集合情報と、検索対象文字列生成手段が、検索対象ベクトルを入力とし、上記検索対象ベクトルの各座標の値に対し、上記座標に対応する上記近似値集合における最も差の小さい近似値を求め、上記近似値の対応する文字列を、全座標にわたって連結することにより、上記検索対象ベクトルに対応する文字列である検索対象文字列を生成し、上記検索対象文字列をキーとして、対応する上記検索対象ベクトルとともに検索インデックスに格納する検索対象文字列生成工程とを有することを特徴とするベクトル検索方法の例である。
この場合、検索キー文字列生成手段が、検索キーベクトルを入力とし、上記検索キーベクトルの各座標の値に対し、上記座標に対応する上記近似値集合における最も差の小さい近似値を求め、上記近似値の対応する文字列を、全座標にわたって連結することにより、上記検索キーベクトルに対応する文字列である検索キー文字列を生成し、記憶装置に記憶する検索キー文字列生成工程と、文字列照合手段が、上記検索キー文字列と、上記検索インデックス中の検索対象文字列とを文字列照合し、一致する検索対象文字列に対応付けられている検索対象ベクトルの集合を取得し、記憶装置に記憶する文字列照合工程とを有する。
また、上記検索対象文字列生成手段が、検索キーベクトルを入力とし、上記検索キーベクトルの各座標の値に対し、上記座標に対応する上記近似値集合における最も差の小さい近似値を求め、上記近似値の対応する文字列を、全座標にわたって連結することにより、上記検索キーベクトルに対応する文字列である検索キー文字列を生成し、記憶装置に記憶し、文字列照合手段が、上記検索キー文字列と、上記検索インデックス中の検索対象文字列とを文字列照合し、一致する検索対象文字列に対応付けられている検索対象ベクトルの集合を取得し、記憶装置に記憶する文字列照合工程を有する。
さらに、上記検索キーベクトルと、上記文字列照合手段で取得した検索対象ベクトルの集合の中の各検索対象ベクトルとの関連度を、関連度算出手段が計算し、記憶装置に記憶する関連度算出工程を有する。
また、上記ベクトル検索装置を構成する上記各手段としてコンピュータを機能させるプログラムを想定することができる。この場合、上記の実施の形態における処理をプログラムとして構築し、上記プログラムを通信回線または記憶媒体からインストールし、CPU等の手段で実施することが可能である。
しかも、上記プログラムをコンピュータ読取可能な記録媒体に記録するようにしてもよい。この場合、CD、DVD、ハードディスク、光ディスク、光磁気ディスク、半導体メモリ等の記録媒体に記録するようにしてもよい。
また、本発明は、上記実施の形態に限定されることなく、特許請求の範囲内において種々変更・応答が可能である。
本発明は、ベクトルを使用する文書検索技術や画像検索技術に適用可能である。
本発明の実施例におけるベクトル検索装置100の構成例を示す。 3次元の検索対象ベクトルの例を示す図である。 図2の検索対象ベクトルをもとに生成された検索インデックス15の例を示す図である。 検索キーベクトルの例を示す図である。 距離の小さい順に、検索対象ベクトルを対応する距離値とともに表示したものである。
符号の説明
100…ベクトル検索装置、
11…検索対象文字列生成手段、
12…検索キー文字列生成手段、
13…文字列照合手段、
14…関連度算出手段、
15…検索インデックス。

Claims (10)

  1. 各座標毎に、特定の桁数の文字列が対応している近似値の集合である近似値集合が付随している近似値集合情報と、
    検索対象ベクトルを入力とし、上記検索対象ベクトルの各座標の値に対し、上記座標に対応する上記近似値集合における最も差の小さい近似値を求め、上記近似値の対応する文字列を、全座標にわたって連結することにより、上記検索対象ベクトルに対応する文字列である検索対象文字列を生成し、上記検索対象文字列をキーとして、対応する上記検索対象ベクトルとともに検索インデックスに格納する検索対象文字列生成手段とを有することを特徴とするベクトル検索装置。
  2. 請求項1において、
    検索キーベクトルを入力とし、上記検索キーベクトルの各座標の値に対し、上記座標に対応する上記近似値集合における最も差の小さい近似値を求め、上記近似値の対応する文字列を、全座標にわたって連結することにより、上記検索キーベクトルに対応する文字列である検索キー文字列を生成する検索キー文字列生成手段と、
    上記検索キー文字列と、上記検索インデックス中の検索対象文字列とを文字列照合し、一致する検索対象文字列に対応付けられている検索対象ベクトルの集合を取得する文字列照合手段とを有することを特徴とするベクトル検索装置。
  3. 請求項1において、
    上記検索対象文字列生成手段が、検索キーベクトルを入力とし、上記検索キーベクトルの各座標の値に対し、上記座標に対応する上記近似値集合における最も差の小さい近似値を求め、上記近似値の対応する文字列を、全座標にわたって連結することにより、上記検索キーベクトルに対応する文字列である検索キー文字列を生成し、
    上記検索キー文字列と、上記検索インデックス中の検索対象文字列とを文字列照合し、一致する検索対象文字列に対応付けられている検索対象ベクトルの集合を取得する文字列照合手段を有することを特徴とするベクトル検索装置。
  4. 請求項2または請求項3において、
    上記検索キーベクトルと、上記文字列照合手段で取得した検索対象ベクトルの集合の中の各検索対象ベクトルとの関連度を計算する関連度算出手段を有することを特徴とするベクトル検索装置。
  5. 各座標毎に、特定の桁数の文字列が対応している近似値の集合である近似値集合が付随している近似値集合情報と、
    検索対象文字列生成手段が、検索対象ベクトルを入力とし、上記検索対象ベクトルの各座標の値に対し、上記座標に対応する上記近似値集合における最も差の小さい近似値を求め、上記近似値の対応する文字列を、全座標にわたって連結することにより、上記検索対象ベクトルに対応する文字列である検索対象文字列を生成し、上記検索対象文字列をキーとして、対応する上記検索対象ベクトルとともに検索インデックスに格納する検索対象文字列生成工程とを有することを特徴とするベクトル検索方法。
  6. 請求項5において、
    検索キー文字列生成手段が、検索キーベクトルを入力とし、上記検索キーベクトルの各座標の値に対し、上記座標に対応する上記近似値集合における最も差の小さい近似値を求め、上記近似値の対応する文字列を、全座標にわたって連結することにより、上記検索キーベクトルに対応する文字列である検索キー文字列を生成し、記憶装置に記憶する検索キー文字列生成工程と、
    文字列照合手段が、上記検索キー文字列と、上記検索インデックス中の検索対象文字列とを文字列照合し、一致する検索対象文字列に対応付けられている検索対象ベクトルの集合を取得し、記憶装置に記憶する文字列照合工程とを有することを特徴とするベクトル検索方法。
  7. 請求項5において、
    上記検索対象文字列生成手段が、検索キーベクトルを入力とし、上記検索キーベクトルの各座標の値に対し、上記座標に対応する上記近似値集合における最も差の小さい近似値を求め、上記近似値の対応する文字列を、全座標にわたって連結することにより、上記検索キーベクトルに対応する文字列である検索キー文字列を生成し、記憶装置に記憶し、
    文字列照合手段が、上記検索キー文字列と、上記検索インデックス中の検索対象文字列とを文字列照合し、一致する検索対象文字列に対応付けられている検索対象ベクトルの集合を取得し、記憶装置に記憶する文字列照合工程を有することを特徴とするベクトル検索方法。
  8. 請求項6または請求項7において、
    上記検索キーベクトルと、上記文字列照合手段で取得した検索対象ベクトルの集合の中の各検索対象ベクトルとの関連度を、関連度算出手段が計算し、記憶装置に記憶する関連度算出工程を有することを特徴とするベクトル検索方法。
  9. 請求項1〜請求項4のいずれか1項に記載のベクトル検索装置を構成する各手段としてコンピュータを機能させるプログラム。
  10. 請求項9記載のプログラムを記録したコンピュータ読取可能な記録媒体。
JP2007288652A 2007-11-06 2007-11-06 ベクトル検索装置、ベクトル検索方法、プログラムおよびプログラムを記録した記録媒体 Pending JP2009116592A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007288652A JP2009116592A (ja) 2007-11-06 2007-11-06 ベクトル検索装置、ベクトル検索方法、プログラムおよびプログラムを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007288652A JP2009116592A (ja) 2007-11-06 2007-11-06 ベクトル検索装置、ベクトル検索方法、プログラムおよびプログラムを記録した記録媒体

Publications (1)

Publication Number Publication Date
JP2009116592A true JP2009116592A (ja) 2009-05-28

Family

ID=40783680

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007288652A Pending JP2009116592A (ja) 2007-11-06 2007-11-06 ベクトル検索装置、ベクトル検索方法、プログラムおよびプログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JP2009116592A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013051619A1 (ja) * 2011-10-03 2013-04-11 日本電気株式会社 類似性検出装置及び指向性近傍検出方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001134573A (ja) * 1999-11-05 2001-05-18 Nippon Telegr & Teleph Corp <Ntt> 類似データ検索方法,類似データ検索装置,および類似データ検索用プログラム記録媒体
WO2001039041A1 (en) * 1999-11-19 2001-05-31 Institute Of Medicinal Molecular Design. Inc. Id symbol unique to structural formula of compound
JP2001344553A (ja) * 2000-05-31 2001-12-14 Samsung Electronics Co Ltd 特徴ベクトルのデータ空間のインデクシング方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001134573A (ja) * 1999-11-05 2001-05-18 Nippon Telegr & Teleph Corp <Ntt> 類似データ検索方法,類似データ検索装置,および類似データ検索用プログラム記録媒体
WO2001039041A1 (en) * 1999-11-19 2001-05-31 Institute Of Medicinal Molecular Design. Inc. Id symbol unique to structural formula of compound
JP2001344553A (ja) * 2000-05-31 2001-12-14 Samsung Electronics Co Ltd 特徴ベクトルのデータ空間のインデクシング方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013051619A1 (ja) * 2011-10-03 2013-04-11 日本電気株式会社 類似性検出装置及び指向性近傍検出方法
JPWO2013051619A1 (ja) * 2011-10-03 2015-03-30 日本電気株式会社 類似性検出装置及び指向性近傍検出方法
US9530081B2 (en) 2011-10-03 2016-12-27 Nec Corporation Similarity detecting apparatus and directional nearest neighbor detecting method

Similar Documents

Publication Publication Date Title
RU2013119801A (ru) Способы и системы для реализации приближенного сравнения строк в базе данных
JP2013521574A (ja) セマンティックオブジェクトの特徴付けおよび検索
JP2007172384A5 (ja)
JP2014191670A5 (ja)
US20160239538A1 (en) Method for processing a database query
US20130290350A1 (en) Similarity Search Initialization
CN113448537B (zh) 用于在关联存储器中进行最小值-最大值计算的方法
CN107273529B (zh) 基于哈希函数的高效层级索引构建及检索方法
CN105630763A (zh) 用于提及检测中的消歧的方法和系统
CN111078952A (zh) 一种基于层次结构的跨模态可变长度哈希检索方法
CN103984754A (zh) 一种搜索系统和搜索方法
JP5980520B2 (ja) 効率的にクエリを処理する方法及び装置
JP2019144780A (ja) 生成装置、生成方法、及び生成プログラム
JP2009116592A (ja) ベクトル検索装置、ベクトル検索方法、プログラムおよびプログラムを記録した記録媒体
CN110275990B (zh) Kv存储的键与值的生成方法及装置
JP6495206B2 (ja) 文書概念ベース生成装置、文書概念検索装置、方法、及びプログラム
US20190294637A1 (en) Similar data search device, similar data search method, and recording medium
JPWO2019171537A1 (ja) 意味推定システム、方法およびプログラム
JP7121706B2 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
JP5954742B2 (ja) 文書を検索する装置及び方法
JP5391212B2 (ja) セキュア検索システム、秘密検索装置、セキュア検索方法、セキュア検索プログラム
JP2010015394A (ja) リンク先提示装置およびコンピュータプログラム
US20230153338A1 (en) Sparse embedding index for search
JP7530339B2 (ja) 変換装置、変換方法、変換プログラム及び記憶媒体
JP7239433B2 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100108

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120210

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120217

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120622