JP2000057172A - 問合せに対する応答を得る方法 - Google Patents
問合せに対する応答を得る方法Info
- Publication number
- JP2000057172A JP2000057172A JP11141079A JP14107999A JP2000057172A JP 2000057172 A JP2000057172 A JP 2000057172A JP 11141079 A JP11141079 A JP 11141079A JP 14107999 A JP14107999 A JP 14107999A JP 2000057172 A JP2000057172 A JP 2000057172A
- Authority
- JP
- Japan
- Prior art keywords
- query
- region
- semantic
- signature
- area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9014—Indexing; Data structures therefor; Storage structures hash tables
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
- Y10S707/99934—Query formulation, input preparation, or translation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
- Y10S707/99935—Query augmenting and refining, e.g. inexact access
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
- Y10S707/99936—Pattern matching access
Abstract
施する方法を提供する。 【解決手段】 いわゆるシグネチャ・ファイルに基づい
てウェブ問合せをキャッシュするための新しいメカニズ
ムは2つの実施選択肢を有する。第1のアルゴリズムは
問合せと対応するキャッシュ項との意味論的包含関係を
うまく処理する。第2のアルゴリズムはこの処理を意味
論的論理積のより複雑なケースへ拡張する。
Description
ステム(たとえば、インターネット/WWW、イントラ
ネット)、より詳細にはシグネチャ・ファイルをベース
とする、問合せの意味論的キャッシング(semantic cach
ing)に関するものである。
New Signature Approach for Retrieval of Documents
from Free-Text Databases”, Information Processing
& Management, Vol. 28, No.2, 1992, pp. 153-163
は、情報検索のシグネチャー手法を述べている。その手
法では、シグネチャ・ファイルのサイズはアルファベッ
トの固有記号の数によって決まる。
は、データーをキャッシュし、そしてサーバーとの将来
の対話を最小限度にするため、主としてローカルクライ
アント・メモリが使用されている。このデーター・キャ
ッシングは、応答を引き渡す際にネットワーク通信量と
低速サーバーが長い遅延を引き起こすことがあるウェブ
に対し特別な重要性を有する。標準ページをベースとす
るキャッシングはウェブに対して技術的に実施不可能で
あり、また組(tuple)をベースとするキャッシングは
一定の制限を有するので、考えられる将来の再使用のた
めユーザー問合せと応答をキャッシュすることに大きな
努力が払われてきた。そのような技法は、たとえばGodf
rey, P., およびGryz, J., の論文“Semantic Query
Caching for Heterogeneous Databases”, in Proceedi
ngs of the 4th KRDB Workshop, Athens, Greece, 30-A
ugust-1997, pp. 6-1 to 6-6 に記載されている。
ドを加えたり、または除去することによって、ユーザー
がかなり頻繁に問合せを改良する場合に特別な利点を有
する。このケースでは、応答の組の多くはそれまでにキ
ャッシュすることができるので、直ちにユーザーへ引き
渡すことができる。
異種分配型(heterogeneous distributed)データ・リポ
ジトリに接触し、いわゆるラッパー(wrappers) を呼び
出してユーザー問合せを目標の問合せ言語へ変換し、サ
ーバーからのデータ・フローを管理する。データーは通
例HTMLフォーマットでネットワークを通じて転送さ
れるので、最終応答がユーザーに報告される(そしてキ
ャッシュに記憶される)前に、ラッパーも検索したHM
TLファイルから応答の組を抽出する。
積(conjunction)である。問合せ内の各項はおそらく演
算子 NOTで否定されたキーワードであり、1つまたはそ
れ以上の属性(題名、著者、等)に付けられる。ほとん
どのウェブ・サーバーでは、演算子 NOTは AND N
OTと同じであり、問合せは少なくとも1個の非否定項
を含むことが強制される。
ッシュを意味論的領域(semantic region)の集まりとし
て管理することができる。すなわち、意味論的領域の単
位でアクセス情報が管理され、キャッシュ置換が実行さ
れる。そのような技法は、Dar, S., Franklin, M. J.,
Jonsson, B.T., およびTan, M.の論文 “Semantic Data
Caching and Replacement”, in Proceedings of the
22th VLDB Conference, Mumbai (Bombay), India, 199
6, pp. 330-341 に記載されている。意味論的領域は、
たとえばユーザー問合せによって扱われる意味的に関係
があるドキュメントをグループに分ける。
味論的領域は、そのコンテンツを記述する制約論理式、
コンテンツ内の組(tuple)のカウンタ、キャッシュ内の
実際の組の集合のためのポインタ、および置換戦略によ
って領域をランク付けするため使用される追加情報を有
することができる。問合せと同様、すべての領域論理式
は項の論理積である。
せは2つの別個の部分、(1)ローカルキャッシュ内で
入手できる応答の部分と(2)サーバーからの応答に欠
けているすべての組を検索する残りの問合せに分けられ
る。もし残りの問合せがヌルでなければ(すなわち、問
合せはキャッシュされない情報空間の部分を取り扱
う)、残りの問合せはサーバーへ送られ、そこで処理さ
れる。
多くの重要な原理について説明したが、どれもキャッシ
ュ項に対する問合せ評価のための効率的な方法を提供し
ていない。さらに、一部の技法においては、問合せ評価
はコンピュータの使用が難しいデータログ問合せ評価に
なっている。
とメモリを備え、前記メモリ内の複数の所定ロケーショ
ンがキャッシュを形成し、前記キャッシュが1つまたは
それ以上の意味論的領域から成る情報処理システムにお
いて実施する方法であって、(a)対応する問合せシグ
ネチャSQをもつ問合せQを受け取ること、(b)前記
問合せシグネチャSQに頼って、前記問合せQに対応す
る応答として前記1つまたはそれ以上の前記領域のコン
テンツを戻すこと、の諸ステップから成る方法を提供す
る。
備え、前記プロセッサはメモリに結合され、そして前記
メモリと協力して前記方法の諸ステップに対応する命令
を実行するように動作することができるプログラム可能
な情報処理システムであって、上記の方法を実施するた
め適切にプログラムされた場合の情報処理システムを提
供する。
新しいメカニズムを提供する。そのメカニズムは、いわ
ゆるシグネチャ・ファイルに基づいており、キャッシュ
項の数に比例する効率的な問合せ評価を考慮に入れてい
る。本発明の実施例に従って、キャッシュ内の各意味論
的領域はシグネチャに関連付けられている。ユーザー問
合せの場合、シグネチャは同様な仕方で作られ、キャッ
シュに保存されている領域シグネチャに対し確かめられ
る。提案したキャッシング・メカニズムは問合せに適格
とされたすべてのキャッシュ項を識別する手続きを含
む。すなわち、手続きはどのキャッシュ項を直ちに再使
用できるか、そしてサーバーから欠けているどの情報を
要求しなければならないかを検出する。
1に、このメカニズムは、1)問合せがキャッシュに含
まれているとき、または2)問合せが幾つかの領域を共
有するとき、2つの重要なケースを同じ洗練されたやり
方で処理する。その結果、提案したメカニズムは組複製
物(tuple duplications)のほとんどのケースを回避し、
適度な記憶装置要求を有する。第2に、このメカニズム
は部分応答の効率的な報告と、問合せの残りの効率的な
生成をサポートする。最後に、このメカニズムは領域合
体および置換方針のための簡単な解決法を提供する。
ットワーク技術を使用してイントラネットによって、ま
たはより適切にインターネットによって実施できること
は理解されるであろう。本発明はインターネットを通じ
てクロスプラットフォーム通信とドキュメント転送を行
う通常のWWWウェブ・ブラウザ・ソフトウェア(たと
えば、Netscape)を使用して実施することができる。図
1は、このやり方を示す。ネットワーク21の一部を構
成する各マシン22,24,26は、この分野で周知の
Windows で動作するPC、MacOSで動作するMac 、また
はUNIXで動作するマイクロコンピュータでもよいことは
理解されるであろう。しかし、異なるシステム構成(た
とえばヨーロッパ特許出願公開EP−A−772,85
7号、米国特許第5,692,073号)を使用して本
発明を実施できることは理解されるであろう。
て、マシン26に保存されたドキュメントまたは他の情
報(たとえば問合せに対する応答)を検索し、インター
ネットを通じてマシン26から幾つかの中間マシン24
を経由してマシン22へ送ることができる。周知のよう
に、ドキュメントは、固有の識別子として、たとえば検
索エンジンへの適当な問合せ入力を用いて得たWorld Wi
de Web URLを使用して検索することができる。
ードを含むフルテキスト断片を検索するため計画された
ものである。最も広く知られているスーパーインポーズ
・コーディングによって、各意味論的領域(semantic re
gion)は論理積形式で論理式と関連付けられる。領域論
理式内の各項は1と0の2進シーケンスである項シグネ
チャが割り当てられる。領域シグネチャは、領域論理式
から生成されたすべての項シグネチャをスーパーインポ
ーズ(ビット状OR演算)することによって生成され
る。
は問合せのサンプルとそれらのシグネチャを示す。
グ”に関するシグネチャの生成を示す。同様に論理積で
あるユーザー問合せの場合は、すべての項がシグネチャ
と関連付けられ、キャッシュ領域と同様なやり方でスー
パーインポーズされ、問合せシグネチャが生成される。
その後、問合せシグネチャはイグネチャ・ファイル内の
各領域シグネチャと突き合わされ、部分応答を得て、問
合せの残り(query remainder)が作られる。
法は意味論的領域と問合せ間の異なる意味論的関係を取
り扱う。第1のキャッシング技法は一方が他方を含んで
いる場合に、問合せと意味論的領域との意味論的包含関
係(semantic containment)をうまく処理する。第2のキ
ャッシング技法は、領域が問合せを含んでいない場合ま
たは問合せが領域を含んでいない場合に、処理を意味論
的AND演算(semantic intersection)のより頻度の高
い、複雑なケースへ拡張する。
ら始める。もし論理式が同等であれば、問合せQは領域
Rと同等である。もし1つまたはそれ以上の項を落とす
ことによって問合せ論理式から領域論理式を得ることが
できれば、領域Rは問合せQを含んでいる。このケース
の場合、問合せに対する応答は領域コンテンツの適当な
サブセットである。逆に、もし1つまたはそれ以上の項
を落とすことによって領域論理式から問合せ論理式を得
ることができれば、意味論的領域Rは問合せQに含まれ
る。さらに、領域包含は応答が領域コンテンツのサブセ
ットであることを意味する。上に述べた3つのケースの
いずれにおいても、領域Rは問合せQに適格とされる。
域シグネチャを表す。意味論的包含関係は、シグネチャ
のビット状比較によって以下のように検出される。領域
包含(SQ⊂SR): 1に設定された問合せシグネチャ
内の各ビットについて、領域シグネチャ内の対応するビ
ットも同様に1に設定される(図3の問合せ2)。同等 (SQ=SR): 領域シグネチャと問合せシグネチ
ャは1に設定された同じビットを有する(図3の問合せ
3)。問合せ包含 (SQ⊃SR): 1に設定された領域シグネ
チャ内の各ビットについて、問合せシグネチャ内の対応
するビットも同様に1に設定される(図3の問合せ
4)。
れないほとんどの領域(全部ではない)を除去する。図
3の最後の問合せは誤り選択(false drop)である。誤
り選択は、そのシグネチャは問合せに適格とされるが、
領域には適格とされない意味論的領域である。実際に
は、もし用語“スキー”と“リゾート”にそれぞれシグ
ネチャ“0110 0000 1000”と“0000
0110 0001”を割り当てれば、問合せ“スキ
ー∧リゾート”のシグネチャは“0110 0110
1001”であり、従って、領域“問合せ∧キャッシン
グ”のシグネチャと同等である。
ことによって除去されるが、もし誤り選択が多ければ、
性能は低下する。誤り選択の確率を最小限にするため
に、シグネチャ内の0と1の予想数を同じにしなければ
ならない。そうすれば、領域または問合せ論理式内の同
数の別個のキーワードの場合、シグネチャの長さが増加
すると、シグネチャ内の1の密度が減少し、それに応じ
て、誤り選択をする機会が減少するであろう。しかし、
それにより、記憶装置オーバーヘッドは増加するであろ
う。もしシグネチャの長さがFビットで、問合せ内の項
の最大限の数がtであれば、項シグネチャ内の1に設定
されたビットの最適の数kopt (一様な確率分布に従っ
て)は、 kopt=(F・ln2)/t (1) である。
するため、本発明の実施例によるキャッシュ・アーキテ
クチャは領域コンテンツとは別個に領域シグネチャを保
有する(図4参照)。シグネチャ部内の各エントリ(領
域)は、シグネチャのほかに、領域論理式、組(tuple)の
カウンタ、対応する領域コンテンツへのリンク、および
置換関数の値を含んでいる。適格とされた領域はシグネ
チャ部内で検出される。意味論的領域が完全または部分
応答に適格とされたら、領域コンテンツに保存された問
合せとマッチする(ぴったり合う)組がユーザーに報告
される。
のほかに、それらの否定を含んでいる。否定をもつ問合
せを円滑に処理するために、キーワードのシグネチャと
その否定のシグネチャを関連付けることができる。否定
項に基本的な項シグネチャのビット状否定であるシグネ
チャを割り当てることができるが、項シグネチャ内の1
に設定されたビットの数kはシグネチャの長さFよりかな
り小さいので、これにより、否定項シグネチャの中に1
に設定されたF−kビットが生じるであろう。従って、こ
の解決法は、論理式が否定項を含むどの領域においても
誤り選択の確率を著しく増加させるであろう。この問題
が起きるのを避けるため、キーワードとその否定(およ
び割り当てられたそれらのシグネチャ)はどのシグネチ
ャにおいても1に設定されたkビットをもつ2つの独立
項として扱われる。
ケース、すなわち(1) 同等、(2) 問合せ包含、および
(3) 領域包含を処理する。もし問合せがキャッシュ内の
領域と同等であれば、問合せ応答は領域コンテンツと一
致する。もし領域が問合せを含んでいれば、フィルタと
して使用した問合せ論理式を用いて、領域コンテンツか
ら完全応答を生成することができる。さらに、もし2つ
またはそれ以上の領域が問合せを含んでいれば、それら
の領域はどれも応答を生成することができる。フィルタ
リング・オーバーヘッドを減らすために、アルゴリズム
は領域のコンテンツが最小限の数の組をもつ領域を選択
し、フィルタする。領域包含のケースでは、アルゴリズ
ムは領域コンテンツから部分応答を抽出し、サーバーヘ
送る問合せの残りを生成する。もし問合せに数個の領域
が含まれていれば、それらのどれかまたはすべてが部分
応答を生成することができる。そのような領域の数が大
きいことがあるので、アルゴリズムは最大限の数の組を
もつ上位m個の領域を選択する。
のキャッシュは使用されず、問合せはサーバーへ送られ
る。応答を受け取ると、問合せに対応する新しいキャッ
シュ領域が生成される。もしキャッシュがその領域のた
めの自由空間を持っていなければ、アルゴリズムは将来
ほとんど使用する価値のない1つまたは数個の領域をキ
ャッシュから廃棄しなければならない。基本的な置換戦
略として、LRU(leastrecently used )法を使用する。
この戦略は、探索がナビゲーションおよび発見に結びつ
いており、また新しい問合せが前の問合せの改良である
ことが多いウェブに適している。
に関して、3つの重要な問題は、より詳しい分析、すな
わち領域の残り(query remainder)の作成、領域合体(re
sioncoalescing)、およびキャッシュ領域置換(cache re
gion replacement)を必要とする。
...,Rmが含まれていると仮定する。問合せの残
りは、Qr=Q−R1−...−Rm=Q∧¬R1∧...
∧¬Rmとして作ることができるが、そのような制約論
理式は、単純化すると、論理和(disjunction)を含む
ことがあり、論理積の問合せだけを受け取るサーバーを
考慮に入れることができない。たとえば、問合せaと領
域a∧b∧cの場合(キーワードを示すため、アルファ
ベットの始めから文字が使用される)、制約論理式a−
a∧b∧cは以下の論理和論理式になる。 a−a∧b∧c=a∧¬(a∧b∧c)=a∧¬b∨a
∧¬c
しない領域とを区別するために、問合せ論理式と領域論
理式との差の尺度を導入する必要がある。差は問合せに
存在しない領域論理式内の項の数として定義される。こ
の定義により、R1,...,Rmの集合はグループ(グ
ループ内のすべての領域は問合せとI項差(I=1,
2,....)をもつ)に分けられる。上記例の場合、
領域論理式a∧b∧cは問合せaと2項差を有する。I
=0のケースも可能であり、問合せと領域が同等である
とき、あるいは領域が問合せを含んでいるとき、従って
問合せの残りがヌルであるとき、I=0のケースが現れ
ることに注目されたい。
域は問合せの残りの論理積形を保つことができ、以下の
ことが当てはまる。結果1 (残りの構造) キャッシュはm個の領域(論理
式は問合せQの論理式と1項差たとえばa1,
a2,...,amを有する)を含んでいると仮定する。
問合せの残りQrはQ∧¬a1∧¬a2∧...∧¬amで
ある。
(a)単一領域包含、(b)複数領域包含、(c)単一
問合せ包含、および(d)複数数問合せ包含を示す。
残りはヌルである。従って、問合せは局部的に処理さ
れ、キャッシュのコンテンツは不変である。問合せ応答
を与える領域は対応する置換値を更新する(以下参
照)。
ルでなく、さらに、意味論的領域Rに対する補数(compl
ement)である(図5(a)参照)。問合せの残りQrに
対する応答を受け取ったとき、その応答をキャッシュに
加える2つの方式がある。非合体戦略では、問合せの残
りのため新しいキャッシュ領域が生成される。合体戦略
では、新しい領域は追加されない。代わりに、残りに対
する応答を用いて領域Rのコンテンツが拡張され、領域
論理式RはQで置き換えられる。上記2つの方式は組を
保存するため同じキャッシュ空間を占有するが、非合体
戦略が2つの領域を使用するのに対し、合体戦略は1つ
の領域のみを使用するので、合体戦略のほうが好まし
い。
が領域包含を生じさせれば(図5(b)参照)、合体戦
略の利点はいっそう大きい。問合せの残りQr=Q−R
1−...−Rmは領域の合体(union)に対する補数(com
plement)であり、合体戦略は、領域R1,...,Rm
と問合せの残りの代わりに、1つの領域(論理式Qと共
に)のみを保有するであろう。領域R1,...,Rmは
組の複製物(tuple duplications)を含むことがあるの
で、合体戦略はキャッシュのシグネチャ部とコンテンツ
部の両方で記憶域をより上手に利用する。
で、空間を新しい領域に解放するためキャッシュはLR
U領域を廃棄することができる。キャッシュ内の組のペ
ージを置き換えるために計画された標準LRU法は同じ
サイズのことを指しており、1ページまたは1組が置換
単位であり、それは問合せとマッチすることもあり、な
いこともある。
ている。もし領域Rが問合せに適格とされれば、応答内
の領域の掛かり合い(involvement)は異なることがあ
る。もし問合せが領域を含んでいれば(図5(a)参
照)、領域コンテンツからのすべての組が応答に現れる
ので、領域コンテンツは完全に応答と関係がある。対照
的に、もし領域が問合せを含んでいれば(図5(c)参
照)、領域の組の一部のみが問合せとマッチするので、
領域の掛かり合いは部分的である。
掛かり合いを考慮に入れなければならない。もし領域の
掛かり合いが完全であれば、問合せ応答がサーバーから
送られるときのケースのように、領域の新しい置換値は
“最新値”である。もし領域の掛かり合いが部分的であ
り、かつ領域コンテンツ内に問合せとぴったり合わない
組が存在すれば、“最新値”への置換値の変更はぴった
り合った組の部分がどのくらいの大きさかによって決ま
る。「領域の掛かり合い」はp=TR/Tとして測定す
ることができる。ここで、TRは問合せ応答に現れた組
の数であり、TRは領域コンテンツ内の組の総数であ
る。
しい問合せが出されるたびに1だけ増加されると仮定す
る。もし領域Rの現在の置換値がVR(VR<Vtop)で、
領域の掛かり合いがpであれば、新しい置換関数は、V
R=VR+(Vtop−VR)pとして計算される。もしp=
1であれば、VR=Vtopである。もしp=1/2であれ
ば、VR=(Vtop+VR)/2である。この置換関数
は、問合せに適格とされた、そして適格とされないキャ
ッシュ内のどの領域にも実施できることに留意された
い。もし領域が問合せに適格とされなければ、従って、
掛かり合いp=0であれば、領域置換値は変わらない。
出される、(b)問合せ後、合体した領域、(c)問合
せb∧d∧fが出される、および(d)問合せ後、更新
された領域を示す。
aをもつ3つの領域を含んでいる。図6(a)は、置換
値をもつ領域を示す(Vtop=6と仮定して)。新しい
問合せはdであると仮定する。第2および第3の領域は
領域包含関係を生じさせる。2つの領域論理式は1ワー
ドだけ(第2領域ではb、第3領域では¬a)問合せ論
理式と違っているので、生成された問合せの残りはd∧
a∧¬bになるであろう。完全応答が生成された後、第
2および第3領域と問合せの残りは論理式dをもつ1つ
の領域で置き換えられる(図5(b))。その置換値は
Vtop=7である。
する(図6(c)参照)。2つの領域b∧dとd∧¬a
は問合せを含んでいる。前者はコンテンツ内により少な
い組を有するので、問合せに対し応答するため前者が選
ばれる。その置換値は、領域コンテンツ内の問合せとぴ
ってり合う組の部分に従って更新される(3から4
へ)。
処理ステップを示す。 入力. 意味論的領域をもつキャッシュと問合せQ 出力. Qに対する応答と更新したキャッシュ 1. キャッシュ内のすべての領域シグネチャと対比し
て問合せシグネチャを確かめる(ステップs1,s
2)。 2. SQ=SR: もし論理式が問合せと同等である領
域が存在すれば、領域コンテンツを問合せ応答として戻
す。領域の置換関数値を更新し、終了する(ステップs
3,s4)。 3. SQ⊃SR: もし1つまたはそれ以上の領域が問
合せを含んでいれば、最小限の基数をもつ領域を選択す
る。領域コンテンツ内の組を走査し、問合せとマッチす
る組を戻す。領域の置換関数値を更新し、終了する(ス
テップs12〜s15)。 4. SQ⊂SR: もし幾つかの領域が問合せを含んで
いれば、最大限の基数をもつ上位m個の領域
R1,...,Rmを選択する。領域R1,...,Rmの
領域コンテンツからすべての組を戻し、複製物を廃棄す
る(ステップs5〜s11)。以下に述べるように問合
せの残りを作る(ステップs71〜s77;図8): ・問合せの残りを問合せQに設定する(ステップs7
1)。 ・各領域Riについて、領域包含を規定し、領域論理式
と問合せとの差を計算する(ステップs73)。もし差
が1項aiだけであれば、¬aiをもつ問合せの残りを拘
束する。その問合せの残りをサーバーへ送る。応答を受
け取った後、領域R1,...,Rmを1つの領域Qで置
き換える。Qの置換値としてVtopを置き、終了する。 5. もしそうでなければ(ステップs16〜s20;
図9)、問合せQをサーバーへ送る。応答を受け取った
ら、Qのためキャッシュ内に新しい領域を生成する。そ
の領域に空間を解放するため、問合せQがキャッシュに
適合するまで、最小の置換値をもつ領域を除去する。
包含関係(semantic containment)のケースを効率的に処
理する。しかし、意味論的領域が応答の一部を生成でき
るが問合せを含んでいないし、また問合せに含まれてい
ない場合には、前記技法は意味論的AND演算(semanti
c intersection)のより頻度の高い、より複雑なケース
をうまく処理しない。
す。例2 .キャッシュは論理式“∧問合せ”をもつ領域R1
を含んでおり、問合せQは“最適な∧問合せ”であると
仮定する(図10(a)参照)。論理式“最適な∧問合
せ∧キャッシング”とマッチする領域コンテンツ内の組
は問合せとマッチするけれども、包含関係が存在しない
ので、アルゴリズム1はR1を部分応答に利用しない。
さらに,アルゴリズム1はサーバーから問合せQに対す
る応答を受け取ると、同じ論理式“最適な∧問合せ”を
もつ新しい意味論的領域R2を生成する(図10(b)
参照)。2つの意味論的領域R1,R2はそれらのAND
演算論理式“最適な∧問合せ∧キャッシング”とマッチ
する組複製物を含んでいる。言い替えると、意味論的A
ND演算のケースでは、アルゴリズム1は低いキャッシ
ュ使用と高い組複製物レベルを維持する。
シュの利用を改善し、組複製物を減らすように意味論的
AND演算を処理する拡張キャッシング技法について説
明する。
は、それらの論理式AND演算(formula intersection)
R∩Qの論理積によって与えられる。領域シグネチャS
Rと問合せシグネチャSQが与えられたとして、ここで
は、SQとSRのビット状AND演算によって得られたそ
れらのシグネチャAND演算SQ∩SRを使用する。従っ
て、シグネチャSの場合、シグネチャ基数(signature c
ardinality)|S|はシグネチャ内の1に設定されたビ
ットの数を示す。
D演算の場合には、ここでは、2つの主要なケースを区
別する。すなわち、補数(complement) : Q∩R=φ;論理式AND演算は
ヌルである。たとえば、問合せa∧bは領域a∧¬bに
対する補数である。従って、領域は問合せに対する応答
の組を含んでいない。しかし、補数のケースでは、領域
合体は可能である。上記の問合せと領域の場合、合体は
論理式aをもつ1つの領域をもたらすであろう。AND演算(intersection): Q∩R≠φ;論理式AN
D演算はヌルでない。以下の2つのサブケースが存在す
る。すなわち、 ・問合せおよび領域の論理式はAND演算に現れる幾つ
かの共通項を有する(たとえば領域“キャッシング∧問
合せ”と問合せ“最適な∧問合せ”は共通項“問合せ”
を有する)。 ・問合せおよび領域の論理式は共通語を持たない。たと
えば、領域aと問合せbは共通項を持たないが、それら
のAND演算a∧bは空でなく、従って領域は部分応答
に貢献できる。
演算. もし問合せQと領域Rが幾つかの共通項を持っ
ていれば、それらのシグネチャは共通項のシグネチャに
対応する1に設定されたビットを有する。論理式QとR
が持つ共通項がを多ければ多いほど、一緒に1に設定さ
れるビットの数は大きいので、2つのシグネチャ内の1
に設定された対応するビットの数|SQ∩SR|によっ
て、RとQの意味論的AND演算を測定することができ
る。しかし、これは常に真ではない。たとえば、論理式
aをもつ領域と問合せbの場合、それらのシグネチャA
ND演算は1に設定されたビットを持つことはない。し
かし、領域は論理式ab∧bとマッチする組をユーザー
に報告することができる。
部が共有されたどの領域が部分応答に貢献し、そして問
合せの残りを拘束できるかを、シグネチャ・ファイル法
がどのように迅速に検出できるかを示す。意味論的AN
D演算に関する以下の検討は、同等または問合せ包含は
キャッシュ内で検出されないこと、従って、問合せの残
りはヌルでないと仮定していることに留意されたい。
されるだけであるので、問合せと共有部分をもつ領域の
すべてが問合せの残りに貢献できるのではない。どの領
域が貢献できるかを検出するために、前に導入した項差
を再び使用する。さらに、意味論的包含のために導出し
たが、意味論的AND演算に完全に適用できる残りの構
造を使用する。すなわち、もしキャッシュがm個の領域
を含んでおり、その論理式は問合せQに含まれていない
が、1項差たとえばa1,a2,...,amを有してい
れば、問合せの残りQrは、Q∧¬a1∧¬a2∧...
∧¬amとして作ることができる。
せ”は問合せ“最適∧問合せ”と1項差を有するので、
領域は部分“最適∧問合せ∧キャッシング”をユーザー
に報告し、問合せの残り“最適∧問合せ∧¬キャッシン
グ”を作ることができる。同様に、領域aは問合せbと
1項差を有する。部分a∧bは報告され,問合せの残り
はb∧¬aである。
項差をもつ意味論的領域のこの著名な特徴は、キャッシ
ュのコンテンツに対する問合せの二重走査評価をもたら
す。領域シグネチャにわたる最初の高速走査は、問合せ
の残りを迅速に作って、最初の部分応答を生成するため
1項差をもつすべての領域を識別する。第2の低速走査
は、他のAND演算が部分応答を質的に向上させること
ができるかを調べる。領域シクネチャにわたる2つの走
査は領域シグネチャに適用されるフィルタリング関数に
違いがある。
Rは問合せとせいぜい1項差をもつべきである。従っ
て、もし領域シグネチャが1に設定された|SR|ビッ
トをもち、問合せシグネチャとそのAND演算が|SR
∩SQ|ビットをもっていれば、2つの数の差はせいぜ
いkビットにすべきである。ここで、kは項シグネチャ
内の1に設定されたビットの数である。以下の結果はこ
の事実を明白に述べている。結果2 もし領域Rが問合せQと1項差を有していれ
ば、 |SR∩SQ|≧|SR|−k (2) である。
(2)を確かめる。もし条件が領域シグネチャに当ては
まれば、領域論理式が1項差に関して調べられる。意味
論的包含と同様に、もし条件(2)は当てはまるが、領
域論理式が1項差を与えなければ、誤り選択が生じる。
多くの実験を行った結果、論理式(1)で計算したシグ
ネチャ・ファイルのパラメータを適切に選択することに
よって、条件(2)を確かめる時の誤り選択の数を少な
く保つことができることが判った。
し、問合せの残りを拘束することができない領域を検出
する。1項差との類推により論理式が問合せとI(I≧
2)項差をもつ領域は条件(3)を満たす。 |SR∩SQ|≧|SR|−k・I (3) しかし、この条件は、第2の走査に全面的に用いること
ができない。第1に、条件(3)は、増加するkの値に
対してはその重要性を失う。実際には、典型的なウェブ
問合せまたは領域論理式は3または4項の平均を有して
おり、条件(3)は|SR∩SQ|≧0に簡単化されるこ
とが多い。この簡単化された条件はすべての領域シグネ
チャを掃引し、多くの誤り選択と高いフィルタリング・
オーバーヘッドを引き起こすであろう。第2に、問合せ
と2またはそれ以上の項差をもつ領域は,通例、1項差
をもつ領域と比べて応答にほとんど貢献しない。第3
に、貢献する組は、それらの論理式が問合せの残りから
除外されなかったので、とにかく問合せの残りに対する
応答の中に複製されないであろう。
に対する以下の2つの条件だけを検討する。 ・|SR∩SQ|≧|SR|−2k:この条件は主として
問合せと2項差をもつ領域をフェッチする。従って,よ
り多くの項差をもつ幾つかの領域はフェッチされない。 ・|SR∩SQ|≧0:すべての領域論理式はこの条件を
満たす。従って、この条件は多くの誤り選択を引き起こ
す。しかし、この条件は問合せとマッチするキャッシュ
内のすべての組を検索する。
索した組の数との間で良好のトレードオフが得られるの
で、最初のオプションのほうが好ましい。第2のオプシ
ョンは、キャッシュが小さい場合や、アプリケーション
が問合せとマッチするキャッシュからすべての組を検索
しようとしているときに使用できる。
は合体戦略に対し新しい拡張部分を与える。一体化した
論理式が論理積でありさえすれば、合体戦略は問合せと
領域を合体することができる。例えば、合体戦略は問合
せa∧bと領域a∧¬bを1つの領域に合体することが
できる。次の3つの条件:1)領域が問合せと1項差、
たとえばa1を有すること、2)対称的に、問合せが領
域と1項差、たとえばa2を有すること、3)a1はa2
の否定であること、が守られてさえいれば、上記操作を
行うことができる。明らかに、そのような状況は同じ条
件2)で検出して、あとで処理することができる。
ainment)のために計画されたので、意味論的AND演算
(semantic intersection)に対しても変わらない。新し
い問合せが出されたとき、キャッシュ内のどの意味論的
領域も応答内の領域掛かり合い(region involvement)に
比例してVtopの方に向かって更新された置換値を有し
ている。
2キャッシング技法は、問合せと意味論的領域間の2つ
の関係、すなわち前に述べた意味論的包含と本節で述べ
る意味論的AND演算を扱う。さらに、この技法は、問
合せ包含を与える領域と意味論的AND演算を与える領
域とを区別しないで、それらを一様に処理して1項差を
もつ領域を識別する。
施する処理ステップを示す。 入力.意味論的領域をもつキャッシュと問合せQ 出力.Qに対する応答と更新したキャッシュ 1.(最初の走査) キャッシュ内の領域シグネチャと
対比して問合せシグネチャを調べる(ステップs2
1)。 2.SQ=SR:もし論理式が問合せと同等である領域が
存在すれば、領域コンテンツを応答として戻す。領域の
置換値を更新し(s24,s24)、終了する。 3.SQ∩SR=SQ:もし1つまたはそれ以上の領域が
問合せを含んでいれば、最小限の基数(minimal cardina
lity)をもつ領域を選択する。領域コンテンツを走査
し,問合せとマッチする組を戻す。領域の置換値を更新
し(s25〜s28)、終了する。 4.|SQ∩SR|≧|SR|≧k.問合せと1項差をも
つすべての領域、たとえばR0,...,Rm(m≧0)
を識別する。R0,...,Rmの意味論的領域内の問合
せとマッチする組を戻し、複製物を廃棄する(ステップ
s29〜s36)。問合せの残りQr=Q∧¬R0...
∧¬Rkを以下のように作る(ステップs311〜s3
15;図12): ・問合せの残りをQに設定する(ステップs312)。 ・各領域Ri(i=0,...,m)について、問合せ
との差aiを計算し(ステップs314)、¬aiをもつ
問合せの残りを拘束する。問合せの残りをサーバーへ送
る。 5.(第2の走査)条件Tをもつ領域シグネチャを走査
する(ステップs331〜s336、図13)。Tは|
SR|−2k≧|SR∩SQ|<|SR−kと、0≦|SR
∩SQ|<|SR|−kとの選択である。フェッチした各
領域Rについて、Q∩R論理式AND演算を調べる(ス
テップs332)。もし論理式がヌルでなければ、問合
せとマッチする領域コンテンツからの組を報告する(ス
テップs335)。 6.問合せの残りQrに対する応答を受け取ったら、以
下のようにキャッシュを更新する(ステップs351〜
s355、図14)。 ・もし領域Ri1...,Ripが問合せを含んでいれば、
それらを論理式Qをもつ新しい領域で置き換える。 ・もし領域Rが問合せQに対する補数であり、論理式R
∪Qが論理積(conjunction)であれば、RとQを新しい
領域で置き換える。 ・さもなければ、論理式Qrをもつキャッシュに新しい
領域を加える。 ・部分応答に貢献するすべての領域について置換値を更
新する。
(a)問合せc∧dが出される、及び(b)問合せの
後、を示す。
をもつ領域を含んでおり、ユーザー問合せはb∧cであ
ると仮定する。図15(a)は、置換値(Vtop=7と
仮定する)をもつ2つの領域と問合せを示す。最初の走
査は、領域a∧bが問合せと1項差を有し、そして問合
せの残りQr(b∧c∧¬a)を拘束できることを検出
する。問合せとマッチする領域コンテンツからのすべて
の組は部分応答を与える。第2の走査は、領域c∧d∧
¬eについて意味論的AND演算を検出する。領域コン
テンツが走査される。問合せとマッチする組は部分応答
を完成させる。
れると、論理式c∧d∧¬eをもつ新しい領域が生成さ
れる。置換値はVtop=8に等しい。同様に、a∧bと
c∧d∧¬eは共に、応答への貢献に比例する更新され
た置換値を有する{図15(b)参照}。
るための新しいメカニズムを提示した。このメカニズム
はシグネチャ・ファイルに基づいており、過去の問合せ
を効率的に再利用することを考慮に入れている。2つの
キャッシング・アルゴリズムは、ユーザー問合せと意味
論的領域との意味論的包含関係とAND演算関係をうま
く処理する。
図である。
ある。
含;(b)複数領域包含;(c)単一問合せ包含;およ
び(d)複数問合せ包含を示す図である。
る;(b)問合せの後、合体された領域:(c)問合せ
b∧d∧fが出される;および(d)問合せの後、更新
された領域を示す図である。
理ステップを示すフローチャートの前部分である。
示す図である。
処理ステップを示すフローチャートの第1部分である。
(a)問合せc∧dが出される、(b)問合せの後、を
示す図である。
Claims (3)
- 【請求項1】 メモリを備え、該メモリ内の1セットの
ロケーションがキャッシュを形成し、該キャッシュは、
1つまたはそれ以上の意味論的領域から成る1セットの
各々について、コンテンツを含んでおり、該コンテンツ
は1つまたはそれ以上のデータアイテムを含んでいるシ
ステムを用いて、問い合わせに対する応答を得る方法で
あって、(a)問合せQを得ること、(b)前記問合せ
Qを用いて問合せシグネチャSQを得ること、(c)前
記問合せシグネチャSQと少なくとも1つの前記意味論
的領域についての領域シグネチャSRとを用いて、前記
問合せQに対し、1つの前記意味論的領域のコンテンツ
から少なくとも1つのデータアイテムを含む応答を得る
こと、から成ることを特徴とする方法。 - 【請求項2】 請求項1に記載の方法において、 更に、各意味論的領域について、前記領域シグネチャS
Rを含んでおり、 前記ステップ(c)は、 (c1)任意の意味論的領域についてSQ=SRかどうか
を決定し、そうでない場合には、任意の意味論的領域に
ついてSQ⊃SRかどうかを決定し、そうでない場合に
は、任意の意味論的領域についてSQ⊂SRiかどうかを
決定すること、および、 (c2)もし前記(c1)が1領域についてSQ=SRと
決定したならば、その領域のコンテンツを前記問合せに
対する応答として得ること、もし前記(c1)が1つま
たはそれ以上の領域についてSQ⊃SRと決定したなら
ば、1つの領域のコンテンツにおいて前記問合せにマッ
チするデータアイテムを含む応答を得ること、もし前記
(c1)が1つまたはそれ以上の領域についてSQ⊂S
Riと決定したならば、少なくとも1つの領域のサブセッ
トのコンテンツからデータアイテムを含む応答を得るこ
と、 から成ることを特徴とする方法。 - 【請求項3】 請求項1に記載の方法において、 各項(ターム)は、セットされるほぼkビットを有し、
前記キャッシュは各意味論的領域について更に前記領域
シグネチャSRを包含し、 前記ステップ(c)が、 (c3)任意の意味論的領域についてSQ=SRかどうか
を決定し、そうでない場合には、任意の意味論的領域に
ついてSQ∩SR=SRかどうかを決定し、そうでない場
合には、任意の意味論的領域について|SQ∩SR|≧|
SR|−kかどうかを決定すること、および、 (c4)もし前記(c3)が1領域についてSQ=SRと
決定したならば、その領域のコンテンツを問合せQに対
する応答として得ること、もし前記(c3)が1つまた
はそれ以上の領域についてSQ∩SR=SRと決定したな
らば、1つの領域のコンテンツにおいて前記問合せQに
マッチするデータアイテムを含む応答を得ること、もし
前記(c3)が1つまたはそれ以上の領域について|S
Q∩SR|≧|SR|−kと決定したならば、少なくとも
1つの領域のサブセットのコンテンツからデータアイテ
ムを含む応答を得ること、 から成ることを特徴とする方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP98401312A EP0961210A1 (en) | 1998-05-29 | 1998-05-29 | Signature file based semantic caching of queries |
EP98401312:8 | 1998-05-29 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000057172A true JP2000057172A (ja) | 2000-02-25 |
JP4418555B2 JP4418555B2 (ja) | 2010-02-17 |
Family
ID=8235391
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP14107999A Expired - Fee Related JP4418555B2 (ja) | 1998-05-29 | 1999-05-21 | 問合せに対する応答を得る方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US6347314B1 (ja) |
EP (1) | EP0961210A1 (ja) |
JP (1) | JP4418555B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008541272A (ja) * | 2005-05-09 | 2008-11-20 | プロビラ,インク. | 署名生成および関連性を有するマッチングエンジン |
Families Citing this family (37)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7844594B1 (en) | 1999-06-18 | 2010-11-30 | Surfwax, Inc. | Information search, retrieval and distillation into knowledge objects |
US20020078300A1 (en) * | 1999-08-16 | 2002-06-20 | Chanda Dharap | Semantics-based caching policy to minimize latency |
JP2002149699A (ja) * | 2000-11-10 | 2002-05-24 | Hitachi Ltd | データ検索装置 |
US7113943B2 (en) * | 2000-12-06 | 2006-09-26 | Content Analyst Company, Llc | Method for document comparison and selection |
US7099871B2 (en) * | 2001-05-04 | 2006-08-29 | Sun Microsystems, Inc. | System and method for distributed real-time search |
US6961723B2 (en) * | 2001-05-04 | 2005-11-01 | Sun Microsystems, Inc. | System and method for determining relevancy of query responses in a distributed network search mechanism |
US6950821B2 (en) * | 2001-05-04 | 2005-09-27 | Sun Microsystems, Inc. | System and method for resolving distributed network search queries to information providers |
US7171415B2 (en) * | 2001-05-04 | 2007-01-30 | Sun Microsystems, Inc. | Distributed information discovery through searching selected registered information providers |
US7013303B2 (en) * | 2001-05-04 | 2006-03-14 | Sun Microsystems, Inc. | System and method for multiple data sources to plug into a standardized interface for distributed deep search |
US6934702B2 (en) * | 2001-05-04 | 2005-08-23 | Sun Microsystems, Inc. | Method and system of routing messages in a distributed search network |
US7475416B2 (en) * | 2001-06-13 | 2009-01-06 | Microsoft Corporation | System and methods for searching interactive broadcast data |
US20090006543A1 (en) * | 2001-08-20 | 2009-01-01 | Masterobjects | System and method for asynchronous retrieval of information based on incremental user input |
US20070156665A1 (en) * | 2001-12-05 | 2007-07-05 | Janusz Wnek | Taxonomy discovery |
US20030208761A1 (en) * | 2002-05-02 | 2003-11-06 | Steven Wasserman | Client-based searching of broadcast carousel data |
US7499910B2 (en) * | 2002-06-27 | 2009-03-03 | Siebel Systems, Inc. | Detecting and processing cache hits for queries with aggregates |
US7487149B2 (en) * | 2004-03-10 | 2009-02-03 | Oracle International Corporation | Method and apparatus for providing query-level security in a database system |
US7676453B2 (en) * | 2004-04-22 | 2010-03-09 | Oracle International Corporation | Partial query caching |
US20060048053A1 (en) | 2004-08-30 | 2006-03-02 | Xerox Corporation | Individually personalized customized report document system |
US20060048042A1 (en) * | 2004-08-30 | 2006-03-02 | Xerox Corporation | Individually personalized customized report document system with user feedback |
US7315854B2 (en) * | 2004-10-25 | 2008-01-01 | International Business Machines Corporation | Distributed directory replication |
US20060242190A1 (en) * | 2005-04-26 | 2006-10-26 | Content Analyst Comapny, Llc | Latent semantic taxonomy generation |
US7844566B2 (en) * | 2005-04-26 | 2010-11-30 | Content Analyst Company, Llc | Latent semantic clustering |
US7840553B2 (en) * | 2005-10-07 | 2010-11-23 | Oracle International Corp. | Recommending materialized views for queries with multiple instances of same table |
US7747612B2 (en) * | 2005-10-31 | 2010-06-29 | Yahoo! Inc. | Indication of exclusive items in a result set |
US7747613B2 (en) * | 2005-10-31 | 2010-06-29 | Yahoo! Inc. | Presentation of differences between multiple searches |
US7747614B2 (en) * | 2005-10-31 | 2010-06-29 | Yahoo! Inc. | Difference control for generating and displaying a difference result set from the result sets of a plurality of search engines |
US8239383B2 (en) * | 2006-06-15 | 2012-08-07 | International Business Machines Corporation | System and method for managing execution of queries against database samples |
US9112873B2 (en) * | 2007-04-10 | 2015-08-18 | Apertio Limited | Alias hiding in network data repositories |
US8782085B2 (en) * | 2007-04-10 | 2014-07-15 | Apertio Limited | Variant entries in network data repositories |
US8645409B1 (en) | 2008-04-02 | 2014-02-04 | Google Inc. | Contextual search term evaluation |
CN101937442A (zh) * | 2009-06-29 | 2011-01-05 | 国际商业机器公司 | 用于缓存术语数据的方法和系统 |
US9053200B2 (en) * | 2009-12-14 | 2015-06-09 | Appfolio, Inc. | Systems and methods for sorting, grouping, and rendering subsets of large datasets over a network |
US8515922B2 (en) | 2011-06-17 | 2013-08-20 | International Business Machines Corporation | Deduplicated caching of queries for green IT management |
US9292341B2 (en) * | 2013-10-16 | 2016-03-22 | Google Inc. | RPC acceleration based on previously memorized flows |
CN111104666B (zh) * | 2018-10-25 | 2023-09-05 | 戴尔产品有限公司 | 用于访问服务的方法、设备和计算机可读介质 |
EP4004758A1 (en) | 2019-07-31 | 2022-06-01 | Sindice Limited t/a Siren | Semantic caching of semi-join operators in shared-nothing and log-structured databases |
CN116541420B (zh) * | 2023-07-07 | 2023-09-15 | 上海爱可生信息技术股份有限公司 | 向量数据的查询方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2000006C (en) * | 1989-01-23 | 1994-07-12 | Walter W. Chang | Combinatorial signatures for data encoding and searching |
JP3132738B2 (ja) * | 1992-12-10 | 2001-02-05 | ゼロックス コーポレーション | テキスト検索方法 |
US6012085A (en) * | 1995-11-30 | 2000-01-04 | Stampede Technolgies, Inc. | Apparatus and method for increased data access in a network file object oriented caching system |
US5819286A (en) * | 1995-12-11 | 1998-10-06 | Industrial Technology Research Institute | Video database indexing and query method and system |
US5913205A (en) * | 1996-03-29 | 1999-06-15 | Virage, Inc. | Query optimization for visual information retrieval system |
US5819288A (en) * | 1996-10-16 | 1998-10-06 | Microsoft Corporation | Statistically based image group descriptor particularly suited for use in an image classification and retrieval system |
US6035303A (en) * | 1998-02-02 | 2000-03-07 | International Business Machines Corporation | Object management system for digital libraries |
-
1998
- 1998-05-29 EP EP98401312A patent/EP0961210A1/en not_active Withdrawn
-
1999
- 1999-05-19 US US09/314,874 patent/US6347314B1/en not_active Expired - Lifetime
- 1999-05-21 JP JP14107999A patent/JP4418555B2/ja not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008541272A (ja) * | 2005-05-09 | 2008-11-20 | プロビラ,インク. | 署名生成および関連性を有するマッチングエンジン |
Also Published As
Publication number | Publication date |
---|---|
EP0961210A1 (en) | 1999-12-01 |
US6347314B1 (en) | 2002-02-12 |
JP4418555B2 (ja) | 2010-02-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4418555B2 (ja) | 問合せに対する応答を得る方法 | |
US11580109B2 (en) | Method and apparatus for stress management in a searchable data service | |
Chidlovskii et al. | Semantic caching of web queries | |
US6795820B2 (en) | Metasearch technique that ranks documents obtained from multiple collections | |
US7627613B1 (en) | Duplicate document detection in a web crawler system | |
KR100699977B1 (ko) | 데이터베이스 검색 시스템에서 관련 검색을 식별하기 위한방법 및 장치 | |
Amiri et al. | DBProxy: A dynamic data cache for Web applications | |
Chidlovskii et al. | Semantic cache mechanism for heterogeneous web querying | |
US8280868B2 (en) | Method and system for monitoring domain name registrations | |
EP1974295B1 (en) | Method and apparatus for a distributed file storage and indexing service | |
US7392238B1 (en) | Method and apparatus for concept-based searching across a network | |
Luo et al. | Active query caching for database web servers | |
US7657515B1 (en) | High efficiency document search | |
EP1050830A2 (en) | System and method for collaborative ranking of search results employing user and group profiles | |
WO2001040949A1 (en) | Dynamic caches with miss tables | |
JP2006511876A (ja) | トランスペアレントなネットワークのエッジ・データ・キャッシュ | |
Wills et al. | Studying the impact of more complete server information on web caching | |
US7836108B1 (en) | Clustering by previous representative | |
Rosenfeld | An implementation of the Annis 2 query language | |
Tsikrika et al. | Merging techniques for performing data fusion on the web | |
Chidlovskii et al. | Signature file methods for semantic query caching | |
Yao et al. | Using user access patterns for semantic query caching | |
US8489560B1 (en) | System and method for facilitating the management of keyword/universal resource locator (URL) data | |
Amiri et al. | A self-managing data cache for edge-of-network web applications | |
US20050033823A1 (en) | Apparatus, method and computer program product for resource locator using queries |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060519 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090601 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090831 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20091029 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20091130 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121204 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131204 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |