JP2000057172A - 問合せに対する応答を得る方法 - Google Patents

問合せに対する応答を得る方法

Info

Publication number
JP2000057172A
JP2000057172A JP11141079A JP14107999A JP2000057172A JP 2000057172 A JP2000057172 A JP 2000057172A JP 11141079 A JP11141079 A JP 11141079A JP 14107999 A JP14107999 A JP 14107999A JP 2000057172 A JP2000057172 A JP 2000057172A
Authority
JP
Japan
Prior art keywords
query
region
semantic
signature
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP11141079A
Other languages
English (en)
Other versions
JP4418555B2 (ja
Inventor
Boris Chidlovskii
キドロヴスキー ボリス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xerox Corp
Original Assignee
Xerox Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xerox Corp filed Critical Xerox Corp
Publication of JP2000057172A publication Critical patent/JP2000057172A/ja
Application granted granted Critical
Publication of JP4418555B2 publication Critical patent/JP4418555B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9014Indexing; Data structures therefor; Storage structures hash tables
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99934Query formulation, input preparation, or translation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99935Query augmenting and refining, e.g. inexact access
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99936Pattern matching access

Abstract

(57)【要約】 【課題】 問合せの意味論的キャッシングを効率的に実
施する方法を提供する。 【解決手段】 いわゆるシグネチャ・ファイルに基づい
てウェブ問合せをキャッシュするための新しいメカニズ
ムは2つの実施選択肢を有する。第1のアルゴリズムは
問合せと対応するキャッシュ項との意味論的包含関係を
うまく処理する。第2のアルゴリズムはこの処理を意味
論的論理積のより複雑なケースへ拡張する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、オンライン情報検索シ
ステム(たとえば、インターネット/WWW、イントラ
ネット)、より詳細にはシグネチャ・ファイルをベース
とする、問合せの意味論的キャッシング(semantic cach
ing)に関するものである。
【0002】
【従来の技術】Tavakoli, N.およびRay, A. の論文“A
New Signature Approach for Retrieval of Documents
from Free-Text Databases”, Information Processing
& Management, Vol. 28, No.2, 1992, pp. 153-163
は、情報検索のシグネチャー手法を述べている。その手
法では、シグネチャ・ファイルのサイズはアルファベッ
トの固有記号の数によって決まる。
【0003】クライアント・サーバー情報システムで
は、データーをキャッシュし、そしてサーバーとの将来
の対話を最小限度にするため、主としてローカルクライ
アント・メモリが使用されている。このデーター・キャ
ッシングは、応答を引き渡す際にネットワーク通信量と
低速サーバーが長い遅延を引き起こすことがあるウェブ
に対し特別な重要性を有する。標準ページをベースとす
るキャッシングはウェブに対して技術的に実施不可能で
あり、また組(tuple)をベースとするキャッシングは
一定の制限を有するので、考えられる将来の再使用のた
めユーザー問合せと応答をキャッシュすることに大きな
努力が払われてきた。そのような技法は、たとえばGodf
rey, P., およびGryz, J., の論文“Semantic Query
Caching for Heterogeneous Databases”, in Proceedi
ngs of the 4th KRDB Workshop, Athens, Greece, 30-A
ugust-1997, pp. 6-1 to 6-6 に記載されている。
【0004】問合せキャッシングは、たとえばキーワー
ドを加えたり、または除去することによって、ユーザー
がかなり頻繁に問合せを改良する場合に特別な利点を有
する。このケースでは、応答の組の多くはそれまでにキ
ャッシュすることができるので、直ちにユーザーへ引き
渡すことができる。
【0005】ウェブをベースとする問合せシステムは、
異種分配型(heterogeneous distributed)データ・リポ
ジトリに接触し、いわゆるラッパー(wrappers) を呼び
出してユーザー問合せを目標の問合せ言語へ変換し、サ
ーバーからのデータ・フローを管理する。データーは通
例HTMLフォーマットでネットワークを通じて転送さ
れるので、最終応答がユーザーに報告される(そしてキ
ャッシュに記憶される)前に、ラッパーも検索したHM
TLファイルから応答の組を抽出する。
【0006】典型的なウェブ問合せは、項(term)の論理
積(conjunction)である。問合せ内の各項はおそらく演
算子 NOTで否定されたキーワードであり、1つまたはそ
れ以上の属性(題名、著者、等)に付けられる。ほとん
どのウェブ・サーバーでは、演算子 NOTは AND N
OTと同じであり、問合せは少なくとも1個の非否定項
を含むことが強制される。
【0007】意味論的キャッシングはクライアントキャ
ッシュを意味論的領域(semantic region)の集まりとし
て管理することができる。すなわち、意味論的領域の単
位でアクセス情報が管理され、キャッシュ置換が実行さ
れる。そのような技法は、Dar, S., Franklin, M. J.,
Jonsson, B.T., およびTan, M.の論文 “Semantic Data
Caching and Replacement”, in Proceedings of the
22th VLDB Conference, Mumbai (Bombay), India, 199
6, pp. 330-341 に記載されている。意味論的領域は、
たとえばユーザー問合せによって扱われる意味的に関係
があるドキュメントをグループに分ける。
【0008】意味論的キャッシングの解決法では、各意
味論的領域は、そのコンテンツを記述する制約論理式、
コンテンツ内の組(tuple)のカウンタ、キャッシュ内の
実際の組の集合のためのポインタ、および置換戦略によ
って領域をランク付けするため使用される追加情報を有
することができる。問合せと同様、すべての領域論理式
は項の論理積である。
【0009】クライアントで問合せが出されると、問合
せは2つの別個の部分、(1)ローカルキャッシュ内で
入手できる応答の部分と(2)サーバーからの応答に欠
けているすべての組を検索する残りの問合せに分けられ
る。もし残りの問合せがヌルでなければ(すなわち、問
合せはキャッシュされない情報空間の部分を取り扱
う)、残りの問合せはサーバーへ送られ、そこで処理さ
れる。
【0010】
【発明が解決しようとする課題】問合せキャッシングの
多くの重要な原理について説明したが、どれもキャッシ
ュ項に対する問合せ評価のための効率的な方法を提供し
ていない。さらに、一部の技法においては、問合せ評価
はコンピュータの使用が難しいデータログ問合せ評価に
なっている。
【0011】
【課題を解決しようとする手段】本発明は、プロセッサ
とメモリを備え、前記メモリ内の複数の所定ロケーショ
ンがキャッシュを形成し、前記キャッシュが1つまたは
それ以上の意味論的領域から成る情報処理システムにお
いて実施する方法であって、(a)対応する問合せシグ
ネチャSQをもつ問合せQを受け取ること、(b)前記
問合せシグネチャSQに頼って、前記問合せQに対応す
る応答として前記1つまたはそれ以上の前記領域のコン
テンツを戻すこと、の諸ステップから成る方法を提供す
る。
【0012】本発明は、さらに、プロセッサとメモリを
備え、前記プロセッサはメモリに結合され、そして前記
メモリと協力して前記方法の諸ステップに対応する命令
を実行するように動作することができるプログラム可能
な情報処理システムであって、上記の方法を実施するた
め適切にプログラムされた場合の情報処理システムを提
供する。
【0013】本発明は、ウェブ問合せをキャッシュする
新しいメカニズムを提供する。そのメカニズムは、いわ
ゆるシグネチャ・ファイルに基づいており、キャッシュ
項の数に比例する効率的な問合せ評価を考慮に入れてい
る。本発明の実施例に従って、キャッシュ内の各意味論
的領域はシグネチャに関連付けられている。ユーザー問
合せの場合、シグネチャは同様な仕方で作られ、キャッ
シュに保存されている領域シグネチャに対し確かめられ
る。提案したキャッシング・メカニズムは問合せに適格
とされたすべてのキャッシュ項を識別する手続きを含
む。すなわち、手続きはどのキャッシュ項を直ちに再使
用できるか、そしてサーバーから欠けているどの情報を
要求しなければならないかを検出する。
【0014】このメカニズムは3つの長所を有する。第
1に、このメカニズムは、1)問合せがキャッシュに含
まれているとき、または2)問合せが幾つかの領域を共
有するとき、2つの重要なケースを同じ洗練されたやり
方で処理する。その結果、提案したメカニズムは組複製
物(tuple duplications)のほとんどのケースを回避し、
適度な記憶装置要求を有する。第2に、このメカニズム
は部分応答の効率的な報告と、問合せの残りの効率的な
生成をサポートする。最後に、このメカニズムは領域合
体および置換方針のための簡単な解決法を提供する。
【0015】
【発明の実施の形態】本発明が通常のコンピュータ・ネ
ットワーク技術を使用してイントラネットによって、ま
たはより適切にインターネットによって実施できること
は理解されるであろう。本発明はインターネットを通じ
てクロスプラットフォーム通信とドキュメント転送を行
う通常のWWWウェブ・ブラウザ・ソフトウェア(たと
えば、Netscape)を使用して実施することができる。図
1は、このやり方を示す。ネットワーク21の一部を構
成する各マシン22,24,26は、この分野で周知の
Windows で動作するPC、MacOSで動作するMac 、また
はUNIXで動作するマイクロコンピュータでもよいことは
理解されるであろう。しかし、異なるシステム構成(た
とえばヨーロッパ特許出願公開EP−A−772,85
7号、米国特許第5,692,073号)を使用して本
発明を実施できることは理解されるであろう。
【0016】マシン22におけるユーザーの要求に応じ
て、マシン26に保存されたドキュメントまたは他の情
報(たとえば問合せに対する応答)を検索し、インター
ネットを通じてマシン26から幾つかの中間マシン24
を経由してマシン22へ送ることができる。周知のよう
に、ドキュメントは、固有の識別子として、たとえば検
索エンジンへの適当な問合せ入力を用いて得たWorld Wi
de Web URLを使用して検索することができる。
【0017】シグネチャ・ファイルはそもそも問合せワ
ードを含むフルテキスト断片を検索するため計画された
ものである。最も広く知られているスーパーインポーズ
・コーディングによって、各意味論的領域(semantic re
gion)は論理積形式で論理式と関連付けられる。領域論
理式内の各項は1と0の2進シーケンスである項シグネ
チャが割り当てられる。領域シグネチャは、領域論理式
から生成されたすべての項シグネチャをスーパーインポ
ーズ(ビット状OR演算)することによって生成され
る。
【0018】図2は領域シグネチャの構造を示し、図3
は問合せのサンプルとそれらのシグネチャを示す。
【0019】図2は意味論的領域“問合せ∧キャッシン
グ”に関するシグネチャの生成を示す。同様に論理積で
あるユーザー問合せの場合は、すべての項がシグネチャ
と関連付けられ、キャッシュ領域と同様なやり方でスー
パーインポーズされ、問合せシグネチャが生成される。
その後、問合せシグネチャはイグネチャ・ファイル内の
各領域シグネチャと突き合わされ、部分応答を得て、問
合せの残り(query remainder)が作られる。
【0020】ここで述べる2つの異なるキャッシング技
法は意味論的領域と問合せ間の異なる意味論的関係を取
り扱う。第1のキャッシング技法は一方が他方を含んで
いる場合に、問合せと意味論的領域との意味論的包含関
係(semantic containment)をうまく処理する。第2のキ
ャッシング技法は、領域が問合せを含んでいない場合ま
たは問合せが領域を含んでいない場合に、処理を意味論
的AND演算(semantic intersection)のより頻度の高
い、複雑なケースへ拡張する。
【0021】3つのケースから成る意味論的包含関係か
ら始める。もし論理式が同等であれば、問合せQは領域
Rと同等である。もし1つまたはそれ以上の項を落とす
ことによって問合せ論理式から領域論理式を得ることが
できれば、領域Rは問合せQを含んでいる。このケース
の場合、問合せに対する応答は領域コンテンツの適当な
サブセットである。逆に、もし1つまたはそれ以上の項
を落とすことによって領域論理式から問合せ論理式を得
ることができれば、意味論的領域Rは問合せQに含まれ
る。さらに、領域包含は応答が領域コンテンツのサブセ
ットであることを意味する。上に述べた3つのケースの
いずれにおいても、領域Rは問合せQに適格とされる。
【0022】SQとSRはそれぞれ問合せシグネチャと領
域シグネチャを表す。意味論的包含関係は、シグネチャ
のビット状比較によって以下のように検出される。領域
包含(SQ⊂SR): 1に設定された問合せシグネチャ
内の各ビットについて、領域シグネチャ内の対応するビ
ットも同様に1に設定される(図3の問合せ2)。同等 (SQ=SR): 領域シグネチャと問合せシグネチ
ャは1に設定された同じビットを有する(図3の問合せ
3)。問合せ包含 (SQ⊃SR): 1に設定された領域シグネ
チャ内の各ビットについて、問合せシグネチャ内の対応
するビットも同様に1に設定される(図3の問合せ
4)。
【0023】シグネチャ・ファイルは問合せに適格とさ
れないほとんどの領域(全部ではない)を除去する。図
3の最後の問合せは誤り選択(false drop)である。誤
り選択は、そのシグネチャは問合せに適格とされるが、
領域には適格とされない意味論的領域である。実際に
は、もし用語“スキー”と“リゾート”にそれぞれシグ
ネチャ“0110 0000 1000”と“0000
0110 0001”を割り当てれば、問合せ“スキ
ー∧リゾート”のシグネチャは“0110 0110
1001”であり、従って、領域“問合せ∧キャッシン
グ”のシグネチャと同等である。
【0024】誤り選択は問合せと領域を詳しく比較する
ことによって除去されるが、もし誤り選択が多ければ、
性能は低下する。誤り選択の確率を最小限にするため
に、シグネチャ内の0と1の予想数を同じにしなければ
ならない。そうすれば、領域または問合せ論理式内の同
数の別個のキーワードの場合、シグネチャの長さが増加
すると、シグネチャ内の1の密度が減少し、それに応じ
て、誤り選択をする機会が減少するであろう。しかし、
それにより、記憶装置オーバーヘッドは増加するであろ
う。もしシグネチャの長さがFビットで、問合せ内の項
の最大限の数がtであれば、項シグネチャ内の1に設定
されたビットの最適の数kopt (一様な確率分布に従っ
て)は、 kopt=(F・ln2)/t (1) である。
【0025】キャッシュ編成 問合せをより迅速に処理
するため、本発明の実施例によるキャッシュ・アーキテ
クチャは領域コンテンツとは別個に領域シグネチャを保
有する(図4参照)。シグネチャ部内の各エントリ(領
域)は、シグネチャのほかに、領域論理式、組(tuple)の
カウンタ、対応する領域コンテンツへのリンク、および
置換関数の値を含んでいる。適格とされた領域はシグネ
チャ部内で検出される。意味論的領域が完全または部分
応答に適格とされたら、領域コンテンツに保存された問
合せとマッチする(ぴったり合う)組がユーザーに報告
される。
【0026】否定 すべての領域論理式は、キーワード
のほかに、それらの否定を含んでいる。否定をもつ問合
せを円滑に処理するために、キーワードのシグネチャと
その否定のシグネチャを関連付けることができる。否定
項に基本的な項シグネチャのビット状否定であるシグネ
チャを割り当てることができるが、項シグネチャ内の1
に設定されたビットの数kはシグネチャの長さFよりかな
り小さいので、これにより、否定項シグネチャの中に1
に設定されたF−kビットが生じるであろう。従って、こ
の解決法は、論理式が否定項を含むどの領域においても
誤り選択の確率を著しく増加させるであろう。この問題
が起きるのを避けるため、キーワードとその否定(およ
び割り当てられたそれらのシグネチャ)はどのシグネチ
ャにおいても1に設定されたkビットをもつ2つの独立
項として扱われる。
【0027】第1の技法は、意味論的包含関係の3つの
ケース、すなわち(1) 同等、(2) 問合せ包含、および
(3) 領域包含を処理する。もし問合せがキャッシュ内の
領域と同等であれば、問合せ応答は領域コンテンツと一
致する。もし領域が問合せを含んでいれば、フィルタと
して使用した問合せ論理式を用いて、領域コンテンツか
ら完全応答を生成することができる。さらに、もし2つ
またはそれ以上の領域が問合せを含んでいれば、それら
の領域はどれも応答を生成することができる。フィルタ
リング・オーバーヘッドを減らすために、アルゴリズム
は領域のコンテンツが最小限の数の組をもつ領域を選択
し、フィルタする。領域包含のケースでは、アルゴリズ
ムは領域コンテンツから部分応答を抽出し、サーバーヘ
送る問合せの残りを生成する。もし問合せに数個の領域
が含まれていれば、それらのどれかまたはすべてが部分
応答を生成することができる。そのような領域の数が大
きいことがあるので、アルゴリズムは最大限の数の組を
もつ上位m個の領域を選択する。
【0028】もし意味論的包含が検出されなければ、そ
のキャッシュは使用されず、問合せはサーバーへ送られ
る。応答を受け取ると、問合せに対応する新しいキャッ
シュ領域が生成される。もしキャッシュがその領域のた
めの自由空間を持っていなければ、アルゴリズムは将来
ほとんど使用する価値のない1つまたは数個の領域をキ
ャッシュから廃棄しなければならない。基本的な置換戦
略として、LRU(leastrecently used )法を使用する。
この戦略は、探索がナビゲーションおよび発見に結びつ
いており、また新しい問合せが前の問合せの改良である
ことが多いウェブに適している。
【0029】上に述べたアルゴリズムのフレームワーク
に関して、3つの重要な問題は、より詳しい分析、すな
わち領域の残り(query remainder)の作成、領域合体(re
sioncoalescing)、およびキャッシュ領域置換(cache re
gion replacement)を必要とする。
【0030】問合せにm個の意味論的領域R1
...,Rmが含まれていると仮定する。問合せの残
りは、Qr=Q−R1−...−Rm=Q∧¬R1∧...
∧¬Rmとして作ることができるが、そのような制約論
理式は、単純化すると、論理和(disjunction)を含む
ことがあり、論理積の問合せだけを受け取るサーバーを
考慮に入れることができない。たとえば、問合せaと領
域a∧b∧cの場合(キーワードを示すため、アルファ
ベットの始めから文字が使用される)、制約論理式a−
a∧b∧cは以下の論理和論理式になる。 a−a∧b∧c=a∧¬(a∧b∧c)=a∧¬b∨a
∧¬c
【0031】問合せの残りを論理和形にする領域とそう
しない領域とを区別するために、問合せ論理式と領域論
理式との差の尺度を導入する必要がある。差は問合せに
存在しない領域論理式内の項の数として定義される。こ
の定義により、R1,...,Rmの集合はグループ(グ
ループ内のすべての領域は問合せとI項差(I=1,
2,....)をもつ)に分けられる。上記例の場合、
領域論理式a∧b∧cは問合せaと2項差を有する。I
=0のケースも可能であり、問合せと領域が同等である
とき、あるいは領域が問合せを含んでいるとき、従って
問合せの残りがヌルであるとき、I=0のケースが現れ
ることに注目されたい。
【0032】差の尺度の助けを借りて、1項差をもつ領
域は問合せの残りの論理積形を保つことができ、以下の
ことが当てはまる。結果1 (残りの構造) キャッシュはm個の領域(論理
式は問合せQの論理式と1項差たとえばa1
2,...,amを有する)を含んでいると仮定する。
問合せの残りQrはQ∧¬a1∧¬a2∧...∧¬am
ある。
【0033】図5は、意味論的包含のケース、すなわち
(a)単一領域包含、(b)複数領域包含、(c)単一
問合せ包含、および(d)複数数問合せ包含を示す。
【0034】問合せ包含と同等のケースでは、問合せの
残りはヌルである。従って、問合せは局部的に処理さ
れ、キャッシュのコンテンツは不変である。問合せ応答
を与える領域は対応する置換値を更新する(以下参
照)。
【0035】領域包含のケースでは、問合せの残りはヌ
ルでなく、さらに、意味論的領域Rに対する補数(compl
ement)である(図5(a)参照)。問合せの残りQr
対する応答を受け取ったとき、その応答をキャッシュに
加える2つの方式がある。非合体戦略では、問合せの残
りのため新しいキャッシュ領域が生成される。合体戦略
では、新しい領域は追加されない。代わりに、残りに対
する応答を用いて領域Rのコンテンツが拡張され、領域
論理式RはQで置き換えられる。上記2つの方式は組を
保存するため同じキャッシュ空間を占有するが、非合体
戦略が2つの領域を使用するのに対し、合体戦略は1つ
の領域のみを使用するので、合体戦略のほうが好まし
い。
【0036】もしm個の意味論的領域R1,...,Rm
が領域包含を生じさせれば(図5(b)参照)、合体戦
略の利点はいっそう大きい。問合せの残りQr=Q−R
1−...−Rmは領域の合体(union)に対する補数(com
plement)であり、合体戦略は、領域R1,...,Rm
と問合せの残りの代わりに、1つの領域(論理式Qと共
に)のみを保有するであろう。領域R1,...,Rm
組の複製物(tuple duplications)を含むことがあるの
で、合体戦略はキャッシュのシグネチャ部とコンテンツ
部の両方で記憶域をより上手に利用する。
【0037】キャッシュのサイズは制限されているの
で、空間を新しい領域に解放するためキャッシュはLR
U領域を廃棄することができる。キャッシュ内の組のペ
ージを置き換えるために計画された標準LRU法は同じ
サイズのことを指しており、1ページまたは1組が置換
単位であり、それは問合せとマッチすることもあり、な
いこともある。
【0038】問合せキャッシングの場合は、状況が違っ
ている。もし領域Rが問合せに適格とされれば、応答内
の領域の掛かり合い(involvement)は異なることがあ
る。もし問合せが領域を含んでいれば(図5(a)参
照)、領域コンテンツからのすべての組が応答に現れる
ので、領域コンテンツは完全に応答と関係がある。対照
的に、もし領域が問合せを含んでいれば(図5(c)参
照)、領域の組の一部のみが問合せとマッチするので、
領域の掛かり合いは部分的である。
【0039】従って、置換関数は問合せ応答内の領域の
掛かり合いを考慮に入れなければならない。もし領域の
掛かり合いが完全であれば、問合せ応答がサーバーから
送られるときのケースのように、領域の新しい置換値は
“最新値”である。もし領域の掛かり合いが部分的であ
り、かつ領域コンテンツ内に問合せとぴったり合わない
組が存在すれば、“最新値”への置換値の変更はぴった
り合った組の部分がどのくらいの大きさかによって決ま
る。「領域の掛かり合い」はp=TR/Tとして測定す
ることができる。ここで、TRは問合せ応答に現れた組
の数であり、TRは領域コンテンツ内の組の総数であ
る。
【0040】一般性を失わずに、「最新値」Vtopは新
しい問合せが出されるたびに1だけ増加されると仮定す
る。もし領域Rの現在の置換値がVR(VR<Vtop)で、
領域の掛かり合いがpであれば、新しい置換関数は、V
R=VR+(Vtop−VR)pとして計算される。もしp=
1であれば、VR=Vtopである。もしp=1/2であれ
ば、VR=(Vtop+VR)/2である。この置換関数
は、問合せに適格とされた、そして適格とされないキャ
ッシュ内のどの領域にも実施できることに留意された
い。もし領域が問合せに適格とされなければ、従って、
掛かり合いp=0であれば、領域置換値は変わらない。
【0041】例1 図6は、領域合体の例、すなわち(a)問合せQ=dが
出される、(b)問合せ後、合体した領域、(c)問合
せb∧d∧fが出される、および(d)問合せ後、更新
された領域を示す。
【0042】キャッシュはa∧b∧cとb∧dとd∧¬
aをもつ3つの領域を含んでいる。図6(a)は、置換
値をもつ領域を示す(Vtop=6と仮定して)。新しい
問合せはdであると仮定する。第2および第3の領域は
領域包含関係を生じさせる。2つの領域論理式は1ワー
ドだけ(第2領域ではb、第3領域では¬a)問合せ論
理式と違っているので、生成された問合せの残りはd∧
a∧¬bになるであろう。完全応答が生成された後、第
2および第3領域と問合せの残りは論理式dをもつ1つ
の領域で置き換えられる(図5(b))。その置換値は
top=7である。
【0043】ここで、問合せはb∧d∧fであると仮定
する(図6(c)参照)。2つの領域b∧dとd∧¬a
は問合せを含んでいる。前者はコンテンツ内により少な
い組を有するので、問合せに対し応答するため前者が選
ばれる。その置換値は、領域コンテンツ内の問合せとぴ
ってり合う組の部分に従って更新される(3から4
へ)。
【0044】キャッシング・アルゴリズム(1) 図7〜9は第1の技法に従ってキャッシングを実施する
処理ステップを示す。 入力. 意味論的領域をもつキャッシュと問合せQ 出力. Qに対する応答と更新したキャッシュ 1. キャッシュ内のすべての領域シグネチャと対比し
て問合せシグネチャを確かめる(ステップs1,s
2)。 2. SQ=SR: もし論理式が問合せと同等である領
域が存在すれば、領域コンテンツを問合せ応答として戻
す。領域の置換関数値を更新し、終了する(ステップs
3,s4)。 3. SQ⊃SR: もし1つまたはそれ以上の領域が問
合せを含んでいれば、最小限の基数をもつ領域を選択す
る。領域コンテンツ内の組を走査し、問合せとマッチす
る組を戻す。領域の置換関数値を更新し、終了する(ス
テップs12〜s15)。 4. SQ⊂SR: もし幾つかの領域が問合せを含んで
いれば、最大限の基数をもつ上位m個の領域
1,...,Rmを選択する。領域R1,...,Rm
領域コンテンツからすべての組を戻し、複製物を廃棄す
る(ステップs5〜s11)。以下に述べるように問合
せの残りを作る(ステップs71〜s77;図8): ・問合せの残りを問合せQに設定する(ステップs7
1)。 ・各領域Riについて、領域包含を規定し、領域論理式
と問合せとの差を計算する(ステップs73)。もし差
が1項aiだけであれば、¬aiをもつ問合せの残りを拘
束する。その問合せの残りをサーバーへ送る。応答を受
け取った後、領域R1,...,Rmを1つの領域Qで置
き換える。Qの置換値としてVtopを置き、終了する。 5. もしそうでなければ(ステップs16〜s20;
図9)、問合せQをサーバーへ送る。応答を受け取った
ら、Qのためキャッシュ内に新しい領域を生成する。そ
の領域に空間を解放するため、問合せQがキャッシュに
適合するまで、最小の置換値をもつ領域を除去する。
【0045】前節で述べたキャッシング技法は意味論的
包含関係(semantic containment)のケースを効率的に処
理する。しかし、意味論的領域が応答の一部を生成でき
るが問合せを含んでいないし、また問合せに含まれてい
ない場合には、前記技法は意味論的AND演算(semanti
c intersection)のより頻度の高い、より複雑なケース
をうまく処理しない。
【0046】図10は、意味論的AND演算の例を示
す。例2 .キャッシュは論理式“∧問合せ”をもつ領域R1
を含んでおり、問合せQは“最適な∧問合せ”であると
仮定する(図10(a)参照)。論理式“最適な∧問合
せ∧キャッシング”とマッチする領域コンテンツ内の組
は問合せとマッチするけれども、包含関係が存在しない
ので、アルゴリズム1はR1を部分応答に利用しない。
さらに,アルゴリズム1はサーバーから問合せQに対す
る応答を受け取ると、同じ論理式“最適な∧問合せ”を
もつ新しい意味論的領域R2を生成する(図10(b)
参照)。2つの意味論的領域R1,R2はそれらのAND
演算論理式“最適な∧問合せ∧キャッシング”とマッチ
する組複製物を含んでいる。言い替えると、意味論的A
ND演算のケースでは、アルゴリズム1は低いキャッシ
ュ使用と高い組複製物レベルを維持する。
【0047】この節では、包含のケースの外に、キャッ
シュの利用を改善し、組複製物を減らすように意味論的
AND演算を処理する拡張キャッシング技法について説
明する。
【0048】意味論的領域Rと問合せQのAND演算
は、それらの論理式AND演算(formula intersection)
R∩Qの論理積によって与えられる。領域シグネチャS
Rと問合せシグネチャSQが与えられたとして、ここで
は、SQとSRのビット状AND演算によって得られたそ
れらのシグネチャAND演算SQ∩SRを使用する。従っ
て、シグネチャSの場合、シグネチャ基数(signature c
ardinality)|S|はシグネチャ内の1に設定されたビ
ットの数を示す。
【0049】意味論的領域Rと問合せQの意味論的AN
D演算の場合には、ここでは、2つの主要なケースを区
別する。すなわち、補数(complement) : Q∩R=φ;論理式AND演算は
ヌルである。たとえば、問合せa∧bは領域a∧¬bに
対する補数である。従って、領域は問合せに対する応答
の組を含んでいない。しかし、補数のケースでは、領域
合体は可能である。上記の問合せと領域の場合、合体は
論理式aをもつ1つの領域をもたらすであろう。AND演算(intersection): Q∩R≠φ;論理式AN
D演算はヌルでない。以下の2つのサブケースが存在す
る。すなわち、 ・問合せおよび領域の論理式はAND演算に現れる幾つ
かの共通項を有する(たとえば領域“キャッシング∧問
合せ”と問合せ“最適な∧問合せ”は共通項“問合せ”
を有する)。 ・問合せおよび領域の論理式は共通語を持たない。たと
えば、領域aと問合せbは共通項を持たないが、それら
のAND演算a∧bは空でなく、従って領域は部分応答
に貢献できる。
【0050】シグネチャ・ファイル内の意味論的AND
演算. もし問合せQと領域Rが幾つかの共通項を持っ
ていれば、それらのシグネチャは共通項のシグネチャに
対応する1に設定されたビットを有する。論理式QとR
が持つ共通項がを多ければ多いほど、一緒に1に設定さ
れるビットの数は大きいので、2つのシグネチャ内の1
に設定された対応するビットの数|SQ∩SR|によっ
て、RとQの意味論的AND演算を測定することができ
る。しかし、これは常に真ではない。たとえば、論理式
aをもつ領域と問合せbの場合、それらのシグネチャA
ND演算は1に設定されたビットを持つことはない。し
かし、領域は論理式ab∧bとマッチする組をユーザー
に報告することができる。
【0051】本節の残りの部分では、問合せによって一
部が共有されたどの領域が部分応答に貢献し、そして問
合せの残りを拘束できるかを、シグネチャ・ファイル法
がどのように迅速に検出できるかを示す。意味論的AN
D演算に関する以下の検討は、同等または問合せ包含は
キャッシュ内で検出されないこと、従って、問合せの残
りはヌルでないと仮定していることに留意されたい。
【0052】意味論的包含と同様に、論理積問合せは許
されるだけであるので、問合せと共有部分をもつ領域の
すべてが問合せの残りに貢献できるのではない。どの領
域が貢献できるかを検出するために、前に導入した項差
を再び使用する。さらに、意味論的包含のために導出し
たが、意味論的AND演算に完全に適用できる残りの構
造を使用する。すなわち、もしキャッシュがm個の領域
を含んでおり、その論理式は問合せQに含まれていない
が、1項差たとえばa1,a2,...,amを有してい
れば、問合せの残りQrは、Q∧¬a1∧¬a2∧...
∧¬amとして作ることができる。
【0053】例2(続き) 領域“キャッシング∧問合
せ”は問合せ“最適∧問合せ”と1項差を有するので、
領域は部分“最適∧問合せ∧キャッシング”をユーザー
に報告し、問合せの残り“最適∧問合せ∧¬キャッシン
グ”を作ることができる。同様に、領域aは問合せbと
1項差を有する。部分a∧bは報告され,問合せの残り
はb∧¬aである。
【0054】問合せの残りを拘束する場合に問合せと1
項差をもつ意味論的領域のこの著名な特徴は、キャッシ
ュのコンテンツに対する問合せの二重走査評価をもたら
す。領域シグネチャにわたる最初の高速走査は、問合せ
の残りを迅速に作って、最初の部分応答を生成するため
1項差をもつすべての領域を識別する。第2の低速走査
は、他のAND演算が部分応答を質的に向上させること
ができるかを調べる。領域シクネチャにわたる2つの走
査は領域シグネチャに適用されるフィルタリング関数に
違いがある。
【0055】最初の走査のときにフィルタされる各領域
Rは問合せとせいぜい1項差をもつべきである。従っ
て、もし領域シグネチャが1に設定された|SR|ビッ
トをもち、問合せシグネチャとそのAND演算が|SR
∩SQ|ビットをもっていれば、2つの数の差はせいぜ
いkビットにすべきである。ここで、kは項シグネチャ
内の1に設定されたビットの数である。以下の結果はこ
の事実を明白に述べている。結果2 もし領域Rが問合せQと1項差を有していれ
ば、 |SR∩SQ|≧|SR|−k (2) である。
【0056】最初の走査は領域シグネチャについて条件
(2)を確かめる。もし条件が領域シグネチャに当ては
まれば、領域論理式が1項差に関して調べられる。意味
論的包含と同様に、もし条件(2)は当てはまるが、領
域論理式が1項差を与えなければ、誤り選択が生じる。
多くの実験を行った結果、論理式(1)で計算したシグ
ネチャ・ファイルのパラメータを適切に選択することに
よって、条件(2)を確かめる時の誤り選択の数を少な
く保つことができることが判った。
【0057】第2の走査は、論理式が2項以上の差を有
し、問合せの残りを拘束することができない領域を検出
する。1項差との類推により論理式が問合せとI(I≧
2)項差をもつ領域は条件(3)を満たす。 |SR∩SQ|≧|SR|−k・I (3) しかし、この条件は、第2の走査に全面的に用いること
ができない。第1に、条件(3)は、増加するkの値に
対してはその重要性を失う。実際には、典型的なウェブ
問合せまたは領域論理式は3または4項の平均を有して
おり、条件(3)は|SR∩SQ|≧0に簡単化されるこ
とが多い。この簡単化された条件はすべての領域シグネ
チャを掃引し、多くの誤り選択と高いフィルタリング・
オーバーヘッドを引き起こすであろう。第2に、問合せ
と2またはそれ以上の項差をもつ領域は,通例、1項差
をもつ領域と比べて応答にほとんど貢献しない。第3
に、貢献する組は、それらの論理式が問合せの残りから
除外されなかったので、とにかく問合せの残りに対する
応答の中に複製されないであろう。
【0058】それらの引数を考慮に入れて、第2の走査
に対する以下の2つの条件だけを検討する。 ・|SR∩SQ|≧|SR|−2k:この条件は主として
問合せと2項差をもつ領域をフェッチする。従って,よ
り多くの項差をもつ幾つかの領域はフェッチされない。 ・|SR∩SQ|≧0:すべての領域論理式はこの条件を
満たす。従って、この条件は多くの誤り選択を引き起こ
す。しかし、この条件は問合せとマッチするキャッシュ
内のすべての組を検索する。
【0059】ほとんどのケースでは、誤り選択の数と検
索した組の数との間で良好のトレードオフが得られるの
で、最初のオプションのほうが好ましい。第2のオプシ
ョンは、キャッシュが小さい場合や、アプリケーション
が問合せとマッチするキャッシュからすべての組を検索
しようとしているときに使用できる。
【0060】領域合体と領域置換 意味論的AND演算
は合体戦略に対し新しい拡張部分を与える。一体化した
論理式が論理積でありさえすれば、合体戦略は問合せと
領域を合体することができる。例えば、合体戦略は問合
せa∧bと領域a∧¬bを1つの領域に合体することが
できる。次の3つの条件:1)領域が問合せと1項差、
たとえばa1を有すること、2)対称的に、問合せが領
域と1項差、たとえばa2を有すること、3)a1はa2
の否定であること、が守られてさえいれば、上記操作を
行うことができる。明らかに、そのような状況は同じ条
件2)で検出して、あとで処理することができる。
【0061】置換戦略は、意味論的包含(semantic cont
ainment)のために計画されたので、意味論的AND演算
(semantic intersection)に対しても変わらない。新し
い問合せが出されたとき、キャッシュ内のどの意味論的
領域も応答内の領域掛かり合い(region involvement)に
比例してVtopの方に向かって更新された置換値を有し
ている。
【0062】第2キャッシング技法 ここに開示する第
2キャッシング技法は、問合せと意味論的領域間の2つ
の関係、すなわち前に述べた意味論的包含と本節で述べ
る意味論的AND演算を扱う。さらに、この技法は、問
合せ包含を与える領域と意味論的AND演算を与える領
域とを区別しないで、それらを一様に処理して1項差を
もつ領域を識別する。
【0063】キャッシング・アルゴリズム(2) 図11〜14は、第2の技法に従ってキャッシングを実
施する処理ステップを示す。 入力.意味論的領域をもつキャッシュと問合せQ 出力.Qに対する応答と更新したキャッシュ 1.(最初の走査) キャッシュ内の領域シグネチャと
対比して問合せシグネチャを調べる(ステップs2
1)。 2.SQ=SR:もし論理式が問合せと同等である領域が
存在すれば、領域コンテンツを応答として戻す。領域の
置換値を更新し(s24,s24)、終了する。 3.SQ∩SR=SQ:もし1つまたはそれ以上の領域が
問合せを含んでいれば、最小限の基数(minimal cardina
lity)をもつ領域を選択する。領域コンテンツを走査
し,問合せとマッチする組を戻す。領域の置換値を更新
し(s25〜s28)、終了する。 4.|SQ∩SR|≧|SR|≧k.問合せと1項差をも
つすべての領域、たとえばR0,...,Rm(m≧0)
を識別する。R0,...,Rmの意味論的領域内の問合
せとマッチする組を戻し、複製物を廃棄する(ステップ
s29〜s36)。問合せの残りQr=Q∧¬R0...
∧¬Rkを以下のように作る(ステップs311〜s3
15;図12): ・問合せの残りをQに設定する(ステップs312)。 ・各領域Ri(i=0,...,m)について、問合せ
との差aiを計算し(ステップs314)、¬aiをもつ
問合せの残りを拘束する。問合せの残りをサーバーへ送
る。 5.(第2の走査)条件Tをもつ領域シグネチャを走査
する(ステップs331〜s336、図13)。Tは|
R|−2k≧|SR∩SQ|<|SR−kと、0≦|SR
∩SQ|<|SR|−kとの選択である。フェッチした各
領域Rについて、Q∩R論理式AND演算を調べる(ス
テップs332)。もし論理式がヌルでなければ、問合
せとマッチする領域コンテンツからの組を報告する(ス
テップs335)。 6.問合せの残りQrに対する応答を受け取ったら、以
下のようにキャッシュを更新する(ステップs351〜
s355、図14)。 ・もし領域Ri1...,Ripが問合せを含んでいれば、
それらを論理式Qをもつ新しい領域で置き換える。 ・もし領域Rが問合せQに対する補数であり、論理式R
∪Qが論理積(conjunction)であれば、RとQを新しい
領域で置き換える。 ・さもなければ、論理式Qrをもつキャッシュに新しい
領域を加える。 ・部分応答に貢献するすべての領域について置換値を更
新する。
【0064】例3 図15は、意味論的AND演算のための領域合体:
(a)問合せc∧dが出される、及び(b)問合せの
後、を示す。
【0065】キャッシュは論理式a∧b,c∧d∧¬e
をもつ領域を含んでおり、ユーザー問合せはb∧cであ
ると仮定する。図15(a)は、置換値(Vtop=7と
仮定する)をもつ2つの領域と問合せを示す。最初の走
査は、領域a∧bが問合せと1項差を有し、そして問合
せの残りQr(b∧c∧¬a)を拘束できることを検出
する。問合せとマッチする領域コンテンツからのすべて
の組は部分応答を与える。第2の走査は、領域c∧d∧
¬eについて意味論的AND演算を検出する。領域コン
テンツが走査される。問合せとマッチする組は部分応答
を完成させる。
【0066】問合せの残りQrに対する応答が受け取ら
れると、論理式c∧d∧¬eをもつ新しい領域が生成さ
れる。置換値はVtop=8に等しい。同様に、a∧bと
c∧d∧¬eは共に、応答への貢献に比例する更新され
た置換値を有する{図15(b)参照}。
【0067】以上、ウェブ論理積問合せをキャッシュす
るための新しいメカニズムを提示した。このメカニズム
はシグネチャ・ファイルに基づいており、過去の問合せ
を効率的に再利用することを考慮に入れている。2つの
キャッシング・アルゴリズムは、ユーザー問合せと意味
論的領域との意味論的包含関係とAND演算関係をうま
く処理する。
【図面の簡単な説明】
【図1】マシンのネットワークを示す略図である。
【図2】領域シグネチャの構造を示す図である。
【図3】サンプルの問合せとそれらのシグネチャを示す
図である。
【図4】適当なキャッシュ・アーキテクチャを示す図で
ある。
【図5】意味論的包含のケース −(a)単一領域包
含;(b)複数領域包含;(c)単一問合せ包含;およ
び(d)複数問合せ包含を示す図である。
【図6】領域合体の例 −(a)問合せQ=dが出され
る;(b)問合せの後、合体された領域:(c)問合せ
b∧d∧fが出される;および(d)問合せの後、更新
された領域を示す図である。
【図7】第1の技法に従ってキャッシングを実施する処
理ステップを示すフローチャートの前部分である。
【図8】同フローチャートの中間部分である。
【図9】同フローチャートの後部分である。
【図10】(a),(b)は意味論的AND演算の例を
示す図である。
【図11】第2の技法に従ってキャッシングを実施する
処理ステップを示すフローチャートの第1部分である。
【図12】同フローチャートの第2部分である。
【図13】同フローチャートの第3部分である。
【図14】同フローチャートの第4部分である。
【図15】意味論的AND演算のための領域合体 −
(a)問合せc∧dが出される、(b)問合せの後、を
示す図である。
【符号の説明】
21 ネットワーク 22 受信マシン 24 中間マシン 26 送信マシン

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 メモリを備え、該メモリ内の1セットの
    ロケーションがキャッシュを形成し、該キャッシュは、
    1つまたはそれ以上の意味論的領域から成る1セットの
    各々について、コンテンツを含んでおり、該コンテンツ
    は1つまたはそれ以上のデータアイテムを含んでいるシ
    ステムを用いて、問い合わせに対する応答を得る方法で
    あって、(a)問合せQを得ること、(b)前記問合せ
    Qを用いて問合せシグネチャSQを得ること、(c)前
    記問合せシグネチャSQと少なくとも1つの前記意味論
    的領域についての領域シグネチャSRとを用いて、前記
    問合せQに対し、1つの前記意味論的領域のコンテンツ
    から少なくとも1つのデータアイテムを含む応答を得る
    こと、から成ることを特徴とする方法。
  2. 【請求項2】 請求項1に記載の方法において、 更に、各意味論的領域について、前記領域シグネチャS
    Rを含んでおり、 前記ステップ(c)は、 (c1)任意の意味論的領域についてSQ=SRかどうか
    を決定し、そうでない場合には、任意の意味論的領域に
    ついてSQ⊃SRかどうかを決定し、そうでない場合に
    は、任意の意味論的領域についてSQ⊂SRiかどうかを
    決定すること、および、 (c2)もし前記(c1)が1領域についてSQ=SR
    決定したならば、その領域のコンテンツを前記問合せに
    対する応答として得ること、もし前記(c1)が1つま
    たはそれ以上の領域についてSQ⊃SRと決定したなら
    ば、1つの領域のコンテンツにおいて前記問合せにマッ
    チするデータアイテムを含む応答を得ること、もし前記
    (c1)が1つまたはそれ以上の領域についてSQ⊂S
    Riと決定したならば、少なくとも1つの領域のサブセッ
    トのコンテンツからデータアイテムを含む応答を得るこ
    と、 から成ることを特徴とする方法。
  3. 【請求項3】 請求項1に記載の方法において、 各項(ターム)は、セットされるほぼkビットを有し、
    前記キャッシュは各意味論的領域について更に前記領域
    シグネチャSRを包含し、 前記ステップ(c)が、 (c3)任意の意味論的領域についてSQ=SRかどうか
    を決定し、そうでない場合には、任意の意味論的領域に
    ついてSQ∩SR=SRかどうかを決定し、そうでない場
    合には、任意の意味論的領域について|SQ∩SR|≧|
    R|−kかどうかを決定すること、および、 (c4)もし前記(c3)が1領域についてSQ=SR
    決定したならば、その領域のコンテンツを問合せQに対
    する応答として得ること、もし前記(c3)が1つまた
    はそれ以上の領域についてSQ∩SR=SRと決定したな
    らば、1つの領域のコンテンツにおいて前記問合せQに
    マッチするデータアイテムを含む応答を得ること、もし
    前記(c3)が1つまたはそれ以上の領域について|S
    Q∩SR|≧|SR|−kと決定したならば、少なくとも
    1つの領域のサブセットのコンテンツからデータアイテ
    ムを含む応答を得ること、 から成ることを特徴とする方法。
JP14107999A 1998-05-29 1999-05-21 問合せに対する応答を得る方法 Expired - Fee Related JP4418555B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP98401312A EP0961210A1 (en) 1998-05-29 1998-05-29 Signature file based semantic caching of queries
EP98401312:8 1998-05-29

Publications (2)

Publication Number Publication Date
JP2000057172A true JP2000057172A (ja) 2000-02-25
JP4418555B2 JP4418555B2 (ja) 2010-02-17

Family

ID=8235391

Family Applications (1)

Application Number Title Priority Date Filing Date
JP14107999A Expired - Fee Related JP4418555B2 (ja) 1998-05-29 1999-05-21 問合せに対する応答を得る方法

Country Status (3)

Country Link
US (1) US6347314B1 (ja)
EP (1) EP0961210A1 (ja)
JP (1) JP4418555B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008541272A (ja) * 2005-05-09 2008-11-20 プロビラ,インク. 署名生成および関連性を有するマッチングエンジン

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7844594B1 (en) 1999-06-18 2010-11-30 Surfwax, Inc. Information search, retrieval and distillation into knowledge objects
US20020078300A1 (en) * 1999-08-16 2002-06-20 Chanda Dharap Semantics-based caching policy to minimize latency
JP2002149699A (ja) * 2000-11-10 2002-05-24 Hitachi Ltd データ検索装置
US7113943B2 (en) * 2000-12-06 2006-09-26 Content Analyst Company, Llc Method for document comparison and selection
US7099871B2 (en) * 2001-05-04 2006-08-29 Sun Microsystems, Inc. System and method for distributed real-time search
US6961723B2 (en) * 2001-05-04 2005-11-01 Sun Microsystems, Inc. System and method for determining relevancy of query responses in a distributed network search mechanism
US6950821B2 (en) * 2001-05-04 2005-09-27 Sun Microsystems, Inc. System and method for resolving distributed network search queries to information providers
US7171415B2 (en) * 2001-05-04 2007-01-30 Sun Microsystems, Inc. Distributed information discovery through searching selected registered information providers
US7013303B2 (en) * 2001-05-04 2006-03-14 Sun Microsystems, Inc. System and method for multiple data sources to plug into a standardized interface for distributed deep search
US6934702B2 (en) * 2001-05-04 2005-08-23 Sun Microsystems, Inc. Method and system of routing messages in a distributed search network
US7475416B2 (en) * 2001-06-13 2009-01-06 Microsoft Corporation System and methods for searching interactive broadcast data
US20090006543A1 (en) * 2001-08-20 2009-01-01 Masterobjects System and method for asynchronous retrieval of information based on incremental user input
US20070156665A1 (en) * 2001-12-05 2007-07-05 Janusz Wnek Taxonomy discovery
US20030208761A1 (en) * 2002-05-02 2003-11-06 Steven Wasserman Client-based searching of broadcast carousel data
US7499910B2 (en) * 2002-06-27 2009-03-03 Siebel Systems, Inc. Detecting and processing cache hits for queries with aggregates
US7487149B2 (en) * 2004-03-10 2009-02-03 Oracle International Corporation Method and apparatus for providing query-level security in a database system
US7676453B2 (en) * 2004-04-22 2010-03-09 Oracle International Corporation Partial query caching
US20060048053A1 (en) 2004-08-30 2006-03-02 Xerox Corporation Individually personalized customized report document system
US20060048042A1 (en) * 2004-08-30 2006-03-02 Xerox Corporation Individually personalized customized report document system with user feedback
US7315854B2 (en) * 2004-10-25 2008-01-01 International Business Machines Corporation Distributed directory replication
US20060242190A1 (en) * 2005-04-26 2006-10-26 Content Analyst Comapny, Llc Latent semantic taxonomy generation
US7844566B2 (en) * 2005-04-26 2010-11-30 Content Analyst Company, Llc Latent semantic clustering
US7840553B2 (en) * 2005-10-07 2010-11-23 Oracle International Corp. Recommending materialized views for queries with multiple instances of same table
US7747612B2 (en) * 2005-10-31 2010-06-29 Yahoo! Inc. Indication of exclusive items in a result set
US7747613B2 (en) * 2005-10-31 2010-06-29 Yahoo! Inc. Presentation of differences between multiple searches
US7747614B2 (en) * 2005-10-31 2010-06-29 Yahoo! Inc. Difference control for generating and displaying a difference result set from the result sets of a plurality of search engines
US8239383B2 (en) * 2006-06-15 2012-08-07 International Business Machines Corporation System and method for managing execution of queries against database samples
US9112873B2 (en) * 2007-04-10 2015-08-18 Apertio Limited Alias hiding in network data repositories
US8782085B2 (en) * 2007-04-10 2014-07-15 Apertio Limited Variant entries in network data repositories
US8645409B1 (en) 2008-04-02 2014-02-04 Google Inc. Contextual search term evaluation
CN101937442A (zh) * 2009-06-29 2011-01-05 国际商业机器公司 用于缓存术语数据的方法和系统
US9053200B2 (en) * 2009-12-14 2015-06-09 Appfolio, Inc. Systems and methods for sorting, grouping, and rendering subsets of large datasets over a network
US8515922B2 (en) 2011-06-17 2013-08-20 International Business Machines Corporation Deduplicated caching of queries for green IT management
US9292341B2 (en) * 2013-10-16 2016-03-22 Google Inc. RPC acceleration based on previously memorized flows
CN111104666B (zh) * 2018-10-25 2023-09-05 戴尔产品有限公司 用于访问服务的方法、设备和计算机可读介质
EP4004758A1 (en) 2019-07-31 2022-06-01 Sindice Limited t/a Siren Semantic caching of semi-join operators in shared-nothing and log-structured databases
CN116541420B (zh) * 2023-07-07 2023-09-15 上海爱可生信息技术股份有限公司 向量数据的查询方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2000006C (en) * 1989-01-23 1994-07-12 Walter W. Chang Combinatorial signatures for data encoding and searching
JP3132738B2 (ja) * 1992-12-10 2001-02-05 ゼロックス コーポレーション テキスト検索方法
US6012085A (en) * 1995-11-30 2000-01-04 Stampede Technolgies, Inc. Apparatus and method for increased data access in a network file object oriented caching system
US5819286A (en) * 1995-12-11 1998-10-06 Industrial Technology Research Institute Video database indexing and query method and system
US5913205A (en) * 1996-03-29 1999-06-15 Virage, Inc. Query optimization for visual information retrieval system
US5819288A (en) * 1996-10-16 1998-10-06 Microsoft Corporation Statistically based image group descriptor particularly suited for use in an image classification and retrieval system
US6035303A (en) * 1998-02-02 2000-03-07 International Business Machines Corporation Object management system for digital libraries

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008541272A (ja) * 2005-05-09 2008-11-20 プロビラ,インク. 署名生成および関連性を有するマッチングエンジン

Also Published As

Publication number Publication date
EP0961210A1 (en) 1999-12-01
US6347314B1 (en) 2002-02-12
JP4418555B2 (ja) 2010-02-17

Similar Documents

Publication Publication Date Title
JP4418555B2 (ja) 問合せに対する応答を得る方法
US11580109B2 (en) Method and apparatus for stress management in a searchable data service
Chidlovskii et al. Semantic caching of web queries
US6795820B2 (en) Metasearch technique that ranks documents obtained from multiple collections
US7627613B1 (en) Duplicate document detection in a web crawler system
KR100699977B1 (ko) 데이터베이스 검색 시스템에서 관련 검색을 식별하기 위한방법 및 장치
Amiri et al. DBProxy: A dynamic data cache for Web applications
Chidlovskii et al. Semantic cache mechanism for heterogeneous web querying
US8280868B2 (en) Method and system for monitoring domain name registrations
EP1974295B1 (en) Method and apparatus for a distributed file storage and indexing service
US7392238B1 (en) Method and apparatus for concept-based searching across a network
Luo et al. Active query caching for database web servers
US7657515B1 (en) High efficiency document search
EP1050830A2 (en) System and method for collaborative ranking of search results employing user and group profiles
WO2001040949A1 (en) Dynamic caches with miss tables
JP2006511876A (ja) トランスペアレントなネットワークのエッジ・データ・キャッシュ
Wills et al. Studying the impact of more complete server information on web caching
US7836108B1 (en) Clustering by previous representative
Rosenfeld An implementation of the Annis 2 query language
Tsikrika et al. Merging techniques for performing data fusion on the web
Chidlovskii et al. Signature file methods for semantic query caching
Yao et al. Using user access patterns for semantic query caching
US8489560B1 (en) System and method for facilitating the management of keyword/universal resource locator (URL) data
Amiri et al. A self-managing data cache for edge-of-network web applications
US20050033823A1 (en) Apparatus, method and computer program product for resource locator using queries

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060519

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090601

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090831

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091029

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091130

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121204

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131204

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees