JP2003518293A - インデクシングシステムおよび方法 - Google Patents

インデクシングシステムおよび方法

Info

Publication number
JP2003518293A
JP2003518293A JP2001547303A JP2001547303A JP2003518293A JP 2003518293 A JP2003518293 A JP 2003518293A JP 2001547303 A JP2001547303 A JP 2001547303A JP 2001547303 A JP2001547303 A JP 2001547303A JP 2003518293 A JP2003518293 A JP 2003518293A
Authority
JP
Japan
Prior art keywords
index
server
database
page
indexing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001547303A
Other languages
English (en)
Other versions
JP4873813B2 (ja
Inventor
ロバート・ジェイムズ・スティール
デイビッド・マーティン・ウォード・パワーズ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
YOURAMIGO Pty Ltd
Original Assignee
YOURAMIGO Pty Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by YOURAMIGO Pty Ltd filed Critical YOURAMIGO Pty Ltd
Publication of JP2003518293A publication Critical patent/JP2003518293A/ja
Application granted granted Critical
Publication of JP4873813B2 publication Critical patent/JP4873813B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

(57)【要約】 中央インデックス用のデータアイテムにアクセスするためにサーバ上でデータを処理し、該データアイテムがネットワークアドレスおよび用語を含むことと、該データアイテムを含むインデックスファイルをコンパイルすることと、該インデックスファイルを中央インデックスに伝送することとを含む、サーバから入手可能なデータのインデックスを作成するための方法。処理は、データ内のデータベース照会文の位置を突き止めることを含んでよく、データアイテムは該文用の入力組を含む。インデックスは、サーバからアクセス可能であり、ページを生成するためのプログラムへの提出用に同期ページと入力組を作成するためのプログラム用のプログラムアドレス、および動的ページを特定し、探索用語に対応する組を特定するサーチエンジンを含むページエントリを含む。

Description

【発明の詳細な説明】
【0001】 (発明の分野) 本発明は、サーバからアクセス可能なデータのインデックスを作成する方法お
よびシステムに関し、特に、インターネット上に含まれる情報用のインデックス
を作成する方法およびシステムに関する。
【0002】 (発明の背景) インターネット等の分散型通信網の特徴の1つとしては、無制限のアクセスを
提供し、かつネットワーク上でデータを自由に公表することが挙げられる。しか
し、ネットワークが拡大するにつれて、ユーザが必要とするデータの位置を突き
止めることはきわめて困難になり、データに対する分かりやすいまたは有効なイ
ンデックスまたはポータルを維持することはなおさらに難しくなっている。デー
タは、テキスト、グラフィックス、ビデオ、音声およびプログラムデータまたは
コードを含んでもよい。効果的に中央制御権威を持たないインターネットの成長
は、現在では必要とされるデータの位置を突き止めることが、無駄骨を折ること
に類似するほどである。それにも関わらず、数多くの企業はサーチエンジンおよ
びインターネットデータ、特にワールドワイドウェブ上で公表されるデータへの
ポータルを維持する。
【0003】 大部分のサーチエンジンは、エンジンが、キーワードなどの照会用語に基づい
て探索できるウェブページのインデックスに依存している。該インデックスは、
通常、ウェブアドレス、すなわち全域資源位置指示子(URL)のデータベース
によって提供され、テキスト情報の用語は、ウェブに掲載されるテキストの各ペ
ージを表すために使用される。
【0004】 Lycos、Hotbot等の多くのサーチエンジンは、典型的には通常のH
TTPプロトコルによって、ウェブページを検索するためのスパイダプログラム
を使用してインデックスを獲得し、索引付けしなければならないこのページから
データを抽出する。同時に、他のページのリンクも注記され、プロセスはその後
新規に発見されたリンクについて繰り返される。これは自動的に実行されるため
、ビジットされたウェブサイトの管理者または作者からの協力は必要とされない
。しかしながら、ページは、処理のためにすべて中央サイトに持ち込まれ、処理
されるデータの量のために、新規のページまたは修正されたページが、処理され
るには数ヶ月待機しなければならない場合がある。
【0005】 Aliwebなどの分散されたインデクサが利用可能である。このシステムで
は、インデクシング情報は、システム管理者またはページの作者によってテンプ
レートの中に手動で入力される。それから、ページは検索のためにスパイダプロ
グラムが使用できる。ページについての情報は人間によって生成されるため、ペ
ージコンテンツについての情報は、通常非常に正確である。しかしながら、多く
の管理者および作者はこのような情報を提供する態勢になく、多くの場合テンプ
レートを完成させるために十分な時間を費やさないため、インデックスはしばし
ば不完全且つ時代遅れである。
【0006】 Yahooによって最初に提供されたサーチエンジンなどの別の種類のサーチ
エンジンでは、インデックスは、人間によるページの手作業の検査で構築される
。検査は手作業であるため、特定のトピックの下のウェブページの分類は、ペー
ジの質のレーティングがそうであるように、通常、かなり正確である。しかしな
がら、使用できる人々の数が限られ、カバーされるウェブの範囲および新しいウ
ェブページと修正されたページがレビューされる速度は制限されている。
【0007】 Fishなどのクライアントベースのサーチエンジンは、個人の探索者または
ウェブユーザを拠点としている。彼らは、合意可能なユーザインタフェースにつ
いて、および個人専用される探索についてさらに大きな範囲を提供する。しかし
ながら、彼らは、ウェブのかなりの部分を独立して探索する場合に大量の帯域幅
を無駄にする可能性がある。
【0008】 MetaCrrawlerやDogpileなどのいくつかのサーチエンジン
は、探索要求を受信すると、他のサーチエンジンの探索サイトを探索し、これら
からの結果を受信し、ユーザに表示するために結果を統合する(これがメタサー
チ(metasearch)として知られている)。これが、いくつかのサーチ
エンジンは、他のサーチエンジンによってビジットされていないサイトからのデ
ータを含むので、ウェブのより優れたカバレージにつながる。しかしながら、こ
れは非効率的なアプローチであり、さまざまな探索インデックスの間にはかなり
の重複があるため、ユーザに結果を戻す際に追加の遅延もあり、関連する順序で
結果を格付けするために使用できる方法は限られている。
【0009】 Harvestなどの別の種類の分散型サーチエンジンは、サイトを十分に調
べ、そのコンテンツに索引付けをし、それらをサイトで格納されているファイル
に入れるために、さまざまなウェブサーバでギャザラ(Gatherers)と
呼ばれる装置を有する。これらのインデックスファイルは、ある特定の探索につ
いてユーザによって起動されるBrokersのような既知のプログラムによっ
て検索できる。このアプローチは、帯域幅の使用に関して節約するが、スパイダ
は、依然として、サーバに記憶されているインデックスが定期的に更新されてい
ることを確実にするために、定期的にサイトをビジットしなければならない。
【0010】 インターネット上で使用可能なウェブページのインデクシングは、数多くの困
難を呈する。これらは、インターネット自体のダイナミズム、およびインターネ
ット上での情報のダイナミズムを含む。これが、ウェブについて完全に最新で、
完成したインデックスがないという状況を生じさせる。
【0011】 他の重要な問題とは、(90%を超えると推定される)インターネット上での
情報の大半が、動的ページ用の基礎として使用されるデータベース内に位置して
いるという点である。動的ページとは、htmlで手作業によって作成されない
が、むしろそれらを構成するhtmlがプログラムまたはスクリプトによって「
動的に」作成されるか、あるいは情報が、例えばJavaを使用するなど、なん
らかの他の方法で提示されるページのことである。これらのページは、ユーザが
照会を提出する時点でプログラムによって構築される。スパイダなどの最新のイ
ンデクシング方法は、動的ページに、または動的ページを作成するために使用さ
れるデータベースにも索引付けをすることはできない。
【0012】 (発明の概要) 本発明に従って、サーバからアクセス可能なデータのインデックスを作成する
ための方法であって、前記サーバ上でデータを処理して中央インデックス用のデ
ータアイテムにアクセスすることであって、前記データアイテムがネットワーク
アドレスと用語を含むことと、 前記データアイテムを含むインデックスファイルをコンパイルすることと、 前記インデックスファイルを前記中央インデックスに伝送することとを含む、
方法を提供する。
【0013】 また本発明は、本方法のステップを実行するための構成要素を有するエージェ
ントを提供する。
【0014】 好ましくは、本方法は、 前記中央インデックスで、インデックスデータベースを有する前記インデック
スファイルを受信することと、 前記インデックスファイル内のエントリに基づいて前記インデックスデータベ
ースを維持することであって、前記インデックスデータベースがサーチエンジン
による使用のために適応されていることとをさらに含む。
【0015】 また本発明は、 ページを作成するためのプログラムに提出するために動的ページおよび入力組
を作成するためのプログラム用プログラムアドレスを含むページエントリと、 動的ページを特定し、検索用語に対応する組を特定する探索エントリと、 を含む、サーバからアクセス可能なデータのインデックスを提供する。
【0016】 また本発明は、 探索照会の探索用語に対応する動的ページを特定するために探索エントリにア
クセスするための手段と、 特定された動的ページのためにアドレスを作成するためにページエントリにア
クセスするための手段であって、前記アドレスが前記プログラムアドレスおよび
前記組に基づいて作成される手段とを含む、インデックス上で利用可能なサーチ
エンジンを提供する。
【0017】 また本発明は、エージェント、インデックスおよびサーチエンジンを含むイン
デクシングシステムを提供する。
【0018】 また本発明は、 少なくとも1つのサイトへのアクセスを提供するためのサーバと、 サイトに関係するデータのインデックスファイルを作成するためのサーバエー
ジェントと、 インデックスファイルからのインデックス情報を記憶するための中央インデッ
クスであって、サーバエージェントがインデックスファイルの転送のために中央
インデックスとの通信を開始する中央インデックスとを含む、インデクシングシ
ステムを提供する。
【0019】 また本発明は、 サーバが提供するインデクシングサイトにサーバエージェントを提供すること
と、 サイトのサイトデータを表すインデックスファイルをコンパイルすることと、 中央インデックスにファイルを伝送し、そこではサーバエージェントがインデ
ックスファイルの転送のために中央インデックスとの通信を開始することとを含
む、検索付けする方法を提供する。
【0020】 また本発明は、 動的ページを作成する際にアクセスされる少なくとも1つのデータベースを特
定することと、 データベースのパラメータおよび環境変数を求めることと、 ページの入力フィールドとデータベース間の関係性を決定することと、 入力に対応するデータベースの列を特定することと、 インデックスファイル内で入力を介してアクセスできるデータベースの行のデ
ータを記憶することとを含む、動的ページを索引付けするための方法を提供する
【0021】 また本発明は、前記ユーザコンピュータシステム上に記憶されるネットワーク
アドレスの変更を決定するために、インデクシングシステムのインデックスと通
信するための手段を有する、ユーザコンピュータシステム上で実行可能なブラウ
ザエージェントを提供する。
【0022】 以下で、本発明の好ましい実施形態を、添付の図面を参照しながら例のみを用
いて説明する。
【0023】 (発明の好ましい実施形態の詳細な説明) 分散方法でインデクシングデータをレビューし、照合するが、この中央記憶は
標準的な方法で分散またはミラー化することができるが、ユーザによるアクセス
のためのインデクシングデータを中心的に記憶するインターネット用のインデク
シングシステムが後述される。該インデクシングシステムは、中央記憶装置を提
供する中央インデックス(CI)214と通信する、図2に図示されるような、
数多くのサーバベースエージェント(SBA)208、222を含む。システム
は、探索要求を処理するときに中央インデックスを使用する中央サーチエンジン
(CSE)216も含む。エージェント208、222は、サーバ製造業者によ
って分散される各ハイパテキスト転送プロトコル(HTTP)とともに含むこと
ができる。エージェントは、追加済み新規サイト/ページ、削除済み旧ページ、
または修正された旧ページなどのそのローカルサーバ上でデータに加えられた変
化がないか定期的にチェックする。注記される修正派、リンク、静的ページまた
は動的ページの削除、作成または修正を含んでよい。あらゆる変更があった場合
、エージェントはインデックスデータファイルを作成し、CIの中央インデクシ
ングデータベースに関連するインデクシング変更を報告する。中央インデクシン
グデータベースは、CSEなどのオンラインで使用可能なサーチエンジン用の包
括的且つ最新のインデクシングデータベースである。
【0024】 インデクシングシステムが、 (i)最新インでクスを維持する、 (ii)インターネットの大部分をカバーするインデックスを作成する、 (iii)旧いリンクを管理、更新する、 (iv)動的に作成されたページを索引付けする、 (v)個々のウェブサイトに関する詳細な統計情報を収集する、 (vi)高度比較ショッピング機能を用いてe−コマースポータルを作成する ことができることは、以下の説明から明らかになるだろう。
【0025】 図1は、ユーザがインデクシングシステムを使用してデータを検索するために
使用するのに適した典型的なコンピュータシステム200の図である。コンピュ
ータ200は、1台または複数台の中央処理装置(CPU)102、メモリシス
テム104、入力/出力(I/O)アダプタ106、二次記憶装置108、ネッ
トワークインタフェース110、ユーザインタフェースアダプタ114、および
ディスプレイアダプタ112を含んでよい。コンピュータ構成要素のすべては、
システムバス115によって接続される。該ディスプレイアダプタ112は、ユ
ーザに対して推奨策を表示するためにディスプレイ116に接続されてよい。該
ユーザインタフェースアダプタ114は、ユーザ入力装置118に接続されてよ
い。ユーザは、ネットワークインタフェース110を通してインターネットに接
続されてよい。ユーザは、例えば、America Online(登録商標)
などのサービスプロバイダに対するモデムを通した接続などのインターネットイ
ンタフェース120に、あるいはケーブル接続を通してインターネットサービス
プロバイダに接続されてよい。
【0026】 図2では、ユーザ200は、インターネット204に結合される、インターネ
ットサービスプロバイダ(ISP)202に接続される。やはりインターネット
204に結合されるのは、典型的には、例えばhtmlページおよびその他の文
書とスクリプトを含んでよい1つまたは複数のサイトへのアクセスを実現、提供
するHTTPサーバ(HS)206である第1サーバである。HSサーバ206
は、第1HSサーバ106上の文書からデータ収集活動を実施するサーバベース
エージェント(SBA)202を含む。SBA208は、いつでも動作してよい
か、あるいは非活動の期間が散在する間隔の間実行してよい。SBA208は、
収集されたデータブロック210に記憶される、すべての文書更新のリスティン
グを作成するためにHSサーバ206上に位置するすべての文書を調べる。SB
A208は、インデックスサーバ212で実行されるソフトウェアによって提供
できる、インデックスファイルまたはインデックスデルタファイルの形の文書更
新のリスティングを中央インデックス(CI)214に伝送する。インデックス
ファイルは、データの位置究明用のアドレスとともに、多様なウェブページに含
まれるものなどの、ネットワーク上の多様なロケーションに含まれるものに関す
る情報を提供するデータのファイルである。該ファイルは、複雑な構造を有して
よく、数多くのファイルおよび/またはサーバ上で分散されてよい。インデック
スファイルに対する参照は、ネットワーク上のデータに対する変更という点で既
存のインデックスファイルに加えられる必要のある変更を単に含むファイルであ
る、インデックスデルタファイルに対する参照も含んでよい。インデクシングシ
ステムの効率的なインプリメンテーションが、後述されるように、SBAおよび
CIとCSEのソフトウェアインプリメンテーションを提供することであり、C
Iが図13に関して後述されるアーキテクチャを有することが、当業者に明らか
となるだろう。また、インターネットのような通信網で数多くの構成要素を分散
できること、およびソフトウェア構成要素の数が、ソフトウェア構成要素と同じ
プロセスを実行する、ASICなどのハードウェア回路にいよって置換できるこ
とも当業者に明らかになるだろう。
【0027】 CI214は、例えば、SBA222およびSBA222によって第2サーバ
220上のウェブページから収集された、収集済みデータ224の選択したもの
も有する、第2サーバ220などの多数のその他のサーバから更新を受け取る。
CI214は、第1HS206および第2HS220などの多様なサーバから受
信される更新を組み込むためにそのコンテンツを更新する。インデックスサーバ
212は、CSE216も備えてよい。サーチエンジン216のインタフェース
は、なんらかのURLに位置してよい。サーチを実行するように要求されると、
サーチエンジン216は、応答を形成する前にCI214のエントリを通して探
索してよい。しかしながら、中央サーチエンジン(CSE)216は、CI21
4と同じサーバ212に位置する必要はない。
【0028】 CI214の機能は、指定領域について、または指定ドメインについてである
が、CI214と類似した機能を実行する数多くの領域インデックスにも適用さ
れてよい。これらの領域インデックスは、CI214がすべてのサーバ用のイン
デクシング情報を維持するように、CI214の領域インデックス情報を提供し
てよい。
【0029】 1.1 サーバベースエージェント(SBA) SBAは、そのサーバ上のデータを自動的に探索するサーバ上のプログラムで
ある。それは、ウェブサーバの一部である場合もあれば、別個である場合もある
。SBAは、典型的には遭遇する状況に反応し、長い時間期間実行してよい。そ
れは、サーチエンジンが、ウェブサーバのサイトで入手できる静的ウェブページ
と動的ウェブページの両方ともを探索できるようにするCIに情報を送信するこ
とができる。それは、旧いリンクに対処するために、いつページが移動または削
除されるのかを通知することもでき、それは、ウェブサーバごとに、サーチエン
ジン結果の格付けを改善するために使用できるウェブページ使用量データを収集
することができる。
【0030】 基本SBAによって実施される基本的なアクションは以下のとおりである。 (a)update_local()――ローカルサーバ上のデータの変化を注
記し、local_indexファイルおよびindex_deltaファイル
を構築する。 (b)report(CI_address,index_delta)――ア
ドレスCI_addressでCIに対するレポートを作成し、更新動作で検出
された局所的な変更を記述するindex_deltaファイルを伝送する。
【0031】 SBA208は、2つの基本的なインデクシング機能、つまり専用のインデッ
クスとindex_deltaファイルの更新、およびCI214へのinde
x_deltaファイあるの報告を実行する。これらの2つの基本的なインデク
シング機能は同じ頻度で動作してよい。例えば、SBA208は、例えば24時
間毎などの定期的な間隔でエージェント208に動作するようにプロンプトを出
すタイマを有してよい。アクティブでない間、SBA208は、過去のアクティ
ブ期間からのサーバ上のすべての文書のそのインデックスエントリを維持する。
SBA208がそのタイマによって目覚まされると、それはサーバサイトのディ
レクトリツリーの変化がないか、あるいは個々のファイルが変更されたかどうか
をチェックする。検出されるあらゆる変化は記憶されてから、CI214に報告
される。変化がない場合、SBA2080は、帯域幅を保存するように、CI2
14にindex_deltaファイルを送信しないようにプログラミングされ
てよい。SBA208は、そのサーバサイトにある文書用のそのローカルインデ
ックスファイルも更新する。
【0032】 定期的な予定された間隔で更新する代わりに、SBA208は、ウェブサイト
上のページが変更されるたびに更新してよい。このケースでは、SBA208は
変更の著者(またはウェブサイト管理者)に、該変更をCI214に即座に提出
するように申し出てよい。また、SBA208は、同じダイアログ中に著者に、
著者がページを反映すると感じるあらゆる主題キーワードを入力する、あるいは
更新するようにプロンプトを出してよい。それから、これらのキーワードはin
dex_deltaファイルでCI214に提出されてよい。言うまでもなく、
著者はキーワードを入力するというオプションを単に無視してよい。
【0033】 レポート動作間の時間は固定された間隔で設定されてよいか、あるいはローカ
ルサーバ206またはインデックスサーバ212の性質またはニーズに合うよう
に動的に改変されてよい。
【0034】 更新動作の一部として、SBA208は、ローカルサーバ206上のページ内
のハイパテキストリンクをレビューしてよい。その後、該レビューされたリンク
は、リンクが加算されたのか、あるいは減算されたのかを判断するために過去の
更新動作中に形成されたリンクリストと比較される。SBA208は、CI21
4に転送されるindex_deltaファイルに変更されたリンクのリストを
含める。それから、この情報は、CI214によって、さらに詳細に後述される
数多くの方法の内の1つまたは複数を使用して旧いリンクに対する参照を削除す
るために使用されてよい。
【0035】 SBA208は、インターネットのユーザによってページがアクセスされた回
数とそのページで費やされた時間、これらのユーザがサイトをビジットする直前
にいたページ、サイトについての帯域統計、および前回の更新動作以来どのよう
な接続が行われたのかなどの、ローカルサーバ206についての統計情報を収集
するように構成されてもよい。このような情報は、サイトの設計およびレイアウ
トを最適化するのを補助するウェブサイト管理者または著者にとって有効である
場合がある。このような情報は、中央リポジトリ内で照合されると、余分なイン
フラストラクチャがインターネットに追加される必要があるところを特定するた
めの有効なデータ、つまり探索結果の集合内でページの関連性格付けを決定する
際のサポート情報を提供してよい。
【0036】 SBAは、後述されるように、動的ページを索引付けすることができ、それが
特定のアプリケーションの特殊目的インデックスを作成する機会を提供する。こ
の1つの例が、SBAがインストールされているその他のe−コマースサイトに
関する情報を提供するe−コマースポータルサイトを形成するe−コマースイン
デックスである。
【0037】 特殊目的SBAの別の例は、代理サーバを含むアプリケーションである。
【0038】 1.2 中央インデックス(CI) CI214は、SBA208と222が、それらが報告するindex_de
ltaを有するときにCI214に接続するという点で、対応するSBA208
と222に対するサーバとしての役割を果たす。CI214は、典型的には、H
TTPサーバ212、つまりインデックスサーバを通してインターネットに接続
される。
【0039】 CI214は、ある特定のサーバからindex_deltaファイルを受信
すると、CI214はそのインデックスデータベースを相応して更新する。イン
ターネット探索者が使用するためにCSE216は、インデックスデータベース
内の新しいデータを即座に使用できる。 (i)SBAが、独自のパラメータ設定値に基づきCIにインデックスファイル
を送信することと、 (ii)SBAが、独自のパラメータ設定値に基づき、CIにindex_de
ltaファイルを送信することと、 (iii)SBAが、CIに変化が発生した旨のショートメッセージを送信し、
その結果CIが既存の方法によるインデクシングのために、あるいはインデック
スまたはindex_deltaファイルを検索するためにスパイダを送信する
ことを含むが、それに制限されない、それが選ぶ任意の方法で後に変化を検索し
てよいことと、 (iv)SBAが、CIに対してよりむしろ領域インデックスに対しショートメ
ッセージまたはインデックスまたはindex_deltaファイルを送信する
ことと、 を含む、SBAとCI間でデータが転送されてよい方法について数多くのオプシ
ョンがある。
【0040】 CI214は、インデクシングデータを蓄積することに加え、ローカルサーバ
でのロードに関係する統計も蓄積してよい。
【0041】 CI214は、すべてのインターネット文書の構築日付と修正日付のリストも
有してよい。このデータリストは探索で役に立ってよく、あるトピックに関する
最も最新の情報を得るための有効な機構を可能にする。CI214は、日付リス
ト内の情報に基づき、サイトがもはや維持されていないサイトであるかどうかも
評価してよい。
【0042】 2.1 旧いリンク CIはインデックスデータベース内に、それに対するリンクを含むあるいはそ
れを参照するページのURLを一覧表示する、URLごとのインデックスを維持
する。これが、各主題URLを、主題URLにリンクしているページを有するそ
れ以外のURLに関係付けるURLのライブラリである。ある特定のURLが削
除された、あるいは移動されたことを示すインデックス情報がCIに報告される
と、CIは、どのURLが削除されたURLへのリンクを含むのかを判断するた
めにURLインデックスを探索してから、参照側サーバのそれぞれでSBAに通
知を送信してよい。その後、ローカルSBAが、このような通知に応えてなんら
かの処置を講じてよい。例えば、SBAは、著者に参照側ページを、あるいはウ
ェブサイト管理者に、リンクが削除または移動されたことを通知してよい。SB
Aは、自動処置を講じるようにプログラミングされてもよい。SBAが削除され
たあるいは移動されたリンクを考慮して講じてよい自動処置の一例とは、マーク
されたリンクがもはや有効ではないことを示すために、参照側ページのhtml
コードに警告を追加することである。別の例は、SBAが、可能であるならば、
URLがこれまで参照していたサイトのルートディレクトリへのリンクでリンク
を置換してよいということである。CIが、URLが削除されたというよりむし
ろ移動されたと通知される場合、参照側サイトにあるSBAは、新しいURLに
対するリンクを更新するように構成されてよい。
【0043】 旧いリンクは、サーバ上の既存のhtml文書内のリンクがなんらかの方法で
変更されると発生する。該変更とは、ターゲットページとしても知られるリンク
内で参照されるページが削除された、移動された(例えば、そのURLが変更さ
れた)、あるいはそのコンテンツが修正された場合である可能性がある。変更は
伝達され、その結果参照側ページをロードするまたは見るユーザは、例えば、空
のターゲットページ、または元のリンクの著者がリンクを形成するときに依存し
ていた情報をもはや含んでいないターゲットページに導かれない。
【0044】 html文書内でリンクを形成するための共通構文は以下のとおりであり、 <href=“www.server.com/linkto_doc.htm
l”>link phrase</A> この場合、「href」は別の文書に対するハイパリンクを作成するために使用
されるhtml属性であり、「www.server.com/linkto_
doc.html」は、それ以外の場合ターゲット文書として知られている、リ
ンクされている文書のインターネットアドレスであり、「link phras
e」は、linkto_doc.htmlへのリンクに続くためにクリックする
html文書中の句のことである。それ以外の属性は、「href」属性に加え
て、同文書内の別の点へのリンクを形成するために使用されてよい。
【0045】 同じウェブサイト内で発生する旧いリンクについて、SBAは、これらを自動
的に更新するためにセットアップされるか、あるいは代わりにそれはウェブサイ
ト管理者に、彼らがSBAを使用することにより手動で変更を実現するのか、あ
るいは自動的に実現するのかを決定できるように知らせることができるだろう。
【0046】 図3に図示されるように、SBAは、ステップ302で、別のタグを探索する
ことによってリンクがないかサーバ上の第1html文書を走査する。SBAは
、ステップ304で、文書中で見つけられたリンクのリストを形成する。リスト
は、例えば、形式(link_from,link_to)を取る数多くの組を
含んでよく、この場合link_fromはソースhtml文書を示し、lin
k_toはターゲットhtml文書(つまり、リンクが指す文書)を示す。
【0047】 それから、SBAは、ステップ306で、過去のリンク走査以来発生したリン
ク内の変化を特定する。それから、変化したリンクに関係するこれらのリンク組
が、ステップ308で、linkchange_listファイルに記憶される
。それから、SBAは、ステップ310で、サーバ上の残りのhtml文書の走
査を進め、その結果linkchange_listは、サーバ上のすべての文
書に含まれているリンクのすべての変化を含む。
【0048】 それから、SBAはさまざまな経路に沿って進んでよいか、あるいは並列経路
に沿って進んでよい。ステップ312で、進むための1つのオプションは、SB
Aがその他のサーバにlinkchange_listに含まれる関連する変化
を伝送することである。このアプローチは、インターネット440を通して通信
中の3つのサーバ410、420および430を示す図4に示されている。サー
バ名http://www.server1.comを有する第1サーバ410
は、SBA_server1と題されるSBA412を有する。Doc1.ht
mlと題されるhtml文書414は、第1サーバ上に存在する。第2サーバ4
20は、アドレスhttp://www.server2.comを有し、SB
A_server2と呼ばれるSBA422も有する。第2サーバは2つのht
ml文書、つまりdoc2.html 424とrefl.html 425を
有する。第3サーバ430は、アドレスhttp://www.server3
.comを有する。第3サーバ430はSBA_server3と呼ばれるSB
A432を有する。第3サーバ430は、ref2.htmlと題されるhtm
l文書435を有する。
【0049】 第1サーバ410上のhtml文書doc1.html 414は、第2サー
バ420上のref1.html 42および第3サーバ430上のref2.
html 435に対するリンクを含む、数多くのリンクを含む。ステップ30
4で前述されたように、各サーバ上のSBAは、ソース文書およびターゲット文
書の組のリストを作成する。したがって、第1SBA412によって作成される
linkto_listファイル416は、描かれている少なくとも2つの組、
つまり (www.server1.com/doc1.html,www.serve
r2.com/ref1.html)および (www.server1.com/doc1.html,www.serve
r3.com/ref2.html) を含む。
【0050】 同様にして、第2サーバ420は、ソース文書が第2サーバ420上のhtm
l文書であり、ターゲット文書がソース文書内のリンクによって参照される文書
である、ソース文書およびターゲット文書の組を一覧表示し、その他のサーバ上
で記憶されるlinkto_listファイル426も含む。示されている例で
は、doc2.html 424は、第3サーバ上のref2.html 43
5に対するリンクを含む。結果的にlinnkto_listファイル426は
、組(www.server2.com/doc2.html,www.ser
er3.com/ref2.html)を含む。サーバ410、420および4
30は、その他のサーバ上の文書へのリンクを有する追加文書を含んでよい。
【0051】 図3を参照し直すと、ステップ312で、SBA412は、linkchan
ge_listの関連する変化を、ターゲット文書が位置するサーバに伝送する
。例えば、doc1.htmlからのリンクのあらゆる変化は、ターゲット文書
を含む関連するサーバに報告される。このようにして、doc1.htmlがr
ef2.htmlへのリンクを含むように変更される場合には、この新規リンク
はlinkchange_listに含まれ、この組はサーバ420に伝送され
る。サーバ420は、サーバ410から情報を受信し、第2リスト、linkf
rom_list 428を第1サーバ410とそれ以外のサーバから受信され
た情報からアセンブルする。Linkfrom_listファイル428は、他
の文書によってリンクされる第2サーバ420上に含まれる文書のリストである
【0052】 同様に、第3サーバ430上のref2.htmlは、2つの異なる文書、つ
まり第1サーバ410上のdoc1.html 414と第2サーバ420上の
doc2.html 424によってリンクされる。第3サーバ430は、do
c1.htmlとdoc2.htmlによってref2.htmlがリンクされ
る第1サーバと第2サーバ410と420から情報を受信し、その情報はlin
kfrom_list 438からアセンブルされる。
【0053】 このプロトコルの元では、各SBAは、すべてのリンクについてソースファイ
ルとターゲットファイルを示すlinkto_listファイルをアセンブルし
、この場合ソースはそのサーバ上に含まれる。SBAは、他のサーバ上のどの文
書がそのサーバ上に含まれる文書に接続するリンクを有するのかを示す他のサー
バから受信される情報からlinkfrom_listもアセンブルする。各S
BAは、リンクについてそのサーバ上に含まれる文書を定期的に走査し、図3に
図示されるステップに示されるように、リンクの変化を特定する。これは、例え
ば、24時間毎、または週に一度、あるいはサーバ上に記憶されているhtml
ページに対して加えられる修正の予想される頻度に従ってサーバ管理者によって
選択されるそれ以外のなんらかの定期的な時間間隔で発生してよい。これにより
、各SBAが、妥当に最新であるlinkfrom_listファイルをアセン
ブルできることが確実になる。
【0054】 それから、ステップ316で、SBAは、そのサーバ上のターゲットhtml
文書で検出された変更を、ソースhtml文書、つまりカレントサーバへのリン
クを含むそれらの文書を含むそれらのサーバに伝送してよい。これは、ソース、
つまりlink_to文書のサーバが、ターゲット文書での変更に従ってソース
文書中のリンクに適応できるようにする。これは、さらに後述される。
【0055】 更新されたリンクを維持し、旧いリンクを回避するための別のプロトコルは、
リンクの変化をCIに伝送するというステップ318を含む。CIは、文書間の
すべてのリンクのリストを維持し、ソース文書に、ターゲット文書の変化が受信
されると、ターゲット文書の変化をソース文書に知らせる。
【0056】 これは、html文書を含み、インターネット504を介して接続される第1
HTTPサーバ、第2HTTPサーバ、および第3HTTPサーバ、510、5
20および530を示す図5に参照してさらに説明される。第1サーバ510は
、SBA_server1と呼ばれるSBA512を含み、第2サーバと第3サ
ーバ520と530もそれぞれのSBA522と532を含む。それぞれのSB
Aは、ステップ304による方法でlinkto_listファイル516、5
26および536をアセンブルする。第1サーバ、第2サーバおよび第3サーバ
510、520、および530は、そのアドレスが、例えば、http://w
ww.ci.comである中央インデックスサーバ550に接続される。CIサ
ーバ550は、CI552を含む。CIは、前述されたような方法で接続された
サーバから受信されるインデクシング情報を含む。
【0057】 第1SBA512は、ステップ318でリンクの変化をCIに伝送する。CI
552は、文書間のすべてのリンクのリスティングであるlink_list
554を維持する。したがって、第1サーバ510上のdoc1.html 5
14は、ref1.htmlとref2.htmlへのリンクを含み、link
_listは、組(www.server1.com/doc1.html、w
ww.server2.com/ref1.html)、および組(www.s
erver1.com/doc1.html、www.server3.com
/ref2.html)を含む。さらに、第2サーバ520上のdoc2.ht
ml 524は、第3サーバ530のref2.html535へのリンクを含
む。したがって、ファイルlink_list 554も、組(server2
.com/doc2.html、server3.com/ref2.html
)を含む。CI512は、すべてのリンク情報を含むので、このプロトコルには
各サーバでのlinkfrom_listファイルを維持するという要件はない
【0058】 図6は、別のサーバ上のターゲット文書が変更されたという情報を受信したの
に応えてSBAによって実行されるプロセスを示す。ローカルSBAは、ステッ
プ602で、変更の種類の表示とともに、ターゲット(link_to)文書内
の変更の通知を受け取る。それから、SBAは、ターゲット文書が削除されたか
どうかを判断する。
【0059】 ターゲット文書が削除されたのか、あるいはそれ以外の場合取り除かれたのか
を判断すると、SBAは、以下の処置の1つまたは複数を講じてよい。第1にS
BAは、ステップ606で、サーバ管理者にメッセージを伝送し、管理者にター
ゲット文書の変更を通知する。管理者は、サーバ上のどの1つのまたは複数のソ
ース文書が問題のターゲット文書へのリンクを含むのかに関しても知らされてよ
い。このようにすることを許可されている、あるいはこのようにするように構成
されている場合、SBAは、例えば、リンクが無効であることを示すためにソー
ス文書中にマークを挿入することによって、ステップ608でソース文書を自動
的に修正してよい。さらに、SBAは、ステップ610で、ソース文書からリン
クを削除することを許可される、あるいは削除するように構成されてよい。さら
に、SBAは、ステップ612で、代替ターゲット文書への新規リンクで、現在
の主題文書へのリンクを置換することを許可される、または置換するように構成
されてよい。
【0060】 代替文書を決定する1つの考えられる方法は、同じワードを含み、これらのワ
ードについて類似したワード頻度のものを見つけることだろう。CIは、削除さ
れた文書から10個の最も頻繁なワードを有するすべての文書に対する探索を行
うことができるだろう。これらの文書の集合の内、それは削除された文書ワード
頻度に最も近い相対的なワード非インドを有するものを探すことができる。これ
は、文書中のワードの頻度を示す、順方向インデックスを調べることを含むだろ
う。
【0061】 SBAが、ターゲット文書のURLが変更されたと判断すると、ステップ61
4、SBAはサーバ管理者にURLの変更に関する通知を提供してよい、ステッ
プ616。SBAは、ステップ618で、ソース文書のアンカータグ内のターゲ
ット文書のURLを修正することを許可される、あるいは修正するように構成さ
れてもよい。
【0062】 SBAがターゲット文書が削除されていないし、移動されてもいないと判断する
場合には、SBAはターゲット文書のコンテンツが変化したかどうかを、ステッ
プ620で判断する。
【0063】 ページのコンテンツが大きく変化したかどうかを判断する1つの方法は、ペー
ジのタイトルが大きく変化したかどうかを確かめることである。これは、テキス
トの2つの小さな部分を比較することを必要とする。過去のタイトルの部分列が
残っている場合には、ページはおそらく大きく変化しなかったのだろう。すべて
のワードが異なる場合には、旧いワードと新しいワードの間には何の意味的なリ
ンクはなく(wordNetなどの意味辞書が使用できる)、そのときには、コ
ンテンツが大きく変化したと結論付けることができる。
【0064】 いったんSBAが、ステップ622で、ターゲット文書のコンテンツの変化が
十分に重要であると判断すると、SBAは、1つまたは複数の方法で進んでよい
。例えば、SBAは、ステップ623で、ターゲットページのコンテンツの変化
をサーバ管理者に知らせるだけでよい。それから、管理者は、著者が、ターゲッ
トページが依然としてソースページからのリンクを維持する価値があるかどうか
に関して手動の決定を下すことができるように、ソースページの著者に知らせて
よい。SBAは、ステップ624で、ソース文書内のリンクを削除することを許
可されるか、あるいは削除するように構成されてよい、あるいはステップ626
で、ターゲット文書へのリンクを、代替ターゲット文書への新しいリンクで置換
することを許可されてよい。
【0065】 代替文書を選ぶ方法は、文書が削除された前記ケースと同じである。
【0066】 SBAは、ステップ628で、ターゲット文書が位置しているサーバがもはや
使用できないと判断してもよい。使用できない場合には、SBAは以下のステッ
プの1つまたは複数を講じてよい。SBAは、ステップ630で、サーバ管理者
に、ターゲット文書を含むサーバがもはや使用できない旨を知らせてよい。SB
Aは、このようにすることを許可されている、あるいはこのようにするように構
成されている場合には、ターゲット文書がもはや使用できないことを示すマーク
によって、ステップ632でソース文書を修正してよい。SBAは、このように
することを許可されている、あるいはこのようにするように構成されている場合
は、ステップ634で、ソース文書内のリンクを単に消去してもよい。また、S
BAは、ステップ636で、ソース文書内のリンクを代替ターゲット文書への新
しいリンクで置換してもよい。
【0067】 ターゲット文書のサーバのSBAは、図7に示されるように、ターゲット文書
が変化した、または移動したことをユーザに警告するためのステップを講じても
よい。いったんSBAが他のサーバ上のソース文書がリンクを有するhtml文
書内に変化があることを検出すると、ステップ702、SBAは、ステップ70
4で、ターゲット文書の変化が、ユーザが変化に関して警告されなければならな
いほど十分に重要であるかどうかを判断する。
【0068】 SBAが、ユーザが文書に対する変化に関して通知されなければならないと判
断する場合、SBAは、ステップ706で文書が削除されたかどうかを判断する
。ターゲット文書が削除されている場合には、SBAは、ステップ708で、タ
ーゲット文書が削除されていることをユーザに知らせる新しいhtml文書を形
成することを許可される、または形成するように構成されてよいか、あるいはス
テップ710で、削除されたターゲットページの代わりに、表示する代替ページ
をユーザに知らせる新しいhtml文書を作成してよい。
【0069】 SBAが、ステップ712で、ターゲット文書のURLが変更されたと判断す
ると、SBAは、ステップ714で、旧いURLで、ユーザに新しいURLを通
知する新しいページを作成してよい。この新しいページは、新しいURLでのタ
ーゲット文書へのハイパテキストリンクも含んでよい。
【0070】 SBAは、限られた時間、新しいページを掲示するように構成されてよい。新
しいページが表示される時間の長さは、古いURLへの追加リンクが残っている
かどうかに従って設定されてよい。SBAは、どのソース文書が古いURLにリ
ンクするのかを示す現在のlink_fromリストを維持する。ステップ71
6で、古いURLへのこれ以上のリンクが残っていないことが判断されると、ス
テップ718で新しい宛先変更ページが削除されてよい。加えて、SBAは、ス
テップ720で、例えば6ヶ月などの所定の長さの時間が経過した後に古いUR
Lの新しいページを削除するようにプログラミングされてよい。
【0071】 ユーザのブラウザが、変化したことがある、または変化した、またはもはや使
用できないサイトに、ユーザを向けるブックマークを含んでいないことを確実に
するために中央インデックスによって維持されるデータベースに対して参照を有
することができる。該ブラウザは、図8にステップ802で、ブックマークが付
いたページが依然として使用できる旨を確実にするために、中央インデックスを
用いて定期的にチェックするエージェントが提供できる。ブラウザエージェント
が、ステップ804で、ブックマークが消えていると判断すると、ブラウザエー
ジェントは、ステップ806で、ブックマークを無効であるとマークしてよい。
ブラウザエージェントが、ステップ808で、中央インデックスから、ブックマ
ークがそのURLを変更したと判断すると、ブラウザエージェントは、ステップ
810で、新しいURLを反映するためにブックマークを変更するように構成さ
れてよい。ブラウザエージェントが、ステップ812で、ブックマークに位置す
るページのコンテンツが変更されたと判断すると、ブラウザエージェントは、ス
テップ814で、ユーザに代替のブックマークを勧めてよい。
【0072】 2.2 動的ページおよび生成された静的ページ 動的ページとは、htmlで手作業により作成されないウェブページのことで
あり、典型的には、それらを構成するhtmlは、プログラムによって「動的に
」作成される。これらのページは、例えば、html形式照会がユーザによって
提出される時点でプログラムによって構築される。大部分の動的なページは、そ
の構築においてデータベースからのデータを使用する。それ以外の種類の動的ペ
ージ(例えば、チャート)は、JavaまたはJavascriptプログラム
またはスクリプトによって構築される。動的ページは、そのURLがブラウザに
よって要求されるたびにプログラムまたはスクリプトによって生成されるウェブ
ページであると見なすことができ、それはウェブサーバ上には記憶されていない
。大部分の動的ページは、バックエンドデータベースから作成される。いくつか
のページは、事前にデータベースから生成され、静的ページとして記憶されてよ
く、動的ページに対する参照は、通常、作成された、または事前に作成された静
的ページを含むと解釈されなければならない。入力組は、有効な動的ページを結
果的に戻す入力を送信するために使用される。
【0073】 データベース内に情報を含むいくつかのサイトは、要求時に動的なページを作
成しないが、定期的に更新される多数の静的ページを作成するためにスクリプト
を使用する。これらのページは、一般的には、どこか他のところからのそれらに
対するリンクはないだろうという点で、動的ページに類似した特性を有する。し
たがって、スパイダなどの従来のインデクシング方法は、スパイダがリンクを介
してウェブページを見つけるため、これらのページを見つけない可能性がある。
これらの作成された静的ページは、考えられるすべてのページの包括的な集合よ
りむしろ、頻繁にアクセスされる動的ページのキャッシュであってよい。作成さ
れた静的ページまたは事前に作成された静的ページは、(例えば、考えられるペ
ージのすべてまたは部分集合を作成することによって、あるいはそれらが検索さ
れるにつれて動的ページをキャッシュに入れることによって)データベース内の
情報へのアクセスを加速するために静的ページとして記憶されるウェブページで
あると見なすことができる。これらは、他の静的ページと同じように捕捉されて
よいが、動的ページまたはデータベースへの接続を認識することによってさらに
効率的に索引付けられてよく、動的ページに対する参照は、通常、作成されたま
たは事前に作成された静的ページを含むと解釈されなければならない。動的ペー
ジおよびこれらの作成された静的ページの索引付けは以下に後述される。
【0074】 以下の詳細な説明から理解されるように、作成される静的ページサイトはペー
ジを作成し、高速アクセスのための静的ページとしてそれらを記憶するが、事前
に作成される静的ページの作成は、SBAが作成し、動的ページを索引付けるが
、それらを記憶しない方法(後述されるケース2.3)に類似している。したが
って、作成される静的ページは、他の任意の静的ページのようにSBAによって
索引付けられるだろうが、組の表現は、SBAがすべてのこれらの作成されたペ
ージを表すための最もコンパクトな方法であり、これらのページを作成するスク
リプトは、索引付け時にSBAによって使用できる。したがって、これらの静的
ページは、静的なリンクが、動的リンクよりむしろCSEによる探索結果ページ
で作成されるという点を除き、動的ページ組インデクシング方法(後述されるケ
ース2.1)によって処理される。
【0075】 html形式は、ウェブページの視聴者が、彼らが現在アクセスしているウェ
ブサイトに情報を提出できるようにするhtmlでの構成子である。例えば、L
ycosなどのサーチエンジンを使用するとき、ユーザは、1つまたは複数のキ
ーワードを、それらを現在表示されている画面の一部の中に打ち込むことによっ
て提出し、それから「探索」などの画面上のボタンをクリックしてキーワードの
転送を開始する。それから、キーワードは、現在アクセスされているウェブサイ
トで受け取られる。
【0076】 html形式構成子は、ユーザによって提出されるワードまたは入力を処理す
るプログラムに名前を指定する。これは、動的ページを作成するプログラムであ
る。このようなプログラムは、多くの場合、cgiスクリプト(cgiは、「共
通ゲートウェイインタフェース」を意味する)であるだろう。該cgiスクリプ
トはユーザによって送信される情報を受信し、情報を、ローカルデータベースま
たはリモートデータベースからの情報の部分に対する要求として解釈し、SQL
照会などのデータベースに対する照会を作成する。それから、cgiスクリプト
は、データベースから要求されたデータを検索し、このデータを使用してページ
を構築し、動的ページをユーザに戻す。動的ページを作成するために使用される
cgiスクリプト以外のプログラムがあり、ここでの形式処理プログラムに対す
る参照は、動的ページを生成するために使用できる(Javaサーブレットおよ
びリモートメソッドを含む)機械コードまたは中間または仮想機械コードに従っ
て解釈されるか、あるいはコンパイルされるかに関係なく、任意の種類の、ある
いは任意の言語での任意のスクリプトまたは実行可能なファイルを意味すると解
釈されなければならない。用語は、ユーザが新規探索を開始できるようにするた
めのフィールド、およびJavaウィンドウなどの入力を収集するそれ以外の手
段を含む動的ページも含むが、形式ページは、ユーザが入力を指定するためのフ
ィールド、メニュー、および/またはその他の手段を含むウェブページであると
見なすことができ、最も多くの場合は静的ページである。動的ページを作成する
ために、形式ページがどのようにして使用されるのかを示す例は、SBAが図1
1に示されるようにサーバ206上でどのように動作するのかを示すときに、図
9から図10に関して後述される。
【0077】 2.2.1 動的ページおよび作成された静的ページの索引付けの概要 2.2.1.1 SBAの動作 動的ページを索引付けするためにSBAによって実行される一般的なステップ
は、図12に図示されている。インストール中、SBAは、ステップ1202で
ウェブサイト管理者のニーズに合うように構成されてよい。例えば、SBAは、
(i)どの程度頻繁にSBAが変化がないかウェブサイトをチェックするのか、
(ii)旧いリンクの自動的な更新、つまりウェブサイト管理者だけに提案され
た更新で警告する (iii)索引付けられてはならないページに対する制限 (iv)索引付けられてはならないデータベース(複数の場合がある)内のデー
タ(例えば、列)に対する制限(例えば、機密情報、重要ではないまたは有効で
はない情報、あるいはそれ以外の情報がユーザによって提供される場合にだけ表
示されなければならない情報―この最後の点の例は、ユーザがある人の名前を入
力し、電話番号が戻される場合であり、これは逆に起こってはならない。 (v)変更が、索引付けられるように設定されていたデータベースに加えられる
ときに、SBAが自動的に索引付け情報を更新するオプション(「データベース
トリガ」) を含む、数多くのパラメータで構成されてよい。
【0078】 いったん構成されると、SBAは、ステップ1204で、ローカルウェブサイ
トを精査し、動的ページの作成で使用されるデータベース(複数の場合がある)
を見つける。それから、SBAは、種類、使用される照会言語、ユーザ名とパス
ワード、およびアクセス方法などの各データベースについての追加情報を決定し
(この情報は、ウェブサイト管理者によって手作業で提供されるか、SBAによ
って自動的に決定されてよい)、その結果SBAは、ステップ1206で各デー
タベースに接続し、各データベースからデータを検索することができる。それか
ら、SBAは後述される方法の1つを使用し、関連するデータベース(複数の場
合がある)からインデクシング情報を抽出し、圧縮されたフォーマットをとって
よいこの情報は、ステップ1208で、後述される方法の1つを使用してCIに
送信される。このようにするように構成されている場合、SBAは、ステップ1
210で、索引付けられているデータベースにいつ変更が加えられるのかを自動
的に検出するトリガをインストールする。それから、SBAは、ステップ121
4で、発生した可能性のあるあらゆる変化についてウェブサイトをチェックする
前に、インストールプロセス中、またはそれ以降に設定されてよい事前に定めら
れる期間(ステップ1212で)待機する。サイトが変化した場合(ステップ1
216)、SBAは、ステップ1218で、CIに関連するインデックス情報を
送信する。
【0079】 2.2.1.2 CIの動作 図13は、CI214の構造およびCSE216に対する関係性を示す。索引
付け情報が多くのSBAから受信されると、CIインデクサ1300は、まず、
この情報のために順方向インデックスエントリ1302と1304を構築する。
それから、それは、反転されたインデックス1306を更新するために、順方向
インデックスエントリ内の情報を利用する。それから、SBAとCIがデルタ、
つまりインデックスデルタファイルと通信しない限り、静的ページ1304の順
方向インデックスエントリは削除される可能性があり、そのケースではそれらの
順方向インデックスエントリは残らなければならない。それらを削除すると、静
的ページに必要とされるCIでの記憶域は大幅に削減されるだろう。動的ページ
1302に対する順方向インデックスエントリは、通常、削除できない。順方向
インデックスと反転インデックスが構築されてよい方法に対して、反転インデッ
クスが順方向インデックスからの表を共用するアプローチを含む、数多くの代替
アプローチがあることが注意されなければならない。反転インデックス1306
の索引が付けられた用語のディクショナリおよび/またはシソーラスを備えるこ
とができる照会用語の辞典1308が維持される。辞典1308の機能が、反転
インデックス1306の中に統合できることが当業者に明らかになるだろう。
【0080】 辞典1308は、wordIDマッピングにワード、つまり用語を提供し、反
転インデックス1306は、wordIDをdocIDマッピングに提供し、順
方向インデックス1302、1304は、docIDをURLマッピングに提供
する。探索者が、探索するものに、1つまたは複数の照会を提供するとき、辞典
1308は、インデックス内に用語が存在しているかどうか、および存在する場
合には、その対応するwordIDを突き止めるために調べられる。それから、
反転インデックスは、探索者の照会用語を含む、文書の完全な集合を表すwor
dIDのすべてのdocIDを見つけるために探索される。
【0081】 反転インデックス1306に記憶される情報は、 (i)docIDが静的ページに対応するのか、動的ページに対応するのか (ii)照会用語が、(タイトルなどの)重要なフィールドで見つけられるのか
、テキストの本文で見つけられるのか (iii)照会用語が、指定された文書内で密接に位置し(そのためおそらく関
係付けられ)ているのか、あるいは明らかに関係付けられていないのか (iv)文書が、照会用語のすべてを含むのか、あるいはいくつかだけを含むの
か を含んでよい。 この情報は、ユーザの照会に十中八九関連しているそれらの文書がリストの先頭
にあるように、docIDのリストを並べるために使用される。それから、do
cIDごとに、順方向インデックスが調べられ、元の文書を検索できるURLを
突き止める。動的ページのケースでは、これは、形式処理プログラムURL、方
法、入力フィールドおよび入力組からURLを構築し直すことを必要とする。順
方向インデックスコンテンツは、探索者が指定した可能性のある正確な句の存在
を確認するために、およびどれが求める結果になるのか(which resu
lts to pursue)を考えるときに、探索者がレビューしてよい関連
するコンテンツの短い抜粋を提供するために使用されてもよい。
【0082】 図14に関して、CIは、ステップ1402でSBAからのメッセージを受信
するために待機する。CIがメッセージを受信すると、それは、ステップ140
4で、新しい索引付け情報を追加し、その順方向インデックス1302、130
4内の既存の索引付け情報を修正する。それから、CIは新しい索引付け情報を
追加し、ステップ1406で、その逆インデックス1306内の既存の索引付け
情報を修正する。それから、CIはSBAからの追加メッセージを待機する。
【0083】 2.2.1.3 CSEの動作 図15に関して、CSEは、ステップ1502で、ユーザが探索と一句に関す
る情報を要求するのを待機する。CSEは、ステップ1504で、ユーザがブラ
ウザを通して適切な探索情報(例えば、キーワード)を入力し、サーチエンジン
ウェッブページ上の提出ボタンまたは探索ボタンを押すことによって照会を受け
取る。CSEは、ステップ1506で、CIの逆転インデックス1306を調べ
、それぞれのキーワードに一致する動的ページ作成点のリストを形成する。それ
から、CSEは、ステップ1508で、すべての照会ワードに一致する動的ペー
ジ作成点を見つけるためにキーワードのリストをマージし、結果的に事前結果リ
ストを生じさせる。事前結果リスト内のアイテムは、ステップ1510と151
2で、この情報を含む有効な動的ページがあるかどうかを確かめるためにチェッ
クされる。ない場合には、アイテムは(ステップ1514で)リストから削除さ
れ、次のアイテムがチェックされる。この情報を含む有効な動的ページがある場
合には、このページを作成する入力が注記され、結果リストに入れられ、エント
リは、ステップ1516で事前結果リストから削除される。各アイテムは、ステ
ップ1518で、何も残らなくなるまで(何かが残されている場合、CSEはス
テップ1510に戻る)事前結果リスト内でチェックされる。ステップ1516
で決定される入力を使用して、URLが、ステップ1520で、結果リスト内の
動的ページごとに構築される。指定されるキーワードを含む静的ページの集合は
、ステップ1521で決定される。関連付けられるURLは、静的ページおよび
動的ページのための結合された結果リストを形成するために結果リストに追加さ
れる。それから、結果は、ステップ1522で、照会に対する関連性の順序で格
付けされる(これを行うための標準的な技法がある)。それから、CSEは、ス
テップ1524で、html結果ページを作成し、要求側ブラウザにそれを戻す
。典型的には、この結果ページは、ユーザによって入力されるキーワードに基づ
いて、動的ページと静的ページの両方へのリンクを含むだろう。CSEのユーザ
が動的ページに対するリンクをクリックすると、彼らはCSEによって構築され
たURLに基づいてデータベース情報から形成される動的ページに直接移動する
【0084】 2.2.2 動的ページの索引付け 2.2.2.1 株式情報例 動的ページの索引付けは、株式仲買人からの多様な株式市場に上場されている
企業に関する勧めを提供するために、図9Aから図9Cに図示されるように動的
ページを作成できる株式情報例に関して後述される。形式ページは図9Aに図示
され、特定の入力を含むことにより照会が入力された形式ページが図9Bに図示
されている。それから、結果として生じる動的ページが作成され、図10に図示
されるように、ウェブサーバ206のデータベース1002から抽出されたデー
タを表すエントリ900が強調表示される図9Cに図示されるようなユーザのブ
ラウザに送信される。図10は、ページ1004の入力フィールド1010に入
力されるデータを要求とともに受信する形式処理プログラム1008にhttp
要求を戻すために、ユーザのブラウザ1006に送信される形式ページ1004
を使用できるメッセージフローを示す。プログラム1008は、ユーザのブラウ
ザに戻すhttp応答を作成するために使用できるプログラム1008に結果を
戻すために、リレーショナルデータベース1002に対するSQL照会を生成す
る。応答は、プログラム1008によって作成される動的ページを定義するコー
ドを含み、応答は、ユーザのブラウザ上での、図9Cに図示されるような、動的
ページの表示を引き起こす。
【0085】 さらに特定すると、図9Aの形式ページのURLは、 http://www.stockadvice.com/broker.ht
ml である。
【0086】 一方の入力フィールドは株式コード用であり、他方の入力フィールドは仲買人
の名前用である。株式コード用の形式入力の名前は「scode」であり、仲買
人名の形式入力の名前は「bname」である。
【0087】 broker.html上のhtml形式タグの例は、 <FORM ACTION=http://www.stockadvice.
com/cgi−bin/brokerdata METHOD=“GET”>
Stock code eg AOL <INPUT TYPE=“text”
NAME=“scode”SIZE=10><br> Stock broker<INPUT TYPE=“text”NAME=“
bname”SIZE=10><br> <INPUT TYPE=“submit”VALUE=“Submit”><
br> となるだろう。
【0088】 形式処理プログラムの例のURLは、 http://www.stockavice.com/cgi−bin/br
okerdata である。この例では、情報は、Oracle(商標)データベース1002に記
憶される。
【0089】 作成される動的ページは、仲買人の株式―買い、売り等の格付けを含む。これ
らの格付けを含む例の表は以下のとおりである。
【0090】 別の表は、stock_infoと呼ばれる。それは、stock_code
単位で索引付けされる。それは2つのそれ以外の列を有し、exchange、
つまり企業が上場されている株式証券取引所と、他方は、企業の名前を含むst
ock_nameである。
【0091】 第3の表、stock_brokersは、列、name(一次キー)、ph
one_no、およびemailを有する。
【0092】 プログラム1008のcgi−scriptは、ユーザが‘YHOO’と‘j
ackson’をそれぞれの形式フィールドに入力してから、提出ボタンを押す
と、以下のSQL照会を生成する。 select rating,stock_name,email from stock_info,stock_rating,stock_b
rokers この場合、 stock_info.stock_code='AOL'and stock_brokers.nam='jackson'and stock_info.stock_code=stock_rating.s
tock_code and stock_brokers.name=stock_rating.name
【0093】 cgi−scriptは、動的ページに、ある特定の仲買人からのある特定の
株式の格付け、および株式の名前、および仲買人のemailアドレスを表示す
る(図9Cを参照すること)。
【0094】 2.2.2.2 サーバベースエージェント 本項でSBAについて示される詳細の多くは、バックエンドデータソースがS
QLデータベースであるという仮定の元にある。いくつかの改変を含む基本的な
技法は、SQL以外の照会言語を使用するバックエンドデータベースから作成さ
れる動的ページの索引付けに、およびその他のバックエンドデータソースにも適
用可能だろう。前述されたように、SBAは、スタンドアロンソフトウェアモジ
ュールとして実現されてよいか、あるいはHTTPサーバ(HS)に含まれてよ
いか、あるいは何らかのほかのさらに大きなソフトウェアモジュールに含まれて
よい。
【0095】 多くの市販されているデータベースについて、データベースへの接続は、デー
タベース(DB)1008の上位装置として働く同じコンピュータからである必
要はない。つまり、DBは、HTTPサーバディレクトリツリー(HSDT)を
記憶するサーバ206に対する別のコンピュータ上にある場合があることを意味
する。
【0096】 SBAは、HSDTと同じコンピュータ上に、あるいはHSDTの一部である
すべてのファイルの表示を可能にするコンピュータ上でインストールできる。こ
れは、SBAの上位装置として働くコンピュータ、および共通のネットワークフ
ァイルシステムの一部であるHSDTの上位装置として働くコンピュータを介し
て実行できるだろう。またリモート機械上のSBAが、別のコンピュータ上で上
位装置として働かされるHSDTを表示するための他の考えられる方法もある。
【0097】 図16に関して、SBAが(ステップ1602で)インストールされると、そ
れは(ステップ1604で)コンピュータ管理者によって手動でHSDTのロケ
ーションを通知されてよいか、あるいはそれは(ステップ1606で)自動的に
このロケーションを演繹することができる。好ましい方法ではない後者のオプシ
ョンは、SBAが、ネットワークファイルシステム全体、つまりHSDTの場合
ローカルファイルシステムを探索することを必要とする。これを達成する1つの
方法は、htmlファイルの位置を突き止めることによる。
【0098】 SBAは、ウェブサイト(WS)のロケーション(つまり、ブラウザに対しサ
ービスを提供できる実際のファイル)を突き止めることも必要とする。これは、
ステップ1608でコンピュータ管理者によって手動で提供されてよいか、ある
いはSBAは、ステップ1610で自動的にこれを演繹することができる。これ
を達成する1つの方法とは、SBAが、htmlファイルを含むこのサブツリー
を見つけるために、HSDTを調べることである。
【0099】 それから、SBAは、ステップ1612で、それが動的ページを作成するため
に使用できるかどうかを判断するためにWS内の各ページを見る。SBAは、リ
スト、つまり動的ページを作成できるだろうそれらのページのdyn_list
を作成する。これを判断する1つの方法は、ページからhtmlの存在を特定す
ることによる。私達の株式情報例では、SBAは、ファイル「broker.h
tml」を見て、それがその中に形式タグを有することを認識するだろう。それ
から、それはこのファイルをdyn_listに追加するだろう。
【0100】 それから、SBNは、ステップ1614でdyndb_listと呼ばれる新
しいリストを作成する。Dyndb_listは、データベースにアクセスする
ことを経由して動的ページを作成できるそれらのページのリストだけを含むため
、リストcyndb_listは、通常、同じ番号またはdyn_listより
少ないアイテムを含むだろう。dyn_list内のページについて、SBAは
形式アクションファイル、act_fileと名前が付けられるファイルを見る
。act_fileがバイナリである(ネイティブ機械コードまたは解釈された
バイトコードのなんらかの形、例えば、Java仮想機械にコンパイルされる)
場合には、SBAはその中から文字列のリストstr_listを抽出する。文
字列は、文字、数字および句読点などの文字を表す値に相当するバイナリ内で見
つけられるバイトのシーケンスである。したがって、str_listは、典型
的には、読み取り可能なワードおよび名前または用語のリストとなるだろう。a
ct_fileがバイナリではない場合には、文字列は容易に可視である。それ
から、SBAは、SQL文である文字列を見つけるためにstr_listのメ
ンバーを調べる。特に、SBAは、SQL選択文を探すだろう。SQL選択文は
、データベースを照会するために使用される。そのact_filesがSQL
選択文を含むこれらのページは、動的ページを構築するためにデータベースにア
クセスするものであると仮定されるだろう。これらのページは、dydndb_
listに記録され、それらのアクションファイルの名前はdbact_lis
tに記憶されるだろう。株式情報例では、act_fileは、cgi−bin
/brokerdataである。この形式処理プログラムがSQL選択文を含む
ので、ファイルbroker.htmlもdynndb_list内にあるだろ
う。
【0101】 この時点で、SBAは、データベースにアクセスすることによってどのページ
およびその関連付けられる形式処理プログラムが動的ページを作成するのかを判
断した。dynb_list内のページごとに、データベースの名前、そのユー
ザ名、そのパスワードおよびそのネットワークアドレスも特定されなければなら
ない。dyndb_list内の各ページによってアクセスされるデータベース
種類は、ステップ1616で、ウェブサイトのシステム管理者によって手作業で
指定されてよい。代わりに、SBAは、ステップ1618から1622でこれら
のパラメータを自動的に演繹してよい。
【0102】 データベース種類およびそれ以外のデータベースアクセスパラメータは、ステ
ップ1618で、cgiスクリプトに可視にされる環境変数の集合から、および
スクリプト自体のコンテンツから証拠を収集することにより自動的に演繹されて
よい。環境変数は、実行中のプログラムがその値をチェックできるプログラムの
外側から名前が指定される値である。cgiスクリプトに可視である環境編集を
求める少なくとも2つの方法がある。非相互的な(non−cross)HSア
プローチは、HSのそれぞれの特定の種類を決定することであり、HSがそのc
giスクリプトの環境にインポートする環境変数のリストはHSDT内にある。
例えば、Apache HTTPサーバを使用すると、これはそのHTTPサー
バディレクトリツリー内のconf/httpd.confファイル内で発生す
る。cgiスクリプトにとって可視の環境変数を求めるためのその他の相互サー
バ方法は、SBAが、WSの中に一時的に、環境変数を単に一覧表示するだけの
簡略なスクリプトをインストールすることである。それから、SBAは、すべて
の環境変数の値および名前を示すこのインストールされたスクリプトに対してH
TTP GET要求を実行する。
【0103】 いったんHSのcgiスクリプトに可視であるすべての環境変数が既知となる
と、ステップ1620で、SBAは、リストknowndb_listに記憶さ
れている、それが知っているデータベース種類の既知の標準的な環境変数がない
か、それらを調べる。例えば、Oracleデータベースが使用されている場合
には、ORACLE_BASE、ORACLE_HOMEおよびORACLE_
SIDなどの環境変数が存在するだろう。株式情報例では、これらはcgi−b
in/brokerdataがオラクルデータベースにアクセスできるために検
出されるだろう環境変数である。このチェックは、SBAのknowndb_l
ist内のすべてのデータベースについて行われるだろう。このリストは、大多
数のウェブサイトがカバーされてよいことを確実にするために、多くの異なる種
類のデータベースによって使用される環境変数を含んでよい。
【0104】 SBAは、ステップ1622で、どのベンダのデータベースがdyndb_l
istの各エントリによってアクセスされているのかを演繹する。通常、1つの
データベースだけがWSでcgi−スクリプトに可視であるだろうが、必ずしも
ではない。ただ1つのデータベースがある場合には、dyndb_list内の
それぞれのページがそれにアクセスすることが既知である。複数のデータベース
がある場合には、SBAは、dyndb_listからのどのページがどのデー
タベースにアクセスするのかを決定する。これを決定するために、SBAは、ど
のようにして一定のcgiスクリプトが特定のデータベースに接続するのかにつ
いての発見的教授法を使用する。例えば、cgiスクリプトがコンパイルされた
Cであり、それがオラクルデータベースにアクセスする場合には、cgiスクリ
プトから抽出される文字列の1つは、ライブラリ名「sqlca」を含むだろう
。いったんcgiスクリプトからデータベースに対する一致が行われると、SB
Aはe−タベースについてデータベース名、ユーザ名およびパスワードを、およ
びそれが必要とされる場合はそのネットワークアドレスを特定するために進むこ
とができる。
【0105】 SBAは、これらが必要とされる場合、データベースの名前およびデータベー
スのユーザ名とパスワードを決定する。ステップ1624と1628では、これ
は、これらの詳細をサイト管理者が入力することによって手動で実行されてよい
。代わりに、SBAは、ステップ1626と1630でこれらを自動的に決定す
ることができる。データベース名は、通常、アクセスされているデータベースの
ための環境変数内に含まれるか、あるいはcgiスクリプト自体に、またはなん
らかのほかのシステム情報ソース内で見つけられてよい。例えば、オラクルを使
用すると、ORACLE_SID環境変数が設定されると、それはデータベース
名を含むだろう。設定されない場合、それはユーザ名文字列の最後にあるだろう
。SBAは、データベース名を探すために、データベース型とcgiスクリプト
型の組み合わせごとに発見的教授法を使用する。株式情報例について、データベ
ース名は、cgi−bin/brokerdataがオラクルデータベースにア
クセスするため、ORACLE_SIDで見つけられるだろう。
【0106】 SBAは、ステップ1630で、データベースのユーザ名およびパスワードを
探すために類似する発見的教授法を使用する。これらも、スクリプト自体の、あ
るいは何らかのシステム情報ソースの環境変数であるだろう。SBAは、データ
ベース型およびcgiスクリプト型の組み合わせごとに発見的教授法を使用する
。株式情報例については、ユーザ名とパスワードは、形式処理プログラムcgi
−bin/brokerdataのテキストに含まれ、SBAはプログラム内の
どの文字列が十中八九ユーザ名とパスワードであるのかを特定し、それは、それ
らが正しいことを確認するためにそれらを試すだろう。
【0107】 ここでは、データベース型、データベース名、ユーザ名およびパスワードは、
SAがデータベースに接続を行うことができるcgiスクリプトについて機知で
ある。SBAがプログラミング言語Javaで実現される場合、これは便宜的に
JDBCを用いて実行できるだろう。JDBCは、多くの異なる種類のデータベ
ースに一様なSQLインタフェースを提供する事前作成されたコード(API)
のライブラリである。
【0108】 株式情報例を考えると、株式情報を含むデータベースはユーザ名「admin
」とパスワード「boggle」が指定されるstock__dbと呼ばれるオ
ラクルデータベースである。また、データベース用のリモートデータベース管理
システム(RDBMS)は、ポート1500で傾聴するホストサーバachil
les.stockavicc.comで実行中である。このケースでは、この
データベースに接続するための例Javaコードは、以下のとおりだろう。 Class.forName(“oracle.jdbc.driver.Or
acleDriver”).newInstance() String url=“jdbc:oracle:thin:@Achill
es.stockadavice.com:1500:stock_db”; Connection con=DriverManager.getConn
ection(url,“admin”,“boggle”);
【0109】 ここで、SBAは、形式入力フィールドと、それが対応するデータベース列の
関係性を決定する。これを決定するための数多くの技法がある。1つのアプロー
チでは、SBAは、ステップ1632で、形式入力とSQL照会の関係性を、形
式処理プログラムを調べることによって演繹する。
【0110】 ただ1つの形式入力フィールドがある場合、形式入力フィールドとデータベー
ス列の関係を見つけ出すことは自明である。SQL文の中の変数のロケーション
は、1つの形式入力フィールドと一致される。以下のとおりに、単純な入力フィ
ールドのある単純な例を考えてみる。
【0111】 形式タブテキストは、 <FORM ACTION=“http://www.stockavice.
com/cgi−bin/stocks” METHOD=“GET”> Enter code:<INPUT TYPE=“text”NAME=“c
ode”SIZE=10><br> <INPUT TYPE=“submit”VALUE=“Get quote
!”><br> である。
【0112】 照会は、 select stock_name,close form stock_info,stock_prices であり、この場合、 stock_info.stsock_code=:code_that_wa
s_inputおよび stock_info.stock_code=stock_prices.s
tock_code である。
【0113】 これは、cgiスクリプトがコンパイルされたC−:code_that_w
as_inputであり、プログラム変数であるように考えられ?、これは「c
ode」と呼ばれる入力フィールドに一致するだろう。これは、この入力フィー
独活がデータベース列stock_info.stock_codeに一致する
ことを示す。このデータベース列は、形式に対するすべての考えられる入力の集
合を含む。
【0114】 複数の入力フィールドがある場合、入力フィールドをデータベース列に一致さ
せることはさらに困難である。このマッチングは、(形式入力フィールドごとに
値を指定するプロセスで)cgiスクリプトに対してSBAが要求をこない、結
果として生じるデータベースに対する入力を観察することによって達成されてよ
い。この観察は、数多くの異なる方法で実施されてよい。1つの方法は、ステッ
プ1634で示されるように、SBAが、開放データベース接続性(ODBC)
捜査プログラム(sniffer)または何らかのその他の方法をインストール
することである。これは、ある特定のデータベースに送信されるログ照会を検出
し、ログするだろう。さらに幅広い範囲のオペレーティングシステムまたはcg
iスクリプト型について作用する他の方法がある。これらの代替策の1つである
ステップ1636は、(コンパイルされていない形式の場合)SBAが形式処理
スクリプトを改変する、あるいは、それが、それが実施するSQL照会をSBA
に知らせるように(コンパイルされている場合には)ラッパーを提供することを
含む。
【0115】 SBAがSQL照会を監視した後(ステップ1634または1636)、それ
は2つの方法の内の一方によって、形式入力とデータベース列の関係を決定する
。ステップ1638では、SBAは、ページごとに形式インタフェースに対する
照会を行い、結果として生じるSQL照会を観察し、どの形式入力が、どのデー
タベース列のどのエントリに一致するのかを注記する。代わりに、ステップ16
40では、SBAは、形式入力および人間の探索者から生じるSQL照会を観察
し、注記する。
【0116】 次に、SBAが、動的ページを索引付けするために使用する方法およびこれら
のケースのそれぞれでCIに送信される必要がある情報の数多くの代替策がある
。使用される方法は、ステップ1642でサイト管理者によって設定されてよい
【0117】 3つの決定点、つまりステップ1644、1646および1656で、どの索
引付け方法が使用されるべきかに関する決定が示される。4つの主要な合うロー
値が概略された。ケース1と2について、2つの方法が与えられた。1.1と2
.1に示される方法は、通常、好ましい方法である。情報が複数のデータベース
に記憶され、相対的に独立している一定のデータベースの場合、一定の照会(例
えば、接合)は、組の展開を生じさせるだろう。1.2と2.2などのそれ以外
の方法を使用すると、これらのケースでは、SBAからCIへ伝送されるデータ
の量は最小限に抑えられるだろう。この交換は、データベースおよびSQL照会
を分析する時点で、SBAによって自動的に決定されてよい。
【0118】 2.2.2.3.1 索引付け方法の分類 索引付け方法を考えるとき、さまざまなデータベースに、さまざまな状況で使
用されてよい数多くの代替策がある。いくつかのデータベースにとって、インタ
フェース(例えば、形式、Java等)を使用して探索してよい用語に索引付け
を制限することが適切である―ケース1と3。それ以外のデータベースにとって
は、データベースに記憶されるすべての情報で索引付け、このようにして探索者
によって指定される情報だけを使用して通常検索できないだろうページの検索を
可能にすることが適切である場合がある―ケース2と4。いくつかのケースでは
、データベースを分析し、データベース内のすべての入力および/または出力を
索引付けすること(ケース1と2)が適切である場合があるが、それ以外のケー
スでは、ユーザによって実際に検索されたそれらのページに索引付けを制限する
ことが必要である場合がある(ケース3と4)。
【0119】 動的ページを索引付けすることに対する2つの基本的なアプローチ、つまり、
作成されたあるいは作成できる実際のページを索引付けること(ケース2.3お
よび4.2)、またはそれがデータベースに記憶される方法に類似する形式で情
報を送信すること(ケース1.2および2.2)がある。第3アプローチは、こ
の後者の代替策の変形、つまりデータベースから抽出される情報の組を送信する
ことである(ケース1.1、2.1、3.1および4.1)。独立した表の接合
のまれなケースでは、ケース1.2または2.2は、前述されたようにさらに効
率的であり、SBAによって自動的に選択されてよいが、この「組方法」は、非
常に一般的に適用可能であり、データベースに対する直接的なアクセスがないと
きにも使用できる。
【0120】 さまざまな方法は、以下の通りに要約される。 ケース1:考えられるすべての動的ページの入力を索引付けする。 ケース1.1:SBAは、すべての考えられる入力組を決定し、送信する(ステ
ップ1658)。 ケース1.2:SBAは、動的ページ(例えば、SQL「where」節(ステ
ップ1660))を作成するために使用されるデータベースからデータを抽出す
るために、形式処理プログラムによって使用されるすべてのデータベースを送信
する。 ケース2:考えられるすべての動的ページの完全テキストを索引付けする。 ケース2.1:SBAは、静的テキストおよび考えられるすべての入力/出力組
を決定し、送信する(ステップ1662)。 ケース2.2:SBAは、静的テキストおよび (i)動的ページを作成するために使用されるデータベースからデータを抽出す
るために形式処理プログラムによって使用され、 (ii)出力列である(ステップ1664) すべてのデータベース列を送信する。 ケース2.3:SBAは、それらが静的ページであるかのように、考えられるす
べての動的ページの索引を作成する。 ケース3:人間の探索者によって塩策されたページの入力を索引付けする(ステ
ップ1648)。 ケース3.1:SBAは、人間の探索者によって入力されるユーザ入力を観察し
、入力組を送信する。 ケース4:人間の探索者によって検索されたページの完全テキストを索引付けす
る(ステップ1650)。 ケース4.1:SBAは、人間の探索者によって入力されるユーザ入力および結
果として生じる出力を観察し、これらを入力/出力組として送信する。 ケース4.2:SBAは、それらが静的ページであるかのように、検索された動
的ページに索引付ける。
【0121】 ケース1は、ケース2の部分集合である。ケース1は、ステップ1658と1
660に示されるように、形式入力だけに対する探索を可能にするデータを送信
することを必要とする。ケース2は、完全テキストでの探索を可能にするデータ
を送信することを必要とする。したがって、ケース1は、出力が索引付けされな
いことを除き、ケース2と同じである。
【0122】 ケース2は、ケース1に非常に類似している。しかしながら、SBAは、形式
処理プログラム内のSQL照会によって選択される列も送信する。SBAは、句
の探索を可能とするために、このテキストのワード位置、および動的ページに表
示されるデータベースエントリのワード位置も含む、静的テキストも送信する。
ステップ1662と1664は、ケース2に対応する動的ページ索引付けのオプ
ションである。
【0123】 ケース2.1 このシナリオはステップ1662に対応する。考えられるすべてのページが、
(ステップ1644で)索引付けられるために選ばれ、それらの完全テキストは
索引付けられなければならない(ステップ1656)。すべての入力と出力の集
合が、SBAが実行する照会によって一覧表示されることは、私達の株式情報例
で理解できる。つまり、サーチエンジンのユーザは、形式入力または動的ページ
に表示されるワードに対して探索できる。後者の場合、対応する入力とは、同じ
組に含まれるものである。
【0124】 例では、SBAによって実行されなければならない照会は、 select stock_info.stock_code,stock_b
rokers.name,rating,stock_name,email
from stock_info,stock_rating,stock_b
rokersであり、 この場合、 sock_info.stock_code=stock.rating.st
ock_codeおよび stock_brokers.name=stock_rating.name
であり、 以下の入力/出力組を示す。
【0125】 形式処理プログラムによって動的ページに載せられる任意の静的テキストは、
ステップ1666で注記される。これらは、通常、同じとなり、このようにして
、動的ページ作成店から動的ページの完全な集合について一度送信されてよい。
探索者は、これらのワードに関して実行されてもよい。静的テキスト、前記デー
タベースコンテンツ(つまり、入力/出力組)および形式処理プログラムのUR
Lなどの情報は、ステップ1668でCIに送信される。
【0126】 いくつかのサイトでは、ページが要求されるときにデータベース検索を回避す
ることによってアクセスを加速するためのデータベースから事前に生成された静
的ページがあるだろう。これらの静的ページは、別個に索引付けされてはならな
いが、むしろSBAは、動的ページについてと同じ方法で組方法を使用してそれ
らを索引付けする。
【0127】 これらのページの生成は、SBA索引付けケース2.3に類似している。相違
点は、ケース2.3は動的ページを作成し、索引付けするが、それらを記憶しな
いが、前記サイトはページを作成し、それらを高速アクセス用の静的ページとし
て記憶するという点である。したがって、これらの作成された静的ページは、そ
れ以外の静的ページによって索引付けることができるだろうが、組の表現は、S
BAがこれらのすべての作成されたページを表すための最もコンパクトな方法で
あり、これらのページを作成するスクリプトは、索引付け時にSBAによって使
用できる。したがって、これらの静的ページは、静的リンクが、動的リンクより
むしろ探索結果ページで作成されるだろうという点を除き、動的ページ組方法(
つまり、ケース2.1)によって処理されなければならない。作成された静的ペ
ージが、動的ページを含み冗長である(つまり、それらが頻繁にアクセスされる
動的ページのキャッシュに入れられたバージョンである)場合、URLの動的バ
ージョンよりむしろ、URLの静的バージョンが中央検索エンジンによって戻さ
れる。SBAは、形式入力から静的URLを構築するJavascriptまた
は類似物を見つける、および/またはステップ1632で動的ページのなんらか
の部分集合の作成スクリプトを発見してよい。
【0128】 ケース2.2 このオプションは、ステップ1664に相当する。このケースでは、CSEは
、ユーザがサーチエンジン照会を行う時点でSQL(類似)照会を実施する。こ
れは、入力のある特定の組み合わせによって指定される動的ページが、有効なコ
ンテンツを含む動的ページを生じさせることを検証するために実行される。
【0129】 この方法では、SBAは、 (i)動的ページを作成するために使用されるデータベースからデータを抽出す
るために形式処理プログラムによって使用され、 (ii)出力列である、 すべてのデータベース列を送信する。
【0130】 ステップ1668では、データベースの列、静的ワードおよび形式処理プログ
ラムのURLなどの情報が、CIに送信される。
【0131】 ケース3.1 このケースは、ステップ1648と1652に相当する。このアプローチは、
実質的には異なる。それは、動的ページの構築で使用できるデータの考えられる
すべての部分を抽出するためにデータベースを照会することを必要としない。む
しろ、SBAは、ステップ1648で形式インタフェースに対して行われる照会
を注記するだけである。効率性の理由から、SBAは、それが数多くのそれらを
観察した後に観察された入力組を送信するにすぎない。これはステップ1652
で実行される。
【0132】 このアプローチの優位点とは、CIで索引付けされている情報が、その有効性
について濾過されている―それは、それが使用されている場合にだけ索引付けさ
れるだろうという点である。
【0133】 1つのアプローチは、SBAがODBC捜査プログラムをインストールする場
合である(初期のステップは、おそらくそのインストールを必要としていた)。
このODBC捜査プログラムは、形式処理プログラムからバックエンドデータベ
ースの中に入る入力を監視する。初期に形式処理プログラムを検査すると、SB
Aは、SQL照会内のワードを見て、その結果それはそれを再び認識できるだろ
う。SBAは、形式入力フィールドからSQL照会の可変スロットへの写像も解
決するだろう。つまり、SBAが実行時にSQL照会を見ると、それは、形式入
力にどの値が入力されたのかを認識できるだろう。
【0134】 加えて、SBAは、動的ページに表示される静的テキストを抽出する。SBA
は、句の探査を可能とするために、これらのワードのワード位置、およびデータ
ベースから抽出されるワードが挿入される位置も送信してよい。
【0135】 それから、SBAは、照会自体を実行する、あるいはそれ以外の何らかの方法
によって、照会が空ではない結果集合を戻すことを確かめる必要がある。結果集
合が空ではなかった場合、SBAはこの入力組をCIに報告できる。
【0136】 SBAは、照会のリストを保つにすぎず、CIに、スレッショルドを上回る一
番上のいくつかを送信するにすぎない。代わりに、SBAは、その一致が一定の
事前設定されたスレッショルドを渡した後に、CIに対する照会を報告してよい
【0137】 ケース4.1 このケースは、ステップ1650と1654で実現される。このケースは、ケ
ース3.1に非常に類似している。唯一の相違点は、SBAが、形式インタフェ
ースに対するユーザ照会を見ると、SQL照会によって戻される値も注記すると
いう点である。これは、照会自体を繰り返す、またはそれ以外の何らかの方法に
よって実行されてよい。
【0138】 SBAは、ここで、CIに全体的な入力/出力組を送信できる。再び、動的ペ
ージは、それらの実用性に従ってCIで索引付けされるだろう。
【0139】 加えて、SBAは、動的ページに表示される静的テキストを抽出する。SBA
は、句の探索を可能とするために、これらのワードのワード位置およびデータベ
ースから抽出されるワードが挿入されるワード位置も送信する。
【0140】 ケース2.3および4.2 これらのケースでは、SBAは、考えられるすべての動的ページのインデック
スを、それらが静的ページであるかのように作成する。したがって、動的ページ
を索引付けするために説明される詳細な方法は、これらのケースでは当てはまら
ない。
【0141】 2.2.2.4 CI記憶要件 ケース1およびケース2は、概して、ケース3および4より、さらに多くの記
憶域をCIで必要とするだろう。これは、最初の2つのケースが、サイトの考え
られるすべての動的ページを索引付けしようと試みるためである。第2の2つの
ケースは、サイトで最も一般的な動的ページだけを索引付けしようと試みる。
【0142】 2.2.2.5 データベーストリガ ステップ1668は、SBAのインストール後に直接的に実行される索引付け
の最後にマークをつける。ステップ1670以降に、データベースに対する変更
を送信する問題が対処される。
【0143】 任意のサーチエンジンインデックスにまつわる重要な問題は、その中の情報の
現在性を維持することである。バックエンドデータベース内での情報の大規模な
記憶を考慮すると、中央サーチエンジンが最新であることは重要である。
【0144】 これを達成するための1つの方法は、データベーストリガを使用することによ
る。SBAは、動的ページの索引付け情報に影響を及ぼす列が変化するときに、
それと通信するデータベーストリガをインストールしてよい。
【0145】 典型的なデータベースは、データベース表あたり1つの特定のタイプのトリガ
だけを可能にする。このため、ステップ1670で、SBAが、その表を利用す
るあらゆる動的ページ作成点に関連する変更についてSBAに通知する表ごとの
単一トリガを構築することが便利である。ステップ1672では、SBAは、d
yndb_list内のエントリによって使用されるすべてのデータベースで構
築されたトリガをインストールする。
【0146】 以下は、株式情報例でのstock_infoデータベース表にインストール
される可能性のある例のトリガである。これは、完全テキスト索引付けが使用さ
れていた場合(つまり、ケース2と4)に使用されるトリガだろう。入力だけが
索引付けされている場合には、stock_code列だけがチェックされる必
要があるだろう。また、株式情報例のその他のデータベース表でのトリガに対す
るニーズもある。 CREATE or REPLACE TRIGGER SENDER() AFTER INSERT or UPDATE OF stock_code
, stock_name ON stock_info FOR EACH ROW DECLARE Msg varchar(30); PipeName varchara(30); Laststatus integer; TraceMode varchar(30); BEGIN PipeName:=‘Slavko’ Laststatus :=0; If(new.stock_code is not null)then Msg:=Msg||‘:stsock_info:’||‘stock_c
ode:’||:new.stock_code; end if; if(:new.surname is not null)then Msg:=Msg||‘stock_info:’||‘stock_nam
e:’||:new.surname; end if; DBMS_PIPE.pack_message(Msg); LastStatus:=DBMS_PIPE.send_message(P
ipeName); DBMS_OUPUT.put_line(‘message sent’) END;
【0147】 このトリガは、データベースパイプを使用することによって、SBAに関連す
るデータベースに対する変更を、それらが発生したときに通知するだろう。SB
Aは、ステップ1678で変更について聞くと、それはCIに知らせる。それは
、即座にこれを行うか、あるいは更新のバッチが蓄積するまで待機することがで
きる。
【0148】 索引付け情報がデータベース列として送信されている場合、これは自明である
。行が挿入されると、SBAはこの新しい行をCIに送信する。CIはそれを順
方向インデックスエントリに追加し、そこからワードを反転インデックスに入れ
る。行が削除された場合、それは、どの行番号かを特定する。SBAはCIに告
げ、それは順方向インデックスから行を削除する。それは反転インデックスを調
べ、古いワードも削除する。行が更新されている場合には、行番号は既知である
。CIはこの行を取り、値を適切に変更する。あらゆる新しいワードは反転イン
デックスに追加される。削除されたワードは、その反転インデックスエントリか
ら取り除かれる。
【0149】 索引付け情報が組みとして送信されている場合、データベース行に変更が加え
られた後に、SBAは、この変更によって影響を受ける組を選択する照会を実施
できる。例えば、「jackson(ジャクソン)」と呼ばれる仲買人が名前を
「stevens(スチーブンス)」に変更する場合、例について変更された組
を検出するための探索は、以下 select stock_info.stock_code,rating,
stock_name,email from stock_info,stock_rating,stock_b
rokers where stock_brokers.name=‘stevens’ and stock_info.stock_code=stock_rating.s
tock_code and stock_brokers.name=stock_rating.name
となり、以下の結果を示す。
【0150】 SBAは、変更される特定のデータベース列にアクセスするすべての形式処理
プログラムについて、影響を受けた組を計算する。CIは、すべての古い組の位
置を突き止め、それらを削除するか、更新する。
【0151】 2.2.2.6 CI214の構造およびCSE216の動作 CIの基本的な構造は、順方向インデックスおよび逆転インデックスを含む。
静的ページについては、情報は、既存のサーチエンジンによって使用されるよう
な確立された技法を使用して、これらのインデックスに記憶される。静的ページ
の順方向インデックスエントリ1702の例および逆転インデックスエントリ1
704は、辞典の例のエントリ1706とともに(表記「field:x」は、
フィールドのxビットを示す)図17に図示されている。ヒットのフォーマット
は16ビットを備え、12ビットは文書中のワードまたは用語の位置用であり、
4ビットはテキスト大文字使用のためのその他の情報用である。ケース2.1と
4.1でのように、組の記憶を含む、CIによって動的ページ作成点のための順
方向インデックスエントリ1802のために使用される構造は、図18に図示さ
れており、反転インデックスエントリ1804はケース2.1と4.1用であり
、辞典エントリ1806は逆転インデックスとともに使用される。このケースで
は、ヒットのフォーマットは、16ビットを使用して記憶されてよい組番号にす
ぎない。
【0152】 図18は、動的ページを索引付けするための順方向インデックスエントリおよ
び逆転インデックスエントリを使用するCI構造の例である。順方向インデック
スは、動的ページ作成点全体についての情報のブロックを含む。これらのブロッ
クのそれぞれは、番号(dynID)で索引付けられる。これらのブロックの中
で、SBAによって送信される情報の組または列は、前述されたように記憶され
る。
【0153】 列または組に加えて、SBAによって送信されただろう動的ページ作成に関係
する情報の数多くのそれ以外の部分がある。これらは、形式ページのURL(図
18のfURL)、形式処理プログラムのURL(図18のflipURL)、
形式のメソッド(GETまたはPOST)(図18の方法)、形式入力フィール
ドの数(図18のnfields)、それらの名前(図18のfield1 f
ield2)、およびそれらが相当するデータベース列を含む。形式ページのタ
イトル(図18のタイトル)、形式ページからの初期テキスト、および動的ペー
ジで発生する静的なワードのリストなどのメタ情報もあるだろう。
【0154】 ケース1.2またはケース2.2について、形式処理プログラムによって使用
されるSQL照会は、順方向インデックスエントリにも記憶されるだろう。また
、組が次々に記憶される代わりに、SQL照会内で言及されるデータベース列が
記憶されるだろう。順方向インデックスにデータベース列を記憶することの代替
策として、それらは、標準データベースに記憶できる。これが、SQL照会のさ
らに容易な実行を可能にするだろう。
【0155】 逆転インデックスは、wordIDで索引付けされる特定のワードに関する情
報のブロックを含む。これらの情報のブロックは、各dynIDの後にワードの
発生のリスト、その動的ページ作成点の「ヒット」が続くdynIDのリストか
ら成り立つだろう。dynIDは、動的ページ作成点のID番号を指す。ヒット
の実際の性質は、動的ページ作成点のために使用されてきた索引付け方法に依存
する。dynIDは、句の探索を可能にするために、入力と出力を、動的ページ
上での静的ワード位置に連結する情報も指す。
【0156】 2.2.2.7 ヒットの記述 ケース1.1、2.1、3.1および4.1の逆転インデックスにおけるヒッ
トは、ワードが発生する組の数にすぎない。組番号は、図18に図示されるよう
に、順方向インデックス内のそのdynID用の組のリスト内での組の位置を指
す。
【0157】 ケース1.2および2.2の場合、逆転インデックス内のヒットは、ワードが
順方向インデックスで発生する列および行を指す。
【0158】 ケース2.3または4.2でのような静的ページ、つまり動的ページ上の静的
テキストのヒットは、図17に図示されるように、ページ上のそのワード位置に
、テキスト属性などのそれ以外の情報を加えたものにすぎない。
【0159】 2.2.2.8 株式情報例のCSEとCI間の対話 ケース2.1または4.1について株式情報例でCIに送信されるデータは、
以下の組を有している。
【0160】 すべての組は、それらが順方向リンク内にあるように記憶されるだろう。CS
Eは、組の中の列のどれが形式入力に相当するのかを注記する―つまり、株式情
報例のケースでは最初の2つ。
【0161】 ユーザは、「jackson」AND(論理積)「Yahoo」に対する探索
を実行できる(この場合、ANDはブール演算子である)。CSEは、その逆転
インデックスエントリから、これらのワードの少なくとも1つが発生する組を認
識する。事前結果リストは、探索ワードの1つに一致するあらゆる組を有するす
べてのdynIDを含む。リストは、ワード「Yahoo」を含む組についての
ワード「jackson」と2つの組番号を含む組についての3つの組番号を含
むbroker.html動的ページ作成点に対する事前結果エントリを有する
だろう。
【0162】 それから、CSEは、(ユーザがAND探索を要求したので)探索ワードの両
方含む組、およびこれらの組の組番号を有するそれらのdynIDを特定する。
株式情報例では、両方の探索ワードを含む1つの組があるため、broker.
htmlのそのdynIDが戻される。
【0163】 それから、CSEは、戻された組番号、つまり組み5の入力を見て、照会文字
列を作成する。このケースでは、入力は、組の最初の2つの列である。組5では
、値は「YHOO」と「jackson」である。形式フィールド名も順方向イ
ンデックスエントリに記憶されているので、CSEは、 scode=YHOO&bname=Jackson である照会文字列を構築できる。
【0164】 CSEは、(やはり順方向インデックスに記憶される)形式処理プログラムの
URLもチェックする―このケースでは、それは、 http://www.stockadvice.com/cgi−bin/b
rokerdata である。
【0165】 それから、CSEは、以下のとおりに動的ページの全体的なURLを構築する
ためにこれらをまとめる。 http://www.stockadvice.com/cgi−bin/b
rokerdata?scode=YHOO&bname=jackson
【0166】 探索は、動的ページに表示されるそれ以外のワードも含む。特に株式情報例お
よび図9Cに関して、ワード「broker」はすべての動的ページに表示され
る。このケースでは、dynID 5000も含む逆転インデックスにヒットが
ある。それは、静的ワード上のヒットとしてマークされるだろう。
【0167】 2.3 アプレットページの索引付け アプレットは、データベースにアクセスするために一般的に使用されている別
の方法である。アプレットは、Javaで作成される小さなプログラムである。
アプレットは、ウェブページのhtmlコードで名前を指定され、ユーザがその
ウェブページを見ると、アプレットは、ウェブページとともにユーザのコンピュ
ータにダウンロードされる。それから、該アプレットプログラムは自動的に実行
される。アプレットは、ウェブページ上でテキストを入力するためのボックス、
およびこのテキストを提出するためにクリックするためのボタンを提示できる。
提出時、アプレットは、照会の結果を示すために、ページ上の外観の変化を生成
することができる。
【0168】 これらのページは、前述された意味では動的ページではないが、それらはユー
ザ入力を受け入れ、バックエンドデータベースから引き出される結果を表示する
ことができるという特徴を有する。
【0169】 データベースがアプレットからアクセスされてよい2つの主要な方法がある。
第1に、アプレットは、データベース自体に連結するための文を含んでよい。そ
れ以外の主要なオプションは、アプレットがその結果としてデータベースアクセ
スを実施する別のJavaクラスでリモートメソッド呼び出しを実行するという
ことである。
【0170】 2.3.1 アプレット用のサーバベースエージェント SBAは最初にインストールされると、それはウェブサイトのディレクトリツ
リーを調べ、各htmlページをチェックする。前述されたように、SBAは、
形式タグを含むページを特定することができる。このケースでは、それはアプレ
ットタグを含むページも探す。
【0171】 これらのページを、データベースにアクセスするにすぎないアプレットに狭め
るために、SBAはJavaバイナリからascii文字列を見て、SQL照会
を特定する。アプレット自体がデータベースにアクセスする場合、SBAは、ア
プレットから文字列内のSQL照会を見つける必要がある。SQL文が見つけら
れる場合、このページが、その出力がデータベースへのアクセスを伴うページで
あると見なされる。
【0172】 それ以外のケースは、アプレットが、リモートメソッド呼び出しを使用して、
データベース照会を実行するクラスを呼び出してよいということである。アプレ
ットに呼び出されるこのJavaクラスはアプレットコードと同じディレクトリ
内になければならない。また、アプレットによって呼びだされるあらゆるクラス
の名前はアプレットに対する文字列のリスト内で発生するだろう。したがって、
SBAはアプレットコード内で名前が指定され、ウェブサイトディレクトリツリ
ーの上位装置として働く機械上でのアプレットのディレクトリ内で発生する各ク
ラスから抽出される文字列をチェックする。これらのどれかがSQL文を含んで
いる場合には、アプレットタグを含んでいた元のページが、バックエンドデータ
ベースにアクセスするページであると見なされる。
【0173】 ユーザ名およびパスワードの決定は、前述されたように形式処理プログラムと
同様に起こる。バイナリ内の文字列が特定される。ユーザ名およびパスワードは
Javaデータベース接続性(JDBC)接続文で指定される。データベースへ
の接続に加え、SBAは、JDBC URLについての情報を決定する必要があ
る。アプレットのケースでは、JDBC URLは、すでに存在するだろう―し
たがって、SBAはそれに直接的にアクセスできる。
【0174】 このケースは、バックエンドデータベースにアクセスするためにテキストフィ
ールド入力を使用するアプレットページを索引付けすることを伴う。それから、
SBAはデータベースにアクセスするために使用されるテキストフィールド入力
の名前を決定する。これは、前述された形式入力フィールドの名前に同等である
。SBAは、アプレットのフィールドの名前を見る、アプレットのサブクラスを
作成することによってこれを達成する。 class Extract extends OriginalApplet
{ public static voidmains(String[]argv
){ Field[]fds=OriginalApplet.getFields
(); } }
【0175】 それから、これは初期にアプレットがバックエンドデータベースにアクセスす
ることを検証することが判明していたので、SBAは、アプレットによって使用
されるSQL照会を考慮する。
【0176】 テキストフィールドをデータベース列に一致させるプロセスは、形式処理プロ
グラムに関して同じである。SBAは、バックエンドデータベースに送信される
照会を監視するODBC捜査プログラムをインストールする。それから、SBA
は、アプレットに照会を送信し、作成されるSQL照会を監視する。
【0177】 CIの構造およびSBAからCIに送信される情報は、一般的に、動的ページ
のケースに関して同じである。この情報は、テキストフィールド入力に対応する
入力組またはデータベース列を含む。
【0178】 サーチエンジンの結果ページ上でクリック可能なリンクを作成するために、S
BAは、元のアプレットのサブクラスであるそのサイトで新しいアプレットをイ
ンストールする。SBAは新しいアプレットを含む新しいページもインストール
する。
【0179】 サーチエンジンの結果ページに表示されるリンクは、SBAによってインスト
ールされる別のスクリプトに対してだろう。このスクリプトは、サーチエンジン
によって送信される照会文字列を読み取り、パラメータとしてサーチエンジンに
よって送信された照会文字列を含むことによって新しいアプレットを含むページ
上のアプレットタグを改変する。それから、スクリプトは、新しいアプレットを
含むページに宛先変更する。新しいアプレットはオリジナルのサブクラスである
。そのinit()メソッドにおいて、それは照会文字列の中で読み取り、テキ
ストフィールド内で相応してテキストを設定し、提出ボタンのクリックを真似る
。このコードの部分の例は以下のとおりである。 Public class ResultApplet extends DB
Applet{ Button submit=new Button(“Enter”); public void init(){ super.init(); field1.setText("sometext"); SubmitActionListner sal=new SubmitAc
tionListener(this); Submit.addActionListener(sal); Sal.actionPerformed(null); } }
【0180】 2.3 ウェブサーバ統計 SBAは、そのローカルサーバについての有効な統計情報も収集してよい。 (i)ローカルサーバによって作成されるログファイルにアクセスすること (ii)HTTP接続を直接的に監視すること (iii)サーバと統合されているSBAのケースでは、内部データ構造にアク
セスすることによって、 SBAがこの情報を収集してよい数多くの方法がある。
【0181】 SBAによって収集されてよい統計は多数であり、 (i)ページまたはサイトに対するヒットの数 (ii)このページからリンクされたページ(つまり、ユーザがこのページに到
達する単にやってきた元のページであり、これは、ユーザが探索照会ページから
きた場合には、(探索のURLから入手可能な)使用されたサーチエンジンキー
ワードを含むことがある。 (iii)ページ、ページセットまたはウェブサイトで過ごした時間量 (iv)彼らのアドレス、ロケーション等ユーザについてのデモグラフィックス
情報 (v)単一ページのパケット間の時間およびページ要素(例えば、画像、アプレ
ット、音等)間の時間を含む、サーバの帯域幅統計 を含む。
【0182】 SBAによって収集されるこの情報は、それ以外の情報と類似した方法でCI
に送信されてよい。それは、 (i)個々のサーチエンジンユーザのデモグラフィックスプロファイルに探索結
果を合わせるために、 (ii)最も高速の応答を出すことができなければならないサイト(例えば、ミ
ラーサイト等)にユーザを向けるために、 (iii)ユーザがページで過ごした平均時間、ユーザのデモグラフィックスプ
ロファイル、および/またはある特定のページを見つけた過去の探索で使用され
たキーワードおに従ってサーチエンジン結果を格付けするために、 使用されてよい。
【0183】 2.4 E−コマースアプリケーション E−コマースは、動的ページに関する索引付け情報を提供するSBAの専門家
アプリケーションである。CIは、ショッピングサイトにインストールされるS
BA用のe−コマースポータルを提供するために使用されてよい。索引付けられ
てよい情報は、 (i)製品名/型/製造メーカ等 (ii)大量価格設定と割引、税金等を含む価格 (iii)ロケーション (iv)納品時間および運送費用オプション (v)品質およびレビュー (vi)製品の写真 (vii)保証情報 (viii)支払いオプション、ポイントプログラム等 を含む。
【0184】 E−コマースポータルは、運賃を含む価格、納品時間、保証期間とロケーショ
ン、品質とレビュー、および支払い要件などの1つの基準または基準の組み合わ
せに基づいた探索を提供してもよい。
【0185】 購入は、CIのポータルを通して発生してよい、あるいはユーザは関連するe
−コマースサイトに向けられてよい。
【0186】 CIのe−コマースポータルは、買い手のロケーションおよび製品の物理的な
ロケーション、売上税、および関税発行等に基づいた最適コスト(運賃コスト)
を特定するために総費用計算を実行してよい。
【0187】 SBAは、e−コマースサイトを構築するためのe−コマースパッケージを含
んでよく、CIのe−コマースポータルまたはローカルサイトのどちらかを通し
て支払いおよび運賃が発生するためのオプションが存在する。
【0188】 明細書を通して、インターネットに関して、ウェブサーバを使用して、htm
lページの形を取るウェブサイトに関連してインデクシングシステムを使用する
ことに対して参照がなされてきた。しかしながら、発明は、探索目的のために索
引付けされてよいデータへのアクセスを提供する任意の形のサーバにも適用可能
であることが理解されるべきである。
【0189】 多くの修正は、添付図面に関して、前述されたように、保温発明の範囲から逸
脱することなく当業者に明らかになるだろう。
【図面の簡単な説明】
【図1】 インターネットへの接続に適切なコンピュータシステムの概略図
である。
【図2】 インターネットに接続されたインデクシングシステムの好ましい
実施形態の概略図である。
【図3】 インデクシングシステムの古いリンクを処理するための基本的な
方法のフロー図である。
【図4】 インターネットに接続されたインデクシングシステムのサーバベ
ースエージェントを含む3つのウェブサーバの例を示す概略図である。
【図5】 サーバベースエージェントおよびインデクシングシステムの中央
ボックスを含む3つのウェブサーバの例を示す概略図である。
【図6A】 別のウェブサーバ上の文書にリンクされた文書が変化した旨の
情報を受信したことに対する、サーバベースエージェントの応答のフロー図であ
る。
【図6B】 別のウェブサーバ上の文書にリンクされた文書が変化した旨の
情報を受信したことに対する、サーバベースエージェントの応答のフロー図であ
る。
【図7】 別のウェブサーバ上でリンクされる文書が変化した、または移動
した旨をウェブ作者に通知するサーバベースエージェントのフロー図である。
【図8】 ブックマークに対する変更を更新するために、ウェブブラウザが
中央インデックスとどのようにチェックするのかに関するフロー図である。
【図9A】 株式コードおよび株式仲買人の氏名を入力するための形式入力
を含むウェブページの例である。
【図9B】 入力が形式入力フィールド内でなされた状態の、図9Aと同一
の例である。
【図9C】 図9Bの提出ボタンを押すと戻るウェブページを示す。
【図10】 データを形式ページに入力することによって動的ページがどの
ようにして作成されるのかを示す概略図である。
【図11】 サーバベースエージェント、静的ページおよびデータベースを
含み、かつ要求時に動的ページを作成する処理プログラムからのウェブサーバを
示す概略図である。
【図12】 動的ページに索引付けするためのサーバベースエージェントの
プロセスのフロー図である。
【図13】 中央インデックスのブロック図である。
【図14】 中央インデックスによって実行されるプロセスのフロー図であ
る。
【図15A】 動的ページ索引付けのためのインデクシングシステムの中央
サーチエンジンによって実行されるプロセスのフロー図である。
【図15B】 動的ページ索引付けのためのインデクシングシステムの中央
サーチエンジンによって実行されるプロセスのフロー図である。
【図16A】 動的ページ索引付けのためにサーバベースエージェントによ
って実行されるプロセスのフロー図である。
【図16B】 動的ページ索引付けのためにサーバベースエージェントによ
って実行されるプロセスのフロー図である。
【図16C】 動的ページ索引付けのためにサーバベースエージェントによ
って実行されるプロセスのフロー図である。
【図16D】 動的ページ索引付けのためにサーバベースエージェントによ
って実行されるプロセスのフロー図である。
【図17】 中央インデックスの順方向インデックスおよび反転インデック
ス内の静的ページインデックスエントリ用の例の構造を示す図である。
【図18】 中央インデックスの順方向インデックスおよび反転インデック
ス内の動的ページインデックスエントリの例の構造を示す図である。
【符号の説明】
102 CPU、104 メモリシステム、106 アダプタ、108 二次
記憶装置、110 ネットワークインターフェース、112 ディスプレイアダ
プタ、114 ユーザインターフェースアダプタ、115 システムバス、11
6 ディスプレイ、200 コンピュータシステム、208 サーバベースエー
ジェント、214 中央インデックス、219 中央サーチエンジン、222
サーバベースエージェント。
───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,CY, DE,DK,ES,FI,FR,GB,GR,IE,I T,LU,MC,NL,PT,SE,TR),OA(BF ,BJ,CF,CG,CI,CM,GA,GN,GW, ML,MR,NE,SN,TD,TG),AP(GH,G M,KE,LS,MW,MZ,SD,SL,SZ,TZ ,UG,ZW),EA(AM,AZ,BY,KG,KZ, MD,RU,TJ,TM),AE,AG,AL,AM, AT,AU,AZ,BA,BB,BG,BR,BY,B Z,CA,CH,CN,CR,CU,CZ,DE,DK ,DM,DZ,EE,ES,FI,GB,GD,GE, GH,GM,HR,HU,ID,IL,IN,IS,J P,KE,KG,KP,KR,KZ,LC,LK,LR ,LS,LT,LU,LV,MA,MD,MG,MK, MN,MW,MX,MZ,NO,NZ,PL,PT,R O,RU,SD,SE,SG,SI,SK,SL,TJ ,TM,TR,TT,TZ,UA,UG,US,UZ, VN,YU,ZA,ZW (72)発明者 デイビッド・マーティン・ウォード・パワ ーズ オーストラリア5050サウス・オーストラリ ア州ベルビュー・ハイツ、ハイランド・ド ライブ72番 Fターム(参考) 5B075 KK33 KK37 NK02

Claims (74)

    【特許請求の範囲】
  1. 【請求項1】 サーバから利用可能なデータのインデックスを作成する方法
    であって、 前記サーバ上でデータを処理して中央インデックス用のデータアイテムにアク
    セスすることであって、前記データアイテムがネットワークアドレスおよび用語
    を含むことと、 前記データアイテムを含むインデックスファイルをコンパイルすることと、 前記中央インデックスに前記インデックスファイルを伝送することとを含む、
    方法。
  2. 【請求項2】 前記処理が、前記データアイテムの変化を突き止めることを
    含み、前記インデックスファイルが前記データアイテムの前記変化を備えるイン
    デックスデルタファイルである、請求項1に記載の方法。
  3. 【請求項3】 前記処理が、前記データ中にデータベース照会文を配置する
    ことを含み、前記データアイテムが前記文のための入力組を含む、請求項1に記
    載の方法。
  4. 【請求項4】 前記データアイテムが、前記文に対応するデータベースにア
    クセスするための追加データを含む、請求項3に記載の方法。
  5. 【請求項5】 前記追加データが、形式処理プログラムのネットワークアド
    レスを含む、請求項4に記載の方法。
  6. 【請求項6】 追加データが、形式ページのネットワークアドレスと、デー
    タベースの組および列用の入力フィールドに関する詳細とを含む、請求項5に記
    載の方法。
  7. 【請求項7】 追加データが、形式ページからの用語と、形式ページで提出
    された組に応じて形式処理プログラムが生成した動的ページからの用語を含む、
    請求項6に記載の方法。
  8. 【請求項8】 前記追加データが、データベース型および名前などのデータ
    ベースにアクセスするための追加の詳細と、ユーザ名およびパスワードなどのア
    クセス用認証データとを含む、請求項6に記載の方法。
  9. 【請求項9】 前記処理が、前記組を抽出するために前記サーバで受信され
    たデータ要求を処理することを含む、請求項3に記載の方法。
  10. 【請求項10】 前記データアイテムが出力組を含む、請求項3に記載の方
    法。
  11. 【請求項11】 前記処理が、受信したデータ要求と、前記組を抽出するた
    めに前記サーバで生成される応答とを処理することを含む、請求項10に記載の
    方法。
  12. 【請求項12】 前記処理が、前記文および前記入力組を使用して動的ペー
    ジを作成することを含み、前記データアイテムが前記動的ページの用語を含む、
    請求項3に記載の方法。
  13. 【請求項13】 前記処理が、データ要求に応じて前記サーバから伝送され
    る動的ページを処理することを含み、前記データアイテムが前記動的ページの用
    語を含む、請求項1に記載の方法。
  14. 【請求項14】 前記処理が、前記照会文と関連付けられたタグに基づいて
    動的ページを特定することを含む、請求項3に記載の方法。
  15. 【請求項15】 前記タグが形式タグである、請求項14に記載の方法。
  16. 【請求項16】 前記タグがアプレットタグであり、前記コンパイルするこ
    とが、アプレットタグが特定したアプレットに前記入力組を提出するために提出
    アプレットを生成することを含み、前記データアイテムが提出アプレット用のネ
    ットワークアドレスを含む、請求項14に記載の方法。
  17. 【請求項17】 前記決定することが、前記データ内の照会文によってアク
    セス可能なデータベースの列の変化を検出するためにデータベーストリガをイン
    ストールすることを含み、前記変化が前記列の前記変化を含む、請求項2に記載
    の方法。
  18. 【請求項18】 前記処理が、前記データからのリンク対を生成することを
    含み、前記リンク対がソースネットワークアドレスおよびターゲットネットワー
    クアドレスを含み、前記データアイテムが前記対を含む、請求項2に記載の方法
  19. 【請求項19】 前記対の少なくとも1つの変化を検出することと、前記対
    の前記ソースアドレスに対応するロケーションに変更通知を送信することとを含
    む、請求項18に記載の方法。
  20. 【請求項20】 前記変更通知を受け取ることと、前記変化に基づいて前記
    ソースドレスに関連付けられる前記データを調整することとを含む、請求項19
    に記載の方法。
  21. 【請求項21】 前記調整することが、前記ターゲットアドレス付きのタグ
    を新しいターゲットアドレスへのタグで置換することを含む、請求項20に記載
    の方法。
  22. 【請求項22】 前記対の少なくとも1つの変化を検出することと、前記タ
    ーゲットアドレスに対応するロケーションに変更通知を送信することとを含む、
    請求項18に記載の方法。
  23. 【請求項23】 前記変更通知を受け取ることと、前記ターゲットアドレス
    に関連付けられたサーバで前記変化に基づいてリンク参照ページを確立すること
    とを含む、請求項22に記載の方法。
  24. 【請求項24】 前記処理が、前記サーバで受け取られるデータ要求および
    前記サーバから送信されるデータ応答に関係付けるなどの、前記サーバ上で統計
    データにアクセスすることを含み、前記データアイテムが統計データを含む、請
    求項1に記載の方法。
  25. 【請求項25】 前記方法が、前記中央インデックス用のエージェントによ
    って実行される、前述の請求項のいずれか1項に記載の方法。
  26. 【請求項26】 前記エージェントが前記サーバ上にある、請求項25に記
    載の方法。
  27. 【請求項27】 請求項1〜24のいずれか1項に記載の方法のステップを
    実行するための構成要素を有するエージェント。
  28. 【請求項28】 インデックスデータベースを有する、前記中央インデック
    スで前記インデックスファイルを受け取ることと、 前記インデックスファイル内のエントリに基づいて前記インデックスデータベ
    ースを維持することであって、前記インデックスデータベースがサーチエンジン
    によって使用されるために適応されることとを含む、請求項1〜24のいずれか
    1項に記載の方法。
  29. 【請求項29】 前記インデックスデータベースが、前記データアイテムの
    インデックスエントリを含み、前記インデックスファイルおよび前記インデック
    スデータベースの前記エントリが、前記データアイテムを有するデータのページ
    に対応する、請求項28に記載の方法。
  30. 【請求項30】 前記インデックスデータベースが、前記データアイテムの
    用語の辞書を含み、前記インデックスデータベースが、前記サーチエンジンによ
    って受け取られるサーチエンジン照会に応えて、ネットワークアドレスを構築し
    、前記データアイテムに基づいて動的ページを作成するために前記サーチエンジ
    ンによってアクセス可能である、請求項29に記載の方法。
  31. 【請求項31】 請求項1〜24および28〜30のいずれか1項に記載の
    方法のステップを実行するための構成要素を有するインデクシングシステム。
  32. 【請求項32】 動的ページを生成するためのプログラム用のプログラムア
    ドレス、およびページを作成するためにプログラムに提出するための入力組を含
    むページエントリと、 動的ページを特定し、探索用語に対応する組を特定する探索エントリとを含む
    、サーバからアクセス可能なデータのインデックス。
  33. 【請求項33】 探索照会の探索用語に対応する動的ページを特定するため
    に探索エントリにアクセスするための手段と、 特定された動的ページについてアドレスを生成するためにページエントリにア
    クセスするための手段であって、前記アドレスが前記プログラムアドレスおよび
    前記組に基づいて生成される手段とを含む、請求項32に記載のインデックス上
    で動作可能なサーチエンジン。
  34. 【請求項34】 請求項27に記載のエージェントと、 請求項32に記載のインデックスと、 請求項33に記載のサーチエンジンとを含む、インデクシングシステム。
  35. 【請求項35】 少なくとも1つのサイトへのアクセスを提供するためのサ
    ーバと、 サイトに関係するデータのインデックスファイルを作成するためのサーバエー
    ジェントと、 インデックスファイルからインデックス情報を記憶するための中央インデック
    スであって、そこではサーバエージェントがインデックスファイルの転送のため
    に、中央インデックスとの通信を開始する中央インデックスとを含む、インデク
    シングシステム。
  36. 【請求項36】 サーバエージェントが、少なくとも1つのサイトをレビュ
    ーし、少なくとも1つのサイトへの変更を表すインデックスデルタファイルをコ
    ンパイルするように適応され、デルタファイルがインデックス情報を更新するた
    めに中央インデックスに伝送される、請求項35に記載のインデクシングシステ
    ム。
  37. 【請求項37】それぞれのインデックスファイルおよび/またはインデック
    スデルタファイルを中央インデックスに伝送するために配列される複数のサーバ
    および関連付けられたサーバエージェントを含む、請求項36に記載のインデク
    シングシステム。
  38. 【請求項38】 各デルタファイルが、それぞれのサーバのサイトでリンク
    の有効性に影響を及ぼすあらゆる変化に関する情報を含む、請求項37に記載の
    インデクシングシステム。
  39. 【請求項39】 サーバエージェントが、前記変化を特定する際に、変更の
    結果生じた無効にされたリンクを含む別のサイトに関連付けられる対応するサー
    バに、変更の通知を伝送するように配列される、請求項38に記載のインデクシ
    ングシステム。
  40. 【請求項40】 中央インデックスが、変更によって影響を受けたサイトを
    特定し、そのサイトに関連付けられた対応するサーバに通知を伝送するように適
    応される、請求項39に記載のインデクシングシステム。
  41. 【請求項41】 通知が、通知受信時に、対応するサーバおよび/または関
    連サイトに関する情報を更新するためのアクションを実施するように適応されて
    いる対応するサーバのそれぞれのサーバエージェントに伝送される、請求項40
    に記載のインデクシングシステム。
  42. 【請求項42】 通知が、対応するサーバの管理者に伝送され、通知受信時
    に、管理者が対応するサーバおよび/または関連するサイトに関する情報を更新
    するためのアクションを実施できる、請求項40に記載のインデクシングシステ
    ム。
  43. 【請求項43】 少なくとも1つのサイトが、データベースへのアクセスに
    よって作成される動的ページにサービスを提供し、動的ページのインデックスフ
    ァイルが、対応する形式処理プログラムによって有効なページを作成するであろ
    う、考えられる入力を含む、請求項37に記載のインデクシングシステム。
  44. 【請求項44】 インデックスファイルが、さらに、動的ページの考えられ
    る出力およびテキストを含む、請求項43に記載のインデクシングシステム。
  45. 【請求項45】 動的ページに関連付けられるサーバエージェントが、デー
    タベースにアクセスし、インデックスファイル内のデータベースの1つまたは複
    数の列を含むように適応される、請求項43に記載のインデクシングシステム。
  46. 【請求項46】 動的ページに関連付けられるサーバエージェントが、デー
    タベースのあらゆる変化を特定するためにデータベース内にトリガを導入し、変
    化が動的ページに関連付けられるインデックスデルタファイルに含まれる、請求
    項43に記載のインデクシングシステム。
  47. 【請求項47】 動的ページに関連付けられるインデックスファイルが、ユ
    ーザがそこから過去に検索したページの入力の記録を含む、請求項43に記載の
    インデクシングシステム。
  48. 【請求項48】 動的ページに関連付けられるインデックスファイルが、ユ
    ーザが過去に検索した動的ページの完全テキストページのインデックスを含む、
    請求項43に記載のインデクシングシステム。
  49. 【請求項49】 入力/出力組または行/列索引付けが記憶される各動的ペ
    ージに関連付けられたインデックスファイルが、さらに、形式処理プログラムお
    よびページに関連付けられたテキストを特定するための識別子を含む、請求項4
    3に記載のインデクシングシステム。
  50. 【請求項50】 サーチエンジンに応じて中央インデックスにアクセスする
    ためのサーバを含む、請求項43に記載のインデクシングシステム。
  51. 【請求項51】 サーバが提供するサイトを索引付けするためにサーバエー
    ジェントを提供することと、 サイトのサイトデータを表すインデックスファイルをコンパイルすることと、 中央インデックスにファイルを伝送し、サーバエージェントがインデックスフ
    ァイルの転送のために中央インデックスとの通信を開始することとを含む、索引
    付けする方法。
  52. 【請求項52】 サーバエージェントがサイトを処理し、1つまたは複数の
    サイトに対する変更を表すインデックスデータファイルをコンパイルし、デルタ
    ファイルが、中央インデックスが保持するインデックス情報を更新するために中
    央インデックスに伝送される、請求項51に記載の索引付けする方法。
  53. 【請求項53】 サーバエージェントがサイトに関するリンク情報を記録し
    、リンク情報の有効性に影響を及ぼすあらゆる変化がデルタファイルに記録され
    る、請求項52に記載の索引付けする方法。
  54. 【請求項54】 関連付けられたサーバエージェントのある複数のサーバの
    内の1つでの前記変更を特定し、それぞれのサーバエージェントから、変更の通
    知を、そのリンクの別のサイトに関連付けられた対応するサーバに伝送すること
    を含む、請求項53に記載の索引付けの方法。
  55. 【請求項55】 中央インデックスが、サイトアドレスのリストを有し、前
    記変更を示すデルタ機能の受信時に、変更によって影響を及ぼされる、関連付け
    られたサイトが特定され、通知が影響を及ぼされるサイトの対応するサーバに送
    信される、請求項53に記載の索引付けする方法。
  56. 【請求項56】 通知が、前記通知受信時に、対応するサーバおよび/また
    は関連するサイトに関する情報を更新するためのアクションを実施する対応する
    サーバの関連サーバエージェントに伝送される、請求項54または55に記載の
    索引付けする方法。
  57. 【請求項57】 通知が対応するサーバの管理者に伝送され、通知の受信時
    に、管理者が対応するサーバおよび/または関連するサイトに関する情報を更新
    するためのアクションを実施できる、請求項54または55に記載の索引付けす
    る方法。
  58. 【請求項58】 インデックスファイルが、サイトの動的ページに関係する
    情報を含む、請求項51に記載の索引付けする方法。
  59. 【請求項59】 インデックスファイルが、動的ページを生成するために考
    えられる入力を含む、請求項58に記載の索引付けする方法。
  60. 【請求項60】 インデックスファイルが、動的ページを生成するために使
    用される、考えられる出力を含む、請求項59に記載の索引付けする方法。
  61. 【請求項61】 動的ページに関連付けられるサーバエージェントが、動的
    ページを作成する少なくとも1つのデータベースを特定し、インデックスファイ
    ルに包含するためにテキストおよび入力組を抽出する、請求項58に記載の索引
    付けする方法。
  62. 【請求項62】 サーバエージェントが、前記入力組と関連付けられる出力
    組を抽出する、請求項61に記載の索引付けする方法。
  63. 【請求項63】 前記サーバエージェントが、インデックスファイルに包含
    するためにデータベースの入力および/または出力列を抽出する、請求項62に
    記載の索引付けする方法。
  64. 【請求項64】 サーバエージェントが、データベース内で変化が起きると
    サーバエージェントに報告するためにデータベース内にトリガを導入し、該変化
    がインデックスデルタファイルに含まれる、請求項61に記載の索引付けする方
    法。
  65. 【請求項65】 インデックスファイルが、過去に検索された動的ページを
    作成するために使用される入力および/または出力の記録を含む、請求項58に
    記載の索引付けする方法。
  66. 【請求項66】 インデックスファイルが、ユーザが過去に検索した動的ペ
    ージのテキストのインデックスを含む、請求項58に記載の索引付けする方法。
  67. 【請求項67】 動的ページを作成する際にアクセスされる少なくとも1つ
    のデータベースを特定することと、 データベースのパラメータおよび環境変数を決定することと、 ページの入力フィールドとデータベースの間の関係性を決定することと、 入力に対応するデータベースの列を特定することと、 インデックスファイル内に列のデータを記憶することとを含む、動的ページを
    索引付けするための方法。
  68. 【請求項68】 前記対の少なくとも1つの変化を検出することと、前記変
    化に基づいてユーザのシステムに記憶される少なくとも1つのネットワークアド
    レスを調整することとを含む、請求項18に記載の方法。
  69. 【請求項69】 少なくとも1つの前記対の変化を検出することと、ブラウ
    ザ用のブックマークとして記憶される少なくとも1つのネットワークアドレスを
    調整することとを含む、請求項18に記載の方法。
  70. 【請求項70】 前記ユーザコンピュータシステムに記憶されるネットワー
    クアドレスの変化を決定するために、インデクシングシステムのインデックスと
    通信するための手段を有する、ユーザコンピュータシステム上で実行可能なブラ
    ウザエージェント。
  71. 【請求項71】 前記インデクシングシステムが、請求項34〜50のいず
    れか1項に記載される、請求項70に記載のブラウザエージェント。
  72. 【請求項72】 前記インデックスが請求項32に記載される、請求項70
    に記載のブラウザエージェント。
  73. 【請求項73】 前記ネットワークアドレスが、ブックマークとして記憶さ
    れるURLである、請求項70に記載のブラウザエージェント。
  74. 【請求項74】 前記変化に基づいて前記ネットワークアドレスを調整する
    ための手段を有する、請求項70に記載のブラウザエージェント。
JP2001547303A 1999-12-20 2000-12-18 インデクシングシステムおよび方法 Expired - Fee Related JP4873813B2 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
AU4757 1999-12-20
AUPQ4757A AUPQ475799A0 (en) 1999-12-20 1999-12-20 An internet indexing system and method
AUPQ4757 1999-12-20
PCT/AU2000/001554 WO2001046856A1 (en) 1999-12-20 2000-12-18 An indexing system and method

Publications (2)

Publication Number Publication Date
JP2003518293A true JP2003518293A (ja) 2003-06-03
JP4873813B2 JP4873813B2 (ja) 2012-02-08

Family

ID=3818896

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001547303A Expired - Fee Related JP4873813B2 (ja) 1999-12-20 2000-12-18 インデクシングシステムおよび方法

Country Status (7)

Country Link
US (1) US7987165B2 (ja)
EP (1) EP1250663A4 (ja)
JP (1) JP4873813B2 (ja)
AU (1) AUPQ475799A0 (ja)
CA (1) CA2394820C (ja)
NZ (1) NZ519640A (ja)
WO (1) WO2001046856A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012089168A (ja) * 2005-08-11 2012-05-10 Fisher-Rosemount Systems Inc 動的ウェブページのためのブックマークを作成する方法及び装置

Families Citing this family (123)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6453334B1 (en) 1997-06-16 2002-09-17 Streamtheory, Inc. Method and apparatus to allow remotely located computer programs and/or data to be accessed on a local computer in a secure, time-limited manner, with persistent caching
US7225182B2 (en) 1999-05-28 2007-05-29 Overture Services, Inc. Recommending search terms using collaborative filtering and web spidering
US7461058B1 (en) 1999-09-24 2008-12-02 Thalveg Data Flow Llc Optimized rule based constraints for collaborative filtering systems
US6526418B1 (en) * 1999-12-16 2003-02-25 Livevault Corporation Systems and methods for backing up data files
US7788123B1 (en) 2000-06-23 2010-08-31 Ekhaus Michael A Method and system for high performance model-based personalization
US8831995B2 (en) 2000-11-06 2014-09-09 Numecent Holdings, Inc. Optimized server for streamed applications
US7062567B2 (en) 2000-11-06 2006-06-13 Endeavors Technology, Inc. Intelligent network streaming and execution system for conventionally coded applications
US6988100B2 (en) * 2001-02-01 2006-01-17 International Business Machines Corporation Method and system for extending the performance of a web crawler
CA2342578A1 (en) * 2001-03-29 2002-09-29 Ibm Canada Limited-Ibm Canada Limitee Method and apparatus for security of a network server
US7581167B2 (en) * 2001-05-17 2009-08-25 Hewlett-Packard Development Company, L.P. Method and system for automated simulation of dynamic URL-based Web application
WO2003012576A2 (en) * 2001-07-27 2003-02-13 Quigo Technologies Inc. System and method for automated tracking and analysis of document usage
WO2003042871A2 (en) * 2001-11-14 2003-05-22 Brian Mervyn Morrow Systems and methods for indexing data in a network environment
AU2002252155A1 (en) * 2002-02-26 2003-09-09 Endeavors Technology, Inc. Systems and methods for indexing data in a network environment
US7743045B2 (en) 2005-08-10 2010-06-22 Google Inc. Detecting spam related and biased contexts for programmable search engines
US7716199B2 (en) 2005-08-10 2010-05-11 Google Inc. Aggregating context data for programmable search engines
US7693830B2 (en) 2005-08-10 2010-04-06 Google Inc. Programmable search engine
AU2002950134A0 (en) * 2002-07-11 2002-09-12 Youramigo Pty Ltd A link generation system
CA2495536A1 (fr) * 2002-08-09 2004-02-26 Agency Multimedia Plateforme de type logicielle dediee au referencement de sites du reseau internet
DE10325998A1 (de) * 2003-06-07 2004-12-30 Hurra Communications Gmbh Verfahren zum Optimieren eines auf eine erste Netzwerkseite verweisenden Verweises
US8095500B2 (en) * 2003-06-13 2012-01-10 Brilliant Digital Entertainment, Inc. Methods and systems for searching content in distributed computing networks
US8321400B2 (en) * 2003-08-29 2012-11-27 Vortaloptics, Inc. Method, device and software for querying and presenting search results
US7440964B2 (en) * 2003-08-29 2008-10-21 Vortaloptics, Inc. Method, device and software for querying and presenting search results
US7225208B2 (en) * 2003-09-30 2007-05-29 Iron Mountain Incorporated Systems and methods for backing up data files
US7346839B2 (en) * 2003-09-30 2008-03-18 Google Inc. Information retrieval based on historical data
US7472254B2 (en) * 2003-10-10 2008-12-30 Iora, Ltd. Systems and methods for modifying a set of data objects
US7849063B2 (en) * 2003-10-17 2010-12-07 Yahoo! Inc. Systems and methods for indexing content for fast and scalable retrieval
US20050144241A1 (en) 2003-10-17 2005-06-30 Stata Raymond P. Systems and methods for a search-based email client
US7620624B2 (en) * 2003-10-17 2009-11-17 Yahoo! Inc. Systems and methods for indexing content for fast and scalable retrieval
JP4396242B2 (ja) * 2003-11-28 2010-01-13 富士ゼロックス株式会社 文書リンク構造情報作成装置及び方法
WO2005069161A1 (en) * 2004-01-19 2005-07-28 Nigel Hamilton Method and system for recording search trails across one or more search engines in a communications network
US20050193004A1 (en) * 2004-02-03 2005-09-01 Cafeo John A. Building a case base from log entries
US7158966B2 (en) * 2004-03-09 2007-01-02 Microsoft Corporation User intent discovery
US7565630B1 (en) 2004-06-15 2009-07-21 Google Inc. Customization of search results for search queries received from third party sites
US20060026194A1 (en) * 2004-07-09 2006-02-02 Sap Ag System and method for enabling indexing of pages of dynamic page based systems
US7720845B2 (en) * 2004-08-13 2010-05-18 Yahoo! Inc. Systems and methods for updating query results based on query deltas
US20060070022A1 (en) * 2004-09-29 2006-03-30 International Business Machines Corporation URL mapping with shadow page support
EP1825390A2 (en) 2004-11-13 2007-08-29 Stream Theory, Inc. Hybrid local/remote streaming
US7584194B2 (en) * 2004-11-22 2009-09-01 Truveo, Inc. Method and apparatus for an application crawler
CA2588219C (en) * 2004-11-22 2014-05-20 Truveo, Inc. Method and apparatus for an application crawler
JP2006185059A (ja) * 2004-12-27 2006-07-13 Fujitsu Ltd コンテンツ管理装置
US9275052B2 (en) 2005-01-19 2016-03-01 Amazon Technologies, Inc. Providing annotations of a digital work
US8024523B2 (en) 2007-11-07 2011-09-20 Endeavors Technologies, Inc. Opportunistic block transmission with time constraints
US9716609B2 (en) 2005-03-23 2017-07-25 Numecent Holdings, Inc. System and method for tracking changes to files in streaming applications
WO2006104534A2 (en) * 2005-03-25 2006-10-05 The Motley Fool, Inc. Scoring items based on user sentiment and determining the proficiency of predictors
US20060217994A1 (en) * 2005-03-25 2006-09-28 The Motley Fool, Inc. Method and system for harnessing collective knowledge
US20060271839A1 (en) * 2005-05-24 2006-11-30 David Gottlieb Connecting structured data sets
US20070005587A1 (en) * 2005-06-30 2007-01-04 Microsoft Corporation Relative search results based off of user interaction
US20070011207A1 (en) * 2005-07-05 2007-01-11 Vishnubhotla Prasad R Method and system for integrating file system events into a relational database
US7805419B2 (en) * 2005-07-11 2010-09-28 Application Security, Inc. System for tracking and analyzing the integrity of an application
US7562087B2 (en) * 2005-09-30 2009-07-14 Computer Associates Think, Inc. Method and system for processing directory operations
US7822736B2 (en) 2005-09-30 2010-10-26 Computer Associates Think, Inc. Method and system for managing an index arrangement for a directory
US8849821B2 (en) * 2005-11-04 2014-09-30 Nokia Corporation Scalable visual search system simplifying access to network and device functionality
US8307275B2 (en) * 2005-12-08 2012-11-06 International Business Machines Corporation Document-based information and uniform resource locator (URL) management
US20070162481A1 (en) * 2006-01-10 2007-07-12 Millett Ronald P Pattern index
US20070174324A1 (en) * 2006-01-12 2007-07-26 Palapudi Sriram M Mechanism to trap obsolete web page references and auto-correct invalid web page references
US8266152B2 (en) * 2006-03-03 2012-09-11 Perfect Search Corporation Hashed indexing
US8176052B2 (en) * 2006-03-03 2012-05-08 Perfect Search Corporation Hyperspace index
US8352449B1 (en) 2006-03-29 2013-01-08 Amazon Technologies, Inc. Reader device content indexing
US20070282802A1 (en) * 2006-05-09 2007-12-06 International Business Machines Corporation System, method and program to manage alternate bookmarks
US7734618B2 (en) * 2006-06-30 2010-06-08 Microsoft Corporation Creating adaptive, deferred, incremental indexes
US8775452B2 (en) 2006-09-17 2014-07-08 Nokia Corporation Method, apparatus and computer program product for providing standard real world to virtual world links
US20080071770A1 (en) * 2006-09-18 2008-03-20 Nokia Corporation Method, Apparatus and Computer Program Product for Viewing a Virtual Database Using Portable Devices
US8725565B1 (en) 2006-09-29 2014-05-13 Amazon Technologies, Inc. Expedited acquisition of a digital item following a sample presentation of the item
US9672533B1 (en) 2006-09-29 2017-06-06 Amazon Technologies, Inc. Acquisition of an item based on a catalog presentation of items
US8261345B2 (en) 2006-10-23 2012-09-04 Endeavors Technologies, Inc. Rule-based application access management
US20080114738A1 (en) * 2006-11-13 2008-05-15 Gerald Chao System for improving document interlinking via linguistic analysis and searching
US7958126B2 (en) * 2006-12-19 2011-06-07 Yahoo! Inc. Techniques for including collection items in search results
US7865817B2 (en) 2006-12-29 2011-01-04 Amazon Technologies, Inc. Invariant referencing in digital works
US8024400B2 (en) 2007-09-26 2011-09-20 Oomble, Inc. Method and system for transferring content from the web to mobile devices
US7751807B2 (en) 2007-02-12 2010-07-06 Oomble, Inc. Method and system for a hosted mobile management service architecture
US9665529B1 (en) 2007-03-29 2017-05-30 Amazon Technologies, Inc. Relative progress and event indicators
US7716224B2 (en) 2007-03-29 2010-05-11 Amazon Technologies, Inc. Search and indexing on a user device
US20080263193A1 (en) * 2007-04-17 2008-10-23 Chalemin Glen E System and Method for Automatically Providing a Web Resource for a Broken Web Link
US8990215B1 (en) 2007-05-21 2015-03-24 Amazon Technologies, Inc. Obtaining and verifying search indices
US7912840B2 (en) * 2007-08-30 2011-03-22 Perfect Search Corporation Indexing and filtering using composite data stores
US9418154B2 (en) * 2007-10-19 2016-08-16 Oracle International Corporation Push-model based index updating
US9594784B2 (en) * 2007-10-19 2017-03-14 Oracle International Corporation Push-model based index deletion
US9594794B2 (en) * 2007-10-19 2017-03-14 Oracle International Corporation Restoring records using a change transaction log
US8682859B2 (en) * 2007-10-19 2014-03-25 Oracle International Corporation Transferring records between tables using a change transaction log
US8892738B2 (en) 2007-11-07 2014-11-18 Numecent Holdings, Inc. Deriving component statistics for a stream enabled application
US20090150433A1 (en) * 2007-12-07 2009-06-11 Nokia Corporation Method, Apparatus and Computer Program Product for Using Media Content as Awareness Cues
US20090210389A1 (en) * 2008-02-20 2009-08-20 Microsoft Corporation System to support structured search over metadata on a web index
US9405831B2 (en) * 2008-04-16 2016-08-02 Gary Stephen Shuster Avoiding masked web page content indexing errors for search engines
US8131753B2 (en) * 2008-05-18 2012-03-06 Rybak Ilya Apparatus and method for accessing and indexing dynamic web pages
US8224841B2 (en) * 2008-05-28 2012-07-17 Microsoft Corporation Dynamic update of a web index
US8423889B1 (en) 2008-06-05 2013-04-16 Amazon Technologies, Inc. Device specific presentation control for electronic book reader devices
JP5350472B2 (ja) * 2008-06-19 2013-11-27 ワイズ テクノロジーズ インコーポレイテッド トピックに関する複数の製品にランクを付ける製品ランク付け方法及び製品ランク付けシステム
US8032495B2 (en) * 2008-06-20 2011-10-04 Perfect Search Corporation Index compression
US9087032B1 (en) 2009-01-26 2015-07-21 Amazon Technologies, Inc. Aggregation of highlights
US8378979B2 (en) 2009-01-27 2013-02-19 Amazon Technologies, Inc. Electronic device with haptic feedback
US8620900B2 (en) * 2009-02-09 2013-12-31 The Hong Kong Polytechnic University Method for using dual indices to support query expansion, relevance/non-relevance models, blind/relevance feedback and an intelligent search interface
US8082258B2 (en) * 2009-02-10 2011-12-20 Microsoft Corporation Updating an inverted index in a real time fashion
US8832584B1 (en) 2009-03-31 2014-09-09 Amazon Technologies, Inc. Questions on highlighted passages
US8386601B1 (en) * 2009-07-10 2013-02-26 Quantcast Corporation Detecting and reporting on consumption rate changes
US8692763B1 (en) 2009-09-28 2014-04-08 John T. Kim Last screen rendering for electronic book reader
US20110196854A1 (en) * 2010-02-05 2011-08-11 Sarkar Zainul A Providing a www access to a web page
US9495322B1 (en) 2010-09-21 2016-11-15 Amazon Technologies, Inc. Cover display
US20120124062A1 (en) * 2010-11-12 2012-05-17 Microsoft Corporation Application Transfer Protocol
US9195745B2 (en) 2010-11-22 2015-11-24 Microsoft Technology Licensing, Llc Dynamic query master agent for query execution
US8713024B2 (en) 2010-11-22 2014-04-29 Microsoft Corporation Efficient forward ranking in a search engine
US9424351B2 (en) 2010-11-22 2016-08-23 Microsoft Technology Licensing, Llc Hybrid-distribution model for search engine indexes
US9342582B2 (en) 2010-11-22 2016-05-17 Microsoft Technology Licensing, Llc Selection of atoms for search engine retrieval
US8620907B2 (en) 2010-11-22 2013-12-31 Microsoft Corporation Matching funnel for large document index
US9529908B2 (en) 2010-11-22 2016-12-27 Microsoft Technology Licensing, Llc Tiering of posting lists in search engine index
US9424002B2 (en) 2010-12-03 2016-08-23 Microsoft Technology Licensing, Llc Meta-application framework
US9401807B2 (en) * 2011-02-03 2016-07-26 Hewlett Packard Enterprise Development Lp Processing non-editable fields in web pages
US8504912B2 (en) * 2011-07-15 2013-08-06 Neodata Group S.R.L. System to forecast performance of online news articles to suggest the optimal homepage layout to maximize article readership and readers stickiness
US9292521B1 (en) 2011-10-20 2016-03-22 Amazon Technologies, Inc. Archiving and querying data updates associated with an electronic catalog system
US9043311B1 (en) 2011-10-20 2015-05-26 Amazon Technologies, Inc. Indexing data updates associated with an electronic catalog system
US9158741B1 (en) 2011-10-28 2015-10-13 Amazon Technologies, Inc. Indicators for navigating digital works
JP5774513B2 (ja) * 2012-02-07 2015-09-09 株式会社日立ソリューションズ ファイルリスト生成方法及びシステム並びにプログラム、ファイルリスト生成装置
CN103514224B (zh) * 2012-06-29 2017-08-25 国际商业机器公司 数据库中的数据处理方法、数据查询方法和相应装置
US10031971B2 (en) * 2013-01-09 2018-07-24 NetSuite Inc. System and methods for optimizing the response to a request for dynamic web content
US9378100B2 (en) * 2013-05-17 2016-06-28 Go Daddy Operating Company, LLC Tools for storing, accessing and restoring website content via a website repository
US20160259819A1 (en) 2013-06-18 2016-09-08 Blink Forward, L.L.C. Error identification, indexing and linking construction documents
US8849833B1 (en) * 2013-07-31 2014-09-30 Linkedin Corporation Indexing of data segments to facilitate analytics
US10069940B2 (en) 2015-09-10 2018-09-04 Microsoft Technology Licensing, Llc Deployment meta-data based applicability targetting
US9965604B2 (en) 2015-09-10 2018-05-08 Microsoft Technology Licensing, Llc De-duplication of per-user registration data
US11200217B2 (en) 2016-05-26 2021-12-14 Perfect Search Corporation Structured document indexing and searching
KR102519159B1 (ko) * 2018-01-23 2023-04-07 삼성전자주식회사 전자 장치 및 그 제어 방법
WO2020133187A1 (zh) * 2018-12-28 2020-07-02 深圳市世强元件网络有限公司 一种针对内容的智能搜索推荐方法、存储介质及终端
US10785336B2 (en) * 2019-01-31 2020-09-22 Walmart Apollo, Llc Pre-loading and caching application code
WO2020222724A1 (en) 2019-04-27 2020-11-05 Hewlett-Packard Development Company, L.P. Microservices data aggregation search engine updating

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09204442A (ja) * 1996-01-24 1997-08-05 Dainippon Screen Mfg Co Ltd ドキュメントデータ検索システム
JPH09218880A (ja) * 1996-02-09 1997-08-19 Dainippon Screen Mfg Co Ltd ドキュメントデータ検索システム
JPH1063686A (ja) * 1996-08-20 1998-03-06 Dainippon Screen Mfg Co Ltd ドキュメントデータ検索システム

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5649186A (en) * 1995-08-07 1997-07-15 Silicon Graphics Incorporated System and method for a computer-based dynamic information clipping service
US5806065A (en) 1996-05-06 1998-09-08 Microsoft Corporation Data system with distributed tree indexes and method for maintaining the indexes
US6038610A (en) * 1996-07-17 2000-03-14 Microsoft Corporation Storage of sitemaps at server sites for holding information regarding content
US5864863A (en) * 1996-08-09 1999-01-26 Digital Equipment Corporation Method for parsing, indexing and searching world-wide-web pages
US5765168A (en) * 1996-08-09 1998-06-09 Digital Equipment Corporation Method for maintaining an index
US5926816A (en) * 1996-10-09 1999-07-20 Oracle Corporation Database Synchronizer
US5963944A (en) * 1996-12-30 1999-10-05 Intel Corporation System and method for distributing and indexing computerized documents using independent agents
US5978799A (en) 1997-01-30 1999-11-02 Hirsch; G. Scott Search engine including query database, user profile database, information templates and email facility
US6415319B1 (en) * 1997-02-07 2002-07-02 Sun Microsystems, Inc. Intelligent network browser using incremental conceptual indexer
CA2209265A1 (en) * 1997-02-27 1998-08-27 The Computer Group, Inc. Apparatus and method for information retrieval via internet
US5974412A (en) * 1997-09-24 1999-10-26 Sapient Health Network Intelligent query system for automatically indexing information in a database and automatically categorizing users
US6088694A (en) * 1998-03-31 2000-07-11 International Business Machines Corporation Continuous availability and efficient backup for externally referenced objects
US6338085B1 (en) * 1998-06-29 2002-01-08 Philips Electronics North America Corporation Telephone activated web server
US6424966B1 (en) * 1998-06-30 2002-07-23 Microsoft Corporation Synchronizing crawler with notification source
US6675205B2 (en) * 1999-10-14 2004-01-06 Arcessa, Inc. Peer-to-peer automated anonymous asynchronous file sharing
US6516337B1 (en) * 1999-10-14 2003-02-04 Arcessa, Inc. Sending to a central indexing site meta data or signatures from objects on a computer network
US6976053B1 (en) * 1999-10-14 2005-12-13 Arcessa, Inc. Method for using agents to create a computer index corresponding to the contents of networked computers
US6418453B1 (en) * 1999-11-03 2002-07-09 International Business Machines Corporation Network repository service for efficient web crawling
US6418452B1 (en) * 1999-11-03 2002-07-09 International Business Machines Corporation Network repository service directory for efficient web crawling
US6546387B1 (en) * 1999-11-15 2003-04-08 Transcom Software Inc. Computer network information management system and method using intelligent software agents
US7062486B2 (en) * 2000-12-05 2006-06-13 International Business Machines Corporation Method, system and program product for enabling authorized access and request-initiated translation of data files
US6931598B2 (en) * 2001-03-30 2005-08-16 Intel Corporation Dynamic web list display

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09204442A (ja) * 1996-01-24 1997-08-05 Dainippon Screen Mfg Co Ltd ドキュメントデータ検索システム
JPH09218880A (ja) * 1996-02-09 1997-08-19 Dainippon Screen Mfg Co Ltd ドキュメントデータ検索システム
JPH1063686A (ja) * 1996-08-20 1998-03-06 Dainippon Screen Mfg Co Ltd ドキュメントデータ検索システム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012089168A (ja) * 2005-08-11 2012-05-10 Fisher-Rosemount Systems Inc 動的ウェブページのためのブックマークを作成する方法及び装置

Also Published As

Publication number Publication date
EP1250663A1 (en) 2002-10-23
JP4873813B2 (ja) 2012-02-08
EP1250663A4 (en) 2007-08-15
AUPQ475799A0 (en) 2000-01-20
CA2394820A1 (en) 2001-06-28
CA2394820C (en) 2011-05-03
US20030191737A1 (en) 2003-10-09
NZ519640A (en) 2004-07-30
WO2001046856A1 (en) 2001-06-28
US7987165B2 (en) 2011-07-26

Similar Documents

Publication Publication Date Title
JP4873813B2 (ja) インデクシングシステムおよび方法
US6718365B1 (en) Method, system, and program for ordering search results using an importance weighting
KR100699977B1 (ko) 데이터베이스 검색 시스템에서 관련 검색을 식별하기 위한방법 및 장치
US8203952B2 (en) Using network traffic logs for search enhancement
US8732169B2 (en) Lateral search
US8014997B2 (en) Method of search content enhancement
US6826559B1 (en) Hybrid category mapping for on-line query tool
US6338058B1 (en) Method for providing more informative results in response to a search of electronic documents
US7047242B1 (en) Weighted term ranking for on-line query tool
US7779002B1 (en) Detecting query-specific duplicate documents
KR101130505B1 (ko) 검색 결과 관련성의 자동화된 최적화를 위한 시스템 및방법
US8069162B1 (en) Enhanced search indexing
US8775396B2 (en) Method and system for searching a wide area network
US20020129062A1 (en) Apparatus and method for cataloging data
US20030131005A1 (en) Method and apparatus for automatic pruning of search engine indices
AU773065B2 (en) An indexing system and method
US20030061204A1 (en) Systems and methods for selective information retrieval based on search source attributes
JP4104878B2 (ja) ウェブページ誘導方法及びウェブページ誘導プログラム
JP2009048589A (ja) ドキュメント作成システム、サーバ装置、プログラム、および記録媒体
WO2005022410A1 (en) Search engine

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071210

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20091016

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20091016

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100713

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20101007

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20101015

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20101213

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20101220

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110113

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110222

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110520

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110527

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110822

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111025

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111122

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141202

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees