JP2003518293A - インデクシングシステムおよび方法 - Google Patents
インデクシングシステムおよび方法Info
- Publication number
- JP2003518293A JP2003518293A JP2001547303A JP2001547303A JP2003518293A JP 2003518293 A JP2003518293 A JP 2003518293A JP 2001547303 A JP2001547303 A JP 2001547303A JP 2001547303 A JP2001547303 A JP 2001547303A JP 2003518293 A JP2003518293 A JP 2003518293A
- Authority
- JP
- Japan
- Prior art keywords
- index
- server
- database
- page
- indexing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Information Transfer Between Computers (AREA)
Abstract
Description
よびシステムに関し、特に、インターネット上に含まれる情報用のインデックス
を作成する方法およびシステムに関する。
提供し、かつネットワーク上でデータを自由に公表することが挙げられる。しか
し、ネットワークが拡大するにつれて、ユーザが必要とするデータの位置を突き
止めることはきわめて困難になり、データに対する分かりやすいまたは有効なイ
ンデックスまたはポータルを維持することはなおさらに難しくなっている。デー
タは、テキスト、グラフィックス、ビデオ、音声およびプログラムデータまたは
コードを含んでもよい。効果的に中央制御権威を持たないインターネットの成長
は、現在では必要とされるデータの位置を突き止めることが、無駄骨を折ること
に類似するほどである。それにも関わらず、数多くの企業はサーチエンジンおよ
びインターネットデータ、特にワールドワイドウェブ上で公表されるデータへの
ポータルを維持する。
て探索できるウェブページのインデックスに依存している。該インデックスは、
通常、ウェブアドレス、すなわち全域資源位置指示子(URL)のデータベース
によって提供され、テキスト情報の用語は、ウェブに掲載されるテキストの各ペ
ージを表すために使用される。
TTPプロトコルによって、ウェブページを検索するためのスパイダプログラム
を使用してインデックスを獲得し、索引付けしなければならないこのページから
データを抽出する。同時に、他のページのリンクも注記され、プロセスはその後
新規に発見されたリンクについて繰り返される。これは自動的に実行されるため
、ビジットされたウェブサイトの管理者または作者からの協力は必要とされない
。しかしながら、ページは、処理のためにすべて中央サイトに持ち込まれ、処理
されるデータの量のために、新規のページまたは修正されたページが、処理され
るには数ヶ月待機しなければならない場合がある。
は、インデクシング情報は、システム管理者またはページの作者によってテンプ
レートの中に手動で入力される。それから、ページは検索のためにスパイダプロ
グラムが使用できる。ページについての情報は人間によって生成されるため、ペ
ージコンテンツについての情報は、通常非常に正確である。しかしながら、多く
の管理者および作者はこのような情報を提供する態勢になく、多くの場合テンプ
レートを完成させるために十分な時間を費やさないため、インデックスはしばし
ば不完全且つ時代遅れである。
エンジンでは、インデックスは、人間によるページの手作業の検査で構築される
。検査は手作業であるため、特定のトピックの下のウェブページの分類は、ペー
ジの質のレーティングがそうであるように、通常、かなり正確である。しかしな
がら、使用できる人々の数が限られ、カバーされるウェブの範囲および新しいウ
ェブページと修正されたページがレビューされる速度は制限されている。
ウェブユーザを拠点としている。彼らは、合意可能なユーザインタフェースにつ
いて、および個人専用される探索についてさらに大きな範囲を提供する。しかし
ながら、彼らは、ウェブのかなりの部分を独立して探索する場合に大量の帯域幅
を無駄にする可能性がある。
は、探索要求を受信すると、他のサーチエンジンの探索サイトを探索し、これら
からの結果を受信し、ユーザに表示するために結果を統合する(これがメタサー
チ(metasearch)として知られている)。これが、いくつかのサーチ
エンジンは、他のサーチエンジンによってビジットされていないサイトからのデ
ータを含むので、ウェブのより優れたカバレージにつながる。しかしながら、こ
れは非効率的なアプローチであり、さまざまな探索インデックスの間にはかなり
の重複があるため、ユーザに結果を戻す際に追加の遅延もあり、関連する順序で
結果を格付けするために使用できる方法は限られている。
べ、そのコンテンツに索引付けをし、それらをサイトで格納されているファイル
に入れるために、さまざまなウェブサーバでギャザラ(Gatherers)と
呼ばれる装置を有する。これらのインデックスファイルは、ある特定の探索につ
いてユーザによって起動されるBrokersのような既知のプログラムによっ
て検索できる。このアプローチは、帯域幅の使用に関して節約するが、スパイダ
は、依然として、サーバに記憶されているインデックスが定期的に更新されてい
ることを確実にするために、定期的にサイトをビジットしなければならない。
難を呈する。これらは、インターネット自体のダイナミズム、およびインターネ
ット上での情報のダイナミズムを含む。これが、ウェブについて完全に最新で、
完成したインデックスがないという状況を生じさせる。
情報の大半が、動的ページ用の基礎として使用されるデータベース内に位置して
いるという点である。動的ページとは、htmlで手作業によって作成されない
が、むしろそれらを構成するhtmlがプログラムまたはスクリプトによって「
動的に」作成されるか、あるいは情報が、例えばJavaを使用するなど、なん
らかの他の方法で提示されるページのことである。これらのページは、ユーザが
照会を提出する時点でプログラムによって構築される。スパイダなどの最新のイ
ンデクシング方法は、動的ページに、または動的ページを作成するために使用さ
れるデータベースにも索引付けをすることはできない。
ための方法であって、前記サーバ上でデータを処理して中央インデックス用のデ
ータアイテムにアクセスすることであって、前記データアイテムがネットワーク
アドレスと用語を含むことと、 前記データアイテムを含むインデックスファイルをコンパイルすることと、 前記インデックスファイルを前記中央インデックスに伝送することとを含む、
方法を提供する。
ントを提供する。
スファイルを受信することと、 前記インデックスファイル内のエントリに基づいて前記インデックスデータベ
ースを維持することであって、前記インデックスデータベースがサーチエンジン
による使用のために適応されていることとをさらに含む。
を作成するためのプログラム用プログラムアドレスを含むページエントリと、 動的ページを特定し、検索用語に対応する組を特定する探索エントリと、 を含む、サーバからアクセス可能なデータのインデックスを提供する。
クセスするための手段と、 特定された動的ページのためにアドレスを作成するためにページエントリにア
クセスするための手段であって、前記アドレスが前記プログラムアドレスおよび
前記組に基づいて作成される手段とを含む、インデックス上で利用可能なサーチ
エンジンを提供する。
デクシングシステムを提供する。
ジェントと、 インデックスファイルからのインデックス情報を記憶するための中央インデッ
クスであって、サーバエージェントがインデックスファイルの転送のために中央
インデックスとの通信を開始する中央インデックスとを含む、インデクシングシ
ステムを提供する。
と、 サイトのサイトデータを表すインデックスファイルをコンパイルすることと、 中央インデックスにファイルを伝送し、そこではサーバエージェントがインデ
ックスファイルの転送のために中央インデックスとの通信を開始することとを含
む、検索付けする方法を提供する。
定することと、 データベースのパラメータおよび環境変数を求めることと、 ページの入力フィールドとデータベース間の関係性を決定することと、 入力に対応するデータベースの列を特定することと、 インデックスファイル内で入力を介してアクセスできるデータベースの行のデ
ータを記憶することとを含む、動的ページを索引付けするための方法を提供する
。
アドレスの変更を決定するために、インデクシングシステムのインデックスと通
信するための手段を有する、ユーザコンピュータシステム上で実行可能なブラウ
ザエージェントを提供する。
いて説明する。
標準的な方法で分散またはミラー化することができるが、ユーザによるアクセス
のためのインデクシングデータを中心的に記憶するインターネット用のインデク
シングシステムが後述される。該インデクシングシステムは、中央記憶装置を提
供する中央インデックス(CI)214と通信する、図2に図示されるような、
数多くのサーバベースエージェント(SBA)208、222を含む。システム
は、探索要求を処理するときに中央インデックスを使用する中央サーチエンジン
(CSE)216も含む。エージェント208、222は、サーバ製造業者によ
って分散される各ハイパテキスト転送プロトコル(HTTP)とともに含むこと
ができる。エージェントは、追加済み新規サイト/ページ、削除済み旧ページ、
または修正された旧ページなどのそのローカルサーバ上でデータに加えられた変
化がないか定期的にチェックする。注記される修正派、リンク、静的ページまた
は動的ページの削除、作成または修正を含んでよい。あらゆる変更があった場合
、エージェントはインデックスデータファイルを作成し、CIの中央インデクシ
ングデータベースに関連するインデクシング変更を報告する。中央インデクシン
グデータベースは、CSEなどのオンラインで使用可能なサーチエンジン用の包
括的且つ最新のインデクシングデータベースである。
使用するのに適した典型的なコンピュータシステム200の図である。コンピュ
ータ200は、1台または複数台の中央処理装置(CPU)102、メモリシス
テム104、入力/出力(I/O)アダプタ106、二次記憶装置108、ネッ
トワークインタフェース110、ユーザインタフェースアダプタ114、および
ディスプレイアダプタ112を含んでよい。コンピュータ構成要素のすべては、
システムバス115によって接続される。該ディスプレイアダプタ112は、ユ
ーザに対して推奨策を表示するためにディスプレイ116に接続されてよい。該
ユーザインタフェースアダプタ114は、ユーザ入力装置118に接続されてよ
い。ユーザは、ネットワークインタフェース110を通してインターネットに接
続されてよい。ユーザは、例えば、America Online(登録商標)
などのサービスプロバイダに対するモデムを通した接続などのインターネットイ
ンタフェース120に、あるいはケーブル接続を通してインターネットサービス
プロバイダに接続されてよい。
ットサービスプロバイダ(ISP)202に接続される。やはりインターネット
204に結合されるのは、典型的には、例えばhtmlページおよびその他の文
書とスクリプトを含んでよい1つまたは複数のサイトへのアクセスを実現、提供
するHTTPサーバ(HS)206である第1サーバである。HSサーバ206
は、第1HSサーバ106上の文書からデータ収集活動を実施するサーバベース
エージェント(SBA)202を含む。SBA208は、いつでも動作してよい
か、あるいは非活動の期間が散在する間隔の間実行してよい。SBA208は、
収集されたデータブロック210に記憶される、すべての文書更新のリスティン
グを作成するためにHSサーバ206上に位置するすべての文書を調べる。SB
A208は、インデックスサーバ212で実行されるソフトウェアによって提供
できる、インデックスファイルまたはインデックスデルタファイルの形の文書更
新のリスティングを中央インデックス(CI)214に伝送する。インデックス
ファイルは、データの位置究明用のアドレスとともに、多様なウェブページに含
まれるものなどの、ネットワーク上の多様なロケーションに含まれるものに関す
る情報を提供するデータのファイルである。該ファイルは、複雑な構造を有して
よく、数多くのファイルおよび/またはサーバ上で分散されてよい。インデック
スファイルに対する参照は、ネットワーク上のデータに対する変更という点で既
存のインデックスファイルに加えられる必要のある変更を単に含むファイルであ
る、インデックスデルタファイルに対する参照も含んでよい。インデクシングシ
ステムの効率的なインプリメンテーションが、後述されるように、SBAおよび
CIとCSEのソフトウェアインプリメンテーションを提供することであり、C
Iが図13に関して後述されるアーキテクチャを有することが、当業者に明らか
となるだろう。また、インターネットのような通信網で数多くの構成要素を分散
できること、およびソフトウェア構成要素の数が、ソフトウェア構成要素と同じ
プロセスを実行する、ASICなどのハードウェア回路にいよって置換できるこ
とも当業者に明らかになるだろう。
220上のウェブページから収集された、収集済みデータ224の選択したもの
も有する、第2サーバ220などの多数のその他のサーバから更新を受け取る。
CI214は、第1HS206および第2HS220などの多様なサーバから受
信される更新を組み込むためにそのコンテンツを更新する。インデックスサーバ
212は、CSE216も備えてよい。サーチエンジン216のインタフェース
は、なんらかのURLに位置してよい。サーチを実行するように要求されると、
サーチエンジン216は、応答を形成する前にCI214のエントリを通して探
索してよい。しかしながら、中央サーチエンジン(CSE)216は、CI21
4と同じサーバ212に位置する必要はない。
が、CI214と類似した機能を実行する数多くの領域インデックスにも適用さ
れてよい。これらの領域インデックスは、CI214がすべてのサーバ用のイン
デクシング情報を維持するように、CI214の領域インデックス情報を提供し
てよい。
ある。それは、ウェブサーバの一部である場合もあれば、別個である場合もある
。SBAは、典型的には遭遇する状況に反応し、長い時間期間実行してよい。そ
れは、サーチエンジンが、ウェブサーバのサイトで入手できる静的ウェブページ
と動的ウェブページの両方ともを探索できるようにするCIに情報を送信するこ
とができる。それは、旧いリンクに対処するために、いつページが移動または削
除されるのかを通知することもでき、それは、ウェブサーバごとに、サーチエン
ジン結果の格付けを改善するために使用できるウェブページ使用量データを収集
することができる。
記し、local_indexファイルおよびindex_deltaファイル
を構築する。 (b)report(CI_address,index_delta)――ア
ドレスCI_addressでCIに対するレポートを作成し、更新動作で検出
された局所的な変更を記述するindex_deltaファイルを伝送する。
クスとindex_deltaファイルの更新、およびCI214へのinde
x_deltaファイあるの報告を実行する。これらの2つの基本的なインデク
シング機能は同じ頻度で動作してよい。例えば、SBA208は、例えば24時
間毎などの定期的な間隔でエージェント208に動作するようにプロンプトを出
すタイマを有してよい。アクティブでない間、SBA208は、過去のアクティ
ブ期間からのサーバ上のすべての文書のそのインデックスエントリを維持する。
SBA208がそのタイマによって目覚まされると、それはサーバサイトのディ
レクトリツリーの変化がないか、あるいは個々のファイルが変更されたかどうか
をチェックする。検出されるあらゆる変化は記憶されてから、CI214に報告
される。変化がない場合、SBA2080は、帯域幅を保存するように、CI2
14にindex_deltaファイルを送信しないようにプログラミングされ
てよい。SBA208は、そのサーバサイトにある文書用のそのローカルインデ
ックスファイルも更新する。
上のページが変更されるたびに更新してよい。このケースでは、SBA208は
変更の著者(またはウェブサイト管理者)に、該変更をCI214に即座に提出
するように申し出てよい。また、SBA208は、同じダイアログ中に著者に、
著者がページを反映すると感じるあらゆる主題キーワードを入力する、あるいは
更新するようにプロンプトを出してよい。それから、これらのキーワードはin
dex_deltaファイルでCI214に提出されてよい。言うまでもなく、
著者はキーワードを入力するというオプションを単に無視してよい。
ルサーバ206またはインデックスサーバ212の性質またはニーズに合うよう
に動的に改変されてよい。
のハイパテキストリンクをレビューしてよい。その後、該レビューされたリンク
は、リンクが加算されたのか、あるいは減算されたのかを判断するために過去の
更新動作中に形成されたリンクリストと比較される。SBA208は、CI21
4に転送されるindex_deltaファイルに変更されたリンクのリストを
含める。それから、この情報は、CI214によって、さらに詳細に後述される
数多くの方法の内の1つまたは複数を使用して旧いリンクに対する参照を削除す
るために使用されてよい。
数とそのページで費やされた時間、これらのユーザがサイトをビジットする直前
にいたページ、サイトについての帯域統計、および前回の更新動作以来どのよう
な接続が行われたのかなどの、ローカルサーバ206についての統計情報を収集
するように構成されてもよい。このような情報は、サイトの設計およびレイアウ
トを最適化するのを補助するウェブサイト管理者または著者にとって有効である
場合がある。このような情報は、中央リポジトリ内で照合されると、余分なイン
フラストラクチャがインターネットに追加される必要があるところを特定するた
めの有効なデータ、つまり探索結果の集合内でページの関連性格付けを決定する
際のサポート情報を提供してよい。
特定のアプリケーションの特殊目的インデックスを作成する機会を提供する。こ
の1つの例が、SBAがインストールされているその他のe−コマースサイトに
関する情報を提供するe−コマースポータルサイトを形成するe−コマースイン
デックスである。
ltaを有するときにCI214に接続するという点で、対応するSBA208
と222に対するサーバとしての役割を果たす。CI214は、典型的には、H
TTPサーバ212、つまりインデックスサーバを通してインターネットに接続
される。
すると、CI214はそのインデックスデータベースを相応して更新する。イン
ターネット探索者が使用するためにCSE216は、インデックスデータベース
内の新しいデータを即座に使用できる。 (i)SBAが、独自のパラメータ設定値に基づきCIにインデックスファイル
を送信することと、 (ii)SBAが、独自のパラメータ設定値に基づき、CIにindex_de
ltaファイルを送信することと、 (iii)SBAが、CIに変化が発生した旨のショートメッセージを送信し、
その結果CIが既存の方法によるインデクシングのために、あるいはインデック
スまたはindex_deltaファイルを検索するためにスパイダを送信する
ことを含むが、それに制限されない、それが選ぶ任意の方法で後に変化を検索し
てよいことと、 (iv)SBAが、CIに対してよりむしろ領域インデックスに対しショートメ
ッセージまたはインデックスまたはindex_deltaファイルを送信する
ことと、 を含む、SBAとCI間でデータが転送されてよい方法について数多くのオプシ
ョンがある。
でのロードに関係する統計も蓄積してよい。
有してよい。このデータリストは探索で役に立ってよく、あるトピックに関する
最も最新の情報を得るための有効な機構を可能にする。CI214は、日付リス
ト内の情報に基づき、サイトがもはや維持されていないサイトであるかどうかも
評価してよい。
れを参照するページのURLを一覧表示する、URLごとのインデックスを維持
する。これが、各主題URLを、主題URLにリンクしているページを有するそ
れ以外のURLに関係付けるURLのライブラリである。ある特定のURLが削
除された、あるいは移動されたことを示すインデックス情報がCIに報告される
と、CIは、どのURLが削除されたURLへのリンクを含むのかを判断するた
めにURLインデックスを探索してから、参照側サーバのそれぞれでSBAに通
知を送信してよい。その後、ローカルSBAが、このような通知に応えてなんら
かの処置を講じてよい。例えば、SBAは、著者に参照側ページを、あるいはウ
ェブサイト管理者に、リンクが削除または移動されたことを通知してよい。SB
Aは、自動処置を講じるようにプログラミングされてもよい。SBAが削除され
たあるいは移動されたリンクを考慮して講じてよい自動処置の一例とは、マーク
されたリンクがもはや有効ではないことを示すために、参照側ページのhtml
コードに警告を追加することである。別の例は、SBAが、可能であるならば、
URLがこれまで参照していたサイトのルートディレクトリへのリンクでリンク
を置換してよいということである。CIが、URLが削除されたというよりむし
ろ移動されたと通知される場合、参照側サイトにあるSBAは、新しいURLに
対するリンクを更新するように構成されてよい。
変更されると発生する。該変更とは、ターゲットページとしても知られるリンク
内で参照されるページが削除された、移動された(例えば、そのURLが変更さ
れた)、あるいはそのコンテンツが修正された場合である可能性がある。変更は
伝達され、その結果参照側ページをロードするまたは見るユーザは、例えば、空
のターゲットページ、または元のリンクの著者がリンクを形成するときに依存し
ていた情報をもはや含んでいないターゲットページに導かれない。
l”>link phrase</A> この場合、「href」は別の文書に対するハイパリンクを作成するために使用
されるhtml属性であり、「www.server.com/linkto_
doc.html」は、それ以外の場合ターゲット文書として知られている、リ
ンクされている文書のインターネットアドレスであり、「link phras
e」は、linkto_doc.htmlへのリンクに続くためにクリックする
html文書中の句のことである。それ以外の属性は、「href」属性に加え
て、同文書内の別の点へのリンクを形成するために使用されてよい。
的に更新するためにセットアップされるか、あるいは代わりにそれはウェブサイ
ト管理者に、彼らがSBAを使用することにより手動で変更を実現するのか、あ
るいは自動的に実現するのかを決定できるように知らせることができるだろう。
ことによってリンクがないかサーバ上の第1html文書を走査する。SBAは
、ステップ304で、文書中で見つけられたリンクのリストを形成する。リスト
は、例えば、形式(link_from,link_to)を取る数多くの組を
含んでよく、この場合link_fromはソースhtml文書を示し、lin
k_toはターゲットhtml文書(つまり、リンクが指す文書)を示す。
ク内の変化を特定する。それから、変化したリンクに関係するこれらのリンク組
が、ステップ308で、linkchange_listファイルに記憶される
。それから、SBAは、ステップ310で、サーバ上の残りのhtml文書の走
査を進め、その結果linkchange_listは、サーバ上のすべての文
書に含まれているリンクのすべての変化を含む。
に沿って進んでよい。ステップ312で、進むための1つのオプションは、SB
Aがその他のサーバにlinkchange_listに含まれる関連する変化
を伝送することである。このアプローチは、インターネット440を通して通信
中の3つのサーバ410、420および430を示す図4に示されている。サー
バ名http://www.server1.comを有する第1サーバ410
は、SBA_server1と題されるSBA412を有する。Doc1.ht
mlと題されるhtml文書414は、第1サーバ上に存在する。第2サーバ4
20は、アドレスhttp://www.server2.comを有し、SB
A_server2と呼ばれるSBA422も有する。第2サーバは2つのht
ml文書、つまりdoc2.html 424とrefl.html 425を
有する。第3サーバ430は、アドレスhttp://www.server3
.comを有する。第3サーバ430はSBA_server3と呼ばれるSB
A432を有する。第3サーバ430は、ref2.htmlと題されるhtm
l文書435を有する。
バ420上のref1.html 42および第3サーバ430上のref2.
html 435に対するリンクを含む、数多くのリンクを含む。ステップ30
4で前述されたように、各サーバ上のSBAは、ソース文書およびターゲット文
書の組のリストを作成する。したがって、第1SBA412によって作成される
linkto_listファイル416は、描かれている少なくとも2つの組、
つまり (www.server1.com/doc1.html,www.serve
r2.com/ref1.html)および (www.server1.com/doc1.html,www.serve
r3.com/ref2.html) を含む。
l文書であり、ターゲット文書がソース文書内のリンクによって参照される文書
である、ソース文書およびターゲット文書の組を一覧表示し、その他のサーバ上
で記憶されるlinkto_listファイル426も含む。示されている例で
は、doc2.html 424は、第3サーバ上のref2.html 43
5に対するリンクを含む。結果的にlinnkto_listファイル426は
、組(www.server2.com/doc2.html,www.ser
er3.com/ref2.html)を含む。サーバ410、420および4
30は、その他のサーバ上の文書へのリンクを有する追加文書を含んでよい。
ge_listの関連する変化を、ターゲット文書が位置するサーバに伝送する
。例えば、doc1.htmlからのリンクのあらゆる変化は、ターゲット文書
を含む関連するサーバに報告される。このようにして、doc1.htmlがr
ef2.htmlへのリンクを含むように変更される場合には、この新規リンク
はlinkchange_listに含まれ、この組はサーバ420に伝送され
る。サーバ420は、サーバ410から情報を受信し、第2リスト、linkf
rom_list 428を第1サーバ410とそれ以外のサーバから受信され
た情報からアセンブルする。Linkfrom_listファイル428は、他
の文書によってリンクされる第2サーバ420上に含まれる文書のリストである
。
まり第1サーバ410上のdoc1.html 414と第2サーバ420上の
doc2.html 424によってリンクされる。第3サーバ430は、do
c1.htmlとdoc2.htmlによってref2.htmlがリンクされ
る第1サーバと第2サーバ410と420から情報を受信し、その情報はlin
kfrom_list 438からアセンブルされる。
ルとターゲットファイルを示すlinkto_listファイルをアセンブルし
、この場合ソースはそのサーバ上に含まれる。SBAは、他のサーバ上のどの文
書がそのサーバ上に含まれる文書に接続するリンクを有するのかを示す他のサー
バから受信される情報からlinkfrom_listもアセンブルする。各S
BAは、リンクについてそのサーバ上に含まれる文書を定期的に走査し、図3に
図示されるステップに示されるように、リンクの変化を特定する。これは、例え
ば、24時間毎、または週に一度、あるいはサーバ上に記憶されているhtml
ページに対して加えられる修正の予想される頻度に従ってサーバ管理者によって
選択されるそれ以外のなんらかの定期的な時間間隔で発生してよい。これにより
、各SBAが、妥当に最新であるlinkfrom_listファイルをアセン
ブルできることが確実になる。
文書で検出された変更を、ソースhtml文書、つまりカレントサーバへのリン
クを含むそれらの文書を含むそれらのサーバに伝送してよい。これは、ソース、
つまりlink_to文書のサーバが、ターゲット文書での変更に従ってソース
文書中のリンクに適応できるようにする。これは、さらに後述される。
リンクの変化をCIに伝送するというステップ318を含む。CIは、文書間の
すべてのリンクのリストを維持し、ソース文書に、ターゲット文書の変化が受信
されると、ターゲット文書の変化をソース文書に知らせる。
HTTPサーバ、第2HTTPサーバ、および第3HTTPサーバ、510、5
20および530を示す図5に参照してさらに説明される。第1サーバ510は
、SBA_server1と呼ばれるSBA512を含み、第2サーバと第3サ
ーバ520と530もそれぞれのSBA522と532を含む。それぞれのSB
Aは、ステップ304による方法でlinkto_listファイル516、5
26および536をアセンブルする。第1サーバ、第2サーバおよび第3サーバ
510、520、および530は、そのアドレスが、例えば、http://w
ww.ci.comである中央インデックスサーバ550に接続される。CIサ
ーバ550は、CI552を含む。CIは、前述されたような方法で接続された
サーバから受信されるインデクシング情報を含む。
552は、文書間のすべてのリンクのリスティングであるlink_list
554を維持する。したがって、第1サーバ510上のdoc1.html 5
14は、ref1.htmlとref2.htmlへのリンクを含み、link
_listは、組(www.server1.com/doc1.html、w
ww.server2.com/ref1.html)、および組(www.s
erver1.com/doc1.html、www.server3.com
/ref2.html)を含む。さらに、第2サーバ520上のdoc2.ht
ml 524は、第3サーバ530のref2.html535へのリンクを含
む。したがって、ファイルlink_list 554も、組(server2
.com/doc2.html、server3.com/ref2.html
)を含む。CI512は、すべてのリンク情報を含むので、このプロトコルには
各サーバでのlinkfrom_listファイルを維持するという要件はない
。
に応えてSBAによって実行されるプロセスを示す。ローカルSBAは、ステッ
プ602で、変更の種類の表示とともに、ターゲット(link_to)文書内
の変更の通知を受け取る。それから、SBAは、ターゲット文書が削除されたか
どうかを判断する。
を判断すると、SBAは、以下の処置の1つまたは複数を講じてよい。第1にS
BAは、ステップ606で、サーバ管理者にメッセージを伝送し、管理者にター
ゲット文書の変更を通知する。管理者は、サーバ上のどの1つのまたは複数のソ
ース文書が問題のターゲット文書へのリンクを含むのかに関しても知らされてよ
い。このようにすることを許可されている、あるいはこのようにするように構成
されている場合、SBAは、例えば、リンクが無効であることを示すためにソー
ス文書中にマークを挿入することによって、ステップ608でソース文書を自動
的に修正してよい。さらに、SBAは、ステップ610で、ソース文書からリン
クを削除することを許可される、あるいは削除するように構成されてよい。さら
に、SBAは、ステップ612で、代替ターゲット文書への新規リンクで、現在
の主題文書へのリンクを置換することを許可される、または置換するように構成
されてよい。
ードについて類似したワード頻度のものを見つけることだろう。CIは、削除さ
れた文書から10個の最も頻繁なワードを有するすべての文書に対する探索を行
うことができるだろう。これらの文書の集合の内、それは削除された文書ワード
頻度に最も近い相対的なワード非インドを有するものを探すことができる。これ
は、文書中のワードの頻度を示す、順方向インデックスを調べることを含むだろ
う。
4、SBAはサーバ管理者にURLの変更に関する通知を提供してよい、ステッ
プ616。SBAは、ステップ618で、ソース文書のアンカータグ内のターゲ
ット文書のURLを修正することを許可される、あるいは修正するように構成さ
れてもよい。
場合には、SBAはターゲット文書のコンテンツが変化したかどうかを、ステッ
プ620で判断する。
ジのタイトルが大きく変化したかどうかを確かめることである。これは、テキス
トの2つの小さな部分を比較することを必要とする。過去のタイトルの部分列が
残っている場合には、ページはおそらく大きく変化しなかったのだろう。すべて
のワードが異なる場合には、旧いワードと新しいワードの間には何の意味的なリ
ンクはなく(wordNetなどの意味辞書が使用できる)、そのときには、コ
ンテンツが大きく変化したと結論付けることができる。
十分に重要であると判断すると、SBAは、1つまたは複数の方法で進んでよい
。例えば、SBAは、ステップ623で、ターゲットページのコンテンツの変化
をサーバ管理者に知らせるだけでよい。それから、管理者は、著者が、ターゲッ
トページが依然としてソースページからのリンクを維持する価値があるかどうか
に関して手動の決定を下すことができるように、ソースページの著者に知らせて
よい。SBAは、ステップ624で、ソース文書内のリンクを削除することを許
可されるか、あるいは削除するように構成されてよい、あるいはステップ626
で、ターゲット文書へのリンクを、代替ターゲット文書への新しいリンクで置換
することを許可されてよい。
使用できないと判断してもよい。使用できない場合には、SBAは以下のステッ
プの1つまたは複数を講じてよい。SBAは、ステップ630で、サーバ管理者
に、ターゲット文書を含むサーバがもはや使用できない旨を知らせてよい。SB
Aは、このようにすることを許可されている、あるいはこのようにするように構
成されている場合には、ターゲット文書がもはや使用できないことを示すマーク
によって、ステップ632でソース文書を修正してよい。SBAは、このように
することを許可されている、あるいはこのようにするように構成されている場合
は、ステップ634で、ソース文書内のリンクを単に消去してもよい。また、S
BAは、ステップ636で、ソース文書内のリンクを代替ターゲット文書への新
しいリンクで置換してもよい。
が変化した、または移動したことをユーザに警告するためのステップを講じても
よい。いったんSBAが他のサーバ上のソース文書がリンクを有するhtml文
書内に変化があることを検出すると、ステップ702、SBAは、ステップ70
4で、ターゲット文書の変化が、ユーザが変化に関して警告されなければならな
いほど十分に重要であるかどうかを判断する。
断する場合、SBAは、ステップ706で文書が削除されたかどうかを判断する
。ターゲット文書が削除されている場合には、SBAは、ステップ708で、タ
ーゲット文書が削除されていることをユーザに知らせる新しいhtml文書を形
成することを許可される、または形成するように構成されてよいか、あるいはス
テップ710で、削除されたターゲットページの代わりに、表示する代替ページ
をユーザに知らせる新しいhtml文書を作成してよい。
ると、SBAは、ステップ714で、旧いURLで、ユーザに新しいURLを通
知する新しいページを作成してよい。この新しいページは、新しいURLでのタ
ーゲット文書へのハイパテキストリンクも含んでよい。
しいページが表示される時間の長さは、古いURLへの追加リンクが残っている
かどうかに従って設定されてよい。SBAは、どのソース文書が古いURLにリ
ンクするのかを示す現在のlink_fromリストを維持する。ステップ71
6で、古いURLへのこれ以上のリンクが残っていないことが判断されると、ス
テップ718で新しい宛先変更ページが削除されてよい。加えて、SBAは、ス
テップ720で、例えば6ヶ月などの所定の長さの時間が経過した後に古いUR
Lの新しいページを削除するようにプログラミングされてよい。
用できないサイトに、ユーザを向けるブックマークを含んでいないことを確実に
するために中央インデックスによって維持されるデータベースに対して参照を有
することができる。該ブラウザは、図8にステップ802で、ブックマークが付
いたページが依然として使用できる旨を確実にするために、中央インデックスを
用いて定期的にチェックするエージェントが提供できる。ブラウザエージェント
が、ステップ804で、ブックマークが消えていると判断すると、ブラウザエー
ジェントは、ステップ806で、ブックマークを無効であるとマークしてよい。
ブラウザエージェントが、ステップ808で、中央インデックスから、ブックマ
ークがそのURLを変更したと判断すると、ブラウザエージェントは、ステップ
810で、新しいURLを反映するためにブックマークを変更するように構成さ
れてよい。ブラウザエージェントが、ステップ812で、ブックマークに位置す
るページのコンテンツが変更されたと判断すると、ブラウザエージェントは、ス
テップ814で、ユーザに代替のブックマークを勧めてよい。
あり、典型的には、それらを構成するhtmlは、プログラムによって「動的に
」作成される。これらのページは、例えば、html形式照会がユーザによって
提出される時点でプログラムによって構築される。大部分の動的なページは、そ
の構築においてデータベースからのデータを使用する。それ以外の種類の動的ペ
ージ(例えば、チャート)は、JavaまたはJavascriptプログラム
またはスクリプトによって構築される。動的ページは、そのURLがブラウザに
よって要求されるたびにプログラムまたはスクリプトによって生成されるウェブ
ページであると見なすことができ、それはウェブサーバ上には記憶されていない
。大部分の動的ページは、バックエンドデータベースから作成される。いくつか
のページは、事前にデータベースから生成され、静的ページとして記憶されてよ
く、動的ページに対する参照は、通常、作成された、または事前に作成された静
的ページを含むと解釈されなければならない。入力組は、有効な動的ページを結
果的に戻す入力を送信するために使用される。
成しないが、定期的に更新される多数の静的ページを作成するためにスクリプト
を使用する。これらのページは、一般的には、どこか他のところからのそれらに
対するリンクはないだろうという点で、動的ページに類似した特性を有する。し
たがって、スパイダなどの従来のインデクシング方法は、スパイダがリンクを介
してウェブページを見つけるため、これらのページを見つけない可能性がある。
これらの作成された静的ページは、考えられるすべてのページの包括的な集合よ
りむしろ、頻繁にアクセスされる動的ページのキャッシュであってよい。作成さ
れた静的ページまたは事前に作成された静的ページは、(例えば、考えられるペ
ージのすべてまたは部分集合を作成することによって、あるいはそれらが検索さ
れるにつれて動的ページをキャッシュに入れることによって)データベース内の
情報へのアクセスを加速するために静的ページとして記憶されるウェブページで
あると見なすことができる。これらは、他の静的ページと同じように捕捉されて
よいが、動的ページまたはデータベースへの接続を認識することによってさらに
効率的に索引付けられてよく、動的ページに対する参照は、通常、作成されたま
たは事前に作成された静的ページを含むと解釈されなければならない。動的ペー
ジおよびこれらの作成された静的ページの索引付けは以下に後述される。
ジを作成し、高速アクセスのための静的ページとしてそれらを記憶するが、事前
に作成される静的ページの作成は、SBAが作成し、動的ページを索引付けるが
、それらを記憶しない方法(後述されるケース2.3)に類似している。したが
って、作成される静的ページは、他の任意の静的ページのようにSBAによって
索引付けられるだろうが、組の表現は、SBAがすべてのこれらの作成されたペ
ージを表すための最もコンパクトな方法であり、これらのページを作成するスク
リプトは、索引付け時にSBAによって使用できる。したがって、これらの静的
ページは、静的なリンクが、動的リンクよりむしろCSEによる探索結果ページ
で作成されるという点を除き、動的ページ組インデクシング方法(後述されるケ
ース2.1)によって処理される。
ブサイトに情報を提出できるようにするhtmlでの構成子である。例えば、L
ycosなどのサーチエンジンを使用するとき、ユーザは、1つまたは複数のキ
ーワードを、それらを現在表示されている画面の一部の中に打ち込むことによっ
て提出し、それから「探索」などの画面上のボタンをクリックしてキーワードの
転送を開始する。それから、キーワードは、現在アクセスされているウェブサイ
トで受け取られる。
るプログラムに名前を指定する。これは、動的ページを作成するプログラムであ
る。このようなプログラムは、多くの場合、cgiスクリプト(cgiは、「共
通ゲートウェイインタフェース」を意味する)であるだろう。該cgiスクリプ
トはユーザによって送信される情報を受信し、情報を、ローカルデータベースま
たはリモートデータベースからの情報の部分に対する要求として解釈し、SQL
照会などのデータベースに対する照会を作成する。それから、cgiスクリプト
は、データベースから要求されたデータを検索し、このデータを使用してページ
を構築し、動的ページをユーザに戻す。動的ページを作成するために使用される
cgiスクリプト以外のプログラムがあり、ここでの形式処理プログラムに対す
る参照は、動的ページを生成するために使用できる(Javaサーブレットおよ
びリモートメソッドを含む)機械コードまたは中間または仮想機械コードに従っ
て解釈されるか、あるいはコンパイルされるかに関係なく、任意の種類の、ある
いは任意の言語での任意のスクリプトまたは実行可能なファイルを意味すると解
釈されなければならない。用語は、ユーザが新規探索を開始できるようにするた
めのフィールド、およびJavaウィンドウなどの入力を収集するそれ以外の手
段を含む動的ページも含むが、形式ページは、ユーザが入力を指定するためのフ
ィールド、メニュー、および/またはその他の手段を含むウェブページであると
見なすことができ、最も多くの場合は静的ページである。動的ページを作成する
ために、形式ページがどのようにして使用されるのかを示す例は、SBAが図1
1に示されるようにサーバ206上でどのように動作するのかを示すときに、図
9から図10に関して後述される。
は、図12に図示されている。インストール中、SBAは、ステップ1202で
ウェブサイト管理者のニーズに合うように構成されてよい。例えば、SBAは、
(i)どの程度頻繁にSBAが変化がないかウェブサイトをチェックするのか、
(ii)旧いリンクの自動的な更新、つまりウェブサイト管理者だけに提案され
た更新で警告する (iii)索引付けられてはならないページに対する制限 (iv)索引付けられてはならないデータベース(複数の場合がある)内のデー
タ(例えば、列)に対する制限(例えば、機密情報、重要ではないまたは有効で
はない情報、あるいはそれ以外の情報がユーザによって提供される場合にだけ表
示されなければならない情報―この最後の点の例は、ユーザがある人の名前を入
力し、電話番号が戻される場合であり、これは逆に起こってはならない。 (v)変更が、索引付けられるように設定されていたデータベースに加えられる
ときに、SBAが自動的に索引付け情報を更新するオプション(「データベース
トリガ」) を含む、数多くのパラメータで構成されてよい。
トを精査し、動的ページの作成で使用されるデータベース(複数の場合がある)
を見つける。それから、SBAは、種類、使用される照会言語、ユーザ名とパス
ワード、およびアクセス方法などの各データベースについての追加情報を決定し
(この情報は、ウェブサイト管理者によって手作業で提供されるか、SBAによ
って自動的に決定されてよい)、その結果SBAは、ステップ1206で各デー
タベースに接続し、各データベースからデータを検索することができる。それか
ら、SBAは後述される方法の1つを使用し、関連するデータベース(複数の場
合がある)からインデクシング情報を抽出し、圧縮されたフォーマットをとって
よいこの情報は、ステップ1208で、後述される方法の1つを使用してCIに
送信される。このようにするように構成されている場合、SBAは、ステップ1
210で、索引付けられているデータベースにいつ変更が加えられるのかを自動
的に検出するトリガをインストールする。それから、SBAは、ステップ121
4で、発生した可能性のあるあらゆる変化についてウェブサイトをチェックする
前に、インストールプロセス中、またはそれ以降に設定されてよい事前に定めら
れる期間(ステップ1212で)待機する。サイトが変化した場合(ステップ1
216)、SBAは、ステップ1218で、CIに関連するインデックス情報を
送信する。
付け情報が多くのSBAから受信されると、CIインデクサ1300は、まず、
この情報のために順方向インデックスエントリ1302と1304を構築する。
それから、それは、反転されたインデックス1306を更新するために、順方向
インデックスエントリ内の情報を利用する。それから、SBAとCIがデルタ、
つまりインデックスデルタファイルと通信しない限り、静的ページ1304の順
方向インデックスエントリは削除される可能性があり、そのケースではそれらの
順方向インデックスエントリは残らなければならない。それらを削除すると、静
的ページに必要とされるCIでの記憶域は大幅に削減されるだろう。動的ページ
1302に対する順方向インデックスエントリは、通常、削除できない。順方向
インデックスと反転インデックスが構築されてよい方法に対して、反転インデッ
クスが順方向インデックスからの表を共用するアプローチを含む、数多くの代替
アプローチがあることが注意されなければならない。反転インデックス1306
の索引が付けられた用語のディクショナリおよび/またはシソーラスを備えるこ
とができる照会用語の辞典1308が維持される。辞典1308の機能が、反転
インデックス1306の中に統合できることが当業者に明らかになるだろう。
転インデックス1306は、wordIDをdocIDマッピングに提供し、順
方向インデックス1302、1304は、docIDをURLマッピングに提供
する。探索者が、探索するものに、1つまたは複数の照会を提供するとき、辞典
1308は、インデックス内に用語が存在しているかどうか、および存在する場
合には、その対応するwordIDを突き止めるために調べられる。それから、
反転インデックスは、探索者の照会用語を含む、文書の完全な集合を表すwor
dIDのすべてのdocIDを見つけるために探索される。
、テキストの本文で見つけられるのか (iii)照会用語が、指定された文書内で密接に位置し(そのためおそらく関
係付けられ)ているのか、あるいは明らかに関係付けられていないのか (iv)文書が、照会用語のすべてを含むのか、あるいはいくつかだけを含むの
か を含んでよい。 この情報は、ユーザの照会に十中八九関連しているそれらの文書がリストの先頭
にあるように、docIDのリストを並べるために使用される。それから、do
cIDごとに、順方向インデックスが調べられ、元の文書を検索できるURLを
突き止める。動的ページのケースでは、これは、形式処理プログラムURL、方
法、入力フィールドおよび入力組からURLを構築し直すことを必要とする。順
方向インデックスコンテンツは、探索者が指定した可能性のある正確な句の存在
を確認するために、およびどれが求める結果になるのか(which resu
lts to pursue)を考えるときに、探索者がレビューしてよい関連
するコンテンツの短い抜粋を提供するために使用されてもよい。
するために待機する。CIがメッセージを受信すると、それは、ステップ140
4で、新しい索引付け情報を追加し、その順方向インデックス1302、130
4内の既存の索引付け情報を修正する。それから、CIは新しい索引付け情報を
追加し、ステップ1406で、その逆インデックス1306内の既存の索引付け
情報を修正する。それから、CIはSBAからの追加メッセージを待機する。
る情報を要求するのを待機する。CSEは、ステップ1504で、ユーザがブラ
ウザを通して適切な探索情報(例えば、キーワード)を入力し、サーチエンジン
ウェッブページ上の提出ボタンまたは探索ボタンを押すことによって照会を受け
取る。CSEは、ステップ1506で、CIの逆転インデックス1306を調べ
、それぞれのキーワードに一致する動的ページ作成点のリストを形成する。それ
から、CSEは、ステップ1508で、すべての照会ワードに一致する動的ペー
ジ作成点を見つけるためにキーワードのリストをマージし、結果的に事前結果リ
ストを生じさせる。事前結果リスト内のアイテムは、ステップ1510と151
2で、この情報を含む有効な動的ページがあるかどうかを確かめるためにチェッ
クされる。ない場合には、アイテムは(ステップ1514で)リストから削除さ
れ、次のアイテムがチェックされる。この情報を含む有効な動的ページがある場
合には、このページを作成する入力が注記され、結果リストに入れられ、エント
リは、ステップ1516で事前結果リストから削除される。各アイテムは、ステ
ップ1518で、何も残らなくなるまで(何かが残されている場合、CSEはス
テップ1510に戻る)事前結果リスト内でチェックされる。ステップ1516
で決定される入力を使用して、URLが、ステップ1520で、結果リスト内の
動的ページごとに構築される。指定されるキーワードを含む静的ページの集合は
、ステップ1521で決定される。関連付けられるURLは、静的ページおよび
動的ページのための結合された結果リストを形成するために結果リストに追加さ
れる。それから、結果は、ステップ1522で、照会に対する関連性の順序で格
付けされる(これを行うための標準的な技法がある)。それから、CSEは、ス
テップ1524で、html結果ページを作成し、要求側ブラウザにそれを戻す
。典型的には、この結果ページは、ユーザによって入力されるキーワードに基づ
いて、動的ページと静的ページの両方へのリンクを含むだろう。CSEのユーザ
が動的ページに対するリンクをクリックすると、彼らはCSEによって構築され
たURLに基づいてデータベース情報から形成される動的ページに直接移動する
。
企業に関する勧めを提供するために、図9Aから図9Cに図示されるように動的
ページを作成できる株式情報例に関して後述される。形式ページは図9Aに図示
され、特定の入力を含むことにより照会が入力された形式ページが図9Bに図示
されている。それから、結果として生じる動的ページが作成され、図10に図示
されるように、ウェブサーバ206のデータベース1002から抽出されたデー
タを表すエントリ900が強調表示される図9Cに図示されるようなユーザのブ
ラウザに送信される。図10は、ページ1004の入力フィールド1010に入
力されるデータを要求とともに受信する形式処理プログラム1008にhttp
要求を戻すために、ユーザのブラウザ1006に送信される形式ページ1004
を使用できるメッセージフローを示す。プログラム1008は、ユーザのブラウ
ザに戻すhttp応答を作成するために使用できるプログラム1008に結果を
戻すために、リレーショナルデータベース1002に対するSQL照会を生成す
る。応答は、プログラム1008によって作成される動的ページを定義するコー
ドを含み、応答は、ユーザのブラウザ上での、図9Cに図示されるような、動的
ページの表示を引き起こす。
ml である。
の名前用である。株式コード用の形式入力の名前は「scode」であり、仲買
人名の形式入力の名前は「bname」である。
com/cgi−bin/brokerdata METHOD=“GET”>
Stock code eg AOL <INPUT TYPE=“text”
NAME=“scode”SIZE=10><br> Stock broker<INPUT TYPE=“text”NAME=“
bname”SIZE=10><br> <INPUT TYPE=“submit”VALUE=“Submit”><
br> となるだろう。
okerdata である。この例では、情報は、Oracle(商標)データベース1002に記
憶される。
らの格付けを含む例の表は以下のとおりである。
単位で索引付けされる。それは2つのそれ以外の列を有し、exchange、
つまり企業が上場されている株式証券取引所と、他方は、企業の名前を含むst
ock_nameである。
one_no、およびemailを有する。
ackson’をそれぞれの形式フィールドに入力してから、提出ボタンを押す
と、以下のSQL照会を生成する。 select rating,stock_name,email from stock_info,stock_rating,stock_b
rokers この場合、 stock_info.stock_code='AOL'and stock_brokers.nam='jackson'and stock_info.stock_code=stock_rating.s
tock_code and stock_brokers.name=stock_rating.name
;
株式の格付け、および株式の名前、および仲買人のemailアドレスを表示す
る(図9Cを参照すること)。
QLデータベースであるという仮定の元にある。いくつかの改変を含む基本的な
技法は、SQL以外の照会言語を使用するバックエンドデータベースから作成さ
れる動的ページの索引付けに、およびその他のバックエンドデータソースにも適
用可能だろう。前述されたように、SBAは、スタンドアロンソフトウェアモジ
ュールとして実現されてよいか、あるいはHTTPサーバ(HS)に含まれてよ
いか、あるいは何らかのほかのさらに大きなソフトウェアモジュールに含まれて
よい。
タベース(DB)1008の上位装置として働く同じコンピュータからである必
要はない。つまり、DBは、HTTPサーバディレクトリツリー(HSDT)を
記憶するサーバ206に対する別のコンピュータ上にある場合があることを意味
する。
すべてのファイルの表示を可能にするコンピュータ上でインストールできる。こ
れは、SBAの上位装置として働くコンピュータ、および共通のネットワークフ
ァイルシステムの一部であるHSDTの上位装置として働くコンピュータを介し
て実行できるだろう。またリモート機械上のSBAが、別のコンピュータ上で上
位装置として働かされるHSDTを表示するための他の考えられる方法もある。
れは(ステップ1604で)コンピュータ管理者によって手動でHSDTのロケ
ーションを通知されてよいか、あるいはそれは(ステップ1606で)自動的に
このロケーションを演繹することができる。好ましい方法ではない後者のオプシ
ョンは、SBAが、ネットワークファイルシステム全体、つまりHSDTの場合
ローカルファイルシステムを探索することを必要とする。これを達成する1つの
方法は、htmlファイルの位置を突き止めることによる。
ービスを提供できる実際のファイル)を突き止めることも必要とする。これは、
ステップ1608でコンピュータ管理者によって手動で提供されてよいか、ある
いはSBAは、ステップ1610で自動的にこれを演繹することができる。これ
を達成する1つの方法とは、SBAが、htmlファイルを含むこのサブツリー
を見つけるために、HSDTを調べることである。
に使用できるかどうかを判断するためにWS内の各ページを見る。SBAは、リ
スト、つまり動的ページを作成できるだろうそれらのページのdyn_list
を作成する。これを判断する1つの方法は、ページからhtmlの存在を特定す
ることによる。私達の株式情報例では、SBAは、ファイル「broker.h
tml」を見て、それがその中に形式タグを有することを認識するだろう。それ
から、それはこのファイルをdyn_listに追加するだろう。
しいリストを作成する。Dyndb_listは、データベースにアクセスする
ことを経由して動的ページを作成できるそれらのページのリストだけを含むため
、リストcyndb_listは、通常、同じ番号またはdyn_listより
少ないアイテムを含むだろう。dyn_list内のページについて、SBAは
形式アクションファイル、act_fileと名前が付けられるファイルを見る
。act_fileがバイナリである(ネイティブ機械コードまたは解釈された
バイトコードのなんらかの形、例えば、Java仮想機械にコンパイルされる)
場合には、SBAはその中から文字列のリストstr_listを抽出する。文
字列は、文字、数字および句読点などの文字を表す値に相当するバイナリ内で見
つけられるバイトのシーケンスである。したがって、str_listは、典型
的には、読み取り可能なワードおよび名前または用語のリストとなるだろう。a
ct_fileがバイナリではない場合には、文字列は容易に可視である。それ
から、SBAは、SQL文である文字列を見つけるためにstr_listのメ
ンバーを調べる。特に、SBAは、SQL選択文を探すだろう。SQL選択文は
、データベースを照会するために使用される。そのact_filesがSQL
選択文を含むこれらのページは、動的ページを構築するためにデータベースにア
クセスするものであると仮定されるだろう。これらのページは、dydndb_
listに記録され、それらのアクションファイルの名前はdbact_lis
tに記憶されるだろう。株式情報例では、act_fileは、cgi−bin
/brokerdataである。この形式処理プログラムがSQL選択文を含む
ので、ファイルbroker.htmlもdynndb_list内にあるだろ
う。
およびその関連付けられる形式処理プログラムが動的ページを作成するのかを判
断した。dynb_list内のページごとに、データベースの名前、そのユー
ザ名、そのパスワードおよびそのネットワークアドレスも特定されなければなら
ない。dyndb_list内の各ページによってアクセスされるデータベース
種類は、ステップ1616で、ウェブサイトのシステム管理者によって手作業で
指定されてよい。代わりに、SBAは、ステップ1618から1622でこれら
のパラメータを自動的に演繹してよい。
ップ1618で、cgiスクリプトに可視にされる環境変数の集合から、および
スクリプト自体のコンテンツから証拠を収集することにより自動的に演繹されて
よい。環境変数は、実行中のプログラムがその値をチェックできるプログラムの
外側から名前が指定される値である。cgiスクリプトに可視である環境編集を
求める少なくとも2つの方法がある。非相互的な(non−cross)HSア
プローチは、HSのそれぞれの特定の種類を決定することであり、HSがそのc
giスクリプトの環境にインポートする環境変数のリストはHSDT内にある。
例えば、Apache HTTPサーバを使用すると、これはそのHTTPサー
バディレクトリツリー内のconf/httpd.confファイル内で発生す
る。cgiスクリプトにとって可視の環境変数を求めるためのその他の相互サー
バ方法は、SBAが、WSの中に一時的に、環境変数を単に一覧表示するだけの
簡略なスクリプトをインストールすることである。それから、SBAは、すべて
の環境変数の値および名前を示すこのインストールされたスクリプトに対してH
TTP GET要求を実行する。
と、ステップ1620で、SBAは、リストknowndb_listに記憶さ
れている、それが知っているデータベース種類の既知の標準的な環境変数がない
か、それらを調べる。例えば、Oracleデータベースが使用されている場合
には、ORACLE_BASE、ORACLE_HOMEおよびORACLE_
SIDなどの環境変数が存在するだろう。株式情報例では、これらはcgi−b
in/brokerdataがオラクルデータベースにアクセスできるために検
出されるだろう環境変数である。このチェックは、SBAのknowndb_l
ist内のすべてのデータベースについて行われるだろう。このリストは、大多
数のウェブサイトがカバーされてよいことを確実にするために、多くの異なる種
類のデータベースによって使用される環境変数を含んでよい。
istの各エントリによってアクセスされているのかを演繹する。通常、1つの
データベースだけがWSでcgi−スクリプトに可視であるだろうが、必ずしも
ではない。ただ1つのデータベースがある場合には、dyndb_list内の
それぞれのページがそれにアクセスすることが既知である。複数のデータベース
がある場合には、SBAは、dyndb_listからのどのページがどのデー
タベースにアクセスするのかを決定する。これを決定するために、SBAは、ど
のようにして一定のcgiスクリプトが特定のデータベースに接続するのかにつ
いての発見的教授法を使用する。例えば、cgiスクリプトがコンパイルされた
Cであり、それがオラクルデータベースにアクセスする場合には、cgiスクリ
プトから抽出される文字列の1つは、ライブラリ名「sqlca」を含むだろう
。いったんcgiスクリプトからデータベースに対する一致が行われると、SB
Aはe−タベースについてデータベース名、ユーザ名およびパスワードを、およ
びそれが必要とされる場合はそのネットワークアドレスを特定するために進むこ
とができる。
スのユーザ名とパスワードを決定する。ステップ1624と1628では、これ
は、これらの詳細をサイト管理者が入力することによって手動で実行されてよい
。代わりに、SBAは、ステップ1626と1630でこれらを自動的に決定す
ることができる。データベース名は、通常、アクセスされているデータベースの
ための環境変数内に含まれるか、あるいはcgiスクリプト自体に、またはなん
らかのほかのシステム情報ソース内で見つけられてよい。例えば、オラクルを使
用すると、ORACLE_SID環境変数が設定されると、それはデータベース
名を含むだろう。設定されない場合、それはユーザ名文字列の最後にあるだろう
。SBAは、データベース名を探すために、データベース型とcgiスクリプト
型の組み合わせごとに発見的教授法を使用する。株式情報例について、データベ
ース名は、cgi−bin/brokerdataがオラクルデータベースにア
クセスするため、ORACLE_SIDで見つけられるだろう。
探すために類似する発見的教授法を使用する。これらも、スクリプト自体の、あ
るいは何らかのシステム情報ソースの環境変数であるだろう。SBAは、データ
ベース型およびcgiスクリプト型の組み合わせごとに発見的教授法を使用する
。株式情報例については、ユーザ名とパスワードは、形式処理プログラムcgi
−bin/brokerdataのテキストに含まれ、SBAはプログラム内の
どの文字列が十中八九ユーザ名とパスワードであるのかを特定し、それは、それ
らが正しいことを確認するためにそれらを試すだろう。
SAがデータベースに接続を行うことができるcgiスクリプトについて機知で
ある。SBAがプログラミング言語Javaで実現される場合、これは便宜的に
JDBCを用いて実行できるだろう。JDBCは、多くの異なる種類のデータベ
ースに一様なSQLインタフェースを提供する事前作成されたコード(API)
のライブラリである。
」とパスワード「boggle」が指定されるstock__dbと呼ばれるオ
ラクルデータベースである。また、データベース用のリモートデータベース管理
システム(RDBMS)は、ポート1500で傾聴するホストサーバachil
les.stockavicc.comで実行中である。このケースでは、この
データベースに接続するための例Javaコードは、以下のとおりだろう。 Class.forName(“oracle.jdbc.driver.Or
acleDriver”).newInstance() String url=“jdbc:oracle:thin:@Achill
es.stockadavice.com:1500:stock_db”; Connection con=DriverManager.getConn
ection(url,“admin”,“boggle”);
関係性を決定する。これを決定するための数多くの技法がある。1つのアプロー
チでは、SBAは、ステップ1632で、形式入力とSQL照会の関係性を、形
式処理プログラムを調べることによって演繹する。
ス列の関係を見つけ出すことは自明である。SQL文の中の変数のロケーション
は、1つの形式入力フィールドと一致される。以下のとおりに、単純な入力フィ
ールドのある単純な例を考えてみる。
com/cgi−bin/stocks” METHOD=“GET”> Enter code:<INPUT TYPE=“text”NAME=“c
ode”SIZE=10><br> <INPUT TYPE=“submit”VALUE=“Get quote
!”><br> である。
s_inputおよび stock_info.stock_code=stock_prices.s
tock_code である。
as_inputであり、プログラム変数であるように考えられ?、これは「c
ode」と呼ばれる入力フィールドに一致するだろう。これは、この入力フィー
独活がデータベース列stock_info.stock_codeに一致する
ことを示す。このデータベース列は、形式に対するすべての考えられる入力の集
合を含む。
せることはさらに困難である。このマッチングは、(形式入力フィールドごとに
値を指定するプロセスで)cgiスクリプトに対してSBAが要求をこない、結
果として生じるデータベースに対する入力を観察することによって達成されてよ
い。この観察は、数多くの異なる方法で実施されてよい。1つの方法は、ステッ
プ1634で示されるように、SBAが、開放データベース接続性(ODBC)
捜査プログラム(sniffer)または何らかのその他の方法をインストール
することである。これは、ある特定のデータベースに送信されるログ照会を検出
し、ログするだろう。さらに幅広い範囲のオペレーティングシステムまたはcg
iスクリプト型について作用する他の方法がある。これらの代替策の1つである
ステップ1636は、(コンパイルされていない形式の場合)SBAが形式処理
スクリプトを改変する、あるいは、それが、それが実施するSQL照会をSBA
に知らせるように(コンパイルされている場合には)ラッパーを提供することを
含む。
は2つの方法の内の一方によって、形式入力とデータベース列の関係を決定する
。ステップ1638では、SBAは、ページごとに形式インタフェースに対する
照会を行い、結果として生じるSQL照会を観察し、どの形式入力が、どのデー
タベース列のどのエントリに一致するのかを注記する。代わりに、ステップ16
40では、SBAは、形式入力および人間の探索者から生じるSQL照会を観察
し、注記する。
のケースのそれぞれでCIに送信される必要がある情報の数多くの代替策がある
。使用される方法は、ステップ1642でサイト管理者によって設定されてよい
。
引付け方法が使用されるべきかに関する決定が示される。4つの主要な合うロー
値が概略された。ケース1と2について、2つの方法が与えられた。1.1と2
.1に示される方法は、通常、好ましい方法である。情報が複数のデータベース
に記憶され、相対的に独立している一定のデータベースの場合、一定の照会(例
えば、接合)は、組の展開を生じさせるだろう。1.2と2.2などのそれ以外
の方法を使用すると、これらのケースでは、SBAからCIへ伝送されるデータ
の量は最小限に抑えられるだろう。この交換は、データベースおよびSQL照会
を分析する時点で、SBAによって自動的に決定されてよい。
用されてよい数多くの代替策がある。いくつかのデータベースにとって、インタ
フェース(例えば、形式、Java等)を使用して探索してよい用語に索引付け
を制限することが適切である―ケース1と3。それ以外のデータベースにとって
は、データベースに記憶されるすべての情報で索引付け、このようにして探索者
によって指定される情報だけを使用して通常検索できないだろうページの検索を
可能にすることが適切である場合がある―ケース2と4。いくつかのケースでは
、データベースを分析し、データベース内のすべての入力および/または出力を
索引付けすること(ケース1と2)が適切である場合があるが、それ以外のケー
スでは、ユーザによって実際に検索されたそれらのページに索引付けを制限する
ことが必要である場合がある(ケース3と4)。
作成されたあるいは作成できる実際のページを索引付けること(ケース2.3お
よび4.2)、またはそれがデータベースに記憶される方法に類似する形式で情
報を送信すること(ケース1.2および2.2)がある。第3アプローチは、こ
の後者の代替策の変形、つまりデータベースから抽出される情報の組を送信する
ことである(ケース1.1、2.1、3.1および4.1)。独立した表の接合
のまれなケースでは、ケース1.2または2.2は、前述されたようにさらに効
率的であり、SBAによって自動的に選択されてよいが、この「組方法」は、非
常に一般的に適用可能であり、データベースに対する直接的なアクセスがないと
きにも使用できる。
ップ1658)。 ケース1.2:SBAは、動的ページ(例えば、SQL「where」節(ステ
ップ1660))を作成するために使用されるデータベースからデータを抽出す
るために、形式処理プログラムによって使用されるすべてのデータベースを送信
する。 ケース2:考えられるすべての動的ページの完全テキストを索引付けする。 ケース2.1:SBAは、静的テキストおよび考えられるすべての入力/出力組
を決定し、送信する(ステップ1662)。 ケース2.2:SBAは、静的テキストおよび (i)動的ページを作成するために使用されるデータベースからデータを抽出す
るために形式処理プログラムによって使用され、 (ii)出力列である(ステップ1664) すべてのデータベース列を送信する。 ケース2.3:SBAは、それらが静的ページであるかのように、考えられるす
べての動的ページの索引を作成する。 ケース3:人間の探索者によって塩策されたページの入力を索引付けする(ステ
ップ1648)。 ケース3.1:SBAは、人間の探索者によって入力されるユーザ入力を観察し
、入力組を送信する。 ケース4:人間の探索者によって検索されたページの完全テキストを索引付けす
る(ステップ1650)。 ケース4.1:SBAは、人間の探索者によって入力されるユーザ入力および結
果として生じる出力を観察し、これらを入力/出力組として送信する。 ケース4.2:SBAは、それらが静的ページであるかのように、検索された動
的ページに索引付ける。
660に示されるように、形式入力だけに対する探索を可能にするデータを送信
することを必要とする。ケース2は、完全テキストでの探索を可能にするデータ
を送信することを必要とする。したがって、ケース1は、出力が索引付けされな
いことを除き、ケース2と同じである。
処理プログラム内のSQL照会によって選択される列も送信する。SBAは、句
の探索を可能とするために、このテキストのワード位置、および動的ページに表
示されるデータベースエントリのワード位置も含む、静的テキストも送信する。
ステップ1662と1664は、ケース2に対応する動的ページ索引付けのオプ
ションである。
(ステップ1644で)索引付けられるために選ばれ、それらの完全テキストは
索引付けられなければならない(ステップ1656)。すべての入力と出力の集
合が、SBAが実行する照会によって一覧表示されることは、私達の株式情報例
で理解できる。つまり、サーチエンジンのユーザは、形式入力または動的ページ
に表示されるワードに対して探索できる。後者の場合、対応する入力とは、同じ
組に含まれるものである。
rokers.name,rating,stock_name,email
from stock_info,stock_rating,stock_b
rokersであり、 この場合、 sock_info.stock_code=stock.rating.st
ock_codeおよび stock_brokers.name=stock_rating.name
であり、 以下の入力/出力組を示す。
ステップ1666で注記される。これらは、通常、同じとなり、このようにして
、動的ページ作成店から動的ページの完全な集合について一度送信されてよい。
探索者は、これらのワードに関して実行されてもよい。静的テキスト、前記デー
タベースコンテンツ(つまり、入力/出力組)および形式処理プログラムのUR
Lなどの情報は、ステップ1668でCIに送信される。
ることによってアクセスを加速するためのデータベースから事前に生成された静
的ページがあるだろう。これらの静的ページは、別個に索引付けされてはならな
いが、むしろSBAは、動的ページについてと同じ方法で組方法を使用してそれ
らを索引付けする。
点は、ケース2.3は動的ページを作成し、索引付けするが、それらを記憶しな
いが、前記サイトはページを作成し、それらを高速アクセス用の静的ページとし
て記憶するという点である。したがって、これらの作成された静的ページは、そ
れ以外の静的ページによって索引付けることができるだろうが、組の表現は、S
BAがこれらのすべての作成されたページを表すための最もコンパクトな方法で
あり、これらのページを作成するスクリプトは、索引付け時にSBAによって使
用できる。したがって、これらの静的ページは、静的リンクが、動的リンクより
むしろ探索結果ページで作成されるだろうという点を除き、動的ページ組方法(
つまり、ケース2.1)によって処理されなければならない。作成された静的ペ
ージが、動的ページを含み冗長である(つまり、それらが頻繁にアクセスされる
動的ページのキャッシュに入れられたバージョンである)場合、URLの動的バ
ージョンよりむしろ、URLの静的バージョンが中央検索エンジンによって戻さ
れる。SBAは、形式入力から静的URLを構築するJavascriptまた
は類似物を見つける、および/またはステップ1632で動的ページのなんらか
の部分集合の作成スクリプトを発見してよい。
、ユーザがサーチエンジン照会を行う時点でSQL(類似)照会を実施する。こ
れは、入力のある特定の組み合わせによって指定される動的ページが、有効なコ
ンテンツを含む動的ページを生じさせることを検証するために実行される。
るために形式処理プログラムによって使用され、 (ii)出力列である、 すべてのデータベース列を送信する。
ラムのURLなどの情報が、CIに送信される。
実質的には異なる。それは、動的ページの構築で使用できるデータの考えられる
すべての部分を抽出するためにデータベースを照会することを必要としない。む
しろ、SBAは、ステップ1648で形式インタフェースに対して行われる照会
を注記するだけである。効率性の理由から、SBAは、それが数多くのそれらを
観察した後に観察された入力組を送信するにすぎない。これはステップ1652
で実行される。
について濾過されている―それは、それが使用されている場合にだけ索引付けさ
れるだろうという点である。
合である(初期のステップは、おそらくそのインストールを必要としていた)。
このODBC捜査プログラムは、形式処理プログラムからバックエンドデータベ
ースの中に入る入力を監視する。初期に形式処理プログラムを検査すると、SB
Aは、SQL照会内のワードを見て、その結果それはそれを再び認識できるだろ
う。SBAは、形式入力フィールドからSQL照会の可変スロットへの写像も解
決するだろう。つまり、SBAが実行時にSQL照会を見ると、それは、形式入
力にどの値が入力されたのかを認識できるだろう。
は、句の探査を可能とするために、これらのワードのワード位置、およびデータ
ベースから抽出されるワードが挿入される位置も送信してよい。
によって、照会が空ではない結果集合を戻すことを確かめる必要がある。結果集
合が空ではなかった場合、SBAはこの入力組をCIに報告できる。
番上のいくつかを送信するにすぎない。代わりに、SBAは、その一致が一定の
事前設定されたスレッショルドを渡した後に、CIに対する照会を報告してよい
。
ース3.1に非常に類似している。唯一の相違点は、SBAが、形式インタフェ
ースに対するユーザ照会を見ると、SQL照会によって戻される値も注記すると
いう点である。これは、照会自体を繰り返す、またはそれ以外の何らかの方法に
よって実行されてよい。
ージは、それらの実用性に従ってCIで索引付けされるだろう。
は、句の探索を可能とするために、これらのワードのワード位置およびデータベ
ースから抽出されるワードが挿入されるワード位置も送信する。
スを、それらが静的ページであるかのように作成する。したがって、動的ページ
を索引付けするために説明される詳細な方法は、これらのケースでは当てはまら
ない。
憶域をCIで必要とするだろう。これは、最初の2つのケースが、サイトの考え
られるすべての動的ページを索引付けしようと試みるためである。第2の2つの
ケースは、サイトで最も一般的な動的ページだけを索引付けしようと試みる。
の最後にマークをつける。ステップ1670以降に、データベースに対する変更
を送信する問題が対処される。
現在性を維持することである。バックエンドデータベース内での情報の大規模な
記憶を考慮すると、中央サーチエンジンが最新であることは重要である。
る。SBAは、動的ページの索引付け情報に影響を及ぼす列が変化するときに、
それと通信するデータベーストリガをインストールしてよい。
だけを可能にする。このため、ステップ1670で、SBAが、その表を利用す
るあらゆる動的ページ作成点に関連する変更についてSBAに通知する表ごとの
単一トリガを構築することが便利である。ステップ1672では、SBAは、d
yndb_list内のエントリによって使用されるすべてのデータベースで構
築されたトリガをインストールする。
される可能性のある例のトリガである。これは、完全テキスト索引付けが使用さ
れていた場合(つまり、ケース2と4)に使用されるトリガだろう。入力だけが
索引付けされている場合には、stock_code列だけがチェックされる必
要があるだろう。また、株式情報例のその他のデータベース表でのトリガに対す
るニーズもある。 CREATE or REPLACE TRIGGER SENDER() AFTER INSERT or UPDATE OF stock_code
, stock_name ON stock_info FOR EACH ROW DECLARE Msg varchar(30); PipeName varchara(30); Laststatus integer; TraceMode varchar(30); BEGIN PipeName:=‘Slavko’ Laststatus :=0; If(new.stock_code is not null)then Msg:=Msg||‘:stsock_info:’||‘stock_c
ode:’||:new.stock_code; end if; if(:new.surname is not null)then Msg:=Msg||‘stock_info:’||‘stock_nam
e:’||:new.surname; end if; DBMS_PIPE.pack_message(Msg); LastStatus:=DBMS_PIPE.send_message(P
ipeName); DBMS_OUPUT.put_line(‘message sent’) END;
るデータベースに対する変更を、それらが発生したときに通知するだろう。SB
Aは、ステップ1678で変更について聞くと、それはCIに知らせる。それは
、即座にこれを行うか、あるいは更新のバッチが蓄積するまで待機することがで
きる。
。行が挿入されると、SBAはこの新しい行をCIに送信する。CIはそれを順
方向インデックスエントリに追加し、そこからワードを反転インデックスに入れ
る。行が削除された場合、それは、どの行番号かを特定する。SBAはCIに告
げ、それは順方向インデックスから行を削除する。それは反転インデックスを調
べ、古いワードも削除する。行が更新されている場合には、行番号は既知である
。CIはこの行を取り、値を適切に変更する。あらゆる新しいワードは反転イン
デックスに追加される。削除されたワードは、その反転インデックスエントリか
ら取り除かれる。
られた後に、SBAは、この変更によって影響を受ける組を選択する照会を実施
できる。例えば、「jackson(ジャクソン)」と呼ばれる仲買人が名前を
「stevens(スチーブンス)」に変更する場合、例について変更された組
を検出するための探索は、以下 select stock_info.stock_code,rating,
stock_name,email from stock_info,stock_rating,stock_b
rokers where stock_brokers.name=‘stevens’ and stock_info.stock_code=stock_rating.s
tock_code and stock_brokers.name=stock_rating.name
となり、以下の結果を示す。
プログラムについて、影響を受けた組を計算する。CIは、すべての古い組の位
置を突き止め、それらを削除するか、更新する。
静的ページについては、情報は、既存のサーチエンジンによって使用されるよう
な確立された技法を使用して、これらのインデックスに記憶される。静的ページ
の順方向インデックスエントリ1702の例および逆転インデックスエントリ1
704は、辞典の例のエントリ1706とともに(表記「field:x」は、
フィールドのxビットを示す)図17に図示されている。ヒットのフォーマット
は16ビットを備え、12ビットは文書中のワードまたは用語の位置用であり、
4ビットはテキスト大文字使用のためのその他の情報用である。ケース2.1と
4.1でのように、組の記憶を含む、CIによって動的ページ作成点のための順
方向インデックスエントリ1802のために使用される構造は、図18に図示さ
れており、反転インデックスエントリ1804はケース2.1と4.1用であり
、辞典エントリ1806は逆転インデックスとともに使用される。このケースで
は、ヒットのフォーマットは、16ビットを使用して記憶されてよい組番号にす
ぎない。
び逆転インデックスエントリを使用するCI構造の例である。順方向インデック
スは、動的ページ作成点全体についての情報のブロックを含む。これらのブロッ
クのそれぞれは、番号(dynID)で索引付けられる。これらのブロックの中
で、SBAによって送信される情報の組または列は、前述されたように記憶され
る。
する情報の数多くのそれ以外の部分がある。これらは、形式ページのURL(図
18のfURL)、形式処理プログラムのURL(図18のflipURL)、
形式のメソッド(GETまたはPOST)(図18の方法)、形式入力フィール
ドの数(図18のnfields)、それらの名前(図18のfield1 f
ield2)、およびそれらが相当するデータベース列を含む。形式ページのタ
イトル(図18のタイトル)、形式ページからの初期テキスト、および動的ペー
ジで発生する静的なワードのリストなどのメタ情報もあるだろう。
されるSQL照会は、順方向インデックスエントリにも記憶されるだろう。また
、組が次々に記憶される代わりに、SQL照会内で言及されるデータベース列が
記憶されるだろう。順方向インデックスにデータベース列を記憶することの代替
策として、それらは、標準データベースに記憶できる。これが、SQL照会のさ
らに容易な実行を可能にするだろう。
報のブロックを含む。これらの情報のブロックは、各dynIDの後にワードの
発生のリスト、その動的ページ作成点の「ヒット」が続くdynIDのリストか
ら成り立つだろう。dynIDは、動的ページ作成点のID番号を指す。ヒット
の実際の性質は、動的ページ作成点のために使用されてきた索引付け方法に依存
する。dynIDは、句の探索を可能にするために、入力と出力を、動的ページ
上での静的ワード位置に連結する情報も指す。
トは、ワードが発生する組の数にすぎない。組番号は、図18に図示されるよう
に、順方向インデックス内のそのdynID用の組のリスト内での組の位置を指
す。
順方向インデックスで発生する列および行を指す。
テキストのヒットは、図17に図示されるように、ページ上のそのワード位置に
、テキスト属性などのそれ以外の情報を加えたものにすぎない。
以下の組を有している。
Eは、組の中の列のどれが形式入力に相当するのかを注記する―つまり、株式情
報例のケースでは最初の2つ。
を実行できる(この場合、ANDはブール演算子である)。CSEは、その逆転
インデックスエントリから、これらのワードの少なくとも1つが発生する組を認
識する。事前結果リストは、探索ワードの1つに一致するあらゆる組を有するす
べてのdynIDを含む。リストは、ワード「Yahoo」を含む組についての
ワード「jackson」と2つの組番号を含む組についての3つの組番号を含
むbroker.html動的ページ作成点に対する事前結果エントリを有する
だろう。
方含む組、およびこれらの組の組番号を有するそれらのdynIDを特定する。
株式情報例では、両方の探索ワードを含む1つの組があるため、broker.
htmlのそのdynIDが戻される。
列を作成する。このケースでは、入力は、組の最初の2つの列である。組5では
、値は「YHOO」と「jackson」である。形式フィールド名も順方向イ
ンデックスエントリに記憶されているので、CSEは、 scode=YHOO&bname=Jackson である照会文字列を構築できる。
URLもチェックする―このケースでは、それは、 http://www.stockadvice.com/cgi−bin/b
rokerdata である。
ためにこれらをまとめる。 http://www.stockadvice.com/cgi−bin/b
rokerdata?scode=YHOO&bname=jackson
よび図9Cに関して、ワード「broker」はすべての動的ページに表示され
る。このケースでは、dynID 5000も含む逆転インデックスにヒットが
ある。それは、静的ワード上のヒットとしてマークされるだろう。
の方法である。アプレットは、Javaで作成される小さなプログラムである。
アプレットは、ウェブページのhtmlコードで名前を指定され、ユーザがその
ウェブページを見ると、アプレットは、ウェブページとともにユーザのコンピュ
ータにダウンロードされる。それから、該アプレットプログラムは自動的に実行
される。アプレットは、ウェブページ上でテキストを入力するためのボックス、
およびこのテキストを提出するためにクリックするためのボタンを提示できる。
提出時、アプレットは、照会の結果を示すために、ページ上の外観の変化を生成
することができる。
ザ入力を受け入れ、バックエンドデータベースから引き出される結果を表示する
ことができるという特徴を有する。
第1に、アプレットは、データベース自体に連結するための文を含んでよい。そ
れ以外の主要なオプションは、アプレットがその結果としてデータベースアクセ
スを実施する別のJavaクラスでリモートメソッド呼び出しを実行するという
ことである。
リーを調べ、各htmlページをチェックする。前述されたように、SBAは、
形式タグを含むページを特定することができる。このケースでは、それはアプレ
ットタグを含むページも探す。
るために、SBAはJavaバイナリからascii文字列を見て、SQL照会
を特定する。アプレット自体がデータベースにアクセスする場合、SBAは、ア
プレットから文字列内のSQL照会を見つける必要がある。SQL文が見つけら
れる場合、このページが、その出力がデータベースへのアクセスを伴うページで
あると見なされる。
データベース照会を実行するクラスを呼び出してよいということである。アプレ
ットに呼び出されるこのJavaクラスはアプレットコードと同じディレクトリ
内になければならない。また、アプレットによって呼びだされるあらゆるクラス
の名前はアプレットに対する文字列のリスト内で発生するだろう。したがって、
SBAはアプレットコード内で名前が指定され、ウェブサイトディレクトリツリ
ーの上位装置として働く機械上でのアプレットのディレクトリ内で発生する各ク
ラスから抽出される文字列をチェックする。これらのどれかがSQL文を含んで
いる場合には、アプレットタグを含んでいた元のページが、バックエンドデータ
ベースにアクセスするページであると見なされる。
同様に起こる。バイナリ内の文字列が特定される。ユーザ名およびパスワードは
Javaデータベース接続性(JDBC)接続文で指定される。データベースへ
の接続に加え、SBAは、JDBC URLについての情報を決定する必要があ
る。アプレットのケースでは、JDBC URLは、すでに存在するだろう―し
たがって、SBAはそれに直接的にアクセスできる。
ールド入力を使用するアプレットページを索引付けすることを伴う。それから、
SBAはデータベースにアクセスするために使用されるテキストフィールド入力
の名前を決定する。これは、前述された形式入力フィールドの名前に同等である
。SBAは、アプレットのフィールドの名前を見る、アプレットのサブクラスを
作成することによってこれを達成する。 class Extract extends OriginalApplet
{ public static voidmains(String[]argv
){ Field[]fds=OriginalApplet.getFields
(); } }
ることを検証することが判明していたので、SBAは、アプレットによって使用
されるSQL照会を考慮する。
グラムに関して同じである。SBAは、バックエンドデータベースに送信される
照会を監視するODBC捜査プログラムをインストールする。それから、SBA
は、アプレットに照会を送信し、作成されるSQL照会を監視する。
のケースに関して同じである。この情報は、テキストフィールド入力に対応する
入力組またはデータベース列を含む。
BAは、元のアプレットのサブクラスであるそのサイトで新しいアプレットをイ
ンストールする。SBAは新しいアプレットを含む新しいページもインストール
する。
ールされる別のスクリプトに対してだろう。このスクリプトは、サーチエンジン
によって送信される照会文字列を読み取り、パラメータとしてサーチエンジンに
よって送信された照会文字列を含むことによって新しいアプレットを含むページ
上のアプレットタグを改変する。それから、スクリプトは、新しいアプレットを
含むページに宛先変更する。新しいアプレットはオリジナルのサブクラスである
。そのinit()メソッドにおいて、それは照会文字列の中で読み取り、テキ
ストフィールド内で相応してテキストを設定し、提出ボタンのクリックを真似る
。このコードの部分の例は以下のとおりである。 Public class ResultApplet extends DB
Applet{ Button submit=new Button(“Enter”); public void init(){ super.init(); field1.setText("sometext"); SubmitActionListner sal=new SubmitAc
tionListener(this); Submit.addActionListener(sal); Sal.actionPerformed(null); } }
セスすることによって、 SBAがこの情報を収集してよい数多くの方法がある。
達する単にやってきた元のページであり、これは、ユーザが探索照会ページから
きた場合には、(探索のURLから入手可能な)使用されたサーチエンジンキー
ワードを含むことがある。 (iii)ページ、ページセットまたはウェブサイトで過ごした時間量 (iv)彼らのアドレス、ロケーション等ユーザについてのデモグラフィックス
情報 (v)単一ページのパケット間の時間およびページ要素(例えば、画像、アプレ
ット、音等)間の時間を含む、サーバの帯域幅統計 を含む。
に送信されてよい。それは、 (i)個々のサーチエンジンユーザのデモグラフィックスプロファイルに探索結
果を合わせるために、 (ii)最も高速の応答を出すことができなければならないサイト(例えば、ミ
ラーサイト等)にユーザを向けるために、 (iii)ユーザがページで過ごした平均時間、ユーザのデモグラフィックスプ
ロファイル、および/またはある特定のページを見つけた過去の探索で使用され
たキーワードおに従ってサーチエンジン結果を格付けするために、 使用されてよい。
アプリケーションである。CIは、ショッピングサイトにインストールされるS
BA用のe−コマースポータルを提供するために使用されてよい。索引付けられ
てよい情報は、 (i)製品名/型/製造メーカ等 (ii)大量価格設定と割引、税金等を含む価格 (iii)ロケーション (iv)納品時間および運送費用オプション (v)品質およびレビュー (vi)製品の写真 (vii)保証情報 (viii)支払いオプション、ポイントプログラム等 を含む。
ン、品質とレビュー、および支払い要件などの1つの基準または基準の組み合わ
せに基づいた探索を提供してもよい。
−コマースサイトに向けられてよい。
ロケーション、売上税、および関税発行等に基づいた最適コスト(運賃コスト)
を特定するために総費用計算を実行してよい。
んでよく、CIのe−コマースポータルまたはローカルサイトのどちらかを通し
て支払いおよび運賃が発生するためのオプションが存在する。
lページの形を取るウェブサイトに関連してインデクシングシステムを使用する
ことに対して参照がなされてきた。しかしながら、発明は、探索目的のために索
引付けされてよいデータへのアクセスを提供する任意の形のサーバにも適用可能
であることが理解されるべきである。
脱することなく当業者に明らかになるだろう。
である。
実施形態の概略図である。
方法のフロー図である。
ースエージェントを含む3つのウェブサーバの例を示す概略図である。
ボックスを含む3つのウェブサーバの例を示す概略図である。
情報を受信したことに対する、サーバベースエージェントの応答のフロー図であ
る。
情報を受信したことに対する、サーバベースエージェントの応答のフロー図であ
る。
した旨をウェブ作者に通知するサーバベースエージェントのフロー図である。
中央インデックスとどのようにチェックするのかに関するフロー図である。
を含むウェブページの例である。
の例である。
ようにして作成されるのかを示す概略図である。
含み、かつ要求時に動的ページを作成する処理プログラムからのウェブサーバを
示す概略図である。
プロセスのフロー図である。
る。
サーチエンジンによって実行されるプロセスのフロー図である。
サーチエンジンによって実行されるプロセスのフロー図である。
って実行されるプロセスのフロー図である。
って実行されるプロセスのフロー図である。
って実行されるプロセスのフロー図である。
って実行されるプロセスのフロー図である。
ス内の静的ページインデックスエントリ用の例の構造を示す図である。
ス内の動的ページインデックスエントリの例の構造を示す図である。
記憶装置、110 ネットワークインターフェース、112 ディスプレイアダ
プタ、114 ユーザインターフェースアダプタ、115 システムバス、11
6 ディスプレイ、200 コンピュータシステム、208 サーバベースエー
ジェント、214 中央インデックス、219 中央サーチエンジン、222
サーバベースエージェント。
Claims (74)
- 【請求項1】 サーバから利用可能なデータのインデックスを作成する方法
であって、 前記サーバ上でデータを処理して中央インデックス用のデータアイテムにアク
セスすることであって、前記データアイテムがネットワークアドレスおよび用語
を含むことと、 前記データアイテムを含むインデックスファイルをコンパイルすることと、 前記中央インデックスに前記インデックスファイルを伝送することとを含む、
方法。 - 【請求項2】 前記処理が、前記データアイテムの変化を突き止めることを
含み、前記インデックスファイルが前記データアイテムの前記変化を備えるイン
デックスデルタファイルである、請求項1に記載の方法。 - 【請求項3】 前記処理が、前記データ中にデータベース照会文を配置する
ことを含み、前記データアイテムが前記文のための入力組を含む、請求項1に記
載の方法。 - 【請求項4】 前記データアイテムが、前記文に対応するデータベースにア
クセスするための追加データを含む、請求項3に記載の方法。 - 【請求項5】 前記追加データが、形式処理プログラムのネットワークアド
レスを含む、請求項4に記載の方法。 - 【請求項6】 追加データが、形式ページのネットワークアドレスと、デー
タベースの組および列用の入力フィールドに関する詳細とを含む、請求項5に記
載の方法。 - 【請求項7】 追加データが、形式ページからの用語と、形式ページで提出
された組に応じて形式処理プログラムが生成した動的ページからの用語を含む、
請求項6に記載の方法。 - 【請求項8】 前記追加データが、データベース型および名前などのデータ
ベースにアクセスするための追加の詳細と、ユーザ名およびパスワードなどのア
クセス用認証データとを含む、請求項6に記載の方法。 - 【請求項9】 前記処理が、前記組を抽出するために前記サーバで受信され
たデータ要求を処理することを含む、請求項3に記載の方法。 - 【請求項10】 前記データアイテムが出力組を含む、請求項3に記載の方
法。 - 【請求項11】 前記処理が、受信したデータ要求と、前記組を抽出するた
めに前記サーバで生成される応答とを処理することを含む、請求項10に記載の
方法。 - 【請求項12】 前記処理が、前記文および前記入力組を使用して動的ペー
ジを作成することを含み、前記データアイテムが前記動的ページの用語を含む、
請求項3に記載の方法。 - 【請求項13】 前記処理が、データ要求に応じて前記サーバから伝送され
る動的ページを処理することを含み、前記データアイテムが前記動的ページの用
語を含む、請求項1に記載の方法。 - 【請求項14】 前記処理が、前記照会文と関連付けられたタグに基づいて
動的ページを特定することを含む、請求項3に記載の方法。 - 【請求項15】 前記タグが形式タグである、請求項14に記載の方法。
- 【請求項16】 前記タグがアプレットタグであり、前記コンパイルするこ
とが、アプレットタグが特定したアプレットに前記入力組を提出するために提出
アプレットを生成することを含み、前記データアイテムが提出アプレット用のネ
ットワークアドレスを含む、請求項14に記載の方法。 - 【請求項17】 前記決定することが、前記データ内の照会文によってアク
セス可能なデータベースの列の変化を検出するためにデータベーストリガをイン
ストールすることを含み、前記変化が前記列の前記変化を含む、請求項2に記載
の方法。 - 【請求項18】 前記処理が、前記データからのリンク対を生成することを
含み、前記リンク対がソースネットワークアドレスおよびターゲットネットワー
クアドレスを含み、前記データアイテムが前記対を含む、請求項2に記載の方法
。 - 【請求項19】 前記対の少なくとも1つの変化を検出することと、前記対
の前記ソースアドレスに対応するロケーションに変更通知を送信することとを含
む、請求項18に記載の方法。 - 【請求項20】 前記変更通知を受け取ることと、前記変化に基づいて前記
ソースドレスに関連付けられる前記データを調整することとを含む、請求項19
に記載の方法。 - 【請求項21】 前記調整することが、前記ターゲットアドレス付きのタグ
を新しいターゲットアドレスへのタグで置換することを含む、請求項20に記載
の方法。 - 【請求項22】 前記対の少なくとも1つの変化を検出することと、前記タ
ーゲットアドレスに対応するロケーションに変更通知を送信することとを含む、
請求項18に記載の方法。 - 【請求項23】 前記変更通知を受け取ることと、前記ターゲットアドレス
に関連付けられたサーバで前記変化に基づいてリンク参照ページを確立すること
とを含む、請求項22に記載の方法。 - 【請求項24】 前記処理が、前記サーバで受け取られるデータ要求および
前記サーバから送信されるデータ応答に関係付けるなどの、前記サーバ上で統計
データにアクセスすることを含み、前記データアイテムが統計データを含む、請
求項1に記載の方法。 - 【請求項25】 前記方法が、前記中央インデックス用のエージェントによ
って実行される、前述の請求項のいずれか1項に記載の方法。 - 【請求項26】 前記エージェントが前記サーバ上にある、請求項25に記
載の方法。 - 【請求項27】 請求項1〜24のいずれか1項に記載の方法のステップを
実行するための構成要素を有するエージェント。 - 【請求項28】 インデックスデータベースを有する、前記中央インデック
スで前記インデックスファイルを受け取ることと、 前記インデックスファイル内のエントリに基づいて前記インデックスデータベ
ースを維持することであって、前記インデックスデータベースがサーチエンジン
によって使用されるために適応されることとを含む、請求項1〜24のいずれか
1項に記載の方法。 - 【請求項29】 前記インデックスデータベースが、前記データアイテムの
インデックスエントリを含み、前記インデックスファイルおよび前記インデック
スデータベースの前記エントリが、前記データアイテムを有するデータのページ
に対応する、請求項28に記載の方法。 - 【請求項30】 前記インデックスデータベースが、前記データアイテムの
用語の辞書を含み、前記インデックスデータベースが、前記サーチエンジンによ
って受け取られるサーチエンジン照会に応えて、ネットワークアドレスを構築し
、前記データアイテムに基づいて動的ページを作成するために前記サーチエンジ
ンによってアクセス可能である、請求項29に記載の方法。 - 【請求項31】 請求項1〜24および28〜30のいずれか1項に記載の
方法のステップを実行するための構成要素を有するインデクシングシステム。 - 【請求項32】 動的ページを生成するためのプログラム用のプログラムア
ドレス、およびページを作成するためにプログラムに提出するための入力組を含
むページエントリと、 動的ページを特定し、探索用語に対応する組を特定する探索エントリとを含む
、サーバからアクセス可能なデータのインデックス。 - 【請求項33】 探索照会の探索用語に対応する動的ページを特定するため
に探索エントリにアクセスするための手段と、 特定された動的ページについてアドレスを生成するためにページエントリにア
クセスするための手段であって、前記アドレスが前記プログラムアドレスおよび
前記組に基づいて生成される手段とを含む、請求項32に記載のインデックス上
で動作可能なサーチエンジン。 - 【請求項34】 請求項27に記載のエージェントと、 請求項32に記載のインデックスと、 請求項33に記載のサーチエンジンとを含む、インデクシングシステム。
- 【請求項35】 少なくとも1つのサイトへのアクセスを提供するためのサ
ーバと、 サイトに関係するデータのインデックスファイルを作成するためのサーバエー
ジェントと、 インデックスファイルからインデックス情報を記憶するための中央インデック
スであって、そこではサーバエージェントがインデックスファイルの転送のため
に、中央インデックスとの通信を開始する中央インデックスとを含む、インデク
シングシステム。 - 【請求項36】 サーバエージェントが、少なくとも1つのサイトをレビュ
ーし、少なくとも1つのサイトへの変更を表すインデックスデルタファイルをコ
ンパイルするように適応され、デルタファイルがインデックス情報を更新するた
めに中央インデックスに伝送される、請求項35に記載のインデクシングシステ
ム。 - 【請求項37】それぞれのインデックスファイルおよび/またはインデック
スデルタファイルを中央インデックスに伝送するために配列される複数のサーバ
および関連付けられたサーバエージェントを含む、請求項36に記載のインデク
シングシステム。 - 【請求項38】 各デルタファイルが、それぞれのサーバのサイトでリンク
の有効性に影響を及ぼすあらゆる変化に関する情報を含む、請求項37に記載の
インデクシングシステム。 - 【請求項39】 サーバエージェントが、前記変化を特定する際に、変更の
結果生じた無効にされたリンクを含む別のサイトに関連付けられる対応するサー
バに、変更の通知を伝送するように配列される、請求項38に記載のインデクシ
ングシステム。 - 【請求項40】 中央インデックスが、変更によって影響を受けたサイトを
特定し、そのサイトに関連付けられた対応するサーバに通知を伝送するように適
応される、請求項39に記載のインデクシングシステム。 - 【請求項41】 通知が、通知受信時に、対応するサーバおよび/または関
連サイトに関する情報を更新するためのアクションを実施するように適応されて
いる対応するサーバのそれぞれのサーバエージェントに伝送される、請求項40
に記載のインデクシングシステム。 - 【請求項42】 通知が、対応するサーバの管理者に伝送され、通知受信時
に、管理者が対応するサーバおよび/または関連するサイトに関する情報を更新
するためのアクションを実施できる、請求項40に記載のインデクシングシステ
ム。 - 【請求項43】 少なくとも1つのサイトが、データベースへのアクセスに
よって作成される動的ページにサービスを提供し、動的ページのインデックスフ
ァイルが、対応する形式処理プログラムによって有効なページを作成するであろ
う、考えられる入力を含む、請求項37に記載のインデクシングシステム。 - 【請求項44】 インデックスファイルが、さらに、動的ページの考えられ
る出力およびテキストを含む、請求項43に記載のインデクシングシステム。 - 【請求項45】 動的ページに関連付けられるサーバエージェントが、デー
タベースにアクセスし、インデックスファイル内のデータベースの1つまたは複
数の列を含むように適応される、請求項43に記載のインデクシングシステム。 - 【請求項46】 動的ページに関連付けられるサーバエージェントが、デー
タベースのあらゆる変化を特定するためにデータベース内にトリガを導入し、変
化が動的ページに関連付けられるインデックスデルタファイルに含まれる、請求
項43に記載のインデクシングシステム。 - 【請求項47】 動的ページに関連付けられるインデックスファイルが、ユ
ーザがそこから過去に検索したページの入力の記録を含む、請求項43に記載の
インデクシングシステム。 - 【請求項48】 動的ページに関連付けられるインデックスファイルが、ユ
ーザが過去に検索した動的ページの完全テキストページのインデックスを含む、
請求項43に記載のインデクシングシステム。 - 【請求項49】 入力/出力組または行/列索引付けが記憶される各動的ペ
ージに関連付けられたインデックスファイルが、さらに、形式処理プログラムお
よびページに関連付けられたテキストを特定するための識別子を含む、請求項4
3に記載のインデクシングシステム。 - 【請求項50】 サーチエンジンに応じて中央インデックスにアクセスする
ためのサーバを含む、請求項43に記載のインデクシングシステム。 - 【請求項51】 サーバが提供するサイトを索引付けするためにサーバエー
ジェントを提供することと、 サイトのサイトデータを表すインデックスファイルをコンパイルすることと、 中央インデックスにファイルを伝送し、サーバエージェントがインデックスフ
ァイルの転送のために中央インデックスとの通信を開始することとを含む、索引
付けする方法。 - 【請求項52】 サーバエージェントがサイトを処理し、1つまたは複数の
サイトに対する変更を表すインデックスデータファイルをコンパイルし、デルタ
ファイルが、中央インデックスが保持するインデックス情報を更新するために中
央インデックスに伝送される、請求項51に記載の索引付けする方法。 - 【請求項53】 サーバエージェントがサイトに関するリンク情報を記録し
、リンク情報の有効性に影響を及ぼすあらゆる変化がデルタファイルに記録され
る、請求項52に記載の索引付けする方法。 - 【請求項54】 関連付けられたサーバエージェントのある複数のサーバの
内の1つでの前記変更を特定し、それぞれのサーバエージェントから、変更の通
知を、そのリンクの別のサイトに関連付けられた対応するサーバに伝送すること
を含む、請求項53に記載の索引付けの方法。 - 【請求項55】 中央インデックスが、サイトアドレスのリストを有し、前
記変更を示すデルタ機能の受信時に、変更によって影響を及ぼされる、関連付け
られたサイトが特定され、通知が影響を及ぼされるサイトの対応するサーバに送
信される、請求項53に記載の索引付けする方法。 - 【請求項56】 通知が、前記通知受信時に、対応するサーバおよび/また
は関連するサイトに関する情報を更新するためのアクションを実施する対応する
サーバの関連サーバエージェントに伝送される、請求項54または55に記載の
索引付けする方法。 - 【請求項57】 通知が対応するサーバの管理者に伝送され、通知の受信時
に、管理者が対応するサーバおよび/または関連するサイトに関する情報を更新
するためのアクションを実施できる、請求項54または55に記載の索引付けす
る方法。 - 【請求項58】 インデックスファイルが、サイトの動的ページに関係する
情報を含む、請求項51に記載の索引付けする方法。 - 【請求項59】 インデックスファイルが、動的ページを生成するために考
えられる入力を含む、請求項58に記載の索引付けする方法。 - 【請求項60】 インデックスファイルが、動的ページを生成するために使
用される、考えられる出力を含む、請求項59に記載の索引付けする方法。 - 【請求項61】 動的ページに関連付けられるサーバエージェントが、動的
ページを作成する少なくとも1つのデータベースを特定し、インデックスファイ
ルに包含するためにテキストおよび入力組を抽出する、請求項58に記載の索引
付けする方法。 - 【請求項62】 サーバエージェントが、前記入力組と関連付けられる出力
組を抽出する、請求項61に記載の索引付けする方法。 - 【請求項63】 前記サーバエージェントが、インデックスファイルに包含
するためにデータベースの入力および/または出力列を抽出する、請求項62に
記載の索引付けする方法。 - 【請求項64】 サーバエージェントが、データベース内で変化が起きると
サーバエージェントに報告するためにデータベース内にトリガを導入し、該変化
がインデックスデルタファイルに含まれる、請求項61に記載の索引付けする方
法。 - 【請求項65】 インデックスファイルが、過去に検索された動的ページを
作成するために使用される入力および/または出力の記録を含む、請求項58に
記載の索引付けする方法。 - 【請求項66】 インデックスファイルが、ユーザが過去に検索した動的ペ
ージのテキストのインデックスを含む、請求項58に記載の索引付けする方法。 - 【請求項67】 動的ページを作成する際にアクセスされる少なくとも1つ
のデータベースを特定することと、 データベースのパラメータおよび環境変数を決定することと、 ページの入力フィールドとデータベースの間の関係性を決定することと、 入力に対応するデータベースの列を特定することと、 インデックスファイル内に列のデータを記憶することとを含む、動的ページを
索引付けするための方法。 - 【請求項68】 前記対の少なくとも1つの変化を検出することと、前記変
化に基づいてユーザのシステムに記憶される少なくとも1つのネットワークアド
レスを調整することとを含む、請求項18に記載の方法。 - 【請求項69】 少なくとも1つの前記対の変化を検出することと、ブラウ
ザ用のブックマークとして記憶される少なくとも1つのネットワークアドレスを
調整することとを含む、請求項18に記載の方法。 - 【請求項70】 前記ユーザコンピュータシステムに記憶されるネットワー
クアドレスの変化を決定するために、インデクシングシステムのインデックスと
通信するための手段を有する、ユーザコンピュータシステム上で実行可能なブラ
ウザエージェント。 - 【請求項71】 前記インデクシングシステムが、請求項34〜50のいず
れか1項に記載される、請求項70に記載のブラウザエージェント。 - 【請求項72】 前記インデックスが請求項32に記載される、請求項70
に記載のブラウザエージェント。 - 【請求項73】 前記ネットワークアドレスが、ブックマークとして記憶さ
れるURLである、請求項70に記載のブラウザエージェント。 - 【請求項74】 前記変化に基づいて前記ネットワークアドレスを調整する
ための手段を有する、請求項70に記載のブラウザエージェント。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
AU4757 | 1999-12-20 | ||
AUPQ4757A AUPQ475799A0 (en) | 1999-12-20 | 1999-12-20 | An internet indexing system and method |
AUPQ4757 | 1999-12-20 | ||
PCT/AU2000/001554 WO2001046856A1 (en) | 1999-12-20 | 2000-12-18 | An indexing system and method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003518293A true JP2003518293A (ja) | 2003-06-03 |
JP4873813B2 JP4873813B2 (ja) | 2012-02-08 |
Family
ID=3818896
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001547303A Expired - Fee Related JP4873813B2 (ja) | 1999-12-20 | 2000-12-18 | インデクシングシステムおよび方法 |
Country Status (7)
Country | Link |
---|---|
US (1) | US7987165B2 (ja) |
EP (1) | EP1250663A4 (ja) |
JP (1) | JP4873813B2 (ja) |
AU (1) | AUPQ475799A0 (ja) |
CA (1) | CA2394820C (ja) |
NZ (1) | NZ519640A (ja) |
WO (1) | WO2001046856A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012089168A (ja) * | 2005-08-11 | 2012-05-10 | Fisher-Rosemount Systems Inc | 動的ウェブページのためのブックマークを作成する方法及び装置 |
Families Citing this family (123)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6453334B1 (en) | 1997-06-16 | 2002-09-17 | Streamtheory, Inc. | Method and apparatus to allow remotely located computer programs and/or data to be accessed on a local computer in a secure, time-limited manner, with persistent caching |
US7225182B2 (en) | 1999-05-28 | 2007-05-29 | Overture Services, Inc. | Recommending search terms using collaborative filtering and web spidering |
US7461058B1 (en) | 1999-09-24 | 2008-12-02 | Thalveg Data Flow Llc | Optimized rule based constraints for collaborative filtering systems |
US6526418B1 (en) * | 1999-12-16 | 2003-02-25 | Livevault Corporation | Systems and methods for backing up data files |
US7788123B1 (en) | 2000-06-23 | 2010-08-31 | Ekhaus Michael A | Method and system for high performance model-based personalization |
US8831995B2 (en) | 2000-11-06 | 2014-09-09 | Numecent Holdings, Inc. | Optimized server for streamed applications |
US7062567B2 (en) | 2000-11-06 | 2006-06-13 | Endeavors Technology, Inc. | Intelligent network streaming and execution system for conventionally coded applications |
US6988100B2 (en) * | 2001-02-01 | 2006-01-17 | International Business Machines Corporation | Method and system for extending the performance of a web crawler |
CA2342578A1 (en) * | 2001-03-29 | 2002-09-29 | Ibm Canada Limited-Ibm Canada Limitee | Method and apparatus for security of a network server |
US7581167B2 (en) * | 2001-05-17 | 2009-08-25 | Hewlett-Packard Development Company, L.P. | Method and system for automated simulation of dynamic URL-based Web application |
WO2003012576A2 (en) * | 2001-07-27 | 2003-02-13 | Quigo Technologies Inc. | System and method for automated tracking and analysis of document usage |
WO2003042871A2 (en) * | 2001-11-14 | 2003-05-22 | Brian Mervyn Morrow | Systems and methods for indexing data in a network environment |
AU2002252155A1 (en) * | 2002-02-26 | 2003-09-09 | Endeavors Technology, Inc. | Systems and methods for indexing data in a network environment |
US7743045B2 (en) | 2005-08-10 | 2010-06-22 | Google Inc. | Detecting spam related and biased contexts for programmable search engines |
US7716199B2 (en) | 2005-08-10 | 2010-05-11 | Google Inc. | Aggregating context data for programmable search engines |
US7693830B2 (en) | 2005-08-10 | 2010-04-06 | Google Inc. | Programmable search engine |
AU2002950134A0 (en) * | 2002-07-11 | 2002-09-12 | Youramigo Pty Ltd | A link generation system |
CA2495536A1 (fr) * | 2002-08-09 | 2004-02-26 | Agency Multimedia | Plateforme de type logicielle dediee au referencement de sites du reseau internet |
DE10325998A1 (de) * | 2003-06-07 | 2004-12-30 | Hurra Communications Gmbh | Verfahren zum Optimieren eines auf eine erste Netzwerkseite verweisenden Verweises |
US8095500B2 (en) * | 2003-06-13 | 2012-01-10 | Brilliant Digital Entertainment, Inc. | Methods and systems for searching content in distributed computing networks |
US8321400B2 (en) * | 2003-08-29 | 2012-11-27 | Vortaloptics, Inc. | Method, device and software for querying and presenting search results |
US7440964B2 (en) * | 2003-08-29 | 2008-10-21 | Vortaloptics, Inc. | Method, device and software for querying and presenting search results |
US7225208B2 (en) * | 2003-09-30 | 2007-05-29 | Iron Mountain Incorporated | Systems and methods for backing up data files |
US7346839B2 (en) * | 2003-09-30 | 2008-03-18 | Google Inc. | Information retrieval based on historical data |
US7472254B2 (en) * | 2003-10-10 | 2008-12-30 | Iora, Ltd. | Systems and methods for modifying a set of data objects |
US7849063B2 (en) * | 2003-10-17 | 2010-12-07 | Yahoo! Inc. | Systems and methods for indexing content for fast and scalable retrieval |
US20050144241A1 (en) | 2003-10-17 | 2005-06-30 | Stata Raymond P. | Systems and methods for a search-based email client |
US7620624B2 (en) * | 2003-10-17 | 2009-11-17 | Yahoo! Inc. | Systems and methods for indexing content for fast and scalable retrieval |
JP4396242B2 (ja) * | 2003-11-28 | 2010-01-13 | 富士ゼロックス株式会社 | 文書リンク構造情報作成装置及び方法 |
WO2005069161A1 (en) * | 2004-01-19 | 2005-07-28 | Nigel Hamilton | Method and system for recording search trails across one or more search engines in a communications network |
US20050193004A1 (en) * | 2004-02-03 | 2005-09-01 | Cafeo John A. | Building a case base from log entries |
US7158966B2 (en) * | 2004-03-09 | 2007-01-02 | Microsoft Corporation | User intent discovery |
US7565630B1 (en) | 2004-06-15 | 2009-07-21 | Google Inc. | Customization of search results for search queries received from third party sites |
US20060026194A1 (en) * | 2004-07-09 | 2006-02-02 | Sap Ag | System and method for enabling indexing of pages of dynamic page based systems |
US7720845B2 (en) * | 2004-08-13 | 2010-05-18 | Yahoo! Inc. | Systems and methods for updating query results based on query deltas |
US20060070022A1 (en) * | 2004-09-29 | 2006-03-30 | International Business Machines Corporation | URL mapping with shadow page support |
EP1825390A2 (en) | 2004-11-13 | 2007-08-29 | Stream Theory, Inc. | Hybrid local/remote streaming |
US7584194B2 (en) * | 2004-11-22 | 2009-09-01 | Truveo, Inc. | Method and apparatus for an application crawler |
CA2588219C (en) * | 2004-11-22 | 2014-05-20 | Truveo, Inc. | Method and apparatus for an application crawler |
JP2006185059A (ja) * | 2004-12-27 | 2006-07-13 | Fujitsu Ltd | コンテンツ管理装置 |
US9275052B2 (en) | 2005-01-19 | 2016-03-01 | Amazon Technologies, Inc. | Providing annotations of a digital work |
US8024523B2 (en) | 2007-11-07 | 2011-09-20 | Endeavors Technologies, Inc. | Opportunistic block transmission with time constraints |
US9716609B2 (en) | 2005-03-23 | 2017-07-25 | Numecent Holdings, Inc. | System and method for tracking changes to files in streaming applications |
WO2006104534A2 (en) * | 2005-03-25 | 2006-10-05 | The Motley Fool, Inc. | Scoring items based on user sentiment and determining the proficiency of predictors |
US20060217994A1 (en) * | 2005-03-25 | 2006-09-28 | The Motley Fool, Inc. | Method and system for harnessing collective knowledge |
US20060271839A1 (en) * | 2005-05-24 | 2006-11-30 | David Gottlieb | Connecting structured data sets |
US20070005587A1 (en) * | 2005-06-30 | 2007-01-04 | Microsoft Corporation | Relative search results based off of user interaction |
US20070011207A1 (en) * | 2005-07-05 | 2007-01-11 | Vishnubhotla Prasad R | Method and system for integrating file system events into a relational database |
US7805419B2 (en) * | 2005-07-11 | 2010-09-28 | Application Security, Inc. | System for tracking and analyzing the integrity of an application |
US7562087B2 (en) * | 2005-09-30 | 2009-07-14 | Computer Associates Think, Inc. | Method and system for processing directory operations |
US7822736B2 (en) | 2005-09-30 | 2010-10-26 | Computer Associates Think, Inc. | Method and system for managing an index arrangement for a directory |
US8849821B2 (en) * | 2005-11-04 | 2014-09-30 | Nokia Corporation | Scalable visual search system simplifying access to network and device functionality |
US8307275B2 (en) * | 2005-12-08 | 2012-11-06 | International Business Machines Corporation | Document-based information and uniform resource locator (URL) management |
US20070162481A1 (en) * | 2006-01-10 | 2007-07-12 | Millett Ronald P | Pattern index |
US20070174324A1 (en) * | 2006-01-12 | 2007-07-26 | Palapudi Sriram M | Mechanism to trap obsolete web page references and auto-correct invalid web page references |
US8266152B2 (en) * | 2006-03-03 | 2012-09-11 | Perfect Search Corporation | Hashed indexing |
US8176052B2 (en) * | 2006-03-03 | 2012-05-08 | Perfect Search Corporation | Hyperspace index |
US8352449B1 (en) | 2006-03-29 | 2013-01-08 | Amazon Technologies, Inc. | Reader device content indexing |
US20070282802A1 (en) * | 2006-05-09 | 2007-12-06 | International Business Machines Corporation | System, method and program to manage alternate bookmarks |
US7734618B2 (en) * | 2006-06-30 | 2010-06-08 | Microsoft Corporation | Creating adaptive, deferred, incremental indexes |
US8775452B2 (en) | 2006-09-17 | 2014-07-08 | Nokia Corporation | Method, apparatus and computer program product for providing standard real world to virtual world links |
US20080071770A1 (en) * | 2006-09-18 | 2008-03-20 | Nokia Corporation | Method, Apparatus and Computer Program Product for Viewing a Virtual Database Using Portable Devices |
US8725565B1 (en) | 2006-09-29 | 2014-05-13 | Amazon Technologies, Inc. | Expedited acquisition of a digital item following a sample presentation of the item |
US9672533B1 (en) | 2006-09-29 | 2017-06-06 | Amazon Technologies, Inc. | Acquisition of an item based on a catalog presentation of items |
US8261345B2 (en) | 2006-10-23 | 2012-09-04 | Endeavors Technologies, Inc. | Rule-based application access management |
US20080114738A1 (en) * | 2006-11-13 | 2008-05-15 | Gerald Chao | System for improving document interlinking via linguistic analysis and searching |
US7958126B2 (en) * | 2006-12-19 | 2011-06-07 | Yahoo! Inc. | Techniques for including collection items in search results |
US7865817B2 (en) | 2006-12-29 | 2011-01-04 | Amazon Technologies, Inc. | Invariant referencing in digital works |
US8024400B2 (en) | 2007-09-26 | 2011-09-20 | Oomble, Inc. | Method and system for transferring content from the web to mobile devices |
US7751807B2 (en) | 2007-02-12 | 2010-07-06 | Oomble, Inc. | Method and system for a hosted mobile management service architecture |
US9665529B1 (en) | 2007-03-29 | 2017-05-30 | Amazon Technologies, Inc. | Relative progress and event indicators |
US7716224B2 (en) | 2007-03-29 | 2010-05-11 | Amazon Technologies, Inc. | Search and indexing on a user device |
US20080263193A1 (en) * | 2007-04-17 | 2008-10-23 | Chalemin Glen E | System and Method for Automatically Providing a Web Resource for a Broken Web Link |
US8990215B1 (en) | 2007-05-21 | 2015-03-24 | Amazon Technologies, Inc. | Obtaining and verifying search indices |
US7912840B2 (en) * | 2007-08-30 | 2011-03-22 | Perfect Search Corporation | Indexing and filtering using composite data stores |
US9418154B2 (en) * | 2007-10-19 | 2016-08-16 | Oracle International Corporation | Push-model based index updating |
US9594784B2 (en) * | 2007-10-19 | 2017-03-14 | Oracle International Corporation | Push-model based index deletion |
US9594794B2 (en) * | 2007-10-19 | 2017-03-14 | Oracle International Corporation | Restoring records using a change transaction log |
US8682859B2 (en) * | 2007-10-19 | 2014-03-25 | Oracle International Corporation | Transferring records between tables using a change transaction log |
US8892738B2 (en) | 2007-11-07 | 2014-11-18 | Numecent Holdings, Inc. | Deriving component statistics for a stream enabled application |
US20090150433A1 (en) * | 2007-12-07 | 2009-06-11 | Nokia Corporation | Method, Apparatus and Computer Program Product for Using Media Content as Awareness Cues |
US20090210389A1 (en) * | 2008-02-20 | 2009-08-20 | Microsoft Corporation | System to support structured search over metadata on a web index |
US9405831B2 (en) * | 2008-04-16 | 2016-08-02 | Gary Stephen Shuster | Avoiding masked web page content indexing errors for search engines |
US8131753B2 (en) * | 2008-05-18 | 2012-03-06 | Rybak Ilya | Apparatus and method for accessing and indexing dynamic web pages |
US8224841B2 (en) * | 2008-05-28 | 2012-07-17 | Microsoft Corporation | Dynamic update of a web index |
US8423889B1 (en) | 2008-06-05 | 2013-04-16 | Amazon Technologies, Inc. | Device specific presentation control for electronic book reader devices |
JP5350472B2 (ja) * | 2008-06-19 | 2013-11-27 | ワイズ テクノロジーズ インコーポレイテッド | トピックに関する複数の製品にランクを付ける製品ランク付け方法及び製品ランク付けシステム |
US8032495B2 (en) * | 2008-06-20 | 2011-10-04 | Perfect Search Corporation | Index compression |
US9087032B1 (en) | 2009-01-26 | 2015-07-21 | Amazon Technologies, Inc. | Aggregation of highlights |
US8378979B2 (en) | 2009-01-27 | 2013-02-19 | Amazon Technologies, Inc. | Electronic device with haptic feedback |
US8620900B2 (en) * | 2009-02-09 | 2013-12-31 | The Hong Kong Polytechnic University | Method for using dual indices to support query expansion, relevance/non-relevance models, blind/relevance feedback and an intelligent search interface |
US8082258B2 (en) * | 2009-02-10 | 2011-12-20 | Microsoft Corporation | Updating an inverted index in a real time fashion |
US8832584B1 (en) | 2009-03-31 | 2014-09-09 | Amazon Technologies, Inc. | Questions on highlighted passages |
US8386601B1 (en) * | 2009-07-10 | 2013-02-26 | Quantcast Corporation | Detecting and reporting on consumption rate changes |
US8692763B1 (en) | 2009-09-28 | 2014-04-08 | John T. Kim | Last screen rendering for electronic book reader |
US20110196854A1 (en) * | 2010-02-05 | 2011-08-11 | Sarkar Zainul A | Providing a www access to a web page |
US9495322B1 (en) | 2010-09-21 | 2016-11-15 | Amazon Technologies, Inc. | Cover display |
US20120124062A1 (en) * | 2010-11-12 | 2012-05-17 | Microsoft Corporation | Application Transfer Protocol |
US9195745B2 (en) | 2010-11-22 | 2015-11-24 | Microsoft Technology Licensing, Llc | Dynamic query master agent for query execution |
US8713024B2 (en) | 2010-11-22 | 2014-04-29 | Microsoft Corporation | Efficient forward ranking in a search engine |
US9424351B2 (en) | 2010-11-22 | 2016-08-23 | Microsoft Technology Licensing, Llc | Hybrid-distribution model for search engine indexes |
US9342582B2 (en) | 2010-11-22 | 2016-05-17 | Microsoft Technology Licensing, Llc | Selection of atoms for search engine retrieval |
US8620907B2 (en) | 2010-11-22 | 2013-12-31 | Microsoft Corporation | Matching funnel for large document index |
US9529908B2 (en) | 2010-11-22 | 2016-12-27 | Microsoft Technology Licensing, Llc | Tiering of posting lists in search engine index |
US9424002B2 (en) | 2010-12-03 | 2016-08-23 | Microsoft Technology Licensing, Llc | Meta-application framework |
US9401807B2 (en) * | 2011-02-03 | 2016-07-26 | Hewlett Packard Enterprise Development Lp | Processing non-editable fields in web pages |
US8504912B2 (en) * | 2011-07-15 | 2013-08-06 | Neodata Group S.R.L. | System to forecast performance of online news articles to suggest the optimal homepage layout to maximize article readership and readers stickiness |
US9292521B1 (en) | 2011-10-20 | 2016-03-22 | Amazon Technologies, Inc. | Archiving and querying data updates associated with an electronic catalog system |
US9043311B1 (en) | 2011-10-20 | 2015-05-26 | Amazon Technologies, Inc. | Indexing data updates associated with an electronic catalog system |
US9158741B1 (en) | 2011-10-28 | 2015-10-13 | Amazon Technologies, Inc. | Indicators for navigating digital works |
JP5774513B2 (ja) * | 2012-02-07 | 2015-09-09 | 株式会社日立ソリューションズ | ファイルリスト生成方法及びシステム並びにプログラム、ファイルリスト生成装置 |
CN103514224B (zh) * | 2012-06-29 | 2017-08-25 | 国际商业机器公司 | 数据库中的数据处理方法、数据查询方法和相应装置 |
US10031971B2 (en) * | 2013-01-09 | 2018-07-24 | NetSuite Inc. | System and methods for optimizing the response to a request for dynamic web content |
US9378100B2 (en) * | 2013-05-17 | 2016-06-28 | Go Daddy Operating Company, LLC | Tools for storing, accessing and restoring website content via a website repository |
US20160259819A1 (en) | 2013-06-18 | 2016-09-08 | Blink Forward, L.L.C. | Error identification, indexing and linking construction documents |
US8849833B1 (en) * | 2013-07-31 | 2014-09-30 | Linkedin Corporation | Indexing of data segments to facilitate analytics |
US10069940B2 (en) | 2015-09-10 | 2018-09-04 | Microsoft Technology Licensing, Llc | Deployment meta-data based applicability targetting |
US9965604B2 (en) | 2015-09-10 | 2018-05-08 | Microsoft Technology Licensing, Llc | De-duplication of per-user registration data |
US11200217B2 (en) | 2016-05-26 | 2021-12-14 | Perfect Search Corporation | Structured document indexing and searching |
KR102519159B1 (ko) * | 2018-01-23 | 2023-04-07 | 삼성전자주식회사 | 전자 장치 및 그 제어 방법 |
WO2020133187A1 (zh) * | 2018-12-28 | 2020-07-02 | 深圳市世强元件网络有限公司 | 一种针对内容的智能搜索推荐方法、存储介质及终端 |
US10785336B2 (en) * | 2019-01-31 | 2020-09-22 | Walmart Apollo, Llc | Pre-loading and caching application code |
WO2020222724A1 (en) | 2019-04-27 | 2020-11-05 | Hewlett-Packard Development Company, L.P. | Microservices data aggregation search engine updating |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09204442A (ja) * | 1996-01-24 | 1997-08-05 | Dainippon Screen Mfg Co Ltd | ドキュメントデータ検索システム |
JPH09218880A (ja) * | 1996-02-09 | 1997-08-19 | Dainippon Screen Mfg Co Ltd | ドキュメントデータ検索システム |
JPH1063686A (ja) * | 1996-08-20 | 1998-03-06 | Dainippon Screen Mfg Co Ltd | ドキュメントデータ検索システム |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5649186A (en) * | 1995-08-07 | 1997-07-15 | Silicon Graphics Incorporated | System and method for a computer-based dynamic information clipping service |
US5806065A (en) | 1996-05-06 | 1998-09-08 | Microsoft Corporation | Data system with distributed tree indexes and method for maintaining the indexes |
US6038610A (en) * | 1996-07-17 | 2000-03-14 | Microsoft Corporation | Storage of sitemaps at server sites for holding information regarding content |
US5864863A (en) * | 1996-08-09 | 1999-01-26 | Digital Equipment Corporation | Method for parsing, indexing and searching world-wide-web pages |
US5765168A (en) * | 1996-08-09 | 1998-06-09 | Digital Equipment Corporation | Method for maintaining an index |
US5926816A (en) * | 1996-10-09 | 1999-07-20 | Oracle Corporation | Database Synchronizer |
US5963944A (en) * | 1996-12-30 | 1999-10-05 | Intel Corporation | System and method for distributing and indexing computerized documents using independent agents |
US5978799A (en) | 1997-01-30 | 1999-11-02 | Hirsch; G. Scott | Search engine including query database, user profile database, information templates and email facility |
US6415319B1 (en) * | 1997-02-07 | 2002-07-02 | Sun Microsystems, Inc. | Intelligent network browser using incremental conceptual indexer |
CA2209265A1 (en) * | 1997-02-27 | 1998-08-27 | The Computer Group, Inc. | Apparatus and method for information retrieval via internet |
US5974412A (en) * | 1997-09-24 | 1999-10-26 | Sapient Health Network | Intelligent query system for automatically indexing information in a database and automatically categorizing users |
US6088694A (en) * | 1998-03-31 | 2000-07-11 | International Business Machines Corporation | Continuous availability and efficient backup for externally referenced objects |
US6338085B1 (en) * | 1998-06-29 | 2002-01-08 | Philips Electronics North America Corporation | Telephone activated web server |
US6424966B1 (en) * | 1998-06-30 | 2002-07-23 | Microsoft Corporation | Synchronizing crawler with notification source |
US6675205B2 (en) * | 1999-10-14 | 2004-01-06 | Arcessa, Inc. | Peer-to-peer automated anonymous asynchronous file sharing |
US6516337B1 (en) * | 1999-10-14 | 2003-02-04 | Arcessa, Inc. | Sending to a central indexing site meta data or signatures from objects on a computer network |
US6976053B1 (en) * | 1999-10-14 | 2005-12-13 | Arcessa, Inc. | Method for using agents to create a computer index corresponding to the contents of networked computers |
US6418453B1 (en) * | 1999-11-03 | 2002-07-09 | International Business Machines Corporation | Network repository service for efficient web crawling |
US6418452B1 (en) * | 1999-11-03 | 2002-07-09 | International Business Machines Corporation | Network repository service directory for efficient web crawling |
US6546387B1 (en) * | 1999-11-15 | 2003-04-08 | Transcom Software Inc. | Computer network information management system and method using intelligent software agents |
US7062486B2 (en) * | 2000-12-05 | 2006-06-13 | International Business Machines Corporation | Method, system and program product for enabling authorized access and request-initiated translation of data files |
US6931598B2 (en) * | 2001-03-30 | 2005-08-16 | Intel Corporation | Dynamic web list display |
-
1999
- 1999-12-20 AU AUPQ4757A patent/AUPQ475799A0/en not_active Abandoned
-
2000
- 2000-12-18 US US10/168,132 patent/US7987165B2/en not_active Expired - Fee Related
- 2000-12-18 EP EP00986857A patent/EP1250663A4/en not_active Withdrawn
- 2000-12-18 JP JP2001547303A patent/JP4873813B2/ja not_active Expired - Fee Related
- 2000-12-18 NZ NZ519640A patent/NZ519640A/en not_active IP Right Cessation
- 2000-12-18 CA CA2394820A patent/CA2394820C/en not_active Expired - Fee Related
- 2000-12-18 WO PCT/AU2000/001554 patent/WO2001046856A1/en active IP Right Grant
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09204442A (ja) * | 1996-01-24 | 1997-08-05 | Dainippon Screen Mfg Co Ltd | ドキュメントデータ検索システム |
JPH09218880A (ja) * | 1996-02-09 | 1997-08-19 | Dainippon Screen Mfg Co Ltd | ドキュメントデータ検索システム |
JPH1063686A (ja) * | 1996-08-20 | 1998-03-06 | Dainippon Screen Mfg Co Ltd | ドキュメントデータ検索システム |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012089168A (ja) * | 2005-08-11 | 2012-05-10 | Fisher-Rosemount Systems Inc | 動的ウェブページのためのブックマークを作成する方法及び装置 |
Also Published As
Publication number | Publication date |
---|---|
EP1250663A1 (en) | 2002-10-23 |
JP4873813B2 (ja) | 2012-02-08 |
EP1250663A4 (en) | 2007-08-15 |
AUPQ475799A0 (en) | 2000-01-20 |
CA2394820A1 (en) | 2001-06-28 |
CA2394820C (en) | 2011-05-03 |
US20030191737A1 (en) | 2003-10-09 |
NZ519640A (en) | 2004-07-30 |
WO2001046856A1 (en) | 2001-06-28 |
US7987165B2 (en) | 2011-07-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4873813B2 (ja) | インデクシングシステムおよび方法 | |
US6718365B1 (en) | Method, system, and program for ordering search results using an importance weighting | |
KR100699977B1 (ko) | 데이터베이스 검색 시스템에서 관련 검색을 식별하기 위한방법 및 장치 | |
US8203952B2 (en) | Using network traffic logs for search enhancement | |
US8732169B2 (en) | Lateral search | |
US8014997B2 (en) | Method of search content enhancement | |
US6826559B1 (en) | Hybrid category mapping for on-line query tool | |
US6338058B1 (en) | Method for providing more informative results in response to a search of electronic documents | |
US7047242B1 (en) | Weighted term ranking for on-line query tool | |
US7779002B1 (en) | Detecting query-specific duplicate documents | |
KR101130505B1 (ko) | 검색 결과 관련성의 자동화된 최적화를 위한 시스템 및방법 | |
US8069162B1 (en) | Enhanced search indexing | |
US8775396B2 (en) | Method and system for searching a wide area network | |
US20020129062A1 (en) | Apparatus and method for cataloging data | |
US20030131005A1 (en) | Method and apparatus for automatic pruning of search engine indices | |
AU773065B2 (en) | An indexing system and method | |
US20030061204A1 (en) | Systems and methods for selective information retrieval based on search source attributes | |
JP4104878B2 (ja) | ウェブページ誘導方法及びウェブページ誘導プログラム | |
JP2009048589A (ja) | ドキュメント作成システム、サーバ装置、プログラム、および記録媒体 | |
WO2005022410A1 (en) | Search engine |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20071210 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20091016 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20091016 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100713 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20101007 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20101015 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20101213 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20101220 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110113 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110222 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20110520 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20110527 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110822 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111025 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111122 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141202 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |