JP2001510607A - 増殖概念による索引付け手法を用いたインテリジェントネットワークブラウザ - Google Patents

増殖概念による索引付け手法を用いたインテリジェントネットワークブラウザ

Info

Publication number
JP2001510607A
JP2001510607A JP53478398A JP53478398A JP2001510607A JP 2001510607 A JP2001510607 A JP 2001510607A JP 53478398 A JP53478398 A JP 53478398A JP 53478398 A JP53478398 A JP 53478398A JP 2001510607 A JP2001510607 A JP 2001510607A
Authority
JP
Japan
Prior art keywords
network
document
information
conceptual information
conceptual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
JP53478398A
Other languages
English (en)
Inventor
ジャセック アール アンブロズィアック
Original Assignee
サンマイクロシステムズ インコーポレーテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by サンマイクロシステムズ インコーポレーテッド filed Critical サンマイクロシステムズ インコーポレーテッド
Publication of JP2001510607A publication Critical patent/JP2001510607A/ja
Ceased legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99944Object-oriented database structure

Abstract

(57)【要約】 ネットワークからコンテンツを保持するドキュメントを受信し、そのコンテンツから概念的情報を抽出し、抽出されたその概念的情報を意味的に分析し、その抽出された概念的情報と記憶辞書内の意味データとの間の構造的関係に基づいてその抽出された概念的情報を索引へ同化させる。これにより、ネットワーク閲覧が容易になる。

Description

【発明の詳細な説明】 増殖概念による索引付け手法を用いたインテリジェントネットワークブラウザ 技術分野 本発明は、ネットワーク情報を閲覧する方法に関し、更に詳しくは、閲覧を容 易にすべく概念的索引を用いてネットワークドキュメントを構成する方法に関す るものである。 背景技術 ワールドワイドウェブは、その自然現象的普及によって、ここ数年のうちに急 激に成長した。ワールドワイドウェブにより自己出版が容易になり、その結果、 数にして推定5000万から1億2000万のドキュメントが出版された。 このドキュメント情報にアクセスするために、ユーザが必要とするのは、ディ スプレイ、モデム及びインターネット接続機能を備えた家庭用パーソナルコンピ ュータその他の標準コンピュータだけである。そして、インターネットサービス プロバイダを経由して種々のタイプのインターネットコネクションが利用可能で ある。ユーザがインターネット接続を利用するには、例えば、ユーザは、モデム と標準電話回線とを用いてインターネットサービスプロバイダ側のコンピュータ へ電話をかければよい。そうすると、インターネットサービスプロバイダ側のコ ンピュータは、ユーザにインターネットへのアクセスを提供する。 このインターネット接続を通じて、ユーザは、「ウェブブラウザ」と称される コンピュータプログラム(例えば、ネットスケープ コミュニケーションズ コー ポレーションが提供するネットスケープナビゲーターTM)を用いてウェブ上の情 報にアクセスする。このアクセスを行うために、ユーザは、ウェブブラウザに対 して、例えば、重要な情報を保持したドキュメントからなるインターネット上の オブジェクト用のURL(統合リソースロケータ)を提供する。そのドキュメント は、「ウェブページ」と称されるものであり、そのウェブページに保持された情 報は、「コンテント」と称される。ウェブページは、しばしば、「ハイパーテキ ストリンク」又は「ハイパーリンク」(これらは、その他のページを表す単語や フレーズを含んでおり、ユーザがハイパーリンクを選択した時に対応するウェブ ページ用のURLをブラウザに提供する形態でなされる。)を用いて他のウェブペ ージを参照する。ハイパーリンクは、ハイパーテキストマークアップランゲージ (HTML)を用いてウェブページを構築することによって実現することができる。 URLは、「ウェブサーバ」と称されるインターネット上の特定コンピュータを 認識し、更に、そのウェブサーバ上に配置されたウェブページのロケーションを 認識する。ウェブブラウザは、そのウェブページを取得して、ユーザにそれを表 示する。 ワールドワイドウェブの特徴として仮想的・瞬間的・コストフリーを挙げるこ とができるが、この特徴を活かした出版は、情報過多という問題を招来している 。検索エンジンは、ユーザがウェブ上の特定情報を配置する作業に利用されるが 、通常は、キーワード検索のみに時間を費やしている。例えば、ディジタル イ クイプメント コーポレーション社製のアルタ ビスタTMと称される検索エンジン は、「zoology」という単語を検索するのに、90,000個のヒット数又はURL数を返 す。従って、ユーザは、必要な情報を保持するウェブページを見つけ出すために 、膨大なURLリストをレビューし、数多くの対応ウェブページにアクセスしなけ ればならない。これでは、折角、キーワード検索エンジンを用いてインターネッ トを便利に活用しようとしても、キーワード検索エンジンに関連した作業がイン ター ネット上での作業をかえって不便なものにしてしまう。 しかしながら、研究者等は、閲覧の容易化をテーマとして、ウェブサーフィン における優先的なセッションに基づいて、ユーザの趣向を「学習」させるという インテリジェント手法を実験している。周知の研究用プロトタイプとして、ウェ ブウオッチャーとレティズィアが挙げられる。 ウェブウォッチャーは、ユーザとウェブとの間に存在するサーバ側のインタフ ェース手段である。ブラウザを走らせているユーザは、ウェブウォッチャーのフ ロントドアページから興味あるトピックをタイプすることにより簡単にシステム に入ることができる。ウェブウォッチャーは、カレントページを修正ページに 置き換え(この修正ページには、ウェブウォッチャーコマンドメニューが埋め込 まれており、修正ページによりウェブウォッチャーは、ウェブを閲覧しているユ ーザに追従することができる)、ユーザに、お勧めのハイパーリンクを強調し て示す。ウェブウオッチャーは、サーバ側システムであり、自己「学習」のため 何千というユーザからのデータを記録し、その検索知識を増やそうとするからで ある。ユーザが特定の検索がうまくいったと合図をすると、ウェブウオッチャー は、ユーザキーワードに、検索した各々のハイパーリンクに注釈をつけ、これを 以前のセッションに基づいて知識ベースに加える。ウェブウォッチャーは、それ らのハイパーリンクに関連するユーザ統計だけでなく、ページ全てのハイパーリ ンク用に頻繁に使用する主要ターム・ドキュメントに基づく情報検索テクニック を用いる。 レティズィアは、クライアント側の個人向け手法であり、ユーザのブラウザを 実行するコンピュータ上に存在するものである(別個に配置されたサーバに対す るものである)。レティズィアは、ユーザの閲覧作業の癖についての情報を収集 し、ユーザが興味を示しそうな追加可能なアイテムを推測する。レティズィアは 、 ユーザの趣向についての結論付けをし、種々の関連事項を活かすことにより、プ ロンプト表示の際に呈示すべく推測されたリンクを検索する待ち状態の間、制限 リソースでウェブ検索を実施する。 上述のプロトタイプは、両者共に、ある情報へのアクセスの間、ユーザの趣向 を推測しようとするものである。このことは、ウェブ上で利用可能な情報を構成 する上で何の問題もなく、閲覧を容易にするものである。従って、ユーサが興味 を示しそうな情報のロケーションを正確に指摘可能な構造を備え、入手可能なネ ットワーク情報を構成するシステムや、このようなネットワーク情報に索引付け を行うシステムが求められている。 発明の開示 本発明に係るシステム及び方法は、ネットワークドキュメントの概念的情報に 増殖的に索引付けを行うと共に、閲覧セッション中のユーザが利用できる手法で その概念的情報を統合することにより、従来技術における制限・欠点・不利益を 大幅に改善するものである。 本発明に係るプロセッサによるネットワーク情報へのアクセス方法は、ネット ワークからコンテンツを保持するドキュメントを受信するドキュメント受信工程 と、前記ドキュメントの前記コンテンツから概念的情報を抽出する概念的情報抽 出工程と、抽出された前記概念的情報を意味的に分析する分析工程と、記憶辞書 内の意味データに基づいた関係を反映して抽出された前記概念的情報の索引を構 築する索引構築工程とを備えたことを要旨とするものである。 上述の一般的な説明及び以下の詳細な説明は、本発明を説明するための好適な 一実施形態についてのものであり、請求の範囲に記載された発明を何ら限定する ものではなく、本発明の技術的範囲を明確にするものである。 図面の簡単な説明 説明の一部を構成する添付図面は、本発明に係るシステム及び方法を図示によ り説明するためのものであり、この明細書と共に、本発明による利益及び趣旨を 説明するためのものである。 図1は、本発明に係る閲覧ガイドシステムのソフトウエアモジュールのブロッ ク図である。 図2は、本発明に係る閲覧ガイドシステムの情報の流れを示したブロック図で ある。 図3及び図4は、本発明に係る閲覧ガイドシステムの閲覧ガイドプロキシモジ ュールにより実行される工程を示したフローチャートである。 図5乃至図9は、本発明に係る閲覧ガイドシステムの索引コントローラモジュ ールにより実行される工程を示したフローチャートである。 図10及び図11は、本発明に係る閲覧ガイドシステムの索引サーバモジュー ルにより実行される工程を示したフローチャートである。 図12は、本発明に係る閲覧ガイドシステムの索引コントローラモジュール用 のユーザインタフェースである。 図13は、本発明に係る閲覧ガイドシステム用のアクティブビューの一例を示 したものである。 図14は、本発明に係る閲覧ガイドシステム用の概念的ブラウザの一例を示し たものである。 発明を実施するための最良の形態 以下に本発明に係るシステム及び方法についての詳細を説明する。尚、図面及 び以下の説明においては、同一部材又は類似部材を参照するのに、全体を通して できる限り同一の符号を使用している。 概略 本発明に係るシステムは、ブラウザによって閲覧対象とされたドキュメント及 びそれらに直接関連するドキュメント(例えば、ハイパーリンクにより接続され るようなドキュメント)についての動的な概念的索引を構築することによってウ ェブを閲覧するユーザを補助するものである。概念的索引とは、単語・フレーズ の概念を階層的に構成した分類であり、ドキュメント中で単語・フレーズの概念 の対応ロケーションに従って索引付けられた事項で構成される。増殖的に構築さ れた概念的索引について問い合わせし、これを閲覧するためのツールを用いるこ とにより、ユーザは、選択された概念に対応する特定ロケーション上のドキュメ ントにアクセスすることができる。 増殖させた索引は、二つの重要な機能、即ち、ウェブ経由のユーザパスの概 念的ログの自動作成機能、及び、ウェブのナビゲート中にブラウザの一工程先 のドキュメント概念を表示する概念的な「周辺ビジュアル機器」としての機能を 提供するものである。 概念的索引 概念的索引付けは、全ての単語・フレーズ事項を概念的分類へ自動的に構成す るテクニックを含むものであり、この概念的分類は、各概念を最適な一般分類に リンクするものである。その分類は、一般的には、「Aは、Bである」という関 係のリンクを用いることによって概念を順番に並べていくグラフ構造をとる。例 えば、次の分類は、「コンピュータ」と「ラップトップ」の概念の関係を示した ものである。 コンピュータ |−−ラップトップ この表現においては、「コンピュータ」という概念は、「ラップトップ」という 概念よりも一般的である。従って、「コンピュータ」という概念は、グラフ構造 中の「ラップトップ」という概念の親概念として描写される。分類は、閲覧用の 情報を構築するために単独で使用でき、また、よりよい問い合わせを作成するた めに検索・取得テクニックとして使用することもできる。 テキストの概念的索引付けは、テキスト中のフレーズの発見的な認識、こ れらのフレーズの内部的な概念的構造へのマッピング(対応付け)、その各構 造の各分類へのクラス分け、その概念をテキスト中のフレーズのロケーション への結合という四工程から構成される。索引付けの間に概念が概念的分類に同化 されると、単語の意味についての記録した知識に基づいて他の概念との意味的な 関係を決定するために、広い適用範囲の英語による辞書が参照される。また、索 引付けがなされたフレーズの単語のうちのいずれもが、増殖させた分類の概念と 対応していなければ、それらは、辞書情報を用いてその分類に追加される。 従って、例えば、ドキュメントに索引付けを行う場合に、「グラフィックワー クステーション」というフレーズに遭遇すると、その辞書は、「ワークステーシ ョン」という単語を吟味して、それが「コンピュータ」の一種を意味することを 学習し、これにより、その辞書は、「ワークステーション」は、「コンピュータ 」であるという関係を分類に同化させる。その処理は、分類に付加される全ての 更なる一般的関係を明らかにするために、「コンピュータ」という単語を用いて 再度行うことができる。従って、「グラフィックワークステーション」というフ レーズは、次の分類フラグメントを構築することになる。 コンピュータ |−−ワークステーション |−−グラフィックワークステーション この一例は、分類ツリー構造の一部を表したものであり、上位概念の下に、イ ンデントを付けて更に特定の下位概念が示されている。分類は、その辞書からの 全ての情報を保持するものではないが、索引付けられたテキスト又は分類に同化 されたその他のフレーズから抽出された単語及び概念に用いる情報のみを保持す るものである。 収集したテキストの索引付けが終わった後、「コンピュータ」という概念用に 記録される分類は、次のようになる。 コンピュータ | |−−新しいコンピュータ | |−−最近の東芝製ラップトップ | |−−東芝製コンピュータ | |−−最近の東芝製ラップトップ | |−−ワークステーション | |−−グラフィックワークステーション |−−ワークステーション |−−グラフィックワークステーション | |−−サーバ | |−−ウェブサーバ | | |−−WWWサーバ | | | |−−サン製の新しいnetra-jサーバ | |−−ラップトップ | |−−最近の東芝製ラップトップ 分類には、三タイプの関係、即ち、下位概念的関係、構造的関係、下位 概念的関係と構造的関係との組合せの関係がある。下位概念的関係は、辞書に基 づくものである。例えば、辞書は、分類中に次のような下位概念的関係を提供す る。 コンピュータ |−−ワークステーション |−−サーバ |−−ラップトップ 及び 新しい |−−最近 このことは、辞書が提供する組込枠を意味し、この組込枠は、これらの概念の間 の関係をも示す。 構造的関係は、索引付けがなされたテキスト内のフレーズから取り出されたも のである。 ワークステーション |−−グラフィックワークステーション 辞書が単語を分類に同化させるのに必要な情報を保持していない場合には、単語 は、テキストに基づいた構造的関係に従って分類に同化される。 次に示すのは、上述の分類における下位概念的関係と構造的関係との組合せの 関係の一例である。 新しいコンピュータ |−−最近の東芝製ラップトップ この組合せにおいて、「新しい」という単語と「最近」という単語との関係及び 「コンピュータ」という単語と「ラップトップ」という単語との関係は、それぞ れ、辞書に基づいた下位概念的関係である。「東芝」という単語を示す索引付け がなされたテキストからこれらの下位概念的関係と構造的関係とを利用すること により、「ラップトップ」という単語を修飾でき、これにより、上述したように 、分類は、「新しいコンピュータ」というフレーズと「最近の東芝製ラップトッ プ」というフレーズとの間に関係を構築することができる。 分類概念は、図書館の図書の構成とほぼ同様である。一般的には、同じトピッ クの図書は、同じ本棚に近接して配置される。同様に、分類は、同類概念を近接 させるため、「ラップトップ」という概念が「最近の東芝製ラップトップ」とい う概念と密接に関係し、「サーバ」という概念が「WWWサーバ」と密接に関係 することになる。 分類は、公式化における問い合わせ作業を補助するものとなる。索引について 問い合わせる場合には、タームは、概念とみなされて、分類におけるその概念の 特定の子分類を用いて拡張される。上記の分類によると、このように、「速いコ ンピュータ」用の問い合わせは、「速いコンピュータ」及び「速いグラフィック ワークステーション」用の問い合わせに拡張される。「グラフィックのワークス テーション」は、「コンピュータ」を更に特定したものだからである。 システムアーキテクチャ 図1は、本発明に係る一実施形態として好適な閲覧ガイドシステム100の構成 を示したものである。閲覧ガイドシステム100は、ブラウザを用いるユーザによ って閲覧対象とされたドキュメント及びそれらに直接関連するドキュメントにつ いての動的な概念的索引を構築することによってウェブを閲覧するユーザを補助 するものである。閲覧ガイドシステム100は、JAVAプログラミング言語で記述さ れたソフトウエアモジュールを保持する。従って、閲覧ガイドシステム100は、 プラットホーム独立であり、マイクロソフト製ウインドウズ95オペレーティング システムを走らせるインテル社製ペンティアムマイクロプロセッサを実装するパ ーソナル・コンピュータ等の従来のコンピュータにおいても動作可能である。 コンピュータは、モデムなどのハードウエアを備え、このハードウエアは、図 1においてウェブページ180を囲む雲型で示されるインターネット160に接続する ために用いられる。即ち、この図は、ウェブページ180がインターネット160上の ドキュメントを構成することを示しており、このドキュメントは、インターネッ ト160に接続されたコンピュータからアクセス可能である。 閲覧ガイドシステム100は、閲覧ガイドプロキシ110、索引コントローラ120、 索引サーバ130、索引140及び辞書データベース150を含むものである。閲覧ガイ ドプロキシ110は2つの一般的機能、即ち、ウェブを閲覧するユーザ操作を監 視する機能、及び、ユーザのブラウザ(図示せず)によって閲覧対象とされた ドキュメント及びそれらに直接関連するドキュメントを含むウェブからの情報に アクセスする機能を実行する。 索引コントローラ120は、概念的分類において索引付けかなされるべき情報及 びドキュメントを識別する待ち行列を部分的に保持することによって閲覧ガイド 100のオペレーションを制御し、索引サーバ130は、索引付け機能を実行する。こ の索引付け機能は、辞書データベース150を用いて索引140を増殖的に構築する機 能を含むものである。辞書データベース150は、上述した手法に従って概念的分 類、即ち、索引140を構築するのに用いられる英語辞書を保持している。 システムオペレーション 図2は、閲覧ガイド100のオペレーションを説明するための情報の流れを示し たものである。図2に示したように、「URLN」とラベルされたモジュールを接続 する多くの接続ラインがある。このラベルの「URL」は、インターネット上のサ イトに用いられるあらゆるURLを表したものであり、下の「N」は、複数のURLが モジユール間を通過することを示したものである。また、更に「WEB PAGEN」と いうラベルされた多くの接続ラインもある。このラベルの「WEB PAGE」は、イン ターネットで利用可能なあらゆるウェブページ、ドキュメント、ファイルなどを 表したものであり、下の「N」は、複数のウェブページがモジュール間を通過す ることを示したものである。また、「WEBPAGEN」とラベルされた多くの接続線の 「N」の隣のシングルクオーテーション(')は、ページがその元の状態から修正 されたことを示している。 ユーザ205が、URLをブラウザ210(このブラウザ210は、マイクロソフトエクス プローラなどの周知のウェブブラウザであってもよい。)に入力する場合には、 ユーザは、ウェブページをインターネット160から取得するよう要求する。閲覧 ガイドプロキシ110は、要求されたウェブページを取得すべく、インターネット1 60上のネットワークサーバ220にURLを配信する前に、URLを傍受する。ネットワ ークサーバ220は、その時、表示用のブラウザ210にページを次々提供する閲覧ガ イドプロキシ110に、URLにより認識されたウェブページを提供する。しかしなが ら、取得されたウェブページは、閲覧ガイドプロキシ110により修正されること になる。この修正によって、索引コントローラ120は、ブラウザ210に接続でき、 その挙動を監視することができる。 閲覧ガイドプロキシ110は、更に取得したウェブページを索引コントローラ120 に提供し、索引コントローラ120は、索引付けを行うためにそのウェブページを 索引サーバ130に渡す。索引付け処理は、取得したウェブページを分析し、ウェ ブページの概念を辞書データベース150を用いて分類索引140へ同化させる手順を 含むものである。取得したウェブページを分析する場合には、インデックスサー バ130は、取得したウェブページ中でそのページのハイパーリンクを認識するこ とにより参照ウェブページの存在があるかどうかを判断する。参照ウェブページ がある場合には、インデックスサーバ130は、それらのページ用のURLを索引コン トローラ120に配信する。 索引コントローラ120は、索引サーバ130によって索引付けられるべきウェブペ ージ用に、優先待ち行列を維持する。待ち行列は、既に索引付けられたページ中 で参照されたURLを含むものである。優先順位は、ユーザ操作に基づいて設定す ればよいが、その他の事項に基づいて優先順位を決めてもよい。従って、ユーザ が待ち行列中のURL又は待ち行列中にない別のURLのうちの一つを選択する場合、 索引コントローラ120は、対応ウェブページの取得を制御し、そのページを索引 サーバ130へ配信する(索引サーバは、その待ち行列中の他のURL用のウェブペー ジの一歩先の分類的索引140へのページ概念の同化のために用いられる。)。更 に、待ち行列が空ではない間は、索引コントローラ120は、対応ウェブページ を取得するために、待ち行列中の各URLを閲覧ガイドプロキシ110に配信する(こ の対応ウェブページは、次々と、索引コントローラ120を経由して索引サーバ130 へ渡され、そのウェブページの概念と同化させるために索引140が参照される。 )。 ユーザ205はまた、索引140に問い合わせをすることができる。問い合わせ単語 又はフレーズを入力することにより、ユーザ205は、索引コントローラ120にアク ティブビュー230を生成させ表示させることができ、このアクティブビュー230は 、索引140に基づく概念と対応URLを保持している。索引コントローラ120がアク ティブビューへのリクエストを受信すると、索引コントローラ120は、検索ター ムを保持する概念を検索すべく索引140とアクセスするために、そのリクエスト を索引サーバ130へ渡す。 閲覧ガイド100は、ブラウザ210と索引コントローラ120との間、索引コントロ ーラ120と各アクティブビュー230との間及び索引サーバ130と各アクティブビュ ー230との間の接続を確立する。これら三つの接続は、図2においては、それぞ れ、,,とラベルされている。図2の下部分に示したキーテーブルは、これ らの接続に沿った情報の流れを説明したものである。ブラウザ210と索引コント ローラ120との間の第一接続により、索引コントローラ120は、待ち行列の優先 順位を管理するためにユーザ205の操作を監視することができる。 索引コントローラ120とアクティブビュー230との間の第二接続により、索引 コントローラ120は、ユーザ205からのリクエストに応答してアクティブビュー23 0を生成し、第一接続を経由してアクティブビュー230をブラウザ210へリンク する。このリンクにより、ユーザは、ブラウザ210に対応ウェブページを表示さ せるために、アクティブビュー230を見ながら概念を選択することができる。 索引サーバ130とアクティブビュー230との間の第三接続により、索引コント ローラ120は、ユーザ205からのリクエストに応答してアクティブビュー230を生 成し、アクティブビュー230を索引サーバ130へリンクする。このリンクにより、 索引サーバ130は、追加データが索引140へ同化された時にアクティブビュー230 を更新又はリフレッシュし、アクティブビュー230は、この同化によって修正さ れた索引140のフラグメントを含む。このようにして、情報は、閲覧セッション の間、リアルタイムに動的に構成されることになる。 処理 閲覧ガイドプロキシ処理 図3及び図4は、閲覧ガイドプロキシ110により実行される二つの処理の工程 を説明するためのフローチャートである。第一の処理は、対応ウェブページを索 引付けを行うためにブラウザ210からURLsを傍受するオペレーションに関するも のであり、第二の処理は、索引コントローラ120のオペレーションを処理する待 ち行列に関連付けられた機能に関するものである。 ユーザ205がブラウザ210からURLを入力すると、閲覧ガイドプロキシ110は、ブ ラウザ210から入力URLを傍受する(ステップ300)。閲覧ガイドプロキシ110は、 次に対応ウェブページを取得するためにインターネット上のネットワークサーバ 220へ傍受されたURLを送信する(ステップ310)。ウェブページが取得されると (ステップ320)、閲覧ガイドプロキシ110は、「プラグイン」をウェブページへ はめ込む(ステップ330)。閲覧ガイドプロキシ110は、修正されたウェブページ を表示させるためにブラウザ210へ配信すると共に(ステップ340)、索引サーバ 130による更なる処理のために索引コントローラ120へ配信する(ステップ350) 。はめ込まれた「プラグイン」は、例えば、C++プログラミング言語で記述され たコンピュータプログラムであり、このプラグインにより、索引コントローラ12 0は、ブラウザ210に接続でき、ブラウザ210の動作を監視することができ る。これにより、索引コントローラ120は、順次、URL待ち行列中のエントリに対 応するウェブページの取得に優先順位を付けることができる。 索引コントローラ120のURL待ち行列が空ではない場合には、索引コントローラ 120は、待ち行列中の各URLを閲覧ガイドプロキシ110に配信する。閲覧ガイドプ ロキシ110が索引コントローラ120からURLを受信した後(ステップ400)、閲覧ガ イドプロキシ110は、URLに対応するウェブページを取得するために、URLをイン ターネット中の適当なネットワークサーバへ転送する(ステップ410)。閲覧ガ イドプロキシ110がウェブページを受信すると(ステップ420)、閲覧ガイドプロ キシ110は、索引コントローラ120用にプラグインをはめ込み(ステップ430)、 次いで、修正されたウェブページを索引コントローラ120へ配信し(ステップ440 )、索引コントローラ120は、順次、そのページの概念を索引140へ同化させるた めに、そのページを索引サーバ130へ配信する。 索引コントローラ処理 図5乃至図9は、索引コントローラ120により実行される五つの処理の工程を 説明するためのフローチャートである。索引コントローラ120の第一処理(図5 参照)は、パススルー機能である。索引コントローラ120が閲覧ガイドプロキシ1 10から修正されたウェブページを受信すると(ステップ510)、索引コントロー ラは、同化させるべく修正されたウェブページを索引サーバ130へ配信する(ス テップ520)。 索引コントローラ120の第二処理(図6参照)は、URL待ち行列に関するもので ある。上述したように、索引サーバ130は、索引中のウェブページ内の全てのURL を識別する。索引コントローラ120は、既に索引付けがなされた各ウェブページ 用に索引サーバ130からURLセットを受信する(ステップ610)。参照付けがなさ れたウェブページが他のURLやウェブページを参照するハイパーリンクを保 持してない場合には、そのセットは、空であってもよい。そのセットの各URLは 、優先順位に従って、ウェブページ取得用及び処理用の索引コントローラ120の 待ち行列へ追加される(ステップ620)。例えば、索引コントローラ120は、ブラ ウザ210によりカレント表示されているウェブページに対応するURLセットに高い 優先順位を設定する。このようにして、閲覧ガイド100は、待ち行列中の他のURL 用のページ上で作動する前にカレント表示されたページに近接するページを同化 させる。 索引コントローラ120の次の処理(図7参照)もまた、待ち行列処理に関する ものである。図6に示した処理は、待ち行列へのアイテムの追加に関するもので あるが、図7に示した処理は、待ち行列からのURLの取出に関するものである。 まず第一に、索引コントローラ120は、定期的にURLエントリがあるか否かを判断 するために待ち行列を監視する(ステップ710)。待ち行列の中にURLが一つもな い場合には、索引コントローラ120は、その監視状態を継続する(ステップ710) 。待ち行列か空ではない場合には(ステップ710)、索引コントローラ120は、待 ち行列の中から最も高い優先順位の次なるURLを選択し、待ち行列の中からそのU RLを取り出す(ステップ720及び730)。索引コントローラ120は、URLを閲覧ガイ ドプロキシ110へ配信し(ステップ740)、図4を参照して述べたように、閲覧ガ イドプロキシ110は、インターネットから対応ウェブページを取得する。 四つめの索引コントローラ120の処理(図8参照)は、アクティブビュー230と 索引コントローラ120との間の第二接続(図2参照)に関するものである。閲 覧ガイド100は、ユーザが閲覧し索引140へ問い合わせるためのインタフェース、 例えば、ダイアログボックスがついたディスプレイを含むものである。その一例 として、図12にインタフェース1200が示されており、このインタフェース1200 は、二つのボックス1210,1220を備えたディスプレイを備えている。第一ボック ス1210においては、ユーザは、索引140のフラグメントを見るために概念を入力 することができる。図示のように、ボックス1210は、「cryptography」という単 語を含む。閲覧ガイド100は、順次、より詳細な特定の下位概念を持つ最も一般 的な概念(即ち、ルート)として、「cryptography」という概念を持つ索引140 の一部を「概念ブラウザ」中に表示する。「cryptography」という概念に用いら れる概念ブラウサディスプレイ1400は、図14に示されている。 ディスプレイ1400は、二つの部分を含む。第一部分1410は、リクエストされた 分類フラグメントであり、第二部分1420は、ユーサが、ボタン上のマウス用アイ コンをポイントしそのマウスボタン上でクリックすることにより、種々のオペレ ーションの初期化を選択可能なボタン1430-1480用のものである。親ボタン1430 は、エリア1410内の選択・強調概念の親分類を表示するために用いられる。ブラ ウザボタン1440は、索引140を経由して閲覧するのに用いられる。問い合わせボ タン1450は、ユーザが選択・強調概念からアクティブビューを構築できるように するために用いられる。フリーズボタン1460は、索引140が追加ウェブページを 同化させるか否かにかかわらず、システムがエリア1410を修正しないように命令 するのに用いられる。閉じるボタン147は、閲覧ガイド100がディスプレイをクロ ーズするように命令するのに用いられ、除外ボタン1480は、エリア1410から強調 概念を除去するのに用いられる。 インタフェース1200内の第二ボックス1220は、ユーザがこれを用いてアクティ ブビューを生成するために閲覧ガイド100用の問い合わせタームを選択し入力す ることができるように(即ち、索引140へ問い合わせる)するものである。図2 は、一つのアクティブビューしか示していないが、閲覧ガイド100は、ユーザが たくさんの両方のビューを使って作業できるように、複数の概念ブラウザと同様 に、複数のアクティブビューをサポートするものであるとよい。図12に示した ようにボックス1220内の「online」という単語は、アクティブビュー用であり、 「online」という問い合わせ用のアクティブビューを図13に示す。 ディスプレイ1300は、二つの部分を含む。第一部分1310は、対応URLの索引140 の問い合わせ結果を示したものであり、第二部分1320は、ユーザが、ボタン上の マウス用アイコンをポイントしそのマウスボタン上でクリックすることにより、 種々のオペレーションの初期化を選択可能なボタン1330-1390用のものである。 問い合わせ結果は、索引140中の概念を用いたウェブページ中の問い合わせフレ ーズとテキストとの間の整合クオリティに基づいて並べられランクされている。 この処理は、1995年7月7日提出の米国特許出願第08/499,268号「コンピュータド キュメント取得システムにおける問合せ応答を生成する方法及び装置」に説明さ れているので、これを参照されたい。ボタン1430-1480に対応するボタン1330-13 80は、それぞれ、ボタン1430-1480に関して上述したものと同一のファンクショ ンを実行する。ユーザにより選択されると、新たな「URLへ飛ぶ」ボタン1390は 、索引コントローラ120に、強調された単語・フレーズ用のURLをブラウザ210へ 配信させ、これにより、順次、識別されたサーバへアクセスし、対応ウェブペー ジを取得・表示することができる。 図8に戻り説明を続けると、索引コントローラ120は、アクティブビューへの リクエストの形式でユーザから索引140への問い合わせリクエストを受信する( ステップ810)。索引コントローラ120がこのような問い合わせを受信すると、索 引コントローラ120は、索引140の問い合わせ結果に従って、リクエストされたア クティブビューをセットアップして表示し(ステップ820)、アクティブビュー を索引サーバ130へ接続する(ステップ830)。この接続により、索引サーバ130 は、追加ページから概念を同化させながら、表示されたアクティブビューを索引 140の変更に従って更新することができる。 索引コントローラ120の第五処理(図9参照)は、索引コントローラ120とブラ ウザ210(図2中の参照)との間の接続に関するものである。索引コントロー ラは、ブラウザ210の挙動を監視し、ユーザが選択した表示されたウェブページ が表示されると同時にブラウザ210から通知を取得する(ステップ910)。このよ うな通知に応答して、索引コントローラ120は、待ち行列内のURLの優先順位を付 け直し、ブラウサ210によりカレント表示されたウェブページによってなされた のと同様に、閲覧ガイド100は、ユーザの趣向と密接に整合する優先順位で対応 ウェブページの概念を同化させる。 索引サーバ処理 索引サーバ130は、新たなウェブページに基づく概念をそのウェブページに基 づいた情報と辞書データベース150内の関係に基づいた情報とを用いて分類に同 化させることにより、分類索引140を維持する。索引サーバ130により実行される 二つの処理工程のフローチャートは、図10及び図11に示される。図10にお いて、索引サーバ130は入力としてウェブページを受信する(ステップ1010)。 この説明は、インターネットからのウェブページを索引付ける点に焦点を置いて いるが、その他のドキュメントからの情報(例えば、電子メールメッセージ、テ キストファイル及びデータベース等)も同様に分類へ同化させることもできる。 索引サーバ130は、同化させるべくページ中のテキストを識別するためにウェ ブページを分析し(ステップ1020)、続いて、ウェブページから単語を抽出する (ステップ1030)。この抽出処理は、一般的には、テキストの「広義化」と称さ れ、この処理により、所定の規則が、単語に対応するページ中のテキストを判断 するために用いられる。この処理は、キャラクタと句読点との間のスペースにつ いてページを調べる周知の処理によりなされ得る。 索引サーバ130は、次に、辞書データベース150に存在しない単語を識別し、索 引140へ同化可能な概念を表すか否かを決定するために、それら「未知の」単語 を分析する(ステップ1040)。この工程は、形態論上の処理を含み、この処理に おいて、索引サーバ130は、辞書データベース150内に存在する他の既知の単語を を含むか否かを決定する。例えば、索引サーバ130は、「スパークステーション 」という単語を分析するが、この分析ば、この単語が「スパーク」と「ステーシ ョン」とから構成されているか否かを判断するためになされ、この形態論に基づ いて分類中のどこに末知の「スパークステーション」という単語が適合するかが 推論される。 ウェブページ中の全ての単語とフレーズとが識別された後(ステップ1030及び 1040)、索引サーバ130は、周知の技術を用いて、異なる品詞(例えば、名詞、 形容詞等)毎でそれらにタグを付ける(ステップ1050)。尚、既知の技術として は、エリックビル著「晶詞分類手法の進展」(AAAIコンフェレンス、1994)に記 載された抽出オペレーションを使用することができる。索引サーバ130は、次に 、ウェブページ中の各単語及びフレーズのロケーションに従ってウェブページか ら抽出された単語とフレーズとを索引140へ同化させる。ユーザがアクティブビ ューからフレーズを選択する際、閲覧ガイド100は、ブラウザ210に、選択された フレーズに対応する強調したパッセージを用いてウェブページを表示させるよう 命令する。 最終的には、索引サーバ130は、更にアクティブビューの更新に関するオペレ ーションを実行する。新たなページに索引付けがなされると(ステップ1110)、 索引サーバ130は、索引140に対する変更によって影響された全てのアクティブビ ューを更新する。例えば、上述した「online」用のアクティブビューが更新され ると、その変更は、索引140へ反映される。例えば、「online」という単語を含 む追加したウェブページ及びその関連概念は、索引140へ同化されることになる 。 結論 従来のインテリジェント手法の欠点を解決するために、本発明は、インターネ ット閲覧セッション中に取得した情報から概念的索引を自動的に構築して、閲覧 処理を容易にするものである。増殖的に構築された概念的索引に問い合わせをし 、これを閲覧するツールを用いることにより、ユーザは、選択された概念に対応 する特定のロケーションにあるドキュメントにアクセスすることかできる。索引 付け工程は、実際に閲覧対象とされたページからの情報取得のみでなく、そのペ ージに近接したページからの情報取得をも含むため、本発明は、ウェブナビゲー ション中のブラウザに、更に進んだドキュメントの概念を表示する「周辺表示」 機能を提供するものである。 以上、本発明の一実施の形態について説明したが、これは本発明の説明のため である。本発明は、上述した開示の形態に何ら限定されるものではなく、多くの 変形例が可能である。例えば、上述した実装は、ソフトウエア的手法によるもの であるが、本発明は、ハードウエアとソフトウエアとの組合せ又はハードウエア 単体によっても実装され得る。本発明の範囲は、請求の範囲及びこれを裏付ける 記載によって定められる。

Claims (1)

  1. 【特許請求の範囲】 1.ネットワークからコンテンツを保持するドキュメントを受信するドキュメン ト受信工程と、 前記ドキュメントの前記コンテンツから概念的情報を抽出する概念的情報抽出 工程と、 抽出された前記概念的情報を意味的に分析する分析工程と、 記憶辞書内の意味データに基づいた関係を反映して抽出された前記概念的情報 の索引を構築する索引構築工程と、 を備えたことを特徴とするプロセッサによるネットワーク情報のアクセス方法 。 2.前記ドキュメント受信工程は、更に、 前記ネットワークを閲覧するためのリクエストであって、前記ネットワークド キュメント用の識別子を含むリクエストを傍受する傍受工程を備えたことを特徴 とする請求項1に記載されるプロセッサによるネットワーク情報のアクセス方法 。 3.前記概念的情報抽出工程は、更に、 受信された前記ネットワークドキュメント内で識別されたネットワークドキュ メントにアクセスするアクセス工程と、 前記ドキュメント上のコンテンツから概念的情報を抽出する概念的情報抽出工 程と、 抽出された前記概念的情報を意味的に分析する分析工程と、 を備えたことを特徴とする請求項1に記載されるプロセッサによるネットワー ク情報のアクセス方法。 4.更に、 前記索引に基づいて抽出された概念的情報を含むアクティブビューを生成する アクティブビュー生成工程と、 前記アクティブビューを表示する表示工程と、 を備えたことを特徴とする請求項1に記載されるプロセッサによるネットワー ク情報のアクセス方法。 5.前記アクティブビュー生成工程は、 検索タームを含む前記索引へ問い合わせのためのリクエストを受信するリクエ スト受信工程と、 前記検索タームに関連する前記索引中の概念的情報を識別する概念的情報識別 工程と、 を備えたことを特徴とする請求項4に記載されるプロセッサによるネットワー ク情報のアクセス方法。 6.前記表示工程は、 識別された前記概念的情報用の前記ネットワークドキュメント内のロケーショ ンの対応識別子を用いて、前記索引に基づいて識別された前記概念的情報を呈示 する概念的情報呈示工程を備えたことを特徴とする請求項5に記載されるプロセ ッサによるネットワーク情報のアクセス方法。 7.更に、 前記ネットワークドキュメント中の対応ロケーションのビューを表示するため に前記識別子のうちのいずれかを選択する選択リクエスト受信工程を備えたこと を特徴とする請求項4に記載されるプロセッサによるネットワーク情報のアクセ ス方法。 8.前記プロセッサは、メモリへ接続され、更に、 前記メモリへ前記アクティブビューをストアするストア工程を備えたことを特 徴とする請求項4に記載されるプロセッサによるネットワーク情報のアクセス方 法。 9.ネットワークからコンテンツを保持するドキュメントを受信するドキュメン ト受信手段と、 前記ドキュメントの前記コンテンツから概念的情報を抽出する概念的情報抽出 手段と、 抽出された前記概念的情報を意味的に分析する分析プロセッサと、 記憶辞書内の意味データに基づいた関係を反映して抽出された前記概念的情報 の索引を構築する索引構築手段と、 を備えたことを特徴とするネットワーク情報アクセス装置。 10.前記ドキュメント受信手段は、更に、 前記ネットワークを閲覧するためのリクエストであって、前記ネットワークド キュメント用の識別子を含むリクエストを傍受する傍受手段を備えたことを特徴 とする請求項9に記載されるネットワーク情報のアクセス装置。 11.前記概念的情報抽出手段は、更に、 受信された前記ネットワークドキュメント内で識別されたネットワークドキュ メントにアクセスするアクセス手段と、 前記ドキュメント上のコンテンツから概念的情報を抽出する概念的情報抽出手 段と、 抽出された前記概念的情報を意味的に分析する分析手段と、 を備えたことを特徴とする請求項9に記載されるネットワーク情報のアクセス 装置。 12.更に、 前記索引に基づいて抽出された概念的情報を含むアクティブビューを生成する アクティブビュー生成手段と、 前記アクティブビューを表示する表示手段と、 を備えたことを特徴とする請求項9に記載されるネットワーク情報のアクセス 方法。 13.前記アクティブビュー生成手段は、 検索タームを含む前記索引へ問い合わせのためのリクエストを受信するリクエ スト受信手段と、 前記検索タームに関連する前記索引中の概念的情報を識別する概念的情報識別 手段と、 を備えたことを特徴とする請求項12に記載されるネットワーク情報のアクセ ス装置。 14.前記表示手段は、 識別された前記概念的情報用の前記ネットワークドキュメント内のロケーショ ンの対応識別子を用いて、前記索引に基づいて識別された前記概念的情報を呈示 する概念的情報呈示手段を備えたことを特徴とする請求項13に記載されるネッ トワーク情報のアクセス装置。 15.更に、 前記ネットワークドキュメント中の対応ロケーションのビューを表示するため に前記識別子のうちのいずれかを選択する選択リクエスト受信手段を備えたこと を特徴とする請求項12に記載されるネットワーク情報のアクセス装置。 16.更に、 前記アクティブビューをストアするメモリを備えたことを特徴とする請求項1 2に記載されるネットワーク情報のアクセス装置。 17.ネットワークからコンテンツを保持するドキュメントを受信するドキュメ ント受信手順と、 前記ドキュメントの前記コンテンツから概念的情報を抽出する概念的情報抽出 手順と、 抽出された前記概念的情報を意味的に分析する分析処理手順と、 記憶辞書内の意味データに基づいた関係を反映して抽出された前記概念的情報 の索引を構築する索引構築手順と、 をコンピュータに実行させるためコンピュータ読出可能に記録したネットワー ク情報アクセス手順記録媒体。 18.前記ドキュメント受信手順は、更に、 前記ネットワークを閲覧するためのリクエストであって、前記ネットワークド キュメント用の識別子を含むリクエストを傍受する傍受手順を備えたことを特徴 とする請求項17に記載されるネットワーク情報アクセス手順記録媒体。 19.前記概念的情報抽出手順は、更に、 受信された前記ネットワークドキュメント内で識別されたネットワークドキュ メントにアクセスするアクセス手順と、 前記ドキュメント上のコンテンツから概念的情報を抽出する概念的情報抽出手 順と、 抽出された前記概念的情報を意味的に分析する分析処理手順と、 を備えたことを特徴とする請求項17に記載されるネットワーク情報アクセス 手順記録媒体。 20.更に、 前記索引に基づいて抽出された概念的情報を含むアクティブビューを生成する アクティブビュー生成手順と、 前記アクティブビューを表示する表示手順と、 を備えたことを特徴とする請求項17に記載されるネットワーク情報アクセス 手順記録媒体。 21.前記アクティブビュー生成手順は、 検索タームを含む前記索引へ問い合わせのためのリクエストを受信するリクエ スト受信手順と、 前記検索タームに関連する前記索引中の概念的情報を識別する概念的情報識別 手順と、 を備えたことを特徴とする請求項20に記載されるネットワーク情報アクセス 手順記録媒体。 22.前記表示手順は、 識別された前記概念的情報用の前記ネットワークドキュメント内のロケーショ ンの対応識別子を用いて、前記索引に基づいて識別された前記概念的情報を呈示 する概念的情報呈示手順を備えたことを特徴とする請求項21に記載されるネッ トワーク情報アクセス手順記録媒体。 23.更に、 前記ネットワークドキュメント中の対応ロケーションのビューを表示するため に前記識別子のうちのいずれかを選択する選択リクエスト受信手順を備えたこと を特徴とする請求項20に記載されるネットワーク情報アクセス手順記録媒体。 24.更に、 前記アクティブビューをストアするストア手順を備えたことを特徴とする請求 項20に記載されるネットワーク情報アクセス手順記録媒体。 25.ネットワークからコンテンツを保持するドキュメントを受信するドキュメ ント受信工程と、 前記ドキュメントの前記コンテンツから概念的情報を抽出する概念的情報抽出 工程と、 抽出された前記概念的情報と記憶辞書内の意味的データとの間の構造的関係に 基づいて、抽出された前記概念的情報を索引へ同化させる同化工程と、 を備えたことを特徴とするプロセッサによるネットワーク情報のアクセス方法 。 26.受信された前記ドキュメントは他のネットワークドキュメント用の識別子 を含み、前記概念的情報抽出工程は、更に、 受信された前記ネットワークドキュメント内で識別されたネットワークドキュ メントにアクセスするアクセス工程と、 前記ドキュメント上のコンテンツから概念的情報を抽出する概念的情報抽出工 程と、 を備えたことを特徴とする請求項25に記載されるプロセッサによるネットワ ーク情報のアクセス方法。 27.前記プロセッサは、メモリに接続され、前記同化工程は、更に、 抽出された前記概念的情報とドキュメント内の前記概念的情報用のロケーショ ンの対応識別子とを含む索引を前記メモリへストアするストア工程を備えたこと を特徴とする請求項25に記載されるプロセッサによるネットワーク情報のアク セス方法。 28.ネットワークからコンテンツを保持するドキュメントを受信するドキュメ ント受信手段と、 前記ドキュメントの前記コンテンツから概念的情報を抽出する概念的情報抽出 手段と、 抽出された前記概念的情報と記憶辞書内の意味的データとの間の構造的関係に 基づいて、抽出された前記概念的情報を索引へ同化させる同化手段と、 を備えたことを特徴とするネットワーク情報のアクセス装置。 29.受信された前記ドキュメントは他のネットワークドキュメント用の識別子 を含み、前記概念的情報抽出手段は、更に、 受信された前記ネットワークドキュメント内で識別されたネットワークドキュ メントにアクセスするアクセス手段と、 前記ドキュメント上のコンテンツから概念的情報を抽出する概念的情報抽出手 段と、 を備えたことを特徴とする請求項28に記載されるネットワーク情報のアクセ ス装置。 30.更に、 抽出された前記概念的情報とドキュメント内の前記概念的情報用のロケーショ ンの対応識別子とを含む索引を前記メモリへストアするメモリを備えたことを特 徴とする請求項28に記載されるネットワーク情報のアクセス装置。 31.ネツトワークからコンテンツを保持するドキュメントを受信するドキュメ ント受信手順と、 前記ドキュメントの前記コンテンツから概念的情報を抽出する概念的情報抽出 手順と、 抽出された前記概念的情報と記憶辞書内の意味的データとの間の構造的関係に 基づいて、抽出された前記概念的情報を索引へ同化させる同化手順と、 をコンピュータに実行させるためコンピュータ読出可能に記録したネットワー ク情報アクセス手順記録媒体。 32.受信された前記ドキュメントは他のネットワークドキュメント用の識別子 を含み、前記概念的情報抽出手順は、更に、 受信された前記ネットワークドキュメント内で識別されたネットワークドキュ メントにアクセスするアクセス手順と、 前記ドキュメント上のコンテンツから概念的情報を抽出する概念的情報抽出手 順と、 を備えたことを特徴とする請求項31に記載されるネットワーク情報アクセス 手順記録媒体。 33.更に、 抽出された前記概念的情報とドキュメント内の前記概念的情報用のロケーショ ンの対応識別子とを含む索引を前記メモリへストアするストア手順を備えたこと を特徴とする請求項31に記載されるネットワーク情報アクセス手順記録媒体。 34.コンテンツを保持するドキュメント用の識別子を受信する識別子受信工程 と、 前記ドキュメント取得用のネットワークへ前記識別子を配信する識別子配信工 程と、 前記ドキュメントを受信するドキュメント受信工程と、 前記ドキュメントの前記コンテンツから概念的情報を抽出する概念的情報抽出 工程と、 抽出された前記概念的情報と記憶辞書内の意味的データとの間の構造的関係に 基づいて、抽出された前記概念的情報を索引へ同化させる同化工程と、 を備えたことを特徴とするプロセッサによるネットワーク情報のアクセス方法 。 35.受信された前記ドキュメントは他のネットワークドキュメント用の識別子 を含み、前記概念的情報抽出手順は、更に、 受信された前記ネットワークドキュメント内で識別されたネットワークドキュ メントにアクセスするアクセス手順と、 前記ドキュメント上のコンテンツから概念的情報を抽出する概念的情報抽出手 順と、 を備えたことを特徴とする請求項34に記載されるネットワーク情報アクセス 手順記録媒体。 36.コンテンツを保持するドキュメント用の識別子を受信する受信手段と、 前記ドキュメント取得用のネットワークへ前記識別子を配信する識別子配信手 段と、 前記ドキュメントを受信する受信手段と、 前記ドキュメントの前記コンテンツから概念的情報を抽出する概念的情報抽出 手段と、 抽出された前記概念的情報と記憶辞書内の意味的データとの間の構造的関係に 基づいて、抽出された前記概念的情報を索引へ同化させる同化手段と、 を備えたことを特徴とするネットワーク情報のアクセス装置。 37.受信された前記ドキュメントは他のネットワークドキュメント用の識別子 を含み、前記概念的情報抽出手段は、更に、 受信された前記ネットワークドキュメント内で識別されたネットワークドキュ メントにアクセスするアクセス手段と、 前記ドキュメント上のコンテンツから概念的情報を抽出する概念的情報抽出手 段と、 を備えたことを特徴とする請求項36に記載されるネットワーク情報のアクセ ス装置。 38.コンテンツを保持するドキュメント用の識別子を受信する受信手順と、 前記ドキュメント取得用のネットワークへ前記識別子を配信する識別子配信手 順と、 前記ドキュメントを受信する受信手順と、 前記ドキュメントの前記コンテンツから概念的情報を抽出する概念的情報抽出 手順と、 抽出された前記概念的情報と記憶辞書内の意味的データとの間の構造的関係に 基づいて、抽出された前記概念的情報を索引へ同化させる同化手順と、 をコンピュータに実行させるためコンピュータ読出可能に記録したネットワー ク情報アクセス手順記録媒休。 39.受信された前記ドキュメントは他のネットワークドキュメント用の識別子 を含み、前記概念的情報抽出手順は、更に、 受信された前記ネットワークドキュメント内で識別されたネットワークドキュ メントにアクセスするアクセス手順と、 前記ドキュメント上のコンテンツから概念的情報を抽出する概念的情報抽出手 順と、 を備えたことを特徴とする請求項38に記載されるネットワーク情報アクセス 手順記録媒体。
JP53478398A 1997-02-07 1998-01-30 増殖概念による索引付け手法を用いたインテリジェントネットワークブラウザ Ceased JP2001510607A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US08/797,630 US6415319B1 (en) 1997-02-07 1997-02-07 Intelligent network browser using incremental conceptual indexer
US08/797,630 1997-02-07
PCT/US1998/001588 WO1998035304A1 (en) 1997-02-07 1998-01-30 Intelligent network browser using incremental conceptual indexer

Publications (1)

Publication Number Publication Date
JP2001510607A true JP2001510607A (ja) 2001-07-31

Family

ID=25171379

Family Applications (1)

Application Number Title Priority Date Filing Date
JP53478398A Ceased JP2001510607A (ja) 1997-02-07 1998-01-30 増殖概念による索引付け手法を用いたインテリジェントネットワークブラウザ

Country Status (6)

Country Link
US (1) US6415319B1 (ja)
EP (1) EP0958541B1 (ja)
JP (1) JP2001510607A (ja)
CA (1) CA2279546A1 (ja)
DE (1) DE69810593D1 (ja)
WO (1) WO1998035304A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010532506A (ja) * 2007-03-30 2010-10-07 ニューコ インコーポレイテッド ナレッジナビゲーション及びディスカバリのデータ構造、システム、及び方法
JP4873813B2 (ja) * 1999-12-20 2012-02-08 ユアアミーゴ・リミテッド インデクシングシステムおよび方法

Families Citing this family (84)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7467137B1 (en) 1994-09-02 2008-12-16 Wolfe Mark A System and method for information retrieval employing a preloading procedure
US6604103B1 (en) * 1994-09-02 2003-08-05 Mark A. Wolfe System and method for information retrieval employing a preloading procedure
US6006252A (en) * 1996-10-08 1999-12-21 Wolfe; Mark A. System and method for communicating information relating to a network resource
US8626763B1 (en) 1997-05-22 2014-01-07 Google Inc. Server-side suggestion of preload operations
US7257604B1 (en) 1997-11-17 2007-08-14 Wolfe Mark A System and method for communicating information relating to a network resource
US6215483B1 (en) * 1998-06-17 2001-04-10 Webtv Networks, Inc. Combining real-time and batch mode logical address links
US6144958A (en) * 1998-07-15 2000-11-07 Amazon.Com, Inc. System and method for correcting spelling errors in search queries
JP2001075965A (ja) * 1999-06-30 2001-03-23 Mega Chips Corp 情報通信システム
US6332139B1 (en) 1998-11-09 2001-12-18 Mega Chips Corporation Information communication system
US6938270B2 (en) 1999-04-07 2005-08-30 Microsoft Corporation Communicating scripts in a data service channel of a video signal
US6665681B1 (en) * 1999-04-09 2003-12-16 Entrieva, Inc. System and method for generating a taxonomy from a plurality of documents
US6594691B1 (en) 1999-10-28 2003-07-15 Surfnet Media Group, Inc. Method and system for adding function to a web page
US6775663B1 (en) * 1999-12-17 2004-08-10 Si Han Kim Information coding and retrieval system and method thereof
US20020010709A1 (en) * 2000-02-22 2002-01-24 Culbert Daniel Jason Method and system for distilling content
US7114124B2 (en) * 2000-02-28 2006-09-26 Xerox Corporation Method and system for information retrieval from query evaluations of very large full-text databases
KR100363619B1 (ko) * 2000-04-21 2002-12-05 배동훈 나선형 도우넛 형태를 갖는 컨텐츠 구조 및 컨텐츠디스플레이 시스템
US7383299B1 (en) * 2000-05-05 2008-06-03 International Business Machines Corporation System and method for providing service for searching web site addresses
US6766524B1 (en) 2000-05-08 2004-07-20 Webtv Networks, Inc. System and method for encouraging viewers to watch television programs
US7464381B1 (en) * 2000-05-12 2008-12-09 Oracle International Corporation Content update proxy method
US7523158B1 (en) 2000-05-12 2009-04-21 Oracle International Corporation System and method for partial page updates using a proxy element
WO2001093071A2 (en) * 2000-05-29 2001-12-06 Saora Kabushiki Kaisha System and method for saving browsed data
US20030120653A1 (en) * 2000-07-05 2003-06-26 Sean Brady Trainable internet search engine and methods of using
US7058700B1 (en) 2000-07-13 2006-06-06 Oracle International Corporation Delta caching
US20020049792A1 (en) * 2000-09-01 2002-04-25 David Wilcox Conceptual content delivery system, method and computer program product
US20020124056A1 (en) * 2001-03-01 2002-09-05 International Business Machines Corporation Method and apparatus for modifying a web page
US20020147775A1 (en) * 2001-04-06 2002-10-10 Suda Aruna Rohra System and method for displaying information provided by a provider
US20040205558A1 (en) * 2001-10-18 2004-10-14 Ibm Corporation Method and apparatus for enhancement of web searches
US7346548B2 (en) * 2001-10-25 2008-03-18 Goldman Sachs & Co. System, method, apparatus and means evaluating historical network activity
JP2003208434A (ja) * 2001-11-07 2003-07-25 Nec Corp 情報検索システム及びそれに用いる情報検索方法
US7428517B2 (en) * 2002-02-27 2008-09-23 Brands Michael Rik Frans Data integration and knowledge management solution
JP2003337699A (ja) * 2002-03-13 2003-11-28 Saora Inc 情報処理装置及びその方法、及びそのプログラムを記憶した記憶媒体
JP2003283545A (ja) * 2002-03-22 2003-10-03 Toshiba Corp 通信システム及び通信システムのコネクション制御方法
US7120641B2 (en) * 2002-04-05 2006-10-10 Saora Kabushiki Kaisha Apparatus and method for extracting data
US20030195896A1 (en) * 2002-04-15 2003-10-16 Suda Aruna Rohra Method and apparatus for managing imported or exported data
US20030229846A1 (en) * 2002-06-07 2003-12-11 Anil Sethi System and method for capturing digital data directly from an electronic device and processing the data into XML form on a computer chip
US20040221001A1 (en) * 2002-07-05 2004-11-04 Anjali Anagol-Subbarao Web service architecture and methods
US20040006610A1 (en) * 2002-07-05 2004-01-08 Anjali Anagol-Subbarao Architecture and method for configuration validation web service
GB0302263D0 (en) * 2003-01-31 2003-03-05 Roke Manor Research Secure network browsing
GB0302640D0 (en) * 2003-02-06 2003-03-12 Rolls Royce Plc Database arrangement
US7188308B2 (en) 2003-04-08 2007-03-06 Thomas Weise Interface and method for exploring a collection of data
US20070022110A1 (en) * 2003-05-19 2007-01-25 Saora Kabushiki Kaisha Method for processing information, apparatus therefor and program therefor
US20050044192A1 (en) * 2003-07-28 2005-02-24 Applin John R. Web site management system with link management functionality
US7302370B2 (en) * 2003-11-17 2007-11-27 Oracle International Corporation System and method for managing browser sessions in single and multi-server workflow environments
US9021529B2 (en) 2004-07-15 2015-04-28 Microsoft Technology Licensing, Llc Content recordation techniques
US20060036451A1 (en) 2004-08-10 2006-02-16 Lundberg Steven W Patent mapping
JP2006053745A (ja) * 2004-08-11 2006-02-23 Saora Inc データ処理方法及びその装置、及びそのプログラム
US7540051B2 (en) 2004-08-20 2009-06-02 Spatial Systems, Inc. Mapping web sites based on significance of contact and category
US7606793B2 (en) 2004-09-27 2009-10-20 Microsoft Corporation System and method for scoping searches using index keys
US7644107B2 (en) * 2004-09-30 2010-01-05 Microsoft Corporation System and method for batched indexing of network documents
US20070073678A1 (en) * 2005-09-23 2007-03-29 Applied Linguistics, Llc Semantic document profiling
WO2006128183A2 (en) 2005-05-27 2006-11-30 Schwegman, Lundberg, Woessner & Kluth, P.A. Method and apparatus for cross-referencing important ip relationships
US20070006129A1 (en) * 2005-06-01 2007-01-04 Opasmedia Oy Forming of a data retrieval, searching from a data retrieval system, and a data retrieval system
US20060294049A1 (en) * 2005-06-27 2006-12-28 Microsoft Corporation Back-off mechanism for search
CN100585591C (zh) * 2005-07-15 2010-01-27 国际商业机器公司 用于实现交互式浏览的系统和方法
US8161025B2 (en) * 2005-07-27 2012-04-17 Schwegman, Lundberg & Woessner, P.A. Patent mapping
US20070073745A1 (en) * 2005-09-23 2007-03-29 Applied Linguistics, Llc Similarity metric for semantic profiling
US7827191B2 (en) * 2005-12-14 2010-11-02 Microsoft Corporation Discovering web-based multimedia using search toolbar data
US20080033943A1 (en) * 2006-08-07 2008-02-07 Bea Systems, Inc. Distributed index search
US9015197B2 (en) 2006-08-07 2015-04-21 Oracle International Corporation Dynamic repartitioning for changing a number of nodes or partitions in a distributed search system
US7860704B2 (en) * 2006-12-13 2010-12-28 Microsoft Corporation Lexicon-based content correlation and navigation
CN101378400B (zh) * 2007-08-30 2013-01-30 国际商业机器公司 实现桌面应用和Web应用聚合的方法、服务器和系统
EP2031820B1 (en) * 2007-08-31 2014-07-30 Alcatel Lucent Method for enriching content of a web page with presence information
US9348912B2 (en) 2007-10-18 2016-05-24 Microsoft Technology Licensing, Llc Document length as a static relevance feature for ranking search results
US20090217179A1 (en) * 2008-02-21 2009-08-27 Albert Mons System and method for knowledge navigation and discovery utilizing a graphical user interface
US20090228817A1 (en) * 2008-03-10 2009-09-10 Randy Adams Systems and methods for displaying a search result
US20090228811A1 (en) * 2008-03-10 2009-09-10 Randy Adams Systems and methods for processing a plurality of documents
US8812493B2 (en) 2008-04-11 2014-08-19 Microsoft Corporation Search results ranking using editing distance and document information
US11048765B1 (en) 2008-06-25 2021-06-29 Richard Paiz Search engine optimizer
US20100131513A1 (en) 2008-10-23 2010-05-27 Lundberg Steven W Patent mapping
US7669136B1 (en) * 2008-11-17 2010-02-23 International Business Machines Corporation Intelligent analysis based self-scheduling browser reminder
US11379473B1 (en) 2010-04-21 2022-07-05 Richard Paiz Site rank codex search patterns
US11423018B1 (en) 2010-04-21 2022-08-23 Richard Paiz Multivariate analysis replica intelligent ambience evolving system
US8738635B2 (en) 2010-06-01 2014-05-27 Microsoft Corporation Detection of junk in search result ranking
US8886811B2 (en) 2010-11-29 2014-11-11 Motorola Mobility Llc Method and device for improving a browsing experience
US9904726B2 (en) 2011-05-04 2018-02-27 Black Hills IP Holdings, LLC. Apparatus and method for automated and assisted patent claim mapping and expense planning
US8495484B2 (en) * 2011-08-02 2013-07-23 International Business Machines Corporation Intelligent link population and recommendation
WO2013025556A1 (en) 2011-08-12 2013-02-21 Splunk Inc. Elastic scaling of data volume
US20130086080A1 (en) 2011-10-03 2013-04-04 Steven W. Lundberg System and method for information disclosure statement management and prior art cross-citation control
US9940363B2 (en) 2011-10-03 2018-04-10 Black Hills Ip Holdings, Llc Systems, methods and user interfaces in a patent management system
US9495462B2 (en) 2012-01-27 2016-11-15 Microsoft Technology Licensing, Llc Re-ranking search results
US20140019457A1 (en) * 2012-07-11 2014-01-16 Wanxia XIE System and method for indexing, ranking, and analyzing web activity within an event driven architecture
JP6021487B2 (ja) * 2012-07-18 2016-11-09 キヤノン株式会社 情報処理システム、制御方法、サーバ、情報処理装置およびコンピュータプログラム
US11809506B1 (en) 2013-02-26 2023-11-07 Richard Paiz Multivariant analyzing replicating intelligent ambience evolving system
US11741090B1 (en) 2013-02-26 2023-08-29 Richard Paiz Site rank codex search patterns

Family Cites Families (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5062074A (en) 1986-12-04 1991-10-29 Tnet, Inc. Information retrieval system and method
US4849898A (en) 1988-05-18 1989-07-18 Management Information Technologies, Inc. Method and apparatus to identify the relation of meaning between words in text expressions
US4839853A (en) 1988-09-15 1989-06-13 Bell Communications Research, Inc. Computer information retrieval using latent semantic structure
US4984178A (en) 1989-02-21 1991-01-08 Texas Instruments Incorporated Chart parser for stochastic unification grammar
US5276616A (en) 1989-10-16 1994-01-04 Sharp Kabushiki Kaisha Apparatus for automatically generating index
US5404514A (en) 1989-12-26 1995-04-04 Kageneck; Karl-Erbo G. Method of indexing and retrieval of electronically-stored documents
US5301109A (en) 1990-06-11 1994-04-05 Bell Communications Research, Inc. Computerized cross-language document retrieval using latent semantic indexing
US5321833A (en) 1990-08-29 1994-06-14 Gte Laboratories Incorporated Adaptive ranking system for information retrieval
US5325298A (en) 1990-11-07 1994-06-28 Hnc, Inc. Methods for generating or revising context vectors for a plurality of word stems
EP0510634B1 (en) 1991-04-25 1999-07-07 Nippon Steel Corporation Data base retrieval system
US5418943A (en) 1991-10-23 1995-05-23 At&T Corp. Information system with knowledge base and data base
US5428778A (en) 1992-02-13 1995-06-27 Office Express Pty. Ltd. Selective dissemination of information
GB9220404D0 (en) 1992-08-20 1992-11-11 Nat Security Agency Method of identifying,retrieving and sorting documents
US5440481A (en) 1992-10-28 1995-08-08 The United States Of America As Represented By The Secretary Of The Navy System and method for database tomography
US5594837A (en) 1993-01-29 1997-01-14 Noyes; Dallas B. Method for representation of knowledge in a computer as a network database system
US5544352A (en) 1993-06-14 1996-08-06 Libertech, Inc. Method and apparatus for indexing, searching and displaying data
US5475588A (en) 1993-06-18 1995-12-12 Mitsubishi Electric Research Laboratories, Inc. System for decreasing the time required to parse a sentence
US5418918A (en) 1993-09-10 1995-05-23 Compaq Computer Corp. Scanning initial CD-ROM sectors for a boot record and executing said boot record to load and execute floppy disk image corresponding to the existing floppy drive
US5600831A (en) * 1994-02-28 1997-02-04 Lucent Technologies Inc. Apparatus and methods for retrieving information by modifying query plan based on description of information sources
US5708825A (en) * 1995-05-26 1998-01-13 Iconovex Corporation Automatic summary page creation and hyperlink generation
US5724571A (en) * 1995-07-07 1998-03-03 Sun Microsystems, Inc. Method and apparatus for generating query responses in a computer-based document retrieval system
US5822539A (en) * 1995-12-08 1998-10-13 Sun Microsystems, Inc. System for adding requested document cross references to a document by annotation proxy configured to merge and a directory generator and annotation server
US5974455A (en) * 1995-12-13 1999-10-26 Digital Equipment Corporation System for adding new entry to web page table upon receiving web page including link to another web page not having corresponding entry in web page table
US6081829A (en) * 1996-01-31 2000-06-27 Silicon Graphics, Inc. General purpose web annotations without modifying browser
US6076088A (en) * 1996-02-09 2000-06-13 Paik; Woojin Information extraction system and method using concept relation concept (CRC) triples
US5937163A (en) * 1996-03-26 1999-08-10 Industrial Technology Research Institute Method and system at a host node for hierarchically organizing the links visited by a world wide web browser executing at the host node
US5894554A (en) * 1996-04-23 1999-04-13 Infospinner, Inc. System for managing dynamic web page generation requests by intercepting request at web server and routing to page server thereby releasing web server to process other requests
US5918013A (en) * 1996-06-03 1999-06-29 Webtv Networks, Inc. Method of transcoding documents in a network environment using a proxy server
US6026409A (en) * 1996-09-26 2000-02-15 Blumenthal; Joshua O. System and method for search and retrieval of digital information by making and scaled viewing
US5918237A (en) * 1996-09-30 1999-06-29 At&T Corp. System and method for providing multimedia bookmarks for hypertext markup language files
US5870559A (en) * 1996-10-15 1999-02-09 Mercury Interactive Software system and associated methods for facilitating the analysis and management of web sites
US6038561A (en) * 1996-10-15 2000-03-14 Manning & Napier Information Services Management and analysis of document information text

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4873813B2 (ja) * 1999-12-20 2012-02-08 ユアアミーゴ・リミテッド インデクシングシステムおよび方法
JP2010532506A (ja) * 2007-03-30 2010-10-07 ニューコ インコーポレイテッド ナレッジナビゲーション及びディスカバリのデータ構造、システム、及び方法

Also Published As

Publication number Publication date
DE69810593D1 (de) 2003-02-13
US6415319B1 (en) 2002-07-02
CA2279546A1 (en) 1998-08-13
EP0958541A1 (en) 1999-11-24
WO1998035304A1 (en) 1998-08-13
EP0958541B1 (en) 2003-01-08

Similar Documents

Publication Publication Date Title
JP2001510607A (ja) 増殖概念による索引付け手法を用いたインテリジェントネットワークブラウザ
US9384245B2 (en) Method and system for assessing relevant properties of work contexts for use by information services
US6338059B1 (en) Hyperlinked search interface for distributed database
US6581056B1 (en) Information retrieval system providing secondary content analysis on collections of information objects
US6968332B1 (en) Facility for highlighting documents accessed through search or browsing
US8014997B2 (en) Method of search content enhancement
US7895595B2 (en) Automatic method and system for formulating and transforming representations of context used by information services
US7421432B1 (en) Hypertext browser assistant
US6493702B1 (en) System and method for searching and recommending documents in a collection using share bookmarks
US20110238662A1 (en) Method and system for searching a wide area network
US8522128B1 (en) Systems and methods for modifying the order of links presented in a document
JP4469432B2 (ja) インターネット情報処理装置、インターネット情報処理方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
US7483877B2 (en) Dynamic comparison of search systems in a controlled environment
KR19990078876A (ko) 일괄된 자원 위치기 입력을 통한 정보 검색 방법
JP2002312389A (ja) 情報検索装置および情報検索方法
US7496600B2 (en) System and method for accessing web-based search services
Sharpe et al. Searching for the last word.

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050125

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080408

A313 Final decision of rejection without a dissenting response from the applicant

Free format text: JAPANESE INTERMEDIATE CODE: A313

Effective date: 20080902

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20081104