【発明の詳細な説明】
インターネットから検索される情報を知識ベース表現を使用して編成する方法
技術分野
本発明は、インターネット上の情報にアクセスする方法に関し、特に、インタ
ーネットから検索される情報を知識ベース表現システムを使用して編成する方法
に関する。
発明の背景
インターネットは、相互に接続される一連のネットワークであり、情報、デー
タおよびファイルの交換を容易にする。インターネットに接続される利用者は、
これらのネットワークによって膨大な量の情報にアクセスすることができる。イ
ンターネットに対するアクセスを得る通常の方法は、オンラインサービスサーバ
による方法である。図1について述べると、ネットワーク110、112、およ
び114は、それぞれ、オンラインサービスサーバ120、122、および12
4を経由してインターネット100に接続される。インターネットにアクセスす
る別の方法は、ダイヤルインインターネットプロバイダを経由する方法である。
たとえば、利用者は、自分のモデム152を使用しインターネットプロバイダ1
50にダイヤルインすることによって、自分のパーソナルコンピュータ(PC)
158上において、インターネット100にアクセスすることができる。ルータ
は、コンピュータとネットワークを接続し、トラフィックをネットワークおよび
インターネットに向ける。ルータ160、162、164、および166は、ネ
ットワークおよびインターネット全域を移動するデータのパケットを検査し、デ
ータの行き先はどこであるかを決定する。
オンラインサービスサーバおよびインターネットプロバイダを利用することに
よって、利用者は、サーチエンジン130、132、134、および154とし
て知られているソフトウェアプログラムを使用し、全世界のネットワークに接続
されているワールドワイドウェブ(ウェブ)をインターネット上において探索す
ることができる。サーチエンジンは、探索ツールおよびウェブクローラ(Web cr
awlers)としも知られる。これらのサーチエンジンは、ウェブ全域を移動し、ウ
ェブ(ホーム)ページ140、142、144、および156に見出されるハイパ
ーテキストリンクを巡ることによってドキュメントを収集する。
インターネットを探索する一つの方法は、キーワードによる方法である。たと
えば、利用者は、自分の求めている情報を表すキーワードのストリングを問い合
わせに打ち込む。サーチエンジンは、インターネット上のデータベースを探索し
、その結果はハイパーテキストマークアップ言語(HTML)ページとして戻る
。利用者は、次に、関心のあるドキュメントを、そのドキュメントに対するリン
クをクリックすることによって見ることができる。クリックするとは、カーソル
を所望の項目に合わせマウススイッチを作動させる処理をいう。
現在のサーチエンジンによってインターネット上でキーワードの探索はできる
が、インターネット上の情報の量は膨大であるので妥当な情報を得ることは難し
い。言い換えれば、キーワード探索の結果、通常、膨大な量の情報が回答され、
利用者は妥当な情報を検索するために全部をブラウズする必要がある。したがっ
て、インターネットから情報を検索する一層効率的な方法が必要とされる。
発明の概要
情報探索結果を編成するという前述した問題は、探索結果を自動的に類別する
ために知識ベース表現(知識ベース・リプリゼンテーション・テクニック)を応
用することによって軽減される。この情報探索および管理のシステムは、知識ベ
ースを探索サーバと対応付け、探索タスクの妥当性および正確度を改良する。知
識ベースは、利用者の情報編成に対する関心および好みを表すユーザプロファイ
ル(主題分類法)を提供する。本システムは、この知識ベースを使用しキーワー
ド探索の結果を編成する。本システムは、知識ベースに従って、探索結果を自動
的に類別し区分し、妥当な情報の探索を容易にする。本システムは、探索結果を
知識ベース主題分類法のサブセットによって表示し、その結果を最も妥当なドキ
ュメントを見出すことを容易にする方法によって区分し、不適切な情報を除外す
る。
図面の簡単な説明
図1は、本発明の作動環境の解説のために、コンピュータおよびネットワーク
ならびにそれらのインターネットに対する接続を示す図である。
図2は、本発明の原理によるコンセプト総合分類法の図式表現を表示する知識
ベースブラウザの例を示す図である。
図2aは、図2に例示した知識ベースブラウザの実際のスクリーン表示を示す図
である。
図3は、本発明の原理による探索インタフェースを示すブロック図である。
図4は、利用者がインターネットから情報を検索し、知識ベース表現を使用し
てその情報を編成するステップを示す流れ図である。
発明の詳細な説明
図1は、本発明に関する環境を示す図であり、環境はインターネット100と
相互接続されるネットワーク110、112、ならびに114およびPC158
および159を含む。これらのネットワークは、たとえば、トークンリングネッ
トワーク(ネットワーク114)またはイーサネット(Ethernet)ネッ
トワーク(ネットワーク110および112)によって互いに接続される利用者
を含む。各ネットワークは、さらに、サーバ120、122および124を含む
。サーバはホストコンピュータであり、利用者は、サーバによってネットワーク
上において相互に通信すること、およびインターネットによってネットワーク外
の利用者と通信することができる。PC158および159上の利用者は、イン
ターネットプロバイダ150に加入し、インターネットプロバイダを使用するこ
とによって互いに通信およびインターネット上の他の利用者と通信することがで
きる。
いかなる利用者も、インターネット上で利用できる情報を探索することができ
る。コンピュータまたはネットワークがインターネットに接続されると、その時
点でコンピュータまたはネットワーク上の情報は、保護されていない場合は、他
者によって利用可能となる。インターネットは全世界的なネットワークであるの
で、検索できる情報の量は膨大である。多数のサーバおよびプロバイダは、サー
チエンジン130、132、134、および154を備え、利用者はサーチエン
ジンを使用することによりキーワードによって探索することができる。これらの
サーチエンジンは、コンピュータプログラムであり、このプログラムは、サーチ
アプリケーションを基礎とするプログラムであり、オンラインサービスサーバ1
20、122、124、およびインターネットプロバイダ150上で実行される
。キーワードによる探索は、通常、結果として、膨大な量の情報の戻りとなり、
利用者は、所望の情報を得るために、全体をブラウジングする必要がある。
現在は、インターネットを探索する方法は二つある。両方法は、クライアント
/サーバモデルによって作動される。クライアント/サーバモデルの対象と考え
られるのは、一つのソフトウェアを自分のコンピュータ上で実行またはクライア
ントであるサーバの共用プログラムを実行し、遠隔サーバコンピュータ(インタ
ーネットに接続される他のサーバ)のリソースを使用する利用者である。たとえ
ば、図1において、PC110aの利用者は、オンラインサービスサーバ122
および124ならびにインターネットプロバイダ150によって、情報を探索す
ることができる。同様に、PC156の利用者は、オンラインサーバ120、1
22、および124によって情報を探索することができる。遠隔サーバ、たとえ
ば、オンラインサーバ120、122、および124ならびにインターネットプ
ロバイダ150は、多数のネットワークの多数の利用者にサービスするので、ホ
ストとも呼ばれる。ホストを使用することによって、多数の異なるクライアント
が、それらのクライアントリソースに同時にアクセスすることができる。ホスト
は、単独の利用者の専用ではない。
インターネットを探索する第1の方法はインデックスによる方法である。イン
デックスは、情報発見の高度な構造を有する方法を提供する。インデックスを使
用し、利用者は、たとえば、芸術、コンピュータ、娯楽、スポーツ、などの類別
によって、情報を徹底的にブラウジングすることができる。ウェブブラウザにお
いては、PC110aの利用者は、通常、自分のマウス110bを使用し、一連
のサブ類別を表示させることができる。たとえば、スポーツには、野球、バスケ
ットボール、フットボール、などが含まれる。インデックスのサイズによって、
サブ類別には幾つかの層が存在する場合がある。利用者が自分の目的とするサブ
類別を得るとき、利用者は妥当なドキュメントのリストを提示される。これらの
ドキュメントを得るために、利用者はこれらのドキュメントに対するリンクをク
リックする。ヤフー(Yahoo!)は、インターネット上で普及しているイン
デックスの名称である。ヤフーおよび他のインデックスを使用し、利用者は、利
用者が求める情報を表すワードを打ち込むことによってそのワードによって探索
することができる。次に、利用者は、一連の探索結果、すなわち、利用者の探索
に一致するドキュメントに対するリンクを得る。情報を得るために、利用者はド
キュメントに対するリンクをクリックする。
情報を発見する第2の方法は、サーチエンジンを使用する方法であり、サーチ
エンジンも探索ツールとして公知である。サーチエンジンは、本質上、静的であ
り事前に組み込まれたインデックス上で作動する。すなわち、インデックスは、
オンラインコンテンツから構築され、サーチサーバ上に記憶される。ウェブクロ
ーラは、検索されサーチサーバのデータベースにおいてインデックスを付けられ
るオンラインコンテンツを収集するために、サーチエンジンによって使用される
。幾つかの普及しているインターネットサーチエンジンは、たとえば、Lyco
s、WebCrawler、およびAlta Vistaなどである。探索を開
始するために、利用者は、自分の欲する情報を表すキーワードを打ち込む。探索
から得られ利用者の探索基準に一致する結果は、利用者に返信される。結果のリ
ストから、利用者は、そのドキュメントに対するリンクをクリックすることによ
って、ドキュメントを検索することができる。
インデックスおよびサーチエンジンの両者を使用することによって、利用者は
インターネット上の情報を得ることができるが、見出される情報は、通常、多量
であり、多くの場合、妥当な情報を突き止めることが困難である。したがって、
利用者が探索結果を容易に十分にブラウザし妥当な情報を発見できるように、イ
ンターネット上で見出される探索結果を自動的に類別することが望ましい。
本発明によれば、知識ベース表現システムは、対象を表現し対象間の関係を推
論するその機能によって、前述した問題を軽減する。特に、本発明は、知識ベー
ス情報検索および管理システムを目的とし、このシステムは、たとえば、インタ
ーネットなどのマルチメディアネットワークシステム上の探索の質を向上させる
。本システムは、インターネット上で見出された情報について個別利用者に適合
するコンセプトの編成を実施する手段を利用者に提供するので、その情報の有効
性が向上し情報に対するアクセスが改良される。図1に示すように、本システム
は、既存のウェブブラウザ130、132、134、および154と統合され、
コンセプトのナビゲーションによるハイパーテキストブラウジングを併用するシ
ームレス環境を生成する。本システムは、パーソナルコンピュータ、たとえば、
PC110aに記憶させることも可能であり、その場合は、そのパーソナルコン
ピュータに対するアクセスを有する利用者のみが本システムを使用することがで
きる。
図2は、知識ベースブラウザの例を示す図であり、このブラウザは、本発明に
よるコンセプト総合分類法200の図式表現を表示する。分類法は、コンセプト
間の関係を図で表現する総合階層である。コンセプトは、対象の抽象的記述であ
る。図2のノードは、知識ベースコンセプトに対応し(たとえば、210、22
0、230、212、214、など)、また辺(エッジ)(たとえば、210a
、210b、220aなど)はノード間を連結しコンセプト間の包摂関係(subs
umption relationships)を示す。本発明の特徴は、本システムはコンセプトお
よびインスタンス(instance:実例)(270,280)に基づいて包摂関係を
自動的に管理できることである。インスタンスは、コンセプトの特定の実現であ
り、すなわち、コンセプトはあるものの抽象的記述であり、一方、そのコンセプ
トのインスタンスは、その記述を満足する現実の対象である。たとえば、新しい
ドキュメントがインスタンスとして知識ベースブラウザに追加されるとき、本シ
ステムは、分類法に属するすべての位置を推論する。
図2に示すように、最も一般的なコンセプトは左にある。コンセプトノードか
ら出る辺を追跡すると(左から右に)、一層特殊化されたコンセプトに到達する
。たとえば、主題「人工知能」228は「コンピュータサイエンス」220の特
殊化であり、次に、「知識表現」229は「人工知能」228の特殊化である。
この表示内のパネル270および280は、これらのコンセプトのインスタンス
のリストを示す。たとえば、パネル270は、主題「小児科医療」212のイン
スタンスであるドキュメントを示す。パネル280は、コンセプト「知識表現」
2
29のインスタンスを示す。インスタンスは、終始、上位の階層の親コンセプト
によって受け継がれるので、たとえば、「知識表現」によって出現するドキュメ
ントは「コンピュータサイエンス」によっても出現する。インスタンスを編成す
る方法は、探索インタフェースに関して、以下に述べる。図2aは、図2の知識
ベースブラウザの例の実際のスクリーン表示を示す図であり、コンセプト総合分
類法200ならびにコンセプトおよびインスタンス間の包摂関係を示す。
探索インタフェースは、知識ベースブラウザのインタフェースと同様に動作す
る。探索インタフェースは、知識ベースを使用し、利用者のコンセプト総合分類
法に関して結果を区分し類別することによって、探索結果の質を向上させる。た
とえば、キーワード探索から得られた結果が表示のために結果セットとしてまと
められた後、本システムは、結果セットをさらに集約することができるステップ
を提供する。知識ベースと対比して結果セットの質を向上させることは、結果セ
ット中のドキュメントを探索し、それを知識ベースパターンマッチャによって処
理することを含む。知識ベース中のコンセプトに対応づけられる原文のパターン
を使用することによって、知識表現システムは、これらのドキュメントをコンセ
プト分類法内において類別し編成することができる。知識ベースの各パターンは
、コンセプトと対応づけられる。言い換えれば、各ドキュメントはこれらのパタ
ーンマッチャに対して比較され、ドキュメントに一致するコンセプトが存在する
かが決定される。この比較処理の出力は、知識ベース中のコンセプトの内、ドキ
ュメントのコンテンツに対していくらかの対応を有する特定のコンセプトのセッ
トである。コンセプトとドキュメント間の一致のレコードは、一致したコンセプ
トの記述を含む一時的インスタンスを生成することによって、知識ベースに作成
される。最後に、質の向上された探索結果が、知識ベース主題分類法のサブセッ
トによって図式的に表示される。このサブセットは、マッチング処理中に生成さ
れる一つ以上の一時的インスタンスを有するこれらのコンセプトによって形成さ
れる。これを図3に示す。図3はドキュメントのコンテンツに一致するこれらの
コンセプトのみを示す。
本発明は、データ編成に知識ベース表現システムを使用し、キーワード探索結
果が数千のような多量のドキュメントとなるとき、特に有用である。パターンマ
ッチャをこれらのドキュメントに実行することによって、これらのドキュメント
を利用者に対して最も妥当なドキュメントに迅速に集約することができる。
したがって、本発明による知識ベース表現システム(ブラウザおよび探索イン
タフェース)を使用することによって、利用者は妥当な情報を迅速に見出すこと
ができる。
分類法の別の特徴は、コンセプトに従って結果をグループ分けすることによっ
て、利用者は、自分が最も妥当であると考える部分をクローズアップすることが
できることである。この方法は、さらに、ブラウジング時間を削減することによ
って、インターネット上の探索を強化する。
探索インタフェースは、さらに、問い合わせ適用範囲を最大とし応答遅延を最
小とするために、多数のインデックスサーバに対する即応型の並行アクセスを実
行する。個別サーチエンジンの機能を明白に表現することによって、問い合わせ
システムは、問い合わせを処理することが可能であるサーバのみが問い合わせを
受けることを保証する。
本発明の別の特徴は、ユーザインタフェースであり、このインタフェースは、
コンセプト階層を拡張し再編成するためのエディタを提供する。ユーザインタフ
ェースは、ナビゲーション経過の対話型図式マップを保持するナビゲーションブ
ラウザも提供する。ナビゲーションブラウザは、利用者のブラウジング経過の木
構造図式表現である。次に、ナビゲーションブラウザの機能について述べる。利
用者がブラウジングするとき、利用者は巡回するウェブサイトの規則正しい順序
を生成し、リンクを一つのページから別のページに進む。利用者が後戻りし、新
しいブラウジングを選択するとき、ブラウジング経過は分岐する木となる。ナビ
ゲーションブラウザは、巡回したあらゆるサイト/ページごとに、木に新しいノ
ードを追加し、これらの選択の軌跡を保持する。この木は、ブラウジング経過の
概要を示すだけでなく、ナビゲーションの代替方法となる(木のノードをクリッ
クし対応づけられるページに戻ることによって)。
本発明の他の特徴は、本システムアーキテクチャは知識ベースをクライアント
から分離することによって、利用者はクライアントの位置に関係なく利用者の情
報空間を一貫して調べることができることである。知識ベースを一つの位置に保
持することによって、環境は、利用者を一つのプラットフォームから別のプラッ
トフォームに追跡することができる。分離の利点は、システムサーバの連続利用
可能性を保証しやすくなることであり、その理由は、分離によって、知識ベース
に対する共用のアクセスが提供され、クライアントが非活動状態または非接続で
あるときでも、タスクの自主的モニタリングを実行できるためである。言い換え
れば、知識ベースは、クライアントから分離された別のサーバに記憶することが
できる。
図4について述べると、この流れ図は、利用者が、インターネットから情報を
検索し、本発明による知識ベース表現を使用し、その情報を編成するステップを
示す。
ステップ401において、利用者は、探索する必要があるキーワードの問い合
わせストリングを自分のパーソナルコンピュータ110aにおいて入力し、本発
明による知識ベースウェブブラウザ130を使用する。知識ベースウェブブラウ
ザは、クライアント110aまたはサーバ120のいずれかにインストールする
ことができるソフトウェアである。
ステップ403において、問い合わせストリングは事前に処理され、どのサー
チサーバが問い合わせ構文を理解できるかを決定する。このステップは、問い合
わせストリングのユニバーサルリソースロケータ(Universal Res
ource Locator)(URL)を検査し、どのサーバに問い合わせを
送るべきかを決定することによって実行される。一般に、問い合わせは、利用者
が情報を要求するサーバの特定の問い合わせ構文に翻訳する必要がある。通常、
問い合わせ翻訳プログラムは、問い合わせの要求を満たすためにサーバに対する
インタフェースを備える。
ステップ405において、問い合わせは、式を処理することができる各サーバ
に送信される。問い合わせは、連続して、または同時に送信することができる。
問い合わせを同時に送信する利点は、ネットワークおよび探索処理の両者の遅延
が減少することである。言い換えれば、すべてのサーバが問い合わせに応じて同
時に作動することができる。
ステップ407において、結果サイズしきい値によって、個別サーバは、特定
数の一致を収集するために、反復して問い合わされることを必要とする。大部分
のサーバは、所定の問い合わせのために使用されるリソースの量を制限するため
に、戻ってくる結果を幾つかの妥当なセットに分解して返信する。たとえば、探
索に対して100件の適合が存在する場合、サーバは、一時に10件の適合のみ
を送信するように設定することができる。それ故、特定数の一致に到達した場合
は、手順が進む。特定数の一致に到達しない場合は、サーバは特定の数に到達す
るまで反復して問い合わせを受ける。
ステップ409において、サーバーから戻る結果は、単独の結果セットに併合
される。結果は、結果の重複を除去することによって併合される。結果セットの
各項目は、ドキュメント(一つのURL)に対する参照およびできる限り1行の
記述テキストよりなる。
ステップ411において、利用者が結果セットの質をさらに向上させることを
望む場合は、利用者は、結果を知識ベースマッチャと比較することを要求するこ
とができる。それ以外の場合は、結果セットは利用者に対して表示される。
ステップ413において、結果セット中の各参照に対するドキュメントが検索
される。
ステップ415において、パターンマッチャーをドキュメントテキストに適用
し、テキストと一致する主題コンセプトが存在するかを決定する。
ステップ417において、ドキュメントのテキストに一致する主題コンセプト
のリストが生成される。
ステップ419において、コンセプトに一致する各ドキュメントに対して、イ
ンスタンスが生成される。
ステップ421において、ドキュメントに対するインスタンスが、知識ベース
の主題分類法によって分類される。
前述したステップ413−421の反復は、並行処理され、ネットワーク遅延
の影響を最小とする。その理由は、結果セットは、検索する必要がある数ダース
または数百のドキュメントを含むためである。
ドキュメントが検索され分類されるとき、本システムは、主題分類法のサブセ
ットによって、後処理された結果を図式で逐次表示する。この表示は、探索結果
を利用者に良く知られており意義のあるコンセプトに関する探索結果を類別し区
分するために、実施される。それ故、本発明による知識ベース表現システムを使
用することによって、探索結果は、利用者がどの程度特定の区分を望むかによっ
て、種々のレベルの詳細度においてブラウジングすることができる。
以上述べたことは、本発明の原理の応用を説明することのみを目的とする。当
業者は、本発明の理念および範囲から逸脱することなく、他の構造および方法を
具体化できる。DETAILED DESCRIPTION OF THE INVENTION
How to organize information retrieved from the Internet using a knowledge-based representation
Technical field
The present invention relates to a method for accessing information on the Internet, and in particular, to an interface.
To Organize Information Retrieved from Internet Using Knowledge Base Representation System
About.
Background of the Invention
The Internet is a series of interconnected networks that contain information, data,
Facilitates the exchange of data and files. Users connected to the Internet
These networks allow access to vast amounts of information. I
The usual way to gain access to the Internet is via an online service server
It is a method by. Referring to FIG. 1, networks 110, 112, and
And 114 are online service servers 120, 122 and 12 respectively.
4 is connected to the Internet 100. Access the internet
Another method is via a dial-in Internet provider.
For example, a user may use his modem 152 to connect to Internet provider 1
By dialing into 50, you can use your personal computer (PC)
On 158, the Internet 100 can be accessed. Router
Connects the computer to the network and routes traffic to the network and
Turn to the Internet. Routers 160, 162, 164, and 166
Inspect packets of data traveling across the network and the Internet
Determine where the data is going.
Using online service servers and internet providers
Thus, users are referred to as search engines 130, 132, 134, and 154.
Connect to worldwide networks using known software programs
The World Wide Web (Web)
Can be Search engines are search tools and web crawlers (Web cr
awlers). These search engines move across the web and
Web pages 140, 142, 144, and 156
-Gather documents by following text links.
One way to search the Internet is by keyword. And
For example, a user can query for a string of keywords that represent the information he or she wants.
Type in. Search engines search databases on the Internet
, The result is returned as a hypertext markup language (HTML) page
. The user then links the document of interest to the document.
You can see it by clicking on it. Click the cursor
Means that the mouse switch is operated according to the desired item.
You can search for keywords on the Internet with current search engines
However, the amount of information on the Internet is enormous, making it difficult to obtain reasonable information.
No. In other words, a keyword search usually returns a huge amount of information,
Users need to browse all to find relevant information. Accordingly
What is needed is a more efficient way to retrieve information from the Internet.
Summary of the Invention
The aforementioned problem of organizing information search results automatically categorizes search results
Knowledge-based representation (knowledge-based representation techniques)
Alleviated. This information search and management system is a knowledge base.
Source to a search server to improve the validity and accuracy of the search task. Knowledge
The knowledge base is a user profile that describes the interests and preferences of users in organizing information.
(Subject taxonomy). The system uses this knowledge base to
Organize the results of the search. This system automatically searches search results according to the knowledge base.
Classify and classify in order to facilitate searching for appropriate information. This system uses search results
Presented by a subset of the knowledge-based thematic taxonomy and the results
Segmentation in a way that makes it easier to find
You.
BRIEF DESCRIPTION OF THE FIGURES
FIG. 1 illustrates a computer and network for describing the operating environment of the present invention.
FIG. 2 is a diagram showing connections to the Internet.
FIG. 2 shows the knowledge representing a graphical representation of the concept comprehensive classification method according to the principles of the present invention.
It is a figure showing the example of a base browser.
FIG. 2a shows an actual screen display of the knowledge base browser illustrated in FIG.
It is.
FIG. 3 is a block diagram illustrating a search interface according to the principles of the present invention.
Figure 4 shows that a user retrieves information from the Internet and uses a knowledge base representation.
5 is a flowchart showing steps for organizing the information.
Detailed description of the invention
FIG. 1 is a diagram showing an environment relating to the present invention.
Interconnected networks 110, 112, and 114 and PC 158
And 159. These networks are, for example, token ring networks.
Network (network 114) or Ethernet (Ethernet) network.
Networked users (networks 110 and 112)
including. Each network further includes servers 120, 122 and 124
. The server is a host computer, and the user can access the network by the server.
Communicating with each other on the Internet and outside the network by the Internet
Can communicate with other users. Users on PCs 158 and 159
Subscribe to Internet provider 150 and use Internet provider
Can communicate with each other and with other users on the Internet.
Wear.
Any user can search for information available on the Internet
You. When a computer or network is connected to the Internet,
In this regard, the information on the computer or network, if not protected,
Made available by the person. The Internet is a worldwide network
Thus, the amount of information that can be searched is enormous. Many servers and providers have
And the search engines 130, 132, 134, and 154.
By using the gin, it is possible to search by keywords. these
The search engine is a computer program, and this program
An application-based program, an online service server 1
20, 122, 124 and running on Internet provider 150
. Keyword searches usually result in a huge return of information,
The user needs to browse the whole to obtain desired information.
Currently, there are two ways to explore the Internet. Both methods are client
/ Operated by the server model. Considered for the client / server model
You can run a piece of software on your own computer or
Executes the shared program of the server that is the
-Other users connected to the Internet). for example
For example, in FIG. 1, the user of the PC 110 a
And 124 and the Internet provider 150 to search for information.
Can be Similarly, the user of the PC 156 can use the online server 120,
Information can be searched by means of 22 and 124. Remote server, even if
For example, online servers 120, 122, and 124 and Internet
The provider 150 serves a large number of users of a large number of networks,
Also called strike. By using a host, many different clients
Can access their client resources simultaneously. host
Is not dedicated to a single user.
The first way to search the Internet is by index. Inn
Dex offers a highly structured method of information discovery. Use index
Users, for example, categorized as arts, computers, entertainment, sports, etc.
This allows you to browse the information thoroughly. Web browser
Normally, the user of the PC 110a uses his / her mouse 110b to perform a series of operations.
Can be displayed. For example, sports include baseball and basketball
Football, football, and the like. Depending on the size of the index,
There may be several layers in sub-classification. The sub that the user intends to use
When getting the categorization, the user is presented with a list of valid documents. these
To get the documents, the user clicks on links to these documents.
Click. Yahoo! is an Internet-based internet
It is the name of dex. Using Yahoo and other indices,
Type in a word that represents the information the user wants and search by that word
can do. Next, the user obtains a series of search results,
Get a link to the document that matches. To get information, the user
Click the link for the document.
A second way to find information is to use a search engine.
Engines are also known as search tools. Search engines are static in nature.
It operates on pre-built indexes. That is, the index is
Constructed from online content and stored on a search server. Web black
Are searched and indexed in the search server's database.
Used by search engines to collect online content
. Some popular Internet search engines are, for example, Lyco
s, WebCrawler, and Alta Vista. Open search
To begin, the user types in a keyword that represents the information he wants. search
The results obtained from and matching the user's search criteria are returned to the user. Results
From the list, the user can click on the link to the document
Thus, a document can be searched.
By using both an index and a search engine,
Information on the Internet can be obtained, but the information found is usually large
And it is often difficult to determine relevant information. Therefore,
In order for users to easily and sufficiently browse the search results and find valid information,
It is desirable to automatically categorize search results found on the Internet.
According to the present invention, a knowledge-based expression system expresses objects and infers relationships between objects.
The features discussed discuss alleviate the aforementioned problems. In particular, the present invention
For information retrieval and management systems, such as
The search quality on multimedia network systems such as Internet
. This system is suitable for individual users for information found on the Internet
To provide users with a means of organizing concepts to be
And access to information is improved. As shown in FIG.
Integrates with existing web browsers 130, 132, 134, and 154,
A system that combines hypertext browsing with concept navigation
Create a seamless environment. This system is a personal computer, for example,
It is also possible to store the data in the PC 110a.
Only users with access to the computer can use the system.
Wear.
FIG. 2 is a diagram showing an example of a knowledge base browser.
The graphical representation of the concept comprehensive classification method 200 is displayed. Taxonomy is a concept
It is a comprehensive hierarchy that expresses the relationship between them in a diagram. Concepts are abstract descriptions of objects.
You. The nodes in FIG. 2 correspond to a knowledge base concept (eg, 210, 22).
0, 230, 212, 214, etc.) and edges (eg, 210a
, 210b, 220a) connect the nodes and include the subsumption relations (subs
umption relationships). The feature of the present invention is that the system
And subsumption relations based on instances (270, 280)
It can be managed automatically. An instance is a specific realization of a concept.
That is, a concept is an abstract description of something, while its concept
Instance is a real object that satisfies the description. For example, a new
When a document is added to the Knowledge Base Browser as an instance,
The stem infers all positions belonging to the taxonomy.
The most common concept is on the left, as shown in FIG. A concept node
Tracking outgoing edges (from left to right) leads to a more specialized concept
. For example, the subject “Artificial Intelligence” 228 is a feature of “Computer Science” 220.
In particular, "knowledge representation" 229 is a specialization of "artificial intelligence" 228.
Panels 270 and 280 in this display are instances of these concepts.
Here is a list. For example, panel 270 shows the subject “pediatric care” 212
Indicates a document that is a stance. Panel 280 is the concept "Knowledge expression"
2
Shows 29 instances. Instances are always the parent concept of a higher hierarchy
Is inherited by, for example, the document
Events also emerge from "computer science." Organize instances
This method is described below with respect to the search interface. FIG. 2a shows the knowledge of FIG.
FIG. 5 is a diagram showing an actual screen display of an example of a base browser, and shows a concept integrated content;
FIG. 6 illustrates the class 200 and subsumption relationships between concepts and instances.
The search interface works similarly to the knowledge base browser interface.
You. The search interface uses the knowledge base to comprehensively classify user concepts.
By partitioning and categorizing the results with respect to the method, the quality of the search results is improved. Was
For example, the results from a keyword search are organized into a result set for display.
The system can then further summarize the result set
I will provide a. Improving the quality of the result set compared to the knowledge base is
Search for the document being processed and process it with the knowledge base pattern matcher.
Management. Textual patterns mapped to concepts in the knowledge base
By using a knowledge representation system, these documents can be
Can be categorized and organized within the Putt taxonomy. Each pattern in the knowledge base
, Can be associated with a concept. In other words, each document has these patterns
There is a concept that matches the document compared to the matcher
Is determined. The output of this comparison process is one of the concepts in the knowledge base.
A set of specific concepts that have some correspondence to the content of the document.
It is. Records of matches between concepts and documents are
Created in the knowledge base by generating a temporary instance containing the description of the
Is done. Finally, the enhanced search results are a subset of the knowledge-based subject taxonomy.
Graphically displayed by the This subset is generated during the matching process.
Formed by these concepts with one or more temporary instances
It is. This is shown in FIG. FIG. 3 shows that these match the content of the document.
Only the concept is shown.
The present invention uses a knowledge-based representation system for data organization,
This is particularly useful when the result is a large number of documents, such as thousands. Pattern
By running the installer on these documents,
Can be quickly aggregated into the most appropriate document for the user.
Therefore, the knowledge base representation system (browser and search in
Interface allows users to find relevant information quickly
Can be.
Another feature of taxonomies is that they group results according to concepts.
Users can take a close-up view of what they consider most relevant.
What you can do. This method further reduces browsing time.
To enhance your search on the Internet.
The search interface also maximizes query coverage and minimizes response delay.
Implement responsive, concurrent access to many index servers to keep
Run. Queries by explicitly expressing the capabilities of individual search engines
The system ensures that only those servers that can process the query
Guarantee to receive.
Another feature of the present invention is a user interface, which comprises:
Provides an editor for extending and reorganizing the concept hierarchy. User interface
Is a navigation block that holds an interactive schematic map of the navigation process.
Rausers are also provided. Navigation browser is a tree of the browsing process of the user
3 is a structural schematic representation. Next, the function of the navigation browser will be described. Profit
When browsing, the user must follow a regular order of the website
Generates a link and goes from one page to another. The user returns and the new
When selecting a new browsing, the browsing process becomes a branching tree. Navigation
The Gation Browser creates a new tree in the tree for every site / page visited.
And keep track of these selections. This tree is a browsing process
It is not only an overview, but an alternative to navigation (clicking a tree node
And return to the associated page).
Another feature of the present invention is that the system architecture uses a knowledge base for the client.
Separation from the client so that the user's information is independent of the client's location.
The ability to examine the news space consistently. Keep your knowledge base in one place
Environment allows the environment to move users from one platform to another.
Can be tracked on the form. The advantage of separation is continuous use of system servers
It is easier to guarantee the potential, because the separation allows the knowledge base
Is provided with shared access to
This is because even at one time, the task can be independently monitored. Paraphrase
The knowledge base could be stored on a separate server separate from the client
it can.
Referring to FIG. 4, this flowchart shows that a user can retrieve information from the Internet.
Searching and using the knowledge base representation according to the present invention to organize the information.
Show.
In step 401, the user inquires about a keyword that needs to be searched.
Input the string on the personal computer 110a,
A knowledge-based web browser 130 according to Ming is used. Knowledge Base Web Brow
Installs on either client 110a or server 120
Software that can.
In step 403, the query string is pre-processed and
Determine whether the query server understands the query syntax. This step is
String Universal Resource Locator (Universal Res
source Locator) (URL) and check which server
Performed by deciding what to send. In general, inquiries are made by the user
Needs to be translated into the specific query syntax of the server requesting the information. Normal,
The query translator sends a query to the server to satisfy the query request.
It has an interface.
In step 405, a query is made for each server that can process the expression.
Sent to. The queries can be sent sequentially or simultaneously.
The advantage of sending queries simultaneously is the delay in both the network and the discovery process.
Is to decrease. In other words, all servers respond to queries
Sometimes can be activated.
In step 407, the individual server is identified by the result size threshold.
It needs to be queried repeatedly to collect number matches. Most
Servers limit the amount of resources used for a given query
, And return the returned result in some reasonable set. For example,
If there are 100 matches for the search, the server will only allow 10 matches at a time
Can be set to be sent. Therefore, if a certain number of matches are reached
Goes the procedure. If the server does not reach a certain number of matches, the server
Inquired repeatedly.
In step 409, the results returned from the server are merged into a single result set
Is done. The results are merged by removing duplicate results. Result set
Each item is a reference to a document (one URL) and one line if possible.
Consists of descriptive text.
In step 411, it is necessary for the user to further improve the quality of the result set.
If desired, the user should request that the results be compared to a knowledge base matcher.
Can be. Otherwise, the result set is displayed to the user.
In step 413, a document is searched for each reference in the result set.
Is done.
Apply the pattern matcher to the document text in step 415
And determine if there is a subject concept that matches the text.
In step 417, a subject concept that matches the text of the document
Is generated.
In step 419, for each document that matches the concept,
Instance is created.
In step 421, the instance for the document is
Subject classification method.
The repetitions of steps 413-421 described above are processed in parallel, resulting in network delays.
Minimize the effect of The reason is that the result set needs to be searched
Or to include hundreds of documents.
When a document is searched and classified, the system uses a sub-set of the subject taxonomy.
The post-processed results are sequentially displayed graphically according to the data. This display shows the search results
Classify search results for concepts that are well known and meaningful to users.
Implemented to separate. Therefore, the knowledge base expression system according to the present invention is used.
By using the search results, the search results depend on how much the user wants a specific segment.
To browse at various levels of detail.
What has been described above is intended only to illustrate applications of the principles of the present invention. This
Those skilled in the art will recognize other structures and methods without departing from the spirit and scope of the invention.
Can be embodied.
─────────────────────────────────────────────────────
フロントページの続き
(81)指定国 EP(AT,BE,CH,DE,
DK,ES,FI,FR,GB,GR,IE,IT,L
U,MC,NL,PT,SE),CA,JP,MX
【要約の続き】
決定する。本システムは、コンセプトのインスタンスと
して、知識ベース表現システムにドキュメントを提供す
る。────────────────────────────────────────────────── ───
Continuation of front page
(81) Designated countries EP (AT, BE, CH, DE,
DK, ES, FI, FR, GB, GR, IE, IT, L
U, MC, NL, PT, SE), CA, JP, MX
[Continuation of summary]
decide. The system consists of a concept instance and
To provide documents to the knowledge base representation system
You.