JPH10222534A - 情報検索装置 - Google Patents

情報検索装置

Info

Publication number
JPH10222534A
JPH10222534A JP9041429A JP4142997A JPH10222534A JP H10222534 A JPH10222534 A JP H10222534A JP 9041429 A JP9041429 A JP 9041429A JP 4142997 A JP4142997 A JP 4142997A JP H10222534 A JPH10222534 A JP H10222534A
Authority
JP
Japan
Prior art keywords
information
document information
document
node
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP9041429A
Other languages
English (en)
Other versions
JP3632354B2 (ja
Inventor
Keiko Aoki
圭子 青木
Kazunori Matsumoto
一則 松本
Kazuo Hashimoto
和夫 橋本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
Kokusai Denshin Denwa KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kokusai Denshin Denwa KK filed Critical Kokusai Denshin Denwa KK
Priority to JP04142997A priority Critical patent/JP3632354B2/ja
Priority to EP04022290A priority patent/EP1486891A3/en
Priority to US09/022,280 priority patent/US6078913A/en
Priority to EP98301003A priority patent/EP0859330A1/en
Publication of JPH10222534A publication Critical patent/JPH10222534A/ja
Application granted granted Critical
Publication of JP3632354B2 publication Critical patent/JP3632354B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 ユーザの文書情報に対する漠然とした限定条
件であっても、適切な複数の文書情報を提供でき、かつ
該文書情報の中で追加及び更新があった際にリアルタイ
ムでユーザが知ることができる情報検索装置を提供す
る。 【解決手段】 文書情報のインデックス情報を、該文書
情報全体の類似度に基づいた階層的な木構造にクラスタ
リングするために、節点となる複数のノード情報を記憶
しており、該ノード情報には下層に位置する文書情報が
更新された際に通知すべき通知先情報を有しているクラ
スタデータベースを備えており、文書情報が更新される
際に、前記クラスタデータベースを用いて連鎖的にリン
クをたどる途中で遭遇するノード情報の通知先情報の通
知先へ、該文書情報が更新される旨を通知するように構
成されている。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、ネットワークに接
続された複数のコンピュータが有する文書情報を検索す
るための情報検索装置に関する。
【0002】
【従来の技術】複数のコンピュータが有する文書情報を
検索するための情報検索装置は、該文書情報のアドレス
等のページインデックス情報を記憶するコンテンツデー
タベースと、該コンテンツデータベースを用いて該文書
情報をキーワードによって検索する制御手段とを有して
いる。従来の情報検索装置の代表例としては、インター
ネットにおけるWWW(World Wide Web)の文書情報であ
るホームページを検索するサーチエンジンがある。以下
では、主にインターネット上での利用を例にとり説明し
ていく。
【0003】従来のサーチエンジンは、検索条件として
クライアントがキーワード等を指定し、対応するホーム
ページのアドレスを検索結果として応答するものであ
る。現在のところ検索される側のホームページの内容を
表すキーワードは、該ページの所有者によって予め登録
されたものであり、完全にページ内容を意味するもので
はない。また、クライアントからの要求に対して応答を
返すだけの完全なクライアント/サーバ関係であるため
に、所望のページが追加又は更新が行われても、再度、
該ページにアクセスしない限り、追加又は更新されたこ
とをユーザが知ることはできない。
【0004】
【発明が解決しようとする課題】最近のWWWの広がり
による膨大な数のホームページの中で、ユーザの所望す
るホームページを検索することは難しくなってきてい
る。その理由の1つは、従来のサーチエンジンが、キー
ワード別にホームページのURL(Uniform ResouceLoca
tor) を分類して記憶しているために、キーワード又は
その組み合わせによってしか検索できないことである。
現在のところ、ユーザは、比較的漠然とした限定条件し
か持っていない場合が多く、膨大な情報資源の中でキー
ワードだけに依存した探索的な情報検索を繰り返してい
る。なぜなら、同じキーワードを用いて検索された複数
のホームページには、内容的に全く類似性又は関連性が
ないからである。しかし、漠然とした限定条件であって
も、検索された複数のホームページが類似性や関連性を
持っているとすれば、比較的ユーザの所望するホームペ
ージが検索しやすくなるはずである。
【0005】更に、ユーザは、WWWという絶えず変化
を繰り返している膨大な情報資源中から、1つの漠然と
した限定条件の中だけの変化をリアルタイムに知りたい
場合もある。具体的には、類似性や関連性を有する複数
のホームページの中の追加及び更新をユーザにリアルタ
イムで通知することによって、該ユーザは所望のホーム
ページの変化を常に監視することができる。
【0006】従って本発明は、ユーザの文書情報に対す
る漠然とした限定条件であっても、適切な複数の文書情
報を提供でき、かつ該文書情報の中で追加及び更新があ
ったことをリアルタイムにユーザが知ることができる情
報検索装置を提供するものである。
【0007】
【課題を解決するための手段】本発明によれば、文書情
報を有する複数のコンピュータがネットワークに接続さ
れており、複数の該文書情報のインデックス情報を記憶
するコンテンツデータベースと、該コンテンツデータベ
ースを用いて該文書情報をキーワードによって検索する
制御手段とを有する情報検索装置であって、複数の文書
情報のインデックス情報を、該文書情報全体の類似度に
基づいた階層的な木構造にクラスタリングするために、
節点となる複数のノード情報を記憶しているクラスタデ
ータベースを備えており、該ノード情報には、下層に位
置する文書情報が更新された際に通知すべき通知先情報
を有しており、制御手段は、文書情報が更新される際
に、前記クラスタデータベースを用いて連鎖的にリンク
をたどる途中で遭遇するノード情報の通知先情報の通知
先へ、該文書情報が更新される旨を通知するように構成
されている情報検索装置である。
【0008】データベースの階層的な木構造のクラスタ
リングは、文書情報の構造及びキーワードの発生頻度か
ら重み付けにより算出される文書情報間の類似度に基づ
いて、類似する該文書情報同士を近くにリンクするよう
に構成されているために、文書情報の検索の高速化を計
ることができる。
【0009】データベースのノード情報には、文書情報
の構造とキーワードの発生頻度とから重み付けにより算
出される文書情報間の類似度に基づく頻度表を有するの
が好ましい。連鎖的にノードのリンクをたどっていく際
に、頻度表からキーワードを比較して類似度を求めるこ
とで、類似度の高いノードをたどることができる。
【0010】少なくとも1つの前記キーワードによって
検索する際に、該キーワードと前記頻度表とを比較しな
がら前記ノード情報のリンクをたどっていき、1つの該
ノード情報の下層に位置する複数の文書情報を検索結果
として通知することもできるので、検索結果として得ら
れた複数の文書情報が類似性及び関連性を持つ。
【0011】データベースのノード情報の通知先情報
は、ネットワーク内での固有アドレスのリストであって
もよい。直接、ユーザの固有アドレスへ、更新通知をす
ることが可能となる。
【0012】情報検索装置は、更に、個々のユーザ毎
に、該ユーザに関心のある文書情報のネットワーク内で
の固有アドレスのリストと、該固有アドレスの検索範囲
を示すドメインリストと、検索結果として表示する文書
情報の個数と、該ユーザのネットワーク内で固有のアド
レスとを含むユーザ情報データベースを備えており、ク
ラスタデータベースのノード情報の通知先情報がユーザ
毎の識別子であるのが好ましい。ユーザ毎に所望する限
定条件での検索が可能となる。
【0013】情報検索装置は、更に、前記ネットワーク
を介して自動的に前記文書情報を収集することができる
リソース発見エンジンを備えているのが好ましい。該情
報検索装置が自動的かつ不定期にネットワーク上の更新
された文書情報を検出して、ユーザに通知することが可
能となる。
【0014】
【発明の実施の形態】以下、図面を用いて本発明の実施
形態を詳細に説明する。
【0015】図1は、本発明の一実施形態における情報
検索装置の構成図である。インターネット11に接続さ
れた情報検索装置は、通常、情報検索サーバ12と位置
づけられる。インターネット11にはホームページを有
する膨大な数のコンピュータ3が接続されており、情報
検索サーバ12は該コンピュータ13の有する文書情報
の所在情報を収集している。該情報検索サーバ12は、
クライアント14に対して所望の文書情報のURLを検
索結果として提供するためのものである。
【0016】情報検索サーバ12は、クラスタデータベ
ース121、ユーザ情報データベース122、コンテン
ツデータベース123、制御手段124及びリソース発
見エンジン125を有している。コンテンツデータベー
ス123と、該コンテンツデータベース123を用いて
キーワードによって検索する制御手段124とは、従来
のサーチエンジンにも備えられていたものである。コン
テンツデータベース123には、ページのURL毎にペ
ージインデックス情報が記憶されている。該ページイン
デックス情報には、当該ホームページのタイトル、キー
ワードで表されたページ内容、及びページ内でリンクさ
れているURLリストが記憶されている。制御手段12
4は、クライアント4とのインタフェース制御、及びコ
ンテンツデータベース123内のぺ−ジインデックス情
報の検索を行う。従来のサーチエンジンは、クライアン
ト14から指定された検索キーワードによって、コンテ
ンツデータベース123の有するページインデックス情
報のタイトル及びページ内容とを比較して検索するもの
である。
【0017】コンテンツデータベース123は、更に、
リソース発見エンジン125に接続されている。通常、
ロボットと称されるリソース発見エンジン125は、イ
ンターネット1を介して自動的にページインデックス情
報を収集し、該ページインデックス情報をコンテンツデ
ータベース23に記憶させるものである。これにより、
ページの追加及び更新を自動的かつ不定期に検出するこ
とが可能となる。
【0018】制御手段124は、更に、クラスタデータ
ベース121にも接続されている。クラスタデータベー
ス121には、複数のページインデックス情報を、該文
書情報全体の類似度に基づく階層的な木構造にクラスタ
リングするために、節点となる複数のノード情報Nが記
憶されている。該ノード情報Nには、ノード毎に、頻度
表、ユーザ識別子リスト、並びに親ノード及び子ノード
を指示するポインタとが記憶されている。ぺ−ジインデ
ックス情報In に関係するノード情報Nnnの階層的な木
構造を表した樹系図が図2に示されている。
【0019】頻度表は、文書情報の構造とキーワードの
発生頻度とから重み付けにより算出され、該キーワード
を該文書情報の特徴を表す優先度順にリストしたもので
ある。該頻度表の作成手順は、最初に、例えば形態素解
析を用いて、ページの全テキストリソースから名詞及び
未定義語のキーワードに限定した切り出しを行う。次
に、ここで切り出されたキーワードに対して重み付けを
行い、優先度順にリストする。この時、キーワードの発
生頻度のみならず、HTML(Hypertext Makup Languag
e)テキストソースのタグ構造を考慮して重み付けするこ
とで、より文書情報の特徴を表した頻度表を作成するこ
とができる。常に上位のノード情報の頻度表は下位の複
数のノード情報の頻度表の総合的なものにする。このよ
うにして作られた頻度表は、該頻度表と検索キーワード
及び検索対象の頻度表とを比較しながら子ノードを選択
していくことで、類似度の高いクラスタを生成すること
ができる。より具体的な頻度表の作成フローについて
は、後で説明する。
【0020】ユーザ識別子リストには、当該ノード情報
の下層に位置するページインデックス情報のページが更
新された際に、通知すべきユーザ識別子のリストが記憶
されている。該ユーザ識別子は、後述するユーザ情報デ
ータベースのキーとなるものである。ユーザ情報データ
ベースの有利な機能を利用する必要がなければ、ユーザ
識別子の代わりに、直接ユーザの通知先アドレス即ちメ
ールアドレスを記憶してもよい。
【0021】親ノード及び子ノードを指示するポインタ
は、階層的な木構造のクラスタリングを実現する上では
必要なものである。子ノードは、左右2つのノードに分
けられており、両ノードの頻度表と類似度を比較しなが
らリンクをたどることができるようになる。
【0022】制御手段24は、更に、ユーザ情報データ
ベース22にも接続されている。該ユーザ情報データベ
ース22は、ノード情報Nのユーザ識別子リストに対応
する情報を記憶しているものである。ノード情報Nのユ
ーザ識別子が直接ユーザのメールアドレスであってもよ
いことは、既に述べた。しかし、種々のユーザ情報を別
に記憶していることで様々な有利なサービスを提供でき
るようになる。該ユーザ情報データベースは、個々のユ
ーザ毎に、該ユーザに関心のある複数のURL及びBook
markと、検索対象範囲を示すドメインリストと、検索結
果として表示するURLの個数と、該ユーザのメールア
ドレスとを含んでいる。特定のURL及びBookmarkを予
め指定することができることで、それに含まれるページ
に更新があった場合には、即時に更新があった旨をユー
ザに通知することができる。また、ドメインリストによ
って検索対象範囲を限定することができる。更に、検索
結果として表示するURLの個数もまた、検索における
無駄な負荷を省略するための利点である。
【0023】図3は、新しい文書情報が収集された場合
の、クラスタリングのフローチャートである。
【0024】リソース発見エンジン125によって、イ
ンターネット1を介して自動的にページインデックス情
報が収集され、該ページインデックス情報をコンテンツ
データベース23に記憶していく(31)。その際、更
新されたページがなければ(32)、何も処理を行う必
要はない。一方、更新されたページが存在すれば、クラ
スタデータベース121を用いて、該ぺージxについて
クラスタの更新(33)を行わなければならない。
【0025】更新されたページxが新たに収集された場
合(33)を考える。予め該ページx全体から頻度表t
x を作成(34)し、クラスタデータベース121にノ
ード情報Nx を確保して該頻度表tx を記憶する。次
に、ルートノード情報N0 から順に、左右の子ノード情
報の頻度表と追加されるページの頻度表tx とを比較し
て検索していく。
【0026】まず、現在の検索位置にあるノード情報N
y (最初はN0 )が子ノードを持つかどうか(35)を
判断する。子ノードを持っていなければ、ノード情報N
x は、ユーザ識別子リスト及びノードポインタを格納
(41)して、ノード情報Nyの子ノードとして追加
(42)される。このユーザ識別子リストのユーザは、
ノード情報Ny の下層に位置するページに関心を持つ者
である。
【0027】一方、現在の検索位置にあるノード情報N
y が子ノードを持っていれば、ノード情報Ny に登録さ
れているユーザ識別子リストをノード情報Nx のユーザ
識別子リストに追加する(36)。そして、ノード情報
x の頻度表tx と、ノード情報Ny の左右の子ノード
の頻度表ty_l 及びty_r とを比較して、どちらの子ノ
ードに類似しているかを判断する(37、38)。ノー
ド情報Ny は、類似している子ノードのリンクをたどっ
ていく(39、40)。これらの操作は、現在の検索位
置にあるノード情報Ny が子ノードを持たなくなるまで
繰り返される。そして、ノード情報Nx は、ユーザ識別
子リスト及びノードポインタを格納(41)して、ノー
ド情報Ny の子ノードとして追加(42)される。
【0028】最終的に、ノード情報Nx のユーザ識別子
リストに追加されてきたユーザ識別子に該当するユーザ
に当該ページが更新されたことを通知する。このように
して、当該ノードが更新される通知を必要とする全ての
ユーザに対して通知することができる。
【0029】次に、クラスタを用いてページインデック
ス情報を検索する場合を説明する。予めクライアント4
のユーザが指定してくる漠然とした限定条件の少なくと
も1つのキーワードを基にして、ルートノードから順に
子ノードの頻度表と比較しながら探索を進めていく。ノ
ード情報には下層に位置する子ノードのポインタが記憶
されているので、順に下層に向かって探索することが可
能とある。下層のページ数がユーザ所望の検索結果の数
になったところで、以下のページインデックス情報を検
索結果として通知することもできる。
【0030】以上詳細に説明した実施形態ではインター
ネットを例にとり説明したが、複数のコンピュータが接
続されたネットワーク上での文書情報の検索装置に対す
る適用において、本発明の技術思想及び見地の範囲の種
々の変更、修正及び省略は、当業者によれば容易に行う
ことができる。従って、前述した実施形態は、あくまで
例であって、何等制約しようとするものではない。本発
明は、特許請求の範囲及びその均等物として限定するも
のだけに制約される。
【0031】
【発明の効果】本発明によれば、複数の文書情報のイン
デックス情報を、該文書情報全体の類似度に基づいた階
層的な木構造にクラスタリングするためのクラスタデー
タベースを備えており、文書情報が更新される際に、連
鎖的にリンクをたどる途中で遭遇するノード情報の通知
先情報の通知先へ該文書情報が更新される旨を通知でき
るために、ユーザの文書情報に対する漠然とした限定条
件であっても、適切な複数の文書情報を提供でき、かつ
該文書情報の中で追加及び更新があった際にリアルタイ
ムでユーザが知ることができる。更に、本発明により、
今後増々膨大していくインターネット上のホームページ
に対して、最適な情報検索装置を提供することができ
る。
【図面の簡単な説明】
【図1】本発明の一実施形態における情報検索装置の構
成図である。
【図2】図1のクラスタデータベース内のクラスタリン
グを表す樹系図である。
【図3】図2のクラスタリングを生成するためのフロー
チャートである。
【符号の説明】
11 インターネット 12 情報検索装置、情報検索サーバ 121 クラスタデータベース 122 ユーザ情報データベース 123 コンテンツデータベース 124 制御手段 125 リソース発見エンジン 13 コンピュータ 14 クライアント

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 文書情報を有する複数のコンピュータが
    ネットワークに接続されており、複数の該文書情報のイ
    ンデックス情報を記憶するコンテンツデータベースと、
    該コンテンツデータベースを用いて該文書情報をキーワ
    ードによって検索する制御手段とを有する情報検索装置
    であって、 複数の前記文書情報のインデックス情報を、該文書情報
    全体の類似度に基づいた階層的な木構造にクラスタリン
    グするために、節点となる複数のノード情報を記憶して
    いるクラスタデータベースを備えており、該ノード情報
    には、下層に位置する文書情報が更新された際に通知す
    べき通知先情報を有しており、 前記制御手段は、前記文書情報が更新される際に、前記
    クラスタデータベースを用いて連鎖的にリンクをたどる
    途中で遭遇する前記ノード情報の前記通知先情報の通知
    先へ、該文書情報が更新される旨を通知するように構成
    されていることを特徴とする情報検索装置。
  2. 【請求項2】 前記データベースの前記階層的な木構造
    のクラスタリングは、前記文書情報の構造及びキーワー
    ドの発生頻度から重み付けにより算出される文書情報間
    の類似度に基づいて、類似する該文書情報同士を近くに
    リンクするように構成されていることを特徴とする請求
    項1に記載の情報検索装置。
  3. 【請求項3】 前記データベースの前記ノード情報は、
    前記文書情報の構造とキーワードの発生頻度とから重み
    付けにより算出される文書情報間の類似度に基づいて、
    キーワードの優先度順にリストされた頻度表を有してい
    ることを特徴とする請求項1又は2に記載の情報検索装
    置。
  4. 【請求項4】 少なくとも1つの前記キーワードによっ
    て検索する際に、該キーワードと前記頻度表とを比較し
    ながら前記ノード情報のリンクをたどっていき、1つの
    該ノード情報の下層に位置する複数の文書情報を検索結
    果として通知することを特徴とする請求項3に記載の情
    報検索装置。
  5. 【請求項5】 前記データベースの前記ノード情報の前
    記通知先情報は、前記ネットワーク内での固有のアドレ
    スであることを特徴とする請求項1から4のいずれか1
    項に記載の情報検索装置。
  6. 【請求項6】 前記情報検索装置は、更に、個々のユー
    ザ毎に、該ユーザに関心のある文書情報の前記ネットワ
    ーク内での固有アドレスのリストと、該固有アドレスの
    検索範囲を示すドメインリストと、検索結果として表示
    する文書情報の個数と、該ユーザの前記ネットワーク内
    での固有のアドレスとを含むユーザ情報データベースを
    備えており、 前記クラスタデータベースの前記ノード情報の前記通知
    先情報が前記ユーザ毎の識別子であることを特徴とする
    請求項1から4のいずれか1項に記載の情報検索装置。
  7. 【請求項7】 更に、前記ネットワークを介して自動的
    に前記文書情報を収集することができるリソース発見エ
    ンジンを備えていることを特徴とする請求項1から6の
    いずれか1項に記載の情報検索装置。
JP04142997A 1997-02-12 1997-02-12 情報検索装置 Expired - Fee Related JP3632354B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP04142997A JP3632354B2 (ja) 1997-02-12 1997-02-12 情報検索装置
EP04022290A EP1486891A3 (en) 1997-02-12 1998-02-11 Document retrieval apparatus
US09/022,280 US6078913A (en) 1997-02-12 1998-02-11 Document retrieval apparatus
EP98301003A EP0859330A1 (en) 1997-02-12 1998-02-11 Document retrieval apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP04142997A JP3632354B2 (ja) 1997-02-12 1997-02-12 情報検索装置

Publications (2)

Publication Number Publication Date
JPH10222534A true JPH10222534A (ja) 1998-08-21
JP3632354B2 JP3632354B2 (ja) 2005-03-23

Family

ID=12608133

Family Applications (1)

Application Number Title Priority Date Filing Date
JP04142997A Expired - Fee Related JP3632354B2 (ja) 1997-02-12 1997-02-12 情報検索装置

Country Status (1)

Country Link
JP (1) JP3632354B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000276279A (ja) * 1999-03-25 2000-10-06 Seiko Epson Corp 電子表示制御装置およびその方法並びに記録媒体
JP2001054090A (ja) * 1999-08-09 2001-02-23 Fujitsu Ltd 情報受信装置および情報受信プログラムを記録したコンピュータ読み取り可能な記録媒体
WO2001018686A1 (en) * 1999-08-03 2001-03-15 Huh Haeng Yang Information acquisition method in internet and computer readable medium for storing program for carrying out the method
US7089268B2 (en) 2001-05-14 2006-08-08 Hitachi, Ltd. Document management method and document management system
JP2014149564A (ja) * 2013-01-31 2014-08-21 International Business Maschines Corporation 情報処理装置、情報処理方法及びプログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04127370A (ja) * 1990-09-19 1992-04-28 Toshiba Corp 情報収集システム
JPH0749875A (ja) * 1993-08-06 1995-02-21 Hitachi Ltd 文書情報分類方法およびそれを用いた文書情報収集方法、文書情報収集システム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04127370A (ja) * 1990-09-19 1992-04-28 Toshiba Corp 情報収集システム
JPH0749875A (ja) * 1993-08-06 1995-02-21 Hitachi Ltd 文書情報分類方法およびそれを用いた文書情報収集方法、文書情報収集システム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000276279A (ja) * 1999-03-25 2000-10-06 Seiko Epson Corp 電子表示制御装置およびその方法並びに記録媒体
WO2001018686A1 (en) * 1999-08-03 2001-03-15 Huh Haeng Yang Information acquisition method in internet and computer readable medium for storing program for carrying out the method
JP2001054090A (ja) * 1999-08-09 2001-02-23 Fujitsu Ltd 情報受信装置および情報受信プログラムを記録したコンピュータ読み取り可能な記録媒体
US7089268B2 (en) 2001-05-14 2006-08-08 Hitachi, Ltd. Document management method and document management system
JP2014149564A (ja) * 2013-01-31 2014-08-21 International Business Maschines Corporation 情報処理装置、情報処理方法及びプログラム
US10169393B2 (en) 2013-01-31 2019-01-01 International Business Machines Corporation Tracking changes among similar documents

Also Published As

Publication number Publication date
JP3632354B2 (ja) 2005-03-23

Similar Documents

Publication Publication Date Title
US7552109B2 (en) System, method, and service for collaborative focused crawling of documents on a network
US6321228B1 (en) Internet search system for retrieving selected results from a previous search
US6516312B1 (en) System and method for dynamically associating keywords with domain-specific search engine queries
US8972371B2 (en) Search engine and indexing technique
US5920859A (en) Hypertext document retrieval system and method
US7499965B1 (en) Software agent for locating and analyzing virtual communities on the world wide web
US20080065632A1 (en) Server, method and system for providing information search service by using web page segmented into several inforamtion blocks
KR19980701598A (ko) 정보 액세스 방법 및 시스템(methods and/or systems for acessing informatiom)
US9275145B2 (en) Electronic document retrieval system with links to external documents
JP4769822B2 (ja) ページグループを用いた情報検索サービス提供サーバー、方法及びシステム
JP2000508450A (ja) インターネットから検索される情報を知識ベース表現を使用して編成する方法
WO2006107141A1 (en) Server, method and system for providing information search service by using sheaf of pages
Duhan et al. A novel approach for organizing web search results using ranking and clustering
WO1997049048A1 (en) Hypertext document retrieval system and method
KR100445943B1 (ko) 근접 검색식을 이용한 정보 검색 시스템 및 방법
JP3632354B2 (ja) 情報検索装置
Li et al. Research on web mining-based intelligent search engine
Liu et al. Digging for gold on the Web: Experience with the WebGather
KR20030051577A (ko) 검색사이트의 검색결과 표시방법
US20060059126A1 (en) System and method for network searching
JP3586272B2 (ja) サーチエンジン、検索システム、および記憶媒体
JP2003186901A (ja) Webサイト検索方法とシステム、並びに、この方法の実行プログラムとこの方法の実行プログラムを記録した記録媒体
Gong et al. An implementation of web image search engines
JPH11265402A (ja) データ処理システム及びデータ処理システムを制御するプログラムを記録した記録媒体
Ceric New methods and tools for the World Wide Web search

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040608

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040714

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040817

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040929

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20041130

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20041213

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees