JPH10240757A - 協調分散検索システム - Google Patents

協調分散検索システム

Info

Publication number
JPH10240757A
JPH10240757A JP9043295A JP4329597A JPH10240757A JP H10240757 A JPH10240757 A JP H10240757A JP 9043295 A JP9043295 A JP 9043295A JP 4329597 A JP4329597 A JP 4329597A JP H10240757 A JPH10240757 A JP H10240757A
Authority
JP
Japan
Prior art keywords
search
search system
information
www
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9043295A
Other languages
English (en)
Inventor
Katsuro Kikuchi
克朗 菊地
Chisato Konno
千里 金野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP9043295A priority Critical patent/JPH10240757A/ja
Publication of JPH10240757A publication Critical patent/JPH10240757A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 ネットワークを介して他の情報処理装置上の
情報を検索する際に、情報転送でネットワークのトラフ
ィックの増加が問題となっている。 【解決手段】 任意の検索システムに対して、ネットワ
ーク上の検索範囲を予め設定しておき、各検索システム
が、担当の検索範囲内のインデックスデータを管理し、
かつ、他の検索システムと協調して検索を行う協調分散
検索システムを提供する。 【効果】 上記課題が解決されトラフィックの増加を抑
えることができるとともに、個々の検索システムで高速
かつ大規模なデータベースシステムを必要とせず、シス
テムの効率的な運用が可能になる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】ネットワーク上に広がるハイ
パーメディア情報の検索システムのうち、予めハイパー
メディア情報を収集し、検索用のキーとそのハイパーメ
ディア情報の所在を示すリンク等の検索インデックスデ
ーターベースを作成しておく検索システム、更には複数
の協調動作する検索システムから構成される検索システ
ムに関する。
【0002】
【従来の技術】1989年、スイスの欧州素粒子物理学研究
所(以下、CERN)によってネットワーク透過なハイパー
メディアシステムであるワールド・ワイド・ウェブ(Wo
rld Wide Web、以下、WWW)がインターネット上で開発
された。さらに、米イリノイ大学のNational Center fo
r Supercomputing Applications(以下、NCSA)におい
て、WWW上のハイパーメディア情報(以下、WWWページ)
をマウス操作で簡単にブラウジング可能なブラウザ(NC
SA Mosaic)が1993年2月に開発された。その後、WWWシ
ステムの持つ情報発信の容易さ、ブラウザによる情報取
得の容易さ及びインターネットによる広大なデータベー
ス空間等の背景により、企業や一般ユーザーをも巻き込
みWWW及びインターネットが爆発的に普及しつつある。
最近においては、イントラネットと呼ばれるインターネ
ット技術やWWW技術を用いた社内情報網を構築する例も
多くみられている。
【0003】WWWの普及と共に、WWW上の情報を検索する
ニーズが高まっていった。これに答える形で、大学や企
業による検索サービスが行われるようになってきた。WW
Wにおける検索においては、WWWシステムの性格上、ユー
ザーの検索要求に対して、そのつど、ネットワークに点
在するWWWページ群から検索することは、事実上不可能
といえる。これに対して、予めWWWページを収集し、検
索用のキーとそのWWWページの所在を示すリンク等の検
索インデックスデーターベースを作成しておき、検索の
際には、このインデックスデータベースに対して検索を
かけるといった方法が一般的行われている。
【0004】
【発明が解決しようとする課題】従来では、ネットワー
クに接続された情報処理装置において、自身の情報処理
装置及び他の情報処理装置の保有するWWWページを検索
する検索システムでは、予め検索対象とするWWWページ
を収集し、検索用のキーとそのWWWページの所在を示す
リンク等の検索インデックスデーターベースを作成して
おき、検索は、このインデックスデータベースに対して
行われている。インターネット上で不特定多数のユーザ
ーに対して検索サービスを行うには、様々な分野のあら
ゆるWWWページを収集、インデックシングしておく必要
がある。しかしながら、現状では、WWWページの収集の
際には、複数のネットワークをまたがってWWWページの
転送が行われるためネットワークに多大なトラフィック
の負担をしいることになっている。また、不特定多数の
ユーザーの要求に答える必要から、ひとつの検索システ
ムを構築する情報処理装置上で、あらゆる分野の情報を
格納する必要がある。このため、高速で大規模なデータ
ベースシステムを必要とするといった問題があった。
【0005】本発明の目的は、ネットワークのトラフィ
ックを減らし、多数のユーザからの検索を実行可能な検
索システムを提供することにある。さらには、検索シス
テムに用いられるデータベースを効率的に運用するシス
テムの構成を提供することにある。
【0006】
【課題を解決するための手段】上記目的を達成するため
に、本発明の協調分散検索システムは、ネットワーク上
に広がるハイパーメディア情報の検索システムのうち、
ネットワーク上のハイパーメディア情報を直接検索する
のではなく、予めハイパーメディア情報を収集し、検索
用のキーとそのハイパーメディア情報の所在を示すリン
ク等の検索インデックスデーターベースを作成しておく
検索システムに関して、互いに協調動作する複数の検索
システムが検索範囲を分担し、各検索システムは、個々
の検索範囲内のみの検索用インデックスデータの作成す
る構成を有する。この構成により、インデックスデータ
ベース作成の際に生じるネットワーク負荷や分散検索に
よる高速な検索を行う。
【0007】
【発明の実施の形態】以下、図1〜図8を用いて本発明
の実施例を説明する。
【0008】始めに、図1と図2を用いて本発明の概要
を説明する。本実施例では、簡単のため2つの検索シス
テムを用いた場合を想定する。
【0009】本発明では、WWWの情報空間全体106をWW
Wページ101のドメイン・ネーム・スペースや情報の分
野等により、分割分類(104、105)し、分割された部分
空間を個々の検索システム100に割り当てる。ここで検
索システム1は、図1における検索処理を実際に行う情
報処理装置100と、情報処理装置に接続されて割り当て
られたWWWページ4及びWWWページ5とWWWページ4、5のイ
ンデックスを保持するデータベース(DB2、107)とから
なるシステムを示すものとする。本実施例では、検索シ
ステム1は、WWWページ1、WWWページ2及びWWWページ
3が検索範囲となり、検索システム2は、WWWページ4
及びWWWページ5が検索範囲となる。この場合、検索シ
ステム1のインデックスデーターベースDB1には、WWW
ページ1、2、3について内容を解析し、インデックス
情報を抽出したものが格納され、検索システム2のイン
デックスデーターベースDB2には、WWWページ4、5に
ついて内容を解析し、インデックス情報を抽出したもの
が格納される。DB1、DB2等のインデックスデータベース
107には、検索インデックスとなるキーワード108、キー
ワードを含むWWWページへのリンクを示すURL(Uniforme
d Resource Location)109が格納されている。また、WW
Wページのタイトルや要約等の付加情報110がある場合も
ある。
【0010】ユーザー201が検索を行う場合を図2を用
いて示す。図2において、ユーザ201は、分割された検
索空間のうちのいずれかの検索システムにアクセスす
る。検索システムにアクセスするとは、検索システムの
インターフェースがWWWページとして構築されている場
合には、NCSAのMosaic等のWWWブラウザで(検索システ
ムの)検索用WWWページにアクセスすることにより行
う。言い換えると、検索システムにアクセスするとは、
検索用WWWページが存在しその検索を行う情報処理装置
にアクセスすることでもある。また、検索システムとユ
ーザーサイドの検索クライアントシステムが独自のもの
であっても良い。ここでは、ユーザは検索システム1に
アクセスしたものとする。アクセス後、ユーザー201か
ら検索の依頼を受ける(202)と検索システム1では、
他の検索システム(検索システム2)にも同様に検索を
依頼する(203)。検索を依頼された検索システム1及
び検索システム2では、ユーザーの入力したキーワード
を検索キーとして、あらかじめ作成されている検索用イ
ンデックスデータベース107から該当するWWWページの情
報を検索する(205)。検索された結果は、WWWページの
記述言語であるHTML(Hyper Text Makeup Language)フ
ァイルとして生成され、検索要求を受けた検索システム
(本実施例では、検索システム1)に送信する(20
4)。なお、検索システムとユーザーサイドの検索クラ
イアントシステムが独自のプロトコルを用いる場合に
は、そのプロトコルにて送信しても良い。ユーザーから
検索要求を受けた検索システム(本実施例では、検索シ
ステム1)は、他の検索システムから送られてきた検索
結果をユーザーに提示する(205)。提示する際には、
それぞれの検索システム100の検索結果を受け取った順
に提示する、もしくは、いったんユーザーがアクセスし
た検索システム(本実施例では、検索システム1)で検
索結果を集計し、スコアリングでのソート等の加工を行
い提示する。ここで、スコアリングとは、WWWページが
どれだけ検索キーにマッチしているかを示す指標であ
る。以上が本発明の概要である。
【0011】次に、検索システム100の検索範囲の決定
の方法について図3〜図8を用いて説明する。検索範囲
の分割例を、図3に示す。図3(a)はWWWページのドメ
イン・ネーム・スペースで分割する。図3(b)はWWWペ
ージの内容の分野で分割する。また、図3(c)はサブ
ネットワーク単位により分割している。図3に示す分割
は例であり、他の形態を排除するものではない。
【0012】以下、順に検索範囲の決定について説明す
る。
【0013】検索範囲の決定は、静的に行うのではな
く、WWWページを芋ずる式にたぐり寄せながらインデッ
クスデータベースを作成するのと同時に動的に決定して
いく。動的な検索範囲の決定は、基本的には以下の1〜
4の流れで行う。(ただし、(b)については、多少異
なる。) 1.WWWページの取得 2.1で取得したWWWページのインデックス情報を作成 3.1で取得したWWWページに含まれる他のWWWページへ
のリンク情報の抽出 4.3で抽出したリンク先について、自検索システムの
検索範囲でない場合担当の検索システムに委譲 初めに検索システムの構成を図4の機能ブロック図を用
いて説明する。本発明の検索システムすなわち検索を行
う情報処理装置は、自検索システムに割り当てられた空
間にあるWWWページの解析やWWWページの取得を行うDB作
成部402、WWWページのインデックス情報を格納するイン
デックスデーターベース107、DB作成部が初めに取得す
るWWWページを格納したWWWページリスト400、他の検索
システムから他の検索空間にあるWWWページの情報の委
譲を受け付ける検索範囲追加部401及びインデックスデ
ーターベース107の検索を行う検索部403によって構成さ
れる。DB作成部402は、初めに、WWWページリスト400を
元に、WWWページ取得の起点となるWWWページを取得す
る。その後、WWWページの内容を解析してインデックス
データーベースに追加し、そのWWWページ内に含まれる
他のWWWページへのリンク情報から新たにWWWページを取
得する。以下、新たなWWWページへのリンクがなくなる
か、もしくは、リンクの深さの制限を設定した場合にそ
の制限に達するまで、該当するWWWページの解析、新た
なWWWページの取得を繰り返す。これを起点となるWWWペ
ージがなくなるまで繰り返す。本発明においては、これ
に加えて、取得するWWWページが自検索システムの検索
範囲でない場合、他の検索システムに、そのWWWページ
の委譲を行う。これにより検索範囲の動的な決定を行
う。検索範囲追加部401では、他の検索システムからのW
WWページの情報の委譲を受け付ける。委譲を受け付ける
と、インデックスデータベース107に委譲を受けたWWWペ
ージの情報が入っていないことを確認した後、WWWペー
ジリスト400に追加する。委譲を受け付けたWWWページの
情報がインデックスデータベース107にすでに格納され
ている場合には、そのWWWページの情報を廃棄する。検
索部403は、ユーザーの入力したキーワードを検索キー
としてインデックスデータベース107を検索する。検索
された結果は、ユーザーがアクセスした検索システムに
転送される。ユーザーのアクセスした検索システムの検
索部403では、他の検索システムの結果と自検索部の検
索結果をそれぞれユーザーに提示する。
【0014】次に図3で示した、3つの検索範囲の動的
な決定について流れ図を用いてそれぞれ詳細に説明す
る。
【0015】初めに図3(a)のドメイン・ネーム・ス
ペースに基づく検索範囲の分割について図5を用いて説
明する。図5(a)がDB作成部402、図5(b)が検索範
囲追加部401のの処理の流れについてそれぞれ示してい
る。先ほど説明したとおり、DB作成部402では、順次起
点となるWWWページをWWWページリストを元に取得し、そ
れを起点として芋づる式にWWWページを取得しながらイ
ンデックスデータベースの作成を行う。WWWページの芋
づる式の取得(508)は、取得しようとするWWWページが
新たなWWWページかつ、起点のWWWページからのリンクの
深さがあらかじめ設定された値以下の間続ける(50
2)。WWWページ取得後には、WWWページの内容を解析し
インデックスデーターベース107へのインデックス情報
の追加(503)、他のWWWページへのリンク情報の取得
(504)が行われる。ついで、504において取得したリン
ク情報が自検索システムの検索範囲であるがどうかを検
査する(505)。この検査は、図6に示したテーブルを
参照することにより行う。自検索システムの担当外だっ
た場合、図6のテーブルから該当する検索システムを探
し出し、そのWWWページの委譲を行う(506)。なお、こ
の委譲は、本DB作成部のインデックス作成が終わるまで
テーブルに保存しておき、最後にまとめて該当する検索
システムにおくるよう構成することも可能である。検索
範囲の決定処理(505、06)終了後、自検索システムの
検索範囲に該当し、かつ、インデックスデータベース10
7に格納されていないWWWページを取得し、503からの処
理を繰り返す。以上がDB作成部の処理の流れである。
【0016】次に検索範囲追加部401の処理の流れにつ
いて説明する。検索範囲追加部では、他の検索システム
からの委譲の依頼を委譲を受け付けた場合(521)、委
譲されたWWWページを起点WWWページリスト400へ追加す
ることを試みる。この場合、委譲を受けたWWWページの
情報がインデックスデータベース107に入っていないこ
とを確認し(522)、入っていなければ起点WWWページリ
ストに追加する(523)。委譲を受け付けたWWWページの
情報がインデックスデータベース107にすでに格納され
ている場合には、そのWWWページを廃棄する(524)。以
上が検索範囲追加部の処理の流れである。
【0017】次に、図3(b)のWWWページの内容の分野
毎に検索範囲を分割する方法について図7を用いて説明
する。
【0018】図7(a)がDB作成部402の処理の流れ、図
7(b)が検索システムの担当分野が格納されたテーブ
ルである。DB作成部402では、順次起点となるWWWページ
をWWWページリストを元に取得し、それを起点として芋
づる式にWWWページを取得しながらインデックスデータ
ベースの作成を行う。WWWページの芋づる式の取得(70
9)は、取得しようとするWWWページが新たなWWWページ
かつ、起点のWWWページからのリンクの深さがあらかじ
め設定された値以下の間続ける(702)。WWWページ取得
後には、検索範囲の判定のため、WWWページの分野の分
類を行う(703)。これは、例えば、WWWページのインデ
ックス解析と同様にWWWページに含まれる単語を切り出
し、切り出した単語について辞書を参照し、分野付けを
行い、出現頻度の高い分野に分類するといった方法を用
いる。なお、本発明では、この分類の方法に依らない。
ついで、703において取得した分野情報が自検索システ
ムの検索範囲であるがどうかを検査する(704)。この
検査は、図7(b)に示したテーブルを参照することに
より行う。自検索システムの担当外だった場合、図7
(b)のテーブルから該当する検索システムを探し出
し、そのWWWページの委譲を行う(705)。なお、この委
譲は、本DB作成部のインデックス作成が終わるまでテー
ブルに保存しておき、最後にまとめて該当する検索シス
テムにおくるよう構成することも可能である。WWWペー
ジが自検索システムの担当出ある場合には、WWWページ
の内容を解析しインデックスデーターベース107へのイ
ンデックス情報の追加(706)、他のWWWページへのリン
ク情報の取得(707)を行う。その後、取得したリンク
情報のうち、自検索システムの検索範囲に該当し、か
つ、インデックスデータベース107に格納されていないW
WWページを取得し、703からの処理を繰り返す。以上がD
B作成部の処理の流れである。
【0019】次に検索範囲追加部401の処理の流れにつ
いて説明する。検索範囲追加部については、ドメイン・
ネーム・スペースによる分割と同様な処理を行う(図5
(b))。
【0020】次に、図3(b)のWWWページの内容の分
野毎に検索範囲を分割する方法について図7を用いて説
明する。
【0021】次に図3(c)のサブネットワークに基づ
く検索範囲の分割について図8を用いて説明する。図8
(a)がDB作成部402の処理の流れ、図8(b)が検索シ
ステムの担当サブネットワークが格納されたテーブルで
ある。DB作成部402では、順次起点となるWWWページをWW
Wページリストを元に取得し、それを起点として芋づる
式にWWWページを取得しながらインデックスデータベー
スの作成を行う。WWWページの芋づる式の取得(808)
は、取得しようとするWWWページが新たなWWWページか
つ、起点のWWWページからのリンクの深さがあらかじめ
設定された値以下の間続ける(802)。WWWページ取得後
には、WWWページの内容を解析しインデックスデーター
ベース107へのインデックス情報の追加(803)、他のWW
Wページへのリンク情報の取得(804)が行われる。つい
で、804において取得したリンク情報が自検索システム
の検索範囲であるがどうかを検査する(805)。この検
査は、図8(b)に示したテーブルを参照することによ
り行う。自検索システムの担当外だった場合、図8
(b)のテーブルから該当する検索システムを探し出
し、そのWWWページの委譲を行う(806)。なお、この委
譲は、本DB作成部のインデックス作成が終わるまでテー
ブルに保存しておき、最後にまとめて該当する検索シス
テムにおくるよう構成することも可能である。検索範囲
の決定処理(805、806)終了後、自検索システムの検索
範囲に該当し、かつ、インデックスデータベース107に
格納されていないWWWページを取得し、803からの処理を
繰り返す。以上がDB作成部の処理の流れである。
【0022】検索範囲追加部401では、ドメイン・ネー
ム・スペースによる分割と同様な処理を行う(図5
(b))。
【0023】
【発明の効果】本発明によれば、検索すべきWWW上の情
報空間を複数に分割し、分割された空間毎に検索システ
ムを配置する。分散した検索システムをネットワークに
分散配置されるため、インデックスデータベース作成の
ためのネットワークトラフィック量の削減が可能とな
る。また、個々の検索システムにそれぞれ独立のユーザ
ー層を想定することにより、データーベースシステムの
効率的な運用が可能となる。
【図面の簡単な説明】
【図1】本発明の概要を示す図。
【図2】ユーザー201が検索を行う場合の説明図。
【図3】検索範囲の分割例示す図。
【図4】検索システムの機能構成図。
【図5】ドメイン・ネーム・スペースに基づく検索範囲
の分割の処理の手順を示す図。
【図6】リンク情報が自検索システムの検索範囲である
がどうかを検査する際に参照するテーブル。
【図7】WWWページの内容の分野毎に検索範囲を分割す
る処理の手順を示す図。
【図8】サブネットワークに基づく検索範囲の分割の処
理の手順を示す図。
【符号の説明】
100…検索システム装置 101…WWWページ 102…WWWページへのリンク 107…インデックスデータベース。

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】ネットワーク上のハイパーメディア情報を
    予め収集し、検索用のキーとそのハイパーメディア情報
    の所在を示すリンクを有する検索インデックスデーター
    ベースを用いて該ハイパーメディア情報を検索する検索
    システムであって、上記ネットワーク上で分割された検
    索範囲のそれぞれを割り当てられた複数の検索システム
    で、該検索システムが個々の検索範囲内のみの検索用イ
    ンデックスデータを有することを特徴とする協調分散検
    索システム。ハイパーメディア情報を直接検索するので
    はなく、
  2. 【請求項2】請求項1の検索範囲は、ハイパーメディア
    情報の所在を示すドメイン・ネーム・スペース等の階層
    的なネーム・スペース空間を基に分割されていることを
    特徴とする協調分散検索システム。
  3. 【請求項3】請求項1の検索範囲は、ハイパーメディア
    の内容の分野毎に分割されていることを特徴とする協調
    分散検索システム。
  4. 【請求項4】請求項1の検索範囲は、ハイパーメディア
    情報が点在するネットワークを、サブネットワーク単位
    により分割されていることを特徴とする協調分散検索シ
    ステム。
  5. 【請求項5】請求項1において自分の担当する検索範囲
    の中に他の検索システムに割り当てられた検索範囲に存
    在するハイパーメディア情報そのものもしくはハイパー
    メディア情報へのリンクが存在する場合には、該ハイパ
    ーメディア情報を上記他の検索システムに委譲すること
    を特徴とする協調分散検索システム。
  6. 【請求項6】請求項1において、ユーザから検索要求を
    受信した検索システムは、他の検索システムにユーザか
    ら受信したものと同様の検索要求を出し、検索要求を受
    け取ったそれぞれの検索システムは、それぞれ自検索イ
    ンデックスデータベースから検索を行い、検索結果をユ
    ーザがアクセスした検索システムに回答し、ユーザがア
    クセスした検索システムでは、他の検索システムから送
    られてくる検索結果をユーザに提示することを特徴とす
    る協調分散検索システム。
  7. 【請求項7】請求項6において、他の検索システムから
    送られてくる検索結果を一旦格納し、スコアリングでの
    ソート等の加工を行い、ユーザーに提示することを特徴
    とする協調分散検索システム。
  8. 【請求項8】請求項6において、ユーザーが検索を実行
    する際、検索範囲の絞り込みに任意のドメイン情報を用
    いることを特徴とする協調分散検索システム。
  9. 【請求項9】請求項6において、ユーザーが検索を実行
    する際、検索範囲の絞り込みに任意の分野情報を用いる
    ことを特徴とする協調分散検索システム。
  10. 【請求項10】請求項6において、ユーザーが検索を実
    行する際、検索範囲の絞り込みに任意のサブネット情報
    を用いることを特徴とする協調分散検索システム。
JP9043295A 1997-02-27 1997-02-27 協調分散検索システム Pending JPH10240757A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9043295A JPH10240757A (ja) 1997-02-27 1997-02-27 協調分散検索システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9043295A JPH10240757A (ja) 1997-02-27 1997-02-27 協調分散検索システム

Publications (1)

Publication Number Publication Date
JPH10240757A true JPH10240757A (ja) 1998-09-11

Family

ID=12659806

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9043295A Pending JPH10240757A (ja) 1997-02-27 1997-02-27 協調分散検索システム

Country Status (1)

Country Link
JP (1) JPH10240757A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006500831A (ja) * 2002-09-18 2006-01-05 スカイリス・ネットワークス・インコーポレーテッド 全地球的にアドレス可能なオブジェクト及び関連するビジネスモデルの経路設定及び索引付けを行うためのシステム、方法及びプログラミング
JP2006107446A (ja) * 2004-09-30 2006-04-20 Microsoft Corp ネットワーク・ドキュメントのバッチ索引付けのためのシステムおよび方法
US8843486B2 (en) 2004-09-27 2014-09-23 Microsoft Corporation System and method for scoping searches using index keys
US9348912B2 (en) 2007-10-18 2016-05-24 Microsoft Technology Licensing, Llc Document length as a static relevance feature for ranking search results
US9495462B2 (en) 2012-01-27 2016-11-15 Microsoft Technology Licensing, Llc Re-ranking search results

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006500831A (ja) * 2002-09-18 2006-01-05 スカイリス・ネットワークス・インコーポレーテッド 全地球的にアドレス可能なオブジェクト及び関連するビジネスモデルの経路設定及び索引付けを行うためのシステム、方法及びプログラミング
US8843486B2 (en) 2004-09-27 2014-09-23 Microsoft Corporation System and method for scoping searches using index keys
JP2006107446A (ja) * 2004-09-30 2006-04-20 Microsoft Corp ネットワーク・ドキュメントのバッチ索引付けのためのシステムおよび方法
US9348912B2 (en) 2007-10-18 2016-05-24 Microsoft Technology Licensing, Llc Document length as a static relevance feature for ranking search results
US9495462B2 (en) 2012-01-27 2016-11-15 Microsoft Technology Licensing, Llc Re-ranking search results

Similar Documents

Publication Publication Date Title
US7188094B2 (en) Indexing virtual attributes in a directory server system
CA2365705C (en) A system for collecting specific information from several sources of unstructured digitized data
JP5160556B2 (ja) 分散型コンピュータネットワークに基づくログファイル分析方法およびシステム
US6647381B1 (en) Method of defining and utilizing logical domains to partition and to reorganize physical domains
KR100313462B1 (ko) 웹검색엔진에서검색된정보를지역적으로근접한순서대로표시하는방법
Koshman et al. Web searching on the Vivisimo search engine
Tyagi et al. An algorithmic approach to data preprocessing in web usage mining
JP2004510257A (ja) 使用者の検索を容易にするインターネット検索システム及びその方法
KR100434902B1 (ko) 지식 기반 맞춤 정보 제공 시스템 및 그 서비스 방법
Lakshmi et al. An overview of preprocessing on web log data for web usage analysis
WO2001055909A1 (en) System and method for bookmark management and analysis
KR100557874B1 (ko) 과학기술 정보분석 방법 및 그 방법에 대한 컴퓨터프로그램을 저장한 기록매체
JPH10240757A (ja) 協調分散検索システム
RU2709647C9 (ru) Способ ассоциирования доменного имени с характеристикой посещения веб-сайта
CN112597369A (zh) 基于改良云平台的网页蜘蛛主题式搜索系统
JP2003162449A (ja) アクセス統合管理システム、アクセス統合管理装置及び方法並びにプログラム
Dixit et al. Preprocessing of web logs
KR100347987B1 (ko) 인터넷 주소 부가 정보를 이용한 응용 서비스 제공 방법
JP2003271647A (ja) 閲覧ファイルデータ提供方法、閲覧頻度データ提供方法、そのための中継装置、プログラム及び記録媒体
Dhawan et al. Web Usage Mining: Finding Usage Patterns from Web Logs
Maheswari et al. Algorithm for Tracing Visitors' On-Line Behaviors for Effective Web Usage Mining
Hassan et al. A framework of Universiti Kebangsaan Malaysia patent: UKM patent
Gupta et al. Application specific web log pre-processing
Luczak-Rösch et al. Statistical analysis of web of data usage
Chavda et al. Recent trends and novel approaches in web usage mining

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Effective date: 20031211

Free format text: JAPANESE INTERMEDIATE CODE: A131

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040120

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040209

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040227

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080305

Year of fee payment: 4

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090305

Year of fee payment: 5

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090305

Year of fee payment: 5

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100305

Year of fee payment: 6

FPAY Renewal fee payment (prs date is renewal date of database)

Year of fee payment: 7

Free format text: PAYMENT UNTIL: 20110305

FPAY Renewal fee payment (prs date is renewal date of database)

Year of fee payment: 8

Free format text: PAYMENT UNTIL: 20120305

FPAY Renewal fee payment (prs date is renewal date of database)

Year of fee payment: 9

Free format text: PAYMENT UNTIL: 20130305

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130305

Year of fee payment: 9

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130305

Year of fee payment: 9

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

FPAY Renewal fee payment (prs date is renewal date of database)

Year of fee payment: 9

Free format text: PAYMENT UNTIL: 20130305

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140305

Year of fee payment: 10