JP2001222535A - ネットワーク情報処理方法及びネットワーク情報処理装置並びにネットワーク情報処理プログラムを記録した記録媒体 - Google Patents

ネットワーク情報処理方法及びネットワーク情報処理装置並びにネットワーク情報処理プログラムを記録した記録媒体

Info

Publication number
JP2001222535A
JP2001222535A JP2000029210A JP2000029210A JP2001222535A JP 2001222535 A JP2001222535 A JP 2001222535A JP 2000029210 A JP2000029210 A JP 2000029210A JP 2000029210 A JP2000029210 A JP 2000029210A JP 2001222535 A JP2001222535 A JP 2001222535A
Authority
JP
Japan
Prior art keywords
information
user
network
index
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000029210A
Other languages
English (en)
Inventor
Toshio Tanaka
敏雄 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP2000029210A priority Critical patent/JP2001222535A/ja
Publication of JP2001222535A publication Critical patent/JP2001222535A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Computer And Data Communications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

(57)【要約】 【課題】ネットワーク上の有効な情報を効率よく収集し
てインデクス処理してインデクスデータベースを作成
し、それによって、最新の情報を効率よく検索できるよ
うにする。 【解決手段】ユーザA.B,C,・・・の与えた閲覧要
求によって収集されたインターネット20の各種情報を
インデクス処理してインデクスデータベース2を作成す
る。そして、ユーザDが何らかの情報を検索しようとし
て検索要求を出すと、その検索要求に対しインデクスデ
ータベース2を参照して当該検索要求に対応したインデ
クスデータを検索結果としてユーザDに提示する。イン
デクスデータベース2は、閲覧要求によって収集された
情報(その情報内容を表す用語など)とその情報を収集
するために与えられたURLを対応付けて示すものであ
り、検索要求を出したユーザDに提示される検索結果と
してのインデクスデータは、インデクスデータベース2
から取り出されるURLとする。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明はネットワーク上に存
在する情報をユーザの検索要求に対し効率よく検索する
ネットワーク情報処理方法及びネットワーク情報処理装
置並びにネットワーク情報処理プログラムを記録した記
録媒体に関する。
【0002】
【従来の技術】インターネットなどから効率よく情報収
集を行うために検索エンジンが存在する。通常、検索エ
ンジンは、ロボットと呼ばれる情報収集プログラムを使
用してネットワーク上に存在する情報を自動的に収集
し、収集した情報をインデクス処理して、インデクスデ
ータベースを作成している。そして、ユーザからの検索
要求が来ると、その検索要求に対しインデクスデータベ
ースを参照し、ユーザからの検索要求に適合した情報の
存在場所を示すアドレス情報としてのURLなどを検索
結果としてユーザに提示する。
【0003】図6は従来のロボット型の情報検索システ
ムにおける情報検索処理について説明する図であり、こ
こでは、情報収集側X1と情報検索側X2とに分けて考
える。情報収集側X1ではロボット11によって複数の
webサーバ12,13,14を定期的に見て回ってイン
ターネット15に存在する情報を収集する。一方、情報
検索側X2ではロボット11が収集した情報をインデク
ス処理することによって作成されたインデクスデータベ
ース21を有し、ユーザからの検索要求を検索エンジン
22が受けると、そのインデクスデータベース21を参
照して、ユーザからの検索要求に適合した情報の存在場
所を示すURLなどを検索結果としてユーザに返す。
【0004】
【発明が解決しようとする課題】このように、ロボット
型の情報検索システムは、ロボット11がインターネッ
ト15から定期的に情報収集を行い、収集された情報を
インデクス処理してインデクスデータベース21を作成
し、ユーザの検索要求による実際の検索時にはそのイン
デクスデータべース21を参照することによって、情報
のありかを示すURLなどをユーザに提示するようにし
ている。
【0005】しかしながら、このような情報検索システ
ムでは、たとえ、ロボット11が定期的に情報収集を行
うといっても、インターネット15の情報量は余りにも
多いため、ロボット11で収集できる情報量は全体の情
報量からみれば、ごくわずかである。
【0006】その結果、インデクスデータベース21に
格納されるインデクスデータも、インターネット15に
存在する膨大なデータの中のほんの一部であるので、そ
のインデクスデータベース21から選択されるURLで
はユーザの本当に欲しい情報が得られない場合も多い。
特に、ロボット11によって収集される情報は、ユーザ
が実際に閲覧して得られた情報ではないので、それによ
って作成されたインデクスデータベース21の内容の有
効性に問題が多く、そのようなインデクスデータベース
21によって提示されるURLの情報は、多くのユーザ
にとって本当に欲しいと思う情報とはなりにくい問題が
ある。
【0007】また、ロボット11がある同じページにつ
いての情報収集を行う頻度は1カ月に一度程度と比較的
長い周期であるため、一度そのページ内容に基づいてイ
ンデクス処理すると、たとえ、そのページ内容が大幅に
変わっていたり、そのページそのものがなくなったとし
ても、1カ月間は同じインデクスである。このため、検
索エンジン22から示されたURLでユーザがそのペー
ジを見ようとしても、全く違う内容(そのユーザの期待
する内容とは全く異なる内容)であったり、すでに、そ
のページが無かったりするということもあり得る。
【0008】また、ロボット11が情報収集を行う際は
幾つものwebサーバから情報収集する動作を頻繁に行う
ため、ネットワークに負荷がかかるという問題もある。
【0009】さらに、webサーバ上ではCGI(Common
Gateway Interface)により、データベースなどからダ
イナミックにページの作成を行うことがなされている
が、ロボットではそのページを読み出すためのパラメー
タの指定が難しいなどの問題点もある。
【0010】そこで本発明は、ロボットによらないでネ
ットワーク上から情報収集を行い、収集された情報をイ
ンデクス処理してインデクスデータベースの作成を行う
ようにして、インデクスデータベースの内容を最新の情
報に対応したものとし、しかも、ロボットを不要とする
ことからネットワークにかかる負荷を少なくすることが
できるなど種々の利点を有するネットワーク情報処理方
法およびネットワーク情報処理装置並びにネットワーク
情報処理プログラムを記録した記録媒体を提供すること
を目的としている。
【0011】
【課題を解決するための手段】上述した目的を達成する
ために、本発明のネットワーク情報処理方法は、ネット
ワーク上を流れる情報を取得し、その取得した情報をイ
ンデクス処理してインデクスデータベースを作成するよ
うにしている。
【0012】このようなネットワーク情報処理方法にお
いて、前記インデクスデータベースは、少なくとも、取
得された情報内容を表すデータとその情報のありかを示
すアドレスデータの2つのデータが対応付けられて示さ
れるものである。
【0013】また、あるユーザから何らかの情報を検索
するための検索要求が与えられると、その検索要求に対
し前記インデクスデータベースを参照して当該検索要求
に対応したインデクスデータを、前記検索要求を出した
ユーザに提示するようにしている。
【0014】そして、前記ユーザに提示されるインデク
スデータは、前記インデクスデータベース内に存在する
データの中の少なくともアドレスデータとしている。
【0015】また、ネットワーク上を流れる情報は、ユ
ーザから与えられた閲覧要求に従ってネットワーク上か
ら収集される情報である。
【0016】また、本発明のネットワーク情報処理方法
は、ユーザから与えられた閲覧要求を受けると、その閲
覧要求に従ってネットワーク上から情報収集を行い、収
集された情報を前記閲覧要求を出したユーザに転送する
とともに、その収集された情報を取得してインデクス処
理し、少なくとも、その情報の内容を表すデータとその
情報を収集するためにユーザが与えた閲覧要求としての
アドレスデータの2つのデータが対応付けられて示され
るインデクスデータベースを作成し、あるユーザから何
らかの情報を検索するための検索要求が与えられると、
その検索要求に対し前記インデクスデータベースを参照
して、そのインデクスデータベース内に存在するデータ
の中の少なくともアドレスデータを前記検索要求を出し
たユーザに提示するようにしている。
【0017】また、本発明のネットワーク情報処理装置
は、ネットワーク上を流れる情報を取得してその取得し
た情報をインデクス処理するインデクス処理手段と、こ
のインデクス処理手段によりインデクス処理された内容
を保持するインデクスデータベースを有するものであ
る。
【0018】このようなネットワーク情報処理装置にお
いて、前記インデクスデータベースは、少なくとも、取
得された情報内容を表すデータとその情報のありかを示
すアドレスデータの2つのデータが対応付けられて示さ
れるものである。
【0019】また、あるユーザから何らかの情報を検索
するための検索要求が与えられると、その検索要求に対
し前記インデクスデータベースを参照して当該検索要求
に対応したインデクスデータを、前記検索要求を出した
ユーザに提示する情報検索手段を有した構成としてい
る。
【0020】そして、前記ユーザに提示されるインデク
スデータは、前記インデクスデータベース内に存在する
データの中の少なくともアドレスデータとしている。
【0021】また、前記ネットワーク上を流れる情報
は、ユーザから与えられた閲覧要求に従ってネットワー
ク上から収集される情報である。
【0022】また、本発明のネットワーク情報処理装置
は、ユーザから与えられた閲覧要求を受けると、その閲
覧要求に従ってネットワーク上から情報収集を行う情報
収集手段と、この情報収集手段により収集された情報を
取得してインデクス処理するインデクス処理手段と、こ
のインデクス処理手段によりインデクス処理された内容
として、少なくとも、前記取得した情報の内容を表すデ
ータとその情報を収集するためにユーザが与えた閲覧要
求としてのアドレスデータの2つのデータが対応付けら
れて示されるインデクスデータベースと、あるユーザか
ら何らかの情報を検索するための検索要求が与えられる
と、その検索要求に対し前記インデクスデータベースを
参照して、そのインデクスデータベース内に存在するデ
ータの中の少なくともアドレスデータを前記検索要求を
出したユーザに提示する情報検索手段とを有した構成と
している。
【0023】また、本発明のネットワーク情報処理プロ
グラムを記録した記録媒体は、ネットワーク上を流れる
情報を取得し、その取得した情報をインデクス処理して
インデクスデータベースを作成する手順をその処理プロ
グラムに含むものである。
【0024】このようなネットワーク情報処理プログラ
ムを記録した記録媒体において、前記インデクスデータ
ベースは、少なくとも、取得された情報内容を表すデー
タとその情報のありかを示すアドレスデータの2つのデ
ータが対応付けられて示されるものである。
【0025】また、あるユーザから何らかの情報を検索
するための検索要求が与えられると、その検索要求に対
し前記インデクスデータベースを参照して当該検索要求
に対応したインデクスデータを、前記検索要求を出した
ユーザに提示する手順をその処理プログラムに含むよう
にしている。
【0026】そして、前記ユーザに提示されるインデク
スデータは、前記インデクスデータベース内に存在する
データの中の少なくともアドレスデータとしている。
【0027】また、前記ネットワーク上を流れる情報
は、ユーザから与えられた閲覧要求に従ってネットワー
ク上から収集される情報である。
【0028】また、本発明のネットワーク情報処理プロ
グラムを記録した記録媒体は、ユーザから与えられた閲
覧要求を受けると、その閲覧要求に従ってネットワーク
上から情報収集を行う手順と、収集された情報を前記閲
覧要求を出したユーザに転送するとともに、その収集さ
れた情報を取得してインデクス処理し、少なくとも、取
得した情報の内容を表すデータとその情報を収集するた
めにユーザが与えた閲覧要求としてのアドレスデータの
2つのデータが対応付けられて示されるインデクスデー
タベースを作成する手順と、あるユーザから何らかの情
報を検索するための検索要求が与えられると、その検索
要求に対し前記インデクスデータベースを参照して、そ
のインデクスデータベース内に存在するデータの中の少
なくともアドレスデータを前記検索要求を出したユーザ
に提示する手順とをその処理プログラムに含むものであ
る。
【0029】本発明は、ネットワーク上を流れている情
報を取得し、その取得した情報をインデクス処理してイ
ンデクスデータベースを作成している。これにより、従
来のように、ロボットが定期的に情報収集を行って、そ
の収集した情報に基づいてデータベースを作成するのと
は異なり、インデクスデータベースの内容は常に最新の
情報に対応できるものとなり、そのインデクスデータベ
ースによって検索される情報は最新のものとなる。ま
た、ロボットが不要となるので、ロボットが行っていた
情報収集操作がなくなり、その分、ネットワークにかか
る負荷を軽減することができる。
【0030】また、そのインデクスデータベースの内容
は、取得された情報の内容を表すデータと、その情報の
ありかを示すアドレスとしてのURL(URLのみなら
ず日付、データサイズ、要約などを付加することもでき
る)とを対応付けて示すものであり、少なくともURL
を含んだインデクスデータを、検索要求を出したユーザ
に対して検索結果として提示するようにしている。これ
により、そのインデクスデータを検索結果として受け取
ったユーザは、そのURLを入力するだけで自分の欲し
い情報を的確に得ることができる。
【0031】また、ネットワーク上を流れている情報
は、たとえば、ユーザが情報閲覧を行おうとして、ある
サーバに対し閲覧要求を与えることによって収集された
情報などである。
【0032】このように、ユーザの閲覧要求によって収
集された情報を途中で取得し、その情報を用いてインデ
クスデータベースを作成することにより、インデクスデ
ータベースの内容は常に最新の情報に対応できるものと
なるとともに、そのインデクスデータベースによって検
索される情報は最新のものとなる。さらに、ユーザによ
って実際に閲覧された情報に基づいたインデクスデータ
ベースが作成されるので、インデクスデータベース内の
情報は有効な情報が多く集まったものとなる。
【0033】しかも、ユーザに提示される検索結果とし
てのURLは他のユーザが情報閲覧したときに用いたU
RLであるので、的確な内容であることが多く、自分の
欲しい情報を効率よく、かつ、適正に得ることが可能と
なる。
【0034】
【発明の実施の形態】以下、本発明の実施の形態につい
て説明する。なお、この実施の形態で説明する内容は、
本発明のネットワーク情報処理方法、ネットワーク情報
処理装置についての説明であるとともに、本発明のネッ
トワーク情報処理プログラムを記録した記録媒体におけ
るネットワーク情報処理プログラムの具体的な処理内容
をも含むものである。
【0035】まず、本発明の基本的な処理について図1
を参照しながら説明し、そのあとで、具体的な実施の形
態について説明する。本発明の基本的な構成としては、
ネットワーク上を流れる情報を取得してその取得した情
報をインデクス処理するインデクス処理部1と、このイ
ンデクス処理部1によりインデクス処理された内容を保
持するインデクスデータベース2を有している。また、
このような構成に、情報検索部3を付加することによっ
て、あるユーザから何らかの情報を検索するための検索
要求が与えられたとき、その検索要求に対し前記インデ
クスデータベース2を参照して当該検索要求に対応した
インデクスデータを、前記検索要求を出したユーザに提
示するようなシステムとすることもできる。
【0036】上述したネットワーク上を流れる情報とい
うのは、たとえば、ユーザが情報閲覧を行おうとして、
あるサーバに対し閲覧要求を与えることによって収集さ
れた情報などであり、このような情報を途中で取得し
て、それをインデクス処理して、インデクスデータベー
ス2を作成する。
【0037】これにより、従来のように、ロボットが定
期的に情報収集を行ってその収集した情報に基づいてデ
ータベースを作成するのとは異なり、インデクスデータ
ベース2の内容は常に最新の情報に対応できるものとな
り、そのインデクスデータベースによって検索される情
報は最新のものとなる。また、ロボットが不要となるの
で、ロボットが行っていた情報収集操作がなくなり、そ
の分、ネットワークにかかる負荷を軽減することができ
る。以下、本発明の実施の形態について説明する。
【0038】この実施の形態では、図2に示すように、
イントラネット10に情報処理端末としてたとえばパー
ソナルコンピュータ(以下、PCといい、PC1,PC
2,・・・で表す)が接続されていて、そのイントラネ
ット10とインターネット20との間にプロキシサーバ
30が接続されてなる情報収集システムを例にとって説
明する。
【0039】プロキシサーバ30は、ユーザ側のネット
ワーク(この図2の例ではイントラネット10)とイン
ターネット20とを結ぶ部分に設置され、ユーザA,
B,C,・・・がPC1,PC2,PC3,・・・によ
って与えた要求をユーザA,B,C,・・・に代わって
インターネット20に接続されているwebサーバ41,
42,43,・・・に転送する。このとき、どのユーザ
(どのPC)からどのような要求がどこのwebサーバに
送られたかを記憶しておく、一方、インターネット20
に接続されたwebサーバ41,42,43,・・・のう
ちプロキシサーバ30からの要求を受け取ったwebサー
バは、プロキシサーバ30からの要求に基づいた情報収
集を行って、収集した情報をプロキシサーバ30に送
る。そして、プロキシサーバ30では、情報収集を行っ
たwebサーバから送られた来た情報を、どのユーザ(P
C)に転送すればよいかを、前述の記憶されたデータを
参照することによって調べ、該当するユーザにその情報
を転送する。なお、プロキシサーバによってはキャッシ
ュを持っていて、ユーザからの要求がそのキャッシュに
保持されている内容で対応できる場合には、そのキャッ
シュの情報をそのユーザに転送するということも行われ
る。
【0040】図3はユーザの情報閲覧操作によってイン
デクスデータベースを作成する際の情報の流れを説明す
る図であり、これによって本発明を概略的に説明する。
【0041】図2で示されたプロキシサーバ30内に
は、どのユーザ(PC)がどのような要求(URLな
ど)を出したかを対応付けるためのテーブルとして、要
求/ユーザ対応テーブル31を有するとともに、ユーザ
によって与えられたURLに基づきそのユーザに代わっ
てwebサーバ41,42,43,・・・に対して情報閲
覧要求を出し、その検索要求を受け取ったwebサーバに
よって得られた情報を収集する情報収集部32と、この
情報収集部32によって収集された情報を取得し、その
取得した情報とユーザから閲覧要求として与えられたU
RLとを対応付けてインデクス処理を行うインデクス処
理部1と、このインデクス処理部で処理された処理結果
を保持するインデクスデータベース2とを有する。
【0042】このような構成において、今、ユーザAが
ある情報を閲覧しようとして、その情報のありそうなア
ドレス(URL1とする)を情報閲覧要求として自己の
PC(PC1)に入力したとする。
【0043】これによって、情報収集部32ではユーザ
Aに代わってwebサーバ41,42,43,・・・のう
ち、たとえばwebサーバ41に対し、情報閲覧要求であ
るURL1を送ったとする。この情報閲覧要求URL1
を受け取ったwebサーバ41では、その情報閲覧要求に
基づいた情報収集を行う。そして、webサーバ41から
URL1の情報が情報収集部32に送られてくると、そ
の情報がどのユーザ(PC)かを要求/ユーザ対応テー
ブル31を参照して調べ、この場合、ユーザA(PC
1)に、そのURL1の情報を転送する。
【0044】また、webサーバ41から送られてきたU
RL1の情報は、インデクス処理部1で取得され、その
取得された情報をインデクス処理し、そのインデクス処
理結果をインデクスデータベース2に格納する。
【0045】なお、ここで行われるインデクス処理とい
うのは、取得したそれぞれの情報をインデクスで表し検
索しやすいようにするもので、たとえば、取得したそれ
ぞれの情報の文書内容から、その情報の内容を表すデー
タとして、たとえば、ユーザの検索要求となり得る用語
を抽出し、その抽出された用語を用いてインデクスデー
タベース2を作成する。
【0046】具体的には、まず、取得された情報の識別
子としてその情報のURLと、このURLによって収集
された情報との対応付け(たとえば、URL1に対して
は情報D1というような対応付け)を行い、収集された
情報からユーザの検索要求となり得る用語を抽出し、抽
出されたそれぞれの用語とそれがどの情報に存在したか
を対応付けて示されるもので、図4はこのようにして作
成されたインデクスデータベース2の一例を示すもので
ある。
【0047】この図4によれば、「プリンタ」、「イン
クジェット」などの用語はURL1の情報に存在し、
「デジタルカメラ」という用語はURL2の情報に存在
するということを示している。この図4は説明を簡略化
するために内容をきわめて単純な例で示したものであ
る。このようなインデクスデータベース2は、ユーザが
何らかの情報を検索しようとする際に用いられるもので
あるが、このインデクスデータベース2を用いた検索の
具体例については後に説明する。
【0048】この図4に示されるインデクスデータベー
ス2は、多くのユーザがインターネット20上の情報を
閲覧する操作を行えば行うほどその内容が充実して行
く。
【0049】つまり、前述したように、ユーザが自己の
PCから何らかの情報を閲覧するために、その情報のあ
りそうなURLをプロキシサーバ30に出すと、プロキ
シサーバ30ではユーザに代わってwebサーバ41,4
2,43,・・・に対し、そのURLに基づいた情報収
集を行う。そして、プロキシサーバ30からの要求を受
け取ったwebサーバからそのURLの情報がプロキシサ
ーバ30に送られてくると、プロキシサーバ30は、閲
覧要求を出したユーザに、そのURL1の情報を転送す
るとともに、その処理過程において、その情報に基づい
て、その情報のURLとその情報の内容を表す用語とを
対応付けして図4のようなインデクスデータベース2を
作成して行く。
【0050】したがって、それぞれのユーザが情報の閲
覧操作を行えば行うほど、インデクスデータベース2は
充実した内容となる。なお、インデクスデータベース2
は、情報のありかを示すURLだけではなくインデクス
処理した日付、その情報のデータサイズや要約なども記
述することができ、検索要求を出したユーザに対して提
示されるインデクスデータつまり検索結果としては、U
RLだけではなく、これらの情報(インデクス処理した
日付、その情報のデータサイズや要約など)をもユーザ
に提示することができる。
【0051】次に、このインデクスデータベース2を用
いた検索の具体例について図5を参照しながら説明す
る。図5は図2を具体的に示すもので、図5において、
破線X1で囲った部分は、ユーザの情報収集要求によっ
て情報収集を行うとともに、収集した情報に基づいてイ
ンデクスデータベース2を作成する情報収集側を示すも
のであり、図3で説明したように、要求とユーザとを対
応付ける要求/ユーザ対応テーブル31、情報収集部3
2、インデクス処理部1、インデクスデータベース2を
有する。また、破線X2で囲った部分は情報検索を行う
情報検索側を示すものであり、情報検索部(この図5で
は検索エンジンと記す)3を有する。これら情報収集側
X1と情報検索側X2は、図2で示されるような情報収
集システムにおいてはプロキシサーバ30内に設けられ
る。
【0052】なお、この図5ではユーザA,B,C,・
・・が情報閲覧を行い、ユーザDが情報検索を行うとい
うような分け方で書かれているが、当然のことながらユ
ーザDもユーザA,B,C,・・・と同様に情報閲覧す
る側になる場合もあり、また、ユーザA,B,C,・・
・も情報検索を行う側になることもある。
【0053】ユーザA,B,C,・・・がそれぞれのP
Cから情報閲覧操作を行うことによって得られた情報に
基づき、図4に示すようなインデクスデータベース2が
作成される。このインデクスデータベース2は、前述し
たように、多くのユーザが多くの情報閲覧操作を行うこ
とにより充実した内容となる。
【0054】そして、今、ユーザDが何らかの情報を得
ようとして自己のPC4から情報検索要求を出したとす
る。この情報検索要求としてはたとえばキーワードとし
ての単語などであり、ここでは、「インクジェット」、
「プリンタ」というキーワードを入力したとする。この
検索要求が検索エンジン3に与えられると、その検索エ
ンジン3ではインデクスデータベース2を参照し、それ
ぞれのキーワードがどのURLに存在するかを調べる。
【0055】図4のインデクスデータベース2の例で
は、「インクジェット」も「プリンタ」もURL1に存
在することがわかる。これにより、検索エンジン3はユ
ーザDに対して検索結果としてインデクスデータ「UR
L1」を返す。ユーザDは検索エンジン3から送られて
きた検索結果である「URL1」により情報閲覧を行え
ば、ユーザDの欲しい情報を閲覧することができる。
【0056】なお、このように検索結果として提示され
たURLによってそのURLの情報が閲覧されると、そ
の閲覧された情報に対してもインデクス処理がなされ、
その情報のURLとその情報の内容から得られた用語が
インデクスデータベース2の内容に加えられる。このと
き、そのURL(URL1)の情報が全く変更されてい
なければ、インデクスデータベース2の内容の更新はな
されないが、そのURL1の情報の内容に変更があれ
ば、変更後の新たな内容に基づいてそのURLとその新
たな情報から得られた用語を調べ、それによってインデ
クスデータベース2の内容の更新が行われる。
【0057】このように、URLは同じでも、その情報
が更新されている場合には、インデクスデータベース2
の内容も更新されるので、誰かが最近に閲覧した最新の
情報を見ることができ、情報の更新に追従することが可
能となる。たとえば、ニュースのトップページのような
場合、データの識別子としてのURL(たとえば、htt
p://www.asahi.com/)は同じであっても、日付や時刻に
よってその内容が変わってくる情報にあっては、誰かが
最新の情報を閲覧すれば、その最新の情報に基づくイン
デクスデータベース2が作成される。これに対して、従
来のロボット型の情報収集システムでは、ロボットがそ
の情報を見に行くまではその情報についてのインデクス
データベースの内容の更新が行われない。
【0058】また、ユーザが行う情報閲覧要求に用いる
URLは、 http://www.epson.co.jp/のように、固定的
なものでよいが、たとえば、CGIのように、サーバ側
でプログラムを動かして、情報を作成するようなもので
あってもよい。その場合は、識別子としてのURLは、
プログラムとパラメータの組み合わせ、たとえば、 htt
p://www.epson.co.jp/getdata.cgi?1999のようになる
が、いずれにしても、情報のありかをURLとして取得
しておけば、あとで、他のユーザが検索を行おうとして
検索エンジンからそのURLを受け取ったとき、そのま
ま、そのURLを用いて情報を閲覧することができる。
【0059】このようにして、サーバ側でプログラムを
動かして、情報を作成するような場合、従来のロボット
型の情報収集システムでは、ロボットがパラメータを色
々考えて最適なパラメータを設定しなければならない
が、本発明によれば、ユーザが適当にパラメータを設定
したURLを用いてくれるので、ロボット側でパラメー
タを考えて設定する必要がなくなる。特に、その分野に
知識のあるユーザであれば、最適なパラメータを設定し
てくれているので、後から同じ情報を閲覧しようとする
際、すでに最適なパラメータを持つURLが設定されて
いるので効率よく情報を閲覧することができる。
【0060】なお、インデクスデータベース2はその内
容を、適宜、メンテナンスすることも可能で、たとえ
ば、予め定めた時間が経過してもその情報へのアクセス
がない場合にはその情報に対するインデクスデータベー
ス2の内容を削除するといったことを行うことができ
る。
【0061】以上説明したようにこの実施の形態によれ
ば、ユーザによって閲覧された情報をインデクス処理す
ることによってインデクスデータベース2が作成、つま
り、ネットワーク上を頻繁に流れている情報によってイ
ンデクスデータベース2が作成されるので、従来のよう
に、ロボットによって定期的に情報収集を行ってインデ
クスデータベースが作成されるのとは異なり、インデク
スデータベース2の内容は常に、最新の情報に対応でき
るものとなり、そのインデクスデータベース2によって
検索される情報は、最新のものとすることができる。
【0062】また、同じサーバを使っているユーザ同士
がネットワークに関する知識の共有(たとえば、お勧め
のページを共有するというようなこと)が可能となり、
また、あるユーザがこのようなインデクスデータベース
2を有するサーバを常時使うのであれば、自分が過去に
閲覧したページなどを見る場合に都合のよいものとな
る。
【0063】また、このようなインデクスデータベース
2を有するサーバを同じ興味や関心事などを有するユー
ザ同士が使用するようにすれば、そのインデクスデータ
ベース2には、ある特定の分野に関する情報を検索する
のに都合のよい内容が多く含まれるので、同じ興味や関
心事などを有するユーザが効率よく情報検索を行える検
索システムを構築できる。
【0064】さらに、ロボットが情報を収集しに行くの
ではなく、ユーザが実際に閲覧した情報を他のユーザが
検索することができるので、webサーバなどがCGIな
どによりダイナミックに作成するページについても、す
でにそのページを閲覧したユーザの与えたURLをその
まま用いて容易に情報を得ることができる。
【0065】ところで、本発明によって得られるインデ
クスデータベースによって検索可能な情報の量は、ネッ
トワーク上に存在する情報全体から見ればごくわずかで
はあるが、多くのユーザによって実際に閲覧される情報
を基にインデクスデータベースが作成されるので、その
インデクスデータベースに存在する情報は、他のユーザ
からも検索される可能性の高い情報であるといえる。つ
まり、本発明により作成されるインデクスデータベース
は、有効性の高い情報の集まりとなる可能性が高く、そ
れによって提示されるURLで検索される情報は、多く
のユーザが欲しい情報となる可能性が高い。
【0066】なお、本発明は以上説明した実施の形態に
限定されるものではなく、本発明の要旨を逸脱しない範
囲で種々変形実施可能となるものである。たとえば、前
述した実施の形態では、図2に示すような情報収集シス
テム、つまり、イントラネット10とインターネット2
0の間にプロキシサーバ30を介在させた情報収集シス
テムを例にとって説明したが、これに限られるものでは
なく、ユーザからの情報閲覧要求を受けるとその閲覧要
求に対して情報収集を行い、収集した情報を当該ユーザ
に転送できるような情報収集システムであれば適用でき
る。
【0067】また、本発明は、プロバイダなど多くのユ
ーザによってアクセスされるところで採用するようにす
れば、幅広いユーザに対応したインデクスデータベース
が作成され、より一層、汎用性の高い情報収集サービス
を提供できる。さらに、それぞれのネットワーク情報収
集システムで作成されるインデクスデータベースを相互
に連携することによっても、幅広いユーザに対応したイ
ンデクス検索が可能となり、より一層、汎用性の高い情
報収集サービスを提供できる。
【0068】また、以上説明した本発明の処理を行うネ
ットワーク情報処理プログラムは、フロッピィディス
ク、光ディスク、ハードディスクなどの記録媒体に記録
させておくことができ、本発明はその記録媒体をも含む
ものである。また、ネットワークから処理プログラムを
得るようにしてもよい。
【0069】
【発明の効果】以上説明したように本発明によれば、ネ
ットワーク上を流れている情報を取得し、その取得した
情報をインデクス処理してインデクスデータベースを作
成している。これにより、従来のように、ロボットが定
期的に情報収集を行ってその収集した情報に基づいてデ
ータベースを作成するのとは異なり、インデクスデータ
ベースの内容は常に最新の情報に対応できるものとな
り、そのインデクスデータベースによって検索される情
報は最新のものとなる。また、ロボットが不要となるの
で、ロボットが行っていた情報収集操作がなくなり、そ
の分、ネットワークにかかる負荷を軽減することができ
る。
【0070】また、インデクスデータベースの内容は、
取得された情報の内容を表すデータと、その情報のあり
かを示すアドレスとしてのURL(URLのみならず日
付、データサイズ、要約などを付加することもできる)
とを対応付けて示すものであり、少なくともURLを含
んだインデクスデータを、検索要求を出したユーザに対
して検索結果として提示するようにしている。これによ
り、そのインデクスデータを検索結果として受け取った
ユーザは、そのURLを入力するだけで自分の欲しい情
報を的確に得ることができる。
【0071】また、ネットワーク上を流れている情報と
しては、たとえば、ユーザが情報閲覧を行おうとして、
あるサーバに対し閲覧要求を与えることによって収集さ
れた情報などがある。このように、ユーザの閲覧要求に
よって収集された情報を途中で取得してその情報を用い
てインデクスデータベースを作成することにより、イン
デクスデータベースの内容は常に最新の情報に対応でき
るものとなるとともに、そのインデクスデータベースに
よって検索される情報は最新のものとなり、さらに、多
くのユーザによって閲覧される可能性の高い情報のイン
デクスデータベースが作成される可能性が高くなる。
【0072】しかも、ユーザに提示される検索結果とし
てのURLは他のユーザが情報閲覧したときに用いたU
RLであるので、的確な内容であることが多く、自分の
欲しい情報を効率よく、かつ、適正に得ることが可能と
なる。
【0073】また、同じサーバを使っているユーザ同士
がネットワークに関する知識の共有(たとえば、お勧め
のページを共有するというようなこと)が可能となり、
また、あるユーザがこのようなインデクスデータベース
を有するサーバを常時使うのであれば、自分が過去に閲
覧したページなどを見る場合に都合のよいものとなる。
【0074】また、このようなインデクスデータベース
を有するサーバを同じ興味や関心事などを有するユーザ
同士が使用するようにすれば、そのインデクスデータベ
ースには、ある特定の分野に関する情報を検索するのに
都合のよい内容が多く含まれるので、同じ興味や関心事
などを有するユーザが効率よく情報検索を行える検索シ
ステムを構築できる。
【0075】さらに、ロボットが情報を収集しに行くの
ではなく、ユーザが閲覧した情報を他のユーザが検索す
ることができるので、webサーバなどがCGIなどによ
りダイナミックに作成するページについても、すでにそ
のページを閲覧したユーザの与えたURLをそのまま用
いて容易に検索することができる。
【図面の簡単な説明】
【図1】本発明の基本的な処理を説明する構成図であ
る。
【図2】本発明の実施の形態を説明する図であり、本発
明が適用される情報収集システムの概略的な構成を示す
図である。
【図3】図2で示されるプロキシサーバ内において、閲
覧要求により収集された情報に基づいてインデクスデー
タベースを作成する処理を説明する図である。
【図4】インデクスデータベースの一例を示す図であ
る。
【図5】図2で示された情報収集システムにおける情報
処理動作を説明する構成図である。
【図6】従来のロボット型情報収集システムの構成を示
す図である。
【符号の説明】
1 インデクス処理部 2,21 インデクスデータベース 3,22 情報検索部(検索エンジン) 10 イントラネット 11 ロボット 15,20 インターネット 30 プロキシサーバ 31 要求/ユーザ対応テーブル 32 情報収集部 12,13,14,41,42,43 webサーバ

Claims (18)

    【特許請求の範囲】
  1. 【請求項1】 ネットワーク上を流れる情報を取得し、
    その取得した情報をインデクス処理してインデクスデー
    タベースを作成することを特徴とするネットワーク情報
    処理方法。
  2. 【請求項2】 前記インデクスデータベースは、少なく
    とも、取得された情報内容を表すデータとその情報のあ
    りかを示すアドレスデータの2つのデータが対応付けら
    れて示されるものであることを特徴とする請求項1記載
    のネットワーク情報処理方法。
  3. 【請求項3】 あるユーザから何らかの情報を検索する
    ための検索要求が与えられると、その検索要求に対し前
    記インデクスデータベースを参照して当該検索要求に対
    応したインデクスデータを、前記検索要求を出したユー
    ザに提示することを特徴とする請求項1または2記載の
    ネットワーク情報処理方法。
  4. 【請求項4】 前記ユーザに提示されるインデクスデー
    タは、前記インデクスデータベース内に存在するデータ
    の中の少なくともアドレスデータであることを特徴とす
    る請求項3記載のネットワーク情報処理方法。
  5. 【請求項5】 前記ネットワーク上を流れる情報は、ユ
    ーザから与えられた閲覧要求に従ってネットワーク上か
    ら収集される情報であることを特徴とする請求項1から
    4いずれかに記載のネットワーク情報処理方法。
  6. 【請求項6】 ユーザから与えられた閲覧要求を受ける
    と、その閲覧要求に従ってネットワーク上から情報収集
    を行い、 収集された情報を前記閲覧要求を出したユーザに転送す
    るとともに、その収集された情報を取得してインデクス
    処理し、少なくとも、その情報の内容を表すデータとそ
    の情報を収集するためにユーザが与えた閲覧要求として
    のアドレスデータの2つのデータが対応付けられて示さ
    れるインデクスデータベースを作成し、 あるユーザから何らかの情報を検索するための検索要求
    が与えられると、その検索要求に対し前記インデクスデ
    ータベースを参照して、そのインデクスデータベース内
    に存在するデータの中の少なくともアドレスデータを前
    記検索要求を出したユーザに提示することを特徴とする
    ネットワーク情報処理方法。
  7. 【請求項7】 ネットワーク上を流れる情報を取得して
    その取得した情報をインデクス処理するインデクス処理
    手段と、 このインデクス処理手段によりインデクス処理された内
    容を保持するインデクスデータベースと、 を有することを特徴とするネットワーク情報処理装置。
  8. 【請求項8】 前記インデクスデータベースは、少なく
    とも、取得された情報内容を表すデータとその情報のあ
    りかを示すアドレスデータの2つのデータが対応付けら
    れて示されるものであることを特徴とする請求項7記載
    のネットワーク情報処理装置。
  9. 【請求項9】 あるユーザから何らかの情報を検索する
    ための検索要求が与えられると、その検索要求に対し前
    記インデクスデータベースを参照して当該検索要求に対
    応したインデクスデータを、前記検索要求を出したユー
    ザに提示する情報検索手段を、前記インデクス処理手段
    とインデクスデータベースとともに有したことを特徴と
    する請求項7または8記載のネットワーク情報処理装
    置。
  10. 【請求項10】 前記ユーザに提示されるインデクスデ
    ータは、前記インデクスデータベース内に存在するデー
    タの中の少なくともアドレスデータであることを特徴と
    する請求項9記載のネットワーク情報処理装置。
  11. 【請求項11】 前記ネットワーク上を流れる情報は、
    ユーザから与えられた閲覧要求に従ってネットワーク上
    から収集される情報であることを特徴とする請求項7か
    ら10のいずれかに記載のネットワーク情報処理装置。
  12. 【請求項12】 ユーザから与えられた閲覧要求を受け
    ると、その閲覧要求に従ってネットワーク上から情報収
    集を行う情報収集手段と、 この情報収集手段により収集された情報を取得してイン
    デクス処理するインデクス処理手段と、 このインデクス処理手段によりインデクス処理された内
    容として、少なくとも、前記取得した情報の内容を表す
    データとその情報を収集するためにユーザが与えた閲覧
    要求としてのアドレスデータの2つのデータが対応付け
    られて示されるインデクスデータベースと、 あるユーザから何らかの情報を検索するための検索要求
    が与えられると、その検索要求に対し前記インデクスデ
    ータベースを参照して、そのインデクスデータベース内
    に存在するデータの中の少なくともアドレスデータを前
    記検索要求を出したユーザに提示する情報検索手段と、 を有することを特徴とするネットワーク情報処理装置。
  13. 【請求項13】 ネットワーク上を流れる情報を取得
    し、その取得した情報をインデクス処理してインデクス
    データベースを作成する手順をその処理プログラムに含
    むことを特徴とするネットワーク情報処理プログラムを
    記録した記録媒体。
  14. 【請求項14】 前記インデクスデータベースは、少な
    くとも、取得された情報内容を表すデータとその情報の
    ありかを示すアドレスデータの2つのデータが対応付け
    られて示されるものであることを特徴とする請求項13
    記載のネットワーク情報処理プログラムを記録した記録
    媒体。
  15. 【請求項15】 あるユーザから何らかの情報を検索す
    るための検索要求が与えられると、その検索要求に対し
    前記インデクスデータベースを参照して当該検索要求に
    対応したインデクスデータを、前記検索要求を出したユ
    ーザに提示する手順をその処理プログラムに含むことを
    特徴とする請求項13または14に記載のネットワーク
    情報処理プログラムを記録した記録媒体。
  16. 【請求項16】 前記ユーザに提示されるインデクスデ
    ータは、前記インデクスデータベース内に存在するデー
    タの中の少なくともアドレスデータであることを特徴と
    する請求項15記載のネットワーク情報処理プログラム
    を記録した記録媒体。
  17. 【請求項17】 前記ネットワーク上を流れる情報は、
    ユーザから与えられた閲覧要求に従ってネットワーク上
    から収集される情報であることを特徴とする請求項13
    から16のいずれかに記載のネットワーク情報処理プロ
    グラムを記録した記録媒体。
  18. 【請求項18】 ユーザから与えられた閲覧要求を受け
    ると、その閲覧要求に従ってネットワーク上から情報収
    集を行う手順と、 収集された情報を前記閲覧要求を出したユーザに転送す
    るとともに、その収集された情報を取得してインデクス
    処理し、少なくとも、取得した情報の内容を表すデータ
    とその情報を収集するためにユーザが与えた閲覧要求と
    してのアドレスデータの2つのデータが対応付けられて
    示されるインデクスデータベースを作成する手順と、 あるユーザから何らかの情報を検索するための検索要求
    が与えられると、その検索要求に対し前記インデクスデ
    ータベースを参照して、そのインデクスデータベース内
    に存在するデータの中の少なくともアドレスデータを前
    記検索要求を出したユーザに提示する手順と、 をその処理プログラムに含むことを特徴とするネットワ
    ーク情報処理プログラムを記録した記録媒体。
JP2000029210A 2000-02-07 2000-02-07 ネットワーク情報処理方法及びネットワーク情報処理装置並びにネットワーク情報処理プログラムを記録した記録媒体 Pending JP2001222535A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000029210A JP2001222535A (ja) 2000-02-07 2000-02-07 ネットワーク情報処理方法及びネットワーク情報処理装置並びにネットワーク情報処理プログラムを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000029210A JP2001222535A (ja) 2000-02-07 2000-02-07 ネットワーク情報処理方法及びネットワーク情報処理装置並びにネットワーク情報処理プログラムを記録した記録媒体

Publications (1)

Publication Number Publication Date
JP2001222535A true JP2001222535A (ja) 2001-08-17

Family

ID=18554504

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000029210A Pending JP2001222535A (ja) 2000-02-07 2000-02-07 ネットワーク情報処理方法及びネットワーク情報処理装置並びにネットワーク情報処理プログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JP2001222535A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008524695A (ja) * 2004-12-17 2008-07-10 クラリア コーポレイション コンピュータネットワークのためのサーチエンジン
WO2008102727A1 (ja) * 2007-02-21 2008-08-28 Nec Corporation インデックス生成装置・システム・プログラム・方法、検索装置・システム・プログラム・方法
JP2011519443A (ja) * 2008-03-28 2011-07-07 アルカテル−ルーセント 少なくとも1つのコンテンツに関する相補データを特定する方法、前記相補データを送信する方法、ならびに関連処理装置およびアプリケーションサーバ
US9495446B2 (en) 2004-12-20 2016-11-15 Gula Consulting Limited Liability Company Method and device for publishing cross-network user behavioral data

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008524695A (ja) * 2004-12-17 2008-07-10 クラリア コーポレイション コンピュータネットワークのためのサーチエンジン
US8078602B2 (en) 2004-12-17 2011-12-13 Claria Innovations, Llc Search engine for a computer network
US9495446B2 (en) 2004-12-20 2016-11-15 Gula Consulting Limited Liability Company Method and device for publishing cross-network user behavioral data
WO2008102727A1 (ja) * 2007-02-21 2008-08-28 Nec Corporation インデックス生成装置・システム・プログラム・方法、検索装置・システム・プログラム・方法
JP2011519443A (ja) * 2008-03-28 2011-07-07 アルカテル−ルーセント 少なくとも1つのコンテンツに関する相補データを特定する方法、前記相補データを送信する方法、ならびに関連処理装置およびアプリケーションサーバ

Similar Documents

Publication Publication Date Title
US7797295B2 (en) User content feeds from user storage devices to a public search engine
US6633867B1 (en) System and method for providing a session query within the context of a dynamic search result set
US6801906B1 (en) Method and apparatus for finding information on the internet
US6212522B1 (en) Searching and conditionally serving bookmark sets based on keywords
KR100885772B1 (ko) 제품 정보를 등록 및 검색하기 위한 방법 및 시스템
US20020198962A1 (en) Method, system, and computer program product for distributing a stored URL and web document set
US20100138425A1 (en) Enhanced search results
JP2009500719A (ja) 画像によるクエリ探索(query−by−imagesearch)及び検索システム
JPH09311869A (ja) インターネット検索サーバ
JP2012256368A (ja) 検索結果にコレクションアイテムを含めるための技術
JP2010508579A (ja) マクロを使用する個別化検索
EP1488643A2 (en) Improved finding of tv anytime web services
JP2000222088A (ja) 情報提供サーバ,仲介サーバ,および閲覧端末
CN101551813A (zh) 网络连接设备、搜索设备及搜集搜索引擎数据源的方法
JP2006099341A (ja) 更新履歴生成装置及びプログラム
JP2002140224A (ja) コンテンツ変更管理方法
US20060116992A1 (en) Internet search environment number system
JP2001222535A (ja) ネットワーク情報処理方法及びネットワーク情報処理装置並びにネットワーク情報処理プログラムを記録した記録媒体
JP2000285052A (ja) Url変換方法および装置
US6754697B1 (en) Method and apparatus for browsing and storing data in a distributed data processing system
JP5297295B2 (ja) WWW情報閲覧システムと方法およびWebブラウザとプログラム
JP2003228584A (ja) サイト情報提供装置、サイト情報提供方法、サイト情報提供システム、プログラム及び記録媒体
JPH11312172A (ja) 情報処理装置及び方法並びにその制御プログラムを記憶した媒体
JP2003271647A (ja) 閲覧ファイルデータ提供方法、閲覧頻度データ提供方法、そのための中継装置、プログラム及び記録媒体
JP4013354B2 (ja) データ固定化システム、データ固定化装置、データ中継装置、情報端末装置、データ固定化プログラムを記録したコンピュータ読み取り可能な記録媒体、データ中継プログラムを記録したコンピュータ読み取り可能な記録媒体、及び情報端末用プログラムを記録したコンピュータ読み取り可能な記録媒体

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070821

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071018

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20071120