JP2001184355A - 情報収集システム、コンテンツサーバ、情報収集装置及び記録媒体 - Google Patents
情報収集システム、コンテンツサーバ、情報収集装置及び記録媒体Info
- Publication number
- JP2001184355A JP2001184355A JP36567399A JP36567399A JP2001184355A JP 2001184355 A JP2001184355 A JP 2001184355A JP 36567399 A JP36567399 A JP 36567399A JP 36567399 A JP36567399 A JP 36567399A JP 2001184355 A JP2001184355 A JP 2001184355A
- Authority
- JP
- Japan
- Prior art keywords
- content
- attribute information
- information
- attribute
- contents
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Transfer Between Computers (AREA)
- Computer And Data Communications (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】
【課題】 コンピュータネットワーク上の通信量が少な
くて済む情報収集システム、情報収集装置、コンテンツ
サーバ及び記録媒体の提供。 【解決手段】 コンテンツサーバ2,2…は、格納して
いるコンテンツの属性を示すコンテンツ属性情報を情報
収集装置1へ送信する。情報収集装置1は、受信したコ
ンテンツ属性情報に基づいて、コンテンツサーバ2,2
…にて更新又は追加されたコンテンツを特定し、特定さ
れたコンテンツの送信要求をコンテンツサーバ2,2…
へ送信する。コンテンツサーバ2,2…は、受信した送
信要求に示されているコンテンツを情報収集装置1へ送
信する。
くて済む情報収集システム、情報収集装置、コンテンツ
サーバ及び記録媒体の提供。 【解決手段】 コンテンツサーバ2,2…は、格納して
いるコンテンツの属性を示すコンテンツ属性情報を情報
収集装置1へ送信する。情報収集装置1は、受信したコ
ンテンツ属性情報に基づいて、コンテンツサーバ2,2
…にて更新又は追加されたコンテンツを特定し、特定さ
れたコンテンツの送信要求をコンテンツサーバ2,2…
へ送信する。コンテンツサーバ2,2…は、受信した送
信要求に示されているコンテンツを情報収集装置1へ送
信する。
Description
【0001】
【発明の属する技術分野】本発明は、ネットワーク上に
存在するコンテンツを収集する情報収集システム、その
情報収集システムの実施に使用するコンテンツサーバ及
び情報収集装置、並びにコンピュータをそのコンテンツ
サーバ及び情報収集装置として機能させる為のコンピュ
ータプログラムが記録されている記録媒体に関する。
存在するコンテンツを収集する情報収集システム、その
情報収集システムの実施に使用するコンテンツサーバ及
び情報収集装置、並びにコンピュータをそのコンテンツ
サーバ及び情報収集装置として機能させる為のコンピュ
ータプログラムが記録されている記録媒体に関する。
【0002】
【従来の技術】インターネットに代表されるコンピュー
タネットワーク上にホームページ等の各種のコンテンツ
が存在している。近年、パーソナルコンピュータを中心
とする情報処理機器の普及に伴い、これらのコンテンツ
は急激に増加する傾向にある。したがって大量のコンテ
ンツを効率的に収集するための技術が従来から提案され
ている。
タネットワーク上にホームページ等の各種のコンテンツ
が存在している。近年、パーソナルコンピュータを中心
とする情報処理機器の普及に伴い、これらのコンテンツ
は急激に増加する傾向にある。したがって大量のコンテ
ンツを効率的に収集するための技術が従来から提案され
ている。
【0003】このようなコンテンツに関する情報(以
下、コンテンツ情報という)を収集する技術として、
「ロボット」と呼ばれるサーチプログラムが従来から用
いられている。このロボットは、HTML(Hyper Text
Markup Language)等で記述されているリンク情報を参
照してその参照先へアクセスし、これを連鎖的に行うこ
とによってコンピュータネットワーク上のコンテンツを
収集するものである。
下、コンテンツ情報という)を収集する技術として、
「ロボット」と呼ばれるサーチプログラムが従来から用
いられている。このロボットは、HTML(Hyper Text
Markup Language)等で記述されているリンク情報を参
照してその参照先へアクセスし、これを連鎖的に行うこ
とによってコンピュータネットワーク上のコンテンツを
収集するものである。
【0004】特開平10−49553号公報では、ロボ
ットがコンテンツを収集するタイミングを最適化するこ
とができる情報収集方法(以下、従来技術1という)が
提案されている。この従来技術1の特徴は、コンテンツ
の更新履歴情報に基づいて各コンテンツを参照する時間
帯をスケジューリングすることによって、各コンテンツ
の更新の頻度と同程度の頻度でコンテンツの参照を行う
ことができることである。これにより、ロボットはコン
テンツの収集を効率的に行うことが可能になる。
ットがコンテンツを収集するタイミングを最適化するこ
とができる情報収集方法(以下、従来技術1という)が
提案されている。この従来技術1の特徴は、コンテンツ
の更新履歴情報に基づいて各コンテンツを参照する時間
帯をスケジューリングすることによって、各コンテンツ
の更新の頻度と同程度の頻度でコンテンツの参照を行う
ことができることである。これにより、ロボットはコン
テンツの収集を効率的に行うことが可能になる。
【0005】また特開平10−240604号公報で
は、更新があった部分のみをコンテンツサーバがクライ
アントへ送信することによって、コンテンツサーバとク
ライアントとの間のデータ転送を効率よく行うことがで
きるコンテンツ管理システム(以下、従来技術2とい
う)が提案されている。この従来技術2を用いた場合、
ロボットは、コンテンツの内容の更新があった部分のみ
をコンテンツサーバから取得することが可能となるた
め、コンピュータネットワークにおけるトラフィックの
増大を防止することができる。
は、更新があった部分のみをコンテンツサーバがクライ
アントへ送信することによって、コンテンツサーバとク
ライアントとの間のデータ転送を効率よく行うことがで
きるコンテンツ管理システム(以下、従来技術2とい
う)が提案されている。この従来技術2を用いた場合、
ロボットは、コンテンツの内容の更新があった部分のみ
をコンテンツサーバから取得することが可能となるた
め、コンピュータネットワークにおけるトラフィックの
増大を防止することができる。
【0006】
【発明が解決しようとする課題】しかしながら、上述し
たような従来のコンテンツ情報収集方法には、以下に説
明する問題点があった。まず、あるコンテンツサーバに
格納されている複数のコンテンツを収集した後に、それ
らのコンテンツの内容が更新されているか否かを判断す
るためには、各コンテンツ夫々に対する更新チェック作
業を行う必要があり、この作業により大きな負荷が発生
するという問題があった。これはコンテンツサーバにお
いて、自身が格納している複数のコンテンツの更新状況
を一括して把握する仕組みが用意されていないためであ
る。その結果、同一のコンテンツサーバに格納されてい
るにもかかわらず、すべてのコンテンツ夫々に対して更
新したか否かを確認しなければならなかった。
たような従来のコンテンツ情報収集方法には、以下に説
明する問題点があった。まず、あるコンテンツサーバに
格納されている複数のコンテンツを収集した後に、それ
らのコンテンツの内容が更新されているか否かを判断す
るためには、各コンテンツ夫々に対する更新チェック作
業を行う必要があり、この作業により大きな負荷が発生
するという問題があった。これはコンテンツサーバにお
いて、自身が格納している複数のコンテンツの更新状況
を一括して把握する仕組みが用意されていないためであ
る。その結果、同一のコンテンツサーバに格納されてい
るにもかかわらず、すべてのコンテンツ夫々に対して更
新したか否かを確認しなければならなかった。
【0007】上述した従来技術1では、最適な頻度でコ
ンテンツの参照を行うためには適切な更新履歴情報を作
成することが不可欠であり、更新履歴情報を作成するた
めには各コンテンツが更新されたか否かをコンテンツ毎
に確認する必要がある。したがって、ロボットに大きな
負荷がかかることになる。
ンテンツの参照を行うためには適切な更新履歴情報を作
成することが不可欠であり、更新履歴情報を作成するた
めには各コンテンツが更新されたか否かをコンテンツ毎
に確認する必要がある。したがって、ロボットに大きな
負荷がかかることになる。
【0008】また上述した従来技術2では、コンテンツ
サーバとクライアントとの間で更新があった部分のみを
送受信するが、この場合もコンテンツ毎に行われるの
で、更新されたコンテンツの数に応じてコンテンツサー
バとクライアントとの間で通信を行う必要がある。した
がって、あるコンテンツサーバにおいて複数のコンテン
ツが更新された場合、複数の通信が発生することにな
り、コンテンツサーバ及びクライアントの両者に対して
大きな負荷がかかることになる。
サーバとクライアントとの間で更新があった部分のみを
送受信するが、この場合もコンテンツ毎に行われるの
で、更新されたコンテンツの数に応じてコンテンツサー
バとクライアントとの間で通信を行う必要がある。した
がって、あるコンテンツサーバにおいて複数のコンテン
ツが更新された場合、複数の通信が発生することにな
り、コンテンツサーバ及びクライアントの両者に対して
大きな負荷がかかることになる。
【0009】さらに、リンク情報を参照することによっ
てあるコンテンツを収集しようとした場合に、そのコン
テンツがコンテンツサーバ上から削除されていたとき
は、ロボット側からコンテンツサーバに対してコンテン
ツの取得依頼メッセージを送信し、所定時間経過した後
に、コンテンツサーバから前記取得依頼に係るコンテン
ツが見つからない旨のメッセージが返信される。したが
って削除されたコンテンツが大量にある場合、これに伴
って前記メッセージが大量に発生し、その結果コンテン
ツサーバ及びクライアントの両者に対して大きな負荷が
かかることになるという問題があった。
てあるコンテンツを収集しようとした場合に、そのコン
テンツがコンテンツサーバ上から削除されていたとき
は、ロボット側からコンテンツサーバに対してコンテン
ツの取得依頼メッセージを送信し、所定時間経過した後
に、コンテンツサーバから前記取得依頼に係るコンテン
ツが見つからない旨のメッセージが返信される。したが
って削除されたコンテンツが大量にある場合、これに伴
って前記メッセージが大量に発生し、その結果コンテン
ツサーバ及びクライアントの両者に対して大きな負荷が
かかることになるという問題があった。
【0010】本発明は斯かる事情に鑑みてなされたもの
であり、情報収集装置からの要求に基づいて、コンテン
ツサーバがコンテンツの属性情報を作成することによっ
て、各コンテンツ毎ではなく複数のコンテンツを格納し
ているコンテンツサーバ毎に、情報収集装置がコンテン
ツの更新状況を知ることができる情報収集システム、そ
の情報収集システムの実施に使用するコンテンツサーバ
及び情報収集装置、並びにコンピュータをそのコンテン
ツサーバ及び情報収集装置として機能させる為のコンピ
ュータプログラムが記録されている記録媒体を提供する
ことを目的とする。
であり、情報収集装置からの要求に基づいて、コンテン
ツサーバがコンテンツの属性情報を作成することによっ
て、各コンテンツ毎ではなく複数のコンテンツを格納し
ているコンテンツサーバ毎に、情報収集装置がコンテン
ツの更新状況を知ることができる情報収集システム、そ
の情報収集システムの実施に使用するコンテンツサーバ
及び情報収集装置、並びにコンピュータをそのコンテン
ツサーバ及び情報収集装置として機能させる為のコンピ
ュータプログラムが記録されている記録媒体を提供する
ことを目的とする。
【0011】また本発明の他の目的は、コンテンツサー
バが作成したコンテンツの属性情報を参照することによ
って、情報収集装置が、コンテンツサーバにて更新、追
加又は削除されたコンテンツがあるか否かを知ることが
できるために、コンテンツの収集に係る通信量が少なく
て済む情報収集システム、並びにコンテンツサーバ、情
報収集装置及び記録媒体の提供にある。
バが作成したコンテンツの属性情報を参照することによ
って、情報収集装置が、コンテンツサーバにて更新、追
加又は削除されたコンテンツがあるか否かを知ることが
できるために、コンテンツの収集に係る通信量が少なく
て済む情報収集システム、並びにコンテンツサーバ、情
報収集装置及び記録媒体の提供にある。
【0012】
【課題を解決するための手段】第1発明に係る情報収集
システムは、複数のコンテンツを格納するコンテンツ格
納部を備えるコンテンツサーバと該コンテンツサーバか
ら前記コンテンツを収集すべくなしてある情報収集装置
とがネットワークを介して接続されてある情報収集シス
テムにおいて、前記情報収集装置は、収集済みのコンテ
ンツの属性を示す収集済みコンテンツ属性情報を格納す
る収集済み属性情報格納部と、コンテンツの取得要求を
前記コンテンツサーバへ送信する手段とを備え、前記コ
ンテンツサーバは、前記コンテンツの取得要求を受信し
た場合、前記コンテンツ格納部に格納してあるコンテン
ツの属性を示すコンテンツ属性情報を作成する属性情報
作成手段と、該属性情報作成手段によって作成されたコ
ンテンツ属性情報を前記情報収集装置へ送信する手段と
を備え、前記情報収集装置は更に、コンテンツ属性情報
を受信した場合、受信したコンテンツ属性情報と前記収
集済み属性情報格納部に格納してある収集済みコンテン
ツ属性情報とを比較する属性情報比較手段と、該属性情
報比較手段による比較の結果、更新又は追加されたコン
テンツがあるか否かを判定する更新追加判定手段と、該
更新追加判定手段によって更新又は追加されたコンテン
ツがあると判定された場合、該更新又は追加されたコン
テンツの送信要求を前記コンテンツサーバへ送信する手
段とを備え、前記コンテンツサーバは更に、前記コンテ
ンツの送信要求を受信した場合、受信したコンテンツの
送信要求に示されているコンテンツを前記情報収集装置
へ送信する手段を備えることを特徴とする。
システムは、複数のコンテンツを格納するコンテンツ格
納部を備えるコンテンツサーバと該コンテンツサーバか
ら前記コンテンツを収集すべくなしてある情報収集装置
とがネットワークを介して接続されてある情報収集シス
テムにおいて、前記情報収集装置は、収集済みのコンテ
ンツの属性を示す収集済みコンテンツ属性情報を格納す
る収集済み属性情報格納部と、コンテンツの取得要求を
前記コンテンツサーバへ送信する手段とを備え、前記コ
ンテンツサーバは、前記コンテンツの取得要求を受信し
た場合、前記コンテンツ格納部に格納してあるコンテン
ツの属性を示すコンテンツ属性情報を作成する属性情報
作成手段と、該属性情報作成手段によって作成されたコ
ンテンツ属性情報を前記情報収集装置へ送信する手段と
を備え、前記情報収集装置は更に、コンテンツ属性情報
を受信した場合、受信したコンテンツ属性情報と前記収
集済み属性情報格納部に格納してある収集済みコンテン
ツ属性情報とを比較する属性情報比較手段と、該属性情
報比較手段による比較の結果、更新又は追加されたコン
テンツがあるか否かを判定する更新追加判定手段と、該
更新追加判定手段によって更新又は追加されたコンテン
ツがあると判定された場合、該更新又は追加されたコン
テンツの送信要求を前記コンテンツサーバへ送信する手
段とを備え、前記コンテンツサーバは更に、前記コンテ
ンツの送信要求を受信した場合、受信したコンテンツの
送信要求に示されているコンテンツを前記情報収集装置
へ送信する手段を備えることを特徴とする。
【0013】第2発明に係る情報収集システムは、複数
のコンテンツを格納するコンテンツ格納部を備えるコン
テンツサーバと該コンテンツサーバから前記コンテンツ
を収集すべくなしてある情報収集装置とがネットワーク
を介して接続されてある情報収集システムにおいて、前
記情報収集装置は、コンテンツの取得要求を前記コンテ
ンツサーバへ送信する手段とを備え、前記コンテンツサ
ーバは、前記情報収集装置へ送信済みのコンテンツの属
性を示す送信済みコンテンツ属性情報を格納する送信済
み属性情報格納部と、前記コンテンツの取得要求を受信
した場合、前記コンテンツ格納部に格納してあるコンテ
ンツの属性を示すコンテンツ属性情報を作成する属性情
報作成手段と、該属性情報作成手段によって作成された
コンテンツ属性情報と前記送信済み属性情報格納部に格
納してある送信済みコンテンツ属性情報とを比較する属
性情報比較手段と、該属性情報比較手段による比較の結
果を示す比較結果情報を前記情報収集装置へ送信する手
段とを備え、前記情報収集装置は更に、前記比較結果情
報を受信した場合、該比較結果情報に基づいて、更新又
は追加されたコンテンツがあるか否かを判定する更新追
加判定手段と、該更新追加判定手段によって更新又は追
加されたコンテンツがあると判定された場合、該更新又
は追加されたコンテンツの送信要求を前記コンテンツサ
ーバへ送信する手段とを備え、前記コンテンツサーバは
更に、前記コンテンツの送信要求を受信した場合、受信
したコンテンツの取得要求に示されているコンテンツを
前記情報収集装置へ送信する手段を備えることを特徴と
する。
のコンテンツを格納するコンテンツ格納部を備えるコン
テンツサーバと該コンテンツサーバから前記コンテンツ
を収集すべくなしてある情報収集装置とがネットワーク
を介して接続されてある情報収集システムにおいて、前
記情報収集装置は、コンテンツの取得要求を前記コンテ
ンツサーバへ送信する手段とを備え、前記コンテンツサ
ーバは、前記情報収集装置へ送信済みのコンテンツの属
性を示す送信済みコンテンツ属性情報を格納する送信済
み属性情報格納部と、前記コンテンツの取得要求を受信
した場合、前記コンテンツ格納部に格納してあるコンテ
ンツの属性を示すコンテンツ属性情報を作成する属性情
報作成手段と、該属性情報作成手段によって作成された
コンテンツ属性情報と前記送信済み属性情報格納部に格
納してある送信済みコンテンツ属性情報とを比較する属
性情報比較手段と、該属性情報比較手段による比較の結
果を示す比較結果情報を前記情報収集装置へ送信する手
段とを備え、前記情報収集装置は更に、前記比較結果情
報を受信した場合、該比較結果情報に基づいて、更新又
は追加されたコンテンツがあるか否かを判定する更新追
加判定手段と、該更新追加判定手段によって更新又は追
加されたコンテンツがあると判定された場合、該更新又
は追加されたコンテンツの送信要求を前記コンテンツサ
ーバへ送信する手段とを備え、前記コンテンツサーバは
更に、前記コンテンツの送信要求を受信した場合、受信
したコンテンツの取得要求に示されているコンテンツを
前記情報収集装置へ送信する手段を備えることを特徴と
する。
【0014】第3発明に係るコンテンツサーバは、複数
のコンテンツを格納するコンテンツ格納部と、コンテン
ツの属性を示すコンテンツ属性情報の取得要求を受信し
た場合、前記コンテンツ格納部に格納してあるコンテン
ツの属性を示すコンテンツ属性情報を作成する属性情報
作成手段と、該属性情報作成手段によって作成されたコ
ンテンツ属性情報を、前記コンテンツ属性情報の取得要
求の送信先へ送信する手段とを備えることを特徴とす
る。
のコンテンツを格納するコンテンツ格納部と、コンテン
ツの属性を示すコンテンツ属性情報の取得要求を受信し
た場合、前記コンテンツ格納部に格納してあるコンテン
ツの属性を示すコンテンツ属性情報を作成する属性情報
作成手段と、該属性情報作成手段によって作成されたコ
ンテンツ属性情報を、前記コンテンツ属性情報の取得要
求の送信先へ送信する手段とを備えることを特徴とす
る。
【0015】第4発明に係る情報収集装置は、ネットワ
ークに接続され、該ネットワーク上に存在する複数のコ
ンテンツを収集すべくなしてある情報収集装置におい
て、収集済みのコンテンツの属性を示す収集済みコンテ
ンツ属性情報を格納する収集済み属性情報格納部と、コ
ンテンツの属性を示すコンテンツ属性情報の取得要求を
コンテンツを格納している格納装置へ送信する手段と該
格納装置からコンテンツ属性情報を受信した場合、受信
したコンテンツ属性情報と前記収集済み属性情報格納部
に格納してある収集済みコンテンツ属性情報とを比較す
る属性情報比較手段と、該属性情報比較手段による比較
の結果、更新又は追加されたコンテンツがあるか否かを
判定する更新追加判定手段と、該更新追加判定手段によ
って更新又は追加されたコンテンツがあると判定された
場合、該更新又は追加されたコンテンツの取得要求を前
記格納装置へ送信する手段とを備えることを特徴とす
る。
ークに接続され、該ネットワーク上に存在する複数のコ
ンテンツを収集すべくなしてある情報収集装置におい
て、収集済みのコンテンツの属性を示す収集済みコンテ
ンツ属性情報を格納する収集済み属性情報格納部と、コ
ンテンツの属性を示すコンテンツ属性情報の取得要求を
コンテンツを格納している格納装置へ送信する手段と該
格納装置からコンテンツ属性情報を受信した場合、受信
したコンテンツ属性情報と前記収集済み属性情報格納部
に格納してある収集済みコンテンツ属性情報とを比較す
る属性情報比較手段と、該属性情報比較手段による比較
の結果、更新又は追加されたコンテンツがあるか否かを
判定する更新追加判定手段と、該更新追加判定手段によ
って更新又は追加されたコンテンツがあると判定された
場合、該更新又は追加されたコンテンツの取得要求を前
記格納装置へ送信する手段とを備えることを特徴とす
る。
【0016】第5発明に係る記録媒体は、複数のコンテ
ンツを格納するコンテンツ格納部を備えるコンピュータ
に、コンテンツの属性を示すコンテンツ属性情報の取得
要求を前記コンピュータが受信した場合、前記コンテン
ツ格納部に格納してあるコンテンツの属性を示すコンテ
ンツ属性情報を作成させるプログラムコード手段と、作
成させたコンテンツ属性情報を、前記コンテンツ属性情
報の取得要求の送信先へ送信させるプログラムコード手
段とを有するプログラムが記録してあることを特徴とす
る。
ンツを格納するコンテンツ格納部を備えるコンピュータ
に、コンテンツの属性を示すコンテンツ属性情報の取得
要求を前記コンピュータが受信した場合、前記コンテン
ツ格納部に格納してあるコンテンツの属性を示すコンテ
ンツ属性情報を作成させるプログラムコード手段と、作
成させたコンテンツ属性情報を、前記コンテンツ属性情
報の取得要求の送信先へ送信させるプログラムコード手
段とを有するプログラムが記録してあることを特徴とす
る。
【0017】第6発明に係る記録媒体は、ネットワーク
に接続されたコンピュータに、該ネットワーク上に存在
する複数のコンテンツを収集させるプログラムが記録し
てあるコンピュータでの読み取りが可能な記録媒体にお
いて、前記コンピュータに、収集済みのコンテンツの属
性を示す収集済みコンテンツ属性情報を格納させるプロ
グラムコード手段と、コンテンツの属性を示すコンテン
ツ属性情報の取得要求をコンテンツを格納している格納
装置へ送信させるプログラムコード手段と前記格納装置
からコンテンツ属性情報を前記コンピュータが受信した
場合、受信したコンテンツ属性情報と前記収集済み属性
情報格納部に格納してある収集済みコンテンツ属性情報
とを比較させるプログラムコード手段と、前記比較の結
果、更新又は追加されたコンテンツがあるか否かを判定
させるプログラムコード手段と、更新又は追加されたコ
ンテンツがあると判定された場合、該更新又は追加され
たコンテンツの取得要求を前記格納装置へ送信させるプ
ログラムコード手段とを有するプログラムが記録してあ
ることを特徴とする。
に接続されたコンピュータに、該ネットワーク上に存在
する複数のコンテンツを収集させるプログラムが記録し
てあるコンピュータでの読み取りが可能な記録媒体にお
いて、前記コンピュータに、収集済みのコンテンツの属
性を示す収集済みコンテンツ属性情報を格納させるプロ
グラムコード手段と、コンテンツの属性を示すコンテン
ツ属性情報の取得要求をコンテンツを格納している格納
装置へ送信させるプログラムコード手段と前記格納装置
からコンテンツ属性情報を前記コンピュータが受信した
場合、受信したコンテンツ属性情報と前記収集済み属性
情報格納部に格納してある収集済みコンテンツ属性情報
とを比較させるプログラムコード手段と、前記比較の結
果、更新又は追加されたコンテンツがあるか否かを判定
させるプログラムコード手段と、更新又は追加されたコ
ンテンツがあると判定された場合、該更新又は追加され
たコンテンツの取得要求を前記格納装置へ送信させるプ
ログラムコード手段とを有するプログラムが記録してあ
ることを特徴とする。
【0018】第1発明、第3発明、第4発明、第5発明
及び第6発明による場合、情報収集装置は、既にコンテ
ンツサーバから収集済みのコンテンツの属性を示すコン
テンツ属性情報を格納する収集済み属性情報格納部を備
えており、新たなコンテンツを取得すべくその取得要求
をコンテンツサーバへ送信する。
及び第6発明による場合、情報収集装置は、既にコンテ
ンツサーバから収集済みのコンテンツの属性を示すコン
テンツ属性情報を格納する収集済み属性情報格納部を備
えており、新たなコンテンツを取得すべくその取得要求
をコンテンツサーバへ送信する。
【0019】この取得要求を受信したコンテンツサーバ
は、コンテンツを格納しているコンテンツ格納部を参照
し、コンテンツ属性情報を作成し、作成したコンテンツ
属性情報を情報収集装置へ送信する。
は、コンテンツを格納しているコンテンツ格納部を参照
し、コンテンツ属性情報を作成し、作成したコンテンツ
属性情報を情報収集装置へ送信する。
【0020】コンテンツ属性情報をコンテンツサーバか
ら受信した情報収集装置は、受信したコンテンツ属性情
報と収集済み属性情報格納部に格納してあるコンテンツ
属性情報とを比較し、その結果更新又は新しく追加され
たコンテンツがある場合、そのコンテンツの送信要求を
コンテンツサーバへ送信する。そしてこの送信要求を受
信したコンテンツサーバは、受信した取得要求に示され
ているコンテンツをコンテンツ格納部から取得し、これ
を情報収集装置へ送信する。
ら受信した情報収集装置は、受信したコンテンツ属性情
報と収集済み属性情報格納部に格納してあるコンテンツ
属性情報とを比較し、その結果更新又は新しく追加され
たコンテンツがある場合、そのコンテンツの送信要求を
コンテンツサーバへ送信する。そしてこの送信要求を受
信したコンテンツサーバは、受信した取得要求に示され
ているコンテンツをコンテンツ格納部から取得し、これ
を情報収集装置へ送信する。
【0021】第2発明による場合、情報収集装置は、コ
ンテンツサーバに対してコンテンツの取得要求を送信
し、この取得要求を受信したコンテンツサーバは、コン
テンツ格納部を参照してコンテンツ属性情報を作成す
る。そしてコンテンツサーバは既に情報収集装置へ送信
済みである送信済みコンテンツ属性情報と、作成したコ
ンテンツ属性情報とを比較し、その比較結果を示す情報
を情報収集装置へ送信する。
ンテンツサーバに対してコンテンツの取得要求を送信
し、この取得要求を受信したコンテンツサーバは、コン
テンツ格納部を参照してコンテンツ属性情報を作成す
る。そしてコンテンツサーバは既に情報収集装置へ送信
済みである送信済みコンテンツ属性情報と、作成したコ
ンテンツ属性情報とを比較し、その比較結果を示す情報
を情報収集装置へ送信する。
【0022】そして、情報収集装置は、更新又は新しく
追加されたコンテンツがあるか否かを、コンテンツサー
バから受信した前記情報に基づいて判別し、このような
コンテンツがある場合、そのコンテンツの送信要求をコ
ンテンツサーバへ送信する。そしてこの送信要求を受信
したコンテンツサーバは、受信した送信要求に示されて
いるコンテンツをコンテンツ格納部から取得し、これを
情報収集装置へ送信する。
追加されたコンテンツがあるか否かを、コンテンツサー
バから受信した前記情報に基づいて判別し、このような
コンテンツがある場合、そのコンテンツの送信要求をコ
ンテンツサーバへ送信する。そしてこの送信要求を受信
したコンテンツサーバは、受信した送信要求に示されて
いるコンテンツをコンテンツ格納部から取得し、これを
情報収集装置へ送信する。
【0023】このように、コンテンツサーバがコンテン
ツ属性情報を作成することによって、コンテンツサーバ
のコンテンツ格納部に格納している複数のコンテンツの
更新状況を一括して把握することができるため、情報収
集装置は、各コンテンツ毎ではなく、各コンテンツサー
バ毎に更新状況を知ることができる。そしてこの更新状
況に基づいて更新又は新しく追加されたコンテンツを特
定し、特定したコンテンツのみをコンテンツサーバから
取得することによって、従来よりも少ない通信量で効率
よくコンテンツの収集を行うことができる。
ツ属性情報を作成することによって、コンテンツサーバ
のコンテンツ格納部に格納している複数のコンテンツの
更新状況を一括して把握することができるため、情報収
集装置は、各コンテンツ毎ではなく、各コンテンツサー
バ毎に更新状況を知ることができる。そしてこの更新状
況に基づいて更新又は新しく追加されたコンテンツを特
定し、特定したコンテンツのみをコンテンツサーバから
取得することによって、従来よりも少ない通信量で効率
よくコンテンツの収集を行うことができる。
【0024】
【発明の実施の形態】以下、本発明をその実施の形態を
示す図面を参照して詳述する。 (実施の形態1)図1は、実施の形態1における本発明
の情報収集システムの構成を示すブロック図である。図
1において、1は情報収集装置を示しており、情報収集
装置1は接続装置101を介してインターネット等のネ
ットワーク3に接続されており、また同様にして複数の
コンテンツサーバ2,2…も接続装置201,201…
を介してネットワーク3に接続されている。この情報収
集装置1は、各コンテンツサーバ2,2…夫々に格納さ
れている複数のコンテンツを収集するための装置であ
る。
示す図面を参照して詳述する。 (実施の形態1)図1は、実施の形態1における本発明
の情報収集システムの構成を示すブロック図である。図
1において、1は情報収集装置を示しており、情報収集
装置1は接続装置101を介してインターネット等のネ
ットワーク3に接続されており、また同様にして複数の
コンテンツサーバ2,2…も接続装置201,201…
を介してネットワーク3に接続されている。この情報収
集装置1は、各コンテンツサーバ2,2…夫々に格納さ
れている複数のコンテンツを収集するための装置であ
る。
【0025】図2は、実施の形態1における本発明の情
報収集装置1の構成を示すブロック図である。図2にお
いて、情報収集装置1はCPU11を有し、該CPU1
1に対して、CPU11において発生するデータを記憶
するRAM12、実施の形態1における本発明の情報収
集装置のプログラムが記録されているCD−ROM又は
フレキシブルディスク等の可搬型記録媒体100から前
記プログラムを読み取るCD−ROMドライブ又はフレ
キシブルディスクドライブ等からなる外部記憶装置1
3、外部記憶装置13により読み取った本発明のプログ
ラムを格納するハードディスク14、キーボード及びマ
ウス等の入力装置からなる入力部15、入出力画面を表
示するディスプレイ16、並びに外部と通信を行うため
の通信インタフェース17が接続されている。またハー
ドディスク14は、後述する3つのデータベース(収集
済み属性情報DB141、コンテンツ写しDB142及
びコンテンツDB143)を有している。
報収集装置1の構成を示すブロック図である。図2にお
いて、情報収集装置1はCPU11を有し、該CPU1
1に対して、CPU11において発生するデータを記憶
するRAM12、実施の形態1における本発明の情報収
集装置のプログラムが記録されているCD−ROM又は
フレキシブルディスク等の可搬型記録媒体100から前
記プログラムを読み取るCD−ROMドライブ又はフレ
キシブルディスクドライブ等からなる外部記憶装置1
3、外部記憶装置13により読み取った本発明のプログ
ラムを格納するハードディスク14、キーボード及びマ
ウス等の入力装置からなる入力部15、入出力画面を表
示するディスプレイ16、並びに外部と通信を行うため
の通信インタフェース17が接続されている。またハー
ドディスク14は、後述する3つのデータベース(収集
済み属性情報DB141、コンテンツ写しDB142及
びコンテンツDB143)を有している。
【0026】情報収集装置1は、通信インタフェース1
7を介してルータ等の接続装置101と接続されてい
る。そしてこの接続装置101によりインターネット等
のネットワーク3に接続されている。
7を介してルータ等の接続装置101と接続されてい
る。そしてこの接続装置101によりインターネット等
のネットワーク3に接続されている。
【0027】実施の形態1における本発明の情報収集装
置のプログラムは可搬型記録媒体100から読み取る以
外にも、ネットワーク3を介して外部サーバコンピュー
タ110に接続し、外部サーバコンピュータ110に内
蔵された前記プログラムを記録してある記録媒体111
から情報収集装置1へ前記プログラムをダウンロードす
ることによりハードディスク14に格納し、格納された
プログラムをCPU11がRAM12にロードすること
によって、情報収集装置1は後述する処理を実行するこ
とができる。
置のプログラムは可搬型記録媒体100から読み取る以
外にも、ネットワーク3を介して外部サーバコンピュー
タ110に接続し、外部サーバコンピュータ110に内
蔵された前記プログラムを記録してある記録媒体111
から情報収集装置1へ前記プログラムをダウンロードす
ることによりハードディスク14に格納し、格納された
プログラムをCPU11がRAM12にロードすること
によって、情報収集装置1は後述する処理を実行するこ
とができる。
【0028】図3は、実施の形態1における本発明のコ
ンテンツサーバ2,2…の構成を示すブロック図であ
る。図3において、コンテンツサーバ2,2…はCPU
21を有し、該CPU21に対して、CPU21におい
て発生するデータを記憶するRAM22、実施の形態1
における本発明のコンテンツサーバのプログラムが記録
されているCD−ROM又はフレキシブルディスク等の
可搬型記録媒体200から前記プログラムを読み取るC
D−ROMドライブ又はフレキシブルディスクドライブ
等からなる外部記憶装置23、外部記憶装置23により
読み取った本発明のプログラムを格納するハードディス
ク24、キーボード及びマウス等の入力装置からなる入
力部25、入出力画面を表示するディスプレイ26、並
びに外部と通信を行うための通信インタフェース27が
接続されている。またハードディスク24は、複数のコ
ンテンツを格納しているコンテンツDB241を有して
いる。
ンテンツサーバ2,2…の構成を示すブロック図であ
る。図3において、コンテンツサーバ2,2…はCPU
21を有し、該CPU21に対して、CPU21におい
て発生するデータを記憶するRAM22、実施の形態1
における本発明のコンテンツサーバのプログラムが記録
されているCD−ROM又はフレキシブルディスク等の
可搬型記録媒体200から前記プログラムを読み取るC
D−ROMドライブ又はフレキシブルディスクドライブ
等からなる外部記憶装置23、外部記憶装置23により
読み取った本発明のプログラムを格納するハードディス
ク24、キーボード及びマウス等の入力装置からなる入
力部25、入出力画面を表示するディスプレイ26、並
びに外部と通信を行うための通信インタフェース27が
接続されている。またハードディスク24は、複数のコ
ンテンツを格納しているコンテンツDB241を有して
いる。
【0029】コンテンツサーバ2,2…は、通信インタ
フェース27を介してルータ等の接続装置201と接続
されている。そしてこの接続装置201によりインター
ネット等のネットワーク3に接続されている。
フェース27を介してルータ等の接続装置201と接続
されている。そしてこの接続装置201によりインター
ネット等のネットワーク3に接続されている。
【0030】実施の形態1における本発明のコンテンツ
サーバのプログラムは可搬型記録媒体200から読み取
る以外にも、ネットワーク3を介して外部サーバコンピ
ュータ210に接続し、外部サーバコンピュータ210
に内蔵された前記プログラムを記録してある記録媒体2
11からコンテンツサーバ2,2…へ前記プログラムを
ダウンロードすることによりハードディスク24に格納
し、格納されたプログラムをCPU21がRAM22に
ロードすることによって、コンテンツサーバ2,2…は
後述する処理を実行することができる。
サーバのプログラムは可搬型記録媒体200から読み取
る以外にも、ネットワーク3を介して外部サーバコンピ
ュータ210に接続し、外部サーバコンピュータ210
に内蔵された前記プログラムを記録してある記録媒体2
11からコンテンツサーバ2,2…へ前記プログラムを
ダウンロードすることによりハードディスク24に格納
し、格納されたプログラムをCPU21がRAM22に
ロードすることによって、コンテンツサーバ2,2…は
後述する処理を実行することができる。
【0031】なお、本発明のコンテンツサーバのプログ
ラムはCGI(Common Gateway Interface)を用いて実
現されている。したがって、既存のWWW(World Wide
Web)サーバに容易に実装することができる。
ラムはCGI(Common Gateway Interface)を用いて実
現されている。したがって、既存のWWW(World Wide
Web)サーバに容易に実装することができる。
【0032】次に情報収集装置1のハードディスク14
が有している上述した3つのデータベースについて説明
する。第1のデータベースである収集済み属性情報DB
141は、コンテンツサーバ2,2…から既に収集して
あるコンテンツの属性を示すコンテンツ属性情報を格納
するデータベースである。この収集済み属性情報DB1
41に格納されているファイルは、コンテンツサーバ
2,2…からコンテンツを受信する都度、後述する手順
にしたがって作成され更新される。したがって、コンテ
ンツサーバ2,2…からコンテンツを受信する前の時点
では、前回コンテンツを収集した際のコンテンツ属性情
報が記録されている。以下、この収集済み属性情報DB
141に格納されているファイルを前回属性情報ファイ
ルという。
が有している上述した3つのデータベースについて説明
する。第1のデータベースである収集済み属性情報DB
141は、コンテンツサーバ2,2…から既に収集して
あるコンテンツの属性を示すコンテンツ属性情報を格納
するデータベースである。この収集済み属性情報DB1
41に格納されているファイルは、コンテンツサーバ
2,2…からコンテンツを受信する都度、後述する手順
にしたがって作成され更新される。したがって、コンテ
ンツサーバ2,2…からコンテンツを受信する前の時点
では、前回コンテンツを収集した際のコンテンツ属性情
報が記録されている。以下、この収集済み属性情報DB
141に格納されているファイルを前回属性情報ファイ
ルという。
【0033】図4(a)は前回属性情報ファイルのフォ
ーマットを示す概念図である。図4(a)に示すとお
り、このファイルには、ディレクトリ名フィールドF
1、ファイル名フィールドF2、更新日時フィールドF
3及び差分フラグフィールドF4の4つのフィールドが
用意されている。
ーマットを示す概念図である。図4(a)に示すとお
り、このファイルには、ディレクトリ名フィールドF
1、ファイル名フィールドF2、更新日時フィールドF
3及び差分フラグフィールドF4の4つのフィールドが
用意されている。
【0034】ディレクトリ名フィールドF1には、各レ
コードに係るコンテンツがコンテンツサーバ2,2…に
おいて置かれているディレクトリの名称が格納されてい
る。またファイル名フィールドF2には、前記コンテン
ツに相当するファイルの名称が格納されており、更新日
時フィールドF3には、このコンテンツの最新の更新日
時が格納されている。さらに差分フラグフィールドF4
には、後述する差分情報ファイル作成処理によって設定
される差分フラグが格納されている。
コードに係るコンテンツがコンテンツサーバ2,2…に
おいて置かれているディレクトリの名称が格納されてい
る。またファイル名フィールドF2には、前記コンテン
ツに相当するファイルの名称が格納されており、更新日
時フィールドF3には、このコンテンツの最新の更新日
時が格納されている。さらに差分フラグフィールドF4
には、後述する差分情報ファイル作成処理によって設定
される差分フラグが格納されている。
【0035】図4(b)は差分フラグフィールドF4に
格納されている差分フラグの値とその意味との対応を示
す概念図である。図4(b)に示すとおり、差分フラグ
の値が1の場合は対象となっているコンテンツが変更さ
れていないことを、2の場合はそのコンテンツが更新さ
れていることを、3の場合はそのコンテンツが新たに追
加されていることを、4の場合はそのコンテンツが削除
されていることを夫々意味している。
格納されている差分フラグの値とその意味との対応を示
す概念図である。図4(b)に示すとおり、差分フラグ
の値が1の場合は対象となっているコンテンツが変更さ
れていないことを、2の場合はそのコンテンツが更新さ
れていることを、3の場合はそのコンテンツが新たに追
加されていることを、4の場合はそのコンテンツが削除
されていることを夫々意味している。
【0036】第2のデータベースであるコンテンツ写し
DB142は、コンテンツサーバ2,2…にて更新又は
新たに追加されたコンテンツを、後述する手順にしたが
ってコンテンツサーバ2,2…から受信し、この受信し
たコンテンツを一時的に格納するデータベースである。
DB142は、コンテンツサーバ2,2…にて更新又は
新たに追加されたコンテンツを、後述する手順にしたが
ってコンテンツサーバ2,2…から受信し、この受信し
たコンテンツを一時的に格納するデータベースである。
【0037】第3のデータベースであるコンテンツDB
143は、コンテンツサーバ2,2…から収集したコン
テンツを格納するデータベースである。後述する手順に
したがってコンテンツの更新、追加、削除等が行われ
る。
143は、コンテンツサーバ2,2…から収集したコン
テンツを格納するデータベースである。後述する手順に
したがってコンテンツの更新、追加、削除等が行われ
る。
【0038】次に、実施の形態1における本発明の情報
収集システムの動作について説明する。図5は、実施の
形態1における本発明の情報収集システムの動作の流れ
を示すフローチャートである。なおこれらの処理は、1
本の縦破線により2つの領域に分けられており、左側の
領域の処理はコンテンツサーバ2,2…が行う処理を、
右側の領域の処理は情報収集装置1が行う処理を夫々示
している。
収集システムの動作について説明する。図5は、実施の
形態1における本発明の情報収集システムの動作の流れ
を示すフローチャートである。なおこれらの処理は、1
本の縦破線により2つの領域に分けられており、左側の
領域の処理はコンテンツサーバ2,2…が行う処理を、
右側の領域の処理は情報収集装置1が行う処理を夫々示
している。
【0039】情報収集装置1は、コンテンツサーバ2,
2…に対して、コンテンツの取得要求を送信する(S1
01)。この取得要求の送信は、オペレータによって予
め設定されたスケジュールにしたがって定期的に行われ
る。なお、取得要求の送信の都度、オペレータが入力部
15を用いて情報収集装置1に指示することによって、
不定期にコンテンツサーバ2,2…へ送信するようにし
てもよい。
2…に対して、コンテンツの取得要求を送信する(S1
01)。この取得要求の送信は、オペレータによって予
め設定されたスケジュールにしたがって定期的に行われ
る。なお、取得要求の送信の都度、オペレータが入力部
15を用いて情報収集装置1に指示することによって、
不定期にコンテンツサーバ2,2…へ送信するようにし
てもよい。
【0040】前記取得要求を情報収集装置1から受信し
たコンテンツサーバ2,2…は、コンテンツDB241
を参照し(S102)、コンテンツ属性情報を作成する
(S103)。
たコンテンツサーバ2,2…は、コンテンツDB241
を参照し(S102)、コンテンツ属性情報を作成する
(S103)。
【0041】図6は、コンテンツサーバ2,2…が作成
するコンテンツ属性情報のフォーマットを示す概念図で
ある。図6に示すとおり、このファイルには、ディレク
トリ名フィールドF11、ファイル名フィールドF21
及び更新日時フィールドF31の3つのフィールドが用
意されている。差分フラグフィールドがないことを除い
て、図4(a)に示した収集済み属性情報ファイルのフ
ォーマットと同じであり、各フィールドに格納されるデ
ータは上述したディレクトリ名フィールドF1、ファイ
ル名フィールドF2及び更新日時フィールドF3と同様
であるので説明は省略する。
するコンテンツ属性情報のフォーマットを示す概念図で
ある。図6に示すとおり、このファイルには、ディレク
トリ名フィールドF11、ファイル名フィールドF21
及び更新日時フィールドF31の3つのフィールドが用
意されている。差分フラグフィールドがないことを除い
て、図4(a)に示した収集済み属性情報ファイルのフ
ォーマットと同じであり、各フィールドに格納されるデ
ータは上述したディレクトリ名フィールドF1、ファイ
ル名フィールドF2及び更新日時フィールドF3と同様
であるので説明は省略する。
【0042】コンテンツサーバ2,2…は、ステップS
103にて作成したコンテンツ属性情報を情報収集装置
1へ送信する(S104)。
103にて作成したコンテンツ属性情報を情報収集装置
1へ送信する(S104)。
【0043】最新属性情報をコンテンツサーバ2,2…
から受信した情報収集装置1は、次に説明する差分情報
ファイル作成処理を実行する(S105)。
から受信した情報収集装置1は、次に説明する差分情報
ファイル作成処理を実行する(S105)。
【0044】図7は、実施の形態1における本発明の情
報収集装置1の差分情報ファイル作成処理の処理手順を
示すフローチャートである。ここで作成される差分情報
ファイルは上述した前回属性情報ファイルと同じフォー
マットで情報が記録されているファイルである。
報収集装置1の差分情報ファイル作成処理の処理手順を
示すフローチャートである。ここで作成される差分情報
ファイルは上述した前回属性情報ファイルと同じフォー
マットで情報が記録されているファイルである。
【0045】情報収集装置1は、コンテンツサーバ2,
2…から受信したコンテンツ属性情報を差分情報ファイ
ルとしてRAM12に記憶する(S201)。次に収集
済み属性情報DB141を参照し、前回属性情報ファイ
ルを取得する(S202)。
2…から受信したコンテンツ属性情報を差分情報ファイ
ルとしてRAM12に記憶する(S201)。次に収集
済み属性情報DB141を参照し、前回属性情報ファイ
ルを取得する(S202)。
【0046】次に情報収集装置1は、差分情報ファイル
の内容と、ステップS201にて取得した前回属性情報
ファイルの内容とを各コンテンツ毎に比較し、次に説明
する処理手順にしたがって差分情報ファイルを完成させ
る。以下、処理対象となっているレコードのことを処理
対象レコードという。
の内容と、ステップS201にて取得した前回属性情報
ファイルの内容とを各コンテンツ毎に比較し、次に説明
する処理手順にしたがって差分情報ファイルを完成させ
る。以下、処理対象となっているレコードのことを処理
対象レコードという。
【0047】まず情報収集装置1は、差分情報ファイル
中の任意のレコードを処理対象レコードに設定した後
(S203)、この処理レコードのファイル名フィール
ドF2に格納されているファイル名を参照し、このファ
イル名と同じファイル名をファイル名フィールドF2に
格納しているレコード(以下、比較対象レコードとい
う)が前回属性情報ファイル中に存在するか否かを判定
する(S204)。
中の任意のレコードを処理対象レコードに設定した後
(S203)、この処理レコードのファイル名フィール
ドF2に格納されているファイル名を参照し、このファ
イル名と同じファイル名をファイル名フィールドF2に
格納しているレコード(以下、比較対象レコードとい
う)が前回属性情報ファイル中に存在するか否かを判定
する(S204)。
【0048】ステップS204にて比較対象レコードが
存在すると判定した場合(S204でYES)、処理対
象レコード及び比較対象レコードの更新日時フィールド
F3を参照し、更新日時が同じであるか否かを判定する
(S205)。ここで更新日時が同じであると判定した
場合(S205でYES)、処理対象レコードの差分フ
ラグフィールドF4に1をセットする(S206)。こ
れによりこの処理対象レコードに係るコンテンツは前回
収集したときから変更されていないことが示されること
になる。
存在すると判定した場合(S204でYES)、処理対
象レコード及び比較対象レコードの更新日時フィールド
F3を参照し、更新日時が同じであるか否かを判定する
(S205)。ここで更新日時が同じであると判定した
場合(S205でYES)、処理対象レコードの差分フ
ラグフィールドF4に1をセットする(S206)。こ
れによりこの処理対象レコードに係るコンテンツは前回
収集したときから変更されていないことが示されること
になる。
【0049】一方、ステップS205にて更新日時が同
じではないと判定した場合(S205でNO)、処理対
象レコードの差分フラグフィールドF4に2をセットす
る(S207)。これによりこの処理対象レコードに係
るコンテンツは前回収集したときから更新されているこ
とが示される。
じではないと判定した場合(S205でNO)、処理対
象レコードの差分フラグフィールドF4に2をセットす
る(S207)。これによりこの処理対象レコードに係
るコンテンツは前回収集したときから更新されているこ
とが示される。
【0050】また、ステップS204にて比較対象レコ
ードが存在しないと判定した場合(S204でNO)、
処理対象レコードの差分フラグフィールドF4に3をセ
ットする(S208)。これによりこの処理対象レコー
ドに係るコンテンツは前回収集した際には存在していな
かったもので、新たに追加されたものであることが示さ
れる。
ードが存在しないと判定した場合(S204でNO)、
処理対象レコードの差分フラグフィールドF4に3をセ
ットする(S208)。これによりこの処理対象レコー
ドに係るコンテンツは前回収集した際には存在していな
かったもので、新たに追加されたものであることが示さ
れる。
【0051】ステップS206、S207又はS208
にて差分フラグフィールドF4に差分フラグの値をセッ
トした後、情報収集装置1は、差分情報ファイルの全レ
コードに対する処理が終了したか否かを判定する(S2
09)。ここでまだ処理をしていないレコードがある場
合(S209でNO)、未処理のレコードを処理対象レ
コードに設定し(S210)、ステップS204に戻
る。
にて差分フラグフィールドF4に差分フラグの値をセッ
トした後、情報収集装置1は、差分情報ファイルの全レ
コードに対する処理が終了したか否かを判定する(S2
09)。ここでまだ処理をしていないレコードがある場
合(S209でNO)、未処理のレコードを処理対象レ
コードに設定し(S210)、ステップS204に戻
る。
【0052】一方、ステップS209にて差分情報ファ
イルの全レコードに対する処理が終了したと判定した場
合(S209でYES)、前回属性情報ファイルを参照
し、比較対象レコードとなっていないレコードが有るか
否かを判定する(S211)。ここでこのようなレコー
ドが有る場合(S211でYES)、そのレコードの差
分フラグフィールドF4に4を設定した後(S21
2)、差分情報ファイルに格納する(S213)。これ
によりこの格納されたレコードに係るコンテンツは前回
収集した際には存在していたが、コンテンツサーバ2,
2…にて削除されたものであることが示される。
イルの全レコードに対する処理が終了したと判定した場
合(S209でYES)、前回属性情報ファイルを参照
し、比較対象レコードとなっていないレコードが有るか
否かを判定する(S211)。ここでこのようなレコー
ドが有る場合(S211でYES)、そのレコードの差
分フラグフィールドF4に4を設定した後(S21
2)、差分情報ファイルに格納する(S213)。これ
によりこの格納されたレコードに係るコンテンツは前回
収集した際には存在していたが、コンテンツサーバ2,
2…にて削除されたものであることが示される。
【0053】上述した処理によって差分情報ファイルを
作成した情報収集装置1は、次回のコンテンツ収集時に
前回属性情報ファイルとして用いるために、作成した差
分情報ファイルを収集済み属性情報DB141に格納す
る(S106)。また情報収集装置1は、この差分情報
ファイルを参照して、差分フラグの値が2又は3である
レコードを抽出し、抽出されたレコードに係るディレク
トリ名フィールドF1及びファイル名フィールドF2の
値を用いて収集コンテンツリストを作成する(S10
7)。差分フラグの値が2又は3であるということは、
上述したように、コンテンツサーバ2,2…にて更新又
は新たに追加されたコンテンツを意味しているので、こ
のようなコンテンツに係るディレクトリ名及びファイル
名が収集コンテンツリストに記録されていることにな
る。
作成した情報収集装置1は、次回のコンテンツ収集時に
前回属性情報ファイルとして用いるために、作成した差
分情報ファイルを収集済み属性情報DB141に格納す
る(S106)。また情報収集装置1は、この差分情報
ファイルを参照して、差分フラグの値が2又は3である
レコードを抽出し、抽出されたレコードに係るディレク
トリ名フィールドF1及びファイル名フィールドF2の
値を用いて収集コンテンツリストを作成する(S10
7)。差分フラグの値が2又は3であるということは、
上述したように、コンテンツサーバ2,2…にて更新又
は新たに追加されたコンテンツを意味しているので、こ
のようなコンテンツに係るディレクトリ名及びファイル
名が収集コンテンツリストに記録されていることにな
る。
【0054】ステップS107にて収集コンテンツリス
トを作成した後、情報収集装置1は、作成した収集コン
テンツリストをコンテンツサーバ2,2…へ送信する
(S108)。
トを作成した後、情報収集装置1は、作成した収集コン
テンツリストをコンテンツサーバ2,2…へ送信する
(S108)。
【0055】収集コンテンツリストを情報収集装置1か
ら受信したコンテンツサーバ2,2…は、受信した収集
コンテンツリストに示されているコンテンツを情報収集
装置1へ送信する(S109)。
ら受信したコンテンツサーバ2,2…は、受信した収集
コンテンツリストに示されているコンテンツを情報収集
装置1へ送信する(S109)。
【0056】コンテンツをコンテンツサーバ2,2…か
ら受信した情報収集装置1は、受信したコンテンツをコ
ンテンツ写しDB142に格納することによって、コン
テンツ写しDB142の更新作業を行う(S110)。
そしてステップS205にて作成した差分情報ファイル
を参照して差分フラグの値が4であるレコードを抽出
し、抽出したレコードに係るディレクトリ名及びファイ
ル名で特定されるコンテンツをコンテンツDB143か
ら削除し、さらにコンテンツ写しDB142に格納され
たコンテンツをコンテンツDB143に格納することに
よって、コンテンツDB143の更新作業を行う(S1
11)。
ら受信した情報収集装置1は、受信したコンテンツをコ
ンテンツ写しDB142に格納することによって、コン
テンツ写しDB142の更新作業を行う(S110)。
そしてステップS205にて作成した差分情報ファイル
を参照して差分フラグの値が4であるレコードを抽出
し、抽出したレコードに係るディレクトリ名及びファイ
ル名で特定されるコンテンツをコンテンツDB143か
ら削除し、さらにコンテンツ写しDB142に格納され
たコンテンツをコンテンツDB143に格納することに
よって、コンテンツDB143の更新作業を行う(S1
11)。
【0057】これにより、情報収集装置1は、コンテン
ツサーバ2,2…にて更新又は新たに追加されたコンテ
ンツのみを収集し、またコンテンツサーバ2,2…にて
削除されたコンテンツをコンテンツDB143から削除
することができる。これにより収集したコンテンツの整
理を行うことができる。また、これらの処理は、各コン
テンツ毎ではなく、各コンテンツサーバ2,2…毎に行
うことができるので、従来に比し少ない通信量で足り
る。
ツサーバ2,2…にて更新又は新たに追加されたコンテ
ンツのみを収集し、またコンテンツサーバ2,2…にて
削除されたコンテンツをコンテンツDB143から削除
することができる。これにより収集したコンテンツの整
理を行うことができる。また、これらの処理は、各コン
テンツ毎ではなく、各コンテンツサーバ2,2…毎に行
うことができるので、従来に比し少ない通信量で足り
る。
【0058】(実施の形態2)図8は、実施の形態2に
おける本発明の情報収集システムの構成を示すブロック
図である。図8において、4は情報収集装置を示してお
り、情報収集装置4は接続装置401を介してインター
ネット等のネットワーク3に接続されており、また同様
にして複数のコンテンツサーバ5,5…も接続装置50
1,501…を介してネットワーク3に接続されてい
る。この情報収集装置4は、各コンテンツサーバ5,5
…夫々に格納されている複数のコンテンツを収集するた
めの装置である。
おける本発明の情報収集システムの構成を示すブロック
図である。図8において、4は情報収集装置を示してお
り、情報収集装置4は接続装置401を介してインター
ネット等のネットワーク3に接続されており、また同様
にして複数のコンテンツサーバ5,5…も接続装置50
1,501…を介してネットワーク3に接続されてい
る。この情報収集装置4は、各コンテンツサーバ5,5
…夫々に格納されている複数のコンテンツを収集するた
めの装置である。
【0059】図9は実施の形態2における本発明の情報
収集装置4の構成を示すブロック図である。図9におい
て、情報収集装置4はCPU41を有し、該CPU41
に対して、CPU41において発生するデータを記憶す
るRAM42、実施の形態2における本発明の情報収集
装置のプログラムが記録されているCD−ROM又はフ
レキシブルディスク等の可搬型記録媒体400から前記
プログラムを読み取るCD−ROMドライブ又はフレキ
シブルディスクドライブ等からなる外部記憶装置43、
外部記憶装置43により読み取った本発明のプログラム
を格納するハードディスク44、キーボード及びマウス
等の入力装置からなる入力部45、入出力画面を表示す
るディスプレイ46、並びに外部と通信を行うための通
信インタフェース47が接続されている。またハードデ
ィスク44は、コンテンツ写しDB441及びコンテン
ツDB442を有している。なお、このコンテンツ写し
DB441及びコンテンツDB442は、実施の形態1
における情報収集装置1が備えているコンテンツ写しD
B142及びコンテンツDB143と同じデータベース
である。
収集装置4の構成を示すブロック図である。図9におい
て、情報収集装置4はCPU41を有し、該CPU41
に対して、CPU41において発生するデータを記憶す
るRAM42、実施の形態2における本発明の情報収集
装置のプログラムが記録されているCD−ROM又はフ
レキシブルディスク等の可搬型記録媒体400から前記
プログラムを読み取るCD−ROMドライブ又はフレキ
シブルディスクドライブ等からなる外部記憶装置43、
外部記憶装置43により読み取った本発明のプログラム
を格納するハードディスク44、キーボード及びマウス
等の入力装置からなる入力部45、入出力画面を表示す
るディスプレイ46、並びに外部と通信を行うための通
信インタフェース47が接続されている。またハードデ
ィスク44は、コンテンツ写しDB441及びコンテン
ツDB442を有している。なお、このコンテンツ写し
DB441及びコンテンツDB442は、実施の形態1
における情報収集装置1が備えているコンテンツ写しD
B142及びコンテンツDB143と同じデータベース
である。
【0060】情報収集装置4は、通信インタフェース4
7を介してルータ等の接続装置401と接続されてい
る。そしてこの接続装置401によりインターネット等
のネットワーク3に接続されている。
7を介してルータ等の接続装置401と接続されてい
る。そしてこの接続装置401によりインターネット等
のネットワーク3に接続されている。
【0061】実施の形態2おける本発明の情報収集装置
のプログラムは、可搬型記録媒体400から読み取る以
外にも、ネットワーク3を介して外部サーバコンピュー
タ410に接続し、外部サーバコンピュータ410に内
蔵された前記プログラムを記録してある記録媒体411
から情報収集装置4へ前記プログラムをダウンロードす
ることによりハードディスク44に格納し、格納された
プログラムをCPU41がRAM42にロードすること
によって、情報収集装置4は後述する処理を実行するこ
とができる。
のプログラムは、可搬型記録媒体400から読み取る以
外にも、ネットワーク3を介して外部サーバコンピュー
タ410に接続し、外部サーバコンピュータ410に内
蔵された前記プログラムを記録してある記録媒体411
から情報収集装置4へ前記プログラムをダウンロードす
ることによりハードディスク44に格納し、格納された
プログラムをCPU41がRAM42にロードすること
によって、情報収集装置4は後述する処理を実行するこ
とができる。
【0062】図10は、実施の形態2における本発明の
コンテンツサーバ5,5…の構成を示すブロック図であ
る。図10において、コンテンツサーバ5,5…はCP
U51を有し、該CPU51に対して、CPU51にお
いて発生するデータを記憶するRAM52、実施の形態
2におけるコンテンツサーバの本発明のプログラムが記
録されているCD−ROM又はフレキシブルディスク等
の可搬型記録媒体500から前記プログラムを読み取る
CD−ROMドライブ又はフレキシブルディスクドライ
ブ等からなる外部記憶装置53、外部記憶装置53によ
り読み取った本発明のプログラムを格納するハードディ
スク54、キーボード及びマウス等の入力装置からなる
入力部55、入出力画面を表示するディスプレイ56、
並びに外部と通信を行うための通信インタフェース57
が接続されている。またハードディスク54は、複数の
コンテンツを格納しているコンテンツDB541、及び
後述する送信済み属性情報DB542を有している。
コンテンツサーバ5,5…の構成を示すブロック図であ
る。図10において、コンテンツサーバ5,5…はCP
U51を有し、該CPU51に対して、CPU51にお
いて発生するデータを記憶するRAM52、実施の形態
2におけるコンテンツサーバの本発明のプログラムが記
録されているCD−ROM又はフレキシブルディスク等
の可搬型記録媒体500から前記プログラムを読み取る
CD−ROMドライブ又はフレキシブルディスクドライ
ブ等からなる外部記憶装置53、外部記憶装置53によ
り読み取った本発明のプログラムを格納するハードディ
スク54、キーボード及びマウス等の入力装置からなる
入力部55、入出力画面を表示するディスプレイ56、
並びに外部と通信を行うための通信インタフェース57
が接続されている。またハードディスク54は、複数の
コンテンツを格納しているコンテンツDB541、及び
後述する送信済み属性情報DB542を有している。
【0063】コンテンツサーバ5,5…は、通信インタ
フェース57を介してルータ等の接続装置501と接続
されている。そしてこの接続装置501によりインター
ネット等のネットワーク3に接続されている。
フェース57を介してルータ等の接続装置501と接続
されている。そしてこの接続装置501によりインター
ネット等のネットワーク3に接続されている。
【0064】コンテンツサーバ5,5…は、通信インタ
フェース57によりネットワーク3に接続されている。
そして、実施の形態2における本発明のコンテンツサー
バのプログラムは可搬型記録媒体500から読み取る以
外にも、ネットワーク3を介して外部サーバコンピュー
タ510に接続し、外部サーバコンピュータ510に内
蔵された前記プログラムを記録してある記録媒体511
からコンテンツサーバ5,5…へ前記プログラムをダウ
ンロードすることによりハードディスク54に格納し、
格納されたプログラムをCPU51がRAM52にロー
ドすることによって、コンテンツサーバ5,5…は後述
する処理を実行することができる。
フェース57によりネットワーク3に接続されている。
そして、実施の形態2における本発明のコンテンツサー
バのプログラムは可搬型記録媒体500から読み取る以
外にも、ネットワーク3を介して外部サーバコンピュー
タ510に接続し、外部サーバコンピュータ510に内
蔵された前記プログラムを記録してある記録媒体511
からコンテンツサーバ5,5…へ前記プログラムをダウ
ンロードすることによりハードディスク54に格納し、
格納されたプログラムをCPU51がRAM52にロー
ドすることによって、コンテンツサーバ5,5…は後述
する処理を実行することができる。
【0065】なお、本発明のコンテンツサーバのプログ
ラムはCGI(Common Gateway Interface)を用いて実
現されている。したがって、既存のWWW(World Wide
Web)サーバに容易に実装することができる。
ラムはCGI(Common Gateway Interface)を用いて実
現されている。したがって、既存のWWW(World Wide
Web)サーバに容易に実装することができる。
【0066】ハードディスク54が有している送信済み
属性情報DB542は、情報収集装置4へ既に送信して
あるコンテンツの属性を示すコンテンツ属性情報を格納
するデータベースである。この送信済み属性情報DB5
42に格納されているファイルは、情報収集装置4から
コンテンツの取得要求を受信する都度、後述する手順に
したがって作成され更新される。したがって、情報収集
装置4からコンテンツの取得要求を受信する前の時点で
は、前回コンテンツを送信した際のコンテンツ属性情報
が記録されている。以下、この送信済み属性情報DB5
42に格納されているファイルを前回属性情報ファイル
という。
属性情報DB542は、情報収集装置4へ既に送信して
あるコンテンツの属性を示すコンテンツ属性情報を格納
するデータベースである。この送信済み属性情報DB5
42に格納されているファイルは、情報収集装置4から
コンテンツの取得要求を受信する都度、後述する手順に
したがって作成され更新される。したがって、情報収集
装置4からコンテンツの取得要求を受信する前の時点で
は、前回コンテンツを送信した際のコンテンツ属性情報
が記録されている。以下、この送信済み属性情報DB5
42に格納されているファイルを前回属性情報ファイル
という。
【0067】なお、この前回属性情報ファイルのフォー
マットは実施の形態1における前回属性情報ファイルの
フォーマットと同じであり、また差分フラグフィールド
F4に格納されている差分フラグの値及びその意味も同
様であるので説明を省略する。
マットは実施の形態1における前回属性情報ファイルの
フォーマットと同じであり、また差分フラグフィールド
F4に格納されている差分フラグの値及びその意味も同
様であるので説明を省略する。
【0068】次に、実施の形態2における本発明の情報
収集システムの動作について説明する。図11は、実施
の形態2における本発明の情報収集システムの動作の流
れを示すフローチャートである。なおこれらの処理は、
1本の縦破線により2つの領域に分けられており、左側
の領域の処理はコンテンツサーバ5,5…が行う処理
を、右側の領域の処理は情報収集装置4が行う処理を夫
々示している。
収集システムの動作について説明する。図11は、実施
の形態2における本発明の情報収集システムの動作の流
れを示すフローチャートである。なおこれらの処理は、
1本の縦破線により2つの領域に分けられており、左側
の領域の処理はコンテンツサーバ5,5…が行う処理
を、右側の領域の処理は情報収集装置4が行う処理を夫
々示している。
【0069】情報収集装置4は、コンテンツサーバ5,
5…に対して、コンテンツの取得要求を送信する(S3
01)。この取得要求の送信は、オペレータによって予
め設定されたスケジュールにしたがって定期的に行われ
る。なお、取得要求の送信の都度、オペレータが入力部
45を用いて情報収集装置4に指示することによって、
不定期にコンテンツサーバ5,5…へ送信するようにし
てもよいことは、実施の形態1の場合と同様である。
5…に対して、コンテンツの取得要求を送信する(S3
01)。この取得要求の送信は、オペレータによって予
め設定されたスケジュールにしたがって定期的に行われ
る。なお、取得要求の送信の都度、オペレータが入力部
45を用いて情報収集装置4に指示することによって、
不定期にコンテンツサーバ5,5…へ送信するようにし
てもよいことは、実施の形態1の場合と同様である。
【0070】前記取得要求を情報収集装置4から受信し
たコンテンツサーバ5,5…は、コンテンツDB541
を参照し(S302)、コンテンツ属性情報を作成する
(S303)。なお、ここで作成されるコンテンツ属性
情報は、実施の形態1におけるステップS103にて作
成されるコンテンツ属性情報と同様であるので説明を省
略する。
たコンテンツサーバ5,5…は、コンテンツDB541
を参照し(S302)、コンテンツ属性情報を作成する
(S303)。なお、ここで作成されるコンテンツ属性
情報は、実施の形態1におけるステップS103にて作
成されるコンテンツ属性情報と同様であるので説明を省
略する。
【0071】コンテンツサーバ5,5…は、ステップS
303にて作成したコンテンツ属性情報と、送信済み属
性情報DB542に格納されている前回属性情報ファイ
ルとに基づいて差分情報ファイルを作成する(S30
4)。なお、この差分情報ファイルの作成処理は、実施
の形態1において情報収集装置1が差分情報ファイルを
作成する処理と同様であるので説明は省略する。
303にて作成したコンテンツ属性情報と、送信済み属
性情報DB542に格納されている前回属性情報ファイ
ルとに基づいて差分情報ファイルを作成する(S30
4)。なお、この差分情報ファイルの作成処理は、実施
の形態1において情報収集装置1が差分情報ファイルを
作成する処理と同様であるので説明は省略する。
【0072】ステップS304にて差分情報ファイルを
作成したコンテンツサーバ5,5…は、次回のコンテン
ツの取得要求受信時に前回属性情報ファイルとして用い
るために、作成した差分情報ファイルを送信済み属性情
報DB542に格納する(S305)。さらにこの差分
情報ファイルを情報収集装置4へ送信する(S30
6)。
作成したコンテンツサーバ5,5…は、次回のコンテン
ツの取得要求受信時に前回属性情報ファイルとして用い
るために、作成した差分情報ファイルを送信済み属性情
報DB542に格納する(S305)。さらにこの差分
情報ファイルを情報収集装置4へ送信する(S30
6)。
【0073】差分情報ファイルをコンテンツサーバ5,
5…から受信した情報収集装置4は、受信した差分情報
ファイルを参照して、差分フラグの値が2又は3である
レコードを抽出し、抽出されたレコードに係るディレク
トリ名フィールドF1及びファイル名フィールドF2の
値を用いて収集コンテンツリストを作成する(S30
7)。そして作成した収集コンテンツリストをコンテン
ツサーバ5,5…へ送信する(S308)。
5…から受信した情報収集装置4は、受信した差分情報
ファイルを参照して、差分フラグの値が2又は3である
レコードを抽出し、抽出されたレコードに係るディレク
トリ名フィールドF1及びファイル名フィールドF2の
値を用いて収集コンテンツリストを作成する(S30
7)。そして作成した収集コンテンツリストをコンテン
ツサーバ5,5…へ送信する(S308)。
【0074】収集コンテンツリストを情報収集装置4か
ら受信したコンテンツサーバ5,5…は、受信した収集
コンテンツリストに示されているコンテンツを情報収集
装置4へ送信する(S309)。
ら受信したコンテンツサーバ5,5…は、受信した収集
コンテンツリストに示されているコンテンツを情報収集
装置4へ送信する(S309)。
【0075】コンテンツをコンテンツサーバ5,5…か
ら受信した情報収集装置4は、受信したコンテンツをコ
ンテンツ写しDB441に格納することによって、コン
テンツ写しDB441の更新作業を行う(S310)。
そしてコンテンツサーバ5,5…から受信した差分情報
ファイルを参照して差分フラグの値が4であるレコード
を抽出し、抽出したレコードに係るディレクトリ名及び
ファイル名で特定されるコンテンツをコンテンツDB4
42から削除し、さらにコンテンツ写しDB441に格
納されたコンテンツをコンテンツDB442に格納する
ことによって、コンテンツDB442の更新作業を行う
(S311)。
ら受信した情報収集装置4は、受信したコンテンツをコ
ンテンツ写しDB441に格納することによって、コン
テンツ写しDB441の更新作業を行う(S310)。
そしてコンテンツサーバ5,5…から受信した差分情報
ファイルを参照して差分フラグの値が4であるレコード
を抽出し、抽出したレコードに係るディレクトリ名及び
ファイル名で特定されるコンテンツをコンテンツDB4
42から削除し、さらにコンテンツ写しDB441に格
納されたコンテンツをコンテンツDB442に格納する
ことによって、コンテンツDB442の更新作業を行う
(S311)。
【0076】これにより、実施の形態1の場合と同様
に、情報収集装置4は、コンテンツサーバ5,5…にて
更新又は新たに追加されたコンテンツのみを収集し、ま
たコンテンツサーバ5,5…にて削除されたコンテンツ
をコンテンツDB442から削除することができる。し
かも、これらの処理は、各コンテンツ毎ではなく、各コ
ンテンツサーバ5,5…毎に行うことができるので、従
来に比し少ない通信量で足りる。
に、情報収集装置4は、コンテンツサーバ5,5…にて
更新又は新たに追加されたコンテンツのみを収集し、ま
たコンテンツサーバ5,5…にて削除されたコンテンツ
をコンテンツDB442から削除することができる。し
かも、これらの処理は、各コンテンツ毎ではなく、各コ
ンテンツサーバ5,5…毎に行うことができるので、従
来に比し少ない通信量で足りる。
【0077】
【発明の効果】以上詳述した如く、情報収集装置からの
要求に基づいて、コンテンツサーバがコンテンツの属性
情報を作成することによって、情報収集装置が、各コン
テンツ毎ではなく複数のコンテンツを格納しているコン
テンツサーバ毎に、コンテンツの更新状況を知ることが
できる。
要求に基づいて、コンテンツサーバがコンテンツの属性
情報を作成することによって、情報収集装置が、各コン
テンツ毎ではなく複数のコンテンツを格納しているコン
テンツサーバ毎に、コンテンツの更新状況を知ることが
できる。
【0078】また、コンテンツサーバが作成したコンテ
ンツの属性情報を参照することによって、情報収集装置
が、コンテンツサーバにて更新、追加又は削除されたコ
ンテンツがあるか否かを知ることができるため、情報収
集装置がコンテンツを収集する際に発生する通信量が従
来に比し少なくて済む等、本発明は優れた効果を奏す
る。
ンツの属性情報を参照することによって、情報収集装置
が、コンテンツサーバにて更新、追加又は削除されたコ
ンテンツがあるか否かを知ることができるため、情報収
集装置がコンテンツを収集する際に発生する通信量が従
来に比し少なくて済む等、本発明は優れた効果を奏す
る。
【0079】以上の説明に関して更に以下の項を開示す
る。 (1)請求項1に記載の情報収集システムであって、上
記情報収集装置は更に、上記属性情報比較手段による比
較の結果、削除されたコンテンツがあるか否かを判定す
る削除判定手段を備える情報収集システム。
る。 (1)請求項1に記載の情報収集システムであって、上
記情報収集装置は更に、上記属性情報比較手段による比
較の結果、削除されたコンテンツがあるか否かを判定す
る削除判定手段を備える情報収集システム。
【0080】(2)請求項2に記載の情報収集システム
であって、上記情報収集装置は更に、上記比較結果情報
を受信した場合、該比較結果情報に基づいて、削除され
たコンテンツがあるか否かを判定する削除判定手段を備
える情報収集システム。
であって、上記情報収集装置は更に、上記比較結果情報
を受信した場合、該比較結果情報に基づいて、削除され
たコンテンツがあるか否かを判定する削除判定手段を備
える情報収集システム。
【0081】(3)請求項4に記載の情報収集装置であ
って、上記情報収集装置は更に、上記属性情報比較手段
による比較の結果、削除されたコンテンツがあるか否か
を判定する削除有無判定手段を備える情報収集装置。
って、上記情報収集装置は更に、上記属性情報比較手段
による比較の結果、削除されたコンテンツがあるか否か
を判定する削除有無判定手段を備える情報収集装置。
【0082】(4)請求項6に記載のコンピュータでの
読み取りが可能な記録媒体であって、上記比較の結果、
削除されたコンテンツがあるか否かを判定させるプログ
ラムコード手段を更に有するプログラムが記録してある
コンピュータでの読み取りが可能な記録媒体。
読み取りが可能な記録媒体であって、上記比較の結果、
削除されたコンテンツがあるか否かを判定させるプログ
ラムコード手段を更に有するプログラムが記録してある
コンピュータでの読み取りが可能な記録媒体。
【図1】実施の形態1における本発明の情報収集システ
ムの構成を示すブロック図である。
ムの構成を示すブロック図である。
【図2】実施の形態1における本発明の情報収集装置の
構成を示すブロック図である。
構成を示すブロック図である。
【図3】実施の形態1における本発明のコンテンツサー
バの構成を示すブロック図である。
バの構成を示すブロック図である。
【図4】前回属性情報ファイルのフォーマットを示す概
念図、及び差分フラグフィールドに格納されている差分
フラグの値とその意味との対応を示す概念図である。
念図、及び差分フラグフィールドに格納されている差分
フラグの値とその意味との対応を示す概念図である。
【図5】実施の形態1における本発明の情報収集システ
ムの動作の流れを示すフローチャートである。
ムの動作の流れを示すフローチャートである。
【図6】コンテンツサーバが作成するコンテンツ属性情
報のフォーマットを示す概念図である。
報のフォーマットを示す概念図である。
【図7】実施の形態1における本発明の情報収集装置の
差分情報ファイル作成処理の処理手順を示すフローチャ
ートである。
差分情報ファイル作成処理の処理手順を示すフローチャ
ートである。
【図8】実施の形態2における本発明の情報収集システ
ムの構成を示すブロック図である。
ムの構成を示すブロック図である。
【図9】実施の形態2における本発明の情報収集装置の
構成を示すブロック図である。
構成を示すブロック図である。
【図10】実施の形態2における本発明のコンテンツサ
ーバの構成を示すブロック図である。
ーバの構成を示すブロック図である。
【図11】実施の形態2における本発明の情報収集シス
テムの動作の流れを示すフローチャートである。
テムの動作の流れを示すフローチャートである。
1,4 情報収集装置 2,5 コンテンツサーバ 3 ネットワーク 141 収集済み属性情報DB 542 送信済み属性情報DB
Claims (6)
- 【請求項1】 複数のコンテンツを格納するコンテンツ
格納部を備えるコンテンツサーバと該コンテンツサーバ
から前記コンテンツを収集すべくなしてある情報収集装
置とがネットワークを介して接続されてある情報収集シ
ステムにおいて、 前記情報収集装置は、 収集済みのコンテンツの属性を示す収集済みコンテンツ
属性情報を格納する収集済み属性情報格納部と、 コンテンツの取得要求を前記コンテンツサーバへ送信す
る手段とを備え、 前記コンテンツサーバは、 前記コンテンツの取得要求を受信した場合、前記コンテ
ンツ格納部に格納してあるコンテンツの属性を示すコン
テンツ属性情報を作成する属性情報作成手段と、 該属性情報作成手段によって作成されたコンテンツ属性
情報を前記情報収集装置へ送信する手段とを備え、 前記情報収集装置は更に、 コンテンツ属性情報を受信した場合、受信したコンテン
ツ属性情報と前記収集済み属性情報格納部に格納してあ
る収集済みコンテンツ属性情報とを比較する属性情報比
較手段と、 該属性情報比較手段による比較の結果、更新又は追加さ
れたコンテンツがあるか否かを判定する更新追加判定手
段と、 該更新追加判定手段によって更新又は追加されたコンテ
ンツがあると判定された場合、該更新又は追加されたコ
ンテンツの送信要求を前記コンテンツサーバへ送信する
手段とを備え、 前記コンテンツサーバは更に、 前記コンテンツの送信要求を受信した場合、受信したコ
ンテンツの送信要求に示されているコンテンツを前記情
報収集装置へ送信する手段を備えることを特徴とする情
報収集システム。 - 【請求項2】 複数のコンテンツを格納するコンテンツ
格納部を備えるコンテンツサーバと該コンテンツサーバ
から前記コンテンツを収集すべくなしてある情報収集装
置とがネットワークを介して接続されてある情報収集シ
ステムにおいて、 前記情報収集装置は、 コンテンツの取得要求を前記コンテンツサーバへ送信す
る手段とを備え、 前記コンテンツサーバは、 前記情報収集装置へ送信済みのコンテンツの属性を示す
送信済みコンテンツ属性情報を格納する送信済み属性情
報格納部と、 前記コンテンツの取得要求を受信した場合、前記コンテ
ンツ格納部に格納してあるコンテンツの属性を示すコン
テンツ属性情報を作成する属性情報作成手段と、 該属性情報作成手段によって作成されたコンテンツ属性
情報と前記送信済み属性情報格納部に格納してある送信
済みコンテンツ属性情報とを比較する属性情報比較手段
と、 該属性情報比較手段による比較の結果を示す比較結果情
報を前記情報収集装置へ送信する手段とを備え、 前記情報収集装置は更に、 前記比較結果情報を受信した場合、該比較結果情報に基
づいて、更新又は追加されたコンテンツがあるか否かを
判定する更新追加判定手段と、 該更新追加判定手段によって更新又は追加されたコンテ
ンツがあると判定された場合、該更新又は追加されたコ
ンテンツの送信要求を前記コンテンツサーバへ送信する
手段とを備え、 前記コンテンツサーバは更に、 前記コンテンツの送信要求を受信した場合、受信したコ
ンテンツの取得要求に示されているコンテンツを前記情
報収集装置へ送信する手段を備えることを特徴とする情
報収集システム。 - 【請求項3】 複数のコンテンツを格納するコンテンツ
格納部と、 コンテンツの属性を示すコンテンツ属性情報の取得要求
を受信した場合、前記コンテンツ格納部に格納してある
コンテンツの属性を示すコンテンツ属性情報を作成する
属性情報作成手段と、 該属性情報作成手段によって作成されたコンテンツ属性
情報を、前記コンテンツ属性情報の取得要求の送信先へ
送信する手段とを備えることを特徴とするコンテンツサ
ーバ。 - 【請求項4】 ネットワークに接続され、該ネットワー
ク上に存在する複数のコンテンツを収集すべくなしてあ
る情報収集装置において、 収集済みのコンテンツの属性を示す収集済みコンテンツ
属性情報を格納する収集済み属性情報格納部と、 コンテンツの属性を示すコンテンツ属性情報の取得要求
をコンテンツを格納している格納装置へ送信する手段と
該格納装置からコンテンツ属性情報を受信した場合、受
信したコンテンツ属性情報と前記収集済み属性情報格納
部に格納してある収集済みコンテンツ属性情報とを比較
する属性情報比較手段と、 該属性情報比較手段による比較の結果、更新又は追加さ
れたコンテンツがあるか否かを判定する更新追加判定手
段と、 該更新追加判定手段によって更新又は追加されたコンテ
ンツがあると判定された場合、該更新又は追加されたコ
ンテンツの取得要求を前記格納装置へ送信する手段とを
備えることを特徴とする情報収集装置。 - 【請求項5】 複数のコンテンツを格納するコンテンツ
格納部を備えるコンピュータに、 コンテンツの属性を示すコンテンツ属性情報の取得要求
を前記コンピュータが受信した場合、前記コンテンツ格
納部に格納してあるコンテンツの属性を示すコンテンツ
属性情報を作成させるプログラムコード手段と、 作成させたコンテンツ属性情報を、前記コンテンツ属性
情報の取得要求の送信先へ送信させるプログラムコード
手段とを有するプログラムが記録してあることを特徴と
するコンピュータでの読み取りが可能な記録媒体。 - 【請求項6】 ネットワークに接続されたコンピュータ
に、該ネットワーク上に存在する複数のコンテンツを収
集させるプログラムが記録してあるコンピュータでの読
み取りが可能な記録媒体において、 前記コンピュータに、 収集済みのコンテンツの属性を示す収集済みコンテンツ
属性情報を格納させるプログラムコード手段と、 コンテンツの属性を示すコンテンツ属性情報の取得要求
をコンテンツを格納している格納装置へ送信させるプロ
グラムコード手段と前記格納装置からコンテンツ属性情
報を前記コンピュータが受信した場合、受信したコンテ
ンツ属性情報と前記収集済み属性情報格納部に格納して
ある収集済みコンテンツ属性情報とを比較させるプログ
ラムコード手段と、 前記比較の結果、更新又は追加されたコンテンツがある
か否かを判定させるプログラムコード手段と、 更新又は追加されたコンテンツがあると判定された場
合、該更新又は追加されたコンテンツの取得要求を前記
格納装置へ送信させるプログラムコード手段とを有する
プログラムが記録してあることを特徴とするコンピュー
タでの読み取りが可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP36567399A JP2001184355A (ja) | 1999-12-22 | 1999-12-22 | 情報収集システム、コンテンツサーバ、情報収集装置及び記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP36567399A JP2001184355A (ja) | 1999-12-22 | 1999-12-22 | 情報収集システム、コンテンツサーバ、情報収集装置及び記録媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2001184355A true JP2001184355A (ja) | 2001-07-06 |
Family
ID=18484835
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP36567399A Pending JP2001184355A (ja) | 1999-12-22 | 1999-12-22 | 情報収集システム、コンテンツサーバ、情報収集装置及び記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2001184355A (ja) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003087164A (ja) * | 2001-09-11 | 2003-03-20 | Sony Corp | 通信装置、通信システムおよびその方法 |
JP2005122702A (ja) * | 2003-10-16 | 2005-05-12 | Hitachi Ltd | 検索エンジンと一式以上のファイルサーバ間の結合を改善する方法及び装置 |
JP2006039598A (ja) * | 2004-06-24 | 2006-02-09 | Katsuya Ishihara | コンピュータシステムのデータ連携方法及びデータ連携装置 |
JP2007148885A (ja) * | 2005-11-29 | 2007-06-14 | Hitachi Ltd | コンテンツ収集装置およびコンテンツ収集システム |
JP2007156546A (ja) * | 2005-11-30 | 2007-06-21 | Toshiba Corp | コンテンツリスト提供装置およびコンテンツリスト提供方法 |
JP2009003717A (ja) * | 2007-06-21 | 2009-01-08 | Yahoo Japan Corp | ふり仮名収集利用装置及びふり仮名収集利用方法 |
US8229934B2 (en) | 2009-08-14 | 2012-07-24 | International Business Machines Corporation | System and program for collecting documents |
WO2012144214A1 (ja) * | 2011-04-20 | 2012-10-26 | パナソニック株式会社 | クライアント機器、サーバ装置、コンテンツ取得方法および集積回路 |
WO2014127658A1 (en) | 2013-02-21 | 2014-08-28 | Tencent Technology (Shenzhen) Company Limited | Method, apparatus and system for processing user generated content |
-
1999
- 1999-12-22 JP JP36567399A patent/JP2001184355A/ja active Pending
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003087164A (ja) * | 2001-09-11 | 2003-03-20 | Sony Corp | 通信装置、通信システムおよびその方法 |
JP4559158B2 (ja) * | 2003-10-16 | 2010-10-06 | 株式会社日立製作所 | データにアクセスするための方法及びシステム |
JP2005122702A (ja) * | 2003-10-16 | 2005-05-12 | Hitachi Ltd | 検索エンジンと一式以上のファイルサーバ間の結合を改善する方法及び装置 |
JP2006039598A (ja) * | 2004-06-24 | 2006-02-09 | Katsuya Ishihara | コンピュータシステムのデータ連携方法及びデータ連携装置 |
JP2007148885A (ja) * | 2005-11-29 | 2007-06-14 | Hitachi Ltd | コンテンツ収集装置およびコンテンツ収集システム |
JP2007156546A (ja) * | 2005-11-30 | 2007-06-21 | Toshiba Corp | コンテンツリスト提供装置およびコンテンツリスト提供方法 |
JP2009003717A (ja) * | 2007-06-21 | 2009-01-08 | Yahoo Japan Corp | ふり仮名収集利用装置及びふり仮名収集利用方法 |
US8229934B2 (en) | 2009-08-14 | 2012-07-24 | International Business Machines Corporation | System and program for collecting documents |
WO2012144214A1 (ja) * | 2011-04-20 | 2012-10-26 | パナソニック株式会社 | クライアント機器、サーバ装置、コンテンツ取得方法および集積回路 |
US9059997B2 (en) | 2011-04-20 | 2015-06-16 | Panasonic Intellectual Property Corporation Of America | Client device, server apparatus, content obtainment method, and integrated circuit |
JP5890777B2 (ja) * | 2011-04-20 | 2016-03-22 | パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America | クライアント機器、サーバ装置、コンテンツ取得方法および集積回路 |
WO2014127658A1 (en) | 2013-02-21 | 2014-08-28 | Tencent Technology (Shenzhen) Company Limited | Method, apparatus and system for processing user generated content |
EP2959661A1 (en) * | 2013-02-21 | 2015-12-30 | Tencent Technology (Shenzhen) Company Limited | Method, apparatus and system for processing user generated content |
EP2959661A4 (en) * | 2013-02-21 | 2016-10-12 | Tencent Tech Shenzhen Co Ltd | METHOD, APPARATUS AND SYSTEM FOR PROCESSING USER GENERATED CONTENT |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7619764B2 (en) | Center server, information processing apparatus and method, and print system | |
US8037107B2 (en) | Document transfer assisting system, monitor apparatus, document transfer assisting apparatus, method and computer readable recording medium | |
JP2002526864A (ja) | ネットワークにおいて遠隔データベースを更新するためのシステムおよび方法 | |
US6985894B2 (en) | Document management method and computer-readable storage medium storing program code for executing the same | |
JP2001184355A (ja) | 情報収集システム、コンテンツサーバ、情報収集装置及び記録媒体 | |
JPH09204442A (ja) | ドキュメントデータ検索システム | |
JP5164673B2 (ja) | サーバ装置、カタログ処理方法及びプログラム | |
US7660876B2 (en) | Electronic file management | |
JP4253315B2 (ja) | 知識情報収集システムおよび知識情報収集方法 | |
JP2006243981A (ja) | 文書管理プログラム、文書管理方法及び文書管理装置 | |
JPH10111821A (ja) | クライアント・サーバー・システム | |
US20020120612A1 (en) | Document management system, document management method, and computer-readable storage medium including the same | |
JPH11175539A (ja) | 代理情報取得方法及びシステム及び代理情報取得プログラムを格納した記憶媒体 | |
JP3708893B2 (ja) | 知識情報収集システムおよび知識情報収集方法 | |
JP4373029B2 (ja) | 文書管理装置及び文書管理方法並びに記録媒体 | |
JP3725087B2 (ja) | 知識情報収集システムおよび知識情報収集方法 | |
JPH11203321A (ja) | メタ情報管理機能を備えた情報提供装置 | |
JP2005173724A (ja) | 文書管理システム、ファイルサーバ、文書管理プログラム、文書管理方法 | |
JPH117445A (ja) | 統合化文書管理装置 | |
JP3708894B2 (ja) | 知識情報収集システムおよび知識情報収集方法 | |
JP3725088B2 (ja) | 知識情報収集システムおよび知識情報収集方法 | |
JP2000066945A (ja) | ドキュメント収集システム、装置及び方法、並びに記録媒体 | |
JP3725837B2 (ja) | 知識情報収集システムおよび知識情報収集方法 | |
JP4917057B2 (ja) | 情報収集方法及び情報収集装置 | |
JP4241889B2 (ja) | ネットワークの可視情報管理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060626 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090421 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20090825 |