JPH10143418A - 文書情報更新監視装置および文書情報の更新監視方法 - Google Patents
文書情報更新監視装置および文書情報の更新監視方法Info
- Publication number
- JPH10143418A JPH10143418A JP9249101A JP24910197A JPH10143418A JP H10143418 A JPH10143418 A JP H10143418A JP 9249101 A JP9249101 A JP 9249101A JP 24910197 A JP24910197 A JP 24910197A JP H10143418 A JPH10143418 A JP H10143418A
- Authority
- JP
- Japan
- Prior art keywords
- document
- update
- address
- documents
- detecting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Information Transfer Between Computers (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
造をもつ文書の更新を効率的に検出して通知することを
可能とする文書情報更新監視装置を提供する。 【解決手段】監視対象とする文書を指定して監視文書ア
ドレス記憶部12に格納する文書指定部11と、この文
書指定部11によって指定され、監視文書アドレス記憶
部12に格納された少なくとも一つ以上の文書の中から
更新の施された文書を検出する更新検出部13と、この
更新検出部13によって更新の施された文書が検出され
たときに、その文書を利用者に通知する文書情報更新通
知部15とを有する文書情報更新監視装置であって、こ
の文書指定部11は、単一の文書を起点に階層的な構造
をなす文書群を組として一括で指定し、一方、文書情報
更新通知部15は、更新検出部13によって検出された
文書をその文書を含んで構成される文書群の階層構造と
対応づけて表示する。
Description
少なくとも一つ以上の文書の中から更新の施された文書
を検出して利用者に通知する文書情報更新監視装置およ
び文書情報の更新監視方法に関する。
いものがあり、世界中に点在する計算機に格納された情
報が、インターネットに接続されてさえいれば、どこか
らでも簡単にアクセスできるようになってきている。特
に、WWW(World Wide Web)では、H
TTP(HyperText Transfer Pr
otocol)を用いることにより、利用者が、世界中
の情報をGUI(Graphical User In
terface)ベースのブラウザによって簡単にアク
セスできる仕組みを提供している。
呼ばれるソフトウェアを用いる。このソフトウェアは、
その計算機のデータベースに格納されているHTML
(HyperText Markup Languag
e)で記述したハイパーテキストファイルを、他の計算
機からの要求に応じて転送するものである。インターネ
ットに接続されている計算機は、転送を要求するハイパ
ーテキストファイルが存在するhttpdに対し、ハイ
パーテキストファイルのアドレスを指定することによっ
て、指定したファイルを読み込むことができる。HTM
Lの記述では、ハイパーテキストファイル内のリンク情
報として、前記アドレスが記述されるので、HTTPの
プロトコルにしたがったブラウザは、各httpd支配
下のハイパーテキストファイルを表示することができ
る。そして、音声、静止画、動画など様々なデータを出
力できるようにすることによって、マルチメディアデー
タを含むハイパーテキストを、ブラウザは表示すること
ができる。
り簡単にインターネット上の情報にアクセスできるよう
になり、多くの個人や企業が、Webページと呼はれる
ハイパーテキストファイルを公開するようになってきて
いる。
管理者がおらず、個々人がそれぞれ勝手にWebページ
を作成および修正し、しかもその規模が膨大であるため
に(1996年度初頭における世界中で公開されている
Webページは4000万ページと推定されている)、
個々の利用者が自らが必要とするWebページがどこに
あるか(URLアドレスとして何を指定すれば必要なW
ebページを取得できるか)を知ることが困難な状況に
なっている。また、更新の頻度や時間帯も、それぞれが
ばらばらに行なわれているといった状況である。
bページを内容ベースで検索するシステムが開発され、
検索を代行するようなサービスが提供されるようになっ
てきた。具体的には、Yahoo、LycosおよびA
ltavistaなどといったWeb検索サーバが存在
する。Web検索サーバでは、キーワードを指定するこ
とによって、そのキーワードを含むWebページを検索
することができる。利用者は、これらWeb検索サーバ
を用いて必要なWebページを検索する。
いることによってオンラインで必要な情報を容易に検索
できるようになったものの、これは利用者が能動的に必
要な情報を検索指示した場合にのみ得られるのであっ
て、利用者が関心・興味をいだいている情報が新しく作
成された際に利用者が検索指示を行なわなければ、たと
え重要な情報であったとしても、その利用者がその情報
を知ることはない。したがって、利用者が関心・興味の
ある情報が発生したときに、その旨を適切な利用者に知
らしめるシステムが必要である。
Webページの中から所望のWebページを予めユーザ
に選択させ、この選択された範囲内でWebページ内の
情報を監視し、その更新を検出する情報フィルタリング
装置などが考え出されてきている。しかしながら、これ
らは、各Webページの更新をページ単位でのみ監視す
るにすぎないものであった。Webページは、文書同士
がリンクで結合されており、ハイパーテキストを構成し
ている点に特徴がある。すなわち、Webページは、1
つの文書だけでは情報の価値が小さく、複数の文書群に
よって意味のある情報単位となる。したがって、Web
ページそれぞれを個別に監視するのみでは、有効な更新
検出を実現することができなかった。
に、HTMLに基づいた記述がされており、他の文書の
参照は、図中の(a)に指示したように、その格納され
ている文書のアドレスを設定する規約となっている。
WWWのWebページに対する従来の更新監視には、以
下のような問題が存在した。
書を文書群として指定することができず、更新を通知す
る際も文書群としての通知が可能ではなかった。
われる。したがって、定期的に更新を検査した場合、更
新の検出が検査の間隔でしか検知できない。
の更新を監視しても無意味であるが、現状ではこのよう
なWebページの更新をも監視してしまう。
視しても無意味であるが、現状では削除されたWebペ
ージについても更新を監視してしまう。
ことがあるが、格納場所が変更された場合に、新しい格
納場所に監視先を変更するという再設定を必要とする。
なわれるため、他のWebページから参照されていると
いう情報は重要な情報であるが、このような情報を通知
することが現状では不可能である。
たものであり、たとえばWebページのように非定期的
に更新され、かつハイパーテキスト構造をもつ文書の更
新を効率的に検出して通知することを可能とする文書情
報更新監視装置および文書情報の更新監視方法を提供す
ることを目的とする。
監視装置は、監視対象とする文書の格納位置を示すアド
レスおよび前記文書を起点に階層的な構造をなす文書群
を一括で指定する文書指定手段と、この文書指定手段に
よって指定された少なくとも一つ以上の文書の中から更
新の施された文書を検出する更新検出手段と、この更新
検出手段によって検出された文書を、その文書を含んで
構成される文書群の階層構造と対応づけて通知する通知
手段とを具備してなることを特徴とする。
は、Webページなどのように、複数の文書が互いに関
連づけられて一つの情報を示すような構成をもつものに
対して、この文書群に含まれる文書すべてを個々に監視
対象として設定することなく文書群を組として一括で指
定することを可能とする。一方、この文書群に含まれる
いずれかの文書の更新が検出されたときは、この文書
を、その文書を含んで構成される文書群の階層構造と対
応づけて通知する。この通知は、たとえばその文書を含
んで構成される文書群の階層構造と対応づけて表示する
などといったことが好ましい。したがって、利用者の設
定操作動作を大幅に削減して操作性を飛躍的に向上させ
るとともに、その検出結果をより効果的に提示すること
ができ、作業効率を向上させることが可能となる。
は、前記文書指定手段によって指定された文書それぞれ
の更新時期を予測する更新時期予測手段をさらに具備
し、前記更新検出手段は、前記更新時期予測手段によっ
て予測された時期にしたがって、前記文書指定手段によ
って指定された文書の中から処理対象とする文書を選定
する手段を具備してなることを特徴とする。
えば日次、週次または月次などといったように、情報ご
とにある程度定まった周期をもつことが多い。したがっ
て、情報ごとに更新時期に関する傾向を分析すれば、利
用者によって設定された文書すべてについて、すなわ
ち、更新されている可能性の著しく低い文書を含めて毎
回検査するといった無駄な処理を排除でき、より効率的
な更新監視を実現できることになる。
は、前記文書指定手段によって指定された文書それぞれ
の最終更新時刻を記憶する最終更新時刻記憶手段と、前
記最終更新時刻記憶手段に記憶された最終更新時刻から
の経過時間が予め定められたしきい値を越えている文書
の格納位置を示すアドレスを、前記文書指定手段による
指定から削除する指定削除手段とをさらに具備してなる
ことを特徴とする。
は、予め定められた期間を越えて参照されていない文書
をすでに不要となった情報と位置づけ、自動的に監視対
象から削除する。これにより、不必要な検査動作を能動
的に削減することができることになり、一方で、利用者
による不要文書の設定削除操作を不要とし、その使い勝
手を向上させることができる。
削除されたときや、その格納位置が変更されたときに応
じて、監視対象を示す設定内容を管理する手段を具備す
ることが好ましい。これにより、利用者による設定内容
の管理作業を不要とすることができ、さらにその使い勝
手を向上させることができる。
は、文書間の参照関係を収集する参照関係収集手段を有
する文書情報更新監視装置であって、監視対象とする文
書の格納位置を示すアドレスを指定する文書指定手段
と、この文書指定手段によって指定された文書を参照す
る他の文書が新たに発生した旨を前記参照関係収集手段
の収集結果から検知する検知手段と、この検知手段によ
って検出された前記新たに発生した他の文書を利用者に
通知する通知手段を具備してなることを特徴とする。
する際、その参照先の文書のアドレスをリンク情報とし
て記述すればよい。したがって、たとえばある利用者が
公開したWebページは、その利用者が知り得ることな
く、他の利用者が公開するWebページから参照される
関連情報として取り扱われる可能性も大いにある。この
ような状況においては、あるWebページが他のいずれ
かのWebページから参照されていないかを認識するこ
とは重要である。この発明の文書情報更新監視装置にお
いては、まず文書間の参照関係をすべて収集し、その収
集結果から指定した文書を参照する他の文書が新たに発
生した旨を検知して利用者に通知する。これにより利用
者は、自身が公開した文書の参照状況を容易に把握する
ことができることになる。
実施の形態について説明する。
実施形態について説明する。図1に、本実施形態の文書
情報更新監視システムの機器構成を示す。図1に示した
ように、この文書情報更新監視システムは、オペレーテ
ィングシステムやユーティリティを含む各種アプリケー
ションプログラム(文書情報の更新管理を行なうプログ
ラムもこれらに含まれる)を実行制御するCPU1、ア
プリケーションプログラムや各種データを格納する記憶
部2、および通信ネットワークを介して他の計算機が管
理する記憶領域に格納された情報にアクセスするための
回線入出力部3からなる。
ステムの機能ブロックを示す。図2に示したように、こ
の文書情報更新監視システムは、文書指定部11、監視
文書アドレス記憶部12、更新検出部13、文書情報更
新記憶部14および文書情報更新通知部15を備えてな
る。
格納されたアドレスを指定する。監視文書アドレス記憶
部12は、文書指定部11で指定された文書のアドレス
を格納する。更新検出部13は、監視文書アドレス記憶
部12に格納された文書が更新されたか否かを判定す
る。文書情報更新記憶部14は、更新が検出された文書
のアドレスを格納する。そして、文書情報更新通知部1
5は、更新された文書を通知する。
処理の流れを説明する。更新検出部13は、監視文書ア
ドレス記憶部12に格納された各アドレスごとに更新時
刻を入手し(ステップA1)、その更新時刻が前回の更
新検出処理を実行した時点より最近であったときに(ス
テップA2のY)、この文書のアドレスを文書情報更新
記憶部14に記憶する。
たアドレスを監視文書アドレス記憶部12に格納する。
そして、文書情報更新通知部15は、文書情報更新記憶
部14に格納されたアドレスに対応する文書一覧を作成
する。
式を図4に示す。図4に示したように、監視文書アドレ
ス記憶部12は、更新を監視する文書群の最上位のアド
レスおよびその文書が参照する文書のアドレスを設定す
るトップノード参照関係テーブル(a)と、それ以下の
文書のアドレスとその文書が参照する文書のアドレスを
設定する子ノード参照関係テーブル(b)からなってい
る。
示した形式にとらわれるものではなく、要するに更新を
監視する文書の文書群を文書群として、その階層関係を
含めて記憶できる形式であればよいことは言うまでもな
い。以下では、文書監視アドレスを記憶するものとして
説明を行なう。
す。文書指定部11では、利用者からのコマンド入力を
受け付け(ステップB1)、そのコマンドが挿入コマン
ドであるときに(ステップB3のY)、この文書群のト
ップノードのアドレスを入力することをユーザに求め
(ステップB4〜ステップB5)、さらに、階層として
たどるリンクの段数を入力させる(ステップB6)。そ
して、文書指定部11は、入力されたアドレスと段数と
を引数にして、監視アドレスの設定を行なう(ステップ
B7)。なお、監視すべき文書のアドレスを入力する際
には、必ずしも利用者が直接入力する必要はない。たと
えば、文書表示システムと連動している場合には、表示
している文書を指定することによって、監視する文書ア
ドレスの入力とすることも可能である。
ードアドレスと入力段数とにしたがって、監視すべき文
書のアドレスを監視文書アドレス記憶部12に設定す
る。この処理を行なう監視アドレスの設定の処理の流れ
を図6に示す。
段数とを入力として処理を行なう。入力されたアドレス
に格納されている文書を読み込んだ後(ステップC
1)、そのアドレスを図4(a)に示したトップノード
参照関係テーブルに格納する(ステップC2)。初めて
設定する場合は、トップノードアドレス1に、2度目に
設定する場合は、トップノードアドレス2に格納するこ
とになる。以降順次、後続する箇所に格納する。たとえ
ば、入力されたアドレスが「http://www.c
cc.bbb.aaaaaa.co.jp/inde
x.html」であって、初めて設定されるアドレスと
して格納されたと仮定すると、「http://ww
w.ccc.bbb.aaaaaaa.co.jp/i
ndex.html」をトップノードアドレス1に格納
することになる。
プC4のN)、トップノードから子ノードへと階層をた
どり、監視アドレスを入手していく。まず始めに、読み
込んだ文書で参照している文書のアドレスをすべて抽出
し(ステップC5)、抽出したアドレスとその個数をト
ップノード参照関係テーブルに格納する(ステップC
6)。次に、抽出した各文書アドレスについて、子ノー
ド参照関係の設定サブルーチンを、抽出したアドレスの
個数だけ繰り返し実行する(ステップC7〜ステップC
8)。この際の引数は、段数を1減じた値と文書アドレ
スである。
れたトップノードアドレスに対応する文書であったと仮
定すると、図7に示したアドレスがトップノード参照関
係テーブルに格納される子ノードに相当する。したがっ
て、この場合には、 子ノード数1に9 子ノードアドレス11にeindex.html 子ノードアドレス12にxx1/index.html 子ノードアドレス13にxx2/index.html 子ノードアドレス14にxx3/index.html 子ノードアドレス15にhttp://www.cc
c.bbb.aaaaaaa.co.jp/cil/i
ndex/html 子ノードアドレス16にhttp://www.bb
b.aaaaaa.co.jp/index.html 子ノードアドレス17にhttp://www.aaa
aaaa.co.jp/s/ 子ノードアドレス18にhttp://www.aaa
aaaa.co.jp/index.html 子ノードアドレス19にhttp://www.aaa
aaaa.co.jp:81/index_j.htm
l がそれぞれ格納されることになる。
スに対して、再帰的なアドレスを子ノード参照関係テー
ブルに順次格納していく。この処理を行なう子ノード参
照関係の設定サブルーチンは、再帰的な処理であり、図
6で説明した監視アドレス設定処理と同様に、対象とす
る文書で参照している文書のアドレスを取り出して、順
次、子ノード参照関係テーブルに設定していくものであ
る。この処理の流れを図8に示す。
は、入力された段数が1以下であった場合(ステップD
1のY)、すでに監視すべき文書の階層の範囲を越えて
いることを意味するので、何もせずに処理を終える。段
数が1を越えている場合(ステップD1のN)、入力さ
れた文書アドレスを、図4(b)に示した子ノード参照
関係テーブルに格納する。次に、入力されたアドレスの
文書を読み込み、その文書で参照している文書のアドレ
スを抽出する(ステップD3)。そして、その抽出した
アドレスの個数と、そのアドレス自体とを子ノード参照
関係テーブルに格納する(ステップD4)。次に、抽出
した各文書アドレスについて子ノード参照関係の設定サ
ブルーチンを、抽出したアドレスの個数だけ繰り返し実
行する(ステップD5〜ステップD6)。この際の引数
は、段数を1減じた値と文書アドレスである。
にループ(参照している子ノードを順次たどっていく
と、元の文書に戻ってしまうような参照関係)が存在し
ていることのチェックなどは行なっていない。このた
め、図示した処理では、監視アドレスとして2重に登録
される無駄が生じる可能性もある。しかしながら、たと
えば、すでに設定した監視アドレスを参照し、2重に登
録されないように処理を変更することなどはごく容易で
ある。
していないが、指定されたアドレスから辿れる子ノード
を含めて、この監視文書アドレス記憶部12から削除す
るものである。
および図10に示す。更新検出部13では、監視文書ア
ドレス記憶部12に記憶されたトップノード参照関係テ
ーブルに格納される各トップノードの文書アドレスごと
に、以下の処理を繰り返し行なう(ステップE2)。
書の更新時刻を読み込んで(ステップE3)、そのトッ
プノードの文書アドレスを文書情報更新記憶部14に格
納する(ステップE4)。更新時刻が前回の更新検出処
理の実行時刻より最近であった場合には(ステップE5
のY)、変更フラグをセットするが(ステップE6)、
一方、それ以前であった場合には(ステップE5の
N)、変更フラグはセットしない。次に、そのトップノ
ードに対応して監視文書アドレス記憶部12に格納され
ている各子ノードについて、子ノード更新検出処理を繰
り返し行なう(ステップE8〜ステップE9)。この際
の引数は、子ノードのアドレスである。
入力された文書アドレスの文書の更新時刻を読み込み
(ステップG2)、さらにそのアドレスを文書情報更新
記憶部14に格納する(ステップG3)。そして、更新
時刻が前回の更新検出時より最近であるか否かにしたが
って(ステップG4)、そのアドレスの文書が変更され
たか否かの情報を変更フラグに設定する。なお、前回の
更新検出時刻については図示していないが、これも文書
情報更新記憶部14に格納するものとする。そして、監
視文書アドレス記憶部12内に入力された文書アドレス
に対応する子ノードが存在する場合に限って、その各子
ノードごとに、子ノード更新検出処理を再帰的に呼び出
すことにより、再帰的に文書の更新状況をチェックし、
その結果を文書アドレスに対応する変更フラグに設定し
ていく。
文書の参照関係の階層をたどっていくための情報を記憶
している。更新時刻だけを入手するために文書内容を読
み込む必要なく、更新時刻のチェックを効率よく行なう
ためである。処理の効率を無視すれば、トップノードと
監視する段数のみを監視文書アドレス記憶部12に格納
し、更新検出を行なうときに、文書を実際に読み込みな
がら階層をたどって行くように変更することも可能であ
る。
図11に示す。図11に示したように、文書情報更新記
憶部14のデータは、文書間の階層関係とともに、変更
があった文書について値を設定する変更フラグからなっ
ている。
および図13に示す。文書情報更新通知部15では、更
新されている文書の通知を階層的に行なう。また、文書
情報更新記憶部14に変更フラグが設定されているアド
レスの文書については見出しを表示し、それ以外の文書
については省略記号を表示するものとする。この結果、
図14に示すように、更新された文書を、その構造に対
応させて得ることができることになる。図14(a)の
例では、「文書A」がトップノードであり、「見出し
A」は「文書A」の見出しである。また、この例は、ト
ップノードの「文書A」が「文書C」を、「文書C」が
「文書D」を、「文書D」が「文書B」をそれぞれ参照
していることを仮定し、さらに、「文書B」は、更新が
検出された文書(変更フラグが設定されたアドレスに対
応する文書)であることを仮定した場合の表示である。
る。トップノード(「文書A」)の見出しと、変更が検
出された文書Bの見出しとが表示され、それ以外の「文
書C」と「文書D」(更新が検出されなかった文書)に
ついては、省略記号(□)によって階層関係が提示され
ている。また、「文書A」が参照するそれ以外の文書に
ついても更新が検出されなかったものとして、省略記号
(…)が表示されている。
ノードの文書(見出しが「Overview of W
WW.ccc.bbb.aaaaaaa.co.j
p」)から2つの文書を経由して参照している文書(見
出しが「出張者報告」)が変更され、「全国大会(19
96/5/1)の報告」という見出しの文書が追加され
たことを示している。
実施形態について説明する。図15に本実施形態の文書
情報更新監視システムの機能ブロックを示す。図2に示
した機能ブロックとの相違は、更新時刻予測部16が付
加されている点にある。また、文書情報更新記憶部14
において、各文書の更新時刻が格納できるように拡張す
る。
によって設定された文書アドレスの文書について更新時
間を取り出し、その更新時間の履歴から各文書がいつ頃
更新されるかの予測を行なう。図16では説明を分かり
やすくするために、この処理を簡略化して示している。
すなわち、監視文書の更新時刻を取り出し(ステップI
1)、その更新時刻とこれまで入手した更新時刻の履歴
(不図示)とから、最頻値の時刻を更新予測時刻とする
ものである(ステップI2)。なお、監視文書の更新時
刻の取り出しについては、図9および図10で示した更
新検出部13の処理において、各文書の更新時刻を読み
込んだ際に、その更新時刻を、図17(b)に示したよ
うに、文書情報更新記憶部14の対応する箇所に格納す
ればよい(図17(a)は更新時刻予測値記憶部17の
記憶形式を示す)。
設定する必要がある。たとえば、時間単位で更新時刻の
頻度をカウントする場合、時間以下の単位(分や秒)や
曜日を無視してカウントすることになり、最大の頻度を
有する時間帯が更新時刻の予測値となる。また、曜日単
位で更新時刻をカウントした場合には、時間や分、秒を
無視して頻度をカウントし、最大の頻度を有する曜日が
更新時刻の予測値となる。このように、各監視文書アド
レスごとに予測更新時刻を求める。そして、これら各文
書アドレスごとの予測更新時刻から、文書群全体の更新
時刻の値を予測する。これについては、たとえば、全体
の平均値を取ることによって監視する文書群の更新時刻
の予測値とする。
に処理を簡略化しているが、監視文書は階層をなしてい
るので、その階層をなすすべての文書に対して更新時刻
を取り出し、その更新時刻から最頻値を求めることにな
る。そして、この求めた更新時刻は、更新時刻予測値記
憶部17に格納する。更新時刻予測値記憶部17は、図
17(a)に示したように、監視する文書群ごとに、そ
のトップノードのアドレスと予測時刻とがペアで記憶さ
れる形式になっている。
測値記憶部17に格納された各文書群の予測時刻にした
がって、その時刻から一定の時刻経過した後に、その文
書群に対して更新検出処理を起動する。これにより、最
近の更新状況を取り出すことができる確率が大きくな
る。
て、更新検出部13と別モジュールで構成する例を示し
た。しかしながら、更新時刻予測部16の処理の大半
は、監視文書アドレス記憶部12に設定された文書の更
新時刻を取り出すことであり、更新検出部13とほとん
ど同じ処理をしていることになる。したがって、更新検
出部13の処理過程で、同時に更新時間の予測を行なう
ように変形することは容易である。
実施形態について説明する。図18に本実施形態の文書
情報更新監視システムの機能ブロックを示す。図2に示
した機能ブロックとの相違は、最終更新時間監視部18
が付加されている点にある。
ように、監視文書の最終更新時刻を取得して(ステップ
J1)、この取得した監視文書の最終更新時刻からある
一定の期間を経過したか否かをチェックし(ステップJ
2)、一定の期間を越えた場合に(ステップJ2の
Y)、その文書のアドレスを、監視文書アドレス記憶部
12から削除する(ステップJ3)といった処理を行な
う。
に、この処理を簡略化して示しているが、監視文書は階
層をなしているので、その階層をなすすべての文書に対
して更新時刻を取り出し、その取り出した更新時刻から
最終更新時間をチェックすることになる。
として、更新検出部13と別モジュールで構成する例を
示した。しかしながら、最終更新時間監視部18の処理
の大半は、監視文書アドレス記憶部12に設定された文
書の更新時刻を取り出すことであり、更新検出部13と
ほとんど同じ処理をしていることになる。したがって、
更新検出部13の処理過程で、同時に最終更新時間のチ
ェックを行なうように変形することは容易である。
あまり更新が行なわれない文書のアドレスを削除する際
に、利用者に対して削除するべきとの警告を発し、その
警告にしたがった場合にのみ、そのアドレスを削除する
ようにしても構わない。
実施形態について説明する。図20に本実施形態の文書
情報更新監視システムの機能ブロックを示す。図2に示
した機能ブロックとの相違は、文書削除検出部19が付
加されている点にある。
ジの作成者がそのページを削除したり、格納している位
置を変更したりすることは日常的に行なわれる。そし
て、そのように削除されている場合に、そのページを何
度も参照しにいくことは無駄な処理である。そこで、本
実施形態の文書削除検出部19では、図21に示したよ
うに、監視している文書が格納されている位置から削除
されている場合に(ステップK1のN)、監視文書アド
レス記憶部12から対応する文書アドレスを削除する
(ステップK2)。
て、更新検出部13と別モジュールで構成した。しかし
ながら、文書削除検出部19では、監視文書アドレス記
憶部12に設定されている文書にアクセスすることで削
除されている否かをチェックすることができる。したが
って、更新検出部13の処理過程で、同時に処理するよ
うに変形することは容易である。
書アドレスを削除する際に、利用者に対して削除するべ
きとの警告を発し、その警告にしたがった場合にのみ、
そのアドレスを削除するようにしても構わない。
実施形態について説明する。図22に本実施形態の文書
情報更新監視システムの機能ブロックを示す。図2に示
した機能ブロックとの相違は、新規アドレス抽出部20
が付加されている点にある。
る。したがって、Webページの管理や整理のために、
従来格納していたアドレスから別のアドレスに実体を移
す場合が頻繁に起こる。この様子を図23に示す。
初文書1がいわゆるホームページの位置に設定されてい
たが、そのホームページの管理者が、文書の増大に伴っ
て文書をカテゴリ化し、新たにリンクだけからなる文書
((b)の文書5)を作成して、この文書へのリンク情
報を文書5内に埋め込んだ場合に相当する。
るアドレスが変更された文書の新規のアドレスを探索
し、監視文書アドレス記憶部12の対応するアドレスを
その新規アドレスに置き換える処理を行なう。
記憶部12に格納されている文書アドレス間の対応関係
を用いて新規アドレスを求める処理を示す。図示した処
理では、監視文書アドレス記憶部12にこれまでのトッ
プノードが子ノードとして含んでいた文書アドレスが記
憶されているので、新規文書から辿れる文書を再帰的に
読み込みながら(ステップL1)、この子ノードのアド
レスと一致する文書リストを持つ文書を求める(ステッ
プL2(図25のステップM1〜ステップM7))。そ
して、この文書が格納されているアドレスが新規アドレ
スということになる。なお、図25のステップM3では
参照しているアドレスがまったく同じかどうかをチェッ
クしているが、文書の参照関係が多少修正されている可
能性もあるので、ある一定の割合以上の文書数のアドレ
スが一致していることを条件とするように変形すること
も可能である。
実施形態について説明する。図26に本実施形態の文書
情報更新監視システムの機能ブロックを示す。図2に示
した機能ブロックとの相違は、参照文書検出部21が付
加されている点にある。
ス記憶部12に設定されている各トップノードを参照し
ている文書を検出する処理を行なう。ある文書を参照し
ている文書を検索する場合、データベース中に格納され
ているすべての文書を取り出し、各文書ごとにその文書
が参照している文書を求めることで、参照元の文書を求
めることができる。つまり、参照文書検出部21では、
「文書B」内に「文書A」へのリンクを張っている場合
に、「文書A」に対して「文書B」が参照しているとい
う逆向きのパスを求める処理を行なう。
な検索を実現することが求められる。このために、あら
かじめ、Web検索サーバのインデクシングシステム
は、WWW上でアクセス可能なサイトを巡回しながらW
eb文書をローカルに読み込み、その読み込んだ文書に
含まれる文字または単語のインデックスを作成してい
る。そして、そのインデックスにしたがって、入力され
た検索条件のWeb文書を検索する。ここで、各サイト
を巡回しながらWeb文書を読み込むシステムは、一般
にネットワークロボットと呼ばれ、Web検索サーバに
おいて実際にインデックスを作る際に用いられている。
ここではこのネットワークロボットを利用した処理の流
れを図27に示す。
内、文書の参照関係を求める処理の部分である。Web
文書を一文書ごとに入手しながら、その文書内で参照し
ている文書のアドレスを抽出し(ステップO1)、元文
書−参照文書という形式で、図28に示すような参照関
係テーブルに格納する(ステップO2)。この参照関係
テーブルは、ある文書(元文書)と、その文書が参照し
ている文書(参照文書アドレス)との双方のアドレスを
対にして記憶する形式となっている。
テーブル211および監視文書参照関係テーブル212
との関係を示し、図30に参照文書検出部21のうち、
監視している文書に対して新たな参照が発生したことを
ユーザに通知する処理の流れを示す。また、図31に、
この監視文書参照関係テーブル212の記憶形式を示
す。
テーブル212に記述されている参照元文書アドレスと
監視文書アドレスとの対に含まれない対が、参照関係テ
ーブルに存在している場合(ステップP1のY)、その
元文書アドレスが監視文書に対する新規な参照元文書と
いうことになる。したがって、この検出された対を新た
に監視文書参照関係テーブルに格納するとともに、ユー
ザに検出した旨を通知する(ステップP2)。
更新時間が取り出せるものとして構成する例を示した。
したがって、更新時間が取り出せない文書データベース
に対しては、たとえば更新を監視するごとに文書を読み
込んで記憶しておき、その記憶した文書との比較を行な
うことにより、更新されたか否かを判定するようにして
も構わない。
して実現可能であるため、CD−ROMやフロッピィデ
ィスクなどといった記録媒体によって頒布することが可
能である。また、磁気ディスクなどに格納しておき、ネ
ットワークで取り寄せる(ダウンロード)ような形式で
頒布することも可能である。
報更新監視装置によれば、階層的な構造を持つ文書群に
対し、利用者の作業量を増加させることなく、その更新
を効果的に監視することが可能となる。
監視するのではなく、その更新傾向を分析し、その分析
結果にしたがった監視を実施するので、より効率的に監
視することが可能となる。
最適化していくために、利用者による再設定などの操作
を必要とすることなく、常に最適な更新監視が継続され
ることになる。
システムの機器構成を示す図。
ブロックを示す図。
るフローチャート。
示す図。
ローチャート。
を示すフローチャート。
格納される子ノードを示す図。
の流れを示すフローチャート。
ローチャート。
フローチャート。
形式を示す図。
示すフローチャート。
示すフローチャート。
示す図。
視システムの機能ブロックを示す図。
示すフローチャート。
の記憶形式、(b)は同実施形態の文書情報更新記憶部
の記憶形式を示す図。
視システムの機能ブロックを示す図。
れを示すフローチャート。
視システムの機能ブロックを示す図。
示すフローチャート。
視システムの機能ブロックを示す図。
めの図。
れを示すフローチャート。
れを示すフローチャート。
視システムの機能ブロックを示す図。
示すフローチャート。
図。
ーブルおよび監視文書参照関係テーブルとの関係を示す
図。
文書に対して新たな参照が発生したことをユーザに通知
する処理の流れを示すフローチャート。
憶形式を示す図。
示する図。
書指定部、12…監視文書アドレス記憶部、13…更新
検出部、14…文書情報更新記憶部、15…文書情報更
新通知部、16…更新時刻予測部、17…更新時刻予測
値記憶部、18…最終更新時間監視部、19…文書削除
検出部、20…新規アドレス抽出部、21…参照文書検
出部。
Claims (11)
- 【請求項1】 監視対象とする文書の格納位置を示すア
ドレスおよび前記文書を起点に階層的な構造をなす文書
群を一括で指定する文書指定手段と、 この文書指定手段によって指定された少なくとも一つ以
上の文書の中から更新の施された文書を検出する更新検
出手段と、 この更新検出手段によって検出された文書を、その文書
を含んで構成される文書群の階層構造と対応づけて通知
する通知手段とを具備してなることを特徴とする文書情
報更新監視装置。 - 【請求項2】 前記通知手段は、前記更新検出手段によ
って検出された文書を、その文書を含んで構成される文
書群の階層構造と対応づけて表示する手段を具備してな
ることを特徴とする請求項1記載の文書情報更新監視装
置。 - 【請求項3】 前記文書指定手段によって指定された文
書それぞれの更新時期を予測する更新時期予測手段をさ
らに具備し、 前記更新検出手段は、前記更新時期予測手段によって予
測された時期にしたがって、前記文書指定手段によって
指定された文書の中から処理対象とする文書を選定する
手段を具備してなることを特徴とする請求項1記載の文
書情報更新監視装置。 - 【請求項4】 前記文書指定手段によって指定された文
書それぞれの最終更新時刻を記憶する最終更新時刻記憶
手段と、 前記最終更新時刻記憶手段に記憶された最終更新時刻か
らの経過時間が予め定められたしきい値を越えている文
書の格納位置を示すアドレスを、前記文書指定手段によ
る指定から削除する指定削除手段とをさらに具備してな
ることを特徴とする請求項1記載の文書情報更新監視装
置。 - 【請求項5】 前記更新検出手段は、前記文書指定手段
によって指定された文書本体が削除されたことを検出す
る手段を具備し、 前記更新検出手段によっていずれかの文書の本体削除が
検出されたときに、その文書の格納位置を示すアドレス
を、前記文書指定手段による指定から削除する指定削除
手段をさらに具備してなることを特徴とする請求項1記
載の文書情報更新監視装置。 - 【請求項6】 前記文書指定手段によって指定された文
書本体の格納位置が変更されたときに、その変更先のア
ドレスを検出するアドレス検出手段と、 前記アドレス検出手段によっていずれかの文書の変更先
のアドレスが検出されたときに、前記文書指定手段によ
って指定されたその文書のアドレスを、前記アドレス検
出手段が検出したアドレスに書き換えるアドレス書き換
え手段とをさらに具備してなることを特徴とする請求項
1記載の文書情報更新監視装置。 - 【請求項7】 文書間の参照関係を収集する参照関係収
集手段を有する文書情報更新監視装置において、 監視対象とする文書の格納位置を示すアドレスを指定す
る文書指定手段と、 この文書指定手段によって指定された文書を参照する他
の文書が新たに発生した旨を前記参照関係収集手段の収
集結果から検知する検知手段と、 この検知手段によって検出された前記新たに発生した他
の文書を利用者に通知する通知手段を具備してなること
を特徴とする文書情報更新監視装置。 - 【請求項8】 監視対象とする文書の格納位置を示すア
ドレスおよび前記文書を起点に階層的な構造をなす文書
群を一括で指定し、 この指定された少なくとも一つ以上の文書の中から更新
の施された文書を検出し、 この検出された文書を、その文書を含んで構成される文
書群の階層構造と対応づけて通知することを特徴とする
文書情報の更新監視方法。 - 【請求項9】 文書間の参照関係を収集する参照関係収
集手段を有する文書情報更新監視装置に適用される文書
情報の更新監視方法において、 監視対象とする文書の格納位置を示すアドレスを指定
し、 この指定された文書を参照する他の文書が新たに発生し
た旨を前記参照関係収集手段の収集結果から検知し、 この検出された前記新たに発生した他の文書を利用者に
通知することを特徴とする文書情報の更新監視方法。 - 【請求項10】 監視対象とする文書の格納位置を示す
アドレスおよび前記文書を起点に階層的な構造をなす文
書群を一括で指定し、 この指定された少なくとも一つ以上の文書の中から更新
の施された文書を検出し、 この検出された文書を、その文書を含んで構成される文
書群の階層構造と対応づけて通知するようにコンピュー
タを動作させるためのプログラムを記録したコンピュー
タ読み取り可能な記録媒体。 - 【請求項11】 文書間の参照関係を収集する参照関係
収集手段を有するコンピュータ上で文書情報の更新監視
を制御するためのプログラムであって、 監視対象とする文書の格納位置を示すアドレスを指定
し、 この指定された文書を参照する他の文書が新たに発生し
た旨を前記参照関係収集手段の収集結果から検知し、 この検出された前記新たに発生した他の文書を利用者に
通知するように前記コンピュータを動作させるためのプ
ログラムを記録したコンピュータ読み取り可能な記録媒
体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP24910197A JP3612185B2 (ja) | 1996-09-13 | 1997-09-12 | 文書情報更新監視装置 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP8-243877 | 1996-09-13 | ||
JP24387796 | 1996-09-13 | ||
JP24910197A JP3612185B2 (ja) | 1996-09-13 | 1997-09-12 | 文書情報更新監視装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH10143418A true JPH10143418A (ja) | 1998-05-29 |
JP3612185B2 JP3612185B2 (ja) | 2005-01-19 |
Family
ID=26536475
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP24910197A Expired - Fee Related JP3612185B2 (ja) | 1996-09-13 | 1997-09-12 | 文書情報更新監視装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3612185B2 (ja) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000123048A (ja) * | 1998-10-02 | 2000-04-28 | Nec Corp | ドキュメント管理システム及びその実現方法 |
JP2000181778A (ja) * | 1998-11-19 | 2000-06-30 | Lg Electronics Inc | 自動情報検索装置及びその方法 |
JP2002117073A (ja) * | 2000-10-04 | 2002-04-19 | Sharp Corp | 新着情報提示方法およびその方法を実行させるプログラムを記録した記録媒体ならびにそのプログラムを実行するコンピュータ |
JP2002526865A (ja) * | 1998-10-01 | 2002-08-20 | インターナショナル・ビジネス・マシーンズ・コーポレーション | イントラネット・ユーザにコンテンツを割り当て、生成し、配布するシステム、方法、およびコンピュータ・プログラム製品 |
JP2006004304A (ja) * | 2004-06-21 | 2006-01-05 | Mitsubishi Electric Corp | データ管理装置及びデータ管理方法及びプログラム |
JP2006072626A (ja) * | 2004-09-01 | 2006-03-16 | Fuji Xerox Co Ltd | 文書管理装置および方法およびプログラム |
JP2007074315A (ja) * | 2005-09-06 | 2007-03-22 | Alpine Electronics Inc | 情報付加システム及び携帯通信端末 |
JP2008090369A (ja) * | 2006-09-29 | 2008-04-17 | Sharp Corp | コンテンツ受信装置およびコンテンツ受信方法 |
JP4606548B2 (ja) * | 2000-05-25 | 2011-01-05 | 富士通株式会社 | 検索システムのメンテナンス方法及び検索システム |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0535797A (ja) * | 1991-07-26 | 1993-02-12 | Matsushita Electric Ind Co Ltd | 情報検索装置 |
JPH05225037A (ja) * | 1992-02-12 | 1993-09-03 | Fuji Xerox Co Ltd | ハイパーテキストモデル表示装置 |
JPH09181723A (ja) * | 1995-12-26 | 1997-07-11 | Fujitsu Ltd | ネットワークにおける資源の変化を通知するネットワーク資源監視システムおよび方法 |
US6092091A (en) * | 1996-09-13 | 2000-07-18 | Kabushiki Kaisha Toshiba | Device and method for filtering information, device and method for monitoring updated document information and information storage medium used in same devices |
JP2001503537A (ja) * | 1995-10-27 | 2001-03-13 | エイ・ティ・アンド・ティ・コーポレーション | オンラインデータリポジトリの変更データの識別 |
-
1997
- 1997-09-12 JP JP24910197A patent/JP3612185B2/ja not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0535797A (ja) * | 1991-07-26 | 1993-02-12 | Matsushita Electric Ind Co Ltd | 情報検索装置 |
JPH05225037A (ja) * | 1992-02-12 | 1993-09-03 | Fuji Xerox Co Ltd | ハイパーテキストモデル表示装置 |
JP2001503537A (ja) * | 1995-10-27 | 2001-03-13 | エイ・ティ・アンド・ティ・コーポレーション | オンラインデータリポジトリの変更データの識別 |
JPH09181723A (ja) * | 1995-12-26 | 1997-07-11 | Fujitsu Ltd | ネットワークにおける資源の変化を通知するネットワーク資源監視システムおよび方法 |
US6092091A (en) * | 1996-09-13 | 2000-07-18 | Kabushiki Kaisha Toshiba | Device and method for filtering information, device and method for monitoring updated document information and information storage medium used in same devices |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002526865A (ja) * | 1998-10-01 | 2002-08-20 | インターナショナル・ビジネス・マシーンズ・コーポレーション | イントラネット・ユーザにコンテンツを割り当て、生成し、配布するシステム、方法、およびコンピュータ・プログラム製品 |
JP2000123048A (ja) * | 1998-10-02 | 2000-04-28 | Nec Corp | ドキュメント管理システム及びその実現方法 |
JP2000181778A (ja) * | 1998-11-19 | 2000-06-30 | Lg Electronics Inc | 自動情報検索装置及びその方法 |
US8239384B2 (en) | 1998-11-19 | 2012-08-07 | Lg Electronics Inc. | Apparatus for automatically searching information and method thereof |
JP4606548B2 (ja) * | 2000-05-25 | 2011-01-05 | 富士通株式会社 | 検索システムのメンテナンス方法及び検索システム |
JP2002117073A (ja) * | 2000-10-04 | 2002-04-19 | Sharp Corp | 新着情報提示方法およびその方法を実行させるプログラムを記録した記録媒体ならびにそのプログラムを実行するコンピュータ |
JP2006004304A (ja) * | 2004-06-21 | 2006-01-05 | Mitsubishi Electric Corp | データ管理装置及びデータ管理方法及びプログラム |
JP2006072626A (ja) * | 2004-09-01 | 2006-03-16 | Fuji Xerox Co Ltd | 文書管理装置および方法およびプログラム |
JP2007074315A (ja) * | 2005-09-06 | 2007-03-22 | Alpine Electronics Inc | 情報付加システム及び携帯通信端末 |
JP2008090369A (ja) * | 2006-09-29 | 2008-04-17 | Sharp Corp | コンテンツ受信装置およびコンテンツ受信方法 |
Also Published As
Publication number | Publication date |
---|---|
JP3612185B2 (ja) | 2005-01-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6092091A (en) | Device and method for filtering information, device and method for monitoring updated document information and information storage medium used in same devices | |
JP3655714B2 (ja) | 情報フィルタリング装置及び記録媒体 | |
US6088707A (en) | Computer system and method of displaying update status of linked hypertext documents | |
JP4489994B2 (ja) | 話題抽出装置、方法、プログラム及びそのプログラムを記録する記録媒体 | |
US7194524B2 (en) | Information processing system, information disclosing server, and portal server | |
JP5513434B2 (ja) | パーペチュアルカレンダページを含むウェブページのトラップ検出及びこれを用いた検索データベース構築方法、システム及びコンピュータ読取可能な記録媒体 | |
US8423885B1 (en) | Updating search engine document index based on calculated age of changed portions in a document | |
JPWO2008149843A1 (ja) | 情報提示システム、情報提示方法及び情報提示用プログラム | |
JP3698242B2 (ja) | 情報セット重要度判定システム及びその判定方法、及び情報セット重要度判定プログラムを記録した記録媒体 | |
JPH09265482A (ja) | データベース検索装置及びデータベース検索方法 | |
JPH10143418A (ja) | 文書情報更新監視装置および文書情報の更新監視方法 | |
JPH0550774B2 (ja) | ||
US20020059223A1 (en) | Locator based assisted information browsing | |
JP2940459B2 (ja) | ノード・リンク探索装置 | |
JP4253315B2 (ja) | 知識情報収集システムおよび知識情報収集方法 | |
JPWO2004031956A1 (ja) | 関連情報管理方法、プログラム及び装置 | |
KR100667917B1 (ko) | 웹사이트 검색 서비스 제공 방법 및 그 시스템 | |
KR20060075798A (ko) | 해외 과학기술 전자원문 수집/색인/추출 시스템과 그 방법및 그 방법에 대한 컴퓨터 프로그램을 저장한 기록매체 | |
JP3655495B2 (ja) | 情報検索方法および装置と情報検索プログラムを記録した記録媒体 | |
KR100496384B1 (ko) | 검색엔진과, 검색시스템, 검색시스템에서의 데이터베이스 작성방법 및, 기억매체 | |
JP3725087B2 (ja) | 知識情報収集システムおよび知識情報収集方法 | |
JP2005031867A (ja) | ウエブ情報収集装置及びウエブ情報収集方法 | |
KR100942902B1 (ko) | 웹페이지 검색 방법 및 상기 방법을 컴퓨터에서 구현하는 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체 | |
JP3708893B2 (ja) | 知識情報収集システムおよび知識情報収集方法 | |
JP3725088B2 (ja) | 知識情報収集システムおよび知識情報収集方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040120 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040322 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040511 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040707 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20041019 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20041022 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081029 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |