JP2010044708A

JP2010044708A - Ｗｅｂ資源追跡管理プログラム、Ｗｅｂ資源追跡管理装置及びＷｅｂ資源追跡管理方法

Info

Publication number: JP2010044708A
Application number: JP2008210003A
Authority: JP
Inventors: Fumito Nishino; 文人西野; Terunobu Kume; 照宣粂
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2008-08-18
Filing date: 2008-08-18
Publication date: 2010-02-25
Anticipated expiration: 2028-08-18
Also published as: JP5187064B2

Abstract

【課題】１ページに１つ以上の資源を含む第一のＷｅｂ資源から他のＷｅｂ資源へ移動した資源を容易且つ迅速に追跡できるＷｅｂ資源追跡管理プログラム、Ｗｅｂ資源追跡管理装置及びＷｅｂ資源追跡管理方法を提供することを目的とする。
【解決手段】コンピュータを、第一のＷｅｂ資源の所在情報と、注目資源を識別する為の注目資源識別情報との対応関係を受け取る受取手段と、利用者に選択された所在情報に対応するＷｅｂ資源を取り出す取出手段と、Ｗｅｂ資源に注目資源が存在するかを、注目資源識別情報により確認する存在確認手段と、Ｗｅｂ資源に注目資源が存在しなければＷｅｂ資源に含まれる他のＷｅｂ資源へのリンクを抽出する抽出手段と、リンクで示される所在情報を次の所在情報として取出手段へ通知する追跡手段と、Ｗｅｂ資源に注目資源が存在すればＷｅｂ資源を利用者の端末に送信する送信手段として機能させることにより上記課題を解決する。
【選択図】図９

Description

本発明は、Ｗｅｂ資源追跡管理プログラム、Ｗｅｂ資源追跡管理装置及びＷｅｂ資源追跡管理方法に係り、特に１ページに１つ以上の資源を含む第一のＷｅｂ資源から他のＷｅｂ資源へ移動した資源を追跡する為のＷｅｂ資源追跡管理プログラム、Ｗｅｂ資源追跡管理装置及びＷｅｂ資源追跡管理方法に関する。

近年、インターネットやイントラネット等のネットワーク上のＷｅｂ資源へのアクセス技術が、よく利用されるようになっている。Ｗｅｂページ等のＷｅｂ資源へのアクセス技術は検索システム，Ｗｅｂアノテーションシステム，Ｗｅｂブラウザ，ブックマークシステムなどで利用されている。

検索システムは、ネットワーク上のＷｅｂページに対して、あらかじめインデックスを用意しておき、検索時に与えられたクエリー（処理要求）に対してインデックスを参照してＷｅｂページの所在情報（例えばＵＲＬ）を返すものである。

一方、Ｗｅｂアノテーションシステムはネットワーク上のＷｅｂページに対して、そのＷｅｂページの作者と異なる別の第三者が、そのＷｅｂページに対し、二次情報として付箋，下線又はマーカなどのアノテーションを付与し、そのＷｅｂページの閲覧時に、付与したアノテーションをＷｅｂページと同時に表示したり、又は付与したアノテーションに基づいた処理をＷｅｂページに加えたりするものである。

通常はＷｅｂページにアノテーションが付与されたとき、そのＷｅｂページのＵＲＬを保持しておき、そのＵＲＬで指定されるＷｅｂページの閲覧時にアノテーションを復元することで、時間をおいてのＷｅｂページの閲覧や、アノテーションを付与したアノテータと異なる第三者による閲覧であってもアノテーションを復元するものである。

これら検索システムやＷｅｂアノテーションシステム等は、Ｗｅｂページに含まれる記事などの資源の所在が時間を経ても変わらない場合、有効に作用する。しかし、ブログやニュース等のフロー型情報を扱うサイトでは、一つのＵＲＬで指定されるＷｅｂページに一つあるいは複数の記事を有する。また、ブログやニュース等のフロー型情報を扱うサイトでは、時間とともに別の記事が追加され、Ｗｅｂページ内の構成が変更される。

上述したように、検索システムやＷｅｂアノテーションシステム等は、Ｗｅｂページが必要となる度に、ＵＲＬで指定されるＷｅｂページを取得しているため、Ｗｅｂページ内の構成が変更されると、インデックスの内容やアノテーションの付与される位置が実際のＷｅｂページと対応しなくなることがあった。

このような事態に対応するため、特許文献１にはマーカ等を文書に付した後、その文書が変更された場合であっても、ある程度の追跡を可能とする内容が記載されている。特許文献１ではマーカ等の表示位置とその前後の文字列とを対応付けて記録しておき、マーカ等を表示する際に表示位置の前後の文字列を検査する。そして、特許文献１ではマーカ等の表示位置の前後の文字列が、記録されている文字列と異なる場合に、記録されている文字列の位置を文書中から探し出して、本来、表示する位置を取得してマーカ等を表示している。

特許文献１の技術を応用することで、検索システムやＷｅｂアノテーションシステム等はＷｅｂページ内の構成が変更されたとしても、インデックスの内容やアノテーションの付与される位置を実際のＷｅｂページと対応させることができた。
特開２０００−１６３４１４号公報

従来、Ｗｅｂページ内の記事数が制限されている場合には「次のページ」というような形式で、最初のＵＲＬとは別のＵＲＬで指定されるＷｅｂページの中に記事が移動する場合もあった。

このような最初のＵＲＬとは別のＵＲＬで指定されるＷｅｂページの中に記事が移動する場合は、記事を閲覧しようとして元の所在（最初のＵＲＬ）にアクセスしたとき、自動的にその記事が移動した先（別のＵＲＬ）にジャンプ（移動した先の記事を表示）させたいという要求がある。

図１は最初のＵＲＬとは別のＵＲＬで指定されるＷｅｂページの中に記事が移動する例を表した一例の模式図である。ある時点で、１．ｈｔｍｌというファイル１０には、記事Ａ、記事Ｂ、記事Ｃがあったとする。一般的にニュースやブログなどは、ファイル１０に示すように１ページに複数の記事Ａ〜Ｃを含んでおり、新しい記事Ｃが上部に配置されることが多い。この時点で記事Ｂは、検索システムの場合、インデックスとして、Ｗｅｂアノテーションの場合、記事Bに付与されたアノテーションの位置として、１．ｈｔｍｌに存在すると記憶されている。

ここでは仮にｉｎｄｅｘ．ｈｔｍｌというファイル１２が各記事の所在を記憶しているものとする。ある時間が経過すると、１．ｈｔｍｌには記事Ｄ、記事Ｅが追加され、一定の条件を超えた記事が他のＷｅｂページに移動される。図１では、１ページ内に３記事までと制限されているとして、あふれた記事Ａと記事Ｂとが２．ｈｔｍｌというファイル１１に移動したことを意味している。このように記事が移動した場合は、記事の移動先を自動的に追跡し、移動した先の記事を表示させたいという要求があった。

検索システムではロボットが関連する資源を再収集し、インデックスを再構築することにより、インデックスが正しい位置を示すようにしている。検索システムでは再収集する間隔を短くすることにより、正しくなるまでの期間を短くするようにしている。しかしながら、これは確率的な問題であり、正しくなるまでの期間を零にできない。

Ｗｅｂアノテーションシステムは、キーワード（あるいはｎｇｒａｍ）を抽出して注目アイテム識別情報とし、この注目アイテム識別情報を検索システムに与えることで、検索システムが指し示すところにアノテーションの付与先が移動したと認識できる。しかしながら、前述のとおり、これは検索システムが常に正しい位置を指し示していることが前提となっており、この前提が成り立たないこともある。

従来は、記事の移動とロボットによる関連するＷｅｂページの位置の再収集とが非同期であるため、インデックスを再構築するまでに時間が掛かり、タイミングによっては移動した記事を検索できないという問題があった。なお、検索のインデックスをオンデマンドで起動して収集することも可能であるが、インデックスの再構築は時間が掛かり、高速に注目している記事を追跡できないという問題があった。

本発明の一実施形態は、上記の点に鑑みなされたもので、１ページに１つ以上の資源を含む第一のＷｅｂ資源から他のＷｅｂ資源へ移動した資源を容易且つ迅速に追跡できるＷｅｂ資源追跡管理プログラム、Ｗｅｂ資源追跡管理装置及びＷｅｂ資源追跡管理方法を提供することを目的とする。

上記課題を解決するため、本発明の一実施形態は、コンピュータに、１ページに１つ以上の資源を含む第一のＷｅｂ資源から他のＷｅｂ資源へ移動した前記資源を追跡させるＷｅｂ資源追跡管理プログラムであって、前記コンピュータを、前記第一のＷｅｂ資源の所在情報と、前記第一のＷｅｂ資源に含まれる注目資源を識別する為の注目資源識別情報との対応関係を受け取る受取手段と、利用者に選択された前記所在情報に対応する前記Ｗｅｂ資源を取り出す取出手段と、前記取出手段が取り出した前記Ｗｅｂ資源に前記注目資源が存在するかを、前記注目資源識別情報により確認する存在確認手段と、前記取出手段が取り出した前記Ｗｅｂ資源に前記注目資源が存在しなければ前記Ｗｅｂ資源に含まれる前記他のＷｅｂ資源へのリンクを抽出する抽出手段と、前記抽出手段が抽出した前記リンクで示される所在情報を次の所在情報として前記取出手段へ通知する追跡手段と、前記取出手段が取り出した前記Ｗｅｂ資源に前記注目資源が存在すれば前記Ｗｅｂ資源を前記利用者の端末に送信する送信手段として機能させるためのＷｅｂ資源追跡管理プログラムであることを特徴とする。

なお、本発明の一実施形態の構成要素、表現または構成要素の任意の組合せを、方法、装置、システム、コンピュータプログラム、記録媒体、データ構造などに適用したものも本発明の態様として有効である。

上述の如く、本発明の一実施形態によれば、１ページに１つ以上の資源を含む第一のＷｅｂ資源から他のＷｅｂ資源へ移動した資源を容易且つ迅速に追跡できる。

次に、本発明を実施するための最良の形態を、以下の実施例に基づき図面を参照しつつ説明していく。

（本実施例の概要）
本実施例は、Ｗｅｂページ間の移動がおこる記事などの注目アイテム（注目資源）へのジャンプにおいて、指定された所在（ＵＲＬ）に注目アイテムがない場合、Ｗｅｂページ内の「次のページ」というような形式で、別のＵＲＬで指定されるＷｅｂページにジャンプするリンク（以下、ナビゲーションリンクという）を探し出し、そのナビゲーションリンクを辿って目的の注目アイテムを見つけるものである。したがって、本実施例では他のＷｅｂページへ移動した注目アイテムを追跡できる。

本実施例は、インターネットやイントラネット等のネットワーク上の記事等の資源に対する検索やアノテーションにおいて、無秩序に（人の自由意志によって）行われる移動ではないシステマティックな記事の移動があった場合でも、検索結果やアノテーションされた資源の閲覧において、資源の移動を反映した移動先へのアクセス（閲覧など）を可能とするものである。

例えば、"hoge"という文字列を含む記事Aが「http://foo/bar1.html」のＷｅｂページにあったとする。検索エンジンのクローラは、このＷｅｂページを収集して"hoge"という文字列の所在として「http://foo/bar1.htmlを記憶したとする。その後、「http://foo/」というサイトでは記事が追加され、記事Aが「http://foo/bar2.html」に移動したとする。このとき検索エンジンの利用者が、クエリーとして"hoge"を与えて検索した時、従来の検索エンジンでは文字列"hoge"の所在として「http://foo/bar1.html」を返す。一方、本実施例では文字列"hoge"の所在として、記事Aの移動先である「http://foo/bar2.html」を返す（あるいは返された所在をクリックした時に移動先である「http://foo/bar2.html」にジャンプする）ことができる。

あるいはＷｅｂアノテーションという応用では、「http://foo/bar1.html」にあった記事Aにアノテーションをしたとき、Ｗｅｂアノテーションシステムがそのアノテーションの所在として「http://foo/bar1.html」を記憶したとする。その後、「http://foo/」というサイトでは記事が追加され、記事Aは「http://foo/bar2.html」に移動したとする。このとき、アノテーションの所在を記したところから当アノテーションを付与した記事にジャンプしようとすると、従来のＷｅｂアノテーションシステムでは「http://foo/bar1.html」にジャンプしてしまい、アノテーションを付与した記事Aがみつからない。一方、本実施例では記事Aの移動先である「http://foo/bar2.html」にジャンプすることで、記事Aと、そこに付与されたアノテーションとを表示することができる。

次に、サンプルのＨＴＭＬテキストで説明する。例えば、「http://foo/bar1.html」のＷｅｂページが図２に示すようなものであるとする。図２はＷｅｂページの一例のイメージ図である。図２のＷｅｂページは記事が水平線で区切られ、各記事に日付、タイトル、記事内容が含まれている。そして、図２のＷｅｂページは新しい記事が登録されると上に追加される。図２のＷｅｂページには一定の記事数だけが掲載される。図２のＷｅｂページは底に「前のページ」というリンクがあって、古くなった記事がリンク先に掲載されている。例えば記事３０１２を含むインデックスを作成し、図３のようなリンクページが作成されたとする。

図３はリンクページの一例のイメージ図である。図３のリンクページは、通常のＷｅｂにおいて、例えば図４のようなＨＴＭＬファイルで表現される。図４は、リンクページを表現するＨＴＭＬファイルの一例のイメージ図である。

図３のリンクページの「記事３０１２」の部分をクリックすると、記事３０１２をもともと含んでいたＷｅｂページにジャンプすることになる。例えば図４のＨＴＭＬファイルの場合は、「http://foo/bar1.html」のＷｅｂページにジャンプする。図３のリンクページは文字列"hoge"の検索結果であっても、アノテーションした所在の一覧リストであってもよい。

しかし、ニュースやブログなどのＷｅｂページは時間が経つと記事が追加される。例えば図２のＷｅｂページは時間が経つと記事が追加され、例えば図５のＷｅｂページのようになっているかもしれない。図５は、記事が追加されたＷｅｂページの一例のイメージ図である。

図５のＷｅｂページは、図２のＷｅｂページとＵＲＬが同じであるが、記事３０１４及び３０１５が追加され、図２のＷｅｂページに掲載されていた記事３０１１及び３０１２が「前のページ」というナビゲーションリンク先の図６に示すようなＷｅｂページに移動している。図６はナビゲーションリンク先のＷｅｂページの一例のイメージ図である。例えば図６のＷｅｂページのＵＲＬは、「http://foo/bar2.html」であるとする。

従来、図３のリンクページは注目アイテム（記事３０１２）の所在を、インデックスが作成された時点での物理的位置「http://foo/bar1.html」として記憶している。インデックスが作成された後で記事３０１２が「http://foo/bar2.html」のＷｅｂページに移動したとすると、図３のリンクページから記事３０１２へのジャンプでは、記事３０１２の無い物理的位置「http://foo/bar1.html」のＷｅｂページが表示されてしまう。

そこで、本実施例では、リンクページから注目アイテムである記事３０１２にアクセスしようとした時、インデックスが作成された時点での物理的位置「http://foo/bar1.html」のＷｅｂページではなく、「前のページ」というアンカーで示されたナビゲーションリンクを利用して、現時点で注目アイテムである記事３０１２が存在する「http://foo/bar2.html」のＷｅｂページにジャンプしようとするものである。

すなわち、検索システムでは図３のリンクページの記事３０１２をクリックすると図５のＷｅｂページではなく図６のＷｅｂページが表示される。また、Ｗｅｂアノテーションシステムでは図６のＷｅｂページにアノテーションが付与された図７に示すＷｅｂページが表示される。図７はナビゲーションリンク先のＷｅｂページに復元したアノテーションの一例のイメージ図である。

なお、上記では説明を容易化する為、「記事３０１０」のように記事番号で記事が一意に特定できるようにしたが、実際、このような記事番号が付与されているのではなく、通常のテキストがタイトルになっている。

一般に記事の移動は無秩序に行われるのではなく、記事の移動元のＷｅｂページから移動先のＷｅｂページへナビゲーションリンクが張られている。なお、ナビゲーションリンクとは、「次に」とか「next」などの目印が付けられた、その記事（資源）に関連する連続的なＷｅｂページへのリンクである。従来は、単に所在情報（ＵＲＬ）あるいは特徴情報で記事にアクセスしていた。

本実施例は、記事の移動元のＷｅｂページから移動先のＷｅｂページへナビゲーションリンクが張られていることに注目し、注目アイテム（注目記事）が見つからなかったときにナビゲーションリンクを自動的に辿ることで注目アイテムにアクセスできるようにしている。

（本実施例の原理）
図８は、本実施例の原理を表した説明図である。図８の資源追跡部２０は、注目アイテム情報取出部２１，Ｗｅｂ情報取出部２２，注目アイテム存在確認部２３，ナビゲーションリンク抽出部２４，ナビゲーション実行部２５を有する構成である。

注目アイテム情報取出部２１は、アドレス（ＵＲＬ）と共に、注目アイテム（記事、ブロックなど）の識別情報（キーワードや記事ＩＤ、記事のハッシュコード値など）を注目アイテム情報として受け取る。

Ｗｅｂ情報取出部２２は、注目アイテム情報取出部２１が受け取ったアドレスで指定されるＷｅｂ資源（Ｗｅｂページ）を取得する。注目アイテム存在確認部２３は、Ｗｅｂ情報取出部２２が取得したＷｅｂ資源に、注目アイテム情報取出部２１が受け取った注目アイテムの識別情報と一致する資源（記事）が存在するか否かを検査する。

注目アイテムの識別情報と一致する資源が存在しない場合、ナビゲーションリンク抽出部２４は、そのＷｅｂ資源のナビゲーションリンクをアンカー文字列あるいは文書構造知識に基づいて探し出す。ナビゲーション実行部２５は、ナビゲーションリンクを組織的に辿りながら、注目アイテムの識別情報と一致する資源を有するＷｅｂ資源を探す。

資源追跡部２０は、ステップＳ２１で注目アイテム情報取出部２１が受け取ったアドレスについて、Ｗｅｂ情報取出部２２，注目アイテム存在確認部２３，ナビゲーションリンク抽出部２４，ナビゲーション実行部２５の処理を繰り返し行う。

以上のように、資源追跡部２０は取得したＷｅｂ資源の注目アイテムの存在を確認しながら、注目アイテムがない時にナビゲーションリンクを辿って注目アイテムを探す。注目アイテムがオリジナルな所在位置からナビゲーションリンクで辿れる所在位置へ移動したのであれば、資源追跡部２０は、どのタイミングでアクセスしても目当ての注目アイテムにアクセスできる。

これは、通常のニュースやブログなどのＷｅｂページは時間経過とともに記事が増えて行くタイプのＷｅｂページに対する検索システム、Ｗｅｂアノテーションシステム、Ｗｅｂブラウザ，ブックマークシステム等のインターネット関連製品において効果がある。

検索やアノテーションのインデックスから注目アイテムが真に存在するＷｅｂページへジャンプするようなシステムとしては、どのタイミングで上記の資源を探すかで、典型的には以下の３つがある。

第１のシステムは、リンクページに一般のリンクを利用する。第１のシステムは、リンクがクリックされてジャンプするときに資源を追跡する。第１のシステムはブラウザ等の閲覧器の拡張あるいは専用閲覧器のような形態で実施される。

第２のシステムは、リンクページにリンクを表示する際に資源を追跡し、追跡した結果をリンクとして表示する。第２のシステムは、例えば検索装置が検索結果を表示するときに実施される。

また、第３のシステムはリンクページにパラメータ付きの特定の所在へのリンクを利用する。第３のシステムは、そのリンクがクリックされると、特定の所在で資源の追跡が実施され、追跡した結果に基づき目的の所在へジャンプする。

図９は資源追跡部の一例の構成図である。本実施例では注目アイテムの存在を確認するための注目アイテム識別情報を同時に保有することを前提としている。本実施例では指定された注目アイテムに対してその特徴、具体的に検索では検索用インデックスが注目アイテム識別情報になり、Ｗｅｂアノテーションではアノテーションを付与した際に付与された場所の周辺情報（周辺のテキスト、記事タイトル、記事本文、それらのハッシュコード値など）が注目アイテム識別情報になる。

図９の資源追跡部２０は、注目アイテム情報取出部２１，Ｗｅｂ情報取出部２２，注目アイテム存在確認部２３，ナビゲーションリンク抽出部２４，ナビゲーション実行部２５，Ｗｅｂ資源情報出力部２６，ナビゲーション管理部２７，ナビゲーションリンクＤＢ２８及びナビゲーションリンクテーブル２９を有する構成である。

注目アイテム情報受取部２１は、所在情報（ＵＲＬ）と共に、注目アイテム識別情報を受け取る。Ｗｅｂ情報取出部２２は、所在情報に対応するＷｅｂ資源をＷｅｂサーバ３０から取り出す。注目アイテム存在確認部２３は、取り出したＷｅｂ資源の中に注目アイテムが存在するかどうか、注目アイテム識別情報を使って確認する。

取り出したＷｅｂ資源の中に注目アイテムが存在すれば、注目アイテム存在確認部２３はＷｅｂ資源情報出力部２６から、そのＷｅｂ資源の所在情報ないしはＷｅｂ資源自身を出力する。

取り出したＷｅｂ資源の中に注目アイテムが存在しなければ、ナビゲーションリンク抽出部２４は、そのＷｅｂ資源から移動してしまった注目アイテムを追跡するため、現在のＷｅｂ資源からナビゲーションリンクを抽出する。ナビゲーションリンク抽出部２４は図１０に示すようなナビゲーションリンクテーブル２９を参照し、現在のＷｅｂ資源からナビゲーションリンクを特定する。

図１０はナビゲーションリンクテーブルの一例の構成図である。ナビゲーションリンクテーブル２９は、ナビゲーションリンクに付けられる「前のページ」，「→」などの目印が記載されている。

ナビゲーションリンク抽出部２４は抽出したナビゲーションリンクをナビゲーション管理部２７に通知する。ナビゲーション管理部２７は一つのＷｅｂ資源中にナビゲーションリンクが一つとは限らないので、通知されたナビゲーションリンクをナビゲーションリンクＤＢ２８に保持させる。ナビゲーション管理部２７は、どういう順番でナビゲーションリンクを辿るか、あるいは一度辿ったところを重複して辿らないように管理しながらナビゲーションリンクＤＢ２８からナビゲーションリンクを一つずつ取り出す。

そして、ナビゲーション実行部２５はナビゲーションリンクＤＢ２８から取り出されたナビゲーションリンクの示す所在情報を取り出し、取り出した所在情報をＷｅｂ情報取出部２２に通知する。

例えば資源追跡部２０のない通常の検索システムは図１１のようになる。図１１は資源追跡部のない通常の検索システムを表した構成図である。利用者はブラウザ５０を操作してキーワード等のクエリーを検索装置４０に入力する。検索装置４０は利用者に入力されたクエリーで検索を行う。

具体的に、検索装置４０はクエリーからキーの論理式を構築し、インデックス表に基づいて所在情報を求める。図１２はインデックス表の一例の構成図である。インデックス表はキーと所在情報とを対応付けているものである。なお、クエリーからキーの論理式を構築する部分は本実施例の本質ではないので、ここでは単一のキーを例に説明する。

例えば図１２のインデックス表の場合、検索装置４０はクエリーとして"hoge"が与えられたとすると、インデクス表から所在情報として「foo/bar1.html」、「foo/bar9.html」を得る。そして、検索装置４０は、それぞれの所在の要約を合わせて検索結果のＨＴＭＬ文書４１を作成し、ブラウザ５０に図１３の検索結果をリンクページとして表示する。

図１３は検索結果画面の一例のイメージ図である。利用者は検索結果４１の中から、その実体のＷｅｂ資源にアクセスするためにＷｅｂ資源へのリンク（例えば「foo/bar1のタイトル」と表示されている部分）をクリックする。

ブラウザ５０は、クリックされたリンク先「foo/bar1.html」のアドレスに対応するＷｅｂ資源３１をＷｅｂサーバ３０から取り出し、そのＷｅｂ資源３１を表示する。本実施例は検索であるかどうかは本質ではなく、注目アイテムへのリンクであればよい。以下の説明では、図３のリンクページによって説明する。

図３のリンクページでは、記事３０１２のHTMLは図４に示すようであり、記事３０１２のリンクをクリックしたら「http://foo/bar1.html」のアドレスに対応する図５のようなＷｅｂページが表示されることになる。

例えば資源追跡部２０のある検索システムは例えば図１４のようになる。図１４は資源追跡部のある検索システムの第一実施例の構成図である。図１４の検索システムは、リンクをクリックしてＷｅｂ資源３１にアクセスしようとした時、資源の追跡を行い、真に注目アイテムが存在するＷｅｂ資源３１を表示するものである。

利用者は、ブラウザ５０を操作してキーワードを検索装置４０に入力する。検索装置４０は利用者に入力されたキーワードで検索を行う。検索装置４０は、ブラウザ５０に検索結果４１をリンクページとして表示する。ここまでの処理は、通常の検索システムと同じである。

図１４の検索システムは、利用者に入力されたキーワードを注目資源識別情報６０として保持しておく点で図１１の検索システムと異なる。利用者は検索結果４１の中から、その実体のＷｅｂ資源にアクセスするためにＷｅｂ資源へのリンクをクリックする。

ブラウザ５０は、クリックされたリンク先のアドレスに対応するＷｅｂ資源３１をＷｅｂサーバ３０から単純に取り出すのではなく、リンク先のアドレス（所在情報）と注目資源識別情報６０から資源の追跡を行い、真に注目アイテムのあるＷｅｂ資源３１を表示するものである。なお、資源追跡部６０はブラウザ５０の拡張として実現してもよいし、資源追跡部６０を有する専用のブラウザ５０としてもよい。

なお、図１４の検索システムは図１１の検索システムと検索結果４１のＨＴＭＬが全くかわらないが、記事３０１２のリンクをクリックしたら「http://foo/bar1.html」とあるにもかかわらず「http://foo/bar2.html」のＷｅｂページ、すなわち図６のＷｅｂページが表示されることになる。

図１５は、資源追跡部のある検索システムの第二実施例の構成図である。図１５の検索システムは検索結果を表示する際、単純に、そのリンクを表示するのではなく、資源の追跡を行い、注目アイテムが真に存在するアドレスにリンクを書き換えて表示するものである。

利用者は、ブラウザ５０を操作してキーワードを検索装置４０に入力する。検索装置４０は利用者に入力されたキーワードで検索を行う。検索装置４０は、ブラウザ５０に検索結果４１をリンクページとして表示する。このとき、検索装置４０は単純に検索結果４１のリンクを表示するのではなく、資源追跡部２０に資源の追跡を行わせる。

すなわち、資源追跡部２０は検索装置４０に与えられたキーワードを注目資源識別情報として、各リンクで示す先に注目アイテムが存在するかどうか確認し、存在しないならばナビゲーションリンクを辿って、注目アイテムが見つかったＷｅｂ資源３１の所在情報（ＵＲＬ）にリンクを書き換えて利用者に提示する。

既にリンクが書き換えられているので、ブラウザ５０は、その後、利用者がリンクをクリックしたならば、そのクリックされたリンク先のアドレスに対応するＷｅｂ資源３１をＷｅｂサーバ３０から取り出し、真に注目アイテムのあるＷｅｂ資源３１を表示するものである。図１５の検索システムでは、各リンクで示す先に注目アイテムが存在するかどうか確認し、存在しないならばナビゲーションリンクを辿って、注目アイテムが見つかったＷｅｂ資源３１の所在情報（ＵＲＬ）にリンクを書き換えて利用者に提示する。

例えば図４のＨＴＭＬファイルの場合、図１５の検索システムではナビゲーションリンクを辿って、注目アイテムが見つかったＷｅｂ資源３１の所在情報（ＵＲＬ）にリンクを書き換える。図１６は、注目アイテムが見つかったＷｅｂ資源の所在情報にリンクを書き換えたＨＴＭＬファイルの一例のイメージ図である。

図１６のＨＴＭＬファイルの場合、図３のリンクページの「記事３０１２」の部分をクリックすると、「http://foo/bar2.html」のＷｅｂページ、すなわち図６のＷｅｂページが表示されることになる。

図１７は、図１５の検索システムの処理手順を表したフローチャートである。ステップＳ１に進み、検索装置４０は利用者からキーワードを受け取る。ステップＳ２に進み、検索装置４０はインデックス表から所在集合を得る。ステップＳ３に進み、資源追跡部２０は所在集合の各要素に対して現在の所在を求める。資源追跡部２０は、インデックス表から得た所在情報と、注目アイテム識別情報としてのキーワードとを得ることで、所在集合の各要素に対して現在の所在を求めることができる。

ステップＳ４に進み、資源追跡部２０は検索結果４１として、所在集合の各要素に対して現在の所在を付与して出力する。なお、ステップＳ４では例えば図１８に示すようにリンク先のタイトル名なども修正された図１８のような検索結果画面を出力するようにしてもよい。図１８は検索結果画面の他の例のイメージ図である。

図１９は、資源追跡部のある検索システムの第三実施例の構成図である。図１９の検索システムは検索結果を表示する際、単純に、そのリンクを表示するのではなく、特定のＷｅｂサーバ６２のアドレス＋パラメータをリンクに書き換えて表示するものである。

利用者は、ブラウザ５０を操作してキーワードを検索装置４０に入力する。検索装置４０は利用者に入力されたキーワードで検索を行う。検索装置４０は、ブラウザ５０に検索結果４１をリンクページとして表示する。このとき、検索装置４０が単純に検索結果４１のリンクを表示するのではないのは、図１５の検索システムと同じである。しかし、図１０の検索システムは、この時点で資源の追跡を行わず、リンク加工部６１が、単にリンクを特定のＷｅｂサーバ６２のアドレス＋パラメータの形に書き換えておく。

例えばキーワード"hoge"の検索結果のＵＲＬが「foo/bar1.html」であり、特定のＷｅｂサーバ６２のＵＲＬが「http://tracking」であったとすると、リンク加工部６１はリンクを「http://tracking?kw=hoge&url=foo%2Fbar1.html」に書き換える。ブラウザ５０には検索結果がリンクページとして表示される。

利用者が「foo.html」にアクセスしようとしてリンクをクリックすると、実際には「http://tracking?kw=hoge&url=foo%2Fbar1.html」がアクセスされる。即ち、特定のＷｅｂサーバ６２として「http://tracking」がアクセスされる。特定のＷｅｂサーバ６２には、特定アイテム識別情報としてキーワード"hoge"、所在情報「foo%2Fbar1.html」が資源追跡部２０へ渡され、資源の追跡が実行される。したがって、ブラウザ５０は真に注目アイテムのあるＷｅｂ資源３１を表示できる。

例えば図４のＨＴＭＬファイルの場合、図１９の検索システムでは特定のＷｅｂサーバ６２のアドレス＋パラメータ「http://tracking?kw=hoge&url=foo%2Fbar1.html」にリンクが書き換えられる。

図２０は、特定のＷｅｂサーバのアドレス＋パラメータにリンクを書き換えたＨＴＭＬファイルの一例のイメージ図である。

図２０のＨＴＭＬファイルの場合、図３のリンクページの「記事３０１２」の部分をクリックすると、特定のＷｅｂサーバ６２として「http://tracking」がアクセスされ、特定アイテム識別情報としてキーワード"hoge"、所在情報「foo%2Fbar1.html」が特定のＷｅｂサーバ６２から資源追跡部２０へ渡され、資源の追跡が実行された結果、真に注目アイテムのある「http://foo/bar2.html」のＷｅｂ資源３１、すなわち図６のＷｅｂ資源３１が表示されることになる。

上記では検索システムを例に説明したが、Ｗｅｂアノテーションシステムの場合、検索システムの検索装置４０をＷｅｂアノテーションＤＢからの情報取得を行う装置に置き換えればよい。

図２１は資源追跡部の処理手順を表した一例のフローチャートである。ステップＳ１１に進み、資源追跡部２０の注目アイテム情報受取部２１は、所在情報（ＵＲＬ）と、注目アイテム識別情報を受け取る。ステップＳ１２に進み、Ｗｅｂ情報取出部２２は所在情報に対応するＷｅｂ資源をＷｅｂサーバ３０から取り出す。

ステップＳ１３に進み、注目アイテム存在確認部２３は取り出したＷｅｂ資源の中に注目アイテム識別情報が存在するか（注目アイテムが存在するか）どうか確認する。取り出したＷｅｂ資源の中に注目アイテムが存在すれば（ステップＳ１４においてＹＥＳ）、注目アイテム存在確認部２３はステップＳ１６に進み、Ｗｅｂ資源情報出力部２６から、そのＷｅｂ資源の所在情報ないしはＷｅｂ資源自身を出力することで、ステップＳ１２で取り出したＷｅｂ資源に対する処理（一般的には表示）を行う。なお、取り出したＷｅｂ資源に対する処理としては単純な表示の他、例えばＷｅｂアノテーションシステムであればアノテーションの処理（アノテーションを付与しての表示など）や、指定されたＷｅｂ資源のダウンロードなどの処理がある。

取り出したＷｅｂ資源の中に注目アイテムが存在しなければ（ステップＳ１４においてＮＯ）、ナビゲーションリンク抽出部２４はステップＳ１５に進み、そのＷｅｂ資源から移動してしまった注目アイテムを追跡するため、現在のＷｅｂ資源からナビゲーションリンクを探索する。現在のＷｅｂ資源にナビゲーションリンクがあれば（ステップＳ１７においてＹＥＳ）、ナビゲーションリンク抽出部２４はステップＳ１８に進み、ナビゲーションリンクを抽出する。ナビゲーション実行部２５は、ナビゲーションリンク抽出部２４が抽出したナビゲーションリンク先の所在情報を新しい所在情報としてナビゲーション管理部２７に通知したあと、ステップＳ１２の処理に戻る。

なお、現在のＷｅｂ資源にナビゲーションリンクがなければ（ステップＳ１７においてＮＯ）、ナビゲーションリンク抽出部２４はステップＳ１９に進み、注目アイテムが見つからなかったと判断する。ナビゲーション実行部２５は見つからなかった時の処理（例外処理など）を行う。具体的には、例えばメッセージを出して、元々の所在情報（ＵＲＬ）で示されるＷｅｂ資源の表示などを行う。

ナビゲーションリンクが常に一つ正確に見つかる場合には、図２１に示すような処理で良い。しかし、実際にはナビゲーションリンクの候補が複数ある場合もある。図２２はナビゲーションリンクの候補が複数ある画面例である。図２２の画面ではナビゲーションリンクの候補として「前のページ」と「次のページ」とがあるが、時間的過去へのリンクがどちらかがあいまいである。

このように、ナビゲーションリンクの候補にあいまい性のある場合にも対処するための実施例としては、ナビゲーションリンクの候補を待ち行列に登録し、その待ち行列に登録されたナビゲーションリンクの候補を出し入れして、次に探索すべきナビゲーションリンクの候補を求める。上記処理のためには、ナビゲーション管理部２７と待ち行列を保存するキューとが必要になる。なお、待ち行列の管理は、深さ優先探索、最良優先探索などのアルゴリズムが良く知られている（これらはコンピュータの基本的な探索アルゴリズムであるので詳細は省略する）。

注目アイテム存在確認部２３は、Ｗｅｂ情報取出部２２が取り出したＷｅｂ資源の中に注目アイテム識別情報が存在するかどうか確認するものである。典型的な注目アイテム存在確認部２３は、文字列検索（例えばUNIX（登録商標）のfgrepコマンド）によりＷｅｂ資源の中に注目アイテム識別情報が存在するかどうか確認する。

例えば、注目アイテム識別情報が文字列"記事３０１２のタイトル"であれば、Ｗｅｂ資源中に文字列"記事３０１２のタイトル"が存在するか否かで注目アイテムが存在するか否かを判定するものである。

やや高度な注目アイテム存在確認部２３は、情報構造を利用するものである。例えば図２３のＨＴＭＬファイルではＷｅｂ資源が複数の記事から構成されており、各記事のタイトルがclass属性の値"entry-header"で指定されている。また、別の注目アイテム存在確認部２３は、記事タイトルでなく、記事（図２３ではclass属性の値"entry"内の本文）のハッシュ値を利用することもできる。

注目アイテム存在確認部２３は、ＨＴＭＬファイルの特定の構造と構造内の照合情報とを利用するものであり、図２４のような処理を行う。図２４は注目アイテム存在確認部の処理手順を表した一例のフローチャートである。

ステップＳ２１に進み、注目アイテム存在確認部２３はＷｅｂ情報取出部２２が取得したＷｅｂ資源（ＨＴＭＬファイル）を取り込む。ステップＳ２２に進み、注目アイテム存在確認部２３は取り込んだＷｅｂ資源から、指定された属性及び値のペアをもつタグを探索する。

ステップＳ２３に進み、注目アイテム存在確認部２３は指定された属性及び値のペアをもつタグが見つからないと、ステップＳ２４に進み、取り込んだＷｅｂ資源の中に注目アイテムが存在しない旨をナビゲーションリンク抽出部２４に返す。なお、注目アイテム存在確認部２３は指定された属性及び値のペアをもつタグが見つかると、ステップＳ２５に進み、そのタグの内容が探している内容と一致するか否かを判定する。見つかったタグの内容が探している内容と一致すると、注目アイテム存在確認部２３はステップＳ２６に進み、取り込んだＷｅｂ資源の中に注目アイテムが存在した旨をＷｅｂ資源情報出力部２６に返す。見つかったタグの内容が探している内容と一致しなければ、注目アイテム存在確認部２３はステップＳ２２の処理に戻る。

また、図２５はナビゲーションリンク抽出部の処理手順を表した一例のフローチャートである。ステップＳ３１に進み、ナビゲーションリンク抽出部２４はＷｅｂ資源（Ｗｅｂページ）中のすべてのリンク情報を取り出す。

例えばＨＴＭＬファイルでは、ナビゲーションリンク抽出部２４が、"a"タグで囲まれたアンカーテキスト及び"a"タグのhref属性の値を取り出す。また、ナビゲーションリンク抽出部２４は必要に応じてalt属性を取り出す（アンカーがテキストではなくイメージの場合などalt属性がアンカーテキストの代替となる）。

ステップＳ３２に進み、ナビゲーションリンク抽出部２４は、取り出したリンク情報のナビゲーションリンクらしさを、アンカーテキストやリンク先、文書中の位置などの情報を使って求める。ステップＳ３３に進み、ナビゲーションリンク抽出部２４は、それぞれのリンク情報のナビゲーションリンクらしさに基づきリンク情報の取捨選択を行い、ナビゲーションリンクを求める。リンク情報の取捨選択は一つないし無しを選ぶようなものであってもよいし、ナビゲーションリンクらしさの優先度を与えて、探索アルゴリズムによってナビゲーションリンクらしいものから順にナビゲーションリンクとして辿るという方策をとってもよい。

ナビゲーションリンクらしさのチェックは、例えば以下のように行う。リンク情報がナビゲーションリンクであるかどうかは明確な基準があるわけではないので、ヒューリスティックスによってナビゲーションリンクらしさを求める。

一般的にナビゲーションリンクは、そのＷｅｂページの閲覧者が一連の情報をサーチするために利用するものなので、アンカーテキストの手がかり（「前のページ」「次のページ」「next」「previous」「→」など）、文書中の位置（一般に文書の末尾付近）や、移動がシステマティックに行われることからリンク先の手がかり（xxx/1.htmlに対してはxxx/2.htmlであるはずというURLパターン）が利用できる。

図２６は、資源追跡部２０を実現する装置の一例の構成図である。図２６の装置は、それぞれバスＢで相互に接続された入力装置７１，出力装置７２，ドライブ装置７３，補助記憶装置７４，主記憶装置７５，演算処理装置７６およびインターフェース装置７７を含むように構成される。

入力装置７１はキーボードやマウスなどで構成され、各種信号を入力するために用いられる。出力装置７２はディスプレイ装置などで構成され、各種ウインドウやデータ等を表示するために用いられる。インターフェース装置７７は、モデム，ＬＡＮカードなどで構成されており、ネットワークに接続する為に用いられる。

本実施例に係るプログラムは、資源追跡部２０を制御する各種プログラムの少なくとも一部である。プログラムは例えば記録媒体７８の配布やネットワークからのダウンロードなどによって提供される。プログラムを記録した記録媒体７８は、ＣＤ−ＲＯＭ、フレキシブルディスク、光磁気ディスク等の様に情報を光学的，電気的或いは磁気的に記録する記録媒体、ＲＯＭ、フラッシュメモリ等の様に情報を電気的に記録する半導体メモリ等、様々なタイプの記録媒体を用いることができる。

また、プログラムを記録した記録媒体７８がドライブ装置７３にセットされると、プログラムは記録媒体７８からドライブ装置７３を介して補助記憶装置７４にインストールされる。ネットワークからダウンロードされたプログラムは、インターフェース装置７７を介して補助記憶装置７４にインストールされる。

補助記憶装置７４は、インストールされたプログラムを格納すると共に、必要なファイル，データ等を格納する。主記憶装置７５は、起動時に補助記憶装置７４からプログラムを読み出して格納する。そして、演算処理装置７６は主記憶装置７５に格納されたプログラムに従って、上記したような各種処理を実現している。

本発明は、以下に記載する付記のような構成が考えられる。
（付記１）
コンピュータに、１ページに１つ以上の資源を含む第一のＷｅｂ資源から他のＷｅｂ資源へ移動した前記資源を追跡させるＷｅｂ資源追跡管理プログラムであって、
前記コンピュータを、
前記第一のＷｅｂ資源の所在情報と、前記第一のＷｅｂ資源に含まれる注目資源を識別する為の注目資源識別情報との対応関係を受け取る受取手段と、
利用者に選択された前記所在情報に対応する前記Ｗｅｂ資源を取り出す取出手段と、
前記取出手段が取り出した前記Ｗｅｂ資源に前記注目資源が存在するかを、前記注目資源識別情報により確認する存在確認手段と、
前記取出手段が取り出した前記Ｗｅｂ資源に前記注目資源が存在しなければ前記Ｗｅｂ資源に含まれる前記他のＷｅｂ資源へのリンクを抽出する抽出手段と、
前記抽出手段が抽出した前記リンクで示される所在情報を次の所在情報として前記取出手段へ通知する追跡手段と、
前記取出手段が取り出した前記Ｗｅｂ資源に前記注目資源が存在すれば前記Ｗｅｂ資源を前記利用者の端末に送信する送信手段と
して機能させるためのＷｅｂ資源追跡管理プログラム。
（付記２）
前記抽出手段は、前記Ｗｅｂ資源に含まれる前記他のＷｅｂ資源への1種類以上のリンクを示したテーブル手段に基づき、前記Ｗｅｂ資源に含まれる前記他のＷｅｂ資源へのリンクを抽出することを特徴とする付記１記載のＷｅｂ資源追跡管理プログラム。
（付記３）
前記存在確認手段は、キーワード，資源番号，又は前記資源のハッシュコード値を前記注目資源識別情報として、前記取出手段が取り出した前記Ｗｅｂ資源に前記注目資源が存在するかを確認することを特徴とする付記１又は２記載のＷｅｂ資源追跡管理プログラム。
（付記４）
前記第一のＷｅｂ資源は、１ページに含む前記資源の数が制限されており、前記資源の数が制限を超過しないよう古い前記資源から順に、前記リンクで示される前記所在情報に対応する前記他のＷｅｂ資源に移動されることを特徴とする付記１乃至３何れか一項記載のＷｅｂ資源追跡管理プログラム。
（付記５）
１ページに１つ以上の資源を含む第一のＷｅｂ資源から他のＷｅｂ資源へ移動した前記資源を追跡させるＷｅｂ資源追跡管理装置であって、
前記第一のＷｅｂ資源の所在情報と、前記第一のＷｅｂ資源に含まれる注目資源を識別する為の注目資源識別情報との対応関係を受け取る受取手段と、
利用者に選択された前記所在情報に対応する前記Ｗｅｂ資源を取り出す取出手段と、
前記取出手段が取り出した前記Ｗｅｂ資源に前記注目資源が存在するかを、前記注目資源識別情報により確認する存在確認手段と、
前記取出手段が取り出した前記Ｗｅｂ資源に前記注目資源が存在しなければ前記Ｗｅｂ資源に含まれる前記他のＷｅｂ資源へのリンクを抽出する抽出手段と、
前記抽出手段が抽出した前記リンクで示される所在情報を次の所在情報として前記取出手段へ通知する追跡手段と、
前記取出手段が取り出した前記Ｗｅｂ資源に前記注目資源が存在すれば前記Ｗｅｂ資源を前記利用者の端末に送信する送信手段と
を有するＷｅｂ資源追跡管理装置。
（付記６）
コンピュータによって実行される、１ページに１つ以上の資源を含む第一のＷｅｂ資源から他のＷｅｂ資源へ移動した前記資源を追跡させるＷｅｂ資源追跡管理方法であって、
前記コンピュータが、
前記第一のＷｅｂ資源の所在情報と、前記第一のＷｅｂ資源に含まれる注目資源を識別する為の注目資源識別情報との対応関係を受け取る受取手順と、
利用者に選択された前記所在情報に対応する前記Ｗｅｂ資源を取り出す取出手順と、
前記取出手順で取り出した前記Ｗｅｂ資源に前記注目資源が存在するかを、前記注目資源識別情報により確認する存在確認手順と、
前記取出手順で取り出した前記Ｗｅｂ資源に前記注目資源が存在しなければ前記Ｗｅｂ資源に含まれる前記他のＷｅｂ資源へのリンクを抽出する抽出手順と、
前記抽出手順で抽出した前記リンクで示される所在情報を次の所在情報として前記取出手段へ通知する追跡手順と、
前記取出手順で取り出した前記Ｗｅｂ資源に前記注目資源が存在すれば前記Ｗｅｂ資源を前記利用者の端末に送信する送信手順と
を実行することを特徴とするＷｅｂ資源追跡管理方法。

本発明は、具体的に開示された実施例に限定されるものではなく、特許請求の範囲から逸脱することなく、種々の変形や変更が可能である。

最初のＵＲＬとは別のＵＲＬで指定されるＷｅｂページの中に記事が移動する例を表した一例の模式図である。Ｗｅｂページの一例のイメージ図である。リンクページの一例のイメージ図である。リンクページを表現するＨＴＭＬファイルの一例のイメージ図である。記事が追加されたＷｅｂページの一例のイメージ図である。ナビゲーションリンク先のＷｅｂページの一例のイメージ図である。ナビゲーションリンク先のＷｅｂページに復元したアノテーションの一例のイメージ図である。本実施例の原理を表した説明図である。資源追跡部の一例の構成図である。ナビゲーションリンクテーブルの一例の構成図である。資源追跡部のない通常の検索システムを表した構成図である。インデックス表の一例の構成図である。検索結果画面の一例のイメージ図である。資源追跡部のある検索システムの第一実施例の構成図である。資源追跡部のある検索システムの第二実施例の構成図である。注目アイテムが見つかったＷｅｂ資源の所在情報にリンクを書き換えたＨＴＭＬファイルの一例のイメージ図である。図１５の検索システムの処理手順を表したフローチャートである。検索結果画面の他の例のイメージ図である。資源追跡部のある検索システムの第三実施例の構成図である。特定のＷｅｂサーバのアドレス＋パラメータにリンクを書き換えたＨＴＭＬファイルの一例のイメージ図である。資源追跡部の処理手順を表した一例のフローチャートである。ナビゲーションリンクの候補が複数ある画面例である。ＨＴＭＬファイルの一例のイメージ図である。注目アイテム存在確認部の処理手順を表した一例のフローチャートである。ナビゲーションリンク抽出部の処理手順を表した一例のフローチャートである。資源追跡部２０を実現する装置の一例の構成図である。

符号の説明

２０資源追跡部
２１注目アイテム情報取出部
２２Ｗｅｂ情報取出部
２３注目アイテム存在確認部
２４ナビゲーションリンク抽出部
２５ナビゲーション実行部
２６Ｗｅｂ資源情報出力部
２７ナビゲーション管理部
２８ナビゲーションリンクＤＢ
２９ナビゲーションリンクテーブル
３０Ｗｅｂサーバ
３１Ｗｅｂ資源
４０検索装置
４１検索結果
５０ブラウザ
６０注目資源識別情報
６１リンク加工部
６２特定のＷｅｂサーバ
７１入力装置
７２出力装置
７３ドライブ装置
７４補助記憶装置
７５主記憶装置
７６演算処理装置
７７インターフェース装置

Claims

コンピュータに、１ページに１つ以上の資源を含む第一のＷｅｂ資源から他のＷｅｂ資源へ移動した前記資源を追跡させるＷｅｂ資源追跡管理プログラムであって、
前記コンピュータを、
前記第一のＷｅｂ資源の所在情報と、前記第一のＷｅｂ資源に含まれる注目資源を識別する為の注目資源識別情報との対応関係を受け取る受取手段と、
利用者に選択された前記所在情報に対応する前記Ｗｅｂ資源を取り出す取出手段と、
前記取出手段が取り出した前記Ｗｅｂ資源に前記注目資源が存在するかを、前記注目資源識別情報により確認する存在確認手段と、
前記取出手段が取り出した前記Ｗｅｂ資源に前記注目資源が存在しなければ前記Ｗｅｂ資源に含まれる前記他のＷｅｂ資源へのリンクを抽出する抽出手段と、
前記抽出手段が抽出した前記リンクで示される所在情報を次の所在情報として前記取出手段へ通知する追跡手段と、
前記取出手段が取り出した前記Ｗｅｂ資源に前記注目資源が存在すれば前記Ｗｅｂ資源を前記利用者の端末に送信する送信手段と
して機能させるためのＷｅｂ資源追跡管理プログラム。
前記抽出手段は、前記Ｗｅｂ資源に含まれる前記他のＷｅｂ資源への1種類以上のリンクを示したテーブル手段に基づき、前記Ｗｅｂ資源に含まれる前記他のＷｅｂ資源へのリンクを抽出することを特徴とする請求項１記載のＷｅｂ資源追跡管理プログラム。
前記存在確認手段は、キーワード，資源番号，又は前記資源のハッシュコード値を前記注目資源識別情報として、前記取出手段が取り出した前記Ｗｅｂ資源に前記注目資源が存在するかを確認することを特徴とする請求項１又は２記載のＷｅｂ資源追跡管理プログラム。
前記第一のＷｅｂ資源は、１ページに含む前記資源の数が制限されており、前記資源の数が制限を超過しないよう古い前記資源から順に、前記リンクで示される前記所在情報に対応する前記他のＷｅｂ資源に移動されることを特徴とする請求項１乃至３何れか一項記載のＷｅｂ資源追跡管理プログラム。
１ページに１つ以上の資源を含む第一のＷｅｂ資源から他のＷｅｂ資源へ移動した前記資源を追跡させるＷｅｂ資源追跡管理装置であって、
前記第一のＷｅｂ資源の所在情報と、前記第一のＷｅｂ資源に含まれる注目資源を識別する為の注目資源識別情報との対応関係を受け取る受取手段と、
利用者に選択された前記所在情報に対応する前記Ｗｅｂ資源を取り出す取出手段と、
前記取出手段が取り出した前記Ｗｅｂ資源に前記注目資源が存在するかを、前記注目資源識別情報により確認する存在確認手段と、
前記取出手段が取り出した前記Ｗｅｂ資源に前記注目資源が存在しなければ前記Ｗｅｂ資源に含まれる前記他のＷｅｂ資源へのリンクを抽出する抽出手段と、
前記抽出手段が抽出した前記リンクで示される所在情報を次の所在情報として前記取出手段へ通知する追跡手段と、
前記取出手段が取り出した前記Ｗｅｂ資源に前記注目資源が存在すれば前記Ｗｅｂ資源を前記利用者の端末に送信する送信手段と
を有するＷｅｂ資源追跡管理装置。
コンピュータによって実行される、１ページに１つ以上の資源を含む第一のＷｅｂ資源から他のＷｅｂ資源へ移動した前記資源を追跡させるＷｅｂ資源追跡管理方法であって、
前記コンピュータが、
前記第一のＷｅｂ資源の所在情報と、前記第一のＷｅｂ資源に含まれる注目資源を識別する為の注目資源識別情報との対応関係を受け取る受取手順と、
利用者に選択された前記所在情報に対応する前記Ｗｅｂ資源を取り出す取出手順と、
前記取出手順で取り出した前記Ｗｅｂ資源に前記注目資源が存在するかを、前記注目資源識別情報により確認する存在確認手順と、
前記取出手順で取り出した前記Ｗｅｂ資源に前記注目資源が存在しなければ前記Ｗｅｂ資源に含まれる前記他のＷｅｂ資源へのリンクを抽出する抽出手順と、
前記抽出手順で抽出した前記リンクで示される所在情報を次の所在情報として前記取出手段へ通知する追跡手順と、
前記取出手順で取り出した前記Ｗｅｂ資源に前記注目資源が存在すれば前記Ｗｅｂ資源を前記利用者の端末に送信する送信手順と
を実行することを特徴とするＷｅｂ資源追跡管理方法。