JP2010044708A - Web資源追跡管理プログラム、Web資源追跡管理装置及びWeb資源追跡管理方法 - Google Patents

Web資源追跡管理プログラム、Web資源追跡管理装置及びWeb資源追跡管理方法 Download PDF

Info

Publication number
JP2010044708A
JP2010044708A JP2008210003A JP2008210003A JP2010044708A JP 2010044708 A JP2010044708 A JP 2010044708A JP 2008210003 A JP2008210003 A JP 2008210003A JP 2008210003 A JP2008210003 A JP 2008210003A JP 2010044708 A JP2010044708 A JP 2010044708A
Authority
JP
Japan
Prior art keywords
resource
web resource
web
link
location information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008210003A
Other languages
English (en)
Other versions
JP5187064B2 (ja
Inventor
Fumito Nishino
文人 西野
Terunobu Kume
照宣 粂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2008210003A priority Critical patent/JP5187064B2/ja
Publication of JP2010044708A publication Critical patent/JP2010044708A/ja
Application granted granted Critical
Publication of JP5187064B2 publication Critical patent/JP5187064B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】1ページに1つ以上の資源を含む第一のWeb資源から他のWeb資源へ移動した資源を容易且つ迅速に追跡できるWeb資源追跡管理プログラム、Web資源追跡管理装置及びWeb資源追跡管理方法を提供することを目的とする。
【解決手段】コンピュータを、第一のWeb資源の所在情報と、注目資源を識別する為の注目資源識別情報との対応関係を受け取る受取手段と、利用者に選択された所在情報に対応するWeb資源を取り出す取出手段と、Web資源に注目資源が存在するかを、注目資源識別情報により確認する存在確認手段と、Web資源に注目資源が存在しなければWeb資源に含まれる他のWeb資源へのリンクを抽出する抽出手段と、リンクで示される所在情報を次の所在情報として取出手段へ通知する追跡手段と、Web資源に注目資源が存在すればWeb資源を利用者の端末に送信する送信手段として機能させることにより上記課題を解決する。
【選択図】 図9

Description

本発明は、Web資源追跡管理プログラム、Web資源追跡管理装置及びWeb資源追跡管理方法に係り、特に1ページに1つ以上の資源を含む第一のWeb資源から他のWeb資源へ移動した資源を追跡する為のWeb資源追跡管理プログラム、Web資源追跡管理装置及びWeb資源追跡管理方法に関する。
近年、インターネットやイントラネット等のネットワーク上のWeb資源へのアクセス技術が、よく利用されるようになっている。Webページ等のWeb資源へのアクセス技術は検索システム,Webアノテーションシステム,Webブラウザ,ブックマークシステムなどで利用されている。
検索システムは、ネットワーク上のWebページに対して、あらかじめインデックスを用意しておき、検索時に与えられたクエリー(処理要求)に対してインデックスを参照してWebページの所在情報(例えばURL)を返すものである。
一方、Webアノテーションシステムはネットワーク上のWebページに対して、そのWebページの作者と異なる別の第三者が、そのWebページに対し、二次情報として付箋,下線又はマーカなどのアノテーションを付与し、そのWebページの閲覧時に、付与したアノテーションをWebページと同時に表示したり、又は付与したアノテーションに基づいた処理をWebページに加えたりするものである。
通常はWebページにアノテーションが付与されたとき、そのWebページのURLを保持しておき、そのURLで指定されるWebページの閲覧時にアノテーションを復元することで、時間をおいてのWebページの閲覧や、アノテーションを付与したアノテータと異なる第三者による閲覧であってもアノテーションを復元するものである。
これら検索システムやWebアノテーションシステム等は、Webページに含まれる記事などの資源の所在が時間を経ても変わらない場合、有効に作用する。しかし、ブログやニュース等のフロー型情報を扱うサイトでは、一つのURLで指定されるWebページに一つあるいは複数の記事を有する。また、ブログやニュース等のフロー型情報を扱うサイトでは、時間とともに別の記事が追加され、Webページ内の構成が変更される。
上述したように、検索システムやWebアノテーションシステム等は、Webページが必要となる度に、URLで指定されるWebページを取得しているため、Webページ内の構成が変更されると、インデックスの内容やアノテーションの付与される位置が実際のWebページと対応しなくなることがあった。
このような事態に対応するため、特許文献1にはマーカ等を文書に付した後、その文書が変更された場合であっても、ある程度の追跡を可能とする内容が記載されている。特許文献1ではマーカ等の表示位置とその前後の文字列とを対応付けて記録しておき、マーカ等を表示する際に表示位置の前後の文字列を検査する。そして、特許文献1ではマーカ等の表示位置の前後の文字列が、記録されている文字列と異なる場合に、記録されている文字列の位置を文書中から探し出して、本来、表示する位置を取得してマーカ等を表示している。
特許文献1の技術を応用することで、検索システムやWebアノテーションシステム等はWebページ内の構成が変更されたとしても、インデックスの内容やアノテーションの付与される位置を実際のWebページと対応させることができた。
特開2000−163414号公報
従来、Webページ内の記事数が制限されている場合には「次のページ」というような形式で、最初のURLとは別のURLで指定されるWebページの中に記事が移動する場合もあった。
このような最初のURLとは別のURLで指定されるWebページの中に記事が移動する場合は、記事を閲覧しようとして元の所在(最初のURL)にアクセスしたとき、自動的にその記事が移動した先(別のURL)にジャンプ(移動した先の記事を表示)させたいという要求がある。
図1は最初のURLとは別のURLで指定されるWebページの中に記事が移動する例を表した一例の模式図である。ある時点で、1.htmlというファイル10には、記事A、記事B、記事Cがあったとする。一般的にニュースやブログなどは、ファイル10に示すように1ページに複数の記事A〜Cを含んでおり、新しい記事Cが上部に配置されることが多い。この時点で記事Bは、検索システムの場合、インデックスとして、Webアノテーションの場合、記事Bに付与されたアノテーションの位置として、1.htmlに存在すると記憶されている。
ここでは仮にindex.htmlというファイル12が各記事の所在を記憶しているものとする。ある時間が経過すると、1.htmlには記事D、記事Eが追加され、一定の条件を超えた記事が他のWebページに移動される。図1では、1ページ内に3記事までと制限されているとして、あふれた記事Aと記事Bとが2.htmlというファイル11に移動したことを意味している。このように記事が移動した場合は、記事の移動先を自動的に追跡し、移動した先の記事を表示させたいという要求があった。
検索システムではロボットが関連する資源を再収集し、インデックスを再構築することにより、インデックスが正しい位置を示すようにしている。検索システムでは再収集する間隔を短くすることにより、正しくなるまでの期間を短くするようにしている。しかしながら、これは確率的な問題であり、正しくなるまでの期間を零にできない。
Webアノテーションシステムは、キーワード(あるいはngram)を抽出して注目アイテム識別情報とし、この注目アイテム識別情報を検索システムに与えることで、検索システムが指し示すところにアノテーションの付与先が移動したと認識できる。しかしながら、前述のとおり、これは検索システムが常に正しい位置を指し示していることが前提となっており、この前提が成り立たないこともある。
従来は、記事の移動とロボットによる関連するWebページの位置の再収集とが非同期であるため、インデックスを再構築するまでに時間が掛かり、タイミングによっては移動した記事を検索できないという問題があった。なお、検索のインデックスをオンデマンドで起動して収集することも可能であるが、インデックスの再構築は時間が掛かり、高速に注目している記事を追跡できないという問題があった。
本発明の一実施形態は、上記の点に鑑みなされたもので、1ページに1つ以上の資源を含む第一のWeb資源から他のWeb資源へ移動した資源を容易且つ迅速に追跡できるWeb資源追跡管理プログラム、Web資源追跡管理装置及びWeb資源追跡管理方法を提供することを目的とする。
上記課題を解決するため、本発明の一実施形態は、コンピュータに、1ページに1つ以上の資源を含む第一のWeb資源から他のWeb資源へ移動した前記資源を追跡させるWeb資源追跡管理プログラムであって、前記コンピュータを、前記第一のWeb資源の所在情報と、前記第一のWeb資源に含まれる注目資源を識別する為の注目資源識別情報との対応関係を受け取る受取手段と、利用者に選択された前記所在情報に対応する前記Web資源を取り出す取出手段と、前記取出手段が取り出した前記Web資源に前記注目資源が存在するかを、前記注目資源識別情報により確認する存在確認手段と、前記取出手段が取り出した前記Web資源に前記注目資源が存在しなければ前記Web資源に含まれる前記他のWeb資源へのリンクを抽出する抽出手段と、前記抽出手段が抽出した前記リンクで示される所在情報を次の所在情報として前記取出手段へ通知する追跡手段と、前記取出手段が取り出した前記Web資源に前記注目資源が存在すれば前記Web資源を前記利用者の端末に送信する送信手段として機能させるためのWeb資源追跡管理プログラムであることを特徴とする。
なお、本発明の一実施形態の構成要素、表現または構成要素の任意の組合せを、方法、装置、システム、コンピュータプログラム、記録媒体、データ構造などに適用したものも本発明の態様として有効である。
上述の如く、本発明の一実施形態によれば、1ページに1つ以上の資源を含む第一のWeb資源から他のWeb資源へ移動した資源を容易且つ迅速に追跡できる。
次に、本発明を実施するための最良の形態を、以下の実施例に基づき図面を参照しつつ説明していく。
(本実施例の概要)
本実施例は、Webページ間の移動がおこる記事などの注目アイテム(注目資源)へのジャンプにおいて、指定された所在(URL)に注目アイテムがない場合、Webページ内の「次のページ」というような形式で、別のURLで指定されるWebページにジャンプするリンク(以下、ナビゲーションリンクという)を探し出し、そのナビゲーションリンクを辿って目的の注目アイテムを見つけるものである。したがって、本実施例では他のWebページへ移動した注目アイテムを追跡できる。
本実施例は、インターネットやイントラネット等のネットワーク上の記事等の資源に対する検索やアノテーションにおいて、無秩序に(人の自由意志によって)行われる移動ではないシステマティックな記事の移動があった場合でも、検索結果やアノテーションされた資源の閲覧において、資源の移動を反映した移動先へのアクセス(閲覧など)を可能とするものである。
例えば、"hoge"という文字列を含む記事Aが「http://foo/bar1.html」のWebページにあったとする。検索エンジンのクローラは、このWebページを収集して"hoge"という文字列の所在として「http://foo/bar1.htmlを記憶したとする。その後、「http://foo/」というサイトでは記事が追加され、記事Aが「http://foo/bar2.html」に移動したとする。このとき検索エンジンの利用者が、クエリーとして"hoge"を与えて検索した時、従来の検索エンジンでは文字列"hoge"の所在として「http://foo/bar1.html」を返す。一方、本実施例では文字列"hoge"の所在として、記事Aの移動先である「http://foo/bar2.html」を返す(あるいは返された所在をクリックした時に移動先である「http://foo/bar2.html」にジャンプする)ことができる。
あるいはWebアノテーションという応用では、「http://foo/bar1.html」にあった記事Aにアノテーションをしたとき、Webアノテーションシステムがそのアノテーションの所在として「http://foo/bar1.html」を記憶したとする。その後、「http://foo/」というサイトでは記事が追加され、記事Aは「http://foo/bar2.html」に移動したとする。このとき、アノテーションの所在を記したところから当アノテーションを付与した記事にジャンプしようとすると、従来のWebアノテーションシステムでは「http://foo/bar1.html」にジャンプしてしまい、アノテーションを付与した記事Aがみつからない。一方、本実施例では記事Aの移動先である「http://foo/bar2.html」にジャンプすることで、記事Aと、そこに付与されたアノテーションとを表示することができる。
次に、サンプルのHTMLテキストで説明する。例えば、「http://foo/bar1.html」のWebページが図2に示すようなものであるとする。図2はWebページの一例のイメージ図である。図2のWebページは記事が水平線で区切られ、各記事に日付、タイトル、記事内容が含まれている。そして、図2のWebページは新しい記事が登録されると上に追加される。図2のWebページには一定の記事数だけが掲載される。図2のWebページは底に「前のページ」というリンクがあって、古くなった記事がリンク先に掲載されている。例えば記事3012を含むインデックスを作成し、図3のようなリンクページが作成されたとする。
図3はリンクページの一例のイメージ図である。図3のリンクページは、通常のWebにおいて、例えば図4のようなHTMLファイルで表現される。図4は、リンクページを表現するHTMLファイルの一例のイメージ図である。
図3のリンクページの「記事3012」の部分をクリックすると、記事3012をもともと含んでいたWebページにジャンプすることになる。例えば図4のHTMLファイルの場合は、「http://foo/bar1.html」のWebページにジャンプする。図3のリンクページは文字列"hoge"の検索結果であっても、アノテーションした所在の一覧リストであってもよい。
しかし、ニュースやブログなどのWebページは時間が経つと記事が追加される。例えば図2のWebページは時間が経つと記事が追加され、例えば図5のWebページのようになっているかもしれない。図5は、記事が追加されたWebページの一例のイメージ図である。
図5のWebページは、図2のWebページとURLが同じであるが、記事3014及び3015が追加され、図2のWebページに掲載されていた記事3011及び3012が「前のページ」というナビゲーションリンク先の図6に示すようなWebページに移動している。図6はナビゲーションリンク先のWebページの一例のイメージ図である。例えば図6のWebページのURLは、「http://foo/bar2.html」であるとする。
従来、図3のリンクページは注目アイテム(記事3012)の所在を、インデックスが作成された時点での物理的位置「http://foo/bar1.html」として記憶している。インデックスが作成された後で記事3012が「http://foo/bar2.html」のWebページに移動したとすると、図3のリンクページから記事3012へのジャンプでは、記事3012の無い物理的位置「http://foo/bar1.html」のWebページが表示されてしまう。
そこで、本実施例では、リンクページから注目アイテムである記事3012にアクセスしようとした時、インデックスが作成された時点での物理的位置「http://foo/bar1.html」のWebページではなく、「前のページ」というアンカーで示されたナビゲーションリンクを利用して、現時点で注目アイテムである記事3012が存在する「http://foo/bar2.html」のWebページにジャンプしようとするものである。
すなわち、検索システムでは図3のリンクページの記事3012をクリックすると図5のWebページではなく図6のWebページが表示される。また、Webアノテーションシステムでは図6のWebページにアノテーションが付与された図7に示すWebページが表示される。図7はナビゲーションリンク先のWebページに復元したアノテーションの一例のイメージ図である。
なお、上記では説明を容易化する為、「記事3010」のように記事番号で記事が一意に特定できるようにしたが、実際、このような記事番号が付与されているのではなく、通常のテキストがタイトルになっている。
一般に記事の移動は無秩序に行われるのではなく、記事の移動元のWebページから移動先のWebページへナビゲーションリンクが張られている。なお、ナビゲーションリンクとは、「次に」とか「next」などの目印が付けられた、その記事(資源)に関連する連続的なWebページへのリンクである。従来は、単に所在情報(URL)あるいは特徴情報で記事にアクセスしていた。
本実施例は、記事の移動元のWebページから移動先のWebページへナビゲーションリンクが張られていることに注目し、注目アイテム(注目記事)が見つからなかったときにナビゲーションリンクを自動的に辿ることで注目アイテムにアクセスできるようにしている。
(本実施例の原理)
図8は、本実施例の原理を表した説明図である。図8の資源追跡部20は、注目アイテム情報取出部21,Web情報取出部22,注目アイテム存在確認部23,ナビゲーションリンク抽出部24,ナビゲーション実行部25を有する構成である。
注目アイテム情報取出部21は、アドレス(URL)と共に、注目アイテム(記事、ブロックなど)の識別情報(キーワードや記事ID、記事のハッシュコード値など)を注目アイテム情報として受け取る。
Web情報取出部22は、注目アイテム情報取出部21が受け取ったアドレスで指定されるWeb資源(Webページ)を取得する。注目アイテム存在確認部23は、Web情報取出部22が取得したWeb資源に、注目アイテム情報取出部21が受け取った注目アイテムの識別情報と一致する資源(記事)が存在するか否かを検査する。
注目アイテムの識別情報と一致する資源が存在しない場合、ナビゲーションリンク抽出部24は、そのWeb資源のナビゲーションリンクをアンカー文字列あるいは文書構造知識に基づいて探し出す。ナビゲーション実行部25は、ナビゲーションリンクを組織的に辿りながら、注目アイテムの識別情報と一致する資源を有するWeb資源を探す。
資源追跡部20は、ステップS21で注目アイテム情報取出部21が受け取ったアドレスについて、Web情報取出部22,注目アイテム存在確認部23,ナビゲーションリンク抽出部24,ナビゲーション実行部25の処理を繰り返し行う。
以上のように、資源追跡部20は取得したWeb資源の注目アイテムの存在を確認しながら、注目アイテムがない時にナビゲーションリンクを辿って注目アイテムを探す。注目アイテムがオリジナルな所在位置からナビゲーションリンクで辿れる所在位置へ移動したのであれば、資源追跡部20は、どのタイミングでアクセスしても目当ての注目アイテムにアクセスできる。
これは、通常のニュースやブログなどのWebページは時間経過とともに記事が増えて行くタイプのWebページに対する検索システム、Webアノテーションシステム、Webブラウザ,ブックマークシステム等のインターネット関連製品において効果がある。
検索やアノテーションのインデックスから注目アイテムが真に存在するWebページへジャンプするようなシステムとしては、どのタイミングで上記の資源を探すかで、典型的には以下の3つがある。
第1のシステムは、リンクページに一般のリンクを利用する。第1のシステムは、リンクがクリックされてジャンプするときに資源を追跡する。第1のシステムはブラウザ等の閲覧器の拡張あるいは専用閲覧器のような形態で実施される。
第2のシステムは、リンクページにリンクを表示する際に資源を追跡し、追跡した結果をリンクとして表示する。第2のシステムは、例えば検索装置が検索結果を表示するときに実施される。
また、第3のシステムはリンクページにパラメータ付きの特定の所在へのリンクを利用する。第3のシステムは、そのリンクがクリックされると、特定の所在で資源の追跡が実施され、追跡した結果に基づき目的の所在へジャンプする。
図9は資源追跡部の一例の構成図である。本実施例では注目アイテムの存在を確認するための注目アイテム識別情報を同時に保有することを前提としている。本実施例では指定された注目アイテムに対してその特徴、具体的に検索では検索用インデックスが注目アイテム識別情報になり、Webアノテーションではアノテーションを付与した際に付与された場所の周辺情報(周辺のテキスト、記事タイトル、記事本文、それらのハッシュコード値など)が注目アイテム識別情報になる。
図9の資源追跡部20は、注目アイテム情報取出部21,Web情報取出部22,注目アイテム存在確認部23,ナビゲーションリンク抽出部24,ナビゲーション実行部25,Web資源情報出力部26,ナビゲーション管理部27,ナビゲーションリンクDB28及びナビゲーションリンクテーブル29を有する構成である。
注目アイテム情報受取部21は、所在情報(URL)と共に、注目アイテム識別情報を受け取る。Web情報取出部22は、所在情報に対応するWeb資源をWebサーバ30から取り出す。注目アイテム存在確認部23は、取り出したWeb資源の中に注目アイテムが存在するかどうか、注目アイテム識別情報を使って確認する。
取り出したWeb資源の中に注目アイテムが存在すれば、注目アイテム存在確認部23はWeb資源情報出力部26から、そのWeb資源の所在情報ないしはWeb資源自身を出力する。
取り出したWeb資源の中に注目アイテムが存在しなければ、ナビゲーションリンク抽出部24は、そのWeb資源から移動してしまった注目アイテムを追跡するため、現在のWeb資源からナビゲーションリンクを抽出する。ナビゲーションリンク抽出部24は図10に示すようなナビゲーションリンクテーブル29を参照し、現在のWeb資源からナビゲーションリンクを特定する。
図10はナビゲーションリンクテーブルの一例の構成図である。ナビゲーションリンクテーブル29は、ナビゲーションリンクに付けられる「前のページ」,「→」などの目印が記載されている。
ナビゲーションリンク抽出部24は抽出したナビゲーションリンクをナビゲーション管理部27に通知する。ナビゲーション管理部27は一つのWeb資源中にナビゲーションリンクが一つとは限らないので、通知されたナビゲーションリンクをナビゲーションリンクDB28に保持させる。ナビゲーション管理部27は、どういう順番でナビゲーションリンクを辿るか、あるいは一度辿ったところを重複して辿らないように管理しながらナビゲーションリンクDB28からナビゲーションリンクを一つずつ取り出す。
そして、ナビゲーション実行部25はナビゲーションリンクDB28から取り出されたナビゲーションリンクの示す所在情報を取り出し、取り出した所在情報をWeb情報取出部22に通知する。
例えば資源追跡部20のない通常の検索システムは図11のようになる。図11は資源追跡部のない通常の検索システムを表した構成図である。利用者はブラウザ50を操作してキーワード等のクエリーを検索装置40に入力する。検索装置40は利用者に入力されたクエリーで検索を行う。
具体的に、検索装置40はクエリーからキーの論理式を構築し、インデックス表に基づいて所在情報を求める。図12はインデックス表の一例の構成図である。インデックス表はキーと所在情報とを対応付けているものである。なお、クエリーからキーの論理式を構築する部分は本実施例の本質ではないので、ここでは単一のキーを例に説明する。
例えば図12のインデックス表の場合、検索装置40はクエリーとして"hoge"が与えられたとすると、インデクス表から所在情報として「foo/bar1.html」、「foo/bar9.html」を得る。そして、検索装置40は、それぞれの所在の要約を合わせて検索結果のHTML文書41を作成し、ブラウザ50に図13の検索結果をリンクページとして表示する。
図13は検索結果画面の一例のイメージ図である。利用者は検索結果41の中から、その実体のWeb資源にアクセスするためにWeb資源へのリンク(例えば「foo/bar1のタイトル」と表示されている部分)をクリックする。
ブラウザ50は、クリックされたリンク先「foo/bar1.html」のアドレスに対応するWeb資源31をWebサーバ30から取り出し、そのWeb資源31を表示する。本実施例は検索であるかどうかは本質ではなく、注目アイテムへのリンクであればよい。以下の説明では、図3のリンクページによって説明する。
図3のリンクページでは、記事3012のHTMLは図4に示すようであり、記事3012のリンクをクリックしたら「http://foo/bar1.html」のアドレスに対応する図5のようなWebページが表示されることになる。
例えば資源追跡部20のある検索システムは例えば図14のようになる。図14は資源追跡部のある検索システムの第一実施例の構成図である。図14の検索システムは、リンクをクリックしてWeb資源31にアクセスしようとした時、資源の追跡を行い、真に注目アイテムが存在するWeb資源31を表示するものである。
利用者は、ブラウザ50を操作してキーワードを検索装置40に入力する。検索装置40は利用者に入力されたキーワードで検索を行う。検索装置40は、ブラウザ50に検索結果41をリンクページとして表示する。ここまでの処理は、通常の検索システムと同じである。
図14の検索システムは、利用者に入力されたキーワードを注目資源識別情報60として保持しておく点で図11の検索システムと異なる。利用者は検索結果41の中から、その実体のWeb資源にアクセスするためにWeb資源へのリンクをクリックする。
ブラウザ50は、クリックされたリンク先のアドレスに対応するWeb資源31をWebサーバ30から単純に取り出すのではなく、リンク先のアドレス(所在情報)と注目資源識別情報60から資源の追跡を行い、真に注目アイテムのあるWeb資源31を表示するものである。なお、資源追跡部60はブラウザ50の拡張として実現してもよいし、資源追跡部60を有する専用のブラウザ50としてもよい。
なお、図14の検索システムは図11の検索システムと検索結果41のHTMLが全くかわらないが、記事3012のリンクをクリックしたら「http://foo/bar1.html」とあるにもかかわらず「http://foo/bar2.html」のWebページ、すなわち図6のWebページが表示されることになる。
図15は、資源追跡部のある検索システムの第二実施例の構成図である。図15の検索システムは検索結果を表示する際、単純に、そのリンクを表示するのではなく、資源の追跡を行い、注目アイテムが真に存在するアドレスにリンクを書き換えて表示するものである。
利用者は、ブラウザ50を操作してキーワードを検索装置40に入力する。検索装置40は利用者に入力されたキーワードで検索を行う。検索装置40は、ブラウザ50に検索結果41をリンクページとして表示する。このとき、検索装置40は単純に検索結果41のリンクを表示するのではなく、資源追跡部20に資源の追跡を行わせる。
すなわち、資源追跡部20は検索装置40に与えられたキーワードを注目資源識別情報として、各リンクで示す先に注目アイテムが存在するかどうか確認し、存在しないならばナビゲーションリンクを辿って、注目アイテムが見つかったWeb資源31の所在情報(URL)にリンクを書き換えて利用者に提示する。
既にリンクが書き換えられているので、ブラウザ50は、その後、利用者がリンクをクリックしたならば、そのクリックされたリンク先のアドレスに対応するWeb資源31をWebサーバ30から取り出し、真に注目アイテムのあるWeb資源31を表示するものである。図15の検索システムでは、各リンクで示す先に注目アイテムが存在するかどうか確認し、存在しないならばナビゲーションリンクを辿って、注目アイテムが見つかったWeb資源31の所在情報(URL)にリンクを書き換えて利用者に提示する。
例えば図4のHTMLファイルの場合、図15の検索システムではナビゲーションリンクを辿って、注目アイテムが見つかったWeb資源31の所在情報(URL)にリンクを書き換える。図16は、注目アイテムが見つかったWeb資源の所在情報にリンクを書き換えたHTMLファイルの一例のイメージ図である。
図16のHTMLファイルの場合、図3のリンクページの「記事3012」の部分をクリックすると、「http://foo/bar2.html」のWebページ、すなわち図6のWebページが表示されることになる。
図17は、図15の検索システムの処理手順を表したフローチャートである。ステップS1に進み、検索装置40は利用者からキーワードを受け取る。ステップS2に進み、検索装置40はインデックス表から所在集合を得る。ステップS3に進み、資源追跡部20は所在集合の各要素に対して現在の所在を求める。資源追跡部20は、インデックス表から得た所在情報と、注目アイテム識別情報としてのキーワードとを得ることで、所在集合の各要素に対して現在の所在を求めることができる。
ステップS4に進み、資源追跡部20は検索結果41として、所在集合の各要素に対して現在の所在を付与して出力する。なお、ステップS4では例えば図18に示すようにリンク先のタイトル名なども修正された図18のような検索結果画面を出力するようにしてもよい。図18は検索結果画面の他の例のイメージ図である。
図19は、資源追跡部のある検索システムの第三実施例の構成図である。図19の検索システムは検索結果を表示する際、単純に、そのリンクを表示するのではなく、特定のWebサーバ62のアドレス+パラメータをリンクに書き換えて表示するものである。
利用者は、ブラウザ50を操作してキーワードを検索装置40に入力する。検索装置40は利用者に入力されたキーワードで検索を行う。検索装置40は、ブラウザ50に検索結果41をリンクページとして表示する。このとき、検索装置40が単純に検索結果41のリンクを表示するのではないのは、図15の検索システムと同じである。しかし、図10の検索システムは、この時点で資源の追跡を行わず、リンク加工部61が、単にリンクを特定のWebサーバ62のアドレス+パラメータの形に書き換えておく。
例えばキーワード"hoge"の検索結果のURLが「foo/bar1.html」であり、特定のWebサーバ62のURLが「http://tracking」であったとすると、リンク加工部61はリンクを「http://tracking?kw=hoge&url=foo%2Fbar1.html」に書き換える。ブラウザ50には検索結果がリンクページとして表示される。
利用者が「foo.html」にアクセスしようとしてリンクをクリックすると、実際には「http://tracking?kw=hoge&url=foo%2Fbar1.html」がアクセスされる。即ち、特定のWebサーバ62として「http://tracking」がアクセスされる。特定のWebサーバ62には、特定アイテム識別情報としてキーワード"hoge"、所在情報「foo%2Fbar1.html」が資源追跡部20へ渡され、資源の追跡が実行される。したがって、ブラウザ50は真に注目アイテムのあるWeb資源31を表示できる。
例えば図4のHTMLファイルの場合、図19の検索システムでは特定のWebサーバ62のアドレス+パラメータ「http://tracking?kw=hoge&url=foo%2Fbar1.html」にリンクが書き換えられる。
図20は、特定のWebサーバのアドレス+パラメータにリンクを書き換えたHTMLファイルの一例のイメージ図である。
図20のHTMLファイルの場合、図3のリンクページの「記事3012」の部分をクリックすると、特定のWebサーバ62として「http://tracking」がアクセスされ、特定アイテム識別情報としてキーワード"hoge"、所在情報「foo%2Fbar1.html」が特定のWebサーバ62から資源追跡部20へ渡され、資源の追跡が実行された結果、真に注目アイテムのある「http://foo/bar2.html」のWeb資源31、すなわち図6のWeb資源31が表示されることになる。
上記では検索システムを例に説明したが、Webアノテーションシステムの場合、検索システムの検索装置40をWebアノテーションDBからの情報取得を行う装置に置き換えればよい。
図21は資源追跡部の処理手順を表した一例のフローチャートである。ステップS11に進み、資源追跡部20の注目アイテム情報受取部21は、所在情報(URL)と、注目アイテム識別情報を受け取る。ステップS12に進み、Web情報取出部22は所在情報に対応するWeb資源をWebサーバ30から取り出す。
ステップS13に進み、注目アイテム存在確認部23は取り出したWeb資源の中に注目アイテム識別情報が存在するか(注目アイテムが存在するか)どうか確認する。取り出したWeb資源の中に注目アイテムが存在すれば(ステップS14においてYES)、注目アイテム存在確認部23はステップS16に進み、Web資源情報出力部26から、そのWeb資源の所在情報ないしはWeb資源自身を出力することで、ステップS12で取り出したWeb資源に対する処理(一般的には表示)を行う。なお、取り出したWeb資源に対する処理としては単純な表示の他、例えばWebアノテーションシステムであればアノテーションの処理(アノテーションを付与しての表示など)や、指定されたWeb資源のダウンロードなどの処理がある。
取り出したWeb資源の中に注目アイテムが存在しなければ(ステップS14においてNO)、ナビゲーションリンク抽出部24はステップS15に進み、そのWeb資源から移動してしまった注目アイテムを追跡するため、現在のWeb資源からナビゲーションリンクを探索する。現在のWeb資源にナビゲーションリンクがあれば(ステップS17においてYES)、ナビゲーションリンク抽出部24はステップS18に進み、ナビゲーションリンクを抽出する。ナビゲーション実行部25は、ナビゲーションリンク抽出部24が抽出したナビゲーションリンク先の所在情報を新しい所在情報としてナビゲーション管理部27に通知したあと、ステップS12の処理に戻る。
なお、現在のWeb資源にナビゲーションリンクがなければ(ステップS17においてNO)、ナビゲーションリンク抽出部24はステップS19に進み、注目アイテムが見つからなかったと判断する。ナビゲーション実行部25は見つからなかった時の処理(例外処理など)を行う。具体的には、例えばメッセージを出して、元々の所在情報(URL)で示されるWeb資源の表示などを行う。
ナビゲーションリンクが常に一つ正確に見つかる場合には、図21に示すような処理で良い。しかし、実際にはナビゲーションリンクの候補が複数ある場合もある。図22はナビゲーションリンクの候補が複数ある画面例である。図22の画面ではナビゲーションリンクの候補として「前のページ」と「次のページ」とがあるが、時間的過去へのリンクがどちらかがあいまいである。
このように、ナビゲーションリンクの候補にあいまい性のある場合にも対処するための実施例としては、ナビゲーションリンクの候補を待ち行列に登録し、その待ち行列に登録されたナビゲーションリンクの候補を出し入れして、次に探索すべきナビゲーションリンクの候補を求める。上記処理のためには、ナビゲーション管理部27と待ち行列を保存するキューとが必要になる。なお、待ち行列の管理は、深さ優先探索、最良優先探索などのアルゴリズムが良く知られている(これらはコンピュータの基本的な探索アルゴリズムであるので詳細は省略する)。
注目アイテム存在確認部23は、Web情報取出部22が取り出したWeb資源の中に注目アイテム識別情報が存在するかどうか確認するものである。典型的な注目アイテム存在確認部23は、文字列検索(例えばUNIX(登録商標)のfgrepコマンド)によりWeb資源の中に注目アイテム識別情報が存在するかどうか確認する。
例えば、注目アイテム識別情報が文字列"記事3012のタイトル"であれば、Web資源中に文字列"記事3012のタイトル"が存在するか否かで注目アイテムが存在するか否かを判定するものである。
やや高度な注目アイテム存在確認部23は、情報構造を利用するものである。例えば図23のHTMLファイルではWeb資源が複数の記事から構成されており、各記事のタイトルがclass属性の値"entry-header"で指定されている。また、別の注目アイテム存在確認部23は、記事タイトルでなく、記事(図23ではclass属性の値"entry"内の本文)のハッシュ値を利用することもできる。
注目アイテム存在確認部23は、HTMLファイルの特定の構造と構造内の照合情報とを利用するものであり、図24のような処理を行う。図24は注目アイテム存在確認部の処理手順を表した一例のフローチャートである。
ステップS21に進み、注目アイテム存在確認部23はWeb情報取出部22が取得したWeb資源(HTMLファイル)を取り込む。ステップS22に進み、注目アイテム存在確認部23は取り込んだWeb資源から、指定された属性及び値のペアをもつタグを探索する。
ステップS23に進み、注目アイテム存在確認部23は指定された属性及び値のペアをもつタグが見つからないと、ステップS24に進み、取り込んだWeb資源の中に注目アイテムが存在しない旨をナビゲーションリンク抽出部24に返す。なお、注目アイテム存在確認部23は指定された属性及び値のペアをもつタグが見つかると、ステップS25に進み、そのタグの内容が探している内容と一致するか否かを判定する。見つかったタグの内容が探している内容と一致すると、注目アイテム存在確認部23はステップS26に進み、取り込んだWeb資源の中に注目アイテムが存在した旨をWeb資源情報出力部26に返す。見つかったタグの内容が探している内容と一致しなければ、注目アイテム存在確認部23はステップS22の処理に戻る。
また、図25はナビゲーションリンク抽出部の処理手順を表した一例のフローチャートである。ステップS31に進み、ナビゲーションリンク抽出部24はWeb資源(Webページ)中のすべてのリンク情報を取り出す。
例えばHTMLファイルでは、ナビゲーションリンク抽出部24が、"a"タグで囲まれたアンカーテキスト及び"a"タグのhref属性の値を取り出す。また、ナビゲーションリンク抽出部24は必要に応じてalt属性を取り出す(アンカーがテキストではなくイメージの場合などalt属性がアンカーテキストの代替となる)。
ステップS32に進み、ナビゲーションリンク抽出部24は、取り出したリンク情報のナビゲーションリンクらしさを、アンカーテキストやリンク先、文書中の位置などの情報を使って求める。ステップS33に進み、ナビゲーションリンク抽出部24は、それぞれのリンク情報のナビゲーションリンクらしさに基づきリンク情報の取捨選択を行い、ナビゲーションリンクを求める。リンク情報の取捨選択は一つないし無しを選ぶようなものであってもよいし、ナビゲーションリンクらしさの優先度を与えて、探索アルゴリズムによってナビゲーションリンクらしいものから順にナビゲーションリンクとして辿るという方策をとってもよい。
ナビゲーションリンクらしさのチェックは、例えば以下のように行う。リンク情報がナビゲーションリンクであるかどうかは明確な基準があるわけではないので、ヒューリスティックスによってナビゲーションリンクらしさを求める。
一般的にナビゲーションリンクは、そのWebページの閲覧者が一連の情報をサーチするために利用するものなので、アンカーテキストの手がかり(「前のページ」「次のページ」「next」「previous」「→」など)、文書中の位置(一般に文書の末尾付近)や、移動がシステマティックに行われることからリンク先の手がかり(xxx/1.htmlに対してはxxx/2.htmlであるはずというURLパターン)が利用できる。
図26は、資源追跡部20を実現する装置の一例の構成図である。図26の装置は、それぞれバスBで相互に接続された入力装置71,出力装置72,ドライブ装置73,補助記憶装置74,主記憶装置75,演算処理装置76およびインターフェース装置77を含むように構成される。
入力装置71はキーボードやマウスなどで構成され、各種信号を入力するために用いられる。出力装置72はディスプレイ装置などで構成され、各種ウインドウやデータ等を表示するために用いられる。インターフェース装置77は、モデム,LANカードなどで構成されており、ネットワークに接続する為に用いられる。
本実施例に係るプログラムは、資源追跡部20を制御する各種プログラムの少なくとも一部である。プログラムは例えば記録媒体78の配布やネットワークからのダウンロードなどによって提供される。プログラムを記録した記録媒体78は、CD−ROM、フレキシブルディスク、光磁気ディスク等の様に情報を光学的,電気的或いは磁気的に記録する記録媒体、ROM、フラッシュメモリ等の様に情報を電気的に記録する半導体メモリ等、様々なタイプの記録媒体を用いることができる。
また、プログラムを記録した記録媒体78がドライブ装置73にセットされると、プログラムは記録媒体78からドライブ装置73を介して補助記憶装置74にインストールされる。ネットワークからダウンロードされたプログラムは、インターフェース装置77を介して補助記憶装置74にインストールされる。
補助記憶装置74は、インストールされたプログラムを格納すると共に、必要なファイル,データ等を格納する。主記憶装置75は、起動時に補助記憶装置74からプログラムを読み出して格納する。そして、演算処理装置76は主記憶装置75に格納されたプログラムに従って、上記したような各種処理を実現している。
本発明は、以下に記載する付記のような構成が考えられる。
(付記1)
コンピュータに、1ページに1つ以上の資源を含む第一のWeb資源から他のWeb資源へ移動した前記資源を追跡させるWeb資源追跡管理プログラムであって、
前記コンピュータを、
前記第一のWeb資源の所在情報と、前記第一のWeb資源に含まれる注目資源を識別する為の注目資源識別情報との対応関係を受け取る受取手段と、
利用者に選択された前記所在情報に対応する前記Web資源を取り出す取出手段と、
前記取出手段が取り出した前記Web資源に前記注目資源が存在するかを、前記注目資源識別情報により確認する存在確認手段と、
前記取出手段が取り出した前記Web資源に前記注目資源が存在しなければ前記Web資源に含まれる前記他のWeb資源へのリンクを抽出する抽出手段と、
前記抽出手段が抽出した前記リンクで示される所在情報を次の所在情報として前記取出手段へ通知する追跡手段と、
前記取出手段が取り出した前記Web資源に前記注目資源が存在すれば前記Web資源を前記利用者の端末に送信する送信手段と
して機能させるためのWeb資源追跡管理プログラム。
(付記2)
前記抽出手段は、前記Web資源に含まれる前記他のWeb資源への1種類以上のリンクを示したテーブル手段に基づき、前記Web資源に含まれる前記他のWeb資源へのリンクを抽出することを特徴とする付記1記載のWeb資源追跡管理プログラム。
(付記3)
前記存在確認手段は、キーワード,資源番号,又は前記資源のハッシュコード値を前記注目資源識別情報として、前記取出手段が取り出した前記Web資源に前記注目資源が存在するかを確認することを特徴とする付記1又は2記載のWeb資源追跡管理プログラム。
(付記4)
前記第一のWeb資源は、1ページに含む前記資源の数が制限されており、前記資源の数が制限を超過しないよう古い前記資源から順に、前記リンクで示される前記所在情報に対応する前記他のWeb資源に移動されることを特徴とする付記1乃至3何れか一項記載のWeb資源追跡管理プログラム。
(付記5)
1ページに1つ以上の資源を含む第一のWeb資源から他のWeb資源へ移動した前記資源を追跡させるWeb資源追跡管理装置であって、
前記第一のWeb資源の所在情報と、前記第一のWeb資源に含まれる注目資源を識別する為の注目資源識別情報との対応関係を受け取る受取手段と、
利用者に選択された前記所在情報に対応する前記Web資源を取り出す取出手段と、
前記取出手段が取り出した前記Web資源に前記注目資源が存在するかを、前記注目資源識別情報により確認する存在確認手段と、
前記取出手段が取り出した前記Web資源に前記注目資源が存在しなければ前記Web資源に含まれる前記他のWeb資源へのリンクを抽出する抽出手段と、
前記抽出手段が抽出した前記リンクで示される所在情報を次の所在情報として前記取出手段へ通知する追跡手段と、
前記取出手段が取り出した前記Web資源に前記注目資源が存在すれば前記Web資源を前記利用者の端末に送信する送信手段と
を有するWeb資源追跡管理装置。
(付記6)
コンピュータによって実行される、1ページに1つ以上の資源を含む第一のWeb資源から他のWeb資源へ移動した前記資源を追跡させるWeb資源追跡管理方法であって、
前記コンピュータが、
前記第一のWeb資源の所在情報と、前記第一のWeb資源に含まれる注目資源を識別する為の注目資源識別情報との対応関係を受け取る受取手順と、
利用者に選択された前記所在情報に対応する前記Web資源を取り出す取出手順と、
前記取出手順で取り出した前記Web資源に前記注目資源が存在するかを、前記注目資源識別情報により確認する存在確認手順と、
前記取出手順で取り出した前記Web資源に前記注目資源が存在しなければ前記Web資源に含まれる前記他のWeb資源へのリンクを抽出する抽出手順と、
前記抽出手順で抽出した前記リンクで示される所在情報を次の所在情報として前記取出手段へ通知する追跡手順と、
前記取出手順で取り出した前記Web資源に前記注目資源が存在すれば前記Web資源を前記利用者の端末に送信する送信手順と
を実行することを特徴とするWeb資源追跡管理方法。
本発明は、具体的に開示された実施例に限定されるものではなく、特許請求の範囲から逸脱することなく、種々の変形や変更が可能である。
最初のURLとは別のURLで指定されるWebページの中に記事が移動する例を表した一例の模式図である。 Webページの一例のイメージ図である。 リンクページの一例のイメージ図である。 リンクページを表現するHTMLファイルの一例のイメージ図である。 記事が追加されたWebページの一例のイメージ図である。 ナビゲーションリンク先のWebページの一例のイメージ図である。 ナビゲーションリンク先のWebページに復元したアノテーションの一例のイメージ図である。 本実施例の原理を表した説明図である。 資源追跡部の一例の構成図である。 ナビゲーションリンクテーブルの一例の構成図である。 資源追跡部のない通常の検索システムを表した構成図である。 インデックス表の一例の構成図である。 検索結果画面の一例のイメージ図である。 資源追跡部のある検索システムの第一実施例の構成図である。 資源追跡部のある検索システムの第二実施例の構成図である。 注目アイテムが見つかったWeb資源の所在情報にリンクを書き換えたHTMLファイルの一例のイメージ図である。 図15の検索システムの処理手順を表したフローチャートである。 検索結果画面の他の例のイメージ図である。 資源追跡部のある検索システムの第三実施例の構成図である。 特定のWebサーバのアドレス+パラメータにリンクを書き換えたHTMLファイルの一例のイメージ図である。 資源追跡部の処理手順を表した一例のフローチャートである。 ナビゲーションリンクの候補が複数ある画面例である。 HTMLファイルの一例のイメージ図である。 注目アイテム存在確認部の処理手順を表した一例のフローチャートである。 ナビゲーションリンク抽出部の処理手順を表した一例のフローチャートである。 資源追跡部20を実現する装置の一例の構成図である。
符号の説明
20 資源追跡部
21 注目アイテム情報取出部
22 Web情報取出部
23 注目アイテム存在確認部
24 ナビゲーションリンク抽出部
25 ナビゲーション実行部
26 Web資源情報出力部
27 ナビゲーション管理部
28 ナビゲーションリンクDB
29 ナビゲーションリンクテーブル
30 Webサーバ
31 Web資源
40 検索装置
41 検索結果
50 ブラウザ
60 注目資源識別情報
61 リンク加工部
62 特定のWebサーバ
71 入力装置
72 出力装置
73 ドライブ装置
74 補助記憶装置
75 主記憶装置
76 演算処理装置
77 インターフェース装置

Claims (6)

  1. コンピュータに、1ページに1つ以上の資源を含む第一のWeb資源から他のWeb資源へ移動した前記資源を追跡させるWeb資源追跡管理プログラムであって、
    前記コンピュータを、
    前記第一のWeb資源の所在情報と、前記第一のWeb資源に含まれる注目資源を識別する為の注目資源識別情報との対応関係を受け取る受取手段と、
    利用者に選択された前記所在情報に対応する前記Web資源を取り出す取出手段と、
    前記取出手段が取り出した前記Web資源に前記注目資源が存在するかを、前記注目資源識別情報により確認する存在確認手段と、
    前記取出手段が取り出した前記Web資源に前記注目資源が存在しなければ前記Web資源に含まれる前記他のWeb資源へのリンクを抽出する抽出手段と、
    前記抽出手段が抽出した前記リンクで示される所在情報を次の所在情報として前記取出手段へ通知する追跡手段と、
    前記取出手段が取り出した前記Web資源に前記注目資源が存在すれば前記Web資源を前記利用者の端末に送信する送信手段と
    して機能させるためのWeb資源追跡管理プログラム。
  2. 前記抽出手段は、前記Web資源に含まれる前記他のWeb資源への1種類以上のリンクを示したテーブル手段に基づき、前記Web資源に含まれる前記他のWeb資源へのリンクを抽出することを特徴とする請求項1記載のWeb資源追跡管理プログラム。
  3. 前記存在確認手段は、キーワード,資源番号,又は前記資源のハッシュコード値を前記注目資源識別情報として、前記取出手段が取り出した前記Web資源に前記注目資源が存在するかを確認することを特徴とする請求項1又は2記載のWeb資源追跡管理プログラム。
  4. 前記第一のWeb資源は、1ページに含む前記資源の数が制限されており、前記資源の数が制限を超過しないよう古い前記資源から順に、前記リンクで示される前記所在情報に対応する前記他のWeb資源に移動されることを特徴とする請求項1乃至3何れか一項記載のWeb資源追跡管理プログラム。
  5. 1ページに1つ以上の資源を含む第一のWeb資源から他のWeb資源へ移動した前記資源を追跡させるWeb資源追跡管理装置であって、
    前記第一のWeb資源の所在情報と、前記第一のWeb資源に含まれる注目資源を識別する為の注目資源識別情報との対応関係を受け取る受取手段と、
    利用者に選択された前記所在情報に対応する前記Web資源を取り出す取出手段と、
    前記取出手段が取り出した前記Web資源に前記注目資源が存在するかを、前記注目資源識別情報により確認する存在確認手段と、
    前記取出手段が取り出した前記Web資源に前記注目資源が存在しなければ前記Web資源に含まれる前記他のWeb資源へのリンクを抽出する抽出手段と、
    前記抽出手段が抽出した前記リンクで示される所在情報を次の所在情報として前記取出手段へ通知する追跡手段と、
    前記取出手段が取り出した前記Web資源に前記注目資源が存在すれば前記Web資源を前記利用者の端末に送信する送信手段と
    を有するWeb資源追跡管理装置。
  6. コンピュータによって実行される、1ページに1つ以上の資源を含む第一のWeb資源から他のWeb資源へ移動した前記資源を追跡させるWeb資源追跡管理方法であって、
    前記コンピュータが、
    前記第一のWeb資源の所在情報と、前記第一のWeb資源に含まれる注目資源を識別する為の注目資源識別情報との対応関係を受け取る受取手順と、
    利用者に選択された前記所在情報に対応する前記Web資源を取り出す取出手順と、
    前記取出手順で取り出した前記Web資源に前記注目資源が存在するかを、前記注目資源識別情報により確認する存在確認手順と、
    前記取出手順で取り出した前記Web資源に前記注目資源が存在しなければ前記Web資源に含まれる前記他のWeb資源へのリンクを抽出する抽出手順と、
    前記抽出手順で抽出した前記リンクで示される所在情報を次の所在情報として前記取出手段へ通知する追跡手順と、
    前記取出手順で取り出した前記Web資源に前記注目資源が存在すれば前記Web資源を前記利用者の端末に送信する送信手順と
    を実行することを特徴とするWeb資源追跡管理方法。
JP2008210003A 2008-08-18 2008-08-18 Web資源追跡管理プログラム、Web資源追跡管理装置及びWeb資源追跡管理方法 Expired - Fee Related JP5187064B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008210003A JP5187064B2 (ja) 2008-08-18 2008-08-18 Web資源追跡管理プログラム、Web資源追跡管理装置及びWeb資源追跡管理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008210003A JP5187064B2 (ja) 2008-08-18 2008-08-18 Web資源追跡管理プログラム、Web資源追跡管理装置及びWeb資源追跡管理方法

Publications (2)

Publication Number Publication Date
JP2010044708A true JP2010044708A (ja) 2010-02-25
JP5187064B2 JP5187064B2 (ja) 2013-04-24

Family

ID=42016025

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008210003A Expired - Fee Related JP5187064B2 (ja) 2008-08-18 2008-08-18 Web資源追跡管理プログラム、Web資源追跡管理装置及びWeb資源追跡管理方法

Country Status (1)

Country Link
JP (1) JP5187064B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012068744A (ja) * 2010-09-21 2012-04-05 Nippon Telegr & Teleph Corp <Ntt> ウェブページリンク設定装置およびその動作方法
JP2014081958A (ja) * 2014-01-20 2014-05-08 Fujitsu Ltd アノテーション付与方法、アノテーション復元方法、アノテーション付与装置及びアノテーション復元装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000172614A (ja) * 1998-12-10 2000-06-23 Nec Corp インターネット検索装置
JP2005173671A (ja) * 2003-12-08 2005-06-30 Nec Corp リンク診断装置、リンク診断方法およびリンク診断プログラム。
JP2006331019A (ja) * 2005-05-25 2006-12-07 Nec Corp Webサイトの管理装置、webサイトの管理方法、及び、プログラム
JP2007188356A (ja) * 2006-01-13 2007-07-26 Internatl Business Mach Corp <Ibm> 不正ハイパーリンク検出装置及びその方法
JP2007264893A (ja) * 2006-03-28 2007-10-11 Ntt Data Corp ウェブページ提供装置及びウェブページ提供プログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000172614A (ja) * 1998-12-10 2000-06-23 Nec Corp インターネット検索装置
JP2005173671A (ja) * 2003-12-08 2005-06-30 Nec Corp リンク診断装置、リンク診断方法およびリンク診断プログラム。
JP2006331019A (ja) * 2005-05-25 2006-12-07 Nec Corp Webサイトの管理装置、webサイトの管理方法、及び、プログラム
JP2007188356A (ja) * 2006-01-13 2007-07-26 Internatl Business Mach Corp <Ibm> 不正ハイパーリンク検出装置及びその方法
JP2007264893A (ja) * 2006-03-28 2007-10-11 Ntt Data Corp ウェブページ提供装置及びウェブページ提供プログラム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CSNG200700136005; 吉岡 真治: 'Web情報活用のためのアンカーテキストの分類と利用' 情報処理学会研究報告 2006-FI-84 情報学基礎 2006-NL-175 自然言語処理 第2006巻、第94号, 20060913, pp.27-33, 社団法人情報処理学会 *
JPN6012066832; 吉岡 真治: 'Web情報活用のためのアンカーテキストの分類と利用' 情報処理学会研究報告 2006-FI-84 情報学基礎 2006-NL-175 自然言語処理 第2006巻、第94号, 20060913, pp.27-33, 社団法人情報処理学会 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012068744A (ja) * 2010-09-21 2012-04-05 Nippon Telegr & Teleph Corp <Ntt> ウェブページリンク設定装置およびその動作方法
JP2014081958A (ja) * 2014-01-20 2014-05-08 Fujitsu Ltd アノテーション付与方法、アノテーション復元方法、アノテーション付与装置及びアノテーション復元装置

Also Published As

Publication number Publication date
JP5187064B2 (ja) 2013-04-24

Similar Documents

Publication Publication Date Title
CN101454781B (zh) 扩展的摘录
CN101192231B (zh) 基于上下文的书签
CN101410834A (zh) 在因特网浏览器中设置书签的方法
US20190235721A1 (en) Flexible content organization and retrieval
JP2011022705A (ja) 証跡管理方法、システム、及びプログラム
JP2010128928A (ja) 検索システム及び検索方法
JP2008090404A (ja) 文書検索装置、文書検索方法および文書検索プログラム
JP5098605B2 (ja) アノテーションプログラム、アノテーション装置
Jatowt et al. Detecting age of page content
JP5284064B2 (ja) 商品idサーバ装置、および商品idサーバ装置の制御方法
JP2004054588A (ja) 文書検索装置、文書検索方法およびその方法をコンピュータに実行させるプログラム
JP2005174138A (ja) コンテンツ検索方法およびシステム、プログラムおよびプログラム記録媒体
JP5187064B2 (ja) Web資源追跡管理プログラム、Web資源追跡管理装置及びWeb資源追跡管理方法
JP5423470B2 (ja) 名寄せチェック支援装置、名寄せチェック支援プログラム及び名寄せチェック支援方法
JPH11143885A (ja) 情報検索方法及び装置及び情報検索プログラムを格納した記憶媒体及び情報発信方法及び装置及び情報発信プログラムを格納した記憶媒体
JP5712496B2 (ja) アノテーション復元方法、アノテーション付与方法、アノテーション復元プログラム及びアノテーション復元装置
JP5380874B2 (ja) 情報検索方法、プログラム及び装置
JP6578693B2 (ja) 情報抽出装置、情報抽出方法、及び、表示制御システム
JP2008176565A (ja) データベース管理方法、そのプログラムおよびデータベース管理装置
JP2008102773A (ja) データを共通のフォーマットに変換する方法
JP2006185059A (ja) コンテンツ管理装置
US20160117352A1 (en) Apparatus and method for supporting visualization of connection relationship
JP2011039743A (ja) WWW情報閲覧システムと方法およびWebブラウザとプログラム
JP6707410B2 (ja) 文献検索装置、文献検索方法およびコンピュータプログラム
US20140122660A1 (en) Web Navigation Using Web Navigation Pattern Histories

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110513

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20121214

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121225

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130107

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160201

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees