JP4648383B2 - 情報提供方法および情報提供システム - Google Patents

情報提供方法および情報提供システム Download PDF

Info

Publication number
JP4648383B2
JP4648383B2 JP2007506933A JP2007506933A JP4648383B2 JP 4648383 B2 JP4648383 B2 JP 4648383B2 JP 2007506933 A JP2007506933 A JP 2007506933A JP 2007506933 A JP2007506933 A JP 2007506933A JP 4648383 B2 JP4648383 B2 JP 4648383B2
Authority
JP
Japan
Prior art keywords
information
web
web page
generation
archive
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007506933A
Other languages
English (en)
Other versions
JPWO2006095400A1 (ja
Inventor
正己 渡辺
博久 福山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JPWO2006095400A1 publication Critical patent/JPWO2006095400A1/ja
Application granted granted Critical
Publication of JP4648383B2 publication Critical patent/JP4648383B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Description

本発明は、Webアーカイブ・サーバによってWebアーカイブに収集されたWebページを情報要求元の端末に提供する情報提供方法および情報提供システムに関する。
従来より、インターネット上には、様々な情報が公開されているが、インターネット上の情報は日々変遷し、移動することによって消滅してしまうものである。近年では、先進各国が文化資産保護の目的で、このようなインターネット上の情報を収集、蓄積し、恒久的に保存する活動を実験的に実施している。
例えば、非特許文献1、2では、インターネットを介してWebページを収集し、該収集されたWebページをWebアーカイブ内に記憶するWebアーカイビング・システムが開示されている。非特許文献1では、Webアーカイブ内に記憶されたWebページ(例えば、「A」)の内部に内包する関連するWebページ(例えば、「a」)へのリンクをWebアーカイブ内に記憶したWebページ「a」へのリンクに書き換えており、非特許文献2では、HTMLファイルの末尾に固定の「Java(登録商標)Script」を追加することによって、HTMLファイル内に静的に記述されたリンク先のURLを、参照時にWebブラウザに書き換えさせている。このようにして、インターネット上のWebページが消失しても、Webアーカイブ内に蓄積された情報を参照できるようにしている。
"国立国会図書館インターネット資源選択的蓄積実験事業WARP"、インターネット<URL:http://warp.ndl.go.jp/> "Way Back Machine"、インターネット<URL:http://www.archive.org/>
しかしながら、上記の従来技術(非特許文献1、2)では、Webアーカイブ内に記憶された多種多様なWebページのリンクをたどることができないという問題点があった。具体的には、Webページ「A」から関連するWebページ「a」に正しくジャンプさせるために、Webアーカイブ内に記憶されたWebページ「A」の内部に書き込まれたリンク先のアドレス(URL)を書き換える必要があるが、Webアーカイビング・システムで書き換え可能なリンクは、解析と書き換えが可能なHTMLファイル内に静的に記述されたリンクに限られているため、Webアーカイブ内に記憶されたHTMLファイルの静的なリンクからしか、関連するWebページにジャンプすることができず、HTMLファイル内の「Java(登録商標)Script」によるリンクやHTMLファイル以外のWebページからは、関連するWebページにジャンプすることができない。
すなわち、上記の従来技術では、インターネット上に存在する様々な各種ワープロ文書、各種アプリケーション向けデータ、マルチメディアデータ等のWebページの内部に存在するリンクの解析および書き換えが不可能であるため、Webアーカイブ内に記憶されたWebページのリンクを正しくたどって参照することができない。また、HTMLファイル内に記述されたリンクであっても、各種スクリプトによって動的に生成されるリンクは、解析できず書き換えが困難であるため、同様の問題が生じる。
そこで、本発明は、上述した従来技術による課題(問題点)を解消するためになされたものであり、Webアーカイブ内に記憶された多種多様なWebページのリンクをたどることができる情報提供方法および情報提供システムを提供することを目的とする。
また、本発明に係る情報提供方法は、Webアーカイブ・サーバによってWebアーカイブに収集されたWebページを情報要求元の端末に提供する情報提供方法であって、前記情報要求元の端末は、要求対象となるWebページの収集前アドレスおよび世代情報もしくは世代情報を特定できる管理情報を含む情報取得要求を前記Webアーカイブ・サーバに送信するように制御する送信制御工程を含み、前記Webアーカイブ・サーバは、前記送信制御工程によって送信されたWebページの収集前アドレスおよび世代情報もしくは世代情報を特定できる管理情報に対応するWebページを前記Webアーカイブから抽出し、該抽出したWebページを前記情報要求元の端末に提供する情報提供工程と、前記情報要求元の端末によって要求対象として特定されたWebページの収集前ドメインアドレスに前記情報取得要求を再度おこなうように指示して、当該Webページの世代情報もしくは世代情報を特定できる管理情報が設定されたCookieを前記情報要求元の端末に発行するCookie発行工程とを含み、前記送信制御工程は、前記Webページの収集前アドレスおよび前記Cookie発行工程によって発行されたCookieの世代情報もしくは世代情報を特定できる管理情報を前記Webアーカイブ・サーバに送信するように制御することを特徴とする。
また、本発明に係る情報提供システムは、Webアーカイブ・サーバによってWebアーカイブに収集されたWebページを情報要求元の端末に提供する情報提供システムであって、前記情報要求元の端末は、要求対象となるWebページの収集前アドレスおよび世代情報もしくは世代情報を特定できる管理情報を含む情報取得要求を前記Webアーカイブ・サーバに送信するように制御する送信制御手段を備え、前記Webアーカイブ・サーバは、前記送信制御手段によって送信されたWebページの収集前アドレスおよび世代情報もしくは世代情報を特定できる管理情報に対応するWebページを前記Webアーカイブから抽出し、該抽出したWebページを前記情報要求元の端末に提供する情報提供手段と、前記情報要求元の端末によって要求対象として特定されたWebページの収集前ドメインアドレスに前記情報取得要求を再度おこなうように指示して、当該Webページの世代情報もしくは世代情報を特定できる管理情報が設定されたCookieを前記情報要求元の端末に発行するCookie発行手段とを備え、前記送信制御手段は、前記Webページの収集前アドレスおよび前記Cookie発行手段によって発行されたCookieの世代情報もしくは世代情報を特定できる管理情報を前記Webアーカイブ・サーバに送信するように制御することを特徴とする。
本発明によれば、情報要求元の端末が要求対象となるWebページの収集前アドレスおよび世代情報もしくは世代情報を特定できる管理情報を含む情報取得要求をWebアーカイブ・サーバに送信するように制御し、Webアーカイブ・サーバが送信されたWebページの収集前アドレスおよび世代情報もしくは世代情報を特定できる管理情報に対応するWebページをWebアーカイブから抽出し、該抽出したWebページを情報要求元の端末に提供することとしたので、Webアーカイブ内に記憶された多種多様なWebページのリンクをたどることが可能な情報提供方法が得られるという効果を奏する
また、本発明によれば、Webアーカイブ・サーバが情報要求元の端末によって要求対象として特定されたWebページの収集前ドメインアドレスに情報取得要求を再度おこなうように指示して、当該Webページの世代情報もしくは世代情報を特定できる管理情報が設定されたCookieを情報要求元の端末に発行し、Webページの収集前アドレスおよび発行されたCookieの世代情報もしくは世代情報を特定できる管理情報をWebアーカイブ・サーバに送信するように制御することとしたので、世代情報(もしくは世代情報を特定できる管理情報)をCookieで持ち回ることができ、同一のIPアドレスから複数のアクセスがなされた場合でも、Webアーカイブを参照することが可能な情報提供方法が得られるという効果を奏する。
また、本発明によれば、要求対象として特定されたWebページの世代情報もしくは世代情報を特定できる管理情報を情報要求元の端末に出力するように制御することとしたので、Webアーカイブに記憶されたWebページ出力時に世代情報(もしくは世代情報を特定できる管理情報)を出力することができ、情報要求元の端末側でアクセス中のアーカイブの世代を容易に識別することが可能な情報提供方法が得られるという効果を奏する。
また、本発明によれば、情報要求元の端末が要求対象となるWebページの収集前アドレスおよび世代情報もしくは世代情報を特定できる管理情報を含む情報取得要求をWebアーカイブ・サーバに送信するように制御し、Webアーカイブ・サーバが送信されたWebページの収集前アドレスおよび世代情報もしくは世代情報を特定できる管理情報に対応するWebページをWebアーカイブから抽出し、該抽出したWebページを情報要求元の端末に提供することとしたので、Webアーカイブ内に記憶された多種多様なWebページのリンクをたどることが可能な情報提供システムが得られるという効果を奏する。
以下に添付図面を参照して、本発明に係る情報提供システムおよび情報提供方法について詳細に説明する。なお、ここでは、本発明に係る情報提供システムの概要および特徴を説明した後に、本実施例1に係る情報提供システムを説明し、最後に、本実施例に対する種々の変形例(実施例3)を説明する。
(概要および特徴)
まず最初に、本発明に係る情報提供システムの概要および特徴を説明する。図1は、本発明に係る情報提供システムの概要を説明するための概念図である。この情報提供システム1では、Webアーカイブ21内に蓄積するWebページの内包リンクをWebアーカイブでのリンクに書き換えるのではなく、収集したコンテンツの内包リンクを書き換えずにWebアーカイブ21内に蓄積している。
そして、この情報提供システム1では、上記した従来技術の課題を解消するために、クライアント端末10とWebアーカイブ・サーバ20の間に置いた参照PROXY(URLの挿げ替え機構)によって、インターネットへのWebページ取得要求をWebアーカイブ・サーバ20への要求に挿げ替えることで、Webアーカイブ21内のあらゆるコンテンツをインターネットと同様の操作でリンクをたどって参照することができるようにするものである。なお、クライアント端末10から参照PROXY(URLの挿げ替え機構)にURLの挿げ替えを依頼させるためには、WebブラウザのPROXYを参照PROXYに定義する必要がある。
この「参照PROXY」の実装例としては、インターネットに公開したサーバ上に置く形態と利用者のWebブラウザに組み込む(または専用ブラウザ)形態とが考えられる。このうち、インターネットに公開したサーバ上に参照PROXYを置いた場合には、図1に示すように、参照PROXYをWebブラウザにPROXYとして定義するだけで、あらたなソフトウェアをインストールすることなく、Webアーカイブを参照することができるようになる。
しかし、この情報提供システム1では、ファイアウォール(PROXY)を経由するクライアント端末10で参照PROXYを利用することができないという課題や、ブロードバンドルータ(IPマスカレード)を経由したクライアント端末10では、同時かつ正常にWebアーカイブを参照することができないという課題を残すこととなる。
これを具体的に説明すると、ファイアウォールを経由するクライアント端末10で、参照PROXYを利用することができない理由は、LANやイントラネットなどのネットワーク内部からファイアウォールの外のPROXYを定義することができないからである。
また、ブロードバンドルータを経由したクライアント端末10で、同時かつ正常にWebアーカイブを参照することができない理由は、インターネット上の参照PROXY(URLの挿げ替え機構)側でアクセス元のグローバルIPアドレスをキーに参照中の世代情報を保持していることから、同一グローバルIPアドレスから複数のアクセスがなされた場合には、最後にアクセスされた世代情報が参照PROXYで保持されることとなり、情報要求元それぞれがいずれのクライアント端末であるかを特定することができないからである。
このため、情報提供システム1において、インターネットに公開された参照PROXY(URLの挿げ替え機構)を利用できるのは、インターネットに直接接続しているクライアント端末のみとなり、それ以外のクライアント端末では、参照PROXY(URLの挿げ替え機構を含む)Webアーカイブ・アクセス用ソフトウェアをインストールする必要がある。また、情報公開機関3では、クライアント端末10のOS別にアクセス用ソフトウェアを用意する必要があり、すべてのOSに対応するアクセス用ソフトを用意したのでは、コストパフォーマンスの低下を招くという問題がある。
ここで、本発明に係る情報提供システム1は、図2に示すように、クライアント端末10が要求対象となるWebページの収集前アドレスおよび世代情報を含む情報取得要求をWebアーカイブ・サーバ20に送信するように制御し、Webアーカイブ・サーバ20が送信されたWebページの収集前アドレスおよび世代情報に対応するWebページをWebアーカイブ21から抽出し、該抽出したWebページをクライアント端末10に提供する一連の処理に主たる特徴があり、かかる一連の処理によって、ファイアウォールを経由するクライアント端末やブロードバンドルータを経由したクライアント端末からでも、Webアーカイブ内に記憶された多種多様なWebページのリンクをたどることができるようにしている。なお、本実施例では、インターネットに存在した時のオリジナルアドレスを以下適宜「収集前アドレス」と記述し、インターネットに存在した時のオリジナルドメインアドレスを以下適宜「収集前ドメインアドレス」と記述することとする。
この主たる特徴を図3を用いて具体的に説明する。図3は、本発明に係る情報提供システムの処理動作を示すシーケンス図である。同図に示すように、クライアント端末10では、Webアーカイブ21の検索結果やメニューから特定世代のWebページのURL選択を受け付けた場合に、Webアーカイブ・サーバ20に対してWebページ取得要求「http://アーカイブ/指示コマンド/世代情報/オリジナルURL(収集前URL)」をおこなう(ステップS301)。なお、このとき、クライアント端末10では、設定PROXYがファイアウォール13からアーカイブ用PROXY12aに切り換えられることとなる(詳細は実施例1で後述する)。
そして、Webアーカイブ・サーバ20では、Webページ取得要求を受けて、要求対象のWebページのオリジナルドメインにWebページ取得要求を再度おこなうように指示し(ステップS302)、クライアント端末10では、オリジナルドメインへの再取得指示を受けて、オリジナルドメインへのWebページ取得要求「http://オリジナルドメイン/指示コマンド/世代情報/オリジナルURL」を再度おこなう(ステップS303)。
ここで、クライアント端末10のPROXYとして定義されたアーカイブ用PROXY12aでは、依頼先をWebアーカイブ・サーバ20に変更するために、「http://オリジナルドメイン/指示コマンド/世代情報/オリジナルURL」に「http://アーカイブ」を付加して、Webページ取得要求をWebアーカイブ・サーバ20に送信するように制御する(ステップS304)。
このように、オリジナルドメインへの再取得指示をおこなうこととしたのは、クライアント端末で設定PROXYとして切り換えられたアーカイブ用PROXY12aを用いて、Webアーカイブ・サーバ20がオリジナルドメインとして振舞うことで、クライアント端末10に同一の発行元ドメインと識別させるためである。
図3の説明に戻り、Webアーカイブ・サーバ20は、クライアント端末10からオリジナルドメインとしての再取得要求を受けて、当該Webページの世代情報が設定された「Cookie」を発行し、オリジナルURL「http://オリジナルURL」にWebページ取得要求を再度おこなうように指示する(ステップS305)。
そして、クライアント端末10は、オリジナルURLへの再取得指示を受けて、オリジナルURLへのWebページ取得要求「http://オリジナルURL」を再度おこなう(ステップS306)。このとき、クライアント端末10では、再取得指示が同一ドメインからのものだと識別されているため、「Cookie」の世代情報もWebアーカイブ・サーバ20に送信されることとなる。
続いて、アーカイブ用PROXY12aでは、オリジナルURL「http://オリジナルURL」の前に「http://アーカイブ」を付加して、Webページ取得要求をWebアーカイブ・サーバ20に送信するように制御する(ステップS307)。
そして、Webアーカイブ・サーバ20は、オリジナルURLの再取得要求を受けて、「Cookie」から世代情報を取り出し、オリジナルURLおよび世代に対応するWebページをWebアーカイブ21から抽出し、該抽出したWebページをクライアント端末10に送信する(ステップS308)。
したがって、本発明に係る情報提供システム1によれば、クライアント端末10が要求対象となるWebページの収集前アドレスおよび世代情報を含む情報取得要求をWebアーカイブ・サーバ20に送信するように制御し、Webアーカイブ・サーバ20が送信されたWebページの収集前アドレスおよび世代情報に対応するWebページをWebアーカイブ21から抽出し、該抽出したWebページをクライアント端末10に提供することで、世代情報の管理およびURLの挿げ替えを各装置(クライアント端末10およびWebアーカイブ・サーバ20)で分散しておこなうことができ、上記した主たる特徴のように、ファイアウォールを経由するクライアント端末やブロードバンドルータを経由したクライアント端末からでも、Webアーカイブ内に記憶された多種多様なWebページのリンクをたどることが可能になる。
次に、本実施例1に係る情報提供システムについて説明する。なお、ここでは、図4を用いて、情報提供システム1におけるクライアント端末およびWebアーカイブ・サーバの各機能を説明しつつ、これらの機能の動作をフローチャートを用いて説明することとする。
図4は、本実施例1に係る情報提供システムの構成を示すシステム構成図である。この情報提供システム1は、クライアント端末10とWebアーカイブ・サーバ20がインターネット2を介して相互に通信可能に接続された構成となる。
このうち、クライアント端末10は、Webページを閲覧するためのブラウザ(アプリケーションソフト)11をCPUなどの内部メモリに保持し、これによって、インターネット2からHTMLファイルや画像ファイル、音楽ファイルなどをダウンロードし、レイアウトを解析して出力する情報処理装置であり、外部ネットワークとの通信を監視するファイアウォール(上位PROXY)と、後述するURLリダイレクト処理をおこなうアーカイブ用PROXYサーバ12と接続されている。
ここで、クライアント端末10におけるブラウザ11の動作内容を説明する。図5は、ブラウザ11におけるPROXY決定処理の手順を示すフローチャートである。同図に示すように、インターネット(外部ネットワーク)2に対するアクセス要求を受け付けた場合(ステップS501肯定)に、内部ネットワーク内のPROXYルールが定義されたPROXY決定プロセス11aは、当該アクセス要求がWebアーカイブのナビゲーションや検索結果一覧HTML内に記述されたURLへのアクセスであるか否かを監視する(ステップS502)。
より詳細には、PROXY決定プロセス11aは、「http://ARCHIVE/view」をキーにして、アクセス要求がWebアーカイブ21のコンテンツに対するものであり、かつそのコンテンツが特定日時および特定URLの参照を示唆するURL(例えば、「http://ARCHIVE/view/世代/http://オリジナルURL」など)であるか否かを監視している。
ここで、アクセス先ドメインが「http://ARCHIVE/view」である場合(ステップS502肯定)には、PROXY決定プロセス11aは、Webアーカイブ用フラグを「ON」に設定し(ステップS503)、当該アクセス要求をアーカイブ用PROXY12aに依頼する(ステップS504)。
また、アクセス先ドメインが「http://ARCHIVE/view」でなくとも、Webアーカイブ用フラグが「ON」である場合(ステップS502否定かつステップS505肯定)には、当該アクセス要求をアーカイブ用PROXY12aに依頼する(ステップS504)。
このように、Webアーカイブ用フラグを「ON」に設定された場合には、ブラウザの当該ウィンドウおよびこのウィンドウから生成される子ウィンドウからのURL要求は、すべてアーカイブ用PROXYサーバ12に向けられるようになる。また、ブラウザ11が終了・再起動がおこなわれた場合には、このWebアーカイブ用フラグがクリアされることとなる。
一方、アクセス先ドメインが「http://ARCHIVE/view」ではなく、Webアーカイブ用フラグが「OFF」である場合(ステップS502否定かつステップS505否定)には、PROXY決定プロセス11aは、通常のインターネットの閲覧と判定して、当該アクセス要求を上位PROXY13に依頼する(ステップS506)。
このようにして、ブラウザ11におけるPROXY決定プロセス11aでは、上位PROXY(ファイアウォール)13およびアーカイブ用PROXY12aのいずれにアクセス要求を依頼するかを決定している。
次に、アーカイブ用PROXYの動作内容を説明する。図6は、アーカイブ用PROXYの動作内容を示すフローチャートである。同図に示すように、アーカイブ用PROXY12aは、ブラウザ11からアクセス要求を依頼された場合(ステップS601肯定)に、アクセス先のURLを読み込む(ステップS602)。
ここで、アクセス先URLのドメインが「http://ARCHIVE/」でない場合(ステップS603肯定)には、アーカイブ用PROXY12aは、要求対象となるWebページのオリジナルURL(収集前URL)またはオリジナルドメインの前にWebアーカイブ・サーバ20のURL「http://ARCHIVE/any/」を付加するURLリダイレクト処理をおこなった後(ステップS604)に、上位PROXY13にアクセス要求を依頼する(ステップS605)。
このように、要求対象となるWebページの収集前アドレスにWebアーカイブ・サーバのアドレスを付加するURLリダイレクト処理をおこなって、情報取得要求をWebアーカイブ・サーバに送信するように制御することで、ファイアウォールを経由するクライアント端末でも、ネットワーク上に存在する収集前アドレスへのアクセスをWebアーカイブ・サーバのアドレスへのアクセスに変更することができるようにしている。
なお、このアーカイブ用PROXY12aのURLリダイレクト機能をクライアント端末で完結しておこなうことも可能であるが、アーカイブ用PROXY12aのURLリダイレクト機能を内部ネットワークに配設された所望のサーバ装置でおこなわせることで、クライアント端末10に対応したWebアーカイブ・アクセス用ソフトウェアを各種OSごとにインストールする必要がなくなり、クライアント端末10の環境を変更せずともWebアーカイブにアクセスすることが可能になる。
Webアーカイブ・サーバ20は、Webロボットなどを用いて、インターネット上に存在するWebページをWebアーカイブ21に収集し、Webアーカイブ21に収集したWebページをクライアント端末10に提供するサーバ装置であり、本発明に密接に関連する機能部として、情報提供処理部22を備える。
この情報提供処理部22は、クライアント端末10から受信したWebページのオリジナルURL(収集前アドレス)および世代情報に対応するWebページをWebアーカイブ21から抽出し、該抽出したWebページをクライアント端末10に提供する処理部である。
ここで、図7〜図11を用いて、情報提供処理部22の動作内容を詳細に説明する。図7〜図11は、情報提供処理部22の動作内容を示すフローチャートである。図7に示すように、ブラウザ11からWebページの要求依頼データを受信したならば(ステップS701肯定)、この要求依頼データに含まれるCGI名が「view」であるか否かを識別する(ステップS702)。
ここで、Webページの要求依頼データに含まれるCGI名が「view」であった場合(ステップS702肯定)には、情報提供処理部22は、要求依頼データ(PATH_INFO)を、世代、オリジナルドメイン、オリジナルURIに分解する(ステップS703)。
そして、再取得制御部22aは、オリジナルドメインを宛先としたURLに、分解して得られた世代を「Cookie」に設定するCGIの指示コマンド「Set-DateInTheWebArchive」を埋め込み、該埋め込んだURL「http://オリジナルドメイン/Set-DateInTheWebArchive/世代/オリジナルURI」を「Location」として、オリジナルドメインへの再取得指示を送信する(ステップS704)。なお、このように、オリジナルドメインへの再取得指示をおこなうこととしたのは、オリジナルドメインで「Cookie」を発行するためである。
一方、Webページの要求依頼データに含まれるCGI名が「any」であった場合(ステップS702否定)には、図8に示すように、情報提供処理部22は、「Cookie」の情報、すなわち「date」(「Cookie」の世代情報)や「sated」(「Cookie」がセット済みの可否)を読み込む(ステップS801)。
そして、「Cookie」の情報が読み込んだ後に、情報提供処理部22では、要求対象のWebページが別ドメインに移動した場合でも世代情報を持ち回れるように、Webページの要求依頼データに含まれるCGIの機能名「Set-DateInTheWebArchive」「Set-Before-DateInTheWebArchive」「オリジナルURL」「Get-BeforeDateInTheWebArchive」、に応じた処理をおこなう。
これらのCGIの機能を簡単に説明する。「Set-DateInTheWebArchive」は、次回以降の参照時に世代情報を持ち回れるように、「Cookie」に世代を設定するとともに、オリジナルURLをカレントURLにするために「Location」をクライアント端末10に返すものである(図9参照)。また、「Set-Before-DateInTheWebArchive」は、URL中の世代を「Cookie」に設定し、オリジナルURLでの再取得指示をクライアント端末10に返すものである(図9参照)。
また、「オリジナルURL」は、「Cookie」に設定されている世代をもとに、オリジナルURLに示されるコンテンツ(Webページ)をWebアーカイブ21から抽出し、該抽出したコンテンツをクライアント端末10に返すものである(図10参照)。ただし、別ドメインのページからリンクをたどって遷移した場合には、クライアント端末10のブラウザ11が「Cookie」を渡さないため、指示コマンド「Get-BeforeDateInTheWebArchive」を遷移前のドメインを宛先にしたURLに埋め込み、該埋め込んだURLを「Location」として遷移前のドメインへの再取得指示をクライアント端末10に返すこととなる。
また、「Get-BeforeDateInTheWebArchive」は、遷移前のドメインから世代を取り出すとともに、遷移後のドメインで「Cookie」の設定をおこなうために遷移後のドメインへの再取得指示をクライアント端末10に返すものである(図11参照)。
図8の説明に戻り、CGIの機能名が「Set-DateInTheWebArchive」または「Set-Before-DateInTheWebArchive」である場合(ステップS802肯定)には、図9に示すように、情報提供処理部22は、要求依頼データ(REQUEST_URI)を分解してドメイン名、世代、URIを取り出す(ステップS901)。
そして、Cookie発行部22bは、世代(=DateInTheWebArchive)およびオリジナルドメイン(=domain)を「Cookie」に設定し(ステップS902)、「Cookie」に世代持込済フラグ=1を設定する(ステップS903)。その後、情報提供処理部22は、「http://オリジナルドメイン/オリジナルURI」を「Location」として、オリジナルURLへの再アクセスをクライアント端末10に指示する(ステップS904)。
一方、CGIの機能名が「オリジナルURL」である場合(ステップS802否定かつステップS803否定)には、図10に示すように、情報提供処理部22は、要求依頼データ(REQUEST_URI)を分解し、ドメイン名、URIを取り出し(ステップS1001)、また「HTTP_REFERER」から遷移元のドメインを取り出す(ステップS1002)。
このとき、遷移元のドメインがなく、かつ「Cookie」に世代(=DateInTheWebArchive)が設定されていなければ(ステップS1003肯定かつステップS1004肯定)、情報提供処理部22は、「Cookie」に世代が設定されていない旨をクライアント端末10にエラー通知する(ステップS1005)。
一方、遷移元のドメインがなくとも、「Cookie」に世代(=DateInTheWebArchive)が設定されていれば(ステップS1003肯定かつステップS1004否定)、情報提供処理部22は、ドメイン名、URIおよび世代に対応するコンテンツ(Webページ)をクライアント端末10に返却する(ステップS1006)。
また、遷移元のドメインが存在し、その遷移元のドメインとドメイン名が同一もしくは遷移元のドメインが「ARCHIVE」であり、かつ「Cookie」に世代(=DateInTheWebArchive)が設定されていなければ(ステップS1003否定、ステップS1007肯定かつステップS1008肯定)、情報提供処理部22は、「Cookie」に世代が設定されていない旨をクライアント端末10にエラー通知する(ステップS1009)。
一方、遷移元のドメインが存在し、その遷移元のドメインとドメイン名が同一もしくは遷移元のドメインが「ARCHIVE」であり、かつ「Cookie」に世代(=DateInTheWebArchive)が設定されていれば(ステップS1003否定、ステップS1007肯定かつステップS1008否定)、情報提供処理部22は、ドメイン名、URIおよび世代に対応するコンテンツ(Webページ)をクライアント端末10に返却する(ステップS1010)。
また、別ドメインから遷移し、かつ世代持込済フラグが「OFF」である場合(ステップS1003否定、ステップS1007否定かつステップS1011肯定)には、再取得制御部22aは、クライアント端末10のブラウザ11が「Cookie」を渡さないため、指示コマンド「Get-BeforeDateInTheWebArchive」を遷移前のドメインを宛先にしたURLに埋め込み、該埋め込んだURLを「Location」として遷移前のドメインへの再取得指示をクライアント端末10におこなう(ステップS1012)。
一方、別ドメインから遷移し、かつ世代持込済フラグが「ON」である場合(ステップS1003否定、ステップS1007否定かつステップS1011否定)には、情報提供処理部22は、「Cookie」に世代持込済フラグ=0を設定し(ステップS1013)、ドメイン名、URIおよび世代に対応するコンテンツ(Webページ)をクライアント端末10に返却する(ステップS1014)。
図8の説明に戻り、CGIの機能名が「Get-BeforeDateInTheWebArchive」である場合(ステップS802否定かつステップS803肯定)には、図11に示すように、情報提供処理部22は、要求依頼データ(REQUEST_URI)を分解して遷移元ドメイン名、遷移後のドメイン名、URIを取り出す(ステップS1101)。
このとき、「Cookie」に世代(=DateInTheWebArchive)が設定されていれば(ステップS1102否定)、再取得制御部22aは、遷移後のドメインを宛先としたURLに、「Cookie」に世代を設定するCGIの指示コマンド「Set-Before-DateInTheWebArchive」を埋め込み、該埋め込んだURL「http://遷移後のドメイン/Set-Before-DateInTheWebArchive/世代/オリジナルURI」を「Location」として、遷移後のドメインへの再取得指示をクライアント端末10におこなう(ステップS1103)。
また、「Cookie」に世代(=DateInTheWebArchive)が設定されていなければ(ステップS1102肯定)、情報提供処理部22は、「Cookie」に世代が設定されていない旨をクライアント端末10にエラー通知する(ステップS1104)。
上述してきたように、本実施例1に係る情報提供システム1によれば、世代情報の管理およびURLの挿げ替えを各装置(クライアント端末10およびWebアーカイブ・サーバ20)で分散しておこなうことができ、ファイアウォールを経由するクライアント端末やブロードバンドルータを経由したクライアント端末からでも、Webアーカイブ内に記憶された多種多様なWebページのリンクをたどることが可能になる。
また、本実施例1に係る情報提供システム1によれば、要求対象となるWebページのオリジナルURLにWebアーカイブ・サーバ20のアドレスを付加するURLリダイレクト処理をおこなって、Webページ取得要求をWebアーカイブ・サーバ20に送信するように制御するよう構成したので、ファイアウォールを経由するクライアント端末でも、ネットワーク上に存在する収集前アドレスへのアクセスをWebアーカイブ・サーバのアドレスへのアクセスに変更することが可能になる。
また、本実施例1に係る情報提供システム1によれば、Webアーカイブ・サーバ20がクライアント端末10によって要求対象として特定されたWebページのオリジナルドメインにWebページ取得要求を再度おこなうように指示して、当該Webページの世代情報が設定されたCookieをクライアント端末10に発行し、WebページのオリジナルURLおよび発行された「Cookie」の世代情報をWebアーカイブ・サーバ20に送信するように制御するよう構成したので、世代情報をCookieで持ち回ることができ、同一のIPアドレスから複数のアクセスがなされた場合でも、Webアーカイブを参照することが可能になる。
さらに、これに関連して、異なるドメインの別サーバ間で「Cookie」の持ち回りが可能となるため、例えば、インターネットショッピングサイトの分野にて、それまでは単独で存在していたサイトにて、本発明を利用して情報を共有することにより、ユーザが共通のサービス(スタンプラリー、ショッピングポイント等の共通化など)を受けることが可能となる。さらに、学習の分野においては、百科事典等のコンテンツを参照時に、その情報を別の辞書サイトと連携して、共通となる情報を表示したり、ユーザの固有情報(思考、嗜好など)を異なるサイトで共有することにより、よりユーザにあったサービスの提供が可能となる。
さて、これまで本発明の実施例について説明したが、本発明は上述した実施例1以外にも、上記特許請求の範囲に記載した技術的思想の範囲内において種々の異なる実施例にて実施されてもよいものである。
例えば、実施例1では、ネットワーク上に存在する収集前アドレスへのアクセスをWebアーカイブ・サーバのアドレスへのアクセスに変更するために、要求対象となるWebページのオリジナルURLにWebアーカイブ・サーバ20のアドレスを付加するURLリダイレクト処理をおこなうこととしたが、本発明はこれに限定されるものではなく、クライアント端末10のPROXYとして定義されたWebアーカイブ・サーバ20にWebページ取得対象を送信するように制御するようにしても良い。すなわち、これによって、Webアーカイブ・サーバ側でクライアント端末からのアクセスを一元管理することが可能になる。
また、本発明では、要求対象として特定されたWebページの世代情報をクライアント端末10に出力するように制御しても良い。例えば、Webアーカイブのナビゲーションや検索結果一覧HTML内に記述されたURLへのアクセスを検出した場合に、世代情報が描画されたウィンドウを表示する。なお、かかる世代情報を表示するウィンドウは、カレントなウィンドウと同一のものであっても良いし、別のウィンドウであっても良い。
すなわち、これによって、Webアーカイブに記憶されたWebページ出力時に世代情報を出力することができ、クライアント端末側でアクセス中のアーカイブの世代を容易に識別することが可能になる。
また、実施例1では、「Cookie」に世代情報そのものを設定した実施例について説明したが、本発明はこれに限定されるものではなく、「Cookie」に世代情報を特定できる管理情報(例えば、セッションID)を設定しておくことにより、実施例1と同様に、クライアント端末10およびWebアーカイブ・サーバ20で世代情報を識別可能にすることもできる。
また、本実施例において説明した各処理のうち、自動的におこなわれるものとして説明した処理の全部または一部を手動的におこなうこともでき、あるいは、手動的におこなわれるものとして説明した処理の全部または一部を公知の方法で自動的におこなうこともできる。この他、上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。さらに、各装置にて行なわれる各処理機能は、その全部または任意の一部が、CPUおよび当該CPUにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。
以上のように、本発明に係る情報提供方法および情報提供システムは、Webアーカイブ・サーバによってWebアーカイブに収集されたWebページを情報要求元の端末に提供する情報提供方法および情報提供システムに有用であり、ファイアウォールを経由するクライアント端末やブロードバンドルータを経由したクライアント端末からでも、Webアーカイブ内に記憶された多種多様なWebページのリンクをたどることが可能な情報提供方法および情報提供システムに適している。
図1は、本発明に係る情報提供システムの概要を説明するための概念図である。 図2は、本発明に係る情報提供システムの特徴を説明するための概念図である。 図3は、本発明に係る情報提供システムの処理動作を示すシーケンス図である。 図4は、本実施例1に係る情報提供システムの構成を示すシステム構成図である。 図5は、ブラウザにおけるPROXY決定処理の手順を示すフローチャートである。 図6は、アーカイブ用PROXYの動作内容を示すフローチャートである。 図7は、情報提供処理部の動作内容を示すフローチャートである。 図8は、情報提供処理部の動作内容を示すフローチャートである。 図9は、情報提供処理部の動作内容を示すフローチャートである。 図10は、情報提供処理部の動作内容を示すフローチャートである。 図11は、情報提供処理部の動作内容を示すフローチャートである。
符号の説明
1 情報提供システム
2 インターネット
3 情報公開機関
10 クライアント端末
11 ブラウザ
11a PROXY決定プロセス
12 アーカイブ用PROXYサーバ
12a アーカイブ用PROXY
13 ファイアウォール(上位PROXY)
14 ルータ
20 Webアーカイブ・サーバ
21 Webアーカイブ
22 情報提供処理部
22a 再取得制御部
22b Cookie発行部

Claims (3)

  1. Webアーカイブ・サーバによってWebアーカイブに収集されたWebページを情報要求元の端末に提供する情報提供方法であって、
    前記情報要求元の端末は、
    要求対象となるWebページの収集前アドレスおよび世代情報もしくは世代情報を特定できる管理情報を含む情報取得要求を前記Webアーカイブ・サーバに送信するように制御する送信制御工程を含み、
    前記Webアーカイブ・サーバは、
    前記送信制御工程によって送信されたWebページの収集前アドレスおよび世代情報もしくは世代情報を特定できる管理情報に対応するWebページを前記Webアーカイブから抽出し、該抽出したWebページを前記情報要求元の端末に提供する情報提供工程と、
    前記情報要求元の端末によって要求対象として特定されたWebページの収集前ドメインアドレスに前記情報取得要求を再度おこなうように指示して、当該Webページの世代情報もしくは世代情報を特定できる管理情報が設定されたCookieを前記情報要求元の端末に発行するCookie発行工程とを含み、
    前記送信制御工程は、前記Webページの収集前アドレスおよび前記Cookie発行工程によって発行されたCookieの世代情報もしくは世代情報を特定できる管理情報を前記Webアーカイブ・サーバに送信するように制御することを特徴とする情報提供方法。
  2. 前記情報要求元の端末および/または前記Webアーカイブ・サーバは、
    要求対象として特定されたWebページの世代情報もしくは世代情報を特定できる管理情報を前記情報要求元の端末に出力するように制御する出力制御工程をさらに含んだことを特徴とする請求項1に記載の情報提供方法。
  3. Webアーカイブ・サーバによってWebアーカイブに収集されたWebページを情報要求元の端末に提供する情報提供システムであって、
    前記情報要求元の端末は、
    要求対象となるWebページの収集前アドレスおよび世代情報もしくは世代情報を特定できる管理情報を含む情報取得要求を前記Webアーカイブ・サーバに送信するように制御する送信制御手段を備え、
    前記Webアーカイブ・サーバは、
    前記送信制御手段によって送信されたWebページの収集前アドレスおよび世代情報もしくは世代情報を特定できる管理情報に対応するWebページを前記Webアーカイブから抽出し、該抽出したWebページを前記情報要求元の端末に提供する情報提供手段と、
    前記情報要求元の端末によって要求対象として特定されたWebページの収集前ドメインアドレスに前記情報取得要求を再度おこなうように指示して、当該Webページの世代情報もしくは世代情報を特定できる管理情報が設定されたCookieを前記情報要求元の端末に発行するCookie発行手段とを備え、
    前記送信制御手段は、前記Webページの収集前アドレスおよび前記Cookie発行手段によって発行されたCookieの世代情報もしくは世代情報を特定できる管理情報を前記Webアーカイブ・サーバに送信するように制御することを特徴とする情報提供システム。
JP2007506933A 2005-03-07 2005-03-07 情報提供方法および情報提供システム Expired - Fee Related JP4648383B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2005/003890 WO2006095400A1 (ja) 2005-03-07 2005-03-07 情報提供方法および情報提供システム

Publications (2)

Publication Number Publication Date
JPWO2006095400A1 JPWO2006095400A1 (ja) 2008-08-14
JP4648383B2 true JP4648383B2 (ja) 2011-03-09

Family

ID=36953011

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007506933A Expired - Fee Related JP4648383B2 (ja) 2005-03-07 2005-03-07 情報提供方法および情報提供システム

Country Status (3)

Country Link
US (1) US20080222157A1 (ja)
JP (1) JP4648383B2 (ja)
WO (1) WO2006095400A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013098925A1 (ja) * 2011-12-26 2013-07-04 株式会社Murakumo 情報処理装置、情報処理システム、情報処理方法およびプログラム
JP5737469B1 (ja) * 2014-08-22 2015-06-17 富士ゼロックス株式会社 制御装置およびプログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09297703A (ja) * 1996-04-30 1997-11-18 Ekushingu:Kk 履歴管理機能付き情報端末装置
JP2002055869A (ja) * 2000-05-30 2002-02-20 Lucent Technol Inc ウェブ資源に対して恒久的アクセスを提供するインターネットアーカイブサービス
JP2002073609A (ja) * 2000-08-28 2002-03-12 Yafoo Japan Corp Webサイト情報の検索閲覧サービス方法およびシステム

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0979453A1 (en) * 1996-05-06 2000-02-16 Adobe Systems Incorporated Document internet url management
JP3765123B2 (ja) * 1996-06-12 2006-04-12 株式会社日立製作所 文書表示方法及び文書管理方法
US7765179B2 (en) * 1998-12-01 2010-07-27 Alcatel-Lucent Usa Inc. Method and apparatus for resolving domain names of persistent web resources
US6625624B1 (en) * 1999-02-03 2003-09-23 At&T Corp. Information access system and method for archiving web pages
US20020112020A1 (en) * 2000-02-11 2002-08-15 Fisher Clay Harvey Archive of a website
US7209977B2 (en) * 2001-10-01 2007-04-24 International Business Machines Corporation Method and apparatus for content-aware web switching
US7921226B2 (en) * 2004-07-20 2011-04-05 Alcatel-Lucent Usa Inc. User specific request redirection in a content delivery network
JP2008117322A (ja) * 2006-11-08 2008-05-22 Hitachi Ltd 情報提供システム及び情報提供方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09297703A (ja) * 1996-04-30 1997-11-18 Ekushingu:Kk 履歴管理機能付き情報端末装置
JP2002055869A (ja) * 2000-05-30 2002-02-20 Lucent Technol Inc ウェブ資源に対して恒久的アクセスを提供するインターネットアーカイブサービス
JP2002073609A (ja) * 2000-08-28 2002-03-12 Yafoo Japan Corp Webサイト情報の検索閲覧サービス方法およびシステム

Also Published As

Publication number Publication date
JPWO2006095400A1 (ja) 2008-08-14
US20080222157A1 (en) 2008-09-11
WO2006095400A1 (ja) 2006-09-14

Similar Documents

Publication Publication Date Title
JP3561139B2 (ja) ファイルオブジェクト中継方法、ファイルオブジェクト中継方法のプログラムを記録したコンピュータで読取り可能な記録媒体、およびゲートウェイ計算機
CN100468411C (zh) 复制和粘贴portlet的方法及系统
JP5885527B2 (ja) 印刷システム、印刷サーバ、制御方法およびコンピュータプログラム
US20140040778A1 (en) System and Method for Displaying and Operating Multiple Layered Item List In Web Browser With Support of Concurrent Users
US20080086540A1 (en) Method and system for executing a normally online application in an offline mode
CN104106048A (zh) 使用应用高速缓存来更新已安装应用的资源
US20140095980A1 (en) Method and system for displaying and operating multi-layers item list in browsers with supporting of concurrent multiple_users
CN111031128B (zh) 基于云端技术实现无天窗的网站IPv6改造的方法
JP2007164527A (ja) 情報処理システム、サーバ装置、情報処理装置及びそれらの制御方法
AU2019294343B2 (en) Intermediated retrieval of networked content
Qiao et al. NDNBrowser: An extended web browser for named data networking
CN114490383A (zh) 远程调试系统、远程调试方法、计算设备和可读介质
Wang et al. Using Node-HTTP-Proxy for Remote Experiment Data Transmission Traversing Firewall.
JP4186164B2 (ja) Web共有システム、Web共有方法、Web共有プログラム、中継サーバ、及びWWWブラウザ表示装置
JP5151696B2 (ja) ユニフォームリソースロケータ情報を書き換えるプログラム
JP4648383B2 (ja) 情報提供方法および情報提供システム
JP2010079796A (ja) 代理サーバならびにその制御方法およびその制御プログラム
JP2013103405A (ja) 画像処理システム、画像処理装置及びその制御方法、並びにプログラム
JP5774429B2 (ja) 通信装置および通信方法、ならびに、プログラム
WO2014030487A1 (ja) プロキシ・サーバならびにその動作制御方法およびその動作制御プログラム
US11533365B2 (en) System and method for displaying and operating multi-layered item list in web browser with supporting of concurrent users
White et al. A lightweight, scriptable, web-based frontend to the SRB
KR100637801B1 (ko) P2p 방식의 개인 홈페이지 서비스 시스템
Cucinella Mass Scale Lightweight Remote Desktop Environments for Educational Purposes
Zhangjin et al. A cgi+ ajax+ svg based monitoring method for distributed and embedded system

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100615

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100816

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100914

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101112

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101207

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101209

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131217

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees