JP2000194644A - ウエブ資源に持続的にアクセスするための方法および装置 - Google Patents

ウエブ資源に持続的にアクセスするための方法および装置

Info

Publication number
JP2000194644A
JP2000194644A JP11341725A JP34172599A JP2000194644A JP 2000194644 A JP2000194644 A JP 2000194644A JP 11341725 A JP11341725 A JP 11341725A JP 34172599 A JP34172599 A JP 34172599A JP 2000194644 A JP2000194644 A JP 2000194644A
Authority
JP
Japan
Prior art keywords
electronic document
version
web
timestamp
time stamp
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Abandoned
Application number
JP11341725A
Other languages
English (en)
Inventor
Ping-Wen Ong
オン ピン−ウェン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia of America Corp
Original Assignee
Lucent Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lucent Technologies Inc filed Critical Lucent Technologies Inc
Publication of JP2000194644A publication Critical patent/JP2000194644A/ja
Abandoned legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9566URL specific, e.g. using aliases, detecting broken or misspelled links
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer And Data Communications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

(57)【要約】 (修正有) 【課題】 ウエブ資源にパシステント(持続的)にアク
セスするための方法および装置。 【解決手段】 パシステントウエブサーバは、(1)タ
イムスタンプを含むURLを受信し、(2)タイムスタ
ンプを抽出し、(3)それが存在する 場合は、リクエ
ストされたタイムスタンプに対応するウエブページを取
り出し、リクエストされたタイムスタンプに対応するウ
エブページのバージョンが存在しない場合は、リクエス
トされた標的(ターゲット)時間の時間的に近傍に格納
されているウエブページのバージョンを取り出し、
(4)該当するページをクライアントに送り返す。パシ
ステントウエブサーバは、ウエブ資源の全てのバージョ
ンを格納するためのパシステント(持続的)アーカイブ
を備え、ウエブユーザはこれら全てのバージョンに持続
的にアクセスすることが可能になる。

Description

【発明の詳細な説明】
【0001】
【関連する特許出願】本発明は、本発明と同時に出願さ
れ、本発明の譲受人に譲渡された、以下の合衆国特許出
願、つまり:“A Method And Apparatus For Persisten
t Storage ofWeb Resources(ウエブ資源を持続的に保
存するための方法および装置)”(Attorney Docket Nu
mber Ong 8)、“A Method And Apparatus For Persist
ent Access to Web Resources Using Relative Time-St
amps(ウエブ資源に相対タイムスタンプを用いて持続的
にアクセスするための方法および装置)”(Attorney D
ocket Number Ong 10)、および“A Method And Appara
tus For Resolving Domain Names of Persistent Web R
esources(持続的ウエブ資源のドメイン名を解決するた
めの方法および装置)”(Attorney Docket Number Ong
11)とも関連するために、これらについても参照され
たい。
【0002】
【発明の属する技術分野】本発明は、インターネット資
源へのアクセス技法、より詳細には、インターネット資
源への持続的な(パシステントな)なアクセスを確保す
るための方法および装置に関する。
【0003】
【従来の技術】World Wide Web(“ウエブ(Web)”)
は、莫大な量の情報を提出および配布するためのダイナ
ミック(動的)な方法を提供する。ウエブ上の情報に
は、インターネットに接続されており、例えば、Netsca
pe Communications Corporationof Mountain View,CA.
から市販されるNetscape Navigator CommunicatorTM
どのブラウザを所有する人なら誰でもアクセスすること
ができる。ウエブは多数の媒体オプションをユーザに提
供する。ウエブは、当初は、主としてパーソナルコンピ
ュータを介してのアクセスに限られていたが、最近で
は、普遍的にますます多様なパーソナル電子デバイスか
ら利用(アクセス)できるようになりつつある。加え
て、ディスプレイ技術も絶えず進歩しており、ウエブ
は、終局的には、従来のペーパベースの媒体に完全に取
って代ることも予測される。
【0004】ペーパベースの媒体は、通常は、関連する
タイムスタンプを持ち、過去のある任意の時点において
提出された情報を簡単に調べることができる。例えば、
新聞の記事は、その新聞の特定の出版日を指定すること
ができれば、信頼できるリファレンス(参照資料)とし
て引用することができる。ただし、ウエブの内容(コン
テント)は、ダイナミックな(動的な/可変的な)性格
を持ち、このため、ウエブのドキュメントは、通常は、
信頼できる参照源とはならない。つまり、現時点では、
ウエブの内容は、将来の任意の時点で同一の形式にて存
在し、これに、将来も引き続いて、同一の均一資源ロケ
ーター(Uniform Resource Locator,“URL”)にて、
持続的にアドレス(アクセス)できるという保証はな
い。つまり、幾つかのウエブサイトは、幾らかのアーカ
イブ(長期保存)ウエブドキュメントへのアクセスを提
供するが、ただし、ユーザは、これら過去のウエブドキ
ュメントに、たとえ可能であったとしても、一貫した予
測可能なやり方でアクセスすることはできない。
【0005】非営利のコンピュータライブラリサービス
およびリサーチ機関であるオンラインコンピュータライ
ブラリセンター(Online Computer Library Center,In
c.,“OCLC”)は、一般インターネット資源に対するイ
ンターネットアドレスおよび別名を管理するためのOC
LC PURL(“Persistent Uniform Resource Loca
tor")と呼ばれるソフトウエアツールを提供する。持続
的均一資源ロケーター(PURL)は、インターネット
資源に、高信頼に、長期間に渡って、最小の保守にて、
アクセスできることを保証するために、インターネット
資源に対するフレキシブルなネーミング(名前の指定)
および名前解決(翻訳)サービスを提供する。概略的に
は、OCLC PURLは、ウエブ資源をどこに保存す
べきかについての助言をインターネットユーザに与え
る。ただし、上述のように、インターネットは、絶え
ず、拡張および変化を続けている。そして、いったん、
均一資源ロケーター(URL)が変更されると、そのU
RLを用いての以前の全ての参照(アクセス)は無効と
なり、ユーザは、もはや、そのインターネット資源には
アクセスできなくなる。しかも、これら変更の管理は、
しばしば、非常に煩雑となる。
【0006】
【発明が解決しようとする課題】均一資源ロケーター
(URL)は、インターネット資源の位置(ロケーショ
ン)を直接にポイントするが、持続的均一資源ロケータ
ー(Persistent Uniform Resource Locator,“PURL”
)は、PURLを実際のURLに翻訳する中間のアド
レス解決(翻訳)サービスをポイントする。いったん、
ウエブ資源がOCLCに登録され、PURLを割り当て
られると、そのウエブ資源はPURLを介してアクセス
することが可能になる。PURLは、ある資源に、その
資源の位置が変わった場合でも、パシステント(持続
的)な名前を割り当てる。こうして、ウエブ資源および
他の資源内で参照されるPURLは、時間がたっても持
続的に有効となり、ウエブ資源が移動される度にその参
照を更新する必要はなくなる(PURLは持続的なもの
となり、ウエブ資源が移動された場合でも、同一のPU
RLを用いて同一のウエブ資源および他の資源の内容に
アクセスすることが可能になる)。ただし、OCLCに
よって維持されるPURL“転送(forwarding)”アド
レスは、常に、更新された状態に維持することを必要と
される。換言すれば、現状では、ドキュメントを移動す
る度に、OCLCに、そのドキュメントの新たなアドレ
スを通知することが要求される。
【0007】
【課題を解決するための手段】本発明は、一般的には、
ウエブ資源へのパシステント(持続的)なアクセスを提
供するための方法および装置に関する。本発明の一面に
よると、ウエブ資源を識別するための均一資源ロケータ
ー(“URL”)が、オプションとして、タイムスタン
プを含むように強化される。このタイムスタンプは、
“URL”内に、任意の適当な形式にて指定することが
できる。本発明は、ウエブ(資源)を、ペーパベースの
媒体と殆ど同様な、編成された、信頼できる参照源とす
ることを可能にする。
【0008】本発明に一面によると、ウエブブラウザお
よびウエブサーバが開示されるが、これらは、タイムス
タンプパラメータを収容し、ユーザが、明確な標的(タ
ーゲット)時間にて、任意のウエブアドレスを参照する
ことを可能にする。リクエストされた時間に対応するウ
エブ資源のバージョンが存在しない場合は、リクエスト
された標的(ターゲット)時間の時間的に近傍に格納さ
れているドキュメントのバージョンが提供される。例え
ば、本発明の一つの実施例においては、このような場
合、ウエブ資源は前にアーカイブされたバージョンから
変更されてないものと想定され、リクエストされた時間
の前の最も最近のタイムスタンプを持つウエブ資源のバ
ージョンが提供される。もう一つの実施例においては、
リクエストされた時間の直後のタイムスタンプを持つウ
エブ資源のバージョンが提供される。開示されるウエブ
ブラウザは、オプションとして、所望の日時の指定を容
易にする機構を備えることも、あるいは、ユーザが、手
操作にて、タイムスタンプを、URLに、ブラウザの
“ロケーション(Location)”ウインドウに指定される
ように付加するようにすることもできる。
【0009】パシステント(持続的)ウエブサーバは、
(1)タイムスタンプを含むURLを受信し、(2)それ
が存在する場合は、リクエストされたタイムスタンプに
対応するウエブページを取り出し、リクエストされたタ
イムスタンプに対応するウエブページのバージョンが存
在しない場合は、リクエストされた標的(ターゲット)
時間の時間的に近傍に格納されているウエブページのバ
ージョンを取り出し、(3)該当するページをクライア
ントに送り返す。パシステント(持続的)ウエブサーバ
は、抽出されたURLを選択されたタイムスタンプフォー
マットに従って翻訳する。加えて、パシステントウエブ
サーバは、ウエブ資源の全てのバージョンを格納するた
めのパシステント(持続的)アーカイブを備え、ウエブ
ユーザはこれら全てのバージョンに持続的にアクセスす
ることが可能になる。こうして、本発明は、任意のウエ
ブ資源へのタイムスタンプを持つ参照が、所望の資料を
参照することを保証する。こうして、ウエブ上で歴史的
な(過去の)調査を行なっている人が、任意の時間期間
に対応する情報を(有効なものとして)取り出すことが
可能となる。
【0010】
【発明の実施の形態】図1は、インターネットあるいは
World Wide Web(“ウエブ(Web)”)環境130を通
じて一つあるいは複数のパシステント(持続的)ウエブ
サーバ140、150からの情報にアクセスする本発明
によるウエブブラウザ100を示す。本発明は、テキス
ト、オーディオ、ビデオ、アニメーションドキュメント
などを含むウエブ資源、すなわち電子ドキュメントへの
パシステントなアクセスを提供する(過去のドキュメン
トにも持続的にアクセスできるようにする)。本発明の
一つの実施例なおいては、ウエブ資源を識別する均一資
源ロケーター(“URL”)が、タイムスタンプを含む
ように強化される。ウエブブラウザ100およびパシス
テントウエブサーバ140、150は、追加のタイムス
タンプパラメータを備え、こうして、ユーザは、特定の
目標日付を持つ任意のウエブアドレスを参照することが
可能となる(過去の任意の特定の日付のウエブ資源にア
クセスすることが可能になる)。例えば、“http://cn
n.com?time=2+2+1997”なるURLは、1997年2月
2日付けのCNNホームページのウエブ内容(コンテン
ト)を指定する。このようにして、ウエブは、編成され
た、しかも、ペーパベースの媒体と同程度に信頼できる
参照源となり得る。
【0011】一例としてのタイムスタンプのフォーマッ
ト タイムスタンプは、“URL”内に任意の適当なフォー
マットにて含めることができる(この方法は当業者にお
いては明白であると思われる)。例えば、www.Lucent.c
omのウエブページの1998年2月2日の時点での内容
を参照する(にアクセスする)ためには、URLは、以
下のように表される: http://www.lucent.com?time=2+2+1998 もう一つのバリエーションとして、追加の時間粒度(よ
り詳細な時間の指定)を、URL内に特定の日の時刻を
含めることで、指定することもできる。例えば、www.Lu
cent.comのウエブページの1998年2月2日1:23.p.m
の時点での内容にアクセスするためには、URLは、以
下のように表される: http://www.lucent.com?time=13+23+2+2+1998 特に改めて指定されない限り、時間帯は、ユーザの省略
時の時間帯であるものと想定される。上述の一例として
のタイムスタンプのフォーマットは、Commom Gateway I
nterface(CGI)による探索引数に従う。勿論、月、
日、年(あるいは他の時間単位)は、任意の順番で表す
ことができる。URLがタイムスタンプを持たない場合
は、省略時の値は、最も最新のバージョンとなる。
【0012】加えて、相対タイムスタンプを用いること
もできる。例えば、www.Lucent.comのウエブページの昨
日の時点での内容にアクセスするためには、URLは、
以下のように表される: http://www.lucent.com?time=yesterday さらに、埋め込まれたハイパーリンクが相対タイムスタ
ンプを含む場合は、その相対タイムスタンプは現在のウ
エブページに基づくこととなる。つまり、現在のウエブ
ページが: http://www.lucent.com?time=1998_1_10 なる形式のURLを持ち、さらに、このページが: http://www.lucent.com?time=yesterday なる形式の埋め込まれたハイパーリンクを持つ場合、ブ
ラウザおよびサーバは、そのURLを: http://www.lucent.com?time=1998_1_9 なる形式を持つものと解釈および翻訳することとなる。
【0013】他の相対タイムスタンプとして、現在のウ
エブページの時刻からの時間オフセットを含めること
も、例えば、指定された時間期間を足したり、引いたり
することも考えられる。この方法では、例えば、“+10
D”は、現時点で見られるウエブページの日付に10日
を加えた時刻(日付)を示すこととなる。
【0014】あるドキュメントより(現ドキュメントの
タイムスタンプを起点として)前にあるいは後にアーカ
イブ(保存)されたバージョンを参照する(にアクセス
する)ために、“next_archive”、あるいは“previous
_archive”なるラベルを用いてURLを表すこともでき
る。この場合は、サーバは、アーカイブを通じて(内
を)所望のドキュメ ントが見つかるまで探索すること
となる。例えば、現在見ているドキュメントが: http://www.lucent.com/doc.html?rtime=1997_5_12 なる形式のURLを持ち、同一のドキュメントの7/2/9
7、6/1/97、4/1/97および3/1/97なる年月日にアーカイ
ブ(保存)された異なるバージョンが存在する場合は、
現ドキュメント内に以下のリンクを用いることで、これ
ら記録の一つを参照(一つにアクセス)することができ
る: doc.html?rtime=next_archive このような相対アーカイブタイムスタンプを用いると、
同一ドキュメントの異なるバージョン間での移動がより
効率的になる。
【0015】ここで、“リクエスト・ヘッダスキーム
(request-header scheme)”と呼ばれるもう一つの実
現においては、タイムスタンプは、HTTPリクエスト
ヘッダの一つとして、例えば: Time-Stamp:June 9,1998 なる形式にて表される。
【0016】ここで、“専用文字スキーム(special ch
aracter scheme)”と呼ばれるもう一つの実現において
は、URL内に含まれるタイムスタンプを示すために、
専用文字が以下のように用いられる: http://www.cnnfn.com;time=2+2+1998&timezone=server
【0017】ウエブサーバ ウエブブラウザ100は、従来のブラウザ、例えば、Mi
crosoft Internet ExplorerTMあるいはNetscape Naviga
torTMとして実現し、これを本発明の特徴および機能を
組み込むように修正することが考えられる。後に詳細に
説明するように、ウエブブラウザ100は、単に、ユー
ザが所望の日時を指定できるように、新たなオプション
選択パネルを組み込むことのみを必要とされる。実際、
従来のウエブブラウザ100を利用し、ユーザが、手操
作にて、タイムスタンプをURLに、ブラウザ100の
“Location”ウインドウに従って付加するようにするこ
ともできる。
【0018】一つの実現においては、ユーザは、タイム
スタンプをターンオンあるいはオフするオプションを有
する。タイムスタンプが起動されている場合は、ブラウ
ザ100は、URLに必要な変更を加えたうえで、UR
Lをウエブ130に送る。対応するウエブサーバ14
0、150がタイムスタンプを認識できるという保証は
なく、このため、サーバ140、150によって送り返
されるドキュメントに含まれる埋め込まれたハイパーリ
ンクがタイムスタンプを含まないことも考えられる。こ
のため、このような状況においては、ウエブブラウザ1
00が、タイムスタンプオプションが起動されている場
合は、ユーザがそのハイパーリンクをクリックした際
に、埋め込まれているハイパーリンクと関連するURL
を自動的に変換し、適当なタイムスタンプを付加するよ
うにすることが考えられる。このため、ウエブブラウザ
100は、URLを選択されたタイムスタンプフォーマ
ットに従って変換できる必要がある。リクエスト・ヘッ
ダスキームを用いる実現では、ブラウザ100を、専用
のリクエストヘッダ(例えば、“Time-Stamp:June9,199
8”)を送信できるように修正する必要がある。加え
て、HTMLを、特定のタイムスタンプを持つ任意の埋
め込まれたハイパーリンクに対して、新たなタイムスタ
ンプタグを含むように修正する必要がある。例えば: <A HREF=“www.lucent.com">Lucent Web Site</A> なる形式を持つハイパーリンに対しては、HTMLを、
1998年2月2日なるタイムスタンプを示すように、
以下のように修正する必要がある: <A HREF=“www.lucent.com"><TIMESTAMP TIME="2+2+19
98” TIMEZONE=server><TIMESTAMP>Lucent Web Site</A>
【0019】パシステント(持続的)ウエブサーバ パシステント(持続的)ウエブサーバ140、150
は、従来のハードウエアおよびソフトウエアとして実現
し、以下に説明する機能および動作を遂行するように修
正することが考えられる。より具体的には、パシステン
トウエブサーバ140、150は、(1)タイムスタン
プを含むURLを受信すること、(2)タイムスタンプを
抽出すること、(3)それが存在する場合は、リクエス
トされたタイムスタンプに対応するウエブページを取り
出し、リクエストされたタイムスタンプに対応するウエ
ブページのバージョンが存在しない場合は、リクエスト
された標的(ターゲット)時間の時間的に近傍に格納さ
れているウエブページのバージョンを取り出すこと、
(4)リクエストされたウエブページを修正すること
で、埋め込まれたハイパーリンクをリクエストされたウ
エブページと同一のタイムスタンプを含むように更新す
ること、および(5)要求されたページをクライアント
に送り返すことができる必要がある。さらに、パシステ
ントウエブサーバ140、150は、抽出されたURL
を、選択されたタイムスタンプフォーマットに従って分
析できる必要がある。
【0020】リクエストされた時間に対応するウエブ資
源のバージョンが存在しない場合は、リクエストされた
標的(ターゲット)時間の時間的に近傍に格納されてい
るドキュメントのバージョンが提供される。例えば、本
発明の一つの実施例においては、このような場合、ウエ
ブ資源は前にアーカイブされたバージョンから変更され
てないものと想定され、リクエストされた時間の前の最
も最近のタイムスタンプを持つウエブ資源のバージョン
が提供される。もう一つの実施例においては、リクエス
トされた時間の直後のタイムスタンプを持つウエブ資源
のバージョンが提供される。
【0021】加えて、パシステントウエブサーバ14
0、150は、それらが扱ったウエブの過去の全ての情
報を保存できる必要がある。このため、図1に示すよう
に、各パシステントウエブサーバ、例えば、パシステン
トウエブサーバ140、150は、それぞれ、ウエブ資
源の全てのバージョンを、それらがウエブユーザによっ
て持続的に利用できるように、格納するためのパシステ
ント(持続的)アーカイブ145、155を備える。こ
れらパシステントアーカイブ145、155は、どのよ
うなメモリデバイスを用いて実現することもできるが、
ただし、好ましくは、CD−ROM、CR−R、WOR
M、DVD−ROMなどの持続的な(消去不能な)メモ
リデバイスが用いられる。
【0022】パシステントウエブサーバ140、150
にて日付を持つURLをサポートするためには、パシステ
ントウエブサーバ140、150は、それらの全内容
(コンテント)を、それらがいつでも取り出せるよう
に、年代順に格納する必要がある。図2に示す一つの実
現においては、パシステントアーカイブ145、155
は、ウエブサイトの全内容を、永久メモリデバイスに、
ある種の年代順ダイレクトリ構造に従って格納する。図
2は、ウエブサイトの内容を年代順に配列するダイレク
トリ構造200を示す。このダイレクトリ構造200内
のおのおのの葉、例えば、葉210は、ある日付(ここ
では、1998年6月26日)を持つURLに対応する。
例えば: http://www.nytimes.com?time=24+2+1998 なる日付を持つURLは、概念的に: http://www.nytimes.com/archive/1998/2/24/ と等しい。
【0023】勿論、ウエブサイトの全内容を格納するこ
とは、メモリの利用の観点からは効率が悪い。多くのウ
エブページは、あったとしても、毎日、少ししか変更さ
れない。このため、単にアーカイブから冗長を除去する
ことで、メモリ効率を大幅に向上させることができる。
いったん冗長が除去されれば、正規のウエブサイトメモ
リに追加されるべきメモリ要件は、通常は、それほどは
大きくはならない。
【0024】図3は、パシステントアーカイブ145、
155の冗長を低減するためのアーカイブプロセス30
0を示す。このアルゴリズムにおいて言及される全ての
ファイルあるいはサブダイレクトリは、図2の一例とし
てのダイレクトリ構造200のアーカイブサブダイレク
トリ220の下に来ることに注意する。図3に示すよう
に、アーカイブプロセス300は、最初に、ステップ3
10において、各サブダイレクトリ、例えば、サブダイ
レクトリAに対して、それより以前に作成され、サブダ
イレクトリAと同一の内容を持つサブダイレクトリBが
存在するか否かを決定するためのテストを遂行する。ス
テップ310において、それより以前に作成され、サブ
ダイレクトリAと同一の内容を持つサブダイレクトリB
は存在しないことが決定された場合は、サブダイレクト
リレベルでは、パシステントアーカイブ145、155
の冗長を低減することはできず、プログラム制御は、ス
テップ330に進む。
【0025】他方、ステップ310において、それより
以前に作成され、サブダイレクトリAと同一の内容を持
つサブダイレクトリBが存在することが決定された場合
は、ステップ320において、サブダイレクトリAが、
サブダイレクトリBをポイントする別名(代替入口点/
代替名)となる。例えば、図4Aに示すように、ウエブ
サイトの現在(今日)の内容が昨日の内容と同一である
場合は、今日に対して昨日のサブダイレクトリをポイン
トする別名が生成され、同様に、図4Bに示すように、
今月の内容が先月の内容と同一である場合は、今月に対
して先月のサブダイレクトリをポイントする別名が生成
される。
【0026】その後、ステップ330において、各ファ
イル、例えば、ファイルAに対して、それより以前に作
成され、ファイルAと同一の内容を持つファイルBが存
在するか否か決定するためのテストが遂行される。ステ
ップ330において、それより以前に作成され、ファイ
ルAと同一の内容を持つファイルBは存在しないことが
決定された場合は、ファイルのレベルでパシステントア
ーカイブ145、155の冗長を低減することはできな
い。このため、プログラム制御は、ステップ350にお
いて終結する。
【0027】他方、ステップ330において、それより
以前に作成され、ファイルAと同一の内容を持つファイ
ルBが存在することが決定された場合は、ステップ34
0において、ファイルAがファイルBをポイントする別
名となる。その後、プログラム制御は、ステップ350
において終結する。
【0028】アーカイブプロセス300は、これが多数
の(一致する)ファイルあるいはダイレクトリを探索す
る必要があるために、現実的でなくなることも考えられ
る。つまり、このプロセスの実行時間は、アーカイブ内
のエンティティの数と共に指数関数的に増大することと
なる。当業者においては明白なように、これに対する多
くの次善の解決策が可能である。一つの極めて単純な解
決策においては、単に、今日アーカイブしたいものが、
最も最近に追加されたアーカイブ(例えば、昨日の内
容)に対してチェックされる(と比較される)。殆どの
ウエブサイトは、以前にアーカイブされたものと僅かし
か違わないために、このアプローチはかなり妥当なもの
となる。このアプローチは、周知のファイルシステムの
増分バックアップと類似する。
【0029】ウエブサーバがパシステントウエブサーバ
でない場合でも、その影響を最小限に押さえることが要
求される。このために、一つの実現においては、リクエ
ストがタイムスタンプを含むが、あるウエブサーバがそ
のタイムスタンプを認識できない場合、そのウエブサー
バは、リクエストされたウエブ資源の最も最近のバージ
ョンを送り返すようにされる。
【0030】パシステントアーカイブのメモリ要件を低
減するためのもう一つの方法として、ウエブサーバを、
正しいアーカイブされたデータを探索できるという観点
で、よりスマートなものにすることが考えられる。例え
ば、あるウエブ資源のパシステントな(持続的な)記録
は、そのウエブ資源の前に保存されているバージョンと
幾らか異なるバージョンのみに制限することが考えられ
る。例えば、あるアーカイブがウエブ資源の次のような
5つの異なるバージョン、つまり、6/4/1996、6/12/199
6、3/23/1997、2/1/1998、2/3/1998を含み、リクエスト
された日付がこれらアーカイブされているどのバージョ
ンとも等しくない場合、ウエブサーバは、そのリクエス
トされた日付は、それより前の最も最近の日付を持つバ
ージョンと同一であるものと想定することが考えられ
る。加えて、あるダイレクトリ内に専用のシンボルリン
ク(あるいは、MacOS上の別名、あるいは、MS Windows
上のショートカット)を用いることで、現在のダイレク
トリの下に見つけることができないファイルあるいはダ
イレクトリを探索すべき場所を表し、こうして、該当す
るダイレクトリの下には、変更された部分のみを格納す
ることも考えられる。変更されてない全てのデータは、
このような専用のリンクの連鎖を通じて参照することが
できる。
【0031】パシステント(持続的)DNSサーバ パシステント(持続的)ドメイン名サーバ(domain nam
e server、DNS)は、従来のハードウエアおよびソフト
ウエアとして実現し、以下に説明する機能および動作を
遂行するように修正することが考えられる。従来のDN
Sサーバは、任意のドメイン名参照を、それらがDNS
データベース内に存在しない場合、拒否する。本発明に
よる日付を持つURLの一つの長所は、これを(URL
を)、過去のウエブ資源を参照(にアクセス)するため
にも用いることができることである。例えば、従来の方
法では、会社Aが会社Bに併合された場合、“www.A.co
m"を通じて参照(アクセス)される全てのウエブページ
はもはや無効となる。つまり、ユーザが会社Aに関する
ドキュメントにアクセスすることを希望する場合、ユー
ザは、全ての参照を会社Bのウエブサイトのどこかに変
更することが必要となる。
【0032】ただし、会社Aの過去の情報は、DNSサ
ーバが、会社Aの名前での参照(アクセス)を拒否する
ことなく、代わりに、会社Aの過去の情報がどこに存在
するかを知っているアーカイブサービス会社に相談(照
会)するようにすれば、アクセスすることが可能とな
る。DNSサーバ自身も、名前をIPアドレスに解決
(翻訳)するプロセスをより迅速にするための幾らかの
過去のデータを格納する。図5A〜図5Bは、DNSサ
ーバデータベースに格納されるデータの一例を、それぞ
れ、会社AとBが併合する前と後について示す。この方
法では、図5Bに示すように、ユーザが併合の後に、ww
w.A.comについて知りたいと希望した場合でも、DNS
サーバは、ユーザのリクエストを会社Bと関連する新た
なIPアドレスに再ダイレクトするための十分な情報を
持つ。データベース内にリストされている日付は、対応
するドメイン名が有効である期間を表す。図面の例で
は、“www.A.com. 2/2/1999"なる日付を持つドメイン名
参照は無効であり、“www.A.com.2/2/1992"なる日付の
場合は有効であることが示される。
【0033】図6は、本発明によるDNSサーバプロセ
ス600を示す。図6に示すように、DNSサーバプロ
セス600は、最初に、ステップ610において、ドメ
イン名リクエストを受信する。次に、ステップ620に
おいて、ドメイン名リクエストが日付を持つか否かを決
定するためのテストが遂行される。ステップ620にお
いて、ドメイン名リクエストが日付を持たないことが決
定された場合は、ステップ630において、通常の名前
探索結果が送り返される。
【0034】反対に、ステップ620において、ドメイ
ン名リクエストが日付を持つことが決定された場合は、
DNSサーバプロセス600は、ステップ640におい
て、DNSデータベースを、そのドメイン名を求めて、
その日付の制約内で探索する。次に、ステップ650に
おいて、その日付を持つドメイン名が見つかったか否か
決定するためのテストが遂行される。ステップ650に
おいて、目的の日付を持つドメイン名が見つからなかっ
たことが決定された場合は、DNSサーバは、ステップ
660において、さらなる探索のために、アーカイブサ
ービス会社に相談し、その後、プログラム制御は、ステ
ップ670に進む。
【0035】一方、ステップ650において、目的の日
付を持つドメイン名が見つかったことが決定された場合
は、ステップ670において、探索結果が送り返され
る。このとき、再リダイレクトの場合は、その指標も送
り返される。その後、プログラム制御は終結する。
【0036】ドメイン名がDNSサーバによって解決
(翻訳)された後、ウエブブラウザ100は、DNSサ
ーバから送り返されたものに従ってリクエストをウエブ
サーバ140、150に送信する必要がある。例えば、
ユーザからのリクエストが、“http://www.A.com?time=
2+2+1992"なる形式のURLである場合、ブラウザ10
0は、DNSサーバにドメイン名解決リクエストを“ww
w.A.com 2/2/1992"なる形式で送信する。説明の例で
は、会社Aは、現在は会社Bの一部であるために、(図
5Bに示すように)結果として、“123.2.3.222redirec
t"が送り返される。こうして、ウエブブラウザ100
は、現在、サーバのIPアドレスを入手しており、それ
が、再ダイレクトアドレスであることも知っている。こ
うして、ウエブブラウザ100は、結果として、会社B
のウエブサーバ140、150にリクエストを“http:/
/123.2.3.222?http://www.A.com?time=2+2+1992"なる形
式にて送信する。会社Bのウエブサーバ140、150
は、正しい(該当する)情報を得るために、どのように
すれば、会社Aのこの古いアドレスを適当な位置にマッ
ピングすることができるか知っている。
【0037】この新たなDNSの一つの副次的な長所
は、幾つかの名前は、それらが一旦過去のものとなった
ら、再使用できることである。例えば、会社Aという名
前を持つもう一つの会社が、所定の期間の後に、DNS
データベースを以下のエントリにて更新することで、ww
w.A.comなるドメイン名を用いることが可能となる:
【表1】 このようにして、ドメイン名を、無駄にすることなく、
再利用することが可能となる。
【0038】ダイナミックなウエブ内容へのパシステン
トなアクセス こうして、ウエブは、ダイナミックな(動的に変化す
る)内容(コンテント)で一杯となる。これら内容(コ
ンテント)には、WebCamなどからのリアルタイムビデオ
や、WebCastイベントなどからのオーディオストリーム
や、Java、Javascript、あるいはActive-X起動のウエブ
ページなどが考えられる。アプリケーションによって
は、一連のダイナミックな内容を保存することは必要と
されない、若しくは、要求されず、加えて、ウエブペー
ジの全ての広告部分は、保存することは必要とされな
い、若しくは、要求されない。
【0039】例えば、銀行や証券会社の取引データなど
の年代順のデータでは、記録の一部分のみを、与えられ
たタイムスタンプの制約内で抽出することができる。例
えば、ある日付における残高をチェックするためには、
ブラウザ100は、リクエストを以下のような形式にて
送信する: http://bank.com/?id=1234&time=2+3+1998 サーバ140、150は、単に、データを1998年3
月2日まで検索あるいは再計算し、結果を送り返すこと
のみを必要とされる。このようなアプリケーション環境
においては、全ての取引はもともとタイムスタンプを持
つために、サービスにこの機能を追加することは極めて
簡単である。
【0040】リアルタイムな内容(コンテント)に対し
ては、タイムスタンプを付加することの唯一の制約は、
メモリ要件である。保存すべき情報の量に対して多くの
メモリ空間が利用できる場合は、ウエブサイトの管理者
は、全てのリアルタイム内容を保存することを選択し、
メモリ空間が十分でない場合は、それらの幾らかを、例
えば、1日分、1週間分、あるいは1年分のデータを保
存することを選択することが考えられる。
【0041】ダイナミックに生成される宣伝に対して
は、ウエブサイトの管理者は、(特別な理由により)古
い広告を‘再提示(reshow)’することが適当である
か、あるいは、‘実際の(real)’アーカイブされてい
るウエブ内容とは特に関係ない古い広告を新たな最新の
コマーシャルと置換すべきか否かを決定することを要求
される。
【0042】ウエブページ上でダイナミックに実行され
るスクリプトについては、2つの可能な状況が考えられ
る。そのスクリプトが時間とともに変化しない場合は、
そのスクリプトは安全に保存することができるが、その
スクリプトの挙動が時間とともに変化する場合、例え
ば、クロックやカレンダーディスプレイである場合は、
そのスクリプトは、日付を持つURLを扱うように修正
することを必要とされ、Java、JavascriptあるいはActi
ve-X標準に適当な修正を施すことが必要となる。CGI
アプリケーションによって動的に生成されるウエブペー
ジについても同様である。
【0043】以上、本発明について説明したが、説明の
実施例およびバリエーションは単に本発明の原理を解説
するためのものであり、当業者においては理解できるよ
うに、本発明の範囲および精神から逸脱することなく様
々な修正が可能である。
【図面の簡単な説明】
【図1】本発明によるインターネット/World Wide Web
(“ウエブ(Wed)”)環境を示す図である。
【図2】ウエブサイトの内容(コンテント)を年代順に
配列するダイレクトリ構造を示す図である。
【図3】図1のパシステント(持続的)アーカイブの冗
長を低減するためにウエブサイト(サーバ)によって実
現される一例としてのアーカイブプロセスの流れ図であ
る。
【図4A】図3のアーカイブプロセスによって遂行され
る以前にアーカイブされた内容と同一のウエブサイトの
内容に別名を付ける様子を示す図である。
【図4B】図3のアーカイブプロセスによって遂行され
る以前にアーカイブされた内容と同一のウエブサイトの
内容に別名を付ける様子を示す図である。
【図5A】本発明によるDNSサーバのデータベースの
サンプルテーブルを示す図である。
【図5B】本発明によるDNSサーバのデータベースの
サンプルテーブルを示す図である。
【図6】タイムスタンプを持つURLに対応するIPア
ドレスを決定するためにDNSサーバによって遂行され
る一例としてのDNSサーバプロセスの流れ図である。
【符号の説明】
100 ウエブブラウザ 130 インターネット/World Wide Web(“ウエブ
(Web)”)環境 140、150 パシステント(持続的)ウエブサーバ 145、155 パシステント(持続的)アーカイブ 200 年代順ダイレクトリ構造

Claims (19)

    【特許請求の範囲】
  1. 【請求項1】 複数のバージョンを持ち、前記複数のバ
    ージョンのおのおのがタイムスタンプを持つ電子ドキュ
    メントを提供するための方法であって、 前記電子ドキュメントの前記複数のバージョンの一つを
    要請する、タイムスタンプの指標を含む、リクエストを
    受信するステップ;前記リクエストされたタイムスタン
    プを持つ前記電子ドキュメントのバージョンが存在しな
    い場合、前記リクエストされたタイムスタンプの時間的
    に近傍に格納されている前記電子ドキュメントのバージ
    ョンを送信するステップを含むことを特徴とする方法。
  2. 【請求項2】 さらに、前記電子ドキュメントの前のバ
    ージョンが実質的に同一である場合、前記電子ドキュメ
    ントの前のバージョンへのポインタを格納するステップ
    を含むことを特徴とする請求項1の方法。
  3. 【請求項3】 前記電子ドキュメントを識別するアドレ
    スが前記タイムスタンプを含むことを特徴とする請求項
    1の方法。
  4. 【請求項4】 前記アドレスが均一資源ロケーター
    (“URL”)であることを特徴とする請求項3の方
    法。
  5. 【請求項5】 前記均一資源ロケーター(“URL”)
    が前記タイムスタンプを識別するための関連するリクエ
    ストヘッダを有することを特徴とする請求項4の方法。
  6. 【請求項6】 前記リクエストがブラウザから受信され
    ることを特徴とする請求項1の方法。
  7. 【請求項7】 前記タイムスタンプが相対タイムスタン
    プであることを特徴とする請求項1の方法。
  8. 【請求項8】 前記送信ステップが、さらに、前記リク
    エストされたタイムスタンプを持つ前記電子ドキュメン
    トのバージョンが存在しない場合、前記リクエストされ
    たタイムスタンプの前の最も最近のタイムスタンプを持
    つ前記電子ドキュメントのバージョンを送信するステッ
    プを含むことを特徴とする請求項1の方法。
  9. 【請求項9】 前記送信ステップが、さらに、前記リク
    エストされたタイムスタンプを持つ前記電子ドキュメン
    トのバージョンが存在しない場合、前記リクエストされ
    たタイムスタンプの後の最も最近のタイムスタンプを持
    つ前記電子ドキュメントのバージョンを送信するステッ
    プを含むことを特徴とする請求項1の方法。
  10. 【請求項10】 複数のバージョンを持つ電子ドキュメ
    ントを格納するためのシステムであって、 前記電子ドキュメントの前記複数のバージョンを電子ド
    キュメントのアーカイブ内に格納するためのメモリ;お
    よび前記メモリに結合されたプロセッサを備え、このプ
    ロセッサが:前記電子ドキュメントの前記複数のバージ
    ョンの一つを要請する、タイムスタンプの指標を含む、
    リクエストを受信し;前記リクエストされたタイムスタ
    ンプを持つ前記電子ドキュメントのバージョンが存在し
    ない場合、前記リクエストされたタイムスタンプの時間
    的に近傍に格納されている前記電子ドキュメントのバー
    ジョンを送信する;ように構成されることを特徴とする
    システム。
  11. 【請求項11】 前記プロセッサが、さらに、前記電子
    ドキュメントの前のバージョンが実質的に同一である場
    合、前記電子ドキュメントの前のバージョンをへのポイ
    ンタを格納するように構成されることを特徴とする請求
    項9のシステム。
  12. 【請求項12】 前記電子ドキュメントを識別するアド
    レスが前記タイムスタンプを含むことを特徴とする請求
    項10のシステム。
  13. 【請求項13】 前記アドレスが均一資源ロケーター
    (“URL”)であることを特徴とする請求項12のシ
    ステム。
  14. 【請求項14】 前記均一資源ロケーター(“UR
    L”)が前記タイムスタンプを識別するための関連する
    リクエストヘッダを有することを特徴とする請求項13
    のシステム。
  15. 【請求項15】 前記リクエストがブラウザを用いて指
    定されることを特徴とする請求項10のシステム。
  16. 【請求項16】 前記タイムスタンプが相対タイムスタ
    ンプであることを特徴とする請求項10のシステム。
  17. 【請求項17】 前記プロセッサが、さらに、前記リク
    エストされたタイムスタンプを持つ前記電子ドキュメン
    トのバージョンが存在しない場合、前記リクエストされ
    たタイムスタンプの前の最も最近のタイムスタンプを持
    つ前記電子ドキュメントのバージョンを送信するように
    構成されることを特徴とする請求項10のシステム。
  18. 【請求項18】 前記プロセッサが、さらに、前記リク
    エストされたタイムスタンプを持つ前記電子ドキュメン
    トのバージョンが存在しない場合、前記リクエストされ
    たタイムスタンプの後の最も最近のタイムスタンプを持
    つ前記電子ドキュメントのバージョンを送信するように
    構成されることを特徴とする請求項10のシステム。
  19. 【請求項19】 電子ドキュメントにアクセスするため
    の製品であって、 その上に実現されたコンピュータにて読出可能なプログ
    ラムコード手段を持つコンピュータにて読出可能な媒体
    を備え、このコンピュータにて読出可能なプログラムコ
    ード手段が、コンピュータに対して:前記電子ドキュメ
    ントの複数のバージョンの一つを要請する、タイムスタ
    ンプの指標を含む、リクエストを受信し;前記リクエス
    トされたタイムスタンプを持つ前記電子ドキュメントの
    バージョンが存在しない場合、前記リクエストされたタ
    イムスタンプの時間的に近傍に格納されている前記電子
    ドキュメントのバージョンを送信する;ように指令する
    プログラムコード手段を備えることを特徴とする製品。
JP11341725A 1998-12-01 1999-12-01 ウエブ資源に持続的にアクセスするための方法および装置 Abandoned JP2000194644A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US20175198A 1998-12-01 1998-12-01
US09/201751 1998-12-01

Publications (1)

Publication Number Publication Date
JP2000194644A true JP2000194644A (ja) 2000-07-14

Family

ID=22747134

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11341725A Abandoned JP2000194644A (ja) 1998-12-01 1999-12-01 ウエブ資源に持続的にアクセスするための方法および装置

Country Status (2)

Country Link
EP (1) EP1006463A2 (ja)
JP (1) JP2000194644A (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080319991A1 (en) 2007-01-08 2008-12-25 Lsr Technologies System for Searching Network Accessible Data Sets
US7424471B2 (en) 2007-01-08 2008-09-09 Lsr Technologies System for searching network accessible data sets
US9053117B2 (en) * 2012-04-11 2015-06-09 4Clicks Solutions, LLC Storing application data with a unique ID
US10965976B2 (en) 2019-03-29 2021-03-30 Spotify Ab Systems and methods for delivering relevant media content by inferring past media content consumption
CN110233882B (zh) * 2019-05-23 2022-01-11 广州视源电子科技股份有限公司 页面资源的访问控制方法、装置、系统、存储介质以及设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1997042576A1 (en) * 1996-05-06 1997-11-13 Adobe Systems Incorporated Document internet url management
JPH10222415A (ja) * 1997-02-03 1998-08-21 Nec Corp 更新情報を用いたWebブラウジング処理装置
JPH10283369A (ja) * 1997-04-10 1998-10-23 Kawasaki Steel Corp データ検索装置およびその使用方法
WO1998048359A1 (en) * 1997-04-23 1998-10-29 Xerox Corporation Feature constraint based document information retrieval and distribution

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1997042576A1 (en) * 1996-05-06 1997-11-13 Adobe Systems Incorporated Document internet url management
JPH10222415A (ja) * 1997-02-03 1998-08-21 Nec Corp 更新情報を用いたWebブラウジング処理装置
JPH10283369A (ja) * 1997-04-10 1998-10-23 Kawasaki Steel Corp データ検索装置およびその使用方法
WO1998048359A1 (en) * 1997-04-23 1998-10-29 Xerox Corporation Feature constraint based document information retrieval and distribution

Also Published As

Publication number Publication date
EP1006463A2 (en) 2000-06-07

Similar Documents

Publication Publication Date Title
JP4145449B2 (ja) ウエブ資源を持続的に格納するための方法および装置
JP2000194642A (ja) ウエブ資源に相対タイムスタンプを用いて持続的にアクセスするための方法および装置
US8402010B2 (en) Method and apparatus for resolving domain names of persistent web resources
US8429201B2 (en) Updating a database from a browser
US6256639B1 (en) Providing internet travel services via bookmark set
US7386614B2 (en) Method allowing persistent links to web-pages
US7426544B2 (en) Method and apparatus for local IP address translation
US20050114756A1 (en) Dynamic Internet linking system and method
EP1418512A2 (en) Methods and apparatus for centralized provisioning of multi-domain Web content
EP1160692A2 (en) Internet archive service providing persistent access to web resources
US20090063406A1 (en) Method, Service and Search System for Network Resource Address Repair
US7376650B1 (en) Method and system for redirecting a request using redirection patterns
US8413222B1 (en) Method and apparatus for synchronizing updates of authentication credentials
US20090125533A1 (en) Reference-Based Technique for Maintaining Links
JP2000194644A (ja) ウエブ資源に持続的にアクセスするための方法および装置
KR20080097866A (ko) 범용 콘텐츠 식별자 기반의 디지털 콘텐츠 연계시스템
Feise An approach to persistence of web resources
KR20000018242A (ko) 인터넷 웹사이트 내용의 단축검색 및 관리 프로그램작성방법
Cohen Issues in URL management for digital collections
Warnock III et al. The Electronic Astrophysical Journal: resource location and archive management
JP2002024078A (ja) イメージファイル管理サーバ
MAYER et al. Applying semantic web technologies to improve the retrieval, credibility and use of health websites
Warnock III et al. Archive Management
WO2001059620A2 (en) A system and method for refreshing internet bookmarks
JP2004265124A (ja) 移設先ホームページアドレスの供給方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040308

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20040608

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20040611

A762 Written abandonment of application

Free format text: JAPANESE INTERMEDIATE CODE: A762

Effective date: 20040908