JP2001503537A - オンラインデータリポジトリの変更データの識別 - Google Patents

オンラインデータリポジトリの変更データの識別

Info

Publication number
JP2001503537A
JP2001503537A JP51681197A JP51681197A JP2001503537A JP 2001503537 A JP2001503537 A JP 2001503537A JP 51681197 A JP51681197 A JP 51681197A JP 51681197 A JP51681197 A JP 51681197A JP 2001503537 A JP2001503537 A JP 2001503537A
Authority
JP
Japan
Prior art keywords
version
page
user
time
pages
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP51681197A
Other languages
English (en)
Inventor
トーマス ジェイ ボール
フレデリック ダグラス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AT&T Corp
Original Assignee
AT&T Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AT&T Corp filed Critical AT&T Corp
Publication of JP2001503537A publication Critical patent/JP2001503537A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Document Processing Apparatus (AREA)
  • Information Transfer Between Computers (AREA)
  • Stored Programmes (AREA)

Abstract

(57)【要約】 バージョン毎にその内容が変更する遠隔のリポジトリ内の文書にアクセスするためのシステム。このシステムは、ユーザーが関心のある文書のリストを指定することを可能にし、そのリストに基づいて、リストに挙げられた各文書の1バージョンのコピーと、他のバージョンを再構築するのを可能にする内容とを含むアーカイブを保持する。上記システムは、リポジトリ内の文書の最新バージョンとアーカイブを周期的に比較し、アーカイブを更新することで、最新のバージョンを再構築する機能を保持する。上記システムはまた、各ユーザーのバージョンへのアクセスをモニタする。ユーザーが最新バージョンを要求すると、上記システムは最新バージョンを提示し、その最新バージョンのどの部分にユーザーがこれまでアクセスしていないかを示す。

Description

【発明の詳細な説明】 オンラインデータリポジトリの変更データの識別 本発明は、データリポジトリから検索した文書の最新バージョンの提示(プレ ゼンテーション)に関する。この提示は、閲覧者が前のバージョンにアクセスし てからのその文書の変更を示すものである。 発明の背景 コンピュータ化されたシステム内に記憶された情報は、通知することなく頻繁 に変更する可能性がある。例えば、開発中のソフトウェアには多くの人が関わる ことが多く、一般に中央の記憶位置に記憶されている。それに関わる人は各自、 他人に知らせることなくそれぞれソフトウェアを思いつくままに変更することが できる。 変更可能なデータを含むこのようなシステムでは、一般に、任意の日に情報を 調べる人は、前回調べてからその情報が変更されたかどうか、そしてどのように 変更されたかは知らないため、最新の情報を前のバージョンの情報と比較するの に時間を費やさなくてはならない。 この比較を簡単にするためのソフトウェアが存在する。例えば、「バージョン 制御システム」または「改訂制御システム」として知られるシステムは、図1A に示されるように、様々な文書の多数のバージョンを表すデータを記憶する。こ の図には、点線の枠内に示されるバージョンとともにデータが図示される。 この枠は、バージョンが これよりもかなり大きな文書に散在している。小さな矢印が変更を示し、この場 合には主に追加点である。「最終更新」日の変更は、テキストが置き換えられる 例を示す。ここでは、ページ作成者は、小さなアイコンを伴ってマニュアルで変 更を強調させている。ページの上部のバナー(見出し)は、HTMLDIFFによって挿 入されたものである。 図12は、バージョンの履歴を示しており、これによってユーザーは任意の二 つのバージョンを比較したり、選択したバージョンに直接アクセスできる。 図13は、W3NEWERの出力を示し、いくつかのアンカー(記述テキストはホッ トリストから生じる)を示す。「変更した」と示されたアンカーは、ユーザーの ブラウザの履歴によってそのURLを最後に見てからの変更日を伴う。URLの 中には全くチェックされないものもあるし、チェックされ、ユーザーに見られた ことがわかっているものもある。 図14は、ユーザーがURLに対する動作を指定するのを可能にするSNAPSHOT 機能の使用法を示す。この例では、DOUGLIS@RESEARCH.ATT.COMが、HTTP://SNAPP LE.CS.WASHINGTON.EDU:600/MOBILE/というURLを「記憶」している。 発明の詳細な説明 本明細書の末尾の「技術面の補遺」に本発明が詳細に説明されている。その後 に本発明の一形態を実現するコードを含むコンピュータプログラムリストを添付 している。 本発明の例示的な実施形態を以下に説明する。 発明の概説 一般的に使用されている情報リポジトリは、ワールドワイドウェブ(World Wid e Web)、すなわちWWWとして知られている。WWWでは、情報提供者によって ユーザーが「ページ」の形態でその情報を入手できるようにされる。各ページに は名前が割り当てられており、それによって他のページと区別し、ユーザーがそ のページの位置を突き止められるようにする。 WWWは、「ハイパーテキスト」と称する情報検索および表示法を用いて情報 を提供する。ハイパーテキストでは、ページは他のページまたは他の文書への参 照を含む。ユーザーは、ポインティングデバイスでその参照部(Universal Reso urce Locator;URL)をクリックすることによって参照するページを呼び出すこと ができる。図1Bにその一例を示す。 図1Bにおいて、文書Dがユーザーに表示される。参照部Rは他の文書への参 照を与える。例えば、R1はD1への参照を与え、R2はD2へ、という具合で ある。参照された文書自体もまた他の文書への参照を含む可能性があり、例えば R4はD4への参照を与える。 ユーザーは、参照する文書Dに対する参照部Rをクリックすることによってそ の文書を検索することができる。例えば、R1をクリックするとD1が検索され 、これが表示される。 本発明によると、WWWのユーザーは最初に自分が関心のあるページを特定す る。図1Bの文書Dは、あるページを表している。これらの選択されたページが 「ホットリスト」を形成する。次に、本発明では以下のことを行う。 (a)ホットリストに挙げられたページをアーカイブにコピーする。アーカイブ とは、WWWとは別個の記憶位置であり、独立して制御される。コピーした後も 、元のページはWWW内に存在し続け、コピーはアーカイブ内に存在する。 (b)その後の元のページの変更をモニタし、その変更をアーカイブする。 (c)その後ユーザーがホットリストに挙げられた各ページにアクセスした時間 を記録する。 (d)ユーザーがホットリストに挙げられたページにアクセスする度に、ユーザ ーに以下を提示する。 i)ページの最新バージョン(これはアーカイブ内に記憶された最初のコピ ーとは異なる可能性がある) ii)ページの選択されたバージョンを比較するオプション。この比較は、 バージョン対に対する差異特定動作を行うことによって実現される。 (e)オプションとして、本発明ではページによって参照された文書に対しても 上述のステップを実施する。例えば、図1Aにおいて、ユーザーが文書Dを見て いるとすると、本発明では参照文書D2の最新バージョンをD2の履歴とともに 提示することができる。 より詳細な説明 ホットリストに挙げられたページの外部サービスへの記憶 図1は、WWW等の情報リポジトリを示す。リポジトリにアクセスするのを補 助するため、本発明は以下を含む外部サービスを提供する。 (a)添付のコンピュータプログラムリストに見られるようなソフトウェア (b)そのソフトウェアを実行するサーバー、または他のコンピュータ (c)ユーザーとリポジトリの双方をリンクする通信システム 外部サービス内に配置されるサーバーおよび通信システムは当該分野では周知で ある。図に示されるように、外部サービスはリポジトリとは別個のものであり、 別々に制御される。 本発明はユーザーのリポジトリとの通常の対話(インタラクション)を妨げる ものではなく、ユーザーは通常通りリポジトリと対話できるのに加えて、外部サ ービスとも対話できる。本発明の例示的な動作態様をいくつか例を挙げて説明す る。 例:シングルユーザー まず、ユーザーが一人である(シングルユーザー)場合の動作を説明する。図 2は、ユーザー1によって提出されたホットリスト4を示し、ユーザー1がペー ジAおよびBに関心を示していることを特定している。本発明によると、ユーザ ーが後でホットリストを変更することも許可する。本発明によると、点線の矢印 で示されるように、ホットリストに応じてリポジトリからページAおよびBがコ ピーされる。これらのページを「基本ページ」と称する。このときページAおよ びBのオリジナルはリポジトリ内に存在し、コピーは外部サービス内に存在する 。 次に、本発明によると、リポジトリ内のページAおよびBのオリジナルの変更 について周期的に調べる。変更点を探す際に、本発明ではまず、(1)変更日、 および(2)チェックサム、等の情報に基づいて予備チェックを行う。 変更日は、ページの提供者によってページに加えられることもある。これらの 日付は、最初にアーカイブされたバージョンが変更したかどうかを直接示すもの である。 チェックサムは本発明によって生成される。チェックサムの一例としては、1 行または1ページ内のすべての文字の数の和が挙げられる。チェックサムが変わ ると(つまり文字数が変わったことを示すと)、その変更はページ内に変更があ った確率が高いことを示す。(実用において使用されるチェックサムはこの単純 な例よりも複雑である。チェックサムは当該分野では周知である。) 変更日またはチェックサムによる予備チェックで変更があったことが示される と、本発明では、そのページの現在のバージョンを外部サービスへとコピーし、 それを基本ページと比較して、変更箇所を突き止める。このような変更を検出す るためのコンピュータプログラムは当該分野では既知であり、その例のいくつか を「技術面の補遺」に挙げている。従来知られていない好適なプログラムはW3NE WERと称するもので、本願発明者らによって開発された。W3NEWERは、本明細書の 末尾のリストに含まれている。 変更を見出すと、本発明ではそれを外部サービスに記憶する。図3は、ページ AおよびBの下の小さなボックス6によって変更の記憶を示す。ボックス6内の 日付は、変更がセーブされた日付を表す。 図3Aは、本発明においてバージョンの履歴をどのように表示するかを示す。 コラム7は、本発明によって各バージョンに割り当てられた番号を示し、コラム 8は、本発明によって各バージョンが検索された時間を示す。コラム8Aにより 、以下に説明するようにユーザーは差異特定動作を行うバージョン対を選択する ことができる。 説明を簡単にするために、図3はページの初期のバージョンである基本ページ とボックス6で示されるその後の変更との記憶を図示しているが、実用において は、(初期のバージョンではなく)最新バージョンを基本ページとして記憶し、 変更6を記憶してそこから初期のバージョンを再構築するといった、逆の方法で 記憶を行う方が効率的なこともある。その理由の一つは、ユーザーが初期のバー ジョンよりも最新バージョンを求めることの方が多いと考えられることである。 最新バージョン全体を記憶することによって、それを再構築する必要がなくなる 。 変更とその基本ページがアーカイブを形成し、これによってどの希望の日付の ページも再構築できる。例えば、 −− ページA自体(すなわち基本ページ)と日付1で示される変更によって 日付1の時点でのページAのバージョンを再構築できる。 −− ページA自体と、日付1および日付2で示される変更とによって日付2 の時点でのページを再構築できる、という具合である。 ユーザー1がページAを見たい場合には、本発明では通常最新バージョンを検 索して提示する。本発明はまた、ユーザーが指定した日付のページを再構築する オプションも提供し、図4に示されるフォーマットでこれを提示する。リストに あるプログラムHTMLDIFFによって図4の画像を生成する。ページの内容は3つの クラスに分類することができる。 第1のクラスは、変更されていない内容を含むものである。このクラスの内容 は、リポジトリからダウンロードされる文書の通常のフォント、サイズ、色、お よび背景で表示される。 第2のクラスは変更を表し、基本ページにはなかったもので追加された内容を 含むものである。括弧9で係る内容を示す(括弧9は図4の一部であり、必ずし も本発明によって生成するページの一部ではない)。この内容は、特定のフォン ト、特定のサイズ、特定の色、そして特定の背景で提示される。これらのパラメ ータの選択は様々であってよいが、一般には第1のクラスの内容とのコントラス トを最大にするように選択すべきである。上記のフォーマッティングに加え、追 加された内容はさらに矢印7で強調される。 第3のクラスは、基本ページから削除された内容を含む。削除された内容は少 なくとも3つの方法で処理することができる。1つは、削除された内容は単に削 除し、読み手に提示されるページが削除された内容への参照を含まないようにす るものである。 2つ目として、削除された内容は削除するが、「削除された内容はここで表示 される」等の文で削除を示す参照を追加してもよい。この場合には、削除された 見えない内容を取り出すオプションをユーザーに与えることができる。 3つ目として、削除された内容を提示し、削除された内容に赤などの横線を引 く「レッドライン」フォーマット等によって削除されたことを示してもよい。 図3Bは、本発明によって生成される表示であり、ユーザーのホットリストに あるページが変更を受けたことを示している。 第2例:ユーザーが複数の場合 実用では、複数のユーザーが本発明を利用すると考えられ、各自がホットリス トを提出する。本発明の手法の一つでは、ユーザーが複数の場合に対してもシン グルユーザーの場合(先に説明した)にとった手順を繰り返す。すなわち、上述 のように、全ホットリストの全ページを外部サービスにコピーし、各ホットリス トについて、リポジトリにあるページのオリジナルの変更をモニタし、その変更 を外部サービスへと取り込む。 しかし、この手法には非効率な点がある。例えば、あるページが2つ以上のホ ットリストで指定される可能性がある。そのページを各ホットリストについて繰 り返しコピーすると同じページの複数のコピーを記憶することになる。さらに、 その複数のコピーをリポジトリ内のオリジナルと繰り返し比較するのはコンピュ ータの時間の無駄であり、一回比較すれば十分である。本発明は、図5に示され る手法によってこれらの非効率な点を改良する。 この図は図4にユーザー2のためのホットリストを加えることでこれを変形し たものである。追加されたホットリストはページAとCを指定している。 新しいホットリストを処理するために、本発明では、追加されたホットリスト で指定されたページが外部サービス内にアーカイブされているかどうかをまずチ ェックする。ページAはその変更とともにすでにアーカイブ内に含まれているた め、このページはコピーされない。しかし、ページCはアーカイブ内に存在しな いため、点線の矢印で示されるようにアーカイブされる。 この時点で、全ホットリストで指定された全ページがアーカイブ内に含まれる 。このことを強調するために、ページAは、1回目はユーザー1のために、そし て2回目は点線のページ14で示されるようにユーザー2のためにと2回示され ているが、上述のようにページAは一度しか記憶されない。 必要なページをすべてアーカイブした後、上述のように、リポジトリ内のオリ ジナルの変更について周期的にモニタする。変更は外部サービスのアーカイブに コピーされる。 フローチャート シングルユーザーの場合の例示的なフローチャートが図6に示される。ブロッ ク20において、外部サービスはユーザーからホットリストを受け取る。次に、 ブロック23で、外部サービスはホットリスト上で指定されたページがアーカイ ブ内にあるかどうかをチェックする。もしなければ、ブロック26で示されるよ うにリポジトリからページがコピーされる。 次に、論理はブロック29へと進み、ここでリポジトリ内のページのオリジナ ルの変更について調べる。この調査は、上述の予備チェック(チェックサムと変 更日についてのチェック)を含み得る。変更が見つかると、それらを含むページ 全体が外部サービスにダウンロードされ、図3のブロック6で示される変更が導 出される。ブロック32は、外部サービスに記憶された関連情報を示す。 ユーザーが各ページのどのバージョンを最後に見たかを特定するために、ユー ザーがページにアクセスすると、ブロック35でアクセス時間をモニタする。ブ ロック32および点線矢印37で示されるように、これらの時間は、記憶され、 これを利用して、各ユーザーによってページが呼び出されると図4のどの変更を 新しい内容として特定すべきかを判断する。以下に一例を挙げる。 図7の上部はページAに対して行われた変更の時間的履歴を示す。ユーザー1 は、図示の通り、このページに時間2でアクセスしている。図6のブロック35 でこの時間をモニタし、これを記録する(もちろん図7の時間2においてであり 、これより早くには行われない)。 ユーザー1が時間5でこのページに再びアクセスすると、本発明ではユーザー にバージョン1を提示する。しかし、ユーザーが時間11でこのページにアクセ スすると、ユーザー1の最後のアクセス時からバージョン2がすでに形成されて いる。本発明ではすでに変更を特定して、図3で示されるようにこれらをコピー している。そこで、本発明では、時間11でのアクセス時に、図6のブロック3 5でユーザーがバージョン2を見ていないことが示されるため、バージョン1と その変更とを提示してバージョン2を形成する。 ここで図6のフローチャートに戻って、ブロック39で、ユーザーがページを 要求すると、本発明では最新バージョンを提示し、ユーザーがそのページに最後 にアクセスしたときから行われた変更を(図4のように)示す。上記の例では、 本発明は図7のようにページAのバージョン2を提示し、ユーザー1が最後にア クセスしたのはバージョン1であるため、バージョン1から行われた変更を示す 。 図6のフローチャートは、本発明を線形かつ逐次的な動作モードに制限するも のではない。実用においては、複数のユーザーが同時にホットリストを提示する 可能性があり、フローチャートに示されるもの以外の動作も同時に起こりうるも のである。 第3例:変更の通知 本発明では、ユーザーがホットリストに挙げたページに変更があると、図6の 点線のブロック40に示されるように、ユーザーにこれを知らせることができる 。この通知は、図8の基本ページと関連するフラグの形態をとっても良い。ユー ザーが外部サービスにログインすると、本発明では、ユーザーにそれぞれのペー ジの変更を知らせる。図3Bは、変更したページを特定する手法の一つを示す。 他のタイプの通知も可能である。例えば、本発明では、ユーザーがページにア クセスするのを待つ必要はなく、変更が見つかるとユーザーに電子メールメッセ ージを送ることでユーザーに知らせることができる。 第4例:共通のホットリスト 本発明では、ユーザーの一集団(コミュニティー)に対して所定のホットリス トを維持することができる。このホットリストは、その集団の一般的な関心事で あると考えられるページのリストを含む。このホットリストとそれに指定された ページは、すべてのユーザーに対して公開されるが、読み出し専用である。ユー ザーがホットリストまたはページを変更することはできない。 この所定のホットリストは教育ツールとして役立てることもでき、本発明の動 作についてユーザーを教育したり、所望の特徴を説明したりしても良い。 データ記憶のアーキテクチャ 図6のフローチャートのブロック32に示される情報を記憶する手法の例が図 8に示されており、これを図7を参照して説明する。 図7は、図5の2つのホットリストで特定された3つのページに対して行われ た仮定上の変更を示す。ページAは時間7および13で変更されており、ページ Bは時間10で変更されており、以下同様である。 図7において、「ユーザー1」等の文字から延びる矢印は、ユーザーによるア クセスの時間を示す。例えば、ユーザー1は時間2でページAのバージョン1に アクセスしており、次に時間9でページAのバージョン2にアクセスしている。 以下も同様である。 本発明では、図8の右側に示されるように、これらの時間の表と、各ユーザー が所有する文書またはページのリストとを保持する。所有者は、ホットリストに よって決定される。本発明ではさらに、この図の左側に示されるように、(a) 基本ページと、(b)その各々に対する変更と、(c)各変更の時間とを保持す る。このデータから、本発明では基本ページの日付以降のどの日付のどのページ も再構築することができる。 補足 1.「ページ」の一定義は、それが特定の名前によって特定されるシステム内 に記憶されたデータの単位を指すというものである(WWWでは各ページが一意 的な名前を持つ)。「ファイル」や「文書」といった他の用語もこのようなデー タ単位を指し得る。一般に、使用する特定の名前は、データを記憶するシステム に依存する。 2.「リポジトリ」の一定義は、コンピュータによってアクセス可能なデータ の集まりである。リポジトリは公開されても良いし、アクセスを制限しても良い 。一般に、リポジトリは分散していると考えられる。つまり、記憶位置は地理的 に広範囲にわたって物理的に分散しており、通信システムによって互いにリンク されると考えられる。 3.本発明が任意の選択日のページを再構築できることについては上述したが 、この再構築は、図3の変更6に基づく。これらの変更は周期的に検出され、そ の周期は、設計者およびシステム管理者が課す制限のもと、システムの各ユーザ ーによって決定される。 例えば、ユーザーAがそのホットリストのページの変更をチェックするのに一 日という周期を指定するのに対して、ユーザーBはBのページについて例えば一 週間という違う周期を指定しても良い。システム管理者は、どのユーザーについ ても1時間未満の周期にはしないように指定することができる。 この結果、リポジトリ内のページの変更は、変更が検出された後で外部サービ スが行う再構築において現れるのであって、これより早くには現れない。この違 いを示す一例を挙げる。 例えば、本発明で奇数日に変更を調べると仮定する。すると、ある月の4日に 起こった変更は5日に検出される。しかし、ユーザーがたまたま4日に再構築を 求めると、4日に起こった変更は再構築の際には現れない。その前の検出時、す なわち3日に起こった変更のみが現れる。 このことによる影響が無視できる程度となるくらい十分に頻繁に検出処理が行 われることが望まれる。 4.本発明の差異特定機能(すなわちページの変更を調べること)を、ユーザ ーがアクセスしたページによって参照したページにまで拡張することができる。 例えば、ユーザーが図1Bの文書Dにアクセスすると、本発明により、文書Dに よって参照されたすべての文書、例えば、D1、D2、D3等の変更を検出する ことができる。 別の実施形態として、この差異特定を、参照された文書によって参照された文 書にまで拡張することもできる。例えば、参照された文書(D1、D2、および D3)がD5およびD6を参照すると、これらの文書(D5およびD6)に対し ても差異特定を行い、さらにこれらが参照した文書に対しても同様に差異特定を 行うことができる。 5.本発明では、ページの最新バージョンを得るもととなった情報すべてを提 供する。図4にその一例を示す。図4は、このようなすべての情報とともに、前 のバージョンからの変更を示す他の情報も含む。 6.これまで、ページの異なるバージョン間の比較すなわち差異特定が外部サ ービスで行われるものとして説明してきたが、必ずしもその必要はなく、比較は いかなる好都合な位置で行われても良い。さらに、変更の有無についての予備チ ェックもいかなる好都合な位置で行われても良い。 7.データ記憶システムにおいて、情報単位に名称が付けられるが(例えば、 文書、ページ、レコード)、この名称はデータベース毎に異なっていても良い。 しかし、一般にこの単位の名称は、単位内に含まれる情報に変更が加えられても 時を問わず同じである。従って、「バージョン」という言葉の一定義は、同じ名 称の前の単位とは異なる情報の単位である。 8.図1内のリポジトリは、一般に外部サービスから遠隔の位置にある。その 通信は、インターネット等の公衆アクセス通信ネットワーク等の何らかの好都合 な方法で行われる。 一般に、リポジトリは外部サービスとは別個に制御される。この独立制御の結 果の一つとして、外部サービスにコピーされたページに対して行われるタイプの 処理は、リポジトリではなく外部サービスによって制御される。例えば、(a) 相違点を特定して記憶するのに用いる特定のプロセス、(b)処理の頻度、およ び(c)ユーザーへの通知モードは、外部サービスの設計者によって制御される 。リポジトリのオペレータはこの処理には関与しない。 9.図9は、本発明の別の形態を示す。本発明では、ホットリスト36に要求 されるように外部サービス内に基本ページ30を保持する。基本ページ30は、 それぞれのリポジトリ42A、42B等からダウンロードされている。 本発明ではリポジトリ42内のページのオリジナル30Aの変更について周期 的にモニタし、その変更を外部サービス内に記憶する。本発明では、ユーザーの ホットリストのページに変更があればユーザーに通知する(通知は図示されてい ない)。 バージョン制御システム39によって、ユーザーはどのページのどのバージョ ンも取り込み、それを見ることが可能となる。 10.文書の様々なバージョンは、図や、音が生成されうるファイル、ビデオ クリップおよびアニメーションを生成するファイル、および厳密には英数字から なるわけではない他の要素を含みうる。本発明では、これらの要素における変更 の有無を検出し、変更の性質については必ずしも詳細に特定することなく、その 変更の有無を図4に示されるような表示で示す。 11.本発明の主な使用法を図10に示される状況で表す。外部サービスはW WW等のリポジトリからページのコピーを得るが、外部サービスにはリポジトリ 内に含まれるページを交換または変更する権限はない。外部サービスに関しては 、書き込み動作を示す矢印50にXが付されているように、ページは読み出し専 用データを表す。 外部サービスは、コピーしたページの最新バージョンと前のバージョンを表す データの差異特定を行う。外部サービス内に記憶されたデータは、外部サービス によって読み出されることも書き込まれることも可能である。外部サービスは、 上述のように、要求に応じてどのバージョンも再構築し、ユーザーが選択した任 意の2つのバージョン間の相違点を示す。これらの機能は、従来の改訂制御シス テムRCS(バージョン制御システムとも称する)によって、または本明細書中 のリストにあるコードによって達成できる。 12.本発明の一形態では、検索ページはハイパーテキストマークアップ言語 (HTML)等の「マークアップ言語」で書かれている。一般に、マークアップ 言語は、実際の文書テキストに散在する2種類のコードを含む。 そのうち1種類は、ページの表示のしかたを示す。例えば、コードの中には、 段落のインデント(字下げ)を示すものや、フォントスタイルを示すもの、さら に、斜字体、下線、二重文字(double-striking)、太字等のフォントにおけるフ ォントスタイルを示すものがある。この種のコードはフォーマット定義型といわ れる。 第2の種類のコードは、その他の位置にあるビットマップファイル等の画像を 特定できるものである。ページを表示するシステムによってこのようなコードが 読み出されると、画像のコピーが検索されてページ内のコードに指定された位置 で表示される。この種のコードはコンテント定義型といわれる。 本発明では、フォーマット定義コードの変更は内容における変更のようには扱 われない。従って、レイアウトまたはタイプスタイルのみが変わっているページ は変更されたページとしては指定されない。 コンピュータプログラムリスト内の差異特定プログラムは、異なるバージョン をサブユニット毎に比較する。たとえば、このプログラムは異なるバージョン内 の対応する文を比較し、その文は終止符によって検出される。(段落やページ等 のより長いサブユニットを用いても良い。)終止符は、マークアップ言語のサブ セットであり、具体的には、フォーマット定義コードである。 コンピュータプログラムリスト プログラムリストは3つのセクションに分かれている。 1.以下を含むHTMLDIFF −− html_diff.sml(5ページ) −− diff.sml(3ページ) −− mlweb.sml(4ページ) −− html.lex(1ページ) 2.W3NEWER(17ページ) 3.以下を含むNOHANDS −− nohandsBE(11ページ) −− no-hands.cgi(3ページ) −− rcsdiff.cgo(4ページ) −− snapshot.cgi(3ページ) NOHANDSは、W3NEWERとHTMLDIFFを利用する包括的なプログラムセットである 。 技術面の補遺 全12ページの技術面の補遺を添付する。その内の2ページは白紙であり、ま た補遺中の図は本明細書の図11−14を参照する。 本発明の真の精神および範囲を逸脱することなく数々の変更および変形を行う ことが可能である。特許証によって保護したいのは以下の請求の範囲に定義され る発明である。 技術面の補遺 ウェブ上の変更の追跡および表示 要約 ワールドワイドウェブのページがいつ変更されたかを検出し、マークアップH TMLでユーザーに視覚的にその変更を提示するツールについて説明する。ツー ルは3つの要素からなる。すなわち、ページの変更を検出するW3NEWERと、ユー ザーが任意のウェブページのコピーを記憶させ、ページのその後のバージョンを そのセーブしたバージョンと比較することを可能にするsnapshotと、HTMLテ キストが前のバージョンからいかに変更したかを示すようにこれをマークアップ するhtmldiffとからなる。これらのツールをまとめて、NO HANDS(Network-Orien ted HTML Archival,Notification,and Differencing System;ネットワーク指 向HTMLアーカイブ、通知、および差異特定システム)と称する。この論文で は、スケーラビリティ、セキュリティ、エラー状態等のシステムの問題に重点を 置いて、NO HANDSのいくつかの特徴について説明する。 1.はじめに ワールドワイドウェブ(W3)の利用は、トラフィックの量の面でもユーザー および内容提供者の多様性の面でも、この数年で劇的に増大した。W3は、学究 的環境(そのそもそものきっかけとなった分野である)、商業的環境、そして様 々な分野で関心をともにする人々の仮想コミュニティにとっての情報提供媒体と なった。メーリングリストまたはニュースグループを購読しているユーザーに対 するアクティブメディアである電子メールまたはUSENETを介してこれまで送られ ていた情報を現在はW3ページ上で公表することができる。そのデータに関心の あるユーザーはそのページにアクセスして、新しい情報を得るのである。 ユーザーにとって関心のあるページのURLは「ホットリスト」(NetscapeTM ではブックマークファイルとして知られている)にセーブすることができ、その ページにアクセスするのが便利になっている。では、ページがいつ変更されたか をユーザーはどのように見出すのだろう。ページが最新のデータ(例えば株式相 場)を含んでいたり、その所有者によって頻繁に変更されることをユーザーが知 っていれば、そのページに頻繁にアクセスするであろう。しかし、そうでないペ ージは、無視されたり、またはブラウズしても変更されていなかったりすること がある。 最近、いつページが変更されたかを判断する問題に対処するためのツールがい くつか利用できるようになった。このようなツールの一例が、webwatchである。 これは、WindowsTM用の製品であり、HTTPのHEADコマンドを用いてページがユー ザーのウェブブラウザによって最後に閲覧されてからいつ変更されたかを見出し 、ユーザーがその更新されたページに直接アクセスするのを可能にするレポート をHTMLで生成する。別の例は、UNIXR上で動作するパブリックドメインperl スクリプトであるBrooks CutterのW3NEWである[2]。 これらの各ツールには重大な欠点がある。すなわち、ユーザーにページが変更 されたことを知らせるものの、そのページがどう変わったかは示さないのである 。ページの中にはその保守者(maintainer)が最も最近の変更を強調するように編 集するものもあるが、特にページが大きければ、変更が目立たない場合が多い。 最近の変更を特に強調しているページでも問題があり、ユーザーがページに頻繁 にアクセスしていると、保守者にとって「新しい」ものもユーザーにとっては「 新しい」わけではない可能性がある。逆に、ページにそう頻繁にはアクセスしな いユーザーは保守者が古いと判断した変更を見落とす可能性がある。 本願発明者らは、ページがいつ変更したかを効率的に追跡し、ユーザーごとに TM Netscapeは、Netscape Communications社の商標である。TM Windowsは、Microsoft社の商標である。R UNIXは、X/Openの登録商標である。 バージョンをコンパクトに記憶し、ページ同士を自動的に比較してその相違点を 提示するシステムを開発した。NO HANDS(Network-Oriented HTML Archival,Not ification,and Differencing System:ネットワーク指向HTMLアーカイブ、 通知、および差異特定システム)は、3つのツールでW3ページのバージョンの「 個人化された」ビュー(表示)を提示する。その第1のw3newerは、CutterのW3n ew変更追跡ツールよりもスケーラブルであって、周期的にW3にアクセスしてユ ーザーのホットリスト上のページがいつ変更されたかを見出す。第2のsnapshot は、ユーザーがページのバージョンをセーブし、後に第3のツールhtmldiffを使 ってそれがどのように変更したかを知ることを可能にする。htmldiffは、2つの HTMLページを自動的に比較し、「併合された」ページを形成して、特殊なH TMLマークアップでその相違点を示す。 チェックされない。しきい値はURLによって異なり、どのしきい値を採用する かを決定するのにperlパターンマッチング(照合)を利用し、第1の照合パター ンを使用する。表1は、/.w3newer_thresholdsコンフィギュレーション(環境 設定)ファイルの一例を示す。しきい値は日付(d)と時間(h)の組み合わせ として指定し、0は、w3newerを起動する度にページをチェックする必要がある ことを示し、「なし」はチェックする必要がないことを示す。 表1:w3newerに対して指定されたしきい値の例 2.3 キャッシュコンシステンシの問題 HTTPページがいつ変更されたかを判断するのは、分散ファイルシステムに ファイルをキャッシュし、ファイルがいつ変更されたかを判断するのに似ている 。Andrew File System[6]およびSprite[8]等のファイルシステムは、無効コピー を伴うホストへのコールバックを発行することによってキャッシュコンシステン シを保証する。HTTPアクセスは、クライアントがアクセスする各ファイルに ついて周期的にサーバーにチェックを入れる従来のNFS[12]の手法により近い 。Netscapeは、各セッションにつき一度、毎アクセス時にキャッシュされたペー ジの変更日をチェックするか、または全くこれを行わないように構成することが 出来る。キャッシングサーバーは、クライアントが完全なリロードを要求すると き、または「活き時間」(time-to-live)が切れるとチェックを行う。 ここで、目的とする環境によって問題が複雑化する。つまり、現在見ているペ ージがいつ変更したかのみならず、暫く見ていないページがいつ変更したかも知 りたいものである。幸い、ファイルシステムとは異なり、HTTPデータは通常 多少のインコンシステンシ(矛盾)については許容できる。ユーザーにとって関 心はあるものの最近見ていないページの場合には、通常、1日または1週間とい ったある妥当な期間内に見いだせば十分である。ページに変更があったときに関 心のある者全員に通知する機構がサーバーにあったとしても、オーバーヘッドを 費やしてすぐに通知する価値がないこともある。 そこで、上述の動作に代えて、ハーベストリプリケーション(Harvest Replica tion)やキャッシングサービス[1]のようなものを用いて、関心のある者にゆっ く りと通知することが考えられるだろう。現在ページをキャッシュしているブラウ ザまたはページに関心を示しているユーザーは、ページに関心があることをその ローカルキャッシングサービスに登録することが出来る。すると、キャッシング サービスはインターネットワイドの分散サービスにその関心を登録し、その分散 サービスが最善を尽くしてキャッシングサービスに変更をタイムリーに通知する 。(このサービスは、HTTPページのバージョンもアーカイブする可能性があ る。)ページはすでに複製されており、サーバーのロードは分散され、ページが 変更するとそれを発見するための機構は、分散リポジトリと内容提供者との間の 交渉にゆだねられる。つまり、内容提供者がリポジトリに変更を通知するか、ま たはリポジトリが周期的にポーリングするのである。いずれにしても、関心のあ るHTTPサーバーの各々をポーリングするクライアントは多くはないであろう 。HTTPキャッシングについてのインテリジェンスをサーバーに移すことは、 GwertzmanおよびSeltzer[3]らによって提言されている。 NO HANDSの機能をファイルシステムに統合することも考えられるであろう。任 意のファイルが変更したときにアクションをおこすことが出来るツールは存在す るものの、広く入手可能であるわけではない[11]。ユーザーは新しいファイルお よびW3ページの統合レポートが欲しいと考えるであろうし、w3newerは「ファイ ル」仕様をサポートし、ローカルファイルが変更したかどうかを見いだすことが 出来る。しかし、snapshotにはユーザーの(遠隔の)ファイルシステムのファイ ルにアクセスする手だてがない。ブラウザに機能を移すことによって、改訂制御 システム(RCS)等のバージョニングシステムの制御下にまだないファイルの スナップショットを個々のユーザーが得ることが可能となる[14]。これは、HotJ ava等のクライアント側の実行を伴うブラウザの適切な使用といえるかもしれな い。 2.4 エラー状態 周期的なタスクで多数のURLの状態をチェックすると、いくつか誤動作が起 こるおそれがある。ネットワークの接続性やプロキシキャッシングサーバーの状 態等のローカル(局所的)な問題によって、HTTPリクエストがすべて失敗に 終わる可能性がある。プロキシキャッシングサーバーは多数のリクエストをタイ ムアウトとするほどにオーバーロードされることがあり、短時間で多くのURL を検索するバックグラウンドタスクによってこの状態がさらに悪化する可能性が ある。従って、w3newerは実行を中止して後で再試行(ユーザーが更新されたレ ポートを見るのに間に合うのが好ましい)する場合を検出できなくてはならない 。 同時に、個々のURLによっていくつかエラーが起こることもある。これらは 、転送ポインタを残したり、または残すことなく移動することがある。URLの ためのサーバーが、非活動化されたり、名称が変わったりすることもある。これ らは「ロボット」による検索を却下することがある。つまり、「ロボット排他プ ロトコル」[10]に従ういかなるプログラムもこれらを検索することが出来ない場 合がある。ロボットテキスト(robots.txt;排他プロトコルの一部)を検索する コストと比較すると、変更日を検索するコストは小さいため、このタスクについ てはロボット排他プロトコルを無視するか、または各ホストについてごくたまに ロボットテキストをチェックするのが適切であろう。それでも、特にページ内容 が毎回検索される場合には、多くのURLがチェックされるホストについてはプ ロトコルを遵守するのが賢明であろう。 変更日およびチェックサム等の情報に基づく変更の自動検出は、「煩わしい」 変更によっても変更が通知されるため、「ジャンクメール」等の発生につながる 可能性がある。たとえば、アクセスされた回数を報告したりその時の時間を組み 込んだページは、検索する度に異なって見えるであろう。 w3newerは以下のステップによってこれらの問題に対処する。 ・ロボットがURLにアクセス出来ない場合には、その事実をキャッシュし、ス クリプトが呼び出される際に特殊なフラグがセットされない限りはそのページに はアクセスしないようにする。 ・別のフラグで、URLのタイムスタンプに関する限り、エラー状態をエラーの ないチェックとして扱うようにw3newerに指示する。たとえば、w3newerが毎日稼 働されて特定のURLを4日ごとにチェックする場合、通常、月曜日にページに アクセスした際にエラーがあるともう一度火曜日にチェックされる。このフラグ を用いると、金曜日にもう一度チェックすることとなる。一般に、エラーは一過 性である傾向があり、w3newerを次に稼働したときにチェックするのが妥当であ ろう。 ・URLにアクセスできなければ、ステータス(状態)レポートにエラーメッセ ージが現れ、ユーザーがもう存在しないURLや頻繁にエラーに当たるURLを 除去するようにすることが出来る。 さらに、w3newerは、特定のURLでエラーに出くわした回数の連続カウンタ を保持したり、ホストまたはネットワークエラー(たとえば、「タイムアウト」 や「ネットワーク接続不可能」など)が起こっていれば、ホストに関する後続の URLをスキップするように変更することが出来る。「煩わしい」変更の問題に 対処するには、意味論レベルでの相違点を調べるためのヒューリスティックス( 発見的方法)を必要とする。 3.Snapshots:バージョンの履歴の外部表現 W3ページがいつ変更されたかを判断するための機構を提供するのに加えて、 比較のためにページの複数のバージョンにアクセスする方法が必要である。この セクションでは、バージョンの履歴を保持する方法と本願発明者らの解決策によ って生じるいくつかの問題について論じる。 3.1 選択的手法 W3ページのバージョニングを提供するのに3つの可能な手法がある。すなわ ち、各内容提供者が全バージョンの履歴を保持するようにするか、各ユーザーが この履歴を保持するようにするか、バージョンの履歴を外部サーバーに記憶する かである。 サーバー側のサポート 各サーバーがそのページの履歴を記憶し、その履歴を 用いて変更を強調するマークアップページを生成する機構を与えてもよい。この 方法では任意の内容提供者がバージョニングと差異特定を提供しなくてはならず 、実用的ではないが、内容提供者がやろうとするのであれば、この特徴をサポー トするのが望ましい。(セクション6.1を参照) クライアント側のサポート ホットリストのアイテムをローカルに記憶するプ ログラムを各ユーザが実行し、ローカルにセーブされたコピーに対してhtmldiff を動作させてもよい。この方法では、関心のあるページすべてを各ユーザーがセ ーブする必要があり、平均的ユーザーのホットリストのページ数が増えるにつれ て望ましくないものとなるであろうし、さらにW3ブラウザを動作させる全ての プラットフォームに対してhtmldiffを実行する能力が必要とされる。Netscape等 のプログラムはいずれにせよローカルにページをキャッシュし得るため、ホット リストによって参照されたページを記憶するのが妥当であるとはいえないかもし れない。この機能を与えるwarmlist[16]等の他の外部ツールも存在する。 外部サービス 本願発明者らの手法は、内容提供者とクライアントの双方から分 離されたサービスを稼働させるというものである。ページはHTMLフォームで サービスに登録され、同じように相違点を検索することが出来る。一旦、ページ がサービスに記憶されると、その後ページの状態を記憶するようにリクエストす ることでそのページと前にチェックしたバージョンとの相違点のみをセーブする RCS「チェックイン」動作が行われる。従って、一度に多くの点で変更するペ ージを除いては、最初にページのコピーをセーブする必要がある以外は記憶のオ ーバーヘッドが最小にされる。 「外部サービス」の手法での不都合は、サービスを利用する者全員が関心を示 したページ全部の状態を記憶し、かつどのユーザーが各ページのどのバージョン を見たかを記憶しなくてはならない点である。前者の問題は、主にリソース(資 源)割り当ての問題であり、サービスが非常に多くのクライアントによって多数 の大きなページに対して利用されていなければさほど大きな問題ではないと考え られる。後者の問題は、RCSのデートスタンプのサポートを利用し、ある時間 に存在した状態のページをリクエストすることによって対処できる。これに代え て、<ユーザー、URL>の各組み合わせについてバージョン番号を保持しても 良い。 ページがそれを元々提供していたマシンから移った場合に相対リンクが問題と なる。ソースが変更されないで渡されるのであれば、ブラウザは、snapshotスク リプトを含むCGIディレクトリに対してリンクが相対的であると見なすであろ う。HTMLは、異なるURLに対して相対的な相対リンクを形成するBASE 指示文をサポートし、これによって上記問題はほとんど対処できる。しかし、Ne tscapel.1Nはこのような文書内の内部リンクを新しいBASEにも相対的である ものとして扱い、それによってブラウザはhtmldiff出力と元の文書との間で予測 しないジャンプを行うこととなり得る。 3.2 システムの問題 snapshot機能で4つの重要な問題、すなわち、CGIの使用、同期、リソース 活用、およびセキュリティ/プライバシーの問題に対処しなくてはならない。 CGIは、snapshotがHTML出力を送信する以外にユーザーおよびそのブラ ウザと対話する手だてがないために問題となる。CGIスクリプトが呼び出され ると、httpdがデフォルトのタイムアウトをセットアップし、スクリプトがフル のタイムアウト間隔の間に出力を発生しなければ、httpdはブラウザにエラーを 返す。このことは、スクリプトがインターネットを介してページを検索してアー カイブされたバージョンと時間のかかる比較を行わなくてはならない可能性があ るため、snapshotにとって問題となる。その後の検索のタイムアウトの間隔がど の程度であれば妥当かについては、サーバーからsnapshotに知らされるのではな く、スクリプトへのハードコードとされる。HTTPコネクションを活かした状 態で保持するために、snapshotは、数秒ごとに1スペース(W3ブラウザには無 視される)を生成する子プロセスにフォーク(分岐)し、一方で親プロセスでは ページを検索するかまたはhtmldiffを実行する。 本機能を同時に利用するユーザー間での同期化は、ブックキーピングのための 複数ファイルの使用によって複雑になる。システムはRCSリポジトリへのアク セスと、HTML文書のローカルにキャッシュされたコピーと、各ページのどの バージョンをユーザーが見たかを記録する制御ファイルとを同期化しなくてはな らない。現在、URL毎のロックファイルとユーザー毎の制御ファイルの両方に 対してロックするUNIXファイルを用いてこれを行っている。複数のユーザーが同 時に同じページをリクエストすると第2のsnapshotプロセスはその作業を繰り返 すのではなくそのページを待ってから返すようにロックが待ち行列に入れられる のが理想である。これはスナップショットを行うためにはそう重要ではなく、そ の場合、プロキシキャッシュサーバーは第2のリクエストに迅速に応え、RCS は何も変更がないことを容易に判断することが出来るが、同じデータに対してht mldiffを2度起動する理由はない。 後者の点はリソース活用の一般的問題に関連している。Snapshotは、処理量も ディスク空間も大量に使用する可能性がある。サーバーに対してhtmldiffを実行 する必要があることによって、この機能がかなり利用される場合にはプロセッサ のロードが大きくなる可能性がある。これらのロードについては、しばらくhtml diffの出力をキャッシュして、あるページのNおよびN+1バージョンを見た多 くのユーザーがhtmldiffを1度呼び出せばhtmldiff(ページN,ページN+1) を検索できるようにする事によって、緩和することができる。この機能はまた、 多くのW3サービスのように、同時ユーザー数に制限を課したり、または複数の コンピュータ間でそれ自体を複製することもできる。 ディスク空間は、リポジトリが制限なく大きくなりユーザーにコストがかから なければ、問題となる可能性がある。実際に、このようなサービスをインターネ ット上に導入する前に、各ユーザーの認証を取り、ユーザーに固定数のURLお よび/またはディスクブロックの制限を課す必要があろう。インターネットの商 用機能を用いて、URL群を記憶する許可と引き替えに料金を徴収することが考 えられよう。この料金は、差異特定サービスに対しての支払いともなるため、記 憶媒体のコストを容易に相殺するであろう。 最後に、セキュリティおよびプライバシーも重要である。CGIスクリプトは 最小特権で動作するため、多くの人がアクセスを有するアカウントから、リポジ トリ内のデータが任意のCGIスクリプトおよびCGI領域にアクセスを有する 任意のユーザーの影響を受けやすい。このリポジトリ内のデータは、ブラウズ、 変更、または削除が可能である。この機能を用いるためには、後にバージョン番 号を比較するのに用いる識別子(現在は電子メールアドレスを用いており、これ は誰でも特定できる)を与えなくてはならない。従って、リポジトリのブラウジ ングによってどのユーザーがどのページに関心があり、ユーザーが新しいチェッ クポイントをどれだけ頻繁にセーブしたかを示すことが出来る。 安全が保証された機械上の認証されたシステムに移行することによって、より セキュリティを与えながら、これらのうちのある接続を断ち、個人のアクティビ ティを曖昧にすることができる。リポジトリは、バージョン番号とURLのセッ トと非個人のアカウント識別子を関連づけ、これらのアカウントのうちの1つに アクセスするのにパスワードが必要とされるであろう。しかし、アカウント形成 が匿名で行えない限りは、この機能を実行する者がどのユーザーがどのページに アクセスするかの情報を有するのである。 4 HtmlDiff:HTMLページの比較 本願発明者らの経験では、W3上のページのうちのごく一部しかページがどの 様に変更されたかをユーザーが確認するのを可能にする情報を含んでいない。最 近追加したものを強調するアイコンや、「変更記録簿」へのリンク、または特別 の「新規事項」ページ等がその例である。導入部で言及したように、これらの手 法には欠点がある。これらは、すべてのユーザーに見られることを意図している が、ユーザーはそれぞれ異なる間隔でページにアクセスし、「新規事項」に対す る概念がそれぞれ異なるのである。さらに、保守者は、通常マニュアルでHTM Lをマークアップすることによって最近の変更のリストを明確に生成しなくては ならない。 HTMLページの自動比較およびマークアップページの生成により、HTML の提供者は何が新しいかを判断する必要も、相違点を示す新しいまたは変更され たHTMLページを形成する必要もなくなる。文書の比較やその結果を提示する のには多くの方法がある。このセクションでは、HTML文書の比較に関する種 々のモデル、本願発明者らの比較アルゴリズム、および比較結果の提示にまつわ る問題について説明する。 4.1 Diffの内容 HTMLはマークアップと内容(生テキスト)を区別する。多くのマークアッ プ(たとえば、<P>、<I>、および<HR>)は、単に生テキストのフォー マティングおよびその提示を変更する一方で、マークアップの中には画像(<I MG src=...>)や、ハイパーテキスト参照(<A href=...>)等の内容定義 型のものがある。文書内の余白は(おそらく<PRE>内部以外は)いかなる内 容も与えず、比較に影響を与えるものであってはならない。 極端に言えば、HTML文書を単なる「内容定義型」マークアップと単語の列 としてみることが出来る。「内容定義」型でないマークアップと余白は比較とい う目的に関しては無視される。<P>...</P>内のテキストが段落として論 理的に一緒に分類されるということは無視される。その結果、4つの文からなる 段落をとってそれを4つの文(各々<LI>で始まる)のリスト(<UL>)に すると、内容は完全に一致するために相違点にはフラグは立てられない。 その逆に極端に言えば、HTMLを階層型文書としてみて、その文書の解析( パーズ)木または抽象構文木の表現を、部分木の等しさ(または何らかのより弱 い基準)を比較の基本として使用して、比較することが出来る。この場合、段落 (<P>...</P>)を表す部分木は、リスト(<UL>...</UL>)を表 す部分木とは比較できない可能性がある。段落をリストと置き換える例は、内容 およびフォーマット変更の両方としてフラグが立てられる。 本願発明者らは、HTML文書を「文分断」マークアップ(たとえば<P>, <HR>,<LI>または<H1>)と文の列としてみなし、ここで「文」はあ る(文を分断しない)マークアップ(たとえば<B>または<A>)と単語の列 である。「文」は、多くても英文1文を含むが、英文の一部分であっても良い。 マークアップは全て、それが「内容定義型」であるかないかに関わらず、表現さ れ、比較される。段落からリストに置き換える例では、比較によって内容の変更 は示されないが、フォーマットに対する変更は示される。 本願発明者らは、HTML文書を比較するのに最長共通サブシーケンス(LC S)の問題に対するHirshbergの解決策[4,5](その速度は最適化した)を採用 した。これは、UNIXのdiffユーティリティで利用される周知の比較アルゴリズム である[7]。LCSの問題は、最長である(または重みが一番大きい)2つのト ークン列の(必ずしも連続していない)の共通部分列を見つけることである。L CSにないトークンは変更を表す。Unixのdiffでは、トークンはテキストライン であり、各ラインが1に等しい重みを有する。htmldiffでは、トークンは、単語 および文分断マークアップの列からなる文または文分断マークアップのいずれか である。文の定義は再帰的ではなく、つまりある文がさらに文を含むことは出来 ないことに留意されたい。HTML文書の単純な字句解析によってトークン列を 形成し、マークアップ名と関連の(変数,値)ペアのケースをアッパーケース( 大文字)に変換する。構文解析は必要ではない。 次に、重みづけLCSアルゴリズムがどの様に2つのトークンを比較し、負で ない重みを計算してそれらの一致の程度を反映させるかを説明する(重み0は不 一致を示す)。文分断マークアップは文分断マークアップとしか一致し得ない。 これらは一致するためには、(余白、ケース、および(変数、値)ペアのリオー ダを法として)同一でなくてはならない(この区分の議諭についてはセクション 4.3を参照されたい)。一致は1に等しい重みを有する。文は文としか一致し 得ないが、文が一致するには互いに同一である必要はない。2つの文が一致する かどうかを判断するのに2つのステップを用いる。第1のステップは、文の長さ を比較単位として用いる。文の長さは、文中の単語と<IMG>または<A>等 の「内容定義型」マークアップの数として定義される。<B>または<I>等の マークアップはカウントされない。2つの文の長さが「十分に近い」のでなけれ ば、これらは一致しない。「十分に近い」場合には、第2のステップで2つの文 のLCSを計算する(単語と完全に一致する単語には重み1を割り当てられ、マ ークアップと完全に一致するマークアップも同様である)。Wを2つの文のLC Sの単語および内容定義型マークアップの数とし、Lを2つの文の長さの和とす る。(2*W)/Lの割合が十分に大きければ、それらの文は重みWで一致する が、そうでない場合には一致しない。 4.2 相違点の提示 上述の比較アルゴリズムにより、古い文書のトークンから新しい文書のトーク ンへのマッピングが得られる。マッピングを有するトークンは「共通」と称し、 古い(新しい)文書にはあるが新しい(古い)文書にはないトークンは「古い」 (「新しい」)と称する。「古い」および「新しい」トークンを「相違点」と称 する。 種々のマークアップ技術で相違点を強調するHTML文書を形成することによ り相違点を提示する3つの基本的な方法について調べた。 並置 縦方向に同期化された共通テキストを伴う文書を並置提示するのは、文 書間の相違点を表示する非常に一般的で納得のいく方法である(たとえば、Unix のsdiffまたはSGIのグラフィックdiffツールgdiffを参照)。残念ながら、現 在のHTMLおよびブラウザ技術にはこのような同期化を可能にする良好な機構 は(列毎に文書を有し、その行を使用して同期を達成する表を含む文書を形成す るのは可能かもしれないが)存在しない。 相違点のみの表示 相違点(古いものと新しいもの)のみを表示し、共通部分 は排除する(Unixのdiffと同様)。これは、文書問に共通部が多い「共通」ケー スには最適である。これは、非常に大型の文書には特に有用であるが、周囲の共 通コンテキスト(文脈)が失われるため、混乱を招きかねない。この手法での別 の問題としては、古い部分と新しい部分が介挿されているHTML文書は構文的 に不正確な可能性がある点である。 統合ページ 共通した内容、新しい内容、および古い内容全てを集約したHT MLページを形成する。これには、共通の内容が一度しか表示されない(並置提 示とは異なる)という利点がある。しかし、2つのページを1つに統合すると、 構文的および意味諭的に不正確なHTMLが形成される恐れが生じる。(たとえ ば、アイテムのリストを表に変換するケースを考察されたい。) 本願発明者らが選択したのは、相違点を統合ページのフォーマットで提示し、 コンテキストを与え、内部ハイパーテキスト参照を用いて相違点をまとめてチェ ーン状にリンクして、ユーザーが相違点から相違点へと迅速にジャンプできるよ うにする方法である。現在、統合による構文上/意味論上の問題については、統 合ページから古いマークアップを全て排除することによって対処している。(こ れは古い方のマークアップ全てという意味ではなく、比較アルゴリズムによって 「古い」と分類されたものだけであることに留意されたい)。そのため、古いハ イパーテキスト参照および画像は統合ページには現れない(もちろん、これらは 削除されているため、いずれにしてもアクセスできない)。しかし、「古い」と 「新しい」の意味を逆にすることによって、古いマークアップはそのままにして 新しいものを削除した統合ページを形成することが出来る。より厳しいオプショ ンは、古い内容全てを取り除くことであろう。この場合には、そもそも最も最近 のページが構文的に正確であれば、構文上の問題はない。統合ページは、単に最 も最近のページと新しい内容を指すマークアップとを併せたものとなる。統合ペ ージ形成の他の方法についても研究中である。 htmldiffの統合ページの出力の例が図1に示される。以下のように古い内容と 新しい内容を強調するのにマークアップが用いられる。文書内の変更領域を指す のに2つの小さな矢印の像が用いられる。赤い矢印は古い内容を指し、緑の矢印 は新しい内容を指す。矢印はまた、互いへの内部ハイパーテキスト参照であり、 チェーン状にリンクされて相違点に迅速に移動するのを可能にする。文書の前部 のバナーは、第1の相違点へのリンクを含む。古いテキストは<STRIKE>を用いて 、我々の経験上W3上で見られるHTMLでは滅多に用いられない「ストラック アウト」フォントで表示する。残念ながら、「新しい」テキストを示す理想的な フ ォントはなく、現在のところ<STRONG><I>を使用している。古いテキストと新し いテキストを強調するためにテキストまたはテキストの背景をカラーコードでき るのが理想であるが、現在のブラウザはこの機能を提供していない。別の手法と して、相違点でアクティブでないフオントを選択することも考えられる。 ここで、文書内のすべての変更が強調されるわけではないことに留意されたい 。たとえば、「内容定義型」でない新しいマークアップ(例えば<P>)はマー クアップされないが、アンカー等のマークアップは強調される。アンカーにおけ るURLは変更されるが<A>...</A>に囲まれる内容は変更されない例に ついて考えると、この場合、矢印によりアンカーのテキストが指されるが、テキ スト自体はその元のフォントのままであり、URLのみに対する変更を示す。 4.3 問題および拡張 htmldiffは、HTML文書の構文解析を行ってマークアップが不一致であった り抜けていたりといった構文上の問題を修正することができるため、唯一起こり そうな真の問題は、変更があまりにも広範囲に及んでいて、得られる統合HTM Lが解読不可能になることである。たとえば、一行おきに変更があれば、関連の ないストラックアウトおよび強調テキストが混在してしまう。古いテキストと新 しいテキストとを散在させられる度合いを変える方法と、変更が多すぎて表示す る意味がない場合を特定するしきい値については開発中である。 現在、htmldiffは「バージョン認識」も「ウェブ認識」もしない。つまり、ht mldiffは単に2つのHTMLページのテキストを比較するだけで、ページが参照 したり、アクセスしたり、他の参照ページ上で再帰的に呼び出したりするエンテ ィティのバージョン同士の比較は行わない。これにより様々な結果が生まれる。 良い点は、htmldiffが、リポジトリからバージョンを引き出したりW3上で情報 に対するリクエストを送ることによるオーバーヘッドを被らないことである。こ のコストはw3newerとsnapshotによって負担される。悪い点は、相違点の中には 無視されるものがあることである。例えば、画像ファイルの内容は変更されても ファイルのURLは変更されない場合には、そのページのURLは変更されたも のとしてフラグが立てられないのである。このような比較をサポートするには参 照されるエンティティのある種のバージョニングが必要となり、さらにhtmldiff がバージョンリポジトリにアクセスを有する必要がある。すべてのエンティティ の完全なバージョニングによって興味深い 比較を行うことができるだろうが、記憶上の要件を劇的に増大させてしまう。よ り安価な代替策として、各エンティティのチェックサムを記憶し、それを利用し て何か変更があったかどうかを判断することが考えられる。このような「より賢 い」比較を効率的に行う方法については研究中である。 5 ツールの統合 NO HANDSへのエントリポイント(入口)は、w3newerを介するものとsnapshot を介するものとの2つがある。 現在のところ、w3newerがユーザーによって直接、多くはcrontabエントリによ って呼び出され、どのページが変更したかを示すHTML文書を生成する。指定 されると、w3newerはホットリストの各文書と以下の3つのリンクを関連させる 。 記憶 snapshot機能にURLを送り、ページのコピーをセーブする。ページが 検索されても、RC Sciコマンドにより、前回記憶したものと変更がなければ セーブされないようになっている。 Diff snapshot機能にhtmldiffを呼び出させて、ユーザーが前回セーブしてか らのページの変更を表示させる。 履歴 snapshotに、任意のバージヨョるか、または特定のバージョンを直接見 せる機能を伴って、このページのバージョンの全ログを表示させる。(図2を参 照) このように、「新しい」と報告された各ページを即座にhtmldiffに渡すことが でき、リストのどのページも将来使用するのに備えて「記憶」することができる 。w3newerの出力の一例を図3に示す。 ユーザーはまた、snapshotに直接入ることを選択して、ページのチェックイン を行ったり、最新ページまたはバージョンの履歴を見るようにしても良い。図4 は、snapshotを介したNO HANDSへのインターフェースを示す。ユーザーが履歴の リンクを選択した場合には、図2に示されるページが提示される。比較する2つ のページを選択すると、図1のようにhtmldiffが呼び出される。 この手法の不利な点は、w3newer、snapshot、W3ブラウザの間に直接のインタ ラクションがないことである。htmldiffでページを見てもブラウザはそのページ が見られたことを記録することにはならず、ブラウザはまずhtmldiffを呼び出す のに使用したURLを記録する。その後、w3newerはブラウザから古くなってし まったデートスタンプを使用し、ブラウザが見たのよりも最近にページが変更さ れたことを報告し続ける。その結果、ユーザーはページを直接見ると共にhtmldi ffを介しても見ない限りは、これを変更ページのリストから外して実際の相違点 を見ることはできない。 6 拡張 このセクションでは、既に説明した作業に対して実行できる拡張について説明 する。セクション6.1では、既に実現されているhtmldiffとRCSのインター フェースについて述べ、セクション6.2および6.3ではまだ実現されていな い、変更の追跡のサーバーへの統合とHTTP POSTプロトコルを介したス クリプトの呼び出しについての拡張を論じる。 6.1 サーバー側のバージョン制御 上述のツールは、W3上の任意のクライアントまたはサーバーの変更を必要と しない。文書のバージョンをセーブしてそれらがどう変更されたかを示すマーク アップ済みバージョンを与える特定のサーバーと通信するのには、既存のGET およびPOSTプロトコルを用いる。しかし、サーバーがhtmldiffおよびあるpe rlスクリプトを動作させる場合には、直接的なバージョン制御インターフェース を与えてそのHTML文書のコピーをどこか別の場所に記憶させる必要をなくす ことができる。 本願発明者らが作成したperlスクリプトは、RCSへのインターフェースを与 える[14]。CGIスクリプト(/cgi-bin/rlog)は、rlogの出力をHTMLに変換 し、任意の特定のバージョンを見たり2つのバージョン間の相違点を見いだすた めのリンクを伴った文書の履歴をユーザーに示す。別のスクリプト(/cgi-bin/co )は、RCSの制御下で文書のバージョンを表示し、さらに別のスクリプト(cgi- bin/rcsdiff)は、相違点を表示する。ファイル名が.htmlで終わる場合には、rcs diffではなくhtmldiffを用いて相違点を表示する。 例えば、HTML文書の末尾にLast-Modifiedフィールドをrlogスクリプトへ のリンクとなるようにセットアップして、文書名をパラメータとして指定しても よい。この目立たないフィールドをクリックすると、ユーザーは文書の履歴を見 ることができる。 6.2 サーバー側のURL追跡 現在、w3newerはユーザーのマシン上で動作するため、スクリプトの複数のイ ンスタンシエーションにより同じ作業を行う可能性がある。これは、AT&Tワ イドのプロキシキャッシングサーバーと同じマシン上の関連デーモンを動作させ て、現在サーバー上でキャッシュされているページについての情報を戻してイン ターネットを介してのいくつかのアクセスについては行わないのだが、そのキャ ッシュには多数のリクエストの必要をなくすだけの十分な局所性がない。 これに代えて、w3newerをsnapshotデーモンによってセーブされたページ群に 対して動作させてもよい。ページに関心があるとして登録したユーザーの数に関 わらず、一度チェックするだけでよいのである。変更があると、新しいバージョ ンが自動的にセーブされる。すると、ユーザーはセーブされた全ページのリスト をリクエストして、ユーザーがセーブしてからどのページが変更されたかの示唆 を受けることができる。 これにより規模の利益(economies of scale)が得られるため、この機能を加え るのは有用である。しかし、ユーザーのW3ブラウザ履歴からは切り離されると いう不都合がある。すなわち、ユーザーがページを直接見ると、snapshot機能は これを示さないため、このページを変更されたものとして提示する可能性がある 。 6.3 CGIスクリプトとのインタラクション NO HANDSは任意のURLを扱うことができるため、URLの一部としてスクリ プトにアーギュメント(引数)を受け渡しすることによって、GETプロトコル を使用するCGIスクリプトと対話できる。しかし、POSTを使用するサービ スへの入力は記憶されないため、このサービスにはアクセスできない。 w3newerもsnapshotもPOSTプロトコルをサポートするように変更しなけれ ば、サービスを呼び出して結果が変更されたかどうかを調べ、その結果を記憶し てもし変更があれば表示するということはできない。しかし、POSTをサポー トするNO HANDSへのインターフェースは、わかりやすくはない。ユーザーはフォ ームが呼び出すURLをNO HANDSによって与えられるものに変更する。そして、 実際のサービスに渡すにはその入力のコピーを形成しなくてはならない。その結 果は、UNIXのパイプに相当するHTTPであって、ユーザーが呼び出そうとしている サービスとブラウザとの間に追加のサービスを介挿することとなる。 これに代えて、フォームに関してよりよいサポートを有するようにブラウザを 変更することができる。すなわち ・そのブックマークファイルにフォームの記入済みのものを記憶させて、ユー ザーがCGIスクリプトの出力に直接ジャンプできるようにする。 ・FORMタグで指定されたURLとともに、フォームをNO HANDSに直接渡し て、出力がRCSのもとで記憶されるようにする。 7 結論 NO HANDSは、単一の結合ツールにW3ページの通知、アーカイビング、差異特 定を組み合わせるものである。さらに、不必要なHTTPアクセスを避け、各ページ は変更される度に(それを追跡するユーザーの数に関わらず)多くても一度だけ セーブされ、基底バージョニングシステムとしてRCSを使用することにより、 規模の利益を与える。HTMLの枠内での相違点の自動生成によって、ユーザー は好都合に挿入点と削除点の両方を知ることができる。 W3および文書検索の一般的環境において、NO HANDSは、2つの集団に利益を 与える。すなわち、W3のユーザーは変更した関心のあるページを探すためにブ ラウズする必要がなくなるし、HTML提供者は「新規事項」を示すために適切 にマークアップされたページを形成する必要がなくなる。このような自動化がこ の一般的状況で便利であることは明らかであるが、さらに、共同作業や分散型作 業に関わる領域では特に、W3のより集中的な使用においてNO HANDSが重要な役 割を果たすことが期待される。 まだ対処すべき問題がいくつか残っている。特に、W3ブラウザおよびサーバ ーとよりよく統合させることによってNO HANDSの多くの複雑な点を回避できるで あろう。例えば、あるページの古いバージョンと最新バージョンとの相違点を見 ることにより、ページがいつ最後に見られたかについてのブラウザの認識が更新 されるようにしなくてはならない。最後に、Harvest[1]等の分散型階層HTTPリポ ジトリの可用性が増大すると、スケーラブル通知機構およびバージョンアーカイ ブにとって好機であり課題となるであろう。 コンピュータプログラムリスト
【手続補正書】特許法第184条の8第1項 【提出日】平成9年5月23日(1997.5.23) 【補正内容】 データ内に含まれており、そこから導出できることを示している。例えば、各バ ージョンはその全体が記憶されてもよいし、または、バージョンの一つについて はその全体が記憶されて、他のバージョンはそのバージョンとの相違の形態とし て記憶されてもよい。 バージョン制御システムは、ユーザーに選択されたどのバージョンをも再構築 する。 しかし、このようなソフトウェアの多くに欠点がある。一般に、システムの中 には、ユーザーに変更があったことは知らせるものの、その変更自体は識別しな いものがあったり、逆に、変更は識別する(これらのシステムは一般に「diff」 システムとして知られる)ものの、特定の文書対の識別に応じてのみこれを行う ものがある。 発明の概要 本発明の一形態は、リポジトリ内に含まれる文書をユーザーが調べるのを監視 するものである。本発明では、その文書の変更について継続的にモニタする。本 発明によると、ユーザーがその後で文書を調べる際に、その最新の形態の文書を 提示し、ユーザーがその文書を最後に見た後に起こった変更を示す。 図面の簡単な説明 図1Aは、従来のバージョン制御システムを示す。 図1Bは、ハイパーテキスト情報検索に関わる選択概念を示す。 図1は、本発明の例示的な実施形態を示す。 図2は、ホットリストと、リポジトリから外部サービスへのページのコピーを 示す。 図3は、ページの元のバージョンのコピーと、その元のバージョンに対して行 われた変更を含む外部サービス内のアーカイブを示す。 図3Aは、ページの種々のバージョンをリストにした本発明によって生成され る表示を示す。 図3Bは、ホットリスト内のページで変更されたものを特定する本発明によっ て生成される表示を示す。 図4は、前のバージョンから行われた変更を示すフォーマットで提示されるペ ージの最新バージョンを示す。 図5は、図2のユーザーが一人であった場合に対して、二人のユーザーのホッ トリストを示す。 図6は、本発明の一形態によって実現される論理を示すフローチャートである 。 図7は、3つのページの時間的履歴である。 図8は、外部サービスの1タイプのアーキテクチャの一部である。 図9は、本発明の一形態を示す。 図10は、本発明の一形態を示す。 図11は、HTTP://SNAPPLE.CS.WASHINGTON.EDU.600/MOBILE/の2つのバージョ ンのサブセット間の相違点を示すHTMLDIFFの出力を示す。もとのHTMLソース は、その結果が1ページに収まるようにマニュアルで編集される。実用では、強 調されている変更は、

Claims (1)

  1. 【特許請求の範囲】 1.システムであって、 a)前記システムに対して読み出し専用でページを提供する外部リポジトリか らページのバージョンをコピーするための手段と、 b)i)選択されたバージョンを再構築するのを可能にし、 ii)選択されたバージョン間の相違点を特定することができる データを記憶するための手段と、 を含むことを特徴とするシステム。 2.請求項1に記載のシステムであって、再構築されるバージョンが、ユーザ ーによって提供されるリスト上で特定されることを特徴とするシステム。 3.複数のユーザーが、時間がたつにつれてそのうちの少なくともいくつかが 変更するデータのバージョンを含む別のシステムとインターフェースすることを 可能にするシステムにおいて、その改良点が a)ユーザーが最新バージョンと前のバージョンを識別することを可能にする 手段と、 b)最新バージョンを前のバージョンと区別するフォーマットで該最新バージ ョンを表示するための手段と、 を含むことを特徴とするシステム。 4.時間とともに変更する最新バージョンの形態でデータ単位を記憶するリポ ジトリと通信する方法であって、 a)複数のユーザーからデータ単位のリストを受け取るステップと、 b)リストに含まれるデータ単位の選択されたバージョンの再構築を可能にす る内容を含むアーカイブを保持するステップと、 c)間隔をおいて、最新バージョンをアーカイブされた内容と比較し、該アー カイブを更新するステップと、 を含むことを特徴とする方法。 5.請求項4に記載の方法であって、 d)各ユーザーがどのバージョンにアクセスしたかを記録するステップをさら に含むことを特徴とする方法。 6.請求項5に記載の方法であって、 e)ユーザーからデータ単位に対するリクエストを受け取るステップと、 f)該データ単位の最新バージョンを提示するステップと、 g)ユーザーがアクセスした前のバージョンにはなかった該最新バージョン内 の内容を強調させるステップと、 をさらに含むことを特徴とする方法。 7.時間とともに変更するバージョンの形態でデータ単位を記憶するリポジト リと通信する方法であって、 a)データ単位の選択されたバージョンの再構築を可能にする内容を含むアー カイブを保持するステップと、 b)ユーザーからデータ単位のリストを受け取るステップと、 c)受け取った各リストについて、該アーカイブをチェックし、リストに挙げ られたデータ単位がアーカイブされていなければ、該リポジトリから最新バージ ョンをコピーするステップと、 d)間隔をおいて i)(A)該アーカイブ内に含まれるバージョンと、(B)該リポジトリ内 に含まれる最新バージョンと、の相違点を見出すステップと、 ii)該アーカイブに該相違点を記憶するステップと、 e)各ユーザーがアクセスした最も最近のバージョンを示す情報を該各ユーザ ーについて保持するステップと、 f)ユーザーから最新バージョンに対するリクエストを受け取り、それに応じ て、 i)該リポジトリから該最新バージョンをコピーするステップと、 ii)該最新バージョンと該アクセスした最も最近のバージョンとの相違点 を見出すステップと、 iii)該相違点を強調させるフォーマットで該最新バージョンを表示する ステップと、 を含むことを特徴とする方法。 8.語とマークアップコマンドの列を含むマークアップ言語で書かれた第1の テキストと、第2のそのようなテキストとを比較するための装置であって、 a)その第1のサブセットに属する句点およびマークアップコマンドを含む終 止符群に定義される該第1および第2のテキストの列を比較して、該テキスト間 の相違点を示す結果を生成する第1および第2のテキストの比較手段と、 b)該結果を受け、それに応じて該相違点を表示する手段と、 を含むことを特徴とする装置。 9.リポジトリ内のページのバージョン同士を比較するための装置であって、 a)第2のページが第1のページの新しいバージョンであることを検出するた めの手段と、 b)前記検出手段に応じて、該第1のページを該第2のページと比較し、該第 1および第2のページ間の相違点を示す結果を生成するための手段と、 c)該結果に応じて、該相違点を表示するための手段と、 を含むことを特徴とする装置。 10.リポジトリ内のページが、あるユーザーが最後にそれを見てから変更さ れているかどうかを検出する方法であって、前記ユーザーが用いるコンピュータ システムにおいて実行される以下のステップ、すなわち、 a)前記コンピュータシステム内で、第1のページ群の各ページについて前記 ユーザーが該ページを見た最後の時間を示すページ最終閲覧時間の第1の記録を 保持して、最後に見た時間が該第1の記録に記録される所与のページについて、 前記コンピュータ内のページ最終変更時間の第2の記録から、該所与のページの 最後変更時間を得て、該第2の記録からの該最終変更時間が、該所与の記録につ いての最終閲覧時間よりも遅いような時間であるかどうかを判断するステップと 、 b)該第2の記録が、そのような時間である最終変更時間を与えていなければ 、ユーザーがアクセスを有する前記コンピュータシステムの外部のソースから最 終変更時間を得て、該外部ソースからの該最終変更時間がそのような時間である かどうかを判断するステップと、 c)該外部ソースから得られた該最終変更時間がそのような時間であれば、該 第2の記録を該最終変更時間で更新するステップと、 を含むことを特徴とする方法。 11.ユーザーによって定義されたページのバージョン履歴を保持する方法で あって、 a)ページの所与のバージョンを該ページのバージョン履歴に保持すべきこと を指定する指示を該ユーザーから受けるステップと、 b)該所与のバージョンが該バージョン履歴内のページの最初のバージョンで あれば、該所与のバージョンのコピーを該バージョン履歴に記憶するステップと 、 c)そうでなければ、少なくとも、該所与のバージョンと該バージョン履歴内 の最も最近の前のバージョンとの何らかの相違点について記憶するステップと、 を含むことを特徴とする方法。
JP51681197A 1995-10-27 1996-10-25 オンラインデータリポジトリの変更データの識別 Pending JP2001503537A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US08/549,359 US6366933B1 (en) 1995-10-27 1995-10-27 Method and apparatus for tracking and viewing changes on the web
US08/549,359 1995-10-27
PCT/US1996/017142 WO1997015890A1 (en) 1995-10-27 1996-10-25 Identifying changes in on-line data repositories

Publications (1)

Publication Number Publication Date
JP2001503537A true JP2001503537A (ja) 2001-03-13

Family

ID=24192693

Family Applications (1)

Application Number Title Priority Date Filing Date
JP51681197A Pending JP2001503537A (ja) 1995-10-27 1996-10-25 オンラインデータリポジトリの変更データの識別

Country Status (5)

Country Link
US (2) US6366933B1 (ja)
EP (1) EP0850454A1 (ja)
JP (1) JP2001503537A (ja)
CA (1) CA2232070C (ja)
WO (1) WO1997015890A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10143418A (ja) * 1996-09-13 1998-05-29 Toshiba Corp 文書情報更新監視装置および文書情報の更新監視方法
JP2010086531A (ja) * 2008-10-02 2010-04-15 Nhn Corp ウェブ文書原本判別方法およびウェブ文書原本判別システム、並びにウェブ文書履歴情報提供方法およびウェブ文書履歴情報提供方法システム
JP2012529688A (ja) * 2009-06-23 2012-11-22 北京捜狗科技▲発▼展有限公司 更新通知方法、およびシステム

Families Citing this family (436)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5694546A (en) * 1994-05-31 1997-12-02 Reisman; Richard R. System for automatic unattended electronic information transport between a server and a client by a vendor provided transport software with a manifest list
US20050027618A1 (en) * 1996-01-17 2005-02-03 Privacy Infrastructure, Inc. Third party privacy system
US6119101A (en) * 1996-01-17 2000-09-12 Personal Agents, Inc. Intelligent agents for electronic commerce
US7293228B1 (en) 1997-01-31 2007-11-06 Timebase Pty Limited Maltweb multi-axis viewing interface and higher level scoping
AUPO489297A0 (en) * 1997-01-31 1997-02-27 Aunty Abha's Electronic Publishing Pty Ltd A system for electronic publishing
US6256712B1 (en) 1997-08-01 2001-07-03 International Business Machines Corporation Scaleable method for maintaining and making consistent updates to caches
US6026413A (en) * 1997-08-01 2000-02-15 International Business Machines Corporation Determining how changes to underlying data affect cached objects
US6006206A (en) * 1997-09-08 1999-12-21 Reuters Limited Data health monitor for financial information communications networks
US7865546B1 (en) * 1998-01-26 2011-01-04 New York University Method and appartus for monitor and notification in a network
US6857102B1 (en) * 1998-04-07 2005-02-15 Fuji Xerox Co., Ltd. Document re-authoring systems and methods for providing device-independent access to the world wide web
US7162689B2 (en) 1998-05-28 2007-01-09 Oracle International Corporation Schema evolution in replication
US6532479B2 (en) * 1998-05-28 2003-03-11 Oracle Corp. Data replication for front office automation
US7120862B1 (en) * 1998-12-01 2006-10-10 Lucent Technologies Inc. Method and apparatus for persistent access to Web resources using variable time-stamps
EP1006462A3 (en) 1998-12-01 2005-03-30 Lucent Technologies Inc. A method and apparatus for persistent storage of web resources
US6366910B1 (en) 1998-12-07 2002-04-02 Amazon.Com, Inc. Method and system for generation of hierarchical search results
US6681369B2 (en) * 1999-05-05 2004-01-20 Xerox Corporation System for providing document change information for a community of users
US6839879B1 (en) * 1999-05-07 2005-01-04 Xilinx, Inc. Method and system for time-stamping and managing electronic documents
US20050097160A1 (en) * 1999-05-21 2005-05-05 Stob James A. Method for providing information about a site to a network cataloger
US6477565B1 (en) * 1999-06-01 2002-11-05 Yodlee.Com, Inc. Method and apparatus for restructuring of personalized data for transmission from a data network to connected and portable network appliances
US7099914B1 (en) * 1999-06-24 2006-08-29 International Business Machines Corporation System and method for variable size retrieval of webpage data
US6560620B1 (en) * 1999-08-03 2003-05-06 Aplix Research, Inc. Hierarchical document comparison system and method
US20040078464A1 (en) * 1999-09-16 2004-04-22 Rajan Sreeranga P. Method and apparatus for enabling real time monitoring and notification of data updates for WEB-based data synchronization services
US7661062B1 (en) * 1999-09-20 2010-02-09 Business Objects Americas System and method of analyzing an HTML document for changes such that the changed areas can be displayed with the original formatting intact
US7171616B1 (en) * 1999-09-27 2007-01-30 International Business Machines Corporation Method, system and computer program product for keeping files current
US8543901B1 (en) * 1999-11-01 2013-09-24 Level 3 Communications, Llc Verification of content stored in a network
US6944821B1 (en) * 1999-12-07 2005-09-13 International Business Machines Corporation Copy/paste mechanism and paste buffer that includes source information for copied data
US6694352B1 (en) * 1999-12-16 2004-02-17 Microsoft Corporation Methods and systems for notifying clients concerning live electronic presentations
US6564233B1 (en) * 1999-12-17 2003-05-13 Openwave Systems Inc. Server chaining system for usenet
US6757682B1 (en) 2000-01-28 2004-06-29 Interval Research Corporation Alerting users to items of current interest
US6981225B1 (en) * 2000-01-31 2005-12-27 Intel Corporation Indicating the differences between Internet web pages
US7114124B2 (en) * 2000-02-28 2006-09-26 Xerox Corporation Method and system for information retrieval from query evaluations of very large full-text databases
JP2003525495A (ja) 2000-03-01 2003-08-26 コンピュータ アソシエイツ シンク,インコーポレイテッド コンピュータ・ファイルのアーカイブを更新する方法及びシステム
US6510432B1 (en) 2000-03-24 2003-01-21 International Business Machines Corporation Methods, systems and computer program products for archiving topical search results of web servers
US6917960B1 (en) * 2000-05-05 2005-07-12 Jibe Networks Intelligent content precaching
US8903950B2 (en) * 2000-05-05 2014-12-02 Citrix Systems, Inc. Personalized content delivery using peer-to-peer precaching
US7475404B2 (en) 2000-05-18 2009-01-06 Maquis Techtrix Llc System and method for implementing click-through for browser executed software including ad proxy and proxy cookie caching
US8086697B2 (en) 2005-06-28 2011-12-27 Claria Innovations, Llc Techniques for displaying impressions in documents delivered over a computer network
US20010047404A1 (en) * 2000-05-24 2001-11-29 Takashi Suda Apparatus for managing web site addresses
US6874124B2 (en) * 2000-05-31 2005-03-29 Fujitsu Limited Electronic document processing system and electronic document processors
JP2001353678A (ja) * 2000-06-12 2001-12-25 Sony Corp オーサリング・システム及びオーサリング方法、並びに記憶媒体
US7219304B1 (en) * 2000-06-19 2007-05-15 International Business Machines Corporation System and method for developing and administering web applications and services from a workflow, enterprise, and mail-enabled web application server and platform
US7593960B2 (en) * 2000-06-20 2009-09-22 Fatwire Corporation System and method for least work publishing
US6868387B1 (en) * 2000-06-23 2005-03-15 Abb Vetco Gray, Inc. Automated notification of part revisions for outside suppliers
US7058700B1 (en) * 2000-07-13 2006-06-06 Oracle International Corporation Delta caching
US7313588B1 (en) * 2000-07-13 2007-12-25 Biap Systems, Inc. Locally executing software agent for retrieving remote content and method for creation and use of the agent
US6882344B1 (en) * 2000-07-25 2005-04-19 Extensis, Inc. Method for examining font files for corruption
US20020023226A1 (en) * 2000-08-21 2002-02-21 Kabushiki Kaisha Network Doc Falsification preventing apparatus, falsification preventing method and recording medium therefor
US7793220B1 (en) 2000-08-29 2010-09-07 Citrix Systems, Inc. Scalable derivative services
US7035907B1 (en) * 2000-09-13 2006-04-25 Jibe Networks, Inc. Manipulating content objects to control their display
US7178097B1 (en) * 2000-11-13 2007-02-13 Srikrishna Talluri Method and system for using a communications network to archive and retrieve bibliography information and reference material
US7152224B1 (en) * 2000-11-21 2006-12-19 Microsoft Corporation Versioned project associations
US6916521B2 (en) * 2000-12-13 2005-07-12 Fuji Photo Film Co., Ltd. Cleaning medium for magnetic recording apparatus
CA2328566A1 (en) * 2000-12-15 2002-06-15 Ibm Canada Limited - Ibm Canada Limitee System and method for providing language-specific extensions to the compare facility in an edit system
US20020087536A1 (en) * 2001-01-04 2002-07-04 Ferguson Helaman David Pratt Methods for reproducing and recreating original data
US7783972B2 (en) * 2001-01-08 2010-08-24 Enfocus NV Ensured workflow system and method for editing a consolidated file
US6917950B2 (en) * 2001-01-10 2005-07-12 Intel Corporation Modifying a shared resource
US20020107886A1 (en) * 2001-02-07 2002-08-08 Gentner Donald R. Method and apparatus for automatic document electronic versioning system
US6978420B2 (en) * 2001-02-12 2005-12-20 Aplix Research, Inc. Hierarchical document cross-reference system and method
US6915482B2 (en) * 2001-03-28 2005-07-05 Cyber Watcher As Method and arrangement for web information monitoring
US20040205538A1 (en) * 2001-04-05 2004-10-14 International Business Machines Corporation Method and apparatus for online integration of offline document correction
US7543024B2 (en) * 2001-05-03 2009-06-02 Oracle International Corporation System and method for monitoring multiple online resources in different formats
US20030005041A1 (en) * 2001-06-29 2003-01-02 International Business Machines Corporation World wide web document distribution system with user selective accessing of any one of a stored historical sequence of changed versions of a bookmarked web document
US20030041305A1 (en) * 2001-07-18 2003-02-27 Christoph Schnelle Resilient data links
KR100414406B1 (ko) * 2001-08-09 2004-01-14 주식회사 핸디소프트 문서 버전 관리가 가능한 워크플로우 시스템 및 이를이용한 문서 버전 관리 방법
JP4294912B2 (ja) * 2001-08-13 2009-07-15 ブラザー工業株式会社 端末情報通知システム、端末情報通知方法及びネットワーク端末装置
US7363310B2 (en) 2001-09-04 2008-04-22 Timebase Pty Limited Mapping of data from XML to SQL
US20040205539A1 (en) * 2001-09-07 2004-10-14 Mak Mingchi Stephen Method and apparatus for iterative merging of documents
US7051031B2 (en) * 2001-10-09 2006-05-23 Sun Microsystems, Inc. Method, system, and program for managing accesses to data objects by multiple user programs over a network
US7035866B1 (en) * 2001-10-09 2006-04-25 Microsoft Corporation System and method providing diffgram format
US7281206B2 (en) * 2001-11-16 2007-10-09 Timebase Pty Limited Maintenance of a markup language document in a database
DE10161034A1 (de) * 2001-12-12 2003-07-03 Siemens Ag Verfahren zur Übergabe und Verarbeitung von Daten an eine Datenverarbeitungseinheit
US6768998B2 (en) * 2001-12-19 2004-07-27 General Electric Company Systems and methods for network-based technical library
US20030122865A1 (en) * 2002-01-03 2003-07-03 Lake Adam T. Methods and apparatus for user directed banner displays and web page navigation
US7412463B2 (en) 2002-01-11 2008-08-12 Bloomberg Finance L.P. Dynamic legal database providing historical and current versions of bodies of law
US7174377B2 (en) * 2002-01-16 2007-02-06 Xerox Corporation Method and apparatus for collaborative document versioning of networked documents
FR2835384A1 (fr) * 2002-01-31 2003-08-01 Thomson Licensing Sa Procede de gestion d'enregistrements de documents audiovisuels et dispositifs associes
WO2003065180A2 (en) * 2002-02-01 2003-08-07 John Fairweather System and method for creating a distributed network architecture
JP4043251B2 (ja) * 2002-02-12 2008-02-06 富士通株式会社 サーバプログラム
US20040015785A1 (en) * 2002-02-22 2004-01-22 Bo-In Lin Automatic link generation for linking to relevant data records circumstantial to document processes
US6996558B2 (en) 2002-02-26 2006-02-07 International Business Machines Corporation Application portability and extensibility through database schema and query abstraction
US7478170B2 (en) * 2002-03-05 2009-01-13 Sun Microsystems, Inc. Generic infrastructure for converting documents between formats with merge capabilities
US7222170B2 (en) * 2002-03-14 2007-05-22 Hewlett-Packard Development Company, L.P. Tracking hits for network files using transmitted counter instructions
US7260773B2 (en) * 2002-03-28 2007-08-21 Uri Zernik Device system and method for determining document similarities and differences
US20030197723A1 (en) * 2002-04-19 2003-10-23 Young Brian R. Methods, apparatus and computer program products for providing network device status information
US20040073581A1 (en) * 2002-06-27 2004-04-15 Mcvoy Lawrence W. Version controlled associative array
US8370420B1 (en) 2002-07-11 2013-02-05 Citrix Systems, Inc. Web-integrated display of locally stored content objects
US20040036912A1 (en) * 2002-08-20 2004-02-26 Shih-Ping Liou Method and system for accessing documents in environments with limited connection speed, storage, and screen space
US7418661B2 (en) * 2002-09-17 2008-08-26 Hewlett-Packard Development Company, L.P. Published web page version tracking
US7398200B2 (en) * 2002-10-16 2008-07-08 Adobe Systems Incorporated Token stream differencing with moved-block detection
US20040177343A1 (en) * 2002-11-04 2004-09-09 Mcvoy Lawrence W. Method and apparatus for understanding and resolving conflicts in a merge
US7603341B2 (en) 2002-11-05 2009-10-13 Claria Corporation Updating the content of a presentation vehicle in a computer network
US20040093564A1 (en) * 2002-11-07 2004-05-13 International Business Machines Corporation Method and apparatus for visualizing changes in data
US7072893B1 (en) * 2002-11-27 2006-07-04 Adobe Systems Incorporated Repairing links in locked files
US7028031B1 (en) 2002-11-27 2006-04-11 Adobe Systems Incorporated Repairing links in deactivated files
JP3753244B2 (ja) * 2002-11-27 2006-03-08 日本電気株式会社 リアルタイムウェブ共有システム
US20040107319A1 (en) * 2002-12-03 2004-06-03 D'orto David M. Cache management system and method
US7392267B2 (en) * 2002-12-04 2008-06-24 International Business Machines Corporation Annotation validity using partial checksums
US7092973B2 (en) * 2002-12-23 2006-08-15 Sap Aktiengesellschaft Conflict detection in a distributed system landscape
US7240077B1 (en) 2002-12-30 2007-07-03 Amazon.Com, Inc. Web site content change management
US20040196313A1 (en) * 2003-02-26 2004-10-07 Microsoft Corporation Ink repurposing
US20040181515A1 (en) * 2003-03-13 2004-09-16 International Business Machines Corporation Group administration of universal resource identifiers with members identified in search result
US7139781B2 (en) 2003-04-29 2006-11-21 International Business Machines Corporation Managing filesystem versions
US7373594B1 (en) 2003-04-30 2008-05-13 Amazon.Com, Inc. Managing the release of electronic content using a template without version logic
US7519949B2 (en) * 2003-05-15 2009-04-14 International Business Machines Corporation Marking changes based on a region and a threshold
FI20031169A (fi) * 2003-08-19 2005-02-20 Nokia Corp Informaatiosisällön päivittäminen pienelle näytölle
US7577995B2 (en) * 2003-09-16 2009-08-18 At&T Intellectual Property I, L.P. Controlling user-access to computer applications
US20050066290A1 (en) * 2003-09-16 2005-03-24 Chebolu Anil Kumar Pop-up capture
US7472254B2 (en) * 2003-10-10 2008-12-30 Iora, Ltd. Systems and methods for modifying a set of data objects
US7571391B2 (en) * 2003-10-17 2009-08-04 Sap Ag Selective rendering of user interface of computer program
US7206777B2 (en) * 2003-10-29 2007-04-17 International Business Machines Corporation Method and system for archiving and retrieving a markup language document
US8170912B2 (en) 2003-11-25 2012-05-01 Carhamm Ltd., Llc Database structure and front end
US20050120060A1 (en) * 2003-11-29 2005-06-02 Yu Meng System and method for solving the dead-link problem of web pages on the Internet
US7900133B2 (en) 2003-12-09 2011-03-01 International Business Machines Corporation Annotation structure type determination
US20050138540A1 (en) * 2003-12-22 2005-06-23 Xerox Corporation Systems and methods for user-specific document change highlighting
US7366727B2 (en) * 2004-03-12 2008-04-29 Sap Aktiengesellschaft Management of inbound conflicts when merging data of distributed systems
US20050222968A1 (en) * 2004-04-06 2005-10-06 International Business Machines Corporation System, method and program product for identifying differences between sets of program container files
US9203648B2 (en) 2004-05-02 2015-12-01 Thomson Reuters Global Resources Online fraud solution
US20070107053A1 (en) * 2004-05-02 2007-05-10 Markmonitor, Inc. Enhanced responses to online fraud
US7913302B2 (en) * 2004-05-02 2011-03-22 Markmonitor, Inc. Advanced responses to online fraud
US7870608B2 (en) * 2004-05-02 2011-01-11 Markmonitor, Inc. Early detection and monitoring of online fraud
US7457823B2 (en) 2004-05-02 2008-11-25 Markmonitor Inc. Methods and systems for analyzing data related to possible online fraud
US8769671B2 (en) * 2004-05-02 2014-07-01 Markmonitor Inc. Online fraud solution
US8041769B2 (en) * 2004-05-02 2011-10-18 Markmonitor Inc. Generating phish messages
US20050278302A1 (en) * 2004-05-27 2005-12-15 Ritter Gerd M Search of recently accessed documents
US20060031317A1 (en) * 2004-06-04 2006-02-09 Wanrong Lin System for synthesizing instant message and presence attributes from polled, queried and event information sources
US20050278537A1 (en) * 2004-06-10 2005-12-15 Dustin Kirkland Logging off a user from a website
US7580929B2 (en) * 2004-07-26 2009-08-25 Google Inc. Phrase-based personalization of searches in an information retrieval system
US7711679B2 (en) * 2004-07-26 2010-05-04 Google Inc. Phrase-based detection of duplicate documents in an information retrieval system
US7702618B1 (en) 2004-07-26 2010-04-20 Google Inc. Information retrieval system for archiving multiple document versions
US7599914B2 (en) 2004-07-26 2009-10-06 Google Inc. Phrase-based searching in an information retrieval system
US7567959B2 (en) 2004-07-26 2009-07-28 Google Inc. Multiple index based information retrieval system
US7536408B2 (en) 2004-07-26 2009-05-19 Google Inc. Phrase-based indexing in an information retrieval system
US7426507B1 (en) 2004-07-26 2008-09-16 Google, Inc. Automatic taxonomy generation in search results using phrases
US7580921B2 (en) * 2004-07-26 2009-08-25 Google Inc. Phrase identification in an information retrieval system
US7584175B2 (en) 2004-07-26 2009-09-01 Google Inc. Phrase-based generation of document descriptions
US7199571B2 (en) * 2004-07-27 2007-04-03 Optisense Network, Inc. Probe apparatus for use in a separable connector, and systems including same
US20060026567A1 (en) * 2004-07-27 2006-02-02 Mcvoy Lawrence W Distribution of data/metadata in a version control system
US7117118B2 (en) * 2004-08-04 2006-10-03 International Business Machines Corporation Efficient accumulation of performance statistics in a multi-port network
US7720845B2 (en) * 2004-08-13 2010-05-18 Yahoo! Inc. Systems and methods for updating query results based on query deltas
US8255413B2 (en) 2004-08-19 2012-08-28 Carhamm Ltd., Llc Method and apparatus for responding to request for information-personalization
US8078602B2 (en) 2004-12-17 2011-12-13 Claria Innovations, Llc Search engine for a computer network
US7631257B2 (en) * 2004-09-15 2009-12-08 Microsoft Corporation Creation and management of content-related objects
US7559016B1 (en) * 2004-10-07 2009-07-07 Google Inc. System and method for indicating web page modifications
US20080046809A1 (en) * 2004-11-12 2008-02-21 Justsystems Corporation Data Processing Device and Data Processing Method
US20080005659A1 (en) * 2004-11-12 2008-01-03 Yusuke Fujimaki Data Processing Device, Document Processing Device, and Document Processing Method
US7640184B1 (en) 2004-11-30 2009-12-29 Google Inc. Method and system for processing published content on the internet
US7689999B2 (en) * 2004-12-01 2010-03-30 Bea Systems, Inc. Sharing dynamically changing resources in software systems
US7693863B2 (en) 2004-12-20 2010-04-06 Claria Corporation Method and device for publishing cross-network user behavioral data
US8230096B2 (en) 2005-01-14 2012-07-24 Citrix Systems, Inc. Methods and systems for generating playback instructions for playback of a recorded computer session
US8340130B2 (en) * 2005-01-14 2012-12-25 Citrix Systems, Inc. Methods and systems for generating playback instructions for rendering of a recorded computer session
US8296441B2 (en) 2005-01-14 2012-10-23 Citrix Systems, Inc. Methods and systems for joining a real-time session of presentation layer protocol data
US8935316B2 (en) * 2005-01-14 2015-01-13 Citrix Systems, Inc. Methods and systems for in-session playback on a local machine of remotely-stored and real time presentation layer protocol data
US8032533B1 (en) 2005-01-14 2011-10-04 Thomson Reuters Global Resources Systems, methods, and software for researching statutory information
US8200828B2 (en) 2005-01-14 2012-06-12 Citrix Systems, Inc. Systems and methods for single stack shadowing
US20060159432A1 (en) 2005-01-14 2006-07-20 Citrix Systems, Inc. System and methods for automatic time-warped playback in rendering a recorded computer session
US8302011B2 (en) 2005-01-24 2012-10-30 A9.Com, Inc. Technique for modifying presentation of information displayed to end users of a computer system
JP4301185B2 (ja) * 2005-02-25 2009-07-22 ソニー株式会社 ファイル管理装置、ファイル管理方法およびプログラム
US8001456B2 (en) * 2005-02-28 2011-08-16 International Business Machines Corporation Methods for maintaining separation between markup and data at a client
US8645941B2 (en) 2005-03-07 2014-02-04 Carhamm Ltd., Llc Method for attributing and allocating revenue related to embedded software
US8073866B2 (en) 2005-03-17 2011-12-06 Claria Innovations, Llc Method for providing content to an internet user based on the user's demonstrated content preferences
US20060282441A1 (en) * 2005-04-06 2006-12-14 Dan Weller Definition and management of procedures in a distributed environment
JP4579755B2 (ja) * 2005-04-13 2010-11-10 キヤノン株式会社 画像形成装置及び情報処理方法
US7707275B2 (en) * 2005-04-20 2010-04-27 Cisco Technology, Inc. Method and system for validating a CLI/configlet on a given image
US7716182B2 (en) * 2005-05-25 2010-05-11 Dassault Systemes Enovia Corp. Version-controlled cached data store
TWI431492B (zh) * 2005-06-14 2014-03-21 Koninkl Philips Electronics Nv 資料處理方法及系統
US20070028301A1 (en) * 2005-07-01 2007-02-01 Markmonitor Inc. Enhanced fraud monitoring systems
US8984636B2 (en) * 2005-07-29 2015-03-17 Bit9, Inc. Content extractor and analysis system
US7895651B2 (en) * 2005-07-29 2011-02-22 Bit 9, Inc. Content tracking in a network security system
US8272058B2 (en) * 2005-07-29 2012-09-18 Bit 9, Inc. Centralized timed analysis in a network security system
US7720812B1 (en) * 2005-09-15 2010-05-18 Google Inc. Synchronizing write accesses
US8191008B2 (en) * 2005-10-03 2012-05-29 Citrix Systems, Inc. Simulating multi-monitor functionality in a single monitor environment
US8356053B2 (en) * 2005-10-20 2013-01-15 Oracle International Corporation Managing relationships between resources stored within a repository
US9069847B2 (en) * 2005-10-21 2015-06-30 Battelle Memorial Institute Data visualization methods, data visualization devices, data visualization apparatuses, and articles of manufacture
US20070106560A1 (en) * 2005-11-10 2007-05-10 Ford Motor Company Electronic, computer-implemented method and system of tracking purchase order history
US8001215B2 (en) * 2005-11-29 2011-08-16 Microsoft Corporation Unlimited history store for navigational web applications
US8255480B2 (en) * 2005-11-30 2012-08-28 At&T Intellectual Property I, L.P. Substitute uniform resource locator (URL) generation
US20070162524A1 (en) * 2006-01-11 2007-07-12 Yahoo! Inc. Network document management
US7661064B2 (en) * 2006-03-06 2010-02-09 Microsoft Corporation Displaying text intraline diffing output
US7768543B2 (en) * 2006-03-09 2010-08-03 Citrix Online, Llc System and method for dynamically altering videoconference bit rates and layout based on participant activity
US8769019B2 (en) * 2006-05-04 2014-07-01 Citrix Systems, Inc. Methods and systems for managing shared state within a distributed system with varying consistency and consensus semantics
US20070294610A1 (en) * 2006-06-02 2007-12-20 Ching Phillip W System and method for identifying similar portions in documents
WO2007146198A2 (en) * 2006-06-09 2007-12-21 Rick Rahim System and method for providing secure third party website histories
US7575163B2 (en) 2006-07-18 2009-08-18 At&T Intellectual Property I, L.P. Interactive management of storefront purchases
US9009115B2 (en) 2006-08-04 2015-04-14 Apple Inc. Restoring electronic information
US7853566B2 (en) * 2006-08-04 2010-12-14 Apple Inc. Navigation of electronic backups
US7925620B1 (en) 2006-08-04 2011-04-12 Hyoungsoo Yoon Contact information management
US8311988B2 (en) 2006-08-04 2012-11-13 Apple Inc. Consistent back up of electronic information
US7791559B2 (en) * 2006-09-14 2010-09-07 Citrix Systems, Inc. System and method for multiple display support in remote access software
US8054241B2 (en) 2006-09-14 2011-11-08 Citrix Systems, Inc. Systems and methods for multiple display support in remote access software
US8782551B1 (en) 2006-10-04 2014-07-15 Google Inc. Adjusting margins in book page images
US7912829B1 (en) * 2006-10-04 2011-03-22 Google Inc. Content reference page
US7979785B1 (en) 2006-10-04 2011-07-12 Google Inc. Recognizing table of contents in an image sequence
US9183321B2 (en) * 2006-10-16 2015-11-10 Oracle International Corporation Managing compound XML documents in a repository
US8504711B1 (en) 2006-12-12 2013-08-06 Google Inc. Integrating web services with a content item
US8620952B2 (en) 2007-01-03 2013-12-31 Carhamm Ltd., Llc System for database reporting
US8205150B2 (en) 2007-01-22 2012-06-19 Cfph, Llc Document changes
US8930331B2 (en) 2007-02-21 2015-01-06 Palantir Technologies Providing unique views of data based on changes or rules
US20080235261A1 (en) * 2007-03-21 2008-09-25 Microsoft Corporation Generating a new file using instance information
US8086594B1 (en) 2007-03-30 2011-12-27 Google Inc. Bifurcated document relevance scoring
US8166045B1 (en) 2007-03-30 2012-04-24 Google Inc. Phrase extraction using subphrase scoring
US7925655B1 (en) 2007-03-30 2011-04-12 Google Inc. Query scheduling using hierarchical tiers of index servers
US20080244381A1 (en) * 2007-03-30 2008-10-02 Alex Nicolaou Document processing for mobile devices
US7693813B1 (en) 2007-03-30 2010-04-06 Google Inc. Index server architecture using tiered and sharded phrase posting lists
US8166021B1 (en) 2007-03-30 2012-04-24 Google Inc. Query phrasification
US7702614B1 (en) 2007-03-30 2010-04-20 Google Inc. Index updating using segment swapping
US8250474B2 (en) * 2007-03-31 2012-08-21 Topix Llc Chronology display and feature for online presentations and web pages
RS60858B1 (sr) * 2007-05-15 2020-10-30 Boehringer Ingelheim Animal Health Usa Inc Ariloazol-2-il cijanoetilamino jedinjenja, postupci dobijanja i postupci njihove primene
US20080295085A1 (en) * 2007-05-25 2008-11-27 Microsoft Corporation Integrated code review tool
US20080307017A1 (en) 2007-06-08 2008-12-11 Apple Inc. Searching and Restoring of Backups
US8745523B2 (en) 2007-06-08 2014-06-03 Apple Inc. Deletion in electronic backups
US8010900B2 (en) * 2007-06-08 2011-08-30 Apple Inc. User interface for electronic backup
US8307004B2 (en) 2007-06-08 2012-11-06 Apple Inc. Manipulating electronic backups
US7849399B2 (en) * 2007-06-29 2010-12-07 Walter Hoffmann Method and system for tracking authorship of content in data
JP2010538354A (ja) * 2007-08-29 2010-12-09 テレフオンアクチーボラゲット エル エム エリクソン(パブル) データベースシステムにおける方法および装置
US8117223B2 (en) 2007-09-07 2012-02-14 Google Inc. Integrating external related phrase information into a phrase-based indexing information retrieval system
US7844693B2 (en) * 2007-09-13 2010-11-30 International Business Machines Corporation Methods and systems involving monitoring website content
US8185621B2 (en) * 2007-09-17 2012-05-22 Kasha John R Systems and methods for monitoring webpages
US7870108B2 (en) * 2007-09-25 2011-01-11 Amadeus S.A.S. Method and apparatus for version management of a data entity
US20090300543A1 (en) * 2008-01-17 2009-12-03 Carl Steven Mower Visual indication of changes in the same user interface dialog originally used to enter the data
US9384175B2 (en) * 2008-02-19 2016-07-05 Adobe Systems Incorporated Determination of differences between electronic documents
US10402780B2 (en) * 2008-04-14 2019-09-03 International Business Machines Corporation Service for receiving obsolete web page copies
US7974948B2 (en) * 2008-05-05 2011-07-05 Microsoft Corporation Automatically capturing and maintaining versions of documents
US10055392B2 (en) 2008-05-12 2018-08-21 Adobe Systems Incorporated History-based archive management
US7945595B1 (en) 2008-05-12 2011-05-17 Adobe Systems Incorporated System and method for generating an item list in electronic content
US8996621B2 (en) 2008-05-12 2015-03-31 Adobe Systems Incorporated Asynchronous comment updates
US9329744B2 (en) 2008-05-12 2016-05-03 Adobe Systems Incorporated Segmented scroll bar
US7949633B1 (en) 2008-05-12 2011-05-24 Adobe Systems Incorporated Shared edit access of electronic content
US9176943B2 (en) 2008-05-12 2015-11-03 Adobe Systems Incorporated Comment presentation in electronic documents
US9418054B2 (en) 2008-05-12 2016-08-16 Adobe Systems Incorporated Document comment management
US8495482B2 (en) 2008-05-19 2013-07-23 Zac Inc., Llc Methods, systems, and computer readable media for automatically and securely citing and transferring electronically formatted information and for maintaining association between the cited or transferred information and back-end information
US8893017B2 (en) 2008-05-29 2014-11-18 Adobe Systems Incorporated Tracking changes in a database tool
US20090327921A1 (en) * 2008-06-27 2009-12-31 Microsoft Corporation Animation to visualize changes and interrelationships
US8286171B2 (en) 2008-07-21 2012-10-09 Workshare Technology, Inc. Methods and systems to fingerprint textual information using word runs
US8555080B2 (en) * 2008-09-11 2013-10-08 Workshare Technology, Inc. Methods and systems for protect agents using distributed lightweight fingerprints
US8984390B2 (en) 2008-09-15 2015-03-17 Palantir Technologies, Inc. One-click sharing for screenshots and related documents
US20100083098A1 (en) * 2008-09-30 2010-04-01 Microsoft Corporation Streaming Information that Describes a Webpage
US10108738B2 (en) * 2008-10-30 2018-10-23 Raja Singh Tuli Image transmission method
WO2010059747A2 (en) 2008-11-18 2010-05-27 Workshare Technology, Inc. Methods and systems for exact data match filtering
US8406456B2 (en) 2008-11-20 2013-03-26 Workshare Technology, Inc. Methods and systems for image fingerprinting
US9489217B2 (en) * 2008-12-09 2016-11-08 Oracle America, Inc. Dynamic software documentation
US8762829B2 (en) * 2008-12-24 2014-06-24 Yahoo! Inc. Robust wrappers for web extraction
US20100205144A1 (en) * 2009-02-11 2010-08-12 Hewlett-Packard Development Company, L.P. Creating searchable revisions of a resource in a repository
SG173200A1 (en) * 2009-02-17 2011-08-29 Vantage Labs Pte Ltd Apparatus and method for managing digital assets
CN101782913A (zh) * 2009-06-23 2010-07-21 北京搜狗科技发展有限公司 一种更新提醒的方法及浏览器
US20110016089A1 (en) * 2009-07-16 2011-01-20 Apple Inc. Restoring data to a mobile device
US9069751B1 (en) * 2009-07-21 2015-06-30 Exelis, Inc. Systems and methods for managing document pedigrees
WO2011017084A2 (en) * 2009-07-27 2011-02-10 Workshare Technology, Inc. Methods and systems for comparing presentation slide decks
JP2011076523A (ja) * 2009-10-01 2011-04-14 Canon Inc 著作権管理システム
US9172712B2 (en) 2009-10-07 2015-10-27 At&T Intellectual Property I, L.P. Method and system for improving website security
US8635584B2 (en) * 2009-10-13 2014-01-21 Yahoo! Inc. Tutorial systems for code creation and provenance tracking
US8719708B2 (en) * 2009-10-28 2014-05-06 Morgan Stanley Systems and methods for dynamic historical browsing
US8561163B2 (en) * 2009-12-03 2013-10-15 International Business Machines Corporation Maintaining the integrity of email authorship
US9305018B2 (en) * 2009-12-16 2016-04-05 Microsoft Technology Licensing, Llc Contextual and semantic differential backup
CN102207936B (zh) * 2010-03-30 2013-10-23 国际商业机器公司 用于提示电子文档内容变更的方法和系统
US10025759B2 (en) 2010-11-29 2018-07-17 Workshare Technology, Inc. Methods and systems for monitoring documents exchanged over email applications
US10783326B2 (en) 2013-03-14 2020-09-22 Workshare, Ltd. System for tracking changes in a collaborative document editing environment
US11030163B2 (en) 2011-11-29 2021-06-08 Workshare, Ltd. System for tracking and displaying changes in a set of related electronic documents
US10853319B2 (en) 2010-11-29 2020-12-01 Workshare Ltd. System and method for display of document comparisons on a remote device
US8607140B1 (en) * 2010-12-21 2013-12-10 Google Inc. Classifying changes to resources
US8984029B2 (en) 2011-01-14 2015-03-17 Apple Inc. File system management
US8943026B2 (en) 2011-01-14 2015-01-27 Apple Inc. Visual representation of a local backup
US8533595B2 (en) * 2011-04-19 2013-09-10 Autodesk, Inc Hierarchical display and navigation of document revision histories
US8533594B2 (en) * 2011-04-19 2013-09-10 Autodesk, Inc. Hierarchical display and navigation of document revision histories
US8533593B2 (en) * 2011-04-19 2013-09-10 Autodesk, Inc Hierarchical display and navigation of document revision histories
US8874525B2 (en) * 2011-04-19 2014-10-28 Autodesk, Inc. Hierarchical display and navigation of document revision histories
US9948676B2 (en) 2013-07-25 2018-04-17 Workshare, Ltd. System and method for securing documents prior to transmission
US10574729B2 (en) 2011-06-08 2020-02-25 Workshare Ltd. System and method for cross platform document sharing
US10963584B2 (en) 2011-06-08 2021-03-30 Workshare Ltd. Method and system for collaborative editing of a remotely stored document
US9613340B2 (en) 2011-06-14 2017-04-04 Workshare Ltd. Method and system for shared document approval
US10880359B2 (en) 2011-12-21 2020-12-29 Workshare, Ltd. System and method for cross platform document sharing
US9170990B2 (en) * 2013-03-14 2015-10-27 Workshare Limited Method and system for document retrieval with selective document comparison
US8799240B2 (en) 2011-06-23 2014-08-05 Palantir Technologies, Inc. System and method for investigating large amounts of data
US9547693B1 (en) 2011-06-23 2017-01-17 Palantir Technologies Inc. Periodic database search manager for multiple data sources
US9092482B2 (en) 2013-03-14 2015-07-28 Palantir Technologies, Inc. Fair scheduling for mixed-query loads
US20130030924A1 (en) 2011-07-28 2013-01-31 American Express Travel Related Services Company, Inc. Systems and methods for generating and using a digital pass
US9280532B2 (en) 2011-08-02 2016-03-08 Palantir Technologies, Inc. System and method for accessing rich objects via spreadsheets
US8732574B2 (en) 2011-08-25 2014-05-20 Palantir Technologies, Inc. System and method for parameterizing documents for automatic workflow generation
US8504542B2 (en) 2011-09-02 2013-08-06 Palantir Technologies, Inc. Multi-row transactions
US8615159B2 (en) 2011-09-20 2013-12-24 Citrix Systems, Inc. Methods and systems for cataloging text in a recorded session
US8468138B1 (en) * 2011-12-02 2013-06-18 International Business Machines Corporation Managing redundant immutable files using deduplication in storage clouds
US20130179768A1 (en) * 2012-01-05 2013-07-11 International Business Machines Corporation Differentiated Information Display For Certified and Uncertified Web Page Versions
US9092499B2 (en) 2012-01-20 2015-07-28 Blackberry Limited Synchronizing endpoint data stores having disparate schemas
US9589541B2 (en) 2012-02-28 2017-03-07 Ebay Inc. Location-based display of pixel history
US9514461B2 (en) * 2012-02-29 2016-12-06 Adobe Systems Incorporated Systems and methods for analysis of content items
US9697238B2 (en) * 2012-03-01 2017-07-04 Microsoft Technology Licensing, Llc Drift detection and notification
US9563325B2 (en) 2012-06-08 2017-02-07 International Business Machines Corporation Selective update of a page having a pegged area
US9058311B1 (en) 2012-08-08 2015-06-16 Sprint Communications Company L.P. User timeframe selection for delivery of media resources
US10268662B2 (en) * 2012-09-10 2019-04-23 The Boeing Company Panoptic visualization of a document according to the structure thereof
US10275428B2 (en) * 2012-09-25 2019-04-30 The Boeing Company Panoptic visualization document differencing
US9361651B2 (en) 2012-10-04 2016-06-07 International Business Machines Corporation Displaying quantitative trending of pegged data from cache
US9348677B2 (en) 2012-10-22 2016-05-24 Palantir Technologies Inc. System and method for batch evaluation programs
US20140173417A1 (en) * 2012-12-18 2014-06-19 Xiaopeng He Method and Apparatus for Archiving and Displaying historical Web Contents
US9380431B1 (en) 2013-01-31 2016-06-28 Palantir Technologies, Inc. Use of teams in a mobile application
US10067917B2 (en) 2013-01-31 2018-09-04 Bluebeam, Inc. Method for managing and selectively arranging sets of multiple documents and pages within documents
US10037314B2 (en) 2013-03-14 2018-07-31 Palantir Technologies, Inc. Mobile reports
US11567907B2 (en) 2013-03-14 2023-01-31 Workshare, Ltd. Method and system for comparing document versions encoded in a hierarchical representation
US8937619B2 (en) 2013-03-15 2015-01-20 Palantir Technologies Inc. Generating an object time series from data objects
US8909656B2 (en) 2013-03-15 2014-12-09 Palantir Technologies Inc. Filter chains with associated multipath views for exploring large data sets
US9501506B1 (en) 2013-03-15 2016-11-22 Google Inc. Indexing system
US8917274B2 (en) 2013-03-15 2014-12-23 Palantir Technologies Inc. Event matrix based on integrated data
US8818892B1 (en) 2013-03-15 2014-08-26 Palantir Technologies, Inc. Prioritizing data clusters with customizable scoring strategies
US8868486B2 (en) 2013-03-15 2014-10-21 Palantir Technologies Inc. Time-sensitive cube
US9965937B2 (en) 2013-03-15 2018-05-08 Palantir Technologies Inc. External malware data item clustering and analysis
US10275778B1 (en) 2013-03-15 2019-04-30 Palantir Technologies Inc. Systems and user interfaces for dynamic and interactive investigation based on automatic malfeasance clustering of related data in various data structures
US8799799B1 (en) 2013-05-07 2014-08-05 Palantir Technologies Inc. Interactive geospatial map
US9378100B2 (en) * 2013-05-17 2016-06-28 Go Daddy Operating Company, LLC Tools for storing, accessing and restoring website content via a website repository
US10037384B2 (en) * 2013-05-28 2018-07-31 Tencent Technology (Shenzhen) Company Limited Method and apparatus for notifying a user of updated content for a webpage
US9483568B1 (en) 2013-06-05 2016-11-01 Google Inc. Indexing system
US10911492B2 (en) 2013-07-25 2021-02-02 Workshare Ltd. System and method for securing documents prior to transmission
US9223773B2 (en) 2013-08-08 2015-12-29 Palatir Technologies Inc. Template system for custom document generation
US8713467B1 (en) 2013-08-09 2014-04-29 Palantir Technologies, Inc. Context-sensitive views
US9785317B2 (en) 2013-09-24 2017-10-10 Palantir Technologies Inc. Presentation and analysis of user interaction data
US8938686B1 (en) 2013-10-03 2015-01-20 Palantir Technologies Inc. Systems and methods for analyzing performance of an entity
US8812960B1 (en) 2013-10-07 2014-08-19 Palantir Technologies Inc. Cohort-based presentation of user interaction data
US8924872B1 (en) 2013-10-18 2014-12-30 Palantir Technologies Inc. Overview user interface of emergency call data of a law enforcement agency
US9116975B2 (en) 2013-10-18 2015-08-25 Palantir Technologies Inc. Systems and user interfaces for dynamic and interactive simultaneous querying of multiple data stores
CN105683920A (zh) * 2013-10-28 2016-06-15 隆沙有限公司 文件的最新版本的即时流式传输
US9021384B1 (en) 2013-11-04 2015-04-28 Palantir Technologies Inc. Interactive vehicle information map
US9684658B2 (en) 2013-11-08 2017-06-20 Samsung Electronics Co., Ltd. SWAT command and API for atomic swap and trim of logical pages
US9678966B2 (en) 2013-11-08 2017-06-13 Samsung Electronics Co., Ltd. Swat command and API for atomic swap and trim of LBAs
US8868537B1 (en) 2013-11-11 2014-10-21 Palantir Technologies, Inc. Simple web search
US9105000B1 (en) 2013-12-10 2015-08-11 Palantir Technologies Inc. Aggregating data from a plurality of data sources
US10025834B2 (en) 2013-12-16 2018-07-17 Palantir Technologies Inc. Methods and systems for analyzing entity performance
US9552615B2 (en) 2013-12-20 2017-01-24 Palantir Technologies Inc. Automated database analysis to detect malfeasance
US9740777B2 (en) 2013-12-20 2017-08-22 Ebay Inc. Systems and methods for saving and presenting a state of a communication session
US10356032B2 (en) 2013-12-26 2019-07-16 Palantir Technologies Inc. System and method for detecting confidential information emails
US9043696B1 (en) * 2014-01-03 2015-05-26 Palantir Technologies Inc. Systems and methods for visual definition of data associations
US8832832B1 (en) 2014-01-03 2014-09-09 Palantir Technologies Inc. IP reputation
US9456021B2 (en) 2014-01-21 2016-09-27 International Business Machines Corporation Loading pegged page objects based on predefined preferences
US9483162B2 (en) 2014-02-20 2016-11-01 Palantir Technologies Inc. Relationship visualizations
US9727376B1 (en) 2014-03-04 2017-08-08 Palantir Technologies, Inc. Mobile tasks
US9483387B1 (en) * 2014-03-17 2016-11-01 Amazon Technologies, Inc. Tree comparison functionality for services
US8924429B1 (en) 2014-03-18 2014-12-30 Palantir Technologies Inc. Determining and extracting changed data from a data source
US9857958B2 (en) 2014-04-28 2018-01-02 Palantir Technologies Inc. Systems and user interfaces for dynamic and interactive access of, investigation of, and analysis of data objects stored in one or more databases
US9009171B1 (en) 2014-05-02 2015-04-14 Palantir Technologies Inc. Systems and methods for active column filtering
US9449346B1 (en) 2014-05-21 2016-09-20 Plaid Technologies, Inc. System and method for programmatically accessing financial data
US9595023B1 (en) 2014-05-21 2017-03-14 Plaid Technologies, Inc. System and method for facilitating programmatic verification of transactions
GB2527118A (en) 2014-06-13 2015-12-16 Ibm Automatic transformation of messages between service versions
US9619557B2 (en) 2014-06-30 2017-04-11 Palantir Technologies, Inc. Systems and methods for key phrase characterization of documents
US9535974B1 (en) 2014-06-30 2017-01-03 Palantir Technologies Inc. Systems and methods for identifying key phrase clusters within documents
US9785773B2 (en) 2014-07-03 2017-10-10 Palantir Technologies Inc. Malware data item analysis
US9256664B2 (en) 2014-07-03 2016-02-09 Palantir Technologies Inc. System and method for news events detection and visualization
US9202249B1 (en) 2014-07-03 2015-12-01 Palantir Technologies Inc. Data item clustering and analysis
US9419992B2 (en) 2014-08-13 2016-08-16 Palantir Technologies Inc. Unwanted tunneling alert system
US9454281B2 (en) 2014-09-03 2016-09-27 Palantir Technologies Inc. System for providing dynamic linked panels in user interface
US9767172B2 (en) 2014-10-03 2017-09-19 Palantir Technologies Inc. Data aggregation and analysis system
US9501851B2 (en) 2014-10-03 2016-11-22 Palantir Technologies Inc. Time-series analysis system
US9984133B2 (en) 2014-10-16 2018-05-29 Palantir Technologies Inc. Schematic and database linking system
US9229952B1 (en) 2014-11-05 2016-01-05 Palantir Technologies, Inc. History preserving data pipeline system and method
US9043894B1 (en) 2014-11-06 2015-05-26 Palantir Technologies Inc. Malicious software detection in a computing system
US9292876B1 (en) 2014-12-16 2016-03-22 Docusign, Inc. Systems and methods for employing document snapshots in transaction rooms for digital transactions
US10362133B1 (en) 2014-12-22 2019-07-23 Palantir Technologies Inc. Communication data processing architecture
US10552994B2 (en) 2014-12-22 2020-02-04 Palantir Technologies Inc. Systems and interactive user interfaces for dynamic retrieval, analysis, and triage of data items
US9348920B1 (en) 2014-12-22 2016-05-24 Palantir Technologies Inc. Concept indexing among database of documents using machine learning techniques
US9367872B1 (en) 2014-12-22 2016-06-14 Palantir Technologies Inc. Systems and user interfaces for dynamic and interactive investigation of bad actor behavior based on automatic clustering of related data in various data structures
US10452651B1 (en) 2014-12-23 2019-10-22 Palantir Technologies Inc. Searching charts
US10133723B2 (en) 2014-12-29 2018-11-20 Workshare Ltd. System and method for determining document version geneology
US9870205B1 (en) 2014-12-29 2018-01-16 Palantir Technologies Inc. Storing logical units of program code generated using a dynamic programming notebook user interface
US9335911B1 (en) 2014-12-29 2016-05-10 Palantir Technologies Inc. Interactive user interface for dynamic data analysis exploration and query processing
US9817563B1 (en) 2014-12-29 2017-11-14 Palantir Technologies Inc. System and method of generating data points from one or more data stores of data items for chart creation and manipulation
US11182551B2 (en) 2014-12-29 2021-11-23 Workshare Ltd. System and method for determining document version geneology
US10372879B2 (en) 2014-12-31 2019-08-06 Palantir Technologies Inc. Medical claims lead summary report generation
US10387834B2 (en) 2015-01-21 2019-08-20 Palantir Technologies Inc. Systems and methods for accessing and storing snapshots of a remote application in a document
US9727560B2 (en) 2015-02-25 2017-08-08 Palantir Technologies Inc. Systems and methods for organizing and identifying documents via hierarchies and dimensions of tags
US9891808B2 (en) 2015-03-16 2018-02-13 Palantir Technologies Inc. Interactive user interfaces for location-based data analysis
US9886467B2 (en) 2015-03-19 2018-02-06 Plantir Technologies Inc. System and method for comparing and visualizing data entities and data entity series
US9672257B2 (en) 2015-06-05 2017-06-06 Palantir Technologies Inc. Time-series data storage and processing database system
US9384203B1 (en) 2015-06-09 2016-07-05 Palantir Technologies Inc. Systems and methods for indexing and aggregating data records
US9407652B1 (en) 2015-06-26 2016-08-02 Palantir Technologies Inc. Network anomaly detection
US9454785B1 (en) 2015-07-30 2016-09-27 Palantir Technologies Inc. Systems and user interfaces for holistic, data-driven investigation of bad actor behavior based on clustering and scoring of related data
US9996595B2 (en) 2015-08-03 2018-06-12 Palantir Technologies, Inc. Providing full data provenance visualization for versioned datasets
US9456000B1 (en) 2015-08-06 2016-09-27 Palantir Technologies Inc. Systems, methods, user interfaces, and computer-readable media for investigating potential malicious communications
US11763013B2 (en) 2015-08-07 2023-09-19 Workshare, Ltd. Transaction document management system and method
US10489391B1 (en) 2015-08-17 2019-11-26 Palantir Technologies Inc. Systems and methods for grouping and enriching data items accessed from one or more databases for presentation in a user interface
US9600146B2 (en) 2015-08-17 2017-03-21 Palantir Technologies Inc. Interactive geospatial map
US9537880B1 (en) 2015-08-19 2017-01-03 Palantir Technologies Inc. Anomalous network monitoring, user behavior detection and database system
US10102369B2 (en) 2015-08-19 2018-10-16 Palantir Technologies Inc. Checkout system executable code monitoring, and user account compromise determination system
US10853378B1 (en) 2015-08-25 2020-12-01 Palantir Technologies Inc. Electronic note management via a connected entity graph
US11150917B2 (en) 2015-08-26 2021-10-19 Palantir Technologies Inc. System for data aggregation and analysis of data from a plurality of data sources
US10402385B1 (en) 2015-08-27 2019-09-03 Palantir Technologies Inc. Database live reindex
US9485265B1 (en) 2015-08-28 2016-11-01 Palantir Technologies Inc. Malicious activity detection system capable of efficiently processing data accessed from databases and generating alerts for display in interactive user interfaces
US10706434B1 (en) 2015-09-01 2020-07-07 Palantir Technologies Inc. Methods and systems for determining location information
US10104059B2 (en) 2015-09-08 2018-10-16 Plaid Technologies, Inc. Secure permissioning of access to user accounts, including secure deauthorization of access to user accounts
US9576015B1 (en) 2015-09-09 2017-02-21 Palantir Technologies, Inc. Domain-specific language for dataset transformations
US9454564B1 (en) 2015-09-09 2016-09-27 Palantir Technologies Inc. Data integrity checks
US10296617B1 (en) 2015-10-05 2019-05-21 Palantir Technologies Inc. Searches of highly structured data
US10044745B1 (en) 2015-10-12 2018-08-07 Palantir Technologies, Inc. Systems for computer network security risk assessment including user compromise analysis associated with a network of devices
US9542446B1 (en) 2015-12-17 2017-01-10 Palantir Technologies, Inc. Automatic generation of composite datasets based on hierarchical fields
US10726491B1 (en) 2015-12-28 2020-07-28 Plaid Inc. Parameter-based computer evaluation of user accounts based on user account data stored in one or more databases
US10089289B2 (en) 2015-12-29 2018-10-02 Palantir Technologies Inc. Real-time document annotation
US9823818B1 (en) 2015-12-29 2017-11-21 Palantir Technologies Inc. Systems and interactive user interfaces for automatic generation of temporal representation of data objects
US9612723B1 (en) 2015-12-30 2017-04-04 Palantir Technologies Inc. Composite graphical interface with shareable data-objects
US10984468B1 (en) 2016-01-06 2021-04-20 Plaid Inc. Systems and methods for estimating past and prospective attribute values associated with a user account
US10642940B2 (en) * 2016-02-05 2020-05-05 Microsoft Technology Licensing, Llc Configurable access to a document's revision history
US10698938B2 (en) 2016-03-18 2020-06-30 Palantir Technologies Inc. Systems and methods for organizing and identifying documents via hierarchies and dimensions of tags
US10324609B2 (en) 2016-07-21 2019-06-18 Palantir Technologies Inc. System for providing dynamic linked panels in user interface
US10719188B2 (en) 2016-07-21 2020-07-21 Palantir Technologies Inc. Cached database and synchronization system for providing dynamic linked panels in user interface
US9753935B1 (en) 2016-08-02 2017-09-05 Palantir Technologies Inc. Time-series data storage and processing database system
US10437840B1 (en) 2016-08-19 2019-10-08 Palantir Technologies Inc. Focused probabilistic entity resolution from multiple data sources
US10133588B1 (en) 2016-10-20 2018-11-20 Palantir Technologies Inc. Transforming instructions for collaborative updates
US10318630B1 (en) 2016-11-21 2019-06-11 Palantir Technologies Inc. Analysis of large bodies of textual data
US11669675B2 (en) * 2016-11-23 2023-06-06 International Business Machines Corporation Comparing similar applications with redirection to a new web page
US10884875B2 (en) 2016-12-15 2021-01-05 Palantir Technologies Inc. Incremental backup of computer data files
US10223099B2 (en) 2016-12-21 2019-03-05 Palantir Technologies Inc. Systems and methods for peer-to-peer build sharing
US10460602B1 (en) 2016-12-28 2019-10-29 Palantir Technologies Inc. Interactive vehicle information mapping system
US10896097B1 (en) 2017-05-25 2021-01-19 Palantir Technologies Inc. Approaches for backup and restoration of integrated databases
GB201708818D0 (en) 2017-06-02 2017-07-19 Palantir Technologies Inc Systems and methods for retrieving and processing data
US10956406B2 (en) 2017-06-12 2021-03-23 Palantir Technologies Inc. Propagated deletion of database records and derived data
US10403011B1 (en) 2017-07-18 2019-09-03 Palantir Technologies Inc. Passing system with an interactive user interface
US10878421B2 (en) 2017-07-22 2020-12-29 Plaid Inc. Data verified deposits
US11468085B2 (en) 2017-07-22 2022-10-11 Plaid Inc. Browser-based aggregation
US11334552B2 (en) 2017-07-31 2022-05-17 Palantir Technologies Inc. Lightweight redundancy tool for performing transactions
US10417224B2 (en) 2017-08-14 2019-09-17 Palantir Technologies Inc. Time series database processing system
US11106867B2 (en) 2017-08-15 2021-08-31 Oracle International Corporation Techniques for document marker tracking
US10216695B1 (en) 2017-09-21 2019-02-26 Palantir Technologies Inc. Database system for time series data storage, processing, and analysis
US20200051030A1 (en) * 2018-08-10 2020-02-13 Nvidia Corporation Platform and method for collaborative generation of content
US10614069B2 (en) 2017-12-01 2020-04-07 Palantir Technologies Inc. Workflow driven database partitioning
US11281726B2 (en) 2017-12-01 2022-03-22 Palantir Technologies Inc. System and methods for faster processor comparisons of visual graph features
US11016986B2 (en) 2017-12-04 2021-05-25 Palantir Technologies Inc. Query-based time-series data display and processing system
US11599369B1 (en) 2018-03-08 2023-03-07 Palantir Technologies Inc. Graphical user interface configuration system
US10754822B1 (en) 2018-04-18 2020-08-25 Palantir Technologies Inc. Systems and methods for ontology migration
US10846470B2 (en) * 2018-04-19 2020-11-24 Box, Inc. Calculating and presenting user-specific differences
US10885021B1 (en) 2018-05-02 2021-01-05 Palantir Technologies Inc. Interactive interpreter and graphical user interface
GB201807534D0 (en) 2018-05-09 2018-06-20 Palantir Technologies Inc Systems and methods for indexing and searching
US11119630B1 (en) 2018-06-19 2021-09-14 Palantir Technologies Inc. Artificial intelligence assisted evaluations and user interface for same
US11316862B1 (en) 2018-09-14 2022-04-26 Plaid Inc. Secure authorization of access to user accounts by one or more authorization mechanisms
US11194702B2 (en) * 2020-01-27 2021-12-07 Red Hat, Inc. History based build cache for program builds
US11334347B2 (en) 2020-05-04 2022-05-17 International Business Machines Corporation Cognitive build recovery from inter-code commit issues
US11887069B2 (en) 2020-05-05 2024-01-30 Plaid Inc. Secure updating of allocations to user accounts
US11327960B1 (en) 2020-10-16 2022-05-10 Plaid Inc. Systems and methods for data parsing
US11424936B2 (en) 2020-10-30 2022-08-23 Docusign, Inc. Post-completion action management in online document system
US20220134222A1 (en) * 2020-11-03 2022-05-05 Nvidia Corporation Delta propagation in cloud-centric platforms for collaboration and connectivity
US11604839B2 (en) * 2021-05-17 2023-03-14 Docusign, Inc. Document package merge in document management system
US20220398232A1 (en) * 2021-06-14 2022-12-15 Microsoft Technology Licensing, Llc Versioned metadata using virtual databases
US11656855B2 (en) 2021-06-14 2023-05-23 International Business Machines Corporation Identify, suggest, and auto-implement best practices for requirement specific software development
CN115544969B (zh) * 2022-11-29 2023-03-21 明度智云(浙江)科技有限公司 基于超文本标记语言的页面对比方法、设备及介质

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4807182A (en) * 1986-03-12 1989-02-21 Advanced Software, Inc. Apparatus and method for comparing data groups
US5008853A (en) * 1987-12-02 1991-04-16 Xerox Corporation Representation of collaborative multi-user activities relative to shared structured data objects in a networked workstation environment
US4912637A (en) * 1988-04-26 1990-03-27 Tandem Computers Incorporated Version management tool
US5325478A (en) * 1989-09-15 1994-06-28 Emtek Health Care Systems, Inc. Method for displaying information from an information based computer system
JPH04181423A (ja) * 1990-11-16 1992-06-29 Fujitsu Ltd バージョン管理方式
US5278979A (en) * 1990-12-20 1994-01-11 International Business Machines Corp. Version management system using pointers shared by a plurality of versions for indicating active lines of a version
US5671428A (en) * 1991-08-28 1997-09-23 Kabushiki Kaisha Toshiba Collaborative document processing system with version and comment management
JP3252454B2 (ja) * 1992-06-30 2002-02-04 富士ゼロックス株式会社 共有データ変更状況把握装置
DE69434311D1 (de) * 1993-02-01 2005-04-28 Sun Microsystems Inc Archivierungsdateiensystem für datenanbieter in einer verteilten netzwerkumgebung
US5835911A (en) * 1994-02-08 1998-11-10 Fujitsu Limited Software distribution and maintenance system and method
US5835601A (en) * 1994-03-15 1998-11-10 Kabushiki Kaisha Toshiba File editing system and shared file editing system with file content secrecy, file version management, and asynchronous editing
US5806078A (en) * 1994-06-09 1998-09-08 Softool Corporation Version management system
JPH0863382A (ja) * 1994-08-19 1996-03-08 Fujitsu Ltd 分散システムにおけるデータ整合性確認方法及びデータ整合性確認装置
US5752245A (en) * 1994-12-09 1998-05-12 Object Technology Licensing Corporation Object-oriented system for configuration history management with a project workspace and project history database for draft identification
US5860071A (en) * 1997-02-07 1999-01-12 At&T Corp Querying and navigating changes in web repositories

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10143418A (ja) * 1996-09-13 1998-05-29 Toshiba Corp 文書情報更新監視装置および文書情報の更新監視方法
JP2010086531A (ja) * 2008-10-02 2010-04-15 Nhn Corp ウェブ文書原本判別方法およびウェブ文書原本判別システム、並びにウェブ文書履歴情報提供方法およびウェブ文書履歴情報提供方法システム
JP2014038650A (ja) * 2008-10-02 2014-02-27 Naver Corp ウェブ文書原本判別方法およびウェブ文書原本判別システム、並びにウェブ文書履歴情報提供方法およびウェブ文書履歴情報提供方法システム
US9477769B2 (en) 2008-10-02 2016-10-25 Nhn Corporation Method and system for detecting original document of web document, method and system for providing history information of web document for the same
JP2012529688A (ja) * 2009-06-23 2012-11-22 北京捜狗科技▲発▼展有限公司 更新通知方法、およびシステム

Also Published As

Publication number Publication date
CA2232070C (en) 2002-02-05
US6366933B1 (en) 2002-04-02
WO1997015890A1 (en) 1997-05-01
CA2232070A1 (en) 1997-05-01
EP0850454A1 (en) 1998-07-01
US6596030B2 (en) 2003-07-22
US20020120648A1 (en) 2002-08-29

Similar Documents

Publication Publication Date Title
JP2001503537A (ja) オンラインデータリポジトリの変更データの識別
CN1799051B (zh) 使用页面存储文件浏览内容的方法
US6424966B1 (en) Synchronizing crawler with notification source
Douglis et al. The AT&T Internet Difference Engine: Tracking and viewing changes on the web
EP1218843B1 (en) A method and system for publication and revision of hierarchically organized sets of static intranet and internet web pages
US6381618B1 (en) Method and apparatus for autosynchronizing distributed versions of documents
US6578078B1 (en) Method for preserving referential integrity within web sites
US6605120B1 (en) Filter definition for distribution mechanism for filtering, formatting and reuse of web based content
USRE42051E1 (en) Peer-to-peer automated anonymous asynchronous file sharing
AU2003236611B2 (en) A link generation system
US5970505A (en) Linking related data in a document set including a plurality of books written by different groups of authors in a computer network
Douglis et al. Tracking and Viewing Changes on the Web.
US7155491B1 (en) Indirect address rewriting
US20060031751A1 (en) Method for creating editable web sites with increased performance &amp; stability
US6772208B1 (en) Method and apparatus to restrict free hyperlinking by internet content distributors to web sites of original content producers
US20100269035A1 (en) Method for Dynamically Generating a &#34;Table of Contents&#34; View of the HTML-Based Information System
EP1266296A1 (en) Method and apparatus for automatically deploying data in a computer network
US20030217076A1 (en) System and method for rapid generation of one or more autonomous websites
JPH11502346A (ja) オンラインサービスの作成および保守用のコンピュータシステムおよびコンピュータ実行プロセス
US20080235565A1 (en) System and Method for Reference Validation in Word Processor Documents
JP2002082936A (ja) コンテンツデータ表示装置とコンテンツデータ表示システム
US6993525B1 (en) Document-database access device
GB2326746A (en) Displaying a subset of a list of titles
Witten et al. Digital Libraries Based on Full-Text Retrieval.
Kirby et al. Versioning the web