JPH08255104A

JPH08255104A - ソフトウエアおよびデータの効率的かつ安全性の高い更新

Info

Publication number: JPH08255104A
Application number: JP7325290A
Authority: JP
Inventors: David Gerard Korn; ジェラルドコーンディヴィッド; Vo Kiem-Phong; ヴォーカーム−フォン
Original assignee: AT&T Corp
Current assignee: AT&T Corp
Priority date: 1994-12-14
Filing date: 1995-12-14
Publication date: 1996-10-01
Also published as: TW313643B; BR9505888A; CN1132372A; SG34329A1; EP0717353A2; CA2161360A1; EP0717353A3

Abstract

(57)【要約】【課題】伝送データ量を削減し、かつかつ傍受されに
くい、遠隔地からソフトウエア又はデータを更新する方
法を提供する。【解決手段】本発明は、旧バージョンから新規バージ
ョンへデータファイルを更新する装置に関する。本発明
は、旧バージョンと新規バージョンを比較し、類似と相
違に関する情報を含む変形処理情報を導き出す。さら
に、本発明は、新規バージョンを導き出すために、新規
バージョン自体を参照せずに、変形処理情報を用いて、
旧バージョンの処理を行う。本発明を用いると、更新さ
れたファイル自体を送信しなくても、変形処理情報を複
数の場所に送信することにより、複数の場所にある銀行
の記録などのような元のファイルの複数バージョンを更
新することができる。一般に、変形処理情報には新規バ
ージョンの内容全体が含まれていないことから、この方
法は傍受に対して高い抗力を持つ。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明により用いられるソースコ
ードを記載した付録を添付する。本発明は、伝送される
データ量を削減し、かつ傍受されにくい、遠隔地からソ
フトウエアまたはデータもしくは両者を更新する方法に
関する。

【０００２】

【従来の技術】電信電話会社の電話システムを介したコ
ンピュータ間の電子データ通信には、スピードと機密保
護が必要とされている。伝送前にデータを圧縮すること
により伝送速度を向上できる一方で、暗号化により機密
保護が可能である。データ圧縮は、データ源における冗
長度を低下させ、かつ暗号解読への抗力を高めることか
ら、暗号化にも有効な働きをする。しかし、データファ
イルが圧縮ならびに暗号化された場合、圧縮および暗号
化されたデータは、単一のデータ源に基づくものとな
る。単一のデータ源に基づくデータ圧縮および暗号化
は、完全なものとはいえない。データの冗長度が高くな
ければ、圧縮はうまく機能せず、最新の暗号解読法と共
に機能する高速コンピュータは、大抵の暗号化データを
解読することができるからである。多くの場合、最初の
データ源に関する複数の新規バージョンが、データに若
干の変更が加えられた後に頻繁に伝送される。この場合
の変更が若干であるとは、全バージョンが本質的に類似
していることを意味している。本質的に類似していれ
ば、その類似性を利用して、あるバージョンを別のバー
ジョンに変形する最小の変形処理情報を計算することが
可能である。

【０００３】このような変形処理情報の計算方法は、デ
ータディファレンシング（データ間の差の計算）と呼ば
れている。データディファレンシングは伝達されるデー
タ量を削減する働きをすることから、これにより伝送速
度が向上する。さらに、旧バージョンを持たない傍受者
は、伝送されたデータからあまり多くの情報を引き出す
ことができないため、データディファレンシングは、プ
ライバシーの保護にも役立つ。これまで数多くの圧縮お
よびディファレンシング技術が、検討されてきた。「情
報理論に関するＩＥＥＥトランザクション（ＩＥＥＥ
ＴｒａｎｓａｃｔｉｏｎｓｏｎＩｎｆｏｒｍａｔｉ
ｏｎＴｈｅｏｒｙ）」１９７７年５月号の２３（３）
（３３７頁〜３４３頁）に記載されたＪ．Ｚｉｖならび
にＡ．Ｌｅｍｐｅｌによる「順次データ圧縮のための普
遍アルゴリズム（ＡＵｎｉｖｅｒｓａｌＡｌｇｏｒ
ｉｔｈｍｆｏｒＳｅｑｕｅｎｔｉａｌＤａｔａ
Ｃｏｍｐｒｅｓｓｉｏｎ）」の記事では、単一のデータ
ファイルを圧縮する技術について述べられている。この
技術は、データの順序を分析し、かつ、可能であれば、
各位置においてすでに分析された部分にある別のセグメ
ントと一致する最長セグメントを識別することによって
機能する。このようなセグメントが検出された場合、一
致した位置と一致した長さを用いて暗号化が行われる。
また、一致しなかったデータは、そのまま出力される。

【０００４】このアルゴリズムの具体化が、１９８４年
８月７日にＷ．Ｌ．Ｅａｓｔｍａｎ、Ａ．Ｌｅｍｐ
ｅｌ、およびＪ．Ｚｉｖ．に付与された米国特許４，４
６４，６５０の主題であった。このＥａｓｔｍａｎ−Ｌ
ｅｍｐｅｌ−Ｚｉｖ圧縮方法では、圧縮解除中も圧縮中
とほぼ同じ作業量をこなさなければならないことから、
圧縮解除の際に低速となる。さらに、この方法は、デー
タディファレンシングに応用できない。ＵＮＩＸシステ
ムでは、第一ファイルから第二ファイルへの変形の際に
削除または追加する必要のある一連の行を作成する「ｄ
ｉｆｆ」プログラムを用いて、（バイナリ以外の）テキ
ストファイル間の違いを算出することができる。「ｄｉ
ｆｆ」による方法を採用した場合、テキスト行の若干の
変更によって、極めて大幅な変形は別のものとみなされ
ることから、そうした大幅な変形を行う可能性も出てく
る。さらに、この方法は、テキストファイルでしか機能
しないことから、応用範囲が限られている。「コンピュ
ータシステムに関するＡＣＭトランザクション（ＡＣＭ
ＴｒａｎｓａｃｔｉｏｎｓｏｎＣｏｍｐｕｔｅｒ
Ｓｙｓｔｅｍｓ）」１９８４年１１月号の２（４）
（３０９頁〜３２１頁）に記載されたＷａｌｔｅｒ
Ｆ．Ｔｉｃｈｙによる「ブロックの移動によるストリ
ングからストリングへの訂正上の問題（ＴｈｅＳｔｒ
ｉｎｇ−ｔｏ−ＳｔｒｉｎｇＣｏｒｒｅｃｔｉｏｎ
ＰｒｏｂｌｅｍｗｉｔｈＢｌｏｃｋＭｏｖｅ
ｓ）」の記事では、データファイルのあるバージョンか
ら別のバージョンへ変形を行うブロック移動と呼ばれる
一連の命令を計算するアルゴリズムについて述べられて
いる。ブロック移動（ｂｌｏｃｋ−ｍｏｖｅ）は、第一
バージョンの別のセグメントと一致する第二バージョン
のデータセグメントである。このアルゴリズムは、本質
的に実現されないものであり、第二バージョンに固有の
冗長性がある場合に、それを活用して第一バージョンか
ら第二バージョンを作成するのに必要な変形を最小限度
に抑えることができない。

【０００５】

【発明の概要】本発明の一態様において、コンピュータ
プログラムにより、ファイルの第一バージョンと第二す
なわち新規バージョンを比較し、一連の命令を作成す
る。この命令により、第一バージョンに基づいた第二バ
ージョンの復元が可能になる。上記の命令は、２つのタ
イプに分けられる。ひとつはＣＯＰＹ命令であり、指定
された一連の文字を構成中のファイルにコピーするよう
命令する。指定された文字列は、第一バージョンまたは
構成中のファイルのいずれにも存在可能である。もうひ
とつは、ＡＤＤ命令であり、このＡＤＤ命令に伴う一連
の文字の追加を指示する。この２種類の命令が連続的に
実行されると、コピーならびに追加された各文字列の連
結が行われ、第二バージョンの復元が行われる。

【０００６】

【実施例】以下に、簡単な類比により、本発明のより基
本的な側面を一部説明する。また、本発明の一部を実現
するコンピュータコードについての技術的な説明は、
「本発明について」と題した項目にて行う。類推ある新聞記者と新聞編集者が、記事を一緒に、しかし、
異なった場所で書くものとする。さらに、両者が図１Ａ
に示すバージョン１を書いたと仮定する。また、この新
聞記者が図１Ｂに示す変更を行った結果、図１Ｃ（四角
枠は変更した位置を示している）に示すようなバージョ
ン２となり、このバージョンを編集者に送信したいと考
えていると仮定する。そこで、次の手順を用いれば、バ
ージョン２の内容全体を送信せずに、編集者にバージョ
ン２の送信が可能である。

【０００７】手順まず初めに、記者は、図１Ａに示すように、バージョン
１の各語に位置を割り当てる。５０語に対し、５０箇所
の位置がある。次に、記者は、バージョン１の単語表を
確認する。単語表は、図１Ａに示すような使用される語
のリストすなわち一覧表である。ただし、各語は、単語
表に一度だけしか現れない。例えば、位置１８の語「ｔ
ｈｅｍ」は単語表に記入されない。この語がすでに位置
１６にあるからである。各語が一度しか記入されていな
いことを確認するために、記者は、各単語を入力する度
に、その語が表にあるかどうか見ながらチェックする。
例えば、記者が、最初の単語「Ｗｈｅｎ」を入力する。
次に、位置２の語「ｂｕｙｉｎｇ」を取り上げ、単語表
の最初の単語、すなわち、「Ｗｈｅｎ」と照合する。一
致しなければ、記者は、「ｂｕｙｉｎｇ」を単語表の位
置２に記入する。記者は、「ｔｈｅｍ」という語が位置
１８にくるまでこのようにして処理を進める。記者がこ
の語を単語表内にあるそれまでに入力された１７の項目
と照合してみると、「ｔｈｅｍ」が単語表の位置１６に
ある「ｔｈｅｍ」と一致することに気がつく。したがっ
て、後の「ｔｈｅｍ」は、前の「ｔｈｅｍ」と重複する
ため単語表に記入されない。

【０００８】バージョン１の最後の語について一致の確
認が行われると、単語表は完了する。バージョン１に
は、全体の長さに対し５０語含まれているが、単語表の
長さが示す通り、異なる語は３８語しかない。次に、記
者は、図１Ｃにあるように、バージョン２の単語表を作
成する。バージョン２には、新語として示されている追
加の３語を除き、バージョン１と同じ単語表がある。こ
れで、記者は、編集者にバージョン２を送信する準備が
整ったことになる。記者は、次の６つのメッセージすな
わち命令を送信してバージョン２を伝送する。各命令
は、図１Ｄ〜図１Ｉの各図によって理解できる。１．ＣＯＰＹ２１２．ＡＤＤ１Ｈａｗａｉｉａｎ３．ＣＯＰＹ３３４．ＡＤＤ１ａｌｌ５．ＣＯＰＹ３７８６．ＡＤＤ２ａｂｒｉｃｋ

【０００９】命令１事前配列により、記者と編集者は、図１Ｄに示すよう
に、位置１にポインタを設定する。最初の命令「ＣＯＰ
Ｙ２１」は、「バージョン１の位置１から始まる２
語の並びをコピーせよ」を意味している。（各命令で
は、該当する語がバージョン２のポインタの位置に配置
されることが暗黙の了解となっている。）この動作が、
図１Ｄに示されている。ただし、構文は、以下の通りで
ある。ＣＯＰＹ［語数、バージョン１の開始位置］命令を実行した後、編集者は、ＣＯＰＹ命令にある「語
数」（この場合、２語）分だけポインタを移動させる。
これにより、ポインタは、図１Ｅに示す位置に設定され
る。

【００１０】命令２命令２では「ＡＤＤ１Ｈａｗａｉｉａｎ」とあり、
「’Ｈａｗａｉｉａｎ’という１語を付け加えよ」を意
味している。この動作は、図１Ｅに示されている。ただ
し、構文は以下の通りである。ＡＤＤ［語数、該当する語］命令を実行した後、編集者は、ＡＤＤ命令にある「語
数」（この場合、１語）分だけポインタを移動させる。
これにより、ポインタは、図１Ｆに示す位置に設定され
る。

【００１１】命令３命令３の「ＣＯＰＹ３３」は、「バージョン１の位
置３から始まる３語の並びをコピーせよ」を意味してい
る。この動作は、図１Ｆに示されている。ただし、構文
は命令１と同一である。命令を実行した後、編集者は、
ＣＯＰＹ命令にある「語数」（この場合、３語）分だけ
ポインタを移動させる。これにより、ポインタは、図１
Ｇに示す位置に設定される。

【００１２】命令４命令４では「ＡＤＤ１ａｌｌ」とあり、「’ａｌ
ｌ’という１語を付け加えよ」を意味している。この動
作は、図１Ｇに示されている。命令を実行した後、編集
者は、ＡＤＤ命令にある「語数」（この場合、１語）分
だけポインタを移動させる。これにより、ポインタは、
図１Ｈに示す位置に設定される。

【００１３】命令５命令５の「ＣＯＰＹ３７８」は、「バージョン１の
位置８から始まる３７語の並びをコピーせよ」を意味し
ている。この動作は、図１Ｈに示されている。ただし、
構文は命令１と同一である。命令を実行した後、編集者
は、ＣＯＰＹ命令にある「語数」（この場合、３７語）
分だけポインタを移動させる。これにより、ポインタ
は、図１Ｉに示す位置に設定される。

【００１４】命令６命令６では「ＡＤＤ２ａｂｒｉｃｋ」とあ
り、「’ａｂｒｉｃｋ’という２語を付け加えよ」を
意味している。この動作は、図１Ｉに示されている。こ
れで、バージョン２が作成されたことになる。

【００１５】重要な特徴図１Ｃに示されるバージョン２には、４３語が含まれて
おり、語自体は、１６３文字から構成されていた。しか
し、６つの命令には２７文字プラス命令自体（ＣＯＰＹ
とＡＤＤ）が含まれていた。各命令と各文字を１バイト
としてコード化した場合、全体のメッセージは、２７＋
６文字、すなわち、３３文字となる。３３文字を送信す
れば、１６３文字を送信した場合に比べて大幅に時間が
短縮される。

【００１６】本発明について上記の類比の説明は簡単に述べたものであり、本発明の
特徴のすべてを示しているわけではない。図２では、フ
ァイルに関する２つのバージョンの他に、バージョン１
と組み合わせてバージョン２を作成できるようにする
「変形処理情報」を示している。図３の手続きでは、復
元が行われる。この手続きについてこれから説明する。
まず初めに、一般的なパターンが綿密に作成される。予
備知識として、重要点を４つ認識しておく必要がある。
ひとつは、各バージョンの各文字は、図２Ａに示す通
り、番号付けされた位置を占めている。例えば、バージ
ョン１の場合、最初の「ａ」は位置０を占有している。
最初の「ｂ」は位置１を占有している等である。第二
に、バージョン２の番号付けされた位置は、バージョン
１の番号付けされた位置の中で最も高い数字の位置の後
ろから開始する。したがって、バージョン１の最も数字
の高い位置が「１５」であることから、バージョン２は
「１６」から開始することになる。第三に、ポインタ
（図３の手続き中にある変数）は、図２Ａに示すような
現在位置を示している。第四に、「変形処理情報」は、
複数の命令により構成されている。命令には２種類、す
なわちＡＤＤとＣＯＰＹがある。次に、この２種類の命
令の動作について、バージョン１からバージョン２がど
のように構成されるのかを示しながら説明したい。

【００１７】命令１図２Ｂでは、「変形処理情報」の命令１が実行されてい
る。命令「ＣＯＰＹ４０」は、基本的に、「バージョ
ン１の位置０から始まる４文字をバージョン２のポイン
タの位置にコピーせよ」を示している。（下線の語は、
命令内の語を示している。）この動作は、図２Ｂに示さ
れている。上記の命令では、バージョン２の作成に使用
される文字を、命令自体からではなく、バージョン１か
ら取得している。このため、電話送信により命令を取得
する場合でも、傍受者は、バージョン１にアクセスでき
ないと推定されるため、バージョン２の作成に使用でき
る情報は一切得ることができない。構文は、以下の通り
である。ＣＯＰＹ［語数、開始位置］

【００１８】命令２図２Ｃでは、命令２が実行される。命令「ＡＤＤ２
ｘ，ｙ」は、事実上、「ｘとｙの２文字をポインタの位
置を起点にバージョン２に追加せよ」を意味している。
この命令では、バージョン２の作成に用いられる文字を
命令自体から得ている。その結果、傍受者は、バージョ
ン２に関する情報の一部を取得できる。しかし、実際に
は、この種の命令は、非常に多種多様な（情報を一切含
まない）ＣＯＰＹ命令と混合して用いられることが予想
されるため、傍受者は、バージョン２について重要な情
報を得ることはない。にもかかわらず、理論的には、Ａ
ＤＤ命令のみが「変形処理情報」に含まれる場合もあり
得ることであり、その場合、傍受者は、バージョン２を
そのまま取得することになる。あるいは、ＡＤＤ命令の
数が膨大になることもある。傍受者がこうしたＡＤＤ命
令から情報を取得できないようにするために、暗号化オ
プションが提供されており、内容については後に述べ
る。ＡＤＤ命令の構文は以下の通りである。ＡＤＤ［語数、該当文字］

【００１９】命令３図２Ｄでは、命令３が実行されている。命令「ＣＯＰＹ
６２０」は、事実上、次の内容を示している。位置
２０とポインタとの間にある文字を用いて、長さが６文
字のコピーを作成し、ポインタの位置にコピーした文字
を配置せよ。命令を実行した結果、図示されるように、
ｘｙｘｙｘｙとなる。（別の例として、ＣＯＰＹ文で
「ＣＯＰＹ６１９」としてあれば、事実上、次の内
容を意味している。位置１９（２０ではない）とポイン
タとの間にある文字を用いて、長さが６文字のコピーを
作成し、ポインタの位置にコピーした文字を配置せよ。
この場合、位置１９とポインタとの間にある文字列はｄ
ｘｙであることから、ポインタの位置に付け加えられた
文字の並びはｄｘｙｄｘｙとなる。）この命令の場合、バージョン２の作成に用いられる文字
がバージョン２から取得される点が重要である。したが
って、ＣＯＰＹ命令は指定されたアドレスによって２つ
のデータ源を使用していることがわかる。この命令で
は、アドレス（すなわち、「ＣＯＰＹ６２０」の
「２０」）が、バージョン２を示している（すなわち、
アドレスは１５を上回る）。したがって、バージョン２
が、このコマンドのデータ源である。逆に、アドレスが
１５以下であれば、バージョン１がデータ源として用い
られるはずである。この方法を用いると、事実上、ＡＤ
Ｄ命令を使用して単語表を拡張することができる。した
がって、（ａ）バージョン１の中になく、（ｂ）拡張さ
れた単語表にある（以前に追加された）文字がバージョ
ン２に含まれていることが明らかになった場合、ＣＯＰ
Ｙ命令が使用できる。したがって、この場合のＣＯＰＹ
命令には２つの利点がある。ひとつは、ＣＯＰＹ命令で
は、文字の総数と開始位置を示すだけで大量の文字を挿
入することができる。逆に、ＡＤＤ命令を用いた場合、
送信される文字自体を必要とすることから、より長い送
信が必要となる。もうひとつは、上記の通り、命令を傍
受した者がバージョン１を取得するようなことがない限
り、ＣＯＰＹ命令には一切の情報が含まれていないこと
になる。命令４図２Ｅでは、命令４が実行されている。命令「ＣＯＰＹ
５９」は、事実上、「バージョン１の位置９から始
まる５文字をコピーせよ」を示している。この命令は、
命令１とよく似ている。

【００２０】図３のプロセスに関する参照事項図３は、コンピュータがバージョン１と「変形処理情
報」との組み合わせからバージョン２を作成するプロセ
スを示している。図３では、２行目において、図２Ｂ〜
図２Ｅに示されているポインタの計算に用いられる変数
ｃの初期化が行われている。ポインタの計算は、９行
目、１３行目、および１４行目で適宜行われている。命令１図２に示される「変形処理情報」の命令１（ＣＯＰＹ
４０）は、図３の１３行目で実行されている。変数ｐ
は、原始データの開始位置を示しており、命令の中から
得ることができ、この場合、０である。ｐはｎ（１２行
目）よりも小さいことから、データ源はバージョン１に
ある。その結果、ＩＦ文により１３行目が実行される
と、バージョン１からデータがコピーされる。このと
き、バージョン１＋ｐの位置、すなわち位置０から開始
する。変数ｓは、文字数を表しており、７行目の命令か
ら得ることができ、この場合、４である。ポインタは、
１６行目において更新される。命令２命令２（ＡＤＤ２ｘ，ｙ）は、８行目のＩＦ文によ
り、９行目で実行される。これにより、バージョン２＋
ｃの位置にある長さｓ（２に等しい）の文字列が設定さ
れる。ポインタは、１６行目で更新される。命令３命令３（ＣＯＰＹ６２０）は、１２行目[ｐ（命令
から得られ、２０に等しい）はｎより小さい]により１
４行目において実行される。このコピー関数は、データ
源としてバージョン２を用い、バージョン２＋ｃから開
始する。コピー関数は、文字数ｓの長さを有する並びで
ある。（変数ｓは[ポインタ−２０]により得られ、２０
の数字は命令から得られる。）命令４命令４は、命令１のように１３行目において実行され
る。

【００２１】「変形処理情報」の作成図５は、各バージョンを１文字ずつ確認し、かつバージ
ョン１と変形処理情報と呼ばれる命令との組み合わせか
らバージョン２を構成できるようにする一連の命令を作
成する手続きを示している。図２の変形処理情報につい
ては、すでに説明している。この手続きによって採られ
る一般的な手法について、以下に説明する。実行１まず初めに、バージョン１の処理が行われる。バージョ
ン１は、図２Ｆの数箇所に表示されている。図５のコー
ドでは、位置０から始まる４文字の文字列が前の位置か
ら始まる４文字の文字列と一致するかどうか尋ねる。位
置０の前には何も存在しないことから、当然、答えは
「Ｎｏ」である。したがって、位置０は、「実行１」と
表示された列に示されるように、カラットを用いてフラ
グが立てられている。実行２実行２では、コードによって、似たような質問、すなわ
ち、位置１から始まる４文字の文字列が前の位置から始
まる４文字の文字列と一致するかどうかを尋ねる。答え
は「Ｎｏ」であり、位置１にフラグが立てられる。実行３および実行４同様に、フラグが位置２および位置３に設定され、図２
Ｆの実行４のようにフラグが立てられる。

【００２２】実行５実行５では、上記とは違った結果が得られる。実行５で
は、コードにより通常の「位置４から始まる４文字の文
字列は、前の位置から始まる４文字の文字列と一致する
か？」という問いを出す。実行５として示された列から
わかるように、答えは、位置０において、「Ｙｅｓ」で
ある。位置４にはフラグが表示されず、ＥＸＴＥＮＤ関
数（図５の１６行目）が呼び出されて動作が行われる。
ＥＸＴＥＮＤ関数は、一致した文字列の長さを尋ねる。
一致したブロックの後ろの次の位置（一致したブロック
は位置４〜７を占めていることから、次の位置は、位置
８である）に４つ前の位置と同じものがあるかどうか尋
ねる。答えは、試行ＴＡからわかるように、「Ｙｅｓ」
である。次に、一致したブロックの２番目の位置すなわ
ち位置９に、４つ前の位置と同じものがあるかどうか尋
ねる。試行ＴＢからわかるように、今度の答えも「Ｙｅ
ｓ」である。この問いは、そのような一致が検出されな
くなる試行ＴＥに位置が到達するまで続行される。した
がって、ＥＸＴＥＮＤ関数は、位置４〜位置１１までの
８つの位置にわたり一致が見られることを確認した。コ
ードの論理上、拡張された一致の最後の３つの位置、す
なわち、「実行５の結果」の中の「ＢＣＤ」にフラグが
立てられる。

【００２３】実行６実行６は、位置１２（最も右にあるｅ）から始まる４文
字の並びが前に発生した位置から始まる４文字の文字列
と一致しているかどうか尋ねる。ここでは、答えは「Ｎ
ｏ」であり、「実行６」と表示された列に示されるよう
に、位置１２にフラグが立てられる。

【００２４】結果図２Ｆの下部に結果が示されており、「結果」と表示さ
れている。そこで、重要な特徴について２点以下に説明
する。第一に、後に説明するように、フラグは、バージ
ョン２の作成に用いられる並びの開始だけでなく、終了
も示している。第二に、図示されるように、フラグが立
てられない領域がある。バージョン２の作成に用いられ
る文字列の探索は、こうした領域の外から開始してその
領域に侵入することができるが、このような領域内から
開始することはない。したがって、探索開始点が削除さ
れることから、全体の探索時間は短縮される。

【００２５】バージョン２の処理実行１〜実行４次に、更新バージョンであるバージョン２の処理が行わ
れる。コードにより、図２Ｇに示されている位置１６、
１７、１８、および１９から始まる４文字の並びが以前
の位置から始まるものと一致しているかどうか質問され
る。位置１６から始まる４文字の並びが位置０から始ま
るものと一致しているが、後続の３つが一致していない
ため、図２Ｇの上部に示されているように、位置１７、
１８、および１９にフラグが立てられる。ＥＸＴＥＮＤ
関数では、拡張された一致が全く検出されない。図５の
コードは、２９行目にジャンプして、図２に出てくる上
記の「ＣＯＰＹ４０」命令を発行する。全体の結果
は、「出力」と表示された矢印で示されている。すでに
３文字にフラグが立てられており、ＣＯＰＹ命令が発行
されている。ただし、これらのフラグが立てられた文字
は、バージョン１のフラグが立てられた文字がそうであ
ったように、後に、探索初期設定点として扱われること
に注意しなければならない。

【００２６】実行５図５のコードでは、（図２Ｇの「実行５」と表示されて
いる欄のバージョン２にある）位置２０から始まる４文
字の並び「ｘｙｘｙ」が前の位置から始まるものと一致
しているかどうか尋ねる。コードにより、現在バージョ
ン２に存在するものも含め、各フラグから探索を開始す
る。さらに、各フラグにおいて、コードによって前後両
方向に探索が行われる。（この前後方向の探索について
は、簡潔化を図るため、これまでの説明では述べられて
いない。）全体の探索は、図２Ｇの実行５によって示さ
れている。探索は、（ａ）各フラグから開始し、（ｂ）
４文字を前後両方向にサーチすることから、試行Ｔ１〜
試行Ｔ１２のすべての４文字の並びが検査される。さら
に、バージョン２のフラグを立てられた位置、すなわ
ち、位置１７、１８、１９、および２０から、同じよう
な探索が行われる。一致が検出されなかったことから、
位置２０にあるｘにフラグが立てられる。

【００２７】実行６図５のコードでは、（バージョン２にある）位置２１か
ら始まる４文字の並び「ｙｘｙｘ」が前の位置から始ま
るものと一致しているかどうか尋ねる。位置２０につい
ては、バージョン２に存在するものも含め、各フラグか
ら前後両方向にコード探索を開始する。現在のフラグの
状態は、図２Ｈの右上の部分に示されている。

【００２８】実行７図５のコードでは、（バージョン２にある）位置２２か
ら始まる４文字の並び「ｘｙｘｙ」が前の位置から始ま
るものと一致しているかどうか尋ねる。答えは、位置２
０において「Ｙｅｓ」である。このため、図２Ｈに示さ
れるように、位置２２にフラグは立てられず、ＥＸＴＥ
ＮＤ関数（図５の１６行目）が入力される。このＥＸＴ
ＥＮＤ関数では、図２Ｆに関して述べられた方法によ
り、一致が図２Ｈの位置２７まで達していると判断され
る。したがって、拡張された一致の最後の３つの位置に
フラグが立てられ、図の左下の四角枠に示されているよ
うな結果となる。このとき、論理上、図５の２９行目に
進み、２つの命令「ＡＤＤ２ｘ，ｙ」および「ＣＯ
ＰＹ６２０」が発行される。（２９行目の引き数
「ａｄｄ」および「ｃ」は、ＡＤＤ命令に関するもので
あり、引き数「ｐｏｓ」および「ｌｅｎ」は、ＣＯＰＹ
命令に関するものである。）

【００２９】実行８コードでは、位置２８から始まる文字の並び「ｂｃｄ
ｅ」が前の位置から始まるものと一致しているかどうか
尋ねる。答えは、バージョン１（図２Ｇの左上を参照）
の位置９において「Ｙｅｓ」である。これで、ＥＸＴＥ
ＮＤ関数が呼び出され、一致が追加文字「ｆ」まで延び
ていると判断する。次に、コードにより、２９行目にお
いて、命令「ＣＯＰＹ５９」を発行する。これで、
図２の４つの命令が作成されたことになる。したがっ
て、バージョン１プラス命令からバージョン２を復元で
きる。

【００３０】特色前記の概要から、次の原理を読み取ることができる。第
一に、ある位置が前に一致した並びを表しているとの判
断が下されると、その位置にはフラグが立てられず、そ
の結果、冗長であるとの理由により、該当する位置にお
いて後続の探索は開始されない。このため、（可能な場
合）探索位置が削減される。第二に、バージョン２は、
２種類のデータ源、すなわち、（ａ）バージョン１また
はバージョン２からコピーされた文字列、（ｂ）バージ
ョン２に追加された文字列により構成される。さらに、
追加された文字列は、後でコピー動作に使用できる。別
の観点から、第一ユーザがバージョン１を保有している
場合、また、第二ユーザがバージョン１とバージョン２
の両方を保有している場合、第二ユーザが以下の文字列
を識別していれば、第一ユーザは、バージョン２の複製
を作成できる。（ａ）第一ユーザのバージョン１からコピーしたもの（ｂ）第一ユーザのバージョン１に付け加えられたもの（ｃ）第一ユーザのバージョン２の複製からコピーされ
たもの

【００３１】第三に、各フラグ表示された位置が、単語
表内の１語の開始点を表している。これに類似する語が
図１Ａに示されている。しかし、図１Ａの用語範囲とは
異なり、各フラグ表示された位置が表す用語範囲は、極
めて多くの並びを表現の対象としている。例えば、バー
ジョン１が以下の通りであるとする。ａｂｃｄｅＦｇｈｉｊｋ大文字のＦ（位置６）にフラグが立てられた場合、次の
並びを表している。ｆｆｇｆｇｈｆｇｈｉｆｇｈｉｊ
ｆｇｈｉｊｋ上記の並びは、他のフラグ表示された位置を含むことが
ある。したがって、単一のフラグ表示された位置は、バ
ージョン２へのコピー対象となる多数の並びを表すこと
もあり得る。このため、このようなフラグ表示された位
置が多数のＣＯＰＹ命令に現れることもある。例えば、
「ＣＯＰＹ３６」は、「ｆｇｈ」をコピーすること
を意味しており、また、「ＣＯＰＹ５」は、「ｆｇｈ
ｉｊ」をコピーすることを意味している。

【００３２】機密保護すでに述べた通り、ＡＤＤ命令には、バージョン２の内
容に関する情報が含まれており、このような情報には、
機密保護が必要である。機密保護の１手法が図１Ｊに示
されている。バージョン１内にポインタがくるように、
送信された図２のＡＤＤ命令（「ＡＤＤ２ｘ，
ｙ」）が修正される。修正された命令は、図１Ｊに「送
信命令」と表示されている。この場合、ポインタが
「２」であり、「ｃ」を示している。次に、送信された
情報（すなわち、「ｘ」および「ｙ」を表すバイト）
が、「ｃ」で始まるデータとの排他的論理和がとられ
る。図１Ｊの左側は、排他的論理和の動作を示してい
る。送信される命令は、「ＡＤＤ２２」プラス排他
的論理和の動作結果である。傍受者はバージョン１に全
くアクセスできないことから、この排他的論理和の結果
には、傍受者にとって価値のある情報は一切含まれてい
ない。

【００３３】図１Ｋの右側にある受信された命令に含ま
れるデータは、バージョン１内の同じデータ、すなわ
ち、「ｃ」で始まるデータとの排他的論理和がとられ
る。この排他的論理和により、元のデータ、すなわち、
「ｘ，ｙ」が回復する。この手続きでは、排他的論理和
の動作の特性、すなわち、第一の語と第二の語の排他的
論理和をとることにより第三の語を作成する点を利用し
ている。第三の語を第二の語と排他的論理和をとること
により、第一の語を回復できる。このため、以下の送信
された命令から、ＡＤＤ２２［ＥＸ−ＯＲの結果］目的とする命令である次の命令を得ることができる。ＡＤＤ２ｘ，ｙ

【００３４】重要事項１．ＣＯＰＹおよびＡＤＤ命令が現れる順序は、当然、
重要である。その順序が全く変われば、異なったバージ
ョン２が得られる。別の観点からすれば、文字列自体は
一種の情報である。文字列は、命令の組み合わせとして
見ることもできる。英語のアルファベットの並べ換えに
よりワードが生成され情報が伝達されるように、このよ
うな並べ換えの仕方に情報が含まれている。文字列の復
元を可能にする情報が含まれていれば、当然、順序をバ
ラバラにして送信することもできる。例えば、各命令に
番号付けをしてもよい。命令の正しい並びがどのように
実行されるかという点とは無関係に、実行により、連結
プロセスによってバージョン２の複製が作成される。す
なわち、図２Ｂ〜図２Ｅの例に戻り、１．最初の「ａｂｃｄ」が複製（図２Ｂ）に書き込まれ
る。「ａｂｃｄ」は、バージョン１から得られたもので
ある。２．次に、「ｘｙ」が連結される（図２Ｃ）。「ｘｙ」
は、バージョン１から得られたものである。３．次に、「ｘｙｘｙｘｙ」の連結が行われる（図２
Ｄ）。「ｘｙｘｙｘｙ」は、バージョン２から得られた
ものである。（代わりに、４組の「ｘｙ」をバージョン
１から取得し、ステップ２で連結することもできる。し
かし、これではあまり効率的とはいえない。）４．「ｂｃｄｅｆ」の連結が行われる（図２Ｅ）。「ｂ
ｃｄｅｆ」は、バージョン１から得たものである。

【００３５】２．さらに、上記の重要事項１に関し、各
ＣＯＰＹおよびＡＤＤ命令にはコピーまたは追加された
部分の長さが含まれていることを発明者から指摘してお
く。このため、所定のＣＯＰＹまたはＡＤＤ命令につい
て、コピーや追加を行うバージョン２内のアドレスを、
以前の全体の長さに基づいて直ちに計算することができ
る。（このような長さに基づきポインタの計算が行われ
ていることから、図３のコードにこの状態が示されてい
る。）

【００３６】３．本発明は、任意の種類のデータファイ
ルを更新する際に使用でき、テキストファイル等の特定
の種類のファイルに限定されるものではない。本発明
は、一般に、バイナリファイルを取り扱うことができ
る。ファイルには文字が含まれている。各文字は、通
常、１バイトのデータによって表される。１バイトに８
ビットが含まれていることから、２８、すなわち、２５
６の想定可能な文字が１バイトで表現できる。「テキス
ト」ファイルでは、このような想定可能な組み合わせを
すべて使用するわけではなく、英数字および句読点を表
すものだけを使用する。「バイナリ」ファイルでは、想
定可能な２５６の組み合わせがすべて使用される。本発
明では、バイナリファイルの取り扱いが可能である。こ
れとは対照的に、従来技術のプログラムのディファレン
シングでは、テキストファイルしか処理できない。

【００３７】４．本発明は、記憶されているバージョン
１からバージョン２の遠隔地への復元動作に限られるも
のではない。さらに、プログラムの新規バージョンは、
バージョン全体を記憶するのではなく、ＡＤＤおよびＣ
ＯＰＹ命令を用いて一箇所に記憶することができる。こ
の方法により、記憶スペースが節約される。バージョン
の復元を必要とする場合、図３のプログラムが実行され
る。５．復元されるファイルのバージョンが、その時点にお
いて年代的に早いファイルの後のバージョンである必要
はない。例えば、バージョン１は、バージョン２から復
元できる。

【００３８】技術上の説明図３および図５に示されているコードについて、より技
術的な説明を行う。概要データファイルは、バイトの並びとみなすことができ
る。実質的にはすべての現行のコンピュータ上におい
て、１バイトは、記憶、通信、およびメモリ内のデータ
の操作によって効率的に圧縮できる最小の自然単位であ
る。「データファイル」という語は、ディスク上に記憶
されたファイルを指す場合が多いが、本発明では、その
ようなバイトの並びはメインメモリのセグメントにする
ことも可能である。図１では、本発明を用いて２台のコ
ンピュータ間でデータを同期化している例を示してい
る。第一に、ソースコンピュータ（翻訳用計算機）上で
は、データの２つのバージョンであるバージョン１およ
びバージョン２が比較されて、バージョン１をバージョ
ン２に取り込む変形処理情報を作成する。この変形処理
情報は、何らかの通信チャネルを介してターゲットコン
ピュータ（目的計算機）に送信される。次に、ターゲッ
トコンピュータ上では、変形処理情報とバージョン１の
ローカルコピーを用いてバージョン２を復元する。

【００３９】変形処理命令のコーディングとデコーディ
ング本発明により計算された変形処理情報は、２種類の命
令、すなわち、ＣＯＰＹおよびＡＤＤの並びにより構成
されている。バージョン２の復元中は、ＣＯＰＹ命令に
よりコピー対象となるデータの現存するセグメントの位
置と長さが定義され、ＡＤＤ命令により追加対象となる
データのセグメントが定義される。図２では、バージョ
ン１が「ａｂｃｄａｂｃｄａｂｃｄｅｆｇｈ」
のバイトの並びにより構成されている２つのデータファ
イルの例を示している（ここでは読みやすくするために
スペースを挿入している）。バージョン２は、「ａｂｃ
ｄｘｙｘｙｘｙｘｙｂｃｄｅｆ」の並びにより
構成されている。したがって、バージョン１の長さは１
６、バージョン２の長さは１７となっている。図２に示
されている変形処理情報では、バージョン１からバージ
ョン２を構成し直すうえで必要となる命令が示されてい
る。ただし、バージョン１の位置は０からコード化さ
れ、バージョン２の位置はバージョン１の長さからコー
ド化されるという規約を採用している。例えば、図２の
変形処理情報の第三の命令は、２０としてコード化され
たバージョン２の位置４からの６バイトをコピーするＣ
ＯＰＹ命令である。

【００４０】図３では、一般にバージョンの復元が行わ
れる手続きが示されている。１行目では、変数「ｎ」を
バージョン１の長さに初期化する。２行目では、バージ
ョン２の現在位置「ｃ」を０に設定する。３行目では、
５行目でエンドオブファイル状態が検出された後に６行
目で終了するループを開始する。４行目では、関数ｒｅ
ａｄｉｎｓｔ（）を呼び出して命令を読み取る。７行目
では、関数ｒｅａｄｓｉｚｅ（）を用いてコピーするサ
イズすなわちデータサイズを読み取る。８行目と９行目
では、命令がＡＤＤ命令であるかどうか確認し、そうで
あれば、現在位置ｃから開始するバージョン２にデータ
を読み込む。１０行目〜１５行目では、位置コードで読
み取りを行って、バージョン１またはバージョン２から
適宜コピー動作を行うことにより、ＣＯＰＹ命令の処理
を行う。１６行目では、バージョン２の現在のコピー位
置を新たに復元されたデータの長さ分だけ増加させる。
ｃｏｐｙ（）関数は、ディスクメモリ（またはメインメ
モリ）の１領域から別の領域へデータをコピーする単純
関数である。しかし、ｒｅａｄｉｎｓｔ（）、ｒｅａｄ
ｓｉｚｅ（）、ｒｅａｄｐｏｓ（）、およびｒｅａｄｄ
ａｔａ（）関数は、ＣＯＰＹおよびＡＤＤ命令とそのパ
ラメタがどのようにコード化されるかという点について
の具体的な定義に基づいて定義されなければならない。

【００４１】図３の手続きを図１の例に当てはめてみる
と、復号化には４つのステップがあることがわかる。第
一ステップでは、位置０から始まるバージョン１から
「ａｂｃｄ」の４バイトをコピーする。第二ステップで
は、「ｘｙ」の２データバイトを追加する。第三ステッ
プでは、（０から数えて規約により２０としてコード化
された）位置４から始まる６バイトをバージョン２から
コピーする。ただし、このステップの開始時点では、
「ｘｙ」の２バイトしかコピーに使用できないことか
ら、バージョン２の最初の６バイトである「ａｂｃｄｘ
ｙ」が復元されただけである。しかし、データが左から
右へコピーされることから、１バイトがコピーされると
きは必ず、作成されているはずである。第四および最終
ステップでは、バージョン１の位置９から「ｂｃｄｅ
ｆ」の５バイトがコピーされる。

【００４２】以上で、ＣＯＰＹおよびＡＤＤ命令のコー
ド化について説明がなされたことになる。このような特
種な具体例である上記命令が選択されたのは、発明者の
実験により、多くの異なるタイプのデータに対してこの
ような命令がうまく機能するためである。以上の説明が
なされれば、上記のｒｅａｄｉｎｓｔ（）、ｒｅａｄｓ
ｉｚｅ（）、およびｒｅａｄｐｏｓ（）機能は、容易に
実行できる。各命令は、制御バイトから開始してコード
化が行われる。制御バイトの８ビットは２つの部分に分
けられている。最初の４ビットは０〜１５の数を表して
おり、各々は、命令の種類と何らかの補助情報に関する
コーディングを定義している。以下に、最初の４ビット
に関する最初の１０の値の一覧を示している。０：ＡＤＤ命令１、２、３：ＱＵＩＣＫキャッシュの位置を伴うＣＯ
ＰＹ命令４：ＳＥＬＦとしてコード化された位置を伴うＣＯＰ
Ｙ命令５：ＨＥＲＥとの差としてコード化された位置を伴う
ＣＯＰＹ命令６、７、８、９：ＲＥＣＥＮＴキャッシュからコード
化された位置を伴うＣＯＰＹ命令ＱＵＩＣＫキャッシュは、サイズ７６８（３ｘ３５６）
の配列である。この配列の各指標には、「ｐｍｏｄｕ
ｌｏ７６８」が配列の指標となっているように、新た
なＣＯＰＹ命令の位置の値ｐが含まれている。このキャ
ッシュは、各ＣＯＰＹ命令が（コーディング中に）出力
されるか、または、（デコーディング中に）処理された
後、更新される。タイプ１、２、または３のＣＯＰＹ命
令は、実際の位置が記憶される配列の指標を計算するた
めに、それぞれ０、２５６、または５１２に加算されな
ければならない０〜２５５の値を有するバイトがその直
後に設定される。

【００４３】タイプ４のＣＯＰＹ命令は、一連のバイト
としてコード化されたコピー位置を有している。タイプ
５のＣＯＰＹ命令は、一連のバイトとしてコード化され
たコピー位置と現在位置との差を有している。ＲＥＣＥ
ＮＴキャッシュは、４つの指標を有する配列であり、最
新の４つのコピー位置を記憶する。ＣＯＰＹ命令が（コ
ーディング中に）出力されるか、または、（デコーディ
ング中に）処理されたときは必ず、そのコピー位置がキ
ャッシュ内の最も古い位置と入れ替わる。タイプ６
（７、８、９）のＣＯＰＹ命令は、キャッシュの指標１
（それぞれ、２、３、４）に対応している。そのコピー
位置は、対応するキャッシュ指標に記憶されている位置
よりも大きいことが保証されており、その差のみがコー
ド化される。

【００４４】タイプ１〜９のＡＤＤ命令およびＣＯＰＹ
命令の場合、制御バイトの２番目の４ビットが、０でな
ければ、含まれているデータのサイズをコード化する。
これらビットが０であれば、各サイズは、次のバイト列
としてコード化される。このようなコーディング方法の
結果、ＡＤＤ命令の後に別のＡＤＤ命令が続くことは決
してない。ＡＤＤ命令のデータサイズが４以下であり、
かつ後に続くＣＯＰＹ命令も小さいことがよくあるが、
そのような場合、この２つの命令を単一の制御バイトに
マージするうえで、上記の方法は有利である。最初の４
ビットである１０〜１５の値は、このような結合された
命令の組をコード化する。その場合、制御バイトの２番
目の４ビットの最初の２ビットにより、ＡＤＤ命令のサ
イズをコード化し、残りの２ビットによりＣＯＰＹ命令
のサイズをコード化する。次に、最初の４ビットの１０
〜１５の値の一覧を示している。１０：ＳＥＬＦとしてコード化されたコピー位置を伴
うマージされたＡＤＤ／ＣＯＰＹ命令１１：ＨＥＲＥとの差としてコード化されたコピー位
置を伴うマージされたＡＤＤ／ＣＯＰＹ命令１２、１３、１４、１５：ＲＥＣＥＮＴキャッシュか
らコード化されたコピー位置を伴うマージされたＡＤＤ
／ＣＯＰＹ命令

【００４５】図４は、図２の変形処理情報である４つの
命令に関するコード化を示したものである。各命令ごと
に、制御バイトの全８ビットが示されている。例えば、
２番目の制御バイトの最初の４ビットが０となっている
が、これは、バイトによりＡＤＤ命令がコード化されて
いることを示している。同じバイトの次の４ビットで
は、ＡＤＤ命令のサイズが２であることを示している。
２つのデータバイト「ｘｙ」が制御バイトの後に置かれ
ている。３つのＣＯＰＹ命令は、すべて、ＳＥＬＦタイ
プを用いてコード化されており、したがって、そのコピ
ー位置は、制御バイトに続く（示されている値を用い
て）バイトによりコード化されている。すべての命令の
サイズパラメタは、制御バイト内ですべてコード化でき
るほど小さい。したがって、この小例は、わずか９バイ
トを用いるだけで、長さ１７バイトのバージョン２が変
形処理情報にコード化できることを示している。

【００４６】一致セグメントの高速計算図５は、バージョン２をいくつかのセグメントに分割
し、ＣＯＰＹ命令およびＡＤＤ命令としてコード化する
方法を示している。ただし、このコーディング方法の場
合、長さの短い一致は、少なくともそれが一致するデー
タとしてコード化を行うスペースを取ることから、有効
とはいえない。このため、短い一致を無視するように一
致方法を調整することができる。ここで用いる一致の最
小の長さは４であり、コーディング手続きの本体にある
変数ＭＩＮによって示されている。

【００４７】図５の１行目では、探索テーブルＴを初期
化して空にする。効率上、Ｔは、衝突をチェーニングし
たハッシュテーブルとして保持されている。このデータ
構造は標準型であり、「コンピュータアルゴリズムの設
計と分析（ＴｈｅＤｅｓｉｇｎａｎｄＡｎａｌｙ
ｓｉｓｏｆＣｏｍｐｕｔｅｒＡｌｇｏｒｉｔｈｍ
ｓ）」（Ａ．Ａｈｏ、Ｊ．Ｈｏｐｃｒｏｆｔ、および
Ｊ．Ｕｌｌｍａｎ著、１９７４年、Ａｄｄｉｓｏｎ−Ｗ
ｅｓｌｅｙ発行）（１１１〜１１２頁）などのデータ構
造およびアルゴリズムの教本に説明されている。

【００４８】表Ｔには、２つのバージョンに一定の選択
された位置が記載されている。この位置は、手続きｉｎ
ｓｅｒｔ（）によって挿入され、最長の一致データセグ
メントを高速で探索するために、手続きｓｅａｒｃ
ｈ（）およびｅｘｔｅｎｄ（）で使用される。２行目お
よび３行目では、手続きｐｒｏｃｅｓｓ（）を呼び出
し、バージョン１およびバージョン２から位置を選択し
て表Ｔに挿入する。バージョン２の処理中には、ＣＯＰ
Ｙ命令およびＡＤＤ命令の作成も行われる。

【００４９】４〜４５行目では、手続きｐｒｏｃｅｓｓ
（）を定義する。５行目と６行目では、変数「ｎ」と
「ｍ」をバージョン１および処理中のバージョンの長さ
に初期化する。７行目では、処理中のバージョンの現在
位置「ｃ」を０に初期化する。８行目では、ＡＤＤ命令
のデータの開始を−１（すなわち、なし）に初期化す
る。９および１０行目では、位置ｃから始まるデータセ
グメントの最長の一致に関する位置と長さを初期化す
る。１１〜４２行目では、所定のバージョンを処理する
メインループを定義する。１２〜１８行目では、ｃから
始まるデータセグメントと一致する処理済みの最長デー
タセグメントを計算する。１２行目で呼び出された手続
きｓｅａｒｃｈ（）により、長さｌｅｎ＋１の一致を検
出する。この手続きでは、位置ｃ＋ｌｅｎ−（ＭＩＮ−
１）から始まるＭＩＮバイトを表Ｔの一致している位置
を探索するためのキーとして使用する。次に、「ｓｅ
ｑ」のデータと適切なバージョンのデータを逆方向に照
合し、一致がｃからｃ＋ｌｅｎ＋１までのすべてをカバ
ーしているかどうか確認する。

【００５０】このような一致が検出されると、１６行目
で呼び出された手続きｅｘｔｅｎｄ（）により、できる
だけ長く前方に一致を延長する。１４および１５行目
は、一致が全くなく、かつ探索ループから外れる場合に
相当する。それ以外の場合は、ループの繰り返しによ
り、さらに長い一致を検出する。１９および２６行目で
は、現在の一致していない位置ｃを表Ｔに挿入する。ｓ
ｅｑがバージョン１の場合、挿入される実効値はｃであ
り、それ以外の場合は、ｃ＋バージョン１の長さ（前述
したバージョン２のコーディング位置の規約）である。
手続きｉｎｓｅｒｔ（Ｔ，ｓｅｑ，ｐ，原点）では、キ
ーとしてバージョンｓｅｑの位置ｐから始まるＭＩＮバ
イトを用いて、コード化された位置「ｐ＋原点」を表Ｔ
に挿入する。

【００５１】２０および２１行目では、未定義であれ
ば、変数ａｄｄをｃに設定し、そこが一致していないデ
ータのセグメントの開始であることを示す。２５行目で
は、処理ループの次の繰り返しを行うために、現在位置
を１だけ前方に移動させる。２７および２８行目は、最
長の一致セグメントを検出する事象に相当する。２８お
よび２９行目では、手続きｗｒｉｔｅｉｎｓｔ（）を呼
び出して、前述した説明に従って、ＣＯＰＹ命令および
ＡＤＤ命令を書き出す。ａｄｄが０または正の値であれ
ば、ｗｒｉｔｅｉｎｓｔ（）への最初の２つの引き数に
より、ＡＤＤ命令のデータを定義する。第二の２つの引
き数では、ＣＯＰＹ命令のパラメタを定義する。この手
続きの作用は簡単なので、ここでは説明を省略する。３
０〜３６行目では、一致したデータセグメントの末尾に
あるＭＩＮ−１の位置を表Ｔに挿入する。３７および３
８行目では、一致した長さの分だけｃを増加し、ａｄｄ
を−１にリセットする。４０および４１行目では、処理
対象となる充分なデータがない場合に、処理を終了させ
る。４３および４４行目では、バージョン２から、一致
しない最終データをＡＤＤ命令として出力する。

【００５２】図６は、表Ｔに位置を挿入する手続きを示
している。図６の２行目は、キーが位置ｐから始まる
「ｓｅｑ」列のＭＩＮバイトであることを示している。
３行目では、コード化された位置を作成する。４行目で
は、（ｋｅｙ，ｐｏｓ）の組を表Ｔに挿入する。図７
は、一致を探索する手続きを示している。３および４行
目では、現在最長となっている一致の長さの末尾のＭＩ
Ｎ−１バイトから成る探索キーと一致していない新規の
１バイトを作成する。５〜１９行目では、可能であれ
ば、一致長さの延長を試行する。この動作は、作成され
た探索キーと一致する表Ｔの全要素を調べ、キー位置に
置かれた現在の一致の一部が検討中の要素の対応する部
分と一致しているかどうか確認することによって行われ
る。このテストは、１７行目で実行される。この結果が
真であれば、１８行目において、ｓｅａｒｃｈ（）によ
り一致の開始位置が返却される。２０行目では、「−
１」が返却され、「ｌｅｎ」よりも長い一致がないこと
を示す。

【００５３】図５の１３行目においてｓｅａｒｃｈ（）
への呼び出しが行われた後、一致の長さが、現在、図５
の「ｌｅｎ」の値よりも少なくとも１以上長いことが明
らかになっている。図８では、ｅｘｔｅｎｄ（）手続き
が示されており、この手続きによって、右方向にできる
だけ長く一致を延長させる。２〜１０行目では、一致を
探索する正しい列を設定する。１１〜１３行目では、延
長を実行する。１４行目では、一致した全体の長さを返
却する。図２の例に当てはめると、上記の方法により、
同じ図に示されている一連の命令が計算できる。図６で
は、表Ｔに挿入されるバージョン１およびバージョン２
の例の位置が示されている。

【００５４】機密保護の強化２つのバージョン１およびバージョン２と計算による変
換処理情報が与えられた場合、変換処理情報のＡＤＤ命
令のみが、バージョン２から生データを取り入れる。こ
のようなデータは、傍受者がバージョン２に関する貴重
な情報を得るのに利用可能である。機密保護の必要性が
高いアプリケーションでは、情報の漏洩を防ぐために、
ＡＤＤ命令を次のように修正することができる。まず初
めに、各ＡＤＤ命令を修正して、その位置から始まるデ
ータセグメントが少なくともＡＤＤデータの長さ以上と
なるようなやり方で、バージョン１から任意に選択され
る位置となるようなコピーアドレスも持つようにする。
そのようにできなければ、ＡＤＤデータはさらに小さい
単位に分割することができる。次に、生データは、変換
処理情報に出力される前に、このようなデータの選択セ
グメントからのデータとの排他的論理和がとられる。例
えば、図２の同じＡＤＤ命令を用いて、バージョン１の
選択位置が２であるとした場合、この位置は、制御バイ
トの直後に出力され、２データバイト「ｘｙ」は、出力
前に、２バイト「ｃｄ」との排他的論理和がとられるこ
とになる。

【００５５】デコーディングの場合、出力前に、各デー
タバイトに対して同じ排他的論理和の演算を行わなけれ
ばならない。排他的論理和の数学的特性により、あるバ
イトともうひとつの同じバイトとの排他的論理和が２度
とられる場合に、元の値が確実に保持されていることか
ら、このような演算が行われる。しかし、これで、傍受
者が、安全であるとみなされたバージョン１のコピーを
すでに入手していない限り、変換されたデータバイトか
ら何らかの情報を得ることは確実に不可能になる。図７
は、このより安全性の高い方法を用いてコード化が行わ
れた図４の命令を示している。これで、ＡＤＤ命令は位
置２を有していることになる。データバイト「ｘ」およ
び「ｙ」は、それぞれ、「ｃ」および「ｄ」と排他的論
理和がとられている。本発明の真の精神および範囲を逸
脱しない限り、多くの代替および変更を行うことが可能
である。特許証による保護を必要とする発明箇所につい
ては、特許請求の範囲に定義されている通りである。

【図面の簡単な説明】

【図１】本発明がコンピュータ間のデータ通信にどのよ
うに用いられるか示す略図である。

【図１Ａ】類推により本発明によって用いられる原理を
示す図のＡである。

【図１Ｂ】類推により本発明によって用いられる原理を
示す図のＢである。

【図１Ｃ】類推により本発明によって用いられる原理を
示す図のＣである。

【図１Ｄ】類推により本発明によって用いられる原理を
示す図のＤである。

【図１Ｅ】類推により本発明によって用いられる原理を
示す図のＥである。

【図１Ｆ】類推により本発明によって用いられる原理を
示す図のＦである。

【図１Ｇ】類推により本発明によって用いられる原理を
示す図のＧである。

【図１Ｈ】類推により本発明によって用いられる原理を
示す図のＨである。

【図１Ｉ】類推により本発明によって用いられる原理を
示す図のＩである。

【図１Ｊ】本発明の機密保護に関する状況を示す図のＪ
である。

【図２】データセットの２つのバージョン例とこのバー
ジョンの片方をもう一方のバージョンに変形するための
一連の命令を示す図である。

【図２Ａ】図３に示されている手続きの動作を示す図の
Ａである。

【図２Ｂ】図３に示されている手続きの動作を示す図の
Ｂである。

【図２Ｃ】図３に示されている手続きの動作を示す図の
Ｃである。

【図２Ｄ】図３に示されている手続きの動作を示す図の
Ｄである。

【図２Ｅ】図３に示されている手続きの動作を示す図の
Ｅである。

【図２Ｆ】図５に示されている手続きの動作を示す図の
Ｆである。

【図２Ｇ】図５に示されている手続きの動作を示す図の
Ｇである。

【図２Ｈ】図５に示されている手続きの動作を示す図の
Ｈである。

【図３】擬似Ｃ言語による復号化手続きである。

【図４】図２の命令を実際にコード化したものである。

【図５】コード化の手続きを示す図である。

【図６】図５で使用されたＩＮＳＥＲＴ手続きを示す図
である。

【図７】図５で使用されたＳＥＡＲＣＨ手続きを示す図
である。

【図８】図５で使用されたＥＸＴＥＮＤ手続きを示す図
である。

【図９】図２に例示されたバージョン１およびバージョ
ン２のデータの挿入位置を示す図である。

【図１０】図４のコード化された命令の機密保護が考慮
されたバージョンである。付録

───────────────────────────────────────────────────── フロントページの続き (72)発明者カーム−フォンヴォーアメリカ合衆国 07922 ニュージャーシィ，バークレイハイツ，スウェンソンサークル 80

Claims

【特許請求の範囲】

【請求項１】コンピュータにおいて、ａ）第二バージョンにアクセスしなくても、第一バージ
ョンに基づいてバイナリファイルの第二バージョンの復
元を可能にする命令を作成するプログラム手段から成る
改良。
【請求項２】ａ）連結されたときに第二バージョンを復
元する文字列を各々が作成する一連の命令を生成する段
階と、ｂ）各命令を実行する段階とから成る、第一バージョン
から導き出されたバイナリファイルの第二バージョンを
復元する方法。
【請求項３】デジタルコンピュータの場合、ａ）ｉ）第一および第二ファイルを検査し、ｉｉ）第二ファイルを復元するため、実行されたとき
に、Ａ）第一ファイルの一部と、Ｂ）第二ファイルへのアクセスを行わずに第二ファイル
の一部とを結合する一連の命令を作成する第一プログラ
ム手段から成る改良。
【請求項４】第二ファイルの復元を行うために一連の
命令を実行する第二プログラム手段を具備する請求項３
に記載の改良。
【請求項５】ａ）新規バージョンと旧バージョンとを比
較し、かつ、ｉ）新規バージョンが旧バージョンと似ている類似語句
と、ｉｉ）新規バージョンが旧バージョンと異なる相違語句
を識別し、ｂ）旧バージョンに各類似語句が出現しているアドレス
を記憶し、ｃ）新規バージョンに出現しているアドレスと共に各相
違語句を記憶する段階とから成る、コンピュータファイ
ルの新規バージョンを退避する方法。
【請求項６】ａ）第一サイトにおいて、第一ファイルと
第二ファイルのｉ）類似と、ｉｉ）相違を検出する段階と、ｂ）第二サイトにおいて、第一ファイルのコピーを保持
する段階と、ｃ）ｉ）類似の位置と、ｉｉ）相違自体と、ｉｉｉ）（ｃ）（ｉ）、（ｃ）（ｉｉ）、および第二フ
ァイルに基づく第二ファイルの復元を可能にする情報
を、第二サイトに送信する段階とから成る情報の復元
法。
【請求項７】ａ）ｉ）新規バージョンの指定位置に旧バージョンの指定部
分をコピーすることと、ｉｉ）新規バージョンの指定位置に新規バージョンの指
定部分をコピーすることと、ｉｉｉ）新規バージョンの指定位置に指定バイトを加え
ることのうち、１つまたはそれ以上を行うよう指示する
命令を受信する段階と、ｂ）命令を実行する段階とから成る、ファイルの旧バー
ジョンを新規バージョンへ更新する方法。
【請求項８】ａ）ｉ）Ａ）第一バージョンまたは第二バージョンの発信元位置
から、Ｂ）第二バージョンの宛先位置へ、文字がコピーされる
よう指示するＣＯＰＹ命令と、ｉｉ）指定文字が第二バージョンの指定位置に加えられ
るよう指示するＡＤＤ命令とから成る、並びを導き出す
手段から成るファイルの第一バージョンと第二バージョ
ンの相違を表すデータを作成するシステム。