JPS63305439A

JPS63305439A - 類似デ−タファイルの圧縮格納方法および復元方法

Info

Publication number: JPS63305439A
Application number: JP62142508A
Authority: JP
Inventors: Meikai Nakamura; 中村　明海; Takao Oiwa; 高雄大岩
Original assignee: Nippon Steel Corp
Current assignee: Nippon Steel Corp
Priority date: 1987-06-08
Filing date: 1987-06-08
Publication date: 1988-12-13

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔産業上の利用分野〕本発明は、計算機によるデータ処理等で一般に知られて
いる順次アクセスファイルに関する世代ファイルを格納
する方法において、その格納を圧縮された形で効率的に
行ない、かつ元のファイルをその圧縮されたファイルか
ら復元する方法に関するものである。

〔従来の技術〕従来１世代ファイルは、不当なデータの更新。

処理の不正等、ソフトの誤りに対する備えと、記憶装置
の障害等のハードの誤りに対する備えのために存在する
ファイルの保存形態である。特に、前者の誤りに対して
は、誤りの発見のおくれに備え、３世代以上持つことが
常識であり、扱うデータの重要度、更新処理の実行頻度
等により持つべき世代数が決められる。しかし、各世代
ファイル間で保有するレコードは大半が同じものであり
。

これらをそのままの形で記憶装置に保存することは一種
の無駄である。

類似データについて、圧縮して保存しようとする試みが
例えば特開昭５６−７４７４４号公報、特開昭５７−１
３２２４２号公報、特開昭６０−３５３７３号公報等に
より行われている。しかしながら、データの圧縮／復元
をファイル間にわたって行なう手段については確立され
ていない。

〔発明が解決しようとする問題点〕

これらのデータ処理においては、計算機負荷の大幅な増
大をもたらすことなく極力縮減された形態にファイル間
にわたって圧縮することが望まれている。また復元後の
ファイルにおいて元ファイルとデータ上の誤りは許され
ないものであり、このような目的に沿う手段は、これま
で開発されていなかった。

本発明の目的は、世代ファイルの本来の目的をそこなわ
ず、かつ、現実的な計算量で保存方法を工夫し、記憶装
置の節約を図るものである。

〔問題点を解決するための手段および作用〕本発明の圧
縮格納方法は、次に説明する（１）および（２）の処理
で構成され、また、圧縮格納復元方法は次に説明する（
１）、（２）および（３）の処理により構成される。

（１）類似ファイル間の特有部抽出ニ一般に、２つの順次アクセスファイルの不一致なレコー
ドの判別は、次の処理で可能である。

■各ファイル内の各レコード全体を２進数を表わすビッ
ト列とみなして、それをＫＥＹとして昇順に並びかえる
。

■並びかえた２つの、ファイルを先頭から順に読み込み
、一致していれば同一レコードと判断し。

２つのファイルから次のレコードを読み込み、その２つ
のレコードに対し比較を行う。不一致であれば小さい方
のレコードをそれが属するファイルの特有レコードとみ
なし、小さいレコードを持つファイルから次のレコード
を読み込み、これと残ったレコードについて比較を行う
。

以上の処理を２つのファイル処理した場合、残ったレコ
ードがなくなるまでくり返す。但し、どちらか一方のフ
ァイルをすべて処理した場合、残ったファイル中のレコ
ードはすべて特有のレコードとみなす。

しかし、容量の大きなファイルについて、そのまま■、
■の処理を行うこと、および後述する「昇順阻害レコー
ド」の抽出処理を行うことは。

計算機のＣＰＵ（センタープロセシングユニット：マイ
クロプロセッサ）の負荷、補助記憶装置のＩ１０負荷を
考えると、実用に耐えない。そこで本発明では、各々の
２つのファイルについて各レコードを予め定められた単
位長さで区切り、その単位毎に加算的に排他論理和をと
ることにより各レコードについて短いビット列を作成す
る。排他論理和の演算は、２つのビット列の対応するビ
ットが共にオン（例えば高レベル１）かオフ（低レベル
０）の場合はオフとし、それ以外はオンとする。レコー
ドをある単位長さに区切り、加算的に排他論理和をとっ
た場合、単位長さに区切られたものを縦に並べた時それ
ぞれ対応するビットのオンの合計が、偶数であれば結果
はオフとなり、奇数であればオンとなる６一般の業務で
使用するファイルで、内容が違うにも拘らず縦にみた場
合の各ビットのオンの数の奇数、偶数が全く一致するこ
とは５区切る単位が６４ビット程度であれば、その組み
合わせの数は１０１９にのぼり、はとんどあり得ない。

つまり、排他論理和のこのような使い方は、１つのレコ
ードを他の内容の違うレコード、はぼ、識別可能な代表
値、を作成する。

第５図に、長さ２バイト（１６ビツト）のレコードを４
ビット単位で加算的に排他論理和（ＥＯＲ：エクスクル
ーシブオア）をとる例を示す。１８で示す４ビツトと１
９で示す４ビツトで排他論理和をとり、２０に示す中間
結果となる。さらに２０の中間結果と。

２１の示す４ビツトを排他論理和をとり、２２に示す中
間結果となる。この繰り返しにより、２３に示す代表値
を得る。このようにして得た代表値を使用して、前述の
操作の、■の処理を行うことにより、実用に耐えうる計
算機のＣＰＵ負荷、補助記憶装置のＩ１０負荷で、類似
ファイル間の共通レコード群、それぞれのファイルの特
有レコード群の判定。

作成を行う。

この様にして得られた共通レコード群に対して、２つの
ファイルの対応するレコードのレコード番号の順序性が
崩れていると、復元処理を行う場合にスタック処理を要
する。第１０図により２つのファイルＡ、Ｂについて、
共通レコード群とＢ特有のレコード群よりＢのファイル
を復元する場合について説明する。共通レコード群、Ｂ
特有レコード群は、順次ファイルであるために、いちば
ん上のレコードしか移動できない、この条件のもとてレ
コード番号が（１）から始まって、順次１ずつ増加する
様に積み重ねてゆけば、それがＢファイルとなる。レコ
ード番号（１）〜（４）は、その番号順に積み重さねて
ゆけば復元できるが、レコード番号（５）を得ようとし
た場合、先の条件よりレコード番号（７）　、　（８）
　、　（９）　、　（１０）を他に移してからレコード
番号（５）を得る動作が必要となり、この様な事が多発
した場合処理時間が、非常にかかる。そこで、レコード
番号（５）をＢの特有ファイルと扱うことにより、この
様なスタック処理を避ける。

第１１図にレコード番号（５）をＢの特有ファイルとし
た場合の処理を示す、これは、類似ファイル間の特有部
抽出処理において、特有部とみなす条件を「両ファイル
に存在しないレコード」に加え「共通部とみなされた両
方の対応するレコード番号が共に昇順であることを阻害
するレコード」とすることである。具体的には、先の■
、■の処理で作成された共通レコード群に対し、一方の
ファイルのレコード番号で昇順にならべかえ、他方のフ
ァイルのレコード番号も昇順であるか判定し。

昇順を阻害するレコードは、第１．第２フアイル特有の
レコードとみなす。

昇順を阻害するレコードの判定にて、実際のレコードの
内容が異なるにも拘らず排他論理和により作成されたビ
ット列が同一になった場合、又は、実際に同一内容のも
のが業務処理の関係で、レコード番号が大きく異なった
場合、たとえば、仮に第１のファイルの２番目のレコー
ドと、第２のファイルの最終レコードが同一とみなされ
る事態がおこり得る。これにより、大部分のレコードが
昇順阻害とみなされないために定められたある一定の数
を基準値として１判定しようとするレコードのレコード
番号が、前のレコードのレコード番号に対し定められた
基準値以上能れている場合は、無条件に昇順阻害レコー
ドとみなす。実際の適用例では、この基準値を５〜１０
とすれば大きな誤りとはならなかった。

第６図に、２つの類似ファイル−Ａファイル。

Ｂファイル−の各レコードの代表値を得たところより、
共通、特有レコード群を得るところまでのファイルの流
れを示す。第６図において、　２４．２５は、Ａ、Ｂフ
ァイルを示し、それぞれの各レコードの代表値とレコー
ド番号を示す。これらを２代表値により昇順にソートし
たものが、　２６．２７である。さらに、ソートしたも
のに対し、代表値が一致するものの２つのファイルのレ
コード番号を格納したものが２８で、それぞれのファイ
ルの特有な代表値を持つもののレコード番号を格納した
ものが２９　、３０である。ここで、共通部とみなされ
たものをＡファイルのレコード番号で、昇順にソートし
たものが３１である。３１に対し、Ｂファイルのレコー
ド番号が昇順にならないものを各ファイルの特有部に移
した結果が３２．３３となる。

以上の様にして得られた２つのファイルの共通、特有の
レコード番号を使用して、実際のファイルを読み込み、ａ）共通レコードとみなしたレコード同士が本当に同一
のものであるかのチェックを行い違うものであれば特有
レコードとする。

ｂ）各ファイルの特有レコード番号を持つものの実際の
レコードをそれぞれの属していたファイルでのレコード
番号を付加して、特有レコードとして格納する。

実際の保存方法は、第１．第２フアイルのいずれかを元
ファイルとしてそのままの形で保存し、他を先に得た２
つの特有ファイルを元ファイルに対する追加、削除すべ
きレコード群として保存する。元ファイル、追加、削除
ファイルの形で持つことは３つ以上類似ファイルがある
場合の格納効率を考慮してのことである。つまり、３つ
以上類似ファイルがある場合、１つの元ファイルと複数
の追加、削除ファイルの形で保存することが可能であり
、効率的な保存方法となる。

（２）類似ファイルの格納処理：保存方法は、第１．第２フアイルのいずれかを元ファイ
ルとして、そのままの形で保存し、他を前記（１）項記
載の処理で得た２つの特有ファイルを元ファイルに対す
る追加、削除すべきレコード群とし、それぞれの属して
いたファイルでのレコード番号を付加して保存する。具
体的には、前記（１）の処理で得た特有レコード群のレ
コード番号順に実際のファイルのレコードを保存するが
、この時共通レコードとみなしたレコード同士が本当に
同一のものであるかのチェックも行い、違うものであれ
ば特有レコードとする６元ファイル、追加、削除ファイ
ルの形で持つことは、３つ以上類似ファイルがある場合
の格納効率を考慮してのことである。つまり、３つ以上
類似ファイルがある場合、１つの元ファイルと、複数の
追加、削除ファイルの形で保存することが可能であり、
効率的な保存方法となる。

第７図に３つの類似ファイルがある場合の保存例を示す
。すなわち、Ａファイル３４．Ｂファイル３５、Ｃファ
イル３６の３つの類似ファイルについて、圧縮を行って
、３７．３８．３９，４０．４１のファイルに変換する
。３６のＣファイルは、元ファイルとしてそのまま旧に
持つ、３５のＢファイルは３６のＣファイルに対しての
特有レコード群を追加、削除ファイルとして３９．４０
に持つ。ここで３９の追加ファイルは３５のＢファイル
を復元するために、４１の元ファイル（＝３６のＣファ
イル）に追加すべきレコード群である。同様に４０の削
除ファイルは、３５のＢファイルを復元するために、４
１の元ファイルから削除すべきレコード群である。３４
のＡファイルは３５のＢファイルに対しての特有レコー
ド群を追加、削除ファイルとして、　３７，３ｇに持つ
、３７は３４のＡファイルのレコード番号を持ち、３８
．３９は、３５のＢファイルのレコード番号を持ち、４
０は３６のＣファイルのレコード番号を持つ。

この様な格納方法を実現するうらには、先に述べた特有
レコードの定義を［共通部とみなされた両ファイルの対
応するレコード番号が、共に昇順であることを阻害する
レコード」とすることによる。仮に、この定義でない場
合、第７図の４１の元ファイルに、３５のＢファイル、
３６のＣファイルの２つのファイルのレコード番号を持
たせ、復元処理時に１元ファイルを所望するファイルの
レコード番号で、ソートしなおす処理が必要となり、復
元処理の負荷が大きくなる。

以上の（１）記載の「類似ファイルの特有部抽出処理」
と、（２）項記載の「類似ファイルの格納処理」を組み
合わせることにより「データ圧縮処理Ｊが実現される。

（３）格納された類似ファイルの復元処理：前記（２）
記載の元ファイルと、追加、削除ファイルを使用して、
元ファイル以外の類似ファイルを作成する方法を説明す
る。

元ファイルから、削除ファイルの示すレコード番号を削
除したものが２つの類似ファイルの共通レコード群であ
り、この共通レコード群と追加ファイルをたし合わせれ
ば１元ファイル以外の類似ファイルとなる。追加ファイ
ルには、所望するファイル上でのレコード番号を保存し
ているので、共通レコード群の所望するファイル上での
レコード番号を知ることができればそれらの番号順で組
みたてて、所望するファイルの復元ができる。ここで共
通レコード群は、２つの類似ファイルのレコード番号で
共に必ず昇順となっているように圧縮処理されているの
で、追加ファイル中にあるレコードのレコード番号をそ
の番号の示す位置に置き、空いたところを共通レコード
群より先頭から順に埋めてゆ、けば所望するファイルが
得られる。

第８図に第７図のファイルＢ、Ｃを例にした回復方法を
示す。

第８図の４２は、Ｂの削除ファイルであり、第７図の４
０と同一である。第８図の４３は１元ファイルであり、
第７図の４１と同一であるが、便宜上レコード番号を付
記している。第８図の４３は、第７図の３６のＣファイ
ルそのものであり、レコード番号は、その並び順と一致
しているので、処理上は、レコード番号が分かっている
ものとしても問題ない。第８図の４６は、Ｂの追加ファ
イルであり、第７図の３９と同一である。４２，４３．
４６の３つのファイルを使用して４５のＢファイルを復
元する。まず、４３のＣファイルより、４２のＢの削除
ファイルの持つレコード番号と一致するものを取り除い
て、４４の共通ファイルを作成する。次に４４の共通フ
ァイルと、４６のＢの追加ファイルを使用して、４５の
Ｂファイルを作成する。、４５のＢファイルの作成は、
レコード番号が１から順次決定する。決定しようとする
レコード番号と、４６のＢの追加ファイルの持つレコー
ド番号が一致する場合は、４６のＢの追加ファイルのレ
コードを４５のＢファイルのレコードとし、一致しない
場合は４４の共通ファイルに残る先頭のレコードを、４
５のＢファイルのレコードとする。

以上の操作により、Ｂファイルの復元が実施される。さ
らに、類似ファイルが３つ以上あり、元ファイルから２
つ以上離れているファイルの復元は、元ファイルと２組
以上の追加削除ファイルを使用して復元する必要がある
が、この場合は、複数の追加、削除ファイルを何らかの
方法で作用させ１つの追加、削除ファイルを作成し、前
述の元ファイル、追加、削除ファイルを使用した復元の
問題に帰着させる。これは１元ファイルは追加、削除フ
ァイルに比べ非常に大きく、元ファイルと、追加、削除
ファイルを使用した復元処理を複数回行うことにより、
複数の追加、削除ファイルを事前に合成させる方が処理
負荷が軽くなる。

３つ以上の追加、削除ファイルを作用させ、１つの追加
、削除ファイルを作成する方法は、２つの追加、削除フ
ァイルを作用させる１つの追加。

削除ファイルを作成することの繰り返しで得られる。

第７図において、３４のＡファイルを復元しようとした
場合、前記（２）記載の処理のみでは、まず、３９の追
加ファイル、４０の削除ファイル、４１の元ファイルを
作用させることにより、３５のＢファイルを復元させる
。それから３７の追加ファイル、３８の削除ファイル、
３５のＢファイルを作用させることにより、３４のＡフ
ァイルを復元させる。しかし、３５のＢファイルを復元
させることは、計算機のＣＰＵ負荷、補助記憶装置のＩ
１０負荷を増大させ、復元させたいファイルと元ファイ
ルとの距離が大きくなると、さらに悪化する。そこで、
類似ファイルが３つ以上あり１元ファイルから、２つ以
上離れているファイルの復元は、複数の追加、削除ファ
イルを何らかの方法で作用させ、１つの追加。

削除ファイルを作成し、その前記（２）記載の元ファイ
ル、追加、削除ファイルを使用した、復元の問題に帰着
させる。これは、元ファイルは、追加、削除ファイルに
比べ非常に大きく１元ファイルと、追加、削除ファイル
を使用した、復元処理を複数回行うよりも、複数の追加
、削除ファイルを事前に合成させる方が処理負荷で軽い
からである。

３つ以上の追加、削除ファイルを作用させ、１つの追加
、削除ファイルを作成する処理は、２つの追加２削除フ
アイルを作用させ、１つの追加、削除ファイルを作成す
ることの繰り返しで得られる。

２つの追加、削除ファイルの合成は、基本的には異なる
レコード番号体系を変換する操作で実現できる。

第９図に、第７図のファイルを例にして２つの追加ファ
イルを１つに合成する場合を示す、第９図において、４
７はＡの追加ファイルで、第７図の３７と同一である。

４９はＢの追加ファイルで、第７図の３９と同一である
。さらに２つの追加ファイルの合成に４８のＡの削除フ
ァイルを必要とし、これは、第７図の３８と同一である
。

ファイルＡからＡの追加ファイル４７をとりのぞいたも
の５０とファイルＢからＡの削除ファイル４８をとり除
いたもの５１は、共にファイルＡ−Ｂの共通部分となり
、１　：　Ｉ　Ｌ：対応する。また５１のＢファイルか
らへの削除ファイルをとり除いたものと４９のＢの追加
ファイルは、共にファイルＢのレコード番号で、記述さ
れており、一致するレコード番号を持つものが同一内容
である。第９図の例で、４９のｒ２’　　ＣＪ、ｒ３’
　　ＤＪは５１に示すところに対応する。ｒ５’ｉＪに
関しては、一致するものがないので捨てる。これは、４
８のＡの削除ファイルにｒ６’　　ｉＪが存在するので
、相殺されるからである。さらにこの様にして得たｒ２
’　　ＣＪ、ｒ３’　　ＤＪは、５０と５１が１対１に
対応することから、５０の中ではｒ３ＣＪ、ｒ４ＤＪと
なる（５２）、これが、４９のＢの追加ファイルのレコ
ード番号をＡファイルのレコード番号の体系に変換した
ものとなる。最後に、５２と４７をレコード番号につい
てマージ処理して得たものが、Ｃファイルを元ファイル
としてＡファイルを復元するための追加ファイル５３で
ある。Ｃファイルを元ファイルとして、Ａファイルを復
元するための削除ファイル５４についても、第７図の３
８．３９．４０を使用して１合成が可能である。

すなわち、ファイルＡからＡの追加ファイルをとりのぞ
いたもの（■）とファイルＢからＡの削除ファイルをと
りのぞいたもの（■）は、共にＡ−Ｂの共通部分となり
、１：１に対応する。

また、ファイルＢからＡの削除ファイルを除いたものと
、Ｂの追加ファイルは共にファイルＢのレコード番号で
記述されており、一致するレコード番号を持つものが同
一内容である（■）。

但し、レコード番号が一致しないレコードが出現した場
合これを捨てる。更に、ここで得たレコードとファイル
ＡからＡの追加ファイルをとり除いたものと対応する。

レコード番号がＢの追加ファイルをＡのレコード番号体
系に変換したものである（■）。このようにして得たＢ
の追加ファイルとＡの追加ファイルをレコード番号につ
いてマージ処理して得たものが所望する追加ファイルで
ある（■）。削除ファイルについても同様にして求める
ことができる（■）。

第１図に、本発明を実施するためのシステムの構成を示
する。１，２．３は、ホスト計算機内で動作するタスク
であり、■はアプリケーションを示し、計算機利用者が
必要とする情報のとり出しファイルの更新等で実行する
タスク、２はアプリケーション、ジョブスケジューラ−
を示し１の実行開始、使用リソース等の管理をするタス
クである。

３は本発明の基本機能を有するファイル管理タスクであ
り、ジョブスケジューラ−２より出される指示に従って
動作する。４は連絡ファイルを示し、アプリケーション
ｌで必要とするファイルを復元した形で提供するための
磁気ディスクである。５は保存ファイルを示し、アプリ
ケーション１にて更新され、連絡ファイル４にはき出さ
れたファイル内のデータを圧縮した形で保存するための
磁気ディスクである。６はバックアップファイルを示し
、保存ファイル５の障害に備えて、その回復をはかるた
めのデータを有する磁気テープである。

ジョブスケジューラ−２よりファイル管理タスク３に出
される指示は、「アプリケーション１にて使用するファ
イルの復元要求」　「アプリケーションｌにて更新した
ファイルの圧縮要求」である。

「アプリケージ１ン１にて使用するファイルの復元要求
」が出された場合、ファイル管理タクス３では復元処理
を行う。この時、保存ファイル５の状態を見て要求され
たファイルから元ファイルまでの世代の差が２以上ある
場合、追加、削除ファイルの合成処理を事前に行う。「
アプリケーション１にて、更新したファイルの圧縮要求
」が出された場合、ファイル管理タスク３では圧縮処理
。

バックアップ処理を行う。圧縮処理において類似ファイ
ルが１つのみの場合は、１つ前の世代のファイルの復元
処理を行ったのち、圧縮処理を行う。

第２図に、保存ファイル５の保存イメージを示す。７は
最新世代ファイルで、元ファイルの形で持つ。８．８’
　、９．９’　は、それぞれ最新世代ファイルより１つ
ずつ古い世代ファイルで、追加、削除の形で持つ、最新
世代ファイル７を元ファイルの形で持つ理由は、圧縮処
理の簡易化のためである。第９図について、〔最新−１
〕の世代を元ファイルで、〔最新〕を追加、削除ファイ
ルで保存する場合、次に〔最新＋１〕と、最新の組み合
わせで圧縮処理をすると六、〔最新−１〕も示ファイル
かｒ１追加、削除ファイルに変換しなければ本発明の目
的を果すことができないからである。バックアップ処理
では、圧縮処理において作成されたファイルの更新世代
分をテープに保存する。

第３図に、保存ファイル５と、バックアップファイル６
との関係を示す６バツクアツプ処理では、圧縮処理で〔
最新−１〕として扱われる追加、削除ファイルを、追加
、削除の機能を逆にして最新の追加、削除ファイルとし
て扱う。これにより、保存ファイル５の保存形態に影響
を与えずにバックアップ処理を少量の単純コピー処理で
実現することができる。

第４図に、バックアップファイル６の保存イメージを示
す、　１４．１４’　〜１６，１６’　は、先に述べた
処理で得たファイルである。１７は復元処理のための元
ファイルとしである周期で保存したものである。

〔発明の効果〕

本発明によれば、従来のアプリケーションプログラムと
ファイルのインターフェイスを変更せずに、現実的な計
算機処理量にて、存在する情報量に比例したディスク容
量のみ必要とする世代ファイルの効率的な保存方法が実
現できる。これにより、世代ファイルの運用コストが世
代数に大きな影響を与えず、データの重要度、更新処理
の実行頻度等に見合った適正な世代数が設定可能となる
と共に、従来無駄に使用していた記憶装置の節約を図る
ことが可能となる。

例えば一つの工場の操業管理システムにおいての例をあ
げれば、本発明により、世代ファイルについて１／２〜
１／６に記憶容量の削減を実現し、さらに従来より存在
するファイル内の圧縮を組み合わせることにより１／１
０〜１／４０の記憶容量削減を実現した。また、ｌレコ
ード１０００バイト、３万レコードの２つの類似ファイ
ルを圧縮するのに、市販の日立Ｍ２Ｏ０ＨＤ（処理能力
６　Ｍｉｐｓ）で、ＣＰＵ使用：１３０秒と、極めて低
負荷であった。

【図面の簡単な説明】

第１図は、本発明を実施するシステム構成の一例を示す
ブロック図である。第２図は、第１図に示す保存ファイル５のファイル格納
手順の一例を示すブロック図である。第３図は、第１図に示す保存ファイル５とバックアップ
ファイル６のファイル格納手順を対比して示すブロック
図である。第４図は、第１図に示すバックアップファイル６のファ
イル格納手順を示すブロック図である。第５図は、ルーコードをあるビット列に分割し、加算的
に排他論理和をとる手順を示すブロック図である。第６図は、２つの類似ファイルＡ、Ｂのレコード番号お
よび代表値から、特有部のレコード番号および共通部の
レコード番号を得る手順を示すブロック図である。第７図は、３つの類似ファイルＡ、Ｂ、Ｃの、本発明を
適用した場合のファイルの格納例を示すブロック図であ
る。第８図は、１つの元ファイルと追加、削除ファイルから
別のファイルを復元する手順を第７図のＢ、Ｃファイル
を例に示すブロック図である。第９図は、それぞれ２つの追加、削除ファイルを合成す
る手順を第７図のＡ、Ｂ、Ｃファイルを例に示したブロ
ック図である。第１Ｏ図は、復元処理する際、スタッフ処理が発生する
場合の処理例を示すブロック図である。第１１図は、復元処理する際、スタッフ処理が発生しな
い場合の処理例を、第１０図に対して示したブロック図
である。

Claims

【特許請求の範囲】

（１）個々のレコードからなる第１のデータファイルと
それに変更を施した類似ファイルである第２のデータフ
ァイルについて、各々２つのファイルの各レコードを予
め定められた長さで区切り、その単位毎に排他論理和を
加算的にとることにより各レコードを他のレコードに対
し、識別可能であるビット列を作成し、該ビット列から
各々のファイルのレコードの格納順を変更しない様に、
第１のファイル特有のレコード群と第２のファイル特有
のレコード群と、第１、第２のファイル共通のレコード
群に振り分けを行なって、類似ファイル間の特有部を抽
出し、次いで第１、第２のファイルのいずれかを元ファ
イルとしてそのままの形で保存し、他を元ファイルに対
し、追加すべきレコード群および削除すべきレコード群
とみなしてそれぞれのレコード群に属するレコードにそ
れぞれの属するファイルでのレコード番号を付加して格
納することを特徴とする類似データファイルの圧縮格納
方法。
（２）個々のレコードからなる第１のデータファイルと
それに変更を施した類似ファイルである第２のデータフ
ァイルについて、各々２つのファイルの各レコードを予
め定められた長さで区切り、その単位毎に排他論理和を
加算的にとることにより各レコードに対し、識別可能で
あるビット列を作成し、該ビット列から各々のファイル
のレコードの格納順を変更しない様に、第１のファイル
特有のレコード群と第２のファイル特有のレコード群と
第１、第２のファイル共通のレコード群に振り分けを行
なって類似ファイル間の特有部を抽出し、次いで第１、
第２のファイルのいずれかを元ファイルとしてそのまま
の形で保存し他を元ファイルに対し追加すべきレコード
群および削除すべきレコード群とみなしてそれぞれのレ
コード群に属すレコードにそれぞれの属するファイルで
のレコード番号を付加して格納し、前記元ファイルと追
加、削除ファイルを作用させて類似ファイルを復元する
ことを特徴とする類似データファイルの圧縮格納復元方
法。
（３）類似ファイルの復元に際し、元ファイルに２つ以
上の追加、削除ファイルを作用させる場合には、あらか
じめ複数の追加、削除ファイルを作用させ、１つの追加
、削除ファイルを作成し、これを元ファイルに作用させ
て行う特許請求の範囲第（２）項の類似データファイル
の圧縮格納復元方法。