JPS63305439A - 類似デ−タファイルの圧縮格納方法および復元方法 - Google Patents

類似デ−タファイルの圧縮格納方法および復元方法

Info

Publication number
JPS63305439A
JPS63305439A JP62142508A JP14250887A JPS63305439A JP S63305439 A JPS63305439 A JP S63305439A JP 62142508 A JP62142508 A JP 62142508A JP 14250887 A JP14250887 A JP 14250887A JP S63305439 A JPS63305439 A JP S63305439A
Authority
JP
Japan
Prior art keywords
file
files
record
records
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62142508A
Other languages
English (en)
Inventor
Meikai Nakamura
中村 明海
Takao Oiwa
高雄 大岩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Steel Corp
Original Assignee
Nippon Steel Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Steel Corp filed Critical Nippon Steel Corp
Priority to JP62142508A priority Critical patent/JPS63305439A/ja
Publication of JPS63305439A publication Critical patent/JPS63305439A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、計算機によるデータ処理等で一般に知られて
いる順次アクセスファイルに関する世代ファイルを格納
する方法において、その格納を圧縮された形で効率的に
行ない、かつ元のファイルをその圧縮されたファイルか
ら復元する方法に関するものである。
〔従来の技術〕 従来1世代ファイルは、不当なデータの更新。
処理の不正等、ソフトの誤りに対する備えと、記憶装置
の障害等のハードの誤りに対する備えのために存在する
ファイルの保存形態である。特に、前者の誤りに対して
は、誤りの発見のおくれに備え、3世代以上持つことが
常識であり、扱うデータの重要度、更新処理の実行頻度
等により持つべき世代数が決められる。しかし、各世代
ファイル間で保有するレコードは大半が同じものであり
これらをそのままの形で記憶装置に保存することは一種
の無駄である。
類似データについて、圧縮して保存しようとする試みが
例えば特開昭56−74744号公報、特開昭57−1
32242号公報、特開昭60−35373号公報等に
より行われている。しかしながら、データの圧縮/復元
をファイル間にわたって行なう手段については確立され
ていない。
〔発明が解決しようとする問題点〕
これらのデータ処理においては、計算機負荷の大幅な増
大をもたらすことなく極力縮減された形態にファイル間
にわたって圧縮することが望まれている。また復元後の
ファイルにおいて元ファイルとデータ上の誤りは許され
ないものであり、このような目的に沿う手段は、これま
で開発されていなかった。
本発明の目的は、世代ファイルの本来の目的をそこなわ
ず、かつ、現実的な計算量で保存方法を工夫し、記憶装
置の節約を図るものである。
〔問題点を解決するための手段および作用〕本発明の圧
縮格納方法は、次に説明する(1)および(2)の処理
で構成され、また、圧縮格納復元方法は次に説明する(
1)、(2)および(3)の処理により構成される。
(1)類似ファイル間の特有部抽出ニ 一般に、2つの順次アクセスファイルの不一致なレコー
ドの判別は、次の処理で可能である。
■各ファイル内の各レコード全体を2進数を表わすビッ
ト列とみなして、それをKEYとして昇順に並びかえる
■並びかえた2つの、ファイルを先頭から順に読み込み
、一致していれば同一レコードと判断し。
2つのファイルから次のレコードを読み込み、その2つ
のレコードに対し比較を行う。不一致であれば小さい方
のレコードをそれが属するファイルの特有レコードとみ
なし、小さいレコードを持つファイルから次のレコード
を読み込み、これと残ったレコードについて比較を行う
以上の処理を2つのファイル処理した場合、残ったレコ
ードがなくなるまでくり返す。但し、どちらか一方のフ
ァイルをすべて処理した場合、残ったファイル中のレコ
ードはすべて特有のレコードとみなす。
しかし、容量の大きなファイルについて、そのまま■、
■の処理を行うこと、および後述する「昇順阻害レコー
ド」の抽出処理を行うことは。
計算機のCPU(センタープロセシングユニット:マイ
クロプロセッサ)の負荷、補助記憶装置のI10負荷を
考えると、実用に耐えない。そこで本発明では、各々の
2つのファイルについて各レコードを予め定められた単
位長さで区切り、その単位毎に加算的に排他論理和をと
ることにより各レコードについて短いビット列を作成す
る。排他論理和の演算は、2つのビット列の対応するビ
ットが共にオン(例えば高レベル1)かオフ(低レベル
0)の場合はオフとし、それ以外はオンとする。レコー
ドをある単位長さに区切り、加算的に排他論理和をとっ
た場合、単位長さに区切られたものを縦に並べた時それ
ぞれ対応するビットのオンの合計が、偶数であれば結果
はオフとなり、奇数であればオンとなる6一般の業務で
使用するファイルで、内容が違うにも拘らず縦にみた場
合の各ビットのオンの数の奇数、偶数が全く一致するこ
とは5区切る単位が64ビット程度であれば、その組み
合わせの数は1019にのぼり、はとんどあり得ない。
つまり、排他論理和のこのような使い方は、1つのレコ
ードを他の内容の違うレコード、はぼ、識別可能な代表
値、を作成する。
第5図に、長さ2バイト(16ビツト)のレコードを4
ビット単位で加算的に排他論理和(EOR:エクスクル
ーシブオア)をとる例を示す。18で示す4ビツトと1
9で示す4ビツトで排他論理和をとり、20に示す中間
結果となる。さらに20の中間結果と。
21の示す4ビツトを排他論理和をとり、22に示す中
間結果となる。この繰り返しにより、23に示す代表値
を得る。このようにして得た代表値を使用して、前述の
操作の、■の処理を行うことにより、実用に耐えうる計
算機のCPU負荷、補助記憶装置のI10負荷で、類似
ファイル間の共通レコード群、それぞれのファイルの特
有レコード群の判定。
作成を行う。
この様にして得られた共通レコード群に対して、2つの
ファイルの対応するレコードのレコード番号の順序性が
崩れていると、復元処理を行う場合にスタック処理を要
する。第10図により2つのファイルA、Bについて、
共通レコード群とB特有のレコード群よりBのファイル
を復元する場合について説明する。共通レコード群、B
特有レコード群は、順次ファイルであるために、いちば
ん上のレコードしか移動できない、この条件のもとてレ
コード番号が(1)から始まって、順次1ずつ増加する
様に積み重ねてゆけば、それがBファイルとなる。レコ
ード番号(1)〜(4)は、その番号順に積み重さねて
ゆけば復元できるが、レコード番号(5)を得ようとし
た場合、先の条件よりレコード番号(7) 、 (8)
 、 (9) 、 (10)を他に移してからレコード
番号(5)を得る動作が必要となり、この様な事が多発
した場合処理時間が、非常にかかる。そこで、レコード
番号(5)をBの特有ファイルと扱うことにより、この
様なスタック処理を避ける。
第11図にレコード番号(5)をBの特有ファイルとし
た場合の処理を示す、これは、類似ファイル間の特有部
抽出処理において、特有部とみなす条件を「両ファイル
に存在しないレコード」に加え「共通部とみなされた両
方の対応するレコード番号が共に昇順であることを阻害
するレコード」とすることである。具体的には、先の■
、■の処理で作成された共通レコード群に対し、一方の
ファイルのレコード番号で昇順にならべかえ、他方のフ
ァイルのレコード番号も昇順であるか判定し。
昇順を阻害するレコードは、第1.第2フアイル特有の
レコードとみなす。
昇順を阻害するレコードの判定にて、実際のレコードの
内容が異なるにも拘らず排他論理和により作成されたビ
ット列が同一になった場合、又は、実際に同一内容のも
のが業務処理の関係で、レコード番号が大きく異なった
場合、たとえば、仮に第1のファイルの2番目のレコー
ドと、第2のファイルの最終レコードが同一とみなされ
る事態がおこり得る。これにより、大部分のレコードが
昇順阻害とみなされないために定められたある一定の数
を基準値として1判定しようとするレコードのレコード
番号が、前のレコードのレコード番号に対し定められた
基準値以上能れている場合は、無条件に昇順阻害レコー
ドとみなす。実際の適用例では、この基準値を5〜10
とすれば大きな誤りとはならなかった。
第6図に、2つの類似ファイル−Aファイル。
Bファイル−の各レコードの代表値を得たところより、
共通、特有レコード群を得るところまでのファイルの流
れを示す。第6図において、 24.25は、A、Bフ
ァイルを示し、それぞれの各レコードの代表値とレコー
ド番号を示す。これらを2代表値により昇順にソートし
たものが、 26.27である。さらに、ソートしたも
のに対し、代表値が一致するものの2つのファイルのレ
コード番号を格納したものが28で、それぞれのファイ
ルの特有な代表値を持つもののレコード番号を格納した
ものが29 、30である。ここで、共通部とみなされ
たものをAファイルのレコード番号で、昇順にソートし
たものが31である。31に対し、Bファイルのレコー
ド番号が昇順にならないものを各ファイルの特有部に移
した結果が32.33となる。
以上の様にして得られた2つのファイルの共通、特有の
レコード番号を使用して、実際のファイルを読み込み、 a)共通レコードとみなしたレコード同士が本当に同一
のものであるかのチェックを行い違うものであれば特有
レコードとする。
b)各ファイルの特有レコード番号を持つものの実際の
レコードをそれぞれの属していたファイルでのレコード
番号を付加して、特有レコードとして格納する。
実際の保存方法は、第1.第2フアイルのいずれかを元
ファイルとしてそのままの形で保存し、他を先に得た2
つの特有ファイルを元ファイルに対する追加、削除すべ
きレコード群として保存する。元ファイル、追加、削除
ファイルの形で持つことは3つ以上類似ファイルがある
場合の格納効率を考慮してのことである。つまり、3つ
以上類似ファイルがある場合、1つの元ファイルと複数
の追加、削除ファイルの形で保存することが可能であり
、効率的な保存方法となる。
(2)類似ファイルの格納処理: 保存方法は、第1.第2フアイルのいずれかを元ファイ
ルとして、そのままの形で保存し、他を前記(1)項記
載の処理で得た2つの特有ファイルを元ファイルに対す
る追加、削除すべきレコード群とし、それぞれの属して
いたファイルでのレコード番号を付加して保存する。具
体的には、前記(1)の処理で得た特有レコード群のレ
コード番号順に実際のファイルのレコードを保存するが
、この時共通レコードとみなしたレコード同士が本当に
同一のものであるかのチェックも行い、違うものであれ
ば特有レコードとする6元ファイル、追加、削除ファイ
ルの形で持つことは、3つ以上類似ファイルがある場合
の格納効率を考慮してのことである。つまり、3つ以上
類似ファイルがある場合、1つの元ファイルと、複数の
追加、削除ファイルの形で保存することが可能であり、
効率的な保存方法となる。
第7図に3つの類似ファイルがある場合の保存例を示す
。すなわち、Aファイル34.Bファイル35、Cファ
イル36の3つの類似ファイルについて、圧縮を行って
、37.38.39,40.41のファイルに変換する
。36のCファイルは、元ファイルとしてそのまま旧に
持つ、35のBファイルは36のCファイルに対しての
特有レコード群を追加、削除ファイルとして39.40
に持つ。ここで39の追加ファイルは35のBファイル
を復元するために、41の元ファイル(=36のCファ
イル)に追加すべきレコード群である。同様に40の削
除ファイルは、35のBファイルを復元するために、4
1の元ファイルから削除すべきレコード群である。34
のAファイルは35のBファイルに対しての特有レコー
ド群を追加、削除ファイルとして、 37,3gに持つ
、37は34のAファイルのレコード番号を持ち、38
.39は、35のBファイルのレコード番号を持ち、4
0は36のCファイルのレコード番号を持つ。
この様な格納方法を実現するうらには、先に述べた特有
レコードの定義を[共通部とみなされた両ファイルの対
応するレコード番号が、共に昇順であることを阻害する
レコード」とすることによる。仮に、この定義でない場
合、第7図の41の元ファイルに、35のBファイル、
36のCファイルの2つのファイルのレコード番号を持
たせ、復元処理時に1元ファイルを所望するファイルの
レコード番号で、ソートしなおす処理が必要となり、復
元処理の負荷が大きくなる。
以上の(1)記載の「類似ファイルの特有部抽出処理」
と、(2)項記載の「類似ファイルの格納処理」を組み
合わせることにより「データ圧縮処理Jが実現される。
(3)格納された類似ファイルの復元処理:前記(2)
記載の元ファイルと、追加、削除ファイルを使用して、
元ファイル以外の類似ファイルを作成する方法を説明す
る。
元ファイルから、削除ファイルの示すレコード番号を削
除したものが2つの類似ファイルの共通レコード群であ
り、この共通レコード群と追加ファイルをたし合わせれ
ば1元ファイル以外の類似ファイルとなる。追加ファイ
ルには、所望するファイル上でのレコード番号を保存し
ているので、共通レコード群の所望するファイル上での
レコード番号を知ることができればそれらの番号順で組
みたてて、所望するファイルの復元ができる。ここで共
通レコード群は、2つの類似ファイルのレコード番号で
共に必ず昇順となっているように圧縮処理されているの
で、追加ファイル中にあるレコードのレコード番号をそ
の番号の示す位置に置き、空いたところを共通レコード
群より先頭から順に埋めてゆ、けば所望するファイルが
得られる。
第8図に第7図のファイルB、Cを例にした回復方法を
示す。
第8図の42は、Bの削除ファイルであり、第7図の4
0と同一である。第8図の43は1元ファイルであり、
第7図の41と同一であるが、便宜上レコード番号を付
記している。第8図の43は、第7図の36のCファイ
ルそのものであり、レコード番号は、その並び順と一致
しているので、処理上は、レコード番号が分かっている
ものとしても問題ない。第8図の46は、Bの追加ファ
イルであり、第7図の39と同一である。42,43.
46の3つのファイルを使用して45のBファイルを復
元する。まず、43のCファイルより、42のBの削除
ファイルの持つレコード番号と一致するものを取り除い
て、44の共通ファイルを作成する。次に44の共通フ
ァイルと、46のBの追加ファイルを使用して、45の
Bファイルを作成する。、45のBファイルの作成は、
レコード番号が1から順次決定する。決定しようとする
レコード番号と、46のBの追加ファイルの持つレコー
ド番号が一致する場合は、46のBの追加ファイルのレ
コードを45のBファイルのレコードとし、一致しない
場合は44の共通ファイルに残る先頭のレコードを、4
5のBファイルのレコードとする。
以上の操作により、Bファイルの復元が実施される。さ
らに、類似ファイルが3つ以上あり、元ファイルから2
つ以上離れているファイルの復元は、元ファイルと2組
以上の追加削除ファイルを使用して復元する必要がある
が、この場合は、複数の追加、削除ファイルを何らかの
方法で作用させ1つの追加、削除ファイルを作成し、前
述の元ファイル、追加、削除ファイルを使用した復元の
問題に帰着させる。これは1元ファイルは追加、削除フ
ァイルに比べ非常に大きく、元ファイルと、追加、削除
ファイルを使用した復元処理を複数回行うことにより、
複数の追加、削除ファイルを事前に合成させる方が処理
負荷が軽くなる。
3つ以上の追加、削除ファイルを作用させ、1つの追加
、削除ファイルを作成する方法は、2つの追加、削除フ
ァイルを作用させる1つの追加。
削除ファイルを作成することの繰り返しで得られる。
第7図において、34のAファイルを復元しようとした
場合、前記(2)記載の処理のみでは、まず、39の追
加ファイル、40の削除ファイル、41の元ファイルを
作用させることにより、35のBファイルを復元させる
。それから37の追加ファイル、38の削除ファイル、
35のBファイルを作用させることにより、34のAフ
ァイルを復元させる。しかし、35のBファイルを復元
させることは、計算機のCPU負荷、補助記憶装置のI
10負荷を増大させ、復元させたいファイルと元ファイ
ルとの距離が大きくなると、さらに悪化する。そこで、
類似ファイルが3つ以上あり1元ファイルから、2つ以
上離れているファイルの復元は、複数の追加、削除ファ
イルを何らかの方法で作用させ、1つの追加。
削除ファイルを作成し、その前記(2)記載の元ファイ
ル、追加、削除ファイルを使用した、復元の問題に帰着
させる。これは、元ファイルは、追加、削除ファイルに
比べ非常に大きく1元ファイルと、追加、削除ファイル
を使用した、復元処理を複数回行うよりも、複数の追加
、削除ファイルを事前に合成させる方が処理負荷で軽い
からである。
3つ以上の追加、削除ファイルを作用させ、1つの追加
、削除ファイルを作成する処理は、2つの追加2削除フ
アイルを作用させ、1つの追加、削除ファイルを作成す
ることの繰り返しで得られる。
2つの追加、削除ファイルの合成は、基本的には異なる
レコード番号体系を変換する操作で実現できる。
第9図に、第7図のファイルを例にして2つの追加ファ
イルを1つに合成する場合を示す、第9図において、4
7はAの追加ファイルで、第7図の37と同一である。
49はBの追加ファイルで、第7図の39と同一である
。さらに2つの追加ファイルの合成に48のAの削除フ
ァイルを必要とし、これは、第7図の38と同一である
ファイルAからAの追加ファイル47をとりのぞいたも
の50とファイルBからAの削除ファイル48をとり除
いたもの51は、共にファイルA−Bの共通部分となり
、1 : I L:対応する。また51のBファイルか
らへの削除ファイルをとり除いたものと49のBの追加
ファイルは、共にファイルBのレコード番号で、記述さ
れており、一致するレコード番号を持つものが同一内容
である。第9図の例で、49のr2’  CJ、r3’
  DJは51に示すところに対応する。r5’iJに
関しては、一致するものがないので捨てる。これは、4
8のAの削除ファイルにr6’  iJが存在するので
、相殺されるからである。さらにこの様にして得たr2
’  CJ、r3’  DJは、50と51が1対1に
対応することから、50の中ではr3CJ、r4DJと
なる(52)、これが、49のBの追加ファイルのレコ
ード番号をAファイルのレコード番号の体系に変換した
ものとなる。最後に、52と47をレコード番号につい
てマージ処理して得たものが、Cファイルを元ファイル
としてAファイルを復元するための追加ファイル53で
ある。Cファイルを元ファイルとして、Aファイルを復
元するための削除ファイル54についても、第7図の3
8.39.40を使用して1合成が可能である。
すなわち、ファイルAからAの追加ファイルをとりのぞ
いたもの(■)とファイルBからAの削除ファイルをと
りのぞいたもの(■)は、共にA−Bの共通部分となり
、1:1に対応する。
また、ファイルBからAの削除ファイルを除いたものと
、Bの追加ファイルは共にファイルBのレコード番号で
記述されており、一致するレコード番号を持つものが同
一内容である(■)。
但し、レコード番号が一致しないレコードが出現した場
合これを捨てる。更に、ここで得たレコードとファイル
AからAの追加ファイルをとり除いたものと対応する。
レコード番号がBの追加ファイルをAのレコード番号体
系に変換したものである(■)。このようにして得たB
の追加ファイルとAの追加ファイルをレコード番号につ
いてマージ処理して得たものが所望する追加ファイルで
ある(■)。削除ファイルについても同様にして求める
ことができる(■)。
第1図に、本発明を実施するためのシステムの構成を示
する。1,2.3は、ホスト計算機内で動作するタスク
であり、■はアプリケーションを示し、計算機利用者が
必要とする情報のとり出しファイルの更新等で実行する
タスク、2はアプリケーション、ジョブスケジューラ−
を示し1の実行開始、使用リソース等の管理をするタス
クである。
3は本発明の基本機能を有するファイル管理タスクであ
り、ジョブスケジューラ−2より出される指示に従って
動作する。4は連絡ファイルを示し、アプリケーション
lで必要とするファイルを復元した形で提供するための
磁気ディスクである。5は保存ファイルを示し、アプリ
ケーション1にて更新され、連絡ファイル4にはき出さ
れたファイル内のデータを圧縮した形で保存するための
磁気ディスクである。6はバックアップファイルを示し
、保存ファイル5の障害に備えて、その回復をはかるた
めのデータを有する磁気テープである。
ジョブスケジューラ−2よりファイル管理タスク3に出
される指示は、「アプリケーション1にて使用するファ
イルの復元要求」 「アプリケーションlにて更新した
ファイルの圧縮要求」である。
「アプリケージ1ン1にて使用するファイルの復元要求
」が出された場合、ファイル管理タクス3では復元処理
を行う。この時、保存ファイル5の状態を見て要求され
たファイルから元ファイルまでの世代の差が2以上ある
場合、追加、削除ファイルの合成処理を事前に行う。「
アプリケーション1にて、更新したファイルの圧縮要求
」が出された場合、ファイル管理タスク3では圧縮処理
バックアップ処理を行う。圧縮処理において類似ファイ
ルが1つのみの場合は、1つ前の世代のファイルの復元
処理を行ったのち、圧縮処理を行う。
第2図に、保存ファイル5の保存イメージを示す。7は
最新世代ファイルで、元ファイルの形で持つ。8.8’
 、9.9’ は、それぞれ最新世代ファイルより1つ
ずつ古い世代ファイルで、追加、削除の形で持つ、最新
世代ファイル7を元ファイルの形で持つ理由は、圧縮処
理の簡易化のためである。第9図について、〔最新−1
〕の世代を元ファイルで、〔最新〕を追加、削除ファイ
ルで保存する場合、次に〔最新+1〕と、最新の組み合
わせで圧縮処理をすると六、〔最新−1〕も示ファイル
かr1追加、削除ファイルに変換しなければ本発明の目
的を果すことができないからである。バックアップ処理
では、圧縮処理において作成されたファイルの更新世代
分をテープに保存する。
第3図に、保存ファイル5と、バックアップファイル6
との関係を示す6バツクアツプ処理では、圧縮処理で〔
最新−1〕として扱われる追加、削除ファイルを、追加
、削除の機能を逆にして最新の追加、削除ファイルとし
て扱う。これにより、保存ファイル5の保存形態に影響
を与えずにバックアップ処理を少量の単純コピー処理で
実現することができる。
第4図に、バックアップファイル6の保存イメージを示
す、 14.14’ 〜16,16’ は、先に述べた
処理で得たファイルである。17は復元処理のための元
ファイルとしである周期で保存したものである。
〔発明の効果〕
本発明によれば、従来のアプリケーションプログラムと
ファイルのインターフェイスを変更せずに、現実的な計
算機処理量にて、存在する情報量に比例したディスク容
量のみ必要とする世代ファイルの効率的な保存方法が実
現できる。これにより、世代ファイルの運用コストが世
代数に大きな影響を与えず、データの重要度、更新処理
の実行頻度等に見合った適正な世代数が設定可能となる
と共に、従来無駄に使用していた記憶装置の節約を図る
ことが可能となる。
例えば一つの工場の操業管理システムにおいての例をあ
げれば、本発明により、世代ファイルについて1/2〜
1/6に記憶容量の削減を実現し、さらに従来より存在
するファイル内の圧縮を組み合わせることにより1/1
0〜1/40の記憶容量削減を実現した。また、lレコ
ード1000バイト、3万レコードの2つの類似ファイ
ルを圧縮するのに、市販の日立M2O0HD(処理能力
6 Mips)で、CPU使用:130秒と、極めて低
負荷であった。
【図面の簡単な説明】
第1図は、本発明を実施するシステム構成の一例を示す
ブロック図である。 第2図は、第1図に示す保存ファイル5のファイル格納
手順の一例を示すブロック図である。 第3図は、第1図に示す保存ファイル5とバックアップ
ファイル6のファイル格納手順を対比して示すブロック
図である。 第4図は、第1図に示すバックアップファイル6のファ
イル格納手順を示すブロック図である。 第5図は、ルーコードをあるビット列に分割し、加算的
に排他論理和をとる手順を示すブロック図である。 第6図は、2つの類似ファイルA、Bのレコード番号お
よび代表値から、特有部のレコード番号および共通部の
レコード番号を得る手順を示すブロック図である。 第7図は、3つの類似ファイルA、B、Cの、本発明を
適用した場合のファイルの格納例を示すブロック図であ
る。 第8図は、1つの元ファイルと追加、削除ファイルから
別のファイルを復元する手順を第7図のB、Cファイル
を例に示すブロック図である。 第9図は、それぞれ2つの追加、削除ファイルを合成す
る手順を第7図のA、B、Cファイルを例に示したブロ
ック図である。 第1O図は、復元処理する際、スタッフ処理が発生する
場合の処理例を示すブロック図である。 第11図は、復元処理する際、スタッフ処理が発生しな
い場合の処理例を、第10図に対して示したブロック図
である。

Claims (3)

    【特許請求の範囲】
  1. (1)個々のレコードからなる第1のデータファイルと
    それに変更を施した類似ファイルである第2のデータフ
    ァイルについて、各々2つのファイルの各レコードを予
    め定められた長さで区切り、その単位毎に排他論理和を
    加算的にとることにより各レコードを他のレコードに対
    し、識別可能であるビット列を作成し、該ビット列から
    各々のファイルのレコードの格納順を変更しない様に、
    第1のファイル特有のレコード群と第2のファイル特有
    のレコード群と、第1、第2のファイル共通のレコード
    群に振り分けを行なって、類似ファイル間の特有部を抽
    出し、次いで第1、第2のファイルのいずれかを元ファ
    イルとしてそのままの形で保存し、他を元ファイルに対
    し、追加すべきレコード群および削除すべきレコード群
    とみなしてそれぞれのレコード群に属するレコードにそ
    れぞれの属するファイルでのレコード番号を付加して格
    納することを特徴とする類似データファイルの圧縮格納
    方法。
  2. (2)個々のレコードからなる第1のデータファイルと
    それに変更を施した類似ファイルである第2のデータフ
    ァイルについて、各々2つのファイルの各レコードを予
    め定められた長さで区切り、その単位毎に排他論理和を
    加算的にとることにより各レコードに対し、識別可能で
    あるビット列を作成し、該ビット列から各々のファイル
    のレコードの格納順を変更しない様に、第1のファイル
    特有のレコード群と第2のファイル特有のレコード群と
    第1、第2のファイル共通のレコード群に振り分けを行
    なって類似ファイル間の特有部を抽出し、次いで第1、
    第2のファイルのいずれかを元ファイルとしてそのまま
    の形で保存し他を元ファイルに対し追加すべきレコード
    群および削除すべきレコード群とみなしてそれぞれのレ
    コード群に属すレコードにそれぞれの属するファイルで
    のレコード番号を付加して格納し、前記元ファイルと追
    加、削除ファイルを作用させて類似ファイルを復元する
    ことを特徴とする類似データファイルの圧縮格納復元方
    法。
  3. (3)類似ファイルの復元に際し、元ファイルに2つ以
    上の追加、削除ファイルを作用させる場合には、あらか
    じめ複数の追加、削除ファイルを作用させ、1つの追加
    、削除ファイルを作成し、これを元ファイルに作用させ
    て行う特許請求の範囲第(2)項の類似データファイル
    の圧縮格納復元方法。
JP62142508A 1987-06-08 1987-06-08 類似デ−タファイルの圧縮格納方法および復元方法 Pending JPS63305439A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62142508A JPS63305439A (ja) 1987-06-08 1987-06-08 類似デ−タファイルの圧縮格納方法および復元方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62142508A JPS63305439A (ja) 1987-06-08 1987-06-08 類似デ−タファイルの圧縮格納方法および復元方法

Publications (1)

Publication Number Publication Date
JPS63305439A true JPS63305439A (ja) 1988-12-13

Family

ID=15316979

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62142508A Pending JPS63305439A (ja) 1987-06-08 1987-06-08 類似デ−タファイルの圧縮格納方法および復元方法

Country Status (1)

Country Link
JP (1) JPS63305439A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0452826A (ja) * 1990-06-15 1992-02-20 Fujitsu Ltd データ処理システム
JPH06290092A (ja) * 1991-11-04 1994-10-18 American Teleph & Telegr Co <Att> 記憶装置へのファイル格納装置
US6816872B1 (en) * 1990-04-26 2004-11-09 Timespring Software Corporation Apparatus and method for reconstructing a file from a difference signature and an original file
JP2008537209A (ja) * 2005-03-11 2008-09-11 ロックソフト リミテッド データ・クラスタを使用する冗長性の少ないデータを格納する方法
WO2016016923A1 (ja) * 2014-07-28 2016-02-04 三菱電機株式会社 差分データ作成システム、データ更新システム及び差分データ作成方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5949062A (ja) * 1982-09-13 1984-03-21 Hitachi Ltd 情報記憶方式

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5949062A (ja) * 1982-09-13 1984-03-21 Hitachi Ltd 情報記憶方式

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6816872B1 (en) * 1990-04-26 2004-11-09 Timespring Software Corporation Apparatus and method for reconstructing a file from a difference signature and an original file
JPH0452826A (ja) * 1990-06-15 1992-02-20 Fujitsu Ltd データ処理システム
JPH06290092A (ja) * 1991-11-04 1994-10-18 American Teleph & Telegr Co <Att> 記憶装置へのファイル格納装置
JP2008537209A (ja) * 2005-03-11 2008-09-11 ロックソフト リミテッド データ・クラスタを使用する冗長性の少ないデータを格納する方法
JP4768009B2 (ja) * 2005-03-11 2011-09-07 ロックソフト リミテッド データ・クラスタを使用する冗長性の少ないデータを格納する方法
WO2016016923A1 (ja) * 2014-07-28 2016-02-04 三菱電機株式会社 差分データ作成システム、データ更新システム及び差分データ作成方法
US9900026B2 (en) 2014-07-28 2018-02-20 Mitsubishi Electric Corporation Differential data creating apparatus, data updating apparatus, and differential data creating method

Similar Documents

Publication Publication Date Title
US6378054B1 (en) Data backup device and method for use with a computer, and computer-readable recording medium having data backup program recorded thereon
US8443000B2 (en) Storage of data with composite hashes in backup systems
US7680998B1 (en) Journaled data backup during server quiescence or unavailability
US20040139127A1 (en) Backup system and method of generating a checkpoint for a database
US9002800B1 (en) Archive and backup virtualization
JPH04139544A (ja) データ復元方法
CN112612576B (zh) 虚拟机备份方法、装置、电子设备及存储介质
CN113468118B (zh) 一种基于区块链的文件增量存储方法、装置及存储介质
US6604183B2 (en) Log storage management in a data processing system using key-pointing
JPS63305439A (ja) 類似デ−タファイルの圧縮格納方法および復元方法
US7756818B1 (en) Database table recovery system
US7685186B2 (en) Optimized and robust in-place data transformation
WO2011095345A1 (en) Method and system for compressing data records and for processing compressed data records
US6226411B1 (en) Method for data compression and restoration
JPH04360246A (ja) ファイル圧縮装置
US6510499B1 (en) Method, apparatus, and article of manufacture for providing access to data stored in compressed files
CN114064982A (zh) 基于快照相似性的大规模时变图存储方法及系统
JPH033046A (ja) ログ記録管理方式
US5978810A (en) Data management system and method for storing a long record in a set of shorter keyed records
JP6853506B2 (ja) ストレージシステム、データソート方法及びプログラム
JP2004062475A (ja) インデクス格納方法
JP2000066929A (ja) コアファイル管理システムおよびコアファイル管理方法
JP3567792B2 (ja) 情報処理装置及び補助記憶媒体への出力データ量の算定方法
JP3559571B2 (ja) データ処理装置およびデータ処理方法
CN114546731A (zh) 一种工作流数据恢复方法及数据恢复系统