JPH05298061A

JPH05298061A - データ圧縮および復元方式ならびにその装置

Info

Publication number: JPH05298061A
Application number: JP10280192A
Authority: JP
Inventors: Hirotaka Chiba; 広隆千葉; Yoshiyuki Okada; 佳之岡田; Yasuhiko Nakano; 泰彦中野; Shigeru Yoshida; 茂吉田
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1992-04-22
Filing date: 1992-04-22
Publication date: 1993-11-12

Abstract

(57)【要約】【目的】ユニバーサル符号、特にＬＺＷ(Lempel-Ziv-
Welch)符号を用いたデータ圧縮および復元方式ならびに
その装置に関し、復元されたデータが有効であるか否か
を正確に判定することのできるデータ圧縮および復元方
式ならびにその装置を提供することを目的とする。【構成】符号化済みデータを相異なる部分列に分けて
各部分列毎に異なる参照番号を付加して辞書に登録して
おき、入力データを該辞書中の部分列のうち、最大長一
致するものの参照番号で指定して符号化するデータ圧縮
方式において、圧縮処理時に特有に発生する項目のデー
タを前記符号データに付加するように構成する。また、
データ復元時に、前記付加された項目のデータと、復元
処理時に特有に発生する該当項目のデータとを比較し、
両者が一致するときに復元されたデータを有効データと
判定するように構成する。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、ユニバーサル符号、特
にＬＺＷ（Ｌｅｍｐｅｌ−Ｚｉｖ−Ｗｅｌｃｈ）符号を
用いたデータ圧縮および復元方式ならびにその装置に関
する。

【０００２】近年、文字コード、ベクトル情報、画像情
報など様々な種類のデータがコンピュータで扱われるよ
うになっており、扱われるデータ量も急速に増加してき
ている。大量のデータを扱うときは、データ中の冗長な
部分を省いてデータ量を圧縮することで、記憶容量を減
らしたり、速く伝送できるようになる。

【０００３】様々なデータを１つの方式でデータ圧縮／
復元できる方式として、ユニバーサル符号化がある。ユ
ニバーサル符号化は、情報源の統計的性質が未知である
場合に符号化を行ないながら統計的性質を調べて適応化
していく手法である。なお、ユニバーサル符号は、文字
コードに限らず、様々なデータに適用することができる
が、以下の説明においては、データが何であるかにかか
わりなく、データの１ワード単位を「文字」と呼び、こ
の文字が任意の数つながったものを「文字列」と呼ぶも
のとする。

【０００４】ユニバーサル符号の代表的な例としては、
Ｚｉｖ−Ｌｅｍｐｅｌ（ジブ−レンペル）符号がある。
Ｚｉｖ−Ｌｅｍｐｅｌ符号では、ユニバーサル型と、増
分分解型の２つのアルゴリズムが提案されている。さら
に、ユニバーサル型アルゴリズムの改良としては、ＬＺ
ＳＳ符号が提案され、また、増分分解型アルゴリズムの
改良としてはＬＺＷ（Ｌｅｍｐｅｌ−Ｚｉｖ−Ｗｅｌｃ
ｈ）符号が提案されている。記憶装置のファイル圧縮処
理などの分野では、高速処理ができること、アルゴリズ
ムが簡単であることなどから、ＬＺＷ符号が多く使われ
るようになっている。本発明は、このＬＺＷ符号を用い
たデータ圧縮と復元に関するものである。

【０００５】

【従来の技術】従来のデータ圧縮／復元装置は、図７に
その構成を示すように、ユニバーサル符号化部７１およ
び書き替え可能な辞書部７２を備えており、入力データ
を相異なる文字列に分け、この文字列を出現した順に番
号をつけて辞書に登録するとともに、現在入力している
文字列を既に辞書に登録した文字列と照合することによ
り最長一致文字列の番号で表し、この番号を入力の順番
に出力することにより、図８に示すように一連の符号化
データとして出力するものである。

【０００６】図９にＬＺＷ符号化処理のフローチャート
を、また、図１０にその復号化処理のフローチャートを
示す。

【０００７】図９の符号化処理においては、まずステッ
プＳ１において、予め使用する全文字について一文字か
らなる文字列を初期値として登録し、それぞれに参照番
号を付与するとともに、入力された最初の文字Ｋを語頭
文字列（prefix string)ωとして設定する。

【０００８】次に、ステップＳ２で次に入力してくる文
字Ｋを読み込み、ステップＳ３で文字入力が終了したか
否かをチェックした後、ステップＳ４に進み、前記ステ
ップＳ１で得られた語頭文字列ωにステップＳ２で読み
込んだ文字Ｋを加えた文字列（ωＫ）が辞書にあるか否
かを探す。

【０００９】ステップＳ４で文字列（ωＫ）が辞書にな
ければ、ステップＳ６に進んで、求めた文字Ｋの参照番
号ωを符号語code（ω）として出力するとともに、文字
列（ωＫ）に新たな参照番号を付与して辞書に登録し、
さらに、ステップＳ２の入力文字Ｋを参照番号ωに置き
換えるとともに、辞書アドレスｎをインクリメントし、
ステップＳ７〜Ｓ１０で辞書登録スペースのチェックを
行なった後、再びステップＳ２に戻り、次の文字Ｋを読
み込む。

【００１０】一方、ステップＳ４で文字列（ωＫ）が辞
書にあれば、ステップＳ５で文字列（ωＫ）を参照番号
ωに置き換え、ステップＳ７〜Ｓ１０で辞書登録スペー
スのチェックを行なった後、再びステップＳ２に戻り、
文字列（ωＫ）が辞書から探せなくなるまで、最大一致
長の文字列の探索を続ける。

【００１１】前記ＬＺＷ符号化処理の具体例を図１１を
参照して説明する。なお、説明を簡単とするため、
「ａ」「ｂ」「ｃ」の３つの文字の組合せからなる入力
データの場合を例に採るものとする。この３つの使用文
字「ａ」「ｂ」「ｃ」は、予め、図１２（Ａ）に示すよ
うに辞書に登録され、それぞれ順番に参照番号＝１，
２，３が付与されている。

【００１２】図１１中の入力データ（INPUT SYMBOLS)は
左から右へ読み込まれるものとする。最初の文字「ａ」
が入力されると、この文字「ａ」が接頭文字列ωとして
設定される。次に、２番目の文字Ｋ＝「ｂ」が入力され
ると、接頭文字列ω＝「ａ」と組合せて文字列（ωＫ）
＝「ａｂ」とし、この文字列「ａｂ」が辞書にあるか否
かを検索する。

【００１３】辞書には文字列「ａｂ」はないので、図１
２（Ａ）に示すように、この文字列「ａｂ」を辞書に登
録するとともに、新たな参照番号＝４を付与する。そし
て、当該文字列（ωＫ）中の接頭文字列ω＝「ａ」につ
いてその参照番号＝１を読み出し、図１１に示すよう
に、この参照番号＝１を文字列ω＝「ａ」の符号語（OU
TPUT CODES）として出力する。文字「ａ」の符号化が終
わると、文字列（ωＫ）＝「ａｂ」中の残りの文字
「ｂ」が次の接頭文字列ωとなる。

【００１４】次に、３番目の文字Ｋ＝「ａ」が入力され
ると、前記新たな接頭文字列ω＝「ｂ」と組合せて文字
列（ωＫ）＝「ｂａ」とし、この文字列「ｂａ」が辞書
にあるか否かを検索する。辞書には文字列「ｂａ」はな
いので、図１２（Ａ）に示すように、この文字列「ｂ
ａ」を辞書に登録するとともに、新たな参照番号＝５を
付与する。そして、当該文字列（ωＫ）中の接頭文字列
ω＝「ｂ」についてその参照番号＝２を読み出し、図１
１に示すように、この参照番号＝２を文字列ω＝「ｂ」
の符号語（OUTPUT CODES）として出力する。文字「ｂ」
の符号化が終わると、文字列（ωＫ）＝「ｂａ」中の残
りの文字「ａ」が次の接頭文字列ωとなる。

【００１５】次に、４番目の文字Ｋ＝「ｂ」が入力され
ると、前記新たな接頭文字列ω＝「ｂ」と組合せて文字
列（ωＫ）＝「ａｂ」とし、この文字列「ａｂ」が辞書
にあるか否かを検索する。辞書には文字列「ａｂ」が参
照番号＝４として既に登録されている。したがって、こ
の場合には、この文字列「ａｂ」を新たな接頭文字列ω
とした後、さらに次の５番目の文字Ｋ＝「ｃ」を入力
し、この５番目の文字Ｋ＝「ｃ」と前記新たな接頭文字
列ω＝「ａｂ」と組合せて文字列（ωＫ）＝「ａｂｃ」
とし、この文字列「ａｂｃ」が辞書にあるか否かを検索
する。

【００１６】辞書には文字列「ａｂｃ」はないので、図
１２（Ａ）に示すように、この文字列「ａｂｃ」を辞書
に登録するとともに、新たな参照番号＝６を付与する。
そして、当該文字列（ωＫ）中の接頭文字列ω＝「ａ
ｂ」についてその参照番号＝４を読み出し、図１１に示
すように、この参照番号＝４を文字列ω＝「ａｂ」の符
号語（OUTPUT CODES）として出力する。文字列「ａｂ」
の符号化が終わると、文字列（ωＫ）＝「ａｂｃ」中の
残りの文字「ａ」が次の接頭文字列ωとなる。

【００１７】以上の処理を繰り返すことにより、入力デ
ータ「ａｂａｂｃｂａｂａｂａａａａａａ」は符号化デ
ータ「1,2,4,3,5,8,1,10,11 」に変換されて出力され
る。このとき、辞書には、図１２（Ａ）に示すような文
字列とその参照番号が登録される。なお、実際の辞書で
は、メモリ容量を低減するため、図１２（Ｂ）に示すよ
うに、登録文字列は、その下位一桁を残してを既に登録
されている上位側の他の登録文字列の参照番号で置き換
えて辞書登録される。

【００１８】図１０の復号化処理は、図９の符号化処理
と逆の操作を行なう。すなわち、図１０の復号化処理で
は、符号化時と同様に、予め使用する全文字について一
文字からなる文字列を初期値として登録し、それぞれに
参照番号を付与してから復号を始める。

【００１９】ステップＳ１１において、最初の入力符号
（＝参照番号）を読み込み、これをOLDcode とする。最
初の符号語は既に辞書に登録されている一文字の参照番
号のいずれかに該当することから、入力符号に一致する
文字code（Ｋ）を探し出し、文字「Ｋ」を出力する。な
お、出力した文字「Ｋ」は、後の処理のためにFINchar
にセットしておく。

【００２０】次に、ステップＳ１２に進んで、次の入力
符号を読み込み、INcodeとしてセットする。ステップＳ
１３で新たな符号があるか否か、すなわち符号の入力が
終了したか否かをチェックし、ステップＳ１４へ進んで
辞書クリアコードであるか否かを判定した後、ステップ
Ｓ１５において、ステップＳ１３で入力された符号語の
codeが辞書に定義（登録）されているか否かをチェック
する。

【００２１】通常、入力した符号語は、前回までの復号
化処理で既に辞書に登録されているため、ステップＳ１
７に進んで、入力符号語に対応する文字列code（ωＫ）
を辞書から読み出し、ステップＳ１８で文字列Ｋを一時
スタックするとともに、参照番号code（ω）を新たな文
字列とし、再度ステップＳ１７へ戻り、このステップＳ
１７，Ｓ１８の処理を再帰的に参照番号ωが一文字にな
るまで繰り返し、最後にステップＳ１９へ進む。

【００２２】そして、ステップＳ１９において、ステッ
プＳ１８でスタックした文字をＬＩＦＯ（Last In Fast
Out）形式でポップアップして出力し、ステップＳ２０
で辞書の登録エリアをチェックした後、ステップＳ２１
において、前回使った符号ω（OLDcode)と今回復元した
文字列の最初の一文字Ｋとを組み合わせた文字列（ω
Ｋ）に新たな参照番号を付与して辞書に登録する。そし
て、ステップＳ１２へ戻り、前記処理を入力符号がなく
なるまで繰り返す。

【００２３】前記ＬＺＷ復号化処理の具体例を図１３を
参照して説明する。まず、最初の入力符号は「１」であ
るが、一文字「ａ」「ｂ」「ｃ」については、符号化時
と同様に、既に図１２（Ｂ）に示すように辞書登録され
ているから、最初の入力符号「１」に一致する参照番号
の文字列「ａ」を読み出して出力する。

【００２４】次の入力符号「２」についても、同様にし
て符号「２」に一致する参照番号の文字列「ｂ」を読み
出して出力する。このとき、前回復号した符号「１」と
今回復号した文字列の最初の１文字「ｂ」とを組み合わ
せた文字列「１ｂ」に新たな参照番号＝４を付加し、辞
書に登録する。以下、同様の処理を繰り返し、各入力符
号の復号を実行する。

【００２５】なお、図１３の復号化においては次の例外
処理がある。この例外処理は、６番目の入力符号「８」
において生ずる。すなわち、符号「８」はいまだ辞書に
定義されておらず、直ちには復号できない。このような
場合には、前回処理した符号「５」に前回復号した文字
列「ｂａ」の最初の一文字「ｂ」を加えた文字列「５
ｂ」を求め、この文字列中の符号「５」を辞書から探し
て文字列「２ａ」で置き換えることにより「２ａｂ」と
し、さらに「２ａｂ」中の符号「２」を辞書から探して
文字「ｂ」で置き換えることにより、最終的に文字列
「ｂａｂ」を復号する。そして、この復号された文字列
「５ｂ」（＝「ｂａｂ」）は辞書に定義されていなかっ
たから、図１２（Ｂ）のように、新たな参照番号＝８を
付して登録する。

【００２６】この例外処理は、図１０のＬＺＷ復号化処
理のステップＳ４，Ｓ１６の処理を通じて行なわれ、ス
テップＳ１９で文字列「ｂａｂ」を出力するとともに、
辞書への登録が行なわれる。したがって、復号化処理時
にも、図１２（Ｂ）と同一の辞書を作成しながら復号が
行なわれる。このようにして、最終的に、入力符号「1,
2,4,3,5,8,1,10,11 」は元の文字列「ａｂａｂｃｂａｂ
ａｂａａａａａａ」に復号される。

【００２７】次に、図９の符号化処理と図１０の復号化
処理における辞書の初期化（クリア）について説明す
る。図９のＬＺＷ符号化処理の場合、ステップＳ６で辞
書に対する文字列の登録が済むと、ステップＳ７で現在
の辞書登録アドレスｎが辞書の最大アドレスNMAXを越え
たか否か、すなわち辞書が一杯になったか否かをチェッ
クする。もし、ステップＳ７で辞書への登録が一杯にな
ったことが判別されると、ステップＳ８に進んで辞書へ
の登録を止め、数百バイト単位で圧縮率をチェックす
る。

【００２８】ステップＳ９で圧縮率が前回チェックした
ときと比べて悪化する傾向にあることが判定されると、
辞書がデータの統計的性質とズレてきていると判断し、
ステップＳ１０に進んで辞書クリアコードを出力した
後、一文字「ａ」「ｂ」「ｃ」のみを残して他の文字列
については初期化（クリア）し、再度、ステップＳ２に
戻って辞書への登録を行ないながら符号化を実行する。

【００２９】図１０の復号化処理の場合、ステップＳ２
０で登録できる辞書スペースがあるか否かを判定し、登
録できる場合はステップＳ２１で辞書への登録を行な
う。また、符号化側で辞書クリアコードが出力された場
合はステップＳ１４で判定され、ステップＳ１１から再
度処理を続行する。

【００３０】

【発明が解決しようとする課題】前述したように、従来
のＬＺＷ符号は、記憶装置上に確保した領域上に辞書を
作成しながら、その辞書を使用して符号化と復号化を行
なう。したがって、これらの処理は、記憶装置上のデー
タが外部的な要因などで破壊されないという前提条件の
下で成立するものである。

【００３１】しかし、実際に装置として構成した場合、
記憶装置の内容が破壊されたり、データが化けるといっ
た障害も発生する。この場合、従来のＬＺＷ符号では、
誤ったデータが読み出されて処理に使用されても、それ
が正しいデータであるのか、誤ったデータであるのかを
判断することができなかった。

【００３２】本発明は、前記事情に基づきなされたもの
で、その目的とするところは、復元されたデータがエラ
ーのない有効なデータであるか否かを正確に判定するこ
とのできるデータ圧縮および復元方式ならびにその装置
を提供することである。

【００３３】

【課題を解決するための手段】本発明のデータ圧縮方式
は、符号化済みデータを相異なる部分列に分けて各部分
列毎に異なる参照番号を付加して辞書に登録しておき、
入力データを該辞書中の部分列のうち、最大長一致する
ものの参照番号で指定して符号化するデータ圧縮方式に
おいて、圧縮処理時に特有に発生する項目のデータを前
記圧縮処理された符号化データに付加することを特徴と
するものである。

【００３４】前記データ圧縮方式を実現するための本発
明の第１のデータ圧縮装置は、辞書クリアの回数を計数
する辞書クリア回数計数手段と、符号化の終了時に辞書
クリア回数計数手段により計数された辞書クリア回数を
符号化データに付加して出力する辞書クリア回数データ
付加手段とを備えたことを特徴とするものである。

【００３５】前記データ圧縮方式を実現するための本発
明の第２のデータ圧縮装置は、符号化処理に使われた入
力データ数をカウントするデータ計数手段と、辞書クリ
ア時のデータ計数手段の値を保持する辞書クリア時デー
タ数保持手段と、符号化の終了時に辞書クリア時データ
数保持手段により保持されたデータ数を符号化データに
付加して出力する辞書クリア時データ数付加手段とを備
えたことを特徴とするものである。

【００３６】前記データ圧縮方式を実現するための本発
明の第３のデータ圧縮装置は、符号化の終了時の使用辞
書容量を保持する使用辞書容量保持手段と、符号化の終
了時に使用辞書容量保持手段により保持された使用辞書
容量を符号化データに付加して出力する使用辞書容量付
加手段とを備えたことを特徴とするものである。

【００３７】前記データ圧縮方式を実現するための本発
明の第４のデータ圧縮装置は、前記データ圧縮装置の複
数を組み合わせることにより構成したことを特徴とする
ものである。

【００３８】さらに、本発明のデータ復元方式は、復元
時に、前記圧縮処理時に付加された項目のデータと、復
元処理時に特有に発生する該当項目のデータとを比較
し、両者が一致するときに復元されたデータを有効デー
タと判定することを特徴とするものである。

【００３９】前記データ復元方式を実現するための本発
明の第１のデータ復元装置は、符号化データに付加され
た辞書クリア回数を分離する辞書クリア回数データ分離
手段と、辞書クリア回数データ分離手段により分離され
た値を保持する辞書クリア回数保持手段と、復号化中の
辞書クリアの回数を計数する辞書クリア回数計数手段
と、復号化の終了時に辞書クリア回数保持手段と辞書ク
リア回数計数手段の値の一致を判定する判定手段とを備
えたことを特徴とするものである。

【００４０】前記データ復元方式を実現するための本発
明の第２のデータ復元装置は、符号化データに付加され
た辞書クリア回数を分離する辞書クリア時データ数分離
手段と、辞書クリア時データ分離手段により分離された
値を保持する圧縮用辞書クリア時データ数保持手段と、
復元されたデータ数をカウントするデータ計数手段と、
復元での辞書クリア時にデータ計数手段の値を保持する
復元用辞書クリア時データ数保持手段と、圧縮用辞書ク
リア時データ数保持手段と復元用辞書クリア時データ数
保持手段の値の一致を判定する判定手段とを備えたこと
を特徴とするものである。

【００４１】前記データ復元方式を実現するための本発
明の第３のデータ復元装置は、符号化データに付加され
た使用辞書容量を分離する使用辞書容量分離手段と、使
用辞書容量分離手段の値を保持する圧縮用使用辞書容量
保持手段と、復号化の終了時の使用辞書容量を保持する
復元用使用辞書容量保持手段と、復号化の終了時に圧縮
用使用辞書容量保持手段と復元用使用辞書容量保持手段
の値の一致を判定する判定手段とを備えたことを特徴と
するものである。

【００４２】前記データ復元方式を実現するための本発
明の第４のデータ復元装置は、前記各データ復元装置の
うちの複数を組み合わせることにより構成したことを特
徴とするものである。

【００４３】

【作用】本発明は、データ圧縮時、圧縮処理時に特有
に発生する項目、例えば、辞書クリア回数、辞書ク
リア時の符号化されたデータ数、使用辞書容量などを
データ圧縮された符号化データに付加するとともに、デ
ータ復元時、前記圧縮処理時に付加された項目のデータ
と、復元処理時に特有に発生する該当項目のデータとを
比較することにより、復元されたデータの有効／無効を
判定するようにしている。このため、記憶装置の内容が
破壊されたり、データが化けるといった障害が発生した
場合でも、復元されたデータが有効であるか否かを正確
に判断することができ、信頼性の高いデータ圧縮と復元
を実現することができる。

【００４４】また、前記圧縮処理時に特有に発生する項
目のデータとして、辞書クリア回数、辞書クリア時の符
号化されたデータ数、使用辞書容量などをそれぞれ単独
で付加するだけでなく、これらを組み合わせて付加する
ようにすれば、さらに信頼性を上げることができる。

【００４５】

【実施例】図１は本発明になるデータ圧縮／復元装置の
第１実施例である。まず、図１（Ａ）の圧縮部の構成と
動作から説明する。なお、ＬＺＷ符号化処理そのものは
前述した従来例と同様であるので、符号化処理自体の具
体的な説明は省略する。

【００４６】図１（Ａ）中、１はＬＺＷ符号化処理を行
なう符号化部、２は辞書部、３は辞書クリア回数計数
部、４は辞書クリア回数データ付加部である。符号化対
象となる入力データは符号化部１に入力される。

【００４７】符号化部１では、辞書部２の辞書を使用し
て登録・参照を繰り返しながら、前述した従来例と同様
にして符号化し、辞書クリア回数データ付加部４へ出力
する。そして、符号化処理中に符号化に必要な辞書スペ
ースがなくなると、その都度、辞書クリアコードにより
辞書部２の辞書を初期化（クリア）し、符号化を続け
る。

【００４８】辞書クリア回数計数部３は前記辞書のクリ
ア回数を計数する。そして、すべての入力データの符号
化を終了すると、辞書クリア回数計数部３で計数された
辞書クリア回数は辞書クリア回数データ付加部４へ送ら
れ、図２に示すような形式に従って符号化データに付加
され、出力される。

【００４９】次に、図１（Ｂ）の復元部の構成と動作に
ついて説明する。図１（Ｂ）中、５はＬＺＷ復号化処理
を行なう復号化部、６は辞書部、７は辞書クリア回数デ
ータ分離部、８は辞書クリア回数保持部、９は辞書クリ
ア回数計数部、１０は判定部である。

【００５０】データ圧縮された符号化データが辞書クリ
ア回数データ分離部７に入力されると、符号化データに
付加されている辞書クリアデータが分離され、辞書クリ
ア回数保持部８に保持される。符号化データは復号化部
５へ入力される。

【００５１】復号化部５は、辞書部６の辞書を使用し、
登録・参照を繰り返すことにより、前述した従来例と同
様にして元の入力データを復号する。このとき、復号化
処理において発生する辞書クリアコードにより辞書部６
の辞書を初期化（クリア）しながら、復号を行なう。

【００５２】辞書クリア回数計数部９は、前記復号化処
理における辞書のクリア回数を計数する。そして、すべ
ての符号化データの復号を終了すると、判定部３は辞書
クリア回数保持部８と辞書クリア回数計数部９にそれぞ
れ保持されている辞書クリア回数の値を比較し、その値
が一致していれば、エラーのない有効な復号として正常
終了する。一方、一致しない場合には、エラーが発生し
たものとしてエラー信号（ERROR)を出力し、異常終了と
する。

【００５３】図３は本発明になるデータ圧縮／復元装置
の第２実施例である。まず、図３（Ａ）の圧縮部の構成
と動作から説明する。１はＬＺＷ符号化処理を行なう符
号化部、２は辞書部、１１はデータ計数部、１２は辞書
クリア時データ数保持部、１３は辞書クリア時データ数
付加部である。

【００５４】符号化対象となる入力データはデータ計数
部１１に入力され、入力データ数を計数するとともに、
符号化部１に入力される。符号化部１では、辞書部２の
辞書を使用して登録・参照を繰り返しながら、前述した
従来例と同様にして符号化し、辞書クリア時データ数付
加部１３へ出力する。そして、符号化処理中に符号化に
必要な辞書スペースがなくなると、その都度、辞書部２
の辞書を初期化（クリア）し、符号化を続ける。

【００５５】データ計数部１１は前記辞書クリア時にお
ける入力データ数を計数し、辞書クリア時データ数保持
部１２に逐次保持していく。そして、全入力データにつ
いて符号化が終了すると、辞書クリア時データ数保持部
１２に保持された各辞書クリア時の入力データ数が辞書
クリア時データ数付加部１３へ送られ、図４に示すよう
な形式に従って符号化データに付加され、出力される。

【００５６】次に、図３（Ｂ）の復元部の構成と動作に
ついて説明する。図３（Ｂ）中、５はＬＺＷ復号化処理
を行なう復号化部、６は辞書部、１０は判定部、１４は
辞書クリア時データ数分離部、１５は圧縮用辞書クリア
時データ数保持部、１６データ計数部、１７は復元用辞
書クリア時データ数保持部である。

【００５７】データ圧縮された符号化データが辞書クリ
ア時データ数分離部１４に入力されると、符号化データ
に付加されている辞書クリア時のデータ数が分離され、
圧縮用辞書クリア時データ数保持部１５に保持される。
符号化データは復号化部５へ入力される。

【００５８】復号化部５は、辞書部６の辞書を使用し、
登録・参照を繰り返すことにより、前述した従来例と同
様にして元の入力データを復号する。このとき、復号化
処理において発生する辞書クリアコードにより辞書部６
の辞書を初期化（クリア）しながら、復号を行なう。復
号されたデータは、データ計数部１６でデータ数を計数
された後、出力される。

【００５９】復元用辞書クリア時データ数保持部１７
は、前記辞書クリア時におけるデータ数計数部１６の値
をその都度読み込んで保持する。すべての符号化データ
の復号を終了すると、判定部１０は圧縮用辞書クリア時
データ数保持部１５と復元用辞書クリア時データ数保持
部１７にそれぞれ保持されている各辞書クリア時のデー
タ数の値を比較し、各値が一致していれば、エラーのな
い有効な復号として正常終了する。一方、一致しない場
合には、エラーが発生したものとしてエラー信号（ERRO
R)を出力し、異常終了とする。

【００６０】前記第２実施例において、符号化と復号化
との間に時間的な余裕がある場合、つまり、データ圧縮
／復元装置から出力される符号化データが磁気ディスク
などの記録媒体に一旦記録されて保存されるような場合
には、図４に示した符号化データのフォーマットを変換
して、辞書クリア時のデータ数を符号化データの先頭側
に配置して記録するようにすればよい。こうすれば、復
元側では、この辞書クリア時のデータ数を復号処理の開
始前に入手して保持することができる。この結果、復号
化処理中の辞書クリアの度にそのデータ数を直ちに比較
することができ、復号化処理の完了する前に復号の異常
／正常を判定することができる。

【００６１】さらに、データ圧縮／復元装置が伝送路な
どで結ばれているような場合には、辞書を初期化するた
めの辞書クリアコードの発生後、数バイトは当該辞書ク
リア時のデータ数を伝送すると予め定めておけば、デー
タ圧縮側で辞書クリア時のデータ数を一旦保存する必要
なく値の比較を行なうことができる。

【００６２】図５は本発明になるデータ圧縮／復元装置
の第３実施例である。まず、図５（Ａ）の圧縮部の構成
と動作から説明する。１はＬＺＷ符号化処理を行なう符
号化部、２は辞書部、１８は使用辞書容量保持部、１９
は使用辞書容量付加部である。

【００６３】符号化対象となる入力データは符号化部１
に入力される。符号化部１では、辞書部２の辞書を使用
して登録・参照を繰り返しながら、前述した従来例と同
様にしてＬＺＷ符号化し、使用辞書容量付加部１９へ出
力する。符号化処理中に符号化に必要な辞書スペースが
なくなると、その都度、辞書部２の辞書を初期化（クリ
ア）し、符号化を続ける。

【００６４】そして、すべての入力データの符号化を終
了すると、一番最後に辞書クリアされた後の辞書の使用
容量を使用辞書容量保持部１８に保持する。この使用辞
書容量は使用辞書容量保持部から使用辞書容量付加部１
９へ送られ、図６に示すような形式に従って符号化デー
タに付加され、出力される。

【００６５】次に、図５（Ｂ）の復元部の構成と動作に
ついて説明する。図５（Ｂ）中、５はＬＺＷ復号化処理
を行なう復号化部、６は辞書部、１０は判定部、２０は
使用辞書容量分離部、２１は圧縮用使用辞書容量保持
部、２２は復元用使用辞書容量保持部である。

【００６６】データ圧縮された符号化データが使用辞書
容量分離部２０に入力されると、符号化データに付加さ
れている使用辞書容量が分離され、圧縮用使用辞書容量
保持部２１に保持される。符号化データは復号化部５へ
入力される。

【００６７】復号化部５は、辞書部６の辞書を使用し、
登録・参照を繰り返すことにより、前述した従来例と同
様にして元の入力データを復号する。このとき、復号化
処理において発生する辞書クリアコードにより辞書部６
の辞書を初期化（クリア）しながら、復号を行なう。

【００６８】そして、すべての符号化データの復号を終
了すると、復号化処理において一番最後に辞書クリアさ
れた後の辞書の使用容量が復元用使用辞書容量保持部２
２に保持される。判定部１０は、圧縮用使用辞書容量保
持部２１と復元用使用辞書容量保持部２２のそれぞれに
保持されている辞書の使用容量の値を比較し、その値が
一致していれば、エラーのない有効な復号として正常終
了する。一方、一致しない場合には、エラーが発生した
ものとしてエラー信号（ERROR)を出力し、異常終了とす
る。

【００６９】なお、前記説明した実施例は、圧縮処理時
に特有に発生する項目として、辞書クリア回数、辞
書クリア時の符号化されたデータ数、使用辞書容量な
どをそれぞれを単独で付加するようにしたが、これらを
組み合わせて付加するようにすれば、さらに信頼性を上
げることができる。

【００７０】

【発明の効果】以上述べたところから明らかなように、
本発明によるときは、データ圧縮時、圧縮処理時に特有
に発生する項目、例えば、辞書クリア回数、辞書クリア
時の符号化されたデータ数、使用辞書容量などを圧縮処
理された符号化データに付加するとともに、復元時、前
記圧縮処理時に付加された項目のデータと、復元処理時
に特有に発生する該当項目のデータとを比較することに
より復元されたデータの有効／無効を判定するようにし
ているので、記憶装置の内容が破壊されたり、データが
化けるといった障害が発生した場合でも、復元されたデ
ータが有効であるか否かを正確に判断することができ、
信頼性の高いデータ圧縮と復元を実現することができ
る。

【図面の簡単な説明】

【図１】本発明の第１実施例の構成を示すブロック図で
ある。

【図２】第１実施例のデータフォーマットを示す図であ
る。

【図３】本発明の第２実施例の構成を示すブロック図で
ある。

【図４】第２実施例のデータフォーマットを示す図であ
る。

【図５】本発明の第３実施例の構成を示すブロック図で
ある。

【図６】第３実施例のデータフォーマットを示す図であ
る。

【図７】従来のデータ圧縮／復元装置の構成を示すブロ
ック図である。

【図８】従来装置のデータフォーマットを示す図であ
る。

【図９】従来のＬＺＷ符号化処理のフローチャートであ
る。

【図１０】従来のＬＺＷ復号化処理のフローチャートで
ある。

【図１１】ＬＺＷ符号化の具体例の説明図である。

【図１２】辞書構成の具体例の説明図である。

【図１３】ＬＺＷ復号化の具体例の説明図である。

【符号の説明】

１符号化部２辞書部３辞書クリア回数計数部４辞書クリア回数データ付加部５復号化部６辞書部７辞書クリア回数データ分離部８辞書クリア回数保持部９辞書クリア回数計数部１０判定部１１データ計数部１２辞書クリア時データ数計数部１３辞書クリア時データ数付加部１４辞書クリア時データ数分離部１５圧縮用辞書クリア時データ数保持部１６データ計数部１７復元用辞書クリア時データ数保持部１８使用辞書容量保持部１９使用辞書容量付加部２０使用辞書容量分離部２１圧縮用使用辞書容量保持部２２復元用使用辞書容量保持部

フロントページの続き (72)発明者吉田茂神奈川県川崎市中原区上小田中1015番地富士通株式会社内

Claims

【特許請求の範囲】

【請求項１】符号化済みデータを相異なる部分列に分
けて各部分列毎に異なる参照番号を付加して辞書に登録
しておき、入力データを該辞書中の部分列のうち、最大
長一致するものの参照番号で指定して符号化するデータ
圧縮方式において、圧縮処理時に特有に発生する項目のデータを前記圧縮処
理された符号化データに付加することを特徴とするデー
タ圧縮方式。
【請求項２】符号化部と辞書部とを有し、符号化済み
データを相異なる部分列に分けて各部分列毎に異なる参
照番号を付加して辞書に登録しておき、入力データを該
辞書中の部分列のうち、最大長一致するものの参照番号
で指定して符号化するデータ圧縮装置において、辞書クリアの回数を計数する辞書クリア回数計数手段
と、符号化の終了時に辞書クリア回数計数手段により計数さ
れた辞書クリア回数を符号化データに付加して出力する
辞書クリア回数データ付加手段とを備えたことを特徴と
するデータ圧縮装置。
【請求項３】符号化部と辞書部とを有し、符号化済み
データを相異なる部分列に分けて各部分列毎に異なる参
照番号を付加して辞書に登録しておき、入力データを該
辞書中の部分列のうち、最大長一致するものの参照番号
で指定して符号化するデータ圧縮装置において、符号化処理に使われた入力データ数をカウントするデー
タ計数手段と、辞書クリア時のデータ計数手段の値を保持する辞書クリ
ア時データ数保持手段と、符号化の終了時に辞書クリア時データ数保持手段により
保持されたデータ数を符号化データに付加して出力する
辞書クリア時データ数付加手段とを備えたことを特徴と
するデータ圧縮装置。
【請求項４】符号化部と辞書部とを有し、符号化済み
データを相異なる部分列に分けて各部分列毎に異なる参
照番号を付加して辞書に登録しておき、入力データを該
辞書中の部分列のうち、最大長一致するものの参照番号
で指定して符号化するデータ圧縮装置において、符号化の終了時の使用辞書容量を保持する使用辞書容量
保持手段と、符号化の終了時に使用辞書容量保持手段により保持され
た使用辞書容量を符号化データに付加して出力する使用
辞書容量付加手段とを備えたことを特徴とするデータ圧
縮装置。
【請求項５】請求項２〜４記載のデータ圧縮装置の複
数を組み合わせることにより構成したことを特徴とする
データ圧縮装置。
【請求項６】請求項１記載のデータ圧縮方式によって
圧縮されたデータの復元方式であって、符号化済みデー
タを相異なる部分列に分けて各部分列毎に異なる辞書に
登録しておき、入力データを該辞書中の部分列のうち、
最大長一致するものの参照番号で指定される符号語から
元の文字列を復元するデータ復元方式において、復元時に、前記圧縮処理時に付加された項目のデータ
と、復元処理時に特有に発生する該当項目のデータとを
比較し、両者が一致するときに復元されたデータを有効
データと判定することを特徴とするデータ復元方式。
【請求項７】復号化部と辞書部とを有し、請求項２記
載のデータ圧縮装置で圧縮されたデータを復元するため
のデータ復元装置であって、符号化データに付加された辞書クリア回数を分離する辞
書クリア回数データ分離手段と、辞書クリア回数データ分離手段により分離された値を保
持する辞書クリア回数保持手段と、復号化中の辞書クリアの回数を計数する辞書クリア回数
計数手段と、復号化の終了時に辞書クリア回数保持手段と辞書クリア
回数計数手段の値の一致を判定する判定手段とを備えた
ことを特徴とするデータ復元装置。
【請求項８】復号化部と辞書部とを有し、請求項３記
載のデータ圧縮装置で圧縮されたデータを復元するため
のデータ復元装置であって、符号化データに付加された辞書クリア回数を分離する辞
書クリア時データ数分離手段と、辞書クリア時データ分離手段により分離された値を保持
する圧縮用辞書クリア時データ数保持手段と、復元されたデータ数をカウントするデータ計数手段と、復元での辞書クリア時にデータ計数手段の値を保持する
復元用辞書クリア時データ数保持手段と、圧縮用辞書クリア時データ数保持手段と復元用辞書クリ
ア時データ数保持手段の値の一致を判定する判定手段と
を備えたことを特徴とするデータ復元装置。
【請求項９】復号化部と辞書部とを有し、請求項４記
載のデータ圧縮装置で圧縮されたデータを復元するため
のデータ復元装置であって、符号化データに付加された使用辞書容量を分離する使用
辞書容量分離手段と、使用辞書容量分離手段の値を保持する圧縮用使用辞書容
量保持手段と、復号化の終了時の使用辞書容量を保持する復元用使用辞
書容量保持手段と、復号化の終了時に圧縮用使用辞書容量保持手段と復元用
使用辞書容量保持手段の値の一致を判定する判定手段と
を備えたことを特徴とするデータ復元装置。
【請求項１０】請求項７〜９記載のデータ復元装置の
複数を組み合わせることにより構成したことを特徴とす
るデータ復元装置。