JPH05241778A

JPH05241778A - データ圧縮及び復元方式

Info

Publication number: JPH05241778A
Application number: JP4516992A
Authority: JP
Inventors: Hirotaka Chiba; 広隆千葉; Yoshiyuki Okada; 佳之岡田; Yasuhiko Nakano; 泰彦中野; Shigeru Yoshida; 茂吉田
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1992-03-03
Filing date: 1992-03-03
Publication date: 1993-09-21

Abstract

(57)【要約】【目的】本発明は、データ圧縮及び復元方式に関し、
圧縮／復元時の処理データが、正規のデータなのか誤っ
たデータなのかを判断できるようにすることを目的とす
る。【構成】図１のＡにおいて、圧縮部２は、外部ハッシ
ュ法により辞書部３を検索して入力データを圧縮する、
この時、復元部５は、圧縮部２の出力データを受け取
り、外部ハッシュ法で辞書部３を検索して復元し、復元
済データ保持部８に保持する。比較部では、復元済デー
タ保持部８のデータと、入力データ保持部６のデータを
比較して、エラーを検出する。図１のＢにおいて、復元
部５は入力データを復元する、圧縮部２は復元部５の出
力データを受け取って圧縮する。比較部７は前記圧縮し
たデータと入力データを比較してエラーを検出する。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、各種のデータを圧縮、
あるいは復元する際に利用されるデータ圧縮及び復元方
式に関する。

【０００２】（技術の背景）近年、文字コード、ベクト
ル情報、画像など様々な種類のデータがコンピュータで
扱われるようになっており、扱われるデータ量も急速に
増加してきている。大量のデータを扱うときは、データ
の中の冗長な部分を省いてデータ量を圧縮することで、
記憶容量を減らしたり、速く伝送したりできるようにな
る。

【０００３】様々なデータを１つの方式でデータ圧縮で
きる方法としてユニバーサル符号化が提案されている。
ここで、本発明の分野は、文字コードの圧縮に限らず、
様々なデータに適用できるが、以下では、情報論理で用
いられている呼称を踏襲し、データの１word単位を文字
と呼び、データが任意wordつながったものを文字列と呼
ぶことにする。

【０００４】ユニバーサル符号の代表的な方法として、
Ziv-Lempel（ジブーレンペル）符号がある（詳しくは、
例えば、宗像「Ziv-Lempelのデータ圧縮法」、情報処
理、Vol.26、No.1、1985年を参照のこと）。Ziv-Lempel
符号では、ユニバーサル型と、増分分解型（Incrementa
l parsing ）の２つのアルゴリズムが提案されている。

【０００５】更に、ユニバーサル型アルゴリズムの改良
として、ＬＺＳＳ符号がある（T.C.Bell 、"Better OPM
/L Text Compression" 、IEEE Ttans．on Commun.、Vo
l.COM-34、No.12 、Dec.1986参照）。また、増分分解型
アルゴリズムの改良としては、ＬＺＷ（Lempel-Ziv-Wel
ch）符号がある（T.A.Welch 、"A Technique for High-
Performance Data Compression" 、Computer、June 198
4 参照）。

【０００６】これらの符号の内、高速処理ができること
と、アルゴリズムの簡単さからＬＺＷ符号が記憶装置の
ファイル圧縮などで使われるようになっている。

【０００７】

【従来の技術】図１３〜図２４は従来例を示した図であ
り、図１３は、圧縮／復元装置のブロック図、図１４は
ＬＺＷ符号化処理フローチャート、図１５はＬＺＷ復号
化処理フローチャート、図１６のＡはＬＺＷ符号化の具
体的説明図、図１６のＢは辞書構成例の説明図、図１７
はＬＺＷ復号化の具体例説明図である。

【０００８】また、図１８は外部ハッシュ法のリスト構
造説明図、図１９は辞書メモリの構成例（符号化時）、
図２０は辞書の説明図（復号化時）、図２１は外部ハッ
シュ法によるＬＺＷ符号化処理フローチャート、図２２
は辞書メモリの構成例（復元時）、図２３は辞書の説明
図（復元時）、図２４は外部ハッシュ法によるＬＺＷ復
合化処理フローチャートである。

【０００９】図中、１は圧縮装置（データ圧縮装置）、
２は圧縮部、３は辞書部、４は復元装置、５は復元部を
示す。 (1) 従来のデータ圧縮／復元処理で用いる装置の説明・
・・図１３参照以下に説明する符号化／復号化によるデータ圧縮／復元
処理に用いるデータ圧縮／復元装置の例を図１３に示
す。

【００１０】図示のように、Ａに示した圧縮装置１に
は、符号化によりデータ圧縮処理を行う圧縮部２と、符
号化の際に使用する辞書部３とを設ける。また、Ｂに示
した復元装置４には、復号化によりデータ復元処理を行
う復元部５と、復号化の際に使用する辞書部３とを設け
る。

【００１１】(2) ＬＺＷ符号による符号化／復号化処理
の説明・・・図１４〜図１７参照まずＬＺＷ符号化処理は、書き替え可能な辞書を持ち、
入力文字列の中を相異なる文字列（部分列）に分け、こ
の文字列を出現した順に参照番号を付けて辞書に登録す
ると共に、現在入力している文字列を、辞書に登録して
ある最長一致文字列の参照番号で表して符号化するもの
である。

【００１２】図１６ＡにＬＺＷ符号化の説明図を示すと
共に図１７にＬＺＷ復号化の説明図を示し、更に図１６
Ｂに符号化及び復号化時に作成される辞書構成例を示
す。尚、図１６、１７にあっては説明を簡単にするた
め、ａｂｃの３文字の組合せからなるデータを圧縮、復
元する場合の例を取り上げている。

【００１３】図１４のＬＺＷ符号化処理では、まずステ
ップＳ１で予め辞書に全文字につき一文字からなる文字
列を初期値として登録してから符号化を始める。ステッ
プＳ１の符号化は入力した最初の文字Ｋにより辞書を検
索して参照番号ωを求め、これを語頭文字列とする。

【００１４】次にステップＳ２で入力データの次の文字
Ｋを読込み、ステップＳ３で文字入力が終了したか否か
チェックした後、ステップＳ４に進んでステップＳ１で
求めた語頭文字列ωにステップＳ２で読込んだ文字Ｋを
加えた拡張文字列（ωＫ）が辞書にあるか否か探す。

【００１５】ステップＳ４で文字列（ωＫ）が辞書にな
ければ、ステップＳ６に進んでステップＳ１で求めた文
字Ｋの参照番号ωを符号語code（ω）として出力し、ま
た文字列（ωＫ）に新たな参照番号を付加して辞書に登
録し、更にステップＳ２の入力文字列Ｋを参照番号ωに
置き換えると共に辞書アドレスｎをインクリメントして
ステップＳ２に戻って次の文字Ｋを読み込む。

【００１６】一方、ステップＳ４で文字列（ωＫ）が辞
書にあればステップＳ５で文字列（ωＫ）を参照番号ω
に置き換え、再びステップＳ２に戻ってステップＳ４で
文字列（ωＫ）が辞書から探せなくなるまで最大一致長
の検索を続ける。

【００１７】図１６を参照してＬＺＷ符号化を具体的に
説明すると次のようになる。まず図１６Ａの入力データ
input は左から右へと読む。最初の文字ａを入力した
時、辞書には文字ａの他に一致する文字列がないので、
OUTPUT CODE 1 （参照番号ω）を符号語して出力する。
そして文字ａを語頭文字列ωとする。

【００１８】次に２番目の文字ｂを入力したとすると、
この入力文字を語頭文字列ωに加えた拡張文字列ωＫ＝
ａｂは辞書にないことから、文字ｂのOUTPUT CODE 2 を
符号語として出力する。そして、拡張文字列ωＫ＝ａｂ
に参照番号４を付けて辞書に登録する。実際の辞書登録
は図１６Ｂの右側に示すように文字列１ｂとして登録さ
れる。そして文字ｂが語頭文字列ωとなる。

【００１９】続いて３番目の文字ａを入力したとする
と、文字ｂに語頭文字列ωを加えた拡張文字列ωＫ＝ｂ
ａ＝２ａは辞書にないことから、文字のａのOUTPUT COD
E 1 を符号語として出力した後、拡張文字列ωＫ＝ｂａ
を２ａで表し、参照番号５を付けて辞書に登録する。そ
して文字ａが新たな語頭文字列ωとなる。

【００２０】４番目の入力文字ｂについては拡張文字列
ωＫ＝ａｂは１ｂの符号語４として既に辞書に登録され
ているので、文字列ωＫを新たな語頭文字列ωとし、５
番目の文字ｃを入力して拡張文字列ωＫ＝４ｃ＝ａｂｃ
を作る。この拡張文字列ωＫ＝ａｂｃは辞書に登録され
ていないことから、文字列ａｂ＝１ｂのOUTPUT CODE4
を符号語として出力し、拡張文字列ωＫ＝ａｂｃを辞書
に４ｃの形で符号語６として登録する。以下同様に、こ
の処理を続ける。

【００２１】図１５の復号化処理は図１４の符号化の逆
の操作を行う。図１５のＬＺＷ復号化では、符号化時と
同様に予め辞書に全文字につき一文字からなる文字列を
初期値として登録してから復号化を始める。

【００２２】まずステップＳ１で最初の符号（参照番
号）を読込み、現在のCODEをOLDcodeとし、最初の符号
は既に辞書に登録された一文字の参照番号いずれかに該
当することから、入力符号CODEに一致するcode（Ｋ）を
探し出し、文字Ｋを出力する。

【００２３】尚、出力した文字Ｋは後の例外処理のため
FINchar にセットしておく。次にステップＳ２に進んで
次の符号を読込んでCODEにINcodeとしてセットする。ス
テップＳ３で新たな符号があるか否か、即ち符号入力の
終了の有無をチェックしてステップＳ４に進み、ステッ
プＳ３で入力された符号CODEが辞書に定義（登録）され
ているか否かチェックする。

【００２４】通常、入力した符号語は前回までの処理で
辞書に登録されているため、ステップＳ５に進んで符号
CODEに対応する文字列code（ωＫ）を辞書から読出し、
ステップＳ６で文字Ｋを一時的にスタックし、参照番号
CODE（ω）を新たな符号CODEとして再度ステップＳ５に
戻り、このステップＳ５、ステップＳ６の手順を再帰的
に参照番号ωが一文字Ｋに至るまで繰り返し、最後にス
テップＳ７に進んでステップＳ６でスタックした文字を
ＬＩＦＯ（Last In Fast Out）形式でポップアップして
出力する。

【００２５】同時にステップＳ７において、前回使った
符号ωと今回復元した文字列の最初の１文字Ｋを組（ω
Ｋ）と表した文字列に、新たな参照番号を付加して辞書
に登録する。

【００２６】図１５を参照してＬＺＷ復号化処理を具体
的に説明すると次のようになる。まず図１５の最初の入
力符号語（INPUT CODE）は１であり、一文字ａ、ｂ、ｃ
については既に参照番号１、２、３として図１６Ｂに示
すように辞書に登録されているため、辞書の参照によ
り、符号語１に一致する参照番号の文字列ａに置き換え
て出力する。

【００２７】次の符号語２についても同様にして文字ｂ
に置き換えて出力する。このとき前回処理した符号語１
と今回復号した文字列の１番目の文字ｂとを組合わせた
文字列ωＫ＝１ｂに新たな参照番号４を付加して辞書に
登録する。

【００２８】３番目の符号語４は辞書の検索により求め
た文字列１ｂから文字列ａｂと置き換えて文字列ａｂを
出力する。同時に前回処理した符号語２と今回復号した
文字列の１番目の文字ａとの組合せた文字列ωＫ＝２ａ
（＝ｂａ）に新たな参照番号５を付加して辞書に登録す
る。

【００２９】以下同様に、この処理を繰り返す。図１７
の復号化では次の例外処理がある。この例外処理は、第
６番目の入力符号８の復号で生ずる。符号８は復号時に
辞書に定義されておらず、復号できない。この場合に
は、前回処理した符号５に前回復号した文字列ｂａの最
初の一文字ｂを文字列５ｂを求め、更に２ａｂ、ｂａｂ
と置き換えられて出力される。

【００３０】そして、文字列の出力語に前回の符号語５
に今回復号した文字列の文字ｂを加えた文字列５ｂに参
照番号８を付加して辞書に登録する。この例外処理は図
１５の復号化処理フローのＳ４、Ｓ８の処理を通じて行
われ、最終的にＳ７で文字列の出力と新たな文字列に参
照番号を付加した辞書への登録Ｓ７で行われる。

【００３１】なお、図１４、１５の符号化／復号化処理
は、同じ辞書を作り出しながら行う。図１４の流れ図に
示す手順で符号化すると、１つの文字列を辞書検索する
たびに最悪、辞書全体をサーチしなければならないため
に時間がかかった。そこで、従来は辞書検索に外部ハッ
シュ法（open hashing、または、chaining）を用いて処
理速度を上げていた（例えば、オーム社刊、情報処理学
会編、情報処理ハンドブック、を参照のこと）。次に、
外部ハッシュ法について説明する。

【００３２】(3) 外部ハッシュ法の説明・・・図１８〜
図２４参照文字列からなる集合Ｓを考えたとき、Ｓの文字列ｘのあ
る位置を、文字列ｘからｘの格納位置のアドレスが直接
計算できる仕組みになっていると高速の探索ができる。
これを実現するのがハッシュ法である。

【００３３】記憶場所（ハッシュ表）に０からｍ−１ま
でのアドレスが付されているとすると、ハッシュ法で
は、関数ｈ：Ｓ→〔０、１、・・・、ｍ−１〕を一つ定めて、Ｓの文字列ｘのアドレスをｈ（ｘ）で求
める。関数ｈをハッシュ関数、値ｈ（ｘ）をｘのハッシ
ュ・アドレスといっている。

【００３４】ハッシュ法は、通常、Ｓの大きさがｍに比
べてはるかに大きい場合に用いられる。そこで、ｈをど
のように選んだとしても、Ｓの相異なる文字列ｘ１、ｘ
２に対して、ｈ（ｘ1 ）＝ｈ（ｘ２）となる場合が起こ
り得る。これを衝突と呼び、衝突する対策の一つとして
外部ハッシュ法（open hashing、または、chaining）が
用いられる。

【００３５】以下辞書検索に、外部ハッシュ法を用いた
ＬＺＷ符号の圧縮／復元処理の概要を説明するが、その
詳細については、例えば「ＡＰ−Ｌａｂｏ著、ハードデ
ィスククックブック、翔泳社発行、１９８７」を参照の
こと。

【００３６】外部ハッシュ法は、図１８に示したよう
に、索引（ディレクトリ）で示されるハッシュアドレス
ｉ毎に連結リストを用意し、衝突を起こしたハッシュア
ドレスｈ（ｘ）＝ｉ文字列ｘは、連結リストの先頭から
順番に格納する。

【００３７】同じハッシュアドレスｈ（ｘ）をもつ、そ
れぞれの連結リストはバケット（Bucket）と呼ばれてい
る。外部ハッシュ法による符号化処理の説明・・・図１９
〜図２１参照この外部ハッシュ法においては、図１８に示すように、
索引部をハッシュアドレスで検索することにより、該当
するリストが示されるようになっている。また、各リス
トには、各要素に対応する識別情報と次の要素の格納場
所を示すポインタとが格納されている。このようにし
て、索引とリストとによって、同じハッシュアドレスを
有する要素が連結されており、順次に探索できるように
なっている。

【００３８】例えば、上述した参照番号ωをハッシュア
ドレスとし、このハッシュアドレスに、参照番号号ωに
対応する部分列に１文字を付加した部分列を格納するリ
ストの先頭アドレスを格納する。また、該当するリスト
に、上述した参照番号ωに対応する節点の『子』に相当
する節点に対応する部分列を順次に格納すればよい。こ
のようにして、参照番号ωと１文字Ｋとの組合せで表さ
れる候補要素の連結関係を示せばよい。また、この場合
は、各要素の拡張文字Ｋを対応する識別情報としてリス
トに格納すればよい。

【００３９】外部ハッシュ法により符号化を行う際に使
用する辞書は、図１９、図２０のように構成されてい
る。この辞書には、「first 」、「next」、「ext 」
（extention ）の各項目（配列）がある。前記first 及
びnextは、図１８の索引部に相当し、ext は図１８のリ
ストに相当している。

【００４０】この辞書は、図２０のように表現できる。
即ちext （拡張文字を表している）を中心として、その
左上にはアドレス、左下にはfirst 、右下にはnextを表
示する（説明の都合上、このように表示する）。

【００４１】そして、図２０に示したように、例えば、
＃１、＃２、＃３、＃４・・・の各階層（文字列の順番
に従った階層）で表現され、全体として「木構造」とな
っている。

【００４２】この辞書において、拡張文字の格納アドレ
スは、「アドレス」に示してあり、次の文字の先頭アド
レスは「first 」に示してある。また、同一階層のアド
レスは「next」に示してある。従って、これらの情報を
用いて辞書を使用する。

【００４３】次に、図２１に基づいて、外部ハッシュ法
を用いた符号化処理の概要を説明する。図２１のＬＺＷ
符号化処理を、説明を簡単にするため文字Ａ、Ｂ、Ｃの
３文字を対象とした場合を例にとって説明すると次のよ
うになる。

【００４４】まずステップＳ１で次の〜の初期化処
理を行う。第１番目の文字を含むように辞書を初期化する。ここ
でアルファベットＡ、Ｂ、Ｃの３文字を対象としている
ことから、Ａ、Ｂ、Ｃの文字コードをそのままハッシュ
アドレスとして図１９の辞書メモリのアドレス１、２、
３に登録する。

【００４５】辞書への現在文字登録数ｎを前記登録し
た文字数にセットする。アルファベット３文字の場合に
は、ｎ＝３となる。入力した最初の文字Ｋを語頭文字列ｉとする。この場
合、最初の入力文字は「Ａ」であることから語頭文字列
ｉ＝１とする。

【００４６】辞書検索用配列を０に初期化する。即
ち、ファースト、ネクスト及び拡張文字の検索用配列は
first[1,Nmax],next[1,Nmax]、EXT[1,Nmax] で表わされ
るので、これを０に初期化する。

【００４７】以上のステップＳ１の初期化処理が済んだ
ならば、ステップＳ２移行の処理に進み、その結果、現
在図１９及び図２０に示す辞書が作成された段階にある
ものとする。

【００４８】この状態でいま文字列「ＡＡＡＡ」を入力
して符号化する場合の処理を説明する。ステップＳ１の
初期化は済んでいるので、最初の入力文字「Ａ」を語頭
文字列ω＝１とし、ステップＳ１で最初の入力文字
「Ａ」を語頭文字列ω＝１とし、ステップＳ２で２番目
の入力文字「Ａ」を読む。続いてステップＳ３で未処理
文字があることが判別されてステップＳ５〜ステップＳ
９に示す辞書検索ステップに進む。

【００４９】辞書検索ステップでは、まずステップＳ５
で語頭文字列ω＝１を変数ｉにｉ＝１としてセットし、
且つ変数ｊをｊ＝１にセットする。ここで変数ｉは配列
first の格納値で指定される辞書メモリのアドレス値で
あり、また変数ｊはnextの格納値で指定される辞書メモ
リのアドレス値である。

【００５０】次にステップＳ６で変数ｉで指定された図
１９の辞書メモリのアドレス１の内容を読み、ext から
シンボル（smbol ）として「Ａ」を読出し、またfirst
から次のアドレス「４」を読出して変数ｉ＝４にセット
する。

【００５１】続いてステップＳ７に進み、辞書登録ステ
ップに移行するか否か判断するためにｉ＝０か否かチェ
ックし、このときｉ＝４であることからステップＳ８に
進み、ステップＳ６のアドレス１のext を参照して得た
シンボル「Ａ」と、１番目の入力文字「Ａ」との一致を
判別する。この場合、両者は一致していることからステ
ップＳ２に戻り、３番目の入力文字「Ａ」を読込む。

【００５２】続いてステップＳ３を介してステップＳ５
に進み、辞書メモリのアドレスωにそのときの変数ｉの
値ｉ＝４をセットし、辞書メモリのアドレス４を参照す
る。次にステップＳ６で辞書メモリのアドレス４の内容
を読み、ext に格納したシンボル（smbol ）として、
「Ｂ」を読出し、また、first から次のアドレス「６」
を読出して変数ｉ＝６にセットする。

【００５３】続いてステップＳ７に進み、ｉ＝０か否か
チェックし、このときｉ＝６であることからステップＳ
８に進み、ステップＳ６のアドレス４のext から得たシ
ンボル「Ｂ」と、ステップＳ２で得ている入力文字
「Ａ」との一致を判別する。この場合、両者は不一致で
あることからステップＳ９に進む。

【００５４】ステップＳ９では、まず変数ｉに辞書メモ
リのアドレス４の参照でnextから得たｊ＝１０の値をセ
ットしてｉ＝１０とする。この変数ｉと変数ｊの置き換
えは、ステップＳ７の判断を変数ｉについてのみ行って
いることから、これを変数ｊについてもできるようにす
るためである。

【００５５】続いて置き換えが済んだ変数ｉで指定され
る辞書メモリのアドレス１０を参照し、アドレス１０の
ext に格納したシンボル「Ａ」を読出し、更に、アドレ
ス１０のfirst に格納している次のアドレス値１１を変
数ｉにセットする。

【００５６】次にステップＳ７に戻り、このときｉ＝１
１であることからステップＳ９で得られたアドレス１０
のシンボル「Ａ」と入力文字「Ａ」とを比較し、一致し
ていることからステップＳ２に進み、３番目の文字の処
理に進む。

【００５７】３番目及び４番目の入力文字「Ａ」につい
ては１番目の入力文字と同様の処理が行われ、辞書メモ
リのアドレス１０から１１、更にアドレス１１から１２
に進み、アドレス１２の処理が済むとステップＳ３で処
理対象となる文字がなくなることからステップＳ１６に
進んで最終アドレスω＝１２を符号｛code（ω）｝とし
て出力して一連の処理を終える。

【００５８】次にステップＳ１１〜ステップＳ１５の辞
書登録ステップの処理を説明する。辞書登録は辞書検索
ステップのfirst 又はnextの検索でｉ＝０となった時に
行われる。

【００５９】即ち、ステップＳ７でｉ＝０が判別される
と、もはや辞書検索はできないのでステップＳ１０でそ
のときの辞書アドレスωを符号｛code（ω）｝として出
力して辞書登録ステップに入る。

【００６０】辞書登録ステップでは、まずステップＳ１
１でその時点での辞書メモリの現在登録文字数ｎを変数
ｉにセットし、更にｎを１つインクリメントする。続い
てステップＳ１２でｊ＝０か否かチェックし、ｊ＝０で
なければｉ＝０であるのでステップＳ１３に進んでfirs
t の登録処理を行う。ｊ＝０であれば、ステップＳ１４
に進んでnextの登録処理を行う。

【００６１】ステップＳ１３のfirst の登録処理は、ｉカウンタで指定されるメモリアドレスｎのfirst に
次の登録先を示す（ｎ＋１）の値を格納し、次のメモリアドレス（ｎ＋１）のext に入力文字Ｋを
シンボルとして登録する。

【００６２】具体的に図１９、図２０でアドレス１１に
続いて入力文字「Ａ」を登録する場合を例にとると、変
数ｉで指定されるメモリアドレス１１のfirst 中に、次
の登録先を示すアドレス値１２を格納し、次のメモリア
ドレス１２のext に入力文字「Ａ」をシンボルとして登
録する。

【００６３】一方、ステップＳ１４のnextの登録処理
は、変数ｉで指定されるメモリアドレスのnext中に、次
の登録先を示す（ｎ＋１）の値を格納し、次のメモリア
ドレス（ｎ＋１）のext に入力文字Ｋをシンボルとして
登録する。

【００６４】具体的に図１９、図２０でアドレス１０で
入力文字「Ａ」を登録する場合を例にとると、まず変数
ｉで指定されるメモリアドレス４のnext中に、次のnext
の登録先を示すアドレス値１０を格納し、メモリアドレ
ス１０のext に入力文字「Ａ」をシンボルとして登録す
る。

【００６５】以上の登録処理が済むと、登録が済んだ文
字Ｋを変数ｉにセットして、ステップＳ２から辞書検索
ステップに戻る。外部ハッシュ法による復号化処理の説明・・・図２２
〜図２４参照外部ハッシュ法による復号化処理では、図２２、図２３
に示した辞書を用いる。この辞書では「before」と「ex
t 」の項目（配列）を用いる。

【００６６】「before」は１つ前の階層のアドレス（fi
rst の逆）を示しており、このbeforeを使って辞書を検
索する。この辞書は、図２３のように表示される。図示
のように、ext （拡張文字）の左上にアドレスを示し、
左下にbeforeを示している。

【００６７】次に、図２４の処理フローチャートに基づ
いて、外部ハッシュ法による復号化処理を説明する。図
２４において、ステップＳ１−１、Ｓ１−２の初期化
は、辞書検索用配列として、beforeとext を初期化する
以外は、図１５の処理Ｓ１と同じである。

【００６８】更に、ステップＳ２〜Ｓ８の辞書検索によ
る復元処理も図１５の処理と基本的には同じである。例
えば、図２２、図２３に示した辞書で、符号語コード１
２を復元する場合は、次のようにする。先ずコード＝１
２で指定される辞書メモリのアドレス１２を参照してex
t のシンボル「Ａ」を読み出してスタックする。

【００６９】次に、beforeから次のアドレス１１を読み
出す（図２３の矢印方向に読み出す）。以下同様な処理
を繰り返すことで、アドレス１１、１０、１のext のシ
ンボル「ＡＡＡ」が読み出されてスタックされ、アドレ
ス１で、次のメモリアドレスが０となって最小値ＮＭ１
Ｎ以下となるので、それまでスタックしていたシンボル
列「ＡＡＡ」を復元した文字列として出力する。

【００７０】このような辞書検索に加えて、ステップＳ
７で辞書登録が行われる。この辞書登録は、シンボルの
復元に対し、１ステップ遅れて行われ、復元した文字列
を出力した後、次の符号語を復元して得た最初の文字
を、現在登録文字数ｎのメモリアドレスのbeforeに登録
し、かつext に文字をシンボル登録する。

【００７１】

【発明が解決しようとする課題】上記のような従来のも
のにおいては、次のような課題があった。 (1) 従来のデータ圧縮／復元方式は、処理中に、ハード
的なエラーが発生しない前提のもとで考えられたもので
ある。

【００７２】従って、例えば通信路中にエラーが発生す
ると、処理対象のデータに影響を及ぼし、正常な処理が
できなくなる。 (2) 従来ののＬＺＷ符号によるデータ圧縮／復号処理
は、メモリ上に確保した領域上の辞書を作成しながら、
その辞書を使用して処理を行っている。

【００７３】この場合、辞書の内容は、連結リストで構
成され、辞書検索時にはこれらのリストをたどる。しか
し、データの圧縮／復元装置として構成した場合、辞書
メモリが破壊されたり、あるいはデータが化けるといっ
た障害も発生する。

【００７４】この場合、従来のＬＺＷ符号による符号化
／復元化処理では、誤ったデータが読み出され、使用さ
れていても、それが正規のデータなのか、誤ったデータ
なのかを判断することはできなかった。

【００７５】本発明は、このような従来の課題を解決
し、データ圧縮／復元処理に使用されるデータが、正規
のデータなのか、誤ったデータなのかを、判断できるよ
うにして、処理の信頼性を高めることを目的とする。

【００７６】

【課題を解決するための手段】図１は本発明の原理図で
あり、図１のＡはデータ圧縮装置の原理ブロック図、図
１のＢはデータ復元装置の原理ブロック図である。

【００７７】図中、図１３と同符号は同一のものを示
す。また、６は入力データ保持部、７は比較部、８は復
元済データ保持部、９は圧縮済データ保持部を示す。本
発明は上記の課題を解決するため、次のように構成し
た。

【００７８】(1) データの圧縮部２と、辞書部３とを具
備し、辞書部３には、符号化済データを、相異なる部分
列に分け、各部分列毎に異なる参照番号ωを付加して登
録しておき、圧縮部２では、辞書部３の検索に外部ハッ
シュ法を使用し、入力データを、辞書部３に登録した部
分列の内、最大長一致するものの参照番号ωで指定して
符号化を行うデータ圧縮方式において、外部ハッシュ法
を用いて、辞書部３を検索することにより、圧縮部２の
符号化処理で検索済の参照番号ωから、部分列のデータ
を復元する復元部５と、該復元部５で復元したデータ
を、圧縮部２の入力データと比較する比較部７とを設
け、該比較部７の比較結果に基づいて、符号化処理に、
誤ったデータが使用されたか否かを検出可能にした。

【００７９】(2) 構成（１）の比較部７で比較するデー
タとして、部分列のデータを用いた。 (3) 構成（１）の比較部７で構成するデータとして、参
照番号ωのデータを用いた。

【００８０】(4) データの復元部５と、辞書部３とを具
備し、辞書部３には、符号化済データを、相異なる部分
列に分け、各部分列毎に異なる参照番号ωを付加して登
録しておき、復元部５では、所定のデータを、辞書部３
に登録した部分列の内、最大長一致するものの参照番号
ωで指定して符号化した符号語を入力データとし、該入
力データをもとに、外部ハッシュ法を使用して辞書部３
を検索することにより、元の部分列のデータを復元する
データ復元方式において、外部ハッシュ法で辞書部３を
検索して、データ圧縮を行うことにより、前記復元部５
で復元された部分列のデータから、元の参照番号のデー
タを得る圧縮部７と、該圧縮部７で得られたデータを、
前記復元部５の入力データと比較する比較部７とを具備
し、該比較部７の比較結果に基づいて、復元処理に、誤
ったデータが使用されたか否かを検出可能にした。

【００８１】(5) 構成（４）の比較部７において比較す
るデータを、部分列のデータとした。 (6) 構成（４）の比較部７において比較するデータを、
参照番号ωのデータとした。

【００８２】(7) 構成（４）の復元部５において、復元
対象の符号語を、辞書部３に登録する際、辞書部３を検
索して、登録の有無を検索することにより、前記符号語
の有効／無効を判定するようにした。

【００８３】(8) 構成（７）辞書部３の或る部分列以降
のハッシュアドレスが全て登録済の場合には、その旨の
付加情報を、記部分列を示す参照番号に付加しておき、
記付加情報を参照することで、上記登録の有無を検索す
るようにした。

【００８４】

【作用】上記構成に基づく本発明の作用を、図１を参照
しながら説明する。 (1) データ圧縮方式の作用・・・図１Ａの圧縮装置参照圧縮装置１の入力データは、圧縮部２に入力すると同時
に、入力データ保持部６に入力して保持される。

【００８５】圧縮部２では、外部ハッシュ法により辞書
部３を検索して、入力データの圧縮処理（符号化処理）
を行い、符号化データを出力する。この時、復元部５で
は、圧縮部２の出力データを受け取り、外部ハッシュ法
により辞書部３を検索して復元処理を行い、復元したデ
ータを復元済データ保持部８に格納する。

【００８６】その後、比較部７では、復元済データ保持
部８のデータと、入力データ保持部６のデータとを比較
する。その結果、両者が等しければ、正規のデータで圧
縮処理が行われていると判断し、両者が異なっていた場
合には、誤ったデータを使用して圧縮処理が行われたと
判断して、エラー信号を出力し、圧縮処理を停止させ
る。

【００８７】(2) データ復元方式の作用・・・図１Ｂの
復元装置参照復元装置４の入力データ（既に圧縮処理された符号化デ
ータ）は、復元部５に入力すると共に、入力データ保持
部６に入力して保持される。

【００８８】復元部５では、外部ハッシュ法により、辞
書部３を検索して、入力データの復元処理を行い、復元
したデータ（原データ）を出力する。この時、圧縮部２
では、復元部５の出力データを受け取り、外部ハッシュ
法により辞書部３を検索して圧縮処理を行い、圧縮した
データ（符号化データ）を、圧縮済データ保持部９に格
納する。

【００８９】その後、比較部７では、圧縮済データ保持
部９のデータと、入力データ保持部６のデータとを比較
する。その結果、両者が等しければ、正規のデータで復
元処理が行われていると判断し、両者が異なっていれ
ば、誤ったデータを使用して復元処理がなされていると
判断し、エラー信号を出力して、復元処理を停止させ
る。

【００９０】以上のようにして、データ圧縮及び復元処
理を行うが、上記比較部７で比較するデータとしては、
部分列のデータ、あるいは参照番号を用いる。本発明に
よれば、符号化時には、符号化された参照番号が正しく
その入力データを表現しているかを再度検索する。復元
時には復元されたデータを再度検索対象として検索して
同一な参照番号を得ることができるかを確認すること
で、復元時の辞書の構造を確認することが出来る。

【００９１】また、復元時に復元対象の参照番号の辞書
への登録時に、登録データがすでに辞書に登録されてい
ないことを確認することで、伝送もしくは蓄積された参
照番号（符号語）の誤りを検出することができる。

【００９２】以上により信頼性の高い圧縮復元装置が実
現できる。

【００９３】

【実施例】以下、本発明の実施例を図面に基づいて説明
する。図２〜図１２は、本発明の実施例を示した図であ
り、図２はデータ圧縮／復元装置のブロック図、図３は
辞書メモリの構成例（実登録）、図４は辞書の説明図、
図５、図６は圧縮処理フローチャート、図７、８は、圧
縮時におけるエラー監視処理フローチャート、図９、１
０は復元処理フローチャート、図１１、１２は復元時に
おけるエラー監視処理フローチャートである。

【００９４】図２〜１２中、図１と同一符号のものは同
一のものを示す。また、１０は復元／圧縮済データ保持
部、１１はＤＭＡ（Direct Memory Access) 制御回路、
１２はＭＰＵ（マイクロプロセッサ）、１３は辞書検索
回路、１４は誤り検出用辞書検索回路、１５は入出力ポ
ート、１６は連続アドレス回路、１７は複数文字読み込
み回路、１８は連結検出回路、１９は一致検査回路、２
０はパイプライン制御回路、３Ａは辞書メモリを示す。

【００９５】(1) データ圧縮／復元装置の説明・・・図
２参照図２に示した装置は、図１に示したデータ圧縮装置１
と、データ復元装置４とを同一装置で実現した例であ
る。

【００９６】この装置は、ＭＰＵ１２、ＤＭＡ制御回路
１１、辞書メモリ３Ａ、辞書検索回路１３、誤り検出用
辞書検索回路１４、入出力ポート１５、比較部７、入力
データ保持部６、復元／圧縮済データ保持部１０等で構
成されている。

【００９７】そして、辞書検索回路１３と誤り検出用辞
書検索回路１４には、それぞれ、連続アドレス回路１
６、連続文字読み込み回路１７、連結検出回路１８、一
致検査回路１９、パイプライン制御回路２０等を設け
る。

【００９８】なお、復元／圧縮済データ保持部１０は図
１の復元済データ保持部８と圧縮済データ保持部９に対
応し、辞書メモリ３Ａは、図１の辞書部３に対応する。
以下、上記装置の動作の概要を説明する。

【００９９】図２において、処理対象となる原データ
（文字データあるいは符号語データ）はＤＭＡ（Direct
Memory Access) 制御回路１１を介して入力される。Ｍ
ＰＵ１２は入力された原データを、１文字といままでの
文字列の参照番号を辞書検索回路１３の複数文字読み込
み回路１７にセットした後、辞書検索回路１３を起動す
る。

【０１００】辞書検索回路１３は以後、辞書メモリ３Ａ
より１文字伸ばした文字列の候補文字を読み込み、一致
検索回路１９で入力文字と候補文字との一致検査を行
い、連結検出回路１８で候補文字の有無の検出を行う。
パイプライン制御回路２０は、一致検査回路１９による
入力文字と候補文字の照合と連結検出回路１８による入
力文字と候補文字の有無とに並行して辞書メモリ３Ａに
次の候補文字の読み出しをかける。このように、パイプ
ライン制御回路２０でパイプライン処理を行うことで、
候補文字の複数個ごとの検索と照合処理が辞書メモリ３
Ａのサイクルタイムで実行できる。

【０１０１】更に辞書検索回路１３には連続アドレス回
路１６が設けられ、連続アドレスを発生、複数文字読み
込み回路１７に辞書メモリ３Ａの連続アドレスに登録さ
れているハッシュアドレス及び候補文字を読み出すよう
にする。このとき、圧縮に使用した原データは入力デー
タ保持部６により保存する。

【０１０２】ＬＺＷ符号化では、辞書メモリ３Ａ中の最
大長一致する文字列を求める。従って、入力文字を付加
して文字列を逐次１文字ずつ伸ばしていき、候補文字が
なくなったところで最大一致長の文字列であることが分
かる。このとき、最大一致長文字列まではアドレスωを
使用した参照番号で表されており、ＭＰＵ１２は、その
参照番号ωを入出力ポート１５から外部に圧縮された符
号として出力する。また、参照番号ωと最終入力文字の
組を辞書に登録する。

【０１０３】誤り検出辞書検索回路１４は、辞書を参照
番号ωにより原データを復元して復元／圧縮済データ保
持部１０に保存する。比較部７では入力データ保持部６
と復元／圧縮済データ保持部１０のデータを比較して不
一致の場合はＭＰＵ１２に知らせる。この場合、辞書の
構造が矛盾を起こしたことを意味し、処理を中断する。

【０１０４】一方、Ｌｚｗ符号の復元は、入力コードで
辞書メモリ３Ａをアクセスして連結リストを前にたどり
ながら１文字ずつ復元し、参照番号が０になったとき
に、既に復元した複数の文字列を文字列データとして出
力する。圧縮と同様に、復元したデータを再度符号化し
て同じ圧縮データが得られるかを比較する。

【０１０５】また、復元時においては辞書に新規にデー
タを登録するとき、登録と同じレベルのハッシュアドレ
スに登録しようとする文字がすでに登録されていないか
をチェックすることで、復元対象の参照番号の謝りが確
認することができる。さらに、同じレベルのハッシュア
ドレスが全て登録済の場合には、対象とするノードに登
録済のマークを付加することで登録時の検索を省略する
ことができる。

【０１０６】(2) 辞書の説明・・・図３、図４参照本実施例では、データ圧縮時にはデータの復元を行って
エラーを監視し、データの復元時にはデータの圧縮を行
ってエラーを監視している。

【０１０７】このため、図３に示した辞書メモリには、
「before」「first 」「next」「ext 」の各配列データ
が格納できるようになっており、データ圧縮時と復元時
で同じ辞書を用いる。

【０１０８】前記辞書メモリの辞書は、図４に示したよ
うに表現される。なお、この辞書の構成は、従来例の圧
縮時に使用する辞書と、復元時に使用されていた辞書を
一緒にしたものなので、説明は省略する。

【０１０９】(3) データ圧縮時の処理説明・・・図５〜
図８参照データ圧縮時には、入力データを、外部ハッシュ法によ
り、符号化データに変換して出力するが、処理の途中
で、誤ったデータが使用されたか否かを監視するため、
一度符号化されたデータを、復号化し、入力データと比
較する。

【０１１０】前記処理の内、外部ハッシュ法による符号
化処理を図５、図６に示し、エラー監視処理を図７、図
８に示す。またこの処理で用いる辞書は図３、図４に示
したものを用いる。

【０１１１】先ず、図５、図６の処理フローチャート
に基づいて、データ圧縮時の符号化処理（圧縮部の処
理）を説明する。なお、図５、図６の各処理番号は、カ
ッコ内に示す。また、説明の都合上、処理対象文字を
Ａ、Ｂ、Ｃの３文字とする。

【０１１２】処理の開始時に、第１番目の文字を含むよ
うに辞書を初期化する（Ｓ１）。この例ではＡ、Ｂ、Ｃ
３文字を対象としているから、Ａ、Ｂ、Ｃ３文字の文字
コードをそのままハッシュアドレスとして図３の辞書メ
モリのアドレス１、２、３に登録する（文字コードｉを
辞書アドレスｉに登録）。

【０１１３】また、辞書への現登録文字列ｎに、次に登
録される部分列に与えられる参照番号をセットする。例
えば、文字Ａ、Ｂ、Ｃに与えられた参照番号「１」、
「２」、「３」をハッシュアドレスとして辞書に格納
し、現登録文字列ｎに数値を設定すればよい（ｎ→ＮＭ
ＩＮ）。

【０１１４】ここで、辞書に登録できる部分列の最大値
をＮＭＡＸとし、それぞれＮＭＡＸ個の成分から成る配
列first 、配列next、配列ext 、配列before（図３、図
４参照）を定義し、これらの配列の全ての成分に初期値
０を設定する。

【０１１５】この場合、配列first は索引部に相当し、
配列next、配列ext はリストに相当している。従って、
配列first のｉ番目の成分first （ｉ）には、参照番号
ｉの節点に対応するリストの先頭となる配列nextの成分
を示す番号が設定されている。

【０１１６】また、配列ext のｉ番目の成分ext （ｉ）
には、参照番号ｉで示される辞書の要素の拡張文字Ｋが
設定されており、配列nextのｉ番目の成分next（ｉ）に
は、参照番号ｉの要素の横階層（図１１参照）の要素を
示すポインタが設定されている。

【０１１７】更に、配列beforeのｉ番目の成分before
（ｉ）には、参照番号ｉの節点に対応するリストの後側
となる配列nextの成分を示す番号が設定されている。ま
た、辞書検索用配列は、それぞれ、first 〔１．ＮＭＡ
Ｘ〕、next〔１．ＮＭＡＸ〕、ext 〔１．ＮＭＡＸ〕、
before〔１．ＮＭＡＸ〕で表される。

【０１１８】次に、最初の文字Ｋを読み込んで、この文
字Ｋに対応する参照番号を変数ｉに設定して、符号化処
理を開始する。先ず、拡張文字をＫとして、入力文字列
の次の文字を読み込んで（Ｓ２）、その次に読み込むべ
き文字が有れば（Ｓ３）、辞書の検索処理（Ｓ５〜Ｓ
９）を行う。

【０１１９】この場合、変数ｉを、別の変数ωにし（ｉ
→ω）、変数ｊを初期値０に設定（０→ｊ）してから
（Ｓ５）、変数ｉに対応する成分first （ｉ）の値で示
される配列nextの成分の番号を、変数ｉに設定する（Ｓ
６）。

【０１２０】その後、変数ｉが数値０でないと判定され
た場合（Ｓ７）は、該当するリストに格納された要素を
候補要素として、このリストにおける検索処理を行う。
この場合、該当する候補要素の拡張文字を示す成分ext
（ｉ）と拡張文字Ｋとを比較し（Ｓ８）、両者が等しく
なければ、成分next（ｉ）に設定された次の候補要素の
ポインタを、新しい変数ｉとして（Ｓ９）、処理Ｓ７に
戻る。

【０１２１】このようにして、Ｓ７、Ｓ８、Ｓ９の処理
を繰り返して行い、該当するリストを検索する。また、
前記処理Ｓ８において、成分ext （ｔ）＝symbol＝Ｋと
なった場合は、入力された文字列と一致する部分列が辞
書に登録されていると判断し、処理Ｓ２に戻って、次の
文字を読み込み、この文字を付加した文字列の符号化を
行う。

【０１２２】一方、変数ｉに対応する成分first
（ｉ）、あるいはnext（ｉ）の値が０であった場合は、
ｉ＝０となる（Ｓ７）。この場合は、参照番号ｉの部分
列に連結する他の候補要素が辞書に登録されていないと
判断し、次の処理を行う。

【０１２３】ここで、上述したように、辞書から該当す
る部分列が検索される毎に、処理Ｓ５において、検索さ
れた部分列に対応する参照番号が変数ωに退避されてい
る。従って、この変数ωに退避された参照番号は、入力
文字列に最も長く一致する登録された部分列を示してお
り、この参照番号ωに対応する符号｛code（ω）｝を出
力する（Ｓ１０）。

【０１２４】そして、前記参照番号ωと、入力文字列を
復元部に渡し、エラー監視処理（この処理は後述する）
を行う（Ｓ１１）。続いて、新しい部分列の登録処理
（Ｓ１２〜Ｓ１６）を行う。この登録処理では、先ず、
変数ｎの値を変数ｉに設定（ｎ→ｉ）すると共に、変数
ｎをインクリメント（ｎ＋１→ｎ）する（Ｓ１２）。

【０１２５】次に変数ｊがｊ＝０か否かを判断し（Ｓ１
３）、ｊ＝０であれば、first （ω）に変数ｉを設定
し、ext （ω）に拡張文字Ｋを設定し（Ｓ１４）、参照
番号ωに対応するリストを定義する。

【０１２６】一方、ｊ＝０でなければ（Ｓ１３）、next
（ω）に変数ｉを設定し、ext （ω）に拡張文字Ｋを設
定する（Ｓ１６）。このようにして、登録処理が終了し
た後に、拡張文字Ｋに対応する参照番号を変数ｉとして
（Ｓ１５）処理Ｓ２に戻り、上述した処理を繰り返す。

【０１２７】その後、読み込むべき文字がなくなると
（Ｓ３）、その時の変数ωに対応する符号｛code
（ω）｝を出力して（Ｓ４）、処理を終了する。次に、符号化したデータを、再び復号化してエラーを
監視する処理（復元部、比較部等の処理）を、図７、８
の処理フローチャートに基づいて説明する。なお、図
７、８の各処理番号は、カッコ内に示す。

【０１２８】この処理では、一度圧縮部により符号化し
たデータを受け取り、この符号化データを復号化して、
原データ（入力データ）と比較することでエラーの監視
をする。

【０１２９】先ず、圧縮部（図６の処理１１）より、ω
と文字列を受け取り（Ｓ２０）、１回目であれば（Ｓ２
１）、最初の符号（参照番号）を読み込み、現在のコー
ドをオールドコードとする（CODE→OLDcode)。

【０１３０】また、最初の符号（参照番号）は、既に辞
書に登録された１文字の参照番号のいずれかに該当する
ことから、入力符号コード（code）に一致する文字Ｋの
コードを検索し、文字Ｋを出力する（Ｓ２２）。

【０１３１】なお、出力した文字Ｋは、後の処理のため
に、「FINchar 」（最終文字列）にセットしておく（Ｋ
→FINchar ）。続いて、次の符号を読み込んで、コード
にインコードして（code→INcode) セットし（Ｓ２
３）、新たな符号が有るか否か、即ち、符号入力の終了
の有無をチェックする（Ｓ２４）。

【０１３２】もし、新たな符号が有れば、入力された符
号コードが辞書に定義（登録）されているか否かをチェ
ックする（Ｓ２７）。前記処理で、もしコードが定義さ
れていれば、「FINchar 」の文字Ｋを一時的にスタック
し、（FINchar →stack)、参照番号コードを新たな符号
コード（OLDcode →Code) とする（Ｓ２９）。

【０１３３】そして、符号コードが現登録文字列ｎの最
小値ＮＭＩＮ（アドレスの最小値）まで（Ｓ２８）、辞
書のbeforeコードから次のアドレスのデータを読み出す
（Ｓ３０）。

【０１３４】このようにして、符号コードが現登録文字
列ｎの最小値（最小アドレス）になると、文字Ｋを出力
し、辞書登録をする（Ｓ３１）。なお、Ｓ３１の処理
は、図２４のＳ７の処理と同じなので、説明を省略す
る。以後、上記処理Ｓ２４からの処理を繰り返して行
う。

【０１３５】上記の処理（Ｓ２４）で、新たな符号が無
くなると、圧縮部からの文字列（入力データ）と、復元
した文字列（一度符号化したものを復元したデータ）が
同じか否かを比較して判断する（Ｓ２５）。

【０１３６】この判断で、もし両者が異なっていた場合
には、エラー信号を出力して、圧縮処理を中止させる
（Ｓ２７）。即ち、前記比較により、両者が異なってい
た場合には、誤ったデータを使用して圧縮処理をしてい
るので、前記のように処理を行う。

【０１３７】しかし、前記比較で、両者が一致すれば、
処理データは正規のデータであるから、圧縮部２６へ戻
って符号化処理を続ける（Ｓ２６）。 (4) データ復元時の処理説明・・・図９〜図１２参照データ復元時には、入力データ（符号化データ）を、外
部ハッシュ法により、復号化データに変換して出力する
が、この場合にも、処理の途中で誤ったデータが使用さ
れたか否かを監視するため、一度復号化したデータを符
号化し、入力データと比較する。

【０１３８】前記処理の内、外部ハッシュ法による復号
化処理を図９、図１０に示し、エラー監視処理を図１
１、図１２に示す。また、辞書は、図３、図４に示した
ものを用いる。

【０１３９】先ず、図９図、１０の処理フローチャー
トに基づいて、データ復元時の復号化処理（復元部の処
理）を説明する。なお、図９、図１０の各処理番号はカ
ッコ内に示す。

【０１４０】復号化処理では、符号化時と同様に、予め
辞書に、全文字につき、１文字から成る文字列を初期値
として登録してから復号化を始める。最初に初期化（Ｓ
５１）を行うが、この処理は図５の処理と同じである。

【０１４１】次に、最初の符号（参照番号）を読み込
み、現在のコード（code) をオールドコード(OLDcode)
とし、入力符号コードに一致する文字Ｋのコードを検索
し、文字を出力する（Ｓ５２）。

【０１４２】なお、出力した文字Ｋは後の処理のために
「FINchar 」にセットしておく（Ｋ→FINchar ）。ま
た、圧縮用に、文字Ｋを語頭文字列（plifix string)ω
に設定する（Ｓ５３）。

【０１４３】その後、次の符号を読んで、コードにイン
コードとしてセット（CODE→INcode) する（Ｓ５４）。
続いて、新たな符号があるか否か、即ち、符号入力の終
了の有無をチェックして（Ｓ５５）、次の処理に進む。

【０１４４】もし、新たな符号が有れば、入力された符
号コードが辞書に定義（登録）されているか否かをチェ
ックし（Ｓ５６）、定義されていれば、「FIN char」の
文字Ｋを一時的にスタックし(FINchar→stack)、参照番
号コードを新たな符号コード（OLDcode →Code) とする
（Ｓ５７）。

【０１４５】そして符号コードが、現登録文字列ｎの最
小値ＮＭＩＮ（アドレスの最小値）になるまで（Ｓ５
９）、辞書のbeforeコードから次のアドレスのデータを
読み出す（Ｓ５８）。

【０１４６】このようにして文字Ｋを出力し、辞書登録
を行う（Ｓ６０）。なお、図１０のＳ５６〜Ｓ６０の処
理は、図８のＳ２７〜Ｓ３１の処理、及び図２４のＳ４
〜Ｓ８の処理と同じなので、詳細な説明は省略する。

【０１４７】前記の処理が終了すると、圧縮部にオール
ドコード（OLDcode ）と、復元文字列を渡し、確認（エ
ラー監視処理）を行う（Ｓ６１）。そして、上記Ｓ５５
の処理に戻り、次の処理を行う。

【０１４８】次に、復号化したデータを、再び符号化
して、エラーを監視する処理（圧縮部、比較部等の処
理）を、図１１、図１２に基づいて説明する。なお、図
１１、図１２の各処理番号はカッコ内に示す。

【０１４９】この処理では、復元部より、一度復号化し
たデータを受け取り、このデータを符号化して原データ
（入力データ）と比較することでエラーの監視をする。
先ず、復元部より、コードと文字列を受け取る（Ｓ６
２）。

【０１５０】そして、次の入力文字Ｋを読み込んで（Ｓ
６３）、その次に読み込むべき文字があれば（Ｓ６
４）、辞書を検索する。この場合、変数ｉを、別の変数
ωにし（ｉ→ω）、変数ｊを初期値０に設定（０→ｊ）
してから（Ｓ６６）、変数ｉに対応する成分first(ｉ）
の値で示される配列nextの成分の番号を、変数ｉに設定
する（Ｓ６７）。

【０１５１】次に、変数ｉが数値０（ｉ＝０）でないと
判定された場合（Ｓ６９）、該当するリストに格納され
た要素を候補要素として、このリストにおける検索処理
を行う。

【０１５２】この場合、該当する候補要素の拡張文字を
示す成分ext （ｉ）と拡張文字Ｋとを比較し（Ｓ７
０）、両者が等しくなければ、成分next（ｉ）に設定さ
れた次の候補要素のポインタを、新しい変数ｉとして
（Ｓ６８）、処理Ｓ６９に戻る。

【０１５３】このようにして、Ｓ６８、Ｓ９、Ｓ７０の
処理を繰り返して行い、該当するリストを検索する。一
方・変数ｉに対応する成分first(ｉ）、あるいはnext
（ｉ）の値が０であった場合には、ｉ＝０となる（Ｓ６
９）。

【０１５４】この場合は、参照番号ｉの部分列に連結す
る他の候補要素が辞書に登録されていないと判断し、図
４のＳ１０の処理と同様にしてコード｛code( ω）｝を
出力する（Ｓ７１）。

【０１５５】そして、復元時のコードと、参照番号ωが
同じか否かを判断し（Ｓ７２）、もし異なっていればエ
ラー信号を出力し、復元処理を中止させる（Ｓ７３）。
しかし、復元時のコードとωが同じならば（Ｓ７２）、
正規のデータで処理されていると判断し、次の辞書登録
処理（Ｓ７４〜Ｓ７９）を行う。

【０１５６】なお、前記の辞書登録処理は、図６の処理
Ｓ１２〜Ｓ１６と同じ処理なので、説明を省略する。（他の実施例）以上実施例について説明したが、本発明
は次のようにしても実施可能である。

【０１５７】(1) データ圧縮時及び復元時の比較処理
（エラー監視処理）において、部分列を比較してもよ
く、また参照番号を比較してもよい。 (2) データ復元方式においては、ある部分列以降のハッ
シュアドレスが全て使用中であった場合には、その旨を
示す付加情報を、参照番号に付加しておくことで、登録
済みの検索を簡素化することができる。

【０１５８】

【発明の効果】以上説明したように、本発明によれば次
のような効果がある。 (1) データの圧縮／復元処理において、処理しているデ
ータが、正規のデータなのか、誤ったデータなのかを検
出することができる。従って、データの圧縮／復元処理
の信頼性が向上する。

【０１５９】(2) 符号化時には、符号化された参照番号
が正しくその入力データを表現しているかを再度検索す
る。復元時には復元されたデータを再度検索対象として
検索して同一な参照番号を得ることができるかを確認す
ることで、復元時の辞書の構造を確認することが出来
る。また、復元時に復元対象の参照番号の辞書への登録
時に、登録データがすでに辞書に登録されていないこと
を確認することで、伝送もしくは蓄積された参照番号
（符号語）の誤りを検出することができる。以上により
信頼性の高い圧縮復元装置が実現できる。

【図面の簡単な説明】

【図１】本発明の原理図である。

【図２】本発明の実施例におけるデータ圧縮／復元装置
のブロック図である。

【図３】辞書メモリの構成例（実登録）である。

【図４】辞書の説明図である。

【図５】圧縮処理フローチャート（その１）である。

【図６】圧縮処理フローチャート（その２）である。

【図７】圧縮時におけるエラー監視処理フローチャート
（その１）である。

【図８】圧縮時におけるエラー監視処理フローチャート
（その２）である。

【図９】復元処理フローチャート（その１）である。

【図１０】復元処理フローチャート（その２）である。

【図１１】復元時におけるエラー監視処理フローチャー
ト（その１）である。

【図１２】復元時におけるエラー監視処理フローチャー
ト（その２）である。

【図１３】従来の圧縮／復元装置のブロック図である。

【図１４】従来のＬＺＷ符号化処理フローチャートであ
る。

【図１５】従来のＬＺＷ復号化処理フローチャートであ
る。

【図１６】Ａは従来のＬＺＷ符号化の具体例説明図、Ｂ
は辞書構成例の説明図である。

【図１７】従来のＬＺＷ復号化の具体例説明図である。

【図１８】外部ハッシュ法のリスト構造説明図である。

【図１９】辞書メモリの構成例（符号化時）である。

【図２０】辞書の説明図（符号化時）である。

【図２１】従来の外部ハッシュ法によるＬＺＷ符号化処
理フローチャートである。

【図２２】辞書メモリの構成例（復元時）である。

【図２３】辞書の説明図（復元時）である。

【図２４】従来の外部ハッシュ法によるＬＺＷ復号化処
理フローチャートである。

【符号の説明】

１圧縮装置２圧縮部３辞書部４復元装置５復元部６入力データ保持部７比較部８復元済データ保持部９圧縮済データ保持部

───────────────────────────────────────────────────── フロントページの続き (72)発明者吉田茂神奈川県川崎市中原区上小田中1015番地富士通株式会社内

Claims

【特許請求の範囲】

【請求項１】データの圧縮部（２）と、辞書部（３）
とを具備し、辞書部（３）には、符号化済データを、相異なる部分列
に分け、各部分列毎に異なる参照番号（ω）を付加して
登録しておき、圧縮部（２）では、辞書部（３）の検索に外部ハッシュ
法を使用し、入力データを、辞書部（３）に登録した部分列の内、最
大長一致するものの参照番号（ω）で指定して符号化を
行うデータ圧縮方式において、外部ハッシュ法を用いて、辞書部（３）を検索すること
により、圧縮部（２）の符号化処理で検索済の参照番号（ω）か
ら、部分列のデータを復元する復元部（５）と、該復元部（５）で復元したデータを、圧縮部（２）の入
力データと比較する比較部（７）とを設け、該比較部（７）の比較結果に基づいて、符号化処理に、
誤ったデータが使用されたか否かを検出可能にしたこと
を特徴とするデータ圧縮方式。
【請求項２】上記比較部（７）において比較するデー
タが、部分列のデータであることを特徴とする請求項１
記載のデータ圧縮方式。
【請求項３】上記比較部（７）において比較するデー
タが、参照番号（ω）のデータであることを特徴とする
請求項１記載のデータ圧縮方式。
【請求項４】データの復元部（５）と、辞書部（３）
とを具備し、辞書部（３）には、符号化済データを、相異なる部分列
に分け、各部分毎に異なる参照番号（ω）を付加して登
録しておき、復元部（５）では、所定のデータを、辞書部（３）に登録した部分列の内、
最大長一致するものの参照番号（ω）で指定して符号化
した符号語を入力データとし、該入力データをもとに、外部ハッシュ法を使用して辞書
部（３）を検索することにより、元の部分列のデータを
復元するデータ復元方式において、外部ハッシュ法で辞書部（３）を検索して、データ圧縮
を行うことにより、前記復元部（５）で復元された部分列のデータから、元
の参照番号のデータを得る圧縮部（７）と、該圧縮部（７）で得られたデータを、前記復元部（５）
の入力データと比較する比較部（７）とを具備し、該比較部（７）の比較結果に基づいて、復元処理に、誤
ったデータが使用されたか否かを検出可能にしたことを
特徴とするデータ復元方式。
【請求項５】上記比較部（７）において比較するデー
タが、部分列のデータであることを特徴とする請求項４
記載のデータ復元方式。
【請求項６】上記比較部（７）において比較するデー
タが、参照番号（ω）のデータであることを特徴とする
請求項４記載のデータ復元方式。
【請求項７】上記復元部（５）において、復元対象の
符号語を、辞書部（３）に登録する際、辞書部（３）を検索して、登録の有無を検索することに
より、前記符号語の有効／無効を判定することを特徴と
した請求項４記載のデータ復元方式。
【請求項８】上記辞書部（３）の或る部分列以降のハ
ッシュアドレスが全て登録済の場合には、その旨の付加情報を、上記部分列を示す参照番号に付加
しておき、上記付加情報を参照することで、上記登録の有無を検索
することを特徴とした請求項７記載のデータ復元方式。