JP3083329B2

JP3083329B2 - データ圧縮復元方式

Info

Publication number: JP3083329B2
Application number: JP1766491A
Authority: JP
Inventors: 広隆千葉; 佳之岡田; 茂吉田; 泰彦中野
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1991-02-08
Filing date: 1991-02-08
Publication date: 2000-09-04
Anticipated expiration: 2015-09-04
Also published as: JPH04256192A

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明はデータの符号化方式や復
号化方式に係り、さらに詳しくは符号化によってデータ
を圧縮するデータ圧縮方式に係る。また、このデータ圧
縮方式によって圧縮されたデータを復元するデータ復元
方式に関する。

【０００２】

【従来の技術】近年、ＯＡ化の発展、更にはＣＰＵの処
理技術の向上により、カラーや白黒階調画像情報等のデ
ータベースを計算機で扱うことが増えてきている。これ
らの画像情報のデータ量は１枚（１画面）あたり数Ｍバ
イトになり非常に大きいものである。このため蓄積や伝
送等における画像情報を効率良く扱うため、データ圧縮
を行って記憶すべきデータ量を減らしている。

【０００３】データ圧縮には様々な方式があるが、その
一方式としてユニバーサル符号化がある。なお、本発明
は文字コードの圧縮に限らず様々なデータに適用できる
が、以下では説明のため情報理論の分野で呼称されてい
るデータの１ワード単位を文字、データが複数ワードつ
ながったものを文字列と呼ぶ。

【０００４】前述のユニバーサル符号化の代表的な方法
として、Ziv-Lempel符号がある（詳しくは、例えば、宗
像『Ziv-Lempelのデータ圧縮法』、情報処理、Vol ．２
６、No．１，1985年を参照のこと）。このZiv-Lempel符
号ではユニバーサル型と、増分分解型（Incrementa
l parsing)の２つのアルゴリズムが提案されている。

【０００５】ユニバーサル型のアルゴリズムは、演算量
が多いが、高圧縮率が得られるという特徴を有してい
る。この方式は、符号化データを過去のデータ系列の任
意の位置から一致する最大長の系列に区切り（部分
列）、過去の系列の複製として符号化する方法である。
図６に示す如くＰバッファとＱバッファとが設けられ、
Ｐバッファに符号化済みの入力データを格納し、Ｑバッ
ファにこれから符号化するデータを格納する。そして、
Ｑバッファの系列はＰバッファの系列をサーチし、Ｐバ
ッファ中で一致する最大長の部分列を求める。そして、
Ｐバッファ中でこの最大部分列を指定するための情報の
組を符号化する。

【０００６】更に、ユニバーサル型アルゴリズムの改良
としてＬＺＳＳ符号がある。（T.C.Bell, “Better OPM
/L Text Compression ”,IEEE Trans. on Commun., Vo
l．COM-34，No．12, Dec.1986参照) 。このＬＺＳＳ符
号では図５Ａに示す如くＰバッファ中の最大一致系列の
開始位置を求め、一致する長さの組と、次のシンボルと
をフラグで区別して符号量の少ない方で符号化するもの
である。

【０００７】一方、増分分解型アルゴリズムは、圧縮率
ではユニバーサル型より劣るが、シンプルで計算も容易
であるという特徴を有している。増分分解型Ziv-Lempel
符号では、入力シンボルの系列をｘ＝ａａｂａｂａｂａ
ａ・・・とすると、成分系列ｘ＝Ｘ₀Ｘ₁Ｘ₂・・・へ
の増分分解は次のようにしている。先ずＸ₁を既成分の
右端のシンボルを取り除いた最長の列とし、Ｘ＝ａ・ａ
ｂ・ａｂａ・ｂ・ａａ・・・としている。従って、Ｘ₀
＝λ（空列）、Ｘ₁＝Ｘ₀ａ，Ｘ₂＝Ｘ₁ｂ，Ｘ₃＝Ｘ
₂ａ，Ｘ₄＝Ｘ₀ｂ，Ｘ₅＝Ｘ₁ａ，・・・・と分解で
きる。

【０００８】増分分解した各成分系列は既成分系列を用
いて、図５Ｂに示すごとく各成分のでた順番に成分のイ
ンデックスと次のシンボルを用いて符号化している。す
なわち増分分解型アルゴリズムは、符号化パターンにつ
いて、過去に分解した部分列の内最大長を意識するもの
を求め、過去に分解した部分列の複製として符号化する
ものである。

【０００９】さらに、前述の増分分解型アルゴリズムの
改良として、ＬＺＷ符号がある。（T.A. Welch, “A Te
chnique for High-Performance Data Compression”,Co
mputer, June 1984参照）。このＬＺＷ符号では、次の
シンボルを次の部分列に組み込むようにしてインデック
ススのみで符号化できるようにしている。

【００１０】図７は従来のＬＺＷ符号化による処理フロ
ー図である。ＬＺＷ符号化処理においては、書き換え可
能な辞書を有し、入力文字列を相異なる文字列（部分
列）に分け、この文字列を出現した順に参照番号を付け
て辞書に登録するとともに、現在入力している文字列を
辞書に登録してある最長一致文字列の参照番号で表わし
て符号化するものである。

【００１１】先ず、処理Ｓ１で予め辞書に全文字につき
１文字からなる文字列を初期値として登録してから後述
する符号化を始める。また、処理Ｓ１では入力した最初
の文字Ｋにより辞書を検索して最小番号ωを求め、これ
を語頭文字列とする。続いて処理Ｓ２で入力データの次
の文字Ｋを読み込み、処理Ｓ３で全ての文字入力が終了
したか否かをチェックする。入力文字が存在する、すな
わち文字Ｋが存在する時（Ｙ）には語頭文字列ωに処理
Ｓ２で読み込んだ文字Ｋを加えた文字列（ωＫ）が辞書
に存在するか否かを求める。

【００１２】判別処理Ｓ４で文字列（ωＫ）が辞書に存
在しなければ（Ｎ）、処理Ｓ６によって処理１で求めた
文字Ｋの参照番号ωを符号語code（ω）として出力し、
また文字列（ωＫ）を新たな参照番号として辞書に登録
し、更に処理Ｓ２の入力文字Ｋを参照番号ωに置き換え
ると共に辞書アドレスｎをインクリメントして再度処理
Ｓ２より実行する。

【００１３】一方、処理Ｓ４で文字列（ωＫ）が辞書に
存在する時（Ｙ）には、文字列（ωＫ）を参照番号ωに
置き換え（Ｓ５）、再び処理Ｓ２に戻って処理Ｓ４にお
いて文字列ωＫが辞書から探せなくなるまで最大一致長
の検索を続ける。

【００１４】また、文字Ｋが判別処理Ｓ３において存在
しないと判別した時（Ｎ）には処理Ｓ７によってcode
（ω）を出力し終了（ＥＮＤ）する。前述した処理を図
９，１０を参照して具体的に説明する。

【００１５】図９の入力データINPUT SYMBOLS は左から
右へと順次読む。最初の文字ａを入力した時、辞書には
ａの他に一致する文字列がないので、OUTPUT CODE １
（参照番号ω）を符号語として出力する。そして、拡張
した文字列ａｂに参照番号４を付けて辞書に登録する。
実際の辞書登録は図１０の右側（ALTERNATE TABLE ）に
示すように文字列１ｂとして登録する。続いて２番目の
文字ｂが文字列の先頭になる。辞書にはｂの他に一致す
る文字がないので参照番号２を符号文字として出力し、
同時に拡張した文字列ｂａも辞書にないので文字列ｂａ
を２ａで表わし、参照番号５を付けて辞書に登録する。
そして３番目のａが次の文字列の先頭になる。以下同様
にこの処理を続ける。

【００１６】図８は図７の復号化処理によって求めた圧
縮データの復号化処理のフローチャートである。図８の
ＬＺＷ復号化処理においては、符号化と同様に予め辞書
に全文字につき１文字からなる文字列を初期値として登
録してから復号を始める。

【００１７】先ず処理Ｓ１１で最初の符号（参照番号）
を読み込み、現在のＣＯＤＥをＯＬＤcodeとし、最初の
符号は既に辞書に登録された１文字の参照番号いずれか
に該当することから、入力符号ＣＯＤＥに一致する文字
code（Ｋ）を探し出し、文字Ｋを出力する。なお、出力
した文字Ｋは後の例外処理のためＦＩＮcharにセットす
る。

【００１８】次に処理Ｓ１２において、次の符号を読み
込んでＣＯＤＥをＩＮcodeとしてセットする。続いて新
たな符号があるか否かを判別（Ｓ１３）し、新たな符号
がない時（Ｎ）には終了（ＥＮＤ）する。また、存在す
る時（Ｙ）には処理Ｓ１３で入力した符号ＣＯＤＥが辞
書に定義されているか否かをチェックする（Ｓ１４）。
通常入力した符号語は前回までの処理で辞書に登録され
ているため、続いて符号CODEに対する文字列code（ω
Ｋ）を辞書から読み出し、文字Ｋを一時的にスタック
（Ｓ１６）し、参照番号ｃｏｄｅ（ω）を新たな符号CO
DEとして再度処理Ｓ１５より実行する。この処理Ｓ１
５、Ｓ１６の手順を再帰的に参照番号ωが１文字Ｋに至
るまで繰り返し最後に処理Ｓ１７において処理Ｓ１６で
スタックした文字をＬＩＦＯ（Last InFast Out) 形式
でポップアップして出力する。また同時に前回使用した
符号ωと今回復元した文字列の最初の１文字Ｋを組
（ω，Ｋ）と表わした文字列に、新たな参照番号として
辞書に登録する。

【００１９】図１１を参照してＬＺＷ復号化処理を具体
的に説明する。最初の入力符号（ＩＮＰＵＴＣＯＤ
Ｅ）は１であり、１文字ａ，ｂ，ｃについては既に参照
番号１，２，３として図１１に示す如く辞書に登録され
ている。よって辞書の参照により符号１に一致する参照
番号の文字列ａに置き換えて出力する。次の符号２につ
いても同様にし、文字ｂに置き換えて出力する。この時
前回処理した符号１と今回復号した最初の１文字ｂとを
組み合わせた文字列（１ｂ）に新たな参照番号４を付加
して辞書に登録する。

【００２０】３番目の符号４は辞書の検索により求めた
文字列１ｂから文字列ａｂと置き換えて文字列ａｂを出
力する。同時に前回処理した符号２と今回復号した文字
列の１番目の文字ａとの組み合わせた文字列２ａ（＝ｂ
ａ）に新たな参照番号５を付加して辞書に登録する。そ
して以下同様に繰り返すことにより復号がなされる。

【００２１】図１１のＬＺＷ復号化においては次の例外
処理がある。この例外処理は例えば第６番目の入力符号
８の復号にて生ずる。復号８は復号時に辞書に定義され
ておらず復号できない。この場合には前回処理した符号
５に前回復号した文字列ｂａの最初の１文字ｂを加えた
文字列５ｂを求め、更に２ａｂ＝ｂａｂと置き換えて出
力する例外処理を行う。そして、文字列の出力後に前回
の符号５に今回復号した文字列の１番目の文字ｂを加え
た文字列５ｂに参照番号８を付加して辞書に登録する。

【００２２】この例外処理は図７の復号化処理フローの
処理Ｓ４，Ｓ８によって行われ、最終的に処理Ｓ７で文
字列の出力と新たな文字列に参照番号を付加した辞書へ
の登録が行われる。

【００２３】尚、図８，図１１のＬＺＷ復号化において
は、復号側で符号を解読しながら辞書をリアルタイムで
作り出す場合を説明しているが、符号化の際に作られた
辞書をそのまま復号化側にコピーして使用することで、
復号化している場合もあり、この場合には復号側での例
外処理は不要になる。

【００２４】

【発明が解決しようとする課題】前述した従来のＬＺＷ
符号においては、入力文字コード・データを相異なる文
字列に分けて符号化するとき、現在符号化中の各文字列
は以前の文字列とは独立に出現するとして符号化する形
式を用いている。しかしながら、従来の方式において
は、辞書が１つであるため、その再現する文字列を表わ
す符号には冗長性を有し、圧縮率の低下を招いてた。し
かしながら、データの増加に伴い、さらに圧縮率の高い
方式が要求されている。

【００２５】本発明は圧縮率を高めたデータ圧縮方式と
その圧縮してデータを復元する復元方式を提供すること
を目的とする。

【００２６】

【課題を解決するための手段とその作用】本発明は第１
には符号化済データを相異なる部分列に分けて辞書に登
録しておき、入力データを前記辞書中の部分列のうちの
最大長と一致するものの番号で指定して符号化する方式
におけるものである。

【００２７】複数個設けた辞書に対して検索を行い、最
長の文字列を表わせる辞書を選択して、選択された辞書
の参照番号で指定して符号化する。入力文字に対して入
力文字の繰り返しを表わせる最長の文字列を辞書から参
照し、最長の文字列を表わせる辞書を選択し、その参照
番号で符号化する。復号時には選択した辞書がわかるの
で辞書の選択指示を必要とせず、高圧縮率をなすことが
できる。

【００２８】また、復号においては、複数個設けた辞書
に対して検索を行い、最長の文字列を復号できる辞書を
選択しその選択した辞書の参照番号から復号化を行う。
この時、上述の最長の文字列を復号できる辞書を選択す
るので上述したデータ圧縮時の辞書の指示を必要とせ
ず、圧縮における高効率化とそれによって圧縮したデー
タを復元することができる。

【００２９】

【実施例】以下、図面を用いて本発明を詳細に説明す
る。本発明はデータ圧縮並びに復元方式におけるもので
あり、回路によって構成することも又プロセッサのソフ
トウェアによって処理を行うこともできる。以下ではプ
ロセッサを用いた時のフローを用いて詳細に説明する。
図１は本発明による符号化方式の符号化アルゴリズムの
フローチャートである。本発明は複数（ＤＮ個）の各辞
書Ｄ_i（ｉ＝１，・・・ＤＮ）に１文字からなる文字列
全種を初期値として予め登録する。そして各辞書の参照
番号の総数をｎ（ｉ）で管理し、初期化のとき、ＤＮ個
のｎ_i（文字種＋１）をセットする。１文字を入力した
時はＬＺＷ符号と手順は同様である。また従来のＬＺＷ
符号では辞書は１個だけであったのに対して本発明の実
施例においては複数個の辞書に対して文字列の照合を行
い、一番長い文字列を符号化できた辞書の参照番号を実
際の符号化に使用している。使用された辞書Ｄ_Noへの登
録後は、Ｄ_Noの参照番号数を管理するｎ_Noが１つインク
リメントされる。この時文字列照合の結果文字列の長さ
が同じ長さになった場合には、乱数により辞書を決定す
る。

【００３０】さらにその処理を詳細に説明する。入力バ
ッファに圧縮すべきデータが入力すると、図１の処理を
実行する。まず第１番目の文字を含むように辞書を初期
化する。この初期化では文字ｉを辞書アドレスｉに登録
し、各辞書の参照番号の個数ｎを初期化する。これは for （ｉ＝１ to DN）ＮＭＩＮ→ｎ；を表わすものである。但し、ＮＭＩＮは（文字の処理＋
１）である。

【００３１】さらに入力した最初の文字Ｋを語頭文字列
（prefix string)ω；として登録する（Ｓ１）。初期設
定（Ｓ１）の後、次の文字入力Ｋを読み（Ｓ２）、つづ
いて文字Ｋがあるか否かを判別（Ｓ３）する。文字Ｋが
存在する時（Ｙ）にはｎ個分の分割辞書検索を行い、最
大符号化できる辞書番号を求める。この検索は後述詳細
に説明するが、辞書を指定しなくても最大符号化できる
辞書番号は辞書に依存するので復号時にその辞書番号を
指示しなくても求めることが出来る。ここで求めた辞書
番号からその辞書に対しcode（ω）を出力し、ωＫを辞
書Ｄ_No（ｎ_No）に登録し、Ｋをωとしｎ_No＋１をｎ_Noと
する。この処理（Ｓ５）の後再度判別（Ｓ３）より繰り
返す。

【００３２】判別（Ｓ３）において文字Ｋが存在しない
時には処理（Ｓ５）によって今まで求めたコードを出力
（Ｓ６）し、終了（ＥＮＤ）する。前述した処理（Ｓ
４）を更に詳細に表わすと図２の如くなる。処理（Ｓ
４）を実行開始すると先ず入力文字ポインタをテンポラ
リポインタレジスタｔｍｐに格納する（Ｓ７）。続いて
カウンタ（ＣＯＵＮＴ）に１を、また入力文字ポインタ
にテンポラリレジスタｔｍｐの内容を格納する。処理
（Ｓ７）における入力文字ポインタをテンポラリポイン
タレジスタｔｍｐに格納するのはＤＮ回繰り返す毎に入
力文字ポインタの先頭を設定するのに必要とするその値
を記憶するためである。すなわち、テンポラリポインタ
レジスタｔｍｐの内容を入力文字ポインタに再度格納す
るのは順次繰り返される辞書に対応して入力文字ポイン
タを以後行うべき位置、すなわちテンポラリポインタレ
ジスタｔｍｐに格納されている値（処理を開始時の入力
文字ポインタ）にするためである。

【００３３】処理（Ｓ８）に続いてωＫが辞書に存在す
るか否かを判別する（Ｓ９）。ωＫが辞書に存在する時
（Ｙ）にはωＫの値をωに格納し（Ｓ１０）、つづいて
次の文字Ｋを読むと共にカウント＋１をカウントに格納
する（Ｓ１１）。そして再度処理（Ｓ９）より繰り返
す。この繰り返しにより順次文字列が存在することとな
る。一方、判別処理（Ｓ９）により存在する文字列がな
いと判別した時（Ｎ）にはそこで文字列が終了している
のでカウント（count)値を保存する（Ｓ１２）。前述し
た処理（Ｓ８〜Ｓ１２）を順次繰り返し行う。この繰り
返しは辞書の数ＤＮ分行う（Ｓ１３）。そしてＤＮ回行
った後、保存したカウントの最大値を選択（Ｓ１４）し
（同数の場合は乱数で選択）、辞書番号ｉをNOに格納し
カウント＋テンポラリの値を入力文字ポインタとする
（Ｓ４）。そして、本処理を終了する。前述した処理に
よって各辞書対応で最大のカウントが変化し、最大値に
対応した辞書を選択するが、この選択は復号においても
同様であり、図４に示す如くコードを出力するωはその
辞書に対応したωであって、ωやその一部が辞書を指示
しているものではない。しかしながら、復号においてそ
の指示が自動的になされるので辞書を指示する必要はな
く、圧縮率を高めることができる。

【００３４】図３は本発明における復号化のアルゴリズ
ムのフローチャートである。復号化においても符号化と
同様に例えばプロセッサによってその処理を行う。本発
明の復号は符号化の逆の動作をするものであり、辞書の
初期化は符号化と同様である。復号においては入力した
符号ＣＯＤＥから参照番号ωを復号した後、最長に復元
される辞書から正式の辞書を決定して文字列を求め、符
号化と同様に最長の文字列が多数求まった場合には乱数
により決定する。この時、符号時と同じ乱数のシードを
使用することにより符号側で符号化した辞書と同じ辞書
を決定することができる。更にその処理を詳細に説明す
る。

【００３５】圧縮したデータを復号化する際、まずバッ
ファ等に圧縮すべきデータが格納される。この格納の
後、図３におけるプログラムを実行する。まず処理を開
始ＳＴＡＲＴすると、最初の符号を読み込み、ｃｏｄｅ
^-1（ＣＯＤＥ）をＯＬＤωとし、続いてω＝Ｄ（Ｋ）、
文字Ｋを出力、ＫをFINEcharに格納する処理を行う（Ｓ
２１）。続いて次の入力コードを読み取る（Ｓ２２）。
そして新たな符号があるかを判別（Ｓ２３）し、新たな
符号がない（Ｎ）には終了（ＥＮＤ）する。また、符号
が存在する時（Ｙ）には続いてｃｏｄｅ^-1（ＣＯＤＥ）
をωとし、ωをＩＮωとする（Ｓ２４）。続いてｎ個の
分割辞書検索処理（Ｓ２５）を実行し、最大符号化でき
る辞書番号を求める。そして辞書番号NOのＳＴＡＣＫが
空になるまでＳＴＡＣＫＴＯＰを出力し、ＰＯＰＳ
ＴＡＫする。また、復元文字列の第１文字をＦＩＮchar
に、また（ＯＬＤω，Ｋ）を辞書Ｄ_No（ｎ_No）に登録
し、さらにｎ_No＋１をｎ_No、ＩＮωをＯＬＤωとする
（Ｓ２６）。そして再度（Ｓ２２）より実行し順次これ
を繰り返す。

【００３６】さらに前述したｎ個の分割辞書検索（Ｓ２
５）について図４で説明する。分割辞書検索処理（Ｓ２
５）を実行開始すると、先ずＯＬＤcodeをＴＭＰ−ＯＬ
Ｄcodeに、ＦＩＮcharをＴＭＰ−ＦＩＮcharに、ωをＴ
ＭＰ−ωにそれぞれ格納する（Ｓ２７）。この処理は複
数の辞書を同一条件で検索する、すなわちそれぞれの辞
書に対応して同一条件からスタートするようにするため
に一時的に記憶するものである（Ｓ２７）。続いてＮ回
繰り返すためのイニシャル処理を行う（Ｓ２８）。この
処理は前述した処理Ｓ２７と逆の処理であり、各テンポ
ラリに格納したＴＭＰ−ＯＬＤcodeのデータをＯＬＤco
deに、ＴＭＰ−ＦＩＮcharのデータをＦＩＮcharに、Ｔ
ＭＰ−ωをωに、カウンタを１にする処理である（Ｓ２
９）。続いて判別処理（Ｓ２９）でωとｎとを比較しω
＝ｎであるならば、ＦＩＮcharを出力、ＯＬＤcodeをＣ
ＯＤＥに、Ｄ（ＩＮω）を（ＯＬＤcode，ＦＩＮchar）
に格納する（Ｓ３１）。また、ωがｎより小さいならば
辞書Ｄ_Noよりω′Ｋ＝Ｄ_No（ω）を判別し、等しい時
（Ｙ）にはＫをＰＵＳＨＳＴＡＣＫに、ω′をωに、
ＣＯＮＴ＋１をＣＯＮＴに設定し、再度判別（Ｓ３０）
を実行する。また、判別（Ｓ３０）において等しくない
と判別した時（Ｎ）にはＯＬＤcode，ＦＩＮchar，ω，
ＣＯＮＴ，ＳＴＡＣＫの内容を保存する（Ｓ３３）。ま
た、判別（Ｓ２９）においてωがカウント値ｎより大で
あるときには前述の処理を行わず次の辞書の処理に移
る。この前述した処理（Ｓ２８〜Ｓ３３）を分割辞書数
分ＤＮ回繰り返す。そしてその繰り返しの後最大のカウ
ント値を選択し同数の場合は乱数で選び辞書番号ｉをナ
ンバーとして出力する。また保存してあるＯＬＤcode，
ＦＩＮchar，ωを設定する（Ｓ３４）。

【００３７】なお、例外処理とし、符号化時に選択され
た最大一致長系列を示す参照番号が、他の分割辞書です
でに使用され、なおかつ、現在選択された系列よりも長
い系列を表す場合には、符号化する参照番号の前に選択
された辞書の番号を示す制御コードを符号化し、それに
続き、参照番号を符号化する。復号化においても、選択
番号を示す制御コードを検出したなら、指定された分割
辞書により復元を行う。

【００３８】以上のような動作により、復号時に符号値
と同様の処理を逆に行い複数の辞書が存在しても、その
辞書を指示されなくても復号側で求めることができ、例
えば圧縮して転送する等の場合にその圧縮率が高まり転
送効率を得ることが出来る。本発明の実施例ではプロセ
ッサによる処理を用いているがこれに限らず、例えば回
路等によって行うことも可能である。

【００３９】

【発明の効果】以上述べたように本発明によれば、複数
に分割した辞書により文字列を符号化できるため、従来
のＬＺＷ符号より高い圧縮率が得られるとともに、符号
が参照番号のみで表わされる簡単なアルゴリズムで実行
できる。

【図面の簡単な説明】

【図１】本発明による符号化方式の符号化アルゴリズム
のフローチャートである。

【図２】本発明による最大文字列検索のフローチャート
である。

【図３】本発明による復号化方式の復号化アルゴリズム
のフローチャートである。

【図４】本発明による分割辞書検索のフローチャートで
ある。

【図５】ユニバーサル符号化のアルゴリズムである。

【図６】ユニバーサル型ＺＬ符号の符号化の原理図であ
る。

【図７】従来のＬＺＷ符号化処理フロー図である。

【図８】従来のＬＺＷ復号化処理フロー図である。

【図９】ＬＺＷ符号化説明図である。

【図10】辞書構成例の説明図である。

【図11】ＬＺＷ復号化説明図である。

フロントページの続き (72)発明者中野泰彦神奈川県川崎市中原区上小田中1015番地富士通株式会社内 (56)参考文献特開昭63−151224（ＪＰ，Ａ) 特開平１−132222（ＪＰ，Ａ) (58)調査した分野(Int.Cl.⁷，ＤＢ名) H03M 7/40

Claims

(57)【特許請求の範囲】

【請求項１】符号化済データを相異なる部分列に分
け、該部分列に参照番号を付けて辞書に登録しておき、
入力データを前記辞書中の部分列のうちの最大長一致す
る部分列を前記参照番号で指定して符号化する方式にお
いて、複数個設けられた辞書に対して検索を行い、最長の文字
列を表わせる辞書を選択すると共に、該選択された辞書
に対し前記参照番号で指定して符号化することを特徴と
するデータ圧縮方式。
【請求項２】符号化済データを相異なる部分列に分
け、該部分列に参照番号を付けて辞書に登録しておき、
入力データを前記辞書中の部分列のうちの最大長一致す
る部分列を前記参照番号で指定して符号化したデータを
復元する方式において、複数個設けた辞書に対して検索を行い、最長の文字列を
復号できる辞書を選択し、該選択された辞書に対して前
記参照番号から復号化を行うことを特徴とするデータ復
元方式。