JPH07261977A - データ圧縮方法および装置ならびにデータ復元方法および装置 - Google Patents

データ圧縮方法および装置ならびにデータ復元方法および装置

Info

Publication number
JPH07261977A
JPH07261977A JP6045874A JP4587494A JPH07261977A JP H07261977 A JPH07261977 A JP H07261977A JP 6045874 A JP6045874 A JP 6045874A JP 4587494 A JP4587494 A JP 4587494A JP H07261977 A JPH07261977 A JP H07261977A
Authority
JP
Japan
Prior art keywords
code
character
character string
mode
matching
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP6045874A
Other languages
English (en)
Other versions
JP3397431B2 (ja
Inventor
Shigeru Yoshida
茂 吉田
Yoshiyuki Okada
佳之 岡田
Yasuhiko Nakano
泰彦 中野
Hironori Yahagi
裕紀 矢作
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP04587494A priority Critical patent/JP3397431B2/ja
Priority to US08/405,209 priority patent/US5673042A/en
Publication of JPH07261977A publication Critical patent/JPH07261977A/ja
Application granted granted Critical
Publication of JP3397431B2 publication Critical patent/JP3397431B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/3084Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction using adaptive string matching, e.g. the Lempel-Ziv method
    • H03M7/3086Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction using adaptive string matching, e.g. the Lempel-Ziv method employing a sliding window, e.g. LZ77
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • G06F16/90344Query processing by using string matching techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/005Statistical coding, e.g. Huffman, run length coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【目的】 データ圧縮方法および装置に関し、スライド
辞書型のZiv-Lempel符号の圧縮率を向上する。 【構成】 辞書101内に蓄積された符号化済みの文字
列の中から、符号化対象の文字列と最大長一致する一致
文字列を検索し、その一致長に応じて、符号化対象の文
字列そのものを1文字単位で符号として送出する生デー
タモードと、一致文字列の辞書101における位置に関
する情報及び一致長に関する情報を符号として送出する
複製モードとを切り換えるスライド辞書型のデータ圧縮
方法において、生データモードにおいて得られる相異な
る符号化結果と複製モードにおいて得られる相異なる符
号化結果とに対して一連の番号を与え、生データモード
および複製モードにおいて、それぞれ得られた符号化結
果に対応する番号を符号表を用いて符号化し、符号表を
組み替えて該当する番号に対応する符号長を減ずる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、スライド辞書型のZiv-
Lempel符号化方式を用いてデータを圧縮,復元するデー
タ圧縮方法および装置ならびにデータ復元方法および装
置に関するものである。
【0002】近年、情報処理技術の発達により、コンピ
ュータによって文字コード,ベクトル情報,画像など様
々な種類の膨大なデータが処理されるようになってい
る。このため、データの種類にかかわらず、データの中
の冗長な部分を省いてデータ量を圧縮する技術および圧
縮された情報を復元する技術が必要とされており、これ
に応じて、ユニバーサル符号化が提案されている。
【0003】Ziv-Lempel符号化方式(以下、ZL符号化方
式と称する)は、ユニバーサル符号化方式の代表的なも
のとして知られており(宗像清治著,「Ziv-Lempelデー
タ圧縮法」,情報処理,pp.2〜6,Vol.26,No.1,1985参
照)、そのアルゴリズムは、スライド辞書型と増分分解
型とに分けられる。特に、スライド辞書型のZL符号化方
式は、演算量は大きいが高い圧縮率が得られることが知
られており、スライド辞書型のアルゴリズムを改良した
ものとして、LZSS符号が提案されている(T.C.Bel
l,"Better OPM/L Text Compression",IEEE Trans. on C
ommun.,Vol.COM-34, No.12 Dec. 1986 参照)。また、
パソコンで利用されている書庫管理ソフト“LHA”も
その応用例である。
【0004】スライド辞書型のZL符号化方式は、既に符
号化した文字列の中から、符号化しようとする文字列に
最大長一致する部分列を検出し、検出した部分列の位置
とその一致長とを組み合わせて符号化する方法である。
【0005】ここで、上述した文字とは、データの1ワ
ード単位を示しており、複数ワードのデータの連なりが
文字列と呼ばれている。本明細書においても、文字およ
び文字列を同様の意味で用いる。
【0006】
【従来の技術】図22に、LZSS符号化方式を適用し
た従来のデータ圧縮装置の原理構成を示す。
【0007】図22において、Pバッファ201は、所
定の長さを有するバッファであり、既に符号化された入
力文字列を順次に格納する。また、このPバッファ20
1は、入力文字列を自身の容量まで格納した後は、新し
い文字列の入力に応じて、この文字列に相当する長さの
古い文字列を捨てて、新しい文字列を格納する構成とな
っている。
【0008】また、Qバッファ202は、符号化しよう
とする文字列を格納しており、マッチング部203は、
Qバッファ202内の文字列と最大長一致する文字列を
Pバッファ201から検索し、その一致開始位置と一致
長とを符号化部501に送出する構成となっている。
【0009】これに応じて符号化部501は、図23
(a) に示すように、kビットで表される一致開始位置と
mビットで表される一致長とを組み合わせて符号語を作
成し、ディスク装置などの補助記憶装置あるいは回線に
送出する。
【0010】例えば、上述したPバッファ201とQバ
ッファ202の容量をそれぞれ4kBと16Bとすると、
一致開始位置および一致長をそれぞれ12ビットおよび
4ビットで表すことができるから、図23(a) に示した
符号語の長さは2バイトとなる。
【0011】したがって、1文字を1バイトとすると、
Pバッファ201から3文字以上の一致長を持つ一致文
字列が検索された場合には、上述したようにして入力文
字列を圧縮することができる。特に、英文などのように
繰り返しの多い文字列が入力された場合には、データ量
を大幅に圧縮することが可能である。
【0012】LZSS符号化方式においては、一致長が
2文字以下である場合には、生データモードを選択し、
入力文字を符号化しないでそのまま符号語とする。一
方、一致長が3文字以上である場合は、複製モードを選
択し、上述したようにして、検索した一致文字列の開始
位置と一致長とを組み合わせた符号語を作成する。
【0013】また、各符号語が生データモードであるか
複製モードであるかを識別フラグによって示し、この識
別フラグを8個の符号語ごとにまとめて対応する符号語
の前に付加し、図23(b) に示すような最終的な符号語
の系列を生成している。
【0014】このように、LZSS符号化方式は、識別
フラグや符号語を固定長で表しており、これらをそれぞ
れ8ビット単位にまとめることによって処理の高速化を
図っている。
【0015】これに対して、入力データにおける文字の
出現確率に適応して、出現文字の符号長を動的に変化さ
せる可変長符号化方式の例として、スプレイ符号化(Sp
lay-tree coding )方法がある (D.W.Jones,"Applicati
on of Splay Trees to DataCompression",Communicatio
n of ACM. Vol.31,No.8,Aug 1988 参照)。
【0016】スプレイ符号化法は、符号表として、各文
字に対応する符号を2分探索木の葉として登録した符号
の木を備えており、入力文字を符号化するごとに、該当
する符号の長さが半分になるように符号の木を組み替え
ていくことにより、動的な符号化を行うものである。
【0017】図24に、5つの文字A,B,C,D,E
からなる文字列を符号化する場合を例にとって、スプレ
イ符号化法を説明する図を示す。図24(a) は、図24
(b) に示す符号表を表す符号の木であり、図24(c),
(d) は、文字Cの符号化に伴う符号の木の組み替え過程
および組み替え結果を示し、図24(e) は、符号の木を
組み替えて得られる新しい符号表を示している。
【0018】この例では、まず、文字Cの親の節(図2
4において符号zで示す)と同じ深さの要素である文字
Bと文字Cとを交換し(図24(c) 参照)、更に、その
親の節(図24において符号yで示す)と文字Eとを交
換することにより(図24(d) 参照)、文字Cに対応す
る符号の長さを4ビットから半分の2ビットにしている
(図24(b),(e) 参照)。
【0019】この方法は、ダイナミック・ハフマン符号
化や適応多値算術符号化などの動的可変長符号化方法に
比べて、アルゴリズムの実現が容易で、かつ、高速処理
が可能であるため、注目されている。
【0020】
【発明が解決しようとする課題】上述したLZSS方式
は、生データあるいは一致開始位置と一致長との組み合
わせをそれぞれ固定長で表している。すなわち、生デー
タモードにおける各文字の出現確率や複製モードにおけ
る一致開始位置および一致長の出現確率がほぼ均等であ
ることを前提としている。同様に、生データモードと複
製モードとがほぼ等確率で出現することを前提として、
各符号語に1ビットの識別フラグを付加している。
【0021】しかしながら、一般に、各文字の出現確率
は均等ではないし、入力文字列に対応する一致文字列が
検索される確率は、入力文字列に近い部分のほうが高い
と考えられるから、一致開始位置をPバッファ201の
アドレスで表した場合には、比較的小さい値のアドレス
が多く出現すると考えられる。
【0022】また、Qバッファ202内の入力文字列の
全て(16文字)に一致する一致文字列がPバッファ2
01から検索される確率よりも、一致長が3〜5文字の
一致文字列が検索される確率のほうが大きいことも明白
である。
【0023】更に、符号化処理を開始した当初とPバッ
ファ201の容量程度まで入力データを符号化したとき
とでは、生データモードと複製モードとの出現確率も違
いがある。なぜならば、最初はPバッファ201内に符
号化済みの文字列が格納されていない状態で処理が開始
され、符号化処理の進行に伴って符号化済みの文字列が
Pバッファ201に蓄積されていくから、Pバッファ2
01内の符号化済みの文字列が少ないうちは、生データ
モードで符号化される確率のほうが大きく、その後、次
第に複製モードで符号化される確率のほうが大きくなっ
ていくと考えられるからである。例えば、入力データが
英文などであった場合には、符号化処理の開始当初は生
データで符号化される確率が100パーセントであった
ものが、Pバッファ201の容量程度まで符号化済みの
文字列が蓄積された状態では、複製モードで符号化され
る確率が80パーセント近くまで増大する。
【0024】従来のLZSS符号化方式においては、各
文字や一致文字列の位置および長さや生データモードと
複製モードの出現確率のかたよりにかかわらず、それぞ
れに固定長を与えて符号化していたために、特に、符号
化処理を開始した当初やPバッファ201の容量に比べ
て小さい入力データを符号化した場合において、符号化
能率が低下していた。また、漢字仮名混じりの和文やオ
ブジェクトコードのような冗長性の低いデータを符号化
した場合には、各文字の出現確率の偏りを考慮していな
いために、圧縮率が極めて低下してしまう。
【0025】上述したLZSS符号化方式のように、ス
ライド辞書型の符号化結果を固定長符号化すると、圧縮
処理を高速に行うことができるが、入力データの統計的
な性質や圧縮処理の経過によっては圧縮率が低下してし
まう。
【0026】このようなスライド辞書型の符号化方式の
短所を補って、圧縮率を向上するための手法として、ス
ライド辞書型の符号化方式による符号化結果を可変長符
号化する方法も提案されている。
【0027】スライド辞書型の符号化方式と組み合わさ
れる可変長符号化方法としては、動的ハフマン符号化す
る方法(LHarc)、算術符号化する方法(LHAR
I)、そして、所定の入力データ長ごとに符号表を一括
して作成し、この符号表を用いてハフマン符号化する方
法(LHA)などが提案されており、フリーソフトとし
て発表されている。しかし、これらの可変長符号化方法
は処理速度が遅く、元のLZSS符号化方式の処理速度
の数分の1程度にまで処理速度が低下してしまう。
【0028】なお、動的ハフマン符号化方法に関して
は、J. S. Vitter : "ALGORITHM 673Dynamic Huffman C
oding",ACM Trans. on Mathmatical Software,Vol.15,N
o.2,June 1989,Pages 158-167 を参照されたい。また、
算術符号化に関しては、I.H.Witten他:"Arithmetic Cod
ing for Data Compression", Communication of theAC
M,Vol.30,No.6,June 1987,Pages 520-540 を参照された
い。
【0029】ところで、上述したスプレイ符号化方法
は、動的可変長符号化方法の1つであり、符号の木を動
的に組み替えることにより、入力データの統計的な性質
にかかわらず、ある程度の圧縮率を得ることができると
ともに、高速処理が可能であるという特徴を持ってい
る。
【0030】しかしながら、この方法は、あくまでも入
力データを1文字単位で符号化するものであるから、文
字列としての冗長性はそのまま符号語の系列に残された
ままである。このため、英文などの冗長性の高い入力デ
ータを符号化した場合でも、LZSS符号化方式による
ほどの圧縮率は得られない。
【0031】本発明は、スライド辞書型のZL符号化方式
によって、入力データの統計的な性質にかかわらず、高
い圧縮率を得ることが可能なデータ圧縮方法および装置
を提供することを目的とする。また、このデータ圧縮方
法および装置で作成された符号データから元のデータを
復元するデータ復元方法および装置を提供することを目
的とする。
【0032】
【課題を解決するための手段】図1は、本発明のデータ
圧縮方法の原理を示す図である。請求項1の発明は、辞
書101内に蓄積された符号化済みの文字列のなかか
ら、符号化対象の文字列と最大長一致する一致文字列を
検索し、その一致長に応じて、符号化対象の文字列その
ものを1文字単位で符号として送出する生データモード
と、一致文字列の辞書101における位置に関する情報
および一致長に関する情報を符号として送出する複製モ
ードとを切り換えるスライド辞書型のデータ圧縮方法に
おいて、生データモードにおいて得られる相異なる符号
化結果と複製モードにおいて得られる相異なる符号化結
果とに対して一連の番号を与え、生データモードおよび
複製モードにおいて、それぞれ得られた符号化結果に対
応する番号を符号表を用いて符号化し、符号表を該当す
る符号に着目して組み替え、該当する符号の符号長を減
ずることを特徴とする。
【0033】請求項2の発明は、請求項1に記載のデー
タ圧縮方法において、生データモードにおける符号化結
果として得られる文字と複製モードにおいて得られる相
異なる符号化結果とに対して一連の番号を与えることを
特徴とする。
【0034】請求項3の発明は、請求項1に記載のデー
タ圧縮方法において、生データモードにおける相異なる
符号化結果と複製モードにおいて得られる相異なる一致
長とに対して一連の番号を与えることを特徴とする。
【0035】請求項4の発明は、請求項3に記載のデー
タ圧縮方法において、複製モードにおいて、一致文字列
の位置に関する情報の少なくとも一部を符号表を用いて
符号化し、符号表を該当する符号に着目して組み替え、
該当する符号の符号長を減ずることを特徴とする。
【0036】請求項5の発明は、請求項1に記載のデー
タ圧縮方法において、生データモードにおける相異なる
符号化結果と複製モードにおいて一致文字列の位置とし
て得られるアドレスの少なくとも一部のビット列につい
て考えられる全ての組み合わせとに対して一連の番号を
与えることを特徴とする。
【0037】請求項6の発明は、請求項5に記載のデー
タ圧縮方法において、複製モードにおいて、一致長に関
する情報を符号表を用いて符号化し、符号表を該当する
符号に着目して組み替え、該当する符号の符号長を減ず
ることを特徴とする。
【0038】請求項7の発明は、請求項1のデータ圧縮
方法において、生データモードにおける符号化結果とし
て得られる文字の上位部分のビット列について考えられ
る組み合わせのそれぞれと複製モードにおける相異なる
符号化結果とに対して一連の番号を与え、文字の上位部
分のビット列の組み合わせのそれぞれに対応して、文字
の下位部分のビット列の組み合わせに対して番号を与え
た符号表を設け、生データモードにおいて、符号化結果
として得られた文字の上位部分に対応する符号表によっ
て示される文字の下位部分に与えられた番号をその出現
確率に応じて可変長符号化することを特徴とする。
【0039】図2は、請求項8ないし請求項11のデー
タ圧縮装置の原理ブロック図である。請求項8の発明
は、辞書101内に蓄積された符号化済みの文字列のな
かから、マッチング手段102により、符号化対象の文
字列と最大長一致する一致文字列を検索し、その一致長
に応じて、符号化手段103が、符号化対象の文字列そ
のものを1文字単位で符号として送出する生データモー
ドと、一致文字列の辞書101における位置に関する情
報および一致長に関する情報を符号として送出する複製
モードとを切り換えながら動作するスライド辞書型のデ
ータ圧縮装置において、生データモードにおいて符号化
手段103で得られる各文字と複製モードにおいて得ら
れる一致長とに与えられた一連の番号に対応する符号を
符号の木の形式で保持する符号表111と、生データモ
ードにおける文字および複製モードにおける一致長の入
力に応じて、それぞれに対応する符号を符号表111か
ら検索して出力するとともに、該当する符号の長さが半
分になるように符号の木を組み替えるスプレイ符号化手
段112とを備えたことを特徴とする。
【0040】請求項9の発明は、請求項8のデータ圧縮
装置において、複製モードにおいて、符号化手段103
によって一致文字列の位置を示す情報として得られるア
ドレスの少なくとも一部のビット列について考えられる
各組み合わせに対応する符号を登録した符号の木を保持
する符号表113と、アドレスの少なくとも一部の入力
に応じて符号表113を参照し、該当する符号を出力す
るとともに、該当する符号の長さが半分になるように符
号の木を組み替えるスプレイ符号化手段114とを備え
たことを特徴とする。
【0041】請求項10の発明は、辞書101内に蓄積
された符号化済みの文字列のなかから、マッチング手段
102により、符号化対象の文字列と最大長一致する一
致文字列を検索し、その一致長に応じて、符号化手段1
03が、符号化対象の文字列そのものを1文字単位で符
号として送出する生データモードと、一致文字列の辞書
101における位置に関する情報および一致長に関する
情報を符号として送出する複製モードとを切り換えなが
ら動作するスライド辞書型のデータ圧縮装置において、
生データモードにおいて符号化手段103で得られる各
文字と複製モードにおいて一致文字列の位置として得ら
れるアドレスの少なくとも一部のビット列について考え
られる各組み合わせとに与えられた一連の番号に対応す
る符号を符号の木の形式で保持する符号表115と、生
データモードにおける文字および複製モードにおけるア
ドレスの少なくとも一部の入力に応じて、それぞれに対
応する符号を符号表115から検索して出力するととも
に、該当する符号の長さが半分になるように符号の木を
組み替えるスプレイ符号化手段116とを備えたことを
特徴とする。
【0042】請求項11の発明は、請求項10のデータ
圧縮装置において、複製モードにおいて、符号化手段1
03による符号化結果として得られる各一致長に対応す
る符号を登録した符号の木を保持する符号表117と、
一致長の入力に応じて符号表117を参照し、該当する
符号を出力するとともに、該当する符号の長さが半分に
なるように符号の木を組み替えるスプレイ符号化手段1
18とを備えたことを特徴とする。
【0043】図3は、請求項12のデータ圧縮装置の原
理ブロック図である。請求項12の発明は、辞書101
内に蓄積された符号化済みの文字列のなかから、マッチ
ング手段102により、符号化対象の文字列と最大長一
致する一致文字列を検索し、その一致長に応じて、符号
化手段103が、符号化対象の文字列そのものを1文字
単位で符号として送出する生データモードと、一致文字
列の辞書101における位置に関する情報および一致長
に関する情報を符号として送出する複製モードとを切り
換えながら動作するスライド辞書型のデータ圧縮装置に
おいて、生データモードにおいて符号化手段103で得
られる文字を表すビット列の上位部分について考えられ
る各組み合わせと複製モードにおいて得られる相異なる
符号化結果とに与えられた一連の番号に対応する符号を
符号の木の形式で保持する符号表121と、文字の上位
部分のそれぞれに対応して、文字の下位部分のビット列
の各組み合わせに与えた符号を符号の木の形式でそれぞ
れ保持する符号表122と、生データモードにおける文
字の上位部分および複製モードにおける符号化結果の入
力に応じて、それぞれに対応する符号を符号表121か
ら検索して出力するとともに、該当する符号の長さが半
分になるように符号の木を組み替えるスプレイ符号化手
段123と、文字の上位部分に応じて符号表122から
該当する符号の木を選択し、生データモードで得られる
文字の下位部分に対応する符号を検索して出力するとと
もに、該当する符号の長さが半分になるように符号の木
を組み替えるスプレイ符号化手段124とを備えたこと
を特徴とする。
【0044】図4は、本発明のデータ復元方法の原理を
示す図である。請求項13の発明は、辞書内に蓄積され
た符号化済みの文字列のなかから、符号化対象の文字列
と最大長一致する一致文字列を検索し、その一致長に応
じて、符号化対象の文字列そのものを1文字単位で符号
として送出する生データモードと、一致文字列の辞書に
おける位置に関する情報および一致長に関する情報を符
号として送出する複製モードとを切り換えるスライド辞
書型のデータ圧縮方法によって得られる符号から元の文
字列を復元するデータ復元方法において、生デー生デー
タモードにおいて得られる相異なる符号化結果と複製モ
ードにおいて得られる相異なる符号化結果とに対して一
連の番号を与えて、それぞれの番号に対応する符号を登
録した第1の符号表を用意し、第1の符号表に基づい
て、入力される符号から一連の番号のいずれかに対応す
る第1符号を抽出して、第1の符号表を用いて復号し、
第1の符号表を該当する符号に着目して組み替えて、該
当する符号の長さを減じ、第1符号の復号結果として得
られる番号に基づいて、第1符号が生データモードであ
るか複製モードであるかを判別し、番号で示される符号
化結果に対して、該当する符号化モードに応じた復元処
理を行うことを特徴とする。
【0045】請求項14の発明は、請求項13に記載の
データ復元方法において、生データモードにおける符号
化結果として得られる文字と複製モードにおいて得られ
る相異なる符号化結果とに対して一連の番号を与え、第
1符号が生データモードである場合に、第1符号の復号
結果として得られた番号に対応する文字を復元文字列と
して出力するとともに辞書に蓄積することを特徴とす
る。
【0046】請求項15の発明は、請求項13に記載の
データ復元方法において、生データモードにおける相異
なる符号化結果と複製モードにおいて得られる相異なる
一致長とに対して一連の番号を与え、第1符号が複製モ
ードである場合に、第1符号の復号結果として得られた
番号から一致長を得ることを特徴とする。
【0047】請求項16の発明は、請求項15に記載の
データ復元方法において、一致文字列の位置に関する情
報の少なくとも一部に対応する符号を登録した第2の符
号表を用意しておき、第1符号が複製モードである場合
に、第1符号に続く第2符号を第2の符号表に基づいて
抽出し、第2符号を第2の符号表を用いて復号して、一
致文字列の位置に関する情報の少なくとも一部を復元
し、第2の符号表を該当する符号に着目して組み替え
て、該当する符号の長さを減ずることを特徴とする。
【0048】請求項17の発明は、請求項13に記載の
データ復元方法において、生データモードにおける相異
なる符号化結果と複製モードにおいて一致文字列の位置
として得られるアドレスの少なくとも一部のビット列に
ついて考えられる全ての組み合わせとに対して一連の番
号を与え、この一連の番号に対応する符号を登録した第
1の符号表を用意し、複製モードの第1符号の入力に応
じて、第1符号の復号結果として得られる番号に対応す
るアドレスの少なくとも一部を得ることを特徴とする。
【0049】請求項18の発明は、請求項17に記載の
データ復元方法において、一致長にに対応する符号を登
録した第2の符号表を用意しておき、第1符号が複製モ
ードである場合に、第1符号に続く第2符号として第2
の符号表に基づいて抽出し、第2符号を第2の符号表を
用いて復号して一致長を復元し、第2の符号表を該当す
る符号に着目して組み替えて、該当する符号の長さを減
じることを特徴とする。
【0050】請求項19の発明は、請求項13のデータ
復元方法において、生データモードにおける符号化結果
として得られる文字の上位部分のビット列について考え
られる組み合わせのそれぞれと複製モードにおける相異
なる符号化結果とに対して一連の番号を与え、文字の上
位部分のビット列の組み合わせのそれぞれに対応して、
文字の下位部分のビット列の組み合わせに対して番号を
与えた符号表を設け、第1符号が生データである場合
に、第1符号の可変長復号結果として得られる番号から
文字の上位部分を復元し、第1符号に続く可変長符号を
第2符号として抽出し、文字の上位部分に対応する符号
表を用いて、第2符号を可変長復号して、文字の下位部
分を得ることを特徴とする。
【0051】図5は、請求項20ないし請求項23のデ
ータ復元装置の原理ブロック図である。請求項20の発
明は、辞書内に蓄積された符号化済みの文字列のなかか
ら、符号化対象の文字列と最大長一致する一致文字列を
検索し、その一致長に応じて、符号化対象の文字列その
ものを1文字単位で符号として送出する生データモード
と、一致文字列の辞書における位置に関する情報および
一致長に関する情報を符号として送出する複製モードと
を切り換えるスライド辞書型のデータ圧縮方法によって
得られる符号の入力に応じて、復元処理手段130が元
の文字列を復元し、辞書104に蓄積するデータ復元装
置において、復元処理手段130が、生データモードに
おいて得られる各文字と複製モードにおいて得られる一
致長とに与えられた一連の番号に対応する符号を符号の
木の形式で保持する符号表131と、入力される符号か
ら可変長符号を第1符号として抽出する抽出手段132
と、第1符号を符号表131を用いてスプレイ復号化
し、該当する番号を出力するとともに、該当する符号の
長さが半分になるように符号の木を組み替えるスプレイ
復号手段133と、第1符号の復号結果として得られる
番号に基づいて、第1符号が生データモードであるか複
製モードであるかを判別する判別手段134と、生デー
タモードである旨の判別結果の入力に応じて、番号から
文字を得て復元文字列として出力し、複製モードである
旨の判別結果の入力に応じて、番号から得られる一致長
に基づいて辞書104から一致文字列を検索し、復元文
字列として出力する文字列復元手段135とを備えた構
成であることを特徴とする。
【0052】請求項21の発明は、請求項20のデータ
復元装置において、復元処理手段130が、複製モード
において、一致文字列の位置を示す情報として得られる
アドレスの少なくとも一部のビット列について考えられ
る各組み合わせに対応する符号を登録した符号の木を保
持する符号表136と、可変長符号の入力に応じて符号
表136を参照し、該当するビット列を出力するととも
に、該当する符号の長さが半分になるように符号の木を
組み替えるスプレイ復号手段137とを備え、抽出手段
132が、第1符号が複製モードである旨の判別結果の
入力に応じて、第1符号に続く可変長符号を第2符号と
して抽出し、スプレイ復号手段137に送出する構成で
あり、文字列復元手段135は、複製モードである旨の
判別結果に応じて、スプレイ復号手段133で得られる
番号で示される一致長と、スプレイ復号手段137で得
られるビット列で示されるアドレスとに基づいて、辞書
104から一致文字列を検索する構成であることを特徴
とする。
【0053】請求項22の発明は、辞書内に蓄積された
符号化済みの文字列のなかから、符号化対象の文字列と
最大長一致する一致文字列を検索し、その一致長に応じ
て、符号化対象の文字列そのものを1文字単位で符号と
して送出する生データモードと、一致文字列の辞書にお
ける位置に関する情報および一致長に関する情報を符号
として送出する複製モードとを切り換えるスライド辞書
型のデータ圧縮方法によって得られる符号の入力に応じ
て、復元処理手段130が元の文字列を復元し、辞書1
04に蓄積するデータ復元装置において、復元処理手段
130が、生データモードにおいて得られる各文字と複
製モードにおいて得られる一致文字列の位置として得ら
れるアドレスの少なくとも一部のビット列について考え
られる各組み合わせとに与えられた一連の番号に対応す
る符号を符号の木の形式で保持する符号表141と、入
力される符号から可変長符号を第1符号として抽出する
抽出手段132と、第1符号を符号表141を用いてス
プレイ復号化し、該当する番号を出力するとともに、該
当する符号の長さが半分になるように符号の木を組み替
えるスプレイ復号手段142と、第1符号の復号結果と
して得られる番号に基づいて、第1符号が生データモー
ドであるか複製モードであるかを判別する判別手段13
4と、生データモードである旨の判別結果の入力に応じ
て、番号から文字を得て復元文字列として出力し、複製
モードである旨の判別結果の入力に応じて、番号から得
られるアドレスの少なくとも一部に基づいて辞書104
から一致文字列を検索し、復元文字列として出力する文
字列復元手段143とを備えた構成であることを特徴と
する。
【0054】請求項23の発明は、請求項22のデータ
復元装置において、復元処理手段130が、複製モード
において得られる各一致長に対応する符号を登録した符
号の木を保持する符号表144と、可変長符号の入力に
応じて符号表144を参照し、該当する一致長を出力す
るとともに、該当する符号の長さが半分になるように符
号の木を組み替えるスプレイ復号手段145とを備え、
抽出手段132が、第1符号が複製モードである旨の判
別結果の入力に応じて、第1符号に続く可変長符号を第
2符号として抽出し、スプレイ復号手段145に送出す
る構成であり、文字列復元手段143は、複製モードで
ある旨の判別結果に応じて、スプレイ復号手段142で
得られる番号で示されるアドレスと、スプレイ復号手段
145で得られる一致長とに基づいて、辞書104から
一致文字列を検索する構成であることを特徴とする。
【0055】請求項24の発明は、辞書内に蓄積された
符号化済みの文字列のなかから、符号化対象の文字列と
最大長一致する一致文字列を検索し、その一致長に応じ
て、符号化対象の文字列そのものを1文字単位で符号と
して送出する生データモードと、一致文字列の辞書にお
ける位置に関する情報および一致長に関する情報を符号
として送出する複製モードとを切り換えるスライド辞書
型のデータ圧縮方法によって得られる符号の入力に応じ
て、復元処理手段130が元の文字列を復元し、辞書1
04に蓄積するデータ復元装置において、復元処理手段
130が、生データモードにおいて得られる文字を表す
ビット列の上位部分について考えられる各組み合わせと
複製モードにおいて得られる相異なる符号化結果とに与
えられた一連の番号に対応する符号を符号の木の形式で
保持する符号表151と、文字の上位部分のそれぞれに
対応して、文字の下位部分のビット列の各組み合わせに
与えた符号を符号の木の形式でそれぞれ保持する符号表
152と、入力される符号から可変長符号を第1符号と
して抽出する抽出手段132と、第1符号を符号表15
1を用いてスプレイ復号化し、該当する番号を出力する
とともに、該当する符号の長さが半分になるように符号
の木を組み替えるスプレイ復号手段153と第1符号の
復号結果として得られる番号に基づいて、第1符号が生
データモードであるか複製モードであるかを判別する判
別手段134と、生データモードである旨の判別結果の
入力に応じて、第1符号に続く可変長符号を第2符号と
して抽出する抽出手段154と、生データモードである
旨の判別結果に応じて、スプレイ復号手段153で得ら
れた番号で示される文字の上位部分に応じて符号表15
2から該当する符号の木を選択し、第2符号をスプレイ
復号化して文字の下位部分を出力するとともに、該当す
る符号の長さが半分になるように符号の木を組み替える
スプレイ符号化手段155と、生データモードである旨
の判別結果の入力に応じて、スプレイ復号手段153で
得られる番号で示される文字の上位部分とスプレイ復号
手段155から得られる文字の下位部分とを結合して復
元文字列として出力し、複製モードである旨の判別結果
の入力に応じて、番号で示される符号化結果に基づいて
辞書104から一致文字列を検索し、復元文字列として
出力する文字列復元手段156とを備えた構成であるこ
とを特徴とする。
【0056】
【作用】請求項1の発明は、生データモードの符号化結
果と複製モードの符号化結果とに一連の番号を与え、こ
の番号をスプレイ符号化の手法により動的に可変長符号
化することにより、生データモードと複製モードとの出
現確率の偏りと2つのモードそれぞれにおける各符号化
結果の出現確率の偏りとを利用して、LZSS符号化方
式による符号化結果をさらに圧縮することができる。
【0057】更に、請求項2の発明は、生データモード
の符号化結果として得られる文字を複製モードの符号化
結果と組み合わせて、スプレイ符号化の手法により動的
に可変長符号化することにより、入力文字列における各
文字の出現確率の偏りを利用して、LZSS符号化方式
による生データモードの符号化結果を圧縮することがで
きる。
【0058】また、請求項3の発明は、複製モードの符
号化結果として得られる一致長を生データモードの符号
化結果と組み合わせて、スプレイ符号化の手法により動
的に可変長符号化することにより、辞書101から検索
される一致文字列の長さの分布の偏りを利用して、LZ
SS符号化方式による複製モードの符号化結果を圧縮す
ることができる。
【0059】更に、請求項4で述べたように、複製モー
ドの符号化結果として得られる一致文字列の位置を示す
アドレスの少なくとも一部に対してもスプレイ符号化の
手法を適用し、これを動的に可変長符号化することによ
り、辞書101から検索される一致文字列の位置の分布
の偏りを利用して、LZSS符号化方式による複製モー
ドの符号化結果を圧縮することができる。
【0060】また、請求項5の発明は、複製モードの符
号化結果として得られる一致文字列の位置を示すアドレ
スの一部を生データモードの符号化結果と組み合わせ
て、スプレイ符号化の手法により動的に可変長符号化す
ることにより、辞書101から検索される一致文字列の
位置の分布の偏りを利用して、LZSS符号化方式によ
る複製モードの符号化結果を圧縮することができる。
【0061】更に、請求項6で述べたように、複製モー
ドの符号化結果として得られる一致長に対してもスプレ
イ符号化の手法を適用し、これを動的に可変長符号化す
ることにより、辞書101から検索される一致文字列の
長さの分布の偏りを利用して、LZSS符号化方式によ
る複製モードの符号化結果を圧縮することができる。
【0062】また、請求項7の発明は、生データモード
の符号化結果として得られる文字の上位部分と下位部分
とを分割し、上位部分を複製モードの符号化結果と組み
合わせて可変長符号化し、更に、文字の下位部分を上位
部分に従属して可変長符号化するものである。これによ
り、画像データのように、下位部分にランダムな成分を
含む情報が入力文字列として入力された場合において
も、文字の上位部分にある冗長性を利用して、LZSS
符号化方式による生データモードの符号化結果を圧縮す
ることができる。更に、文字の下位部分を上位部分に従
属して可変長符号化することにより、文字の上位部分と
下位部分とのあいだに相関がある場合にも柔軟に対応
し、LZSS符号化方式による生データモードの符号化
結果を圧縮することができる。
【0063】請求項8の発明は、符号表111に保持さ
れた符号の木を用いて、スプレイ符号化手段112が生
データモードにおける文字と複製モードにおける一致長
とをスプレイ符号化することにより、生データモードと
複製モードとの出現確率の偏りと生データモードにおけ
る各文字の出現確率および複製モードにおける各一致長
の出現確率の偏りとを利用して、LZSS符号化方式で
得られる両モードの符号化結果を圧縮することができ
る。
【0064】請求項9の発明は、更に、符号表113に
保持された符号の木を用いて、スプレイ符号化手段11
4が複製モードの符号化結果として得られるアドレスの
少なくとも一部をスプレイ符号化することにより、一致
文字列の出現位置の偏りを利用して、LZSS符号化方
式の複製モードにおける符号化結果を一層圧縮すること
ができる。
【0065】請求項10の発明は、符号表115に保持
された符号の木を用いて、スプレイ符号化手段116が
生データモードにおける文字と複製モードにおけるアド
レスの少なくとも一部とをスプレイ符号化することによ
り、生データモードと複製モードとの出現確率の偏りと
生データモードにおける各文字の出現確率および複製モ
ードにおける一致文字列の出現位置の偏りとを利用し
て、LZSS符号化方式で得られる両モードの符号化結
果を圧縮することができる。
【0066】請求項11の発明は、更に、符号表117
に保持された符号の木を用いて、スプレイ符号化手段1
18が複製モードの符号化結果として得られる一致長を
スプレイ符号化することにより、各一致長の出現確率の
偏りを利用して、LZSS符号化方式の複製モードにお
ける符号化結果を一層圧縮することができる。
【0067】請求項12の発明は、符号表121に保持
された符号の木を用いて、スプレイ符号化手段123
が、生データモードにおける文字の上位部分と複製モー
ドにおける符号化結果とをスプレイ符号化することによ
り、生データモードと複製モードとの出現確率の偏りと
文字の上位部分のビット列の出現確率の偏りを利用し
て、LZSS符号化方式で得られる両モードの符号化結
果を圧縮することができる。このように、文字の上位部
分に注目してスプレイ符号化することにより、画像デー
タのように、各文字の下位部分にランダムな成分が含ま
れているために文字全体としての出現確率に偏りが見ら
れない情報にも柔軟に対応して、文字の上位部分で示さ
れる規則性を利用して、入力文字列の圧縮を図ることが
できる。
【0068】また、スプレイ符号化手段124が、符号
表122内の該当する符号の木を用いて、文字の下位部
分を文字の上位部分に従属してスプレイ符号化すること
により、テキストデータなどのように、文字の上位部分
のビット列と下位部分のビット列との間に相関関係があ
る情報にも柔軟に対応し、文字としての出現確率の偏り
を利用して、入力文字列の圧縮を図ることができる。
【0069】請求項13の発明は、入力符号から抽出し
た第1符号をスプレイ復号化の手法を適用して復号し、
得られた番号に基づいて、該当する符号が生データモー
ドであるか複製モードであるかを判別し、この判別結果
に応じて、上述した番号に対応するLZSS符号化方式
による符号化結果を得るものである。
【0070】ここで、生データモードにおける符号化結
果と複製モードにおける符号化結果とには、請求項1の
方法と同様に一連の番号が与えられているから、復号結
果として得られる番号と、2つの符号化結果の境目の番
号とを比較することにより、符号化モードを判別するこ
とができるから、請求項1の方法による符号から、両モ
ードにおける符号化結果をそれぞれ復元することができ
る。
【0071】また、このようにして得られた符号化結果
に基づいて、従来と同様の復元処理を行うことにより、
請求項1の方法で得られた符号データから元の文字列を
復元することができる。
【0072】請求項14の発明は、請求項2の方法と同
様に、生データモードにおける文字と複製モードにおけ
る符号化結果とに一連の番号を与えている。したがっ
て、請求項2の方法によって得られた生データモードの
符号の入力に応じて、復号結果として得られる番号から
文字を復元することができる。
【0073】請求項15の発明は、請求項3の方法と同
様に、生データモードにおける符号化結果と複製モード
における一致長とに一連の番号を与えている。したがっ
て、請求項3の方法によって得られた複製モードの符号
の入力に応じて、復号結果として得られる番号から一致
長を復元し、一致文字列の検索処理に供することができ
る。
【0074】請求項16の発明は、第1符号が複製モー
ドの符号である場合に第2符号を抽出し、この第2符号
をスプレイ復号化の手法を用いて復号することにより、
復号結果として一致文字列の位置を示すアドレスの少な
くとも一部を得ることができる。これにより、請求項4
の方法による符号からLZSS符号化方法による複製モ
ードの符号化結果を復元し、一致文字列の検索処理に供
することができる。
【0075】請求項17の発明は、請求項5の方法と同
様に、生データモードにおける符号化結果と複製モード
におけるアドレスの少なくとも一部とに一連の番号を与
えている。したがって、請求項5の方法によって得られ
た複製モードの符号の入力に応じて、復号結果として得
られる番号からアドレスの一部を復元し、一致文字列の
検索処理に供することができる。
【0076】請求項18の発明は、第1符号が複製モー
ドの符号である場合に第2符号を抽出し、この第2符号
をスプレイ復号化の手法を用いて復号することにより、
復号結果として一致長を得ることができる。これによ
り、請求項6の方法による符号からLZSS符号化方法
による複製モードの符号化結果を復元し、一致文字列の
検索処理に供することができる。
【0077】請求項19の発明は、請求項7の方法と同
様に、生データモードにおける文字の上位部分と複製モ
ードにおける符号化結果とに一連の番号を与えており、
文字の上位部分に対応して、文字の下位部分の符号表が
設けられている。したがって、第1符号が生データモー
ドである場合に、第1符号の復号結果として得られる番
号から文字の上位部分を復元するとともに第2符号を抽
出し、この第2符号を復元された文字の上位部分に対応
する符号表を用いて復号することにより、文字の下位部
分を復元することができる。
【0078】請求項20の発明は、請求項8の装置と同
様に、生データモードにおける文字と複製モードにおけ
る一致長とに一連の番号を与えた符号表131を備えて
いる。したがって、スプレイ復号手段133が、抽出手
段132で得られた第1符号を符号表131を用いて復
号し、判別手段134による判別結果に応じて、文字列
復元手段135が動作することにより、第1符号の復号
結果として得られた番号に基づいて、LZSS符号化方
法による2つの符号化モードのそれぞれの符号化結果を
得ることができる。このようにして得られたLZSS符
号化方法による符号化結果に基づいて、従来と同様の復
元処理を行うことにより、請求項8の装置で得られた符
号から、元の文字列を復元することができる。
【0079】請求項21の発明は、請求項9の装置の符
号表113に対応する符号表136を備えており、複製
モードの符号の入力に応じて、抽出手段132により第
2符号を抽出し、スプレイ復号手段137が、上述した
符号表136を用いてこの第2符号を復号することによ
り、一致文字列の位置を示すアドレスの少なくとも一部
を得ることができる。このようにして、請求項9の装置
で得られた符号から、LZSS符号化方法による符号化
結果を復元し、この符号化結果に対して従来と同様の復
元処理を施すことによって元の文字列を復元することが
できる。
【0080】請求項22の発明は、請求項10の装置と
同様に、生データモードにおける文字と複製モードにお
けるアドレスの少なくとも一部とに一連の番号を与えた
符号表141を備えている。したがって、スプレイ復号
手段142が、抽出手段132で得られた第1符号を符
号表141を用いて復号し、判別手段134による判別
結果に応じて、文字列復元手段143が動作することに
より、第1符号の復号結果として得られた番号に基づい
て、LZSS符号化方法による2つの符号化モードのそ
れぞれの符号化結果を得ることができる。このようにし
て得られたLZSS符号化方法による符号化結果に基づ
いて、従来と同様の復元処理を行うことにより、請求項
10の装置で得られた符号から、元の文字列を復元する
ことができる。
【0081】請求項23の発明は、請求項11の装置の
符号表117に対応する符号表144を備えており、複
製モードの符号の入力に応じて、抽出手段132により
第2符号を抽出し、スプレイ復号手段145が、上述し
た符号表144を用いてこの第2符号を復号することに
より一致長を得ることができる。このようにして、請求
項11の装置で得られた符号から、LZSS符号化方法
による符号化結果を復元することができる。また、この
符号化結果に対して従来と同様の復元処理を施すことに
よって元の文字列を復元することができる。
【0082】請求項24の発明は、請求項12の装置の
符号表121,122に対応する符号表151,152
を備えており、生データモードの符号の入力に応じて、
抽出手段132によって抽出された第1符号からスプレ
イ復号手段153が文字の上位部分を示す番号を復元す
るとともに、抽出手段154により第2符号を抽出す
る。また、スプレイ復号手段155が、符号表152か
ら上述した番号で示される文字の上位部分に対応する符
号の木を選択し、選択して符号の木を用いて第2符号か
ら文字の下位部分を復元する。したがって、判別手段1
34による判別結果に応じて、文字列復元手段156が
文字の上位部分と下位部分とを結合することにより、請
求項12の装置で得られた生データモードの符号から文
字を復元することができる。このようにして、請求項1
2の装置で得られた符号から、LZSS符号化方法によ
る符号化結果を復元することができる。また、この符号
化結果に対して従来と同様の復元処理を施すことによっ
て元の文字列を復元することができる。
【0083】
【実施例】以下、図面に基づいて本発明の実施例につい
て詳細に説明する。図7は、請求項8のデータ圧縮装置
の実施例構成図である。
【0084】図7において、請求項8のデータ圧縮装置
は、図22に示した従来のデータ圧縮装置の符号化部5
01に代えて、スプレイ符号化部211と符号表格納部
212と符号化制御部213と符号語作成部214とを
備え、マッチング部203による検索結果に基づいて、
符号化制御部213がスプレイ符号化部211と符号語
作成部214とを制御して、入力文字列を符号化する構
成となっている。
【0085】ここで、出現する可能性のある各文字およ
び一致長のそれぞれには、予め相異なる符号が与えられ
ており、これらの符号を2分木の葉として登録した符号
の木(以下、符号の木と称する)の構造が、上述した
符号表格納部212に格納されている。
【0086】例えば、図8に示すように、8ビットで表
される各文字の先頭に1ビット“0”を付加したものと
4ビットで表される各一致長にビット列“10000”
を付加したものとを考える。これらの9ビットからなる
ビット列は、全ての文字および一致長を含んだシンボル
の系列であるから、これらのシンボルのそれぞれに符号
を与えて、符号の木に登録しておけばよい。上述した
シンボルは、各文字および一致長のそれぞれに対応する
一連の番号に相当するから、上述した符号の木は、符
号表111に相当している。なお、この場合は、各シン
ボルのビット列そのものを符号の初期値として登録すれ
ばよい。
【0087】また、図7において、スプレイ符号化部2
11は、請求項8のスプレイ符号化手段112に相当す
るものであり、符号化制御部213からの文字および一
致長を入力データとして受け取り、上述した符号表格納
部212を参照して入力データに対応する符号を得て符
号語作成部214に送出するとともに、この入力データ
に応じて符号表格納部212の内容を書き換えて、符号
の木を組み替える構成となっている。以下の説明にお
いては、上述したスプレイ符号化部211の動作を一括
して、『スプレイ符号化する』と称する。
【0088】図9に、データ圧縮動作を表す流れ図を示
す。まず、マッチング部203は、従来と同様にしてQ
バッファ202内の入力文字列に最大長一致するPバッ
ファ201内の文字列を検索し(ステップ301)、該
当する文字列が得られた場合はその文字列を一致文字列
として符号化制御部213に送出し、該当する文字列が
ない場合は入力文字列の先頭文字を一致文字列として符
号化制御部213に送出する。
【0089】これに応じて、符号化制御部213は、受
け取った一致文字列の長さ、つまり一致長が2文字以上
であるか否かに基づいて、一致文字列を複製モードで符
号化するか否かを判定する(ステップ302)。
【0090】一致長が2文字以下である場合は、符号化
制御部213は、ステップ302の否定判定として生デ
ータモードを選択し、一致文字列として受け取ったQバ
ッファ202の先頭文字をスプレイ符号化部211に送
出するとともに、符号語作成部214に生データモード
の符号語を作成する旨を指示する。
【0091】この場合は、上述した文字を入力データと
して受け取って、スプレイ符号化部211は、符号表格
納部212内の符号の木を用いて入力文字をスプレイ
符号化し(ステップ303)、得られたスプレイ符号
(以下、スプレイ符号と称する)を符号語作成部21
4に送出する。これに応じて、符号語作成部214は、
図10(a) に示すように、生データモードの符号語とし
て、上述したスプレイ符号をそのまま出力し、ステッ
プ305に進む。
【0092】一方、一致長が2文字以上である場合に
は、符号化制御部213はステップ302の肯定判定と
して、複製モードを選択して符号語作成部214に通知
し、マッチング部203で得られた一致長をスプレイ符
号化部211に送出する。また、このとき、一致開始位
置を示すPバッファ201のアドレスを符号語作成部2
14に送出する。
【0093】これに応じて、スプレイ符号化部211
は、上述した符号の木を用いて一致長をスプレイ符号
化して符号語作成部214に送出する(ステップ30
4)。また、符号語作成部214は、受け取ったアドレ
スを固定長符号化し(ステップ305)、図10(a) に
示すように、スプレイ符号化部211で得られたスプレ
イ符号にアドレスの符号化結果を付加して複製モード
の符号語を作成して出力する。なお、上述したステップ
305において、符号語作成部214は、受け取ったア
ドレスをそのまま固定長符号化結果として、上述したス
プレイ符号に付加して符号語を作成すればよい。
【0094】上述したステップ303あるいはステップ
305の終了後に、ステップ306において、従来と同
様にして、Qバッファ202内の符号化済みの文字列を
Pバッファ201に移し、Pバッファ201から古い文
字列を捨てる処理を行った後に、符号化済みでない文字
列が有るか否かを判定する(ステップ307)。このス
テップ307の肯定判定の場合は、ステップ301に戻
って、新しい文字列の符号化処理を行い、否定判定の場
合は、データ圧縮処理を終了する。
【0095】上述したように、このデータ圧縮装置にお
いては、生データモードでは、スプレイ符号化部211
によってQバッファ202の先頭文字がスプレイ符号化
され、複製モードでは、マッチング部203で得られた
一致長がスプレイ符号化される。すなわち、符号化制御
部213からの指示に応じて、スプレイ符号化部211
が動作することにより、請求項2のデータ圧縮方法と請
求項3のデータ圧縮方法との特徴を併せ持つデータ圧縮
方法を適用したデータ圧縮装置を実現している。
【0096】この場合は、符号化処理の開始当初のよう
に、生データモードの出現確率が高い場合は、各文字に
対応する符号の長さがそれぞれの出現確率に応じて短く
なり、一方、複製モードの出現確率の増大に伴って、今
度は一致長に対応する符号の長さがそれぞれの出現確率
に応じて短くなる。
【0097】したがって、上述したようにして、文字お
よび一致長を含むシンボルの系列をスプレイ符号化する
ことにより、文字および一致長それぞれの出現確率の偏
りを利用してそれぞれの情報を圧縮するとともに、一致
文字列の出現確率にかかわらず、入力文字列の圧縮能率
を向上することができる。
【0098】なぜならば、図8に示した符号の例から分
かるように、文字および一致長を含んだシンボルを表す
ビット列の先頭ビットによって、符号化モードが生デー
タモードであるか複製モードであるかが示されており、
従来の識別フラグに相当する情報も同時に可変長符号化
されているからである。
【0099】すなわち、上述したようにして、LZSS
符号化法によって得られる固定長の符号を更にスプレイ
符号化することにより、LZSS符号化法の短所を補っ
て、符号化能率を向上することができる。特に、スプレ
イ符号化部211による符号表の組み替えにより、出現
した番号に対応する符号の長さを逐次に半分にしていく
と、入力データを高能率で圧縮することができる。
【0100】これにより、入力データの統計的な性質に
追従し、生データモードの出現確率が高いときには、入
力データにおける各文字の出現頻度の偏りを利用して入
力データを圧縮し、複製モードの出現頻度が高いときに
は、入力データにおける文字列の冗長性を利用して高い
圧縮率を得ることができる。したがって、符号化処理の
開始直後における圧縮能率の低下や冗長性の低い入力デ
ータに対する圧縮能率の低下を軽減して、統計的な性質
や符号化処理の経過にかかわらず、高い圧縮率を得るこ
とが可能となる。
【0101】なお、図8に示した例に代えて、各文字に
対応する番号の最上位ビットを“1”とし、各一致長に
対応する番号の最上位ビットを“0”とすることによ
り、一致長に与えた番号に続く番号を各文字に与えても
よい。
【0102】ところで、上述したように、Pバッファ2
01から一致文字列を検索する場合に、符号化対象の文
字列に近い位置から検索される可能性が高いことが知ら
れている。
【0103】例えば、Pバッファ201の16進数のア
ドレス“000H”にQバッファ202から入力文字列
が順次に入力され、Pバッファ201の16進数のアド
レス“FFFH”から古い文字列が捨てられるとする
と、若い番号で表されるアドレスの方が、一致開始位置
として検索される確率が高いと言える。
【0104】このような一致開始位置の出現確率の偏り
を利用すれば、更に、高い圧縮率を得ることが可能であ
る。例えば、図7に示した符号表格納部212に、上述
した符号の木とともに、一致開始位置を表すPバッフ
ァ201のアドレスに対応する符号を登録した符号の木
(以下、符号の木と称する)を格納しておき、符号化
制御部213が、スプレイ符号化部211に対して、符
号の木を指定して入力データの符号化処理を実行する旨
を指示する構成とすればよい。
【0105】ここで、一致開始位置の出現確率は、符号
化対象の文字に近い位置で大きくなる傾向があるが、ば
らつきが大きいから、特定のアドレスに集中することは
考えられない。したがって、アドレスの上位部分に注目
し、Pバッファ201の対応する領域内で一致文字列が
検出される確率に応じて、可変長符号化するほうが有利
であると考えられる。例えば、アドレスの上位4ビット
に注目してスプレイ符号化すれば、それぞれに対応する
16個の領域ごとに一致文字列が検出される確率を評価
して、一致開始位置の出現確率の偏りをその符号長に反
映させることができる。
【0106】したがって、符号表格納部212には、例
えば、アドレスの上位4ビットに対応する符号を登録し
た符号の木を符号の木として2分木の形式で格納して
おけばよい。
【0107】この場合は、スプレイ符号化部211が符
号化制御部213からの指示に応じて符号の木を切り換
えながら動作することにより、符号表格納部212が、
請求項8で述べた符号表111と請求項9で述べた符号
表113との機能を果たし、スプレイ符号化部211
が、請求項8で述べたスプレイ符号化手段112および
請求項9で述べたスプレイ符号化手段114の機能を実
現する構成となっている。
【0108】図11に、請求項9のデータ圧縮装置によ
るデータ圧縮動作を表す流れ図を示す。上述したステッ
プ301,302と同様にして、Pバッファ201から
一致文字列を検索して符号化モードを判定し(ステップ
311,312)、生データモードが選択された場合
(ステップ312の否定判定の場合)は、ステップ30
3と同様にして、図10(b) に示すように、入力文字に
対応するスプレイ符号を生データモードの符号語とし
て出力して(ステップ313)、ステップ317に進
む。 一方、複製モードを選択した場合(ステップ31
2の肯定判定の場合)は、符号化制御部213により、
まず、スプレイ符号化部211に符号の木を指定して
一致長の符号化処理が指示され、これに応じて、スプレ
イ符号化部211により、符号の木を用いた符号化処
理が行われ、得られたスプレイ符号が符号語作成部2
14に送出される(ステップ314)。
【0109】次に、符号化制御部213により、スプレ
イ符号化部211に対して、符号の木を指定してアド
レスの上位4ビットの符号化処理が指示され、これに応
じて、スプレイ符号化部211により、符号の木を用
いた符号化処理が行われ、得られたスプレイ符号(以
下、スプレイ符号と称する)が符号語作成部214に
送出される(ステップ315)。
【0110】また、このとき、符号化制御部213は、
アドレスの下位8ビットを符号化制御部214に送出
し、複製モードの符号語の作成を指示する。これに応じ
て、符号語作成部214は、アドレスの下位8ビットを
固定長符号化し(ステップ316)、図10(b) に示す
ように、上述したスプレイ符号とスプレイ符号と固
定長符号化結果とを順次に結合し、複製モードの符号語
として出力する。
【0111】その後、ステップ317において、ステッ
プ305と同様にしてPバッファ201,Qバッファ2
02の管理処理を行い、ステップ318における未処理
の入力文字列の有無の判定結果に応じて、ステップ31
1に戻って新しい文字列の符号化処理を行う。
【0112】この場合は、上述した請求項8に対応する
実施例と同様にして、各文字および一致長の出現確率の
偏りならびに符号化処理の経過に応じた生データモード
と複製モードとの出現確率の偏りを利用して、圧縮率の
向上を図るとともに、更に、一致開始位置を示すPバッ
ファ201のアドレスの上位4ビットをスプレイ符号化
することにより、一致文字列の出現位置の偏りを利用し
て、圧縮率の向上を図っている。
【0113】これにより、LZSS符号化方式で一致開
始位置を固定長で表していたことによる無駄を排除する
ことができる。特に、符号化処理の開始直後や入力デー
タの大きさが小さい場合などには、大きな圧縮効果が期
待できる。なぜなら、このような場合には、Pバッファ
201のアドレス番号の大きい領域は空であり、一致開
始位置は、Pバッファ201のアドレス番号の小さい領
域に限定されているから、該当する領域に非常に短いビ
ット数の符号が割り当てられることが期待できるからで
ある。
【0114】なお、Pバッファ201のアドレス全体を
スプレイ符号化してもよい。この場合は、符号表格納部
212に12ビットのアドレスのそれぞれに対応する符
号を登録した符号の木(以下、符号の木と称する)を
2分木の形式で格納しておき、符号化制御部213は、
マッチング部203で得られた一致開始位置をそのまま
スプレイ符号化部221に送出し、上述した符号の木
を用いて符号化処理を行う旨を指示すればよい。また、
符号語作成部214は、複製モードが指示されたとき
に、スプレイ符号化部211で一致長と一致開始アドレ
スとに対応してそれぞれ得られるスプレイ符号を順次に
結合して符号語を作成すればよい。
【0115】したがって、この場合の複製モードの符号
語は、図10(a) に示した複製モードの符号語におい
て、固定長で表された一致開始位置に代えて、Pバッフ
ァ201のアドレス全体をスプレイ符号化して得られる
スプレイ符号を備えた構成となる。
【0116】また、一致長の代わりに、一致開始位置の
上位ビットを生データモードの文字と組み合わせてもよ
い。例えば、図7において、符号化制御部213が、ス
プレイ符号化部211に一致長の代わりに一致開始位置
の上位kビットを送出して該当する符号の木を用いた符
号化処理を指示し、次に、別の符号の木を指定して一致
長の符号化処理を指示する構成とすればよい。
【0117】この場合は、符号表格納部212に、各文
字と一致開始位置の上位kビットとを含むシンボルの系
列に対応する符号の木(以下、符号の木と称する)と
一致長に対応する符号の木(以下、符号の木と称す
る)とが、それぞれ2分木の形式で格納すればよい。上
述した符号の木は、請求項10で述べた符号表115
に相当するものであり、符号の木は、請求項11で述
べた符号表117に相当するものである。
【0118】ここで、例えば、一致開始位置の上位4ビ
ットに注目した場合は、そのビット列の組み合わせは一
致長を表すビット列の組み合わせと同一であるから、上
述した符号の木に登録される符号の初期値は、上述し
た符号の木の場合と同じようにして決めてよい。つま
り、一致開始位置の上位4ビットにビット列“1000
0”を付加したものと各文字のビット列に1ビット
“0”を付加したものとを新しいシンボルの系列とし、
この系列に含まれる各シンボルのビット列をそれぞれ与
えられた符号の初期値として登録すればよい。また、符
号の木に登録する符号の初期値としては、各一致長を
表すビット列を登録しておけばよい。
【0119】この場合は、図11に示した流れ図におい
て、ステップ314において、符号化制御部213が、
スプレイ符号化部211に対して、符号の木を指定し
てアドレスの上位4ビットの符号化処理を指示し、ま
た、ステップ315において、符号の木を指定して一
致長の符号化処理を指示すればよい。したがって、ステ
ップ314において、アドレスの上位4ビットを符号の
木を用いて符号化して得られるスプレイ符号(以下、
スプレイ符号と称する)が得られ、ステップ315に
おいて、一致長を符号の木を用いて符号化して得られ
るスプレイ符号(以下、スプレイ符号と称する)が得
られる。
【0120】このように、符号化制御部213からの指
示に応じて、スプレイ符号化部211と符号表格納部2
12とが動作することにより、請求項10で述べたスプ
レイ符号化手段116および請求項11で述べたスプレ
イ符号化手段118の機能を果たすことができる。すな
わち、生データモードにおける文字と複製モードにおけ
る一致開始位置を示す情報の一部とを可変長符号化する
とともに、複製モードにおける一致長を可変長符号化す
ることができる。
【0121】この場合は、符号語作成部214により、
図10(c) に示すように、生データモードの符号語とし
て、入力文字を符号の木を用いて符号化して得られる
スプレイ符号が出力され、複製モードの符号語として
は、一致開始位置の一部に対応するスプレイ符号に一
致開始位置の下位8ビットと一致長に対応するスプレイ
符号とを付加した符号語が出力される。
【0122】このようにして、請求項2のデータ圧縮方
法と請求項4のデータ圧縮方法との特徴を併せ持つデー
タ圧縮方法を適用したデータ圧縮装置を実現することが
できる。これにより、上述した請求項8のデータ圧縮装
置と同様に、入力データの統計的な性質や符号化処理の
経過による生データモードと複製モードとの出現割合の
変化にかかわらず、LZSS符号化方式の短所を補っ
て、圧縮能率を向上することができる。
【0123】なお、生データモードにおける文字と複製
モードにおける一致開始位置を示すアドレス全体とを組
み合わせてもよい。例えば、図7に示したデータ圧縮装
置において、複製モードが選択されたときに、符号化制
御部213が、一致開始位置を示すPバッファ201の
アドレス全体と一致長とを順次にスプレイ符号化部21
1に送出し、それぞれ該当する符号の木を用いて符号化
処理を行う旨を指示する構成とすればよい。
【0124】また、符号表格納部212には、上述した
符号の木に代えて、全ての文字と一致開始位置を示す
アドレスを含むシンボルの系列に対応する符号の木と
ともに、一致長に対応する符号の木を格納すればよ
い。この符号の木は、上述した符号の木と同様に、
符号表115に相当するものである。
【0125】この場合は、ビット長を合わせるための付
加ビット列“0000”と識別フラグに対応するビット
“0”とを文字を表すビット列に付加し、アドレスを表
すビット列には識別フラグに対応するビット“1”を付
加して、文字とアドレスとを含むシンボルの系列を作成
し、これに対応する符号の木を符号の木として符号表
格納部212に格納すればよい。また、これらのシンボ
ルに対応する符号の初期値としては、上述した符号の木
と同様に、各シンボルを示すビット列そのものを登録
しておけばよい。
【0126】図12に、データ圧縮動作を表す流れ図を
示す。まず、図9に示したステップ301,302と同
様にして、一致文字列の検索および符号化モードの判定
処理を行う(ステップ321,322)。
【0127】次に、生データモードが選択された場合
(ステップ322の否定判定)は、符号化制御部213
からの指示に応じて、スプレイ符号化部211により、
入力文字が上述した符号の木を用いてスプレイ符号化
され、得られたスプレイ符号(以下、スプレイ符号と
称する)のみからなる符号語は、図10(d) に示すよう
に、符号語作成部214を介して生データモードの符号
語として出力される(ステップ323)。
【0128】一方、複製モードが選択された場合(ステ
ップ322の肯定判定)は、まず、符号化制御部213
からの指示に応じて、スプレイ符号化部211により、
一致開始位置を示すPバッファ201のアドレス全体が
上述した符号の木を用いてスプレイ符号化され(ステ
ップ324)、アドレスに対応するスプレイ符号が得
られる。次に、スプレイ符号化部211により、一致長
が符号の木を用いてスプレイ符号化され(ステップ3
25)、一致長に対応するスプレイ符号が得られる。
このようにしてステップ324,325で得られたスプ
レイ符号,は、符号化制御部213からの指示に応
じて、符号語作成部214によって結合され、図10
(d) に示すような複製モードの符号語として出力され
る。
【0129】その後、ステップ305と同様のバッファ
管理処理を行い(ステップ326)、ステップ327に
おける未処理の文字の有無についての判定結果に応じ
て、ステップ321に戻って新しい文字列の符号化処理
を行う。
【0130】この場合は、LZSS符号化方式による符
号化結果が全て可変長符号化される。したがって、各文
字,一致開始位置および一致長のそれぞれの出現確率に
大きな偏りがあれば、大幅な圧縮率の向上が期待でき
る。しかし、実際には、特定のアドレスが一致開始位置
として出現する確率に大きな偏りはないから、アドレス
全体をスプレイ符号化するよりもアドレスの一部(例え
ば上位4ビット)をスプレイ符号化するほうが有利であ
ると考えられる。
【0131】ところで、自然画像においては、各画素の
階調を表す画像データにはノイズ成分が含まれている。
このため、例えば、隣接する画素の階調は近似している
にもかかわらず、これらの画素の画像データが完全に一
致する確率は非常に小さく、更に、階調値が同じパター
ンで反復している箇所を検出するのは非常に困難であ
る。
【0132】これは、画像データの下位ビットがノイズ
成分のためにばらついているからであり、各画素の画像
データの上位ビットを比較すれば、かなり高い確率で反
復していることが分かる。つまり、画像データにおいて
も、大まかな階調についてはその変化に規則性があり、
この規則性を利用して圧縮することが可能である。
【0133】以下、このような性質を利用して、入力デ
ータを圧縮する方法について説明する。請求項12のデ
ータ圧縮装置は、図7において、符号化制御部213
が、生データモードを選択したときに、入力文字を上位
部分と下位部分とに分割して順次にスプレイ符号化部2
11に送出し、それぞれを異なる符号の木を用いてスプ
レイ符号化する旨を指示することによって実現すること
ができる。
【0134】また、符号表格納部212には、上述した
符号の木に代えて、文字を表すビット列の上位部分の
全ての組み合わせと一致長を表すビット列の全ての組み
合わせとからなるシンボルの系列に対応する符号の木
が格納されている。また、符号表格納部212には、上
述した符号の木とともに、文字の上位4ビットに組み
合わせのそれぞれに対応して下位4ビットの組み合わせ
のそれぞれに符号を登録した16通りの符号の木0
15と、一致開始位置の上位4ビットに対応する符号の
木とが格納されている。上述した符号の木は符号表
121に相当するものであり、符号の木0 15は符
号表122に相当するものである。
【0135】この場合は、文字の上位4ビットに識別フ
ラグに対応するビット“0”を付加したものと、一致長
を表す4ビットのビット列に識別フラグに対応するビッ
ト“1”を付加したものとにより、文字の上位4ビット
と一致長とを含むシンボルの系列を形成し、各シンボル
を表すビット列をそれぞれの符号の初期値として符号の
木に登録し、2分木の形式で符号表格納部212に格
納しておけばよい。また、16通りの符号の木0
15についても、同様にして、文字の下位4ビットのビッ
ト列をそのまま符号の初期値として登録しておけばよ
い。
【0136】図13に、請求項12の装置によるデータ
圧縮動作を表す流れ図を示す。まず、図9に示したステ
ップ301,302と同様にして、一致文字列の検索お
よび符号化モードの判定処理を行う(ステップ331,
332)。
【0137】生データモードが選択された場合(ステッ
プ332の否定判定)は、符号化制御部213からの指
示に応じて、スプレイ符号化部211は、まず、入力文
字の上位4ビットを上述した符号の木を用いてスプレ
イ符号化し、次に、この上位4ビットに対応する符号の
木を用いて、入力文字の下位4ビットをスプレイ符号
化する(ステップ333,334)。
【0138】これに応じて、符号語作成部214は、図
10(e) に示すように、スプレイ符号化部211におい
て、符号の木,をそれぞれ用いて得られたスプレイ
符号(以下、スプレイ符号,と称する)を順次に結
合し、生データモードの符号語として出力する。
【0139】一方、複製モードが選択された場合(ステ
ップ332の肯定判定)は、まず、符号化制御部213
からの指示に応じて、スプレイ符号化部211により、
一致長が上述した符号の木を用いてスプレイ符号化さ
れ(ステップ335)、次に、同様にして、スプレイ符
号化部211により、アドレスの上位4ビットが符号の
木を用いてスプレイ符号化される(ステップ33
6)。更に、符号語作成部214において、アドレスの
下位8ビットが固定長符号化され(ステップ337)、
この固定長符号化結果と上述したステップ336,33
7で得られたスプレイ符号,とを順次に結合して、
図10(e) に示すような符号語が作成され、複製モード
の符号語として出力される。
【0140】その後、ステップ305と同様のバッファ
管理処理を行い(ステップ338)、ステップ339に
おける判定結果に応じて、ステップ331に戻って新し
い文字列の符号化処理を行う。
【0141】このように、スプレイ符号化部211が、
符号化制御部213からの指示に応じて、符号の木を
用いて符号化処理を行うことにより、このスプレイ符号
化部211によって、請求項12のスプレイ符号化手段
123およびスプレイ符号化手段124の機能を実現
し、生データモードにおける符号化結果の一部と複製モ
ードにおける符号化結果の一部とを含むシンボルの系列
として可変長符号化することができる。
【0142】このようにして、請求項7のデータ圧縮方
法を適用したデータ圧縮装置を実現し、生データモード
における文字を表すビット列の上位部分と複製モードに
おける一致長とを組み合わせてスプレイ符号化し、LZ
SS符号化方式による符号化結果と組み合わせて出力す
ることができる。これにより、一致文字列の出現確率や
その一致長および一致開始位置の出現確率の偏りを利用
して圧縮率の向上を図るとともに、入力文字を表すビッ
ト列の上位部分のみに冗長性がある場合にも、この冗長
性を利用して入力データを圧縮することができる。した
がって、いわゆるテキストデータだけでなく、自然画像
のように、ノイズ成分を含んでいる入力データにも柔軟
に対応して、高い圧縮能率を得ることができる。
【0143】ここで、各画素の画像データをそれぞれ1
文字としてLZSS符号化方式で符号化すると、ほとん
ど全ての入力文字が生データモードで符号化されると考
えられるから、画像データを圧縮する場合には、生デー
タモードにおける圧縮率が重要となる。
【0144】上述したように、画像データの上位部分の
系列は冗長な情報を含んでおり、特に、自然画像の背景
部分などに存在する階調変化の少ない部分においては、
上位部分が同一である可能性が高いから、該当するビッ
ト列に対応する符号は非常に短くなると考えられ、高い
圧縮能率が期待できる。
【0145】また、文字の上位部分に応じて、スプレイ
符号化部211が符号表格納部212から対応する符号
の木を選択し、この符号の木を用いて符号化処理を
行う構成としたことにより、入力文字の上位4ビットと
下位4ビットとのあいだの従属関係に応じて、入力文字
の下位4ビットを可変長符号化することができる。これ
により、英文などのように、各文字を表す8ビットのビ
ット列全体で出現確率の偏りがある入力文字列にも対応
して、圧縮率の向上を図ることができる。
【0146】また、一致長の代わりに、一致開始位置を
示すアドレスの上位部分を入力文字の上位部分と組み合
わせてスプレイ符号化してもよい。例えば、図7におい
て、複製モードのときに、符号化制御部213が、Pバ
ッファ201のアドレスの上位4ビットをスプレイ符号
化部231に送出し、一致長をスプレイ符号化部211
に送出する構成とすればよい。
【0147】また、上述した符号の木の代わりに、入
力文字を表すビット列の上位4ビットおよびPバッファ
201のアドレスの上位4ビットを含むシンボルの系列
に対応する符号の木を作成し、符号表121に相当す
るものとして符号表格納部212に格納し、アドレスの
上位4ビットに対応する符号の木の代わりに、一致長
に対応する符号の木を格納すればよい。
【0148】この場合は、符号化制御部213からの指
示に応じて、スプレイ符号化部211が符号表格納部2
12内の符号の木を用いて符号化処理を行うことによ
り、請求項12のスプレイ符号化手段123の機能が実
現される。
【0149】すなわち、図13に示した流れ図のステッ
プ333において、入力文字の上位4ビットが、符号の
木を用いてスプレイ符号化され、ステップ336にお
いて、一致長の代わりに、アドレスの上位4ビットが符
号の木を用いてスプレイ符号化される。また、ステッ
プ337において、一致長が符号の木を用いてスプレ
イ符号化される。
【0150】したがって、この場合は、図10(f) に示
すように、符号語作成部214により、スプレイ符号
に代えて、符号の木を用いて得られたスプレイ符号
(以下、スプレイ符号と称する)をスプレイ符号と
組み合わせた符号語が生データモードの符号語として出
力され、スプレイ符号とアドレスの下位8ビットとス
プレイ符号とを結合したものが複製モードの符号語と
して出力される。
【0151】これにより、生データモードでは、入力文
字の上位4ビットの出現確率に応じてこのビット列を圧
縮し、複製モードでは、一致文字列の検出位置の分布の
偏りを利用して一致開始位置の上位4ビットを圧縮する
ことができる。
【0152】なお、上述した実施例においては、1つの
スプレイ符号化部がスプレイ符号化する情報ごとに符号
表を切り換えながらスプレイ符号化処理を行うことによ
り、各情報を順次に処理する構成を示したが、情報ごと
にスプレイ符号化部と符号表格納部とを設け、これらの
スプレイ符号化部が並行して動作する構成としてもよ
い。
【0153】図14に、本発明のデータ圧縮装置の別実
施例構成図を示す。図14において、データ圧縮装置
は、2つのスプレイ符号化部211,221と符号語作
成部214とを備えており、符号化制御部213が、生
データモードのおける入力文字と複製モードにおける一
致長とをスプレイ符号化部211に送出し、一致開始位
置の上位4ビットおよび下位8ビットをそれぞれスプレ
イ符号化部221および符号語作成部214に送出する
構成となっている。
【0154】また、符号表格納部212には、各文字お
よび一致長に対応するシンボルの系列について与えられ
た符号を登録した符号の木が格納されており、スプレ
イ符号化部211がこの符号の木を用いて符号化処理
を行うことにより、請求項8で述べたスプレイ符号化手
段112の機能を果たす構成となっている。同様に、符
号表格納部222には、一致開始位置の上位4ビットに
対応する符号の木が格納されており、スプレイ符号化
部221がこの符号の木を用いて符号化処理を行うこ
とにより、請求項9で述べたスプレイ符号化手段114
の機能を果たす構成となっている。
【0155】この場合は、生データモードでは、スプレ
イ符号化部211のみが動作して、入力文字に対応する
スプレイ符号が符号語作成部214を介して出力され、
複製モードでは、スプレイ符号化部211,221が並
行して動作し、それぞれ一致長および一致開始位置の上
位4ビットに対応するスプレイ符号が符号語作成部21
4によって一致開始位置の下位8ビットと結合されて出
力される。
【0156】このように、スプレイ符号化部211,2
21を並行動作可能としたことにより、複製モードのと
きの符号化処理に要する時間を短縮することが可能とな
るから、データ圧縮処理の高速化を図ることができる。
【0157】同様にして、請求項10〜請求項12のデ
ータ圧縮装置を実現することも可能である。次に、上述
したようなデータ圧縮装置によって得られる符号データ
から元の文字列を復元するデータ復元方法および装置に
ついて説明する。
【0158】図15に、請求項20のデータ復元装置の
実施例構成図を示す。図15において、データ復元装置
は、復元処理部230が、上述した圧縮処理と逆の手順
で符号語の系列から文字列を復元し、復元文字列として
出力するとともに、辞書104に相当するPバッファ2
01に蓄積する構成となっている。
【0159】復元処理部230において、入力される符
号語は、切換指示に応じてデマルチプレクサ(DMP
X)231が動作することによってその構成ごとに分解
され、スプレイ復号部232あるいは読出処理部233
に入力される。
【0160】また、符号表格納部234は、符号表13
1に相当するものであり、上述した請求項8のデータ圧
縮装置の実施例と同様に、全ての文字と一致長とを含む
シンボルの系列に対応する符号の木を格納している。
上述したデータ圧縮装置と同様に、この符号表格納部2
34は、初期状態においては、これらのシンボルのそれ
ぞれに対応する符号の初期値として、各シンボルを表す
ビット列を登録している。
【0161】したがって、スプレイ復号部232が、符
号表格納部234内に格納された符号の木を用いて、
入力されたスプレイ符号を復元することにより、請求項
20のスプレイ復号手段133の機能が果たされ、生デ
ータモードにおいては文字が、複製モードにおいては一
致長が、対応するシンボルとして得られる。
【0162】このスプレイ復号部232による復号結果
に基づいて、復元制御部235が、デマルチプレクサ2
31および読出処理部233を制御することにより、元
の文字列を復元する構成となっている。
【0163】図16に、図10(a) に示した符号語の系
列から文字列を復元するデータ復元動作を表す流れ図を
示す。復元制御部235からの切換指示に応じて、デマ
ルチプレクサ231から第1符号に相当する1つのスプ
レイ符号がスプレイ復号部232に送出され、これに応
じて、スプレイ復号部232により、符号の木を用い
た復号処理が行われ、該当するシンボルが得られる(ス
テップ401)。
【0164】ステップ401で得られたシンボルに基づ
いて、復元制御部235は判別手段134として動作
し、該当する符号語が生データモードであるか否かを判
定する(ステップ402)。ここで、上述したシンボル
は、全ての文字と一致長とに付された一連の番号であ
り、文字に対応するシンボルの最上位ビットは“0”で
あり、一致長に対応するシンボルの最上位ビットは
“1”となっている。したがって、復号されたシンボル
のビット列で表される数値と数値『255』とを比較
し、数値『255』以下であるか否かによって、生デー
タモードであるか否かを判定することができる。
【0165】ステップ402における肯定判定の場合
は、復元制御部235は、復号されたシンボルを表すビ
ット列の下位8ビットを抽出することにより、生データ
モードにおけるLZSS符号化方法による符号化結果を
復元し(ステップ403)、復元文字列としてPバッフ
ァ201に送出した後に、ステップ407に進む。
【0166】一方、ステップ402における否定判定の
場合に、復元制御部235は、複製モードの符号語が入
力されたと判断し、ステップ404〜ステップ406の
処理を行う。
【0167】まず、復元制御部235は、復号されたシ
ンボルから一致長を復元する(ステップ404)。ここ
で、上述したように、最上位ビットに対応するオフセッ
トを与えることにより、各一致長に全ての文字に続く番
号が与えられているから、オフセット分である数値『2
56』を復号されたシンボルで表される値から差し引け
ば、元の一致長を得ることができる。
【0168】その後、復元制御部235は、デマルチプ
レクサ231による切り換え動作を制御して、次に入力
される12ビットのビット列を抽出することにより、一
致開始位置を示すアドレスを固定長復号する(ステップ
405)。
【0169】このようにして、複製モードにおけるLZ
SS符号化方法による符号化結果が復元され、得られた
一致長と一致開始位置とに基づいて、読出処理部233
が、Pバッファ201から該当する文字列を読み出すこ
とにより、符号語に対応する文字列が復元される(ステ
ップ406)。
【0170】上述したステップ403あるいはステップ
406の終了後に、Pバッファ201は、復元された復
元文字列を蓄積するとともに、必要に応じて古い文字列
を廃棄する(ステップ407)。その後、復元済みでな
い符号が有るか否かを判定し(ステップ408)、未処
理の符号がある場合は、ステップ408の肯定判定とし
てステップ401に戻って新しい符号の復元処理を行
い、ステップ408の否定判定の場合は、復元処理を終
了する。
【0171】このように、復元制御部235が、スプレ
イ復号部232による復号結果に基づいて、デマルチプ
レクサ231と読出処理部233とを制御することによ
り、抽出手段132と文字列復元手段135との機能を
果たし、スプレイ符号と固定長符号とが混在した符号語
からLZSS符号化方法による符号化結果を復元し、元
の文字列を復元することができる。
【0172】なお、データ圧縮装置によって、一致開始
位置を示すPバッファ201のアドレスが何らかの方法
で固定長符号化されている場合は、上述したステップ4
05において該当する固定長符号を抽出したのちに、対
応する方法で復号して一致開始位置を得ればよい。
【0173】また、図15において、符号表格納部23
4に、上述した符号の木とともに、アドレスの上位4
ビットに対応する符号の木を格納し、複製モードの符
号語が入力されたときに、復元制御部235が、スプレ
イ復号部232に対して、符号の木を指定して2番目
のスプレイ符号の復号処理を指示する構成としてもよ
い。
【0174】この場合は、符号表格納部234内の符号
の木によって請求項21で述べた符号表136の機能
が果たされ、この符号の木を用いてスプレイ復号部2
32が復号処理を行うことにより、請求項21で述べた
スプレイ復号手段137の機能が果たされる。すなわ
ち、請求項21のデータ復元装置を実現し、図10(b)
に示した符号語の系列から元の文字列を復元することが
できる。
【0175】図17に、請求項21のデータ復元装置に
よるデータ復元動作を表す流れ図を示す。まず、上述し
たステップ401,402と同様にして、第1符号に相
当するスプレイ符号を符号の木を用いて復号し(ス
テップ411)、得られた復号結果に基づいて、符号化
モードを判定する(ステップ412)。
【0176】生データモードである場合(ステップ41
2の否定判定)は、ステップ403と同様にして文字を
復元し(ステップ413)、ステップ418に進めばよ
い。一方、複製モードである場合(ステップ肯定判定)
に、復元制御部235は、まず、ステップ404と同様
にして、ステップ411で得られた復号結果で示される
一致長を復元して読出処理部233に送出し(ステップ
414)、次に、スプレイ復号部232に対して、符号
の木を指定して次の符号の復号処理を指示する。
【0177】これに応じて、スプレイ復号部232が、
上述したスプレイ符号に続いて入力されるスプレイ符
号、すなわち第2符号を復号することにより、アドレ
スの上位4ビットが復元され(ステップ415)、復元
制御部235を介して読出処理部233に送出される。
【0178】次に、復元制御部235からの切換指示に
応じて、デマルチプレクサ231が動作し、上述したス
プレイ符号に続いて入力される8ビットのビット列を
抽出することにより、アドレスの下位8ビットが復元さ
れ(ステップ416)、読出処理部233に送出され
る。
【0179】これに応じて、読出処理部233は、ステ
ップ415で得られたアドレスの上位4ビットにステッ
プ416で得られた下位8ビットを付加して得られるP
バッファ201のアドレスと、ステップ414で得られ
た一致長とに基づいて、Pバッファ201から該当する
文字列を読み出して復元文字列として出力する(ステッ
プ417)。
【0180】その後、ステップ407,408と同様に
してPバッファの管理処理および未処理符号の有無の判
定処理を行い、ステップ408の判定結果に応じて、ス
テップ411に戻って新しい符号の復元処理を行う。
【0181】このように、最初のスプレイ符号の復号結
果に基づいて、復元制御部235がデマルチプレクサ2
31,スプレイ復号部232および読出処理部233を
制御することにより、スプレイ符号,とアドレスの
下位8ビットとが混在した符号語の系列からLZSS符
号化方法による符号化結果を復元し、更に元の文字列を
復元することが可能となる。
【0182】また、上述した符号の木の代わりに、ア
ドレス全体に対応する符号の木を符号表136に相当
するものとして符号表格納部234に格納し、複製モー
ドの符号語が入力されたときに、復元制御部235が、
スプレイ復号部232に対して、符号の木を指定して
2番目のスプレイ符号の復号処理を指示する構成として
もよい。
【0183】この場合は、図16に示した流れ図のステ
ップ405において、復元制御部235は、スプレイ復
号部232に対して、符号の木を指定して次のスプレ
イ符号の復号処理を指示し、この復号結果を一致開始位
置を示すアドレスとして読出処理部233に送出すれば
よい。
【0184】これにより、図10(c) に示したようなス
プレイ符号,が混在した符号語の系列からLZSS
符号化方法による符号化結果を復元し、更に元の文字列
を復元することが可能となる。
【0185】なお、この場合は、復元制御部235から
の指示に応じて、スプレイ復号部232が、符号の木
と符号の木とを切り換えながら復号処理を行うことに
より、抽出手段132の機能が実現されでいるので、デ
マルチプレクサ231は不要である。したがって、図1
8に示すように、スプレイ復号部232に符号を直接入
力すればよい。
【0186】また、図15において、符号の木に代え
て、全ての文字および一致開始位置の一部に対応する情
報を含むシンボルに対応する符号の木を符号表格納部
234に格納するとともに、符号の木を符号表格納部
234に格納し、復元制御部235が後述するようにし
て、復元処理部230の各部を制御することにより、請
求項23のデータ復元装置を実現することができる。
【0187】上述した符号の木は、請求項22で述べ
た符号表141に相当するものであり、符号の木は、
請求項23で述べた符号表144に相当するものであ
る。図19に、請求項23のデータ復元装置によるデー
タ復元動作を表す流れ図を示す。
【0188】まず、上述したステップ401,402と
同様にして、第1符号に相当する最初のスプレイ符号
を復号し、その復号結果に基づいて、符号化モードの判
定を行い(ステップ421,422)、生データモード
である場合(ステップ422の否定判定)は、ステップ
403と同様にして文字を復元し(ステップ423)、
ステップ428に進む。
【0189】一方、ステップ422の肯定判定の場合
は、上述したにスプレイ符号の復号結果として得られ
るシンボルからアドレスの上位4ビットを復元し(ステ
ップ424)、読出処理部233に送出する。次に、ス
テップ416と同様にしてデマルチプレクサ231を制
御して、8ビットのビット列を抽出することによりアド
レスの下位8ビットを復元する(ステップ425)。ま
た、ステップ426において、復元制御部235からの
指示に応じて、スプレイ復号部232が符号の木を用
いて、第2符号に相当する次のスプレイ符号の復号処理
を行って一致長を復元し、読出処理部233に送出すれ
ばよい。
【0190】ステップ424〜426によって得られた
LZSS符号化方法による符号化結果に基づいて、読出
処理部233は、Pバッファ201から該当する文字列
を読み出して、復元文字列として出力する(ステップ4
27)。
【0191】その後、ステップ428,429におい
て、ステップ407,408と同様のバッファ管理処理
および未処理符号の有無の判定処理を行い、ステップ4
29の判定結果に応じて、ステップ421に戻って新し
い符号の復元処理行う。
【0192】このように、復元制御部235が、デマル
チプレクサ231,スプレイ復号部232および読出処
理部233を制御することにより、請求項22で述べた
抽出手段132およびスプレイ復号手段142の機能と
請求項23で述べたスプレイ復号手段145および文字
列復元手段143の機能を実現することができる。これ
により、スプレイ符号,とアドレスの下位8ビット
とが混在した符号語の系列からLZSS符号化方法によ
る符号化結果を復元し、元の文字列を復元することが可
能となる。
【0193】また、図18において、符号の木に代え
て、請求項22の符号表141に相当するものとして全
ての文字およびアドレス全体に対応する符号の木を符
号表格納部234に格納するとともに、符号の木に代
えて上述した符号の木を格納し、復元制御部235が
後述するようにして、復元処理部230の各部を制御す
ることにより、図10(e) に示した符号語の系列から元
の文字列を復元することができる。
【0194】図20に、このデータ復元装置によるデー
タ復元動作を表す流れ図を示す。まず、上述したステッ
プ401,402と同様にして第1符号を復号し、その
復号結果に基づいて、符号化モードの判定を行う(ステ
ップ431,432)。
【0195】ここで、上述したように、符号の木に対
応するシンボルの系列においては、文字とアドレスとは
対応するシンボルの最上位ビットによって区別されてお
り、また、各シンボルは13ビットのビット列で表され
ている。したがって、この場合は、ステップ432にお
いて、各シンボルで表される数値が数値『4096』よ
りも大きいか否かによって、複製モードであるか否かを
判定すればよい。
【0196】このステップ432における否定判定の場
合は、ステップ403と同様に、復号結果として得られ
たシンボルから文字を復元し(ステップ433)、ステ
ップ437に進む。
【0197】一方、ステップ432の肯定判定の場合
に、復元制御部235は、まず、上述したシンボルから
一致開始位置を示すPバッファ201のアドレスを復元
し(ステップ434)、読出処理部233に送出する。
次に、復元制御部235からの指示に応じて、スプレイ
復号部232が符号の木を用いて次のスプレイ符号、
すなわち第2符号を復号し(ステップ435)、得られ
た復号結果を一致長として読出処理部233に送出すれ
ばよい。
【0198】このようにして得られた一致開始位置およ
び一致長に基づいて、読出処理部232は、Pバッファ
201から該当する文字列を読み出して、復元文字列と
して出力する(ステップ436)。
【0199】その後、ステップ437,438におい
て、ステップ407,408と同様のバッファ管理処理
および未処理符号の有無の判定処理を行い、ステップ4
08の肯定判定に応じて、ステップ431に戻って新し
い符号の復元処理行う。
【0200】この場合は、図10(e) に示したように、
符号語の系列は、スプレイ符号とスプレイ符号とか
ら形成されているので、復元制御部235が、上述した
ようにして、スプレイ復号部232による復号処理に用
いられ符号の木を切り換えることにより、請求項22お
よび請求項23で述べた抽出手段132の機能が果たさ
れる。また、復元制御部235からの指示に対応する符
号の木を用いて、スプレイ復号部232が復号処理を行
うことにより、請求項22のスプレイ復号手段142と
請求項23のスプレイ復号手段145との機能を果た
し、これらの復号結果に基づいて読出処理部233が動
作することにより、請求項23で述べた文字列復元手段
143の機能を実現する構成となっている。
【0201】また、図15において、符号の木に代え
て、上述した符号の木と16通りの符号の木1
16と符号の木とを符号表格納部234に格納し、復元
制御部235が、後述するようにして、復元処理部23
0の各部を制御することにより、請求項24のデータ復
元装置を実現し、図10(f) に示した符号語の系列から
元の文字列を復元することができる。
【0202】この場合は、符号表格納部234に格納さ
れた符号の木は、請求項24の符号表151に相当す
るものであり、16通りの符号の木1 16は符号表
152に相当するものである。
【0203】図21に、請求項24のデータ復元装置に
よるデータ復元動作を表す流れ図を示す。まず、上述し
たステップ401,402と同様にして、最初のスプレ
イ符号を復号し、その復号結果に基づいて、符号化モ
ードの判定を行う(ステップ441,442)。ここ
で、上述したように、符号の木に対応するシンボルの
系列においては、文字の上位部分と一致長とは対応する
シンボルの最上位ビットによって区別されており、ま
た、各シンボルは5ビットのビット列で表されている。
したがって、この場合は、ステップ442において、各
シンボルで表される数値が数値『16』よりも大きいか
否かによって、複製モードであるか否かを判定すればよ
い。
【0204】このステップ442における否定判定の場
合に、復元制御部235は、まず、上述したステップ4
41で得られた復号結果から文字を表すビット列の上位
部分を復元し(ステップ443)、この上位部分に対応
する符号の木を指定して、スプレイ復号部232に対
して次のスプレイ符号の復号処理を指示する。
【0205】これに応じて、スプレイ復号部232は、
該当する符号の木を用いて、入力されたスプレイ符号
を復号し(ステップ444)、復号結果を復元制御部
235に送出する。
【0206】次に、復元制御部235は、ステップ44
3で文字の上位部分とステップ444の復号結果として
得られる文字の下位部分とを結合して1文字を復元し
(ステップ445)、ステップ447に進む。
【0207】一方、ステップ443における肯定判定の
場合は、図17に示した流れ図のステップ414〜41
7と同様にして、複製モードの符号語から文字列を復元
して出力する(ステップ446)。
【0208】その後、ステップ407,408と同様の
バッファ管理処理および未処理符号の有無の判定処理を
行い(ステップ447,448)、ステップ448の判
定結果に応じて、ステップ441に戻って新しい符号語
の復元処理を行う。
【0209】このように、復元制御部235が、スプレ
イ復号部232による復号処理に用いられ符号の木を切
り換えることにより、請求項24で述べた抽出手段13
2,154の機能が果たされる。また、復元制御部23
5からの指示に対応する符号の木を用いて、スプレイ復
号部232が復号処理を行うことにより、請求項24の
スプレイ復号手段153およびスプレイ復号手段155
の機能を果たし、これらの復号結果に基づいて読出処理
部233が動作することにより、請求項24の文字列復
元手段156の機能を実現する構成となっている。
【0210】これにより、請求項12のデータ圧縮装置
によって得られた符号語からLZSS符号化方法による
符号化結果を復元し、更に元の文字列を復元することが
可能となる。
【0211】また、図15において、符号の木に代え
て、上述した符号の木と16通りの符号の木1
16と符号の木とを符号表格納部234に格納し、復元
制御部235が、後述するようにして、復元処理部23
0の各部を制御することにより、図10(g) に示した符
号語の系列から元の文字列を復元することができる。
【0212】この場合は、図21に示したステップ44
6において、ステップ414〜ステップ417の処理を
行う代わりに、図19に示したステップ424〜ステッ
プ427の処理を行うことにより、複製モードの符号語
からLZSS符号化方法による符号化結果を復元し、更
に文字列を復元すればよい。
【0213】
【発明の効果】以上説明したように本発明のデータ圧縮
装置は、LZSS符号化方法による2つのモードの符号
化結果を組み合わせて可変長符号化することにより、生
データモードと複製モードとの出現確率の偏りと各モー
ドにおける符号化結果の出現確率の偏りとを利用して、
LZSS符号化方法による符号化結果を圧縮することが
でき、LZSS符号化方法の短所を補って、圧縮能率を
向上することが可能である。
【0214】特に、生データモードにおける文字と複製
モードにおける一致長(あるいはアドレスの少なくとも
一部)とを組み合わせて可変長符号化し、更に、複製モ
ードの場合に、アドレスの少なくとも一部(あるいは一
致長)を単独で可変長符号化することにより、大きな効
果を得ることができる。
【0215】また、生データモードにおける文字を上位
部分と下位部分とに分け、上位部分と複製モードにおけ
る符号化結果とを組み合わせて可変長符号化することに
より、画像データのように、ランダムな成分を含む情報
にも柔軟に対応して、圧縮能率の向上を図ることができ
る。この場合に、更に、文字の下位部分を上位部分に従
属して可変長符号化することにより、ランダムな成分を
含む情報とテキストデータのような文字としての出現確
率に偏りがある情報との両方に対応することができる。
【0216】一方、復元側においては、符号から抽出し
た可変長符号の復号結果によって符号化モードを知るこ
とができるから、この判別結果に応じて、復号結果から
LZSS符号化方法による符号化結果を復元し、更に従
来と同様の復元処理を行うことにより、元の文字列を復
元することができる。
【図面の簡単な説明】
【図1】本発明のデータ圧縮方法の原理を示す図であ
る。
【図2】請求項8ないし請求項11のデータ圧縮装置の
原理ブロック図である。
【図3】請求項12のデータ圧縮装置の原理ブロック図
である。
【図4】本発明のデータ復元方法の原理を示す図であ
る。
【図5】請求項20ないし請求項23のデータ復元装置
の原理ブロック図である。
【図6】請求項24のデータ復元装置の原理ブロック図
である。
【図7】請求項8のデータ圧縮装置の実施例構成図であ
る。
【図8】符号の例を示す図である。
【図9】データ圧縮動作を表す流れ図である。
【図10】符号語の系列の例を示す図である。
【図11】データ圧縮動作を表す流れ図である。
【図12】データ圧縮動作を表す流れ図である。
【図13】データ圧縮動作を表す流れ図である。
【図14】請求項9のデータ圧縮装置の別実施例構成図
である。
【図15】請求項20のデータ復元装置の実施例構成図
である。
【図16】データ復元動作を表す流れ図である。
【図17】データ復元動作を表す流れ図である。
【図18】請求項21のデータ復元装置の別実施例構成
図である。
【図19】データ復元動作を表す流れ図である。
【図20】データ復元動作を表す流れ図である。
【図21】データ復元動作を表す流れ図である。
【図22】従来のデータ圧縮装置の構成例を示す図であ
る。
【図23】符号語の構成を示す図である。
【図24】スプレイ符号化方法の説明図である。
【符号の説明】
101,104 辞書 102 マッチング手段 103 符号化手段 111,113,115,117,121,122 符
号表 112,114,116,118,123,124 ス
プレイ符号化手段 130 復元処理手段 131,136,141,144,151,152 符
号表 132,154 抽出手段 133,137,142,145,153,155 ス
プレイ復号手段 134 判別手段 135,143,156 文字列復元手段 201 Pバッファ 202 Qバッファ 203 マッチング部 211,221 スプレイ符号化部 212,222 符号表格納部 213 符号化制御部 214 符号語作成部 230 復元処理部 231 デマルチプレクサ(DMPX) 232 スプレイ復号部 233 読出処理部 234 符号表格納部 235 復元制御部 501 符号化部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 矢作 裕紀 神奈川県川崎市中原区上小田中1015番地 富士通株式会社内

Claims (24)

    【特許請求の範囲】
  1. 【請求項1】 辞書101内に蓄積された符号化済みの
    文字列のなかから、符号化対象の文字列と最大長一致す
    る一致文字列を検索し、その一致長に応じて、符号化対
    象の文字列そのものを1文字単位で符号として送出する
    生データモードと、前記一致文字列の前記辞書101に
    おける位置に関する情報および前記一致長に関する情報
    を符号として送出する複製モードとを切り換えるスライ
    ド辞書型のデータ圧縮方法において、 前記生データモードにおいて得られる相異なる符号化結
    果と前記複製モードにおいて得られる相異なる符号化結
    果とに対して一連の番号を与え、 前記生データモードおよび前記複製モードにおいて、そ
    れぞれ得られた符号化結果に対応する番号を符号表を用
    いて符号化し、 前記符号表を該当する符号に着目して組み替え、該当す
    る符号の符号長を減ずることを特徴とするデータ圧縮方
    法。
  2. 【請求項2】 請求項1に記載のデータ圧縮方法におい
    て、 生データモードにおける符号化結果として得られる文字
    と複製モードにおいて得られる相異なる符号化結果とに
    対して一連の番号を与えることを特徴とするデータ圧縮
    方法。
  3. 【請求項3】 請求項1に記載のデータ圧縮方法におい
    て、 生データモードにおける相異なる符号化結果と複製モー
    ドにおいて得られる相異なる一致長とに対して一連の番
    号を与えることを特徴とするデータ圧縮方法。
  4. 【請求項4】 請求項3に記載のデータ圧縮方法におい
    て、 複製モードにおいて、一致文字列の位置に関する情報の
    少なくとも一部を符号表を用いて符号化し、 前記符号表を該当する符号に着目して組み替えて、該当
    する符号の符号長を減じることを特徴とするデータ圧縮
    方法。
  5. 【請求項5】 請求項1に記載のデータ圧縮方法におい
    て、 生データモードにおける相異なる符号化結果と複製モー
    ドにおいて一致文字列の位置として得られるアドレスの
    少なくとも一部のビット列について考えられる全ての組
    み合わせとに対して一連の番号を与えることを特徴とす
    るデータ圧縮方法。
  6. 【請求項6】 請求項5に記載のデータ圧縮方法におい
    て、 複製モードにおいて、一致長に関する情報を符号表を用
    いて符号化し、 前記符号表を該当する符号に着目して組み替えて、該当
    する符号の符号長を減じることを特徴とするデータ圧縮
    方法。
  7. 【請求項7】 請求項1のデータ圧縮方法において、 生データモードにおける符号化結果として得られる文字
    の上位部分のビット列について考えられる組み合わせの
    それぞれと複製モードにおける相異なる符号化結果とに
    対して一連の番号を与え、 前記文字の上位部分のビット列の組み合わせのそれぞれ
    に対応して、文字の下位部分のビット列の組み合わせに
    対して番号を与えた符号表を設け、 前記生データモードにおいて、符号化結果として得られ
    た文字の上位部分に対応する符号表によって示される前
    記文字の下位部分に与えられた番号をその出現確率に応
    じて可変長符号化することを特徴とするデータ圧縮方
    法。
  8. 【請求項8】 辞書(101)内に蓄積された符号化済
    みの文字列のなかから、マッチング手段(102)によ
    り、符号化対象の文字列と最大長一致する一致文字列を
    検索し、その一致長に応じて、符号化手段(103)
    が、符号化対象の文字列そのものを1文字単位で符号と
    して送出する生データモードと、前記一致文字列の前記
    辞書(101)における位置に関する情報および前記一
    致長に関する情報を符号として送出する複製モードとを
    切り換えながら動作するスライド辞書型のデータ圧縮装
    置において、 前記生データモードにおいて前記符号化手段(103)
    で得られる各文字と前記複製モードにおいて得られる一
    致長とに与えられた一連の番号に対応する符号を符号の
    木の形式で保持する符号表(111)と、 前記生データモードにおける文字および前記複製モード
    における一致長の入力に応じて、それぞれに対応する符
    号を前記符号表(111)から検索して出力するととも
    に、該当する符号の長さが半分になるように前記符号の
    木を組み替えるスプレイ符号化手段(112)とを備え
    たことを特徴とするデータ圧縮装置。
  9. 【請求項9】 請求項8のデータ圧縮装置において、 複製モードにおいて、符号化手段(103)によって一
    致文字列の位置を示す情報として得られるアドレスの少
    なくとも一部のビット列について考えられる各組み合わ
    せに対応する符号を登録した符号の木を保持する符号表
    (113)と、 前記アドレスの少なくとも一部の入力に応じて前記符号
    表(113)を参照し、該当する符号を出力するととも
    に、該当する符号の長さが半分になるように前記符号の
    木を組み替えるスプレイ符号化手段(114)とを備え
    たことを特徴とするデータ圧縮装置。
  10. 【請求項10】 辞書(101)内に蓄積された符号化
    済みの文字列のなかから、マッチング手段(102)に
    より、符号化対象の文字列と最大長一致する一致文字列
    を検索し、その一致長に応じて、符号化手段(103)
    が、符号化対象の文字列そのものを1文字単位で符号と
    して送出する生データモードと、前記一致文字列の前記
    辞書(101)における位置に関する情報および前記一
    致長に関する情報を符号として送出する複製モードとを
    切り換えながら動作するスライド辞書型のデータ圧縮装
    置において、 前記生データモードにおいて前記符号化手段(103)
    で得られる各文字と前記複製モードにおいて一致文字列
    の位置として得られるアドレスの少なくとも一部のビッ
    ト列について考えられる各組み合わせとに与えられた一
    連の番号に対応する符号を符号の木の形式で保持する符
    号表(115)と、 前記生データモードにおける文字および前記複製モード
    におけるアドレスの少なくとも一部の入力に応じて、そ
    れぞれに対応する符号を前記符号表(115)から検索
    して出力するとともに、該当する符号の長さが半分にな
    るように前記符号の木を組み替えるスプレイ符号化手段
    (116)とを備えたことを特徴とするデータ圧縮装
    置。
  11. 【請求項11】 請求項10のデータ圧縮装置におい
    て、 複製モードにおいて、符号化手段(103)による符号
    化結果として得られる各一致長に対応する符号を登録し
    た符号の木を保持する符号表(117)と、 前記一致長の入力に応じて前記符号表(117)を参照
    し、該当する符号を出力するとともに、該当する符号の
    長さが半分になるように前記符号の木を組み替えるスプ
    レイ符号化手段(118)とを備えたことを特徴とする
    データ圧縮装置。
  12. 【請求項12】 辞書(101)内に蓄積された符号化
    済みの文字列のなかから、マッチング手段(102)に
    より、符号化対象の文字列と最大長一致する一致文字列
    を検索し、その一致長に応じて、符号化手段(103)
    が、符号化対象の文字列そのものを1文字単位で符号と
    して送出する生データモードと、前記一致文字列の前記
    辞書(101)における位置に関する情報および前記一
    致長に関する情報を符号として送出する複製モードとを
    切り換えながら動作するスライド辞書型のデータ圧縮装
    置において、 前記生データモードにおいて前記符号化手段(103)
    で得られる文字を表すビット列の上位部分について考え
    られる各組み合わせと前記複製モードにおいて得られる
    相異なる符号化結果とに与えられた一連の番号に対応す
    る符号を符号の木の形式で保持する符号表(121)
    と、 前記文字の上位部分のそれぞれに対応して、文字の下位
    部分のビット列の各組み合わせに与えた符号を符号の木
    の形式でそれぞれ保持する符号表(122)と、 前記生データモードにおける文字の上位部分および前記
    複製モードにおける符号化結果の入力に応じて、それぞ
    れに対応する符号を前記符号表(121)から検索して
    出力するとともに、該当する符号の長さが半分になるよ
    うに前記符号の木を組み替えるスプレイ符号化手段(1
    23)と、 前記文字の上位部分に応じて前記符号表(122)から
    該当する符号の木を選択し、前記生データモードで得ら
    れる文字の下位部分に対応する符号を検索して出力する
    とともに、該当する符号の長さが半分になるように前記
    符号の木を組み替えるスプレイ符号化手段(124)と
    を備えたことを特徴とするデータ圧縮装置。
  13. 【請求項13】 辞書内に蓄積された符号化済みの文字
    列のなかから、符号化対象の文字列と最大長一致する一
    致文字列を検索し、その一致長に応じて、符号化対象の
    文字列そのものを1文字単位で符号として送出する生デ
    ータモードと、前記一致文字列の前記辞書における位置
    に関する情報および前記一致長に関する情報を符号とし
    て送出する複製モードとを切り換えるスライド辞書型の
    データ圧縮方法によって得られる符号から元の文字列を
    復元するデータ復元方法において、 前記生データモードにおいて得られる相異なる符号化結
    果と前記複製モードにおいて得られる相異なる符号化結
    果とに対して一連の番号を与えて、それぞれの番号に対
    応する符号を登録した第1の符号表を用意し、 前記第1の符号表に基づいて、入力される符号から前記
    一連の番号のいずれかに対応する第1符号を抽出して、
    前記第1の符号表を用いて復号し、 前記第1の符号表を該当する符号に着目して組み替え
    て、該当する符号の長さを減じ、 前記第1符号の復号結果として得られる番号に基づい
    て、前記第1符号が生データモードであるか複製モード
    であるかを判別し、 前記番号で示される符号化結果に対して、該当する符号
    化モードに応じた復元処理を行うことを特徴とするデー
    タ復元方法。
  14. 【請求項14】 請求項13に記載のデータ復元方法に
    おいて、 生データモードにおける符号化結果として得られる文字
    と複製モードにおいて得られる相異なる符号化結果とに
    対して一連の番号を与え、 第1符号が生データモードである場合に、前記第1符号
    の復号結果として得られた番号に対応する文字を復元文
    字列として出力するとともに辞書に蓄積することを特徴
    とするデータ復元方法。
  15. 【請求項15】 請求項13に記載のデータ復元方法に
    おいて、 生データモードにおける相異なる符号化結果と複製モー
    ドにおいて得られる相異なる一致長とに対して一連の番
    号を与え、 第1符号が複製モードである場合に、前記第1符号の復
    号結果として得られた番号から一致長を得ることを特徴
    とするデータ復元方法。
  16. 【請求項16】 請求項15に記載のデータ復元方法に
    おいて、 一致文字列の位置に関する情報の少なくとも一部に対応
    する符号を登録した第2の符号表を用意しておき、 第1符号が複製モードである場合に、前記第1符号に続
    く第2符号を前記第2の符号表に基づいて抽出し、 前記第2符号を第2の符号表を用いて復号して、一致文
    字列の位置に関する情報の少なくとも一部を復元し、 前記第2の符号表を該当する符号に着目して組み替え
    て、該当する符号の長さを減ずることを特徴とするデー
    タ復元方法。
  17. 【請求項17】 請求項13に記載のデータ復元方法に
    おいて、 生データモードにおける相異なる符号化結果と複製モー
    ドにおいて一致文字列の位置として得られるアドレスの
    少なくとも一部のビット列について考えられる全ての組
    み合わせとに対して一連の番号を与え、この一連の番号
    に対応する符号を登録した第1の符号表を用意し、 複製モードの第1符号の入力に応じて、前記第1符号の
    復号結果として得られる番号に対応する前記アドレスの
    少なくとも一部を得ることを特徴とするデータ復元方
    法。
  18. 【請求項18】 請求項17に記載のデータ復元方法に
    おいて、 一致長にに対応する符号を登録した第2の符号表を用意
    しておき、 第1符号が複製モードである場合に、前記第1符号に続
    く第2符号として前記第2の符号表に基づいて抽出し、 前記第2符号を前記第2の符号表を用いて復号して一致
    長を復元し、 前記第2の符号表を該当する符号に着目して組み替え
    て、該当する符号の長さを減じることを特徴とするデー
    タ復元方法。
  19. 【請求項19】 請求項13のデータ復元方法におい
    て、 生データモードにおける符号化結果として得られる文字
    の上位部分のビット列について考えられる組み合わせの
    それぞれと複製モードにおける相異なる符号化結果とに
    対して一連の番号を与え、 前記文字の上位部分のビット列の組み合わせのそれぞれ
    に対応して、文字の下位部分のビット列の組み合わせに
    対して番号を与えた符号表を設け、 第1符号が生データである場合に、前記第1符号の可変
    長復号結果として得られる番号から文字の上位部分を復
    元し、 前記第1符号に続く可変長符号を第2符号として抽出
    し、 前記文字の上位部分に対応する符号表を用いて、前記第
    2符号を可変長復号して、前記文字の下位部分を得るこ
    とを特徴とするデータ復元方法。
  20. 【請求項20】 辞書内に蓄積された符号化済みの文字
    列のなかから、符号化対象の文字列と最大長一致する一
    致文字列を検索し、その一致長に応じて、符号化対象の
    文字列そのものを1文字単位で符号として送出する生デ
    ータモードと、前記一致文字列の前記辞書における位置
    に関する情報および前記一致長に関する情報を符号とし
    て送出する複製モードとを切り換えるスライド辞書型の
    データ圧縮方法によって得られる符号の入力に応じて、
    復元処理手段(130)が元の文字列を復元し、辞書
    (104)に蓄積するデータ復元装置において、 前記復元処理手段(130)が、 前記生データモードにおいて得られる各文字と前記複製
    モードにおいて得られる一致長とに与えられた一連の番
    号に対応する符号を符号の木の形式で保持する符号表
    (131)と、 入力される符号から可変長符号を第1符号として抽出す
    る抽出手段(132)と、 前記第1符号を前記符号表(131)を用いてスプレイ
    復号化し、該当する番号を出力するとともに、該当する
    符号の長さが半分になるように前記符号の木を組み替え
    るスプレイ復号手段(133)と、 前記第1符号の復号結果として得られる番号に基づい
    て、前記第1符号が生データモードであるか複製モード
    であるかを判別する判別手段(134)と、 生データモードである旨の判別結果の入力に応じて、前
    記番号から文字を得て復元文字列として出力し、複製モ
    ードである旨の判別結果の入力に応じて、前記番号から
    得られる一致長に基づいて前記辞書(104)から一致
    文字列を検索し、復元文字列として出力する文字列復元
    手段(135)とを備えた構成であることを特徴とする
    データ復元装置。
  21. 【請求項21】 請求項20のデータ復元装置におい
    て、 復元処理手段(130)が、 複製モードにおいて、一致文字列の位置を示す情報とし
    て得られるアドレスの少なくとも一部のビット列につい
    て考えられる各組み合わせに対応する符号を登録した符
    号の木を保持する符号表(136)と、 可変長符号の入力に応じて前記符号表(136)を参照
    し、該当するビット列を出力するとともに、該当する符
    号の長さが半分になるように前記符号の木を組み替える
    スプレイ復号手段(137)とを備え、 抽出手段(132)が、第1符号が複製モードである旨
    の判別結果の入力に応じて、前記第1符号に続く可変長
    符号を第2符号として抽出し、前記スプレイ復号手段
    (137)に送出する構成であり、 文字列復元手段(135)は、複製モードである旨の判
    別結果に応じて、スプレイ復号手段(133)で得られ
    る番号で示される一致長と、前記スプレイ復号手段(1
    37)で得られるビット列で示されるアドレスとに基づ
    いて、辞書(104)から一致文字列を検索する構成で
    あることを特徴とするデータ復元装置。
  22. 【請求項22】 辞書内に蓄積された符号化済みの文字
    列のなかから、符号化対象の文字列と最大長一致する一
    致文字列を検索し、その一致長に応じて、符号化対象の
    文字列そのものを1文字単位で符号として送出する生デ
    ータモードと、前記一致文字列の前記辞書における位置
    に関する情報および前記一致長に関する情報を符号とし
    て送出する複製モードとを切り換えるスライド辞書型の
    データ圧縮方法によって得られる符号の入力に応じて、
    復元処理手段(130)が元の文字列を復元し、辞書
    (104)に蓄積するデータ復元装置において、 前記復元処理手段(130)が、 前記生データモードにおいて得られる各文字と前記複製
    モードにおいて得られる一致文字列の位置として得られ
    るアドレスの少なくとも一部のビット列について考えら
    れる各組み合わせとに与えられた一連の番号に対応する
    符号を符号の木の形式で保持する符号表(141)と、 入力される符号から可変長符号を第1符号として抽出す
    る抽出手段(132)と、 前記第1符号を前記符号表(141)を用いてスプレイ
    復号化し、該当する番号を出力するとともに、該当する
    符号の長さが半分になるように前記符号の木を組み替え
    るスプレイ復号手段(142)と、 前記第1符号の復号結果として得られる番号に基づい
    て、前記第1符号が生データモードであるか複製モード
    であるかを判別する判別手段(134)と、 生データモードである旨の判別結果の入力に応じて、前
    記番号から文字を得て復元文字列として出力し、複製モ
    ードである旨の判別結果の入力に応じて、前記番号から
    得られるアドレスの少なくとも一部に基づいて前記辞書
    (104)から一致文字列を検索し、復元文字列として
    出力する文字列復元手段(143)とを備えた構成であ
    ることを特徴とするデータ復元装置。
  23. 【請求項23】 請求項22のデータ復元装置におい
    て、 復元処理手段(130)が、 複製モードにおいて得られる各一致長に対応する符号を
    登録した符号の木を保持する符号表(144)と、 可変長符号の入力に応じて前記符号表(144)を参照
    し、該当する一致長を出力するとともに、該当する符号
    の長さが半分になるように前記符号の木を組み替えるス
    プレイ復号手段(145)とを備え、 抽出手段(132)が、第1符号が複製モードである旨
    の判別結果の入力に応じて、前記第1符号に続く可変長
    符号を第2符号として抽出し、前記スプレイ復号手段
    (145)に送出する構成であり、 文字列復元手段(143)は、複製モードである旨の判
    別結果に応じて、スプレイ復号手段(142)で得られ
    る番号で示されるアドレスと、前記スプレイ復号手段
    (145)で得られる一致長とに基づいて、辞書(10
    4)から一致文字列を検索する構成であることを特徴と
    するデータ復元装置。
  24. 【請求項24】 辞書内に蓄積された符号化済みの文字
    列のなかから、符号化対象の文字列と最大長一致する一
    致文字列を検索し、その一致長に応じて、符号化対象の
    文字列そのものを1文字単位で符号として送出する生デ
    ータモードと、前記一致文字列の前記辞書における位置
    に関する情報および前記一致長に関する情報を符号とし
    て送出する複製モードとを切り換えるスライド辞書型の
    データ圧縮方法によって得られる符号の入力に応じて、
    復元処理手段(130)が元の文字列を復元し、辞書
    (104)に蓄積するデータ復元装置において、 前記復元処理手段(130)が、 前記生データモードにおいて得られる文字を表すビット
    列の上位部分について考えられる各組み合わせと前記複
    製モードにおいて得られる相異なる符号化結果とに与え
    られた一連の番号に対応する符号を符号の木の形式で保
    持する符号表(151)と、 前記文字の上位部分のそれぞれに対応して、文字の下位
    部分のビット列の各組み合わせに与えた符号を符号の木
    の形式でそれぞれ保持する符号表(152)と、 入力される符号から可変長符号を第1符号として抽出す
    る抽出手段(132)と、 前記第1符号を前記符号表(151)を用いてスプレイ
    復号化し、該当する番号を出力するとともに、該当する
    符号の長さが半分になるように前記符号の木を組み替え
    るスプレイ復号手段(153)と、 前記第1符号の復号結果として得られる番号に基づい
    て、前記第1符号が生データモードであるか複製モード
    であるかを判別する判別手段(134)と、 生データモードである旨の判別結果の入力に応じて、前
    記第1符号に続く可変長符号を第2符号として抽出する
    抽出手段(154)と、 生データモードである旨の判別結果に応じて、前記スプ
    レイ復号手段(153)で得られた番号で示される文字
    の上位部分に応じて前記符号表(152)から該当する
    符号の木を選択し、前記第2符号をスプレイ復号化して
    前記文字の下位部分を出力するとともに、該当する符号
    の長さが半分になるように前記符号の木を組み替えるス
    プレイ符号化手段(155)と、 生データモードである旨の判別結果の入力に応じて、前
    記スプレイ復号手段(153)で得られる番号で示され
    る文字の上位部分と前記スプレイ復号手段(155)か
    ら得られる文字の下位部分とを結合して復元文字列とし
    て出力し、複製モードである旨の判別結果の入力に応じ
    て、前記番号で示される符号化結果に基づいて前記辞書
    (104)から一致文字列を検索し、復元文字列として
    出力する文字列復元手段(156)とを備えた構成であ
    ることを特徴とするデータ復元装置。
JP04587494A 1994-03-16 1994-03-16 データ圧縮方法および装置ならびにデータ復元方法および装置 Expired - Fee Related JP3397431B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP04587494A JP3397431B2 (ja) 1994-03-16 1994-03-16 データ圧縮方法および装置ならびにデータ復元方法および装置
US08/405,209 US5673042A (en) 1994-03-16 1995-03-16 Method of and an apparatus for compressing/decompressing data

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP04587494A JP3397431B2 (ja) 1994-03-16 1994-03-16 データ圧縮方法および装置ならびにデータ復元方法および装置

Publications (2)

Publication Number Publication Date
JPH07261977A true JPH07261977A (ja) 1995-10-13
JP3397431B2 JP3397431B2 (ja) 2003-04-14

Family

ID=12731367

Family Applications (1)

Application Number Title Priority Date Filing Date
JP04587494A Expired - Fee Related JP3397431B2 (ja) 1994-03-16 1994-03-16 データ圧縮方法および装置ならびにデータ復元方法および装置

Country Status (2)

Country Link
US (1) US5673042A (ja)
JP (1) JP3397431B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6778103B2 (en) 1998-08-13 2004-08-17 Fujitsu Limited Encoding and decoding apparatus using context
JP2006295853A (ja) * 2005-04-14 2006-10-26 Sony Corp 符号化装置、復号装置、および、符号化方法ならびに復号方法
JP2007037115A (ja) * 2005-07-11 2007-02-08 Quantum Corp デジタルデータを符号化する方法、データセグメントのストリームを符号化する方法、エンコーダ、データのソースを符号化するためのパラレルエンコーダ、符号化データのソースを復号するためのパラレルデコーダ、コード化データを復号する方法、磁気テープドライブ、およびデータのストリームを符号化する方法
JP2010068511A (ja) * 2008-07-21 2010-03-25 Sony Computer Entertainment Europe Ltd データ圧縮及びデータ伸張
JP2016143987A (ja) * 2015-01-30 2016-08-08 富士通株式会社 圧縮プログラム、圧縮方法、圧縮装置および伸長プログラム

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5999949A (en) * 1997-03-14 1999-12-07 Crandall; Gary E. Text file compression system utilizing word terminators
US6301394B1 (en) * 1998-09-25 2001-10-09 Anzus, Inc. Method and apparatus for compressing data
JP2000201080A (ja) * 1999-01-07 2000-07-18 Fujitsu Ltd 付加コ―ドを用いたデ―タ圧縮/復元装置および方法
JP2000261803A (ja) * 1999-03-04 2000-09-22 Sega Enterp Ltd 画像情報の符号化方法及び復号化方法
US6611213B1 (en) 1999-03-22 2003-08-26 Lucent Technologies Inc. Method and apparatus for data compression using fingerprinting
US6236341B1 (en) 2000-03-16 2001-05-22 Lucent Technologies Inc. Method and apparatus for data compression of network packets employing per-packet hash tables
US6388584B1 (en) 2000-03-16 2002-05-14 Lucent Technologies Inc. Method and apparatus for data compression of network packets
DE10131801B4 (de) * 2001-06-30 2013-03-07 Robert Bosch Gmbh Verfahren zur Datenkompression und Navigationssystem
GB0117721D0 (en) * 2001-07-20 2001-09-12 Surfcontrol Plc Database and method of generating same
US6798360B1 (en) * 2003-06-27 2004-09-28 Canadian Space Agency Method and system for compressing a continuous data flow in real-time using recursive hierarchical self-organizing cluster vector quantization (HSOCVQ)
US7079054B2 (en) * 2004-06-04 2006-07-18 Broadcom Corporation V.42bis standalone hardware accelerator and architecture of construction
US7507897B2 (en) * 2005-12-30 2009-03-24 Vtech Telecommunications Limited Dictionary-based compression of melody data and compressor/decompressor for the same
US7836037B2 (en) * 2007-10-04 2010-11-16 Sap Ag Selection of rows and values from indexes with updates
US8176080B2 (en) * 2009-03-06 2012-05-08 Hewlett-Packard Development Company, L.P. Desensitizing character strings
JP5656593B2 (ja) * 2010-12-07 2015-01-21 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 符号化データを復号する装置及び方法
US8902087B1 (en) 2013-08-27 2014-12-02 International Business Machines Corporation Data decompression utilizing pre-expanded dictionaries during decompression
WO2015066086A1 (en) 2013-10-28 2015-05-07 Changello Enterprise Llc Piezo based force sensing
US11138152B2 (en) 2017-10-11 2021-10-05 Lognovations Holdings, Llc Method and system for content agnostic file indexing
US10963429B2 (en) 2017-10-11 2021-03-30 Lognovations Holdings, Llc Method and system for content agnostic file indexing

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4899148A (en) * 1987-02-25 1990-02-06 Oki Electric Industry Co., Ltd. Data compression method
US5003307A (en) * 1989-01-13 1991-03-26 Stac, Inc. Data compression apparatus with shift register search means

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6778103B2 (en) 1998-08-13 2004-08-17 Fujitsu Limited Encoding and decoding apparatus using context
US6906644B2 (en) 1998-08-13 2005-06-14 Fujitsu Limited Encoding and decoding apparatus with matching length means for symbol strings
JP2006295853A (ja) * 2005-04-14 2006-10-26 Sony Corp 符号化装置、復号装置、および、符号化方法ならびに復号方法
JP2007037115A (ja) * 2005-07-11 2007-02-08 Quantum Corp デジタルデータを符号化する方法、データセグメントのストリームを符号化する方法、エンコーダ、データのソースを符号化するためのパラレルエンコーダ、符号化データのソースを復号するためのパラレルデコーダ、コード化データを復号する方法、磁気テープドライブ、およびデータのストリームを符号化する方法
JP2010068511A (ja) * 2008-07-21 2010-03-25 Sony Computer Entertainment Europe Ltd データ圧縮及びデータ伸張
JP2016143987A (ja) * 2015-01-30 2016-08-08 富士通株式会社 圧縮プログラム、圧縮方法、圧縮装置および伸長プログラム

Also Published As

Publication number Publication date
JP3397431B2 (ja) 2003-04-14
US5673042A (en) 1997-09-30

Similar Documents

Publication Publication Date Title
JP3397431B2 (ja) データ圧縮方法および装置ならびにデータ復元方法および装置
US5870036A (en) Adaptive multiple dictionary data compression
US4906991A (en) Textual substitution data compression with finite length search windows
US5243341A (en) Lempel-Ziv compression scheme with enhanced adapation
JP3278297B2 (ja) データ圧縮方法及びデータ復元方法並びにデータ圧縮装置及びデータ復元装置
JP3541930B2 (ja) 符号化装置及び復号化装置
JP4479530B2 (ja) データ圧縮装置、及びデータ復元装置
JP3258552B2 (ja) データ圧縮装置及びデータ復元装置
JP4905562B2 (ja) データ圧縮装置、及びデータ復元装置
JP2581903B2 (ja) バイト整列式データ圧縮方法及び装置
WO2019153700A1 (zh) 编解码方法、装置及编解码设备
JPH04502377A (ja) データ圧縮
US6304676B1 (en) Apparatus and method for successively refined competitive compression with redundant decompression
Carus et al. Fast text compression using multiple static dictionaries
JP3231105B2 (ja) データ符号化方式及びデータ復元方式
KR20200121760A (ko) 인코딩된 데이터에 대한 조건부 트랜스코딩
JP2536422B2 (ja) デ―タ圧縮装置及びデ―タ復元装置
EP0340039B1 (en) Search tree data structure encoding for textual substitution data compression systems
EP0340041B1 (en) Start, step, stop unary coding for data compression
Tsai et al. An improved LZW algorithm for large data size and low bitwidth per code
Atwal et al. Fast Lempel Ziv (LZ'78) Algorithm Using Codebook Hashing
JPH0628149A (ja) 複数種類データのデータ圧縮方法
JPH05241776A (ja) データ圧縮方式
Anand et al. Compression And Decompression Of Files Without Loss Of Quality
Nakano et al. Highly efficient universal coding with classifying to subdictionaries for text compression

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20030128

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080214

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090214

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090214

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100214

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110214

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110214

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120214

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees