JP3397431B2 - データ圧縮方法および装置ならびにデータ復元方法および装置 - Google Patents

データ圧縮方法および装置ならびにデータ復元方法および装置

Info

Publication number
JP3397431B2
JP3397431B2 JP04587494A JP4587494A JP3397431B2 JP 3397431 B2 JP3397431 B2 JP 3397431B2 JP 04587494 A JP04587494 A JP 04587494A JP 4587494 A JP4587494 A JP 4587494A JP 3397431 B2 JP3397431 B2 JP 3397431B2
Authority
JP
Japan
Prior art keywords
code
character
matching
mode
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP04587494A
Other languages
English (en)
Other versions
JPH07261977A (ja
Inventor
茂 吉田
佳之 岡田
泰彦 中野
裕紀 矢作
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP04587494A priority Critical patent/JP3397431B2/ja
Priority to US08/405,209 priority patent/US5673042A/en
Publication of JPH07261977A publication Critical patent/JPH07261977A/ja
Application granted granted Critical
Publication of JP3397431B2 publication Critical patent/JP3397431B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/3084Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction using adaptive string matching, e.g. the Lempel-Ziv method
    • H03M7/3086Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction using adaptive string matching, e.g. the Lempel-Ziv method employing a sliding window, e.g. LZ77
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • G06F16/90344Query processing by using string matching techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/005Statistical coding, e.g. Huffman, run length coding

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、スライド辞書型のZiv-
Lempel符号化方式を用いてデータを圧縮,復元するデー
タ圧縮方法および装置ならびにデータ復元方法および装
置に関するものである。
【0002】近年、情報処理技術の発達により、コンピ
ュータによって文字コード,ベクトル情報,画像など様
々な種類の膨大なデータが処理されるようになってい
る。このため、データの種類にかかわらず、データの中
の冗長な部分を省いてデータ量を圧縮する技術および圧
縮された情報を復元する技術が必要とされており、これ
に応じて、ユニバーサル符号化が提案されている。
【0003】Ziv-Lempel符号化方式(以下、ZL符号化方
式と称する)は、ユニバーサル符号化方式の代表的なも
のとして知られており(宗像清治著,「Ziv-Lempelデー
タ圧縮法」,情報処理,pp.2〜6,Vol.26,No.1,1985参
照)、そのアルゴリズムは、スライド辞書型と増分分解
型とに分けられる。特に、スライド辞書型のZL符号化方
式は、演算量は大きいが高い圧縮率が得られることが知
られており、スライド辞書型のアルゴリズムを改良した
ものとして、LZSS符号が提案されている(T.C.Bel
l,"Better OPM/L Text Compression",IEEE Trans. on C
ommun.,Vol.COM-34, No.12 Dec. 1986 参照)。また、
パソコンで利用されている書庫管理ソフト“LHA”も
その応用例である。
【0004】スライド辞書型のZL符号化方式は、既に符
号化した文字列の中から、符号化しようとする文字列に
最大長一致する部分列を検出し、検出した部分列の位置
とその一致長とを組み合わせて符号化する方法である。
【0005】ここで、上述した文字とは、データの1ワ
ード単位を示しており、複数ワードのデータの連なりが
文字列と呼ばれている。本明細書においても、文字およ
び文字列を同様の意味で用いる。
【0006】
【従来の技術】図22に、LZSS符号化方式を適用し
た従来のデータ圧縮装置の原理構成を示す。
【0007】図22において、Pバッファ201は、所
定の長さを有するバッファであり、既に符号化された入
力文字列を順次に格納する。また、このPバッファ20
1は、入力文字列を自身の容量まで格納した後は、新し
い文字列の入力に応じて、この文字列に相当する長さの
古い文字列を捨てて、新しい文字列を格納する構成とな
っている。
【0008】また、Qバッファ202は、符号化しよう
とする文字列を格納しており、マッチング部203は、
Qバッファ202内の文字列と最大長一致する文字列を
Pバッファ201から検索し、その一致開始位置と一致
長とを符号化部501に送出する構成となっている。
【0009】これに応じて符号化部501は、図23
(a) に示すように、kビットで表される一致開始位置と
mビットで表される一致長とを組み合わせて符号語を作
成し、ディスク装置などの補助記憶装置あるいは回線に
送出する。
【0010】例えば、上述したPバッファ201とQバ
ッファ202の容量をそれぞれ4kBと16Bとすると、
一致開始位置および一致長をそれぞれ12ビットおよび
4ビットで表すことができるから、図23(a) に示した
符号語の長さは2バイトとなる。
【0011】したがって、1文字を1バイトとすると、
Pバッファ201から3文字以上の一致長を持つ一致文
字列が検索された場合には、上述したようにして入力文
字列を圧縮することができる。特に、英文などのように
繰り返しの多い文字列が入力された場合には、データ量
を大幅に圧縮することが可能である。
【0012】LZSS符号化方式においては、一致長が
2文字以下である場合には、生データモードを選択し、
入力文字を符号化しないでそのまま符号語とする。一
方、一致長が3文字以上である場合は、複製モードを選
択し、上述したようにして、検索した一致文字列の開始
位置と一致長とを組み合わせた符号語を作成する。
【0013】また、各符号語が生データモードであるか
複製モードであるかを識別フラグによって示し、この識
別フラグを8個の符号語ごとにまとめて対応する符号語
の前に付加し、図23(b) に示すような最終的な符号語
の系列を生成している。
【0014】このように、LZSS符号化方式は、識別
フラグや符号語を固定長で表しており、これらをそれぞ
れ8ビット単位にまとめることによって処理の高速化を
図っている。
【0015】これに対して、入力データにおける文字の
出現確率に適応して、出現文字の符号長を動的に変化さ
せる可変長符号化方式の例として、スプレイ符号化(Sp
lay-tree coding )方法がある (D.W.Jones,"Applicati
on of Splay Trees to DataCompression",Communicatio
n of ACM. Vol.31,No.8,Aug 1988 参照)。
【0016】スプレイ符号化法は、符号表として、各文
字に対応する符号を2分探索木の葉として登録した符号
の木を備えており、入力文字を符号化するごとに、該当
する符号の長さが半分になるように符号の木を組み替え
ていくことにより、動的な符号化を行うものである。
【0017】図24に、5つの文字A,B,C,D,E
からなる文字列を符号化する場合を例にとって、スプレ
イ符号化法を説明する図を示す。図24(a) は、図24
(b) に示す符号表を表す符号の木であり、図24(c),
(d) は、文字Cの符号化に伴う符号の木の組み替え過程
および組み替え結果を示し、図24(e) は、符号の木を
組み替えて得られる新しい符号表を示している。
【0018】この例では、まず、文字Cの親の節(図2
4において符号zで示す)と同じ深さの要素である文字
Bと文字Cとを交換し(図24(c) 参照)、更に、その
親の節(図24において符号yで示す)と文字Eとを交
換することにより(図24(d) 参照)、文字Cに対応す
る符号の長さを4ビットから半分の2ビットにしている
(図24(b),(e) 参照)。
【0019】この方法は、ダイナミック・ハフマン符号
化や適応多値算術符号化などの動的可変長符号化方法に
比べて、アルゴリズムの実現が容易で、かつ、高速処理
が可能であるため、注目されている。
【0020】
【発明が解決しようとする課題】上述したLZSS方式
は、生データあるいは一致開始位置と一致長との組み合
わせをそれぞれ固定長で表している。すなわち、生デー
タモードにおける各文字の出現確率や複製モードにおけ
る一致開始位置および一致長の出現確率がほぼ均等であ
ることを前提としている。同様に、生データモードと複
製モードとがほぼ等確率で出現することを前提として、
各符号語に1ビットの識別フラグを付加している。
【0021】しかしながら、一般に、各文字の出現確率
は均等ではないし、入力文字列に対応する一致文字列が
検索される確率は、入力文字列に近い部分のほうが高い
と考えられるから、一致開始位置をPバッファ201の
アドレスで表した場合には、比較的小さい値のアドレス
が多く出現すると考えられる。
【0022】また、Qバッファ202内の入力文字列の
全て(16文字)に一致する一致文字列がPバッファ2
01から検索される確率よりも、一致長が3〜5文字の
一致文字列が検索される確率のほうが大きいことも明白
である。
【0023】更に、符号化処理を開始した当初とPバッ
ファ201の容量程度まで入力データを符号化したとき
とでは、生データモードと複製モードとの出現確率も違
いがある。なぜならば、最初はPバッファ201内に符
号化済みの文字列が格納されていない状態で処理が開始
され、符号化処理の進行に伴って符号化済みの文字列が
Pバッファ201に蓄積されていくから、Pバッファ2
01内の符号化済みの文字列が少ないうちは、生データ
モードで符号化される確率のほうが大きく、その後、次
第に複製モードで符号化される確率のほうが大きくなっ
ていくと考えられるからである。例えば、入力データが
英文などであった場合には、符号化処理の開始当初は生
データで符号化される確率が100パーセントであった
ものが、Pバッファ201の容量程度まで符号化済みの
文字列が蓄積された状態では、複製モードで符号化され
る確率が80パーセント近くまで増大する。
【0024】従来のLZSS符号化方式においては、各
文字や一致文字列の位置および長さや生データモードと
複製モードの出現確率のかたよりにかかわらず、それぞ
れに固定長を与えて符号化していたために、特に、符号
化処理を開始した当初やPバッファ201の容量に比べ
て小さい入力データを符号化した場合において、符号化
能率が低下していた。また、漢字仮名混じりの和文やオ
ブジェクトコードのような冗長性の低いデータを符号化
した場合には、各文字の出現確率の偏りを考慮していな
いために、圧縮率が極めて低下してしまう。
【0025】上述したLZSS符号化方式のように、ス
ライド辞書型の符号化結果を固定長符号化すると、圧縮
処理を高速に行うことができるが、入力データの統計的
な性質や圧縮処理の経過によっては圧縮率が低下してし
まう。
【0026】このようなスライド辞書型の符号化方式の
短所を補って、圧縮率を向上するための手法として、ス
ライド辞書型の符号化方式による符号化結果を可変長符
号化する方法も提案されている。
【0027】スライド辞書型の符号化方式と組み合わさ
れる可変長符号化方法としては、動的ハフマン符号化す
る方法(LHarc)、算術符号化する方法(LHAR
I)、そして、所定の入力データ長ごとに符号表を一括
して作成し、この符号表を用いてハフマン符号化する方
法(LHA)などが提案されており、フリーソフトとし
て発表されている。しかし、これらの可変長符号化方法
は処理速度が遅く、元のLZSS符号化方式の処理速度
の数分の1程度にまで処理速度が低下してしまう。
【0028】なお、動的ハフマン符号化方法に関して
は、J. S. Vitter : "ALGORITHM 673Dynamic Huffman C
oding",ACM Trans. on Mathmatical Software,Vol.15,N
o.2,June 1989,Pages 158-167 を参照されたい。また、
算術符号化に関しては、I.H.Witten他:"Arithmetic Cod
ing for Data Compression", Communication of theAC
M,Vol.30,No.6,June 1987,Pages 520-540 を参照された
い。
【0029】ところで、上述したスプレイ符号化方法
は、動的可変長符号化方法の1つであり、符号の木を動
的に組み替えることにより、入力データの統計的な性質
にかかわらず、ある程度の圧縮率を得ることができると
ともに、高速処理が可能であるという特徴を持ってい
る。
【0030】しかしながら、この方法は、あくまでも入
力データを1文字単位で符号化するものであるから、文
字列としての冗長性はそのまま符号語の系列に残された
ままである。このため、英文などの冗長性の高い入力デ
ータを符号化した場合でも、LZSS符号化方式による
ほどの圧縮率は得られない。
【0031】本発明は、スライド辞書型のZL符号化方式
によって、入力データの統計的な性質にかかわらず、高
い圧縮率を得ることが可能なデータ圧縮方法および装置
を提供することを目的とする。また、このデータ圧縮方
法および装置で作成された符号データから元のデータを
復元するデータ復元方法および装置を提供することを目
的とする。
【0032】
【課題を解決するための手段】図1は、本発明のデータ
圧縮方法の原理を示す図である。請求項1の発明は、辞
書101内に蓄積された符号化済みの文字列のなかか
ら、符号化対象の文字列と最大長一致する一致文字列を
検索し、その一致長に応じて、符号化対象の文字列その
ものを1文字単位で符号として送出する生データモード
と、一致文字列の辞書101における位置に関する情報
および一致長に関する情報を符号として送出する複製モ
ードとを切り換えるスライド辞書型のデータ圧縮方法に
おいて、生データモードにおいて得られる符号化結果の
相異なる要素および複製モードにおいて得られる符号化
結果の相異なる要素とに対して統一的な番号を与えて一
つの符号表に登録し、生データモードおよび複製モード
において、それぞれ得られた符号化結果に対応する番号
を符号表に番号に対応して登録された符号に置き換える
ことによって符号化し、符号表を該当する符号に着目し
て組み替え、該当する符号の符号長を減ずることを特徴
とする。
【0033】請求項2の発明は、請求項1に記載のデー
タ圧縮方法において、生データモードにおける符号化結
果として得られる文字および複製モードにおいて得られ
符号化結果の相異なる要素に対して統一的な番号を与
えることを特徴とする。
【0034】請求項3の発明は、請求項1に記載のデー
タ圧縮方法において、生データモードにおける符号化結
果の相異なる要素および複製モードにおいて得られる相
異なる一致長に対して統一的な番号を与えることを特徴
とする。
【0035】請求項4の発明は、請求項3に記載のデー
タ圧縮方法において、複製モードにおいて、一致文字列
の位置に関する情報の少なくとも一部の相異なる要素に
それぞれ与えられた番号を、番号に対応する符号が登録
された符号表を用いて符号化し、符号表を該当する符号
に着目して組み替えて、該当する符号の符号長を減じる
ことを特徴とする。
【0036】請求項5の発明は、請求項1に記載のデー
タ圧縮方法において、生データモードにおける符号化結
果の相異なる要素および複製モードにおいて一致文字列
の位置として得られるアドレスを表すビット列の少なく
とも一部に相当する相異なる要素に対して統一的な番号
を与えることを特徴とする。
【0037】請求項6の発明は、請求項5に記載のデー
タ圧縮方法において、複製モードにおいて、相異なる
致長にそれぞれ与えられた番号を、番号に対応する符号
が登録された符号表を用いて符号化し、符号表を該当す
る符号に着目して組み替えて、該当する符号の符号長を
減じることを特徴とする。
【0038】請求項7の発明は、請求項1のデータ圧縮
方法において、生データモードにおける符号化結果とし
て得られる文字を表すビット列の上位部分に相当する相
異なる要素および複製モードにおける符号化結果の相異
なる要素に対して統一的な番号を与え、文字を表すビッ
ト列の上位部分に相当する各要素に対応して、文字を表
すビット列の下位部分に相当する相異なる要素に対して
番号を与えた符号表をそれぞれ設け、生データモードに
おいて、符号化結果として得られた文字を表すビット列
上位部分に対応する符号表によって示される文字を表
すビット列の下位部分に与えられた番号をその出現確率
に応じて可変長符号化することを特徴とする。
【0039】図2は、請求項8ないし請求項11のデー
タ圧縮装置の原理ブロック図である。請求項8の発明
は、辞書101内に蓄積された符号化済みの文字列のな
かから、マッチング手段102により、符号化対象の文
字列と最大長一致する一致文字列を検索し、その一致長
に応じて、符号化手段103が、符号化対象の文字列そ
のものを1文字単位で符号として送出する生データモー
ドと、一致文字列の辞書101における位置に関する情
報および一致長に関する情報を符号として送出する複製
モードとを切り換えながら動作するスライド辞書型のデ
ータ圧縮装置において、生データモードにおいて符号化
手段で得られる各文字および複製モードにおいて得られ
相異なる一致長に統一的に与えられた番号に対応する
符号を符号の木の形式で保持する符号表111と、生デ
ータモードにおける文字および複製モードにおける一致
長の入力に応じて、それぞれに対応する符号を符号表1
11から検索して出力するとともに、該当する符号の長
さが半分になるように符号の木を組み替えるスプレイ符
号化手段112とを備えたことを特徴とする。
【0040】請求項9の発明は、請求項8のデータ圧縮
装置において、複製モードにおいて、符号化手段103
によって一致文字列の位置を示す情報として得られるア
ドレス少なくとも一部に相当する相異なるビット列に
対応する符号を登録した符号の木を保持する符号表11
3と、アドレスの少なくとも一部の入力に応じて符号表
113を参照し、該当する符号を出力するとともに、該
当する符号の長さが半分になるように符号の木を組み替
えるスプレイ符号化手段114とを備えたことを特徴と
する。
【0041】請求項10の発明は、辞書101内に蓄積
された符号化済みの文字列のなかから、マッチング手段
102により、符号化対象の文字列と最大長一致する一
致文字列を検索し、その一致長に応じて、符号化手段1
03が、符号化対象の文字列そのものを1文字単位で符
号として送出する生データモードと、一致文字列の辞書
101における位置に関する情報および一致長に関する
情報を符号として送出する複製モードとを切り換えなが
ら動作するスライド辞書型のデータ圧縮装置において、
生データモードにおいて符号化手段103で得られる各
文字および複製モードにおいて一致文字列の位置として
得られるアドレスの少なくとも一部に相当する相異なる
ビット列に統一的に与えられた番号に対応する符号を
号の木の形式で保持する符号表115と、生データモー
ドにおける文字および複製モードにおけるアドレスの少
なくとも一部の入力に応じて、それぞれに対応する符号
を符号表115から検索して出力するとともに、該当す
る符号の長さが半分になるように符号の木を組み替える
スプレイ符号化手段116とを備えたことを特徴とす
る。
【0042】請求項11の発明は、請求項10のデータ
圧縮装置において、複製モードにおいて、符号化手段1
03による符号化結果として得られる各一致長に対応す
る符号を登録した符号の木を保持する符号表117と、
一致長の入力に応じて符号表117を参照し、該当する
符号を出力するとともに、該当する符号の長さが半分に
なるように符号の木を組み替えるスプレイ符号化手段1
18とを備えたことを特徴とする。
【0043】図3は、請求項12のデータ圧縮装置の原
理ブロック図である。請求項12の発明は、辞書101
内に蓄積された符号化済みの文字列のなかから、マッチ
ング手段102により、符号化対象の文字列と最大長一
致する一致文字列を検索し、その一致長に応じて、符号
化手段103が、符号化対象の文字列そのものを1文字
単位で符号として送出する生データモードと、一致文字
列の辞書101における位置に関する情報および一致長
に関する情報を符号として送出する複製モードとを切り
換えながら動作するスライド辞書型のデータ圧縮装置に
おいて、生データモードにおいて符号化手段103で得
られる文字を表すビット列の上位部分に相当する相異な
る要素および複製モードにおいて得られる符号化結果の
相異なる要素に統一的に与えられた番号に対応する符号
を符号の木の形式で保持する第1の符号表121と、
字を表すビット列の上位部分に相当する各要素に対応し
て、文字を表すビット列の下位部分に相当する相異なる
ビット列に与えた符号系列それぞれを符号の木の形式で
保持する第2の符号表122と、生データモードにおけ
文字を表すビット列の上位部分および複製モードにお
ける符号化結果の入力に応じて、それぞれに対応する符
号を第1の符号表121から検索して出力するととも
に、該当する符号の長さが半分になるように符号の木を
組み替える第1のスプレイ符号化手段123と、文字を
表すビット列の上位部分に応じて第2の符号表122か
ら該当する符号の木を選択し、生データモードで得られ
文字を表すビット列の下位部分に対応する符号を検索
して出力するとともに、該当する符号の長さが半分にな
るように符号の木を組み替える第2のスプレイ符号化手
段124とを備えたことを特徴とする。
【0044】図4は、本発明のデータ復元方法の原理を
示す図である。請求項13の発明は、辞書内に蓄積され
た符号化済みの文字列のなかから、符号化対象の文字列
と最大長一致する一致文字列を検索し、その一致長に応
じて、符号化対象の文字列そのものを1文字単位で符号
として送出する生データモードと、一致文字列の辞書に
おける位置に関する情報および一致長に関する情報を符
号として送出する複製モードとを切り換えるスライド辞
書型のデータ圧縮方法によって得られる符号から元の文
字列を復元するデータ復元方法において、生データモー
ドにおいて得られる符号化結果の相異なる要素および
製モードにおいて得られる符号化結果の相異なる要素
対して統一的な番号を与えて、それぞれの番号に対応す
る符号を登録した第1の符号表を用意し、第1の符号表
に基づいて、入力される符号系列から一連の番号のいず
れかに対応して登録された第1符号を抽出し、この第1
符号を第1の符号表を用いて復号し、第1の符号表を
1符号に着目して組み替えて、該当する符号の長さを減
じ、第1符号の復号結果として得られる番号に基づい
て、第1符号が生データモードであるか複製モードであ
るかを判別し、番号で示される符号化結果に対して、該
当する符号化モードに応じた復元処理を行うことを特徴
とする。
【0045】請求項14の発明は、請求項13に記載の
データ復元方法において、生データモードにおける符号
化結果として得られる文字および複製モードにおいて得
られる符号化結果の相異なる要素に対して統一的な番号
を与えて第1の符号表を用意し抽出された第1符号が
生データモードである場合に、第1符号を第1の符号表
を用いて復号して得られた番号に対応する文字を復元文
字列として出力するとともに辞書に蓄積することを特徴
とする。
【0046】請求項15の発明は、請求項13に記載の
データ復元方法において、生データモードにおける符号
化結果の相異なる要素および複製モードにおいて得られ
る相異なる一致長に対して統一的な番号を与えて第1の
符号表を用意し、抽出された第1符号が複製モードであ
る場合に、第1符号を第1の符号表を用いて復号して得
られた番号から一致長を得ることを特徴とする。
【0047】請求項16の発明は、請求項15に記載の
データ復元方法において、一致文字列の位置に関する情
報の少なくとも一部に相当する要素にそれぞれ与えられ
符号を登録した第2の符号表を用意しておき、第1符
号が複製モードである場合に、第1符号に続く第2符号
を第2の符号表に基づいて抽出し、第2符号を第2の符
号表を用いて復号して、一致文字列の位置に関する情報
の少なくとも一部を復元し、第2の符号表を第2符号
着目して組み替えて、該当する符号の長さを減ずること
を特徴とする。
【0048】請求項17の発明は、請求項13に記載の
データ復元方法において、生データモードにおける符号
化結果の相異なる要素および複製モードにおいて一致文
字列の位置として得られるアドレスの少なくとも一部の
ビット列に相当する相異なる要素に対して統一的な番号
を与え、この統一的な番号に割り当てた符号を登録した
第1の符号表を用意し、複製モードの第1符号の入力に
応じて、第1符号を第1の符号表を用いて復号して得ら
れた番号に対応するアドレスの少なくとも一部を得るこ
とを特徴とする。
【0049】請求項18の発明は、請求項17に記載の
データ復元方法において、相異なる一致長に対応する符
を登録した第2の符号表を用意しておき、第1符号が
複製モードである場合に、第1符号に続く第2符号
2の符号表に基づいて抽出し、第2符号を第2の符号表
を用いて復号して一致長を復元し、第2の符号表を第2
符号に着目して組み替えて、該当する符号の長さを減じ
ることを特徴とする。
【0050】請求項19の発明は、請求項13のデータ
復元方法において、生データモードにおける符号化結果
として得られる文字を表すビット列の上位部分に相当す
る相異なる要素および複製モードにおける符号化結果の
相異なる要素に対して統一的な番号を与え、この統一的
番号に割り当てた符号を登録した第1の符号表を用意
し、文字を表すビット列の上位部分に相当する各要素
対応して、文字を表すビット列の下位部分に相当する相
異なる要素それぞれに対して番号を与えた符号表をそれ
ぞれ設け、第1符号が生データである場合に、第1符号
の可変長復号結果として得られる番号から文字を表すビ
ット列の上位部分を復元し、第1符号に続く可変長符号
を第2符号として抽出し、文字を表すビット列の上位部
に対応する符号表を用いて、第2符号を可変長復号し
て、文字を表すビット列の下位部分を得ることを特徴と
する。
【0051】図5は、請求項20ないし請求項23のデ
ータ復元装置の原理ブロック図である。請求項20の発
明は、辞書内に蓄積された符号化済みの文字列のなかか
ら、符号化対象の文字列と最大長一致する一致文字列を
検索し、その一致長に応じて、符号化対象の文字列その
ものを1文字単位で符号として送出する生データモード
と、一致文字列の辞書における位置に関する情報および
一致長に関する情報を符号として送出する複製モードと
を切り換えるスライド辞書型のデータ圧縮方法によって
得られる符号の入力に応じて、復元処理手段130が元
の文字列を復元し、辞書104に蓄積するデータ復元装
置において、復元処理手段130が、生データモードに
おいて得られる各文字および複製モードにおいて得られ
る一致長に統一的に与えられた番号系列に対応する符号
系列を符号の木の形式で保持する符号表131と、入力
される一連の符号から可変長符号を第1符号として抽出
する抽出手段132と、第1符号を符号表131を用い
てスプレイ復号化し、該当する番号を出力するととも
に、該当する符号の長さが半分になるように符号の木を
組み替えるスプレイ復号手段133と、第1符号の復号
結果として得られる番号に基づいて、第1符号が生デー
タモードであるか複製モードであるかを判別する判別手
段134と、生データモードである旨の判別結果の入力
に応じて、番号から文字を得て復元文字列として出力
し、複製モードである旨の判別結果の入力に応じて、番
号から得られる一致長に基づいて辞書104から一致文
字列を検索し、復元文字列として出力する文字列復元手
段135とを備えた構成であることを特徴とする。
【0052】請求項21の発明は、請求項20のデータ
復元装置において、復元処理手段130が、複製モード
において、一致文字列の位置を示す情報として得られる
アドレスを表すビット列の少なくとも一部に相当する相
異なる要素に対応する符号を登録した符号の木を保持す
る符号表136と、可変長符号の入力に応じて符号表を
参照し、該当するビット列を出力するとともに、該当す
る符号の長さが半分になるように符号の木を組み替える
スプレイ復号手段137とを備え、抽出手段132が、
第1符号が複製モードである旨の判別結果の入力に応じ
て、第1符号に続く可変長符号を第2符号として抽出
し、スプレイ復号手段137に送出する構成であり、文
字列復元手段135は、複製モードである旨の判別結果
に応じて、スプレイ復号手段133で得られる番号で示
される一致長と、スプレイ復号手段137で得られるビ
ット列で示されるアドレスとに基づいて、辞書104か
ら一致文字列を検索する構成であることを特徴とする。
【0053】請求項22の発明は、辞書内に蓄積された
符号化済みの文字列のなかから、符号化対象の文字列と
最大長一致する一致文字列を検索し、その一致長に応じ
て、符号化対象の文字列そのものを1文字単位で符号と
して送出する生データモードと、一致文字列の辞書にお
ける位置に関する情報および一致長に関する情報を符号
として送出する複製モードとを切り換えるスライド辞書
型のデータ圧縮方法によって得られる符号の入力に応じ
て、復元処理手段130が元の文字列を復元し、辞書1
04に蓄積するデータ復元装置において、復元処理手段
130が、生データモードにおいて得られる各文字およ
複製モードにおいて得られる一致文字列の位置として
得られるアドレスを表すビット列の少なくとも一部に対
応する相異なる要素に統一的に与えられた番号系列に対
応する符号系列を符号の木の形式で保持する符号表14
1と、入力される一連の符号から可変長符号を第1符号
として抽出する抽出手段132と、第1符号を符号表を
用いてスプレイ復号化し、該当する番号を出力するとと
もに、該当する符号の長さが半分になるように符号の木
を組み替えるスプレイ復号手段142と、第1符号の復
号結果として得られる番号に基づいて、第1符号が生デ
ータモードであるか複製モードであるかを判別する判別
手段134と、生データモードである旨の判別結果の入
力に応じて、番号から文字を得て復元文字列として出力
し、複製モードである旨の判別結果の入力に応じて、番
号から得られるアドレスの少なくとも一部に基づいて辞
書104から一致文字列を検索し、復元文字列として出
力する文字列復元手段143とを備えた構成であること
を特徴とする。
【0054】請求項23の発明は、請求項22のデータ
復元装置において、復元処理手段130が、複製モード
において得られる各一致長に対応する符号を登録した符
号の木を保持する符号表144と、可変長符号の入力に
応じて符号表144を参照し、該当する一致長を出力す
るとともに、該当する符号の長さが半分になるように符
号の木を組み替えるスプレイ復号手段145とを備え、
抽出手段132が、第1符号が複製モードである旨の判
別結果の入力に応じて、第1符号に続く可変長符号を第
2符号として抽出し、スプレイ復号手段145に送出す
る構成であり、文字列復元手段143は、複製モードで
ある旨の判別結果に応じて、スプレイ復号手段142で
得られる番号で示されるアドレスと、スプレイ復号手段
145で得られる一致長とに基づいて、辞書104から
一致文字列を検索する構成であることを特徴とする。
【0055】請求項24の発明は、辞書内に蓄積された
符号化済みの文字列のなかから、符号化対象の文字列と
最大長一致する一致文字列を検索し、その一致長に応じ
て、符号化対象の文字列そのものを1文字単位で符号と
して送出する生データモードと、一致文字列の辞書にお
ける位置に関する情報および一致長に関する情報を符号
として送出する複製モードとを切り換えるスライド辞書
型のデータ圧縮方法によって得られる符号の入力に応じ
て、復元処理手段130が元の文字列を復元し、辞書1
04に蓄積するデータ復元装置において、復元処理手段
130が、生データモードにおいて得られる文字を表す
ビット列の上位部分に相当する相異なる要素および複製
モードにおいて得られる符号化結果の相異なる要素に統
一的に与えられた番号系列に対応する符号系列を符号の
木の形式で保持する第1の符号表151と、文字を表す
ビット列の上位部分に相当する各要素に対応して、文字
を表すビット列の下位部分に相当する各要素に割り当て
た符号系列を符号の木の形式でそれぞれ保持する第2の
符号表152と、入力される符号から可変長符号を第1
符号として抽出する抽出手段132と、第1符号を第1
符号表151を用いてスプレイ復号化し、該当する番
号を出力するとともに、該当する符号の長さが半分にな
るように符号の木を組み替える第1のスプレイ復号手段
153と、第1符号の復号結果として得られる番号に基
づいて、第1符号が生データモードであるか複製モード
であるかを判別する判別手段134と、生データモード
である旨の判別結果の入力に応じて、第1符号に続く可
変長符号を第2符号として抽出する抽出手段154と、
生データモードである旨の判別結果に応じて、第1の
プレイ復号手段153で得られた番号で示される文字
表すビット列の上位部分に応じて第2の符号表152か
ら該当する符号の木を選択し、第2符号をスプレイ復号
化して文字を表すビット列の下位部分を出力するととも
に、該当する符号の長さが半分になるように符号の木を
組み替える第2のスプレイ復号手段155と、生データ
モードである旨の判別結果の入力に応じて、第1のスプ
レイ復号手段153で得られる番号で示される文字を表
すビット列の上位部分第2のスプレイ復号手段155
から得られる文字を表すビット列の下位部分とを結合し
て復元文字列として出力し、複製モードである旨の判別
結果の入力に応じて、番号で示される符号化結果に基づ
いて辞書104から一致文字列を検索し、復元文字列と
して出力する文字列復元手段156とを備えた構成であ
ることを特徴とする。
【0056】
【作用】請求項1の発明は、生データモードの符号化結
および複製モードの符号化結果に統一的な番号を与
え、この番号をスプレイ符号化の手法により動的に符号
化することにより、統一的な番号を与える際の規則性に
含まれている情報、すなわち、生データモードと複製モ
ードとを識別する情報をも含めて、可変長符号化するこ
ができる。これにより、生データモードと複製モード
との出現確率の偏りと2つのモードそれぞれにおける各
符号化結果の出現確率の偏りとを利用して、LZSS符
号化方式による符号化結果を更に圧縮することができ
る。
【0057】更に、請求項2の発明は、生データモード
の符号化結果として得られる文字を複製モードの符号化
結果と組み合わせて、スプレイ符号化の手法により動的
に可変長符号化することにより、入力文字列における各
文字の出現確率の偏りを利用して、LZSS符号化方式
による生データモードの符号化結果を圧縮することがで
きる。
【0058】また、請求項3の発明は、複製モードの符
号化結果として得られる一致長を生データモードの符号
化結果と組み合わせて、スプレイ符号化の手法により動
的に可変長符号化することにより、辞書101から検索
される一致文字列の長さの分布の偏りを利用して、LZ
SS符号化方式による複製モードの符号化結果を圧縮す
ることができる。
【0059】更に、請求項4で述べたように、複製モー
ドの符号化結果として得られる一致文字列の位置を示す
アドレスの少なくとも一部に対してもスプレイ符号化の
手法を適用し、これを動的に可変長符号化することによ
り、辞書101から検索される一致文字列の位置の分布
の偏りを利用して、LZSS符号化方式による複製モー
ドの符号化結果を圧縮することができる。
【0060】また、請求項5の発明は、複製モードの符
号化結果として得られる一致文字列の位置を示すアドレ
スの一部を生データモードの符号化結果と組み合わせ
て、スプレイ符号化の手法により動的に可変長符号化す
ることにより、辞書101から検索される一致文字列の
位置の分布の偏りを利用して、LZSS符号化方式によ
る複製モードの符号化結果を圧縮することができる。
【0061】更に、請求項6で述べたように、複製モー
ドの符号化結果として得られる一致長に対してもスプレ
イ符号化の手法を適用し、これを動的に可変長符号化す
ることにより、辞書101から検索される一致文字列の
長さの分布の偏りを利用して、LZSS符号化方式によ
る複製モードの符号化結果を圧縮することができる。
【0062】また、請求項7の発明は、生データモード
の符号化結果として得られる文字の上位部分と下位部分
とを分割し、上位部分を複製モードの符号化結果と組み
合わせて可変長符号化し、更に、文字の下位部分を上位
部分に従属して可変長符号化するものである。これによ
り、画像データのように、下位部分にランダムな成分を
含む情報が入力文字列として入力された場合において
も、文字の上位部分にある冗長性を利用して、LZSS
符号化方式による生データモードの符号化結果を圧縮す
ることができる。更に、文字の下位部分を上位部分に従
属して可変長符号化することにより、文字の上位部分と
下位部分とのあいだに相関がある場合にも柔軟に対応
し、LZSS符号化方式による生データモードの符号化
結果を圧縮することができる。
【0063】請求項8の発明は、符号表111に保持さ
れた符号の木を用いて、スプレイ符号化手段112が生
データモードにおける文字と複製モードにおける一致長
とを組み合わせてスプレイ符号化することにより、上述
した文字と一致長とを組み合わせた際の規則性に含まれ
ている情報、すなわち、生データモードと複製モードと
を識別する情報をも含めて、可変長符号化することがで
きる。これにより、生データモードと複製モードとの出
現確率の偏りと生データモードにおける各文字の出現確
率および複製モードにおける各一致長の出現確率の偏り
とを利用して、LZSS符号化方式で得られる両モード
の符号化結果を圧縮することができる。
【0064】請求項9の発明は、更に、符号表113に
保持された符号の木を用いて、スプレイ符号化手段11
4が複製モードの符号化結果として得られるアドレスの
少なくとも一部をスプレイ符号化することにより、一致
文字列の出現位置の偏りを利用して、LZSS符号化方
式の複製モードにおける符号化結果を一層圧縮すること
ができる。
【0065】請求項10の発明は、符号表115に保持
された符号の木を用いて、スプレイ符号化手段116が
生データモードにおける文字と複製モードにおけるアド
レスの少なくとも一部とをスプレイ符号化することによ
り、生データモードと複製モードとの出現確率の偏りと
生データモードにおける各文字の出現確率および複製モ
ードにおける一致文字列の出現位置の偏りとを利用し
て、LZSS符号化方式で得られる両モードの符号化結
果を圧縮することができる。
【0066】請求項11の発明は、更に、符号表117
に保持された符号の木を用いて、スプレイ符号化手段1
18が複製モードの符号化結果として得られる一致長を
スプレイ符号化することにより、各一致長の出現確率の
偏りを利用して、LZSS符号化方式の複製モードにお
ける符号化結果を一層圧縮することができる。
【0067】請求項12の発明は、符号表121に保持
された符号の木を用いて、スプレイ符号化手段123
が、生データモードにおける文字の上位部分と複製モー
ドにおける符号化結果とをスプレイ符号化することによ
り、生データモードと複製モードとの出現確率の偏りと
文字の上位部分のビット列の出現確率の偏りを利用し
て、LZSS符号化方式で得られる両モードの符号化結
果を圧縮することができる。このように、文字の上位部
分に注目してスプレイ符号化することにより、画像デー
タのように、各文字の下位部分にランダムな成分が含ま
れているために文字全体としての出現確率に偏りが見ら
れない情報にも柔軟に対応して、文字の上位部分で示さ
れる規則性を利用して、入力文字列の圧縮を図ることが
できる。
【0068】また、スプレイ符号化手段124が、符号
表122内の該当する符号の木を用いて、文字の下位部
分を文字の上位部分に従属してスプレイ符号化すること
により、テキストデータなどのように、文字の上位部分
のビット列と下位部分のビット列との間に相関関係があ
る情報にも柔軟に対応し、文字としての出現確率の偏り
を利用して、入力文字列の圧縮を図ることができる。
【0069】請求項13の発明は、入力符号から抽出し
た第1符号をスプレイ復号化の手法を適用して復号し、
得られた番号に基づいて、該当する符号が生データモー
ドであるか複製モードであるかを判別し、この判別結果
に応じて、上述した番号に対応するLZSS符号化方式
による符号化結果を得るものである。
【0070】ここで、生データモードにおける符号化結
および複製モードにおける符号化結果には、請求項1
の方法と同様に統一的な番号が与えられているから、復
号結果として得られる番号と、2つの符号化結果に統一
的な番号を与えた際に境目となった番号とを比較するこ
とにより、符号化モードを判別することができるから、
請求項1の方法による符号から、両モードにおける符号
化結果をそれぞれ復元することができる。
【0071】また、このようにして得られた符号化結果
に基づいて、従来と同様の復元処理を行うことにより、
請求項1の方法で得られた符号データから元の文字列を
復元することができる。
【0072】請求項14の発明は、請求項2の方法と同
様に、生データモードにおける文字および複製モードに
おける符号化結果に統一的な番号を与えている。したが
って、請求項2の方法によって得られた生データモード
の符号の入力に応じて、復号結果として得られる番号か
ら文字を復元することができる。
【0073】請求項15の発明は、請求項3の方法と同
様に、生データモードにおける符号化結果および複製モ
ードにおける一致長に統一的な番号を与えている。した
がって、請求項3の方法によって得られた複製モードの
符号の入力に応じて、復号結果として得られる番号から
一致長を復元し、一致文字列の検索処理に供することが
できる。
【0074】請求項16の発明は、第1符号が複製モー
ドの符号である場合に第2符号を抽出し、この第2符号
をスプレイ復号化の手法を用いて復号することにより、
復号結果として一致文字列の位置を示すアドレスの少な
くとも一部を得ることができる。これにより、請求項4
の方法による符号からLZSS符号化方法による複製モ
ードの符号化結果を復元し、一致文字列の検索処理に供
することができる。
【0075】請求項17の発明は、請求項5の方法と同
様に、生データモードにおける符号化結果および複製モ
ードにおけるアドレスの少なくとも一部に統一的な番号
を与えている。したがって、請求項5の方法によって得
られた複製モードの符号の入力に応じて、復号結果とし
て得られる番号からアドレスの一部を復元し、一致文字
列の検索処理に供することができる。
【0076】請求項18の発明は、第1符号が複製モー
ドの符号である場合に第2符号を抽出し、この第2符号
をスプレイ復号化の手法を用いて復号することにより、
復号結果として一致長を得ることができる。これによ
り、請求項6の方法による符号からLZSS符号化方法
による複製モードの符号化結果を復元し、一致文字列の
検索処理に供することができる。
【0077】請求項19の発明は、請求項7の方法と同
様に、生データモードにおける文字を表すビット列の上
位部分および複製モードにおける符号化結果に統一的な
番号を与えており、文字を表すビット列の上位部分に対
応して、文字を表すビット列の下位部分に相当する各要
素が登録された符号表が設けられている。したがって、
第1符号が生データモードである場合に、第1符号の復
号結果として得られる番号から文字を表すビット列の上
位部分を復元するとともに第2符号を抽出し、この第2
符号を復元された文字を表すビット列の上位部分に対応
する符号表を用いて復号することにより、文字を表すビ
ット列の下位部分を復元することができる。
【0078】請求項20の発明は、請求項8の装置と同
様に、生データモードにおける文字および複製モードに
おける一致長に統一的な番号を与えた符号表131を備
えている。したがって、スプレイ復号手段133が、抽
出手段132で得られた第1符号を符号表131を用い
て復号し、判別手段134による判別結果に応じて、文
字列復元手段135が動作することにより、第1符号の
復号結果として得られた番号に基づいて、LZSS符号
化方法のいずれの符号化モードについても適切な符号化
結果を得ることができる。このようにして得られたLZ
SS符号化方法による符号化結果に基づいて、従来と同
様の復元処理を行うことにより、請求項8の装置で得ら
れた符号から、元の文字列を復元することができる。
【0079】請求項21の発明は、請求項9の装置の符
号表113に対応する符号表136を備えており、複製
モードの符号の入力に応じて、抽出手段132により第
2符号を抽出し、スプレイ復号手段137が、上述した
符号表136を用いてこの第2符号を復号することによ
り、一致文字列の位置を示すアドレスの少なくとも一部
を得ることができる。このようにして、請求項9の装置
で得られた符号から、LZSS符号化方法による符号化
結果を復元し、この符号化結果に対して従来と同様の復
元処理を施すことによって元の文字列を復元することが
できる。
【0080】請求項22の発明は、請求項10の装置と
同様に、生データモードにおける文字および複製モード
におけるアドレスの少なくとも一部に統一的な番号を与
えた符号表141を備えている。したがって、スプレイ
復号手段142が、抽出手段132で得られた第1符号
を符号表141を用いて復号し、判別手段134による
判別結果に応じて、文字列復元手段143が動作するこ
とにより、第1符号の復号結果として得られた番号に基
づいて、LZSS符号化方法のいずれの符号化モードに
ついても適切な符号化結果を得ることができる。このよ
うにして得られたLZSS符号化方法による符号化結果
に基づいて、従来と同様の復元処理を行うことにより、
請求項10の装置で得られた符号から、元の文字列を復
元することができる。
【0081】請求項23の発明は、請求項11の装置の
符号表117に対応する符号表144を備えており、複
製モードの符号の入力に応じて、抽出手段132により
第2符号を抽出し、スプレイ復号手段145が、上述し
た符号表144を用いてこの第2符号を復号することに
より一致長を得ることができる。このようにして、請求
項11の装置で得られた符号から、LZSS符号化方法
による符号化結果を復元することができる。また、この
符号化結果に対して従来と同様の復元処理を施すことに
よって元の文字列を復元することができる。
【0082】請求項24の発明は、請求項12の装置の
符号表121,122に対応する符号表151,152
を備えており、生データモードの符号の入力に応じて、
抽出手段132によって抽出された第1符号からスプレ
イ復号手段153が文字を表すビット列の上位部分を示
す番号を復元するとともに、抽出手段154により第2
符号を抽出する。また、スプレイ復号手段155が、符
号表152から上述した番号で示される文字を表すビッ
ト列の上位部分に対応する符号の木を選択し、選択して
符号の木を用いて第2符号から文字を表すビット列の
位部分を復元する。したがって、判別手段134による
判別結果に応じて、文字列復元手段156が文字を表す
ビット列の上位部分と下位部分とを結合することによ
り、請求項12の装置で得られた生データモードの符号
から文字を復元することができる。このようにして、請
求項12の装置で得られた符号から、LZSS符号化方
法による符号化結果を復元することができる。また、こ
の符号化結果に対して従来と同様の復元処理を施すこと
によって元の文字列を復元することができる。
【0083】
【実施例】以下、図面に基づいて本発明の実施例につい
て詳細に説明する。図7は、請求項8のデータ圧縮装置
の実施例構成図である。
【0084】図7において、請求項8のデータ圧縮装置
は、図22に示した従来のデータ圧縮装置の符号化部5
01に代えて、スプレイ符号化部211と符号表格納部
212と符号化制御部213と符号語作成部214とを
備え、マッチング部203による検索結果に基づいて、
符号化制御部213がスプレイ符号化部211と符号語
作成部214とを制御して、入力文字列を符号化する構
成となっている。
【0085】ここで、出現する可能性のある各文字およ
び一致長のそれぞれには、予め相異なる符号が与えられ
ており、これらの符号を2分木の葉として登録した符号
の木(以下、符号の木と称する)の構造が、上述した
符号表格納部212に格納されている。
【0086】例えば、図8に示すように、8ビットで表
される各文字の先頭に1ビット“0”を付加したものと
4ビットで表される各一致長にビット列“10000”
を付加したものとを考える。これらの9ビットからなる
ビット列は、全ての文字および一致長を含んだシンボル
の系列であるから、これらのシンボルのそれぞれに符号
を与えて、符号の木に登録しておけばよい。上述した
シンボルは、各文字および一致長のそれぞれに対応する
一連の番号に相当するから、上述した符号の木は、符
号表111に相当している。なお、この場合は、各シン
ボルのビット列そのものを符号の初期値として登録すれ
ばよい。
【0087】また、図7において、スプレイ符号化部2
11は、請求項8のスプレイ符号化手段112に相当す
るものであり、符号化制御部213からの文字および一
致長を入力データとして受け取り、上述した符号表格納
部212を参照して入力データに対応する符号を得て符
号語作成部214に送出するとともに、この入力データ
に応じて符号表格納部212の内容を書き換えて、符号
の木を組み替える構成となっている。以下の説明にお
いては、上述したスプレイ符号化部211の動作を一括
して、『スプレイ符号化する』と称する。
【0088】図9に、データ圧縮動作を表す流れ図を示
す。まず、マッチング部203は、従来と同様にしてQ
バッファ202内の入力文字列に最大長一致するPバッ
ファ201内の文字列を検索し(ステップ301)、該
当する文字列が得られた場合はその文字列を一致文字列
として符号化制御部213に送出し、該当する文字列が
ない場合は入力文字列の先頭文字を一致文字列として符
号化制御部213に送出する。
【0089】これに応じて、符号化制御部213は、受
け取った一致文字列の長さ、つまり一致長が2文字以上
であるか否かに基づいて、一致文字列を複製モードで符
号化するか否かを判定する(ステップ302)。
【0090】一致長が2文字以下である場合は、符号化
制御部213は、ステップ302の否定判定として生デ
ータモードを選択し、一致文字列として受け取ったQバ
ッファ202の先頭文字をスプレイ符号化部211に送
出するとともに、符号語作成部214に生データモード
の符号語を作成する旨を指示する。
【0091】この場合は、上述した文字を入力データと
して受け取って、スプレイ符号化部211は、符号表格
納部212内の符号の木を用いて入力文字をスプレイ
符号化し(ステップ303)、得られたスプレイ符号
(以下、スプレイ符号と称する)を符号語作成部21
4に送出する。これに応じて、符号語作成部214は、
図10(a) に示すように、生データモードの符号語とし
て、上述したスプレイ符号をそのまま出力し、ステッ
プ305に進む。
【0092】一方、一致長が2文字以上である場合に
は、符号化制御部213はステップ302の肯定判定と
して、複製モードを選択して符号語作成部214に通知
し、マッチング部203で得られた一致長をスプレイ符
号化部211に送出する。また、このとき、一致開始位
置を示すPバッファ201のアドレスを符号語作成部2
14に送出する。
【0093】これに応じて、スプレイ符号化部211
は、上述した符号の木を用いて一致長をスプレイ符号
化して符号語作成部214に送出する(ステップ30
4)。また、符号語作成部214は、受け取ったアドレ
スを固定長符号化し(ステップ305)、図10(a) に
示すように、スプレイ符号化部211で得られたスプレ
イ符号にアドレスの符号化結果を付加して複製モード
の符号語を作成して出力する。なお、上述したステップ
305において、符号語作成部214は、受け取ったア
ドレスをそのまま固定長符号化結果として、上述したス
プレイ符号に付加して符号語を作成すればよい。
【0094】上述したステップ303あるいはステップ
305の終了後に、ステップ306において、従来と同
様にして、Qバッファ202内の符号化済みの文字列を
Pバッファ201に移し、Pバッファ201から古い文
字列を捨てる処理を行った後に、符号化済みでない文字
列が有るか否かを判定する(ステップ307)。このス
テップ307の肯定判定の場合は、ステップ301に戻
って、新しい文字列の符号化処理を行い、否定判定の場
合は、データ圧縮処理を終了する。
【0095】上述したように、このデータ圧縮装置にお
いては、生データモードでは、スプレイ符号化部211
によってQバッファ202の先頭文字がスプレイ符号化
され、複製モードでは、マッチング部203で得られた
一致長がスプレイ符号化される。すなわち、符号化制御
部213からの指示に応じて、スプレイ符号化部211
が動作することにより、請求項2のデータ圧縮方法と請
求項3のデータ圧縮方法との特徴を併せ持つデータ圧縮
方法を適用したデータ圧縮装置を実現している。
【0096】この場合は、符号化処理の開始当初のよう
に、生データモードの出現確率が高い場合は、各文字に
対応する符号の長さがそれぞれの出現確率に応じて短く
なり、一方、複製モードの出現確率の増大に伴って、今
度は一致長に対応する符号の長さがそれぞれの出現確率
に応じて短くなる。
【0097】したがって、上述したようにして、文字お
よび一致長を含むシンボルの系列をスプレイ符号化する
ことにより、文字および一致長それぞれの出現確率の偏
りを利用してそれぞれの情報を圧縮するとともに、一致
文字列の出現確率にかかわらず、入力文字列の圧縮能率
を向上することができる。
【0098】なぜならば、図8に示した符号の例から分
かるように、文字および一致長を含んだシンボルを表す
ビット列の先頭ビットによって、符号化モードが生デー
タモードであるか複製モードであるかが示されており、
従来の識別フラグに相当する情報も同時に可変長符号化
されているからである。
【0099】すなわち、上述したようにして、LZSS
符号化法によって得られる固定長の符号を更にスプレイ
符号化することにより、LZSS符号化法の短所を補っ
て、符号化能率を向上することができる。特に、スプレ
イ符号化部211による符号表の組み替えにより、出現
した番号に対応する符号の長さを逐次に半分にしていく
と、入力データを高能率で圧縮することができる。
【0100】これにより、入力データの統計的な性質に
追従し、生データモードの出現確率が高いときには、入
力データにおける各文字の出現頻度の偏りを利用して入
力データを圧縮し、複製モードの出現頻度が高いときに
は、入力データにおける文字列の冗長性を利用して高い
圧縮率を得ることができる。したがって、符号化処理の
開始直後における圧縮能率の低下や冗長性の低い入力デ
ータに対する圧縮能率の低下を軽減して、統計的な性質
や符号化処理の経過にかかわらず、高い圧縮率を得るこ
とが可能となる。
【0101】なお、図8に示した例に代えて、各文字に
対応する番号の最上位ビットを“1”とし、各一致長に
対応する番号の最上位ビットを“0”とすることによ
り、一致長に与えた番号に続く番号を各文字に与えても
よい。
【0102】ところで、上述したように、Pバッファ2
01から一致文字列を検索する場合に、符号化対象の文
字列に近い位置から検索される可能性が高いことが知ら
れている。
【0103】例えば、Pバッファ201の16進数のア
ドレス“000H”にQバッファ202から入力文字列
が順次に入力され、Pバッファ201の16進数のアド
レス“FFFH”から古い文字列が捨てられるとする
と、若い番号で表されるアドレスの方が、一致開始位置
として検索される確率が高いと言える。
【0104】このような一致開始位置の出現確率の偏り
を利用すれば、更に、高い圧縮率を得ることが可能であ
る。例えば、図7に示した符号表格納部212に、上述
した符号の木とともに、一致開始位置を表すPバッフ
ァ201のアドレスに対応する符号を登録した符号の木
(以下、符号の木と称する)を格納しておき、符号化
制御部213が、スプレイ符号化部211に対して、符
号の木を指定して入力データの符号化処理を実行する旨
を指示する構成とすればよい。
【0105】ここで、一致開始位置の出現確率は、符号
化対象の文字に近い位置で大きくなる傾向があるが、ば
らつきが大きいから、特定のアドレスに集中することは
考えられない。したがって、アドレスの上位部分に注目
し、Pバッファ201の対応する領域内で一致文字列が
検出される確率に応じて、可変長符号化するほうが有利
であると考えられる。例えば、アドレスの上位4ビット
に注目してスプレイ符号化すれば、それぞれに対応する
16個の領域ごとに一致文字列が検出される確率を評価
して、一致開始位置の出現確率の偏りをその符号長に反
映させることができる。
【0106】したがって、符号表格納部212には、例
えば、アドレスの上位4ビットに対応する符号を登録し
た符号の木を符号の木として2分木の形式で格納して
おけばよい。
【0107】この場合は、スプレイ符号化部211が符
号化制御部213からの指示に応じて符号の木を切り換
えながら動作することにより、符号表格納部212が、
請求項8で述べた符号表111と請求項9で述べた符号
表113との機能を果たし、スプレイ符号化部211
が、請求項8で述べたスプレイ符号化手段112および
請求項9で述べたスプレイ符号化手段114の機能を実
現する構成となっている。
【0108】図11に、請求項9のデータ圧縮装置によ
るデータ圧縮動作を表す流れ図を示す。上述したステッ
プ301,302と同様にして、Pバッファ201から
一致文字列を検索して符号化モードを判定し(ステップ
311,312)、生データモードが選択された場合
(ステップ312の否定判定の場合)は、ステップ30
3と同様にして、図10(b) に示すように、入力文字に
対応するスプレイ符号を生データモードの符号語とし
て出力して(ステップ313)、ステップ317に進
む。 一方、複製モードを選択した場合(ステップ31
2の肯定判定の場合)は、符号化制御部213により、
まず、スプレイ符号化部211に符号の木を指定して
一致長の符号化処理が指示され、これに応じて、スプレ
イ符号化部211により、符号の木を用いた符号化処
理が行われ、得られたスプレイ符号が符号語作成部2
14に送出される(ステップ314)。
【0109】次に、符号化制御部213により、スプレ
イ符号化部211に対して、符号の木を指定してアド
レスの上位4ビットの符号化処理が指示され、これに応
じて、スプレイ符号化部211により、符号の木を用
いた符号化処理が行われ、得られたスプレイ符号(以
下、スプレイ符号と称する)が符号語作成部214に
送出される(ステップ315)。
【0110】また、このとき、符号化制御部213は、
アドレスの下位8ビットを符号化制御部214に送出
し、複製モードの符号語の作成を指示する。これに応じ
て、符号語作成部214は、アドレスの下位8ビットを
固定長符号化し(ステップ316)、図10(b) に示す
ように、上述したスプレイ符号とスプレイ符号と固
定長符号化結果とを順次に結合し、複製モードの符号語
として出力する。
【0111】その後、ステップ317において、ステッ
プ305と同様にしてPバッファ201,Qバッファ2
02の管理処理を行い、ステップ318における未処理
の入力文字列の有無の判定結果に応じて、ステップ31
1に戻って新しい文字列の符号化処理を行う。
【0112】この場合は、上述した請求項8に対応する
実施例と同様にして、各文字および一致長の出現確率の
偏りならびに符号化処理の経過に応じた生データモード
と複製モードとの出現確率の偏りを利用して、圧縮率の
向上を図るとともに、更に、一致開始位置を示すPバッ
ファ201のアドレスの上位4ビットをスプレイ符号化
することにより、一致文字列の出現位置の偏りを利用し
て、圧縮率の向上を図っている。
【0113】これにより、LZSS符号化方式で一致開
始位置を固定長で表していたことによる無駄を排除する
ことができる。特に、符号化処理の開始直後や入力デー
タの大きさが小さい場合などには、大きな圧縮効果が期
待できる。なぜなら、このような場合には、Pバッファ
201のアドレス番号の大きい領域は空であり、一致開
始位置は、Pバッファ201のアドレス番号の小さい領
域に限定されているから、該当する領域に非常に短いビ
ット数の符号が割り当てられることが期待できるからで
ある。
【0114】なお、Pバッファ201のアドレス全体を
スプレイ符号化してもよい。この場合は、符号表格納部
212に12ビットのアドレスのそれぞれに対応する符
号を登録した符号の木(以下、符号の木と称する)を
2分木の形式で格納しておき、符号化制御部213は、
マッチング部203で得られた一致開始位置をそのまま
スプレイ符号化部221に送出し、上述した符号の木
を用いて符号化処理を行う旨を指示すればよい。また、
符号語作成部214は、複製モードが指示されたとき
に、スプレイ符号化部211で一致長と一致開始アドレ
スとに対応してそれぞれ得られるスプレイ符号を順次に
結合して符号語を作成すればよい。
【0115】したがって、この場合の複製モードの符号
語は、図10(a) に示した複製モードの符号語におい
て、固定長で表された一致開始位置に代えて、Pバッフ
ァ201のアドレス全体をスプレイ符号化して得られる
スプレイ符号を備えた構成となる。
【0116】また、一致長の代わりに、一致開始位置の
上位ビットを生データモードの文字と組み合わせてもよ
い。例えば、図7において、符号化制御部213が、ス
プレイ符号化部211に一致長の代わりに一致開始位置
の上位kビットを送出して該当する符号の木を用いた符
号化処理を指示し、次に、別の符号の木を指定して一致
長の符号化処理を指示する構成とすればよい。
【0117】この場合は、符号表格納部212に、各文
字と一致開始位置の上位kビットとを含むシンボルの系
列に対応する符号の木(以下、符号の木と称する)と
一致長に対応する符号の木(以下、符号の木と称す
る)とが、それぞれ2分木の形式で格納すればよい。上
述した符号の木は、請求項10で述べた符号表115
に相当するものであり、符号の木は、請求項11で述
べた符号表117に相当するものである。
【0118】ここで、例えば、一致開始位置の上位4ビ
ットに注目した場合は、そのビット列の組み合わせは一
致長を表すビット列の組み合わせと同一であるから、上
述した符号の木に登録される符号の初期値は、上述し
た符号の木の場合と同じようにして決めてよい。つま
り、一致開始位置の上位4ビットにビット列“1000
0”を付加したものと各文字のビット列に1ビット
“0”を付加したものとを新しいシンボルの系列とし、
この系列に含まれる各シンボルのビット列をそれぞれ与
えられた符号の初期値として登録すればよい。また、符
号の木に登録する符号の初期値としては、各一致長を
表すビット列を登録しておけばよい。
【0119】この場合は、図11に示した流れ図におい
て、ステップ314において、符号化制御部213が、
スプレイ符号化部211に対して、符号の木を指定し
てアドレスの上位4ビットの符号化処理を指示し、ま
た、ステップ315において、符号の木を指定して一
致長の符号化処理を指示すればよい。したがって、ステ
ップ314において、アドレスの上位4ビットを符号の
木を用いて符号化して得られるスプレイ符号(以下、
スプレイ符号と称する)が得られ、ステップ315に
おいて、一致長を符号の木を用いて符号化して得られ
るスプレイ符号(以下、スプレイ符号と称する)が得
られる。
【0120】このように、符号化制御部213からの指
示に応じて、スプレイ符号化部211と符号表格納部2
12とが動作することにより、請求項10で述べたスプ
レイ符号化手段116および請求項11で述べたスプレ
イ符号化手段118の機能を果たすことができる。すな
わち、生データモードにおける文字と複製モードにおけ
る一致開始位置を示す情報の一部とを可変長符号化する
とともに、複製モードにおける一致長を可変長符号化す
ることができる。
【0121】この場合は、符号語作成部214により、
図10(c) に示すように、生データモードの符号語とし
て、入力文字を符号の木を用いて符号化して得られる
スプレイ符号が出力され、複製モードの符号語として
は、一致開始位置の一部に対応するスプレイ符号に一
致開始位置の下位8ビットと一致長に対応するスプレイ
符号とを付加した符号語が出力される。
【0122】このようにして、請求項2のデータ圧縮方
法と請求項4のデータ圧縮方法との特徴を併せ持つデー
タ圧縮方法を適用したデータ圧縮装置を実現することが
できる。これにより、上述した請求項8のデータ圧縮装
置と同様に、入力データの統計的な性質や符号化処理の
経過による生データモードと複製モードとの出現割合の
変化にかかわらず、LZSS符号化方式の短所を補っ
て、圧縮能率を向上することができる。
【0123】なお、生データモードにおける文字と複製
モードにおける一致開始位置を示すアドレス全体とを組
み合わせてもよい。例えば、図7に示したデータ圧縮装
置において、複製モードが選択されたときに、符号化制
御部213が、一致開始位置を示すPバッファ201の
アドレス全体と一致長とを順次にスプレイ符号化部21
1に送出し、それぞれ該当する符号の木を用いて符号化
処理を行う旨を指示する構成とすればよい。
【0124】また、符号表格納部212には、上述した
符号の木に代えて、全ての文字と一致開始位置を示す
アドレスを含むシンボルの系列に対応する符号の木と
ともに、一致長に対応する符号の木を格納すればよ
い。この符号の木は、上述した符号の木と同様に、
符号表115に相当するものである。
【0125】この場合は、ビット長を合わせるための付
加ビット列“0000”と識別フラグに対応するビット
“0”とを文字を表すビット列に付加し、アドレスを表
すビット列には識別フラグに対応するビット“1”を付
加して、文字とアドレスとを含むシンボルの系列を作成
し、これに対応する符号の木を符号の木として符号表
格納部212に格納すればよい。また、これらのシンボ
ルに対応する符号の初期値としては、上述した符号の木
と同様に、各シンボルを示すビット列そのものを登録
しておけばよい。
【0126】図12に、データ圧縮動作を表す流れ図を
示す。まず、図9に示したステップ301,302と同
様にして、一致文字列の検索および符号化モードの判定
処理を行う(ステップ321,322)。
【0127】次に、生データモードが選択された場合
(ステップ322の否定判定)は、符号化制御部213
からの指示に応じて、スプレイ符号化部211により、
入力文字が上述した符号の木を用いてスプレイ符号化
され、得られたスプレイ符号(以下、スプレイ符号と
称する)のみからなる符号語は、図10(d) に示すよう
に、符号語作成部214を介して生データモードの符号
語として出力される(ステップ323)。
【0128】一方、複製モードが選択された場合(ステ
ップ322の肯定判定)は、まず、符号化制御部213
からの指示に応じて、スプレイ符号化部211により、
一致開始位置を示すPバッファ201のアドレス全体が
上述した符号の木を用いてスプレイ符号化され(ステ
ップ324)、アドレスに対応するスプレイ符号が得
られる。次に、スプレイ符号化部211により、一致長
が符号の木を用いてスプレイ符号化され(ステップ3
25)、一致長に対応するスプレイ符号が得られる。
このようにしてステップ324,325で得られたスプ
レイ符号,は、符号化制御部213からの指示に応
じて、符号語作成部214によって結合され、図10
(d) に示すような複製モードの符号語として出力され
る。
【0129】その後、ステップ305と同様のバッファ
管理処理を行い(ステップ326)、ステップ327に
おける未処理の文字の有無についての判定結果に応じ
て、ステップ321に戻って新しい文字列の符号化処理
を行う。
【0130】この場合は、LZSS符号化方式による符
号化結果が全て可変長符号化される。したがって、各文
字,一致開始位置および一致長のそれぞれの出現確率に
大きな偏りがあれば、大幅な圧縮率の向上が期待でき
る。しかし、実際には、特定のアドレスが一致開始位置
として出現する確率に大きな偏りはないから、アドレス
全体をスプレイ符号化するよりもアドレスの一部(例え
ば上位4ビット)をスプレイ符号化するほうが有利であ
ると考えられる。
【0131】ところで、自然画像においては、各画素の
階調を表す画像データにはノイズ成分が含まれている。
このため、例えば、隣接する画素の階調は近似している
にもかかわらず、これらの画素の画像データが完全に一
致する確率は非常に小さく、更に、階調値が同じパター
ンで反復している箇所を検出するのは非常に困難であ
る。
【0132】これは、画像データの下位ビットがノイズ
成分のためにばらついているからであり、各画素の画像
データの上位ビットを比較すれば、かなり高い確率で反
復していることが分かる。つまり、画像データにおいて
も、大まかな階調についてはその変化に規則性があり、
この規則性を利用して圧縮することが可能である。
【0133】以下、このような性質を利用して、入力デ
ータを圧縮する方法について説明する。請求項12のデ
ータ圧縮装置は、図7において、符号化制御部213
が、生データモードを選択したときに、入力文字を上位
部分と下位部分とに分割して順次にスプレイ符号化部2
11に送出し、それぞれを異なる符号の木を用いてスプ
レイ符号化する旨を指示することによって実現すること
ができる。
【0134】また、符号表格納部212には、上述した
符号の木に代えて、文字を表すビット列の上位部分の
全ての組み合わせと一致長を表すビット列の全ての組み
合わせとからなるシンボルの系列に対応する符号の木
が格納されている。また、符号表格納部212には、上
述した符号の木とともに、文字の上位4ビットに組み
合わせのそれぞれに対応して下位4ビットの組み合わせ
のそれぞれに符号を登録した16通りの符号の木0
15と、一致開始位置の上位4ビットに対応する符号の
木とが格納されている。上述した符号の木は符号表
121に相当するものであり、符号の木0 15は符
号表122に相当するものである。
【0135】この場合は、文字の上位4ビットに識別フ
ラグに対応するビット“0”を付加したものと、一致長
を表す4ビットのビット列に識別フラグに対応するビッ
ト“1”を付加したものとにより、文字の上位4ビット
と一致長とを含むシンボルの系列を形成し、各シンボル
を表すビット列をそれぞれの符号の初期値として符号の
木に登録し、2分木の形式で符号表格納部212に格
納しておけばよい。また、16通りの符号の木0
15についても、同様にして、文字の下位4ビットのビッ
ト列をそのまま符号の初期値として登録しておけばよ
い。
【0136】図13に、請求項12の装置によるデータ
圧縮動作を表す流れ図を示す。まず、図9に示したステ
ップ301,302と同様にして、一致文字列の検索お
よび符号化モードの判定処理を行う(ステップ331,
332)。
【0137】生データモードが選択された場合(ステッ
プ332の否定判定)は、符号化制御部213からの指
示に応じて、スプレイ符号化部211は、まず、入力文
字の上位4ビットを上述した符号の木を用いてスプレ
イ符号化し、次に、この上位4ビットに対応する符号の
木を用いて、入力文字の下位4ビットをスプレイ符号
化する(ステップ333,334)。
【0138】これに応じて、符号語作成部214は、図
10(e) に示すように、スプレイ符号化部211におい
て、符号の木,をそれぞれ用いて得られたスプレイ
符号(以下、スプレイ符号,と称する)を順次に結
合し、生データモードの符号語として出力する。
【0139】一方、複製モードが選択された場合(ステ
ップ332の肯定判定)は、まず、符号化制御部213
からの指示に応じて、スプレイ符号化部211により、
一致長が上述した符号の木を用いてスプレイ符号化さ
れ(ステップ335)、次に、同様にして、スプレイ符
号化部211により、アドレスの上位4ビットが符号の
木を用いてスプレイ符号化される(ステップ33
6)。更に、符号語作成部214において、アドレスの
下位8ビットが固定長符号化され(ステップ337)、
この固定長符号化結果と上述したステップ336,33
7で得られたスプレイ符号,とを順次に結合して、
図10(e) に示すような符号語が作成され、複製モード
の符号語として出力される。
【0140】その後、ステップ305と同様のバッファ
管理処理を行い(ステップ338)、ステップ339に
おける判定結果に応じて、ステップ331に戻って新し
い文字列の符号化処理を行う。
【0141】このように、スプレイ符号化部211が、
符号化制御部213からの指示に応じて、符号の木を
用いて符号化処理を行うことにより、このスプレイ符号
化部211によって、請求項12のスプレイ符号化手段
123およびスプレイ符号化手段124の機能を実現
し、生データモードにおける符号化結果の一部と複製モ
ードにおける符号化結果の一部とを含むシンボルの系列
として可変長符号化することができる。
【0142】このようにして、請求項7のデータ圧縮方
法を適用したデータ圧縮装置を実現し、生データモード
における文字を表すビット列の上位部分と複製モードに
おける一致長とを組み合わせてスプレイ符号化し、LZ
SS符号化方式による符号化結果と組み合わせて出力す
ることができる。これにより、一致文字列の出現確率や
その一致長および一致開始位置の出現確率の偏りを利用
して圧縮率の向上を図るとともに、入力文字を表すビッ
ト列の上位部分のみに冗長性がある場合にも、この冗長
性を利用して入力データを圧縮することができる。した
がって、いわゆるテキストデータだけでなく、自然画像
のように、ノイズ成分を含んでいる入力データにも柔軟
に対応して、高い圧縮能率を得ることができる。
【0143】ここで、各画素の画像データをそれぞれ1
文字としてLZSS符号化方式で符号化すると、ほとん
ど全ての入力文字が生データモードで符号化されると考
えられるから、画像データを圧縮する場合には、生デー
タモードにおける圧縮率が重要となる。
【0144】上述したように、画像データの上位部分の
系列は冗長な情報を含んでおり、特に、自然画像の背景
部分などに存在する階調変化の少ない部分においては、
上位部分が同一である可能性が高いから、該当するビッ
ト列に対応する符号は非常に短くなると考えられ、高い
圧縮能率が期待できる。
【0145】また、文字の上位部分に応じて、スプレイ
符号化部211が符号表格納部212から対応する符号
の木を選択し、この符号の木を用いて符号化処理を
行う構成としたことにより、入力文字の上位4ビットと
下位4ビットとのあいだの従属関係に応じて、入力文字
の下位4ビットを可変長符号化することができる。これ
により、英文などのように、各文字を表す8ビットのビ
ット列全体で出現確率の偏りがある入力文字列にも対応
して、圧縮率の向上を図ることができる。
【0146】また、一致長の代わりに、一致開始位置を
示すアドレスの上位部分を入力文字の上位部分と組み合
わせてスプレイ符号化してもよい。例えば、図7におい
て、複製モードのときに、符号化制御部213が、Pバ
ッファ201のアドレスの上位4ビットをスプレイ符号
化部231に送出し、一致長をスプレイ符号化部211
に送出する構成とすればよい。
【0147】また、上述した符号の木の代わりに、入
力文字を表すビット列の上位4ビットおよびPバッファ
201のアドレスの上位4ビットを含むシンボルの系列
に対応する符号の木を作成し、符号表121に相当す
るものとして符号表格納部212に格納し、アドレスの
上位4ビットに対応する符号の木の代わりに、一致長
に対応する符号の木を格納すればよい。
【0148】この場合は、符号化制御部213からの指
示に応じて、スプレイ符号化部211が符号表格納部2
12内の符号の木を用いて符号化処理を行うことによ
り、請求項12のスプレイ符号化手段123の機能が実
現される。
【0149】すなわち、図13に示した流れ図のステッ
プ333において、入力文字の上位4ビットが、符号の
木を用いてスプレイ符号化され、ステップ336にお
いて、一致長の代わりに、アドレスの上位4ビットが符
号の木を用いてスプレイ符号化される。また、ステッ
プ337において、一致長が符号の木を用いてスプレ
イ符号化される。
【0150】したがって、この場合は、図10(f) に示
すように、符号語作成部214により、スプレイ符号
に代えて、符号の木を用いて得られたスプレイ符号
(以下、スプレイ符号と称する)をスプレイ符号と
組み合わせた符号語が生データモードの符号語として出
力され、スプレイ符号とアドレスの下位8ビットとス
プレイ符号とを結合したものが複製モードの符号語と
して出力される。
【0151】これにより、生データモードでは、入力文
字の上位4ビットの出現確率に応じてこのビット列を圧
縮し、複製モードでは、一致文字列の検出位置の分布の
偏りを利用して一致開始位置の上位4ビットを圧縮する
ことができる。
【0152】なお、上述した実施例においては、1つの
スプレイ符号化部がスプレイ符号化する情報ごとに符号
表を切り換えながらスプレイ符号化処理を行うことによ
り、各情報を順次に処理する構成を示したが、情報ごと
にスプレイ符号化部と符号表格納部とを設け、これらの
スプレイ符号化部が並行して動作する構成としてもよ
い。
【0153】図14に、本発明のデータ圧縮装置の別実
施例構成図を示す。図14において、データ圧縮装置
は、2つのスプレイ符号化部211,221と符号語作
成部214とを備えており、符号化制御部213が、生
データモードのおける入力文字と複製モードにおける一
致長とをスプレイ符号化部211に送出し、一致開始位
置の上位4ビットおよび下位8ビットをそれぞれスプレ
イ符号化部221および符号語作成部214に送出する
構成となっている。
【0154】また、符号表格納部212には、各文字お
よび一致長に対応するシンボルの系列について与えられ
た符号を登録した符号の木が格納されており、スプレ
イ符号化部211がこの符号の木を用いて符号化処理
を行うことにより、請求項8で述べたスプレイ符号化手
段112の機能を果たす構成となっている。同様に、符
号表格納部222には、一致開始位置の上位4ビットに
対応する符号の木が格納されており、スプレイ符号化
部221がこの符号の木を用いて符号化処理を行うこ
とにより、請求項9で述べたスプレイ符号化手段114
の機能を果たす構成となっている。
【0155】この場合は、生データモードでは、スプレ
イ符号化部211のみが動作して、入力文字に対応する
スプレイ符号が符号語作成部214を介して出力され、
複製モードでは、スプレイ符号化部211,221が並
行して動作し、それぞれ一致長および一致開始位置の上
位4ビットに対応するスプレイ符号が符号語作成部21
4によって一致開始位置の下位8ビットと結合されて出
力される。
【0156】このように、スプレイ符号化部211,2
21を並行動作可能としたことにより、複製モードのと
きの符号化処理に要する時間を短縮することが可能とな
るから、データ圧縮処理の高速化を図ることができる。
【0157】同様にして、請求項10〜請求項12のデ
ータ圧縮装置を実現することも可能である。次に、上述
したようなデータ圧縮装置によって得られる符号データ
から元の文字列を復元するデータ復元方法および装置に
ついて説明する。
【0158】図15に、請求項20のデータ復元装置の
実施例構成図を示す。図15において、データ復元装置
は、復元処理部230が、上述した圧縮処理と逆の手順
で符号語の系列から文字列を復元し、復元文字列として
出力するとともに、辞書104に相当するPバッファ2
01に蓄積する構成となっている。
【0159】復元処理部230において、入力される符
号語は、切換指示に応じてデマルチプレクサ(DMP
X)231が動作することによってその構成ごとに分解
され、スプレイ復号部232あるいは読出処理部233
に入力される。
【0160】また、符号表格納部234は、符号表13
1に相当するものであり、上述した請求項8のデータ圧
縮装置の実施例と同様に、全ての文字と一致長とを含む
シンボルの系列に対応する符号の木を格納している。
上述したデータ圧縮装置と同様に、この符号表格納部2
34は、初期状態においては、これらのシンボルのそれ
ぞれに対応する符号の初期値として、各シンボルを表す
ビット列を登録している。
【0161】したがって、スプレイ復号部232が、符
号表格納部234内に格納された符号の木を用いて、
入力されたスプレイ符号を復元することにより、請求項
20のスプレイ復号手段133の機能が果たされ、生デ
ータモードにおいては文字が、複製モードにおいては一
致長が、対応するシンボルとして得られる。
【0162】このスプレイ復号部232による復号結果
に基づいて、復元制御部235が、デマルチプレクサ2
31および読出処理部233を制御することにより、元
の文字列を復元する構成となっている。
【0163】図16に、図10(a) に示した符号語の系
列から文字列を復元するデータ復元動作を表す流れ図を
示す。復元制御部235からの切換指示に応じて、デマ
ルチプレクサ231から第1符号に相当する1つのスプ
レイ符号がスプレイ復号部232に送出され、これに応
じて、スプレイ復号部232により、符号の木を用い
た復号処理が行われ、該当するシンボルが得られる(ス
テップ401)。
【0164】ステップ401で得られたシンボルに基づ
いて、復元制御部235は判別手段134として動作
し、該当する符号語が生データモードであるか否かを判
定する(ステップ402)。ここで、上述したシンボル
は、全ての文字と一致長とに付された一連の番号であ
り、文字に対応するシンボルの最上位ビットは“0”で
あり、一致長に対応するシンボルの最上位ビットは
“1”となっている。したがって、復号されたシンボル
のビット列で表される数値と数値『255』とを比較
し、数値『255』以下であるか否かによって、生デー
タモードであるか否かを判定することができる。
【0165】ステップ402における肯定判定の場合
は、復元制御部235は、復号されたシンボルを表すビ
ット列の下位8ビットを抽出することにより、生データ
モードにおけるLZSS符号化方法による符号化結果を
復元し(ステップ403)、復元文字列としてPバッフ
ァ201に送出した後に、ステップ407に進む。
【0166】一方、ステップ402における否定判定の
場合に、復元制御部235は、複製モードの符号語が入
力されたと判断し、ステップ404〜ステップ406の
処理を行う。
【0167】まず、復元制御部235は、復号されたシ
ンボルから一致長を復元する(ステップ404)。ここ
で、上述したように、最上位ビットに対応するオフセッ
トを与えることにより、各一致長に全ての文字に続く番
号が与えられているから、オフセット分である数値『2
56』を復号されたシンボルで表される値から差し引け
ば、元の一致長を得ることができる。
【0168】その後、復元制御部235は、デマルチプ
レクサ231による切り換え動作を制御して、次に入力
される12ビットのビット列を抽出することにより、一
致開始位置を示すアドレスを固定長復号する(ステップ
405)。
【0169】このようにして、複製モードにおけるLZ
SS符号化方法による符号化結果が復元され、得られた
一致長と一致開始位置とに基づいて、読出処理部233
が、Pバッファ201から該当する文字列を読み出すこ
とにより、符号語に対応する文字列が復元される(ステ
ップ406)。
【0170】上述したステップ403あるいはステップ
406の終了後に、Pバッファ201は、復元された復
元文字列を蓄積するとともに、必要に応じて古い文字列
を廃棄する(ステップ407)。その後、復元済みでな
い符号が有るか否かを判定し(ステップ408)、未処
理の符号がある場合は、ステップ408の肯定判定とし
てステップ401に戻って新しい符号の復元処理を行
い、ステップ408の否定判定の場合は、復元処理を終
了する。
【0171】このように、復元制御部235が、スプレ
イ復号部232による復号結果に基づいて、デマルチプ
レクサ231と読出処理部233とを制御することによ
り、抽出手段132と文字列復元手段135との機能を
果たし、スプレイ符号と固定長符号とが混在した符号語
からLZSS符号化方法による符号化結果を復元し、元
の文字列を復元することができる。
【0172】なお、データ圧縮装置によって、一致開始
位置を示すPバッファ201のアドレスが何らかの方法
で固定長符号化されている場合は、上述したステップ4
05において該当する固定長符号を抽出したのちに、対
応する方法で復号して一致開始位置を得ればよい。
【0173】また、図15において、符号表格納部23
4に、上述した符号の木とともに、アドレスの上位4
ビットに対応する符号の木を格納し、複製モードの符
号語が入力されたときに、復元制御部235が、スプレ
イ復号部232に対して、符号の木を指定して2番目
のスプレイ符号の復号処理を指示する構成としてもよ
い。
【0174】この場合は、符号表格納部234内の符号
の木によって請求項21で述べた符号表136の機能
が果たされ、この符号の木を用いてスプレイ復号部2
32が復号処理を行うことにより、請求項21で述べた
スプレイ復号手段137の機能が果たされる。すなわ
ち、請求項21のデータ復元装置を実現し、図10(b)
に示した符号語の系列から元の文字列を復元することが
できる。
【0175】図17に、請求項21のデータ復元装置に
よるデータ復元動作を表す流れ図を示す。まず、上述し
たステップ401,402と同様にして、第1符号に相
当するスプレイ符号を符号の木を用いて復号し(ス
テップ411)、得られた復号結果に基づいて、符号化
モードを判定する(ステップ412)。
【0176】生データモードである場合(ステップ41
2の否定判定)は、ステップ403と同様にして文字を
復元し(ステップ413)、ステップ418に進めばよ
い。一方、複製モードである場合(ステップ肯定判定)
に、復元制御部235は、まず、ステップ404と同様
にして、ステップ411で得られた復号結果で示される
一致長を復元して読出処理部233に送出し(ステップ
414)、次に、スプレイ復号部232に対して、符号
の木を指定して次の符号の復号処理を指示する。
【0177】これに応じて、スプレイ復号部232が、
上述したスプレイ符号に続いて入力されるスプレイ符
号、すなわち第2符号を復号することにより、アドレ
スの上位4ビットが復元され(ステップ415)、復元
制御部235を介して読出処理部233に送出される。
【0178】次に、復元制御部235からの切換指示に
応じて、デマルチプレクサ231が動作し、上述したス
プレイ符号に続いて入力される8ビットのビット列を
抽出することにより、アドレスの下位8ビットが復元さ
れ(ステップ416)、読出処理部233に送出され
る。
【0179】これに応じて、読出処理部233は、ステ
ップ415で得られたアドレスの上位4ビットにステッ
プ416で得られた下位8ビットを付加して得られるP
バッファ201のアドレスと、ステップ414で得られ
た一致長とに基づいて、Pバッファ201から該当する
文字列を読み出して復元文字列として出力する(ステッ
プ417)。
【0180】その後、ステップ407,408と同様に
してPバッファの管理処理および未処理符号の有無の判
定処理を行い、ステップ408の判定結果に応じて、ス
テップ411に戻って新しい符号の復元処理を行う。
【0181】このように、最初のスプレイ符号の復号結
果に基づいて、復元制御部235がデマルチプレクサ2
31,スプレイ復号部232および読出処理部233を
制御することにより、スプレイ符号,とアドレスの
下位8ビットとが混在した符号語の系列からLZSS符
号化方法による符号化結果を復元し、更に元の文字列を
復元することが可能となる。
【0182】また、上述した符号の木の代わりに、ア
ドレス全体に対応する符号の木を符号表136に相当
するものとして符号表格納部234に格納し、複製モー
ドの符号語が入力されたときに、復元制御部235が、
スプレイ復号部232に対して、符号の木を指定して
2番目のスプレイ符号の復号処理を指示する構成として
もよい。
【0183】この場合は、図16に示した流れ図のステ
ップ405において、復元制御部235は、スプレイ復
号部232に対して、符号の木を指定して次のスプレ
イ符号の復号処理を指示し、この復号結果を一致開始位
置を示すアドレスとして読出処理部233に送出すれば
よい。
【0184】これにより、図10(c) に示したようなス
プレイ符号,が混在した符号語の系列からLZSS
符号化方法による符号化結果を復元し、更に元の文字列
を復元することが可能となる。
【0185】なお、この場合は、復元制御部235から
の指示に応じて、スプレイ復号部232が、符号の木
と符号の木とを切り換えながら復号処理を行うことに
より、抽出手段132の機能が実現されでいるので、デ
マルチプレクサ231は不要である。したがって、図1
8に示すように、スプレイ復号部232に符号を直接入
力すればよい。
【0186】また、図15において、符号の木に代え
て、全ての文字および一致開始位置の一部に対応する情
報を含むシンボルに対応する符号の木を符号表格納部
234に格納するとともに、符号の木を符号表格納部
234に格納し、復元制御部235が後述するようにし
て、復元処理部230の各部を制御することにより、請
求項23のデータ復元装置を実現することができる。
【0187】上述した符号の木は、請求項22で述べ
た符号表141に相当するものであり、符号の木は、
請求項23で述べた符号表144に相当するものであ
る。図19に、請求項23のデータ復元装置によるデー
タ復元動作を表す流れ図を示す。
【0188】まず、上述したステップ401,402と
同様にして、第1符号に相当する最初のスプレイ符号
を復号し、その復号結果に基づいて、符号化モードの判
定を行い(ステップ421,422)、生データモード
である場合(ステップ422の否定判定)は、ステップ
403と同様にして文字を復元し(ステップ423)、
ステップ428に進む。
【0189】一方、ステップ422の肯定判定の場合
は、上述したにスプレイ符号の復号結果として得られ
るシンボルからアドレスの上位4ビットを復元し(ステ
ップ424)、読出処理部233に送出する。次に、ス
テップ416と同様にしてデマルチプレクサ231を制
御して、8ビットのビット列を抽出することによりアド
レスの下位8ビットを復元する(ステップ425)。ま
た、ステップ426において、復元制御部235からの
指示に応じて、スプレイ復号部232が符号の木を用
いて、第2符号に相当する次のスプレイ符号の復号処理
を行って一致長を復元し、読出処理部233に送出すれ
ばよい。
【0190】ステップ424〜426によって得られた
LZSS符号化方法による符号化結果に基づいて、読出
処理部233は、Pバッファ201から該当する文字列
を読み出して、復元文字列として出力する(ステップ4
27)。
【0191】その後、ステップ428,429におい
て、ステップ407,408と同様のバッファ管理処理
および未処理符号の有無の判定処理を行い、ステップ4
29の判定結果に応じて、ステップ421に戻って新し
い符号の復元処理行う。
【0192】このように、復元制御部235が、デマル
チプレクサ231,スプレイ復号部232および読出処
理部233を制御することにより、請求項22で述べた
抽出手段132およびスプレイ復号手段142の機能と
請求項23で述べたスプレイ復号手段145および文字
列復元手段143の機能を実現することができる。これ
により、スプレイ符号,とアドレスの下位8ビット
とが混在した符号語の系列からLZSS符号化方法によ
る符号化結果を復元し、元の文字列を復元することが可
能となる。
【0193】また、図18において、符号の木に代え
て、請求項22の符号表141に相当するものとして全
ての文字およびアドレス全体に対応する符号の木を符
号表格納部234に格納するとともに、符号の木に代
えて上述した符号の木を格納し、復元制御部235が
後述するようにして、復元処理部230の各部を制御す
ることにより、図10(e) に示した符号語の系列から元
の文字列を復元することができる。
【0194】図20に、このデータ復元装置によるデー
タ復元動作を表す流れ図を示す。まず、上述したステッ
プ401,402と同様にして第1符号を復号し、その
復号結果に基づいて、符号化モードの判定を行う(ステ
ップ431,432)。
【0195】ここで、上述したように、符号の木に対
応するシンボルの系列においては、文字とアドレスとは
対応するシンボルの最上位ビットによって区別されてお
り、また、各シンボルは13ビットのビット列で表され
ている。したがって、この場合は、ステップ432にお
いて、各シンボルで表される数値が数値『4096』よ
りも大きいか否かによって、複製モードであるか否かを
判定すればよい。
【0196】このステップ432における否定判定の場
合は、ステップ403と同様に、復号結果として得られ
たシンボルから文字を復元し(ステップ433)、ステ
ップ437に進む。
【0197】一方、ステップ432の肯定判定の場合
に、復元制御部235は、まず、上述したシンボルから
一致開始位置を示すPバッファ201のアドレスを復元
し(ステップ434)、読出処理部233に送出する。
次に、復元制御部235からの指示に応じて、スプレイ
復号部232が符号の木を用いて次のスプレイ符号、
すなわち第2符号を復号し(ステップ435)、得られ
た復号結果を一致長として読出処理部233に送出すれ
ばよい。
【0198】このようにして得られた一致開始位置およ
び一致長に基づいて、読出処理部232は、Pバッファ
201から該当する文字列を読み出して、復元文字列と
して出力する(ステップ436)。
【0199】その後、ステップ437,438におい
て、ステップ407,408と同様のバッファ管理処理
および未処理符号の有無の判定処理を行い、ステップ4
08の肯定判定に応じて、ステップ431に戻って新し
い符号の復元処理行う。
【0200】この場合は、図10(e) に示したように、
符号語の系列は、スプレイ符号とスプレイ符号とか
ら形成されているので、復元制御部235が、上述した
ようにして、スプレイ復号部232による復号処理に用
いられ符号の木を切り換えることにより、請求項22お
よび請求項23で述べた抽出手段132の機能が果たさ
れる。また、復元制御部235からの指示に対応する符
号の木を用いて、スプレイ復号部232が復号処理を行
うことにより、請求項22のスプレイ復号手段142と
請求項23のスプレイ復号手段145との機能を果た
し、これらの復号結果に基づいて読出処理部233が動
作することにより、請求項23で述べた文字列復元手段
143の機能を実現する構成となっている。
【0201】また、図15において、符号の木に代え
て、上述した符号の木と16通りの符号の木1
16と符号の木とを符号表格納部234に格納し、復元
制御部235が、後述するようにして、復元処理部23
0の各部を制御することにより、請求項24のデータ復
元装置を実現し、図10(f) に示した符号語の系列から
元の文字列を復元することができる。
【0202】この場合は、符号表格納部234に格納さ
れた符号の木は、請求項24の符号表151に相当す
るものであり、16通りの符号の木1 16は符号表
152に相当するものである。
【0203】図21に、請求項24のデータ復元装置に
よるデータ復元動作を表す流れ図を示す。まず、上述し
たステップ401,402と同様にして、最初のスプレ
イ符号を復号し、その復号結果に基づいて、符号化モ
ードの判定を行う(ステップ441,442)。ここ
で、上述したように、符号の木に対応するシンボルの
系列においては、文字の上位部分と一致長とは対応する
シンボルの最上位ビットによって区別されており、ま
た、各シンボルは5ビットのビット列で表されている。
したがって、この場合は、ステップ442において、各
シンボルで表される数値が数値『16』よりも大きいか
否かによって、複製モードであるか否かを判定すればよ
い。
【0204】このステップ442における否定判定の場
合に、復元制御部235は、まず、上述したステップ4
41で得られた復号結果から文字を表すビット列の上位
部分を復元し(ステップ443)、この上位部分に対応
する符号の木を指定して、スプレイ復号部232に対
して次のスプレイ符号の復号処理を指示する。
【0205】これに応じて、スプレイ復号部232は、
該当する符号の木を用いて、入力されたスプレイ符号
を復号し(ステップ444)、復号結果を復元制御部
235に送出する。
【0206】次に、復元制御部235は、ステップ44
3で文字の上位部分とステップ444の復号結果として
得られる文字の下位部分とを結合して1文字を復元し
(ステップ445)、ステップ447に進む。
【0207】一方、ステップ443における肯定判定の
場合は、図17に示した流れ図のステップ414〜41
7と同様にして、複製モードの符号語から文字列を復元
して出力する(ステップ446)。
【0208】その後、ステップ407,408と同様の
バッファ管理処理および未処理符号の有無の判定処理を
行い(ステップ447,448)、ステップ448の判
定結果に応じて、ステップ441に戻って新しい符号語
の復元処理を行う。
【0209】このように、復元制御部235が、スプレ
イ復号部232による復号処理に用いられ符号の木を切
り換えることにより、請求項24で述べた抽出手段13
2,154の機能が果たされる。また、復元制御部23
5からの指示に対応する符号の木を用いて、スプレイ復
号部232が復号処理を行うことにより、請求項24の
スプレイ復号手段153およびスプレイ復号手段155
の機能を果たし、これらの復号結果に基づいて読出処理
部233が動作することにより、請求項24の文字列復
元手段156の機能を実現する構成となっている。
【0210】これにより、請求項12のデータ圧縮装置
によって得られた符号語からLZSS符号化方法による
符号化結果を復元し、更に元の文字列を復元することが
可能となる。
【0211】また、図15において、符号の木に代え
て、上述した符号の木と16通りの符号の木1
16と符号の木とを符号表格納部234に格納し、復元
制御部235が、後述するようにして、復元処理部23
0の各部を制御することにより、図10(g) に示した符
号語の系列から元の文字列を復元することができる。
【0212】この場合は、図21に示したステップ44
6において、ステップ414〜ステップ417の処理を
行う代わりに、図19に示したステップ424〜ステッ
プ427の処理を行うことにより、複製モードの符号語
からLZSS符号化方法による符号化結果を復元し、更
に文字列を復元すればよい。
【0213】
【発明の効果】以上説明したように本発明のデータ圧縮
装置は、LZSS符号化方法による2つのモードの符号
化結果を組み合わせて可変長符号化することにより、生
データモードと複製モードとの出現確率の偏りと各モー
ドにおける符号化結果の出現確率の偏りとを利用して、
LZSS符号化方法による符号化結果を圧縮することが
でき、LZSS符号化方法の短所を補って、圧縮能率を
向上することが可能である。
【0214】特に、生データモードにおける文字と複製
モードにおける一致長(あるいはアドレスの少なくとも
一部)とを組み合わせて可変長符号化し、更に、複製モ
ードの場合に、アドレスの少なくとも一部(あるいは一
致長)を単独で可変長符号化することにより、大きな効
果を得ることができる。
【0215】また、生データモードにおける文字を上位
部分と下位部分とに分け、上位部分と複製モードにおけ
る符号化結果とを組み合わせて可変長符号化することに
より、画像データのように、ランダムな成分を含む情報
にも柔軟に対応して、圧縮能率の向上を図ることができ
る。この場合に、更に、文字の下位部分を上位部分に従
属して可変長符号化することにより、ランダムな成分を
含む情報とテキストデータのような文字としての出現確
率に偏りがある情報との両方に対応することができる。
【0216】一方、復元側においては、符号から抽出し
た可変長符号の復号結果によって符号化モードを知るこ
とができるから、この判別結果に応じて、復号結果から
LZSS符号化方法による符号化結果を復元し、更に従
来と同様の復元処理を行うことにより、元の文字列を復
元することができる。
【図面の簡単な説明】
【図1】本発明のデータ圧縮方法の原理を示す図であ
る。
【図2】請求項8ないし請求項11のデータ圧縮装置の
原理ブロック図である。
【図3】請求項12のデータ圧縮装置の原理ブロック図
である。
【図4】本発明のデータ復元方法の原理を示す図であ
る。
【図5】請求項20ないし請求項23のデータ復元装置
の原理ブロック図である。
【図6】請求項24のデータ復元装置の原理ブロック図
である。
【図7】請求項8のデータ圧縮装置の実施例構成図であ
る。
【図8】符号の例を示す図である。
【図9】データ圧縮動作を表す流れ図である。
【図10】符号語の系列の例を示す図である。
【図11】データ圧縮動作を表す流れ図である。
【図12】データ圧縮動作を表す流れ図である。
【図13】データ圧縮動作を表す流れ図である。
【図14】請求項9のデータ圧縮装置の別実施例構成図
である。
【図15】請求項20のデータ復元装置の実施例構成図
である。
【図16】データ復元動作を表す流れ図である。
【図17】データ復元動作を表す流れ図である。
【図18】請求項21のデータ復元装置の別実施例構成
図である。
【図19】データ復元動作を表す流れ図である。
【図20】データ復元動作を表す流れ図である。
【図21】データ復元動作を表す流れ図である。
【図22】従来のデータ圧縮装置の構成例を示す図であ
る。
【図23】符号語の構成を示す図である。
【図24】スプレイ符号化方法の説明図である。
【符号の説明】
101,104 辞書 102 マッチング手段 103 符号化手段 111,113,115,117,121,122 符
号表 112,114,116,118,123,124 ス
プレイ符号化手段 130 復元処理手段 131,136,141,144,151,152 符
号表 132,154 抽出手段 133,137,142,145,153,155 ス
プレイ復号手段 134 判別手段 135,143,156 文字列復元手段 201 Pバッファ 202 Qバッファ 203 マッチング部 211,221 スプレイ符号化部 212,222 符号表格納部 213 符号化制御部 214 符号語作成部 230 復元処理部 231 デマルチプレクサ(DMPX) 232 スプレイ復号部 233 読出処理部 234 符号表格納部 235 復元制御部 501 符号化部
フロントページの続き (72)発明者 矢作 裕紀 神奈川県川崎市中原区上小田中1015番地 富士通株式会社内 (56)参考文献 特開 平7−135471(JP,A) 特開 昭63−294134(JP,A) 特開 平5−244015(JP,A) 特開 平4−280517(JP,A) 特開 平5−218881(JP,A) 特開 平4−156111(JP,A) 特開 平8−30432(JP,A) 特開 平7−334344(JP,A) 特開 平7−225667(JP,A) 特開 平5−224878(JP,A) 特開 平5−11973(JP,A) 特開 平3−78322(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06F 5/00 H03M 7/46

Claims (24)

    (57)【特許請求の範囲】
  1. 【請求項1】 辞書内に蓄積された符号化済みの文字列
    のなかから、符号化対象の文字列と最大長一致する一致
    文字列を検索し、その一致長に応じて、符号化対象の文
    字列そのものを1文字単位で符号として送出する生デー
    タモードと、前記一致文字列の前記辞書における位置に
    関する情報および前記一致長に関する情報を符号として
    送出する複製モードとを切り換えるスライド辞書型のデ
    ータ圧縮方法において、 前記生データモードにおいて得られる符号化結果の相異
    なる要素および前記複製モードにおいて得られる符号化
    結果の相異なる要素とに対して統一的な番号を与えて一
    つの符号表に登録し、 前記生データモードおよび前記複製モードにおいて、そ
    れぞれ得られた符号化結果に対応する番号を前記符号表
    に前記番号に対応して登録された符号に置き換えること
    によって符号化し、 前記符号表を該当する符号に着目して組み替え、該当す
    る符号の符号長を減ずることを特徴とするデータ圧縮方
    法。
  2. 【請求項2】 請求項1に記載のデータ圧縮方法におい
    て、 生データモードにおける符号化結果として得られる文字
    および複製モードにおいて得られる符号化結果の相異な
    る要素に対して統一的な番号を与えることを特徴とする
    データ圧縮方法。
  3. 【請求項3】 請求項1に記載のデータ圧縮方法におい
    て、 生データモードにおける符号化結果の相異なる要素およ
    複製モードにおいて得られる相異なる一致長に対して
    統一的な番号を与えることを特徴とするデータ圧縮方
    法。
  4. 【請求項4】 請求項3に記載のデータ圧縮方法におい
    て、 複製モードにおいて、一致文字列の位置に関する情報の
    少なくとも一部の相異なる要素にそれぞれ与えられた番
    号を、前記番号に対応する符号が登録された符号表を用
    いて符号化し、 前記符号表を該当する符号に着目して組み替えて、該当
    する符号の符号長を減じることを特徴とするデータ圧縮
    方法。
  5. 【請求項5】 請求項1に記載のデータ圧縮方法におい
    て、 生データモードにおける符号化結果の相異なる要素およ
    複製モードにおいて一致文字列の位置として得られる
    アドレスを表すビット列の少なくとも一部に相当する相
    異なる要素に対して統一的な番号を与えることを特徴と
    するデータ圧縮方法。
  6. 【請求項6】 請求項5に記載のデータ圧縮方法におい
    て、 複製モードにおいて、相異なる一致長にそれぞれ与えら
    れた番号を、前記番号に対応する符号が登録された符号
    表を用いて符号化し、 前記符号表を該当する符号に着目して組み替えて、該当
    する符号の符号長を減じることを特徴とするデータ圧縮
    方法。
  7. 【請求項7】 請求項1のデータ圧縮方法において、 生データモードにおける符号化結果として得られる文字
    を表すビット列の上位部分に相当する相異なる要素およ
    複製モードにおける符号化結果の相異なる要素に対し
    統一的な番号を与え、 前記文字を表すビット列の上位部分に相当する各要素に
    対応して、文字を表すビット列の下位部分に相当する相
    異なる要素に対して番号を与えた符号表をそれぞれ
    け、 前記生データモードにおいて、符号化結果として得られ
    た文字を表すビット列の上位部分に対応する符号表によ
    って示される前記文字を表すビット列の下位部分に与え
    られた番号をその出現確率に応じて可変長符号化するこ
    とを特徴とするデータ圧縮方法。
  8. 【請求項8】 辞書内に蓄積された符号化済みの文字列
    のなかから、マッチング手段により、符号化対象の文字
    列と最大長一致する一致文字列を検索し、その一致長に
    応じて、符号化手段が、符号化対象の文字列そのものを
    1文字単位で符号として送出する生データモードと、前
    記一致文字列の前記辞書における位置に関する情報およ
    び前記一致長に関する情報を符号として送出する複製モ
    ードとを切り換えながら動作するスライド辞書型のデー
    タ圧縮装置において、 前記生データモードにおいて前記符号化手段で得られる
    各文字および前記複製モードにおいて得られる相異なる
    一致長に統一的に与えられた番号に対応する符号を符号
    の木の形式で保持する符号表と、 前記生データモードにおける文字および前記複製モード
    における一致長の入力に応じて、それぞれに対応する符
    号を前記符号表から検索して出力するとともに、該当す
    る符号の長さが半分になるように前記符号の木を組み替
    えるスプレイ符号化手段と を備えたことを特徴とするデータ圧縮装置。
  9. 【請求項9】 請求項8のデータ圧縮装置において、 複製モードにおいて、符号化手段によって一致文字列の
    位置を示す情報として得られるアドレス少なくとも一
    に相当する相異なるビット列に対応する符号を登録し
    た符号の木を保持する符号表と、 前記アドレスの少なくとも一部の入力に応じて前記符号
    表を参照し、該当する符号を出力するとともに、該当す
    る符号の長さが半分になるように前記符号の木を組み替
    えるスプレイ符号化手段とを備えたことを特徴とするデ
    ータ圧縮装置。
  10. 【請求項10】 辞書内に蓄積された符号化済みの文字
    列のなかから、マッチング手段により、符号化対象の文
    字列と最大長一致する一致文字列を検索し、その一致長
    に応じて、符号化手段が、符号化対象の文字列そのもの
    を1文字単位で符号として送出する生データモードと、
    前記一致文字列の前記辞書における位置に関する情報お
    よび前記一致長に関する情報を符号として送出する複製
    モードとを切り換えながら動作するスライド辞書型のデ
    ータ圧縮装置において、 前記生データモードにおいて前記符号化手段で得られる
    各文字および前記複製モードにおいて一致文字列の位置
    として得られるアドレスの少なくとも一部に相当する相
    異なるビット列に統一的に与えられた番号に対応する符
    号を符号の木の形式で保持する符号表と、 前記生データモードにおける文字および前記複製モード
    におけるアドレスの少なくとも一部の入力に応じて、そ
    れぞれに対応する符号を前記符号表から検索して出力す
    るとともに、該当する符号の長さが半分になるように前
    記符号の木を組み替えるスプレイ符号化手段とを備えた
    ことを特徴とするデータ圧縮装置。
  11. 【請求項11】 請求項10のデータ圧縮装置におい
    て、 複製モードにおいて、符号化手段による符号化結果とし
    て得られる各一致長に対応する符号を登録した符号の木
    を保持する符号表と、 前記一致長の入力に応じて前記符号表を参照し、該当す
    る符号を出力するとともに、該当する符号の長さが半分
    になるように前記符号の木を組み替えるスプレイ符号化
    手段とを備えたことを特徴とするデータ圧縮装置。
  12. 【請求項12】 辞書内に蓄積された符号化済みの文字
    列のなかから、マッチング手段により、符号化対象の文
    字列と最大長一致する一致文字列を検索し、その一致長
    に応じて、符号化手段が、符号化対象の文字列そのもの
    を1文字単位で符号として送出する生データモードと、
    前記一致文字列の前記辞書における位置に関する情報お
    よび前記一致長に関する情報を符号として送出する複製
    モードとを切り換えながら動作するスライド辞書型のデ
    ータ圧縮装置において、 前記生データモードにおいて前記符号化手段で得られる
    文字を表すビット列の上位部分に相当する相異なる要素
    および前記複製モードにおいて得られる符号化結果の相
    異なる要素に統一的に与えられた番号に対応する符号を
    符号の木の形式で保持する第1の符号表と、 前記文字を表すビット列の上位部分に相当する各要素
    対応して、文字を表すビット列の下位部分に相当する相
    異なる要素に与えた符号系列それぞれを符号の木の形式
    で保持する第2の符号表と、 前記生データモードにおける文字を表すビット列の上位
    部分および前記複製モードにおける符号化結果の入力に
    応じて、それぞれに対応する符号を前記第1の符号表か
    ら検索して出力するとともに、該当する符号の長さが半
    分になるように前記符号の木を組み替える第1のスプレ
    イ符号化手段と、 前記文字を表すビット列の上位部分に応じて前記第2の
    符号表から該当する符号の木を選択し、前記生データモ
    ードで得られる文字を表すビット列の下位部分に対応す
    る符号を検索して出力するとともに、該当する符号の長
    さが半分になるように前記符号の木を組み替える第2の
    スプレイ符号化手段とを備えたことを特徴とするデータ
    圧縮装置。
  13. 【請求項13】 辞書内に蓄積された符号化済みの文字
    列のなかから、符号化対象の文字列と最大長一致する一
    致文字列を検索し、その一致長に応じて、符号化対象の
    文字列そのものを1文字単位で符号として送出する生デ
    ータモードと、前記一致文字列の前記辞書における位置
    に関する情報および前記一致長に関する情報を符号とし
    て送出する複製モードとを切り換えるスライド辞書型の
    データ圧縮方法によって得られる符号から元の文字列を
    復元するデータ復元方法において、 前記生データモードにおいて得られる符号化結果の相異
    なる要素および前記複製モードにおいて得られる符号化
    結果の相異なる要素に対して統一的な番号を与えて、そ
    れぞれの番号に対応する符号を登録した第1の符号表を
    用意し、 前記第1の符号表に基づいて、入力される符号系列から
    前記一連の番号のいずれかに対応して登録された第1符
    号を抽出し、この第1符号を前記第1の符号表を用いて
    復号し、 前記第1の符号表を前記第1符号に着目して組み替え
    て、該当する符号の長さを減じ、 前記第1符号の復号結果として得られる番号に基づい
    て、前記第1符号が生データモードであるか複製モード
    であるかを判別し、 前記番号で示される符号化結果に対して、該当する符号
    化モードに応じた復元処理を行うことを特徴とするデー
    タ復元方法。
  14. 【請求項14】 請求項13に記載のデータ復元方法に
    おいて、 生データモードにおける符号化結果として得られる文字
    および複製モードにおいて得られる符号化結果の相異な
    る要素に対して統一的な番号を与えて第1の符号表を用
    意し抽出された 第1符号が生データモードである場合に、前
    記第1符号を前記第1の符号表を用いて復号して得られ
    番号に対応する文字を復元文字列として出力するとと
    もに辞書に蓄積することを特徴とするデータ復元方法。
  15. 【請求項15】 請求項13に記載のデータ復元方法に
    おいて、 生データモードにおける符号化結果の相異なる要素およ
    複製モードにおいて得られる相異なる一致長に対して
    統一的な番号を与えて第1の符号表を用意し、 抽出された 第1符号が複製モードである場合に、前記第
    1符号を前記第1の符号表を用いて復号して得られた
    号から一致長を得ることを特徴とするデータ復元方法。
  16. 【請求項16】 請求項15に記載のデータ復元方法に
    おいて、 一致文字列の位置に関する情報の少なくとも一部に相当
    する要素にそれぞれ与えられた符号を登録した第2の符
    号表を用意しておき、 第1符号が複製モードである場合に、前記第1符号に続
    く第2符号を前記第2の符号表に基づいて抽出し、 前記第2符号を第2の符号表を用いて復号して、一致文
    字列の位置に関する情報の少なくとも一部を復元し、 前記第2の符号表を前記第2符号に着目して組み替え
    て、該当する符号の長さを減ずることを特徴とするデー
    タ復元方法。
  17. 【請求項17】 請求項13に記載のデータ復元方法に
    おいて、 生データモードにおける符号化結果の相異なる要素およ
    複製モードにおいて一致文字列の位置として得られる
    アドレスの少なくとも一部のビット列に相当する相異な
    る要素に対して統一的な番号を与え、この統一的な番号
    割り当てた符号を登録した第1の符号表を用意し、 複製モードの第1符号の入力に応じて、前記第1符号
    前記第1の符号表を用いて復号して得られた番号に対応
    する前記アドレスの少なくとも一部を得ることを特徴と
    するデータ復元方法。
  18. 【請求項18】 請求項17に記載のデータ復元方法に
    おいて、相異なる一致長に対応する符号 を登録した第2の符号表
    を用意しておき、 第1符号が複製モードである場合に、前記第1符号に続
    く第2符号前記第2の符号表に基づいて抽出し、 前記第2符号を前記第2の符号表を用いて復号して一致
    長を復元し、 前記第2の符号表を前記第2符号に着目して組み替え
    て、該当する符号の長さを減じることを特徴とするデー
    タ復元方法。
  19. 【請求項19】 請求項13のデータ復元方法におい
    て、 生データモードにおける符号化結果として得られる文字
    を表すビット列の上位部分に相当する相異なる要素およ
    複製モードにおける符号化結果の相異なる要素に対し
    統一的な番号を与え、この統一的な番号に割り当てた
    符号を登録した第1の符号表を用意し、 前記文字を表すビット列の上位部分に相当する各要素
    対応して、文字を表すビット列の下位部分に相当する相
    異なる要素それぞれに対して番号を与えた符号表をそれ
    ぞれ設け、 第1符号が生データである場合に、前記第1符号の可変
    長復号結果として得られる番号から文字を表すビット列
    の上位部分を復元し、 前記第1符号に続く可変長符号を第2符号として抽出
    し、 前記文字を表すビット列の上位部分に対応する符号表を
    用いて、前記第2符号を可変長復号して、前記文字を表
    すビット列の下位部分を得ることを特徴とするデータ復
    元方法。
  20. 【請求項20】 辞書内に蓄積された符号化済みの文字
    列のなかから、符号化対象の文字列と最大長一致する一
    致文字列を検索し、その一致長に応じて、符号化対象の
    文字列そのものを1文字単位で符号として送出する生デ
    ータモードと、前記一致文字列の前記辞書における位置
    に関する情報および前記一致長に関する情報を符号とし
    て送出する複製モードとを切り換えるスライド辞書型の
    データ圧縮方法によって得られる符号の入力に応じて、
    復元処理手段が元の文字列を復元し、辞書に蓄積するデ
    ータ復元装置において、 前記復元処理手段が、 前記生データモードにおいて得られる各文字および前記
    複製モードにおいて得られる一致長に統一的に与えられ
    た番号系列に対応する符号系列を符号の木の形式で保持
    する符号表と、 入力される一連の符号から可変長符号を第1符号として
    抽出する抽出手段と、前記第1符号を前記符号表を用い
    てスプレイ復号化し、該当する番号を出力するととも
    に、該当する符号の長さが半分になるように前記符号の
    木を組み替えるスプレイ復号手段と、 前記第1符号の復号結果として得られる番号に基づい
    て、前記第1符号が生データモードであるか複製モード
    であるかを判別する判別手段と、 生データモードである旨の判別結果の入力に応じて、前
    記番号から文字を得て復元文字列として出力し、複製モ
    ードである旨の判別結果の入力に応じて、前記番号から
    得られる一致長に基づいて前記辞書から一致文字列を検
    索し、復元文字列として出力する文字列復元手段とを備
    えた構成であることを特徴とするデータ復元装置。
  21. 【請求項21】 請求項20のデータ復元装置におい
    て、 復元処理手段が、 複製モードにおいて、一致文字列の位置を示す情報とし
    て得られるアドレスを表すビット列の少なくとも一部に
    相当する相異なる要素に対応する符号を登録した符号の
    木を保持する符号表と、 可変長符号の入力に応じて前記符号表を参照し、該当す
    るビット列を出力するとともに、該当する符号の長さが
    半分になるように前記符号の木を組み替えるスプレイ復
    号手段とを備え、 抽出手段が、第1符号が複製モードである旨の判別結果
    の入力に応じて、前記第1符号に続く可変長符号を第2
    符号として抽出し、前記スプレイ復号手段に送出する構
    成であり、 文字列復元手段は、複製モードである旨の判別結果に応
    じて、スプレイ復号手段で得られる番号で示される一致
    長と、前記スプレイ復号手段で得られるビット列で示さ
    れるアドレスとに基づいて、辞書から一致文字列を検索
    する構成であることを特徴とするデータ復元装置。
  22. 【請求項22】 辞書内に蓄積された符号化済みの文字
    列のなかから、符号化対象の文字列と最大長一致する一
    致文字列を検索し、その一致長に応じて、符号化対象の
    文字列そのものを1文字単位で符号として送出する生デ
    ータモードと、前記一致文字列の前記辞書における位置
    に関する情報および前記一致長に関する情報を符号とし
    て送出する複製モードとを切り換えるスライド辞書型の
    データ圧縮方法によって得られる符号の入力に応じて、
    復元処理手段が元の文字列を復元し、辞書に蓄積するデ
    ータ復元装置において、 前記復元処理手段が、 前記生データモードにおいて得られる各文字および前記
    複製モードにおいて得られる一致文字列の位置として得
    られるアドレスを表すビット列の少なくとも一部に対応
    する相異なる要素に統一的に与えられた番号系列に対応
    する符号系列を符号の木の形式で保持する符号表と、 入力される一連の符号から可変長符号を第1符号として
    抽出する抽出手段と、 前記第1符号を前記符号表を用いてスプレイ復号化し、
    該当する番号を出力するとともに、該当する符号の長さ
    が半分になるように前記符号の木を組み替えるスプレイ
    復号手段と、 前記第1符号の復号結果として得られる番号に基づい
    て、前記第1符号が生データモードであるか複製モード
    であるかを判別する判別手段と、 生データモードである旨の判別結果の入力に応じて、前
    記番号から文字を得て復元文字列として出力し、複製モ
    ードである旨の判別結果の入力に応じて、前記番号から
    得られるアドレスの少なくとも一部に基づいて前記辞書
    から一致文字列を検索し、復元文字列として出力する文
    字列復元手段とを備えた構成であることを特徴とするデ
    ータ復元装置。
  23. 【請求項23】 請求項22のデータ復元装置におい
    て、 復元処理手段が、 複製モードにおいて得られる各一致長に対応する符号を
    登録した符号の木を保持する符号表と、 可変長符号の入力に応じて前記符号表を参照し、該当す
    る一致長を出力するとともに、該当する符号の長さが半
    分になるように前記符号の木を組み替えるスプレイ復号
    手段とを備え、 抽出手段が、第1符号が複製モードである旨の判別結果
    の入力に応じて、前記第1符号に続く可変長符号を第2
    符号として抽出し、前記スプレイ復号手段に送出する構
    成であり、 文字列復元手段は、複製モードである旨の判別結果に応
    じて、スプレイ復号手段で得られる番号で示されるアド
    レスと、前記スプレイ復号手段で得られる一致長とに基
    づいて、辞書から一致文字列を検索する構成であること
    を特徴とするデータ復元装置。
  24. 【請求項24】 辞書内に蓄積された符号化済みの文字
    列のなかから、符号化対象の文字列と最大長一致する一
    致文字列を検索し、その一致長に応じて、符号化対象の
    文字列そのものを1文字単位で符号として送出する生デ
    ータモードと、前記一致文字列の前記辞書における位置
    に関する情報および前記一致長に関する情報を符号とし
    て送出する複製モードとを切り換えるスライド辞書型の
    データ圧縮方法によって得られる符号の入力に応じて、
    復元処理手段が元の文字列を復元し、辞書に蓄積するデ
    ータ復元装置において、 前記復元処理手段が、 前記生データモードにおいて得られる文字を表すビット
    列の上位部分に相当する相異なる要素および前記複製モ
    ードにおいて得られる符号化結果の相異なる要素に統一
    的に与えられた番号系列に対応する符号系列を符号の木
    の形式で保持する符号表と、 前記文字を表すビット列の上位部分に相当する各要素
    対応して、文字を表すビット列の下位部分に相当する各
    要素に割り当てた符号系列を符号の木の形式でそれぞれ
    保持する符号表と、 入力される符号から可変長符号を第1符号として抽出す
    る抽出手段と、 前記第1符号を前記統一的な番号に関する符号表を用い
    てスプレイ復号化し、該当する番号を出力するととも
    に、該当する符号の長さが半分になるように前記符号の
    木を組み替える第1のスプレイ復号手段と、 前記第1符号の復号結果として得られる番号に基づい
    て、前記第1符号が生データモードであるか複製モード
    であるかを判別する判別手段と、 生データモードである旨の判別結果の入力に応じて、前
    記第1符号に続く可変長符号を第2符号として抽出する
    抽出手段と、 生データモードである旨の判別結果に応じて、前記第1
    スプレイ復号手段で得られた番号で示される文字を表
    すビット列の上位部分に応じて前記文字を表すビット列
    の下位部分に関する符号表から該当する符号の木を選択
    し、前記第2符号をスプレイ復号化して前記文字を表す
    ビット列の下位部分を出力するとともに、該当する符号
    の長さが半分になるように前記符号の木を組み替える
    2のスプレイ復号手段と、 生データモードである旨の判別結果の入力に応じて、前
    第1のスプレイ復号手段で得られる番号で示される
    字を表すビット列の上位部分と前記第2のスプレイ復号
    手段から得られる文字を表すビット列の下位部分とを結
    合して復元文字列として出力し、複製モードである旨の
    判別結果の入力に応じて、前記番号で示される符号化結
    果に基づいて前記辞書から一致文字列を検索し、復元文
    字列として出力する文字列復元手段とを備えた構成であ
    ることを特徴とするデータ復元装置。
JP04587494A 1994-03-16 1994-03-16 データ圧縮方法および装置ならびにデータ復元方法および装置 Expired - Fee Related JP3397431B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP04587494A JP3397431B2 (ja) 1994-03-16 1994-03-16 データ圧縮方法および装置ならびにデータ復元方法および装置
US08/405,209 US5673042A (en) 1994-03-16 1995-03-16 Method of and an apparatus for compressing/decompressing data

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP04587494A JP3397431B2 (ja) 1994-03-16 1994-03-16 データ圧縮方法および装置ならびにデータ復元方法および装置

Publications (2)

Publication Number Publication Date
JPH07261977A JPH07261977A (ja) 1995-10-13
JP3397431B2 true JP3397431B2 (ja) 2003-04-14

Family

ID=12731367

Family Applications (1)

Application Number Title Priority Date Filing Date
JP04587494A Expired - Fee Related JP3397431B2 (ja) 1994-03-16 1994-03-16 データ圧縮方法および装置ならびにデータ復元方法および装置

Country Status (2)

Country Link
US (1) US5673042A (ja)
JP (1) JP3397431B2 (ja)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5999949A (en) * 1997-03-14 1999-12-07 Crandall; Gary E. Text file compression system utilizing word terminators
JP3541930B2 (ja) 1998-08-13 2004-07-14 富士通株式会社 符号化装置及び復号化装置
US6301394B1 (en) * 1998-09-25 2001-10-09 Anzus, Inc. Method and apparatus for compressing data
JP2000201080A (ja) * 1999-01-07 2000-07-18 Fujitsu Ltd 付加コ―ドを用いたデ―タ圧縮/復元装置および方法
JP2000261803A (ja) 1999-03-04 2000-09-22 Sega Enterp Ltd 画像情報の符号化方法及び復号化方法
US6611213B1 (en) 1999-03-22 2003-08-26 Lucent Technologies Inc. Method and apparatus for data compression using fingerprinting
US6388584B1 (en) 2000-03-16 2002-05-14 Lucent Technologies Inc. Method and apparatus for data compression of network packets
US6236341B1 (en) 2000-03-16 2001-05-22 Lucent Technologies Inc. Method and apparatus for data compression of network packets employing per-packet hash tables
DE10131801B4 (de) * 2001-06-30 2013-03-07 Robert Bosch Gmbh Verfahren zur Datenkompression und Navigationssystem
GB0117721D0 (en) * 2001-07-20 2001-09-12 Surfcontrol Plc Database and method of generating same
US6798360B1 (en) * 2003-06-27 2004-09-28 Canadian Space Agency Method and system for compressing a continuous data flow in real-time using recursive hierarchical self-organizing cluster vector quantization (HSOCVQ)
US7079054B2 (en) * 2004-06-04 2006-07-18 Broadcom Corporation V.42bis standalone hardware accelerator and architecture of construction
JP2006295853A (ja) * 2005-04-14 2006-10-26 Sony Corp 符号化装置、復号装置、および、符号化方法ならびに復号方法
US7215259B2 (en) * 2005-06-03 2007-05-08 Quantum Corporation Data compression with selective encoding of short matches
US7507897B2 (en) * 2005-12-30 2009-03-24 Vtech Telecommunications Limited Dictionary-based compression of melody data and compressor/decompressor for the same
US7836037B2 (en) * 2007-10-04 2010-11-16 Sap Ag Selection of rows and values from indexes with updates
DE602008002583D1 (de) * 2008-07-21 2010-10-28 Sony Comp Entertainment Europe Datenkomprimierung und -dekomprimierung
US8176080B2 (en) * 2009-03-06 2012-05-08 Hewlett-Packard Development Company, L.P. Desensitizing character strings
JP5656593B2 (ja) * 2010-12-07 2015-01-21 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 符号化データを復号する装置及び方法
US8902087B1 (en) 2013-08-27 2014-12-02 International Business Machines Corporation Data decompression utilizing pre-expanded dictionaries during decompression
US10120478B2 (en) 2013-10-28 2018-11-06 Apple Inc. Piezo based force sensing
JP6511836B2 (ja) * 2015-01-30 2019-05-15 富士通株式会社 圧縮プログラム、圧縮方法、圧縮装置および伸長プログラム
US11138152B2 (en) 2017-10-11 2021-10-05 Lognovations Holdings, Llc Method and system for content agnostic file indexing
US10963429B2 (en) 2017-10-11 2021-03-30 Lognovations Holdings, Llc Method and system for content agnostic file indexing

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4899148A (en) * 1987-02-25 1990-02-06 Oki Electric Industry Co., Ltd. Data compression method
US5003307A (en) * 1989-01-13 1991-03-26 Stac, Inc. Data compression apparatus with shift register search means

Also Published As

Publication number Publication date
US5673042A (en) 1997-09-30
JPH07261977A (ja) 1995-10-13

Similar Documents

Publication Publication Date Title
JP3397431B2 (ja) データ圧縮方法および装置ならびにデータ復元方法および装置
KR100894002B1 (ko) 선택적 압축과 복원 및 압축 데이터에 대한 데이터 포맷을위한 장치 및 방법
JP3278297B2 (ja) データ圧縮方法及びデータ復元方法並びにデータ圧縮装置及びデータ復元装置
JP3541930B2 (ja) 符号化装置及び復号化装置
JP4905562B2 (ja) データ圧縮装置、及びデータ復元装置
JP3258552B2 (ja) データ圧縮装置及びデータ復元装置
JP2581903B2 (ja) バイト整列式データ圧縮方法及び装置
WO2019153700A1 (zh) 编解码方法、装置及编解码设备
US6304676B1 (en) Apparatus and method for successively refined competitive compression with redundant decompression
Carus et al. Fast text compression using multiple static dictionaries
Gupta et al. Data compression-lossless and lossy techniques
Ezhilarasu et al. Arithmetic Coding for Lossless Data Compression–A Review
JP3231105B2 (ja) データ符号化方式及びデータ復元方式
Rahman et al. A novel lossless coding technique for image compression
Rathore et al. A brief study of data compression algorithms
JP2536422B2 (ja) デ―タ圧縮装置及びデ―タ復元装置
JP2005521324A (ja) 損失のないデータの圧縮および圧縮解除方法および装置
Atwal et al. Fast Lempel Ziv (LZ'78) Algorithm Using Codebook Hashing
JPH0628149A (ja) 複数種類データのデータ圧縮方法
Yu Data compression for PC software distribution
Tsai et al. An Improved LZW Algorithm for Large Data Size and Low Bitwidth per Code
Nakano et al. Highly efficient universal coding with classifying to subdictionaries for text compression
JPH0644038A (ja) データ圧縮方法、データ復元方法、データ圧縮/復元方法
Vergara-Villegas et al. Data preprocessing by sequential pattern mining for LZW
Pannirselvam et al. A Comparative Analysis on Different Techniques in Text Compression

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20030128

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080214

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090214

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090214

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100214

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110214

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110214

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120214

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees