JP3278297B2

JP3278297B2 - データ圧縮方法及びデータ復元方法並びにデータ圧縮装置及びデータ復元装置

Info

Publication number: JP3278297B2
Application number: JP16850294A
Authority: JP
Inventors: 君孝村下; 佳之岡田; 茂吉田
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1994-07-20
Filing date: 1994-07-20
Publication date: 2002-04-30
Anticipated expiration: 2017-04-30
Also published as: EP1289153A3; DE69532775T2; EP1024600B1; EP1289153A2; DE69527679D1; EP1024600A2; DE69527679T2; JPH0830432A; EP0695040A3; EP0695040A2; DE69532775D1; DE69535118D1; DE69535118T2; US5907637A; EP0695040B1; EP1289153B1; EP1024600A3

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、データ圧縮方法及びデ
ータ復元方法並びにデータ圧縮装置及びデータ復元装置
に関する。近年、文字コード、ベクトル情報，画像など
様々な種類のデータがコンピュータで扱われるようにな
っており、扱われるデータ量も急速に増加してきてい
る。これに伴い、大量のデータを扱うときは、データの
中の冗長な部分を省いてデータ量を圧縮することで、記
憶容量を減らしたり速く伝送したりすることが行なわれ
ている。また、様々なデータを一つの方式でデータ圧縮
できる方法としてユニバーサル符号化が提案されてい
る。

【０００２】ここで、本発明の分野は文字コードの圧縮
に限らず、様々なデータに適用できるが、以下では情報
理論で用いられている呼称を踏襲し、データの１ワード
単位を文字といい、データが任意ワードつながったもの
を文字列と呼ぶようにする。

【０００３】

【従来の技術】テキストデータやフィアル等を圧縮する
方式には、データ系列の類似性を利用いた辞書型符号化
方式と、データ列の出現頻度を利用した確率統計型符号
化方式(statistical coding) がある。この内、確率統
計型符号化の代表的な手法が、上述のユニバーサル符号
化である。

【０００４】さらに、算術符号化と呼ばれる符号化があ
る。この算術符号化とは、各文字の出現確率に適応した
符号を、符号表をもたずに、計算しながら生成するもの
であり、情報源の文字の出現頻度が分かっている場合に
最大の効率で圧縮できるといわれている方法であり、２
値算術符号化と３値以上の多値算術符号化とがある。

【０００５】以下に、多値算術符号化の方法について述
べる。多値算術符号化では、まず０≦Ｐ＜１（以下、
〔０，１〕と記述する）の数直線を、出現した文字の事
象（以下、シンボルという）の数で分割する。ここで、
各区間の幅はシンボルの出現頻度の比に比例するように
取り、出現頻度が高い順に区間を配置する。

【０００６】そして、出現したシンボルに対応する区間
を選択し、次のシンボルでは選択した区間をさらに全シ
ンボル数分の区間に分割し対応するシンボルの区間を選
択するという具合に、再帰的に選択した区間を細分す
る。上述の処理について、図３２（ａ），図３２（ｂ）
に示す多値算術符号化の原理を説明する図を参照しなが
ら具体的に述べる。

【０００７】ここで、図３２（ａ）はシンボルと出現頻
度の一例を示す図、同図３２（ｂ）はシンボルの区間分
割の例を示す図である。そして、文字列“ａｂｅ”の区
間を分割する場合を例にとり、説明を進める。まず、数
直線〔０，１〕を、図３２（ａ）で示すような文字ａ，
ｂ，ｃ，ｄ，ｅの５つの区間に分割する。

【０００８】そして、最初に出現したシンボル“ａ”の
区間〔０，０．２〕を選択し、この選択した区間〔０，
０．２〕を、さらに、全シンボルａ〜ｅの５つの区間に
分割する。次に、第２に出現したシンボル“ｂ”の区間
〔０．０４，０．０６〕を選択し、この区間〔０．０
４，０．０６〕を、さらに全シンボルａ〜ｅの５つの区
間に分割する。こうして、第３に出現したシンボル
“ｅ”の区間を選択することにより、文字列“ａｂｅ”
の区間〔０．０５，０．０６〕が得られる。

【０００９】このように、全入力データについて、上述
のような処理を繰り返すことで、符号化する文字列の区
間を決定することができ、最終的に定まった文字列の区
間内の任意の点を２進表示で表したものを、圧縮符号と
して出力するのである。「算術符号化」という名称は、
符号語が〔０．１１０１１・・〕のように、２進数の小
数点以下の数値で表現され、それを計算で求められるこ
とからきている。

【００１０】また、上述のような出現頻度に応じた区間
の分割方法には、文字列の実際の出現頻度によらず、予
め設定した出現頻度に従って区間を分割する静的符号化
方式(static)、最初に全文字列を走査することにより得
られた出現頻度で区間を分割する準適応型符号化方式(s
emi-adaptive) 、又は文字が出現する毎に頻度を再計算
して１文字毎に区間を再設定する適応型符号化方式(ada
ptive)とがある。

【００１１】ところで、上述の多値算術符号化をファイ
ル圧縮に用い、バイト（文字）単位にデータを圧縮する
方法は、例えば、以下の２つの文献，に記載されて
いる。 "Arithmetic Coding for Data Compression," Commu
n. of ACM, Vol.30, No.6 PP.520 −540(1986) "An Adative Dependency Source Model for Data Com
pression Scheme," Commun. of ACM, Vol.32 No.1 PP.7
7 −83 ここで、文献は、多値算術符号化の具体的なアルゴリ
ズムを開示している。また、この文献での多値算術符
号化は、１文字単位に符号化・圧縮するエントロピー符
号化と呼ばれる方法の一つであり、注目文字の出現確率
を多値算術符号化するとともに、各文字の出現確率をそ
の文字が表れるごとに逐次更新し、種々のデータに動的
に適応して符号化を行なうものである。また、この多値
算術符号化では、詳細には図３３（ａ）のフローチャー
トに示すような処理が行なわれる。

【００１２】一方、文献の方法は、注目文字を直前文
字を用いた条件付確率で表し、その条件付確率を多値算
術符号化することで高圧縮率を得る方法を与え、各条件
付確率を逐次更新し、種々のデータに動的に適応して符
号化を行なうものである。この多値算術符号化において
も、図３３（ｂ）のフローチャートに示すような処理が
行なわれる。

【００１３】ここで、多値算術符号化の代わりに、ハフ
マン符号化の変形であるダイナミック・ハフマン符号化
（"Variation a Theme by Huffman", IEEE Trans. Info
rm.Theory, Vol.24, No.6 1978, または、"Design and
Analysis of Dynamic Huffman Codes", Journal of AC
M, Vol.34, No.4 1987 参照）を用いる方法も考えられ
るが、このダイナミック・ハフマン符号化は、符号化効
率が多値算術符号化より劣る上、処理に時間がかかるた
め、条件付確率をダイナミック・ハフマン符号化する方
法は実際には使用されていない。

【００１４】なお、図３４は、この多値算術符号化・復
号化のアルゴリズムの一例を示す図である。また、算術
符号化とは別にスプレイ（Splay-Tree）符号化方法と呼
ばれるものがある（例えば、文献"Application of Spla
y Tree to Data Compression"DOUGLAS W.JONES著 Commu
n.of ACM,Vol31 No.8 P996-1007 参照）。

【００１５】このスプレイ符号化方法では、図３５
（ａ）に示すような木構造の符号表( 以下、符号木と称
する) を用い、符号木の終端( 一般的に葉、あるいはリ
ーフと呼ばれる)にシンボルを登録し、符号木の頂点
（一般的に根，あるいはルートと呼ばれる）から入力デ
ータが格納されているリーフまでの距離を符号語として
出力する。

【００１６】具体的に述べると、符号語には、ルートか
らリーフへ下るとき、右へ分岐したときは“１”、左へ
分岐したときは“０”を割り当てるのである。つまり、
図３５（ａ）の例では、シンボルＡの符号は〔１０１１
０〕となり、シンボルＢの符号は〔００１〕となる。そ
して、符号長を変更する（符号更新する）場合は、符号
化したリーフと他のリーフ、あるいは符号木上の接点
（節、あるいはノードと呼ばれる）とを組み替えること
により行なう。

【００１７】図３５（ｂ）に上述の符号更新の例を示
す。この図３５（ｂ）に示すように、入力されたデータ
の中に、初めシンボルＡ，Ｂ，Ｃ，Ｄの各符号が符号木
のリーフに格納されている。そして、まずシンボルＡと
シンボルＣとのノードを組み替え、さらにシンボルＡの
上位ノードＤとシンボルＥとのノードを組み替えること
により、図３５（ｂ）に示すように、シンボルＡの符号
は、〔１０１１０〕から〔１１０〕となり符号の更新が
行なわれる。

【００１８】ここで、上述の説明は１文字毎の出現確率
を動的に可変長符号化する場合であるが、さらに、圧縮
率を高めるためには、入力信号と直前の文字との依存関
係を取り入れた条件付き出現確率を動的可変長符号化す
ることで行なわれる。この方法は、データの確率統計的
な性質を用いる確率統計型符号化であり、図３６に示す
ように、文脈収集処理５１１と動的可変長符号化処理５
１２との２段階の処理からなる。

【００１９】そして、図３７（ａ）に示すように、文脈
収集により入力データから文字列の前後関係の文脈を収
集し、図３７（ｂ）に示すような文脈の木構造を作成
し、条件付き確率を求めて動的可変長符号化する。ここ
で、上述の条件付き確率は、図３７（ｂ）に示すような
木構造の文脈木上において、各ノードの文字を通る文字
列が出現する毎に出現回数を計数しておくことによって
求められる。

【００２０】ところで、条件付き確率を求める文脈収集
の方法には、主に以下の２つの方法がある。なお、以
下、条件（文脈）の文字数を次数と呼ぶことにする（文
献"Data Compression Using Adaptive Coding and Part
ial String Matching"JOHN G.CLEARY 他著IEEE Vol.COM
-32,No.4 APRIL 1984 P396-402参照）。（１）固定次数の文脈収集方法この方法は、条件付き確率の条件を固定の文字数にする
方法である。

【００２１】例えば２次の文脈では、直前２文字につな
がる文字の文脈を収集し、条件付き確率ｐ（ｙ｜ｘ１
，ｘ２）を符号化する。ただし、ｙは注目符号化文
字，ｘ１，ｘ２はそれぞれ直前の第１文字，第２文
字である。（２）Blending文脈収集方法上述の固定次数の文脈収集方法では、直前の条件文字列
が出にくい場合、条件付き確率の推定は不正確になり、
逆に直前の条件付き文字列が出やすい場合は条件付き確
率の推定は正確になり、さらに次数を上げ得る可能性を
残す。

【００２２】一般に、高次の文脈を使うほど文字間の相
関が大きいデータに対しては高圧縮率が得られるが、逆
に高次文脈を使うほど相関が小さくなるデータでは、か
えって圧縮率が悪くなる。これを解決するのが文脈のBl
ending（次数の混合）である。この方法は、直前の次数
を固定せずに出やすい場合には次数を上げ、出にくい場
合には低い次数のままという具合に文脈の次数を入力デ
ータに適応させて伸ばす方法である。

【００２３】

【発明が解決しようとする課題】しかしながら、算術符
号化を動的可変長符号に用いた確率統計型符号化方式に
は、データが入力されてくる度にそれまで入力された全
てのデータの累積頻度を再計算し、〔０，１〕の数直線
を再分割するので、複雑で大量な演算処理を必要であ
り、処理の高速化が行なえないという課題がある。

【００２４】本発明は、このような課題に鑑み創案され
たもので、算術符号の区間計算の代わりにスプレイ符号
化を適用し、このスプレイ符号化における符号木に新規
データを登録することで、高速な符号登録処理を可能に
してデータ圧縮／復元処理を高速化できるようにした、
データ圧縮方法及びデータ復元方法並びにデータ圧縮装
置及びデータ復元装置を提供することを目的とする。

【００２５】

【課題を解決するための手段】このため、本発明のデー
タ圧縮方法は、入力データを過去に出現した履歴に応じ
て符号化して圧縮するデータ圧縮方法において、次のよ
うな過程をとることを特徴としている（請求項１）。（１）入力データの文字列について直前文字との繋がり
を表わす文脈を収集して文脈木を作成する文脈収集過
程。（２）この文脈収集過程で得られた文脈木の各ノードに
対応する符号を符号木アドレスで対応させることにより
文脈に対応してスプレイ符号を対応させた符号木を、入
力データの文字列に応じてスプレイ符号化しながら作成
・更新するスプレイ符号化過程。

【００２６】また、本発明のデータ圧縮方法は、入力デ
ータを過去に出現した履歴に応じて符号化して圧縮する
データ圧縮方法において、上記入力データの文字列を収
集し、収集した文字列に番号を付けて直前文字との繋が
りを表わす文脈を辞書としての文脈木に登録するととも
に、この文脈木の各ノードに対応する符号を符号木アド
レスで対応させることにより文脈に対応してスプレイ符
号を対応させておき、最長一致文字列の辞書番号に対応
するスプレイ符号の符号化及び更新を施すとともに、所
定の最大文字列長に達するまで符号化文字列の伸長文字
列を文脈木に登録し、その伸長文字列に対応するスプレ
イ符号を木構造の符号表としての符号木に登録すること
を特徴としている（請求項２）。

【００２７】さらに、本発明のデータ圧縮方法では、辞
書登録文字列として、符号化済の直前文字から登録し、
直前文字から続く文字列を符号化するようにしてもよい
（請求項３）。また、本発明のデータ圧縮方法では、全
ての一文字にスプレイ符号を割り当てておき、もし、直
前文字から繋がる文字列が既に収集した辞書（文脈木）
中の文字列中になければ、一文字のスプレイ符号を出力
するとともにそのスプレイ符号を更新した後、直前文字
から繋がる符号化した文字を辞書（文脈木）に登録する
ようにしてもよい（請求項４）。

【００２８】一方、本発明のデータ復元方法は、入力デ
ータを過去の入力データの履歴に応じて符号化した符号
化データを復元するデータ復元方法において、次のよう
な過程をとることを特徴としている（請求項５）。（１）復元データの文字列について直前文字との繋がり
を表わす文脈を収集して文脈木を作成する文脈収集過
程。（２）この文脈収集過程で得られた文脈木の各ノードに
対応する符号を符号木アドレスで対応させることにより
文脈に対応してスプレイ符号を対応させた符号木を、復
元データの文字列に応じてスプレイ符号化しながら作成
・更新するスプレイ符号化過程。

【００２９】また、本発明のデータ復元方法は、入力デ
ータを過去の入力データの履歴に応じて符号化した符号
化データを復元するデータ復元方法において、復元した
データの文字列を収集し、収集した文字列に番号を付け
て直前文字との繋がりを表わす文脈を辞書としての文脈
木に登録するとともに、その文脈木の各ノードに対応す
る符号を符号木アドレスで対応させることにより文脈に
対応してスプレイ符号を対応させておき、辞書番号に対
応する文字列をスプレイ符号で復号化及び更新するとと
もに、所定の最大文字列長に達するまで符号化文字列の
伸長文字列を文脈木に登録し、その伸長文字列に対応す
るスプレイ符号を木構造の符号表としての符号木に登録
することを特徴としている（請求項６）。

【００３０】さらに、本発明のデータ復元方法では、辞
書登録文字列として、復号化済の直前文字から登録し、
直前文字から続く文字列を復号化するようにしてもよく
（請求項７）、全ての一文字にスプレイ符号を割り当て
ておき、直前文字から繋がる文字列が既に収集した辞書
（文脈木）中の文字列中にない一文字のスプレイ符号を
復号したとき、符号を更新するとともに、直前文字から
繋がる復号化した文字を辞書（文脈木）に登録するよう
にしてもよい（請求項８）。

【００３１】

【作用】上述の本発明のデータ圧縮方法では、次のよう
な作用がある（請求項１）。（１）文脈収集過程により、入力データの文字列につい
て直前文字との繋がりを表わす文脈を収集して文脈木を
作成することができる。（２）スプレイ符号化過程により、この文脈収集過程で
得られた文脈木の各ノードに対応する符号を符号木アド
レスで対応させることにより文脈に対応してスプレイ符
号を対応させた符号木を、入力データの文字列に応じて
スプレイ符号化しながら作成・更新することができる。

【００３２】また、本発明のデータ圧縮方法では、入力
データを過去に出現した履歴に応じて符号化して圧縮す
るデータ圧縮方法において、辞書としての文脈木に入力
データの文字列について直前文字との繋がりを表わす文
脈を収集し番号を付けて登録するとともに、その文脈木
の各ノードに対応する符号を符号木アドレスで対応させ
ることにより文脈に対応してスプレイ符号を対応させて
おき、最長一致文字列の辞書番号に対応するスプレイ符
号の符号化及び更新を施すとともに、所定の最大文字列
長に達するまで符号化文字列の伸長文字列を文脈木に登
録し、その伸長文字列に対応するスプレイ符号を符号木
に登録することができる（請求項２）。

【００３３】さらに、本発明のデータ圧縮方法では、辞
書登録文字列として、符号化済の直前文字から登録し、
直前文字から続く文字列を符号化することもできる（請
求項３）。また、本発明のデータ圧縮方法では、全ての
一文字にスプレイ符号を割り当てておき、もし、直前文
字から繋がる文字列が既に収集した辞書（文脈木）中の
文字列中になければ、一文字のスプレイ符号を出力する
とともにそのスプレイ符号を更新した後、直前文字から
繋がる符号化した文字を辞書（文脈木）に登録すること
もできる（請求項４）。

【００３４】一方、本発明のデータ復元方法では、次の
ような作用がある（請求項５）。（１）文脈収集過程により、復元データの文字列につい
て直前文字との繋がりを表わす文脈を収集して文脈木を
作成することができる。（２）スプレイ符号化過程により、この文脈収集過程で
得られた文脈木の各ノードに対応する符号を符号木アド
レスで対応させることにより文脈に対応してスプレイ符
号を対応させた符号木を、復元データの文字列に応じて
スプレイ符号化しながら作成・更新することができる。
さらに、本発明のデータ復元方法では、入力データを過
去の入力データの履歴に応じて符号化した符号化データ
を復元するデータ復元方法において、辞書としての文脈
木に、復元したデータの文字列を収集し番号を付けて直
前文字との繋がりを表わす文脈を登録するとともに、文
脈木の各ノードに対応する符号を符号木アドレスで対応
させることにより復元した文字列に対応してスプレイ符
号を対応させておき、辞書番号に対応する文字列をスプ
レイ符号で復号化及び更新するとともに、所定の最大文
字列長に達するまで符号化文字列の伸長文字列を文脈木
に登録し、その伸長文字列に対応するスプレイ符号を符
号木に登録することができる（請求項６）。

【００３５】また、本発明のデータ復元方法では、辞書
登録文字列として、復号化済の直前文字から登録し、直
前文字から続く文字列を復号化することもできる（請求
項７）。さらに、本発明のデータ復元方法では、全ての
一文字にスプレイ符号を割り当てておき、直前文字から
繋がる文字列が既に収集した辞書（文脈木）中の文字列
中にない一文字のスプレイ符号を復号したとき、符号を
更新するとともに、直前文字から繋がる復号化した文字
を辞書（文脈木）に登録することもできる（請求項
８）。

【００３６】

【実施例】（ａ）一実施例の説明図１５は本発明の一実施例としてのデータ圧縮装置とデ
ータ復元装置の構成例を示すブロック図であり、この図
１５において、１は入力された文字を過去に出現した履
歴に応じて符号化して圧縮するデータ圧縮装置であり、
２はデータ圧縮装置１で符号化された文字を復元するデ
ータ復元装置である。

【００３７】さらに、データ圧縮装置１は、入力された
文字列データの文脈を収集して文脈木を作成する文脈収
集過程１１と、この文脈収集過程１１で得られた文脈
（文脈木）に対応してスプレイ符号を対応させた符号木
を、入力データの文字列に応じてスプレイ符号化しなが
ら作成・更新するスプレイ符号化過程１２をとるように
なっている。一方、データ復元装置２は、データ圧縮装
置１で符号化された復元データの文脈に対応してスプレ
イ符号を対応させた符号木を、復元データの文字列に応
じてスプレイ符号化しながら作成・更新するスプレイ符
号化過程２１と、復元データとしての文字列についての
文脈を収集（文脈木を作成）する文脈収集過程２２をと
るようになっている。

【００３８】以後、本実施例ではデータ圧縮装置１を符
号化側、データ復元装置２を復元側として説明する。（１）符号化側の説明図１６（ａ），（ｂ）は、文脈収集過程１１において作
成される文脈木の一例を示す図であり、図１６（ａ）は
文脈木がハッシュ法を用いて短時間で探索できるように
文字列をリスト構造の格納形式でメモリに格納した例を
示す図、図１６（ｂ）は文字列を格納した木構造の辞書
（リスト）を親子関係の繋がりで示した図である。

【００３９】ここで、図１６（ａ）中のアドレスは１６
進表示であり、この図１６（ａ）の例では、文脈木の最
大サイズは４Ｋノード（４ＫＷ）である。このように、
全ての文字を予め登録しておけば、ルートに繋がる第１
階層の兄弟ノードの位置は予め分かるので、探索時にリ
ストを操作する必要はなく、直接アクセスすることがで
きる。

【００４０】一方、第２階層以降は、子ノードと右兄弟
ノードのアドレスを格納しておき、探索時にリスト形式
で格納文字を照合しながら一致するまで、リストを操作
してアクセスする。また、文脈の木は初期化されたと
き、アドレス１００まで設定されるが、このとき第１階
層のアドレス１００には、End Of File （ＥＯＦ）符号
を登録しておき、アドレス１０１以降のメモリを新規登
録に使用する。

【００４１】次に、図１７は、上述のスプレイ符号化過
程１２において作成される符号木の一例を示す図であ
る。符号木は、基本的に従来のSplay-Tree符号化と同様
に、初期化時に図１７のように設定される。そして、図
１６（ｂ）に対応して、最大サイズが４Ｋノード（４Ｋ
Ｗ）までの場合、符号の木のノードは、内部節点（子ノ
ードが付いている）と外部節点（リーフ、子ノードがな
い各符号の終端）の２つに分類される。

【００４２】また、スプレイ符号化では、符号の木をア
クセスするために、図１８に示すようなＵｐ，Ｌｅｆ
ｔ，Ｒｉｇｈｔという３つの配列を用いる。ここで、Ｕ
ｐ配列は、各ノードから親ノードへのアドレスを格納
し、Ｌｅｆｔ配列は、各ノードから左の子ノードへのア
ドレスを格納し、Ｒｉｇｈｔ配列は、各ノードから右の
子ノードへのアドレスを格納するものである。

【００４３】また、Ｕｐ配列では、内部節点を最初の４
ＫＷ（アドレス（１６進）０００〜ＦＦＦ）に格納し、
外部節点を残りの４ＫＷ（アドレス（１６進）１０００
〜１ＦＦＦ）に格納するようになっている。このように
することで、文脈木の各ノードに対する符号を、符号木
のアドレス＝文脈木のノードポインタ（番号）＋４Ｋ、
で対応付けることができるようになる。

【００４４】なお、各配列のビット幅は、Ｕｐ配列が１
３ビット、Ｌｅｆｔ，Ｒｉｇｈｔ配列が１２ビットとな
る。次に、上述のような構成をもつ符号木の木の更新の
基本操作について、図１９（ａ），（ｂ）を用いて説明
する。図１９（ａ）はスプレイ符号更新の基本操作を示
す図であるが、この図１９（ａ）に示すように、文字Ａ
がアクセスされたとき、ノードＡと２段上のノードＡが
付いている枝と反対方向の枝のノードＣとを入れ換え
る。

【００４５】そして、文字Ａ〜Ｅまでの符号に対して、
文字Ｃがアクセスされた場合には、例えば図１９（ｂ）
に示すように、符号の木を組み換えるようになってい
る。すなわち、上述した基本操作を２回繰り返すことに
よって符号木の木の更新を行なう。この場合、２回目の
基本操作は１回目に更新したノードの親ノードの長さを
更新する。

【００４６】これにより、符号の木の深さが深くなって
も、この基本操作を繰り返すことによって、ルートから
アクセスされたノードＣ（符号０１１０）までの長さを
１／２（符号１０）にすることができるので、ルートか
らアクセスされたノードまでの符号木を動的に組み換え
て、符号表を入力データに適応させることができる。す
なわち、スプレイ符号の符号更新は線型リストの Move-
To-Front操作を Binary-Treeで行なったようなものであ
る。

【００４７】さらに、上述のような文脈収集過程１１に
おける文脈木の作成およびスプレイ符号化過程１２の符
号木の更新・作成の処理を、図２０のフローチャートに
おける処理ステップＥ１〜Ｅ３１を参照しながら詳述す
る。なお、入力文字をＫ（Ｋは任意の文字）とし、文字
Ｋが入力される直前に入力された文字をＰ（Ｐは任意の
文字）とする。

【００４８】まず、文脈木と符号木および直前文字Ｐを
初期化する（ステップＥ１）。そして、既に入力された
全文字が入力符号化されているかをチェックし（ステッ
プＥ２）、入力文字が残っている場合、文字Ｋの入力
と、文字列の長さＬの０へのセットとを行なう（ステッ
プＥ３）。さらに、文脈木の直前文字Ｐの下に子ノード
があるかをチェックし（ステップＥ５）、直前文字Ｐの
下に子ノードがなければ、入力文字Ｋの０次符号を出力
し（ステップＥ６）、文脈木の直前文字Ｐの下に入力文
字Ｋを子ノードとして登録する（ステップＥ７）。

【００４９】一方、符号木の方では、直前文字Ｐの下
に、文字Ｋとエスケープコードを登録するノードを作成
して文字Ｋを登録する（ステップＥ８）。なお、このノ
ード作成のアルゴリズムの一例を図３０（ａ），（ｂ）
に示す。さらに、直前文字を入力文字Ｋに変更し（ステ
ップＥ１６）、直前文字列の長さＬ’が最大文字列長Ｌ
ｍａｘに等しいかをチェックする（ステップＥ２４）。

【００５０】そして、直前文字列長Ｌ’が最大文字列長
Ｌｍａｘに等しくなければ、直前文字列が１次符号で符
号化され出力されているかをチェックする（ステップＥ
２５）。ここで、直前文字列が１次符号で符号化されて
いなければ、直前文字列長Ｌ’に注目文字列長Ｌを移し
（ステップＥ２８）、文字Ｋが符号化済かをチェックし
（ステップＥ９）、符号化済であれば、上述のステップ
Ｅ２からの処理を繰り返し（ステップＥ９のＹＥＳルー
ト）、符号化済でなければ、上述のステップＥ３からの
処理を繰り返す（ステップＥ９のＮＯルート）。

【００５１】ところで、上述のステップＥ１０におい
て、子ノードに登録されている文字が入力文字Ｋと一致
した場合は、文字列の長さＬを１増やし（ステップＥ１
７）、この文字列長Ｌが、予め設定した最大符号長Ｌｍ
ａｘと等しいかをチェックする（ステップＥ１８）。等
しくない場合は、入力データの全文字が符号化されたか
をチェックし（ステップＥ１９）、まだ符号化されてい
ない文字があれば、今までの入力文字を直前文字Ｐに移
し（ステップＥ２０）、さらに１文字Ｋを入力して（ス
テップＥ２１）上述のステップＥ１０の処理へ戻り、再
び子ノードに登録されている文字が文字Ｋと一致するか
をチェックする。

【００５２】一致しなければ、今度は文字列の長さＬが
０かどうかをチェックし（ステップＥ１１）、ＹＥＳ、
すなわち、直前文字Ｐの下に子ノードはあるが、該当す
る文字Ｋがまだ付いていないなら、直前文字Ｐの下のエ
スケープコードを出力した後、文字Ｋの０次符号を出力
する（ステップＥ１２）。さらに、文字Ｋを、文脈木の
直前文字Ｐの下の子ノードの兄弟ノードとして登録し
（ステップＥ１３）、符号木の直前文字Ｐの下のエスケ
ープコードをエスケープコードと文字Ｋの符号とに分割
して、文字Ｋの符号を追加し（ステップＥ１４）、符号
木のエスケープコードと０次符号Ｋの符号長をスプレイ
符号として更新する（ステップＥ１５）。

【００５３】以上のようにして、所定の最大文字列長に
達するまで符号化文字列の伸長文字列を登録することが
できるようになっている。その後、上述したステップＥ
１６，ステップＥ２４を経て、再び直前文字列を１次符
号で出力したかをチェックする（ステップＥ２５）。即
ち、直前文字列が１次符号で符号化され、出力されてい
れば、文脈木に直前文字列に符号化文字（列）の先頭文
字を付加した延長文字列を登録し（ステップＥ２６）、
符号木に、符号化した延長文字列の符号を登録し（ステ
ップＥ２７）、上述のステップＥ２８からの処理を繰り
返す。

【００５４】なお、この登録は、直前文字の符号を分岐
させ、文字Ｋを付加した文字列の１次符号を追加するよ
うに行なう。文字列の分岐は、エスケープコードを符号
化した文字列の符号とみて分岐させ、元の文字列と文字
Ｋを付加した文字列の符号とを作る。このようにして、
辞書登録文字列として、符号化済の直前文字から登録
し、この直前文字から続く文字列を符号化している。

【００５５】さらに、上述のステップＥ１８において、
文字列長Ｌが、予め設定した最大符号長Ｌｍａｘと等し
い場合、または、ステップＥ１１において、文字列長Ｌ
が０に等しくない場合は、文脈木の文字（列）の参照番
号に対応する１次符号を出力し（ステップＥ２２）、符
号木が出力した１次符号の符号長をスプレイ符号として
更新（ステップＥ２３）した後、上述のステップＥ２４
からの処理を行なう。

【００５６】ここで、以上の閉ループ処理は、直前文字
Ｐと入力文字Ｋとの組み合わせが、既に文脈木に登録さ
れている時に、登録文字数（文字列長）を伸長して、文
字列単位に登録を行なう処理を示している。また、上述
のステップＥ２において、入力された全ての文字が符号
化されている場合は、文脈木の直前文字Ｐの下に子ノー
ドがあるかチェックし（ステップＥ２９）、子ノードが
あれば直前文字Ｐの下のエスケープコードを出力し（ス
テップＥ２９のＮＯルートからステップＥ３０）、Ｅｎ
ｄＯｆＦｉｌｅを表すＥＯＦの０次符号を出力して
（ステップＥ３１）処理を終了する（ステップＥ２９の
ＮＯルートからステップＥ３１）。

【００５７】子ノードがなければ、そのままＥＯＦの０
次符号を出力して処理を終了する。以上のような処理を
行なうことで、入力データとしての文字列を過去に出現
した履歴に応じて符号化して圧縮するデータ圧縮方法に
おいて、辞書に入力データの文字列を収集し番号を付け
て登録するとともに、各文字列に対応してスプレイ符号
の符号化及び更新を施している。

【００５８】ここで、上述の入力文字Ｋをアルファベッ
トａ，ｂ，ｃのいずれかに限り、文字「ａｂｃａｂｃ
ａｂｂ」が入力された場合を例にとり、文脈木と符
号木の更新・作成について、図２１〜図２８を用いてさ
らに詳述する。まず、図２１（ａ），（ｂ）に示すよう
に、文脈木と符号木に、予め文字ａ，ｂ，ｃと入力デー
タを全て符号化した後に出力する終端符号ＥＯＦとを、
番号を付することによりａ₁ ，ｂ₂ ，ｃ₃ ，ＥＯＦ₄
として登録しておく。

【００５９】このように文脈木を初期化することで、最
初に登録してある文字ａ，ｂ，ｃのいずれかが直前文字
となり、直前文字から続く文脈がないとき独立の単独の
参照番号も兼ねることになる。以下の説明では、文字ｃ
を最初の直前文字と仮定しておく。一方、図２１（ｂ）
に示すように、符号木は、ルート（ｒｏｏｔ）からノー
ドを左下に下がるときには、登録した文字に符号“０”
を割り当て、ノードを右下に下がるときには、登録した
文字に符号“１”を割り当てる２進木であり、これによ
り符号化時は、対応する文字の参照番号のノードからル
ートまでの辿る経路をスタックして、その経路を逆転さ
せ、左下か右下かによって符号“０”，“１”を割り振
ることによって、その文字の参照番号に対応する符号語
が得られるようになっている。

【００６０】すなわち、「ａ₁，ｂ₂，ｃ₃」の３文字の
０次符号は、それぞれ「０００１１０１１」とな
る。そして、上述の図２１（ａ），（ｂ）に示す状態か
ら、まず文字列「ａｂｃ」が入力されると、予め登録し
ておいた「ｃ」（ｃ₃）を直前文字と仮定するので、図
２２（ａ）に示すように、文脈木の「ｃ」（ｃ₃）の下
位に新たにノードを作成し、文字列「ａｂｃ」の内、最
初の１文字「ａ₅」と未登録を表すエスケープコード
（ＥＳＣ₆）とを登録する。

【００６１】一方、符号木では、図２２（ｂ）に示すよ
うに、「ａ」が、既に登録されているので、「ａ」が登
録されているノードと直前文字である「ｃ」の上位ノー
ドとを組み替え、この「ｃ」を新たにルートとおいて
（１次符号化）、「ａ」とエスケープコード（ＥＳＣ）
を登録する。さらに、文字列「ａｂｃ」の内、次のｂ，
ｃについても上述の処理を行なうことにより、ｂが入力
されたときの文脈木と符号木は、それぞれ図２３
（ａ），（ｂ）に示すようになり、ｃが入力されたとき
の文脈木と符号木は図２４（ａ），（ｂ）に示すように
なる。

【００６２】この処理は、図２０にて上述した処理ステ
ップにおいて、ステップＥ５のＮＯルート，ステップＥ
２４のＹＥＳルート，ステップＥ２５のＮＯルートを経
由する閉ループ処理に相当するものである。すなわち、
文脈木では、直前文字の下位に子ノードが存在しない場
合に、この直前文字の下位に入力文字とエスケープコー
ドを登録するノードを新たに作成して登録を行なう。

【００６３】一方、符号木では、過去に登録されている
文字と同じ文字が再び入力された場合は、過去に登録さ
れている文字のノードを、入力された文字の直前文字が
登録されているノードの上位ノードと組み替えて、過去
に登録されている文字のノードを上位に移動し、ルート
からの距離を１／２にして符号長を短くするのである。

【００６４】さらに、続いて文字列「ａｂｃ」が入力さ
れると、最初に入力された文字列「ａｂｃ」の最後の
「ｃ」を直前文字として文脈木の「ｃ₉」の下位に、文
字列「ａｂｃ」の内の１文字「ａ」のみを登録しようと
するが、図２４（ａ）に示すように、文脈木には、既に
「ｃ₃」の下位に「ａ₅」が登録されているので、図２５
（ａ）に示すように、登録する文字を１文字「ａ」から
２文字「ａｂ」へ１文字伸長して「ａ₅」の下位に「ｂ
₁₁」を登録する。

【００６５】この時、符号木では、図２５（ｂ）に示す
ように、「ｃ」の下位に「ａ」とともに登録されている
エスケープコード（ＥＳＣ）のノードを分岐して新たに
ノードを作成し、文脈木で１文字伸長して登録した「ａ
ｂ」の登録を行なう。続いて、文字列「ａｂｃ」の内、
「ｂ」を文脈木に登録しようとした場合も、図２５
（ａ）に示すように、既に「ａ₁」の下位に「ｂ₇」が登
録されているので、図２６（ａ）に示すように、登録す
る文字を１文字「ｂ」から２文字「ｂｃ」へ１文字伸長
して「ｂ₇」の下位に「ｃ₁₂」を登録する。

【００６６】この時、符号木では、図２６（ｂ）に示す
ように、「ａ」の下位に「ｂ」とともに登録されていた
エスケープコード（ＥＳＣ）のノードを分岐して新たに
ノードを作成し、文脈木で１文字伸長して登録した「ｂ
ｃ」の登録を行なう。そして、次の文字列「ａｂｃ」の
内、最後の「ｃ」を登録する場合も、上述の処理を行な
うと、文脈木及び符号木は、それぞれ図２７（ａ），
（ｂ）に示す状態となる（ここまでで、「ａｂｃａｂ
ｃ」が入力済となる）。

【００６７】そして、さらに文字列「ａｂ」が入力され
ると文脈木では、まず、直前文字の「ｃ」の下位に１文
字「ａ」を登録しようとするが、上述したように、「ｃ
₃」の下位に既に「ａ₅」が登録されているので、登録文
字数を１文字伸長して「ａｂ」として、「ａ₅」の下位
に「ｂ」を登録しようとする。しかし、図２７（ａ）に
示すように、「ａ₅」の下位にも既に「ｂ₁₁」が登録さ
れているので、図２８（ａ）に示すように、さらに、登
録文字数を１文字伸長して「ａｂｂ」として、「ｂ₁₁」
の下位に「ｂ」を登録する。

【００６８】この時、符号木では、図２８（ｂ）に示す
ように、「ａｂ」が登録されているノードを分岐して
「ａｂｂ」を登録する。この処理は、図２０にて上述し
た処理ステップのステップＥ５のＹＥＳルート，ステッ
プＥ１０のＹＥＳルート，ステップＥ２５のＹＥＳルー
トを経由する閉ループ処理に相当する。

【００６９】すなわち、文字列が入力されたとき、直前
文字と入力された文字列中の１文字との組み合わせが、
既に文脈木に登録されている場合、登録する文字数を１
文字伸長して登録されていない１文字のみ登録する。そ
して、この時、符号木では、直前文字とともに登録され
ているエスケープコード（ＥＳＣ）のノードを分岐させ
て新たにノードを作成し、この文字列を登録する。

【００７０】以上のように、文字「ａｂｃａｂｃａ
ｂｂ」の入力が終了すると、各文字に割り当てられる
符号は図２９に示すようになる。この図２９に示すよう
に、最初に入力された文字「ａｂｃ」は、それぞれ１文
字単独で符号化され、対応する符号は、それぞれ００，
０１，１０の２ビットとなる。

【００７１】そして、次に入力された文字列「ａｂｃ」
に対応する符号語は、直前文字との関係からそれぞれ
０，０，０の１ビットとなる。さらに、次に入力された
「ａｂ」２文字の文字列に符号が割り当てられるが、こ
の図２９に示すように、２文字の文字列が２ビットのみ
の符号語で表されている。

【００７２】そして最後に入力された文字「ｂ」は、今
までの直前文字の繋がりに該当する文字がない場合で、
ＥＳＣと１文字単独の符号語の組み合わせの３ビットで
表されている。以上のように、本発明のデータ圧縮方法
によれば、圧縮する文字（列）を、木構造の文脈木に番
号を付けて登録し、この文脈木に対応した符号木をスプ
レイ符号化を施しながら作成・更新することにより、出
現する文字の出現頻度を求めて確率モデルを構築し、各
文字に符号を割り当てるという２段階の処理を同時に行
なうので、データの圧縮処理の速度が大幅に向上すると
いう効果がある。

【００７３】また、上述の確率モデルは、文字の入力毎
に符号木のノードが作成・更新（スプレイ処理）される
ことによって構築されるので、文字の入力毎に、既に構
築されている確率モデルを再構築するという膨大な演算
処理を行なう必要が無く、これにより圧縮処理の速度が
さらに向上する効果がある。さらに、本発明のデータ圧
縮方法によれば、過去に圧縮（符号化）した文字と同じ
文字が出現する毎に、過去に登録してあった同じ文字の
符号木のノードを上位のノードと組み替えて（スプレイ
処理）符号長を１／２にすることにより、同じ文字
（列）が繰り返し出現するほど、その文字（列）の符号
は少ないビット数で表せるので、圧縮効果が大幅に向上
する効果がある。

【００７４】また、本発明のデータ圧縮方法によれば、
上述の文字列「ａｂ」を符号化した場合のように、文字
を１文字単位に符号化するのではなく、複数文字単位の
文字列として符号化することにより、可変長符号化処理
が高速化できるとともに、符号化単位を文字列とするの
で、情報源が拡大し、スプレイ符号化の符号化効率が大
幅に向上するという効果もある。

【００７５】（２）復元側の説明次に、上述のように、符号化（圧縮）されたデータを入
力符号として、図１７にて上述したデータ復元装置２内
の文脈収集過程２１とスプレイ符号化過程２２が、デー
タを復元する処理について、図３１のフローチャートに
おける処理ステップＤ１〜Ｄ２４を参照しながら説明す
る。

【００７６】なお、このデータを復元する処理は、基本
的に符号化側の説明にて上述した符号化の処理と逆の処
理を行なうようにすればよい。すなわち、まず、文脈木
と符号木とを初期化し、直前文字Ｐを０に初期化する
（ステップＤ１）。列長Ｌを０とし（ステップＤ２）、
文脈木の直前文字の下位に子ノードがあるかをチェック
する（ステップＤ３）。

【００７７】ここで、子ノードがない場合においては、
入力符号を０次符号として文字Ｋを復号し（ステップＤ
３のＮＯルートからステップＤ４）、この復号した文字
ＫがＥＯＦ符号であるかをチェックする（ステップＤ
５）。もし、この復号した文字Ｋが、ＥＯＦ符号でなけ
れば、ＮＯルートをとり、復号した文字Ｋを出力し（ス
テップＤ６）、文脈木に文字Ｋを登録する（ステップＤ
７）。なお、これは図１７にて上述した符号化時の処理
ステップＥ７と同様にして行なう。

【００７８】さらに、符号化時のステップＥ８と同様に
して、符号木の直前文字Ｐの下に文字Ｋとエスケープコ
ードのノードを作り（ステップＤ８）、直前文字Ｐを文
字Ｋとおく（ステップＤ１７）。そして、以降の処理ス
テップＤ２０〜Ｄ２３は、符号化時の処理ステップＥ２
０〜Ｅ２３と同様の処理ステップをとり、直前文字列長
Ｌ’を注目文字列長Ｌで置き換えて（ステップＤ２
４）、上述の処理ステップＤ２に戻る。

【００７９】ところで、上述の処理ステップＤ３におい
て、文脈木の直前文字Ｐの下位に子ノードが存在する場
合は、入力された符号を符号木より１次符号とみなして
復号して、文脈木の文字（列）の参照番号を得る（ステ
ップＤ３のＹＥＳルートからステップＤ９）。さらに、
復号した参照番号がエスケープコードであるかをチェッ
クし（ステップＤ１０）、エスケープコードであれば、
ＹＥＳルートをとり、入力文字を０次符号として次の符
号を復号して、文字Ｋを得る（ステップＤ１１）。

【００８０】そして、上述のステップＤ５と同様に、復
号した文字ＫがＥＯＦ符号であるかをチェックし（ステ
ップＤ１２）、復号した文字ＫがＥＯＦ符号でなけれ
ば、ＮＯルートをとり、文字Ｋを出力する（ステップＤ
１３）。さらに、符号化時の処理ステップＥ１３〜１５
と同様にして、文脈木に文字Ｋを登録し（ステップＤ１
４）、直前文字Ｐの下に文字Ｋを追加し（ステップＤ１
５）、符号木のエスケープコードと０次符号Ｋの符号長
をスプレイ符号として更新する（ステップＤ１６）。

【００８１】そして、以降は上述のステップＤ１７から
の処理を行なう。このようにして、全ての一文字にスプ
レイ符号を割り当てておき、直前文字から繋がる文字列
が既に収集した辞書中の文字列中にない一文字のスプレ
イ符号を復号したときに、符号を更新し、上述の直前文
字からの繋がる復号した文字を文脈木に登録することが
できる。

【００８２】また、上述の処理ステップＤ１０におい
て、復号した参照番号がエスケープコードでなければ、
ＮＯルートをとり、文脈木の参照番号に対応する文字列
を復元して出力し（ステップＤ１８）、文字（列）の最
終文字を直前文字Ｐに置き換える（ステップＤ１９）。
そして、以降は、上述のステップＤ２０からの処理を行
なう。

【００８３】このようにして、辞書登録文字列として、
復号化済の直前文字から登録し、この直前文字から続く
文字列を復号することができる。また、上述の処理ステ
ップＤ４またはステップＤ１２において、復号した文字
ＫがＥＯＦ符号であれば、ＹＥＳルートをとり、復元処
理を終了する。以上のようにして、辞書としての文脈木
に復元したデータの文字列を収集し番号を付けて登録す
るとともに、復元各文字列に対応してスプレイ符号を対
応させておき、辞書番号に対応する文字列をスプレイ符
号で復号化及び更新を行ない、また、所定の最大文字列
長に達するまで符号化文字列の伸長文字列を登録し、こ
の伸長文字列に対応するスプレイ符号を登録する。

【００８４】これにより、データ圧縮装置１の文脈収集
過程１１およびスプレイ符号化過程１２により圧縮・符
号化された文字Ｋを復元している。このように、本発明
のデータ復元方法によれば、文脈木に復元した文字
（列）に番号を付けて登録するとともに、この文脈木に
対応した符号表としての符号木を構築することにより、
符号化された文字の符号と一致する符号を符号表におい
て検索し、一致した符号に対応する文字を復号文字とし
て出力するという２段階の処理を同時に行なうので、デ
ータの復元処理の速度が大幅に向上するという効果があ
る。

【００８５】また、上述の確率モデルは、文字の復元毎
に符号木のノードが作成・更新（スプレイ処理）される
ことによって構築されるので、文字の復元毎に、既に構
築されている符号表（確率モデル）を再構築するという
膨大な演算処理を行なう必要が無く、これにより復元処
理の速度がさらに向上する効果がある。さらに、本発明
のデータ復元方法によれば、過去に復号した符号と同じ
符号が出現する毎に、過去に登録してあった同じ符号の
符号木上のノードを上位のノードと組み替えて（スプレ
イ処理）符号長を１／２にすることにより、同じ符号が
繰り返し出現するほどその符号は少ないビット数で表せ
るので、同じ符号を繰り返し復号する場合、復元処理の
速度が大幅に向上する効果がある。

【００８６】また、本発明のデータ復元方法によれば、
文字を１文字単位に復号するのではなく、複数文字単位
の文字列として復号することにより、スプレイ処理が高
速化できるとともに、復号単位を文字列とするので、復
元できる情報源が拡大し、復元効率が大幅に向上すると
いう効果もある。なお、本実施例では、直前文字から繋
がる文字列を文脈として収集して符号化・復号する方法
について述べたが、本発明によれば、必ずしも直前文字
にこだわることはなく２文字以上以前からの文脈を収集
して符号化・復号化してもよい。

【００８７】また、本実施例では、動的に文脈を収集し
てスプレイ処理する例を示したが、本発明によれば、必
ずしも動的である必要はなく、予め代表的なサンプルか
ら収集した静的な文脈を用いてスプレイ処理してもよ
い。さらに、本実施例では、入力された全てのデータを
動的可変長符号化（スプレイ符号化）する場合について
述べたが、相当程度のデータを符号化した後に、スプレ
イ符号化の更新操作を止めて、静的な可変長符号化をし
てもよい。この場合、符号化と復号化とで予め取決めを
しておき同期が取れればよい。

【００８８】また、本実施例では、圧縮するデータを文
字あるいは文字列として説明したが、本発明のデータ圧
縮方法及びデータ復元方法は、他の画像データや音声デ
ータなどあらゆるデータに対して適用できる。（ｂ）関連技術の説明次に、以下では、本発明に関連する技術について図１〜
図１４を用いて付言する。まず、本発明に関連するデー
タ圧縮方法（１）を実施するための装置の構成を、図１
に示す。この図１に示すデータ圧縮装置は、入力データ
を過去に出現した履歴に応じて符号化して圧縮するもの
である。ここで、１００は前置データ保持手段、１０１
は履歴保持手段、１０２は符号木保持手段、１０３は符
号木決定手段、１０４は符号出力手段、１０５は符号長
変更手段、１０６は前置データ更新手段である。前置デ
ータ保持手段１００は、入力データの直前までに入力さ
れたｎ個の入力データからなる文脈を保持するものであ
り、履歴保持手段１０１は、入力データと文脈との組み
合わせを保持するものであり、符号木保持手段１０２
は、文脈毎に独立した符号木を保持するものである。ま
た、符号木決定手段１０３は、前置データ保持手段１０
０に保持されている直前までの入力データからデータの
符号木を決定するものであり、符号出力手段１０４は、
符号木決定手段１０３で選択した符号木の頂点を意味す
るルートからデータが格納されているリーフに沿って途
中に位置する分岐点としてのノードからの分岐に従って
固有のデータを出力するものである。さらに、符号長変
更手段１０５は、符号化したリーフと他のリーフあるい
はノードとを組み替えるものであり、前置データ更新手
段１０６は、データを前置データ保持手段１００に登録
するものである。また、本発明に関連するデータ圧縮方
法（２）を実施するための装置の構成を、図２に示す。
この図２に示すデータ圧縮装置も、入力データを過去に
出現した履歴に応じて符号化して圧縮するものである。
ここで、１００は前置データ保持手段、１０１は履歴保
持手段、１０３は符号木決定手段、１０７は符号木決定
手段である。さらに、１０８は文脈判別手段、１０９は
エスケープコード出力手段、１１０は文脈変更手段、１
１１は符号出力手段、１１６は制御手段である。前置デ
ータ保持手段１００は、入力データの直前までに入力さ
れたｎ個の入力データからなる文脈を保持するものであ
り、履歴保持手段１０１は、入力データと文脈との組み
合わせを保持するものであり、符号木保持手段１０７
は、データ未登録を示すデータとして定義されるエスケ
ープコードをあらかじめ登録した文脈毎に独立した符号
木を保持するものである。また、符号木決定手段１０３
は、文脈と入力データからデータの符号木を決定するも
のであり、文脈判別手段１０８は、符号木決定手段１０
３で決定した符号木にデータが登録されているか否かを
判別するものであり、エスケープコード出力手段１０９
は、符号木にデータが登録されていないときは符号木の
頂点を意味するルートからエスケープコードのデータ格
納点としてのリーフまでの途中に位置する分岐点として
のノードからの分岐に従ってエスケープコードを出力す
るものである。さらに、文脈変更手段１１０は、符号木
にデータが登録されていないときは文脈の長さｎを短く
するものであり、符号出力手段１１１は、符号木にデー
タが登録されているときは符号木のルートからデータの
リーフまでの途中に位置するノードからの分岐に従って
データの符号を出力するものである。また、符号長変更
手段１０５は、符号化したリーフと他のリーフあるいは
ノードとを組み換えるものであり、前置データ更新手段
１０６は、データを前置データ保持手段１００に登録す
るものであり、制御手段１１６は、エスケープコードを
符号化したときはデータの符号化を行なうまで処理を繰
り返すものである。また、本発明に関連するデータ圧縮
方法（３）を実施するための装置の構成を、図３に示
す。この図３に示すデータ圧縮装置も、入力データを過
去に出現した履歴に応じて符号化して圧縮するものであ
る。ここで、１００は前置データ保持手段、１０１は履
歴保持手段、１０３は符号木決定手段、１０５は符号長
変更手段、１０６は前置データ更新手段、１０７は符号
木保持手段、１０８は文脈判別手段、１０９はエスケー
プコード出力手段、１１０は文脈変更手段、１１１は符
号出力手段、１１２は履歴登録手段、１１３は符号登録
手段、１１６は制御手段である。前置データ保持手段１
００は、入力データの直前までに入力されたｎ個の入力
データからなる文脈を保持するものであり、履歴保持手
段１０１は、入力データと文脈との組み合わせを保持す
るものであり、符号木保持手段１０７は、データ未登録
を示すデータとして定義されるエスケープコードを予め
登録した文脈毎に独立した符号木を保持するものであ
る。また、符号木決定手段１０３は、文脈と入力データ
からデータの符号木を決定するものであり、文脈判別手
段１０８は、符号木決定手段１０３で決定した符号木に
データが登録されているか否かを判別するものである。
さらに、エスケープコード出力手段１０９は、符号木に
データが登録されていないときは符号木の頂点を意味す
るルートからエスケープコードのデータ格納点としての
リーフまでの中に位置する分岐点としてのノードからの
分岐に従ってエスケープコードを出力するものである。
また、履歴登録手段１１２は、符号木にデータが登録さ
れていないときは履歴保持手段１０１にデータと文脈の
組み合わせを登録するものであり、符号登録手段１１３
は、符号木にデータが登録されていないときは符号木に
データを新規に登録するものであり、文脈変更手段１１
０は、符号木にデータが登録されていないときは文脈の
長さｎを短くするものである。さらに、符号出力手段１
１１は、符号木にデータが登録されているときは符号木
のルートからデータのリーフまでの途中に位置するノー
ドからの分岐に従ってデータの符号を出力するものであ
り、符号長変更手段１０５は、符号化したリーフと他の
リーフあるいはノードとを組み換えるものである。ま
た、前置データ更新手段１０６は、データを前置データ
保持手段１００に登録するものであり、制御手段１１６
は、エスケープコードを符号化したときはデータの符号
化を行なうまで処理を繰り返すものである。さらに、本
発明に関連するデータ圧縮方法（４）を実施するための
装置の構成を、図４に示す。この図４に示すデータ圧縮
装置も、入力データを過去に出現した履歴に応じて符号
化して圧縮するものである。ここで、１００は前置デー
タ保持手段、１０１は履歴保持手段、１０３は符号木決
定手段、１０５は符号長変更手段、１０６は前置データ
更新手段、１０７は符号木保持手段、１０８は文脈判別
手段、１０９および１１１はエスケープコード出力手
段、１１０は文脈変更手段、１１４は履歴登録手段、１
１５は符号登録手段、１１７は制御手段である。前置デ
ータ保持手段１００は、入力データの直前までに入力さ
れたｎ個の入力データからなる文脈を保持するものであ
り、履歴保持手段１０１は、入力データと文脈との組み
合わせを保持するものであり、符号木保持手段１０７
は、データ未登録を示すデータとして定義されるエスケ
ープコードをあらかじめ登録した文脈毎に独立した符号
木を保持するものである。また、符号木決定手段１０３
は、文脈と入力データからデータの符号木を決定するも
のであり、文脈判別手段１０８は、符号木決定手段１０
３で決定した符号木にデータが登録されているか否かを
判別するものである。さらに、エスケープコード出力手
段１０９は、符号木にデータが登録されていないときは
符号木の頂点を意味するルートからエスケープコードの
データ格納点としてのリーフまでの途中に位置する分岐
点としてのノードからの分岐に従ってエスケープコード
を出力するものである。また、文脈変更手段１１０は、
符号木にデータが登録されていないときは文脈の長さｎ
を短くするものであり、エスケープコード出力手段１１
１は、符号木にデータが登録されているときは符号木の
ルートからデータのリーフまでの途中に位置するノード
からの分岐にしたがってデータの符号を出力するもので
ある。さらに、履歴登録手段１１４は、履歴保持手段１
０１にデータと文脈の組み合わせを登録するものであ
り、符号登録手段１１５は、符号木にデータを新規に登
録するものであり、符号長変更手段１０５は、符号化し
たリーフと他のリーフあるいはノードとを組み換えるも
のであり、前置データ更新手段１０６は、データを前置
データ保持手段１００に登録するものである。また、制
御手段１１７は、データの符号化時に一度でもエスケー
プコードを符号化したときは、データの符号化の直前の
文脈とデータとの組み合わせを履歴登録手段１１４で履
歴保持手段１０１に登録し、データの符号化の直前に符
号化したエスケープコードを持つ符号木に符号登録手段
１１５でデータを新規に登録するものである。一方、本
発明に関連するデータ復元方法（１）を実施するための
装置の構成を、図５に示す。この図５に示すデータ復元
装置は、過去に出現した履歴に応じて符号化した符号を
復号するものである。ここで、２００は前置データ保持
手段、２０１は履歴保持手段、２０２は符号木保持手
段、２０３は符号木決定手段、２０４は復号手段、２０
５は符号長変更手段、２０６は前置データ更新手段であ
る。前置データ保持手段２００は、過去に復号したｎ個
のデータを保持するものであり、履歴保持手段２０１
は、復号したデータと文脈との組み合わせを保持するも
のであり、符号木保持手段２０２は、文脈毎に独立した
符号木を保持するものである。また、符号木決定手段２
０３は、前置データ保持手段２００に保持されている文
脈からデータを復号するための符号木を決定するもので
あり、復号手段２０４は、符号に従って符号木決定手段
２０３で選択した符号木の頂点を意味するルートから分
岐点としてのノードを走査して到達したデータ格納点と
してのリーフに格納されているデータを出力するもので
ある。さらに、符号長変更手段２０５は、復号したリー
フと他のリーフあるいはノードとを組み替えるものであ
り、前置データ更新手段２０６は、復号したデータを前
置データ保持手段２００に登録するものである。また、
本発明に関連するデータ復元方法（２）を実施するため
の装置の構成を、図６に示す。この図６に示すデータ復
元装置も、過去に出現した履歴に応じて符号化した符号
を復号するものである。ここで、２００は前置データ保
持手段、２０１は履歴保持手段、２０３は符号木決定手
段、２０４は復号手段、２０５は符号長変更手段、２０
６は前置データ更新手段、２０７は符号木保持手段、２
０８は文脈変更手段、２１３は制御手段である。前置デ
ータ保持手段２００は、過去に復号したｎ個のデータを
保持するものであり、履歴保持手段２０１は、復号した
データと文脈との組み合わせを保持するものであり、符
号木保持手段２０７は、データ未登録を示すデータとし
て定義されるエスケープコードをあらかじめ登録した符
号木を保持するものである。また、符号木決定手段２０
３は、前置データ保持手段２００に保持されている文脈
からデータを復号するための符号木を決定するものであ
り、復号手段２０４は、符号に従って符号木決定手段２
０３で選択した符号木の頂点を意味するルートから分岐
点としてのノードを走査して到達したデータ格納点とし
てのリーフに格納されているデータを出力するものであ
る。さらに、符号長変更手段２０５は、復号したリーフ
と他のリーフあるいはノードとを組み替えるものであ
り、文脈変更手段２０８は−出力したデータがエスケー
プコードであったときデータを棄却し文脈を短くするも
のであり、前置データ更新手段２０６は、復号したデー
タを前置データ保持手段２００に登録するものである。
制御手段２１３は、エスケープコードを復号した時は文
脈変更手段２０８で文脈を再設定し、エスケープコード
以外が復号されるまで処理を繰り返すものである。さら
に、本発明に関連するデータ復元方法（３）を実施する
ための装置の構成を、図７に示す。この図７に示すデー
タ復元装置も、過去に出現した履歴に応じて符号化した
符号を復号するものである。ここで、２００は前置デー
タ保持手段、２０１は履歴保持手段、２０３は符号木決
定手段、２０４は復号手段、２０５は符号長変更手段、
２０６は前置データ更新手段、２０７は符号木保持手
段、２０８は文脈変更手段、２０９は履歴登録手段、２
１０は符号登録手段、２１３は制御手段である。前置デ
ータ保持手段２００は、過去に復号したｎ個のデータを
保持するものであり、履歴保持手段２０１は、復号した
データと文脈との組み合わせを保持するものであり、符
号木保持手段２０７は、エスケープコードをあらかじめ
登録した符号木を保持するものである。また、符号木決
定手段２０３は、前置データ保持手段２００に保持され
ている文脈からデータを復号するための符号木を決定す
るものであり、復号手段２０４は、符号に従って符号木
決定手段２０３で選択した符号木の頂点を意味するルー
トから分岐点としてのノードを走査して到達したデータ
格納点としてのリーフに格納されているデータを出力す
るものである。さらに、符号長変更手段２０５は、復号
したリーフと他のリーフあるいはノードとを組み替える
ものであり、文脈変更手段２０８は、出力したデータが
上記エスケープコードであったとき、上記データを棄却
し文脈を短くするものである。また、前置データ更新手
段２０６は、復号したデータを前置データ保持手段２０
０に登録するものであり、履歴登録手段２０９は、デー
タの復号処理でエスケープコードを復号したときの全て
の文脈と復号したデータとを履歴保持手段２０１に登録
するものである。また、符号登録手段２１０は、データ
の復号処理でエスケープコードを復号した時の文脈に対
応した全ての符号木にデータの符号を登録するものであ
り、制御手段２１３は、エスケープコードを復号した時
は文脈変更手段２０８で文脈を再設定し、エスケープコ
ード以外が復号されるまで処理を繰り返すものである。
また、本発明に関連するデータ復元方法（４）を実施す
るための装置の構成を、図８に示す。この図８に示すデ
ータ復元装置も、過去に出現した履歴に応じて符号化し
た符号を復号するものである。ここで、２００は前置デ
ータ保持手段、２０１は履歴保持手段、２０３は符号木
決定手段、２０４は復号手段、２０５は符号長変更手
段、２０６は前置データ更新手段、２０７は符号木保持
手段、２０８は文脈変更手段、２１２は符号登録手段、
２１３は制御手段である。前置データ保持手段２００
は、過去に復号したｎ個のデータを保持するものであ
り、履歴保持手段２０１は、復号したデータと文脈との
組み合わせを保持するものであり、符号木保持手段２０
７は、データ未登録を示すデータとして定義されるエス
ケープコードをあらかじめ登録した符号木を保持するも
のである。また、符号木決定手段２０３は、前置データ
保持手段２００に保持されている文脈からデータを復号
するための符号木を決定するものであり、復号手段２０
４は、符号に従って符号木決定手段２０３で選択した符
号木の頂点を意味するルートから分岐点としてのノード
を走査して到達したデータ格納点としてのリーフに格納
されているデータを出力するものである。さらに、符号
長変更手段２０５は、復号したリーフと他のリーフある
いはノードとを組み替えるものであり、文脈変更手段２
０８は、出力したデータがエスケープコードであったと
きデータを棄却し文脈を短くするものであり、前置デー
タ更新手段２０６は、復号したデータを前置データ保持
手段２００に登録するものである。また、履歴登録手段
２１１は、データの復号処理でエスケープコードを最後
に復号した時の文脈と復号したデータとを履歴保持手段
２０１に登録するものであり、符号登録手段２１２は、
データの復号処理で最後にエスケープコードを復号した
時の文脈に対応した符号木にデータの符号を登録するも
のであり、制御手段２１３は、エスケープコードを復号
した時は文脈変更手段２０８で文脈を再設定し、エスケ
ープコード以外が復号されるまで処理を繰り返すもので
ある。また、本発明に関連するデータ圧縮方法（５）を
実施するための装置の構成を、図９に示す。この図９に
示すデータ圧縮装置は、入力データを過去に出現した履
歴に応じて符号化するものである。ここで、３０１は符
号木保持手段、３０２は文脈木保持手段、３０３は文脈
登録手段、３０４は符号登録手段、３０５は文脈変更手
段、３０６は符号化手段、３０７は符号更新手段であ
る。符号木保持手段３０１は、予めデータ未登録を示す
データとして定義されるエスケープコードを登録した符
号木を保持するものであり、文脈木保持手段３０２は、
入力データと文脈との組み合わせを登録した文脈木を保
持するものであり、文脈登録手段３０３は、エスケープ
コードを符号化したのち、文脈木にデータを新規に登録
するものである。さらに、符号登録手段３０４は、エス
ケープコードを符号化したのち符号木のエスケープコー
ドのデータ格納点としてのリーフを分岐してデータを新
規に登録するものであり、文脈変更手段３０５は、入力
データと文脈との組み合わせが文脈木に保持されていな
いとき、文脈を変更するものである。また、符号化手段
３０６は、符号木の頂点からの入力データあるいはエス
ケープコードが登録してあるリーフまでの分岐に従って
符号を出力するものであり、符号更新手段３０７は、符
号化したデータ及びエスケープコードが登録してあるリ
ーフと他のリーフあるいはノードとを取り替えるもので
ある。また、本発明に関連するデータ圧縮方法（６）を
実施するための装置の構成を、図１０に示す。この図１
０に示データ圧縮装置も、入力データを過去に出現した
履歴に応じて符号化するものである。この図１０に示す
データ圧縮装置は、前述の図９におけるものと同様の符
号木保持手段３０１，文脈木保持手段３０２，文脈登録
手段３０３，文脈変更手段３０５，符号化手段３０６，
符号更新手段３０７をそなえており、これらの説明は省
略する。また、３１０は分岐位置検索手段であり、この
分岐位置検索手段３１０は、符号木上の最長の符号長を
持つリーフを検索するものである。３１１は符号登録手
段であり、この符号登録手段３１１は、エスケープコー
ドを符号化したのち、分岐位置検索手段１１０に検索さ
れたデータ格納点としてのリーフを分岐してデータを新
規に登録するものである。さらに、本発明に関連するデ
ータ圧縮方法（７）を実施するための装置の構成を、図
１１に示す。この図１１に示すデータ圧縮装置も、入力
データを過去に出現した履歴に応じて符号化するもので
ある。ここで、この図１１に示すデータ圧縮装置におい
ても、前述の図９におけるものと同様の符号木保持手段
３０１，文脈木保持手段３０２，文脈登録手段３０３，
文脈変更手段３０５，符号化手段３０６，符号更新手段
３０７をそなえており、これらの説明は省略する。３０
８は分岐位置保持手段であり、この分岐位置保持手段３
０８は、符号木に新規に登録されたデータ格納点として
のリーフの位置を保持するものである。さらに、３０９
は符号登録手段であり、この符号登録手段３０９は、エ
スケープコードを符号化したのち、分岐位置保持手段３
０８に保持されている位置にあるリーフを分岐してデー
タを新規に登録するものである。一方、本発明に関連す
るデータ復元方法（５）を実施するための装置の構成
を、図１２に示す。この図１２に示すデータ復元装置
は、入力データを過去の入力データの履歴に応じて符号
化した符号を復号するものである。ここで、４０１は符
号木保持手段、４０２は文脈木保持手段、４０３は符号
木決定手段、４０４は復号手段、４０５は文脈変更手
段、４０６は符号更新手段、４０７は符号登録手段、４
０８は文脈木登録手段である。符号木保持手段４０１
は、予めデータ未登録を示すデータとして定義されるエ
スケープコードを登録した符号木を保持するものであり
文脈木保持手段４０２は、復号したデータと文脈との組
み合わせを登録した文脈木を保持するものであり、符号
木決定手段４０３は、直前までに復号したデータから符
号の符号木を決定するものである。さらに、復号手段４
０４は、符号に従って符号木の頂点を意味するルートか
らデータ格納点としてのリーフへと走査して符号を復号
するものであり、文脈変更手段４０５は、到達したリー
フがエスケープコードであった場合、文脈を変更するも
のであり、符号更新手段４０６は、復号したデータ及び
エスケープコードのリーフを他のリーフあるいは分岐点
としてのノードと組み替えるものである。また、符号登
録手段４０７は、エスケープコードを復号したとき、エ
スケープコードのリーフを分岐して復号したデータを新
規に登録するものであり、文脈木登録手段４０８は、符
号登録手段４０７で登録したデータを文脈保持手段４０
２の文脈木に登録するものである。さらに、本発明に関
連するデータ復元方法（６）を実施するための装置の構
成を、図１３に示す。この図１３に示すデータ復元装置
も、入力データを過去の入力データの履歴に応じて符号
化した符号を復号するもので、ここで、この図１３に示
すデータ復元装置は、前述の図１２に示すものと同様の
符号木保持手段４０１，文脈木保持手段４０２，符号木
決定手段４０３，復号手段４０４，文脈変更手段４０
５，符号更新手段４０６をそなえており、これらの説明
は省略する。また、４１１は分岐位置検索手段であり、
この分岐位置検索手段４１１は、符号木内の最長の符号
長を持つリーフの位置を検索するものである。そして、
４１２は符号登録手段であり、この符号登録手段４１２
は、エスケープコードを符号化したのち分岐位置検索手
段４１１で検索されたリーフを分岐してデータを新規に
登録するものである。さらに、４１３は文脈木登録手段
であり、この文脈木登録手段４１３は、符号登録手段４
１２で登録したデータを文脈木保持手段４０２の文脈木
に登録するものである。さらに、本発明に関連するデー
タ復元方法（７）を実施するための装置の構成を、図１
４に示す。この図１４に示すデータ復元装置も、入力デ
ータを過去の入力データの履歴に応じて符号化した符号
を復号するものである。ここで、この図１４に示すデー
タ復元装置においても、前述の図１２に示すものと同様
の符号木保持手段４０１，文脈木保持手段４０２，符号
木決定手段４０３，復号手段４０４，文脈変更手段４０
５，符号更新手段４０６をそなえており、これらの説明
は省略する。また、４０９は分岐位置保持手段であり、
この分岐位置保持手段４０９は、符号木に新規に登録さ
れたリーフの位置を保持するものである。さらに、４１
０は符号登録手段であり、この符号登録手段４１０は、
エスケープコードを符号化したのち、分岐位置保持手段
４０９に保持されている位置にあるリーフを分岐してデ
ータを新規に登録するものである。４１４は文脈木登録
手段であり、この文脈木登録手段４１４は、符号登録手
段４１０で登録したデータを文脈保持手段４０２の文脈
木に登録するものである。そして、図１を用いて説明し
た構成をもつ装置、すなわち入力データを過去に出現し
た履歴に応じて符号化して圧縮するデータ圧縮装置にお
いては、前置データ保持手段１００が、入力データの直
前までに入力されたｎ個の入力データからなる文脈を保
持し、履歴保持手段１０１が、入力データと文脈との組
み合わせを保持し、符号木保持手段１０２が、文脈毎に
独立した符号木を保持する。そして、符号木決定手段１
０３が、前置データ保持手段１００に保持されている直
前までの入力データからデータの符号木を決定し、符号
出力手段１０４が、符号木決定手段１０３で選択した符
号木の頂点を意味するルートからデータが格納されてい
るリーフに沿って途中に位置する分岐点としてのノード
からの分岐に従って固有のデータを出力する。さらに、
符号長変更手段１０５が、符号化したリーフと他のリー
フあるいはノードとを組み替え、前置データ更新手段１
０６が、データを前置データ保持手段１００に登録する
ことができる。次に、図２を用いて説明した構成をもつ
装置、すなわち入力データを過去に出現した履歴に応じ
て符号化して圧縮するデータ圧縮装置においては、前置
データ保持手段１００が、入力データの直前までに入力
されたｎ個の入力データからなる文脈を保持し、履歴保
持手段１０１が、入力データと文脈との組み合わせを保
持し、符号木保持手段１０７が、データ未登録を示すデ
ータとして定義されるエスケープコードをあらかじめ登
録した文脈毎に独立した符号木を保持する。そして、符
号木決定手段１０３が、文脈と入力データからデータの
符号木を決定し、文脈判別手段１０８が、符号木決定手
段１０３で決定した符号木にデータが登録されているか
否かを判別し、エスケープコード出力手段１０９が、符
号木にデータが登録されていないときは符号木の頂点を
意味するルートからエスケープコードのデータ格納点と
してのリーフまでの途中に位置する分岐点としてのノー
ドからの分岐に従ってエスケープコードを出力する。さ
らに、文脈変更手段１１０が、符号木にデータが登録さ
れていないときは文脈の長さｎを短くし、符号出力手段
１１１が、符号木にデータが登録されているときは符号
木のルートからデータのリーフまでの途中に位置するノ
ードからの分岐に従ってデータの符号を出力し、符号長
変更手段１０５が、符号化したリーフと他のリーフある
いはノードとを組み換える。そして、前置データ更新手
段１０６が、データを前置データ保持手段１００に登録
し、制御手段１１６が、エスケープコードを符号化した
ときはデータの符号化を行なうまで処理を繰り返す。次
に、図３を用いて説明した構成をもつ、請求項１１記載
の本発明のデータ圧縮方法を実施するための装置、すな
わち入力データを過去に出現した履歴に応じて符号化し
て圧縮するデータ圧縮装置においては、前置データ保持
手段１００が、入力データの直前までに入力されたｎ個
の入力データからなる文脈を保持し、履歴保持手段１０
１が、入力データと文脈との組み合わせを保持し、符号
木保持手段１０７が、データ未登録を示すデータとして
定義されるエスケープコードを予め登録した文脈毎に独
立した符号木を保持する。そして、符号木決定手段１０
３が、文脈と入力データからデータの符号木を決定し、
文脈判別手段１０８が、符号木決定手段１０３で決定し
た符号木にデータが登録されているか否かを判別し、エ
スケープ出力手段１０９が、符号木にデータが登録され
ていないときは符号木の頂点を意味するルートからエス
ケープコードのデータ格納点としてのリーフまでの中に
位置する分岐点としてのノードからの分岐に従ってエス
ケープコードを出力する。さらに、履歴登録手段１１２
が、符号木にデータが登録されていないときは履歴保持
手段１０１にデータと文脈の組み合わせを登録し、符号
登録手段１１３が、符号木にデータが登録されていない
ときは符号木にデータを新規に登録し、文脈変更手段１
１０が、符号木にデータが登録されていないときは文脈
の長さｎを短くし、符号出力手段１１１が、符号木にデ
ータが登録されているときは符号木のルートからデータ
のリーフまでの途中に位置するノードからの分岐に従っ
てデータの符号を出力する。そして、符号長変更手段１
０５が、符号化したリーフと他のリーフあるいはノード
とを組み換え、前置データ更新手段１０６が、データを
前置データ保持手段１００に登録し、制御手段１１６
が、エスケープコードを符号化したときはデータの符号
化を行なうまで処理を繰り返す。次に、図４を用いて説
明した構成をもつ、請求項１２に記載の本発明のデータ
圧縮方法を実施するための装置、すなわち入力データを
過去に出現した履歴に応じて符号化して圧縮するデータ
圧縮装置においては、前置データ保持手段１００が、入
力データの直前までに入力されたｎ個の入力データから
なる文脈を保持し、履歴保持手段１０１が、入力データ
と文脈との組み合わせを保持し、符号木保持手段１０７
が、データ未登録を示すデータとして定義されるエスケ
ープコードをあらかじめ登録した文脈毎に独立した符号
木を保持する。そして、符号木決定手段１０３が、文脈
と入力データからデータの符号木を決定し、文脈判別手
段１０８が、符号木決定手段１０３で決定した符号木に
データが登録されているか否かを判別し、エスケープコ
ード出力手段１０９と符号木にデータが登録されていな
いときは符号木の頂点を意味するルートからエスケープ
コードのデータ格納点としてのリーフまでの途中に位置
する分岐点としてのノードからの分岐に従ってエスケー
プコードを出力する。さらに、文脈変更手段１１０が、
符号木にデータが登録されていないときは文脈の長さｎ
を短くし、エスケープ符号出力手段１１１が、符号木に
データが登録されているときは符号木のルートからデー
タのリーフまでの途中に位置するノードからの分岐にし
たがってデータの符号を出力する。そして、履歴登録手
段１１４が、履歴保持手段１０１にデータと文脈の組み
合わせを登録し、符号登録手段１１５が、符号木にデー
タを新規に登録し、符号長変更手段１０５が、符号化し
たリーフと他のリーフあるいはノードとを組み換え、前
置データ更新手段１０６が、データを前置データ保持手
段１００に登録する。さらに、制御手段１１６が、デー
タの符号化時に一度でもエスケープコードを符号化した
ときは、データの符号化の直前の文脈とデータとの組み
合わせを履歴登録手段１１４で履歴保持手段１０１に登
録し、データの符号化の直前に符号化したエスケープコ
ードを持つ符号木に符号登録手段１１５でデータを新規
に登録する。一方、図５を用いて説明した構成をもつ装
置、すなわち過去に出現した履歴に応じて符号化した符
号を復号するデータ復元装置においては、前置データ保
持手段２００が、過去に復号したｎ個のデータを保持
し、履歴保持手段２０１が、復号したデータと文脈との
組み合わせを保持し、符号木保持手段２０２が、文脈毎
に独立した符号木を保持する。そして、符号木決定手段
２０３が、前置データ保持手段２００に保持されている
文脈からデータを復号するための符号木を決定し、復号
手段２０４が、符号に従って符号木決定手段２０３で選
択した符号木の頂点を意味するルートから分岐点として
のノードを走査して到達したデータ格納点としてのリー
フに格納されているデータを出力する。さらに、符号長
変更手段２０５が、復号したリーフと他のリーフあるい
はノードとを組み替え、前置データ更新手段２０６が、
復号したデータを前置データ保持手段２００に登録す
る。次に、図６を用いて説明した構成をもつ装置、すな
わち過去に出現した履歴に応じて符号化した符号を復号
するデータ復元装置においては、前置データ保持手段２
００が、過去に復号したｎ個のデータを保持し、履歴保
持手段２０１が、復号したデータと文脈との組み合わせ
を保持し、符号木保持手段２０７が、データ未登録を示
すデータとして定義されるエスケープコードをあらかじ
め登録した符号木を保持する。そして、符号木決定手段
２０３が、前置データ保持手段２００に保持されている
文脈からデータを復号するための符号木を決定し、復号
手段２０４が、符号に従って符号木決定手段２０３で選
択した符号木の頂点を意味するルートから分岐点として
のノードを走査して到達したデータ格納点としてのリー
フに格納されているデータを出力する。さらに、符号長
変更手段２０５が、復号したリーフと他のリーフあるい
はノードとを組み替え、文脈変更手段２０８が、出力し
たデータがエスケープコードであったときデータを棄却
し文脈を短くし、前置データ更新手段２０６が、復号し
たデータを前置データ保持手段２００に登録する。そし
て、制御手段２１３が、エスケープコードを復号した時
は文脈変更手段２０８で文脈を再設定し、エスケープコ
ード以外が復号されるまで処理を繰り返す。次に、図７
を用いて説明した構成をもつ装置、すなわち過去に出現
した履歴に応じて符号化した符号を復号するデータ復元
装置においては、前置データ保持手段２００が、過去に
復号したｎ個のデータを保持し、履歴保持手段２０１
が、復号したデータと文脈との組み合わせを保持し、符
号木保持手段２０７が、エスケープコードをあらかじめ
登録した符号木を保持する。そして、符号木決定手段２
０３が、前置データ保持手段２００に保持されている文
脈からデータを復号するための符号木を決定し、復号手
段２０４が、符号に従って符号木決定手段２０３で選択
した符号木の頂点を意味するルートから分岐点としての
ノードを走査して到達したデータ格納点としてのリーフ
に格納されているデータを出力する。さらに、符号長変
更手段２０５が、復号したリーフと他のリーフあるいは
ノードとを組み替え、文脈変更手段２０８が、出力した
データがエスケープコードであったとき、データを棄却
し文脈を短くし、前置データ更新手段２０６が、復号し
たデータを前置データ保持手段２００に登録する。そし
て、履歴登録手段２０９が、データの復号処理でエスケ
ープコードを復号したときの全ての文脈と復号したデー
タとを履歴保持手段２０１に登録し、符号登録手段２１
０が、データの復号処理でエスケープコードを復号した
時の文脈に対応した全ての符号木にデータの符号を登録
し、制御手段２１３が、エスケープコードを復号した時
は文脈変更手段２０８で文脈を再設定し、エスケープコ
ード以外が復号されるまで処理を繰り返す。次に、図８
を用いて説明した構成をもつ装置、すなわち過去に出現
した履歴に応じて符号化した符号を復号するデータ復元
装置においては、前置データ保持手段２００が、過去に
復号したｎ個のデータを保持し、履歴保持手段２０１
が、復号したデータと文脈との組み合わせを保持し、符
号木保持手段２０７が、データ未登録を示すデータとし
て定義されるエスケープコードをあらかじめ登録した符
号木を保持する。そして、符号木決定手段２０３が、前
置データ保持手段２００に保持されている文脈からデー
タを復号するための符号木を決定し、復号手段２０４
が、符号に従って符号木決定手段２０３で選択した符号
木の頂点を意味するルートから分岐点としてのノードを
走査して到達したデータ格納点としてのリーフに格納さ
れているデータを出力する。さらに、符号長変更手段２
０５が、復号したリーフと他のリーフあるいはノードと
を組み替え、文脈変更手段２０８が、出力したデータが
エスケープコードであったときデータを棄却し文脈を短
くする。そして、前置データ更新手段２０６が、復号し
たデータを前置データ保持手段２００に登録し、履歴登
録手段２１１が、データの復号処理でエスケープコード
を最後に復号した時の文脈と復号したデータとを履歴保
持手段２０１に登録し、符号登録手段２１２が、データ
の復号処理で最後にエスケープコードを復号した時の文
脈に対応した符号木にデータの符号を登録する。さら
に、制御手段２１３が、エスケープコードを復号した時
は文脈変更手段２０８で文脈を再設定し、エスケープコ
ード以外が復号されるまで処理を繰り返す。また、図９
を用いて説明した構成をもつ装置、すなわち入力データ
を過去に出現した履歴に応じて符号化するデータ圧縮装
置においては、符号木保持手段３０１が、予めデータ未
登録を示すデータとして定義されるエスケープコードを
登録した符号木を保持し、文脈木保持手段３０２が、入
力データと文脈との組み合わせを登録した文脈木を保持
する。そして、文脈登録手段３０３が、エスケープコー
ドを符号化したのち、文脈木にデータを新規に登録し、
符号登録手段３０４が、エスケープコードを符号化した
のち符号木のエスケープコードのデータ格納点としての
リーフを分岐してデータを新規に登録し、文脈変更手段
３０５が、入力データと文脈との組み合わせが文脈木に
保持されていないとき、文脈を変更する。さらに、符号
化手段３０６が、符号木の頂点からの入力データあるい
はエスケープコードが登録してあるリーフまでの分岐に
従って符号を出力し、符号更新手段３０７が、符号化し
たデータ及びエスケープコードが登録してあるリーフと
他のリーフあるいはノードとを取り替える。さらに、図
１０を用いて説明した構成をもつ装置、すなわち入力デ
ータを過去に出現した履歴に応じて符号化するデータ圧
縮装置においては、符号木保持手段３０１が、予めデー
タ未登録を示すデータとして定義されるエスケープコー
ドを登録した符号木を保持し、文脈木保持手段３０２
が、入力データと文脈との組み合わせを登録した文脈木
を保持する。そして、文脈登録手段３０３が、エスケー
プコードを符号化したのち、文脈木にデータを新規に登
録し、分岐位置検索手段３１０が、符号木上の最長の符
号長を持つリーフを検索し、符号登録手段３１１が、エ
スケープコードを符号化したのち、分岐位置検索手段３
１０に検索されたデータ格納点としてのリーフを分岐し
てデータを新規に登録する。さらに、文脈変更手段３０
５が、入力データと文脈との組み合わせが文脈木に保持
されていないとき文脈を変更し、符号化手段３０６が、
符号木の頂点から入力データあるいはエスケープコード
が登録してあるリーフまでの分岐に従って符号を出力
し、符号更新手段３０７が、符号化したデータ及びエス
ケープコードが登録してあるリーフと他のリーフあるい
はノードとを取り替える。また、図１１を用いて説明し
た構成をもつ装置、すなわち入力データを過去に出現し
た履歴に応じて符号化するデータ圧縮装置においては、
符号木保持手段３０１が予めデータ未登録を示すデータ
として定義されるエスケープコードを登録した符号木を
保持し、文脈木保持手段３０２が入力データと文脈との
組み合わせを登録した文脈木を保持する。そして、文脈
登録手段３０３がエスケープコードを符号化したのち、
文脈木にデータを新規に登録し、分岐位置保持手段３０
８が符号木に新規に登録されたデータ格納点としてのリ
ーフの位置を保持し、符号登録手段３０９がエスケープ
コードを符号化したのち、分岐位置保持手段３０８に保
持されている位置にあるリーフを分岐してデータを新規
に登録する。さらに、文脈変更手段３０５が入力データ
と文脈との組み合わせが文脈木に保持されていないとき
分脈を変更し、符号化手段３０６が符号木の頂点から入
力データあるいはエスケープコードが登録してあるリー
フまでの分岐に従って符号を出力し、符号更新手段３０
７が符号化したデータ及びエスケープコードが登録して
あるリーフと他のリーフあるいは分岐点としてのノード
とを取り替える。一方、図１２を用いて説明した構成を
もつ装置、すなわち入力データを過去の入力データの履
歴に応じて符号化した符号を復号するデータ復元装置に
おいては、符号木保持手段４０１が予めデータ未登録を
示すデータとして定義されるエスケープコードを登録し
た符号木を保持し、文脈保持手段４０２が復号したデー
タと文脈との組み合わせを登録した文脈木を保持し、符
号木決定手段４０３が直前までに復号したデータから符
号の符号木を決定する。そして、復号手段４０４が符号
に従って符号木の頂点を意味するルートからデータ格納
点としてのリーフへと走査して符号を復号し、文脈変更
手段４０５が到達したリーフがエスケープコードであっ
た場合、文脈を変更する。さらに、符号更新手段４０６
が、復号したデータ及びエスケープコードのリーフを他
のリーフあるいは分岐点としてのノードと組み替え、符
号登録手段４０７がエスケープコードを復号したとき、
エスケープコードのリーフを分岐して復号したデータを
新規に登録し、文脈木登録手段４０８が符号登録手段４
０７で登録したデータを文脈保持手段４０２の文脈木に
登録する。さらに、図１３を用いて説明した構成をもつ
装置、すなわち入力データを過去の入力データの履歴に
応じて符号化した符号を復号するデータ復元装置におい
ては、符号木保持手段４０１が予めデータ未登録を示す
データとして定義されるエスケープコードを登録した符
号木を保持し、文脈保持手段４０２が復号したデータと
文脈との組み合わせを登録した文脈木を保持し、符号木
決定手段４０３が直前までに復号したデータから符号の
符号木を決定する。そして、復号手段４０４が符号に従
って符号木の頂点を意味するルートからデータ格納点と
してのリーフへと走査して符号を復号し、文脈変更手段
４０５が、到達したリーフがエスケープコードであった
場合、文脈を変更する。さらに、符号更新手段４０６が
復号したデータ及びエスケープコードのリーフを他のリ
ーフあるいは分岐点としてのノードと組み替え、分岐位
置検索手段４１１が符号木内の最長の符号長を持つリー
フの位置を検索し、符号登録手段４１２が、エスケープ
コードを符号化したのち分岐位置検索手段４１１で検索
されたリーフを分岐してデータを新規に登録し、文脈木
登録手段４０８が符号登録手段４１２で登録したデータ
を文脈保持手段４０２の文脈木に登録する。また、図１
４を用いて説明した構成をもつ装置、すなわち入力デー
タを過去の入力データの履歴に応じて符号化した符号を
復号するデータ復元装置においては、符号木保持手段４
０１が予めデータ未登録を示すデータとして定義される
エスケープコードを登録した符号木を保持し、文脈保持
手段４０２が、復号したデータと文脈との組み合わせを
登録した文脈木を保持し、符号木決定手段４０３が直前
までに復号したデータから符号の符号木を決定する。そ
して、復号手段４０４が、符号に従って符号木の頂点を
意味するルートからデータ格納点としてのリーフへと走
査して符号を復号し、文脈変更手段４０５が、到達した
リーフがエスケープコードであった場合、文脈を変更
し、符号更新手段４０６が復号したデータ及びエスケー
プコードのリーフを他のリーフあるいは分岐点としての
ノードと組み替え、分岐位置保持手段４０９が符号木に
新規に登録されたリーフの位置を保持する。さらに、符
号登録手段４１０がエスケープコードを符号化したの
ち、分岐位置保持手段４０９に保持されている位置にあ
るリーフを分岐してデータを新規に登録し、文脈木登録
手段４０８が符号登録手段４１０で登録したデータを文
脈保持手段４０２の文脈木に登録する。

【００８９】

【発明の効果】以上詳述したように、本発明のデータ圧
縮方法によれば、入力データを過去に出現した履歴に応
じて符号化して圧縮するデータ圧縮方法において、入力
データの文字列について直前文字との繋がりを表わす文
脈を収集して文脈木を作成する文脈収集過程と、この文
脈収集過程で得られた文脈木の各ノードに対応する符号
を符号木アドレスで対応させることにより文脈に対応し
てスプレイ符号を対応させた符号木を、入力データの文
字列に応じてスプレイ符号化しながら作成・更新するス
プレイ符号化過程とをそなえて構成されているので、出
現する入力データの出現頻度を求めて確率モデルを構築
して符号表を作成し、この符号表から各入力データに符
号を割り当てるという２段階の処理を同時に行なうこと
ができ、データ圧縮の処理速度が大幅に向上するという
効果がある。また、上述の確率モデルは、文字の入力毎
に符号木が作成・更新されることによって構築されるの
で、文字の入力毎に、既に構築されている確率モデルを
再構築するという膨大な演算処理を行なう必要が無く、
これにより圧縮処理の速度がさらに向上する（請求項
１）。

【００９０】また、本発明のデータ圧縮方法によれば、
入力データを過去に出現した履歴に応じて符号化して圧
縮するデータ圧縮方法において、入力データの文字列を
収集し収集した文字列に番号を付けて直前文字との繋が
りを表わす文脈を辞書としての文脈木に登録するととも
に、その文脈木の各ノードに対応する符号を符号木アド
レスで対応させることにより文脈に対応してスプレイ符
号を対応させておき、最長一致文字列の辞書番号に対応
するスプレイ符号の符号化及び更新を施すとともに、所
定の最大文字列長に達するまで符号化文字列の伸長文字
列を文脈木に登録し、その伸長文字列に対応するスプレ
イ符号を符号木に登録するので、入力データを１文字単
位ではなく、複数文字単位の文字列として符号化するこ
とができ、データ圧縮の処理速度が大幅に向上する効果
がある（請求項２）。

【００９１】また、辞書登録文字列として、符号化済の
直前文字から登録し、直前文字から続く文字列を符号化
したり、全ての一文字にスプレイ符号を割り当ててお
き、もし、直前文字から繋がる文字列が既に収集した辞
書（文脈木）中の文字列中になければ、一文字のスプレ
イ符号を符号化出力するとともに更新した後、直前文字
から繋がる符号化した文字を辞書（文脈木）に登録する
ようにすれば、辞書（文脈木）中にない文字列をその都
度全て登録する必要がないので、データ圧縮の処理速度
が、さらに大幅に向上する効果がある（請求項３，
４）。

【００９２】また、本発明のデータ復元方法によれば、
入力データを過去の入力データの履歴に応じて符号化し
た符号化データを復元するデータ復元方法において、復
元データの文字列について直前文字との繋がりを表わす
文脈を収集して文脈木を作成する文脈収集過程と、この
文脈収集過程で得られた文脈木の各ノードに対応する符
号を符号木アドレスで対応させることにより文脈に対応
してスプレイ符号を対応させた符号木を、復元データの
文字列に応じてスプレイ符号化しながら作成・更新する
スプレイ符号化過程とをそなえているので、復元する文
字列の符号の出現頻度を求めて確率モデルを構築して符
号表を作成し、この符号表から復元する文字列の符号を
復元するという２段階の処理を同時に行なうことがで
き、データ復元の処理速度が大幅に向上するという効果
がある。また、上述の確率モデルは、文字の復元毎に符
号木が作成・更新されることによって構築されるので、
文字の復元毎に、既に構築されている確率モデルを再構
築するという膨大な演算処理を行なう必要が無く、これ
により復元処理の速度がさらに向上する（請求項５）。

【００９３】さらに、本発明のデータ復元方法によれ
ば、入力データを過去の入力データの履歴に応じて符号
化した符号化データを復元するデータ復元方法におい
て、復元したデータの文字列を収集し収集した文字列に
番号を付けて直前文字との繋がりを表わす文脈を辞書と
しての文脈木に登録するとともに、その文脈木の各ノー
ドに対応する符号を符号木アドレスで対応させることに
より文脈に対応してスプレイ符号を対応させておき、辞
書番号に対応する文字列をスプレイ符号で復号化及び更
新するとともに、所定の最大文字列長に達するまで符号
化文字列の伸長文字列を文脈木に登録し、その伸長文字
列に対応するスプレイ符号を符号木に登録するので、入
力されたデータを１文字単位ではなく、複数文字単位の
文字列として復元することができ、これにより、データ
復元の処理速度が大幅に向上する効果がある（請求項
６）。

【００９４】また、本発明のデータ復元方法によれば、
辞書登録文字列として、復号化済の直前文字から登録
し、直前文字から続く文字列を復号化したり、全ての一
文字にスプレイ符号を割り当てておき、直前文字から繋
がる文字列が既に収集した辞書（文脈木）中の文字列中
にない一文字のスプレイ符号を復号したとき、符号を更
新するとともに、直前文字から繋がる復号化した文字を
辞書（文脈木）に登録するようにすれば、辞書（文脈
木）中に無い文字列の符号をその都度全て登録する必要
が無いので、データ復元の処理速度が、さらに大幅に向
上する効果がある（請求項７，８）。

【図面の簡単な説明】

【図１】本発明に関連する技術を説明するためのブロッ
ク図である。

【図２】本発明に関連する技術を説明するためのブロッ
ク図である。

【図３】本発明に関連する技術を説明するためのブロッ
ク図である。

【図４】本発明に関連する技術を説明するためのブロッ
ク図である。

【図５】本発明に関連する技術を説明するためのブロッ
ク図である。

【図６】本発明に関連する技術を説明するためのブロッ
ク図である。

【図７】本発明に関連する技術を説明するためのブロッ
ク図である。

【図８】本発明に関連する技術を説明するためのブロッ
ク図である。

【図９】本発明に関連する技術を説明するためのブロッ
ク図である。

【図１０】本発明に関連する技術を説明するためのブロ
ック図である。

【図１１】本発明に関連する技術を説明するためのブロ
ック図である。

【図１２】本発明に関連する技術を説明するためのブロ
ック図である。

【図１３】本発明に関連する技術を説明するためのブロ
ック図である。

【図１４】本発明に関連する技術を説明するためのブロ
ック図である。

【図１５】本発明の一実施例にかかるデータ圧縮装置及
びデータ復元装置の構成を示すブロック図である。

【図１６】（ａ）は文脈木の格納形式の一例を示す図で
ある。（ｂ）は辞書の親子関係を示す図である。

【図１７】符号木の初期状態を説明するための図であ
る。

【図１８】符号木を格納する配列の一例を示す図であ
る。

【図１９】（ａ），（ｂ）はそれぞれスプレイ符号の符
号更新の基本操作およびスプレイ符号の符号更新の一例
を説明するための図である。

【図２０】本発明の一実施例にかかる符号化の手順を説
明するためのフローチャートである。

【図２１】（ａ），（ｂ）は、本実施例にかかる文脈木
と符号木の更新手順を説明するための図である。

【図２２】（ａ），（ｂ）は、本実施例にかかる文脈木
と符号木の更新手順を説明するための図である。

【図２３】（ａ），（ｂ）は、本実施例にかかる文脈木
と符号木の更新手順を説明するための図である。

【図２４】（ａ），（ｂ）は、本実施例にかかる文脈木
と符号木の更新手順を説明するための図である。

【図２５】（ａ），（ｂ）は、本実施例にかかる文脈木
と符号木の更新手順を説明するための図である。

【図２６】（ａ），（ｂ）は、本実施例にかかる文脈木
と符号木の更新手順を説明するための図である。

【図２７】（ａ），（ｂ）は、本実施例にかかる文脈木
と符号木の更新手順を説明するための図である。

【図２８】（ａ），（ｂ）は、本実施例にかかる文脈木
と符号木の更新手順を説明するための図である。

【図２９】本発明の一実施例にかかる文字列の符号化後
の例を説明するための図である。

【図３０】（ａ），（ｂ）は文脈木の作成手順のアルゴ
リズムを示す図である。

【図３１】本発明の一実施例にかかる復号化の手順を説
明するためのフローチャートである。

【図３２】（ａ），（ｂ）は多値算術符号化の原理を説
明するための図である。

【図３３】（ａ），（ｂ）は従来の文字単位に圧縮する
多値算術符号化の手順を示すフローチャートである。

【図３４】多値算術符号化のアルゴリズムの一例を示す
図である。

【図３５】（ａ），（ｂ）はスプレイ符号化の原理を説
明するための図である。

【図３６】確率統計型符号化の原理を説明するための図
である。

【図３７】（ａ），（ｂ）は文脈の木の登録例を示す図
である。

【符号の説明】

１，３データ圧縮装置２，４データ復元装置１１，２２文脈収集過程１２，２１スプレイ符号化過程１００，２００前置データ保持手段１０１，２０１履歴保持手段１０２，２０２，１０７，２０７，３０１，４０１符
号木保持手段１０３，２０３，４０３符号木決定手段１０４符号出力手段１０５，２０５符号長変更手段１０６，２０６前置データ更新手段１０８文脈判別手段１０９エスケープコード出力手段１１０，２０８，３０５，４０５文脈変更手段１１１符号出力手段１１２，２０９履歴登録手段１１３，１１４，１１５，２１２，３０４，３０９，３
１１，４０７，４１０，４１２符号登録手段１１６，１１７，２１３制御手段２０４，４０４復号手段３０３文脈登録手段３０２，４０２文脈木保持手段３０６符号化手段３０７，４０６符号更新手段３０８，４０９分岐位置保持手段３１０，４１１分岐位置検索手段４０８，４１３，４１４文脈木登録手段５１１文脈収集５１２動的可変長符号化

フロントページの続き (56)参考文献特開平５−67978（ＪＰ，Ａ) 特開平５−128103（ＪＰ，Ａ) 特開平４−230518（ＪＰ，Ａ) 特開平４−100322（ＪＰ，Ａ) 特開平４−156111（ＪＰ，Ａ) 特開平５−218881（ＪＰ，Ａ) ＤｏｕｇｌａｓＷ．Ｊｏｎｅｓ，Ａｐｐｌｉｃａｔｉｏｎｏｆｓｐｌａｙｔｒｅｅｓｔｏｄａｔａｃｏｍｐｒｅｓｓｉｏｎ，ＣｏｍｍｕｎｉｃａｔｉｏｎｏｆｔｈｅＡＣＭ，米国，ＡｓｓｏｃｉａｔｉｏｎｆｏｒＣｏｍｐｕｔｉｎｇｍａｃｈｉｎｅｒｙ，31［８］，Ｐ．996−1007 (58)調査した分野(Int.Cl.⁷，ＤＢ名) G06F 5/00 H03M 7/30 - 7/50

Claims

(57)【特許請求の範囲】

【請求項１】入力データを過去に出現した履歴に応じ
て符号化して圧縮するデータ圧縮方法において、上記入力データの文字列について直前文字との繋がりを
表わす文脈を収集して文脈木を作成する文脈収集過程
と、上記文脈収集過程で得られた該文脈木の各ノードに対応
する符号を符号木アドレスで対応させることにより該文
脈に対応してスプレイ符号を対応させた符号木を、上記
入力データの文字列に応じてスプレイ符号化しながら作
成・更新するスプレイ符号化過程とをそなえて構成され
たことを特徴とする、データ圧縮方法。
【請求項２】入力データを過去に出現した履歴に応じ
て符号化して圧縮するデータ圧縮方法において、上記入力データの文字列を収集し、収集した文字列に番
号を付けて直前文字との繋がりを表わす文脈を辞書とし
ての文脈木に登録するとともに、該文脈木の各ノードに対応する符号を符号木アドレスで
対応させることにより該文脈に対応してスプレイ符号を
対応させておき、最長一致文字列の辞書番号に対応する
スプレイ符号の符号化及び更新を施すとともに、所定の
最大文字列長に達するまで符号化文字列の伸長文字列を
該文脈木に登録し、上記伸長文字列に対応するスプレイ
符号を木構造の符号表としての符号木に登録することを
特徴とする、データ圧縮方法。
【請求項３】辞書登録文字列として、符号化済の直前
文字から登録し、上記直前文字から続く文字列を符号化
することを特徴とする、請求項２記載のデータ圧縮方
法。
【請求項４】全ての一文字にスプレイ符号を割り当て
ておき、もし、上記直前文字から繋がる文字列が既に収
集した辞書中の文字列中になければ、上記一文字のスプ
レイ符号を出力するとともに更新した後、上記直前文字
から繋がる上記符号化した文字を該文脈木に登録するこ
とを特徴とする請求項３記載のデータ圧縮方法。
【請求項５】入力データを過去の入力データの履歴に
応じて符号化した符号化データを復元するデータ復元方
法において、復元データの文字列について直前文字との繋がりを表わ
す文脈を収集して文脈木を作成する文脈収集過程と、上記文脈収集過程で得られた該文脈木の各ノードに対応
する符号を符号木アドレスで対応させることにより該文
脈に対応してスプレイ符号を対応させた符号木を、上記
復元データの文字列に応じてスプレイ符号化しながら作
成・更新するスプレイ符号化過程とをそなえて構成され
たことを特徴とする、データ復元方法。
【請求項６】入力データを過去の入力データの履歴に
応じて符号化した符号化データを復元するデータ復元方
法において、復元したデータの文字列を収集し、収集した文字列に番
号を付けて直前文字との繋がりを表わす文脈を辞書とし
ての文脈木に登録するとともに、該文脈木の各ノードに対応する符号を符号木アドレスで
対応させることにより該文脈に対応してスプレイ符号を
対応させておき、辞書番号に対応する文字列をスプレイ
符号で復号化及び更新するとともに、所定の最大文字列
長に達するまで符号化文字列の伸長文字列を該文脈木に
登録し、上記伸長文字列に対応するスプレイ符号を木構
造の符号表としての符号木に登録することを特徴とす
る、データ復元方法。
【請求項７】辞書登録文字列として、復号化済の直前
文字から登録し、上記直前文字から続く文字列を復号化
することを特徴とする請求項６記載のデータ復元方法。
【請求項８】全ての一文字にスプレイ符号を割り当て
ておき、上記直前文字から繋がる文字列が既に収集した
辞書中の文字列中にない上記一文字のスプレイ符号を復
号したとき、符号を更新するとともに、上記直前文字か
ら繋がる上記復号化した文字を該文脈木に登録すること
を特徴とする、請求項７記載のデータ復元方法。