JP2002232297A

JP2002232297A - データ圧縮方法及びデータ復元方法並びにデータ圧縮装置及びデータ復元装置

Info

Publication number: JP2002232297A
Application number: JP2001402030A
Authority: JP
Inventors: Kimitaka Murashita; 君孝村下; Yoshiyuki Okada; 佳之岡田; Shigeru Yoshida; 茂吉田
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2001-12-28
Filing date: 2001-12-28
Publication date: 2002-08-16
Anticipated expiration: 2018-07-07
Also published as: JP3425142B2

Abstract

(57)【要約】【課題】算術符号の区間計算の代わりにスプレイ符号
化を適用し、このスプレイ符号化における符号木に新規
データを登録することで、高速な符号登録処理を可能に
してデータ圧縮／復元処理を高速化できるようにする。【解決手段】入力データとそれまでに連続したｎ個の
データからなる文脈との組み合わせを保持し、その文脈
毎に独立した符号木を保持しておき、文脈に該当したデ
ータが出現したとき、上記符号木の頂点を意味するルー
トから上記符号木上の上記データが格納されている点と
してのリーフまでの分岐点としてのノードの分岐に応じ
た固有のデータとして定義される符号を出力し（ステッ
プＡ３）、上記データのリーフと他データのリーフある
いはノードとを組み替える（ステップＡ４）。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、データ圧縮方法及
びデータ復元方法並びにデータ圧縮装置及びデータ復元
装置に関する。近年、文字コード、ベクトル情報，画像
など様々な種類のデータがコンピュータで扱われるよう
になっており、扱われるデータ量も急速に増加してきて
いる。これに伴い、大量のデータを扱うときは、データ
の中の冗長な部分を省いてデータ量を圧縮することで、
記憶容量を減らしたり速く伝送したりすることが行なわ
れている。また、様々なデータを一つの方式でデータ圧
縮できる方法としてユニバーサル符号化が提案されてい
る。

【０００２】ここで、本発明の分野は文字コードの圧縮
に限らず、様々なデータに適用できるが、以下では情報
理論で用いられている呼称を踏襲し、データの１ワード
単位を文字といい、データが任意ワードつながったもの
を文字列と呼ぶようにする。

【０００３】

【従来の技術】テキストデータやフィアル等を圧縮する
方式には、データ系列の類似性を利用いた辞書型符号化
方式と、データ列の出現頻度を利用した確率統計型符号
化方式(statistical coding) がある。この内、確率統
計型符号化の代表的な手法が、上述のユニバーサル符号
化である。

【０００４】さらに、算術符号化と呼ばれる符号化があ
る。この算術符号化とは、各文字の出現確率に適応した
符号を、符号表をもたずに、計算しながら生成するもの
であり、情報源の文字の出現頻度が分かっている場合に
最大の効率で圧縮できるといわれている方法であり、２
値算術符号化と３値以上の多値算術符号化とがある。以
下に、多値算術符号化の方法について述べる。

【０００５】多値算術符号化では、まず０≦Ｐ＜１（以
下、〔０，１）と記述する）の数直線を、出現した文字
の事象（以下、シンボルという）の数で分割する。ここ
で、各区間の幅はシンボルの出現頻度の比に比例するよ
うに取り、出現頻度が高い順に区間を配置する。そし
て、出現したシンボルに対応する区間を選択し、次のシ
ンボルでは選択した区間をさらに全シンボル数分の区間
に分割し対応するシンボルの区間を選択するという具合
に、再帰的に選択した区間を細分する。

【０００６】上述の処理について、図７０（ａ），図７
０（ｂ）に示す多値算術符号化の原理を説明する図を参
照しながら具体的に述べる。ここで、図７０（ａ）はシ
ンボルと出現頻度の一例を示す図、同図７０（ｂ）はシ
ンボルの区間分割の例を示す図である。そして、文字列
“ａｂｅ”の区間を分割する場合を例にとり、説明を進
める。

【０００７】まず、数直線〔０，１）を、図７０（ａ）
で示すような文字ａ，ｂ，ｃ，ｄ，ｅの５つの区間に分
割する。そして、最初に出現したシンボル“ａ”の区間
〔０，０．２）を選択し、この選択した区間〔０，０．
２）を、さらに、全シンボルａ〜ｅの５つの区間に分割
する。

【０００８】次に、第２に出現したシンボル“ｂ”の区
間〔０．０４，０．０６）を選択し、この区間〔０．０
４，０．０６）を、さらに全シンボルａ〜ｅの５つの区
間に分割する。こうして、第３に出現したシンボル
“ｅ”の区間を選択することにより、文字列“ａｂｅ”
の区間〔０．０５，０．０６）が得られる。このよう
に、全入力データについて、上述のような処理を繰り返
すことで、符号化する文字列の区間を決定することがで
き、最終的に定まった文字列の区間内の任意の点を２進
表示で表したものを、圧縮符号として出力するのであ
る。

【０００９】「算術符号化」という名称は、符号語が
〔０．１１０１１・・〕のように、２進数の小数点以下
の数値で表現され、それを計算で求められることからき
ている。また、上述のような出現頻度に応じた区間の分
割方法には、文字列の実際の出現頻度によらず、予め設
定した出現頻度に従って区間を分割する静的符号化方式
(static)、最初に全文字列を走査することにより得られ
た出現頻度で区間を分割する準適応型符号化方式(semi-
adaptive) 、又は文字が出現する毎に頻度を再計算して
１文字毎に区間を再設定する適応型符号化方式(adaptiv
e)とがある。

【００１０】ところで、上述の多値算術符号化をファイ
ル圧縮に用い、バイト（文字）単位にデータを圧縮する
方法は、例えば、以下の２つの文献，に記載されて
いる。 "Arithmetic Coding for Data Compression," Commu
n. of ACM, Vol.30, No.6 PP.520 −540(1986) "An Adatpive Dependency Source Model for Data Co
mpression Scheme," Commun. of ACM, Vol.32 No.1 PP.
77 −83 ここで、文献は、多値算術符号化の具体的なアルゴリ
ズムを開示している。また、この文献での多値算術符
号化は、１文字単位に符号化・圧縮するエントロピー符
号化と呼ばれる方法の一つであり、注目文字の出現確率
を多値算術符号化するとともに、各文字の出現確率をそ
の文字が表れるごとに逐次更新し、種々のデータに動的
に適応して符号化を行なうものである。また、この多値
算術符号化では、詳細には図７１（ａ）のフローチャー
トに示すような処理が行なわれる。

【００１１】一方、文献の方法は、注目文字を直前文
字を用いた条件付確率で表し、その条件付確率を多値算
術符号化することで高圧縮率を得る方法を与え、各条件
付確率を逐次更新し、種々のデータに動的に適応して符
号化を行なうものである。この多値算術符号化において
も、図７１（ｂ）のフローチャートに示すような処理が
行なわれる。

【００１２】ここで、多値算術符号化の代わりに、ハフ
マン符号化の変形であるダイナミック・ハフマン符号化
（"Variation a Theme by Huffman", IEEE Trans. Info
rm.Theory, Vol.24, No.6 1978, または、"Design and
Analysis of Dynamic Huffman Codes", Journal of AC
M, Vol.34, No.4 1987 参照）を用いる方法も考えられ
るが、このダイナミック・ハフマン符号化は、符号化効
率が多値算術符号化より劣る上、処理に時間がかかるた
め、条件付確率をダイナミック・ハフマン符号化する方
法は実際には使用されていない。

【００１３】なお、図７２は、この多値算術符号化・復
号化のアルゴリズムの一例を示す図である。また、算術
符号化とは別にスプレイ（Splay-Tree）符号化方法と呼
ばれるものがある（例えば、文献"Application of Spla
y Tree to Data Compression"DOUGLAS W.JONES著 Commu
n.of ACM,Vol31 No.8 P996-1007 参照) 。

【００１４】このスプレイ符号化方法では、図７３
（ａ）に示すような木構造の符号表( 以下、符号木と称
する)を用い、符号木の終端( 一般的に葉、あるいはリ
ーフと呼ばれる）にシンボルを登録し、符号木の頂点
（一般的に根，あるいはルートと呼ばれる）から入力デ
ータが格納されているリーフまでの距離を符号語として
出力する。

【００１５】具体的に述べると、符号語には、ルートか
らリーフへ下るとき、右へ分岐したときは“１”、左へ
分岐したときは“０”を割り当てるのである。つまり、
図７３（ａ）の例では、シンボルＡの符号は〔１０１１
０〕となり、シンボルＢの符号は〔００１〕となる。そ
して、符号長を変更する（符号更新する）場合は、符号
化したリーフと他のリーフ、あるいは符号木上の接点
（節、あるいはノードと呼ばれる）とを組み替えること
により行なう。

【００１６】図７３（ｂ）に上述の符号更新の例を示
す。この図７３（ｂ）に示すように、入力されたデータ
の中に、初めシンボルＡ，Ｂ，Ｃ，Ｄの各符号が符号木
のリーフに格納されている。そして、まずシンボルＡと
シンボルＣとのノードを組み替え、さらにシンボルＡの
上位ノードＤとシンボルＥとのノードを組み替えること
により、図７３（ｂ）に示すように、シンボルＡの符号
は、〔１０１１０〕から〔１１０〕となり符号の更新が
行なわれる。

【００１７】ここで、上述の説明は１文字毎の出現確率
を動的に可変長符号化する場合であるが、さらに、圧縮
率を高めるためには、入力信号と直前の文字との依存関
係を取り入れた条件付き出現確率を動的可変長符号化す
ることで行なわれる。この方法は、データの確率統計的
な性質を用いる確率統計型符号化であり、図７４に示す
ように、文脈収集処理５１１と動的可変長符号化処理５
１２との２段階の処理からなる。

【００１８】そして、図７５（ａ）に示すように文脈収
集により入力データから文字列の前後関係の文脈を収集
し、図７５（ｂ）に示すような文脈の木構造を作成し、
条件付き確率を求めて動的可変長符号化する。ここで、
上述の条件付き確率は、図７５（ｂ）に示すような木構
造の文脈木上において、各ノードの文字を通る文字列が
出現する毎に出現回数を計数しておくことによって求め
られる。

【００１９】ところで、条件付き確率を求める文脈収集
の方法には、主に以下の２つの方法がある。なお、以
下、条件（文脈）の文字数を次数と呼ぶことにする（文
献"Data Compression Using Adaptive Coding and Part
ial String Matching"JOHN G.CLEARY 他著IEEE Vol.COM
-32,No.4 APRIL 1984 P396-402参照) 。（１）固定次数の文脈収集方法この方法は、条件付き確率の条件を固定の文字数にする
方法である。

【００２０】例えば２次の文脈では、直前２文字につな
がる文字の文脈を収集し、条件付き確率ｐ（ｙ｜ｘ１，
ｘ２）を符号化する。ただし、ｙは注目符号化文字，ｘ
１，ｘ２はそれぞれ直前の第１文字，第２文字である。（２）Blending文脈収集方法上述の固定次数の文脈収集方法では、直前の条件文字列
が出にくい場合、条件付き確率の推定は不正確になり、
逆に直前の条件付き文字列が出やすい場合は条件付き確
率の推定は正確になり、さらに次数を上げ得る可能性を
残す。

【００２１】一般に、高次の文脈を使うほど文字間の相
関が大きいデータに対しては高圧縮率が得られるが、逆
に高次文脈を使うほど相関が小さくなるデータでは、か
えって圧縮率が悪くなる。これを解決するのが文脈のBl
ending（次数の混合）である。この方法は、直前の次数
を固定せずに出やすい場合には次数を上げ、出にくい場
合には低い次数のままという具合に文脈の次数を入力デ
ータに適応させて伸ばす方法である。

【００２２】

【発明が解決しようとする課題】しかしながら、算術符
号化を動的可変長符号に用いた確率統計型符号化方式に
は、データが入力されてくる度にそれまで入力された全
てのデータの累積頻度を再計算し、〔０，１）の数直線
を再分割するので、複雑で大量な演算処理を必要であ
り、処理の高速化が行なえないという課題がある。

【００２３】本発明は、このような課題に鑑み創案され
たもので、算術符号の区間計算の代わりにスプレイ符号
化を適用し、このスプレイ符号化における符号木に新規
データを登録することで、高速な符号登録処理を可能に
してデータ圧縮／復元処理を高速化できるようにした、
データ圧縮方法及びデータ復元方法並びにデータ圧縮装
置及びデータ復元装置を提供することを目的とする。

【００２４】

【課題を解決するための手段】このため、本発明のデー
タ圧縮方法は、入力データを過去に出現した履歴に応じ
て符号化して圧縮するデータ圧縮方法において、次のよ
うな過程をとることを特徴としている（請求項１）。（１）入力データとそれまでに連続したｎ個のデータか
らなる文脈との組み合わせを保持する文脈収集過程。（２）文脈毎に独立した符号木を保持する符号木保持過
程。（３）文脈収集過程の文脈に該当したデータが出現した
とき、符号木の頂点を意味するルートから符号木上のデ
ータが格納されている点としてのリーフまでの分岐点と
してのノードの分岐に応じた固有のデータとして定義さ
れる符号を出力する符号出力過程。（４）符号出力過程での処理の後、データのリーフと他
データのリーフあるいはノードとを組み替える符号長変
更過程。

【００２５】さらに、本発明のデータ圧縮方法は、入力
データを過去に出現した履歴に応じて符号化して圧縮す
るデータ圧縮方法において、次のような過程をとること
を特徴としている（請求項２）。（１）入力データとそれまでに連続したｎ個のデータか
らなる文脈との組み合わせを保持する文脈収集過程。（２）文脈毎に独立した符号木を保持する符号木保持過
程。（３）文脈収集過程の文脈に該当したデータが出現した
とき、符号木の頂点を意味するルートから符号木上のデ
ータが格納されている点としてのリーフまでの分岐点と
してのノードの分岐に応じた固有のデータとして定義さ
れる符号を出力する符号出力過程。（４）符号出力過程での処理の後、データのリーフと他
データのリーフあるいはノードとを組み替える符号長変
更過程。（５）入力データと文脈との組み合わせが文脈収集過程
に保持されているか否かを判別する文脈判別過程。（６）予めデータ未登録を示すデータとして定義される
エスケープコードを登録したリーフを符号木に保持する
エスケープコード保持過程。（７）入力データと文脈との組み合わせが文脈収集過程
の履歴に保持されていない組み合わせであったとき、エ
スケープコードを出力し、文脈収集過程に保持されてい
る組み合わせが得られるまで、データの文脈を短くする
処理を繰り返す過程。

【００２６】また、本発明のデータ圧縮方法は、入力デ
ータを過去に出現した履歴に応じて符号化して圧縮する
データ圧縮方法において、次のような過程をとることを
特徴としている（請求項３）。（１）入力データとそれまでに連続したｎ個のデータか
らなる文脈との組み合わせを保持する文脈収集過程。（２）文脈毎に独立した符号木を保持する符号木保持過
程。（３）文脈収集過程の文脈に当したデータが出現したと
き、符号木の頂点を意味するルートから符号木上のデー
タが格納されている点としてのリーフまでの分岐点とし
てのノードの分岐に応じた固有のデータとして定義され
る符号を出力する符号出力過程。（４）符号出力過程での処理の後、データのリーフと他
データのリーフあるいはノードとを組み替える符号長変
更過程。（５）入力データと文脈との組み合わせが文脈収集過程
に保持されているか否かを判別する文脈判別過程。（６）予めデータ未登録を示すデータとして定義される
エスケープコードを登録したリーフを符号木に保持する
エスケープコード保持過程。（７）入力データと文脈との組み合わせが文脈収集過程
の履歴に保持されていない組み合わせであったとき、入
力データと文脈との組み合わせを文脈収集過程に新規に
登録する文脈新規登録過程。（８）入力データと文脈との組み合わせが文脈収集過程
の履歴に保持されていない組み合わせであったとき、デ
ータを文脈に対応した符号木に新規に登録する符号木新
規登録過程。（９）入力データと文脈との組み合わせが文脈収集過程
の履歴に保持されていない組み合わせであったとき、エ
スケープコードの符号を出力すると同時に、入力データ
と文脈との組み合わせを履歴に登録するとともに、デー
タを文脈に対応した符号木に登録し、文脈収集過程に保
持されている組み合わせが得られるまでデータの文脈を
短くする処理を繰り返す過程。

【００２７】さらに、本発明のデータ圧縮方法は、入力
データを過去に出現した履歴に応じて符号化して圧縮す
るデータ圧縮方法において、次のような過程をとること
を特徴としている（請求項４）。（１）入力データとそれまでに連続したｎ個のデータか
らなる文脈との組み合わせを保持する文脈収集過程。（２）文脈毎に独立した符号木を保持する符号木保持過
程。（３）文脈収集過程の文脈に該当したデータが出現した
とき、符号木の頂点を意味するルートから符号木上のデ
ータが格納されている点としてのリーフまでの分岐点と
してのノードの分岐に応じた固有のデータとして定義さ
れる符号を出力する符号出力過程。（４）符号出力過程での処理の後、データのリーフと他
データのリーフあるいはノードとを組み替える符号長変
更過程。（５）入力データと文脈との組み合わせが文脈収集過程
に保持されているか否かを判別する文脈判別過程。（６）予めデータ未登録を示すデータとして定義される
エスケープコードを登録したリーフを符号木に保持する
エスケープコード保持過程。（７）入力データと文脈との組み合わせが文脈収集過程
の履歴に保持されていない組み合わせであったとき、入
力データと文脈との組み合わせを文脈収集過程に新規に
登録する文脈新規登録過程。（８）入力データと文脈との組み合わせが文脈収集過程
の履歴に保持されていない組み合わせであったとき、デ
ータを文脈に対応した符号木に新規に登録する符号木新
規登録過程。（９）文脈新規登録過程及び符号木新規登録過程におい
ては、履歴にあると判断された直前の文脈とデータとの
組み合わせのみを登録する過程。

【００２８】一方、本発明のデータ復元方法は、入力デ
ータを過去の入力データの履歴に応じて符号化した符号
データを復元するデータ復元方法において、次のような
過程をとることを特徴としている（請求項５）。（１）復号データと文脈との組み合わせの履歴を保持す
る文脈収集過程。（２）文脈に応じておのおの独立した符号木を保持する
符号木保持過程。（３）直前までに復号したデータの文脈からデータの符
号木を決定する符号木決定過程。（４）符号木決定過程で決定した符号木とデータの符号
からデータを復号する復号過程。（５）復号過程の復号の後に、符号化側と同一の手段
で、符号木上のデータ格納点としてのリーフ間又はリー
フと符号木の分岐点としてのノードとを組み替える符号
長変更過程。

【００２９】また、本発明のデータ復元方法は、入力デ
ータを過去の入力データの履歴に応じて符号化した符号
データを復元するデータ復元方法において、次のような
過程をとることを特徴としている（請求項６）。（１）復号データと文脈との組み合わせの履歴を保持す
る文脈収集過程。（２）文脈に応じておのおの独立した符号木を保持する
符号木保持過程。（３）直前までに復号したデータの文脈からデータの符
号木を決定する符号木決定過程。（４）符号木決定過程で決定した符号木とデータの符号
からデータを復号する復号過程。（５）復号過程の復号の後に、符号化側と同一の手段
で、符号木上のデータ格納点としてのリーフ間又はリー
フと符号木の分岐点としてのノードとを組み替える符号
長変更過程。（６）符号木にはそれぞれの文脈に応じた符号木毎に予
めデータ未登録を示すデータとして定義されるエスケー
プコードを登録し、復号時にエスケープコードを復号し
た場合、エスケープコード以外が復号されるまで、文脈
の長さを短くする処理を繰り返す過程。

【００３０】さらに、本発明のデータ復元方法は、入力
データを過去の入力データの履歴に応じて符号化した符
号データを復元するデータ復元方法において、次のよう
な過程をとることを特徴としている（請求項７）。（１）復号データと文脈との組み合わせの履歴を保持す
る文脈収集過程。（２）文脈に応じておのおの独立した符号木を保持する
符号木保持過程。（３）直前までに復号したデータの文脈からデータの符
号木を決定する符号木決定過程。（４）符号木決定過程で決定した符号木とデー
タの符号からデータを復号する復号過程。（５）復号過程の復号の後に、符号化側と同一の手段
で、符号木上のデータ格納点としてのリーフ間又はリー
フと符号木の分岐点としてのノードとを組み替える符号
長変更過程。（６）文脈収集過程にデータを新規に登録する文脈新規
登録過程。（７）復号したデータを文脈に応じた符号木に新規に登
録する符号木新規登録過程。（８）データ未登録を示すデータとして定義されるエス
ケープコードを復号したとき、文脈新規登録過程及び符
号木新規登録過程を実行して、エスケープコード以外が
復号されるまで、文脈の長さを短くする処理を繰り返す
過程。

【００３１】また、本発明のデータ復元方法は、入力デ
ータを過去の入力データの履歴に応じて符号化した符号
データを復元するデータ復元方法において、次のような
過程をとることを特徴としている（請求項８）。（１）復号データと文脈との組み合わせの履歴を保持す
る文脈収集過程。（２）文脈に応じておのおの独立した符号木を保持する
符号木保持過程。（３）直前までに復号したデータの文脈からデータの符
号木を決定する符号木決定過程。（４）符号木決定過程で決定した符号木とデータの符号
からデータを復号する復号過程。（５）復号過程の復号の後に、符号化側と同一の手段
で、符号木上のデータ格納点としてのリーフ間又はリー
フと符号木の分岐点としてのノードとを組み替える符号
長変更過程。（６）文脈収集過程にデータを新規に登録する文脈新規
登録過程。（７）復号したデータを文脈に応じた符号木に新規に登
録する符号木新規登録過程。（８）データ未登録を示すデータとして定義されるエス
ケープコード以外が復号されるまでの処理において、エ
スケープコードを一つでも復号した時、エスケープコー
ド以外を復号した直前の文脈においてのみ、文脈新規登
録過程および符号木新規登録過程での各新規登録処理を
行なう過程。

【００３２】さらに、請求項１に記載の本発明のデータ
圧縮方法を実施するための装置の構成を、図１の原理ブ
ロック図に示す。この図１に示すデータ圧縮装置は、入
力データを過去に出現した履歴に応じて符号化して圧縮
するものである。ここで、１００は前置データ保持手
段、１０１は履歴保持手段、１０２は符号木保持手段、
１０３は符号木決定手段、１０４は符号出力手段、１０
５は符号長変更手段、１０６は前置データ更新手段であ
る。

【００３３】前置データ保持手段１００は、入力データ
の直前までに入力されたｎ個の入力データからなる文脈
を保持するものであり、履歴保持手段１０１は、入力デ
ータと文脈との組み合わせを保持するものであり、符号
木保持手段１０２は、文脈毎に独立した符号木を保持す
るものである。また、符号木決定手段１０３は、前置デ
ータ保持手段１００に保持されている直前までの入力デ
ータからデータの符号木を決定するものであり、符号出
力手段１０４は、符号木決定手段１０３で選択した符号
木の頂点を意味するルートからデータが格納されている
リーフに沿って途中に位置する分岐点としてのノードか
らの分岐に従って固有のデータを出力するものである。

【００３４】さらに、符号長変更手段１０５は、符号化
したリーフと他のリーフあるいはノードとを組み替える
ものであり、前置データ更新手段１０６は、データを前
置データ保持手段１００に登録するものである（以上、
請求項９）。また、請求項２に記載の本発明のデータ圧
縮方法を実施するための装置の構成を、図２の原理ブロ
ック図に示す。この図２に示すデータ圧縮装置も、入力
データを過去に出現した履歴に応じて符号化して圧縮す
るものである。

【００３５】ここで、１００は前置データ保持手段、１
０１は履歴保持手段、１０３は符号木決定手段、１０７
は符号木決定手段である。さらに、１０８は文脈判別手
段、１０９はエスケープコード出力手段、１１０は文脈
変更手段、１１１は符号出力手段、１１６は制御手段で
ある。前置データ保持手段１００は、入力データの直前
までに入力されたｎ個の入力データからなる文脈を保持
するものであり、履歴保持手段１０１は、入力データと
文脈との組み合わせを保持するものであり、符号木保持
手段１０７は、データ未登録を示すデータとして定義さ
れるエスケープコードをあらかじめ登録した文脈毎に独
立した符号木を保持するものである。

【００３６】また、符号木決定手段１０３は、文脈と入
力データからデータの符号木を決定するものであり、文
脈判別手段１０８は、符号木決定手段１０３で決定した
符号木にデータが登録されているか否かを判別するもの
であり、エスケープコード出力手段１０９は、符号木に
データが登録されていないときは符号木の頂点を意味す
るルートからエスケープコードのデータ格納点としての
リーフまでの途中に位置する分岐点としてのノードから
の分岐に従ってエスケープコードを出力するものであ
る。

【００３７】さらに、文脈変更手段１１０は、符号木に
データが登録されていないときは文脈の長さｎを短くす
るものであり、符号出力手段１１１は、符号木にデータ
が登録されているときは符号木のルートからデータのリ
ーフまでの途中に位置するノードからの分岐に従ってデ
ータの符号を出力するものである。また、符号長変更手
段１０５は、符号化したリーフと他のリーフあるいはノ
ードとを組み換えるものであり、前置データ更新手段１
０６は、データを前置データ保持手段１００に登録する
ものであり、制御手段１１６は、エスケープコードを符
号化したときはデータの符号化を行なうまで処理を繰り
返すものである（以上、請求項１０）。

【００３８】また、請求項３に記載の本発明のデータ圧
縮方法を実施するための装置の構成を、図３の原理ブロ
ック図に示す。この図３に示すデータ圧縮装置も、入力
データを過去に出現した履歴に応じて符号化して圧縮す
るものである。ここで、１００は前置データ保持手段、
１０１は履歴保持手段、１０３は符号木決定手段、１０
５は符号長変更手段、１０６は前置データ更新手段、１
０７は符号木保持手段、１０８は文脈判別手段、１０９
はエスケープコード出力手段、１１０は文脈変更手段、
１１１は符号出力手段、１１２は履歴登録手段、１１３
は符号登録手段、１１６は制御手段である。

【００３９】前置データ保持手段１００は、入力データ
の直前までに入力されたｎ個の入力データからなる文脈
を保持するものであり、履歴保持手段１０１は、入力デ
ータと文脈との組み合わせを保持するものであり、符号
木保持手段１０７は、データ未登録を示すデータとして
定義されるエスケープコードを予め登録した文脈毎に独
立した符号木を保持するものである。

【００４０】また、符号木決定手段１０３は、文脈と入
力データからデータの符号木を決定するものであり、文
脈判別手段１０８は、符号木決定手段１０３で決定した
符号木にデータが登録されているか否かを判別するもの
である。さらに、エスケープコード出力手段１０９は、
符号木にデータが登録されていないときは符号木の頂点
を意味するルートからエスケープコードのデータ格納点
としてのリーフまでの中に位置する分岐点としてのノー
ドからの分岐に従ってエスケープコードを出力するもの
である。

【００４１】また、履歴登録手段１１２は、符号木にデ
ータが登録されていないときは履歴保持手段１０１にデ
ータと文脈の組み合わせを登録するものであり、符号登
録手段１１３は、符号木にデータが登録されていないと
きは符号木にデータを新規に登録するものであり、文脈
変更手段１１０は、符号木にデータが登録されていない
ときは文脈の長さｎを短くするものである。

【００４２】さらに、符号出力手段１１１は、符号木に
データが登録されているときは符号木のルートからデー
タのリーフまでの途中に位置するノードからの分岐に従
ってデータの符号を出力するものであり、符号長変更手
段１０５は、符号化したリーフと他のリーフあるいはノ
ードとを組み換えるものである。また、前置データ更新
手段１０６は、データを前置データ保持手段１００に登
録するものであり、制御手段１１６は、エスケープコー
ドを符号化したときはデータの符号化を行なうまで処理
を繰り返すものである（以上、請求項１１）。

【００４３】さらに、請求項４に記載の本発明のデータ
圧縮方法を実施するための装置の構成を、図４の原理ブ
ロック図に示す。この図４に示すデータ圧縮装置も、入
力データを過去に出現した履歴に応じて符号化して圧縮
するものである。ここで、１００は前置データ保持手
段、１０１は履歴保持手段、１０３は符号木決定手段、
１０５は符号長変更手段、１０６は前置データ更新手
段、１０７は符号木保持手段、１０８は文脈判別手段、
１０９および１１１はエスケープコード出力手段、１１
０は文脈変更手段、１１４は履歴登録手段、１１５は符
号登録手段、１１７は制御手段である。

【００４４】前置データ保持手段１００は、入力データ
の直前までに入力されたｎ個の入力データからなる文脈
を保持するものであり、履歴保持手段１０１は、入力デ
ータと文脈との組み合わせを保持するものであり、符号
木保持手段１０７は、データ未登録を示すデータとして
定義されるエスケープコードをあらかじめ登録した文脈
毎に独立した符号木を保持するものである。

【００４５】また、符号木決定手段１０３は、文脈と入
力データからデータの符号木を決定するものであり、文
脈判別手段１０８は、符号木決定手段１０３で決定した
符号木にデータが登録されているか否かを判別するもの
である。さらに、エスケープコード出力手段１０９は、
符号木にデータが登録されていないときは符号木の頂点
を意味するルートからエスケープコードのデータ格納点
としてのリーフまでの途中に位置する分岐点としてのノ
ードからの分岐に従ってエスケープコードを出力するも
のである。

【００４６】また、文脈変更手段１１０は、符号木にデ
ータが登録されていないときは文脈の長さｎを短くする
ものであり、エスケープコード出力手段１１１は、符号
木にデータが登録されているときは符号木のルートから
データのリーフまでの途中に位置するノードからの分岐
にしたがってデータの符号を出力するものである。さら
に、履歴登録手段１１４は、履歴保持手段１０１にデー
タと文脈の組み合わせを登録するものであり、符号登録
手段１１５は、符号木にデータを新規に登録するもので
あり、符号長変更手段１０５は、符号化したリーフと他
のリーフあるいはノードとを組み換えるものであり、前
置データ更新手段１０６は、データを前置データ保持手
段１００に登録するものである。

【００４７】また、制御手段１１７は、データの符号化
時に一度でもエスケープコードを符号化したときは、デ
ータの符号化の直前の文脈とデータとの組み合わせを履
歴登録手段１１４で履歴保持手段１０１に登録し、デー
タの符号化の直前に符号化したエスケープコードを持つ
符号木に符号登録手段１１５でデータを新規に登録する
ものである（以上、請求項１２）。

【００４８】一方、請求項５に記載の本発明のデータ復
元方法を実施するための装置の構成を、図５の原理ブロ
ック図に示す。この図５に示すデータ復元装置は、過去
に出現した履歴に応じて符号化した符号を復号するもの
である。ここで、２００は前置データ保持手段、２０１
は履歴保持手段、２０２は符号木保持手段、２０３は符
号木決定手段、２０４は復号手段、２０５は符号長変更
手段、２０６は前置データ更新手段である。

【００４９】前置データ保持手段２００は、過去に復号
したｎ個のデータを保持するものであり、履歴保持手段
２０１は、復号したデータと文脈との組み合わせを保持
するものであり、符号木保持手段２０２は、文脈毎に独
立した符号木を保持するものである。また、符号木決定
手段２０３は、前置データ保持手段２００に保持されて
いる文脈からデータを復号するための符号木を決定する
ものであり、復号手段２０４は、符号に従って符号木決
定手段２０３で選択した符号木の頂点を意味するルート
から分岐点としてのノードを走査して到達したデータ格
納点としてのリーフに格納されているデータを出力する
ものである。

【００５０】さらに、符号長変更手段２０５は、復号し
たリーフと他のリーフあるいはノードとを組み替えるも
のであり、前置データ更新手段２０６は、復号したデー
タを前置データ保持手段２００に登録するものである
（以上、請求項１３）。また、請求項６に記載の本発明
のデータ復元方法を実施するための装置の構成を、図６
の原理ブロック図に示す。この図６に示すデータ復元装
置も、過去に出現した履歴に応じて符号化した符号を復
号するものである。

【００５１】ここで、２００は前置データ保持手段、２
０１は履歴保持手段、２０３は符号木決定手段、２０４
は復号手段、２０５は符号長変更手段、２０６は前置デ
ータ更新手段、２０７は符号木保持手段、２０８は文脈
変更手段、２１３は制御手段である。前置データ保持手
段２００は、過去に復号したｎ個のデータを保持するも
のであり、履歴保持手段２０１は、復号したデータと文
脈との組み合わせを保持するものであり、符号木保持手
段２０７は、データ未登録を示すデータとして定義され
るエスケープコードをあらかじめ登録した符号木を保持
するものである。

【００５２】また、符号木決定手段２０３は、前置デー
タ保持手段２００に保持されている文脈からデータを復
号するための符号木を決定するものであり、復号手段２
０４は、符号に従って符号木決定手段２０３で選択した
符号木の頂点を意味するルートから分岐点としてのノー
ドを走査して到達したデータ格納点としてのリーフに格
納されているデータを出力するものである。

【００５３】さらに、符号長変更手段２０５は、復号し
たリーフと他のリーフあるいはノードとを組み替えるも
のであり、文脈変更手段２０８は−出力したデータがエ
スケープコードであったときデータを棄却し文脈を短く
するものであり、前置データ更新手段２０６は、復号し
たデータを前置データ保持手段２００に登録するもので
ある。

【００５４】制御手段２１３は、エスケープコードを復
号した時は文脈変更手段２０８で文脈を再設定し、エス
ケープコード以外が復号されるまで処理を繰り返すもの
である（以上、請求項１４）。さらに、請求項７に記載
の本発明のデータ復元方法を実施するための装置の構成
を、図７の原理ブロック図に示す。この図７に示すデー
タ復元装置も、過去に出現した履歴に応じて符号化した
符号を復号するものである。

【００５５】ここで、２００は前置データ保持手段、２
０１は履歴保持手段、２０３は符号木決定手段、２０４
は復号手段、２０５は符号長変更手段、２０６は前置デ
ータ更新手段、２０７は符号木保持手段、２０８は文脈
変更手段、２０９は履歴登録手段、２１０は符号登録手
段、２１３は制御手段である。前置データ保持手段２０
０は、過去に復号したｎ個のデータを保持するものであ
り、履歴保持手段２０１は、復号したデータと文脈との
組み合わせを保持するものであり、符号木保持手段２０
７は、エスケープコードをあらかじめ登録した符号木を
保持するものである。

【００５６】また、符号木決定手段２０３は、前置デー
タ保持手段２００に保持されている文脈からデータを復
号するための符号木を決定するものであり、復号手段２
０４は、符号に従って符号木決定手段２０３で選択した
符号木の頂点を意味するルートから分岐点としてのノー
ドを走査して到達したデータ格納点としてのリーフに格
納されているデータを出力するものである。

【００５７】さらに、符号長変更手段２０５は、復号し
たリーフと他のリーフあるいはノードとを組み替えるも
のであり、文脈変更手段２０８は、出力したデータが上
記エスケープコードであったとき、上記データを棄却し
文脈を短くするものである。また、前置データ更新手段
２０６は、復号したデータを前置データ保持手段２００
に登録するものであり、履歴登録手段２０９は、データ
の復号処理でエスケープコードを復号したときの全ての
文脈と復号したデータとを履歴保持手段２０１に登録す
るものである。

【００５８】また、符号登録手段２１０は、データの復
号処理でエスケープコードを復号した時の文脈に対応し
た全ての符号木にデータの符号を登録するものであり、
制御手段２１３は、エスケープコードを復号した時は文
脈変更手段２０８で文脈を再設定し、エスケープコード
以外が復号されるまで処理を繰り返すものである（以
上、請求項１５）。

【００５９】また、請求項８に記載の本発明のデータ復
元方法を実施するための装置の構成を、図８の原理ブロ
ック図に示す。この図８に示すデータ復元装置も、過去
に出現した履歴に応じて符号化した符号を復号するもの
である。ここで、２００は前置データ保持手段、２０１
は履歴保持手段、２０３は符号木決定手段、２０４は復
号手段、２０５は符号長変更手段、２０６は前置データ
更新手段、２０７は符号木保持手段、２０８は文脈変更
手段、２１２は符号登録手段、２１３は制御手段であ
る。

【００６０】前置データ保持手段２００は、過去に復号
したｎ個のデータを保持するものであり、履歴保持手段
２０１は、復号したデータと文脈との組み合わせを保持
するものであり、符号木保持手段２０７は、データ未登
録を示すデータとして定義されるエスケープコードをあ
らかじめ登録した符号木を保持するものである。また、
符号木決定手段２０３は、前置データ保持手段２００に
保持されている文脈からデータを復号するための符号木
を決定するものであり、復号手段２０４は、符号に従っ
て符号木決定手段２０３で選択した符号木の頂点を意味
するルートから分岐点としてのノードを走査して到達し
たデータ格納点としてのリーフに格納されているデータ
を出力するものである。

【００６１】さらに、符号長変更手段２０５は、復号し
たリーフと他のリーフあるいはノードとを組み替えるも
のであり、文脈変更手段２０８は、出力したデータがエ
スケープコードであったときデータを棄却し文脈を短く
するものであり、前置データ更新手段２０６は、復号し
たデータを前置データ保持手段２００に登録するもので
ある。

【００６２】また、履歴登録手段２１１は、データの復
号処理でエスケープコードを最後に復号した時の文脈と
復号したデータとを履歴保持手段２０１に登録するもの
であり、符号登録手段２１２は、データの復号処理で最
後にエスケープコードを復号した時の文脈に対応した符
号木にデータの符号を登録するものであり、制御手段２
１３は、エスケープコードを復号した時は文脈変更手段
２０８で文脈を再設定し、エスケープコード以外が復号
されるまで処理を繰り返すものである（以上、請求項１
６）。

【００６３】ここで、上述した本発明のデータ圧縮方法
では、次のような作用がある（請求項１）。（１）文脈収集過程により、入力データとそれまでに連
続したｎ個のデータからなる文脈との組み合わせを保持
することができる。（２）符号木保持過程により、文脈毎に独立した符号木
を保持することができる。（３）符号出力過程により、文脈収集過程の文脈に該当
したデータが出現したとき、符号木の頂点を意味するル
ートから符号木上のデータが格納されている点としての
リーフまでの分岐点としてのノードの分岐に応じた固有
のデータとして定義される符号を出力することができ
る。（４）符号長変更過程により、符号出力過程での処理の
後、データのリーフと他データのリーフあるいはノード
とを組み替えることができる。

【００６４】さらに、本発明のデータ圧縮方法では、次
のような作用がある（請求項２）。（１）文脈収集過程により、入力データとそれまでに連
続したｎ個のデータからなる文脈との組み合わせを保持
することができる。（２）符号木保持過程により、文脈毎に独立した符号木
を保持することができる。（３）符号出力過程により、文脈収集過程の文脈に該当
したデータが出現したとき、符号木の頂点を意味するル
ートから符号木上のデータが格納されている点としての
リーフまでの分岐点としてのノードの分岐に応じた固有
のデータとして定義される符号を出力することができ
る。（４）符号長変更過程により、符号出力過程での処理の
後、データのリーフと他データのリーフあるいはノード
とを組み替えることができる。（５）文脈判別過程により、入力データと文脈との組み
合わせが文脈収集過程に保持されているか否かを判別す
ることができる。（６）エスケープコード保持過程により、予めデータ未
登録を示すデータとして定義されるエスケープコードを
登録したリーフを符号木に保持することができる。（７）入力データと文脈との組み合わせが文脈収集過程
（１）の履歴に保持されていない組み合わせであったと
き、エスケープコードを出力し、文脈収集過程に保持さ
れている組み合わせが得られるまで、データの文脈を短
くする処理を繰り返すことができる。

【００６５】また、本発明のデータ圧縮方法では、次の
ような作用がある（請求項３）。（１）文脈収集過程により、入力データとそれまでに連
続したｎ個のデータからなる文脈との組み合わせを保持
することができる。（２）符号木保持過程により、文脈毎に独立した符号木
を保持することができる。（３）符号出力過程により、文脈収集過程の文脈に該当
したデータが出現したとき、符号木の頂点を意味するル
ートから符号木上のデータが格納されている点としての
リーフまでの分岐点としてのノードの分岐に応じた固有
のデータとして定義される符号を出力することができ
る。（４）符号長変更過程により、符号出力過程での処理の
後、データのリーフと他データのリーフあるいはノード
とを組み替えることができる。（５）文脈判別過程により、入力データと文脈との組み
合わせが文脈収集過程に保持されているか否かを判別す
ることができる。（６）エスケープコード保持過程により、予めデータ未
登録を示すデータとして定義されるエスケープコードを
登録したリーフを符号木に保持することができる。（７）文脈新規登録過程により、入力データと文脈との
組み合わせが文脈収集過程の履歴に保持されていない組
み合わせであったとき、この入力データと文脈との組み
合わせを文脈収集過程に新規に登録することができる。（８）符号木新規登録過程により、入力データと文脈と
の組み合わせが文脈収集過程の履歴に保持されていない
組み合わせであったとき、このデータを文脈に対応した
符号木に新規に登録することができる。（９）入力データと文脈との組み合わせが文脈収集過程
の履歴に保持されていない組み合わせであったとき、エ
スケープコードの符号を出力すると同時に、この入力デ
ータと文脈との組み合わせを履歴に登録するとともに、
データを文脈に対応した符号木に登録し、文脈収集過程
に保持されている組み合わせが得られるまでデータの文
脈を短くする処理を繰り返すことができる。

【００６６】さらに、本発明のデータ圧縮方法では、次
のような作用がある（請求項４）。（１）文脈収集過程により、入力データとそれまでに連
続したｎ個のデータからなる文脈との組み合わせを保持
することができる。（２）符号木保持過程により、文脈毎に独立した符号木
を保持することができる。（３）符号出力過程により、文脈収集過程の文脈に該当
したデータが出現したとき、符号木の頂点を意味するル
ートから符号木上のデータが格納されている点としての
リーフまでの分岐点としてのノードの分岐に応じた固有
のデータとして定義される符号を出力することができ
る。（４）符号長変更過程により、符号出力過程での処理の
後、データのリーフと他データのリーフあるいはノード
とを組み替えることができる。（５）文脈判別過程により、入力データと文脈との組み
合わせが文脈収集過程に保持されているか否かを判別す
ることができる。（６）エスケープコード保持過程により、予めデータ未
登録を示すデータとして定義されるエスケープコードを
登録したリーフを符号木に保持することができる。（７）文脈新規登録過程により、入力データと文脈との
組み合わせが文脈収集過程の履歴に保持されていない組
み合わせであったとき、この入力データと文脈との組み
合わせを文脈収集過程に新規に登録することができる。（８）符号木新規登録過程により、入力データと文脈と
の組み合わせが文脈収集過程の履歴に保持されていない
組み合わせであったとき、データを文脈に対応した符号
木に新規に登録することができる。（９）上述の（７）の文脈新規登録過程及び（８）の符
号木新規登録過程においては、履歴にあると判断された
直前の文脈とデータとの組み合わせのみを登録すること
ができる一方、本発明のデータ復元方法では、次のよう
な作用がある（請求項５）。（１）文脈収集過程により、復号データと文脈との組み
合わせの履歴を保持することができる。（２）符号木保持過程により、文脈に応じておのおの独
立した符号木を保持することができる。（３）符号木決定過程により、直前までに復号したデー
タの文脈からデータの符号木を決定することができる。（４）復号過程により、符号木決定過程で決定した符号
木とデータの符号からデータを復号することができる。（５）符号長変更過程により、復号過程の復号の後に、
符号化側と同一の手段で、符号木上のデータ格納点とし
てのリーフ間又はリーフと符号木の分岐点としてのノー
ドとを組み替えることができる。

【００６７】さらに、本発明のデータ復元方法では、次
のような作用がある（請求項６）。（１）文脈収集過程により、復号データと文脈との組み
合わせの履歴を保持することができる。（２）符号木保持過程により、文脈に応じておのおの独
立した符号木を保持することができる。（３）符号木決定過程により、直前までに復号したデー
タの文脈からデータの符号木を決定することができる。（４）復号過程により、符号木決定過程で決定した符号
木とデータの符号からデータを復号することができる。（５）符号長変更過程により、復号過程の復号の後に、
符号化側と同一の手段で、符号木上のデータ格納点とし
てのリーフ間又はリーフと符号木の分岐点としてのノー
ドとを組み替えることができる。（６）符号木にはそれぞれの文脈に応じた符号木毎に予
めデータ未登録を示すデータとして定義されるエスケー
プコードを登録し、復号時にエスケープコードを復号し
た場合、エスケープコード以外が復号されるまで、文脈
の長さを短くする処理を繰り返すことができる。

【００６８】また、本発明のデータ復元方法では、次の
ような作用がある（請求項７）。（１）文脈収集過程により、復号データと文脈との組み
合わせの履歴を保持することができる。（２）符号木保持過程により、文脈に応じておのおの独
立した符号木を保持することができる。（３）符号木決定過程により、直前までに復号したデー
タの文脈からデータの符号木を決定することができる。（４）復号過程により、符号木決定過程で決定した符号
木とデータの符号からデータを復号することができる。（５）符号長変更過程により、復号過程の復号の後に、
符号化側と同一の手段で、符号木上のデータ格納点とし
てのリーフ間又はリーフと符号木の分岐点としてのノー
ドとを組み替えることができる。（６）文脈新規登録過程により、文脈収集過程にデータ
を新規に登録することができる。（７）符号木新規登録過程により、復号したデータを文
脈に応じた符号木に新規に登録することができる（８）データ未登録を示すデータとして定義されるエス
ケープコードを復号したとき、上述の（６）の文脈新規
登録過程及び（７）の符号木新規登録過程を実行して、
エスケープコード以外が復号されるまで、文脈の長さを
短くする処理を繰り返すことができる。

【００６９】さらに、本発明のデータ復元方法では、次
のような作用がある（請求項８）。（１）文脈収集過程により、復号データと文脈との組み
合わせの履歴を保持することができる。（２）符号木保持過程により、文脈に応じておのおの独
立した符号木を保持することができる。（３）符号木決定過程により、直前までに復号したデー
タの文脈からデータの符号木を決定することができる。（４）復号過程により、符号木決定過程で決定した符号
木とデータの符号からデータを復号することができる。（５）符号長変更過程により、復号過程の復号の後に、
符号化側と同一の手段で、符号木上のデータ格納点とし
てのリーフ間又はリーフと符号木の分岐点としてのノー
ドとを組み替えることができる。（６）文脈新規登録過程により、文脈収集過程にデータ
を新規に登録することができる。（７）符号木新規登録過程により、復号したデータを文
脈に応じた符号木に新規に登録することができる。（８）データ未登録を示すデータとして定義されるエス
ケープコード以外が復号されるまでの処理において、エ
スケープコードを一つでも復号した時、エスケープコー
ド以外を復号した直前の文脈においてのみ、文脈新規登
録過程および符号木新規登録過程での各新規登録処理を
行なうことができる。

【００７０】また、図１を用いて説明した構成をもつ、
請求項１記載の本発明のデータ圧縮方法を実施するため
の装置、すなわち入力データを過去に出現した履歴に応
じて符号化して圧縮するデータ圧縮装置においては、前
置データ保持手段１００が、入力データの直前までに入
力されたｎ個の入力データからなる文脈を保持し、履歴
保持手段１０１が、入力データと文脈との組み合わせを
保持し、符号木保持手段１０２が、文脈毎に独立した符
号木を保持する。

【００７１】そして、符号木決定手段１０３が、前置デ
ータ保持手段１００に保持されている直前までの入力デ
ータからデータの符号木を決定し、符号出力手段１０４
が、符号木決定手段１０３で選択した符号木の頂点を意
味するルートからデータが格納されているリーフに沿っ
て途中に位置する分岐点としてのノードからの分岐に従
って固有のデータを出力する。

【００７２】さらに、符号長変更手段１０５が、符号化
したリーフと他のリーフあるいはノードとを組み替え、
前置データ更新手段１０６が、データを前置データ保持
手段１００に登録することができる（請求項９）。次
に、図２を用いて説明した構成をもつ、請求項２に記載
の本発明のデータ圧縮方法を実施するための装置、すな
わち入力データを過去に出現した履歴に応じて符号化し
て圧縮するデータ圧縮装置においては、前置データ保持
手段１００が、入力データの直前までに入力されたｎ個
の入力データからなる文脈を保持し、履歴保持手段１０
１が、入力データと文脈との組み合わせを保持し、符号
木保持手段１０７が、データ未登録を示すデータとして
定義されるエスケープコードをあらかじめ登録した文脈
毎に独立した符号木を保持する。

【００７３】そして、符号木決定手段１０３が、文脈と
入力データからデータの符号木を決定し、文脈判別手段
１０８が、符号木決定手段１０３で決定した符号木にデ
ータが登録されているか否かを判別し、エスケープコー
ド出力手段１０９が、符号木にデータが登録されていな
いときは符号木の頂点を意味するルートからエスケープ
コードのデータ格納点としてのリーフまでの途中に位置
する分岐点としてのノードからの分岐に従ってエスケー
プコードを出力する。

【００７４】さらに、文脈変更手段１１０が、符号木に
データが登録されていないときは文脈の長さｎを短く
し、符号出力手段１１１が、符号木にデータが登録され
ているときは符号木のルートからデータのリーフまでの
途中に位置するノードからの分岐に従ってデータの符号
を出力し、符号長変更手段１０５が、符号化したリーフ
と他のリーフあるいはノードとを組み換える。

【００７５】そして、前置データ更新手段１０６が、デ
ータを前置データ保持手段１００に登録し、制御手段１
１６が、エスケープコードを符号化したときはデータの
符号化を行なうまで処理を繰り返す（以上、請求項１
０）。次に、図３を用いて説明した構成をもつ、請求項
３記載の本発明のデータ圧縮方法を実施するための装
置、すなわち入力データを過去に出現した履歴に応じて
符号化して圧縮するデータ圧縮装置においては、前置デ
ータ保持手段１００が、入力データの直前までに入力さ
れたｎ個の入力データからなる文脈を保持し、履歴保持
手段１０１が、入力データと文脈との組み合わせを保持
し、符号木保持手段１０７が、データ未登録を示すデー
タとして定義されるエスケープコードを予め登録した文
脈毎に独立した符号木を保持する。

【００７６】そして、符号木決定手段１０３が、文脈と
入力データからデータの符号木を決定し、文脈判別手段
１０８が、符号木決定手段１０３で決定した符号木にデ
ータが登録されているか否かを判別し、エスケープ出力
手段１０９が、符号木にデータが登録されていないとき
は符号木の頂点を意味するルートからエスケープコード
のデータ格納点としてのリーフまでの中に位置する分岐
点としてのノードからの分岐に従ってエスケープコード
を出力する。

【００７７】さらに、履歴登録手段１１２が、符号木に
データが登録されていないときは履歴保持手段１０１に
データと文脈の組み合わせを登録し、符号登録手段１１
３が、符号木にデータが登録されていないときは符号木
にデータを新規に登録し、文脈変更手段１１０が、符号
木にデータが登録されていないときは文脈の長さｎを短
くし、符号出力手段１１１が、符号木にデータが登録さ
れているときは符号木のルートからデータのリーフまで
の途中に位置するノードからの分岐に従ってデータの符
号を出力する。

【００７８】そして、符号長変更手段１０５が、符号化
したリーフと他のリーフあるいはノードとを組み換え、
前置データ更新手段１０６が、データを前置データ保持
手段１００に登録し、制御手段１１６が、エスケープコ
ードを符号化したときはデータの符号化を行なうまで処
理を繰り返す（以上、請求項１１）。次に、図４を用い
て説明した構成をもつ、請求項４に記載の本発明のデー
タ圧縮方法を実施するための装置、すなわち入力データ
を過去に出現した履歴に応じて符号化して圧縮するデー
タ圧縮装置においては、前置データ保持手段１００が、
入力データの直前までに入力されたｎ個の入力データか
らなる文脈を保持し、履歴保持手段１０１が、入力デー
タと文脈との組み合わせを保持し、符号木保持手段１０
７が、データ未登録を示すデータとして定義されるエス
ケープコードをあらかじめ登録した文脈毎に独立した符
号木を保持する。

【００７９】そして、符号木決定手段１０３が、文脈と
入力データからデータの符号木を決定し、文脈判別手段
１０８が、符号木決定手段１０３で決定した符号木にデ
ータが登録されているか否かを判別し、エスケープコー
ド出力手段１０９と符号木にデータが登録されていない
ときは符号木の頂点を意味するルートからエスケープコ
ードのデータ格納点としてのリーフまでの途中に位置す
る分岐点としてのノードからの分岐に従ってエスケープ
コードを出力する。

【００８０】さらに、文脈変更手段１１０が、符号木に
データが登録されていないときは文脈の長さｎを短く
し、エスケープ符号出力手段１１１が、符号木にデータ
が登録されているときは符号木のルートからデータのリ
ーフまでの途中に位置するノードからの分岐にしたがっ
てデータの符号を出力する。そして、履歴登録手段１１
４が、履歴保持手段１０１にデータと文脈の組み合わせ
を登録し、符号登録手段１１５が、符号木にデータを新
規に登録し、符号長変更手段１０５が、符号化したリー
フと他のリーフあるいはノードとを組み換え、前置デー
タ更新手段１０６が、データを前置データ保持手段１０
０に登録する。

【００８１】さらに、制御手段１１６が、データの符号
化時に一度でもエスケープコードを符号化したときは、
データの符号化の直前の文脈とデータとの組み合わせを
履歴登録手段１１４で履歴保持手段１０１に登録し、デ
ータの符号化の直前に符号化したエスケープコードを持
つ符号木に符号登録手段１１５でデータを新規に登録す
る（以上、請求項１２）。

【００８２】一方、図５を用いて説明した構成をもつ、
請求項５に記載の本発明のデータ復元方法を実施するた
めの装置、すなわち過去に出現した履歴に応じて符号化
した符号を復号するデータ復元装置においては、前置デ
ータ保持手段２００が、過去に復号したｎ個のデータを
保持し、履歴保持手段２０１が、復号したデータと文脈
との組み合わせを保持し、符号木保持手段２０２が、文
脈毎に独立した符号木を保持する。

【００８３】そして、符号木決定手段２０３が、前置デ
ータ保持手段２００に保持されている文脈からデータを
復号するための符号木を決定し、復号手段２０４が、符
号に従って符号木決定手段２０３で選択した符号木の頂
点を意味するルートから分岐点としてのノードを走査し
て到達したデータ格納点としてのリーフに格納されてい
るデータを出力する。

【００８４】さらに、符号長変更手段２０５が、復号し
たリーフと他のリーフあるいはノードとを組み替え、前
置データ更新手段２０６が、復号したデータを前置デー
タ保持手段２００に登録する（以上、請求項１３）。次
に、図６を用いて説明した構成をもつ、請求項６に記載
の本発明のデータ復元方法を実施するための装置、すな
わち過去に出現した履歴に応じて符号化した符号を復号
するデータ復元装置においては、前置データ保持手段２
００が、過去に復号したｎ個のデータを保持し、履歴保
持手段２０１が、復号したデータと文脈との組み合わせ
を保持し、符号木保持手段２０７が、データ未登録を示
すデータとして定義されるエスケープコードをあらかじ
め登録した符号木を保持する。

【００８５】そして、符号木決定手段２０３が、前置デ
ータ保持手段２００に保持されている文脈からデータを
復号するための符号木を決定し、復号手段２０４が、符
号に従って符号木決定手段２０３で選択した符号木の頂
点を意味するルートから分岐点としてのノードを走査し
て到達したデータ格納点としてのリーフに格納されてい
るデータを出力する。

【００８６】さらに、符号長変更手段２０５が、復号し
たリーフと他のリーフあるいはノードとを組み替え、文
脈変更手段２０８が、出力したデータがエスケープコー
ドであったときデータを棄却し文脈を短くし、前置デー
タ更新手段２０６が、復号したデータを前置データ保持
手段２００に登録する。そして、制御手段２１３が、エ
スケープコードを復号した時は文脈変更手段２０８で文
脈を再設定し、エスケープコード以外が復号されるまで
処理を繰り返す（以上、請求項１４）。

【００８７】次に、図７を用いて説明した構成をもつ、
請求項７に記載の本発明のデータ復元方法を実施するた
めの装置、すなわち過去に出現した履歴に応じて符号化
した符号を復号するデータ復元装置においては、前置デ
ータ保持手段２００が、過去に復号したｎ個のデータを
保持し、履歴保持手段２０１が、復号したデータと文脈
との組み合わせを保持し、符号木保持手段２０７が、エ
スケープコードをあらかじめ登録した符号木を保持す
る。

【００８８】そして、符号木決定手段２０３が、前置デ
ータ保持手段２００に保持されている文脈からデータを
復号するための符号木を決定し、復号手段２０４が、符
号に従って符号木決定手段２０３で選択した符号木の頂
点を意味するルートから分岐点としてのノードを走査し
て到達したデータ格納点としてのリーフに格納されてい
るデータを出力する。

【００８９】さらに、符号長変更手段２０５が、復号し
たリーフと他のリーフあるいはノードとを組み替え、文
脈変更手段２０８が、出力したデータがエスケープコー
ドであったとき、データを棄却し文脈を短くし、前置デ
ータ更新手段２０６が、復号したデータを前置データ保
持手段２００に登録する。そして、履歴登録手段２０９
が、データの復号処理でエスケープコードを復号したと
きの全ての文脈と復号したデータとを履歴保持手段２０
１に登録し、符号登録手段２１０が、データの復号処理
でエスケープコードを復号した時の文脈に対応した全て
の符号木にデータの符号を登録し、制御手段２１３が、
エスケープコードを復号した時は文脈変更手段２０８で
文脈を再設定し、エスケープコード以外が復号されるま
で処理を繰り返す（以上、請求項１５）。

【００９０】次に、図８を用いて説明した構成をもつ、
請求項８に記載の本発明のデータ復元方法を実施するた
めの装置、すなわち過去に出現した履歴に応じて符号化
した符号を復号するデータ復元装置においては、前置デ
ータ保持手段２００が、過去に復号したｎ個のデータを
保持し、履歴保持手段２０１が、復号したデータと文脈
との組み合わせを保持し、符号木保持手段２０７が、デ
ータ未登録を示すデータとして定義されるエスケープコ
ードをあらかじめ登録した符号木を保持する。

【００９１】そして、符号木決定手段２０３が、前置デ
ータ保持手段２００に保持されている文脈からデータを
復号するための符号木を決定し、復号手段２０４が、符
号に従って符号木決定手段２０３で選択した符号木の頂
点を意味するルートから分岐点としてのノードを走査し
て到達したデータ格納点としてのリーフに格納されてい
るデータを出力する。

【００９２】さらに、符号長変更手段２０５が、復号し
たリーフと他のリーフあるいはノードとを組み替え、文
脈変更手段２０８が、出力したデータがエスケープコー
ドであったときデータを棄却し文脈を短くする。そし
て、前置データ更新手段２０６が、復号したデータを前
置データ保持手段２００に登録し、履歴登録手段２１１
が、データの復号処理でエスケープコードを最後に復号
した時の文脈と復号したデータとを履歴保持手段２０１
に登録し、符号登録手段２１２が、データの復号処理で
最後にエスケープコードを復号した時の文脈に対応した
符号木にデータの符号を登録する。

【００９３】さらに、制御手段２１３が、エスケープコ
ードを復号した時は文脈変更手段２０８で文脈を再設定
し、エスケープコード以外が復号されるまで処理を繰り
返す（以上、請求項１６）。

【００９４】

【発明の実施の形態】（ａ）本発明に関連する技術１の
説明図１５は本発明に関連する技術１としてのデータ圧縮装
置とデータ復元装置の構成例を示すブロック図であり、
この図１５において、１は入力された文字を過去に出現
した履歴に応じて符号化して圧縮するデータ圧縮装置で
あり、２はデータ圧縮装置１で符号化された文字を復元
するデータ復元装置である。

【００９５】さらに、データ圧縮装置１は、入力された
文字列データの文脈を収集して文脈木を作成する文脈収
集過程１１と、この文脈収集過程１１で得られた文脈
（文脈木）に対応してスプレイ符号を対応させた符号木
を、入力データの文字列に応じてスプレイ符号化しなが
ら作成・更新するスプレイ符号化過程１２をとるように
なっている。

【００９６】一方、データ復元装置２は、このデータ圧
縮装置１で符号化された復元データの文脈に対応してス
プレイ符号を対応させた符号木を、復元データの文字列
に応じてスプレイ符号化しながら作成・更新するスプレ
イ符号化過程２１と、復元データとしての文字列につて
の文脈を収集（文脈木を作成）する文脈収集過程２２を
とるようになっている。

【００９７】なお、以下では、データ圧縮装置１を符号
化側、データ復元装置２を復元側として説明する。（１）符号化側の説明図１６（ａ），（ｂ）は、文脈収集過程１１において作
成される文脈木の一例を示す図であり、図１６（ａ）は
文脈木がハッシュ法を用いて短時間で探索できるように
文字列をリスト構造の格納形式でメモリに格納した例を
示す図、図１６（ｂ）は文字列を格納した木構造の辞書
（リスト）を親子関係の繋がりで示した図である。

【００９８】ここで、図１６（ａ）中のアドレスは１６
進表示であり、この図１６（ａ）の例では、文脈木の最
大サイズは４Ｋノード（４ＫＷ）である。このように、
全ての文字を予め登録しておけば、ルートに繋がる第１
階層の兄弟ノードの位置は予め分かるので、探索時にリ
ストを操作する必要はなく、直接アクセスすることがで
きる。

【００９９】一方、第２階層以降は、子ノードと右兄弟
ノードのアドレスを格納しておき、探索時にリスト形式
で格納文字を照合しながら一致するまで、リストを操作
してアクセスする。また、文脈の木は初期化されたと
き、アドレス１００まで設定されるが、このとき第１階
層のアドレス１００には、End Of File（ＥＯＦ）符号
を登録しておき、アドレス１０１以降のメモリを新規登
録に使用する。

【０１００】次に、図１７は、上述のスプレイ符号化過
程１２において作成される符号木の一例を示す図であ
る。符号木は、基本的に従来のSplay-Tree符号化と同様
に、初期化時に図１７のように設定される。そして、図
１６（ｂ）に対応して、最大サイズが４Ｋノード（４Ｋ
Ｗ）までの場合、符号の木のノードは、内部節点（子ノ
ードが付いている）と外部節点（リーフ、子ノードがな
い各符号の終端）の２つに分類される。

【０１０１】また、スプレイ符号化では、符号の木をア
クセスするために、図１８に示すようなＵｐ，Ｌｅｆ
ｔ，Ｒｉｇｈｔという３つの配列を用いる。ここで、Ｕ
ｐ配列は、各ノードから親ノードへのアドレスを格納
し、Ｌｅｆｔ配列は、各ノードから左の子ノードへのア
ドレスを格納し、Ｒｉｇｈｔ配列は、各ノードから右の
子ノードへのアドレスを格納するものである。

【０１０２】また、Ｕｐ配列では、内部節点を最初の４
ＫＷ（アドレス（１６進）０００〜ＦＦＦ）に格納し、
外部節点を残りの４ＫＷ（アドレス（１６進）１０００
〜１ＦＦＦ）に格納するようになっている。このように
することで、文脈木の各ノードに対する符号を、符号木
のアドレス＝文脈木のノードポインタ（番号）＋４Ｋ、
で対応付けることができるようになる。

【０１０３】なお、各配列のビット幅は、Ｕｐ配列が１
３ビット、Ｌｅｆｔ，Ｒｉｇｈｔ配列が１２ビットとな
る。次に、上述のような構成をもつ符号木の木の更新の
基本操作について、図１９（ａ），（ｂ）を用いて説明
する。図１９（ａ）はスプレイ符号更新の基本操作を示
す図であるが、この図１９（ａ）に示すように、文字Ａ
がアクセスされたとき、ノードＡと２段上のノードＡが
付いている枝と反対方向の枝のノードＣとを入れ換え
る。

【０１０４】そして、文字Ａ〜Ｅまでの符号に対して、
文字Ｃがアクセスされた場合には、例えば図１９（ｂ）
に示すように、符号の木を組み換えるようになってい
る。すなわち、上述した基本操作を２回繰り返すことに
よって符号木の木の更新を行なう。この場合、２回目の
基本操作は１回目に更新したノードの親ノードの長さを
更新する。

【０１０５】これにより、符号の木の深さが深くなって
も、この基本操作を繰り返すことによって、ルートから
アクセスされたノードＣ（符号０１１０）までの長さを
１／２（符号１０）にすることができるので、ルートか
らアクセスされたノードまでの符号木を動的に組み換え
て、符号表を入力データに適応させることができる。す
なわち、スプレイ符号の符号更新は線型リストの Move-
To-Front操作を Binary-Treeで行なったようなものであ
る。

【０１０６】さらに、上述のような文脈収集過程１１に
おける文脈木の作成およびスプレイ符号化過程１２の符
号木の更新・作成の処理を、図２０のフローチャートに
おける処理ステップＥ１〜Ｅ３１を参照しながら詳述す
る。なお、入力文字をＫ（Ｋは任意の文字）とし、文字
Ｋが入力される直前に入力された文字をＰ（Ｐは任意の
文字）とする。

【０１０７】まず、文脈木と符号木および直前文字Ｐを
初期化する（ステップＥ１）。そして、既に入力された
全文字が入力符号化されているかをチェックし（ステッ
プＥ２）、入力文字が残っている場合、文字Ｋの入力
と、文字列の長さＬの０へのセットとを行なう（ステッ
プＥ３）。さらに、文脈木の直前文字Ｐの下に子ノード
があるかをチェックし（ステップＥ５）、直前文字Ｐの
下に子ノードがなければ、入力文字Ｋの０次符号を出力
し（ステップＥ６）、文脈木の直前文字Ｐの下に入力文
字Ｋを子ノードとして登録する（ステップＥ７）。

【０１０８】一方、符号木の方では、直前文字Ｐの下
に、文字Ｋとエスケープコードを登録するノードを作成
して文字Ｋを登録する（ステップＥ８）。なお、このノ
ード作成のアルゴリズムの一例を図３０（ａ），（ｂ）
に示す。さらに、直前文字を入力文字Ｋに変更し（ステ
ップＥ１６）、直前文字列の長さＬ’が最大文字列長Ｌ
ｍａｘに等しいかをチェックする（ステップＥ２４）。

【０１０９】そして、直前文字列長Ｌ’が最大文字列長
Ｌｍａｘに等しくなければ、直前文字列が１次符号で符
号化され出力されているかをチェックする（ステップＥ
２５）。ここで、直前文字列が１次符号で符号化されて
いなければ、直前文字列長Ｌ’に注目文字列長Ｌを移し
（ステップＥ２８）、文字Ｋが符号化済かをチェックし
（ステップＥ９）、符号化済であれば、上述のステップ
Ｅ２からの処理を繰り返し（ステップＥ９のＹＥＳルー
ト）、符号化済でなければ、上述のステップＥ３からの
処理を繰り返す（ステップＥ９のＮＯルート）。

【０１１０】ところで、上述のステップＥ１０におい
て、子ノードに登録されている文字が入力文字Ｋと一致
した場合は、文字列の長さＬを１増やし（ステップＥ１
７）、この文字列長Ｌが、予め設定した最大符号長Ｌｍ
ａｘと等しいかをチェックする（ステップＥ１８）。等
しくない場合は、入力データの全文字が符号化されたか
をチェックし（ステップＥ１９）、まだ符号化されてい
ない文字があれば、今までの入力文字を直前文字Ｐに移
し（ステップＥ２０）、さらに１文字Ｋを入力して（ス
テップＥ２１）上述のステップＥ１０の処理へ戻り、再
び子ノードに登録されている文字が文字Ｋと一致するか
をチェックする。

【０１１１】一致しなければ、今度は文字列の長さＬが
０かどうかをチェックし（ステップＥ１１）、ＹＥＳ、
すなわち、直前文字Ｐの下に子ノードはあるが、該当す
る文字Ｋがまだ付いていないなら、直前文字Ｐの下のエ
スケープコードを出力した後、文字Ｋの０次符号を出力
する（ステップＥ１２）。さらに、文字Ｋを、文脈木の
直前文字Ｐの下の子ノードの兄弟ノードとして登録し
（ステップＥ１３）、符号木の直前文字Ｐの下のエスケ
ープコードをエスケープコードと文字Ｋの符号とに分割
して、文字Ｋの符号を追加し（ステップＥ１４）、符号
木のエスケープコードと０次符号Ｋの符号長をスプレイ
符号として更新する（ステップＥ１５）。

【０１１２】以上のようにして、所定の最大文字列長に
達するまで符号化文字列の伸長文字列を登録することが
できるようになっている。その後、上述したステップＥ
１６，ステップＥ２４を経て、再び直前文字列を１次符
号で出力したかをチェックする（ステップＥ２５）。即
ち、直前文字列が１次符号で符号化され、出力されてい
れば、文脈木に直前文字列に符号化文字（列）の先頭文
字を付加した延長文字列を登録し（ステップＥ２６）、
符号木に、符号化した延長文字列の符号を登録し（ステ
ップＥ２７）、上述のステップＥ２８からの処理を繰り
返す。

【０１１３】なお、この登録は、直前文字の符号を分岐
させ、文字Ｋを付加した文字列の１次符号を追加するよ
うに行なう。文字列の分岐は、エスケープコードを符号
化した文字列の符号とみて分岐させ、元の文字列と文字
Ｋを付加した文字列の符号とを作る。このようにして、
辞書登録文字列として、符号化済の直前文字から登録
し、この直前文字から続く文字列を符号化している。

【０１１４】さらに、上述のステップＥ１８において、
文字列長Ｌが、予め設定した最大符号長Ｌｍａｘと等し
い場合、または、ステップＥ１１において、文字列長Ｌ
が０に等しくない場合は、文脈木の文字（列）の参照番
号に対応する１次符号を出力し（ステップＥ２２）、符
号木が出力した１次符号の符号長をスプレイ符号として
更新（ステップＥ２３）した後、上述のステップＥ２４
からの処理を行なう。

【０１１５】ここで、以上の閉ループ処理は、直前文字
Ｐと入力文字Ｋとの組み合わせが、既に文脈木に登録さ
れている時に、登録文字数（文字列長）を伸長して、文
字列単位に登録を行なう処理を示している。また、上述
のステップＥ２において、入力された全ての文字が符号
化されている場合は、文脈木の直前文字Ｐの下に子ノー
ドがあるかチェックし（ステップＥ２９）、子ノードが
あれば直前文字Ｐの下のエスケープコードを出力し（ス
テップＥ２９のＮＯルートからステップＥ３０）、Ｅｎ
ｄＯｆＦｉｌｅを表すＥＯＦの０次符号を出力して
（ステップＥ３１）処理を終了する（ステップＥ２９の
ＮＯルートからステップＥ３１）。

【０１１６】子ノードがなければ、そのままＥＯＦの０
次符号を出力して処理を終了する。以上のような処理を
行なうことで、入力データとしての文字列を過去に出現
した履歴に応じて符号化して圧縮するデータ圧縮方法に
おいて、辞書に入力データの文字列を収集し番号を付け
て登録するとともに、各文字列に対応してスプレイ符号
の符号化及び更新を施している。

【０１１７】ここで、上述の入力文字Ｋをアルファベッ
トａ，ｂ，ｃのいずれかに限り、文字「ａｂｃａｂｃ
ａｂｂ」が入力された場合を例にとり、文脈木と符
号木の更新・作成について、図２１〜図２８を用いてさ
らに詳述する。まず、図２１（ａ），（ｂ）に示すよう
に、文脈木と符号木に、予め文字ａ，ｂ，ｃと入力デー
タを全て符号化した後に出力する終端符号ＥＯＦとを、
番号を付することによりａ₁，ｂ₂，ｃ₃，ＥＯＦ₄として
登録しておく。

【０１１８】このように文脈木を初期化することで、最
初に登録してある文字ａ，ｂ，ｃのいずれかが直前文字
となり、直前文字から続く文脈がないとき独立の単独の
参照番号も兼ねることになる。以下の説明では、文字ｃ
を最初の直前文字と仮定しておく。一方、図２１（ｂ）
に示すように、符号木は、ルート（ｒｏｏｔ）からノー
ドを左下に下がるときには、登録した文字に符号“０”
を割り当て、ノードを右下に下がるときには、登録した
文字に符号“１”を割り当てる２進木であり、これによ
り符号化時は、対応する文字の参照番号のノードからル
ートまでの辿る経路をスタックして、その経路を逆転さ
せ、左下か右下かによって符号“０”，“１”を割り振
ることによって、その文字の参照番号に対応する符号語
が得られるようになっている。

【０１１９】すなわち、「ａ₁，ｂ₂，ｃ₃」の３文字の
０次符号は、それぞれ「０００１１０１１」とな
る。そして、上述の図２１（ａ），（ｂ）に示す状態か
ら、まず文字列「ａｂｃ」が入力されると、予め登録し
ておいた「ｃ」（ｃ₃）を直前文字と仮定するので、図
２２（ａ）に示すように、文脈木の「ｃ」（ｃ₃）の下
位に新たにノードを作成し、文字列「ａｂｃ」の内、最
初の１文字「ａ₅」と未登録を表すエスケープコード
（ＥＳＣ₆）とを登録する。

【０１２０】一方、符号木では、図２２（ｂ）に示すよ
うに、「ａ」が、既に登録されているので、「ａ」が登
録されているノードと直前文字である「ｃ」の上位ノー
ドとを組み替え、この「ｃ」を新たにルートとおいて
（１次符号化）、「ａ」とエスケープコード（ＥＳＣ）
を登録する。さらに、文字列「ａｂｃ」の内、次のｂ，
ｃについても上述の処理を行なうことにより、ｂが入力
されたときの文脈木と符号木は、それぞれ図２３
（ａ），（ｂ）に示すようになり、ｃが入力されたとき
の文脈木と符号木は図２４（ａ），（ｂ）に示すように
なる。

【０１２１】この処理は、図２０にて上述した処理ステ
ップにおいて、ステップＥ５のＮＯルート，ステップＥ
２４のＹＥＳルート，ステップＥ２５のＮＯルートを経
由する閉ループ処理に相当するものである。すなわち、
文脈木では、直前文字の下位に子ノードが存在しない場
合に、この直前文字の下位に入力文字とエスケープコー
ドを登録するノードを新たに作成して登録を行なう。

【０１２２】一方、符号木では、過去に登録されている
文字と同じ文字が再び入力された場合は、過去に登録さ
れている文字のノードを、入力された文字の直前文字が
登録されているノードの上位ノードと組み替えて、過去
に登録されている文字のノードを上位に移動し、ルート
からの距離を１／２にして符号長を短くするのである。

【０１２３】さらに、続いて文字列「ａｂｃ」が入力さ
れると、最初に入力された文字列「ａｂｃ」の最後の
「ｃ」を直前文字として文脈木の「ｃ₉」の下位に、文
字列「ａｂｃ」の内の１文字「ａ」のみを登録しようと
するが、図２４（ａ）に示すように、文脈木には、既に
「ｃ₃」の下位に「ａ₅」が登録されているので、図２５
（ａ）に示すように、登録する文字を１文字「ａ」から
２文字「ａｂ」へ１文字伸長して「ａ₅」の下位に「ｂ
₁₁」を登録する。

【０１２４】この時、符号木では、図２５（ｂ）に示す
ように、「ｃ」の下位に「ａ」とともに登録されている
エスケープコード（ＥＳＣ）のノードを分岐して新たに
ノードを作成し、文脈木で１文字伸長して登録した「ａ
ｂ」の登録を行なう。続いて、文字列「ａｂｃ」の内、
「ｂ」を文脈木に登録しようとした場合も、図２５
（ａ）に示すように、既に「ａ₁」の下位に「ｂ₇」が登
録されているので、図２６（ａ）に示すように、登録す
る文字を１文字「ｂ」から２文字「ｂｃ」へ１文字伸長
して「ｂ₇」の下位に「ｃ₁₂」を登録する。

【０１２５】この時、符号木では、図２６（ｂ）に示す
ように、「ａ」の下位に「ｂ」とともに登録されていた
エスケープコード（ＥＳＣ）のノードを分岐して新たに
ノードを作成し、文脈木で１文字伸長して登録した「ｂ
ｃ」の登録を行なう。そして、次の文字列「ａｂｃ」の
内、最後の「ｃ」を登録する場合も、上述の処理を行な
うと、文脈木及び符号木は、それぞれ図２７（ａ），
（ｂ）に示す状態となる（ここまでで、「ａｂｃａｂ
ｃ」が入力済となる）。

【０１２６】そして、さらに文字列「ａｂ」が入力され
ると文脈木では、まず、直前文字の「ｃ」の下位に１文
字「ａ」を登録しようとするが、上述したように、「ｃ
₉」の下位に既に「ａ₅」が登録されているので、登録文
字数を１文字伸長して「ａｂ」として、「ａ₅」の下位
に「ｂ」を登録しようとする。しかし、図２７（ａ）に
示すように、「ａ₅」の下位にも既に「ｂ₁₁」が登録さ
れているので、図２８（ａ）に示すように、さらに、登
録文字数を１文字伸長して「ａｂｂ」として、「ｂ₁₁」
の下位に「ｂ」を登録する。

【０１２７】この時、符号木では、図２８（ｂ）に示す
ように、「ａｂ」が登録されているノードを分岐して
「ａｂｂ」を登録する。この処理は、図２０にて上述し
た処理ステップのステップＥ５のＹＥＳルート，ステッ
プＥ１０のＹＥＳルート，ステップＥ２５のＹＥＳルー
トを経由する閉ループ処理に相当する。

【０１２８】すなわち、文字列が入力されたとき、直前
文字と入力された文字列中の１文字との組み合わせが、
既に文脈木に登録されている場合、登録する文字数を１
文字伸長して登録されていない１文字のみ登録する。そ
して、この時、符号木では、直前文字とともに登録され
ているエスケープコード（ＥＳＣ）のノードを分岐させ
て新たにノードを作成し、この文字列を登録する。

【０１２９】以上のように、文字「ａｂｃａｂｃａ
ｂｂ」の入力が終了すると、各文字に割り当てられる
符号は図２９に示すようになる。この図２９に示すよう
に、最初に入力された文字「ａｂｃ」は、それぞれ１文
字単独で符号化され、対応する符号は、それぞれ００，
０１，１０の２ビットとなる。

【０１３０】そして、次に入力された文字列「ａｂｃ」
に対応する符号語は、直前文字との関係からそれぞれ
０，０，０の１ビットとなる。さらに、次に入力された
「ａｂ」２文字の文字列に符号が割り当てられるが、こ
の図２９に示すように、２文字の文字列が２ビットのみ
の符号語で表されている。

【０１３１】そして最後に入力された文字「ｂ」は、今
までの直前文字の繋がりに該当する文字がない場合で、
ＥＳＣと１文字単独の符号語の組み合わせの３ビットで
表されている。以上のように、関連技術１のデータ圧縮
方法によれば、圧縮する文字（列）を、木構造の文脈木
に番号を付けて登録し、この文脈木に対応した符号木を
スプレイ符号化を施しながら作成・更新することによ
り、出現する文字の出現頻度を求めて確率モデルを構築
し、各文字に符号を割り当てるという２段階の処理を同
時に行なうので、データの圧縮処理の速度が大幅に向上
するという効果がある。

【０１３２】また、上述の確率モデルは、文字の入力毎
に符号木のノードが作成・更新（スプレイ処理）される
ことによって構築されるので、文字の入力毎に既に構築
されている確率モデルを再構築するという膨大な演算処
理を行なう必要が無く、これにより圧縮処理の速度がさ
らに向上する効果がある。さらに、関連技術１のデータ
圧縮方法によれば、過去に圧縮（符号化）した文字と同
じ文字が出現する毎に、過去に登録してあった同じ文字
の符号木のノードを上位のノードと組み替えて（スプレ
イ処理）符号長を１／２にすることにより、同じ文字
（列）が繰り返し出現するほど、その文字（列）の符号
は少ないビット数で表せるので、圧縮効果が大幅に向上
する効果がある。

【０１３３】また、関連技術１のデータ圧縮方法によれ
ば、上述の文字列「ａｂ」を符号化した場合のように、
文字を１文字単位に符号化するのではなく、複数文字単
位の文字列として符号化することにより、可変長符号化
処理が高速化できるとともに、符号化単位を文字列とす
るので、情報源が拡大し、スプレイ符号化の符号化効率
が大幅に向上するという効果もある。

【０１３４】（２）復元側の説明次に、上述のように、符号化（圧縮）されたデータを入
力符号として、図１７にて上述したデータ復元装置２内
の文脈収集過程２１とスプレイ符号化過程２２が、デー
タを復元する処理について、図３１のフローチャートに
おける処理ステップＤ１〜Ｄ２４を参照しながら説明す
る。

【０１３５】なお、このデータを復元する処理は、基本
的に符号化側の説明にて上述した符号化の処理と逆の処
理を行なうようにすればよい。すなわち、まず、文脈木
と符号木とを初期化し、直前文字Ｐを０に初期化する
（ステップＤ１）。列長Ｌを０とし（ステップＤ２）、
文脈木の直前文字の下位に子ノードがあるかをチェック
する（ステップＤ３）。

【０１３６】ここで、子ノードがない場合においては、
入力符号を０次符号として文字Ｋを復号し（ステップＤ
３のＮＯルートからステップＤ４）、この復号した文字
ＫがＥＯＦ符号であるかをチェックする（ステップＤ
５）。もし、この復号した文字Ｋが、ＥＯＦ符号でなけ
れば、ＮＯルートをとり、復号した文字Ｋを出力し（ス
テップＤ６）、文脈木に文字Ｋを登録する（ステップＤ
７）。なお、これは図１７にて上述した符号化時の処理
ステップＥ７と同様にして行なう。

【０１３７】さらに、符号化時のステップＥ８と同様に
して、符号木の直前文字Ｐの下に文字Ｋとエスケープコ
ードのノードを作り（ステップＤ８）、直前文字Ｐを文
字Ｋとおく（ステップＤ１７）。そして、以降の処理ス
テップＤ２０〜Ｄ２３は、符号化時の処理ステップＥ２
０〜Ｅ２３と同様の処理ステップをとり、直前文字列長
Ｌ’を注目文字列長Ｌで置き換えて（ステップＤ２
４）、上述の処理ステップＤ２に戻る。

【０１３８】ところで、上述の処理ステップＤ３におい
て、文脈木の直前文字Ｐの下位に子ノードが存在する場
合は、入力された符号を符号木より１次符号とみなして
復号して、文脈木の文字（列）の参照番号を得る（ステ
ップＤ３のＹＥＳルートからステップＤ９）。さらに、
復号した参照番号がエスケープコードであるかをチェッ
クし（ステップＤ１０）、エスケープコードであれば、
ＹＥＳルートをとり、入力文字を０次符号として次の符
号を復号して、文字Ｋを得る（ステップＤ１１）。

【０１３９】そして、上述のステップＤ５と同様に、復
号した文字ＫがＥＯＦ符号であるかをチェックし（ステ
ップＤ１２）、復号した文字ＫがＥＯＦ符号でなけれ
ば、ＮＯルートをとり、文字Ｋを出力する（ステップＤ
１３）。さらに、符号化時の処理ステップＥ１３〜１５
と同様にして、文脈木に文字Ｋを登録し（ステップＤ１
４）、直前文字Ｐの下に文字Ｋを追加し（ステップＤ１
５）、符号木のエスケープコードと０次符号Ｋの符号長
をスプレイ符号として更新する（ステップＤ１６）。

【０１４０】そして、以降は上述のステップＤ１７から
の処理を行なう。このようにして、全ての一文字にスプ
レイ符号を割り当てておき、直前文字から繋がる文字列
が既に収集した辞書中の文字列中にない一文字のスプレ
イ符号を復号したときに、符号を更新し、上述の直前文
字からの繋がる復号した文字を文脈木に登録することが
できる。

【０１４１】また、上述の処理ステップＤ１０におい
て、復号した参照番号がエスケープコードでなければ、
ＮＯルートをとり、文脈木の参照番号に対応する文字列
を復元して出力し（ステップＤ１８）、文字（列）の最
終文字を直前文字Ｐに置き換える（ステップＤ１９）。
そして、以降は、上述のステップＤ２０からの処理を行
なう。

【０１４２】このようにして、辞書登録文字列として、
復号化済の直前文字から登録し、この直前文字から続く
文字列を復号することができる。また、上述の処理ステ
ップＤ４またはステップＤ１２において、復号した文字
ＫがＥＯＦ符号であれば、ＹＥＳルートをとり、復元処
理を終了する。以上のようにして、辞書としての文脈木
に復元したデータの文字列を収集し番号を付けて登録す
るとともに、復元各文字列に対応してスプレイ符号を対
応させておき、辞書番号に対応する文字列をスプレイ符
号で復号化及び更新を行ない、また、所定の最大文字列
長に達するまで符号化文字列の伸長文字列を登録し、こ
の伸長文字列に対応するスプレイ符号を登録する。

【０１４３】これにより、データ圧縮装置１の文脈収集
過程１１およびスプレイ符号化過程１２により圧縮・符
号化された文字Ｋを復元している。このように、関連技
術１のデータ復元方法によれば、文脈木に復元した文字
（列）に番号を付けて登録するとともに、この文脈木に
対応した符号表としての符号木を構築することにより、
符号化された文字の符号と一致する符号を符号表におい
て検索し、一致した符号に対応する文字を復号文字とし
て出力するという２段階の処理を同時に行なうので、デ
ータの復元処理の速度が大幅に向上するという効果があ
る。

【０１４４】また、上述の確率モデルは、文字の復元毎
に符号木のノードが作成・更新（スプレイ処理）される
ことによって構築されるので、文字の復元毎に、既に構
築されている符号表（確率モデル）を再構築するという
膨大な演算処理を行なう必要が無くなり、これにより復
元処理の速度がさらに向上する効果がある。さらに、関
連技術１のデータ復元方法によれば、過去に復号した符
号と同じ符号が出現する毎に、過去に登録してあった同
じ符号の符号木上のノードを上位のノードと組み替えて
（スプレイ処理）符号長を１／２にすることにより、同
じ符号が繰り返し出現するほどその符号は少ないビット
数で表せるので、同じ符号を繰り返し復号する場合、復
元処理の速度が大幅に向上する効果がある。

【０１４５】また、関連技術１のデータ復元方法によれ
ば、文字を１文字単位に復号するのではなく、複数文字
単位の文字列として復号することにより、スプレイ処理
が高速化できるとともに、復号単位を文字列とするの
で、復元できる情報源が拡大し、復元効率が大幅に向上
するという効果もある。なお、上述した例では、直前文
字から繋がる文字列を文脈として収集して符号化・復号
する方法について述べたが、必ずしも直前文字にこだわ
ることはなく２文字以上以前からの文脈を収集して符号
化・復号化してもよい。

【０１４６】また、上述した例では、動的に文脈を収集
してスプレイ処理する例を示したが、本発明によれば、
必ずしも動的である必要はなく、予め代表的なサンプル
から収集した静的な文脈を用いてスプレイ処理してもよ
い。さらに、上述した例では、入力された全てのデータ
を動的可変長符号化（スプレイ符号化）する場合につい
て述べたが、相当程度のデータを符号化した後に、スプ
レイ符号化の更新操作を止めて、静的な可変長符号化を
してもよい。この場合、符号化と復号化とで予め取決め
をしておき同期が取れればよい。

【０１４７】また、上述した例では、圧縮するデータを
文字あるいは文字列として説明したが、関連技術１のデ
ータ圧縮方法及びデータ復元方法は、他の画像データや
音声データなどあらゆるデータに対して適用できる。（ｂ）本発明の一実施形態の説明図３２は、本発明の一実施形態としてのデータ圧縮方法
及びデータ復元方法を実施するためのデータ圧縮装置及
びデータ復元装置の構成例を示すブロック図であるが、
この図３２において、データ圧縮装置３は、入力された
データを過去に出現した履歴に応じて符号化して圧縮す
るものであり、データ復元装置４は、データ圧縮装置３
が符号化した符号を復号するものである。

【０１４８】以後、データ圧縮装置３を符号化側、デー
タ復元装置４を復元側として、以下に説明する。なお、
以下の説明中、文脈木および符号木は、項目（ａ）にて
前述した構成をもつものである。（１）符号化側の説明図３３は、上述のデータ圧縮装置３の内部の構成例を示
すブロック図であり、この図３３に示すように、１００
Ａ−１〜１００Ａ−ｎ（ｎは自然数）は前置データ保持
部、１０１Ａは文脈履歴保持部、１０２Ａは符号木保持
部、１０３Ａは符号木決定部、１０４Ａは符号化部、１
０５Ａは符号木更新部、１０６Ａは文脈更新部である。

【０１４９】ここで、前置データ保持部（前置データ保
持手段）１００Ａ−１〜１００Ａ−ｎは、入力されたデ
ータＫ（以下、事象Ｋということがある）の直前までに
入力されたｎ個のデータからなる文脈を保持するもので
ある。また、文脈履歴保持部（履歴保持手段）１０１Ａ
は、入力されたデータＫと文脈との組み合わせを保持す
るものであり、符号木保持部（符号木保持手段）１０２
Ａは、文脈毎に独立した符号木を保持するものであり、
符号木決定部（符号木決定手段）１０３Ａは、前置デー
タ保持部１００Ａ−１〜１００Ａ−ｎに保持されている
直前までのデータから符号木を決定するものである。

【０１５０】さらに、符号化部（符号出力手段）１０４
Ａは、データＫを符号化して、符号木決定部１０３Ａで
選択した符号木のルート（符号木の頂点）からデータＫ
が格納されているリーフに沿って途中に位置するノード
（分岐点）からの分岐に従って符号化したデータＫを出
力するものである。また、符号木更新部（符号長変更手
段）１０５Ａは、符号化したリーフと他のリーフあるい
はノードとを組み替えるものであり、文脈更新部（前置
データ更新手段）１０６Ａは、データＫを前置データ保
持部１００Ａ−１〜１００Ａ−ｎに登録するものであ
る。

【０１５１】さらに、図３４は上述の符号化部１０４Ａ
の内部の構成例を示すブロック図であり、この図３４に
示すように、上述のようにノードからの分岐に従って符
号化したデータＫを出力するために、符号化部１０４Ａ
には、上位ノード判別部４１，ノード番号管理部（メモ
リ）４２，位置判別部４３，ラッチ４４，スタック４５
が設けられている。

【０１５２】ここで、上位ノード判別部４１は、符号木
のルートのノード番号と文脈木のリーフのノード番号と
から上位ノードのノード番号を得るものであり、ノード
番号管理部（メモリ）４２は、文脈木と符号木のノード
番号を管理するものであり、位置判別部４３は、ノード
の分岐状態を判別するものである。さらに、ラッチ４４
は、リーフのノード番号を一旦保持するものであり、ス
タック４５は、位置判別部４３から出力されるデータＫ
の符号を一旦保持して、終了信号を受信すると保持して
おいた符号を順次出力するものである。

【０１５３】上述の構成により、図３３に示すデータ圧
縮装置では、前置データ保持部１００Ａ−１〜１００Ａ
−ｎが、入力データＫの直前までに入力されたｎ個の入
力データからなる文脈を保持し、文脈履歴保持部１０１
Ａが、入力データと文脈との組み合わせを保持し、符号
木保持部１０２Ａが、文脈毎に独立した符号木を保持す
る。

【０１５４】さらに、符号木決定部１０３Ａが、前置デ
ータ保持部１００Ａ−１〜１００Ａ−ｎに保持されてい
る直前までの入力データからデータの符号木を決定し、
符号化部１０４Ａが、符号木決定部１０３Ａで選択した
符号木のルート（頂点）からデータＫが格納されている
リーフに沿って途中に位置するノードからの分岐に従っ
て“０”か“１”で表される符号（固有のデータ）を出
力する。

【０１５５】また、符号長変更手段としての符号木更新
部１０５Ａが、符号化したリーフと他のリーフあるいは
ノードとを組み替え、前置データ更新部１０６Ａが、デ
ータＫを前置データ保持手段１００Ａ−１に登録する。
ここで、上述の動作について、図３５に示すフローチャ
ートの処理ステップＡ１〜Ａ６を参照しながら、さらに
詳述する。

【０１５６】まず、前置データ保持部１００Ａ−１〜１
００Ａ−ｎに保持されている文脈文字列Ｐを初期化し
（ステップＡ１）、符号化するデータＫを入力する（ス
テップＡ２）。符号木決定部１０３Ａは前置データ保持
部１００Ａ−１〜１００Ａ−ｎに保持されている文脈の
履歴を保持している文脈履歴保持部１０１Ａから文脈Ｐ
に対応した符号木を決定し、決定した符号木と文脈履歴
保持部１０１Ａの情報から、データＫが保持されている
リーフのノード番号（ＩＤ）と文脈Ｐのルートのノード
番号（ＩＤ）を符号化部１０４Ａに送り、符号化部１０
４Ａは、文脈Ｐに対応した符号木内において、事象Ｋ
（データＫ）のリーフからルートへのノードの分岐に対
応した符号を出力する（ステップＡ３）。なお、この符
号化部１０４Ａが行なう処理については、図３６を用い
て後に詳述する。

【０１５７】そして、符号化部１０４Ａにおいての符号
化後、符号木更新部１０５Ａは、符号木の事象Ｋのリー
フを他のリーフあるいはノードと組み替え（ステップＡ
４）、元の符号木保持部１０２Ａに格納することで符号
木の更新を行なう。なお、この符号木更新部１０５Ａが
行なう処理については、図３７を用いて後に詳述する。

【０１５８】さらに、文脈更新部１０６Ａは、最も古い
データ（前置データ保持部１００−ｎに保持されている
データ）を棄却し、入力データＫを文脈として前置デー
タ保持部１００Ａ−１に登録することで、文脈文字列Ｐ
を更新する（ステップＡ５）。そして、全てのデータに
ついて符号化が終了したかをチェックし（ステップＡ
６）、終了していなければステップＡ２からの処理を繰
り返し、終了していれば符号化処理を終了する（ステッ
プＡ６のＹＥＳルート）。

【０１５９】なお、上述のノードの組み変え（ステップ
Ａ４）と文脈更新（ステップＡ５）の処理は、どちらを
先にしてもよく、また、並列に処理してもよい。次に、
処理ステップＡ３で述べたように、図３４にて上述した
構成をもつ符号化部１０４Ａが行なう符号化処理につい
て、図３６の処理ステップＢ１〜Ｂ８を参照しながら説
明する。

【０１６０】まず、スタック４５（ｐｕｓｈ−ｄｏｗｎ
ｓｔａｃｋ）を初期化し（ステップＢ１）、カレント
ノードＬのアドレスポインタを、データＫが格納されて
いる文脈Ｐの符号木内のリーフにセットする（ステップ
Ｂ２）。そして、上述のステップＡ３で送られてきた、
データＫが保持されているリーフのノード番号（ＩＤ）
を、ラッチ４４から位置判別部４３に送り、位置判別部
４３は、この受け取ったノード番号のノードが上位ノー
ドのどちらに位置するかの情報をノード番号管理部４２
から手得し、この情報から受け取ったノードが上位ノー
ドの右手に位置するかを判別する（ステップＢ３）。

【０１６１】右手に位置する場合は“１”をスタック４
５にＰｕｓｈ（出力）し（ステップＢ３のＹＥＳルート
からステップＢ４）、左手に位置する場合は、“０”を
スタック４５にＰｕｓｈ（出力）する（ステップＢ３の
ＮＯルートからステップＢ５）。さらに、上述のステッ
プＡ３で送られてきた、もう１つのノード番号である文
脈Ｐのルートのノード番号（ＩＤ）を、上位ノード判別
部４１に送り、上位ノード判別部４１は、受け取ったノ
ード（あるいはリーフ）がルートであるか否かを判別す
る（ステップＢ６）。

【０１６２】そして、ルートであった場合、終了信号を
出力し（ステップＢ６のＹＥＳルート）、ルートではな
かった場合、ノード番号（ＩＤ）管理部４２にアクセス
し、このノード（あるいはリーフ）の上位のノード
（Ｕ）の番号を手得し、このノード（Ｕ）を新たにカレ
ントノードＬとしてアドレスポインタを上位ノードに移
動させ、ステップＢ３からの処理を繰り返す（ステップ
Ｂ６のＮＯルートからステップＢ７）。

【０１６３】このようにして、アドレスポインタがルー
トに達するまで処理を繰り返すことで、スタック４５に
は、リーフからルートへの“１”か“０”の数値で表さ
れる「道筋」が記憶される。そして、この「道筋」を、
逆に下位ビットから１ビットづつ出力（ｐｏｐ−ｕｐ出
力）することで、ルートからリーフへの「道筋」が符号
として出力される（ステップＢ８）。

【０１６４】次に、処理ステップＡ４で前述したよう
に、符号木更新部１０５Ａが、事象Ｋのリーフを他のリ
ーフあるいはノードと組み替える処理について、図３７
の処理ステップＣ１〜Ｃ９を参照しながら詳述する。ま
ず、組み替えの対象となるノードＺのアドレスポインタ
をリーフＫにセットし（ステップＣ１）、ノードＵ０に
ノードＺの上位ノードをセットする（ステップＣ２）。

【０１６５】そして、Ｋの上位ノードＵ０が符号木のル
ートかどうかを判別し（ステップＣ３）、ルートであれ
ば組み替えを終了するが（ステップＣ３のＹＥＳルート
からステップＣ９）、ルートでなければノードＵ１にノ
ードＵ０の上位ノードをセットし（ステップＣ３のＮＯ
ルートからステップＣ４）、ノードＵ０がノードＵ０の
上位ノードＵ１に対してどちらかに位置しているかを判
別する（ステップＣ５）。

【０１６６】Ｕ０がＵ１の右手にある場合は、ノードＸ
にノードＵ１の左手に位置するノードをセットし（ステ
ップＣ５のＹＥＳルートからステップＣ６）、ノードＺ
とノードＸとを取り替える（ステップＣ８）。すなわ
ち、ノードＵ１の左手のノードとリーフＫとを組み換え
る。一方、ノードＵ０がＵ１の左手にある場合は、ノー
ドＸにノードＵ１の右手に位置するノードをセットし
（ステップＣ５のＮＯルートからステップＣ７）、ノー
ドＺとノードＸとを取り替える（ステップＣ８）。すな
わち、ノードＵ１の右手のノードとリーフＫとを組み換
える。

【０１６７】さらに、ノードＺのアドレスポインタをノ
ードＵ１にセットすると（ステップＣ９）、上述のステ
ップＣ２に戻り、ステップＣ３において、セットしたア
ドレスポインタの上位ノードがルート，すなわち、アド
レスポインタがルートの直下のノードと判別されるまで
処理を繰り返す。この処理を行なうことで、アクセスさ
れたリーフのルートからの距離（符号長）は１／２にな
る。

【０１６８】以上の処理を全ての入力文字について繰り
返すことにより、文字列を符号化することができる。こ
のように、本発明の一実施形態にかかるデータ圧縮方法
を実施するためのデータ圧縮装置によれば、符号化する
文字を、木構造の文脈木に番号を付けて登録し、この文
脈木に対応した符号木をスプレイ符号化を施しながら作
成・更新することにより、出現する文字の出現頻度を求
めて確率モデルを構築して各文字に符号を割り当て符号
表を作成し、この符号表から符号化する文字の符号を出
力するという２段階の処理を同時に行なうことができる
ので、圧縮処理の速度が大幅に向上するという効果があ
る。

【０１６９】また、上述のように、文字が入力されるご
とに符号木のノードの作成・更新（スプレイ処理）によ
り確率モデルを構築するので、文字が入力されるごとに
既に構築されている確率モデルを再構築するという膨大
な演算処理を省くことができるので、圧縮処理の速度が
さらに向上する効果がある。さらに、過去に圧縮（符号
化）した文字と同じ文字が出現する毎に、過去に登録し
てあった同じ文字の符号木のノードを上位のノードと組
み替えて符号長を１／２にする（スプレイ処理）ことに
より、同じ文字（列）が繰り返し出現するほど、その文
字（列）の符号は少ないビット数で表すことができるの
で、圧縮効果が大幅に向上する効果もある。

【０１７０】（２）復元側の説明図３８は、前述のデータ復元装置４の内部の構成例を示
すブロック図であり、この図３８に示すように、２００
Ａ−１〜２００Ａ−ｎ（ｎは自然数）は前置データ保持
部、２０１Ａは文脈履歴保持部、２０２Ａは符号木保持
部、２０３Ａは符号木決定部、２０４Ａは符号化部、２
０５Ａは符号木更新部、２０６Ａは文脈更新部である。

【０１７１】ここで、前置データ保持部（前置データ保
持手段）２００Ａ−１〜２００Ａ−ｎは、過去に復号し
たｎ個のデータを保持するものであり、文脈履歴保持部
（履歴保持手段）２０１Ａは、復号したシンボルと文脈
との組み合わせを保持するものであり、符号木保持部
（符号木保持手段）２０２Ａは、文脈毎に独立した符号
木を保持するものである。

【０１７２】また、符号木決定部（符号木決定手段）２
０３Ａは、前置データ保持部２００Ａ−１〜２００Ａ−
ｎに保持されている文脈からシンボルを復号するための
符号木を決定するものであり、復号部（復号手段）２０
４Ａは、符号に従って符号木決定部２０３Ａで選択した
符号木のルート（符号木の頂点）からノード（分岐点）
を走査して到達したリーフに格納されているシンボルを
出力するものである。

【０１７３】さらに、符号木更新部（符号長変更手段）
２０５Ａは、復号したリーフと他のリーフあるいはノー
ドとを組み替えるものであり、文脈更新部（前置データ
更新手段）２０６Ａは、復号したシンボルを前置データ
保持部２００Ａ−１〜２００Ａ−ｎに登録するものであ
る。また、図３９は、上述の復号部２０４Ａの内部の構
成例を示すブロック図であり、この図３９に示すよう
に、符号に従って符号木決定部２０３Ａで選択した符号
木のルートからノードを走査して到達したリーフに格納
されているシンボルを出力するために、復号部２０４Ａ
には、ノード番号管理部（メモリ）４２と，ラッチ４４
と，下位ノード判別部４６と，葉／節判別部４７とが設
けられている。

【０１７４】ここで、ノード番号管理部（メモリ）４２
は、符号化側の説明中、図３４にて前述したものと同様
のものであり、文脈木と符号木のノード番号を管理する
ものである。また、下位ノード判別部４６は、符号と符
号木のルートのノード番号およびノード番号管理部４２
の情報から下位ノードのノード番号を得るものであり、
葉／節判別部４７は、下位ノード判別部４６からの情報
とノード番号管理部４２とから下位ノードがリーフかノ
ードかを判別するものであり、ラッチ４８は、ルートの
ノード番号を一旦保持するものである。

【０１７５】そして、上述の構成により、前置データ保
持部２００Ａ−１〜２００Ａ−ｎが、過去に復号したｎ
個の文脈（データ）を保持し、文脈履歴保持部２０１Ａ
が復号したデータＫと文脈との組み合わせを保持し、符
号木保持部２０２Ａが、文脈毎に独立した符号木を保持
する。さらに、符号木決定部２０３Ａが、前置データ保
持部２００Ａ−１〜２００Ａ−ｎに保持されている文脈
からデータＫを復号するための符号木を決定し、復号部
２０４Ａが、符号化されたデータＫの符号に従って符号
木決定部２０３Ａで選択した符号木のルート（頂点）か
らノード（分岐点）を走査して到達したリーフに格納さ
れているデータＫを出力する。

【０１７６】また、符号長変更手段としての符号木更新
部２０５Ａが、復号したリーフと他のリーフあるいはノ
ードとを組み替え、前置データ更新部２０６Ａが、復号
したデータＫを最新の文脈として前置データ保持部２０
０Ａ−１に登録する。以下、上述の処理について、図４
０に示すフローチャートの処理ステップＦ１〜Ｆ６を参
照しながら、さらに詳述する。

【０１７７】まず、前置データ保持部２００Ａ−１〜２
００Ａ−ｎに保持されているｎ個の文脈文字列Ｐを初期
化し（ステップＦ１）、復号する事象（データ）Ｋを入
力する（ステップＦ２）。符号木決定部２０３Ａは前置
データ保持部２００Ａ−１〜２００Ａ−ｎに保持されて
いる文脈の履歴を保持している文脈履歴保持部２０１Ａ
から文脈Ｐに対応した符号木を決定し、決定した符号木
のルートのノード番号（ＩＤ）と、復号する事象Ｋの符
号とを復号部２０４Ａに送り、復号部２０４Ａは、決定
した符号木内において、送られてきた符号に応じて、ル
ートから事象Ｋが格納されているリーフへ走査して符号
を復号する（ステップＦ３）。なお、この復号部２０４
Ａが行なう処理については、図４１を用いて後に詳述す
る。

【０１７８】そして、復号後、符号木更新部２０５Ａ
は、符号木の復号した事象Ｋのリーフを他のリーフある
いはノードと組み替え（ステップＦ４）、元の符号木保
持部２０２Ａに格納することで符号木の更新を行なう。
なお、この符号木更新部２０５Ａが行なうノードの組み
替え処理は、図３７のフローチャートにて前述した符号
木更新部１０５Ａが行なう処理ステップＣ１〜Ｃ９と同
様にして行なう。

【０１７９】さらに、文脈更新部２０６Ａは、最も古い
データ（前置データ保持部２００−ｎに保持されている
データ）を棄却し、復号した事象（データ）Ｋを文脈と
して前置データ保持部２００−１に登録することで、文
脈文字列Ｐを更新する（ステップＦ５）。そして、全て
のデータについて復号が終了したかをチェックし（ステ
ップＦ６）、終了していなければステップＦ２からの処
理を繰り返し（ステップＦ６のＮＯルート）、そうでな
ければ復号処理を終了する（ステップＦ６のＹＥＳルー
ト）。

【０１８０】なお、この場合も符号化側と同様に、上述
のノードの組み変え（ステップＦ４）と文脈更新（ステ
ップＦ５）の処理は、どちらを先にしてもよく、また、
並列に処理してもよい。次に、処理ステップＦ３で述べ
たように、図３９にて上述した構成をもつ復号部２０４
Ａが行なう符号化処理について、図４１に示すフローチ
ャートの処理ステップＧ１〜Ｇ７を参照しながら説明す
る。

【０１８１】まず、下位ノード判別部４６は、符号木決
定部２０３Ａから送られてきたルートのノード番号（Ｉ
Ｄ）をノードＺにセットし（ステップＧ１）、ラッチ４
８を介して同じく符号木決定部２０３Ａから送られてき
た、復号する事象Ｋの符号（１ｂｉｔ）をＣにセットす
る（ステップＧ２）。そして、Ｃにセットした復号する
事象Ｋの符号が“１”に一致するかをチェックし（ステ
ップＧ３）、“１”である（Ｙｅｓの）場合はノードＺ
の右手にあるノードをノードＺにセットし（ステップＧ
３のＹＥＳルートからステップＧ４）、“１”でない場
合（すなわち“０”の場合）はノードＺの左手にあるノ
ードをノードＺにセットする（ステップＧ３のＮＯルー
トからステップＧ５）。さらに、下位ノード判別部４６
は、ノードＺにセットしたノードのノード番号をもと
に、ノード番号管理部４２からノードＺのノード番号を
取得し、このノード番号を葉／節判別部４７に送り、こ
の葉／節判別部４７では、送られてきたノード番号をも
つノードＺの位置情報をノード番号管理部４２から手得
し、このノードＺがノードであるかリーフであるかをチ
ェックする（ステップＧ６）。

【０１８２】ノードＺがリーフでない場合（ステップＧ
６のＮＯルート）、処理はステップＧ２に戻り、復号す
る事象Ｋが格納されているリーフに到達するまで処理を
繰り返す。一方、ノードＺがリーフである場合（ステッ
プＧ６のＹＥＳルート）、復号する事象Ｋが見つかった
ことになるので、葉／節判別部４７は、ノード番号管理
部４２にシンボル（事象）出力信号を送信し、この信号
を受信したノード番号管理部４２が、このリーフに格納
されている事象Ｋ（シンボル）を出力するとともに（ス
テップＧ７）、復号処理の終了信号を出力する。

【０１８３】これにより、符号化側で作成された符号木
の“１”か“０”の数値で表される「道筋」を、事象Ｋ
が格納されているリーフまで辿ることにより符号化され
た事象Ｋを復号することができる。このように、本発明
の一実施形態にかかるデータ復元方法を実施するための
データ復元装置によれば、復号した文字を木構造の文脈
木に番号を付けて登録し、この文脈木に対応した符号木
をスプレイ処理を施しながら作成・更新することによ
り、復号する文字の符号と一致する符号を符号表から検
索し、その一致した符号に対応して登録されている文字
を復号文字として出力するという２段階の処理を同時に
行なうことができるので、データの復元処理の速度が大
幅に向上するという効果がある。

【０１８４】また、符号化側と同様に、文字が入力され
るごとに符号木のノードの作成・更新（スプレイ処理）
により構築するので、文字が入力されるごとに既に構築
されている確率モデルを再構築するという膨大な演算処
理を行なう必要がなくなり、これによりデータの復元処
理の速度がさらに向上する効果がある。さらに、これも
符号化側と同様に、過去に復号した符号と同じ符号が出
現する毎に、過去に登録してあった同じ符号の符号木の
ノードを上位のノードと組み替えて（スプレイ処理）符
号長を１／２にすることにより、同じ符号を繰り返し復
元するほど、その符号は少ないビット数で表すことがで
きるので、復元効果が大幅に向上する効果もある。（ｂ−１）一実施形態の第１の変形例の説明（１）符号化側の説明図４２は、本発明の一実施形態の変形例としてのデータ
圧縮装置３の内部の構成を示すものであり、この図４２
に示すように、本実施形態におけるデータ圧縮装置３の
内部には、一実施形態の説明中、図３３にて前述した構
成に加えて、文脈判別部１０８Ａ，文脈変更部１１０Ａ
とが設けられており、また、図３３にて前述した符号化
部１０４Ａ，符号木保持部１０５Ａの代わりに、それぞ
れ符号化部１０４Ａ′，符号木保持部１０７Ａが設けら
れている。

【０１８５】このため、この図４２中、図３３にて既述
の符号と同じ符号の構成部分の説明は省略し、図３３と
は異なる構成部分についてのみ、以下に説明する。即
ち、符号化部１０４Ａ′は符号出力手段およびエスケー
プコード出力手段として、符号木にシンボルが登録され
ていないときは符号木のルートからエスケープコードが
格納されているリーフまでの途中に位置するノードから
の分岐に従ってエスケープコードを出力し、符号木にシ
ンボルが登録されているときは符号木のルートからシン
ボルのリーフまでの途中に位置するノードからの分岐に
従ってシンボルの符号を出力するものである。

【０１８６】さらに、この符号化部１０４Ａ′は制御手
段として、エスケープコードを符号化したときはデータ
の符号化を行なうまで処理を繰り返すようになってい
る。また、符号木保持部（符号木保持手段）１０７Ａ
は、シンボルが未登録であることを示すエスケープコー
ド（ＥＳＣ）をあらかじめ登録した文脈毎に独立した符
号木を保持するものであり、文脈判別部（文脈判別手
段）１０８Ａは、符号木決定部１０３で決定した符号木
にシンボルが登録されているか否かを判別するものであ
り、文脈変更部（文脈変更手段）１１０Ａは、符号木に
シンボルが登録されていないときに文脈の長さを短くす
るものである。

【０１８７】そして、このような図３３とは異なる構成
により、図４２に示すデータ圧縮装置３では、符号化部
１０４Ａ′が、符号木にシンボルＫが登録されていない
ときは符号木のルートからＥＳＣが格納されているリー
フまでの途中に位置するノードからの分岐に従ってＥＳ
Ｃの符号を出力し、符号木にシンボルＫが登録されてい
るときは符号木のルートからシンボルＫのリーフまでの
途中に位置するノードからの分岐に従ってシンボルＫの
符号を出力する。

【０１８８】また、ＥＳＣを符号化したときはデータＫ
の符号化を行なうまで処理を繰り返す。さらに、符号木
保持部１０７Ａが、シンボルが未登録であることを示す
エスケープコード（ＥＳＣ）をあらかじめ登録した文脈
毎に独立した符号木を保持する。

【０１８９】以下、上述の処理について、図４３に示す
フローチャートの処理ステップＨ１〜Ｈ１１を参照しな
がら、さらに詳述する。まず、文脈変更部１１０Ａが、
前置データ保持部２００Ａ−１〜２００Ａ−ｎに保持さ
れている全ての文脈から文脈文字列Ｐ₀を初期化し（ス
テップＨ１）、この文脈文字列Ｐ₀を文脈Ｐにセットし
ておき（ステップＨ２）、そして、符号化するデータ
（シンボル）Ｋを入力する（ステップＨ３）。

【０１９０】さらに、文脈変更部１１０Ａは、文脈Ｐと
データＫの情報を文脈履歴保持部１０１Ａ及び符号木決
定手段１０３Ａへ送り、文脈履歴保持部１０１Ａでは、
文脈変更部１１０Ａから送られてきた文脈Ｐの情報を、
文脈判別部１０８Ａに送る。そして、文脈判別部１０８
Ａは、受信した文脈Ｐの情報からこの文脈Ｐに事象Ｋが
登録されているか否かを判別する（ステップＨ４）。

【０１９１】ここで、文脈Ｐに事象Ｋが登録されている
場合は、文脈履歴保持部１０１Ａが、符号化部１０４
Ａ′にエスケープコード（ＥＳＣ）の符号化を指示し、
符号化部１０４Ａ′では、文脈Ｐに対応した符号木内に
おいて、エスケープコード（ＥＳＣ）のリーフからルー
トへのノードの分岐に対応した符号を出力してエスケー
プコードの符号化を行なう（ステップＨ４のＮＯルート
からステップＨ５）。

【０１９２】さらに、符号化部１０４Ａ′は、符号木決
定部１０３Ａを通じて符号木更新部１０５Ａに、符号木
の更新を指示し、符号木更新部１０５Ａは、符号木のＥ
ＳＣのリーフを他のリーフあるいはノードと取り替える
（ステップＨ６）。そして、文脈Ｐの次数（符号木の初
期状態が０次である）を１つ低次に移し（ステップＨ
７）、ステップＨ４に戻り、文脈Ｐに事象Ｋが登録され
ている（Ｙｅｓ）と判断されるまで処理を繰り返す。

【０１９３】一方、上述のステップＨ４で、文脈Ｐに事
象Ｋが登録されている（Ｙｅｓの）場合は、文脈履歴保
持部１０１Ａが、符号化部１０４Ａ′に事象Ｋの符号化
を指示し、符号化部１０４Ａ′では、文脈Ｐに対応した
符号木内において、事象Ｋのリーフからルートへのノー
ドの分岐に対応した符号を出力して符号化を行なう（ス
テップＨ４のＹＥＳルートからステップＨ８）。

【０１９４】そして、符号化部１０４Ａ′は、符号木決
定部１０３Ａを通じて符号木更新部１０５Ａに、符号木
の更新を指示し、符号木更新部１０５Ａは、符号木の事
象Ｋのリーフと他のリーフあるいはノードとを組み替え
る（ステップＨ９）。さらに、文脈更新部１０６Ａが最
も古いデータ（前置データ保持部１００−ｎに保持され
ているデータ）を棄却して入力データＫの文脈を前置デ
ータ保持部１００Ａ−１に登録し、この情報から文脈変
更部１１０Ａが文脈文字列Ｐ₀の更新を行なう（ステッ
プＨ１０）。

【０１９５】そして、全てのデータについて符号化が終
了したかをチェックし（ステップＨ１１）、終了してい
ない場合は（ステップＨ１１のＮＯルート）、ステップ
Ｈ２に戻り、全てのデータを符号化するまでステップＨ
２以降の処理を繰り返し、終了している場合は（ステッ
プＨ１１のＹＥＳルート）、符号化の全ての処理を終了
する。

【０１９６】なお、上述のステップＨ５およびステップ
Ｈ８における符号出力処理の詳細については、本実施形
態中、図３６にて前述した処理ステップＢ１〜Ｂ８を参
照されたく、ステップＨ６およびステップＨ９における
リーフあるいはノードの組み替え処理の詳細について
は、同じく本実施形態中、図３７にて上述した処理ステ
ップＣ１〜Ｃ９を参照されたい。

【０１９７】このように、本発明の一実施形態の第１変
形例にかかるデータ圧縮装置によれば、シンボルが登録
されていないことを表すエスケープコード（ＥＳＣ）を
予め符号木に登録しておき、符号化するシンボルが予め
登録されている文脈に含まれない間（シンボルが含まれ
る文脈を発見して符号化するまでの間）はこのエスケー
プコードの符号を出力することにより、入力データとし
て現れるシンボルの組み合わせ（文脈）全てを予め登録
しておかなくてもよいので、文脈の登録に使用するメモ
リを大幅に削減できる利点がある。

【０１９８】そして、上述のように予め登録されている
文脈に符号化するシンボルが含まれない間に出力するエ
スケープコードの符号長を、スプレイ処理により短く
（１／２）してゆくことにより、シンボルが含まれる文
脈を発見して符号化するまでの時間を短縮することがで
きるので、データ圧縮の処理速度が大幅に向上するとと
もにデータ圧縮装置の処理負荷も大幅に軽減できる効果
がある。

【０１９９】（２）復元側の説明図４４は、本発明の一実施形態の第１の変形例としての
データ復元装置４の内部の構成を示すものであり、この
図４４に示すように、本実施形態におけるデータ復元装
置４の内部には、本実施形態の説明中、図３８にて前述
した構成に加えて、文脈変更部２１０Ａが設けられてお
り、また、復号部２０４Ａ，符号木保持部２０５Ａの代
わりに、それぞれ復号部２０４Ａ′，符号木保持部２０
７Ａが設けられている。

【０２００】このため、この図４４中、図３８にて既述
の符号と同じ符号の構成部分の説明は省略し、図３８に
示す構成とは異なる構成部分について、以下に説明す
る。即ち、符号木保持部（符号木保持手段）２０７Ａ
は、エスケープコードをあらかじめ登録した符号木を保
持するものであり、文脈変更部（文脈変更手段）２１０
Ａは、出力したデータがエスケープコードであったとき
入力されたデータを棄却し文脈を短くするものである。

【０２０１】また、復号部２０４Ａ′は復号手段とし
て、上述の符号化側で符号化された符号に従って、符号
木決定部２０３Ａで選択した符号木のルート（頂点）か
らノード（分岐点）を走査して到達したリーフに格納さ
れているデータを出力するものである。さらに、復号部
２０４Ａ′は制御手段として、エスケープコードを復号
した時は、文脈変更部２１０Ａで上述のように文脈を再
設定し、エスケープコード以外のデータが復号されるま
で処理を繰り返す制御を行なうようになっている。

【０２０２】そして、上述のような図３８に示す構成と
は異なる構成により、図４４に示すデータ復元装置で
は、符号木保持部２０７ＡがＥＳＣをあらかじめ登録し
た符号木を保持し、文脈変更部２１０Ａが出力したデー
タＫがＥＳＣであったとき入力されたデータＫを棄却し
文脈を短くする。また、復号部２０４Ａ′が、符号化さ
れたデータＫの符号に従って、符号木決定部２０３Ａで
選択した符号木のルートからノードを走査して到達した
リーフに格納されているデータＫを出力し、ＥＳＣを復
号した時は、文脈変更部２１０Ａで文脈の次数を変更
し、ＥＳＣ以外のデータＫが復号されるまで処理を繰り
返す。

【０２０３】ここで、上述のような動作について、図４
５に示すフローチャートの処理ステップＪ１〜Ｊ９を参
照しながら、さらに詳述する。まず、文脈変更部２１０
Ａが、前置データ保持部２００Ａ−１〜２００Ａ−ｎに
保持されている全ての文脈から文脈文字列Ｐ₀を初期化
し（ステップＪ１）、この文脈文字列Ｐ₀を文脈Ｐにセ
ットしておく（ステップＪ２）。

【０２０４】そして、文脈変更部１１０Ａは、この文脈
Ｐを文脈履歴保持部２０１Ａおよび符号木決定部２０３
Ａに送り、符号木決定部２０３Ａでは、受け取った文脈
Ｐから符号木を選択（決定）し（ステップＪ３）、決定
した符号木を復号部２０４Ａ′に送る。復号部２０４
Ａ′では、決定した符号木内において、符号化側で符号
化された符号に応じてルートからリーフへ走査して符号
を復号する（ステップＪ４）。なお、この復号部２０４
Ａ′が行なう処理の詳細については、本実施形態中、図
４１にて前述した処理ステップＧ１〜Ｇ７を参照された
い。

【０２０５】そして、復号部２０４Ａ′は、復号した事
象ＫがＥＳＣ（エスケープコード）であるか否かをチェ
ックし（ステップＪ５）、復号した事象ＫがＥＳＣであ
る場合は、ＥＳＣ信号を文脈変更部２１０Ａに送信する
（ステップＪ５のＹＥＳルート）。さらに、このＥＳＣ
信号を受信した文脈変更部２１０Ａでは、文脈Ｐの次数
を１つ低次に移して変更し（例えば、前置データ保持部
２００−ｎに保持されている最も古いデータを無視して
ｎ−１次の文脈Ｐを作る）（ステップＪ６）、この文脈
Ｐを文脈履歴保持部２０１及び符号木決定手段２０３へ
送り、処理はステップＪ３に戻る。

【０２０６】すなわち、復号化部２０４Ａ′が、ＥＳＣ
以外の事象Ｋを復号するまでステップＪ２からの処理を
繰り返す。一方、復号した事象ＫがＥＳＣでない場合
は、復号した事象Ｋのリーフを他のリーフあるいはノー
ドと組み替える（ステップＪ５のＮＯルートからステッ
プＪ７）。なお、このリーフあるいはノードの組み替え
処理の詳細については、本実施形態中、図３７にて前述
したフローチャートにおける処理ステップＣ１〜Ｃ９を
参照されたい。

【０２０７】さらに、文脈更新部２０６Ａは、最も古い
データ（前置データ保持部２００−ｎに保持されている
データ）を棄却し、復号した事象Ｋを文脈として前置デ
ータ保持部２００−１に挿入して登録し、文脈文字列Ｐ
₀を更新する（ステップＪ８）。そして、全てのデータ
について復号が終了したかをチェックし（ステップＪ
９）、終了していなければ、ステップＪ２からの処理を
繰り返し（ステップＪ９のＮＯルートからステップＪ
２）、そうでなければ復号処理を終了する（ステップＪ
９のＹＥＳルート）。

【０２０８】なお、この場合も符号化側と同様に、上述
のノードの組み変え（ステップＪ７）と文脈更新（ステ
ップＪ８）の処理は、どちらを先にしてもよく、また、
並列に処理してもよい。このように、本発明の一実施形
態の第１の変形例にかかるデータ復元装置によれば、シ
ンボルが登録されていないことを表すエスケープコード
（ＥＳＣ）を予め符号木に登録しておき、復号したシン
ボルがこのエスケープコードであった場合に、エスケー
プコード以外の符号（すなわち、復号するシンボルの符
号）を復号するまで文脈を短く（変更）して復号するシ
ンボルの符号を検索することにより、入力データとして
現れるシンボルの組み合わせ（文脈）全てを予め符号木
に登録しておかなくてもよいので、文脈の登録に使用す
るメモリを大幅に削減できる利点がある。

【０２０９】そして、上述のように復号したシンボルが
エスケープコードである間、このエスケープコードの符
号長をスプレイ処理により短く（１／２）してゆくこと
により、復号するシンボルが含まれる文脈を発見して復
号するまでの時間を短縮することができるので、データ
復元処理の速度が大幅に向上するとともにデータ復元装
置の処理負荷も大幅に軽減できる効果がある。（ｂ−２）一実施形態の第２の変形例の説明（１）符号化側の説明図４６は、本発明の一実施形態の第２の変形例としての
データ圧縮装置３の内部の構成例を示すものであり、こ
の図４６に示すように、本実施形態におけるデータ圧縮
装置３の内部には、本実施形態の第１の変形例の説明
中、図３８にて前述した構成に加えて、さらに符号登録
部１１２Ａが設けられている。

【０２１０】このため、この図４２中、図３３にて既述
の符号と同じ符号の構成部分の説明は省略する。また、
符号登録部１１２Ａは、入力されたデータＫが符号木に
登録されていないときに、このデータＫを符号木に登録
するものである。このような構成により、入力されたデ
ータＫが符号木に登録されていないときに、符号登録部
１１２Ａが符号木にデータＫを登録するようにすること
ができる。

【０２１１】ここで、上述のような動作について、図４
７の処理ステップＫ１〜Ｋ１２を参照しながら説明する
が、ここで、この図４７に示すように、ステップＫ８以
外の処理は、本実施形態の第１の変形例の説明中、図４
３のフローチャートにて前述した処理ステップＨ１〜Ｈ
１１と同様の処理である。すなわち、本実施形態ではス
テップＫ１〜Ｋ７において、図４３中のステップＨ１〜
Ｈ７と同様の処理が行なわれ、そのあとにステップＫ８
にかかる処理が行われる。

【０２１２】すなわち、文脈判別部１０８Ａが、文脈木
に事象Ｋが登録されていないと判別した場合（ステップ
Ｋ４のＮＯルート）、符号木更新部１０５Ａが、符号木
のＥＳＣのリーフを他のリーフあるいはノードと組み替
えてＥＳＣの符号を変更し（ステップＫ６）、文脈履歴
保持部１０１Ａが現在の文脈Ｐを符号登録手段１１２Ａ
に送り、文脈変更部１１０Ａが文脈Ｐの次数を１つ低次
に移して変更した（ステップＫ７）後、符号登録部１１
２Ａが符号木に事象Ｋを登録する（ステップＫ８）。

【０２１３】なお、ステップＫ４において、文脈木に事
象Ｋが登録されていると判別された場合においても、ス
テップＫ９〜Ｋ１２において、前述の図４３におけるス
テップＨ８〜Ｈ１１と同様の処理が行なわれている。こ
のように、本発明の一実施形態の第２の変形例にかかる
データ圧縮装置によれば、上述のように、ステップＫ８
以外は、本実施形態の第１の変形例の符号化側における
における図４３の処理ステップと同様であるので、本実
施形態の第１の変形例の符号化側の効果と同様の効果が
ある。

【０２１４】さらに、上述のように、ステップ８をとる
ことで、エスケープコードを符号化した間シンボルを符
号木上に登録してゆき、符号木に予め登録されていなか
ったシンボルについても次の符号化では早い段階（高次
の次数）で符号化することができるので、符号化が進む
ほど圧縮効果が大幅に向上する効果がある。（２）復元側の説明図４８は、本発明の一実施形態の第２の変形例としての
データ復元装置４の内部の構成例を示すものであり、こ
の図４８に示すように、本実施形態におけるデータ復元
装置４の内部には、本実施形態の第１の変形例の復元側
の説明中、図４４にて前述した構成に加えて、さらに符
号登録部２１２Ａが設けられている。なお、この符号登
録部２１２Ａは、符号化側の構成（図４６参照）に対応
して、設けられているものである。

【０２１５】このため、この図４８中、図４４にて既述
の符号と同じ符号の構成部分の説明は省略する。符号登
録部２１２Ａは、圧縮側で符号化されたデータの復号処
理でＥＳＣ（エスケープコード）を復号したときに、文
脈に対応した全ての符号木に、この復号したデータの符
号を登録するものである。

【０２１６】これにより、図４４にて前述した構成がと
る動作に加えて、符号登録部２１２Ａが、符号化された
データＫの復号処理において、ＥＳＣを復号したとき
に、文脈に対応した全ての符号木に、この復号したデー
タＫの符号を登録することができる。上述の動作につい
て、図４９の処理ステップＬ１〜Ｌ１０を参照しなが
ら、さらに詳述する。

【０２１７】ここで、この図４９に示すように、処理ス
テップＬ１〜Ｌ４においては、本実施形態の第１の変形
例の復元側における、図４５にて前述した処理ステップ
Ｊ１〜Ｊ４と同様の処理が行なわれる。そして、ステッ
プＬ４で、復号部２０４Ａが符号を復号した後、符号木
更新部２０５Ａが、復号した事象Ｋのリーフを他のリー
フあるいはノードと組み替え（ステップＬ５）。

【０２１８】さらに、符号木更新部２０５Ａは、この時
点で、以前にＥＳＣ（エスケープコード）が復号されて
おり、復号部２０４ＡからのＥＳＣ信号を受信している
と、このＥＳＣを復号した全ての符号木に事象Ｋを登録
する（ステップＬ６）。さらに、復号した事象ＫがＥＳ
Ｃであるかを判別し（ステップＬ７）、復号した事象Ｋ
がＥＳＣである場合は、復号した事象ＫがＥＳＣである
ことを示すＥＳＣ信号を、文脈変更部２１０Ａおよび符
号登録部２１２Ａに送信し、このＥＳＣ信号を受信した
文脈変更部２１０Ａは、文脈Ｐの次数を１つ低次に移し
て変更し（ステップＬ７のＹＥＳルートからステップＬ
８）、処理はステップＬ３に戻って、ＥＳＣ以外の事象
Ｋを復号するまで処理を繰り返す。

【０２１９】このようにして、復号部２０４Ａで復号し
た事象ＫがＥＳＣである場合は、符号登録部２１２Ａが
符号木に新規のリーフを作成し、復号部２０４がＥＳＣ
以外の事象をＫを復号したとき、この事象Ｋを新規に作
成した全てのリーフに格納することにより、ＥＳＣを復
元した全ての符号木に該シンボルを登録することができ
る。

【０２２０】一方、上述のステップＬ７で、復号した事
象ＫがＥＳＣでない場合は、文脈更新部２０６Ａが、最
も古いデータ（前置データ保持部２００−ｎに保持され
ているデータ）を棄却し、復号した事象Ｋを文脈として
前置データ保持部２００−１に挿入して登録し、文脈文
字列Ｐ₀を更新する（ステップＬ９）。そして、全ての
データについて復号が終了したかをチェックし（ステッ
プＬ１０）、終了していなければステップＬ２からの処
理を繰り返し（ステップＬ１０のＮＯルート）、終了し
ていれば復号処理を終了する（ステップＬ１０のＹＥＳ
ルート）。

【０２２１】以上のように、復号側でも符号化側と同様
に、復号部２０４ＡがＥＳＣを復号したときは、符号木
登録部２１２Ａが符号木に事象Ｋを新規に登録する。こ
のように、本発明の一実施形態の第２の変形例にかかる
データ復元装置によれば、符号化側と同様に、本実施形
態の第１の変形例における復元側にて前述した効果に加
えて、エスケープコードの符号を復号した場合の間、復
号するシンボルの符号を符号木上に登録してゆくこと
で、符号木に登録されていないシンボルについても次の
復号では早い段階で復号することができるので、文字な
どのデータの復号処理が進むほど復元効果が大幅に向上
するとともにデータ復元装置の処理負荷も大幅に軽減で
きる効果がある。（ｂ−３）本実施形態の第３の変形例の説明（１）符号化側の説明本実施形態の第３の変形例において、上述のデータ圧縮
装置３は、前述の第２の変形例に比して、データＫを符
号化する際、一度でもＥＳＣを符号化したときは、履歴
登録手段としての文脈変更部１１０Ａが、このデータの
符号化の直前の文脈とこのデータとの組み合わせを文脈
履歴保持部１０１Ａに登録し、符号登録部１１２Ａが、
このデータを符号化する直前に符号化したエスケープコ
ードを持つ符号木にデータを新規に登録するようにする
ことができる点が異なる。

【０２２２】以下、上述の処理について、図５０に示す
処理ステップＭ１〜Ｍ１３を参照しながら、さらに詳述
する。ここで、この図５０に示すように、ステップＭ１
〜Ｍ９は、本実施形態の第１の変形例の説明で用いた図
４３の処理ステップＨ１〜Ｈ９とそれぞれ同様の処理が
行なわれる。

【０２２３】そして、文脈Ｐに入力データの事象Ｋが登
録されている場合は（ステップＭ４のＹＥＳルート）、
ステップＭ８を経由して、ステップＭ９で符号木の組み
替えを行なった後は、復号部１０４がステップＭ８で符
号化した事象ＫがＥＳＣであるかをチェックする（ステ
ップＭ１０）。符号化した事象ＫがＥＳＣである場合
は、符号登録部１１２Ａがこの事象Ｋを符号化する直前
の文脈Ｐ’に対応する符号木に事象Ｋを登録し（ステッ
プＭ１０のＹＥＳルートからステップＭ１１）、文脈更
新部１０６Ａが事象Ｋを含む文脈Ｐを、最も新しい文脈
として前置データ保持部１００Ａ−１に登録する。

【０２２４】さらに、この情報から文脈変更部１１０Ａ
が、文脈文字列Ｐ₀にデータＫを挿入して更新し（ステ
ップＭ１２）、文脈履歴保持部１０１Ａに登録する。つ
まり、ステップＭ１１でデータＫを符号化する直前の文
脈Ｐ’（すなわち最後に符号化された文脈）の符号木に
データＫが登録されているので、データＫとこのデータ
Ｋを符号化する直前の文脈Ｐ’との組み合わせが文脈変
更部１０６Ａにより文脈履歴保持部１０１Ａに登録され
ることになる。

【０２２５】一方、符号化した事象ＫがＥＳＣでない場
合は（ステップＭ１０のＮＯルート）、ステップＭ１１
をスキップして、上述のステップＭ１２を行なう。さら
に、全てのデータの符号化が終了したかをチェックし
（ステップＭ１３）、終了していない場合は（ステップ
Ｍ１３のＮＯルート）、処理はステップＭ２に戻り、全
てのデータの符号化が終了するまで処理を繰り返し、終
了している場合は、符号化の処理を終了する（ステップ
Ｍ１３のＹＥＳルート）。

【０２２６】このように、本発明の一実施形態の第３の
変形例にかかるデータ圧縮装置によれば、本実施形態の
第２の変形例の符号化側にて前述した効果に加えて、予
め登録された文脈にシンボルが含まれない場合、最後に
符号化したエスケープコードの符号木にのみこのシンボ
ルを登録してゆくことにより、新たな文脈を登録するた
めに使用するメモリの量を大幅に削減することができる
ので、データ圧縮装置の性能が大幅に向上する効果があ
る。

【０２２７】さらに、上述のようにして新たに登録され
たシンボルと、同じシンボルが後に入力される毎にこの
シンボルの符号木のノードを組み替えて符号長を短くす
る（スプレイ処理する）ことにより、実際に出現頻度が
高いシンボルについてのみ、その符号の符号長を短くす
ることができるので、データ圧縮装置の圧縮効果が大幅
に向上する効果がある。

【０２２８】（２）復元側の説明本実施形態の第３の変形例にかかるデータ復元装置４
は、図４８に示したデータ復元装置４に比して、履歴登
録手段としての文脈変更部２１０Ａが、符号化側で符号
化されたデータＫの復号処理で、最後にＥＳＣ（エスケ
ープコード）を復号した時の文脈と復号したデータＫと
を文脈履歴保持部２０１Ａに登録し、符号登録部２１２
Ａが、データＫの復号処理で最後にＥＳＣを復号した時
の文脈に対応した符号木にデータＫの符号を登録するよ
うにすることができる点が異なる。

【０２２９】上述のような処理について、図５１の処理
ステップＮ１〜Ｎ１０を参照しながら、さらに詳述す
る。ここで、この図５１に示すように、ステップＮ１〜
Ｎ５において、前述の第２の変形例の復元側の説明で用
いた図４９のステップＫ１〜Ｋ５とそれぞれ同様の処理
が行なわれる。

【０２３０】そして、本実施形態の復元側では、ステッ
プＮ５で復号した事象Ｋのリーフを他のリーフあるいは
ノードと組み替えた後に、復号した事象ＫがＥＳＣであ
るかをチェックする（ステップＮ６）。復号した事象Ｋ
がＥＳＣである場合は、文脈Ｐの次数を変更し（ステッ
プＮ６のＹＥＳルートからステップＮ７）、処理はステ
ップＮ３に戻って、ＥＳＣ以外の事象Ｋを復号するまで
処理を繰り返す。

【０２３１】一方、復号した事象ＫがＥＳＣでない場合
は、符号木更新部２０５Ａは、直前のＥＳＣを復号した
符号木のみに新規リーフを作成し、符号登録部２１２Ａ
がこの符号木の新規リーフに事象Ｋを登録する（ステッ
プＮ６のＮＯルートからステップＮ８）。さらに、文脈
更新部２０６Ａが、最も古いデータ（前置データ保持部
２００−ｎに保持されているデータ）を棄却し、復号し
た事象Ｋを文脈として前置データ保持部２００−１に挿
入して登録し、文脈文字列Ｐ₀を更新する（ステップＮ
９）。

【０２３２】そして、全てのデータについて復号が終了
したかをチェックし（ステップＮ１０）、終了していな
ければ、ステップＮ２からの処理を繰り返し（ステップ
Ｎ１０のＮＯルートからステップＮ２）、終了していな
ければ復号処理を終了する。このように、本発明の一実
施形態の第３の変形例にかかるデータ復元装置によれ
ば、本実施形態の第２の変形例の復元側にて前述した効
果に加えて、予め登録された文脈にシンボルが含まれな
い場合、最後に復号したエスケープコードの符号木にの
みこのシンボルの符号を新規に登録してゆくことによ
り、１つのシンボルに対して常に１つ以下の登録で済
み、新たなシンボルの符号を登録するために使用するノ
ードＩＤ管理用のメモリを大幅に削減することがきるの
で、データ復元装置の性能が大幅に向上する効果があ
る。

【０２３３】さらに、上述のようにして新たに登録され
たシンボルと、同じシンボルが後に入力される毎にこの
シンボルの符号木のノードを組み替えて符号長を短くす
る（スプレイ処理する）ことにより、実際に出現頻度が
高いシンボルについてのみ、符号長の短い符号をもつこ
とになるので、データ復元装置の復元効果が大幅に向上
する効果がある。

【０２３４】（ｃ）本発明に関連する技術２の説明次に、本発明に関連する技術２について説明するが、ま
ず、その原理について説明する。本発明に関連する技術
２に係るデータ圧縮方法を実施するための装置の構成
を、図９に示す。この図９に示すデータ圧縮装置は、入
力データを過去に出現した履歴に応じて符号化するもの
である。

【０２３５】ここで、３０１は符号木保持手段、３０２
は文脈木保持手段、３０３は文脈登録手段、３０４は符
号登録手段、３０５は文脈変更手段、３０６は符号化手
段、３０７は符号更新手段である。符号木保持手段３０
１は、予めデータ未登録を示すデータとして定義される
エスケープコードを登録した符号木を保持するものであ
り、文脈木保持手段３０２は、入力データと文脈との組
み合わせを登録した文脈木を保持するものであり、文脈
登録手段３０３は、エスケープコードを符号化したの
ち、文脈木にデータを新規に登録するものである。

【０２３６】さらに、符号登録手段３０４は、エスケー
プコードを符号化したのち符号木のエスケープコードの
データ格納点としてのリーフを分岐してデータを新規に
登録するものであり、文脈変更手段３０５は、入力デー
タと文脈との組み合わせが文脈木に保持されていないと
き、文脈を変更するものである。また、符号化手段３０
６は、符号木の頂点からの入力データあるいはエスケー
プコードが登録してあるリーフまでの分岐に従って符号
を出力するものであり、符号更新手段３０７は、符号化
したデータ及びエスケープコードが登録してあるリーフ
と他のリーフあるいはノードとを取り替えるものであ
る。

【０２３７】また、本発明に関連する技術２に係る他の
データ圧縮方法を実施するための装置の構成を、図１０
に示す。この図１０に示データ圧縮装置も、入力データ
を過去に出現した履歴に応じて符号化するものである。
この図１０に示すデータ圧縮装置は、前述の図９におけ
るものと同様の符号木保持手段３０１，文脈木保持手段
３０２，文脈登録手段３０３，文脈変更手段３０５，符
号化手段３０６，符号更新手段３０７をそなえており、
これらの説明は省略する。

【０２３８】また、３１０は分岐位置検索手段であり、
この分岐位置検索手段３１０は、符号木上の最長の符号
長を持つリーフを検索するものである。３１１は符号登
録手段であり、この符号登録手段３１１は、エスケープ
コードを符号化したのち、分岐位置検索手段１１０に検
索されたデータ格納点としてのリーフを分岐してデータ
を新規に登録するものである。

【０２３９】さらに、本発明に関連する技術２に係る他
のデータ圧縮方法を実施するための装置の構成を、図１
１に示す。この図１１に示すデータ圧縮装置も、入力デ
ータを過去に出現した履歴に応じて符号化するものであ
る。ここで、この図１１に示すデータ圧縮装置において
も、前述の図９におけるものと同様の符号木保持手段３
０１，文脈木保持手段３０２，文脈登録手段３０３，文
脈変更手段３０５，符号化手段３０６，符号更新手段３
０７をそなえており、これらの説明は省略する。

【０２４０】３０８は分岐位置保持手段であり、この分
岐位置保持手段３０８は、符号木に新規に登録されたデ
ータ格納点としてのリーフの位置を保持するものであ
る。さらに、３０９は符号登録手段であり、この符号登
録手段３０９は、エスケープコードを符号化したのち、
分岐位置保持手段３０８に保持されている位置にあるリ
ーフを分岐してデータを新規に登録するものである。

【０２４１】一方、本発明に関連する技術２に係るデー
タ復元方法を実施するための装置の構成を、図１２に示
す。この図１２に示すデータ復元装置は、入力データを
過去の入力データの履歴に応じて符号化した符号を復号
するものである。ここで、４０１は符号木保持手段、４
０２は文脈木保持手段、４０３は符号木決定手段、４０
４は復号手段、４０５は文脈変更手段、４０６は符号更
新手段、４０７は符号登録手段、４０８は文脈木登録手
段である。

【０２４２】符号木保持手段４０１は、予めデータ未登
録を示すデータとして定義されるエスケープコードを登
録した符号木を保持するものであり文脈木保持手段４０
２は、復号したデータと文脈との組み合わせを登録した
文脈木を保持するものであり、符号木決定手段４０３
は、直前までに復号したデータから符号の符号木を決定
するものである。

【０２４３】さらに、復号手段４０４は、符号に従って
符号木の頂点を意味するルートからデータ格納点として
のリーフへと走査して符号を復号するものであり、文脈
変更手段４０５は、到達したリーフがエスケープコード
であった場合、文脈を変更するものであり、符号更新手
段４０６は、復号したデータ及びエスケープコードのリ
ーフを他のリーフあるいは分岐点としてのノードと組み
替えるものである。

【０２４４】また、符号登録手段４０７は、エスケープ
コードを復号したとき、エスケープコードのリーフを分
岐して復号したデータを新規に登録するものであり、文
脈木登録手段４０８は、符号登録手段４０７で登録した
データを文脈保持手段４０２の文脈木に登録するもので
ある。さらに、本発明に関連する技術２に係る他のデー
タ復元方法を実施するための装置の構成を、図１３に示
す。この図１３に示すデータ復元装置も、入力データを
過去の入力データの履歴に応じて符号化した符号を復号
するもので、ここで、この図１３に示すデータ復元装置
は、前述の図１２に示すものと同様の符号木保持手段４
０１，文脈木保持手段４０２，符号木決定手段４０３，
復号手段４０４，文脈変更手段４０５，符号更新手段４
０６をそなえており、これらの説明は省略する。

【０２４５】また、４１１は分岐位置検索手段であり、
この分岐位置検索手段４１１は、符号木内の最長の符号
長を持つリーフの位置を検索するものである。そして、
４１２は符号登録手段であり、この符号登録手段４１２
は、エスケープコードを符号化したのち分岐位置検索手
段４１１で検索されたリーフを分岐してデータを新規に
登録するものである。

【０２４６】さらに、４１３は文脈木登録手段であり、
この文脈木登録手段４１３は、符号登録手段４１２で登
録したデータを文脈木保持手段４０２の文脈木に登録す
るものである。さらに、本発明に関連する技術２に係る
データ復元方法を実施するための装置の構成を、図１４
に示す。この図１４に示すデータ復元装置も、入力デー
タを過去の入力データの履歴に応じて符号化した符号を
復号するものである。

【０２４７】ここで、この図１４に示すデータ復元装置
においても、前述の図１２に示すものと同様の符号木保
持手段４０１，文脈木保持手段４０２，符号木決定手段
４０３，復号手段４０４，文脈変更手段４０５，符号更
新手段４０６をそなえており、これらの説明は省略す
る。また、４０９は分岐位置保持手段であり、この分岐
位置保持手段４０９は、符号木に新規に登録されたリー
フの位置を保持するものである。

【０２４８】さらに、４１０は符号登録手段であり、こ
の符号登録手段４１０は、エスケープコードを符号化し
たのち、分岐位置保持手段４０９に保持されている位置
にあるリーフを分岐してデータを新規に登録するもので
ある。４１４は文脈木登録手段であり、この文脈木登録
手段４１４は、符号登録手段４１０で登録したデータを
文脈保持手段４０２の文脈木に登録するものである。

【０２４９】そして、本発明に関連する技術２に係るデ
ータ圧縮方法では、次のような作用がある。（１）文脈木保持過程により、入力データとそれまでに
連続したｎ個のデータからなる文脈との組み合わせを登
録した文脈木を保持することができる。（２）符号木保持過程により、文脈毎に独立した符号木
を保持することができる。

【０２５０】（３）文脈木新規登録過程により、入力デ
ータと文脈との組み合わせが文脈木保持過程に保持され
ていないとき、文脈木保持過程の文脈木にデータを新規
に登録することができる。（４）符号木新規登録過程により、入力データと文脈と
の組み合わせが文脈木保持過程に保持されていないと
き、符号木保持過程の符号木にデータを新規に登録する
ことができる。

【０２５１】（５）新規登録過程により、入力データと
文脈との組み合わせが文脈木保持過程に保持されていな
いとき、符号木保持過程の符号木のデータ格納点として
のリーフを分岐して得た新規リーフにデータを格納する
ことができる。（６）文脈変更過程により、入力データと文脈との組み
合わせが文脈木保持過程に保持されていないとき文脈を
変更することができる。

【０２５２】（７）符号出力過程により、符号木の頂点
からの入力データあるいは符号木中の特定コードが登録
してあるリーフまでの分岐に従って符号を出力すること
ができる。（８）符号長変更過程により、入力データあるいは符号
木中の特定コードが登録してあるリーフと他のリーフあ
るいは符号木の頂点以外の分岐点として定義されるノー
ドとを取り替えることができる。

【０２５３】（９）新規登録過程では、特定コードを登
録してあるリーフを分岐し、得た２つの新規リーフに特
定コードと新規データとを登録することができる。そし
て、本発明に関連する技術２に係るデータ圧縮方法は、
次のような作用がある。（１）符号木保持過程により、予め未登録を示すデータ
として定義されるエスケープコードを登録した符号木を
保持することができる。

【０２５４】（２）文脈木保持過程により、入力データ
とそれまでに連続したｎ個のデータからなる文脈との組
み合わせを登録した文脈木を保持することができる。（３）文脈木新規登録過程により、入力データと文脈と
の組み合わせが文脈木保持過程に保持されていないと
き、文脈木保持過程の文脈木にデータを新規に登録する
ことができる。

【０２５５】（４）符号木新規登録過程により、入力デ
ータと文脈との組み合わせが文脈木保持過程に保持され
ていないとき、符号木保持過程の符号木にデータを新規
に登録することができる。（５）新規登録過程により、入力データと文脈との組み
合わせが文脈木保持過程に保持されていないとき、符号
木保持過程の符号木のデータ格納点としてのリーフを分
岐して得た新規リーフにデータを格納することができ
る。

【０２５６】（６）文脈変更過程により、入力データと
文脈との組み合わせが文脈木保持過程に保持されていな
いとき文脈を変更することができる。（７）符号出力過程により、符号木の頂点からの入力デ
ータあるいはエスケープコードが登録してあるリーフま
での分岐に従って符号を出力することができる。（８）符号長変更過程により、入力データあるいはエス
ケープコードが登録してあるリーフと他のリーフあるい
は符号木の頂点以外の分岐点として定義されるノードと
を取り替えることができる。

【０２５７】（９）新規登録過程では、エスケープコー
ドを登録してあるリーフを分岐し、得た２つの新規リー
フにエスケープコードと新規データとを登録することが
できる。また、上述の（５）の新規登録過程では、同じ
文脈の下にあるリーフのうち、符号木の頂点として定義
されるルートからの距離が最も長いリーフを分岐し、得
た２つの新規リーフに、分岐したリーフに格納していた
データと、新規データとを登録することもでき、同じ文
脈の下にあるリーフのうち、最後に登録したリーフを分
岐し、得た２つの新規リーフに、分岐したリーフに格納
していたデータと、新規データとを登録することもでき
る。

【０２５８】一方、本発明に関連する技術２に係るデー
タ復元方法には、次のような作用がある。（１）文脈木保持過程により、復号したデータと文脈と
の組み合わせを登録した文脈木を保持することができ
る。（２）符号木保持過程により、文脈に応じておのおの独
立した符号木を保持することができる。

【０２５９】（３）符号木決定過程により、直前までに
復号したデータから符号の符号木を決定することができ
る。（４）復号過程により、符号に従って符号木の頂点を意
味するルートからデータ格納点としてのリーフへと走査
して符号を復号することができる。（５）文脈変更過程により、到達したリーフが符号木中
の特定コードであった場合、文脈を変更することができ
る。

【０２６０】（６）符号長変更過程により、復号したデ
ータ及び特定コードのリーフを他のリーフあるいは分岐
点としてのノードと組み替えることができる。（７）新規登録過程により、特定コードを復号したとき
符号木に復号したデータを新規に登録することができ
る。（８）文脈木登録過程により、新規登録過程で登録した
データを文脈木保持過程の文脈木に登録することができ
る。

【０２６１】（９）新規登録過程では符号化側で分岐に
選択したリーフと同じリーフを分岐して新規データを登
録することができる。さらに、本発明に関連する技術２
に係るデータ復元方法は、次のような作用がある。（１）符号木保持過程により、予めデータ未登録を示す
データとして定義されるエスケープコードを登録した符
号木を保持することができる。

【０２６２】（２）文脈木保持過程により、復号したデ
ータと文脈との組み合わせを登録した文脈木を保持する
ことができる。（３）符号木決定過程により、直前までに復号したデー
タから符号の符号木を決定することができる。（４）復号過程により、符号に従って符号木の頂点を意
味するルートからデータ格納点としてのリーフへと走査
して符号を復号することができる。

【０２６３】（５）文脈変更過程により、到達したリー
フがエスケープコードであった場合、文脈を変更するこ
とができる。（６）符号長変更過程により、復号したデータ及びエス
ケープコードのリーフを他のリーフあるいは分岐点とし
てのノードと組み替えることができる。（７）新規登録過程により、エスケープコードを復号し
たとき符号木に復号したデータを新規に登録することが
できる。

【０２６４】（８）文脈木登録過程により、新規登録過
程で登録したデータを文脈木保持過程の文脈木に登録す
ることができる。（９）新規登録過程では符号化側で分岐に選択したリー
フと同じリーフを分岐して新規データを登録することが
できる。また、図９を用いて説明した構成をもつ装置、
すなわち入力データを過去に出現した履歴に応じて符号
化するデータ圧縮装置においては、符号木保持手段３０
１が、予めデータ未登録を示すデータとして定義される
エスケープコードを登録した符号木を保持し、文脈木保
持手段３０２が、入力データと文脈との組み合わせを登
録した文脈木を保持する。

【０２６５】そして、文脈登録手段３０３が、エスケー
プコードを符号化したのち、文脈木にデータを新規に登
録し、符号登録手段３０４が、エスケープコードを符号
化したのち符号木のエスケープコードのデータ格納点と
してのリーフを分岐してデータを新規に登録し、文脈変
更手段３０５が、入力データと文脈との組み合わせが文
脈木に保持されていないとき、文脈を変更する。

【０２６６】さらに、符号化手段３０６が、符号木の頂
点からの入力データあるいはエスケープコードが登録し
てあるリーフまでの分岐に従って符号を出力し、符号更
新手段３０７が、符号化したデータ及びエスケープコー
ドが登録してあるリーフと他のリーフあるいはノードと
を取り替える。さらに、図１０を用いて説明した構成を
もつ装置、すなわち入力データを過去に出現した履歴に
応じて符号化するデータ圧縮装置においては、符号木保
持手段３０１が、予めデータ未登録を示すデータとして
定義されるエスケープコードを登録した符号木を保持
し、文脈木保持手段３０２が、入力データと文脈との組
み合わせを登録した文脈木を保持する。

【０２６７】そして、文脈登録手段３０３が、エスケー
プコードを符号化したのち、文脈木にデータを新規に登
録し、分岐位置検索手段３１０が、符号木上の最長の符
号長を持つリーフを検索し、符号登録手段３１１が、エ
スケープコードを符号化したのち、分岐位置検索手段３
１０に検索されたデータ格納点としてのリーフを分岐し
てデータを新規に登録する。

【０２６８】さらに、文脈変更手段３０５が、入力デー
タと文脈との組み合わせが文脈木に保持されていないと
き文脈を変更し、符号化手段３０６が、符号木の頂点か
ら入力データあるいはエスケープコードが登録してある
リーフまでの分岐に従って符号を出力し、符号更新手段
３０７が、符号化したデータ及びエスケープコードが登
録してあるリーフと他のリーフあるいはノードとを取り
替える。

【０２６９】また、図１１を用いて説明した構成をもつ
装置、すなわち入力データを過去に出現した履歴に応じ
て符号化するデータ圧縮装置においては、符号木保持手
段３０１が予めデータ未登録を示すデータとして定義さ
れるエスケープコードを登録した符号木を保持し、文脈
木保持手段３０２が入力データと文脈との組み合わせを
登録した文脈木を保持する。

【０２７０】そして、文脈登録手段３０３がエスケープ
コードを符号化したのち、文脈木にデータを新規に登録
し、分岐位置保持手段３０８が符号木に新規に登録され
たデータ格納点としてのリーフの位置を保持し、符号登
録手段３０９がエスケープコードを符号化したのち、分
岐位置保持手段３０８に保持されている位置にあるリー
フを分岐してデータを新規に登録する。

【０２７１】さらに、文脈変更手段３０５が入力データ
と文脈との組み合わせが文脈木に保持されていないとき
分脈を変更し、符号化手段３０６が符号木の頂点から入
力データあるいはエスケープコードが登録してあるリー
フまでの分岐に従って符号を出力し、符号更新手段３０
７が符号化したデータ及びエスケープコードが登録して
あるリーフと他のリーフあるいは分岐点としてのノード
とを取り替える。

【０２７２】一方、図１２を用いて説明した構成をもつ
装置、すなわち入力データを過去の入力データの履歴に
応じて符号化した符号を復号するデータ復元装置におい
ては、符号木保持手段４０１が予めデータ未登録を示す
データとして定義されるエスケープコードを登録した符
号木を保持し、文脈保持手段４０２が復号したデータと
文脈との組み合わせを登録した文脈木を保持し、符号木
決定手段４０３が直前までに復号したデータから符号の
符号木を決定する。

【０２７３】そして、復号手段４０４が符号に従って符
号木の頂点を意味するルートからデータ格納点としての
リーフへと走査して符号を復号し、文脈変更手段４０５
が到達したリーフがエスケープコードであった場合、文
脈を変更する。さらに、符号更新手段４０６が、復号し
たデータ及びエスケープコードのリーフを他のリーフあ
るいは分岐点としてのノードと組み替え、符号登録手段
４０７がエスケープコードを復号したとき、エスケープ
コードのリーフを分岐して復号したデータを新規に登録
し、文脈木登録手段４０８が符号登録手段４０７で登録
したデータを文脈保持手段４０２の文脈木に登録する。

【０２７４】さらに、図１３を用いて説明した構成をも
つ装置、すなわち入力データを過去の入力データの履歴
に応じて符号化した符号を復号するデータ復元装置にお
いては、符号木保持手段４０１が予めデータ未登録を示
すデータとして定義されるエスケープコードを登録した
符号木を保持し、文脈保持手段４０２が復号したデータ
と文脈との組み合わせを登録した文脈木を保持し、符号
木決定手段４０３が直前までに復号したデータから符号
の符号木を決定する。

【０２７５】そして、復号手段４０４が符号に従って符
号木の頂点を意味するルートからデータ格納点としての
リーフへと走査して符号を復号し、文脈変更手段４０５
が、到達したリーフがエスケープコードであった場合、
文脈を変更する。さらに、符号更新手段４０６が復号し
たデータ及びエスケープコードのリーフを他のリーフあ
るいは分岐点としてのノードと組み替え、分岐位置検索
手段４１１が符号木内の最長の符号長を持つリーフの位
置を検索し、符号登録手段４１２が、エスケープコード
を符号化したのち分岐位置検索手段４１１で検索された
リーフを分岐してデータを新規に登録し、文脈木登録手
段４０８が符号登録手段４１２で登録したデータを文脈
保持手段４０２の文脈木に登録する。

【０２７６】また、図１４を用いて説明した構成をもつ
装置、すなわち入力データを過去の入力データの履歴に
応じて符号化した符号を復号するデータ復元装置におい
ては、符号木保持手段４０１が予めデータ未登録を示す
データとして定義されるエスケープコードを登録した符
号木を保持し、文脈保持手段４０２が、復号したデータ
と文脈との組み合わせを登録した文脈木を保持し、符号
木決定手段４０３が直前までに復号したデータから符号
の符号木を決定する。

【０２７７】そして、復号手段４０４が、符号に従って
符号木の頂点を意味するルートからデータ格納点として
のリーフへと走査して符号を復号し、文脈変更手段４０
５が、到達したリーフがエスケープコードであった場
合、文脈を変更し、符号更新手段４０６が復号したデー
タ及びエスケープコードのリーフを他のリーフあるいは
分岐点としてのノードと組み替え、分岐位置保持手段４
０９が符号木に新規に登録されたリーフの位置を保持す
る。

【０２７８】さらに、符号登録手段４１０がエスケープ
コードを符号化したのち、分岐位置保持手段４０９に保
持されている位置にあるリーフを分岐してデータを新規
に登録し、文脈木登録手段４０８が符号登録手段４１０
で登録したデータを文脈保持手段４０２の文脈木に登録
する。従って、本発明に関連する技術２に係るデータ圧
縮方法によれば、上述の特定コードを比較的多く出力す
るようなデータである場合、または文脈木保持過程に保
持されている文脈の登録が十分でない初期の段階などに
おいて高い符号化率が得られる効果がある。

【０２７９】また、上述の符号木新規登録過程の前に符
号長変更過程を行なえば、符号及び特定コードの符号長
を最小で２ビット、符号木新規登録後に符号長変更過程
を行なえば、特定コードの符号を最小で１ビットにする
ことができるので、さらに符号化効率が大幅に向上する
効果がある。さらに、符号木新規登録では、データの新
規登録は常に１つずつ行なわれるので、常に符号木の高
次には再現性を持ったシンボルのみが登録されることに
なり、符号木に登録はしたが実際には使われていないデ
ータが存在するために生じる符号化効率の低下を防止で
き、これにより十分にデータの登録がなされた後の符号
化効率が大幅に向上する効果がある。

【０２８０】なお、上述の特定コードを、予め未登録を
示すデータとして定義されるエスケープコードとして
も、上述のデータ圧縮方法における効果と同様の効果が
得られる。さらに、本発明に関連する技術２に係る他の
データ圧縮方法によれば、新規登録過程では、同じ文脈
の下にあるリーフのうち、符号木の頂点として定義され
るルートからの距離が最も長いリーフを分岐し、得た２
つの新規リーフに、分岐したリーフに格納していたデー
タと、新規データとを登録したり、また同じ文脈の下に
あるリーフのうち、最後に登録したリーフを分岐し、得
た２つの新規リーフに、分岐したリーフに格納していた
データと、新規データとを登録するようにすることもで
きるので、上述のデータ圧縮方法における効果に加え
て、あまり使われない出現頻度の最も低いデータの符号
長を長くすることができる。

【０２８１】これにより、符号長が１ビット伸びたこと
による符号化効率の低下を最小限に抑えてデータ圧縮の
処理速度を大幅に向上させることができる効果がある。
また、最後に登録したリーフに格納した新規データは、
比較的符号長の長いデータとして近似できることから、
さらにデータ圧縮の処理速度が大幅に向上する効果もあ
る。

【０２８２】また、本発明に関連する技術２に係るデー
タ復元方法によれば、符号化側と同様に、データの新規
登録過程において、２つに分割したリーフの符号長を
（分割前のリーフの符号長＋１）ビットにすることがで
きるとともに、新規登録したデータの符号及び特定コー
ドの符号長を最小で２ビットにすることができ、これに
よりエスケープコードを比較的多く復号するようなデー
タである場合に、または辞書登録（符号木へのシンボル
の登録）が十分でない初期の段階の場合などにおいて、
データの復号効率が大幅に向上する効果がある。

【０２８３】また、データの新規登録過程の前に符号長
変更過程を行なえば、復号したデータ符号及びエスケー
プコードの符号長を最小で２ビット、新規登録過程の後
に符号長変更過程を行なえば、エスケープコードの符号
を最小で１ビットにすることができ、これにより、さら
にデータの復号効率が大幅に向上する効果がある。さら
に、復元側が符号化側と同一の新規登録過程が行なうこ
とができ、これにより符号化側で符号化されたデータを
正確に復号することができる利点がある。

【０２８４】なお、上述したデータ復元方法において
も、特定コードを、予め未登録を示すデータとして定義
されるエスケープコードとしても、上述のデータ復元方
法における効果と同様の効果が得られる。さらに、本発
明に関連する技術２に係る他のデータ圧縮装置によれ
ば、エスケープコードを比較的多く出力するようなデー
タである場合、または文脈木保持手段に保持されている
文脈の登録が十分でない初期の段階などにおいて高い符
号化率が得られる効果がある。

【０２８５】また、符号登録手段による符号の登録の前
に符号更新手段による符号更新を行なえば、符号及び特
定コードの符号長を最小で２ビット、符号登録手段によ
る符号の登録の後に符号更新手段による符号更新を行な
えば、エスケープコードの符号を最小で１ビットにする
ことができ、これにより、さらに符号化効率が大幅に向
上する効果がある。

【０２８６】さらに、符号登録手段による符号の新規登
録は、常に１つずつ行なわれるので、常に符号木の高次
には再現性を持ったデータのみが登録されることにな
り、符号木に登録はしたが実際には使われていないデー
タが存在するために生じる符号化効率の低下を防止で
き、これにより十分にデータの登録がなされた後の符号
化効率が大幅に向上する効果がある。そして、このよう
な効果によりデータ圧縮装置の性能が飛躍的に向上する
効果がある。

【０２８７】さらに、本発明に関連する技術２に係る他
のデータ圧縮装置によれば、上述のデータ圧縮装置にお
ける効果に加えて、あまり使われない出現頻度の最も低
いデータの符号長を長くすることができ、これにより符
号長が１ビット伸びたことによる符号化効率の低下を最
小限に抑えてデータ圧縮の処理速度を大幅に向上させる
ことができる効果があるとともにデータ圧縮装置の性能
が飛躍的に向上する効果がある。

【０２８８】さらに、本発明に関連する技術２に係るさ
らに他のデータ圧縮装置によれば、上述したデータ圧縮
装置における効果に加えて、最後に登録したリーフに格
納した新規データは、比較的符号長の長いデータとして
近似できることから、さらにデータ圧縮の処理速度が大
幅に向上するとともにデータ圧縮装置の処理負荷も大幅
に軽減される効果がある。

【０２８９】また、本発明に関連する技術２に係るデー
タ復元装置によれば、エスケープコードを比較的多く復
号するようなデータである場合、または文脈木保持手段
に保持されている文脈の登録が十分でない初期の段階な
どにおいて高い復号率が得られる効果がある。また、符
号登録手段による符号の登録の前に符号更新手段による
符号更新を行なえば、符号及び特定コードの符号長を最
小で２ビット、符号登録手段による符号の登録の後に符
号更新手段による符号更新を行なえば、エスケープコー
ドの符号を最小で１ビットにすることができ、これによ
り、さらに復号効率が大幅に向上する効果がある。

【０２９０】さらに、符号登録手段による復号する符号
の新規登録は、常に１つずつ行なわれるので、常に符号
木の高次には再現性を持ったデータのみが登録されるこ
とになり、符号木に登録はしたが実際には使われていな
いデータが存在するために生じる復号効率の低下を防止
でき、これにより十分にデータの登録がなされた後の復
号効率が大幅に向上する効果がある。そして、このよう
な効果によりデータ復元装置の性能が飛躍的に向上する
効果がある。

【０２９１】さらに、本発明に関連する技術２に係る他
のデータ復元装置によれば、上述したデータ復元装置に
おける効果に加えて、あまり使われない出現頻度の最も
低いデータの符号長を長くすることができ、これにより
符号長が１ビット伸びることによる符号化効率の低下を
最小限に抑えてデータ復元の処理速度を大幅に向上させ
ることができる効果があり、さらにデータ復元装置の性
能が飛躍的に向上する効果もある。

【０２９２】また、本発明に関連する技術２に係るさら
に他のデータ復元装置によれば、上述のデータ復元装置
による効果に加えて、データの新規登録を最後に登録し
たデータが格納されているリーフに行なうことができ、
この最後に登録したリーフに格納されているデータは比
較的符号長の長いデータとして近似できることから、符
号長が１ビット伸びることによる復号化効率の低下を最
小限に抑えてデータ復元の処理速度を大幅に向上させる
ことができる効果があり、さらにデータ復元装置の性能
が飛躍的に向上する効果もある。

【０２９３】次に、本発明に関連する技術２（以下、関
連技術２ともいう）について、より具体的に説明する。
即ち、関連技術２にかかるデータ圧縮装置及びデータ復
元装置も、上述した実施形態と同様に、図３２に示した
ような本発明のデータ圧縮方法及びデータ復元方法を実
施するためのものである。

【０２９４】また、本関連技術２においても、上述した
実施形態と同様に、データ圧縮装置を符号化側、データ
復元装置を復元側として説明を進める。なお、以下の説
明中においても、文脈木および符号木は、項目（ａ）に
て前述した構成をもつものである。（１）符号化側の説明図５２は、本発明の関連技術２にかかるデータ圧縮方法
を実施するためのデータ圧縮装置３（図３２参照）の内
部の構成例を示す図であり、この図５２において、３０
１Ｂは符号木保持部、３０２Ｂは文脈木保持部、３０３
Ｂは文脈登録部、３０５Ｂは文脈変更部、３０６Ｂは符
号化部、３０７Ｂは符号変更部、３２１Ｂは文脈保持
部、３２２Ｂは符号登録部である。

【０２９５】ここで、符号木保持部（符号木保持手段）
３０１Ｂは、予めエスケープコード（ＥＳＣ）（データ
未登録を示すデータ）を登録した符号木を保持するもの
であり、文脈木保持部（文脈木保持手段）３０２Ｂは、
シンボルＫ（入力データ）と文脈との組み合わせを登録
した文脈木を保持するものである。また、文脈登録部
（文脈登録手段）３０３Ｂは、エスケープコードを符号
化したのち、文脈木にシンボルＫを新規に登録するもの
であり、文脈保持部３２１Ｂは、入力されたシンボルＫ
を一旦保持するものである。

【０２９６】符号登録部（符号登録手段）３２２Ｂは、
エスケープコードを符号化したのち符号木保持部（符号
木保持手段）３０１Ｂ内の符号木のエスケープコードの
リーフ（データ格納点）を分岐してシンボルＫを新規に
登録するものである。このため、符号登録部３２２Ｂに
は、図５３にて後述する、新規ノードＩＤ発生部６１，
ラッチ６２，親子情報更新部６３が設けられており、符
号木保持部３０１Ｂの内部には、外部節点（リーフＩ
Ｄ）保持部６４，内部節点（ノードＩＤ）保持部６５,
ＥＳＣ−ＩＤ保持部６６，及び符号木管理部６７が設け
られている。

【０２９７】また、文脈変更部３０５Ｂは、シンボルＫ
と文脈との組み合わせが文脈木に保持されていないと
き、文脈を変更するものである。符号化部３０６Ｂは、
符号木の頂点からのシンボルＫあるいはエスケープコー
ドが登録してあるリーフまでの分岐に従って“１”か
“０”で表される符号を出力するものである。

【０２９８】符号更新部３０７Ｂは、符号化したシンボ
ルＫ及びエスケープコードが登録してあるリーフと他の
リーフあるいはノードとを取り替えるものである。そし
て、図５３に示すように、符号登録部３２２Ｂの内部に
おいて、新規ノードＩＤ発生部６１は、文脈木保持部３
０２Ｂから更新信号を受けて２つの新規ノードＩＤ（Ｉ
Ｄ−１，ＩＤ−２を発生するものであり、ラッチ６２は
エスケープコードのＩＤ（ＥＳＣ−ＩＤ）を一旦保持す
るものである。

【０２９９】また、親子情報更新部６３は、処理対象の
ノードの上位のノードＩＤと右下に位置する下位ノード
のノードＩＤおよび左下に位置する下位ノードのノード
ＩＤの３つの情報（ＥＳＣ−ＩＤ，ＩＤ−１，ＩＤ−
２）からなる親子情報を受けてこの親子情報を変更し、
符号木保持部３０１Ｂに送るものである。さらに、符号
木保持部３０１Ｂの内部において、外部節点（リーフＩ
Ｄ）保持部６４は符号木のデータの格納点であるリーフ
のリーフＩＤを保持するものであり、内部節点（ノード
ＩＤ）保持部６５は符号木のノードのノードＩＤを保持
するものであり、ＥＳＣ−ＩＤ保持部６６は符号木のエ
スケープコードとこのエスケープコードのＩＤを保持す
るものである。

【０３００】また、符号木管理部６７は、文脈木保持部
３０２Ｂから文脈ＩＤを受けて、この文脈ＩＤを外部節
点（リーフＩＤ）保持部６４，内部節点（ノードＩＤ）
保持部６５およびＥＳＣ−ＩＤ保持部６６に送るもので
ある。上述の構成により、本発明の関連技術２にかかる
データ圧縮装置３では、符号木保持部３０１Ｂが予めエ
スケープコードを登録した符号木を保持し、文脈木保持
部３０２ＢがシンボルＫと文脈Ｐとの組み合わせを登録
した文脈木を保持し、文脈登録部３０３Ｂがエスケープ
コードを符号化したのち、文脈木にシンボルＫを新規に
登録することができる。

【０３０１】さらに、文脈保持部３２１Ｂが文脈Ｐを一
旦保持し、符号登録部３２２Ｂがエスケープコードを符
号化したのち、符号木のエスケープコードのリーフを分
岐してシンボルＫを新規に登録することができる。ま
た、文脈変更部３０５Ｂが、入力されたシンボルＫと文
脈Ｐとの組み合わせが文脈木に保持されていないとき、
文脈Ｐを変更することができる。

【０３０２】さらに、符号化部３０６Ｂが符号木の頂点
からの入力データあるいはエスケープコードが登録して
あるリーフまでの分岐に従って符号を出力し、符号更新
部３０７Ｂが符号化したデータ及びエスケープコードが
登録してあるリーフと他のリーフあるいはノードとを取
り替えることができる。なお、図５７（ａ）は符号木の
例を示す図であり、同図（ｂ）は文脈木の例を示す図で
ある。ところで、この図５７（ａ）に示すように、符号
木は内部節点としてのルートとノード、外部節点として
のリーフにそれぞれＩＤ番号（０〜１０）を持ってい
る。

【０３０３】一方、図５７（ｂ）に示すように、文脈木
は、文脈のＩＤとその文脈に登録されているシンボルの
ＩＤ番号を持っており、文脈のＩＤ番号は符号木のルー
トのＩＤ番号、シンボルのＩＤ番号は符号木のリーフの
ＩＤ番号と同一である。ここで、上述の動作について、
図５４〜図５６に示す本発明の符号化側の動作を示す処
理ステップＰ１〜Ｐ１６を参照しながら、さらに詳述す
る。

【０３０４】また、以下の動作の説明中、符号木および
文脈木は、上述のような構成を有しているものとする。
まず、図５４に示すように、シンボルＫが入力されると
（ステップＰ１）、文脈保持部３２１Ｂに保持されてい
る文脈Ｐが文脈変更部３０５Ｂに出力される（ステップ
Ｐ２）。

【０３０５】そして、文脈変更部３０５Ｂでは、文脈Ｐ
とシンボルＫとを受けて、文脈Ｐの中にシンボルＫが登
録されているかを判断するが、シンボルＫが文脈Ｐに登
録されていない場合、文脈木保持部３０２Ｂは文脈変更
信号を文脈変更部３０５Ｂに出力する（ステップＰ
３）。文脈変更信号を受けた文脈変更部３０５Ｂは、最
高次（文脈木のルートから１番距離が長いリーフ）の文
字を棄却して次数を１つ下げた文脈Ｐを文脈木保持部３
０２Ｂに送る（ステップＰ４）。

【０３０６】そして、シンボルＫが登録されている文脈
Ｐを決定するまで、この処理を繰り返す。次に、図５５
に示すように、文脈保持部３０２Ｂは、文脈ＰのＩＤ
（番号）とシンボルＫ（シンボルＫが登録されていない
ときはＥＳＣ）のＩＤを符号化部３０６Ｂに送り（ステ
ップＰ５）、符号化部３０６Ｂは、送られてきたＩＤを
符号木保持部３０１Ｂにそのまま転送する（ステップＰ
６）。

【０３０７】そして、符号木保持部３０１Ｂは、送られ
てきたＩＤの上位ノードのＩＤ番号と、符号化部３０６
Ｂが送ってきたＩＤが上位ノードに対して右左のどちら
かに位置しているかを示す情報とを符号化部３０６Ｂに
送る（ステップＰ７）。さらに、符号化部３０６Ｂは、
上位ノードに対する、符号化部３０６Ｂが送ってきたＩ
Ｄをもつノードの位置情報に従って、例えば右に位置し
ていた場合は“１”、左なら“０”を符号として出力す
る（ステップＰ８）。

【０３０８】また、上述の位置情報とともに送られてき
た上位ノードのＩＤが、文脈保持部３０２Ｂから送られ
てきた文脈ＰのＩＤ（ルートＩＤ）と一致したとき、符
号化処理を終了する。一方、一致しなかったときは、そ
の文脈ＰのＩＤをさらに符号変更部３０７Ｂに出力し
（ステップＰ６と同じ経路）、さらに符号木保持部３０
１Ｂから上位のノードＩＤと位置情報とを得る。

【０３０９】そして、符号木保持部３０１Ｂからの上位
ノードのＩＤ番号が、文脈ＰのＩＤに一致するまで処理
を繰り返す。この処理が終了した後、符号変更部３０７
Ｂは、符号化部３０６Ｂから文脈ＰのＩＤ（＝符号木の
ルートＩＤ）及び符号化したシンボルＫのリーフＩＤを
受け（ステップＰ９）、ノードの組み換え処理（スプレ
イ処理）を行ない、符号長を更新する。なお、このノー
ドの組み換え処理については、項目（ａ）および本発明
の一実施形態にて前述したように行なう。

【０３１０】これにより、シンボルＫが以前に入力され
文脈Ｐに登録されている場合に、さらにシンボルＫが入
力されると、既に登録してあるシンボルＫのノードを上
位のノードと組み替えて、符号長を短く（１／２に）す
ることができる。ところで、上述の文脈ＰにシンボルＫ
が登録されていない場合は、図５６に示すように、文脈
登録部３１０Ｂは、文脈変更部３０５Ｂから登録する文
脈Ｐを受ける（ステップＰ１０）とともにシンボルＫと
を受けて（ステップＰ１１）、文脈木保持部３０２Ｂに
登録シンボルのＩＤを出力し（ステップＰ１２）、文脈
木保持部３０２Ｂは、文脈Ｐの下にシンボルＫを新規に
登録する。

【０３１１】一方、符号登録部３２２Ｂは、符号を登録
する符号木を符号木保持部３０１Ｂより受け（ステップ
Ｐ１３）、登録するシンボルＫと、文脈木保持部３０２
Ｂからの登録シンボルのＩＤとを受けて（ステップＰ１
４，１５）、シンボルＫを符号木に新規登録して符号木
保持部３０１Ｂに再格納する（ステップＰ１６）。これ
により、文脈Ｐに登録されていないシンボルＫの登録
（符号化）が行なわれる。

【０３１２】ここで、符号登録部３２２Ｂが、エスケー
プコードを符号化したのち符号木保持部３０１Ｂ内の符
号木のエスケープコードのリーフを分岐してシンボルＫ
を新規に登録する動作（上述のステップＰ１３〜Ｐ１
６）について、前述したように、図５３を用いてさらに
詳述する。まず、符号木保持部３０１Ｂの内部に設けら
れた符号木管理部６７は文脈ＩＤを受けて符号木保持部
内のＥＳＣ−ＩＤ保持部に文脈のＥＳＣアドレスを送
る。

【０３１３】そして、ＥＳＣ−ＩＤ保持部６６は、ＥＳ
Ｃアドレスを受けて、ＥＳＣのＩＤとこのＩＤに登録し
てあるシンボル（この場合はＥＳＣ）を出力する一方、
符号登録部３２２Ｂでは、ＥＳＣ−ＩＤとＥＳＣをラッ
チ６２でラッチする。さらに、新規ＩＤ発生器６１は、
更新信号を受けて２つのＩＤ番号（ＩＤ−１，ＩＤ−
２）を発信し、ＩＤ−１は、新規のＥＳＣ−ＩＤとして
ラッチしてあったＥＳＣとともに符号木保持部３０１Ｂ
のＥＳＣ−ＩＤ保持部６６に格納される。

【０３１４】また、符号木には、ＩＤとシンボルの他に
ＩＤの位置情報を表した親子情報が保持されているが、
この親子情報には、自分の上位のノードＩＤ，自分の右
下に位置するノードＩＤ，及び自分の左下に位置するノ
ードＩＤの３つの情報がある。親子情報更新部６３は、
３つのＩＤ（変更前のＥＳＣ−ＩＤ，ＩＤ−１，ＩＤ−
２）を受けて、親子情報を変更する。すなわち、ＩＤ−
１，ＩＤ−２の上位ＩＤにはＥＳＣ−ＩＤが登録され、
またＥＳＣ−ＩＤの右下にはＩＤ−１，左下にはＩＤ−
２が位置するという情報が登録される。

【０３１５】親子情報は、各ＩＤとともに符号木保持部
３０１ＢのノードＩＤ保持部６５に保持される。一方、
符号木保持部３０１ＢのリーフＩＤ保持部６４には、登
録シンボルと新規ＩＤ（ＩＤ−２）が登録される。以上
のような処理を行なうことにより、ＥＳＣには新規ＥＳ
Ｃ−ＩＤ（ＩＤ−１）が登録され、旧ＥＳＣ−ＩＤはノ
ードＩＤとして親子情報とともにノードＩＤ保持部に保
持され、新規ＩＤ（ＩＤ−２）とシンボルＫは新規リー
フとしてリーフＩＤ保持部に保持され、シンボルＫを符
号木保持部３０１Ｂの符号木のエスケープコードが登録
されているリーフを分岐して新規登録する処理が終了す
る。

【０３１６】以上、図５３〜５６にて説明した動作をま
とめると、図５８に示すフローチャートで表すことがで
きる。すなわち、まず、文脈Ｐ₀に０を入力して初期化
し（ステップＱ１）、文脈Ｐ₀を変数としての文脈Ｐに
入力する（ステップＱ２）。なお、この文脈Ｐ₀は、直
前までに入力・符号化された文字（シンボル）であり、
例えば、本実施形態における符号化が、ｎ次の文脈を用
いるモデルであったとき、文脈Ｐ₀は直前までに入力・
符号化された（ｎ−１）文字が格納されていることにな
る。

【０３１７】そして、シンボルＫが入力されたとき、文
脈Ｐの文脈木にシンボルＫが登録されているか否かを検
索する（ステップＱ３）。そして、文脈Ｐの文脈木にシ
ンボルＫが登録されていない場合、ＥＳＣ（エスケープ
コード）の符号を出力し（ステップＱ３のＮＯルートか
らステップＱ４）、文脈Ｐに対応する符号木のＥＳＣが
登録されているリーフをスプレイ処理する（ステップＱ
５）。

【０３１８】そして、上述のＥＳＣのリーフを分岐し
（ステップＱ６）、これにより得た２つの新規リーフに
ＥＳＣとシンボルＫを登録し（ステップＱ７）、文脈Ｐ
の文脈木にもシンボルＫを登録しておく。さらに、上述
のようにしてシンボルＫの新規登録した後、文脈Ｐ内の
最も古い文字を棄却し、文脈の次数を１つ減じた文脈を
新たに文脈Ｐとして文脈Ｐを変更する（ステップＱ
８）。

【０３１９】そして、ステップＱ３に戻り、シンボルＫ
が文脈Ｐに登録されていることを検出するまで、文脈Ｐ
を順次変更して処理を繰り返す。一方、文脈Ｐの文脈木
にシンボルＫが登録されている場合、シンボルＫの符号
を出力し（ステップＱ３のＹＥＳルートからステップＱ
９）、この文脈Ｐに対応する符号木のシンボルＫが登録
されているリーフをスプレイ（ＳＰＬＡＹ）処理する
（ステップＱ１０）。

【０３２０】さらに、シンボルＫの符号化後、文脈Ｐ₀
にシンボルＫを追加登録して文脈Ｐ₀を更新する（ステ
ップＱ１１）。（例えば文脈Ｐ₀にシンボルＫを追加
し、文脈Ｐ₀内の最も古い文字を棄却する）。そして、
全ての文字（シンボル）の符号化が終了したかをチェッ
クし（ステップＱ１２）、終了していない場合は（ステ
ップＱ１２のＮＯルート）、処理はステップＱ２に戻っ
て、全ての文字の符号化が終了するまで処理を繰り返
す。

【０３２１】また、上述の図５８における処理におい
て、ＥＳＣのリーフのスプレイ処理を、ＥＳＣとシンボ
ルＫを登録した後に行なっているが、この処理順は逆に
してもよく、この場合の処理ステップは図５９に示すよ
うになる。ここで、この図５９に示すように、ステップ
Ｒ１〜Ｒ３およびステップＲ９〜Ｒ１２においては、そ
れぞれ図５８の処理ステップＱ１〜Ｑ３およびステップ
Ｑ９〜Ｑ１２と同様の処理が行なわれる。

【０３２２】そして、ステップＲ３で文脈Ｐにシンボル
Ｋが登録されていない場合に、ＥＳＣの符号を出力し
（ステップＲ４）、ＥＳＣのリーフを分岐し（ステップ
Ｒ５）、新規リーフにＥＳＣとシンボルＫを登録する
（ステップＲ６）。そして、上述のように登録を行なっ
た後に、ＥＳＣのリーフをスプレイ処理する（ステップ
Ｒ７）。

【０３２３】さらに、図５８の処理ステップＱ８と同様
に、文脈Ｐを変更し（ステップＲ１２）、ステップＲ３
でシンボルＫを検出するまで処理を繰り返す。例えば、
符号木が、図６０（ａ）に示すように、文字（シンボ
ル）Ａ〜Ｅがすでに符号化され登録されている状態にあ
る場合に、上述の処理ステップＲ１〜Ｒ１２（または図
５８中の処理ステップＱ１〜Ｑ１２）において、シンボ
ルＫを文字Ｆとして処理を実行すると、リーフ番号６の
ＥＳＣのリーフが分岐され、図６０（ｂ）に示すよう
に、新たに作成されたリーフ番号１１，１２のリーフに
それぞれＥＳＣと文字Ｆが登録される。

【０３２４】例えば、以上の処理において用いる文脈が
３次文脈であった場合、シンボルＫが０次（初期状態）
で符号化されたときには、１次，２次，３次の文脈にそ
れぞれ登録される（以下、この全ての次数に登録を行な
う方法を全登録型という）。また、図５８および図５９
に示したステップＱ１〜Ｑ１２およびステップＲ１〜Ｒ
１２は、上述したように、ＥＳＣを符号化する毎にシン
ボルＫを全ての次数の文脈に登録する処理のステップを
示すが、シンボルＫが符号化される直前に符号化（登
録）された次数の１つの文脈にのみ、シンボルＫを登録
するように処理を行なってもよく、この場合の処理のフ
ローチャートは、図６１に示すようになる。

【０３２５】即ち、この図６１に示す処理では、まず、
文脈Ｐ₀を０に初期化し（ステップＴ１）、文脈（変
数）Ｐには文脈Ｐ₀を入力し、文脈（変数）Ｘには０を
入力する（ステップＴ２）。さらに、文脈Ｐにシンボル
Ｋが登録されているか検索し（ステップＴ３）、文脈Ｐ
にシンボルＫが登録されていない場合は、前述のステッ
プＱ４，Ｑ５（図５８参照）と同様の処理を行う（ステ
ップＴ３のＮＯルートからステップＴ４，Ｔ５）。

【０３２６】その後、文脈Ｘに文脈Ｐを入力し（ステッ
プＴ６）、文脈Ｐを変更して（ステップＴ７）、文脈Ｐ
にシンボルＫが登録されていることを検出するまで処理
を繰り返す。一方、上述のステップＴ３において、文脈
ＰにシンボルＫが登録されている場合は、前述のステッ
プＱ９〜Ｑ１１（図５８参照）、またはステップＲ９〜
Ｒ１１（図５９参照）と同様の処理を行なう（ステップ
Ｔ８〜Ｔ１０）。

【０３２７】その後、文脈ＸのＥＳＣのリーフを分岐し
（ステップＴ１１）、この分岐された新規の２つのリー
フにそれぞれＥＳＣとシンボルＫを登録する（ステップ
Ｔ１２）。さらに、全ての文字（シンボル）の符号化が
終了したか否かをチェックし（ステップＴ１３）、終了
していなければステップＴ２以降の処理を繰り返し（ス
テップＴ１３のＮＯルート）、終了していれば符号化処
理を終了する（ステップＴ１３のＹＥＳルート９）。

【０３２８】このように処理を行なうことにより、すべ
ての次数の文脈ＰにシンボルＫを登録するのではなく、
シンボルＫを符号化した直前の次数の文脈（文脈Ｘ）に
のみ登録を行なうことができる（以下、この直前の次数
の文脈にのみシンボルの登録を行なう方法を逐次登録型
という）。このように、本発明の関連技術２にかかるデ
ータ圧縮装置によれば、文脈ＰにシンボルＫが登録され
ていないとき、エスケープコード（ＥＳＣ）の分岐・登
録の符号長を（分割前のリーフの符号長＋１）ビット、
新規登録した符号及びエスケープコードの符号長を最小
で２ビットにすることにより、エスケープコードを比較
的多く出力するようなデータである場合、または辞書登
録（符号木へのシンボルの登録）が十分でない初期の段
階などにおいて高い符号化率が得られる効果がある。

【０３２９】また、上述のようなシンボルの新規登録の
前にスプレイ処理を行なえば、符号及びエスケープコー
ドの符号長を最小で２ビット、新規登録後にスプレイ処
理を行なえば、エスケープコードの符号を最小で１ビッ
トにすることができるので、さらに符号化効率が大幅に
向上する効果がある。さらに、上述の逐次登録型の場
合、符号木へのシンボルの新規登録は、常に１つずつ行
なわれ、同じシンボルが２度３度と出現することによっ
て２次３次の登録が行なわれるので、常に符号木の高次
には再現性を持ったシンボルのみが登録されることにな
り、符号木に登録はしたが実際には使われていないシン
ボルが存在するために生じる符号木の符号化効率の低下
を防止し、十分に辞書登録がなされた後の符号化効率が
大幅に向上する効果もある。

【０３３０】また、逐次登録型は全登録型よりも使用す
るメモリ容量（辞書容量）が少ないという利点もある。（２）復元側の説明図６２は、本発明の関連技術２にかかるデータ復元方法
を実施するためのデータ復元装置４（図３２参照）の内
部の構成例を示す図であり、この図６２において、４０
１Ｂは符号木保持部、４０２Ｂは文脈木保持部、４０３
Ｂは文脈変更部、４０４Ｂは復号部、４０７Ｂは符号登
録部、４０８Ｂは文脈登録部、４０９Ｂはラッチ、４２
１Ｂは文脈保持部である。

【０３３１】ここで、符号木保持部（符号木保持手段）
４０１Ｂは、予めエスケープコード（ＥＳＣ）（データ
未登録を示すデータ）を登録した符号木を保持するもの
であり、文脈木保持部（文脈木保持手段）４０２Ｂは、
復号したシンボル（データ）と文脈との組み合わせを登
録した文脈木を保持するものである。また、文脈変更部
４０３Ｂは、文脈木保持部４０２Ｂに保持されている文
脈木を検索し、到達したリーフがエスケープコードであ
った場合、文脈を変更するものであり、復号部４０４Ｂ
は、符号化側で符号化されたシンボルＫが入力されたと
き、このシンボルＫの符号に従って、符号木保持部４０
１Ｂに保持されている符号木のルート（頂点）からリー
フ（データ格納点）へと走査してシンボルＫの符号を復
号するものである。

【０３３２】さらに、符号変更部４０６Ｂは、復号した
シンボルＫ及びエスケープコードのリーフを他のリーフ
あるいは分岐点としてのノードと組み替えるものであ
る。また、符号登録部（符号登録手段）４０７Ｂは、符
号木決定手段としての機能を兼ねており、シンボルＫを
復号する直前までに復号したシンボルから、シンボルＫ
の符号が登録されている符号木保持部４０１Ｂ内の符号
木を決定するとともに、エスケープコードを復号したと
き、この符号木に登録さているエスケープコードのリー
フを分岐して新たにリーフを作成し、復号したシンボル
Ｋをこのリーフに新規に登録するものである。

【０３３３】このため、符号登録部４０７Ｂおよび上述
の符号木保持部４０１は、それぞれ符号化側における符
号登録部３２２Ｂおよび符号木保持部３０１Ｂ（図５２
参照）の内部構成（図５３参照）と同様の構成を有して
いる。また、文脈登録部４０８Ｂは、符号登録部４０７
Ｂで登録したシンボルＫを文脈木保持部４０２Ｂに保持
されている文脈木に登録するものであり、ラッチ４０９
Ｂは、復号部４０４Ｂで復号されたシンボルＫを一旦保
持しておくものであり、文脈保持部４２１Ｂは、復号さ
れたシンボルＫを保持するものである。

【０３３４】また、上述の符号木保持部４０１Ｂによ
り、予めエスケープコードを登録した符号木を保持する
ことができ、文脈木保持部４０２Ｂにより、復号したシ
ンボルＫと文脈Ｐとの組み合わせを登録した文脈木を保
持できるようになっている。さらに、文脈変更部４０３
Ｂにより、到達したリーフがエスケープコードであった
場合、文脈を変更することができ、復号部４０４Ｂによ
り、符号化されたシンボルＫの符号に従って符号木のル
ートからリーフへと走査してシンボルＫの符号を復号で
きるようになっている。

【０３３５】また、符号木決定手段を兼ねる符号変更部
４０６により、直前までに復号したシンボルからシンボ
ルＫの符号が保持されている符号木を決定することがで
き、復号したシンボルＫ及びエスケープコードのリーフ
を他のリーフあるいはノードと組み替えることができ
る。さらに、符号登録部４０７Ｂにより、エスケープコ
ードを復号したとき、エスケープコードのリーフを分岐
して新たにリーフを作成し、復号したシンボルＫをこの
リーフに新規に登録することができる。

【０３３６】また、文脈登録部４０８Ｂにより、符号登
録部４０７Ｂで登録したシンボルＫを文脈木保持部４０
２Ｂの文脈木に登録することができ、ラッチ４０９Ｂに
より、復号部２０４Ｂで復号したシンボルＫを一旦保持
することができ、文脈変保持部４２１により、復号部２
０４Ｂで復号したシンボルＫを保持することができる。

【０３３７】そして、上述の動作について、符号化側の
説明と同様に、図６３および図６４に示す復元側の動作
を示す処理ステップＵ１〜Ｕ１４を参照しながら、さら
に詳述する。まず、図６３に示すように、文脈保持部４
２１Ｂはそれまでに復号したシンボル（文脈）を保持
し、文脈変更部４０３Ｂに出力し（ステップＵ１）、文
脈変更部４０３Ｂは、最初は送られてきた文脈をそのま
ま文脈木保持部４０２Ｂに出力する（ステップＵ２）。

【０３３８】また、文脈木保持部４０２は、文脈変更部
４０３Ｂから送られてきた文脈のＩＤ、すなわちルート
ＩＤを復号部４０４Ｂに出力する（ステップＵ３）。こ
こで、復号部４０４Ｂでは、送られてきたルートＩＤに
対して符号（１ビット）が、例えば“１”ならば右下、
“０”ならば左下に位置するノード（あるいはリーフ）
ＩＤを、符号木保持部４０１Ｂに要求する（ステップＵ
４）。

【０３３９】また、符号木保持部４０１Ｂは、要求され
たノード（あるいはリーフ）のノードＩＤを復号部４０
４Ｂに返信する（ステップＵ５）。そして、復号部４０
４Ｂ及び符号木保持部４０１Ｂは、符号木の終端である
リーフのリーフＩＤを得るまで上述の処理を繰り返す。
すなわち、復号部４０４Ｂは、符号化側で符号化された
符号に従って、復号するシンボルＫが登録されているリ
ーフに到達するまで、符号木保持部４０１Ｂの符号木を
辿ってゆく。

【０３４０】そして、目的のリーフが発見されると、復
号部４０４Ｂは、このリーフを復号し、符号変更部４０
６Ｂが、この復号したリーフを符号化側と同様にスプレ
イ処理を行なって符号長を更新する。ここで、この処理
で復号されたシンボルがＥＳＣであった場合、復号部４
０４Ｂは、このシンボル（ＥＳＣ）をラッチに送り（ス
テップＵ６）、ラッチはこのシンボルを一旦保持して、
文脈変更部４０３Ｂに送る（ステップＵ７）。文脈変更
部４０３Ｂは符号化側と同様の文脈変更処理を行なっ
て、再度復号を行なう。

【０３４１】そして、上述の処理で復号部４０４Ｂが復
号したシンボルが、ＥＳＣ以外、すなわちシンボルＫで
あるときは、図６４に示すように、復号部４０４Ｂは、
ラッチ４０９Ｂ，文脈保持部４２１Ｂを介して、この復
号したシンボルＫを文脈登録部４０８Ｂに送り（ステッ
プＵ８〜Ｕ１１）、文脈登録部４０８Ｂは文脈木保持部
４０２ＢにこのシンボルＫを新規に登録する。

【０３４２】また、符号登録部４０７Ｂは、文脈木保持
部４０７ＢからシンボルＫが登録された文脈Ｐのルート
ＩＤを受けて（ステップＵ１２）、このルートＩＤを符
号木保持部４０１Ｂに送る（ステップＵ１３）。符号木
保持部４０１Ｂでは、送られてきた文脈ＰのルートＩＤ
と同じルートＩＤをもつ符号木のルートＩＤを、符号登
録部４０７Ｂに返信し（ステップＵ１４）、符号登録部
４０７Ｂは、このルートＩＤをもつ符号木に、シンボル
Ｋの新規符号を登録する（ステップＵ１３と同じ経
路）。

【０３４３】なお、上述の復元側の符号登録部４０７Ｂ
が符号木保持部４０１ＢにシンボルＫを登録する処理
は、符号化側における符号登録部３２２Ｂが符号木保持
部３０１ＢにシンボルＫを登録する処理と同様である。
このため、符号化側の登録処理が、符号化側の説明にお
いて図５８および図５９にて示したような全登録型の場
合は、復元側においてもＥＳＣを復号した全ての文脈に
登録する全登録型となり、図６１にて示したような逐次
登録型の場合は、復元側においても最後に復号されたＥ
ＳＣの文脈にそれぞれシンボルＫの登録を行なう逐次登
録型となる。

【０３４４】そして、符号化側の説明と同様に、上述の
復元側の処理は、図６５に示すようなフローチャートで
表すことができる。即ち、文脈（変数）Ｐ₀に最大次数
の数値を入力して初期化し（ステップＶ１）、この文脈
Ｐ₀を文脈Ｐに入力する（ステップＶ２）。つまり、符
号を復号する場合は、まず最大次数の文脈を用いて処理
を行なう。

【０３４５】そして、この最大次数の文脈Ｐに対応する
符号木において、リーフに登録されている符号を復号す
る（ステップＶ３）。さらに、この復号した符号がシン
ボルであるかをチェックし（ステップＶ４）、復号した
符号がシンボルでない、すなわちＥＳＣであった場合
は、符号化側と同様に、復号したＥＳＣのリーフをスプ
レイ処理し（ステップＶ４のＮＯルートからステップＶ
５）、文脈Ｐ内の最も高次のシンボル（最も古いシンボ
ル）を棄却して、文脈を１つ低次に移して変更し（ステ
ップＶ６）、ステップ２に戻る。すなわち、ＥＳＣ以外
のシンボル（シンボルＫ）を復号するまで、文脈Ｐを最
高次数から１ずつ減じた文脈に変更してシンボルＫが登
録されている文脈Ｐを検索する。

【０３４６】一方、復号した符号がシンボルであった場
合は、シンボルＫが復号されたことになるので、このシ
ンボルＫを出力し（ステップＶ４のＹＥＳルートからス
テップＶ７）、このシンボルＫリーフを符号化側と同様
にしてスプレイ処理してシンボルＫの符号長を短く（更
新）する（ステップＶ８）。さらに、文脈Ｐ₀にシンボ
ルＫを追加登録し（ステップＶ９）、ＥＳＣは棄却す
る。なお、この文脈Ｐ₀の変更も符号化側と同一の処理
を行なう。

【０３４７】さらに、復号したシンボルＫについて、符
号化側と同一の登録方法、例えば、符号化側のシンボル
Ｋの登録方法が全登録型なら全登録型により、ＥＳＣの
リーフを分岐して、新規シンボルＫの登録を行なう（ス
テップＶ１０）。そして、入力された全ての符号の復号
が終了したかチェックし（ステップＶ１１）、終了して
いない場合は（ステップＶ１１のＮＯルート）、処理は
ステップＶ２に戻って、全ての符号の復号が終了するま
で処理を繰り返す。

【０３４８】以上のように、本発明の関連技術２にかか
るデータ復元装置によれば、符号化側と同様に、シンボ
ルの新規登録処理において、既に符号木上に存在するリ
ーフを２つに分割してこのリーフの符号長を（分割前の
リーフの符号長＋１）ビットにすることにより、新規登
録したシンボルＫの符号及びエスケープコードの符号長
を最小で２ビットにすることができるので、エスケープ
コードを比較的多く復号するようなデータである場合、
または辞書登録（符号木へのシンボルの登録）が十分で
ない初期の段階などにおいて、データの復号効率が大幅
に向上する効果がある。

【０３４９】また、上述のようなシンボルの新規登録の
前にスプレイ処理を行なえば、復号したシンボルの符号
及びエスケープコードの符号長を最小で２ビット、新規
登録後にスプレイ処理を行なえば、エスケープコードの
符号を最小で１ビットにすることができるので、さらに
データの復号効率が大幅に向上する効果がある。さら
に、上述のように、復元側が符号化側と同一の登録処理
を行なうことで、符号を正確に復号することができる利
点がある。（ｃ−１）関連技術２の第１の変形例の説明関連技術２の第１の変形例にかかるデータ圧縮装置及び
データ復元装置においても、上述の関連技術２と同様
に、図３２に示すデータ圧縮方法及びデータ復元方法を
実施するためのものである。

【０３５０】また、上述した関連技術２と同様に、デー
タ圧縮装置３を符号化側、データ復元装置４を復元側と
して以下に説明する。（１）符号化側の説明符号化側の構成は、上述した関連技術２の説明中、図５
２にて前述したものの構成と同様である。

【０３５１】また、本関連技術２における図５２に示す
符号登録部３２２Ｂには、符号木保持手段３０１Ｂに保
持されている符号木上の最長の符号長のリーフにシンボ
ルを登録するために、図６６に示すように、新規ノード
ＩＤ発生部６１，ラッチ６２，親子情報更新部６３及び
最長符号検出部（分岐位置検索手段）６９が設けられて
おり、これに対応して、符号木保持部３０１Ｂには、内
部節点（ノードＩＤ）保持部６５，符号木管理部６７及
び外部節点／ＥＳＣ−ＩＤ（リーフＩＤ）保持部６８が
設けられている。

【０３５２】ここで、符号登録部３２２Ｂの内部におい
て、新規ノードＩＤ発生部６１は、文脈木保持部３０２
Ｂから更新信号を受けて２つの新規ノードＩＤ（ＩＤ−
１，ＩＤ−２）を発生するものであり、ラッチ６２は、
最長符号検出部６９が検出したリーフＩＤをラッチする
ものである。また、親子情報更新部６３は、処理対象の
ノードの上位のノードＩＤと右下に位置する下位ノード
のノードＩＤおよび左下に位置する下位ノードのノード
ＩＤの３つ情報（ＥＳＣ−ＩＤ，ＩＤ−１，ＩＤ−２）
からなる親子情報を受けてこの親子情報を変更し、符号
木保持部３０１Ｂに送るものである。

【０３５３】最長符号検出部（分岐位置検索手段）６９
は、符号木保持部３０１Ｂから符号木のノードＩＤを得
て、その符号木の中で最長の符号長をもつリーフのＩＤ
（ＩＤ−０）を検出するものである。また、符号木保持
部３０１Ｂの内部において、内部節点（ノードＩＤ）保
持部６５は、符号木のノードＩＤを保持するものであ
り、外部節点／ＥＳＣ−ＩＤ（リーフＩＤ）保持部６８
は、符号木のリーフＩＤを保持するものである。

【０３５４】符号木管理部６７は、文脈木保持部３０２
Ｂから文脈ＩＤを受けて、この文脈ＩＤを、内部節点
（ノードＩＤ）保持部６５および外部節点／ＥＳＣ−Ｉ
Ｄ（リーフＩＤ）保持部６８に送るものである。符号登
録部３２２Ｂおよび符号木保持部３０１Ｂが上述の構成
を有することにより、符号登録部３２２Ｂが符号木保持
部３０１Ｂに保持されている符号木上の最長の符号長を
もつリーフを検索し、エスケープコードを符号化した
後、検索した最長の符号長をもつリーフを分岐してシン
ボルＫを新規に登録する。

【０３５５】さらに、上述の処理について、図６７に示
すフローチャートの処理ステップＷ１〜Ｗ１３を参照し
ながら詳述する。まず、シンボルＫが含まれている文脈
を検索するために、文脈木保持部３０２Ｂに保持されて
いる文脈（文脈Ｐ）を選択し（ステップＷ１〜Ｗ２）、
この文脈ＰにシンボルＫが登録されているかをチェック
し（ステップＷ３）、登録されている場合は、第３実施
形態の説明中、図５８にて前述したステップＱ９〜Ｑ１
２と同様の処理を行なう（ステップＷ９〜Ｗ１２）。

【０３５６】一方、文脈ＰにシンボルＫが登録されてい
ない場合は、同じく図５８のステップＱ４〜Ｑ５と同様
に、符号化部３０６ＢがＥＳＣの符号を出力し（ステッ
プＷ４）、符号変更部３０７Ｂが、符号木保持部３０１
Ｂに保持されている符号木のＥＳＣのリーフをスプレイ
処理する（ステップＷ５）。その後、符号木保持部３０
１Ｂは、文脈ＰのＩＤ（ルートＩＤ）を文脈木保持部３
０２Ｂから受けて、この文脈ＰのノードＩＤと親子情報
とを最長符号検出部６９に送る。

【０３５７】最長符号検出部６９では、親子情報から最
長の符号長を持つリーフＸ（ｐ）のＩＤ（ＩＤ−０）を
検出する（ステップＷ６）。そして、検出したリーフＸ
（ｐ）のＩＤ、ＩＤ−０をリーフＩＤ保持部６８に送
り、このＩＤ−０とＩＤ−０に格納してあるシンボルを
ラッチ７０でラッチする。

【０３５８】また、新規ノードＩＤ発生部７１は、２つ
の新規ノードＩＤ（ＩＤ−１，ＩＤ−２）を発生し、親
子情報更新部６３は、３つのＩＤ（ＩＤ−０，ＩＤ−
１，ＩＤ−２）を受けて親子情報を更新し、符号木保持
部３０１ＢのノードＩＤ保持部６５に登録する。一方、
符号木保持部３０１ＢのリーフＩＤ保持部６８には登録
シンボルＫと新規ＩＤ（ＩＤ−２），ＩＤ−０に登録し
てあったシンボルとＩＤ−１を新規リーフとしてそれぞ
れ登録する（ステップＷ７）。

【０３５９】上述の処理を行なうことにより、最長の符
号長であったリーフはノードとなり、このノードの下に
２つの新規リーフが登録される。そして、文脈Ｐを変更
して（ステップＷ８）、文脈ＰにシンボルＫが登録され
ていることを検出するまで上述の処理を繰り返す。この
ように、本発明の関連技術２の第１の変形例にかかるデ
ータ圧縮装置によれば、符号化側にて前述した効果に加
えて、文脈Ｐの符号木において、最長の符号長をもつ
（ルートからの距離が最も遠い）リーフＸ（ｐ）を検出
し、このリーフＸ（ｐ）を分岐してシンボルＫとＸ
（ｐ）に登録されていたシンボルの符号木への新規登録
を行なう。これにより、「最長の符号長」＝「出現頻度
の最も低いシンボル」であるため、符号長が１ビット伸
びたことによる符号化効率の低下を最小限に抑えること
ができ、データ圧縮の処理速度が大幅に向上するととも
にデータ圧縮装置の処理負荷も大幅に軽減できる。

【０３６０】（２）復元側の説明本関連技術２の第１の変形例にかかるデータ復元装置４
では、図６２にて前述したものの構成と同様の構成を有
しており、さらに、この復元側における符号登録部４０
７Ｂおよび符号木保持部４０１Ｂは、それぞれ符号化側
の符号登録部３２２Ｂおよび符号木保持部３０１Ｂと同
様の内部構成を有している（図６６参照）。従って、符
号登録部４０７Ｂおよび符号木保持部４０１Ｂは、符号
化側の符号登録部３２２Ｂおよび符号木保持部３０１Ｂ
と同様の構成を有しているので、符号登録部４０７Ｂ
が、復号したシンボルの符号を符号木保持部４０１Ｂに
新規に登録する処理は、符号化側と同様の処理を行なう
ことになる。

【０３６１】このため、符号化側で符号化されたシンボ
ルＫを復号する処理は、第３実施形態中、図６５にて前
述した処理（ステップＶ１〜Ｖ１１）と同様にして行な
えばよく、図６５中のステップＶ１０においては、符号
化側の処理ステップＷ７，Ｗ８（図６７参照）を行なえ
ばよい。このように、本発明の関連技術２の第１の変形
例にかかるデータ復元装置によれば、符号化側と同様
に、文脈Ｐの符号木において最長の符号長をもつ（ルー
トからの距離が最も遠い）リーフＸ（ｐ）を検出し、こ
のリーフＸ（ｐ）を分岐してシンボルＫとＸ（ｐ）に登
録されていたシンボルの符号木への新規登録を行なうこ
とにより、「最長の符号長」＝「出現頻度の最も低いシ
ンボル」であることから、前述の関連技術２の復元側に
おける効果に加えて、符号長が１ビット伸びたことによ
るデータの復号効率の低下を最小限に抑えることがで
き、データ復号の処理速度が大幅に向上するとともにデ
ータ復元装置の処理負荷も大幅に軽減できる効果があ
る。

【０３６２】さらに、上述のように、シンボルの復元側
の登録処理を符号化側の登録処理と同一の処理とするこ
とで、符号化側で符号化されたシンボルの符号を正確に
復号することができる効果がある。（ｃ−２）関連技術２の第２の変形例の説明（１）符号化側の説明本変形例においても、符号化側の構成は、図５２にて前
述したものの構成と同様である。

【０３６３】そして、本関連技術２における図５２に示
す符号登録部３２２Ｂには、符号木保持手段３０１Ｂに
保持されている符号木上に新規に登録されたリーフを分
岐してシンボルを登録するために、新規ノードＩＤ発生
部６１，ラッチ６２，親子情報更新部６３及び最新登録
ＩＤ保持部７０が設けられており、符号木保持部３０１
Ｂには、外部節点（リーフＩＤ）保持部６４、内部節点
（ノードＩＤ）保持部６５，ＥＳＣ−ＩＤ保持部６６及
び符号木管理部６７が設けられている。

【０３６４】ここで、上述の構成の内、図５３または図
６６にて既述の符号と同じ符号は同じ部分を示すので、
その説明は省略する。本関連技術２で新たに設けられて
いる、最新登録ＩＤ保持部（分岐位置保持手段）７０
は、符号木保持部３０１Ｂに保持されている符号木に最
後に（新規に）登録されたリーフのＩＤを保持するもの
である。

【０３６５】符号登録部３２２Ｂおよび符号木保持部３
０１Ｂが上述の構成を有していることにより、符号登録
部３２２Ｂが、符号木保持部３０１Ｂに保持されている
符号木にシンボルが最後に登録された最新のリーフを分
岐して、この新たに作成されたリーフにシンボルＫを新
規に登録することができる。以下に、上述の処理につい
て、図６９の処理ステップＸ１〜Ｘ１３を参照しなが
ら、さらに詳述する。

【０３６６】上述の処理は、最後に登録された、最新登
録のリーフのＩＤを最新登録ＩＤ保持部７０に保持し、
そのＩＤを分岐することで新規登録を行なう。まず、シ
ンボルＫが含まれている文脈を検索するために、文脈木
保持部３０２Ｂに保持されている文脈（文脈Ｐ）を選択
し（ステップＸ１〜Ｘ２）、この文脈ＰにシンボルＫが
登録されているかをチェックし（ステップＸ３）、登録
されている場合は、第３実施形態の変形例の説明中、図
６７にて前述したステップＷ１０〜Ｗ１３と同様の処理
を行なう（ステップＸ３のＹＥＳルートからステップＸ
１０〜Ｘ１３）。

【０３６７】一方、文脈ＰにシンボルＫが登録されてい
ない場合は、同じく図６７のステップＷ４〜Ｗ５と同様
に、符号化部３０６ＢがＥＳＣの符号を出力し（ステッ
プＸ４）、符号変更部３０７Ｂが、符号木保持部３０１
Ｂに保持されている符号木のＥＳＣのリーフをスプレイ
処理する（ステップＸ５）。その後、符号木保持部３０
１Ｂは、文脈ＰのＩＤ（ルートＩＤ）を、そのまま最新
登録ＩＤ保持部７０に出力する。

【０３６８】最新登録ＩＤ保持部７０では、この文脈Ｐ
に対応する符号木の最新登録のリーフＸ（ｐ）のリーフ
ＩＤ（ＩＤ−０）を符号木保持部３０１ＢのリーフＩＤ
保持部６４に送り、ＩＤ−０とＩＤ−０に格納してある
シンボルをラッチ６２でラッチする。新規ＩＤ発生部６
１は、２つの新規ＩＤ（ＩＤ−１，ＩＤ−２）を発生
し、親子情報更新部６３が、３つのＩＤ（ＩＤ−０，Ｉ
Ｄ−１，ＩＤ−２）を受けて親子情報を更新することに
よりリーフＸ（ｐ）を分岐し（ステップＸ６）、この情
報を符号木保持部３０１ＢのノードＩＤ保持部６５に登
録する。

【０３６９】一方、符号木保持部３０１ＢのリーフＩＤ
保持部６４には、登録シンボルＫと、リーフＸ（ｐ）に
登録してあったシンボルとを新規リーフとしてそれぞれ
登録し（ステップＸ７，Ｘ８）、さらに最新登録ＩＤ保
持部７０には新規ＩＤであるＩＤ−２を登録する。そし
て、文脈Ｐを変更し（ステップＸ９）、文脈Ｐにシンボ
ルＫが登録されていることを検出するまで上述の処理を
繰り返す。

【０３７０】以上の処理を行なうことにより、新たなシ
ンボルＫが入力されたときは、常に、シンボルＫが入力
される直前に登録された最新の登録リーフを分割してこ
のリーフにシンボルＫを登録する。このように、関連技
術２の第２の変形例にかかるデータ圧縮装置によれば、
シンボルの符号木への新規登録を、直前に登録したシン
ボルのリーフを分岐してこのリーフに登録することによ
り、「直前に登録したリーフのシンボル」＝「比較的符
号長の長いシンボル」に近似できることから、第３実施
形態の第１の変形例にて前述したように最長の符号長を
もつリーフを検出する処理を省略することができ、さら
にデータ圧縮の処理速度が大幅に向上する効果がある。

【０３７１】（２）復元側の説明復元側の構成は、符号化側と同様に、図６２にて前述し
た構成と同様であり、さらに、この復元側における符号
登録部４０７Ｂおよび符号木保持部４０１Ｂは、それぞ
れ符号化側の符号登録部３２２Ｂおよび符号木保持部３
０１Ｂと同様の内部構成をもつものである（図６８参
照）。

【０３７２】従って、符号登録部４０７Ｂおよび符号木
保持部４０１Ｂが、符号化側の符号登録部３２２Ｂおよ
び符号木保持部３０１Ｂと同様の構成を有しているの
で、第３実施形態の第１の変形例における復元側と同様
に、符号登録部４０７Ｂが復号したシンボルの符号を符
号木保持部４０１Ｂに新規に登録する処理は、符号化側
の処理と同様に行なわれる。

【０３７３】このため、本復元側でも、符号化側で符号
化されたシンボルＫを復号する処理は、図６５にて前述
した処理（ステップＶ１〜Ｖ１１）と同様にして行なわ
れる。即ち、図６５中の処理ステップＶ１１において
も、符号化側の登録処理である図６９のステップＸ６〜
Ｘ８と同様の処理が行なわれている。このように、関連
技術２の第２の変形例にかかるデータ復元装置によれ
ば、シンボルの符号木への新規登録を、符号化側と同様
に、直前に登録したシンボルのリーフを分岐してこのリ
ーフに登録することにより、「直前に登録したリーフの
シンボル」＝「比較的符号長の長いシンボル」に近似で
きることから、第３実施形態の第１の変形例にて前述し
たように最長の符号長をもつリーフを検出する処理を省
略することができ、さらにデータ復号の処理速度が大幅
に向上する効果がある。

【０３７４】そして、このようにシンボルの符号木への
新規登録の処理を符号化側の登録処理と同一にすること
で、符号化側で符号化されたシンボルの復号処理を正確
に行うことができる効果もある。なお、以上の関連技術
２および各変形例において、符号化側で述べた方法を、
符号化するデータあるいはシステムによって切り替える
ために、符号データの伝送に先立って、ヘッダ部にどの
方式を用いているかのＩＤ番号を付加し、復元側ではそ
のＩＤ番号から符号化側で用いた登録方式を選択するよ
うにしてもよい。

【０３７５】

【発明の効果】以上詳述したように、請求項１記載の本
発明のデータ圧縮方法によれば、入力データを過去に出
現した履歴に応じて符号化して圧縮するデータ圧縮方法
において、入力データとそれまでに連続したｎ個のデー
タからなる文脈との組み合わせを保持する文脈収集過程
と、文脈毎に独立した符号木を保持する符号木保持過程
と、文脈収集過程の文脈に該当したデータが出現したと
き、符号木の頂点を意味するルートから符号木上のデー
タが格納されている点としてのリーフまでの分岐点とし
てのノードの分岐に応じた固有のデータとして定義され
る符号を出力する符号出力過程と、符号出力過程での処
理の後、データのリーフと他データのリーフあるいはノ
ードとを組み替える符号長変更過程とを有するので、入
力データの出現頻度を求めて確率モデルを構築して各入
力データに符号を割り当て符号表を作成し、この符号表
から符号化する文字の符号を出力するという２段階の処
理を同時に行なうことができ、これにより圧縮処理の速
度が大幅に向上するという効果がある。また、データが
入力されるごとに既に構築されている確率モデルを再構
築するという膨大な演算処理を省くことができ、これに
より圧縮処理の速度がさらに向上する効果もある。さら
に、過去に出現した入力データと同じデータが繰り返し
出現するほど、そのデータの符号を少ないビット数で表
すことができ、これによりデータ圧縮における圧縮効果
が大幅に向上する効果もある。

【０３７６】また、請求項２記載の本発明のデータ圧縮
方法によれば、上述の請求項１記載の本発明のデータ圧
縮方法が有する各過程に加えて、入力データと文脈との
組み合わせが文脈収集過程に保持されているか否かを判
別する文脈判別過程と、予めデータ未登録を示すデータ
として定義されるエスケープコードを登録したリーフを
符号木に保持するエスケープコード保持過程とを有して
おり、入力データと文脈との組み合わせが文脈収集過程
の履歴に保持されていない組み合わせであったとき、エ
スケープコードを出力し、文脈収集過程に保持されてい
る組み合わせが得られるまで、データの文脈を短くする
処理を繰り返すことを特徴としているので、上述の請求
項１記載の本発明のデータ圧縮方法にかかる効果に加え
て、入力データと文脈との組み合わせの履歴の全てを予
め登録しておかなくてもよく、これによりデータ圧縮の
処理速度が大幅に向上する効果がある。さらに、入力デ
ータと文脈との組み合わせが得られるまでの時間を短縮
することができ、これによりデータ圧縮の処理速度が大
幅に向上する効果もある。

【０３７７】また、請求項３記載の本発明のデータ圧縮
方法によれば、上述の請求項２記載の本発明のデータ圧
縮方法が有する各過程に加えて、入力データと文脈との
組み合わせが文脈収集過程の履歴に保持されていない組
み合わせであったとき、入力データと文脈との組み合わ
せを文脈収集過程に新規に登録する文脈新規登録過程
と、入力データと文脈との組み合わせが文脈収集過程の
履歴に保持されていない組み合わせであったとき、デー
タを文脈に対応した符号木に新規に登録する符号木新規
登録過程とを有しており、入力データと文脈との組み合
わせが文脈収集過程の履歴に保持されていない組み合わ
せであったとき、エスケープコードの符号を出力すると
同時に、入力データと文脈との組み合わせを履歴に登録
するとともに、データを文脈に対応した符号木に登録
し、文脈収集過程に保持されている組み合わせが得られ
るまでデータの文脈を短くする処理を繰り返すことを特
徴としているので、上述の請求項２記載の本発明のデー
タ圧縮方法における効果に加えて、さらに、過去に予め
登録されていなかった入力データを新規に登録してゆく
ことができるとともにこの新規に登録したデータも次の
符号化処理においては早い段階で符号化することがで
き、これにより符号化処理が進むほどデータの圧縮効果
が大幅に向上する効果がある。

【０３７８】さらに、請求項４記載の本発明のデータ圧
縮方法によれば、請求項３記載の本発明のデータ圧縮方
法が有する各過程とそれぞれ同様の過程を有し、文脈新
規登録過程及び符号木新規登録過程においては、履歴に
あると判断された直前の文脈とデータとの組み合わせの
みを登録することを特徴としているので、請求項３記載
の本発明のデータ圧縮方法による効果に加えて、過去の
入力データの履歴にないと判断された文脈とデータとの
組み合わせを全て登録する必要がなく、これによりデー
タの圧縮処理がさらに大幅に向上する効果がある。さら
に、実際に出現頻度が高いデータについてのみ符号をも
たせる（登録する）ことができ、これによりデータの圧
縮効率が大幅に向上する効果もある。

【０３７９】また、請求項５記載の本発明のデータ復元
方法によれば、入力データを過去の入力データの履歴に
応じて符号化した符号データを復元するデータ復元方法
において、復号データと文脈との組み合わせの履歴を保
持する文脈収集過程と、文脈に応じておのおの独立した
符号木を保持する符号木保持過程と、直前までに復号し
たデータの文脈からデータの符号木を決定する符号木決
定過程と、符号木決定過程で決定した符号木とデータの
符号からデータを復号する復号過程と、復号過程の復号
の後に、符号化側と同一の手段で、符号木上のデータ格
納点としてのリーフ間又はリーフと符号木の分岐点とし
てのノードとを組み替える符号長変更過程とを有するの
で、入力データの出現頻度を求めて確率モデルを構築し
て各入力データに符号を割り当て符号表を作成し、この
符号表から復号する文字を出力するという２段階の処理
を同時に行なうことができ、これによりデータの復元処
理の速度が大幅に向上するという効果がある。また、デ
ータが入力されるごとに既に構築されている確率モデル
を再構築するという膨大な演算処理を省くことができ、
これにより復元処理の速度がさらに向上する効果もあ
る。さらに、過去に出現した入力データの符号と同じデ
ータの符号が繰り返し出現するほど、そのデータの符号
を少ないビット数で表すことができ、これによりデータ
復元における復元効果が大幅に向上する効果もある。

【０３８０】さらに、請求項６記載の本発明のデータ復
元方法によれば、請求項５記載の本発明のデータ復元方
法が有する各過程とそれぞれ同様の過程を有し、符号木
にはそれぞれの文脈に応じた符号木毎に予めデータ未登
録を示すデータとして定義されるエスケープコードを登
録し、復号時にエスケープコードを復号した場合、エス
ケープコード以外が復号されるまで、文脈の長さを短く
する処理を繰り返すことを特徴としているので、上述の
請求項５記載の本発明のデータ復元方法における効果に
加えて、復号データと文脈との組み合わせの履歴の全て
を予め登録しておかなくてもよく、これによりデータ復
元の処理速度が大幅に向上する効果がある。さらに、復
号データと文脈との組み合わせが得られるまでの時間を
短縮することができ、これによりデータ復元の処理速度
が大幅に向上する効果もある。

【０３８１】また、請求項７記載の本発明のデータ復元
方法によれば、請求項６記載の本発明のデータ復元方法
が有する各過程に加えて、文脈収集過程にデータを新規
に登録する文脈新規登録過程と、復号したデータを文脈
に応じた符号木に新規に登録する符号木新規登録過程と
を有しており、データ未登録を示すデータとして定義さ
れるエスケープコードを復号したとき、文脈新規登録過
程及び符号木新規登録過程を実行して、エスケープコー
ド以外が復号されるまで、文脈の長さを短くする処理を
繰り返すことを特徴としているので、上述の請求項６記
載の本発明のデータ復元方法における効果に加えて、さ
らに、過去に予め登録されていなかった復号データを新
規に登録してゆくことができるとともにこの新規に登録
した復号データも次の復号処理においては早い段階で復
号することができ、これにより復号処理が進むほどデー
タの復元効果が大幅に向上する効果がある。

【０３８２】さらに、請求項８記載の本発明のデータ復
元方法によれば、請求項５記載のデータ復元方法が有す
る各過程とそれぞれ同様の過程を有し、データ未登録を
示すデータとして定義されるエスケープコード以外が復
号されるまでの処理において、エスケープコードを一つ
でも復号した時、エスケープコード以外を復号した直前
の文脈においてのみ、文脈新規登録過程および符号木新
規登録過程での各新規登録処理を行なうことを特徴とし
ているので、請求項７記載の本発明のデータ復元方法に
よる効果に加えて、過去の入力データの履歴にないと判
断された文脈とデータとの組み合わせを全て登録する必
要がなく、これによりデータ復元の処理速度がさらに大
幅に向上する効果がある。さらに、実際に出現頻度が高
いデータについてのみ符号をもたせる（登録する）こと
ができ、これによりデータの復元効率が大幅に向上する
効果もある。

【０３８３】また、請求項９記載の本発明のデータ圧縮
装置によれば、入力データを過去に出現した履歴に応じ
て符号化して圧縮するデータ圧縮装置において、入力デ
ータの直前までに入力されたｎ個の入力データからなる
文脈を保持する前置データ保持手段と、入力データと文
脈との組み合わせを保持する履歴保持手段と、文脈毎に
独立した符号木を保持する符号木保持手段と、前置デー
タ保持手段に保持されている直前までの入力データから
データの符号木を決定する符号木決定手段と、符号木決
定手段で選択した符号木の頂点を意味するルートからデ
ータが格納されているリーフに沿って途中に位置する分
岐点としてのノードからの分岐に従って固有のデータを
出力する符号出力手段と、符号化したリーフと他のリー
フあるいはノードとを組み替える符号長変更手段と、デ
ータを前置データ保持手段に登録する前置データ更新手
段とをそなえて構成されているので、入力データの出現
頻度を求めて確率モデルを構築して各入力データに符号
を割り当て符号表を作成し、この符号表から符号化する
データの符号を出力するという２段階の処理を同時に行
なうことができ、これによりデータ圧縮の処理速度が大
幅に向上するという効果がある。また、データが入力さ
れるごとに既に構築されている確率モデルを再構築する
という膨大な演算処理を省くことができ、これによりデ
ータ圧縮の処理速度がさらに向上する効果もある。ま
た、過去に符号化したデータと同じデータが出現する毎
に、符号化したリーフと他のリーフあるいはノードとを
組み替えて符号長を変更することができるので、同じデ
ータが繰り返し出現するほど、そのデータの符号を少な
いビット数で表すことができ、これによりデータの圧縮
効果が大幅に向上する効果もある。

【０３８４】さらに、請求項１０記載の本発明のデータ
圧縮装置によれば、入力データを過去に出現した履歴に
応じて符号化して圧縮するデータ圧縮装置において、入
力データの直前までに入力されたｎ個の入力データから
なる文脈を保持する前置データ保持手段と、入力データ
と文脈との組み合わせを保持する履歴保持手段と、デー
タ未登録を示すデータとして定義されるエスケープコー
ドをあらかじめ登録した文脈毎に独立した符号木を保持
する符号木保持手段と、文脈と入力データからデータの
符号木を決定する符号木決定手段と、符号木決定手段で
決定した符号木にデータが登録されているか否かを判別
する文脈判別手段と、符号木にデータが登録されていな
いときは符号木の頂点を意味するルートからエスケープ
コードのデータ格納点としてのリーフまでの途中に位置
する分岐点としてのノードからの分岐に従ってエスケー
プコードを出力するエスケープコード出力手段と、符号
木にデータが登録されていないときは文脈の長さｎを短
くする文脈変更手段と、符号木にデータが登録されてい
るときは符号木のルートからデータのリーフまでの途中
に位置するノードからの分岐に従ってデータの符号を出
力する符号出力手段と、符号化したリーフと他のリーフ
あるいはノードとを組み換える符号長変更手段と、デー
タを前置データ保持手段に登録する前置データ更新手段
と、エスケープコードを符号化したときはデータの符号
化を行なうまで処理を繰り返す制御手段とをそなえて構
成されているので、上述の請求項９記載の本発明のデー
タ圧縮装置における効果に加えて、入力データと文脈と
の組み合わせの履歴の全てを予め登録しておかなくても
よい。従って、データ圧縮の処理速度が大幅に向上する
とともに、文脈の登録に使用するメモリを大幅に削減で
きるので、データ圧縮装置の処理負荷も大幅に軽減でき
る効果がある。

【０３８５】また、請求項１１記載の本発明のデータ圧
縮装置によれば、入力データを過去に出現した履歴に応
じて符号化して圧縮するデータ圧縮装置において、入力
データの直前までに入力されたｎ個の入力データからな
る文脈を保持する前置データ保持手段と、入力データと
文脈との組み合わせを保持する履歴保持手段と、データ
未登録を示すデータとして定義されるエスケープコード
を予め登録した文脈毎に独立した符号木を保持する符号
木保持手段と、文脈と入力データからデータの符号木を
決定する符号木決定手段と、符号木決定手段で決定した
符号木にデータが登録されているか否かを判別する文脈
判別手段と、符号木にデータが登録されていないときは
符号木の頂点を意味するルートからエスケープコードの
データ格納点としてのリーフまでの中に位置する分岐点
としてのノードからの分岐に従ってエスケープコードを
出力するエスケープ出力手段と、符号木にデータが登録
されていないときは履歴保持手段にデータと文脈の組み
合わせを登録する履歴登録手段と、符号木にデータが登
録されていないときは符号木にデータを新規に登録する
符号登録手段と、符号木にデータが登録されていないと
きは文脈の長さｎを短くする文脈変更手段と、符号木に
データが登録されているときは符号木のルートからデー
タのリーフまでの途中に位置するノードからの分岐に従
ってデータの符号を出力する符号出力手段と、符号化し
たリーフと他のリーフあるいはノードとを組み換える符
号長変更手段と、データを前置データ保持手段に登録す
る前置データ更新手段と、エスケープコードを符号化し
たときはデータの符号化を行なうまで処理を繰り返す制
御手段とをそなえて構成されているので、上述の請求項
１１記載の本発明のデータ圧縮装置における効果に加え
て、さらに、過去に予め登録されていなかった入力デー
タを新規に登録してゆくことができるとともに、この新
規に登録したデータも次の符号化処理においては早い段
階で符号化することができ、これにより符号化処理が進
むほどデータの圧縮効果が大幅に向上するとともにデー
タ圧縮装置の処理負荷も大幅に軽減できる効果がある。

【０３８６】さらに、請求項１２記載の本発明のデータ
圧縮装置によれば、入力データを過去に出現した履歴に
応じて符号化して圧縮するデータ圧縮装置において、入
力データの直前までに入力されたｎ個の入力データから
なる文脈を保持する前置データ保持手段と、入力データ
と文脈との組み合わせを保持する履歴保持手段と、デー
タ未登録を示すデータとして定義されるエスケープコー
ドをあらかじめ登録した文脈毎に独立した符号木を保持
する符号木保持手段と、文脈と入力データからデータの
符号木を決定する符号木決定手段と、符号木決定手段で
決定した符号木にデータが登録されているか否かを判別
する文脈判別手段と、符号木にデータが登録されていな
いときは符号木の頂点を意味するルートからエスケープ
コードのデータ格納点としてのリーフまでの途中に位置
する分岐点としてのノードからの分岐に従ってエスケー
プコードを出力するエスケープコード出力手段と、符号
木にデータが登録されていないときは文脈の長さｎを短
くする文脈変更手段と、符号木にデータが登録されてい
るときは符号木のルートからデータのリーフまでの途中
に位置するノードからの分岐にしたがってデータの符号
を出力するエスケープ符号出力手段と、履歴保持手段に
データと文脈の組み合わせを登録する履歴登録手段と、
符号木にデータを新規に登録する符号登録手段と、符号
化したリーフと他のリーフあるいはノードとを組み換え
る符号長変更手段と、データを前置データ保持手段に登
録する前置データ保持手段に登録する前置データ更新手
段と、データの符号化時に一度でもエスケープコードを
符号化したときは、データの符号化の直前の文脈とデー
タとの組み合わせを履歴登録手段で履歴保持手段に登録
し、データの符号化の直前に符号化したエスケープコー
ドを持つ符号木に符号登録手段でデータを新規に登録す
る制御手段とをそなえて構成されているので、上述の請
求項１１記載の本発明のデータ圧縮装置による効果に加
えて、過去の入力データの履歴にないと判断された文脈
とデータとの組み合わせを全て登録する必要がなく、こ
れによりデータの圧縮処理がさらに大幅に向上する効果
がある。さらに、実際に出現頻度が高いデータについて
のみ符号をもたせる（登録する）ことができ、これによ
りデータの圧縮効率が大幅に向上する効果もある。そし
て、以上のような効果により、データ圧縮装置の性能が
飛躍的に向上する効果がある。

【０３８７】また、請求項１３記載の本発明のデータ復
元装置によれば、過去に出現した履歴に応じて符号化し
た符号を復号するデータ復元装置において、過去に復号
したｎ個のデータを保持する前置データ保持手段と、復
号したデータと文脈との組み合わせを保持する履歴保持
手段と、文脈毎に独立した符号木を保持する符号木保持
手段と、前置データ保持手段に保持されている文脈から
データを復号するための符号木を決定する符号木決定手
段と、符号に従って符号木決定手段で選択した符号木の
頂点を意味するルートから分岐点としてのノードを走査
して到達したデータ格納点としてのリーフに格納されて
いるデータを出力する復号手段と、復号したリーフと他
のリーフあるいはノードとを組み替える符号長変更手段
と、復号したデータを前置データ保持手段に登録する前
置データ更新手段とをそなえて構成されているので、入
力データの出現頻度を求めて確率モデルを構築して各入
力データに符号を割り当て符号表を作成し、この符号表
から復号する文字を出力するという２段階の処理を同時
に行なうことができ、これによりデータの復元処理の速
度が大幅に向上するという効果がある。また、データが
入力されるごとに既に構築されている確率モデルを再構
築するという膨大な演算処理を省くことができ、これに
より復元処理の速度がさらに向上する効果もある。さら
に、過去に出現した入力データの符号と同じデータの符
号が繰り返し出現するほど、そのデータの符号を少ない
ビット数で表すことができ、これによりデータ復元にお
ける復元効果が大幅に向上する効果もある。そして、以
上のような効果により、データ復元装置の性能が飛躍的
に向上する効果がある。

【０３８８】さらに、請求項１４記載の本発明のデータ
復元装置によれば、過去に出現した履歴に応じて符号化
した符号を復号するデータ復元装置において、過去に復
号したｎ個のデータを保持する前置データ保持手段と、
復号したデータと文脈との組み合わせを保持する履歴保
持手段と、データ未登録を示すデータとして定義される
エスケープコードをあらかじめ登録した符号木を保持す
る符号木保持手段と、前置データ保持手段に保持されて
いる文脈からデータを復号するための符号木を決定する
符号木決定手段と、符号に従って符号木決定手段で選択
した符号木の頂点を意味するルートから分岐点としての
ノードを走査して到達したデータ格納点としてのリーフ
に格納されているデータを出力する復号手段と、復号し
たリーフと他のリーフあるいはノードとを組み替える符
号長変更手段と、出力したデータがエスケープコードで
あったときデータを棄却し文脈を短くする文脈変更手段
と、復号したデータを前置データ保持手段に登録する前
置データ更新手段と、エスケープコードを復号した時は
文脈変更手段で文脈を再設定し、エスケープコード以外
が復号されるまで処理を繰り返す制御手段とをそなえて
構成されているので、上述の請求項１３記載の本発明の
データ復元装置における効果に加えて、復号データと文
脈との組み合わせの履歴の全てを予め登録しておかなく
てもよく、これによりデータ復元の処理速度が大幅に向
上する効果がある。さらに、復号データと文脈との組み
合わせが得られるまでの時間を短縮することができ、こ
れによりデータ復元の処理速度が大幅に向上するととも
にデータ復元装置の性能も大幅に向上する効果もある。

【０３８９】また、請求項１５記載の本発明のデータ復
元装置によれば、過去に出現した履歴に応じて符号化し
た符号を復号するデータ復元装置において、過去に復号
したｎ個のデータを保持する前置データ保持手段と、復
号したデータと文脈との組み合わせを保持する履歴保持
手段と、エスケープコードをあらかじめ登録した符号木
を保持する符号木保持手段と、前置データ保持手段に保
持されている文脈からデータを復号するための符号木を
決定する符号木決定手段と、符号に従って符号木決定手
段で選択した符号木の頂点を意味するルートから分岐点
としてのノードを走査して到達したデータ格納点として
のリーフに格納されているデータを出力する復号手段
と、復号したリーフと他のリーフあるいはノードとを組
み替える符号長変更手段と、出力したデータがエスケー
プコードであったとき、データを棄却し文脈を短くする
文脈変更手段と、復号したデータを前置データ保持手段
に登録する前置データ更新手段と、データの復号処理で
エスケープコードを復号したときの全ての文脈と復号し
たデータとを履歴保持手段に登録する履歴登録手段と、
データの復号処理でエスケープコードを復号した時の文
脈に対応した全ての符号木にデータの符号を登録する符
号登録手段と、エスケープコードを復号した時は文脈変
更手段で文脈を再設定し、エスケープコード以外が復号
されるまで処理を繰り返す制御手段とをそなえて構成さ
れているので、上述の請求項１４記載の本発明のデータ
復元装置における効果に加えて、さらに、過去に予め登
録されていなかった復号データを新規に登録してゆくこ
とができるとともにこの新規に登録した復号データも次
の復号処理においては早い段階で復号することができ、
これにより復号処理が進むほどデータの復元効果が大幅
に向上するとともに、データ復元装置の性能も大幅に向
上する効果がある。

【０３９０】さらに、請求項１６記載の本発明のデータ
復元装置によれば、過去に出現した履歴に応じて符号化
した符号を復号するデータ復元装置において、過去に復
号したｎ個のデータを保持する前置データ保持手段と、
復号したデータと文脈との組み合わせを保持する履歴保
持手段と、データ未登録を示すデータとして定義される
エスケープコードをあらかじめ登録した符号木を保持す
る符号木保持手段と、前置データ保持手段に保持されて
いる文脈からデータを復号するための符号木を決定する
符号木決定手段と、符号に従って符号木決定手段で選択
した符号木の頂点を意味するルートから分岐点としての
ノードを走査して到達したデータ格納点としてのリーフ
に格納されているデータを出力する復号手段と、復号し
たリーフと他のリーフあるいはノードとを組み替える符
号長変更手段と、出力したデータがエスケープコードで
あったときデータを棄却し文脈を短くする文脈変更手段
と、復号したデータを前置データ保持手段に登録する前
置データ更新手段と、データの復号処理でエスケープコ
ードを最後に復号した時の文脈と復号したデータとを履
歴保持手段に登録する履歴登録手段と、データの復号処
理で最後にエスケープコードを復号した時の文脈に対応
した符号木にデータの符号を登録する符号登録手段と、
エスケープコードを復号した時は文脈変更手段で文脈を
再設定し、エスケープコード以外が復号されるまで処理
を繰り返す制御手段とをそなえて構成されているので、
請求項１５記載の本発明のデータ復元装置による効果に
加えて、過去の入力データの履歴にないと判断された文
脈とデータとの組み合わせを全て登録する必要がなく、
これによりデータ復元の処理がさらに大幅に向上する効
果がある。さらに、実際に出現頻度が高いデータについ
てのみ符号をもたせる（登録する）ことができ、これに
よりデータの復元効率が大幅に向上するとともにデータ
復元装置の性能も大幅に向上する効果がある。

【図面の簡単な説明】

【図１】本発明の原理ブロック図である。

【図２】本発明の原理ブロック図である。

【図３】本発明の原理ブロック図である。

【図４】本発明の原理ブロック図である。

【図５】本発明の原理ブロック図である。

【図６】本発明の原理ブロック図である。

【図７】本発明の原理ブロック図である。

【図８】本発明の原理ブロック図である。

【図９】本発明に関連する技術を説明するためのブロッ
ク図である。

【図１０】本発明に関連する技術を説明するためのブロ
ック図である。

【図１１】本発明に関連する技術を説明するためのブロ
ック図である。

【図１２】本発明に関連する技術を説明するためのブロ
ック図である。

【図１３】本発明に関連する技術を説明するためのブロ
ック図である。

【図１４】本発明に関連する技術を説明するためのブロ
ック図である。

【図１５】本発明に関連する技術１にかかるデータ圧縮
装置及びデータ復元装置の構成を示すブロック図であ
る。

【図１６】（ａ）は文脈木の格納形式の一例を示す図で
ある。（ｂ）は辞書の親子関係を示す図である。

【図１７】符号木の初期状態を説明するための図であ
る。

【図１８】符号木を格納する配列の一例を示す図であ
る。

【図１９】（ａ），（ｂ）はそれぞれスプレイ符号の符
号更新の基本操作およびスプレイ符号の符号更新の一例
を説明するための図である。

【図２０】関連技術１にかかる符号化の手順を説明する
ためのフローチャートである。

【図２１】（ａ），（ｂ）は、関連技術１にかかる文脈
木と符号木の更新手順を説明するための図である。

【図２２】（ａ），（ｂ）は、関連技術１にかかる文脈
木と符号木の更新手順を説明するための図である。

【図２３】（ａ），（ｂ）は、関連技術１にかかる文脈
木と符号木の更新手順を説明するための図である。

【図２４】（ａ），（ｂ）は、関連技術１にかかる文脈
木と符号木の更新手順を説明するための図である。

【図２５】（ａ），（ｂ）は、関連技術１にかかる文脈
木と符号木の更新手順を説明するための図である。

【図２６】（ａ），（ｂ）は、関連技術１にかかる文脈
木と符号木の更新手順を説明するための図である。

【図２７】（ａ），（ｂ）は、関連技術１にかかる文脈
木と符号木の更新手順を説明するための図である。

【図２８】（ａ），（ｂ）は、関連技術１にかかる文脈
木と符号木の更新手順を説明するための図である。

【図２９】関連技術１にかかる文字列の符号化後の例を
説明するための図である。

【図３０】（ａ），（ｂ）は文脈木の作成手順のアルゴ
リズムを示す図である。

【図３１】関連技術１にかかる復号化の手順を説明する
ためのフローチャートである。

【図３２】本発明の一実施形態にかかるデータ圧縮装置
およびデータ復元装置の構成を示すブロック図である。

【図３３】本実施形態にかかるデータ圧縮装置の構成を
示すブロック図である。

【図３４】本実施形態にかかる符号化部の構成を示すブ
ロック図である。

【図３５】本実施形態にかかる符号化の手順を説明する
ためのフローチャートである。

【図３６】本実施形態にかかる符号の出力手順を説明す
るためのフローチャートである。

【図３７】本実施形態にかかる符号木の組み替え手順を
説明するためのフローチャートである。

【図３８】本実施形態にかかるデータ復元装置の構成を
説明するためのブロック図である。

【図３９】本実施形態にかかる復号部の構成を説明する
ためのブロック図である。

【図４０】本実施形態にかかる復号化の手順を説明する
ためのフローチャートである。

【図４１】本実施形態にかかる復号化の手順を説明する
ためのフローチャートである。

【図４２】本実施形態の第１の変形例にかかるデータ圧
縮装置の構成を説明するためのブロック図である。

【図４３】本実施形態の第１の変形例にかかる符号化の
手順を説明するためのフローチャートである。

【図４４】本実施形態の第１の変形例にかかるデータ復
元装置の構成を説明するためのブロック図である。

【図４５】本実施形態の第１の変形例にかかる復号化の
手順を説明するためのフローチャートである。

【図４６】本実施形態の第２の変形例にかかるデータ圧
縮装置の構成を説明するためのブロック図である。

【図４７】本実施形態の第２の変形例にかかる符号化の
手順を説明するためのフローチャートである。

【図４８】本実施形態の第２の変形例にかかるデータ復
元装置の構成を説明するためのブロック図である。

【図４９】本実施形態の第２の変形例にかかる復号化の
手順を説明するためのフローチャートである。

【図５０】本実施形態の第３の変形例にかかる符号化の
手順を説明するためのフローチャートである。

【図５１】本実施形態の第３の変形例にかかる復号化の
手順を説明するためのフローチャートである。

【図５２】本発明に関連する技術２にかかるデータ圧縮
装置の構成を説明するためのブロック図である。

【図５３】関連技術２にかかる符号登録部及び符号木保
持部の構成を説明するためのブロック図である。

【図５４】関連技術２にかかるデータ圧縮装置の動作を
説明するための図である。

【図５５】関連技術２にかかるデータ圧縮装置の動作を
説明するための図である。

【図５６】関連技術２にかかるデータ圧縮装置の動作を
説明するための図である。

【図５７】（ａ），（ｂ）はそれぞれ符号木および文脈
木の一例を示す図である。

【図５８】関連技術２にかかる符号化の手順を説明する
ためのフローチャートである。

【図５９】関連技術２にかかる符号化の手順を説明する
ためのフローチャートである。

【図６０】（ａ），（ｂ）は関連技術２にかかる符号の
新規登録の状態を示す図である。

【図６１】関連技術２にかかる符号化の他の手順を説明
するためのフローチャートである。

【図６２】関連技術２にかかるデータ復元装置の構成を
説明するためのブロック図である。

【図６３】関連技術２にかかるデータ復元装置の動作を
説明するための図である。

【図６４】関連技術２にかかるデータ復元装置の動作を
説明するための図である。

【図６５】関連技術２にかかる復号化の手順を説明する
ためのフローチャートである。

【図６６】関連技術２の第１の変形例にかかる符号登録
部及び符号木保持部の構成を説明するためのブロック図
である。

【図６７】関連技術２の第１の変形例にかかる符号化の
手順を説明するためのフローチャートである。

【図６８】関連技術２の第２の変形例にかかる符号登録
部及び符号木保持部の構成例を説明するためのブロック
図である。

【図６９】関連技術２の第２の変形例にかかる符号化の
手順を説明するためのフローチャートである。

【図７０】（ａ），（ｂ）は多値算術符号化の原理を説
明するための図である。

【図７１】（ａ），（ｂ）は従来の文字単位に圧縮する
多値算術符号化の手順を示すフローチャートである。

【図７２】多値算術符号化のアルゴリズムの一例を示す
図である。

【図７３】（ａ），（ｂ）はスプレイ符号化の原理を説
明するための図である。

【図７４】確率統計型符号化の原理を説明するための図
である。

【図７５】（ａ），（ｂ）は文脈の木の登録例を示す図
である。

【符号の説明】

１，３データ圧縮装置２，４データ復元装置１１，２２文脈収集過程１２，２１スプレイ符号化過程４１上位ノード判別部４２ノード番号管理部（メモリ）４３位置判別部４４，４８ラッチ４５スタック４６下位ノード判別部４７葉／節判別部６１新規ノードＩＤ発生部６２ラッチ６３親子情報更新部６４外部節点（リーフＩＤ）保持部６５内部節点（ノードＩＤ）保持部６６ＥＳＣ−ＩＤ保持部６７符号木管理部６８外部節点／ＥＳＣ−ＩＤ（リーフＩＤ）保持部６９最長符号検出部（分岐位置検索手段）７０最新登録ＩＤ保持部（分岐位置保持手段）１００，２００前置データ保持手段１００Ａ−１〜１００Ａ−ｎ，２００Ａ−１〜２００Ａ
−ｎ前置データ保持部１０１，２０１履歴保持手段１０１Ａ，２０１Ａ文脈履歴保持部１０２，２０２，１０７，２０７，３０１，４０１符
号木保持手段１０２Ａ，２０２Ａ，１０７Ａ，２０７Ａ，３０１Ｂ，
４０１Ｂ符号木保持部１０３，２０３，４０３符号木決定手段１０３Ａ，２０３Ａ符号木決定部１０４符号出力手段１０４Ａ，１０４Ａ′，３０６Ｂ符号化部１０５，２０５符号長変更手段１０５Ａ，２０５Ａ符号木更新部１０６，２０６前置データ更新手段１０６Ａ，２０６Ａ文脈更新部１０８文脈判別手段１０８Ａ文脈判別部１０９エスケープコード出力手段１１０，２０８，３０５，４０５文脈変更手段１１０Ａ，２１０Ａ，３０５Ｂ，４０３Ｂ文脈変更部１１１符号出力手段１１２，２０９履歴登録手段１１３，１１４，１１５，２１２，３０４，３０９，３
１１，４０７，４１０，４１２符号登録手段１１２Ａ，２１２Ａ，３２２Ｂ，４０７Ｂ符号登録部１１６，１１７，２１３制御手段２０４，４０４復号手段２０４Ａ，２０４Ａ′，４０４Ｂ復号部３０３文脈登録手段３０３Ｂ，４０８Ｂ文脈登録部３０２，４０２文脈木保持手段３０２Ｂ，４０２Ｂ文脈木保持部３０６符号化手段３０７，４０６符号更新手段４０６Ｂ符号変更部３０８，４０９分岐位置保持手段３１０，４１１分岐位置検索手段３２１Ｂ，４２１Ｂ文脈保持部４０８，４１３，４１４文脈木登録手段４０９Ｂラッチ５１１文脈収集５１２動的可変長符号化

───────────────────────────────────────────────────── フロントページの続き (72)発明者吉田茂神奈川県川崎市中原区上小田中４丁目１番１号富士通株式会社内Ｆターム(参考） 5J064 AA03 BA00 BA09 BA10 BA11 BB06 BC02 BC27 BC28 BC29 BD04

Claims

【特許請求の範囲】

【請求項１】入力データを過去に出現した履歴に応じ
て符号化して圧縮するデータ圧縮方法において、入力データとそれまでに連続したｎ個のデータからなる
文脈との組み合わせを保持する文脈収集過程と、上記文脈毎に独立した符号木を保持する符号木保持過程
と、上記文脈収集過程の文脈に該当したデータが出現したと
き、上記符号木の頂点を意味するルートから上記符号木
上の上記データが格納されている点としてのリーフまで
の分岐点としてのノードの分岐に応じた固有のデータと
して定義される符号を出力する符号出力過程と、上記符号出力過程での処理の後、上記データのリーフと
他データのリーフあるいはノードとを組み替える符号長
変更過程とを有することを特徴とする、データ圧縮方
法。
【請求項２】入力データを過去に出現した履歴に応じ
て符号化して圧縮するデータ圧縮方法において、入力データとそれまでに連続したｎ個のデータからなる
文脈との組み合わせを保持する文脈収集過程と、上記文脈毎に独立した符号木を保持する符号木保持過程
と、上記文脈収集過程の文脈に該当したデータが出現したと
き、上記符号木の頂点を意味するルートから上記符号木
上の上記データが格納されている点としてのリーフまで
の分岐点としてのノードの分岐に応じた固有のデータと
して定義される符号を出力する符号出力過程と、上記符号出力過程での処理の後、上記データのリーフと
他データのリーフあるいはノードとを組み替える符号長
変更過程とをそなえるとともに、上記の入力データと文脈との組み合わせが上記文脈収集
過程に保持されているか否かを判別する文脈判別過程
と、予めデータ未登録を示すデータとして定義されるエスケ
ープコードを登録したリーフを上記符号木に保持するエ
スケープコード保持過程とを有し、上記の入力データと文脈との組み合わせが上記文脈収集
過程の履歴に保持されていない組み合わせであったと
き、上記エスケープコードを出力し、上記文脈収集過程
に保持されている組み合わせが得られるまで、上記デー
タの文脈を短くする処理を繰り返すことを特徴とする、
データ圧縮方法。
【請求項３】入力データを過去に出現した履歴に応じ
て符号化して圧縮するデータ圧縮方法において、入力データとそれまでに連続したｎ個のデータからなる
文脈との組み合わせを保持する文脈収集過程と、上記文脈毎に独立した符号木を保持する符号木保持過程
と、上記文脈収集過程の文脈に該当したデータが出現したと
き、上記符号木の頂点を意味するルートから上記符号木
上の上記データが格納されている点としてのリーフまで
の分岐点としてのノードの分岐に応じた固有のデータと
して定義される符号を出力する符号出力過程と、上記符号出力過程での処理の後、上記データのリーフと
他データのリーフあるいはノードとを組み替える符号長
変更過程と、上記の入力データと文脈との組み合わせが上記文脈収集
過程に保持されているか否かを判別する文脈判別過程
と、予めデータ未登録を示すデータとして定義されるエスケ
ープコードを登録したリーフを上記符号木に保持するエ
スケープコード保持過程とを有するとともに、上記の入力データと文脈との組み合わせが上記文脈収集
過程の履歴に保持されていない組み合わせであったと
き、上記の入力データと文脈との組み合わせを上記文脈
収集過程に新規に登録する文脈新規登録過程と、上記の入力データと文脈との組み合わせが上記文脈収集
過程の履歴に保持されていない組み合わせであったと
き、上記データを文脈に対応した上記符号木に新規に登
録する符号木新規登録過程とを有し、上記の入力データと文脈との組み合わせが上記文脈収集
過程の履歴に保持されていない組み合わせであったと
き、上記エスケープコードの符号を出力すると同時に、
上記の入力データと文脈との組み合わせを履歴に登録す
るとともに、上記データを文脈に対応した上記符号木に
登録し、上記文脈収集過程に保持されている組み合わせ
が得られるまで上記データの文脈を短くする処理を繰り
返すことを特徴とする、データ圧縮方法。
【請求項４】入力データを過去に出現した履歴に応じ
て符号化して圧縮するデータ圧縮方法において、入力データとそれまでに連続したｎ個のデータからなる
文脈との組み合わせを保持する文脈収集過程と、上記文脈毎に独立した符号木を保持する符号木保持過程
と、上記文脈収集過程の文脈に該当したデータが出現したと
き、上記符号木の頂点を意味するルートから上記符号木
上の上記データが格納されている点としてのリーフまで
の分岐点としてのノードの分岐に応じた固有のデータと
して定義される符号を出力する符号出力過程と、上記符号出力過程での処理の後、上記データのリーフと
他データのリーフあるいはノードとを組み替える符号長
変更過程と、上記の入力データと文脈との組み合わせが上記文脈収集
過程に保持されているか否かを判別する文脈判別過程
と、予めデータ未登録を示すデータとして定義されるエスケ
ープコードを登録したリーフを上記符号木に保持するエ
スケープコード保持過程とを有するとともに、上記の入力データと文脈との組み合わせが上記文脈収集
過程の履歴に保持されていない組み合わせであったと
き、上記の入力データと文脈との組み合わせを上記文脈
収集過程に新規に登録する文脈新規登録過程と、上記の入力データと文脈との組み合わせが上記文脈収集
過程の履歴に保持されていない組み合わせであったと
き、上記データを文脈に対応した上記符号木に新規に登
録する符号木新規登録過程とを有し、上記の文脈新規登録過程及び符号木新規登録過程におい
ては、履歴にあると判断された直前の文脈と上記データ
との組み合わせのみを登録することを特徴とする、デー
タ圧縮方法。
【請求項５】入力データを過去の入力データの履歴に
応じて符号化した符号データを復元するデータ復元方法
において、復号データと文脈との組み合わせの履歴を保持する文脈
収集過程と、文脈に応じておのおの独立した符号木を保持する符号木
保持過程と、直前までに復号したデータの文脈から上記データの符号
木を決定する符号木決定過程と、上記符号木決定過程で決定した上記符号木と上記データ
の符号から上記データを復号する復号過程と、上記復号過程の復号の後に、符号化側と同一の手段で、
上記符号木上のデータ格納点としてのリーフ間又は上記
リーフと上記符号木の分岐点としてのノードとを組み替
える符号長変更過程とを有することを特徴とする、デー
タ復元方法。
【請求項６】入力データを過去の入力データの履歴に
応じて符号化した符号データを復元するデータ復元方法
において、復号データと文脈との組み合わせの履歴を保持する文脈
収集過程と、文脈に応じておのおの独立した符号木を保持する符号木
保持過程と、直前までに復号したデータの文脈から上記データの符号
木を決定する符号木決定過程と、上記符号木決定過程で決定した上記符号木と上記データ
の符号から上記データを復号する復号過程と、上記復号過程の復号の後に、符号化側と同一の手段で、
上記符号木上のデータ格納点としてのリーフ間又は上記
リーフと上記符号木の分岐点としてのノードとを組み替
える符号長変更過程とを有し、上記符号木にはそれぞれの文脈に応じた上記符号木毎に
予めデータ未登録を示すデータとして定義されるエスケ
ープコードを登録し、復号時に上記エスケープコードを
復号した場合、上記エスケープコード以外が復号される
まで、文脈の長さを短くする処理を繰り返すことを特徴
とする、データ復元方法。
【請求項７】入力データを過去の入力データの履歴に
応じて符号化した符号データを復元するデータ復元方法
において、復号データと文脈との組み合わせの履歴を保持する文脈
収集過程と、文脈に応じておのおの独立した符号木を保持する符号木
保持過程と、直前までに復号したデータの文脈から上記データの符号
木を決定する符号木決定過程と、上記符号木決定過程で決定した上記符号木と上記データ
の符号から上記データを復号する復号過程と、上記復号過程の復号の後に、符号化側と同一の手段で、
上記符号木上のデータ格納点としてのリーフ間又は上記
リーフと上記符号木の分岐点としてのノードとを組み替
える符号長変更過程とを有するとともに、上記文脈収集過程に上記データを新規に登録する文脈新
規登録過程と、復号したデータを文脈に応じた上記符号木に新規に登録
する符号木新規登録過程とを有し、データ未登録を示すデータとして定義されるエスケープ
コードを復号したとき、上記文脈新規登録過程及び上記
符号木新規登録過程を実行して、上記エスケープコード
以外が復号されるまで、文脈の長さを短くする処理を繰
り返すことを特徴とする、データ復元方法。
【請求項８】入力データを過去の入力データの履歴に
応じて符号化した符号データを復元するデータ復元方法
において、復号データと文脈との組み合わせの履歴を保持する文脈
収集過程と、文脈に応じておのおの独立した符号木を保持する符号木
保持過程と、直前までに復号したデータの文脈から上記データの符号
木を決定する符号木決定過程と、上記符号木決定過程で決定した上記符号木と上記データ
の符号から上記データを復号する復号過程と、上記復号過程の復号の後に、符号化側と同一の手段で、
上記符号木上のデータ格納点としてのリーフ間又は上記
リーフと上記符号木の分岐点としてのノードとを組み替
える符号長変更過程とを有するとともに、上記文脈収集過程に上記データを新規に登録する文脈新
規登録過程と、復号したデータを文脈に応じた上記符号木に新規に登録
する符号木新規登録過程とを有し、データ未登録を示すデータとして定義されるエスケープ
コード以外が復号されるまでの処理において、上記エス
ケープコードを一つでも復号した時、上記エスケープコ
ード以外を復号した直前の文脈においてのみ、上記文脈
新規登録過程および上記符号木新規登録過程での各新規
登録処理を行なうことを特徴とする、データ復元方法。
【請求項９】入力データを過去に出現した履歴に応じ
て符号化して圧縮するデータ圧縮装置において、上記入力データの直前までに入力されたｎ個の入力デー
タからなる文脈を保持する前置データ保持手段と、上記の入力データと文脈との組み合わせを保持する履歴
保持手段と、上記文脈毎に独立した符号木を保持する符号木保持手段
と、上記前置データ保持手段に保持されている直前までの入
力データから上記データの符号木を決定する符号木決定
手段と、上記符号木決定手段で選択した上記符号木の頂点を意味
するルートから上記データが格納されているリーフに沿
って途中に位置する分岐点としてのノードからの分岐に
従って固有のデータを出力する符号出力手段と、符号化したリーフと他のリーフあるいはノードとを組み
替える符号長変更手段と、上記データを上記前置データ保持手段に登録する前置デ
ータ更新手段とをそなえて構成されたことを特徴とす
る、データ圧縮装置。
【請求項１０】入力データを過去に出現した履歴に応
じて符号化して圧縮するデータ圧縮装置において、上記入力データの直前までに入力されたｎ個の入力デー
タからなる文脈を保持する前置データ保持手段と、上記の入力データと文脈との組み合わせを保持する履歴
保持手段と、データ未登録を示すデータとして定義されるエスケープ
コードをあらかじめ登録した文脈毎に独立した符号木を
保持する符号木保持手段と、上記の文脈と入力データから上記データの符号木を決定
する符号木決定手段と、上記符号木決定手段で決定した上記符号木に上記データ
が登録されているか否かを判別する文脈判別手段と、上記符号木に上記データが登録されていないときは上記
符号木の頂点を意味するルートから上記エスケープコー
ドのデータ格納点としてのリーフまでの途中に位置する
分岐点としてのノードからの分岐に従ってエスケープコ
ードを出力するエスケープコード出力手段と、上記符号木に上記データが登録されていないときは文脈
の長さｎを短くする文脈変更手段と、上記符号木に上記データが登録されているときは上記符
号木のルートから上記データのリーフまでの途中に位置
するノードからの分岐に従って上記データの符号を出力
する符号出力手段と、符号化したリーフと他のリーフあるいはノードとを組み
換える符号長変更手段と、上記データを上記前置データ保持手段に登録する前置デ
ータ更新手段と、上記エスケープコードを符号化したときは上記データの
符号化を行なうまで処理を繰り返す制御手段とをそなえ
て構成されたことを特徴とする、データ圧縮装置。
【請求項１１】入力データを過去に出現した履歴に応
じて符号化して圧縮するデータ圧縮装置において、上記入力データの直前までに入力されたｎ個の入力デー
タからなる文脈を保持する前置データ保持手段と、上記の入力データと文脈との組み合わせを保持する履歴
保持手段と、データ未登録を示すデータとして定義されるエスケープ
コードを予め登録した文脈毎に独立した符号木を保持す
る符号木保持手段と、上記の文脈と入力データから上記データの符号木を決定
する符号木決定手段と、上記符号木決定手段で決定した上記符号木に上記データ
が登録されているか否かを判別する文脈判別手段と、上記符号木に上記データが登録されていないときは上記
符号木の頂点を意味するルートから上記エスケープコー
ドのデータ格納点としてのリーフまでの中に位置する分
岐点としてのノードからの分岐に従って上記エスケープ
コードを出力するエスケープコード出力手段と、上記符号木に上記データが登録されていないときは上記
履歴保持手段に上記データと文脈の組み合わせを登録す
る履歴登録手段と、上記符号木に上記データが登録されていないときは上記
符号木に上記データを新規に登録する符号登録手段と、上記符号木に上記データが登録されていないときは文脈
の長さｎを短くする文脈変更手段と、上記符号木に上記データが登録されているときは上記符
号木のルートから上記データのリーフまでの途中に位置
するノードからの分岐に従って上記データの符号を出力
する符号出力手段と、符号化したリーフと他のリーフあるいはノードとを組み
換える符号長変更手段と、上記データを前置データ保持手段に登録する前置データ
更新手段と、上記エスケープコードを符号化したときは上記データの
符号化を行なうまで処理を繰り返す制御手段とをそなえ
て構成されたことを特徴とする、データ圧縮装置。
【請求項１２】入力データを過去に出現した履歴に応
じて符号化して圧縮するデータ圧縮装置において、上記入力データの直前までに入力されたｎ個の入力デー
タからなる文脈を保持する前置データ保持手段と、上記の入力データと文脈との組み合わせを保持する履歴
保持手段と、データ未登録を示すデータとして定義されるエスケープ
コードをあらかじめ登録した文脈毎に独立した符号木を
保持する符号木保持手段と、上記の文脈と入力データから上記データの符号木を決定
する符号木決定手段と、上記符号木決定手段で決定した上記符号木に上記データ
が登録されているか否かを判別する文脈判別手段と、上記符号木に上記データが登録されていないときは上記
符号木の頂点を意味するルートから上記エスケープコー
ドのデータ格納点としてのリーフまでの途中に位置する
分岐点としてのノードからの分岐に従って上記エスケー
プコードを出力するエスケープコード出力手段と、上記符号木に上記データが登録されていないときは文脈
の長さｎを短くする文脈変更手段と、上記符号木に上記データが登録されているときは上記符
号木のルートから上記データのリーフまでの途中に位置
するノードからの分岐にしたがって上記データの符号を
出力するエスケープ符号出力手段と、履歴保持手段に上記データと文脈の組み合わせを登録す
る履歴登録手段と、符号木に上記データを新規に登録する符号登録手段と、符号化したリーフと他のリーフあるいはノードとを組み
換える符号長変更手段と、上記データを前置データ保持手段に登録する前置データ
更新手段と、上記データの符号化時に一度でも上記エスケープコード
を符号化したときは、上記データの符号化の直前の文脈
と上記データとの組み合わせを上記履歴登録手段で上記
履歴保持手段に登録し、上記データの符号化の直前に符
号化したエスケープコードを持つ符号木に上記符号登録
手段で上記データを新規に登録する制御手段とをそなえ
て構成されたことを特徴とする、データ圧縮装置。
【請求項１３】過去に出現した履歴に応じて符号化し
た符号を復号するデータ復元装置において、過去に復号したｎ個のデータを保持する前置データ保持
手段と、復号したデータと文脈との組み合わせを保持する履歴保
持手段と、文脈毎に独立した符号木を保持する符号木保持手段と、上記前置データ保持手段に保持されている文脈から上記
データを復号するための符号木を決定する符号木決定手
段と、符号に従って上記符号木決定手段で選択した上記符号木
の頂点を意味するルートから分岐点としてのノードを走
査して到達したデータ格納点としてのリーフに格納され
ているデータを出力する復号手段と、復号したリーフと他のリーフあるいはノードとを組み替
える符号長変更手段と、復号したデータを上記前置データ保持手段に登録する前
置データ更新手段とをそなえて構成されたことを特徴と
する、データ復元装置。
【請求項１４】過去に出現した履歴に応じて符号化し
た符号を復号するデータ復元装置において、過去に復号したｎ個のデータを保持する前置データ保持
手段と、復号したデータと文脈との組み合わせを保持する履歴保
持手段と、データ未登録を示すデータとして定義されるエスケープ
コードをあらかじめ登録した符号木を保持する符号木保
持手段と、上記前置データ保持手段に保持されている文脈から上記
データを復号するための符号木を決定する符号木決定手
段と、符号に従って上記符号木決定手段で選択した上記符号木
の頂点を意味するルートから分岐点としてのノードを走
査して到達したデータ格納点としてのリーフに格納され
ているデータを出力する復号手段と、復号したリーフと他のリーフあるいはノードとを組み替
える符号長変更手段と、出力したデータが上記エスケープコードであったとき上
記データを棄却し文脈を短くする文脈変更手段と、復号したデータを前置データ保持手段に登録する前置デ
ータ更新手段と、上記エスケープコードを復号した時は上記文脈変更手段
で文脈を再設定し、上記エスケープコード以外が復号さ
れるまで処理を繰り返す制御手段とをそなえて構成され
たことを特徴とする、データ復元装置。
【請求項１５】過去に出現した履歴に応じて符号化し
た符号を復号するデータ復元装置において、過去に復号したｎ個のデータを保持する前置データ保持
手段と、復号したデータと文脈との組み合わせを保持する履歴保
持手段と、エスケープコードをあらかじめ登録した符号木を保持す
る符号木保持手段と、上記前置データ保持手段に保持されている文脈から上記
データを復号するための符号木を決定する符号木決定手
段と、符号に従って上記符号木決定手段で選択した上記符号木
の頂点を意味するルートから分岐点としてのノードを走
査して到達したデータ格納点としてのリーフに格納され
ているデータを出力する復号手段と、復号したリーフと他のリーフあるいはノードとを組み替
える符号長変更手段と、出力したデータが上記エスケープコードであったとき、
上記データを棄却し文脈を短くする文脈変更手段と、復号したデータを前置データ保持手段に登録する前置デ
ータ更新手段と、上記データの復号処理で上記エスケープコードを復号し
たときの全ての文脈と復号したデータとを上記履歴保持
手段に登録する上記履歴登録手段と、上記データの復号処理で上記エスケープコードを復号し
た時の文脈に対応した全ての符号木に上記データの符号
を登録する符号登録手段と、上記エスケープコードを復号した時は上記文脈変更手段
で文脈を再設定し、上記エスケープコード以外が復号さ
れるまで処理を繰り返す制御手段とをそなえて構成され
たことを特徴とする、データ復元装置。
【請求項１６】過去に出現した履歴に応じて符号化し
た符号を復号するデータ復元装置において、過去に復号したｎ個のデータを保持する前置データ保持
手段と、復号したデータと文脈との組み合わせを保持する履歴保
持手段と、データ未登録を示すデータとして定義されるエスケープ
コードをあらかじめ登録した符号木を保持する符号木保
持手段と、上記前置データ保持手段に保持されている文脈から上記
データを復号するための符号木を決定する符号木決定手
段と、符号に従って上記符号木決定手段で選択した上記符号木
の頂点を意味するルートから分岐点としてのノードを走
査して到達したデータ格納点としてのリーフに格納され
ているデータを出力する復号手段と、復号したリーフと他のリーフあるいはノードとを組み替
える符号長変更手段と、出力したデータが上記エスケープコードであったとき上
記データを棄却し文脈を短くする文脈変更手段と、復号したデータを上記前置データ保持手段に登録する前
置データ更新手段と、上記データの復号処理で上記エスケープコードを最後に
復号した時の文脈と復号したデータとを上記履歴保持手
段に登録する履歴登録手段と、上記データの復号処理で最後に上記エスケープコードを
復号した時の文脈に対応した符号木に上記データの符号
を登録する符号登録手段と、上記エスケープコードを復号した時は上記文脈変更手段
で文脈を再設定し、上記エスケープコード以外が復号さ
れるまで処理を繰り返す制御手段とをそなえて構成され
たことを特徴とする、データ復元装置。