JP3266787B2

JP3266787B2 - データ圧縮装置，データ復元装置，及びデータ圧縮・復元システム

Info

Publication number: JP3266787B2
Application number: JP5505896A
Authority: JP
Inventors: 佳之岡田; 宣子佐藤
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1995-03-14
Filing date: 1996-03-12
Publication date: 2002-03-18
Anticipated expiration: 2016-03-12
Also published as: JPH08316848A

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、コンピュータにおいて
データを格納又は送信する場合等においてデータを圧縮
するとともにデータ使用時において復元するためのデー
タ圧縮装置，データ復元装置，及びデータ圧縮・復元シ
ステムに関する。本発明は、特に、確率統計型符号化装
置によるデータ圧縮装置，データ復元装置，及びデータ
圧縮・復元システムに関する。

【０００２】

【従来の技術】近年、文字コード、画像データ等の様々
な種類のデータがコンピュータで扱われるようになり、
取り扱われるデータ量も増大している。そのような大量
のデータは、データ中の冗長な部分を省くことにより、
圧縮することが可能である。このようにデータの圧縮を
行うことにより、ディスク容量を見かけ上大きくした
り、遠隔地への伝送時間を短縮（送るデータ量が減るこ
とによる）することができる。

【０００３】上記した様々な種類のデータを１つの方式
で圧縮できる方法として、ユニバーサル符号化による圧
縮方式がある。以下に、このユニバーサル符号化による
データ圧縮方式の説明を行う。なお、上述のように、ユ
ニバーサル符号化はあらゆる種類のデータに適用できる
が、以下の説明では、文字コードの符号化に例をとって
説明を行う。また、情報理論に基づき、説明文中におい
て、データの1WORD単位を「文字」と呼ぶこととし、任
意の文字が繋がったものを「文字列」と呼ぶこととす
る。

【０００４】ユニバーサル符号化方式には大きく分けて
次の２種類がある。データ系列の類似性を利用した辞書
型符号化方式と、データ列の出現頻度を利用した確率統
計型符号化方式である。本発明は、後者、確率統計型符
号化方式に関するものである。

【０００５】確率統計型符号化方式の中の代表的な方式
の一つにハフマン符号化方式がある。このハフマン符号
化方式は、情報源の文字の出現頻度が判っており且つ一
文字単位に符号化する方式では、最も圧縮効果の高い方
式である。この方式は、「節点」と各節点を結ぶ「枝」
からなる木構造で表現する符号表（以下、符号木と称す
る）を、用いる。

【０００６】木の各部の名称を、図２７を参照して、説
明する。まず、一番上にある節点を「根」と呼ぶ。図２
７の例では、節点１が根となる。ある節点（仮に“Ｘ”
とする）に枝で接続されている下の節点（仮に“Ｙ”と
する）を、「節点Ｘの子」と呼び、逆に点Ｘを、「節点
Ｙの親」と呼ぶ。例えば、節点６の子は節点８と節点９
であり、節点６の親は節点３である。また、親の親、そ
のまた親などを「先祖」と呼び、子の子、そのまた子な
どを「子孫」と呼ぶ。例えば、節点５の先祖は節点１の
みであり、節点３の子孫は節点８と節点９である。さら
に、二つの節点の親が同一の節点である時、これらの節
点を「兄弟」と呼ぶ。子を持たない節点のことを「葉」
と呼ぶ。また、葉でない節点のことを「内部節点」と呼
ぶ。このような符号木においては、符号木の各葉に文字
を割り当てている。そして、各枝は、必ず一つの節点か
ら二つに分岐しているので、夫々に"０"又は"１"の符号
が与えられる。従って、各葉に割り当てられた文字に
は、根からその葉までの経路をなす各枝に付された符号
の列が、１対１で対応する。従って、ある文字を符号化
する場合には、根からこの文字に対応した葉までの経路
（枝）を辿ることにより、一義的に、特定の２進数で表
された符号に変換することができる。

【０００７】このような符号木を作成するためのハフマ
ン符号化の原理を、図２８を参照して、説明する。ハフ
マン符号化においては、最初に、出現した各文字（以
下、「シンボル」と称する）に対応する葉を作り、それ
ぞれの葉には、そのシンボルの生起確率または出現頻度
を書いておく。なお、この葉は、右から左に向けて出現
頻度（出起確率）が高くなるように並べられる。

【０００８】そして、生起確率の最も低い（最も出現頻
度の少ない）２つ葉を子とする親の節点を、新しく一つ
作る。この新しい節点（親）には、２つの葉（子）の生
起確率の和を書き込む。また、この新しい節点（親）と
２つの葉（子）との間を、２本の枝で結ぶ。この２本の
枝のうち、右側のものには“１”の値を付与し、左側の
ものには“０”の値を付与する。

【０００９】次に、残りの葉と新しい節点とを比較し、
それらのうちで最も生起確率の低い２つを選び、それら
２つの節点又は葉を子とする親の節点を新しく一つ作
る。また、この新しい節点（親）と２つの子との間を、
２本の枝で結ぶ。以上の作業を、根が生成されて全体が
１つの木になるまで続ける。最終的に得られた符号木に
おいて、根から葉までたどった経路がその葉に対応する
符号語になる。上述しようにして各枝には“０”又は
“１”の符号が付与されているので、各分岐点において
経路を左に分岐した時には"０"が、また、右に分岐した
時に"１"が割り当てられて、一連の符号語を表すことに
なる。図２８の符号木に作成することによって得られる
シンボルと符号語との関係を、図２９の表に示す。

【００１０】このようなハフマン符号化方式（確率統計
型符号化方式）は、更に、予め各シンボルの生起確率が
求まっている静的符号化方式(static)，最初に全文字列
を走査して各シンボルの生起確率を得る準適応型符号化
方式(semi-adaptive)，及び、シンボルが出現する毎に
頻度をとり生起確率を再計算する適応型符号化方式(ada
ptive)に、分類される。本発明は、データ形式に依存せ
ず、１パスで符号化が行なえる適応型符号化方式(adapt
ive)に関するものである。

【００１１】この適応型符号化方式(adaptive)におい
て、各シンボルの出現頻度が変化する度に木の構造及び
符号が更新されていく様子を、図３０に例示する。図３
０（ａ）は、初期段階において作成される符号木を示し
ている。図３０において、丸の節点は内部節点を示し、
正方形の接点は葉を示す。また、各節点を示す丸又は正
方形の内側に記された数字は、節点番号（順位）を示し
ている。また、各節点の右肩に付された数字は、各節点
に登録された生起頻度である。また、葉の下に示された
アルファベットは、登録されたシンボルを示している。
従って、図３０（ａ）の段階では、シンボル“ａ”〜
“ｇ”の生起頻度は、夫々、“７”，“６”，“５”，
“５”，“３”，“２”，“１”となっている。

【００１２】この状態からシンボル“ｇ”が表れると、
図３０（ｂ）に示すように、この符号木による符号化が
行われた後に、節点１５の生起頻度が“２”に増加され
る。これにより、親の節点１３，及び先祖の節点９，
２，０の頻度も、夫々、１つインクリメントされる。増
加された結果、節点１３の頻度“４”が隣の節点１２の
頻度“３”と比較して大きくなるので、節点１２と節点
１３の入れ替えが行われる。同様に、その親の節点９と
節点８を入れ替える（図３０（ｃ）参照）。また、その
親の節点２と節点１とは頻度が逆転していないので、そ
れらの入れ替えは行わない。従って、一つのシンボル
“ｇ”の生起によって、符号木の形態は、最終的に図３
０（ｄ）に示す状態にまで変化する。

【００１３】図３１乃至図３８は、シンボルが次々に生
起された場合における符号木の変化を示している。初期
状態において各シンボルの生起頻度が図３２に示す通り
であるとすると、符号木の状態は図３１に示すようにな
る。この符号木によれば、図３２に示すように、“ａ”
及び“ｂ”は２ビットに圧縮でき、“ｃ”，“ｄ”及び
“ｇ”は３ビットに圧縮でき、“ｅ”及び“ｆ”は４ビ
ットに圧縮できる。図３１及び図３２の状態から、シン
ボル“ａ”が８回生起してその生起頻度が“２５”にな
ると、符号木の状態は図３３に示すようになる。この符
号木によれば、図３４に示すように、“ａ”は１ビット
に圧縮でき、“ｂ”，“ｃ”，“ｄ”は３ビットに圧縮
でき、“ｇ”は４ビットに圧縮でき、“ｅ”及び“ｆ”
は５ビットに圧縮できる。この状態から、シンボル
“ｇ”が１６回生起してその生起頻度が“２０”になる
と、符号木の状態は図３５に示すようになり、各シンボ
ルの圧縮量は、図３６に示すようにになる。この状態か
ら、シンボル“ｃ”が５回生起してその生起頻度が“１
０”になると、符号木の状態は図３７に示すようにな
り、各シンボルの圧縮量は、図３８に示すようになる。

【００１４】このように、適応型符号化方式(adaptive)
によると、シンボルの生起頻度が増すにつれて、当該シ
ンボルに対応する符号語の長さが短くなる。即ち、圧縮
効果が上がる。なお、このように符号木の構成が次第に
変化すると、データの初めと終わりとでは、同じシンボ
ルに対応する符号語が別のものとなってしまう。しかし
ながら、データの復元側は圧縮側と同じ符号木を作成し
ているとともに、データの圧縮側は生起されたシンボル
に対する符号化を行った後に符号木の更新を行ってい
る。従って、データの復元側は、出力される符号語を見
ることで、自分の符号木を圧縮側と同期して更新するこ
とができる。そのため、符号語とシンボルとの対応の変
化に拘わらず、元のシンボルの復元をすることができ
る。

【００１５】また、上述の静的符号化方式（static）あ
るいは準適応型符号化方式（semi-adaptive）では、符
号木上には入力に現れる全てのシンボルが予め登録され
ており、シンボルの追加はできない。これに対して、適
応型符号化方式（adaptive）の場合には、シンボルの生
起毎に、シンボルの生起確率を再計算するので、シンボ
ルの追加登録をすることが可能である。このような適応
型符号化方式（adaptive）においてシンボルを追加登録
する場合の手順を、図３９に説明する。

【００１６】この場合、図３９（ａ）に示すように、初
期設定時においては、符号木上に"未登録"を意味するコ
ード（以下、エスケープコードまたはESCと称する）と
ファイルの最後を示すコード（以下、EOFと称する）の
みを、登録する。そして、出現したシンボルが符号木上
に登録されていない場合は、ESCに対応する符号語とシ
ンボルの生データ（圧縮前のデータ）とを出力する。し
かる後に、ESCの頻度を＋１増やすとともに、符号木内
の最も重みの低い節点（葉）を分岐する。分岐によって
できた新しい葉の一つには、元の接点のシンボル（最も
出現頻度の少ないシンボル）を登録し、他の葉には、新
規登録のシンボルを登録するのである（第３９図
（b））。

【００１７】上記の説明は、一文字毎の生起確率に基づ
いて動的に可変長符号化する場合について述べた。さら
に圧縮効果を高めるためには、入力文字と直前の文字と
の依存関係を（以下、「文脈」と称する）取り入れた、
条件付き出現確率を用いて可変長符号化することで実現
できる。即ち、文字列がある文脈通りに生成される確率
が高くなっている状態下では、文脈の最初のシンボルが
生成された場合に、次に生成されるであろうシンボルを
或る程度（文脈を構成する次のシンボルに）絞ることが
できる。従って、この最初のシンボルが生成された条件
下において適用される符号木を用意しておれば、次のシ
ンボルに対応する符号語の長さを短くすることができ
る。即ち、圧縮率を高めることができるのである。

【００１８】「文脈」を取り入れた条件付き出現確率を
用いる場合、文脈及び符号化対象文字は図２３に示すよ
うに木構造で表される（以下、文脈木と称する）。この
文脈木は、過去に入力された文脈（文字列の流れを）の
流れをまとめたものである。文脈木の各節点は、文脈木
における子の節点を葉とする符号木を備えている。この
符号木には、各文脈において次のシンボルが出現する頻
度を登録している。このようにして、あるシンボルが生
起された場合において次のシンボルが生起する確率を、
条件つき確率として求めることができるのである。

【００１９】この文脈収集方法には以下に示す２つの方
法がある。その第１の方法は、条件つき確率の条件の次
数を固定にする方法である。ここに、次数とは、条件つ
き確率を求める文脈の長さのことである。この場合、例
えば２次の文脈に固定したとすると、直前２文字に繋が
る文字の文脈のみを収集して、条件付確率Ｐ（Ｙ|Ｘ1，
Ｘ2)を得るのである。但し、Ｙは注目符号化文字であ
り、Ｘ1，Ｘ2はそれぞれ直前の第１文字，第２文字であ
る。また、その第２の方法は、条件文字列の長さを固定
せずに入力データに応じて次数を伸ばす方法である。こ
れをBlending文脈という。

【００２０】

【発明が解決しようとする課題】以上に説明したよう
に、ハフマン符号化方式は、符号木を用いる符号化方式
のうちで、最大の効率でデータ圧縮をすることができる
方式である。とりわけ、適応型ハフマン符号化は、各文
字の生起確率をあらかじめ保持する必要もなく、一つの
ファイル内で生起確率が変動するのに追従できる利点が
あった。この適応型は、各シンボル出現毎に、符号木を
更新する。この更新は、各シンボルの生起頻度のインク
リメント，各節点における生起頻度のインクリメント，
各節点における生起頻度の比較，及び、符号木の構造の
組替えによって実現している。

【００２１】しかしながら、実際にこのようにしてハフ
マン木を構築した場合、多くの頻度比較及び頻度インク
リメントが必要であった。また、各節点毎に頻度を保持
する必要があるため、多くのメモリを必要とした。

【００２２】本発明の課題は、符号木の各節点毎に頻度
を保持することを不要とすることでメモリの節約を可能
とするとともに、各節点毎に保持された頻度を比較しな
くても、生起頻度が高いシンボルの圧縮率が大きくなる
ように符号木を更新することができるデータ圧縮装置，
データ復元装置，及びデータ圧縮・復元システムを提供
することである。

【００２３】

【課題を解決するための手段】本発明によるデータ圧縮
装置，データ復元装置，及びデータ圧縮・復元システム
は、上記課題を解決するために、以下の手段を採用し
た。（第１の態様）＜基本構成＞本発明の第１の態様の原理を、図１に示
す。即ち、本発明によるデータ圧縮装置（１００）は、
過去に現われた単位データの出現状況に応じて、入力さ
れた単位データを動的に符号化するデータ圧縮装置（１
００）において、前記単位データ毎に順位を定めるとと
もにこの順位毎に符号を割り当てる圧縮用テーブル（１
０１）と、圧縮対象の単位データを入力するデータ入力
手段（１０２）と、前記圧縮用テーブル（１０１）を検
索して、前記データ入力手段（１０２）によって入力さ
れた前記単位データに対応する順位を求めてこの順位に
対応する符号を出力する符号化手段（１０３）と、前記
符号化手段（１０３）による前記単位データに対応する
符号の出力後に、前記圧縮用テーブル（１０１）内にお
ける前記単位データの順位を、その順位のみに基づいて
自己組織的に変更する圧縮用テーブル更新手段（１０
４）とを備えた事を特徴とする（請求項１に対応）。

【００２４】また、本発明によるデータ復元装置（１０
５）は、過去に現われた単位データの出現状況に応じ
て、動的に、入力された符号を複号化した単位データを
出力するデータ復元装置（１０５）において、前記単位
データ毎に順位を定めるとともにこの順位毎に符号を割
り当てる復元用テーブル（１０６）と、復元対象の符号
を入力する符号入力手段（１０７）と、前記復元用テー
ブル（１０６）を検索して、前記符号入力手段（１０
７）によって入力された前記符号に対応する順位を求め
てこの順位に対応する単位データを出力するデータ復元
手段（１０８）と、前記データ復元手段（１０８）によ
る前記単位符号に対応する符号の出力後に、前記復元用
テーブル（１０６）内における前記単位データの順位
を、その順位のみに基づいて自己組織的に変更する復元
用テーブル更新手段（１０９）とを備えたことを特徴と
する（請求項２に対応）。

【００２５】また、本発明によるデータ圧縮・復元シス
テムは、上述のデータ圧縮装置（１００）と上述のデー
タ復元装置（１０５）とからなるデータ圧縮・復元シス
テムであって、前記圧縮用デーブル（１０１）の内容と
前記復元用テーブル（１０６）の内容とが同一であると
ともに、前記圧縮用テーブル更新手段（１０４）及び前
記復元用テーブル更新手段（１０９）は、同一の手順に
従って前記各テーブル（１０１，１０６）の更新処理を
行うことを特徴とする（請求項５，８に対応）。

【００２６】ここで、「単位データ」とは、文字（シン
ボル）であっても良いし、画像データであっても良い
し、その他のデータであっても良い。＜木構造のテーブルを採用する場合の構成＞前記圧縮用
テーブル及び復元用テーブルは、単一の根から枝を繰り
返し分岐させた木構造を有していても良い。この場合、
枝の分岐点及び末端に形成された各節点に対して前記根
から前記末端に向かう順番に順位が付され、前記末端の
節点に前記単位データが登録され、各分岐された枝毎に
互いに識別可能な符号が与えられているように構成す
る。

【００２７】この場合、前記データ符号化手段は、前記
根と前記入力された単位データが登録されている節点と
を結ぶ経路上の前記符号を読み取ることによって、前記
符号を出力する（請求項３に対応）。また、前記データ
復元手段は、前記符号と同じ符号が与えられている前記
根からの経路を辿ることにより、その経路の末端の節点
に登録されている前記単位データを探し、探し出した前
記単位データを出力する（請求項４に対応）。＜シンボルの追加登録を可能とする構成＞前記圧縮用テ
ーブル及び復元用テーブルには初期状態において終了記
号と未出現記号のみを登録し、未登録の単位データが出
現する度にこの単位データをこれらテーブルに登録する
ようにしてもよい。

【００２８】この場合、データ圧縮装置内には、前記デ
ータ入力手段により入力された前記単位データが前記圧
縮用テーブル内に登録されているか否かを判断するデー
タ登録有無判断手段を備えるようにする。そして、前記
符号化手段は、前記データ登録有無判断手段によって前
記単位データが前記圧縮用テーブル内に登録されていな
いと判断された時には、前記未出現記号に対応する順位
を求めてこの順位に対応する符号を出力した後に、前記
単位データ自体を出力し、前記圧縮用テーブル更新手段
は、前記符号化手段が前記未出現記号に対応する符号と
前記単位データ自体とを出力した時には、前記圧縮用テ
ーブル内における前記未出現記号の順位をその順位のみ
に基づいて自己組織的に変更した後に、前記単位データ
を前記圧縮用テーブルに登録するようにする（請求項６
に対応）。

【００２９】また、データ復元装置において、前記デー
タ復元手段は、前記復元用テーブル内において前記符号
に対応する順位が前記未登録符号に対応している場合に
は、前記符号の直後に入力された前記単位データをその
まま出力し、前記復元用テーブル更新手段は、前記デー
タ復元手段が符号の直後に入力された前記単位データを
そのまま出力した時には、前記復元用テーブル内におけ
る前記未出現記号の順位をその順位のみに基づいて自己
組織的に変更した後に、前記単位データを前記復元用テ
ーブルに登録する（請求項７に対応）。＜圧縮用テーブル更新手段及び復元用テーブル更新手段
の構成＞前記圧縮用テーブル更新手段及び前記復元用テ
ーブル更新手段は、前記単位データが登録された節点を
処理対象節点とするとともに、この処理対象節点を１つ
上の順位の節点と入れ替える更新処理を行うように構成
しても良い（請求項９に対応）。

【００３０】また、前記圧縮用テーブル更新手段及び前
記復元用テーブル更新手段は、前記単位データが登録さ
れた節点を処理対象節点とするとともに、この処理対象
節点を複数個順位が上の位置に挿入するとともにこの挿
入した位置から元の位置までにあった他の節点の順位を
１つづつ繰り下げる更新処理を行うように構成しても良
い（請求項１０に対応）。

【００３１】また、前記圧縮用テーブル更新手段及び前
記復元用テーブル更新手段は、前記単位データが登録さ
れた節点を処理対象節点とするとともに、根に対して同
じだけ離れた同一レベル内においてこの処理対象節点が
最高順位にある場合にはこの処理対象節点を１つ上の順
位の節点と入れ替え、前記同一レベル内においてこの処
理対象節点が最高順位以外にある場合にはこの処理対象
節点を前記最高順位の位置に挿入するとともにこの挿入
した位置から元の位置までにあった他の節点の順位を一
つづつ繰り下げる更新処理を行うように構成しても良い
（請求項１１に対応）。

【００３２】また、前記圧縮用テーブル更新手段及び前
記復元用テーブル更新手段は、更新処理がなされた節点
よりも前記根側に接続されている節点を新たな処理対象
節点として、この処理対象節点に対して前記更新処理を
行うように構成しても良い（請求項１２に対応）。

【００３３】また、前記圧縮用テーブル更新手段及び前
記復元用テーブル更新手段は、前記処理対象節点，及び
この処理対象節点の１つ上の順位の節点が共に末端の節
点でない場合には、前記更新処理を行わないように構成
しても良い（請求項１３に対応）。

【００３４】また、前記圧縮用テーブル更新手段及び前
記復元用テーブル更新手段は、前記単位データが登録さ
れた節点を根の次の順位の位置に挿入する更新処理を行
うようにしても良い（請求項１４に対応）。

【００３５】また、前記圧縮用テーブル更新手段及び前
記復元用テーブル更新手段は、前記単位データが登録さ
れた節点を、根に対して同じだけ離れた同一レベル内に
おいて最高順位の位置に挿入するとともにこの挿入した
位置から元の位置までにあった他の節点の順位を一つづ
つ繰り下げる挿入処理と一つ上の順位の節点と入れ替え
る交換処理とを繰り返すことにより、前記単位データが
登録された節点を前記根の次の順位の位置まで移動させ
る更新処理を行うように構成しても良い（請求項１５に
対応）。

【００３６】また、単位シンボルの追加登録を行う場
合、前記圧縮用テーブル更新手段及び前記復元用テーブ
ル更新手段は、未出現記号の節点を分岐し、この分岐に
よって生成された２本の枝の末端の節点に前記実出現記
号及び前記単位データを登録するように構成しても良い
（請求項１６に対応）。

【００３７】また、単位シンボルの追加登録を行う場
合、前記圧縮用テーブル更新手段及び前記復元用テーブ
ル更新手段は、前記各テーブルを構成する節点のうち末
端でない最下位の節点の次の順位に位置する末端の節点
を分岐し、この分岐によって生成された枝の末端の節点
に前記単位データを登録するように構成しても良い（請
求項１７に対応）。（第２の態様）＜基本構成＞本発明の第２の態様の原理を、図２に示
す。即ち、本発明によるデータ圧縮装（１１０）は、過
去に現われたシンボルの直前の文脈での条件付出現状況
に応じて動的に符号化を行うデータ圧縮装置（１１０）
において、過去に表れた文脈を０次から一定次数までの
範囲で木構造に登録した文脈木，及びこの文脈木の各次
数のシンボル毎にそのシンボルに続くシンボル及び未出
現記号の順位を定めて符号を割り当てた符号木を格納し
た圧縮用テーブル（１１１）と、圧縮対象のシンボルを
入力する入力手段（１１２）と、前記シンボルがその末
端に存在する前記一定次の文脈を前記文脈木から探す文
脈検索手段（１１３）と、前記一定次から前記シンボル
が存在する次数までの文脈に対応している各符号木を参
照して未出現記号の順位を随時符号化する未出現記号順
位符号化手段（１１４）と、前記文脈検索手段（１１
３）によって探し出された前記文脈下において前記シン
ボルを登録している最高次数の符号木を参照して前記シ
ンボルの順位を符号化するシンボル順位符号化手段（１
１５）と、前記参照された符号木中での前記シンボルの
順位のみに基づいて、この符号木内における前記シンボ
ルの順位を自己組織的に更新する符号木順位更新手段
（１１６）と、前記参照された各符号木内での前記未出
現記号の順位のみに基づいて、これら各符号木内におけ
る前記未出現記号の順位を自己組織的に更新する未出現
記号順位更新手段（１１７）とを有する事を特徴とする
（請求項１８に対応）。

【００３８】また、本発明によるデータ復元装置（１２
０）は、過去に現われたシンボルの直前の文脈での条件
付出現状況に応じて、動的に、入力された符号を複合化
したシンボルを出力するデータ復元装置（１２０）にお
いて、過去に表れた文脈を０次から一定次数までの範囲
で木構造に登録した文脈木，及びこの文脈木の各次数の
シンボル毎にそのシンボルに続くシンボル及び未出現記
号の順位を定めて符号を割り当てた符号木を格納した復
元用テーブル（１２１）と、復元対象の符号を入力する
入力手段（１２２）と、前記シンボルがその末端に存在
すると予想される前記一定次の文脈を前記文脈木から探
す文脈検索手段（１２３）と、前記シンボルが存在する
と予想される前記一定次の文脈下に存在する符号木に基
づいて、前記符号から前記シンボルの順位を復号化する
シンボル順位復号化手段（１２４）と、このシンボル順
位復号化手段（１２４）によって復号された結果未出現
記号が得られた場合には、前記シンボル順位復号化手段
（１２４）に対して、前記符号木の次数よりも一つ小さ
い次数の符号木を参照して前記シンボル順位の復号化を
行わしめるシンボル順位再復号化手段（１２５）と、前
記参照された符号木中での前記シンボルの順位のみに基
づいて、この符号木内における前記シンボルの順位を自
己組織的に更新する符号木順位更新手段（１２６）と、
前記参照された各符号木中での前記未出現記号の順位の
みに基づいて、これら各符号木内における前記未出現記
号の順位を自己組織的に更新する未出現記号順位更新手
段（１２７）とを有する事を特徴とする（請求項１９に
対応）。

【００３９】また、本発明によるデータ圧縮・復元シス
テムは、上述のデータ圧縮装置（１１０）と上述のデー
タ復元装置（１２０）とからなるデータ圧縮・復元シス
テムであって、前記圧縮用テーブル（１１１）の内容と
前記復元用テーブル（１２１）の内容とが同一であると
ともに、前記データ圧縮装置（１１０）と前記データ復
元装置（１２０）における前記各符号木順位更新手段
（１１６，１２６），及び前記各未出現順位更新手段
（１１７，１２７）は、夫々同一の処理を行うことを特
徴とする（請求項２０に対応）。

【００４０】上述の圧縮用テーブルと復元用テーブル内
の前記符号木には、初期状態において終了記号を含む全
出現シンボルが登録されていても良い（請求項２１に対
応）。

【００４１】

【作用】

（第１の態様による作用）＜基本構成による作用＞データ圧縮装置（１００）内に
おいて、データ入力手段（１０２）が単位データを入力
すると、符号化手段（１０３）は、圧縮用テーブル（１
０１）を参照し、入力された単位データに対応する順位
を求めて、この順位に対応する符号を出力する。この符
号化が完了すると、圧縮用テーブル更新手段（１０４）
は、圧縮用テーブル（１０１）内における前記単位デー
タの順位を、その順位のみに基づいて自己組織的に変更
する（請求項１の作用）。

【００４２】一方、データ復元装置（１０５）におい
て、符号入力手段（１０７）が圧縮結果としての符号を
入力すると、データ復元手段（１０８）は、復元用テー
ブル（１０６）を参照し、入力された符号に対応する順
位を求めて、この順位に対応する単位データを出力す
る。この符号化が完了すると、復元用テーブル更新手段
（１０９）は、前記復元用テーブル（１０６）内におけ
る前記単位データの順位を、その順位のみに基づいて自
己組織的に変更する（請求項２の作用）。

【００４３】両テーブル更新手段（１０４，１０９）が
各テーブル（１０１，１０６）を更新する際には、順位
のみに基づき、生起頻度を一切考慮しない。従って、生
起頻度を各節点に保持する必要や、生起頻度の再計算・
比較を行う必要がない。従って、メモリや制御処理装置
（ＣＰＵ）の負荷を軽減することができる。なお、この
ように生起頻度の考慮をしなくても、順位が上がるにつ
れて短い符号長を対応させることができるので、生起頻
度の高い文字に短い符号を対応させて圧縮効率を高める
ことができる（請求項１，２の作用）。

【００４４】また、データ圧縮装置（１００）の圧縮用
テーブル（１０１）とデータ復元装置（１０５）の復元
用テーブル（１０６）の内容とが同一であるとともに、
圧縮用テーブル更新手段（１０４）及び復元用テーブル
更新手段（１０９）が同一の手順に従ってこれら各テー
ブル（１０１，１０６）の更新処理を行うように構成す
れば、圧縮と復元を同期させられるので、同一の単位デ
ータに対応する符号が変動しても、元の単位データを正
確に復元することができる（請求項５，８の作用）。＜木構造のテーブルを採用する場合の作用＞前記圧縮用
テーブル及び復元用テーブルを、単一の根から枝を繰り
返し分岐させた木構造とし、枝の分岐点及び末端に形成
された各節点に対して根から末端に向かう順番に順位を
付し、末端の節点に単位データを登録し、各分岐された
枝毎に互いに識別可能な符号を与えるように構成すれ
ば、木の形態をどの様に更新したとしても、特定の単位
データに対応する符号が一義的に定まる。また、特定の
符号に対応する単位データも一義的に定まる。従って、
正確且つ確実にデータの圧縮及び復元を行うことができ
る（請求項３，４，５の作用）＜シンボルの追加登録を可能とする場合の作用＞圧縮用
テーブル及び復元用テーブルには初期状態において終了
記号と未出現記号のみを登録し、未登録の単位データが
出現する度にこの単位データをこれらテーブルに登録す
るようにすれば、圧縮に先だって圧縮対象のファイル内
をサーチする必要がないので処理時間の短縮となるとと
もに、データ入力に対してリアルタイムでデータ圧縮を
行うことも可能になる（請求項６，７の作用）。＜圧縮用テーブル更新手段及び復元用テーブル更新手段
の構成を特定した場合の作用＞圧縮用テーブル更新手段
及び復元用テーブル更新手段が、各テーブル内におい
て、単位データが登録された節点を１つ上の順位の節点
と入れ替えるように更新処理を行えば、単位データが登
録された節点の順位を確実に上げていくことができる
（請求項９の作用）。

【００４５】圧縮用テーブル更新手段及び復元用テーブ
ル更新手段が、各テーブル内において、単位データが登
録された節点を複数個順位が上の位置に挿入するととも
にこの挿入した位置から元の位置までにあった他の節点
の順位を１つづつ繰り下げるように更新処理を行えば、
単位データの順位をより早く上げることができる（請求
項１０の作用）。

【００４６】圧縮用テーブル更新手段及び復元用テーブ
ル更新手段が、各テーブル内において、単位データが登
録された節点を処理対象接点とするとともに、根に対し
て同じだけ離れた同一レベル内においてこの処理対象節
点が最高順位にある場合にはこの処理対象節点を１つ上
の順位の節点と入れ替えるように更新処理を行い、前記
同一レベル内においてこの処理対象節点が最高順位以外
にある場合にはこの処理対象節点を前記最高順位の位置
に挿入するとともにこの挿入した位置から元の位置まで
にあった他の節点の順位を一つづつ繰り下げるように更
新処理を行えば、同じ単位データが少なくとも２回連続
して生起するだけで、この単位データに対応する符号の
長さを１ビット短くすることができる。よって、圧縮効
率をより高めることができる（請求項１１の作用）。

【００４７】圧縮用テーブル更新手段及び復元用テーブ
ル更新手段が、各テーブル内において、更新処理がなさ
れた節点よりも前記根側に接続されている節点を新たな
処理対象節点として、この処理対象節点に対して前記更
新処理を行えば、処理対象の単位データよりも上位に登
録されている単位データの順位を徐々に下げることがで
きるので、生起確率が下がったことに即した圧縮を行う
ことができる（請求項１２の作用）。この場合、処理対
象節点，及びこの処理対象節点の１つ上の順位の節点が
共に末端の節点でない場合には、更新処理を行わないよ
うに構成すれば、徒にテーブルの更新をしてしまう弊害
を防止できる（請求項１３の作用）。

【００４８】圧縮用テーブル更新手段及び復元用テーブ
ル更新手段が、各テーブル内において、単位データが登
録された節点を根の次の順位の位置に挿入するように更
新処理を行えば、生起頻度を測る期間を極く最近に限定
したのと同じ結果が得られる。即ち、最近に生起した単
位データは次に生起する確率が最も高くなるという前提
において、当該単位データに対応する符号の長さを最短
にすることができる（請求項１４の作用）。

【００４９】圧縮用テーブル更新手段及び復元用テーブ
ル更新手段が、各テーブル内において、単位データが登
録された節点を、根に対して同じだけ離れた同一レベル
内において最高順位の位置に挿入するとともにこの挿入
した位置から元の位置までにあった他の節点の順位を一
つづつ繰り下げる挿入処理と一つ上の順位の節点と入れ
替える交換処理とを繰り返すことにより、前記単位デー
タが登録された節点を前記根の次の順位の位置まで移動
させるように更新処理を行えば、他の節点の順位を一つ
づつ下げられるので、他の節点に対する影響を抑えるこ
とができる（請求項１５の作用）。

【００５０】単位シンボルの追加登録を行う場合、圧縮
用テーブル更新手段及び復元用テーブル更新手段が、未
出現記号の節点を分岐し、この分岐によって生成された
２本の枝の末端の節点に前記未出現記号及び前記単位デ
ータを登録するように構成すれば、単純な制御にてこの
単位データを登録することができる（請求項１６の作
用）。

【００５１】単位シンボルの追加登録を行う場合、圧縮
用テーブル更新手段及び復元用テーブル更新手段が、各
テーブルを構成する節点のうち末端でない最下位の節点
の次の順位に位置する末端の節点を分岐し、この分岐に
よって生成された枝の末端の節点に前記単位データを登
録するようにすれば、登録後の当該単位データに対応す
る符号が極端に長くなることを防止できる（請求項１７
の作用）。（第２の態様による作用）＜基本構成による作用＞データ圧縮装置（１１０）内に
おいて、データ入力手段（１１２）がシンボルを入力す
ると、文脈検索手段（１１３）は、圧縮用テーブル（１
１１）内の文脈木を参照して、入力されたシンボルがそ
の末端に存在する一定次数の文脈を前記文脈木から探
す。未出現記号順位符号化手段（１１４）は、この一定
次数から入力されたシンボルが存在する次数までの文脈
に対応している各符号木を参照して、未出現記号の順位
を随時符号化する。次に、シンボル順位符号化手段（１
１５）は、入力されたシンボルを登録している最高次数
の符号木を参照して前記シンボルの順位を符号化する。
この符号化が完了すると、符号木順位更新手段（１１
６）は、符号化された前記シンボルを登録していた符号
木内における前記シンボルの順位を、その順位のみに基
づいて自己組織的に更新する。また、未出現記号順位更
新手段（１１７）は、符号化された未出現記号を登録し
ていた符号木内における前記未出現記号の順位を、その
順位のみに基づいて自己組織的に更新する（請求項１８
の作用）。

【００５２】一方、データ復元装置（１２０）内におい
て、入力手段（１２２）が圧縮結果としての符号を入力
すると、文脈検索手段（１２３）は、入力したシンボル
がその末端に存在すると予想される一定次の文脈を前記
文脈木から探す。シンボル順位復号化手段（１２４）
は、前記シンボルが存在すると予想される前記一定次の
文脈化に存在する符号木に基づいて、前記符号から前記
シンボルの順位を復号化する。復号された結果未出現記
号が得られた場合には、シンボル順位再復号化手段（１
２５）は、このシンボル順位復号化手段（１２４）に対
して、前記符号木の次数よりも一つ小さい次数の符号木
を参照して前記シンボル順位の復号化を行わしめる。こ
の復元が完了すると、符号木順位更新手段（１２６）
は、符号化された前記シンボルを登録していた符号木内
における前記シンボルの順位を、その順位のみに基づい
て自己組織的に更新する。また、未出現記号順位更新手
段（１２７）は、符号化された未出現記号を登録してい
た符号木内における前記未出現記号の順位を、その順位
のみに基づいて自己組織的に更新する（請求項１９の作
用）。

【００５３】各更新手段（１１６，１１７，１２６，１
２７）が各テーブル（１１１，１２１）内の符号木を更
新する際には、順位のみに基づき、生起頻度を一切考慮
しない。従って、生起頻度を各節点に保持する必要や、
生起頻度の再計算・比較を行う必要がない。従って、メ
モリや制御処理装置（ＣＰＵ）の負荷を軽減することが
できる。なお、このように生起頻度の考慮をしなくて
も、順位が上がるにつれて短い符号長を対応させること
ができるので、生起頻度の高い文字に短い符号を対応さ
せて圧縮効率を高めることができる。しかも、文脈木に
登録された各次数の文脈下に、各シンボルが一旦発生し
た条件下において次のシンボルを符号化するための符号
木を分散して設けたので、各文脈木の大きさを小さくす
ることができる。その結果、符号化後の符号長を短くす
ることができるのである（請求項１８，１９の作用）。

【００５４】また、データ圧縮装置（１１０）内の圧縮
用テーブル（１１１）の内容とデータ復元装置（１２
０）内の復元用テーブル（１２１）の内容とが同一であ
るとともに、データ圧縮装置（１１０）とデータ復元装
置（１２０）における各符号木順位更新手段（１１６，
１２６），及び各未出現順位更新手段（１１７，１２
７），が夫々同一の処理を行うように構成すれば、圧縮
と復元を同期させられるので、同一のシンボルに対応す
る符号が変動しても、元のシンボルを正確に復元するこ
とができる（請求項２０の作用）。

【００５５】上述の圧縮用テーブルと復元用テーブル
に、初期状態において、前記符号木には終了記号を含む
全出現シンボルが登録されていているように構成すれ
ば、圧縮・復元処理を簡略化させることができる（請求
項２１の作用）。

【００５６】

【実施例】以下、図面に基づいて、本発明の実施例を説
明する。本発明の各実施例の具体的構成を説明する前
に、各実施例に共通する原理を、図３及び図４に説明す
る。図３は、適応型符号化方式によってデータを圧縮す
る際の処理手順を示すフローチャートであり、図４は、
同方式によって圧縮されたデータを復元する際の処理手
順を示すフローチャートである。

【００５７】図３の処理は、データを送信する際，デー
タを記憶装置に格納する際，等に実行される。図３にお
いて、最初のステップＳ０１では、初期化を行う。即
ち、シンボルを予め登録させる方式においては、ファイ
ルをサーチして、登場する全シンボルを葉に書き込んだ
符号木を生成する（図９（ａ）参照）。この際、各シン
ボル毎の確率は計算せず、任意の順番に葉を並べる。そ
して、根が得られるまで、それらの葉に基づいて、親及
び先祖の節点を作る。また、シンボルを予め登録しない
で生起毎に追加する方式においては、上述した未出現記
号（ＥＳＣコード）と終了記号（ＥＯＦコード）のみを
葉とする符号木を作成する（図１７（ａ）参照）。

【００５８】次のステップＳ０２では、ファイルを読み
込んで、シンボル（単位データ）を一つづつ入力する。
次のステップＳ０３では、シンボルが終了したか否かチ
ェックし、未終了であれば、処理をステップＳ０４に進
める。ステップＳ０４では、入力したシンボルが符号木
内におけるどの順位の節点と一致するかを検索する。こ
の順位とは、各節点に付した数字であり、各節点の位置
を示す。即ち、符号木の根を“０”として、子の代，孫
の代と世代（根に対して同じだけ離れたレベルのこと，
以下、単に「レベル」と称する）が下がるにつれて大き
くなるとともに、同レベル内においては右側に位置する
ほど大きくなる（図９（ａ）参照）。

【００５９】次のステップＳ０５では、検索した順位に
従って、入力したシンボルの符号化を行う。即ち、根か
ら検索した順位に位置する葉までの経路を辿り、その経
路上の枝に付されている“０”又は“１”の符号を順番
に拾って、一連の符号語として出力するのである。な
お、シンボルを予め登録しない方式において符号木内に
該当する葉がないときには、ＥＳＣに対応する符号語，
及び生データ（圧縮前のデータ）を出力する。

【００６０】次のステップＳ０６においては、符号木を
自己組織的に更新，登録する。この「自己組織的に更
新」とは、生起確率の算出や生起頻度の比較をすること
なく、一定ルーチンに従って自律的に符号木の組み替え
を行うことである。そして、次のシンボルの符号化のた
めに、更新した符号木を登録して、処理をステップＳ０
２に戻す。

【００６１】以上のループを繰り返した結果、ファイル
内の全てのシンボルが終了した場合には、ステップＳ０
３からステップＳ０７に進み、終了を符号化する。予め
シンボルを登録しない方式においては、ＥＯＦに対応す
る符号語を出力する。その後、処理を終了する。

【００６２】図４の処理は、圧縮データを通信を介して
受信した際，圧縮データを記憶装置から読み出す際，等
に実行される。図４において、最初のステップＳ１１で
は、図３のステップＳ０１と全く同じ処理を行い、図３
によって生成されるのと全く同じ符号木を生成する。次
のステップＳ１２では、図３のステップＳ０５によって
符号化された符号語を、その符号化された順番通りに入
力する。次のステップＳ１３では、入力された符号が終
了を示すか否か，即ち、図３のステップＳ０７にて符号
化された符号であるか否かをチェックする。

【００６３】符号が終了を示していない場合には、ステ
ップＳ１４において、符号から順位を検索する。即ち、
符号木の根を起点にして、符号語が示す“０”及び
“１”の順番通りに、枝を辿り、対応する順位の節点
（葉）を探す。

【００６４】次のステップＳ１５では、シンボルを復元
する。即ち、検索した順位の節点（葉）に対応するシン
ボルを出力する。なお、シンボルを予め登録しない方式
において、符号語に対応するシンボルがＥＳＣコードで
あった場合には、この符号語に続くデータが生データで
あるので、その生データをそのまま出力する。

【００６５】続くステップＳ１６においては、符号木を
自己組織的に更新，登録する。即ち、図３のステップＳ
０６と全く同じルーチンに従って、符号木を自律的に組
み替える。従って、図３による圧縮用の符号木の更新に
同期して、全く同じようにして復元用の符号木を更新す
ることができる。そして、次のシンボルの符号化のため
に、更新した符号木を登録して、処理をステップＳ１２
に戻す。

【００６６】以上のループを繰り返した結果、終了を示
す符号語を入力した場合には、ステップＳ１３から処理
を終了する。

【００６７】

【第１実施例】本発明の第１実施例は、予め全シンボル
を登録しておくとともに、生起したシンボルに対応する
葉とその親及び先祖の節点を、一つ順位が上の節点と交
換するルーチンによって符号木を更新することを特徴と
する。＜ハード構成＞図５は、第１実施例によるデータ圧縮・
復元システムを示すブロック図である。図５において、
データ入力部１，符号化部２，テーブル３，データ送信
部４，及びデータ書込部７がデータ圧縮装置を構成し、
データ受信部６，データ読取部９，復元部１０，テーブ
ル１１，及びデータ出力部１２がデータ復元装置を構成
する。

【００６８】データ入力手段としてのデータ入力部１
は、キーボード，マウス，等のマン・マシンインタフェ
ースからの入力をコード化する装置，兼、データファイ
ルを格納した外部記憶装置からデータを読み出す装置で
ある。

【００６９】このデータ入力部１からデータが渡される
符号化部２は、本実施例によるデータ圧縮（符号化）処
理を実行する符号化手段及び圧縮用テーブル更新手段と
しての装置である。この符号化部２は、データ圧縮をす
るに伴って、テーブル（圧縮用テーブル）３内に符号木
を生成するとともに、データ圧縮（符号化）過程におい
てテーブル３内の符号木を更新する。

【００７０】符号化部２によって圧縮（符号化）された
データは、データ送信部４及びデータ書込部７の何れか
一方に出力される。このデータ送信部４は、送信線５に
圧縮データを送出して、通信網等を介して遠隔地に送信
する装置である。また、データ書込部７は、圧縮データ
をデータ格納部８に書き込む装置である。このデータ格
納部８は、ハードディスク等のデータ記憶装置である。

【００７１】符号入力手段としてのデータ受信部６は、
送信線５から送信されてくる圧縮データを受信して、復
元部１０に転送する装置である。また、符号入力手段と
してのデータ読出部９は、データ格納部８から圧縮デー
タを読み出して、復元部１０に転送する装置である。

【００７２】復元部１０は、転送された圧縮データに対
して本実施例によるデータ復元処理を実行するデータ復
元手段及び復元用テーブル更新手段としての装置であ
る。この復元部１０は、データ復元をするに伴って、テ
ーブル（復元用テーブル）１１内に符号木を生成すると
ともに、データ復元過程においてテーブル１１内の符号
木を更新する。復元部１０によって復元されたデータ
は、データ出力部１２に転送される。

【００７３】このデータ出力部１２は、外部記憶装置や
ディスプレイ装置，印刷装置等に復元されたデータを出
力する装置である。＜制御内容＞〔符号化部における制御の内容〕図６は、符号化部２に
おいてデータ入力部１からデータの転送があった時に実
行されるデータ圧縮（符号化）のための処理の内容を示
す。図６の処理は、圧縮対象のファイル（データ）の受
信をトリガとして、スタートする。

【００７４】スタート後最初のステップＳ０００１で
は、符号木を初期化して、テーブル３に登録する。即
ち、入力されたファイルの内容をサーチして、登場する
全てのシンボルを抽出する。そして、これら抽出したシ
ンボル及び終了記号（ＥＯＦ）を葉として、図９（ａ）
に示すような符号木を新たに作成する。

【００７５】この符号木を作成するに際して、各シンボ
ル及び終了記号（ＥＯＦ）に対応する葉は、任意の順番
に並べられる。そして、片側から順番に選ばれた隣り合
う二つの葉同士が、一つの内部節点（親の節点）に対し
て、２本の枝によって接続される。これら２本の枝のう
ち、左側の枝には符号“０”が割り当てられ、右側の枝
には符号“１”が割り当てられる。このようにして、全
ての葉に内部節点（親の節点）が接続されると、片側か
ら順番に選ばれた隣り合う二つの内部節点同士が、一つ
の内部節点（更に親の節点）に対して、２本の枝によっ
て接続される。これら２本の枝には、上述したのと同様
に、“０”又は“１”の符号が割り当てられる。このよ
うな作業を、唯一の根が接続されるまで、継続する。唯
一の根が接続されて、全ての節点が一つの符号木にまと
められると、根の世代を“レベル０”と定義し、根の子
の世代を“レベル１”と定義し、根の孫の世代を“レベ
ル２”と定義し、根の曾孫の世代を“レベル３”と定義
する。また、各節点に順位を付す。即ち、根を“０”と
し、レベルが下がるほど順位が下がり、同レベル内では
左から右に向けて順位が下がるように、各節点に連続し
た順位を付す。以上のようにして符号木の初期設定が完
了すると、符号化部２は、この符号木をテーブル３に格
納する。また、符号化部２は、この符号木を、通信線５
を介してデータ受信部６に転送するか、データ格納部８
に格納する。

【００７６】次のステップＳ０００２では、入力された
データの中から順番にシンボル（文字）を一つ取り出す
（シンボル入力）。次のステップＳ０００３では、ステ
ップＳ０００２にてシンボルを取り出せたか否か，即
ち、ファイル中のシンボルが終了しているか否かを、チ
ェックする。そして、シンボルが終了していない時に
は、処理をステップＳ０００４に進める。

【００７７】ステップＳ０００４では、テーブル３内に
格納された符号木を参照して、ステップＳ０００２にて
取り出したシンボルに対応する葉の順位を検索する。そ
して、根から対応葉までの経路を辿り、その経路上の枝
に付されている“０”又は“１”の符号を順番に拾い、
一連の符号語を得る（符号化手段に対応）。

【００７８】次のステップＳ０００５では、このように
して得られた符号語を、データ送信部４又はデータ書込
部７に対して出力する。次のステップＳ０００６では、
ステップＳ０００４にて検索した今回処理対象のシンボ
ルに対応する葉の順位を基準に符号木の更新を行う（圧
縮用テーブル更新手段に対応）。図８は、このステップ
Ｓ０００６にて実行される符号木の更新処理サブルーチ
ンの内容を示すフローチャートである。

【００７９】図８に入って最初のステップＳ０２０１で
は、今回処理対象のシンボルに対応する葉の順位を変数
“Ｙ”に代入し、このＹが０であるかどうかをチェック
する。Ｙが０でないということは、当該順位が根以外の
節点に対応することなので、処理をステップＳ０２０２
に進める。

【００８０】このステップＳ０２０２では、順位Ｙの節
点情報ｉを読み出す。この節点情報ｉとは、この節点に
対応するシンボル，未出現記号（ＥＳＣ），又は終了記
号（ＥＯＦ）の内容であるが、この節点が内部節点であ
るか葉であるかの情報，及びこの節点を中心とした親子
関係についての情報も同時に読み出される。

【００８１】次のステップＳ０２０３では、順位Ｙ−１
の節点情報ｊを読み出す。次のステップＳ０２０４で
は、ステップＳ０２０２にて読み出した節点情報ｉとス
テップＳ０２０３にて読み出した節点情報ｊとを比較し
て、順位Ｙの節点及び順位Ｙ−１の節点の何れか一方が
葉であるか否かをチェックする。

【００８２】何れか一方の節点が葉であると判定した場
合には、ステップＳ０２０５において、節点情報ｉと節
点情報ｊとを交換する。但し、親との関係についての情
報は、元の節点に残しておく。即ち、子の情報のみを交
換して、節点情報とともに子の節点が移動するようにす
る。

【００８３】次のステップＳ０２０６では、順位Ｙ−１
の親の節点順位を新たなＹとし、以上の処理を繰り返す
ために、処理をステップＳ２０１に戻す。一方、ステッ
プＳ０２０４において両節点が内部節点であると判定し
た場合には、ステップＳ０２０５の処理をすることな
く、ステップＳ０２０７において順位Ｙの親の節点順位
を新たなＹとする。そして、以上の処理を繰り返すため
に、処理をステップＳ０２０１に戻す。

【００８４】以上の処理を繰り返した結果順位Ｙが０に
なった場合は、処理対象の節点が根になった場合である
ので、ステップＳ０２０１にてこのサブルーチンを終了
させて、メインルーチンにリターンする。

【００８５】図８から処理が戻された図６のメインルー
チンにおいては、次のシンボルに対する圧縮処理を行う
ために、処理をステップＳ０００２に戻す。ファイル中
の全シンボルに対して上記圧縮処理を実施した結果、ス
テップＳ０００３においてシンボルが終了していると判
定した場合には、処理をステップＳ０００７に進める。
このステップＳ０００７では、テーブル３内の符号木を
参照して、終了記号（ＥＯＦ）に対応する葉の順位を検
索する。そして、根から終了記号（ＥＯＦ）に対応する
葉の順位までの経路を辿り、その経路上の枝に付されて
いる“０”又は“１”の符号を順番に拾い、一連の符号
語を得る。

【００８６】次のステップＳ０００８では、ステップＳ
０００７にて得られた符号語をデータ送信部４又はデー
タ書込部７に対して出力し、この圧縮（符号化）処理を
終了する。〔復元部における制御の内容〕図７は、復元部１０にお
いて実行されるデータ復元のための処理の内容を示す。
図７の処理は、データ受信部６がデータを受信したこ
と，或いは、データ読み出し部９が外部指示に応じてデ
ータ格納部８からデータを読み出したことをトリガとし
てスタートする。

【００８７】スタート後最初のステップＳ０１０１で
は、符号木を初期化して、テーブル３に登録する。即
ち、復元部１０がデータ受信部６又はデータ読み出し部
９から最初に受け取るのは、図６のステップＳ０００１
にて初期化された符号木そのものを示すデータである。
そのため、受信したデータから初期状態の符号木を生成
して、この符号木をテーブル１１に格納する。

【００８８】次のステップＳ０１０２では、ファイル内
のシンボルに対応する符号語を、受信した順番（符号化
部２において圧縮された順番）に従って、一つ入力す
る。次のステップＳ０１０３では、テーブル１１内に格
納された符号木を参照して、入力した符号語が終了記号
（ＥＯＦ）に対応するか否かをチェックする。終了記号
に対応していない場合には、処理をステップＳ０１０４
に進める。

【００８９】このステップＳ０１０４では、テーブル１
１内に格納された符号木を参照して、ステップＳ０１０
２にて入力した符号語に対応する葉の順位を検索する。
即ち、符号木の根を起点にして、符号語が示す“０”及
び“１”の順番通りに、枝を辿り、対応する順位の節点
（葉）を探す。

【００９０】次のステップＳ０１０５では、ステップＳ
０１０４にて検索された葉に対応するシンボルを、デー
タ出力部１２に出力する（シンボルの復元）（データ復
元手段に対応）。

【００９１】次のステップＳ０１０６では、ステップＳ
０１０５にて検索した今回処理対象の符号に対応するシ
ンボルが書き込まれている葉の順位を基準に、テーブル
１１内に格納された符号木の更新を行う（復元用テーブ
ル更新手段に対応）。このステップＳ０１０６では、図
６のステップＳ０００６で実行されるのと全く同じ処
理，即ち、図８のサブルーチンを、実行する。従って、
テーブル１１内に格納された符号木は、テーブル３内に
格納された符号木と同期して、全く同様に更新されて行
く。ステップＳ０１０６が完了すると、次の符号語を復
元するために、処理をステップＳ０１０２に戻す。

【００９２】ファイルを構成する全符号語に対して上記
復元処理を実施して、ステップＳ０１０３において終了
シンボルに対応する符号語が入力されたと判定した場合
には、この復元処理を終了する。＜実施例の作用＞以上のように構成される本実施例の作
用を、図９に基づいて説明する。

【００９３】いま、テーブル３内の符号木が、図９
（ａ）に示されるように初期設定されているとする。そ
して、最初にシンボル“ｂ”が出現したとする。する
と、符号化部２は、図９（ａ）に示す形態の符号木を検
索することにより、“００１”の符号語に符号化するこ
とができる。符号化部２は、符号化の後に、符号化した
シンボル“ｂ”の葉を注目節点（処理対象節点）とし、
この注目節点の位置を一つ上の順位の節点と交換する。
図９（ａ）では“ｂ”に対応する葉の順位は“８”であ
るので、順位“７”の節点（“ａ”に対応する葉）と交
換する。なお、交換後において、“ｂ”に対応する節点
の親及び先祖（順位“３”，“１”，“０”の節点）
は、何れも一つ順位が上の節点が葉でないので、それら
の順位の交換はしない。その結果、更新後の符号木の形
態は、図９（ｂ）に示す通りとなる。

【００９４】一方、初期状態においては、テーブル１１
にも図９（ａ）に示される形態の符号木が格納されてい
る。従って、復元部１０は、“００１”の符号語を受信
すると、同図（ａ）に示す形態の符号木を検索すること
により、シンボル“ｂ”を得ることができる。復元部１
０は、この復元の後に、復元したシンボル“ｂ”の葉を
注目節点とし、この注目節点の位置を一つ上の順位の節
点と交換する。即ち、テーブル３内の符号木と同様に、
“ｂ”に対応する葉の位置を“ａ”に対応する葉と交換
する。その結果、更新後の符号木の形態は、図９（ｂ）
に示す通りとなる。

【００９５】次に、符号化部２において、再度シンボル
“ｂ”が出現したとする。すると、符号化部２は、図９
（ｂ）に示す形態の符号木を検索することにより、“０
００”の符号語に符号化することができる。符号化部２
は、符号化の後に、符号化したシンボル“ｂ”の葉を注
目節点とし、この注目節点の位置を一つ上の順位の節点
と交換する。図９（ｂ）では“ｂ”に対応する葉の順位
は“７”であるので、順位“６”の節点と交換する（図
９（ｃ）参照）。なお、順位“６”の節点を移動する際
には、これに接続されている子の節点（順位“１３”及
び“１４”の節点）も一緒に移動する。また、交換後に
おいて、“ｂ”に対応する節点の親及び先祖（順位
“２”，“０”の節点）は、何れも一つ順位が上の節点
が葉でないので、それらの順位の交換はしない。その結
果、更新後の符号木の形態は、図９（ｄ）に示す通りと
なる。

【００９６】一方、復元部１０は、“０００”の符号語
を受信すると、図９（ｂ）に示す形態の符号木を検索す
ることにより、シンボル“ｂ”を得ることができる。復
元部１０は、この復元の後に、復元したシンボル“ｂ”
の葉を注目節点とし、この注目節点の位置を一つ上の順
位の節点と交換する（図９（ｃ）参照）。即ち、テーブ
ル３内の符号木と同様に、“ｂ”に対応する葉の位置を
順位“６”の節点と交換する。その結果、更新後の符号
木の形態は、図９（ｄ）に示す通りとなる。

【００９７】次に、符号化部２において、再度シンボル
“ｂ”が出現したとする。すると、符号化部２は、図９
（ｄ）に示す形態の符号木を検索することにより、“１
１”の符号語に符号化することができる。符号化部２
は、符号化の後に、符号化したシンボル“ｂ”の葉を注
目節点とし、この注目節点の位置を一つ上の順位の節点
と交換する。図９（ｄ）では“ｂ”に対応する葉の順位
は“６”であるので、順位“５”の節点と交換する。な
お、順位“５”の節点を移動する際には、これに接続さ
れている子の節点（順位“１１”及び“１２”の節点）
も一緒に移動する。また、交換後において、“ｂ”に対
応する節点の親及び先祖（順位“２”，“０”の節点）
は、何れも一つ順位が上の節点が葉でないので、それら
の順位の交換はしない。その結果、更新後の符号木の形
態は、図９（ｅ）に示す通りとなる。

【００９８】一方、復元部１０は、“１１”の符号語を
受信すると、図９（ｄ）に示す形態の符号木を検索する
ことにより、シンボル“ｂ”を得ることができる。復元
部１０は、この復元の後に、復元したシンボル“ｂ”の
葉を注目節点とし、この注目節点の位置を一つ上の順位
の節点と交換する。即ち、テーブル３内の符号木と同様
に、“ｂ”に対応する葉の位置を順位“５”の節点と交
換する。その結果、更新後の符号木の形態は、図９
（ｅ）に示す通りとなる。

【００９９】次に、シンボル“ｇ”が出現したとする。
すると、符号化部２は、図９（ｅ）に示す形態の符号木
を検索することにより、“００００”の符号語に符号化
することができる。符号化部２は、符号化の後に、符号
化したシンボル“ｇ”の葉を注目節点とし、この注目節
点の位置を一つ上の順位の節点と交換する。図９（ｅ）
では“ｇ”に対応する葉の順位は“１３”であるので、
順位“１２”の節点と交換する（図９（ｆ）参照）。交
換後において、“ｇ”に対応する節点の親（順位“６”
の節点）を注目節点として、その一つ上の順位の節点
（順位“５”の節点）が葉であるか否かを調べる。この
順位“５”の節点は葉（“ｂ”に対応する葉）であるの
で、順位“６”の節点と交換する。なお、順位“６”の
節点を移動する際には、これに接続されている子の節点
（順位“１１”及び“１２”の節点）も一緒に移動す
る。また、交換後、順位“５”の節点の親及び先祖（順
位“２”，“０”の節点）は、何れも一つ順位が上の節
点が葉でないので、それらの順位の交換はしない。その
結果、更新後の符号木の形態は、図９（ｇ）に示す通り
となる。

【０１００】一方、復元部１０は、“００００”の符号
語を受信すると、図９（ｅ）に示す形態の符号木を検索
することにより、シンボル“ｇ”を得ることができる。
復元部１０は、この復元の後に、復元したシンボル
“ｇ”の葉を注目節点とし、この注目節点の位置を一つ
上の順位の節点と交換する。即ち、テーブル３内の符号
木と同様に、“ｇ”に対応する葉の位置を順位“１２”
の節点（シンボル“ｆ”に対応する節点）と交換する。
また、その親の節点（順位“６”の節点）を注目節点と
し、その注目節点の位置を一つ上の順位の節点と交換す
る。即ち、テーブル３内の符号木と同様に、順位“５”
の節点と交換する。その結果、更新後の符号木の形態
は、図９（ｇ）に示す通りとなる。

【０１０１】以上のような順で各シンボルの出現があっ
た場合における節点順位の変動を、表１に示す。

【０１０２】

【表１】

【０１０３】表１において“ｂ”，“ｇ”に注目すれば
明らかなように、連続して生起するにつれて順位が上が
り、それとともに、対応する符号語の長さも短くなる。
また、生起が途切れると、徐々に順位が下がる。このよ
うな符号木の更新をするに当たって、各節点にはシンボ
ル生起頻度の情報が与えられていないので、消費メモリ
量の節約ができるとともに、生起頻度の比較や再計算が
必要ないので、符号化部２や復元部１０の機能を実現す
る処理装置（ＣＰＵ）の負荷を小さくすることができ
る。

【０１０４】

【第２実施例】本発明の第２実施例は、第１実施例と比
して、図６のステップＳ０００６及び図７のステップＳ
０１０６において実行される符号木の更新処理の内容の
みを異にし、他の構成を同じとしている。従って、その
他の説明を省略する。＜制御内容＞本第２実施例においては、符号化部４が図
６の処理を実行し、復元部１０が図７の処理を実行す
る。

【０１０５】図１０は、図６のステップＳ０００６，及
び図７のステップＳ０１０６にて実行される符号木の更
新処理サブルーチンの内容を示すフローチャートであ
る。図１０に入って最初のステップＳ０３０１では、今
回処理対象のシンボルに対応する葉の順位を変数“Ｙ”
に代入し、このＹが０であるかどうかをチェックする。
Ｙが０でないということは、当該順位が根以外の節点に
対応することなので、処理をステップＳ０３０２に進め
る。このステップＳ０３０２では、順位Ｙの節点情報
ｉを読み出す。この節点情報ｉとは、この節点に対応す
るシンボル，未出現記号（ＥＳＣ），又は終了記号（Ｅ
ＯＦ）の内容であるが、この節点が内部節点であるか葉
であるかの情報，この節点を中心とした親子関係につい
ての情報，及びこの節点のレベルについての情報も、同
時に読み出される。

【０１０６】次のステップＳ０３０３では、順位Ｙが同
レベルの最上位であるかどうかをチェックする。そし
て、最上位でない場合にはステップＳ０３０４に処理を
進め、最上位である場合にはステップＳ０３０９に処理
を進める。

【０１０７】ステップＳ０３０４では、順位Ｙと同レベ
ルにおける最高順位（“Ｚ”とする）の節点情報ｊを読
み出す。次のステップＳ０３０５では、ステップＳ０３
０２にて読み出した節点情報ｉとステップＳ０３０４に
て読み出した節点情報ｊとを比較して、順位Ｙの節点及
び順位Ｚの節点の何れか一方が葉であるか否かをチェッ
クする。

【０１０８】何れか一方の節点が葉であると判定した場
合には、ステップＳ０３０６において、節点情報ｉを順
位Ｚの位置に置き、順位Ｚから順位Ｙ−１までの節点情
報を、夫々一つ下の順位にシフトさせる。この際、各節
点の節点情報のうち、親との関係についての情報は、元
の節点に残しておく。次のステップＳ０３０７では、順
位Ｚの親の節点順位を新たなＹとし、以上の処理を繰り
返すために、処理をステップＳ０３０１に戻す。

【０１０９】これに対して、ステップＳ０３０５におい
て両節点が内部節点であると判定した場合には、ステッ
プＳ０３０６の処理をすることなく、ステップＳ０３０
８において順位Ｙの親の節点順位を新たなＹとする。そ
して、以上の処理を繰り返すために、処理をステップＳ
０３０１に戻す。

【０１１０】一方、ステップＳ０３０９においては、順
位Ｙ−１の節点情報ｊを読み出す。次のステップＳ０３
１０では、ステップＳ０３０２にて読み出した節点情報
ｉとステップＳ０３０９にて読み出した節点情報ｊとを
比較して、順位Ｙの節点及び順位Ｙ−１の節点の何れか
一方が葉であるか否かをチェックする。

【０１１１】何れか一方の節点が葉であると判定した場
合には、ステップＳ０３１１において、節点情報ｉと節
点情報ｊとを交換する。但し、親との関係についての情
報は、元の節点に残しておく。次のステップＳ０３１２
では、順位Ｙ−１の親の節点順位を新たなＹとし、以上
の処理を繰り返すために、処理をステップＳ０３０１に
戻す。

【０１１２】一方、ステップＳ０３１０において両節点
が内部節点であると判定した場合には、ステップＳ０３
１１の処理をすることなく、ステップＳ０３１３におい
て順位Ｙの親の節点順位を新たなＹとする。そして、以
上の処理を繰り返すために、処理をステップＳ０３０１
に戻す。

【０１１３】以上の処理を繰り返した結果順位Ｙが０に
なった場合は、処理対象の節点が根になった場合である
ので、ステップＳ０３０１にてこのサブルーチンを終了
させて、メインルーチンにリターンする。＜実施例の作用＞以上のように構成される本実施例の作
用を、図１１に基づいて説明する。

【０１１４】いま、テーブル３内の符号木が、図１１
（ａ）に示されるように初期設定されているとする。そ
して、最初にシンボル“ｅ”が出現したとする。する
と、符号化部２は、図１１（ａ）に示す形態の符号木を
検索することにより、“１００”の符号語に符号化する
ことができる。符号化部２は、符号化の後に、符号化し
たシンボル“ｅ”の葉を注目節点（処理対象節点）とす
る。そして、この注目節点の位置を同じレベル内の最高
順位の位置に移動するとともに、元の最高順位の位置に
いた節点から注目節点の直前の節点までを、一つ順位を
下げるようにシフトさせる。図１１（ａ）の例では、
“ｅ”に対応する葉の順位をレベル３の最高順位（順位
“７”）に移動させ、“ａ”に対応する葉から“ｄ”に
対応する葉までを一つづつ右にシフトさせる。なお、交
換後、“ｅ”に対応する節点の親及び先祖（順位
“３”，“１”，“０”の節点）は、何れもそのレベル
内の最高順位であるので、それらの順位の交換はしな
い。その結果、更新後の符号木の形態は、図１１（ｂ）
に示す通りとなる。

【０１１５】一方、初期状態においては、テーブル１１
にも図１１（ａ）に示される形態の符号木が格納されて
いる。従って、復元部１０は、“１００”の符号語を受
信すると、図１１（ａ）に示す形態の符号木を検索する
ことにより、シンボル“ｅ”を得ることができる。復元
部１０は、この復元の後に、復元したシンボル“ｅ”の
葉を注目節点とし、この注目節点の位置を同じレベル内
の最高順位の位置に移動するとともに、元の最高順位の
位置にいた節点から注目節点の直前の節点までを、一つ
順位を下げるようにシフトさせる。即ち、テーブル３内
の符号木と同様に、“ｅ”に対応する葉の位置を同レベ
ル内の最高順位の位置に移動する。その結果、更新後の
符号木の形態は、図１１（ｂ）に示す通りとなる。

【０１１６】次に、符号化部２において、再度シンボル
“ｅ”が出現したとする。すると、符号化部２は、図１
１（ｂ）に示す形態の符号木を検索することにより、
“０００”の符号語に符号化することができる。符号化
部２は、符号化の後に、符号化したシンボル“ｅ”の葉
を注目節点とする。但し、この注目節点の位置が同レベ
ルの最高順位にあるために、この注目節点の位置を一つ
上の順位の節点と交換する。図１１（ｂ）の例では、
“ｅ”に対応する葉の順位は“７”であるので、順位
“６”の節点と交換する（図１１（ｃ）参照）。なお、
順位“６”の節点を移動する際には、これに接続されて
いる子の節点（順位“１３”及び“１４”の節点）も一
緒に移動する。また、交換後、“ｅ”に対応する節点の
親及び先祖（順位“２”，“０”の節点）は、何れも同
レベルの最高順位の節点が葉でないので、順位の交換は
しない。その結果、更新後の符号木の形態は、図１１
（ｄ）に示す通りとなる。

【０１１７】一方、復元部１０は、“０００”の符号語
を受信すると、図１１（ｂ）に示す形態の符号木を検索
することにより、シンボル“ｅ”を得ることができる。
復元部１０は、この復元の後に、復元したシンボル
“ｅ”の葉を注目節点とし、この注目節点の位置を一つ
上の順位の節点と交換する（図１１（ｃ）参照）。即
ち、テーブル３内の符号木と同様に、“ｅ”に対応する
葉の位置を順位“６”の節点と交換する。その結果、更
新後の符号木の形態は、図１１（ｄ）に示す通りとな
る。

【０１１８】次に、符号化部２において、再度シンボル
“ｅ”が出現したとする。すると、符号化部２は、図１
１（ｄ）に示す形態の符号木を検索することにより、
“１１”の符号語に符号化することができる。符号化部
２は、符号化の後に、符号化したシンボル“ｅ”の葉を
注目節点とする。そして、この注目節点の位置を同じレ
ベル内の最高順位の位置に移動するとともに、元の最高
順位の位置にいた節点から注目節点の直前の節点まで
を、一つ順位を下げるようにシフトさせる。図１１
（ｄ）の例では、“ｅ”に対応する葉の順位をレベル２
の最高順位（順位“３”）に移動させ、元の順位“３”
の節点から順位“５”の節点までを一つづつ右にシフト
させる。なお、元の順位“３”の節点〜順位“５”の節
点を移動する際には、これらに接続されている子の節点
も一緒に移動する。また、交換後、“ｅ”に対応する節
点の親及び先祖（順位“１”，“０”の節点）は、何れ
も同レベルの最高順位にあるので、順位の交換はしな
い。その結果、更新後の符号木の形態は、図１１（ｅ）
に示す通りとなる。

【０１１９】一方、復元部１０は、“１１”の符号語を
受信すると、図１１（ｄ）に示す形態の符号木を検索す
ることにより、シンボル“ｅ”を得ることができる。復
元部１０は、この復元の後に、復元したシンボル“ｅ”
の葉を注目節点とし、この注目節点の位置を同じレベル
内の最高順位の位置に移動するとともに、元の最高順位
の位置にいた節点から注目節点の直前の節点までを、一
つ順位を下げるようにシフトさせる。即ち、テーブル３
内の符号木と同様に、“ｅ”に対応する葉の位置を同レ
ベル内の最高順位の位置に移動する。その結果、更新後
の符号木の形態は、図１１（ｅ）に示す通りとなる。

【０１２０】次に、シンボル“ｇ”が出現したとする。
すると、符号化部２は、図１１（ｅ）に示す形態の符号
木を検索することにより、“０１００”の符号語に符号
化することができる。符号化部２は、符号化の後に、符
号化したシンボル“ｇ”の葉を注目節点とする。但し、
この注目節点の位置が同レベルの最高順位にあるため
に、この注目節点の位置を一つ上の順位の節点と交換す
る。図１１（ｆ）の例では、“ｇ”に対応する葉の順位
は“１３”であるので、順位“１２”の節点と交換する
（図１１（ｆ）参照）。交換後、“ｇ”に対応する節点
の親（順位“６”の節点）を注目節点とする。この注目
節点と同レベルにおける最高順位の節点は葉（“ｅ”に
対応する葉）であるので、この注目節点の位置を同じレ
ベル内の最高順位の位置に移動するとともに、元の最高
順位の位置にいた節点から注目節点の直前の節点まで
を、一つ順位を下げるようにシフトさせる。図１１
（ｆ）の例では、順位“６”の節点の順位をレベル２の
最高順位（順位“３”）に移動させ、元の順位“３”の
節点から順位“５”の節点までを一つづつ右にシフトさ
せる。なお、元の順位“３”の節点〜順位“５”の節点
を移動する際には、これらに接続されている子の節点も
一緒に移動する。また、交換後、順位“３”の節点の親
及び先祖（順位“１”，“０”の節点）は、何れも同レ
ベルの最高順位にあるので、順位の交換はしない。その
結果、更新後の符号木の形態は、図１１（ｇ）に示す通
りとなる。

【０１２１】一方、復元部１０は、“０１００”の符号
語を受信すると、図１１（ｅ）に示す形態の符号木を検
索することにより、シンボル“ｇ”を得ることができ
る。復元部１０は、この復元の後に、復元したシンボル
“ｇ”の葉を注目節点とし、この注目節点の位置を一つ
上の順位の節点と交換する。即ち、テーブル３内の符号
木と同様に、“ｇ”に対応する葉の位置を順位“１２”
の節点と交換する（図１１（ｆ）参照）。また、その親
の節点（順位“６”の節点）を注目節点とし、この注目
節点の位置を同じレベル内の最高順位の位置に移動する
とともに、元の最高順位の位置にいた節点から注目節点
の直前の節点までを、一つ順位を下げるようにシフトさ
せる。即ち、テーブル３内の符号木と同様に、順位
“６”の節点の位置を同レベル内の最高順位の位置に移
動する。その結果、更新後の符号木の形態は、図１１
（ｇ）に示す通りとなる。

【０１２２】以上のような順で各シンボルの出現があっ
た場合における節点順位の変動を、表２に示す。

【０１２３】

【表２】

【０１２４】表２において“ｅ”，“ｇ”に注目すれば
明らかなように、連続して生起したときの順位が上がり
方は、第１実施例よりも早い。即ち、同シンボルの生起
が２回連続すると、必ず、対応する葉のレベルが一つ上
がり、符号語の長さが１ビット短くなる。従って、第１
実施例による効果を更に向上させ、圧縮効率を良くする
ことができる。

【０１２５】

【第３実施例】本発明の第３実施例は、第１実施例と比
して、図６のステップＳ０００６及び図７のステップＳ
０１０６において実行される符号木の更新処理の内容の
みを異にし、他の構成を同じとしている。従って、その
他の説明を省略する。＜制御内容＞本第３実施例においては、符号化部４が図
６の処理を実行し、復元部１０が図７の処理を実行す
る。

【０１２６】図１２は、図６のステップＳ０００６，及
び図７のステップＳ０１０６にて実行される符号木の更
新処理サブルーチンの内容を示すフローチャートであ
る。図１２に入って最初のステップＳ０４０１では、今
回処理対象のシンボルに対応する葉の順位を変数“Ｙ”
に代入し、このＹが１であるかどうかをチェックする。
Ｙが１でない場合には、処理をステップＳ０４０２に進
める。

【０１２７】このステップＳ０４０２では、順位Ｙの節
点情報ｉを読み出す。この節点情報ｉとは、この節点に
対応するシンボル，未出現記号（ＥＳＣ），又は終了記
号（ＥＯＦ）の内容であるが、この節点が内部節点であ
るか葉であるかの情報，この節点を中心とした親子関係
についての情報，及びこの節点のレベルについての情報
も、同時に読み出される。

【０１２８】次のステップＳ０４０３では、順位Ｙが同
レベルの最上位であるかどうかをチェックする。そし
て、最上位でない場合にはステップＳ０４０４に処理を
進め、最上位である場合にはステップＳ０４０７に処理
を進める。

【０１２９】ステップＳ０４０４では、順位Ｙと同レベ
ルにおける最高順位（“Ｚ”とする）の節点情報ｊを読
み出す。次のステップＳ０４０５では、節点情報ｉを順
位Ｚの位置に置き、順位Ｚから順位Ｙ−１までの節点情
報を、夫々一つ下の順位にシフトさせる（挿入処理）。
この際、各節点の節点情報のうち、親との関係について
の情報は、元の節点に残しておく。次のステップＳ０４
０６では、順位Ｚの節点順位を新たなＹとし、以上の処
理を繰り返すために、処理をステップＳ０４０１に戻
す。

【０１３０】一方、ステップＳ０４０７においては、順
位Ｙ−１の節点情報ｊを読み出す。次のステップＳ０４
０８では、節点情報ｉと節点情報ｊとを交換する（交換
処理）。但し、親との関係についての情報は、元の節点
に残しておく。次のステップＳ０４０９では、順位Ｙ−
１の親の節点順位を新たなＹとし、以上の処理を繰り返
すために、処理をステップＳ０４０１に戻す。

【０１３１】以上の処理を繰り返した結果順位Ｙが１に
なった場合は、処理対象の節点が根の次の節点になった
場合であるので、ステップＳ０４０１にてこのサブルー
チンを終了させて、メインルーチンにリターンする。＜実施例の作用＞以上のように構成される本実施例の作
用を、図１３に基づいて説明する。

【０１３２】いま、テーブル３内の符号木が、図１３
（ａ）に示されるように初期設定されているとする。そ
して、シンボル“ｅ”が出現したとする。すると、符号
化部２は、図１３（ａ）に示す形態の符号木を検索する
ことにより、“１００”の符号語に符号化することがで
きる。符号化部２は、符号化の後に、符号化したシンボ
ル“ｅ”の葉を注目節点（処理対象節点）とする。そし
て、この注目節点の位置を同じレベル内の最高順位の位
置に移動するとともに、元の最高順位の位置にいた節点
から注目節点の直前の節点までを、一つ順位を下げるよ
うにシフトさせる。図１３（ａ）の例では、“ｅ”に対
応する葉の順位をレベル３の最高順位（順位“７”）に
移動させ、“ａ”に対応する葉から“ｄ”に対応する葉
までを一つづつ右にシフトさせる（図１３（ｂ）参
照）。

【０１３３】次に、移動後の“ｅ”に対応する葉を注目
節点として、一つ上の順位の節点と交換する。図１３
（ｂ）の状態では、“ｅ”に対応する葉の順位は“７”
であるので、順位“６”の節点と交換する（図１３
（ｃ）参照）。なお、順位“６”の節点を移動する際に
は、これに接続されている子の節点（順位“１３”及び
“１４”の節点）も一緒に移動する（図１３（ｄ）参
照）。

【０１３４】次に、交換後の“ｅ”に対応する葉を注目
節点とする。そして、この注目節点の位置を同じレベル
内の最高順位の位置に移動するとともに、元の最高順位
の位置にいた節点から注目節点の直前の節点までを、一
つ順位を下げるようにシフトさせる。図１３（ｄ）の例
では、“ｅ”に対応する葉の順位をレベル２の最高順位
（順位“３”）に移動させ、元の順位“３”の節点から
順位“５”の節点までを一つづつ右にシフトさせる。な
お、元の順位“３”の節点〜順位“５”の節点を移動す
る際には、これらに接続されている子の節点も一緒に移
動する（図１３（ｅ）参照）。

【０１３５】次に、移動後の“ｅ”に対応する葉を注目
節点として、一つ上の順位の節点と交換する。図１３
（ｅ）の状態では、“ｅ”に対応する葉の順位は“３”
であるので、順位“２”の節点と交換する（図１３
（ｆ）参照）。更に、同レベルの最高順位の節点と交換
する。以上の結果、“ｅ”に対応する葉の順位は、根の
次に位置する順位“１”にまで、上がる（図１３（ｇ）
参照）。

【０１３６】一方、初期状態においては、テーブル１１
にも図１３（ａ）に示される形態の符号木が格納されて
いる。従って、復元部１０は、“１００”の符号語を受
信すると、図１３（ａ）に示す形態の符号木を検索する
ことにより、シンボル“ｅ”を得ることができる。復元
部１０は、この復元の後に、復元したシンボル“ｅ”の
葉を注目節点とし、符号化部２と同様に符号木の更新を
行う。その結果、更新後の符号木の形態は、図１３
（ｇ）に示す通りとなる。

【０１３７】以上のような順で各シンボルの出現があっ
た場合における節点順位の変動を、表３に示す。

【０１３８】

【表３】

【０１３９】表３において“ｅ”に注目すれば明らかな
ように、如何なる順位に登録されていたシンボルであっ
ても、一回生起しただけで順位“１”に移動することが
できる。即ち、符号語の符号長が１ビットだけになる。
従って、第１実施例及び第２実施例による効果を更に向
上させ、圧縮効率を良くすることができる。

【０１４０】

【第４実施例】本発明の第４実施例は、予めシンボルを
登録せず、新規のシンボルが生起する毎に符号木に登録
することを特徴とする。＜ハード構成＞本実施例のハード構成は、第１実施例の
ものと同じである。従って、その説明を省略する。＜制御内容＞〔符号化部における制御の内容〕図１４は、符号化部２
において、データ入力部１からデータの転送があった時
に実行されるデータ圧縮（符号化）のための処理の内容
を示す。図１４の処理は、圧縮対象のファイル（デー
タ）の受信をトリガとして、スタートする。

【０１４１】スタート後最初のステップＳ０５０１で
は、符号木を初期化して、テーブル３に登録する。即
ち、図１７（ａ）に示すように、終了記号（ＥＯＦ）に
対応する葉，及び未出現記号（ＥＳＣ）に対応する葉の
みを、唯一の根に対して、２本の枝で接続し、符号木を
生成する。そして、終了記号（ＥＯＦ）に接続されてい
る左側の枝に符号“０”を与え、未出現記号（ＥＳＣ）
に接続されている右側の枝に符号“１”を与える。そし
て、根に順位“０”を与え、終了記号（ＥＯＦ）に順位
“１”を与え、未出現記号（ＥＳＣ）に順位“２”を与
える。以上のようにして符号木の初期設定が完了する
と、符号化部２は、この符号木をテーブル３に格納す
る。

【０１４２】次のステップＳ０５０２では、入力された
データの中から順番にシンボル（文字）を一つ取り出す
（シンボル入力）。次のステップＳ０５０３では、ステ
ップＳ０５０２にてシンボルが取り出せたか否か，即
ち、ファイル中のシンボルが終了しているか否かを、チ
ェックする。そして、シンボルが終了していない時に
は、処理をステップＳ０５０４に進める。

【０１４３】ステップＳ０５０４では、テーブル３内に
格納された符号木を参照して、ステップＳ０５０２にて
取り出したシンボルに対応する葉が既に登録されている
かどうかをチェックする。そして、当該シンボルが未登
録である場合には、処理をステップＳ５０８に進め、当
該シンボルが登録済である場合には、処理をステップＳ
５０５に進める（データ登録有無判断手段に対応）。

【０１４４】シンボルが未登録である場合のステップＳ
０５０８においては、テーブル３内に格納された符号木
を参照して、未出現記号（ＥＳＣ）の順位を検索する。
そして、根から未出現記号（ＥＳＣ）に対応する葉まで
の経路を辿り、その経路上の枝に付されている“０”又
は“１”の符号を順番に拾い、一連の符号語を得る。

【０１４５】次のステップＳ０５０９では、データ送信
部４又はデータ書込部７に対して、ステップＳ０５０８
にて得た符号語を出力した後に、ステップＳ０５０２に
て取り出した新規シンボルの生データ（未圧縮のデー
タ）を出力する（符号化手段に対応）。

【０１４６】次のステップＳ０５１０では、ステップＳ
０５０８にて検索した未出現記号（ＥＳＣ）に対応する
葉の順位を基準に符号木の更新を行う（圧縮用テーブル
更新手段に対応）。この符号木の更新処理は、図８の処
理を実行してなしている。但し、このステップＳ０５１
０のサブルーチンとして図８の処理を実行する場合に
は、処理対象の注目節点は、未出現記号（ＥＳＣ）に対
応する葉である。

【０１４７】図８から処理が戻された図１４のメインル
ーチンにおいては、ステップＳ０５１１において、ステ
ップＳ０５０２にて取り出した新規データを符号木に登
録する（圧縮用テーブル更新手段に対応）。図１６は、
ステップＳ０５１１にて実行される新規シンボルの登録
処理のサブルーチンの内容を示すフローチャートであ
る。

【０１４８】このサブルーチンに入って最初のステップ
Ｓ０７０１では、符号木内における未出現記号（ＥＳ
Ｃ）の節点を分岐して、新たに生成された２枚の葉に未
出現記号（ＥＳＣ）と新規シンボルとを登録する。この
際、未出現記号（ＥＳＣ）に対応する葉は、新規シンボ
ルに対応する葉よりも順位が高くなるように、左側に配
置される。この図１６のサブルーチンを実行することに
よる符号木の変化を、図１７に示す。図１７では、
（ａ）が初期設定状態を示し、（ｂ）が新規シンボル
“ａ”の生成後の状態を示し、（ｃ）が新規シンボル
“ｂ”の生成後の状態を示す（なお、実際には符号木の
更新がなされるので、図１８に示すように変化す
る。）。この場合における節点順位の変動を、表４に示
す。

【０１４９】

【表４】

【０１５０】ステップＳ０７０１の実行が完了すると、
この図１６のサブルーチンが終了して、メインルーチン
にリターンする。図１６から処理が戻された図１４のメ
インルーチンにおいては、次のシンボルに対する圧縮処
理を行うために、処理をステップＳ０５０２に戻す。

【０１５１】一方、ステップＳ０５０４にてシンボルが
登録済であると判定された場合のステップＳ０５０５に
おいては、テーブル３内に格納された符号木を参照し
て、ステップＳ０５０２にて取り出したシンボルに対応
する葉の順位を検索する。そして、根から対応葉までの
経路を辿り、その経路上の枝に付されている“０”又は
“１”の符号を順番に拾い、一連の符号語を得る。

【０１５２】次のステップＳ０５０６では、このように
して得られた符号語を、データ送信部４又はデータ書込
部７に対して出力する（符号化手段に対応）。次のステ
ップＳ０５０７では、ステップＳ０５０５にて検索した
今回処理対象のシンボルに対応する葉の順位を基準に符
号木の更新を行う（圧縮用テーブル更新手段に対応）。
この符号木の更新処理は、図８の処理を実行してなして
いる。但し、このステップＳ０５０７のサブルーチンと
して図８の処理を実行する場合には、処理対象の注目節
点は、ステップＳ０５０２にて取り出したシンボルに対
応する葉である。

【０１５３】図８から処理が戻された図１４のメインル
ーチンにおいては、次のシンボルに対する圧縮処理を行
うために、処理をステップＳ０５０２に戻す。ファイル
中の全シンボルに対して上記圧縮処理を実施した結果、
ステップＳ０５０３においてシンボルが終了していると
判定した場合には、処理をステップＳ０５１２に進め
る。このステップＳ０５１２では、テーブル３内の符号
木を参照して、終了記号（ＥＯＦ）に対応する葉の順位
を検索する。そして、根から終了記号（ＥＯＦ）に対応
する葉の順位までの経路を辿り、その経路上の枝に付さ
れている“０”又は“１”の符号を順番に拾い、一連の
符号語を得る。

【０１５４】次のステップＳ０５１３では、ステップＳ
０５１２にて得られた符号語をデータ送信部４又はデー
タ書込部７に対して出力し、この圧縮（符号化）処理を
終了する。〔復元部における制御の内容〕図１５は、復元部１０に
おいて、実行されるデータ復元のための処理の内容を示
す。図１５の処理は、データ受信部６がデータを受信し
たこと，或いは、データ読み出し部９が外部指示に応じ
てデータ格納部８からデータを読み出したことをトリガ
としてスタートする。

【０１５５】スタート後最初のステップＳ０６０１で
は、符号木を初期化して、テーブル３に登録する。即
ち、復元部１０は、図１４のステップＳ０５０１と同様
にして、未出現記号（ＥＳＣ）及び終了記号（ＥＯＦ）
のみを葉とする図１７（ａ）に示す符号木を生成し、こ
の符号木をテーブル１１に格納する。

【０１５６】次のステップＳ０６０２では、ファイル内
のシンボルに対応する符号語を、受信した順番（符号化
部２において圧縮された順番）に従って、一つ入力す
る。次のステップＳ０６０３では、テーブル１１内に格
納された符号木を参照して、入力した符号語が終了記号
（ＥＯＦ）に対応するか否かをチェックする。終了記号
に対応していない場合には、処理をステップＳ０６０４
に進める。

【０１５７】このステップＳ０６０４では、テーブル１
１内に格納された符号木を参照して、ステップＳ０６０
２にて入力した符号語に対応する葉の順位を検索する。
即ち、符号木の根を起点にして、符号語が示す“０”及
び“１”の順番通りに、枝を辿り、対応する順位の節点
（葉）を探す。

【０１５８】次のステップＳ０６０５では、ステップＳ
０６０４にて検索された葉に対応するシンボルを獲得す
る（シンボルの復元）（データ復元手段に対応）。次の
ステップＳ０６０６では、ステップＳ０６０５にて復元
された今回処理対象の符号に対応するシンボルが書き込
まれている葉の順位を基準に、テーブル１１内に格納さ
れた符号木の更新を行う（復元用テーブル更新手段に対
応）。このステップＳ０６０６では、図６のステップＳ
０５０７及びステップＳ０５１０で実行されるのと全く
同じ処理，即ち、図８のサブルーチンを、実行する。従
って、テーブル１１内に格納された符号木は、テーブル
３内に格納された符号木と同期して、全く同様に更新さ
れて行く。

【０１５９】図８から処理が戻された図１５のメインル
ーチンでは、ステップＳ０６０７において、ステップＳ
０６０５にて復元したシンボルが未出現記号（ＥＳＣ）
であるか否かをチェックする。

【０１６０】ステップＳ０６０７にて未出現記号（ＥＳ
Ｃ）であると判定した場合には、次のステップＳ０６０
９において、ステップＳ０６０２にて入力した符号に続
くデータを入力する。このデータは、図１４のステップ
Ｓ０５０９において出力された新規シンボルの生データ
（未圧縮データ）である。この新規シンボルは、次のス
テップＳ０６１０において、複元部１０から出力され
る。

【０１６１】次のステップＳ０６１１では、ステップＳ
０６１０にて出力した新規シンボルを、テーブル１１内
の符号木に登録する（復元用テーブル更新手段に対
応）。このステップＳ０６１１では、図１４のステップ
Ｓ０５１１で実行されるのと全く同じ処理，即ち、図１
６のサブルーチンを、実行する。従って、テーブル１１
内に格納された符号木は、テーブル３内に格納された符
号木と同期して、全く同様に更新されて行く。ステップ
Ｓ０６１１を完了すると、次の符号語を復元するため
に、処理をステップＳ０６０２に戻す。

【０１６２】これに対して、ステップＳ０６０７にて未
出現記号（ＥＳＣ）でないと判定した場合には、ステッ
プＳ０６０８において、ステップＳ０６０５にて復元し
たシンボルを出力する。ステップＳ０６０８を完了する
と、次の符号語を復元するために、処理をステップＳ０
６０２に戻す。＜実施例の作用＞以上のように構成される本第４実施例
の作用を、図１８に基づいて説明する。

【０１６３】いま、テーブル３内の符号木が、図１８
（ａ）に示されるように初期設定されているとする。そ
して、最初に新規シンボル“ａ”が出現したとする。す
ると、符号化部２は、図１８（ａ）に示す形態の符号木
を検索することにより、シンボル“ａ”が未登録である
ことが判るので、未出現記号（ＥＳＣ）を符号語“１”
に符号化して出力する。符号化部２は、符号化の後に、
符号化した未出現記号（ＥＳＣ）の葉を注目節点（処理
対象節点）とし、この注目節点の位置を一つ上の順位の
節点（終了記号（ＥＯＦ）に対応する葉）と交換する。
その結果、更新後の符号木の形態は、図１８（ｂ）に示
す通りになる。続いて、符号化部２は、新規シンボル
“ａ”の生データ（未圧縮のデータ）を出力する。続い
て、符号化部２は、符号木中において未出現記号（ＥＳ
Ｃ）の葉に接続された枝を分岐して、新規シンボルに対
応する葉を登録する。この際、未出現記号（ＥＳＣ）に
対応する葉の順位が新規シンボルに対応する葉の順位よ
りも大きくなるようにする。その結果、更新後の符号木
の形態は、図１８（ｃ）に示す通りとなる。

【０１６４】一方、初期状態においては、テーブル１１
にも図１８（ａ）に示される形態の符号木が格納されて
いる。従って、復元部１０は、“１”の符号語を受信す
ると、図１８（ａ）に示す形態の符号木を検索すること
により、未出現記号（ＥＳＣ）を得ることができる。す
ると、復元部１０は、この“１”の符号語の後に入力し
た符号が新規シンボルの生データ（未圧縮のデータ）で
あることを認識することができるので、この新規シンボ
ルの生データ“ａ”をそのまま出力する。復元部１０
は、この出力の後に、未出現記号（ＥＳＣ）の葉を注目
節点とし、この注目節点の位置を一つ上の順位の節点
（終了記号（ＥＯＦ）に対応する節点）と交換する（図
１８（ｂ）参照）。続いて、復元部１０は、符号木中に
おいて未出現記号（ＥＳＣ）の葉に接続された枝を分岐
して、新規シンボルに対応する葉を登録する。その結
果、更新後の符号木の形態は、テーブル３内の符号木と
同様に、図１８（ｃ）に示す通りとなる。

【０１６５】次に、符号化部２において、新規シンボル
“ｂ”が出現したとする。すると、符号化部２は、図１
８（ｃ）に示す形態の符号木を検索することにより、シ
ンボル“ｂ”が未登録であることが判るので、未出現記
号（ＥＳＣ）を符号語“００”に符号化して出力する。
符号化部２は、符号化の後に、符号化した未出現記号
（ＥＳＣ）の葉を注目節点とし、この注目節点の位置を
一つ上の順位の節点と交換する。図１８（ｃ）の例では
“ＥＳＣ”に対応する葉の順位は“３”であるので、順
位“２”の節点と交換する。その結果、更新後の符号木
の形態は、図１８（ｄ）に示す通りとなる。続いて、符
号化部２は、新規シンボル“ｂ”の生データ（未圧縮の
データ）を出力する。続いて、符号化部２は、符号木中
において未出現記号（ＥＳＣ）の葉に接続された枝を分
岐して、新規シンボルに対応する葉を登録する。この
際、未出現記号（ＥＳＣ）に対応する葉の順位が新規シ
ンボルに対応する葉の順位よりも大きくなるようにす
る。その結果、更新後の符号木の形態は、図１８（ｅ）
に示す通りとなる。

【０１６６】一方、復元部１０は、“００”の符号語を
受信すると、図１８（ｃ）に示す形態の符号木を検索す
ることにより、未出現記号（ＥＳＣ）を得ることができ
る。すると、復元部１０は、この“００”の符号語の後
に入力した符号が新規シンボルの生データ（未圧縮のデ
ータ）であることを認識することができるので、この新
規シンボルの生データ“ｂ”をそのまま出力する。復元
部１０は、この出力の後に、未出現記号（ＥＳＣ）の葉
を注目節点とし、この注目節点の位置を一つ上の順位の
節点と交換する（図１８（ｄ）参照）。続いて、復元部
１０は、符号木中において未出現記号（ＥＳＣ）の葉に
接続された枝を分岐して、新規シンボルに対応する葉を
登録する。その結果、更新後の符号木の形態は、テーブ
ル３内の符号木と同様に、図１８（ｅ）に示す通りとな
る。

【０１６７】このような新規シンボルの登録を繰り返し
た結果、符号木の構成が図９（ａ）に示したようになる
と、第１実施例の作用で説明したのと同様にして、更新
がなされて行く。

【０１６８】以上のように、本第４実施例によると、第
１実施例の作用を全て実現できるとともに、圧縮処理の
最初にファイル全体をサーチする必要や初期設定の符号
木を復元部に通知する必要がなくなるので、処理時間の
短縮を図ることができるばかりか、符号化部２や復元部
１０の機能を実現する処理装置（ＣＰＵ）の負荷を小さ
くすることができる。また、予めファイルの全体構成を
知ることができないリアルタイムのデータ入力に対して
も、圧縮処理を行うことができる。

【０１６９】なお、本第４実施例においては、図１４の
ステップＳ０５０７，及びＳ０５１０，並びに図１５の
ステップＳ０６０６の符号木更新処理として、図８のサ
ブルーチンを実行しているが、これに代えて、図１０の
サブルーチン又は図１２のサブルーチンを実行しても良
い。

【０１７０】

【第５実施例】本発明の第５実施例は、第４実施例と比
して、図１４のステップＳ０５１１及び図１５のステッ
プＳ０６１１において実行される新規シンボルの符号木
への登録処理の内容のみを異にし、他の構成を同じとし
ている。従って、その他の説明を省略する。＜制御内容＞本第５実施例においては、符号化部４が図
１４の処理を実行し、復元部１０が図１５の処理を実行
する。

【０１７１】図１９は、図１４のステップＳ０５１１，
及び図１５のステップＳ０６１１において実行される新
規シンボルの符号木への登録サブルーチンの内容を示す
フローチャートである。

【０１７２】図１９に入って最初のステップＳ０８０１
では、符号木を構成する全ての節点の最下位順位（全節
点数−１）を、変数Ｎの値とする。次のステップＳ０８
０２では、符号木を構成する内部節点のうちの最下位の
ものの順位の一つ下の順位を、順位“Ｘ”とする。そし
て、順位“Ｘ”にある葉を分岐させる。この結果、順位
“Ｘ”の節点は、内部節点になる。次のステップＳ０８
０３では、元々順位“Ｘ”から順位“Ｎ−１”までの間
に登録されていたシンボル（又は、ＥＯＦ，ＥＳＣ）
を、一つ下の順位に夫々シフトする。次のステップＳ０
８０４では、新しい順位“Ｘ”の内部節点の子として、
元の順位“Ｎ”に登録されていたシンボル等と新規シン
ボルとを登録する。このとき、新規シンボルの順位が下
になるように登録する。次のステップＳ０８０５では、
Ｎ＋２を新たなＮとする。

【０１７３】この図１９のサブルーチンを実行すること
による符号木の変化を、図２０に示す。図２０では、
（ａ）が初期設定状態を示し、（ｂ）が新規シンボル
“ａ”の生成後の状態を示し、（ｃ）が新規シンボル
“ｂ”の生成後の状態を示す（なお、実際には符号木の
更新がなされるので、図２１に示すように変化す
る。）。この場合における節点順位の変動を、表５に示
す。

【０１７４】

【表５】

【０１７５】ステップＳ０８０５の実行が完了すると、
この図１９のサブルーチンが終了して、メインルーチン
にリターンする。＜実施例の作用＞以上のように構成される本第５実施例
の作用を、図２１に基づいて説明する。

【０１７６】いま、テーブル３内の符号木が、図２１
（ａ）に示されるように初期設定されているとする。そ
して、最初に新規シンボル“ａ”が出現したとする。す
ると、符号化部２は、図２１（ａ）に示す形態の符号木
を検索することにより、シンボル“ａ”が未登録である
ことが判るので、未出現記号（ＥＳＣ）を符号語“１”
に符号化して出力する。符号化部２は、符号化の後に、
符号化した未出現記号（ＥＳＣ）の葉を注目節点とし、
この注目節点の位置を一つ上の順位の節点（終了記号
（ＥＯＦ）に対応する葉）と交換する。その結果、符号
木の形態は、図２１（ｂ）に示す通りになる。続いて、
符号化部２は、新規シンボル“ａ”の生データ（未圧縮
のデータ）を出力する。続いて、符号化部２は、最下位
の内部節点（順位“０”の節点）の次の順位の節点（順
位“１”の葉：この節点を、「節点Ｘ」と称する。）を
分岐する。そして、分岐により生成された二つの葉に夫
々順位を付与する。すると、節点Ｘから右側に繋がる新
しい葉が最下位の節点となるので、この葉に新規シンボ
ル“ａ”を登録する。そして、元の節点Ｘに登録されて
いたシンボルから元の最下位の節点に登録されていたシ
ンボルまでを、一つずつ下にずらせて登録し直す。その
結果、更新後の符号木の形態は、図２１（ｃ）に示す通
りとなる。

【０１７７】一方、初期状態においては、テーブル１１
にも図２１（ａ）に示される形態の符号木が格納されて
いる。従って、復元部１０は、“１”の符号語を受信す
ると、図２１（ａ）に示す形態の符号木を検索すること
により、未出現記号（ＥＳＣ）を得ることができる。す
ると、復元部１０は、この“１”の符号語の後に入力し
た符号が新規シンボルの生データ（未圧縮のデータ）で
あることを認識することができるので、この新規シンボ
ルの生データ“ａ”をそのまま出力する。復元部１０
は、この出力の後に、未出現記号（ＥＳＣ）の葉を注目
節点とし、この注目節点の位置を一つ上の順位の節点
（終了記号（ＥＯＦ）に対応する節点）と交換する（図
２１（ｂ）参照）。続いて、復元部１０は、符号化部２
がしたのと同じに、新規シンボル“ａ”を登録する。そ
の結果、更新後の符号木の形態は、テーブル３内の符号
木と同様に、図２１（ｃ）に示す通りとなる。

【０１７８】次に、符号化部２において、新規シンボル
“ｂ”が出現したとする。すると、符号化部２は、図２
１（ｃ）に示す形態の符号木を検索することにより、シ
ンボル“ｂ”が未登録であることが判るので、未出現記
号（ＥＳＣ）を符号語“１”に符号化して出力する。符
号化部２は、符号化の後に、符号化した未出現記号（Ｅ
ＳＣ）の葉を注目節点とし、この注目節点の位置を一つ
上の順位の節点（順位“１”の葉）と交換する。その結
果、符号木の形態は、図２１（ｄ）に示す通りになる。
続いて、符号化部２は、新規シンボル“ｂ”の生データ
（未圧縮のデータ）を出力する。続いて、符号化部２
は、最下位の内部節点（順位“２”の節点）の次の順位
の節点（順位“３”の葉：この節点を、「節点Ｘ」と称
する。）を分岐する。そして、分岐により生成された二
つの葉に夫々順位を付与する。すると、節点Ｘから右側
に繋がる新しい葉が最下位の節点となるので、この葉に
新規シンボル“ｂ”を登録する。そして、元の節点Ｘに
登録されていたシンボルから元の最下位の節点に登録さ
れていたシンボルまでを、一つずつ下にずらせて登録し
直す。その結果、更新後の符号木の形態は、図２１
（ｅ）に示す通りとなる。

【０１７９】一方、復元部１０は、“１”の符号語を受
信すると、図２１（ｂ）に示す形態の符号木を検索する
ことにより、未出現記号（ＥＳＣ）を得ることができ
る。すると、復元部１０は、この“１”の符号語の後に
入力した符号が新規シンボルの生データであることを認
識することができるので、この新規シンボルの生データ
“ｂ”をそのまま出力する。復元部１０は、この出力の
後に、未出現記号（ＥＳＣ）の葉を注目節点とし、この
注目節点の位置を一つ上の順位の節点（順位“１”の節
点）と交換する（図２１（ｄ）参照）。続いて、復元部
１０は、符号化部２がしたのと同じに、新規シンボル
“ｂ”を登録する。その結果、更新後の符号木の形態
は、テーブル３内の符号木と同様に、図２１（ｅ）に示
す通りとなる。

【０１８０】このような新規シンボルの登録を繰り返し
た結果、符号木の構成が図９（ａ）に示したようになる
と、第１実施例の作用で説明したのと同様にして、更新
がなされて行く。

【０１８１】以上のように、本第５実施例によると、第
１実施例の作用を全て実現できるとともに、圧縮処理の
最初にファイル全体をサーチする必要や初期設定の符号
木を復元部に通知する必要がなくなるので、処理時間の
短縮を図ることができるばかりか、符号化部２や復元部
１０の機能を実現する処理装置（ＣＰＵ）の負荷を小さ
くすることができる。また、予めファイルの全体構成を
知ることができないリアルタイムのデータ入力に対して
も、圧縮処理を行うことができる。また、新規シンボル
に対応する符号語の符号長を極端に長くすることがない
ので、符号化の効率を悪化させることがない。

【０１８２】なお、本第５実施例においては、図１４の
ステップＳ０５０７，及びＳ０５１０，並びに図１５の
ステップＳ０６０６の符号木更新処理として、図８のサ
ブルーチンを実行しているが、これに代えて、図１０の
サブルーチン又は図１２のサブルーチンを実行しても良
い。

【０１８３】

【実施例６】本発明の第６実施例は、予めシンボルを登
録せず、新規のシンボルが生起する毎に符号木に登録す
るとともに、文脈モデルを併用して圧縮を行うことを特
徴とする。

【０１８４】本第６実施例による圧縮方式は、図２２に
示す概念図に示すように、最初に文脈モデルによる条件
付けを行い、この条件下において第５実施例と同じ符号
化を行うものである。＜ハード構成＞本第６実施例のハード構成は、第１実施
例において説明したのと同じものであるのでその説明を
省略するが、本第６実施例における符号化部２は、文脈
検索手段，未出現記号順位符号化手段，シンボル順位符
号化手段，符号木順位更新手段，及び未出現記号順位更
新手段に対応し、復元部１０は、文脈検索手段，シンボ
ル順位復号化手段，シンボル順位再復号化手段，符号木
順位更新手段，及び未出現記号順位更新手段に対応す
る。

【０１８５】また、本第６実施例におけるテーブル３及
びテーブル１１には、図２３に示すような文脈木，及び
この文脈木の各内部節点を夫々根とする複数の符号木が
格納されている。以下に、これら文脈木及び符号木の関
係を説明する。

【０１８６】文脈木は、過去に生起した文脈（複数の文
字が連続して生起したパターン）を唯一の根（ｒｏｏ
ｔ）を先頭にしてまとめたものである。図２３の例で
は、過去、“ａａｂ”，“ａｂｃ”，“ａｃｂ”，“ｂ
ｃａ”，“ｃａａ”，“ｃａｃ”，“ｃｂｃ”といった
文脈が生起していることを示している。この文脈木で
は、符号木と異なり、根（ｒｏｏｔ）以外の全ての節点
（葉であるか内部節点であるかを問わず）に文字を割り
当てている。また、この文脈木は、あくまでも条件付け
のために用いこれ自体で符号化する訳ではないので、あ
る内部節点から３本以上の枝が分岐していることがあり
得る。また、これらの枝には、符号が割り当てられてい
ない。さらに、文脈木に登録された３文字の文脈に全く
当てはまらない文脈や１文字又は２文字しか当てはまら
ない文脈が生起された場合に備え、各内部節点には未出
現記号（ＥＳＣ）も接続されている。なお、ファイルの
終了を示すために、根には終了記号（ＥＯＦ）も接続さ
れている。また、文脈木においては、「レベル」のこと
を「〜次，次数」という。

【０１８７】各内部節点に対応する文字が生起された条
件下においては、次にどの文字が生起されるかの確率
は、無条件の場合に比して偏りが生じていると考えられ
る。即ち、過去に生じた文脈に沿った文字の生起確率が
それ以外の文字に比べて高いと考えられる。従って、あ
る文字が生起された条件下では、その文字に続く文脈に
沿った文字のみを符号化する符号木を適用しても、符号
化が可能である。しかも、このような条件付きの符号木
を適用すれば、この条件付きの符号木による符号化対象
の文字は限定されるので、符号木の規模が小さくなる。
その結果、符号語の符号長が短くなり、圧縮効率が高ま
る。

【０１８８】以上の理由により、文脈木の各内部節点に
は、当該内部節点に対応した根を有するとともに、当該
文脈木の内部節点に直接接続された次レベルの節点の文
字（ＥＣＳ，ＥＯＦをも含む）を葉とする符号木が用意
されている。図２４は、これらの符号木のうち、図２３
の文脈木における根（ｒｏｏｔ）に対応して備えられた
符号木を示している。なお、これらの符号木内において
は、上述の各実施例において説明したように、次に生起
する可能性のある文字に対応する符号長が短くなってい
る。即ち、生起する可能性が高い文脈に沿った文字ほ
ど、その圧縮率が高くなっているのである。＜制御内容＞〔符号化部における制御の内容〕図２５は、符号化部２
において、データ入力部１からデータの転送があった時
に実行されるデータ圧縮（符号化）のための処理の内容
を示す。図２５の処理は、圧縮対象のファイル（デー
タ）の受信をトリガとして、スタートする。

【０１８９】スタート後最初のステップＳ０９０１で
は、文脈木及び符号木を初期化して、テーブル３に登録
する。即ち、表６（１）に示すように、根（ｒｏｏｔ）
に対して終了記号（ＥＯＦ）及び未出現記号（ＥＳＣ）
のみを接続して文脈木を生成する。そして、この文脈木
に基づいて、符号木を生成する。但し、文脈木の内部節
点は根（ｒｏｏｔ）のみであるので、この根（ｒｏｏ
ｔ）に対応した文脈木を生成する。従って、ｒｏｏｔ下
の符号木は、終了記号（ＥＯＦ）に対応した葉と未出現
記号（ＥＳＣ）に対応した葉のみを、唯一の根に対して
２本の枝で接続した構造となる。そして、終了記号（Ｅ
ＯＦ）に接続されている左側の枝に符号“０”を与え、
未出現記号（ＥＳＣ）に接続されている右側の枝に符号
“１”を与える。そして、根に順位“０”を与え、終了
記号（ＥＯＦ）に順位“１”を与え、未出現記号（ＥＳ
Ｃ）に順位“２”を与える。以上のようにして文脈木及
び符号木の初期設定が完了すると、符号化部２は、この
符号木をテーブル３に格納する。符号化部２は、これと
ともに、文脈木の最高次数（定数）ｎ１を宣言する。こ
の文脈木の最高次数とは、文脈木内における内部節点の
最高次数である。従って、図２３の例では、ｎ１＝２と
なる。

【０１９０】次のステップＳ０９０２では、参照する既
出の文脈を更新する。即ち、上述のようにｎ１＝２に設
定されているとすると、条件付きの符号木を有する文脈
木の内部節点の最高次数は２次となる。図２３を見れば
理解されるように、２次の節点に対応する文脈木を適用
できる場合とは、１次と２次の文脈の条件を満たした場
合である。従って、参照する文脈は最近に生成された２
次の文脈であることが判る。そこで、このステップＳ０
９０２では、参照対象としての文脈を、最近生成された
２次の文脈に更新するのである。符号化部２は、また、
入力されたデータの中から順番にシンボル（文字）を一
つ取り出す（シンボル入力）。また、変数ｎにステップ
Ｓ０９０１にて宣言したｎ１の値を代入する。

【０１９１】次のステップＳ０９０３では、ステップＳ
０９０２にて更新した参照用の文脈（ｎ次）が文脈木に
登録されているかをチェックする（文脈検索手段に対
応）。圧縮処理が進んで文脈木が延びればｎ次の文脈も
登録され得るが、最初にこのステップＳ０９０３に入っ
たときには、ｎ＝ｎ１＞０であって、文脈木には如何な
る文脈も登録されていないとされる。ステップＳ０９０
３にてｎ次の文脈が登録されていないと判定された場合
には、ステップＳ０９０４において、ｎを一つインクリ
メントして、再チェックを行う。

【０１９２】ステップＳ０９０３にてｎ次の文脈が登録
されていると判定した場合（ｎ＝０であって文脈が全く
登録されていない場合を含む。）には、処理をステップ
Ｓ０９０５に進める。このステップＳ０９０５では、現
時点のｎの値が“０”であり且つシンボルが終了してい
るかどうかをチェックする。現時点のｎの値が“０”で
ない場合，又はシンボルが終了していない場合には、処
理をステップＳ０９０６に進める。

【０１９３】ステップＳ０９０６では、ステップＳ０９
０３で探し出されたｎ次文脈の末端に当たる節点に対応
して設けられた符号木（ｎ次の文脈木の下の符号木）
に、ステップＳ０９０２において入力したシンボルが登
録されているかどうかをチェックする。初期においては
文脈木には“０”次文脈しか登録されていない，即ち、
文脈が全く登録されていないので、根（ｒｏｏｔ）に対
応した符号木内をチェックすることになる。そして、当
該シンボルが未登録である場合には、処理をステップＳ
０９１４に進め、当該シンボルが登録済である場合に
は、処理をステップＳ０９０７に進める。

【０１９４】シンボルが未登録である場合のステップＳ
０９１４においては、ｎ次の文脈木の下の符号木を参照
して、未出現記号（ＥＳＣ）の順位を検索する。そし
て、当該符号木における根から未出現記号（ＥＳＣ）に
対応する葉までの経路を辿り、その経路上の枝に付され
ている“０”又は“１”の符号を順番に拾い、一連の符
号語を得る。

【０１９５】次のステップＳ０９１５では、データ送信
部４又はデータ書込部７に対して、ステップＳ０９１４
にて得た未出現記号（ＥＳＣ）に対する符号語を出力す
る（未出現記号順位符号化手段に対応）。

【０１９６】次のステップＳ０９１５では、ステップＳ
０９１４にて検索した未出現記号（ＥＳＣ）に対応する
葉の順位を基準に、ｎ次の文脈木の下の符号木の更新を
行う（未出現記号順位更新手段に対応）。この符号木の
更新処理は、図８の処理を実行してなしている。但し、
このステップＳ０９１６のサブルーチンとして図８の処
理を実行する場合には、処理対象の注目節点は、未出現
記号（ＥＳＣ）に対応する葉である。

【０１９７】図８から処理が戻された図２５のメインル
ーチンにおいては、ステップＳ０９１７の処理を実行す
る。このステップＳ０９１７では、現在のｎの値が
“０”であるのか否か，即ち、ステップＳ０９０６にて
チェック対象としたのが０次の文脈であるのか否かをチ
ェックする。そして、ｎ＝０でない場合，即ち、０次の
文脈ではない場合には、ステップＳ０９２１にてｎの値
を一つデクリメントして、処理をステップＳ０９０５に
戻す。即ち、文脈木の節点を一つ根（ｒｏｏｔ）側に戻
して、その節点に対応する符号木に基づいて符号化処理
を行うようにするのである。

【０１９８】これに対してｎ＝０である場合，即ち、０
次の文脈である場合には、テーブル３内の何れの符号木
を用いても符号化することができない全く新規なシンボ
ルが入力された場合であると考えられる。そのため、ス
テップＳ０９１８において、データ送信部４又はデータ
書込部７に対して、ステップＳ０９０２にて入力したシ
ンボルの生データ（未圧縮のデータ）をそのまま出力す
る。

【０１９９】次のステップＳ０９１９では、ステップＳ
０９０２にて入力した新規シンボルをｎ次（０次）の符
号木に登録する。この符号木への新規シンボルの登録
は、図１９の処理を実行してなされている。

【０２００】図１９から処理が戻された図２５のメイン
ルーチンにおいては、ステップＳ０９２０において、文
脈木に新規シンボルを登録する。この登録は、文脈木の
１次の節点として新規シンボルに対応する節点を設け、
この節点と根（ｒｏｏｔ）とを結ぶことによって、行わ
れる。

【０２０１】このステップＳ０９２０の処理が完了する
と、次のシンボルに対する圧縮処理を行うために、処理
をステップＳ０９０２に戻す。一方、ステップＳ０９０
６にてｎ次の文脈木の下の符号木にシンボルが登録され
ていると判定した場合のステップＳ０９０７において
は、ｎ次の文脈木の下の符号木を参照して、ステップＳ
０９０２にて取り出したシンボルに対応する葉の順位を
検索する。そして、根から対応葉までの経路を辿り、そ
の経路上の枝に付されている“０”又は“１”の符号を
順番に拾い、一連の符号語を得る。

【０２０２】次のステップＳ０９０８では、このように
して得られた符号語を、データ送信部４又はデータ書込
部７に対して出力する（シンボル順位符号化手段に対
応）。次のステップＳ０９０９では、ステップＳ０９０
５にて検索した今回処理対象のシンボルに対応する葉の
順位を基準に、ｎ次の文脈木の下の符号木の更新を行う
（符号木順位更新手段に対応）。この符号木の更新処理
は、図８の処理を実行してなしている。但し、このステ
ップＳ０９０９のサブルーチンとして図８の処理を実行
する場合には、処理対象の注目節点は、ステップＳ０９
０２にて取り出したシンボルに対応する葉である。

【０２０３】図８から処理が戻された図２５のメインル
ーチンにおいては、ステップＳ０９１０において、ｎ＋
１次の文脈木の下に符号木があるか否かをチェックす
る。即ち、ステップＳ０９０９にて処理対象とした符号
木に対応する文脈木中の節点に続く節点に、対応する符
号木が設けられているかをチェックする。符号木が既に
設けられている場合には、新たな符号木を作成する必要
がないので、次のシンボルの圧縮を行うために、処理を
ステップＳ０９０２に戻す。

【０２０４】一方、符号木が設けられていない場合に
は、ステップＳ０９１１において現在のｎの値がｎ１未
満であるかどうかをチェックする。ｎがｎ１以上である
場合には、最高次数を越えぬように、処理をステップＳ
０９０２に戻す。

【０２０５】一方、ｎがｎ１未満である場合には、ステ
ップＳ０９１２においてｎ＋１次の文脈木の下におい
て、新たな符号木を作成する。即ち、ステップＳ０９０
９にて処理対象とした符号木に対応する文脈木中の節点
に続く節点をその根と対応させて、符号木を作成する。
この符号木には、未出現記号（ＥＳＣ）と新規シンボル
のみを登録する。この際、新規シンボルの節点の順位が
未出現記号（ＥＳＣ）の節点の順位よりも上になるよう
にする。

【０２０６】次のステップＳ０９１３では、文脈木に未
出現記号（ＥＳＣ）及び新規シンボルを登録する。この
登録は、文脈木内のｎ＋１次の節点から枝を二本延ば
し、それらの先端に設けられた節点に夫々未出現記号
（ＥＳＣ）及び新規シンボルを対応させることによっ
て、行われる。

【０２０７】このステップＳ０９１３の処理が完了する
と、次のシンボルに対する圧縮処理を行うために、処理
をステップＳ０９０２に戻す。以上の処理を繰り返した
結果、現時点のｎの値が“０”であり且つシンボルが終
了しているとステップＳ０９０５にて判定した場合に
は、ステップＳ０９２２において、根（ｒｏｏｔ）に対
応する符号木を参照し、終了記号に対応する葉の順位を
検索する。そして、根から対応葉までの経路を辿り、そ
の経路上の枝に付されている“０”又は“１”の符号を
順番に拾い、一連の符号語を得る。

【０２０８】次のステップＳ０９２３では、ステップＳ
０９２２にて得られた符号語を、データ送信部４又はデ
ータ書込部７に対して出力する。その後、この圧縮処理
を終了する。〔復元部における制御の内容〕図２６は、復元部１０に
おいて実行されるデータ復元のための処理の内容を示
す。図２６の処理は、データ受信部６がデータを受信し
たこと，或いは、データ読み出し部９が外部指示に応じ
てデータ格納部８からデータを読み出したことをトリガ
としてスタートする。

【０２０９】スタート後最初のステップＳ１００１で
は、文脈木及び符号木を初期化して、テーブル３に登録
する。即ち、復元部１０は、図２５のステップＳ１００
１と同様にして、根（ｒｏｏｔ）に対して終了記号（Ｅ
ＯＦ）及び未出現記号（ＥＳＣ）のみを接続した文脈木
と、この文脈木に基づいた符号木とを、表６（１）に示
すように生成する。以上のようにして文脈木及び符号木
の初期設定が完了すると、復元部１０は、これら文脈木
及び符号木をテーブル３に格納する。復元部１０は、こ
れとともに、文脈木の最高次数（定数）ｎ１を宣言す
る。ここでは、上述した通り、ｎ１＝２である。

【０２１０】次のステップＳ１００２では、参照する既
出の文脈を更新する。即ち、復元部１０は、参照対象と
しての文脈を、最近生成された２次の文脈に更新するの
である。また、復元部１０は、ステップＳ１００１にて
宣言したｎ１の値を変数ｎに代入する。更に、復元部１
０は、ファイル内のシンボルに対応する符号語を、受信
した順番（符号化部２において圧縮された順番）に従っ
て、一つ入力する。

【０２１１】次のステップＳ１００３では、ステップＳ
１００２にて更新した参照用の文脈（ｎ次）が文脈木に
登録されているかをチェックする（文脈検索手段に対
応）。圧縮処理が進んで文脈木が延びればｎ次の文脈も
登録され得るが、最初にこのステップＳ１００３に入っ
たときには、ｎ＝ｎ１＞０であって、文脈木には如何な
る文脈さえも登録されていないとされる。ステップＳ１
００３にてｎ次の文脈が登録されていないと判定された
場合には、ステップＳ１００４において、ｎを一つイン
クリメントして、再チェックを行う。

【０２１２】ステップＳ１００４にてｎ次の文脈が登録
されていると判定した場合には、処理をステップＳ１０
０５に進める。このステップＳ１００５では、ステップ
Ｓ１００３で探し出したｎ次文脈の末端に当たる節点に
対応して設けられた符号木（ｎ次の文脈下の符号木）を
参照して、入力した符号語に対応する葉の順位を検索す
る。即ち、符号木の根を起点にして、符号語が示す
“０”及び“１”の順番通りに枝を辿り、対応する順位
の葉を探す。そして、探し出した葉に対応つけられてい
るシンボルを読み取るのである（シンボル順位復号化手
段に対応）。

【０２１３】次のステップＳ１００６では、現時点のｎ
の値が“０”であり且つシンボルが終了しているかどう
かをチェックする。現時点のｎの値が“０”でない場
合，又はシンボルが終了していない場合には、処理をス
テップＳ１００７に進める。

【０２１４】ステップＳ１００７では、ステップＳ１０
０５にて復元したシンボルが未出現記号（ＥＳＣ）であ
るか否かをチェックする。ステップＳ１００７にて未出
現記号（ＥＳＣ）であると判定した場合には、処理をス
テップＳ１０１４に進める（シンボル順位再復号化手段
に対応）。このステップＳ１０１４では、この未出現記
号（ＥＳＣ）に対応する葉の順位を基準に、ｎ次の文脈
木の下の符号木の更新を行う（未出現記号順位更新手段
に対応）。この符号木の更新処理は、図８の処理を実行
してなしている。但し、このステップＳ１０１６のサブ
ルーチンとして図８の処理を実行する場合には、処理対
象の注目節点は、未出現記号（ＥＳＣ）に対応する葉で
ある。

【０２１５】図８から処理が戻された図２６のメインル
ーチンにおいては、ステップＳ１０１５の処理を実行す
る。このステップＳ１０１５では、現在のｎの値が
“０”であるのか否か，即ち、ステップＳ１０１４にて
更新した符号木が０次の文脈木下のものであるのか否か
をチェックする。そして、ｎ＝０でない場合，即ち、０
次の文脈木下ではない場合には、ステップＳ１０１９に
てｎの値を一つデクリメントして、処理をステップＳ１
００５に戻す（シンボル順位再復号化手段に対応）。即
ち、文脈木の節点を一つ根（ｒｏｏｔ）側に戻して、そ
の節点に対応する符号木に基づいて符号化処理を行うよ
うにするのである。

【０２１６】これに対してｎ＝０である場合，即ち、０
次の文脈である場合には、次に続くデータが新規シンボ
ルの生データ（未圧縮データ）であると考えることがで
きる。そこで、ステップＳ１０１６において、次のデー
タをそのまま出力する。

【０２１７】次のステップＳ１０１７では、ステップＳ
１０１６にて出力した新規シンボルを、テーブル１１内
に格納されたｎ次の文脈木下の符号木に登録する。この
ステップＳ１０１７では、ステップＳ０９１９にて実行
されるのと全く同じ処理，即ち、図１９のサブルーチン
を実行する。従って、テーブル１１内に格納されたｎ次
の文脈木下の符号木は、テーブル３内に格納された符号
木と同期して、全く同様に更新されて行く。

【０２１８】図１９から処理が戻された図２５のメイン
ルーチンにおいては、ステップＳ１０２０において、文
脈木に新規シンボルを登録する。この登録は、文脈木の
１次の節点として新規シンボルに対応する節点を設け、
この節点と根（ｒｏｏｔ）とを結ぶことによって、行わ
れる。

【０２１９】このステップＳ１０２０の処理が完了する
と、次の符号語に対する復元処理を行うために、処理を
ステップＳ１００２に戻す。一方、ステップＳ１００７
にて未出現記号（ＥＳＣ）でないと判定した場合には、
次のステップＳ１００８において、ステップＳ１００５
にて復元したシンボルを出力する。

【０２２０】次のステップＳ１００９では、ステップＳ
１００８にて出力したシンボルに対応する葉の順位を基
準に、ｎ次の文脈木の下の符号木の更新を行う（符号木
順位更新手段に対応）。この符号木の更新処理は、図８
の処理を実行してなしている。但し、このステップＳ１
０１６のサブルーチンとして図８の処理を実行する場合
には、処理対象の注目節点は、ステップＳ１００５にて
復元したシンボルに対応する葉である。

【０２２１】図８から処理が戻された図２６のメインル
ーチンにおいては、ステップＳ１０１０において、ｎ＋
１次の文脈木の下に符号木があるか否かをチェックす
る。即ち、ステップＳ１００９にて処理対象とした符号
木に対応する文脈木中の節点に続く節点に、対応する符
号木が設けられているかをチェックする。符号木が既に
設けられている場合には、新たな符号木を作成する必要
がないので、次の符号語の復元を行うために、処理をス
テップＳ１００２に戻す。

【０２２２】一方、符号木が設けられていない場合に
は、ステップＳ１０１１において現在のｎの値がｎ１未
満であるかどうかをチェックする。ｎがｎ１以上である
場合には、最高次数を越えぬように、処理をステップＳ
１００２に戻す。

【０２２３】一方、ｎがｎ１未満である場合には、ステ
ップＳ１０１２においてｎ＋１次の文脈木の下におい
て、新たな符号木を作成する。即ち、図１５のステップ
Ｓ０９１２と同様にして、符号木を作成する。この符号
木には、未出現記号（ＥＳＣ）と新規シンボルのみを登
録する。この際、新規シンボルの節点の順位が未出現記
号（ＥＳＣ）の節点の順位よりも上になるようにする。

【０２２４】次のステップＳ１０１３では、文脈木に未
出現記号（ＥＳＣ）及び新規シンボルを登録する。この
登録は、文脈木内のｎ＋１次の節点から枝を二本延ば
し、それらの先端に設けられた節点に夫々未出現記号
（ＥＳＣ）及び新規シンボルを対応させることによっ
て、行われる。

【０２２５】このステップＳ１０１３の処理が完了する
と、次の符号語に対する復元処理を行うために、処理を
ステップＳ１００２に戻す。＜実施例の作用＞以上のように構成される本第６実施例
の作用を、表６に基づいて説明する。

【０２２６】

【表６】

【０２２７】いま、テーブル３内の文脈木及び符号木
が、表６（１）に示されるように初期設定されていると
する。そして、最初に新規シンボル“ａ”が出現したと
する。この時参照するのは０次の文脈である。符号化部
２は、表６（１）に示す形態を有する０次の文脈木下の
符号木を検索することにより、シンボル“ａ”が未登録
であることが判る。そこで、未出現記号（ＥＳＣ）を符
号語“１”に符号化して出力する。符号化部２は、０次
の文脈下の符号木内において、符号化した未出現記号
（ＥＳＣ）の葉を注目節点とし、この注目節点の位置を
一つ上の順位の節点（終了記号（ＥＯＦ）に対応する
葉）と交換する。続いて、符号化部２は、新規シンボル
“ａ”の生データ（未圧縮のデータ）を出力する。続い
て、符号化部２は、０次の文脈木下の符号木中において
順位“１”の節点を分岐して、最下位の葉に新規シンボ
ルを登録する。また、符号化部２は、文脈木の根（ｒｏ
ｏｔ）から枝を延ばして、その先端の葉に新規シンボル
“ａ”を登録する。その結果、更新後の符号木の形態
は、表６（２）に示す通りとなる。

【０２２８】一方、初期状態においては、テーブル１１
にも表６（１）に示される形態の文脈木及び符号木が格
納されている。従って、復元部１０は、“１”の符号語
を受信すると、表６（１）に示す形態の符号木を検索す
ることにより、未出現記号（ＥＳＣ）を得ることができ
る。すると、復元部１０は、この“１”の符号語の後に
入力したデータが新規シンボルの生データであることを
認識することができるので、この新規シンボルの生デー
タ“ａ”をそのまま出力する。その後、復元部１０は、
符号化部２と同様にして、テーブル１１内の文脈木と符
号木を更新する。

【０２２９】次に、符号化部２において、シンボル
“ａ”が出現したとする。この時最初に参照するのは、
１次の文脈“ａ”である（ステップＳ０９０３を抜ける
と０次の文脈となる。）。符号化部２は、表６（２）に
示す形態を有する０次の文脈木下の符号木を検索するこ
とにより、この符号木にシンボルが登録されていること
が判る。そこで、このシンボルを符号語“０１”に符号
化して出力する。符号化部２は、０次の文脈木下の符号
木内において、符号化したシンボル“ａ”の葉を注目節
点とし、この注目節点の位置を一つ上の順位の節点（終
了記号（ＥＯＦ）に対応する葉）と交換する。続いて、
符号化部２は、文脈木内の１次の節点（“ａ”に対応す
る節点）に対応した新たな符号木を生成して、この新た
な符号木にシンボル“ａ”及び未出現記号（ＥＳＣ）を
登録する。また、符号化部２は、文脈木の１次の節点
（“ａ”に対応する節点）から２本の枝を延ばして、そ
れらの先端の葉にシンボル“ａ”及び未出現記号（ＥＳ
Ｃ）を登録する。その結果、更新後の符号木の形態は、
表６（３）に示す通りとなる。

【０２３０】一方、復元部１０は、“０１”の符号語を
受信すると、表６（２）に示す形態の０次の文脈木下の
符号木を検索することにより、シンボル“ａ”を復元す
ることができる。その後、復元部１０は、符号化部２と
同様にして、テーブル１１内の文脈木と符号木を更新
し、新たな符号木を生成する。

【０２３１】次に、符号化部２において、新規シンボル
“ｂ”が出現したとする。この時最初に参照するのは、
２次の文脈“ａａ”である（ステップＳ０９０３を抜け
ると１次の文脈“ａ”となる）。すると、符号化部２
は、表６（３）に示す形態を有する１次の文脈木下の符
号木（１次の文脈“ａ”の末端の節点“ａ”に対応した
符号木）を検索することにより、当該符号木にはシンボ
ル“ｂ”が未登録であることが判る。そこで、未出現記
号（ＥＳＣ）を符号語“１”に符号化して出力する。符
号化部２は、１次の文脈“ａ”の末端の節点“ａ”に対
応した符号木内において、符号化した未出現記号（ＥＳ
Ｃ）の葉を注目節点とし、この注目節点の位置を一つ上
の順位の節点（終了記号（ＥＯＦ）に対応する葉）と交
換する。次に、符号化部２は、表６（３）に示す形態を
有する０次の文脈木下の符号木を検索することにより、
当該符号木にはシンボル“ｂ”が未登録であることが判
る。そこで、未出現記号（ＥＳＣ）を符号語“１”に符
号化して出力する。符号化部２は、０次の文脈木下の符
号木内において、符号化した未出現記号（ＥＳＣ）の葉
を注目節点とし、この注目節点の位置を一つ上の順位の
節点（順位“１”の節点）と交換する。続いて、符号化
部２は、新規シンボル“ｂ”の生データ（未圧縮のデー
タ）を出力する。続いて、符号化部２は、０次の文脈木
下の符号木中において順位“３”の節点を分岐して、最
下位の葉に新規シンボル“ｂ”を登録する。また、符号
化部２は、文脈木の根（ｒｏｏｔ）から枝を延ばして、
その先端の葉に新規シンボル“ａ”を登録する。その結
果、更新後の符号木の形態は、図表６（４）に示す通り
となる。

【０２３２】一方、復元部１０は、“１”の符号語を受
信すると、表６（３）に示す形態を有する１次の文脈木
下の符号木（１次の文脈“ａ”の末端の節点“ａ”に対
応した符号木）を検索することにより、未出現記号（Ｅ
ＳＣ）を得ることができる。次に、“１”の符号語を受
信すると、表６（３）に示す形態を有する０次の文脈木
下の符号木を検索することにより、未出現記号（ＥＳ
Ｃ）を得ることができる。すると、復元部１０は、これ
ら“１１”の符号の後に入力したデータが新規シンボル
の生データであることを認識することができるので、こ
の新規シンボルの生データ“ｂ”をそのまま出力する。
その後、復元部１０は、符号化部２と同様にして、テー
ブル１１内の文脈木と符号木を更新する。

【０２３３】次に、符号化部２において、新規シンボル
“ｃ”が出現したとする。この時最初に参照するのは、
２次の文脈“ａｂ”である（ステップＳ０９０３を抜け
ると０次の文脈となる。）。符号化部２は、表６（４）
に示す形態を有する０次の文脈木下の符号木を検索する
ことにより、当該符号木にはシンボル“ｃ”が未登録で
あることが判る。そこで、未出現記号（ＥＳＣ）を符号
語“０”に符号化して出力する。続いて、符号化部２
は、新規シンボル“ｃ”の生データ（未圧縮のデータ）
を出力する。続いて、符号化部２は、０次の文脈木下の
符号木中において順位“４”の節点を分岐して、最下位
の葉に新規シンボル“ｃ”を登録する。また、符号化部
２は、文脈木の根（ｒｏｏｔ）から枝を延ばして、その
先端の葉に新規シンボル“ｃ”を登録する。その結果、
更新後の符号木の形態は、表（５）に示す通りとなる。

【０２３４】一方、復元部１０は、“０”の符号語を受
信すると、表６（４）に示す形態を有する０次の文脈木
下の符号木を検索することにより、未出現記号（ＥＳ
Ｃ）を得ることができる。すると、復元部１０は、この
“０”の符号の後に入力したデータが新規シンボルの生
データであることを認識することができるので、この新
規シンボルの生データ“ｃ”をそのまま出力する。その
後、復元部１０は、符号化部２と同様にして、テーブル
１１内の文脈木と符号木を更新する。

【０２３５】以上のように、本第６実施例によると、第
１実施例，第４実施例，及び第５実施例の作用を全て実
現できるとともに、文脈モデルを併用することによって
圧縮効率を更に向上させることができる。

【０２３６】なお、本第６実施例においては、図２５の
ステップＳ０９０９，及びＳ０９１６，並びに図２６の
ステップＳ１００９，及びＳ１０１４の符号木更新処理
として、図８のサブルーチンを実行しているが、これに
代えて、図１０のサブルーチン又は図１２のサブルーチ
ンを実行しても良い。また、図２５のステップＳ０９１
９，及び図２６のステップＳ１０１７の新規シンボルの
登録処理として、図１９のサブルーチンを実行している
が、これに変えて、図１６のサブルーチンを実行しても
良い。

【０２３７】

【発明の効果】本発明によれば、符号木の各節点毎に頻
度を保持することを不要とすることでメモリの節約が可
能となり、各節点毎に保持された頻度を比較しなくて
も、生起頻度が高いシンボルの圧縮率が大きくなるよう
に符号木を更新することができる。よって、制御処理装
置の負荷を軽減させることができる。

【図面の簡単な説明】

【図１】本発明の第１の態様の原理図

【図２】本発明の第２の態様の原理図

【図３】本発明の各実施例における圧縮処理制御の原
理を示すフローチャート

【図４】本発明の各実施例における復元処理制御の原
理を示すフローチャート

【図５】本発明の第１実施例のハード構成を示すブロ
ック図

【図６】図５の符号化部にて実行される圧縮処理の内
容を示すフローチャート

【図７】図５の復元部にて実行される復元処理の内容
を示すフローチャート

【図８】図６のステップＳ０００６及び図７のステッ
プＳ０１０６で実行される符号木の更新処理サブルーチ
ンを示すフローチャート

【図９】本発明の第１実施例の作用の説明図

【図１０】本発明の第２実施例において、図６のステ
ップＳ０００６及び図７のステップＳ０１０６で実行さ
れる符号木の更新処理サブルーチンを示すフローチャー
ト

【図１１】本発明の第２実施例の作用の説明図

【図１２】本発明の第３実施例において、図６のステ
ップＳ０００６及び図７のステップＳ０１０６で実行さ
れる符号木の更新処理サブルーチンを示すフローチャー
ト

【図１３】本発明の第３実施例の作用の説明図

【図１４】本発明の第４実施例において、図５の符号
化部にて実行される圧縮処理の内容を示すフローチャー
ト

【図１５】本発明の第４実施例において、図５の復元
部にて実行される復元処理の内容を示すフローチャート

【図１６】図１４のステップＳ０５１１及び図１５の
ステップＳ０６１１で実行される新規シンボルの符号木
への登録処理サブルーチンを示すフローチャート

【図１７】図１６の処理の説明図

【図１８】本発明の第４実施例の作用の説明図

【図１９】本発明の第５実施例において、図１４のス
テップＳ０５１１及び図１５のステップＳ０６１１で実
行される新規シンボルの符号木への登録処理サブルーチ
ンを示すフローチャート

【図２０】図１９の処理の説明図

【図２１】本発明の第５実施例の作用の説明図

【図２２】本発明の第６実施例の原理の説明図

【図２３】本発明の第６実施例において、図５の各テ
ーブル３，１１内に格納された文脈木の説明図

【図２４】図２３の文脈木の根（ｒｏｏｔ）に対応し
た符号木の説明図

【図２５】本発明の第６実施例において、図５の符号
化部にて実行される圧縮処理の内容を示すフローチャー
ト

【図２６】本発明の第６実施例において、図５の復元
部にて実行される復元処理の内容を示すフローチャート

【図２７】符号木の各部の名称の説明図

【図２８】ハフマン符号化方式の原理図

【図２９】図２８の符号木による文字と符号語との関
係を示す図

【図３０】適応型符号化方式の原理図

【図３１】適応型符号化方式による符号木の更新例の
説明図

【図３２】図３１の符号木による文字と符号語との関
係を示す図

【図３３】適応型符号化方式による符号木の更新例の
説明図

【図３４】図３３の符号木による文字と符号語との関
係を示す図

【図３５】適応型符号化方式による符号木の更新例の
説明図

【図３６】図３５の符号木による文字と符号語との関
係を示す図

【図３７】適応型符号化方式による符号木の更新例の
説明図

【図３８】図３７の符号木による文字と符号語との関
係を示す図

【図３９】適応型符号化方式における新規シンボルの
登録例の説明図

【符号の説明】

１データ入力部２符号化部３テーブル１０復元部１１テーブル１２データ出力部１００データ圧縮装置１０１圧縮用テーブル１０２データ入力手段１０３符号化手段１０４圧縮用テーブル更新手段１０５データ復元装置１０６復元用テーブル１０７符号入力手段１０８データ復元手段１０９復元用テーブル更新手段

フロントページの続き (56)参考文献特開昭61−242122（ＪＰ，Ａ) 特開昭63−209229（ＪＰ，Ａ) 特開平７−7436（ＪＰ，Ａ) 特開平７−221652（ＪＰ，Ａ) 特開平７−170197（ＪＰ，Ａ) (58)調査した分野(Int.Cl.⁷，ＤＢ名) H03M 7/42

Claims

(57)【特許請求の範囲】

【請求項１】過去に現われた単位データの出現状況に応
じて、入力された単位データを動的に符号化するデータ
圧縮装置において、前記単位データ毎に順位を定めるとともにこの順位毎に
符号を割り当てる圧縮用テーブルと、圧縮対象の単位データを入力するデータ入力手段と、前記圧縮用テーブルを検索して、前記データ入力手段に
よって入力された前記単位データに対応する順位を求め
てこの順位に対応する符号を出力する符号化手段と、前記符号化手段による前記単位データに対応する符号の
出力後に、前記圧縮用テーブル内における前記単位デー
タの順位を、その順位のみに基づいて自己組織的に変更
する圧縮用テーブル更新手段とを備えたことを特徴とす
るデータ圧縮装置。
【請求項２】過去に現われた単位データの出現状況に応
じて、動的に、入力された符号を複号化した単位データ
を出力するデータ復元装置において、前記単位データ毎に順位を定めるとともにこの順位毎に
符号を割り当てる復元用テーブルと、復元対象の符号を入力する符号入力手段と、前記復元用テーブルを検索して、前記符号入力手段によ
って入力された前記符号に対応する順位を求めてこの順
位に対応する単位データを出力するデータ復元手段と、前記データ復元手段による前記単位符号に対応する符号
の出力後に、前記復元用テーブル内における前記単位デ
ータの順位を、その順位のみに基づいて自己組織的に変
更する復元用テーブル更新手段とを備えたことを特徴と
するデータ復元装置。
【請求項３】前記圧縮用テーブルは、単一の根から枝を
繰り返し分岐させた木構造を有し、枝の分岐点及び末端
に形成された各節点に対して前記根から前記末端に向か
う順番に順位が付され、前記末端の節点に前記単位デー
タが登録されており、各分岐された枝毎に互いに識別可
能な符号が与えられているとともに、前記データ符号化手段は、前記根と前記入力された単位
データが登録されている節点とを結ぶ経路上の前記符号
を読み取ることによって、前記符号を出力することを特
徴とする請求項１記載のデータ圧縮装置。
【請求項４】前記復元用テーブルは、単一の根から枝を
繰り返し分岐させた木構造を有し、枝の分岐点及び末端
に形成された各節点に対して前記根から前記末端に向か
う順番に順位が付され、前記末端の節点に前記単位デー
タが登録されており、各分岐された枝毎に互いに識別可
能な符号が与えられているとともに、前記データ復元手段は、前記符号と同じ符号が与えられ
ている前記根からの経路を辿ることにより、その経路の
末端の節点に登録されている前記単位データを探し、探
し出した前記単位データを出力することを特徴とする請
求項２記載のデータ復元装置。
【請求項５】請求項３記載のデータ圧縮装置と請求項４
記載のデータ復元装置とからなるデータ圧縮・復元シス
テムであって、前記圧縮用デーブルの内容と前記復元用テーブルの内容
とが同一であるとともに、前記圧縮用テーブル更新手段及び前記復元用テーブル更
新手段は、同一の手順に従って前記各テーブルの更新処
理を行うことを特徴とするデータ圧縮・復元システム。
【請求項６】前記データ入力手段により入力された前記
単位データが前記圧縮用テーブル内に登録されているか
否かを判断するデータ登録有無判断手段を更に備えると
ともに、前記圧縮用テーブルには初期状態において終了記号と未
出現記号のみが登録されており、前記符号化手段は、前記データ登録有無判断手段によっ
て前記単位データが前記圧縮用テーブル内に登録されて
いないと判断された時には、前記未出現記号に対応する
順位を求めてこの順位に対応する符号を出力した後に、
前記単位データ自体を出力し、前記圧縮用テーブル更新手段は、前記符号化手段が前記
未出現記号に対応する符号と前記単位データ自体とを出
力した時には、前記圧縮用テーブル内における前記未出
現記号の順位をその順位のみに基づいて自己組織的に変
更した後に、前記単位データを前記圧縮用テーブルに登
録することを特徴とする請求項１記載のデータ圧縮装
置。
【請求項７】前記復元用テーブルには初期状態において
終了記号と未出現記号のみが登録されており、前記データ復元手段は、前記復元用テーブル内において
前記符号に対応する順位が前記未登録符号に対応してい
る場合には、前記符号の直後に入力された前記単位デー
タをそのまま出力し、前記復元用テーブル更新手段は、前記データ復元手段が
符号の直後に入力された前記単位データをそのまま出力
した時には、前記復元用テーブル内における前記未出現
記号の順位をその順位のみに基づいて自己組織的に変更
した後に、前記単位データを前記復元用テーブルに登録
することを特徴とする請求項２記載のデータ復元装置。
【請求項８】請求項６記載のデータ圧縮装置と請求項７
記載のデータ復元装置とからなるデータ圧縮・復元シス
テムであって、前記圧縮用テーブルの内容と前記復元用テーブルの内容
とが同一であるとともに、前記圧縮用テーブル更新手段及び前記復元用テーブル更
新手段は、同一の手順に従って前記各テーブルの更新処
理を行うことを特徴とするデータ圧縮・復元システム。
【請求項９】前記圧縮用テーブル更新手段及び前記復元
用テーブル更新手段は、前記単位データが登録された節
点を処理対象節点とするとともに、この処理対象節点を
１つ上の順位の節点と入れ替える更新処理を行うことを
特徴とする請求項５又は８記載のデータ圧縮・復元シス
テム。
【請求項１０】前記圧縮用テーブル更新手段及び前記復
元用テーブル更新手段は、前記単位データが登録された
節点を処理対象節点とするとともに、この処理対象節点
を複数個順位が上の位置に挿入するとともにこの挿入し
た位置から元の位置までにあった他の節点の順位を１つ
づつ繰り下げる更新処理を行うことを特徴とする請求項
５又は８記載のデータ圧縮・復元システム。
【請求項１１】前記圧縮用テーブル更新手段及び前記復
元用テーブル更新手段は、前記単位データが登録された
節点を処理対象節点とするとともに、根に対して同じだ
け離れた同一レベル内においてこの処理対象節点が最高
順位にある場合にはこの処理対象節点を１つ上の順位の
節点と入れ替え、前記同一レベル内においてこの処理対
象節点が最高順位以外にある場合にはこの処理対象節点
を前記最高順位の位置に挿入するとともにこの挿入した
位置から元の位置までにあった他の節点の順位を一つづ
つ繰り下げる更新処理を行うことを特徴とする請求項５
又は８記載のデータ圧縮・復元システム。
【請求項１２】前記圧縮用テーブル更新手段及び前記復
元用テーブル更新手段は、更新処理がなされた節点より
も前記根側に接続されている節点を新たな処理対象節点
として、この処理対象節点に対して前記更新処理を行う
ことを特徴とする請求項１０乃至１１の何れかに記載の
データ圧縮・復元システム。
【請求項１３】前記圧縮用テーブル更新手段及び前記復
元用テーブル更新手段は、前記処理対象節点，及びこの
処理対象節点の１つ上の順位の節点が共に末端の節点で
ない場合には、前記更新処理を行わないことを特徴とす
る請求項１２記載のデータ圧縮・復元システム。
【請求項１４】前記圧縮用テーブル更新手段及び前記復
元用テーブル更新手段は、前記単位データが登録された
節点を根の次の順位の位置に挿入する更新処理を行うこ
とを特徴とする請求項５又は８記載のデータ圧縮・復元
システム。
【請求項１５】前記圧縮用テーブル更新手段及び前記復
元用テーブル更新手段は、前記単位データが登録された
節点を、根に対して同じだけ離れた同一レベル内におい
て最高順位の位置に挿入するとともにこの挿入した位置
から元の位置までにあった他の節点の順位を一つづつ繰
り下げる挿入処理と一つ上の順位の節点と入れ替える交
換処理とを繰り返すことによって、前記単位データが登
録された節点を前記根の次の順位の位置まで移動させる
更新処理を行うことを特徴とする請求項５又は８記載の
データ圧縮・復元システム。
【請求項１６】前記圧縮用テーブル更新手段及び前記復
元用テーブル更新手段は、未出現記号の節点を分岐し、
この分岐によって生成された２本の枝の末端の節点に前
記実出現記号及び前記単位データを登録することを特徴
とする請求項８記載のデータ圧縮・復元システム。
【請求項１７】前記圧縮用テーブル更新手段及び前記復
元用テーブル更新手段は、前記各テーブルを構成する節
点のうち末端でない最下位の節点の次の順位に位置する
末端の節点を分岐し、この分岐によって生成された枝の
末端の節点に前記単位データを登録することを特徴とす
る請求項８記載のデータ圧縮・復元システム。
【請求項１８】過去に現われたシンボルの直前の文脈で
の条件付出現状況に応じて動的に符号化を行うデータ圧
縮装置において、過去に表れた文脈を０次から一定次数までの範囲で木構
造に登録した文脈木，及びこの文脈木の各次数のシンボ
ル毎にそのシンボルに続くシンボル及び未出現記号の順
位を定めて符号を割り当てた符号木を格納した圧縮用テ
ーブルと、圧縮対象のシンボルを入力する入力手段と、前記シンボルがその末端に存在する前記一定次の文脈を
前記文脈木から探す文脈検索手段と、前記一定次から前記シンボルが存在する次数までの文脈
に対応している各符号木を参照して未出現記号の順位を
随時符号化する未出現記号順位符号化手段と、前記文脈
検索手段によって探し出された前記文脈下において前記
シンボルを登録している最高次数の符号木を参照して前
記シンボルの順位を符号化するシンボル順位符号化手段
と、前記参照された符号木中での前記シンボルの順位のみに
基づいて、この符号木内における前記シンボルの順位を
自己組織的に更新する符号木順位更新手段と、前記参照
された各符号木内での前記未出現記号の順位のみに基づ
いて、これら各符号木内における前記未出現記号の順位
を自己組織的に更新する未出現記号順位更新手段とを有
することを特徴とするデータ圧縮装置。
【請求項１９】過去に現われたシンボルの直前の文脈で
の条件付出現状況に応じて、動的に、入力された符号を
複合化したシンボルを出力するデータ復元装置におい
て、過去に表れた文脈を０次から一定次数までの範囲で木構
造に登録した文脈木，及びこの文脈木の各次数のシンボ
ル毎にそのシンボルに続くシンボル及び未出現記号の順
位を定めて符号を割り当てた符号木を格納した復元用テ
ーブルと、復元対象の符号を入力する入力手段と、前記シンボルがその末端に存在すると予想される前記一
定次の文脈を前記文脈木から探す文脈検索手段と、前記シンボルが存在すると予想される前記一定次の文脈
下に存在する符号木に基づいて、前記符号から前記シン
ボルの順位を復号化するシンボル順位復号化手段と、このシンボル順位復号化手段によって復号された結果未
出現記号が得られた場合には、前記シンボル順位復号化
手段に対して、前記符号木の次数よりも一つ小さい次数
の符号木を参照して前記シンボル順位の復号化を行わし
めるシンボル順位再復号化手段と、前記参照された符号木内での前記シンボルの順位のみに
基づいて、この符号木内における前記シンボルの順位を
自己組織的に更新する符号木順位更新手段と、前記参照
された各符号木中での前記未出現記号の順位のみに基づ
いて、これら各符号木内における前記未出現記号の順位
を自己組織的に更新する未出現記号順位更新手段とを有
することを特徴とするデータ復元装置。
【請求項２０】請求項１８記載のデータ圧縮装置と請求
項１９記載のデータ復元装置とからなるデータ圧縮・復
元システムであって、前記圧縮用デーブルの内容と前記復元用テーブルの内容
とが同一であるとともに、前記データ圧縮装置と前記データ復元装置における前記
各符号木順位更新手段，及び、前記各未出現順位更新手
段は、夫々同一の処理を行うことを特徴とするデータ圧
縮・復元システム。
【請求項２１】初期状態において、前記符号木には終了
記号を含む全出現シンボルが登録されていることを特徴
とする請求項２０記載のデータ圧縮・復元システム。