JPH08293800A

JPH08293800A - データ圧縮方法及びデータ圧縮装置、並びにデータ復元方法及びデータ復元装置

Info

Publication number: JPH08293800A
Application number: JP7271577A
Authority: JP
Inventors: Hironori Yahagi; 裕紀矢作; Nobuko Sato; 宣子佐藤; Yoshiyuki Okada; 佳之岡田; Shigeru Yoshida; 茂吉田
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1995-02-21
Filing date: 1995-10-19
Publication date: 1996-11-05
Anticipated expiration: 2015-10-19
Also published as: JP3238854B2; US5801648A

Abstract

(57)【要約】【課題】少ないメモリでも良いデータ圧縮率が得ら
れ、また、文頭に顕著な文脈が現れていない場合や文脈
自体が変化した場合にも良い圧縮率を得ることができる
データ圧縮方法を提供することを第１の課題とする。【解決手段】データ列を登録するデータ列登録部を用
いると共に、未登録を示すデータが予め含まれて構成さ
れたデータ列の符号化情報を登録する符号情報登録部を
用い、符号化情報は、入力データの履歴に応じて符号化
されるデータ圧縮方法において、新規に入力されたデー
タの直前に入力されたデータ列を文脈とするとき、文脈
と新規入力データからなる符号化対象データ列をデータ
列登録部に新規登録するデータ列新規登録過程と、符号
化対象データ列を符号化した情報を符号情報登録部に新
規登録する符号情報新規登録過程と、符号情報登録部に
登録された符号情報を出力する符号情報出力過程と、符
号情報登録部を更新する符号情報更新過程とを備えて構
成した。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、データ圧縮方法、
データ復元方法、データ圧縮装置及びデータ復元装置に
関する。

【０００２】

【従来の技術】近年、文字コード、画像データ等の様々
な種類のデータがコンピュータで扱われるのに伴って、
取り扱われるデータ量も急速に増加してきている。大量
のデータを扱う場合、データ中の冗長な部分を省いてデ
ータ量を圧縮することにより、記憶容量を減らしたり、
早く伝送したりできるようになる。

【０００３】ここで、データの種類を問わずに圧縮でき
る方法として、ユニバーサル符号化方式が提案されてい
る。ユニバーサル符号化方式にはデータ系列の類似性を
利用した辞書型符号化方式と、データ列の出現頻度を利
用した確率統計型符号化方式がある。そして、確率統計
型符号化方式には、算術符号化方式、スプレー符号化方
式、ブレンドスプレー符号化方式等が存在する。

【０００４】以下、算術符号化方式、スプレー符号化方
式、ブレンドスプレー符号化方式について説明する。な
お、本明細書では、１ワード単位のデータを文字（アル
ファベット）と呼び、任意のワード単位でつながったデ
ータを文字列と呼ぶ。（算術符号化方式）算術符号化方式は、情報源の文字の
出現頻度が既知の場合に、最大効率で圧縮できる符号化
方式であり、２値で算術符号化する方式（２値算術符号
化方式）と３値以上で算術符号化する方式（多値算術符
号化方式）とが存在する（例えば、Bell,T.C.,Cleary,
J.G.,and Witten,I.H(1990) “Text Compression”,Pre
nticeHallや“Arithmetic Cording for Data Compressi
on”IAN H.WITTEN他著Commun.of ACM Vol.130 No.6 P52
0-540,“An Adaptive DependencySorce Model for Data
Compression Scheme”D.M.Abrahamson著Commun.of ACM
Vol.132 No.1 P77-83を参照）。

【０００５】以下、図１を参照して多値算術符号化方式
について説明する。なお、２値で算術符号化する方式に
ついては、多値算術符号化方式の特別な場合と考えるこ
とができる。

【０００６】まず、多値算術符号化では、数直線０≦Ｐ
＜１（以下、［０，１）と記述する）を、出現した文字
（以下、シンボルと称する）の事象数で分割する。数直
線上のシンボルの幅（区間）は、出現頻度に比例する。
最初に、出現したシンボルの区間を選択し、次に選択し
た区間をさらに［０，１）のときと同様に全シンボルで
分割する。さらに分割した区間について、第２に出現し
たシンボルの区間を選択する。以後、全入力データにつ
いて先の処理を繰り返すことで符号化する文字列の区間
を決定する。このようにして最終的に定まった区間内の
任意の点を、２進数で表示したときの小数点以下が、符
号として出力される。

【０００７】ここで、出現頻度に応じて区間を分割する
方式としては、静的符号化方式(static)、準適応型符号
化方式(semi-adaptive)及び適応型符号化方式(adaptiv
e)の３つの方式が知られている。

【０００８】静的符号化方式では、実際の文字の出現頻
度によらず、予め設定した出現頻度に従って区間を分割
する。準適応型符号化方式では、最初に全文字列を走査
して得た出現頻度に従って、区間を分割する。

【０００９】適応型符号化方式では、文字が出現するご
とに文字の頻度を再計算し、再計算した出現頻度に従っ
て区間を分割する。なお、符号化することにより圧縮さ
れたデータは、符号に従って数直線上の区間を徐々に限
定することにより復号される（以下、このことを復元と
いう）。復元では、符号化の場合と同一の出現頻度を計
算することで、符号化の場合と同じ分割区間が常に得ら
れる。

【００１０】（スプレー符号化方式）スプレー符号化方
式は、木構造で表された符号表を表す符号木を用いる符
号化方式である。スプレー符号化方式では、符号木の終
端節点（葉又はリーフという）に文字を登録し、符号木
の頂点（根又はルートという）から記号が登録されてい
る葉までの経路に割り当てられた値を符号として出力す
る。また、スプレー符号化方式では、根から文字が登録
されている葉までの距離を符号長とする。

【００１１】符号は、具体的には、下記のように割り当
てられいる。即ち、根から葉へ下るとき、右へ分岐する
経路には“１”が割り当てられ、左へ分岐する経路には
“０”が割り当てられる。例えば図２（ａ）に示す符号
木の場合、文字Ａの符号は“００”であり、記号Ｅの符
号は“１１００”である。

【００１２】そして、スプレー符号化方式では、出現頻
度が高い文字ほど符号長が短くなるように、具体的に
は、符号長が半分になるように符号木を組み替える処理
（スプレー処理）が行われる。スプレー処理は、言い換
えれば、出現頻度が高い文字に短い符号が割り当てられ
るようする処理である。

【００１３】スプレー処理では、符号化した葉と他の葉
を入れ替えたり、符号木上の節点（ノードという）を入
れ替えたりすることで行われる。スプレー処理の一例を
図２（ｂ）を参照して説明する。

【００１４】まず、スプレー処理を行う以前は、根から
文字Ｅが登録された葉までの距離は“４”である。ここ
で、スプレー処理として、文字Ｅが登録された葉と文字
Ｇが登録された葉を入れ替えるるとともに、入れ替えた
後の葉を接続する節点と文字Ａ，Ｂ，Ｃを接続する節点
とを組み替える。このようなスプレー処理を行った後で
は、根から文字Ｅが登録された葉までの距離は“２”に
なり、スプレー処理を行う前に比べ半分になっているこ
とがわかる。

【００１５】なお、スプレー符号化方式に関しては、例
えば、文献“Application of SplayTree to Data Compr
ession”Douglas W.Jones著Commun. of ACM Vol.131 N
o.8P996-1007を参照することが好ましい。

【００１６】（ブレンドスプレー符号化方式）ブレンド
スプレー符号化方式は、ブレンドモデルと呼ばれるモデ
ルを利用してて符号化する方式である。

【００１７】以下、「文脈」の概念、「次数」の概念、
ブレンドモデルの概念及びブレンドスプレー符号化の概
念について説明する。スプレー符号化方式では、一文字
毎の出現確率に基づいて動的に可変長符号化されていた
が、ブレンドスプレー符号化方式では、データの圧縮率
を高めるため、直前に出現した文字列（「文脈」とい
う）と、文脈の直後に出現した文字（符号化対象文字）
との前後関係を取り入れた条件付き出現確率を用いて可
変長符号化される。

【００１８】まず、文脈（例えば、図３（ａ）に示され
る“ａｂｃ”）及び符号化対象文字（例えば、図３
（ｂ）に示される“ｃ”）は、図３（ｂ）に示すような
木構造（以下、文脈木という）で表され、条件付き出現
確率は、文脈木の各節点に表された文字を有する文字列
が出現する毎に、その出現回数を各節点で計数しておく
ことで求められる。ここで、文脈に含まれる文字の数を
「次数」という。

【００１９】図３（ｂ）で、０次、１次、２次と記され
ている部分は、それぞれ、rootと記された位置からの距
離が０、１、２であることを示している。そして、０次
と記された場所には、出現する可能性がある全ての文字
が示されており、１次と記された場所には、０次に示さ
れた文字に続いて出現する文字が示されており、２次と
記された場所には、１次に示された場所に続いて出現す
る文字が示されている。例えば、２次の場所で矢印で示
された箇所にある文字“ｃ”は、１次の文字“ｂ”に続
いて出現したものであり、１次の文字“ｂ”は、０次の
文字“ａ”に続いて出現したものである。従って、矢印
で示された２次の文字“ｃ”は、文字列“ａｂ”に続い
て出現したことになる。

【００２０】また、図３（ｂ）で、各次数の文字の下側
に記されたＰ（）は、先に説明した、文脈と符号化対象
文字との前後関係を取り入れた条件付き出現確率を表し
ている。例えば、Ｐ（y|X1,X2）の場合、文字X1の後に
文字X2が出現し、さらにその直後に文字y が出現する条
件付き出現確率を表している。

【００２１】ブレンドモデルは、複数の次数の文脈とそ
の文脈に続く文字とを登録（保持）するものである。ブ
レンドモデルの「ブレンド」は、異なる次数の文脈が混
合されていることに由来する。なお、ブレンドモデル
は、ブレンドスプレー符号化のみに用いられるわけでは
なく、他の符号化でも用いられる。

【００２２】ブレンドモデルにおける文字の登録方法
は、逐次登録型、即ち、データ中に出現した文脈に従い
１次ずつ次数をあげる方法を採用する場合がある。ただ
し、初期状態では、出現可能なすべての文字が予め登録
される。

【００２３】例えば、出現可能な文字が“Ａ”、“Ｂ”
及び“Ｃ”の３文字であり、文字列“ＡＡＢＡＢＣ”が
出現した場合、図４（ｂ）に示す文脈木のように、既に
登録済みの次数よりも１つ高い次数を持つ文脈（“Ａ
Ａ”、“ＡＢ”、“ＢＡ”及び“ＢＡＢ”）が登録され
る。

【００２４】なお、ブレンドモデルでは、図５（ａ）に
示すように、葉を持つ節点に未出現文字を表す“ＥＳ
Ｃ”（エスケープコードとも呼ばれる）を登録すること
がある。図５（ａ）の各節点に付された番号は、文脈木
ノード番号と呼ばれるもので、辞書（データを集合させ
たもの）の中で、各節点を区別するのに用いられる。

【００２５】そして、逐次登録型と対比される文字の登
録方法に、全登録型がある。この方法は、例えば、符号
化済みデータ中の全ての０次、１次及び２次（以下、０
／１／２次と表す）文脈を登録する。例えば、出現可能
な文字が“Ａ”、“Ｂ”及び“Ｃ”の３文字であり、文
字列“ＡＡＢＡＢＣ”が出現した場合、図４（ａ）に示
すように、０次の文脈“Ａ”、“Ｂ”及び“Ｃ”、１次
の文脈“ＡＡ”、“ＡＢ”、“ＢＡ”及び“ＡＢ”、並
びに２次の文脈“ＡＡＢ”、“ＡＢＡ”及び“ＢＡＢ”
が登録される。

【００２６】次に、ブレンドスプレー符号化について説
明する。ブレンドスプレー符号化は、原理的には、スプ
レー符号化と同様の符号化であり、出現可能な全ての文
字、即ち全ての０次の文脈を符号木に初期登録する（図
６（ｃ）参照）。

【００２７】そして、図６（ａ）及び図６（ｂ）に示す
ように、１次以上の文脈の記号を登録する節点の葉に
は、実際に出現した文字と、実際に出現した文字以外の
文字が出現していないことを表す“ＥＳＣ”（エスケー
プ符号又は未出現符号と呼ばれる）とが登録される。

【００２８】ブレンドスプレー符号化では、以下のよう
な基準で符号が出力される。１）出現した文字（符号化対象文字）が符号木上に登録
されていれば、その登録位置の葉に割り当てられた符号
を出力する。

【００２９】２）符号化対象文字が符号木上に登録され
ていなければ、ＥＳＣを出力する。３）１）及び２）の処理後、一つ下の次数の文脈、即
ち、現在の文脈から先頭文字を除いてできる新たな文脈
の後に、符号化対象文字が出現したとして、文脈が０次
になるまでの、１）及び２）の処理を繰り返す。

【００３０】図６で２次の文脈ａａに続く文字“ｄ”を
符号化する場合、符号化文字“ｄ”は０次の文脈として
のみ登録されているので、２次の文脈で登録されていな
いことを示すＥＳＣ（符号は１１）を最初に出力する
（図６（ａ）参照）。そして、１次の文脈で登録されて
いないことを示すＥＳＣ（符号は１１）を出力する（図
６（ｂ）参照）。最後に、０次の文脈に登録されている
ことを示す符号ｄ［．．．１１］を出力する（図６
（ｃ）参照）。総括すると、符号列（１１１１００．．
１１）が出力される。

【００３１】そして、スプレー符号化では、符号化対象
文字を符号化後に、符号化した次数の一つ上の次数の符
号木に符号化対象文字を新たに登録する。この登録は、
符号木内のＥＳＣを新たなＥＳＣと新規の葉とに分岐さ
せ、新しく作られた葉に符号化対象文字を登録すること
や、符号化した次数より一つ上の次数の文脈に対応する
文脈木上に符号化対象文字を新たに登録することで行わ
れる。

【００３２】

【発明が解決しようとする課題】確率統計型圧縮方式
は、統計的な各文字の出現頻度に従い、出現確率の高い
文字に対して短い符号長を割り振ることによって圧縮効
果を得ている。ここで、一文字毎の出現確率(P(y))では
なく、文脈を取り入れた条件付出現確率（例えば、２次
の文脈だとP(y|x1,x2)）に基づいて可変長符号化すると
一層の圧縮効果を得ることができる。

【００３３】一方、適応型符号化方式は、出現した文脈
と符号化対象文字の組み合わせ全てを文脈木と符号表に
順次登録し、登録済みの組に対してはその文字の符号長
が短くなるように、その文脈の符号表を更新する。ここ
で、次数を高くするのに伴って文脈木が大きくなるた
め、メモリ上の制限から、全ての条件付出現確率を追跡
することができなくなる。

【００３４】この問題は今までも指摘されてきたが、具
体的な対処方法が示されていなかった。このため、文頭
に出現した文脈と符号化対象文字の組み合わせ全てをメ
モリ上限まで登録した後は、新たな登録をせず、既に登
録済みの組の符号長更新のみを行っていた。

【００３５】従って、登録された文脈が文頭に現れてい
ない場合には、良い圧縮率が得られなかった。また、文
脈自体が変化した場合にも、良い圧縮率が得られなかっ
た。一方、ブレンドモデルを利用して符号・復号化する
方式では、ブレンドモデルに多数のＥＳＣが登録される
ため（図５参照）、符号・復号化時に大容量の作業領域
を必要としている。

【００３６】本発明は、このような事情に鑑みてなされ
たもので、少ないメモリでも良いデータ圧縮率が得ら
れ、また、文頭に顕著な文脈が現れていない場合や文脈
自体が変化した場合にも良い圧縮率を得ることができる
データ圧縮方法を提供することを第１の課題とする。

【００３７】また、本発明は、ブレンドモデルを利用し
て符号・復号化する場合でも大容量の作業領域を必要と
せず、効率の良い辞書容量を達成できるデータ圧縮方法
及びデータ復号方法、並びに、データ圧縮装置及びデー
タ復元装置を提供することを第２の課題とする。

【００３８】

【課題を解決するための手段】

《本発明の第１のデータ圧縮方法》本発明の第１のデー
タ圧縮方法は、前述した第１の課題を解決するため、下
記の如く構成されている（請求項１に対応）。

【００３９】即ち、データ列を登録するデータ列登録部
を用いると共に、未登録を示すデータが予め含まれて構
成されたデータ列の符号化情報を登録する符号情報登録
部を用い、前記符号化情報は、入力データの履歴に応じ
て符号化されるデータ圧縮方法において、新規に入力さ
れたデータの直前に入力されたデータ列を文脈とすると
き、データ列新規登録過程、符号情報新規登録過程、符
号情報出力過程及び符号情報更新過程を備えている。

【００４０】（データ列登録部）データ列登録部は、デ
ータ列を登録する。データは、アルファベット、数字、
ひらがな、かたかな、記号等を使用することができる。

【００４１】また、データ列登録部は、例えば、ＲＡＭ
（Random Access Memory）、半導体記憶装置、磁気ディ
スク記憶装置、磁気テープ装置、Ｍ／Ｏ（Magnet Optic
al；光磁気ディスク装置）、Ｉ／Ｃカード等を利用する
ことができる。

【００４２】そして、データ列登録部には、データ列の
出現回数を登録することが好ましい。さらに、データ列
登録部は、木構造、表形式で構成することができる。

【００４３】（符号情報登録部）符号情報登録部は、未
登録を示すデータ、例えばエスケープコード（ＥＳＣ）
が予め含まれて構成されたデータ列の符号化情報を登録
する。前記符号化情報は、データ列の出現頻度に基づい
て符号化される。

【００４４】また、符号情報登録部は、例えば、ＲＡ
Ｍ、半導体記憶装置、磁気ディスク記憶装置、磁気テー
プ装置、Ｍ／Ｏ、Ｉ／Ｃカード等を利用することができ
る。そして、符号情報登録部には、符号情報の出現回数
を登録することが好ましい。

【００４５】さらに、符号情報登録部は、木構造、表形
式で構成することができる。（データ列新規登録過程）データ列新規登録過程では、
前記文脈と新規入力データからなる符号化対象データ列
を前記データ列登録部に新規登録する。

【００４６】そして、データ列新規登録過程では、前記
符号化対象データ列が１回目に出現した時点で、その符
号化対象データ列を前記データ列登録部に新規登録す
る。（符号情報新規登録過程）符号情報新規登録過程では、
前記符号化対象データ列を符号化した情報を前記符号情
報登録部に新規登録する。

【００４７】そして、符号情報新規登録過程では、前記
符号化対象データ列が２回目に出現した時点で、その符
号化対象データ列を符号化した情報を前記符号情報登録
部に新規登録する。

【００４８】（符号情報出力過程）符号情報出力過程で
は、前記符号情報登録部に登録された符号情報を出力す
る。

【００４９】（符号情報更新過程）符号情報更新過程で
は、前記符号情報登録部を更新する。《本発明の第２のデータ圧縮方法》本発明の第２のデー
タ圧縮方法は、前述した第１の課題を解決するため、下
記の如く構成されている（請求項２に対応）。

【００５０】即ち、第１のデータ圧縮方法において、前
記データ列登録部はデータ列の出現回数を一定数まで監
視し、前記符号情報新規登録過程では、出現回数が所定
数を越えて登録されている符号化対象データ列の符号化
情報のみを新規登録することである（請求項２に対
応）。《本発明の第３のデータ圧縮方法》本発明の第３のデー
タ圧縮方法は、前述した第１の課題を解決するため、下
記の如く構成されている（請求項３に対応）。

【００５１】即ち、データ列登録部を用いると共に、符
号情報登録部を用い、前記符号化情報は、入力データの
履歴に応じて符号化されるデータ圧縮方法において、新
規に入力されたデータの直前に入力されたデータ列を文
脈とするとき、データ列新規登録過程、符号情報新規登
録過程、符号情報更新過程及びデータ列・符号情報削除
過程を備えている。

【００５２】（データ列登録部）データ列登録部は、デ
ータ列を登録する。データは、アルファベット、数字、
ひらがな、かたかな、記号等を使用することができる。

【００５３】また、データ列登録部は、例えば、ＲＡ
Ｍ、半導体記憶装置、磁気ディスク記憶装置、磁気テー
プ装置、Ｍ／Ｏ、Ｉ／Ｃカード等を利用することができ
る。そして、データ列登録部には、データ列の出現回数
を登録することが好ましい。

【００５４】さらに、データ列登録部は、木構造、表形
式で構成することができる。（符号情報登録部）符号情報登録部は、未登録を示すデ
ータ、例えばエスケープコード（ＥＳＣ）が予め含まれ
て構成されたデータ列の符号化情報を登録する。前記符
号化情報は、データ列の出現頻度に基づいて符号化され
る。

【００５５】また、符号情報登録部は、例えば、ＲＡ
Ｍ、半導体記憶装置、磁気ディスク記憶装置、磁気テー
プ装置、Ｍ／Ｏ、Ｉ／Ｃカード等を利用することができ
る。そして、符号情報登録部には、符号情報の出現回数
を登録することが好ましい。

【００５６】さらに、符号情報登録部は、木構造、表形
式で構成することができる。（データ列新規登録過程）データ列新規登録過程では、
前記文脈と新規入力データからなる符号化対象データ列
を前記データ列登録部に新規登録する。

【００５７】（符号情報新規登録過程）符号情報新規登
録過程では、前記符号化対象データ列を符号化した情報
を前記符号情報登録部に新規登録する。

【００５８】（符号情報出力過程）符号情報出力過程で
は、前記符号情報登録部に登録された符号情報を出力す
る。

【００５９】（符号情報更新過程）符号情報更新過程で
は、前記符号情報登録部を更新する。（データ列・符号情報削除過程）データ列・符号情報削
除過程では、前記データ列登録部に登録されているデー
タ列を削除すると共に、前記符号情報登録部に登録され
ている符号化情報を削除する。《本発明の第４のデータ圧縮方法》本発明の第４のデー
タ圧縮方法は、前述した第１の課題を解決するため、下
記の如く構成されている（請求項４に対応）。

【００６０】即ち、第３のデータ圧縮方法において、前
記データ列・符号情報削除過程は、前記データ列登録部
に登録されているデータ列及び前記符号情報登録部に登
録されている符号化情報を初期化するか否かを判断する
初期化判断過程と、前記初期化判断過程で、データ列及
び符号化情報を初期化すると判断した場合に、前記デー
タ列登録部に登録されているデータ列を初期化すると共
に、前記符号情報登録部に登録されている符号化情報を
初期化する初期化過程とを有する。《本発明の第５のデータ圧縮方法》本発明の第５のデー
タ圧縮方法は、前述した第１の課題を解決するため、下
記の如く構成されている（請求項５に対応）。

【００６１】即ち、第４のデータ圧縮方法において、前
記初期化施行判断過程では、新規入力データの容量の累
積値を計数し、計数値が一定量を越えるごとに、前記初
期化過程を施行する。《本発明の第６のデータ圧縮方法》本発明の第６のデー
タ圧縮方法は、前述した第１の課題を解決するため、下
記の如く構成されている（請求項６に対応）。

【００６２】即ち、第４のデータ圧縮方法において、前
記削除施行判断過程では、データ圧縮率を監視し、この
データ圧縮率が低下した場合に、前記初期化過程を施行
する。《本発明の第７のデータ圧縮方法》本発明の第７のデー
タ圧縮方法は、前述した第１の課題を解決するため、下
記の如く構成されている（請求項７に対応）。

【００６３】即ち、第４のデータ圧縮方法において、前
記初期化施行判断過程では、前記データ列登録部におけ
る全登録数が新規登録の際に一定数を超える場合に、前
記初期化過程を施行する。《本発明の第８のデータ圧縮方法》本発明の第８のデー
タ圧縮方法は、前述した第１の課題を解決するため、下
記の如く構成されている（請求項８に対応）。

【００６４】即ち、第３のデータ圧縮方法において、前
記データ列・符号情報削除過程は、前記データ列登録部
に登録されているデータ列及び前記符号情報登録部に登
録されている符号化情報を削除するか否かを判断する削
除判断過程と、前記削除施行判断過程で、削除すると判
断した場合に、削除するデータ列及び符号化情報を選別
する削除対象選別過程と、前記削除対象選別過程で選別
されたデータ列及び前記符号化情報を、それぞれ前記デ
ータ列登録部及び前記符号情報登録部から削除する削除
過程とを有する。《本発明の第９のデータ圧縮方法》本発明の第９のデー
タ圧縮方法は、前述した第１の課題を解決するため、下
記の如く構成されている（請求項９に対応）。

【００６５】即ち、第８のデータ圧縮方法において、前
記削除対象選別過程では、前記データ列登録部を木構造
でみた場合に、木の内部節点であるノード及び木の終端
であるリーフを指すポインタ全てを削除順位リストに登
録し、この削除順位リストで低位に登録されたポインタ
が指すデータ列及び符号化情報を前記削除過程にて削除
する。《本発明の第１０のデータ圧縮方法》本発明の第１０の
データ圧縮方法は、前述した第１の課題を解決するた
め、下記の如く構成されている（請求項１０に対応）。

【００６６】即ち、第８のデータ圧縮方法において、前
記削除対象選別過程では、前記データ列登録部を木構造
でみた場合に、木の終端であるリーフを指すポインタを
一つの削除順位リストに登録し、この削除順位リストで
低位に登録されたポインタが指すデータ列及び符号化情
報を前記削除過程にて削除する。《本発明の第１１のデータ圧縮方法》本発明の第１１の
データ圧縮方法は、前述した第１の課題を解決するた
め、下記の如く構成されている（請求項１１に対応）。

【００６７】即ち、第９のデータ圧縮方法において、前
記削除対象選別過程では、前記ポインタの出現回数を監
視して、出現回数の高いポインタを前記削除順位リスト
の高位に登録する。《本発明の第１２のデータ圧縮方法》本発明の第１２の
データ圧縮方法は、前述した第１の課題を解決するた
め、下記の如く構成されている（請求項１２に対応）。

【００６８】即ち、第８のデータ圧縮方法において、前
記削除対象選別過程では、新規登録のリーフに相当する
ポインタを前記削除順位リストの最高順位に登録し、新
規登録によってリーフが内部ノードになった場合には、
その内部ノードになったものを指すポインタを削除す
る。《本発明の第１３のデータ圧縮方法》本発明の第１３の
データ圧縮方法は、前述した第１の課題を解決するた
め、下記の如く構成されている（請求項１３に対応）。

【００６９】即ち、第８のデータ圧縮方法において、前
記削除対象選別過程では、新規登録のリーフに相当する
ポインタを前記削除順位リストの最高順位に登録し、そ
のリーフの親及び先祖に相当する内部ノードを指すポイ
ンタの順位を繰り下げる。《本発明の第１４のデータ圧縮方法》本発明の第１４の
データ圧縮方法は、前述した第１の課題を解決するた
め、下記の如く構成されている（請求項１４に対応）。

【００７０】即ち、第８のデータ圧縮方法において、前
記削除対象選別過程では、新規登録のリーフに相当する
ポインタを前記削除順位リストの最低順位に登録し、新
規登録によってリーフが内部ノードになった場合には、
その内部ノードになったものを指すポインタを削除す
る。《本発明の第１５のデータ圧縮方法》本発明の第１５の
データ圧縮方法は、前述した第１の課題を解決するた
め、下記の如く構成されている（請求項１５に対応）。

【００７１】即ち、第８のデータ圧縮方法において、前
記削除対象選別過程では、新規登録のリーフに相当する
ポインタを前記削除順位リストの最低順位に登録し、そ
のリーフの親及び先祖に相当する内部ノードを指すポイ
ンタの順位を繰り下げる。《本発明の第１６のデータ圧縮方法》本発明の第１６の
データ圧縮方法は、前述した第１の課題を解決するた
め、下記の如く構成されている（請求項１６に対応）。

【００７２】即ち、第８のデータ圧縮方法において、前
記削除対象選別過程では、新規登録のリーフに相当する
ポインタを前記削除順位リストの最低順位に登録し、新
規登録によってリーフが内部ノードになった場合には、
その内部ノードになったものを指すポインタを削除す
る。《本発明の第１７のデータ圧縮方法》本発明の第１７の
データ圧縮方法は、前述した第１の課題を解決するた
め、下記の如く構成されている（請求項１７に対応）。

【００７３】即ち、第８のデータ圧縮方法において、前
記削除対象選別過程では、新規登録のリーフに相当する
ポインタを前記削除順位リストの最低順位に登録し、そ
のリーフの親及び先祖に相当する内部ノードを指すポイ
ンタの順位を繰り下げる。《本発明の第１８のデータ圧縮方法》本発明の第１８の
データ圧縮方法は、前述した第１の課題を解決するた
め、下記の如く構成されている（請求項１８に対応）。

【００７４】即ち、第８のデータ圧縮方法において、前
記削除対象選別過程では、出現回数が所定値以下となっ
たデータ列及び符号化情報を削除対象として選別する。《本発明の第１９のデータ圧縮方法》本発明の第１９の
データ圧縮方法は、前述した第１の課題を解決するた
め、下記の如く構成されている（請求項１９に対応）。

【００７５】即ち、第８のデータ圧縮方法において、前
記削除対象選別過程では、ある文脈の出現回数の合計値
を求め、前記文脈に続いて入力されたデータの出現回数
が前記合計値に対して所定比以下となる場合に、該デー
タを削除対象として選別する。《本発明の第２０のデータ圧縮方法》本発明の第２０の
データ圧縮方法は、前述した第１の課題を解決するた
め、下記の如く構成されている（請求項１８に対応）。

【００７６】即ち、第８のデータ圧縮方法において、前
記削除施行判断過程では、前記データ列登録部における
登録数を監視し、新規登録の際にこの数が一定数を超え
る場合、前記削除対象選別過程において選別された削除
対象の一つを前記削除過程で削除し、換わりに新規登録
の組を登録する。《本発明の第２１のデータ圧縮方法》本発明の第２１の
データ圧縮方法は、前述した第１の課題を解決するた
め、下記の如く構成されている（請求項２１に対応）。

【００７７】即ち、第８のデータ圧縮方法において、前
記削除過程では、前記データ列登録部に登録されている
データ列の半分を削除し、削除されたデータ列に対応す
る符号化情報を前記符号情報登録部から削除する。《本発明の第２２のデータ圧縮方法》本発明の第２２の
データ圧縮方法は、前述した第１の課題を解決するた
め、下記の如く構成されている（請求項２２に対応）。

【００７８】即ち、第３のデータ圧縮方法において、前
記データ列・符号情報削除過程は、削除するデータ列及
び符号化情報を選別する削除対象選別過程を有し、新規
登録の際に、前記データ列登録部の登録数が所定数を越
えていれば、削除対象選別過程で選別された削除対象の
一つを削除すると共に新規登録の組を登録し、データ圧
縮率が低減していれば、全削除を行う。《本発明の第２３のデータ圧縮方法》本発明の第２３の
データ圧縮方法は、前述した第１の課題を解決するた
め、下記の如く構成されている（請求項２３に対応）。

【００７９】即ち、第３のデータ圧縮方法において、前
記符号情報登録部が２分木構造の符号木でできている場
合に、符号木の葉であるリーフをデータとする共に、符
号木の根であるルートから各リーフまでの経路を符号と
する。

【００８０】そして、前記符号情報更新過程では、前記
符号木の頂点から新規入力データ及び未登録を示すデー
タのいずれか一方が登録されたリーフを、他のリーフも
しくは符号木の頂点以外の分岐点であるノードのいずれ
か一方と取り替えることにより符号木を更新する。

【００８１】そして、前記符号情報新規登録過程では、
前記符号木のリーフを分岐して得た新規リーフに符号情
報を登録する。そして、前記データ列・符号情報削除過
程では、符号木のリーフを、１経路分だけルートに近い
所に位置する分岐ノードとともに削除する。《本発明の第２４のデータ圧縮方法》本発明の第２４の
データ圧縮方法は、前述した第１の課題を解決するた
め、下記の如く構成されている（請求項２４に対応）。

【００８２】即ち、第１のデータ圧縮方法において、前
記符号情報登録部に登録される符号情報は、算術符号化
方式により符号化される。《本発明の第２５のデータ圧縮方法》本発明の第２５の
データ圧縮方法は、前述した第１の課題を解決するた
め、下記の如く構成されている（請求項２５に対応）。

【００８３】即ち、第２４のデータ圧縮方法において、
前記データ列・符号情報削除過程は、削除判断過程、削
除対象選別過程、削除過程及び削除用更新過程とを有す
る。削除判断過程では、前記データ列登録部に登録され
ているデータ列及び前記符号情報登録部に登録されてい
る符号化情報を削除するか否かを判断する。

【００８４】削除対象選別過程では、前記削除施行判断
過程で削除すると判断した場合に、削除するデータ列及
び前記符号化情報を選別する。削除過程では、前記削除
対象選別過程で選別されたデータ列及び符号化情報を、
それぞれ前記データ列登録部及び前記符号情報登録部か
ら削除する。

【００８５】削除用更新過程では、削除過程で削除され
た後の前記符号情報登録部を更新する。そして、前記削
除用更新過程では、符号情報の出現回数を２の倍数で割
り、割った値が１以下になる場合にその出現回数を１と
する。

【００８６】本発明の第１のデータ圧縮方法によれば、
符号情報登録部に対する登録が制限される。また、本発
明の第２〜第２５のデータ圧縮方法によれば、データ列
登録部に登録されるデータ列及び符号情報登録部に登録
される符号化情報が、それぞれ、全部あるいは一部削除
される。《本発明の第２６のデータ圧縮方法》本発明の第２６の
データ圧縮方法は、前述した第２の課題を解決するた
め、下記の如く構成されている（請求項２６に対応）。

【００８７】即ち、種類が限定された文字を対象とし、
入力文字を、既に出現した文字列を表す文脈に応じて符
号化することにより圧縮するデータ圧縮方法において、
文脈辞書登録過程、符号表登録過程、次数設定過程、登
録判別過程、未出現符号登録過程、未登録処理過程、繰
り返し過程、符号出力過程及び追加登録過程を備えてい
る。そして、未出現符号は、設定されている次数の文脈
に対応している。

【００８８】（文脈辞書登録過程）文脈辞書登録過程で
は、符号化処理対象文脈及びその子である符号化対象文
字の組み合わせを文脈辞書に登録する。

【００８９】（符号表登録過程）符号表登録過程では、
前記文脈辞書に登録された前記符号化対象文字を符号化
したときの情報を符号表に登録する。

【００９０】（次数設定過程）次数設定過程では、文脈
に含まれる文字数で表される次数を設定する。（登録判別過程）登録判別過程では、設定された次数を
有する前記符号化処理対象文脈及び前記符号化対象文字
の組み合わせが前記文脈辞書に登録されているか否かを
判別する。

【００９１】（未出現符号登録過程）未出現符号登録過
程では、前記符号化処理対象文脈及び前記符号化対象文
字の組み合わせががない場合に、より低い次数の文脈へ
の脱出を示す未出現符号を、設定された次数の文脈に対
応した符号表に登録する。

【００９２】（未登録処理過程）未登録処理過程では、
前記登録判別過程で、前記符号化処理対象文脈及び前記
符号化対象文字の組み合わせが登録されていないと判別
された場合に、前記設定されている次数の未出現符号を
出力するとともに設定されている次数を一つ下げる処理
を行う。

【００９３】（繰り返し過程）繰り返し過程では、前記
登録判別過程で、前記符号化処理対象文脈及び前記符号
化対象文字の組み合わせが登録されていると判別される
まで、前記登録判別過程、前記追加登録過程及び前記未
登録処理過程を繰り返す。

【００９４】（符号出力過程）符号出力過程では、前記
登録判別過程で、前記符号化処理対象文脈及び前記符号
化対象文字の組み合わせが登録されていると判別された
場合に、前記符号表から、符号化対象文字に対応した符
号を出力する。

【００９５】（追加登録過程）追加登録過程では、前記
符号化対象文字を、符号化された次数より上の次数の前
記文脈辞書及び前記符号表に追加登録する。《本発明の第２７のデータ圧縮方法》本発明の第２７の
データ圧縮方法は、前述した第２の課題を解決するた
め、下記の如く構成されている（請求項２７に対応）。

【００９６】即ち、第２６のデータ圧縮方法において、
前記符号表の未出現符号は、符号表の格納場所に対応す
る関係にある。そして、未出現の文字を符号化する場合
に、符号表の格納場所に対応する符号を出力する。《本発明の第２８のデータ圧縮方法》本発明の第２８の
データ圧縮方法は、前述した第２の課題を解決するた
め、下記の如く構成されている（請求項２８に対応）。

【００９７】即ち、第２６のデータ圧縮方法において、
前記符号化処理対象文脈と前記符号化対象文字との各組
み合わせに関して、前記符号化処理対象文脈に対応する
符号表の格納場所と、前記符号化処理対象文脈に符号化
対象文字を連結して生成される第２の符号化処理対象文
脈に対応する符号表の格納場所とを登録する。

【００９８】そして、前記第２の符号化処理対象文脈に
関する未出現符号を出力する場合に、前記第２の符号化
処理対象文脈に対応する符号表の格納場所を利用する。《本発明の第２９のデータ圧縮方法》本発明の第２９の
データ圧縮方法は、前述した第２の課題を解決するた
め、下記の如く構成されている（請求項３２に対応）。

【００９９】即ち、第２６のデータ圧縮方法において、
前記文脈辞書は、文脈木として構成されている。そし
て、前記符号表は、２分木からなる符号木として構成さ
れている。《本発明の第３０のデータ圧縮方法》本発明の第３０の
データ圧縮方法は、前述した第２の課題を解決するた
め、下記の如く構成されている（請求項３３に対応）。

【０１００】即ち、第２９のデータ圧縮方法において、
前記符号木内の未出現符号に相当する各枝の内の最後に
枝を、前記符号木の根に結合させ、未出現符号を符号化
する場合には、符号木の根からその親をたどり、再び、
根に戻るまで、各節点の分岐に応じた符号を出力する。《本発明の第３１のデータ圧縮方法》本発明の第３１の
データ圧縮方法は、前述した第２の課題を解決するた
め、下記の如く構成されている（請求項３４に対応）。

【０１０１】即ち、第２９のデータ圧縮方法において、
前記符号化処理対象文脈と前記符号化対象文字との各組
み合わせに関して、前記符号化処理対象文脈に対応する
符号木の根と、前記符号化処理対象文脈に符号化対象文
字を連結して生成される第２の符号化処理対象文脈に対
応する符号木の根とを登録する。

【０１０２】そして、前記第２の符号化処理対象文脈に
関する未出現符号を出力する場合に、前記第２の符号化
処理対象文脈に対応する符号木の根を利用する。《本発明の第１のデータ復元方法》本発明の第１のデー
タ復元方法は、前述した第２の課題を解決するため、下
記の如く構成されている（請求項２９に対応）。

【０１０３】即ち、種類が限定された文字を対象とし、
入力文字を、既に出現した文字列を表す文脈に応じて符
号化することにより圧縮されたデータを復元するデータ
復元方法において、次数設定過程、文脈辞書登録過程、
符号表登録過程、符号表決定過程、未出現符号登録過
程、復元処理過程、文字出力過程及び復元文字追加登録
過程を備えている。そして、設定されている次数の前記
復号化処理対象文脈における未出現符号を、設定されて
いる次数の文脈に対応させる。

【０１０４】（次数設定過程）次数設定過程では、文脈
に含まれる文字数で表される次数を設定する。（文脈辞書登録過程）文脈辞書登録過程では、復号化済
みの文字と所定の次数の文脈との組合せを文脈辞書に登
録する。

【０１０５】（符号表登録過程）符号表登録過程では、
復号化のための情報を復号化した各文脈毎に独立して符
号表に登録する。

【０１０６】（符号表決定過程）符号表決定過程では、
直前に復号化した所定の次数の復号化処理対象文脈に対
応した符号表を決定する。

【０１０７】（未出現符号登録過程）未出現符号登録過
程では、設定されている次数の復号化処理対象文脈に復
号化対象文字が登録されていない場合に、より低い次数
の文脈への脱出を示す未出現符号を、設定されている次
数の文脈に対応した符号表に登録する。

【０１０８】（復元処理過程）復元処理過程では、文字
が復元できるまで、各次数の未出現符号を復元すると共
に設定されている次数を一つ下げる処理を行う。

【０１０９】（文字出力過程）文字出力過程では、文字
が復元できた場合に、符号に対応した文字を符号表から
出力する。

【０１１０】（復元文字追加登録過程）復元文字追加登
録過程では、文字がある次数で復元できた場合に、復元
できた文字を、復元できた次数より上の次数の前記文脈
辞書及び前記符号表に追加登録する。《本発明の第２のデータ復元方法》本発明の第２のデー
タ復元方法は、前述した第２の課題を解決するため、下
記の如く構成されている（請求項３０に対応）。

【０１１１】即ち、第１のデータ復元方法において、前
記符号表の未出現符号は、符号表の格納場所に対応する
関係にある。そして、符号表の格納場所に対応する符号
に対しては、未出現符号として復元化する。《本発明の第３のデータ復元方法》本発明の第３のデー
タ復元方法は、前述した第２の課題を解決するため、下
記の如く構成されている（請求項３１に対応）。

【０１１２】即ち、第１のデータ復元方法において、前
記文脈辞書登録過程では、前記復号化処理対象文脈と前
記復号化対象文字との各組み合わせに関して、前記復号
化処理対象文脈に対応する符号表の格納場所と、前記復
号化処理対象文脈に復号化対象文字を連結して生成され
る第２の復号化処理対象文脈の格納場所とを登録する。

【０１１３】そして、前記第２の復号化処理対象文脈を
復元化する場合に、前記第２の復号化処理対象文脈の格
納場所を利用する。《本発明の第４のデータ復元方法》本発明の第４のデー
タ復元方法は、前述した第２の課題を解決するため、下
記の如く構成されている（請求項３５に対応）。

【０１１４】即ち、第１のデータ復元方法において、前
記文脈辞書は、文脈木として構成されている。そして、
前記符号表は、２分木からなる符号木として構成されて
いる。《本発明の第５のデータ復元方法》本発明の第５のデー
タ復元方法は、前述した第２の課題を解決するため、下
記の如く構成されている（請求項３６に対応）。

【０１１５】即ち、第４のデータ復元方法において、前
記符号木内の未出現符号に相当する各枝の内の最後の枝
を、符号木の根に結合させ、未出現符号を復号化する場
合には、符号木の根から左右の子を符号ビットに応じて
たどり、再び、根に戻ることで未出現符号と判断する。《本発明の第６のデータ復元方法》本発明の第６のデー
タ復元方法は、前述した第２の課題を解決するため、下
記の如く構成されている（請求項３７に対応）。

【０１１６】即ち、第４のデータ復元方法において、前
記復号化処理対象文脈と前記復号化対象文字との各組み
合わせに関して、前記復号化処理対象文脈に対応する符
号木の根を登録するとともに、前記復号化処理対象文脈
に復号化対象文字を連結して生成される第２の復号化処
理対象文脈に対応する符号木の根を登録する。

【０１１７】そして、前記第２の復号化処理対象文脈を
復元化する場合に、前記第２の復号化処理対象文脈に対
応する符号木の根を利用する。《本発明の第１のデータ圧縮装置》本発明の第１のデー
タ圧縮装置は、前述した第２の課題を解決するため、下
記の如く構成されている（請求項３８に対応）。

【０１１８】即ち、種類が限定された文字を対象とし、
入力文字を、既に出現した文字列を表す文脈に応じて符
号化することにより圧縮するデータ圧縮装置において、
文脈辞書登録部、符号木登録部、次数設定部、登録判別
部、未出現符号登録部、未登録処理部、繰り返し部、符
号出力部及び符号化対象文字追加登録部を備えている。

【０１１９】（文脈辞書登録部）文脈辞書登録部では、
符号化処理対象文脈及びその子である符号化対象文字の
組み合わせを文脈辞書に登録する。

【０１２０】また、文脈辞書登録部では、登録する文脈
に一意の識別子を割り当てる。（符号木登録部）符号木登録部では、前記文脈辞書に登
録された前記符号化対象文字を符号化したときの情報
を、２分木からなる符号木に登録する。

【０１２１】また、符号木登録部では、前記符号木の根
に一意の識別子を割り当てる。（次数設定部）次数設定部では、文脈に含まれる文字数
で表される次数を設定する。

【０１２２】（登録判別部）登録判別部では、設定され
た次数を有する前記符号化処理対象文脈及び前記符号化
対象文字の組み合わせが前記文脈辞書に登録されている
か否かを判別する。

【０１２３】（未出現符号登録部）未出現符号登録部で
は、前記符号化処理対象文脈及び前記符号化対象文字の
組み合わせががない場合に、より低い次数の文脈への脱
出を示す未出現符号を、設定された次数の文脈に対応し
た符号木の根として登録する。

【０１２４】また、未出現符号登録部では、前記文脈辞
書登録部で割り当てられた識別子と一致するともに、前
記符号木登録部で割り当てられた識別子とも一致する識
別子を前記未出現符号に割り当てる。

【０１２５】（未登録処理部）未登録処理部では、前記
登録判別部で、前記符号化処理対象文脈及び前記符号化
対象文字の組み合わせが登録されていないと判別された
場合に、前記設定されている次数の未出現符号を出力す
るとともに設定されている次数を一つ下げる処理を行
う。

【０１２６】（繰り返し部）繰り返し部では、前記登録
判別部で、前記符号化処理対象文脈及び前記符号化対象
文字の組み合わせが登録されていると判別されるまで、
前記登録判別部、前記追加登録部及び前記未登録処理部
で行われる処理を繰り返す。

【０１２７】（符号出力部）符号出力部では、前記登録
判別部で、前記符号化処理対象文脈及び前記符号化対象
文字の組み合わせが登録されていると判別された場合
に、前記符号木の根から符号化対象文字が格納されてい
る葉までの節点の分岐に応じた符号を出力する。

【０１２８】（符号化対象文字追加登録部）符号化対象
文字追加登録部では、前記登録判別部で、前記符号化処
理対象文脈及び符号化対象文字の組み合わせが登録され
ていると判別された場合に、前記符号化対象文字を、前
記組み合わせがあると判別された次数より上の次数の前
記文脈辞書及び前記符号木に追加して登録する。《本発明の第２のデータ圧縮装置》本発明の第２のデー
タ圧縮装置は、前述した第２の課題を解決するため、下
記の如く構成されている（請求項３９に対応）。

【０１２９】即ち、第１のデータ圧縮装置において、前
記符号出力部は、符号化対象文字が未出現文字か一般の
文字かを判断するとともに、前記初期判断部で未出現文
字と判断された場合に、前記符号木の根からその親をた
どり、再び、根に戻るまで、前記符号木の節点を探索す
る。《本発明の第３のデータ圧縮装置》本発明の第３のデー
タ圧縮装置は、前述した第２の課題を解決するため、下
記の如く構成されている（請求項４０に対応）。

【０１３０】即ち、第１のデータ圧縮装置において、前
記文脈辞書登録部では、前記符号化処理対象文脈と前記
符号化対象文字との各組み合わせに関して、前記符号化
処理対象文脈に対応する符号木の根と、前記符号化処理
対象文脈に符号化対象文字を連結して生成される第２の
符号化処理対象文脈に対応する符号木の根とを登録す
る。

【０１３１】そして、前記符号出力部では、前記第２の
符号化処理対象文脈に関する未出現符号を出力する場合
に、前記第２の符号化処理対象文脈に対応する符号木の
根を利用する。《本発明の第１のデータ復元装置》本発明の第１のデー
タ復元装置は、前述した第２の課題を解決するため、下
記の如く構成されている（請求項４１に対応）。

【０１３２】即ち、種類が限定された文字を対象とし、
入力文字を、既に出現した文字列を表す文脈に応じて符
号化することにより圧縮されたデータを復元するデータ
復元装置において、次数設定部、文脈辞書登録部、符号
木登録部、符号木決定部、未出現符号登録部、文脈変更
部及び符号登録部を備えている。

【０１３３】（次数設定部）次数設定部では、文脈に含
まれる文字数で表される次数を設定する。（文脈辞書登録部）文脈辞書登録部では、復号化済みの
文字と所定の次数の文脈との組合せを文脈辞書に登録す
る。

【０１３４】また、文脈辞書登録部では、登録する文脈
に一意の識別子を割り当てる。（符号木登録部）符号木登録部では、復号化のための情
報を復号化した各文脈毎に独立して、２分木からなる符
号木に登録する。

【０１３５】また、符号木登録部では、前記符号木の根
に一意の識別子を割り当てる。（符号木決定部）符号木決定部では、復号化のための情
報を復号化した各文脈毎に独立して、２分木からなる符
号木に登録する。

【０１３６】（未出現符号登録部）未出現符号登録部で
は、復号化対象文字が、設定されている次数の復号化処
理対象文脈に登録されていない場合に、より低い次数の
文脈への脱出を表す未出現符号を、設定されている次数
の文脈に対応した符号木の根として登録する。

【０１３７】（文脈変更部）文脈変更部では、文字を復
元できるまで、各次数の未出現符号を復元した後、復号
化処理対象文脈の次数を下げて復元の処理を繰り返す。

【０１３８】（復元文字登録部）復元文字登録部では、
復元化した文字を、復元できた次数より上の次数の前記
文脈及び前記符号木に登録する。《本発明の第２のデータ復元装置》本発明の第２のデー
タ復元装置は、前述した第２の課題を解決するため、下
記の如く構成されている（請求項４２に対応）。

【０１３９】即ち、第１のデータ復元装置において、前
記復号化部では、未出現符号を復号化する場合に、符号
木の根から左右の子を符号ビットに応じてたどり、再び
根にもどることを確認することにより、未出現符号と判
断する。《本発明の第３のデータ復元装置》本発明の第３のデー
タ復元装置は、前述した第２の課題を解決するため、下
記の如く構成されている（請求項４３に対応）。

【０１４０】即ち、第１のデータ復元装置において、前
記文脈辞書登録部では、前記復号化処理対象文脈と前記
復号化対象文字との各組み合わせに関して、前記復号化
処理対象文脈に対応する符号木の根と、前記復号化処理
対象文脈に復号化対象文字を連結して生成される第２の
復号化処理対象文脈に対応する符号木の根とを登録す
る。

【０１４１】そして、前記符号出力部では、前記第２の
復号化処理対象文脈に関して復号化する場合に、前記第
２の復号化処理対象文脈に対応する符号木の根を利用す
る。

【０１４２】

【発明の実施の形態】以下、本発明の実施形態を図面を
参照して説明する。（第１実施形態）第１実施形態は、登録制限処理を行っ
て確率統計適応型符号化するデータ圧縮方法に関する。
図７は、第１実施形態で行われるデータ圧縮方法の処理
フローチャート（その１）である。以下の説明で、Ｐ₀
は、直前までに入力・符号化された文字（文脈）を意味
し、例えば、ｎ次文脈モデルで符号化する場合には、直
前までのｎ文字を格納しているものとする。

【０１４３】最初に、文脈Ｐ₀ を初期化するため“０”
を設定する（ステップ４０１）。なお、“０”を設定す
るとは、文脈Ｐ₀ の要素を全て“０”で置き換えること
をいう（以下同様）。

【０１４４】次に、文脈を表す変数Ｐに文脈Ｐ₀ をコピ
ーする（ステップ４０２）。シンボルＫが入力された時
（ステップ４０３）、文脈Ｐの符号表にシンボルＫが登
録されているか否かを判別する（ステップ４０４）。

【０１４５】ステップ４０４で、「登録されている」と
判別された場合には、文脈Ｐの符号表を用いてシンボル
Ｋに対応する符号を出力する（ステップ４０５）。符号
出力後、先に符号出力したシンボルＫの符号が短くなる
ように符号表を更新する（ステップ４０６）。

【０１４６】そして、シンボルＫを追加して、文脈Ｐ₀
を更新する（ステップ４０７）。そして、全ての文字が
終了したか否かを判別する（ステップ４０８）。ステッ
プ４０８で、「終了していない」と判別された場合に
は、ステップ４０２に戻る。

【０１４７】ステップ４０８で、「終了した」と判別さ
れた場合には、処理を終了する。一方、ステップ４０４
で、「登録されていない」と判別された場合には、未出
現記号を表すエスケープコード（ＥＳＣ）の符号を出力
する（ステップ４０９）。

【０１４８】符号出力後、先に符号出力したＥＳＣの符
号長が短くなるように符号表を更新する（ステップ４１
０）。そして、文脈Ｐに続くK(K|P)は文脈木に登録済み
か否かを判別する（ステップ４１１）。

【０１４９】ステップ４１１で、「登録されている」と
判別された場合には、文脈Ｐの符号表にシンボルＫを新
規登録する（ステップ４１２）。ステップ４１１で、
「登録されていない」と判別された場合には、文脈木に
K|P を新規登録する（ステップ４１３）。

【０１５０】ステップ４１２及びステップ４１３の処理
後に文脈Ｐを更新し、ステップ４０４に戻る。以上の動
作を、全ての入力文字に対して繰り返す。

【０１５１】次に、図８は、第１実施形態で行われるデ
ータ圧縮方法の処理フローチャート（その２）である。
図８におけるステップ５０１〜５０８は、図７における
ステップ４０１〜４０８と同様の処理なので説明を省略
する。

【０１５２】ステップ５０４で、「登録されていない」
と判別された場合には、文脈Ｐの符号表を用いてＥＳＣ
の符号を出力する（ステップ５０９）。符号出力後、先
に符号出力したＥＳＣの符号長が短くなるように文脈Ｐ
の符号表を更新する（ステップ５１０）。

【０１５３】そして、文脈Ｐに続くシンボルＫは既に
（Ｎ−１）回出現していたか否かを判別する（ステップ
５１１）。ステップ５１１で、「出現した」と判別され
た場合には、文脈Ｐの符号表にシンボルＫを新規登録す
る（ステップ５１２）。

【０１５４】ステップ５１１で、「出現していない」と
判別された場合には、文脈Ｐに続くK(K|P)は文脈木に登
録済みか否かを判別する（ステップ５１４）。ステップ
５１４で、「登録済み」と判別された場合には、ステッ
プ５１３に進む。

【０１５５】ステップ５１４で、「登録されていない」
と判別された場合には、文脈木にK|P を新規登録する
（ステップ５１５）。ステップ５１２及びステップ５１
５の処理後に文脈Ｐを更新し、ステップ５０４に戻る。

【０１５６】以上の動作を、全ての入力文字に対して繰
り返す。（第２実施形態）第２実施形態は、削除処理を行って確
率統計適応型符号化するデータ圧縮方法に関する。

【０１５７】削除処理において、符号出力、符号表更新
に関する処理では、登録制限処理の場合と同様に、文脈
木にK|P が登録されていない場合に、文脈木、符号木と
もに新規登録を行う。また、新たな削除施行時に、符号
表と文脈の初期化を行う。

【０１５８】図９は、入力データサイズをカウントし、
一定数に達したときに初期化を行うことを内容とする削
除処理を行って確率統計適応型符号化するデータ圧縮方
法の処理フローチャートである。

【０１５９】最初に、ファイルサイズカウンタに相当す
るｎの値を“０”に設定する（ステップ６０１）。次
に、文脈Ｐ₀ に“０”を設定する（ステップ６０２）。

【０１６０】次に、変数Ｐ（文脈）に文脈Ｐ₀ を入力す
る（ステップ６０３）。シンボルＫが入力された時（ス
テップ６０４）、ｎ≧Ｎか否かを判別する（ステップ６
０５）。

【０１６１】ステップ６０５で、「ＹＥＳ」と判別され
た場合には、符号表及び文脈木を初期化する（ステップ
６０６）。そして、ｎの値を“０”に設定する（ステッ
プ６０７）。

【０１６２】ステップ６０５で、「ＮＯ」と判別された
場合には、ｎの値を１だけ増加させる（ステップ６０
８）。ステップ６０７及びステップ６０８の処理後に、
文脈Ｐの符号表にシンボルＫが登録されているか否かを
判別する（ステップ６０９）。

【０１６３】ステップ６０９で、「登録されている」と
判別された場合には、文脈Ｐの符号表を用いてシンボル
Ｋの符号を出力する（ステップ６１０）。そして、先に
符号出力したシンボルＫの符号が短くなるように符号表
を更新する（ステップ６１１）。

【０１６４】そして、シンボルＫを追加して、文脈Ｐ₀
を更新する（ステップ６１２）。そして、全ての文字が
終了したか否かを判別する（ステップ６１３）。ステッ
プ６１３で、「終了していない」と判別された場合に
は、ステップ６０３に戻る。

【０１６５】ステップ６１３で、「終了した」と判別さ
れた場合には、処理を終了する。一方、ステップ６０９
で、「登録されていない」と判別された場合には、ＥＳ
Ｃの符号を出力する（ステップ６１４）。

【０１６６】符号出力後、先に符号出力したＥＳＣの符
号長が短くなるように符号表を更新する（ステップ６１
５）。そして、文脈Ｐの符号表にシンボルＫを新規登録
する（ステップ６１６）。

【０１６７】そして、文脈Ｐを変更し（ステップ６１
７）、ステップ６０５に戻る。以上の動作を、全ての入
力文字に対して繰り返す。次に、図１０は、圧縮率を一
定ファイルサイズ毎に比べ、圧縮率が下がった時に初期
化を行うことを内容とする削除処理を行って確率統計適
応型符号化するデータ圧縮方法の処理フローチャートで
ある。

【０１６８】最初に、ファイルサイズカウンタに相当す
るｎ１の値を“０”に、符号サイズカウンタに相当する
ｎ２の値を“０”に、登録数カウンタに相当するｍの値
を“０”に、それぞれ設定する（ステップ７０１）。

【０１６９】次に、文脈Ｐ₀ を“０”に、変数Ｒの値を
“１”にそれぞれ設定する（ステップ７０２）。次に、
変数Ｐ（文脈）に文脈Ｐ₀ を入力する（ステップ７０
３）。シンボルＫが入力された時（ステップ７０４）、
ｎ１≧Ｎか否かを判別する（ステップ７０５）。

【０１７０】ステップ７０５で、「ＹＥＳ」と判別され
た場合に、ｎ２／ｎ１≧Ｒか否かを判別する（ステップ
７０６）。ステップ７０６で、「ＹＥＳ」と判別された
場合に、符号表及び文脈木を初期化すると共に、ｍの値
を“０”に設定する（ステップ７０７）。

【０１７１】そして、Ｒの値、ｎ２／ｎ１に設定する
（ステップ７０８）。ステップ７０６で、「ＮＯ」と判
別された場合に、Ｒの値を“１”に設定する（ステップ
７０９）。

【０１７２】ステップ７０８及びステップ７０９の処理
後に、ｎ１及びｎ２の値を“０”に設定する（ステップ
７１０）。ここで、ステップ７０５で、「ＮＯ」と判別
された場合には、ｎ１の値を“１”だけ増加させる（ス
テップ７１１）。

【０１７３】ステップ７１０及びステップ７１１の処理
後に、文脈Ｐの符号表にシンボルＫが登録されているか
否かを判別する（ステップ７１２）。ステップ７１２
で、「登録されている」と判別された場合には、シンボ
ルＫの符号を文脈Ｐの符号表を用いて出力する（ステッ
プ７１３）。

【０１７４】そして、Ｋの符号長だけｎ２の値を増加さ
せる（ステップ７１４）。そして、先に符号出力したシ
ンボルＫの符号が短くなるように文脈Ｐの符号表を更新
する（ステップ７１５）。

【０１７５】そして、シンボルＫを追加して、文脈Ｐ₀
を更新する（ステップ７１６）。そして、全ての文字が
終了したか否かを判別する（ステップ７１７）。ステッ
プ７１７で、「終了していない」と判別された場合に
は、ステップ７０３に戻る。

【０１７６】ステップ７１７で、「終了した」と判別さ
れた場合には、処理を終了する。一方、ステップ７１２
で、「登録されていない」と判別された場合には、ＥＳ
Ｃの符号を出力する（ステップ７１８）。

【０１７７】そして、ＥＳＣの符号長だけｎ２の値を増
加させる（ステップ７１９）。そして、先に符号出力し
たＥＳＣの符号長が短くなるように符号表を更新する
（ステップ７２０）。

【０１７８】ここで、ｍ≧Ｍか否かを判別する（ステッ
プ７２１）。ステップ７２１で、「ＮＯ」と判別された
場合に、文脈Ｐの符号表にシンボルＫを新規登録すると
共に、ｍを１だけ増加させる（ステップ７２２）。

【０１７９】ステップ７２１で、「ＹＥＳ」と判別され
た場合及びステップ７２２の処理後に、文脈Ｐを変更し
（ステップ７２３）、ステップ７０５に戻る。以上の動
作を、全ての入力文字に対して繰り返す。

【０１８０】次に、図１１は、総登録組数をカウント
し、一定数に達したときに初期化を行うことを内容とす
る削除処理を行って確率統計適応型符号化するデータ圧
縮方法の処理フローチャートである。

【０１８１】最初に、登録数カウンタに相当するｍに
“０”を設定する（ステップ８０１）。次に、文脈Ｐ₀
に“０”を設定する（ステップ８０２）。

【０１８２】次に、変数Ｐ（文脈）に文脈Ｐ₀ を入力す
る（ステップ８０３）。シンボルＫが入力された時（ス
テップ８０４）、文脈Ｐの符号表にシンボルＫが登録さ
れているか否かを判別する（ステップ８０５）。

【０１８３】ステップ８０５で、「登録されている」と
判別された場合には、シンボルＫの符号を出力する（ス
テップ８０６）。そして、先に符号出力したシンボルＫ
の符号が短くなるように文脈Ｐの符号表を更新する（ス
テップ８０７）。

【０１８４】そして、シンボルＫを追加して、文脈Ｐ₀
を更新する（ステップ８０８）。そして、全ての文字が
終了したか否かを判別する（ステップ８０９）。ステッ
プ８０９で、「終了していない」と判別された場合に
は、ステップ８０３に戻る。

【０１８５】ステップ８０９で、「終了した」と判別さ
れた場合には、処理を終了する。一方、ステップ８０５
で、「登録されていない」と判別された場合には、ｍ≧
Ｍか否かを判別する（ステップ８１０）。

【０１８６】ステップ８１０で、「ＹＥＳ」と判別され
た場合には、符号表及び文脈木を初期化する（ステップ
８１１）。そして、ｍの値を“０”に設定する（ステッ
プ８１２）。

【０１８７】ステップ８１０で、「ＮＯ」と判別された
場合には、ｍの値を“１”だけ増加させる（ステップ８
１３）。ステップ８１２及びステップ８１３の処理後
に、ＥＳＣの符号を出力する（ステップ８１４）。

【０１８８】そして、先に符号出力したＥＳＣの符号が
短くなるように符号表を更新する（ステップ８１５）。
そして、文脈Ｐの符号表にシンボルＫを新規登録する
（ステップ８１６）。

【０１８９】そして、文脈Ｐを更新し（ステップ８１
７）、ステップ８０５に戻る。即ち、入力文字がなくな
るまで以上の処理を繰り返す。（第３実施形態）第３実施形態は、部分削除処理を行っ
て確率統計適応型符号化するデータ圧縮方法に関する。

【０１９０】部分削除処理において、符号出力、符号表
更新に関する処理では、文脈木にK|P が登録されていな
い場合に、文脈Ｐの符号表にシンボルＫを新規登録し、
更に削除順位リストにも先の組(K|P)を登録する。ま
た、符号表更新の際に、符号化した文字の削除順位が高
くなるように削除順位リストを更新する。削除時（例え
ば、一定量の文字を符号化するごとに）に、削除順位リ
ストに従って、順位が低い組を符号表、文脈木から削除
する。

【０１９１】図１２は、一定ファイルサイズ毎に部分削
除を行うことを内容とする部分削除処理を行って確率統
計適応型符号化するデータ圧縮方法の処理フローチャー
トである。

【０１９２】最初に、ファイルカウンタに相当するｎの
値を“０”に設定する（ステップ９０１）。次に、文脈
Ｐ₀ に“０”を設定する（ステップ９０２）。

【０１９３】次に、変数Ｐ（文脈）に文脈Ｐ₀ を入力す
る（ステップ９０３）。シンボルＫが入力された時（ス
テップ９０４）、ｎ≧Ｎか否かを判別する（ステップ９
０５）。

【０１９４】ステップ９０５で、「ＹＥＳ」と判別され
た場合には、削除順位リストを部分削除すると共に、符
号表及び文脈木を部分削除する（ステップ９０６）。そ
して、ｎの値を“０”に設定する（ステップ９０７）。

【０１９５】ステップ９０５で、「ＮＯ」と判別された
場合には、ｎの値を“１”だけ増加させる（ステップ９
０８）。ステップ９０７及ぶステップ９０８の処理後に
は、文脈Ｐの符号表にシンボルＫが登録されているか否
かを判別する（ステップ９０９）。

【０１９６】ステップ９０９で、「ＹＥＳ」と判別され
た場合には、シンボルＫの符号を出力する（ステップ９
１０）。そして、先に符号出力したシンボルＫの符号が
短くなるように符号表を更新する（ステップ９１１）。

【０１９７】そして、シンボルＫを追加して、文脈Ｐ₀
を更新する（ステップ９１２）。そして、シンボルＫの
順位が高くなるように、削除順位を更新する（ステップ
９１３）。

【０１９８】そして、全ての文字が終了したか否かを判
別する（ステップ９１４）。ステップ９１４で、「終了
していない」と判別された場合には、ステップ９０３に
戻る。

【０１９９】ステップ９１４で、「終了した」と判別さ
れた場合には、処理を終了する。ステップ９０９で、
「ＹＥＳ」と判別された場合には、ＥＳＣの符号を出力
する（ステップ９１５）。

【０２００】そして、先に符号出力したＥＳＣの符号が
短くなるように符号表を更新する（ステップ９１６）。
そして、文脈Ｐの符号表にシンボルＫを新規登録する
（ステップ９１７）。

【０２０１】そして、削除順位リストに、文脈Ｐに続く
シンボルＫの組(K|P) を登録する（ステップ９１８）。
そして、文脈Ｐを更新し（ステップ９１９）、ステップ
９０５に戻る。即ち、入力文字がなくなるまで以上の処
理を繰り返す。

【０２０２】次に、図１３（ａ）は、頻度順に削除順位
リストを更新することを内容とする部分削除処理を行っ
て確率統計適応型符号化するデータ圧縮方法の処理フロ
ーチャートである。

【０２０３】最初に、文脈Ｐ’に文脈Ｐをコピーする
（ステップ１００１）。次に、文脈Ｐ’が“０”か否か
を判別する（ステップ１００２）。ステップ１００２
で、「ＹＥＳ」と判別された場合には、Ｐ’の頻度を
“１”インクリメントし、頻度に応じて削除順位を変更
する（ステップ１００３）。

【０２０４】ステップ１００２で、「ＮＯ」と判別され
た場合には、Ｐ’の頻度を“１”インクリメントし、頻
度に応じて削除順位を変更する（ステップ１００４）。
そして、１つ次数を落とすことでＰ’を変更し（ステッ
プ１００５）、ステップ１００２に戻る。

【０２０５】図１４（ａ）は、ｃ｜ａａで符号化した場
合に、頻度順に削除順位リストを更新するとき、更新さ
れる削除順位リストの様子を示している。まず、文字及
び符号の組とその出現頻度として、ａが８、ｂが５、ｃ
が４、ａ｜ａが３、ａ｜ｂが２、ｃ｜ａが２、ｃ｜ａａ
が１であった場合に、削除順位リストは、図１４の（ａ
−１）に示すように、出現頻度の大きいものから順に並
んで構成される。ここで、文脈ａａに続いて文字ｃが出
現した場合に、ｃ｜ａａ、ｃ｜ａ、ｃの出現頻度がそれ
ぞれ１ずつ増加して、削除順位リストは、図１４の（ａ
−２）に示すように、ａ、ｂ、ｃ、ｃ｜ａ、ａ｜ａ、ａ
｜ｂ、ｃ｜ａａの順に並び替えられる。

【０２０６】次に、図１３（ｂ）は、最も最近出現した
ものの順位が高くなるように削除順位リストを更新する
ことを内容とする部分削除処理を行って確率統計適応型
符号化するデータ圧縮方法の処理フローチャート（その
１）である。

【０２０７】最初に、文脈Ｐ’に文脈Ｐ、Ｋをコピーす
る（ステップ１０１１）。次に、文脈Ｐ’が“０”か否
かを判別する（ステップ１０１２）。ステップ１０１２
で、「ＹＥＳ」と判別された場合には、Ｋの削除順位を
最上位にし、それに伴って他の順位を繰り下げる（ステ
ップ１０１３）。

【０２０８】ステップ１０１２で、「ＮＯ」と判別され
た場合には、Ｋ｜Ｐ’の削除順位を最上位にし、それに
伴って他の順位を繰り下げる（ステップ１０１４）。そ
して、１つ次数を落とすことでＰ’を変更し（ステップ
１０１５）、ステップ１０１２に戻る。

【０２０９】図１４（ｂ）は、ｃ｜ａａで符号化した場
合に、最も最近出現したものの順位が高くなるように削
除順位リストを更新するとき、更新される削除順位リス
トの様子を示している。まず、削除順位リストは、図１
４の（ｂ−１）に示すように、ａ、ｂ、ｃ、ａ｜ａ、ａ
｜ｂ、ｃ｜ａ、ｃ｜ａａの順に並んで構成されている。
ここで、文脈ａａに続いて文字ｃが出現した場合に、
（ｂ−２）、（ｂ−３）、（ｂ−４）の順で削除順位リ
ストが並び替えられる。即ち、（ｂ−２）では、ｃ｜ａ
ａが最上位で、他は（ｂ−１）の順となるように並び替
えられる。（ｂ−３）では、ｃ｜ａが最上位で、他は
（ｂ−２）の順となるように並び替えられる。そして、
（ｂ−４）では、ｃが最上位で、他は（ｂ−３）の順と
なるように並び替えられる。

【０２１０】次に、図１３（ｃ）は、最も最近出現した
ものの順位が高くなるように削除順位リストを更新する
ことを内容とする部分削除処理を行って確率統計適応型
符号化するデータ圧縮方法の処理フローチャート（その
２）である。

【０２１１】最初に、文脈Ｐ’に文脈Ｐ、Ｋをコピーす
る（ステップ１０２１）。次に、文脈Ｐ’が“０”か否
かを判別する（ステップ１０２２）。ステップ１０２２
で、「ＹＥＳ」と判別された場合には、Ｋの削除順位を
半分にし、それに伴って他の順位を繰り下げる（ステッ
プ１０２３）。

【０２１２】ステップ１０２２で、「ＮＯ」と判別され
た場合には、Ｋ｜Ｐ’の削除順位を半分にし、それに伴
って他の順位を繰り下げる（ステップ１０２４）。そし
て、１つ次数を落とすことでＰ’を変更し（ステップ１
０２５）、ステップ１０２２に戻る。

【０２１３】図１４（ｃ）は、ｃ｜ａａで符号化した場
合に、最も最近出現したものの順位が高くなるように削
除順位リストを更新するとき、更新される削除順位リス
トの様子を示している。まず、削除順位リストは、図１
４の（ｃ−１）に示すように、ａ、ｂ、ｃ、ａ｜ａ、ａ
｜ｂ、ｃ｜ａ、ｃ｜ａａの順に並んで構成されている。
ここで、文脈ａａに続いて文字ｃが出現した場合に、
（ｃ−２）、（ｃ−３）、（ｃ−４）の順で削除順位リ
ストが並び替えられる。即ち、（ｃ−２）では、ｃ｜ａ
ａの順位が半分になって、他は（ｃ−１）の順となるよ
うに並び替えられる。（ｃ−３）では、ｃ｜ａの順位が
半分になって、他は（ｃ−２）の順となるように並び替
えられる。そして、（ｃ−４）では、ｃの順位が半分に
なって、他は（ｃ−３）の順となるように並び替えられ
る。

【０２１４】（第４実施形態）第４実施形態は、全削除
と部分削除を組み合わせた処理を行って確率統計適応型
符号化するデータ圧縮方法に関する。

【０２１５】全削除と部分削除を組み合わせた処理を行
って確率統計適応型符号化するとは、総登録組数が一定
数に達した後でさらに新規登録をする場合に、削除順位
リストに従って順位が低い組を符号表、文脈木から一つ
削除し、換わりに新規の組を登録し、圧縮率が低減した
場合に全削除を行うことをいう。

【０２１６】図１５は、第４実施形態で行われるデータ
圧縮方法の処理フローチャートである。最初に、ファイ
ルサイズカウンタに相当するｎ１の値を“０”に、符号
サイズカウンタに相当するｎ２の値を“０”に、登録数
カウンタに相当するｍの値を“０”に、それぞれ設定す
る（ステップ１２０１）。

【０２１７】次に、文脈Ｐ₀ を“０”に、Ｒの値を
“１”に、それぞれ設定する（ステップ１２０２）。次
に、変数Ｐ（文脈）に文脈Ｐ₀ を入力する（ステップ１
２０３）。シンボルＫが入力された時（ステップ１２０
４）、ｎ１≧Ｎか否かを判別する（ステップ１２０
５）。

【０２１８】ステップ１２０５で、「ＹＥＳ」と判別さ
れた場合に、ｎ２／ｎ１≧Ｒか否かを判別する（ステッ
プ１２０６）。ステップ１２０６で、「ＹＥＳ」と判別
された場合に、符号表及び文脈木を初期化すると共に、
ｍの値に“０”に設定する（ステップ１２０７）。

【０２１９】そして、Ｒの値を、ｎ２／ｎ１に設定する
（ステップ１２０８）。ステップ１２０６で、「ＮＯ」
と判別された場合に、Ｒの値を“１”に設定する（ステ
ップ７０９）。

【０２２０】ステップ１２０８及びステップ１２０９の
処理後に、ｎ１及びｎ２の値を“０”に設定する（ステ
ップ１２１０）。ここで、ステップ１２０５で、「Ｎ
Ｏ」と判別された場合には、ｎ１の値を“１”だけ増加
させる（ステップ１２１１）。

【０２２１】ステップ１２１０及びステップ１２１１の
処理後に、文脈Ｐの符号表にシンボルＫが登録されてい
るか否かを判別する（ステップ１２１２）。ステップ１
２１２で、「登録されている」と判別された場合には、
シンボルＫの符号を出力する（ステップ１２１３）。

【０２２２】そして、Ｋの符号長だけｎ２の値を増加さ
せる（ステップ１２１４）。そして、先に符号出力した
シンボルＫの符号が短くなるように符号表を更新する
（ステップ１２１５）。

【０２２３】そして、シンボルＫの順位が高くなるよう
に削除順位を更新する（ステップ１２１５）。そして、
シンボルＫを追加して、文脈Ｐ₀ を更新する（ステップ
１２１７）。

【０２２４】そして、全ての文字が終了したか否かを判
別する（ステップ１２１８）。ステップ１２１８で、
「終了していない」と判別された場合には、ステップ１
２０３に戻る。

【０２２５】ステップ１２１８で、「終了した」と判別
された場合には、処理を終了する。一方、ステップ１２
１２で、「登録されていない」と判別された場合には、
ＥＳＣの符号を出力する（ステップ１２１９）。

【０２２６】そして、ＥＳＣの符号長だけｎ２の値を増
加させる（ステップ１２２０）。そして、先に符号出力
したＥＳＣの符号長が短くなるように符号表を更新する
（ステップ１２２１）。

【０２２７】ここで、ｍ≧Ｍか否かを判別する（ステッ
プ１２２２）。ステップ１２２２で、「ＮＯ」と判別さ
れた場合には、順位リストを一つ削除すると共に、符号
表及び文脈木一つを削除する（ステップ１２２３）。

【０２２８】ステップ１２２２で、「ＹＥＳ」と判別さ
れた場合には、ｍの値を１だけ増加させる（ステップ１
２２４）。ステップ１２２３とステップ１２２４の処理
後に、文脈Ｐの符号表にシンボルＫを新規登録する（ス
テップ１２２５）。

【０２２９】そして、削除順位リストに、文脈Ｐに続く
シンボルＫの組(K|P) を登録する（ステップ１２２
６）。そして、文脈Ｐを変更し（ステップ１２２７）、
ステップ１２０５に戻る。即ち、入力文字がなくなるま
で以上の処理を繰り返す。

【０２３０】（第５実施形態）第５実施形態は、文脈木
の削除することを内容とする削除処理を行って多値算術
符号化するデータ圧縮方法に関する。

【０２３１】図１６は、第５実施形態で行われる文脈木
の削除方法を示している。まず、低い次数から同じ文脈
に続く文字の出現回数の総和が１／２になるように出現
回数の少ない枝から削除する。同図においては、まず０
次において総和が５０００となるようにａ以下を削除す
る。次に、１次において同様に総和が１／２となるよう
に枝を削除する。

【０２３２】以上を最高次数まで（本例では２次）繰り
返す。その後、削除後残った子供の出現回数を８で割
り、１以下になったものは１とする。なお、出現回数を
８で割るのは一例であり、２の倍数ならば何でもよい。

【０２３３】《第１〜第５実施形態の効果》第１〜第５
実施形態の効果を図１７から図２０を使用して説明す
る。なお、図１７から図２０において、（ａ）には登録
したうち符号化に使用しなかった組の割合変化が示され
ており、（ｂ）には入力文字のうち高次（ただし、最高
次数を２次としている）で符号化できた割合の変化が示
されている。そして、（ａ）では、未使用の組数が少な
いほど辞書メモリを有効に利用できていることを意味
し、（ｂ）では高次の符号化割合が大きいほど高い圧縮
率が得られることを意味している。

【０２３４】まず、図１７は、従来行われていた全登録
無削除の場合、即ち、出現した文脈と符号化対象文字の
組合せ全てを文脈木と符号表に順次登録し、メモリ制限
まで登録した後は、新たな登録をせず、既に登録済みの
符号帳を更新する場合のファイルサイズと辞書登録数及
び符号化割合の関係を示す図である。図１７（ａ）に示
すように、文脈変化の無い定常のデータ（各文字の統計
量が一定）では、辞書登録に伴って登録したうちの未使
用の組数も徐々に増えるが、全登録辞書数に占める未使
用の割合は徐々に減り、辞書メモリ制限一杯になった時
点で一定になる。また、図１７（ｂ）に示すように、高
次の符号化割合は、辞書登録に伴って徐々に大きくな
り、辞書が固定されてからは一定の割合を保つ。そし
て、文脈変化が起こると未使用の割合が増え、高次での
符号化割合も減少する。

【０２３５】次に、図１８は、登録制限を行うが削除を
行わない場合のファイルサイズと辞書登録数及び符号化
割合の関係を示す図である。図１８（ａ）に示すよう
に、登録制限を行っているため、全辞書登録数の増加度
は、従来の場合（図１７参照）に比べ緩やかになってい
る。また、図１８（ｂ）に示すように、定常データで
は、未使用の割合が従来の場合（図１７参照）に比べ少
なく、高次の符号化割合が多くなっている。そして、文
脈変化が起こると従来の場合と同様に未使用の割合が増
加し、高次での符号化割合が減少する。

【０２３６】次に、図１９は、全登録を行うと共に全削
除を行う場合のファイルサイズと辞書登録数及び符号化
割合の関係を示す図である。ここでの登録方法とは、従
来と同様に、文脈変化が起こったときに辞書を全クリア
することである。辞書クリア後は、ファイル入力に伴っ
てファイルサイズが増大すると全辞書登録数は増え、辞
書メモリが一杯になった時点で登録が止められる。図１
９（ａ）に示すように、辞書登録に伴って全登録辞書数
に占める未使用の割合は徐々に減り、辞書メモリ制限一
杯になった時点で一定になる。また、図１９（ｂ）に示
すように、高次の符号化割合は、辞書登録に伴って徐々
に大きくなり、辞書が固定されてからは一定の割合が保
たれる。このように削除を行うことで、文脈の変化に適
応可能となっている。

【０２３７】次に、図２０は、全登録を行うと共に部分
削除を行う場合のファイルサイズと辞書登録数及び符号
化割合の関係を示す図である。ここでの削除とは、辞書
が一杯になって時点で辞書を半分クリアすることであ
る。図２０（ｂ）に示すように、定常データにおいて
は、従来の場合に比べ未使用の割合が徐々に減ってい
き、それに伴って高次で符号化する割合が増加する。こ
のように部分削除を行うことで、文脈の変化に適応可能
となっている。

【０２３８】（第６実施形態）第６実施形態は、ＥＳＣ
を文脈木に登録しないブレンドモデルを利用すると共
に、ＥＳＣを符号木に登録せずにブレンドスプレー符号
化するデータ圧縮方法及び装置に関する。

【０２３９】最初に、図５を参照して、従来のブレンド
モデルで用いられている文脈木を説明し、次に、図２１
を参照して、第６実施形態におけるブレンドモデルで用
いられる文脈木を説明する。

【０２４０】まず、従来のブレンドモデルで用いられて
いる文脈木には、図５（ａ）に示すように、ＥＳＣが多
数登録されている。これらのＥＳＣは、未出現文字を表
しており、文脈に連なる文字が登録されていないことを
示すために用いられるものである。例えば、図５（ａ）
に示す文脈木には２次文脈ＢＡに連なるＣが登録されて
いないから、２次文脈ＢＡに連なるＣが探索された場合
には、２次のＥＳＣが出力される。

【０２４１】ここで、２次のＥＳＣが登録された節点に
は、図５（ａ）の場合、番号９が付されている。この番
号９の節点に登録された文字列はＢＡであり、属する符
号木の根はlroot(ＢＡ)（lroot=local root）である。

【０２４２】一方、同じ文脈木で番号６が付された節点
は、１次文脈Ｂに連なるＡを探索した結果得られる節点
に相当する。文脈とこの文脈に連なる記号は、同じくＢ
Ａであり、属する符号木の根はlroot(Ｂ) である。番号
６の節点は、ＢＡの内のＡに相当する。

【０２４３】両者の節点とも同じ文字列が対応している
が、その意味は異なる。即ち、前者の節点は、番号９の
節点に登録されたＥＳＣの親に相当する節点であること
を意味しており、後者の節点は、番号１の節点に登録さ
れた文字Ｂの子に相当する節点であることを意味してい
る。

【０２４４】ここで、ＥＳＣがその親の節点に所属して
いると考えて、図５（ａ）の文脈木からＥＳＣを取り除
くと、図２１（ａ）に示す文脈木になる。この図２１
（ａ）に示す文脈木には、ＥＳＣが登録されていない代
わりに、従来のブレンドモデルではＥＳＣがその子とし
て登録されていた節点（例えば、図５（ａ）で番号６の
節点）に、ＥＳＣの内容が併せて登録されている（図２
１（ｂ）参照）。図２１（ｂ）の例では、番号８の節点
には、文字列として“ＢＡＢ”が登録され、節点が表す
第２の符号化（復号化）処理対象文脈に対応する符号木
の根として“０”（これは葉であることを示す）が登録
され、節点の親である符号化（復号化）処理対象文脈に
対応する符号木の根としてlroot(ＢＡ) が登録される。

【０２４５】次に、図５を参照して、従来のブレンドス
プレー符号化で用いられている符号木について説明し、
次に、図２２を参照して、第６実施形態におけるブレン
ドスプレー符号化で用いられる符号木について説明す
る。

【０２４６】まず、図５（ｂ）は、従来のブレンドスプ
レー符号化で用いられる符号木を示している。この符号
木は、図５（ａ）に示される文脈木のなかの番号１の節
点（文字Ｂを登録）を親とした１次文脈に対応する。Ｅ
ＳＣは、文脈木の葉の時（番号７の節点）と同様、独自
の番号を持っている。符号木の根は、２次文脈ＢＡある
いはＢＣを探索した時に得られる。符号木の葉の番号
は、文脈木の節点の番号に、１対１に対応する。

【０２４７】そして、図２２は、６実施形態のブレンド
スプレー符号化で用いられる符号木を示している。この
符号木は、図２１（ａ）に示される文脈木と同様にＥＳ
Ｃが消えている。その代わり、この符号木は、ＥＳＣの
親の右側に位置していた子（右側の子）用のポインタ
が、符号木の根を指している。一方、符号木の根は、空
いていた親用のポインタがＥＳＣの親を指している。

【０２４８】次に、図２３を参照して、従来のブレンド
スプレー符号化及び第６実施形態のブレンドスプレー符
号化における新規文字登録方法について説明する。この
新規文字登録方法は、符号化だけではなく、復号化にも
共通した方法である。図２３（ａ）に示すように、従来
のブレンドスプレー符号化における新規文字登録方法で
は、ＥＳＣの箇所に二つの子を設け、一方の子を新規文
字とし、他方の文字をＥＳＣとしている。

【０２４９】一方、図２３（ｂ）に示すように、第６実
施形態のブレンドスプレー符号化における新規文字登録
方法では、文脈木にＥＳＣがないため、従来の方法でＥ
ＳＣの親となっていた節点の下に新たな節点（番号は２
０）を設け、一方の子を新規文字とし、他方の子が符号
木の根を指すようにする。このようにすることで、符号
木にＥＳＣを登録せずにすむようになる。

【０２５０】次に、図２４を参照して、データ圧縮装置
について説明する。文脈更新部１０６は、符号化が済ん
だ入力文字に基づいて、文脈を更新する。また、文脈更
新部１０６は、更新された文脈を前置データ保持部１０
０−１〜１００−ｎに出力する。

【０２５１】前置データ保持部１００−１〜１００−ｎ
は、文脈更新部１０６で更新された文脈に、前回符号化
した文字を足して新たな文脈を作成する。また、前置デ
ータ保持部１００−１〜１００−ｎは、作成された文脈
を文脈変更部１１０に出力する。

【０２５２】文脈履歴保持部１０１は、文脈変更部１１
０から出力された文脈の子に注目文字が有るか無いかを
調べる。ただし、有るか無いかの判断は、文脈判別部１
０８で行われる。また、文脈履歴保持部１０１には、節
点に関して、「節点が表す第２の符号化（復号化）処理
対象文脈に対応する符号木の根」及び「節点の親である
符号化（復号化）処理対象文脈に対応する符号木の根」
の二つの情報を格納したテーブル（図２１（ｂ）参照）
を有している。

【０２５３】また、文脈履歴保持部１０１は、符号化対
象文字を割り当てられた節点がテーブル中に見つからな
い場合、現在の文脈に対応した符号木でＥＳＣを出力す
ることを指示するＥＳＣ出力指示信号を、符号木決定部
１０３に出力する処理（処理Ａという）を行う。

【０２５４】ＥＳＣ出力指示信号が符号木決定部１０３
に出力された場合、文脈判別部１０８は、文脈の次数を
下げることを指示する次数減少指示信号を文脈変更部１
１０に出力する処理（処理Ｂという）を行う。

【０２５５】処理Ａ及び処理Ｂは、符号化対象文字を割
り当てられた節点がテーブル中に見つかるまで繰り返さ
れる。一方、符号化対象文字を割り当てられた節点がテ
ーブル中に見つかった場合、文脈履歴保持部１０１は、
現在の文脈に対応した符号木を利用して符号化対象文字
の符号を出力することを指示する符号出力指示信号を、
符号木決定部１０３に出力する。

【０２５６】符号木決定部１０３は、符号出力指示信号
を入力した場合に、現在の文脈に対応した符号木を符号
木保持部１０７から入力する。符号化部１０４は、符号
木の構造から符号を算出するとともに、算出した符号を
出力する。

【０２５７】符号木更新部１０５は、符号木の組み替え
操作を行う。文脈履歴保持部１０１及び符号登録部１１
２は、ＥＳＣを最後に符号化した文脈に符号化対象文字
を登録する。

【０２５８】次に、図２５を参照して、符号化部１０４
の詳細な構成を説明する。符号化部１０４には、根の番
号及び葉の番号が入力される。初期判断部１０４ａは、
ＥＳＣを符号化する場合に、通常の葉とは異なる番号
を、ＥＳＣが割り当てられた葉の番号として出力する。
これは、ＥＳＣは独自の節点ではないため、ＥＳＣが割
り当てられた葉の番号がもともと無いためである。

【０２５９】ラッチ１０４ｂは、葉の番号をラッチする
と共に、ラッチした葉の番号を上位節点判別部１０４ｃ
に出力する。情勢節点判断部１０４ｃは、葉の番号と根
の番号とを比較し、注目している節点であるかか否か、
あるいは根が葉であるかか否かを判断する。根であると
判断された場合には、終了信号を出力する。根でないと
判断された場合には、以下のように動作する。

【０２６０】即ち、ＥＳＣを符号化する場合には、通常
の葉とは異なる番号と根の番号を節点番号管理部１０４
ｄに出力する。また、ＥＳＣを符号化する場合には、図
２２に示すように、根の親をたどって、通常の葉が上位
をたどるのと同じことをする。一方、ＥＳＣ以外の文
字を符号化する場合には、通常の節点（葉）番号と
“０”（根の番号の代わり）を節点番号管理部１０４ｄ
に出力する。

【０２６１】節点番号管理部１０４ｄは、上位の節点に
付された番号（単に節点番号という）を上位節点判別部
１０４ｃに出力する。出力された上位の節点番号は、ラ
ッチ１０４ｂでラッチされる。

【０２６２】ラッチ１０４ｂでラッチされていた注目節
点番号及び上位の節点番号は、位置判断部１０４ｅに出
力される。さらに、注目節点番号及び上位の節点番号
は、位置判断部１０４ｅを経由して節点番号管理部１０
４ｄに出力される。

【０２６３】節点番号管理部１０４ｄは、位置判断部１
０４ｅから入力した注目節点番号及び上位の節点番号に
基づいて、注目節点が上位の節点の左側に位置するか右
側に位置するかを表す位置情報を位置判別部１０４ｅに
出力する。ここで、左側に位置すれば位置情報は“０”
であり、右側に位置すれば位置情報は“１”である。

【０２６４】位置情報は、位置判断部１０４ｅを経由し
てスタック１０４ｆに出力される。スタック１０４ｆ
は、図示していないスタックポインターにより位置情報
を管理しており、上位節点判別部１０４ｃから終了信号
が出力されると、それまで管理していた出力情報を取り
出して出力する。

【０２６５】次に、図２６及び図２７を参照して、符号
化処理の流れを説明する。まず、文脈を表すＰ₀ を初期
化する（ステップ２６０１）。ここでの初期化とは、文
脈Ｐ₀ の要素を全て“０”で置き換えることをいう。

【０２６６】そして、文脈を表す変数Ｐに文脈Ｐ₀ をコ
ピーする（ステップ２６０２）。文字Ｋが入力された時
（ステップ２６０３）、文脈Ｐの子として文字Ｋが登録
されているか否かを判別する（ステップ２６０４）。

【０２６７】ステップ２６０４で、「登録されている」
と判別された場合には、文脈Ｐに対応した符号木内で文
字Ｋの葉から根への、内部節点の分岐に対応した符号を
出力する（ステップ２６０５）。

【０２６８】次に、符号木の文字Ｋの葉と他の葉、また
は内部節点とを取り替える（ステップ２６０６）。そし
て、直前の文脈を表すＰ’の符号木に文字Ｋを登録する
（ステップ２６０７）。

【０２６９】そして、文字Ｋを挿入して直前の文脈Ｐ’
を更新する（ステップ２６０８）。そして、全ての文字
が終了したか否かを判断する（ステップ２６１２）。ス
テップ２６１２で、「終了していない」と判断された場
合には、ステップ２６０２に戻る。

【０２７０】ステップ２６１２で、「終了した」と判断
された場合には、処理を終了する。一方、ステップ２６
０４で、「登録されていない」と判断された場合には、
文脈Ｐに対応した符号木内で、根の親のポインタを経
て、再び根まで一巡するまでの、内部節点の分岐に対応
した符号を出力する（ステップ２６１９）。

【０２７１】次に、符号木の根をＥＳＣと仮定し、これ
を他の葉、または内部節点とを取り替える（ステップ２
６１０）。そして、文脈Ｐの次数をを１段階低次に移し
て（（ステップ２６１１）、ステップ２６０４に戻る。

【０２７２】次に、図２７を参照して、ステップ２６０
４、ステップ２６０５及びステップ２６０９に相当する
部分の詳細な処理の流れを説明する。まず、スタック１
０４ｆを初期化する（ステップ２７０１）。

【０２７３】次に、文脈Ｐの子として文字Ｋが登録され
ているか否かを判断する（ステップ２７０２）。ステッ
プ２７０２で、「登録されている」と判断された場合に
は、文脈Ｐの符号木内の葉Ｋを現在の節点Ｌとするとと
もに、葉Ｋの親を上位の節点Ｕとする（ステップ２７０
３）。

【０２７４】ステップ２７０２で、「登録されていな
い」と判断された場合には、符号木の根を現在の節点Ｌ
とするとともに、根の親を上位の節点Ｕとする（ステッ
プ２７０４）。

【０２７５】ステップ２７０３及びステップ２７０４の
処理後に、現在の節点Ｌは上位の節点Ｕの右側にあるか
否かを判断する（ステップ２７０５）。ステップ２７０
５で、「右側にある」と判断された場合には、スタック
１０４ｆに“１”を押し込む（プッシュ）する（ステッ
プ２７０６）。

【０２７６】ステップ２７０５で、「右側にない」（＝
「左側にある」）と判断された場合には、スタック１０
４ｆに“０”を押し込む（プッシュ）する（ステップ２
７０７）。

【０２７７】ステップ２７０６及びステップ２７０７の
処理後に、上位の節点Ｕは符号木の根か否かを判断する
（ステップ２７０８）。ステップ２７０８で、「根でな
い」と判断された場合には、上位の節点Ｕを現在の節点
Ｌとして（ステップ２７０９）、ステップ２７０５に戻
る。

【０２７８】ステップ２７０８で、「根である」と判断
された場合には、スタック１０４ｆの内容を１ビットづ
つ取り出して出力して（ステップ２７１０）、処理を終
了する。

【０２７９】（第７実施形態）第７実施形態は、第６実
施形態で述べた方法で圧縮された符号を復号するデータ
復号方法及び装置に関する。

【０２８０】最初に、図２８を参照して、データ復号装
置について説明する。文脈更新部２０６は、復号化が済
んだ入力文字に基づいて、文脈を更新する。また、文脈
更新部２０６は、更新された文脈を前置データ保持部２
００−１〜２００−ｎに出力する。

【０２８１】前置データ保持部２００−１〜２００−ｎ
は、文脈更新部２０６で更新された文脈に、前回復号化
した文字を足して新たな文脈を作成する。また、前置デ
ータ保持部２００−１〜２００−ｎは、作成された文脈
を文脈変更部２１０に出力する。

【０２８２】文脈履歴保持部２０１は、図２１（ｂ）に
示されるテーブルの欄の一つである「符号木の根になっ
た時」の情報を利用して、文脈に対応した符号木の根を
求める。また、文脈履歴保持部２０１は、求めた符号木
の根を符号木決定部２０３に出力する。

【０２８３】符号木決定部２０３は、現在の文脈に対応
した符号木を符号木保持部２０７から入力する。復号化
部２０４は、符号木を根からたどることで文字を復号化
する処理、復号化された文字を復号データとして出力す
る処理、復号化された内容がＥＳＣの時、文脈の次数を
下げることを指示する次数減少指示信号を文脈変更部２
１０に出力する処理（以上、一連の処理を処理Ｃとい
う）を行う。

【０２８４】符号木更新部２０５は、符号木を組み替え
操作する処理（処理Ｄという）を行う。処理Ｃ及び処理
Ｄは、文字が復号化されるまで繰り返される。

【０２８５】文脈履歴保持部２０１及び符号登録部２１
２は、ＥＳＣが最後に符号化された文脈に注目文字を登
録する。次に、図２９を参照して、復号化部２０４の詳
細な構成を説明する。復号化部２０４には、根の番号及
び符号ビット（ビット形式で表された符号）が入力され
る。

【０２８６】ラッチ２０４ａは、根の番号をラッチする
と共に、ラッチした根の番号を下位節点判別部２０４ｂ
に出力する。下位節点判別部２０４ｂは、符号ビットを
入力して、ラッチ２０４ａから出力された番号を持つ根
が、上位の節点（注目節点）の左側に位置するか右側に
位置するかを判断する。また、下位節点判別部２０４ｂ
は、注目節点の左側あるいは右側に位置する子が持つ番
号（下位節点番号）を獲得することを指示する節点番号
獲得指示信号を節点番号管理部２０４ｄに出力する。

【０２８７】節点番号管理部２０４ｄは、節点番号獲得
指示信号が入力された場合に、下位節点番号を求めると
ともに、求めた下位節点番号を、下位節点判別部２０４
ｂに出力する。また、節点番号管理部２０４ｄは、下位
の文字が、内部節点か葉かを示す位置情報を根／節／葉
判別部２０４ｃに出力する。

【０２８８】節点番号管理部２０４ｄで求められた下位
節点番号は、下位節点判別部２０４ｂでラッチされた
後、根／節／葉判別部２０４ｃに出力される。根／節／
葉判別部２０４ｃは、下位の文字が葉の場合、文字出力
信号を節点番号管理部２０４ｄに出力し、下位の文字が
内部節点の場合、作業を実行し、下位の文字が、ＥＳＣ
が登録された根の場合、終了信号を出力する。

【０２８９】節点番号管理部２０４ｄは、根／節／葉判
別部２０４ｃから文字出力信号が入力されると、文字を
出力する。次に、図３０及び図３１を参照して、復号化
処理の処理の流れを説明する。

【０２９０】まず、文脈を表すＰ₀ を初期化する（ステ
ップ３００１）。ここでの初期化とは、文脈Ｐ₀ の要素
を全て“０”で置き換えることをいう。そして、文脈を
表す変数Ｐに文脈Ｐ₀ をコピーする（ステップ３００
２）。

【０２９１】そして、文脈Ｐから符号木を選択する（ス
テップ３００３）。そして、選択された符号木内で、符
号に応じて根から葉に走査して復号化する（ステップ３
００４）。

【０２９２】そして、復号化した文字を表すＫの葉を他
の葉又は内部節点と取り替える（ステップ３００５）。
ここで、復号化された文字がＥＳＣか通常の文字かを判
断する（ステップ３００６）。

【０２９３】ステップ３００６で、ＥＳＣと判断された
場合に、文脈Ｐの次数を１段階低次に移して（ステップ
３０１０）、ステップ３００３に戻る。ステップ３００
６で、通常の文字と判断された場合に、直前のＥＳＣを
復号化した文脈Ｐ’に対応する符号木に文字Ｋを登録す
る（ステップ３００７）。

【０２９４】そして、同じく直前の文脈Ｐ’に復号文字
Ｋを挿入することで文脈Ｐ’を更新する（ステップ３０
０８）。そして、全文字が終了したか否かを判断する
（ステップ３００９）。

【０２９５】ステップ３００９で全文字が終了していな
いと判断された場合には、ステップ３００２に戻る。ス
テップ３００９で全文字が終了したと判断された場合に
は、一連の処理を終了する。

【０２９６】次に、図３１を参照して、復号化の詳細な
処理の流れを説明する。まず、節点Ｚを根とする（ステ
ップ３１０１）。そして、変数Ｃに１ビットの符号を代
入する（ステップ３１０２）。

【０２９７】そして、Ｃの値が１か否かを判断する（ス
テップ３１０３）。ステップ３１０３で、Ｃの値が１で
あると判断された場合には、節点Ｚの右側の子を節点Ｚ
とする（ステップ３１０４）。

【０２９８】ステップ３１０３で、Ｃの値が１でないと
判断された場合には、節点Ｚの左側の子を節点Ｚとする
（ステップ３１０５）。ステップ３１０４及びステップ
３１０５の後に、節点Ｚが葉であるか否かを判断する
（ステップ３１０６）。

【０２９９】ステップ３１０６で、節点Ｚが葉であると
判断された場合には、葉に登録された文字Ｋを出力して
（ステップ３１０７）、処理を終了する。ステップ３０
１６で、節点Ｚが葉でないと判断された場合には、節点
Ｚが根であるか否かを判断する（ステップ３１０８）。

【０３００】ステップ３１０８で、節点Ｚが根であると
判断された場合には、ＥＳＣを出力して処理を終了する
（ステップ３１０９）。ステップ３１０８で、節点Ｚが
根でないと判断された場合には、ステップ３１０２に戻
る。

【０３０１】

【発明の効果】本発明の第１のデータ圧縮方法によれ
ば、符号情報登録部に対する登録が制限されるため、符
号情報登録部に要するメモリを有効に利用できるととも
に、少ないメモリでも良いデータ圧縮率が得られるよう
になる。

【０３０２】また、本発明の第２〜第２５のデータ圧縮
方法によれば、データ列登録部に登録されるデータ列及
び符号情報登録部に登録される符号化情報が、それぞ
れ、全部あるいは一部削除されるため、文頭に顕著な文
脈が現れていない場合や文脈自体が変化した場合にも、
良いデータ圧縮率が得られるようになる。

【０３０３】そして、本発明の第２６〜第３１のデータ
圧縮方法及び第１〜第３のデータ圧縮装置によれば、未
出現符号（ＥＳＣ）が単独で独自の番号を持つため、ブ
レンドモデルを利用して符号化する場合でも大容量の作
業領域を必要とず、効率の良い辞書容量を達成できる。

【０３０４】さらに、本発明の第１〜第６のデータ復元
方法及び第１〜第３のデータ復元装置によれば、未出現
符号（ＥＳＣ）が単独で独自の番号を持つため、ブレン
ドモデルを利用して復号化する場合でも大容量の作業領
域を必要とず、効率の良い辞書容量を達成できる。

【図面の簡単な説明】

【図１】多値算術符号化の原理図である。（ａ）は文
字、出現頻度及び区間の対応関係を格納するテーブルを
示す。（ｂ）は文字列“ａｂｃ”に対して（ａ）のテー
ブルを利用して区間分割する例を示す。

【図２】スプレー符号化の原理図である。（ａ）はスプ
レー符号化で用いられる符号木の例を示す。（ｂ）はス
プレー符号化で行われるスプレー処理の例を示す。

【図３】文脈木の登録例を示す図である。（ａ）は文脈
と符号化対象文字を示す。（ｂ）は文脈木と各文字の出
現確率を示す。

【図４】文脈の登録例を示す図である。（ａ）は全登録
型の例を示す。（ｂ）は逐次登録型の例を示す。

【図５】スプレー符号化で使用される文脈木と符号木の
例を示す図である。（ａ）は文脈木を示し、（ｂ）は符
号木を示す。

【図６】スプレー符号化で使用される符号木の例を示す
図である。（ａ）は２次文脈の符号木を示す。（ｂ）は
１次文脈の符号木を示す。（ｃ）は０次文脈を示す。

【図７】第１実施形態において、登録制限処理を行って
確率統計適応型符号化するデータ圧縮方法の処理フロー
チャート（その１）である。

【図８】第１実施形態において、登録制限処理を行って
確率統計適応型符号化するデータ圧縮方法の処理フロー
チャート（その２）である。

【図９】第２実施形態において、一定ファイルサイズ毎
に全削除を行って確率統計適応型符号化するデータ圧縮
方法の処理フローチャートである。

【図１０】第２実施形態において、圧縮率低下時に全削
除を行って確率統計適応型符号化するデータ圧縮方法の
処理フローチャートである。

【図１１】第２実施形態において、一定数登録ごとに全
削除を行って確率統計適応型符号化するデータ圧縮方法
の処理フローチャートである。

【図１２】第３実施形態において、一定ファイルサイズ
ごとに部分削除を行って確率統計適応型符号化するデー
タ圧縮方法の処理フローチャートである。

【図１３】第３実施形態において、削除順位リストを更
新して確率統計適応型符号化するデータ圧縮方法の処理
フローチャートである。（ａ）は頻度順に更新する場合
を示し、（ｂ）は最も最近に出現したものを高くする場
合（その１）を示し、（ｃ）は最も最近に出現したもの
を高くする場合（その２）を示す。

【図１４】第３実施形態において、c|aaで符号化したと
きの、削除順位リストを示す図である。（ａ）は頻度順
の場合を示し、（ｂ）は最も最近に出現したものを高く
する場合（その１）を示し、（ｃ）は最も最近に出現し
たものを高くする場合（その２）を示す。

【図１５】第４実施形態において、全削除と部分削除を
組み合わせた処理を行って確率統計適応型符号化するデ
ータ圧縮方法の処理フローチャートである。

【図１６】第５実施形態で行われる文脈木の削除方法の
概念を示す図である。

【図１７】第１〜第５実施形態において、全登録を削除
しない従来の方法でのファイルサイズ、辞書登録数及び
符号化割合の関係を示す図である。（ａ）は、登録した
うち未使用の組の割合を示し、（ｂ）は、高次で符号化
した割合を示す。

【図１８】第１〜第５実施形態において、登録制限を行
うが削除を行わない方法でのファイルサイズ、辞書登録
数及び符号化割合の関係を示す図である。（ａ）は、登
録したうち未使用の組の割合を示し、（ｂ）は、高次で
符号化した割合を示す。

【図１９】第１〜第５実施形態において、全登録を行う
と共に全削除を行う方法でのファイルサイズ、辞書登録
数及び符号化割合の関係を示す図である。（ａ）は、登
録したうち未使用の組の割合を示し、（ｂ）は、高次で
符号化した割合を示す。

【図２０】第１〜第５実施形態において、全登録を行う
と共に部分削除を行う方法でのファイルサイズ、辞書登
録数及び符号化割合の関係を示す図である。（ａ）は登
録したうち未使用の組の割合を示し、（ｂ）は高次で符
号化した割合を示す。

【図２１】第６実施形態における文脈木の例とその登録
内容例を示す図である。（ａ）は文脈木の例を示し、
（ｂ）は登録内容例を示す。

【図２２】第６実施形態における符号木を示す図であ
る。

【図２３】従来の方法及び第６実施形態における新規文
字登録例を示す図である。（ａ）は従来の方法における
新規文字登録例を示し、（ｂ）は第６実施形態における
新規文字登録例を示す。

【図２４】第６実施形態における符号化装置の構成ブロ
ック図である。

【図２５】第６実施形態における符号化装置の符号化部
の詳細構成ブロック図である。

【図２６】第６実施形態における符号化処理の処理フロ
ーチャートである。

【図２７】図２６の詳細処理フローチャートである。こ
の処理フローチャートは、図２６のステップ２６０４、
ステップ２６０５及びステップ２６０９部分に相当す
る。

【図２８】第７実施形態における復号化装置の構成ブロ
ック図である。

【図２９】第７実施形態における復号化装置の復号化部
の詳細構成ブロック図である。

【図３０】第７実施形態における復号化処理の処理フロ
ーチャートである。

【図３１】図３０の詳細処理フローチャートである。こ
の処理フローチャートは、図３０のステップ３００４部
分に相当する。

【符号の説明】

１００・・・前置データ保持部１０１・・・文脈履歴保持部１０３・・・符号木決定部１０４・・・符号化部１０５・・・符号木更新部１０６・・・文脈更新部１０７・・・符号木保持部１０８・・・文脈判別部１１０・・・文脈変更部１１２・・・符号登録部２００・・・前置データ保持部２０１・・・文脈履歴保持部２０３・・・符号木決定部２０４・・・復号化部２０５・・・符号木更新部２０６・・・文脈更新部２０７・・・符号木保持部２１０・・・文脈変更部２１２・・・符号登録部

───────────────────────────────────────────────────── フロントページの続き (72)発明者岡田佳之神奈川県川崎市中原区上小田中1015番地富士通株式会社内 (72)発明者吉田茂神奈川県川崎市中原区上小田中1015番地富士通株式会社内

Claims

【特許請求の範囲】

【請求項１】データ列を登録するデータ列登録部を用い
ると共に、未登録を示すデータが予め含まれて構成され
たデータ列の符号化情報を登録する符号情報登録部を用
い、前記符号化情報は、入力データの履歴に応じて符号
化されるデータ圧縮方法において、新規に入力されたデータの直前に入力されたデータ列を
文脈とするとき、前記文脈と新規入力データからなる符号化対象データ列
を前記データ列登録部に新規登録するデータ列新規登録
過程と、前記符号化対象データ列を符号化した情報を前記符号情
報登録部に新規登録する符号情報新規登録過程と、前記符号情報登録部に登録された符号情報を出力する符
号情報出力過程と、前記符号情報登録部を更新する符号情報更新過程とを備
え、前記データ列新規登録過程では、前記符号化対象データ
列が１回目に出現した時点で、その符号化対象データ列
を前記データ列登録部に新規登録し、前記符号情報新規登録過程では、前記符号化対象データ
列が２回目に出現した時点で、その符号化対象データ列
を符号化した情報を前記符号情報登録部に新規登録する
ことを特徴とするデータ圧縮方法。
【請求項２】前記データ列登録部はデータ列の出現回数
を一定数まで監視し、前記符号情報新規登録過程では、出現回数が所定数を越
えて登録されている符号化対象データ列の符号化情報の
みを新規登録することを特徴とする請求項１に記載のデ
ータ圧縮方法。
【請求項３】データ列を登録するデータ列登録部を用い
ると共に、未登録を示すデータが予め含まれて構成され
たデータ列の符号化情報を登録する符号情報登録部を用
い、前記符号化情報は、入力データの履歴に応じて符号
化されるデータ圧縮方法において、新規に入力されたデータの直前に入力されたデータ列を
文脈とするとき、前記文脈と新規入力データからなる符号化対象データ列
を前記データ列登録部に新規登録するデータ列新規登録
過程と、前記符号化対象データ列を符号化した情報を前記符号情
報登録部に新規登録する符号情報新規登録過程と、前記符号情報登録部に登録された符号情報を出力する符
号情報出力過程と、前記符号情報登録部を更新する符号情報更新過程と、前記データ列登録部に登録されているデータ列を削除す
ると共に、前記符号情報登録部に登録されている符号化
情報を削除するデータ列・符号情報削除過程とを備えた
ことを特徴とするデータ圧縮方法。
【請求項４】前記データ列・符号情報削除過程は、前記データ列登録部に登録されているデータ列及び前記
符号情報登録部に登録されている符号化情報を初期化す
るか否かを判断する初期化判断過程と、前記初期化判断過程で、データ列及び符号化情報を初期
化すると判断した場合に、前記データ列登録部に登録さ
れているデータ列を初期化すると共に、前記符号情報登
録部に登録されている符号化情報を初期化する初期化過
程とを有することを特徴とする請求項３に記載のデータ
圧縮方法。
【請求項５】前記初期化施行判断過程では、新規入力デ
ータの容量の累積値を計数し、計数値が一定量を越える
ごとに、前記初期化過程を施行することを特徴とする請
求項４に記載のデータ圧縮方法。
【請求項６】前記削除施行判断過程では、データ圧縮率
を監視し、このデータ圧縮率が低下した場合に、前記初
期化過程を施行することを特徴とする請求項４に記載の
データ圧縮方法。
【請求項７】前記初期化施行判断過程では、前記データ
列登録部における全登録数が新規登録の際に一定数を超
える場合に、前記初期化過程を施行することを特徴とす
る請求項４に記載のデータ圧縮方法。
【請求項８】前記データ列・符号情報削除過程は、前記データ列登録部に登録されているデータ列及び前記
符号情報登録部に登録されている符号化情報を削除する
か否かを判断する削除判断過程と、前記削除施行判断過程で、削除すると判断した場合に、
削除するデータ列及び符号化情報を選別する削除対象選
別過程と、前記削除対象選別過程で選別されたデータ列及び前記符
号化情報を、それぞれ前記データ列登録部及び前記符号
情報登録部から削除する削除過程とを有することを特徴
とする請求項３に記載のデータ圧縮方法。
【請求項９】前記削除対象選別過程では、前記データ列
登録部を木構造でみた場合に、木の内部節点であるノー
ド及び木の終端であるリーフを指すポインタ全てを削除
順位リストに登録し、この削除順位リストで低位に登録
されたポインタが指すデータ列及び符号化情報を前記削
除過程にて削除することを特徴とする請求項８に記載の
データ圧縮方法。
【請求項１０】前記削除対象選別過程では、前記データ
列登録部を木構造でみた場合に、木の終端であるリーフ
を指すポインタを一つの削除順位リストに登録し、この
削除順位リストで低位に登録されたポインタが指すデー
タ列及び符号化情報を前記削除過程にて削除することを
特徴とする請求項８に記載のデータ圧縮方法。
【請求項１１】前記削除対象選別過程では、前記ポイン
タの出現回数を監視して、出現回数の高いポインタを前
記削除順位リストの高位に登録することを特徴とする請
求項９に記載のデータ圧縮方法。
【請求項１２】前記削除対象選別過程では、新規登録の
リーフに相当するポインタを前記削除順位リストの最高
順位に登録し、新規登録によってリーフが内部ノードに
なった場合には、その内部ノードになったものを指すポ
インタを削除することを特徴とする請求項８に記載のデ
ータ圧縮方法。
【請求項１３】前記削除対象選別過程では、新規登録の
リーフに相当するポインタを前記削除順位リストの最高
順位に登録し、そのリーフの親及び先祖に相当する内部
ノードを指すポインタの順位を繰り下げることを特徴と
する請求項８に記載のデータ圧縮方法。
【請求項１４】前記削除対象選別過程では、新規登録の
リーフに相当するポインタを前記削除順位リストの最低
順位に登録し、新規登録によってリーフが内部ノードに
なった場合には、その内部ノードになったものを指すポ
インタを削除することを特徴とする請求項８に記載のデ
ータ圧縮方法。
【請求項１５】前記削除対象選別過程では、新規登録の
リーフに相当するポインタを前記削除順位リストの最低
順位に登録し、そのリーフの親及び先祖に相当する内部
ノードを指すポインタの順位を繰り下げることを特徴と
する請求項８に記載のデータ圧縮方法。
【請求項１６】前記削除対象選別過程では、新規登録の
リーフに相当するポインタを前記削除順位リストの最低
順位に登録し、新規登録によってリーフが内部ノードに
なった場合には、その内部ノードになったものを指すポ
インタを削除することを特徴とする請求項８に記載のデ
ータ圧縮方法。
【請求項１７】前記削除対象選別過程では、新規登録の
リーフに相当するポインタを前記削除順位リストの最低
順位に登録し、そのリーフの親及び先祖に相当する内部
ノードを指すポインタの順位を繰り下げることを特徴と
する請求項８に記載のデータ圧縮方法。
【請求項１８】前記削除対象選別過程では、出現回数が
所定値以下となったデータ列及び符号化情報を削除対象
として選別することを特徴とする請求項８に記載のデー
タ圧縮方法。
【請求項１９】前記削除対象選別過程では、ある文脈の
出現回数の合計値を求め、前記文脈に続いて入力された
データの出現回数が前記合計値に対して所定比以下とな
る場合に、該データを削除対象として選別することを特
徴とする請求項８に記載のデータ圧縮方法。
【請求項２０】前記削除施行判断過程では、前記データ
列登録部における登録数を監視し、新規登録の際にこの
数が一定数を超える場合、前記削除対象選別過程におい
て選別された削除対象の一つを前記削除過程で削除し、
換わりに新規登録の組を登録することを特徴とする請求
項８に記載のデータ圧縮方法。
【請求項２１】前記削除過程では、前記データ列登録部
に登録されているデータ列の半分を削除し、削除された
データ列に対応する符号化情報を前記符号情報登録部か
ら削除することを特徴とする請求項８に記載のデータ圧
縮方法。
【請求項２２】前記データ列・符号情報削除過程は、削
除するデータ列及び符号化情報を選別する削除対象選別
過程を有し、新規登録の際に、前記データ列登録部の登
録数が所定数を越えていれば、削除対象選別過程で選別
された削除対象の一つを削除すると共に新規登録の組を
登録し、データ圧縮率が低減していれば、全削除を行う
ことを特徴とする請求項３に記載のデータ圧縮方法。
【請求項２３】前記符号情報登録部が２分木構造の符号
木でできている場合に、符号木の葉であるリーフをデー
タとする共に、符号木の根であるルートから各リーフま
での経路を符号とし、前記符号情報更新過程では、前記符号木の頂点から新規
入力データ及び未登録を示すデータのいずれか一方が登
録されたリーフを、他のリーフもしくは符号木の頂点以
外の分岐点であるノードのいずれか一方と取り替えるこ
とにより符号木を更新し、前記符号情報新規登録過程では、前記符号木のリーフを
分岐して得た新規リーフに符号情報を登録し、前記データ列・符号情報削除過程では、符号木のリーフ
を、１経路分だけルートに近い所に位置する分岐ノード
とともに削除することをを特徴とする請求項３に記載の
データ圧縮方法。
【請求項２４】前記符号情報登録部に登録される符号情
報は、算術符号化方式により符号化されることを特徴と
する請求項１に記載のデータ圧縮方法。
【請求項２５】前記データ列・符号情報削除過程は、前記データ列登録部に登録されているデータ列及び前記
符号情報登録部に登録されている符号化情報を削除する
か否かを判断する削除判断過程と、前記削除施行判断過程で削除すると判断した場合に、削
除するデータ列及び前記符号化情報を選別する削除対象
選別過程と、前記削除対象選別過程で選別されたデータ列及び符号化
情報を、それぞれ前記データ列登録部及び前記符号情報
登録部から削除する削除過程と、削除過程で削除された後の前記符号情報登録部を更新す
る削除用更新過程とを有し、前記削除用更新過程では、符号情報の出現回数を２の倍
数で割り、割った値が１以下になる場合にその出現回数
を１とすることを特徴とする請求項２４に記載のデータ
圧縮方法。
【請求項２６】種類が限定された文字を対象とし、入力
文字を、既に出現した文字列を表す文脈に応じて符号化
することにより圧縮するデータ圧縮方法において、符号化処理対象文脈及びその子である符号化対象文字の
組み合わせを文脈辞書に登録する文脈辞書登録過程と、前記文脈辞書に登録された前記符号化対象文字を符号化
したときの情報を符号表に登録する符号表登録過程と、文脈に含まれる文字数で表される次数を設定する次数設
定過程と、設定された次数を有する前記符号化処理対象文脈及び前
記符号化対象文字の組み合わせが前記文脈辞書に登録さ
れているか否かを判別する登録判別過程と、前記符号化処理対象文脈及び前記符号化対象文字の組み
合わせががない場合に、より低い次数の文脈への脱出を
示す未出現符号を、設定された次数の文脈に対応した符
号表に登録する未出現符号登録過程と、前記登録判別過程で、前記符号化処理対象文脈及び前記
符号化対象文字の組み合わせが登録されていないと判別
された場合に、前記設定されている次数の未出現符号を
出力するとともに設定されている次数を一つ下げる処理
を行う未登録処理過程と、前記登録判別過程で、前記符号化処理対象文脈及び前記
符号化対象文字の組み合わせが登録されていると判別さ
れるまで、前記登録判別過程、前記追加登録過程及び前
記未登録処理過程を繰り返す繰り返し過程と、前記登録判別過程で、前記符号化処理対象文脈及び前記
符号化対象文字の組み合わせが登録されていると判別さ
れた場合に、前記符号表から、符号化対象文字に対応し
た符号を出力する符号出力過程と、前記符号化対象文字を、符号化された次数より上の次数
の前記文脈辞書及び前記符号表に追加登録する追加登録
過程と備え、前記未出現符号は、設定されている次数の文脈に対応し
ていることを特徴とするデータ圧縮方法。
【請求項２７】請求項２６において、前記符号表の未出現符号は、符号表の格納場所に対応す
る関係にあり、未出現の文字を符号化する場合に、符号表の格納場所に
対応する符号を出力することを特徴とするデータ圧縮方
法。
【請求項２８】請求項２６において、前記符号化処理対象文脈と前記符号化対象文字との各組
み合わせに関して、前記符号化処理対象文脈に対応する
符号表の格納場所と、前記符号化処理対象文脈に符号化
対象文字を連結して生成される第２の符号化処理対象文
脈に対応する符号表の格納場所とを登録し、前記第２の符号化処理対象文脈に関する未出現符号を出
力する場合に、前記第２の符号化処理対象文脈に対応す
る符号表の格納場所を利用することを特徴とするデータ
圧縮方法。
【請求項２９】種類が限定された文字を対象とし、入力
文字を、既に出現した文字列を表す文脈に応じて符号化
することにより圧縮されたデータを復元するデータ復元
方法において、文脈に含まれる文字数で表される次数を設定する次数設
定過程と、復号化済みの文字と所定の次数の文脈との組合せを文脈
辞書に登録する文脈辞書登録過程と、復号化のための情報を復号化した各文脈毎に独立して符
号表に登録する符号表登録過程と、直前に復号化した所定の次数の復号化処理対象文脈に対
応した符号表を決定する符号表決定過程と、設定されている次数の復号化処理対象文脈に復号化対象
文字が登録されていない場合に、より低い次数の文脈へ
の脱出を示す未出現符号を、設定されている次数の文脈
に対応した符号表に登録する未出現符号登録過程と、文字が復元できるまで、各次数の未出現符号を復元する
と共に設定されている次数を一つ下げる処理を行う復元
処理過程と、文字が復元できた場合に、符号に対応した文字を符号表
から出力する文字出力過程と、文字がある次数で復元できた場合に、復元できた文字
を、復元できた次数より上の次数の前記文脈辞書及び前
記符号表に追加登録する復元文字追加登録過程とを備
え、設定されている次数の前記復号化処理対象文脈における
未出現符号を、設定されている次数の文脈に対応させる
ことを特徴とするデータ復元方法。
【請求項３０】請求項２９において、前記符号表の未出現符号は、符号表の格納場所に対応す
る関係にあり、符号表の格納場所に対応する符号に対しては、未出現符
号として復元化することを特徴とするデータ復元方法。
【請求項３１】請求項２９において、前記文脈辞書登録過程では、前記復号化処理対象文脈と
前記復号化対象文字との各組み合わせに関して、前記復
号化処理対象文脈に対応する符号表の格納場所と、前記
復号化処理対象文脈に復号化対象文字を連結して生成さ
れる第２の復号化処理対象文脈の格納場所とを登録し、前記第２の復号化処理対象文脈を復元化する場合に、前
記第２の復号化処理対象文脈の格納場所を利用すること
を特徴とするデータ復元方法。
【請求項３２】請求項２６において、前記文脈辞書は、文脈木として構成され、前記符号表は、２分木からなる符号木として構成されて
いることを特徴とするデータ圧縮方法。
【請求項３３】請求項３２において、前記符号木内の未出現符号に相当する各枝の内の最後に
枝を、前記符号木の根に結合させ、未出現符号を符号化
する場合には、符号木の根からその親をたどり、再び、
根に戻るまで、各節点の分岐に応じた符号を出力するこ
とを特徴とするデータ圧縮方法。
【請求項３４】請求項３２において、前記符号化処理対象文脈と前記符号化対象文字との各組
み合わせに関して、前記符号化処理対象文脈に対応する
符号木の根と、前記符号化処理対象文脈に符号化対象文
字を連結して生成される第２の符号化処理対象文脈に対
応する符号木の根とを登録し、前記第２の符号化処理対象文脈に関する未出現符号を出
力する場合に、前記第２の符号化処理対象文脈に対応す
る符号木の根を利用することを特徴とするデータ圧縮方
法。
【請求項３５】請求項２９において、前記文脈辞書は、文脈木として構成され、前記符号表は、２分木からなる符号木として構成されて
いることを特徴とするデータ復元方法。
【請求項３６】請求項３５において、前記符号木内の未出現符号に相当する各枝の内の最後の
枝を、符号木の根に結合させ、未出現符号を復号化する
場合には、符号木の根から左右の子を符号ビットに応じ
てたどり、再び、根に戻ることで未出現符号と判断する
ことを特徴とするデータ復元方法。
【請求項３７】請求項３５において、前記復号化処理対象文脈と前記復号化対象文字との各組
み合わせに関して、前記復号化処理対象文脈に対応する
符号木の根を登録するとともに、前記復号化処理対象文
脈に復号化対象文字を連結して生成される第２の復号化
処理対象文脈に対応する符号木の根を登録し、前記第２の復号化処理対象文脈を復元化する場合に、前
記第２の復号化処理対象文脈に対応する符号木の根を利
用することを特徴とするデータ復元方法。
【請求項３８】種類が限定された文字を対象とし、入力
文字を、既に出現した文字列を表す文脈に応じて符号化
することにより圧縮するデータ圧縮装置において、符号化処理対象文脈及びその子である符号化対象文字の
組み合わせを文脈辞書に登録する文脈辞書登録部と、前記文脈辞書に登録された前記符号化対象文字を符号化
したときの情報を、２分木からなる符号木に登録する符
号木登録部と、文脈に含まれる文字数で表される次数を設定する次数設
定部と、設定された次数を有する前記符号化処理対象文脈及び前
記符号化対象文字の組み合わせが前記文脈辞書に登録さ
れているか否かを判別する登録判別部と、前記符号化処理対象文脈及び前記符号化対象文字の組み
合わせががない場合に、より低い次数の文脈への脱出を
示す未出現符号を、設定された次数の文脈に対応した符
号木の根として登録する未出現符号登録部と、前記登録判別部で、前記符号化処理対象文脈及び前記符
号化対象文字の組み合わせが登録されていないと判別さ
れた場合に、前記設定されている次数の未出現符号を出
力するとともに設定されている次数を一つ下げる処理を
行う未登録処理部と、前記登録判別部で、前記符号化処理対象文脈及び前記符
号化対象文字の組み合わせが登録されていると判別され
るまで、前記登録判別部、前記追加登録部及び前記未登
録処理部で行われる処理を繰り返す繰り返し部と、前記登録判別部で、前記符号化処理対象文脈及び前記符
号化対象文字の組み合わせが登録されていると判別され
た場合に、前記符号木の根から符号化対象文字が格納さ
れている葉までの節点の分岐に応じた符号を出力する符
号出力部と、前記登録判別部で、前記符号化処理対象文脈及び符号化
対象文字の組み合わせが登録されていると判別された場
合に、前記符号化対象文字を、前記組み合わせがあると
判別された次数より上の次数の前記文脈辞書及び前記符
号木に追加して登録する符号化対象文字追加登録部と備
え、前記文脈辞書登録部では、登録する文脈に一意の識別子
を割り当て、前記符号木登録部では、前記符号木の根に一意の識別子
を割り当て、前記未出現符号登録部では、前記文脈辞書登録部で割り
当てられた識別子と一致するともに、前記符号木登録部
で割り当てられた識別子とも一致する識別子を前記未出
現符号に割り当てることを特徴とするデータ圧縮装置。
【請求項３９】請求項３８において、前記符号出力部は、符号化対象文字が未出現文字か一般
の文字かを判断するとともに、前記初期判断部で未出現
文字と判断された場合に、前記符号木の根からその親を
たどり、再び、根に戻るまで、前記符号木の節点を探索
することを特徴とするデータ圧縮装置。
【請求項４０】請求項３８において、前記文脈辞書登録部では、前記符号化処理対象文脈と前
記符号化対象文字との各組み合わせに関して、前記符号
化処理対象文脈に対応する符号木の根と、前記符号化処
理対象文脈に符号化対象文字を連結して生成される第２
の符号化処理対象文脈に対応する符号木の根とを登録
し、前記符号出力部では、前記第２の符号化処理対象文脈に
関する未出現符号を出力する場合に、前記第２の符号化
処理対象文脈に対応する符号木の根を利用することを特
徴とするデータ圧縮装置。
【請求項４１】種類が限定された文字を対象とし、入力
文字を、既に出現した文字列を表す文脈に応じて符号化
することにより圧縮されたデータを復元するデータ復元
装置において、文脈に含まれる文字数で表される次数を設定する次数設
定部と、復号化済みの文字と所定の次数の文脈との組合せを文脈
辞書に登録する文脈辞書登録部と、復号化のための情報を復号化した各文脈毎に独立して、
２分木からなる符号木に登録する符号木登録部と、直前に復号化した所定の次数の復号化処理対象文脈に対
応した符号木を決定する符号木決定部と、復号化対象文字が、設定されている次数の復号化処理対
象文脈に登録されていない場合に、より低い次数の文脈
への脱出を表す未出現符号を、設定されている次数の文
脈に対応した符号木の根として登録する未出現符号登録
部と、文字を復元できるまで、各次数の未出現符号を復元した
後、復号化処理対象文脈の次数を下げて復元の処理を繰
り返す文脈変更部と、前記符号木の根から出発し、符号の各ビットに応じて節
点の分岐をたどり、復号化対象文字が登録されている葉
まで着いた後、文字を出力する復号化部と、復元化した文字を、復元できた次数より上の次数の前記
文脈及び前記符号木に登録する復元文字登録部とを備
え、前記文脈辞書登録部では、登録する文脈に一意の識別子
を割り当て、前記符号木登録部では、前記符号木の根に一意の識別子
を割り当て、前記未出現符号登録部では、前記文脈辞書登録部で割り
当てられた識別子と一致するともに、前記符号木登録部
で割り当てられた識別子とも一致する識別子を前記未出
現符号に割り当てることを特徴とするデータ復元装置。
【請求項４２】請求項４１において、前記復号化部では、未出現符号を復号化する場合に、符
号木の根から左右の子を符号ビットに応じてたどり、再
び根にもどることを確認することにより、未出現符号と
判断することを特徴とするデータ復元装置。
【請求項４３】請求項４１において、前記文脈辞書登録部では、前記復号化処理対象文脈と前
記復号化対象文字との各組み合わせに関して、前記復号
化処理対象文脈に対応する符号木の根と、前記復号化処
理対象文脈に復号化対象文字を連結して生成される第２
の復号化処理対象文脈に対応する符号木の根とを登録
し、前記符号出力部では、前記第２の復号化処理対象文
脈に関して復号化する場合に、前記第２の復号化処理対
象文脈に対応する符号木の根を利用することを特徴とす
るデータ復元装置。