JPH0644038A

JPH0644038A - データ圧縮方法、データ復元方法、データ圧縮／復元方法

Info

Publication number: JPH0644038A
Application number: JP19535192A
Authority: JP
Inventors: Yasuhiko Nakano; 泰彦中野; Yoshiyuki Okada; 佳之岡田; Shigeru Yoshida; 茂吉田; Hirotaka Chiba; 広隆千葉
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1992-07-22
Filing date: 1992-07-22
Publication date: 1994-02-18

Abstract

(57)【要約】【目的】圧縮対象データの持つ冗長度を取り除き、効
率良く圧縮できるようにする。【構成】前処理部１０の確率計算部１２により、前回
までに入力された単位データに基づき、単位データ内で
の所定の１又は複数の各ビット別に、該ビットの論理値
が他の所定の１又は複数のビットの論理値の組み合わせ
を条件として生起する確率を求めておき、ビット置換部
１４により、今回入力された単位データの所定の１又は
複数の各ビットを、該ビットの条件付論理生起確率が大
のとき「０」、小のとき「１」となるように置換したの
ち符号化部１６へ出力する。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明はデータ圧縮方法、データ
復元方法、データ圧縮／復元方法に係わり、特にユニバ
ーサル符号などデータを所定ビット長単位で扱う場合で
も、単位データ内での冗長性の取り込みを可能としたデ
ータ圧縮方法、データ復元方法、データ圧縮／復元方法
に関する。

【０００２】近年、ＯＡ（オフィスオートメーション）
の発展に伴い、ファクシミリ通信、光ディスクファイル
システムなどで、文字コード情報や画像情報が大量に扱
われるようになってきており、伝送や蓄積を効率的に行
うためにデータの圧縮が必須となっている。文字コード
の効率的な圧縮方式には、Ziv-Lempel符号に代表される
ユニバーサル符号が有り、画像情報の効率的な圧縮方式
には、ＭＨ方式（Modified HuffmanCoding)、ＭＭＲ（M
odified Modified READ）方式、予測符号化方式が有
る。ユニバーサル符号は、情報源の統計的な性質を予め
仮定しないため、種々のタイプ（文字コード、オブジェ
クトコードなど）のデータに適用可能であるが、文字コ
ード情報と画像情報は統計的性質が大きく異なるため、
ユニバーサル符号化方式をそのまま画像情報に適用して
も１／２程度の圧縮率しか得られず、ＭＨ方式、ＭＭＲ
方式等の画像情報用の圧縮方式に較べて、非常に低いも
のとなっている。このため、従来は、文字コード情報と
画像情報を異なる方式で圧縮していたが、１つのシステ
ムで両者を扱う場合、ハード上の負担が大きくなってい
た。本発明はこのような状況に鑑み、圧縮対象データの
持つ冗長度を取り除き、効率良く圧縮できるようにする
ものである。

【０００３】

【従来の技術】近年、ＯＡで扱う文書や画像の情報量が
急速に増加してきており、ファクシミリ通信、光ディス
クファイルシステムなどで、伝送や蓄積を効率的に行う
ため、データ中の冗長な部分を除くデータ圧縮が不可欠
となっている。文字情報を対象とした効率の良い圧縮方
式として、ジブ−レンペル（Ziv-Lempel）符号に代表さ
れるユニバーサル符号が有る（宗像「Ziv-Lempelのデー
タ圧縮法」、情報処理、Vol.26,No.1,1985年参照）。こ
のZiv-Lempel符号では、ユニバーサル型と、増分分
解型（Incremental parsing)の２つのアルゴリズムが提
案されており、ユニバーサル型アルゴリズムを用いた実
用的な方法として、ＬＺＳＳ符号（T.C. Bell,"Better
OMP/L Text Compression",IEEE Trans. on Commun., Vo
l. COM-34, No.12, Dec.1986）があり、又、増分分解型
アルゴリズムを用いた実用的な方法として、ＬＺＷ（Le
mpel-Ziv-Welch) 符号がある(T.A. Welch,"A Technique
for High-Performance Data Compression", Computer,
June 1984) 。

【０００４】ＬＺＳＳ符号ＬＺＳＳ符号化においては、既に出現して符号化済の入
力データを記憶部（Ｐバッファ）に記憶すると共に、符
号化済データの任意の位置から始まる部分列データより
入力データと最大長に一致する部分データ列を探し、該
一致部分データ列の先頭文字の記憶部（Ｐバッファ）に
おけるアドレスと一致長とを示す情報により、入力デー
タ列を符号化する。このＬＺＳＳ符号化においては、演
算量は多いが、高圧縮率が得られる。

【０００５】図１１はかかるＬＺＳＳ符号化の説明図で
あり、１はＱバッファ、２はＰバッファである。入力文
字コードが１バイトで表現されるものとして、Ｑバッフ
ァ１は例えば４ビットのインデックス情報（アドレス）
を持ち、これから符号化する１６（＝２⁴）個の文字列
を格納するもの、Ｐバッファ２は例えば１２ビットのイ
ンデックス情報（アドレス）を持ち、最新に符号化され
た４０９６（＝２¹²）個の文字列を格納するものであ
る。

【０００６】図示しないユニバーサル符号化部は、Ｑバ
ッファ１の先頭からの文字列とＰバッファ２の任意の位
置から始まる文字列とを照合して最大長一致部分文字列
３を求め、「該部分文字列のＰバッファにおける一致開
始位置ｐ₁」と「部分文字列の一致長ｑ₁」とを用いて
Ｑバッファの部分文字列３´を符号化して記憶する。し
かる後、ユニバーサル符号化部はＱバッファ１内の符号
化した文字列３´をＰバッファ２に移すと共に該文字列
数分の最も古い符号化済み文字列をＰバッファ２から捨
て、かつ符号化した文字列３´の文字数分の新たな文字
列をＱバッファ１内に入力し、以降、前述の符号化処理
を継続する。尚、最大一致長が１の場合には、符号化せ
ず、Ｑバッファ１の先頭文字データ（生データという）
をそのまま記憶する。これは、符号化データとして２バ
イト必要であるが、生データは１バイトで済むからであ
る。

【０００７】そして、８個の符号化データ又は生データ
が記憶されれば、図１１（ｂ）に示すように、符号化デ
ータと生データの識別を表示するための８個のフラグビ
ットより成る識別データを先頭に附加し（”０”は符号
データ、”１”は生データ）、この一組のデータを順次
出力する。

【０００８】ＬＺＷ符号一方、ＬＺＷ符号化においては、書換可能な辞書を設
け、入力文字列を相異なる文字列に分け、この文字列を
出現した順に番号を付けて辞書に登録すると共に、現在
入力している文字列を辞書に登録してある最長一致文字
列の辞書番号だけで表して符号化する。このＬＺＷ符号
化によれば、圧縮率はＬＺＳＳ符号化より劣るが、シン
プルで、計算も容易で、高速処理ができることから記憶
装置のファイル圧縮、データ伝送などで使われるように
なっている。

【０００９】図１２はＬＺＷ符号化の説明図、図１３は
辞書構成の説明図、図１４はＬＺＷ符号化処理の流れ図
である。なお、説明を簡単にするために、ａ，ｂ，ｃ３
文字からなる文字列を対象にするものとする。予め、全
文字につき一文字からなる文字列（ａ，ｂ，ｃ）に登録
番号を付して辞書に初期登録すると共に、辞書アドレス
Ｎを文字種数Ｍ＋１とする（図１２のステップ１０
１）。

【００１０】かかる状態で、最初の文字Ｋを入力し、該
文字の登録番号を参照番号ωとし、これを語頭文字列
（prefix string)とする（ステップ１０２）。次いで、
入力データの次の文字Ｋを読み込み（ステップ１０
３）、ステップ１０２で求めた語頭文字列ωにステップ
１０３で読み込んだ文字Ｋを加えた文字列（ωＫ）が現
在の辞書にあるか否かを検索する（ステップ１０４）。

【００１１】文字列（ωＫ）が辞書に存在すれば、文字
列（ωＫ）をωに置き換え（ステップ１０５）、しかる
後、入力データが終了したか判断し（ステップ１０
６）、データが終了していなければステップ１０３に戻
り以降の処理を繰り返し、文字列（ωＫ）が辞書から探
せなくなるまで最大一致長文字列の検索を続ける。一
方、ステップ１０６において、入力データが終了してい
れば、参照番号ωを符号語code（ω）として出力して
（ステップ１０７）、符号化処理を終了する。

【００１２】最長一致文字列の検索が続行して、ステッ
プ１０４において、文字列（ωＫ）が辞書に存在しなく
なれば、参照番号ωを符号語code（ω) として出力し、
又、文字列（ωＫ）に新たな登録番号Ｎを附加して辞書
に登録し、更に、ステップ１０３で読み込んだ文字Ｋの
登録番号を参照番号ωに書き換えると共に、辞書アドレ
スＮをインクリメントする（ステップ１０８）。次い
で、ステップ１０６により入力データが終了したか判断
し、判断結果に応じて以降の処理を繰り返す。

【００１３】図１２及び図１３を参照してＬＺＷ符号化
を具体的に説明すると、以下のようになる。即ち、図１
２の入力データを左から右に向けて１文字ずつ読み込
む。最初の文字ａを読み込んだ時、辞書にはａの他に一
致する文字列はないから、ａの登録番号「１」（参照番
号ω＝１）を符号語（code（ω））として出力する。そ
して、拡張した文字列ａｂに登録番号４を付けて辞書に
登録する。実際の登録は文字列「１ｂ」の形となる。続
いて、２番目の文字ｂが入力文字列の先頭になる。辞書
にはｂの他に一致する文字列がないので、ｂの登録番号
（参照番号）２を符号語として出力し、拡張した文字列
ｂａを実際には２ａの形で登録番号５を付けて辞書に登
録する。

【００１４】以上により、３番目の文字ａが入力文字列
の先頭になる。辞書には先頭文字ａが存在するから、該
文字の登録番号１に次の文字ｂを付した文字列「１ｂ」
が存在するか調べる。文字列「１ｂ」が存在するから、
該文字列の登録番号４に次の文字ｃを付した文字列「４
ｃ」が存在するか調べる。文字列「４ｃ」は存在しない
から、最長一致文字列「１ｂ」の登録番号「４」を符号
語として出力し、拡張した文字列「４ｃ」に登録番号６
を付して辞書登録し、以降同様に符号化と辞書登録を繰
り返して全入力文字のＬＺＷ符号化処理を実行する。

【００１５】因みに、図１５はＬＺＷ復号化処理の流れ
図であり、復号化処理では、符号化の逆の操作が行われ
る。即ち、復号化に際しては、符号化と同様に、全文字
につき一文字からなる文字列（ａ，ｂ，ｃ）に登録番号
を付して辞書に初期登録すると共に、辞書アドレスＮを
文字種数Ｍ＋１とする（図１５のステップ２０１）。つ
いで、最初の符号CODEを読み込み、該符号CODEをOLDcod
e とする。又、最初の符号は既に辞書に登録された一文
字の登録番号のいずれかに該当することから、入力符号
CODE（＝登録番号）が示す文字Ｋを出力する。又、出力
した文字Ｋは後の例外処理のためにcharとして設定する
（以上、ステップ２０２）。

【００１６】しかる後、次の符号CODEを読み込んでNEWc
ode としてセットすると共に（ステップ２０３）、符号
CODE（＝登録番号）が辞書に定義（登録）されているか
否かをチェックする（ステップ２０４）。通常、入力し
た符号CODE（＝登録番号）は前回までの処理で辞書に登
録されているから、ステップ２０４において「ＮＯ」と
なるから、次に、符号CODE（＝登録番号）が指示する辞
書の登録文字列が（ωＫ）か判断する。即ち、符号CODE
が指示する辞書の登録文字列が( ωＫ）のように、参照
番号ωと文字Ｋの結合文字列であるか判断する（ステッ
プ２０５）。

【００１７】参照番号ωと文字Ｋの結合文字列であれ
ば、文字Ｋを一時的にスタックし、参照番号ωの符号語
code（ω）（実際にはcode（ω）＝ω）を新たなCODEと
し、かつ、文字数Ｃを１だけカウントアップし（ステッ
プ２０６）、ステップ２０５に戻る。以降、ステップ２
０５、２０６の処理をCODEが示す登録文字列が一文字に
至まで再帰的に繰り返す。

【００１８】ステップ２０５において、CODEが示す文字
列が一文字の場合には、即ち、符号CODEが指示する辞書
の登録文字列が（Ｋ）の場合には、Ｋを出力し、しかる
後、スタックしたＣ個の文字列をＬＩＦＯ（Last In Fa
st Out）形式でポップアップして出力する。又、前回の
復号化において使用した符号OLDcode に、今回復号した
文字列の先頭文字Ｋを附加した文字列（OLDcode ，Ｋ）
を登録番号Ｎを付して辞書に登録し、Ｎをインクリメン
トする（Ｎ＋１→Ｎ）。更に、復号文字列の先頭文字Ｋ
をcharとし、かつ、NEWcode をOLDcode とする（以上、
ステップ２０７）。

【００１９】以降、符号入力が終了したか判断し（ステ
ップ２０８）、終了していなければステップ２０３に戻
り次の符号を読み込んで復号処理を繰り返す。ところ
で、符号化処理においては、ある文字列の符号化と、該
文字列に次の先頭文字を附加した文字列の辞書登録とを
同時に行うため、次の符号化処理において直前に符号化
した文字列の符号語を使用できる。しかし、復号化処理
においては、直前に復号した文字列に、今回復号した文
字列の先頭文字列を附加した文字列を辞書登録するた
め、辞書登録が符号化処理に較べて１回遅れる。このた
め、符号化処理において、直前に符号化した文字列の符
号語を使用すると、復号化処理において、該符号語が登
録（定義）されていない場合を生じる。この場合がステ
ップ２０４においてCODEが定義されていない状態にな
り、「ＹＥＳ」となる。

【００２０】例えば、図１６に示すように符号化に際し
て、文字列「ａ・・・ｚ」に対してOLDcode を出力する
と共に、文字列「ａ・・・ｚａ」をNEWcode として辞書
登録し、次の文字列「ａ・・・ｚａ」をNEWcode で出力
し、文字列「ａ・・・ｚａｂ」を辞書登録する。さて、
復号側で符号語NEWcode を読み込んだ時、該符号語は復
号側で辞書登録されていないので、復号ができない。し
かし、NEWcode とOLDcode を比較すると、以下の関係 NEWcode の文字列＝OLDcode の文字列＋OLDcode の文字
列の先頭文字（char)がある。このため、ステップ２０
４で「ＮＯ」となれば、セットされているcharをスタッ
クすると共に、OLDcode をCODEとみなし、かつ、OLDcod
e にcharを附加した文字列をNEWcode とし（ステップ２
０９）、以降、CODEを用いてステップ２０５以降の処理
を行う。

【００２１】図１７を参照して復号化処理を具体的に説
明すると以下のようになる。最初の入力符号は「１」で
あり、一文字ａ，ｂ，ｃについては既に登録番号１，
２，３として辞書登録されているから（図１３と同
様）、辞書の参照により符号「１」に一致する登録番号
の文字列ａに置き換えて出力する。次に、符号「２」に
ついても同様にして文字ｂに置き換えて出力する。この
時、前回処理した符号と今回復号した最初の一文字ｂと
を組み合わせた「１ｂ」に新たな登録番号４を附加して
辞書に登録する。

【００２２】３番目の符号「４」は辞書の検索により、
「１ｂ」から「ａｂ」と置き換えて文字列「ａｂ」を出
力する。同時に、前回処理した符号「２」と今回復号し
た１番目の文字ａとを組み合わせた文字列「２ａ（＝ｂ
ａ）」に新たな登録番号を附加して辞書に登録する。以
下、同様に、復号処理を繰り返す。尚、図１５のステッ
プ２０９の例外処理は、第６番目の入力符号「８」の復
号で生じる。符号「８」は復号時に辞書に定義されてお
らず、復号できない。この場合には、前回処理した符号
「５」に前回復号した文字列「ｂａ」の最初の一文字ｂ
を加えた文字列「５ｂ」を求め、更に「２ａｂ」、「ｂ
ａｂ」と置き換えられて出力される。そして、前回の符
号語「５」に今回復号した文字列の文字ｂを加えた文字
列「５ｂ」に登録番号「８」を附加して辞書登録する。

【００２３】このように、Ziv-Lempel符号は、現在の文
字コードの系列を、符号化済みの過去の系列に対する複
製として符号化するものであり、文字コードからなる文
書情報を１／２〜数分の１程度に圧縮することができ
る。Ziv-Lempel符号に代表されるユニバーサル符号は、
情報保存型のデータ圧縮方式であり、データ圧縮時に情
報源の統計的な性質を予め仮定しないため、「万能」の
名が示す通り、種々のタイプ（文字コード、オブジェク
トコードなど）のデータに適用することができる。

【００２４】一方、画像情報を対象とした効率の良い圧
縮方式として、モディファイドハフマン符号方式（Ｍ
Ｈ方式；Modified Huffman Coding)、モディファイド
モディファイドリード方式（ＭＭＲ；Modified Modifie
d READ（Relative AddressDesignate Coding））方式、
予測符号化方式が有る。ＭＨ方式ＭＨ方式は、２値画像に対する１次元圧縮方式として国
際標準（ファクシミリ通信Ｇ３規格）となっている。こ
のＭＨ方式は、白または黒の画素が連続する長さ（Run
Length）をハフマン符号で可変長符号化してデータ圧縮
するものであり、ハフマン符号は、符号語数を減らすた
め、６４ビット以下の長さを表すターミネイティング符
号と６４の倍数を表すメイクアップ符号とで構成され
る。通常の文書画像であれば、ＭＨ方式により、数分の
１に圧縮できる。

【００２５】ＭＭＲ方式ＭＭＲ方式は２値画像に対する２次元圧縮方式として国
際標準（ファクシミリ通信Ｇ４規格）となっている。こ
のＭＭＲ方式は、主走査方向に見ていって白から黒、又
は黒から白に変化する画素を変化画素とし、隣接する走
査線間で変化画素の表す白黒パターンの境界のずれ（変
化画素相対アドレス）が小さいという変化画素の接続関
係に着目してデータ圧縮するものである。ＭＭＲ方式に
より、通常の文書画像であれば、数分の１から１０数分
の１に圧縮できる。

【００２６】予測符号化方式ＴＶ会議システム、ハイビジョン放送等で実用化されて
いる。規則正しい模様の画像や平坦な画像は、１枚の画
像が有する空間的冗長度が大きく、隣接する画素間の相
関が強い。このような画像の場合、すでに符号化された
画素の値から次に符号化すべき画素の値を予測し、予測
できなかった成分だけ抽出して符号化することで、大幅
に圧縮できる。また、動きの小さい動画像においては、
相続くフレームの画像が互いに類似していて、時間的冗
長度が大きい。このような場合、前フレームとの差分を
符号化することで、圧縮可能となる。

【００２７】

【発明が解決しようとする課題】ところで、ＭＨ方式、
ＭＭＲ方式、予測符号化方式のいずれも画像情報用の圧
縮方式なので、文字コード情報には適用できない。シス
テムが文字コード情報と画像情報のいずれも扱うような
場合、文字コード用の圧縮方式と画像用の圧縮方式を別
個に用意するのが有利であるが、ハード的な負担が大と
なってしまう。一方、前述したユニバーサル符号は、そ
の汎用性から画像情報にも適用でき、文字コードと画像
情報のいずれもユニバーサル符号で圧縮することができ
る。但し、画像情報は文字コード情報と較べて統計的性
質が大きく異なっており、Ziv-lempel符号を適用した場
合、１／２程度の圧縮ができるだけで、ＭＭＲ方式、予
測符号化方式などに較べると、圧縮率が非常に低いとい
う問題があった。これは、ユニバーサル符号はデータを
バイト単位で処理するため、バイト単位の文字コードに
適合しているものの、画像情報ではバイト単位で見たと
き、種々のパターンが均等に出現して、１バイト中のビ
ット単位の冗長性を捕らえることができないからであ
り、換言すれば、ＭＭＲ方式が画像の２次元的相関を利
用してデータ圧縮するのに対し、ユニバーサル符号は時
系列で出現する文字コードを１次元的相関を利用して圧
縮するという相違が有るからである。

【００２８】以上から本発明の目的は、圧縮対象データ
の持つ冗長度を取り除き、効率良く圧縮できるようにし
たデータ圧縮方法、データ復元方法、データ圧縮／復元
方法を提供することである。

【００２９】

【課題を解決するための手段】図１は本発明の原理説明
図である。１０は所定ビット長単位で入力される原デー
タに対し、所定の前処理を行う前処理部であり、１２は
前回までに入力された単位データに基づき、単位データ
内での所定の１又は複数の各ビット別に、該ビットの論
理値が他の所定の１又は複数のビットの論理値の組み合
わせを条件として生起する確率を求める確率計算部、１
４は確率計算部の計算結果を参照して、今回の入力単位
データの所定の１又は複数の各ビットを、該ビットの条
件付論理生起確率が大のとき「０」（又は「１」）、小
のとき「１」（又は「０」）となるように置換するビッ
ト置換部である。１６は前処理部から出力されたデータ
を所定ビット長単位で、ユニバーサル符号化して圧縮す
る符号化部である。

【００３０】

【作用】前処理部１０の確率計算部１２により、前回ま
でに入力された単位データに基づき、単位データ内での
所定の１又は複数の各ビット別に、該ビットの論理値が
他の所定の１又は複数のビットの論理値の組み合わせを
条件として生起する確率を求めておき、ビット置換部１
４により、今回入力された単位データの所定の１又は複
数の各ビットを、該ビットの条件付論理生起確率が大の
とき「０」（又は「１」）、小のとき「１」（又は
「０」）となるように置換したのち符号化部１２へ出力
する。符号化部１２は、前処理の済んだデータを所定ビ
ット長単位でユニバーサル符号化して出力する。

【００３１】これにより、入力データの内、所定のビッ
トが「０」と「１」のいずれの論理値であっても、条件
付論理生起確率が大のビットを「０」（又は「１」）に
置き換えて、所定ビット長として見たとき「０」（又は
「１」）の多いパターンに偏らせることができ、ビット
単位の冗長度を減らし、その後、所定ビット長単位でな
される符号化で高い圧縮率を実現することが可能とな
る。

【００３２】圧縮符号化データを所定の方式で復号化
し、ｎビット長単位の復元データとする復元方法におい
て、復号化後、前回までに完全に復元された単位データ
に基づき、単位データ内での所定の１又は複数のビット
について、各ビット別に、該ビットの論理値が他の所定
の１又は複数のビットの論理値の組み合わせを条件とし
て生起する確率を求めておくとともに、今回復号化され
た単位データの所定の１又は複数の各ビットを、逐次、
該ビットの両論理値に係る条件付論理生起確率の大小
と、当該ビットの論理値との組み合わせに従い所定論理
値に逆置換する後処理を行って、完全に復元した単位デ
ータを得る。これにより、圧縮時に符号化の前段で、ビ
ット単位の冗長度を削減するように前処理されていて
も、復元側では、確実に前処理される前の原データを復
元することが可能となる。

【００３３】ｎビット長単位で入力されるデータを、所
定の方式で圧縮し符号化するとともに、圧縮符号化デー
タを所定の方式で復号化し、ｎビット長単位の復元デー
タとするデータ圧縮／復元方法において、圧縮時、符号
化前に、前回までに入力された単位データに基づき、単
位データ内での所定の１又は複数のビットについて、各
ビット別に、該ビットの論理値が他の所定の１又は複数
のビットの論理値の組み合わせを条件として生起する確
率を求めておくとともに、今回入力された単位データの
所定の１又は複数の各ビットを、該ビットの条件付論理
生起確率が大か小かに従い、互いに異なる所定論理値に
置換する前処理を行うようにし、復元時、復号化後、前
回までに完全に復元された単位データに基づき、単位デ
ータ内での所定の１又は複数のビットについて、各ビッ
ト別に、該ビットの論理値が他の所定の１又は複数のビ
ットの論理値の組み合わせを条件として生起する確率を
求めておくとともに、今回復号化された単位データの所
定の１又は複数の各ビットを、逐次、該ビットの両論理
値に係る条件付論理生起確率の大小と、当該ビットの論
理値との組み合わせに従い所定論理値に逆置換する後処
理を行って、完全に復元した単位データを得る。これに
より、圧縮時は、符号化の前段で、ビット単位の冗長度
を削減するように前処理することで、高い圧縮率を実現
可能となり、又、復元側では、確実に前処理される前の
原データを完全に復元することが可能となる。

【００３４】

【実施例】図２は本発明の実施例構成図であり、図１と
同一部分には同一符号を付している。１０は圧縮側にお
いて符号化の前段で、１バイト単位で入力される原デー
タに対し、前処理を行う前処理部、１２は前回までに入
力された全単位データに基づき、単位データ内での最上
位桁を除く各ビット（２ＳＢ〜ＬＳＢ）別に、該ビット
の論理値が他の所定の１又は複数のビットの論理値の組
み合わせを条件として生起する確率を求める確率計算部
であり、具体的には、１バイト単位でデータが入力され
る毎に、単位データ内での最上位桁以外の各ビットに関
し、最上位桁から該ビットの１桁上までの論理値の組み
合わせを条件とする条件付論理生起確率を累積的に求め
る。また、確率計算部１２は、単位データの最上位桁
（ＭＳＢ）については、単純に論理生起確率を累積的に
求める。１４は確率計算部の計算結果を参照して、今回
入力した単位データ内の最上位桁を除く各ビットを、該
ビットに係る条件付論理生起確率が大のとき「０」、小
のとき「１」となるように置換するビット置換部であ
る。なお、最上位桁については、該ビットの論理値に係
る論理生起確率が大のとき「０」、小のとき「１」とな
るように置換する。１６は前処理から出力されたデータ
をバイト単位で、ユニバーサル符号化する符号化部であ
る。

【００３５】確率計算部１２は図３に示す２分木テーブ
ルを書き換え自在に記憶するメモリ１２Ａを有してお
り、１バイトデータが入力される毎に、逐次、該データ
のＭＳＢの累積的な論理生起確率を計算するとともに、
２ＳＢ乃至ＬＳＢの累積的な条件付論理生起確率を計算
し、メモリ１２Ａに更新記憶する。図３において、２分
木の１段目乃至８段目は、入力１バイトデータのＭＳＢ
乃至ＬＳＢに対応している。Ａ(1) はＭＳＢが「１」と
なる論理生起確率、Ａ(2) はＭＳＢが「０」となる論理
生起確率を表している。ＭＳＢが「１」となった累積頻
度をａ(1) 、「０」となった累積頻度をａ(2) とする
と、Ａ(1) ＝ａ(1) ／（ａ(1)+ａ(2) ）Ａ(2) ＝ａ(2) ／（ａ(1)+ａ(2) ）として求められる。

【００３６】Ｂ(1) はＭＳＢが「１」であったときに、
２ＳＢが「１」となる条件付論理生起確率、Ｂ(2) はＭ
ＳＢが「１」であったときに、２ＳＢが「０」となる条
件付論理生起確率、Ｂ(3) はＭＳＢが「０」であったと
きに、２ＳＢが「１」となる条件付論理生起確率、Ｂ
(4) はＭＳＢが「０」であったときに、２ＳＢが「０」
となる条件付論理生起確率を表している。ＭＳＢが
「１」かつ２ＳＢが「１」となった累積頻度をｂ(1) 、
ＭＳＢが「１」かつ２ＳＢが「０」となった累積頻度を
ｂ(2) 、ＭＳＢが「０」かつ２ＳＢが「１」となった累
積頻度をｂ(3) 、ＭＳＢが「０」かつ２ＳＢが「０」と
なった累積頻度をｂ(4) とすると、Ｂ(1) ＝ｂ(1) ／ａ(1) Ｂ(2) ＝ｂ(2) ／ａ(1) Ｂ(3) ＝ｂ(3) ／ａ(2) Ｂ(4) ＝ｂ(4) ／ａ(2) として求められる。

【００３７】Ｃ(1) はＭＳＢが「１」、２ＳＢが「１」
であったときに、３ＳＢが「１」となる条件付論理生起
確率、Ｃ(2) はＭＳＢが「１」、２ＳＢが「１」であっ
たときに、３ＳＢが「０」となる条件付論理生起確率、
Ｃ(3) はＭＳＢが「１」、２ＳＢが「０」であったとき
に、３ＳＢが「１」となる条件付論理生起確率、Ｃ(4)
はＭＳＢが「１」、２ＳＢが「０」であったときに、３
ＳＢが「０」となる条件付論理生起確率、Ｃ(5) はＭＳ
Ｂが「０」、２ＳＢが「１」であったときに、３ＳＢが
「１」となる条件付論理生起確率、Ｃ(6) はＭＳＢが
「０」、２ＳＢが「１」であったときに、３ＳＢが
「０」となる条件付論理生起確率、Ｃ(7) はＭＳＢが
「０」、２ＳＢが「０」であったときに、３ＳＢが
「１」となる条件付論理生起確率、Ｃ(8) はＭＳＢが
「０」、２ＳＢが「０」であったときに、３ＳＢが
「０」となる条件付論理生起確率を表している。

【００３８】ＭＳＢが「１」かつ２ＳＢが「１」かつ３
ＳＢが「１」となった累積頻度をｃ(1) 、ＭＳＢが
「１」かつ２ＳＢが「１」かつ３ＳＢが「０」となった
累積頻度をｃ(2) 、ＭＳＢが「１」かつ２ＳＢが「０」
かつ３ＳＢが「１」となった累積頻度をｃ(3) 、ＭＳＢ
が「１」かつ２ＳＢが「０」かつ３ＳＢが「０」となっ
た累積頻度をｃ(4) 、ＭＳＢが「０」かつ２ＳＢが
「１」かつ３ＳＢが「１」となった累積頻度をｃ(5) 、
ＭＳＢが「０」かつ２ＳＢが「１」かつ３ＳＢが「０」
となった累積頻度をｃ(6) 、ＭＳＢが「０」かつ２ＳＢ
が「０」かつ３ＳＢが「１」となった累積頻度をｃ(7)
、ＭＳＢが「０」かつ２ＳＢが「０」かつ３ＳＢが
「０」となった累積頻度をｃ(8) とすると、Ｃ(1) ＝ｃ(1) ／ｂ(1) Ｃ(2) ＝ｃ(2) ／ｂ(1) Ｃ(3) ＝ｃ(3) ／ｂ(2) Ｃ(4) ＝ｃ(4) ／ｂ(2) Ｃ(5) ＝ｃ(5) ／ｂ(3) Ｃ(6) ＝ｃ(6) ／ｂ(3) Ｃ(7) ＝ｃ(7) ／ｂ(4) Ｃ(8) ＝ｃ(8) ／ｂ(4) として求められる。

【００３９】以下、同様にして、Ｄ(1) 乃至Ｄ(16)が４
ＳＢの種々の条件付論理生起確率、Ｅ(1) 乃至Ｅ(32)が
５ＳＢの種々の条件付論理生起確率、Ｆ(1) 乃至Ｆ(64)
が６ＳＢの種々の条件付論理生起確率、Ｇ(1) 乃至Ｇ(1
28) が７ＳＢの種々の条件付論理生起確率、Ｈ(1) 乃至
Ｈ(256) がＬＳＢの種々の条件付論理生起確率を表して
おり、所定の２つの累積頻度の割り算として求められ
る。なお、確率を求める割り算の分母と分子の累積頻度
がともに０のときは、確率＝零とされる。１バイトデー
タが入力される毎に、確率計算部１２は２分木テーブル
の各論理生起確率と条件付論理生起確率を計算し直し、
メモリ１２Ａに記憶された２分木テーブルを更新する。

【００４０】ビット置換部１４は、１バイトデータが入
力されると、その時点で確率計算部１２のメモリ１２Ａ
に記憶されている２分木テーブルを参照して、ビット置
換を行う。具体的には、最上位桁を除く各ビット別に、
該ビットの実際の論理値に係る条件付論理生起確率の方
が、該ビットの反転論理値に係る条件付論理生起確率よ
り大きいとき、当該ビットを「０」に置換し、小さいと
き「１」に置換する。当該ビットの実際の論理値に係る
条件付論理生起確率と、当該ビットの反転論理値に係る
条件付論理生起確率が等しいときは、当該ビットが
「１」である方の条件付論理生起確率が大きいとして扱
う。また、最上位桁については、該ビットの論理値に係
る論理生起確率の方が、該ビットの反転論理値に係る論
理生起確率より大きいとき、当該ビットを「０」に置換
し、小さいとき「１」に置換する。当該ビットの実際の
論理値に係る論理生起確率と、当該ビットの反転論理値
に係る論理生起確率が等しいときは、当該ビットが
「１」である方の論理生起確率が大きいとして扱う。例
えば、前回までに入力された全ての単位データ（ＤＴ₁
〜ＤＴ_i-1）に基づき求めた２分木テーブルが図４
（ａ）の如くであり、今回の１バイト分の原入力データ
ＤＴ_iが図４（ｂ）に示す如く、「０１１０１１０１」
であったならば、ＤＴ_i´＝「１００１００００」に置
換される。

【００４１】図２に戻って、２０は復元側において、ユ
ニバーサル符号化データをユニバーサル復号化する復号
化部、２２は復号化の後段で、復号化された１バイト単
位のデータに対し、所定の後処理を行い完全な復元デー
タに戻して出力する後処理部である。２４は前回までに
完全に復元された全ての単位データに基づき、単位デー
タ内での最上位桁を除く各ビット（２ＳＢ〜ＬＳＢ）別
に、該ビットの論理値が他の所定の１又は複数のビット
の論理値の組み合わせを条件として生起する確率を求め
る確率計算部であり、具体的には、１バイト単位の復元
データが入力される毎に、単位データ内での最上位桁以
外の各ビットに関し、最上位桁から該ビットの１桁上ま
での論理値を条件とする条件付論理生起確率を累積的に
求める。また、確率計算部２４は復元データの最上位桁
（ＭＳＢ）については、単純に論理生起確率を累積的に
求める。

【００４２】２６は確率計算部の計算結果を参照して、
復号化部で復号された単位データ内の各ビットを、逐
次、ＭＳＢ側から、ビットの両論理値に係る論理生起確
率又は条件付論理生起確率の大小と、当該ビットの論理
値との組み合わせに従い所定論理値に逆置換し、圧縮側
の原データと同じ完全な復元データを出力するビット逆
置換部である。ビット逆置換部２６から出力された完全
な復元データは、確率計算部２４に入力される。

【００４３】確率計算部２４は図３と同じ２分木テーブ
ルを書き換え自在に記憶するメモリ２４Ａを有してお
り、圧縮側の確率計算部１２と全く同様にして、完全に
復元された１バイトデータが入力される毎に、逐次、該
データのＭＳＢの累積的な論理生起確率を計算するとと
もに、２ＳＢ乃至ＬＳＢの累積的な条件付論理生起確率
を計算し、メモリ２４Ａに更新記憶させる。

【００４４】ビット逆置換部２６は、復号化部２０から
復号化された１バイトデータが入力されると、その時点
で確率計算部２４のメモリ２４Ａに記憶されている２分
木テーブルを参照して、ビットの逆置換を行う。具体的
には、まず、ＭＳＢについて、該ビットの論理値が
「１」であるときの論理生起確率の方が、「０」である
ときの論理生起確率より大きいとき（等しい場合を含
む）、当該ビットの実際の論理値が「０」のときは
「１」，「１」のときは「０」となるように逆置換し、
当該ビットの論理値が「１」であるときの論理生起確率
の方が、「０」であるときの論理生起確率より小さいと
き、当該ビットの実際の論理値が「０」のときは
「０」，「１」のときは「１」となるように逆置換す
る。次に、２ＳＢについて、先に逆置換したＭＳＢの論
理値を条件として、２ＳＢの論理値が「１」であるとき
の条件付論理生起確率の方が、「０」であるときの条件
付論理生起確率より大きいとき（等しい場合を含む）、
当該ビットの実際の論理値が「０」のときは「１」，
「１」のときは「０」となるように逆置換し、当該ビッ
トの論理値が「１」であるときの条件付論理生起確率の
方が、「０」であるときの条件付論理生起確率より小さ
いとき、当該ビットの実際の論理値が「０」のときは
「０」，「１」のときは「１」となるように逆置換す
る。

【００４５】次に３ＳＢについて、先に逆置換したＭＳ
Ｂと２ＳＢの論理値を条件として、３ＳＢの論理値が
「１」であるときの条件付論理生起確率の方が、「０」
であるときの条件付論理生起確率より大きいとき（等し
い場合を含む）、当該ビットの実際の論理値が「０」の
ときは「１」，「１」のときは「０」となるように逆置
換し、当該ビットの論理値が「１」であるときの条件付
論理生起確率の方が、「０」であるときの条件付論理生
起確率より小さいとき、当該ビットの実際の論理値が
「０」のときは「０」，「１」のときは「１」となるよ
うに逆置換する。４ＳＢ以降についても同様に、逐次、
自身より上位桁の逆置換後の論理値の組み合わせを条件
として、当該ビットの論理値が「１」であるときの条件
付論理生起確率の方が、「０」であるときの条件付論理
生起確率より大きいとき（等しい場合を含む）、当該ビ
ットの実際の論理値が「０」のときは「１」，「１」の
ときは「０」となるように逆置換し、当該ビットの論理
値が「１」であるときの条件付論理生起確率の方が、
「０」であるときの条件付論理生起確率より小さいと
き、当該ビットの実際の論理値が「０」のときは
「０」，「１」のときは「１」となるように逆置換す
る。

【００４６】例えば、前回までに完全に復元された全て
の単位データ（ＤＲ₁〜ＤＲ_i-1）に基づき求めた２分
木テーブルが図５（ａ）の如くであり、今回の１バイト
分の復号化データＤＲ_i´が図５（ｂ）に示す如く、
「１００１００００」であったならば、最終的に「０１
１０１１０１」に逆置換される。

【００４７】図６は上記した実施例の圧縮処理を示す流
れ図、図７は圧縮時のビット置換動作の説明図、図８は
復元処理を示す流れ図、図９と図１０は復元時のビット
逆置換動作の説明図であり、以下、これらの図に従って
説明する。圧縮処理データの圧縮を開始するとき、最初に確率計算部１２は
メモリ１２Ａに記憶された２分木テーブルの各論理生起
確率及び条件付論理生起確率を全て零に初期設定する
（図６のステップ１０１）。原データがバイト単位で入
力される毎に、前処理部１０はビット単位での冗長度を
取り除く前処理を行って、符号化部１６へ出力する。

【００４８】この前処理では、単位データを１つ入力す
ると（ステップ１０２）、まず、ビット置換部１４が確
率計算部１２のメモリ１２Ａに記憶された２分木テーブ
ルを参照して、今回入力した単位データの各ビット別
に、ＭＳＢは該ＭＳＢの実際の論理値に対応する論理生
起確率が、該ＭＳＢの反転論理値に対応する論理生起確
率より大きいとき「０」，小さいとき「１」に置換し
（２つの確率が等しいときはＭＳＢが「１」となってい
る方の確率が大きいとして扱う）、２ＳＢ乃至ＬＳＢ
は、各ビットの実際の論理値に係る条件付論理値に対応
する条件付論理生起確率が、該ビットの反転論理値に係
る条件付論理生起確率より大きいとき「０」，小さいと
き「１」に置換し（２つの確率が等しいときは当該ビッ
トが「１」となっている方の確率が大きいとして扱
う）、置換後の１バイトの単位データを符号化部１６へ
出力する（ステップ１０３）。予め、２分木テーブルの
初期化により、ＭＳＢ乃至ＬＳＢのいずれも、「１」と
なっている方の確率が大きいとされるので、最初の入力
データが、ＤＴ₁＝（１１１１０１０１）であるとする
と、ビット置換後のデータは、ＤＴ₁´＝（００００１
０１０）となる。

【００４９】次に、確率計算部１２は、今回の入力デー
タを用いて、２分木テーブルにおける１段目の論理生起
確率と２乃至８段目の条件付論理生起確率を計算し直
し、メモリ１２Ａに書き換え記憶させる（ステップ１０
４）。具体的には、ＤＴ₁の場合、ＭＳＢが「１」なの
で、ａ(1) ＝１，ａ(2) ＝０となり、Ａ(1) ＝ａ(1) ／（ａ(1) ＋ａ(2) ）＝１／１Ａ(2) ＝ａ(1) ／（ａ(1) ＋ａ(2) ）＝０／１Ａ(1) ＋Ａ(2) ＝１となる。また、ＭＳＢ＝「１」の下で２ＳＢ＝「１」と
なっているので、ｂ(1) ＝１，ｂ(2) ＝０となり、Ｂ(1) ＝ｂ(1) ／ａ(1) ＝１／１Ｂ(2) ＝ｂ(2) ／ａ(1) ＝０／１Ｂ(1) ＋Ｂ(2) ＝１となる（但し、Ｂ(3) ，Ｂ(4) は零のまま）。

【００５０】更に、ＭＳＢ＝「１」，２ＳＢ＝「１」の
下で３ＳＢ＝「１」となっているので、ｃ(1) ＝１，ｃ
(2) ＝０となり、Ｃ(1) ＝ｃ(1) ／ｂ(1) ＝１／１Ｃ(2) ＝ｃ(1) ／ｂ(1) ＝０／１Ｃ(1) ＋Ｃ(2) ＝１となる（但し、Ｃ(3) 乃至Ｃ(8) は零のまま）。また、
ＭＳＢ＝「１」，２ＳＢ＝「１」，３ＳＢ＝「１」の下
で４ＳＢ＝「１」となっているので、ｄ(1) ＝１，ｄ
(2) ＝０となり、Ｄ(1) ＝ｄ(1) ／ｃ(1) ＝１／１Ｄ(2) ＝ｄ(2) ／ｃ(1) ＝０／１Ｄ(1) ＋Ｄ(2) ＝１となる（但し、Ｄ(3) 乃至Ｄ(16)は零のまま）。

【００５１】同様にして、５ＳＢ＝「０」より、ｅ(1)
＝０，ｅ(2) ＝１となり、Ｅ(1) ＝０／１，Ｅ(2) ＝１
／１となる（但し、Ｅ(3) 乃至Ｅ(32)は零のまま) 。ま
た、６ＳＢ＝「１」より、ｆ(3) ＝１，ｆ(4) ＝０とな
り、Ｆ(3) ＝１／１，Ｆ(4)＝０／１となる（但し、Ｆ
(1) ，Ｆ(2) ，Ｆ(5) 乃至Ｆ(64)は零のまま) 。また、
７ＳＢ＝「０」より、ｇ(5) ＝０，ｇ(6) ＝１となり、
Ｇ(5) ＝０／１，Ｇ(6) ＝１／１となる（但し、Ｇ(1)
乃至Ｇ(4) ，Ｇ(7) 乃至Ｇ(128) は零のまま)。また、
ＬＳＢ＝「１」より、ｈ(11)＝１，ｈ(12)＝０となり、
Ｈ(11)＝１／１，Ｈ(12)＝０／１となる（但し、Ｈ(1)
乃至Ｈ(10)，Ｈ(13)乃至Ｈ(256) は零のまま) 。このよ
うにして、確率計算を終えたならば、メモリ１２Ａの２
分木テーブルを今回の計算結果で書き換えて更新する。

【００５２】一方、符号化部１６はビット置換された単
位データＴＤ₁´を入力すると、ユニバーサル符号化し
て圧縮し、符号化データを出力する（ステップ１０
５）。次に、前処理部１０が２番目の単位データを入力
すると（ステップ１０６でＮＯ、１０２）、まず、ビッ
ト置換部１２が確率計算部１２のメモリ１２Ａに記憶さ
れた２分木テーブル（前回までの入力データに基づき、
最新のテーブルとされている）を参照して、今回入力し
た単位データの各ビット別に、所定のビット置換を行
い、置換後の１バイトの単位データを符号化部１６へ出
力する（ステップ１０３）。２番目の入力データがＤＴ
₂＝（１１１１００１０）であるとすると、ＭＳＢの論
理生起確率，２ＳＢ乃至４ＳＢ，６ＳＢ乃至ＬＳＢにつ
いての条件付論理生起確率は「１」の方が大、５ＳＢの
条件付論理生起確率は「０」の方が大となっているの
で、ビット置換後のデータＤＴ₂´＝（０００００１０
１）となる（図７参照）。

【００５３】次に、確率計算部１２は、今回の入力デー
タを用いて、２分木テーブルにおける１段目の論理生起
確率と２乃至８段目の条件付論理生起確率を計算し直
し、メモリ１２Ａに書き換え記憶させる（ステップ１０
４）。具体的には、ＤＴ₂のＭＳＢが「１」なので、ａ
(1) ＝２，ａ(2) ＝０となり、Ａ(1) ＝ａ(1) ／（ａ(1) ＋ａ(2) ）＝２／２Ａ(2) ＝ａ(1) ／（ａ(1) ＋ａ(2) ）＝０／２Ａ(1) ＋Ａ(2) ＝１となる。また、ＭＳＢ＝「１」の下で２ＳＢ＝「１」と
なっているので、ｂ(1) ＝２，ｂ(2) ＝０となり、Ｂ(1) ＝ｂ(1) ／ａ(1) ＝２／２Ｂ(2) ＝ｂ(2) ／ａ(1) ＝０／２Ｂ(1) ＋Ｂ(2) ＝１となる（但し、Ｂ(3) ，Ｂ(4) は零のまま）。

【００５４】更に、ＭＳＢ＝「１」，２ＳＢ＝「１」の
下で３ＳＢ＝「１」となっているので、ｃ(1) ＝２，ｃ
(2) ＝０となり、Ｃ(1) ＝ｃ(1) ／ｂ(1) ＝２／２Ｃ(2) ＝ｃ(2) ／ｂ(1) ＝０／２Ｃ(1) ＋Ｃ(2) ＝１となる（但し、Ｃ(3) 乃至Ｃ(8) は零のまま）。また、
ＭＳＢ＝「１」，２ＳＢ＝「１」，３ＳＢ＝「１」の下
で４ＳＢ＝「１」となっているので、ｄ(1) ＝２，ｄ
(2) ＝０となり、Ｄ(1) ＝ｄ(1) ／ｃ(1) ＝２／２Ｄ(2) ＝ｄ(2) ／ｃ(1) ＝０／２Ｄ(1) ＋Ｄ(2) ＝１となる（但し、Ｄ(3) 乃至Ｄ(16)は零のまま）。

【００５５】同様にして、５ＳＢ＝「０」より、ｅ(1)
＝０，ｅ(2) ＝２となり、Ｅ(1) ＝０／２，Ｅ(2) ＝２
／２となる（但し、Ｅ(3) 乃至Ｅ(32)は零のまま) 。ま
た、６ＳＢ＝「０」より、ｆ(3) ＝１，ｆ(4) ＝１とな
り、Ｆ(3) ＝１／２，Ｆ(4)＝１／２となる（但し、Ｆ
(1) ，Ｆ(2) ，Ｆ(5) 乃至Ｆ(64)は零のまま) 。また、
７ＳＢ＝「１」より、ｇ(7) ＝１，ｇ(8) ＝０となり、
Ｇ(7) ＝０／１，Ｇ(8) ＝１／１となる（但し、Ｇ(5)
＝０／１、Ｇ(6) ＝１／１、Ｇ(1) 乃至Ｇ(4)，Ｇ(9)
乃至Ｇ(128) は零のまま) 。また、ＬＳＢ＝「０」よ
り、ｈ(13)＝０，ｈ(14)＝１となり、Ｈ(13)＝０／１，
Ｈ(14)＝１／１となる（但し、Ｈ(11)＝１／１、Ｈ(12)
＝０／１、Ｈ(1) 乃至Ｈ(10)，Ｈ(15)乃至Ｈ(256) は零
のまま) 。このようにして、確率計算を終えたならば、
メモリ１２Ａの２分木テーブルを今回の計算結果で書き
換えて更新する。

【００５６】ビット置換部１４でビット置換された１バ
イトデータＤＴ₂´は符号化部１６でユニバーサル符号
化されて出力される（ステップ１０５）。以下、同様に
して、逐次入力される単位データに対し、ビット置換部
１４でのビット置換、確率計算部１２での２分木テーブ
ルの更新、符号化部１６での符号化を繰り返していく。
或る程度、処理が進み、前回までに入力された全ての単
位データ（ＤＴ₁〜ＤＴ_i-1）に基づき求めた２分木テ
ーブルが図４（ａ）の如くなった状態で、新たな今回の
１バイト分の原入力データＤＴ_iが図４（ｂ）に示す如
く、「０１１０１１０１」であったならば、ビット置換
後のデータＤＴ_i´は「１００１００００」となり、
「０」の多いパターンに変わることが判る。

【００５７】単位データのＭＳＢに「０」又は「１」の
出現頻度に偏りがあったり、２ＳＢ以下の各ビットにつ
き、上位桁側のビットとの間に相関、即ち冗長度が存在
しているとき、論理生起確率や条件付論理生起確率に偏
りが生じることになる。このとき、論理生起確率や条件
付論理生起確率が大となったビットが「０」に置き換え
られて、１バイト長として見たとき「０」の多いパター
ンに偏るので、ビット単位の冗長度が減り、その後、１
バイト単位でなされる符号化で高い圧縮率を実現するこ
とが可能となる。尚、以上の説明では条件付論理生起確
率が大となったビットが説明ではすべて「０」に置き換
えているが、これを「１」に置き換えてもよい。即ち、
条件付論理生起確率が大→「０」、条件付論理生起確率
が小→「１」にする場合と、条件付論理生起確率が大→
「１」、条件付論理生起確率が小→「０」の２つの組が
考えられ、どちらか一方に決定する。単位データの入力
が終了したならば、圧縮処理を終える（ステップ１０６
でＹＥＳ）。

【００５８】復元処理データの復元を開始するとき、最初に確率計算部２４は
メモリ２４Ａに記憶された２分木テーブルの各論理生起
確率及び条件付論理生起確率を全て零に初期設定する
（図８のステップ２０１）。ユニバーサル符号化データ
が入力される毎に、復号化部２０はユニバーサル復号化
を行い復号化データを後処理部へ出力する（ステップ２
０２、２０３）。例えば、最初の復号化データＤＲ₁´
は（００００１０１０）、２番目の復号化データＤＲ₂
´は（０００００１０１）となる。復号化データが１バ
イト単位で入力される毎に、後処理部２２は、圧縮時で
の前処理と逆の後処理を行って、圧縮側の原データと同
じ完全な復元データを復元して出力する。

【００５９】この後処理では、復号化データが１つ入力
されると、まず、ビット逆置換部２６が確率計算部２４
のメモリ２４Ａに記憶された２分木テーブルを参照し
て、今回入力した単位データの各ビットの内、ＭＳＢに
ついて、該ビットの論理値が「１」であるときの論理生
起確率の方が「０」であるときの論理生起確率より大き
いとき（等しい場合を含む）、当該ビットの実際の論理
値が「０」のときは「１」，「１」のときは「０」とな
るように逆置換し、当該ビットの論理値が「１」である
ときの論理生起確率の方が「０」であるときの論理生起
確率より小さいとき、当該ビットの実際の論理値が
「０」のときは「０」，「１」のときは「１」となるよ
うに逆置換する。

【００６０】２ＳＢ乃至ＬＳＢについては、逐次、当該
ビットより上位桁側の各逆置換後の論理値の組み合わせ
を条件としながら、該ビットの論理値が「１」であると
きの条件付論理生起確率の方が、「０」であるときの条
件付論理生起確率より大きいとき（等しい場合を含
む）、当該ビットの実際の論理値が「０」のときは
「１」，「１」のときは「０」となるように逆置換し、
当該ビットの論理値が「１」であるときの条件付論理生
起確率の方が、「０」であるときの条件付論理生起確率
より小さいとき、当該ビットの実際の論理値が「０」の
ときは「０」，「１」のときは「１」となるように逆置
換する。ＬＳＢまで逆置換を終えたあとの１バイトの単
位データを完全な復元データとして外部へ出力するとと
もに確率計算部２４に入力する（ステップ２０４）。予
め、２分木テーブルの初期化により、２分木テーブルは
全て、「１」となっている方の確率が大きいとされる。
この場合、最初の復号化データＤＲ₁´＝（００００１
０１０）に対するビットの逆置換は、図９に示す如く進
められて、逆置換後のデータは、ＤＲ₁＝（１１１１０
１０１）となり、圧縮側でのＤＴ₁と同一のデータが復
元される。

【００６１】次に、確率計算部２４は、今回の完全な復
元データＤＲ₁を用いて、２分木テーブルにおける１段
目の論理生起確率と２乃至８段目の条件付論理生起確率
を計算し直し、メモリ２４Ａに書き換え記憶させる（ス
テップ２０５）。この際、それまでの２分木テーブルの
内容とデータＤＲ₁が、圧縮側において、最初のデータ
ＤＴ₁を用いて確率計算し２分木テーブルの更新を行っ
たときと全く同じになっているので、２分木テーブルの
１段目はＡ(1) ＝１／１，Ａ(2)＝０／１、２段目はＢ
(1) ＝１／１，Ｂ(2) ＝０／１（但し、Ｂ(3) ，Ｂ(4)
は零のまま）、Ｃ(1) ＝１／１，Ｃ(2) ＝０／１（但
し、Ｃ(3) 乃至Ｃ(8) は零のまま）、Ｄ(1) ＝１／１，
Ｄ(2) ＝０／１（但し、Ｄ(3) 乃至Ｄ(16)は零のま
ま）、Ｅ(1) ＝０／１，Ｅ(2) ＝１／１（但し、Ｅ(3)
乃至Ｅ(32)は零のまま) 、Ｆ(3) ＝１／１，Ｆ(4) ＝０
／１（但し、Ｆ(1) ，Ｆ(2) ，Ｆ(5) 乃至Ｆ(64)は零の
まま) 、Ｇ(5) ＝０／１，Ｇ(6) ＝１／１（但し、Ｇ
(1) 乃至Ｇ(4) ，Ｇ(7) 乃至Ｇ(128) は零のまま) 、Ｈ
(11)＝１／１，Ｈ(12)＝０／１（但し、Ｈ(1)乃至Ｈ(1
0)，Ｈ(13)乃至Ｈ(256) は零のまま) となる。このよう
にして、確率計算を終えたならば、メモリ１２Ａの２分
木テーブルを今回の計算結果で書き換えて更新する。こ
の更新された２分木テーブルは、圧縮時に、最初の入力
データＤＴ₁に基づき、更新されたものと完全に一致す
る。

【００６２】次に、後処理部２２が２番目の復号化デー
タを入力すると（ステップ２０３）、まず、ビット逆置
換部２６が確率計算部２４のメモリ２４Ａに記憶された
２分木テーブル（前回までの完全な復元データに基づ
き、最新のテーブルとされている）を参照して、今回入
力した復号化データの各ビット別に、逐次、所定のビッ
ト逆置換を行い、逆置換後の１バイトの完全な復元デー
タを外部へ出力するとともに、確率計算部２４に入力す
る（ステップ２０４）。２番目の復号化データＤＲ₂´
＝（０１００１０１１）については、ビットの逆置換は
図１０の如く進行し、逆置換後の完全な復元データＤＲ
₂は（０００００１０１）となり、圧縮時のＤＴ₂と同
一となる。

【００６３】次に、確率計算部２４は、今回の復号化デ
ータを用いて、２分木テーブルにおける１段目の論理生
起確率と２乃至８段目の条件付論理生起確率を計算し直
し、メモリ２４Ａに書き換え記憶させる（ステップ２０
５）。この場合も、それまでの２分木テーブルの内容と
データＤＲ₂が、圧縮側において、最初のデータＤＴ₂
を用いて確率計算し２分木テーブルの更新を行ったとき
と全く同じになっているので、２分木テーブルの１段目
はＡ(1) ＝２／２，Ａ(2) ＝０／２、２段目はＢ(1) ＝
２／２，Ｂ(2) ＝０／２（但し、Ｂ(3) ，Ｂ(4) は零の
まま）、３段目はＣ(1) ＝２／２，Ｃ(2) ＝０／２（但
し、Ｃ(3) 乃至Ｃ(8) は零のまま）、４段目はＤ(1) ＝
２／２，Ｄ(2) ＝０／２（但し、Ｄ(3)乃至Ｄ(16)は零
のまま）、５段目はＥ(1) ＝０／２，Ｅ(2) ＝２／２
（但し、Ｅ(3) 乃至Ｅ(32)は零のまま) 、６段目はＦ
(3) ＝１／２，Ｆ(4) ＝１／２（但し、Ｆ(1) ，Ｆ(2)
，Ｆ(5) 乃至Ｆ(64)は零のまま) 、７段目はＧ(7) ＝
０／１，Ｇ(8) ＝１／１（但し、Ｇ(5) ＝０／１、Ｇ
(6) ＝１／１、Ｇ(1) 乃至Ｇ(4) ，Ｇ(9) 乃至Ｇ(128)
は零のまま) 、８段目はＨ(13)＝０／１，Ｈ(14)＝１／
１となる（但し、Ｈ(11)＝１／１、Ｈ(12)＝０／１、Ｈ
(1) 乃至Ｈ(10)，Ｈ(15)乃至Ｈ(256) は零のまま) 。こ
のようにして、確率計算を終えたならば、メモリ２４Ａ
の２分木テーブルを今回の計算結果で書き換えて更新す
る。この更新された２分木テーブルは、圧縮時に、２番
目の入力データＤＴ₂に基づき、更新されたものと完全
に一致する。

【００６４】以下、同様にして、逐次入力される復号化
データに対し、ビット逆置換部２６でのビット逆置換、
ビット逆置換後の復元データに基づく確率計算部２４で
の２分木テーブルの更新を繰り返していく。或る程度、
処理が進み、前回までに復元された全ての単位データ
（ＤＲ₁〜ＤＲ_i-1）に基づき求めた２分木テーブルが
図５（ａ）の如くなった状態で、新たな今回の１バイト
分の復号化データＤＲ_i´が図５（ｂ）に示す如く、
「０００００１０１」であったならば、ビット逆置換後
のデータＤＲ_iは「１１１１００１０」となり、圧縮時
における入力データＤＴ_iが再現される。新たなユニバ
ーサル符号化データが入力されなくなったら、復元処理
を終了する。これにより、圧縮時に符号化の前段で、ビ
ット単位の冗長度を削減するように前処理されていて
も、復元側では、確実に前処理される前の原データを復
元することが可能となる。

【００６５】この実施例によれば、圧縮対象の１バイト
データの各ビットが「０」と「１」のいずれの論理値で
あっても、論理生起確率又は条件付論理生起確率が大の
ビットを「０」に置き換えて、１バイト単位で見たとき
「０」の多いパターンに偏らせることで、ビット単位の
冗長度を減らすことができ、その後、所定ビット長単位
でなされる符号化で、ベクトル符号化に並ぶ高い圧縮率
を実現することが可能となる。また、圧縮時に符号化の
前段で、ビット単位の冗長度を削減するように前処理さ
れていても、復元側では、確実に前処理される前の原デ
ータを復元することが可能となる。

【００６６】なお、上記した実施例では、圧縮時にビッ
ト置換する際、論理生起確率や条件付論理生起確率が大
きいとき「０」に置換し、小さいとき「１」に置換する
ようにしたが、反対に、確率が大きいとき「１」に置換
し、小さいとき「０」に置換するようにしてもよく、こ
の場合、復元時のビット逆置換では、ビットの論理値が
「０」であるときの論理生起確率又は条件付論理生起確
率の方が、「１」であるときの論理生起確率又は条件付
論理生起確率より大きいとき（等しい場合を含む）、当
該ビットの実際の論理値が「１」のときは「１」，
「０」のときは「０」となるように逆置換し、当該ビッ
トの論理値が「０」であるときの条件付論理生起確率の
方が、「１」であるときの条件付論理生起確率より小さ
いとき、当該ビットの実際の論理値が「１」のときは
「０」，「０」のときは「１」となるように逆置換すれ
ばよい。また、１バイトの単位データに対し、最上位桁
側から枝分かれさせて２分木テーブルを構成するように
したが、最下位桁側から枝分かれさせて２分木テーブル
を構成してもよい。更に、圧縮対象は、１バイトデータ
なくても、２バイトデータ等、２ビット以上の任意のビ
ット長であってよい。また、単位データの端のビット
（ＭＳＢやＬＳＢ等）は、ビット置換の対象としないよ
うにしてもよい。

【００６７】また、上記した実施例では確率の計算及び
大小判断を、例えば、ＭＳＢについては、「１」の出現
頻度ａ(1) 、「０」の出現頻度ａ(2) を用いて、ａ(1)
とａ(2) のいずれも０の場合を除き、Ａ(1) ＝ａ(1) ／（ａ(1) ＋ａ(2) ）Ａ(2) ＝ａ(2) ／（ａ(1) ＋ａ(2) ）の如く分数計算で実際の確率を求め、Ａ(1) ≧0.5 のと
きＡ(1) の確率大、Ａ(1) ＜0.5 とし、Ａ(2) ＞0.5 の
ときＡ(2) の確率大、Ａ(2) ≦0.5 のとき確率小と判断
して行ったのと同じであるが、出現頻度ａ(1) とａ(2)
自体を便宜上の確率とし、ａ(1) ≧ａ(2) のとき「１」
の確率大、ａ(1) ＜ａ(2) のとき「１」の確率小、ａ
(2) ＞ａ(1) のとき「０」の確率大、ａ(2) ≦ａ(1) の
とき「０」の確率小と判断するようにしてもよい。２Ｓ
Ｂ以降についても同様である。また、圧縮方式としてユ
ニバーサル符号を例に挙げたが、他の方式であってもよ
い。以上、本発明を実施例、変形例により説明したが、
本発明は請求の範囲に記載した本発明の主旨に従い種々
の変形が可能であり、本発明はこれらを排除するもので
はない。

【００６８】

【発明の効果】以上、本発明によれば、符号化前に、前
回までに入力された単位データに基づき、単位データ内
での所定の１又は複数のビットについて、各ビット別
に、該ビットの論理値が他の所定の１又は複数のビット
の論理値の組み合わせを条件として生起する確率を求め
ておくとともに、今回入力された単位データの所定の１
又は複数の各ビットを、該ビットの条件付論理生起確率
が大か小かに従い、互いに異なる所定論理値に置換する
前処理を行うように構成したから、入力データの内、所
定のビットが「０」と「１」のいずれの論理値であって
も、条件付論理生起確率が大のビットを「０」（又は
「１」）に置き換えて、所定ビット長として見たとき
「０」（又は「１」）の多いパターンに偏らせること
で、ビット単位の冗長度を減らすことができ、その後、
所定ビット長単位でなされる符号化で高い圧縮率を実現
することが可能となる。

【００６９】また、圧縮符号化データを所定の方式で復
号化し、ｎビット長単位の復元データとする復元方法に
おいて、復号化後、前回までに完全に復元された単位デ
ータに基づき、単位データ内での所定の１又は複数のビ
ットについて、各ビット別に、該ビットの論理値が他の
所定の１又は複数のビットの論理値の組み合わせを条件
として生起する確率を求めておくとともに、今回復号化
された単位データの所定の１又は複数の各ビットを、逐
次、該ビットの両論理値に係る条件付論理生起確率の大
小と、当該ビットの論理値との組み合わせに従い所定論
理値に逆置換する後処理を行って、完全に復元した単位
データを得るように構成したから、圧縮時に符号化の前
段で、ビット単位の冗長度を削減するように前処理され
ていても、復元側では、確実に前処理される前の原デー
タを復元することが可能となる。

【００７０】また、ｎビット長単位で入力されるデータ
を、所定の方式で圧縮し符号化するとともに、圧縮符号
化データを所定の方式で復号化し、ｎビット長単位の復
元データとするデータ圧縮／復元方法において、圧縮
時、符号化前に、前回までに入力された単位データに基
づき、単位データ内での所定の１又は複数のビットにつ
いて、各ビット別に、該ビットの論理値が他の所定の１
又は複数のビットの論理値の組み合わせを条件として生
起する確率を求めておくとともに、今回入力された単位
データの所定の１又は複数の各ビットを、該ビットの条
件付論理生起確率が大か小かに従い、互いに異なる所定
論理値に置換する前処理を行うようにし、復元時、復号
化後、前回までに完全に復元された単位データに基づ
き、単位データ内での所定の１又は複数のビットについ
て、各ビット別に、該ビットの論理値が他の所定の１又
は複数のビットの論理値の組み合わせを条件として生起
する確率を求めておくとともに、今回復号化された単位
データの所定の１又は複数の各ビットを、逐次、該ビッ
トの両論理値に係る条件付論理生起確率の大小と、当該
ビットの論理値との組み合わせに従い所定論理値に置換
する後処理を行って、完全に復元した単位データを得る
ように構成したから、圧縮時は、符号化の前段で、ビッ
ト単位の冗長度を削減するように前処理することで、高
い圧縮率を実現可能となり、又、復元側では、確実に前
処理される前の原データを完全に復元することが可能と
なる。

【図面の簡単な説明】

【図１】本発明の原理説明図である。

【図２】本発明の実施例構成図である。

【図３】２分木テーブルの説明図である。

【図４】ビット置換方法を示す説明図である。

【図５】ビット逆置換方法を示す説明図である。

【図６】圧縮処理を示す流れ図である。

【図７】ビット置換動作の説明図である。

【図８】復元処理を示す流れ図である。

【図９】ビット逆置換動作の説明図である。

【図１０】ビット逆置換動作の説明図である。

【図１１】ＬＺＳＳ符号化方式の説明図である。

【図１２】ＬＺＷ符号化方式の説明図である。

【図１３】辞書構成の説明図である。

【図１４】ＬＺＷ符号化処理を示す流れ図である。

【図１５】ＬＺＷ復号化処理を示す流れ図である。

【図１６】ＬＺＷ復号化の例外時における説明図であ
る。

【図１７】ＬＺＷ復号化の説明図である。

【符号の説明】

１０前処理部１２、２４確率計算部１４ビット置換部１６符号化部２０復号化部２２後処理部２６ビット逆置換部

───────────────────────────────────────────────────── フロントページの続き (72)発明者千葉広隆神奈川県川崎市中原区上小田中1015番地富士通株式会社内

Claims

【特許請求の範囲】

【請求項１】ｎビット長単位で入力されるデータを、
所定の方式で圧縮し符号化するデータ圧縮方法におい
て、符号化前に、前回までに入力された単位データ（ＤＴ₁
〜ＤＴ_i-1）に基づき、単位データ内での所定の１又は
複数のビットについて、各ビット別に、該ビットの論理
値が他の所定の１又は複数のビットの論理値の組み合わ
せを条件として生起する確率（Ｂ(1) 〜Ｈ(256) ）を求
めておくとともに、今回入力された単位データ（ＤＴ_i）の所定の１又は複
数の各ビットを、該ビットの条件付論理生起確率が大か
小かに従い、互いに異なる所定論理値に置換する前処理
を行うようにしたこと、を特徴とするデータ圧縮方法。
【請求項２】圧縮符号化データを所定の方式で復号化
し、ｎビット長単位の復元データとする復元方法におい
て、復号化後、前回までに完全に復元された単位データ（Ｄ
Ｒ₁〜ＤＲ_i-1）に基づき、単位データ内での所定の１
又は複数のビットについて、各ビット別に、該ビットの
論理値が他の所定の１又は複数のビットの論理値の組み
合わせを条件として生起する確率（Ｂ(1) 〜Ｈ(256) ）
を求めておくとともに、今回復号化された単位データ（ＤＲ_i´）の所定の１又
は複数の各ビットを、逐次、該ビットの両論理値に係る
条件付論理生起確率の大小と、当該ビットの論理値との
組み合わせに従い所定論理値に逆置換する後処理を行っ
て、完全に復元した単位データ（ＤＲ_i）を得るように
したこと、を特徴とするデータ復元方法。
【請求項３】ｎビット長単位で入力されるデータを、
所定の方式で圧縮し符号化するとともに、圧縮符号化デ
ータを所定の方式で復号化し、ｎビット長単位の復元デ
ータとするデータ圧縮／復元方法において、圧縮時、符号化前に、前回までに入力された単位データ
（ＤＴ₁〜ＤＴ_i-1）に基づき、単位データ内での所定
の１又は複数のビットについて、各ビット別に、該ビッ
トの論理値が他の所定の１又は複数のビットの論理値の
組み合わせを条件として生起する確率（Ｂ(1) 〜Ｈ(25
6) ）を求めておくとともに、今回入力された単位データ（ＤＴ_i）の所定の１又は複
数の各ビットを、該ビットの条件付論理生起確率が大か
小かに従い、互いに異なる所定論理値に置換する前処理
を行うようにし、復元時、復号化後、前回までに完全に復元された単位デ
ータ（ＤＲ₁〜ＤＲ_i- ₁）に基づき、単位データ内での
所定の１又は複数のビットについて、各ビット別に、該
ビットの論理値が他の所定の１又は複数のビットの論理
値の組み合わせを条件として生起する確率（Ｂ(1) 〜Ｈ
(256) ）を求めておくとともに、今回復号化された単位データ（ＤＲ_i´）の所定の１又
は複数の各ビットを、逐次、該ビットの両論理値に係る
条件付論理生起確率の大小と、当該ビットの論理値との
組み合わせに従い所定論理値に逆置換する後処理を行っ
て、完全に復元した単位データ（ＤＲ_i）を得るように
したこと、を特徴とするデータ圧縮／復元方法。