JP3199291B2

JP3199291B2 - ハフマン復号化テーブルの構成方法

Info

Publication number: JP3199291B2
Application number: JP11275793A
Authority: JP
Inventors: 勲宮川; 肇水町; 眞松木
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 1993-05-14
Filing date: 1993-05-14
Publication date: 2001-08-13
Anticipated expiration: 2016-08-13
Also published as: JPH06326616A

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、圧縮されたデータを復
号する復号化処理に関し、特に、ハフマン符号によって
圧縮されたデータを復号化する際に使用されるハフマン
復号化テーブルの構成方法に関する。

【０００２】

【従来の技術】データの蓄積や通信を効率的に行なうた
めに、データの圧縮が行なわれる。圧縮の方法としては
各種のものが知られているが、ファクシミリ通信などで
はハフマン（Huffman）符号化が用いられている。ハフ
マン符号化では、頻繁に出現する記号に対して符号長の
短い符号語を対応させ、出現頻度が小さい記号に対して
は長い符号語を対応させる。したがって、ハフマン符号
化を行なった場合、その符号長は一定ではない。図１は
６種の記号に対してハフマン符号化を行なう場合を説明
するものであり、最短１ビット、最長４ビットの符号語
が生成してすることが示されている。ハフマン符号化は
図１に示すように、根（ルート）１０１から枝１０２が
延び、節１０３で枝１０２が分岐する木構造として表わ
され、木構造の各葉１０４すなわち枝１０２に末端に各
符号語が対応する。

【０００３】このようにハフマン符号化によって圧縮さ
れたデータの復号化は、符号語の最大長さに対応する大
きさの変換テーブル（ハフマン・テーブル）を用意し、
圧縮されたデータから符号語の最大長さ分のデータを読
み込み、変換テーブルを検索して入力データに対応する
記号を出力することによって行なわれる。

【０００４】

【発明が解決しようとする課題】ハフマン符号化では、
復号化に使用される変換テーブルのエントリー数が符号
語の最大長さで決定されることになる。すなわち、符号
語の最大長さがＭビットであれば、一般にはエントリー
数は２^Mとなる。図１に示した例では、総エントリー数
が２⁴＝１６となる。このため符号語の数に比べて変換
テーブルのエントリー数が極端に多くなって、復号化を
処理を行なうときに、、出力すべき記号を検索するのに
要する時間が長くなり、また使用するメモリ容量やＣＰ
Ｕパワーも増加するという問題点がある。

【０００５】本発明の目的は、変換テーブルのエントリ
ー数が少なく、固定長の符号語に対して高速での復号化
を行なうことのできるような変換テーブルを構成する方
法を提供することにある。

【０００６】

【課題を解決するための手段】本発明のハフマン復号化
テーブルの構成方法は、ハフマン符号化によって圧縮さ
れた符号化データを復号化する際に用いられハフマン符
号語と該ハフマン符号語に対応する記号との関係を示す
ハフマン・テーブルを構成する方法において、前記ハフ
マン符号語のうち最長のものの符号長がＭビットである
場合に、

【０００７】

【数３】となるように自然数の列｛Ｎ_i｝を定める第１の工程
と、エントリー数が２のＮ_j乗と等しくなるように第ｊ
段目（ただしｊはＬ以下の自然数）の変換テーブルを設
ける第２の工程と、第ｊ段目の変換テーブルの各エント
リーごとに、対応する符号長と記号とを設定し、第（ｊ
＋１）段目の変換テーブルに対するポインタ情報を設定
する第３の工程とを有し、前記第１の工程の実施したの
ち、ｊ＝１からｊ＝Ｌに達するまで、前記第２および第
３の工程を実施してｊに１を加えることを繰り返し、前
記第（ｊ＋１）段目の変換テーブルが

【０００８】

【数４】を越える符号長のハフマン符号語の復号化において使用
されるものである。

【０００９】

【作用】変換テーブルを２段以上に分割するので、変換
テーブル全体としての総エントリー数を削減することが
できる。このとき、ハフマン符号化を表わす木構造にお
いて変換テーブルの分割が根に近い側と遠い側との間で
行なわれているので、符号長の短いすなわち出現頻度の
大きい符号語に対しては、より少ない段数の変換テーブ
ルの検索によって該当する記号を取得することができ
る。したがって、変換テーブルの分割による処理時間の
増加は起こらず、エントリー数が減少した分に見合って
処理時間が減少する。

【００１０】

【実施例】次に、本発明の実施例について図面を参照し
て説明する。図１は本発明の一実施例のハフマン復号化
テーブルの構成方法の手順を示すフローチャートであ
る。

【００１１】ハフマン符号化における最長の符号語がＭ
ビットであるとする。まず、

【００１２】

【数５】となるように、自然数列｛Ｎ_i｝を定める（ステップ１
１）。そして、ｊ＝１として（ステップ１２）、第ｊ段
目の変換テーブルのエントリー数を２のＮ_j乗とする
（ステップ１３）。例えば、Ｎ_j＝３であれば、１０進
表示で０,１,…,７で表わされる８（＝２³）個のエント
リーを持つように、第ｊ段目の変換テーブルを定める。
そして、この第ｊ段目の変換テーブルについて、各エン
トリーごとに、対応する符号長と記号とを設定し、さら
にｊ＜Ｌであれば、第（ｊ＋１）段目の変換テーブルへ
のポインタ情報を設定する（ステップ１４）。ここで第
（ｊ＋１）段目の変換テーブルは、自然数列｛Ｎ_i｝に
おけるｉが１からｊまでの和すなわち

【００１３】

【数６】を越えるような符号長をもつ符号語の復号化処理に使用
されるものである。

【００１４】そして、ｊ＝Ｌかどうかの判断を行ない
（ステップ１５）、ｊ＝Ｌであれば処理を終了し、ｊ≠
Ｌであればｊに１を加え（ステップ１６）、ステップ１
３に戻る。このような手順を進めることにより、まず第
１段目の変換テーブルが構成され、次に第２段目の変換
テーブルが構成され、以下、同様にして最後に第Ｌ段目
の変換テーブルが構成されて、全ての変換テーブルが構
成されたことになる。

【００１５】ここで実例を挙げて説明する。図１に示し
た木構造で表わされるハフマン符号化（最大符号長４ビ
ット）に対し、図３に示すように符号長３ビットで変換
テーブルを分割するものとする。根１０１側の変換テー
ブルが第１段目の変換テーブル１２１となり、根１０１
から遠い方の変換テーブルが第２段目の変換テーブル１
２２となる。これら各変換テーブル１２１,１２２の構
成が、図４に示されている。３ビットの符号長までの符
号語に対応する記号は第１段目の変換テーブル１２１に
登録され、符号長４ビットの記号は第２段目の変換テー
ブル１２２に登録されている。そして、第１段目の変換
テーブル１２１においてエントリー"111"には、第２段
目の変換テーブル１２２へのポインタ情報が登録されて
いる。なお、第１段目の変換テーブル１２１の最初のエ
ントリーには"0**"と記されているが、"*"は任意である
ことを示し、実際には"000","001","010","011"の４つ
のエントリーが設けられていることを示している。結
局、第１段目の変換テーブルのエントリー数は８、第２
段目の変換テーブルのエントリー数は２であって、総エ
ントリー数は１０となり、図１に示したものの総エント
リー数１６に比べ、大幅に減少している。

【００１６】次に、このように構成された変換テーブル
１２１,１２２を用いた復号化について説明する（図４
参照）。まず、ハフマン符号化による圧縮データから３
ビットを取り出し、第１段目の変換テーブル１２１を検
索する。符号長が３ビットまでの記号すなわち出現頻度
が大きい方の記号は、この段階で確定する。取り出した
３ビットが"111"である場合には、符号長が４ビットで
ある記号に対応するので、さらに１ビットを読出し、こ
の１ビットによって第２段目の変換テーブル１２２を検
索する。これによって、符号長が４ビットの記号も確定
する。

【００１７】次に、本実施例をＧ３ファクシミリにおけ
るＭＨ符号の復号化処理に適用した例を説明する。ＭＨ
符号は、ハフマン符号に若干の修正を加えたものである
から、本実施例を適用することができる。ファクシミリ
でのＭＨ符号化処理は画像符号化処理であり、復号化し
て取得される記号は、画像上での白または黒のランレン
グスとなる。

【００１８】最初に、ＭＨ符号を復号化する処理の大き
な流れについて図５を用いて説明する。まず、圧縮デー
タファイルを読み込み（ステップ３１）、終端符号（Ｅ
ＯＦ）であるかどうかのチェックを行なう（ステップ３
２）。終端符号を検出した場合には処理を終了し、そう
でない場合には、白または黒のデータについて交互に
（ステップ３３）、ランレングスへの復号化（ステップ
３４またはステップ３５）を行ない、復号化して得たデ
ータをイメージデータとして書き込む（ステップ３
６）。そして、ステップ３２に戻り、終端符号を検出す
るまで、ステップ３３〜３６の処理を繰り返すようにな
っている。ＭＨ符号では、画像上での白領域の符号化と
黒領域の符号化とが異なるハフマン符号を用いて行なわ
れるので、復号化処理も白と黒とで分けて行なわれ、白
と黒とで別々に変換テーブルが設けられることになる。
なお、符号語の長さの最大値は、白については１２ビッ
ト、黒については１３ビットである。

【００１９】まず、白の復号化処理について説明する。
白に対しては、符号長８ビットで変換テーブルの分割を
行ない、第１段目をメインテーブル１３１とする。そし
て、第２段目をサブテーブル１３２とメークアップ符号
用拡張テーブル１３３の２本立てとする。このように第
２段目に相当する変換テーブルを２つ設けるのは、拡張
メークアップ符号に属する符号語が必ず"00000001"で始
まる１１ビットあるいは１２ビットのものであり、拡張
メークアップ符号以外の白の符号語はたかだか９ビット
であることに対応している。これら各テーブル１３１〜
１３３の内容およびその相互関係が図６に示されてい
る。なお、メインテーブル１３１において符号長が負と
なっているのは、終端符号であること、あるいはサブテ
ーブル１３２やメークアップ符号用拡張テーブル１３３
に対するポインタ情報であることを示している。なお、
メインテーブル１３１のエントリー数は２５６、サブテ
ーブル１３２とメークアップ符号用拡張テーブル１３３
のエントリー数はそれぞれ１６であり、各エントリー、
符号長、ランレングスはそれぞれ１０進数で表示されて
いる。

【００２０】次に、このように構成された各テーブル１
３１〜１３３を用いて行なう復号化処理について、図７
のフローチャートを用いて説明する。

【００２１】上述のように終端符号でないかをチェック
したのち（図５のステップ３２）、データ圧縮の行なわ
れているデータファイルから８ビット分のビット列を読
み出し（ステップ４１）、このビット列の前後の順番を
逆転させる（ステップ４２）。例えば、ビット列が"000
00101"であれば、"10100000"と逆転される。そして、逆
転して得たビット列に基づいて、メインテーブル１３１
を参照する（ステップ４３）。メインテーブル１３１の
エントリーの中にこのビット列に対応するものが必ずあ
るから、そのエントリーの符号長とランレングスとを読
み出す。そして、読み出された符号長ｍがいくつである
かの判定を行なう（ステップ４４）。

【００２２】ｍ≧１の場合には、メインテーブル１３１
のみでランレングスが確定する場合である。この場合に
は、ｍ＝８かどうかを調べ（ステップ４５）、ｍ＝８で
あればそのままランレングスを決定し（ステップ５
４）、ｍ≠８であれば、符号語が８ビットより短い場合
であるので、データファイルにおいて（８−ｍ）ビット
だけポインタを後退させてから（ステップ４６）、ラン
レングスを決定する（ステップ５４）。ステップ４６で
の（８−ｍ）ビットは、切り出された符号長と有効なビ
ット数との差に相当する。

【００２３】０≧ｍ≧−７の場合には、拡張メークアッ
プ符号以外の符号であってかつ符号長が９ビットの場合
であるので、データファイルからさらに１ビットを切り
出す（ステップ４７）。切り出された１ビットをＮとす
ると、（−２）＊ｍ＋Ｎをビット演算で求め、求めた値
をサブテーブル１３２で検索するエントリーとし（ステ
ップ４８）、サブテーブル１３２を参照する（ステップ
４９）。実際には計算がビット演算で行なわれること、
ｍ＜０であることから、図８に示すように、符号長ｍの
下３ビットを１ビット左にシフトさせ、最下位ビットを
Ｎとした４ビットの値がエントリー値となる。そしてサ
ブテーブル１３２を参照して得たランレングスをもって
ランレングスを決定する（ステップ５４）。

【００２４】ｍ＝−８の場合は、拡張メークアップ符号
の場合であるので、データファイルから４ビットを切り
出し（ステップ５０）、切り出したビット列の前後の順
番を逆転させる（ステップ５１）。そして、逆転された
４ビットのビット列に応じてメークアップ符号用拡張テ
ーブル１３３を参照し（ステップ５２）、ランレングス
を求める。この場合、メークアップ符号用拡張テーブル
１３３に登録された符号長ｎが４ビット未満の場合に
は、有効なビット数との差分だけデータファイルのポイ
ンタを後退させるものとする（ステップ５３）。そし
て、メークアップ符号用拡張テーブル１３３の参照結果
に応じて、ランレングスを決定する（ステップ５４）。

【００２５】以上のようにしてランレングスが決定した
ら、処理を終了する。なお、メインテーブル１３１にお
いてエントリー"0"の符号長が"-9"となっているが、こ
れは"0"が８ビット続くのが終端符号（ＥＯＦ）である
ことを示すためである。

【００２６】次に、黒の復号化処理について説明する。
黒に対しては、符号長８ビットで変換テーブルの分割を
行ない、第１段目をメインテーブル１４１とする。そし
て、第２段目をサブテーブル１４２とする。メインテー
ブル１４１のエントリー数は１５６であり、サブテーブ
ル１４２のエントリー数は２２４である。ここでサブテ
ーブル１４２のエントリー数が変則的なのは、全体とし
ての復号化処理を効率的に行なうためである。これら各
テーブル１４１,１４２の内容およびその相互関係が図
９に示されている。なお、メインテーブル１４１におい
て符号長が負となっているのは、終端符号であることあ
るいはサブテーブル１４２に対するポインタ情報である
ことを示している。なお、各エントリー、符号長、ラン
レングスはそれぞれ１０進数で表示されている。

【００２７】次に、このように構成された各テーブル１
４１,１４２を用いて行なう復号化処理について、図１
０のフローチャートを用いて説明する。

【００２８】上述のように終端符号でないかをチェック
したのち（図５のステップ３２）、データ圧縮の行なわ
れているデータファイルから８ビット分のビット列を読
み出し（ステップ６１）、このビット列の前後の順番を
逆転させる（ステップ６２）。逆転して得たビット列に
基づいて、メインテーブル１４１を参照し（ステップ６
３）、このビット列に対応するエントリーの符号長とラ
ンレングスとを読み出す。そして、読み出された符号長
ｍを判定を行なう（ステップ６４）。

【００２９】ｍ≧１の場合には、メインテーブル１４１
のみでランレングスが確定する場合である。この場合に
は、ｍ＝８かどうかを調べ（ステップ６５）、ｍ＝８で
あればそのままランレングスを決定し（ステップ７
６）、ｍ≠８であれば、符号語が８ビットより短い場合
であるので、データファイルにおいて（８−ｍ）ビット
だけポインタを後退させてから（ステップ６６）、ラン
レングスを決定する（ステップ７６）。

【００３０】０＞ｍ≧−６の場合には、データファイル
からさらに５ビットを切り出し、切り出された５ビット
をＮとする（ステップ６７）。ビット列Ｎの前後の順番
を逆転させ（ステップ６８）、（−３２）＊ｍ＋Ｎをビ
ット演算で求め、求めた値をサブテーブル１４２で検索
するエントリーとし（ステップ６９）、サブテーブル１
４２を参照する（ステップ７０）。実際には計算がビッ
ト演算で行なわれること、ｍ＜０であることから、図１
１に示すように、符号長ｍの下３ビットを５ビット左に
シフトさせ、下５ビットを逆転後のＮとした８ビットの
値がエントリー値となる。サブテーブル１４２を参照し
た結果、登録されている符号長ｎとランレングスとが得
られるが、ｎ≠５の場合には、ステップ６６と同様に、
データファイルにおいてポインタを（５−ｎ）ビットだ
け後退させる（ステップ７１）。そしてサブテーブル１
３２を参照して得たランレングスをもってランレングス
を決定する（ステップ７６）。

【００３１】ｍ＝０の場合は、拡張メークアップ符号の
場合であるので、データファイルから４ビットを切り出
し（ステップ７２）、切り出したビット列の前後の順番
を逆転させる（ステップ７３）。そして、逆転された４
ビットのビット列に応じてサブテーブル１４２を参照し
（ステップ７４）、ランレングスを求める。この場合、
サブテーブル１４２に登録された符号長ｎ'が４ビット
未満の場合には、有効なビット数との差分だけデータフ
ァイルのポインタを後退させるものとする（ステップ７
５）。そして、サブテーブル１４２の参照結果に応じて
ランレングスを決定する（ステップ７６）。

【００３２】以上のようにしてランレングスが決定した
ら、処理を終了する。なお、メインテーブル１４１にお
いてエントリー"0"の符号長が"-7"となっているが、こ
れは"0"が８ビット続くのが終端符号（ＥＯＦ）である
ことを示すためである。また図９で"011?1110"とあるの
は、"01101110"あるいは"01111110"であることを示して
いる。

【００３３】以上、本実施例をファクシミリで使用され
るＭＨ符号に適用した例を説明したが、このようにＭＨ
符号の復号化に使用される変換テーブルを分割すること
により、変換テーブル全体としての総エントリー数が大
幅に減少し、高速での画像復号化処理を達成することが
できる。

【００３４】

【発明の効果】以上説明したように本発明は、ハフマン
符号語とハフマン符号語に対応した記号との対応関係を
表わす変換テーブルを分割することにより、復号化に使
用される変換テーブル全体としての総エントリー数を削
減することができという効果があり、また、ハフマン符
号において出現頻度が高いために短い符号長を割り当て
られた符号語に対しては、より少ない段数の変換テーブ
ルの検索によって該当する記号を取得することができる
ので、変換テーブルの分割による復号化処理時間の劣化
を防止することができるという効果がある。

【図面の簡単な説明】

【図１】ハフマン符号を説明する図である。

【図２】本発明の一実施例のハフマン復号化テーブルの
構成方法を手順を説明するフローチャートである。

【図３】図１のハフマン符号に対する変換テーブルの分
割を説明する図である。

【図４】図３において分割によって生成した各変換テー
ブルを説明する図である。

【図５】ＭＨ符号の復号化処理を示すフローチャートで
ある。

【図６】白のランレングスに対応する各変換テーブルを
説明する図である。

【図７】白のランレングスに対応する復号化処理を説明
するフローチャートである。

【図８】ビット演算処理を説明する図である。

【図９】黒のランレングスに対応する各変換テーブルを
説明する図である。

【図１０】黒のランレングスに対応する復号化処理を説
明するフローチャートである。

【図１１】ビット演算処理を説明する図である。

【符号の説明】

１１〜１６,３１〜３６,４１〜５４,６１〜７６ス
テップ１２１,１２２変換テーブル１３１,１４１メインテーブル１３２,１４２サブテーブル１３３メークアップ符号用拡張テーブル

フロントページの続き (56)参考文献特開平１−312625（ＪＰ，Ａ) 特開平２−265329（ＪＰ，Ａ) 特開平３−145223（ＪＰ，Ａ) 特開平４−215321（ＪＰ，Ａ) 特開平５−14210（ＪＰ，Ａ) 特開平２−266615（ＪＰ，Ａ) (58)調査した分野(Int.Cl.⁷，ＤＢ名) H03M 7/42

Claims

(57)【特許請求の範囲】

【請求項１】ハフマン符号化によって圧縮された符号
化データを復号化する際に用いられハフマン符号語と該
ハフマン符号語に対応する記号との関係を示すハフマン
・テーブルを構成する方法において、前記ハフマン符号語のうち最長のものの符号長がＭビッ
トである場合に、【数１】となるように自然数の列｛Ｎ_i｝を定める第１の工程
と、エントリー数が２のＮ_j乗と等しくなるように第ｊ段目
（ただしｊはＬ以下の自然数）の変換テーブルを設ける
第２の工程と、第ｊ段目の変換テーブルの各エントリーごとに、対応す
る符号長と記号とを設定し、第（ｊ＋１）段目の変換テ
ーブルに対するポインタ情報を設定する第３の工程とを
有し、前記第１の工程の実施したのち、ｊ＝１からｊ＝Ｌに達
するまで、前記第２および第３の工程を実施してｊに１
を加えることを繰り返し、前記第（ｊ＋１）段目の変換テーブルが【数２】を越える符号長のハフマン符号語の復号化において使用
されるものであることを特徴とするハフマン復号化テー
ブルの構成方法。