JP2891818B2

JP2891818B2 - 符号化装置

Info

Publication number: JP2891818B2
Application number: JP10311692A
Authority: JP
Inventors: 茂徳木野; 和彦丸山
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 1992-04-22
Filing date: 1992-04-22
Publication date: 1999-05-17
Anticipated expiration: 2014-05-17
Also published as: JPH05298063A

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】この発明は、適応型２値算術符号
化方式を用いて文字圧縮・伸長を行う符号化装置に関す
るものである。

【０００２】

【従来の技術】従来の２値算術符号化方式としては、例
えばＩＳＯ／ＩＥＣ Committee Draft 11544 に記述さ
れている２値算術符号化方式（Arithmetic Coding ：以
後QM-Coderと呼ぶ）がある。図１１は上記先行技術と同
様な２値算術符号化装置を用いた画像符号化装置の例を
示す構成図である。

【０００３】図１１において、４１は入力画像データを
２値シンボル列として入力する２値シンボル列読み取り
部、４２は上記２値シンボル列読み取り部４１にて読み
取った２値シンボル列を記憶する２値シンボル列記憶
部、４０は上記２値シンボル列記憶部４２に記憶されて
いる２値シンボル列より上記ＱＭ−Ｃｏｄｅｒにて規定
された圧縮を行うために、必要な情報として、圧縮しよ
うとする符号化対象シンボルに最も相関の深い２値シン
ボル列の一部である図１３に示される１０ビットで示さ
れるシンボルパターン（以後テンプレートと記述する）
を２値シンボル列から選択する画像参照シンボル選択部
である。

【０００４】また、６は上記画像参照シンボル選択部４
０にて取り出された１０ビットの参照シンボルの内容が
示す値（以後コンテクストあるいはＣＸと記述する）を
用いて、上記符号化対象シンボルが“１”であるか
“０”であるかを、図１７に示す構造を持つ状態番号／
優勢シンボル記憶部４に記憶されているコンテクストの
もとで、符号化対象シンボルとしてより高い確率で出現
するシンボル値［以後、より高い確率で出現するシンボ
ルをMore Probable Symbol：（優勢シンボル／ＭＰ
Ｓ）、より低い確率で出現するシンボルをLess Probabl
e Symbol：（劣勢シンボル／ＬＰＳ）と記述する］と比
較し、比較の結果をＭＰＳと等しいか異なるかの情報と
して出力する予測変換処理部である。

【０００５】また、１は予測変換処理部６にて出力され
た符号化対象シンボルがＭＰＳであるかＬＰＳであるか
の情報（以後、ＭＰＳ／ＬＰＳ情報と記す）及び状態番
号／優勢シンボル記憶部４に記憶されたＬＰＳの出現確
率領域幅の値を２値算術符号化部２に出力する確率推定
部、２は確率推定部１にて出力されたＭＰＳ／ＬＰＳの
情報及びＬＰＳの出現確率領域幅の値を元に符号化対象
シンボルに対して２値算術符号化処理を行う２値算術符
号化部、３はコンテクストに対応した予め定められたＬ
ＰＳの確率領域の大きさおよびコンテクストに対応した
予め定められた遷移情報を記憶した確率推定テーブルで
ある。

【０００６】上記装置における２値算術符号化の処理手
順を図２４ないし図２９に示す。まず、２値算術符号化
器全体の初期化を行う。図２５に符号化器の初期化手順
を示す。初期化処理では、まず、状態番号／優勢シンボ
ル記憶部４に記憶されている状態（この状態番号を用い
て、ＭＰＳ／ＬＰＳシンボルの出現確率を参照する。以
後この状態をＳＴと記述する）およびＭＰＳの値をすべ
てのコンテクストに対してゼロにセットする。

【０００７】続いて、図１８におけるＡレジスタによっ
て示される確率領域のＭＰＳ領域の幅を１００００Ｈｅ
ｘにセットし、図１８におけるＣレジスタによって示さ
れる確率領域のＭＰＳ領域の幅Ａの下界値を０にセット
し、符号出力のためのシフトの数をカウントするカウン
タ（以後ＣＴと示す）を１１にセットする。

【０００８】次に、画像参照シンボル選択部４０におい
て、符号化する符号化対象シンボル及び符号化するため
のコンテクストを図１３に示すテンプレートに従い２値
シンボル列記憶部に記憶された２値シンボル列よりロー
ドしてくる。

【０００９】次に、２値算術符号化を行う。はじめに、
確率推定部１において、図２６に示す手順に従い符号化
対象シンボルの値とコンテクストＣＸに対応した状態番
号／優勢シンボル記憶部４に記憶されたＭＰＳの値（以
後ＭＰＳ（ＣＸ）と示す）とを比較する。符号化対象シ
ンボルの値とＭＰＳ（ＣＸ）が等しければ符号化対象シ
ンボルはＭＰＳであるので、図２８に示すＭＰＳの場合
の２値算術符号化処理手順へ処理を継続し、等しくなけ
れば符号化対象シンボルはＬＰＳであるので、図２７に
示すＬＰＳの場合の２値算術符号化処理手順へ処理を継
続する。

【００１０】次に、２値算術符号化部２における符号化
対象シンボルがＭＰＳであった場合の２値算術符号化処
理手順を図２８に示す。まず、コンテクストＣＸの現在
の状態をＳＴ（ＣＸ）と表現し、さらに、その状態ＳＴ
（ＣＸ）においてＬＰＳに対して割り当てられる領域幅
をＬＰＺ（ＳＴ（ＣＸ））と表現すると、Ａレジスタの
内容をＡ＝Ａ−ＬＰＺ（ＳＴ（ＣＸ））式で表される処
理を行う（図１５参照）。すなわち、ＬＰＺ（ＳＴ（Ｃ
Ｘ））は、現在当該コンテクストが図１６に示す状態遷
移図の中のどの状態にあり、その状態において図１７に
示す確率推定テーブル３が定めるＬＰＳに割り当てられ
る確率領域幅ＬＰＳがどんな値であるのかを示してい
る。

【００１１】また、図１５に示す現在までに符号化した
シンボル列の出現確率に対応した確率領域幅Ａを、次の
符号化対象シンボルに対して期待されるＬＰＳとＭＰＳ
の出現推定確率で分割し、画像の符号化対象シンボル
（画素）ＰＩＸがＭＰＳであれば、図１５における確率
領域のＭＰＳの領域が符号化対象シンボルに割り当てら
れる。

【００１２】したがって、図１５において、符号化対象
シンボルの出現する確率領域の大きさを示す値はＡ′レ
ジスタの値であるため、Ａ−ＬＳＺを求めることによっ
て符号化対象シンボルとしてＭＰＳが出現する場合に割
り当てられる確率領域幅を求めることができる。次に、
求めたＡレジスタの値を図１４におけるＨａｌｆで示さ
れる８０００Ｈｅｘと比較し、８０００Ｈｅｘ以上であ
れば処理を終了し、８０００Ｈｅｘ未満であれば正規化
処理を行う。

【００１３】正規化処理を行うに当たって、前処理とし
て図２８に示す処理、すなわち上記の符号化対象シンボ
ルとしてＭＰＳが出現した場合に割り当てる確率領域の
幅を示すＡレジスタの値と符号化対象シンボルとしてＬ
ＰＳが出現した場合に割り当てる確率領域の幅ＬＳＺと
を比較し、Ａレジスタの値がＬＳＺの値より小さければ
符号化効率の向上を目的として、ＭＰＳとＬＰＳに割り
当てられる確率領域の意味を入れ換える処理（条件付き
交換処理）を行う。

【００１４】次に、ＳＴ（ＣＸ）で示される値すなわち
コンテクストＣＸに対応した状態ＳＴの次の遷移状態
［ＮＭＰＳ（ＳＴ（ＣＸ））と表記する］を確率推定テ
ーブル３より求め、現在のＳＴ（ＣＸ）の値を更新する
処理を行うが、このとき、ＮＭＰＳによって表される次
の状態における「ＬＰＳに対して割り当てる確率領域
幅」ＬＳＺは、現在の状態のＬＳＺよりも必ず小さくな
るように確率推定テーブル３が設定されている。

【００１５】なぜならば、たとえば符号化対象シンボル
ＭＰＳのみ発生した場合、図２０に示すように、ＬＰＳ
領域幅が大きい場合には丸１，丸２，丸３と３回符号化
対象シンボルを符号化した時点で１回正規化が起こり、
図２０の場合では１ビットの符号が出力されている。一
方、図２１に示すように、ＬＰＳ領域幅が小さい場合に
は符号化対象シンボルを６ビット符号化した時点で１回
正規化が起こり、１ビットの符号が出力されている。

【００１６】すなわち、前者の場合には圧縮率３分の１
であり、後者の場合には圧縮率が６分の１となり、連続
してＭＰＳが発生する場合にはＬＰＳ領域幅のより小さ
い方が圧縮率が良くなる。つまり、ＭＰＳが生じた場合
はＬＳＺの値が小さいほど同じ入力データ量に対して正
規化処理を行う回数が少なく、また、一回の正規化処理
によって出力される符号も少なくなるからである。

【００１７】次に、図１４および図２９に示す正規化処
理手順について述べる。正規化処理では、８０００Ｈｅ
ｘより小さくなったＭＰＳの確率領域を８０００Ｈｅｘ
より大きくする処理を行う。すなわち、現在までに符号
化されたシンボル列に対して割り当てられた確率領域の
幅を示すＡレジスタおよび現在までに符号化されたシン
ボル列に対して割り当てられた確率領域を代表する座標
を示すＣレジスタの値を各々のレジスタ中にて左（ＭＳ
Ｂ方向）へシフトすることにより、各領域と座標を２倍
ずつ拡大する処理を行う。

【００１８】８０００ＨｅｘはＡレジスタのとりうる数
直線上での最大領域幅の１／２の値であり、Ａレジスタ
の値が１／２より小さくなった場合に、少なくとも現在
までに符号化されたシンボル列に対して割り当てられた
確率領域を代表する座標を示すＣレジスタ中の最上位の
１ビットの値が数直線上で確定したことを示している。
正規化処理における左シフト中にＣレジスタの最上位ビ
ットから順に符号が出力される。符号の出力タイミング
は図２９におけるカウンタＣＴによりカウントされてお
り、出力符号が８ビット蓄積されるＣＴがゼロになり、
符号はバイト単位で出力される。

【００１９】次に、２値算術符号化部２における符号化
対象シンボルがＬＰＳであった場合の２値算術符号化処
理手順を図２７に示す。上記符号化対象シンボルがＭＰ
Ｓであった場合の処理と異なる点は、確率推定テーブル
３に予め定められたスイッチビットと呼ばれるビットを
検査する処理があることと、ＬＰＳが生じた場合は必ず
正規化処理を行う必要があるということ、正規化処理に
ともなうＳＴ（ＣＸ）の値の更新が、ＭＰＳが生じた場
合にはＬＳＺ（ＳＴ（ＣＸ））が小さくなる方向へ更新
されていくのに対し、ＬＰＳが生じた場合にはＬＳＺ
（ＳＴ（ＣＸ））が大きくなる方向へ更新されることで
ある。

【００２０】スイッチビットは、図１６に示すＳＴ０の
状態にあるコンテクストが存在した時に、さらにＬＰＳ
が出現した場合に、状態番号／優勢シンボル記憶部４に
記憶されたＭＰＳとＬＰＳの値を入れ換える処理を行う
必要があり、このＭＰＳ／ＬＰＳ入れ換えの必要性判定
のために用意されている。

【００２１】ＭＰＳとＬＰＳを入れ換える処理がなぜ必
要かとなれば、符号化器の初期化処理において、状態番
号／優勢シンボル記憶部４に記憶されたＭＰＳの値は初
期値としてゼロにクリアされており、あるコンテクスト
に対するＭＰＳの値として１がふさわしかった場合、ま
た、２値シンボル列において、ある部位ではＭＰＳの値
として１がふさわしく、またある部位では０の値がふさ
わしいといったように、ＭＰＳ値が変化する場合、ＭＰ
Ｓの値とＬＰＳの値とを２値シンボル列の特性の変化に
適応して入れ替えることによって符号化効率を高めるた
めである。

【００２２】次に、ＬＰＳが生じた場合には必ず正規化
処理を行うなぜ必要があるかとなれば、ＬＰＳの値すな
わちＬＳＺ（ＳＴ（ＣＸ））の値は常に８０００Ｈｅｘ
より小さい値に設定されており、ＬＰＳが出現した場合
にはＡレジスタの値が必ず８０００Ｈｅｘよりも小さく
なるためである。

【００２３】ＭＰＳにより正規化が行われた場合にはＬ
ＳＺ（ＳＴ（ＣＸ））が小さくなる方向へ状態が更新さ
れていくのに対し、ＬＰＳにより正規化が行われた場合
にはＬＳＺ（ＳＴ（ＣＸ））が大きくなる方向へ状態が
更新される理由については次のように言える。図２２と
図２３に示されるように、ＬＰＳに割り当てられる領域
幅が小さい場合には正規化処理におけるレジスタのシフ
ト処理すなわち１回の正規化処理において出力される符
号量（シフト動作の回数）が多く、ＬＰＳの領域幅に割
り当てられる領域幅が大きい場合には、ＬＰＳの出現に
よる正規化処理におけるレジスタのシフト動作の回数が
少なくなる。

【００２４】あるコンテクストにおいてはＬＰＳと判定
されていたシンボルが出現した場合には、いままでの推
定確率のままでＬＰＳ領域幅を割り当てていると、次に
ＬＰＳが出現した場合に符号化効率が低下することか
ら、さらにＬＰＳが出現しても、多くの符号を出力しな
いように対応するために、ＬＳＺ（ＳＴ（ＣＸ））が大
きくなる方向へ状態遷移を行う。符号化対象のシンボル
列の特性に途中で変化が生じたような場合、例えば文字
を記述したファクシミリ画像の中に写真画像が含まれて
いたような場合には、ＬＰＳが頻繁に発生し、特性の変
化に追従するよう状態遷移を追う必要がある。こうし
て、ＬＰＳに割り当てる確率領域を、状態遷移により適
宜選択することにより、圧縮率を向上させている。

【００２５】次に、図１１に示す上記２値算術符号化装
置にて符号化された符号データを復号する２値算術復号
化装置の動作について述べる。図１２に上記先行技術に
おける２値算術符号化装置によって符号化された２値シ
ンボル列を復号する２値算術復号化装置の構成図を示
す。

【００２６】図１２において、１４は符号データを元に
復号対象シンボルがそのコンテクストにおいてＭＰＳで
あったかＬＰＳであったのかを出力する２値算術復号化
部であり、確率推定部１は上記２値算術復号化部２より
出力されたＭＰＳ／ＬＰＳ情報を元に符号化器と同様の
状態遷移を実行し、符号化器の動作をシミュレートする
ことで、次に復号する対象シンボルに対して、符号化器
がＭＰＳ／ＬＰＳに対してどのくらいの確率領域を割り
当ているかを判定する。

【００２７】また、確率推定テーブル３はコンテクスト
の各状態においてＬＰＳに対してどのくらいの確率領域
を割り当てるのが最適であるのか、正規化が発生した場
合の状態遷移先としてはどこが適当かを統計的に求めて
作成された符号化器と同一のテーブルであり、状態番号
／優勢シンボル記憶部４は、上記符号化装置における状
態番号／優勢シンボル記憶部４と同様なフォーマットお
よびデータを持つ記憶装置である。

【００２８】画像参照シンボル選択部４０は逆予測変換
処理部９から出力される復号された２値シンボル列から
図１３に示したテンプレートに従って参照シンボルを選
択する装置、逆予測変換処理部９は確率推定部１より出
力されたＭＰＳの意味するシンボル値と２値算術復号化
部１４より得られた復号対象シンボルがＭＰＳかＬＰＳ
かという情報から符号化前の２値シンボル列を出力する
装置である。

【００２９】図１２に示す上記２値算術復号化装置にお
ける２値算術符号復号化の処理手順を図３０ないし図３
５に示す。まず、２値算術復号化装置全体の初期化を行
う。図３１に復号器の初期化手順を示す。初期化処理で
は、まず、状態番号／優勢シンボル記憶装置４に記憶さ
れている各コンテクストに対する遷移状態およびＭＰＳ
の値をすべてのコンテクストに対してゼロにセットす
る。

【００３０】続いて、図１９に示す確率領域のＭＰＳ領
域の下界値（ＱＭ−ｃｏｄｅｒでは領域の下界値を確率
領域の代表座標としている）を示すＣレジスタの値をゼ
ロにセットし、符号をバイト単位でＣレジスタにセット
し、Ｃレジスタを左（ＭＳＢ方向）へ８ビットシフトす
ることを３度繰り返してＣレジスタの初期化を終了す
る。続いて、図１９に示すＭＰＳの確率領域を示すＡレ
ジスタに１００００Ｈｅｘ（最大確率領域幅）をセット
し、復号器の初期化処理を完了する。

【００３１】次に、復号化するためのコンテクストを逆
予測変換処理部９より出力された出力２値シンボル列か
ら画像参照シンボル選択部４０にて図１３に示すテンプ
レートに従って参照シンボルを選択する。

【００３２】次に、確率推定部１において２値算術復号
化処理を行うにあたっての処理手順を図３２に示す。式
ＬＳＺ（ＳＴ（ＣＸ））で示される画像参照シンボル選
択部４０より出力された各コンテクストに対応した状態
番号／優勢シンボル記憶部４に記憶された状態ＳＴに対
応したＬＰＳに割り当てる確率領域の幅ＬＳＺを確率推
定テーブル３から読み出し、そのＬＰＳに割り当てる確
率領域の幅ＬＳＺを２値算術復号化部１４へ渡す。２値
算術復号化部１４では、確率推定部１より渡されたＬＳ
Ｚの値をＡレジスタより減算する。

【００３３】次に、上記減算処理後のＡレジスタの値と
ＣレジスタのＭＳＢ側１６ビットを示す図１９に示すＣ
ＨＩＧＨの内容を比較する。Ａレジスタには、現在まで
に復号されたシンボルによって分割されてきた領域幅が
すでに復号されたシンボル分拡大されて、すなわちシフ
トされた回数分拡大された値が入っており、ＣＨＩＧＨ
には、符号化するシンボル列に対して割り当てられた確
率領域を代表する座標情報（下界の座標）のうち、まだ
入力されない符号分を除いた座標の近似値（下界座標は
すべての符号が復号器に入力された段階で完結する）か
ら、すでに復号されたシンボルに割り当てられた領域の
下界座標を減算した値がＡレジスタと同じ拡大を与えら
れて入っている。

【００３４】そのＡレジスタを、次に復号するシンボル
に対する推定領域幅で分割し、ＣＨＩＧＨレジスタがそ
の分割された領域の境界よりもＭＰＳ側に属している
か、ＬＰＳ側に属しているかによって、すなわち、Ａ−
ＬＳＺ（ＳＴ（ＣＸ））とＣＨＩＧＨの大小比較によっ
て復号を行う。

【００３５】復号化を行っている復号化対象シンボルが
ＭＰＳであった場合、Ａレジスタの幅が８０００Ｈｅｘ
以上であれば逆予測変換処理部９へ処理を継続し、８０
００Ｈｅｘより小さい場合にはＭＰＳの条件付き交換処
理を行った後、正規化処理を行い、逆予測変換処理部９
へ処理を継続する。復号化を行っている復号化対象シン
ボルがＬＰＳであった場合、符号化処理の場合と同様に
必ず正規化処理を行い、逆予測変換処理部９へ処理を継
続する。

【００３６】上記復号化対象シンボルがＬＰＳであった
場合のＭＰＳ／ＬＰＳ領域の条件付き交換処理の処理手
順を図３３に示す。また、上記復号化対象シンボルがＭ
ＰＳであった場合のＭＰＳ／ＬＰＳ領域の条件付き交換
処理の処理手順を図３４に示す。

【００３７】２値算術復号化装置における正規化処理手
順は、上記２値算術符号化処理時における正規化処理手
順とまったく同一である。すなわち、図１４および図２
９に示す正規化処理手順と等しい。符号化／復号化処理
時に関わらず、正規化処理では、ＡレジスタおよびＣレ
ジスタの値をレジスタ中にて左（ＭＳＢ方向）へシフト
し、８０００Ｈｅｘより小さくなったＡレジスタ内容を
８０００Ｈｅｘより大きくし、Ｃレジスタ中の符号が不
足したら次の符号をＣレジスタに読み込み、復号を継続
する。

【００３８】次に、逆予測変換処理部６の動作内容につ
いて説明する。画像参照シンボル選択部４０の出力であ
るコンテクストを用いて、確率推定部１はコンテクスト
に対応したＭＰＳ値を状態番号／優勢シンボル記憶部４
から取り出して、逆予測変換処理部９に伝える。また、
２値算術復号化部１４より出力された「復号シンボルが
ＭＰＳかＬＰＳか」を示すＭＰＳ／ＬＰＳ情報とこのＭ
ＰＳ値を比較することで、符号化する前のシンボルが出
力される。

【００３９】

【発明が解決しようとする課題】上記のように従来の２
値算術符号化装置における初期化処理においては、状態
番号／優勢シンボル記憶部４に与える初期値として、す
べての状態を“０”、全てのＭＰＳ値も“０”と設定し
ていたため、各コンテクストにおける状態が、ＭＰＳ／
ＬＰＳの出現確率に適した領域幅選択が行える状態にな
るまで、効率の悪い符号が出力されるという問題点があ
った。

【００４０】また、入力シンボル数が画像ほど多くない
文字文書の符号化時には、各コンテクストがＭＰＳ／Ｌ
ＰＳの出現確率に応じた領域幅選択を行える状態に至る
前に符号化が終了してしまい、このような場合には、参
照シンボル数を増やしても、符号化効率が上がらないと
いう欠点を有していた。

【００４１】さらに、予測の的中率を上げる目的で、参
照シンボル数を増やしても、ＭＰＳだけが生じてＬＰＳ
が全く生じないコンテクストが増加し、このコンテクス
トに対する確率領域割り当てが状態０からスタートする
ため、ＬＰＳが出現しないにもかかわらず、符号化効率
が改善しないという問題も有していた。

【００４２】この発明は、上述した従来例における問題
点を解消するためになされたもので、適応型２値算術符
号化方式を用いた文字符号化において、文字を２値のシ
ンボル列とみなして符号化を行っても、画像に比べて入
力シンボル数が少ないため、適応部の状態遷移が十分に
行われないことから学習効果が得られず、データ圧縮率
及び符号化効率が低下するのを回避するために、別途統
計的に文書の特徴を計測し、適応型２値算術符号化方式
の適応部の「状態番号」と「優勢シンボル値」について
初期値を与えることで、学習ステップを削減し、符号化
効率を向上させることができる符号化装置を提供するも
のである。

【００４３】また、画像符号化に用いられる２値算術符
号化方式とも、多くの部品を共通化し、文字／画像共用
の符号化装置を提供するものである。

【００４４】さらに、参照シンボルの選択に使用する回
路についても、簡易で高速化が図れる構成の符号化装置
を提供するものである。

【００４５】

【課題を解決するための手段】この発明の請求項１に係
る符号化装置は、文字コードを２値のシンボル列とみな
して２値のシンボル列から符号化対象シンボルの直前の
連続する所定個以上の参照シンボルを選択する参照シン
ボル選択部と、参照シンボル選択部により選択された参
照シンボルの個々の値の組み合わせによって生ずるコン
テクスト毎に符号化対象シンボルが各コンテクストにお
いて出現確率が高いと予想されるシンボルと一致すれば
優勢シンボル（以下、優勢シンボルをＭＰＳという）で
あることを、出現確率が高いと予想されるシンボルと一
致しなければ劣勢シンボル（以下、劣勢シンボルをＬＰ
Ｓという）であることを示すデータをそれぞれ出力する
予測変換処理部と、コンテクストの状態を示す状態番号
とＬＰＳあるいはＭＰＳに割り当てる確率領域幅を対応
づけるとともに、状態の遷移が必要となった場合の状態
遷移先番号を記憶する確率推定テーブルと、各コンテク
スト毎に状態番号によって識別し、符号化対象シンボル
に対する上記予測変換処理部の出力とそのコンテクスト
とを入力とし、上記確率推定テーブルを参照してコンテ
クスト毎の状態遷移を行いながら、ＬＰＳあるいはＭＰ
Ｓに対する確率領域幅を推定し出力する確率推定部と、
各コンテクストの状態番号とＭＰＳ値を記憶する状態番
号／優勢シンボル記憶部と、上記確率推定部の出力であ
るＬＰＳあるいはＭＰＳに対する確率領域幅を用いて符
号化対象シンボルを演算により符号化する２値算術符号
化部とを有する文字符号化部を備えると共に、上記文字
符号化部の２値出力符号を逐次復号し、復号対象シンボ
ルがＭＰＳであるかＬＰＳであるかをコード出力する２
値算術復号化部と、２値算術復号化部の出力コードを符
号化前の２値シンボル列に変換する逆予測変換処理部
と、逆予測変換処理部の２値出力シンボル列から上記符
号器側と同じ参照シンボルを選択する参照シンボル選択
部と、参照シンボル選択部により選択された参照シンボ
ルの個々の値の組み合わせによって生ずるコンテクスト
と２値算術復号化部の出力コードを入力とし、各コンテ
クスト毎に状態番号によって識別し、上記文字符号化部
と同じ確率推定テーブルを参照することによって、状態
遷移を行いながら、各コンテクストの各状態についてＬ
ＰＳあるいはＭＰＳに割り当てられる確率領域幅を推定
し出力する確率推定部と、確率推定部の状態番号とＭＰ
Ｓ値を記憶する状態番号／優勢シンボル記憶部とを有
し、逆予測変換処理部の２値シンボル列を出力とする文
字復号化部とを備える符号化装置において、符号化を行
おうとする複数の文書について参照シンボル選択部が選
択するのと同じ参照シンボルを用いて各コンテクストに
おけるＬＰＳの出現確率ｐ_1ps を予め算出し、この時の
ＬＰＳの出現確率をｐ_1ps とした場合、予め定めた正の
整数ｎについて１／２^k+2 ≦ ｐ_1ps ＜１／２^k+1 を満たす整数ｋ（ｎ＞ｋ≧０）を各コンテクスト毎に求
め、ｐ_1ps＜１／２ⁿ⁺²の場合にはｋ＝ｎと選択し、ＭＰ
Ｓしか発生しないコンテクストであるＰ_1pS ＝０の場合
についてはＬＰＳに対して割り当てられる確率領域幅が
最小になる状態番号をｋに設定することによってコンテ
クストを分類すると共に、各コンテクストにおけるＭＰ
Ｓ値を予め計測して、上記整数ｋによって分類され、そ
れに対応づけられた初期状態番号を各コンテクストの状
態番号に設定すると共に、上記計測したＭＰＳ値を優勢
シンボルの初期ＭＰＳ値として記憶してなる状態番号／
ＭＰＳ初期値記憶部を上記文字符号化部及び文字復号化
部に備え、符号および復号の開始時に、状態番号／ＭＰ
Ｓ初期値記憶部の内容を文字符号化部および文字復号化
部の状態番号／優勢シンボル記憶部に設定した後、符号
化および復号化動作をそれぞれ開始することを特徴とし
たものである。

【００４６】また、請求項２に係る符号化装置は、文字
コードを２値のシンボル列とみなして２値のシンボル列
から符号化対象シンボルの直前の連続する所定個以上の
参照シンボルを選択する参照シンボル選択部と、参照シ
ンボル選択部により選択された参照シンボルの個々の値
の組み合わせによって生ずるコンテクスト毎に符号化対
象シンボルが各コンテクストにおいて出現確率が高いと
予想されるシンボルと一致すれば優勢シンボル（以下、
優勢シンボルをＭＰＳという）であることを、出現確率
が高いと予想されるシンボルと一致しなければ劣勢シン
ボル（以下、劣勢シンボルをＬＰＳという）であること
を示すデータをそれぞれ出力する予測変換処理部と、コ
ンテクストの状態を示す状態番号とＬＰＳあるいはＭＰ
Ｓに割り当てる確率領域幅を対応づけるとともに、状態
の遷移が必要となった場合の状態遷移先番号を記憶する
確率推定テーブルと、各コンテクスト毎に状態番号によ
って識別し、符号化対象シンボルに対する上記予測変換
処理部の出力とそのコンテクストとを入力とし、上記確
率推定テーブルを参照してコンテクスト毎の状態遷移を
行いながら、ＬＰＳあるいはＭＰＳに対する確率領域幅
を推定し出力する確率推定部と、各コンテクストの状態
番号とＭＰＳ値を記憶する状態番号／優勢シンボル記憶
部と、上記確率推定部の出力であるＬＰＳあるいはＭＰ
Ｓに対する確率領域幅を用いて符号化対象シンボルを演
算により符号化する２値算術符号化部とを有する文字符
号化部を備えると共に、上記文字符号化部の２値出力符
号を逐次復号し、復号対象シンボルがＭＰＳであるかＬ
ＰＳであるかをコード出力する２値算術復号化部と、２
値算術復号化部の出力コードを符号化前の２値シンボル
列に変換する逆予測変換処理部と、逆予測変換処理部の
２値出力シンボル列から上記符号器側と同じ参照シンボ
ルを選択する参照シンボル選択部と、参照シンボル選択
部により選択された参照シンボルの個々の値の組み合わ
せによって生ずるコンテクストと２値算術復号化部の出
力コードを入力とし、各コンテクスト毎に状態番号によ
って識別し、上記文字符号化部と同じ確率推定テーブル
を参照することによって、状態遷移を行いながら、各コ
ンテクストの各状態についてＬＰＳあるいはＭＰＳに割
り当てられる確率領域幅を推定し出力する確率推定部
と、確率推定部の状態番号とＭＰＳ値を記憶する状態番
号／優勢シンボル記憶部とを有し、逆予測変換処理部の
２値シンボル列を出力とする文字復号化部とを備える符
号化装置において、上記文字符号化部に、符号化対象の
文書毎に各コンテクストにおける２値シンボルの出現数
をカウントしてＭＰＳ値を求めるＭＰＳ／ＬＰＳ検出部
を備え、符号化時に上記状態番号／優勢シンボル記憶部
にｍビットの参照シンボルから構成されるコンテクスト
全てに関する２^m 個のＭＰＳをテーブルとしたＭＰＳテ
ーブル情報を生成し、このＭＰＳテーブル情報をシンボ
ル列と見なして初期値として全てのコンテクストにおい
て状態番号を“０”、ＭＰＳ値も“０”と設定して符号
化を開始し、続く符号化する文字情報については、２ ^m
個のコンテクストについてＭＰＳテーブル情報値を状態
番号／優勢シンボル記憶部のＭＰＳ値に設定し、かつ予
め復号化部と取り決めた初期状態番号を全コンテクスト
に（同じ番号を）設定した後、符号化すると共に、上記
文字復号化部に、２値算術符号化されて送られてきた文
字文書伸長用の全コンテクストについての初期ＭＰＳ値
の復号した値を蓄積する初期ＭＰＳ値蓄積部を備え、復
号化時に、状態番号／優勢シンボル記憶部の初期値とし
て、全てのコンテクストにおいて状態番号を“０”、優
勢シンボルも“０”と設定して復号化を開始し、ＭＰＳ
テーブル情報の復号データを初期ＭＰＳ値蓄積部に一時
蓄積し、ＭＰＳテーブル情報の復号が終了した時点で、
復号されたＭＰＳテーブル情報を状態番号／優勢シンボ
ル記憶部のＭＰＳ値に設定した後、上記予め符号化部と
取り決めた初期状態番号を全コンテクストについて設定
して文字情報の復号を開始することを特徴とするもので
ある。

【００４７】また、請求項３に係る符号化装置は、文字
コードを２値のシンボル列とみなして２値のシンボル列
から符号化対象シンボルの直前の連続する所定個以上の
参照シンボルを選択する参照シンボル選択部と、参照シ
ンボル選択部により選択された参照シンボルの個々の値
の組み合わせによって生ずるコンテクスト毎に符号化対
象シンボルが各コンテクストにおいて出現確率が高いと
予想されるシンボルと一致すれば優勢シンボル（以下、
優勢シンボルをＭＰＳという）であることを、出現確率
が高いと予想されるシンボルと一致しなければ劣勢シン
ボル（以下、劣勢シンボルをＬＰＳという）であること
を示すデータをそれぞれ出力する予測変換処理部と、コ
ンテクストの状態を示す状態番号とＬＰＳあるいはＭＰ
Ｓに割り当てる確率領域幅を対応づけるとともに、状態
の遷移が必要となった場合の状態遷移先番号を記憶する
確率推定テーブルと、各コンテクスト毎に状態番号によ
って識別し、符号化対象シンボルに対する上記予測変換
処理部の出力とそのコンテクストとを入力とし、上記確
率推定テーブルを参照してコンテクスト毎の状態遷移を
行いながら、ＬＰＳあるいはＭＰＳに対する確率領域幅
を推定し出力する確率推定部と、各コンテクストの状態
番号とＭＰＳ値を記憶する状態番号／優勢シンボル記憶
部と、上記確率推定部の出力であるＬＰＳあるいはＭＰ
Ｓに対する確率領域幅を用いて符号化対象シンボルを演
算により符号化する２値算術符号化部とを有する文字符
号化部を備えると共に、上記文字符号化部の２値出力符
号を逐次復号し、復号対象シンボルがＭＰＳであるかＬ
ＰＳであるかをコード出力する２値算術復号化部と、２
値算術復号化部の出力コードを符号化前の２値シンボル
列に変換する逆予測変換処理部と、逆予測変換処理部の
２値出力シンボル列から上記符号器側と同じ参照シンボ
ルを選択する参照シンボル選択部と、参照シンボル選択
部により選択された参照シンボルの個々の値の組み合わ
せによって生ずるコンテクストと２値算術復号化部の出
力コードを入力とし、各コンテクスト毎に状態番号によ
って識別し、上記文字符号化部と同じ確率推定テーブル
を参照することによって、状態遷移を行いながら、各コ
ンテクストの各状態についてＬＰＳあるいはＭＰＳに割
り当てられる確率領域幅を推定し出力する確率推定部
と、確率推定部の状態番号とＭＰＳ値を記憶する状態番
号／優勢シンボル記憶部とを有し、逆予測変換処理部の
２値シンボル列を出力とする文字復号化部とを備える符
号化装置において、上記文字符号化部に、符号化対象の
文書毎に各コンテクストにおける２値シンボルの出現数
をカウントしてＭＰＳ値を求めるＭＰＳ／ＬＰＳ検出部
を備え、符号化時に、このＭＰＳ／ＬＰＳ検出部を用い
て各コンテクストのＭＰＳ値を示す１ビットと「ＭＰＳ
のみが発生し、ＬＰＳが発生しない」コンテクストであ
ることを示す１ビットの計２ビットをコンテクスト情報
として求め、ｍシンボルの参照シンボルを用いる場合に
は全部で２^m+1 ビットのコンテクスト情報を文字情報と
見なして状態番号／優勢シンボル記憶部の初期値として
全てのコンテクストにおいて状態番号を“０”、優勢シ
ンボルも“０”と設定して符号化を開始し、続く文字情
報については、ＭＰＳ値を状態番号／優勢シンボル記憶
部に設定し、かつ、「ＭＰＳのみが発生し、ＬＰＳが発
生しない」コンテクストについては、状態番号／優勢シ
ンボル記憶部の状態番号を「ＬＰＳに割り当てる確率領
域を最小にする状態番号」に設定した後、文字符号化を
行うと共に、上記文字復号化部に、復号した上記２^m+1
ビットのコンテクスト情報を蓄積する初期化情報蓄積部
を備え、状態番号／優勢シンボル記憶部の初期値とし
て、全てのコンテクストにおいて状態番号を“０”、優
勢シンボルも“０”と設定して復号化を開始し、復号し
た２^m+1 ビットのコンテクスト情報を上記初期化情報蓄
積部に蓄積し、コンテクスト情報の復号が終了した時点
で、復号された各コンテクストにおけるＭＰＳ値を状態
番号／優勢シンボル記憶部の優勢シンボル値に設定し、
かつ、「ＭＰＳのみが発生し、ＬＰＳが発生しない」コ
ンテクストであることがわかったコンテクストについて
は状態番号／優勢シンボル記憶部の状態番号を「ＬＰＳ
に割り当てる確率領域を最小にする状態番号」に設定し
た後、文字情報の復号を行うことを特徴とするものであ
る。

【００４８】また、請求項４に係る符号化装置は、文字
コードを２値のシンボル列とみなして２値のシンボル列
から符号化対象シンボルの直前の連続する所定個以上の
参照シンボルを選択する参照シンボル選択部と、参照シ
ンボル選択部により選択された参照シンボルの個々の値
の組み合わせによって生ずるコンテクスト毎に符号化対
象シンボルが各コンテクストにおいて出現確率が高いと
予想されるシンボルと一致すれば優勢シンボル（以下、
優勢シンボルをＭＰＳという）であることを、出現確率
が高いと予想されるシンボルと一致しなければ劣勢シン
ボル（以下、劣勢シンボルをＬＰＳという）であること
を示すデータをそれぞれ出力する予測変換処理部と、コ
ンテクストの状態を示す状態番号とＬＰＳあるいはＭＰ
Ｓに割り当てる確率領域幅を対応づけるとともに、状態
の遷移が必要となった場合の状態遷移先番号を記憶する
確率推定テーブルと、各コンテクスト毎に状態番号によ
って識別し、符号化対象シンボルに対する上記予測変換
処理部の出力とそのコンテクストとを入力とし、上記確
率推定テーブルを参照してコンテクスト毎の状態遷移を
行いながら、ＬＰＳあるいはＭＰＳに対する確率領域幅
を推定し出力する確率推定部と、各コンテクストの状態
番号とＭＰＳ値を記憶する状態番号／優勢シンボル記憶
部と、上記確率推定部の出力であるＬＰＳあるいはＭＰ
Ｓに対する確率領域幅を用いて符号化対象シンボルを演
算により符号化する２値算術符号化部とを有する文字符
号化部を備えると共に、上記文字符号化部の２値出力符
号を逐次復号し、復号対象シンボルがＭＰＳであるかＬ
ＰＳであるかをコード出力する２値算術復号化部と、２
値算術復号化部の出力コードを符号化前の２値シンボル
列に変換する逆予測変換処理部と、逆予測変換処理部の
２値出力シンボル列から上記符号器側と同じ参照シンボ
ルを選択する参照シンボル選択部と、参照シンボル選択
部により選択された参照シンボルの個々の値の組み合わ
せによって生ずるコンテクストと２値算術復号化部の出
力コードを入力とし、各コンテクスト毎に状態番号によ
って識別し、上記文字符号化部と同じ確率推定テーブル
を参照することによって、状態遷移を行いながら、各コ
ンテクストの各状態についてＬＰＳあるいはＭＰＳに割
り当てられる確率領域幅を推定し出力する確率推定部
と、確率推定部の状態番号とＭＰＳ値を記憶する状態番
号／優勢シンボル記憶部とを有し、逆予測変換処理部の
２値シンボル列を出力とする文字復号化部とを備える符
号化装置において、上記文字符号化部に画像データ選択
信号の入力に基づいて画像の２値シンボル列から符号化
対象シンボルの発生確率を推定するための参照シンボル
を取り出す画像参照シンボル選択部を備えると共に、上
記文字復号化部に、画像データ選択信号の入力に基づい
て逆予測変換処理部の出力から復号対象シンボルのＭＰ
Ｓ／ＬＰＳの確率推定を行うための参照ビットを取り出
す画像参照シンボル選択部を備えたことを特徴とするも
のである。

【００４９】さらに、請求項５に係る符号化装置は、文
字コードを２値のシンボル列とみなして２値のシンボル
列から符号化対象シンボルの直前の連続する所定個以上
の参照シンボルを選択する参照シンボル選択部と、参照
シンボル選択部により選択された参照シンボルの個々の
値の組み合わせによって生ずるコンテクスト毎に符号化
対象シンボルが各コンテクストにおいて出現確率が高い
と予想されるシンボルと一致すれば優勢シンボル（以
下、優勢シンボルをＭＰＳという）であることを、出現
確率が高いと予想されるシンボルと一致しなければ劣勢
シンボル（以下、劣勢シンボルをＬＰＳという）である
ことを示すデータをそれぞれ出力する予測変換処理部
と、コンテクストの状態を示す状態番号とＬＰＳあるい
はＭＰＳに割り当てる確率領域幅を対応づけるととも
に、状態の遷移が必要となった場合の状態遷移先番号を
記憶する確率推定テーブルと、各コンテクスト毎に状態
番号によって識別し、符号化対象シンボルに対する上記
予測変換処理部の出力とそのコンテクストとを入力と
し、上記確率推定テーブルを参照してコンテクスト毎の
状態遷移を行いながら、ＬＰＳあるいはＭＰＳに対する
確率領域幅を推定し出力する確率推定部と、各コンテク
ストの状態番号とＭＰＳ値を記憶する状態番号／優勢シ
ンボル記憶部と、上記確率推定部の出力であるＬＰＳあ
るいはＭＰＳに対する確率領域幅を用いて符号化対象シ
ンボルを演算により符号化する２値算術符号化部とを有
する文字符号化部を備えると共に、上記文字符号化部の
２値出力符号を逐次復号し、復号対象シンボルがＭＰＳ
であるかＬＰＳであるかをコード出力する２値算術復号
化部と、２値算術復号化部の出力コードを符号化前の２
値シンボル列に変換する逆予測変換処理部と、逆予測変
換処理部の２値出力シンボル列から上記符号器側と同じ
参照シンボルを選択する参照シンボル選択部と、参照シ
ンボル選択部により選択された参照シンボルの個々の値
の組み合わせによって生ずるコンテクストと２値算術復
号化部の出力コードを入力とし、各コンテクスト毎に状
態番号によって識別し、上記文字符号化部と同じ確率推
定テーブルを参照することによって、状態遷移を行いな
がら、各コンテクストの各状態についてＬＰＳあるいは
ＭＰＳに割り当てられる確率領域幅を推定し出力する確
率推定部と、確率推定部の状態番号とＭＰＳ値を記憶す
る状態番号／優勢シンボル記憶部とを有し、逆予測変換
処理部の２値シンボル列を出力とする文字復号化部とを
備える符号化装置において、上記文字符号化部の上記参
照シンボル選択部を、符号化対象ビットの直前の連続す
るｍビットを参照ビットとして取り出すシフトレジスタ
と、このシフトレジスタの内容をアドレス信号として上
記状態番号／優勢シンボル記憶部内のコンテクストに対
応した領域を選択するためのラッチ回路とで構成し、か
つ上記アドレス線により指定された状態番号／優勢シン
ボル記憶部内の特定アドレス内容を確率推定部から読み
書きするためのリード／ライト信号線と、確率推定部か
らシフトレジスタ部へデータのシフトタイミングを知ら
せる次コンテクスト要求信号線とを備えると共に、上記
文字復号化部の上記参照シンボル選択部を、復号対象シ
ンボル直前の連続するｍビットを参照シンボルとして取
り出すシフトレジスタと、このシフトレジスタの内容を
アドレス信号として出力するためのラッチ回路とで構成
し、かつ上記アドレス線により指定された状態番号／優
勢シンボル記憶部内の特定アドレス内容を確率推定部か
ら読み書きするためのリード／ライト信号線と、確率推
定部からシフトレジスタ部へデータのシフトタイミング
を知らせる次コンテクスト要求信号線とを備えたことを
特徴とするものである。

【００５０】

【作用】この発明の請求項１に係る符号化装置において
は、前もって符号化対象の複数の文書あるいは符号化対
象の文書を代表する文書を用いて、コンテクスト毎のＭ
ＰＳ値を求めて符号化部と復号化部に初期ＭＰＳ値とし
て設定するとともに、各コンテクストにおけるＬＰＳの
出現確率に応じて、各コンテクストの初期状態番号を指
定することにより、確率推定部が各コンテクストにおけ
るＬＰＳやＭＰＳの出現確率に応じた最適な確率領域幅
を選択するまでに要する学習ステップを削減し、文字文
書の圧縮率および符号化効率の向上を実現する。

【００５１】また、請求項２に係る符号化装置において
は、符号化を行う文書毎に、予め全コンテクストのＭＰ
Ｓ値を求めておき、そのＭＰＳ値を符号化部と復号化部
共通の初期ＭＰＳ値とすると同時に、初期ＭＰＳ値が与
えられたことを条件として最も圧縮率が向上する全コン
テクストに共通な初期状態番号を符号化部と復号化部で
予め取り決めておくことで、文字文書の圧縮効率を向上
させるとともに、ＭＰＳ初期値を符号化部から復号化部
に送るに当たっては、ＭＰＳ値の情報（ＭＰＳテーブル
情報）をシンボル列とみなして２値算術符号化部を利用
して圧縮して送ることで符号化効率を高める。

【００５２】また、請求項３に係る符号化装置において
は、符号化を行う文書毎に、予め全コンテクストにおい
てＭＰＳとＬＰＳの出現数をカウントし、上記請求項２
と同様に、各コンテクストのＭＰＳ値を求めると同時
に、ＬＰＳが出現しないコンテクストを求めて、そのコ
ンテクストについては、ＬＰＳに割り当てられる確率領
域幅が最小になる状態番号を初期状態番号とすることを
符号化部と復号化部とで予め取り決めておき、全コンテ
クストへの初期ＭＰＳ値の設定と、ＬＰＳが出現しない
コンテクストへの「ＬＰＳに割り当てられる確率領域幅
が最小になる状態番号」の設定を行った後、符号化およ
び復号化の動作を行うことで、文字圧縮率を向上させ
る。また、全コンテクストのＭＰＳ値と、ＬＰＳが出現
しないコンテクストを符号化部から復号化部に通知する
にあたっては、これらの情報をシンボル列とみなして２
値算術符号化部にて圧縮し、復号化部では、全コンテク
ストのＭＰＳ値と、ＬＰＳが出現しないコンテクストを
まず復号したのち、符号化部と同じ方法で初期ＭＰＳ値
と初期状態番号を与えた後、文字の復号を行う方法によ
り、符号化効率の向上を実現する。

【００５３】また、請求項４に係る符号化装置において
は、請求項３で実現された文字符号化に適した符号化装
置の構成に、参照シンボル選択部として画像用の参照シ
ンボル選択部も選択できるようにすることで、画像符号
化装置と文字符号化装置が確率推定テーブルをはじめ確
率推定部、算術符号化部を共有できるようにする。

【００５４】さらに、請求項５に係る符号化装置におい
ては、上記請求項１ないし３に記した符号化装置の参照
シンボル選択部を、簡単なシフトレジスタにより実現
し、回路の高速化を実現する。

【００５５】

【実施例】

実施例１．請求項１に係る文字符号化部２０の実施例を
図１に示す。図１において、８は文字入力を２値シンボ
ル列に変換する文字コード２値化部、５はこの変換され
た２値シンボル列から符号化対象シンボルの直前の７個
以上の連続するシンボルを参照シンボルとして選択する
参照シンボル選択部であり、ここで参照シンボルが２値
シンボルであるため、参照シンボル数をｍとすると、２
^m 通りの組み合わせ（コンテクスト）が出現しうる。

【００５６】６はそのコンテクストによって、入力シン
ボルがより出現確率が高いシンボル（ＭＰＳ：More Pro
bable Symbol ）であるか、出現確率が低いシンボル
（ＬＰＳ：Less Probable Symbol ）であるかを出力す
る予測変換処理部、１はコンテクスト毎にステートマシ
ンを持ち、その状態を入力シンボルがＭＰＳであるかＬ
ＰＳであるかによって遷移させ、２値算術符号のために
各コンテクストにおけるＬＰＳ領域幅あるいはＭＰＳ領
域幅を適応的に推定し選択する確率推定部である。

【００５７】３は確率推定部１の状態番号とＬＰＳある
いはＭＰＳに対して割り当てる確率領域幅を対応づけ、
また、符号化対象シンボルがＭＰＳであるかＬＰＳかに
応じて状態の遷移先を定める確率推定テーブルであり、
確率推定テーブルの例としては、図１０にISO/IEC Comm
ittee Draft 11544 “Progressive Bi-level Image Com
pression"に記載の確率推定テーブル(Probability Esti
mation Tabie 23 )を示す。

【００５８】４は確率推定部１における各コンテクスト
毎の状態を状態番号として記憶するとともに、このコン
テクストにおける現在のＭＰＳ値を記憶する状態番号／
優勢シンボル記憶部、２は確率推定部１の出力であるＬ
ＰＳあるいはＭＰＳに対して割り当てる確率領域幅を入
力として２値算術符号演算を行い符号を出力する２値算
術符号化部、７は状態番号／ＭＰＳ初期値記憶部であ
る。

【００５９】一方、図２は、請求項１に係る文字復号化
部２１の実施例を示す。図２において、１４は２値算術
符号化された符号を入力して、復号対象シンボルがＭＰ
ＳであるかＬＰＳであるかを出力とする２値算術復号化
部、９は２値算術復号化部の出力、すなわち復号化対象
シンボルがＭＰＳであるかＬＰＳであるかを示すシンボ
ルを、符号化する前の２値シンボルに変換する逆予測変
換処理部である。

【００６０】１０は逆予測変換処理部９の出力である符
号化する前の２値シンボル列を、文字文書の文字コード
に変換する２値文字コード変換部、１は文字符号化部２
０と同じく、コンテクスト毎にステートマシンを持ち、
その状態を復号対象シンボルがＭＰＳであるかＬＰＳで
あるかによって遷移させ、２値算術復号のために各コン
テクストにおけるＬＰＳ領域幅あるいはＭＰＳの領域幅
を適応的に推定し選択する確率推定部である。

【００６１】３は確率推定テーブルであり、これは文字
符号化部２０における確率推定テーブル３と同一のもの
である。４は文字符号化部２０と同じく、確率推定部１
における各コンテクスト毎の状態を状態番号として記憶
するとともに、そのコンテクストにおける現在のＭＰＳ
値を記憶する状態番号／優勢シンボル記憶部、５も文字
符号化部２０と同じく、復号された文字コードの構成要
素である２値シンボル列から復号化対象シンボルの直前
の７個以上の連続するシンボルを参照シンボルとして選
択する参照シンボル選択部である。また、７は、文字符
号化部２０の場合と同一の状態番号／ＭＰＳの初期値記
憶部である。

【００６２】次に、図１と図２および図１０を用いて、
請求項１に係る符号化装置の動作を説明する。なお、こ
こでは、２値算術符号化方式として、ISO/IEC Committe
e Draft 11544 “Progressive Bi-level Image Compres
sion"に記載の算術符号化方式ＱＭコーダを例とする
が、他の２値算術符号でも同様である。

【００６３】まず、図１に示す文字符号化部２０の動作
について説明する。文字符号化を開始する先立って、確
率推定部１は、状態番号／ＭＰＳ初期値記憶部７の内容
を読み出し、各コンテクストに対応する状態番号／優勢
シンボル記憶部４に初期値を設定する。次に、文字符号
化が開始される。符号化対象文字は、文字符号化部２０
の文字コード２値変換部８に入力され、２値のシンボル
列に変換され、参照シンボル選択部５と予測変換処理部
６に伝えられる。

【００６４】参照シンボル選択部５は、例えば符号化シ
ンボル直前の連続する１６シンボルを参照シンボルに選
択し、各シンボルの値によって２¹⁶通りの組み合わせが
ある。この各々の組み合わせを、コンテクストとして確
率推定部１へ通知し、確率推定部１では、このコンテク
ストを基に、状態番号／優勢シンボル記憶部４の内容、
すなわちそのコンテクストの現在の状態番号とＭＰＳ値
を読み出す。

【００６５】状態番号／優勢シンボル記憶部４から読み
出されたＭＰＳ値は予測変換処理部６に通知される。予
測変換処理部６では、文字コード２値変換部８の出力で
ある符号化対象シンボルと確率推定部１から知られたそ
のコンテクストにおけるＭＰＳ値とを比較し、比較結果
をＬＰＳ／ＭＰＳコードとして、確率推定部１と２値算
術符号部２に通知する。このＬＰＳ／ＭＰＳコードは、
例えば、符号化対象シンボルがＭＰＳ値と一致したら
“０”、不一致なら“１”といった信号である。

【００６６】一方、確率推定部１は、先に参照シンボル
選択部５から通知されたコンテクストを基に、状態番号
／優勢シンボル記憶部４からそのコンテクストの現在の
状態番号を読み出し、この状態番号を基に、確率推定部
テーブル３からＬＰＳに対する領域割り当て幅を得る。
こうして得たＬＰＳ領域割り当て幅は、確率推定部１か
ら２値算術符号化部２に伝えられる。

【００６７】２値算術符号化部２では、予測変換処理部
６から通知されたＬＰＳ／ＭＰＳコードと、確率推定部
１から通知されたＬＰＳ領域割り当て幅から２値算術符
号化を実行する。すなわち、２値算術符号化部２におけ
る現在の有効領域幅をＡ、確率推定部１から通知された
ＬＰＳ領域割り当て幅をＬＳＺとすると、Ａ−ＬＳＺを
ＭＰＳに、ＬＳＺをＬＰＳの領域とし、予測変換処理部
６から通知されたＬＰＳ／ＭＰＳコードの内容に応じ
て、Ａ−ＬＳＺあるいはＬＳＺの領域を選択し、算術符
号化を実行する。

【００６８】一方、予測変換処理部６からＬＰＳ／ＭＰ
Ｓコードを通知された確率推定部１では、ＬＰＳを通知
されると、無条件でそのコンテクストでの状態遷移を実
行する。また、ＱＭコーダでは、２値算術符号化部２に
おいて２値算術符号演算により正規化が発生すると、Ｍ
ＰＳであっても状態遷移を実行する必要があるため、２
値算術符号化部２から確率推定部１へ正規化が発生した
ことが通知される。

【００６９】確率推定部１は、当該コンテクストが状態
遷移を必要とされる状況になったと判断すると、確率推
定テーブル３を参照し、遷移すべき次の状態番号を得
る。確率推定テーブル３は、図１０に示すように、符号
化対象シンボルがＬＰＳだった場合には次の状態番号は
ｎｌｐｓ（next lps) 欄から、符号化対象シンボルがＭ
ＰＳだった場合には次の状態番号はｎｍｐｓ（next mp
s）欄から得られる。新しい状態番号は、状態番号／優
勢シンボル記憶部４に書き込まれ、そのコンテクストの
状態番号が改訂される。

【００７０】また、ＱＭコーダでは、符号化対象シンボ
ルがＬＰＳで、確率推定テーブルのswitchビットが１の
場合、ＭＰＳ値を変更、すなわち、現在の値をＸとする
と（１−Ｘ）に置き換える。この新しいＭＰＳ値も状態
番号／優勢シンボル記憶部４に書き込まれ記憶される。
各シンボルごとに以上の手順で符号化が行われる。

【００７１】次に、図２に示す文字復号化部２１の動作
について説明する。復号動作が開始する先立って、確率
推定部１は、状態番号／ＭＰＳ初期値記憶部１５から、
各コンテクストの状態番号とＭＰＳ値を読み出し、この
各初期値を、状態番号／優勢シンボル記憶部４の相当す
るコンテクストの位置に設定した後、復号動作を開始す
る。復号動作が開始されると、文字符号化部２１の出力
符号は２値算術復号部１４に入力される。

【００７２】２値算術復号化部１４では、確率推定部１
からＬＰＳに対する領域幅を通知されることにより、復
号化対象シンボルがＭＰＳであるのかＬＰＳであるのか
を算術演算によって求め、結果をＬＰＳ／ＭＰＳコード
として出力する。このＬＰＳ／ＭＰＳコードを受けた逆
予測変換処理部９では、確率推定部１から通知を受けた
ＭＰＳ値とこのＬＰＳ／ＭＰＳコードから、復号対象シ
ンボルを復号し出力する。

【００７３】復号された２値シンボルは、２値文字コー
ド変換部１０により、文字として復号され、外部へと取
り出される。また、逆予測変換処理部９の出力、復号シ
ンボル列は、参照シンボル選択部５へと送られ、参照シ
ンボル選択部５で文字符号化部２０と同じ参照シンボル
を、すなわち、復号化対象シンボルの直前の連続する１
６個のシンボルを選択し、その各シンボルの値によって
２¹⁶通りのコンテクストを発生する。

【００７４】このコンテクストは確率推定部１へと通知
され、確率推定部１は、このコンテクストを基に、当該
コンテクストの状態番号とＭＰＳ値を、状態番号／優勢
シンボル記憶部４から読み出す。また、２値算術復号化
部１４から通知されたＬＰＳ／ＭＰＳコードから、その
コンテクストでの復号対象シンボルがＬＰＳであったが
ＭＰＳであったかを知り、状態遷移が必要であれば、状
態遷移の動作に移る。

【００７５】ＱＭコーダでは、状態遷移が必要な場合
は、２値算術復号化部１４から正規化が発生したことを
知らせる信号が送られてくるため、この信号が送られて
来た場合のみ、次に述べる状態遷移を実行すればよい。
すなわち、確率推定部１は、現在の状態番号を基に確率
推定テーブルから次の状態番号を得る。

【００７６】この動作は、文字符号化部２０と同じ動作
であり、確率推定テーブル３は図１０に示されている。
すなわち、符号化対象シンボルがＬＰＳだった場合には
次の状態場合はｎｌｐｓ（next lps) 欄から、符号化対
象シンボルがＭＰＳだった場合には次の状態番号はｎｍ
ｐｓ（next mps）欄から得られる。

【００７７】新しい状態番号は、状態番号／優勢シンボ
ル記憶部４に書き込まれ、そのコンテクストの状態番号
が改訂される。また、ＱＭコーダでは、符号化対象シン
ボルがＬＰＳで、確率推定テーブルのswitchビットが１
の場合、ＭＰＳ値を変更、すなわち、現在の値をＸとす
ると（１−Ｘ）に置き換える。この新しいＭＰＳ値も状
態番号／優勢シンボル記憶部４に書き込まれ記憶され
る。

【００７８】さて、状態番号が改訂されたされないに係
わらず、確率推定部１は、次の復号化対象シンボルのた
めのＬＰＳ領域幅を２値算術復号化部１４に通知する必
要がある。このＬＰＳ領域幅は、今、復号したシンボル
が参照シンボル選択部５に加えられ、参照シンボル選択
部５で選択された参照シンボルから次のコンテクストが
出力される。

【００７９】このコンテクストを用いて確率推定部１が
現在の状態番号を状態番号／優勢シンボル記憶部４から
読み出し、さらに、その状態番号を用いて、その状態で
のＬＰＳ領域幅を確率推定テーブル３から読み出すこと
により得られる。このＬＰＳ領域幅を確率推定部１は２
値算術復号化部１４に与えて次のシンボルの復号動作に
移る。

【００８０】ここで、この発明の状態番号／初期値記憶
部７の値の設定方法について述べる。符号化対象となっ
ている複数の文書、あるいは符号化対象を代表している
と思われる文書について、文字符号化部２０と文字復号
化部２１とは別に、例えば計算機上で、実際に参照シン
ボル選択部５が行うのと同じ参照シンボルを用いて、そ
れぞれのコンテクストごとに２値シンボルの出現回数を
カウントする。

【００８１】今、“０”シンボルがｉ回、“１”シンボ
ルがｊ回とすると、ｉとｊを比較し、出現回数が多かっ
た方をＭＰＳ、少なかった方をＬＰＳとする。ｉ≦ｊが
成り立てば、“１”がＭＰＳがあり、逆に、ｉ＞ｊが成
り立てば、“０”がＭＰＳ値となる。また、ＬＰＳの出
現確率ｐ_1ps はｉ≦ｊならｐ_1ps ＝ｉ／（ｉ＋ｊ）ｉ＞ｊならｐ_1ps ＝ｊ／（ｉ＋ｊ）として定める。

【００８２】この時、予め定めた正の整数ｎについて１／２^k+2 ≦ｐ_1ps ＜１／２^k+1 を満たす整数ｋ（ｎ＞ｋ≧０）を各コンテクスト毎に求
め、また、ｐ_1ps ＜１／２ⁿ⁺² の番号にはｋ＝ｎと選択
し、さらに、ｐ_1ps ＝０の場合、すなわち、統計的にも
ＭＰＳしか発生しないコンテクストについては、ＬＰＳ
に対して割り当てられる確率領域幅が最小になる状態番
号をｋに設定する。

【００８３】例えば、ｎ＝３とした場合、１／２² ≦ｐ_1ps ＜１／２¹ のコンテクストはｋ＝０１／２³ ≦ｐ_1ps ＜１／２² のコンテクストはｋ＝１１／２⁴ ≦ｐ_1ps ＜１／２³ のコンテクストはｋ＝２ｐ_1ps ＜１／２⁴ のコンテクストはｋ＝３また、ｐ_1ps ＝０のコンテクストは、ｋ＝１３と
いった状態番号が選択される。

【００８４】こうして求めたＭＰＳ値と状態番号を、各
コンテクスト毎に記憶させたのが、状態番号／ＭＰＳ初
期値記憶部７である。状態番号／初期値記憶部７は文字
符号化部２０および文字復号化部２１で共通に使用され
る。

【００８５】以上のように、上述した実施例１（請求項
１）では、予め符号化対象の複数の文書あるいは符号化
対象の文書を代表する文書を用いて、コンテクスト毎に
ＭＰＳ値を求めて符号化部と復号化部に初期ＭＰＳ値と
して設定するとともに、各コンテクストにおけるＬＰＳ
の出現確率に応じて、各コンテクストの初期状態番号を
設定することにより、確率推定部が各コンテクストにお
けるＬＰＳやＭＰＳの出現確率に応じて最適な確率領域
幅を選択するまでに要する学習ステップを削減し、かつ
既知の適応型２値算術符号部の構成については変更を加
えることなく、文字文書の圧縮率および符号化効率の向
上を実現することができるという効果を有する。

【００８６】実施例２．次に、請求項２に係る文字符号
化部２０の実施例を図３に示す。図３において、１１
は、符号化対象の文書毎に、各コンテクストにおける２
値シンボルの出現数をカウントし、各コンテクストにお
けるＭＰＳ値を求めるＭＰＳ／ＬＰＳ検出部であり、そ
の他の部分は、請求項１に係る図１における文字符号化
部２０と同じあるいは同等の部分を示し、８は文字コー
ド２値化部、５は参照シンボル選択部、６は予測変換処
理部、１は確率推定部、３は確率推定テーブルである。
４は状態番号／優勢シンボル記憶部、２は２値算術符号
化部である。

【００８７】一方、図４は請求項２に係る文字復号化部
２１の実施例を示す。図４において、１２は２値算術符
号化されてきた文字文書伸長用の全コンテクストについ
て初期ＭＰＳ値の復号した値を蓄積する初期ＭＰＳ値蓄
積部であり、この他の図中の部分は請求項１に係る図２
における文字復号化部２１と同じあるいは同等の部分を
示し、１４は２値算術復号化部、９は逆予測変換処理
部、１０は２値文字コード変換部、１は確率推定部、３
は確率推定テーブル、４は状態番号／優勢シンボル記憶
部、５は参照シンボル選択部である。

【００８８】次に、図３および図４を用いて、請求項２
に係る符号化装置の動作を説明する。なお、ここでは、
２値算術符号化方式として、ISO/IEC Committee Draft
11544 “Progressive Bi-level Image Compression"に
記載の算術符号化方式ＱＭコーダを例とするが、他の２
値算術符号でも同様である。

【００８９】まず、文字符号化部２０の動作について説
明する。本装置では、符号化しようとする文書を２度、
文字コード２値化部８に入力する。まず、第１回目の入
力時には、文字コード２値化部８の出力は、ＭＰＳ／Ｌ
ＰＳ検出部１１と参照シンボル選択部５へと送られる。
参照シンボル選択部５では、符号化対象シンボルの直前
の７個以上、例えば１６個の連続するシンボルを参照シ
ンボルとして選択する。

【００９０】ここで得られた２¹⁶通りのコンテクスト
は、文字コード２値化部８の出力と共にＭＰＳ／ＬＰＳ
検出部１１へと送られる。ＭＰＳ／ＬＰＳ検出部１１で
は、文字コード２値化部８の出力である２値シンボルの
それぞれについて、各コンテクスト毎に出現回数をカウ
ントする。

【００９１】今、あるコンテクストについて、シンボル
“０”がｉ回、シンボル“１”がｊ回出現したとする
と、ｉ≦ｊの時シンボル“１”をＭＰＳとしｉ＞ｊの時シンボル“０”をＭＰＳと定める。こうして、文書の第１回目の入力により、文書毎のコン
テクストにおけるＭＰＳ値が求まる。

【００９２】ＭＰＳ／ＬＰＳ検出部１１の内容から求め
られた各コンテクストのＭＰＳ値は、続いて、状態番号
／優勢シンボル記憶部４の内容を、全てのコンテクスト
について状態番号を“０”、優勢シンボルも“０”と初
期設定した状態で、２値算術符号にかけられる。すなわ
ち、上記の手順で求められた各コンテクストのＭＰＳ値
２¹⁶個は、参照シンボル選択部５と予測変換処理部６に
入力シンボルとして送られ、２値の算術符号にかけられ
て圧縮された後、文字復号化部２１へと送られる。

【００９３】また、２¹⁶個の文字圧縮用の初期ＭＰＳ値
が符号化を終了した後は、ＭＰＳ／ＬＰＳ検出部１１内
のカウンタ値から求められた各コンテクストにおけるＭ
ＰＳ値は、確率推定部１を経由して、状態番号／優勢シ
ンボル記憶部４に設定される。また、このとき、予め定
めておいた全てのコンテクストに共通な初期状態番号
値、たとえば“２”を、状態番号／優勢シンボル記憶部
４に同時に設定する。その後、２度目の文書入力を文字
コード２値化部８に対して開始する。以後の文字文書符
号化手順は、請求項１に係る図１に示す文字符号化部２
０の場合と同様である。

【００９４】次いで、文字復号化部２１の動作につい
て、図４を用いて説明する。文字文書復号器に送られて
くる最初の符号は、２¹⁶シンボル分の各コンテクストに
おけるＭＰＳ値である。そこで、まず、最初の２¹⁶シン
ボル分の復号については、状態番号／優勢シンボル記憶
部４の内容を、全てのコンテクストについて状態番号を
“０”、優勢シンボルも“０”と初期設定した状態で、
２値算術復号化が実行される。復号の手順は請求項１に
係る図２に示す文字復号化部２１の動作と同様である。

【００９５】復号された各コンテクストにおけるＭＰＳ
値は、初期ＭＰＳ値蓄積部１２に２¹⁶シンボルが溜まる
まで蓄積された後、確率推定部１を経由して、状態番号
／優勢シンボル記憶部４に設定される。このとき、予め
定めておいた全てのコンテクストに共通な初期状態番号
値、たとえば“２”を、状態番号／優勢シンボル記憶部
４に同時に設定する。引き続いて、このＭＰＳ値と状態
番号を初期値として、続いて送られてくる文字文書を２
値算術復号方式により復号する。この復号の手順も請求
項１に係る図２で説明した文字復号化部２１の動作と同
様である。こうして文字文書の圧縮伸長が行われる。

【００９６】以上のように、上述した実施例２（請求項
２）においては、符号化を行う文書毎に、第１パスで全
コンテクストのＭＰＳ値をまず求めて、そのＭＰＳ値を
符号化部と復号化部共通の初期ＭＰＳ値とし、同時に初
期ＭＰＳ値が与えられたことを条件として最も圧縮率が
向上する全コンテクストに共通な初期状態番号を符号化
部と復号化部で予め取り決めておくことで、文字文書の
圧縮効率を向上させるとともに、ＭＰＳ初期値を符号化
部から復号化部に送るに当たっては、ＭＰＳ値の情報
（ＭＰＳテーブル情報）を文字列とみなして２値算術符
号化方式を用いて圧縮して送ることで符号化効率を高め
ることができる。

【００９７】実施例３．次に、請求項３に係る文字符号
化部２０の実施例を図５に示す。図５において、１１
は、請求項２に係る実施例２と同じく、符号化対象の文
書毎に、各コンテクストにおける２値シンボルの出現数
をカウントし、カウントした各コンテクストにおけるＭ
ＰＳ値を検知するとともに、ＭＰＳのみが出現する、す
なわち一方のシンボルのみが出現するコンテクストを
「ＭＰＳのみ出現し、ＬＰＳが出現しないコンテクス
ト」として認識するＭＰＳ／ＬＰＳ検出部であり、その
他の部分は、請求項１に係る図１に示す文字符号化部２
０と同じあるいは同等の部分を示し、８は文字コード２
値化部、５は参照シンボル選択部、６は予測変換処理
部、１は確率推定部、３は確率推定テーブル、４は状態
番号／優勢シンボル記憶部、２は２値算術符号化部であ
る。

【００９８】一方、図６は請求項３に係る文字復号化部
２１の実施例を示す。図６において、１３は２値算術符
号化されて送られてきた各コンテクストについての文字
復号化のための初期ＭＰＳ値１ビットと、どのコンテク
ストが「ＭＰＳのみ出現し、ＬＰＳが出現しないコンテ
クスト」であるのかを示す１ビットの、あわせて「２ビ
ット×コンテクスト数」のデータを蓄積する初期化情報
蓄積部であり、その他の図中の部分は請求項１に係る図
２に示す文字復号化部２１と同じあるいは同等の部分を
示し、１４は２値算術復号化部、９は逆予測変換処理
部、１０は２値文字コード変換部、１は確率推定部、３
は確率推定テーブル、４は状態番号／優勢シンボル記憶
部、５は参照シンボル選択部である。

【００９９】次に、図５および図６を用いて、請求項３
に係る符号化装置の動作を説明する。まず、図５に示す
文字符号化部２０の動作について説明する。本装置にお
いても、請求項２と同じく、符号化しようとする文書を
２度、８の文字コード２値化部に入力する。まず、第１
回目の入力時には、文字コード２値化部８の出力は、Ｍ
ＰＳ／ＬＰＳ検出部１１と参照シンボル選択部５へと送
られる。

【０１００】参照シンボル選択部５では、やはり請求項
２と同じく、符号化対象シンボルの直前の７個以上、例
えば１６個の連続するシンボルを参照シンボルとして選
択する。ここで得られた２¹⁶通りのコンテクストは、文
字コード２値化部８の出力と共にＭＰＳ／ＬＰＳ検出部
１１へと送られる。ＭＰＳ／ＬＰＳ検出部１１では、文
字コード２値化部８の出力である２値シンボルのそれぞ
れについて、各コンテクスト毎に出現回数をカウントす
る。

【０１０１】今、あるコンテクストについて、シンボル
“０”がｉ回、シンボル“１”がｊ回出現したとする
と、ｉ≦ｊの時シンボル“１”をＭＰＳとしｉ＞ｊの時シンボル“０”をＭＰＳと定める。こうして、文書の第１回目の入力により、文書毎のコン
テクストにおけるＭＰＳ値が求まる。また、ｉ＞０かつｊ＝０の場合およびｉ＝０かつｊ＞０の場合そのコンテクストを「ＭＰＳのみ出現し、ＬＰＳが出現
しないコンテクスト」であることを認識する。

【０１０２】ＭＰＳ／ＬＰＳ検出部１１により検出され
た各コンテクストのＭＰＳ値１ビットと「ＭＰＳのみ出
現し、ＬＰＳが出現しないコンテクスト」であるかを示
す１ビットの合計「２ビット×コンテクスト数」の初期
化情報は、状態番号／優勢シンボル記憶部４の内容を、
全てのコンテクストについて状態番号を“０”、優勢シ
ンボルも“０”と初期設定した状態で、２値算術符号に
かけられる。

【０１０３】すなわち、上記の手順で求められた各コン
テクストのＭＰＳ値２¹⁶ビットと「ＭＰＳのみ出現し、
ＬＰＳが出現しないコンテクスト」であるかを示す２¹⁶
ビットは、参照シンボル選択部５と予測変換処理部６に
入力シンボルとして送られ、２値の算術符号にかけられ
て圧縮された後、文字復号化部２１へと送られる。

【０１０４】また、「２ビット×コンテクスト数」の初
期化情報の符号化が終了した後は、ＭＰＳ／ＬＰＳ検出
部１１のカウンタ値から求められた各コンテクストにお
けるＭＰＳ値は、確率推定部１を経由して、状態番号／
優勢シンボル記憶部４に設定される。

【０１０５】また、このとき、「ＭＰＳのみ出現し、Ｌ
ＰＳが出現しないコンテクスト」については「ＬＰＳに
対して割り当てられる確率領域幅が最小になる状態番
号」、例えば図１０の確率遷移テーブルでは状態番号１
３が状態番号／優勢シンボル記憶部４に同時に設定され
る。その後、２度目の文書入力を文字コード２値化部８
に対して開始する。以後の文字文書符号化手順は、請求
項１の文字符号化部２０の場合と同様である。

【０１０６】次いで、文字復号化部２１の動作につい
て、図６を用いて説明する。文字復号化部２１に送られ
てくる最初の符号は、「２ビット×コンテクスト数」の
初期化情報である。そこで、ます、最初の「２ビット×
コンテクスト数」の復号については、状態番号／優勢シ
ンボル記憶部４の内容を、全てのコンテクストについて
状態番号を“０”、優勢シンボルも“０”と初期設定し
た状態で、２値算術復号化が実行される。

【０１０７】復号の手順は請求項１に係る図２で説明し
た文字復号化部２１の動作と同様である。復号された各
コンテクストにおけるＭＰＳ値と「ＭＰＳのみ出現し、
ＬＰＳが出現しないコンテクスト」を示す初期化情報
は、初期化情報蓄積部１３に２¹⁶シンボルが溜まるまで
蓄積された後、確率推定部１を経由して、状態番号／優
勢シンボル記憶部４に設定される。このとき、予め定め
ておいた全てのコンテクストに共通な初期状態番号値、
たとえば「２ビット×コンテクスト数」の情報が溜まる
まで蓄積された後、各コンテクストのＭＰＳ値は確率推
定部１を経由して、状態番号／優勢シンボル記憶部４に
設定される。

【０１０８】このとき、「ＭＰＳのみ出現し、ＬＰＳが
出現しないコンテクスト」に対しては、文字符号化部２
０と同じく「ＬＰＳに対して割り当てられる確率領域幅
が最小になる状態番号」例えば、図１０の確率遷移テー
ブルでは、同じ状態番号１３が、状態番号／優勢シンボ
ル記憶部４に同時に設定される。引き続いて、このＭＰ
Ｓ値と状態番号を初期値として、続いて送られてくる文
字文書を２値算術復号方式により復号する。この復号の
手順も請求項１で説明した文字復号化部２１の動作と同
様である。こうして文字文書の符号化／復号化が行われ
る。

【０１０９】以上のように、上述した実施例３（請求項
３）においては、符号化を行う文書毎に、第１パスで各
コンテクストにおけるシンボルの出現数をカウントし、
上記請求項２と同様に、各コンテクストのＭＰＳ値を求
めるとともに、ＬＰＳが出現しないコンテクストを求め
て、そのコンテクストについては、ＬＰＳに割り当てら
れる確率領域幅が最小になる状態番号を初期状態番号と
することを符号化部と復号化部とで予め取り決めてお
き、全コンテクストへの初期ＭＰＳ値の設定と、ＬＰＳ
が出現しないコンテクストについては「ＬＰＳに対して
割り当てられる確率領域幅が最小になる状態番号」の設
定を行った後、符号化および復号化の動作を行うこと
で、文字圧縮率を向上させることができる。

【０１１０】また、全コンテクストのＭＰＳ値と、ＬＰ
Ｓが出現しないコンテクストを符号化部から復号化部に
通知するにあたっては、これらの情報を２値算術符号化
器にて圧縮し、復号化部では、全コンテクストのＭＰＳ
値と、ＬＰＳが出現しないコンテクストをまず復号し
て、初期ＭＰＳ値と初期状態番号を設定した後、文字の
復号を行うことにより、符号化効率の向上を実現するこ
とができる。

【０１１１】実施例４．次に、請求項４に係る文字／画
像符号化装置の符号化部の実施例を図７に示す。図７は
請求項１に係る図１に示す符号化部２０について、画像
符号化機能を追加した図である。また、図８は請求項１
に係る図２に示す文字復号化部２１について、画像復号
化機能を追加した図である。図７および図８において、
４０は上記文字／画像符号化装置の符号化部２２と復号
化部２３で使用される同じ画像参照シンボル選択部、２
４は符号化部２２および復号化部２３で、画像データと
文字データのいずれを符号化／復号化するのかを選択す
るための画像／文字データ選択信号である。

【０１１２】図７で上記画像参照シンボル選択部４０、
画像／文字データ選択信号２４の他の各部分の構成と動
作は、請求項１に係る実施例１の同一名称、同一番号で
示した符号化部の各部分と同一である。

【０１１３】次に、符号化部２２の動作について図７を
用いて説明する。まず、画像／文字データ選択信号２４
から、画像データを符号化するのか文字データを符号化
するのかを選択する指示が入力される。この画像／文字
データ選択信号２４の入力により、予測変換処理部６に
入力されるシンボルが選択されるとともに、確率推定部
１に入力されるコンテクストが、文字用の参照シンボル
によるコンテクストか画像用の参照シンボルによるコン
テクストかが選択される。

【０１１４】次に開始される符号化動作と各部の動作に
ついては、文字データ符号化が選択された場合には、請
求項１に係る実施例１の文字文書符号化装置の動作と同
じ動作を行い、画像データ符号化が選択された場合に
は、例えば、ISO/IEC Committee Draft 11544 “Progre
ssive Bi-level Image Compression"に記載され、従来
技術の例でも示した、lowest resolution layer の符号
化と同じ動作を行う。

【０１１５】次に図８を用いて、復号化部２３の動作を
説明する。上記画像参照シンボル選択部４０、画像／文
字データ選択信号２４の他の各部分の構成と動作は、請
求項１に係る実施例１の同一名称、同一番号で示した復
号化部の各部分と同一である。まず、画像／文字データ
選択信号２４で、画像データを復号するのか文字データ
を復号するのかを選択する指示が入力される。

【０１１６】この画像／文字データ選択信号２４の入力
により、逆予測変換処理部９の出力である復号シンボル
を、「文字データとして出力し、かつ、文字用の参照テ
ーブル選択部５に伝える」か、「画像データとして出力
し、かつ、画像用の参照テーブル選択部４０に伝える」
かを選択するとともに、確率推定部１へのコンテクスト
入力を、文字用の参照シンボル選択部５からのコンテク
スト画像用の画像参照シンボル選択部４０からのコンテ
クストかを選択する。

【０１１７】続いて開始される復号化動作と各部の動作
については、文字データ復号化が選択された場合には、
請求項１に係る実施例１の文字文書復号化器の動作と同
じ動作を行い、画像データ復号化が選択された場合に
は、例えばISO/IEC CommitteeDraft 11544 “Progressi
ve Bi-level Image Compression"に記載され、従来技術
の例でも示した、lowest resolution layer の符号化と
同じ動作を行うことで、文字／画像伸長装置を実現す
る。なお、この実施例は実施例１〜３にも同様に実施で
きる。

【０１１８】以上のように、上述した実施例４（請求項
４）においては、符号化部２２では、文字用の参照シン
ボル選択部の出力であるコンテクストと、画像参照シン
ボル選択部の出力であるコンテクストのいずれかを確率
推定部１に続いて伝えるよう選択し、また、予測変換処
理部６への入力シンボル列が文字データか画像データか
を選択することにより、復号化部２３では、逆予測変換
処理部９の出力である復号シンボルを、「文字データと
して出力し、かつ、文字用の参照テーブル選択部５に伝
える」かを選択するとともに、確率推定部１へのコンテ
クスト入力を、文字用の参照シンボル選択部５からのコ
ンテクストか画像用の画像参照シンボル選択部４０から
のコンテクストかを選択することにより、予測変換処理
部６、確率推定部１、確率推定テーブル３、状態番号／
優勢シンボル記憶部４、２値算術符号化部２、状態番号
／ＭＰＳ初期値記憶部７、逆予測変換処理部９、２値算
術復号化部１４の構成を変更することなく、符号化効率
の高い画像／文字両用の符号化装置を実現できる。

【０１１９】実施例５．次に、請求項５に係る符号化装
置の構成例を図９に示す。図９において、２５はシフト
レジスタ、２６はシフトレジスタ内容をラッチするラッ
チ回路、２８は確率推定部１が状態番号／優勢シンボル
記憶部４の内容を読み書きするタイミングを示すリード
／ライト信号、２７は確率推定部１が次のコンテクスト
を参照シンボル選択部５に要求する次コンテクスト要求
信号である。

【０１２０】図９を用いて、参照シンボル選択部５とそ
の周辺の部分の動作を説明する。文字圧縮に使用する参
照シンボルとしては、符号化対象シンボルの直前の連続
するｍ（ｍ≧７）を用いることで、高い圧縮率が実現で
きることから、文字データ入力信号をシフトレジスタ２
５にシンボル単位に入力し、そのシフトレジスタ２５の
内容をラッチ回路２６によりラッチすることで、参照シ
フトレジスタ選択部５を構成できる。

【０１２１】このラッチ回路２６の出力は、コンテクス
トであり、その出力を状態番号／優勢シンボル記憶部４
の内容を選択するアドレス信号として用いる。確率推定
部１は、状態番号／優先シンボル記憶部４の内容を読み
書きするにあたって、リード／ライト信号２８をタイミ
ング信号として出力し、状態番号／優先シンボル記憶部
４の内容を読み書きする。確率推定部１は次のコンテク
ストが必要になった時点で、次コンテクスト要求信号２
７を出力し、シフトレジスタ２５をシフトさせると同時
に、ラッチ回路２６の内容を更新して、次のコンテクス
トを得る。なお、上記参照シンボル選択部５の構成は符
号化部及び復号化部の両者に適用でき、また、この実施
例は実施例１〜４にも適用できる。

【０１２２】以上のように、上述した実施例５（請求項
５）による構成をとることにより、確率推定部１が状態
番号／優先シンボル記憶部４の内容を読み書きする場合
に、コンテクトを受け取る必要がなく、またシフトレジ
スタ２５とラッチ回路２６という簡単な構成により、参
照シンボル選択部５を構成できることから、回路規模を
小さくし、高速な符号化を実現することができるという
効果を有する。

【０１２３】

【発明の効果】以上のように、この発明の請求項１によ
れば、予め符号化対象の複数の文書あるいは復号化対象
の文書を代表する文書を用いて、コンテクスト毎のＭＰ
Ｓ値を求めて符号化部と復号化部に初期ＭＰＳ値として
設定するとともに、各コンテクストにおけるＬＰＳの出
現確率に応じて、各コンテクストの初期状態番号を指定
することにより、確率推定部が各コンテクストにおける
ＬＰＳやＭＰＳの出現確率に応じて最適な確率領域幅を
選択するまでに要する学習ステップを削減し、かつ既知
の適用型２値算術符号化器の構成については変更を加え
ることなく、文字文書の圧縮率および符号化効率の向上
を実現することができるという効果を有する。

【０１２４】また、請求項２によれば、符号化を行う文
書毎に、第１パスで全コンテクストのＭＰＳ値をまず求
めて、そのＭＰＳ値を符号化部と復号化部共通の初期Ｍ
ＰＳ値とし、同時に初期ＭＰＳ値が与えられたことを条
件として最も圧縮率が向上する全コンテクストに共通な
初期状態番号を符号化部と復号化部で予め取り決めてお
くことで、文字文書の圧縮効率を向上させるとともに、
ＭＰＳ初期値を符号化部から復号化部に送るに当たって
は、ＭＰＳ値の情報（ＭＰＳテーブル情報）を文字列と
みなして２値算術符号化方式を用いて圧縮して送ること
で符号化効率を高めることができる。

【０１２５】また、請求項３によれば、符号化を行う文
書毎に、第１パスで各コンテクストにおけるシンボルの
出現数をカウントし、上記請求項２と同様に、各コンテ
クストのＭＰＳ値を求めるとともに、ＬＰＳが出現しな
いコンテクストを求めて、そのコンテクストについて
は、ＬＰＳに割り当てられる確率領域幅が最小になる状
態番号を初期状態番号とすることを符号化部と復号化部
とで予め取り決めておき、全コンテクストへの初期ＭＰ
Ｓ値の設定と、ＬＰＳが出現しないコンテクストについ
ては「ＬＰＳに対して割り当てられる確率領域幅が最小
になる状態番号」の設定を行った後、符号化および復号
化の動作を行うことで、文字圧縮率を向上させることが
できる。

【０１２６】また、全コンテクストのＭＰＳ値と、ＬＰ
Ｓが出現しないコンテクストを符号化部から復号化部に
通知するにあたっては、これらの情報を２値算術符号化
部にて圧縮し、復号化部では、全コンテクストのＭＰＳ
値と、ＬＰＳが出現しないコンテクストをまず復号し
て、初期ＭＰＳ値と初期状態番号を設定した後、文字の
復号を行うことにより、符号化効率の向上を実現するこ
とができる。

【０１２７】また、請求項４によれば、符号化部では、
文字用の参照シンボル選択部の出力であるコンテクスト
と、画像用参照シンボル選択部の出力であるコンテクス
トのいずれかを確率推定部に伝えるよう選択し、また、
予測変換処理部への入力シンボル列が文字データか画像
データかを選択することにより、復号化部では、逆予測
変換処理部の出力である復号シンボルを、「文字データ
として出力し、かつ、文字用の参照テーブル選択部に伝
える」か、「画像データとして出力し、かつ、画像用の
参照テーブル選択部に伝える」かを選択するとともに、
確率推定部へのコンテクスト入力を、文字用の参照シン
ボル選択部からのコンテクストか画像用の画像参照シン
ボル選択部からのコンテクストかを選択することによ
り、構成の変更を要することなく、符号化効率の高い画
像／文字両用の符号化装置を実現できる。

【０１２８】さらに、請求項５によれば、確率推定部が
状態番号／優先シンボル記憶部の内容を読み書きする場
合に、コンテクストを受け取る必要がなく、また、シフ
トレジスタとラッチ回路という簡単な構成により、参照
シンボル選択部を構成できることから、回路規模を小さ
くし、高速な符号化を実現することができるという効果
を有する。

【図面の簡単な説明】

【図１】この発明の請求項１に係る２値算術符号化を用
いた文字符号化部の構成図である。

【図２】この発明の請求項１に係る２値算術符号化を用
いた文字復号化部の構成図である。

【図３】この発明の請求項２に係る２値算術符号化を用
いた文字符号化部の構成図である。

【図４】この発明の請求項２に係る２値算術符号化を用
いた文字復号化部の構成図である。

【図５】この発明の請求項３に係る２値算術符号化を用
いた文字符号化部の構成図である。

【図６】この発明の請求項３に係る２値算術符号化を用
いた文字復号化部の構成図である。

【図７】この発明の請求項４に係る２値算術符号化を用
いた文字符号化部の構成図である。

【図８】この発明の請求項４に係る２値算術符号化を用
いた文字復号化部の構成図である。

【図９】この発明の請求項５に係る参照シンボル選択部
の構成図である。

【図１０】確率推定テーブルの説明図である。

【図１１】従来の２値算術符号化方式を用いた画像符号
化装置の構成図である。

【図１２】従来の２値算術復号化方式を用いた画像復号
化装置の構成図である。

【図１３】従来の２値算術符号／復号化装置のテンプレ
ート説明図である。

【図１４】２値算術符号／復号化装置の条件付き交換処
理および正規化処理の処理内容説明図である。

【図１５】２値算術符号／復号化装置の確率領域減算処
理の説明図である。

【図１６】２値算術符号／復号化装置のＭＰＳおよびＬ
ＰＳの発生による状態の遷移モデル説明図である。

【図１７】２値算術符号／復号化装置の状態番号／ＭＰ
Ｓ初期値記憶部の内部論理構成図である。

【図１８】２値算術符号化装置のＣレジスタ／Ａレジス
タの内部構成図である。

【図１９】２値算術復号化装置のＣレジスタ／Ａレジス
タの内部構成図である。

【図２０】２値算術符号化／復号化装置のＭＰＳが連続
して発生した場合におけるＬＰＳ領域幅が大きい場合の
減算処理及び正規化処理の説明図である。

【図２１】２値算術符号化／復号化装置のＭＰＳが連続
して発生した場合におけるＬＰＳ領域幅が小さい場合の
減算処理及び正規化処理の説明図である。

【図２２】２値算術符号化／復号化装置のＬＰＳが連続
して発生した場合におけるＬＰＳ領域幅が大きい場合の
減算処理及び正規化処理の説明図である。

【図２３】２値算術符号化／復号化装置のＬＰＳが連続
して発生した場合におけるＬＰＳ領域幅が小さい場合の
減算処理及び正規化処理の説明図である。

【図２４】従来の２値算術符号化装置の処理手順を示す
フローチャートである。

【図２５】従来の２値算術符号化装置の初期化処理手順
を示すフローチャートである。

【図２６】従来の２値算術符号化装置の符号化対象シン
ボルによる処理分岐手順を示すフローチャートである。

【図２７】従来の２値算術符号化装置の符号化対象シン
ボルがＬＰＳであった場合の符号化処理手順を示すフロ
ーチャートである。

【図２８】従来の２値算術符号化装置の符号化対象シン
ボルがＭＰＳであった場合の符号化処理手順を示すフロ
ーチャートである。

【図２９】従来の２値算術符号化装置の正規化処理手順
を示すフローチャートである。

【図３０】従来の２値算術復号化装置の処理手順を示す
フローチャートである。

【図３１】従来の２値算術復号化装置の初期化処理手順
を示すフローチャートである。

【図３２】従来の２値算術復号化装置の復号化対象シン
ボルによる処理分岐手順を示すフローチャートである。

【図３３】従来の２値算術復号化装置の復号化対象シン
ボルがＬＰＳであった場合の復号化処理手順を示すフロ
ーチャートである。

【図３４】従来の２値算術復号化装置の復号化対象シン
ボルがＭＰＳであった場合の復号化処理手順を示すフロ
ーチャートである。

【図３５】従来の２値算術復号化装置の正規化処理手順
を示すフローチャートである。

【符号の説明】

１確率推定部２２値算術符号化部３確率推定テーブル４状態番号／優勢シンボル記憶部５参照シンボル選択部６予測変換処理部７状態番号／ＭＰＳ初期値記憶部８文字コード２値化部９逆予測変換処理部１０２値文字コード変換部１１ＭＰＳ／ＬＰＳ検出部１２初期ＭＰＳ値蓄積部１３初期化情報蓄積部１４２値算術復号化部２０文字符号化部２１文字復号化部２２符号化部２３復号化部２４画像／文字データ選択信号２５シフトレジスタ２６ラッチ回路２７次コンテクスト要求信号２８リード／ライト信号４０画像参照シンボル選択部４１２値シンボル列読み取り部４２２値シンボル列記憶部

───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.⁶，ＤＢ名) H03M 7/40

Claims

(57)【特許請求の範囲】

【請求項１】文字コードを２値のシンボル列とみなし
て２値のシンボル列から符号化対象シンボルの直前の連
続する所定個以上の参照シンボルを選択する参照シンボ
ル選択部と、参照シンボル選択部により選択された参照
シンボルの個々の値の組み合わせによって生ずるコンテ
クスト毎に符号化対象シンボルが各コンテクストにおい
て出現確率が高いと予想されるシンボルと一致すれば優
勢シンボル（以下、優勢シンボルをＭＰＳという）であ
ることを、出現確率が高いと予想されるシンボルと一致
しなければ劣勢シンボル（以下、劣勢シンボルをＬＰＳ
という）であることを示すデータをそれぞれ出力する予
測変換処理部と、コンテクストの状態を示す状態番号と
ＬＰＳあるいはＭＰＳに割り当てる確率領域幅を対応づ
けるとともに、状態の遷移が必要となった場合の状態遷
移先番号を記憶する確率推定テーブルと、各コンテクス
ト毎に状態番号によって識別し、符号化対象シンボルに
対する上記予測変換処理部の出力とそのコンテクストと
を入力とし、上記確率推定テーブルを参照してコンテク
スト毎の状態遷移を行いながら、ＬＰＳあるいはＭＰＳ
に対する確率領域幅を推定し出力する確率推定部と、各
コンテクストの状態番号とＭＰＳ値を記憶する状態番号
／優勢シンボル記憶部と、上記確率推定部の出力である
ＬＰＳあるいはＭＰＳに対する確率領域幅を用いて符号
化対象シンボルを演算により符号化する２値算術符号化
部とを有する文字符号化部を備えると共に、上記文字符
号化部の２値出力符号を逐次復号し、復号対象シンボル
がＭＰＳであるかＬＰＳであるかをコード出力する２値
算術復号化部と、２値算術復号化部の出力コードを符号
化前の２値シンボル列に変換する逆予測変換処理部と、
逆予測変換処理部の２値出力シンボル列から上記符号器
側と同じ参照シンボルを選択する参照シンボル選択部
と、参照シンボル選択部により選択された参照シンボル
の個々の値の組み合わせによって生ずるコンテクストと
２値算術復号化部の出力コードを入力とし、各コンテク
スト毎に状態番号によって識別し、上記文字符号化部と
同じ確率推定テーブルを参照することによって、状態遷
移を行いながら、各コンテクストの各状態についてＬＰ
ＳあるいはＭＰＳに割り当てられる確率領域幅を推定し
出力する確率推定部と、確率推定部の状態番号とＭＰＳ
値を記憶する状態番号／優勢シンボル記憶部とを有し、
逆予測変換処理部の２値シンボル列を出力とする文字復
号化部とを備える符号化装置において、符号化を行おう
とする複数の文書について参照シンボル選択部が選択す
るのと同じ参照シンボルを用いて各コンテクストにおけ
るＬＰＳの出現確率ｐ_1ps を予め算出し、この時のＬＰ
Ｓの出現確率をｐ_1ps とした場合、予め定めた正の整数
ｎについて１／２^k+2 ≦ ｐ_1ps ＜１／２^k+1 を満たす整数ｋ（ｎ＞ｋ≧０）を各コンテクスト毎に求
め、ｐ_1ps＜１／２ⁿ⁺²の場合にはｋ＝ｎと選択し、ＭＰ
Ｓしか発生しないコンテクストであるＰ_1pS ＝０の場合
についてはＬＰＳに対して割り当てられる確率領域幅が
最小になる状態番号をｋに設定することによってコンテ
クストを分類すると共に、各コンテクストにおけるＭＰ
Ｓ値を予め計測して、上記整数ｋによって分類され、そ
れに対応づけられた初期状態番号を各コンテクストの状
態番号に設定すると共に、上記計測したＭＰＳ値を優勢
シンボルの初期ＭＰＳ値として記憶してなる状態番号／
ＭＰＳ初期値記憶部を上記文字符号化部及び文字復号化
部に備え、符号および復号の開始時に、状態番号／ＭＰ
Ｓ初期値記憶部の内容を文字符号化部および文字復号化
部の状態番号／優勢シンボル記憶部に設定した後、符号
化および復号化動作をそれぞれ開始することを特徴とし
た符号化装置。
【請求項２】文字コードを２値のシンボル列とみなし
て２値のシンボル列から符号化対象シンボルの直前の連
続する所定個以上の参照シンボルを選択する参照シンボ
ル選択部と、参照シンボル選択部により選択された参照
シンボルの個々の値の組み合わせによって生ずるコンテ
クスト毎に符号化対象シンボルが各コンテクストにおい
て出現確率が高いと予想されるシンボルと一致すれば優
勢シンボル（以下、優勢シンボルをＭＰＳという）であ
ることを、出現確率が高いと予想されるシンボルと一致
しなければ劣勢シンボル（以下、劣勢シンボルをＬＰＳ
という）であることを示すデータをそれぞれ出力する予
測変換処理部と、コンテクストの状態を示す状態番号と
ＬＰＳあるいはＭＰＳに割り当てる確率領域幅を対応づ
けるとともに、状態の遷移が必要となった場合の状態遷
移先番号を記憶する確率推定テーブルと、各コンテクス
ト毎に状態番号によって識別し、符号化対象シンボルに
対する上記予測変換処理部の出力とそのコンテクストと
を入力とし、上記確率推定テーブルを参照してコンテク
スト毎の状態遷移を行いながら、ＬＰＳあるいはＭＰＳ
に対する確率領域幅を推定し出力する確率推定部と、各
コンテクストの状態番号とＭＰＳ値を記憶する状態番号
／優勢シンボル記憶部と、上記確率推定部の出力である
ＬＰＳあるいはＭＰＳに対する確率領域幅を用いて符号
化対象シンボルを演算により符号化する２値算術符号化
部とを有する文字符号化部を備えると共に、上記文字符
号化部の２値出力符号を逐次復号し、復号対象シンボル
がＭＰＳであるかＬＰＳであるかをコード出力する２値
算術復号化部と、２値算術復号化部の出力コードを符号
化前の２値シンボル列に変換する逆予測変換処理部と、
逆予測変換処理部の２値出力シンボル列から上記符号器
側と同じ参照シンボルを選択する参照シンボル選択部
と、参照シンボル選択部により選択された参照シンボル
の個々の値の組み合わせによって生ずるコンテクストと
２値算術復号化部の出力コードを入力とし、各コンテク
スト毎に状態番号によって識別し、上記文字符号化部と
同じ確率推定テーブルを参照することによって、状態遷
移を行いながら、各コンテクストの各状態についてＬＰ
ＳあるいはＭＰＳに割り当てられる確率領域幅を推定し
出力する確率推定部と、確率推定部の状態番号とＭＰＳ
値を記憶する状態番号／優勢シンボル記憶部とを有し、
逆予測変換処理部の２値シンボル列を出力とする文字復
号化部とを備える符号化装置において、上記文字符号化
部に、符号化対象の文書毎に各コンテクストにおける２
値シンボルの出現数をカウントしてＭＰＳ値を求めるＭ
ＰＳ／ＬＰＳ検出部を備え、符号化時に上記状態番号／
優勢シンボル記憶部にｍビットの参照シンボルから構成
されるコンテクスト全てに関する２^m 個のＭＰＳをテー
ブルとしたＭＰＳテーブル情報を生成し、このＭＰＳテ
ーブル情報をシンボル列と見なして初期値として全ての
コンテクストにおいて状態番号を“０”、ＭＰＳ値も
“０”と設定して符号化を開始し、続く符号化する文字
情報については、２ ^m 個のコンテクストについてＭＰＳ
テーブル情報値を状態番号／優勢シンボル記憶部のＭＰ
Ｓ値に設定し、かつ予め復号化部と取り決めた初期状態
番号を全コンテクストに（同じ番号を）設定した後、符
号化すると共に、上記文字復号化部に、２値算術符号化
されて送られてきた文字文書伸長用の全コンテクストに
ついての初期ＭＰＳ値の復号した値を蓄積する初期ＭＰ
Ｓ値蓄積部を備え、復号化時に、状態番号／優勢シンボ
ル記憶部の初期値として、全てのコンテクストにおいて
状態番号を“０”、優勢シンボルも“０”と設定して復
号化を開始し、ＭＰＳテーブル情報の復号データを初期
ＭＰＳ値蓄積部に一時蓄積し、ＭＰＳテーブル情報の復
号が終了した時点で、復号されたＭＰＳテーブル情報を
状態番号／優勢シンボル記憶部のＭＰＳ値に設定した
後、上記予め符号化部と取り決めた初期状態番号を全コ
ンテクストについて設定して文字情報の復号を開始する
ことを特徴とする符号化装置。
【請求項３】文字コードを２値のシンボル列とみなし
て２値のシンボル列から符号化対象シンボルの直前の連
続する所定個以上の参照シンボルを選択する参照シンボ
ル選択部と、参照シンボル選択部により選択された参照
シンボルの個々の値の組み合わせによって生ずるコンテ
クスト毎に符号化対象シンボルが各コンテクストにおい
て出現確率が高いと予想されるシンボルと一致すれば優
勢シンボル（以下、優勢シンボルをＭＰＳという）であ
ることを、出現確率が高いと予想されるシンボルと一致
しなければ劣勢シンボル（以下、劣勢シンボルをＬＰＳ
という）であることを示すデータをそれぞれ出力する予
測変換処理部と、コンテクストの状態を示す状態番号と
ＬＰＳあるいはＭＰＳに割り当てる確率領域幅を対応づ
けるとともに、状態の遷移が必要となった場合の状態遷
移先番号を記憶する確率推定テーブルと、各コンテクス
ト毎に状態番号によって識別し、符号化対象シンボルに
対する上記予測変換処理部の出力とそのコンテクストと
を入力とし、上記確率推定テーブルを参照してコンテク
スト毎の状態遷移を行いながら、ＬＰＳあるいはＭＰＳ
に対する確率領域幅を推定し出力する確率推定部と、各
コンテクストの状態番号とＭＰＳ値を記憶する状態番号
／優勢シンボル記憶部と、上記確率推定部の出力である
ＬＰＳあるいはＭＰＳに対する確率領域幅を用いて符号
化対象シンボルを演算により符号化する２値算術符号化
部とを有する文字符号化部を備えると共に、上記文字符
号化部の２値出力符号を逐次復号し、復号対象シンボル
がＭＰＳであるかＬＰＳであるかをコード出力する２値
算術復号化部と、２値算術復号化部の出力コードを符号
化前の２値シンボル列に変換する逆予測変換処理部と、
逆予測変換処理部の２値出力シンボル列から上記符号器
側と同じ参照シンボルを選択する参照シンボル選択部
と、参照シンボル選択部により選択された参照シンボル
の個々の値の組み合わせによって生ずるコンテクストと
２値算術復号化部の出力コードを入力とし、各コンテク
スト毎に状態番号によって識別し、上記文字符号化部と
同じ確率推定テーブルを参照することによって、状態遷
移を行いながら、各コンテクストの各状態についてＬＰ
ＳあるいはＭＰＳに割り当てられる確率領域幅を推定し
出力する確率推定部と、確率推定部の状態番号とＭＰＳ
値を記憶する状態番号／優勢シンボル記憶部とを有し、
逆予測変換処理部の２値シンボル列を出力とする文字復
号化部とを備える符号化装置において、上記文字符号化
部に、符号化対象の文書毎に各コンテクストにおける２
値シンボルの出現数をカウントしてＭＰＳ値を求めるＭ
ＰＳ／ＬＰＳ検出部を備え、符号化時に、このＭＰＳ／
ＬＰＳ検出部を用いて各コンテクストのＭＰＳ値を示す
１ビットと「ＭＰＳのみが発生し、ＬＰＳが発生しな
い」コンテクストであることを示す１ビットの計２ビッ
トをコンテクスト情報として求め、ｍシンボルの参照シ
ンボルを用いる場合には全部で２^m+1 ビットのコンテク
スト情報を文字情報と見なして状態番号／優勢シンボル
記憶部の初期値として全てのコンテクストにおいて状態
番号を“０”、優勢シンボルも“０”と設定して符号化
を開始し、続く文字情報については、ＭＰＳ値を状態番
号／優勢シンボル記憶部に設定し、かつ、「ＭＰＳのみ
が発生し、ＬＰＳが発生しない」コンテクストについて
は、状態番号／優勢シンボル記憶部の状態番号を「ＬＰ
Ｓに割り当てる確率領域を最小にする状態番号」に設定
した後、文字符号化を行うと共に、上記文字復号化部
に、復号した上記２^m+1 ビットのコンテクスト情報を蓄
積する初期化情報蓄積部を備え、状態番号／優勢シンボ
ル記憶部の初期値として、全てのコンテクストにおいて
状態番号を“０”、優勢シンボルも“０”と設定して復
号化を開始し、復号した２^m+1 ビットのコンテクスト情
報を上記初期化情報蓄積部に蓄積し、コンテクスト情報
の復号が終了した時点で、復号された各コンテクストに
おけるＭＰＳ値を状態番号／優勢シンボル記憶部の優勢
シンボル値に設定し、かつ、「ＭＰＳのみが発生し、Ｌ
ＰＳが発生しない」コンテクストであることがわかった
コンテクストについては状態番号／優勢シンボル記憶部
の状態番号を「ＬＰＳに割り当てる確率領域を最小にす
る状態番号」に設定した後、文字情報の復号を行うこと
を特徴とする符号化装置。
【請求項４】文字コードを２値のシンボル列とみなし
て２値のシンボル列から符号化対象シンボルの直前の連
続する所定個以上の参照シンボルを選択する参照シンボ
ル選択部と、参照シンボル選択部により選択された参照
シンボルの個々の値の組み合わせによって生ずるコンテ
クスト毎に符号化対象シンボルが各コンテクストにおい
て出現確率が高いと予想されるシンボルと一致すれば優
勢シンボル（以下、優勢シンボルをＭＰＳという）であ
ることを、出現確率が高いと予想されるシンボルと一致
しなければ劣勢シンボル（以下、劣勢シンボルをＬＰＳ
という）であることを示すデータをそれぞれ出力する予
測変換処理部と、コンテクストの状態を示す状態番号と
ＬＰＳあるいはＭＰＳに割り当てる確率領域幅を対応づ
けるとともに、状態の遷移が必要となった場合の状態遷
移先番号を記憶する確率推定テーブルと、各コンテクス
ト毎に状態番号によって識別し、符号化対象シンボルに
対する上記予測変換処理部の出力とそのコンテクストと
を入力とし、上記確率推定テーブルを参照してコンテク
スト毎の状態遷移を行いながら、ＬＰＳあるいはＭＰＳ
に対する確率領域幅を推定し出力する確率推定部と、各
コンテクストの状態番号とＭＰＳ値を記憶する状態番号
／優勢シンボル記憶部と、上記確率推定部の出力である
ＬＰＳあるいはＭＰＳに対する確率領域幅を用いて符号
化対象シンボルを演算により符号化する２値算術符号化
部とを有する文字符号化部を備えると共に、上記文字符
号化部の２値出力符号を逐次復号し、復号対象シンボル
がＭＰＳであるかＬＰＳであるかをコード出力する２値
算術復号化部と、２値算術復号化部の出力コードを符号
化前の２値シンボル列に変換する逆予測変換処理部と、
逆予測変換処理部の２値出力シンボル列から上記符号器
側と同じ参照シンボルを選択する参照シンボル選択部
と、参照シンボル選択部により選択された参照シンボル
の個々の値の組み合わせによって生ずるコンテクストと
２値算術復号化部の出力コードを入力とし、各コンテク
スト毎に状態番号によって識別し、上記文字符号化部と
同じ確率推定テーブルを参照することによって、状態遷
移を行いながら、各コンテクストの各状態についてＬＰ
ＳあるいはＭＰＳに割り当てられる確率領域幅を推定し
出力する確率推定部と、確率推定部の状態番号とＭＰＳ
値を記憶する状態番号／優勢シンボル記憶部とを有し、
逆予測変換処理部の２値シンボル列を出力とする文字復
号化部とを備える符号化装置において、上記文字符号化
部に画像データ選択信号の入力に基づいて画像の２値シ
ンボル列から符号化対象シンボルの発生確率を推定する
ための参照シンボルを取り出す画像参照シンボル選択部
を備えると共に、上記文字復号化部に、画像データ選択
信号の入力に基づいて逆予測変換処理部の出力から復号
対象シンボルのＭＰＳ／ＬＰＳの確率推定を行うための
参照ビットを取り出す画像参照シンボル選択部を備えた
ことを特徴とする符号化装置。
【請求項５】文字コードを２値のシンボル列とみなし
て２値のシンボル列から符号化対象シンボルの直前の連
続する所定個以上の参照シンボルを選択する参照シンボ
ル選択部と、参照シンボル選択部により選択された参照
シンボルの個々の値の組み合わせによって生ずるコンテ
クスト毎に符号化対象シンボルが各コンテクストにおい
て出現確率が高いと予想されるシンボルと一致すれば優
勢シンボル（以下、優勢シンボルをＭＰＳという）であ
ることを、出現確率が高いと予想されるシンボルと一致
しなければ劣勢シンボル（以下、劣勢シンボルをＬＰＳ
という）であることを示すデータをそれぞれ出力する予
測変換処理部と、コンテクストの状態を示す状態番号と
ＬＰＳあるいはＭＰＳに割り当てる確率領域幅を対応づ
けるとともに、状態の遷移が必要となった場合の状態遷
移先番号を記憶する確率推定テーブルと、各コンテクス
ト毎に状態番号によって識別し、符号化対象シンボルに
対する上記予測変換処理部の出力とそのコンテクストと
を入力とし、上記確率推定テーブルを参照してコンテク
スト毎の状態遷移を行いながら、ＬＰＳあるいはＭＰＳ
に対する確率領域幅を推定し出力する確率推定部と、各
コンテクストの状態番号とＭＰＳ値を記憶する状態番号
／優勢シンボル記憶部と、上記確率推定部の出力である
ＬＰＳあるいはＭＰＳに対する確率領域幅を用いて符号
化対象シンボルを演算により符号化する２値算術符号化
部とを有する文字符号化部を備えると共に、上記文字符
号化部の２値出力符号を逐次復号し、復号対象シンボル
がＭＰＳであるかＬＰＳであるかをコード出力する２値
算術復号化部と、２値算術復号化部の出力コードを符号
化前の２値シンボル列に変換する逆予測変換処理部と、
逆予測変換処理部の２値出力シンボル列から上記符号器
側と同じ参照シンボルを選択する参照シンボル選択部
と、参照シンボル選択部により選択された参照シンボル
の個々の値の組み合わせによって生ずるコンテクストと
２値算術復号化部の出力コードを入力とし、各コンテク
スト毎に状態番号によって識別し、上記文字符号化部と
同じ確率推定テーブルを参照することによって、状態遷
移を行いながら、各コンテクストの各状態についてＬＰ
ＳあるいはＭＰＳに割り当てられる確率領域幅を推定し
出力する確率推定部と、確率推定部の状態番号とＭＰＳ
値を記憶する状態番号／優勢シンボル記憶部とを有し、
逆予測変換処理部の２値シンボル列を出力とする文字復
号化部とを備える符号化装置において、上記文字符号化
部の上記参照シンボル選択部を、符号化対象ビットの直
前の連続するｍビットを参照ビットとして取り出すシフ
トレジスタと、このシフトレジスタの内容をアドレス信
号として上記状態番号／優勢シンボル記憶部内のコンテ
クストに対応した領域を選択するためのラッチ回路とで
構成し、かつ上記アドレス線により指定された状態番号
／優勢シンボル記憶部内の特定アドレス内容を確率推定
部から読み書きするためのリード／ライト信号線と、確
率推定部からシフトレジスタ部へデータのシフトタイミ
ングを知らせる次コンテクスト要求信号線とを備えると
共に、上記文字復号化部の上記参照シンボル選択部を、
復号対象シンボル直前の連続するｍビットを参照シンボ
ルとして取り出すシフトレジスタと、このシフトレジス
タの内容をアドレス信号として出力するためのラッチ回
路とで構成し、かつ上記アドレス線により指定された状
態番号／優勢シンボル記憶部内の特定アドレス内容を確
率推定部から読み書きするためのリード／ライト信号線
と、確率推定部からシフトレジスタ部へデータのシフト
タイミングを知らせる次コンテクスト要求信号線とを備
えたことを特徴とする符号化装置。