JP2891818B2 - 符号化装置 - Google Patents

符号化装置

Info

Publication number
JP2891818B2
JP2891818B2 JP10311692A JP10311692A JP2891818B2 JP 2891818 B2 JP2891818 B2 JP 2891818B2 JP 10311692 A JP10311692 A JP 10311692A JP 10311692 A JP10311692 A JP 10311692A JP 2891818 B2 JP2891818 B2 JP 2891818B2
Authority
JP
Japan
Prior art keywords
symbol
unit
mps
context
probability
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP10311692A
Other languages
English (en)
Other versions
JPH05298063A (ja
Inventor
茂徳 木野
和彦 丸山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP10311692A priority Critical patent/JP2891818B2/ja
Publication of JPH05298063A publication Critical patent/JPH05298063A/ja
Application granted granted Critical
Publication of JP2891818B2 publication Critical patent/JP2891818B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、適応型2値算術符号
化方式を用いて文字圧縮・伸長を行う符号化装置に関す
るものである。
【0002】
【従来の技術】従来の2値算術符号化方式としては、例
えばISO/IEC Committee Draft 11544 に記述さ
れている2値算術符号化方式(Arithmetic Coding :以
後QM-Coderと呼ぶ)がある。図11は上記先行技術と同
様な2値算術符号化装置を用いた画像符号化装置の例を
示す構成図である。
【0003】図11において、41は入力画像データを
2値シンボル列として入力する2値シンボル列読み取り
部、42は上記2値シンボル列読み取り部41にて読み
取った2値シンボル列を記憶する2値シンボル列記憶
部、40は上記2値シンボル列記憶部42に記憶されて
いる2値シンボル列より上記QM−Coderにて規定
された圧縮を行うために、必要な情報として、圧縮しよ
うとする符号化対象シンボルに最も相関の深い2値シン
ボル列の一部である図13に示される10ビットで示さ
れるシンボルパターン(以後テンプレートと記述する)
を2値シンボル列から選択する画像参照シンボル選択部
である。
【0004】また、6は上記画像参照シンボル選択部4
0にて取り出された10ビットの参照シンボルの内容が
示す値(以後コンテクストあるいはCXと記述する)を
用いて、上記符号化対象シンボルが“1”であるか
“0”であるかを、図17に示す構造を持つ状態番号/
優勢シンボル記憶部4に記憶されているコンテクストの
もとで、符号化対象シンボルとしてより高い確率で出現
するシンボル値[以後、より高い確率で出現するシンボ
ルをMore Probable Symbol:(優勢シンボル/MP
S)、より低い確率で出現するシンボルをLess Probabl
e Symbol:(劣勢シンボル/LPS)と記述する]と比
較し、比較の結果をMPSと等しいか異なるかの情報と
して出力する予測変換処理部である。
【0005】また、1は予測変換処理部6にて出力され
た符号化対象シンボルがMPSであるかLPSであるか
の情報(以後、MPS/LPS情報と記す)及び状態番
号/優勢シンボル記憶部4に記憶されたLPSの出現確
率領域幅の値を2値算術符号化部2に出力する確率推定
部、2は確率推定部1にて出力されたMPS/LPSの
情報及びLPSの出現確率領域幅の値を元に符号化対象
シンボルに対して2値算術符号化処理を行う2値算術符
号化部、3はコンテクストに対応した予め定められたL
PSの確率領域の大きさおよびコンテクストに対応した
予め定められた遷移情報を記憶した確率推定テーブルで
ある。
【0006】上記装置における2値算術符号化の処理手
順を図24ないし図29に示す。まず、2値算術符号化
器全体の初期化を行う。図25に符号化器の初期化手順
を示す。初期化処理では、まず、状態番号/優勢シンボ
ル記憶部4に記憶されている状態(この状態番号を用い
て、MPS/LPSシンボルの出現確率を参照する。以
後この状態をSTと記述する)およびMPSの値をすべ
てのコンテクストに対してゼロにセットする。
【0007】続いて、図18におけるAレジスタによっ
て示される確率領域のMPS領域の幅を10000He
xにセットし、図18におけるCレジスタによって示さ
れる確率領域のMPS領域の幅Aの下界値を0にセット
し、符号出力のためのシフトの数をカウントするカウン
タ(以後CTと示す)を11にセットする。
【0008】次に、画像参照シンボル選択部40におい
て、符号化する符号化対象シンボル及び符号化するため
のコンテクストを図13に示すテンプレートに従い2値
シンボル列記憶部に記憶された2値シンボル列よりロー
ドしてくる。
【0009】次に、2値算術符号化を行う。はじめに、
確率推定部1において、図26に示す手順に従い符号化
対象シンボルの値とコンテクストCXに対応した状態番
号/優勢シンボル記憶部4に記憶されたMPSの値(以
後MPS(CX)と示す)とを比較する。符号化対象シ
ンボルの値とMPS(CX)が等しければ符号化対象シ
ンボルはMPSであるので、図28に示すMPSの場合
の2値算術符号化処理手順へ処理を継続し、等しくなけ
れば符号化対象シンボルはLPSであるので、図27に
示すLPSの場合の2値算術符号化処理手順へ処理を継
続する。
【0010】次に、2値算術符号化部2における符号化
対象シンボルがMPSであった場合の2値算術符号化処
理手順を図28に示す。まず、コンテクストCXの現在
の状態をST(CX)と表現し、さらに、その状態ST
(CX)においてLPSに対して割り当てられる領域幅
をLP(ST(CX))と表現すると、Aレジスタの
内容をA=A−LPZ(ST(CX))式で表される処
理を行う(図15参照)。すなわち、LPZ(ST(C
X))は、現在当該コンテクストが図16に示す状態遷
移図の中のどの状態にあり、その状態において図17に
示す確率推定テーブル3が定めるLPSに割り当てられ
る確率領域幅LPSがどんな値であるのかを示してい
る。
【0011】また、図15に示す現在までに符号化した
シンボル列の出現確率に対応した確率領域幅Aを、次の
符号化対象シンボルに対して期待されるLPSとMPS
の出現推定確率で分割し、画像の符号化対象シンボル
(画素)PIXがMPSであれば、図15における確率
領域のMPSの領域が符号化対象シンボルに割り当てら
れる。
【0012】したがって、図15において、符号化対象
シンボルの出現する確率領域の大きさを示す値はA′レ
ジスタの値であるため、A−LSZを求めることによっ
て符号化対象シンボルとしてMPSが出現する場合に割
り当てられる確率領域幅を求めることができる。次に、
求めたAレジスタの値を図14におけるHalfで示さ
れる8000Hexと比較し、8000Hex以上であ
れば処理を終了し、8000Hex未満であれば正規化
処理を行う。
【0013】正規化処理を行うに当たって、前処理とし
て図28に示す処理、すなわち上記の符号化対象シンボ
ルとしてMPSが出現した場合に割り当てる確率領域の
幅を示すAレジスタの値と符号化対象シンボルとしてL
PSが出現した場合に割り当てる確率領域の幅LSZと
を比較し、Aレジスタの値がLSZの値より小さければ
符号化効率の向上を目的として、MPSとLPSに割り
当てられる確率領域の意味を入れ換える処理(条件付き
交換処理)を行う。
【0014】次に、ST(CX)で示される値すなわち
コンテクストCXに対応した状態STの次の遷移状態
[NMPS(ST(CX)と表記する]を確率推定テ
ーブル3より求め、現在のST(CX)の値を更新する
処理を行うが、このとき、NMPSによって表される次
の状態における「LPSに対して割り当てる確率領域
幅」LSZは、現在の状態のLSZよりも必ず小さくな
るように確率推定テーブル3が設定されている。
【0015】なぜならば、たとえば符号化対象シンボル
MPSのみ発生した場合、図20に示すように、LPS
領域幅が大きい場合には丸1,丸2,丸3と3回符号化
対象シンボルを符号化した時点で1回正規化が起こり、
図20の場合では1ビットの符号が出力されている。一
方、図21に示すように、LPS領域幅が小さい場合に
は符号化対象シンボルを6ビット符号化した時点で1回
正規化が起こり、1ビットの符号が出力されている。
【0016】すなわち、前者の場合には圧縮率3分の1
であり、後者の場合には圧縮率が6分の1となり、連続
してMPSが発生する場合にはLPS領域幅のより小さ
い方が圧縮率が良くなる。つまり、MPSが生じた場合
はLSZの値が小さいほど同じ入力データ量に対して正
規化処理を行う回数が少なく、また、一回の正規化処理
によって出力される符号も少なくなるからである。
【0017】次に、図14および図29に示す正規化処
理手順について述べる。正規化処理では、8000He
xより小さくなったMPSの確率領域を8000Hex
より大きくする処理を行う。すなわち、現在までに符号
化されたシンボル列に対して割り当てられた確率領域の
幅を示すAレジスタおよび現在までに符号化されたシン
ボル列に対して割り当てられた確率領域を代表する座標
を示すCレジスタの値を各々のレジスタ中にて左(MS
B方向)へシフトすることにより、各領域と座標を2倍
ずつ拡大する処理を行う。
【0018】8000HexはAレジスタのとりうる数
直線上での最大領域幅の1/2の値であり、Aレジスタ
の値が1/2より小さくなった場合に、少なくとも現在
までに符号化されたシンボル列に対して割り当てられた
確率領域を代表する座標を示すCレジスタ中の最上位の
1ビットの値が直線上で確定したことを示している。
正規化処理における左シフト中にCレジスタの最上位ビ
ットから順に符号が出力される。符号の出力タイミング
は図29におけるカウンタCTによりカウントされてお
り、出力符号が8ビット蓄積されるCTがロになり、
符号はバイト単位で出力される。
【0019】次に、2値算術符号化部2における符号化
対象シンボルがLPSであった場合の2値算術符号化処
理手順を図27に示す。上記符号化対象シンボルがMP
Sであった場合の処理と異なる点は、確率推定テーブル
3に予め定められたスイッチビットと呼ばれるビットを
検査する処理があることと、LPSが生じた場合は必ず
正規化処理を行う必要があるということ、正規化処理に
ともなうST(CX)の値の更新が、MPSが生じた場
合にはLSZ(ST(CX))が小さくなる方向へ更新
されていくのに対し、LPSが生じた場合にはLSZ
(ST(CX))が大きくなる方向へ更新されることで
ある。
【0020】スイッチビットは、図16に示すST0の
状態にあるコンテクストが存在した時に、さらにLPS
が出現した場合に、状態番号/優勢シンボル記憶部4に
記憶されたMPSとLPSの値を入れ換える処理を行う
必要があり、このMPS/LPS入れ換えの必要性判定
のために用意されている。
【0021】MPSとLPSを入れ換える処理がなぜ必
要かとなれば、符号化器の初期化処理において、状態番
号/優勢シンボル記憶部4に記憶されたMPSの値は初
期値としてゼロにクリアされており、あるコンテクスト
に対するMPSの値として1がふさわしかった場合、ま
た、2値シンボル列において、ある部位ではMPSの値
として1がふさわしく、またある部位では0の値がふさ
わしいといったように、MPS値が変化する場合、MP
Sの値とLPSの値とを2値シンボル列の特性の変化に
適応して入れ替えることによって符号化効率を高めるた
めである。
【0022】次に、LPSが生じた場合には必ず正規化
処理を行うなぜ必要があるかとなれば、LPSの値すな
わちLSZ(ST(CX))の値は常に8000Hex
より小さい値に設定されており、LPSが出現した場合
にはAレジスタの値が必ず8000Hexよりも小さく
なるためである。
【0023】MPSにより正規化が行われた場合にはL
SZ(ST(CX))が小さくなる方向へ状態が更新さ
れていくのに対し、LPSにより正規化が行われた場合
にはLSZ(ST(CX))が大きくなる方向へ状態が
更新される理由については次のように言える。図22と
図23に示されるように、LPSに割り当てられる領域
幅が小さい場合には正規化処理におけるレジスタのシフ
ト処理すなわち1回の正規化処理において出力される符
号量(シフト動作の回数)が多く、LPSの領域幅に割
り当てられる領域幅が大きい場合には、LPSの出現に
よる正規化処理におけるレジスタのシフト動作の回数が
少なくなる。
【0024】あるコンテクストにおいてはLPSと判定
されていたシンボルが出現した場合には、いままでの推
定確率のままでLPS領域幅を割り当てていると、次に
LPSが出現した場合に符号化効率が低下することか
ら、さらにLPSが出現しても、多くの符号を出力しな
いように対応するために、LSZ(ST(CX))が大
きくなる方向へ状態遷移を行う。符号化対象のシンボル
列の特性に途中で変化が生じたような場合、例えば文字
を記述したファクシミリ画像の中に写真画像が含まれて
いたような場合には、LPSが頻繁に発生し、特性の変
化に追従するよう状態遷移を追う必要がある。こうし
て、LPSに割り当てる確率領域を、状態遷移により適
宜選択することにより、圧縮率を向上させている。
【0025】次に、図11に示す上記2値算術符号化装
置にて符号化された符号データを復号する2値算術復号
化装置の動作について述べる。図12に上記先行技術に
おける2値算術符号化装置によって符号化された2値シ
ンボル列を復号する2値算術復号化装置の構成図を示
す。
【0026】図12において、14は符号データを元に
復号対象シンボルがそのコンテクストにおいてMPSで
あったかLPSであったのかを出力する2値算術復号化
部であり、確率推定部1は上記2値算術復号化部2より
出力されたMPS/LPS情報を元に符号化器と同様の
状態遷移を実行し、符号化器の動作をシミュレートする
ことで、次に復号する対象シンボルに対して、符号化器
がMPS/LPSに対してどのくらいの確率領域を割り
当ているかを判定する。
【0027】また、確率推定テーブル3はコンテクスト
の各状態においてLPSに対してどのくらいの確率領域
を割り当てるのが最適であるのか、正規化が発生した場
合の状態遷移先としてはどこが適当かを統計的に求めて
作成された符号化器と同一のテーブルであり、状態番号
/優勢シンボル記憶部4は、上記符号化装置における状
態番号/優勢シンボル記憶部4と同様なフォーマットお
よびデータを持つ記憶装置である。
【0028】画像参照シンボル選択部40は逆予測変換
処理部9から出力される復号された2値シンボル列から
図13に示したテンプレートに従って参照シンボルを選
択する装置、逆予測変換処理部9は確率推定部1より出
力されたMPSの意味するシンボル値と2値算術復号化
部14より得られた復号対象シンボルがMPSかLPS
かという情報から符号化前の2値シンボル列を出力する
装置である。
【0029】図12に示す上記2値算術復号化装置にお
ける2値算術符号復号化の処理手順を図30ないし図3
5に示す。まず、2値算術復号化装置全体の初期化を行
う。図31に復号器の初期化手順を示す。初期化処理で
は、まず、状態番号/優勢シンボル記憶装置4に記憶さ
れている各コンテクストに対する遷移状態およびMPS
の値をすべてのコンテクストに対してゼロにセットす
る。
【0030】続いて、図19に示す確率領域のMPS領
域の下界値(QM−coderでは領域の下界値を確率
領域の代表座標としている)を示すCレジスタの値をゼ
ロにセットし、符号をバイト単位でCレジスタにセット
し、Cレジスタを左(MSB方向)へ8ビットシフトす
ることを3度繰り返してCレジスタの初期化を終了す
る。続いて、図19に示すMPSの確率領域を示すAレ
ジスタに10000Hex(最大確率領域幅)をセット
し、復号器の初期化処理を完了する。
【0031】次に、復号化するためのコンテクストを逆
予測変換処理部9より出力された出力2値シンボル列か
ら画像参照シンボル選択部40にて図13に示すテンプ
レートに従って参照シンボルを選択する。
【0032】次に、確率推定部1において2値算術復号
化処理を行うにあたっての処理手順を図32に示す。式
LSZ(ST(CX))で示される画像参照シンボル選
択部40より出力された各コンテクストに対応した状態
番号/優勢シンボル記憶部4に記憶された状態STに対
応したLPSに割り当てる確率領域の幅LSZを確率推
定テーブル3から読み出し、そのLPSに割り当てる確
率領域の幅LSZを2値算術復号化部14へ渡す。2値
算術復号化部14では、確率推定部1より渡されたLS
Zの値をAレジスタより減算する。
【0033】次に、上記減算処理後のAレジスタの値と
CレジスタのMSB側16ビットを示す図19に示すC
HIGHの内容を比較する。Aレジスタには、現在まで
に復号されたシンボルによって分割されてきた領域幅が
すでに復号されたシンボル分拡大されて、すなわちシフ
トされた回数分拡大された値が入っており、CHIGH
には、符号化するシンボル列に対して割り当てられた確
率領域を代表する座標情報(下界の座標)のうち、まだ
入力されない符号分を除いた座標の近似値(下界座標は
すべての符号が復号器に入力された段階で完結する)か
ら、すでに復号されたシンボルに割り当てられた領域の
下界座標を減算した値がAレジスタと同じ拡大を与えら
れて入っている。
【0034】そのAレジスタを、次に復号するシンボル
に対する推定領域幅で分割し、CHIGHレジスタがそ
の分割された領域の境界よりもMPS側に属している
か、LPS側に属しているかによって、すなわち、A−
LSZ(ST(CX))とCHIGHの大小比較によっ
て復号を行う。
【0035】復号化を行っている復号化対象シンボルが
MPSであった場合、Aレジスタの幅が8000Hex
以上であれば逆予測変換処理部9へ処理を継続し、80
00Hexより小さい場合にはMPSの条件付き交換処
理を行った後、正規化処理を行い、逆予測変換処理部9
へ処理を継続する。復号化を行っている復号化対象シン
ボルがLPSであった場合、符号化処理の場合と同様に
必ず正規化処理を行い、逆予測変換処理部9へ処理を継
続する。
【0036】上記復号化対象シンボルがLPSであった
場合のMPS/LPS領域の条件付き交換処理の処理手
順を図33に示す。また、上記復号化対象シンボルがM
PSであった場合のMPS/LPS領域の条件付き交換
処理の処理手順を図34に示す。
【0037】2値算術復号化装置における正規化処理手
順は、上記2値算術符号化処理時における正規化処理手
順とまったく同一である。すなわち、図14および図2
9に示す正規化処理手順と等しい。符号化/復号化処理
時に関わらず、正規化処理では、AレジスタおよびCレ
ジスタの値をレジスタ中にて左(MSB方向)へシフト
し、8000Hexより小さくなったAレジスタ内容を
8000Hexより大きくし、Cレジスタ中の符号が不
足したら次の符号をCレジスタに読み込み、復号を継続
する。
【0038】次に、逆予測変換処理部6の動作内容につ
いて説明する。画像参照シンボル選択部40の出力であ
るコンテクストを用いて、確率推定部1はコンテクスト
に対応したMPS値を状態番号/優勢シンボル記憶部4
から取り出して、逆予測変換処理部9に伝える。また、
2値算術復号化部14より出力された「復号シンボルが
MPSかLPSか」を示すMPS/LPS情報とこのM
PS値を比較することで、符号化する前のシンボルが出
力される。
【0039】
【発明が解決しようとする課題】上記のように従来の2
値算術符号化装置における初期化処理においては、状態
番号/優勢シンボル記憶部4に与える初期値として、す
べての状態を“0”、全てのMPS値も“0”と設定し
ていたため、各コンテクストにおける状態が、MPS/
LPSの出現確率に適した領域幅選択が行える状態にな
るまで、効率の悪い符号が出力されるという問題点があ
った。
【0040】また、入力シンボル数が画像ほど多くない
文字文書の符号化時には、各コンテクストがMPS/L
PSの出現確率に応じた領域幅選択を行える状態に至る
前に符号化が終了してしまい、このような場合には、参
照シンボル数を増やしても、符号化効率が上がらないと
いう欠点を有していた。
【0041】さらに、予測の的中率を上げる目的で、参
照シンボル数を増やしても、MPSだけが生じてLPS
が全く生じないコンテクストが増加し、このコンテクス
トに対する確率領域割り当てが状態0からスタートする
ため、LPSが出現しないにもかかわらず、符号化効率
が改善しないという問題も有していた。
【0042】この発明は、上述した従来例における問題
点を解消するためになされたもので、適応型2値算術符
号化方式を用いた文字符号化において、文字を2値のシ
ンボル列とみなして符号化を行っても、画像に比べて入
力シンボル数が少ないため、適応部の状態遷移が十分に
行われないことから学習効果が得られず、データ圧縮率
及び符号化効率が低下するのを回避するために、別途統
計的に文書の特徴を計測し、適応型2値算術符号化方式
の適応部の「状態番号」と「優勢シンボル値」について
初期値を与えることで、学習ステップを削減し、符号化
効率を向上させることができる符号化装置を提供するも
のである。
【0043】また、画像符号化に用いられる2値算術符
号化方式とも、多くの部品を共通化し、文字/画像共用
の符号化装置を提供するものである。
【0044】さらに、参照シンボルの選択に使用する回
路についても、簡易で高速化が図れる構成の符号化装置
を提供するものである。
【0045】
【課題を解決するための手段】この発明の請求項1に係
る符号化装置は、文字コードを2値のシンボル列とみな
して2値のシンボル列から符号化対象シンボルの直前の
連続する所定個以上の参照シンボルを選択する参照シン
ボル選択部と、参照シンボル選択部により選択された参
照シンボルの個々の値の組み合わせによって生ずるコン
テクスト毎に符号化対象シンボルが各コンテクストにお
いて出現確率が高いと予想されるシンボルと一致すれば
優勢シンボル(以下、優勢シンボルをMPSという)で
あることを、出現確率が高いと予想されるシンボルと一
致しなければ劣勢シンボル(以下、劣勢シンボルをLP
Sという)であることを示すデータをそれぞれ出力する
予測変換処理部と、コンテクストの状態を示す状態番号
とLPSあるいはMPSに割り当てる確率領域幅を対応
づけるとともに、状態の遷移が必要となった場合の状態
遷移先番号を記憶する確率推定テーブルと、各コンテク
スト毎に状態番号によって識別し、符号化対象シンボル
に対する上記予測変換処理部の出力とそのコンテクスト
とを入力とし、上記確率推定テーブルを参照してコンテ
クスト毎の状態遷移を行いながら、LPSあるいはMP
Sに対する確率領域幅を推定し出力する確率推定部と、
各コンテクストの状態番号とMPS値を記憶する状態番
号/優勢シンボル記憶部と、上記確率推定部の出力であ
るLPSあるいはMPSに対する確率領域幅を用いて符
号化対象シンボルを演算により符号化する2値算術符号
化部とを有する文字符号化部を備えると共に、上記文字
符号化部の2値出力符号を逐次復号し、復号対象シンボ
ルがMPSであるかLPSであるかをコード出力する2
値算術復号化部と、2値算術復号化部の出力コードを符
号化前の2値シンボル列に変換する逆予測変換処理部
と、逆予測変換処理部の2値出力シンボル列から上記符
号器側と同じ参照シンボルを選択する参照シンボル選択
部と、参照シンボル選択部により選択された参照シンボ
ルの個々の値の組み合わせによって生ずるコンテクスト
と2値算術復号化部の出力コードを入力とし、各コンテ
クスト毎に状態番号によって識別し、上記文字符号化部
と同じ確率推定テーブルを参照することによって、状態
遷移を行いながら、各コンテクストの各状態についてL
PSあるいはMPSに割り当てられる確率領域幅を推定
し出力する確率推定部と、確率推定部の状態番号とMP
S値を記憶する状態番号/優勢シンボル記憶部とを有
し、逆予測変換処理部の2値シンボル列を出力とする文
字復号化部とを備える符号化装置において、符号化を行
おうとする複数の文書について参照シンボル選択部が選
択するのと同じ参照シンボルを用いて各コンテクストに
おけるLPSの出現確率p1ps を予め算出し、この時の
LPSの出現確率をp1ps とした場合、予め定めた正の
整数nについて 1 / 2k+2 ≦ p1ps < 1 / 2k+1 を満たす整数k(n>k≧0)を各コンテクスト毎に求
め、p1ps<1/2n+2の場合にはk=nと選択し、MP
Sしか発生しないコンテクストであるP1pS =0の場合
についてはLPSに対して割り当てられる確率領域幅が
最小になる状態番号をkに設定することによってコンテ
クストを分類すると共に、各コンテクストにおけるMP
S値を予め計測して、上記整数kによって分類され、そ
れに対応づけられた初期状態番号を各コンテクストの状
態番号に設定すると共に、上記計測したMPS値を優勢
シンボルの初期MPS値として記憶してなる状態番号/
MPS初期値記憶部を上記文字符号化部及び文字復号化
部に備え、符号および復号の開始時に、状態番号/MP
S初期値記憶部の内容を文字符号化部および文字復号化
部の状態番号/優勢シンボル記憶部に設定した後、符号
化および復号化動作をそれぞれ開始することを特徴とし
たものである。
【0046】また、請求項2に係る符号化装置は、文字
コードを2値のシンボル列とみなして2値のシンボル列
から符号化対象シンボルの直前の連続する所定個以上の
参照シンボルを選択する参照シンボル選択部と、参照シ
ンボル選択部により選択された参照シンボルの個々の値
の組み合わせによって生ずるコンテクスト毎に符号化対
象シンボルが各コンテクストにおいて出現確率が高いと
予想されるシンボルと一致すれば優勢シンボル(以下、
優勢シンボルをMPSという)であることを、出現確率
が高いと予想されるシンボルと一致しなければ劣勢シン
ボル(以下、劣勢シンボルをLPSという)であること
を示すデータをそれぞれ出力する予測変換処理部と、コ
ンテクストの状態を示す状態番号とLPSあるいはMP
Sに割り当てる確率領域幅を対応づけるとともに、状態
の遷移が必要となった場合の状態遷移先番号を記憶する
確率推定テーブルと、各コンテクスト毎に状態番号によ
って識別し、符号化対象シンボルに対する上記予測変換
処理部の出力とそのコンテクストとを入力とし、上記確
率推定テーブルを参照してコンテクスト毎の状態遷移を
行いながら、LPSあるいはMPSに対する確率領域幅
を推定し出力する確率推定部と、各コンテクストの状態
番号とMPS値を記憶する状態番号/優勢シンボル記憶
部と、上記確率推定部の出力であるLPSあるいはMP
Sに対する確率領域幅を用いて符号化対象シンボルを演
算により符号化する2値算術符号化部とを有する文字符
号化部を備えると共に、上記文字符号化部の2値出力符
号を逐次復号し、復号対象シンボルがMPSであるかL
PSであるかをコード出力する2値算術復号化部と、2
値算術復号化部の出力コードを符号化前の2値シンボル
列に変換する逆予測変換処理部と、逆予測変換処理部の
2値出力シンボル列から上記符号器側と同じ参照シンボ
ルを選択する参照シンボル選択部と、参照シンボル選択
部により選択された参照シンボルの個々の値の組み合わ
せによって生ずるコンテクストと2値算術復号化部の出
力コードを入力とし、各コンテクスト毎に状態番号によ
って識別し、上記文字符号化部と同じ確率推定テーブル
を参照することによって、状態遷移を行いながら、各コ
ンテクストの各状態についてLPSあるいはMPSに割
り当てられる確率領域幅を推定し出力する確率推定部
と、確率推定部の状態番号とMPS値を記憶する状態番
号/優勢シンボル記憶部とを有し、逆予測変換処理部の
2値シンボル列を出力とする文字復号化部とを備える符
号化装置において、上記文字符号化部に、符号化対象の
文書毎に各コンテクストにおける2値シンボルの出現数
をカウントしてMPS値を求めるMPS/LPS検出部
を備え、符号化時に上記状態番号/優勢シンボル記憶部
にmビットの参照シンボルから構成されるコンテクスト
全てに関する2m 個のMPSをテーブルとしたMPSテ
ーブル情報を生成し、このMPSテーブル情報をシンボ
ル列と見なして初期値として全てのコンテクストにおい
て状態番号を“0”、MPS値も“0”と設定して符号
化を開始し、続く符号化する文字情報については、2 m
個のコンテクストについてMPSテーブル情報値を状態
番号/優勢シンボル記憶部のMPS値に設定し、かつ予
め復号化部と取り決めた初期状態番号を全コンテクスト
に(同じ番号を)設定した後、符号化すると共に、上記
文字復号化部に、2値算術符号化されて送られてきた文
字文書伸長用の全コンテクストについての初期MPS値
の復号した値を蓄積する初期MPS値蓄積部を備え、復
号化時に、状態番号/優勢シンボル記憶部の初期値とし
て、全てのコンテクストにおいて状態番号を“0”、優
勢シンボルも“0”と設定して復号化を開始し、MPS
テーブル情報の復号データを初期MPS値蓄積部に一時
蓄積し、MPSテーブル情報の復号が終了した時点で、
復号されたMPSテーブル情報を状態番号/優勢シンボ
ル記憶部のMPS値に設定した後、上記予め符号化部と
取り決めた初期状態番号を全コンテクストについて設定
して文字情報の復号を開始することを特徴とするもので
ある。
【0047】また、請求項3に係る符号化装置は、文字
コードを2値のシンボル列とみなして2値のシンボル列
から符号化対象シンボルの直前の連続する所定個以上の
参照シンボルを選択する参照シンボル選択部と、参照シ
ンボル選択部により選択された参照シンボルの個々の値
の組み合わせによって生ずるコンテクスト毎に符号化対
象シンボルが各コンテクストにおいて出現確率が高いと
予想されるシンボルと一致すれば優勢シンボル(以下、
優勢シンボルをMPSという)であることを、出現確率
が高いと予想されるシンボルと一致しなければ劣勢シン
ボル(以下、劣勢シンボルをLPSという)であること
を示すデータをそれぞれ出力する予測変換処理部と、コ
ンテクストの状態を示す状態番号とLPSあるいはMP
Sに割り当てる確率領域幅を対応づけるとともに、状態
の遷移が必要となった場合の状態遷移先番号を記憶する
確率推定テーブルと、各コンテクスト毎に状態番号によ
って識別し、符号化対象シンボルに対する上記予測変換
処理部の出力とそのコンテクストとを入力とし、上記確
率推定テーブルを参照してコンテクスト毎の状態遷移を
行いながら、LPSあるいはMPSに対する確率領域幅
を推定し出力する確率推定部と、各コンテクストの状態
番号とMPS値を記憶する状態番号/優勢シンボル記憶
部と、上記確率推定部の出力であるLPSあるいはMP
Sに対する確率領域幅を用いて符号化対象シンボルを演
算により符号化する2値算術符号化部とを有する文字符
号化部を備えると共に、上記文字符号化部の2値出力符
号を逐次復号し、復号対象シンボルがMPSであるかL
PSであるかをコード出力する2値算術復号化部と、2
値算術復号化部の出力コードを符号化前の2値シンボル
列に変換する逆予測変換処理部と、逆予測変換処理部の
2値出力シンボル列から上記符号器側と同じ参照シンボ
ルを選択する参照シンボル選択部と、参照シンボル選択
部により選択された参照シンボルの個々の値の組み合わ
せによって生ずるコンテクストと2値算術復号化部の出
力コードを入力とし、各コンテクスト毎に状態番号によ
って識別し、上記文字符号化部と同じ確率推定テーブル
を参照することによって、状態遷移を行いながら、各コ
ンテクストの各状態についてLPSあるいはMPSに割
り当てられる確率領域幅を推定し出力する確率推定部
と、確率推定部の状態番号とMPS値を記憶する状態番
号/優勢シンボル記憶部とを有し、逆予測変換処理部の
2値シンボル列を出力とする文字復号化部とを備える符
号化装置において、上記文字符号化部に、符号化対象の
文書毎に各コンテクストにおける2値シンボルの出現数
をカウントしてMPS値を求めるMPS/LPS検出部
を備え、符号化時に、このMPS/LPS検出部を用い
て各コンテクストのMPS値を示す1ビットと「MPS
のみが発生し、LPSが発生しない」コンテクストであ
ることを示す1ビットの計2ビットをコンテクスト情報
として求め、mシンボルの参照シンボルを用いる場合に
は全部で2m+1 ビットのコンテクスト情報を文字情報と
見なして状態番号/優勢シンボル記憶部の初期値として
全てのコンテクストにおいて状態番号を“0”、優勢シ
ンボルも“0”と設定して符号化を開始し、続く文字情
報については、MPS値を状態番号/優勢シンボル記憶
部に設定し、かつ、「MPSのみが発生し、LPSが発
生しない」コンテクストについては、状態番号/優勢シ
ンボル記憶部の状態番号を「LPSに割り当てる確率領
域を最小にする状態番号」に設定した後、文字符号化を
行うと共に、上記文字復号化部に、復号した上記2m+1
ビットのコンテクスト情報を蓄積する初期化情報蓄積部
を備え、状態番号/優勢シンボル記憶部の初期値とし
て、全てのコンテクストにおいて状態番号を“0”、優
勢シンボルも“0”と設定して復号化を開始し、復号し
た2m+1 ビットのコンテクスト情報を上記初期化情報蓄
積部に蓄積し、コンテクスト情報の復号が終了した時点
で、復号された各コンテクストにおけるMPS値を状態
番号/優勢シンボル記憶部の優勢シンボル値に設定し、
かつ、「MPSのみが発生し、LPSが発生しない」コ
ンテクストであることがわかったコンテクストについて
は状態番号/優勢シンボル記憶部の状態番号を「LPS
に割り当てる確率領域を最小にする状態番号」に設定し
た後、文字情報の復号を行うことを特徴とするものであ
る。
【0048】また、請求項4に係る符号化装置は、文字
コードを2値のシンボル列とみなして2値のシンボル列
から符号化対象シンボルの直前の連続する所定個以上の
参照シンボルを選択する参照シンボル選択部と、参照シ
ンボル選択部により選択された参照シンボルの個々の値
の組み合わせによって生ずるコンテクスト毎に符号化対
象シンボルが各コンテクストにおいて出現確率が高いと
予想されるシンボルと一致すれば優勢シンボル(以下、
優勢シンボルをMPSという)であることを、出現確率
が高いと予想されるシンボルと一致しなければ劣勢シン
ボル(以下、劣勢シンボルをLPSという)であること
を示すデータをそれぞれ出力する予測変換処理部と、コ
ンテクストの状態を示す状態番号とLPSあるいはMP
Sに割り当てる確率領域幅を対応づけるとともに、状態
の遷移が必要となった場合の状態遷移先番号を記憶する
確率推定テーブルと、各コンテクスト毎に状態番号によ
って識別し、符号化対象シンボルに対する上記予測変換
処理部の出力とそのコンテクストとを入力とし、上記確
率推定テーブルを参照してコンテクスト毎の状態遷移を
行いながら、LPSあるいはMPSに対する確率領域幅
を推定し出力する確率推定部と、各コンテクストの状態
番号とMPS値を記憶する状態番号/優勢シンボル記憶
部と、上記確率推定部の出力であるLPSあるいはMP
Sに対する確率領域幅を用いて符号化対象シンボルを演
算により符号化する2値算術符号化部とを有する文字符
号化部を備えると共に、上記文字符号化部の2値出力符
号を逐次復号し、復号対象シンボルがMPSであるかL
PSであるかをコード出力する2値算術復号化部と、2
値算術復号化部の出力コードを符号化前の2値シンボル
列に変換する逆予測変換処理部と、逆予測変換処理部の
2値出力シンボル列から上記符号器側と同じ参照シンボ
ルを選択する参照シンボル選択部と、参照シンボル選択
部により選択された参照シンボルの個々の値の組み合わ
せによって生ずるコンテクストと2値算術復号化部の出
力コードを入力とし、各コンテクスト毎に状態番号によ
って識別し、上記文字符号化部と同じ確率推定テーブル
を参照することによって、状態遷移を行いながら、各コ
ンテクストの各状態についてLPSあるいはMPSに割
り当てられる確率領域幅を推定し出力する確率推定部
と、確率推定部の状態番号とMPS値を記憶する状態番
号/優勢シンボル記憶部とを有し、逆予測変換処理部の
2値シンボル列を出力とする文字復号化部とを備える符
号化装置において、上記文字符号化部に画像データ選択
信号の入力に基づいて画像の2値シンボル列から符号化
対象シンボルの発生確率を推定するための参照シンボル
を取り出す画像参照シンボル選択部を備えると共に、上
記文字復号化部に、画像データ選択信号の入力に基づい
て逆予測変換処理部の出力から復号対象シンボルのMP
S/LPSの確率推定を行うための参照ビットを取り出
す画像参照シンボル選択部を備えたことを特徴とするも
のである。
【0049】さらに、請求項5に係る符号化装置は、文
字コードを2値のシンボル列とみなして2値のシンボル
列から符号化対象シンボルの直前の連続する所定個以上
の参照シンボルを選択する参照シンボル選択部と、参照
シンボル選択部により選択された参照シンボルの個々の
値の組み合わせによって生ずるコンテクスト毎に符号化
対象シンボルが各コンテクストにおいて出現確率が高い
と予想されるシンボルと一致すれば優勢シンボル(以
下、優勢シンボルをMPSという)であることを、出現
確率が高いと予想されるシンボルと一致しなければ劣勢
シンボル(以下、劣勢シンボルをLPSという)である
ことを示すデータをそれぞれ出力する予測変換処理部
と、コンテクストの状態を示す状態番号とLPSあるい
はMPSに割り当てる確率領域幅を対応づけるととも
に、状態の遷移が必要となった場合の状態遷移先番号を
記憶する確率推定テーブルと、各コンテクスト毎に状態
番号によって識別し、符号化対象シンボルに対する上記
予測変換処理部の出力とそのコンテクストとを入力と
し、上記確率推定テーブルを参照してコンテクスト毎の
状態遷移を行いながら、LPSあるいはMPSに対する
確率領域幅を推定し出力する確率推定部と、各コンテク
ストの状態番号とMPS値を記憶する状態番号/優勢シ
ンボル記憶部と、上記確率推定部の出力であるLPSあ
るいはMPSに対する確率領域幅を用いて符号化対象シ
ンボルを演算により符号化する2値算術符号化部とを有
する文字符号化部を備えると共に、上記文字符号化部の
2値出力符号を逐次復号し、復号対象シンボルがMPS
であるかLPSであるかをコード出力する2値算術復号
化部と、2値算術復号化部の出力コードを符号化前の2
値シンボル列に変換する逆予測変換処理部と、逆予測変
換処理部の2値出力シンボル列から上記符号器側と同じ
参照シンボルを選択する参照シンボル選択部と、参照シ
ンボル選択部により選択された参照シンボルの個々の値
の組み合わせによって生ずるコンテクストと2値算術復
号化部の出力コードを入力とし、各コンテクスト毎に状
態番号によって識別し、上記文字符号化部と同じ確率推
定テーブルを参照することによって、状態遷移を行いな
がら、各コンテクストの各状態についてLPSあるいは
MPSに割り当てられる確率領域幅を推定し出力する確
率推定部と、確率推定部の状態番号とMPS値を記憶す
る状態番号/優勢シンボル記憶部とを有し、逆予測変換
処理部の2値シンボル列を出力とする文字復号化部とを
備える符号化装置において、上記文字符号化部の上記参
照シンボル選択部を、符号化対象ビットの直前の連続す
るmビットを参照ビットとして取り出すシフトレジスタ
と、このシフトレジスタの内容をアドレス信号として上
記状態番号/優勢シンボル記憶部内のコンテクストに対
応した領域を選択するためのラッチ回路とで構成し、か
つ上記アドレス線により指定された状態番号/優勢シン
ボル記憶部内の特定アドレス内容を確率推定部から読み
書きするためのリード/ライト信号線と、確率推定部か
らシフトレジスタ部へデータのシフトタイミングを知ら
せる次コンテクスト要求信号線とを備えると共に、上記
文字復号化部の上記参照シンボル選択部を、復号対象シ
ンボル直前の連続するmビットを参照シンボルとして取
り出すシフトレジスタと、このシフトレジスタの内容を
アドレス信号として出力するためのラッチ回路とで構成
し、かつ上記アドレス線により指定された状態番号/優
勢シンボル記憶部内の特定アドレス内容を確率推定部か
ら読み書きするためのリード/ライト信号線と、確率推
定部からシフトレジスタ部へデータのシフトタイミング
を知らせる次コンテクスト要求信号線とを備えたことを
特徴とするものである。
【0050】
【作用】この発明の請求項1に係る符号化装置において
は、前もって符号化対象の複数の文書あるいは符号化対
象の文書を代表する文書を用いて、コンテクスト毎のM
PS値を求めて符号化部と復号化部に初期MPS値とし
て設定するとともに、各コンテクストにおけるLPSの
出現確率に応じて、各コンテクストの初期状態番号を指
定することにより、確率推定部が各コンテクストにおけ
るLPSやMPSの出現確率に応じた最適な確率領域幅
を選択するまでに要する学習ステップを削減し、文字文
書の圧縮率および符号化効率の向上を実現する。
【0051】また、請求項2に係る符号化装置において
は、符号化を行う文書毎に、予め全コンテクストのMP
S値を求めておき、そのMPS値を符号化部と復号化部
共通の初期MPS値とすると同時に、初期MPS値が与
えられたことを条件として最も圧縮率が向上する全コン
テクストに共通な初期状態番号を符号化部と復号化部で
予め取り決めておくことで、文字文書の圧縮効率を向上
させるとともに、MPS初期値を符号化部から復号化部
に送るに当たっては、MPS値の情報(MPSテーブル
情報)をシンボル列とみなして2値算術符号化部を利用
して圧縮して送ることで符号化効率を高める。
【0052】また、請求項3に係る符号化装置において
は、符号化を行う文書毎に、予め全コンテクストにおい
てMPSとLPSの出現数をカウントし、上記請求項2
と同様に、各コンテクストのMPS値を求めると同時
に、LPSが出現しないコンテクストを求めて、そのコ
ンテクストについては、LPSに割り当てられる確率領
域幅が最小になる状態番号を初期状態番号とすることを
符号化部と復号化部とで予め取り決めておき、全コンテ
クストへの初期MPS値の設定と、LPSが出現しない
コンテクストへの「LPSに割り当てられる確率領域幅
が最小になる状態番号」の設定を行った後、符号化およ
び復号化の動作を行うことで、文字圧縮率を向上させ
る。また、全コンテクストのMPS値と、LPSが出現
しないコンテクストを符号化部から復号化部に通知する
にあたっては、これらの情報をシンボル列とみなして2
値算術符号化部にて圧縮し、復号化部では、全コンテク
ストのMPS値と、LPSが出現しないコンテクストを
まず復号したのち、符号化部と同じ方法で初期MPS値
と初期状態番号を与えた後、文字の復号を行う方法によ
り、符号化効率の向上を実現する。
【0053】また、請求項4に係る符号化装置において
は、請求項3で実現された文字符号化に適した符号化装
置の構成に、参照シンボル選択部として画像用の参照シ
ンボル選択部も選択できるようにすることで、画像符号
化装置と文字符号化装置が確率推定テーブルをはじめ確
率推定部、算術符号化部を共有できるようにする。
【0054】さらに、請求項5に係る符号化装置におい
ては、上記請求項1ないし3に記した符号化装置の参照
シンボル選択部を、簡単なシフトレジスタにより実現
し、回路の高速化を実現する。
【0055】
【実施例】
実施例1.請求項1に係る文字符号化部20の実施例を
図1に示す。図1において、8は文字入力を2値シンボ
ル列に変換する文字コード2値化部、5はこの変換され
た2値シンボル列から符号化対象シンボルの直前の7個
以上の連続するシンボルを参照シンボルとして選択する
参照シンボル選択部であり、ここで参照シンボルが2値
シンボルであるため、参照シンボル数をmとすると、2
m 通りの組み合わせ(コンテクスト)が出現しうる。
【0056】6はそのコンテクストによって、入力シン
ボルがより出現確率が高いシンボル(MPS:More Pro
bable Symbol )であるか、出現確率が低いシンボル
(LPS:Less Probable Symbol )であるかを出力す
る予測変換処理部、1はコンテクスト毎にステートマシ
ンを持ち、その状態を入力シンボルがMPSであるかL
PSであるかによって遷移させ、2値算術符号のために
各コンテクストにおけるLPS領域幅あるいはMPS領
域幅を適応的に推定し選択する確率推定部である。
【0057】3は確率推定部1の状態番号とLPSある
いはMPSに対して割り当てる確率領域幅を対応づけ、
また、符号化対象シンボルがMPSであるかLPSかに
応じて状態の遷移先を定める確率推定テーブルであり、
確率推定テーブルの例としては、図10にISO/IEC Comm
ittee Draft 11544 “Progressive Bi-level Image Com
pression"に記載の確率推定テーブル(Probability Esti
mation Tabie 23 )を示す。
【0058】4は確率推定部1における各コンテクスト
毎の状態を状態番号として記憶するとともに、このコン
テクストにおける現在のMPS値を記憶する状態番号/
優勢シンボル記憶部、2は確率推定部1の出力であるL
PSあるいはMPSに対して割り当てる確率領域幅を入
力として2値算術符号演算を行い符号を出力する2値算
術符号化部、7は状態番号/MPS初期値記憶部であ
る。
【0059】一方、図2は、請求項1に係る文字復号化
部21の実施例を示す。図2において、14は2値算術
符号化された符号を入力して、復号対象シンボルがMP
SであるかLPSであるかを出力とする2値算術復号化
部、9は2値算術復号化部の出力、すなわち復号化対象
シンボルがMPSであるかLPSであるかを示すシンボ
ルを、符号化する前の2値シンボルに変換する逆予測変
換処理部である。
【0060】10は逆予測変換処理部9の出力である符
号化する前の2値シンボル列を、文字文書の文字コード
に変換する2値文字コード変換部、1は文字符号化部2
0と同じく、コンテクスト毎にステートマシンを持ち、
その状態を復号対象シンボルがMPSであるかLPSで
あるかによって遷移させ、2値算術復号のために各コン
テクストにおけるLPS領域幅あるいはMPSの領域幅
を適応的に推定し選択する確率推定部である。
【0061】3は確率推定テーブルであり、これは文字
符号化部20における確率推定テーブル3と同一のもの
である。4は文字符号化部20と同じく、確率推定部1
における各コンテクスト毎の状態を状態番号として記憶
するとともに、そのコンテクストにおける現在のMPS
値を記憶する状態番号/優勢シンボル記憶部、5も文字
符号化部20と同じく、復号された文字コードの構成要
素である2値シンボル列から復号化対象シンボルの直前
の7個以上の連続するシンボルを参照シンボルとして選
択する参照シンボル選択部である。また、7は、文字符
号化部20の場合と同一の状態番号/MPSの初期値記
憶部である。
【0062】次に、図1と図2および図10を用いて、
請求項1に係る符号化装置の動作を説明する。なお、こ
こでは、2値算術符号化方式として、ISO/IEC Committe
e Draft 11544 “Progressive Bi-level Image Compres
sion"に記載の算術符号化方式QMコーダを例とする
が、他の2値算術符号でも同様である。
【0063】まず、図1に示す文字符号化部20の動作
について説明する。文字符号化を開始する先立って、確
率推定部1は、状態番号/MPS初期値記憶部7の内容
を読み出し、各コンテクストに対応する状態番号/優勢
シンボル記憶部4に初期値を設定する。次に、文字符号
化が開始される。符号化対象文字は、文字符号化部20
の文字コード2値変換部8に入力され、2値のシンボル
列に変換され、参照シンボル選択部5と予測変換処理部
6に伝えられる。
【0064】参照シンボル選択部5は、例えば符号化シ
ンボル直前の連続する16シンボルを参照シンボルに選
択し、各シンボルの値によって216通りの組み合わせが
ある。この各々の組み合わせを、コンテクストとして確
率推定部1へ通知し、確率推定部1では、このコンテク
ストを基に、状態番号/優勢シンボル記憶部4の内容、
すなわちそのコンテクストの現在の状態番号とMPS値
を読み出す。
【0065】状態番号/優勢シンボル記憶部4から読み
出されたMPS値は予測変換処理部6に通知される。予
測変換処理部6では、文字コード2値変換部8の出力で
ある符号化対象シンボルと確率推定部1から知られたそ
のコンテクストにおけるMPS値とを比較し、比較結果
をLPS/MPSコードとして、確率推定部1と2値算
術符号部2に通知する。このLPS/MPSコードは、
例えば、符号化対象シンボルがMPS値と一致したら
“0”、不一致なら“1”といった信号である。
【0066】一方、確率推定部1は、先に参照シンボル
選択部5から通知されたコンテクストを基に、状態番号
/優勢シンボル記憶部4からそのコンテクストの現在の
状態番号を読み出し、この状態番号を基に、確率推定部
テーブル3からLPSに対する領域割り当て幅を得る。
こうして得たLPS領域割り当て幅は、確率推定部1か
ら2値算術符号化部2に伝えられる。
【0067】2値算術符号化部2では、予測変換処理部
6から通知されたLPS/MPSコードと、確率推定部
1から通知されたLPS領域割り当て幅から2値算術符
号化を実行する。すなわち、2値算術符号化部2におけ
る現在の有効領域幅をA、確率推定部1から通知された
LPS領域割り当て幅をLSZとすると、A−LSZを
MPSに、LSZをLPSの領域とし、予測変換処理部
6から通知されたLPS/MPSコードの内容に応じ
て、A−LSZあるいはLSZの領域を選択し、算術符
号化を実行する。
【0068】一方、予測変換処理部6からLPS/MP
Sコードを通知された確率推定部1では、LPSを通知
されると、無条件でそのコンテクストでの状態遷移を実
行する。また、QMコーダでは、2値算術符号化部2に
おいて2値算術符号演算により正規化が発生すると、M
PSであっても状態遷移を実行する必要があるため、2
値算術符号化部2から確率推定部1へ正規化が発生した
ことが通知される。
【0069】確率推定部1は、当該コンテクストが状態
遷移を必要とされる状況になったと判断すると、確率推
定テーブル3を参照し、遷移すべき次の状態番号を得
る。確率推定テーブル3は、図10に示すように、符号
化対象シンボルがLPSだった場合には次の状態番号は
nlps(next lps) 欄から、符号化対象シンボルがM
PSだった場合には次の状態番号はnmps(next mp
s)欄から得られる。新しい状態番号は、状態番号/優
勢シンボル記憶部4に書き込まれ、そのコンテクストの
状態番号が改訂される。
【0070】また、QMコーダでは、符号化対象シンボ
ルがLPSで、確率推定テーブルのswitchビットが1の
場合、MPS値を変更、すなわち、現在の値をXとする
と(1−X)に置き換える。この新しいMPS値も状態
番号/優勢シンボル記憶部4に書き込まれ記憶される。
各シンボルごとに以上の手順で符号化が行われる。
【0071】次に、図2に示す文字復号化部21の動作
について説明する。復号動作が開始する先立って、確率
推定部1は、状態番号/MPS初期値記憶部15から、
各コンテクストの状態番号とMPS値を読み出し、この
各初期値を、状態番号/優勢シンボル記憶部4の相当す
るコンテクストの位置に設定した後、復号動作を開始す
る。復号動作が開始されると、文字符号化部21の出力
符号は2値算術復号部14に入力される。
【0072】2値算術復号化部14では、確率推定部1
からLPSに対する領域幅を通知されることにより、復
号化対象シンボルがMPSであるのかLPSであるのか
を算術演算によって求め、結果をLPS/MPSコード
として出力する。このLPS/MPSコードを受けた逆
予測変換処理部9では、確率推定部1から通知を受けた
MPS値とこのLPS/MPSコードから、復号対象シ
ンボルを復号し出力する。
【0073】復号された2値シンボルは、2値文字コー
ド変換部10により、文字として復号され、外部へと取
り出される。また、逆予測変換処理部9の出力、復号シ
ンボル列は、参照シンボル選択部5へと送られ、参照シ
ンボル選択部5で文字符号化部20と同じ参照シンボル
を、すなわち、復号化対象シンボルの直前の連続する1
6個のシンボルを選択し、その各シンボルの値によって
16通りのコンテクストを発生する。
【0074】このコンテクストは確率推定部1へと通知
され、確率推定部1は、このコンテクストを基に、当該
コンテクストの状態番号とMPS値を、状態番号/優勢
シンボル記憶部4から読み出す。また、2値算術復号化
部14から通知されたLPS/MPSコードから、その
コンテクストでの復号対象シンボルがLPSであったが
MPSであったかを知り、状態遷移が必要であれば、状
態遷移の動作に移る。
【0075】QMコーダでは、状態遷移が必要な場合
は、2値算術復号化部14から正規化が発生したことを
知らせる信号が送られてくるため、この信号が送られて
来た場合のみ、次に述べる状態遷移を実行すればよい。
すなわち、確率推定部1は、現在の状態番号を基に確率
推定テーブルから次の状態番号を得る。
【0076】この動作は、文字符号化部20と同じ動作
であり、確率推定テーブル3は図10に示されている。
すなわち、符号化対象シンボルがLPSだった場合には
次の状態場合はnlps(next lps) 欄から、符号化対
象シンボルがMPSだった場合には次の状態番号はnm
ps(next mps)欄から得られる。
【0077】新しい状態番号は、状態番号/優勢シンボ
ル記憶部4に書き込まれ、そのコンテクストの状態番号
が改訂される。また、QMコーダでは、符号化対象シン
ボルがLPSで、確率推定テーブルのswitchビットが1
の場合、MPS値を変更、すなわち、現在の値をXとす
ると(1−X)に置き換える。この新しいMPS値も状
態番号/優勢シンボル記憶部4に書き込まれ記憶され
る。
【0078】さて、状態番号が改訂されたされないに係
わらず、確率推定部1は、次の復号化対象シンボルのた
めのLPS領域幅を2値算術復号化部14に通知する必
要がある。このLPS領域幅は、今、復号したシンボル
が参照シンボル選択部5に加えられ、参照シンボル選択
部5で選択された参照シンボルから次のコンテクストが
出力される。
【0079】このコンテクストを用いて確率推定部1が
現在の状態番号を状態番号/優勢シンボル記憶部4から
読み出し、さらに、その状態番号を用いて、その状態で
のLPS領域幅を確率推定テーブル3から読み出すこと
により得られる。このLPS領域幅を確率推定部1は2
値算術復号化部14に与えて次のシンボルの復号動作に
移る。
【0080】ここで、この発明の状態番号/初期値記憶
部7の値の設定方法について述べる。符号化対象となっ
ている複数の文書、あるいは符号化対象を代表している
と思われる文書について、文字符号化部20と文字復号
化部21とは別に、例えば計算機上で、実際に参照シン
ボル選択部5が行うのと同じ参照シンボルを用いて、そ
れぞれのコンテクストごとに2値シンボルの出現回数を
カウントする。
【0081】今、“0”シンボルがi回、“1”シンボ
ルがj回とすると、iとjを比較し、出現回数が多かっ
た方をMPS、少なかった方をLPSとする。i≦j
成り立てば、“1”がMPSがあり、逆に、i>jが成
り立てば、“0”がMPS値となる。また、LPSの出
現確率p1ps は i≦jならp1ps =i/(i+j) i>jならp1ps =j/(i+j) として定める。
【0082】この時、予め定めた正の整数nについて 1/2k+2 ≦p1ps <1/2k+1 を満たす整数k(n>k≧0)を各コンテクスト毎に求
め、また、p1ps <1/2n+2 の番号にはk=nと選択
し、さらに、p1ps =0の場合、すなわち、統計的にも
MPSしか発生しないコンテクストについては、LPS
に対して割り当てられる確率領域幅が最小になる状態番
号をkに設定する。
【0083】例えば、n=3とした場合、 1/22 ≦p1ps <1/21 のコンテクストはk=0 1/23 ≦p1ps <1/22 のコンテクストはk=1 1/24 ≦p1ps <1/23 のコンテクストはk=2 p1ps <1/24 のコンテクストはk=3 また、 p1ps =0のコンテクストは、k=13と
いった状態番号が選択される。
【0084】こうして求めたMPS値と状態番号を、各
コンテクスト毎に記憶させたのが、状態番号/MPS初
期値記憶部7である。状態番号/初期値記憶部7は文字
符号化部20および文字復号化部21で共通に使用され
る。
【0085】以上のように、上述した実施例1(請求項
1)では、予め符号化対象の複数の文書あるいは符号化
対象の文書を代表する文書を用いて、コンテクスト毎に
MPS値を求めて符号化部と復号化部に初期MPS値と
して設定するとともに、各コンテクストにおけるLPS
の出現確率に応じて、各コンテクストの初期状態番号を
設定することにより、確率推定部が各コンテクストにお
けるLPSやMPSの出現確率に応じて最適な確率領域
幅を選択するまでに要する学習ステップを削減し、かつ
既知の適応型2値算術符号部の構成については変更を加
えることなく、文字文書の圧縮率および符号化効率の向
上を実現することができるという効果を有する。
【0086】実施例2.次に、請求項2に係る文字符号
化部20の実施例を図3に示す。図3において、11
は、符号化対象の文書毎に、各コンテクストにおける2
値シンボルの出現数をカウントし、各コンテクストにお
けるMPS値を求めるMPS/LPS検出部であり、そ
の他の部分は、請求項1に係る図1における文字符号化
部20と同じあるいは同等の部分を示し、8は文字コー
ド2値化部、5は参照シンボル選択部、6は予測変換処
理部、1は確率推定部、3は確率推定テーブルである。
4は状態番号/優勢シンボル記憶部、2は2値算術符号
化部である。
【0087】一方、図4は請求項2に係る文字復号化部
21の実施例を示す。図4において、12は2値算術符
号化されてきた文字文書伸長用の全コンテクストについ
て初期MPS値の復号した値を蓄積する初期MPS値蓄
積部であり、この他の図中の部分は請求項1に係る図2
における文字復号化部21と同じあるいは同等の部分を
示し、14は2値算術復号化部、9は逆予測変換処理
部、10は2値文字コード変換部、1は確率推定部、3
は確率推定テーブル、4は状態番号/優勢シンボル記憶
部、5は参照シンボル選択部である。
【0088】次に、図3および図4を用いて、請求項2
に係る符号化装置の動作を説明する。なお、ここでは、
2値算術符号化方式として、ISO/IEC Committee Draft
11544 “Progressive Bi-level Image Compression"に
記載の算術符号化方式QMコーダを例とするが、他の2
値算術符号でも同様である。
【0089】まず、文字符号化部20の動作について説
明する。本装置では、符号化しようとする文書を2度、
文字コード2値化部8に入力する。まず、第1回目の入
力時には、文字コード2値化部8の出力は、MPS/L
PS検出部11と参照シンボル選択部5へと送られる。
参照シンボル選択部5では、符号化対象シンボルの直前
の7個以上、例えば16個の連続するシンボルを参照シ
ンボルとして選択する。
【0090】ここで得られた216通りのコンテクスト
は、文字コード2値化部8の出力と共にMPS/LPS
検出部11へと送られる。MPS/LPS検出部11で
は、文字コード2値化部8の出力である2値シンボルの
それぞれについて、各コンテクスト毎に出現回数をカウ
ントする。
【0091】今、あるコンテクストについて、シンボル
“0”がi回、シンボル“1”がj回出現したとする
と、 i≦jの時 シンボル“1”をMPSとし i>jの時 シンボル“0”をMPSと定める。 こうして、文書の第1回目の入力により、文書毎のコン
テクストにおけるMPS値が求まる。
【0092】MPS/LPS検出部11の内容から求め
られた各コンテクストのMPS値は、続いて、状態番号
/優勢シンボル記憶部4の内容を、全てのコンテクスト
について状態番号を“0”、優勢シンボルも“0”と初
期設定した状態で、2値算術符号にかけられる。すなわ
ち、上記の手順で求められた各コンテクストのMPS値
16個は、参照シンボル選択部5と予測変換処理部6に
入力シンボルとして送られ、2値の算術符号にかけられ
て圧縮された後、文字復号化部21へと送られる。
【0093】また、216個の文字圧縮用の初期MPS値
が符号化を終了した後は、MPS/LPS検出部11内
のカウンタ値から求められた各コンテクストにおけるM
PS値は、確率推定部1を経由して、状態番号/優勢シ
ンボル記憶部4に設定される。また、このとき、予め定
めておいた全てのコンテクストに共通な初期状態番号
値、たとえば“2”を、状態番号/優勢シンボル記憶部
4に同時に設定する。その後、2度目の文書入力を文字
コード2値化部8に対して開始する。以後の文字文書符
号化手順は、請求項1に係る図1に示す文字符号化部2
0の場合と同様である。
【0094】次いで、文字復号化部21の動作につい
て、図4を用いて説明する。文字文書復号器に送られて
くる最初の符号は、216シンボル分の各コンテクストに
おけるMPS値である。そこで、まず、最初の216シン
ボル分の復号については、状態番号/優勢シンボル記憶
部4の内容を、全てのコンテクストについて状態番号を
“0”、優勢シンボルも“0”と初期設定した状態で、
2値算術復号化が実行される。復号の手順は請求項1に
係る図2に示す文字復号化部21の動作と同様である。
【0095】復号された各コンテクストにおけるMPS
値は、初期MPS値蓄積部12に216シンボルが溜まる
まで蓄積された後、確率推定部1を経由して、状態番号
/優勢シンボル記憶部4に設定される。このとき、予め
定めておいた全てのコンテクストに共通な初期状態番号
値、たとえば“2”を、状態番号/優勢シンボル記憶部
4に同時に設定する。引き続いて、このMPS値と状態
番号を初期値として、続いて送られてくる文字文書を2
値算術復号方式により復号する。この復号の手順も請求
項1に係る図2で説明した文字復号化部21の動作と同
様である。こうして文字文書の圧縮伸長が行われる。
【0096】以上のように、上述した実施例2(請求項
2)においては、符号化を行う文書毎に、第1パスで全
コンテクストのMPS値をまず求めて、そのMPS値を
符号化部と復号化部共通の初期MPS値とし、同時に初
期MPS値が与えられたことを条件として最も圧縮率が
向上する全コンテクストに共通な初期状態番号を符号化
部と復号化部で予め取り決めておくことで、文字文書の
圧縮効率を向上させるとともに、MPS初期値を符号化
部から復号化部に送るに当たっては、MPS値の情報
(MPSテーブル情報)を文字列とみなして2値算術符
号化方式を用いて圧縮して送ることで符号化効率を高め
ることができる。
【0097】実施例3.次に、請求項3に係る文字符号
化部20の実施例を図5に示す。図5において、11
は、請求項2に係る実施例2と同じく、符号化対象の文
書毎に、各コンテクストにおける2値シンボルの出現数
をカウントし、カウントした各コンテクストにおけるM
PS値を検知するとともに、MPSのみが出現する、す
なわち一方のシンボルのみが出現するコンテクストを
「MPSのみ出現し、LPSが出現しないコンテクス
ト」として認識するMPS/LPS検出部であり、その
他の部分は、請求項1に係る図1に示す文字符号化部2
0と同じあるいは同等の部分を示し、8は文字コード2
値化部、5は参照シンボル選択部、6は予測変換処理
部、1は確率推定部、3は確率推定テーブル、4は状態
番号/優勢シンボル記憶部、2は2値算術符号化部であ
る。
【0098】一方、図6は請求項3に係る文字復号化部
21の実施例を示す。図6において、13は2値算術符
号化されて送られてきた各コンテクストについての文字
復号化のための初期MPS値1ビットと、どのコンテク
ストが「MPSのみ出現し、LPSが出現しないコンテ
クスト」であるのかを示す1ビットの、あわせて「2ビ
ット×コンテクスト数」のデータを蓄積する初期化情報
蓄積部であり、その他の図中の部分は請求項1に係る図
2に示す文字復号化部21と同じあるいは同等の部分を
示し、14は2値算術復号化部、9は逆予測変換処理
部、10は2値文字コード変換部、1は確率推定部、3
は確率推定テーブル、4は状態番号/優勢シンボル記憶
部、5は参照シンボル選択部である。
【0099】次に、図5および図6を用いて、請求項3
に係る符号化装置の動作を説明する。まず、図5に示す
文字符号化部20の動作について説明する。本装置にお
いても、請求項2と同じく、符号化しようとする文書を
2度、8の文字コード2値化部に入力する。まず、第1
回目の入力時には、文字コード2値化部8の出力は、M
PS/LPS検出部11と参照シンボル選択部5へと送
られる。
【0100】参照シンボル選択部5では、やはり請求項
2と同じく、符号化対象シンボルの直前の7個以上、例
えば16個の連続するシンボルを参照シンボルとして選
択する。ここで得られた216通りのコンテクストは、文
字コード2値化部8の出力と共にMPS/LPS検出部
11へと送られる。MPS/LPS検出部11では、文
字コード2値化部8の出力である2値シンボルのそれぞ
れについて、各コンテクスト毎に出現回数をカウントす
る。
【0101】今、あるコンテクストについて、シンボル
“0”がi回、シンボル“1”がj回出現したとする
と、 i≦jの時 シンボル“1”をMPSとし i>jの時 シンボル“0”をMPSと定める。 こうして、文書の第1回目の入力により、文書毎のコン
テクストにおけるMPS値が求まる。 また、i>0 かつ j=0の場合 および i=0 かつ j>0の場合 そのコンテクストを「MPSのみ出現し、LPSが出現
しないコンテクスト」であることを認識する。
【0102】MPS/LPS検出部11により検出され
た各コンテクストのMPS値1ビットと「MPSのみ出
現し、LPSが出現しないコンテクスト」であるかを示
す1ビットの合計「2ビット×コンテクスト数」の初期
化情報は、状態番号/優勢シンボル記憶部4の内容を、
全てのコンテクストについて状態番号を“0”、優勢シ
ンボルも“0”と初期設定した状態で、2値算術符号に
かけられる。
【0103】すなわち、上記の手順で求められた各コン
テクストのMPS値216ビットと「MPSのみ出現し、
LPSが出現しないコンテクスト」であるかを示す216
ビットは、参照シンボル選択部5と予測変換処理部6に
入力シンボルとして送られ、2値の算術符号にかけられ
て圧縮された後、文字復号化部21へと送られる。
【0104】また、「2ビット×コンテクスト数」の初
期化情報の符号化が終了した後は、MPS/LPS検出
部11のカウンタ値から求められた各コンテクストにお
けるMPS値は、確率推定部1を経由して、状態番号/
優勢シンボル記憶部4に設定される。
【0105】また、このとき、「MPSのみ出現し、L
PSが出現しないコンテクスト」については「LPSに
対して割り当てられる確率領域幅が最小になる状態番
号」、例えば図10の確率遷移テーブルでは状態番号1
3が状態番号/優勢シンボル記憶部4に同時に設定され
る。その後、2度目の文書入力を文字コード2値化部8
に対して開始する。以後の文字文書符号化手順は、請求
項1の文字符号化部20の場合と同様である。
【0106】次いで、文字復号化部21の動作につい
て、図6を用いて説明する。文字復号化部21に送られ
てくる最初の符号は、「2ビット×コンテクスト数」の
初期化情報である。そこで、ます、最初の「2ビット×
コンテクスト数」の復号については、状態番号/優勢シ
ンボル記憶部4の内容を、全てのコンテクストについて
状態番号を“0”、優勢シンボルも“0”と初期設定し
た状態で、2値算術復号化が実行される。
【0107】復号の手順は請求項1に係る図2で説明し
た文字復号化部21の動作と同様である。復号された各
コンテクストにおけるMPS値と「MPSのみ出現し、
LPSが出現しないコンテクスト」を示す初期化情報
は、初期化情報蓄積部13に216シンボルが溜まるまで
蓄積された後、確率推定部1を経由して、状態番号/優
勢シンボル記憶部4に設定される。このとき、予め定め
ておいた全てのコンテクストに共通な初期状態番号値、
たとえば2ビット×コンテクスト数」の情報が溜まる
まで蓄積された後、各コンテクストのMPS値は確率推
定部1を経由して、状態番号/優勢シンボル記憶部4に
設定される。
【0108】このとき、「MPSのみ出現し、LPSが
出現しないコンテクスト」に対しては、文字符号化部2
0と同じく「LPSに対して割り当てられる確率領域幅
が最小になる状態番号」例えば、図10の確率遷移テー
ブルでは、同じ状態番号13が、状態番号/優勢シンボ
ル記憶部4に同時に設定される。引き続いて、このMP
S値と状態番号を初期値として、続いて送られてくる文
字文書を2値算術復号方式により復号する。この復号の
手順も請求項1で説明した文字復号化部21の動作と同
様である。こうして文字文書の符号化/復号化が行われ
る。
【0109】以上のように、上述した実施例3(請求項
3)においては、符号化を行う文書毎に、第1パスで各
コンテクストにおけるシンボルの出現数をカウントし、
上記請求項2と同様に、各コンテクストのMPS値を求
めるとともに、LPSが出現しないコンテクストを求め
て、そのコンテクストについては、LPSに割り当てら
れる確率領域幅が最小になる状態番号を初期状態番号と
することを符号化部と復号化部とで予め取り決めてお
き、全コンテクストへの初期MPS値の設定と、LPS
が出現しないコンテクストについては「LPSに対して
割り当てられる確率領域幅が最小になる状態番号」の設
定を行った後、符号化および復号化の動作を行うこと
で、文字圧縮率を向上させることができる。
【0110】また、全コンテクストのMPS値と、LP
Sが出現しないコンテクストを符号化部から復号化部に
通知するにあたっては、これらの情報を2値算術符号化
器にて圧縮し、復号化部では、全コンテクストのMPS
値と、LPSが出現しないコンテクストをまず復号し
て、初期MPS値と初期状態番号を設定した後、文字の
復号を行うことにより、符号化効率の向上を実現するこ
とができる。
【0111】実施例4.次に、請求項4に係る文字/画
像符号化装置の符号化部の実施例を図7に示す。図7は
請求項1に係る図1に示す符号化部20について、画像
符号化機能を追加した図である。また、図8は請求項1
に係る図2に示す文字復号化部21について、画像復号
化機能を追加した図である。図7および図8において、
40は上記文字/画像符号化装置の符号化部22と復号
化部23で使用される同じ画像参照シンボル選択部、2
4は符号化部22および復号化部23で、画像データと
文字データのいずれを符号化/復号化するのかを選択す
るための画像/文字データ選択信号である。
【0112】図7で上記画像参照シンボル選択部40、
画像/文字データ選択信号24の他の各部分の構成と動
作は、請求項1に係る実施例1の同一名称、同一番号で
示した符号化部の各部分と同一である。
【0113】次に、符号化部22の動作について図7を
用いて説明する。まず、画像/文字データ選択信号24
から、画像データを符号化するのか文字データを符号化
するのかを選択する指示が入力される。この画像/文字
データ選択信号24の入力により、予測変換処理部6に
入力されるシンボルが選択されるとともに、確率推定部
1に入力されるコンテクストが、文字用の参照シンボル
によるコンテクストか画像用の参照シンボルによるコン
テクストかが選択される。
【0114】次に開始される符号化動作と各部の動作に
ついては、文字データ符号化が選択された場合には、請
求項1に係る実施例1の文字文書符号化装置の動作と同
じ動作を行い、画像データ符号化が選択された場合に
は、例えば、ISO/IEC Committee Draft 11544 “Progre
ssive Bi-level Image Compression"に記載され、従来
技術の例でも示した、lowest resolution layer の符号
化と同じ動作を行う。
【0115】次に図8を用いて、復号化部23の動作を
説明する。上記画像参照シンボル選択部40、画像/文
字データ選択信号24の他の各部分の構成と動作は、請
求項1に係る実施例1の同一名称、同一番号で示した復
号化部の各部分と同一である。まず、画像/文字データ
選択信号24で、画像データを復号するのか文字データ
を復号するのかを選択する指示が入力される。
【0116】この画像/文字データ選択信号24の入力
により、逆予測変換処理部9の出力である復号シンボル
を、「文字データとして出力し、かつ、文字用の参照テ
ーブル選択部5に伝える」か、「画像データとして出力
し、かつ、画像用の参照テーブル選択部40に伝える」
かを選択するとともに、確率推定部1へのコンテクスト
入力を、文字用の参照シンボル選択部5からのコンテク
スト画像用の画像参照シンボル選択部40からのコンテ
クストかを選択する。
【0117】続いて開始される復号化動作と各部の動作
については、文字データ復号化が選択された場合には、
請求項1に係る実施例1の文字文書復号化器の動作と同
じ動作を行い、画像データ復号化が選択された場合に
は、例えばISO/IEC CommitteeDraft 11544 “Progressi
ve Bi-level Image Compression"に記載され、従来技術
の例でも示した、lowest resolution layer の符号化と
同じ動作を行うことで、文字/画像伸長装置を実現す
る。なお、この実施例は実施例1〜3にも同様に実施で
きる。
【0118】以上のように、上述した実施例4(請求項
4)においては、符号化部22では、文字用の参照シン
ボル選択部の出力であるコンテクストと、画像参照シン
ボル選択部の出力であるコンテクストのいずれかを確率
推定部1に続いて伝えるよう選択し、また、予測変換処
理部6への入力シンボル列が文字データか画像データか
を選択することにより、復号化部23では、逆予測変換
処理部9の出力である復号シンボルを、「文字データと
して出力し、かつ、文字用の参照テーブル選択部5に伝
える」かを選択するとともに、確率推定部1へのコンテ
クスト入力を、文字用の参照シンボル選択部5からのコ
ンテクストか画像用の画像参照シンボル選択部40から
のコンテクストかを選択することにより、予測変換処理
部6、確率推定部1、確率推定テーブル3、状態番号/
優勢シンボル記憶部4、2値算術符号化部2、状態番号
/MPS初期値記憶部7、逆予測変換処理部9、2値算
術復号化部14の構成を変更することなく、符号化効率
の高い画像/文字両用の符号化装置を実現できる。
【0119】実施例5.次に、請求項5に係る符号化装
置の構成例を図9に示す。図9において、25はシフト
レジスタ、26はシフトレジスタ内容をラッチするラッ
チ回路、28は確率推定部1が状態番号/優勢シンボル
記憶部4の内容を読み書きするタイミングを示すリード
/ライト信号、27は確率推定部1が次のコンテクスト
を参照シンボル選択部5に要求する次コンテクスト要求
信号である。
【0120】図9を用いて、参照シンボル選択部5とそ
の周辺の部分の動作を説明する。文字圧縮に使用する参
照シンボルとしては、符号化対象シンボルの直前の連続
するm(m≧7)を用いることで、高い圧縮率が実現で
きることから、文字データ入力信号をシフトレジスタ2
5にシンボル単位に入力し、そのシフトレジスタ25の
内容をラッチ回路26によりラッチすることで、参照シ
フトレジスタ選択部5を構成できる。
【0121】このラッチ回路26の出力は、コンテクス
トであり、その出力を状態番号/優勢シンボル記憶部4
の内容を選択するアドレス信号として用いる。確率推定
部1は、状態番号/優先シンボル記憶部4の内容を読み
書きするにあたって、リード/ライト信号28をタイミ
ング信号として出力し、状態番号/優先シンボル記憶部
4の内容を読み書きする。確率推定部1は次のコンテク
ストが必要になった時点で、次コンテクスト要求信号2
7を出力し、シフトレジスタ25をシフトさせると同時
に、ラッチ回路26の内容を更新して、次のコンテクス
トを得る。なお、上記参照シンボル選択部5の構成は符
号化部及び号化部の両者に適用でき、また、この実施
例は実施例1〜4にも適用できる。
【0122】以上のように、上述した実施例5(請求項
5)による構成をとることにより、確率推定部1が状態
番号/優先シンボル記憶部4の内容を読み書きする場合
に、コンテクトを受け取る必要がなく、またシフトレジ
スタ25とラッチ回路26という簡単な構成により、参
照シンボル選択部5を構成できることから、回路規模を
小さくし、高速な符号化を実現することができるという
効果を有する。
【0123】
【発明の効果】以上のように、この発明の請求項1によ
れば、予め符号化対象の複数の文書あるいは復号化対象
の文書を代表する文書を用いて、コンテクスト毎のMP
S値を求めて符号化部と復号化部に初期MPS値として
設定するとともに、各コンテクストにおけるLPSの出
現確率に応じて、各コンテクストの初期状態番号を指定
することにより、確率推定部が各コンテクストにおける
LPSやMPSの出現確率に応じて最適な確率領域幅を
選択するまでに要する学習ステップを削減し、かつ既知
の適用型2値算術符号化器の構成については変更を加え
ることなく、文字文書の圧縮率および符号化効率の向上
を実現することができるという効果を有する。
【0124】また、請求項2によれば、符号化を行う文
書毎に、第1パスで全コンテクストのMPS値をまず求
めて、そのMPS値を符号化部と復号化部共通の初期M
PS値とし、同時に初期MPS値が与えられたことを条
件として最も圧縮率が向上する全コンテクストに共通な
初期状態番号を符号化部と復号化部で予め取り決めてお
くことで、文字文書の圧縮効率を向上させるとともに、
MPS初期値を符号化部から復号化部に送るに当たって
は、MPS値の情報(MPSテーブル情報)を文字列と
みなして2値算術符号化方式を用いて圧縮して送ること
で符号化効率を高めることができる。
【0125】また、請求項3によれば、符号化を行う文
書毎に、第1パスで各コンテクストにおけるシンボルの
出現数をカウントし、上記請求項2と同様に、各コンテ
クストのMPS値を求めるとともに、LPSが出現しな
いコンテクストを求めて、そのコンテクストについて
は、LPSに割り当てられる確率領域幅が最小になる状
態番号を初期状態番号とすることを符号化部と復号化部
とで予め取り決めておき、全コンテクストへの初期MP
S値の設定と、LPSが出現しないコンテクストについ
ては「LPSに対して割り当てられる確率領域幅が最小
になる状態番号」の設定を行った後、符号化および復号
化の動作を行うことで、文字圧縮率を向上させることが
できる。
【0126】また、全コンテクストのMPS値と、LP
Sが出現しないコンテクストを符号化部から復号化部に
通知するにあたっては、これらの情報を2値算術符号化
部にて圧縮し、復号化部では、全コンテクストのMPS
値と、LPSが出現しないコンテクストをまず復号し
て、初期MPS値と初期状態番号を設定した後、文字の
復号を行うことにより、符号化効率の向上を実現するこ
とができる。
【0127】また、請求項4によれば、符号化部では、
文字用の参照シンボル選択部の出力であるコンテクスト
と、画像用参照シンボル選択部の出力であるコンテクス
トのいずれかを確率推定部に伝えるよう選択し、また、
予測変換処理部への入力シンボル列が文字データか画像
データかを選択することにより、復号化部では、逆予測
変換処理部の出力である復号シンボルを、「文字データ
として出力し、かつ、文字用の参照テーブル選択部に伝
える」か、「画像データとして出力し、かつ、画像用の
参照テーブル選択部に伝える」かを選択するとともに、
確率推定部へのコンテクスト入力を、文字用の参照シン
ボル選択部からのコンテクストか画像用の画像参照シン
ボル選択部からのコンテクストかを選択することによ
り、構成の変更を要することなく、符号化効率の高い画
像/文字両用の符号化装置を実現できる。
【0128】さらに、請求項5によれば、確率推定部が
状態番号/優先シンボル記憶部の内容を読み書きする場
合に、コンテクストを受け取る必要がなく、また、シフ
トレジスタとラッチ回路という簡単な構成により、参照
シンボル選択部を構成できることから、回路規模を小さ
くし、高速な符号化を実現することができるという効果
を有する。
【図面の簡単な説明】
【図1】この発明の請求項1に係る2値算術符号化を用
いた文字符号化部の構成図である。
【図2】この発明の請求項1に係る2値算術符号化を用
いた文字復号化部の構成図である。
【図3】この発明の請求項2に係る2値算術符号化を用
いた文字符号化部の構成図である。
【図4】この発明の請求項2に係る2値算術符号化を用
いた文字復号化部の構成図である。
【図5】この発明の請求項3に係る2値算術符号化を用
いた文字符号化部の構成図である。
【図6】この発明の請求項3に係る2値算術符号化を用
いた文字復号化部の構成図である。
【図7】この発明の請求項4に係る2値算術符号化を用
いた文字符号化部の構成図である。
【図8】この発明の請求項4に係る2値算術符号化を用
いた文字復号化部の構成図である。
【図9】この発明の請求項5に係る参照シンボル選択部
の構成図である。
【図10】確率推定テーブルの説明図である。
【図11】従来の2値算術符号化方式を用いた画像符号
化装置の構成図である。
【図12】従来の2値算術復号化方式を用いた画像復号
化装置の構成図である。
【図13】従来の2値算術符号/復号化装置のテンプレ
ート説明図である。
【図14】2値算術符号/復号化装置の条件付き交換処
理および正規化処理の処理内容説明図である。
【図15】2値算術符号/復号化装置の確率領域減算処
理の説明図である。
【図16】2値算術符号/復号化装置のMPSおよびL
PSの発生による状態の遷移モデル説明図である。
【図17】2値算術符号/復号化装置の状態番号/MP
S初期値記憶部の内部論理構成図である。
【図18】2値算術符号化装置のCレジスタ/Aレジス
タの内部構成図である。
【図19】2値算術復号化装置のCレジスタ/Aレジス
タの内部構成図である。
【図20】2値算術符号化/復号化装置のMPSが連続
して発生した場合におけるLPS領域幅が大きい場合の
減算処理及び正規化処理の説明図である。
【図21】2値算術符号化/復号化装置のMPSが連続
して発生した場合におけるLPS領域幅が小さい場合の
減算処理及び正規化処理の説明図である。
【図22】2値算術符号化/復号化装置のLPSが連続
して発生した場合におけるLPS領域幅が大きい場合の
減算処理及び正規化処理の説明図である。
【図23】2値算術符号化/復号化装置のLPSが連続
して発生した場合におけるLPS領域幅が小さい場合の
減算処理及び正規化処理の説明図である。
【図24】従来の2値算術符号化装置の処理手順を示す
フローチャートである。
【図25】従来の2値算術符号化装置の初期化処理手順
を示すフローチャートである。
【図26】従来の2値算術符号化装置の符号化対象シン
ボルによる処理分岐手順を示すフローチャートである。
【図27】従来の2値算術符号化装置の符号化対象シン
がLPSであった場合の符号化処理手順を示すフロ
ーチャートである。
【図28】従来の2値算術符号化装置の符号化対象シン
がMPSであった場合の符号化処理手順を示すフロ
ーチャートである。
【図29】従来の2値算術符号化装置の正規化処理手順
を示すフローチャートである。
【図30】従来の2値算術復号化装置の処理手順を示す
フローチャートである。
【図31】従来の2値算術復号化装置の初期化処理手順
を示すフローチャートである。
【図32】従来の2値算術復号化装置の復号化対象シン
ボルによる処理分岐手順を示すフローチャートである。
【図33】従来の2値算術復号化装置の復号化対象シン
ボルがLPSであった場合の復号化処理手順を示すフロ
ーチャートである。
【図34】従来の2値算術復号化装置の復号化対象シン
ボルがMPSであった場合の復号化処理手順を示すフロ
ーチャートである。
【図35】従来の2値算術復号化装置の正規化処理手順
を示すフローチャートである。
【符号の説明】
1 確率推定部 2 2値算術符号化部 3 確率推定テーブル 4 状態番号/優勢シンボル記憶部 5 参照シンボル選択部 6 予測変換処理部 7 状態番号/MPS初期値記憶部 8 文字コード2値化部 9 逆予測変換処理部 10 2値文字コード変換部 11 MPS/LPS検出部 12 初期MPS値蓄積部 13 初期化情報蓄積部 14 2値算術復号化部 20 文字符号化部 21 文字復号化部 22 符号化部 23 復号化部 24 画像/文字データ選択信号 25 シフトレジスタ 26 ラッチ回路 27 次コンテクスト要求信号 28 リード/ライト信号 40 画像参照シンボル選択部 41 2値シンボル列読み取り部 42 2値シンボル列記憶部
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.6,DB名) H03M 7/40

Claims (5)

    (57)【特許請求の範囲】
  1. 【請求項1】 文字コードを2値のシンボル列とみなし
    て2値のシンボル列から符号化対象シンボルの直前の連
    続する所定個以上の参照シンボルを選択する参照シンボ
    ル選択部と、参照シンボル選択部により選択された参照
    シンボルの個々の値の組み合わせによって生ずるコンテ
    クスト毎に符号化対象シンボルが各コンテクストにおい
    て出現確率が高いと予想されるシンボルと一致すれば優
    勢シンボル(以下、優勢シンボルをMPSという)であ
    ることを、出現確率が高いと予想されるシンボルと一致
    しなければ劣勢シンボル(以下、劣勢シンボルをLPS
    という)であることを示すデータをそれぞれ出力する予
    測変換処理部と、コンテクストの状態を示す状態番号と
    LPSあるいはMPSに割り当てる確率領域幅を対応づ
    けるとともに、状態の遷移が必要となった場合の状態遷
    移先番号を記憶する確率推定テーブルと、各コンテクス
    ト毎に状態番号によって識別し、符号化対象シンボルに
    対する上記予測変換処理部の出力とそのコンテクストと
    を入力とし、上記確率推定テーブルを参照してコンテク
    スト毎の状態遷移を行いながら、LPSあるいはMPS
    に対する確率領域幅を推定し出力する確率推定部と、各
    コンテクストの状態番号とMPS値を記憶する状態番号
    /優勢シンボル記憶部と、上記確率推定部の出力である
    LPSあるいはMPSに対する確率領域幅を用いて符号
    化対象シンボルを演算により符号化する2値算術符号化
    部とを有する文字符号化部を備えると共に、上記文字符
    号化部の2値出力符号を逐次復号し、復号対象シンボル
    がMPSであるかLPSであるかをコード出力する2値
    算術復号化部と、2値算術復号化部の出力コードを符号
    化前の2値シンボル列に変換する逆予測変換処理部と、
    逆予測変換処理部の2値出力シンボル列から上記符号器
    側と同じ参照シンボルを選択する参照シンボル選択部
    と、参照シンボル選択部により選択された参照シンボル
    の個々の値の組み合わせによって生ずるコンテクストと
    2値算術復号化部の出力コードを入力とし、各コンテク
    スト毎に状態番号によって識別し、上記文字符号化部と
    同じ確率推定テーブルを参照することによって、状態遷
    移を行いながら、各コンテクストの各状態についてLP
    SあるいはMPSに割り当てられる確率領域幅を推定し
    出力する確率推定部と、確率推定部の状態番号とMPS
    値を記憶する状態番号/優勢シンボル記憶部とを有し、
    逆予測変換処理部の2値シンボル列を出力とする文字復
    号化部とを備える符号化装置において、符号化を行おう
    とする複数の文書について参照シンボル選択部が選択す
    るのと同じ参照シンボルを用いて各コンテクストにおけ
    るLPSの出現確率p1ps を予め算出し、この時のLP
    Sの出現確率をp1ps とした場合、予め定めた正の整数
    nについて 1 / 2k+2 ≦ p1ps < 1 / 2k+1 を満たす整数k(n>k≧0)を各コンテクスト毎に求
    め、p1ps<1/2n+2の場合にはk=nと選択し、MP
    Sしか発生しないコンテクストであるP1pS =0の場合
    についてはLPSに対して割り当てられる確率領域幅が
    最小になる状態番号をkに設定することによってコンテ
    クストを分類すると共に、各コンテクストにおけるMP
    S値を予め計測して、上記整数kによって分類され、そ
    れに対応づけられた初期状態番号を各コンテクストの状
    態番号に設定すると共に、上記計測したMPS値を優勢
    シンボルの初期MPS値として記憶してなる状態番号/
    MPS初期値記憶部を上記文字符号化部及び文字復号化
    部に備え、符号および復号の開始時に、状態番号/MP
    S初期値記憶部の内容を文字符号化部および文字復号化
    部の状態番号/優勢シンボル記憶部に設定した後、符号
    化および復号化動作をそれぞれ開始することを特徴とし
    た符号化装置。
  2. 【請求項2】 文字コードを2値のシンボル列とみなし
    て2値のシンボル列から符号化対象シンボルの直前の連
    続する所定個以上の参照シンボルを選択する参照シンボ
    ル選択部と、参照シンボル選択部により選択された参照
    シンボルの個々の値の組み合わせによって生ずるコンテ
    クスト毎に符号化対象シンボルが各コンテクストにおい
    て出現確率が高いと予想されるシンボルと一致すれば優
    勢シンボル(以下、優勢シンボルをMPSという)であ
    ることを、出現確率が高いと予想されるシンボルと一致
    しなければ劣勢シンボル(以下、劣勢シンボルをLPS
    という)であることを示すデータをそれぞれ出力する予
    測変換処理部と、コンテクストの状態を示す状態番号と
    LPSあるいはMPSに割り当てる確率領域幅を対応づ
    けるとともに、状態の遷移が必要となった場合の状態遷
    移先番号を記憶する確率推定テーブルと、各コンテクス
    ト毎に状態番号によって識別し、符号化対象シンボルに
    対する上記予測変換処理部の出力とそのコンテクストと
    を入力とし、上記確率推定テーブルを参照してコンテク
    スト毎の状態遷移を行いながら、LPSあるいはMPS
    に対する確率領域幅を推定し出力する確率推定部と、各
    コンテクストの状態番号とMPS値を記憶する状態番号
    /優勢シンボル記憶部と、上記確率推定部の出力である
    LPSあるいはMPSに対する確率領域幅を用いて符号
    化対象シンボルを演算により符号化する2値算術符号化
    部とを有する文字符号化部を備えると共に、上記文字符
    号化部の2値出力符号を逐次復号し、復号対象シンボル
    がMPSであるかLPSであるかをコード出力する2値
    算術復号化部と、2値算術復号化部の出力コードを符号
    化前の2値シンボル列に変換する逆予測変換処理部と、
    逆予測変換処理部の2値出力シンボル列から上記符号器
    側と同じ参照シンボルを選択する参照シンボル選択部
    と、参照シンボル選択部により選択された参照シンボル
    の個々の値の組み合わせによって生ずるコンテクストと
    2値算術復号化部の出力コードを入力とし、各コンテク
    スト毎に状態番号によって識別し、上記文字符号化部と
    同じ確率推定テーブルを参照することによって、状態遷
    移を行いながら、各コンテクストの各状態についてLP
    SあるいはMPSに割り当てられる確率領域幅を推定し
    出力する確率推定部と、確率推定部の状態番号とMPS
    値を記憶する状態番号/優勢シンボル記憶部とを有し、
    逆予測変換処理部の2値シンボル列を出力とする文字復
    号化部とを備える符号化装置において、上記文字符号化
    部に、符号化対象の文書毎に各コンテクストにおける2
    値シンボルの出現数をカウントしてMPS値を求めるM
    PS/LPS検出部を備え、符号化時に上記状態番号/
    優勢シンボル記憶部にmビットの参照シンボルから構成
    されるコンテクスト全てに関する2m 個のMPSをテー
    ブルとしたMPSテーブル情報を生成し、このMPSテ
    ーブル情報をシンボル列と見なして初期値として全ての
    コンテクストにおいて状態番号を“0”、MPS値も
    “0”と設定して符号化を開始し、続く符号化する文字
    情報については、2 m 個のコンテクストについてMPS
    テーブル情報値を状態番号/優勢シンボル記憶部のMP
    S値に設定し、かつ予め復号化部と取り決めた初期状態
    番号を全コンテクストに(同じ番号を)設定した後、符
    号化すると共に、上記文字復号化部に、2値算術符号化
    されて送られてきた文字文書伸長用の全コンテクストに
    ついての初期MPS値の復号した値を蓄積する初期MP
    S値蓄積部を備え、復号化時に、状態番号/優勢シンボ
    ル記憶部の初期値として、全てのコンテクストにおいて
    状態番号を“0”、優勢シンボルも“0”と設定して復
    号化を開始し、MPSテーブル情報の復号データを初期
    MPS値蓄積部に一時蓄積し、MPSテーブル情報の復
    号が終了した時点で、復号されたMPSテーブル情報を
    状態番号/優勢シンボル記憶部のMPS値に設定した
    後、上記予め符号化部と取り決めた初期状態番号を全コ
    ンテクストについて設定して文字情報の復号を開始する
    ことを特徴とする符号化装置。
  3. 【請求項3】 文字コードを2値のシンボル列とみなし
    て2値のシンボル列から符号化対象シンボルの直前の連
    続する所定個以上の参照シンボルを選択する参照シンボ
    ル選択部と、参照シンボル選択部により選択された参照
    シンボルの個々の値の組み合わせによって生ずるコンテ
    クスト毎に符号化対象シンボルが各コンテクストにおい
    て出現確率が高いと予想されるシンボルと一致すれば優
    勢シンボル(以下、優勢シンボルをMPSという)であ
    ることを、出現確率が高いと予想されるシンボルと一致
    しなければ劣勢シンボル(以下、劣勢シンボルをLPS
    という)であることを示すデータをそれぞれ出力する予
    測変換処理部と、コンテクストの状態を示す状態番号と
    LPSあるいはMPSに割り当てる確率領域幅を対応づ
    けるとともに、状態の遷移が必要となった場合の状態遷
    移先番号を記憶する確率推定テーブルと、各コンテクス
    ト毎に状態番号によって識別し、符号化対象シンボルに
    対する上記予測変換処理部の出力とそのコンテクストと
    を入力とし、上記確率推定テーブルを参照してコンテク
    スト毎の状態遷移を行いながら、LPSあるいはMPS
    に対する確率領域幅を推定し出力する確率推定部と、各
    コンテクストの状態番号とMPS値を記憶する状態番号
    /優勢シンボル記憶部と、上記確率推定部の出力である
    LPSあるいはMPSに対する確率領域幅を用いて符号
    化対象シンボルを演算により符号化する2値算術符号化
    部とを有する文字符号化部を備えると共に、上記文字符
    号化部の2値出力符号を逐次復号し、復号対象シンボル
    がMPSであるかLPSであるかをコード出力する2値
    算術復号化部と、2値算術復号化部の出力コードを符号
    化前の2値シンボル列に変換する逆予測変換処理部と、
    逆予測変換処理部の2値出力シンボル列から上記符号器
    側と同じ参照シンボルを選択する参照シンボル選択部
    と、参照シンボル選択部により選択された参照シンボル
    の個々の値の組み合わせによって生ずるコンテクストと
    2値算術復号化部の出力コードを入力とし、各コンテク
    スト毎に状態番号によって識別し、上記文字符号化部と
    同じ確率推定テーブルを参照することによって、状態遷
    移を行いながら、各コンテクストの各状態についてLP
    SあるいはMPSに割り当てられる確率領域幅を推定し
    出力する確率推定部と、確率推定部の状態番号とMPS
    値を記憶する状態番号/優勢シンボル記憶部とを有し、
    逆予測変換処理部の2値シンボル列を出力とする文字復
    号化部とを備える符号化装置において、上記文字符号化
    部に、符号化対象の文書毎に各コンテクストにおける2
    値シンボルの出現数をカウントしてMPS値を求めるM
    PS/LPS検出部を備え、符号化時に、このMPS/
    LPS検出部を用いて各コンテクストのMPS値を示す
    1ビットと「MPSのみが発生し、LPSが発生しな
    い」コンテクストであることを示す1ビットの計2ビッ
    トをコンテクスト情報として求め、mシンボルの参照シ
    ンボルを用いる場合には全部で2m+1 ビットのコンテク
    スト情報を文字情報と見なして状態番号/優勢シンボル
    記憶部の初期値として全てのコンテクストにおいて状態
    番号を“0”、優勢シンボルも“0”と設定して符号化
    を開始し、続く文字情報については、MPS値を状態番
    号/優勢シンボル記憶部に設定し、かつ、「MPSのみ
    が発生し、LPSが発生しない」コンテクストについて
    は、状態番号/優勢シンボル記憶部の状態番号を「LP
    Sに割り当てる確率領域を最小にする状態番号」に設定
    した後、文字符号化を行うと共に、上記文字復号化部
    に、復号した上記2m+1 ビットのコンテクスト情報を蓄
    積する初期化情報蓄積部を備え、状態番号/優勢シンボ
    ル記憶部の初期値として、全てのコンテクストにおいて
    状態番号を“0”、優勢シンボルも“0”と設定して復
    号化を開始し、復号した2m+1 ビットのコンテクスト情
    報を上記初期化情報蓄積部に蓄積し、コンテクスト情報
    の復号が終了した時点で、復号された各コンテクストに
    おけるMPS値を状態番号/優勢シンボル記憶部の優勢
    シンボル値に設定し、かつ、「MPSのみが発生し、L
    PSが発生しない」コンテクストであることがわかった
    コンテクストについては状態番号/優勢シンボル記憶部
    の状態番号を「LPSに割り当てる確率領域を最小にす
    る状態番号」に設定した後、文字情報の復号を行うこと
    を特徴とする符号化装置。
  4. 【請求項4】 文字コードを2値のシンボル列とみなし
    て2値のシンボル列から符号化対象シンボルの直前の連
    続する所定個以上の参照シンボルを選択する参照シンボ
    ル選択部と、参照シンボル選択部により選択された参照
    シンボルの個々の値の組み合わせによって生ずるコンテ
    クスト毎に符号化対象シンボルが各コンテクストにおい
    て出現確率が高いと予想されるシンボルと一致すれば優
    勢シンボル(以下、優勢シンボルをMPSという)であ
    ることを、出現確率が高いと予想されるシンボルと一致
    しなければ劣勢シンボル(以下、劣勢シンボルをLPS
    という)であることを示すデータをそれぞれ出力する予
    測変換処理部と、コンテクストの状態を示す状態番号と
    LPSあるいはMPSに割り当てる確率領域幅を対応づ
    けるとともに、状態の遷移が必要となった場合の状態遷
    移先番号を記憶する確率推定テーブルと、各コンテクス
    ト毎に状態番号によって識別し、符号化対象シンボルに
    対する上記予測変換処理部の出力とそのコンテクストと
    を入力とし、上記確率推定テーブルを参照してコンテク
    スト毎の状態遷移を行いながら、LPSあるいはMPS
    に対する確率領域幅を推定し出力する確率推定部と、各
    コンテクストの状態番号とMPS値を記憶する状態番号
    /優勢シンボル記憶部と、上記確率推定部の出力である
    LPSあるいはMPSに対する確率領域幅を用いて符号
    化対象シンボルを演算により符号化する2値算術符号化
    部とを有する文字符号化部を備えると共に、上記文字符
    号化部の2値出力符号を逐次復号し、復号対象シンボル
    がMPSであるかLPSであるかをコード出力する2値
    算術復号化部と、2値算術復号化部の出力コードを符号
    化前の2値シンボル列に変換する逆予測変換処理部と、
    逆予測変換処理部の2値出力シンボル列から上記符号器
    側と同じ参照シンボルを選択する参照シンボル選択部
    と、参照シンボル選択部により選択された参照シンボル
    の個々の値の組み合わせによって生ずるコンテクストと
    2値算術復号化部の出力コードを入力とし、各コンテク
    スト毎に状態番号によって識別し、上記文字符号化部と
    同じ確率推定テーブルを参照することによって、状態遷
    移を行いながら、各コンテクストの各状態についてLP
    SあるいはMPSに割り当てられる確率領域幅を推定し
    出力する確率推定部と、確率推定部の状態番号とMPS
    値を記憶する状態番号/優勢シンボル記憶部とを有し、
    逆予測変換処理部の2値シンボル列を出力とする文字復
    号化部とを備える符号化装置において、上記文字符号化
    部に画像データ選択信号の入力に基づいて画像の2値シ
    ンボル列から符号化対象シンボルの発生確率を推定する
    ための参照シンボルを取り出す画像参照シンボル選択部
    を備えると共に、上記文字復号化部に、画像データ選択
    信号の入力に基づいて逆予測変換処理部の出力から復号
    対象シンボルのMPS/LPSの確率推定を行うための
    参照ビットを取り出す画像参照シンボル選択部を備えた
    ことを特徴とする符号化装置。
  5. 【請求項5】 文字コードを2値のシンボル列とみなし
    て2値のシンボル列から符号化対象シンボルの直前の連
    続する所定個以上の参照シンボルを選択する参照シンボ
    ル選択部と、参照シンボル選択部により選択された参照
    シンボルの個々の値の組み合わせによって生ずるコンテ
    クスト毎に符号化対象シンボルが各コンテクストにおい
    て出現確率が高いと予想されるシンボルと一致すれば優
    勢シンボル(以下、優勢シンボルをMPSという)であ
    ることを、出現確率が高いと予想されるシンボルと一致
    しなければ劣勢シンボル(以下、劣勢シンボルをLPS
    という)であることを示すデータをそれぞれ出力する予
    測変換処理部と、コンテクストの状態を示す状態番号と
    LPSあるいはMPSに割り当てる確率領域幅を対応づ
    けるとともに、状態の遷移が必要となった場合の状態遷
    移先番号を記憶する確率推定テーブルと、各コンテクス
    ト毎に状態番号によって識別し、符号化対象シンボルに
    対する上記予測変換処理部の出力とそのコンテクストと
    を入力とし、上記確率推定テーブルを参照してコンテク
    スト毎の状態遷移を行いながら、LPSあるいはMPS
    に対する確率領域幅を推定し出力する確率推定部と、各
    コンテクストの状態番号とMPS値を記憶する状態番号
    /優勢シンボル記憶部と、上記確率推定部の出力である
    LPSあるいはMPSに対する確率領域幅を用いて符号
    化対象シンボルを演算により符号化する2値算術符号化
    部とを有する文字符号化部を備えると共に、上記文字符
    号化部の2値出力符号を逐次復号し、復号対象シンボル
    がMPSであるかLPSであるかをコード出力する2値
    算術復号化部と、2値算術復号化部の出力コードを符号
    化前の2値シンボル列に変換する逆予測変換処理部と、
    逆予測変換処理部の2値出力シンボル列から上記符号器
    側と同じ参照シンボルを選択する参照シンボル選択部
    と、参照シンボル選択部により選択された参照シンボル
    の個々の値の組み合わせによって生ずるコンテクストと
    2値算術復号化部の出力コードを入力とし、各コンテク
    スト毎に状態番号によって識別し、上記文字符号化部と
    同じ確率推定テーブルを参照することによって、状態遷
    移を行いながら、各コンテクストの各状態についてLP
    SあるいはMPSに割り当てられる確率領域幅を推定し
    出力する確率推定部と、確率推定部の状態番号とMPS
    値を記憶する状態番号/優勢シンボル記憶部とを有し、
    逆予測変換処理部の2値シンボル列を出力とする文字復
    号化部とを備える符号化装置において、上記文字符号化
    部の上記参照シンボル選択部を、符号化対象ビットの直
    前の連続するmビットを参照ビットとして取り出すシフ
    トレジスタと、このシフトレジスタの内容をアドレス信
    号として上記状態番号/優勢シンボル記憶部内のコンテ
    クストに対応した領域を選択するためのラッチ回路とで
    構成し、かつ上記アドレス線により指定された状態番号
    /優勢シンボル記憶部内の特定アドレス内容を確率推定
    部から読み書きするためのリード/ライト信号線と、確
    率推定部からシフトレジスタ部へデータのシフトタイミ
    ングを知らせる次コンテクスト要求信号線とを備えると
    共に、上記文字復号化部の上記参照シンボル選択部を、
    復号対象シンボル直前の連続するmビットを参照シンボ
    ルとして取り出すシフトレジスタと、このシフトレジス
    タの内容をアドレス信号として出力するためのラッチ回
    路とで構成し、かつ上記アドレス線により指定された状
    態番号/優勢シンボル記憶部内の特定アドレス内容を確
    率推定部から読み書きするためのリード/ライト信号線
    と、確率推定部からシフトレジスタ部へデータのシフト
    タイミングを知らせる次コンテクスト要求信号線とを備
    えたことを特徴とする符号化装置。
JP10311692A 1992-04-22 1992-04-22 符号化装置 Expired - Fee Related JP2891818B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10311692A JP2891818B2 (ja) 1992-04-22 1992-04-22 符号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10311692A JP2891818B2 (ja) 1992-04-22 1992-04-22 符号化装置

Publications (2)

Publication Number Publication Date
JPH05298063A JPH05298063A (ja) 1993-11-12
JP2891818B2 true JP2891818B2 (ja) 1999-05-17

Family

ID=14345626

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10311692A Expired - Fee Related JP2891818B2 (ja) 1992-04-22 1992-04-22 符号化装置

Country Status (1)

Country Link
JP (1) JP2891818B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3139460B2 (ja) 1998-07-07 2001-02-26 日本電気株式会社 2値文書画像の符号化方法および符号化装置
PT3468045T (pt) * 2002-09-20 2022-05-31 Ntt Docomo Inc Método e aparelho para codificação aritmética

Also Published As

Publication number Publication date
JPH05298063A (ja) 1993-11-12

Similar Documents

Publication Publication Date Title
US6031938A (en) Image encoding apparatus with selective Markov and predictive coding
EP0776569B1 (en) Method and system for encoding and decoding image data
JP2000115783A (ja) 復号化装置及び方法
JP3684128B2 (ja) 算術符号化/復号化方法ならびに算術符号化/復号化装置
JP3872217B2 (ja) ディザ画像の2値表現処理方法、ディザ画像の圧縮2値表現圧縮解除方法、及びディザ画像の圧縮及び圧縮解除システム
US20020006225A1 (en) Encoding apparatus, decoding apparatus, encoding/decoding apparatus, encoding method and decoding method
US5960117A (en) Method of adaptive arithmetic encoding/decoding according to JBIG standard
JP2891818B2 (ja) 符号化装置
US20080025620A1 (en) Data compression apparatus and data compressing program storage medium
CN112449201B (zh) 解码方法、编码方法、相应的装置、电子设备及存储介质
CN112449186B (zh) 编码方法、解码方法、相应的装置、电子设备及存储介质
US6553144B1 (en) Coding method and coding apparatus for bi-level document image
JP3855376B2 (ja) 画像符号化装置
JP2003189108A (ja) 画像圧縮方法
JP3342380B2 (ja) 符号化及び復号装置とそれを適用した画像処理装置
JP3232533B2 (ja) 画像符号化装置、画像復号化装置、及び画像符号化・復号化装置
JP3223118B2 (ja) 画像符号化装置、画像復号化装置、及び画像符号化・復号化装置
JP3084187B2 (ja) 2値画像符号化装置及び2値画像復号化装置
JP3673630B2 (ja) 符号化方法
JPH0591343A (ja) 2値データ符号化方法及びその復号化方法
JP6569242B2 (ja) 画像処理装置、画像処理システム及び画像処理プログラム
JPH0575874A (ja) 2値データ符号化方法及びその復号化方法
JPS60251763A (ja) フアクシミリ情報の拡大縮小回路
JPH06152988A (ja) 可変長符号の復号化装置
JP3705771B2 (ja) Jbig復号化方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080226

Year of fee payment: 9

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090226

Year of fee payment: 10

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100226

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees