JP2800880B2

JP2800880B2 - 高速復号算術符号化装置

Info

Publication number: JP2800880B2
Application number: JP6288285A
Authority: JP
Inventors: グレン・ジョージ・ラングドン・ジュニア; アハマド・ザンディー
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 1994-01-03
Filing date: 1994-11-22
Publication date: 1998-09-21
Anticipated expiration: 2013-09-21
Also published as: JPH07221653A; EP0661668A2; US5546080A; EP0661668A3

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、コンピュータ・システ
ムにおけるデータ保存と圧縮の方法に関し、より詳しく
は、圧縮された記録の分類順序を維持しながら、圧縮に
関する理論的限界に近づくための、容易に実施できる高
速復号算術符号化装置に関する。

【０００２】

【従来の技術】データ圧縮符号化とは、一連のデータを
「圧縮された」形式（すなわち、より少ないビット総数
を含む形式）に変換するプロセスをいい、その圧縮され
た形式から、元の形またはその近似形を後で再構築する
ことができる。圧縮された（または符号化された）デー
タをその後に圧縮解除して元の形式に戻すことができる
場合に、「可逆性の」または「損失のない」データ圧縮
が達成される。圧縮解除されたデータが、ある忠実度の
評価基準を満足することにより、元のデータの本質を保
存するという条件で、「損失のある」データ圧縮は、圧
縮解除されたデータを元の形から変化させてしまう。記
憶コストは急激に低下し続けているが、有効なデータ圧
縮技術を使用すると、所望の性能を維持しながら、必要
な記憶空間がさらに減少するはずである。さらに、通信
帯域幅の制限が課されているものとすれば、圧縮形式の
データが能率良く伝送でき、通信チャネルを利用する様
々な情報主体の適用業務で大きな利点がもたらされる。

【０００３】データ圧縮符号化のシステムまたは方法の
２つの望ましい特質は、高い圧縮効率と辞書的順序の維
持である。しかし、これらの特質は、互いに排他的な傾
向があり、あるいは、トレードオフを必要としてきた。
この分野でなされてきた仕事の大半は、高い圧縮効率と
辞書的順序の維持の両方を実現するという目標を追求す
るものであった。

【０００４】データ圧縮プロセスは、２つの部分、すな
わちモデル化と符号化に分けることができる。モデル化
タスクでは、記号が多くの文脈や条件で現れ、文脈また
は条件に応じてアルファベットの各記号に確率が割り当
てられる。したがって、モデルは、文脈依存確率分布の
集合体である。その分布の統計モデルは、相対頻度の仮
度数分布図に基づいていることが多い。

【０００５】符号化タスク（符号化と復号の両方を含
む）では、これらの確率が、一連のビットに翻訳され、
またその逆が行われる。参照により本明細書に組み込ま
れた、J. リッサネン（Rissanen）と G.G. ラングドン
（Langdon）の論文 "UniversalModeling and Coding,"
IEEE Transactions on Information Theory, Vol. IT-2
7, pp. 12-23(January 1981)を参照されたい。

【０００６】確率と符号の関係は、シャノン（Shanno
n）の論文 "A Mathematical Theory of Communicatio
n," Bell Syst. Tech. Journal, Vol. 27, pp. 398-40
3, (July1948)で、初めて確立された。この文献では、
確率ｐで現れることが期待される記号は、対数の底を２
として、−log ｐビットで表すのが最良であることが示
されている。したがって、より高い確率を持つ記号は、
より少ないビット数で符号化され、確率のより低い記号
は、符号化のためにより多くのビット数を必要とする。
記号の発生確率によって重み付けされた全ての可能な記
号の符号長を平均することにより、期待される符号長が
得られる。シャノンは、この着想を数学的に

【数１】Ｈ＝−Σｐ_ilogｐ_i で表現している。これは、確率分布のエントロピーと呼
ばれている。１つの記号の発生確率が１であり、他のす
べての記号ではゼロである場合、その符号化方式のエン
トロピーはゼロである。発生確率が全記号で等しい場合
に、エントロピーは最大になる。

【０００７】シャノンの符号化定理によれば、エントロ
ピーは、圧縮の下限を課している。言い換えると、エン
トロピーは、符号化されたメッセージに必要な１文字当
たりの平均ビット数の最小値を確立する。所与の各分布
ごとに、制限的性能、すなわちエントロピーが所望の確
度で達成できる符号の設計技術が存在する。この高圧縮
効率符号には、古典的ハフマン符号とより新しい柔軟な
算術符号化がある。データ圧縮符号のその他の所望の特
質には、以下に詳述するように辞書的順序の維持、高速
の符号化と復号、および実施の容易さが含まれる。

【０００８】典型的なハフマン符号化方式では、アルフ
ァベットの各記号をバイナリ・ツリーの葉に関連づけ
る。最初、それらの記号は、確率の順番にリストされ
る。そのツリーの構築は、最初の１対の兄弟節点とし
て、最低の確率を持つ２つの記号を選ぶことから始ま
る。その後、それらの親としての中間節点が生成され、
その親節点からの一方の子節点の枝が１とラベルされ、
一方、他の枝はゼロとラベルされる。２つの最低確率と
それに関連する節点が、２つの確率の和を持つ親節点で
置換される。アルファベットの全記号がこのプロセスに
含まれるまで、このプロセスが繰り返される。ハフマン
符号化は、その性能が圧縮の理論的下限に非常に近いと
いう意味で、非常に効率的である。実際、入力確率が２
の負の累乗である場合、その限界が達成される。R.G.
ガラガー（Gallager）の論文 "Variationson a theme b
y Huffman," IEEE Trans. Inform. Theory, Vol. IT-2
6, pp. 668-674(Nov. 1978)を参照されたい。

【０００９】ハフマン符号化は、よく知られているにも
かかわらず、統計モデル、すなわち記号の確率分布が変
化する度に、新しい１組の符号を計算しなければならな
いので、最適のモデル化および符号化とは言えない。

【００１０】ハフマン符号化の別の主な欠点は、圧縮レ
コード中で記号の順序を維持できないことである。符号
化されるデータの性質等の要素に応じて、様々な順序配
置が維持されることが望ましい。例えば、データは、記
号集合の等価アルファベット順に基づいて辞書的順序に
分類される。符号化されたデータで辞書的順序を維持す
ると、その所望のデータ項目へのアクセスと復号が容易
になる。

【００１１】レコードの辞書的順序を維持するための１
つの手法は、いわゆるアルファベット順の符号化を採用
することであり、原始レコードの順序がその２進符号の
番号順として保存される。例えば、E.N. ギルバート（G
ilbert）と E.F. モア（Moore）の論文 "Variable-leng
th binary encodings,", Bell System Technical J.,Vo
l. 38, pp. 933-967(July 1959)を参照されたい。所与
のアルファベットと所与の確率分布（アルファベットの
各構成要素に割り当てられた確率値の集合）について、
符号語の符号（または辞書）が構築され、符号語がアル
ファベットの構成要素のアルファベット順にリストされ
る。

【００１２】ギルバート・モア符号は、接頭辞の特徴を
持つ。すなわち、符号中の符号語はどれも、同じ符号中
の他の符号語の接頭辞ではなく、アルファベットの諸記
号から成る単語の分類順序を維持しない。復号の際に、
次の符号語を見るとすぐに、接頭辞特性により、次の符
号化された項目の明確な復号が保証される。残念なが
ら、所与のモデルについて、ギルバート・モア符号の分
類順序は、圧縮効率を犠牲にして維持される。すなわ
ち、ギルバート・モア符号は、一般的にハフマン符号よ
り効率が悪い。

【００１３】ハフマン符号に対する高速復号に関して、
米国特許第3883847号は、素早い復号のために、記憶さ
れた表を使って記憶域に１回または２回アクセスする方
法を開示している。

【００１４】ハフマン符号とは対照的に、算術符号化
は、文字列が処理されるときに、記号に対する確率分布
または符号の割当てが更新される適応モデルも含めて、
どのようなモデルにも適用できる。典型的な１クラスの
算術符号は確率に基づく、または積（乗算が使われる）
に基づく符号であり、参照により本明細書に合体される
G.G. ラングドンの論文 "An introduction to arithmet
ic coding," IBM J. Res. Develop., Vol. 28, No. 2,
pp. 135-149(March 1984)で「Ｐベースの算術符号」と
呼ばれる。典型的な算術符号化器は、数字列上の固定し
た間隔をそれぞれの記号と対応する小間隔に分割する。
辞書的順序は、小間隔を数字列上で記号の辞書的順序に
対応する順序に配置することによって維持される。小間
隔の長さは、対応する記号の確率、または推定確率（相
対頻度）に比例している。

【００１５】現在の間隔が再分割された後、符号化され
る実際の記号に対応する小間隔が、新しい現間隔として
選択される。

【００１６】この分割と選択のプロセスは、記号の確
率、間隔の長さ、および間隔の終了点の座標で表した数
字列上の点の座標計算を含む。

【００１７】記号列を符号化するために、上記のプロセ
スが、後続の各記号について繰り返される。毎回前の繰
り返しからの小間隔を次の繰り返しのための開始間隔と
して使用しながら、このような割当てと選択のプロセス
を繰り返す。

【００１８】ラングドンが開示した上記のＰベースの算
術符号では、後続の各記号を符号化するために、小間隔
を次のレベルの小間隔に分割する反復プロセスは、累積
的に多くの乗算ステップを含む。したがって、高い計算
効率が符号化プロセスにおいて望ましい。その例を、以
下に少し詳しく示す。

【００１９】上記のラングドンの文献に記載されている
ように、符号化および復号の間、所与の記号に関連する
小間隔は、次の３つの識別方法のうちの任意の１つの方
法で識別できる。（ＩＭ１）両方の終了点（Ｃ_loからＣ_hi）。（ＩＭ２）左側の終了点Ｃ_loと小間隔の幅Ａ。（ＩＭ３）右側の終了点Ｃ_hiと小間隔の幅Ａ。第２の識別法ＩＭ２は、多くのＰベースの算術符号で使
用される。

【００２０】算術符号化器は、２つのレジスタ、Ｃレジ
スタとＡレジスタを含むことがしばしばある。特記して
いない場合、以後の考察では、小間隔を識別するために
ＩＭ２を使用する場合に焦点を置き、その際に、Ｃレジ
スタは入力記号に対応する小間隔の左側終了点Ｃ_loを識
別し、一方、Ａレジスタは入力記号の確率に対応する小
間隔の幅Ａを含むものとする。

【００２１】図１は、Ａとラベルした間隔が、４記号ア
ルファベットの４つの記号ｗ、ｘ、ｙ、ｚの間で再分割
される。Ａレジスタの値、すなわち現間隔の幅は、「符
号空間」と定義される。その記号の仮の確率を、それぞ
れｐ（ｗ）、ｐ（ｘ）、ｐ（ｙ）、ｐ（ｚ）とする。記
号ｙに割り当てられた符号空間の部分は、新間隔幅（ま
たは新しい符号空間）と現間隔幅（または古い符号空
間）の比率である。Ｐベースの符号では、その比率が、
ｐ（ｙ）に比例する。「区切り点」、すなわち現間隔内
の小間隔の境界を定める点も、左右の終了点に対するそ
れらの位置によって識別される。

【００２２】初期の間隔幅は通常、Ｃ_loが0.0、Ｃ_hiが
1.0になるように正規化される。例えば、固定小数点算
術（すなわち、32ビットのレジスタで）を使用し、固定
小数点レジスタの整数値2¹⁵= 32,768を値1.0として扱
うことができる。その後の符号化（または復号）プロセ
スで間隔値Ａがさらに再分割されるとき、関係式Ｃ_lo＋
Ａ＝Ｃ_hiが満足される限り、そのような符号は、位取り
因数（すなわち、32,768）または初期の幅もしくは範囲
に加算された任意の定数とは独立に動作する。

【００２３】さらにこのプロセスを例示するために、記
号ｙは、間隔Ａを４つの記号ｗ、ｘ、ｙ、ｚ用の４つの
小間隔に再分割し、三つの識別法に従って終了点または
小間隔の幅によって記号ｙの小間隔を指定することによ
り、符号化されるものと仮定する。下記の表１に、前記
の三つの識別法について新しい間隔の新しい記述値を古
い（すなわち、現在の）間隔によって示す。

【００２４】

【表１】

【００２５】すなわち、符号化操作において、Ｃレジス
タとＡレジスタの値は、乗算、シフト、および大小比較
を含む一対の再帰式に従って反復計算される。復号操作
は、符号化の反復を繰り返し「元に戻す」。多数の大小
比較や乗算も、復号プロセスに含まれる。辞書的順序付
けが、記号の順序付けと同じように維持される場合、大
きさの順序が各繰返しで辞書的順序に対応するように、
記号が数字列上に写像されるので、圧縮された記録の分
類順序は維持される。この方法は、辞書的順序付けを維
持し、かつ高い圧縮効率も達成するので好都合である。
しかし、計算が必要なので、計算効率は低く、実施が困
難である。

【００２６】さらに算術符号を例示するために、被加数
に基づく（またはＡベースの）符号を考察する。この符
号は、G.G. ラングドンと J.リッサネンの論文 "A Simp
le General Binary Source Code," IEEE Trans, Vol. I
T-28, pp. 800-803(1982)に初めて現れた。Ａベースの
符号に関する一般的な参照については、G.G. ラングド
ンの論文 "Augend-Based Arithmetic Codes and the Go
lomb Code," IBM Research Report RJ 7844, IBM Almad
en Research Center, San Jose, California(November
1990)を参照されたい。これらの論文を、参照により本
明細書に組み込む。

【００２７】ラングドンとリッサネンの論文で、Ａレジ
スタ値と確率を含んだ乗算は、最も確率の高い記号（Ｍ
ＰＳ）に対するものは除いて、積の近似値で置換され
る。この近似により、幾つかの計算の必要がなくなる。

【００２８】Ａベースの符号を使う第２の手法は、K.
モヒーウッディーン（Mohiuddin）とJ. リッサネンの "
Multiplication-Free Multi-Alphabet Arithmetic Cod
e,"と題する米国特許第4652856号と、J. リッサネンと
K. モヒーウッディーンの論文 "Multiplication-Free M
ulti-Alphabet Arithmetic Codes,"IEEE Trans. Comm.,
V. 37, pp. 93-98(Feb. 1989)に見られる。この両方を
参照により本明細書に組み込む。

【００２９】米国特許第4652856号では、ｍ元アルファ
ベットの諸記号｛1,...,ｉ,...,ｍ｝が、まず確率が増
加する算術符号化の順序でリストされ、この順序の右端
の記号ｍがＭＰＳである。米国特許第4652856号におけ
るＡレジスタ値（Ａとも呼ばれる）は、特別な理由で、
左側閉で右側開の間隔[0.75,1.5)に制限されている。こ
の間隔に厳格に固執すると、計算が複雑になる。実際
は、さらに２つの複雑な比較によって、再正規化点が値
Ｕとなり得るので、Ａレジスタは範囲[Ｕ,2Ｕ)にある。
しかし、Ａの再正規化点を1.0に選ぶとＡレジスタ値が
範囲[1.0,2.0)に制限されるので好都合である。

【００３０】上限は下限よりＫビット多いので、下限が
最低の許容確率を表すのに十分な精度を与える限り、表
１の方法ＩＭ１をそれほど多く使わずに再正規化する技
術では通常、Ｋを１より大きい整数として、間隔幅上の
上限が下限の2^K倍である範囲を選択することを留意され
たい。Ａが1.0に制限されると、整数長の場合となる。
全ての符号化確率は、２の負の累乗（1/2、1/4、1/8
等）となる。整数長算術符号は、分数長を含まず、ラン
グドンの前記論文 "Introduction to Arithmetic Codin
g" に記載されている、Ｌベースの符号の特別な構成要
素を表す。

【００３１】図２と図３を参照すると、記号ｙが右端の
記号であり、ＩＭ２は間隔を識別するために使用されて
いる。他の記号ｉは、A・ｐ（ｉ）を最高の符号化効率
のために記号ｉに割り当てられる符号空間とすると、値
Ａ・ｐ（ｉ）に対する「拡大」近似値によって表され
る。記号ｉに実際に割り当てられた近似値は、被加数Ａ
ｇ（ｉ）（代わりにＧｉと呼ばれる）と呼ばれ、数式Ａ
ｇ（ｉ）

【数２】Ａ・ｐ（ｉ）によって与えられる。

【００３２】図２は、最小符号空間（すなわち、Ａの最
小値）の例であり、ここでＡ＝1.0である。記号ｙに割
り当てられた符号空間は「使い残り」であり、すなわち
符号空間の後に残る空間は、他の記号に割り当てられて
いる。記号ｗ、ｘ、ｙ、ｚから成る４記号アルファベッ
トについて、記号ｙに割り当てられた使い残しの符号空
間は、数式Ａ−[Ａｇ（ｗ）＋Ａｇ（ｘ）＋Ａｇ（ｚ）]
で与えられ、より低い確率の他の記号に割り当てられた
符号空間より必ずしも大きくない。新しい現在幅Ａが符
号化の間に1.0未満に低下すると、Ａ≧1.0になるまで、
Ａに２を掛け、Ｃに２を掛けて、その間隔が、1.0と2.0
の間の値になるように再調整（再正規化）される。すな
わち、図３において、Ａが1.0と2.0の間の値に再正規化
されたので、ｙに対するより大きな符号空間が得られ
る。ただし、数字列上の最右端にＭＰＳを置くと、記号
の辞書的順序が失われることになる。

【００３３】米国特許第4652856号で、ｍ元アルファベ
ットについてｉ＝0,1,,...,ｍ-1とすると、記号ｉの符
号化にはＣレジスタとＡレジスタを使用し、これら両レ
ジスタは、最左端の点（Ｃ_lo）と小間隔幅Ａにより小間
隔を識別する。記号ｉの確率ｐ(ｉ)に対応する加数値Ａ
ｄ(ｉ)が計算され、Ａレジスタに記憶される。前記の順
序付け、すなわち、

【数３】で、より確率の低い記号の累積確率に対応する被加数Ａ
ｇ（ｉ）も計算される。各サイクル・タイム毎に、Ｃレ
ジスタで計算が行われ、その際には、入力記号ｉに対す
る被加数Ａｇ（ｉ）が、現在の符号列の作業終端に加え
られる。ラングドンの上記論文 "Introduction to Arit
hmetic Coding"に従って、作業終端は、Ａレジスタと同
じ精度に対応する最下位ビットと定義される。

【００３４】一方、記号ｉがＭＰＳでない場合は、Ａレ
ジスタは、記号ｉに対応する新しい値のＡｄ（ｉ）を採
用し、この場合は、現在のＡレジスタ値からＭＰＳの被
加数値を引いた値がＡレジスタの新しい値になる。この
新しいＡレジスタ値は、再正規化され、妥当な量だけシ
フトされる。符号列の作成のために、Ｃレジスタも左側
への同数の再正規化シフトを受けなければならず、ゼロ
値のビットが右側から入力される。Ｃレジスタからの左
シフト・ビットが、その符号化器からの新しい符号列ビ
ットとなる。このようにして、Ａレジスタ・ビットは、
Ｃレジスタの最下位ビットに対応し続ける。

【００３５】モヒーウッディーンとリッサネンの技術の
復号プロセスは、積の近似値Ａｇ（ｉ）＝Ａｐ（ｉ）と
して被加数を使用することにより、乗算を回避してい
る。しかし、計算の削減にも係わらず、この技術は、や
はり低速または複雑である。例えば、２５６個の記号を
含む８ビット・アルファベットが与えられている場合、
復号器は、Ａｇ（ｉ）がＣレジスタ値以下で、Ａｇ（ｉ
＋1）がＣレジスタ値より大きいという記号ｉを見つけ
なければならない。すなわち、復号を１サイクル・タイ
ムで完了しなければならない場合には、復号器は、被加
数とＣレジスタ値の同時比較を、２５６回（すなわち、
２５６個の比較器を使用して）実行しなければならな
い。したがって、実施が困難であり複雑である。

【００３６】

【発明が解決しようとする課題】したがって、本発明の
目的は、従来の方法やシステムで得られなかった高速の
符号化および復号速度、高い圧縮効率、辞書的順序の維
持、および簡単な実施を併せて達成する、効率が高く、
順序を維持する符号化技術を提供することにある。

【００３７】本発明は、（１）前記のモヒーウッディー
ンとリッサネンの技術の性能に匹敵する圧縮性能を達成
し、（２）圧縮された記録と圧縮解除された記録の分類
順序を維持し、かつ、（３）最も大切なことであるが、
記録の回復のための高速な復号技術を提供する、新しい
算術符号化法および装置を含む。本発明は、整数長ケー
スと呼ばれるＡ＝1.0のケースでも、ギルバートとモア
のアルファベット符号に勝る符号化効率で動作する。

【００３８】

【課題を解決するための手段】本発明によれば、ｍ元ア
ルファベットの確率が、最も近い1/2の累乗に近似され
て、整数記号符号長になる。これらの符号長は、Ａベー
スの算術符号化器で被加数が使用されたのと類似の方法
で、整数長算術符号化器で使用される。

【００３９】この近似によって符号化効率は犠牲になる
が、その損失は、通常非常に小さく、アルファベットが
非常に大きくて、各記号の確率が小さくなる場合には特
に小さい。従来技術の制限長ハフマン符号と比較して、
この整数長算術符号化器は、効率的であるばかりでな
く、分類順序の維持という利点も備えている。整数長算
術符号化器の他の利点は、その実施が上記のＡベースの
算術符号化器よりもさらに簡単なことである。

【００４０】本発明の特定の実施例で、整数長算術符号
化器は、Ｃレジスタ、論理演算装置（ＡＬＵ）、および
記号符号長参照表を含む記憶装置を備える。ｍ元アルフ
ァベットの記号に割り当てられた累積確率（または被加
数Ａｇ（ｉ）またはＧi）に基づく参照表を備え、被加
数に基づく（Ａベースの）算術符号化器が構築される。

【００４１】符号化プロセスで、論理演算装置（ＡＬ
Ｕ）が符号列を反復的に構築し、その符号列をＣレジス
タに記憶する。反復復号プロセスで、ＡＬＵは、符号長
表の中の最大の被加数をＣレジスタから引いてＣレジス
タに正の値を残し、Ｃレジスタ値を妥当な量だけシフト
し、この最大の被加数に対応する記号を復号された記号
として送り出す。

【００４２】本発明の整数長の特徴は、従来の算術符号
化器の実施よりも容易である。その理由の１つは、従来
の算術符号化器に対応するＡレジスタが常に1.0であ
り、したがってＡレジスタが不要なことである。

【００４３】

【実施例】本発明は、多数の形で実施できるが、特定の
実施例を開示する。ただし、この開示によって本発明が
以下に例示する実施例に限定されるものではないことを
理解されたい。

【００４４】整数長算術符号化器本発明によれば、ｍ元アルファベット｛1,...,ｉ,...,
ｍ｝について、効率的で、順序を維持し、高速で復号
し、実施の容易な、整数長算術符号化器が構築される。

【００４５】まず、アルファベットの諸記号（または、
より一般的には、一連の記号等の「事象」）の確率ｐ_i
が、ハフマンの周知のアルゴリズムで得られる１組の符
号語に対する基礎として使用され、その結果、整数の記
号符号語長ｌ_iがビット単位で測定される。符号語長
は、より一般的には、シャノンの命名法に従って、自己
情報と呼ばれる。定義により、符号化確率ｐ_iは、記号
ｉについて、2^-liであり、ｌ_i＝−log₂ｐ_iである。

【００４６】２の負の累乗に近似すると、符号化効率が
犠牲になるが、その損失は、通常非常に小さく、特にア
ルファベットが非常に大きく、最も確率の高い記号の確
率が相対的に小さい場合には、特に小さい。ギルバート
・モア符号のような従来技術の分類順序維持の接頭辞符
号と比較して、本発明の整数符号長に基づく算術符号化
器は、どの接頭辞ハフマン符号とも同等に効率的であ
り、さらに、分類順序の維持という利点を備えている。
すなわち、ギルバート・モア符号の欠陥を克服してい
る。

【００４７】さらに、以下で明白になるように、整数符
号長を使用すると、Ｃレジスタを使用する繰返しにおけ
る任意の乗算の代わりに、シフトを使うことが可能にな
る。この結果、整数長でない算術符号に比べて実施が簡
単になり、単なる乗算の回避よりも多くの面で有利とな
った。

【００４８】図５を参照すると、本発明による復号プロ
セスは、下記のように進行する。従来技術のＬベースの
算術符号化法に関係するものと本質的に似た形で、復号
すべき符号列が記号列から符号化された。すなわち、記
号（または事象）が、辞書的順序で確率表にリストされ
る。累積確率は、被加数として使用される。本発明の整
数長態様によれば、各記号の符号化確率ｐ_jは２の負の
累乗なので、２進化分数確率または加数は、0.00...01
の形式であり、すなわち、２進小数点の後にゼロ個、１
個または２個以上のゼロから続き、その後に１個の１が
続くものである。被加数の欄が上記の記号表に追加さ
れ、被加数Ｇ_iは、

【数４】で与えられる。

【００４９】例示的な４記号アルファベットについて、
４記号アルファベットに対する被加数表の例が図６に示
されている。この表は、アルファベットの記号の１つに
対応する指標値を与えることによってアクセスされる。
各指標値について、記号、その確率ｐ_i、被加数Ｇ_i、お
よび符号長ｌ_iが提供される。長さは、整数長ケースの
確率を暗示するので、ここの確率は記述の目的で示され
ている。

【００５０】記号ｉを符号化するためには、符号化器
は、Ｃレジスタ内にある符号列Ｃの活動終端にＧ_iを単
に加え、Ｃレジスタ値をｌ_iビットだけ左にシフトす
る。すなわち、符号化動作に乗算ステップは必要でな
い。さらに、記号列を表す符号列は、符号化処理後も、
符号化の前の記号列と同じ分類順序になっている。

【００５１】整数長算術符号の場合、復号器は、Ｃレジ
スタの単位位置を必要としない。一般的な場合、ラング
ドンの"Introduction to Arithmetic Coding."に記載さ
れている、いわゆる「桁あふれ」の問題を処理しなけれ
ばならない。ある種の符号では、次の記号の復号に進む
前に、復号器側が、入力符号列またはＣレジスタあるい
はその両方の調整をしなければならない。復号器のこの
実施例では、Ａレジスタの大きさが、1.00...0から1.1
1...1まで変化し、Ｌ個の分数ビットが含まれていると
仮定している。すなわち、Ｌ＝４なら、正規化されたＡ
レジスタは、1.0000から1.1111までの値を記憶できる。
復号の準備が整うと、Ｌ＝４の場合、Ｃレジスタは、1.
0000から1.1111までの値を保持できると仮定する。

【００５２】復号プロセスは、Ｃレジスタに対して逆参
照表を使用すると、都合良く実行される。この例では、
図７は、図６の参照表に対応する逆参照表を示す。

【００５３】未知の記号ｉを復号する場合を考える。図
５の流れ図を参照すると、ステップ２において、ｉより
前に符号化された記号は、既に復号されていて、それら
の対応する被加数がＣレジスタから差し引かれており、
それらの対応する相対シフトが適切に考慮されているも
のと仮定する。これらの動作の結果、現在の符号列Ｃの
最大の被加数が、復号すべき現在の記号ｉによるものと
なる。そのＣレジスタの符号列が、図５のステップ２で
参照される。

【００５４】図７に示される逆参照表は、現在のＣレジ
スタ値Ｃが、適切な記号の復号のためのインデックスま
たは記憶アドレスとして使用できるように、図６の被加
数表から構築されている。Ｊがアドレスであるかあるい
は基底アドレスに対するオフセットである実施例では、
Ｊに対する２進小数点は不要である。可能な各インデッ
クス値について、適切な復号された記号が現在のＣレジ
スタ値から被加数を差し引いた後のＣレジスタ値とシフ
ト量（またはカウント）と共に与えられる。参照表のア
ドレスは、インデックス・ビット数に基づいて、ゼロか
らＣレジスタによって許される最大値まで付けるのが好
都合である。２進数として表されたインデックスのビッ
ト数はＬ＋1であり、ここでＬは、任意の記号に対する
最大の符号長ｌ_iである。

【００５５】復号は、逆参照表を参照して、直接的な方
法で実行される。インデックスｊは、符号列Ｃの最上位
ビットから得られ（ステップ２）、ステップ４で、アド
レス値として参照表（ＬＵＴ）に送出される。記号ｉに
対する被加数Ｇ_i以上で、次の記号ｉ＋1に対するＧ_i+1
より小さい任意のインデックスｊは、復号される記号と
して記号ｉを含む図７の逆参照表中のあるエントリを指
定する。

【００５６】インデックス値に対応する単一の被加数が
ある場合（ステップ６）、記号ｉが、符号列から復号さ
れる次の記号であると決定される（ステップ８）。しか
し、所与の記号に対して複数のインデックス値がある場
合がある。例えば、図６の表で、被加数.001を持つ記号
ｂは、図７の表では２つのエントリで表される。次の記
号ｃは、被加数.011を持つので、ｂは、図７の表の第２
と第３のエントリで表される。これは、それらのインデ
ックス値.001と.010がｂの被加数値.001以上であるが、
ｃの被加数値.011より小さいからである。すなわち、繰
返しプロセスで、符号列と被加数との差が負であるかが
検査され（ステップ１０）、負であれば、ステップ１０
の検査を満足するインデックスが見つかるまで、そのイ
ンデックスが減分される（ステップ８）。そのインデッ
クスに対する記号が、その列の次の記号であると決定さ
れる。

【００５７】次に、復号された記号に対応する被加数が
Ｃレジスタから差し引かれ、シフトカウントに基づいて
相対シフトが行われる（ステップ１４）。復号が完了し
ない限り、新しいＣレジスタ値は、次の記号の復号のた
めのインデックスを参照表に提供する（ステップ１
６）。

【００５８】図５のプロセスを実行する装置が、図８に
示されている。適切にプログラムされた汎用処理装置と
して実施できる装置は、論理演算機構（ＡＬＵ）１８
と、直列の符号ストリームを受け取るＣレジスタ２０
と、図６と図７の表を含む記憶装置２２と２４とを含
む。

【００５９】図８は、Ｃレジスタ２０の全数値がＬＵＴ
（ＲＯＭ）２２のアドレス指定に使用され、復号された
記号ＩＮＤＥＸが直接得られる場合を示している。ここ
で、長さ（シフト）と被加数（Ｑ）の値を収容するため
に主記憶装置の幅を広げる代わりに、インデックスは、
より小さい第２のＬＵＴ２４にアクセスする。幅を広げ
た記憶装置３６が記憶装置２２と２４の代わりに使用さ
れる別の実施例が、図１０に示されている。図８の記憶
装置２２と２４は、読取り専用記憶装置（ＲＯＭ）とし
て示されているが、ＲＡＭでも他の適当なアドレス指定
可能な記憶装置でも実施できる。記憶装置３６に記憶さ
れ、バス３８を経由してＣレジスタ２０にバス伝送され
るＮＥＸＴ＿ＳＴＡＴＥ情報を使用すると、ＡＬＵ１８
と、図８及び図９にある関連する接続とが不要になる。

【００６０】多重化装置（マルチプレクサまたはデータ
選択装置）２５は、図５のループ６、１０、８を実施す
るための代替方法の一つを示す。図８において、ＬＵＴ
２２のＩＮＤＥＸとラベルした出力は、復号された記号
であり、ループ６、１０、８は不要なので、マルチプレ
クサ２５は、ＡＬＵ出力１８（次の状態）を常にＣレジ
スタに入れる。マルチプレクサ２５からの並列ロードに
加えて、レジスタ２０は左シフト能力も持っている。左
シフト量は、第２記憶装置ＬＵＴ２４からの出力値ＳＨ
ＩＦＴで指示され、符号列からの入力置換ビットが入力
線ＣＯＤＥＩＮ上に現れる。シフト構造は、直列的にビ
ット毎に、あるいはより複雑なバレル・シフタによって
１サイクルで、またはこの両方の技術を組み合わせて使
用して行うことができる。さらに、バレル・シフタは、
ＡＬＵ１８とレジスタ２０の間に置くことができる。

【００６１】図９は、主記憶装置ＬＵＴアドレスが、Ｃ
レジスタの全ビットより少なく、最上位ビットのみであ
る、記憶容量を節約する別の実施例を示す。図９の実施
例において、図５のループ６、１０、８とＰＲＥＶ＿Ｓ
ＴＡＴＥと呼ばれる過去の状態とが、Ｃレジスタにロー
ドするために、マルチプレクサ２５によって選択され
る。ある実施技術において、マルチプレクサ２５の代替
物は、Ｃレジスタの内容が変化しない場合（すなわち、
現在の値がロードされるとき）、Ｃレジスタをクロック
することを禁止するものであろう。

【００６２】図９は、図５のステップ４で、主記憶装置
ＬＵＴ２６から値ｉをロードされたカウンタ３２をも含
む。カウンタ３２は、ダウン・カウンタであり、これ
は、最初にＬＵＴ２６からインデックス値を入力されて
おり、ステップ８のループ６、１０、８を実施するため
に、ＡＬＵ１８からのＵＮＤＥＲＦＬＯＷ信号に従っ
て、そのインデックスを減分する。信号３４、すなわち
ＵＮＤＥＲＦＬＯＷは、比較ステップ１０の結果を表し
ている。下位桁あふれは、Ｃから被加数Ｇ_i（図９で
は、Ｑと表示）を差し引くと結果が負になったことを意
味する。多数のＡＬＵにおいて、負の結果は、負の符号
値を表示する符号ビット信号の値から検出される。

【００６３】多重化装置（マルチプレクサ）２９は、入
力としてＬＵＴ２６から直接にインデックスを、またカ
ウンタ３２から減分されたインデックスを受け取る。マ
ルチプレクサ２９は、ステップ１０でＵＮＤＥＲＦＬＯ
Ｗが発生したかどうかを表す制御信号に基づいてこれら
のインデックス中から選択する。この制御信号は、下位
桁あふれが発生するとセットされ、記号が復号された後
に適当な制御機構（図示せず）によってリセットされる
ラッチ３１を使って供給することが好ましい。

【００６４】Ｌビット・インデックスの代わりに、ｋビ
ット・インデックス（ｋ＜Ｌ）が逆参照表の作成に使用
できる。なお、ｋビットしか持たないインデックスが、
幾つかの記号の一つに復号されることがときどきある。
例として、図７の逆参照表を取り上げる。２ビット・イ
ンデックス00は、復号される記号としてａとｂのどちら
かを指す。この曖昧さは、幾つかの方法で解決でき、例
えば、第２の参照表あるいは逐次減算法を使用する。

【００６５】具体的な例として、図９のｋビット・イン
デックスを使った別の実施例を考える。図９の装置は、
ＡＬＵ１８と、１６ビットＣレジスタ２０と、１０ビッ
ト参照表２６と、被加数２８を含む。記号の復号のため
に、Ｃレジスタ値の最上位１０ビットだけが、インデッ
クスｊとしてバス３０を経由して参照表に送出される。

【００６６】この１０ビット・インデックスは、すべて
同じ最上位１０ビットを共有する被加数表中の幾つかの
被加数に対応するので、復号される記号を指す適当な被
加数を反復法で決定することができる。図５を再度参照
すると、ｊに対応する幾つかの被加数のうちで最大の被
加数が、Ｃレジスタから差し引かれる。その引き算の結
果が負である（すなわち、下位桁あふれを引き起こす）
場合、その被加数は復号される記号に対して大き過ぎ
る。その差し引かれた値を加え直して、Ｃレジスタ値を
復元する。正の引き算結果が得られるまで、インデック
スｊに対応する次に小さな被加数を使ってこのプロセス
を繰り返す。最後に差し引かれた被加数に対応する記号
ｉが、復号された記号として出力される。引き算の結果
は、量ｌ_iだけ左にシフトされ、Ｃレジスタに記憶さ
れ、Ｃレジスタは、復号される次の記号用のインデック
スｊを与える。

【００６７】被加数に基づく符号化器本発明の別の特定の実施例によれば、ｍ元アルファベッ
ト｛1,...,ｉ,...,ｍ｝用の、高い効率で、順序を維持
し、高速で復号する、被加数に基づく（Ａベースの）符
号化器が構築される。記号ｉの符号化には、Ｃレジスタ
とＡレジスタを含む算術復号器が必要である。

【００６８】現Ａレジスタ値Ａの検査に依存する被加数
の任意の条件的スケーリングなしに、入力記号ｉに対応
する被加数Ａｇ（ｉ）が、Ｃレジスタに維持されている
符号列Ｃに加算される。ｉがｍに等しい（これは記号集
合の最後の記号である）場合を除いて、Ａｄ（ｉ）は、
再正規化の前にＡレジスタの新しい値となるが、ｉがｍ
に等しい場合は、再正規化の前のＡレジスタの新しい値
は、現在の値ＡからＡｄＳｕｍを差し引いたものであ
り、ＡｄＳｕｍは、ｉ＝１から（ｍ−1）の場合のＡｄ
（ｉ）の和と定義されている。

【００６９】次に両方のレジスタが再正規化され、記号
ｉと算術符号化器または復号器の内部状態に応じた適切
な量Ｓ_iだけシフトされる。

【００７０】順序の最後に現れるｍ番目の記号が、最も
確率の高い記号ＭＰＳであるという、米国特許第465285
6号の場合の復号プロセスを考える。復号器は、符号化
記号を回復するために、符号化された結果を元に戻す。
被加数Ａｇ（ｉ）は通常通り（Ａｇ（０）＝０等）決定
されるが、ＭＰＳは最後の記号なので、Ａｇ（ＭＰＳ）
＝ＡｄＳｕｍとなる。

【００７１】本発明の一態様によれば、引き算の結果が
正であることを維持しながら、復号器は、Ｃレジスタに
維持されている符号列の最上位ビットから、復号器がＣ
レジスタに加算できる可能な最大の被加数Ａｇ（ｉ）を
差し引く。その被加数に対応する加数Ａｄ（ｉ）が、再
正規化の前にＡレジスタの新しい値となる。次にＡレジ
スタとＣレジスタの値は、適切な再正規化のための左シ
フトを施されるが、これは、その符号化後に同じ記号に
対してこれら２つのレジスタ内で行われる。

【００７２】復号器に必要な前記の可能な最大の被加数
は、多数の方法で、好都合なように決定することができ
る。例えば、Ａｄ（ｉ）から開始して、差が負になるま
で、それぞれ次のＡｄ（ｉ）をＣレジスタから繰り返し
て差し引く。Ａｄ（ｍ）は、Ａ−ＡｄＳｕｍとして計算
されることに留意されたい。負の結果をもたらす加数Ａ
ｄ（ｊ）は、Ｃレジスタに加え直され、ｊが復号された
記号となる。

【００７３】この状況において、高速復号は、前記の可
能な最大の被加数の高速な探索と識別に依存している。
具体的な例として、このタスクを達成するため、まず、
Ｃレジスタからのビットでアドレス指定される、復号表
または参照表を作成する。ここで、Ｃレジスタは、Ｎビ
ットの精度を持ち（すなわち、Ａレジスタは、Ｎ−1個
の分数ビットを持つ）、復号表は、0＜ｋ≦Ｎとして、
ｋ個のアドレス・ビットを持つ。

【００７４】ｋ＝Ｎ＝１２の特定の場合を考える。復号
表は、'000'X(0)から'FFF'X(4095)までの２¹²＝４０９
６個のエントリを持つ。各１２ビット・インデックスｊ
に、Ａｇ（ｉ）≦ｊ＜Ａｇ（ｉ＋1）となる一義的な値
ｉが対応する。ＭＰＳは最後なので、最高のアドレスが
ＭＰＳに復号される。各ｊに対する表のエントリは、
ｉ、Ａｄ（ｉ）、Ａｇ（ｉ）、シフト量Ｓ（ｉ）等の値
を含む。記号ｉを復号するためには、新しいＡレジスタ
値Ｄ_iと新しいＣレジスタ値（Ａレジスタの元の値から
Ａｇ（ｉ）を引いたもの）を、数回の簡単な表の参照と
算術計算で決定することができる。各Ａｄ（ｉ）に対す
るシフト数はアプリオリに計算できるので、シフト量も
復号表から検索することができる。

【００７５】復号表のアドレス・ビット数ｋが、Ｃレジ
スタ内の精度ビット数Ｎより小さい場合を考える。下記
の式を満足するｎ個の被加数（ｎ≧２）が存在する。

【数５】ｊ−１＜Ａｇ（ｉ）＜Ａｇ（ｉ＋１）＜...＜
Ａｇ（ｉ＋ｎ−１）≦ｊ＜Ａｇ（ｉ＋ｎ）第２表を使用すると、インデックスｊに対応する前記の
復号表にあるエントリは、ｉ、ｉ＋１、...、ｉ＋ｎ−
１のうちのいずれかであり、その選択は、その課題の解
決をするための方針に依存する。例えば、最初の表のエ
ントリは、インデックスとしてＣレジスタの残りのＮ−
ｋビットを使って、第２の参照に使われる特別な表を示
すこともできる。

【００７６】別の手法では、特別なフラグが、主表のエ
ントリを多重被加数状況として指示し、最大の適用可能
被加数値（すなわち、Ａｇ（ｉ＋ｎ−１））をその表に
入れる。Ｃレジスタ値からＡｇ（ｉ＋ｎ−１）を差し引
いた結果が正であれば、その対応する記号ｉ＋ｎ−１が
復号された記号となる。第３の手法では、表が、適用さ
れる最小値Ａｇ（ｉ）だけでなく、インデックスｉも提
供する。Ｃレジスタ値が負になるまで、この最小値Ａｇ
（ｉ）に加数を繰り返し加算することにより、復号され
た記号が決定される。

【００７７】その代わりに、整数長の場合に対する図５
に似た第２表の手法が、図１１に示されている。図１１
で、ステップ４０と４２は、図５の最初の２ステップで
あるステップ２と４に対応する。

【００７８】ステップ４４において、加数がＡ−ＡｄＳ
ｕｍとして計算される最後の記号を除いて、加数Ａｄ
（ｉ）が得られる。引き算のステップは、ステップ４８
である。引き算の結果が正ならば、ステップ５０で、記
号ｉが復号され、引き算から得られた正の差が、再正規
化の前にＣの新しい値となる。そうでなければ、ステッ
プ４６でｉが減分され、再度検査が行われる。

【００７９】順序の最後の記号が復号された場合（ステ
ップ５４）、再正規化の前に、Ａの新しい値がＡ−Ａｄ
Ｓｕｍとして計算される（ステップ５６）。そうでなけ
れば、参照値Ａｄ（ｉ）がＡの新しい値となる。

【００８０】ステップ５８において、再正規化が実施さ
れる。最後の記号が復号された場合を除き、システム
は、次の記号を復号するために準備する。

【００８１】ステップ４８で、負の結果はＡｇ（ｉ）が
大き過ぎることを意味するので、ステップ４６で、次に
大きい被加数値にアクセスするために、インデックスを
減分する。被加数値が正しい記号を復号するのに十分に
小さい（しかし、より小さくはない）場合、４４、４
８、４６のループから出る。

【００８２】図１２は、図９の修正版であり、参照表２
６がＣレジスタ中の最上位ｋビットに適用できる、最大
可能インデックスｉを提供する。例えば、レジスタが１
６ビットで、ｋが１０ビットなら、１０ビット構成0.00
1111000について、Ｃレジスタ中の最大可能値は、0.001
11000111111である。すなわち、表中のインデックスｉ
は、Ａｇ（ｉ）がＣの最大値以下の場合のインデックス
である。その場合に、明らかに、Ａｇ（ｉ＋1）は、0.0
0111001000000以上でなければならない。最後の記号
（最大のインデックスｉ）が可能ならば、その最後の記
号が、最初に検査されることに留意されたい。

【００８３】インデックスが初めて使われるときは、Ａ
ＬＵ１８による被加数Ａｇ（ｉ）の最初の引き算試行の
ためにＱ表６４をアドレス指定するために、そのインデ
ックスは、マルチプレクサ２９を通過する。下位桁あふ
れがあると、信号３４がｉを減分させ、マルチプレクサ
２９が第２記憶装置６４のアドレスとしてカウンタ値を
選択する。

【００８４】ＬＵＴ６２が最大のインデックスを出力す
ると想像されたい。このことが復号器６６で検出され、
制御装置６８に通知される。信号７０に現れる加数は、
実際はＡｄＳｕｍであり、復号される記号が順序の最後
のものであれば、それをＡレジスタから差し引かなけれ
ばならない。ＡＬＵ７２は、その引き算をし、マルチプ
レクサ７４は、再正規化の前に、Ａレジスタ用の値を得
るために、Ａとの差を選択する。最上位ビット位置、Ｓ
ｉｇｎａｌＴｅｓｔ７６が１の値を得るまで、Ａレジ
スタを左シフトにより再正規化することができる。

【００８５】最初のインデックス（ＬＵＴ６２から開始
する）が復号された記号ではない場合には、ダウン・カ
ウンタ３２が次々により小さい値のＡｇ（ｉ）にアクセ
スする。ＵＮＤＥＲＦＬＯＷ３４が次のダウン・カウン
トを禁止すると、その探索は終了し、制御装置６８は、
現在のインデックスが復号された記号であると認める。
最後のもの（上記のように処理する）以外の記号に対し
て、表６４は、信号７０上で、Ａレジスタの新しく正規
化された値を供給し、信号７８上でＣレジスタをシフト
するためのシフト量を供給する。

【００８６】上記の探索方法のどの方法の復号速度も、
接頭辞特性を持つハフマン符号で達成される速度と同様
である。上記の手法を組み合わせても（ｋ＝Ｎかｋ＜Ｎ
のどちらか）、所望の探索結果が得られる。

【００８７】算術符号の基底2システムにおいてＡレジ
スタ値が、1.0から2.0まで変化する場合、追加の符号空
間は、0.0（Ａレジスタ値が1.0の場合）からほぼ1.0
（Ａレジスタ値が2.0の場合）まで変化する。この追加
の符号空間は、最後の記号がデフォールトになり、これ
は米国特許第4652856号の場合はＭＰＳであった。最後
の記号が最も確率が高いものであれば、符号化は最も効
率的である。しかし、ＭＰＳ用の空間を確保するため
に、Ａｄ（ｍ）がＡから他の加数の合計であるＡｄＳｕ
ｍを引いたものであり、ＡｄＳｕｍがＡレジスタに対す
る最小許容値であるＡｍｉｎより小さい限り、どんな記
号ｍが最後の記号に選ばれた場合でも、上記の符号化お
よび復号プロセスは正しく動作する。

【００８８】Ａレジスタ値が2.0に近い場合、算術符号
化の順序の最後の記号を除いて、各符号化記号は、最大
効率の符号空間の悪くとも半分だけで符号化される。Ａ
レジスタ値が1.0に近い場合だけ、各記号は、最高の符
号化効率のために必要な符号空間を受け取る。

【００８９】本発明の別の実施例によれば、以前に定義
した算術符号化器を使う間、分類順序が維持されるよう
に、前記の参照表を拡張することができる。図１３に、
この実施例に対する数字列の分割を示す。分類順序を維
持する際に、算術符号順序の最後の記号ｍが、必ずしも
最も確率の高い記号（ＭＰＳ）とはならないことに留意
されたい。それとは対照的に、順序の最後の記号は常
に、ここでｈで示す最も確率の高い記号である。以下の
議論では、ＭＰＳ以外のすべての記号は、以前のよう
に、加数値Ａｄ（ｉ）を事前に割り当てられている。Ｍ
ＰＳに対して等価な加数は、以前の値から変化した現在
のＡの値に依存する。

【００９０】ｋ＝Ｎの場合を再度考える。記号ｈを1＜
ｈ＜ｍで、ｍ元アルファベットのＭＰＳであると仮定す
る。符号化か復号のどちらかの間、Ａレジスタを使用す
る繰返しにおいて、現在の記号ｉがｈでない場合、前記
の状況の場合と同様に、Ａレジスタはその中のＡｄ
（ｉ）で終了する。追加の符号空間ｃが記号ｈに与えら
れると、1からｈ−1までの任意の記号が、算術符号順序
中でｈより先行する。これらの記号は、ＭＰＳに対する
「下位の」記号であり、和について以下の関係式が成立
する。

【数６】一方、ｈ＋１からｍまでの記号は、ＭＰＳの「上位の」
側にある。第２参照表は、これら「上位」記号に関する
特性に対して作成される。上位記号の合計確率は、すべ
て第２参照表に含まれている、最後の記号ｍからｈ＋1
までの逆順で加数値Ａｄ（ｉ）を累計することにより計
算される。上位記号の合計確率は、下記のように計算で
きる。

【数７】上位記号の合計確率と下位記号の累積確率をＡレジスタ
値から差し引いた後、Ａレジスタ内の結果の値は、ｈと
追加符号空間ｃに割り当てられた最小確率である。Ａｄ
（ｈ）の現在値の計算は、Ａ−ＡｄＳｕｍＨ−ＡｄＳｕ
ｍＬである。

【００９１】前記の第２参照表の使用法を説明するため
に、ｎ＞ｈとして、記号ｎの符号化の間、Ｃレジスタを
使用する繰返しを考える。以前の記号の累計確率は、こ
のとき、Ａｇ（ｈ−1）＋ｐ（ｈ）＋ｃ＋ｐ（ｈ＋1）＋
ｐ（ｈ＋2）＋...＋ｐ（ｎ−1）である。この計算は、
最後の記号ｍから作業を始めると好都合である。Ａレジ
スタ値とＣレジスタ値の和をＣ（ｈｉ）とする、したが
って、Ｃ（ｈｉ）＝Ｃ＋Ａである。したがって、Ａｇ
（ｍ）＝Ａｇ（ｈｉ）−ｐ（ｍ）、Ａｇ（ｍ−1）＝Ｃ
（ｈｉ）−（ｐ（ｍ）＋ｐ（ｍ−1））であり、以下同
様である。Ａｇ（ｎ）をｐ（ｍ）＋ｐ（ｍ−1）＋...＋
ｐ（ｎ）と定義する。ｈの符号化のための上記の繰返し
の結果、新しいＣレジスタ値Ｃ（ｈｉ）−Ａｇ（ｎ）、
またはそれと等価であるが、Ｃ＋（Ａ−Ａｇ（ｎ））と
なる。

【００９２】最後に、順序を維持する復号プロセスにお
いて、ｉ≦ｈとして、記号ｉは、前記の方法で復号でき
る。特に、復号される記号は、Ｃレジスタのｋ個の先行
ビットを参照することによって決定される。ｎ＜ｈとし
て、ある記号ｎに対して、前記の第２参照表が使われ
る。

【００９３】上記のプロセスを説明するため、ｙがＭＰ
Ｓである、図１の４記号の例に対する被加数に基づく符
号を再度考える。前記のリッサネンとモヒーウッディン
による従来技術において、ｙは、図２に示すように、数
字列上の最も右にある。この例で、Ａレジスタの再正規
化点は1.0であり、Ａレジスタ値は、[1.0, 2.0）、すな
わち左側が閉で、右側が開である範囲にある。すなわ
ち、リッサネンとモヒーウッディンの方法のように間隔
[0.75, 1.5)を使う代わりに、間隔の新しいＣ_loの位置
を識別するｐ（ｉ）とＡの積を近似する加数値まで、記
号の確率を「スケールアップ」することができる。

【００９４】一般に、Ｃ_hiに基づく表は、上位ＬＵＴ参
照において値Ａ−Ｃ_loを使用し、値Ｃ_loは、下位ＬＵＴ
に対して使用される。各事例で初期インデックスが、検
査のために抜き出される。下位の参照について、Ｃから
差し引いても負にならない最大のＡｇ（ｉ）を探索す
る。ただし、ＣはＡｄＳｕｍより小さくなければならな
い。ＣがＡ−ＡｄＳｕｍＨより小さい場合、下位参照表
が、上位ＬＵＴを指す。

【００９５】同様に、ＣがＡｄＳｕｍＬより小さい場合
は、上位のＬＵＴが、その答えに対する下位ＬＵＴを指
す。Ａ−Ｃ_loの値が小さいほど、復号されるインデック
スは大きくなる。Ａ−Ｃ_loが最後の記号に対する加数Ａ
ｄ（ｍ）より小さい場合は、その最後の記号が復号され
る。Ａｄ（ｍ）より大きいがＡｄ（ｍ）＋Ａｄ（ｍ−
1）より小さい場合は、記号ｍ−1が復号される。

【００９６】ＩＭ１を使うアルゴリズムは、通常、間隔
値の上限が下限の２^k倍である範囲を使用する。ｋは、1
より大きい整数である。例えば、ｋは１２とすることが
できる。

【００９７】図２において、Ａが最小値1.0である場合
でも、ＭＰＳ符号空間用のスペースがあることに留意さ
れたい。等価な被加数値を複雑な方法で再スケーリング
されなければならない、従来技術の米国特許第4652856
号の場合には、必ずしもそうではなかった。この点に関
して、Ａレジスタに基づく再スケーリングを行なう本発
明によって教示される好ましい方法は、米国特許第4652
856号の方法よりも実施が容易である。本発明の方法の
この変形では、非ＭＰＳ記号に与えられた符号空間をよ
り正確に反映するために必要がないからである。

【００９８】記号の辞書的順序が、本発明においてどの
ようにして維持されるかを説明するために、図２の４記
号がアルファベットにおける辞書的順序に従って並べて
いる図４を考える。図４において、ｙに対する符号空間
は、図２や図３の場合と同様に、依然としてＡ−［Ａｇ
（ｗ）＋Ａｇ（ｘ）＋Ａｇ（ｚ）］である。しかし、間
隔の両端から内側にあるＭＰＳに対する符号空間を識別
すると、ＭＰＳを常に最右端に置く必要はなくなる。Ｃ
_lo、Ｃ_hiまたはＡあるいはその両方によって定義された
現在の間隔が与えられるものとすれば、記号ｉの符号化
後の新しい間隔は、下記の表２に示される。

【００９９】

【表２】

【０１００】前記のように、非ＭＰＳ記号の被加数値
は、対応する記号の確率から決定される。図４に示すよ
うに、Ａ＝1.0のときに、ＭＰＳ用の最小の符号空間
が、存在する。

【０１０１】本発明において、ｙに割り当てられた符号
空間Ａ−［Ａｇ（ｗ）＋Ａｇ（ｘ）＋Ａｇ（ｚ）］がゼ
ロより大きくなるように、合計Ａｇ（ｗ）＋Ａｇ（ｘ）
＋Ａｇ（ｚ）が1.0より小さいことが必要である。任意
の非ＭＰＳ記号ｉについてＡｇ（ｉ）＝Ｐ（ｉ）なら
ば、この要件は必ず満たされる。しかし、Ａレジスタの
期待値は、通常、1.3と1.5の間なので、被加数Ａｇ
（ｉ）は適当にスケールアップされる。

【０１０２】上記の被加数に基づく算術符号の符号化プ
ロセスをさらに説明するために、下記の例１と例２を考
える。

【０１０３】（例１）

【表３】ａはＭＰＳなので、Ｃ_hiを「アンカー」点として選ぶの
が適切である。記号ｄに割り当てられた符号空間Ａｇ
（ｄ）は、ｋｘｐ（ｄ）として選択される。ここで、再
分布係数ｋは、あまり小さくないＭＰＳに対する符号空
間を維持しながら、その確率集団の再分布が行えるよう
に選ぶと好都合である。経験的に、1.2と1.4の間の数値
を再分布係数に選ぶことができる。この例では、ｋは1.
4とした。記号ｃに割り当てられる符号空間は、理想的
には1.4ｘｐ（ｃ）であるが、追加の量を表すのに十分
な精度が無いため、依然として0.00001である。記号ｂ
に対する符号空間は、1.4ｘｐ（ｂ）

【数８】である。非ＭＰＳ記号の全てに対して同じ再分布係数を
選ぶ必要はないが、非ＭＰＳ記号の全てに単一の値が適
用されることが実施上好ましいことに留意されたい。最
後に、Ａｇ（ｄ）、Ａｇ（ｃ）およびＡｇ（ｂ）の合計
は0.10101なので、ＭＰＳ（記号ａ）に割り当てられる
符号空間は、Ａ−0.10101である。

【０１０４】４つの記号ａ、ｂ、ｃ、ｄのそれぞれの符
号化に際して、Ｃレジスタへの加数、新しいＡレジスタ
値Ａ、およびＡを発生させるために必要なシフト数は、
下記の通りである。

【０１０５】

【表４】ｉ＝ｂ，ｃ，ｄとして、非ＭＰＳ記号ｉを符号化した後
の新しいＡレジスタ値は、1≦Ａ＜2となる量だけシフト
されたＡｇ（ｉ）であることに留意されたい。

【０１０６】（例２）それぞれが例１の記号と同じ対応
する確率を持つ、記号ｂ、ａ、ｄ、ｃという新しい順序
を考える。すなわち、

【表５】記号確率 p(i) 符号空間 Ag(i) b 0.00010 0.00011 a 0.10001 A - 0.10101 d 0.01100 0.10001 c 0.00001 0.00001

【０１０７】４つの記号ａ、ｂ、ｃ、ｄのそれぞれの符
号化に際して、Ｃレジスタへの加数、新しいＡレジスタ
値Ａ、およびＡを発生させるために必要なシフト数は、
下記の通りである。

【０１０８】

【表６】記号 Cに加算される量 Aの新しい値シフト数 b 0 1.10000 4 a 0.00011 A < 1.10101ならば A < 1.10101ならば (A-0.10101)× 1/2 1 そうでなければそうでなければ0 A - 0.10101 d (A - 0.10101)+0.00011 1.00010 1 c (A - 0.10101)+0.00011+0.10001 1.00000 5 この場合も、ｉ＝ｂ，ｃ，ｄとして、非ＭＰＳ記号ｉを
符号化した後の新しいＡレジスタ値は、1≦Ａ＜2となる
量だけシフトされたＡｇ（ｉ）である。

【０１０９】同様に、本発明の被加数に基づく算術符号
の符号化プロセスをさらに説明するために、下記の例３
と例４を考える。

【０１１０】（例３）下記の４記号アルファベットを考
える。

【表７】記号確率 p(i) 符号空間 Ag(i) e 0.04 0.05 f 0.24 0.30 g 0.57 A - 0.54 h 0.15 0.19 非ＭＰＳ記号に割り当てられる符号空間Ａｇ（ｉ）は、
記号確率を再分布係数ｋによりスケールアップすること
によって得られる。この例では、ｋは1.25である。ＭＰ
ＳであるＡｇ（ｇ）に対する符号空間は、最小値の0.46
を有し、常に1.46より小さい。

【０１１１】ＭＰＳは、辞書的順序のどちらの端にもな
いので、Ｃ_loもＣ_hiも「アンカー」点として使用されな
い。その結果、２つの復号表が必要になる。辞書的順序
でＭＰＳの左側の記号は表８で復号され、一方、辞書的
順序でＭＰＳの右側の記号は表９で復号される。

【０１１２】

【表８】表８記号ｉの復号記号ｉ−１でなく、参照する表次に記号ｉを復号するかつ以下の場合０≦Ｃ＜０．０５＝Ａｇ（ｆ）３．１ｅ０．５≦Ｃ＜０．３５＝Ａｇ（ｇ）３．１ｆＣ＜Ａ−０．１９＝Ａ−ＡｄＳｕｍＨ３．２ｇまたはｈ（上位ＬＵＴ）Ｃ≧Ａ−０．１９３．２ｇ

【０１１３】

【表９】表９記号ｉの復号記号ｉ−１でなく、参照する表次に記号ｉを復号するかつ以下の場合Ａ−Ｃ_lo＜０．１９＝ＡｄＳｕｍＨ３．２ｈＡ−Ｃ_lo＞０．１９３．２ｇｉｆＣ≧０．３５＝ＡｄＳｕｍＬ３．２ｇまたはｈｉｆＣ＜０．３５３．２ use lower ＬＵＴ

【０１１４】表８から、ゼロ以上で0.05（すなわち、Ａ
ｇ（ｃ））より小さいＣレジスタ値なら、記号ｃに復号
される。0.05以上で、0.35（すなわち、Ａｇ（ｅ）＋Ａ
ｇ（ｆ））より小さいＣレジスタ値なら、記号ｆに復号
される。全ビット精度の参照表は0.05のアドレスがある
ことに留意されたい。全ビット精度でない参照表は0.05
を含む（が等しくはない）アドレスがある。

【０１１５】後者の状況では、そのアドレスの内容が、
乗算被加数の場合にフラグを立て、かつ復号プロセスを
実行するために、さらに動作を実行する必要がある。

【０１１６】Ｃレジスタ値が0.35以上であれば、Ａレジ
スタ値を検査しなければならない。Ｃレジスタ値がＡレ
ジスタ値から0.19（すなわち、Ａｇ（ｈ））を差し引い
たものより大きい場合には、復号エントリはｇであると
一義的に決定される。しかし、ＣがＡ−0.19より小さけ
れば、復号される記号はｇかｈのどちらかになる。この
点に関して、復号エントリを決定するために表９を参照
しなければならない。

【０１１７】上記の記号ｉが復号されると、Ｃレジスタ
とＡレジスタに対する新しい値が、下記のように計算さ
れる。

【０１１８】

【表１０】

【０１１９】最後に、最も確率の低い記号の確率が最小
の被加数値を決定し、この値（２進数）は、復号に必要
なアドレスのビット数を低減するために増加方向に調整
することができる。

【０１２０】（例４）5ビットの精度で表された確率と
被加数を持ち、辞書的順序に並んだ下記の５つの記号を
考える。

【表１１】記号 2進法による確率被加数累計 l 0.00001 0.0001 0 m 0.00111 0.0100 0.0001 n 0.01110 A - 0.1011 0.0101 p 0.00100 0.0010 - 0.0110 q 0.00110 0.0100 - 0.0100

【０１２１】Ａの最小値が1.0000なので、記号ｎ（ＭＰ
Ｓ）に対する最小の符号空間は、0.0101である。5ビッ
ト精度が被加数には必要でないように、非ＭＰＳ記号
（ｌ、ｍ、ｐおよびｑ）の被加数値がそれぞれの確率か
らスケールアップされる。これには、参照記憶の大きさ
を半分に減らすという利点がある。最後の欄の最後の二
つの値、すなわちＣｕｍ（ｐ）とＣｕｍ（ｑ）は、辞書
的順序でＭＰＳの右側の記号、すなわちｐとｑの復号の
間に符号列から差し引かれる値を表すので、負である。

【０１２２】ＭＰＳは、辞書的順序のどちらの端にもな
いので、２つの復号表、どちらも4ビット精度の表１２
と表１３が、復号のために必要である。

【０１２３】

【表１２】Ｃ復号エントリ 0.0000 l 0.0001 m 0.0010 m 0.0011 m 0.0100 m 0.0101 n 0.0110 n 0.0111 n 0.1000 n 0.1001 n 0.1010 nまたはp 0.1011 nまたはp 0.1100 nまたはpまたはq ... 表１３参照

【０１２４】

【表１３】

【０１２５】上記の復号表の使用例は、下記の通りであ
る。Ｃ＝0.1101かつＡ＝1.1100とする。Ａ−Ｃの値は、
0.1111である。復号表１２は、エントリ1.0000（？）に
あるｎ、ｐまたはｑ（？）の一つが復号される記号であ
ることを示している。一方、復号表１３は、ｍまたはｎ
が復号される記号であることを示している。したがっ
て、復号される記号は、両方の復号表を満足する唯一の
記号であるｎでなければならない。

【０１２６】記号ｎの復号後、新しいＣレジスタ値は、
0.1101−0.0101となり、新しいＡレジスタ値は、古いＡ
から0.1011または1.0001を差し引いたものとなる。

【０１２７】Ｃ＝0.1101かつＡ＝1.0000とすると、Ａ−
Ｃは0.0011となる。表１２は、「ｎまたはｐまたはｑ」
を与え、一方、表１３のアドレス0.0011はｑを与える。
したがって、復号される記号はｑである。

【０１２８】Ｃ＝0.1001かつＡ＝1.0000（表を作成する
ために使用される極端な場合）とする。復号表１２で、
0.1001は、ｎの復号のための最後の値である。これは、
Ａ＝1.000の場合に発生し、この場合、復号表１３のア
ドレス0.0111が、ｎの復号のために、その表の最初の値
を指す。またｎに割り振られた最小の符号空間は0.0101
なので、各4ビット精度の参照表に５つの対応するアド
レスがあることに留意すべきである。

【０１２９】最後に、Ｃが0.0101で、Ａが1.1111（すな
わち、その最大値）とする。Ａ−Ｃは1.1010であり、復
号される記号が、表１３でｎかｍのどちらかであること
を示している。Ａが1.0より大きいときには、値はＡに
加えるのではなく、Ａから差し引かれることに留意され
たい。その結果、Ａは左シフトによってのみ、1.0000よ
り大きくなる。従来通り、１つのゼロが左シフトされ
る。このエントリについて、Ａが1.1111より小さけれ
ば、Ｃは0.0101より小さい。表１は、復号される記号が
何かを一義的に決定する。

【０１３０】本発明に従った復号方法のソフトウェアに
よる実施を、付録として本開示文書に添付する。

【０１３１】本発明は、主に、方法として開示されてい
るが、ＣＰＵ、記憶装置、入出力装置、プログラム記憶
装置、結合バス、および他の適当な構成要素を含む従来
のデータ演算処理装置などの装置を、本発明の方法の実
施を可能にするためにプログラムしまたはその他の形で
設計することが可能なことを当業者なら理解されよう。
そのような演算処理装置は、本発明の方法を実行するた
めの適当なプログラム手段を含む。また、事前に記録済
みのディスクや他の類似のプログラム製品など、データ
処理システムで使用される製造物品が、記憶媒体と、そ
れに記録された、本発明の方法の実施を可能にするため
にデータ処理システムに指令するプログラム手段とを含
むこともできる。そのような装置や製造物品も、本発明
の趣旨および範囲に含まれることを理解されたい。

【０１３２】まとめとして、本発明の構成に関して以下
の事項を開示する。

【０１３３】（１）記号に関して所定の順序を有するア
ルファベットの諸記号の符号化および復号のための装置
において、それぞれの記号について、所定の順序でそれ
ぞれの記号に先行するアルファベットの全記号の累積確
率に関係する値を有するそれぞれの被加数を含む被加数
表と、（ｉ）記号の数値表現を生成し、（ii）符号化さ
れる記号に先行する記号の累積確率に関係する値をもつ
被加数に、前記表現を加算し、（iii）再正規化のため
に、左シフトすることによって、記号を符号化する手段
と、（ｉ）符号列の少なくとも１つの最上位ビットから
符号化記号を識別し、（ii）符号化記号を生成するため
に、前記記号に被加数表のどの被加数を加算するかを決
定し、（iii）前記決定ステップで決定された前記被加
数により、符号列から符号化記号を獲得することによっ
て、符号列から記号を復号するための手段とを含む装
置。（２）復号手段が、符号化記号の値より小さい値をもつ
最大累積確率を識別することによって前記合計から復号
された記号を得る手段を含むことを特徴とする上記
（１）に記載の装置。（３）アルファベットの符号化記号に対応するそれぞれ
のインデックス値によってアドレス指定される、それぞ
れの復号された記号を含む逆の表をさらに含む上記
（１）に記載の装置。（４）前記復号手段において、前記合計が同時に生成さ
れることを特徴とする上記（１）に記載の装置。

【０１３４】付録これは、記号に関する固定した統計に基づくアルゴリズ
ムである。このアルゴリズムは、まず、MPS（最も確率
の高い記号）を識別し、次に、下記のように、256個の
記号に対する配列fcumを計算する。prob(N)が1から3276
7までの間にスケーリングされたN番目の記号の確率であ
るとして、N≦MPSの場合には、fcum(N) =prob(0)+prob
(1)+...+prob(N-1)であり、N＞MPSの場合は、fcum(N) =
prob(N)+prob(N+1)+...+prob(256)である。二つの参照
表right_dexとleft_dexがあり、それぞれ長さ１KBであ
る。AをＡレジスタ値、CをＣレジスタ値とすると、righ
t_dexは、差A-Cの最初の10ビットを取り、fcum(N)≧A-C
を満足する最大のN(＞MPS)を指す。そのようなNが存在
する場合、right_crashは、1より大きな可能性がある
かどうかを示す。right_dexで記号を復号できない場
合、left_dexが、fcum(N)≦A-Cになるような最大のN(≦
MPS)を指す。この場合も、left_crashが多重解の可能性
があるかどうかを示し、それがある場合には、線形探索
が実行される。

【０１３５】charsは、処理された文字数である。cycle
_cntは、記号が復号される前の引き算の回数である。し
たがって、例えば、right_dexかleft_dexのどちらか
が、失敗なく記号の発見に成功した場合、ただ一度の引
き算が実行される。引き算の回数を、繰り返しの単位と
みなす。

【０１３６】 right_dex：配列（.0..1023.）の整数； left_dex：配列（.0..1023.）の整数； right_crash：配列（.0..1023.）のブール数； left_crash：配列（.0..1023.）のブール数； cycle_cnt：整数； chars：整数；

【０１３７】この手順で、right_dex、left_dex、right
_crashおよびleft_crashが初期設定される。

【０１３８】所与のどの場合でも、レジスタの最初の10
ビットが、最大レジスタ値を使って可能な解を指す。次
に最小のレジスタ値を使って、多重解の可能性があるか
どうかを検査する。そのような場合、フラグ「crash」
が、「true」に設定される。

【０１３９】 procedure initializeproc; var i, j, N: integer; begin for i: = 0 to 1023 do begin right_crash(.i.):= false; left_crash(.i.):= false; end; for i:= 0 to 1023 do begin N:= 255; while ( N > MPS) and (fcum(.N.) < i * 64) do N:= N - 1; right_dex(.i.):= N; if (N > MPS) and (fcum(.N.) < i * 64 + 63) then right_crash(.i.):= true; end; for i:= 0 to 1023 do begin N: = MPS; while fcum(.N.): > 1 * 64 + 63 do N:= N - 1; left_dex(.i.):= N; if fcum(.N.) > i * 64 then left_crash(.i.): = true; end;

【０１４０】「A-C」の最初の10ビットからのfdecproc
は、記号を見つけ出すために、まず、right_dexを使用
する。答が見つかると、right_crashは、探索が必要か
どうかを指示する。right_decがMPSを指す場合は、解が
MPS以下であることを示す。次に、left_dexを使用し
て、left_crashが探索が必要かどうかを指示する。

【０１４１】ハードウェアで実施する場合、右と左を並
列に使用でき、left_dexは、right_dexの答を待つ必要
はないことに留意されたい。

【０１４２】 procedure fdecproc; var N,M, i: integer; fini: boolean; begin fini:= false; if a < c then begin N:= 255 fini:= true; end else begin i: = (a - c)div 64; N: = right_hash(.i.); if N > MPS then if not(right_crash(.i.)) then fini:= true else bigin while (N > MPS) and (a - c > fcum(.N.)) do begin N:= N - 1; cycle_cnt:= cycle_cnt + 1; end; if N > MPS then fini:= true; end; end; if not(fini) then begin i:= c div 64; N:= left_hash(.i.); if left_crash(.i.) then while c < fcum(.N.) do begin N:= N - 1; cycle_cnt:= cycle_cnt + 1; end; end; if N > MPS then c:= c - a + fcum(.N.) else c:= c - fcum(.N.); if N <> MPS then a:= fprob(.N.) else a:= a - fcum(.N.) - fcum(.N+1.); if a < renormval then derenormproc; write(outfile9, chr(N)); treepointer;= N + 2; end;

【０１４３】

【発明の効果】以上により、本発明によって、従来の方
法やシステムで得られなかった高速の符号化および復号
速度、高い圧縮効率、辞書的順序の維持、および簡単な
実施を併せて達成する、効率が高く、順序を維持する符
号化技術が提供されることとなった。

【図面の簡単な説明】

【図１】１つのアルファベットの４つの記号の間での、
間隔幅Ａの小分割を示す図である。

【図２】Ａが1.0の場合の、４記号アルファベットに対
する符号空間の割振りを示す図である。

【図３】本発明の別の実施例に対する符号空間の割振り
を示す図である。

【図４】本発明の別の実施例に対する符号空間の割振り
を示す図である。

【図５】整数長算術符号化器の復号プロセスの流れ図で
ある。

【図６】４記号アルファベットに対する被加数（Ａｇ
（ｉ）またはＧ_i）表を示す図である。

【図７】図６におけるアルファベットに対する逆参照表
を示す図である。

【図８】本発明の第１の実施例による復号装置を示す図
である。

【図９】本発明の別の実施例による復号装置を示す図で
ある。

【図１０】本発明の別の実施例による復号装置である。

【図１１】本発明の別の実施例の復号プロセスの流れ図
である。

【図１２】本発明の別の実施例による復号装置を示す図
である。

【図１３】本発明のさらに別の実施例に対する符号空間
の割振りを示す図である。

【符号の説明】

１８演算論理機構２０Ｃレジスタ２２記憶装置２４第２記憶装置２５多重化装置３２カウンタ３４下位桁あふれ信号６２参照表６４第２記憶装置６６復号器６８制御装置７２演算論理機構７４多重化装置

───────────────────────────────────────────────────── フロントページの続き (72)発明者アハマド・ザンディーアメリカ合衆国95014 カリフォルニア州クパーティーノジョンソン・アベニュー10791 (56)参考文献特開平２−53329（ＪＰ，Ａ) (58)調査した分野(Int.Cl.⁶，ＤＢ名) H03M 7/40

Claims

(57)【特許請求の範囲】

【請求項１】記号に関して所定の順序を有するアルファ
ベットの諸記号の符号化および復号のための装置におい
て、それぞれの記号について、所定の順序でそれぞれの記号
に先行するアルファベットの全記号の累積確率に関係す
る値を有するそれぞれの被加数Ｇ_iを含む被加数表であ
って、前記累積確率がそれぞれの記号に先行するアルフ
ァベットの記号の確率Ｐ_jを２の負の累乗２^-li（但しｌ
ｉは整数の記号符号語長）で近似した確率に基づくもの
である被加数表と、（ｉ）記号の数値表現を生成し、（ii）符号化される記号に先行する記号の累積確率に関
係する値をもつ被加数に、前記表現を加算して合計値を
生成し、（iii）前記合計値を再正規化のために、ｌｉビット左
シフトすることによって、記号を符号化する手段と、（ｉ）符号列の少なくとも１つの最上位ビットから符号
化記号を識別し、（ii）符号化記号を生成するために、前記記号に被加数
表のどの被加数が加算されたかを決定し、（iii）前記決定ステップで決定された前記被加数によ
り、符号列から符号化記号を獲得することによって、符号列から記号を復号するための手段とを含む装置。
【請求項２】復号手段が、符号化記号の値より小さい値
をもつ最大累積確率を識別することによって前記合計か
ら復号された記号を得る手段を含むことを特徴とする請
求項１に記載の装置。
【請求項３】アルファベットの符号化記号に対応するそ
れぞれのインデックス値によってアドレス指定される、
それぞれの復号された記号を含む逆の表をさらに含む請
求項１に記載の装置。
【請求項４】前記復号手段において、前記合計が同時に
生成されることを特徴とする請求項１に記載の装置。