JP3171776B2

JP3171776B2 - 圧縮方法及びコンテキスト・モデラー

Info

Publication number: JP3171776B2
Application number: JP31392695A
Authority: JP
Inventors: ジェーゴーミッシュマイケル; ピーボーリックマーティン
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 1994-12-01
Filing date: 1995-12-01
Publication date: 2001-06-04
Anticipated expiration: 2015-12-01
Also published as: US5689589A; TW307086B; JPH08228342A; DE19544761C2; DE19544761A1

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は画像圧縮に係り、特
に、デジタル画像シーケンスの圧縮に関する。

【０００２】

【従来の技術】デジタル画像の圧縮は、圧縮前の画像の
ビットを再配列して、使用ビット数の少ない圧縮画像を
生成するプロセスである。非損失性（lossless）圧縮に
よる場合、圧縮画像は圧縮前の原画像を完全に復元でき
るだけの情報を含んでいる。ある種の圧縮プロセスは損
失性（lossy）であり、圧縮前の画像をほぼ復元できる
だけである。損失性圧縮が利用されるアプリケーション
の場合、デジタル画像の性格及び圧縮スキームは再現画
像が原画像に十分に似ていれば損失を問題にしないよう
なものである。例えば、ある損失性圧縮スキームでは、
わずかではあるが色のバリエーション又は画像の鮮明度
が失われる。

【０００３】損失性圧縮は、画像を完全には復元できな
いが、非損失性圧縮より高い圧縮率を得られることが多
い点で有利である。しかしながら、アプリケーションに
よっては、損失は許されず圧縮は非損失性でなければな
らない。このようなアプリケーションには、効率的な非
損失性圧縮が必要である。ここで、効率とは得られる圧
縮率を意味する。したがって、ある入力画像を１／４の
サイズに圧縮する（圧縮率＝４：１）圧縮装置は、その
画像を１／２サイズに圧縮する（圧縮率＝２：１）圧縮
装置より効率がよい。計算能力を一定としたときの圧縮
の実行速度は、ここで述べない一点を除いて圧縮装置の
効率の尺度とは別物である。

【０００４】デジタル画像は、画素に割り当てられた画
素値（簡略化のため、”画素”と”画素値”が同じ意味
でしばしば用いられる）の集まり（通常、二次元配列）
により記述される。画素値は、画像を生成するために画
素に塗る色を指定する。画像が”パレット化された”
（palettized）画像であるときには、画素値は色値を直
接には指定せず、各索引と色値との相互参照を格納して
いる色テーブルに対する索引である。パレット化画像が
パレット化しない画像に比べ有利な点は、色テーブル中
の一つの値を変更するだけで一群の同一色の画素を変更
できることである。このようなパレット化画像の性質
は、ビデオゲームで特に有用である。例えば、ビデオゲ
ームは、レーシングカーの一つのパレット化画像を記憶
し、各プレイヤーに異なった色テーブルを割り当てるこ
とによりプレイヤー毎に違った色のレーシングカーを表
示することができるだろう。

【０００５】パレット化画像の不利な点は、パレット化
画像が通常、非損失性圧縮しなければならないことであ
る。損失性圧縮では、画素値の軽微なエラーを生じるこ
とがある。パレット化されない画像の場合、このような
軽微なエラーは通常、色値の僅かなずれとなり、画像に
は殆ど影響しない。しかし、パレット化した画像では、
このエラーは索引値の僅かなずれとなり、これは色の大
きなずれとなるので画像を大幅に変化させる。

【０００６】一つの圧縮方法がＺａｎｄｉ等により、本
発明の譲受人に譲渡された米国特許出願第０８／２０
０，２３３号（”Ｃompression of Ｐalletized Ｉmage
s andＢinarization for Ｂitwise Ｃoding of Ｍ-ary
Ａlphabets Ｔherefor”,１９９４年２月２３日受理）
で提案されている。この出願の内容は引用により本明細
書に組み込まれ、また、”Ｚａｎｄｉ”と呼ばれる。Ｚ
ａｎｄｉでは、色テーブルの存在が圧縮システムのため
にうまく利用される。画像の画素値はテーブルの任意の
索引であるから、テーブルのエントリーを設定し直して
も、画素値により指定されるテーブルエントリーの色値
が変わらない限り、情報は失われない。このような制約
の下で、画素値はそのビットが圧縮しやすくなるように
再割り当てされる。

【０００７】Ｚａｎｄｉの圧縮方法は非常に効率がよい
が、動きのある表示（例えばビデオシーケンス）を作り
出す多数の画像を記憶する必要がある場合には、毎秒の
ビデオシーケンスのために６０もの画像すなわちフレー
ムを生成しなければならないので、さらに高い圧縮率が
必要である。１画像あたり２５６画素×２４０画素，８
ビット画素値の解像度では、圧縮しない１フレームに６
１４４０バイト（８ビット／バイト）のメモリが必要で
あるので、１秒の（６０フレーム）のビデオシーケンス
のために、それが圧縮されないときには３，６８６，４
００バイトのメモリが必要である。

【０００８】ビデオシーケンスを使いビデオカートリッ
ジで提供されるビデオゲームにとって、優れた圧縮が重
要である。ゲームの命令、固定画像及びビデオシーケン
スが全てリード・オンリー・メモリ（ＲＯＭ）に格納さ
れるからである。ビデオカートリッジを安価にしなけれ
ばならない場合、ビデオゲームのデザイナーは限られた
ＲＯＭサイズに無理にあわせなければならないことが多
い。ゆえに、彼らは、限られたＲＯＭにより多くのシー
ンを収容可能にする、あるいは、より小さく安価なＲＯ
Ｍを記憶に使用できるようにする、より優れた圧縮を要
望する。

【０００９】圧縮装置は、圧縮すべき入力ブロックより
シンボルをシーケンシャルに読み込み、それらを圧縮し
て出力ファイルを生成する。入力ファイルが一つのデジ
タル画像又はフレームのシーケンス（各フレームは１つ
のデジタル画像である）である場合、シンボルは画素値
である。画素値は、シーケンシャルに読みとられる時に
は、通常、最上行の画素から始まって最下行の画素へ向
かうような順序で読みとられ、各行内では左から右へと
読みとられる。圧縮されようとしている原画素は”カレ
ント”（current）画素と呼ばれ、プライア（prior）画
素は処理済みの画素を意味し、”アプカミング”（upco
ming）画素はまだ処理されていない画素を意味し、”ネ
クスト”（next）画素はカレント画素のすぐ後に処理さ
れるアプカミング画素である。ある圧縮装置は一度にカ
レント画素の１ビットを圧縮し、この場合、処理される
ビットはカレント・ビットプレーンにあるといわれる。

【００１０】圧縮装置は、カレント・シンボルを若干の
圧縮ビット（符号語）に変換するコーダー（coder）を
含んでいる。全てのシンボルに対する符号語が出力ブロ
ックを形成する。あるコーダーでは、入力シンボルと出
力符号語との関係は固定している。適応的エントロピー
・コーダーでは、その関係はカレント・シンボルの生起
確率に応じて変わる。エントロピー・コーダーがそのよ
うに呼ばれるのは、データをエントロピーにより規定さ
れる理論的な圧縮限界まで圧縮しようとするからであ
る。エントロピーは、平均的に、シンボルＳを、その生
起確率の逆数の２の対数より少ないビット数には符号化
し得ないと規定する。すなわち、シンボルＳの生起確率
をＰとすると、圧縮ブロックにおいてシンボルＳを抽出
できるように表現するためには、少なくともＮ＝ｌｏｇ
₂ （１／Ｐ）ビットが必要とされる。したがって、非損
失性圧縮の場合、エントロピー限界を越える圧縮率は不
可能である。

【００１１】ハフマン・コーダーでは、１符号語あたり
のビット数は整数でなければならないので、いくつかの
符号語は、その生起確率に対するエントロピーにより必
要とされるビット数より、端数ビット分多いビットで表
現されることになる。このような丸めを行うので、ハフ
マン・コーダーは、非整数のビットを用いて符号語を表
現できるエントロピー・コーダーほどは圧縮しない。非
整数ビット数の符号語の使用は、符号語を互いにオーバ
ーラップさせることにより可能になる。

【００１２】１符号語のビット数が非整数の場合でも、
確率は正確には決まらないので、画像をエントロピー限
界までは圧縮できない。勿論、画像全体を調べることに
より入力画像中の各画素値の生起確率を正確に測定でき
るが、伸長装置側でカレント画素を伸長しようとする時
に入手できない情報はカレント画素をどのように符号化
すべきか決定するのに用いられるべきでない。そうでな
いと、伸長装置はカレント画素を復号するための十分な
情報を得られないことになる。

【００１３】幸い、プライア画素だけに基づいた確率予
測によって、エントロピー・コーダーに対し適切な入力
が提供される。確率予測を改善するため、条件付き確率
予測を考慮したコンテキストが用いられる。すなわち、
あるコンテキストが与えられれば、カレント画素となる
画素の確率Ｐが決まる。伸長装置がカレント画素を復号
する前にコンテキストを決定できるように、コンテキス
トはプライア画素だけに依存すべきである。画素のコン
テキストの決定要素を選択するものは、コンテキスト・
モデルとして知られている。例えば、あるコンテキスト
・モデルでは、圧縮される画素に対するコンテキスト
は、その直前のプライア画素によって決定される。ある
コンテキスト・モデルを使って確率がより良好に予測さ
れるならば、そのコンテキスト・モデルはより良好な圧
縮をもたらす。

【００１４】コンテキスト・モデルが最も良く働いた時
には、コンテキストは符号化されるシンボルもしくは画
素の的確な予測子である。例えば、画素Ｐのコンテキス
トがＣで、Ｐがその画素値をそのコンテキストで持つ確
率が０．５０であるときには、その画素の符号化のため
に１ビットだけ必要である。しかし、その確率が０．７
０ならば、１／２ビットしか必要でない。画素が予測可
能性がよければよいほど、その画素の符号化に必要なビ
ット又はビットの部分が少なくてよいので、コンテキス
ト・モデルが優れているほど圧縮率がよくなる。同一色
の大きな領域を持つ画像の場合、近傍画素の色はカレン
ト画素の色の良好な予測子であり、したがって、良好な
コンテキスト・モデルの一つは、近傍画素の色によりコ
ンテキストが決定されるモデルである。

【００１５】しかし、良好なコンテキスト・モデルを用
いる場合であっても、さらに高い圧縮率が可能であるし
望ましい。

【００１６】

【発明が解決しようとする課題】本発明の目的は、改良
した画像圧縮の方法及びそのための改良したコンテキス
ト・モデラー（modeller）を提供することにある。

【００１７】

【課題を解決するための手段】本発明によれば、複数入
力シンボル中の入力シンボルを圧縮するための方法が提
供される。この方法は、原画素を、該原画素と画素値が
同一性関係にあるとみなせる位置的に関連した画素（同
一性画素）と比較し、同一性結果を判定するステップ
と、該同一性結果の判定のために第１コンテキストモデ
ル（同一性コンテキストモデル）に従って、該原画素に
関連した少なくとも一つのコンテキスト画素もしくはそ
の位置に依存する同一性（sameness）コンテキストを決
定するステツプと、該同一性結果及び該同一性コンテキ
ストをエントロピー・コーダーへ出力するステップと、
該同一性結果が否定で、該原画素と該同一性画素とが等
しくない場合、第２コンテキストモデル（剰余コンテキ
ストモデル）に従って、該原画素に関連したコンテキス
ト画素もしくはその位置によって規定される剰余（resi
dual）コンテキストを決定して、剰余結果として該原画
素の表現及び剰余コンテキストをエントロピー・コーダ
ーへ出力するステップと、該エントロピー・コーダーを
使って、該同一性結果及び該剰余結果を符号化するステ
ップを有することを主たる特徴とするものである。

【００１８】本発明によれば、画素が入力され、結果値
及びコンテキスト値がエントロピー・コーダーに出力さ
れるところの、圧縮又は伸長システム用のコンテキスト
・モデラーが提供される。このコンテキスト・モデラー
は、複数のクロックサイクルのそれぞれにおいて画素を
受け取るために接続され、カレント画素値を格納する入
力画素レジスタ、該入力画素レジスタに接続されて該入
力画素レジスタの前の内容を格納し、それをコンテキス
トデータ用として出力するフレーム記憶、該フレーム記
憶及び該入力画素レジスタに接続され、該コンテキスト
データの第１の部分を該カレント画素値と比較し、同一
性表示を出力するコンパレータ、少なくとも該コンパレ
ータに接続され、少なくとも該同一性表示及び該コンテ
キストデータの第２の部分を記憶するコンテキストレジ
スタ、該入力画素レジスタに接続され、該カレント画素
値に基づいた結果値を出力する結果出力手段、該コンテ
キストレジスタに接続され、該同一性表示が肯定のとき
に該コンテキストレジスタの内容のビットをマスクして
同一性コンテキスト値を生成する同一性マスク、該コン
テキストレジスタに接続され、該同一性表示が否定する
ときに該コンテキストレジスタの内容のビットをマスク
して剰余コンテキスト値を生成する剰余マスク、該同一
性表示が肯定を示す時に該結果出力出段により出力され
た該結果値に対応する該コンテキスト値として該同一性
コンテキスト値を出力し、該同一性表示が否定を示す時
に該結果出力手段により出力された結果値に対応する該
コンテキスト値として該剰余コンテキスト値を出力する
制御ロジックを有することを主たる特徴とするものであ
る。

【００１９】

【発明の実施の形態】本発明は、２つのコンテキスト・
セット、すなわち、カレント画素値が前フレームの対応
位置の画素と同一であるか判定するためのコンテキスト
を提供するコンテキスト・セットと、前フレームの画素
と同一でない画素値を符号化する時にコンテキストを提
供するもう一つのコンテキスト・セットとを用いること
により、ビデオ・シーケンスに対する圧縮を改善する。

【００２０】本発明は、ビデオ・シーケンスの時間的に
接近した画素が、符号化しようとする画素のための貴重
なコンテキスト情報を提供すること、並びに、時間的に
接近した画素及び空間的に接近した画素が同一である場
合、その情報は、ただ一つのデシジョン（バイナリ・デ
シジョン、ただし１ビット程度に符号化されるもの）に
より表現できることに着目し、改善したコンテキストモ
デルを提供する。したがって、”同一性”（sameness）
判定を出力するコンテキスト・モデラーは、同一性が真
の時には処理をする必要も出力を出す必要もない。

【００２１】同一性デシジョンを用いると計算が減る。
これは、同一性デシジョンを復号する時には、伸長装置
が画素を前フレームの対応画素と同じであると判断する
と、その画素に対しそれ以上の復号は必要でないからで
ある。

【００２２】同一性テストに用いられる画素ペアは、二
つのフレームの対応した画素である必要はない。アプリ
ケーションによっては、同一性ビットは、カレント画素
値と前行の画素又は前フレームの位置がずれた画素の画
素値との同一性を表すこともあるからである。実際、カ
レント画素を、前に送られた任意の画素と比較してもよ
い。例えば、カメラが、フレーム間でシーンがどのよう
に変化するかを示すモーション・センサー出力を持って
いると、カレント画素を、カメラ自体の動きがなければ
前フレームの同一位置にあったであろう画素と比較して
もよい（このようなカメラは、１９９４年３月７日受理
された米国特許出願第０８／２０７，２４４号に示され
ている）。また、テーブル・ルックアップ、モーション
予測方式、その他の方法を、カレント画素と比較される
べき前画素を決定論的に選択するために用いてもよい。

【００２３】図１は圧縮が利用される一般化されたアプ
リケーションのブロック図である。このシステムでは、
データソースがデータを発生し、そのデータの最終的な
ユーザは制限されたチャネルにより時間的又は空間的に
データソースより分離されている。ユーザとデータソー
スとが分離していないか、チャネルが制限されていなけ
れば、実際には圧縮を必要としない。

【００２４】図１は、ビデオカセット１０２、スチル画
像１０４、ビデオシーケンス１０５、レンダリング画像
を作成するワークステーション１０６等の幾つかのデー
タソースを示している。データソースが画像データ、特
に画像フレームのシーケンスである場合、圧縮しない画
像又はシーケンスには大量のメモリが必要であるので、
圧縮が必要である。フレーム・シーケンスに関連して本
発明を説明するが、本発明はフレーム・シーケンスのデ
ータと同様の性質を持つ他の種類のデータに対しても有
効である。

【００２５】データが圧縮装置１０８に入力すると、圧
縮装置は、それが正しく設計されているならば、原デー
タより少ないビットからなる圧縮データを出力する。圧
縮装置１０８が非損失性の圧縮装置ならば、圧縮データ
のビットから原データを正確に復元可能である。データ
は、圧縮された後、あるチャネルへ加えられる。チャネ
ルの幾つかの例が図１に示されている。

【００２６】チャネルの一つはコンパクトディスクＲＯ
Ｍ（ＣＤ−ＲＯＭ）であり、ソフトウエア及び大きな画
像ファイルの頒布のための手段として用いられる。一枚
のＣＤ−ＲＯＭは６００ＭＢ（メガバイト）の容量を持
つであろうが、複雑なコンピュータゲームの中には画像
の記憶のためにそれ以上の容量を必要とするものがあ
る。そこで、より多量のデータを一枚のＣＤ−ＲＯＭに
納め、複数枚のディスクを絶えず交換する不便からユー
ザーを解放するため、データは一枚のＣＤ−ＲＯＭに納
まるよう圧縮される。

【００２７】もう一つのチャネルは、ビデオゲーム機用
のゲームカートリッジ１１２である。ゲームカートリッ
ジの制約はコストの問題である。すなわち、使用される
物理メモリが増えるにしたがって、各カートリッジの製
造コストが上昇する。圧縮を必要とする同様の制約は、
ディスクドライブ１１４やビデオテープカートリッジ１
１６のような他の記憶メディアにも当てはまる。

【００２８】ある種のチャネルの場合、制約は記憶容量
の制限ではなく、データ伝送回線１１８（電話回線、専
用回線、セルラー電話伝送網ケーブル、ＣＤ−ＲＯＭ
等）又はパケット網１２０で問題となるような伝送時間
及び帯域幅の制限である。このようなアプリケーション
において、１単位時間に伝送可能なビット数が制限され
かつデータが高レートで必要とされる時、あるいは、伝
送メディアの利用コストが伝送されたビット数により決
まるような場合、圧縮が望ましい。

【００２９】どのようにしてデータがデータソースで生
成され、データソースと時間的及び空間的に離れた最終
ユーザへ送られるとしても、最終ユーザによって、チャ
ネルを介して送られたもの及び予め分かっていることだ
けを使って、そのデータを伸長しなければならない。こ
の目的のために、伸長装置１２２は、圧縮装置１０８に
初めに与えられたデータソースを復元する。

【００３０】ソースとユーザが分かれているために、送
られた情報しか、その情報の伸長のために利用できな
い。勿論、データソースが伸長装置１１２にヒントを与
えることもできようが、そのようなヒントは伝送の際に
帯域幅を要するでうあろうし、圧縮ファイルのサイズの
一部としてカウントされることは間違いない。データソ
ースがヒントを別のチャネルを通じて供給することも可
能であろうが、圧縮システムを適切に評価する際には、
このデータは同じ様に圧縮データの一部とみなされるべ
きである。勿論、メモリ及び体域幅を真に削減する一方
法は、データソースと最終ユーザのシステムにアプリオ
リ（a priori）データを永久的に（あるいはアプリケー
ションによっては半永久的に）記憶しておくことであ
る。しかし、この方法では、伝送できるデータの種類が
限定される。例えば、ビデオゲームのメーカーとビデオ
ゲームシステムのデザイナーは通常、データのフォーマ
ット方法及び圧縮方法について合意している。そうでな
いと、帯域幅の一部を画像サイズ等のセットアップ情報
の通信のために使う必要があろう。一例では、画像は２
５６画素幅、２４０画素高さ、８ビット／画素に固定さ
れる。この情報を固定することにより、各画像の範囲の
境界決定のために帯域幅を使う必要がない。データソー
スとユーザシステムとの間で予め決めた情報は”アプリ
オリ情報”と呼ばれる。

【００３１】図２は、圧縮されていない画像（フレー
ム）のシーケンスを表す原ファイル２００及び原ファイ
ル２００の圧縮したものを表す圧縮ファイル２２０と共
に圧縮装置１０８の詳細を示す。本システムにより実行
される圧縮を画像又は画像シーケンスとの関連で説明す
るが、同様の特性を持つ他のデータも本システムにより
圧縮可能である。

【００３２】圧縮装置１０８は、圧縮ファイル２２０を
生成するために原データをコンテキスト・モデラー２０
２Ｃ及びエントロピー・コーダー２０８Ｃに通す。コン
テキスト・モデラー２０２Ｃは、原画素と画素クロック
を受け取るための入力を有する。実施例によっては、原
データ（画素）はセルフクロッキングであり、画素クロ
ックは必要でない。コンテキスト・モデラー２０２Ｃ
は、結果（result）の値と、この結果値のためのコンテ
キストを明らかにするコンテキスト・ビン（bin)識別子
（ＩＤ）を結果クロックの各サイクル毎に出力する。こ
の結果値は、２進エントロピー・コーダーの場合には２
進値であり、Ｍ進コーダーの場合にはＭ進値である。勿
論、Ｚａｎｄｉに教えられる如く、Ｍ進コーダーは２進
コーダーと追加のロジック又は処理によって実現でき
る。

【００３３】データがセルフクロッキングでなければ、
結果クロックも出力される。入力がデータ記憶装置であ
り、かつ、圧縮装置１０８の要素がソフトウエアモジュ
ールによって実現されるときには、それら要素はソフト
ウエアの働きによってセルフクロッキングされるのが一
般的である。

【００３４】コンテキスト・モデラー２０２Ｃは、カレ
ント画素によってフレーム記憶２０４Ｃを更新するた
め、及びフレーム記憶２０４Ｃからコンテキスト画素も
しくはコンテキストビットを読み出すため、フレーム記
憶２０４Ｃにも接続される。

【００３５】ここで、エントロピー・コーダー２０８Ｃ
を構成する要素の幾つかを説明する。確率予測器２１０
Ｃは、コンテキスト・モデラー２０２Ｃより結果（resu
lt）とコンテキストビンＩＤを受け取るように接続さ
れ、確率値とoutcome値（２進ビットジェネレータの場
合は２進値）を出力する。必要ならば、確率予測器２１
０Ｃはoutcomeクロックも出力する。確率予測器２１０
Ｃは、同一性コンテキストテーブル２１２Ｃ及び剰余
（residual）コンテキストテーブル２１４Ｃに、それら
テーブル内の確率値を更新し又読み出すために接続され
る。構成によっては、ハフマン又はＴｕｎｓｔａｌのビ
ットジェネレータ等、他の非２進ビットジェネレータ
（多ビット・ジェネレータ）も可能である。

【００３６】ビットジェネレータ２１６Ｃは、確率予測
器２１０Ｃより確率値とoutcome値を受け取って符号語
に対応したビットを出力し、端数ビットを端数ビット記
憶２１８Ｃに保存する。ビットジェネレータ２１６Ｃよ
り出力されるビットストリームが圧縮ファイル２２０を
形成する。

【００３７】圧縮装置１０８はまた、コンテキスト・モ
デラー２０２Ｃに接続された２つの出力を持つコンテキ
ストモデル・コントローラ２０６Ｃを含む。その一方の
出力は同一性コンテキストモデル・マスクを与え、他方
の出力は剰余コンテキストモデル・マスクを与える。こ
れら二つのマスクがアプリオリ情報でなければ、それら
マスクはパス２２２Ｃを介し圧縮ファイル２２０に格納
される。

【００３８】動作を説明する。画素クロックの各サイク
ル期間に、圧縮装置１０８は原画素を格納しているファ
イル２００より入力画素（”カレント”画素）を受け取
る。圧縮装置１０８は、カレント画素に応じて、ある数
のビットを圧縮ファイル２２０へ出力する。ここで、こ
のビット数は圧縮装置１０８の状態に依存し、０ビット
のこともある（すなわち、入力画素サイクルでビットが
全く出力されないこともある）。ビットが出力されない
場合、圧縮装置１０８の内部状態は変更される。このこ
とは、その後の１つ又は複数の圧縮ビットに反映され
る。

【００３９】各画素サイクルは、いくつかの結果もしく
はエントロピーサイクルに分割されるかもしれない。例
えば、画素が８ビットの大きさで、エントロピー・コー
ダーが２進コーダーの場合、各画素サイクルは８つの結
果もしくはエントロピーサイクルを持ち、各エントロピ
ーサイクルにつき１個のコンテキストビン値と結果ビッ
トがある。

【００４０】コンテキスト・モデラー２０２Ｃは、入力
画素を受け取って、コンテキストビンＩＤと結果値の組
を１つ以上出力する。一実施例では、画素はある数のビ
ットで表され、１エントロピーサイクルで、結果値の１
ビットと１つのコンテキストビンＩＤが処理される。別
の実施例では、結果値は８ビット値であり、単一のコン
テキストＩＤが用いられ、エントロピー・コーダーは、
Ｗitten，Ｈ.，Ｒ．Ｎeal and Ｊ．Ｇ．Ｃleary，”Ａr
ithmetic coding for data compression,”Ｃomm. of t
he ＡＣＭ，Ｊune １９８７，Ｖol．３０，pp．５２０
−５４０に述べられているような多シンボル算術コーダ
ーである。

【００４１】コンテキスト・モデラー２０２Ｃは、以下
に詳述する方法によって、コンテキストビンＩＤと結果
を決定する。コンテキストは、デコーダーにより判定可
能なカレント画素の環境に関する何か、例えば、カレン
ト画素の左側に見つかる画素値、あるいは左側の画素値
と結果ビットのビットプレーン（例えばカレント画素内
の結果ビットの位置）とを組み合わせたようなサブコン
ビネーションの組み合わせを示す。幾つかの前画素だけ
が用いられる場合、これをデータのマルコフモデルと呼
ぶ。

【００４２】コンテキストモデルは、カレント画素とそ
の周辺画素のどの属性をコンテキストの決定に用いるか
制御する。画素が圧縮装置１０８に入力される順序は分
かってので、コンテキスト・モデラー２０２Ｃは、カレ
ント画素がどのフレームのものかと、そのフレーム内の
カレント画素の位置が分かる。

【００４３】最初、フレーム記憶２０４Ｃは空であるの
で、ごく初めの画素に対してはコンテキストを提供でき
ないかもしれない。しかし、フレーム記憶にアプリオリ
値を入れておくだけで、すべての結果のためのコンテキ
ストを用意できる。最初のフレームの後では、フレーム
記憶２０４Ｃには少なくとも１つのフルフレームが入っ
ている。フレーム記憶２０４Ｃが一杯になると、新しい
画素が格納される時に最も古い画素が上書きされる。フ
レーム記憶２０４Ｃは将来のコンテキストを決定するた
めに必要な値を保持できるだけの大きさがあれば足り
る。例えば、直前フレームより前の画素値を参照するコ
ンテキストがなければ、１フルフレーム分の記憶容量し
か必要でない。実施例によっては、フレーム記憶が既に
存在するので、追加のメモリは必要でない。

【００４４】コンテキスト・モデラー２０２Ｃにより出
力されるコンテキストビンＩＤは、カレント画素のコン
テキスト、並びに同一性モード及び剰余（residual）モ
ードから選ばれた一つのモードを指示する。勿論、オー
バーラップしないコンテキストビンＩＤを適切に割り当
てれば、コンテキストビンＩＤが出力されるだけでよ
い。条件付き確率を二つのコンテキストテーブルに分け
たことを別にすれば、確率予測器２１０Ｃの動作は一般
的な確率予測器の動作と同様である。勿論、同一性コン
テキストビンＩＤを剰余コンテキストビンＩＤと区別で
きるならば、同一性コンテキストと剰余コンテキストの
合計数に等しいエントリー数を持つ単一のテーブルを用
いて確率予測器２１０Ｃを構成することができる。

【００４５】コンテキスト及び結果が確率予測器２１０
Ｃへ出力されると、確率予測値（outcome）がビットジ
ェレータ２１６Ｃへ転送される。２進エントロピー・コ
ーダーでは、このoutcomeは結果が最高確率シンボルで
あるか否かを表す。このため、確率予測値は常に０.５
以上である。多シンボル算術コーダーではoutcomeは結
果に先行するリスト内の全シンボルの確率の予測値かも
しれない。

【００４６】確率予測値及びoutcomeがビットジェネレ
ータ２１６Ｃに送られた後、結果は確率予測器２１０Ｃ
によって確率予測値の更新のために利用される。この更
新が終わると、当該コンテキストビンＩＤの次の出現に
対する確率予測値の準備ができるが、それは復号時に利
用可能な情報だけに基づいている（すなわち、カジュア
ル（casual）である）。

【００４７】ビットジェネレータ２１６Ｃは、確率予測
器２１０Ｃにより与えられたoutcomeとその結果の確率
予測値を用いて内部状態すなわちビットジェネレータ２
１６Ｃの状態を変更し、圧縮ビットをそれが適当ならば
出力する。ある実施例では、ビットジェネレータ２１６
Ｃは、Ａｌｌｅｎ等に付与され本発明の譲受人に譲渡さ
れた米国特許第５，２７２，４７８号に見られるＢ−コ
ーダーのようなビットジェネレータである。ある実施例
では、エントロピー・コーダー２０８ＣはＩＢＭ社開発
のＱ−コーダー、又は１９９３年２月１０日受理された
米国特許出願第０８／０１６，０３５号に示されている
リコー社のＡｌｌｅｎ等のＡＢＳコーダーのようなエン
トロピー・コーダーである。

【００４８】図３は、圧縮装置１０８と同要素の多くを
持つ伸長装置１２２を詳細に示す。伸長装置１２２と圧
縮装置１０８の同様要素を区別するため、伸長装置１２
２の要素は、添え字”Ｃ”に代えて添え字”Ｄ”を付け
た同様番号で表される。例えばコンテキスト・モデラー
２０２Ｄ、フレーム記憶２０４Ｄ、コンテキストモデル
・コンテローラ２０６Ｄ、並びに確率予測器２１０Ｄ，
コンテキストテーブル２１２Ｄ，２１４Ｄ、ビットジェ
ネレータ２１６Ｄ及び端数ビット記憶２１８Ｄからなる
エントロピー・デコーダー２０８Ｄというようにであ
る。伸長装置１２２と圧縮装置１０８との間に幾つかの
違いがあるが、とるに足りない。

【００４９】伸長装置１２２においては、コンテキスト
ビンＩＤはフレーム記憶からの画素を用いて決定され、
コンテキスト・モデラー２０２Ｄは、そのようにして決
定したコンテキストビンＩＤを確率予測器２１０Ｄに与
える。確率予測器２１０Ｄは、２進エントロピー・コー
ダーの場合には最高確率シンボルのための確率を決定
し、また、多シンボル算術コーダーの場合には確率分布
を決定する。そして、ビットジェネレータ２１６Ｄは、
この確率情報並びに端数ビット記憶２１８Ｄ及び圧縮ビ
ットストリームを用いてoutcomeを決定する。このoutco
meは、確率予測器２１０Ｄに戻されるが、通常、圧縮プ
ロセスにおいて確率予測器２１０から出されたoutcome
と同じものである。次にビットジェネレータ２１６Ｄ
は、その端数ビット記憶２１８Ｄを更新する。

【００５０】確率予測器２１０Ｄは、outcomeを用いて
結果（result）を決定する。この結果は、通常、符号化
時にコンテキスト・モデラー２０２Ｃにより初めに決定
された結果と同一である。確率予測器２１０Ｄは、この
結果をコンテキスト・モデラー２０２Ｄに渡した後、コ
ンテキストビンＩＤにマッチしたコンテキストメモリ２
１２Ｄ又は２１４Ｄを更新する。コンテキスト・モデラ
ー２０２Ｄは、結果を用いてフレーム記憶を更新し、原
画素を生成し、そして次のコンテキストビンＩＤを決定
する。コンテキストモデル・コントローラ２０６Ｄは、
コンテキストモデル・コントローラ２０６Ｃと同じ動作
をする。

【００５１】圧縮と伸長の両方を行なうシステムの場
合、コンテキスト・モデラー、フレーム記憶等のいくつ
かの要素は、同じものが圧縮装置と伸長装置の両方のた
めに働く。

【００５２】図４は、コンテキスト・モデラー２０２Ｃ
の詳細ブロック図である。図示しないが、コンテキスト
・モデラー２０２Ｄの詳細構成も同様である。図４に示
されるように、コンテキスト・モデラー２０２Ｃは、カ
レント画素を保持するための画素レジスタ４０２、図６
に示されるプリコーディング・プロセスを実行するため
の制御ロジック４０４Ｃ、ビットプレーンが別々に処理
されるときにカレント画素のどのビットが現在処理され
ているか指示するためのビットプレーン（ＢＰ）レジス
タ４０６、カレント画素の位置を保持するためのカーソ
ル位置（ＣＰ）レジスタ４０８、同一性信号を発生する
ためのコンパレータ４１０、フルコンテキスト（ful co
ntext）レジスタ４１２、２つのコンテキスト・マスク
ＲＭＡＳＫ，ＳＭＡＳＫ、及び更新バッファ４１４から
なる。

【００５３】コンテキスト・モデラー２０２Ｃ内部の相
互接続は次の通りである。画素レジスタ４０２は、カレ
ント画素のための入力と、画素クロックＰＣＬＫを受け
取るためののクロック入力とを有する。画素レジスタ４
０２は、カレント画素を制御ロジック４０４Ｃ、コンパ
レータ４１０及び更新バッファ４１４に出力する。制御
ロジック４０４Ｃはまた、ＰＣＫＬ用のクロック入力、
並びに、カレント画素及びテストＸ＝＝Ｔ（後述）の結
果のための入力も持っている。制御ロジック４０４Ｃ
は、ビットプレーン・インジケーター（ＢＰレジスタ４
０６へ送られる）用出力、更新バッファ４１４のクロッ
キングのための更新クロック（ＵＣＬＫ）の出力、コン
テキスト・マスクＲＭＡＳＫ，ＳＭＡＳＫの一つを選択
するためのモードセレクターの出力、及び結果値のため
の出力を有する。ＲＭＡＳＫマスクは剰余モードでアク
ティブであるのに対し、ＳＭＡＳＫは同一性モードでア
クティブである。アクティブなマスクは、カレント・コ
ンテキストを作るためフルコンテキスト・レジスタ４１
２をマスクするのに用いられる。制御ロジック４０４Ｃ
の結果出力は、コンテキスト・モデラー２０２Ｃの結果
出力である。

【００５４】更新クロックＵＣＬＫは、カレント画素の
ためのコンテキストが得られた後にフレーム記憶２０４
Ｃを更新するために更新バッファ４１４をクロックす
る。勿論、カレント画素のためのコンテキストを形成す
るどの画素も上書きすることなくカレント画素を保持で
きるだけのスペースがフレーム記憶２０４Ｃにあれば、
ＵＣＫＬの代わりにＰＣＬＫを使用できる。

【００５５】ＢＰレジスタ４０６、コンパレーター４１
０、ＣＰレジスタ４０８はそれぞれフルコンテキスト・
レジスタ４１２にビット又は画素を供給する。そして、
レジスタ４１２の内容はモードで指定されたマスクによ
りマスクされ、マスクされた内容がコンテキスト・モデ
ラー２０２Ｃにより出力されるコンテキストビンＩＤと
して出力されるが、これについては図５及び以下の記述
により詳しく説明する。ＲＭＡＳＫ及びＳＭＡＳＫは、
コンテキストモデル・コントローラー２０６Ｃから様々
なマスクをロードさせるための入力を有する。

【００５６】１画素クロック（ＰＣＬＫ）サイクル期間
におけるコンテキスト・モデラー２０２Ｃの動作を説明
する。まず、カレント画素が画素レジスタ４０２に読み
込まれる。ＣＰレジスタ４０８は、カレント画素のため
のコンテキスト画素を取得するためにフレーム記憶２０
４Ｃを”アドレス”する。典型的なコンテキストモデル
は、カレント画素の左側の画素がコンテキストを形成す
るというものである。この場合、左側の画素がフレーム
記憶２０４Ｃから読み出されることになろう。この時、
ＣＰレジスタ４０８はカレント画素がどこにあるか、し
たがって”左側の画素”がどこに見つかるかを指示す
る。コンテキスト画素のいくらかが、コンパレータ４１
０によって相互に及びカレント画素と比較される。図４
に示されるように、カレント画素（”Ｘ”と表示）は、
カレントフレーム中におけるカレント画素と同じ位置に
ある直前フレーム中の画素（”Ｔ”と表示）と比較され
る。この比較の結果は制御ロジック４０４Ｃへ与えられ
る。これ以外の比較の結果、例えば左側画素と前フレー
ムの対応画素との比較の結果はフルコンテキスト・レジ
スタ４１２へ送られる。

【００５７】図５は、フルコンテキスト・レジスタ４１
２及びコンテキストマスクの可能な一構成を示す（図５
には、図４と対応したスケールでは示されていないが、
明細書及び各図によってレジスタ及びマスクのビットの
対応関係は明らかである）。コンテキスト画素は、カレ
ント画素に関係した画素であるので、画素毎に異なる。
図５において、カレント画素は”Ｘ”と表され、Ｘの左
側の画素は”Ｈ”と表され、Ｘと同じ垂直カラムの直上
の画素は”Ｖ”と表され、Ｘの左上の画素は”Ｄ”と表
示される。Ｘの近傍にあるがＨ，Ｖ，Ｄより遠い画素
は、Ｈ１，Ｈ２，Ｈ３，Ｖ１，Ｖ２，Ｄ１，Ｄ２等々と
表される。右側と下の画素はコンテキストのために利用
されないが、カレント画素は復号可能である。というの
は、前に指摘したように、画像は上から下へ、左から右
へとシーケンシャルに圧縮され、また同じ順番で伸長さ
れるからである。

【００５８】コンテキスト画素は２つ以上のフレームか
ら引き出されるかもしれない。これらの複数フレーム
は、カレントフレーム（Ｃ）、直前フレーム（Ｐ）、す
ぐ次のフレーム（Ｎ）、Ｎの次のフレーム（２Ｎ）とい
うように表されている。フルコンテキスト・レジスタ４
１２は、４２ビットがコンテキストモデルに包含可能で
あるとして示されている。実際的には、結果として得ら
れるコンテキストビンの数（２＾４６）は大きすぎて実
用的でないので、４６ビット全部がコンテキストに影響
を与えるわけではない。表１は、一例としての幾つかの
同一性コンテキストモデルを、ＳＭＡＳＫの値と一緒に
示す。勿論、構成に応じて、４６ビットより多い又は少
ないビットを用いてもよく、及び／又は異なったコンテ
キストモデルを用いてもよい。

【００５９】

【表１】

【００６０】表１においては、簡単にするために、同一
性テストの結果ａ＝＝ａ_p を示すために関数Ｓ（ａ）が
用いられる。ここで、添え字ｐは前フレームからの画素
のビットを示すためにもちいられる。ＴはＸｐの代わり
に用いられる。モデル０は、同一性コーディングは使わ
ないが比較のために含められている。モデル１は同一性
コーディングを使うが、異なる同一性コンテキストを用
いない。

【００６１】図６は、カレント画素を結果とそれに対す
るコンテキストに変換するためにコンテキスト・モデラ
ー２０２Ｃが実行するプロセスのフローチャートであ
る。初めに、コンテキストモデル・コントローラー２０
６Ｃは同一性コンテキストモデル及び剰余コンテキスト
モデルを決定しＳＭＡＳＫ及びＲＭＡＳＫをロードする
（ステップＣ１）。それらが設定されると、制御ロジッ
ク４０４Ｃは画素クロックをサイクルさせてカレント画
素を画素レジスタ４０２にロードする（ステップＣ
２）。ある実施例では、制御ロジック４０４Ｃはマスク
をカジュアルに適応変更する。

【００６２】次に、フルコンテキスト・レジスタ４１２
を更新しＳＭＡＳＫでマスクすることにより、同一性コ
ンテキストが調決定される（ステップＣ３）。動的（適
応的）コンテキスト・モデリングが用いられるときに
は、初めに動的コンテキストモデルが決定される（ステ
ップＣ３’）。カレント画素をＸとして、同一性テスト
Ｘ＝＝Ｔが行われ（Ｃ４）、このテスト結果が真なら
ば、カレント画素の同一性コンテキストとともに結果値
１が出力される（Ｃ５）。同一性テストは、カレント画
素が前フレームの対応画素と同一であるか否か（すなわ
ち、カレント画素の色が前フレームと変わったか否か）
を検査する。このテストは、Ｘ＝＝Ｔで表現され、コン
パレータ４１０によって実行される。コンパレータ４１
０は、フレーム記憶２０４ＣよりＴを読み込み、画素レ
ジスタ４０２よりＸを読み込む。Ｘ＝＝Ｔが真ならば、
カレント画素について他に情報を出力する必要はない。

【００６３】Ｘ＝＝Ｔが偽ならば、カレント画素の同一
性コンテキストとともに、否定テスト結果（０）が結果
として出力される（Ｃ６）。１画素について同一性結果
は一つしか出力されないから、ビットプレーン位置は同
一性コンテキストの要素ではない。同一性テストでＸと
Ｔが異なるときには、コンテキスト・モデラー２０２Ｃ
は、Ｘ値の指示を出力しなければならない。これが、本
明細書では剰余コーディングと呼ばれる。同一性テスト
は、画素とプライア・フレームの画素の単なる時間的な
（temporal）同一性を越えて一般化されるが、テストが
Ｘ＝＝Ｔの時には、同一性モードを時間的（temporal）
モードと呼ぶことができ、剰余モードを非時間的（nont
emporal）モードと呼ぶことができる。

【００６４】剰余モードでは、原画素は一度に１ビット
出力される。こうするために、制御ロジック４０４Ｃは
ＢＰレジスタ４０６を最初のビットプレーンを指すよう
に初期化し（Ｃ７）、カレント画素及びカレントビット
プレーンに対する剰余コンテキストを決定し（Ｃ８）、
ｂ（ＢＰ，Ｘ）を結果として出力する（Ｃ９）。ここ
で、ｂ（）はビットプレーンＢＰにあるＸのビットを取
り出す関数である。剰余コンテキストは”０”が先行し
同一性コンテキストは”１”が先行するので、コンテキ
スト出力と結果出力を受け取ったエントロピー・コーダ
ーは、同一性テストの結果と剰余結果とを区別できる。

【００６５】剰余ビットが出力された後、ビットプレー
ンが最後のビットプレーンであるか確認するため、その
ビットプレーンがビットプレーン数（ＢＰＮ）と比較さ
れる（Ｃ１０）。他のビットプレーンが残っているとき
には、ＢＰレジスタがインクリメントされ（Ｃ１１）、
プロセスはステップＣ８より繰り返される。ビットプレ
ーンが残っていないときは、プロセスはステップＣ１２
より継続し、圧縮すべき画素が残っているか確認するた
めのテストが行われる。このステップはステップＣ５の
後でも実行される。他の画素が残っているときは、制御
ロジック４０４ＣはＵＣＫＬをサイクルしてフレーム記
憶２０４Ｃを更新し（Ｃ１３）、次にＰＣＬＫをサイク
ルして次の画素を取得する（Ｃ１４）。画素が残ってい
ないときは、プロセスは終了する（Ｃ１５）。

【００６６】以上の説明及び図６は２進コーダーに適し
た剰余結果出力を述べたが、Ｍ進コーダーに適合するよ
うに調整することは簡単である。例えば、ＢＰレジスタ
を省き、ＸがＴと等しくない時に１画素につき一つの剰
余結果だけ出力する（ＸとＴが等しい時には何も出力し
なくてよい）。

【００６７】異なった剰余コンテキストモデルの例を表
２に示す。ビットプレーン・コーディングはカレントビ
ットプレーンを表現するために３ビットのコンテキスト
を用いるが、模擬Ｍ進コーディングはプライア・ビット
プレーンのビットに基づいた２５５のコンテキストを使
う（Ｚａｎｄｉに述べられている）。表２においては、
簡単にするため、Ｍ進コーディングに必要なコンテキス
トの数は２５６に丸められている。

【００６８】

【表２】

【００６９】表２において、ＢＰはカレントビットプレ
ーン値を指し、関数ｂ（）はパラメータ画素のためのビ
ットプレーンＢＰのビットの値を指す。各剰余コンテキ
ストモデルのためのＲＭＡＳＫ用の値は表１のＳＭＡＳ
Ｋと同じ方法で容易に決定できる。

【００７０】図７は、伸長プロセスのフローチャートで
ある。このプロセスについて、図７並びに図３を参照し
て説明する。このプロセスは、コンテキスト・モデラー
２０２Ｄを含む伸長装置１２２により実行される。コン
テキスト・モデラー２０２Ｄはコンテキスト・モデラー
２０２Ｃと同様であるが、コンテキスト・モデラー２０
２Ｄは結果を入力し、入力を出力するので、異なった制
御ロジックを必要とする点が相違する。

【００７１】伸長プロセスが開始すると、同一性コンテ
キストモデルと剰余コンテキストモデルが決定される
（ステップＤ１）。当然、この同一性コンテキストモデ
ル及び剰余コンテキストモデルがアプリケーションを通
じて固定されるときには、コンテキストモデル・コント
ローラは必要でない。いくつかのコンテキストモデルが
用いられるときには、これらコンテキスモデルはプライ
ア・データに基づいて決定論的に決定されても、圧縮デ
ータとともに圧縮ファイル２２０に挿入されてもよい。
コンテキストモデル情報は圧縮プロセス中にパス２２２
Ｃ（図２に示されている）を経由して圧縮ファイル２２
０へ送られ、また、伸長プロセス中にパス２２２Ｄを経
由し取り出される。

【００７２】コンテキスト・モデラー２０２Ｄは次に、
カレント同一性コンテキストを決定し（ステップＤ
２）、これを確率予測器２１０Ｄへ出力する（ステップ
Ｄ３）。動的コンテキストモデル再構成（reconfigurat
ion）が圧縮に使用された場合には、伸長中ステップＤ
２の前にコンテキストモデルが再構成される（ステップ
Ｄ１’）。コンテキスト情報が与えられると、確率予測
器２１０Ｄは該コンテキストの確率をビットジェネレー
タ２１６Ｄに出力することができる。ビットジェネレー
タ２１６Ｄは、該情報を用いて圧縮画像から何ビット読
み出すべきか決定し、また、該情報を用いて、読み出し
たビットからの矛盾のないoutcomeと確率を決定する。
ビットジェネレータ２１６Ｄはoutcome値を確率予測器
２１０Ｄへ出力し、確率予測器２１０Ｄは該outcomeを
結果に変換し、カレントコンテキストに対するその確率
テーブルを更新し、そして、該結果をコンテキスト・モ
デラー２０２Ｄへ出力する（ステップＤ４）。圧縮画像
は順序付けられているので、最初のコンテキストは同一
性コンテキストであることが分かっている。

【００７３】コンテキスト・モデラー２０２Ｄは結果を
チックする（Ｄ５）。結果が１ならば、カレントＸがＴ
と同一であったということであり、コンテスト・モデラ
ー２０２Ｄはフレーム記憶２０４ＤよりＴを読み出し、
Ｔをカレント画素として出力する（Ｄ６）。コンテキス
ト・モデラー２０２Ｄは次に他に画素があるかチェック
する（Ｄ７）。他に画素があるならばフレーム記憶２０
４Ｄが画素Ｘで更新されるが（Ｄ８）、他に画素がなけ
ればプロセスは終了する（Ｄ９）。

【００７４】ステップＤ５で同一性結果が０ならば、カ
レント画素がＴと異なるということであるので、コンテ
キスト・モデラー２０２Ｄは剰余モードに入り、剰余結
果が否定同一性結果の後に続くことを期待する。剰余モ
ードでは、最初のビットプレーンを処理するため、カレ
ントビットプレーン（ＢＰ）を最初のビットプレーンに
設定し（Ｄ１０）、カレントビットプレーンのための剰
余コンテキストを決定し（Ｄ１１）、そのコンテキスト
を確率予測器２１０Ｄへ出力し（Ｄ１２）、確率予測器
２１０Ｄから結果を受け取り（Ｄ１３）、この結果をｂ
（ＢＰ，Ｘ）すなわちＸの第ＢＰビットとして出力する
（Ｄ１４）。このビットは画素全体が得られるまで別々
に出力し又はバッファしてよい。

【００７５】一つのビットプレーンに対する結果が得ら
れた後、制御ロジックが他にビットプレーンがあると判
定したときには（Ｄ１５）、ＢＰがインクリメントされ
（Ｄ１６）処理はステップＤ１１へ戻る。そうでないと
きには、カレント画素が出力され（Ｄ１７）、制御ロジ
ックはステップＤ７へ戻って他に画素があるかチェック
する。

【００７６】これで図面の説明を終わった。要約すれ
ば、図面に示したシステムを利用し、データは圧縮され
てから限定されたチャネルに通され、それから最終ユー
ザーにより伸長される。上記例はフレームのシーケンス
であるデータの圧縮に関するものであって、各フレーム
は一つのディジタイズ画像である。圧縮装置はフレーム
を圧縮するためにエントロピー・コーダーを用い、コン
テキスト・モデラーがモードに応じて、カレント画素の
ためのコンテキスト又はカレント画素のカレントビット
を提供する。カレント画素が同一性コンテキストのため
に用いられた画素と同一である場合、同一性モードで同
一性結果がエントロピー・コーダーへ指示され、二つ以
上の同一性コンテキストが用いられるときの結果に対す
る同一性コンテキスト以外は、カレント画素について他
の情報は与えられる必要がない。

【００７７】上例において、同一性テストに用いられる
画素はカレント画素と同位置にあるプライア・フレーム
の画素であり、したがって同一性は時間的（temporal）
同一性である。同一性テストが否定ならば、すなわち、
それら画素が異なるときには、圧縮装置は剰余モードに
スイッチし、カレント画素が１つ以上の剰余コンテキス
ト及び剰余結果とともにエントロピー・コーダーへ与え
られる。

【００７８】伸長装置は、フレームを伸長するために、
カレント画素に対するコンテキストを決定してビットス
トリームからカレント画素を復号する。コンテキストモ
デルの変更を可能にするため、コンテキストモデル・コ
ントローラが設けられる。コンテキストモデルが変更さ
れる場合、使用されるコンテキストモデルを圧縮データ
の一部に含めてもよい。

【００７９】圧縮プロセスにおいて、同一性情報の利用
に関する相対的性能を測定するため、幾つかの実験が行
われた。この実験のために、三つのパレット化（palett
ized）フレームシーケンスが用いられた。第１のシーケ
ンスは、同一色背景上の動くテキストを表すシーケンス
であり、３色だけ使用する。第２のシーケンスは、静止
した格子板パターンの前方にあるレイトレーシングの球
体を表し、多数の色を使う。第３のシーケンスはアニメ
ーション映画のディジタイズドクリップ（digitized c
lip）であり、２５２色を使い、クリップ内で幾つかの
シーン変化がある。このデジタイズドクリップには、そ
れを取り込む過程で入り込んだノイズが含まれている。
表３は、同一性コーディングを使った場合と使わない場
合のこれら三つのシーケンスの圧縮性を示す。使用した
同一性テストは時間的（temporal）テストである。

【００８０】

【表３】

【００８１】表３に見られるように、同一性コーディン
グは多くのシーケンスの圧縮率を改善することができ
る。映画のシーケンスはいずれの場合もあまり圧縮性が
よくないが、一般的なノイズの殆どない生成又はデジタ
イズした高品質シーケンスは、レイトレーシングのシー
ケンスと取り込んだ映画シーケンスの間の結果をもたら
すと予想される。

【００８２】これら三つのシーケンスについて、使用す
るのに最良の同一性コンテキストモデル及び剰余モデル
を決定するためにさらに実験が行われた。表３に対する
結果は、最良のパフォーマンスを提供する同一性コンテ
キストモデル及び剰余コンテキストモデルを使って得ら
れた（同一性コンテキストモデルは非同一性コーディン
グには無意味である）。実験結果は、カレント画素の前
フレーム画素ＴとＭ進コーディングに基づくコンテキス
ト（表２の剰余モデル３）が同一性コーディング及び非
同一性コーディングの両方で一番有効であった。同一性
コーディングでは、使用した剰余コーディングに関係な
く、同一性モデル６（表１）が全ての同一性モデル中で
最も有効であり、また、これら二つの組み合わせが総合
的に最も有効であった。

【００８３】レイトレーシングのシーケンス及び映画シ
ーケンスのいずれについても、同一性コンテキスト１０
が同一性コーディングのために最も有効との傾向であっ
たが、いずれの場合にも、それよりも複雑でない同一性
モデルであるコンテキスト数２＾８のモデル６が、より
複雑な同一性モデルであるコンテキスト数２＾１７のモ
デル１０とほぼ同様の性能を発揮した。

【００８４】実験の結果を表４から表６に示す。これら
は、同一性コンテキストモデル及び剰余コンテキストモ
デルのそれぞれにより３つのシーケンスを圧縮した場合
のビットレート（bit rate）を表にしたものである
（圧縮しない画像のビットレートは８．０の場合）。各
同一性コンテキストモデルの最良結果にはアスタリスク
（”＊”）が付けられており、各剰余モデルの最良結果
には十字記号（”†”）が付けられている。表１に示す
ように、同一性モデル０は非時間的な（nontemporal)ケ
ースである。実験はしなかったが、Ｚａｎｄｉの教える
パレット再整理（reordering）を利用すれば、ビットプ
レーン剰余コーディング（モデル１とモデル４）の圧縮
率は改善されるはずである。

【００８５】

【表４】

【００８６】

【表５】

【００８７】

【表６】

【００８８】以上述べたことは本発明の説明のためのも
のであって、本発明を限定することを意図したものでは
ない。当業者にとって、以上の開示内容を吟味すれば本
発明の多くの変形が明白になろう。

【００８９】

【発明の効果】以上の説明から明らかなように、本発明
によれば、ビデオシーケンス等の圧縮の目的に好適な改
良した圧縮方法と、そのための改良したコンテキスト・
モデラーを実現できる。

【図面の簡単な説明】

【図１】データを効率的に記憶及び伝送するために圧縮
及び伸長を利用する幾つかのアプリケーションのブロッ
ク図である。

【図２】図１に示した圧縮装置の詳細図である。

【図３】図１に示した伸長装置の詳細図である。

【図４】図２に示した圧縮装置のコンテキスト・モデラ
ーの詳細図である。

【図５】同一性コンテキスト及び剰余コンテキストを生
成するため前後関係画素がどのように用いられるかの説
明図である。

【図６】コンテキスト・モデラーにより実行されるプリ
コーディングプロセスのフローチャートである。

【図７】コンテキスト・モデラーにより実行される復号
プロセスのフローチャートである。

【符号の説明】

１０２ビデオカセット１０４スチル画像１０５ビデオシーケンス１０６ワークステーション１０８圧縮装置１１０ＣＤ−ＲＯＭ１１２ゲームカートリッジ１１４ディスクドライブ１１６ビデオテープカートリッジ１１８データ伝送回線１２０ＴＣＰ／ＩＰパケット網１２２伸長装置１２４圧縮フレームシーケンス２００原ファイル２０２Ｃ，２０２Ｄコンテキスト・モデラー２０４Ｃ，２０４Ｄフレーム記憶２０６Ｃ，２０６Ｄコンテキストモデル・モデラー２０８Ｃエントロピー・コーダー２０８Ｄエントロピー・デコーダー２１０Ｃ，２１０Ｄ確率予測器２１２Ｃ，２１２Ｄ同一性コンテキストテーブル２１４Ｃ，２１４Ｄ剰余コンテキストテーブル２１６Ｃ，２１６Ｄビットジェネレータ２１８Ｃ，２１８Ｄ端数ビット記憶２２０圧縮ファイル２２２Ｃ，２２２Ｄパス４０２画素レジスタ４０４Ｃ制御ロジック４０６ビットプレーン（ＢＰ）レジスタ４０８カーソルポインター（ＣＰ）レジスタ４１２フルコンテキストレジスタ

───────────────────────────────────────────────────── フロントページの続き (56)参考文献特開平４−122174（ＪＰ，Ａ) 特開平６−224777（ＪＰ，Ａ) 特開平６−315089（ＪＰ，Ａ) 特開平８−265800（ＪＰ，Ａ) (58)調査した分野(Int.Cl.⁷，ＤＢ名) H04N 7/24

Claims

(57)【特許請求の範囲】

【請求項１】複数入力シンボル中の入力シンボルを圧
縮するための方法であって、原画素を、該原画素と画素値が同一性関係にあるとみな
せる位置的に関連した画素（以下、同一性画素と称す）
と比較し、同一性結果を判定するステップと、該同一性結果の判定のために第１コンテキストモデル
（以下、同一性コンテキストモデルと称す）に従って、
該原画素に関連した少なくとも一つのコンテキスト画素
もしくはその位置に依存する同一性コンテキストを決定
するステツプと、該同一性結果及び該同一性コンテキストをエントロピー
・コーダーへ出力するステップと、該同一性結果が否定で、該原画素と該同一性画素とが等
しくない場合、第２コンテキストモデル（以下、剰余コ
ンテキストモデルと称す）に従って、該原画素に関連し
たコンテキスト画素もしくはその位置によって規定され
る剰余コンテキストを決定して、剰余結果として該原画
素の表現及び剰余コンテキストをエントロピー・コーダ
ーへ出力するステップと、該エントロピー・コーダーを使って、該同一性結果及び
該剰余結果を符号化するステップを有する圧縮方法。
【請求項２】請求項１記載の圧縮方法において、該原
画素はフレームシーケンス中の画素であり、該同一性関
係は、該同一性画素がカレントフレーム中の該原画素の
画素位置に対応した位置にある前フレーム中の画素であ
るという関係である、ことを特徴とする圧縮方法。
【請求項３】請求項１記載の圧縮方法において、該原
画素はフレームシーケンス中の画素であり、該同一性関
係は、該同一性画素が少なくともシーン中の１点を少な
くとも近似的に表すところの前に伝送された画素であっ
て、該１点も該原画素により表されるという関係であ
る、ことを特徴とする圧縮方法。
【請求項４】該同一性画素として用いられた前に伝送
された画素の位置を検出するためフレーム間の動き予測
を実行するステップをさらに有することを特徴とする請
求項３記載の圧縮方法。
【請求項５】請求項１記載の圧縮方法において、該同
一性コンテキストモデルは、該同一性コンテキストがコ
ンテキスト画素について実行された同一性テストの同一
性テスト結果にも依存するというものである、ことを特
徴とする圧縮方法。
【請求項６】請求項１記載の圧縮方法において、該原
画素の表現を出力するステップは、２進の剰余結果及び
該剰余結果の各ビットプレーンに対するビットプレーン
剰余コンテキストを出力するステップを有することを特
徴とする圧縮方法。
【請求項７】請求項１記載の圧縮方法において、該エ
ントロピー・コーダーは２進コーダーであることを特徴
とする圧縮方法。
【請求項８】請求項１記載の圧縮方法において、該エ
ントロピー・コーダーはＭ進コーダーであることを特徴
とする圧縮方法。
【請求項９】請求項１記載の圧縮方法において、該エ
ントロピー・コーダーの出力から入力シンボルを伸長す
るステップをさらに有することを特徴とする圧縮方法。
【請求項１０】請求項１記載の圧縮方法において、該
同一性コンテキストは該入力シンボルのシンボル索引と
該同一性画素のシンボル索引との同一性に依存すること
を特徴とする圧縮方法。
【請求項１１】画素が入力され、結果値及びコンテキ
スト値がエントロピー・コーダーに出力されるところ
の、圧縮又は伸長システム用のコンテキスト・モデラー
であって、複数のクロックサイクルのそれぞれにおいて画素を受け
取るために接続され、カレント画素値を格納する入力画
素レジスタ、該入力画素レジスタに接続されて該入力画素レジスタの
前の内容を格納し、それをコンテキストデータ用として
出力するフレーム記憶、該フレーム記憶及び該入力画素レジスタに接続され、該
コンテキストデータの第１の部分を該カレント画素値と
比較し、同一性表示を出力するコンパレータ、少なくとも該コンパレータに接続され、少なくとも該同
一性表示及び該コンテキストデータの第２の部分を記憶
するコンテキストレジスタ、該入力画素レジスタに接続され、該カレント画素値に基
づいた結果値を出力する結果出力手段、該コンテキストレジスタに接続され、該同一性表示が肯
定のときに該コンテキストレジスタの内容のビットをマ
スクして同一性コンテキスト値を生成する同一性マス
ク、該コンテキストレジスタに接続され、該同一性表示が否
定するときに該コンテキストレジスタの内容のビットを
マスクして剰余コンテキスト値を生成する剰余マスク、該同一性表示が肯定を示す時に該結果出力出段により出
力された該結果値に対応する該コンテキスト値として該
同一性コンテキスト値を出力し、該同一性表示が否定を
示す時に該結果出力手段により出力された結果値に対応
する該コンテキスト値として該剰余コンテキスト値を出
力する制御ロジック、を有するコンテキスト・モデラ
ー。
【請求項１２】請求項１１記載のコンテキスト・モデ
ラーにおいて、該制御ロジックは追加剰余コンテキスト
値及び対応結果値を出力するクロッキング論理を含むこ
とを特徴とするコンテキスト・モデラー。
【請求項１３】請求項１１記載のコンテキスト・モデ
ラーにおいて、該コンテキストデータの該第１の部分、
該コンテキストデータの該第２の部分、該同一性マスク
の内容、及び該剰余マスクの内容は、コンテキストモデ
ルに従って決定されることを特徴とするコンテキスト・
モデラー。
【請求項１４】請求項１３記載のコンテキスト・モデ
ラーにおいて、該コンテキストモデルは予め決められる
ことを特徴とするコンテキスト・モデラー。
【請求項１５】請求項１３記載のコンテキスト・モデ
ラーにおいて、該コンテキストモデルは該コンテキスト
・モデラーに入力された画素の値に従って動的に適応化
されることを特徴とするコンテキスト・モデラー。
【請求項１６】請求項１１記載のコンテキスト・モデ
ラーにおいて、該コンテキストデータの該第１の部分
は、前のフレームの該カレント画素の位置に対応する位
置より得られる画素の画素値を示すことを特徴とするコ
ンテキスト・モデラー。
【請求項１７】請求項１１記載のコンテキスト・モデ
ラーにおいて、該コンパレータの出力は該カレント画素
値及び前の画素値より多くのものに対する同一性表示を
含むことを特徴とするコンテキスト・モデラー。
【請求項１８】請求項１１記載のコンテキスト・モデ
ラーにおいて、該結果値は２進値であり、該同一性表示
が否定を示すときに追加剰余値が出力されることを特徴
とするコンテキスト・モデラー。
【請求項１９】請求項１１記載のコンテキスト・モデ
ラーにおいて、画素値は色テーブルへの索引であること
を特徴とするコンテキスト・モデラー。
【請求項２０】請求項１１記載のコンテキスト・モデ
ラーにおいて、該コンテキストデータの該第１の部分と
該第２の部分はオーバーラップすることを特徴とするコ
ンテキスト・モデラー。
【請求項２１】該画素クロックによりクロックされ、
かつ該フレーム記憶の出力に接続されたカーソルポイン
ターレジスタをさらに有し、該カーソルポインターレジ
スタが該フレーム記憶に対しアドレスを供給し、該フレ
ーム記憶が該アドレスされたコンテキストに対応するコ
ンテキストデータを出力することにより応答することを
特徴とする請求項１１記載のコンテキスト・モデラー。
【請求項２２】請求項２１記載のコンテキスト・モデ
ラーにおいて、該フルコンテキストレジスタはビットプ
レーンインジケーター及び該カーソルポインターレジス
タの内容も格納することを特徴とするコンテキスト・モ
デラー。
【請求項２３】フレーム記憶の更新の手段をさらに有
することを特徴とする請求項１１記載のコンテキスト・
モデラー。