JP2008011431A

JP2008011431A - 画像符号化装置

Info

Publication number: JP2008011431A
Application number: JP2006182324A
Authority: JP
Inventors: Hiromitsu Nakayama; 啓満中山; Takaya Ogawa; 貴也小川; Kiwamu Watanabe; 究渡辺; Tatsuhiro Suzumura; 竜広鈴村; Satoshi Takegawa; 智竹川; Yoshinori Shigeta; 良則繁田; Akihiro Ogami; 晃弘大上; Hideji Michinaka; 秀治道中
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 2006-06-30
Filing date: 2006-06-30
Publication date: 2008-01-17

Abstract

【課題】少ない処理量で、最適な予測モードを決定する。
【解決手段】入力される２値シンボル列中の各２値シンボルに対する発生確率に基づく値を符号量の情報として出力する符号量情報出力手段（６５〜６７）と、前記符号量情報出力手段からの情報によって与えられる符号量を加算して、前記２値シンボル列を算術符号化した場合の発生符号量の推定値を出力する符号量累積加算手段６４と、を有する発生符号量推定部５４を具備したことを特徴とする。
【選択図】図４

Description

本発明は、予測符号化及び算術符号化を採用した画像符号化装置に関する。

近年、画像処理のディジタル化が普及している。ディジタル化された画像データは、符号量を削減するために、Ｈ．２６４、ＡＶＣ規格等の動画像符号化方法を採用して符号化後に伝送や記録が行われることが多い。

Ｈ．２６４規格等においては、複数の予測モードで複数のブロック形状の予測符号化を採用しており、画像ブロック単位に多数の予測モードの中から最適なモードを選択して、予測符号化を行う。最適な予測モードは、画像ブロックの性質毎に相違し、適切なモードを選択することで、符号化効率を向上させることができる。

複数の予測モードから最適なモードを選択する手法として、ラグランジュの未定乗数法に基づくレート−歪み最適化手法が知られている。このレート−歪み最適化手法では、各予測モードで符号化した際の符号化歪みＤ（現画像と再生画像の２乗誤差）と発生符号量とから、符号化コストを算出する。画像符号化における符号化効率は、いかに少ない符号量で、いかに画質劣化の少ない符号化ができるかということを意味している。つまり符号化コストが小さいほど符号化効率が高くなる。従って、与えられた量子化パラメータに対して、符号化コストが最小となる予測モードを画像ブロック毎に選択することで、符号化効率を最大にすることができる。

ところで、Ｈ．２６４では、圧縮率が高いエントロピー符号化方式としてＣＡＢＡＣと呼ばれる符号化方式が採用されている。ＣＡＢＡＣ符号化は、２値シンボル１ビット毎に複雑な処理が必要であり、また、符号化は１ビットずつ順番に行う必要があり並列化が困難である。

レート−歪最適化手法では、画像ブロック毎に取り得る全ての予測モードで符号化（仮符号化）及び復号化（仮復号化）を行って符号化コストを算出する必要がある。ところが、ＣＡＢＡＣ仮符号化及び仮復号化における処理量は極めて大きく、発生符号量の計測に膨大な処理時間が必要となる。

そこで、従来、ＣＡＢＡＣ仮符号化における発生符号量計測の演算量を削減する手法が提案されている。例えば、非特許文献１においては、仮符号化時には算術符号化は行わずに、２値シンボルのシンボル長の総和から算術符号化の発生符号量を推定する方法が提案されている。この手法では、２値シンボル長の仮符号化時に算術符号化を行わないため、大幅な演算量の削減が可能である。

しかしながら、非特許文献１の方法では、実際の算術符号化の発生符号量は２値シンボルの発生確率とそのシンボル値で決まるため、２値シンボル長からの推定では画像によっては誤差が大きくなり、符号化効率に悪影響を与える場合がある。

なお、特許文献１においては、画像特徴量（２値シンボル）の発生確率から、目標符号量を算出して、量子化ステップサイズを調整する装置が開示されている。
特開２００２−２７４５９号公報浅野渉，他「ＣＡＢＡＣ圧縮率推定を用いたＨ．２６４におけるレート−歪み最適化モード判定の高速化」．第３回情報科学技術フォーラム（ＦＩＴ２００４）講演論文集．京都，２００４−０９，（社）電子情報通信学会．東京，２００４，ｐ．２３３−２３４

本発明は、比較的少ない処理量で最適な予測モードを高精度に検出して高効率の符号化を行うことができる画像符号化装置を提供することを目的とする。

本発明の一態様に係る画像符号化装置は、入力される２値シンボル列中の各２値シンボルに対する発生確率に基づく値を符号量の情報として出力する符号量情報出力手段と、前記符号量情報出力手段からの情報によって与えられる符号量を加算して、前記２値シンボル列を算術符号化した場合の発生符号量の推定値を出力する符号量累積加算手段と、を有する発生符号量推定部を具備したことを特徴とするものであり、
本発明の他の態様に係る画像符号化装置は、入力画像信号を予測符号化する予測符号化手段と、前記予測符号化手段の出力を算術符号化して出力する算術符号化手段と、予測符号化における複数の予測モード毎に予測信号を生成する予測信号生成手段と、前記予測信号を用いて、前記予測符号化手段と同様の予測符号化処理によって、前記入力画像信号を予測符号化する仮予測符号化手段と、前記仮予測符号化手段の出力を２値化して２値シンボル列を出力する２値化手段と、前記２値化手段からの２値シンボル列中の各２値シンボルに対する発生確率に基づく値を符号量の情報として出力する符号量情報出力手段と、前記符号量情報出力手段からの情報によって与えられる符号量を加算して、前記２値シンボル列を算術符号化した場合の発生符号量の推定値を出力する符号量累積加算手段と、を有する発生符号量推定部と、前記発生符号量推定部が推定した発生符号量に基づいて最適な予測モードを決定して、最適な予測モードにおける予測信号を前記予測符号化手段に与えて予測符号化させる予測モード決定手段とを具備したことを特徴とする。

本発明によれば、比較的少ない処理量で最適な予測モードを高精度に検出して高効率の符号化を行うことができるという効果を有する。

以下、図面を参照して本発明の実施の形態について詳細に説明する。

＜第１の実施の形態＞
図１は本発明の第１の実施の形態に係る画像符号化装置を示すブロック図である。

本実施の形態は、推定した発生符号量と符号化歪みとに基づいてレート−歪み最適化モードの判定を行い、判定結果に基づく予測モードで動画像の符号化を行うものである。

符号化部１１には画像信号が入力される。この画像信号は符号化部１１の減算器１２及び予測信号生成部２３に供給される。減算器１２は、後述するＭＢ予測モード選択部２４から予測信号が与えられており、入力された画像信号と予測信号との差分値（予測誤差）を出力する。なお、予測誤差は、予測モードに応じたサイズのブロック単位で求められる。

減算器１２からの予測誤差は、直交変換部１３に与えられる。直交変換部１３は、入力された予測誤差を直交変換して、ブロック単位で空間周波数成分に変換する。これにより空間的な相関成分が削減可能となる。直交変換部１３からの変換係数は量子化部１４に与えられる。量子化部１４は、入力された変換係数を量子化することにより、ブロックの信号の冗長度を削減して出力する。

量子化部１４からの量子化出力は、ＣＡＢＡＣ符号化部１５に供給される。ＣＡＢＡＣ符号化部１５は、２値化部１６及び算術符号化部１７によって構成されている。２値化部１６は、量子化出力であるシンタックス要素が入力されると共に、ＭＢ予測モード選択部２４から予測モード情報も入力され、シンタックス要素を可変長の２値のシンボル列に変換する。算術符号化部１７は、２値化部１６からの２値シンボル列を、シンボルの発生確率に応じて算術符号化する。こうして、ＣＡＢＡＣ符号化部１５は、符号量を一層削減した符号化出力を出力バッファ１８に出力するようになっている。

また、ＭＢ予測モード選択部２４から出力される量子化係数等の予測方法に関する情報は、可変長符号化部２５に与えられる。可変長符号化部２５は入力された情報を可変長符号化して出力バッファ１８に出力する。出力バッファはＣＡＢＡＣ符号化部１５の出力及び可変長符号化部２５の出力を、所定のビットレートで符号化データとして出力する。

量子化部１４の出力は、予測信号を生成するために逆量子化部１９にも与えられる。逆量子化部１９、逆直交変換部２０、加算器２１及び参照画像メモリ２２によって局部復号器が構成される。逆量子化部１９は入力された量子化出力を逆量子化して、量子化前のデータ（変換係数）に戻して逆直交変換部２０に出力する。逆直交変換部２０は入力された変換係数を逆直交変換することにより、直交変換前の予測誤差を得る。この予測誤差は加算器２１に与えられる。

加算器２１はＭＢ予測モード選択部２４から予測信号も与えられており、予測誤差と予測信号との加算によって、入力画像を復元する。加算器２１からの復元画像は、参照画像として参照画像メモリ２２に与えられる。参照画像メモリ２２は、参照画像を保持すると共に、動きベクトルに基づくブロック化位置の参照画像をブロック単位で予測信号生成部２３に出力する。

予測信号生成部２３には入力画像信号も入力されている。予測信号生成部２３は、予測モードを示す予測モード制御信号に基づいて、入力画像信号又は参照画像信号から予測信号を生成する。この場合には、予測信号生成部２３は、各予測モード毎の符号化コストを算出し、予測モードの情報及び対応した符号化コストの情報（コスト情報）を出力すると共に、ＭＢ予測モード選択部２４の選択処理に従って、最適な予測モードにおける予測信号を出力するようになっている。

ＭＢ予測モード選択部２４は、予測信号生成部２３から、各予測モード毎のコスト情報がその予測モードを示す予測モード情報と共に与えられる。ＭＢ予測モード選択部２４は、符号化コストが最も小さい予測モードを選択するための予測モード制御信号を予測信号生成部２３に出力する（図示省略）。ＭＢ予測モード選択部２４は、予測信号生成部２３から出力された予測信号を減算器１２及び加算器２１に出力するようになっている。

符号化制御部３１は、発生符号量のフィードバック制御及び量子化特性制御等によって発生符号量を制御するレート制御、予測モードの決定処理の制御、符号化全体の制御等を行う。符号化制御部３１は、符号化対象のピクチャタイプ情報及びスライスタイプ情報等をＭＢ予測モード選択部２４に与える。これにより、ＭＢ予測モード選択部２４は、予測モードを制御するための予測モード制御信号を生成して予測信号生成部２３に出力するようになっている。

図２は図１中の予測信号生成部２３の具体的な構成を示すブロック図である。また、図３は図２中のフレーム内符号化部４３の具体的な構成を示すブロック図である。

予測信号生成部２３は、ブロック化部４２、フレーム内符号化部４３及びフレーム間符号化部４４によって構成されている。ブロック化部４２には、参照画像メモリ２２からの参照画像信号及び入力画像信号が入力される。ブロック化部４２は、予測モードを示す予測モード制御信号によって制御されて、予測モードがフレーム内符号化を採用したモードである場合には、入力画像信号から予測モードで指定されたブロック化位置のブロック単位の画像信号を予測信号としてフレーム内符号化部４３に出力する。また、予測モードがフレーム間符号化を採用したモードである場合には、参照画像信号から予測モード及び動きベクトルで指定されたブロック化位置のブロック単位の画像信号を予測信号としてフレーム間符号化部４４に出力する。

フレーム内符号化部４３とフレーム間符号化部４４の構成は同様であり、図３では一方のフレーム内符号化部４３の構成のみを具体的に示す。

ブロック化部４２からの各予測モードに対応した各予測信号のいずれが最適な予測信号であるかを判定するために、フレーム内符号化部４３及びフレーム間符号化部４４は、入力された予測信号に対する仮符号化処理を行って、発生符号量及び符号化歪みを求めて、符号化コストを算出する。

即ち、ブロック化部４２からの予測信号は減算器５１に供給される。減算器５１、直交変換部５２及び量子化部５３の構成は、夫々符号化部１１における減算器１２、直交変換部１３及び量子化部１４と同様である。即ち、減算器５１には入力画像信号も与えられており、減算器５１は、入力画像信号と予測信号との差分（予測誤差）を求めて、求めた予測誤差を直交変換部５２に出力する。直交変換部５２は、入力された予測誤差を直交変換して、変換係数を量子化部５３に出力する。量子化部５３は、入力された変換係数を量子化して量子化出力を発生符号量推定部５４に出力する。

また、量子化部５３からの量子化出力は、符号化歪みの算出のために、逆量子化部５６にも与えられる。逆量子化部５６、逆直交変換部５７及び加算器５８は、夫々局部復号器を構成する逆量子化部１９、逆直交変換部２０及び加算器２１と同様の構成である。即ち、逆量子化部５６は、入力された量子化出力を逆量子化処理して変換係数に戻し、逆直交変換部５７は入力された変換係数を逆直交変換して予測誤差を得る。加算器５８は予測誤差と予測信号との加算によって、元の入力画像を復元する。

加算器５８からの復元画像の画像信号及び入力画像信号は、符号化歪み算出部５９に与えられる。符号化歪み算出部５９は、入力画像と復元画像の２乗誤差を算出し、算出結果を符号化歪みＤとして、符号化コスト計算部５５に出力する。

発生符号量は、量子化部５３の出力をＣＡＢＡＣ符号化部によって算術符号化することによって、求めることができる。しかしながら、上述したように、この演算には膨大な処理時間が必要である。そこで、本実施の形態においては、発生符号量推定部５４は、算術符号化を行うことなく、算術符号化において用いるシンボルの発生確率を用いて、発生符号量を推定するようになっている。

図４は図３中の発生符号量推定部５４の具体的な構成を示すブロック図である。

量子化部５３からの量子化出力は、シンタックスによって伝送することが規定されているデータ（多値シンタックス要素）であり、この多値シンタックス要素は符号量を算出するために、ＣＡＢＡＣ符号化部１５の２値化部１６と同様の構成の２値化部６３に供給される。２値化部６３は、入力された多値シンタックス要素を可変長の２値シンボル列に変換する。

一般的なＣＡＢＡＣ符号化では、２値シンボル列の各シンボルの発生確率を用いて算術符号化が行われる。この場合には、シンボル“０”，“１”のうち発生確率が高いシンボル（ＭＰＳ：Most Probable Symbol）を符号化するか、発生確率が低いシンボル（ＬＰＳ：Least Probable Symbol）を符号化するかによって、各シンボルの発生確率の設定を更新するようになっている。各シンボルの発生確率を決定するために、コンテキスト計算部及びコンテキストテーブルが用いられる。

なお、図１のＣＡＢＡＣ符号化部１５では図示を省略したが、算術符号化部１７に発生確率の情報を与えるものとして、コンテキスト計算部及びコンテキストテーブルは、一般的に用いられるものである。

即ち、一般的には、コンテキスト計算部は、各シンボルの発生確率を算術符号化部に与えるものであり、多値シンタックス要素及び２値シンボル列が与えられて、シンボルの発生確率を保持するテーブル（確率テーブル）の読出しを制御する。

確率テーブルは、２値シンボル列の各ＭＰＳ毎の発生確率の情報を保持している。確率テーブルは、符号化の状況に応じて発生確率を変更するために、各ＭＰＳ毎に複数（Ｈ．２６４では６４個）の発生確率の情報を保持する。

確率テーブルの読出しには、コンテキストテーブルが用いられる。コンテキストテーブルは、シンタックス要素の種類（Ｈ．２６４では４６０種類）に応じた複数の領域を有し、更にこの各領域は確率テーブル中の各ＭＰＳ毎に保持された複数の発生確率に夫々対応した領域を有している。コンテキスト計算部は、多値シンタックス要素の種類及び２値シンボル列の状況から、内部に保持している周囲マクロブロック情報メモリ（図示せず）を参照してコンテキスト計算を行い、計算結果に基づいて、各２値シンボルを算術符号化する場合の発生確率を決定するために、コンテキストテーブルにコンテキストテーブルインデックスを出力する。コンテキストテーブルは、コンテキストテーブルインデックスに応じた読出しアドレスを確率テーブルに出力して、各２値シンボルに対応した発生確率の情報を算術符号化部に出力させる。

図４中のコンテキスト計算部６５及びコンテキストテーブル６６は、上述した一般的なコンテキスト計算部及びコンテキストテーブルと同様の構成である。

本実施の形態においては、確率テーブルに代えて符号量情報出力手段としての最適符号量テーブル６７が採用される。コンテキストテーブル６６は、コンテキストテーブルインデックスが入力されると、コンテキストテーブルインデックスで指定された領域を参照して、参照した値（コンテキスト情報）を最適符号量テーブル６７に最適符号量テーブルインデックスとして出力すると共に、最適符号量累積加算部６４にＭＰＳを出力する。

図５は図４中の最適符号量テーブルの割り当てを示す説明図である。図５に示すように、最適符号量テーブル６７は、一般的な確率テーブルと同様の領域を有し、各領域には、各発生確率に代えて発生確率の対数値を保持するようになっている。本実施の形態においては、ＣＡＢＡＣ符号化の算術符号化において用いる発生確率テーブルの各要素を対数計算した値を、発生確率を用いて算術符号化するビットの最適符号量とする。即ち、コンテキストテーブル６６は、通常のコンテキスト計算結果によって得られた２値シンボルの発生確率に相当する最適符号量テーブルインデックスに応じて、最適符号量を示す発生確率の対数値を出力する。

最適符号量累積加算部６４は、２値シンボル列及びＭＰＳと共に最適符号量の情報が与えられ、最適符号量の総和を発生符号量推定値として出力する。また、最適符号量累積加算部６４は、発生符号量推定値に応じて、コンテキストテーブル６６に更新した最適符号量テーブルインデックスを出力する。これにより、コンテキストテーブル６６のコンテキスト情報が更新されるようになっている。

発生確率が既知の符号については、符号量の対数を算術符号化における発生確率として用いることで、統計上、最も符号化効率を高くすることができる。２値化部６３の出力が発生確率通りの符号であるとは限らないが、統計的には、発生確率の対数値を累積することで略発生符号量の推定値を得ることができる。また、最適符号量累積加算部６４において、更新した最適符号量テーブルインデックスを出力することで、コンテキストテーブル６６によって選択しようとする確率を、入力される実際の２値シンボル列に応じて更新することができる。これにより、発生符号量推定値の精度を向上させることができる。

発生符号量推定部５４からの発生符号量推定値は、符号化コスト計算部５５に与えられる。符号化コスト計算部５５は、符号化歪み算出部５９からの符号化歪みＤと発生符号量推定値Ｒとをメモリ６１に蓄積し、蓄積した符号化歪みＤと発生符号量推定値Ｒとから符号化コストを算出する。例えば、符号化コスト計算部５５は、下記（１）式の演算によって符号化コストＪｉを求める。

Ｊｉ＝Ｄｉ＋λ・Ｒｉ …（１）
但し、λは、量子化パラメータに基づいて計算される定数
符号化コスト計算部５５は、予測モードの決定対象のブロックに対する符号化コストの情報（コスト情報）とその符号化コストが得られる予測モードの情報（予測モード情報）とをＭＢ予測モード選択部２４に出力する。フレーム間符号化部４４も同様の構成であり、各予測モード毎に、コスト情報及び予測モード情報をＭＢ予測モード選択部２４に出力する。

ＭＢ予測モード選択部２４は、各予測モードについてのコスト情報及び予測モード情報をメモリ６２に記憶させ、ラグランジュ未定乗数法を用いて、コスト最小の予測モードを最終予測モードとして決定する。ＭＰ予測モード選択部２４は、決定した最終的な予測モードを、予測モード制御信号としてブロック化部４２に出力する。ブロック化部４２は、予測モード制御信号に応じた予測信号を生成して、ＭＢ予測モード選択部２４に出力し、ＭＢ予測モード選択部２４は、この予測信号を実際の符号化に用いる予測信号として、減算器１２及び加算器２１に出力するようになっている。

次に、このように構成された実施の形態の動作について図６及び図７を参照して説明する。図６は符号化に用いる予測信号を決定するための最適予測モードの判定処理を示すフローチャートであり、図７は図６中の発生符号量推定処理の具体的なフローを示すフローチャートである。

実際の符号化に先立って、仮符号化による最適予測モードの判定処理が行われる。先ず、図６のステップＳ１１において、符号化コストが初期化される。入力画像信号及び参照画像メモリ２２からの参照画像信号は、予測信号生成部２３に供給される。予測信号生成部２３のブロック化部４２は、予測モード制御信号に応じた予測モードで、ブロック化を行って予測信号を生成する（ステップＳ１２）。予測モードがフレーム内符号化モードである場合には、フレーム内符号化部４３において符号化コストが求められ、予測モードがフレーム間符号化モードである場合には、フレーム間符号化部４４において符号化コストが求められる。

先ず、予測信号は減算器５１に供給されて、入力画像信号との差分（予測誤差）が求められる。予測誤差は、直交変換部５２において直交変換され（ステップＳ１３）、量子化部５３において量子化される（ステップＳ１４）。

量子化部５３の出力は、現予測モードにおける発生符号量及び符号化歪みを算出するために、多値シンタックス要素として発生符号量推定部５４に供給されると共に、逆量子化部５６にも供給される。量子化部５３の量子化出力は、逆量子化部５６において逆量子化され（ステップＳ１５）、逆直交変換部５７において逆直交変換されて予測誤差が復元される（ステップＳ１６）。加算器５８は復元された予測誤差とブロック化部４２からの予測信号とを加算して、入力画像を復元する。加算器５８からの復元画像は、符号化コスト計算部５５及び符号化歪み算出部５９に与えられる。

ステップＳ１７においては、図７の発生符号量推定処理が行われる。即ち、量子化部５３からの多値シンタックス要素は、ステップＳ３１において、２値シンボル列に変換される。ステップＳ３２では、多値シンタックス要素及び２値シンボル列に基づいて、コンテキスト計算が行われて、コンテキストテーブルインデックスが求められる。

このコンテキストテーブルインデックスに基づいて、コンテキストテーブル６６が参照されて、最適符号量テーブルインデックスが出力される（ステップＳ３３）。最適符号量テーブルインデックスによって、最適符号量テーブル６７が参照されて（ステップＳ３４）、最適符号量テーブル６７から最適符号量が出力される。

本実施の形態においては、最適符号量テーブル６７は、各２値シンボルの発生確率に対応してその対数値を記憶しており、２値シンボルの発生確率に対応した対数値を最適符号量として出力する。最適符号量累積加算部６４は、最適符号量テーブル６７からの最適符号量を累積加算することで、発生符号量推定値を得る（ステップＳ３５）。

従って、本実施の形態においては、所定の予測モードにおける発生符号量を、簡単な累積加算演算によって得ることができ、比較的処理能力が低い装置を用いた場合でも、短時間に発生符号量の推定値を高精度に求めることができる。

ステップＳ３６では、最適符号量累積加算部６４は、最適符号量テーブル６７の参照の仕方を実際の２値シンボル列に応じたものとするために、更新した最適符号量テーブルインデックスをコンテキストテーブル６６に出力する（ステップＳ３６）。これにより、コンテキストテーブル６６は、コンテキスト情報を更新する（ステップＳ３７）。

最適符号量累積加算部６４からの発生符号量推定値は、符号化コスト計算部５５に与えられる。一方、符号化歪み算出部５９は、加算器５８からの復元画像と入力画像とが与えられ、符号化歪みを算出する。算出された符号化歪みは、符号化コスト計算部５５に供給される（ステップＳ１８）。

ステップＳ１９においては、符号化コストの算出及び評価が行われる。符号化コスト計算部５５は、メモリ６１に発生符号量推定値及び符号化歪みを蓄積すると共に、これらの値を用いて符号化コストを算出する。符号化コスト計算部５５は、求めたコスト情報を現予測モードを示す予測モード情報と共に出力する。

こうして、フレーム内符号化部４３又はフレーム間符号化部４４からコスト情報及び予測モード情報がＭＢ予測モード選択部２４に出力される。ＭＢ予測モード選択部２４は、入力されたコスト情報及び予測モード情報をメモリ６２に蓄積する。ＭＢ予測モード選択部２４は、メモリ６２の情報を読み出して、符号化コストが最も小さくなる予測モードを選択する。

例えば、ＭＢ予測モード選択部２４は、ステップＳ２０において、現予測モードにおける符号化コストＪが最小コストよりも小さいか否かを判定する。現予測モードにおける符号化コストＪが最小コストよりも大きい場合には、処理をステップＳ２２に移行し、全ての予測モードについて符号化コストを求めたか否かを判定する。全ての予測モードについて符号化コストを求めていない場合には、ステップＳ２３において予測モードを更新する。即ち、ＭＢ予測モード選択部２４は、予測モード制御信号によってブロック化部４２に次の予測モードによる予測信号を生成させる。

現予測モードにおける符号化コストＪが最小コストよりも小さい場合には、ステップＳ２１において、現予測モードの符号化コストＪを最小コストに設定した後、ステップＳ２２を経て予測モードを更新する（ステップＳ２３）。

以後、同様の動作を繰り返し、全ての予測モードについて、符号化コストを求めて、最小符号化コストを得る予測モードを得る。ＭＢ予測モード選択部２４は、最小符号化コストが得られる予測モードを最適予測モードとして、ブロック化部４２に最適予測モードを設定するための予測モード制御信号を出力する（ステップＳ２４）。

ブロック化部４２は、最適予測モードに対応した予測信号を出力する。この予測信号は、ＭＢ予測モード選択部２４を介して減算器１２及び加算器２１に供給される。こうして、直交変換部１３、量子化部１４及びＣＡＢＡＣ符号化部１５において、実際の符号化が行われる。この場合には、符号化コストが最小となる予測モードが選択されており、高効率の符号化が可能である。

なお、図６及び図７においては、説明のために直列的な処理を行う例を示しているが、並列処理が可能であることは明らかであり、処理順も図６及び図７に限定されるものではない。

このように本実施の形態においては、最適予測モードの選択のための仮符号化に際して、ＣＡＢＡＣ符号化における算術符号化を行うことなく、２値シンボルの発生確率の対数を累積加算することで、発生符号量を推定する。これにより、少ない処理量で高精度の発生符号量推定値を得ることができる。高精度に求めた発生符号量推定値を用いてレート−歪み最適化モード判定を行うことで、高画質な符号化画像を高い符号化効率で得ることができる。

図８は本発明の第２の実施の形態を示すブロック図である。図８は発生符号量推定部の構成を示している。図８において図４と同一の構成要素には同一符号を付して説明を省略する。また、図９は第２の実施の形態における発生符号量推定処理フローを示すフローチャートである。

本実施の形態における発生符号量推定部は、コンテキストテーブル６６のコンテキスト情報の更新を行わない点が図４の発生符号量推定部５４と異なるのみである。コンテキストテーブル６６は、コンテキストテーブルインデックスに対応した最適符号量テーブルインデックスを出力するのみである。最適符号量累積加算部６４は、最適符号量を累積加算することで、２値シンボル列を算術符号化した場合の発生符号量推定値を得る。

図４の発生符号量推定部５４は、実際に入力される２値シンボルに応じて、最適符号量を変化させるように、コンテキスト情報の更新を行った。これに対し、本実施の形態では、実際の入力に拘わらず、最適符号量テーブル６７からは２値シンボルに応じた規定の最適符号量の情報が出力される。

このような構成によれば、図７と図９との比較から明らかなように、ステップＳ３６のコンテキストテーブル更新処理が省略されている。本実施の形態においては、コンテキストテーブルの更新が不要であることから、並列化による高速処理が可能であるという利点を有する。

他の構成及び作用は第１の実施の形態と同様である。

なお、本発明は上記各実施の形態に限定されるものではなく、種々の変形が可能である。例えば、符号化装置の構成及び符号化手法は、特に限定されるものではない。

本発明の第１の実施の形態に係る画像符号化装置を示すブロック図。図１中の予測信号生成部２３の具体的な構成を示すブロック図。図２中のフレーム内符号化部４３の具体的な構成を示すブロック図。図３中の発生符号量推定部５４の具体的な構成を示すブロック図。図４中の最適符号量テーブルの割り当てを示す説明図。符号化に用いる予測信号を決定するための最適予測モードの判定処理を示すフローチャート。図６中の発生符号量推定処理の具体的なフローを示すフローチャート。本発明の第２の実施の形態を示すブロック図。第２の実施の形態における発生符号量推定処理フローを示すフローチャート。

符号の説明

２３…予測信号生成部、２４…ＭＢ予測モード選択部、１５…ＣＡＢＡＣ符号化部。

Claims

入力される２値シンボル列中の各２値シンボルに対する発生確率に基づく値を符号量の情報として出力する符号量情報出力手段と、
前記符号量情報出力手段からの情報によって与えられる符号量を加算して、前記２値シンボル列を算術符号化した場合の発生符号量の推定値を出力する符号量累積加算手段と、を有する発生符号量推定部
を具備したことを特徴とする画像符号化装置。
入力画像信号を予測符号化する予測符号化手段と、
前記予測符号化手段の出力を算術符号化して出力する算術符号化手段と、
予測符号化における複数の予測モード毎に予測信号を生成する予測信号生成手段と、
前記予測信号を用いて、前記予測符号化手段と同様の予測符号化処理によって、前記入力画像信号を予測符号化する仮予測符号化手段と、
前記仮予測符号化手段の出力を２値化して２値シンボル列を出力する２値化手段と、
前記２値化手段からの２値シンボル列中の各２値シンボルに対する発生確率に基づく値を符号量の情報として出力する符号量情報出力手段と、前記符号量情報出力手段からの情報によって与えられる符号量を加算して、前記２値シンボル列を算術符号化した場合の発生符号量の推定値を出力する符号量累積加算手段と、を有する発生符号量推定部と、
前記発生符号量推定部が推定した発生符号量に基づいて最適な予測モードを決定して、最適な予測モードにおける予測信号を前記予測符号化手段に与えて予測符号化させる予測モード決定手段と
を具備したことを特徴とする画像符号化装置。
前記予測モード決定手段は、前記発生符号量推定部が推定した発生符号量及び前記仮予測符号化手段による符号歪みから求めた符号化コストに基づいて最適な予測モードを決定することを特徴とする請求項２に記載の画像符号化装置。
前記符号量情報出力手段は、前記各２値シンボルに対する発生確率の対数値を符号量の情報として出力することを特徴とする請求項１又は２のいずれか一方に記載の画像符号化装置。
前記符号量情報出力手段は、
前記各２値シンボルに対する発生確率に応じた対数値を保持する符号量テーブルと、
前記２値シンボル列に対応して前記符号量テーブルの読出しを制御するためのコンテキスト情報を保持するコンテキストテーブルとを具備し、
前記符号量累積加算手段は、前記２値シンボル列に応じて前記コンテキスト情報を更新することを特徴とする請求項３に記載の画像符号化装置。