WO2008072592A1

WO2008072592A1 - 映像符号化方法、映像符号化装置および映像符号化プログラム

Info

Publication number: WO2008072592A1
Application number: PCT/JP2007/073769
Authority: WO
Inventors: Tetsuhiro Nanbu; Keiichi Chono
Original assignee: Nec Corporation; Nec Engineering, Ltd.
Priority date: 2006-12-14
Filing date: 2007-12-10
Publication date: 2008-06-19
Also published as: US20100238998A1; JP5045950B2; EP2124343A1; CN101553988A; US8345767B2; CN101553988B; EP2124343A4; JPWO2008072592A1

Abstract

本発明は、画像ブロックの符号化データを２進列のシンボルに変換する２進列変換ステップと、２進列の各シンボルをコンテキストに応じて算術符号化する２値算術符号化ステップと、画像ブロックに対する符号化データが２値算術符号化されるときに必要なビット数を推定する推定ステップと、推定ステップで推定されたビット数に応じて前記符号化データを２値算術符号化して出力するか否かを決定する符号化データ決定ステップと、符号化データ決定ステップで２値算術符号化して出力すると決定された符号化データに対応する前記コンテキストを更新し、前記符号化データ決定ステップで２値算術符号化して出力しないと決定された符号化データに対応する前記コンテキストを更新しないコンテキスト更新ステップとを備え、推定ステップで、２値算術符号化への入力シンボルに対する算術符号化出力ビット数の最大値を前記ビット数とすることを特徴とする映像符号化方法である。

Description

明細書

映像符号化方法、映像符号化装置および映像符号化プログラム技術分野

[0001] 本発明は、テーブル引き 2値算術符号化エンジン（table-driven binary arithmetic c oding engine) ίこ 3¾づレヽ 7こし ABAし (Context-based Adaptive binary Arithmetic Codi ng)技術を利用した映像符号化方法、映像符号化装置および映像符号化プログラムに関する。

背景技術

[0002] 映像符号化装置は、外部から入力される動画像信号をディジタル化した後、所定の画像符号化方式に準拠した符号化処理を行うことによって符号化データすなわちビットストリームを生成する。

[0003] 画像符号化方式の 1つとして、 ITU— T勧告 H. 264/AVC (Advanced Video Cod ing)がある（非特許文献 1参照。）。 Η· 264/AVCは、 ISO/IEC 14496— 10 A VCに相当する。 H. 264/AVCでは、マクロブロック（MB)レイヤ以下の符号化データであるシンタクスエレメント（SE)に対して、ハフマン符号化系の CAVLC (Contex t-based Adaptive Variable Length Coding)または算術符号化系の CABAC (Contex t-based Adaptive binary Arithmetic Coding)を選択してエントロピー符号化が行われる。なお、 MBレイヤの SEについては、非特許文献 1の 7· 3. 5 Macroblock layer sy ntaxに記載がある。また、以下、 H. 264/AVCで定められている事項を、 H. 264 規格という。

[0004] CABACを選択してエントロピー符号化を行うことによって、 CAVLCを選択した場合よりも、平均で 15%程度の符号量削減効果が得られるといわれている。また、 H. 2 64/AVC符号器の参照モデルとして Joint Model方式が知られている（以後、一般的な映像符号化装置という。）。

[0005] 図 9を参照して、ディジタル化された画像フレームを入力とし、ビットストリームを出力する一般的な映像符号化装置の構成と動作を説明する。図 9に示す映像符号化装置は、原画像フレームバッファ 10、 MB符号化装置 20、レート制御装置 30、および復号画像フレームバッファ 40を備えている。画像フレームが QCIF (Quarter Common Intermediate Format)の場合、原画像フレームバッファ 10は、図 10に示すような画像データを格納する。画像フレームは、 MBとよばれる 16 X 16画素の輝度画素と、 8 X 8画素の色差画素（Crと Cb)を構成要素とする画素ブロックとに分割される。

[0006] MB符号化装置 20は、通常、画像フレームの左上から右下へのラスタスキャン順で、 MBを符号化する。

[0007] レート制御装置 30は、 MB符号化装置 20が出力するビットストリームの出力ビット数を監視して、 MB符号化装置 20に供給する量子化パラメータを調整し、ビットストリームが目標のビット数に近づくようにレート制御する。具体的には、ビットストリームのビット数が目標のビット数よりも多くなると、量子化幅を大とする量子化パラメータを MB符号化装置 20に供給し、逆にビットストリームのビット数が目標のビット数よりも少なくなると量子化幅を小とする量子化パラメータを MB符号化装置 20に供給する。

[0008] 復号画像フレームバッファ 40は、 MB符号化装置 20による復号画像を、以降の符号化（予測）に利用するために、 MB符号化装置 20が 1MBの符号化を完了したタイミングで、 MB符号化装置 20による復号画像を読み込んで格納する。

[0009] 次に、 MB符号化装置 20の内部構成と動作を説明する。図 9に示すように、 MB符号化装置 20は、リード (Read)装置 210、予測装置 220、ビデオ符号化 (Venc)装置 230、エントロピー符号化（EC)装置 240を備えている。リード (read)装置 210は、原画像 MBメモリ 211および参照画像メモリ 212を含む。ビデオ符号化装置 230は、変換/量子化器 231、逆量子化/逆変換器 232および復号画像 MBメモリ 233を含む。エントロピー符号化装置 240は、エントロピー符号化器 241、出力バッファ 242、制御装置 243およびコンテキスト複製メモリ 244を含む。

[0010] 原画像 MBメモリ 211には、原画像フレームバッファ 10に格納された画像フレームのうち符号化対象 MBの画像（以下、原画像 orgという。）が格納される。参照画像メモリ 212には、復号画像フレームバッファ 40に格納された画像のうち、符号化対象 M Bを予測して符号化するために必要な画像（以下、参照画像 refという。）が格納され

[0011] 予測装置 220は、復号画像フレームバッファ 40および復号画像メモリ 233に格納された参照画像から、原画像を好適に符号化できる予測パラメータ paramを検出し、予測画像 predと予測誤差画像 peとを生成する。予測パラメータは、エントロピー符号化器 241に供給される。予測誤差画像 peは、変換/量子化器 231に供給される。予測誤差画像 peは、逆量子化/逆変換器 232の出力に加算されて、復号画像 MBメモリ 233に復号画像として格納される。ただし、後述する原画像 PCM (Pulse Code M odulation )再符号化が発生した場合、復号画像 MBメモリ 233には、原画像 MBメモリ 21 1から供給される原画像が復号画像として格納される。

[0012] 予測には、フレーム内予測とフレーム間予測との 2種類がある。フレーム内予測/ フレーム間予測での予測画像と、予測誤差画像を説明する。フレーム内予測が実施されると、現在の符号化対象画像フレームと表示時刻が同一の過去の復号画像を参照し、画像フレーム内（空間方向）での画素の相関を利用して、予測画像 predを生成する。一例として、 MBを更に細かく分割した 4 X 4画素ブロックサイズでのフレーム内予測の種々のパターンが図 1 1の説明図に示されて!/、る（色差やその他の場合でのフレーム内予測については、非特許文献 1の 8. 3節 Intra prediction process参照

[0013] 図 1 1 (A)〜（I)における intra— dirは、フレーム内予測の方向などを示す画面内予測方向パラメータである。予測装置 220は、フレーム内予測を選択すると、画面内予測方向パラメータ intra— dirに従って予測画像 predを生成する。以後の説明のために、フレーム内予測を、式 1と定義する。

[0014] 國 pred = intra preaiction ( ref , intra air )

[0015] 式 1において、 intra— prediction ()は、画面内予測方向パラメータ intra— dirに従って、参照画像 refからフレーム内予測画像を生成する関数である。

[0016] フレーム間予測が実施されると、現在の符号化対象画像フレームと表示時刻が異なる過去の復号画像を参照し、画像フレーム間（時間方向）の相関を利用して、予測画像 predが生成される。フレーム間予測の一例として、 16 X 16画素ブロックのフレーム間予測を図 12の説明図を参照して説明する（その他の画素ブロックサイズなどのフレーム間予測については、非特許文献 1の 8. 4節 Intra prediction process参照 )。

[0017] 図 12に示す動きベクトル mv— x、 mv— yは、フレーム間予測の予測パラメータである。予測装置 220は、フレーム間予測を選択すると、動きベクトル mv— x、 mv— yに従って予測画像 predを生成する。以後の説明のために、フレーム間予測を式 2と定義する。

[0018] [数 2] pred = inter prediction ( ref, mv x, mv y )

[0019] 式 2において、 inter—prediction ()は、動きべクトノレ mv_x、 mv_yに従って、参照画像 refからフレーム間予測画像を生成する関数である。なお、 H. 264規格において、動きベクトルの画素精度は 1/4画素である。

[0020] 予測装置 220は、式 3および式 4〜式 7のコスト関数 (予測評価値)を利用して、上述した予測画像 predを生成する予測パラメータ paramを検出する。予測パラメータとは、フレーム内予測であれば画面内予測方向 intra— dir、フレーム間予測であれば動きベクトル mv— x、 mv—yなどである（その他の予測パラメータについては、非特許文献 1の 7節 Syntax and semantics参照。）。検出された予測パラメータ paramに対応する予測画像 predと、原画像 orgの差分を予測誤差画像 peと呼ぶ（式 6参照）。

[0021] 園

Cost (param) =

SATD ( idx ) + λ ( QP ) x R (param)

idx=0

[0022] [数 4]

[0023] [数 5] H(idx) =

1 1 1 — pe_idx(0，0) pe_idx(0,l) pe_idx(0,2) pe_idx(0,3) 1 1 1 1 1 1 -1 -1 pe_idx( ) pe_idx(l，l) pe_idx(l,2) pe_idx(l,3) 1 1 -1 -1 1 -1 -1 1 pe_idx(2，0) pe_idx(2,l) pe_idx(2,2) pe_jdx(2,3) 1 -1 -1 1 1 -1 1 -1 pe_idx(3,0) pe_idx(3,l) pe_idx(3,2) pe_idx(3,3)_ 1 -1 1 -1

[0024] [数 6]

P^eidx(y， x) = ^org(^b4yidx + y， t>4x_idx + x) - pred(b4y_idx + y， b4x_idx + x)

[0025] [数 7]

[0026] [数 8]

(b4x_idx， b4y_idx ){0<b4x_idx<12, 0<b4y_idx <12}

[0027] なお、式 3は、 H.264における予測評価値の計算を説明する式である。式 4は、式

3における SATD(idx)の計算を説明する式である。式 5は、式 4における H(idx)の計算を説明する式である。式 6は、式 5における peidx(y, x)の計算を説明する式である。式 7は、式 3における λ (QP)の計算を説明する式である。式 8は、式 6における b4x, b4yを説明する式である。また、式 3〜式 7における QPは MBの量子化パラメータ、 idxは図 10に示す MB内部での 4X4ブロックの番号、 b4x、 b4yは idxに対応する 4X4ブロックの左上角の MB内部での座標を示す。

[0028] 次!/、で、変換/量子化器 223は、予測装置 220から供給される予測誤差 peを、 M Bよりも細かいブロックの単位（以下、変換ブロックという。）で周波数変換し、空間領域から周波数領域に変換する。周波数領域に変換された予測誤差画像を変換係数 Tという。

[0029] さらに、変換/量子化器 223は、変換係数 Tを、レート制御装置 30から供給される量子化パラメータ QPに対応する量子化幅で量子化する。量子化された変換係数は、一般的に変換量子化値 Lと呼ばれる。変換量子化値 Lは、以降の符号化のために逆量子化/逆変換器 233に供給され、ビットストリーム形成のためにエントロピー符号化装置 240に供給される。

[0030] 逆量子化/逆変換器 233に供給される変換量子化値 Lに着目して、以降の動作を説明する。

[0031] 逆量子化/逆変換器 233は、変換/量子化器 223から供給される変換量子化値 L を逆量子化し、さらに逆周波数変換して元の空間領域に戻す。元の空間領域に戻された予測誤差画像を再構築予測誤差画像 pe—recという。

[0032] 逆量子化/逆変換器 233から供給される再構築予測誤差画像 pe—recには、 H.

264規格における参照画像を説明する式 9に示すように、予測装置 220から供給される予測画像 predが加算され、復号画像 recとして復号画像 MBメモリ 233に格納される。復号画像 MBメモリ 233に格納された復号画像 recは、以降に、予測装置 220 ゃ復号画像フレームバッファ 40に読み込まれて参照画像となる。

[0033] [数 9コ rec = pred + pe rec

[0034] 次に、エントロピー符号化装置 240に供給される変換量子化値 Lに着目して、以降の動作を説明する。

[0035] エントロピー符号化装置 240は、エントロピー符号化器 241、出力バッファ 242、制御装置 243、およびコンテキスト複製メモリ 244を含む。エントロピー符号化器 241は、入力データをエントロピー符号化して、出力ビットを出力バッファ 242に供給する。制御装置 243は、エントロピー符号化器 241の出力ビット数を監視して、他の装置の動作を制御する。コンテキスト複製メモリ 244は、後述するコンテキストデータの複製を格納するメモリである。

[0036] 制御装置 243は、エントロピー符号化器 241の出力ビット数を監視し、制御信号 (ェントロピー符号化制御信号、出力バッファ制御信号）によって、エントロピー符号化器 241および出力バッファ 242を制御する。

[0037] 1MBすべての入力データをエントロピー符号化して、その出力ビット数が Η· 264 規格で定められる上限ビット数（非特許文献 1の Annex A A.3 Levelsを参照すると 3 200ビット）を超えなかった場合には、制御装置 243は、出力バッファ制御信号によつて出力バッファ 242に格納されたビットを MBの符号化データとして出力させる。なお、 H. 264規格で定められる 1MBあたりの上限ビット数を、以後、規定値という。

[0038] 1MBの入力データをエントロピー符号化した出力ビット数が MBビット数の規定値を超えた瞬間に、制御装置 243は、エントロピー符号化制御信号によってエントロピ一符号化器 241の動作を一旦停止させて、出力バッファ制御信号によって出力バッファ 242のビットを全て廃棄する。つまり、この時点での出力バッファ 242の中身を符号化データとしない。ビット廃棄の後、制御装置 243は、エントロピー符号化制御信号によってエントロピー符号化器 241を起動させて、規定値以下のビット数になるように入力画像データを再符号化させる。

[0039] 次に、エントロピー符号化として CABACを選択した場合のエントロピー符号化器 2 41の内部構成と動作を説明する。図 13に示すように、エントロピー符号化器 241は、バイナリ化装置 2411、 2値算術符号化装置 2412およびコンテキストモデリング装置 2413を含むエントロピー符号化部 2416、スィッチ 2414ならびにスィッチ 2415で構成される。

[0040] エントロピー符号化装置での PCM再符号化動作につ!/、て説明する。

[0041] エントロピー符号化器 241は、まず、入力データに対するエントロピー符号化の処理を一旦停止する。次いで、コンテキスト複製メモリ 244に保存されたコンテキストデータをコンテキストモデリング装置 2413に読み込む。その後、バイナリ化装置 2411 は、 PCMの開始を示す予測パラメータの bin (binary symbol)を生成して、 2値算術符号化装置 2412に供給する。これと同時に、コンテキストモデリング装置 2413は、 binに対応するコンテキストデータを 2値算術符号化装置 2412に供給する。 2値算術符号化装置 2412は、コンテキストデータを用いて binを算術符号化し、スィッチ 24 15を経由して出力ビットを出力バッファ 242に書き出しながら、算術符号化で更新されたコンテキストデータをコンテキストモデリング装置 2413に返す。 2値算術符号化装置 2412は、 PCMの開始を示す予測パラメータの binを算術符号化し終えた後に、スィッチ 2414を切り換えて、原画像 MBメモリ 211に格納された画像を読み込んで PCMのまま再符号化して、出力バッファ 242に書き出す。 [0042] 再符号化の処理として、上記の変換処理を適用していない原画像を PCMで再符号化する処理を原画像 PCM再符号化という（特許文献 1参照。）。原画像 PCM再符号化を利用すれば、変換や予測が全く効かない画像を無歪みで、 MBビット数の規定値以下の一定のビット数で符号化できるので、符号化装置のエントロピー符号化装置の処理時間だけでなぐ復号側のエントロピー復号化装置の処理時間をある一定時間に保証できると!/、われて!/、る。

[0043] また、再符号化を伴うことなく MBビット数の規定値を遵守する方法として、 MBの M B出力ビット数を CABAC前に予測し、符号化画像を利用した PCM符号化に切り替える方法がある（特許文献 2参照。）。

[0044] 次に、 CABACの符号化処理について詳細に説明する。

[0045] 図 14に示すように、 CABACを実現するために、例えば、バイナリ化器 101、スイツチ 111、 2値算術符号化器 102およびコンテキストモデリング器 103によって構成される。なお、図 14に示す構成は、図 13に示すエントロピー符号化部 2416の構成に相当する。コンテキストモデリング器 103はスライス先頭の MB処理前に最初の MBの QPを用いて初期化される（非特許文献 1の 9· 3. 1 Initialisation process参照。）。

[0046] ノイナリ化器 101は、入力される SEを規格で定められたルールに従って 2進列 (バイナリシーケンス）に変換する（SEと 2進列変換の対応は非特許文献 1の 9. 3. 2 Bi narization process参照。）。次いで、 2値算術符号化器 102は、バイナリ化器 101から供給されるバイナリシーケンスの各シンボル (bin)を、コンテキストモデリング器 103から供給されるコンテキスト（優勢シンボル（MPS) )とステートインデックス（state— idx) を利用して、 2値算術符号化する。

[0047] なお、コンテキストの MPSは非特許文献 1における valMPSに対応し、 state— idx は非特許文献 1における pStateldxに対応する。一般的に 2値算術符号化では、シンボルの出現確率 pに応じて数直線 [0、 1)を分割し、最終的な部分区間代表点の 2進小数値を最終的な符号語としてビット出力する。 3シンボルの入力（110)に対する通常の 2値算術符号化の動作例を図 15に示す。

[0048] H. 264規格の 2値算術符号化において、現 bin処理時の劣勢シンボル（LPS)の出現確率 (rLPS (i) )が図 15における pに対応する。 rLPS (i)は、以下の式 10で表現できる。

[0049] [数 10] rLPS (ι ) = range 1 ab LRS [state ldx i[aCodIrangeIdx] I Rrange (i、

[0050] ここで、 Erange (i) (非特許文献 1における codlRangeに対応）を現 bin処理時の算術レンジ、 qCodlRangeldxを Erange (i)の上位ビットから得られる算術レンジインデッタス、 rangeTabLPS [64] [4] (非特許文献 1における table 9— 35)を劣勢シンボノレレンジ表とする (非特許文献 1の 9. 3. 4 Arithmetic encoding process (informat ive )参照。）。

[0051] 2値算術符号化器 102が、 rLPS (i)を用いて、以下の式 11および式 12の演算に相当する処理 (非特許文献 1の 9. 3. 4. 2 Encoding process for a binary decision (i nformative )参照。）を行うことによって、 1つの binに対する 2値算術符号化の処理が完了する。ここで、 Elow (i) (非特許文献 1における codlLowに対応）は現 bin処理時の算術下限であるとする。 rLPS (i)が常に固定の値となる Bypass encodingもある¹^特許文献上の 9. 3. 4. 4 Bypass Encoding process for a binary decisions unfor mative )参照。 )。

[0052] [数 11]

Erange (i) - rLPS (i) Λ if (bin = MPS)

Erange (i + 1)

[ rLPS① Λ otherwise.

[0053] [数 12] f Elow (i) Λ if (bin = MPS)

Elow (i + 1) =

Erange (り - rLPS (i) Λ otherwise.

[0054] また、 H. 264規格の 2値算術符号化では、入力シンボルの出現頻度に合致した算術符号化を行うために、 lbinの 2値算術符号化が完了する度に、 binの 2値算術符号化に利用したコンテキストの MPSを以下の式 13で更新し、同時に、コンテキストの state idxの値を state遷移表（非特許文献 1の Table 9-36)に従って更新する。 [0055] [数 13]

1一 MPS Λ if ( state _idx 二 0 AND bin≠ MPS)

MPS =

MPS Λ Otherwise.

[0056] 上述したように、 H. 264規格の 2値算術符号化は、劣勢シンボルの確率を劣勢シンボルレンジ表と state遷移表によって管理するので、テーブル引き 2値算術符号化

(table-driven binary antnmetic coding )と呼はれる ₀

[0057] 入力されるすべての binに上述した 2値算術符号化を逐次行うことによって、算術符号化出力ビット（ビットストリーム）が得られる。

[0058] 特許文献 1 :特開 2006— 93777号公報

特許文献 2：特願 2005— 300933号公報

非特許文献 1 : ITU— T 勧告 Η· 2り 4 Advanced video coding for generic audiovisu al services, 2005年 5月 (Prepublished version )

発明の開示

発明が解決しょうとする課題

[0059] 発明が解決しょうとする第 1の課題は、算術レンジやコンテキストによる出力ビットの変動を考慮して CABACの出力ビット数の最大値を推定する方法を提供することである。 PCM再符号化を伴うことなく MBビット数の規定値を遵守する方法が提案された特許文献 2においては、 CABACの MB出力ビット数の推定に関して、推定精度がよく考慮されていない。具体的には、特許文献 2に記載された方法では、 CABACの入力シンボル（bin)の個数に対して単純な線形計算を適用して CABACの MB出力ビット数を推定しているため、算術符号化レンジやコンテキストによって出力ビット数が変動することが考慮できなレヽとレ、う問題がある。

[0060] 発明が解決しょうとする第 2の課題は、 CABACの binとコンテキストに応じて、好適な推定方法を適応的に選択して出力ビット数を推定する方法を提供することである。出力ビット数の変動を考慮した推定にお!/、て、全ての binに対して高精度な推定方法を適用すれば、最も高信頼度な出力ビット数の推定が可能であるが、装置面積と計算処理量が増大するという別の問題が発生する。 [0061] すなわち、本発明は、算術レンジやコンテキストによって出力ビット数が変動することを考慮し、 1つのシンボル、または複数のシンボルに対する算術符号化出力ビット数の最大値を高精度に推定して映像符号化を行う映像符号化方法、映像符号化装置および映像符号化プログラムを提供することを目的とする。

[0062] また、出力ビット数推定に伴う演算量の削減を削減でき、出力ビット数の推定の精度を高品質に行う映像符号化方法、映像符号化装置および映像符号化プログラムを提供することを目的とする。

課題を解決するための手段

[0063] 上記課題を解決する本発明は、画像ブロックの符号化データを 2進列のシンボルに変換する 2進列変換ステップと、 2進列の各シンボルをコンテキストに応じて算術符号化する 2値算術符号化ステップと、画像ブロックに対する符号化データが 2値算術符号化されるときに必要なビット数を推定する推定ステップと、前記推定ステップで推定されたビット数に応じて前記符号化データを 2値算術符号化して出力するか否かを決定する符号化データ決定ステップと、前記符号化データ決定ステップで 2値算術符号化して出力すると決定された符号化データに対応する前記コンテキストを更新し、前記符号化データ決定ステップで 2値算術符号化して出力しないと決定された符号化データに対応する前記コンテキストを更新しないコンテキスト更新ステップとを備え、前記推定ステップで、 2値算術符号化への入力シンボルに対する算術符号化出力ビット数の最大値を前記ビット数とすることを特徴とする映像符号化方法である。

[0064] また、上記課題を解決する本発明は、画像ブロックの符号化データを 2進列のシンボルに変換する 2進列変換部と、 2進列の各シンボルをコンテキストに応じて算術符号化する 2値算術符号化部と、画像ブロックに対する符号化データが 2値算術符号化されるときに必要なビット数を推定する推定部と、前記推定部が推定したビット数に応じて前記符号化データを 2値算術符号化して出力するか否かを決定する符号化データ決定部と、前記符号化データ決定部が 2値算術符号化して出力すると決定した符号化データに対応する前記コンテキストを更新し、前記符号化データ決定部が 2 値算術符号化して出力しないと決定した符号化データに対応する前記コンテキストを更新しないコンテキスト更新部とを備え、前記推定部は、 2値算術符号化への入力シンボルに対する算術符号化出力ビット数の最大値を前記ビット数とすることを特徴とする映像符号化装置である。

[0065] また、上記課題を解決する本発明は、コンピュータに、画像ブロックの符号化データを 2進列のシンボルに変換する 2進列変換処理と、 2進列の各シンボルをコンテキストに応じて算術符号化する 2値算術符号化処理と、画像ブロックに対する符号化データが 2値算術符号化されるときに必要なビット数を推定する推定処理と、前記推定処理で推定されたビット数に応じて前記符号化データを 2値算術符号化して出力するか否かを決定する符号化データ決定処理と、前記符号化データ決定処理で 2値算術符号化して出力すると決定された符号化データに対応する前記コンテキストを更新し、前記符号化データ決定処理で 2値算術符号化して出力しないと決定された符号化データに対応する前記コンテキストを更新しないコンテキスト更新処理とを実行させ、前記推定処理で、 2値算術符号化への入力シンボルに対する算術符号化出力ビット数の最大値を前記ビット数とする処理を実行させることを特徴とする映像符号化プログラムである。

発明の効果

[0066] 本発明の第 1の効果は、 CABACの算術符号化における出力ビット数を高信頼度に見積もることができる映像符号化方法、映像符号化装置および映像符号化プログラムを提供することができることである。その理由は、算術符号化のレンジやコンテキストに応じて出力ビット数の変動を見積ることができるからである。

[0067] 第 2の効果は、第 1の効果を奏する高信頼度な出力ビット数の見積もりを用いて、 H . 264規格の映像符号化方法における再符号化を伴わなレ、MBビット数の規定値を遵守する方法等として用いることによって、高品質な H. 264規格の映像符号化方法、映像符号化装置および映像符号化プログラムを提供できるようになることである。その理由は、高信頼度な見積もりが適用できるため、符号ビット数を MBビット数の規定値に対する余分なマージンを少なくすることができ、例えば、量子化パラメータを粗くするなどの方法による符号化された映像の画質を悪化させるような規定値の遵守手段を抑制できるためである。

図面の簡単な説明 [0068] [図 1]CABACにおける state— idxと p LPSとの関係を説明する図である。

[図 2]本発明の第 1の実施の形態の映像符号化器における算術符号化出力ビット数推定方法による CABACを実現するためのエントロピー符号化部の構成を示すプロック図である。

[図 3]図 2に示すエントロピー符号化部の動作を示すフローチャートである。

[図 4]本発明の第 2の実施の形態における 2値算術符号化最大ビット数計算器の構成を示すブロック図である。

[図 5]図 4に示す 2値算術符号化最大ビット数計算器の動作を示すフローチャートである。

[図 6]本発明の第 3の実施の形態の映像符号化器における算術符号化出力ビット数推定方法による CABACを実現するためのエントロピー符号化部の構成を示すプロック図である。

[図 7]図 6に示すエントロピー符号化部の動作を示すフローチャートである。

[図 8]本発明を実現可能な情報処理システムの構成を示すブロック図である。

[図 9]一般的な映像符号化装置の構成を説明するブロック図である。

[図 10]画像フレーム（YUV420フォーマット）の構成を説明するための説明図である

[図 11]フレーム内予測の一例を説明するための説明図である。

[図 12]フレーム間予測の一例を説明するための説明図である。

[図 13]PCM再符号化を説明するための説明図である。

[図 14]CABACを実現するための一般的なエントロピー符号化部の構成を示すプロック図である。

[図 15]2値算術符号化の動作例を説明するための説明図である。

符号の説明

[0069] 101 バイナリ化器

102 2値算術符号化器

103 コンテキストモデリング器

104 binバッファ 105 2値算術符号化最大ビット数計算器

106 第 2コンテキストモデリング器

107 コンテキスト複製メモリ

110 スィッチ部（PCM再符号化スィッチ）

1050 2値算術符号化最大ビット数計算器

1051 lbin単位計算器

1052 複数 bin単位計算器

1053 累積計算器

1054 スィッチ部（単位計算器スィッチ）

1055 スィッチ部（累積計算器スィッチ）

発明を実施するための最良の形態

[0070] 本発明の実施の形態を説明する。

[0071] 上述したように、 rLPS (i)を利用することによって、現 bin (i番目の bin)に対する瞬間的な算術符号化出力ビットの数（cabac— bits (i) )を、現 binと MPSの比較により式 14で計算できる。式 14は、 CABACで lbinから出力されるビット数を計算するための式である。

[0072] [数 14]

[0073] ここで、 H. 264規格では、 Erange (i)が固定のビット精度（9ビット）で表現されること、および、 rangeTabLPS [64] [4]が規格で定めた固定値であることの 2点に着目する。すると、未来の算術レンジ Erange (i)の値が未確定な条件（条件 1)であっても、コンテキストの state— idxに対して rLPS (i)が取り得る最大値（max— rLPS (state — idx) )および最小値（min— rLPS (state— idx) )は確定する。すなわち、現 binに対する cabac— bits (i)の最大値（max— cabac— bits (i) )を、式 15で正確に計算できる。式 15は、 CABACで条件 1において lbinから出力されるビット数の最大値を計算するための式である。 [0074] [[数数 1155]]

mmaaxx ccaabbaacc b biittss ((iι)) ==

(( mmaaxx_— rr LLPPSS (( ssttaattee _—iiddxx)) -- 11)) ΛΛ iiff ((bbiinn == MMPPSS))

((-— mmiinn rrLLPPSS (( ssttaattee iiddxx)))) ΛΛ ootthheerrwwiissee..

[0075] つまり、 CABACにおいて、最初の MBでコンテキストの state— idxと MPSの初期化を行い、バイナリ化と 2値算術符号化の間に binを格納する中間バッファを設け、 2 値算術符号化に先行して、中間バッファに格納された各 binに対して式 15の計算と s tate遷移表による sutate— idx遷移計算によって、中間バッファに格納する bin、すなわち、 MBレイヤの SEに対する算術符号化出力ビット数の最大値を正確に計算すること力 Sでさる。

[0076] さらに、未来の算術レンジ Erange (i)だけでなぐ未来のコンテキストの state— idx が未確定な条件（条件 2)であっても、 H. 264規格では state— idx力 tate遷移表によって管理されること、また、 state— idxに対する rLPSが連続的に変化すること（図 1 、グラフの縦軸の p LPSが rLPSに対応）の 2点に着目すると、条件 2における複数 bi nに対する算術符号化出力ビット数の最大値 (max— sum— cabac— bits)は、現時点の state— idx の値が 0になるまで連続して LPSが入力されて発生するビット数と、 state=0で MPSが反転し続けて発生するビット数の合計になる。なお、図 1は、 CA BACにおける state— idx (横軸）と p LPS (縦軸）との関係を説明する図である。 bin 数を B、現時点の state— idxの値を s0 (s0=62が最大出力ビット数になる。）、連続して LPSが入力されて state=sOから state=0になるまでの最大 bin数を Lとすると、 max — sum_cabac_bitsを式 16および式 17で計算できる。なお、 F ）の最大値は 1 ( P = 0. 5)なので、式 16を簡略化した式 18を用いてもよい。式 16は、 CABACで条件 2において複数 binから出力されるビット数の最大値を計算するための式である。式 17は、式 16における F ( p )を計算するための式である。

[0077] [数 16] Max _ sum _ cabac _ bits =

一し

log₂(- n^min-^rLPS(^state))⁺(^B_L) * F(min_rLPS(0)) Λ if(B>L) state =s0

[ [ min r LPS ( state )) Λ otherwise.

state =s0

[0078] [数 17]

F (p) = plog₂ (-p) + (l-p)log₂ (-(l-p))

[0079] [数 18]

Max _ sum _ cabac bits =

し

log₂ ( - I1^min-^rLPS (state)) + (B L) Λ if (B>L) state =s0

B

I ]min r LPS state)) Λ otherwise.

state =s0

[0080] 式 16、式 18の第 1項は、所定の state遷移期間における各 stateの rLPS (state) の最小値の総積であるから、所定の state遷移期間における rLPS (state)総積の最小値である。

[0081] 以上の事項をまとめると、

•未来の算術レンジ Erange (i)の値が未確定であっても、 lbinに対する算術符号化出力ビット数の最大値を式 15で計算できる。

•未来の算術レンジ Erange (i)だけでなく、未来のコンテキストの state— idxも不確定であっても、複数 binに対する算術符号化出力ビット数の最大値は式 16または式 1 8で計算できることが分かる。

[0082] 本発明は、上記 2つの事実にもとづいて、映像符号化方法、映像符号化装置および映像符号化プログラムにおいて、算術レンジやコンテキストによって出力ビット数が変動することを考慮し、 1つの binまたは複数の binに対する算術符号化出力ビット数の最大値を高精度に推定する算術符号化出力ビット数推定方法を実現する。

[0083] すなわち、本発明による映像符号化方法は、画像ブロックの符号化データを 2進列のシンボルに変換する 2進列変換ステップと、 2進列の各シンボルをコンテキストに応じて算術符号化する 2値算術符号化ステップと、画像ブロックに対する符号化データ力 ¾値算術符号化されるときに必要なビット数を推定する推定ステップと、推定ステツプで推定されたビット数に応じて符号化データを 2値算術符号化して出力するか否かを決定する符号化データ決定ステップと、符号化データ決定ステップで 2値算術符号化して出力すると決定された符号化データに対応するコンテキストを更新し、符号化データ決定ステップで 2値算術符号化して出力しないと決定された符号化データに対応するコンテキストを更新しなレ、コンテキスト更新ステップとを備え、推定ステップで、 2値算術符号化への入力シンボルに対する算術符号化出力ビット数の最大値をビット数とすることを特徴とする。

[0084] 映像符号化方法は、推定ステップで、算術符号化出力ビット数の最大値を、劣勢シンボル出現確率の最小値を利用した 1シンボル単位の計算によって求めるように構成されていてもよい。

[0085] 映像符号化方法は、推定ステップで、算術符号化出力ビット数の最大値を、劣勢シンボルが連続して発生したときの劣勢シンボル出現確率の総積の最小値を利用した複数シンボル単位の計算によって求めるように構成されていてもよい。

[0086] 映像符号化方法は、推定ステップで、算術符号化出力ビット数の最大値を、劣勢シンボル出現確率の最小値を利用した 1シンボル単位の計算、および、劣勢シンボルが連続して発生したときの劣勢シンボル出現確率の総積の最小値を利用した複数シンボル単位の計算によって求めるように構成されて!/、てもよ!/、。

[0087] 映像符号化方法は、画像ブロックを周波数領域に変換し量子化した変換量子化値を計算する変換量子化ステップと、画像ブロックを非エントロピー符号化（エントロピ一符号化を適用せず非圧縮データとして符号化）したデータを出力する非エントロピ一符号化ステップとを備え、符号化データ決定ステップで、推定されたビット数が所定値を越える場合に、 PCMモードヘッダを、出力する符号化データとして決定し、非エントロピー符号化ステップで、 2値算術符号化ステップで PCMモードヘッダが算術符号化されて出力された後に、変換量子化値を再構築して得られる画像ブロックまたは変換量子化を適用する前の元の画像ブロックの画像を非エントロピー符号化した P CMデータを出力するように構成されて!/、てもよ!/、。

[0088] 本発明による映像符号化装置は、画像ブロックの符号化データを 2進列のシンボルに変換する 2進列変換部（一例として、バイナリ化器 101で実現される。）と、 2進列の各シンボルをコンテキストに応じて算術符号化する 2値算術符号化部（一例として、 2 値算術符号化器 102で実現される。）と、画像ブロックに対する符号化データが 2値算術符号化されるときに必要なビット数を推定する推定部 (一例として、 2値算術符号化最大ビット数計算器 105, 1050で実現される。）と、推定部が推定したビット数に応じて符号化データを 2値算術符号化して出力するか否かを決定する符号化データ決定部 (一例として、 2値算術符号化器 102で実現される。）と、符号化データ決定部が 2値算術符号化して出力すると決定した符号化データに対応するコンテキストを更新し、符号化データ決定部が 2値算術符号化して出力しないと決定した符号化データに対応するコンテキストを更新しないコンテキスト更新部（一例として、 2値算術符号化器 102で実現される。）とを備え、推定部は、 2値算術符号化への入力シンボルに対する算術符号化出力ビット数の最大値をビット数とすることを特徴とする。

[0089] 映像符号化装置は、推定部が、算術符号化出力ビット数の最大値を、劣勢シンポル出現確率の最小値を利用した 1シンボル単位の計算（式 15参照）によって求めるように構成されていてもよい。

[0090] 映像符号化装置は、推定部が、算術符号化出力ビット数の最大値を、劣勢シンポルが連続して発生したときの劣勢シンボル出現確率の総積の最小値を利用した複数シンボル単位の計算（式 16,式 18参照）によって求めるように構成されていてもよい

[0091] 映像符号化装置は、推定部が、算術符号化出力ビット数の最大値を、劣勢シンポル出現確率の最小値を利用した 1シンボル単位の計算、および、劣勢シンボルが連続して発生したときの劣勢シンボル出現確率の総積の最小値を利用した複数シンポル単位の計算によって求めるように構成されてレ、てもよ!/、。

[0092] 映像符号化装置は、画像ブロックを周波数領域に変換し量子化した変換量子化値を計算する変換量子化部と、画像ブロックを非エントロピー符号化したデータを出力する非エントロピー符号化部とを備え、符号化データ決定部が、推定されたビット数が所定値を越える場合に、 PCMモードヘッダを、出力する符号化データとして決定し、非エントロピー符号化部が、 2値算術符号化部が PCMモードヘッダを算術符号化して出力した後に、変換量子化値を再構築して得られる画像ブロックまたは変換量子化を適用する前の元の画像ブロックの画像を非エントロピー符号化した PCMデータを出力するように構成されて!/、てもよ!/、。

[0093] 本発明による映像符号化プログラムは、コンピュータに、画像ブロックの符号化データを 2進列のシンボルに変換する 2進列変換処理と、 2進列の各シンボルをコンテキストに応じて算術符号化する 2値算術符号化処理と、画像ブロックに対する符号化データが 2値算術符号化されるときに必要なビット数を推定する推定処理と、推定処理で推定されたビット数に応じて符号化データを 2値算術符号化して出力するか否力、を決定する符号化データ決定処理と、符号化データ決定処理で 2値算術符号化して出力すると決定された符号化データに対応するコンテキストを更新し、符号化データ決定処理で 2値算術符号化して出力しないと決定された符号化データに対応するコンテキストを更新しないコンテキスト更新処理とを実行させ、推定処理で、 2値算術符号化への入力シンボルに対する算術符号化出力ビット数の最大値をビット数とする処理を実行させることを特徴とする。

[0094] 映像符号化プログラムは、コンピュータに、推定処理で、算術符号化出力ビット数の最大値を、劣勢シンボル出現確率の最小値を利用した 1シンボル単位の計算によつて求める処理を実行させるように構成されて!/、てもよ!/、。

[0095] 映像符号化プログラムは、コンピュータに、推定処理で、算術符号化出力ビット数の最大値を、劣勢シンボルが連続して発生したときの劣勢シンボル出現確率の総積の最小値を利用した複数シンボル単位の計算によって求める処理を実行させるように構成されていてもよい。

[0096] 映像符号化プログラムは、コンピュータに、推定処理で、算術符号化出力ビット数の最大値を、劣勢シンボル出現確率の最小値を利用した 1シンボル単位の計算、および、劣勢シンボルが連続して発生したときの劣勢シンボル出現確率の総積の最小値を利用した複数シンボル単位の計算によって求める処理を実行させるように構成されていてもよい。

[0097] 映像符号化プログラムは、コンピュータに、画像ブロックを周波数領域に変換し量子化した変換量子化値を計算する変換量子化処理と、画像ブロックを非エントロピー符号化したデータを出力する非エントロピー符号化処理とを実行させ、符号化データ決定処理で、推定されたビット数が所定値を越える場合に、 PCMモードヘッダを、出力する符号化データとして決定し、非エントロピー符号化処理で、 2値算術符号化処理で PCMモードヘッダが算術符号化されて出力された後に、変換量子化値を再構築して得られる画像ブロックまたは変換量子化を適用する前の元の画像ブロックの画像を非エントロピー符号化した PCMデータを出力する処理を実行させるように構成されていてもよい。

[0098] 以下、本発明の具体的な実施の形態を、図面を参照して説明する。

[0099] 実施の形態 1.

図 2は、本実施の形態の CABACを実現するためのエントロピー符号化部を示すブロック図である。本実施の形態の CABACを実現するためのエントロピー符号化部は、図 14に示されたエントロピー符号化部と比較すると、 binバッファ 104、 2値算術符号化最大ビット数計算器 105、第 2コンテキストモデリング器 106およびスィッチ部 (P CM再符号化スィッチ） 110をさらに備えている。なお、本実施の形態では、 2値算術符号化器 102は、推定したビット数に応じて符号化データを 2値算術符号化して出力するか否かを決定する機能を備えている。また、第 1〜第 3の実施の形態において、エントロピー符号化器 241の構成は異なるが、映像符号化装置の全体的な構成は図 9に示された構成と同じである。

[0100] バイナリ化器 101は、図 14に示されたものと同様に、入力された MBレイヤの SEを規格 (例えば、 H. 264規格）で定められたルールに従ってバイナリシーケンスに変換する。そして、バイナリシーケンスを binバッファ 104に格納する。次いで、 2値算術符号化最大ビット数計算器 105は、 binバッファ 104に格納されたバイナリシーケンスの各 binについて、逐次、第 2コンテキストモデリング器 106から供給されるコンテキストを利用して、各 binに対する算術符号化出力ビット数の最大値を式 15で計算し、その累積値を最大ビット数 (推定された 2値算術符号化されるときに必要なビット数に相当 )として出力する。

[0101] エントロピー符号化装置での PCM再符号化に際して、基本的な動作では、コンテキスト複製メモリ 244に保存されたコンテキストデータをコンテキストモデリング器 103 に読み込む。その後、バイナリ化器 101は、 PCMの開始を示す予測パラメータの bin を生成して、 2値算術符号化器 102に供給する。これと同時に、コンテキストモデリング器 103は、 binに対応するコンテキストデータを 2値算術符号化器 102に供給する。 2値算術符号化器 102は、、コンテキストデータを用いて binを算術符号化し、スイツチ部 110を経由して出力ビットを出力バッファ 242に書き出しながら、算術符号化で更新されたコンテキストデータをコンテキストモデリング器 103に返す。 2値算術符号化器 102は、 PCMの開始を示す予測パラメータの binを算術符号化し終えた後に、原画像 MBメモリ 211に格納された画像を読み込んで PCMのまま再符号化して出力バッファ 242に書き出す。

[0102] 本実施の形態では、 2値算術符号化器 102は、 2値算術符号化最大ビット数計算器 105から供給される最大ビット数を監視し、最大ビット数が所定の閾値 (例えば 320 0ビット）以下であれば、図 14に示されたものと同様に、 binバッファ 104に格納されたバイナリシーケンスの各 binを、コンテキストモデリング器 103から供給されるコンテキストを利用して 2値算術符号化する。最大ビット数が所定の閾値よりも多ければ、 2値算術符号化器 102は、 PCM符号化に対応する MBレイヤの SE (PCMモードヘッダ )に相当するバイナリシーケンスの各 binだけを 2値算術符号化する。そのように処理を行うことによって、 2値算術符号化して出力しないと決定された符号化データに対応するコンテキストの更新がなされず、以降の MBの 2値算術符号化に必要なコンテキストが不正に更新されるのを防ぐことができる。

[0103] スィッチ部 110は、 2値算術符号化最大ビット数計算器 105から供給される最大ビット数を監視し、最大ビット数が所定の閾値以下であれば、 2値算術符号化器 102の出力のみを選択して外部にビットストリームとして供給する。最大ビット数が所定の閾値よりも多ければ、スィッチ部 110は、 2値算術符号化器 102の出力（PCM符号化に対応する MBレイヤの SEに相当する 2値算術符号化データ）を外部にビットストリームとして供給した後、外部から供給される画像データを選択して PCMデータとしてさらに外部にビットストリームとして供給する。なお、 H. 264規格では、非エントロピー符号化として PCM符号化が規定されている。すなわち、スィッチ部 110は、外部から供給される画像データを選択する場合には、画像を非エントロピー符号化した PCMデータを出力することになる。

[0104] ここで注意すべきことは、第 2コンテキストモデリング器 106に格納されたコンテキストと、コンテキストモデリング器 104に格納されたコンテキストとは常に同期していることである。つまり、 2値算術符号化最大ビット数計算器 105から供給される最大ビット数が所定の閾値を越えた場合には、エントロピー符号化部は、第 2コンテキストモデリング器 106に格納されたコンテキストを、コンテキストモデリング器 104に格納されたコンテキストで更新するものとする。

[0105] なお、外部から供給される画像データは、対応する MBの原画像データであってもょレ、し、対応する MBを符号化した結果の符号化画像データであってもよ!/、。

[0106] 次に、図 3のフローチャートを参照して、本実施の形態の CABACを実現するためのエントロピー符号化部の動作を説明する。

[0107] 本実施の形態のエントロピー符号化部は、 MBレイヤ SEの CABACに際して、 MB 最大ビットカウンタ（mb— max— bit)の値を 0に初期化する。そして、初期化後に、以下で説明する 6つステップの処理を行う。

[0108] ステップ S101では、バイナリ化器 101力 MBレイヤのすべての SEを MBレイヤの SEを規格で定められたルールに従ってバイナリシーケンスに変換し、 binバッファ 10 4に格納する。そして、ステップ S 102に移る。

[0109] ステップ S102では、 2値算術符号化最大ビット数計算器 105が、 binバッファ 104 に格納されたバイナリシーケンスの各 binにつ!/、て、第 2コンテキストモデリング器から供給されるコンテキストを利用して、各 binに対する算術符号化出力ビットの最大値を式 15で計算し、 MB最大ビットカウンタを式 19で更新する。そして、ステップ S 103に移る。式 19は、本実施の形態における符号量推定の計算のための式である。

[0110] [数 19]

mb max bit = mb max— bit + cabac— bits u) [0111] ステップ S103では、 2値算術符号化最大ビット数計算器 105が、 binバッファ 104 に格納されたバイナリシーケンスの各 binに対して、ステップ S102の処理をすベて適用したか否力、を判断し、すべて適用したのであればステップ S104に移り、そうでなければステップ S102に移る。なお、ステップ S104に移る条件として、 mb— max— bit 力 200 (閾値）を超えたか否かを追加してもよ!/、。

[0112] ステップ S104では、 2値算術符号化器 102が、 mb— max— bitが 3200ビット以下か否かを判断し、 3200ビット以下であればステップ S105に移り、そうでなければステップ S 106に移る。

[0113] ステップ S105では、 2値算術符号化器 102が、 binバッファ 104に格納されたバイナリシーケンスの各 binを、コンテキストモデリング器 103から供給されるコンテキストを利用して、 2値算術符号化する。 binバッファ 104に格納されたバイナリシーケンスの各 binに対する 2値算術符号化が完了したのち、 MBの CABAC処理を終了する。

[0114] ステップ S106では、スィッチ部 110力 PCM符号化に対応する MBレイヤの SEに相当する 2値算術符号化データを出力した後、画像データを PCMデータとして出力する。次いで、後続 MBのために、第 2コンテキストモデリング器 106に格納されたコンテキストを、コンテキストモデリング器 104に格納されたコンテキストで更新したのち、 MBの CABAC処理を終了する。

[0115] 以上のようにして、本実施の形態における CABACの処理が遂行される。本実施の形態では、算術レンジやコンテキストによって出力ビット数が変動することを考慮し、 1 つの binに対する算術符号化出力ビット数の最大値を高精度に推定する。よって、本実施の形態の CABACを実現するためのエントロピー符号化部を利用することによつて、 MBレイヤ SEの各 binに対する算術符号化出力ビットの最大値を高精度に推定することができ、 MB出力ビット数が 3200ビット以下になるように高精度に符号化制徒 Pすること力 Sでさる。

[0116] なお、本実施の形態において、 MB最大ビットカウンタが所定値の 3200ビットを超えるかを判断する（ステップ S104)だけでなぐ MB最大ビットカウンタとレート制御装置 30が割り当てる符号量の関係を考慮して、上述したステップ S 106の処理のように PCM符号化を行ってもよ!/、。 [0117] 実施の形態 2.

第 1の実施形態（実施の形態 1)では、 lbin単位で算術符号化出力ビット数の最大値が高精度に推定された。本実施の形態では、 CABACは、さらに、 MBレイヤの SE の種類によって、複数 bin単位の算術符号化出力ビット数の最大値を推定する。複数 bin単位で算術符号化出力ビット数の最大値を計算するメリットは、演算のオーバヘッドを減らせることである。ただし、第 1の実施形態の場合に比べて、算術符号化出力ビット数をより大きく見積もることになる。

[0118] 複数 bin単位で算術符号化出力ビット数の最大値を推定する MBレイヤの SEとして、 residualレイヤ（非特許文献 1の 7· 3. 4. 3参照。）よりも上位の SEであることが望ましい。 residualレイヤよりも上位の SEについては、 MBレイヤにおける binの割合が少なぐ算術符号化出力ビット数の最大値を多く見積もって、 MBレイヤ全体の算術符号化出力ビットに対する影響が比較的少ないからである。ただし、もちろん、任意の SEで、 lbin単位での算術符号化出力ビット数の最大値推定と、複数 bin単位での算術符号化出力ビット数の最大値推定を切り替え可能である。

[0119] なお、 residualレの significant― coeff― flagねよび last― signiiicant― coe ff— flagの SEは、 1つの SEから 1シンボルしか生成されない SEであり、かつ、 MBレィャにおいても個数が多い SEであるため、 lbin単位で算術符号化出力ビット数の最大値を高精度に推定することが望ましい。

[0120] 本実施の形態の CABACを実現するためのエントロピー符号化部の構成は、第 1 の実施形態のエントロピー符号化部において、 2値算術符号化最大ビット数計算器 1 05の内部構成が変わるだけである。よって、第 1の実施形態との差分である 2値算術符号化最大ビット数計算器 105のみを説明する。

[0121] 図 4は、本実施の形態における 2値算術符号化最大ビット数計算器 1050の構成を示すブロック図である。図 4に示すように、 2値算術符号化最大ビット数計算器 1050 は、スィッチ部（単位計算器スィッチ） 1054、 lbin単位計算器 1051、複数 bin単位計算器 1052、スィッチ部（累積計算器スィッチ） 1055、および累積計算器 1053で構成される。

[0122] スィッチ部 1054は、外部（図 2に示す binバッファ 104)力も供給されるバイナリシーケンスについて、その SEが lbin単位で算術符号化出力ビット数の最大値を推定する SEであれば、バイナリシーケンスを lbin単位計算器 1051に供給する。そうでなければ、スィッチ部 1054は、バイナリシーケンスを複数 bin単位計算器 1052に供給す

[0123] lbin単位計算器 1051は、逐次、外部（図 2に示す第 2コンテキストモデリング器 10 6)から供給されるコンテキストを利用して、各 binに対する算術符号化出力ビットの最大値を式 15で計算し、スィッチ部 1055を経由して、計算した値を累積計算器 1053 に出力する。

[0124] 複数 bin単位計算器 1051は、逐次、外部（図 2に示す第 2コンテキストモデリング器

106)から供給されるコンテキストを利用して、複数 binに対する算術符号化出力ビット数の最大値を式 16または式 18で計算し、スィッチ部 1055を経由して、その最大値を累積計算器 1053に出力する。なお、本実施の形態では、 MBレイヤ処理後の第 2 コンテキストモデリング器 106と、 MBレイヤ処理後のコンテキストモデリング器 103とでコンテキストの値が異なる。第 2コンテキストモデリング器 106のコンテキストを劣勢シンボルが連続して発生したものとして、 state— idxを遷移させるからである。

[0125] 累積計算器 1053は、 MBレイヤの SEに属する lbinもしくは複数 binに対する算術符号化出力ビットの最大値を累積し、 MBレイヤの SEの処理が終わった後に、累積値を外部（図 2に示す 2値算術符号化器 102とスィッチ部 110)に出力する。

[0126] 次に、図 5のフローチャートを参照して、本実施の形態の 2値算術符号化最大ビット数計算器 1050の動作を説明する。 CABACを実現するためのエントロピー符号化部全体の処理は図 3のフローチャートに示された処理と同じである力ステップ S 102 の処理が図 4のフローチャートに示す処理に置き換わる。

[0127] ステップ S111では、スィッチ部 1054力バイナリシーケンスの SEが lbin単位で算術符号化出力ビット数の最大値を推定する SEであるか否力、 (例えば、 MBレイヤの S Eよりも上位の SEであるか否力、)を判断する。 lbin単位で算術符号化出力ビット数の最大値を推定する SEであればステップ S 112に移り、そうでなければ、 S113に移る

[0128] ステップ S112では、 lbin単位計算器 1051が、逐次、外部（図 2に示す第 2コンテキストモデリング器 103)から供給されるコンテキストを利用して、各 binに対する算術符号化出力ビットの最大値を式 15で計算して、処理を終了する。ステップ S 113では、複数 bin単位計算器 1051が、逐次、外部（図 2に示す第 2コンテキストモデリング器 106)から供給されるコンテキストを利用して、複数 binに対する算術符号化出力ビット数の最大値を式 16または式 18で計算して、処理を終了する。

[0129] ステップ S112またはステップ S113で得られた、最大値（lbinまたは複数 binに対する算術符号化出力ビット数の最大値）は外部に供給され、バイナリシーケンスに対する 2値算術符号化最大ビット数計算は終了する。

[0130] 本実施の形態の CABACを利用することによって、 MBレイヤ SEの各 binに対する算術符号化出力ビット数の最大値を高精度に推定することができ、 MB出力ビット数力 ¾200ビット以下になるように高精度に符号化制御することができる。また、複数 bin 単位で算術符号化出力ビット数の最大値を推定することで、推定に伴う演算のォーバヘッドを減らすことができる。

[0131] なお、本実施の形態では、ステップ S111の判断処理により、 lbin単位での算術符号化出力ビット数の最大値を推定処理と、複数 bin単位での算術符号化出力ビット数の最大値の推定処理とを切り替えるようにした力常に複数 bin単位での算術符号化出力ビット数の最大値の推定処理を実行するようにしてもよい。

[0132] 実施の形態 3.

図 6は、第 3の実施の形態（実施の形態 3)の CABACを実現するためのエントロピ一符号化部を示すブロック図である。本実施の形態において、 2値算術符号化最大ビット数計算器 105は、第 1の実施の形態（実施の形態 1)または第 2の実施の形態（実施の形態 2)のいずれかにおける 2値算術符号化最大ビット数計算器が用いた方式と同様の方式を用いる。ここでは、第 1の実施の形態と同様の 2値算術符号化最大ビット数計算器 105を例にする。

[0133] 本実施の形態の CABACを実現するためのエントロピー符号化部は、図 14に示されたエントロピー符号化部と比較すると、 binバッファ 104、 2値算術符号化最大ビット数計算器 105、第 2コンテキストモデリング器 106およびスィッチ部 108をさらに備えている。 [0134] バイナリ化器 101は、入力される MBレイヤの SEを規格で定められたルールに従つてバイナリシーケンスに変換し、 binバッファ 104に格納する。次いで、 2値算術符号化最大ビット数計算器 105は、 binバッファ 104に格納されたバイナリシーケンスの各 binについて、逐次、第 2コンテキストモデリング器 106から供給されるコンテキストを利用して、各 binに対する算術符号化出力ビット数の最大値を計算する。そして、計算された累積値と MBビット数の規定値 (例えば 3200ビット）を比較する。累積値が MBビット数の規定値を超えた場合には、 binバッファ 104力も MBの出力 binをクリアし、 PCM符号化に対応する MBレイヤの SEに相当するヘッダの binを binバッファ 10 4に格納する。

[0135] スィッチ部 108は、 2値算術符号化最大ビット数計算器 105から供給される最大ビット数を監視し、最大ビット数が MB最大ビット数の規定値以下であれば、バイナリ化器 101の出力のみを選択して binバッファ 104に供給する。最大ビット数が MB最大ビット数の規定値よりも多ければ、スィッチ部 108は、 PCM符号化のヘッダの binを供給した後、外部から供給される画像データを選択して PCMデータとして binバッファ 10 4に供給する。

[0136] 2値算術符号化器 102は、バイナリ化器 101の 1MB動作完了以降から動作を開始し、図 14に示されたエントロピー符号化部の場合と同様に、 binバッファ 104に格納されたバイナリシーケンスの各 binを、コンテキストモデリング器 103から供給されるコンテキストを利用して、 2値算術符号化する。算術符号化の動作開始を 1MB以上遅延させる場合、 binバッファ 104の容量に応じて、入力 binレートに対する 2値算術符号化の負荷を数 MB単位で分散させることができる。

[0137] 本実施の形態では、 2値算術符号化器 102の処理が遅延するため、 MB最大ビット数が規定値よりも多かった場合に PCM符号化する場合、第 2コンテキストモデリング器 103への複写を即座に行うことができない。そのため、 2値算術符号化最大ビット数計算器 105は、式 15を用いて出力ビット数を計算するコンテキストについては MB 処理の最初で第 2コンテキストモデリング器 106からの複製を保存しておき、 PCM符号化の際には複製したコンテキストをコピーしてバイナリ符号化を続ける。なお、外部から供給される画像データは、対応する MBの原画像データであってもよいし、対応する MBをエンコードした結果の符号化画像データであってもよい。

[0138] 次に、図 7のフローチャートを参照して、本実施の形態の CABACを実現するためのエントロピー符号化部の動作を説明する。

[0139] 本実施の形態のエントロピー符号化部は、 MBレイヤ SEの CABACに際して、 MB 最大ビットカウンタ（mb— max— bit)の値を 0に初期化する。そして、初期化後に、以下で説明する 7つステップの処理を行う。

[0140] ステップ S201では、 2値算術符号化最大ビット数計算器 105が、 MBレイヤで第 2 コンテキストモデリング器 106が式 15で推定するコンテキストについてコンテキストを複製する。そして、ステップ S202に移る。ステップ S202では、バイナリ化器 101が、 MBレイヤのすべての SEを MBレイヤの SEを規格で定められたルールに従ってバイナリシーケンスに変換し、 binバッファ 104に格納する。そして、ステップ S203に移る

〇

[0141] ステップ S203では、 2値算術符号化最大ビット数計算器 105が、第 1の実施の形態におけるステップ S 102の処理と同様に、 binバッファ 104に格納されたバイナリシ一ケンスの各 binについて、第 2コンテキストモデリング器から供給されるコンテキストを利用して、各 binに対する算術符号化出力ビットの最大値を式 15で計算し、 MB最大ビットカウンタを式 19に示すように更新する。そして、ステップ S204に移る。

[0142] 第 2の実施の形態における 2値算術符号化最大ビット数計算器 1050を用いる場合には、ステップ S203で、図 5のフローチャートと同様の処理を実行したした後、 MB最大ビットカウンタを式 19で更新する。そして、ステップ S204に移る。

[0143] ステップ S204では、 2値算術符号化最大ビット数計算器 105が、 binバッファ 104 に格納されたバイナリシーケンスの各 binに対して、ステップ S203の処理をすベて適用したか否力、を判断し、すべて適用したのであればステップ S205に移り、そうでなければステップ S203に移る。なお、ステップ S205に移る条件として、 mb— max— bit 力 200 (閾値）を超えたか否かを追加してもよ!/、。

[0144] ステップ S205では、 2値算術符号化器 102が、 mb— max— bitが 3200ビット以下か否かを判断し、 3200ビット以下であればステップ S206に移り、そうでなければステップ S 207に移る。 [0145] ステップ S206では、 2値算術符号化器 102が、 PCM符号化に対応する MBレイヤの SEに相当する binデータを出力した後、画像データを PCMデータとして格納する。次いで、後続 MBのために、第 2コンテキストモデリング器 106に格納されたコンテキストを、コンテキスト複製メモリ（第 2コンテキスト複製メモリ） 107に格納されたコンテキストで更新し、 PCM符号化に対応する SE分のコンテキスト遷移を行い、 MBの CA BAC処理を終了する。

[0146] ステップ S207では、 2値算術符号化器 102が、 binバッファ 104に格納されたバイナリシーケンスの各 binを、コンテキストモデリング器 103から供給されるコンテキストを利用して、 2値算術符号化する。 binバッファ 104に格納されたバイナリシーケンスの各 binに対する 2値算術符号化が完了した後、 MBの CABAC処理を終了する。なお、本実施の形態では、ステップ S207の処理の完了を待たずに、次の MBについて S 201の処理を開始してもよい。

[0147] 以上のようにして、本実施の形態における CABACの処理が遂行される。本実施の形態では、 MBレイヤ SEの各 binに対する算術符号化出力ビット数の最大値を高精度に推定することができ、かつ、 2値算術符号化の処理負荷を数 MB単位で分散させることができるので、パイプライン方式の処理に好適に適用される。

[0148] 上記の説明からも明らかなように、上記の各実施の形態を、ハードウェアで構成することも可能である力コンピュータプログラムを用いて実現することも可能である。例えば、上記の各実施の形態を実現するための図 8に示す情報処理システムは、プロセッサ 501、プログラムメモリ 502、画像データを記憶する記憶媒体 503およびビットストリームを記憶する記憶媒体 504を含む。プロセッサ 501は、プログラムメモリ 502 に格納されているプログラムに従って、図 3に示された処理 (第 1の実施の形態）または図 7に示された処理 (第 3の実施の形態）を実行する。第 2の実施の形態を実現する場合には、図 3または図 7に示された処理と図 5に示された処理とを実行する。なお、記憶媒体 503の記憶領域および記憶媒体 504の記憶領域は、別個の記憶媒体における記憶領域であってもよレ、し、同一の記憶媒体における記憶領域であってもよレ、。また、記憶媒体 503, 504として、ハードディスク等の磁気記憶媒体を用いることができる。 [0149] 本出願は、 2006年 12月 14日に出願された日本出願特願 2006— 337468号を基礎とする優先権を主張し、その開示の全てをここに取り込む。

産業上の利用可能性

[0150] 本発明は、算術符号化出力ビット数推定方法による CABACを用いる映像符号化装置に好適に適用される。

Claims

請求の範囲

[1] 画像ブロックの符号化データを 2進列のシンボルに変換する 2進列変換ステップと、

2進列の各シンボルをコンテキストに応じて算術符号化する 2値算術符号化ステツプと、

画像ブロックに対する符号化データが 2値算術符号化されるときに必要なビット数を推定する推定ステップと、

前記推定ステップで推定されたビット数に応じて前記符号化データを 2値算術符号化して出力するか否かを決定する符号化データ決定ステップと、

前記符号化データ決定ステップで 2値算術符号化して出力すると決定された符号化データに対応する前記コンテキストを更新し、前記符号化データ決定ステップで 2 値算術符号化して出力しないと決定された符号化データに対応する前記コンテキストを更新しなレ、コンテキスト更新ステップとを備え、

前記推定ステップで、 2値算術符号化への入力シンボルに対する算術符号化出力ビット数の最大値を前記ビット数とする

ことを特徴とする映像符号化方法。

[2] 推定ステップで、算術符号化出力ビット数の最大値を、劣勢シンボル出現確率の最小値を利用した 1シンボル単位の計算によって求める

ことを特徴とする請求項 1記載の映像符号化方法。

[3] 推定ステップで、算術符号化出力ビット数の最大値を、劣勢シンボルが連続して発生したときの劣勢シンボル出現確率の総積の最小値を利用した複数シンボル単位の計算によって求める

ことを特徴とする請求項 1記載の映像符号化方法。

[4] 推定ステップで、算術符号化出力ビット数の最大値を、劣勢シンボル出現確率の最小値を利用した 1シンボル単位の計算、および、劣勢シンボルが連続して発生したときの劣勢シンボル出現確率の総積の最小値を利用した複数シンボル単位の計算によって求める

ことを特徴とする請求項 1記載の映像符号化方法。

[5] 画像ブロックを周波数領域に変換し量子化した変換量子化値を計算する変換量子化ステップと、

画像ブロックを非エントロピー符号化したデータを出力する非エントロピー符号化ステツプとを備え、

符号化データ決定ステップで、推定されたビット数が所定値を越える場合に、 PCM モードヘッダを、出力する符号化データとして決定し、

前記非エントロピー符号化ステップで、 2値算術符号化ステップで前記 PCMモードヘッダが算術符号化されて出力された後に、前記変換量子化値を再構築して得られる画像ブロックまたは変換量子化を適用する前の元の画像ブロックの画像を非ェント口ピー符号化した PCMデータを出力する

ことを特徴とする請求項 1から請求項 4のうちのいずれか 1項に記載の映像符号化方法。

[6] 画像ブロックの符号化データを 2進列のシンボルに変換する 2進列変換部と、

2進列の各シンボルをコンテキストに応じて算術符号化する 2値算術符号化部と、画像ブロックに対する符号化データが 2値算術符号化されるときに必要なビット数を推定する推定部と、

前記推定部が推定したビット数に応じて前記符号化データを 2値算術符号化して出力するか否かを決定する符号化データ決定部と、

前記符号化データ決定部が 2値算術符号化して出力すると決定した符号化データに対応する前記コンテキストを更新し、前記符号化データ決定部が 2値算術符号化して出力しないと決定した符号化データに対応する前記コンテキストを更新しないコンテキスト更新部とを備え、

前記推定部は、 2値算術符号化への入力シンボルに対する算術符号化出力ビット数の最大値を前記ビット数とする

ことを特徴とする映像符号化装置。

[7] 推定部は、算術符号化出力ビット数の最大値を、劣勢シンボル出現確率の最小値を利用した 1シンボル単位の計算によって求める

ことを特徴とする請求項 6記載の映像符号化装置。

[8] 推定部は、算術符号化出力ビット数の最大値を、劣勢シンボルが連続して発生したときの劣勢シンボル出現確率の総積の最小値を利用した複数シンボル単位の計算によって求める

ことを特徴とする請求項 6記載の映像符号化装置。

[9] 推定部は、算術符号化出力ビット数の最大値を、劣勢シンボル出現確率の最小値を利用した 1シンボル単位の計算、および、劣勢シンボルが連続して発生したときの劣勢シンボル出現確率の総積の最小値を利用した複数シンボル単位の計算によつて求める

ことを特徴とする請求項 6記載の映像符号化装置。

[10] 画像ブロックを周波数領域に変換し量子化した変換量子化値を計算する変換量子化部と、

画像ブロックを非エントロピー符号化したデータを出力する非エントロピー符号化部とを備え、

符号化データ決定部は、推定されたビット数が所定値を越える場合に、 PCMモードヘッダを、出力する符号化データとして決定し、

前記非エントロピー符号化部は、 2値算術符号化部が前記 PCMモードヘッダを算術符号化して出力した後に、前記変換量子化値を再構築して得られる画像ブロックまたは変換量子化を適用する前の元の画像ブロックの画像を非エントロピー符号化した PCMデータを出力する

ことを特徴とする請求項 6から請求項 9のうちのいずれか 1項に記載の映像符号化装置。

[11] コンピュータに、

画像ブロックの符号化データを 2進列のシンボルに変換する 2進列変換処理と、 2進列の各シンボルをコンテキストに応じて算術符号化する 2値算術符号化処理と画像ブロックに対する符号化データが 2値算術符号化されるときに必要なビット数を推定する推定処理と、

前記推定処理で推定されたビット数に応じて前記符号化データを 2値算術符号化して出力するか否かを決定する符号化データ決定処理と、前記符号化データ決定処理で 2値算術符号化して出力すると決定された符号化データに対応する前記コンテキストを更新し、前記符号化データ決定処理で 2値算術符号化して出力しないと決定された符号化データに対応する前記コンテキストを更新しな!/、コンテキスト更新処理とを実行させ、

前記推定処理で、 2値算術符号化への入力シンボルに対する算術符号化出力ビット数の最大値を前記ビット数とする処理を実行させる

ことを特徴とする映像符号化プログラム。

[12] コンピュータに、

推定処理で、算術符号化出力ビット数の最大値を、劣勢シンボル出現確率の最小値を利用した 1シンボル単位の計算によって求める処理を実行させる

ことを特徴とする請求項 11記載の映像符号化プログラム。

[13] コンピュータに、

推定処理で、算術符号化出力ビット数の最大値を、劣勢シンボルが連続して発生したときの劣勢シンボル出現確率の総積の最小値を利用した複数シンボル単位の計算によって求める処理を実行させる

ことを特徴とする請求項 11記載の映像符号化プログラム。

[14] コンピュータに、

推定処理で、算術符号化出力ビット数の最大値を、劣勢シンボル出現確率の最小値を利用した 1シンボル単位の計算、および、劣勢シンボルが連続して発生したときの劣勢シンボル出現確率の総積の最小値を利用した複数シンボル単位の計算によつて求める処理を実行させる

ことを特徴とする請求項 11記載の映像符号化プログラム。

[15] コンピュータに、

画像ブロックを周波数領域に変換し量子化した変換量子化値を計算する変換量子化処理と、

画像ブロックを非エントロピー符号化したデータを出力する非エントロピー符号化処理とを実行させ、

符号化データ決定処理で、推定されたビット数が所定値を越える場合に、 PCMモードヘッダを、出力する符号化データとして決定し、

前記非エントロピー符号化処理で、 2値算術符号化処理で前記 PCMモードヘッダが算術符号化されて出力された後に、前記変換量子化値を再構築して得られる画像ブロックまたは変換量子化を適用する前の元の画像ブロックの画像を非エントロピー符号化した PCMデータを出力する処理を実行させる

ことを特徴とする請求項 11から請求項 14のうちのいずれか 1項に記載の映像符号化プログラム。