WO2003092301A1

WO2003092301A1 - Coding device and method, decoding device and method, recording medium, and program

Info

Publication number: WO2003092301A1
Application number: PCT/JP2003/005081
Authority: WO
Inventors: Kazushi Sato; Teruhiko Suzuki; Osamu Sunohara; Yoichi Yagasaki
Original assignee: Sony Corporation
Priority date: 2002-04-26
Filing date: 2003-04-22
Publication date: 2003-11-06
Also published as: US20120288010A1; US8649442B2; JP2003319391A; CN1650636B; US8325820B2; US20120294354A1; US20130107967A1; US7778331B2; US8571116B2; CN101800898B; KR20090130302A; US20130010874A1; US20130010862A1; CN1650636A; US20130107945A1; US20090225862A1; US8654862B2; US20090225861A1; US20140153649A1; CN101800897B

Description

明細書

符号化装置および方法、復号装置および方法、記録媒体、並びにプログラム技術分野

本発明は、符号化装置および方法、復号装置および方法、記録媒体、並びにプログラムに関し、例えば、画像信号を従来よりも高い圧縮率で符号化し、伝送または蓄積する場合に用いて好適な符号化装置おょぴ方法、復号装置および方法、記録媒体、並びにプログラムに関する。背景技術

近年、画像をディジタル信号として取り扱い、当該ディジタル信号を効率よく伝送、蓄積することを目的として、画像情報特有の冗長性を利用して、離散コサイン変換等の直交変換と動き補償により圧縮する MPEG (Moving Picture Expert

Group) 等の方式に準拠した装置が、放送局などの情報配信、および一般家庭における情報受信の双方において普及しつつある。

特に、 MPEG 2 (IS0/IEC 13818-2)圧縮方式は、汎用性がある画像圧縮方式として定義された規格であり、飛び越し走査画像および順次走査画像の双方、並びに標準解像度画像および高精細画像を網羅する標準であって、例えば DVD (Digital Versatile Disk)規格に代表されるように、プロフェッショナル用途おょぴコンシユーマー用途の広範なアプリケーションに現在広く用いられている。

MPEG 2圧縮方式を用いることにより、例えば、 7 2 0 X 4 8 0画素を持つ標準解像度の飛び越し走査画像に対しては⁴乃至 8 Mbps、 1 9 2 0 X 1 0 8 8画素を持つ高解像度の飛び越し走査画像に対しては 1 8乃至 2 2 Mbpsの符号量（ビットレート）を割り当てることで、高い圧縮率と良好な画質の実現が可能である。ところで、 MPEG 2は、主として放送用に適合する高画質符号化を対象としていたが、より高い圧縮率の符号化方式には対応していなかつたので、より高い圧縮率の符号化方式として、 MPEG 4符号化方式の標準化が行われた。画像符号化方式に関しては、 1 9 9 8年 1 2月に ISO/IEC 14496-2としてその規格が国際標準に承認された。

さらに、近年、テレビ会議用の画像符号化を当初の目的として、国際電気連合の電気通信標準化部門である ITU-T (International Telecommunication Union 一 Telecommunication Standardization Sector)による H. 2 6 L (ITU-T Q6/16 VCEG) と称される標準の規格化が進められている。

H. 2 6 Lは、 MPEG 2や MPEG 4などの従来の符号化方式に比較して、符号化処理、およぴ復号処理により多くの演算量が必要となるが、より高い符号化効率が実現されることが知られている。

またさらに、現在、 MPEG 4の活動の一環として ITU - Tと共同で、 H . 2 6 Lに基づいた、 H. 2 6 Lではサポートされない機能を取り入れた、より高い符号化効率を実現する符号化技術の標準化が、 Joint Model of Enhanced- Compression Video Codingとして進められている。

ここで、離散コサイン変換または力ルーネン■ レーべ変換等の直交変換と動き補償とを利用した従来の画像情報符号化装置について、図 1を参照して説明する。図 1は、従来の画像情報符号化装置の構成の一例を示している。

当該画像情報符号化装置において、アナログ信号である入力画像信号は、 A/ D変換部 1によってディジタル信号に変換された後、画面並べ替えバッファ 2に供給される。画面並べ替えバッファ 2は、 A/D変換部 1からの画像情報を、当該画像情報符号化装置が出力する画像圧縮情報の GOP (Group of Pictures)構造に応じて、フレームの並べ替えを行う。

まず、イントラ（画像内）符号化が行われる画像について説明する。画面並び替えバッファ 2において、イントラ符号化が行われる画像については、その画像情報が加算器 3を介して直交変換部 4に供給される。

直交変換部 4では、画像情報に対して直交変換（離散コサイン変換、または力ルーネン ' レーべ変換等）が施され、得られた変換係数が量子化部 5に供給される。量子化部 5では、蓄積バッファ 7に蓄積された変換係数のデータ量に基づくレート制御部 8からの制御に従い、直交変換部 4から供給された変換係数に対して量子化処理が施こされる。

可逆符号化部 6では、量子化部 5から供給された量子化された変換係数や量子化スケール等から符号化モードが決定され、決定された符号化モードに対して可逆符号化（可変長符号化、または算術符号化等）が施こされ、画像符号化単位のヘッダ部に挿入される情報が形成される。また、符号化された符号化モードは、蓄積バッファ 7に供給されて蓄積される。蓄積バッファ 7に蓄積された、符号化された符号化モードは、画像圧縮情報として後段に出力される。

また、可逆符号化部 6では、量子化された変換係数に対して可逆符号化が施され、符号化された変換係数が蓄積バッファ 7に蓄積させる。蓄積バッファ 7に蓄積された、符号化された変換係数も、画像圧縮情報として後段に出力される。逆量子化部 9では、量子化部 5によつて量子化された変換係数が逆量子化される。逆直交変換部 1 0では、逆量子化された変換係数に対して逆直交変換処理が施されて復号画像情報が生成される。生成された復号画像情報は、フレームメモリ 1 1に蓄積される。

次に、インター（画像間）符号化が行われる画像について説明する。画面並び替えバッファ 2において、インター符号化が行われる画像については、その画像情報が加算器 3および動き予測■捕償部 1 2に供給される。

動き予測 ·補償部 1 2では、画面並び替えバッファ 2からのインター符号化が行われる画像に対応する、参照するための画像情報がフレームメモリ 1 1から読み出され、動き予測，補償処理を施して参照画像情報が生成され、加算器 3に供給される。また、動き予測 ·補償部 1 2で動き予測 '補償処理の際に得られた動きベクトル情報は、可逆符号化部 6に供給される。

加算器 3では、動き予測 .補償部 1 2からの参照画像情報が、画面並ぴ替えバッファ 2からのインター符号化が行われる画像の画像情報との差分信号に変換される。

インター符号化が行われる画像を処理する場合、直交変換部 4では、差分信号に対して直交変換が施され、得られる変換係数が量子化部 5に供給される。量子化部 5では、レート制御部 8からの制御に従い、直交変換部 4から供給された変換係数に対して量子化処理を施される。

可逆符号化部 6では、量子化部 5によつて量子化された変換係数および量子化スケール、並びに動き予測■補償部 1 2から供給された動きべクトル情報等に基づいて符号化モードが決定され、決定された符号化モードに対して可逆符号化が施され、画像符号化単位のヘッダ部に挿入される情報が生成される。符号化された符号化モードは蓄積バッファ 7に蓄積される。蓄積バッファ 7に蓄積された符号化された符号化モードは、画像圧縮情報として出力される。

また、可逆符号化部 6では、動き予測 ·補償部 1 2からの動きべクトル情報に対して可逆符号化処理が施され、画像符号化単位のへッダ部に挿入される情報が生成される。

なお、ィンター符号化が行われる画像を処理する場合における逆量子化部 9以降の処理については、イントラ符号化を施される画像を処理する場合と同様であるので、その説明を省略する。

次に、図 1に示した従来の画像情報符号化装置が出力する画像圧縮情報を入力とし、画像信号を復元する従来の画像情報復号装置について、図 2を参照して説明する。図 2は、従来の画像情報復号装置の構成の一例を示している。

当該画像情報復号装置において、入力された画像圧縮情報は、蓄積バッファ 2 1に一時的に格納された後、可逆複号化部 2 2に転送される。可逆復号化部 2 2 は、予め定められている画像圧縮情報のフォーマットに基づき、画像圧縮情報に対して可逆復号（可変長復号、または算術復号等）を施し、ヘッダ部に格納された符号化モード情報を取得して逆量子化部 2 3に供給する。また同様に、可逆復号化部 2 2は、量子化されている変換係数を取得して逆量子化部 2 3に供給する。さらに、可逆復号化部 2 2は、復号するフレームがインター符号化されたものである場合には、画像圧縮情報のヘッダに格納された動きべクトル情報についても復号し、その情報を動き予測■補償部 2 8に供給する。逆量子化部 2 3は、可逆復号化部 2 2から供給された量子化されている変換係数を逆量子化し、得られる変換係数を逆直交変換部 2 4に供給する。逆直交変換部 2 4は、予め定められている画像圧縮情報のフォーマットに基づき、変換係数に対して逆直交変換（逆離散コサイン変換、または逆力ルーネン' レーべ変換等）を施す。

ここで、対象となるフレームがイントラ符号化されたものである場合には、逆直交変換が施された画像情報は、加算器 2 5を介して画面並べ替えバッファ 2 6 に格納され、 D /A変換部 2 7によってアナログ信号に変換されて後段に出力される。逆直交変換が施された画像情報は、フレームメモリ 2 9にも格納される。また、対象となるフレームがインター符号化されたものである場合には、動き予測 '補償部 2 8では、可逆復号化部 2 2からの動きべクトル情報とフレームメモリ 2 9に格納された画像情報とに基づいて参照画像が生成され、加算器 2 5に供給される。加算器 2 5では、動き予測 '補償部 2 8からの参照画像と逆直交変換部 2 5の出力とが合成されて画像情報が生成される。なお、その他の処理については、イントラ符号化されたフレームと同様であるため、説明を省略する。ところで、 H . 2 6 Lにおいては、可逆符号化方式として、可変長符号化の一種である UVLC (Universal Variable Length Code)と、算術符号化の一種である CABAC (Context-based adaptive binary arithmetic coding)の 2種類力 ^λ疋' されており、ユーザは可逆符号化方式に UVLCまたは CABACの一方を選択して適用することが可能である。可逆符号化方式が UVLCであるか CABACであるかを示す情報は、画像圧縮情報中において、 RTP レイヤの RTP Parameter Set Packetに含まれる、 Entropy Codingと称されるフィールドにおいて指定される。

ここで、 CABACが属する算術符号化について説明する。算術符号化においては、任意のメッセージ（複数のアルファベット記号から構成される）は半開区間 0 . 0 ≤ X < 1 . 0上の 1点として表され、この点の座標から符号が生成される。まず、アルファベットを構成する記号の出現確率を元に、半開区間 0 . Ο ^ χ < 1 . 0を、各記号に対応するサブ区間に分割する。図 3は、記号 s i乃至 s ₇の発生確率と、サブ区間の分割の一例を示している。算術符号化においては、図 3に示すように、各記号の累積出現確率を元にサブ区間の上限と下限が決定される。記号 3 _; ( i = 1 , 2， · · ·， 7) に対するサブ区間の下限は、記号 s のサブ区間の上限であり、記号 s iに対応するサブ区間の上限は、そのサブ区間の下限に記号 s iの出現確率を加えた値である。

いま、メッセージとして、（s ₂ s _{l S 3} s ₆ s ₇) が入力されたものとする。ただし、記号 s ₇は、メッセージの終了を表す終端記号であり、終端記号が現れた時点でメッセージが終了するものとする。算術符号化法は、メッセージ（s ₂ s s 3 s ₆ s ₇) に対し、図 4に示すように、メッセージを構成する各記号に対応するサブ区間の計算を実行する。すなわち、図 3に割り当てられた区間を、次の記号の累積出現確率に応じて分割する。最終的に得られるサブ区間が、そのメッセージを表す値の含まれる区間となる。したがって、この区間内の値であれば一意にメッセージの復元を行うことができる。ただし、符号化の効率を考慮して、その半開区間内で 2のべき乗表現が可能な数によってメッセ一ジを表すようにする _c すなわち、この例では、次式（1) を考慮すると、次式（2) が半開区間 0. 2 1 1 64≤ x < 0. 2 1 1 7に含まれるメッセージを表す値となる。

2— ¹ = 0. 5

2- ² = 0. 2 5

2— ³ = 0, 1 2 5

22——⁴⁴ == 00. 0 6 2 5

2一⁵ - = 0 0 3 1 2 5

2一⁶ = 0 0 1 5 6 2 5

2一 7 = 0 00 7 8 1 2 5

2— ⁸ = 0 00 3 9 0 6 2 5

22—一 ⁹⁹ ==00. 00 1 9 5 3 1 2 5

2一^{1 0} = 0 00 0 9 7 6 5 6 2 5

2一^{1 1} = 0 00 04 8 8 2 8 1 2 5 2— ¹²= 0. 000244 1406 25

• · · · (1) 2— ³+ 2_⁴+ 2^_6+ 2一⁷ + 2— u+ 2一¹² = 0. 2 1 1 6699 2 1 87 5

• ■ ■ (2) したがって、メッセージ（ s ₂ S i S ₃ s ₆ s ₇) に対応する符号の符号長は、 2 -¹乃至 2— ¹²までを表現できるように 1 2ビットであればよく、メッセージ（s ₂ s！ s 3 s ₆ s ₇) は、（00 1 10 1 10001 1) に符号化される。

次に、 H. 26 Lで定義されている CABACについて説明する。なお、 CABACの詳糸田につヽては、文献 I 'Video Compression Using Context-Based Adaptive Arithmetic Coding", Marpe et al， ICIOlj (以下、文献 1と記述する）に開示されている。 CABACは、同じく H. 26 Lで定義されている UVLCと比較して、以下の 3つの特徴を有している。

第 1の特徴は、符号化されるそれぞれの記号に対して適切なコンテキストモデルを用い、それぞれ独立した確率モデルに基づいた算術符号化を行うことで、シンポル間の冗長性を排除できることである。

第 2の特徴は、算術符号化において、それぞれの記号に対して非整数値の符号量（ビット）を割り当てることが可能であり、エントロピに近い符号化効率を得ることが可能であることである。

第 3の特徴は、例えば動きベクトルの統計データは、ビットレートゃシーケンスのみならず、空間、時間的に異なるものであって一定ではないが、適応型符号化を行うことにより、これらの変化に追従した符号化が可能となることである。図 5は、 CABACを適用した CABAC符号化器の一般的な構成を示している。当該 CABAC 符号化器において、コンテキストモデル化部 3 1は、画像圧縮情報における任意のシンタクス要素に関して、まず、過去の履歴に応じて、シンタクス要素のシンポル（記号）を適切なコンテキストモデルに変換する。このようなモデル化をコンテキストモデル化と称する。画像圧縮情報中のそれぞれのシンタクス要素に対するコンテキストモデルについては後述する。

2値化部 3 2は、 2値化されていないシンボルを 2値化する。適応 2値算術符号化部 3 3では、 2値化されたシンポルに対して、確率推定部 3 4によって確率推定がなされ、符号化エンジン 3 5によって確率推定に基づく適応算術符号化が施される。適応算術符号化処理が行われた後、関連するモデルの更新が行われるため、それぞれのモデルは実際の画像圧縮情報の統計に応じた符号化処理を行うことが可能となる。

ここで、画像圧縮情報中のシンタクス要素である MB一 type (MB_type)、動きべクトル情報（MVD)、および参照フレームパラメータ（Ref_frame)を算術符号化するコンテキストモデルについて説明する。

B_type のコンテキストモデル生成について、イントラフレームとィンターフレームに分けて説明する。

イントラフレームにおいて、図 6に示すようにマクロブロック A， B , Cが配置されている場合、マクロプロック Cの MB— typeに対応するコンテキストモデル ctx— mb_type一 intra (C)は、次式（3 ) によって定義される。なお、イントラフレームにおいて、マクロブロックのモードは、 Intra 4 X 4、または Intra l 6 X l 6である。

ctx_mb_type_intra (C) = A + B · · · ( 3 ) ただし、式（3 ) において、 Aは、マクロブロック Aが Intra 4 X 4である場合には 0であり、 Intra 1 6 X 1 6である場合には 1である。同様に、 Bは、マク口プロック Bが Intra 4 X 4である場合には 0であり、 Intra 1 6 X 1 6である場合には 1である。したがって、コンテキストモデル ctx— mb— type— intra (C)は、 0 , 1， 2のいずれかの値となる。

インターフレームにおいて、図 6に示すようにマクロブロック A， B， Cが酉己置されている場合、マクロブロック Cの MB_typeに対応するコンテキストモデル ctx— mb— type_inter (C)は、当該インターフレームが Pピクチャである場合、次式 1

9

(4) によって定義される。また、当該インターフレームが Bピクチャである場合、次式（5) によって定義される。

ctx_rab_type_inter (C) = ( (A==Skip) ?0： l) + ( (B==Skip) ?0： l) ■ · - (4) ctx_mb_type_inter (C) = ( (A==Direct) ?0： l) + ( (B==Direct) ?0： l) ■ ■ - (5) ただし、式（4) において、演算子（（A==Skip)?0:l)は、マクロプロック Aが S kipモードである場合には 0を示し、マクロプロック Aが Skipモードではない場合には 1を示すものとする。同様に、演算子（(B==Skip)?0:l)は、マクロプロック Bが Skipモードである場合には 0を示し、マクロプロック Bが Skipモードではない場合には 1を示すものとする。

また、式（5) において、演算子（（A==Direct)?0:l)は、マクロプロックが！） irectモードである場合には 0を示し、マクロプロック Aが Directモードではない場合には 1を示すものとする。演算子（（B==Direct)?0:l)は、マクロブロック B が Directモードである場合には 0を示し、マクロブロック Bが Directモードではない場合には 1を示すものとする。

したがって、ィンターフレーム ( Pピクチャ) におけるマクロブロック Cの MB一 typeに対応するコンテキストモデル ctx_mb_type— inter (C)は、 Pピクチャである場合と Bピクチャである場合に対して、それぞれ 3種類の値となることになる。

次に、動きべクトル情報（MVD)のコンテキストモデル生成について説明する。画像圧縮情報に含まれる、注目するマクロブロックに対応する動きベクトル情報は、隣接するマクロプロックに対応する動きべクトルとの予測誤差として符号化されている。いま、図 7に示すように配置されているマクロブロック A， B, Cのうち、注目するマクロブロック Cに対する評価関数 e _k (C) を次式（6) によって定義する。ここで、 k = 0は水平成分、 k= lは垂直成分を示す。

e _k (C) = [ m v d _k (A) | + | mv d_k (B) ,| · · · (6) ただし、式（6) において、；mv d_k (A), m v d _k (B) は、それぞれ、マクロブロック Cに瞵接するマクロブロック A， Bに対する動きべクトル予測誤差である。

なお、式（6) に関し、マクロプロック Cが画枠の左端に存在しており、マク口プロック A, Bの一方が存在しないような場合、動きベクトル予測誤差 mv d _k (A) または mv d_k (B) に関する情報を得ることができないので、式（6) の右辺における対応する項は無視する。このように定義された e _k (C) に対応するコンテキストモデル ctx— mvd(C，k)は、次式（7— 1 ) 乃至（7— 3) のように定義される。

ctx_mvd(C, k) = 0 e _k (C) < 3 - - ■ ( 7 - 1 ) ctx_ravd(C, k) = 1 32 < e _k (C) - - · (7 - 2) ctx_mvd(C, k) = 2 3≤ e _k (C) ≤ 32 - - · ( 7 - 3 ) 動きべクトル情報（MVD)のコンテキストモデル生成は、図 8に示すように行われる。すなわち、マクロブロック Cに対する動きベクトル予測誤差 mv d _k (C) は、絶対値 I mv d_k (C) I と符号に分離される。絶対値 I mv d_k (C) | は 2値化される。 2値化された絶対値 i m v d_k (C) Iの第 1の b i n (最左端の値）は、上述したコンテキストモデル ctx_mvd(C,k)を用いて符号化する。第 2 の b i n (左端から 2番目の値）はコンテキストモデル 3を用いて符号化する。同様に、第 3, 4の b i nは、それぞれコンテキストモデル 4, 5を用いて符号化する。第 5以降の b i nは、コンテキストモデル 6を用いて符号化する。 mv d _k (C) の符号は、コンテキストモデル 7を用いて符号化する。このように、運動ベクトル情報 (MVD)は、 8種類のコンテキストモデルを用いて符号化される。次に、参照フレームパラメータ (Ref_frame)を符号化するコンテキストモデルについて説明する。

ィンターフレームに対して、 2枚以上の参照フレームが用いられる場合、インターフレームの各マクロプロックに対して参照フレームに関する情報が設定される。図 6に示すように配置されたマクロブロック A， B, Cにおいて、マクロブロック A， Bそれぞれに対する参照フレームパラメータを A, Bとした場合、マクロブロック Cに対するコンテキストモデル ctx_ref_frame(C)は、次式（8) によって定義される。

ctx—ref— frame (C) = ( (A==0) ?0：1)+ 2 ( (B==0) ?0:1) · · ■ (8) ただし、式（8) において、演算子（(A==0)?0:1)は、マクロブロック Aの参照フレームパラメータ 0である場合には 0を示し、マクロプロック Aの参照フレームパラメータが 0ではない場合には 1を示すものとする。同様に、演算子（(Β==0)?

0:1)は、マクロプロック Βの参照フレームパラメータ 0である場合には 0を示し、マクロブロック Βの参照フレームパラメータが 0ではない場合には 1を示すものとする。

参照フレームパラメータ（Ref— frame)を符号化するコンテキストモデルは、式 (8) によって 4種類が定義される。さらに、第 2の b i nに対するコンテキストモデル、および第 3以降の b i nに対するコンテキストモデルが定義される。次に、 H. 26 Lの画像圧縮情報中に含まれるテキスチャ情報に関するシンタタス要素であるコードプロックパターン（CBP)、イントラ予測モード（IPRED)、おょぴ（RUN,LEVEL) 情報を算出符号化するコンテキストモデルについて説明する。始めに、コードブロックパターンに関するコンテキストモデルについて説明する。 Intra 1 6 X 1 6マクロプロック以外のコードプロックパターンに関する取り扱いは以下のように定義されている。

すなわち、輝度信号に関しては、 Intral 6 X 16マクロブロックに含まれる、 4つの 8 X 8ブロックそれぞれに対して 1ビットずつ、合計 4ビットの CBPビットが含まれている。図 6に示すようにマクロブロック A， B, Cが配置されている場合、マクロブロック Cの輝度信号に対応するコンテキストモデル ctx— cbp—luma(C)は、次式（9) によって定義される。

ctx_cbp_luma (C) = A + 2 B · · · ( 9 ) ただし、式（9) において、 Aは、マクロプロック Aの輝度信号の CBPビットであり、 Bは、マクロプロック Bの輝度信号の CBPビットである。 ■

CBP フィールドの残り 2ビットは色差信号に関するものである。マクロブロック Cの色差信号に対応するコンテキストモデル ci:x_cbp— chroma— sig(C)は、次式 (1 0) によって定義される。

ctx_cbp_chroma_sig(C) = A+ 2 B ■ · ' (1 0) ただし、式（1 0) において、 Aは、マクロプロック Aの色差信号の CBPビットであり、 Bは、マクロブロック Bの色差信号の CBPビットである。

ここで、マクロブロック Cの色差信号に対応するコンテキストモデル ctx_cbp_ chroraa_sig(C)が 0ではない場合、すなわち、色差信号の A C成分が存在する場合、次式（1 1 ) によって定義されるマクロブロック Cの色差信号の AC成分に対応するコンテキストモデル ctx—cbp一 chroma— ac (C)が符号化される必要がある。

ctx_cbp_chroma_ac (C) = A + 2 B 上 ) ただし、式（1 1 ) において、 Aは、マクロプロック Aに対応する cbp_chroma_a c decisionであり、 Bは、マクロブロック Bに対応する cbp一 ckroma_ac decisio nである。

式 (9) 乃至 ( 1 1) によって定義されるコンテキストモデルは、イントラマクロプロックとインターマクロブ口ックのそれぞれに対して別個に定義されるので、 24 (= 2 X 3 X 4) 種類のコンテキストモデルが定義されることになる。さらに、 Intra 1 6 X 1 6マクロプロックに対しては、 2値化された AC decision に対して 1種類のコンテキストモデルが定義され、色差信号の各成分それぞれに対して 1種のコンテキストモデルが定義されている。

次に、イントラ予測モード（IPRED)に関するコンテキストモデルについて説明する。ここで、 H. 2 6 Lにおいて定義されている 6種類（ラベル 0乃至 5) のィントラ予測モードについて、図 9およぴ図 1 0を参照して説明する。図 9は、マクロプロックを分割した 4 X 4ブロックに存在する画素 a乃至 pと、隣接する各 4 X 4プロック内に存在する画素 A乃至 Iを示している。図 1 0のラベル 1乃至 5は、それぞれラベル 1乃至 5のイントラ予測モードの方向を示している。ラベル 0のイントラ予測モードは、 D C予測モード（DC Prediction)である。

ラベル 0のイントラ予測モードにおいては、画素 a乃至 pが次式（1 2) に従つて予測される。画素 a乃至 p = (A+B + C + D + E+ F + G + H) 〃8 ■ . . ( 1 2) ただし、式（1 2) 乃至次式（1 5) において、 A乃至 Iは、それぞれ画素 A乃至 Iを示しており、記号" ΙΓは、除算した結果を丸め込む演算を意味している。なお、ラベル 0のイントラ予測モードにおいて、 8画素 A乃至 Hのうち、 4画素（例えば、画素 A乃至 D) が画枠内に存在しない場合、式（1 2) は用いられず、残りの 4画素（いまの場合、画素 E乃至 H) の平均値が、画素 a乃至 pの予測値とされる。また、 8画素 A乃至 Hの全てが画枠内に存在しない場合も、式（1 2) は用いられず、所定の値（例えば、 1 2 8) が画素 a乃至 pの予測値とされる。

ラベル 1のィン卜ラ予測モードは、 Vertical/Diagonal Predictionと称される。ラベル 1のイントラ予測モードは、 4画素 A乃至 Dが画枠内に存在する場合にだけ用いられる。この場合、画素 a乃至！のそれぞれが、次式（1 3— 1 ) 乃至（1 3 - 6) に従って予測される。

a (A+B) //2 ( 1 3 - 1) e B ( 1 3 2) 画素 b i = (B + C) 112 ( 1 3 3) 画素 f m= C ( 1 3 4) c， j = (C + D) 〃2 ( 1 3 5) 画素 d， g， h， k， 1， n o , p

=D • • • ( 1 3— 6) ラベル 2のイントラ予測モードは、 Vertical Prediction と称される。ラベル 2のイントラ予測モードは、 4画素 A乃至 Dが画枠内に存在する場合にだけ用いられる。この場合、例えば、画素 a， e , i , mの予測値として画素 Aが用いられ、画素 b , f , j , ηの予測値として画素 Βが用いられる。

ラベル 3のイントラ予測モードは、 Diagonal Prediction と称される。ラベル 1のイントラ予測モードは、 9画素 A乃至 Iが画枠内に存在する場合にだけ用いられる。この場合、画素 a乃至 pのそれぞれが、次式（1 4— 1) 乃至（1 3— TJP03/05081

14

7) に従って予測される。

画素 m = (H+ 2 G+F) //4 - - - ( 1 4- 1) n = (G+ 2 F + E) 〃4 - ' ■ ■ ( 1 4一 2) 画素 e j , o = (F+ 2 E+ I ) //4 - - - ( 1 4- 3) 画素 f , k， p = (E+ 2 I +A) 〃4 · ■ - (1 4 - 4) 画素 b g， l = ( I + 2 A+B) //4 - - - ( 1 4- 5) c h = (A+ 2 B + C) //4 · · - (1 4- 6) 画素 d = (B + 2 C + D) //4 - - - (1 4- 7) ラベル 4のイントラ予測モードは、 Horizontal Prediction と称される。ラベル 4のィントラ予測モードは、 4画素 E乃至 Hが画枠内に存在する場合にだけ用いられる。この場合、例えば、画素 a， b , c , dの予測値として画素 Eが用いられ、画素 e， f ， g， hの予測値として画素 Fが用いられる。

ラベル 5のイントラ予測モードは、 Horizontal/Diagonal Predictionと称される。ラベル 5のイントラ予測モードは、 4画素 E乃至 Hが画枠内に存在する場合にだけ用いられる。この場合、画素 a乃至！のそれぞれが、次式（1 5— 1 ) 乃至（1 5— 6) に従って予測される。

画素 a = (E + F) //2 ( 1 5 - 1 ) 画素 b = F ( 1 5 2) 画素 c， e = (F + G) 1/2 ( 1 5 3) 画素 f ， d =G ( 1 5 4) 画素 i， g = (G + H) //2 ( 1 5 5) 画素 h , j , k , 1 , m, η ο , ρ

=Η - ' - ( 1 5 - 6) ラベル 0乃至 5のイントラ予測モードに対しては、それぞれ 2つのコンテキストモデルが定義されている。すなわち、 1つは、それぞれのモードに対する第 1 の b i nであり、もう 1つは、それぞれのモードに対する第 2の b i nである。これらに加え、 Intra 1 6 X 1 6モードの 2ビットに対して 1つずつコンテキスト 03 05081

15 モデルが定義されている。したがって、イントラ予測モードに対しては、合計 1 4のコンテキストモデルが定義されている。

次に、（RUN, LEVEL)に関するコンテキストモデルについて説明する。

H . 2 6 Lにおいては、 2次元離散コサイン変換係数を 1次元に並べ替えるスキャン方式として、図 1 1 A , Bに示す 2種類の方法が定義されている。図 1 1 Aに示すシングルスキャン方式は、イントラマクロプロックに対する輝度信号であって、かつ、量子化パラメータ Q Pが 2 4よりも小さい場合以外に用いられる方式である。図 1 1 Bに示すダブルスキヤン方式は、シングルスキャン方式が用いられない場合に用いられる。

ィンターマクロプロックおよび量子化パラメータ Q Pが 2 4以上であるイントラマクロブロックでは、平均して 4 X 4マクロプロックに対する非零係数は 1つであり、 1ビットの EOB (End Of Block) 信号で十分であるが、量子化パラメ一タ Q Pが 2 4よりも小さいイントラマクロブロックの輝度信号に関しては、 2つ以上の非零係数が存在するため、 1ビットの E0B信号では不十分である。このため、図 1 1 Bに示すダブルスキャン方式が用いられる。

(RUN, LEVEL)に対するコンテキストモデルは、図 1 2に示すように、上述したスキャン方式の区別、 D C /A Cブロックタイプの区別、輝度信号/色差信号の区別、ィントラマクロプロック Zィンターマクロプロックの区別に応じて 9種類が定義されている。

LEVEL情報は符号と絶対値に分離される。図 1 2に示した対応する Ctx_run— le vel に応じて、 4つのコンテキストモデルが定義される。すなわち、第 1のコンテキストモデルは符号に対してのものであり、第 2のコンテキストモデルは第 1 の b i nに対してのものであり、第 2のコンテキストモデルは第 2の b i nに対してのものであり、第 4のコンテキストモデルはそれ以降の b i nに対して定義されたものである。

LEVELが 0ではない場合（E0Bでない場合）には、以下に述べる RUNが符号化される。 RUNに対してであるが、図 1 2に示された、それぞれの Ctx_run— levelに T/JP03/05081

16 対して、第 1の b i nと第 2以降の b i nについて、それぞれ 2つずつのコンテキストモデルが定義されている。

H . 2 6 Lの画像圧縮情報において、マクロプロックレベルで設定され得る、量子化に関するパラメータ Dquant に対するコンテキストモデルについて説明する。

パラメータ Dquantは、マクロブロックに対するコードプロックパターンが、非零の直交変換係数を含む場合、またはマクロブロックが 1 6 X 1 6 Intra Coded である場合に設定される。パラメータ Dquantは、一 1 6乃至 1 6の値を取り得る。マクロプロックに対する量子化パラメータ QUANT_{n e w}は、画像圧縮情報中のパラメータ Dquantを用いた次式（1 6 ) によって算出される。

QUANT_{n e w} = modulo _{3 2} (QUANT _{0 L d} +Dquant+ 3 2 ) · ■ · ( 1 6 ) ただし、式（1 6 ) において、 QUANT。_{l d}は、直前の符号化または復号に用いられた量子化パラメータである。

図 6に示すように配置されたマクロブロック Cのパラメータ Dquant に対する第 1のコンテキストモデル ctx_dquant (C)は、次式（ 1 7 )のように定義される。 ctx_dquant (C) = (A！ = 0 ) · ■ · ( 1 7 ) ただし、式（1 7 ) において、 Aは、マクロブロック Aのパラメータ Dquantの値を示している。第 1の b i nに対しては第 2のコンテキストモデルが、第 2以降の b i ηに対しては第 2のコンテキストモデルが定義されている。

以上説明した様々なコンテキストモデルに対し、入力となるシンボルが 2値化されていない場合には、そのシンボルを入力前に 2値化する必要がある。 MB_ty_Pe 以外のシンタクス要素は、図 1 3に示す対応関係によって 2値化される。

Pピクチャに対して 1 0種類定義されている MB_ty_Peは、図 1 4 Aに示す対応関係によって 2値化される。また、 Bピクチャに対して 1 7種類定義されている MB— typeは、図 1 4 Bに示す対応関係によって 2値化される。

以上説明した様々なコンテキストモデルに対応するレジスタは、事前に計算された値によって予め初期化されており、各シンボルを符号化する際、一連のコンテキストモデルに対する b i nの発生頻度が逐次更新され、次のシンボルの符号化を行う際の判定に用いられる。

しかしながら、与えられたコンテキストモデルに対する発生頻度が予め定められた値を超えた場合には、頻度カウンタは縮小処理が行われる。このように周期的にスケーリング処理を行うことで、動的なシンポルの発生に対応することを容易なものとしている。

H . 2 6 Lにおいて、 2値化されたシンボルの算術符号化方式については、現在のところ、文献 I Arithmeticし oding for Data Compression ， (Witten et al. Comm. of the ACM, 30 (6) , 1987, pp520-541)」（以下、文献 2と記述する）に開示されている方法が適用されている。

ところで、 MPEG 2においては、入力となる画像信号が飛び越し走査フォーマツトであった場合、マクロブロックレベルでフィールド Zフレーム適応型符号化処理が可能とされている。

現在、 H . 2 6 Lにはそのような仕様は定義されていないが、文献 ^Interlace Coding Tools for H. 26L Video Coding (L. Wang et al.， VCEG—037, Dec. 2001) "\ (以下、文献 3と記述する）には、 H . 2 6 Lの仕様を、マクロブロックレベルでフィールドフレーム適応型符号化処理を可能とするように拡張することが提案されている。

文献 3に提案されている、マクロプロックレベルでフィールド Zフレーム適応型符号化処理について説明する。

現在の H . 2 6 Lにおいては、マクロブロックにおける動き予測 '補償の単位として、図 1 5に示すような 7種類のモード（mode l乃至 7 )が定義されている。文献 3においては、画像圧縮情報のマクロプロックに対応するシンタクスとして、図 1 6に示すように、 Runと MB— typeの間に Frame/Field Flagを持つことが提案されている。 Frame/Field Flagの値が 0である場合、当該マクロブロックはフレームベースの符号化が施されることを示し、 Frame/Fi eld Flagの値が 1である場合、フィールドベースの符号化が施されることを示している。 Frame/Field Flagの値が 1である場合（すなわち、フィールドベースの符号化が施される場合）、マクロプロック内の画素は、図 1 7に示すように行単位で画素の並べ替えが行われる。

Frame/Field Flagの値が 1である場合、マクロブロックにおける動き予測 ·補償の単位として、図 1 5の mode 3乃至 7に相当する、図 1 8に示す 5種類のモード（mode l a乃至 5 a ) が定義されている。 '

例えば、図 1 8の mode 2 aにおいて、マクロブロックを 4分割した 8 X 8ブロック 0乃至 3のうち、ブロック 0 , 1は同一のフィールドパリティに属し、また、ブロック 2， 3は同一のフィールドパリティに属する。また例えば、図 1 8の mode 3 aにおいて、マクロブロックを 8分割した 4 X 8プロック 0乃至 8のうち、ブロック 0乃至 3は同一のフィールドパリティに属し、また、ブロック 4乃至 7は同一のフィーノレドパリティに属する。

Frame/Field Flagの値が 1である場合のィントラ予測モードについて説明する。例えば、図 9に示した 4 X 4ブロックに位置する画素 a乃至 pは、 Frame/Field Flagの値が 1である場合においても、隣接する 4 X 4プロックに位置する画素 A 乃至 Iを用いてイントラ予測が行われるが、画素 a乃至！）、および画素 A乃至 I が全て同一フィールドパリティに属していることが特徴である。

画素 A乃至 I力 S、画素 a乃至 pと同一のマクロブロックに属している場合について、図 1 9を参照して説明する。マクロブロックを 1 6分割した 4 X 4プロック 7に存在する画素 a乃至 pは、隣接するプロック 2， 3， 6の端に存在する画素 A乃至 Iを用いてィントラ予測が行われる。

画素 A乃至 I 1 画素 a乃至 pとは異なるマクロブロックに属する場合について、図 2 O Aおよび図 2 0 Bを参照して説明する。

図 2 O Aは、処理対象としているマクロブ口ックの左側のマクロプロックと、上側のマクロブ口ックに対する Frame/Field Flagの値がそれぞれ 1である場合を示している。この場合、処理対象としているマクロブロックを 1 6分割した 4 X 4ブロック Cに存在する画素のィントラ予測は、左側のマクロプロックを 1 6分 0508!

19 割したブ 4 X 4プロック Aに存在する画素と、上側のマクロブロックを 1 6分割した 4 X 4ブロック Bに存在する画素を用いて行われる。 4 X 4ブロック C' に存在する画素のイントラ予測は、 4 X 4ブロック A' に存在する画素と、 4 X 4 ブロック B ' に存在する画素を用いて行われる。

図 2 0 Bは、処理対象としているマクロブロックに対する Frame/Field Flag の値が 1であり、その左側および上側のマクロブ口ックに対する Frame/Field Flagの値がそれぞれ 0である場合を示している。この場合、処理対象としているマクロブロックを 1 6分割した 4 X 4プロック Cに存在する画素のィントラ予測は、左側のマクロプロックを 1 6分割した 4 X 4プロック Aに存在する画素と、上側のマクロプロックを 1 6分割した 4 X 4プロック Bに存在する画素を用いて行われる。 4 X 4ブロック C ' に存在する画素のイントラ予測は、 4 X 4ブロック A' に存在する画素と、 4 X 4ブロック Bに存在する画素を用いて行われる。次に、色差信号のイントラ予測について、図 2 1を参照して説明する。 Frame/ Field Flagの値が 1である場合、色差信号のィントラ予測モードは 1種類だけが定義されている。

図 2 1において、 A乃至 Dは、それぞれ色差信号の 4 X 4ブロックを示す。ブロック A， Bは、第 1フィールドに属し、プロック C， Dは、第 2フィールドに属する。 s。乃至 s ₂は、プロック A乃至 Dに隣接するブロックのうち、第 1フィ一ルドパリティに属するプロックに存在する色差信号の合計値である。 s ₃至 s ₅ は、ブロック A乃至 Dに隣接するブロックのうち、第 2フィールドパリティに属するブロックに存在する色差信号の合計値である。

ブロック A乃至 Dにそれぞれ対応する予測値 A乃至 Dは、 s。乃至 s ₅が全て画枠内に存在する場合、次式（1 8 ) に従って予測される。

A= ( s 0 + s 2 + 4) 8

B = ( s！ + 2) /4

C= ( s 3 + s ₅+ 4) /8

D= ( s , + 2) /4 · · ■ ( 1 8) ただし、 S。乃至 S ₅のうち、 S。， _{S l}， S 3 , S ₄だけが画枠内に存在する場合、ブロック A乃至 Dにそれぞれ対応する予測値 A乃至 Dは、次式（1 9) に従つて予測される。

A= ( s。+ 2) /4

B= ( s _x+ 2) /4

C= ( s 3 + 2) /4

D- (s ₄+ 2) /4 ■ ■ · (1 9) さらに、 s。乃至 s ₅のうち、 s ₂ s ₅だけが画枠内に存在する場合、ブロック A 乃至 Dにそれぞれ対応する予測値は、次式（20) に従って予測される。

A= ( s ₂+ 2) Z4

B= ( s ₂+ 2) Z4

C= ( s ₅+ 2) /4

D- ( s ₅+ 2) /4 ■ · · (20) 図 22は、上述したようにイントラ予測された後の色差信号の残差成分を符号化する方法を示している。すなわち、それぞれの 4 X 4ブロックに対して直交変換処理を施した後、第 1フィールドおよび第 2フィールドの直流成分を用いて図示すような 2 X 2プロックが生成され、再び直交変換処理が施される。

次に、 Frame/Field Flagの値が 1である場合の動き予測 ·補償処理について説明する。 Frame/Field Flag の値が 1である場合、動き予測補償モードとしては、インター 1 6 X 1 6モード、インター 8 X 16モード、インター 8 X 8モード、インター 4 X 8モード、ィンター 4 X 4モードの 6種類のモードが存在する。例えば、インター 1 6 X 1 6モードは、インター 8 X 1 6モードにおける第 1 フィールドに対する動きべクトル情報、第 2フィールドに対する動きべクトル情報、および参照フレームが同等であるモードである。

これら 6種類の動き予測捕償モードに対して、それぞれ Code— Number 0乃至 5 が割り当てられている。

現在の H. 26 Lにおいては、図 23に示すような、複数の参照フレームを設けることができるマルチプルフレーム予測が規定されている。. 現在のフレームべースの H. 2 6 Lの規格において、参照フレームに関する情報は、マクロプロックレベルで定義されており、直前に符号化されたフレームに対し、 Code_Number 0が割り当てられており、その 1乃至 5回前に符号化されたフレームに対し、それぞれ Code_Number 1乃至 5が割り当てられている。

これに対して、フィールドベース符号化を行う場合、直前に符号化されたフレ一ムの第 1フイー^^ドに対して Code一 Number 0が割り当てられ、当該フレームの第 2フィールドに対して Code_Number lが割り当てられる。その 1回前に符号化されたフレームの第 1フィールドに対して Code一 Number 2が割り当てられ、当該フレームの第 2フィールドに対して Code— Number 3が割り当てられる。さらに 1 回前に符号化されたフレームの第 1フィールドに対して Code_Number 4が割り当てられ、第 2フィールドに対して Code_Number 5が割り当てられる。

また、フィールドベース符号化が行われるマク口プロックに対しては、第 1フィールドに対する参照フィールドと、第 2フィールドに対する参照フィールドが別個に規定される。

次に、 Frame/Field Flagの値が 1である場合の動きべクトル情報予測方式について説明するが、その前に、現在の H . 2 6 Lにおいて規定されているメディアン予測について、図 2 4を参照して説明する。図 2 4に示す 1 6 X 1 6マクロブ口ック Eに対応する 1 6 X 1 6、 8 X 8、または 4 X 4動きべクトル情報は、隣接するマクロブロック A乃至 Cの動きべクトル情報のメディアンを用いて予測される。

ただし、マク口プロック A乃至 Cのうち、画枠内に存在しないものについては、対応する動きべクトル情報の値は 0であるとしてメディアンを算出する。例えば、マクロプロック D， B , Cが画枠内に存在しない場合、予測値としてマクロプロック Aに対応する動きベクトル情報を用いる。また、マクロブロック Cが画枠内に存在しない場合、その代わりにマクロブロック Dの動きべクトル情報を用いて

-算出する。 T/JP03/05081

22 なお、マクロプロック A乃至 Dの参照フレームは必ずしも同一でなくてもよい。次に、マクロプロックのプロックサイズが、 8 X 1 6、 1 6 X 8、 8 X 4、または 4 X 8である場合について、図 2 5 A乃至図 2 5 Dを参照して説明する。なお、注目するマクロブロック Eとこれに隣接するマクロブロック A乃至 Dは、図 2 4に示すように配置されていると仮定する。

図 2 5 Aは、マクロプロック E l， E 2のブロックサイズが 8 X 1 6である場合を示している。左側のマクロブロック E 1に関しては、左に隣接するマクロブロック Aがマクロブロック E 1と同じフレームを参照している場合、マクロプロック Aの動きべクトル情報が予測値として用いられる。左に隣接するマクロブロック Aがマクロブロック E 1 と異なるフレームを参照している場合、上述したメディアン予測が適用される。

右側のマクロブロック E 2に関しては、右上に隣接するマクロプロック Cがマクロブロック E 2と同じフレームを参照している場合、マクロブロック Cの動きベタトル情報が予測値として用いられる。右上に隣接するマクロプロック Cがマクロブロック E 2と異なるフレームを参照している場合、上述したメディアン予測が適用される。

図 2 5 Bは、マクロブロック E l , E 2のブロックサイズが 1 6 X 8である場合を示している。上側のマクロブロック E 1に関しては、上に隣接するマクロブロック Bがマクロブロック E 1と同じフレームを参照している場合、マクロプロック Bの動きベクトル情報が予測値として用いられる。上に隣接するマクロプロック Bがマクロブロック E 1 と異なるフレームを参照している場合、上述したメディアン予測が適用される。

下側のマクロプロック E 2に関しては、左に隣接するマクロプロック Aがマクロブ口ック E 2と同じフレームを参照している場合、マクロブロック Aの動きべタトル情報が予測値として用いられる。左に隣接するマクロブロック Aがマクロプロック E 2と異なるフレームを参照している場合、上述したメディアン予測が適用される。図 2 5 Cは、マクロブロック E 1乃至 E 8のプロックサイズが 8 X 4である場合を示している。左側のマクロブロック E 1乃至 E 4に対しては、上述したメデイアン予測が適用され、右側のマクロプロック E 5乃至 E 8に対しては、左側のマクロプロック E 1乃至 E 4の動きべクトル情報が予測値として用いられる。図 2 5 Dは、マクロプロック E 1乃至 E 8のブロックサイズが 4 X 8である場合を示している。上側のマクロプロック E 1乃至 E 4に対しては、上述したメデイアン予測が適用され、下側のマクロブロック E 5乃至 E 8に対しては、上側のマクロプロック E 1乃至 E 4の動きべクトル情報が予測値として用いられる。

Frame/Field Flagの値が 1である場合においても、動きべクトル情報の水平方向成分の予測に関しては、上述の方式に準ずる。しかしながら、垂直方向成分に関しては、フィ一ルドベースのブロックとフレームベースのブロックが混在するため、以下のような処理を行う。なお、注目するマクロプロック Eとこれに隣接するマクロプロック A乃至 Dは、図 2 4に示すように配置されているとする。マクロブロック Eをフレームベース符号化する場合であって、隣接するマクロブロック A乃至 Dのいずれかがフィールドベース符号化されている場合、第 1フィールドに対する動きべクトル情報の垂直方向成分と、第 2フィールドに対する動きべクトル情報の垂直方向成分の平均値の 2倍を算出し、これをフレームベースの動きべクトル情報に相当するものとして予測処理を行う。

マクロプロック Eをフィールドベース符号化する場合であって、隣接するプロック A乃至 Dのいずれかがフレームベース符号化されている場合、動きベクトル情報の垂直方向成分の値を 2で割った商を、フィールドベースの動きべクトルに相当するものとして予測処理を行う。

ところで、文献 3においては、マクロブロックレベルのフィールド Zフレーム符号化に必要なシンタクス要素が付加されており、また、動きベクトル情報等のシンタクス要素に関しても、そのセマンティクスが変更されているが、これに対して、新たなコンテキストモデルの導入、および既存のコンテキストモデルの変更がなされておらず、文献 3に提案された情報のみでは、 CABAC方式を用いたマクロブロックレベルのフィールド/フレーム符号化を行うことが不可能である。

CABAC方式は、 UVLC方式に比較して符号化処理により多くの演算量を要するものの、より高い符号化効率を実現することが知られており、入力となる画像情報が飛び越し走査フォーマツトであった場合にも、 CABAC方式を用いたマクロブロックレベルのフィールド Zフレーム符号化を実現できることが望ましい。発明の開示

本発明はこのような状況に鑑みてなされたものであり、入力となる画像情報が飛び越し走査フォーマツトであった場合にも、 CABAC方式を用いたマクロプロックレベルのフィールド Zフレーム符号化を可能とすることを目的とする。

本発明の符号化装置は、マクロブロックレベルの符号化処理をフィールドベースとするかフレームベースとするかを示す frame/field flagに対応するコンテキストモデノレと、フレームベースの符号化処理を行うためのシンタクス要素に対応するコンテキストモデルと、フィールドベースで符号化処理を行うためのシンタクス要素に対応するコンテキストモデルとを用いて可逆符号化処理を実行する可逆符号化手段を含むことを特徴とする。

前記フィールドベースで符号化処理を行うためのシンタタス要素に対するコンテキストモデルには、 Iピクチャに対する MB_type、 P / Bピクチャに対する MB— type、動きべクトル情報、参照フィールドパラメータ、およびイントラ予測モードに対応するコンテキストモデルのうち、少なくとも 1つを含むようにすることができる。

本発明の符号化方法は、マクロブロックレベルの符号化処理をフィールドベースとするかフレームベースとするかを示す frame/field flagに対応するコンテキストモデノレと、フレームベースの符号化処理を行うためのシンタクス要素に対応するコンテキストモデルと、フィールドベースで符号化処理を行うためのシンタクス要素に対応するコンテキストモデルとを用いて可逆符号化処理を実行する可逆符号化ステップを含むことを特徴とする。 05081

25 本発明の第 1の記録媒体のプログラムは、マクロプロックレベルの符号化処理をフィーノレドベースとするかフレームベースとするかを示す frameZfield flag に対応するコンテキストモデルと、フレームベースの符号化処理を行うためのシンタクス要素に対応するコンテキストモデルと、フィールドベースで符号化処理を行うためのシンタクス要素に対応するコンテキストモデルとを用いて可逆符号化処理を実行する可逆符号化ステップを含むことを特徴とする。

本発明の第 1のプログラムは、マクロブロックレベルの符号化処理をフィールドベースとするかフレームベースとするかを示す frame/field flagに対応するコンテキストモデ _/レと、フレームベースの符号化処理を行うためのシンタクス要素に対応するコンテキストモデルと、フィールドベースで符号化処理を行うためのシンタクス要素に対応するコンテキストモデルとを用いて可逆符号化処理を行う可逆符号化ステップをコンピュータに実行させることを特徴とする。

本発明の復号装置は、マクロブロックレベルの符号化処理をフィールドベースとするかフレームベースとするかを示す frame/field flagに対応するコンテキストモデルと、フレームべ一スの符号化処理を行うためのシンタクス要素に対応するコンテキストモデルと、フィ一ルドベースで符号化処理を行うためのシンタクス要素に対応するコンテキストモデルとを用いて可逆符号化されている画像圧縮情報を復号する復号手段を含むことを特徴とする。

本発明の復号方法は、マクロプロックレベルの符号化処理をフィールドベースとするかフレームベースとするかを示す frameZfield flagに対応するコンテキストモデルと、フレームベースの符号化処理を行うためのシンタクス要素に対応するコンテキストモデルと、フィールドベースで符号化処理を行うためのシンタクス要素に対応するコンテキストモデルとを用いて可逆符号化されている画像圧縮情報を復号する復号ステップを含むことを特徴とする。

本発明の第 2の記録媒体のプログラムは、マクロブロックレベルの符号化処理をフィールドベースとするかフレームベースとするかを示す frameZfield flag に対応するコンテキストモデルと、フレームベースの符号化処理を行うためのシンタクス要素に対応するコンテキストモデルと、フィールドベースで符号化処理を行うためのシンタタス要素に対応するコンテキストモデルとを用いて可逆符号化されている画像圧縮情報を復号する復号ステップを含むことを特徴とする。本発明の第 2のプログラムは、マク口プロックレベルの符号化処理をフィールドベースとするかフレームベースとするかを示す frame/field flagに対応するコンテキストモデルと、フレームベースの符号化処理を行うためのシンタクス要素に対応するコンテキストモデルと、フィールドベースで符号化処理を行うためのシンタクス要素に対応するコンテキストモデルとを用いて可逆符号化されている画像圧縮情報を復号する復号ステップをコンピュータに実行させることを特徴とする。

本発明の符号化装置および方法、並びに第 1のプログラムにおいては、マクロブロックレべノレの符号化処理をフィールドベースとするかフレームベースとするかを示す frameZfield flagに対応するコンテキストモデルと、フレームベースの符号化処理を行うためのシンタクス要素に対応するコンテキストモデルと、フィールドベースで符号化処理を行うためのシンタクス要素に対応するコンテキストモデルとを用いて可逆符号化処理が行われる。

本発明の復号装置おょぴ方法、並びに第 2のプログラムにおいては、マクロプロックレべノレの符号化処理をフィーノレドベースとするかフレームベースとするかを示す frame/field flagに対応するコンテキストモデルと、フレームベースの符号化処理を行うためのシンタクス要素に対応するコンテキストモデルと、フィールドベースで符号化処理を行うためのシンタクス要素に対応するコンテキストモデルとを用いて可逆符号化されている画像圧縮情報が復号される。

符号化装置および復号装置は、互いに独立した装置であってもよいし、信号処理装置の符号化処理およぴ復号処理を行うプロックであってもよい。図面の簡単な説明

図 1は、直交変換処理と動き補償処理によって画像圧縮を実現する従来の画像情報符号化装置の構成を示すプロック図である。

図 2は、図 1の画像情報符号化装置に対応する画像情報復号装置の構成を示すプロック図である。

図 3は、算術符号化処理における、記号の発生確率と割り当てられるサブ区間の対応関係の一例を示した図である。

図 4は、算術符号化処理の一例を示す図である。

図 5は、 CABAC符号化器の一般的な構成を示すプロック図である。

図 6は、 MB— typeのコンテキストモデルを説明するための図である。

図 7は、動きべクトル情報 MVDのコンテキストモデルを説明するための図である。

図 8は、コンテキストモデルに基づいて、動きベクトル情報 MVDを符号化する処理を説明するための図である。

図 9は、 H. 2 6 Lで定義されているイントラ予測モードを説明するための図である。

図 1 0は、ラベル 1乃至 5のイントラ予測モードの方向を説明するための図である。

図 1 1 Aは、 H. 2 6 Lで定義されているシングルスキャン方式を説明するための図である。

図 1 1 Bは、 H. 2 6 Lで定義されているダブルスキャン方式を説明するための図である。

図 1 2は、 H. 2 6 Lで定義されている、（RUN， LEVEL)に対応するコンテキストモデルを示す図である。

図 1 3は、 H . 2 6 Lにおける、 MB— type 以外のシンタクス要素を 2値化する処理を説明するための図である。

図 1 4 Aは、 H . 2 6 Lにおける、 Pピクチャの MB_typeを 2値化する処理を説明するための図である。

図 1 4 Bは、 H . 2 6 Lにおける、 Bピクチャの MB_typeを 2値化する処理を説明するための図である。

図 1 5は、 H . 2 6 Lにおいて定義されている、マクロプロックにおける動き予測■補償の単位として 7種類のモードを示す図である。

図 1 6は、マクロブロックレベルのフィールド/フレーム適応符号化がえるように拡張された画像圧縮情報のシンタクスを示す図である。

図 1 7は、マクロプロックをフィールドベースで符号化する場合における、マクロプロックの画素の並べ替えを説明するための図である。

図 1 8は、マクロブロックをフィールドベースで符号化する場合における、動き予測■補償の単位として定義されている 5種類のモードを示す図である。図 1 9は、マクロプロックをフィールドベースで符号化する場合における、マクロプロック内でィントラ予測を行う動作原理を説明するための図である。図 2 O Aは、マクロブロックをフィールドベースで符号化する場合における、マクロブロックをまたがってイントラ予測を行う動作原理を説明するための図である。

図 2 0 Bは、マクロブロックをフィールドベースで符号化する場合における、マクロプロックをまたがってイントラ予測を行う動作原理を説明するための図である。

図 2 1は、マクロブロックをフィールドベースで符号化する場合における、色差信号に対するイントラ予測を行う動作原理を説明するための図である。

図 2 2は、マクロブロックをフィールドベースで符号化する場合における、色差信号の残差成分を符号化する動作原理を説明するための図である。

図 2 3は、 H . 2 6 Lにおいて規定されているマルチプルフレーム予測を説明するための図である。

図 2 4は、マクロブロックをフィールドベースで符号化する場合における、動きべクトル情報の予測方式を説明するための図である。

図 2 5 Aは、 H. 2 6 Lで定められている各予測モードにおける動きベクトル情報の予測値を生成する処理を説明するための図である。図 2 5 Bは、 H . 2 6 Lで定められている各予測モードにおける動きベクトル情報の予測値を生成する処理を説明するための図である。

図 2 5 Cは、 H . 2 6 Lで定められている各予測モードにおける動きベクトル情報の予測値を生成する処理を説明するための図である。

図 2 5 Dは、 H . 2 6 Lで定められている各予測モードにおける動きベクトル情報の予測値を生成する処理を説明するための図である。

図 2 6は、本発明の一実施の形態である画像情報符号化装置の構成例を示すブ口ック図である。

図 2 7は、図 2 6の算術符号化部 5 8の構成例を示すプロック図である。

図 2 8 Aは、マクロブロックをフィールドベースで符号化する場合における、 Pピクチャに属するマク口プロックの MB_typeを 2値化するたためのテープ/レを示す図である。

図 2 8 Bは、マクロプロックをフィールドベースで符号化する場合における、 Bピクチャに属するマク口プロックの MB_typeを 2値化するたためのテープノレを示す図である。

図 2 9は、図 2 6の画像情報符号化装置の対応する、本発明の一実施の形態である画像情報復号装置の構成例を示すブロック図である。発明を実施するための最良の形態

以下、本発明を適用した画像情報符号化装置について、図 2 6を参照して説明する。当該画像情報符号化装置は、入力となる画像情報が飛び越し走査フォーマットであった場合にも、 CABAC方式を用いて符号化処理を施すことができるものである。

当該画像情報符号化装置において、 A/D変換部 5 1は、アナログ信号である入力画像信号をディジタル信号に変換して、画面並べ替えバッファ 5 2に出力する。画面並べ替えバッファ 5 2は、 A/D変換部 5 1からの入力画像情報を、当該画像情報符号化装置の出力となる画像圧縮情報の GOP構造に応じて並び替えて、 P T/JP03/05081

30 加算器 5 4に出力する。

フィールド/フレーム判定部 5 3は、処理対象の画像のマクロブロックを、フィールドベースで符号化する場合と、フレームベースで符号化する場合との符号化効率が高い方を判定し、対応する Frame/Field Flagを生成して、フィールド/ フレーム変換部 5 5および算術符号化部 5 8に出力する。

加算器 5 4は、処理対象のマクロプロックがインター符号化される場合、フィ一ルド/フレーム判定部 5 3を介する入力画像と、動き予測■補償部 6 4からの参照画像との差分画像を生成して、フィールドフレーム変換部 5 5および直交変換部 5 6に出力する。また、加算器 5 4は、処理対象のマクロプロックがイントラ符号化される場合、フィールド/フレーム判定部 5 3を介する入力画像をそのまま、フィールド/フレーム変換部 5 5および直交変換部 5 6に出力する。フィールド Zフレーム変換部 5 5は、処理対象のマクロブロックがフィールドベースで符号化される場合、加算器 5 4からの入力画像をフィールド構造に変換して直交変換部 5 6に出力する。直交変換部 5 6は、入力される画像情報に対して直交変換（離散コサイン変換、またはカルーネン ' レーべ変換等）を施し、得られる変換係数を量子化部 5 7に供給する。量子化部 5 7は、レート制御部 6 5 らの制御に従い、直交変換部 5 6から供給された変換係数に対して量子化処理を施す。

算術符号化部 5 8は、量子化部 5 7および動き予測 '補償部 6 4から入力される各シンタクス要素、並びにフィールド Zフレーム判定部 5 3からの Frame/Field Flagを CABAC方式に基づいて算術符号化し、蓄積バッファ 5 9に供給して蓄積させる。蓄積バッファ 5 9は、蓄積した画像圧縮情報を後段に出力する。

逆量子化部 6 0は、量子化された直交変換係数を逆量子化して、逆直交変換部 6 1に出力する。逆直交変換部 6 1は、逆量子化された変換係数に対して逆直交変換処理を施して復号画像情報を生成し、フレームメモリ 6 ²に供給して蓄積させる。フィールド/フレーム変換部 6 3は、処理対象とするマクロブロックをフ細 81

31 ィールドベースで符号化する場合、フレームメモリ 6 2に蓄積された復号画像情報をフィールド構造に変換して、動き予測 ·補償部 6 4に出力する。

動き予測 '補償部 6 4は、動き予測処理により、最適な予測モード情報および動きべクトル情報を生成して算術符号化部 5 8部に出力するとともに、予測画像を生成して加算器 5 4に出力する。レート制御部 6 5は、蓄積バッファ 5 9に蓄積されたデータ量に基づき、量子化部 5 7の動作のフィードバック制御を行う。制御部 6 6は、記録媒体 6 7に記録されている制御用プログラムに従い、当該画像情報符号化装置の各部を制御する。

次に、算術符号化部 5 8の動作原理について、図 2 7を参照して説明する。図 2 7は、算術符号化部 5 8の構成例を示している。算術符号化部 5 8においては、入力される画像圧縮情報のシンタクス要素のうち、まず、図 1 6に示した frame Zfield flag力フレーム Zフィールドフラグコンテタストモデル 9 1によって符号化される。

そして、処理対象となるマクロプロックがフレームベース符号化される場合、現在 H . 2 6 Lの標準で定められているフレームベースのコンテキストモデル 9 2が適用される。なお、 2値化されていない値を持つシンタタス要素に関しては、 2値化部 9 3によって 2値化が施された後、算術符号化が行われる。

一方、処理対象となるマクロブロックがフィールド符号化される場合、以下のシンタクス要素に関しては、フィールドベースのコンテキストモデル 9 4が適用される。なお、 2値化されていない値を持つシンタクス要素に関しては、 2値化部 9 5によって 2値化が施された後、算術符号化が行われる。すなわち、第 1のシンタクス要素は、 Iピクチャに対する MB_typeであり、第 2のシンタクス要素は P / Bピクチャに対する MB— typeであり、第 3のシンタクス要素は動きべクトル情報であり、第 4のシンタクス要素は参照フィールドパラメータであり、第 5 のシンタクスはイントラ予測モードである。

以下、図 6に示すようにマクロブロック A， B， Cが配置されているとする。 frame/field flag に関するコンテキストモデルについて説明する。マクロブロックじの fratneZfield flagに関するコンテキストモデル ctx— fifr_f lag(C)は、次式（21) によって定義される。

ctx一 fifr— flag(C) = a + 2 b - - " (2 1) ただし、式（2 1) において、 a, bは、それぞれマクロプロック A， Bの frame /field flagのィ直である。

次に、 Iピクチャに対する MB_typeに関するコンテキストモデルについて説明する。 fratneZfield flag が 1である場合、 Iピクチャに含まれるマクロプロック Cの MB— typeに対応するコンテキストモデノレ ctx一 mb一 type— intra— field (C)は、式（3) と同様に次式（22) によって定義される。

ctx一 mb一 type— intra一 field (C) =A+B ■ ■ - (22) ただし、式（22) における A, Bは、式（3) におけるものと同様である。なお、隣接するマクロブロック A， Bは、フィールドベース符号化されていても、フレームベース符号化されていてもかまわない。

次に、 P/Bピクチャに対する MB_typeに関するコンテキストモデルについて説明する。マクロブロック Cが Pピクチヤに含まれる場合、マクロブロック Cの MB— typeに対応するコンテキストモデル ctx— mb— type— inter— field (C)は、次式（ 2 3) によって定義される。また、 Bピクチャに含まれる場合、次式（24) によつて定義される。

ctx_mb_type_inter_field(C) = ((A==skip)?0:l) + 2 ((B二 =skip)?0: 1)

· · · ( 23 ) ctx— mb— type— inter一 field (C) = ( (A==Direct) ?0:1) + 2 ( (B==Direct) ?0:1)

■ · · (24) ただし、式（23) における演算子（(A==skip) ?0:1)，（(A==skip)?0:l)は、式 (4)におけるものと同様であり、式（24)における演算子（（A==Direct) ?0:1)， ((B-Direct)?0:l)は、式（5) におけるものと同様である。隣接するマクロプロック A, Bは、フィールドベース符号化されていても、フレームベース符号化されていてもかまわない。なお、 2値化されていない Pピクチャの MB_typeは、図 28 Aに示すテーブルによって 2値化される。また、 2値化されていない Bピクチャの MB_typeは、図 28 Bに示すテーブルによって 2値化される。

適応 2値算術符号化部 96では、 2値化されたシンボルに対して、確率推定部 97によって確率推定がなされ、符号化エンジン 98によって確率推定に基づく適応算術符号化が施される。適応算術符号化処理が行われた後、関連するモデルの更新が行われるため、それぞれのモデルは実際の画像圧縮情報の統計に応じた符号化処理を行うことが可能となる。

フレームベース符号化されるマクロブロックに対しては、 Pピクチャに属する場合、 10種類の MB_typeが定義されている。一方、フィールドベース符号化されるマクロプロックに対しては、 Pピクチャに属する場合、前記 1 6種類のうち、 1 6 X 1 6モード、および 8 X 16モードが定義されていない。すなわち、フィ一ルドベース符号化されるマクロブロックに対しては、 pピクチャに関して 8種類の MB— typeが定義されている。

フレームベース符号化されるマクロプロックに対しては、 Bピクチャに関して 1 8種類の MB_typeが定義されている。一方、フィールドベース符号化されるマクロブロックに対しては、 Bピクチャに属する場合、前記 1 8種類のうち、前方向 1 6 X 1 6モード、後方向 1 6 X 1 6モード、前方向 8 X 1 6モード、および後方向 8 X 1 6モードが定義されていない。すなわち、フィールドベース符号化されるマクロブロックに対しては、 Bピクチャに関して 14種類の MB_typeが定義されている。

次に、動きべクトル情報のコンテキストモデルについて説明する。 frameZfield flagの値が 1である場合、マクロプロック Cの動きべクトル情報に対応する第 1 乃至 3のコンテキストモデル ctx_mvd— field(C,k)は、次式（25— 1) 乃至（2 5 - 3 ) によって定義される。

ctx_mvd_f ield (C, k) = 0 e _k (C) < 3 - - - (25 - 1) ctx_mvd_field (C, k) = 1 3 2 < e _k (C) - - - (25 - 2) ctx— mvd—field (C,k)= 2 3≤ e _k (C) ≤ 3 2 · ' · (25— 3) ただし、式（2 5— 1) 乃至（2 5— 3) における評価関数 e _kは次式（26) のように定義されている。マクロプロック A， Bは同じパリティフィールドにある。

k (c) m V d _k (A) I + I m v d _k (B) (26) ここで、マクロプロック Aがフレームベース符号化されたものである場合、垂直方向成分の動きベクトル情報 mv d i (A) に関しては、次式（2 7) を用いて算出した m V d — _{f ; e} i _d (A) を式（26) に適用する。また、マクロブロック Bがフレームベース符号化されたものである場合においても同様である。

mv

d ₁__{f r ame} (A) /2 · ■ · (2 7) 反対に、マクロブロック Cをフレームベース符号化する場合であって、隣接ブロック Aがフィールドベース符号化されたものである場合、 mv d _k (A) の水平方向成分、垂直方向成分は、それぞれ次式（28— 1)， (28- 2) を用いて算出した m V d_k— _{f r ame} (A) を式（26) に適用する。

m V d ₀_f _{r ame} (A)

= (m v d ₀__{t o p} (A) +mv d。— _b。_{t t}。_m (A)) /2 · ■ - (28- 1) m v d !__{f r ame} (A)

=m v d _x__{t op} (A) +11^ 一 _b。_{t t}。_m (A) · ■ - (28 - 2) 次に、参照フィールドパラメータに関するコンテキストモデルについて説明する。 frarae/field flag の値が 1である場合、第 1フィールドに対応する第 1のコンテキストモデル ctx— ref— field_top(C)は、次式（29— 1) によって定義される。また、第 2フィールドに対応する第 1のコンテキストモデル ctx— ref_fiel d— bot(C)は、次式（29— 2) によって定義される。

ctx_ref_field_top(C) = a _t + 2 b _t - - - (29 - 1) ctx_ref_field_bot (C) = a _b + 2 b _b - - - (29 -2) ただし、式（29— 1)， (2 9 - 2) において、パラメータ a _tは、隣接するマクロブロック Aの第丄フィールドに関するものであり、パラメータ a _hは、隣 081

35 接するマクロブロック Aの第 2フィールドに関するものであり、パラメータ b _t は、隣接するマクロブロック Bの第 1フィールドに関するものであり、パラメ一タ b _bは、隣接するマクロブロック Bの第²フィールドに関するものであり、次式（30— 1)， (30- 2) のように定義されている。

aリ a _b , b " b _b

= 0 参照フィールドが最も直前に符号化されたものである場合

■ · - (30- 1) aい a _b, bい _b

= 1 上記以外の場合 · · ' （30— 2) 第 2以降の b i nに対応するコンテキストモデルに関しては、それぞれ、式（8) に示したコンテキストモデル ctx_ref_frame(C)と同様に定義される。ただし、符号化される Code_numberは、フレームに対するものではなく、フィールドに対して割り当てられたものである。

次に、ィントラ予測モードに関するコンテキストモデルについて説明する。 frame/field flag の値が 1である場合、マクロプロック Cに対応するイントラ予測モードに関するコンテキストモデル ctx— intra_pred— field(C)は、フレームモードのマク口プロックに対するコンテキストモデル ctx— intra— pred(C)と同様に定義される。なお、隣接するマクロブロック A， Bは、フィールドベース符号化されていても、フレームベース符号化されていてもかまわない。

以上説明したように、新たなコンテキストモデルを導入し、既存のコンテキストモデルを変更することにより、 CABAC方式を用いたフィールドノフレーム符号化を行うことが可能となる。

次に、図 29は、図 26の画像情報符号化装置に対応する画像情報復号装置の構成例を示している。

当該画像情報復号装置において、蓄積バッファ 10 1は、入力される画像圧縮情報を蓄積し、適宜、算術復号化部 1 02に出力する。算術復号化部 102は、 CABAC方式に基づいて符号化されている画像圧縮情報に算術複号化処理を施し、 JP03/05081

36 復号した fraraeZfield flagをフィールド Zフレーム変換部 1 0 5 , 1 1 0に出力し、量子化されている直交変換係数を逆量子化部 1 0 3に出力し、予測モード情報および動きべクトル情報を動き予測 ·補償部 1 1 1に出力する。

逆量子化部 1 0 3は、算術復号化部 1 0 2によって復号された、量子化されている直交変換係数を逆量子化する。逆直交変換部 1 0 4は、逆量子化された直交変換係数を逆直交変換する。フィールドダフレーム変換部 1 0 5は、処理対象のマクロプロックがフィールドベースで符号化されている場合、逆直交変換の結果得られた出力画像または差分画像をフレーム構造に変換する。

加算器 1 0 6は、処理対象のマクロブロックがィンターマクロブ口ックであつた場合、逆直交変換部 1 0 4からの差分画像と、動き予測 ·補償部 1 1 1からの参照画像を合成して出力画像を生成する。画面並べ替えバッファ 1 0 7は、入力された画像圧縮情報の G0P構造に応じて、出力画像を並べ替えて D /A変換部 1 0 8に出力する。 0 変換部1 0 8は、ディジタル信号である出力画像をアナログ信号に変換して後段に出力する。 '

フレームメモリ 1 0 9は、加算器 1 0 6が生成した、参照画像の元となる画像情報を格納する。フィールド/フレーム変換部 1 1 0は、処理対象のマクロプロックがフィールドベースで符号化されている場合、フレームメモリ 1 1 1に格納されている画像情報をフィールド構造に変換する。動き予測 ·補償部 1 1 1は、画像圧縮情報に含まれる、マクロプロックごとの予測モード情報および動きべクトル情報に基づき、フレームメモリに格納された画像情報を元にいて参照画像を生成し、加算部 1 0 6に出力する。

以上説明したように構成される画像情報復号装置によれば、図 2 6の画像情報符号化装置が出力する画像圧縮情報を復号し、元の画像情報を得ることができる。上述した一連の処理は、ハードウェアにより実行させることもできるが、ソフトウエアにより実行させることもできる。一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、専用のハードゥエァに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどに、例えば図 2 6の記録媒体 6 7力、らィンストールされる。

この記録媒体 6 7は、コンピュータとは別に、ユーザにプログラムを提供するために配布される、プログラムが記録されている磁気ディスク（フレキシブルデイスクを含む）、光ディスク ( CD-ROM (Compact Disc-Read Only Memory)、 DVD (Digital Versati le Disc)を含む）、光磁気ディスク (MD (Mini Disc)を含む）、もしくは半導体メモリなどよりなるパッケージメディアにより構成されるだけでなく、コンピュータに予め組み込まれた状態でユーザに提供される、プログラムが記録されている ROMやハードディスクなどで構成される。

なお、本明細書において、記録媒体に記録されるプログラムを記述するステツプは、記載された順序に従って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。産業上の利用可能性

以上のように、本発明によれば、入力となる画像情報が飛び越し走査フォーマットであった場合にも、 CABAC方式を用いたマクロプロックレベルのフィールド

Zフレーム符号化を実現することが可能となる。

また、本発明によれば、飛び越し走査フォーマットの画像情報が CABAC方式を用いてマクロブ口ックレベルでフィールド/フレーム符号化されている圧縮画像情報を復号して、飛び越し走査フォーマツトの画像情報を復元することが可能となる。

Claims

請求の範囲

1 . 飛び越し走査の画像情報を入力として、マクロブロックレベルで適応的にフィールドベースまたはフレームベースの符号化処理を実行し、前記符号化処理に含まれる可逆符号化処理に CABAC方式を採用した符号化装置において、前記マクロブロックレベルの前記符号化処理を前記フィールドベースとするか前記フレームベースとするかを示す frameZfield flagに対応するコンテキストモデルと、前記フレームベースの符号化処理を行うためのシンタクス要素に対応するコンテキストモデルと、前記フィールドベースで符号化処理を行うためのシンタクス要素に対応するコンテキストモデルとを用いて前記可逆符号化処理を実行する可逆符号化手段を

含むことを特徴とする符号化装置。

2 . 前記フィールドベースで符号化処理を行うためのシンタクス要素に対するコンテキストモデルには、 I ピクチャに対する MB_ ype、 P / Bピクチャに対する MB— type、動きベクトル情報、参照フィールドパラメータ、およびイントラ予測モードに対応するコンテキストモデルのうち、少なくとも 1つを含む

ことを特徴とする請求の範囲第 1項に記載の符号化装置。

3 . マクロブロックじの fraraeZfield flag に関するコンテキストモデノレ ctx— fifr— flag (C)は、前記マクロブロック Cに隣接するマクロプロック A， Bそれぞれの fratneZfield flagの値 a , bを用いて次式のように定義されている ctx_fifr_flag (C) = a + 2 b

ことを特徴とする請求の範囲第 1項に記載の符号化装置。

4 . Pピクチャに含まれるマクロプロック Cを前記フィールドベースで符号化する場合、前記マクロブロック Cの MB_typeに対応する第 1のコンテキストモデル ctx一 mb一 type_inter一 field (C)は、前記マクロブロック Cに隣接するマクロプロック A， Bそれぞれが Skipモードであるか否かに対応して 0または 1を示す演算子（A==Skip) ?0 : l) , ( (B==Skip) ?0 : l)を用いて次式のように定義されている ctx mb type— inter— field (C) = ( (A==skip) ?0 : 1) + 2 ( (B==skip) ?0 : 1) 39 ことを特徴とする請求の範囲第 1項に記載の符号化装置。

5. Pピクチャに含まれるマクロプロック Cを前記フィールドベースで符号化する場合、前記マクロブロック Cの MB— typeに対応する Code— Number 0乃至 7を、それぞれ、 0， 1 00, 10 1， 1 1000, 1 100 1, 1 10 10， 1 10 1 1または 1 1 100に 2値化する

ことを特徴とする請求の範囲第 4項に記載の符号化装置。

6. Bピクチャに含まれるマク口プロック Cを前記フィールドベースで符号化する場合、前記マクロブロック Cの MB— typeに対応する第 1のコンテキストモデル ctx—mb_type— inter— field (C)は、前記マクロブロック Cに隣接するマク口プロック A， Bそれぞれが Directモードであるか否かに対応して 0または 1を示す演算子（A==Direct)?0:l)，（（B==Direc"t) ?0: 1)を用いて次式のように定義されている ctx— mb— type— inter— field (C) = ( (A==Direct) ?0 : 1) + 2 ( (B==Direct) ?0： 1) ことを特徴とする請求の範囲第 1項に記載の符号化装置。

7. Bピクチャに含まれるマクロブロック Cを前記フィールドベースで符号化する場合、前記マクロブロック Cの MB一 typeに対応する Code— Number 0乃至 1 3 を、それぞれ、 0， 100， 10 1， 1 1 000， 1 1001 , 1 101 0， 1 10 1 1, 1 1 100, 1 1 1000, 1 1 1000 1, 1 1 100 1 0， 1 1 100 1 1 , 1 1 10 1 00, 1 1 10101または 1 1 10 1 1 0に 2値化する

ことを特徴とする請求の範囲第 6項に記載の符号化装置。

8. マクロブロック Cを前記フィールドベースで符号化する場合、前記マクロブロック Cの動きべクトル情報に対応する第 1乃至 3のコンテキストモデル ctx_mvd_field(C，k)は、前記マクロブロック Cに隣接するマクロプロック A, B それぞれの動きべクトル情報を用いて算出される評価関数 e _k (C) = I mv d_k (A) I + I mv d_k (B) | の値によって場合分けされた次式によって定義されている

ctx_mvd_field(C, k) = 0 e _k (C) < 3 ctx_ravd_field(C, k) = 1 3 2 < e _k (C)

ctx_mvd_field(C, k) = 2 3≤ e _k (C) ≤ 3 2

ことを特徴とする請求の範囲第 1項に記載の符号化装置。

9. 前記マクロプロック Cに隣接する前記マクロブロック A， Bは、前記マク口プロック Cと同じパリティフィールドに属する

ことを特徴とする請求の範囲第 8項に記載の符号化装置。

10. 前記マクロブロック Cを前記フィールドベースで符号化する場合であつて、かつ、前記マクロプロック Cに隣接する前記マクロブロック X (Xは Aまたは B) が前記フレームベースで符号化されている場合、次式のように、マクロブロック Xに対応する動きベクトル垂直成分 mv d — _{i r ame} (X) をフィールド符号化相当に換算して前記評価関数 e_k (C) を算出する

mv di— f i_ei_d (X) =m v d ₁___{ί r ame} (X / 2

ことを特徴とする請求の範囲第 8項に記載の符号化装置。

1 1. 前記マクロブロック Cを前記フィールドベースで符号化する場合、前記マクロブロック Cの前記動きべクトル情報の第 2および第 3の b i nに対しては、フレームベースのコンテキストモデル ctx_mvd (C，k) と同様のコンテキストモデ ■ ル ctx一 mvd— f ield (C, k) を用いる

ことを特徴とする請求の範囲第 8項に記載の符号化装置。

1 2. マクロブロック Cを前記フレームベースで符号化する場合、前記マクロプロック Cの動きべクトル情報に対応する第 1乃至 3のコンテキストモデル ctx_ravd(C, k)は、前記マクロブロック Cに隣接するマクロプロック A, Bそれぞれの動きベクトル情報を用いて算出される評価関数 e _k (C) = I mv d _k (A) I + I m v d _k (B) Iの値によって場合分けされた次式によって定義されている

ctx_mvd(C, k) = 0 e _k (C) く 3

ctx一 mvd (C， k) = 1 32く e _k ( C )

ctx一 mvd(C，k)= 2 3≤ e _k (C) ≤ 3 2 ことを特徴とする請求の範囲第 1項に記載の符号化装置。

1 3. 前記マクロブロック Cを前記フレームベースで符号化する場合であって、かつ、前記マクロブ口ック Cに隣接する前記マクロブ口ック X (Xは Aまたは B) が前記フィールドベースで符号化されている場合、次式のように、マクロブロック Xに対応する動きベクトル水平成分 mv d。― _{f i e l d} (X) および垂直成分 mv di _{i i e l d} (X) をフレーム符号化相当に換算して前記評価関数 e _k (C) を算出する

m V d ₀_f _{r ame} (A)

= (rav d₀j。p (A) +mv d₀一 _b。_{t t}。_m (A)) / 2

mv d ₁__{f r ame} (A)

= mv d i一 _t。_p (A) +mv di一 b。t t。m (^A)

ことを特徴とする請求の範囲第 1 2項に記載の符号化装置。

14. マクロブロック Cを前記フィールドベースで符号化する場合、前記マクロブ口ック Cの第 1のフィールドに対する参照フィールドに対応する第 1のコンテキストモデル ctx_ref_field一 top(C)、および前記マクロブロック Cの第 2のフィールドに対する参照フィールドに対応する第 1 のコンテキストモデル ctx_ref_field_bot (C)は、次式によつて定義され、

ctx一: ref一 field一 top (しノ = a _t + 2 b _t

ctx_ref_field_bot (C) = a _b + 2 b _b

隣接するマクロブロック Aの第 1のフィールドに関するパラメータ aい隣接する前記マクロブロック Aの第 2フィールドに関するパラメータ aい隣接するマクロブロック Bの第 1フィールドに関するパラメータ bいおよび前記隣接するマクロブロック Bの第 2フィールドに関するパラメータ b _bは、次式によって定義されている

参照フィールドが最も直前に符号化されたものである場合

a _t . ^a b， b _t , b _b = 0

参照フィールドが最も直前に符号化されたものではない場合 a _t > ^a b， b _t , b _b = 1

ことを特徴とする請求の範囲第 1項に記載の符号化装置。

1 5 . マクロプロック Cを前記フィールドベースで符号化する場合、前記マク口プロック Cの第 1およぴ第 2フィールドのそれぞれに対する第 2および第 3の b i nに関しては、 Code— Number が参照フレームでなく、参照フィールドを示していること以外は、フレームモードで符号化するマクロプロックに対するコンテキストモデノレ ctx—ref— frame (C)と同一である

ことを特徴とする請求の範囲第 1項に記載の符号化装置。

1 6 . マクロプロック Cを前記フィールドベースで符号化する場合、イントラ予測モードに対するコンテキストモデル ctx—intra_pred_field (C)は、前記フレームモードの前記マクロブ口ックに対するコンテキストモデ /レ ctx_intra_pred_field (C)と同様に定義されている

ことを特徴とする請求の範囲第 1項に記載の符号化装置。

1 7 . マクロブロック Cを前記フィールドベースで符号化する場合、イントラ予測モードに対するコンテキストモデル ctx_intra一 pred_field (C)は、前記マク口プロック Cに隣接するマクロブ口ック A， Bがフィーノドモードであるかフレームモードであるかに拘わらず、前記フレームモードの前記マクロプロックに対するコンテキストモデル ctx_intra_pred (C)と同様に定義されている

ことを特徴とする請求の範囲第 1 5項に記載の符号化装置。

1 8 . 飛び越し走査の画像情報を入力として、マクロブロックレベルで適応的にフィールドベースまたはフレームベースの符号化処理を実行し、前記符号化処理に含まれる可逆符号化処理に CABAC方式を採用した符号化方法において、前記マクロプロックレベルの前記符号化処理を前記フィールドベースとするか前記フレームベースとするかを示す frameZfield flagに対応するコンテキストモデルと、前記フレームベースの符号化処理を行うためのシンタクス要素に対応するコンテキストモデルと、前記フィールドベースで符号化処理を行うためのシンタクス要素に対応するコンテキストモデルとを用いて前記可逆符号化処理を実行する可逆符号化ステップを

含むことを特徴とする符号化方法。

1 9 . 飛び越し走査の画像情報を入力として、マクロブロックレベルで適応的にフィールドベースまたはフレームベースの符号化処理を実行し、前記符号化処理に含まれる可逆符号化処理に CABAC方式が採用されたプログラムであって、前記マクロブ口ックレベルの前記符号化処理を前記フィールドベースとするか前記フレームベースとするかを示す frame/field flagに対応するコンテキストモデルと、前記フレムベースの符号化処理を行うためのシンタクス要素に対応するコンテキストモデルと、前記フィールドベースで符号化処理を行うためのシンタクス要素に対応するコンテキストモデルとを用いて前記可逆符号化処理を実行する可逆符号化ステップを

含むことを特徴とするコンピュータが読み取り可能なプログラムが記録されている記録媒体。

2 0 . 飛び越し走査の画像情報を入力として、マクロブロックレベルで適応的にフィールドベースまたはフレームベースで符号化処理を実行し、前記符号化処理に含まれる可逆符号化処理に CABAC方式が採用されたプログラムであって、前記マクロプロックレベルの前記符号化処理を前記フィールドベースとするか前記フレームベースとするかを示す frame/field flagに対応するコンテキストモデルと、前記フレームベースの符号化処理を行うためのシンタクス要素に対応するコンテキストモデルと、前記フィールドベースで符号化処理を行うためのシンタクス要素に対応するコンテキストモデルとを用いて前記可逆符号化処理を行う可逆符号化ステップを

含む処理をコンピュータに実行させることを特徴とするプログラム。

2 1 . 画像圧縮情報を復号して前記飛び越し走査の画像情報を復元する復号装置において、

前記マク口プロックレベルの前記符号化処理を前記フィールドベースとするか前記フレームベースとするかを示す frameZfiel d flagに対応するコンテキストモデルと、前記フレームベースの符号化処理を行うためのシンタクス要素に対応するコンテキストモデルと、前記フィールドベースで符号化処理を行うためのシンタクス要素に対応するコンテキストモデルとを用いて可逆符号化されている前記画像圧縮情報を復号する復号手段を

含むことを特徴とする復号装置。

2 2 . 画像圧縮情報を復号して前記飛び越し走査の画像情報を復元する復号方法において、

前記マクロブロックレベルの前記符号化処理を前記フィールドベースとするか前記フレームベースとするかを示す frame/field flagに対応するコンテキストモデルと、前記フレームベースの符号化処理を行うためのシンタクス要素に対応するコンテキストモデルと、前記フィールドベースで符号化処理を行うためのシンタクス要素に対応するコンテキストモデルとを用いて可逆符号化されている前記画像圧縮情報を復号する復号ステップを

含むことを特徴とする復号方法。

2 3 . 画像圧縮情報を復号して前記飛び越し走査の画像情報を復元するためのプログラムであって、

前記マクロブロックレベルの前記符号化処理を前記フィールドベースとするか前記フレームベースとするかを示す frame/fiel d flagに対応するコンテキストモデルと、前記フレームベースの符号化処理を'行うためのシンタクス要素に対応するコンテキストモデルと、前記フィールドベースで符号化処理を行うためのシンタクス要素に対応するコンテキストモデルとを用いて可逆符号化されている前記画像圧縮情報を復号する復号ステップを

2 4 . 画像圧縮情報を復号して前記飛び越し走査の画像情報を復元するためのプログラムであって、

前記マクロプロックレベルの前記符号化処理を前記フィールドベースとするか前記フレームベースとするかを示す frame/field flagに対応するコンテキストモデルと、前記フレームベースの符号化処理を行うためのシンタクス要素に対応するコンテキストモデルと、前記フィールドベースで符号化処理を行うためのシンタクス要素に対応するコンテキストモデルとを用いて可逆符号化されている前記画像圧縮情報を復号する復号ステップを