JP2013176168A

JP2013176168A - 画像符号化装置および画像復号装置

Info

Publication number: JP2013176168A
Application number: JP2013124268A
Authority: JP
Inventors: Shunichi Sekiguchi; 俊一関口; Shuichi Yamagishi; 秀一山岸; Yoshimi Moriya; 芳美守屋; Etsuhisa Yamada; 悦久山田; Kotaro Asai; 光太郎浅井; Atsumichi Murakami; 篤道村上; Yuichi Izuhara; 優一出原
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 2007-06-28
Filing date: 2013-06-13
Publication date: 2013-09-05
Also published as: CN101889449A; US20090003716A1; BRPI0813996A2; EP2169961A4; RU2010102711A; WO2009001864A1; CN103327328A; US8145002B2; US8139875B2; RU2514787C1; JP5296679B2; CA2691742C; US20090003448A1; HK1148148A1; RU2012140183A; RU2430486C1; KR101088972B1; JPWO2009001864A1; US20090003449A1; RU2470480C1

Abstract

【課題】色成分間にサンプル比の区別のない動画像信号を符号化するにあたり、最適性を高めた符号化方法等の提供。
【解決手段】入力色成分信号を、符号化ブロックサイズ指示情報によって定まるサイズのブロックに分割して、前記符号化単位領域の信号を生成するブロック分割部と、予測画像生成方法を示すひとつ以上の予測モードに対応して前記符号化単位領域の信号に対する予測画像を生成する予測画像生成部と、該予測画像生成部から出力される予測画像の予測効率に応じて符号化に用いる予測モードを判定する判定部と、該判定部によって定められた予測モードに対応する予測画像と前記入力色成分信号との差分を符号化する予測誤差符号化部と、前記予測モードと予測誤差符号化部の出力とを可変長符号化する符号化部とを備える。
【選択図】図１

Description

本発明は、画像圧縮符号化技術や圧縮画像データ伝送技術等に用いられるデジタル画像信号符号化装置、デジタル画像信号復号装置、デジタル画像信号符号化方法、およびデジタル画像信号復号方法に関する。

従来、MPEGやITU-T H.26xなどの国際標準映像符号化方式では、主として４：２：０フォーマットと呼ばれる標準化された入力信号フォーマットの使用を前提としてきた。４：２：０とは、RGBなどのカラー動画像信号を輝度成分(Y)と２つの色差成分(Cb、Cr)に変換し、水平・垂直ともに色差成分のサンプル数を輝度成分の半分に削減したフォーマットである。色差成分は輝度成分に比べて視認性が落ちることから、MPEG-4 AVC(ISO/IEC 14496-10)/ITU-T H.264規格(以下、AVC)(非特許文献１)のような従来の国際標準映像符号化方式では、このように符号化を行う前に色差成分のダウンサンプルを行うことで符号化対象の原情報量を削減しておくことを前提としていた。一方、近年のビデオディスプレイの高解像度化、高階調化に伴い、また、デジタルシネマなどのコンテンツ制作時の色表現を上映時に正確に再現することを目的として、色差成分をダウンサンプルすることなく輝度成分と同一サンプルで符号化する方式についても検討が行われている。輝度成分と色差成分とがまったく同一のサンプル数のフォーマットは４：４：４フォーマットと呼ばれる。MPEG-4 AVC(ISO/IEC 14496-10)/ITU-T H.264規格(以下、AVC)では、４：４：４フォーマットを入力とする符号化方式として「ハイ４：４：４プロファイル」が策定されている。この目的に適した方式として、JPEG2000(ISO/IEC 15444)規格（非特許文献２）のような標準方式がある。図１０に示すように、従来の４：２：０フォーマットが色差成分のダウンサンプルを前提としたためにY、Cb、Crという色空間定義にのみ限定されたのに対し、４：４：４フォーマットでは色成分間にサンプル比の区別がないため、Y、Cb、Crのほか、R,G,Bを直接使用したり、その他複数の色空間定義を利用することが可能である。４：２：０フォーマットを用いた映像符号化方式では、その色空間はY、Cb、Crに決まっていたため符号化処理中に色空間の種別を考慮する必要はなかったが、上記のAVCハイ４：４：４プロファイルにおいては色空間定義が符号化処理そのものに影響を与える方式になっている。一方で、現在のハイ４：４：４プロファイルは、Y、Cb、Cr空間で定義された４：２：０フォーマットを符号化対象とするその他のプロファイルとの互換性を考慮するため、４：４：４フォーマットの圧縮効率を最適とする設計になっているとはいえない。

MPEG-4 AVC(ISO/IEC 14496-10)/ITU-T H.264規格 JPEG2000(ISO/IEC 15444)規格

たとえば、AVCの４：２：０フォーマットを符号化対象とするハイ４：２：０プロファイルでは、輝度成分１６ｘ１６画素からなるマクロブロック領域において、対応する色差成分はCb、Crとも各８ｘ８画素ブロックとなる。ハイ４：２：０プロファイルにおける動き補償予測では、輝度成分に対してのみ動き補償予測の単位となるブロックサイズ情報と予測に用いる参照画像情報、各ブロックごとの動きベクトル情報を多重化し、色差成分は輝度成分と同じ情報を用いて動き補償予測を行うことになっている。このような方式は、４：２：０フォーマットが画像の構造(テクスチャ)の表現に大きく寄与する輝度成分に比べ色差成分の寄与が小さいという色空間定義の前提のもとでなりたつものである。しかしながら、現在のハイ４：４：４プロファイルは、マクロブロックあたりの色差信号のブロックサイズが１６ｘ１６画素に拡張された状態においても、４：２：０フォーマットの色差用イントラ予測モードを単純に拡張した方式となっているのみであり、また、４：２：０フォーマットのときと同様、１成分を輝度成分とみなし、１成分の情報のみしか多重化せずに3成分に共通のインター予測モード、参照画像情報および動きベクトル情報で動き補償予測が行われることになっており、画像信号の構造表現に際して各色成分が同等に寄与する４：４：４フォーマットでは必ずしも最適な予測方法とはいえない。

そこで、本発明は、上記従来技術に述べたように、４：４：４フォーマットのような色成分間にサンプル比の区別のない動画像信号を符号化するにあたり、最適性を高めた符号化装置、復号装置、符号化方法、復号方法、およびこれらを実行するプログラムとこれらのプログラムを記録した記録媒体を提供することを目的とする。

本発明にかかわる画像符号化装置は、複数の色成分から構成されるカラー動画像信号を入力して、該カラー動画像信号を各色成分ごとに所定の符号化単位領域に分割して、画面内符号化ないしは動き補償予測符号化を選択的に適用することにより前記カラー動画像信号をデジタル圧縮する画像符号化装置であって、入力色成分信号を、符号化ブロックサイズ指示情報によって定まるサイズのブロックに分割して、前記符号化単位領域の信号を生成するブロック分割部と、予測画像生成方法を示すひとつ以上の予測モードに対応して前記符号化単位領域の信号に対する予測画像を生成する予測画像生成部と、該予測画像生成部から出力される予測画像の予測効率に応じて符号化に用いる予測モードを判定する判定部と、該判定部によって定められた予測モードに対応する予測画像と前記入力色成分信号との差分を符号化する予測誤差符号化部と、前記予測モードと予測誤差符号化部の出力とを可変長符号化する符号化部とを備え、前記符号化部は、前記符号化ブロックサイズ指示情報、ならびに各符号化単位領域ごとの前記予測モード、予測誤差を符号化した情報をビットストリームに多重化するものである。

本発明の画像符号化装置、画像復号装置によれば、Y、Cb、Crなどの固定された色空間に限定せず多様な色空間を利用する符号化を行う場合において、各色成分で用いるイントラ予測モード情報やインター予測モード情報を柔軟に選択できるように構成することができ、色空間の定義が種々に及ぶ場合にも最適な符号化処理を行うことができる。

実施の形態１における映像符号化装置の構成を示す説明図実施の形態１における映像復号装置の構成を示す説明図図１の空間予測部２で評価されるイントラ４ｘ４予測モードの予測画像生成方法を説明する説明図図１の空間予測部２で評価されるイントラ１６ｘ１６予測モードの予測画像生成方法を説明する説明図図１の映像符号化装置において行われるイントラ予測モード判定処理の手順を説明するフローチャート実施の形態１における映像符号化装置から出力されるビデオビットストリームのデータ配列を示す説明図図２の映像復号装置において行われるイントラ予測復号処理の手順を説明するフローチャート実施の形態１における映像符号化装置から出力されるビデオビットストリームの別のデータ配列の形態を示す説明図 AVC規格における色差成分対応イントラ予測モードの予測画像生成方法を説明する説明図従来と現在のマクロブロックを説明する説明図実施の形態２における映像符号化装置の構成を示す説明図実施の形態２における映像復号装置の構成を示す説明図図１１の空間予測部２で評価されるイントラ８ｘ８予測モードの予測画像生成方法を説明する説明図図１１の映像符号化装置において行われるイントラ符号化モード判定処理の手順を説明するフローチャート実施の形態２における映像符号化装置から出力されるビデオビットストリームのデータ配列を示す説明図実施の形態２における映像符号化装置から出力されるビデオビットストリームの別のデータ配列を示す説明図図１２の映像復号装置において行われるイントラ予測復号処理の手順を説明するフローチャート実施の形態３におけるC0成分のイントラ予測モード符号化処理のパラメータを説明する説明図実施の形態３におけるC1成分のイントラ予測モード符号化処理のパラメータを説明する説明図実施の形態３におけるC2成分のイントラ予測モード符号化処理のパラメータを説明する説明図実施の形態３におけるイントラ予測モード符号化処理の流れを示すフローチャート実施の形態３におけるイントラ予測モード符号化処理の別の流れを示すフローチャート実施の形態３におけるイントラ予測モード復号処理の流れを示すフローチャート実施の形態４における映像符号化装置から出力されるビデオビットストリームの別のデータ配列を示す説明図実施の形態５におけるイントラ予測モード符号化処理の別の流れを示すフローチャート実施の形態５におけるテーブル化された予測値設定の規則を示す説明図実施の形態６における符号化手順を示すフローチャート実施の形態６におけるCurrIntraPredModeの二値系列構成を示す説明図実施の形態６におけるCurrIntraPredModeの別の二値系列構成を示す説明図実施の形態７における映像符号化装置の構成を示す説明図実施の形態７における映像復号装置の構成を示す説明図マクロブロックの単位を示す説明図実施の形態７におけるインター予測モード判定処理の流れを示すフローチャート実施の形態７における映像符号化装置から出力されるビデオストリームのデータ配列を示す説明図実施の形態７における可変長復号部２５で行われる処理の流れを示すフローチャート実施の形態７における映像符号化装置から出力されるビデオストリームの別のデータ配列を示す説明図実施の形態７における映像符号化装置から出力されるビデオストリームの別のデータ配列を示す説明図実施の形態８におけるインター予測モード判定処理の流れを示すフローチャート実施の形態８におけるマクロブロックのレベルにおけるビットストリームのデータ配列を示す説明図実施の形態８におけるインター予測画像生成処理の流れを示すフローチャート実施の形態８におけるマクロブロックのレベルにおけるビットストリームの別のデータ配列を示す説明図実施の形態８におけるマクロブロックのレベルにおけるビットストリームの別のデータ配列を示す説明図実施の形態９におけるインター予測モード判定処理の流れを示すフローチャート実施の形態９におけるインター予測画像生成処理の流れを示すフローチャート動きベクトル符号化部の構成を示す説明図動きベクトル符号化部の動作を示す説明図動きベクトル復号部の構成を示す説明図ビットストリームシンタックスの様子を示す説明図実施の形態１１におけるマクロブロック符号化データの構成を示す説明図実施の形態１１における図４９中のCn成分ヘッダ情報の符号化データの詳細構成を示す説明図実施の形態１１におけるマクロブロック符号化データの別の構成を示す説明図実施の形態１１におけるビットストリームの構成を示す説明図実施の形態１１におけるスライスの構成を示す説明図実施の形態１２における可変長符号化部１１の算術符号化処理に関わる内部構成を示す説明図実施の形態１２における可変長符号化部１１の算術符号化処理の流れを示すフローチャート実施の形態１２における図５５中のステップＳ１６２の処理の詳細な流れを示す説明図コンテクストモデル(ctx)の概念を示す説明図マクロブロックの動きベクトルに関するコンテクストモデルの例を示す説明図実施の形態１２における可変長復号部２５の算術復号処理に関わる内部構成を示す説明図実施の形態１２における可変長復号部２５の算術復号処理の流れを示すフローチャート実施の形態１２におけるコンテクストモデル１１ｆを示す説明図実施の形態１２におけるカレントマクロブロックのモードの違いを示す説明図実施の形態１３における符号化装置・復号装置の構成を示す説明図実施の形態１３における映像符号化装置の構成を示す説明図実施の形態１３における映像復号装置の構成を示す説明図実施の形態１４における共通符号化処理を示す説明図実施の形態１４における独立符号化処理を示す説明図実施の形態１４の符号化装置・復号装置におけるピクチャ間の時間方向の動き予測参照関係を示す説明図実施の形態１４の符号化装置で生成され実施の形態１４の復号装置が入力・復号処理の対象とするビットストリームの構造の一例を示す説明図共通符号化処理、独立符号化処理それぞれの場合のスライスデータのビットストリーム構成を示す説明図実施の形態１４の符号化装置の概略構成を示す説明図符号化装置側での処理遅延を小さくする様子を示す説明図第１のピクチャ符号化部の内部構成を示す説明図第２のピクチャ符号化部の内部構成を示す説明図実施の形態１４の復号装置の概略構成を示す説明図第１のピクチャ復号部の内部構成を示す説明図第２のピクチャ復号部の内部構成を示す説明図色空間変換処理を施した第１のピクチャ符号化部の内部構成を示す説明図色空間変換処理を施した第１のピクチャ符号化部の内部構成を示す説明図逆色空間変換処理を施した第１のピクチャ符号化部の内部構成を示す説明図逆色空間変換処理を施した第１のピクチャ符号化部の内部構成を示す説明図従来のYUV４：２：０フォーマットのビットストリームに含まれるマクロブロックヘッダ情報の符号化データの構成を示す説明図従来のYUV４：２：０フォーマットのビットストリームに対する互換性を確保する第１のピクチャ復号部の予測部４６１の内部構成を示す説明図実施の形態１５における多重化する符号化データのビットストリームの構成を示す説明図 AUD NALユニットで始まるアクセスユニット内のピクチャデータが符号化される際のピクチャ符号化タイプの情報を示す説明図実施の形態１５における多重化する符号化データのビットストリームの構成を示す説明図実施の形態１６の符号化装置の概略構成を示す説明図ピクチャ符号化部の内部構成を示す説明図色差成分ごとに異なるブロックサイズを用いることを示す説明図マクロブロックの単位を示す説明図ピクチャ符号化部からの出力であるビデオストリームのデータ配列を示す説明図実施の形態１６の復号装置の概略構成を示す説明図復号部の内部構成を示す説明図半画素予測画素の生成方法を示す説明図 1/4画素MC時の半画素予測画素の生成方法の水平処理のみを示す説明図実施の形態１７の符号化装置の概略構成を示す説明図ピクチャ符号化部からの出力であるビデオストリームのデータ配列を示す説明図実施の形態１７の復号装置の概略構成を示す説明図

実施の形態１．
本実施の形態１では、４：４：４フォーマットで入力される映像フレームを１６×１６画素の矩形領域(マクロブロック)に均等分割した単位でフレーム内に閉じた符号化を行う符号化装置、および対応する復号装置について説明する。また、本符号化装置、復号装置は非特許文献１であるMPEG-4 AVC(ISO/IEC 14496-10)/ITU-T H.264規格で採用される符号化方式をベースとして、本発明に固有の特徴を付与したものとする。なお、以下、すべての実施の形態において、マクロブロックはフレーム画像の１６ｘ１６画素に限定する必要はなく、例えばインタレース信号の場合のように、フィールドを符号化単位の画面とするケースでフィールド画像の１６ｘ１６画素ブロックをマクロブロックとしてもよいし、フレーム画像としてマクロブロック符号化を行うか、フィールド画像としてマクロブロック符号化を行うかに応じて適応的にマクロブロックのブロックサイズを変更しながら符号化するような構成を伴っていてもよい。

図１に、本実施の形態１における映像符号化装置の構成を、図２に本実施の形態１における映像復号装置の構成を示す。図２において、図１の符号化装置の構成要素と同じ番号が付されている要素は同一の要素であることを示す。

以下、これらの図に基づいて符号化装置ならびに復号装置全体の動作と、本実施の形態１の特徴的な動作であるイントラ予測モード判定処理およびイントラ予測復号処理について説明する。

１．符号化装置の動作概要
図１の符号化装置において、入力映像信号１は、個々の映像フレームが４：４：４フォーマットで入力される。入力される映像フレームは、図１０に示すように、３つの色成分を同一サイズの16画素×16画素のブロックに分割してまとめたマクロブロック単位で符号化装置に入力されるものとする。

まず、空間予測部２において、メモリ１６に格納される局部復号画像１５を用いて、該マクロブロックの単位で、各色成分ごとにイントラ予測処理が行われる。メモリは各色成分ごとに３面用意される（本実施の形態では３面として説明するが、設計により適宜変更してよい）。イントラ予測のモードには、図３に示す4画素×4ラインのブロックの単位でその周辺画素を用いた空間予測を行うイントラ４ｘ４予測モード、図４に示す16画素×16ラインのマクロブロックの単位でその周辺画素を用いた空間予測を行うイントラ１６ｘ１６予測モードがある。

(a)イントラ４ｘ４予測モード
マクロブロック内の輝度信号16×16画素ブロックを4×4画素ブロックで構成される16個のブロックに分割し、図３に示す９つのモードのいずれかを4×4画素ブロック単位に選択する。すでに符号化を終え、局部復号処理されてメモリ１６に格納された周囲のブロック（左上、上、右上、左）の画素を予測画像生成に用いる。

Intra4x4_pred_mode = 0: 隣接する上部の画素をそのまま予測画像として使用する。
Intra4x4_pred_mode = 1: 隣接する左部の画素をそのまま予測画像として使用する。
Intra4x4_pred_mode = 2: 隣接する8つの画素の平均値を予測画像として使用する
Intra4x4_pred_mode = 3: 隣接する画素から2〜3画素ごとに加重平均を求め予測画像として使用する(右45度エッジに対応)。
Intra4x4_pred_mode = 4: 隣接する画素から2〜3画素ごとに加重平均を求め予測画像として使用する(左45度エッジに対応)。
Intra4x4_pred_mode = 5: 隣接する画素から2〜3画素ごとに加重平均を求め予測画像として使用する(左22.5度エッジに対応)。
Intra4x4_pred_mode = 6: 隣接する画素から2〜3画素ごとに加重平均を求め予測画像として使用する(左67.5度エッジに対応)。
Intra4x4_pred_mode = 7: 隣接する画素から2〜3画素ごとに加重平均を求め予測画像として使用する(右22.5度エッジに対応)。
Intra4x4_pred_mode = 8: 隣接する画素から2〜3画素ごとに加重平均を求め予測画像として使用する(左112.5度エッジに対応)。

イントラ４ｘ４予測モードを選択する場合、マクロブロックあたりのモード情報は16個必要となる。したがって、モード情報自体の符号量を削減するため、モード情報は隣接するブロック間との相関が高いことを利用して、隣接するブロックのモード情報から予測符号化を行う。

(b)イントラ１６ｘ１６予測モード
マクロブロックサイズに相当する16×16画素ブロックを一度に予測するモードであり、図４に示す4つのモードのいずれかをマクロブロック単位に選択する。イントラ４ｘ４予測モードと同様、すでに符号化を終え、局部復号処理されてメモリ１６に格納された周囲のマクロブロック（左上、上、左）の画素を予測画像生成に用いる。

Intra16x16_pred_mode = 0: 上マクロブロックの最下辺の16画素を予測画像として使用する。
Intra16x16_pred_mode = 1: 左マクロブロックの最右辺の16画素を予測画像として使用する。
Intra16x16_pred_mode = 2: 上マクロブロックの最下辺の16画素(図４のA部分)と左マクロブロックの最左辺の16画素(図４のB部分)の合計32画素の平均値を予測画像として使用する。
Intra16x16_pred_mode = 3: 左上のマクロブロックの右下隅の画素、上マクロブロックの最下辺の15画素(白抜き画素を除いた部分)、左マクロブロックの最右辺の15画素(白抜き画素を除いた部分)の合計31画素を用いて所定の演算処理（使用する画素と予測する画素位置に応じた重み付け加算処理）により予測画像を得る。

本実施の形態１における映像符号化装置は、イントラ予測モード共通化識別フラグ２３に基づき、３つの色成分に対するイントラ予測処理方法を切り替えることを特徴とする。この点については、下記２で詳しく述べる。

空間予測部２では、図３や図４に示した全モードないしはサブセットに対して予測処理を実行して減算器３により予測差分信号４を得る。予測差分信号４は符号化モード判定部５においてその予測効率が評価され、空間予測部２で実行した予測処理の中から、予測対象のマクロブロックに対して最適な予測効率が得られる予測モードを符号化モード６として出力する。ここで、符号化モード６は、イントラ４ｘ４予測モードを用いるか、イントラ１６ｘ１６予測モードを用いるかの判別情報(図６のイントラ符号化モードに相当)とともに、予測単位領域あたりで使用する個々の予測モード情報(上記Intra4x4_pred_mode ないしはIntra16x16_pred_mode)も含むものとする。予測単位領域は、イントラ４ｘ４予測モードの場合は4x4画素ブロック、イントラ１６ｘ１６予測モードの場合は16x16画素ブロックに相当する。符号化モード６の選定にあたっては、符号化制御部１９の判断で定まる各符号化モードに対する重み係数２０が加味されることもある。符号化モード判定部５において符号化モード６を用いて得られる最適な予測差分信号４は、直交変換部８へ出力される。直交変換部８は入力される予測差分信号４を変換し直交変換係数として量子化部９へ出力する。量子化部９は入力される直交変換係数を、符号化制御部１９によって定まる量子化パラメータ２１に基づいて量子化を行い、量子化済み変換係数１０として可変長符号化部１１へ出力する。量子化済み変換係数１０は、可変長符号化部１１にてハフマン符号化や算術符号化などの手段によりエントロピー符号化される。また、量子化済み変換係数１０は逆量子化部１２、逆直交変換部１３を経て局部復号予測差分信号１４へ復元され、符号化モード６に基づいて生成される予測画像７と加算器１８で加算することで局部復号画像１５が生成される。局部復号画像１５は以降のイントラ予測処理に用いるためメモリ１６へ格納される。また、可変長符号化部１１には、当該マクロブロックに対してデブロッキングフィルタを施すか否かを示すデブロッキングフィルタ制御フラグ２４も入力される(空間予測部２で実施される予測処理には、デブロッキングフィルタが施される前の画素データをメモリ１６に格納して用いるのでデブロッキングフィルタ処理自体は符号化処理には必要はないが、復号装置側ではデブロッキングフィルタ制御フラグ２４の指示によってデブロッキングフィルタを行って最終的な復号画像を得る)。

可変長符号化部１１に入力されるイントラ予測モード共通化識別フラグ２３、量子化済み変換係数１０、符号化モード６、量子化パラメータ２１は所定の規則(シンタックス)に従ってビットストリームとして配列・整形され、送信バッファ１７へ出力される。送信バッファ１７では符号化装置が接続される伝送路の帯域や記録媒体の読み出し速度に合わせてビットストリームを平滑化してビデオストリーム２２として出力する。また、送信バッファ１７中のビットストリーム蓄積状況に応じて符号化制御部１９へフィードバック情報を出力し、以降の映像フレームの符号化における発生符号量を制御する。

２．符号化装置におけるイントラ予測モード判定処理
本実施の形態１の符号化装置の特徴であるイントラ予測モード判定処理について詳述する。本処理は上記3つの色成分をまとめたマクロブロックの単位で実施され、主として、図１の符号化装置における空間予測部２、符号化モード判定部５によって行われる。また、本処理の流れを示すフローチャートを図５に示す。以下、ブロックを構成する3つの色成分の画像データをC0、C1、C2とする。

まず、符号化モード判定部５は、イントラ予測モード共通化識別フラグ２３を受け取り、その値に基づいてC0、C1、C2で共通のイントラ予測モードを使用するか否かを判断する(図５のステップS1)。共通化する場合はステップS2以降へ、共通化しない場合はステップS5以降へ進む。

イントラ予測モードをC0、C1、C2で共通化する場合は、符号化モード判定部５は空間予測部２に対して、選択しうるすべてのイントラ4x4予測モードを通知し、空間予測部２はそのすべての予測効率を評価して、C0、C1、C2で共通の最適なイントラ4x4予測モードを選択する(ステップS2)。次いで、符号化モード判定部５は空間予測部２に対して、選択しうるすべてないしは一部のイントラ16x16予測モードを通知し、空間予測部２はそのすべての予測効率を評価して、C0、C1、C2で共通の最適なイントラ16x16予測モードを選択する(ステップS3)。符号化モード判定部５はステップS2、S3で得たモードのうちより予測効率上最適なモードを最終的に選択して(ステップS4)、処理を終了する。

イントラ予測モードをC0、C1、C2で共通化せず、C0、C1、C2でそれぞれ一番よいモードを選択する場合は、符号化モード判定部５は空間予測部２に対して、Ci (i<=0<3)成分で選択しうるすべてないしは一部のイントラ4x4予測モードを通知し、空間予測部２はそのすべての予測効率を評価して、Ci (i<=0<3)成分における最適なイントラ4x4予測モードを選択する(ステップS6)。同様に最適なイントラ16x16予測モードを選択する(ステップS7)。最後にステップS8にてCi (i<=0<3)成分における最適なイントラ予測モードを判定する。

空間予測部２で行われる予測モードの予測効率評価の規範としてはたとえば、
Jm = Dm + λRm(λ：正数)
で与えられるレート・ひずみコストを用いることができる。ここで、Dmはイントラ予測モードmを適用した場合の符号化歪または予測誤差量である。符号化歪とは、イントラ予測モードmを適用して予測誤差を得、予測誤差を変換・量子化した結果から映像を復号して符号化前の信号に対する誤差を計測するものである。予測誤差量は、イントラ予測モードmを適用した場合の予測画像と符号化前の信号との差分を得、その差分の大きさを定量化したもので、たとえば差分絶対値和(Sum of Absolute Distance: SAD)などが用いられる。Rmはイントラ予測モードmを適用した場合の発生符号量である。つまり、Jmはイントラ予測モードmを適用した場合の符号量と劣化度とのトレードオフを規定する値であり、最小のJmを与えるイントラ予測モードmが最適解を与える。

符号化装置がステップS2以降の処理を行った場合、イントラ予測モードの情報は、３つの色成分を含むマクロブロックに対して１つ割り当てられる。一方、ステップS5以降の処理を行った場合は、各色成分に対してそれぞれイントラ予測モード情報が割り当てられる。したがって、マクロブロックに対して割り当てられるイントラ予測モードの情報が異なるため、符号化装置がS2以降の処理過程を行ったか、S5以降の処理過程を行ったかはイントラ予測モード共通化識別フラグ２３をビットストリームに多重化して復号装置側で認識できるようにする必要がある。このようなビットストリームのデータ配列を図６に示す。

同図はマクロブロックのレベルにおけるビットストリームのデータ配列を示しており、イントラ符号化モード２８はイントラ4x4かイントラ16x16かを判別する情報、基本イントラ予測モード２９はイントラ予測モード共通化識別フラグ２３が「C0、C1、C2で共通」であることを示す場合は共通イントラ予測モード情報を示し、「C0、C1、C2で共通」でないことを示す場合はC0に対するイントラ予測モード情報を示す。拡張イントラ予測モード３０は、イントラ予測モード共通化識別フラグ２３が「C0、C1、C2で共通」でないことを示す場合にのみ多重化され、C1、C2に対するイントラ予測モード情報を示す。ついで量子化パラメータ２１、量子化済み変換係数１０が多重化される。図１における符号化モード６は、上記イントラ符号化モード２８とイントラ予測モード(基本・拡張)を総称したものである(図６には図１で可変長符号化部１１に入力されているデブロッキングフィルタ制御フラグ２４が含まれていないが、本実施の形態１の特徴を説明するために必要な構成要素ではないため割愛している)。

従来の映像符号化標準で採用されてきた４：２：０フォーマットでは、色空間の定義がY、Cb、Crに固定されていたが、４：４：４フォーマットではY、Cb、Crに限定せず多様な色空間を利用することができる。図６のようにイントラ予測モード情報を構成することで、入力映像信号１の色空間の定義が種々に及ぶ場合にも最適な符号化処理を行うことができる。たとえば、色空間がRGBで定義される場合はR、G、Bの各成分には均等に映像テクスチャの構造が残存しているため、共通のイントラ予測モード情報を用いることでイントラ予測モード情報自体の冗長性を削減して符号化効率を高めることができる。一方、Y、Cb、Crで色空間が定義される場合、映像テクスチャの構造はYに集約されるため、必ずしも共通のイントラ予測モードが最適な結果を与えるわけではない。そこで、拡張イントラ予測モード３０を適応的に利用することで最適な符号化効率を得ることができる。

３．復号装置の動作概要
図２の復号装置は、図１の符号化装置から出力される図６の配列に従うビデオストリーム２２を受信して、３つの色成分が同一サイズ(４：４：４フォーマット)のマクロブロックの単位で復号処理を行い、個々の映像フレームを復元するものとする。

まず、可変長復号部２５はストリーム２２を入力とし、所定の規則(シンタックス)に従ってストリーム２２を解読して、イントラ予測モード共通化識別フラグ２３、量子化済み変換係数１０、符号化モード６、量子化パラメータ２１などの情報を抽出する。量子化済み変換係数１０は量子化パラメータ２１とともに逆量子化部１２へ入力され、逆量子化処理が行われる。ついでその出力が逆直交変換部１３へ入力され、局部復号予測差分信号１４へ復元される。一方、空間予測部２に対しては符号化モード６とイントラ予測モード共通化識別フラグ２３が入力され、これらの情報に従って予測画像７を得る。予測画像７を得る具体的な手順については後述する。局部復号予測差分信号１４と予測画像７は加算器１８により加算され、暫定復号画像１５を得る(これは符号化装置における局部復号画像１５とまったく同じ信号である)。暫定復号画像１５は以降のマクロブロックのイントラ予測に用いられるためメモリ１６へ書き戻される。メモリは各色成分ごとに３面用意される（本実施の形態では３面として説明するが、設計により適宜変更してよい）。また、可変長符号化部２５によって解読されたデブロッキングフィルタ制御フラグ２４の指示に基づいてデブロッキングフィルタ２６を暫定復号画像１５に対して作用させ、最終的な復号画像２７を得る。

４．復号装置におけるイントラ予測復号処理
本実施の形態１の復号装置の特徴であるイントラ予測画像生成処理について詳述する。本処理は上記3つの色成分をまとめたマクロブロックの単位で実施され、主として、図２の復号装置における可変長復号部２５、空間予測部２によって行われる。また、本処理の流れを示すフローチャートを図７に示す。

図７のフローチャートのうち、S10〜S14は可変長復号部２５において行われる。可変長復号部２５への入力であるビデオストリーム２２は、図６のデータ配列に従うものとする。ステップS10では図６のデータのうちイントラ符号化モード２８がまず復号され、ついでイントラ予測モード共通化識別フラグ２３が復号される(ステップS11)。さらに基本イントラ予測モード２９が復号される(ステップS12)。ステップS13では、イントラ予測モード共通化識別フラグ２３の結果を用いてイントラ予測モードをC0、C1、C2で共通化するかどうかを判断し、共通化の場合はC0、C1、C2のすべてに対して基本イントラ予測モード２９を用いることとし、共通化しない場合は基本イントラ予測モード２９をC0のモードとして使用し、さらに拡張イントラ予測モード３０を復号して(ステップS14)、C1,C2のモード情報を得る。以上の処理過程を経て各色成分の符号化モード６が確定するため、これを空間予測部２へ出力し、ステップS15〜S17にしたがって各色成分のイントラ予測画像を得る。イントラ予測画像を得るプロセスは図３、図４の手順に従うもので図１の符号化装置で行う処理と同じである。

図８に、図６のビットストリームデータ配列のバリエーションを示す。図７では、イントラ予測モード共通化識別フラグ２３は、マクロブロックレベルのフラグとしてでなく、スライス、ピクチャ、シーケンスなどの上位データレイヤに位置するフラグとして多重化され、かつ、拡張イントラ予測モード３０の符号語を定義する符号テーブルを複数あるうちのいずれかから選択できるよう、拡張イントラ予測モードテーブル指示フラグ３１を備えるようにした。これにより、スライス以上の上位レイヤでの切り替えで十分な予測効率が確保できる場合は、マクロブロックレベルでイントラ予測モード共通化識別フラグ２３を逐一多重化することなくオーバヘッドビットを削減できる。また、拡張イントラ予測モード３０については、拡張イントラ予測モードテーブル指示フラグ３１を設けることにより、基本イントラ予測モード２９と同一の定義でなく、C1、C2成分に特化した予測モードの定義を選択することが可能となり、色空間の定義に適応した符号化処理を行うことが可能となる。たとえば、AVCの４：２：０フォーマットの符号化では、色差成分(Cb、Cr)に対しては、輝度（Y）とは異なるイントラ予測モードセットが定義されている。４：２：０フォーマットではマクロブロック内の色差信号は8画素×8ラインであり、図９に示す4つのモードのいずれかをマクロブロック単位に選択して復号処理を行う。色差信号はCbとCrの2種類があるが、同じモードを使用する。intra_chroma_pred_mode = 0のDC予測を除いては、図４のイントラ16×16予測モードと同様の予測処理となるが、DC予測では8×8ブロックを4つの4×4ブロックに分割し、それぞれのブロックごとに平均値を求める画素の位置を変更して処理を行う。同図で「a+x, a or x」となっているブロックは、画素aと画素xが共に利用可能な場合にはaとxの8画素、aのみが利用可能な場合にはaの4画素、xのみ利用可能な場合にはxの4画素のみを用いて平均値を求め、予測画像７として使用する。aとxともに利用不可能な場合には値128を予測画像７として使用する。「b or x」となっているブロックは、画像bが利用可能な場合にはbの4画素を、画素xのみが利用可能な場合にはxの4画素を用いて平均値を求める。

このように、色成分の性質に応じてイントラ予測モードのセットに変更を要する場合、図８のシンタックスのような構成により、より最適な符号化効率を得ることができる。

実施の形態２．
本実施の形態２では、４：４：４フォーマットで入力される映像フレームを１６×１６画素の矩形領域(マクロブロック)に均等分割した単位でフレーム内に閉じた符号化を行う別の符号化装置、および対応する復号装置について説明する。本符号化装置、復号装置は実施の形態１と同様、非特許文献１であるMPEG-4 AVC(ISO/IEC 14496-10)/ITU-T H.264規格で採用される符号化方式をベースとして、本発明に固有の特徴を付与したものとする。

図１１に、本実施の形態２における映像符号化装置の構成を、図１２に本実施の形態２における映像復号装置の構成を示す。図１１において、図１の符号化装置の構成要素と同じ番号が付されている要素は同一の要素であることを示す。図１２において、図１１の符号化装置の構成要素と同じ番号が付されている要素は同一の要素であることを示す。図１１における３２は変換ブロックサイズ識別フラグであり、３３はイントラ符号化モード共通化識別フラグである。

以下、これらの図に基づいて本実施の形態２の符号化装置ならびに復号装置全体の動作と、本実施の形態２の特徴的な動作であるイントラ符号化・予測モード判定処理およびイントラ予測復号処理について説明する。

１．符号化装置の動作概要
図１１の符号化装置において、入力映像信号１は、個々の映像フレームが４：４：４フォーマットであって、かつ３つの色成分が図１０に示すように同一サイズのマクロブロックに分割してまとめられた単位で符号化装置に入力されるものとする。

空間予測部２においては、メモリ１６に格納される局部復号画像１５を用いて、該マクロブロックの単位で、各色成分ごとにイントラ予測処理が行われる。イントラ予測のモードには、図３に示す４画素×４ラインのブロックの単位でその周辺画素を用いた空間予測を行うイントラ４ｘ４予測モード、図１３に示す８画素×８ラインのブロックの単位でその周辺画素を用いた空間予測を行うイントラ８ｘ８予測モード、図４に示す１６画素×１６ラインのマクロブロックの単位でその周辺画素を用いた空間予測を行うイントラ１６ｘ１６予測モードがある。本実施の形態２における符号化装置では、変換ブロックサイズ識別フラグ３２の状態に従ってイントラ４ｘ４予測モードとイントラ８ｘ８予測モードとを切り替えて用いる。あるマクロブロックを４ｘ４予測、８ｘ８予測、１６ｘ１６予測のいずれのイントラ予測モードを用いて符号化するかは、図６と同様にイントラ符号化モードで表現できる。本実施の形態２における符号化装置では、イントラ符号化モードとして、イントラ４ｘ４予測モードかイントラ８ｘ８予測モードかのいずれかを用いて符号化を行うイントラＮｘＮ予測符号化モード(Ｎは４ないしは８)と、イントラ１６ｘ１６予測モードを用いて符号化を行うイントラ１６ｘ１６予測符号化モードの２種類を設ける。以下、イントラ符号化モード別に説明を進める。

(a)イントラＮｘＮ予測符号化モード
マクロブロック内の輝度信号１６ｘ１６画素ブロックを４ｘ４画素ブロックで構成される１６個のブロックに分割し、各４ｘ４画素ブロックに対して個別に予測モードを選択するイントラ４ｘ４予測モードと、マクロブロック内の輝度信号１６ｘ１６画素ブロックを８ｘ８画素ブロックで構成される４個のブロックに分割し、各８ｘ８画素ブロックに対して個別に予測モードを選択するイントラ８ｘ８予測モードとを選択的に切り替えながら符号化を行うモードである。イントラ４ｘ４予測モードとイントラ８ｘ８予測モードの切り替えは、変換ブロックサイズ識別フラグ３２の状態に連動する。この点は後述する。イントラ４ｘ４予測モードについては、実施の形態１で説明したように、図３に示す９つのモードのいずれかを４ｘ４画素ブロック単位に選択する。すでに符号化を終え、局部復号処理されてメモリ１６に格納された周囲のブロック（左上、上、右上、左）の画素を予測画像生成に用いる。

一方、イントラ８ｘ８予測モードは、図１３に示す９つのモードのいずれかを８ｘ８画素ブロック単位に選択する。図３との対比で明らかなように、イントラ４ｘ４予測モードの予測方法を８ｘ８画素ブロックに適合するように変更を加えたものである。
Intra8x8_pred_mode = 0: 隣接する上部の画素をそのまま予測画像として使用する。
Intra8x8_pred_mode = 1: 隣接する左部の画素をそのまま予測画像として使用する。
Intra8x8_pred_mode = 2: 隣接する8つの画素の平均値を予測画像として使用する
Intra8x8_pred_mode = 3: 隣接する画素から2〜3画素ごとに加重平均を求め予測画像として使用する(右45度エッジに対応)。
Intra8x8_pred_mode = 4: 隣接する画素から2〜3画素ごとに加重平均を求め予測画像として使用する(左45度エッジに対応)。
Intra8x8_pred_mode = 5: 隣接する画素から2〜3画素ごとに加重平均を求め予測画像として使用する(左22.5度エッジに対応)。
Intra8x8_pred_mode = 6: 隣接する画素から2〜3画素ごとに加重平均を求め予測画像として使用する(左67.5度エッジに対応)。
Intra8x8_pred_mode = 7: 隣接する画素から2〜3画素ごとに加重平均を求め予測画像として使用する(右22.5度エッジに対応)。
Intra8x8_pred_mode = 8: 隣接する画素から2〜3画素ごとに加重平均を求め予測画像として使用する(左112.5度エッジに対応)。

イントラ４ｘ４予測モードを選択する場合、マクロブロックあたりのモード情報は１６個必要となる。したがって、モード情報自体の符号量を削減するため、モード情報は隣接するブロック間との相関が高いことを利用して、隣接するブロックのモード情報から予測符号化を行う。同様にイントラ８ｘ８予測モードを選択する場合も隣接するブロック間でイントラ予測モードの相関が高いことを利用して、隣接するブロックのモード情報から予測符号化を行う。

(b)イントラ１６ｘ１６予測符号化モード
マクロブロックサイズに相当する１６ｘ１６画素ブロックを一度に予測するモードであり、図４に示す４つのモードのいずれかをマクロブロック単位に選択する。イントラ４ｘ４予測モードと同様、すでに符号化を終え、局部復号処理されてメモリ１６に格納された周囲のマクロブロック（左上、上、左）の画素を予測画像生成に用いる。モード種別は実施の形態１における図４の説明の通りである。イントラ１６ｘ１６予測符号化モードでは、変換ブロックサイズは常に４ｘ４とする。ただし、まず４ｘ４ブロック単位のDC(直流成分、平均値)を１６個分集め、その単位で４ｘ４ブロック変換を行い、DC分を除いた残りの交流成分を４ｘ４ブロックごとに変換する２段階の変換を施す。

本実施の形態２における映像符号化装置は、イントラ符号化モード共通化識別フラグ３３に基づき、３つの色成分に対するイントラ予測・変換・符号化方法を切り替えることを特徴とする。この点については、下記２で詳しく述べる。

空間予測部２では、入力される３つの色成分の信号に対して、イントラ符号化モード共通化識別フラグ３３の指示に基づいてイントラ予測モードの評価を行う。イントラ符号化モード共通化識別フラグ３３は、入力される３つの色成分それぞれについて個別にイントラ符号化モードを割り当てるか、３成分すべてに同じイントラ符号化モードを割り当てるかを指示する。これは以下の背景による。

４：４：４フォーマットでは、従来から符号化に用いられてきたY、Cb、Cr色空間以外に、RGBを直接利用することも可能である。Y、Cb、Cr色空間は、Cb、Crの信号から映像のテクスチャ構造に依存する成分が取り除かれる。Y成分とCb、Cr２成分との間では最適なイントラ符号化方法が変化する確率が高い。(現に、ハイ４：２：０プロファイルなど、AVC/H.264の４：２：０フォーマットを対象とする符号化方式では、Y成分とCb、Cr成分で用いるイントラ予測モードの設計が異なっている)。一方、RGB色空間で符号化を行う場合は、Y、Cb、Cr色空間のように色成分間でのテクスチャ構造の除去を行わず、同一空間上の信号成分は相関が高くなるため、イントラ符号化モードを共通的に選択できるように構成することで符号化効率を高められる可能性がある。この点は、色空間の定義だけでなく、ある特定の色空間を使用したとしても映像の性質によって左右される点であり、符号化方式自体は、そういった映像信号の性質に適応的に対応できることが望ましい。そこで、本実施の形態ではイントラ符号化モード共通化識別フラグ３３を設け、４：４：４フォーマット映像に対する柔軟な符号化を行うことができるよう符号化装置を構成した。

空間予測部２では、以上のように設定されるイントラ符号化モード共通化識別フラグ３３の状態に応じて、図３や図４、図１３に示した全イントラ予測モードないしは所定のサブセットに対して各色成分に対する予測処理を実行して減算器３により予測差分信号４を得る。予測分信号４は符号化モード判定部５においてその予測効率が評価され、空間予測部２で実行した予測処理の中から、対象のマクロブロックに対して最適な予測効率が得られるイントラ予測モードを選択する。ここで、イントラＮｘＮ予測が選ばれた場合、符号化モード６としてイントラＮｘＮ予測符号化モードを出力するとともに、予測モードがイントラ４ｘ４予測であった場合は、変換ブロックサイズ識別フラグ３２を「４ｘ４ブロックサイズでの変換」に設定する。また、予測モードがイントラ８ｘ８予測であった場合は、変換ブロックサイズ識別フラグ３２を「８ｘ８ブロックサイズでの変換」に設定する。変換ブロックサイズ識別フラグ３２の決定方法については様々な方法が考えられるが、本実施の形態２における符号化装置では、イントラＮｘＮ予測によって得られる残差に対して変換を行う場合のブロックサイズを定めるため、符号化モード判定部５において最適なイントラＮｘＮ予測モードが定まった後、そのＮ値にあわせて決定する方法が一例として挙げられる。例えば、イントラ４ｘ４予測モードを用いる場合に変換ブロックサイズを８ｘ８画素ブロックとすると、予測の結果得られる予測差分信号４において４ｘ４ブロックの単位で予測信号の空間的連続性が断絶される可能性が高くなり、無駄な高周波成分が発生するため、変換による信号電力集中化の効果が薄れる。変換ブロックサイズを予測モードにあわせて４ｘ４画素ブロックとしておけば、このような問題は発生しない。

符号化モード判定部５においてイントラ１６ｘ１６予測が選ばれた場合、符号化モード６としてイントラ１６ｘ１６予測符号化モードを出力する。なお、符号化モード６の選定にあたっては、符号化制御部１９の判断で定まる各符号化モードに対する重み係数２０が加味されることもある。

符号化モード６によって得られる予測差分信号４は直交変換部８へ出力される。直交変換部８は入力される予測差分信号を変換し直交変換係数として量子化部９へ出力する。量子化部９は入力される直交変換係数を、符号化制御部１９によって定まる量子化パラメータ２１に基づいて量子化を行い、量子化済み変換係数１０として可変長符号化部１１へ出力する。

変換ブロックサイズが４ｘ４ブロック単位の場合、直交変換部８に入力される予測差分信号４は、４ｘ４ブロック単位に分割され直交変換され、量子化部９にて量子化が行われる。変換ブロックサイズが８ｘ８ブロック単位の場合、直交変換部８に入力される予測差分信号４は、８ｘ８ブロック単位に分割され直交変換され、量子化部９にて量子化が行われる。

量子化済み変換係数１０は、可変長符号化部１１にてハフマン符号化や算術符号化などの手段によりエントロピー符号化される。また、量子化済み変換係数１０は変換ブロックサイズ識別フラグ３２などに基づくブロックサイズにて逆量子化部１２、逆直交変換部１３を経て局部復号予測差分信号１４へ復元され、符号化モード６に基づいて生成される予測画像７と加算器１８で加算することで局部復号画像１５が生成される。局部復号画像１５は以降のイントラ予測処理に用いるためメモリ１６へ格納される。また、可変長符号化部１１には、当該マクロブロックに対してデブロッキングフィルタを施すか否かを示すデブロッキングフィルタ制御フラグ２４も入力される(空間予測部２で実施される予測処理には、デブロッキングフィルタが施される前の画素データをメモリ１６に格納して用いるのでデブロッキングフィルタ処理自体は符号化処理には必要はないが、復号装置側ではデブロッキングフィルタ制御フラグ２４の指示によってデブロッキングフィルタを行って最終的な復号画像を得る)。

可変長符号化部１１に入力されるイントラ符号化モード共通化識別フラグ３３、量子化済み変換係数１０、符号化モード６、量子化パラメータ２１は所定の規則(シンタックス)に従ってビットストリームとして配列・整形され、送信バッファ１７へ出力される。送信バッファ１７では符号化装置が接続される伝送路の帯域や記録媒体の読み出し速度に合わせてビットストリームを平滑化してビデオストリーム２２として出力する。また、送信バッファ１７中のビットストリーム蓄積状況に応じて符号化制御部１９へフィードバック情報を出力し、以降の映像フレームの符号化における発生符号量を制御する。

２．符号化装置におけるイントラ符号化モード・予測モード判定処理
本実施の形態２の符号化装置の特徴であるイントラ符号化モードおよびイントラ予測モードの判定処理について詳述する。本処理は上記３つの色成分をまとめたマクロブロックの単位で実施され、主として、図１１の符号化装置における空間予測部２、符号化モード判定部５によって行われる。また、本処理の流れを示すフローチャートを図１４に示す。以下、ブロックを構成する３つの色成分の画像データをC0、C1、C2とする。

まず、符号化モード判定部５は、イントラ符号化モード共通化識別フラグ３３を受け取り、その値に基づいてC0、C1、C2で共通のイントラ符号化モードを使用するか否かを判断する(図１４のステップS20)。共通化する場合はステップS21以降へ、共通化しない場合はステップS22以降へ進む。

イントラ符号化モードをC0、C1、C2で共通化する場合は、符号化モード判定部５は空間予測部２に対して、選択しうるすべてないしは一部のイントラ予測モード(イントラＮｘＮ予測、イントラ１６ｘ１６予測)を通知し、空間予測部２はそのすべての予測効率を評価して、全成分に最適なイントラ符号化モードおよびイントラ予測モードを選択する(ステップS21)。

一方、C0、C1、C2でそれぞれ最適なイントラ符号化モードを選択する場合は、符号化モード判定部５は空間予測部２に対して、Ci(i<=0<3)成分で選択しうるすべてないしは一部のイントラ予測モード(イントラＮｘＮ予測、イントラ１６ｘ１６予測)を通知し、空間予測部２はそのすべての予測効率を評価して、Ci(i<=0<3)成分における最適なイントラ４ｘ４予測モードを選択する(ステップS23)。

上記ステップS21、S23において、空間予測部２がイントラ４ｘ４予測モードを最適な予測効率を与えるモードとして選択した場合、変換ブロックサイズ識別フラグ３２は「４ｘ４ブロックサイズでの変換」に設定され、空間予測部２がイントラ８ｘ８予測モードを最適な予測効率を与えるモードとして選択した場合、変換ブロックサイズ識別フラグ３２は「８ｘ８ブロックサイズでの変換」に設定される。

空間予測部２で行われる予測モードの予測効率評価の規範としてはたとえば、
Jm = Dm + λRm(λ：正数)
で与えられるレート・ひずみコストを用いることができる。ここで、Dmはイントラ予測モードmを適用した場合の符号化歪または予測誤差量である。符号化歪とは、イントラ予測モードmを適用して予測誤差を得て、予測誤差を変換・量子化した結果から映像を復号して符号化前の信号に対する誤差を計測するものである。予測誤差量は、イントラ予測モードmを適用した場合の予測画像と符号化前の信号との差分を得て、その差分の大きさを定量化したもので、たとえば差分絶対値和(Sum of Absolute Distance: SAD)などが用いられる。Rmはイントラ予測モードmを適用した場合の発生符号量である。つまり、Jmはイントラ予測モードmを適用した場合の符号量と劣化度とのトレードオフを規定する値であり、最小のJmを与えるイントラ予測モードmが最適解を与える。

符号化装置がステップS21以降の処理を行った場合、イントラ符号化モードの情報は、３つの色成分を含むマクロブロックに対して、１つ割り当てられる。一方、ステップS22以降の処理を行った場合は、各色成分に対してそれぞれイントラ符号化モード情報(計３つ)が割り当てられる。したがって、マクロブロックに対して割り当てられるイントラ予測モードの情報が異なるため、符号化装置がS21以降の処理過程を行ったか、S23以降の処理過程を行ったかはイントラ符号化モード共通化識別フラグ２３をビットストリームに多重化して復号装置側で認識できるようにする必要がある。このようなビットストリームのデータ配列を図１５に示す。

図１５において、マクロブロックレベルでビットストリームに多重化されるイントラ符号化モード０(34a)、１(34b)、２(34c)はそれぞれ、C0、C1、C2成分に対する符号化モード６を示す。イントラ符号化モードがイントラＮｘＮ予測符号化モードである場合には、変換ブロックサイズ識別フラグ３２、イントラ予測モードの情報がビットストリームに多重化される。一方、イントラ符号化モードがイントラ１６ｘ１６予測符号化モードである場合には、イントラ予測モードの情報はイントラ符号化モード情報の一部として符号化され、変換ブロックサイズ識別フラグ３２、イントラ予測モードの情報はビットストリームに多重化されない。イントラ符号化モード共通化識別フラグ３３が「C0、C1、C2で共通」であることを示す場合には、イントラ符号化モード１(34b)・２(34c)、変換ブロックサイズ識別フラグ１(32b)・２(32c)、イントラ予測モード１(35b)・２(35c)はビットストリームに多重化されない(図１５中の点線の丸印部分がその分岐を示す)。このときは、イントラ符号化モード0(34a)、変換ブロックサイズ識別フラグ0(32a)、イントラ予測モード0(35a)がそれぞれ全色成分共通の符号化情報として機能する。イントラ符号化モード共通化識別フラグ３３は、図１５においてはスライス、ピクチャ、シーケンスなど、マクロブロックよりも上位レベルのビットストリームデータとして多重化される例を示す。特に、本実施の形態２に挙げた例のように用いる場合は、シーケンスを通じて色空間が変化しないことが多いことから、シーケンスレベルにイントラ符号化モード共通化識別フラグ３３を多重化しておくことで目的を達成できる。

本実施の形態２では、イントラ符号化モード共通化識別フラグ３３を「全成分で共通かどうか」という意味で用いたが、これは入力映像信号１の色空間定義に応じて例えば「C1、C2など特定の２成分で共通かどうか」という意味で使用してもよい(Y、Cb、Crのような場合、CbとCrとでは共通化できる可能性が高い)。さらに、イントラ符号化モード共通化識別フラグ３３の共通化範囲をイントラ符号化モードのみに限定し、イントラＮｘＮ予測モードを使用する場合には、各色成分で独立に変換ブロックサイズやＮｘＮ予測モードを選択できるように構成してもよい(図１６)。図１６のようなシンタックス構成により、ＮｘＮ予測を必要とするような複雑な絵柄の映像に対して、符号化モード情報を共通化しつつも、色成分ごとに予測方法を変更することができ、予測効率を高めることができる。

なお、イントラ符号化モード共通化識別フラグ３３の情報は、符号化装置と復号装置の双方であらかじめ何らかの手段で既知となっていれば、ビデオのビットストリーム中に載せて伝送しなくてもよい。その場合、例えば符号化装置はイントラ符号化モード共通化識別フラグ３３をいずれかの値に固定化して符号化を行うように構成してもよいし、ビデオのビットストリームとは別に伝送してもよい。

３．復号装置の動作概要
図１２の復号装置は、図１１の符号化装置から出力される図１５の配列に従うビデオストリーム２２を受信して、３つの色成分が同一サイズ(４：４：４フォーマット)のマクロブロックの単位で復号処理を行い、個々の映像フレームを復元するものとする。

まず、可変長復号部２５はストリーム２２を入力とし、所定の規則(シンタックス)に従ってストリーム２２を解読して、イントラ符号化モード共通化識別フラグ３３、量子化済み変換係数１０、符号化モード６、量子化パラメータ２１などの情報を抽出する。量子化済み変換係数１０は量子化パラメータ２１とともに逆量子化部１２へ入力され、逆量子化処理が行われる。ついでその出力が逆直交変換部１３へ入力され、局部復号予測差分信号１４へ復元される。一方、空間予測部２に対しては符号化モード６とイントラ符号化モード共通化識別フラグ３３が入力され、これらの情報に従って予測画像７を得る。予測画像７を得る具体的な手順については後述する。局部復号予測差分信号１４と予測画像７は加算器１８により加算され、暫定復号画像１５を得る(これは符号化装置における局部復号画像１５とまったく同じ信号である)。暫定復号画像１５は以降のマクロブロックのイントラ予測に用いられるためメモリ１６へ書き戻される。メモリは各色成分ごとに３面用意される。また、可変長符号化部２５によって解読されたデブロッキングフィルタ制御フラグ２４の指示に基づいてデブロッキングフィルタ２６を暫定復号画像１５に対して作用させ、最終的な復号画像２７を得る。

４．復号装置におけるイントラ予測復号処理
本実施の形態２の復号装置の特徴であるイントラ予測画像生成処理について詳述する。本処理は上記３つの色成分をまとめたマクロブロックの単位で実施され、主として、図１２の復号装置における可変長復号部２５、空間予測部２によって行われる。また、本処理の流れを示すフローチャートを図１７に示す。

図１７のフローチャートのうち、S25〜S38は可変長復号部２５において行われる。可変長復号部２５への入力であるビデオストリーム２２は、図１５のデータ配列に従うものとする。ステップS25では図１５のデータのうちイントラ符号化モード0(34a)(C0成分対応)がまず復号される。結果、イントラ符号化モード0(34a)が「イントラＮｘＮ予測」である場合は、変換ブロックサイズ識別フラグ0(32a)とイントラ予測モード0(35a)とが復号される(ステップS26,S27)。次いで、イントラ符号化モード共通化識別フラグ３３の状態に基づき、イントラ符号化・予測モード情報が全色成分で共通と判断された場合は、イントラ符号化モード0(34a)、変換ブロックサイズ識別フラグ0(32a)、イントラ予測モード0(35a)を、C1およびC2成分で用いる符号化情報として設定する(ステップS29、S30)。図１７はマクロブロック単位の処理を図示しており、ステップS29の判断に用いるイントラ符号化モード共通化識別フラグ３３は、図１７のSTARTのプロセスに入る前に、スライス以上のレイヤレベルで可変長復号部２５によってビットストリーム２２から読み出されているものとする。

図１７におけるステップS29にてイントラ符号化・予測モード情報が各色成分ごとに符号化と判断された場合は、続くステップS31〜S38のプロセスにおいて、C1およびC2成分用のイントラ符号化・予測モード情報を復号する。以上の処理過程を経て各色成分の符号化モード６が確定し、これを空間予測部２へ出力して、ステップS39〜S41にしたがって各色成分のイントラ予測画像を得る。イントラ予測画像を得るプロセスは図３、図４、図１３の手順に従うもので図１１の符号化装置で行う処理と同じである。

なお、前述のように、イントラ符号化モード共通化識別フラグ３３の情報は、符号化装置と復号装置の双方であらかじめ何らかの手段で既知となっていれば、復号装置は、ビデオのビットストリーム中からその値を解析するのでなく、例えばあらかじめ固定の値で復号を行うように構成してもよいし、ビデオのビットストリームとは別に伝送してもよい。

従来の映像符号化標準で採用されてきた４：２：０フォーマットでは、色空間の定義がY、Cb、Crに固定されていたが、４：４：４フォーマットではY、Cb、Crに限定せず多様な色空間を利用することができる。図１５や図１６のようにイントラマクロブロックの符号化情報を構成することで、入力映像信号１の色空間の定義や映像信号の性質に応じて最適な符号化処理を行えるとともに、かような符号化処理の結果得られるビットストリームを一意に解釈して映像復号再生処理を行うことができる。

実施の形態３．
本実施の形態３では、図１１の符号化装置、図１２の復号装置の別の構成例を示す。本符号化装置、復号装置は実施の形態１と同様、非特許文献１であるMPEG-4 AVC(ISO/IEC 14496-10)/ITU-T H.264規格で採用される符号化方式をベースとして、本発明に固有の特徴を付与したものとする。本実施の形態３における映像符号化装置は、図１１で説明した実施の形態２の符号化装置のうち、可変長符号化部１１のみが異なる。本実施の形態３における映像復号装置は、図１２で説明した実施の形態２の復号装置のうち、可変長復号部２５のみが異なる。他は実施の形態２と同様の動作とし、ここでは差異部分のみを説明する。

１．符号化装置におけるイントラ予測モード情報の符号化手順
実施の形態２の符号化装置においては、その可変長符号化部１１では、イントラＮｘＮ予測モードの情報について、ビットストリーム上のデータ配列は示したが、特にその符号化手順を示さなかった。本実施の形態では、その符号化手順の具体的な方法を示す。本実施の形態では特に、イントラＮｘＮ予測モードの値が色成分間で高い相関を有する場合を考慮し、各色成分で得られたイントラＮｘＮ予測モードについて、色成分間での値の相関を利用したエントロピー符号化を行う点に特徴がある。

以下の説明では、図１６の形式のビットストリーム配列を前提とする。また、説明の簡略化のため、イントラ符号化モード共通化識別フラグ３３の値は、イントラ符号化モードをC0、C1、C2で共通化する、と設定し、イントラ符号化モードをイントラＮｘＮ予測モード、変換ブロックサイズ0〜2を４ｘ４ブロックであるとする。この際、イントラ予測モード0〜2(35a〜35c)はすべてイントラ４ｘ４予測モードになる。図１８〜図２０において、符号化の対象となるカレントマクロブロックはＸとする。また、その左隣のマクロブロックはマクロブロックＡ、真上のマクロブロックをマクロブロックＢとする。

C0、C1、C2の各色成分の符号化手順の説明図として、図１８〜図２０を用いる。また、手順のフローチャートを図２１、図２２に示す。

図１８はマクロブロックＸのC0成分の様子を示している。ここで、符号化対象の４ｘ４ブロックをブロックＸ、ブロックＸの左、上の４ｘ４ブロックをそれぞれブロックＡ、ブロックＢと呼ぶこととする。マクロブロックＸのうち、符号化対象の４ｘ４ブロックの位置に応じて２つのケースがある。Case１は、符号化対象の４ｘ４ブロックに対して、その左、上の４ｘ４ブロックがカレントマクロブロックＸの外、すなわち、マクロブロックＡないしはマクロブロックＢに属する場合である。Case２は、符号化対象の４ｘ４ブロックに対して、その左、上の４ｘ４ブロックがカレントマクロブロックＸの内部、すなわち、マクロブロックＸに属する場合である。いずれに場合にせよ、イントラ４ｘ４予測モードはマクロブロックＸ内の個々の４ｘ４ブロックＸに対して１つずつ割り当てられ、これをCurrIntraPredModeとする。また、ブロックＡのイントラ４ｘ４予測モードをIntraPredModeA、ブロックＢのイントラ４ｘ４予測モードをIntraPredModeBとする。IntraPredModeA、IntraPredModeBはともに、ブロックＸを符号化する時点ではすでに符号化済みの情報である。あるブロックＸのイントラ４ｘ４予測モードを符号化するにあたり、まずこれらのパラメータの割り当てを行う(図２１におけるステップS50)。

次に、ブロックＸのCurrIntraPredModeに対する予測値 predCurrIntraPredMode を下式で定める(ステップS51)。
predCurrIntraPredMode = Min( IntraPredModeA, IntraPredModeB )

次に、C0成分のCurrIntraPredMode の符号化を行う。ここでは、CurrIntraPredMode = predCurrIntraPredModeならば、予測値と同じであることを示す１ビットのフラグ(prev_intra_pred_mode_flag)を符号化する。CurrIntraPredMode != predCurrIntraPredModeならば、CurrIntraPredModeとpredCurrIntraPredModeを比較してCurrIntraPredModeのほうが小さい場合、CurrIntraPredModeをそのまま符号化する。CurrIntraPredModeのほうが大きい場合、CurrIntraPredMode-1を符号化する(ステップS52)。

if(CurrIntraPredMode == predCurrIntraPredMode)
{
prev_intra_pred_mode_flag = 1;
}
else
{
prev_intra_pred_mode_flag = 0;
if( CurrIntraPredMode < predCurrIntraPredMode)
rem_intra_pred_mode = CurrIntraPredMode;
else
rem_intra_pred_mode = CurrIntraPredMode - 1;
}
Encode prev_intra_pred_mode_flag;
If(prev_intra_pred_mode_flag == 0)
Encode rem_intra_pred_mode;

次に、図１９により、C1成分の符号化手順を示す。まず、C0成分と同様、ブロックＸの位置に応じて、IntraPredModeA、IntraPredModeBなどの近傍の符号化パラメータを設定する(ステップS53)。

次に、ブロックＸのCurrIntraPredModeに対する予測値候補１ predCurrIntraPredMode1 を下式で定める(ステップS54)。
predCurrIntraPredMode1 = Min( IntraPredModeA, IntraPredModeB )

もしC0成分において、prev_intra_pred_mode_flag＝1ならば、このpredCurrIntraPredMode1をそのままC1成分のブロックXにおける predCurrIntraPredMode に採用する。これは以下の理由による。C0成分の同一ブロック位置でprev_intra_pred_mode_flag＝1が採用されたということは、C0成分においては近傍画像領域において予測モード間の相関が高かったことを意味している。C0成分とC1成分の間でテクスチャ構造の相関を除去し切れていないRGB信号などの場合においては、このような場合、C1成分においてもC0成分と同様、近傍画像領域間に相関が高い可能性がある。したがって、C1成分の予測値はC0成分のイントラ４ｘ４予測モードに依存しないと判断する。

一方、C0成分において、prev_intra_pred_mode_flag＝0、すなわち、rem_intra_pred_modeを符号化した場合(ステップS55)は、C0成分の CurrIntraPredMode を予測値候補２とする(ステップS56)。すなわち、
predCurrIntraPredMode2 = CurrIntraPredMode_C0
これを予測値候補とする背景は以下の通りである。C0成分でrem_intra_pred_modeを符号化するということは、C0成分においては近傍画像領域間でのイントラ予測の相関が低いことを意味する。その場合、C1成分でも同様に近傍画像領域間での相関が低いことが予想され、異なる色成分における同一ブロック位置のイントラ予測モードのほうが、よりよい予測値を与える可能性がある。

C1成分のブロックＸにおける CurrIntraPredMode の予測値は最終的に、predCurrIntraPredMode1か、predCurrIntraPredMode2のどちらか一方の値として定める(ステップS57)。どちらの値を用いるかは１ビットのフラグ(pred_flag)で追加符号化する。ただし、pred_flagは、CurrIntraPredModeが予測値に一致するときだけ符号化し、一致しない場合（rem_intra_pred_modeを符号化する場合）予測値はpredCurrIntraPredMode1を用いる。

以上の手順を式で記載すると

if( prev_intra_pred_mode_flag_C0 == 1 )
{
predCurrIntraPredMode = Min( IntraPredModeA, IntraPredModeB );
}
else
{
predCurrIntraPredMode1 = Min( IntraPredModeA, IntraPredModeB );
predCurrIntraPredMode2 = CurrIntraPredMode_C0;
if( CurrIntraPredMode == predCurrIntraPredMode1 )
{
prev_intra_pred_mode_flag = 1;
pred_flag = 0; // 予測値候補１を使う
}
else if(CurrIntraPredMode == predCurrIntraPredMode2 )
{
prev_intra_pred_mode_flag = 1;
pred_flag = 1; // 予測値候補２を使う
}
else
{
prev_intra_pred_mode_flag = 0;
if( CurrIntraPredMode < predCurrIntraPredMode1 )
rem_intra_pred_mode = CurrIntraPredMode;
else
rem_intra_pred_mode = CurrIntraPredMode - 1;
}
}
Encode prev_intra_pred_mode_flag ;
if(prev_intra_pred_mode_flag == 1)
Encode pred_flag;
else // If(prev_intra_pred_mode_flag == 0)
Encode rem_intra_pred_mode ;

となる。結果、prev_intra_pred_mode_flag、pred_flag、rem_intra_pred_modeが符号化データとして符号化される(ステップS58)。

次に、図２０により、C2成分の符号化手順を示す。まず、C0、C1成分と同様、ブロックＸの位置に応じて、IntraPredModeA、IntraPredModeBなどの近傍の符号化パラメータを設定する(ステップS59)。

次に、ブロックＸのCurrIntraPredModeに対する予測値候補１ predCurrIntraPredMode1 を下式で定める(ステップS60)。
predCurrIntraPredMode1 = Min( IntraPredModeA, IntraPredModeB )

もしC0、C1成分の両方において、prev_intra_pred_mode_flag＝1ならば、このpredCurrIntraPredMode1をそのままC1成分のブロックＸにおける predCurrIntraPredMode に採用する。これは以下の理由による。C0、C1成分の同一ブロック位置でprev_intra_pred_mode_flag＝1が採用されたということは、C0、C1成分においては近傍画像領域において予測モード間の相関が高かったことを意味している。C0、C1成分とC2成分の間でテクスチャ構造の相関を除去し切れていないRGB信号などの場合においては、このような場合、C2成分においてもC0、C1成分と同様、近傍画像領域間に相関が高い可能性がある。したがって、C2成分の予測値はC0、C1成分のイントラ４ｘ４予測モードに依存しないと判断する。

一方、C0ないしはC1成分において、prev_intra_pred_mode_flag＝0、すなわち、rem_intra_pred_modeを符号化した場合(ステップS61)は、C0ないしはC1成分の CurrIntraPredMode を予測値候補２とする(ステップS62)。すなわち、
If( prev_intra_pred_mode_flag_C0 == 0 && pred_intra_pred_mode_flag_C1 == 1 )
predCurrIntraPredMode2 = CurrIntraPredMode_C0;
else if(prev_intra_pred_mode_flag_C0 == 1 && pred_intra_pred_mode_flag_C1 == 0 )predCurrIntraPredMode2 = CurrIntraPredMode_C1;
else
predCurrIntraPredMode2 = CurrIntraPredMode_C1;
これを予測値候補とする背景は以下の通りである。C0ないしはC1成分でrem_intra_pred_modeを符号化するということは、C0ないしはC1成分においては近傍画像領域間でのイントラ予測の相関が低いことを意味する。その場合、C2成分でも同様に近傍画像領域間での相関が低いことが予想され、異なる色成分における同一ブロック位置のイントラ予測モードのほうが、よりよい予測値を与える可能性がある。また、この考え方によれば、C0、C1成分ともにrem_intra_pred_modeを符号化する場合には、C0、C1の両方のカレントイントラ予測モードが予測値の候補となりうるが、ここでは、C1成分のカレントイントラ予測モードを予測値として採用する。その理由は、YUV色空間が入力される場合、C0は輝度、C1/C2は色差として扱われる可能性が高く、その場合、C0よりもC1のほうがよりC2の予測モードに近いと考えられるからである。RGB色空間入力の場合においては、C0を選ぶかC1を選ぶかはそれほど大きなファクタにはならず、一般的にC1成分を予測値に採用するのは妥当と考えられる（設計によりC2成分を予測値に採用してもよい）。

C2成分のブロックＸにおける CurrIntraPredMode の予測値は最終的に、predCurrIntraPredMode1か、predCurrIntraPredMode2のどちらか一方の値として定める(ステップS63)。どちらの値を用いるかは１ビットのフラグ(pred_flag)で追加符号化する。

以上の手順を式で記載すると

If( prev_intra_pred_mode_flag_C0 == 1 && prev_intra_pred_mode_flag == 1 )
{
predCurrIntraPredMode = Min( IntraPredModeA, IntraPredModeB );
}
else
{
predCurrIntraPredMode1 = Min( IntraPredModeA, IntraPredModeB );
If( prev_intra_pred_mode_flag_C0 == 0 && pred_intra_pred_mode_flag_C1 == 1 )
predCurrIntraPredMode2 = CurrIntraPredMode_C0;
else if(prev_intra_pred_mode_flag_C0 == 1 && pred_intra_pred_mode_flag_C1 == 0 )predCurrIntraPredMode2 = CurrIntraPredMode_C1;
else
predCurrIntraPredMode2 = CurrIntraPredMode_C1;
if( CurrIntraPredMode == predCurrIntraPredMode1 )
{
prev_intra_pred_mode_flag = 1;
pred_flag = 0; // 予測値候補１を使う
}
else if(CurrIntraPredMode == predCurrIntraPredMode2 )
{
prev_intra_pred_mode_flag = 1;
pred_flag = 1; // 予測値候補２を使う
}
else
{
prev_intra_pred_mode_flag = 0;
if( CurrIntraPredMode < predCurrIntraPredMode1 )
rem_intra_pred_mode = CurrIntraPredMode;
else
rem_intra_pred_mode = CurrIntraPredMode - 1;
}
}
Encode prev_intra_pred_mode_flag ;
if(prev_intra_pred_mode_flag == 1)
Encode pred_flag;
else // If(prev_intra_pred_mode_flag == 0)
Encode rem_intra_pred_mode ;

となる。結果、prev_intra_pred_mode_flag、pred_flag、rem_intra_pred_modeが符号化データとして符号化される(ステップS64)。

以上のべた符号化手順は、イントラ８ｘ８予測モードに対しても同様に定義できる。イントラＮｘＮ予測モードをこのような手順で符号化することにより、他の色成分において選択される予測モードとの間の相関を利用することができ、予測モード自体の符号量を削減して、符号化効率を向上することができる。

図２１と図２２の違いは、MBあたりのイントラ予測モードの符号化処理を各色成分ごとに分離して行うか、まとめて行うかの違いである。図２１の場合は４ｘ４ブロックの単位で各色成分の符号化が行われ、それらを16パターン集めたものがビットストリームに配列される（ステップS65）。図２２の場合は、各色成分の16個の４ｘ４ブロックがまとめて符号化され、それを色成分別にビットストリームに配列した形態になる（ステップS66、S67、S68）。

なお、上記述べた手順では、pred_flag は、prev_intra_pred_mode_flag が１のときのみ有効な情報としているが、prev_intra_pred_mode_flag が0の場合も包含するように定めてもよい。すなわち、例えば、C1成分の例をとると、

If( prev_intra_pred_mode_flag_C0 == 1 )
{
predCurrIntraPredMode = Min( IntraPredModeA, IntraPredModeB );
if( CurrIntraPredMode == predCurrIntraPredMode )
{
prev_intra_pred_mode_flag = 1;
}
Else{
if( CurrIntraPredMode < predCurrIntraPredMode )
rem_intra_pred_mode = CurrIntraPredMode;
else
rem_intra_pred_mode = CurrIntraPredMode - 1;
}
}
else
{
predCurrIntraPredMode1 = Min( IntraPredModeA, IntraPredModeB );
predCurrIntraPredMode2 = CurrIntraPredMode_C0;

if( CurrIntraPredMode == predCurrIntraPredMode1 )
{
prev_intra_pred_mode_flag = 1;
pred_flag = 0; // 予測値候補１を使う
}
else if(CurrIntraPredMode == predCurrIntraPredMode2 )
{
prev_intra_pred_mode_flag = 1;
pred_flag = 1; // 予測値候補２を使う
}
else
{
prev_intra_pred_mode_flag = 0;
if( | CurrIntraPredMode - predCurrIntraPredMode1 | <
| CurrIntraPredMode predCurrIntraPredMode2 | )
{
pred_flag = 0;
predCurrIntraPredMode = predCurrIntraPredMode1;
}
Else
{
pred_flag = 1;
predCurrIntraPredMode = predCurrIntraPredMode2;
}
if( CurrIntraPredMode < predCurrIntraPredMode )
rem_intra_pred_mode = CurrIntraPredMode;
else
rem_intra_pred_mode = CurrIntraPredMode - 1;
}
}
Encode prev_intra_pred_mode_flag ;
If(prev_intra_pred_mode_flag_C0 == 0)
Encode pred_flag;
If(prev_intra_pred_mode_flag == 0)
Encode rem_intra_pred_mode ;

のような手順で符号化するように構成してもよい。この方法では、C0成分の同一位置のブロックにおけるイントラ予測モードにおいてrem_intra_pred_modeを符号化する場合には常時pred_flagを符号化することになるが、prev_intra_pred_mode_flag = 0の場合でもより精度のよい予測値を使用することができ、符号化効率の改善が期待できる。また、さらに進めて、C0成分の同一位置のブロックにおけるイントラ予測モードにおいてrem_intra_pred_modeを符号化するかどうかに依存せず、pred_flagを符号化するように構成してもよい。この場合は常時C0成分のイントラ予測モードを予測値候補として使用することになる。

すなわち、この場合の式は以下のようになる。

predCurrIntraPredMode1 = Min( IntraPredModeA, IntraPredModeB );
predCurrIntraPredMode2 = CurrIntraPredMode_C0;

if( CurrIntraPredMode == predCurrIntraPredMode1 )
{
prev_intra_pred_mode_flag = 1;
pred_flag = 0; // 予測値候補１を使う
}
else if(CurrIntraPredMode == predCurrIntraPredMode2 )
{
prev_intra_pred_mode_flag = 1;
pred_flag = 1; // 予測値候補２を使う
}
else
{
prev_intra_pred_mode_flag = 0;
if( | CurrIntraPredMode - predCurrIntraPredMode1 | <
| CurrIntraPredMode predCurrIntraPredMode2 | )
{
pred_flag = 0;
predCurrIntraPredMode = predCurrIntraPredMode1;
}
Else
{
pred_flag = 1;
predCurrIntraPredMode = predCurrIntraPredMode2;
}
if( CurrIntraPredMode < predCurrIntraPredMode )
rem_intra_pred_mode = CurrIntraPredMode;
else
rem_intra_pred_mode = CurrIntraPredMode - 1;
}
Encode prev_intra_pred_mode_flag ;
Encode pred_flag;
If(prev_intra_pred_mode_flag == 0)
Encode rem_intra_pred_mode ;

なお、pred_flag は、４ｘ４ブロック単位でなく、マクロブロックやシーケンスの単位で設定するようにしてもよい。マクロブロック単位で設定する場合は、マクロブロック内のすべての４ｘ４ブロックについて、予測値候補１ないしは予測値候補２のどちらを使うかを共通化するので、pred_flagとして伝送するオーバヘッド情報をさらに削減できる。また、入力色空間定義に応じて予測値候補１ないしは予測値候補２のどちらを使うかを定めるために、シーケンスの単位で定めるようにすることもできる。この場合はマクロブロックごとにもpred_flagを伝送する必要がなくなり、さらにオーバヘッド情報を削減できる。

２．復号装置におけるイントラ予測モード情報の復号手順
実施の形態２の復号装置においては、その可変長復号部２５では、イントラＮｘＮ予測モードの情報について、ビットストリーム上のデータ配列は示したが、特にその復号手順を示さなかった。本実施の形態３では、その復号手順の具体的な方法を示す。本実施の形態３では特に、イントラＮｘＮ予測モードの値が色成分間で高い相関を有する場合を考慮し、各色成分で得られたイントラＮｘＮ予測モードについて、色成分間での値の相関を利用したエントロピー符号化が行われたビットストリームを復号する点に特徴がある。

以下の説明では、図１６の形式のビットストリーム配列を前提とする。また、説明をイントラ予測モードの復号手順に限定するため、ビットストリーム中のイントラ符号化モード共通化識別フラグ３３の値は、イントラ符号化モードをC0、C1、C2で共通化する、と設定されているものとする。また、イントラ符号化モードはイントラＮｘＮ予測モード、変換ブロックサイズ0〜2は４ｘ４ブロックが指定されているものとする。この際、イントラ予測モード0〜2(35a〜35c)はすべてイントラ４ｘ４予測モードになる。符号化装置と同様、復号装置においても、図１８〜図２０の関係を用いる。復号装置では、復号の対象となるカレントマクロブロックをＸとする。また、その左隣のマクロブロックはマクロブロックＡ、真上のマクロブロックをマクロブロックＢとする。復号手順のフローチャートを図２３に示す。図２３において、図２１、図２２と同じ番号を付与したステップは符号化装置の処理と同じ処理を実行することを示す。

図１８はマクロブロックＸのC0成分の様子を示している。マクロブロックＸのうち、復号対象の４ｘ４ブロックの位置に応じて２つのケースがある。Case１は、復号対象の４ｘ４ブロックに対して、その左、上の４ｘ４ブロックがカレントマクロブロックＸの外、すなわち、マクロブロックＡないしはマクロブロックＢに属する場合である。Case２は、復号対象の４ｘ４ブロックに対して、その左、上の４ｘ４ブロックがカレントマクロブロックＸの内部、すなわち、マクロブロックＸに属する場合である。ここで、復号対象の４ｘ４ブロックをブロックＸ、ブロックＸの左、上の４ｘ４ブロックをそれぞれブロックＡ、ブロックＢと呼ぶこととする。いずれに場合にせよ、イントラ４ｘ４予測モードはマクロブロックＸ内の個々の４ｘ４ブロックＸに対して１つずつ割り当てられ、これをCurrIntraPredModeとする。また、ブロックＡのイントラ４ｘ４予測モードをIntraPredModeA、ブロックＢのイントラ４ｘ４予測モードをIntraPredModeBとする。IntraPredModeA、IntraPredModeBはともに、ブロックＸを符号化する時点ではすでに復号済みの情報である。あるブロックＸのイントラ４ｘ４予測モードを復号するにあたり、まずこれらのパラメータの割り当てを行う(ステップS50)。

次に、CurrIntraPredMode = predCurrIntraPredModeであるかどうかを示す１ビットのフラグ(prev_intra_pred_mode_flag)を復号する。prev_intra_pred_mode_flag = 1は、CurrIntraPredMode = predCurrIntraPredModeであることを意味する。さもなくば(prev_intra_pred_mode_flag = 0)、rem_intra_pred_mode の情報をビットストリーム中から復号する。rem_intra_pred_mode とpredCurrIntraPredModeを比較してrem_intra_pred_modeの方が小さい場合、CurrIntraPredMode = rem_intra_pred_modeとする。CurrIntraPredModeの方が大きい場合、CurrIntraPredMode = rem_intra_pred_mode ＋1とする(ステップS65)。

これらの手順をまとめると以下のようになる。

predCurrIntraPredMode = Min( IntraPredModeA, IntraPredModeB );
Decode prev_intra_pred_mode_flag;
if(prev_intra_pred_mode_flag == 1)
{
CurrIntraPredMode == predCurrIntraPredMode;
}
else
{
Decode rem_intra_pred_mode;
if(rem_intra_pred_mode < predCurrIntraPredMode )
CurrIntraPredMode = rem_intra_pred_mode;
else
CurrIntraPredMode = rem_intra_pred_mode + 1;
}

次に、図１９により、C1成分の復号手順を示す。まず、C0成分と同様、ブロックＸの位置に応じて、IntraPredModeA、IntraPredModeBなどの近傍の符号化パラメータを設定する(ステップS53)。

もしC0成分において、prev_intra_pred_mode_flag＝1ならば、このpredCurrIntraPredMode1をそのままC1成分のブロックＸにおける predCurrIntraPredMode に採用する。これは符号化装置において説明した理由と同様である。

一方、C0成分において、prev_intra_pred_mode_flag＝0、すなわち、rem_intra_pred_modeを復号した場合(ステップS55)は、C0成分の CurrIntraPredMode を予測値候補２とする(ステップS56)。すなわち、
predCurrIntraPredMode2 = CurrIntraPredMode_C0
これを予測値候補とする背景も符号化装置において説明した理由と同様である。

C1成分のブロックＸにおける CurrIntraPredMode の予測値は最終的に、predCurrIntraPredMode1か、predCurrIntraPredMode2のどちらか一方の値として定める(ステップS57)。どちらの値を用いるかは１ビットのフラグ(pred_flag)を復号して定める。ただし、pred_flagは、CurrIntraPredModeが予測値に一致するときだけ復号し、一致しない場合（rem_intra_pred_modeを復号する場合）予測値はpredCurrIntraPredMode1を用いる。

予測値候補１、予測値候補２、prev_intra_pred_mode_flag、pred_flag、rem_intra_pred_modeが与えられた上で、以下の手順により、CurrIntraPredModeを復号する(ステップS66)。

if( prev_intra_pred_mode_flag_C0 == 1 )
{
pred_flag = 0; // このときはpred_flagはビットストリームには含まれない
predCurrIntraPredMode = Min( IntraPredModeA, IntraPredModeB );
Decode prev_intra_pred_mode_flag;
if(prev_intra_pred_mode_flag == 1)
{
CurrIntraPredMode == predCurrIntraPredMode;
}
else
{
Decode rem_intra_pred_mode;
if(rem_intra_pred_mode < predCurrIntraPredMode )
CurrIntraPredMode = rem_intra_pred_mode;
else
CurrIntraPredMode = rem_intra_pred_mode + 1;
}
}
else
{
predCurrIntraPredMode1 = Min( IntraPredModeA, IntraPredModeB );
predCurrIntraPredMode2 = CurrIntraPredMode_C0;
Decode prev_intra_pred_mode_flag;
if(prev_intra_pred_mode_flag == 1)
{
Decode pred_flag;
If( pred_flag == 0 )
predCurrIntraPredMode = predCurrIntraPredMode1;
Else
predCurrIntraPredMode = predCurrIntraPredMode2;
CurrIntraPredMode == predCurrIntraPredMode;
}
else
{
predCurrIntraPredMode = predCurrIntraPredMode1;
Decode rem_intra_pred_mode;
if(rem_intra_pred_mode < predCurrIntraPredMode )
CurrIntraPredMode = rem_intra_pred_mode;
else
CurrIntraPredMode = rem_intra_pred_mode + 1;
}
}

次に、図２０により、C2成分の復号手順を示す。まず、C0、C1成分と同様、ブロックＸの位置に応じて、IntraPredModeA、IntraPredModeBなどの近傍の符号化パラメータを設定する(ステップS59)。

もしC0、C1成分の両方において、prev_intra_pred_mode_flag＝1ならば、このpredCurrIntraPredMode1をそのままC1成分のブロックＸにおける predCurrIntraPredMode に採用する。これは符号化装置において説明した理由と同様である。

一方、C0ないしはC1成分において、prev_intra_pred_mode_flag＝0、すなわち、rem_intra_pred_modeを復号した場合(ステップS61)は、C0ないしはC1成分の CurrIntraPredMode を予測値候補２とする(ステップS62)。

すなわち、
If( prev_intra_pred_mode_flag_C0 == 0 && pred_intra_pred_mode_flag_C1 == 1 )
predCurrIntraPredMode2 = CurrIntraPredMode_C0;
else if(prev_intra_pred_mode_flag_C0 == 1 && pred_intra_pred_mode_flag_C1 == 0 )predCurrIntraPredMode2 = CurrIntraPredMode_C1;
else
predCurrIntraPredMode2 = CurrIntraPredMode_C1;
これを予測値候補とする背景も符号化装置において説明した理由と同様である。

C2成分のブロックＸにおける CurrIntraPredMode の予測値は最終的に、predCurrIntraPredMode1か、predCurrIntraPredMode2のどちらか一方の値として定める(ステップS63)。どちらの値を用いるかは１ビットのフラグ(pred_flag)を復号して定める。ただし、pred_flagは、CurrIntraPredModeが予測値に一致するときだけ復号し、一致しない場合（rem_intra_pred_modeを復号する場合）は、予測値はpredCurrIntraPredMode1を用いる。

予測値候補１、予測値候補２、prev_intra_pred_mode_flag、pred_flag、rem_intra_pred_modeが与えられた上で、以下の手順により、CurrIntraPredModeを復号する(ステップS71)。

if(prev_intra_pred_mode_flag_C0 == 1 && prev_intra_pred_mode_flag_C1 == 1 )
{
pred_flag = 0; // このときはpred_flagはビットストリームには含まれない
predCurrIntraPredMode = Min( IntraPredModeA, IntraPredModeB );
Decode prev_intra_pred_mode_flag;
if(prev_intra_pred_mode_flag == 1)
{
CurrIntraPredMode == predCurrIntraPredMode;
}
else
{
Decode rem_intra_pred_mode;
if(rem_intra_pred_mode < predCurrIntraPredMode )
CurrIntraPredMode = rem_intra_pred_mode;
else
CurrIntraPredMode = rem_intra_pred_mode + 1;
}
}
else
{
predCurrIntraPredMode1 = Min( IntraPredModeA, IntraPredModeB );
If( prev_intra_pred_mode_flag_C0 == 0 && pred_intra_pred_mode_flag_C1 == 1 )
predCurrIntraPredMode2 = CurrIntraPredMode_C0;
else if(prev_intra_pred_mode_flag_C0 == 1 && pred_intra_pred_mode_flag_C1 == 0 )predCurrIntraPredMode2 = CurrIntraPredMode_C1;
else
predCurrIntraPredMode2 = CurrIntraPredMode_C1;
Decode prev_intra_pred_mode_flag;
if(prev_intra_pred_mode_flag == 1)
{
Decode pred_flag;
If( pred_flag == 0 )
predCurrIntraPredMode = predCurrIntraPredMode1;
Else
predCurrIntraPredMode = predCurrIntraPredMode2;
CurrIntraPredMode == predCurrIntraPredMode;
}
else
{
predCurrIntraPredMode = predCurrIntraPredMode1;
Decode rem_intra_pred_mode;
if(rem_intra_pred_mode < predCurrIntraPredMode )
CurrIntraPredMode = rem_intra_pred_mode;
else
CurrIntraPredMode = rem_intra_pred_mode + 1;
}
}

以上のべた復号手順は、イントラ８ｘ８予測モードに対しても同様に定義できる。イントラＮｘＮ予測モードをこのような手順で復号することにより、他の色成分において選択される予測モードとの間の相関を利用して、予測モード自体の符号量を削減し、符号化効率を向上させたビットストリームを復号することができる。

なお、上記述べた手順では、pred_flag は、prev_intra_pred_mode_flag が１となっている場合にのみ復号される情報としているが、prev_intra_pred_mode_flag が０の場合も包含する情報として復号するようにしてもよい。

すなわち、例えば、C1成分の例をとると、

if( prev_intra_pred_mode_flag_C0 == 1 )
{
predCurrIntraPredMode = Min( IntraPredModeA, IntraPredModeB );
Decode prev_intra_pred_mode_flag;
if(prev_intra_pred_mode_flag == 1)
{
CurrIntraPredMode == predCurrIntraPredMode;
}
else
{
Decode rem_intra_pred_mode;
if(rem_intra_pred_mode < predCurrIntraPredMode )
CurrIntraPredMode = rem_intra_pred_mode;
else
CurrIntraPredMode = rem_intra_pred_mode + 1;
}
}
else
{
predCurrIntraPredMode1 = Min( IntraPredModeA, IntraPredModeB );
predCurrIntraPredMode2 = CurrIntraPredMode_C0;
Decode prev_intra_pred_mode_flag;
Decode pred_flag;
If( pred_flag == 0 )
predCurrIntraPredMode = predCurrIntraPredMode1;
Else
predCurrIntraPredMode = predCurrIntraPredMode2;

if(prev_intra_pred_mode_flag == 1)
{
CurrIntraPredMode == predCurrIntraPredMode;
}
else
{
Decode rem_intra_pred_mode;
if(rem_intra_pred_mode < predCurrIntraPredMode )
CurrIntraPredMode = rem_intra_pred_mode;
else
CurrIntraPredMode = rem_intra_pred_mode + 1;
}
}

のような手順で復号するように構成してもよい。この方法の効果は対応する符号化装置側での符号化手順の記載中に述べたとおりである。また、さらに進めて、C0成分の同一位置のブロックにおけるイントラ予測モードにおいてrem_intra_pred_modeを復号するかどうかに依存せず、pred_flagを復号するように構成してもよい。この場合は常時C0成分のイントラ予測モードを予測値候補として使用することになる。

すなわち、

predCurrIntraPredMode1 = Min( IntraPredModeA, IntraPredModeB );
predCurrIntraPredMode2 = CurrIntraPredMode_C0;
Decode prev_intra_pred_mode_flag;
Decode pred_flag;
If( pred_flag == 0 )
predCurrIntraPredMode = predCurrIntraPredMode1;
Else
predCurrIntraPredMode = predCurrIntraPredMode2;

if(prev_intra_pred_mode_flag == 1)
{
CurrIntraPredMode == predCurrIntraPredMode;
}
else
{
Decode rem_intra_pred_mode;
if(rem_intra_pred_mode < predCurrIntraPredMode )
CurrIntraPredMode = rem_intra_pred_mode;
else
CurrIntraPredMode = rem_intra_pred_mode + 1;
}

となる。

なお、符号化装置の説明で述べたように、pred_flag は、４ｘ４ブロック単位でなく、マクロブロックやシーケンスの単位でビットストリームに含まれていてもよい。マクロブロック単位で設定する場合は、マクロブロック内のすべての４ｘ４ブロックについて、予測値候補１ないしは予測値候補２のどちらを使うかを共通化するので、復号するpred_flagのオーバヘッド情報が削減される。また、入力色空間定義に応じて予測値候補１ないしは予測値候補２のどちらを使うかを定めるために、シーケンスの単位で定めるようにすることもできる。この場合はマクロブロックごとにもpred_flagを伝送する必要がなくなり、さらにオーバヘッド情報を削減される。

実施の形態４．
実施の形態２にて図１６の形式のビットストリームについて説明した。実施の形態２では、イントラ符号化モードが「イントラNxN予測」を示している場合、変換ブロックサイズ識別フラグ0〜2(32a〜32c)の値に応じて、C0、C1、C2各色成分のイントラ予測モードがイントラ4x4予測モードか、イントラ8x8予測モードと認識されることを述べた。本実施の形態４では、このビットストリーム配列を変更して図２４に示すように、C1、C2成分について、イントラ予測モード指示フラグ１、２(36a,36b)をシーケンスレベルで伝送するように構成する。イントラ予測モード指示フラグは、イントラ符号化モードにおいてイントラNxN予測モードが選択される場合で、かつ変換ブロックサイズ識別フラグが4x4変換を指示している場合、すなわちイントラ4x4予測モードの場合に有効であって、この値に応じて、以下の２つの状態を切り替えることを可能とする。
状態１：C1ないしはC2成分に対しても、使用するイントラ4x4予測モードは図３の９つから個別に選択し符号化する。
状態２：C1ないしはC2成分に対しては、使用するイントラ4x4予測モードをDC予測、つまり図３のintra4x4_pred_mode = 2に限定し、イントラ予測モード情報を符号化しない。

例えば、Y、Cb、Crのような色空間で符号化を行う場合で、HDTV以上などの高解像度映像の場合、4x4ブロックはきわめて小さい画像領域に対応する。このとき、特にCb、Cr成分といった画像のテクスチャ構造を保持していない成分に対して９つもの予測モードを選択する余地を与えるよりも、予測モード情報自体を１つに固定化してオーバヘッドとなる予測モード情報を伝送しないほうが効率的な場合がある。このようなビットストリーム配列を行うことによって、入力色空間の性質や映像の特性に応じた最適な符号化が可能になる。

図２４の形式のビットストリームを受ける復号装置は、可変長復号部２５においてイントラ予測モード指示フラグ(36a,36b)を復号し、その値によって、ビットストリームが状態１で符号化されているか、状態２で符号化されているかを識別するように構成しておく。これによって、C1ないしはC2成分に対して、ビットストリームからイントラ4x4予測モードを復号して使用するか、DC予測つまり図３のintra4x4_pred_mode = 2を固定的に適用するかを判断する。

また、本実施の形態４では、状態２は、C1ないしはC2成分に対して、intra4x4_pred_mode = 2に限定するとしたが、予測モード情報を１つに固定すればよく、他の予測モードでもよい。また、状態２は、C1ないしはC2成分に対して、C0と同じイントラ4x4予測モードを使用する、というように定めてもよい。この場合も、C1ないしはC2成分についてはイントラ4x4予測モードを符号化する必要がないのでオーバヘッドビットを削減できる。

実施の形態５．
本実施の形態５では、図１１の符号化装置、図１２の復号装置の別の構成例を示す。本実施の形態５における符号化装置、復号装置は上記の他の実施の形態と同様、非特許文献１であるMPEG-4 AVC(ISO/IEC 14496-10)/ITU-T H.264規格で採用される符号化方式をベースとして、本発明に固有の特徴を付与したものとする。本実施の形態５における映像符号化装置は、実施の形態２、３で説明した図１１の符号化装置の構成のうち、可変長符号化部１１の動作のみが異なる。本実施の形態５における映像復号装置は、実施の形態２、３で説明した図１２の復号装置の構成のうち、可変長復号部２５の動作のみが異なる。他は実施の形態２、３と同様の動作とし、ここでは差異部分のみを説明する。

１．符号化装置におけるイントラ予測モード情報の符号化手順
実施の形態３の符号化装置においては、その可変長符号化部１１では、図１６の形式によるビットストリームにおいて、イントラNxN予測モード情報の具体的な符号化方法について示した。本実施の形態５では、その符号化手順の別の具体的な方法を示す。本実施の形態５では特に、イントラNxN予測モードの値が画像パターンとしてのテクスチャの構造を反映することに着目し、同一色成分中の近傍画素領域内で適応的な予測を行う方法を与える点に特徴がある。以下の説明では、図１６の形式のビットストリーム配列を前提とする。また、本実施の形態５では、C0、C1、C2の各成分のイントラNxN予測モード情報の符号化は色成分ごとに独立に符号化することとして、C0成分の符号化方法をC1、C2にも同様に適用するものとし、説明の簡略化のため、C0成分についてのみ説明する。イントラ符号化モード共通化識別フラグ３３の値は、イントラ符号化モードをC0、C1、C2で共通化する、と設定し、イントラ符号化モードをイントラNxN予測モード、変換ブロックサイズ識別フラグ0〜2(32a〜32c)を4x4ブロックであるとする。この際、イントラ予測モード0〜2(35a〜35c)はすべてイントラ4x4予測モードになる。C0成分のイントラNxN予測モード情報の符号化手順の説明図として、図１８を用いる。図１８において、符号化の対象となるカレントマクロブロックはＸとする。また、その左隣のマクロブロックはマクロブロックＡ、真上のマクロブロックをマクロブロックＢとする。また、符号化手順のフローチャートを図２５に示す。

実施の形態３では、図１８において個々の4x4ブロックＸに対して１つずつ割り当てられているイントラ4x4予測モードCurrIntraPredModeに対する予測値 predCurrIntraPredMode を、IntraPredModeA, IntraPredModeBのうち小さいほうの値を一意に割り当てた。これは、現在のAVC/H.264規格でも採用されている方法であり、イントラNxN予測モードの値が大きくなるほど、予測画像生成方式が画像パターンの方向性を加味した画素補間を伴う複雑なモードになっており、一般的な画像パターンへの適合性が高いモードには小さい値が割り振られることに起因する。ビットレートが低い場合には、歪の増分よりも予測モードの符号量増分のほうがモード選択に大きな影響を及ぼすため、この方式でも全体の符号化効率にとっては有益であるが、逆に、ビットレートが比較的高い場合は、予測モードの符号量の増分よりも歪の増分のほうがモード選択に大きな影響を与えることから、かならずしもIntraPredModeA, IntraPredModeBのうち小さいほうの値が最適とはいえなくなる。このような観察に基づいて、本実施の形態５では、この予測値設定を、以下に説明するようにIntraPredModeA, IntraPredModeBの状態に応じて適応化することで予測値の精度を向上させる。この手順では、画像パターンとしてみた場合にCurrIntraPredModeをもっともよく推定できると判断される値として、IntraPredModeA, IntraPredModeBの状態をもとにpredCurrIntraPredMode を定める(ステップS73,S74,S75)。

(1)IntraPredModeA, IntraPredModeBがともに0から2の範囲にあるときは、MIN(IntraPredModeA, IntraPredModeB)をpredCurrIntraPredModeとする。
(2)IntraPredModeA, IntraPredModeBのいずれかが3以上のときで、IntraPredModeA, IntraPredModeBの予測の方向がまったく異なるとき (例：IntraPredModeAが3で、IntraPredModeBが4のとき)は、DC予測(intra4x4_pred_mode = 2) をpredCurrIntraPredModeとする。
(3)IntraPredModeA, IntraPredModeBのいずれかが3以上のときで、予測の方向が同じとき(例：IntraPredModeAが3でIntraPredModeBが7のとき（いずれも右上からの予測）)は、画素を補間する予測モード(上述の例では7)をpredCurrIntraPredModeとする。

なお、実施の形態３と同様、IntraPredModeA、IntraPredModeBなど符号化のための準備処理は事前に行っておく(ステップS50,S53,S59)。結果、predCurrIntraPredMode は、IntraPredModeA, IntraPredModeBの値から一意に導かれる。この予測値設定の規則をテーブル化したものを図２６に示す。図２６において網がけされた部分は、従来のMIN(IntraPredModeA, IntraPredModeB)の規則には従わないケースで、画像パターンの連続性からよりよい予測値が判断されるケースである。上記手順(1)では、クラス0のテーブルが使用される。(2)、(3)ではクラス１のテーブルが使用される。

以上の結果、predCurrIntraPredModeが定まった後は、実施の形態３で述べたC0成分の残りの符号化手順を実行することで符号化を完了する(ステップS52,S58,S64)。

つまり、

if(CurrIntraPredMode == predCurrIntraPredMode)
{
prev_intra_pred_mode_flag = 1;
}
else
{
prev_intra_pred_mode_flag = 0;
if( CurrIntraPredMode < predCurrIntraPredMode)
rem_intra_pred_mode = CurrIntraPredMode;
else
rem_intra_pred_mode = CurrIntraPredMode - 1;
}
Encode prev_intra_pred_mode_flag;
If(prev_intra_pred_mode_flag == 0)
Encode rem_intra_pred_mode;

となる。

以上のべた符号化手順は、イントラ8x8予測モードに対しても同様に定義できる。イントラNxN予測モードをこのような手順で符号化することにより、同一色成分の近傍画素領域における予測モードの相関をよりよく利用することができ、予測モード自体の符号量を削減して、符号化効率を向上することができる。

２．復号装置におけるイントラ予測モード情報の復号手順
実施の形態３の復号装置においては、図１６の形式によるビットストリームに対して、可変長復号部２５でのイントラNxN予測モードの情報の具体的な復号手順の一つを示した。本実施の形態５では、復号手順の別の具体的な方法を示す。本実施の形態５では特に、イントラNxN予測モードの値が画像パターンとしてのテクスチャの構造を反映することに着目し、同一色成分中の近傍画素領域内で適応的な予測を行って符号化が行われたビットストリームを復号する点に特徴がある。

以下の説明では、図１６の形式のビットストリーム配列を前提とする。また、説明の簡略化のため、ビットストリーム中のイントラ符号化モード共通化識別フラグ３３の値は、イントラ符号化モードをC0、C1、C2で共通化する、と設定されているものとする。また、イントラ符号化モードはイントラNxN予測モード、変換ブロックサイズ識別フラグ0〜2(32a〜32c)は4x4ブロックが指定されているものとする。この際、イントラ予測モード0〜2(35a〜35c)はすべてイントラ4x4予測モードになる。符号化装置と同様、復号装置においても、図１８の関係を用いてC0成分についてのみ説明する(C1、C2は同等の手順でC0とは独立に復号する)。復号装置では、復号の対象となるカレントマクロブロックをＸとする。また、その左隣のマクロブロックはマクロブロックＡ、真上のマクロブロックをマクロブロックＢとする。

実施の形態３では、符号化装置の説明にも記したように、図１８において個々の4x4ブロックＸに対して１つずつ割り当てられているイントラ4x4予測モードCurrIntraPredModeに対する予測値 predCurrIntraPredMode を、IntraPredModeA, IntraPredModeBのうち小さいほうの値を一意に割り当てた。これに対し、本実施の形態５における復号装置では、predCurrIntraPredModeを符号化手順に示した手順と全く同じ手順で、図２６のテーブルを用いて決定する。IntraPredModeA, IntraPredModeBはすでに復号されて既知であるため、符号化手順とまったく同じ処理を行うことが可能である。

その後の手順は、実施の形態３に述べたC0成分の復号手順と等価である。まとめると以下のようになる。

Decode prev_intra_pred_mode_flag;
if(prev_intra_pred_mode_flag == 1)
{
CurrIntraPredMode == predCurrIntraPredMode;
}
else
{
Decode rem_intra_pred_mode;
if(rem_intra_pred_mode < predCurrIntraPredMode )
CurrIntraPredMode = rem_intra_pred_mode;
else
CurrIntraPredMode = rem_intra_pred_mode + 1;
}

以上のべた復号手順は、イントラ8x8予測モードに対しても同様に定義できる。イントラNxN予測モードをこのような手順で復号することにより、同一色成分の近傍画素領域における予測モードの相関をよりよく利用して、予測モード自体の符号量を削減した符号化ビットストリームを復号することができる。

また、上述の例では図２６のテーブルを固定的に使用してpredCurrIntraPredModeを定めて符号化・復号を行ったが、図２６のテーブルを初期値として、IntraPredModeA, IntraPredModeBの状態に対して最も発生しやすいイントラ予測モードをpredCurrIntraPredModeとして逐次更新しながら符号化・復号するように構成してもよい。例えば、図２６の「クラス＝０、IntraPredModeA＝０、IntraPredModeB＝０、predCurrIntraPredMode＝０」なる組み合わせにおいて、上述の実施の形態ではIntraPredModeA＝０、IntraPredModeB＝０の場合には、常にpredCurrIntraPredModeを0とした。しかし、映像信号自体は非定常信号であるため、映像の内容によっては、この組み合わせが必ずしもベストである保証はない。最悪の場合、映像全体を通じて、ほとんどのケースでpredCurrIntraPredModeが予測値としてヒットしない可能性もゼロではない。したがって、例えば、IntraPredModeA＝０、IntraPredModeB＝０の場合に発生するCurrIntraPredModeの頻度をカウントしておき、CurrIntraPredModeの符号化・復号が終わるたびに、IntraPredModeA、IntraPredModeBの状態に対して最も発生頻度の高い予測モードをもってpredCurrIntraPredModeを更新するように構成する。このような構成により、CurrIntraPredModeの符号化・復号に用いる予測値を映像内容に照らして最適な値に設定することができる。

実施の形態６．
本実施の形態６では、図１１の符号化装置、図１２の復号装置の別の構成例を示す。本実施の形態６における符号化装置、復号装置は上記の他の実施の形態と同様、非特許文献１であるMPEG-4 AVC(ISO/IEC 14496-10)/ITU-T H.264規格で採用される符号化方式をベースとして、本発明に固有の特徴を付与したものとする。本実施の形態６における映像符号化装置は、実施の形態２、３、５で説明した図１１の符号化装置の構成のうち、可変長符号化部１１の動作のみが異なる。本実施の形態６における映像復号装置は、実施の形態２、３、５で説明した図１２の復号装置の構成のうち、可変長復号部２５の動作のみが異なる。他は実施の形態２、３、５と同様の動作とし、ここでは差異部分のみを説明する。

１．符号化装置におけるイントラ予測モード情報の符号化手順
実施の形態３や実施の形態５の符号化装置においては、図１６の形式によるビットストリームについて、イントラNxN予測モード情報の具体的な符号化方法について示した。本実施の形態６では、その符号化手順の別の具体的な方法を示す。本実施の形態６では特に、イントラNxN予測モードの値が画像パターンとしてのテクスチャの構造を反映することに着目し、同一色成分中の近傍画素領域内で適応的な算術符号化を行う方法を与える点に特徴がある。以下の説明では、図１６の形式のビットストリーム配列を前提とする。また、本実施の形態６では、C0、C1、C2の各成分のイントラNxN予測モード情報の符号化は色成分ごとに独立に符号化することとして、C0成分の符号化方法をC1、C2にも同様に適用するものとし、説明の簡略化のため、C0成分についてのみ説明する。イントラ符号化モード共通化識別フラグ３３の値は、イントラ符号化モードをC0、C1、C2で共通化する、と設定し、イントラ符号化モードをイントラNxN予測モード、変換ブロックサイズ識別フラグ0〜2(32a〜32c)を4x4ブロックであるとする。この際、イントラ予測モード0〜2(35a〜35c)はすべてイントラ4x4予測モードになる。C0成分のイントラNxN予測モード情報の符号化手順の説明図として、図１８を用いる。図１８において、符号化の対象となるカレントマクロブロックはXとする。また、その左隣のマクロブロックはマクロブロックA、真上のマクロブロックをマクロブロックBとする。符号化手順のフローチャートを図２７に示す。

実施の形態３、５では、図１８において個々の4x4ブロックＸに対して１つずつ割り当てられているイントラ4x4予測モードCurrIntraPredModeに対する予測値 predCurrIntraPredMode を、IntraPredModeA, IntraPredModeBのうち小さいほうの値を一意に割り当て、それと等しい場合にはprev_intra_pred_mode_flagを１としてブロックＸに対するイントラ４x４予測モードの符号化を打ち切り、異なる場合に、rem_intra_pred_modeによって符号を伝送するように構成した。本実施の形態では、IntraPredModeA, IntraPredModeBの状態を利用してCurrIntraPredMode を直接算術符号化する。この際、AVC/H.264規格に採用されているコンテクスト適応二値算術符号化に従う符号化手順を用いる。

まず、符号化対象のCurrIntraPredModeを図２８に示す形式にしたがって二値表現化する(ステップS76)。二値系列の第１ビンは、CurrIntraPredModeが縦方向予測か、横方向予測かを分類する符号になっている(図３参照)。この例では、DC予測(intra4x4_pred_mode = 2)を横方向予測に分類しているが、これは縦方向予測に分類するように構成してもよい。第２ビンは、縦方向、横方向のそれぞれで出現頻度が最も高いと考えられる予測モード値に対してTerminateビットを与える。第３ビン以降は、残存する予測モード値の中で出現頻度が高いものから順次Terminateされるように符号構成する。（図２８における二値系列構成の第２ビン以降は実際の画像データ符号化の過程でのシンボル発生確率に応じて設定されることが望ましい）

算術符号化は、二値系列の各ビンに対し、順次、使用する(0,1)生起確率テーブルを選択しながら実行する。第１ビンの符号化では、算術符号化に用いるコンテクストを以下のように定める(ステップS78)。

コンテクストA(C_A)：イントラ予測モードが縦方向予測か、横方向予測かをバイナリ表現するフラグ intra_pred_direction_flag をIntraPredModeA、IntraPredModeBに対して定義し、以下の４状態をコンテクスト値とする。
C_A = (intra_pred_direction_flag for IntraPredModeA == 1) + (intra_pred_direction_flag for IntraPredModeB == 1);
ここで、intra_pred_direction_flagは例えば図３にて、intra4x4_pred_modeが値０、３、５、７をとる場合は縦方向予測(＝０)、値１、２、４、６、８をとる場合は横方向予測（＝１）に分類する。C_Aの４状態には、それぞれ、あらかじめIntraPredModeA、IntraPredModeBの状態を前提とするCurrIntraPredModeの条件付確率を求めておき、それに基づいて定まる(0,1)の初期生起確率テーブルを割り当てておく。このようにコンテクストを構成することで、第１ビンの条件付生起確率をよりよく推定することが可能となり、算術符号化の効率を高めることができる。C_Aの値に応じて第１ビンの生起確率テーブルを選択して算術符号化を実行する。また、符号化値をもって生起確率テーブルを更新する(ステップS79)。

第２ビン以降については、あらかじめ各予測モード値の発生確率に応じて定まる(0,1)の初期生起確率テーブルを割り当てておく(ステップS80)。次いで、第1ビンと同様に二値算術符号化、生起確率テーブル更新を行う(ステップS81)。

以上のべた符号化手順は、イントラ8x8予測モードに対しても同様に定義できる。イントラNxN予測モードをこのような手順で符号化することにより、同一色成分の近傍画素領域における予測モードの相関を利用して、予測モード情報の符号化に適応算術符号化を適用することができるので、符号化効率を向上することができる。

２．復号装置におけるイントラ予測モード情報の復号手順
実施の形態３、５の復号装置においては、図１６の形式によるビットストリームに対して、可変長符号部２５でのイントラNxN予測モードの情報の具体的な復号手順の一つを示した。本実施の形態６では、復号手順の別の具体的な方法を示す。本実施の形態６では特に、イントラNxN予測モードの値が画像パターンとしてのテクスチャの構造を反映することに着目し、同一色成分中の近傍画素領域内で適応的な算術符号化を用いて符号化が行われたビットストリームを復号する点に特徴がある。

実施の形態３、５では、符号化装置の説明にも記したように、図１８において個々の4x4ブロックＸに対して１つずつ割り当てられているイントラ4x4予測モードCurrIntraPredModeに対する予測値 predCurrIntraPredMode を、IntraPredModeA, IntraPredModeBのうち小さいほうの値を一意に割り当て、prev_intra_pred_mode_flagを復号してその値が１の場合にはCurrIntraPredModeとしてpredCurrIntraPredModeを採用し、prev_intra_pred_mode_flagがゼロの場合は、rem_intra_pred_modeを復号することによってブロックＸのイントラ4x4予測モードを復元するように構成した。これに対し、本実施の形態６では、IntraPredModeA, IntraPredModeBの状態を利用してCurrIntraPredMode を直接算術復号する。この際、AVC/H.264規格に採用されているコンテクスト適応二値算術復号に従う復号手順を用いる。

復号対象のCurrIntraPredModeは、図２８に示す形式にしたがって二値系列として符号化されているものとし、この系列を左端から順次二値算術復号していく。本実施の形態６の符号化手順で説明したとおり、二値系列の第１ビンは、CurrIntraPredModeが縦方向予測か、横方向予測かを分類する符号になっており(図３参照)、第２ビン以降は予測モード値の中で出現頻度が高いものから順次Terminateされるように符号構成されている。この符号構成の理由については符号化手順で述べたとおりである。

復号プロセスでは、まず、第１ビンの復号に際して、符号化手順で用いたコンテクストと同じC_Aを定める。C_Aの値に応じて第１ビンの生起確率テーブルを選択して算術復号を実行して第１ビンを復元する。また、復号値をもって生起確率テーブルを更新する。

第２ビン以降については、あらかじめ各予測モード値の発生確率に応じて定まる(0,1)の初期生起確率テーブルを割り当てておく。次いで、第１ビンと同様に二値算術復号、生起確率テーブル更新を行う。図２８の二値系列は各予測モード値を一意に特定できるように構成されているため、所定の数だけビンを復元したところで逐次CurrIntraPredModeが復号される。

以上のべた復号手順は、イントラ8x8予測モードに対しても同様に定義できる。イントラNxN予測モードをこのような手順で復号することにより、同一色成分の近傍画素領域における予測モードの相関を利用した算術符号化によって予測モード自体の符号量を削減した符号化ビットストリームを復号することができる。

上述の例において、図２８のテーブルは他にもバリエーションが考えられる。例えば、図２９のような二値系列を構成する方法でもよい。ここでは、第１ビンには以下のコンテクストＢを用いる。

コンテクストB(C_B)：イントラ予測モードがDC予測か、DC予測でないかをバイナリ表現するフラグ intra_dc_pred_flag をIntraPredModeA、IntraPredModeBに対して定義し、以下の４状態をコンテクスト値とする。
C_A = (intra_dc_pred_flag for IntraPredModeA == 1) + (intra_dc_pred_flag for IntraPredModeB == 1);
ここで、intra_dc_pred _flagは図３にて、intra4x4_pred_modeが値2をとる場合は１、その他の値をとる場合は０に設定する。C_B の4状態には、それぞれ、あらかじめIntraPredModeA、IntraPredModeBの状態を前提とするCurrIntraPredModeの条件付確率を求めておき、それに基づいて定まる第１ビンの値(0,1)の初期生起確率テーブルを割り当てておく。図２９では、CurrIntraPredModeがDC予測の場合に、第１ビンは値０を、DC予測以外の場合は第１ビンは値１をとるように設計している。また、第２ビンには、上述のコンテクストA(C_A)を用いることとした。このようにコンテクストを構成することで、第１ビンおよび第２ビンのいずれに対しても条件付生起確率をよりよく推定することが可能となり、算術符号化の効率を高めることができる。

実施の形態７．
本実施の形態７では、４：４：４フォーマットで入力される映像フレームを１６×１６画素の矩形領域(マクロブロック)に均等分割した単位でフレーム間予測を用いて符号化を行う符号化装置、および対応する復号装置について説明する。また、本符号化装置、復号装置はMPEG-4 AVC(ISO/IEC 14496-10)/ITU-T H.264規格(以下、AVC)で採用される符号化方式をベースとして、本発明に固有の特徴を付与したものとする。

図３０に、本実施の形態７における映像符号化装置の構成を、図３１に本実施の形態７における映像復号装置の構成を示す。図３１において、図３０の符号化装置の構成要素と同じ番号が付されている要素は同一の要素であることを示す。

以下、これらの図に基づいて符号化装置ならびに復号装置全体の動作と、本実施の形態７の特徴的な動作であるインター予測モード判定処理と動き補償予測復号処理について説明する。

１．符号化装置の動作概要
図３０の符号化装置において、入力映像信号１は、個々の映像フレームが４：４：４フォーマットであって、かつ３つの色成分を同一サイズのマクロブロックに分割してまとめた単位で符号化装置に入力されるものとする。

まず、動き補償予測部１０２において、メモリ１６に格納される１フレーム以上の動き補償予測参照画像データの中から１フレームの参照画像を選択し、該マクロブロックの単位で、各色成分ごとに動き補償予測処理が行われる。メモリは各色成分ごとに３面用意される（本実施の形態では３面として説明するが、設計により適宜変更してよい）。動き補償予測を行うブロックサイズには、７種類用意されており、まずマクロブロック単位に、図３２(a)から(d)に示すように、１６ｘ１６、１６ｘ８、８ｘ１６、８ｘ８のいずれかのサイズを選択することができる。さらに８ｘ８が選択された場合には、各８ｘ８ブロックごとに、図３２(e)から(h)に示すように、８ｘ８、８ｘ４、４ｘ８、４ｘ４のいずれかのサイズを選択することができる。選択したサイズ情報は、マクロブロック単位のサイズ情報はマクロブロックタイプとして、８ｘ８ブロック単位のサイズ情報はサブマクロブロックタイプとして出力される。なお、それぞれのブロックごとに選択した参照画像の識別番号と動きベクトル情報が出力される。

本実施の形態７における映像符号化装置は、インター予測モード共通化識別フラグ１２３に基づき、３つの色成分に対する動き補償予測処理方法を切り替えることを特徴とする。この点については、下記２で詳しく述べる。

動き補償予測部１０２では、図３２に示した全ブロックサイズないしはサブブロックサイズ、および所定の探索範囲のすべての動きベクトル１３７および選択可能な１枚以上の参照画像に対して動き補償予測処理を実行して、動きベクトル１３７と１枚の参照画像と減算器３により予測差分信号４を得る。予測差分信号４は符号化モード判定部５においてその予測効率が評価され、動き補償予測部１０２で実行した予測処理の中から、予測対象のマクロブロックに対して最適な予測効率が得られるマクロブロックタイプ／サブマクロブロックタイプ１０６と動きベクトル１３７と参照画像の識別番号を出力する。マクロブロックタイプ／サブマクロブロックタイプ１０６の選定にあたっては、符号化制御部１９の判断で定まる各タイプに対する重み係数２０が加味されることもある。また、選定されたタイプと動きベクトル１３７と参照画像に基づく動き補償予測によって得られる予測差分信号４を直交変換部８へ出力する。直交変換部８は入力される予測差分信号４を変換し直交変換係数として量子化部９へ出力する。量子化部９は入力される直交変換係数を、符号化制御部１９によって定まる量子化パラメータ２１に基づいて量子化を行い、量子化済み変換係数１０として可変長符号化部１１へ出力する。量子化済み変換係数１０は、可変長符号化部１１にてハフマン符号化や算術符号化などの手段によりエントロピー符号化される。また、量子化済み変換係数１０は逆量子化部１２、逆直交変換部１３を経て局部復号予測差分信号１４へ復元され、選定されたマクロブロックタイプ／サブマクロブロックタイプ１０６と動きベクトル１３７と参照画像に基づいて生成される予測画像７と加算器１８で加算することで局部復号画像１５が生成される。局部復号画像１５は以降の動き補償予測処理に用いるためメモリ１６へ格納される。また、可変長符号化部１１には、当該マクロブロックに対してデブロッキングフィルタを施すか否かを示すデブロッキングフィルタ制御フラグ２４も入力される（動き補償予測部１０２で実施される予測処理には、デブロッキングフィルタが施される前の画素データをメモリ１６に格納して用いるのでデブロッキングフィルタ処理自体は符号化処理には必要はないが、復号装置側ではデブロッキングフィルタ制御フラグ２４の指示によってデブロッキングフィルタを行って最終的な復号画像を得る）。

可変長符号化部１１に入力されるインター予測モード共通化識別フラグ１２３、量子化済み変換係数１０、マクロブロックタイプ／サブマクロブロックタイプ１０６、動きベクトル１３７、参照画像識別番号、量子化パラメータ２１は所定の規則(シンタックス)に従ってビットストリームとして配列・整形され、送信バッファ１７へ出力される。送信バッファ１７では符号化装置が接続される伝送路の帯域や記録媒体の読み出し速度に合わせてビットストリームを平滑化してビデオストリーム２２として出力する。また、送信バッファ１７中のビットストリーム蓄積状況に応じて符号化制御部１９へフィードバックをかけ、以降の映像フレームの符号化における発生符号量を制御する。

２．符号化装置におけるインター予測モード判定処理
本実施の形態７の符号化装置の特徴であるインター予測モード判定処理について詳述する。なお以下の記述でインター予測モードとは、上述の動き補償予測の単位となるブロックサイズ、すなわちマクロブロックタイプ／サブマクロブロックタイプを指し、インター予測モード判定処理とは、マクロブロックタイプ／サブマクロブロックタイプと動きベクトルと参照画像を選定する処理のことである。本処理は上記３つの色成分をまとめたマクロブロックの単位で実施され、主として、図３０の符号化装置における動き補償予測部１０２、符号化モード判定部５によって行われる。また、本処理の流れを示すフローチャートを図３３に示す。以下、ブロックを構成する３つの色成分の画像データをC0、C1、C2とする。

まず、符号化モード判定部５は、インター予測モード共通化識別フラグ１２３を受け取り、その値に基づいてC0、C1、C2で共通のインター予測モードと共通の動きベクトル１３７および共通の参照画像を使用するか否かを判断する(図３３のステップS100)。共通化する場合はステップS101以降へ、さもなくばステップS102以降へ進む。

インター予測モードと動きベクトル１３７および参照画像をC0、C1、C2で共通化する場合は、符号化モード判定部５は動き補償予測部１０２に対して、選択しうるすべてのインター予測モードと動きベクトル探索範囲と参照画像を通知し、動き補償予測部１０２はそのすべての予測効率を評価して、C0、C1、C2で共通の最適なインター予測モードと動きベクトル１３７と参照画像を選択する(ステップS101)。

インター予測モードと動きベクトル１３７および参照画像をC0、C1、C2で共通化せず、C0、C1、C2でそれぞれ一番よいモードを選択する場合は、符号化モード判定部５は動き補償予測部１０２に対して、Ci (i<=0<3)成分で選択しうるすべてのインター予測モードと動きベクトル探索範囲と参照画像を通知し、動き補償予測部１０２はそのすべての予測効率を評価して、Ci (i<=0<3)成分における最適なインター予測モードと動きベクトル１３７と参照画像を選択する(ステップS102、S103、S104)。

動き補償予測部１０２で行われる予測モードの予測効率評価の規範としてはたとえば、Jm,v,r = Dm,v,r + λRm,v,r(λ：正数)
で与えられるレート・ひずみコストを用いることができる。ここで、Dm,v,rはインター予測モードmと所定範囲の動きベクトルvと参照画像rを適用した場合の符号化歪または予測誤差量である。符号化歪とは、インター予測モードmと動きベクトルvと参照画像rを適用して予測誤差を得、予測誤差を変換・量子化した結果から映像を復号して符号化前の信号に対する誤差を計測するものである。予測誤差量は、インター予測モードmと動きベクトルvと参照画像rを適用した場合の予測画像と符号化前の信号との差分を得、その差分の大きさを定量化したもので、たとえば差分絶対値和(Sum of Absolute Distance: SAD)などが用いられる。Rm,v,rはインター予測モードmと動きベクトルvと参照画像rを適用した場合の発生符号量である。つまり、Jm,v,rはインター予測モードmおよび動きベクトルvと参照画像rを適用した場合の符号量と劣化度とのトレードオフを規定する値であり、最小のJm,v,rを与えるインター予測モードmと動きベクトルvと参照画像rが最適解を与える。

符号化装置がステップS101以降の処理を行った場合、インター予測モードと動きベクトル１３７および参照画像の情報は、３つの色成分を含むマクロブロックに対して１組割り当てられる。一方、ステップS102以降の処理を行った場合は、各色成分に対してそれぞれインター予測モード情報と動きベクトル１３７および参照画像が割り当てられる。したがって、マクロブロックに対して割り当てられるインター予測モードと動きベクトル１３７と参照画像の情報が異なるため、符号化装置がS101以降の処理過程を行ったか、S102以降の処理過程を行ったかはインター予測モード共通化識別フラグ１２３をビットストリームに多重化して復号装置側で認識できるようにする必要がある。このようなビットストリームのデータ配列を図３４に示す。

図３４はマクロブロックのレベルにおけるビットストリームのデータ配列を示しており、マクロブロックタイプは、イントラかインターかを示し、インターモードのときには動き補償の単位となるブロックサイズを示す情報を含む。サブマクロブロックタイプは、マクロブロックタイプで８ｘ８ブロックサイズが選択された場合にのみ多重化され、各８ｘ８ブロックごとのブロックサイズ情報を含む。基本マクロブロックタイプ１２８と基本サブマクロブロックタイプ１２９はインター予測モード共通化識別フラグ１２３が「C0、C1、C2で共通」であることを示す場合は共通マクロブロックタイプおよび共通サブマクロブロックタイプを示し、さもなくばC0に対するマクロブロックタイプおよびサブマクロブロックタイプを示す。拡張マクロブロックタイプ１３０および拡張サブマクロブロックタイプ１３１は、インター予測モード共通化識別フラグ１２３が「C0、C1、C2で共通」でないことを示す場合にのみC1、C2各々に対して多重化され、C1、C2に対するマクロブロックタイプおよびサブマクロブロックタイプを示す。

参照画像識別番号は、動き補償単位となる８ｘ８ブロックサイズ以上のブロックごとに選択する参照画像を特定するための情報である。インターフレームのときには、選択できる参照画像は１フレームであるので、１ブロックごとに１つの参照画像識別番号が多重化される。動きベクトル情報は、動き補償単位となるブロックごとに１組の動きベクトル情報を多重化する。参照画像識別番号および動きベクトル情報は、マクロブロックに含まれる動き補償の単位となるブロックの個数分多重化される必要がある。基本参照画像識別番号１３２および基本動きベクトル情報１３３はインター予測モード共通化識別フラグ１２３が「C0、C1、C2で共通」であることを示す場合は、共通の参照画像識別番号および共通の動きベクトル情報を示し、さもなければC0に対する参照画像識別番号および動きベクトル情報を示す。拡張参照画像識別番号１３４および拡張動きベクトル情報１３５は、インター予測モード共通化識別フラグ１２３が「C0、C1、C2で共通」でないことを示す場合にのみC1、C2各々に対して多重化され、C1、C2に対する参照画像識別番号および動きベクトル情報を示す。

ついで量子化パラメータ２１、量子化済み変換係数１０が多重化される。（図３４には図３０で可変長符号化部１１に入力されているデブロッキングフィルタ制御フラグ２４が含まれていないが、本実施の形態７の特徴を説明するために必要な構成要素ではないため割愛している）

従来の映像符号化標準で採用されてきた４：２：０フォーマットでは、色空間の定義がY、Cb、Crに固定されていたが、４：４：４フォーマットではY、Cb、Crに限定せず多様な色空間を利用することができる。図３４のようにインター予測モード情報を構成することで、入力映像信号１の色空間の定義が種々に及ぶ場合にも最適な符号化処理を行うことができる。たとえば、色空間がRGBで定義される場合にR、G、Bの各成分に均等に映像テクスチャの構造が残存している領域では、共通のインター予測モード情報と共通の動きベクトル情報を用いることでインター予測モード情報と動きベクトル情報自体の冗長性を削減して符号化効率を高めることができる。これに対し、例えば赤味がまったくない領域(R成分が0)では、R成分に最適なインター予測モードと動きベクトル情報とG,B成分に最適なインター予測モードと動きベクトル情報は異なるはずである。そこで、拡張インター予測モードと拡張参照画像識別情報および拡張動きベクトル情報を適応的に利用することで最適な符号化効率を得ることができる。

３．復号装置の動作概要
図３１の復号装置は、図３０の符号化装置から出力される図３４の配列に従うビデオストリーム２２を受信して、３つの色成分が同一サイズ(４：４：４フォーマット)のマクロブロックの単位で復号処理を行い、個々の映像フレームを復元するものとする。

まず、可変長復号部２５はストリーム２２を入力とし、所定の規則(シンタックス)に従ってビデオストリーム２２を解読して、インター予測モード共通化識別フラグ１２３、量子化済み変換係数１０、マクロブロックタイプ／サブマクロブロックタイプ１０６、参照画像識別番号、動きベクトル情報、量子化パラメータ２１などの情報を抽出する。量子化済み変換係数１０は量子化パラメータ２１とともに逆量子化部１２へ入力され、逆量子化処理が行われる。ついでその出力が逆直交変換部１３へ入力され、局部復号予測差分信号１４へ復元される。一方、動き補償予測部１０２に対してはマクロブロックタイプ／サブマクロブロックタイプ１０６とインター予測モード共通化識別フラグ１２３と動きベクトル１３７と参照画像識別番号が入力され、これらの情報に従って予測画像７を得る。予測画像７を得る具体的な手順については後述する。局部復号予測差分信号１４と予測画像７は加算器１８により加算され、暫定復号画像１５を得る(これは符号化装置における局部復号画像１５とまったく同じ信号である)。暫定復号画像１５は以降のマクロブロックの動き補償予測に用いられるためメモリ１６へ書き戻される。メモリは各色成分ごとに３面用意される（本実施の形態では３面として説明するが、設計により適宜変更してよい）。また、可変長復号部２５によって解読されたデブロッキングフィルタ制御フラグ２４の指示に基づいてデブロッキングフィルタ２６を暫定復号画像１５に対して作用させ、最終的な復号画像２７を得る。

４．復号装置におけるインター予測復号処理
図３１の復号装置は、図３０の符号化装置から出力される図３４の配列に従うビデオストリーム２２を受信して、３つの色成分が同一サイズ(４：４：４フォーマット)のマクロブロックの単位で復号処理を行い、個々の映像フレームを復元するものとする。

本実施の形態７の復号装置の特徴であるインター予測画像生成処理について詳述する。本処理は上記３つの色成分をまとめたマクロブロックの単位で実施され、主として、図３１の復号装置における可変長復号部２５、動き補償予測部１０２によって行われる。また、本処理のうち可変長復号部２５で行われる処理の流れを示すフローチャートを図３５に示す。

可変長復号部２５への入力であるビデオストリーム２２は、図３４のデータ配列に従うものとする。ステップS110では図３４のデータのうちインター予測モード共通化識別フラグ１２３が復号される(ステップS110)。さらに基本マクロブロックタイプ１２８および基本サブマクロブロックタイプ１２９が復号される(ステップS111)。ステップS112では、インター予測モード共通化識別フラグ１２３の結果を用いてインター予測モードをC0、C1、C2で共通化するかどうかを判断し、共通化の場合は(ステップS112でYes)C0、C1、C2のすべてに対して基本マクロブロックタイプ１２８および基本サブマクロブロックタイプ１２９を用いることとし、さもなければ(ステップS112でNo)基本マクロブロックタイプ１２８および基本サブマクロブロックタイプ１２９はC0のモードとして使用し、さらにC1、C2の各々に対して拡張マクロブロックタイプ１３０および拡張サブマクロブロックタイプ１３１を復号して(ステップS113)、C1、C2のインター予測モード情報を得る。次に基本参照画像識別番号１３２と基本動きベクトル情報１３３を復号し(ステップS114)、インター予測モード共通化識別フラグ１２３が、「C0、C1、C2で共通化」することを示す場合には(ステップS115でYes)、C0、C1、C2のすべてに対して基本参照画像識別番号１３２および基本動きベクトル情報１３３を用いることとし、さもなければ(ステップS115でNo)基本参照画像識別番号１３２および基本動きベクトル情報１３３はC0の情報として使用し、さらにC1、C2の各々に対して拡張参照画像識別番号１３４および拡張動きベクトル情報１３５を復号する(ステップS116)。以上の処理過程を経て各色成分のマクロブロックタイプ／サブマクロブロックタイプ１０６、参照画像識別番号および動きベクトル情報が確定するため、これらを動き補償予測部１０２へ出力し、各色成分の動き補償予測画像を得る。

図３６に、図３４のビットストリームデータ配列のバリエーションを示す。図３６では、インター予測モード共通化識別フラグ１２３は、マクロブロックレベルのフラグとしてではなく、スライス、ピクチャ、シーケンスなどの上位データレイヤに位置するフラグとして多重化されるようにした。これにより、スライス以上の上位レイヤでの切り替えで十分な予測効率が確保できる場合は、マクロブロックレベルで予測モード共通化識別フラグ１２３を逐一多重化することなくオーバヘッドビットを削減できる。

図３４、図３６では、インター予測モード共通化識別フラグ１２３をマクロブロック毎またはスライス、ピクチャ、シーケンスなどの上位データレイヤに多重化したが、インター予測モード共通化識別フラグ１２３を多重化せずに４：４：４フォーマットで符号化する場合には常に各成分に異なるインター予測モードと動きベクトル情報を用いるようにしてもよい。その場合のビットストリームデータの配列を図３７に示す。図３７では、インター予測モード共通化識別フラグ１２３は存在せず、シーケンスなどの上位データレイヤに４：４：４フォーマットの入力画像を扱うことを指示するプロファイル情報１３６が多重化され、このプロファイル情報の復号結果によって、拡張マクロブロックタイプ１３０、拡張サブマクロブロックタイプ１３１、拡張参照画像識別番号１３４、拡張動きベクトル情報１３５が多重化される。

実施の形態８．
実施の形態７では、マクロブロックタイプ／サブマクロブロックタイプ、動きベクトル、参照画像の各々を色成分ごとに異なるものにすることができるようにしたが、本実施の形態８ではマクロブロックタイプ／サブマクロブロックタイプと参照画像を各成分で共通とし、動きベクトルのみを各成分で異なるものにすることができることを特徴とする映像符号化装置、映像復号装置について記述する。本実施の形態８における映像符号化装置および映像復号装置の構成は実施の形態７における図３０および図３１と同じであるが、インター予測モード共通化識別フラグ１２３の代わりに動きベクトル共通化識別フラグ１２３ｂを使用している点が異なる。

１．符号化装置におけるインター予測モード判定処理
本実施の形態８の符号化装置の特徴であるインター予測モード判定処理について実施の形態７と異なる処理を中心に詳述する。

本処理は上記３つの色成分をまとめたマクロブロックの単位で実施され、主として、図３０の符号化装置における動き補償予測部１０２、符号化モード判定部５によって行われる。また、本処理の流れを示すフローチャートを図３８に示す。以下、ブロックを構成する３つの色成分の画像データをC0、C1、C2とする。

まず、符号化モード判定部５は、動きベクトル共通化識別フラグ１２３ｂを受け取り、その値に基づいてC0、C1、C2で共通の動きベクトル１３７を使用するか否かを判断する(図３７のステップS120)。共通化する場合はステップS121以降へ、さもなくばステップS122以降へ進む。

動きベクトル１３７をC0、C1、C2で共通化する場合は、符号化モード判定部５は動き補償予測部１０２に対して、選択しうるすべてのインター予測モードと動きベクトル探索範囲と参照画像を通知し、動き補償予測部１０２はそのすべての予測効率を評価して、C0、C1、C2で共通の最適なインター予測モードと動きベクトル１３７と参照画像を選択する(ステップS121)。

動きベクトル１３７をC0、C1、C2で共通化せず、C0、C1、C2でそれぞれ一番よい動きベクトルを選択する場合は、符号化モード判定部５は動き補償予測部１０２に対して、選択しうるすべてのインター予測モードと動きベクトル探索範囲と参照画像を通知し、動き補償予測部１０２はそのすべての予測効率を評価して、C0、C1、C2で共通の最適なインター予測モードと参照画像を選択し(ステップS122)、さらにCi (i<=0<3)成分において最適な動きベクトルを選択する(ステップS123、S124、S125)。

動きベクトル共通化識別フラグ１２３ｂは、ビットストリームに多重化して復号装置側で認識できるようにする必要がある。このようなビットストリームのデータ配列を図３９に示す。

図３９はマクロブロックのレベルにおけるビットストリームのデータ配列を示している。マクロブロックタイプ１２８ｂとサブマクロブロックタイプ１２９ｂおよび参照画像識別番号１３２ｂは、「C0、C1、C2で共通」である。基本動きベクトル情報１３３は、動きベクトル共通化識別フラグ１２３ｂが「C0、C1、C2で共通」であることを示す場合は、共通の動きベクトル情報を示し、さもなければC0に対する動きベクトル情報を示す。拡張動きベクトル情報１３５は、動きベクトル共通化識別フラグ１２３ｂが「C0、C1、C2で共通」でないことを示す場合にのみC1、C2各々に対して多重化され、C1、C2に対する動きベクトル情報を示す。なお、図３０、３１におけるマクロブロックタイプ／サブマクロブロックタイプ１０６は、図３９におけるマクロブロックタイプ１２８ｂとサブマクロブロックタイプ１２９ｂの総称である。

２．復号装置におけるインター予測復号処理
本実施の形態８の復号装置は、本実施の形態８の符号化装置から出力される図３９の配列に従うビデオストリーム２２を受信して、３つの色成分が同一サイズ(４：４：４フォーマット)のマクロブロックの単位で復号処理を行い、個々の映像フレームを復元するものとする。

本実施の形態８の復号装置の特徴であるインター予測画像生成処理について実施の形態７と異なる処理を中心に詳述する。本処理は上記３つの色成分をまとめたマクロブロックの単位で実施され、主として、図３１の復号装置における可変長復号部２５、動き補償予測部１０２によって行われる。また、本処理のうち可変長復号部２５で行われる処理の流れを示すフローチャートを図４０に示す。

可変長復号部２５への入力であるビデオストリーム２２は、図３９のデータ配列に従うものとする。ステップS126では、C0、C1、C2で共通のマクロブロックタイプ１２８ｂ、サブマクロブロックタイプ１２９ｂを復号する。復号したマクロブロックタイプ１２８ｂまたはサブマクロブロックタイプ１２９ｂによって、動き補償の単位となるブロックサイズが決まるので、次に動き補償の単位となるブロックごとにC0、C1、C2に共通の参照画像識別番号１３２ｂを復号する(ステップS127)。ステップS128では、動きベクトル共通化識別フラグ１２３ｂを復号する。次に動き補償の単位となるブロックごとに基本動きベクトル情報１３３を復号する(ステップS129)。ステップS130では、動きベクトル共通化識別フラグ１２３ｂの結果を用いて動きベクトル１３７をC0、C1、C2で共通化するかどうかを判断し、共通化の場合は(ステップS130でYes)C0、C1、C2のすべてに対して基本動きベクトル情報を用いることとし、さもなければ(ステップS130でNo)基本動きベクトル情報１３３はC0のモードとして使用し、さらにC1、C2の各々に対して拡張動きベクトル情報１３５を復号する(ステップS131)。以上の処理過程を経て各色成分のマクロブロックタイプ／サブマクロブロックタイプ１０６、参照画像識別番号および動きベクトル情報が確定するため、これらを動き補償予測部１０２へ出力し、各色成分の動き補償予測画像を得る。

図４１に、図３９のビットストリームデータ配列のバリエーションを示す。図３９では、動きベクトル共通化識別フラグ１２３ｂは、マクロブロックレベルのフラグとしてではなく、スライス、ピクチャ、シーケンスなどの上位データレイヤに位置するフラグとして多重化されるようにした。これにより、スライス以上の上位レイヤでの切り替えで十分な予測効率が確保できる場合は、マクロブロックレベルで動きベクトル共通化識別フラグ１２３ｂを逐一多重化することなくオーバヘッドビットを削減できる。

図３９、図４１では動きベクトル共通化識別フラグ１２３ｂをマクロブロック毎またはスライス、ピクチャ、シーケンスなどの上位データレイヤに多重化したが、動きベクトル共通化識別フラグ１２３ｂを多重化せずに４：４：４フォーマットで符号化する場合には常に各成分に異なる動きベクトル情報を用いるようにしてもよい。その場合のビットストリームデータの配列を図４２に示す。図４２では、動きベクトル共通化識別フラグ１２３ｂが存在せず、シーケンスなどの上位データレイヤに４：４：４フォーマットの入力画像を扱うことを指示するプロファイル情報１３６が多重化され、このプロファイル情報１３６の復号結果によって、拡張動きベクトル情報１３５が多重化される。

本実施の形態８では、マクロブロックタイプ／サブマクロブロックタイプ１０６と参照画像を各色成分に対して共通とし、動きベクトル１３７のみを色成分ごとに異なるものにすることができるようにした。これにより、各色成分に対して動きベクトル１３７のみを適応化することで十分な予測効率が得られる場合にはマクロブロックタイプ／サブマクロブロックタイプ１０６や参照画像識別番号は色成分ごとに多重化することなくオーバヘッドビットを削減できる。

実施の形態９．
実施の形態７では、インター予測モード共通化識別フラグ１２３またはプロファイル情報１３６によって、マクロブロックタイプ／サブマクロブロックタイプ１０６、動きベクトル１３７、参照画像の各々を３成分で共通にするか、色成分ごとに異なるものにするかを切り替えることができるようにしたが、本実施の形態９では、Y、Cb、Cr形式などの４：４：４フォーマット画像を想定し、輝度成分(Y)と色差成分(Cb、Cr)に対して異なるものにするかを切り替えることができるようにした(この場合、色差成分の２成分に対しては共通のモードを使用する)。すなわち、３成分で共通にするか、各成分ごとに異なるものにするか、あるいは輝度成分と色差成分に対して異なるものにするかを切り替えることができるようにしたことを特徴とする映像符号化装置および映像復号装置について説明する。本実施の形態９における映像符号化装置および映像復号装置の構成は実施の形態７における図３０および図３１と同じである。

１．符号化装置におけるインター予測モード判定処理
本実施の形態９の符号化装置の特徴であるインター予測モード判定処理について実施の形態７と異なる処理を中心に詳述する。

本処理は上記３つの色成分をまとめたマクロブロックの単位で実施され、主として、図３０の符号化装置における動き補償予測部１０２、符号化モード判定部５によって行われる。また、本処理の流れを示すフローチャートを図４３に示す。以下、ブロックを構成する３つの色成分の画像データをC0、C1、C2とする。

まず、符号化モード判定部５は、インター予測モード共通化識別フラグ１２３を受け取り、その値に基づいてC0、C1、C2で共通のインター予測モードと共通の動きベクトル１３７および共通の参照画像を使用するか否かを判断する(図４３のステップS132)。共通化する場合はステップS133以降へ、さもなくばステップS134以降またはステップS137以降へ進む。

インター予測モードと動きベクトル１３７および参照画像をC0、C1、C2で共通化する場合は、符号化モード判定部５は動き補償予測部１０２に対して、選択しうるすべてのインター予測モードと動きベクトル探索範囲と参照画像を通知し、動き補償予測部１０２はそのすべての予測効率を評価して、C0、C1、C2で共通の最適なインター予測モードと動きベクトル１３７と参照画像を選択する(ステップS133)。

インター予測モードと動きベクトル１３７および参照画像をC0、C1、C2で共通化せず、C0、C1、C2でそれぞれ一番よいモードを選択する場合は、符号化モード判定部５は動き補償予測部１０２に対して、Ci (i<=0<3)成分で選択しうるすべてのインター予測モードと動きベクトル探索範囲と参照画像を通知し、動き補償予測部１０２はそのすべての予測効率を評価して、Ci (i<=0<3)成分における最適なインター予測モードと動きベクトル１３７と参照画像を選択する(ステップS134、S135、S136)。

インター予測モードと動きベクトル１３７および参照画像をC1、C2で共通化し、C0(輝度成分相当)とC1,C2(色差成分相当)でそれぞれ一番よいモードを選択する場合は、符号化モード判定部５は動き補償予測部１０２に対して、C0成分で選択しうるすべてのインター予測モードと動きベクトル探索範囲と参照画像を通知し、動き補償予測部１０２はそのすべての予測効率を評価して、C0成分における最適なインター予測モードと動きベクトル１３７と参照画像を選択する(ステップS137)。さらにC1、C2成分で選択しうるすべてのインター予測モードと動きベクトル探索範囲と参照画像を通知し、動き補償予測部１０２はそのすべての予測効率を評価して、C1、C2で共通の最適なインター予測モードと動きベクトル１３７と参照画像を選択する(ステップS138)。

本実施の形態９における符号化装置が出力するビットストリームのデータ配列は図３４と同じであるが、インター予測モード共通化識別フラグ１２３が、「C1、C2で共通」であることを示す場合は、拡張マクロブロックタイプ１３０、拡張サブマクロブロックタイプ１３１、拡張参照識別番号１３４、拡張動きベクトル情報１３５は、C1、C2に対して共通の情報である。

２．復号装置におけるインター予測復号処理
本実施の形態９の復号装置は、本実施の形態９の符号化装置から出力される図３４の配列に従うビデオストリーム２２を受信して、３つの色成分が同一サイズ(４：４：４フォーマット)のマクロブロックの単位で復号処理を行い、個々の映像フレームを復元するものとする。

本実施の形態９の復号装置の特徴であるインター予測画像生成処理について実施の形態７と異なる処理を中心に詳述する。本処理は上記３つの色成分をまとめたマクロブロックの単位で実施され、主として、図３１の復号装置における可変長復号部２５、動き補償予測部１０２によって行われる。また、本処理のうち可変長復号部２５で行われる処理の流れを示すフローチャートを図４４に示す。

可変長復号部２５への入力であるビデオストリーム２２は、図３４のデータ配列に従うものとする。ステップS140では図３４のデータのうちインター予測モード共通化識別フラグ１２３が復号される(ステップS140)。さらに基本マクロブロックタイプ１２８および基本サブマクロブロックタイプ１２９が復号される(ステップS141)。ステップS142では、インター予測モード共通化識別フラグ１２３の結果を用いてインター予測モードをC0、C1、C2で共通化するかどうかを判断し、共通化の場合はC0、C1、C2のすべてに対して基本マクロブロックタイプ１２８および基本サブマクロブロックタイプ１２９を用いることとし、さもなければ基本マクロブロックタイプ１２８および基本サブマクロブロックタイプ１２９はC0のモードとして使用する。さらにC1、C2で共通の場合には、C1、C2成分で共通の拡張マクロブロックタイプ１３０および拡張サブマクロブロックタイプ１３１を復号する(ステップS143)。C0、C1、C2に対して異なるモードを使用する場合には、C1、C2の各々に対して拡張マクロブロックタイプ１３０および拡張サブマクロブロックタイプ１３１を復号して(ステップS144、S145、S146)、C1、C2のモード情報を得る。次に基本参照画像識別番号１３２と基本動きベクトル情報１３３を復号し(ステップS147)、インター予測モード共通化識別フラグ１２３が、「C0、C1、C2で共通化」することを示す場合には、C0、C1、C2のすべてに対して基本参照画像識別番号１３２および基本動きベクトル情報１３３を用いることとし、さもなければ基本参照画像識別番号１３２および基本動きベクトル情報１３３はC0の情報として使用し、さらにC1、C2で共通の場合には、C1、C2成分で共通の拡張参照画像識別番号１３４および拡張動きベクトル情報１３５を復号する(ステップS149)。C0、C1、C2に対して異なるモードを使用する場合には、C1、C2の各々に対して拡張参照画像識別番号１３４および拡張動きベクトル情報１３５を復号する(ステップS150、S151、S152)。以上の処理過程を経て各色成分のマクロブロックタイプ／サブマクロブロックタイプ１０６、参照画像識別番号および動きベクトル情報が確定するため、これらを動き補償予測部１０２へ出力し、各色成分の動き補償予測画像を得る。

なおビットストリームのデータ配列が、図３６の場合も同様に、インター予測モード共通化識別フラグ１２３が、「C1、C2で共通」であることを示す場合は、拡張マクロブロックタイプ１３０、拡張サブマクロブロックタイプ１３１、拡張参照識別番号１３４、拡張動きベクトル情報１３５は、C1、C2に対して共通の情報であり、図３６に示すデータの配列に従うビデオストリームを出入力とする映像符号化装置および映像復号装置の動作は図３４の場合と同様である。

本実施の形態９では、マクロブロックタイプ／サブマクロブロックタイプ１０６、動きベクトル１３７、参照画像の各々を色成分ごとに異なるものにすることができるようにしたが、マクロブロックタイプ／サブマクロブロックタイプ１０６と参照画像は各成分で共通とし、動きベクトル１３７のみ３成分で共通にするか、各成分ごとに異なるものにするか、あるいはC1、C2で共通化し、C0とC1,C2でそれぞれ最適なものを選択するかを切り替えても良い。この場合のビットストリームのデータ配列は図３９または図４１に従い、この場合も、インター予測モード共通化識別フラグ１２３が、「C1、C2で共通」であることを示す場合は、拡張動きベクトル情報１３５は、C1、C2に対して共通の情報である。

実施の形態１０．
本実施の形態１０では、実施の形態７で述べた符号化装置の可変長符号化部１１において、入力される動きベクトル１３７を符号化し、ビットストリームに多重化する方法と、対応する復号装置の可変長復号部２５において、ビットストリームから動きベクトル１３７を復号する方法を述べる。

図４５は図３０に示す符号化装置の可変長符号化部１１の一部で、動きベクトル１３７を符号化する動きベクトル符号化部の構成である。

３つの色成分(C0、C1、C2)の動きベクトル１３７をC0、C1、C2の順番にビットストリームに多重化する方法について述べる。

C0の動きベクトル１３７をmv0とする。動きベクトル予測部１１１にて、C0の動きベクトル１３７の予測ベクトル(mvp0)を求める。図４６に示すように、符号化対象の動きベクトル(mv0)が位置するブロックに隣接するブロック(図４６のA、B、C)の動きベクトル(mvA0, mvB0, mvC0)をメモリより取得する。なおA、B、Cの動きベクトル１３７はすでにビットストリームに多重化されているものとする。mvA0、mvB0、mvC0の中央値をmvp0として算出する。算出した予測ベクトルmvp0と符号化対象の動きベクトルmv0を差分動きベクトル算出部１１２へ入力する。差分動きベクトル算出部１１２ではmv0とmvp0の差分ベクトル(mvd0)を算出する。算出したmvd0は差分動きベクトル可変長符号化部１１３へ入力され、ハフマン符号化や算術符号化などの手段によりエントロピー符号化される。

次にC1の動きベクトル(mv1)を符号化する。動きベクトル予測部１１１にて、C1の動きベクトル１３７の予測ベクトル(mvp1)を求める。図４６に示すように、符号化対象の動きベクトル(mv1)が位置するブロックに隣接するブロックの動きベクトル(mvA1、mvB1、mvC1)とmv1が位置するブロックと同位置のC0の動きベクトル(mv0)をメモリ１６より取得する。なおA、B、Cの動きベクトル１３７はすでにビットストリームに多重化されているものとする。mvA1、mvB1、mvC1、mv0の中央値をmvp1として算出する。算出した予測ベクトルmvp1と符号化対象の動きベクトルmv1を差分動きベクトル算出部１１２へ入力し、mv1とmvp1の差分動きベクトル(mvd1=mv1-mvp1)を算出する。算出したmvd1は差分動きベクトル可変長符号化部１１３へ入力され、ハフマン符号化や算術符号化などの手段によりエントロピー符号化される。

次にC2の動きベクトル(mv2)を符号化する。動きベクトル予測部１１１にて、C2の動きベクトル１３７の予測ベクトル(mvp2)を求める。図４６に示すように、符号化対象の動きベクトル(mv2)が位置するブロックに隣接するブロックの動きベクトル(mvA2、mvB2、mvC2)とmv2が位置するブロックと同位置のC0およびC1の動きベクトル(mv1、mv2)をメモリより取得する。mvA2、mvB2、mvC2、mv0、mv1の中央値をmvp2として算出する。算出した予測ベクトルmvp2と符号化対象の動きベクトルmv2を差分動きベクトル算出部１１２へ入力し、mv2とmvp2の差分動きベクトル(mvd2=mv2-mvp2)を算出する。算出したmvd2は差分動きベクトル可変長符号化部１１３へ入力され、ハフマン符号化や算術符号化などの手段によりエントロピー符号化される。

図４７に図３１に示す復号装置の可変長復号部２５の一部で、動きベクトル１３７を復号する動きベクトル復号部２５０の構成を示す。

動きベクトル復号部２５０ではC0、C1、C2の順番にビデオストリーム２２に多重化された３つの色成分の動きベクトル１３７を復号する。

差分動きベクトル可変長復号部２５１にて、ビデオストリーム２２に多重化された３つの色成分(C0、C1、C2)の差分動きベクトル(mvd0、mvd1、mvd2)を抽出し可変長復号する。

動きベクトル予測部２５２にて、C0、C1、C2の動きベクトル１３７の予測ベクトル(mvp0、mvp1、mvp2)を算出する。予測ベクトルの算出方法は符号化装置の動きベクトル予測部１１１と同じである。

次に動きベクトル算出部２５３にて差分動きベクトルと予測ベクトルを加算し動きベクトル(mvi=mvdi+mvpi(i=0,1,2))を算出する。算出した動きベクトル１３７は予測ベクトル候補として用いるためにメモリ１６に格納する。

本実施の形態１０によれば、動きベクトルを符号化および復号する際に、符号化対象の動きベクトルが位置するブロックに隣接する同一色成分ブロックの動きベクトルと、符号化対象の動きベクトルが位置するブロックと同位置にあって異なる色成分ブロックの動きベクトルを予測ベクトル候補として用いることにしたので、物体の境界領域などで同一色成分内の隣接するブロックの動きベクトルと連続性がない場合などに、異なる色成分の同位置のブロックの動きベクトルを予測ベクトル候補として用いることで動きベクトルの予測効率を高め、動きベクトルの符号量を削減する効果が得られる。

実施の形態１１．
本実施の形態１１では、実施の形態７で述べた符号化装置および復号装置から派生する別の符号化装置、復号装置の実施例について述べる。本実施の形態１１における符号化装置・復号装置は、マクロブロック中のC0、C1、C2成分を個別のヘッダ情報に従って符号化するか否かを所定の制御信号に応じて判断し、その制御信号の情報をビデオストリーム２２に多重化する。また、当該制御信号に応じてC0、C1、C2成分の復号に必要なヘッダ情報をビデオストリーム２２に多重化するとともに、当該制御信号に応じて伝送すべき動きベクトルや変換係数の情報がない場合のスキップ(またはnot coded)マクロブロックを効率よく符号化する手段を提供する点を特徴とする。

AVCも含め従来のMPEG映像符号化方式では、符号化対象のマクロブロックについて伝送すべき符号化情報が存在しないようなケースを特別にシグナリングすることで、当該マクロブロックの符号量を最小限に抑えた高能率符号化を実現している。例えば、あるマクロブロックを符号化しようとする場合、動き補償予測に用いる参照画像上でまったく同じ位置の画像データを予測画像として使用し(すなわち、動きベクトルがゼロ)、なおかつ得られた予測誤差信号を変換、量子化した結果、マクロブロック内の量子化後のすべての変換係数がゼロになる場合、復号側では逆量子化を行っても得られる予測誤差信号は振幅がゼロとなり、復号装置側へ伝送すべき変換係数データがなくなる。さらに、動きベクトルがゼロであることも結合仮定すれば、「動きベクトルゼロ、変換係数データ無し」という特別なマクロブロックタイプを定義することができる。このようなマクロブロックは従来、スキップマクロブロックまたはnot codedマクロブロックと呼ばれ、特別なシグナリングを行うことで余分な情報を伝送しないようにする工夫がなされている。AVCでは、動きベクトルの仮定を、「図３２(a)の１６ｘ１６予測を行う場合で、かつ動きベクトルの符号化に用いる予測値(予測ベクトルmvp0、mvp1、mvp2が該当)が実際の動きベクトルに等しい場合」という条件とし、その条件に合致し、かつ伝送すべき変換係数データがない場合に、スキップマクロブロックとみなす。従来のAVCでは、このスキップマクロブロックを符号化する場合に、使用する可変長符号化方式に応じて以下の2つの方法のいずれかを選択することになっている。

方法１：スライス内で連続するスキップマクロブロックの数(RUN長)をカウントし、RUN長を可変長符号化する。
方法２：マクロブロックごとに、スキップマクロブロックか否かの指示フラグを符号化する。

各方法によるビットストリームシンタックスを図４８に示す。図４８(a)は、可変長符号化方式として適応ハフマン符号化を用いた場合(方法１)、図４８(b)は適応算術符号化を用いた場合(方法２)である。方法１の場合はmb_skip_run、方法２の場合は mb_skip_flagによってスキップマクロブロックのシグナリングを行っている。MB(n)はｎ番目の(スキップでない)マクロブロックの符号化データを指す。ここで、mb_skip_runやmb_skip_flagは、C0、C1、C2成分をひとまとめにしたマクロブロックを単位として割り当てられていることに注意されたい。

これに対して、本実施の形態１１における符号化装置・復号装置では、上記制御信号、すなわち実施の形態７で述べたインター予測モード共通化識別フラグ１２３相当の信号の状態に応じて、C0、C1、C2の各成分ごとに動きベクトルなどを含むヘッダ情報を変更し、スキップマクロブロックのシグナリングをC0、C1、C2の各成分ごとに行う方法を提供する。具体的なビットストリームシンタックスの例を図４９、図５０に示す。

図４９は本実施の形態１１の符号化装置が出力し、本実施の形態１１の復号装置の入力となるマクロブロック符号化データの構成を、図５０は図４９中のCn成分ヘッダ情報の符号化データの詳細構成を示す。以下では、このビットストリーム構成の効果を説明するため、ビットストリームを受信して映像信号を復元する復号装置側の動作を中心に説明する。復号装置の動作説明には図３１を参照する。

実施の形態７におけるインター予測モード共通化識別フラグ１２３は、定義を拡張し、マクロブロックヘッダ共通化識別フラグ１２３ｃと表現する。マクロブロックヘッダ共通化識別フラグ１２３ｃはC0成分ヘッダ情報１３９ａを基本マクロブロックヘッダ情報とみなし、C0成分ヘッダ情報１３９ａのみをC1、C2成分にも共通に用いるヘッダ情報として多重化するか、C1成分ヘッダ情報１３９ｂ、C2成分ヘッダ情報１３９ｃをそれぞれ個別に拡張ヘッダ情報として多重化するかを指示するフラグとする。マクロブロックヘッダ共通化識別フラグ１２３ｃはビデオストリーム２２から可変長復号部２５によって抽出・復号される。同フラグが、C0成分ヘッダ情報１３９ａのみをC1,C2成分にも共通に用いるヘッダ情報として多重化することを示す場合は、マクロブロック中のC0、C1、C2の全成分に対して、C0成分ヘッダ情報１３９aを用いた復号を行い、C1成分ヘッダ情報１３９ｂ、C2成分ヘッダ情報１３９ｃをそれぞれ個別に拡張ヘッダ情報として多重化することを示す場合は、マクロブロック中のC0、C1,C2それぞれの成分に固有のヘッダ情報１３９a〜１３９ｃを用いた復号を行うものとする。以下ではこの点をさらに詳しくマクロブロック単位の処理として説明する。

１．C0成分ヘッダ情報のみが多重化される場合
マクロブロックヘッダ共通化識別フラグ１２３ｃがC0成分ヘッダ情報１３９ａのみをC1,C2成分にも共通に用いるヘッダ情報として多重化することを示している場合は、C0、C1、C2の全成分に対して、C0成分ヘッダ情報１３９ａに含まれている各種マクロブロックヘッダ情報に基づいてマクロブロックの復号を行う。この場合は、C0成分スキップ指示情報１３８ａとC0成分ヘッダ情報１３９ａをC1、C2成分に対しても共通に適用することとするため、C1、C2成分についてのスキップ指示情報（１３８ｂ、１３８ｃ）、ヘッダ情報（１３９ｂ、１３９ｃ）はビットストリーム中に多重化されない。

可変長復号部２５はまずC0成分スキップ指示情報１３８ａを復号、評価する。ここでC0成分スキップ指示情報１３８ａが「スキップ」であることを示す場合は、C0成分ヘッダ情報１３９ａは符号化されていないものとみなし、C0成分ヘッダ情報１３９ａのうちの変換係数有効無効指示情報１４２はゼロ(符号化されている変換係数がまったくない)であるとみなす。これにより、C0〜C2成分変換係数データ（１４０ａ〜１４０ｃ）はすべて符号化されていないものとみなされ、マクロブロック中の量子化済み変換係数１０を全てゼロとして出力する。さらに、スキップマクロブロックの定義に従って、C0、C1、C2全成分の動きベクトル１３７を同一値に設定し出力する。

C0成分スキップ指示情報１３８ａが「スキップ」でないことを示す場合は、C0成分ヘッダ情報１３９ａが存在するものとし、その復号を行う。C0成分ヘッダ情報１３９ａの中で、マクロブロックタイプ１２８ｂがイントラ符号化を示していれば、イントラ予測モード１４１、変換係数有効無効指示情報１４２、(変換係数有効無効指示情報１４２が０でなければ)量子化パラメータを復号する。ここで変換係数有効無効指示情報１４２がゼロでなければ、C0〜C2成分変換係数データ（１４０ａ〜１４０ｃ）を復号して量子化済み変換係数１０の形式で出力する。変換係数有効無効指示情報１４２がゼロの場合は、C0〜C2成分変換係数データ（１４０ａ〜１４０ｃ）はすべてゼロであるとし、マクロブロック中の量子化済み変換係数１０を全てゼロとして出力する。マクロブロックタイプ１２８ｂがインター符号化を示していれば、必要に応じてサブマクロブロックタイプ１２９ｂを復号し、さらに参照画像識別番号１３２ｂ、動きベクトル情報１３３ｂ、変換係数有効無効指示情報１４２、(変換係数有効無効指示情報１４２が０でなければ)量子化パラメータ２１を復号する。ここで変換係数有効無効指示情報１４２がゼロでなければ、C0〜C2成分変換係数データ（１４０ａ〜１４０ｃ）を復号して量子化済み変換係数１０の形式で出力する。変換係数有効無効指示情報１４２がゼロの場合は、C0〜C2成分変換係数データ（１４０ａ〜１４０ｃ）はすべてゼロであるとし、マクロブロック中の量子化済み変換係数１０を全てゼロとして出力する。以上の動作による可変長復号部２５からの出力を用いて所定の処理手順に従ってマクロブロックの復号を行う点は実施の形態７と同様である。

２．C0、C1、C2成分について各対応ヘッダ情報が多重化される場合
マクロブロックヘッダ共通化識別フラグ１２３ｃがC1成分ヘッダ情報１３９ｂ、C2成分ヘッダ情報１３９ｃをC0成分ヘッダ情報１３９ａとは別にそれぞれ個別に拡張ヘッダ情報として多重化することを示している場合は、C0、C1、C2の各成分に対して、それぞれ対応するヘッダ情報（１３９ａ〜１３９ｃ）に含まれる各種マクロブロックヘッダ情報に基づいて各成分画像の復号を行う。この場合は、C1、C2成分についてのスキップ指示情報（１３８ｂ、１３８ｃ）、ヘッダ情報（１３９ｂ、１３９ｃ）がビットストリームに多重化される。

可変長復号部２５はまずC0成分スキップ指示情報１３８ａを復号、評価する。ここでC0成分スキップ指示情報１３８ａが「スキップ」であることを示す場合は、C0成分ヘッダ情報１３９ａは符号化されていないものとみなし、C0成分ヘッダ情報１３９ａのうちの変換係数有効無効指示情報１４２はゼロ(符号化されている変換係数がまったくない)であるとみなす。これにより、C0成分変換係数データ１４０ａは符号化されていないものとみなされ、C0成分における量子化済み全変換係数をゼロとする(つまり、マクロブロックヘッダ共通化識別フラグ１２３ｃの値により、C0成分スキップ指示情報１３８ａと変換係数有効無効指示情報１４２の関係が変化する)。さらに、C0成分の動きベクトル１３７をC0成分スキップの場合の定義に従って設定し出力する。

C0成分スキップ指示情報１３８ａが「スキップ」でないことを示す場合は、C0成分ヘッダ情報１３９ａが存在するものとし、その復号を行う。C0成分ヘッダ情報１３９ａの中で、マクロブロックタイプ１２８ｂがイントラ符号化を示していれば、イントラ予測モード１４１(フレーム内の被予測対象画素の近傍画素を予測値として用いることにする空間画素予測のモード)と、変換係数有効無効指示情報１４２、(変換係数有効無効指示情報１４２が０でなければ)量子化パラメータ２１を復号する。ここで変換係数有効無効指示情報１４２がゼロでなければ、C0成分変換係数データを復号して量子化済み変換係数１０の形式で出力する。変換係数有効無効指示情報がゼロの場合は、C0成分変換係数データはすべてゼロであるとする。マクロブロックタイプがインター符号化を示していれば、必要に応じてサブマクロブロックタイプを復号し、さらに参照画像識別番号、動きベクトル情報、変換係数有効無効指示情報、(変換係数有効無効指示情報が０でなければ)量子化パラメータを復号する。ここで変換係数有効無効指示情報がゼロでなければ、C0成分変換係数データを復号して量子化済み変換係数１０の形式で出力する。変換係数有効無効指示情報がゼロの場合は、C0成分変換係数データはすべてゼロであるとする。以上の処理手順を、C1、C2に対しても同様に行う。
以上の動作による可変長復号部２５からの出力を用いて所定の処理手順に従ってマクロブロック中のC0、C1、C2の各成分の復号を行う点は実施の形態７と同様である。

以上は復号装置側での動作を中心に述べたが、このようにビットストリームを構成することにより、以下の効果が得られる。まず、従来のAVCではマクロブロックあたりに利用可能なヘッダ情報（図５０）は1組しかなく、このヘッダ情報にしたがってC0〜C2の全成分をひとまとめでイントラ・インター判定を行って符号化を行う必要があった。一方、４：４：４フォーマットのように、画像信号の内容を伝える輝度信号相当の信号成分が3つの色成分に等価に含まれる場合に対しては、各成分への入力映像信号へのノイズの乗り方等に起因する信号特性のばらつきが生じることがあり、必ずしもC0〜C2の全成分をひとまとめで符号化することが最適ではないことがある。本実施の形態１１における図４９、図５０のビットストリーム構成を前提にすることで、符号化装置は、マクロブロックヘッダ共通化識別フラグ１２３ｃによって、C0〜C2の各成分ごとに信号特性に応じた最適な符号化モード(イントラ・インター符号化種別を含むマクロブロックタイプ)、動きベクトルなどを選択して符号化を行うことができ、符号化効率を高めることができる。また、従来はC0〜C2の全成分をひとまとめにしたマクロブロックの単位で符号化を行っていたため、全成分の符号化情報がすべて存在しないことを条件にスキップと判定を行っていたが、本実施の形態１１では、各成分ごとに符号化情報の有無をスキップ指示情報１３８で判別できるように構成したため、ある成分だけがスキップだが、別の成分はスキップでないというような場合に、全成分をスキップでないとする必要がなく、より効率的に符号量の割り当てを行うことが可能となる。なお、符号化装置において、スキップ指示情報１３８の値は、可変長符号化部１１にて、量子化済み変換係数データ１０と動きベクトル１３７・参照画像識別番号１３２ｂ、マクロブロックタイプ／サブマクロブロックタイプ１０６に基づき、段落０２２０で述べたような符号化装置・復号装置の双方で一意に規定されるスキップマクロブロックの定義に従って決定される。

なお、本実施の形態１１による符号化装置・復号装置が扱うビットストリームの構成は、図５１のようにしてもよい。この例では、C0、C1、C2の各成分のスキップ指示情報（１３８）、ヘッダ情報（１３９ａ〜１３９ｃ）、変換係数データ（１４０ａ〜１４０ｃ）をそれぞれまとめて配置するようにした。この際、スキップ指示情報１３８は、C0、C1、C2の各状態をそれぞれ1ビットの符号シンボルで並べてもよいし、8状態を1つの符号シンボルにまとめて符号化するようにしてもよい。色成分間でスキップ状態に相関が高い場合は、符号シンボルをまとめて適切に算術符号化のコンテクストモデル（実施の形態１２で後述）を定義することによって、スキップ指示情報１３８そのものの符号化効率を高めることもできる。

なお、マクロブロックヘッダ共通化識別フラグ１２３ｃは、マクロブロック、スライス、ピクチャ、シーケンスなどの任意のデータレイヤの単位でビットストリームに多重してもよい。入力信号において定常的に色成分間の信号の性質の違いがある場合には、マクロブロックヘッダ共通化識別フラグ１２３ｃをシーケンスの単位で多重化するように構成すれば、より少ないオーバヘッド情報で効率的な符号化を行うことができる。マクロブロックヘッダ共通化識別フラグ１２３ｃをピクチャの単位で多重化するように構成すれば、マクロブロックタイプのバリエーションが少ないIピクチャではヘッダを共通化し、マクロブロックタイプのバリエーションが多いP、Bピクチャでは色成分ごとに個別のヘッダを使用することで符号化効率と演算負荷のバランスを改善するなどの効果が期待できる。さらにピクチャレイヤでの切り替えは、シーンチェンジなど、ピクチャごとに信号の性質が変化するような映像信号の符号化制御の観点からも望ましいといえる。マクロブロックヘッダ共通化識別フラグ１２３ｃをマクロブロックの単位で多重化することにすると、マクロブロックあたりの符号量が増加する反面、マクロブロックの単位で各色成分の信号状態を踏まえてヘッダ情報の共通化を行うか否かを制御することが可能となり、画像の局所的な信号の変動によりよく追随して圧縮効率を向上させる符号化装置を構成することができる。

AVCのようにピクチャタイプ相当の符号化タイプがスライスレベルで切り替わる場合は、マクロブロックヘッダ共通化識別フラグ１２３ｃをスライスごとに多重し、同フラグが「C0、C1、C2で共通」であることを示す場合は当該スライスは３つの色成分の符号化情報をすべて含むようにビットストリームを構成し、また、同フラグが「C0、C1、C2で共通」でないことを示す場合は、１つのスライスが１つの色成分の情報を含むようにビットストリームを構成する方法が考えられる。この様子を図５２に示す。図５２において、マクロブロックヘッダ共通化識別フラグ１２３ｃには、「カレントスライスは３つの色成分の符号化情報をすべて含んでいる」か「カレントスライスはある特定の色成分の符号化情報を含んでいる」かのスライス構成識別情報としての意味を持たせている。もちろん、このようなスライス構成識別情報をマクロブロックヘッダ共通化識別フラグ１２３ｃとは別に用意してもよい。「カレントスライスはある特定の色成分の符号化情報を含んでいる」と識別される場合には、それが「C0、C1、C2のうちどれか」という識別を含むものとする。また、このようにしてスライス単位で、一つのマクロブロックヘッダをC0、C1、C2成分で共通に用いるか(C0、C1、C2混在スライス)、C0、C1、C2成分ごとにマクロブロックヘッダを個別に多重するか(C0スライス、C1スライス、C2スライス)を切り替える場合、１ピクチャ内でこれら2種類のスライスが混在する場合においては、C0スライス、C1スライス、C2スライスは常に画面内の同一位置のマクロブロックを符号化したデータとして組にしてビットストリームに多重する制約を設ける。すなわち、スライスヘッダに含まれてスライスの先頭マクロブロックのピクチャ内位置を示すfirst_mb_in_sliceの値は、一組のC0スライス、C1スライス、C2スライスで常に同一の値をとり、かつ、一組のC0スライス、C1スライス、C2スライスに含まれるマクロブロックの個数は同じ数とする。この様子を図５３に示す。ビットストリームの構成にこのような制約を設けることにより、符号化装置では、ピクチャ内の局所的な信号の性質に応じて、C0、C1、C2混在スライスと、C0スライス、C1スライス、C2スライスの組のうち、符号化効率の高い符号化方法を適応的に選択して符号化することができ、復号装置はそのようにして効率的に符号化されたビットストリームを受信して映像信号を再生できる。例えば、図３１の復号装置に入力されるビットストリーム２２がこのような構成であるとすると、可変長復号部２５ではスライスデータが入力されるたびにスライス構成識別情報をビットストリームから復号し、これから復号しようとするスライスが図５２のいずれのスライスかを識別する。スライス構成識別情報から、C0スライス、C1スライス、C2スライスの組として符号化データが構成されると判断される場合は、インター予測モード共通化識別フラグ１２３(またはマクロブロックヘッダ共通化識別フラグ１２３ｃ)の状態を「C0、C1、C2で個別のインター予測モードまたは(マクロブロックヘッダ)を使用」であると定めて復号動作を行うようにすればよい。各スライスのfirst_mb_in_sliceの値とスライス中のマクロブロック個数が等しいことが保証されるため、これに基づいてC0、C1、C2混在スライスとピクチャ上でのオーバラップやギャップを発生させることなく復号処理が可能である。

また、C0、C1、C2の各スライスの信号の性質が大きく異なる場合にこのような制約を設けることによる符号化効率の低下を回避するため、ピクチャ内で異なるスライス構成識別情報の値を持つスライスの混在を許可するかしないかをピクチャレベルまたはシーケンスレベルで選択可能とする識別情報を付与するように構成してもよい。

実施の形態１２．
本実施の形態１２では、実施の形態１１で述べた符号化装置および復号装置から派生する別の符号化装置、復号装置の実施例について述べる。本実施の形態１２における符号化装置・復号装置は、マクロブロック中のC0、C1、C2各成分の符号化を、適応算術符号化方式を用いて行う場合に、算術符号化に用いるシンボル生起確率ならびにその学習過程を全成分で共有するか、各成分ごとに分離するかを、ビットストリーム中に多重される指示情報によって適応的に切り替えることを特徴とする。

本実施の形態１２は、符号化装置では図３０の可変長符号化部１１、復号装置では図３１の可変長復号部２５内の処理のみが実施の形態１１と異なり、それ以外の動作は実施の形態１１に順ずる。以下、本実施の形態１２のポイントである算術符号化および復号処理について詳細に説明する。

１．符号化処理
図５４は可変長符号化部１１における算術符号化処理に関わる内部構成を、図５５及び図５６はその動作フローを示す。

本実施の形態１２における可変長符号化部１１は、符号化対象データである動きベクトル１３７、参照画像識別番号１３２ｂ、マクロブロックタイプ／サブマクロブロックタイプ１０６、イントラ予測モード１４１、量子化済み変換係数１０などの個々のデータタイプに対して定義されるコンテクストモデル（後述）を定めるコンテクストモデル決定部１１a、各符号化対象データタイプについて定められる二値化規則に従って多値データを二値データに変換する二値化部１１ｂ、二値化後の個々のbinの値(0 or 1)の生起確率を与える生起確率生成部１１ｃ、生成された生起確率に基づいて算術符号化を実行する符号化部１１ｄ、生起確率情報を記憶するメモリ１１ｇから構成される。コンテクストモデル決定部１１aへの入力は、動きベクトル１３７・参照画像識別番号１３２ｂ、マクロブロックタイプ／サブマクロブロックタイプ１０６、イントラ予測モード１４１、量子化済み変換係数１０など、可変長符号化部１１に符号化対象データとして入力される各種データであって、符号化部１１ｄからの出力はビデオストリーム２２のマクロブロックに関わる情報に相当する。

(1)コンテクストモデル決定処理（図５５におけるステップS160）
コンテクストモデルとは、情報源シンボルの生起確率の変動要因となる他の情報との依存関係をモデル化したものであり、この依存関係に対応して生起確率の状態を切り替えることで、よりシンボルの実際の生起確率に適応した符号化を行うことが可能となる。図５７にコンテクストモデル(ctx)の概念を示す。なお、図５７では情報源シンボルは二値としたが、多値でも構わない。図５７の0〜2というctxの選択肢は、このctxを用いる情報源シンボルの生起確率の状態が、状況に応じて変化するであろうことを想定して定義されている。本実施の形態１２における映像符号化で言えば、あるマクロブロックにおける符号化データとその周辺のマクロブロックの符号化データとの間の依存関係に応じてctxの値が切り替えられる。例えば、図５８に、D. Marpe他, 「Video Compression Using Context-Based Adaptive Arithmetic Coding」, International Conference on Image Processing 2001に開示されるマクロブロックの動きベクトルに関するコンテクストモデルの例を示す。図５８において、ブロックCの動きベクトルが符号化対象であり（正確には、ブロックCの動きベクトルを近傍から予測した予測差分値mvd_k(C)が符号化される）、ctx_mvd(C,k)がコンテクストモデルを示す。mvd_k(A)はブロックAにおける動きベクトル予測差分値、mvd_k(B)はブロックBにおける動きベクトル予測差分値をそれぞれ示し、コンテクストモデルの切り替え評価値e_k(C)の定義に用いられる。評価値e_k(C)は、近傍の動きベクトルのばらつき具合を示すことになり、一般的にはこのばらつきが小さい場合にはmvd_k(C)は小さく、逆にe_k(C)が大きい場合はmvd_k(C)も大きくなる傾向がある。したがって、mvd_k(C)のシンボル生起確率は、e_k(C)に基づいて適応化されることが望ましい。この生起確率のバリエーションセットがコンテクストモデルであり、このケースでは３種類の生起確率バリエーションがある、といえる。

この他、マクロブロックタイプ／サブマクロブロックタイプ１０６、イントラ予測モード１４１、量子化済み変換係数１０などの符号化対象データそれぞれについてあらかじめコンテクストモデルが定義され、符号化装置と復号装置で共有される。コンテクストモデル決定部１１ａでは、このような符号化対象データの種別に基づいてあらかじめ定められたモデルを選択する処理を行う（コンテクストモデルの中のどの生起確率バリエーションを選択するかは下記(3)の生起確率生成処理に該当する）。

(2)二値化処理（図５５におけるステップS161）
コンテクストモデルは、符号化対象データを二値化部１１ｂにて二値系列化し、二値系列の各bin(バイナリ位置)に応じて定められる。二値化の規則は、各符号化データの取りうる値のおおまかな分布に従い、可変長の二値系列への変換を行う。二値化は、本来多値を取りうる符号化対象データをそのまま算術符号化するよりもbin単位で符号化することにより確率数直線分割数を削減でき演算を簡略化できる、コンテクストモデルのスリム化が可能になるなどのメリットがある。

(3)生起確率生成処理（図５５におけるステップS162(ステップS162の詳細は図５６)）
上記(1)、(2)のプロセスで、多値の符号化対象データの二値化と、各binに適用するコンテクストモデルの設定が完了し、符号化準備が整う。次いで生起確率生成部１１ｃにて算術符号化に用いる生起確率状態の生成処理が行われる。各コンテクストモデルには、0/1の各値に対する生起確率のバリエーションが含まれているので、図５４に示すように、ステップS160で決定されたコンテクストモデル１１ｆを参照して処理を行う。図５８のe_k(C)に示したような生起確率選択のための評価値を定め、これに従って、参照するコンテクストモデルの選択肢の中からどの生起確率バリエーションを現在の符号化に用いるかを決定する（図５６のステップS162a）。さらに、本実施の形態１２における可変長符号化部１１は、生起確率情報記憶メモリ１１ｇを備え、符号化の過程で順次更新される生起確率状態１１ｈを色成分別に記憶する機構を備える。生起確率生成部１１ｃは、生起確率状態パラメータ共通化識別フラグ１４３の値に応じて、現在の符号化に用いる生起確率状態１１ｈをC0〜C2の色成分別に保持されたものから選択するか、C0成分用のものをC1、C2で共有するかを選択して、実際に符号化に用いる生起確率状態１１ｈを決定する(図５６のS162b〜S162d)。

生起確率状態パラメータ共通化識別フラグ１４３は、復号装置で同様の選択を行うことを可能とするため、ビットストリームに多重化する必要がある。このような構成とすることにより、以下の効果がある。例えば、図５８を例にとると、マクロブロックヘッダ共通化識別フラグ１２３ｃがC0成分ヘッダ情報１３９ａを他の成分でも使用することを示す場合、マクロブロックタイプ１２８ｂが１６ｘ１６予測モードを示していれば、図５８のe_k(C)はマクロブロックあたり１つだけ定まる。このときは、C0成分用に用意された生起確率状態を常時使用する。一方、マクロブロックヘッダ共通化識別フラグ１２３ｃが各成分に対応するヘッダ情報（１３９ａ〜１３９ｃ）を使用することを示す場合、マクロブロックタイプ１２８ｂがC0、C1、C2のいずれにおいても１６ｘ１６予測モードを示していれば、図５８のe_k(C)はマクロブロックあたり３つのバリエーションがありうる。後段の符号化部１１ｄでは、それぞれのバリエーションについて、C0成分で用意される生起確率状態１１ｈを共通的に使用、更新するか、または、各色成分別に用意される生起確率状態１１ｈを個別に使用、更新するかという2つの選択肢をとりうる。前者は、C0、C1、C2各成分でほぼ同じような動きベクトル分布をもつ場合、生起確率状態１１ｈを共通的に使用・更新することで学習回数が増え、よりよく動きベクトルの生起確率を学習できる可能性がある。後者は、逆にC0、C1、C2各成分でばらばらの動きベクトル分布をもつ場合、生起確率状態１１ｈを個別に使用・更新することで学習によるミスマッチを削減でき、よりよく動きベクトルの生起確率を学習できる可能性がある。映像信号は非定常であるため、このような適応制御が可能になることにより、算術符号化の効率を高めることができる。

(4)符号化処理
(3)によって、算術符号化プロセスに必要な確率数直線上の0/1各値の生起確率が得られるため、従来例にあげたプロセスにしたがって符号化部１１ｄにおいて算術符号化を行う（図５５のステップS163）。また、実際の符号化値(0 or 1)１１eは、生起確率生成部１１ｃへフィードバックされ、使用した生起確率状態１１ｈの更新のため、0/1発生頻度のカウントが行われる（ステップS164）。例えば、ある特定の生起確率状態１１ｈを用いて100個のbinの符号化処理が行われた時点で、当該生起確率バリエーションにおける0/1の生起確率が0.25、0.75であったとする。ここで、同じ生起確率バリエーションを用いて1が符号化されると、1の出現頻度が更新され、0/1の生起確率は0.247、0.752に変化する。このメカニズムにより、実際の生起確率に適応した効率的な符号化を行うことが可能となる。符号化値１１ｅは可変長符号化部１１からの出力となり、ビデオストリーム２２として符号化装置から出力される。

図５９は可変長復号部２５における算術復号処理に関わる内部構成を、図６０はその動作フローを示す。

本実施の形態１２における可変長復号部２５は、動きベクトル１３７・参照画像識別番号１３２ｂ、マクロブロックタイプ／サブマクロブロックタイプ１０６、イントラ予測モード１４１、量子化済み変換係数１０などの個々の復号対象データのタイプを特定して、それぞれに符号化装置と共通定義されるコンテクストモデルを定めるコンテクストモデル決定部１１a、復号対象データのタイプに基づいて定まる二値化規則を生成する二値化部１１ｂ、二値化規則とコンテクストモデルに従って、個々のbin(0 or 1)の生起確率を与える生起確率生成部１１ｃ、生成された生起確率に基づいて算術復号を実行し、その結果得られる二値系列と、上記二値化規則とから、動きベクトル１３７・参照画像識別番号１３２ｂ、マクロブロックタイプ／サブマクロブロックタイプ１０６、イントラ予測モード１４１、量子化済み変換係数１０などのデータを復号する復号部２５a、生起確率情報を記憶するメモリ１１ｇとから構成される。１１a〜１１ｃ及び１１ｇは図５４の可変長符号化部１１の内部構成要素と同一のものである。

(5)コンテクストモデル決定処理、二値化処理、生起確率生成処理
これらのプロセスは符号化装置側のプロセス(1)〜(3)に準ずる。なお、図示していないが、生起確率状態パラメータ共通化識別フラグ１４３は、ビデオストリーム２２からあらかじめ抽出されているものとする。

(6)算術復号処理
これから復号しようとするbinの生起確率が(6)までのプロセスで確定するため、復号部２５aにおいて、所定の算術復号処理プロセスにしたがって、binの値を復元する(図６０におけるステップS166)。binの復元値２５ｂは、生起確率生成部１１ｃへフィードバックされ、使用した生起確率状態１１ｈの更新のため、0/1発生頻度のカウントが行われる（ステップS164）。復号部２５aでは、各binの復元値が確定するごとに、二値化規則で定められる二値系列パターンとの合致を確認し、合致したパターンが指し示すデータ値を復号データ値として出力する(ステップS167)。復号データが確定しない限りは、ステップS166へ戻って復号処理を継続する。

以上の構成による、算術符号化ならびに算術復号処理を備えた符号化・復号装置によれば、マクロブロックヘッダ共通化識別フラグ１２３ｃに応じて適応的に色成分ごとの符号化情報を算術符号化する場合において、より効率的な符号化が可能となる。

なお、特に図示していないが、生起確率状態パラメータ共通化識別フラグ１４３を多重する単位はマクロブロック単位、スライス単位、ピクチャ単位、シーケンス単位のいずれでもよい。スライス、ピクチャ、シーケンスなどの上位データレイヤに位置するフラグとして多重化されるようにすることで、スライス以上の上位レイヤでの切り替えで十分な符号化効率が確保できる場合は、マクロブロックレベルで生起確率状態パラメータ共通化識別フラグ１４３を逐一多重化することなくオーバヘッドビットを削減できる。

また、生起確率状態パラメータ共通化識別フラグ１４３は、それ自体とは別のビットストリーム中に含まれる関連情報に基づいて復号装置の内部で定まる情報であってもよい。

本実施の形態１２において、マクロブロックヘッダ共通化識別フラグ１２３ｃをマクロブロック単位に算術符号化する際は、コンテクストモデル１１ｆについて図６１に示すモデルを用いる。図６１において、マクロブロックXにおけるマクロブロックヘッダ共通化識別フラグ１２３ｃの値をIDC_Xとする。マクロブロックCにおけるマクロブロックヘッダ共通化識別フラグ１２３ｃの符号化を行う場合は、マクロブロックAのマクロブロックヘッダ共通化識別フラグ１２３ｃの値IDC_Aと、マクロブロックBのマクロブロックヘッダ共通化識別フラグ１２３ｃの値IDC_Bとの値に基づいて、同図の式に基づいて、以下の3つの状態をとる。
・値０：A、Bの両方とも「C0、C1、C2で共通のマクロブロックヘッダを使用する」モードである
・値１：A、Bのうちいずれかが「C0、C1、C2で共通のマクロブロックヘッダを使用する」モードで、他方が「C0、C1、C2で個別のマクロブロックヘッダを使用する」モードである
・値２：A、Bの両方とも「C0、C1、C2で個別のマクロブロックヘッダを使用する」モードである
このようにマクロブロックヘッダ共通化識別フラグ１２３ｃを符号化することにより、近傍のマクロブロックの符号化状態に適合して算術符号化を行うことができ、符号化効率を高めることができる。なお、符号化側でも復号側でも同じ手順でコンテクストモデルを定義して算術復号することは、上記本実施の形態１２の復号装置の動作説明から自明である。

また、本実施の形態１２において、マクロブロックヘッダ中に含まれる図５０のヘッダ情報(マクロブロックタイプ、サブマクロブロックタイプ、イントラ予測モード、参照画像識別番号、動きベクトル、変換係数有効無効指示情報、量子化パラメータ)については、それぞれ各情報種別ごとに定義されるコンテクストモデルで算術符号化を行うが、いずれのコンテクストモデルも図６２に示すように、カレントマクロブロックCに対して、マクロブロックA、Bの対応する情報を参照して定義される。ここで、図６２(a)のように、マクロブロックCが「C0、C1、C2で共通のマクロブロックヘッダを使用する」モードであって、マクロブロックBが「C0、C1、C2で個別のマクロブロックヘッダを使用する」モードである場合には、コンテクストモデル定義上の参照情報として、C0、C1、C2のいずれか特定の色成分の情報を用いる。

例えば、C0、C1、C2が、R、G、B色成分に対応する場合は、画像の構造をよく表現する信号として従来から符号化に用いられてきた輝度信号に最も近い成分を持つG成分を選択するといった方法が考えられる。それは「C0、C1、C2で共通のマクロブロックヘッダを使用する」モードでも、G成分を基準にしてマクロブロックヘッダの情報を定めて符号化を行うケースが多いと考えられるからである。

一方、逆のケースで、図６２(b)のように、マクロブロックCが「C0、C1、C2で個別のマクロブロックヘッダを使用する」モードであって、マクロブロックBが「C0、C1、C2で共通のマクロブロックヘッダを使用する」モードが存在する場合には、マクロブロックCでは、3つの色成分のヘッダ情報を符号化・復号する必要があるが、その際、各色成分のヘッダ情報のコンテクストモデル定義上の参照情報として、マクロブロックBについては3成分共通のヘッダ情報を3成分同じ値として用いることとする。また、自明であるが、マクロブロックAもBもCもすべてマクロブロックヘッダ共通化識別フラグ１２３ｃが同じ値を示す場合は、それぞれ対応する参照情報が常に存在するのでそれらを用いることとする。

なお、符号化側でも復号側でも同じ手順でコンテクストモデルを定義して算術復号することは、上記本実施の形態１２の復号装置の動作説明から自明である。また、どの成分の情報を参照したコンテクストモデルを用いるかが決まった後は、そのコンテクストモデルに対応付けられている生起確率状態の更新は生起確率状態パラメータ共通化識別フラグ１４３の状態に基づいて実行する。

また、本実施の形態１２において、C0、C1、C2成分の各変換係数データについても各符号化対象データの生起確率分布に応じた算術符号化が行われる。これらのデータはマクロブロックヘッダを共通化するしないに関わらず、常に3成分分の符号化データがビットストリームに含まれる。本実施の形態１２では、符号化入力信号の色空間上でイントラ予測、インター予測が行われて予測差分信号が得られるので、予測差分信号を整数変換して得られる変換係数データの分布は、図６２のようなマクロブロックヘッダを共通化するしないといった周辺の状態に関わらず、同様の生起確率分布になると考えられる。そこで、本実施の形態１２では、C0、C1、C2の各成分ごとに、マクロブロックヘッダを共通化するしないに関わらず、共通のコンテクストモデルを定義して符号化・復号に用いる。

実施の形態１３．
本実施の形態１３では、実施の形態７〜１２で述べた符号化装置および復号装置から派生する別の符号化装置、復号装置の実施形態について述べる。本実施の形態１３における符号化装置・復号装置は、実施の形態７〜１２に記載の符号化装置の入力段で色空間変換処理を行い、撮像後に符号化装置へ入力される映像信号の色空間を符号化に適した任意の色空間に変換して、復号側で撮像時の色空間へ戻すための逆変換処理を指定する情報をビットストリームに多重化する符号化装置と、逆変換処理を指定する情報をビットストリームから抽出して、実施の形態７〜１２に記載の復号装置によって復号画像を得たのち、逆変換処理を指定する情報に基づいて逆色空間変換を行う構成を特徴とする。

本実施の形態１３における符号化装置・復号装置の構成を図６３に示す。図６３により本実施の形態１３の符号化装置・復号装置について説明する。

本実施の形態１３の符号化装置は、実施の形態７〜１２の符号化装置３０３に加えて、その前段に色空間変換部３０１を備える。色空間変換部３０１は、１つまたは複数の色空間変換処理を備え、入力される映像信号の性質やシステムの設定などによって使用する色空間変換処理を選択して入力映像信号に対する色空間変換処理を行い、その結果得られる変換映像信号３０２を符号化装置３０３へ送る。また、同時に使用した色空間変換処理を識別する情報を色空間変換方法識別情報３０４として符号化装置３０３へ出力する。符号化装置３０３は、変換映像信号３０２を符号化対象信号として実施の形態７〜１２に示す方法で圧縮符号化したビットストリーム３０５に、色空間変換方法識別情報３０４を多重して伝送路へ送出、または記録メディアへの記録を行う記録装置へ出力する。

ここで、用意される色空間変換方法は、例えば、従来標準で用いられているRGBからYUVへの変換
C0 = Y = 0.299 x R + 0.587 x G + 0.114 x B
C1 = U = -0.169 x R - 0.3316 x G + 0.500 x B
C2 = V = 0.500 x R - 0.4186 x G - 0.0813 x B
や、色成分間の予測、
C0 = G' = G
C1 = B' = B - f(G) (ただし、f(G): G成分に対するフィルタ処理結果)
C2 = R' = R - f(G)
や、RGBからYCoCgへの変換
C0 = Y = R/2 + G/2 + B/4
C1 = Co = R/2 - B/2
C2 = Cg = -R/4 + G/2 - B/4
のような変換がある。色空間変換部３０１に対する入力はRGBに限定する必要はなく、また変換処理も上記3種に限定するものではない。

本実施の形態１３の復号装置は、実施の形態７〜１２の復号装置３０６に加えて、その後段に逆色空間変換部３０８を備える。復号装置３０６はビットストリーム３０５を入力として、色空間変換方法識別情報３０４をビットストリーム３０５から抽出して出力するとともに、実施の形態７〜１２に記載の復号装置の動作により得られる復号画像３０７を出力する。逆色空間変換部３０８は、上記色空間変換部３０１で選択可能な色空間変換方法のそれぞれに対して対応する逆変換処理を備え、復号装置３０６から出力される色空間変換方法識別情報３０４に基づいて色空間変換部３０１で実行された変換を特定して、復号画像３０７に対して逆変換処理を施し、本実施の形態１３の符号化装置に対する入力映像信号の色空間へ戻す処理を行う。

本実施の形態１３のような符号化装置・復号装置によれば、符号化の前段と復号処理の後段で符号化される映像信号に対して最適な色空間の変換処理を行うことにより、３つの色成分から構成される画像信号中に含まれる相関を符号化前に除去して、冗長度を少なくした状態で符号化を行うことができ、圧縮効率を高めることができる。従来のMPEG等の標準符号化方式では、符号化対象の信号の色空間をYUVの1種類に限定していたが、色空間変換部３０１、逆色空間変換部３０８を備え、色空間変換方法識別情報３０４をビットストリーム３０５に含めることにより、符号化入力される映像信号の色空間に関する制限をなくすことができ、かつ色成分間の相関を取り除く複数種類の手段の中から最適な変換を用いて符号化することが可能になる。色空間変換方法識別情報３０４はピクチャ、スライス、マクロブロックといったレベルで多重するように構成してもよい。例えばマクロブロック単位で多重することにより、3つの色成分間の局所的な相関をもっともよく取り除くことができる変換を選択的に使用することができ、符号化効率を高めることができる。

本実施の形態１３では、色空間変換部３０１、逆色空間変換部３０８を常に動作させるという前提で記載したが、これらの処理部を動作させず、従来の規格との互換性を確保することを指示する情報を、シーケンスなどの上位のレイヤで符号化する構成をとることも可能である。

また、本実施の形態１３の色空間変換部３０１、逆色空間変換部３０８を、本実施の形態７〜１２の符号化装置、復号装置の内部構成に取り入れるようにして、予測差分信号レベルでの色空間変換を行うように構成することもできる。このように構成した符号化装置を図６４に、復号装置を図６５に示す。図６４の符号化装置では、直交変換部８の代わりに変換部３１０が、逆直交変換部１３の代わりに逆変換部３１２が備えられ、図６５の復号装置では、逆直交変換部１３の代わりに逆変換部３１２が備えられている。

変換部３１０は、符号化モード判定部５から出力されるC0、C1、C2成分の予測差分信号４に対して、上記色空間変換部３０１の処理として示したように、複数の色空間変換処理の中から最適な変換処理を選択して色空間変換をまず実行する。その後、色空間変換の結果に対して直交変換部８相当の変換を実行する。どの変換を選択したかを示す色空間変換方法識別情報３１１は可変長符号化部１１に送り、ビットストリームに多重してビデオストリーム２２として出力する。また、逆変換部３１２では、まず逆直交変換部１３相当の逆変換を行った後、色空間変換方法識別情報３１１で指定される色空間変換処理を用いて逆色空間変換処理を実行する。

復号装置では、可変長復号部２５でビットストリームから色空間変換方法識別情報３１１を抽出して、その結果を逆変換部３１２へ送ることで、上述の符号化装置における逆変換部３１２と同様の処理を行う。このように構成することで、色成分の間に残存する相関が予測差分領域で十分に除去できるような場合は、それを符号化処理の一部として実行するようにでき、符号化効率を高める効果がある。ただし、C0、C1、C2成分で個別のマクロブロックヘッダを用いる場合には、そもそもC0成分はイントラ予測、C1成分はインター予測といったように、成分ごとに予測の方法が変化しうるため、予測差分信号４の領域での相関が保持されにくいこともある。したがって、C0、C1、C2成分で個別のマクロブロックヘッダを用いる場合は、変換部３１０、逆変換部３１２は色空間変換を実行しないように動作させるようにしてもよいし、予測差分信号４の領域で色空間変換を実行するかしないかを識別情報としてビットストリームに多重するように構成してもよい。なお、色空間変換方法識別情報３１１はシーケンス、ピクチャ、スライス、マクロブロックのいずれの単位で切り替えられるようにしてもよい。

図６４、図６５の符号化装置、復号装置の構成では、C0、C1、C2成分の各変換係数データは、色空間変換方法識別情報３１１に応じて符号化対象信号の信号定義ドメインが異なることになる。したがって、色空間変換方法識別情報３１１に応じて、変換係数データの分布は、異なる生起確率分布になるのが一般的と考えられる。そこで、図６４、６５のように符号化装置、復号装置を構成する場合は、C0、C1、C2の各成分ごとに、色空間変換方法識別情報３１１の状態ごとに個別の生起確率状態が対応付けられたコンテクストモデルを用いて符号化・復号を行う。

実施の形態１４．
本実施の形態１４では、上記実施の形態で述べた符号化装置・復号装置につき、さらに具体的な装置構成について言及する。

上記実施の形態では、符号化装置・復号装置の動作説明を、例えば図１、図２、図３０、図３１等に準ずる図面を用いて実施した。これらの図面では、３つの色成分からなる入力映像信号を符号化装置に一括入力して、装置内部で３つの色成分を共通の予測モードやマクロブロックヘッダに基づいて符号化するか個々の予測モードやマクロブロックヘッダに基づいて符号化するかを選択しながら符号化を行い、その結果得られるビットストリームを復号装置に入力して、復号装置内部で３つの色成分が予測モードやマクロブロックヘッダに基づいて符号化されているか個々の予測モードやマクロブロックヘッダに基づいて符号化されているかを、ビットストリームから復号して取り出したフラグ（例えば、イントラ予測モード共通化識別フラグ２３、インター予測モード共通化識別フラグ１２３等）に基づいて選択しながら復号処理を行い再生映像を得る動作を説明した。上記フラグはマクロブロック、スライス、ピクチャ、シーケンスなどの任意のデータレイヤの単位で符号化・復号してもよい旨はすでに明記したが、本実施の形態１４では、特に、３つの色成分信号を共通のマクロブロックヘッダで符号化するか、個別のマクロブロックヘッダで符号化するかを1フレーム（ないしは１フィールド）の単位で切り分けながら符号化・復号する装置構成・動作を具体的な図面をもとに説明する。以下、特に断らない限り、「１フレーム」と記載した場合は１フレームないしは１フィールドのデータ単位とみなす。

本実施の形態１４におけるマクロブロックヘッダは、図１５のような変換ブロックサイズ識別フラグ、図５０のようなマクロブロックタイプ・サブマクロブロックタイプ・イントラ予測モードなどの符号化・予測モード情報、参照画像識別番号・動きベクトルなどの動き予測情報、変換係数有効無効指示情報、変換係数に対する量子化パラメータ等、変換係数データ以外のマクロブロックオーバヘッド情報を含むものとする。

以降、１フレームの３つの色成分信号を共通のマクロブロックヘッダで符号化する処理を「共通符号化処理」、１フレームの３つの色成分信号を個別の独立したマクロブロックヘッダで符号化する処理を「独立符号化処理」と記す。同様に、１フレームの３つの色成分信号が共通のマクロブロックヘッダで符号化されたビットストリームからフレーム画像データを復号する処理を「共通復号処理」、１フレームの３つの色成分信号が個別の独立したマクロブロックヘッダで符号化されたビットストリームからフレーム画像データを復号する処理を「独立復号処理」と記す。本実施の形態１４における共通符号化処理では、図６６に示すように、１フレーム分の入力映像信号を３つの色成分をまとめた形のマクロブロックに分割する。一方、独立符号化処理では、図６７に示すように、１フレーム分の入力映像信号を３つの色成分に分離し、それらを単一の色成分からなるマクロブロックに分割する。つまり、共通符号化処理の対象となるマクロブロックは、C0、C1、C2の３つの色成分のサンプルを含むが、独立符号化処理の対象となるマクロブロックは、C0またはC1またはC2成分のうちのいずれか１つの成分のサンプルのみを含む。

図６８は、本実施の形態１４の符号化装置・復号装置における、ピクチャ間の時間方向の動き予測参照関係を示す説明図である。この例では、太縦棒線で示されるデータ単位をピクチャとし、ピクチャとアクセスユニットとの関係を囲み点線で示している。共通符号化・復号処理の場合、１ピクチャは、３つの色成分が混在した１フレーム分の映像信号を表すデータであって、独立符号化・復号処理の場合、１ピクチャはいずれか１つの色成分の１フレーム分の映像信号とする。アクセスユニットは、映像信号に対してオーディオ・音声情報などとの同期などを目的とするタイムスタンプを付与する最小データ単位であり、共通符号化・復号処理の場合、１つのアクセスユニットには１ピクチャ分のデータを含む（図６８の４２７ａ）。一方、独立符号化・復号処理の場合は１つのアクセスユニットに３つのピクチャが含まれる（図６８の４２７ｂ）。これは独立符号化・復号処理の場合、３つの色成分すべての同一表示時刻のピクチャがそろってはじめて１フレーム分の再生映像信号が得られるためである。なお、各ピクチャの上部に付与した番号は、ピクチャの時間方向の符号化・復号処理順序（AVCのframe_num）を示す。図６８では、ピクチャ間の矢印は動き予測の参照方向を示している。すなわち、独立符号化・復号処理の場合、同一アクセスユニットに含まれるピクチャの間での動き予測参照、ならびに異なる色成分間での動き予測参照は行わないものとし、C0、C1、C2の各色成分のピクチャを同一色成分の信号に限定して予測参照しながら符号化・復号する。このような構成とすることにより、本実施の形態１４における独立符号化・復号処理の場合は、各色成分の符号化・復号を、他の色成分の符号化・復号処理に全く依存することなく実行でき、並列処理が容易になる。

なお、AVCでは、自身はイントラ符号化を行うとともに、動き補償予測に用いる参照画像メモリの内容をリセットするIDR（instantaneous decoder refresh）ピクチャが定義されている。IDRピクチャは他のいかなるピクチャにも依存せずに復号可能であるためランダムアクセスポイントとして利用される。共通符号化処理の場合のアクセスユニットは、１アクセスユニット＝１ピクチャであるが、独立符号化処理の場合のアクセスユニットでは１アクセスユニットが複数ピクチャで構成されるため、ある色成分ピクチャがIDRピクチャである場合は他の残りの色成分ピクチャもIDRピクチャとして、IDRアクセスユニットを定義し、ランダムアクセス機能を確保する。

以下、共通符号化処理による符号化を行ったか、独立符号化処理による符号化を行ったかを示す識別情報を、本実施の形態１４では、共通符号化・独立符号化識別信号と呼ぶ。

図６９は、本実施の形態１４の符号化装置で生成され、本実施の形態１４の復号装置が入力・復号処理の対象とするビットストリームの構造の一例を示す説明図である。図６９は、シーケンスからフレームレベルまでのビットストリーム構成を示したもので、まず、シーケンスレベルの上位ヘッダ（AVCの場合、シーケンスパラメータセットなど）に、共通符号化・独立符号化識別信号４２３を多重しておく。個々のフレームはアクセスユニットの単位で符号化される。AUDとは、AVCにおいてアクセスユニットの切れ目を識別するためのユニークなNALユニットであるAccess Unit Delimiter NALユニットを示す。共通符号化・独立符号化識別信号４２３が「共通符号化処理によるピクチャ符号化」を示す場合は、アクセスユニットには１ピクチャ分の符号化データが含まれる。このときのピクチャは、前述のように３つの色成分が混在した１フレーム分の映像信号を表すデータであるとする。このとき、i番目のアクセスユニットの符号化データはスライスデータ Slice(i,j) の集合として構成される。jは、１ピクチャ内のスライスデータのインデックスである。

一方、共通符号化・独立符号化識別信号４２３が「独立符号化処理によるピクチャ符号化」を示す場合は、１ピクチャはいずれか１つの色成分の１フレーム分の映像信号である。このとき、p番目のアクセスユニットの符号化データは、アクセスユニット内のq番目のピクチャのスライスデータ Slice(p,q,r) の集合として構成される。rは、１ピクチャ内のスライスデータのインデックスである。RGBのように色成分が３成分で構成される映像信号の場合、qがとり得る値の個数は３である。また、３原色からなる映像信号に加えて例えばアルファブレンディングのための透過度情報のような付加データを同一アクセスユニットとして符号化・復号する場合や、４成分以上の色成分(例えばカラー印刷で使用されるYMCKなど)で構成される映像信号を符号化・復号する場合などは、qがとり得る値の個数は４以上となるように設定する。本実施の形態１４における符号化装置、復号装置は、独立符号化処理を選択すれば、映像信号を構成する各色成分をまったく独立に符号化するため、原理的に符号化・復号処理を変更することなく、色成分の枚数を自在に変更できる。将来、映像信号の色表現を行うための信号形式が変更された場合にも、本実施の形態１４における独立符号化処理で対応可能となる効果がある。

このような構成を実現するために、本実施の形態１４では、共通符号化・独立符号化識別信号４２３は「１アクセスユニット内に含まれ、各々が相互に動き予測参照することなく独立に符号化されるピクチャの数」という形で表現する。このとき、共通符号化・独立符号化識別信号４２３は上記パラメータqがとり得る値の個数で表現できることになり、このパラメータがとり得る値の個数を以降、num_pictures_in_auと呼ぶ。つまり、num_pictures_in_au = 1は「共通符号化処理」を示し、num_pictures_in_au = 3は本実施の形態１４における「独立符号化処理」を示す。色成分が４以上となる場合、num_pictures_in_au > 3なる値に設定すればよい。このようなシグナリングを行うことによって、復号装置はnum_pictures_in_auを復号、参照すれば共通符号化処理による符号化データと独立符号化処理による符号化データの区別ができるだけでなく、１つのアクセスユニット内に何枚の単一色成分ピクチャが存在するかを同時に知ることができ、将来の映像信号の色表現拡張への対応も可能にしつつ、共通符号化処理と独立符号化処理をビットストリーム中でシームレスに扱うことが可能である。

図７０は、共通符号化処理、独立符号化処理それぞれの場合のスライスデータのビットストリーム構成を示す説明図である。独立符号化処理によって符号化されたビットストリームでは、後述する効果を達成するため、復号装置で受信したスライスデータがアクセスユニット内のどの色成分のピクチャに属するスライスかを識別可能なように、スライスデータの先頭のヘッダ領域に色成分識別フラグ(color_channel_idc)を付与する。color_channel_idcは、その値が同じスライスをグループ化する。つまり、color_channel_idcの値が異なるスライス間では、いかなる符号化・復号の依存性（例えば動き予測参照、CABACのコンテキストモデリング・生起確率学習など）も持たせないものとする。このように規定することで、独立符号化処理の場合のアクセスユニット内の個々のピクチャの独立性が確保される。また、各スライスヘッダに多重されるframe_num（スライスが属するピクチャの符号化・復号処理順序）については、１アクセスユニット内の全色成分ピクチャにおいて同一の値とする。

図７１は、本実施の形態１４の符号化装置の概略構成を示す説明図である。図７１において、共通符号化処理は第１のピクチャ符号化部５０３ａにおいて実行され、独立符号化処理は第２のピクチャ符号化部５０３ｂ０、５０３ｂ１、５０３ｂ２(３つの色成分分を用意)において実行される。入力映像信号１は、スイッチ(SW)５０１によって第１のピクチャ符号化部５０３ａか、色成分分離部５０２および第２のピクチャ符号化部５０３ｂ０〜５０３ｂ２のいずれかに供給される。スイッチ５０１は、共通符号化・独立符号化識別信号４２３によって駆動され、入力映像信号１を指定されたパスへ供給する。以下では、共通符号化・独立符号化識別信号(num_pictures_in_au)４２３は、入力映像信号が４：４：４フォーマットの場合にシーケンスパラメータセットに多重され、シーケンスの単位で共通符号化処理と独立符号化処理を選択する信号とする場合について説明する。これは上記実施の形態７で述べたインター予測モード共通化識別フラグ１２３や、上記実施の形態１１で述べたマクロブロックヘッダ共通化識別フラグ１２３ｃと概念的に同一である。共通符号化処理を用いた場合は復号装置側では共通復号処理を実行し、独立符号化処理を用いた場合は復号装置側では独立復号処理を実行する必要があるため、共通符号化・独立符号化識別信号４２３はそれを指定する情報としてビットストリームに多重する必要がある。そのため、共通符号化・独立符号化識別信号４２３は多重化部５０４へ入力される。この共通符号化・独立符号化識別信号４２３の多重化単位は、シーケンス内のいくつかのピクチャ群からなるGOP(グループ・オブ・ピクチャ)の単位など、ピクチャよりも上位レイヤであればどのような単位であってもよい。

第１のピクチャ符号化部５０３ａでは、共通符号化処理を実行するために、入力映像信号１を図６６に示すように３つの色成分のサンプルをまとめた形式のマクロブロックへ分割して、その単位で符号化処理を進める。第１のピクチャ符号化部５０３ａにおける符号化処理は後述する。独立符号化処理が選択された場合は、入力映像信号１は色成分分離部５０２でC0、C1、C2の１フレーム分のデータへ分離され、それぞれ対応する第２のピクチャ符号化部５０３ｂ０〜５０３ｂ２へ供給される。第２のピクチャ符号化部５０３ｂ０〜５０３ｂ２では、色成分ごとに分離された１フレーム分の信号を図６７に示す形式のマクロブロックへ分割して、その単位で符号化処理を進める。第２のピクチャ符号化部における符号化処理は後述する。

第１のピクチャ符号化部５０３ａには、３つの色成分からなる１ピクチャ分の映像信号が入力され、符号化データはビデオストリーム４２２ａとして出力される。第２のピクチャ符号化部５０３ｂ０〜５０３ｂ２には、単一色成分からなる１ピクチャ分の映像信号が入力され、符号化データはビデオストリーム４２２ｂ０〜４２２ｂ２として出力される。これらビデオストリームは、共通符号化・独立符号化識別信号４２３の状態に基づいて多重化部５０４でビデオストリーム４２２ｃの形式に多重化され、出力される。

ビデオストリーム４２２ｃの多重化に際しては、独立符号化処理される場合のアクセスユニット中では、スライスデータのビットストリーム中での多重化順、伝送順を、アクセスユニット内のピクチャ（各色成分）間でインタリーブ可能とする（図７２）。この場合、復号装置側では、受信したスライスデータが、アクセスユニット内のどの色成分に属するスライスかを識別する必要がある。そのために、スライスデータの先頭のヘッダ領域に図７０のように多重する色成分識別フラグを利用する。

このような構成にすることにより、符号化装置では、図７１の符号化装置のように３つの色成分のピクチャをそれぞれ独立な第２のピクチャ符号化部５０３ｂ０〜５０３ｂ２の３セット使用して、並列処理により符号化を行う場合に、他の色成分ピクチャの符号化データの完成を待たずに、自身のピクチャのスライスデータが準備できればすぐに符号化データを送出可能となる。ＡＶＣでは１ピクチャを複数のスライスデータに分割して符号化することができ、スライスデータ長やスライス内に含まれるマクロブロックの個数については、符号化条件に応じて柔軟に変化させることができる。画像空間上で隣り合うスライスの間では、スライスの復号処理の独立性を確保するため、イントラ予測や算術符号化などの近傍コンテクストの利用ができないため、スライスデータ長はできるだけ長いほうが符号化効率は高い。一方、伝送や記録の過程でビットストリームに誤りが混入した場合は、スライスデータ長が短いほど誤りからの復帰が早まり、品質劣化を抑えやすくなる。色成分識別フラグを多重化することなく、スライスの長さや構成、色成分の順序などを固定的にしてしまうと、符号化装置においてビットストリームの生成条件が固定化されてしまい、多様な符号化要求条件に柔軟に対応することができなくなる。

また、図７２のようにビットストリームを構成することができれば、符号化装置では伝送に必要な送信バッファサイズ、すなわち符号化装置側での処理遅延を小さくすることができる。その様子を図７２に示す。もしピクチャをまたがるスライスデータの多重が許容されない場合、符号化装置は、ある特定の色成分のピクチャの符号化が終了するまでの間、他のピクチャの符号化データをバッファリングさせる必要がある。これはピクチャレベルでの遅延が発生することを意味する。一方、図７２最下部に示すように、スライスレベルでインタリーブ可能とすれば、ある特定の色成分のピクチャ符号化部はスライスデータの単位で符号化データを多重化部に出力することができ、遅延を抑制することができる。

なお、１つの色成分ピクチャ内においては、それに含まれるスライスデータはマクロブロックのラスタスキャン順で伝送するようにしてもよいし、１つのピクチャ内でもインタリーブ伝送を可能とするように構成してもよい。

以下、第１および第２のピクチャ符号化部の動作を詳しく説明する。

第1のピクチャ符号化部の動作概要
第１のピクチャ符号化部５０３ａの内部構成を図７３に示す。図７３において、入力映像信号１は、４：４：４フォーマットで、かつ図６６の形式の３つの色成分をまとめたマクロブロックの単位で入力されるものとする。

まず、予測部４６１において、メモリ１６ａに格納される動き補償予測参照画像データの中から参照画像を選択し、該マクロブロックの単位で動き補償予測処理が行われる。メモリ１６ａには、複数時刻に渡る、３つの色成分で構成される複数枚の参照画像データが格納され、予測部４６１では、これらの中からマクロブロックの単位で最適な参照画像を選択して動き予測を行う。メモリ１６ａ内の参照画像データの配置は、色成分ごとに面順次で分けて格納してもよいし、各色成分のサンプルを点順次で格納してもよい。動き補償予測を行うブロックサイズは７種類用意されており、まずマクロブロック単位に、図３２(a)から(d)に示すように、１６ｘ１６、１６ｘ８、８ｘ１６、８ｘ８のいずれかのサイズを選択することができる。さらに８ｘ８が選択された場合には、各８ｘ８ブロックごとに、図３２(e)から(h)に示すように、８ｘ８、８ｘ４、４ｘ８、４ｘ４のいずれかのサイズを選択することができる。

予測部４６１では、図３２のすべてまたは一部のブロックサイズ・サブブロックサイズ、および所定の探索範囲の動きベクトルおよび利用可能な１枚以上の参照画像に対してマクロブロックごとに動き補償予測処理を実行して、動きベクトル情報と予測に用いる参照画像識別番号４６３と減算器３により、動き補償予測単位となるブロックごとの予測差分信号４を得る。予測差分信号４は符号化モード判定部５においてその予測効率が評価され、予測部４６１で実行した予測処理の中から、予測対象のマクロブロックに対して最適な予測効率が得られるマクロブロックタイプ／サブマクロブロックタイプ１０６と動きベクトル情報・参照画像識別番号４６３を出力する。マクロブロックタイプ、サブマクロブロックタイプ、参照画像インデックス、動きベクトルなどのマクロブロックヘッダ情報はすべて、３つの色成分に対して共通のヘッダ情報として決定され、符号化に使用され、ビットストリームに多重化される。予測効率の最適性の評価にあたっては、演算量を抑制する目的で、ある所定の色成分（たとえばＲＧＢのうちのＧ成分、ＹＵＶのうちのＹ成分など）に対する予測誤差量だけを評価してもよいし、演算量は大きくなるが最適な予測性能を得るべくすべての色成分についての予測誤差量を総合評価するようにしてもよい。また、最終的なマクロブロックタイプ／サブマクロブロックタイプ１０６の選定にあたっては、符号化制御部１９の判断で定まる各タイプに対する重み係数２０が加味されることもある。

同様に、予測部４６１では、イントラ予測も実行する。イントラ予測実行時は、出力信号４６３には、イントラ予測モード情報が出力される。以降、特にイントラ予測、動き補償予測を区別しない場合には、出力信号４６３はイントラ予測モード情報、動きベクトル情報、参照画像識別番号をまとめて予測オーバヘッド情報と呼ぶ。イントラ予測についても所定の色成分だけの予測誤差量を評価してもよいし、すべての色成分についての予測誤差量を総合評価するようにしてもよい。最後に、マクロブロックタイプをイントラ予測にするか、インター予測にするかを、符号化モード判定部５において予測効率または符号化効率で評価して選定する。

選定されたマクロブロックタイプ／サブマクロブロックタイプ１０６と、予測オーバヘッド情報４６３に基づくイントラ予測・動き補償予測によって得られる予測差分信号４を変換部３１０へ出力する。変換部３１０は入力される予測差分信号４を変換し変換係数として量子化部９へ出力する。この際、変換を行う単位となるブロックのサイズを４ｘ４か８ｘ８のいずれかから選択するようにしてもよい。変換ブロックサイズを選択可能とする場合は、符号化時に選択されたブロックサイズを、変換ブロックサイズ指定フラグ４６４の値に反映し、同フラグをビットストリームに多重化する。量子化部９は入力される変換係数を、符号化制御部１９によって定まる量子化パラメータ２１に基づいて量子化を行い、量子化済み変換係数１０として可変長符号化部１１へ出力する。量子化済み変換係数１０は、３つの色成分分の情報を含み、可変長符号化部１１にてハフマン符号化や算術符号化などの手段によりエントロピー符号化される。また、量子化済み変換係数１０は逆量子化部１２、逆変換部３１２を経て局部復号予測差分信号１４へ復元され、選定されたマクロブロックタイプ／サブマクロブロックタイプ１０６と予測オーバヘッド情報４６３に基づいて生成される予測画像７と加算器１８で加算することで局部復号画像１５が生成される。局部復号画像１５は、デブロッキングフィルタ４６２でブロックひずみ除去処理を実施した後、以降の動き補償予測処理に用いるためメモリ１６ａへ格納される。可変長符号化部１１には、当該マクロブロックに対してデブロッキングフィルタを施すか否かを示すデブロッキングフィルタ制御フラグ２４も入力される。

可変長符号化部１１に入力される量子化済み変換係数１０、マクロブロックタイプ／サブマクロブロックタイプ１０６、予測オーバヘッド情報４６３、量子化パラメータ２１は所定の規則（シンタックス）に従ってビットストリームとして配列・整形され、図６６の形式のマクロブロックが１つないしは複数個まとまったスライスデータの単位でＮＡＬユニット化された符号化データとして送信バッファ１７へ出力される。送信バッファ１７では符号化装置が接続される伝送路の帯域や記録媒体の読み出し速度に合わせてビットストリームを平滑化してビデオストリーム４２２ａとして出力する。また、送信バッファ１７中のビットストリーム蓄積状況に応じて符号化制御部１９へフィードバックをかけ、以降の映像フレームの符号化における発生符号量を制御する。

なお、第１のピクチャ符号化部５０３ａの出力は、３成分をまとめた単位のスライスであってアクセスユニットをまとめた単位での符号量と等価であるため、送信バッファ１７はそのまま多重化部５０４内に配置してもよい。

本実施の形態１４における第１のピクチャ符号化部５０３ａでは、共通符号化・独立符号化識別信号４２３によってシーケンス中のすべてのスライスデータがＣ０、Ｃ１、Ｃ２混在スライス（すなわち、３つの色成分の情報が混在するスライス）であることが識別可能であるため、スライスヘッダに色成分識別フラグは多重化しない。

第２のピクチャ符号化部の動作概要
第２のピクチャ符号化部５０３ｂ０（５０３ｂ１、５０３ｂ２）の内部構成を図７４に示す。図７４において、入力映像信号１は、図６７の形式の単一色成分のサンプルからなるマクロブロックの単位で入力されるものとする。

まず、予測部４６１において、メモリ１６ｂに格納される動き補償予測参照画像データの中から参照画像を選択し、該マクロブロックの単位で動き補償予測処理を行う。メモリ１６ｂには、複数時刻に渡る、単一色成分で構成される複数枚の参照画像データを格納でき、予測部４６１では、これらの中からマクロブロックの単位で最適な参照画像を選択して動き予測を行う。メモリ１６ｂは３つの色成分分をまとめた単位でメモリ１６ａと共用するようにしてもよい。動き補償予測を行うブロックサイズには７種類用意されており、まずマクロブロック単位に、図３２(a)から(d)に示すように、１６ｘ１６、１６ｘ８、８ｘ１６、８ｘ８のいずれかのサイズを選択することができる。さらに８ｘ８が選択された場合には、各８ｘ８ブロックごとに、図３２(e)から(h)に示すように、８ｘ８、８ｘ４、４ｘ８、４ｘ４のいずれかのサイズを選択することができる。

予測部４６１では、図３２のすべてまたは一部のブロックサイズ・サブブロックサイズ、および所定の探索範囲の動きベクトルおよび利用可能な１枚以上の参照画像に対してマクロブロックごとに動き補償予測処理を実行して、動きベクトル情報と予測に用いる参照画像識別番号４６３と減算器３により、動き補償予測単位となるブロックごとの予測差分信号４を得る。予測差分信号４は符号化モード判定部５においてその予測効率が評価され、予測部４６１で実行した予測処理の中から、予測対象のマクロブロックに対して最適な予測効率が得られるマクロブロックタイプ／サブマクロブロックタイプ１０６と動きベクトル情報・参照画像識別番号４６３を出力する。マクロブロックタイプ、サブマクロブロックタイプ、参照画像インデックス、動きベクトルなどのマクロブロックヘッダ情報はすべて、入力映像信号１の単一色成分の信号に対するヘッダ情報として決定され、符号化に使用され、ビットストリームに多重化される。予測効率の最適性の評価にあたっては、符号化処理対象となる単一色成分に対する予測誤差量だけを評価する。また、最終的なマクロブロックタイプ／サブマクロブロックタイプ１０６の選定にあたっては、符号化制御部１９の判断で定まる各タイプに対する重み係数２０が加味されることもある。

同様に、予測部４６１では、イントラ予測も実行する。イントラ予測実行時は、出力信号４６３には、イントラ予測モード情報が出力される。以降、特にイントラ予測、動き補償予測を区別しない場合には、出力信号４６３はイントラ予測モード情報、動きベクトル情報、参照画像識別番号をまとめて予測オーバヘッド情報と呼ぶ。イントラ予測についても符号化処理対象となる単一色成分に対する予測誤差量だけを評価する。最後に、マクロブロックタイプをイントラ予測にするか、インター予測にするかを予測効率または符号化効率で評価して選定する。

選定されたマクロブロックタイプ／サブマクロブロックタイプ１０６と、予測オーバヘッド情報４６３によって得られる予測差分信号４を変換部３１０へ出力する。変換部３１０は入力される単一色成分分の予測差分信号４を変換し変換係数として量子化部９へ出力する。この際、変換を行う単位となるブロックのサイズを４ｘ４か８ｘ８のいずれかから選択するようにしてもよい。選択可能とする場合は、符号化時に選択されたブロックサイズを、変換ブロックサイズ指定フラグ４６４の値に反映し、同フラグをビットストリームに多重化する。量子化部９は入力される変換係数を、符号化制御部１９によって定まる量子化パラメータ２１に基づいて量子化を行い、量子化済み変換係数１０として可変長符号化部１１へ出力する。量子化済み変換係数１０は、単一色成分分の情報を含み、可変長符号化部１１にてハフマン符号化や算術符号化などの手段によりエントロピー符号化される。また、量子化済み変換係数１０は逆量子化部１２、逆変換部３１２を経て局部復号予測差分信号１４へ復元され、選定されたマクロブロックタイプ／サブマクロブロックタイプ１０６と予測オーバヘッド情報４６３に基づいて生成される予測画像７と加算器１８で加算することで局部復号画像１５が生成される。局部復号画像１５は、デブロッキングフィルタ４６２でブロックひずみ除去処理を実施した後、以降の動き補償予測処理に用いるためメモリ１６ｂへ格納される。可変長符号化部１１には、当該マクロブロックに対してデブロッキングフィルタを施すか否かを示すデブロッキングフィルタ制御フラグ２４も入力される。

可変長符号化部１１に入力される量子化済み変換係数１０、マクロブロックタイプ／サブマクロブロックタイプ１０６、予測オーバヘッド情報４６３、量子化パラメータ２１は所定の規則（シンタックス）に従ってビットストリームとして配列・整形され、図６７の形式のマクロブロックが１つないしは複数個まとまったスライスデータの単位でＮＡＬユニット化された符号化データとして送信バッファ１７へ出力される。送信バッファ１７では符号化装置が接続される伝送路の帯域や記録媒体の読み出し速度に合わせてビットストリームを平滑化してビデオストリーム４２２ｂ０（４２２ｂ１、４２２ｂ２）として出力する。また、送信バッファ１７中のビットストリーム蓄積状況に応じて符号化制御部１９へフィードバックをかけ、以降の映像フレームの符号化における発生符号量を制御する。

なお、第２のピクチャ符号化部５０３ｂ０〜５０３ｂ２の出力は、単一色成分のデータのみからなるスライスであって、アクセスユニットをまとめた単位での符号量制御が必要となる場合には、多重化部５０４内に全色成分のスライスを多重した単位での共通送信バッファを設け、同バッファの占有量をもとに各色成分の符号化制御部１９にフィードバックをかけるように構成してもよい。また、この際、全色成分の発生情報量だけを用いて符号化制御を行うようにしてもよいし、各色成分の送信バッファ１７の状態も加味して符号化制御を行うようにしてもよい。全色成分の発生情報量だけを用いて符号化制御を行う場合は、送信バッファ１７相当の機能を多重化部５０４内の共通送信バッファで実現することとして、送信バッファ１７を省略する構成をとることもできる。

本実施の形態１４における第２のピクチャ符号化部５０３ｂ０〜５０３ｂ２では、共通符号化・独立符号化識別信号４２３によってシーケンス中のすべてのスライスデータが単一色成分スライス（すなわち、Ｃ０スライスまたはＣ１スライスまたはＣ２スライス）であることが識別可能であるため、スライスヘッダに常に色成分識別フラグを多重化し、復号装置側でどのスライスがアクセスユニット内のどのピクチャデータに該当するかを識別できるようにする。このため、各第２のピクチャ符号化部５０３ｂ０〜５０３ｂ２は、それぞれの送信バッファ１７からの出力を１ピクチャ分ためることなく、１スライス分のデータがたまった時点で送出することができる。

なお共通符号化・独立符号化識別信号(num_pictures_in_au)は、共通符号化処理による符号化データと独立符号化処理による符号化データを区別する情報(共通符号化識別情報)と、１つのアクセスユニット内に何枚の単一色成分ピクチャが存在するかを示す情報(色成分の数)を同時に表現できるようにしたが、上記２つの情報を独立な情報として符号化してもよい。

なお、第１のピクチャ符号化部５０３ａと第２のピクチャ符号化部５０３ｂ０〜５０３ｂ２とは、マクロブロックヘッダ情報を３成分共通の情報として扱うか、単一の色成分の情報として扱うかの違いと、スライスデータのビットストリーム構成が異なるだけである。図７３や図７４における予測部や変換部・逆変換部、量子化部・逆量子化部、デブロッキングフィルタなどの基本的な処理ブロックの多くは、３つの色成分の情報とまとめて処理するか、単一の色成分の情報だけを扱うかの違いだけで、第１のピクチャ符号化部５０３ａと第２のピクチャ符号化部５０３ｂ０〜５０３ｂ２とで共通の機能ブロックで実現することもできる。したがって、図７１のような完全に独立な符号化処理部としてだけでなく、図７３や図７４の基本構成要素を適宜組み合わせて多様な符号化装置の実装を実現することができる。また、第１のピクチャ符号化部５０３ａにおけるメモリ１６ａの配置を面順次で持つことにすれば、参照画像格納メモリの構成を第１のピクチャ符号化部５０３ａと第２のピクチャ符号化部５０３ｂ０〜５０３ｂ２とで共通にできる。

なお、図示はしていないが、本実施の形態１４における符号化装置では、図６９、図７０の配列に従うビデオストリーム４２２ｃをバッファリングする仮想的なストリームバッファ（符号化ピクチャバッファ）と、復号画像４２７ａ、４２７ｂをバッファリングする仮想的なフレームメモリ（復号ピクチャバッファ）の存在を想定し、符号化ピクチャバッファのオーバーフロー・アンダーフローや、復号ピクチャバッファの破綻がないようにビデオストリーム４２２ｃを生成する。この制御は主として、符号化制御部１９で行う。これにより、復号装置において、ビデオストリーム４２２ｃを符号化ピクチャバッファと復号ピクチャバッファの動作（仮想バッファモデル）に従って復号する場合に、復号装置に破綻が生じないようにすることを保証する。仮想バッファモデルを以下に規定する。

符号化ピクチャバッファの動作はアクセスユニット単位で行う。上述のとおり、共通復号処理を行う場合には１アクセスユニットには１ピクチャ分の符号化データが含まれ、独立復号処理を行う場合には１アクセスユニットには色成分数分のピクチャ（３成分ならば３ピクチャ分）の符号化データが含まれている。符号化ピクチャバッファについて規定される動作は、アクセスユニットの最初のビットと最後のビットが符号化ピクチャバッファに入力される時刻とアクセスユニットのビットが符号化ピクチャバッファから読み出される時刻である。なお符号化ピクチャバッファからの読み出しは瞬時に行われると規定し、アクセスユニットのすべてのビットが同じ時刻に符号化ピクチャバッファから読み出されることする。アクセスユニットのビットは符号化ピクチャバッファから読み出されると、上位ヘッダ解析部へ入力され、上述のとおり、第１のピクチャ復号部または第２のピクチャ復号部にて復号処理が行われ、アクセスユニット単位に束ねられたカラー映像フレームとして出力される。なお符号化ピクチャバッファからビットを読み出して、アクセスユニット単位のカラー映像フレームとして出力するまでの処理は、仮想バッファモデルの規定上は瞬時に行われるものとする。アクセスユニット単位に構成されたカラー映像フレームは復号ピクチャバッファへ入力され、復号ピクチャバッファからの出力時刻が算出される。復号ピクチャバッファからの出力時刻は、符号化ピクチャバッファからの読み出し時刻に所定の遅延時間を加えた値である。この遅延時間はビットストリームに多重して復号装置を制御することが可能である。遅延時間が０の場合、すなわち復号ピクチャバッファからの出力時刻が符号化ピクチャバッファからの読み出し時刻に等しい場合には、カラー映像フレームが復号ピクチャバッファへ入力されると同時に復号ピクチャバッファから出力される。それ以外の場合、すなわち復号ピクチャバッファからの出力時刻が符号化ピクチャバッファからの読み出し時刻より遅い場合、復号ピクチャバッファからの出力時刻になるまでカラー映像フレームは復号ピクチャバッファに保存される。上述のとおり、アクセスユニット単位に復号ピクチャバッファからの動作が規定される。

図７５は、本実施の形態１４の復号装置の概略構成を示す説明図である。図７５において、共通復号処理は第1のピクチャ復号部６０３ａにおいて実行され、独立復号処理は色成分判定部６０２と第２のピクチャ復号部６０３ｂ０、６０３ｂ１、６０３ｂ２（３つの色成分分を用意）において実行される。

ビデオストリーム４２２ｃは、上位ヘッダ解析部６１０でＮＡＬユニット単位に分割され、シーケンスパラメータセットやピクチャパラメータセットなどの上位ヘッダ情報は、そのまま復号して復号装置内の第１のピクチャ復号部６０３ａ、色成分判定部６０２、第２のピクチャ復号部６０３ｂ０〜６０３ｂ２が参照可能な所定のメモリエリアへ格納しておく。シーケンス単位に多重される共通符号化・独立符号化識別信号４２３（num_pictures_in_au）は、上位ヘッダ情報の一部として復号・保持される。

復号されたnum_pictures_in_auはスイッチ（SW）６０１に供給され、スイッチ６０１はnum_pictures_in_au = 1ならば、ピクチャごとのスライスＮＡＬユニットを第１のピクチャ復号部６０３ａへ供給し、num_pictures_in_au = 3ならば、色成分判定部６０２に供給する。すなわち、num_pictures_in_au = 1ならば第１のピクチャ復号部６０３ａにより、共通復号処理が行われ、num_pictures_in_au = 3ならば３つの第２のピクチャ復号部６０３ｂ０〜６０３ｂ２により、独立復号処理が行われる。第１および第２のピクチャ復号部の詳細な動作は後述する。

色成分判定部６０２は、図７０で示した色成分識別フラグの値により、スライスＮＡＬユニットが現在のアクセスユニット内のいずれの色成分ピクチャに相当するかを識別して、適切な第２のピクチャ復号部６０３ｂ０〜６０３ｂ２へ分配供給する。このような復号装置の構成によって、図７２のようにアクセスユニット内でスライスがインタリーブされて符号化されたビットストリームを受信しても、どのスライスがどの色成分ピクチャに属するかを容易に判別し正しく復号できる効果がある。

第1のピクチャ復号部の動作概要
第１のピクチャ復号部６０３ａの内部構成を図７６に示す。第１のピクチャ復号部６０３ａは、図７１の符号化装置から出力される図６９、図７０の配列に従うビデオストリーム４４２ｃを、上位ヘッダ解析部６１０でＮＡＬユニット単位に分割した後、Ｃ０、Ｃ１、Ｃ２混在スライスの単位で受信して、図６６に示す３つの色成分のサンプルからなるマクロブロックを単位として復号処理を行い、出力映像フレームを復元する。

可変長復号部２５はＮＡＬユニットに分割されたビデオストリーム４４２ｃを入力とし、所定の規則（シンタックス）に従ってビデオストリーム４４２ｃを解読して、３成分分の量子化済み変換係数１０、および３成分で共通して用いられるマクロブロックヘッダ情報（マクロブロックタイプ／サブマクロブロックタイプ１０６、予測オーバヘッド情報４６３、変換ブロックサイズ指定フラグ４６４、量子化パラメータ２１）を抽出する。量子化済み変換係数１０は量子化パラメータ２１とともに、第１のピクチャ符号化部５０３ａと同じ処理を行う逆量子化部１２へ入力され、逆量子化処理が行われる。ついでその出力が第１のピクチャ符号化部５０３ａと同じ処理を行う逆変換部３１２へ入力され、局部復号予測差分信号１４へ復元される（変換ブロックサイズ指定フラグ４６４がビデオストリーム４２２ｃ中に存在すれば、それを逆量子化、逆変換処理過程で参照する）。一方、予測部４６１は、第１のピクチャ符号化部５０３ａ中の予測部４６１のうち、予測オーバヘッド情報４６３を参照して予測画像７を生成する処理だけが含まれ、予測部４６１に対してマクロブロックタイプ／サブマクロブロックタイプ１０６、予測オーバヘッド情報４６３が入力され、３成分分の予測画像７を得る。マクロブロックタイプがイントラ予測であることを示す場合は、予測オーバヘッド情報４６３からイントラ予測モード情報に従って３成分分の予測画像７を得、マクロブロックタイプがインター予測であることを示す場合は、予測オーバヘッド情報４６３から動きベクトル、参照画像インデックスに従って３成分分の予測画像７を得る。局部復号予測差分信号１４と予測画像７は加算器１８により加算され、３成分分の暫定復号画像（局部復号画像）１５を得る。暫定復号画像１５は以降のマクロブロックの動き補償予測に用いられるため、第１のピクチャ符号化部５０３ａと同じ処理を行うデブロッキングフィルタ４６２で３成分分の暫定復号画像サンプルに対してブロックひずみ除去処理を実施した後、復号画像４２７ａとして出力されるとともに、メモリ１６ａへ格納される。この際、可変長復号部２５によって解読されたデブロッキングフィルタ制御フラグ２４の指示に基づいてデブロッキングフィルタ処理を暫定復号画像１５に対して作用させる。メモリ１６ａには、複数時刻に渡る、３つの色成分で構成される複数枚の参照画像データが格納され、予測部４６１では、これらの中からマクロブロックの単位でビットストリームから抽出した参照画像インデックスで示される参照画像を選択して予測画像生成を行う。メモリ１６ａ内の参照画像データの配置は、色成分ごとに面順次で分けて格納してもよいし、各色成分のサンプルを点順次で格納してもよい。復号画像４２７ａは３つの色成分を含み、そのまま共通復号処理におけるアクセスユニット４２７ａ０を構成するカラー映像フレームとなる。

第２のピクチャ復号部の動作概要
第２のピクチャ復号部６０３ｂ０〜６０３ｂ２の内部構成を図７７に示す。第２のピクチャ復号部６０３ｂ０〜６０３ｂ２は、図７１の符号化装置から出力される図６９、図７０の配列に従うビデオストリーム４４２ｃが、上位ヘッダ解析部６１０でＮＡＬユニット単位に分割され、色成分判定部６０２で振り分けられたＣ０ないしは、Ｃ１ないしは、Ｃ２スライスＮＡＬユニット単位で受信して、図６７に示す単一色成分のサンプルからなるマクロブロックを単位として復号処理を行い、出力映像フレームを復元する。

可変長復号部２５はビデオストリーム４２２ｃを入力とし、所定の規則（シンタックス）に従ってビデオストリーム４２２ｃを解読して、単一色成分の量子化済み変換係数１０、および単一色成分に適用するマクロブロックヘッダ情報（マクロブロックタイプ／サブマクロブロックタイプ１０６、予測オーバヘッド情報４６３、変換ブロックサイズ指定フラグ４６４、量子化パラメータ２１）を抽出する。量子化済み変換係数１０は量子化パラメータ２１とともに第２のピクチャ符号化部５０３ｂ０（５０３ｂ１、５０３ｂ２）と同じ処理を行う逆量子化部１２へ入力され、逆量子化処理が行われる。ついでその出力が第２のピクチャ符号化部５０３ｂ０（５０３ｂ１、５０３ｂ２）と同じ処理を行う逆変換部３１２へ入力され、局部復号予測差分信号１４へ復元される（変換ブロックサイズ指定フラグ４６４がビデオストリーム４２２ｃ中に存在すれば、それを逆量子化、逆直交変換処理過程で参照する）。一方、予測部４６１は、第２のピクチャ符号化部５０３ｂ０（５０３ｂ１、５０３ｂ２）中の予測部４６１のうち、予測オーバヘッド情報４６３を参照して予測画像７を生成する処理だけが含まれ、予測部４６１に対してマクロブロックタイプ／サブマクロブロックタイプ１０６、予測オーバヘッド情報４６３が入力され、単一色成分の予測画像７を得る。マクロブロックタイプがイントラ予測であることを示す場合は、予測オーバヘッド情報４６３からイントラ予測モード情報に従って単一色成分の予測画像７を得、マクロブロックタイプがインター予測であることを示す場合は、予測オーバヘッド情報４６３から動きベクトル、参照画像インデックスに従って単一色成分の予測画像７を得る。局部復号予測差分信号１４と予測画像７は加算器１８により加算され、単一色成分マクロブロックの暫定復号画像１５を得る。暫定復号画像１５は以降のマクロブロックの動き補償予測に用いられるため、第２のピクチャ符号化部５０３ｂ０（５０３ｂ１、５０３ｂ２）と同じ処理を行うデブロッキングフィルタ２６で単一色成分の暫定復号画像サンプルに対してブロックひずみ除去処理を実施した後、復号画像４２７ｂとして出力されるとともに、メモリ１６ｂへ格納される。この際、可変長復号部２５によって解読されたデブロッキングフィルタ制御フラグ２４の指示に基づいてデブロッキングフィルタ処理を暫定復号画像１５に対して作用させる。復号画像４２７ｂは単一色成分のサンプルのみを含み、図７５における他の並列処理される第２のピクチャ復号部６０３ｂ０〜６０３ｂ２のそれぞれの出力である復号画像４２７ｂをアクセスユニット４２７ｂ０の単位に束ねることで、カラー映像フレームとして構成される。

以上のことから明らかなように、第１のピクチャ復号部６０３ａと第２のピクチャ復号部６０３ｂ０〜６０３ｂ２とは、マクロブロックヘッダ情報を３成分共通の情報として扱うか、単一の色成分の情報として扱うかの違いと、スライスデータのビットストリーム構成が異なるだけで、図７３や図７４における動き補償予測処理や逆変換、逆量子化などの基本的な復号処理ブロックの多くは第１のピクチャ復号部６０３ａと第２のピクチャ復号部６０３ｂ０〜６０３ｂ２とで共通の機能ブロックで実現できる。したがって、図７５のような完全に独立な復号処理部としてだけでなく、図７６や図７７の基本構成要素を適宜組み合わせて多様な復号装置の実装を実現することができる。また、第１のピクチャ復号部６０３ａにおけるメモリ１６ａの配置を面順次で持つことにすれば、メモリ１６ａ、メモリ１６ｂの構成を第１のピクチャ復号部６０３ａと第２のピクチャ復号部６０３ｂ０〜６０３ｂ２とで共通にできる。

なお、図７５の復号装置は、図７１の符号化装置の別の形態として、共通符号化・独立符号化識別信号４２３を常に「独立符号化処理」に固定化して、第１のピクチャ符号化部５０３ａを一切使用せず全フレームを独立符号化するように構成された符号化装置から出力されるビットストリームを受信して復号することももちろん可能である。また、図７５の復号装置の別の形態として、常に共通符号化・独立符号化識別信号４２３が「独立符号化処理」に固定化されることを前提とする利用形態では、スイッチ６０１や第１のピクチャ復号部６０３ａを省略した独立復号処理を行うのみの復号装置として構成してもよい。

なお共通符号化・独立符号化識別信号(num_pictures_in_au)は、共通符号化処理による符号化データと独立符号化処理による符号化データを区別する情報(共通符号化識別情報)と、１つのアクセスユニット内に何枚の単一色成分ピクチャが存在するかを示す情報(色成分の数)を含むようにしたが、上記２つの情報が独立な情報として符号化されていてもよい。

さらに、第１のピクチャ復号部６０３ａに、従来のYUV４：２：０フォーマットを対象として３成分まとめて符号化されたAVCハイプロファイル準拠のビットストリームの復号機能を備えるようにし、上位ヘッダ解析部６１０において、ビデオストリーム４２２ｃから復号するプロファイル識別子を参照していずれのフォーマットで符号化されたビットストリームかを判定し、判定結果を共通符号化・独立符号化識別信号４２３の信号線の情報の一部としてスイッチ６０１と第１のピクチャ復号部６０３ａに伝える構成をとれば、従来のYUV４：２：０フォーマットのビットストリームに対する互換性を確保する復号装置を構成することもできる。

なお、本実施の形態１４における第１のピクチャ符号化部５０３ａでは、スライスデータに３つの色成分の情報が混在し、かつ３つの色成分に対してまったく同じイントラ・インター予測処理を実施するため、予測誤差信号空間で、色成分間での信号相関が残存することがある。これを除去する工夫として、例えば、予測誤差信号に対して、上記実施の形態１３で述べたような色空間変換処理を施すように構成してもよい。このような構成をもつ第１のピクチャ符号化部５０３ａの例を図７８、図７９に示す。図７８は、色空間変換処理を、変換処理を行う前の画素レベルで実施する例であり、色空間変換部４６５を変換部３１０の前に、逆色空間変換部４６６を逆変換部３１２の後に配置する。図７９は、色空間変換処理を、変換処理を行った後で得られた係数データに対して処理対象の周波数成分を適宜選択しながら実施する例であり、色空間変換部４６５を変換部３１０の後に、逆色空間変換部４６６を逆変換部３１２の前に配置する。色空間変換を施す周波数成分を限定することで、特定の色成分に含まれる高周波ノイズ成分がノイズをあまり含まない他の色成分に伝播することを抑制することができる効果がある。色空間変換処理の対象となる周波数成分を適応選択可能とする場合には、復号側で符号化時の選択を判断するためのシグナリング情報４６７をビットストリームに多重化する。

色空間変換処理は、符号化対象の画像信号の性質に応じて上記実施の形態１３で述べたような複数の変換方式をマクロブロック単位に切り替えて使用するようにしてもよいし、マクロブロックの単位で変換有無を判定するように構成してもよい。選択可能な変換方式の種別をシーケンスレベルなどで指定しておき、それらの中からどれを選ぶかをピクチャ、スライス、マクロブロックなどの単位で指定するようにも構成できる。また、直交変換の前で実施するか、後で実施するかを選択可能なように構成してもよい。これらの適応符号化処理を行う場合は、選択可能なすべての選択肢について、符号化モード判定部５で符号化効率の評価を行ってもっとも符号化効率が高いものを選択するように構成することができる。これらの適応符号化処理を実施する場合は、復号側で符号化時の選択を判断するためのシグナリング情報４６７をビットストリームに多重化する。このようなシグナリングは、スライス、ピクチャ、GOP、シーケンスなどマクロブロックとは異なるレベルで指定してもよい。

図７８、図７９の符号化装置に対応する復号装置を図８０、図８１に示す。図８０は、図７８の符号化装置によって、変換処理前に色空間変換が行われて符号化されたビットストリームを復号する復号装置である。可変長復号部２５はビットストリームから、逆色空間変換部４６６において変換を行うか行わないかを選択する変換有無の情報や、逆色空間変換部４６６において実行可能な変換方式を選択する情報であるシグナリング情報４６７を復号して、逆色空間変換部４６６へ供給する。図８０の復号装置は、逆色空間変換部４６６において、これらの情報に基づいて逆変換後の予測誤差信号に対する色空間変換処理を実施する。また、図８１は、図７９の符号化装置によって、変換処理後に処理対象の周波数成分を選択して色空間変換を行うことによって符号化されたビットストリームを復号する復号装置である。可変長復号部はビットストリームから、逆色空間変換部４６６において変換を行うか行わないかを選択する変換有無の情報や、逆色空間変換部において実行される変換方式を選択する情報や、色空間変換を施す周波数成分を特定する情報などを含む識別情報であるシグナリング情報４６７を復号して逆色空間変換部４６６に供給する。図８１の復号装置は、逆色空間変換部４６６において、これらの情報に基づいて逆量子化後の変換係数データに対し色空間変換処理を実施する。

図８０、図８１の復号装置は、図７５の復号装置と同様、第１のピクチャ復号部６０３ａに、従来のYUV４：２：０フォーマットを対象として３成分まとめて符号化されたAVCハイプロファイル準拠のビットストリームの復号機能を備えるようにし、上位ヘッダ解析部６１０において、ビデオストリーム４２２ｃから復号するプロファイル識別子を参照していずれのフォーマットで符号化されたビットストリームかを判定し、判定結果を共通符号化・独立符号化識別信号４２３の信号線の情報の一部としてスイッチ６０１と第１のピクチャ復号部６０３ａに伝える構成をとれば、従来のYUV４：２：０フォーマットのビットストリームに対する互換性を確保する復号装置を構成することもできる。

図８２に従来のYUV４：２：０フォーマットのビットストリームに含まれるマクロブロックヘッダ情報の符号化データの構成を示す。図５０に示したCn成分ヘッダ情報と異なる点は、マクロブロックタイプがイントラ予測のときに、イントラ色差予測モード１４４の符号化データが含まれている点のみである。なおマクロブロックタイプがインター予測のときには、マクロブロックヘッダ情報の符号化データの構成は、図５０に示したCn成分ヘッダ情報と同じであるが、マクロブロックヘッダ情報に含まれる参照画像識別番号、動きベクトル情報を用いて輝度成分とは異なる方法で色差成分の動きベクトルが生成される。

従来のYUV４：２：０フォーマットのビットストリームに対する互換性を確保する復号装置の動作について説明する。上述のとおり、第１のピクチャ復号部６０３ａが従来のYUV４：２：０フォーマットのビットストリームの復号機能を備えるものとする。第１のピクチャ復号部の内部構成は図７６と同じである。

従来のYUV４：２：０フォーマットのビットストリームの復号機能を備えた第１のピクチャ復号部の可変長復号部２５の動作を説明する。ビデオストリーム４２２ｃが可変長復号部へ入力されると、色差フォーマット指示フラグを復号する。色差フォーマット指示フラグはビデオストリーム４２２ｃのシーケンスパラメータヘッダに含まれ、入力映像フォーマットが４：４：４か、４：２：２か、４：２：０か、４：０：０かのいずれかのフォーマットを示すフラグである。ビデオストリーム４２２ｃのマクロブロックヘッダ情報の復号処理は色差フォーマット指示フラグの値によって切り替えられる。マクロブロックタイプがイントラ予測を示している場合で、色差フォーマット指示フラグが４：２：０または４：２：２を示している場合にはイントラ色差予測モード１４４をビットストリームから復号する。色差フォーマット指示フラグが４：４：４を示している場合にはイントラ色差予測モード１４４の復号をスキップする。色差フォーマット指示フラグが４：０：０を示している場合、入力映像信号は輝度信号のみで構成されるフォーマット(４：０：０フォーマット)であるため、イントラ色差予測モード１４４の復号をスキップする。イントラ色差予測モード１４４以外のマクロブロックヘッダ情報の復号処理は、従来のYUV４：２：０フォーマットのビットストリームの復号機能を備えていない第１のピクチャ復号部６０３ａの可変長復号部と同じである。以上によりビデオストリーム４２２ｃが可変長復号部２５へ入力されると、色差フォーマット指示フラグ（図示せず）、３成分分の量子化済み変換係数１０、マクロブロックヘッダ情報（マクロブロックタイプ／サブマクロブロックタイプ１０６、予測オーバヘッド情報４６３、変換ブロックサイズ指定フラグ４６４、量子化パラメータ２１）を抽出する。予測部４６１には、色差指示フォーマット指示フラグ（図示せず）と予測オーバヘッド情報４６３が入力され、３成分分の予測画像７を得る。

図８３に従来のYUV４：２：０フォーマットのビットストリームに対する互換性を確保する第１のピクチャ復号部の予測部４６１の内部構成を示し、その動作を説明する。

切替部４６１１ａは、マクロブロックタイプを判別し、マクロブロックタイプがイントラ予測であることを示す場合は、切替部４６１１ｂにて色差フォーマット指示フラグの値を判別する。色差フォーマット指示フラグの値が、４：２：０または４：２：２のいずれかを示す場合には、予測オーバヘッド情報４６３からイントラ予測モード情報とイントラ色差予測モード情報に従って３成分分の予測画像７を得る。３成分のうち、輝度信号の予測画像は、イントラ予測モード情報に従って輝度信号イントラ予測部４６１２にて生成される。色差信号２成分の予測画像は、イントラ色差予測モード情報に従って、輝度成分とは異なる処理を行う色差信号イントラ予測部４６１３にて生成される。色差フォーマット指示フラグの値が、４：４：４を示す場合には、３成分すべての予測画像がイントラ予測モード情報に従って輝度信号イントラ予測部４６１２にて生成される。色差フォーマット指示フラグの値が、４：０：０を示す場合には、４：０：０フォーマットは輝度信号（１成分）のみで構成されるため、輝度信号の予測画像のみがイントラ予測モード情報に従って輝度信号イントラ予測部４６１２にて生成される。

切替部４６１１ａにてマクロブロックタイプがインター予測であることを示す場合は、切替部４６１１ｃにて色差フォーマット指示フラグの値を判別する。色差フォーマット指示フラグの値が４：２：０または４：２：２のいずれかを示す場合には、輝度信号については、輝度信号インター予測部４６１４にて予測オーバヘッド情報４６３から動きベクトル、参照画像インデックスに従って、AVC規格が定める輝度信号の予測画像生成方法に従って予測画像が生成される。色差信号２成分の予測画像については、色差信号インター予測部４６１５にて、予測オーバヘッド情報４６３から得られる動きベクトルを色差フォーマットに基づいてスケーリングして色差動きベクトルを生成し、予測オーバヘッド情報４６３から得られる参照画像インデックスが指示する参照画像から、上記色差動きベクトルに基づいてAVC規格の定める方法に従って予測画像が生成される。色差フォーマット指示フラグの値が、４：０：０を示す場合には、４：０：０フォーマットは輝度信号（１成分）のみで構成されるため、輝度信号の予測画像のみが動きベクトル、参照画像インデックスに従って輝度信号インター予測部４６１４にて生成される。

以上のように、従来のYUV４：２：０フォーマットの色差信号の予測画像を生成する手段を設け、ビットストリームから復号した色差フォーマット指示フラグの値に応じて３成分の予測画像の生成に用いる手段を切り替えるようにしたため、従来のYUV４：２：０フォーマットのビットストリームに対する互換性を確保する復号装置を構成することができる。

なお、図８０、図８１の復号装置に供給するビデオストリーム４２２ｃに、図７５の復号装置のように色空間変換処理をサポートしない復号装置でも復号が可能であるビットストリームかどうかを示す情報をシーケンスパラメータセットなどの単位で付与しておけば、図８０、図８１と図７５いずれの復号装置でもそれぞれの復号性能に応じたビットストリームの復号が可能であり、ビットストリームの互換性を確保しやすい効果がある。

実施の形態１５．
本実施の形態１５では、図７１や図７５など上記実施の形態１４の符号化装置・復号装置において、その入出力対象となるビットストリームの構成のみが異なる別の実施の形態について述べる。本実施の形態１５における符号化装置は、図８４に示すビットストリーム構成で符号化データの多重化を行う。

図６９の構成のビットストリームにおいて、AUD NALユニットは、その要素としてprimary_pic_typeという情報を含む。これは、AUD NALユニットで始まるアクセスユニット内のピクチャデータが符号化される際のピクチャ符号化タイプの情報を図８５に示す。

例えば、primary_pic_type = 0の場合は、ピクチャ内すべてがイントラ符号化されていることを示す。primary_pic_type = １の場合は、イントラ符号化されるスライスと、参照ピクチャリストを１つだけ使用して動き補償予測を行うことが可能なスライスとがピクチャ内で混在できることを示す。primary_pic_typeは１つのピクチャがどのような符号化モードを使用して符号化できるか、を規定する情報であるので、符号化装置側ではこの情報を操作することで、入力映像信号の性質やランダムアクセス機能などの種々の条件に適した符号化を行うことができる。上記実施の形態１４では、primary_pic_typeがアクセスユニットあたり１つだけしかないので、独立符号化処理を行う場合のアクセスユニットでは３つの色成分ピクチャでprimary_pic_typeは共通、とする。本実施の形態１５では、各色成分ピクチャの独立符号化を行う場合に、図６９のAUD NALユニット内に、num_pictures_in_auの値に応じて、追加で残り２つの色成分ピクチャ分のprimary_pic_typeを挿入するか、図８４のビットストリーム構成のように、各色成分ピクチャの符号化データを、色成分ピクチャの開始を示すNALユニット（Color Channel Delimiter）から開始するように構成し、このCCD NALユニット中に、対応するピクチャのprimary_pic_type情報を含むように構成する。この構成では、各色成分ピクチャの符号化データは１ピクチャ分まとめて多重されるので、上記実施の形態１４で述べた色成分識別フラグ（color_channel_idc）はスライスヘッダではなく、CCD NALユニットに含めるようにする。これにより、各スライスへの多重が必要であった色成分識別フラグの情報をピクチャ単位のデータに集約できるので、オーバヘッド情報を削減できる効果がある。また、バイト列として構成されるCCD NALユニットを検出してcolor_channel_idcを色成分ピクチャあたり１度だけ検証すればよく、可変長復号処理を行うことなく色成分ピクチャの先頭をすばやく見つけることができるので、復号装置側で、色成分ごとに復号対象のNALユニットを分離するためにスライスヘッダ中のcolor_channel_idcを逐一検証しなくてもよくなり、第２のピクチャ復号部へのデータ供給を円滑に行うことができる。

一方で、このような構成では、上記実施の形態１４の図７２で述べたような、符号化装置のバッファサイズ、処理遅延を低減する効果が薄れるため、色成分識別フラグはスライス単位に多重するか、色成分ピクチャ単位に多重するかをより上位のレベル（シーケンスやGOP）でシグナリングするように構成してもよい。このようなビットストリーム構成をとることで、符号化装置はその利用形態に応じて柔軟な実装を行うことが可能となる。

さらに別の実施の形態として、図８６に示すビットストリーム構成で符号化データの多重化を行ってもよい。図８６において、図８４ではCCD NALユニットに含むようにした color_channel_idc, primary_pic_typeは各AUDに含むようにする。本実施の形態１５におけるビットストリーム構成では、独立符号化処理の場合にも、１つのアクセスユニットに１つの（色成分）ピクチャが含まれるように構成する。このような構成でも、色成分識別フラグの情報をピクチャ単位のデータに集約できることによるオーバヘッド情報の削減効果、また、バイト列として構成されるAUD NALユニットを検出してcolor_channel_idcをピクチャあたり１度だけ検証すればよく、可変長復号処理を行うことなく色成分ピクチャの先頭をすばやく見つけることができるので、復号装置側で、色成分ごとに復号対象のNALユニットを分離するためにスライスヘッダ中のcolor_channel_idcを逐一検証することなく第２のピクチャ復号部へのデータ供給を円滑に行うことができる。一方、１フレームないしは１フィールドの画像は３つのアクセスユニットから構成されるため、３つのアクセスユニットが同一時刻の画像データであることを指定する必要がある。このため、図８６のビットストリーム構成では、さらにAUDの中に、各ピクチャのシーケンス番号（時間方向の符号化・復号順序等）を付与するように構成することもできる。このような構成によって、復号装置側では各ピクチャの復号・表示順や色成分属性、IDRの是非などを、スライスデータを一切復号することなく検証可能となり、ビットストリームレベルの編集や特殊再生を効率よく行うことが可能となる。

また、図６９、８４ないしは図８６のビットストリーム構成において、AUDやCCDの領域に、ひとつの色成分ピクチャに含まれるスライスNALユニットの個数を指定する情報を格納するように構成してもよい。

なお、上記すべての実施例について、変換処理、逆変換処理は、DCTのように直交性を保証する変換でもよいし、AVCのような、厳密にはDCTのような直交変換でなく、量子化・逆量子化処理と組み合わせて直交性を近似する変換であってもよい。また、変換を行わずに、予測誤差信号を画素レベルの情報として符号化するような構成であってもよい。

実施の形態１６．
本実施の形態１６では、４：４：４フォーマットで入力される映像フレームを、各色成分独立にM_i×M_i画素(i=0,1,2)の矩形領域に分割した単位でフレーム内、フレーム間適応予測を用いて符号化を行う符号化装置、および対応する復号装置について説明する。M_iは、映像フレームのi番目の色成分の信号を分割する領域のサイズを示す。

１．符号化装置の動作概要
図８７に、本実施の形態１６における映像符号化装置の構成を示す。４：４：４フォーマットの入力映像信号１は、色成分分離部５０２において、各色成分の画面成分５０５ｂ０、５０５ｂ１、５０５ｂ２に分離され、それぞれ同じ構成からなるピクチャ符号化部５０３ｂ０、５０３ｂ１、５０３ｂ２に入力される。また、この際、色成分分離部５０２からは、各ピクチャ符号化部５０３ｂ０、５００３ｂ１、５０３ｂ２における符号化単位の矩形領域のサイズM_iを指定する情報５０６ｂ０、５０６ｂ１、５０６ｂ２をそれぞれ対応するピクチャ符号化部５０３ｂ０、５０３ｂ１、５０３ｂ２へ入力する。これにより、色成分Ciを符号化するピクチャ符号化部５０３ｂ０、５０３ｂ１、５０３ｂ２は、各画面成分５０５ｂ０、５０５ｂ１、５０５ｂ２を矩形領域サイズM_iに基づいて分割して、その単位で符号化を行う。

以下、ピクチャ符号化部５０３ｂ０、５０３ｂ１、５０３ｂ２の詳細動作説明を行う。本実施の形態１６のピクチャ符号化部５０３ｂ０、５０３ｂ１、５０３ｂ２の説明は、図７４の構成を変形する形で説明を行う。図８８にピクチャ符号化部５０３ｂ０、５０３ｂ１、５０３ｂ２の内部構成を示す。同図中、図７４のピクチャ符号化部と同じ番号を付与した機能ブロックや信号線は、特に断らない限り、図７４のものと同一のものとする。以下、ピクチャ符号化部５０３ｂ０、５０３ｂ１、５０３ｂ２の説明においては、各色成分の画面成分５０５ｂ０、５０５ｂ１、５０５ｂ２を代表して入力信号５０５とし、符号化単位の矩形領域のサイズM_iを指定する情報５０６ｂ０、５０６ｂ１、５０６ｂ２は代表して符号化ブロックサイズ指示情報５０６として記載する。入力信号５０５は、符号化ブロックサイズ指示情報５０６に基づいてブロック分割部４０によって矩形ブロックに分割される。また、色成分Ciに対応する入力信号５０５のことを、以降の説明では符号化処理のデータ単位としてピクチャと呼ぶことがある。

入力信号５０５は、入力映像信号１が輝度・色差信号(たとえば、Y、Cb、CrやY、Co、Cgなど)の色空間表現された信号である場合、５０５ｂ０として輝度成分を、５０５ｂ１、５０５ｂ２として色差成分を割り当てるといった符号化方法がある。この場合、輝度成分は画像信号の持つテクスチャ情報を集約した信号となり、色差信号は逆にテクスチャ成分に関わる輝度成分との相関が除かれ、視覚的にはモノクロ画像に対する着色の意味を有する信号成分となる。したがって、テクスチャの構造を根拠とするフレーム間の動き補償予測や、AVCで採用されるようなフレーム内の空間予測といった信号予測において、予測の単位とするブロックのサイズは必ずしも輝度成分と同じである必要はない。逆に、色差信号に対して言えば、必ずしも輝度成分と同一のブロックサイズで予測を行うのではなく、色差信号の画面内における相関を最大限活用可能な個別のブロックサイズで予測を行う方が符号化効率を高めることができると考えられる。例えば、Y成分をC0、Cb成分をC1、Cr成分をC2とした場合、M₀=16, M₁=M₂=32として、色差成分のブロックサイズを輝度よりも大きくとれば、3つのうちの2つの成分に対しては、符号化単位あたりのオーバヘッド情報(予測モード、動きベクトルなど)を輝度成分の4分の1程度まで低減することができる。この様子を図８９に示す。

また、M_iは、画像サイズに応じて定めるように構成してもよい。例えばHDTV信号(1920画素x1080ライン)の映像と意味的に同じ内容を持つCIF信号(352画素x288ライン)などの低解像度映像とを比べた場合、HDTV信号の4画素x4ラインブロックはCIF信号では1画素領域のサイズしかない。したがって、画像解像度が高くなるほど、画素あたりがカバーする実質的な画像テクスチャ領域は小さくなっていく。フレーム間の動き補償予測やフレーム内空間予測では、元来画像のテクスチャ構造の類似度を検出してもっとも類似度が高い信号部分を予測値として用いるので、予測の単位となるブロック内の信号にある程度テクスチャ構造が保存されていないと、予測がうまくいかない(予測性能が雑音成分に阻害される)。したがって、解像度の高い映像ではブロックサイズを大きくとって低解像度時にカバーされるテクスチャ領域をカバーできるように構成することが望ましい。したがって、画像サイズが大きくなるほどM_iを大きくするなどといった構成をとることも可能である。以降、M_i×M_i画素からなる矩形領域をマクロブロックと呼ぶ。

ブロック分割部４０によってマクロブロックに分割された入力信号５０５に対し、まず、予測部４６１において、カレントピクチャの局所復号済みのメモリ１６ｂに格納される周辺画素から空間予測を行うイントラ予測処理、ないしは、メモリ１６ｂに格納される１フレーム分以上の予測参照画像データの中から参照画像を用いて各色成分ごとに動き補償予測処理が行われる。本実施の形態１６における予測部４６１の処理は図７４の予測部４６１と動作が異なるので、以下説明する。

１．１イントラ予測処理
予測部４６１において、メモリ１６ｂに格納される参照画像７０１を用いて、該マクロブロックの単位でイントラ予測処理が行われる。イントラ予測のモードには、N画素xNラインのブロックの単位でその周辺画素を用いた空間予測を行うイントラNxN予測モード、図８９に示すマクロブロックの単位でその周辺画素を用いた空間予測を行うマクロブロック単位イントラ予測モードがある。

(a)イントラNxN予測モード
マクロブロック内をNxN画素ブロックで構成されるブロックに分割し、各ブロックに対して空間予測を行う。イントラNxN予測を行う単位となるブロックサイズNとしては、マクロブロックのサイズM_iに対して均等分割が可能なサイズを選択するものとする。例えば、M_i＝１６であればN=４、８、M_i＝３２であればN=４、８、１６のいずれかを用いる。予測値としては、すでに符号化を終え、局部復号処理されてメモリ１６ｂに格納されたカレントピクチャの周囲のブロック（左上、上、右上、左）の画素を用いる。予測モードとして、例えば図３に示すような複数のモードを用意する。上記実施の形態１と同様に、図３は、N=4の場合の予測モード種別を図示しており、9つの予測モードがあることを示す。この9つのうちのいずれかを4x4画素ブロック単位に選択する。
Intra4x4_pred_mode = 0: 隣接する上部の画素をそのまま予測画像として使用する。
Intra4x4_pred_mode = 1: 隣接する左部の画素をそのまま予測画像として使用する。
Intra4x4_pred_mode = 2: 隣接する8つの画素の平均値を予測画像として使用する
Intra4x4_pred_mode = 3: 隣接する画素から2〜3画素ごとに加重平均を求め予測画像として使用する(右45度エッジに対応)。
Intra4x4_pred_mode = 4: 隣接する画素から2〜3画素ごとに加重平均を求め予測画像として使用する(左45度エッジに対応)。
Intra4x4_pred_mode = 5: 隣接する画素から2〜3画素ごとに加重平均を求め予測画像として使用する(左22.5度エッジに対応)。
Intra4x4_pred_mode = 6: 隣接する画素から2〜3画素ごとに加重平均を求め予測画像として使用する(左67.5度エッジに対応)。
Intra4x4_pred_mode = 7: 隣接する画素から2〜3画素ごとに加重平均を求め予測画像として使用する(右22.5度エッジに対応)。
Intra4x4_pred_mode = 8: 隣接する画素から2〜3画素ごとに加重平均を求め予測画像として使用する(左112.5度エッジに対応)。
N=4とする場合、マクロブロックあたりのモード情報は16個必要となる。モード情報自体の符号量を抑制するため、モード情報は隣接するブロック間との相関が高いことを利用して、隣接するブロックのモード情報から予測符号化を行う。Nが8、16といったサイズになる場合は、図示はしないが、N=4の場合と同様の、画像テクスチャの方向性を加味した空間予測モードを定義して、Mi×Miのマクロブロックの中を均等にN×Nで分割したサブブロックの単位でイントラ予測処理を行う。

(b)マクロブロック単位イントラ予測モード
マクロブロックサイズに相当するM_ixM_i画素ブロックを一度に予測するモードであり、M_i＝１６の場合、図４に示す4つのモードのいずれかをマクロブロック単位に選択する。イントラNxN予測モードと同様、すでに符号化を終え、局部復号処理されてメモリ１６ｂに格納された周囲のマクロブロック（左上、上、左）の画素を予測画像生成に用いる。

Intra16x16_pred_mode = 0: 上マクロブロックの最下辺の16画素を予測画像として使用する。
Intra16x16_pred_mode = 1: 左マクロブロックの最右辺の16画素を予測画像として使用する。
Intra16x16_pred_mode = 2: 上マクロブロックの最下辺の16画素(図４のA部分)と左マクロブロックの最左辺の16画素(図４のB部分)の合計32画素の平均値を予測画像として使用する。
Intra16x16_pred_mode = 3: 左上のマクロブロックの右下隅の画素、上マクロブロックの最下辺の15画素(白抜き画素を除いた部分)、左マクロブロックの最右辺の15画素(白抜き画素を除いた部分)の合計31画素を用いて所定の演算処理（使用する画素と予測する画素位置に応じた重み付け加算処理）により予測画像を得る。M_iが１６でない場合も、Mi=16の場合と同様の、画像テクスチャの方向性を加味したマクロブロック単位の空間予測モードを定義するものとする。

予測部４６１で行われるイントラ予測モード選択のための予測効率評価の規範としてはたとえば、
Jm = Dm + λRm(λ：正数)
で与えられるレート・ひずみコストを用いることができる。ここで、Dmはイントラ予測モードmを適用した場合の符号化歪または予測誤差量である。符号化歪とは、イントラ予測モードmを適用して予測差分信号を得、予測差分信号を変換・量子化した結果から映像を復号して符号化前の信号に対する誤差を計測するものである。予測誤差量は、イントラ予測モードmを適用した場合の予測画像と符号化前の信号との差分を得、その差分の大きさを定量化したもので、たとえば差分絶対値和(Sum of Absolute Distance: SAD)などが用いられる。Rmはイントラ予測モードmを適用した場合の発生符号量である。つまり、Jmはイントラ予測モードmを適用した場合の符号量と劣化度とのトレードオフを規定する値であり、最小のJmを与えるイントラ予測モードmが最適解を与える。

１．２動き補償予測処理
予測部４６１においては、さらに、メモリ１６ｂに格納される符号化済みの局部復号画像１５を用いて、該マクロブロックの単位でフレーム間動き補償予測処理が行われる。動き補償予測を行うブロックサイズとして、図９０(a)から(d)に示すように、マクロブロック単位に、M_ixM_i画素、M_ix(M_i/2)、(M_i/2)xM_i、(M_i/2)x(M_i/2)のいずれかの分割形状タイプを選択することができるものとする。さらに(M_i/2)x(M_i/2)が選択された場合には、各(M_i/2)x(M_i/2)ブロックごとに、図９０(e)から(h)に示すように、(M_i/2)x(M_i/2)、(M_i/2)x(M_i/4)、(M_i/4)x(M_i/2)、(M_i/4)x(M_i/4)のいずれかのサイズを選択することができる。

さらには、図９０(i)から(l)に示すように、マクロブロック内を不均等分割した領域を動き補償予測単位とするように構成してもよい。画像信号には一般に輪郭をもつ被写体が含まれ、輪郭を境に動きの不連続が発生することが多い。マクロブロックやそのサブセットとしての矩形ブロックのみが動き検出の単位であると、ブロック内に物体境界が存在して動きの不連続が生じる場合は、ブロック分割を細かくして動きベクトルの本数を増やさないと予測効率が高まらないという状況が発生する。図９０(i)から(l)のように、マクロブロックを不均等分割した領域を動き補償予測単位として用意しておけば、より少ない動きベクトルで物体輪郭上の動きの不連続性をカバーして予測効率を高めることができる。

また、一般には、マクロブロック内に輪郭が存在する場合のマクロブロック中における輪郭の位置や形状は多様であり、それらをすべて定義するには図９０(i)から(l)のような形状にとどまらずありとあらゆるブロック内分割を定義する必要があるが、本実施の形態１６の図９０(i)から(l)のように、(M_i/2)x(M_i/2)までのブロックまで、といった形で不均一分割の形状を構成する単位領域を限定することにより、分割パターンを表現するために符号化が必要となる付加情報の符号量を抑制したり、各分割パターンに対して動き検出を行うために必要な演算量の抑制、かつ予測値を生成するためのメモリ１６ｂへのアクセスを効率化できメモリバンド幅を抑制する効果がある。

図９０のいずれの分割を動き補償予測に用いるかはインター予測モードとして決定され、各分割に割り当てられる動きベクトルが生成・出力される。あるピクチャにおいて利用可能なインター予測モードの種類については、図９０のすべての分割パターンを指定可能なようにインター予測モードを定義してもよいし、最適なインター予測モードの選択に必要な演算量やインター予測モードを指定する情報の符号量を削減するために、条件に応じてインター予測モードとして選択可能な分割パターンを制限するように構成してもよい。例えば、マクロブロック内の分割を多くすればするほど、符号化が必要な動きベクトルの情報が増えるので、低いビットレートで符号化を行う場合、図９０(e)から(h)に示すような(M_i/2)x(M_i/2)画素以下への再分割を行うパターンは使用せず、代わりに動きベクトルの符号量が少なくてすむ図９０(i)から(l)に示す分割パターンを選択するように構成することができる。例えば、ビットレートの高低の判断基準として量子化パラメータの大きさが利用できるので、ピクチャの符号化を行うにあたっての量子化パラメータの初期状態の値に応じてインター予測モードの定義を切り替えるように構成できる。ないしはインター予測モードの定義を定める専用の識別ビットをビットストリームに多重するように構成してもよい。

さらに、MPEG-2のBピクチャや、AVCの双方向予測などのように、複数の参照画像からの予測画像を使用するようなピクチャにおいて、各参照画像に対する動きベクトルを個別に符号化しなければならないケースがある場合、動きベクトルの情報量を削減するために、図９０(e)から(h)に示すような(M_i/2)x(M_i/2)画素以下への再分割を行うパターンは使用せず、代わりに動きベクトルの符号量が少なくてすむ図９０(i)から(l)に示す分割パターンを選択するように構成することもできる。このほか、画面全体の動きの様子をあらかじめ推定して、ないしは直前に符号化を行ったピクチャの符号化過程を示す情報に基づいてインター予測モードの定義を切り替えるように構成してもよい。例えば、動きが複雑なシーンであれば、より細かい分割パターンが利用可能なようにインター予測モードの定義を定め、動きが均一で大きなブロックの単位でも十分に予測が可能と判断される状況では細かい分割パターンを使用しないインター予測モードの定義にする、といった方法がある。また、マクロブロック内のそれぞれの分割ブロックごとに予測値生成に用いる参照画像を指定できるように構成して、参照画像の識別番号を符号化するように構成してもよい。

動き補償予測処理におけるインター予測モード選択のための予測効率評価の規範としてはたとえば、
Jm,v,r = Dm,v,r + λRm,v,r(λ：正数)
で与えられるレート・ひずみコストを用いることができる。ここで、Dm,v,rはインター予測モードmとそれに応じて定まる動きベクトルv、参照画像rを適用した場合の符号化歪または予測誤差量である。符号化歪とは、インター予測モードmと動きベクトルvと参照画像rを適用して予測差分信号を得、予測差分信号を変換・量子化した結果から映像を復号して符号化前の信号に対する誤差を計測するものである。予測誤差量は、インター予測モードmと動きベクトルvと参照画像rを適用した場合の予測画像と符号化前の信号との差分を得、その差分の大きさを定量化したもので、たとえば差分絶対値和(Sum of Absolute Distance: SAD)などが用いられる。Rm,v,rはインター予測モードmと動きベクトルvと参照画像rを適用した場合の発生符号量である。つまり、Jm,v,rはインター予測モードmおよび動きベクトルvと参照画像rを適用した場合の符号量と劣化度とのトレードオフを規定する値であり、最小のJm,v,rを与えるインター予測モードmと動きベクトルvと参照画像rが最適解を与える。

１．３ピクチャ符号化処理
予測部４６１では、図３や図４に示したイントラ予測の全モードないしはそのサブセットに対して、イントラ予測処理を実行してマクロブロック単位のイントラ予測画像を生成するとともに、図９０に示した動き補償予測の全モードないしはそのサブセットに対して、動き補償予測処理を実行して、Mi×Miブロックの予測画像７を出力する。予測画像７は減算器３により入力信号５０５から差し引かれ、予測差分信号４を得る。予測差分信号４は符号化モード判定部５においてその予測効率が評価され、予測部４６１で実行した予測処理の中から、予測対象のマクロブロックに対して最適な予測効率が得られる予測モードを符号化モード６として出力する。すなわち、符号化モード６は、図３などのイントラNxN予測モードを用いるか、図４などのマクロブロック単位イントラ予測モードを用いるか、図９０に示すような分割パターンのいずれを用いて動き補償予測を行うかを識別するマクロブロックタイプの情報を含む。また、本実施の形態１６では、カレントピクチャで選択可能な符号化モードの種類を、符号化制御部１９等で定まる符号化モード定義選択情報７１１によって切り替える。符号化モード定義選択情報７１１としては、専用の選択指示情報を使用するほか、専用の情報を使わずに、例えばカレントピクチャを符号化するにあたっての量子化パラメータ２１の初期値、ブロック分割部４０に通知される符号化ブロックサイズ指示情報５０６などを単体で代用したり、または複合的に組み合わせて用いるように構成してもよい。符号化モード６の選定にあたっては、符号化制御部１９の判断で定まる各符号化モードに対する重み係数２０が加味されることもある。符号化モード判定部５において符号化モード６を用いて得られる最適な予測差分信号４は、変換部３１０へ出力される。

変換部３１０は入力されるMi×Mi画素ブロックからなる予測差分信号４を変換し変換係数として量子化部９へ出力する。変換に際しては、Mi×Mi画素ブロックをL×L画素ブロック(L<=Miで、かつMiはLの倍数)へ分割して変換し、変換ブロックサイズLを変換ブロックサイズ指定フラグ４６４により指定するよう構成する。このように構成することで、Mi×Mi画素ブロック中の信号の局所的性質に適応した変換処理を行うことができる。変換ブロックサイズLは、設定可能なすべてのLの値に対して変換を行って最も効率のより値を選択してもよいし、イントラ予測モードのブロックサイズや動き補償予測モードのブロックサイズに合わせるようにしてもよい。後者の場合は、符号化モード６に変換ブロックサイズ指定フラグ４６４相当の情報が含まれるため、別途変換ブロックサイズ指定フラグ４６４をビットストリームに多重化しなくてもよいという効果がある。量子化部９は入力される変換係数を、符号化制御部１９によって定まる量子化パラメータ２１に基づいて量子化を行い、量子化済み変換係数１０として可変長符号化部１１へ出力する。量子化済み変換係数１０は、可変長符号化部１１にてハフマン符号化や算術符号化などの手段によりエントロピー符号化される。また、量子化済み変換係数１０は逆量子化部１２、逆変換部３１２を経て局部復号予測差分信号１４へ復元され、符号化モード６に対応する予測方法で生成される予測画像７と加算器１８で加算することで局部復号画像１５が生成される。局部復号画像１５は以降の予測処理に用いるため、デブロッキングフィルタを施すか否かを示すデブロッキングフィルタ制御フラグ２４に基づいて、デブロッキングフィルタ部４６２でブロック境界にひずみ除去フィルタを施すか、ないしはそのままメモリ１６ｂへ格納される。なお、デブロッキングフィルタ部４６２では、符号化ブロックサイズ指示情報５０６、変換ブロックサイズ指定フラグ４６４を参照し、マクロブロック境界、変換ブロック境界のそれぞれに対して最適なブロックひずみ除去処理を行う。デブロッキングフィルタ制御フラグ２４は、復号装置でも同様の処理を行う必要があるため、可変長符号化部１１に入力され、ビットストリームに多重化される。

可変長符号化部１１では、マクロブロックサイズM_iを規定する符号化ブロックサイズ指示情報５０６、量子化済み変換係数１０、符号化モード６、予測オーバヘッド情報４６３、量子化パラメータ２１がハフマン符号化、算術符号化などによってエントロピー符号化され、所定の規則(シンタックス)に従ってビットストリームとして配列・整形され、送信バッファ１７へ出力される。本実施の形態１６の予測オーバヘッド情報４６３には、符号化モード６してイントラ予測処理が選択された場合には、予測単位ブロックあたりで使用する個々の予測モード情報(Intra4x4_pred_mode、Intra16x16_pred_modeなど)が含まれる。また、符号化モード６として動き補償予測処理が選択された場合は、図９０記載のマクロブロックタイプごとに定まる分割パターンに合わせた動きベクトル情報や参照画像インデックスが含まれる。送信バッファ１７では符号化装置が接続される伝送路の帯域や記録媒体の読み出し速度に合わせてビットストリームを平滑化してビデオストリーム４２２ｂ０として出力する。また、送信バッファ１７中のビットストリーム蓄積状況に応じて符号化制御部１９へフィードバック情報を出力し、以降の映像フレームの符号化における発生符号量を制御する。ビデオストリーム４２２ｂ０は、複数のマクロブロックを束ねたスライスの単位でユニット化され、出力される。

２．符号化ビットストリームの構成
以上の処理をピクチャ符号化部５０３で実施することにより、符号化装置への入力映像信号１は、３つの独立したピクチャ符号化部５０３ｂ０、５０３ｂ１、５０３ｂ２によってそれぞれ独立して符号化され、複数のマクロブロックを束ねたスライスの単位でビデオストリーム４２２ｂ０、４２２ｂ１、４２２ｂ２として出力され、多重化部５０４において、3成分から構成される入力映像信号１としてのビデオストリーム４２２ｃの形に配列されて符号化装置から出力される。

ピクチャ符号化部５０３ｂ０、５０３ｂ１、５０３ｂ２からの出力であるビデオストリーム４２２ｂ０、４２２ｂ１、４２２ｂ２のデータ配列を図９１に示す。ピクチャ符号化によるビデオストリーム４２２ｂ０、４２２ｂ１、４２２ｂ２は、同ピクチャ中に含まれるマクロブロックの数分の符号化データが集められたものとして構成され、マクロブロックは複数個集められたスライスというデータ単位にユニット化される。同一ピクチャに属するマクロブロックが共通パラメータとして参照するピクチャレベルヘッダが用意され、ピクチャレベルヘッダには、符号化ブロックサイズ指示情報５０６、符号化モード定義選択情報７１１が格納される。ピクチャ内のすべてのマクロブロックは、参照するピクチャレベルヘッダに含まれる符号化ブロックサイズ指示情報５０６によってマクロブロックサイズM_iを定め、符号化モード定義選択情報７１１にしたがって符号化モード６の可変長符号化手順を定める。

各スライスはそれぞれスライスヘッダから始まり、スライスヘッダには同スライスにどの色成分の符号化データを含むか(５０５ｂ０、５０５ｂ１、５０５ｂ２の種別を定義する情報)を示す色成分識別フラグ７２１を含む(図６９の独立符号化処理によって得られるスライス符号化データの場合と同じ)。スライスヘッダに引き続いて、スライス内の各マクロブロックの符号化データが配列される。(この例では、1ピクチャ内の第2スライスにK個のマクロブロックが含まれることを示す。)各マクロブロックのデータは、符号化モード６に続いて、予測オーバヘッド情報４６３、変換ブロックサイズ指定フラグ４６４、(マクロブロック単位に量子化パラメータを変更する場合のみ)量子化パラメータ２１、量子化済み変換係数１０が配列される。図８７の符号化装置の出力となるビデオストリーム４２２ｃは、図９１の構成のビデオストリーム４２２ｂ０、４２２ｂ１、４２２ｂ２の３成分分多重される形式をとる。なお、図９１では、符号化ブロックサイズ指示情報５０６や符号化モード定義選択情報７１１をピクチャレベルヘッダに配置しているが、これらは3成分分の情報をまとめて複数毎の映像フレームを束ねたシーケンスの単位で付与するシーケンスレベルヘッダに格納するように構成してもよい。このようにすることで、3つの成分で異なる情報を個別のピクチャレベルヘッダで符号化・伝送する必要がなくなり、ヘッダの情報量を削減できる。

３．復号装置の動作概要
図９２の復号装置は、図８７の符号化装置から出力されるビデオストリーム４２２ｃを受信して、マクロブロックの単位で復号処理を行い、個々の映像フレームを復元するものとする。
図９２において、ビデオストリーム４２２ｃは、上位ヘッダ解析部６１０で、シーケンスレベルヘッダやピクチャレベルヘッダなどの上位ヘッダ情報を復号し、色成分判定部６０２、ピクチャ復号部６０３ｂ０、６０３ｂ１、６０３ｂ２が参照可能な所定のメモリエリアへ格納しておく。

色成分判定部６０２は、図９１で示した色成分識別フラグ７２１の値により、スライスがいずれの色成分ピクチャに相当するかを識別して、適切なピクチャ復号部（６０３ｂ０、６０３ｂ１、６０３ｂ２）へ分配供給する。このような復号装置の構成によって、３つの色成分が混在するビデオストリームを受信しても、どのスライスがどの色成分ピクチャに属するかを容易に判別し正しく復号できる。

３．１ピクチャ復号部６０３の動作概要
以下、ピクチャ復号部６０３ｂ０、６０３ｂ１、６０３ｂ２の詳細動作説明を行う。本実施の形態１６のピクチャ復号部６０３ｂ０、６０３ｂ１、６０３ｂ２の説明は、図７７の構成を変形する形で説明を行う。図９３にピクチャ復号部６０３ｂ０、６０３ｂ１、６０３ｂ２の内部構成を示す。同図中、図７７のピクチャ復号部と同じ番号を付与した機能ブロックや信号線は、特に断らない限り、図７７のものと同一のものとする。
ピクチャ復号部６０３ｂ０、６０３ｂ１、６０３ｂ２は、色成分判定部６０２で振り分けられたＣ０ないしは、Ｃ１ないしは、Ｃ２スライス符号化データを受信して、単一色成分のサンプルからなるマクロブロックを単位として復号処理を行い、出力映像フレームの該当色成分の信号４２７ｂ０（４２７ｂ１、４２７ｂ２）を復元する。

可変長復号部２５はビデオストリーム４２２ｃを入力とし、所定の規則（シンタックス）に従ってビデオストリーム４２２ｃを解読して、スライスヘッダ、各マクロブロックの量子化済み変換係数１０、予測オーバヘッド情報４６３、変換ブロックサイズ指定フラグ４６４、量子化パラメータ２１、符号化モード６を抽出する。図９２では、シーケンスないしはピクチャレベルヘッダを上位ヘッダ解析部６１０で復号するように記載したが、この場合は、符号化ブロックサイズ指示情報５０６、符号化モード定義選択情報７１１といった情報は、該当する色成分を復号するピクチャ復号部６０３においてスライスの復号を開始する前に参照できるように構成する。各ピクチャ復号部６０３中の可変長復号部２５で復号する場合は、スライスの復号を開始する前に可変長復号部２５においてピクチャレベルヘッダの復号を行い、符号化ブロックサイズ指示情報５０６、符号化モード定義選択情報７１１といった情報をビットストリームから抽出する。なお、図示はしていないが、符号化モード定義選択情報７１１は、可変長復号部２５内で符号化モード６を復号する際に、その可変長復号手順を定めるために用いられる。

量子化済み変換係数１０は量子化パラメータ２１とともにピクチャ符号化部５０３ｂ０、５０３ｂ１、５０３ｂ２と同じ処理を行う逆量子化部１２へ入力され、逆量子化処理が行われる。ついでその出力がピクチャ符号化部５０３ｂ０、５０３ｂ１、５０３ｂ２と同じ処理を行う逆変換部３１２へ入力され、局部復号予測差分信号１４へ復元される。これらの過程で、逆変換及び逆量子化の単位となる変換ブロックサイズLを与える変換ブロックサイズ指示フラグ４６４、逆変換出力をMi×Mi画素ブロックの予測誤差画像として構成するために符号化ブロックサイズ指示情報５０６を参照する。一方、予測部４６１には、ピクチャ符号化部５０３ｂ０、５０３ｂ１、５０３ｂ２中の予測部４６１のうち、符号化モード６、予測オーバヘッド情報４６３を参照して予測画像７を生成する処理だけが含まれる。予測部４６１に対して符号化モード６、予測オーバヘッド情報４６３が入力され、予測画像７を得る。予測部４６１では、マクロブロックサイズM_iに基づいてM_ixM_i画素ブロックに対する予測画像を生成するため、符号化ブロックサイズ指示情報５０６を通知する。

符号化モード６がイントラNxN予測、マクロブロック単位イントラ予測などのイントラ予測モードであることを示す場合は、予測オーバヘッド情報４６３からNxNブロック単位のイントラ予測モード情報や、マクロブロック単位のイントラ予測モード情報、およびマクロブロックサイズM_iに従ってメモリ１６ｂ中に格納される参照画像７０１を用いて予測画像７を得る。符号化モード６がインター(動き補償)予測であることを示す場合は、符号化モード６より図９０のマクロブロック内分割パターンを識別し、予測オーバヘッド情報４６３から得られる動きベクトル、参照画像インデックス、、およびマクロブロックサイズM_iに従ってメモリ１６ｂ中に格納される参照画像７０１を用いて予測画像７を得る。

局部復号予測差分信号１４と予測画像７は加算器１８により加算され、復号画像４２７ｂ０（４２７ｂ１、４２７ｂ２）を得る。復号画像４２７ｂ０（４２７ｂ１、４２７ｂ２）は以降のマクロブロックの動き補償予測に用いられるため、ピクチャ符号化部５０３ｂ０、５０３ｂ１、５０３ｂ２と同じように、デブロッキングフィルタ制御フラグ２４に基づいて、デブロッキングフィルタ２６においてブロックひずみ除去処理を実施することがある。この際、デブロッキングフィルタ２６の処理結果は、メモリ１６ｂに格納され、以降のピクチャ復号に参照画像７０１として参照されるため、符号化時と同様、符号化ブロックサイズ指示情報５０６、変換ブロックサイズ指示フラグ４６４を参照して、マクロブロック、変換ブロックのそれぞれに適応したブロックひずみ除去処理を行う。復号画像４２７ｂ０（４２７ｂ１、４２７ｂ２）は以降の動き補償予測処理に用いるため、メモリ１６ｂへ格納される。復号画像４２７ｂ０（４２７ｂ１、４２７ｂ２）は単一色成分のサンプルのみを含み、他の色成分の復号を行うピクチャ復号部６０３ｂ０、６０３ｂ１、６０３ｂ２のそれぞれの出力である復号画像４２７ｂ０、４２７ｂ１、４２７ｂ２を映像フレームの単位に束ねることで、カラー映像フレームとして構成される。

以上述べた符号化装置、復号装置によれば、４：４：４フォーマットのカラー映像信号を効率よく符号化するために、各色成分を独立に予測符号化して、かつ各色成分の信号の性質に応じて予測や符号化を行うマクロブロックのサイズを動的に切り替えることが可能となるため、高い圧縮率となる低ビットレート符号化において符号量全体に対する比率が高くなる、イントラ予測モード、動きベクトル、参照画像インデックスといった予測オーバヘッド情報４６３の符号量を効果的に抑制した符号化を行うことが可能となる。さらに、動き補償予測処理において、予測オーバヘッド情報４６３の符号量抑制のため、少ない動きベクトル本数で予測効率を高めるためのマクロブロック内不均一分割のパターンを用いることにより、予測効率と符号量のバランスを改善するとともに、これら分割パターンを示すインター予測モードの種別を多様化してさまざまな動きに対する予測効率を高めるとともに、ビットレートや画像解像度などの符号化条件に合わせて必要となるインター予測モードの種別を切り替えられるよう構成したので、４：４：４フォーマットのカラー映像信号を効率よく符号化する符号化装置、復号装置を提供することができる。

なお、本実施の形態１６では、図７４にブロック分割部４０を加えた図８８の符号化装置と、それに対応する復号装置を用いて説明したが、他の実施の形態における、色成分ごとに個別・独立な符号化処理を行う処理機能にブロック分割部４０を加えた符号化装置、及びそれに対応する復号装置を用いても同様の効果を得ることができる。また、図７１の符号化装置における個別符号化処理実施部分を図８７の符号化装置に、図７５の復号装置における個別復号処理実施部分を図９２の復号装置に置き換えることで、４：４：４フォーマットのカラー映像信号の符号化に対してより適応性・効率の高い符号化装置、復号装置を提供することができる。

実施の形態１７．
本実施の形態１７では、実施の形態１６の符号化装置、復号装置に対して、予測部における動き補償予測処理を行う際に動きベクトル検出精度を動的に切り替える符号化装置、復号装置について述べる。
本来、デジタル画像である入力信号５０５には、サンプリングによって生成された離散的な画素情報(以降、整数画素と呼ぶ)しか存在しないが、整数画素の間に内挿演算によって仮想的なサンプルを作り出し、それを予測画像として用いる技術が広く利用されている。この技術には、予測の候補点が増えることによる予測精度の向上と、内挿演算に伴うフィルタ効果によって予測画像の特異点が削減され予測効率が向上するという２つの効果があることが知られている。一方で、仮想サンプルの精度が向上すると、動き量を表現する動きベクトルの精度も上げる必要があるため、その符号量も増加することに注意する必要がある。

MPEG-1、MPEG-2などの符号化方式ではこの仮想サンプルの精度を1/2画素精度まで許容する半画素予測が採用されている。図９４に1/2画素精度のサンプルの生成の様子を示す。同図において、A,B,C,Dは整数画素、e,f,g,h,iはA〜Dから生成される半画素精度の仮想サンプルを示す。

e = (A+B)//2
f = (C+D)//2
g = (A+C)//2
h = (B+D)//2
i = (A+B+C+D)//2
(ただし、//は丸めつき除算を示す。)

また、MPEG-4(ISO/IEC 14496-2)では、1/4画素精度までの仮想サンプルを用いる1/4画素精度予測が採用されている。1/4画素精度予測では、半画素サンプルを生成した後、それらを用いて1/4画素精度のサンプルを生成する。半画素サンプル生成時の過度の平滑化を抑える目的で、タップ数の多いフィルタを用いてもとの信号の周波数成分を極力保持するよう設計される。例えばMPEG-4の1/4画素精度予測では、1/4画素精度の仮想サンプル生成のために作られる半画素精度の仮想サンプルaは、その周辺8画素分を使用して、以下のように生成される。なお、下式は、水平処理の場合のみを示しており、1/4画素精度の仮想サンプル生成のために作られる半画素精度の仮想サンプルaと、下式の整数画素のX成分X-4〜X4との関係は、図９５に示す位置関係にある。

a = (COE1＊X1+COE2＊X2+COE3＊X3+COE4＊X4+COE_-1＊X_-1+COE_-2＊X_-2+COE_-3＊X_-3+COE_-4＊X_-4)//256
（ただし、COE_k: フィルタ係数(係数総和が256)。//は丸めつき除算を示す。）
AVC(ISO/IEC 14496-10)では、半画素精度の仮想サンプルを生成する際に、[1,-5,20,20,-5,1]なる6タップのフィルタを採用しており、さらに1/4画素精度の仮想サンプルを上記MPEG-1、MPEG-2の半画素サンプル生成と同様の線形補間処理によって生成している。

１．符号化装置の動作
本実施の形態１７においても、動き補償予測処理時に仮想サンプルの精度として半画素、1/4画素精度まで指定可能とする。そのうえで、本実施の形態１７の符号化装置、復号装置は各色成分ごとに利用する仮想サンプルの精度を指定できるように構成する。図９６に本実施の形態１７におけるピクチャ符号化部５０３ｂ０、５０３ｂ１、５０３ｂ２の構成を示す。図８８のピクチャ符号化部５０３ｂ０、５０３ｂ１、５０３ｂ２に対して、予測部４６１、可変長符号化部１１の動作のみが異なる。

本実施の形態１７における予測部４６１は、仮想画素精度指示情報８００を受け取り、それに基づいて動きベクトル検出を行う仮想画素の精度を定めて処理を行う。図示していないが、仮想画素精度指示情報８００は、各色成分の符号化を行うピクチャ符号化部５０３にそれぞれ色成分Ci別に個別に指定されるように構成する。予測部４６１は、仮想画素精度指示情報８００が「1/4画素精度の動きベクトル検出」を行うことを示す場合は、上記MPEG-4ないしはAVCのようなマルチタップフィルタに基づく半画素精度サンプルを生成した上で線形補間により1/4画素精度のサンプルを生成しながら動きベクトル検出を行う。一方、仮想画素精度指示情報８００が「半画素精度の動きベクトル検出のみ」を行うことを示す場合は、上記MPEG-4ないしはAVCのようなマルチタップフィルタに基づく半画素精度サンプル生成を行うか、または、上記MPEG-1,MPEG-2の場合のような線形補間により半画素精度のサンプルを生成しながら動きベクトル検出を行う。仮想画素精度指示情報８００は、復号装置で同じ方法で仮想サンプルを生成して予測画像を得る必要があるため、ビットストリームへ多重出力する。なお、半画素精度サンプルの生成方法は１つに決めておいて符号化装置と復号装置で同じ手順で処理を行うように構成してもよいし、複数の生成方法を用意して、いずれを用いるかを仮想サンプル生成手法指示情報８１１としてビットストリームに多重して復号装置へ伝達するように構成してもよい。仮想画素精度指示情報８００の設定方法としては、例えば、Y、Cb、Crのような色空間で符号化を行う際、画像のテクスチャ構造を強く反映するY成分については仮想画素精度指示情報８００を「1/4画素精度の動きベクトル検出」として細かい精度で動き検出を行い、Y成分信号に比べてテクスチャ構造との相関が低い色差成分(Cb,Cr)に対しては、仮想画素精度指示情報８００を「半画素精度の動きベクトル検出のみ」とする、といった方法が考えられる。この構成は、色成分別に仮想画素精度の指示を変化させるだけでなく、RGB信号のように、いずれの成分もある程度の画像テクスチャ構造を保存している場合では、すべての成分に対して仮想画素精度指示情報８００を「1/4画素精度の動きベクトル検出」として細かい精度で動き検出を行うように構成することも可能であり、どのような色空間の信号に対しても各色成分の信号の性質に合わせて柔軟な動き補償予測処理を行うことができるという効果がある。

また、仮想画素精度指示情報８００は、可変長符号化部１１へ送られ、予測部４６１で検出される動きベクトル(予測オーバヘッド情報４６３に含まれる)の値の単位を識別するために用いられる。可変長符号化部１１において、符号化対象となる動きベクトルをMVとし、所定の予測値決定手順にしたがってMVに対して定められた予測ベクトルをPMVとする。PMVはすでに符号化済みの値を用いる。可変長符号化部１１ではMV-PMVの値を符号化する。この際、仮想画素精度指示情報８００が「1/4画素精度の動きベクトル検出」を示している場合は、MVの値の単位は1/4画素とする。一方、仮想画素精度指示情報８００が「半画素精度の動きベクトル検出のみ」を行うことを示す場合は、MVの値の単位は1/2画素とする。1/4画素を１とする動きベクトルは、水平・垂直成分共に1/2画素を１とする場合に比べて値域が２倍になる。したがって、1/2画素精度のサンプルしか使用しない場合は、MVの値の単位を1/2画素とすることで、1/4画素を値の単位とする場合に比べてMVの符号化に必要な情報量を削減できる。
この性質を利用することにより、色空間に伴う信号の性質の違いだけでなく、符号量全体に対して動きベクトルなど予測オーバヘッド情報４６３の符号量の比率が高くなる高圧縮符号化を行う場合に、仮想画素精度指示情報８００を調整して動きベクトルの符号量を抑制した符号化を行うようにすることも可能である。仮想画素精度指示情報８００は色成分ごとに独立して設定できるので、高圧縮時の各色成分の状況に適応した制御が可能であり、より適応性の高い符号化処理が可能となる。

２．符号化ビットストリームの構成
図９７に、図９６の符号化装置から出力されるビデオストリーム４２２ｂ０、４２２ｂ１、４２２ｂ２のデータ配列を示す。図９１のストリーム配列と比べて異なる点は、ピクチャレベルヘッダ部分に仮想画素指示情報８００を多重している点である。これにより、このビットストリームを受け取る復号装置は、色成分ごとに予測オーバヘッド情報４６３に含まれる動きベクトルの値の単位を認識して符号化装置と同じように動きベクトルを復号し、予測画像を生成することが可能となる。また、例えば前述のように半画素精度のサンプルを生成するための方法が複数用意できる場合は、仮想サンプル生成手法指示情報８１１をピクチャレベルヘッダに多重するように構成してもよい。図９７では仮想画素指示情報８００や仮想サンプル生成手法指示情報８１１をピクチャレベルヘッダ領域に多重しているが、３つの色成分の分をまとめてシーケンスレベルヘッダなどより上位のヘッダ領域に多重する構成としてもよい。

３．復号装置の動作
図９８に本実施の形態１７における復号装置(ピクチャ復号部６０３ｂ０、６０３ｂ１、６０３ｂ２)の構成を示す。図９３のピクチャ復号部部６０３ｂ０、６０３ｂ１、６０３ｂ２に対して、可変長復号部２５、予測部４６１の動作だけが異なる。可変長復号部２５は、図９７に示すビデオストリーム４２２ｂ０、４２２ｂ１、４２２ｂ２を復号し、ピクチャレベルヘッダに含まれる仮想画素精度指示情報８００をビデオストリームから抽出し、予測部４６１に出力する。仮想画素精度指示情報８００の値が「1/4画素精度の動きベクトル検出」を示している場合は、予測オーバヘッド情報４６３に含まれる動きベクトルの値の単位を1/4画素に設定して、予測オーバヘッド情報４６３を予測部４６１へ送る。予測部４６１は、予測オーバヘッド情報４６３に含まれる動きベクトルの値が1/4画素単位であることを踏まえて、上記MPEG-4ないしはAVCのようなマルチタップフィルタに基づく半画素精度サンプルを生成した上で線形補間により1/4画素精度のサンプルを生成しながら予測画像の生成を行う。
一方、仮想画素精度指示情報８００の値が「半画素精度の動きベクトル検出」を示している場合は、予測オーバヘッド情報４６３に含まれる動きベクトルの値の単位を1/2画素に設定して、予測オーバヘッド情報４６３を予測部４６１へ送る。予測部４６１は、予測オーバヘッド情報４６３に含まれる動きベクトルの値が1/2画素単位であることを踏まえて、上記MPEG-4ないしはAVCのようなマルチタップフィルタに基づく半画素精度サンプル生成を行うか、または、上記MPEG-1,MPEG-2の場合のような線形補間により半画素精度のサンプルを生成しながら予測画像の生成を行う。半画素サンプルの生成方法を複数選択できるように構成する場合は、可変長復号部２５において図９７の仮想サンプル生成手法指示情報８１１をビットストリームから抽出し、それを予測部４６１へ伝達して符号化装置と同じ方法により半画素サンプルの生成を行うように構成する。

以上述べた本実施の形態１７における符号化装置、復号装置によれば、４：４：４フォーマットのカラー映像信号を効率よく符号化するために、各色成分を独立に動き補償予測する際に、各色成分の信号の性質に応じて、動きベクトル検出・予測画像生成の際に利用する仮想サンプルの精度を動的に切り替えることが可能となるため、高い圧縮率となる低ビットレート符号化において符号量全体に対する比率が高くなる、動きベクトルの符号量を効果的に抑制した符号化を行うことが可能となる。さらに、仮想サンプルの生成を行う場合に使用する内挿フィルタの種別など仮想サンプル生成の手法を複数用意して選択的に切り替えて仮想サンプルを生成することにより、各色成分の信号の性質に応じた最適な動き補償予測処理が可能となり、４：４：４フォーマットのカラー映像信号を効率よく符号化する符号化装置、復号装置を提供することができる。

なお、本実施の形態１７では、上記実施の形態１６の図８８に仮想画素精度指示情報８００を加えた図９６の符号化装置、図９３に仮想画素精度指示情報８００を加えた図９８の復号装置を用いて説明したが、他の実施の形態の図に仮想画素精度指示情報８００を加えた符号化装置、及び仮想画素精度指示情報８００を加えた復号装置を用いても同様の効果を得ることができる。

実施の形態１８．
上述した実施の形態において、単一の色成分を他の色成分とは独立に符号化・復号する個別・独立符号化処理を行う符号化装置・復号装置につき、別の実施の形態について述べる。ここでは、実施の形態１６を例にして述べる。個別・独立符号化処理では、原理上非可逆符号化ができない符号化モード６や動きベクトルなどの予測オーバヘッド情報４６３を、色成分別に個々にビットストリームに多重するため、符号量全体に対してこれらの符号量の比率が高くなる高圧縮符号化の場合には圧縮性能の妨げとなる。そこで、本実施の形態１８の符号化装置では、ある特定の色成分(例えばC0成分、と決める)でマクロブロック符号化を行った結果得られる、符号化モード６や予測オーバヘッド情報４６３等の情報をリファレンス情報として保持しておき、他の色成分を扱うピクチャ符号化部５０３において、リファレンス情報を使用するC0成分のマクロブロックと画像空間上で同一位置にあるマクロブロックの符号化を行う際、上記リファレンス情報を流用して符号化を行うか、あるいは自身の色成分で個別に符号化モード６、予測オーバヘッド情報４６３を決定して符号化を行うかを選択できるように構成し、いずれの手順を選択したかを示す予測情報符号化指示フラグをマクロブロック単位に多重するように構成する。このように構成することによって、色成分間で符号化モード６や予測オーバヘッド情報４６３に関わる相関が高い場合、これらの符号量を効果的に削減して圧縮効率を高めることができる。

自身の色成分で個別に符号化モード６、予測オーバヘッド情報４６３を決定して符号化を行う場合は、実施の形態１６や１７に述べた符号化・復号処理手順をそのまま利用できる。また、リファレンス情報を参照して符号化を行う場合も、符号化側ではリファレンス情報を得るまで他の成分の符号化処理を待たせる必要はあるものの、符号化モード６や予測オーバヘッド情報４６３等のビットストリームへの多重処理をスキップするだけで、ほぼ実施の形態１６や１７に述べた符号化処理手順をそのまま利用できる。復号側においても、はじめにリファレンス情報の復号を行っておく必要はあるが、上記予測情報符号化指示フラグを復号してリファレンス情報を使用するか、自身のマクロブロック内の復号情報を使用するかを判断する処理が行われるだけで、あとは実施の形態１６や１７に述べた復号処理手順をそのまま利用できる。

さらに、上記予測情報符号化指示フラグがマクロブロック単位に常に多重されるか否かを、より上位のデータ階層(スライス、ピクチャ、シーケンス)で決定しビットストリームに多重することにより、高圧縮時のみに限定するなど、上記予測情報符号化指示フラグを必要な場合にだけマクロブロックレベルの符号として多重すればよく、符号化効率を高めることもできる。また、リファレンス情報をある特定の色成分の情報に限定せず、いずれの色成分をリファレンスとして用いるか、を選択しながら符号化・復号するように構成してもよい。

なお、本実施の形態１８の構成は、実施の形態１６に限定せず、本願実施の形態における、単一の色成分を他の色成分とは独立に符号化・復号する個別・独立符号化処理を行う符号化装置・復号装置すべてに適用可能である。

１入力映像信号、２空間予測部、３減算器、４予測差分信号、５符号化モード判定部、６符号化モード、７予測画像、８直交変換部、９量子化部、１０量子化済み変換係数、１１可変長符号化部、１１ａコンテクストモデル決定部、１１ｂ二値化部、１１ｃ生起確率生成部、１１ｄ符号化部、１１ｅ符号化値、１１ｆコンテクストモデル、１１ｇ生起確率情報記憶メモリ、１１ｈ生起確率状態、１２逆量子化部、１３逆直交変換部、１４局部復号予測差分信号、１５局部復号画像（暫定復号画像）、１６メモリ、１７送信バッファ、１８加算器、１９符号化制御部、２０重み係数、２１量子化パラメータ、２２ビデオストリーム、２３イントラ予測モード共通化識別フラグ、２４デブロッキングフィルタ制御フラグ、２５可変長復号部、２５ａ復号部、２５ｂ bin復元値、２６デブロッキングフィルタ、２７復号画像、２８イントラ符号化モード、２９基本イントラ予測モード、３０拡張イントラ予測モード、３１拡張イントラ予測モードテーブル指示フラグ、３２変換ブロックサイズ識別フラグ、３３イントラ符号化モード共通化識別フラグ、３４イントラ符号化モード、３５イントラ予測モード、３６イントラ予測モード指示フラグ、４０ブロック分割部、１０２動き補償予測部、１０６マクロブロックタイプ／サブマクロブロックタイプ、１２３インター予測モード共通化識別フラグ、１２３ｂ動きベクトル共通化識別フラグ、１２３ｃマクロブロックヘッダ共通化識別フラグ、１２８基本マクロブロックタイプ、１２８ｂマクロブロックタイプ、１２９基本サブマクロブロックタイプ、１２９ｂサブマクロブロックタイプ、１３０拡張マクロブロックタイプ、１３１拡張サブマクロブロックタイプ、１３２基本参照画像識別番号、１３２ｂ参照画像識別番号、１３３基本動きベクトル情報、１３４拡張参照画像識別番号、１３５拡張動きベクトル情報、１３６プロファイル情報、１３７動きベクトル、１３８、１３８ａ、１３８ｂ、１３８ｃスキップ指示情報、１３９ａ、１３９ｂ、１３９ｃヘッダ情報、１４０ａ、１４０ｂ、１４０ｃ変換係数データ、１４１イントラ予測モード、１４２変換係数有効無効指示情報、１４３生起確率状態パラメータ共通化識別フラグ、１４４イントラ色差予測モード、１１１動きベクトル予測部、１１２差分動きベクトル算出部、１１３差分動きベクトル可変長符号化部、２５０動きベクトル復号部、２５１差分動きベクトル可変長復号部、２５２動きベクトル予測部、２５３動きベクトル算出部、３０１色空間変換部、３０２変換映像信号、３０３符号化装置、３０４色空間変換方法識別情報、３０５ビットストリーム、３０６復号装置、３０７復号画像、３０８逆色空間変換部、３１０変換部、３１１色空間変換方法識別情報、３１２逆変換部、４２２ａ、４２２ｂ０、４２２ｂ１、４２２ｂ２、４２２ｃビデオストリーム、４２３共通符号化・独立符号化識別信号、４２７ａ、４２７ｂ、４２７ｂ０、４２７ｂ１、４２７ｂ２復号画像、４６１予測部、４６２デブロッキングフィルタ、４６３予測オーバヘッド情報、４６４変換ブロックサイズ指定フラグ、４６５色空間変換部、４６６逆色空間変換部、４６７シグナリング情報、５０１、６０１スイッチ、５０２色成分分離部、５０３ａ第１のピクチャ符号化部、５０３ｂ０、５０３ｂ１、５０３ｂ２第２のピクチャ符号化部、５０４多重化部、５０５入力信号、５０５ｂ０、５０５ｂ１、５０５ｂ２画面成分、５０６符号化ブロックサイズ指示情報、５０６ｂ０、５０６ｂ１、５０６ｂ２符号化単位の矩形領域のサイズMiを指定する情報、６０２色成分判定部、６０３ａ第１のピクチャ復号部、６０３ｂ０、６０３ｂ１、６０３ｂ２第２のピクチャ復号部、６１０上位ヘッダ解析部、７０１参照画像、７１１符号化モード定義選択情報、７２１色成分識別フラグ、８００仮想画素精度指示情報、８１１仮想サンプル生成手法指示情報、４６１１ａ、４６１１ｂ、４６１１ｃ切替部、４６１２輝度信号イントラ予測部、４６１３色差信号イントラ予測部、４６１４輝度信号インター予測部、４６１５色差信号インター予測部。

Claims

複数の色成分から構成されるカラー動画像信号を入力して、該カラー動画像信号を各色成分ごとに所定の符号化単位領域に分割して、画面内符号化ないしは動き補償予測符号化を選択的に適用することにより前記カラー動画像信号をデジタル圧縮する画像符号化装置であって、
入力色成分信号を、符号化ブロックサイズ指示情報によって定まるサイズのブロックに分割して、前記符号化単位領域の信号を生成するブロック分割部と、
予測画像生成方法を示すひとつ以上の予測モードに対応して前記符号化単位領域の信号に対する予測画像を生成する予測画像生成部と、
該予測画像生成部から出力される予測画像の予測効率に応じて符号化に用いる予測モードを判定する判定部と、
該判定部によって定められた予測モードに対応する予測画像と前記入力色成分信号との差分を符号化する予測誤差符号化部と、
前記予測モードと予測誤差符号化部の出力とを可変長符号化する符号化部とを備え、
前記符号化部は、前記符号化ブロックサイズ指示情報、ならびに各符号化単位領域ごとの前記予測モード、予測誤差を符号化した情報をビットストリームに多重化することを特徴とする画像符号化装置。
複数の色成分から構成されるカラー動画像信号を圧縮符号化したビットストリームを入力として、該カラー動画像信号の各色成分ごとに、画面内復号処理ないしは動き補償予測復号処理を選択的に適用することにより前記カラー動画像信号を復号する画像復号装置であって、
色成分ごとに、各色成分信号の符号化単位領域となるブロックのサイズを定める符号化ブロックサイズ指示情報をビットストリームから復号するとともに、該符号化ブロックサイズ指示情報に基づいて符号化単位領域のブロックサイズを定め、該符号化単位領域ごとに、所定のシンタックスにしたがって、該符号化単位領域の符号化に用いられる予測画像生成方法を示す予測モード、および予測誤差を符号化した情報をビットストリームから復号する復号部と、
前記符号化ブロックサイズ指示情報と前記予測モードとに基づいて前記符号化単位領域の信号に対する予測画像を生成する予測画像生成部と、
前記予測誤差を符号化した情報に基づいて予測誤差信号を復号する予測誤差復号部と、前記予測画像生成部の出力と、前記予測誤差復号部の出力とを加算する加算部とを備えることを特徴とする画像復号装置。
複数の色成分から構成されるカラー動画像信号を入力して、該カラー動画像信号を各色成分ごとに所定の符号化単位領域に分割して、動き補償予測符号化を用いて前記カラー動画像信号をデジタル圧縮する画像符号化装置であって、
入力色成分信号を、所定のブロックに分割して、前記符号化単位領域の信号を生成するブロック分割部と、
動き補償予測画像生成方法を示すひとつ以上の動き補償予測モードと動きベクトルに対応して前記符号化単位領域の信号に対する予測画像を生成する予測画像生成部と、
該予測画像生成部から出力される動き補償予測画像の予測効率に応じて符号化に用いる動き補償予測モードおよび対応する動きベクトルを判定する判定部と、
該判定部によって定められた動き補償予測モードに対応する予測画像と前記入力色成分信号との差分を符号化する予測誤差符号化部と、
前記動き補償予測モードと動きベクトルと予測誤差符号化部の出力を可変長符号化する符号化部とを備え、
前記予測画像生成部は、予測画像生成に際して使用する仮想画素の上限精度を示す仮想画素精度指示情報に基づいて、指定される仮想画素までの精度で前記符号化領域単位ごとに予測画像生成を行うとともに、前記判定部は、前記仮想画素精度指示情報に基づいて、指定される仮想画素までの精度で、前記符号化領域単位ごとに動き補償予測モードと動きベクトルを求め、前記符号化部は、前記仮想画素精度指示情報をビットストリームに多重化するとともに、前記符号化単位領域ごとに、前記仮想画素精度指示情報に基づいて動きベクトルを符号化し、前記動き補償予測モードおよび予測誤差を符号化した情報をビットストリームに多重化することを特徴とする画像符号化装置。
複数の色成分から構成されるカラー動画像信号を圧縮符号化したビットストリームを入力として、該カラー動画像信号の各色成分ごとに、動き補償予測復号処理を用いて前記カラー動画像信号を復号する画像復号装置であって、
色成分ごとに、予測画像生成に際して使用する仮想画素の上限精度を示す仮想画素精度指示情報をビットストリームから復号するとともに、符号化単位領域ごとに、所定のシンタックスにしたがって、該符号化単位領域の符号化に用いられる動き補償予測画像生成方法を示す動き補償予測モード、対応する動きベクトルおよび予測誤差を符号化した情報をビットストリームから復号する復号部と、
前記仮想画素精度指示情報と前記動き補償予測モードと前記動きベクトルとに基づいて前記符号化単位領域の信号に対する予測画像を生成する予測画像生成部と、
前記符号化単位領域の予測誤差を符号化した情報に基づいて予測誤差信号を復号する予測誤差復号部と、
前記予測画像生成部の出力と、前記予測誤差復号部の出力とを加算する加算部とを備え、
前記復号部は、前記仮想画素精度指示情報に基づいて動きベクトルの復号処理を行うことを特徴とする画像復号装置。