JP2016508354A

JP2016508354A - ３ｄビデオにおけるビュー合成

Info

Publication number: JP2016508354A
Application number: JP2015552825A
Authority: JP
Inventors: チェン、イン; ワン、イェ−クイ; ジャン、リ
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2013-01-10
Filing date: 2014-01-10
Publication date: 2016-03-17
Anticipated expiration: 2034-01-10
Also published as: KR20150105434A; WO2014110426A1; CN105308969A; EP2944086A1; EP2944086B1; KR102218509B1; TWI566589B; BR112015016678A2; CN105308969B; BR112015016678B1; TW201440503A; US20140192157A1; US10136119B2; ES2703062T3; JP6312705B2

Abstract

一例では、ビデオデータを復号する方法は、現在のブロックに対する参照インデックスがビュー間参照ピクチャに対応するかどうかを決定することと、現在のブロックに対する参照インデックスがビュー間参照ピクチャに対応するときに、現在のブロックのビュー合成予測（ＶＳＰ）モードを示すデータを、符号化されたビットストリームから取得することとを含み、ここで、参照インデックスに対するＶＳＰモードは、現在のブロックがビュー間参照ピクチャからビュー合成予測を用いて予測されるかどうかを示す。

Description

[0001]本出願は、その全体が参照により本明細書に組み込まれる、２０１３年１月１０日に出願された米国仮出願第６１／７５１，２１１号の利益を主張する。

[0002]本開示は、ビデオコード化に関する。

[0003]デジタルビデオ機能は、デジタルテレビジョン、デジタルダイレクトブロードキャストシステム、ワイヤレスブロードキャストシステム、携帯情報端末（ＰＤＡ）、ラップトップコンピュータ又はデスクトップコンピュータ、タブレットコンピュータ、電子ブックリーダ、デジタルカメラ、デジタル記録機器、デジタルメディアプレーヤ、ビデオゲーム機器、ビデオゲームコンソール、携帯電話又は衛星無線電話、所謂「スマートフォン」、ビデオ遠隔会議機器、ビデオストリーミング機器などを含む、広範囲にわたる機器に組み込まれ得る。デジタルビデオ機器は、ＭＰＥＧ−２、ＭＰＥＧ−４、ＩＴＵ−ＴＨ．２６３、ＩＴＵ−ＴＨ．２６４／ＭＰＥＧ−４、Ｐａｒｔ１０、アドバンストビデオコード化（ＡＶＣ：Advanced Video Coding）、現在開発中の高効率ビデオコード化（ＨＥＶＣ：High Efficiency Video Coding）規格によって定義された規格、及びそのような規格の拡張に記載されているビデオ圧縮技法など、ビデオ圧縮技法を実装する。ビデオ機器は、そのようなビデオ圧縮技法を実装することによって、デジタルビデオ情報をより効率的に送信、受信、符号化、復号、及び／又は記憶することができる。

[0004]ビデオ圧縮技法は、ビデオシーケンスに固有の冗長性を低減又は除去するために空間的（イントラピクチャ）予測及び／又は時間的（インターピクチャ）予測を実行する。ブロックベースのビデオコード化の場合、ビデオスライス（即ち、ピクチャ又はピクチャの一部分）は、ツリーブロック、コード化単位（ＣＵ）及び／又はコード化ノードと呼ばれる場合もあるビデオブロックに区分することができる。ピクチャのイントラコード化された（Ｉ）スライス中のビデオブロックは、同じピクチャ中の隣接ブロック中の参照サンプルに対する空間的予測を使用して符号化される。ピクチャのインターコード化された（Ｐ又はＢ）スライス内のビデオブロックは、同じピクチャの中の隣接ブロック内の参照サンプルに対する空間的予測、又は他の参照ピクチャの中の参照サンプルに対する時間的予測を使用することができる。

[0005]空間的予測又は時間的予測は、コード化されるべきブロックの予測ブロックをもたらす。残差データは、コード化されるべき元のブロックと予測ブロックとの間の画素差分を表す。インターコード化されたブロックは、予測ブロックを形成する参照サンプルのブロックを指す動きベクトルと、コード化されたブロックと予測ブロックとの差を示す残差データとに従って符号化される。イントラコード化されたブロックは、イントラコード化モードと残差データとに従って符号化される。更なる圧縮のために、残差データは空間領域から変換領域に変換されて、残差変換係数をもたらすことができ、次いで、残差変換係数は量子化され得る。最初に２次元アレイで構成される量子化された変換係数は、変換係数の１次元ベクトルを生成するために走査されてよく、エントロピーコード化が更なる圧縮を達成するために適用されてよい。

[0006]概して、本開示は、ビュー合成予測(view synthesis prediction)に関係する情報をコード化するための技法について説明する。ビュー合成予測は、概して、ビュー間予測を使用してビューのピクチャをコード化するときに参照ピクチャとして合成ビューコンポーネントが使用されるマルチビュービデオコード化のためのビデオコード化技法を指す。本開示の技法は、ビュー間参照ピクチャに対するビットストリーム中に与えられる指示に基づいてビデオデータの特定のブロックに対するビュー合成予測を適用するかどうかを決定することを含む。

[0007]一例では、ビデオデータを復号する方法は、現在のブロックに対する参照インデックスがビュー間参照ピクチャに対応するかどうかを決定することと、現在のブロックに対する参照インデックスがビュー間参照ピクチャに対応するときに、現在のブロックのビュー合成予測（ＶＳＰ）モードを示すデータを、符号化されたビットストリームから取得することとを含み、ここにおいて、参照インデックスに対するＶＳＰモードは、現在のブロックがビュー間参照ピクチャからビュー合成予測を用いて予測されるかどうかを示す。

[0008]別の例では、ビデオデータを復号するための装置は、現在のブロックを含むビデオデータを記憶するメモリと、現在のブロックに対する参照インデックスがビュー間参照ピクチャに対応するかどうかを決定すること、及び現在のブロックに対する参照インデックスがビュー間参照ピクチャに対応するときに、現在のブロックのビュー合成予測（ＶＳＰ）モードを示すデータを、符号化されたビットストリームから取得することを行うように構成された１つ又は複数のプロセッサとを含み、ここにおいて、参照インデックスに対するＶＳＰモードは、現在のブロックがビュー間参照ピクチャからビュー合成予測を用いて予測されるかどうかを示す。

[0009]別の例では、ビデオデータを符号化する方法は、現在のブロックに対する参照インデックスがビュー間参照ピクチャに対応するかどうかを決定することと、現在のブロックに対する参照インデックスがビュー間参照ピクチャに対応するときに、現在のブロックのビュー合成予測（ＶＳＰ）モードを示すデータを生成することと、ここにおいて、参照インデックスに対するＶＳＰモードは、現在のブロックがビュー間参照ピクチャからビュー合成予測を用いて予測されるかどうかを示す、ビットストリーム中のＶＳＰモードを示すデータを符号化することとを含む。

[0010]別の例では、ビデオデータを符号化するための装置は、現在のブロックを含むビデオデータを記憶するメモリと、現在のブロックに対する参照インデックスがビュー間参照ピクチャに対応するかどうかを決定すること、現在のブロックに対する参照インデックスがビュー間参照ピクチャに対応するときに、現在のブロックのビュー合成予測（ＶＳＰ）モードを示すデータを生成すること、ここにおいて、参照インデックスに対するＶＳＰモードは、現在のブロックがビュー間参照ピクチャからビュー合成予測を用いて予測されるかどうかを示す、及びビットストリーム内のＶＳＰモードを示すデータを符号化することを行うように構成された１つ又は複数のプロセッサとを含む。

[0011]別の例では、非一時的コンピュータ可読媒体は、その上に記憶された命令を有し、その命令は、実行されると、１つ又は複数のプロセッサに、現在のブロックに対する参照インデックスがビュー間参照ピクチャに対応するかどうかを決定することと、現在のブロックに対する参照インデックスがビュー間参照ピクチャに対応するときに、現在のブロックのビュー合成予測（ＶＳＰ）モードを示すデータをコード化することとを行わせ、ここにおいて、参照インデックスに対するＶＳＰモードは、現在のブロックがビュー間参照ピクチャからビュー合成予測を用いて予測されるかどうかを示す。

[0012]別の例では、ビデオデータをコード化するための装置は、現在のブロックに対する参照インデックスがビュー間参照ピクチャに対応するかどうかを決定するための手段と、現在のブロックに対する参照インデックスがビュー間参照ピクチャに対応するときに、現在のブロックのビュー合成予測（ＶＳＰ）モードを示すデータをコード化するための手段とを含み、ここにおいて、参照インデックスに対するＶＳＰモードは、現在のブロックがビュー間参照ピクチャからビュー合成予測を用いて予測されるかどうかを示す。

[0013]１つ又は複数の例の詳細が、添付の図面及び以下の説明に記載されている。他の特徴、目的、及び利点は、その説明及び図面、ならびに特許請求の範囲から明らかになろう。

[0014]本開示で説明される技法を利用し得る例示的なビデオ符号化及び復号システムを示すブロック図。 [0015]本開示で説明される技法を実装し得る例示的なビデオエンコーダを示すブロック図。 [0016]本開示で説明される技法を実装し得る例示的なビデオデコーダを示すブロック図。 [0017]マルチビュービデオコード化（ＭＶＣ）シーケンスをコード化することを示す概念図。 [0018]例示的なＭＶＣ予測パターンを示す概念図。 [0019]ビュー合成予測に関係する情報をコード化するための例示的な方法を示すフローチャート。 [0020]ビュー合成予測に関係する情報をコード化するための別の例示的な方法を示すフローチャート。

[0021]概して、本開示は、マルチビュービデオデータ、例えば、３次元（３Ｄ）効果を生成するために使用されるビデオデータをコード化し処理するための技法について説明する。従って、本開示の態様は、深度マップを用いたピクチャの２つ以上のビューのコード化を含む、アドバンストコーデックに基づく３Ｄビデオコード化に関連し得る。特に、本開示の態様は、３Ｄビデオコード化プロセスにおけるビュー合成予測サポート信号伝達(view synthesis prediction support signaling)に関連し得る。

[0022]本開示の技法は、多種多様なビデオコード化規格に適用され得る。例えば、ビデオコード化規格は、ＩＴＵ−ＴＨ．２６１、ＩＳＯ／ＩＥＣＭＰＥＧ−１Ｖｉｓｕａｌ、ＩＴＵ−ＴＨ．２６２又はＩＳＯ／ＩＥＣＭＰＥＧ−２Ｖｉｓｕａｌ、ＩＴＵ−ＴＨ．２６３、ＩＳＯ／ＩＥＣＭＰＥＧ−４Ｖｉｓｕａｌ、ならびに、そのスケーラブルビデオコード化（ＳＶＣ）拡張及びマルチビュービデオコード化（ＭＶＣ）拡張を含む（ＩＳＯ／ＩＥＣＭＰＥＧ−４ＡＶＣ又はＨ．２６４／ＡＶＣとしても知られている）ＩＴＵ−ＴＨ．２６４を含む。ＭＶＣの最近のジョイントドラフトは、「Ａｄｖａｎｃｅｄｖｉｄｅｏｃｏｄｉｎｇｆｏｒｇｅｎｅｒｉｃａｕｄｉｏｖｉｓｕａｌｓｅｒｖｉｃｅｓ」、ＩＴＵ−Ｔ勧告Ｈ．２６４、２０１０年３月に記載されている。

[0023]更に、ＩＴＵ−Ｔビデオコード化エキスパートグループ（ＶＣＥＧ）とＩＳＯ／ＩＥＣモーションピクチャエキスパートグループ（ＭＰＥＧ：Motion Picture Experts Group）とのジョイントコラボレーションチームオンビデオコード化（ＪＣＴ−ＶＣ：Joint Collaboration Team on Video Coding）によって開発されている新しいビデオコード化規格、即ちＨＥＶＣがある。以下でＨＥＶＣＷＤ４と呼ぶ、ＨＥＶＣの最近のワーキングドラフト（ＷＤ）は、ｈｔｔｐ：／／ｐｈｅｎｉｘ．ｉｎｔ−ｅｖｒｙ．ｆｒ／ｊｃｔ／ｄｏｃ＿ｅｎｄ＿ｕｓｅｒ／ｄｏｃｕｍｅｎｔｓ／６＿Ｔｏｒｉｎｏ／ｗｇ１１／ＪＣＴＶＣ−Ｆ８０３−ｖ８．ｚｉｐから入手可能である。これ以降ＨＥＶＣＷＤ９と呼ばれる、ＨＥＶＣの別のＷＤが、ｈｔｔｐ：／／ｐｈｅｎｉｘ．ｉｎｔ−ｅｖｒｙ．ｆｒ／ｊｃｔ／ｄｏｃ＿ｅｎｄ＿ｕｓｅｒ／ｄｏｃｕｍｅｎｔｓ／１１＿Ｓｈａｎｇｈａｉ／ｗｇ１１／ＪＣＴＶＣ−Ｋ１００３−ｖ１０．ｚｉｐから入手可能である。

[0024]最近のＭＰＥＧにおける標準化活動は、３Ｄビデオ技術に対する提案の呼びかけ（ＣｆＰ：Call for Proposal）を含めた。応答の中から、現在の３Ｄ参照ソフトウェアに含まれるべき技法が選択された。１つの可能性のある規格は、各ビューに対してテクスチャと深度の両方をコード化し得る、Ｈ．２６４／ＡＶＣベースの３Ｄビデオコード化である。ＡＶＣベースの３Ｄビデオコード化（３Ｄ−ＡＶＣ）（本明細書では３ＤＶＷＤ４と呼ばれる）に対する主たるコード化ツールは、文書ＪＣＴ３Ｖ−Ｂ１００２（「３Ｄ−ＡＶＣＤｒａｆｔＴｅｘｔ４」、ＩＴＵ−ＴＳＧ１６ＷＰ３の３Ｄビデオコード化拡張開発とＩＳＯ／ＩＥＣＪＴＣ１／ＳＣ２９／ＷＧ１１とについてのジョイントコラボレーションチーム、第２回会合：上海、ＣＮ、２０１２年１０月１３日〜１９日、ｈｔｔｐ：／／ｐｈｅｎｉｘ．ｉｔ−ｓｕｄｐａｒｉｓ．ｅｕ／ｊｃｔ２／ｄｏｃ＿ｅｎｄ＿ｕｓｅｒ／ｃｕｒｒｅｎｔ＿ｄｏｃｕｍｅｎｔ．ｐｈｐ？ｉｄ＝４５６から公に入手可能）に記載されている。最新の参照ソフトウェアの説明は、ＭｉｓｋａＭ．Ｈａｎｎｕｋｓｅｌａ、「ＴｅｓｔＭｏｄｅｌｆｏｒＡＶＣｂａｓｅｄ３Ｄｖｉｄｅｏｃｏｄｉｎｇ」、ＩＳＯ／ＩＥＣＪＴＣ１／ＳＣ２９／ＷＧ１１ＭＰＥＧ２０１１／Ｎ１２５５８、サンノゼ、米国、２０１２年２月である。最新の参照ソフトウェアは、本明細書ではＡＴＭ又は３Ｄ−ＡＴＭと呼ばれてよく、ｈｔｔｐ：／／ｍｐｅｇ３ｄｖ．ｒｅｓｅａｒｃｈ．ｎｏｋｉａ．ｃｏｍ／ｓｖｎ／ｍｐｅｇ３ｄｖ／ｔｒｕｎｋ／において公に入手可能である。

[0025]幾つかの例では、本開示の技法は、Ｈ．２６４／ＡＶＣに基づく３Ｄビデオ（３ＤＶ）コード化規格に適用され得る。従って、例示のために、本開示の技法は、主に、ＩＴＵ−ＴＨ．２６４／ＡＶＣの３ＤＶ拡張に関して説明される。しかしながら、技法は、ＨＥＶＣ規格又は他のコード化規格の３Ｄビデオ（３ＤＶ）拡張などの３次元効果を生成するために使用されるコード化ビデオデータに対する他の規格に適用され得ることは理解されよう。

[0026]いずれの場合も、特定のビデオコード化システムによれば、データ圧縮を実現するように、ビデオシーケンスにおける時間的冗長性を低減するために、動き推定及び動き補償が使用され得る。この場合、ビデオデータの予測ブロック、例えば、コード化されている現在ビデオブロックの値を予測するために使用され得る別のビデオのピクチャ又はスライスからのブロックを識別する、動きベクトルが生成され得る。予測ビデオブロックの値が現在ビデオブロックの値から減算されて、残差データのブロックを生成する。動き情報（例えば、動きベクトル、動きベクトルインデックス、予測方向、又は他の情報）が、残差データとともにビデオエンコーダからビデオデコーダに通信される。デコーダは、（動きベクトルに基づいて）同じ予測ブロックの位置を特定し、残差データを予測ブロックのデータと合成することにより、符号化されたビデオブロックを復元することができる。

[0027]３Ｄビデオコード化に関して、ビデオ中で３次元効果を生成するために、シーンの２つのビュー、例えば、左眼ビューと右眼ビューとが同時に又はほぼ同時に示され得る。シーンの左眼ビューと右眼ビューとに対応する、同じシーンの２つのピクチャは、閲覧者の左眼と右眼との間の水平視差を表すわずかに異なる水平位置から撮影され得る（又は、例えば、コンピュータ生成グラフィックとして生成され得る）。左眼ビューのピクチャが閲覧者の左眼によって知覚され、右眼ビューのピクチャが閲覧者の右眼によって知覚されるようにこれらの２つのピクチャを同時又はほぼ同時に表示することによって、閲覧者は３次元ビデオ効果を経験し得る。

[0028]マルチビューコード化（又はステレオビューコード化）に関係するビデオコード化技法は、概して、ビュー間予測及び／又はコード化深度情報を含み得る。ビュー間予測は、概して、標準のイントラ予測又はインター予測を使用してベースビューのピクチャをコード化し、次いで、ベースビュー又は他のビューに対して他のビューのピクチャを予測することを含む。このようにして、非ベースビューの幾つかのピクチャは、ベースビュー又は別の非ベースビューのピクチャに対して予測され得る。

[0029]一般に、ピクチャが参照ピクチャに対してコード化されるとき、ビデオコード化機器は、参照ピクチャリストのメンバーとして参照ピクチャを信号伝達する。従って、ビュー間コード化では、参照ピクチャリストに追加される参照ピクチャは、例えば、時間的予測のための現在ビューの他のピクチャに加えて、他のビューのピクチャを含み得る。参照ピクチャリスト構築プロセスは、時間的及びビュー予測参照をフレキシブルに構成することができる。参照ピクチャ選択及び冗長ピクチャ機構がビュー次元に拡張され得るので、これは、潜在的なコード化効率向上だけでなく誤り耐性も与え得る。

[0030]３ＤＶの現在のコンテキストでは、ビデオコーダは、マルチビュービットストリームの各ビューについてのテクスチャ情報（例えば、ルミナンス／輝度及びクロミナンス／色）と深度情報の両方をコード化し得る。従って、３ＤＶビデオコーダは、深度マップをコード化するように構成され得る。深度マップは、画素値(pixel values)が、対応するテクスチャピクチャ中に示されるオブジェクトの３次元深度を表すピクチャである。深度マップは、アクセス単位の別のビューとしてコード化され得る。即ち、様々なビュー用のテクスチャピクチャに加えて、アクセス単位中で表される１つ又は複数のビューは、それぞれの深度マップを含むことができる。ビューのための深度マップは、アクセス単位の「深度ビューコンポーネント」と呼ばれることもある。「ビューコンポーネント」という用語は、アクセス単位の特定のビューのテクスチャビューコンポーネントと深度ビューコンポーネントの両方を指すために使用され得る。

[0031]従って、３ＤＶビットストリームは、複数のビューのコード化された表現を含み得、複数のビューの各々が、テクスチャ情報（テクスチャビューコンポーネント）と深度情報（深度ビューコンポーネント）の両方を含み得る。３ＤＶはまた複数のビューのテクスチャを含んでいるが、場合によっては、３ＤＶビットストリームはマルチビュービットストリームに適合し得る。

[0032]深度情報を与えることによって、機器は、ビットストリーム中に与えられるビュー以外の様々なビューのためのピクチャをレンダリングし得る。例えば、深度情報をもつ２つのビューがビットストリーム中に与えられている場合、クライアント機器は、例えば、ビットストリームの２つのコード化されたビューとの間に第３のビューのためのピクチャを生成するために深度情報を使用し得る。そのようなピクチャの生成は、深度画像ベースレンダリング（ＤＩＢＲ：depth image based rendering）と呼ばれる。ＤＩＢＲは、利用可能なテクスチャ及び深度画像に基づいてビューを生成するために使用され得る。そのような生成プロセスはビュー合成と呼ばれる。

[0033]ビュー合成は、ビューの復号に続く後処理のために使用され得る（「ループ後」ビュー合成とも呼ばれる」）。追加又は代替として、ビュー合成は、ビュー間予測のために使用される参照ピクチャを生成するために使用され得る（「ループ内」ビュー合成とも呼ばれる）。ＤＩＢＲがテクスチャピクチャ、（一般に深度マップと呼ばれる）深度ピクチャ、又はその両方をレンダリングするために使用され得ることを理解されたい。概して、深度マップは、クロミナンス情報を含むことなしに、深度マップの画素値が輝度情報ではなく、対応するテクスチャ情報のための深度を表すことを除いて、テクスチャピクチャのルミナンス（ルーマ）データと同様に表される。

[0034]ループ内ビュー合成に関して、ビュー合成参照ピクチャ（ＶＳＲＰ：view synthesis reference picture）（又は、代替として、ビュー合成予測ピクチャ）と呼ばれることがある、ビュー合成を使用して生成される参照ピクチャは、時間的インター予測参照ピクチャ又はビュー間参照ピクチャと同様の参照ピクチャとして使用され得る。ＶＳＲＰは参照ピクチャリスト中に含まれ得る。従来のコード化技法の幾つかの特定の設計では、ＤＩＢＲを介してただ１つのＶＳＲＰを生成するために（深度をもつ）複数のビューが使用され得る。従って、現在コード化されているピクチャについて、ただ１つのＶＳＲＰがこれらの従来のコード化技法において利用可能であり得る。

[0035]ループ内ビュー合成予測（ＶＳＰ）は、強化されたテクスチャコード化（上記のＷＤ４）に対する現在のＨ．２６４／ＡＶＣベースの３Ｄビデオコード化規格中でサポートされる。現在ビューのコード化のためにＶＳＰを使用可能にするために、同じアクセス単位の以前にコード化されたテクスチャ及び深度のビューコンポーネントがビュー合成のために使用され得る。ＶＳＰから生じる合成ピクチャは、時間的参照フレーム及びビュー間参照フレームに続く初期参照ピクチャリスト（例えば、ＲｅｆＰｉｃＬｉｓｔ０及び／又はＲｅｆＰｉｃＬｉｓｔ１）中に含まれる。

[0036]文書「３Ｄ−ＣＥ１．ａ：ＧｅｎｅｒａｌｉｚｅｄＶｉｅｗＳｙｎｔｈｅｓｉｓＰｒｅｄｉｃｔｉｏｎ（ＧＶＳＰ）ｍｏｄｅ」、ＩＴＵ−ＴＳＧ１６ＷＰ３とＩＳＯ／ＩＥＣＪＴＣ１／ＳＣ２９／ＷＧ１１との３Ｄビデオコード化拡張開発についてのジョイントコラボレーションチーム、第２回会合：上海、ＣＮ、２０１２年１０月１３日〜１９日、ＪＣＴ３Ｖ−Ｂ００５４が、一般化されたビュー合成予測（ＧＶＳＰ）と呼ばれるビュー合成プロセスを提案した。ＧＶＳＰにおいて、ブロックがスキップモードとしてコード化され、ビュー合成されたピクチャから予測されるかどうかを示すために、フラグがマクロブロック又はそれ以下の複数のレベルにおいて導入される。

[0037]ビュー合成予測の信号伝達は、ＭＢレベルの信号伝達に関してＨ．２６４／ＡＶＣ設計に対して透明である伝統的な参照インデックスに基づくことができる。例えば、各ＭＢに対して、ビデオコーダは、参照ピクチャリスト中のビュー合成ピクチャを識別する参照インデックスに基づいて、ビュー合成を使用するかどうかを決定し、ビュー合成参照インデックスは、スライスヘッダ内で明示的に信号伝達され得る。この設計は、一方向がビュー合成ピクチャを用いて予測され、他方向が通常の時間的ピクチャ又はビュー間参照ピクチャから予測される、双方向予測をサポートし得る。この設計はまた、スライスレベルにおいてならびにマクロブロックレベルにおいて適応されるべき複数のビュー合成ピクチャをサポートする。

[0038]しかしながら、（上記のように３Ｄ−ＡＴＭと呼ばれる現在の３Ｄ−ＡＶＣ参照ソフトウェアに記載されている）現在の設計において、ブロックベースのビュー合成予測がオンザフライで行われる。ブロックベースのビュー合成予測を「オンザフライで」実行することは、ビュー合成参照ブロックが、ビュー合成ブロックが必要になるまで生成されないことを意味する。従って、（参照ピクチャとしての）ビュー合成予測ピクチャは存在せず、例えば、予め生成されることも参照ピクチャリスト中に含まれることもない。

[0039]しかしながら、動き補償を実行するための特定のハードウェアは、入力として１つの参照フレームと１つの動きベクトルとを使用するレガシー（例えば、成熟した）動き補償モジュールを有し得る。従って、現在流通している少なくとも幾つかのＨ．２６４／ＡＶＣ動き補償モジュールは、初期入力として予め生成されたビュー合成ピクチャがないので、オンザフライのビュー合成予測用に使用され得ない。

[0040]レガシーハードウェアを補償するために、上記で説明されたようにビュー合成をオンザフライで実行するのではなく、ビデオコーダが、常にビュー合成ピクチャを生成し得る。即ち、ビデオコーダは、一連のピクチャに対するビュー合成ピクチャを生成し、参照ピクチャリスト中の参照ピクチャインデックス値をビュー合成ピクチャに割り当てることができる。しかしながら、ビュー合成予測ピクチャが常に生成される場合、ブロックベース（「オンザフライ」）のビュー合成予測を活用することはできず、そのことが、計算効率及びメモリ効率に影響を与えることがある。典型的な場合、そのような信号伝達プロセスは、コード化効率の低下をもたらすことがある。加えて、参照インデックス信号伝達ベースの機構は、ビュー合成ピクチャを参照ピクチャリストの所望の位置に置くために、明確な参照ピクチャリスト修正コマンドを必要とすることがあり、このことが、計算効率に更に影響を与えることがある。

[0041]本開示は、例えば、Ｈ．２６４／ＡＶＣの３ＤＶ拡張の従来のコード化技法に関して生じ得る幾つかの問題を認識する。例えば、ビュー合成予測に対して上記で説明された参照インデックスベースの信号伝達機構を切ることはできない。例えば、３Ｄ−ＡＴＭ拡張の下位互換性の目標を途絶することなく、３Ｄ−ＡＴＭの現在の参照インデックスベースの信号伝達機構を切ることはできない。

[0042]従って、ブロックベースのビュー合成予測をサポートする新しいハードウェアモジュールが、ビデオコーダ用に必要となり得る。加えて、一連のピクチャが、関連するビュー合成ピクチャを有する（ｓｅｑ＿ｖｉｅｗ＿ｓｙｎｔｈｅｓｉｓ＿ｆｌａｇが１に等しい）とき、ビュー合成ピクチャが生成され、予測のために使用される場合に割り当てられるために参照インデックス値が利用可能であるように、ビデオコーダは、ビュー合成ピクチャ用に追加の参照インデックス値を生成しなければならない。従って、ビデオコーダは、ビュー合成ピクチャがコード化の間に実際には生成されないときでさえ、追加の参照インデックス値を生成し、計算効率及び／又はコード化効率に影響を与える。

[0043]本開示の態様によれば、ＶＳＰピクチャの参照インデックスは、スライスヘッダ内に明確に示されず、又は参照ピクチャリスト構築中に追加されない。代わりに、１つ又は複数のシンタックス要素（例えば、フラグ）が、ビュー間参照ピクチャに対応する各参照インデックスに対するＭＢ又はＭＢ区分のレベルにおいて信号伝達され得る。このフラグは、ＶＳＰが、その参照インデックスに対するＭＢ又はＭＢ区分に対して適用されるかどうかを示し得る。言い換えれば、例えば、フラグは、予測のためにビュー間参照ピクチャを使用するかどうか、又は予測のために（例えば、ビュー間参照ピクチャから生成された）ＶＳＰピクチャを使用するかどうかを示し得る。

[0044]上記で説明されたフラグは、３Ｄ−ＡＴＭの伝統的なｖｓｐ＿ｆｌａｇとは異なる。例えば、上記で説明されたフラグは、３Ｄ−ＡＴＭのｖｓｐ＿ｆｌａｇを置き換え得る。本開示の態様によれば、上記で説明された方法で参照インデックスを信号伝達することによって、様々な参照インデックスがＶＳＰ用に使用され得る。即ち、スライスヘッダ内で信号伝達される特定のＶＳＰ参照インデックスにＶＳＰが縛られるのではなく、例えば、任意のビュー間参照インデックスが、ＶＳＰ用に使用され得る。

[0045]一例では、本開示の態様によれば、現在コード化されているブロックに対する参照インデックスがビュー間参照ピクチャに対応するときだけ、ＶＳＰフラグが存在する。別の例では、ＶＳＰフラグは、任意のインター予測されるモードに対して存在し得る。別の例では、追加又は代替として、フラグは、ＲｅｆＰｌｉｃＬｉｓｔ０に対応する参照インデックスに対してのみ存在し得る。別の例では、追加又は代替として、ＶＳＰフラグは、ＲｅｆＰｌｉｃＬｉｓｔ０とＲｅｆＰｉｃＬｉｓｔ１（存在する場合）の両方に対応する参照インデックスに対して存在し得る。

[0046]図１は、ビュー合成に対する本開示の技法を利用し得る例示的なビデオ符号化及び復号システム１０を示すブロック図である。図１に示すように、システム１０は、宛先機器１４によって後で復号されるべき符号化されたビデオデータを与える発信源機器１２を含む。特に、発信源機器１２は、コンピュータ可読媒体１６を介してビデオデータを宛先機器１４に与える。発信源機器１２及び宛先機器１４は、デスクトップコンピュータ、ノートブック（即ち、ラップトップ）コンピュータ、タブレットコンピュータ、セットトップボックス、所謂「スマート」フォンなどの電話ハンドセット、所謂「スマート」パッド、テレビジョン、カメラ、表示装置、デジタルメディアプレーヤ、ビデオゲームコンソール、ビデオストリーミング機器などを含む、広範囲にわたる機器のいずれかを備え得る。場合によっては、発信源機器１２及び宛先機器１４は、ワイヤレス通信のために装備され得る。

[0047]宛先機器１４は、コンピュータ可読媒体１６を介して、復号されるべき符号化されたビデオデータを受信することができる。コンピュータ可読媒体１６は、符号化されたビデオデータを発信源機器１２から宛先機器１４に移動することが可能な任意のタイプの媒体又は機器を備え得る。一例では、コンピュータ可読媒体１６は、発信源機器１２が、符号化されたビデオデータをリアルタイムで宛先機器１４に直接送信することを可能にするための通信媒体を備え得る。

[0048]符号化されたビデオデータは、ワイヤレス通信プロトコルなどの通信規格に従って変調され、宛先機器１４に送信され得る。通信媒体は、高周波（ＲＦ）スペクトル若しくは１つ又は複数の物理伝送線路など、任意のワイヤレス又は有線通信媒体を備え得る。通信媒体は、ローカルエリアネットワーク、ワイドエリアネットワーク、又はインターネットなどのグローバルネットワークのような、パケットベースネットワークの一部を形成し得る。通信媒体は、発信源機器１２から宛先機器１４への通信を支援するために有用であり得るルータ、スイッチ、基地局、又は任意の他の機器を含み得る。

[0049]幾つかの例では、符号化されたデータは、出力インターフェース２２から記憶装置に出力され得る。同様に、符号化されたデータは、入力インターフェースによって記憶装置からアクセスされ得る。記憶装置は、ハードドライブ、ブルーレイ（登録商標）ディスク、ＤＶＤ、ＣＤ−ＲＯＭ、フラッシュメモリ、揮発性又は不揮発性のメモリ、あるいは符号化されたビデオデータを記憶するための任意の他の好適なデジタル記憶媒体のような、様々な分散された又はローカルにアクセスされるデータ記憶媒体のいずれかを含み得る。更なる一例では、記憶装置は、発信源機器１２によって生成された符号化されたビデオを記憶し得る、ファイルサーバ又は別の中間記憶装置に対応し得る。

[0050]宛先機器１４は、ストリーミング又はダウンロードを介して、記憶装置から記憶されたビデオデータにアクセスし得る。ファイルサーバは、符号化されたビデオデータを記憶し、その符号化されたビデオデータを宛先機器１４に送信することができる任意のタイプのサーバであり得る。例示的なファイルサーバとしては、（例えば、ウェブサイト用の）ウェブサーバ、ＦＴＰサーバ、ネットワーク接続ストレージ（ＮＡＳ）機器、又はローカルディスクドライブがある。宛先機器１４は、インターネット接続を含む、任意の標準的なデータ接続を通じて符号化されたビデオデータにアクセスし得る。これは、ファイルサーバに記憶された符号化されたビデオデータにアクセスするのに適しているワイヤレスチャネル（例えば、Ｗｉ−Ｆｉ（登録商標）接続）、ワイヤード接続（例えば、ＤＳＬ、ケーブルモデムなど）、又は両方の組合せを含み得る。記憶装置からの符号化されたビデオデータの送信は、ストリーミング送信、ダウンロード送信、又はそれらの組合せであり得る。

[0051]本開示の技法は、必ずしもワイヤレスの用途又は設定に限定されるとは限らない。本技法は、無線テレビジョン放送、ケーブルテレビジョン送信、衛星テレビジョン送信、ｄｙｎａｍｉｃａｄａｐｔｉｖｅｓｔｒｅａｍｉｎｇｏｖｅｒＨＴＴＰ（ＤＡＳＨ）などのインターネットストリーミングビデオ送信、データ記憶媒体上に符号化されたデジタルビデオ、データ記憶媒体に記憶されたデジタルビデオの復号、又は他の用途のような、種々のマルチメディア用途のいずれかをサポートするビデオコード化に適用され得る。幾つかの例では、システム１０は、ビデオストリーミング、ビデオ再生、ビデオブロードキャスティング、及び／又はビデオ電話などの用途をサポートするために、一方向又は双方向のビデオ送信をサポートするように構成され得る。

[0052]図１の例では、発信源機器１２は、ビデオ発信源１８と、ビデオエンコーダ２０と、出力インターフェース２２とを含む。宛先機器１４は、入力インターフェース２８と、ビデオデコーダ３０と、表示装置３２とを含む。本開示によれば、発信源機器１２のビデオエンコーダ２０は、マルチビューコード化における動きベクトル予測のための技法を適用するように構成され得る。他の例では、発信源機器及び宛先機器は、他のコンポーネント又は構成を含み得る。例えば、発信源機器１２は、外部カメラなどの外部ビデオ発信源１８からビデオデータを受信し得る。同様に、宛先機器１４は、一体型表示装置を含むのではなく、外部表示装置とインターフェースをとり得る。

[0053]図１の図示のシステム１０は一例にすぎない。ビュー合成のための技法は、任意のデジタルビデオ符号化及び／又は復号機器によって実施され得る。概して、本開示の技法はビデオ符号化機器によって実行されるが、本技法は、一般に「コーデック」と呼ばれるビデオエンコーダ／デコーダによっても実行され得る。その上、本開示の技法は、ビデオプリプロセッサによっても実行され得る。発信源機器１２及び宛先機器１４は、発信源機器１２が、宛先機器１４に送信するためのコード化されたビデオデータを生成するような、コード化機器の例にすぎない。幾つかの例では、機器１２、１４の各々がビデオ符号化コンポーネントとビデオ復号コンポーネントとを含むように、機器１２、１４は、実質的に対称的な方式で動作することができる。従って、システム１０は、例えば、ビデオストリーミング、ビデオ再生、ビデオブロードキャスティング、又はビデオ電話のために、ビデオ機器１２とビデオ機器１４との間の一方向又は双方向のビデオ送信をサポートし得る。

[0054]発信源機器１２のビデオ発信源１８は、ビデオカメラなどのビデオ撮影機器、以前に撮影されたビデオを含んでいるビデオアーカイブ、及び／又はビデオコンテンツプロバイダからビデオを受信するためのビデオフィードインターフェースを含み得る。更なる代替として、ビデオ発信源１８は、発信源ビデオとしてのコンピュータグラフィックスベースのデータ、又はライブビデオとアーカイブされたビデオとコンピュータにより生成されたビデオとの組合せを生成し得る。場合によっては、ビデオ発信源１８がビデオカメラである場合、発信源機器１２及び宛先機器１４は、所謂カメラフォン又はビデオフォンを形成し得る。しかしながら、上で言及されたように、本開示で説明される技法は、一般にビデオコード化に適用可能であり、ワイヤレス及び／又は有線の用途に適用され得る。各々の場合において、撮影されたビデオ、以前に撮影されたビデオ、又はコンピュータにより生成されたビデオは、ビデオエンコーダ２０によって符号化され得る。次いで、符号化されたビデオ情報は、出力インターフェース２２によってコンピュータ可読媒体１６に出力され得る。

[0055]コンピュータ可読媒体１６は、ワイヤレスブロードキャスト又はワイヤードネットワーク送信などの一時媒体、若しくは、ハードディスク、フラッシュドライブ、コンパクトディスク、デジタルビデオディスク、ブルーレイディスク、又は他のコンピュータ可読媒体などの記憶媒体（即ち、非一時的記憶媒体）を含み得る。幾つかの例では、ネットワークサーバ（図示せず）は、例えば、ネットワーク送信を介して、発信源機器１２から符号化されたビデオデータを受信し、宛先機器１４に符号化されたビデオデータを与え得る。同様に、ディスクスタンピング設備など、媒体製造設備のコンピュータ機器は、発信源機器１２から符号化されたビデオデータを受信し、その符号化されたビデオデータを含んでいるディスクを生成し得る。従って、コンピュータ可読媒体１６は、様々な例において、様々な形態の１つ又は複数のコンピュータ可読媒体を含むことが理解されよう。

[0056]宛先機器１４の入力インターフェース２８は、コンピュータ可読媒体１６から情報を受信する。コンピュータ可読媒体１６の情報は、ビデオエンコーダ２０によって定義され、またビデオデコーダ３０によって使用される、ブロック及び他のコード化された単位、例えば、ＧＯＰの特性及び／又は処理を記述するシンタックス要素を含む、シンタックス情報を含み得る。表示装置３２は、復号されたビデオデータをユーザに対して表示し、陰極線管（ＣＲＴ）、液晶表示器（ＬＣＤ）、プラズマ表示器、有機発光ダイオード（ＯＬＥＤ）表示器、又は別のタイプの表示装置のような、様々な表示装置のいずれかを備え得る。

[0057]ビデオエンコーダ２０及びビデオデコーダ３０は各々、適用可能なとき、１つ又は複数のマイクロプロセッサ、デジタル信号プロセッサ（ＤＳＰ）、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、離散論理回路、ソフトウェア、ハードウェア、ファームウェア、又はそれらの任意の組合せなどの、様々な好適なエンコーダ又はデコーダ回路のいずれかとして実装され得る。ビデオエンコーダ２０及びビデオデコーダ３０の各々は１つ又は複数のエンコーダ又はデコーダに含まれてよく、そのいずれもが複合ビデオエンコーダ／デコーダ（コーデック）の一部として統合されてよい。ビデオエンコーダ２０及び／又はビデオデコーダ３０を含む機器は、集積回路、マイクロプロセッサ、及び／又は携帯電話のようなワイヤレス通信機器を備え得る。

[0058]図１には示されていないが、幾つかの態様では、ビデオエンコーダ２０及びビデオデコーダ３０は、それぞれオーディオエンコーダ及びデコーダと統合され得、適切なＭＵＸ−ＤＥＭＵＸユニット、又は他のハードウェア及びソフトウェアを含んで、共通のデータストリーム又は別個のデータストリーム中のオーディオとビデオの両方の符号化を処理し得る。適用可能な場合、ＭＵＸ−ＤＥＭＵＸユニットはＩＴＵＨ．２２３マルチプレクサプロトコル、又はユーザデータグラムプロトコル（ＵＤＰ）などの他のプロトコルに準拠することができる。

[0059]本開示では全般に、ビデオエンコーダ２０が、ある情報をビデオデコーダ３０などの別の機器に「信号伝達（signaling）」することに言及することがある。しかしながら、ビデオエンコーダ２０はあるシンタックス要素をビデオデータの様々な符号化された部分と関連付けることによって情報を信号伝達し得ることを理解されたい。即ち、ビデオエンコーダ２０は、ビデオデータの様々な符号化された部分のヘッダに、あるシンタックス要素を格納することによって、データを「信号伝達」することができる。幾つかの場合には、そのようなシンタックス要素は、ビデオデコーダ３０によって受信及び復号される前に、符号化及び記憶され（例えば、記憶装置２４に記憶され）得る。従って、「信号伝達（signaling）」という用語は、通信がリアルタイム又はほぼリアルタイムで行われるか、若しくは、符号化時にシンタックス要素を媒体に記憶し、次いで、この媒体に記憶された後の任意の時間にそのシンタックス要素が復号機器によって取り出され得るときなどに行われ得る、ある時間期間にわたって行われるかどうかにかかわらず、概して、圧縮ビデオデータを復号するためのシンタックス又は他のデータの通信を指し得る。

[0060]ビデオエンコーダ２０及びビデオデコーダ３０は、様々なビデオコード化規格に従って動作し得る。例えば、ビデオエンコーダ２０及びビデオデコーダ３０は、ＪｏｉｎｔＶｉｄｅｏＴｅａｍ（ＪＶＴ）として知られる共同パートナーシップの成果としてＩＳＯ／ＩＥＣＭｏｖｉｎｇＰｉｃｔｕｒｅＥｘｐｅｒｔｓＧｒｏｕｐ（ＭＰＥＧ）とともにＩＴＵ−ＴＶｉｄｅｏＣｏｄｉｎｇＥｘｐｅｒｔｓＧｒｏｕｐ（ＶＣＥＧ）によって策定された、ＩＴＵ−ＴＨ．２６４／ＭＰＥＧ−４（ＡＶＣ）規格に従って動作し得る。幾つかの態様では、本開示で説明する技法は、Ｈ．２６４規格に概して準拠する機器に適用され得る。Ｈ．２６４規格は、ＩＴＵ−Ｔ研究グループによる２００５年３月付けのＩＴＵ−Ｔ勧告Ｈ．２６４「ＡｄｖａｎｃｅｄＶｉｄｅｏＣｏｄｉｎｇｆｏｒｇｅｎｅｒｉｃａｕｄｉｏｖｉｓｕａｌｓｅｒｖｉｃｅｓ」に記載されており、本明細書ではＨ．２６４規格又はＨ．２６４仕様、若しくはＨ．２６４／ＡＶＣ規格又は仕様と呼ぶ。

[0061]ＪｏｉｎｔＶｉｄｅｏＴｅａｍ（ＪＶＴ）は、Ｈ．２６４／ＭＰＥＧ−４ＡＶＣに対する拡張に取り組み続けている。詳細には、１つの可能性のある規格は、ビデオデータの各ビューに対してテクスチャと深度の両方をコード化することを提供するＨ．２６４／ＡＶＣベースの３Ｄビデオコード化規格である。３ＤＶＷＤ４に対する主たるコード化ツールは、上記の文書ＪＣＴ３Ｖ−Ｂ１００２に記載されている。加えて、最新の参照ソフトウェアは、本明細書では、上記のＡＴＭ又は３Ｄ−ＡＴＭと呼ばれることがある。

[0062]但し、本開示の技法は、いかなる特定のコード化規格にも限定されない。ビデオコード化規格の他の例には、ＭＰＥＧ−２、ＩＴＵ−ＴＨ．２６３、及び高効率ビデオコード化（ＨＥＶＣ）規格がある。例えば、場合によっては、ビデオエンコーダ２０及びビデオデコーダ３０は、マルチビュービデオコード化（ＭＶＣ）を実行し、ＨＥＶＣのマルチビュー拡張、所謂ＭＶ−ＨＥＶＣ、又は深度を強化されたＨＥＶＣベースのフル３ＤＶコーデック、３Ｄ−ＨＥＶＣを実装することができる。

[0063]Ｈ．２６４／ＡＶＣでは、インター予測されたマクロブロック（ＭＢ）の各々は、１つの１６×１６ＭＢ区分と、２つの１６×８ＭＢ区分と、２つの８×１６ＭＢ区分と、４つの８×８ＭＢ区分とを含む、４つの異なる可能な方法のうちの１つに区分され得る。１つのＭＢ中の異なるＭＢ区分は、方向（ＲｅｆＰｉｃＬｉｓｔ０又はＲｅｆＰｉｃＬｉｓｔ１）ごとに異なる参照インデックス値を有し得る。ＭＢが４つの８×８ＭＢ区分に区分されないとき、ＭＢはＭＢ区分全体について各方向に１つの動きベクトルしか有し得ない。ＭＢが、４つの８×８ＭＢ区分に区分されるとき、各８×８ＭＢ区分はサブブロックに更に区分され得、その各々が各方向に異なる動きベクトルを有し得る。８×８ＭＢ区分を、１つの８×８サブブロックと、２つの８×４サブブロックと、２つの４×８サブブロックと、４つの４×４サブブロックとを含むサブブロックに区分する４つの方法が存在し得る。各サブブロックは、各方向に異なる動きベクトルを有し得る。

[0064]一般に、Ｈ．２６４／ＡＶＣ及びＨＥＶＣの動き補償ループは同じである。例えば、

上の式では、Ｐは、Ｐフレームのための単予測的インター予測又はＢフレームのための双予測的インター予測を示す。

[0065]しかしながら、ＨＥＶＣにおける動き補償の単位は、以前のビデオコード化規格における単位とは異なる。例えば、以前のビデオコード化規格におけるマクロブロックの概念は、ＨＥＶＣでは存在しない。むしろ、マクロブロックは、一般的な４分木方式に基づく柔軟な階層構造によって置き換えられる。この方式の中で、３つのタイプのブロック、即ちコード化単位（ＣＵ）、予測単位（ＰＵ）、及び変換単位（ＴＵ）が定義される。ＣＵは領域分割の基本単位である。ＣＵの概念はマクロブロックの概念に類似するが、ＣＵは最大サイズに制限されず、コンテンツを適応的に向上させるために４つの等しいサイズのＣＵへの再帰的分割を可能にする。ＰＵはインター／イントラ予測の基本単位である。幾つかの例では、ＰＵは、不規則な画像パターンを効果的にコード化するために、単一のＰＵの中に複数の任意の形状の区分を含み得る。ＴＵは変換の基本単位である。ＣＵのＴＵは、ＣＵのＰＵとは独立に定義され得る。しかしながら、ＴＵのサイズは、ＴＵが属するＣＵに限定される。３つの異なる概念へのブロック構造のこの分離は、各々がその役割に従って最適化されることを可能にでき、このことはコード化効率の改善をもたらし得る。

[0066]いずれの場合にも、ビデオコード化仕様では、ビデオシーケンスは通常、一連のピクチャを含む。ピクチャは「フレーム」と呼ばれることもある。ピクチャは、Ｓ_L、Ｓ_Cb、及びＳ_Crと示される３つのサンプルアレイを含み得る。Ｓ_Lは、ルーマサンプルの２次元アレイ（即ち、ブロック）である。Ｓ_Cbは、Ｃｂクロミナンスサンプルの２次元アレイである。Ｓ_Crは、Ｃｒクロミナンスサンプルの２次元アレイである。クロミナンスサンプルは、本明細書では「クロマ」サンプルとも呼ばれることもある。他の例では、ピクチャは、モノクロームであってよく、ルーマサンプルのアレイのみを含み得る。

[0067]場合によっては、ピクチャは、各スライスが幾つかのマクロブロック又はコード化ツリー単位（ＨＥＶＣに関するＣＴＵ）を含む幾つかのスライスに分割され得る。スライスは、ラスター走査順序で連続的に順序付けられた整数個のマクロブロック又はＣＴＵを含み得る。コード化されたスライスは、スライスヘッダとスライスデータとを備え得る。スライスのスライスヘッダは、スライスについての情報を提供するシンタックス要素を含むシンタックス構造であり得る。

[0068]本開示は、サンプルの１つ又は複数のブロックのサンプルをコード化するために使用される１つ又は複数のサンプルブロックとシンタックス構造とを指すために、「ビデオ単位」又は「ビデオブロック」又は「ブロック」という用語を使用し得る。例示的なタイプのビデオ単位又はブロックは、マクロブロック、マクロブロック区分、ＣＴＵ、ＣＵ、ＰＵ、変換ユニット（ＴＵ）、などを含み得る。ビデオデータのブロックは、一般に、スライスレベル、ピクチャレベル、又はシーケンスレベルなどのより高いレベルに対して、「ブロックレベル」にあると言われることがある。

[0069]ビデオエンコーダ２０は、予測ブロックを生成するためにイントラ予測又はインター予測を使用し得る。ビデオエンコーダ２０が予測ブロックを生成するためにイントラ予測を使用する場合、ビデオエンコーダ２０は、コード化されるブロックと関連付けられたピクチャのサンプルに基づいて予測ブロックを生成し得る。本開示では、「に基づいて」という句は、「に少なくとも部分的に基づいて」を示し得る。

[0070]ビデオエンコーダ２０が予測ブロックを生成するためにインター予測を使用する場合、ビデオエンコーダ２０は、現在コード化されているピクチャ以外の１つ又は複数のピクチャの復号されたサンプルに基づいて、予測ブロックを生成し得る。ブロックの予測ブロックを生成するためにインター予測が使用されるとき、本開示は、ブロックを「インターコード化される」又は「インター予測される」ものとして呼ぶことがある。インター予測は、単予測的（即ち、単予測）又は双予測的（即ち、双予測）であり得る。単予測又は双予測を実行するために、ビデオエンコーダ２０は、現在のピクチャに対して、第１の参照ピクチャリスト（ＲｅｆＰｉｃＬｉｓｔ０）と第２の参照ピクチャリスト（ＲｅｆＰｉｃＬｉｓｔ１）とを生成し得る。参照ピクチャリストの各々は、１つ又は複数の参照ピクチャを含み得る。参照ピクチャリストが構築された後（即ち、利用可能であれば、ＲｅｆＰｉｃＬｉｓｔ０及びＲｅｆＰｉｃＬｉｓｔ１）、参照ピクチャリストに対する参照インデックスは、参照ピクチャリストに含まれる任意の参照ピクチャを識別するために使用され得る。

[0071]単予測を使用するとき、ビデオエンコーダ２０は、参照ピクチャ内の参照位置を決定するために、ＲｅｆＰｉｃＬｉｓｔ０とＲｅｆＰｉｃＬｉｓｔ１のいずれか又は両方の中の参照ピクチャを探索することができる。更に、単予測を使用するとき、ビデオエンコーダ２０は、参照位置に対応するサンプルに少なくとも部分的に基づいて、予測ブロックを生成することができる。その上、単予測を使用するとき、ビデオエンコーダ２０は、予測ブロックと参照位置との間の空間的変位を示す単一の動きベクトルを生成することができる。この動きベクトルは、予測ブロックと参照位置との間の水平方向の変位を規定する水平成分を含んでよく、予測ブロックと参照位置との間の垂直方向の変位を規定する垂直成分を含んでよい。

[0072]双予測を使用してブロックを符号化するとき、ビデオエンコーダ２０は、ＲｅｆＰｉｃＬｉｓｔ０中の参照ピクチャ中の第１の参照位置と、ＲｅｆＰｉｃＬｉｓｔ１中の参照ピクチャ中の第２の参照位置とを決定することができる。ビデオエンコーダ２０は、第１の参照位置及び第２の参照位置に対応するサンプルに少なくとも部分的に基づいて、予測ブロックを生成することができる。その上、双予測を使用するとき、ビデオエンコーダ２０は、予測ブロックと第１の参照位置との間の空間的変位を示す第１の動きベクトルと、予測ブロックと第２の参照位置との間の空間的変位を示す第２の動きベクトルとを生成することができる。

[0073]イントラ予測コード化又はインター予測コード化に続いて、ビデオエンコーダ２０は、現在コード化されているブロックに対する残差データを計算し得る。残差データは、符号化されていないピクチャの画素と予測ブロックの画素との間の画素差分に対応し得る。ビデオエンコーダ２０は、次いで、残差データを変換し得る。例えば、ビデオエンコーダ２０は、例えば、離散コサイン変換（ＤＣＴ）、整数変換、ウェーブレット変換、又は概念的に類似の変換を適用することによって、ビデオデータを空間領域から変換領域に変換し得る。

[0074]変換係数を生成するための任意の変換の後、ビデオエンコーダ２０は、変換係数の量子化を実行し得る。量子化は、概して、係数を表すために使用されるデータの量をできるだけ低減するために変換係数が量子化され、更なる圧縮を行うプロセスを指す。量子化プロセスは、係数の一部又は全部に関連するビット深度を低減し得る。例えば、量子化中にｎビット値がｍビット値に切り捨てられてよく、但し、ｎはｍよりも大きい。

[0075]量子化の後に、ビデオエンコーダ２０は、変換係数を走査して、量子化変換係数を含む２次元行列から１次元ベクトルを生成し得る。走査は、より高いエネルギー（従ってより低い周波数）の係数をアレイの前方に配置し、より低いエネルギー（従ってより高い周波数）の係数をアレイの後方に配置するように設計され得る。幾つかの例では、ビデオエンコーダ２０は、エントロピー符号化され得るシリアル化ベクトルを生成するために、量子化変換係数を走査するために予め定義された走査順序を利用し得る。他の例では、ビデオエンコーダ２０は適応走査を実施し得る。

[0076]量子化された変換係数を走査して１次元ベクトルを形成した後に、ビデオエンコーダ２０は、例えば、コンテキスト適応可変長コード化（ＣＡＶＬＣ）、コンテキスト適応バイナリ算術コード化（ＣＡＢＡＣ）、シンタックスベースコンテキスト適応バイナリ算術コード化（ＳＢＡＣ）、確率間隔区分エントロピー（ＰＩＰＥ）コード化、又は別のエントロピー符号化方法に従って、１次元ベクトルをエントロピー符号化し得る。ビデオエンコーダ２０はまた、ビデオデータを復号する際にビデオデコーダ３０が使用するための符号化されたビデオデータに関連するシンタックス要素をエントロピー符号化し得る。

[0077]ビデオエンコーダ２０は、ブロックベースのシンタックスデータ、ピクチャベースのシンタックスデータ、及びＧＯＰベースのシンタックスデータなどのシンタックスデータを、例えば、ピクチャヘッダ、ブロックヘッダ、スライスヘッダ、又はＧＯＰヘッダ中でビデオデコーダ３０に更に送り得る。ＧＯＰシンタックスデータは、それぞれのＧＯＰ中の幾つかのピクチャを記述することができ、ピクチャシンタックスデータは、対応するピクチャを符号化するために使用される符号化／予測モードを示すことができる。

[0078]ビデオエンコーダ２０は、ビデオデータの表現（即ち、コード化されたピクチャ及び関連付けられたデータ）を形成するビットのシーケンスを含むビットストリームを出力することができる。ビットストリームは、一連のネットワーク抽象化レイヤ（ＮＡＬ）ユニットを備え得る。ＮＡＬ単位は、ＮＡＬ単位中のデータのタイプの指示と、必要に応じてエミュレーション防止ビットが散在させられているローバイトシーケンスペイロード（ＲＢＳＰ）の形態でそのデータを含むバイトとを含む、シンタックス構造である。ＮＡＬ単位の各々は、ＮＡＬ単位ヘッダを含み、ＲＢＳＰをカプセル化する。ＮＡＬ単位ヘッダは、ＮＡＬ単位タイプコードを示すシンタックス要素を含み得る。ＮＡＬ単位のＮＡＬ単位ヘッダによって規定されるＮＡＬ単位タイプコードは、ＮＡＬ単位のタイプを示す。ＲＢＳＰは、ＮＡＬ単位内にカプセル化された整数個のバイトを含むシンタックス構造であり得る。幾つかの例では、ＲＢＳＰは０ビットを含む。

[0079]異なるタイプのＮＡＬ単位は、異なるタイプのＲＢＳＰをカプセル化し得る。例えば、異なるタイプのＮＡＬ単位は、シーケンスパラメータセット（ＳＰＳ）、ピクチャパラメータセット（ＰＰＳ）、コード化されたスライス、補足拡張情報（supplemental enhancement information）（ＳＥＩ）メッセージなどのための様々なＲＢＳＰをカプセル化し得る。（パラメータセット及びＳＥＩメッセージのためのＲＢＳＰではなく）ビデオコード化データのためのＲＢＳＰをカプセル化するＮＡＬ単位は、ビデオコード化レイヤ（ＶＣＬ）ＮＡＬ単位と呼ばれ得る。

[0080]ビデオデコーダ３０は、ビデオエンコーダ２０によって生成されたビットストリームを受信することができる。加えて、ビデオデコーダ３０は、ビットストリームを解析して、ビットストリームからシンタックス要素を取得することができる。ビデオデコーダ３０は、ビットストリームから取得されたシンタックス要素に少なくとも部分的に基づいて、ビデオデータのピクチャを再構築することができる。ビデオデータを再構築するための処理は、全般に、ビデオエンコーダ２０によって実行される処理の逆であり得る。

[0081]例えば、ビデオデコーダ３０は、現在復号されているブロック（現在のブロック）に対する予測ブロックを決定するために動きベクトルを使用し得る。加えて、ビデオデコーダ３０は、現在のブロックの変換係数を逆量子化することができる。ビデオデコーダ３０は、逆変換を係数に適用し、現在のブロックに対する残差データを決定することができる。ビデオデコーダ３０は、予測ブロックのサンプルを対応する残差サンプルに追加することによって現在のブロックを再構築し得る。ピクチャに対するブロックの各々を再構築することによって、ビデオデコーダ３０はピクチャを再構築し得る。

[0082]概して、ビュー合成予測を実行するために、ビデオエンコーダ２０又はビデオデコーダ３０などのビデオコーダは、合成ビューコンポーネントを生成するために１つ又は複数のビューのテクスチャ及び深度情報を使用し得る。例えば、ＶＳＰは、ビデオデータを予測するために、追加の合成された参照フレームを生成することを指すことができる。フレームの仮想バージョンが、以前に符号化された他のカメラのフレームから符号化されるように合成され、仮想フレームを予測参照として使用することができる。

[0083]このプロセスは、表示のためにテクスチャ及び深度情報を使用して合成ビューコンポーネントを生成するためのプロセスと実質的に同様である。しかしながら、ビュー合成予測では、合成ビューコンポーネント（即ち、ピクチャ）は、異なるビューをコード化するときに参照ピクチャとして使用するために参照ピクチャリストに追加され得る。ビュー合成予測は、テクスチャ情報又は深度情報をコード化するために参照ピクチャを生成するために使用され得る。もちろん、生成されたビュー合成ピクチャはまた、再生の一部としてクライアント機器によって表示され得る。追加又は代替として、ビデオデコーダ３０、又は後処理ユニット（図示せず）など、宛先機器１４の別のユニットは、再生のための合成ピクチャを生成するためにビュー合成を実行し得る。予測のために使用されるビュー合成ピクチャが表示され得るが、幾つかの例では、別個のピクチャは、表示のためにＤＩＢＲを使用して生成され得ることを理解されたい。予測のためのビュー合成画像は、コード化又は「ループ内」中に生成され得、一方、表示のためのビュー合成画像は、「ループ内」又は「ループ後」で、即ちコード化に続いて生成され得る。

[0084]追加の参照画像を生成するために、３Ｄワーピングプロセス又はビュー補間プロセスが使用され得る。例えば、３Ｄワーピングプロセスは、深度情報とカメラパラメータとを使用して投影を実行することを含み得る。ビュー補間プロセスは、隣接するビューポイント画像間の視差情報を利用することを含み得る。一般に、ＶＳＰに対して、２つのタイプの画像ワーピング技法、即ち、現在ビューの深度マップの利用可能性に応じて前方ワーピングと後方ワーピングとが存在する。前方ワーピングは、参照ビューポイントからの深度マップが利用可能であるときに合成ビューを生成する。この例では、参照ビューポイントからの深度マップは、現在ビューのテクスチャ成分を符号化／復号する前に符号化／復号される。同様の派生物が、合成されるべきビューの深度を使用して後方ワーピングに対して取得され得る。

[0085]ループ内ＶＳＰは、強化されたテクスチャコード化（上記のＷＤ４）に対する現在のＨ．２６４／ＡＶＣベースの３Ｄビデオコード化規格中でサポートされる。現在ビューのコード化のためにＶＳＰを使用可能にするために、同じアクセス単位の以前にコード化されたテクスチャ及び深度のビューコンポーネントがビュー合成のために使用され得る。ＶＳＰから生じる合成ピクチャは、時間的参照フレーム及びビュー間参照フレームに続く初期参照ピクチャリスト（例えば、ＲｅｆＰｉｃＬｉｓｔ０及び／又はＲｅｆＰｉｃＬｉｓｔ１）中に含まれる。

[0086]上記のように、文書「３Ｄ−ＣＥ１．ａ：ＧｅｎｅｒａｌｉｚｅｄＶｉｅｗＳｙｎｔｈｅｓｉｓＰｒｅｄｉｃｔｉｏｎ（ＧＶＳＰ）ｍｏｄｅ」、ＩＴＵ−ＴＳＧ１６ＷＰ３とＩＳＯ／ＩＥＣＪＴＣ１／ＳＣ２９／ＷＧ１１との３Ｄビデオコード化拡張開発についてのジョイントコラボレーションチーム、第２回会合：上海、ＣＮ、２０１２年１０月１３日〜１９日、ＪＣＴ３Ｖ−Ｂ００５４は、ブロックがスキップモードとしてコード化され、ビュー合成されたピクチャから予測されるかどうかを示すために、マクロブロック又はそれ以下の複数のレベルにおけるフラグを導入することを提案した。

[0087]シンタックス要素セットの一例は、以下の表１〜表３の中で説明される。編集の便宜上、フラグはｖｓｐ＿ｆｌａｇと名付けられる。マクロブロックレイヤシンタックスの一例が、以下の表１に示されている。

[0088]上記の表１の例では、１に等しいｖｓｐ＿ｍｂ＿ｆｌａｇは、ＭＢ全体がＶＳＰピクチャから予測されることを示す。０に等しいこのフラグは、ＭＢ全体が他のモードによって予測され得ることを示す。このフラグが１に等しいとき、ｍｂ＿ｔｙｐｅは信号伝達されない。存在しないとき、それは、０に等しいものと推測される。

[0089]マクロブロック予測シンタックスの一例が、以下の表２に示されている。

[0090]上記の表２の例では、１に等しいｍｂ＿ｐａｒｔ＿ｖｓｐ＿ｆｌａｇ［ｍｂＰａｒｔＩｄｘ］は、現在のＭＢ区分がＶＳＰピクチャから予測されることを示す。０に等しいこのフラグは、ＭＢ区分全体がＶＳＰピクチャから予測されないことを示す。このフラグが存在しないとき、このフラグは、０に等しいものと推測される。

[0091]幾つかの例では、ＭＢ区分の数が４未満の場合、ｎｏＳｕｂＭｂＰａｒｔＳｉｚｅＬｅｓｓＴｈａｎ８×８Ｆｌａｇは、（Ｈ．２６４／ＡＶＣにおけるものと同じく）真である。ＭＢ区分の数が４に等しい場合、ｎｏＳｕｂＭｂＰａｒｔＳｉｚｅＬｅｓｓＴｈａｎ８×８Ｆｌａｇシンタックス要素が、次のように、０に等しいｍｂ＿ｐａｒｔ＿ｖｓｐ＿ｆｌａｇを用いて８×８ＭＢ区分を検査することによって導出され得る。

１．いずれかのＭＢ区分が、８×８よりも小さいサブＳｕｂ−ｍｂ区分を有する場合、ｎｏＳｕｂＭｂＰａｒｔＳｉｚｅＬｅｓｓＴｈａｎ８×８Ｆｌａｇは偽である。リターン。

２．ｎｏＳｕｂＭｂＰａｒｔＳｉｚｅＬｅｓｓＴｈａｎ８×８Ｆｌａｇは真である。

[0092]サブマクロブロック予測シンタックスの一例が、以下の表３に示されている。

[0093]上記の表３の例では、１に等しいｓｕｂ＿ｍｂ＿ｖｓｐ＿ｆｌａｇ［ｍｂＰａｒｔＩｄｘ］は、現在のＭＢ区分（８×８）がＶＳＰピクチャから予測されることを示す。０に等しいこのフラグは、ＭＢ区分全体がＶＳＰピクチャから予測されないことを示す。存在しないとき、このフラグは０に等しいものと推測される。

[0094]ビュー合成を簡単にするために、幾つかの例では、ビュー合成予測は、動きベクトル予測と一元化され得る。そのような例では、ビュー合成予測は、後方ワーピングのみを実行するように簡素化され、ホールフィリングなど、任意の追加のビュー合成技法を実行しないことがある。加えて、視差値又は深度値が、４×４ブロック全体に適用される。従って、動きベクトルが、深度又は視差から導出され、ＭＢの４×４ブロック、ＭＢ区分、又はｓｕｂ−ＭＢ区分の各々と関連付けられるように、ビュー合成予測を簡素化して伝統的動き補償技法を使用することが可能である。この簡素化されたビュー合成プロセスは、一元化ＶＳＰモードと呼ばれることがある。

[0095]上記のように、ビュー合成予測の信号伝達は、ＭＢレベルの信号伝達に関してＨ．２６４／ＡＶＣ設計に対して透明である伝統的な参照インデックスに基づくことができる。例えば、各ＭＢに対して、ビデオコーダは、参照ピクチャリスト中のビュー合成ピクチャを識別する参照インデックスに基づいて、ビュー合成を使用するかどうかを決定し、ビュー合成参照インデックスは、スライスヘッダ内で明示的に信号伝達され得る。この設計は、一方向がビュー合成ピクチャを用いて予測され、他方向が通常の時間的ピクチャ又はビュー間参照ピクチャから予測される、双方向予測をサポートし得る。この設計はまた、スライスレベルにおいて及びマクロブロックレベルにおいて適応されるべき複数のビュー合成ピクチャをサポートする。

[0096]３Ｄ−ＡＴＭの現在の参照インデックスベースの信号伝達機構を切ることはできない。例えば、３Ｄ−ＡＴＭ拡張の下位互換性の目標を途絶することなく、３Ｄ−ＡＴＭの現在の参照インデックスベースの信号伝達機構を切ることはできない。従って、ブロックベースのビュー合成予測をサポートする新しいハードウェアモジュールが、ビデオコーダ用に必要となり得る。加えて、一連のピクチャが、関連するビュー合成ピクチャを有する（ｓｅｑ＿ｖｉｅｗ＿ｓｙｎｔｈｅｓｉｓ＿ｆｌａｇが１に等しい）とき、ビュー合成ピクチャが生成され、予測のために使用される場合に割り当てられるために参照インデックス値が利用可能であるように、ビデオコーダは、ビュー合成ピクチャ用に追加の参照インデックス値を生成しなければならない。従って、ビデオコーダは、ビュー合成ピクチャがコード化の間に実際には生成されないときでさえ、追加の参照インデックス値を生成し、計算効率及び／又はコード化効率に影響を与える。

[0097]本開示の態様は、ビデオデータのブロックをコード化するときにビュー合成予測を適用するかどうかを示すための技法を含む。一例では、ビデオエンコーダ２０及び／又はビデオデコーダ３０などのビデオコーダは、現在のブロックに対する参照インデックスがビュー間参照ピクチャに対応するかどうかを決定することと、現在のブロックに対する参照インデックスがビュー間参照ピクチャに対応するときに、現在のブロックのＶＳＰモードを示すデータを決定することとを行い得、ここで、参照インデックスに対するＶＳＰモードは、現在のブロックがビュー間ピクチャから（例えば、ビュー間ピクチャから合成されたピクチャの少なくとも一部から）ビュー合成予測を使用して予測されるかどうかを示す。ビデオコーダがビデオデコーダ３０として構成される例では、ビデオデコーダ３０は、符号化されたビットストリームからデータを取得することによってＶＳＰモードを示すデータを決定し得る。

[0098]従って、上記の例では、ＶＳＰピクチャの参照インデックスは、スライスヘッダ内に明確に示されず、又は参照ピクチャリスト構築中に追加されない。代わりに、インター予測された参照ピクチャに対応する各参照インデックスに対してＭＢレベル又はＭＢ区分レベルにおいて１つ又は複数のシンタックス要素を、ビデオエンコーダ２０が符号化し得る（及び、そのような１つ又は複数のシンタックス要素を、ビデオデコーダ３０が符号化されたビットストリームから取得し復号し得る）。本明細書で説明されるように、インター予測参照ピクチャは、一般に、インター予測モードと関連付けられる。即ち、インター予測ピクチャは、ビュー内参照ピクチャ又はビュー間参照ピクチャを含み得る。

[0099]幾つかの例では、１つ又は複数のシンタックス要素は、ＶＳＰフラグであり得る。例えば、このフラグは、ＶＳＰが、特定の参照インデックスに対するＭＢ又はＭＢ区分に対して適用されるかどうかを示し得る。言い換えれば、例えば、フラグは、予測のためにビュー間参照ピクチャを使用するかどうか、又は予測のためにＶＳＰピクチャを使用するかどうかを示し得る。

[0100]一例では、本開示の態様によれば、ブロックを予測的にコード化するための参照インデックスが、ビュー間参照ピクチャに対応するときだけ、ビデオエンコーダ２０はＶＳＰフラグを符号化し得る。別の例では、ビデオエンコーダ２０は、任意のインター予測されるモードに対してＶＳＰフラグを符号化し得る。別の例では、追加又は代替として、ビデオエンコーダ２０は、ＲｅｆＰｌｉｃＬｉｓｔ０に対応する参照インデックスに対してのみ、フラグを符号化し得る。更に別の例では、ビデオエンコーダ２０は、ＲｅｆＰｌｉｃＬｉｓｔ０とＲｅｆＰｉｃＬｉｓｔ１（存在する場合）の両方に対応する参照インデックスに対して、フラグを符号化し得る。

[0101]本開示の他の態様によれば、ビュー合成予測が使用可能であるとき、参照ベースの信号伝達がＶＳＰに対して使用される（例えば、参照ピクチャインデックスがビュー合成参照ピクチャに対して生成され、ＶＳＰが参照インデックスに基づいて実行される）、例えば第１のＶＳＰモードかどうか、又はＧＶＳＰがＶＳＰに対して使用される（例えば、上記の表１〜表３に関して、上記で説明されたマクロブロック信号伝達に基づいてＶＳＰが実行される）、例えば第２のＶＳＰモードかどうかを示すＳＰＳ又はＳＰＳ拡張など、パラメータセット中の１つ又は複数のシンタックス要素を、ビデオエンコーダ２０が符号化し得る（及びそのような１つ又は複数のシンタックス要素を、ビデオデコーダ３０が符号化されたビットストリームから取得し得る）。幾つかの例では、１つ又は複数のシンタックス要素は、ＳＰＳ拡張中のフラグを含み得る。

[0102]本開示の他の態様によれば、参照インデックスベースの信号伝達が使用されないとき、参照ピクチャリスト修正（ＲＰＬＭ）プロセスは、ＶＳＰピクチャに対応するＲＰＬＭコマンドを含まない。例えば、参照ピクチャリスト構築は、下記のステップを含み得る：（１）ＡＶＣにおいて規定された時間的（ビュー間）参照ピクチャに対する参照ピクチャリスト初期化プロセスが適用される、（２）ビュー間及び／又は合成された参照ピクチャがリストの最後に添付される、及び（３）参照ピクチャリスト中の参照ピクチャを並べ替えるためにＲＰＬＭプロセスが適用される。ビデオエンコーダ２０は、ＲＰＬＭプロセスを適用するために、ビデオデコーダ３０に命令する１つ又は複数のＲＰＬＭコマンドを出力し得る。ビデオデコーダ３０は、ＲＰＬＭコマンドに応答してＲＰＬＭプロセスを適用し得る。

[0103]本開示の態様によれば、参照インデックスベースの信号伝達が使用されないとき、ビデオエンコーダ２０及びビデオデコーダ３０は、ＶＳＰピクチャに対応するＲＰＬＭコマンドを発行しない。即ち、ＶＳＰピクチャは生成されていないので、ビデオエンコーダ２０及びビデオデコーダ３０は、ＶＳＰピクチャの位置を変えるためにＲＰＬＭを使用するのを控えることがある。

[0104]本開示の他の態様によれば、ＧＶＳＰが使用されるとき、ビデオエンコーダ２０及びビデオデコーダ３０は、ＲｅｆＰｉｃＬｉｓｔ０に対する第１のビュー間参照ピクチャのみから、ビュー合成予測ピクチャを合成し得る。この例では、ビュー合成予測ピクチャの信号伝達は不要であり、ＧＶＳＰモードが、第１のビュー間参照ピクチャ、例えばＲｅｆＰｉｃＬｉｓｔ０を指す視差動きベクトルを出力することが、自動的に決定（例えば、推測）される。代替として、別の例では、ビデオエンコーダ２０及びビデオデコーダ３０は、ＲｅｆＰｉｃＬｉｓｔ１中のビュー間ピクチャに基づいてビュー合成予測を実行し得る。代替として、別の例では、ビデオエンコーダ２０及びビデオデコーダ３０は、ＲｅｆＰｉｃＬｉｓｔ０とＲｅｆＰｉｃＬｉｓｔ１の両方の中に存在する場合、ビュー間ピクチャに基づいてビュー合成予測を実行し得る。

[0105]図２は、ビュー合成に対して本開示で説明される技法を実装し得る例示的なビデオエンコーダ２０を示すブロック図である。ビデオエンコーダ２０は、ビデオスライス内のビデオブロックのイントラコード化とインターコード化とを実行することができる。イントラコード化は、所与のピクチャ内のビデオの空間的冗長性を低減又は除去するために空間的予測に依拠する。インターコード化は、ビデオシーケンスの隣接ピクチャ又はピクチャ内のビデオの時間的冗長性を低減又は除去するために時間的予測に依拠する。イントラモード（Ｉモード）は、幾つかの空間ベースの圧縮モードのいずれかを指し得る。単方向予測（Ｐモード）又は双方向予測（Ｂモード）などのインターモードは、幾つかの時間ベースの圧縮モードのいずれかを指し得る。

[0106]上で述べられたように、ビデオエンコーダ２０は、マルチビュービデオコード化を実行するように適合され得る。各ビューに対するテクスチャマップ（即ち、ルーマ値及びクロマ値）を符号化することに加えて、ビデオエンコーダ２０は更に、各ビューに対する深度マップを符号化することができる。

[0107]図２に示されたように、ビデオエンコーダ２０は、符号化されるべきビデオフレーム内の現在ビデオブロックを受信する。図２の例では、ビデオエンコーダ２０は、モード選択ユニット４０と、参照ピクチャメモリ６４と、加算器５０と、変換処理ユニット５２と、量子化ユニット５４と、エントロピーエンコード化ユニット５６とを含む。モード選択ユニット４０は、今度は、動き補償ユニット４４と、動き推定ユニット４２と、イントラ予測ユニット４６と、区分化ユニット４８とを含む。ビデオブロックの復元のために、ビデオエンコーダ２０はまた、逆量子化ユニット５８と、逆変換ユニット６０と、加算器６２とを含む。

[0108]再構築されたビデオからブロック歪み（blockiness artifacts）を除去するためにブロック境界をフィルタ処理するデブロッキングフィルタ（図２に図示せず）も含まれ得る。所望される場合、デブロッキングフィルタは通常、加算器６２の出力をフィルタリングする。追加のフィルタ（ループ内又はループ後）もデブロッキングフィルタに加えて使用され得る。そのようなフィルタは、簡潔にするために示されていないが、所望される場合、（ループ内フィルタとして）加算器５０の出力をフィルタリングし得る。

[0109]符号化プロセス中に、ビデオエンコーダ２０はコード化されるべきビデオフレーム又はスライスを受信する。フレーム又はスライスは、複数のビデオブロックに分割され得る。動き推定ユニット４２及び動き補償ユニット４４は、時間予測を行うために、１つ又は複数の参照フレーム中の１つ又は複数のブロックに対して、受信されたビデオブロックのインター予測コード化を実行する。イントラ予測ユニット４６は、代替的に、空間予測を行うために、コード化されるべきブロックと同じフレーム又はスライス中の１つ又は複数の隣接ブロックに対して、受信されたビデオブロックのイントラ予測コード化を実行し得る。ビデオエンコーダ２０は、例えば、ビデオデータのブロックごとに適切なコード化モードを選択するために、複数のコード化パスを実行することができる。

[0110]その上、区分化ユニット４８は、以前のコード化パスにおける以前の区分方式の評価に基づいて、ビデオデータのブロックをサブブロックに区分することができる。例えば、区分化ユニット４８は、初めにフレーム又はスライスをブロック（例えば、マクロブロック又はＬＣＵ）に区分し、レート歪み（rate-distortion）分析（例えば、レート歪み最適化）に基づいてブロックの各々をサブブロックに区分し得る。

[0111]モード選択ユニット４０は、例えば、誤差結果に基づいて、イントラ予測、時間的インター予測、又はビュー間予測などのコード化モードのうちの１つを選択し得、残差ブロックデータを生成するために、予測ブロックを加算器５０に与え、参照フレームとして使用するための符号化されたブロックを再構築するために、予測ブロックを加算器６２に与える。モード選択ユニット４０はまた、動きベクトル、イントラモードインジケータ、区分情報、及び他のそのようなシンタックス情報など、シンタックス要素をエントロピー符号化ユニット５６に与える。

[0112]幾つかの例では、モード選択ユニット４０は、ビュー合成予測のために、例えば、前にコード化されたビュー又は合成ビューに対してビュー間予測を選択するように構成され得る。以下でより詳細に説明するように、ビュー合成ユニット６６は、ビュー合成予測のためにビューを合成する（即ち、テクスチャ及び／又は深度画素値を含むピクチャを合成する）ように構成され得る。例えば、ビュー合成ユニット６６は、深度画像ベースレンダリング（ＤＩＢＲ：depth-image based rendering）と実質的に同様の技法を実行するように構成され得る。

[0113]ビュー合成予測が使用可能である場合、モード選択ユニット４０は、依然として、前にコード化されたピクチャに対して他の利用可能なコード化モード、例えば、イントラ予測、時間的インター予測、又はビュー間予測の中から選択し得ることを理解されたい。従って、ビデオエンコーダ２０は、ビュー合成予測が使用可能であるかどうかを示す情報とは別個に、ビデオデータのブロックのためにどのコード化モードが選択されるかの指示を与え得る。

[0114]動き推定ユニット４２及び動き補償ユニット４４（及び、ビデオエンコーダ２０の１つ又は複数の他のユニット）は、高度に一体化され得るが、概念的な目的のために別々に示されている。動き推定ユニット４２によって実施される動き推定は、ビデオブロックの動きを推定する動きベクトルを生成するプロセスである。動きベクトルは、例えば、現在フレーム（又は他のコード化された単位）内でコード化されている現在のブロックに対する参照フレーム（又は他のコード化された単位）内の予測ブロックに対する現在ビデオフレーム又は現在ピクチャ内のビデオブロックの変位を示し得る。

[0115]予測ブロックは、絶対値差分和（ＳＡＤ：sum of absolute difference）、２乗差分和（ＳＳＤ：sum of square difference）、又は他の差分メトリックによって決定され得る画素差分に関して、コード化されるべきブロックにぴったり一致することがわかるブロックである。動きベクトルは、時間的に別個のピクチャ中の同じビューの前にコード化されたブロックに対してブロックの動きについて説明する時間的動きベクトルと、（異なる水平カメラパースペクティブを有する）が同じ時間的位置を有し得る異なるビュー中の同様のブロック間の視差について説明する視差動きベクトルとを含み得る。場合によっては、動きベクトルは、異なるビュー中にも存在する時間的に別個のピクチャに関する動きについて説明し得る。

[0116]幾つかの例では、ビデオエンコーダ２０は、参照ピクチャメモリ６４に記憶された参照ピクチャのサブ整数画素位置の値を計算し得る。例えば、ビデオエンコーダ２０は、参照ピクチャの１／４画素位置、１／８画素位置、又は他の小数画素位置の値を補間し得る。従って、動き推定ユニット４２は、フル画素位置と小数画素位置とに対する動き探索を実行し、小数画素精度で動きベクトルを出力することができる。

[0117]ビュー間予測を実行するとき、動き推定ユニット４２は、ビュー合成予測のために、異なるビューの前にコード化されたピクチャ又は合成ピクチャに対して視差動きベクトルを計算し得る。従って、動き推定ユニット４２は、動き／視差推定ユニットと呼ばれることもある。

[0118]概して、合成ピクチャは、ビュー合成ユニット６６によって参照ピクチャメモリ６４に記憶され得、従って、動き推定ユニット４２及び動き補償ユニット４４は、参照ピクチャが、異なるビューの前にコード化されたピクチャであるのか、ビュー合成プロセスからの合成ピクチャであるのかを決定するように構成される必要はない。シーンのピクチャが、異種水平カメラの観点から撮影又は生成されるために、同じ時間的位置における異なるビューのピクチャは、一般に、水平差異のみを含み、垂直差異を含まないので、視差動きベクトルを探索するためのプロセスは、水平方向と垂直方向の両方に探索するのではなく、水平方向に探索することに制限され得る。

[0119]動き推定ユニット４２は、ブロックの位置を参照ピクチャの予測ブロックの位置と比較することによって、インターコード化されたスライスにおけるビデオブロックのための動きベクトル（例えば、時間的動きベクトル又は視差動きベクトル）を計算する。参照ピクチャは、第１の参照ピクチャリスト（リスト０）又は第２の参照ピクチャリスト（リスト１）から選択されてよく、それらの参照ピクチャリストの各々は、参照ピクチャメモリ６４に記憶された１つ又は複数の参照ピクチャを識別する。動き推定ユニット４２は、計算された動きベクトルをエントロピー符号化ユニット５６と動き補償ユニット４４とに送る。

[0120]動き補償ユニット４４によって実行される動き補償は、同じく、時間的動きベクトル又は視差動きベクトルであり得る、動き推定ユニット４２によって決定された動きベクトルに基づいて予測ブロックをフェッチ又は生成することに関与し得る。この場合も、幾つかの例では、動き推定ユニット４２と動き補償ユニット４４とは機能的に統合され得る。現在ビデオブロックの動きベクトルを受信すると、動き補償ユニット４４は、動きベクトルが参照ピクチャリストのうちの１つにおいて指す予測ブロックの位置を特定し得る。加算器５０は、以下で説明するように、コード化されている現在ビデオブロックの画素値から予測ブロックの画素値を減算し、画素差分値を形成することによって、残差ビデオブロックを形成する。

[0121]概して、動き推定ユニット４２はルーマ成分に対して動き推定を実行し、動き補償ユニット４４は、クロマ成分とルーマ成分の両方のためにルーマ成分に基づいて計算された動きベクトルを使用する。動き推定ユニット４２及び動き補償ユニット４４は、深度マップをコード化するためにルーマ成分から動きベクトルを再使用するか、又は深度マップのための動きベクトルを独立して計算するように構成され得る。従って、場合によっては、動き推定４２及び動き補償ユニット４４は、ルーマ成分と同様の方法で、又はクロマ成分と同様の方法で深度マップを予測するように構成され得る。モード選択ユニット４０はまた、ビデオスライスのビデオブロックを復号する際にビデオデコーダ３０が使用するためのビデオブロックとビデオスライスとに関連するシンタックス要素を生成し得る。

[0122]イントラ予測ユニット４６は、上記で説明されたように、動き推定ユニット４２及び動き補償ユニット４４によって実行されるインター予測（例えば、時間的インター予測及び／又はビュー間予測）の代替として、現在のブロックをイントラ予測し得る。特に、イントラ予測ユニット４６は、現在のブロックを符号化するために使用するようにイントラ予測モードを決定することができる。幾つかの例では、イントラ予測ユニット４６は、例えば、別個の符号化パスの間に、様々なイントラ予測モードを使用して現在のブロックを符号化することができ、イントラ予測ユニット４６（又は、幾つかの例では、モード選択ユニット４０）は、使用するのに適したイントラ予測モードをテストされたモードから選択することができる。

[0123]例えば、イントラ予測ユニット４６は、様々なテストされたイントラ予測モードに対するレート歪み分析を使用してレート歪み値を計算し、テストされたモードの中で最良のレート歪み特性を有するイントラ予測モードを選択することができる。レート歪み分析は、概して、符号化されたブロックと、符号化されたブロックを生成するために符号化された元の符号化されていないブロックとの間の歪み（又は誤差）の量、及び符号化されたブロックを生成するために使用されるビットレート（即ち、ビット数）を決定する。イントラ予測ユニット４６は、どのイントラ予測モードがブロックに対して最良のレート歪み値を呈するかを決定するために、様々な符号化されたブロックの歪み及びレートから比率を計算することができる。

[0124]ブロックのためのイントラ予測モードを選択した後に、イントラ予測ユニット４６は、ブロックのための選択されたイントラ予測モードを示す情報をエントロピー符号化ユニット５６に与え得る。エントロピー符号化ユニット５６は、選択されたイントラ予測モードを示す情報を符号化し得る。ビデオエンコーダ２０は、送信されるビットストリーム中に、複数のイントラ予測モードインデックステーブル及び複数の修正されたイントラ予測モードインデックステーブル（コードワードマッピングテーブルとも呼ばれる）と、様々なブロックの符号化コンテキストの定義と、コンテキストの各々に対して使用する、最確イントラ予測モード（most probable intra-prediction mode）、イントラ予測モードインデックステーブル、及び修正されたイントラ予測モードインデックステーブルの指示とを含み得る、構成データを含め得る。

[0125]更に、上記のように、モード選択ユニット４０は、非ベースビューの特定のブロックをコード化するためにビュー合成予測を利用すべきかどうかを決定し得る。モード選択ユニット４０は、ビュー合成予測がビットストリームのために、又はマルチビュービットストリームの特定の動作点のために使用可能であるかどうかを示す構成データを受信し得る。例えば、ユーザは、ビットストリームがビュー合成予測を実行する能力がない機器に適合すべきであることを示す構成データを与えられていることがあり、その場合、モード選択ユニット４０は、全ビットストリームのためにビュー合成予測を使用不能にし得る。代替的に、構成データは、ビュー合成予測が使用不能である、動作点を形成するビューのサブセットを示し得、その場合、モード選択ユニット４０は、サブセット中のビューの各々のためにビュー合成予測を使用不能にするが、サブセット中に含まれないビットストリームの他のビューのためにビュー合成予測をテストし得る。

[0126]概して、特定の非ベースビューに対してビュー合成予測が許可されると仮定すると、モード選択ユニット４０は、ビュー合成予測が、前にコード化された（非合成）ビューに対して他のコード化モード、例えば、時間的インター予測、イントラ予測、及び／又はビュー間予測よりも良い性能（performance）をもたらすかどうかを決定するために非ベースビューのピクチャのブロックのためのビュー合成予測をテストし得る。モード選択ユニット４０は、レート歪み最適化（ＲＤＯ：rate-distortion optimization）を使用して、及び／又はＢｊｏｎｔｅｇａａｒｄデルタレート（ＢＤレート）を使用して様々なコード化モードの性能をテストし得る。概して、レート歪み最適化は、モード又はモードの組合せによってもたらされる歪みの量に対して、特定のモード又はモードの組合せを使用してビデオデータのセットをコード化するために必要なビット数の測度である。モード選択ユニット４０は、これらの測度によって示される最良の性能をもたらすモード又はモードの組合せを選択し得る。

[0127]更に、モード選択ユニット４０は、ビュー合成予測が最良の性能をもたらすスライス、ピクチャ、シーケンス、又は他のコード化された単位（例えば、タイル又は波面）中のブロックの数を決定し、ブロックのこの数がビュー合成予測を使用することの処理時間を正当化するのに十分に高いかどうかを決定し得る。例えば、ビデオデコーダによってビューを合成することは、かなり大量の処理リ発信源を必要とし得、従って、ビュー合成予測が使用されるべきコード化された単位に十分に多くの数のブロックがない場合、モード選択ユニット４０は、ビュー合成予測の他に特定のブロックのための異なるコード化モードを選択し得る。

[0128]ビュー合成ユニット６６は、ビュー間予測のためのビューを合成するユニットを表す。ビュー合成予測が使用可能であるとき、ビュー合成ユニット６６は、参照ピクチャメモリ６４に記憶されたテクスチャ及び深度情報を使用して合成ビューのためのピクチャを合成し得る。ビュー合成ユニット６６は、別のビューを合成するために１つ又は複数の参照ビューを使用し得る。

[0129]概して、ピクチャを合成するために、ビュー合成ユニット６６は、１つ又は複数の前にコード化されたビューのテクスチャ及び深度情報を使用し得る。ビュー合成ユニット６６は、テクスチャピクチャの対応する（例えば、実質的に同一位置に配置される(co-located)）深度情報と対応する深度マップとに基づいてテクスチャ情報のための水平視差を計算し得る。概して、表示器の深度に（例えば、収束の平面に）出現すべき物体は、０の視差を有し得る。即ち、この物体を表す画素は、参照ビューの場合のように合成ビュー中で実質的に同じ水平位置を有し得る。物体をスクリーンの前に表示すべき場合、「左眼」ピクチャ中で、物体のための画素が「右眼」ピクチャ中の対応する画素の右側に配置されるように正の視差が割り当てられ得る。代替として、物体をスクリーンの背後に表示すべき場合、「左眼」ピクチャ中で、物体のための画素が「右眼」ピクチャ中の対応する画素の左側に配置されるように負の視差が割り当てられ得る。相対的水平シフトは、達成されるべき深度の量、相対的水平オフセット、収束平面までの距離、現実世界距離、カメラパラメータなどの関数として決定され得る。

[0130]このようにして、ビュー合成ユニット６６は、参照ピクチャとして使用されるべきビューのピクチャを合成し得る。ビュー合成ユニット６６は、テクスチャ画像及び／又は深度マップのいずれか又は両方を合成するために同様のプロセスを使用し得る。従って、ビデオエンコーダ２０は、合成ビューコンポーネントに対してテクスチャ画像及び／又は深度マップ、例えば、合成テクスチャ画像又は合成深度マップをコード化し得る。ビュー合成ユニット６６は、参照ピクチャメモリ６４中に合成ビューコンポーネントについてのデータを記憶し得る。このようにして、モード選択ユニット４０と、動き推定ユニット４２と、動き補償ユニット４４とは、合成ビューコンポーネントが従来の参照ピクチャであるかのように合成ビューコンポーネントを扱い得る。

[0131]本開示の態様によれば、モード選択ユニット４０は、特定のブロックをコード化するためにＶＳＰを適用するかどうかを示す１つ又は複数のシンタックス要素を生成し得る。幾つかの例では、モード選択ユニット４０は、ビュー間予測されるなど、インター予測されるブロックに対するシンタックス要素だけを生成し得る。従って、この例では、現在のブロックに対する参照ピクチャインデックスがビュー間参照ピクチャに対応するとき、モード選択ユニット４０は、現在のブロックをコード化するためにＶＳＰが使用されるかどうかを示すために、エントロピー符号化ユニット５６にフラグを送ることができる。

[0132]上記の例では、ＶＳＰピクチャの参照インデックスは、スライスヘッダ内に明確に示されず、又は参照ピクチャリスト構築中に追加されない。代わりに、ビデオエンコーダ２０は、ビュー間参照ピクチャに対応する各参照インデックスに対するＭＢ又はＭＢ区分レベルにおいてフラグを符号化し得る。そのような信号伝達は、合成されたピクチャが特定の参照ピクチャインデックスに縛られないという点で、与え得る、又はＶＳＰ信号伝達に対するより柔軟な手法。

[0133]別の例では、モード選択ユニット４０は、任意のインター予測されるモードに対してＶＳＰフラグを生成し得る。別の例では、追加又は代替として、モード選択ユニット４０は、ＲｅｆＰｌｉｃＬｉｓｔ０に対応する参照インデックスに対してのみ、フラグを生成し得る。更に別の例では、モード選択ユニット４０は、ＲｅｆＰｌｉｃＬｉｓｔ０とＲｅｆＰｉｃＬｉｓｔ１（存在する場合）の両方に対応する参照インデックスに対して、フラグを生成し得る。

[0134]本開示の他の態様によれば、ビュー合成予測が使用可能であるとき、参照ベースの信号伝達がＶＳＰに対して使用される（例えば、参照ピクチャインデックスがビュー合成参照ピクチャに対して生成され、ＶＳＰが参照インデックスに基づいて実行される）かどうか、又はＧＶＳＰがＶＳＰに対して使用される（例えば、上記の表１〜表３に関して、上記で説明されたマクロブロック信号伝達に基づいてＶＳＰが実行される）かどうかを示すＳＰＳ又はＳＰＳ拡張などのパラメータセットに対する１つ又は複数のシンタックス要素を、モード選択ユニット４０が生成し得る。幾つかの例では、１つ又は複数のシンタックス要素は、ＳＰＳ拡張中のフラグを含み得る。

[0135]本開示の他の態様によれば、参照インデックスベースの信号伝達が使用されないとき、ビデオエンコーダ２０は、ＶＳＰピクチャに対応するＲＰＬＭコマンドを発行しない。

[0136]本開示の他の態様によれば、ＧＶＳＰが使用されるとき、ビュー合成ユニット６６は、ＲｅｆＰｉｃＬｉｓｔ０に対する第１のビュー間参照ピクチャのみから、ビュー合成予測ピクチャを合成し得る。この例では、ビュー合成予測ピクチャの信号伝達は不要であり、ＧＶＳＰモードが、第１のビュー間参照ピクチャ、例えばＲｅｆＰｉｃＬｉｓｔ０を指す視差動きベクトルを出力することが、自動的に決定（例えば、推測）される。代替として、別の例では、ビュー合成ユニット６６は、ＲｅｆＰｉｃＬｉｓｔ１中のビュー間ピクチャに基づいてビュー合成予測を実行し得る。代替として、別の例では、ビュー合成ユニット６６は、ＲｅｆＰｉｃＬｉｓｔ０とＲｅｆＰｉｃＬｉｓｔ１の両方の中に存在する場合、ビュー間ピクチャに基づいてビュー合成予測を実行し得る。

[0137]ビデオエンコーダ２０は、コード化されている元のビデオブロックから、モード選択ユニット４０からの予測データを減算することによって、残差ビデオブロックを形成する。加算器５０は、この減算演算を実行する１つ又は複数のコンポーネントを表す。変換処理ユニット５２は、離散コサイン変換（ＤＣＴ）又は概念的に同様の変換などの変換を残差ブロックに適用し、残差変換係数値を備えるビデオブロックを生成する。変換処理ユニット５２は、ＤＣＴと概念的に同様である他の変換を実行することができる。ウェーブレット変換、整数変換、サブバンド変換又は他のタイプの変換も使用され得る。

[0138]いずれの場合も、変換処理ユニット５２は、変換を残差ブロックに適用し、残差変換係数のブロックを生成する。変換は、残差情報を画素値領域から周波数領域などの変換領域に変換し得る。変換処理ユニット５２は、得られた変換係数を量子化ユニット５４に送ることができる。量子化ユニット５４は、ビットレートを更に低減するために変換係数を量子化する。量子化プロセスは、係数の一部又は全部に関連するビット深度を低減し得る。量子化の程度は、量子化パラメータを調整することによって修正され得る。幾つかの例では、量子化ユニット５４は、次いで、量子化された変換係数を含む行列の走査を実行することができる。代替的に、エントロピー符号化ユニット５６が走査を実行してよい。

[0139]量子化の後、エントロピー符号化ユニット５６は、量子化された変換係数をエントロピーコード化する。例えば、エントロピー符号化ユニット５６は、コンテキスト適応型可変長コード化（ＣＡＶＬＣ）、コンテキスト適応型バイナリ算術コード化（ＣＡＢＡＣ）、シンタックスベースコンテキスト適応型バイナリ算術コード化（ＳＢＡＣ）、確率間隔区分エントロピー（ＰＩＰＥ）コード化又は別のエントロピーコード化技法を実行し得る。コンテキストベースエントロピーコード化の場合、コンテキストは隣接ブロックに基づき得る。エントロピー符号化ユニット５６によるエントロピーコード化の後に、符号化されたビットストリームは、別の機器（例えば、ビデオデコーダ３０）に送信されるか、又は後で送信するか又は取り出すためにアーカイブされ得る。

[0140]逆量子化ユニット５８及び逆変換ユニット６０は、それぞれ逆量子化及び逆変換を適用して、例えば、参照ブロックとして後で使用するために、画素領域中で残差ブロックを再構築する。動き補償ユニット４４は、残差ブロックを参照ピクチャメモリ６４のフレームのうちの１つの予測ブロックに加算することによって参照ブロックを計算し得る。動き補償ユニット４４はまた、再構築された残差ブロックに１つ又は複数の補間フィルタを適用して、動き推定において使用するためのサブ整数画素値を計算し得る。

[0141]加算器６２は、再構築された残差ブロックを、動き補償ユニット４４によって生成された動き補償予測ブロックに加算して、参照ピクチャメモリ６４に記憶するための再構築されたビデオブロックを生成する。再構築されたビデオブロックは、後続のビデオフレーム中のブロックをインターコード化するために動き推定ユニット４２及び動き補償ユニット４４によって参照ブロックとして使用され得る。

[0142]本開示の態様によれば、ビデオエンコーダ２０は、現在のブロックに対する参照インデックスがビュー間参照ピクチャに対応するかどうかを決定することを含む方法を実行し得、現在のブロックに対する参照インデックスがビュー間参照ピクチャに対応するときに、現在のブロックのビュー合成予測（ＶＳＰ）モードを示すデータを生成し得、ここにおいて、参照インデックスに対するＶＳＰモードは、現在のブロックがビュー間参照ピクチャからビュー合成予測を用いて予測されるかどうかを示す。ビデオエンコーダ２０はまた、ビットストリーム中のＶＳＰモードを示すデータを符号化するように構成される。

[0143]図３は、ビュー合成予測に関係する情報をコード化するための技法を実装し得るビデオデコーダ３０の一例を示すブロック図である。図３の例では、ビデオデコーダ３０は、エントロピー復号ユニット７０と、動き補償ユニット７２と、イントラ予測ユニット７４と、逆量子化ユニット７６と、逆変換ユニット７８と、参照ピクチャメモリ８２と、加算器８０とを含む。ビデオデコーダ３０は、幾つかの例では、ビデオエンコーダ２０（図２）に関して説明された符号化パスとは概して逆の復号パスを実行し得る。動き補償ユニット７２は、エントロピー復号ユニット７０から受信された動きベクトルに基づいて予測データを生成し得、イントラ予測ユニット７４は、エントロピー復号ユニット７０から受信されたイントラ予測モードインジケータに基づいて予測データを生成し得る。

[0144]復号プロセス中に、ビデオデコーダ３０は、ビデオエンコーダ２０から、符号化されたビデオスライスのビデオブロックと、関連するシンタックス要素とを表す符号化されたビデオビットストリームを受信する。エントロピー復号ユニット７０は、量子化係数、動きベクトル又はイントラ予測モードインジケータ、及び他のシンタックス要素を生成するためにビットストリームをエントロピー復号する。エントロピー復号ユニット７０は、動きベクトルと他のシンタックス要素とを動き補償ユニット７２に転送する。ビデオデコーダ３０は、ビデオスライスレベル及び／又はビデオブロックレベルでシンタックス要素を受信し得る。

[0145]幾つかの例では、ビデオデコーダ３０は、ビュー合成予測が一連のピクチャ、個別のピクチャ、スライス、タイル、又は波面のいずれか又は全てのために使用可能であるかどうかを示すシンタックス情報を受信し得る。エントロピー復号ユニット７０は、シンタックス情報を復号し、ビュー合成予測が使用可能であるかどうかを示す情報をビュー合成ユニット８４に送ることができる。

[0146]ビュー合成ユニット８４は、ビュー合成ユニット６６（図２）の方法と実質的に同様の方法で動作するように構成され得る。例えば、ビュー合成予測が使用可能であるとき、ビュー合成ユニット８４は、ビュー合成を使用して参照ピクチャ（即ち、ビュー合成参照ピクチャ）を生成するために、参照ピクチャメモリ８２に記憶された、前に復号されたピクチャのテクスチャ及び深度情報を使用し得る。ビュー合成ユニット８４は、参照ピクチャメモリ８２中に合成ピクチャを記憶し得る。ビュー合成予測が使用可能でないとき、ビュー合成ユニット８４は、ピクチャを生成する必要はなく、それにより、処理リ発信源及び／又はバッテリー電力を節約し得る。

[0147]本開示の態様によれば、エントロピー復号ユニット７０は、特定のブロックをコード化するためにＶＳＰを適用するかどうかを示す１つ又は複数のシンタックス要素を受信及び復号することができる。幾つかの例では、シンタックス要素は、ビュー間予測されるなど、インター予測されるブロックに対してのみ、生成され得る。従って、この例では、現在のブロックに対する参照ピクチャインデックスがビュー間参照ピクチャに対応するとき、ビュー合成ユニット８４は、現在のブロックをコード化するためにＶＳＰが使用されるかどうかを示すフラグを受信し得る。

[0148]上記の例では、ＶＳＰピクチャの参照インデックスは、スライスヘッダ内に明確に示されず、又は参照ピクチャリスト構築中に追加されない。代わりに、ビデオデコーダ３０は、ビュー間参照ピクチャに対応する各参照インデックスに対するＭＢ又はＭＢ区分レベルにおいてフラグを復号する。そのような信号伝達は、合成されたピクチャが特定の参照ピクチャインデックスに縛られないという点で、与え得る、又はＶＳＰ信号伝達に対するより柔軟な手法。

[0149]別の例では、エントロピー復号ユニット７０は、任意のインター予測されるモードに対してＶＳＰフラグを受信及び復号することができる。別の例では、追加又は代替として、エントロピー復号ユニット７０は、ＲｅｆＰｌｉｃＬｉｓｔ０に対応する参照インデックスに対してのみ、フラグを受信及び復号することができる。更に別の例では、エントロピー復号ユニット７０は、ＲｅｆＰｌｉｃＬｉｓｔ０とＲｅｆＰｉｃＬｉｓｔ１（存在する場合）の両方に対応する参照インデックスに対して、フラグを受信及び復号することができる。

[0150]本開示の他の態様によれば、ビュー合成予測が使用可能であるとき、参照ベースの信号伝達がＶＳＰに対して使用される（例えば、参照ピクチャインデックスがビュー合成参照ピクチャに対して生成され、ＶＳＰが参照インデックスに基づいて実行される）かどうか、又はＧＶＳＰがＶＳＰに対して使用される（例えば、上記の表１〜表３に関して、上記で説明されたマクロブロック信号伝達に基づいてＶＳＰが実行される）かどうかを示すＳＰＳ又はＳＰＳ拡張などのパラメータセットの中の１つ又は複数のシンタックス要素を、ビデオデコーダ３０が受信及び復号することができる。幾つかの例では、１つ又は複数のシンタックス要素は、ＳＰＳ拡張中のフラグを含み得る。

[0151]本開示の他の態様によれば、参照インデックスベースの信号伝達が使用されないとき、ビデオデコーダ３０は、ＶＳＰピクチャに対応するＲＰＬＭコマンドを実行しない。

[0152]本開示の他の態様によれば、ＧＶＳＰが使用されるとき、ビュー合成ユニット８４は、ＲｅｆＰｉｃＬｉｓｔ０に対する第１のビュー間参照ピクチャのみから、ビュー合成予測ピクチャを合成し得る。この例では、ビュー合成予測ピクチャの信号伝達は不要であり、ＧＶＳＰモードが、第１のビュー間参照ピクチャ、例えばＲｅｆＰｉｃＬｉｓｔ０を指す視差動きベクトルを出力することが、自動的に決定（例えば、推測）される。代替として、別の例では、ビュー合成ユニット８４は、ＲｅｆＰｉｃＬｉｓｔ１中のビュー間ピクチャに基づいてビュー合成予測を実行し得る。代替として、別の例では、ビュー合成ユニット８４は、ＲｅｆＰｉｃＬｉｓｔ０とＲｅｆＰｉｃＬｉｓｔ１の両方の中に存在する場合、ビュー間ピクチャに基づいてビュー合成予測を実行し得る。

[0153]ビデオスライスがイントラコード化された（Ｉ）スライスとしてコード化されるとき、イントラ予測ユニット７４は、信号伝達されたイントラ予測モードと、現在フレーム又はピクチャの、前に復号されたブロックからのデータとに基づいて、現在ビデオスライスのビデオブロックのための予測データを生成し得る。ビデオフレームがインターコード化された（例えば、Ｂ、Ｐ、又はＧＰＢ）スライスとしてコード化されるとき、動き補償ユニット７２は、エントロピー復号ユニット７０から受信された動きベクトルと他のシンタックス要素とに基づいて、現在のビデオスライスのビデオブロックのための予測ブロックを生成する。予測ブロックは、参照ピクチャリストのうち１つ内の参照ピクチャのうち１つから生成され得る。ビデオデコーダ３０は、参照ピクチャメモリ８２に記憶された参照ピクチャに基づいて、デフォルトの構築技法を使用して、参照フレームリスト、即ち、リスト０及びリスト１を構成し得る。

[0154]動き補償ユニット７２は、動きベクトルと他のシンタックス要素とを解析することによって現在のビデオスライスのビデオブロックについての予測情報を決定し、予測情報を使用して、復号されている現在のビデオブロックのための予測ブロックを生成する。例えば、動き補償ユニット７２は、ビデオスライスのビデオブロックをコード化するために使用される予測モード（例えば、イントラ予測、時間的インター予測、又はビュー間予測）と、インター予測スライスタイプ（例えば、Ｂスライス、Ｐスライス、又はＧＰＢスライス）と、スライスの参照ピクチャリストのうちの１つ又は複数についての構築情報と、スライスの各インター符号化されたビデオブロックのための動きベクトル（例えば、視差動きベクトル及び／又は時間的動きベクトル）と、スライスの各インターコード化されたビデオブロックのためのインター予測ステータスと、現在のビデオスライス中のビデオブロックを復号するための他の情報とを決定するために、受信されたシンタックス要素の幾つかを使用する。

[0155]動き補償ユニット７２はまた、補間フィルタに基づいて補間を実行し得る。動き補償ユニット７２は、ビデオブロックの符号化中にビデオエンコーダ２０によって使用された補間フィルタを使用して、参照ブロックのサブ整数画素の補間値を計算し得る。この場合、動き補償ユニット７２は、受信されたシンタックス要素からビデオエンコーダ２０によって使用された補間フィルタを決定し、その補間フィルタを使用して予測ブロックを生成し得る。

[0156]幾つかの例では、動き補償ユニット７２は、視差動きベクトルを使用してビュー間予測を実行し得る。ビュー合成予測が使用可能であると仮定すると、そのようなビュー間予測は、別のビューの前に復号されたピクチャに対するものであるか、又はビュー合成を使用して生成される参照ピクチャに対するものであり得る。従って、動き補償ユニット７２は、動き／視差補正ユニット７２と呼ばれることがある。

[0157]逆量子化ユニット７６は、ビットストリーム中に与えられ、エントロピー復号ユニット７０によって復号された、量子化変換係数を逆量子化する（inverse quantize）、即ち、逆量子化する（de-quantize）。逆量子化プロセスは、量子化の程度を決定し、同様に、適用されるべき逆量子化の程度を決定するための、ビデオスライス中のビデオブロックごとにビデオデコーダ３０によって計算される量子化パラメータＱＰ_Yの使用を含み得る。

[0158]逆変換ユニット７８は、画素領域において残差ブロックを生成するために、逆変換、例えば逆ＤＣＴ、逆整数変換、又は概念的に同様の逆変換プロセスを変換係数に適用する。

[0159]動き補償ユニット７２又はイントラ予測ユニット７４が、動きベクトルと他のシンタックス要素とに基づいて現在のビデオブロックのための予測ブロックを生成した後、ビデオデコーダ３０は、逆変換ユニット７８からの残差ブロックを対応する予測ブロックと加算することによって、復号されたビデオブロックを形成する。加算器８０は、この加算演算を実行する１つ又は複数のコンポーネントを表す。

[0160]所望される場合、ブロック歪みを除去するために、復号されたブロックをフィルタリングするためのデブロッキングフィルタも適用され得る。画素遷移を平滑化するために、又は場合によってはビデオ品質を改善するために、他のループフィルタも（コード化ループ中又はコード化ループ後のいずれかで）使用され得る。所与のフレーム又はピクチャ中の復号されたビデオブロックは、次いで、その後の動き補償のために使用される参照ピクチャを記憶する参照ピクチャメモリ８２に記憶される。参照ピクチャメモリ８２はまた、図１の表示装置３２などの表示装置上での後の提示のために、復号されたビデオを記憶する。

[0161]このようにして、図３のビデオデコーダ３０は、現在のブロックに対する参照インデックスがビュー間参照ピクチャに対応するかどうかを決定することと、現在のブロックに対する参照インデックスがビュー間参照ピクチャに対応するときに、現在のブロックのビュー合成予測（ＶＳＰ）モードを示すデータを、符号化されたビットストリームから取得することとを行うように構成されたビデオデコーダの一例を表し、ここで、参照インデックスに対するＶＳＰモードは、現在のブロックがビュー間参照ピクチャからビュー合成予測を用いて予測されるかどうかを示す。

[0162]図４は、典型的なＭＶＣ復号順序（即ち、ビットストリーム順序）を示す。復号順序の構成はタイムファーストコード化と呼ばれる。各アクセス単位は、１つの出力時間インスタンスのための全てのビューのコード化されたピクチャを含むように定義される。アクセス単位の復号順序は、出力又は表示の順序と同一ではないことがある。

[0163]図５は、例示的なＭＶＣ予測パターンを示す概念図である。マルチビュービデオコード化（ＭＶＣ）は、ＩＴＵ−ＴＨ．２６４／ＡＶＣの拡張である。同様の技法が、ＨＥＶＣに適用され得る。図４の例では、（ビューＩＤ「Ｓ０」〜「Ｓ７」を有する）８つのビューが示され、１２個の時間的位置（temporal location）（「Ｔ０」〜「Ｔ１１」）がビューごとに示されている。即ち、図４中の各行はビューに対応し、各列は時間的位置を示す。

[0164]ＭＶＣはＨ．２６４／ＡＶＣデコーダによって復号可能である所謂基本ビューを有し、ステレオビューペアはＭＶＣによってサポートされ得るが、ＭＶＣの１つの利点は、ＭＶＣが、３Ｄビデオ入力として３つ以上のビューを使用し複数のビューによって表されるこの３Ｄビデオを復号する例を、サポートできることである。ＭＶＣデコーダを有するクライアントのレンダラは、複数のビューを用いて３Ｄビデオコンテンツを予想し得る。

[0165]図５のピクチャは、対応するピクチャがイントラコード化される（即ち、Ｉフレームである）か、又は一方向に（即ち、Ｐフレームとして）インターコード化されるか、又は複数の方向に（即ち、Ｂフレームとして）インターコード化されるかを指定する、文字を含む影付きブロックを使用して示される。一般に、予測は矢印によって示され、ここで矢印の終点のピクチャは、予測参照のために矢印の始点のオブジェクトを使用する。例えば、時間的位置Ｔ０にあるビューＳ２のＰフレームは、時間的位置Ｔ０にあるビューＳ０のＩフレームから予測される。

[0166]シングルビュービデオの符号化の場合と同様に、マルチビュービデオシーケンスのピクチャは、異なる時間的位置におけるピクチャに関して予測的に符号化され得る。例えば、時間的位置Ｔ１におけるビューＳ０のｂフレームは、時間的位置Ｔ０におけるビューＳ０のＩフレームからそのｂフレームに向けられた矢印を有し、ｂフレームがＩフレームから予測されることを示す。しかしながら、加えて、マルチビュービデオの符号化の状況において、ピクチャはビュー間予測され得る。即ち、ビュー成分は、参照のために他のビュー中のビュー成分を使用することができる。ＭＶＣでは、例えば、別のビュー中のビュー成分がインター予測参照であるかのように、ビュー間予測が実現される。可能性のあるビュー間参照は、シーケンスパラメータセット（ＳＰＳ）ＭＶＣ拡張において信号伝達されてよく、インター予測又はビュー間予測の参照の柔軟な順序付けを可能にする参照ピクチャリストの構築処理によって修正され得る。

[0167]図５は、ビュー間予測の様々な例を提供する。図５の例では、ビューＳ１のピクチャは、ビューＳ１の様々な時間的位置にあるピクチャから予測されるものとして、ならびに同じ時間的位置にあるビューＳ０及びビューＳ２のピクチャのうちのピクチャからビュー間予測されるものとして示されている。例えば、時間的位置Ｔ１にあるビューＳ１のｂフレームは、時間的位置Ｔ０及びＴ２にあるビューＳ１のＢフレームの各々、ならびに時間的位置Ｔ１にあるビューＳ０及びビューＳ２のｂフレームから予測される。

[0168]図５の例では、大文字「Ｂ」及び小文字「ｂ」は、異なる符号化方法ではなく、ピクチャ間の異なる階層関係を示すことが意図される。一般に、大文字の「Ｂ」フレームは、小文字の「ｂ」フレームよりも予測階層が比較的高い。図５はまた、異なるレベルの陰影を使用して予測階層の差異を示し、より陰影の量が大きい（即ち、比較的暗い）ピクチャは、より陰影が少ない（即ち、比較的明るい）ピクチャよりも予測階層が高い。例えば、図５の全てのＩフレームは完全な陰影によって示されるが、Ｐフレームは幾分明るい陰影を有し、Ｂフレーム（及び小文字のｂフレーム）は、互いに対して様々なレベルの陰影を有するが、Ｐフレーム及びＩフレームの陰影よりも常に明るい。

[0169]一般に、階層の比較的高いピクチャが、階層の比較的低いピクチャの復号中に参照ピクチャとして使用され得るように、予測階層の比較的高いピクチャは、階層の比較的低いピクチャを復号する前に復号されるべきであるという点で、予測階層はビュー順序インデックスに関係する。ビュー順序インデックスは、アクセス単位中のビュー成分の復号順序を示すインデックスである。ビュー順序インデックスは、ＳＰＳなどのパラメータセット中で示唆され得る。

[0170]このようにして、参照ピクチャとして使用されるピクチャは、その参照ピクチャを参照して符号化されたピクチャを復号する前に復号され得る。ビュー順序インデックスは、アクセス単位中のビュー成分の復号順序を示すインデックスである。ビュー順序インデックスｉごとに、対応するｖｉｅｗ＿ｉｄが信号伝達される。ビュー成分の復号は、ビュー順序インデックスの昇順に従う。全てのビューが提示された場合、ビュー順序インデックスのセットは、０からビューの全数よりも１少ない数まで連続的に順序付けされたセットを備える。

[0171]ＭＶＣでは、全ビットストリームのサブセットが抽出されて、依然としてＭＶＣに準拠するサブビットストリームが形成され得る。例えば、サーバによって提供されるサービス、１つ又は複数のクライアントのデコーダの容量、サポート、及び能力、及び／又は、１つ以上のクライアントの選好に基づいて、特定の適用例が必要とし得る多くの可能なサブビットストリームが存在する。例えば、あるクライアントが３つのビューのみを必要とすることがあり、２つの状況があり得る。一例では、あるクライアントは滑らかな観察エクスペリエンスを必要とし、ｖｉｅｗ＿ｉｄ値Ｓ０、Ｓ１、及びＳ２のビューを選好することができ、別の他のクライアントはビュースケーラビリティを必要とし、ｖｉｅｗ＿ｉｄ値Ｓ０、Ｓ２、及びＳ４のビューを選好することができる。これらのサブビットストリームの両方が、独立したＭＶＣビットストリームとして復号され、同時にサポートされ得ることに留意されたい。

[0172]図５に、マルチビュービデオコード化用の典型的なＭＶＣ予測（各ビュー内のピクチャ間予測とビュー間予測の両方を含む）構造が示され、ここでは矢印によって予測が示され、矢印の終点のオブジェクトは、予測参照のために矢印の始点のオブジェクトを使用する。ＭＶＣでは、Ｈ．２６４／ＡＶＣ動き補償のシンタックスを使用するが、異なるビュー中のピクチャが参照ピクチャとして使用されることを可能にする視差動き補償によって、ビュー間予測がサポートされる。

[0173]２つのビューのコード化は、ＭＶＣによってもサポートされる可能性があり、ＭＶＣの潜在的な利点の１つは、ＭＶＣエンコーダが３Ｄビデオ入力として３つ以上のビューをとらえることができ、ＭＶＣデコーダがそのようなマルチビュー表現を復号することができることである。従って、ＭＶＣデコーダをもつ任意のレンダラは、３つ以上のビューをもつ３Ｄビデオコンテンツを予想し得る。

[0174]ビュー間予測に関して、ＭＶＣにおいて、同じアクセス単位中の（即ち、同じ時間インスタンスをもつ）ピクチャ間でビュー間予測が可能にされる。非ベースビューの１つの中のピクチャをコード化するとき、ピクチャが異なるビュー中にあるが同じ時間インスタンスをもつ場合、そのピクチャは参照ピクチャリストに追加され得る。ビュー間予測参照ピクチャは、任意のインター予測参照ピクチャと同様に、参照ピクチャリストの任意の位置に置かれ得る。

[0175]図４のビューＳ０〜Ｓ７は、コード化されたビュー、即ち、コード化された情報がビットストリーム中に与えられるビューの例を表すものである。幾つかの例では、追加のビューが、ビューＳ０〜Ｓ７の間で合成され得る。例えば、ビューＳ０とＳ１との間にビューが合成され得る。そのようなビューのピクチャを合成するために、ビューＳ０及びＳ２中のピクチャのテクスチャ及び／又は深度情報が使用され得る。例えば、時間Ｔ１における参照ピクチャを合成するために、ビューＳ０及び／又はＳ２からの時間Ｔ１におけるピクチャからのテクスチャ及び深度情報が使用され得る。ビデオエンコーダ２０又はビデオデコーダ３０などのビデオコーダは、別のピクチャ、例えば、時間Ｔ１におけるビューＳ１のピクチャをコード化するための参照として使用されるべき合成ビューのそのようなピクチャについての画素データを補間し得る。

[0176]本開示の態様は、ビデオデータのブロックをコード化するときにビュー合成予測を適用するかどうかを示すための技法を含む。一例では、ビデオエンコーダ２０及び／又はビデオデコーダ３０などのビデオコーダは、現在のブロックに対する参照インデックスがインター予測参照ピクチャに対応するかどうかを決定することと、現在のブロックに対する参照インデックスがインター予測参照ピクチャに対応するときに、現在のブロックのＶＳＰモードを示すデータを決定することとを行い得、ここで、参照インデックスに対するＶＳＰモードは、現在のブロックが、例えばビュー間参照ピクチャからビュー合成予測を使用して予測されるかどうかを示す。ビデオコーダがビデオデコーダ３０として構成される例では、ビデオデコーダ３０は、符号化されたビットストリームからデータを取得することによってＶＳＰモードを示すデータを決定し得る。

[0177]幾つかの例では、インター予測参照ピクチャは、一般に、インター予測モードと関連付けられる。そのような例では、ＶＳＰモードを示すデータは、任意のインターモードに対して、例えばビュー内参照ピクチャ及びビュー間参照ピクチャに対して決定され得る。他の例では、ＶＳＰモードを示すデータは、ビュー間参照ピクチャに対してのみ、決定され得る。即ち、例えば、ビデオデコーダ３０は、参照ピクチャインデックスがビュー間参照ピクチャに対応するときにＶＳＰモードを示すデータだけを復号し得る。

[0178]上記の例では、ＶＳＰピクチャの参照インデックスは、スライスヘッダ内に明確に示されず、又は参照ピクチャリスト構築中に追加されない。代わりに、ビデオコーダは、インター予測参照ピクチャに対応する各参照インデックスに対するＭＢ又はＭＢ区分レベルにおいて１つ又は複数のシンタックス要素をコード化し得る。幾つかの例では、１つ又は複数のシンタックス要素は、ＶＳＰフラグであり得る。例えば、このフラグは、ＶＳＰが、特定の参照インデックスに対するＭＢ又はＭＢ区分に対して適用されるかどうかを示し得る。

[0179]マクロブロックレイヤセマンティックスに関して、１に等しいｖｓｐ＿ｆｌａｇは、現在のＭＢ又はＭＢ区分が、ａｎｃｈｏｒ＿ｐｉｃ＿ｆｌａｇが０のときにｎｏｎ＿ａｎｃｈｏｒ＿ｒｅｆ＿１０［ＶＯＩｄｘ］［０］によって、又はａｎｃｈｏｒ＿ｐｉｃ＿ｆｌａｇが１のときにａｎｃｈｏｒ＿ｒｅｆ＿１０［ＶＯＩｄｘ］［０］によって識別されるビュー間参照ピクチャから単方向に予測されることを規定し得、ここで、ＶＯＩｄｘは現在ビューコンポーネントのビュー順序インデックスである。ＭＢ又はＭＢ区分の動きベクトルは、サブクローズＪ．８．３．１．３（例えば、ＷＤ４）において規定されているように導出され得る。加えて、０に等しいｖｓｐ＿ｆｌａｇは、ビュー合成予測が現在のＭＢ又はＭＢ区分に対して使用されないことを規定し得る。代替として、０に等しいｖｓｐ＿ｆｌａｇは、ＧＶＳＰの下でのビュー合成予測は使用不可能であることを規定するが、参照インデックス信号伝達ベースの機構を使用するビュー合成予測は依然として許容され得る。

[0180]別の例では、ｖｓｐ＿ｆｌａｇが１に等しいとき、ＭＢ又はＭＢ区分は、ＲｅｆＰｉｃＬｉｓｔ０中の第１のビュー間参照から予測され得る。別の例では、ｖｓｐ＿ｆｌａｇが１に等しいとき、ＭＢ又はＭＢ区分は、ｖｓｐ＿ｐｉｃ＿ｆｌａｇがｍｏｄｉｆｉｃａｔｉｏｎ＿ｏｆ＿ｐｉｃ＿ｎｕｍｓ＿ｉｄｃの現在を制約するために使用されないとき、６に等しいｍｏｄｉｆｉｃａｔｉｏｎ＿ｏｆ＿ｐｉｃ＿ｎｕｍｓ＿ｉｄｃを有するＲＰＬＭ中の第１のエントリから予測され得る。この場合、ＲＰＬＭ中の６に等しいｍｏｄｉｆｉｃａｔｉｏｎ＿ｏｆ＿ｐｉｃ＿ｎｕｍｓ＿ｉｄｃを有するコマンドは、参照ピクチャリスト中の新しいエントリを示さない。

[0181]レベルの制約に関して、ＭＢ又はＭＢ区分がＶＳＰフラグを用いてコード化され、ＭＢ又はＭＢ区分の内部で少なくとも１つの８×８ブロック中に異なる動きベクトルを有するとき、ビデオエンコーダ２０又はビデオデコーダ３０などのビデオコーダは、ＭＢ又はＭＢ区分に基づいて８×８より小さいサブブロックの数を数えることができる。サブブロックの数は、ＭａｘＳｕｂＭｂＲｅｃｔＳｉｚｅを超えない。この例では、ビデオコーダは、ＶＳＰによって予測されたＭＢは、８×８より小さい１つ又は複数のサブブロックを有することを決定することができる。

[0182]代替として、別の例では、（ｖｓｐ＿ｆｌａｇを有する）ＶＳＰを使用してＭＢを予測した後、ビデオコーダは、ＭＢが８×８より小さいサブブロックを有することを決定することができる。代替として、更に別の例では、ｖｓｐフラグがＭＢ又はＭＢ区分に対して存在するとき、各ＭＢ区分に対して、ＭＢ又はＭＢ区分が８×８より小さいブロック区分を持たないように、唯一のビュー間動きベクトルが導出される。代替として、更に別の例では、ｖｓｐフラグがＭＢ又はＭＢ区分に対して存在するとき、各ＭＢ区分に対して、ＭＢ又はＭＢ区分が８×８より小さいブロック区分を持たないように、唯一のビュー間動きベクトルが、４つの８×８ブロックの各々に対して導出される。

[0183]本開示の他の態様によれば、ビュー合成予測が使用可能であるとき、参照ベースの信号伝達がＶＳＰに対して使用される（例えば、参照ピクチャインデックスがビュー合成参照ピクチャに対して生成され、ＶＳＰが参照インデックスに基づいて実行される）かどうか、又はＧＶＳＰがＶＳＰに対して使用される（例えば、上記の表１〜表３に関して、上記で説明されたマクロブロック信号伝達に基づいてＶＳＰが実行される）かどうかを示すＳＰＳ又はＳＰＳ拡張などのパラメータセットの中の１つ又は複数のシンタックス要素を、ビデオコーダがコード化することができる。幾つかの例では、１つ又は複数のシンタックス要素は、ＳＰＳ拡張中のフラグを含み得る。

[0184]例えば、本開示の態様によれば、ビデオエンコーダ２０及び／又はビデオデコーダ３０は、下の表４

に示されるように、ＷＤ４（上述されている）に対するシーケンスパラメータセット拡張シンタックスを使用ことができる。

[0185]上記の表４の例では、１に等しいｖｓｐ＿ｐｉｃ＿ｆｌａｇは、ビュー合成予測ピクチャが生成され、参照ピクチャリスト中の参照インデックスによって参照され得ることを示す。加えて、０に等しいｖｓｐ＿ｐｉｃ＿ｆｌａｇは、ビュー合成予測ピクチャが生成されず、ビュー合成予測は常にビュー間参照ピクチャを指すことを示す。存在しないとき、ｖｓｐ＿ｐｉｃ＿ｆｌａｇは０に等しいものと推測され得る。

[0186]本開示の他の態様によれば、参照インデックスベースの信号伝達が使用されないとき、ＲＰＬＭは、ＶＳＰピクチャに対応するＲＰＬＭコマンドを含まない。例えば、参照インデックスベースの信号伝達が使用されないとき、ビデオコーダ（ビデオエンコーダ２０及び／又はビデオデコーダ３０など）は、ＶＳＰピクチャに対応するＲＰＬＭコマンドを発行しない。即ち、ＶＳＰピクチャは生成されていないので、ビデオコーダは、ＶＳＰピクチャの位置を変えるためにＲＰＬＭを使用するのを控えることがある。

[0187]一例では、参照ピクチャリスト３ＤＶＣ修正に関して、サブクローズＩ．７．４．３．１．１中で（例えば、上述されたＷＤ４中で）規定されたセマンティックスが、下記の追加物

とともに適用される。

ここでｓｅｑ＿ｖｉｅｗ＿ｓｙｎｔｈｅｓｉｓ＿ｆｌａｇ又はｖｓｐ＿ｐｉｃ＿ｆｌａｇが０に等しい場合、ｍｏｄｉｆｉｃａｔｉｏｎ＿ｏｆ＿ｐｉｃ＿ｎｕｍｓ＿ｉｄｃは６に等しくならない。

[0188]本開示の他の態様によれば、ＧＶＳＰが使用されるとき、ビデオコーダは、ＲｅｆＰｉｃＬｉｓｔ０に対する第１のビュー間参照ピクチャのみから、ビュー合成予測ピクチャを合成し得る。この例では、ビュー合成予測ピクチャの信号伝達は不要であり、ＧＶＳＰモードが、第１のビュー間参照ピクチャ、例えばＲｅｆＰｉｃＬｉｓｔ０を指す視差動きベクトルを出力することが、自動的に決定（例えば、推測）される。代替として、別の例では、ビデオコーダは、ＲｅｆＰｉｃＬｉｓｔ１中のビュー間ピクチャに基づいてビュー合成予測を実行し得る。代替として、別の例では、ビデオコーダは、ＲｅｆＰｉｃＬｉｓｔ０とＲｅｆＰｉｃＬｉｓｔ１の両方の中に存在する場合、ビュー間ピクチャに基づいてビュー合成予測を実行し得る。

[0189]図６は、ビュー合成予測に関係する情報をコード化するための例示的な方法を示すフローチャートである。図６の方法についてビデオエンコーダ２０（図１及び図２）に関して説明する。しかしながら、他のビデオコード化機器が、同様の方法を実行するように構成され得ることを理解されたい。更に、本方法における幾つかのステップは、異なる順序で、又は並行して実行され得る。同様に、様々な例では、幾つかのステップが省略され得、他のステップが追加され得る。

[0190]この例では、ビデオエンコーダ２０は、最初に、現在のブロックと予測ブロックの参照インデックスとを予測する（１２０）。この例では、ビデオエンコーダ２０が現在のブロックをインター予測すると仮定される。例えば、動き推定ユニット４２は、前にコード化されたピクチャ、例えば、ビュー間ピクチャ及び時間的ピクチャの動き探索を実行することによって、現在のブロックの動きベクトルを計算し得る。従って、動き推定ユニット４２は、現在のブロックを予測するために、時間的動きベクトル又は視差動きベクトルを生成し得る。

[0191]幾つかの例では、上記のように、ビデオエンコーダ２０は、合成されたブロックから現在のブロックを予測し得る。例えば、ビデオエンコーダ２０は、参照ピクチャリストに追加され得、参照ピクチャインデックスを有し得る、合成されたピクチャを生成するために、ビュー合成プロセスを実行し得る。ビデオエンコーダ２０は、合成されたピクチャのブロックに対する現在のブロックを予測するためにＶＳＰを実行し得る。

[0192]図６の例では、ビデオエンコーダ２０は、予測ブロックを含む参照ピクチャの参照インデックスがビュー間参照ピクチャであるかどうかを決定し得る（１２２）。幾つかの例では、ビデオエンコーダ２０は、参照ピクチャが、ビュー識別子（ｖｉｅｗ＿ｉｄ）に基づいて符号化されるブロックと異なるビュー中に含まれるかどうかを決定し得る。

[0193]本開示の態様によれば、参照インデックスがビュー間参照ピクチャに対応する（ステップ１２２のＹＥＳ分岐）場合、ビデオエンコーダ２０は、参照インデックスに対するＶＳＰを適用するかどうかを示すデータを符号化し得る。例えば、ビデオエンコーダ２０が予想ブロックを決定するためにＶＳＰを実行した例では、ビデオエンコーダ２０は、ＶＳＰが使用されている（例えば、ｖｓｐ＿ｆｌａｇを１にセットしている）ことを示すデータを符号化し得る。ビデオエンコーダ２０が予想ブロックを決定するために単に（ＶＳＰなしに）ビュー間予測を実行した例では、ビデオエンコーダ２０は、ＶＳＰが使用されていない（例えば、ｖｓｐ＿ｆｌａｇを０にセットしている）ことを示すデータを符号化し得る。

[0194]ビデオエンコーダ２０は次いで、現在のブロックに対する残差ブロックを計算することができる（１２６）。残差ブロックを計算するために、ビデオエンコーダ２０は、元のコード化されていないブロックと、コード化されるブロックと同じビュー中のブロックであり得る予想ブロックか、コード化されるブロックと異なるビュー中のブロックか、又は合成されたブロックとの間の差分を計算し得る。ビデオエンコーダ２０は次いで、残差ブロックの係数を変換し、量子化することができる（１２８）。次に、ビデオエンコーダ２０は、残差ブロックの量子化された変換係数を走査することができる（１３０）。走査中又は走査後に、ビデオエンコーダ２０は、係数をエントロピー符号化することができる（１３２）。例えば、ビデオエンコーダ２０は、ＣＡＶＬＣ又はＣＡＢＡＣを使用して係数を符号化することができる。次いで、ビデオエンコーダ２０は、ブロックのエントロピーコード化されたデータならびにＶＳＰ指示を出力することができる（１３４）。

[0195]このようにして、図６の方法は、ビデオデータを符号化するための方法の一例を表し、方法は、現在のブロックに対する参照インデックスがビュー間参照ピクチャに対応するかどうかを決定することと、現在のブロックに対する参照インデックスがビュー間参照ピクチャに対応するときに、現在のブロックのビュー合成予測（ＶＳＰ）モードを示すデータを生成することと、ここで、参照インデックスに対するＶＳＰモードは、現在のブロックがビュー間参照ピクチャからビュー合成予測を用いて予測されるかどうかを示す、ビットストリーム中のＶＳＰモードを示すデータを符号化することとを含む。

[0196]図７は、ビュー合成予測に関係する情報をコード化するための例示的な方法を示すフローチャートである。図７の方法が、ビデオデコーダ３０（図１及び図３）に関して説明される。しかしながら、他のビデオコード化機器が、同様の方法を実行するように構成され得ることを理解されたい。更に、本方法における幾つかのステップは、異なる順序で、又は並行して実行され得る。同様に、様々な例では、幾つかのステップが省略され得、他のステップが追加され得る。

[0197]エントロピー復号ユニット７０は、現在復号されているブロックの係数に対するデータと、少なくとも１つの動きベクトル又は視差ベクトルと、少なくとも１つの対応する参照インデックスとをエントロピー復号する（１６０）。図７の例は、現在のブロックが単予測されることを仮定するが、他の例では、現在のブロックは、本明細書で説明されたように双予測されてもよいことを理解されたい。

[0198]動きベクトル又は視差ベクトルは、復号された参照ピクチャインデックスと関連付けられた参照ピクチャ中の予測ブロックを識別し得る。例えば、現在のブロックは、現在のブロックと同じビュー中のブロックからインター予測され得るか、現在のブロックと異なるビュー中のブロックからビュー間予測され得るか、又はＶＳＰを使用して合成されたブロックからビュー間予測され得る。特定の予測プロセスにかかわらず、復号された参照インデックスは、参照ピクチャメモリに記憶されたピクチャを識別する。

[0199]図７の例では、ビデオデコーダ３０は、予測ブロックを含む参照ピクチャの参照インデックスがビュー間参照ピクチャであるかどうかを決定し得る（１６２）。幾つかの例では、ビデオデコーダ３０は、参照ピクチャが、ビュー識別子（ｖｉｅｗ＿ｉｄ）に基づいて符号化されるブロックと異なるビュー中に含まれるかどうかを決定し得る。

[0200]本開示の態様によれば、参照インデックスがビュー間参照ピクチャに対応する（ステップ１６２のＹＥＳ分岐）場合、ビデオデコーダ３０は、参照インデックスに対するＶＳＰを適用するかどうかを示すデータを復号し得る。例えば、予想ブロックを決定するためにＶＳＰが使用されるべき例では、ビデオデコーダ３０は、ＶＳＰが使用されるべきである（例えば、ビデオデコーダ３０が１に等しいｖｓｐ＿ｆｌａｇを符号化されたビットストリームから取得し得る）ことを示すデータを復号することができる。予想ブロックを決定するためにビデオデコーダ３０がＶＳＰなしにビュー間予測を実行すべき例では、ビデオデコーダ３０は、ＶＳＰが使用されるべきでない（例えば、ビデオデコーダ３０が０に等しいｖｓｐ＿ｆｌａｇを符号化されたビットストリームから取得し得る）ことを示すデータを復号することができる。幾つかの例では、参照インデックスがビュー間参照ピクチャに対応するがビットストリーム中にＶＳＰ指示が含まれていない（例えば、ｖｓｐ＿ｆｌａｇが存在しない）場合、ビデオデコーダ３０は、現在のブロックがＶＳＰなしにビュー間予測されることを自動的に決定（推測）することができる。

[0201]ビデオデコーダ３０は、復号された動きベクトル又は視差ベクトルと参照ピクチャインデックスとを使用して現在のブロックを予測し得る（１６６）。ＶＳＰが使用される例では、ビデオデコーダ３０は、予測ブロックを決定するために合成されたピクチャを生成し得る。ビデオデコーダ３０は、次いで、量子化された変換係数のブロックを作成するために、再生成された係数を逆走査することができる（１６８）。ビデオデコーダ３０は、次いで、残差ブロックを生成するために係数を逆量子化し、逆変換することができる（１７０）。ビデオデコーダ３０は、最終的に、予測ブロックと残差ブロックとを組み合わせることによって現在のブロックを復号することができる（１７２）。

[0202]このようにして、図７の方法は、現在のブロックに対する参照インデックスがビュー間参照ピクチャに対応するかどうかを決定することと、現在のブロックに対する参照インデックスがビュー間参照ピクチャに対応するときに、現在のブロックのビュー合成予測（ＶＳＰ）モードを示すデータを、符号化されたビットストリームから取得することとを含み、ここで、参照インデックスに対するＶＳＰモードは、現在のブロックがビュー間参照ピクチャからビュー合成予測を用いて予測されるかどうかを示す。

[0203]ビュー合成に関して上で説明された技法は、ビデオエンコーダ２０（図１及び図２）及び／又はビデオデコーダ３０（図１及び図３）によって実行されてよく、ビデオエンコーダ２０とビデオデコーダ３０の両方が全般にビデオコーダと呼ばれ得る。同様に、「コード化」及び「ビデオコード化」は、適用可能な場合、ビデオ符号化（例えば、ビデオエンコーダによる）又はビデオ復号（例えば、ビデオデコーダによる）のいずれかを指すことがある。

[0204]例に応じて、本明細書で説明された方法のうちのいずれかの幾つかの動作又はイベントは、異なる順序で実行されてよく、互いに追加、統合、又は完全に除外され得る（例えば、全ての説明された動作又はイベントが、本方法の実施のために必要であるとは限らない）ことを理解されたい。その上、幾つかの例では、動作又はイベントは、連続的にではなく、同時に、例えば、マルチスレッド処理、割込み処理、又は複数のプロセッサを通じて実行され得る。更に、本開示の幾つかの態様は、明快にするために単一のモジュール又はユニットによって実行されるものとして説明されているが、本開示の技法はビデオコーダと関連付けられるユニット又はモジュールの組合せによって実行され得ることを理解されたい。

[0205]技法の様々な態様の特定の組合せが上で説明されたが、これらの組合せは、本開示で説明される技法の例を単に示すために与えられる。従って、本開示の技法は、これらの例示的な組合せに限定されるべきではなく、本開示で説明される技法の様々な態様の任意の想起可能な組合せを包含し得る。

[0206]１つ又は複数の例では、説明された機能は、ハードウェア、ソフトウェア、ファームウェア、又はそれらの任意の組合せで実装され得る。ソフトウェアで実装される場合、機能は、１つ又は複数の命令又はコードとしてコンピュータ可読媒体上に記憶されてよく、あるいは、コンピュータ可読媒体を介して送信され、ハードウェアベースの処理ユニットによって実行されてよい。コンピュータ可読媒体は、データ記憶媒体などの有形媒体に対応するコンピュータ可読記憶媒体、あるいは、例えば、通信プロトコルに従って、ある場所から別の場所へのコンピュータプログラムの転送を支援する任意の媒体を含む通信媒体を含み得る。

[0207]このようにして、コンピュータ可読媒体は、一般に、（１）非一時的である有形コンピュータ可読記憶媒体、あるいは（２）信号又は搬送波などの通信媒体に対応し得る。データ記憶媒体は、本開示で説明された技法を実装するための命令、コード及び／又はデータ構造を取り出すために、１つ又は複数のコンピュータ、又は１つ又は複数のプロセッサによってアクセスされ得る任意の利用可能な媒体であり得る。コンピュータプログラム製品はコンピュータ可読媒体を含み得る。

[0208]限定ではなく例として、そのようなコンピュータ可読記憶媒体は、ＲＡＭ、ＲＯＭ、ＥＥＰＲＯＭ（登録商標）、ＣＤ−ＲＯＭ又は他の光ディスクストレージ、磁気ディスクストレージ、又は他の磁気記憶装置、フラッシュメモリ、あるいは、命令又はデータ構造の形態の所望のプログラムコードを記憶するために使用されコンピュータによってアクセスされ得る、任意の他の媒体を備え得る。また、いかなる接続もコンピュータ可読媒体と適切に呼ばれる。例えば、命令が、同軸ケーブル、光ファイバーケーブル、ツイストペア、デジタル加入者回線（ＤＳＬ）、又は赤外線、無線、及びマイクロ波などのワイヤレス技術を使用して、ウェブサイト、サーバ、又は他のリモート発信源から送信される場合、同軸ケーブル、光ファイバーケーブル、ツイストペア、ＤＳＬ、又は赤外線、無線、及びマイクロ波などのワイヤレス技術は、媒体の定義に含まれる。

[0209]但し、コンピュータ可読記憶媒体及びデータ記憶媒体は、接続、搬送波、信号、又は他の一時媒体を含まないが、代わりに非一時的有形記憶媒体を対象とすることを理解されたい。本明細書で使用されるディスク（disk）及びディスク（disc）は、コンパクトディスク（disc）（ＣＤ）、レーザーディスク（登録商標）（disc）、光ディスク（disc）、デジタル多用途ディスク（disc）（ＤＶＤ）、フロッピー（登録商標）ディスク（disk）及びブルーレイ（登録商標）ディスク（disc）を含み、ディスク（disk）は、通常、データを磁気的に再生し、ディスク（disc）は、データをレーザーで光学的に再生する。上記の組合せもコンピュータ可読媒体の範囲内に含めるべきである。

[0210]命令は、１つ又は複数のデジタル信号プロセッサ（ＤＳＰ）などの１つ又は複数のプロセッサ、汎用マイクロプロセッサ、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブル論理アレイ（ＦＰＧＡ）、又は他の等価な集積回路もしくはディスクリート論理回路によって実行され得る。従って、本明細書で使用される「プロセッサ」という用語は、前述の構造、又は本明細書で説明された技法の実施に適した任意の他の構造のいずれかを指し得る。更に、幾つかの態様では、本明細書において説明された機能は、符号化及び復号のために構成された専用のハードウェア及び／又はソフトウェアモジュール内に設けられる場合があるか、又は複合コーデックに組み込まれる場合がある。また、本技法は、１つ又は複数の回路又は論理要素において完全に実施され得る。

[0211]本開示の技法は、ワイヤレスハンドセット、集積回路（ＩＣ）、又はＩＣのセット（例えば、チップセット）を含む、多種多様な機器又は装置において実装され得る。本開示では、開示する技法を実行するように構成された機器の機能的態様を強調するために様々な構成要素、モジュール、又はユニットについて説明したが、それらの構成要素、モジュール、又はユニットを、必ずしも異なるハードウェアユニットによって実現する必要があるとは限らない。むしろ、上記のように、適切なソフトウェア及び／又はファームウェアとともに、様々なユニットがコーデックハードウェアユニットにおいて組み合わせられ得るか、又は上記のような１つ又は複数のプロセッサを含む、相互動作可能なハードウェアユニットの集合体よって設けられ得る。

[0212]本開示の様々な態様が説明されてきた。これら及び他の態様は以下の特許請求の範囲内に入る。

[0212]本開示の様々な態様が説明されてきた。これら及び他の態様は以下の特許請求の範囲内に入る。
以下に本件出願当初の特許請求の範囲に記載された発明を付記する。
［１］ビデオデータを復号する方法であって、現在のブロックに対する参照インデックスがビュー間参照ピクチャに対応するかどうかを決定することと、前記現在のブロックに対する前記参照インデックスが、前記ビュー間参照ピクチャに対応するときに、前記現在のブロックのビュー合成予測（ＶＳＰ）モードを示すデータを、符号化されたビットストリームから取得することとを備え、ここにおいて、前記参照インデックスに対する前記ＶＳＰモードは、前記現在のブロックが前記ビュー間参照ピクチャからビュー合成予測を用いて予測されるかどうかを示す、方法。
［２］前記ＶＳＰモードを示す前記データを取得することが、前記現在のブロックに対する前記参照インデックスがビュー間参照ピクチャに対応するときだけ、ブロックレベルにおけるＶＳＰフラグを取得することを備える、［１］に記載の方法。
［３］前記ブロックレベルが、前記現在のブロックがマクロブロックであるときにマクロブロックレベルであるか、又は前記現在のブロックがマクロブロック区分であるときにマクロブロック区分レベルである、［２］に記載の方法。
［４］前記現在のブロックを復号するためにビュー合成参照ピクチャの参照インデックスの指示を含まないスライスヘッダを復号することを更に備える、［１］に記載の方法。
［５］前記現在のブロックに対する前記参照インデックスが、参照ピクチャリストゼロ中のピクチャに対応するときだけ、前記現在のブロックに対する前記ＶＳＰモードを示す前記データが取得される、［１］に記載の方法。
［６］前記現在のブロックに対する前記参照インデックスが、第１の参照ピクチャリスト及び第２の参照ピクチャリストのうちの１つの中のピクチャに対応するときに、前記現在のブロックに対する前記ＶＳＰモードを示す前記データが取得される、［１］に記載の方法。
［７］前記ＶＳＰモード及び第２のＶＳＰモードのうちの１つを実行するかどうかを示すデータを、符号化されたビットストリームから取得することを更に備え、ここにおいて、前記第２のＶＳＰモードを実行することが、ビュー合成参照ピクチャの参照ピクチャインデックスに基づいて前記ビュー合成参照ピクチャを決定することを備える、［１］に記載の方法。
［８］前記ビュー間参照ピクチャからビュー合成参照ピクチャを決定することと、ビュー合成予測ピクチャを参照ピクチャリストに追加することと、ここにおいて、参照ピクチャリスト修正プロセスは、前記ビュー合成予測ピクチャを並べ替えるために使用されない、前記ビュー合成参照ピクチャに対して前記現在のブロックを復号することとを更に備える、［１］に記載の方法。
［９］前記ビュー間参照ピクチャが参照ピクチャリストゼロ中に含まれるときだけ、前記ビュー間参照ピクチャからビュー合成参照ピクチャを合成することを更に備える、［１］に記載の方法。
［１０］前記ビュー間参照ピクチャが参照ピクチャリスト１中に含まれるときだけ、前記ビュー間参照ピクチャからビュー合成参照ピクチャを合成することを更に備える、［１］に記載の方法。
［１１］ビデオデータを復号するための装置であって、現在のブロックを含むビデオデータを記憶するメモリと、前記現在のブロックに対する参照インデックスがビュー間参照ピクチャに対応するかどうかを決定すること、及び前記現在のブロックに対する前記参照インデックスが、前記ビュー間参照ピクチャに対応するときに、前記現在のブロックのビュー合成予測（ＶＳＰ）モードを示すデータを、符号化されたビットストリームから取得することを行うように構成された１つ以上のプロセッサとを備え、ここにおいて、前記参照インデックスに対する前記ＶＳＰモードは、前記現在のブロックが前記ビュー間参照ピクチャからビュー合成予測を用いて予測されるかどうかを示す、装置。
［１２］前記ＶＳＰモードを示す前記データを取得するために、前記現在のブロックに対する前記参照インデックスがビュー間参照ピクチャに対応するときだけ、前記１つ以上のプロセッサが、ブロックレベルにおけるＶＳＰフラグを取得するように構成される、［１１］に記載の装置。
［１３］前記ブロックレベルが、前記現在のブロックがマクロブロックであるときにマクロブロックレベルであるか、又は前記現在のブロックがマクロブロック区分であるときにマクロブロック区分レベルである、［１２］に記載の装置。
［１４］前記１つ以上のプロセッサが、前記現在のブロックを復号するためにビュー合成参照ピクチャの参照インデックスの指示を含まないスライスヘッダを復号するように更に構成される、［１１］に記載の装置。
［１５］前記現在のブロックに対する前記参照インデックスが、参照ピクチャリストゼロ中のピクチャに対応するときだけ、前記１つ以上のプロセッサが、前記現在のブロックに対する前記ＶＳＰモードを示す前記データを取得するように構成される、［１１］に記載の装置。
［１６］前記現在のブロックに対する前記参照インデックスが、第１の参照ピクチャリスト及び第２の参照ピクチャリストのうちの１つの中のピクチャに対応するときに、前記１つ以上のプロセッサが、前記現在のブロックに対する前記ＶＳＰモードを示す前記データを取得するように構成される、［１１］に記載の装置。
［１７］前記１つ以上のプロセッサが、前記ＶＳＰモード及び第２のＶＳＰモードのうちの１つを実行するかどうかを示すデータを、符号化されたビットストリームから取得するように更に構成され、前記第２のＶＳＰモードを実行するために、前記１つ以上のプロセッサが、前記ビュー合成参照ピクチャの参照ピクチャインデックスに基づいてビュー合成参照ピクチャを決定するように構成される、［１１］に記載の装置。
［１８］前記１つ以上のプロセッサが、前記ビュー間参照ピクチャからビュー合成参照ピクチャを決定することと、前記ビュー合成予測ピクチャを参照ピクチャリストに追加することと、ここにおいて、参照ピクチャリスト修正プロセスは、前記ビュー合成予測ピクチャを並べ替えるために使用されない、前記ビュー合成参照ピクチャに対して前記現在のブロックを復号することとを行うように更に構成される、［１１］に記載の装置。
［１９］前記１つ以上のプロセッサが、前記ビュー間参照ピクチャが参照ピクチャリストゼロ中に含まれるときだけ、前記ビュー間参照ピクチャからビュー合成参照ピクチャを合成するように更に構成される、［１１］に記載の装置。
［２０］前記１つ以上のプロセッサが、前記ビュー間参照ピクチャが参照ピクチャリスト１中に含まれるときだけ、前記ビュー間参照ピクチャからビュー合成参照ピクチャを合成するように更に構成される、［１１］に記載の装置。
［２１］ビデオデータを符号化する方法であって、現在のブロックに対する参照インデックスがビュー間参照ピクチャに対応するかどうかを決定することと、前記現在のブロックに対する前記参照インデックスが、前記ビュー間参照ピクチャに対応するときに、前記現在のブロックのビュー合成予測（ＶＳＰ）モードを示すデータを生成することと、ここにおいて、前記参照インデックスに対する前記ＶＳＰモードは、前記現在のブロックが前記ビュー間参照ピクチャからビュー合成予測を用いて予測されるかどうかを示す、ビットストリーム中の前記ＶＳＰモードを示す前記データを符号化することとを備える、方法。
［２２］前記ＶＳＰモードを示す前記データを生成することが、前記現在のブロックに対する前記参照インデックスがビュー間参照ピクチャに対応するときだけ、ブロックレベルにおけるＶＳＰフラグを生成することを備える、［２１］に記載の方法。
［２３］前記ブロックレベルが、前記現在のブロックがマクロブロックであるときにマクロブロックレベルであるか、又は前記現在のブロックがマクロブロック区分であるときにマクロブロック区分レベルである、［２２］に記載の方法。
［２４］前記現在のブロックを符号化するためにビュー合成参照ピクチャの参照インデックスの指示を含まないスライスヘッダを符号化することを更に備える、［２１］に記載の方法。
［２５］前記現在のブロックに対する前記ＶＳＰモードを示す前記データを生成することが、前記現在のブロックに対する前記参照インデックスが、参照ピクチャリストゼロ中のピクチャに対応するときだけ、前記データを生成することを備える、［２１］に記載の方法。
［２６］前記現在のブロックに対する前記ＶＳＰモードを示す前記データを生成することが、前記現在のブロックに対する前記参照インデックスが、第１の参照ピクチャリスト及び第２の参照ピクチャリストのうちの１つの中のピクチャに対応するときに、前記データを生成することを備える、［２１］に記載の方法。
［２７］前記ＶＳＰモード及び第２のＶＳＰモードのうちの１つを実行するかどうかを示すデータを符号化することを更に備え、ここにおいて、前記第２のＶＳＰモードを実行することが、ビュー合成参照ピクチャの参照ピクチャインデックスに基づいて前記ビュー合成参照ピクチャを決定することを備える、［２１］に記載の方法。
［２８］前記ビュー間参照ピクチャからビュー合成参照ピクチャを決定することと、ビュー合成予測ピクチャを参照ピクチャリストに追加することと、ここにおいて、参照ピクチャリスト修正プロセスは、前記ビュー合成予測ピクチャを並べ替えるために使用されない、前記ビュー合成参照ピクチャに対して前記現在のブロックを符号化することとを更に備える、［２１］に記載の方法。
［２９］前記ビュー間参照ピクチャが参照ピクチャリストゼロ中に含まれるときだけ、前記ビュー間参照ピクチャからビュー合成参照ピクチャを合成することを更に備える、［２１］に記載の方法。
［３０］前記ビュー間参照ピクチャが参照ピクチャリスト１中に含まれるときだけ、前記ビュー間参照ピクチャからビュー合成参照ピクチャを合成することを更に備える、［２１］に記載の方法。
［３１］ビデオデータを符号化するための装置であって、現在のブロックを含むビデオデータを記憶するメモリと、現在のブロックに対する参照インデックスがビュー間参照ピクチャに対応するかどうかを決定すること、前記現在のブロックに対する前記参照インデックスが、前記ビュー間参照ピクチャに対応するときに、前記現在のブロックのビュー合成予測（ＶＳＰ）モードを示すデータを生成すること、ここにおいて、前記参照インデックスに対する前記ＶＳＰモードは、前記現在のブロックが前記ビュー間参照ピクチャからビュー合成予測を用いて予測されるかどうかを示す、及びビットストリーム中の前記ＶＳＰモードを示す前記データを符号化することを行うように構成された１つ以上のプロセッサとを備える、装置。
［３２］前記ＶＳＰモードを示す前記データを生成するために、前記現在のブロックに対する前記参照インデックスがビュー間参照ピクチャに対応するときだけ、前記１つ以上のプロセッサが、ブロックレベルにおけるＶＳＰフラグを生成するように構成される、［３１］に記載の装置。
［３３］前記ブロックレベルが、前記現在のブロックがマクロブロックであるときにマクロブロックレベルであるか、又は前記現在のブロックがマクロブロック区分であるときにマクロブロック区分レベルである、［３２］に記載の装置。
［３４］前記１つ以上のプロセッサが、前記現在のブロックを符号化するためにビュー合成参照ピクチャの参照インデックスの指示を含まないスライスヘッダを符号化するように更に構成される、［３１］に記載の装置。
［３５］前記現在のブロックに対する前記参照インデックスが、参照ピクチャリストゼロ中のピクチャに対応するときだけ、前記１つ以上のプロセッサが、前記現在のブロックに対する前記ＶＳＰモードを示す前記データを生成するように構成される、［３１］に記載の装置。
［３６］前記現在のブロックに対する前記参照インデックスが、第１の参照ピクチャリスト及び第２の参照ピクチャリストのうちの１つの中のピクチャに対応するときに、前記１つ以上のプロセッサが、前記現在のブロックに対する前記ＶＳＰモードを示す前記データを生成するように構成される、［３１］に記載の装置。
［３７］前記１つ以上のプロセッサが、前記ＶＳＰモード及び第２のＶＳＰモードのうちの１つを実行するかどうかを示すデータを符号化するように更に構成され、前記第２のＶＳＰモードを実行するために、前記１つ以上のプロセッサが、ビュー合成参照ピクチャの参照ピクチャインデックスに基づいて前記ビュー合成参照ピクチャを決定するように構成される、［３１］に記載の装置。
［３８］前記１つ以上のプロセッサが、前記ビュー間参照ピクチャからビュー合成参照ピクチャを決定することと、ビュー合成予測ピクチャを参照ピクチャリストに追加することと、ここにおいて、参照ピクチャリスト修正プロセスは、前記ビュー合成予測ピクチャを並べ替えるために使用されない、前記ビュー合成参照ピクチャに対して前記現在のブロックを符号化することとを行うように更に構成される、［３１］に記載の装置。
［３９］前記１つ以上のプロセッサが、前記ビュー間参照ピクチャが参照ピクチャリストゼロ中に含まれるときだけ、前記ビュー間参照ピクチャからビュー合成参照ピクチャを合成するように更に構成される、［３１］に記載の装置。
［４０］前記１つ以上のプロセッサが、前記ビュー間参照ピクチャが参照ピクチャリスト１中に含まれるときだけ、前記ビュー間参照ピクチャからビュー合成参照ピクチャを合成するように更に構成される、［３１］に記載の装置。
［４１］命令が記憶された非一時的コンピュータ可読媒体であって、前記命令が、実行されると、１つ以上のプロセッサに、現在のブロックに対する参照インデックスがビュー間参照ピクチャに対応するかどうかを決定することと、前記現在のブロックに対する前記参照インデックスが、前記ビュー間参照ピクチャに対応するときに、前記現在のブロックのビュー合成予測（ＶＳＰ）モードを示すデータをコード化することとを行わせ、ここにおいて、前記参照インデックスに対する前記ＶＳＰモードは、前記現在のブロックが前記ビュー間参照ピクチャからビュー合成予測を用いて予測されるかどうかを示す、非一時的コンピュータ可読媒体。
［４２］前記ＶＳＰモードを示す前記データをコード化することが、前記現在のブロックに対する前記参照インデックスがビュー間参照ピクチャに対応するときだけ、ブロックレベルにおけるＶＳＰフラグをコード化することを備える、［４１］に記載の非一時的コンピュータ可読媒体。
［４３］前記ブロックレベルが、前記現在のブロックがマクロブロックであるときにマクロブロックレベルであるか、又は前記現在のブロックがマクロブロック区分であるときにマクロブロック区分レベルである、［４２］に記載の非一時的コンピュータ可読媒体。
［４４］ビデオデータをコード化するための装置であって、現在のブロックに対する参照インデックスがビュー間参照ピクチャに対応するかどうかを決定するための手段と、前記現在のブロックに対する前記参照インデックスが、前記ビュー間参照ピクチャに対応するときに、前記現在のブロックのビュー合成予測（ＶＳＰ）モードを示すデータをコード化するための手段とを備え、ここにおいて、前記参照インデックスに対する前記ＶＳＰモードは、前記現在のブロックが前記ビュー間参照ピクチャからビュー合成予測を用いて予測されるかどうかを示す、装置。
［４５］前記ＶＳＰモードを示す前記データをコード化するための前記手段が、前記現在のブロックに対する前記参照インデックスがビュー間参照ピクチャに対応するときだけ、ブロックレベルにおけるＶＳＰフラグをコード化するための手段を備える、［４４］に記載の装置。
［４６］前記ブロックレベルが、前記現在のブロックがマクロブロックであるときにマクロブロックレベルであるか、又は前記現在のブロックがマクロブロック区分であるときにマクロブロック区分レベルである、［４５］に記載の装置。

Claims

ビデオデータを復号する方法であって、
現在のブロックに対する参照インデックスがビュー間参照ピクチャに対応するかどうかを決定することと、
前記現在のブロックに対する前記参照インデックスが、前記ビュー間参照ピクチャに対応するときに、前記現在のブロックのビュー合成予測（ＶＳＰ）モードを示すデータを、符号化されたビットストリームから取得することとを備え、ここにおいて、前記参照インデックスに対する前記ＶＳＰモードは、前記現在のブロックが前記ビュー間参照ピクチャからビュー合成予測を用いて予測されるかどうかを示す、方法。
前記ＶＳＰモードを示す前記データを取得することが、前記現在のブロックに対する前記参照インデックスがビュー間参照ピクチャに対応するときだけ、ブロックレベルにおけるＶＳＰフラグを取得することを備える、請求項１に記載の方法。
前記ブロックレベルが、前記現在のブロックがマクロブロックであるときにマクロブロックレベルであるか、又は前記現在のブロックがマクロブロック区分であるときにマクロブロック区分レベルである、請求項２に記載の方法。
前記現在のブロックを復号するためにビュー合成参照ピクチャの参照インデックスの指示を含まないスライスヘッダを復号することを更に備える、請求項１に記載の方法。
前記現在のブロックに対する前記参照インデックスが、参照ピクチャリストゼロ中のピクチャに対応するときだけ、前記現在のブロックに対する前記ＶＳＰモードを示す前記データが取得される、請求項１に記載の方法。
前記現在のブロックに対する前記参照インデックスが、第１の参照ピクチャリスト及び第２の参照ピクチャリストのうちの１つの中のピクチャに対応するときに、前記現在のブロックに対する前記ＶＳＰモードを示す前記データが取得される、請求項１に記載の方法。
前記ＶＳＰモード及び第２のＶＳＰモードのうちの１つを実行するかどうかを示すデータを、符号化されたビットストリームから取得することを更に備え、ここにおいて、前記第２のＶＳＰモードを実行することが、ビュー合成参照ピクチャの参照ピクチャインデックスに基づいて前記ビュー合成参照ピクチャを決定することを備える、請求項１に記載の方法。
前記ビュー間参照ピクチャからビュー合成参照ピクチャを決定することと、
ビュー合成予測ピクチャを参照ピクチャリストに追加することと、ここにおいて、参照ピクチャリスト修正プロセスは、前記ビュー合成予測ピクチャを並べ替えるために使用されない、
前記ビュー合成参照ピクチャに対して前記現在のブロックを復号することとを更に備える、請求項１に記載の方法。
前記ビュー間参照ピクチャが参照ピクチャリストゼロ中に含まれるときだけ、前記ビュー間参照ピクチャからビュー合成参照ピクチャを合成することを更に備える、請求項１に記載の方法。
前記ビュー間参照ピクチャが参照ピクチャリスト１中に含まれるときだけ、前記ビュー間参照ピクチャからビュー合成参照ピクチャを合成することを更に備える、請求項１に記載の方法。
ビデオデータを復号するための装置であって、
現在のブロックを含むビデオデータを記憶するメモリと、
前記現在のブロックに対する参照インデックスがビュー間参照ピクチャに対応するかどうかを決定すること、及び
前記現在のブロックに対する前記参照インデックスが、前記ビュー間参照ピクチャに対応するときに、前記現在のブロックのビュー合成予測（ＶＳＰ）モードを示すデータを、符号化されたビットストリームから取得することを行うように構成された１つ以上のプロセッサとを備え、ここにおいて、前記参照インデックスに対する前記ＶＳＰモードは、前記現在のブロックが前記ビュー間参照ピクチャからビュー合成予測を用いて予測されるかどうかを示す、装置。
前記ＶＳＰモードを示す前記データを取得するために、前記現在のブロックに対する前記参照インデックスがビュー間参照ピクチャに対応するときだけ、前記１つ以上のプロセッサが、ブロックレベルにおけるＶＳＰフラグを取得するように構成される、請求項１１に記載の装置。
前記ブロックレベルが、前記現在のブロックがマクロブロックであるときにマクロブロックレベルであるか、又は前記現在のブロックがマクロブロック区分であるときにマクロブロック区分レベルである、請求項１２に記載の装置。
前記１つ以上のプロセッサが、前記現在のブロックを復号するためにビュー合成参照ピクチャの参照インデックスの指示を含まないスライスヘッダを復号するように更に構成される、請求項１１に記載の装置。
前記現在のブロックに対する前記参照インデックスが、参照ピクチャリストゼロ中のピクチャに対応するときだけ、前記１つ以上のプロセッサが、前記現在のブロックに対する前記ＶＳＰモードを示す前記データを取得するように構成される、請求項１１に記載の装置。
前記現在のブロックに対する前記参照インデックスが、第１の参照ピクチャリスト及び第２の参照ピクチャリストのうちの１つの中のピクチャに対応するときに、前記１つ以上のプロセッサが、前記現在のブロックに対する前記ＶＳＰモードを示す前記データを取得するように構成される、請求項１１に記載の装置。
前記１つ以上のプロセッサが、前記ＶＳＰモード及び第２のＶＳＰモードのうちの１つを実行するかどうかを示すデータを、符号化されたビットストリームから取得するように更に構成され、前記第２のＶＳＰモードを実行するために、前記１つ以上のプロセッサが、前記ビュー合成参照ピクチャの参照ピクチャインデックスに基づいてビュー合成参照ピクチャを決定するように構成される、請求項１１に記載の装置。
前記１つ以上のプロセッサが、
前記ビュー間参照ピクチャからビュー合成参照ピクチャを決定することと、
前記ビュー合成予測ピクチャを参照ピクチャリストに追加することと、ここにおいて、参照ピクチャリスト修正プロセスは、前記ビュー合成予測ピクチャを並べ替えるために使用されない、
前記ビュー合成参照ピクチャに対して前記現在のブロックを復号することとを行うように更に構成される、請求項１１に記載の装置。
前記１つ以上のプロセッサが、前記ビュー間参照ピクチャが参照ピクチャリストゼロ中に含まれるときだけ、前記ビュー間参照ピクチャからビュー合成参照ピクチャを合成するように更に構成される、請求項１１に記載の装置。
前記１つ以上のプロセッサが、前記ビュー間参照ピクチャが参照ピクチャリスト１中に含まれるときだけ、前記ビュー間参照ピクチャからビュー合成参照ピクチャを合成するように更に構成される、請求項１１に記載の装置。
ビデオデータを符号化する方法であって、
現在のブロックに対する参照インデックスがビュー間参照ピクチャに対応するかどうかを決定することと、
前記現在のブロックに対する前記参照インデックスが、前記ビュー間参照ピクチャに対応するときに、前記現在のブロックのビュー合成予測（ＶＳＰ）モードを示すデータを生成することと、ここにおいて、前記参照インデックスに対する前記ＶＳＰモードは、前記現在のブロックが前記ビュー間参照ピクチャからビュー合成予測を用いて予測されるかどうかを示す、
ビットストリーム中の前記ＶＳＰモードを示す前記データを符号化することとを備える、方法。
前記ＶＳＰモードを示す前記データを生成することが、前記現在のブロックに対する前記参照インデックスがビュー間参照ピクチャに対応するときだけ、ブロックレベルにおけるＶＳＰフラグを生成することを備える、請求項２１に記載の方法。
前記ブロックレベルが、前記現在のブロックがマクロブロックであるときにマクロブロックレベルであるか、又は前記現在のブロックがマクロブロック区分であるときにマクロブロック区分レベルである、請求項２２に記載の方法。
前記現在のブロックを符号化するためにビュー合成参照ピクチャの参照インデックスの指示を含まないスライスヘッダを符号化することを更に備える、請求項２１に記載の方法。
前記現在のブロックに対する前記ＶＳＰモードを示す前記データを生成することが、前記現在のブロックに対する前記参照インデックスが、参照ピクチャリストゼロ中のピクチャに対応するときだけ、前記データを生成することを備える、請求項２１に記載の方法。
前記現在のブロックに対する前記ＶＳＰモードを示す前記データを生成することが、前記現在のブロックに対する前記参照インデックスが、第１の参照ピクチャリスト及び第２の参照ピクチャリストのうちの１つの中のピクチャに対応するときに、前記データを生成することを備える、請求項２１に記載の方法。
前記ＶＳＰモード及び第２のＶＳＰモードのうちの１つを実行するかどうかを示すデータを符号化することを更に備え、ここにおいて、前記第２のＶＳＰモードを実行することが、ビュー合成参照ピクチャの参照ピクチャインデックスに基づいて前記ビュー合成参照ピクチャを決定することを備える、請求項２１に記載の方法。
前記ビュー間参照ピクチャからビュー合成参照ピクチャを決定することと、
ビュー合成予測ピクチャを参照ピクチャリストに追加することと、ここにおいて、参照ピクチャリスト修正プロセスは、前記ビュー合成予測ピクチャを並べ替えるために使用されない、
前記ビュー合成参照ピクチャに対して前記現在のブロックを符号化することとを更に備える、請求項２１に記載の方法。
前記ビュー間参照ピクチャが参照ピクチャリストゼロ中に含まれるときだけ、前記ビュー間参照ピクチャからビュー合成参照ピクチャを合成することを更に備える、請求項２１に記載の方法。
前記ビュー間参照ピクチャが参照ピクチャリスト１中に含まれるときだけ、前記ビュー間参照ピクチャからビュー合成参照ピクチャを合成することを更に備える、請求項２１に記載の方法。
ビデオデータを符号化するための装置であって、
現在のブロックを含むビデオデータを記憶するメモリと、
現在のブロックに対する参照インデックスがビュー間参照ピクチャに対応するかどうかを決定すること、
前記現在のブロックに対する前記参照インデックスが、前記ビュー間参照ピクチャに対応するときに、前記現在のブロックのビュー合成予測（ＶＳＰ）モードを示すデータを生成すること、ここにおいて、前記参照インデックスに対する前記ＶＳＰモードは、前記現在のブロックが前記ビュー間参照ピクチャからビュー合成予測を用いて予測されるかどうかを示す、及び
ビットストリーム中の前記ＶＳＰモードを示す前記データを符号化することを行うように構成された１つ以上のプロセッサとを備える、装置。
前記ＶＳＰモードを示す前記データを生成するために、前記現在のブロックに対する前記参照インデックスがビュー間参照ピクチャに対応するときだけ、前記１つ以上のプロセッサが、ブロックレベルにおけるＶＳＰフラグを生成するように構成される、請求項３１に記載の装置。
前記ブロックレベルが、前記現在のブロックがマクロブロックであるときにマクロブロックレベルであるか、又は前記現在のブロックがマクロブロック区分であるときにマクロブロック区分レベルである、請求項３２に記載の装置。
前記１つ以上のプロセッサが、前記現在のブロックを符号化するためにビュー合成参照ピクチャの参照インデックスの指示を含まないスライスヘッダを符号化するように更に構成される、請求項３１に記載の装置。
前記現在のブロックに対する前記参照インデックスが、参照ピクチャリストゼロ中のピクチャに対応するときだけ、前記１つ以上のプロセッサが、前記現在のブロックに対する前記ＶＳＰモードを示す前記データを生成するように構成される、請求項３１に記載の装置。
前記現在のブロックに対する前記参照インデックスが、第１の参照ピクチャリスト及び第２の参照ピクチャリストのうちの１つの中のピクチャに対応するときに、前記１つ以上のプロセッサが、前記現在のブロックに対する前記ＶＳＰモードを示す前記データを生成するように構成される、請求項３１に記載の装置。
前記１つ以上のプロセッサが、前記ＶＳＰモード及び第２のＶＳＰモードのうちの１つを実行するかどうかを示すデータを符号化するように更に構成され、前記第２のＶＳＰモードを実行するために、前記１つ以上のプロセッサが、ビュー合成参照ピクチャの参照ピクチャインデックスに基づいて前記ビュー合成参照ピクチャを決定するように構成される、請求項３１に記載の装置。
前記１つ以上のプロセッサが、
前記ビュー間参照ピクチャからビュー合成参照ピクチャを決定することと、
ビュー合成予測ピクチャを参照ピクチャリストに追加することと、ここにおいて、参照ピクチャリスト修正プロセスは、前記ビュー合成予測ピクチャを並べ替えるために使用されない、
前記ビュー合成参照ピクチャに対して前記現在のブロックを符号化することとを行うように更に構成される、請求項３１に記載の装置。
前記１つ以上のプロセッサが、前記ビュー間参照ピクチャが参照ピクチャリストゼロ中に含まれるときだけ、前記ビュー間参照ピクチャからビュー合成参照ピクチャを合成するように更に構成される、請求項３１に記載の装置。
前記１つ以上のプロセッサが、前記ビュー間参照ピクチャが参照ピクチャリスト１中に含まれるときだけ、前記ビュー間参照ピクチャからビュー合成参照ピクチャを合成するように更に構成される、請求項３１に記載の装置。
命令が記憶された非一時的コンピュータ可読媒体であって、前記命令が、実行されると、１つ以上のプロセッサに、
現在のブロックに対する参照インデックスがビュー間参照ピクチャに対応するかどうかを決定することと、
前記現在のブロックに対する前記参照インデックスが、前記ビュー間参照ピクチャに対応するときに、前記現在のブロックのビュー合成予測（ＶＳＰ）モードを示すデータをコード化することとを行わせ、ここにおいて、前記参照インデックスに対する前記ＶＳＰモードは、前記現在のブロックが前記ビュー間参照ピクチャからビュー合成予測を用いて予測されるかどうかを示す、非一時的コンピュータ可読媒体。
前記ＶＳＰモードを示す前記データをコード化することが、前記現在のブロックに対する前記参照インデックスがビュー間参照ピクチャに対応するときだけ、ブロックレベルにおけるＶＳＰフラグをコード化することを備える、請求項４１に記載の非一時的コンピュータ可読媒体。
前記ブロックレベルが、前記現在のブロックがマクロブロックであるときにマクロブロックレベルであるか、又は前記現在のブロックがマクロブロック区分であるときにマクロブロック区分レベルである、請求項４２に記載の非一時的コンピュータ可読媒体。
ビデオデータをコード化するための装置であって、
現在のブロックに対する参照インデックスがビュー間参照ピクチャに対応するかどうかを決定するための手段と、
前記現在のブロックに対する前記参照インデックスが、前記ビュー間参照ピクチャに対応するときに、前記現在のブロックのビュー合成予測（ＶＳＰ）モードを示すデータをコード化するための手段とを備え、ここにおいて、前記参照インデックスに対する前記ＶＳＰモードは、前記現在のブロックが前記ビュー間参照ピクチャからビュー合成予測を用いて予測されるかどうかを示す、装置。
前記ＶＳＰモードを示す前記データをコード化するための前記手段が、前記現在のブロックに対する前記参照インデックスがビュー間参照ピクチャに対応するときだけ、ブロックレベルにおけるＶＳＰフラグをコード化するための手段を備える、請求項４４に記載の装置。
前記ブロックレベルが、前記現在のブロックがマクロブロックであるときにマクロブロックレベルであるか、又は前記現在のブロックがマクロブロック区分であるときにマクロブロック区分レベルである、請求項４５に記載の装置。