JP2016517682A

JP2016517682A - ３ｄビデオコーディングにおける視差ベクトル導出および動きベクトル予測の簡略化

Info

Publication number: JP2016517682A
Application number: JP2016504336A
Authority: JP
Inventors: ティルマライ、ビジャヤラグハバン; ジャン、リ; チェン、イン; カークゼウィックズ、マルタ
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2013-03-18
Filing date: 2014-03-18
Publication date: 2016-06-16
Anticipated expiration: 2034-03-18
Also published as: KR102180859B1; WO2014153340A3; KR102185025B1; US9900576B2; WO2014153343A2; HUE049461T2; ES2796824T3; ES2736280T3; CN105191319A; JP6768503B2; JP6768502B2; KR20150131220A; EP2976884B1; JP2019068447A; EP2976885A2; US9596448B2; WO2014153340A2; JP6768768B2; EP2976884A2; CN105052146A

Abstract

ビデオコーダは、第１のテクスチャビュー、第１の深度ビュー、第２のテクスチャビュー、および第２の深度ビューに対して、テクスチャ優先コーディングを実行することと、第２のテクスチャビューのマクロブロックについて、マクロブロックに対応する第１の深度ビューの深度ブロックの位置を特定することと、深度ブロックの少なくとも１つの深度値に基づいて、マクロブロックのための視差ベクトルを導出することと、導出された視差ベクトルに基づいて、マクロブロックの第１のサブブロックをコーディングすることと、導出された視差ベクトルに基づいて、マクロブロックの第２のサブブロックをコーディングすることとを行うように構成され得る。

Description

[0001]本出願は、各々の内容全体が参照により本明細書に組み込まれる、２０１３年３月１８日に出願された米国仮出願第６１／８０３，１００号、２０１３年４月１日に出願された米国仮出願第６１／８０７，２８１号の利益を主張する。

[0002]本開示は、ビデオ符号化および復号に関する。

[0003]デジタルビデオ機能は、デジタルテレビジョン、デジタルダイレクトブロードキャストシステム、ワイヤレスブロードキャストシステム、携帯情報端末（ＰＤＡ）、ラップトップまたはデスクトップコンピュータ、デジタルカメラ、デジタル記録デバイス、デジタルメディアプレーヤ、ビデオゲームデバイス、ビデオゲームコンソール、携帯電話または衛星無線電話、ビデオ遠隔会議デバイスなどを含む、広範囲にわたるデバイスに組み込まれ得る。デジタルビデオデバイスは、デジタルビデオ情報をより効率的に送信、受信および記憶するための、ＭＰＥＧ−２、ＭＰＥＧ−４、ＩＴＵ−ＴＨ．２６３、ＩＴＵ−ＴＨ．２６４／ＭＰＥＧ−４、Ｐａｒｔ１０、アドバンストビデオコーディング（ＡＶＣ：Advanced Video Coding）によって定義された規格、現在開発中の高効率ビデオコーディング（ＨＥＶＣ：High Efficiency Video Coding）規格、およびそのような規格の拡張に記載されているビデオ圧縮技法など、ビデオ圧縮技法を実装する。

[0004]Ｈ．２６４／ＡＶＣを含む前述の規格のうちのいくつかの拡張は、ステレオまたは３次元（「３Ｄ」）ビデオを生成するためにマルチビュービデオコーディング用の技法を提供し得る。具体的には、マルチビューコーディング用の技法は、（Ｈ．２６４／ＡＶＣに対するスケーラブル拡張である）スケーラブルビデオコーディング（ＳＶＣ）規格、および（Ｈ．２６４／ＡＶＣに対するマルチビュー拡張になった）マルチビュービデオコーディング（ＭＶＣ）規格とともに、ＡＶＣにおいて使用するために提案されている。

[0005]一般に、ステレオビデオは、２つのビュー、たとえば、左ビューと右ビューとを使用して実現される。左ビューのピクチャは右ビューのピクチャと実質的に同時に表示されて、３次元ビデオ効果が実現され得る。たとえば、ユーザは、左ビューを右ビューからフィルタ処理する偏光パッシブ眼鏡を着用し得る。代替的に、２つのビューのピクチャは高速で連続して示され得、ユーザは、同じ頻度で、ただし位相が９０度シフトして左眼と右眼とを迅速に閉じるアクティブ眼鏡を着用し得る。

[0006]概して、本開示では、３Ｄビデオコーディング用の技法について説明する。詳細には、本開示は、視差ベクトルを導出するための技法に関する。

[0007]一例では、３次元（３Ｄ）ビデオデータをコーディングする方法は、第１のテクスチャビュー、第１の深度ビュー、第２のテクスチャビュー、および第２の深度ビューに対して、テクスチャ優先コーディングを実行することと、第２のテクスチャビューのマクロブロックについて、マクロブロックに対応する第１の深度ビューの深度ブロックの位置を特定することと、深度ブロックの少なくとも１つの深度値に基づいて、マクロブロックのための視差ベクトルを導出することと、導出された視差ベクトルに基づいて、マクロブロックの第１のサブブロックをコーディングすることと、導出された視差ベクトルに基づいて、マクロブロックの第２のサブブロックをコーディングすることとを含む。

[0008]別の例では、ビデオデータをコーディングするためのデバイスは、第１のテクスチャビュー、第１の深度ビュー、第２のテクスチャビュー、および第２の深度ビューに対して、テクスチャ優先コーディングを実行することと、第２のテクスチャビューのマクロブロックについて、マクロブロックに対応する第１の深度ビューの深度ブロックの位置を特定することと、深度ブロックの少なくとも１つの深度値に基づいて、マクロブロックのための視差ベクトルを導出することと、導出された視差ベクトルに基づいて、マクロブロックの第１のサブブロックをコーディングすることと、導出された視差ベクトルに基づいて、マクロブロックの第２のサブブロックをコーディングすることとを行うように構成されたビデオコーダを含む。

[0009]別の例では、３次元（３Ｄ）ビデオデータをコーディングするためのデバイスは、第１のテクスチャビュー、第１の深度ビュー、第２のテクスチャビュー、および第２の深度ビューに対して、テクスチャ優先コーディングを実行するための手段と、第２のテクスチャビューのマクロブロックについて、マクロブロックに対応する第１の深度ビューの深度ブロックの位置を特定するための手段と、深度ブロックの少なくとも１つの深度値に基づいて、マクロブロックのための視差ベクトルを導出するための手段と、導出された視差ベクトルに基づいて、マクロブロックの第１のサブブロックをコーディングするための手段と、導出された視差ベクトルに基づいて、マクロブロックの第２のサブブロックをコーディングするための手段とを含む。

[0010]別の例では、１つまたは複数のプロセッサによって実行されたとき、１つまたは複数のプロセッサに、第１のテクスチャビュー、第１の深度ビュー、第２のテクスチャビュー、および第２の深度ビューに対して、テクスチャ優先コーディングを実行することと、第２のテクスチャビューのマクロブロックについて、マクロブロックに対応する第１の深度ビューの深度ブロックの位置を特定することと、深度ブロックの少なくとも１つの深度値に基づいて、マクロブロックのための視差ベクトルを導出することと、導出された視差ベクトルに基づいて、マクロブロックの第１のサブブロックをコーディングすることと、導出された視差ベクトルに基づいて、マクロブロックの第２のサブブロックをコーディングすることとを行わせる命令を記憶する、コンピュータ可読記憶媒体。

[0011]１つまたは複数の例の詳細が、添付の図面および以下の説明に記載されている。他の特徴、目的、および利点は、その説明および図面から、ならびに特許請求の範囲から明らかになろう。

[0012]本開示で説明される技法を利用し得る例示的なビデオ符号化および復号システムを示すブロック図。 [0013]例示的なマルチビュー復号順序を示す概念図。 [0014]マルチビューコーディングのための例示的な予測構造を示す概念図。 [0015]後方ワーピングに基づくブロックベースビュー合成予測の概念の視覚化の図。 [0016]隣接ブロック視差ベクトル導出のために使用される空間隣接ブロックを示す概念図。 [0017]隣接ブロックを使用する後方ビュー合成予測（ＢＶＳＰ：backward view synthesis prediction）に関する技法を示す概念図。 [0018]本開示の技法による視差ベクトルを導出するために使用され得る深度ボックの一例を示す図。 [0019]本開示で説明される技法を実装し得る例示的なビデオエンコーダを示すブロック図。 [0020]本開示で説明される技法を実装し得る例示的なビデオデコーダを示すブロック図。 [0021]本開示で説明される技法による視差ベクトル導出およびインター予測コーディングの例示的な動作を示すフローチャート。 [0022]本開示で説明される技法による視差ベクトル導出およびインター予測コーディングの別の例示的な動作を示すフローチャート。

[0023]本開示は、視差ベクトル導出に関する技法について説明し、より詳細には、本開示は、ビデオコーダ（たとえば、ビデオエンコーダまたはビデオデコーダ）が３次元（３Ｄ）ビデオコーディングにおける使用のために現在のビューの現在のピクチャ内の現在のブロックのための視差ベクトルを導出する技法について説明する。ビデオコーダは、異なるビュー中の対応するブロックの位置を特定するために、視差ベクトルを使用し得る。このようにして、視差ベクトルは、２つの異なるビュー中の２つの同様のビデオブロック間の視差を表し得る。以下でより詳細に説明されるように、ビデオコーダは、視差動きベクトルとして視差ベクトルを使用することができ、現在のブロックは、視差動きベクトルによって位置を特定されるブロックに基づいて予測され得る。ビデオコーダはまた、他の目的のためにも視差ベクトルを使用し得る。一例として、ビデオコーダは、別のビュー中の対応するブロックの位置を特定するために視差ベクトルを使用し、次いで、現在のブロックの動き情報を決定するために、位置を特定されたブロックの動き情報を使用し得る。その上、視差ベクトルのためのさらに他の使用があり得る。本開示では、「現在の」という用語は、概して、現在コーディングされているビュー、ピクチャ、またはブロックを指すために使用される。したがって、現在のブロックは、概して、すでにコーディングされたブロックとは対照的に、または、まだコーディングされていないブロックとは対照的に、コーディングされているビデデータのブロックを表す。

[0024]現在のピクチャの現在のブロックのための視差ベクトルは、現在のピクチャとは異なるビュー中である対応するピクチャ中の対応するブロックを指すベクトルである。したがって、視差ベクトルを使用して、ビデオコーダは、対応するピクチャ中で、現在のピクチャの現在のブロックに対応するブロックの位置を特定することができる。この場合、対応するピクチャは、現在のピクチャと同じ時間インスタンスのものであるが、異なるビュー中にあるピクチャである。対応するピクチャ中の対応するブロックおよび現在のピクチャ中の現在のブロックは、同様のビデオコンテンツを含み得るが、現在のピクチャ中の現在のブロックのロケーションと対応するピクチャ中の対応するブロックのロケーションとの間に少なくとも水平視差がある。現在のブロックの視差ベクトルは、対応するピクチャ中のブロックと現在のピクチャ中の現在のブロックとの間のこの水平視差の測度を提供する。いくつかの事例では、対応するピクチャ内のブロックのロケーションと現在のピクチャ内の現在のブロックのロケーションとの間に垂直視差もあり得るが、多くの事例では、垂直視差はゼロになる。現在のブロックの視差ベクトルはまた、対応するピクチャ中のブロックと現在のピクチャ中の現在のブロックとの間のこの垂直視差の測度を提供し得る。視差ベクトルは、２つの成分（ｘ成分およびｙ成分）を含んでいるが、多くの事例では、垂直成分はゼロに等しくなる。現在のビューの現在のピクチャおよび異なるビューの対応するピクチャが表示される時間は、同じであってよく、すなわち、現在のピクチャおよび対応するピクチャは、同じ時間インスタンスのピクチャである。

[0025]２Ｄビデオコーディングでは、フレームは、テクスチャビューコンポーネントまたは単にテクスチャと呼ばれることがある、１つのビューコンポーネントのみによって表される。いくつかのタイプの３Ｄビデオコーディングでは、テクスチャビューコンポーネントおよび深度ビューコンポーネント、または単にテクスチャおよび深度という、２つのビューコンポーネントがある。たとえば、各ビューは、テクスチャビューと深度ビューとを含み得、ただし、ビューは複数のビューコンポーネントを含み、たとえば、テクスチャビューは複数のテクスチャビューコンポーネントを含み、深度ビューは複数の深度ビューコンポーネントを含む。各テクスチャビューコンポーネントは、ビューのビューコンポーネントを形成するために、深度ビューコンポーネントに関連付けられる。深度ビューコンポーネントは、テクスチャビューコンポーネント中のオブジェクトの相対深度を表す。深度ビューコンポーネントおよびテクスチャビューコンポーネントは、別個に復号可能であり得る。

[0026]本開示は、視差ベクトルを導出するための技法について説明する。視差ベクトルを導出するための１つのそのような技法は、後方ビュー合成予測（ＢＶＳＰ）モードとともに使用され得る。ビデオコーダは、第１のテクスチャビューのブロックが、ＢＶＳＰモードを使用してコーディングされるべきであると決定し得る。ビデオコーダは、深度ビュー中で、第１のテクスチャビューのブロックに対応する深度ブロックの位置を特定し、深度ブロックの２つ以上の隅の位置のための深度値を決定し得る。深度値に基づいて、ビデオコーダは、ブロックのための視差ベクトルを導出し、視差ベクトルを使用して、第２のテクスチャビューのブロックの位置を特定し得る。ビデオコーダは、次いで、第２のテクスチャビューのブロックを使用して、第１のテクスチャビューのブロックをインター予測し得る。この点について、および、以下でより詳細に説明されるように、本開示の技法は、対応する深度ブロックの隅のサンプルのみを使用して、ＢＶＳＰモードにおける使用のために、視差ベクトルを決定することによって、視差ベクトル導出プロセスを簡略化し得る。

[0027]別の例示的な技法では、第１のビューのブロックについて、ビデオコーダは、第１のテクスチャビューのブロックに対応する深度ビュー中の深度ブロックの位置を特定し、深度ブロックの少なくとも１つの深度値に基づいて、第１のテクスチャビューのブロックのための視差ベクトルを導出し得る。ビデオコーダは、次いで、導出された視差ベクトルに基づいて、ブロックの第１のサブブロックをコーディングし、同じ導出された視差ベクトルに基づいて、マクロブロックの第２のサブブロックをコーディングし得る。この点について、および、以下でより詳細に説明されるように、本開示の技法は、ブロックのための１つの視差ベクトルを導出し、そのブロックの２つ以上のサブブロックのためにその視差を使用することによって、視差ベクトル導出プロセスを簡略化し得る。特定のサブブロックについて指定されたコーディングモードに応じて、ビデオコーダは、導出された視差ベクトルを視差動きベクトルとして使用することができ、または、異なるビュー中の対応するブロックを識別するために、視差ベクトルを使用し、その対応するブロックから、サブブロックを予測するための動き情報を決定することができる。

[0028]図１は、本開示で説明される視差ベクトル導出のための技法を実行するように構成され得る、例示的なビデオ符号化および復号システム１０を示すブロック図である。図１に示されるように、システム１０は、宛先デバイス１４によって後の時間で復号されるべき符号化されたビデオデータを生成するソースデバイス１２を含む。ソースデバイス１２および宛先デバイス１４は、デスクトップコンピュータ、ノートブック（すなわち、ラップトップ）コンピュータ、タブレットコンピュータ、セットトップボックス、いわゆる「スマート」フォンなどの電話ハンドセット、いわゆる「スマート」パッド、テレビジョン、カメラ、ディスプレイデバイス、デジタルメディアプレーヤ、ビデオゲームコンソール、ビデオストリーミングデバイスなどを含む、広範囲にわたるデバイスのいずれかを備え得る。場合によっては、ソースデバイス１２および宛先デバイス１４は、ワイヤレス通信のために装備され得る。

[0029]システム１０は、異なるビデオコーディング規格、プロプライエタリ規格、またはマルチビューコーディングの任意の他の方法に従って動作し得る。下記は、ビデオコーディング規格の数例について説明しており、限定と見なされるべきではない。ビデオコーディング規格は、ＩＴＵ−ＴＨ．２６１、ＩＳＯ／ＩＥＣＭＰＥＧ−１Ｖｉｓｕａｌ、ＩＴＵ−ＴＨ．２６２またはＩＳＯ／ＩＥＣＭＰＥＧ−２Ｖｉｓｕａｌ、ＩＴＵ−ＴＨ．２６３、ＩＳＯ／ＩＥＣＭＰＥＧ−４Ｖｉｓｕａｌ、およびそれのスケーラブルビデオコーディング（ＳＶＣ）拡張とマルチビュービデオコーディング（ＭＶＣ）拡張とを含む（ＩＳＯ／ＩＥＣＭＰＥＧ−４ＡＶＣとしても知られる）ＩＴＵ−ＴＨ．２６４を含む。ＭＶＣの最新のジョイントドラフトは、「Ａｄｖａｎｃｅｄｖｉｄｅｏｃｏｄｉｎｇｆｏｒｇｅｎｅｒｉｃａｕｄｉｏｖｉｓｕａｌｓｅｒｖｉｃｅｓ」、ＩＴＵ−Ｔ勧告Ｈ．２６４、２０１０年３月に記載されており、その内容全体は参照により本明細書に組み込まれる。ＭＶＣの別のジョイントドラフトは、「Ａｄｖａｎｃｅｄｖｉｄｅｏｃｏｄｉｎｇｆｏｒｇｅｎｅｒｉｃａｕｄｉｏｖｉｓｕａｌｓｅｒｖｉｃｅｓ」、ＩＴＵ−Ｔ勧告Ｈ．２６４、２０１１年６月に記載されており、その内容全体は参照により本明細書に組み込まれる。いくつかの追加のビデオコーディング規格には、ＡＶＣに基づく、ＭＶＣ＋Ｄおよび３Ｄ−ＡＶＣがある。加えて、新しいビデオコーディング規格、すなわち高効率ビデオコーディング（ＨＥＶＣ）が、ＩＴＵ−ＴＶｉｄｅｏＣｏｄｉｎｇＥｘｐｅｒｔｓＧｒｏｕｐ（ＶＣＥＧ）およびＩＳＯ／ＩＥＣＭｏｔｉｏｎＰｉｃｔｕｒｅＥｘｐｅｒｔｓＧｒｏｕｐ（ＭＰＥＧ）のＪｏｉｎｔＣｏｌｌａｂｏｒａｔｉｏｎＴｅａｍｏｎＶｉｄｅｏＣｏｄｉｎｇ（ＪＣＴ−ＶＣ）によって開発された。

[0030]単に例示のために、本開示で説明される技法は、３Ｄ−ＡＶＣなど、Ｈ．２６４規格による例とともに説明される。しかしながら、本開示で説明される技法は、これらの例示的な規格に限定されると見なされるべきではなく、マルチビューコーディングもしくは３Ｄビデオコーディングのための他のビデオコーディング規格（たとえば、３Ｄ−ＨＥＶＣ）、または必ずしも特定のビデオコーディング規格に基づくとは限らないマルチビューコーディングもしくは３Ｄビデオコーディングに関連する技法に拡張可能であり得る。たとえば、本開示で説明される技法は、マルチビューコーディングのためのビデオエンコーダ／デコーダ（コーデック）によって実装され、ここでマルチビューコーディングは、２つ以上のビューのコーディングを含む。

[0031]宛先デバイス１４は、リンク１６を介して、復号されるべき符号化されたビデオデータを受信し得る。リンク１６は、ソースデバイス１２から宛先デバイス１４に符号化されたビデオデータを移動することが可能な任意のタイプの媒体またはデバイスを備え得る。一例では、リンク１６は、ソースデバイス１２が、符号化されたビデオデータをリアルタイムで宛先デバイス１４に直接送信することを可能にするための通信媒体を備え得る。符号化されたビデオデータは、ワイヤレス通信プロトコルなどの通信規格に従って変調され、宛先デバイス１４に送信され得る。通信媒体は、高周波（ＲＦ）スペクトルあるいは１つまたは複数の物理伝送線路など、任意のワイヤレスまたはワイヤード通信媒体を備え得る。通信媒体は、ローカルエリアネットワーク、ワイドエリアネットワーク、またはインターネットなどのグローバルネットワークなど、パケットベースネットワークの一部を形成し得る。通信媒体は、ソースデバイス１２から宛先デバイス１４への通信を可能にするために有用であり得る、ルータ、スイッチ、基地局、または任意の他の機器を含み得る。

[0032]代替的に、符号化されたデータは、出力インターフェース２２からストレージデバイス３４に出力され得る。同様に、符号化されたデータは、入力インターフェースによってストレージデバイス３４からアクセスされ得る。ストレージデバイス３４は、ハードドライブ、Ｂｌｕ−ｒａｙ（登録商標）ディスク、ＤＶＤ、ＣＤ−ＲＯＭ、フラッシュメモリ、揮発性もしくは不揮発性メモリ、または符号化されたビデオデータを記憶するための任意の他の好適なデジタル記憶媒体など、様々な分散したまたはローカルでアクセスされるデータ記憶媒体のいずれかを含み得る。さらなる一例では、ストレージデバイス３４は、ソースデバイス１２によって生成された符号化されたビデオを保持できるファイルサーバまたは別の中間ストレージデバイスに対応し得る。宛先デバイス１４は、ストリーミングまたはダウンロードを介して、ストレージデバイス３４から、記憶されたビデオデータにアクセスし得る。ファイルサーバは、符号化されたビデオデータを記憶し、その符号化されたビデオデータを宛先デバイス１４に送信することが可能な任意のタイプのサーバとすることができる。例示的なファイルサーバとしては、（たとえば、ウェブサイト用の）ウェブサーバ、ＦＴＰサーバ、ネットワーク接続ストレージ（ＮＡＳ）デバイス、またはローカルディスクドライブがある。宛先デバイス１４は、インターネット接続を含む任意の標準的なデータ接続を通じて、符号化されたビデオデータにアクセスし得る。これは、ファイルサーバに記憶された符号化されたビデオデータにアクセスするのに適しているワイヤレスチャネル（たとえば、Ｗｉ−Ｆｉ（登録商標）接続）、ワイヤード接続（たとえば、ＤＳＬ、ケーブルモデムなど）、または両方の組合せを含み得る。ストレージデバイス３４からの符号化されたビデオデータの送信は、ストリーミング送信、ダウンロード送信、または両方の組合せであり得る。

[0033]視差ベクトル導出のための本開示の技法は、必ずしもワイヤレス適用例または設定に限定されるとは限らない。本技法は、オーバージエアテレビジョン放送、ケーブルテレビジョン送信、衛星テレビジョン送信、たとえばインターネットを介したストリーミングビデオ送信、データ記憶媒体に記憶するためのデジタルビデオの符号化、データ記憶媒体に記憶されたデジタルビデオの復号、または他の適用例のような、種々のマルチメディア適用例のいずれかをサポートするビデオコーディングに適用され得る。いくつかの例では、システム１０は、ビデオストリーミング、ビデオ再生、ビデオブロードキャスティング、および／またはビデオテレフォニーなどの適用例をサポートするために、一方向または双方向のビデオ送信をサポートするように構成され得る。

[0034]図１の例では、ソースデバイス１２は、ビデオソース１８と、ビデオエンコーダ２０と、出力インターフェース２２とを含む。場合によっては、出力インターフェース２２は、変調器／復調器（モデム）および／または送信機を含み得る。ソースデバイス１２において、ビデオソース１８は、ビデオキャプチャデバイス、たとえばビデオカメラ、以前にキャプチャされたビデオを含んでいるビデオアーカイブ、ビデオコンテンツプロバイダからビデオを受信するためのビデオフィードインターフェース、および／もしくはソースビデオとしてコンピュータグラフィックスデータを生成するためのコンピュータグラフィックスシステムのようなソース、またはそのようなソースの組合せを含み得る。一例として、ビデオソース１８がビデオカメラである場合、ソースデバイス１２および宛先デバイス１４は、いわゆるカメラフォンまたはビデオフォンを形成し得る。ただし、本開示で説明される技法は、概してビデオコーディングに適用可能であり得、ワイヤレスおよび／またはワイヤード適用例に適用され得る。

[0035]キャプチャされたビデオ、プリキャプチャされたビデオ、またはコンピュータにより生成されたビデオは、ビデオエンコーダ２０によって符号化され得る。符号化されたビデオデータは、ソースデバイス１２の出力インターフェース２２を介して宛先デバイス１４に直接送信され得る。符号化されたビデオデータは、さらに（または代替的に）、復号および／または再生のための宛先デバイス１４または他のデバイスによる後のアクセスのためにストレージデバイス３４上に記憶され得る。

[0036]宛先デバイス１４は、入力インターフェース２８と、ビデオデコーダ３０と、ディスプレイデバイス３２とを含む。場合によっては、入力インターフェース２８は、受信機および／またはモデムを含み得る。宛先デバイス１４の入力インターフェース２８は、リンク１６を介して、符号化されたビデオデータを受信する。リンク１６を介して通信され、またはストレージデバイス３４上に提供された符号化されたビデオデータは、ビデオデータを復号する際にビデオデコーダ３０などのビデオデコーダが使用するための、ビデオエンコーダ２０によって生成された様々なシンタックス要素を含み得る。そのようなシンタックス要素は、通信媒体上で送信され、記憶媒体上に記憶される符号化されたビデオデータとともに含まれ得、またはファイルサーバを記憶した。

[0037]ディスプレイデバイス３２は、宛先デバイス１４と一体であってよく、またはその外部にあり得る。いくつかの例では、宛先デバイス１４は、集積ディスプレイデバイスを含むことができ、また、外部ディスプレイデバイスとインターフェースするように構成され得る。他の例では、宛先デバイス１４はディスプレイデバイスであり得る。一般に、ディスプレイデバイス３２は、復号されたビデオデータをユーザに対して表示し、液晶ディスプレイ（ＬＣＤ）、プラズマディスプレイ、有機発光ダイオード（ＯＬＥＤ）ディスプレイ、または別のタイプのディスプレイデバイスなど、種々のディスプレイデバイスのいずれかを備え得る。

[0038]図１には示されないが、いくつかの態様では、ビデオエンコーダ２０およびビデオデコーダ３０は、それぞれオーディオエンコーダおよびオーディオデコーダと統合されてよく、共通のデータストリームまたは別個のデータストリーム中のオーディオとビデオの両方の符号化を処理するための、適切なＭＵＸ−ＤＥＭＵＸユニット、または他のハードウェアとソフトウェアとを含み得る。適用可能な場合、いくつかの例では、ＭＵＸ−ＤＥＭＵＸユニットは、ＩＴＵＨ．２２３マルチプレクサプロトコル、またはユーザデータグラムプロトコル（ＵＤＰ）などの他のプロトコルに準拠し得る。

[0039]ビデオエンコーダ２０およびビデオデコーダ３０はそれぞれ、１つまたは複数のマイクロプロセッサ、デジタル信号プロセッサ（ＤＳＰ）、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、ディスクリート論理、ソフトウェア、ハードウェア、ファームウェアなど、様々な好適なエンコーダ回路のいずれか、あるいはそれらの任意の組合せとして実装され得る。たとえば、本開示で説明される技法は、装置またはデバイスの観点から説明され得る。一例として、装置またはデバイスは、ビデオデコーダ３０（たとえば、ワイヤレス通信デバイスの一部としての宛先デバイス１４）を含んでよく、ビデオデコーダ３０は、本開示で説明される技法を実装する（たとえば、本開示で説明される技法に従って、ビデオデータを復号する）ように構成された１つまたは複数のプロセッサを含んでよい。別の例として、装置またはデバイスは、ビデオデコーダ３０を含むマイクロプロセッサまたは集積回路（ＩＣ）を含んでよく、マイクロプロセッサまたはＩＣは、宛先デバイス１４または別のタイプのデバイスの一部であり得る。同じことは、ビデオエンコーダ２０にも当てはまり得る（すなわち、ソースデバイス１２のような装置もしくはデバイス、および／またはマイクロコントローラもしくはＩＣは、ビデオエンコーダ２０を含み、その場合、ビデオエンコーダ２０は、本開示で説明される技法に従ってビデオデータを符号化するように構成される）。

[0040]本技法が部分的にソフトウェアで実装されるとき、デバイスは、好適な非一時的コンピュータ可読媒体にソフトウェアの命令を記憶し、本開示の技法を実行するために１つまたは複数のプロセッサを使用してハードウェアでその命令を実行し得る。ビデオエンコーダ２０およびビデオデコーダ３０の各々は１つまたは複数のエンコーダまたはデコーダ中に含まれてよく、そのいずれも、それぞれのデバイスにおいて複合エンコーダ／デコーダ（コーデック）の一部として統合されてよい。

[0041]ビデオシーケンスは、一般に、ビューからの一連のビデオピクチャを含む。ピクチャグループ（ＧＯＰ）は、概して、一連の１つまたは複数のビデオピクチャを備える。ＧＯＰは、ＧＯＰ中に含まれるいくつかのピクチャを記述するシンタックスデータを、ＧＯＰのヘッダ中、ＧＯＰの１つもしくは複数のピクチャのヘッダ中、または他の場所に含み得る。各ピクチャは、それぞれのピクチャのための符号化モードを記述するピクチャシンタックスデータを含み得る。ビデオエンコーダ２０は、一般に、ビデオデータを符号化するために、個々のビデオピクチャ内のビデオブロックに対して動作する。ビデオブロックは、Ｈ．２６４規格において定義されるようなマクロブロック、マクロブロックのパーティション、および場合によってはパーティションのサブブロックに対応し得る。ビデオブロックは、固定サイズまたは可変サイズを有し得、指定されたコーディング規格に従ってサイズが異なり得る。各ビデオピクチャは複数のスライスを含み得る。各スライスは複数のブロックを含み得る。

[0042]一例として、ＩＴＵ−ＴＨ．２６４規格は、ルーマ成分については１６×１６、８×８、または４×４、およびクロマ成分については８×８など、様々なブロックサイズのイントラ予測をサポートし、ならびにルーマ成分については１６×１６、１６×８、８×１６、８×８、８×４、４×８および４×４、およびクロマ成分については対応するスケーリングされたサイズなど、様々なブロックサイズのインター予測をサポートする。本開示では、「Ｎ×（x）Ｎ」と「Ｎ×（by）Ｎ」は、垂直寸法および水平寸法に関するブロックのピクセル寸法（たとえば、１６×（x）１６ピクセルまたは１６×（by）１６ピクセル）を指すために互換的に使用され得る。一般に、１６×１６ブロックは、垂直方向に１６ピクセルを有し（ｙ＝１６）、水平方向に１６ピクセルを有する（ｘ＝１６）。同様に、Ｎ×Ｎブロックは、概して、垂直方向にＮピクセルを有し、水平方向にＮピクセルを有し、ただし、Ｎは非負整数値を表す。ブロック中のピクセルは行と列とに構成され得る。その上、ブロックは、必ずしも、水平方向において垂直方向と同じ数のピクセルを有する必要があるとは限らない。たとえば、ブロックはＮ×Ｍピクセルを備えてよく、この場合に、Ｍは必ずしもＮに等しいとは限らない。

[0043]ブロックがイントラモード符号化される（たとえば、イントラ予測される）とき、ブロックは、ブロック用のイントラ予測モードを記述するデータを含む場合がある。別の例として、ブロックがインターモード符号化される（たとえば、インター予測される）とき、ブロックは、ブロックについての動きベクトルを定義する情報を含む場合がある。この動きベクトルは、同じビュー中の参照ピクチャを指す（たとえば、時間動きベクトル）か、または別のビュー中の参照ピクチャを指す（たとえば、視差動きベクトル）。ブロックのための動きベクトルを定義するデータは、たとえば、動きベクトルの水平成分と、動きベクトルの垂直成分と、動きベクトルの解像度（たとえば、１／４ピクセル精度または１／８ピクセル精度）とを記述する。加えて、インター予測されるとき、ブロックは、動きベクトルが指す参照ピクチャなどの参照インデックス情報、および／または動きベクトル用の参照ピクチャリスト（たとえば、ＲｅｆＰｉｃＬｉｓｔ０もしくはＲｅｆＰｉｃＬｉｓｔ１）を含む場合がある。

[0044]Ｈ．２６４規格では、イントラ予測またはインター予測コーディングの後、ビデオエンコーダ２０は、マクロブロックのための残差データを計算する。残差データは、符号化されていないピクチャのピクセルと、Ｈ．２６４におけるマクロブロックのための予測値との間のピクセル差分に対応し得る。

[0045]いくつかの例では、変換係数を生成するための任意の変換の後、ビデオエンコーダ２０は、変換係数の量子化を実行する。量子化は、概して、係数を表すために使用されるデータの量をできるだけ低減するために変換係数が量子化され、さらなる圧縮を行うプロセスを指す。量子化プロセスは、係数の一部または全部に関連するビット深度を低減する。たとえば、量子化中にｎビット値がｍビット値に切り捨てられ、ただし、ｎはｍよりも大きい。

[0046]いくつかの例では、ビデオエンコーダ２０は、エントロピー符号化され得るシリアル化ベクトルを生成するために、量子化変換係数を走査するためにあらかじめ定義された走査順序を利用する。他の例では、ビデオエンコーダ２０は適応走査を実行する。１次元ベクトルを形成するために、量子化変換係数を走査した後、いくつかの例では、ビデオエンコーダ２０は、いくつかの例として、コンテキスト適応型可変長コーディング（ＣＡＶＬＣ）、コンテキスト適応型バイナリ算術コーディング（ＣＡＢＡＣ）、シンタックスベースコンテキスト適応型バイナリ算術コーディング（ＳＢＡＣ）、確率間隔区分エントロピー（ＰＩＰＥ）コーディング、または別のエントロピー符号化方法に従って、１次元ベクトルをエントロピー符号化する。ビデオエンコーダ２０はまた、ビデオデータを復号する際にビデオデコーダ３０によって使用するための符号化されたビデオデータに関連するシンタックス要素をエントロピー符号化する。

[0047]ＣＡＢＡＣを実行するために、ビデオエンコーダ２０は、送信されるべきシンボルに、コンテキストモデル内のコンテキストを割り当て得る。コンテキストは、たとえば、シンボルの隣接値が０ではないかどうかに関係し得る。ＣＡＶＬＣを実行するために、ビデオエンコーダ２０は、送信されるべきシンボルの可変長コードを選択し得る。ＶＬＣにおけるコードワードは、比較的短いコードが優勢シンボルに対応し、一方より長いコードが劣勢シンボルに対応するように構成され得る。このようにして、ＶＬＣの使用は、たとえば、送信されるべき各シンボルのために等長コードワードを使用するよりも、ビット節約を達成し得る。確率決定は、シンボルに割り当てられたコンテキストに基づき得る。

[0048]ビデオデコーダ３０は、ビデオエンコーダ２０の技法の逆を実施する。たとえば、ビデオデコーダ３０は、符号化されたビデオビットストリームを復号し、逆量子化および逆変換によって残差ブロックを決定する。ビデオデコーダ３０は、ピクチャ内のブロックのためのピクセル値を決定するために、前に復号されたピクチャのブロックと残差ブロックとを合計する。

[0049]本開示で説明されるいくつかの技法は、ビデオエンコーダ２０とビデオデコーダ３０の両方によって実行され得る。一例として、ビデオエンコーダ２０は、ビデオデータのブロックをどのように符号化するかを決定することの一部として、視差ベクトルを導出し得る。ビデオエンコーダ２０はまた、参照ピクチャを生成するために使用される復号ループの一部として、視差ベクトルを導出し得る。ビデオデコーダ３０は、ビデオブロックを復号することの一部として、ビデオエンコーダ２０によって実行される同じ視差ベクトル導出技法を実行し得る。本開示は、時々、ビデオデコーダ３０によって実行されているような技法に言及することがあるが、別段に規定されていない限り、ビデオデコーダ３０に関して説明される技法はまた、ビデオエンコーダ２０によっても実行され得ることが仮定されるべきである。

[0050]上記で説明されたように、本開示で説明される技法は、３ｄビデオコーディングを対象とする。本技法をよりよく理解するために、下記は、いくつかのＨ．２６４／ＡＶＣコーディング技法、Ｈ．２６４／ＭＶＣ拡張および高効率ビデオコーディング（ＨＥＶＣ）規格の観点からのマルチビュービデオコーディング、ならびに、３Ｄ−ＡＶＣ技法について説明する。

[0051]Ｈ．２６４／アドバンストビデオコーディング（ＡＶＣ）では、ビデオ符号化または復号（たとえば、コーディング）がマクロブロック上で実施され、ただし、マクロブロックは、フレームの一部分を表し、インター予測またはイントラ予測される（すなわち、インター予測符号化もしくは復号され、またはイントラ予測符号化もしくは復号される）。たとえば、Ｈ．２６４／ＡＶＣでは、各インターマクロブロック（ＭＢ）（たとえば、インター予測されたマクロブロック）は、１つの１６×１６ＭＢパーティション、２つの１６×８ＭＢパーティション、２つの８×１６ＭＢパーティション、または４つの８×８ＭＢパーティションの４つの異なる方法で区分され得る。１つのＭＢ中の異なるＭＢパーティションは、方向ごとに異なる参照インデックス値（すなわち、ＲｅｆＰｉｃＬｉｓｔ０またはＲｅｆＰｉｃＬｉｓｔ１）を有し得る。ＭＢが複数の（１よりも多い）ＭＢパーティションに区分されないとき、ＭＢは、各方向に、ＭＢパーティション全体のための１つの動きベクトルのみを有する。

[0052]ビデオコーディング（符号化または復号）の一部として、ビデオデコーダ３０は、ＲｅｆＰｉｃＬｉｓｔ０およびＲｅｆＰｉｃＬｉｓｔ１と呼ばれる、１つまたは２つの参照ピクチャリストを構成するように構成され得る。参照ピクチャリスト（複数可）は、フレームまたはスライスのマクロブロックをインター予測するために使用され得る参照ピクチャを識別する。たとえば、ビデオエンコーダ２０は、参照インデックスと参照ピクチャリスト識別子とをシグナリングし得る。ビデオデコーダ３０は、参照インデックスと参照ピクチャリスト識別子とを受信し、参照インデックスと参照ピクチャリスト識別子とから、現在のマクロブロックをインター予測復号するために使用されるべきである参照ピクチャを決定し得る。

[0053]ＭＢが４つの８×８ＭＢパーティションに区分されるとき、各８×８ＭＢパーティションは、Ｈ．２６４／ＡＶＣサブブロックにさらに区分され得る。８×８ＭＢパーティションから、Ｈ．２６４／ＡＶＣサブブロック、すなわち、１つの８×８サブブロック、２つの８×４サブブロック、２つの４×８サブブロック、または４つの４×４サブブロックを得るための、４つの異なる方法がある。各Ｈ．２６４／ＡＶＣサブブロックは、各方向において異なる動きベクトルを有し得るが、各方向のための同じ参照ピクチャインデックスを共有することができる。８×８ＭＢパーティションがサブブロックに区分される方法は、サブブロック区分と称される。

[0054]本開示は、概して、ビデオデータの任意のブロックを指すために、ブロックという用語を使用する。たとえば、Ｈ．２６４コーディングおよびその拡張のコンテキストでは、ブロックは、マクロブロック、マクロブロックパーティション、サブブロック、または任意の他のタイプのブロックのいずれかを指すことがある。ＨＥＶＣおよびその拡張のコンテキストでは、ブロックは、ＰＵ、ＴＵ、ＣＵ、または任意の他のタイプのブロックのいずれかを指すことがある。本開示で使用されるサブブロックは、概して、より大きいブロックの任意の部分を指す。サブブロックはまた、それ自体で単にブロックと呼ばれることもある。Ｈ．２６４／ＡＶＣにおいて定義されるようなサブブロックに特に言及するとき、Ｈ．２６４／ＡＶＣサブブロックという用語が使用され得る。そうでない場合、本開示で使用されるサブブロックは、概して、Ｈ．２６４／ＡＶＣサブブロック、ならびに、上記で説明された他のタイプのサブブロックを包含する、総称語であるものとする。

[0055]マルチビュービデオコーディングでは、複数の異なるビデオコーディング規格がある。混乱を避けるために、本開示が一般的にマルチビュービデオコーディングについて説明するとき、本開示は「マルチビュービデオコーディング」というフレーズを使用する。概して、マルチビュービデオコーディングでは、ベースビュー、および、１つまたは複数の非ベースビューまたは依存ビューがある。ベースビューは、依存ビューのいずれにも関係なく、完全に復号可能である（すなわち、ベースビューは、時間動きベクトルを用いてのみインター予測される）。これは、マルチビュービデオコーディングのために構成されないコーデックが、完全に復号可能である少なくとも１つのビューをなお受信することを可能にする（すなわち、ベースビューが抽出され、他のビューが破棄されて、マルチビュービデオコーディングのために構成されないデコーダが、３Ｄエクスペリエンスがないにもかかわらず、ビデオコンテンツをなお復号することが可能にされ得る）。１つまたは複数の依存ビューは、ベースビューに関して、または別の依存ビューに関してインター予測され（すなわち、視差補償予測され）、あるいは、同じビュー中の他のピクチャに関してインター予測され（すなわち、動き補償予測され）得る。

[0056]「マルチビュービデオコーディング」が総称的に使用されるのに対して、頭文字ＭＶＣは、Ｈ．２６４／ＡＶＣの拡張に関連付けられる。したがって、本開示が頭文字ＭＶＣを使用するとき、本開示は、特にＨ．２６４／ＡＶＣビデオコーディング規格の拡張を指している。Ｈ．２６４／ＡＶＣのＭＶＣ拡張は、時間動きベクトルに加えて、別のタイプの動きベクトルとしての視差動きベクトルに依拠している。ＭＶＣプラス深度（ＭＶＣ＋Ｄ）と呼ばれる別のビデオコーディング規格もまた、ＪＣＴ−３ＶおよびＭＰＥＧによって開発されている。ＭＶＣ＋Ｄは、テクスチャと深度の両方に対して、ＭＶＣのものと同じ低レベルコーディングツールを適用し、深度の復号は、テクスチャの復号とは無関係であり、その逆も同様である。たとえば、ＭＶＣでは、フレームは、テクスチャビューコンポーネントまたは単にテクスチャと呼ばれる、１つのビューコンポーネントのみによって表される。ＭＶＣ＋Ｄでは、テクスチャビューコンポーネントおよび深度ビューコンポーネント、または単にテクスチャおよび深度という、２つのビューコンポーネントがある。たとえば、ＭＶＣ＋Ｄでは、各ビューは、テクスチャビューと深度ビューとを含み、ただし、ビューは複数のビューコンポーネントを含み、テクスチャビューは複数のテクスチャビューコンポーネントを含み、深度ビューは複数の深度ビューコンポーネントを含む。

[0057]各テクスチャビューコンポーネントは、ビューのビューコンポーネントを形成するために、深度ビューコンポーネントに関連付けられる。深度ビューコンポーネントは、テクスチャビューコンポーネント中のオブジェクトの相対深度を表す。ＭＶＣ＋Ｄでは、深度ビューコンポーネントおよびテクスチャビューコンポーネントは、別個に復号可能である。たとえば、ビデオデコーダ３０は、第１のコーデックがテクスチャビューコンポーネントを復号し、第２のコーデックが深度ビューコンポーネントを復号する、ＭＶＣコーデックの２つのインスタンスを実装し得る。これらの２つのコーデックは、テクスチャビューコンポーネントおよび深度ビューコンポーネントが別個に符号化されるので、互いに無関係に実行することができる。

[0058]ＭＶＣ＋Ｄでは、深度ビューコンポーネントは常に、関連付けられた（たとえば、対応する）テクスチャビューコンポーネントの直後にくる。このようにして、ＭＶＣ＋Ｄは、テクスチャビューコンポーネントが深度ビューコンポーネントより前に復号される、テクスチャ優先コーディングをサポートする。

[0059]テクスチャビューコンポーネントおよびその関連付けられた（たとえば、対応する）深度ビューコンポーネントは、同じピクチャ順序カウント（ＰＯＣ：picture order count）値とｖｉｅｗ＿ｉｄとを含み得る（すなわち、テクスチャビューコンポーネントおよびその関連付けられた深度ビューコンポーネントのＰＯＣ値およびｖｉｅｗ＿ｉｄは同じである）。ＰＯＣ値は、テクスチャビューコンポーネントの表示順序を示し、ｖｉｅｗ＿ｉｄは、テクスチャビューコンポーネントおよび深度ビューコンポーネントが属する先のビューを示す。

[0060]図２は、典型的なＭＶＣ復号順序（すなわち、ビットストリーム順序）を示す。復号順序構成は時間優先（time-first）コーディングと呼ばれる。アクセスユニットの復号順序は、出力または表示の順序と同一ではない場合があることに留意されたい。図２では、Ｓ０〜Ｓ７は、それぞれマルチビュービデオの異なるビューを指す。Ｔ０〜Ｔ８は、それぞれ１つの出力時間インスタンスを表す。アクセスユニットは、１つの出力時間インスタンスについてのすべてのビューのコーディングされたピクチャを含み得る。たとえば、第１のアクセスユニットは時間インスタンスＴ０についてのビューＳ０〜Ｓ７のすべてを含み得、第２のアクセスユニットは時間インスタンスＴ１についてのビューＳ０〜Ｓ７のすべてを含み得、以下同様である。

[0061]簡潔にするために、本開示は以下の定義を使用し得る。

ビューコンポーネント：単一のアクセスユニット中のビューのコーディングされた表現。ビューが、コーディングされたテクスチャ表現とコーディングされた深度表現の両方を含むとき、ビューコンポーネントは、テクスチャビューコンポーネントと深度ビューコンポーネントとを含み得る。

テクスチャビューコンポーネント：単一のアクセスユニット中のビューのテクスチャのコーディングされた表現。

深度ビューコンポーネント：単一のアクセスユニット中のビューの深度のコーディングされた表現。

[0062]上記で説明されたように、本開示のコンテキストでは、ビューコンポーネント、テクスチャビューコンポーネント、および深度ビデコンポーネントは、一般にレイヤと呼ばれることがある。図２では、ビューの各々はピクチャのセットを含む。たとえば、ビューＳ０はピクチャ０、８、１６、２４、３２、４０、４８、５６、および６４のセットを含み、ビューＳ１はピクチャ１、９、１７、２５、３３、４１、４９、５７、および６５のセットを含み、以下同様である。各セットは２つのピクチャを含み、一方のピクチャはテクスチャビューコンポーネントと呼ばれ、他方のピクチャは深度ビューコンポーネントと呼ばれる。ビューのピクチャのセット内のテクスチャビューコンポーネントおよび深度ビューコンポーネントは、互いに対応すると見なされ得る。たとえば、ビューのピクチャのセット内のテクスチャビューコンポーネントは、そのビューのピクチャのセット内の深度ビューコンポーネントに対応すると見なされ、その逆も同様である（すなわち、深度ビューコンポーネントはセット中のそれのテクスチャビューコンポーネントに対応し、その逆も同様である）。本開示で使用する、深度ビューコンポーネントに対応するテクスチャビューコンポーネントは、単一のアクセスユニットの同じビューの一部であるテクスチャビューコンポーネントおよび深度ビューコンポーネントと見なされ得る。

[0063]テクスチャビューコンポーネントは、表示される実際の画像コンテンツを含む。たとえば、テクスチャビューコンポーネントは、ルーマ（Ｙ）成分と、クロマ（ＣｂおよびＣｒ）成分とを含み得る。深度ビューコンポーネントは、それの対応するテクスチャビューコンポーネント中のピクセルの相対深度を示し得る。一例のアナロジーとして、深度ビューコンポーネントは、ルーマ値のみを含むグレースケール画像と同様である。言い換えれば、深度ビューコンポーネントは、画像コンテンツを搬送するのではなく、テクスチャビューコンポーネント中のピクセルの相対深度の測度を与え得る。

[0064]たとえば、深度ビューコンポーネント中の純白のピクセルは、対応するテクスチャビューコンポーネント中のそれの対応する１つまたは複数のピクセルが閲覧者から見てより近いことを示し、深度ビューコンポーネント中の純黒のピクセルは、対応するテクスチャビューコンポーネント中のそれの対応する１つまたは複数のピクセルが閲覧者から見てより遠いことを示す。黒と白との中間にあるグレーの様々な陰影は、異なる深度レベルを示す。たとえば、深度ビューコンポーネント中の濃いグレーのピクセルは、テクスチャビューコンポーネント中のそれの対応するピクセルが、深度ビューコンポーネント中のより薄いグレーのピクセルよりも遠いことを示す。ピクセルの深度を識別するためにグレースケールのみが必要とされるので、深度ビューコンポーネントの色値がいかなる目的も果たし得ないことから、深度ビューコンポーネントはクロマ成分を含む必要がない。上記の説明は、深度画像をテクスチャ画像に関係付ける目的のためのアナロジーであるものとする。深度画像中の深度値は、実際にはグレーの陰影を表すものではなく、実際には、８ビットまたは他のビットサイズの深度値を表す。

[0065]深度を識別するためにルーマ値（たとえば、強度値）のみを使用する深度ビューコンポーネントが説明のために提供され、限定するものと見なされるべきではない。他の例では、テクスチャビューコンポーネント中のピクセルの相対深度を示すために任意の技法が利用され得る。

[0066]図３は、マルチビュービデオコーディング用の（各ビュー内のピクチャ間予測と、ビュー間のビュー間予測の両方を含む）典型的なＭＶＣ予測構造を示している。予測方向は矢印によって示され、矢印の終点のオブジェクトは、予測参照として矢印の始点のオブジェクトを使用する。ＭＶＣでは、Ｈ．２６４／ＡＶＣ動き補償のシンタックスを使用するが、異なるビュー中のピクチャが参照ピクチャとして使用されることを可能にする視差動き補償によって、ビュー間予測がサポートされる。

[0067]図３の例では、（ビューＩＤ「Ｓ０」〜「Ｓ７」を有する）８つのビューが示され、１２個の時間ロケーション（「Ｔ０」〜「Ｔ１１」）がビューごとに示されている。すなわち、図３中の各行はビューに対応し、一方各列は時間ロケーションを示す。

[0068]ＭＶＣがＨ．２６４／ＡＶＣデコーダによって復号可能である、いわゆるベースビューを有し、また、ステレオビューペアがＭＶＣによってもサポートされ得るが、ＭＶＣの利点は、ＭＶＣが、３Ｄビデオ入力として３つ以上のビューを使用し、複数のビューによって表されるこの３Ｄビデオを復号する例をサポートできることである。ＭＶＣデコーダを有するクライアントのレンダラは、複数のビューを用いて３Ｄビデオコンテンツを予想し得る。

[0069]図３中のピクチャは、各行と各列の交点に示されている。Ｈ．２６４／ＡＶＣ規格は、ビデオの一部分を表すためにフレームという用語を使用し得る。本開示では、ピクチャという用語とフレームという用語とを互換的に使用し得る。

[0070]図３中のピクチャは、対応するピクチャがイントラコーディングされる（すなわち、Ｉピクチャである）か、あるいは一方向に（すなわち、Ｐピクチャとして）または複数の方向に（すなわち、Ｂピクチャとして）インターコーディングされるかを指定する、文字を含むブロックを使用して示されている。概して、予測は矢印によって示され、ここで矢印の終点のピクチャは、予測参照のために矢印の始点のピクチャを使用する。たとえば、時間ロケーションＴ０にあるビューＳ２のＰピクチャは、時間ロケーションＴ０にあるビューＳ０のＩピクチャから予測される。

[0071]シングルビュービデオ符号化の場合と同様に、マルチビュービデオコーディングビデオシーケンスのピクチャは、異なる時間ロケーションにあるピクチャに関して予測符号化され得る。たとえば、時間ロケーションＴ１にあるビューＳ０のｂピクチャは、時間ロケーションＴ０にあるビューＳ０のＩピクチャからそのｂピクチャに向けられた矢印を有し、その矢印は、ｂピクチャがＩピクチャから予測されることを示す。しかしながら、さらに、マルチビュービデオ符号化のコンテキストにおいて、ピクチャはビュー間予測され得る。すなわち、ビューコンポーネントは、参照のために他のビュー中のビューコンポーネントを使用することができる。ＭＶＣでは、たとえば、別のビュー中のビューコンポーネントがインター予測参照であるかのように、ビュー間予測が実現される。潜在的なビュー間参照は、シーケンスパラメータセット（ＳＰＳ）ＭＶＣ拡張においてシグナリングされ、インター予測またはビュー間予測参照のフレキシブルな順序付けを可能にする参照ピクチャリスト構成プロセスによって変更され得る。ビュー間予測は、３Ｄ−ＨＥＶＣ（マルチビュープラス深度）を含むＨＥＶＣの提案されたマルチビュー拡張の機能でもある。

[0072]図３は、ビュー間予測の様々な例を提供する。図３の例では、ビューＳ１のピクチャは、ビューＳ１の異なる時間ロケーションにあるピクチャから予測されるものとして、ならびに同じ時間ロケーションにあるビューＳ０およびＳ２のピクチャからビュー間予測されるものとして示されている。たとえば、時間ロケーションＴ１にあるビューＳ１のｂピクチャは、時間ロケーションＴ０およびＴ２にあるビューＳ１のＢピクチャの各々、ならびに時間ロケーションＴ１にあるビューＳ０およびＳ２のｂピクチャから予測される。

[0073]いくつかの例では、図３はテクスチャビューコンポーネントを示すものとして見なされ得る。たとえば、図２に示されたＩピクチャ、Ｐピクチャ、Ｂピクチャ、およびｂピクチャは、ビューの各々のためのテクスチャビューコンポーネントと見なされ得る。本開示で説明される技法によれば、図３に示されたテクスチャビューコンポーネントの各々について、対応する深度ビューコンポーネントがある。いくつかの例では、深度ビューコンポーネントは、対応するテクスチャビューコンポーネントについて図３に示された方法と同様の方法で予測され得る。

[0074]２つのビューのコーディングもＭＶＣによってサポートされ得る。ＭＶＣの利点のうちの１つは、ＭＶＣエンコーダが３Ｄビデオ入力として３つ以上のビューをとり得、ＭＶＣデコーダがそのようなマルチビュー表現を復号し得ることである。したがって、ＭＶＣデコーダをもついかなるレンダラも、３つ以上のビューをもつ３Ｄビデオコンテンツを復号し得る。

[0075]上記で説明されたように、ＭＶＣでは、（いくつかの事例では、同じ時間インスタンスをもつことを意味する）同じアクセスユニット中のピクチャ間で、ビュー間予測が可能にされる。非ベースビューのうちの１つの中のピクチャをコーディングするとき、ピクチャが異なるビュー内にあるが同じ時間インスタンス内にある場合、そのピクチャは参照ピクチャリストに追加され得る。ビュー間予測の参照ピクチャは、任意のインター予測の参照ピクチャと同様に、参照ピクチャリストの任意の位置に置かれ得る。図３に示されたように、ビューコンポーネントは、参照用に他のビュー中のビューコンポーネントを使用することができる。ＭＶＣでは、別のビュー中のビューコンポーネントがインター予測参照であるかのように、ビュー間予測が実現される。

[0076]ＭＶＣでは、同じアクセスユニット中の（すなわち、同じ時間インスタンスをもつ）ピクチャ間でビュー間予測が可能にされる。非ベースビューのうちの１つ中のピクチャをコーディングするとき、ピクチャが異なるビュー中にあるが同じ時間インスタンスをもつ場合、そのピクチャは参照ピクチャリストに追加され得る。ビュー間予測参照ピクチャは、任意のインター予測参照ピクチャと同様に、参照ピクチャリストの任意の位置に置かれ得る。

[0077]図３に示されたように、ビューコンポーネントは、参照用に他のビュー中のビューコンポーネントを使用することができる。これはビュー間予測と呼ばれる。ＭＶＣでは、別のビュー中のビューコンポーネントがインター予測参照であるかのように、ビュー間予測が実現される。

[0078]マルチビュービデオコーディングのコンテキストでは、２種類の動きベクトルが存在する。ｎｅは、時間参照ピクチャを指す通常の動きベクトルである。対応する時間インター予測は、動き補償予測（ＭＣＰ：motion-compensated prediction）である。他方のタイプの動きベクトルは、異なるビュー中のピクチャ（すなわち、ビュー間参照ピクチャ）を指す視差動きベクトルである。対応するインター予測は、視差補償予測（ＤＣＰ：disparity-compensated prediction）である。

[0079]次のセクションは、ＡＶＣベース３Ｄビデオコーディング規格について説明する。現在、ＶＣＥＧおよびＭＰＥＧのＪｏｉｎｔＣｏｌｌａｂｏｒａｔｉｏｎＴｅａｍｏｎ３ＤＶｉｄｅｏＣｏｄｉｎｇ（ＪＣＴ−３Ｖ）は、Ｈ．２６４／ＡＶＣに基づく３ＤＶ規格、すなわち、３Ｄ−ＡＶＣを開発中である。３Ｄ−ＡＶＣでは、ＭＶＣにおけるビュー間予測の他に、新しいコーディングツールが含まれ、サポートされている。３Ｄ−ＡＶＣのための最新のソフトウェア３Ｄ−ＡＴＭは、以下のリンクからダウンロード可能であり、すなわち、［３Ｄ−ＡＴＭバージョン６．２］：ｈｔｔｐ：／／ｍｐｅｇ３ｄｖ．ｒｅｓｅａｒｃｈ．ｎｏｋｉａ．ｃｏｍ／ｓｖｎ／ｍｐｅｇ３ｄｖ／ｔａｇｓ／３ＤＶ−ＡＴＭｖ６．２／である。

[0080]ＡＶＣベース３Ｄビデオ（３Ｄ−ＡＶＣ）コーディング規格は、ＪＣＴ−３Ｖによって現在開発中であり、３Ｄ−ＡＶＣの最新のバージョンは、現在公に入手可能であり、すなわち、Ｍ．Ｍ．Ｈａｎｎｕｋｓｅｌａ、Ｙ．Ｃｈｅｎ、Ｔ．Ｓｕｚｕｋｉ、Ｊ．−Ｒ．Ｏｈｍ、Ｇ．Ｊ．Ｓｕｌｌｉｖａｎ、「３Ｄ−ＡＶＣｄｒａｆｔｔｅｘｔ５」、ＪＣＴ３Ｖ−Ｃ１００２、ジュネーブ、スイス、２０１３年１月である。それは、２０１４年３月１４日現在、以下のリンクから入手可能であり、参照により本明細書に組み込まれ、すなわち、ｈｔｔｐ：／／ｐｈｅｎｉｘ．ｉｔ−ｓｕｄｐａｒｉｓ．ｅｕ／ｊｃｔ２／ｄｏｃ＿ｅｎｄ＿ｕｓｅｒ／ｄｏｃｕｍｅｎｔｓ／３＿Ｇｅｎｅｖａ／ｗｇ１１／ＪＣＴ３Ｖ−Ｃ１００２−ｖ３．ｚｉｐである。

[0081]３Ｄ−ＡＶＣにおけるビューコンポーネントのコーディング順序について、次に説明する。３Ｄ−ＡＶＣは、ベースビューのテクスチャ部分がＨ．２６４／ＡＶＣデコーダによって完全に復号可能である形で、Ｈ．２６４／ＡＶＣと互換性がある。たとえば、ベースビューのビューコンポーネント中のテクスチャビューコンポーネントは、同じベースビュー中の他のテクスチャビューコンポーネントのみを用いてインター予測され得る。ベースビュー中のテクスチャビューコンポーネントは、ビュー間予測されなくてよい。また、ベースビュー中のテクスチャビューコンポーネントは、復号の目的のために対応する深度ビューコンポーネントを必要としなくてよい。

[0082]３Ｄ−ＡＶＣにおける拡張ビューコンポーネントでは、いくつかの他の例示的な技法において、深度がテクスチャより前にコーディングされ得、テクスチャビューコンポーネントが、深度ビューコンポーネントからの情報に基づいてコーディングされ得、これは深度優先（depth-first）コーディングとしても知られる。ただし、各テクスチャビューコンポーネントは、上記で説明されたＭＶＣ＋Ｄにおけるような、テクスチャ優先コーディング順序において、それぞれの深度ビューコンポーネントの前でコーディングされる。言い換えれば、いくつかの他の例示的な技法では、３Ｄ−ＡＶＣでは、ベースビューのテクスチャビューコンポーネントが最初にコーディングされ、ベースビューの関連付けられた深度ビューコンポーネントによって後続され、第１のエンハンスメントビューまたは依存ビューの深度ビューコンポーネントによって後続され、第１のエンハンスメントビューまたは依存ビューの関連付けられたテクスチャビューコンポーネントによって後続され、第２のエンハンスメントビューまたは依存ビューの深度ビューコンポーネントによって後続され、第２のエンハンスメントビューまたは依存ビューの関連付けられたテクスチャビューコンポーネントによって後続され、以下同様である。

[0083]たとえば、３Ｄ−ＡＶＣにおけるテクスチャビューコンポーネントおよび深度ビューコンポーネントのコーディング順序は、次のように例示される。以下の例では、Ｔ０およびＤ０は、それぞれ、ベースビューのテクスチャビューコンポーネントと深度ビューコンポーネントとを指し、ＴｉおよびＤｉは、それぞれ、ｉ番目の依存ビューのテクスチャビューコンポーネントと深度ビューコンポーネントとを指す。以下の例では、３つのビューが考慮される。

[0084]第１の例では、考慮されるビューは、Ｔ０、Ｄ０、Ｄ１、Ｄ２、Ｔ１、およびＴ２である。この例では、ベースビュー（Ｔ０およびＤ０）は、テクスチャ優先コーディング順序でコーディングされるが、一方依存ビューは、深度優先コーディング順序でコーディングされる。ハイブリッドコーディング順序が、３Ｄ−ＡＶＣの共通試験条件において現在使用されている。別の例では、コーディングの順序は、Ｔ０、Ｄ０、Ｔ１、Ｄ１、Ｔ２、およびＤ２である。すなわち、すべてのビューコンポーネントが、テクスチャ優先コーディング順序でコーディングされる。

[0085]ビュー間予測がＴｉに対して可能にされる場合、参照テクスチャビューは、ビュー間参照ピクチャを含むビューとして定義され、対応する深度ビューは、参照テクスチャビューのものと同じビュー順序インデックスを有する参照深度ビューとして定義される。

[0086]深度マップを介した３Ｄ−ＡＶＣ視差ベクトル導出について、次に説明する。視差ベクトルを導出するための技法は、各低レベルコーディングツールとともに変化し得るが、一般に、依存ビューの深度データは、テクスチャビューコンポーネントコーディングのための視差ベクトル導出のために使用される。これは、深度優先コーディング順序のために、依存ビューの深度ビューが利用可能であるからである。使用される低レベルコーディングツールは、３Ｄ−ＡＶＣにおける、インループブロックベースビュー合成ビュー間予測（ＢＶＳＰ）および深度ベース動きベクトル予測（Ｄ−ＭＶＰ：depth-based motion vector prediction）である。ビデオコーダ、たとえば、ビデオデコーダ３０は、（依存フレームと呼ばれることがある）依存ビュー中の（深度マップと呼ばれることがある）深度ビューの深度値から変換された視差ベクトルを使用し得る。３Ｄ−ＡＶＣ参照ソフトウェアでは、典型的には、実際の深度マップ値から特定のビューに対する視差への変換プロセスの結果が、カメラパラメータとともにルックアップテーブルに記憶される。

[0087]視差ベクトル導出における使用のための、４隅からの最大深度導出について、次に説明する。深度値を導出するために、ビデオデコーダ３０は、最初に、深度ビューコンポーネントの参照深度ブロックを識別する。参照深度ブロックは、現在のＭＢ／パーティション／サブブロックにコロケートされ／対応する。識別された参照深度ブロック中で、ビデオデコーダ３０は、左上、右上、左下、および右下の深度サンプルに対応する４隅のサンプルにアクセスする。深度値は、次いで、４隅の深度サンプルの最大値を取ることによって計算される。

[0088]最後に、ビデオデコーダ３０は、計算された深度値を使用し、視差ベクトルの垂直成分を０に設定して、ルックアップテーブルから視差ベクトルの水平成分を推論する。この方法では、ＭＢがパーティションまたはサブブロックに分割されるとき、アクセスされた深度サンプルの数が増加する。たとえば、１６×１６ＭＢが４つの８×８パーティションに区分されるとき、アクセスされるべき深度サンプルの数は１６であり、１６×１６ＭＢが１６個の４×４パーティションに区分されるとき、アクセスされるべき深度サンプルの数は６４である。

[0089]３Ｄ−ＡＶＣにおけるＢＶＳＰは、３Ｄ−ＡＶＣならびに他のコーディング規格によってサポートされたコーディングモードである。ＢＶＳＰは、Ｗ．Ｓｕ他による「３ＤＶ−ＣＥ１．ａ：Ｂｌｏｃｋ−ＢａｓｅｄＶｉｅｗＳｙｎｔｈｅｓｉｓＰｒｅｄｉｃｔｉｏｎｆｏｒ３ＤＶ−ＡＴＭ」（ＪＣＴ３Ｖ−Ａ０１０７）において最初に提案されており、それは、以下のリンクからダウンロード可能であり、参照により本明細書に組み込まれ、すなわち、ｈｔｔｐ：／／ｐｈｅｎｉｘ．ｉｔ−ｓｕｄｐａｒｉｓ．ｅｕ／ｊｃｔ２／ｄｏｃ＿ｅｎｄ＿ｕｓｅｒ／ｄｏｃｕｍｅｎｔｓ／１＿Ｓｔｏｃｋｈｏｌｍ／ｗｇ１１／ＪＣＴ３Ｖ−Ａ０１０７−ｖ１．ｚｉｐである。

[0090]図４は、後方ワーピングに基づくＢＶＳＰの概念図である。図４を参照すると、以下のコーディング順序、（Ｔ０、Ｄ０、Ｄ１、Ｔ１）が利用され、Ｔがテクスチャビューを指し、Ｄが深度ビューを指す、と仮定する。テクスチャコンポーネントＴ０は、ベースビューであり、Ｔ１は、ＶＳＰでコーディングされた依存ビューである。深度マップコンポーネントＤ０（図４に示されない）およびＤ１は、Ｔ０およびＴ１に関連付けられたそれぞれの深度マップである。

[0091]依存ビューＴ１では、現在コーディングされているブロックＣｂのサンプル値が、ＶＳＰ予測を使用して、ベースビューＴ０のサンプル値からなる参照エリアＲ（Ｃｂ）から予測される（ＶＳＰ予測）。コーディングされるべき現在のサンプル（すなわち、Ｃｂ）と参照サンプル（すなわち、Ｒ（Ｃｂ））との間の変位ベクトル（Ｄｉｓｐ＿ｖｅｃ）は、現在コーディングされているテクスチャサンプルに関連付けられた深度マップ値からのＴ１とＴ０との間の導出された視差ベクトルとして示される。

[0092]深度値から視差ベクトルへの変換のプロセスは、たとえば以下の式を用いて実行され得る。

ただし、ｊおよびｉは、Ｃｂ内のローカル空間座標であり、ｄＣ_b（_j，_i）は、ビュー１の深度マップ画像における深度マップ値であり、Ｚは、実際の対応する深度値であり、Ｄは、特定のビュー０への導出された視差ベクトルの水平成分である。パラメータｆ、ｂ、ＺｎｅａｒおよびＺｆａｒは、カメラセットアップを指定するパラメータであり、すなわち、使用される焦点距離（ｆ）、ビュー＃１とビュー＃０との間のカメラ分離（ｂ）、および、深度マップ変換のパラメータを表す深度範囲（Ｚｎｅａｒ、Ｚｆａｒ）である。

[0093]いくつかの例では、導出された視差ベクトルの垂直成分が０に設定されることに留意されたい。また、いくつかの３ＤＶ−ＡＴＭ実装形態では、式（１）および（２）は、あらゆる深度マップ値（０．．．２５５）についてすでに事前計算され、ルックアップテーブルとして記憶されている。

[0094]図３の例では、Ｃｂは、現在コーディングされているブロックを表す。ビデオデコーダ３０は、ＢＶＳＰモードを使用してＣｂをコーディングし得る。Ｃｂが、ＢＶＳＰモードを使用してコーディングされるべきである場合、ビデオデコーダ３０は、Ｃｂに対応する深度ブロック、図４におけるｄ（Ｃｂ）を識別する。この点について、対応することは、コロケートされることを意味する。深度ブロックｄ（Ｃｂ）は、複数の深度値を含む。ｄ（Ｃｂ）のそれらの深度値のうちの１つまたは複数に基づいて、ビデオデコーダ３０は、視差値を決定する。その視差値が視差ベクトルのｘ成分として使用されてよく、ｙ成分が０に設定される。視差ベクトルを使用して、ビデオデコーダ３０は、異なるビュー中の、参照ブロック、図４の例におけるＲ（ｃｂ）を識別し、その参照ブロックに基づいて、ブロックＣｂをインター予測し得る。

[0095]深度ビュー解像度およびテクスチャビュー解像度は同じであってよく、または、それらは異なってよい。深度ビュー解像度およびテクスチャビュー解像度が異なる場合、ビデオデコーダ３０は、コロケートされた深度そのブロックを発見するために変換を実行し得る。ビデオデコーダ３０は、次のように変換を実行し得る。（ｘ，ｙ）はブロックＣｂの左上位置を示すとする。深度ビュー中のコロケートされたブロックの左上隅の位置は、（ｘ＞＞ｒｅｄｕｃｅｄ＿ｒｅｓｏｌｕｔｉｏｎ＿ｆｌａｇ，ｙ＞＞ｒｅｄｕｃｅｄ＿ｒｅｓｏｌｕｔｉｏｎ＿ｆｌａｇ）によって表される。シンタックス要素「ｒｅｄｕｃｅｄ＿ｒｅｓｏｌｕｔｉｏｎ＿ｆｌａｇ」は、あるビューコンポーネントペアの深度ビューコンポーネントが同じビューコンポーネントペアのテクスチャビューコンポーネントのルーマ成分よりも低い空間解像度を有すること、ならびに、深度ビューコンポーネントの幅と高さの両方が、すべてのテクスチャビューコンポーネントの幅および高さの半分であることを指定するために、１に等しい。

[0096]本開示の次のセクションは、ＢＶＳＰのいくつかの実装問題について説明する。１つの問題は、ＢＶＳＰブロックの指示、すなわち、どのようなブロックが、ＢＶＳＰモードを使用してコーディングされるべきであるかを含む。ＢＶＳＰブロックは、次のように示される。

−ＭＢレベルにおける１つのフラグが、現在のＭＢが従来のスキップ／直接モードでコーディングされるかどうか、または、スキップ／直接モードでコーディングされるが、合成参照コンポーネントから予測されるかどうかを、シグナリングするために使用される。このコンテキストでは、「従来のスキップ／直接モードは、Ｈ．２６４／ＡＶＣコーディング規格において使用されるスキップ／直接モードの拡張バージョンを指し、合成参照コンポーネントは、ビュー間ブロックから生成された参照ブロックを指す。

−ＭＢパーティション（１６×１６から８×８まで）ごとに、各参照ピクチャリスト中の参照インデックス（または、３Ｄ−ＡＶＣのためのいくつかの提案と同様に、フラグ）が、参照ピクチャをシグナリングするために使用される。パーティションがＢＶＳＰモードでコーディングされるとき、ＢＶＳＰコーディングされたブロックのための動きベクトルがないので、動きベクトル差分はシグナリングされない。

[0097]フラグまたは参照インデックスのいずれかが合成参照コンポーネントを示すとき、以下の項目において説明されるような１つのパーティションの予測が呼び出される。言い換えれば、あるビットは、ＭＢまたはＭＢパーティションが従来のスキップ／直接モードまたはＢＶＳＰモードを使用してコーディングされるかどうかを示し得る。ＢＶＳＰモードでは、ビデオデコーダ３０は、ＭＢまたはＭＢパーティションをＫ×Ｋブロックに分割し、Ｋ×Ｋブロックごとに、コロケートされた深度ブロックを識別し、深度ブロックから視差値を得て、視差ベクトルによって指されたビュー間参照ピクチャからＭＢまたはＭＢパーティションを予測することによって、（あなたが合成スキップ／直接と呼んでいる）ＢＶＳＰモードを使用してコーディングされるＭＢまたはＭＢパーティションの部分を復号する。

[0098]３Ｄ−ＡＶＣにおいて、従来のスキップ／直接モードでは、ビデオデコーダ３０は、次のように動きベクトルと参照インデックスとを導出する。参照ビュー中の（視差ベクトルによって指される）対応するブロックの動きベクトルは、利用可能な場合、現在のブロックの動きベクトルに等しく設定され、現在のブロックの参照インデックスがそれに応じて導出される。ビュー間動きベクトルが利用不可能である、すなわち、視差ベクトルによって指されたベースビュー中の参照ブロックがイントラコーディングされる場合、参照インデックスをゼロに設定することによって、従来の中央値ベース動きベクトル予測方式が使用される。

[0099]ＢＶＳＰに関する別の実装問題は、予測導出プロセスを含む。そのサイズがＮ×Ｍによって示される（ただし、ＮまたはＭは、８または１６とする）、ＭＢパーティションごとに、そのＭＢパーティションがＢＶＳＰモードでコーディングされる場合、現在のＭＢパーティションは、Ｋ×Ｋ（ただし、Ｋは、３Ｄ−ＡＶＣのためのいくつかの提案と同様に８×８であるか、４×４、２×２、または１×１であり得る）に等しいサイズをもついくつかの下位領域にさらに区分される。下位領域ごとに、別個の視差ベクトルが導出され、各下位領域が、ビュー間参照ピクチャ中の導出された視差ベクトルによって位置を特定された１つのブロックから予測され、すなわち、図４におけるＲ（ｃｂ）である。いくつかの例示的な共通試験条件では、Ｋは４になるように定義される。導出された視差ベクトルは、ＢＶＳＰコーディングされたブロックについては記憶されず、その理由は、そのようなベクトルを使用するコーディングツールがないからであることに留意されたい。

[0100]ＢＶＳＰに関する別の実装問題は、視差ベクトル導出プロセスを含む。深度優先コーディング順序が適用されるとき、視差ベクトルは、図４の例に示されるように、対応する非ベース深度ビュー中の対応する深度ブロックからの深度値を変換することによって導出される。単一の深度値が、最初に、Ｋ×Ｋ下位領域にコロケートされた／対応する深度ブロックからの４隅の深度サンプルにアクセスすることによって、および、次いで、４つのアクセスされた深度サンプルの最大値を取ることによって、計算される。計算された深度値は、後に、式（１）および（２）を使用して、視差ベクトルに変換される。テクスチャ優先コーディング順序が適用されるとき、非ベーステクスチャビューを復号するときに対応する非ベース深度ビューが利用不可能であるので、ＢＶＳＰモードが無効化される。

[0101]通常のインター予測モードのための３Ｄ−ＡＶＣにおける深度ベース動きベクトル予測（Ｄ−ＭＶＰ）について、次に説明する。Ｄ−ＭＶＰは、深度優先コーディング順序のために利用可能である、現在のビューの関連付けられた深度マップデータを使用する、動きベクトル予測方法を指す。その方法は、依存ビュー中のテクスチャビューコンポーネントとともに適用される。

[0102]３Ｄ−ＡＶＣでは、動きベクトル予測は、隣接ブロックを依然として利用する。隣接ブロックは、順に、現在のブロックの左ブロックと、上ブロックと、右上ブロックと、左上ブロックとを含む。左上ブロック中の動きベクトルは、他の３つの隣接ブロックのうちの１つが動きベクトルを含んでおらず、したがって利用不可能であると見なされるときのみ、使用される。

[0103]隣接ブロックからの動きベクトルは、予測されるべき現在の動きベクトルとして異なるタイプを有する場合、利用不可能であると見なされる。動きベクトルのタイプは、対応する参照インデックスに依存する。すなわち、参照インデックスがビュー間参照ピクチャに対応する場合、動きベクトルは、視差動きベクトルであり、タイプは「視差」であり、参照インデックスが（同じビュー中の）時間参照ピクチャに対応する場合、動きベクトルは、時間動きベクトルであり、タイプは「時間」である。

[0104]３Ｄ−ＡＶＣでは、３つの隣接ブロックが利用可能である場合、３つの隣接ブロック中の動きベクトルが、現在のブロックの動きベクトル予測のために採用される。時間的予測では、それらの動きベクトルがすべて同じタイプを有し、同じ参照インデックスを有する場合、Ｈ．２６４／ＡＶＣと同様に、メディアンフィルタが直接使用され、他の場合（動きベクトルが異なるタイプに属しており、異なる参照インデックスを有する場合）、動きベクトルがさらに導出される。現在の参照ピクチャがビュー間参照ピクチャであるとき、隣接ブロック位置における動きベクトルタイプおよびそれらの参照インデックスがチェックされ、隣接ブロックがすべて同じタイプと同じ参照インデックスとを有する場合、メディアンフィルタが適用される。どちらの場合も、３つよりも少ない隣接ブロックが利用可能である場合、３つの隣接ブロックが利用可能になるように、利用不可能なブロックのための動きベクトルがさらに導出される。

[0105]空間隣接ブロックが、利用可能な時間動きベクトルを含んでいない場合、時間動きベクトルが、現在のブロックについて予測されるべきである。参照ビューピクチャ中の現在のブロックの参照ブロックは、ブロックベースビュー合成予測に関して上記で説明されたように導出された視差ベクトルによって識別される。参照ブロックの中心位置を含んでいるブロックの動きベクトルは、時間動きベクトルである場合、現在の空間隣接ブロックについて導出される。時間動きベクトルが利用不可能であると見なされる（イントラブロック、または、現在の参照ピクチャとともに整合された参照ビュー中の参照ピクチャを指していない）場合、導出された動きベクトルは、ゼロに設定される。

[0106]空間隣接ブロックが利用可能な視差動きベクトルを含んでおらず、視差動きベクトルが、現在のブロックについて予測されるべきである場合、現在のブロックについて導出された視差ベクトルは、ブロックベースビュー合成予測に関して上記で説明されたような視差動きベクトルに変換される。

[0107]３Ｄ−ＡＶＣでは、Ｄ−ＭＶＰ方法が、Ｈ．２６４／ＡＶＣにおける従来の中央値関数ベース動きベクトル予測に組み込まれる。そのため、空間隣接ブロック中の動きベクトルが利用可能である（または、当初は利用可能ではないが、上記で述べられた方法で利用可能にされる）とき、中央値関数は、依然として３つの動きベクトルに適用され得るが、そのうちのすべてが同じタイプに属するべきである。

[0108]スキップおよび直接モードのための３Ｄ−ＡＶＣにおけるビュー間動き予測について、次に説明する。３Ｄ−ＡＶＣにおけるビュー間動き予測は、Ｐスキップ、Ｂスキップ、Ｂ−１６×１６直接、およびＢ−８×８直接モードで実行される。これらのモードでは、参照ブロックを識別するために使用される視差ベクトルは、隣接ブロックから、または、現在のＭＢに関連付けられた対応する深度ブロックからの導出された視差ベクトルから（ブロックベースビュー合成予測に関しては、上記参照）のいずれかのものである。候補隣接ブロックＡ、ＢおよびＣが、それが視差動きベクトルを有するかどうかにかかわらず、その利用可能性についてチェックされる。１つの空間隣接ブロックが利用可能である、すなわち、それが視差動きベクトルを含んでいる場合、この視差動きベクトルが視差ベクトルになる。

[0109]空間隣接ブロックＡ、ＢおよびＣのための視差ベクトルが利用不可能である場合、現在のＭＢに関連付けられた、深度ブロックから導出された視差ベクトル（ブロックベースビュー合成予測に関しては、上記参照）が、利用不可能なブロックのために使用される。その後、視差ベクトルを得るために、メディアンフィルタが適用される。

[0110]上記のプロセスから得られたこの視差ベクトルは、参照ビューピクチャ中の参照ブロックを得るために使用される。参照ブロック内で、動きベクトル（すなわち、ビュー間動きベクトル）は、利用可能な場合、現在のブロックの動きベクトルに等しく設定され、現在のブロックの参照インデックスがそれに応じて導出される。

[0111]ビュー間動きベクトルが利用可能ではない、すなわち、視差ベクトルによって指されたベースビュー中の参照ブロックがイントラコーディングされる場合、従来の中央値ベース動きベクトル予測方式が使用される。この場合、参照インデックスが最初に導出され、セクション１．４．５において説明されたＤ−ＭＶＰ方式が、現在のＭＢのための動きベクトル予測を導出するために使用される。

[0112]視差ベクトル導出のための改善について、次に説明する。ＪＣＴ３Ｖ−Ｃ０１２２では、簡略化された視差ベクトル導出方法が提案されている。提案された方法では、現在のＭＢが、スキップまたは直接ではないインター予測モードでコーディングされるとき、現在のＭＢを用いたすべてのパーティション／サブブロックは、現在のＭＢの関連付けられた深度ブロックの右下の深度サンプルから計算される、導出された視差ベクトルを共有する。ただし、現在のＭＢがスキップまたは直接モードでコーディングされるとき、異なる視差ベクトル導出プロセス、すなわち、参照深度ブロックの４隅のサンプルにアクセスすることが、利用される。さらに、ＢＶＳＰモードでは、ＭＢパーティションの各Ｋ×Ｋ下位領域の参照深度ブロックの４隅のサンプルにアクセスすることが、依然として必要とされる。

[0113]ＪＣＴ３Ｖ−Ｃ０１３４では、インターモードでコーディングされるとき、同じＭＢ内のすべてのパーティションブロックが、現在のＭＢにコロケートされる／対応する同じ参照深度ブロックからの４隅のサンプルの最大深度値から導出される単一の視差ベクトルを共有することが提案されている。ただし、ＢＶＳＰモードでは、ＭＢパーティションの各Ｋ×Ｋ下位領域の参照深度ブロックの４隅のサンプルにアクセスすることが、依然として必要とされる。

[0114]本開示は、次に、３Ｄ−ＨＥＶＣの態様について説明する。隣接ブロックベース視差ベクトル導出（ＮＢＤＶ）は、すべてのビューに対してテクスチャ優先コーディング順序を使用する３Ｄ−ＨＥＶＣにおける視差ベクトル導出方法として使用され得る。現在の３Ｄ−ＨＥＶＣの設計では、ＮＢＤＶから導出された視差ベクトルは、参照ビューの深度マップから深度データを取り出すことによって、さらに精緻化され得る。ＮＢＤＶでは、視差ベクトル（ＤＶ）は、２つのビューの間の変位を推定するものとして使用される。隣接ブロックは、ビデオコーディングにおいてほぼ同じ動き／視差情報を共有するので、現在のブロックは、良い予測子として、隣接ブロック中の動きベクトル情報を使用することができる。この考えに従って、ＮＢＤＶは、異なるビュー中の視差ベクトルを推定するために、隣接視差情報を使用する。

[0115]いくつかの空間隣接ブロックおよび時間隣接ブロックは、最初に定義される。隣接ブロックの各々が、次いで、現在のブロックと候補ブロックとの間の相関の優先度によって決定された、あらかじめ定義された順序でチェックされる。視差動きベクトル（すなわち、ビュー間参照ピクチャを指す動きベクトル）が候補中で発見されると、視差動きベクトルが視差ベクトルに変換される。２つのセットの隣接ブロックが利用される。一方のセットは、空間隣接ブロックからのものであり、他方のセットは、時間隣接ブロックからのものである。

[0116]３Ｄ−ＨＥＶＣは、ＪＣＴ３Ｖ−Ａ００９７、３Ｄ−ＣＥ５．ｈ：Ｄｉｓｐａｒｉｔｙｖｅｃｔｏｒｇｅｎｅｒａｔｉｏｎｒｅｓｕｌｔｓ、Ｌ．Ｚｈａｎｇ、Ｙ．Ｃｈｅｎ、Ｍ．Ｋａｒｃｚｅｗｉｃｚ（Ｑｕａｌｃｏｍｍ）において提案された隣接ブロック（ベース）視差ベクトル（ＮＢＤＶ）方法を、最初に採用した。暗黙的視差ベクトル（implicit disparity vector）が、ＪＣＴＶＣ−Ａ０１２６、３Ｄ−ＣＥ５．ｈ：ＳｉｍｐｌｉｆｉｃａｔｉｏｎｏｆｄｉｓｐａｒｉｔｙｖｅｃｔｏｒｄｅｒｉｖａｔｉｏｎｆｏｒＨＥＶＣ−ｂａｓｅｄ３Ｄｖｉｄｅｏｃｏｄｉｎｇ、Ｊ．Ｓｕｎｇ、Ｍ．Ｋｏｏ、Ｓ．Ｙｅａ（ＬＧ）において簡略化されたＮＢＤＶとともに含まれた。それに加えて、ＪＣＴ３Ｖ−Ｂ００４７、３Ｄ−ＣＥ５．ｈｒｅｌａｔｅｄ：Ｉｍｐｒｏｖｅｍｅｎｔｓｆｏｒｄｉｓｐａｒｉｔｙｖｅｃｔｏｒｄｅｒｉｖａｔｉｏｎ、Ｊ．Ｋａｎｇ、Ｙ．Ｃｈｅｎ、Ｌ．Ｚｈａｎｇ、Ｍ．Ｋａｒｃｚｅｗｉｃｚ（Ｑｕａｌｃｏｍｍ）では、ＮＢＤＶは、復号されたピクチャバッファに記憶された暗黙的視差ベクトルを除去することによって、さらに簡略化されるが、また、ＲＡＰピクチャ選択を用いてコーディング利得も改善した。

[0117]現在の（本開示の時間現在での）ＮＢＤＶでは、５つの空間隣接ブロックが、視差ベクトル導出のために使用される。それらは、図５におけるＡ０、Ａ１、Ｂ０、Ｂ１またはＢ２によって示されるような、現在のブロック（たとえば、現在の予測ユニット（ＰＵ））の左下ブロック、左ブロック、右上ブロック、上ブロック、および左上ブロックである。これらの隣接ブロックは、ＨＥＶＣにおけるマージモードにおいて使用されたものと同じであることに留意されたい。したがって、追加のメモリアクセスが必要とされない。

[0118]時間隣接ブロックをチェックするために、ビデオコーダは、候補ピクチャリストの構成プロセスを最初に実行し得る。一例では、現在のビューからの最大２つの参照ピクチャが、候補ピクチャとして扱われ得る。ビデオコーダは、コロケートされた参照ピクチャを候補ピクチャリストに最初に挿入することができ、参照インデックスの昇順に候補ピクチャの残りによって後続される。両方の参照ピクチャリスト中で同じ参照インデックスをもつ参照ピクチャが利用可能であるとき、コロケートされたピクチャの同じ参照ピクチャリスト中のものが、他のものに先行し得る。候補ピクチャリスト中の候補ピクチャごとに、時間隣接ブロックを導出するために３つの候補領域が決定され得る。

[0119]ブロックがビュー間動き予測でコーディングされるとき、異なるビュー中の対応するブロックを選択するために、視差ベクトルが導出され得る。暗黙的視差ベクトル（ＩＤＶ、導出された視差ベクトルとも呼ばれる）は、ビュー間動き予測において導出された視差ベクトルと呼ばれる。ブロックが動き予測でコーディングされるとしても、導出された視差ベクトルは、後続のブロックをコーディングする目的のために破棄されない。

[0120]３Ｄ−ＨＴＭ６．０の現在の設計では、ビデオコーダは、ＮＢＤＶプロセスに従って、時間隣接ブロック中の視差動きベクトルと、空間隣接ブロック中の視差動きベクトルと、次いでＩＤＶとを、順にチェックする。視差動きベクトルまたはＩＤＶが発見されると、プロセスは終了させられる。

[0121]ビデオコーダは、深度情報にアクセスすることによって、ＮＢＤＶを使用して導出された視差ベクトルをさらに精緻化し得る。１つの視差ベクトルがＮＢＤＶプロセスから導出されるとき、ビデオコーダは、参照ビューの深度マップから深度データを取り出すことによって、視差ベクトルをさらに精緻化し得る。精緻化プロセスは、２つのステップを含み得る。

ａ）ベースビューなど、前にコーディングされた参照深度ビュー中の導出された視差ベクトルによって、対応する深度ブロックの位置を特定し、対応する深度ブロックのサイズは、現在のＰＵのものと同じである。

ｂ）対応する深度ブロックの４隅のピクセルから１つの深度値を選択し、それを、精緻化された視差ベクトルの水平成分に変換する。視差ベクトルの垂直成分は、不変である。

[0122]ビデオコーダは、ビュー間動き予測のために、精緻化された視差ベクトルを使用し得るが、一方精緻化されていない視差ベクトルは、ビュー間残差予測のために使用される。加えて、精緻化された視差ベクトルは、後方ＶＳＰモードでコーディングされる場合、１つのＰＵの動きベクトルとして記憶され得る。

[0123]本開示の技法によれば、空間隣接ブロックのうちの１つは、ＢＶＳＰコーディングされたブロックに対応し得、空間隣接ブロックのうちの別のものは、非ＢＶＳＰコーディングされたブロックに対応し得る。たとえば、ブロックＡ１は、ＢＶＳＰコーディングされたブロックに対応し得、ブロックＢ１は、非ＢＶＳＰコーディングされたブロックに対応し得る。それにもかかわらず、現在のブロックのための動き情報をコーディングするとき、ビデオコーダは、同じ論理関数を使用してブロックＡ１とブロックＢ１の両方のための動き情報にアクセスし得る。上記で述べられた例における、ＢＶＳＰコーディングされたブロック、すなわち、ブロックＡ１のための動き情報は、参照ピクチャを識別する参照インデックスを含むことが仮定される。したがって、ブロックＡ１の動き情報にアクセスするための別個の論理関数が、ビデオコーダにおいて与えられる必要がない。

[0124]図６は、隣接ブロックを使用する後方ビュー合成予測（ＢＶＳＰ）に関する技法を示す概念図である。ＢＶＳＰは、３Ｄ−ＨＥＶＣのための技法として提案され、採用されている。ＪＣＴ３Ｖ−Ｃ０１５２において提案されたような後方ワーピングＶＳＰ手法が、第３回ＪＣＴ−３Ｖ会合において採用された。この後方ワーピングＶＳＰの基本的な考えは、３Ｄ−ＡＶＣにおけるブロックベースＶＳＰと同じである。これらの２つの技法の両方は、動きベクトル差分を送信することを避け、より正確な動きベクトルを使用するために、後方ワーピングおよびブロックベースＶＳＰを使用する。実装の詳細は、異なるプラットフォームのために異なる。本開示は、概して、３Ｄ−ＨＥＶＣにおける後方ビュー合成予測を指すために頭文字語ＢＶＳＰを使用するが、ＢＶＳＰはまた、３Ｄ−ＡＶＣのブロックベースビュー合成予測を指すこともある。

[0125]３Ｄ−ＨＴＭでは、テクスチャ優先コーディングが共通試験条件において適用される。したがって、対応する非ベース深度ビューは、１つの非ベーステクスチャビューを復号するとき、利用不可能である。したがって、深度情報が推定され、ＢＶＳＰを実行するために使用される。ブロックのための深度情報を推定するために、隣接ブロックから視差ベクトルを最初に導出し、次いで、参照ビューから深度ブロックを取得するために、導出された視差ベクトルを使用することが提案された。

[0126]ＨＴＭ５．１試験モデルでは、ＮＢＤＶ（隣接ブロック視差ベクトル）として知られる視差ベクトル予測子を導出するためのプロセスが存在する。（ｄｖｘ，ｄｖｙ）がＮＢＤＶ関数から識別された視差ベクトルを示し、現在のブロック位置が（ｂｌｏｃｋｘ，ｂｌｏｃｋｙ）であるとする。参照ビューの深度画像中の（ｂｌｏｃｋｘ＋ｄｖｘ，ｂｌｏｃｋｙ＋ｄｖｙ）における深度ブロックをフェッチすることが提案された。フェッチされた深度ブロックは、現在の予測ユニット（ＰＵ）の同じサイズを有することになり、それが次いで、現在のＰＵのための後方ワーピングを行うために使用されることになる。図６は、参照ビューから深度ブロックの位置を特定し、次いで、ＢＶＳＰ予測のためにその深度ブロックを使用するためのステップを示す。

[0127]図６の例では、深度ピクチャ１５０およびテクスチャピクチャ１５４は、同じビューに対応するが、一方テクスチャピクチャ１５２は、異なるビューに対応する。特に、テクスチャピクチャ１５２は、参照ピクチャとして働く、テクスチャピクチャ１５４に対してコーディングされている現在のブロック１６０を含む。ビデオコーダは、現在のブロック１６０に隣接する、隣接ブロック１６２を参照し得る。隣接ブロック１６２は、以前に決定された視差ベクトル１６６を含む。視差ベクトル１６６は、現在のブロック１６０のための視差ベクトル１６４として導出され得る。したがって、視差ベクトル１６４は、参照ビューの深度ピクチャ１５０中の深度ブロック１５６を参照する。

[0128]ビデオコーダは、次いで、後方ワーピングを実行するために、現在のブロック１６０のピクセルのための視差値１６８（すなわち、テクスチャ値）を決定するために、深度ブロック１５６のピクセル（すなわち、深度値）を使用し得る。ビデオコーダは、次いで、視差値１６８によって識別されたピクセルから、現在のブロック１６０のための予測されたブロック（すなわち、ＢＶＳＰ参照ブロック）のための値を合成し得る。ビデオコーダは、次いで、この予測されたブロックを使用して、現在のブロック１６０を予測し得る。たとえば、ビデオエンコーダ２０によるビデオ符号化中に、ビデオエンコーダ２０は、残差値を生成するために、予測されたブロックと現在のブロック１６０との間のピクセルごとの差分を計算し得、ビデオエンコーダ２０は、次いで、それを変換、量子化、およびエントロピー符号化し得る。他方では、ビデオデコーダ３０によるビデオ復号中に、ビデオデコーダ３０は、残差データをエントロピー復号、逆量子化、および逆変換し、次いで、現在のブロック１６０を再生するために、残差データを（ピクセルごとのベースで）予測されたブロックと結合し得る。

[0129]ＪＣＴ３Ｖ−Ｃ０１５２は、以下で説明されるように、３Ｄ−ＨＥＶＣのＢＶＳＰ技法への変更を提案した。特に、イタリック体のテキストは、３Ｄ−ＨＥＶＣに追加されたテキストを表すが、一方「除去された（removed:）」が前に付けられた括弧付きのテキストは、３Ｄ−ＨＥＶＣからの削除を表す。

ＢＶＳＰがシーケンスにおいて可能にされる場合、ビュー間動き予測のためのＮＢＤＶプロセスが変更され、差異が以下のパラグラフにおいて強調される。

●時間隣接ブロックの各々について、それが視差動きベクトルを使用する場合、その視差動きベクトルが視差ベクトルとして返され、それが、３Ｄ−ＨＥＶＣのセクション１．６．１．３において説明された方法を用いてさらに精緻化される。

●空間隣接ブロックの各々について、以下が適用される。

〇順に、参照ピクチャリスト０および参照ピクチャリスト１について、
□それが視差動きベクトルを使用する場合、その視差動きベクトルが視差ベクトルとして返され、それが、セクション１．６．１．３において説明された方法を用いてさらに精緻化される。

□そうでない場合、それがＢＶＳＰモードを使用する場合、関連付けられた動きベクトルが視差ベクトルとして返される。それが、セクション１．６．１．３において説明されたものと同様の方法で、さらに精緻化される。ただし、最大深度値は、４隅のピクセルではなく、対応する深度ブロックのすべてのピクセルから選択され、精緻化された視差ベクトルの垂直成分は、０に設定される。

●空間隣接ブロックの各々について、それがＩＤＶを使用する場合、そのＩＤＶが視差ベクトルとして返され、それが、セクション１．６．１．３において説明された方法を用いてさらに精緻化される。

[0130]導入されたＢＶＳＰモードは、空間インターコード化モードとして扱われ、ＢＶＳＰモードの使用を示すフラグが、ＰＵごとに維持され得る。ビットストリーム中でフラグをシグナリングするのではなく、新しいマージング候補（ＢＶＳＰマージング候補）がマージ候補リストに追加された。フラグは、復号されたマージ候補インデックスがＢＶＳＰマージング候補に対応するかどうかに依存する。ＢＶＳＰマージング候補は、次のように、ＪＣＴ３Ｖ−Ｃ０１５２によって、定義される。

●参照ピクチャリストごとの参照ピクチャインデックス：−１
●参照ピクチャリストごとの動きベクトル：精緻化された視差ベクトル
[0131]ＪＣＴ３Ｖ−Ｃ０１５２では、ＢＶＳＰマージング候補の挿入された位置は、以下で説明されるように、空間隣接ブロックに依存する。

●５つの空間隣接ブロックのいずれか（図５に示されたＡ０、Ａ１、Ｂ０、Ｂ１、またはＢ２）が、ＢＶＳＰモードでコーディングされる、すなわち、隣接ブロックの維持されたフラグが１に等しい場合、ＢＶＳＰマージング候補は、対応する空間マージング候補として扱われ、マージ候補リストに挿入される。ＢＶＳＰマージング候補は、マージ候補リストに一度のみ挿入されることになる。

●そうでない（５つの空間隣接ブロックのいずれもがＢＶＳＰモードでコーディングされない）場合、ＢＶＳＰマージング候補は、時間マージング候補の直前に、マージ候補リストに挿入される。

[0132]組み合わされた双予測マージング候補導出プロセス中に、ＢＶＳＰマージング候補を含めることを避けるために、追加の条件がチェックされ得ることに留意されたい。

[0133]ＪＣＴ３Ｖ−Ｊ０１５２は、そのサイズがＮ×Ｍによって示された、各ＢＶＳＰコーディングされたＰＵが、Ｋ×Ｋ（ただし、Ｋは４または２であり得る）に等しいサイズをもついくつかの下位領域にさらに区分されることを、さらに規定した。下位領域ごとに、別個の視差動きベクトルが導出され、各下位領域が、ビュー間参照ピクチャ中の導出された視差動きベクトルによって位置を特定された１つのブロックから予測される。言い換えれば、ＢＶＳＰコーディングされたＰＵのための動き補償ユニットのサイズは、Ｋ×Ｋに設定される。共通試験条件では、Ｋは４に設定される。

[0134]ＪＣＴ３Ｖ−Ｊ０１５２は、ＢＶＳＰモードでコーディングされた１つのＰＵ内の下位領域（４×４ブロック）ごとに、対応する４×４深度ブロックが、第１に、上記で上述された精緻化された視差ベクトルを用いて、参照深度ビュー中で位置を特定されることを、さらに規定している。第２に、対応する深度ブロック中の１６個の深度ピクセルの最大値が選択される。第３に、最大値が視差動きベクトルの水平成分に変換される。視差動きベクトルの垂直成分は、０に設定される。

[0135]３Ｄ−ＨＥＶＣでは、テクスチャ優先コーディング順序が適用されるとき、予測ユニット（ＰＵ）ごとに、参照深度ビュー中の考慮深度値あり／なしで、視差ベクトルがＮＢＤＶから導出され得る。視差ベクトルが取得された後、視差ベクトルは、１つのＰＵがＢＶＳＰモードでコーディングされる場合、そのＰＵの４×４下位領域ごとにさらに精緻化されることになる。

[0136]３Ｄ−ＨＥＶＣは、精緻化プロセスを２つのステップを含むものとして説明している、すなわち、１）導出された視差ベクトルによって位置を特定される参照深度ビュー中の４×４深度ブロックから１つの最大深度値を選択し、２）精緻化された視差ベクトルの垂直成分を０になるように保ちながら、深度値を精緻化された視差ベクトルの水平成分に変換する。視差ベクトルが１つのＰＵの１つの４×４下位領域について精緻化された後、３Ｄ−ＨＥＶＣは、精緻化された視差ベクトルが、動き補償のために参照テクスチャビュー中で１つのブロックの位置を特定するために使用されることを規定している。

[0137]３Ｄ−ＡＶＣにおけるＮＢＤＶについて、次に説明する。いくつかの３Ｄコーディング技法によれば、ＭＢレベルＮＢＤＶは、現在のＭＢのための視差ベクトルを導出するために使用され、動きベクトル予測のためにさらに使用され得る。視差動きベクトルが識別されると、すなわち、時間または空間隣接ブロックのうちの１つがビュー間参照ピクチャを使用すると、それが現在のＭＢのための視差ベクトルとして返される。

[0138]いくつかの３Ｄコーディング技法によれば、ＮＢＤＶから導出された視差ベクトルは、対応する深度ブロックにアクセスすることによって、さらに精緻化され得る。たとえば、（視差ベクトルによって識別された）参照ビューの深度ブロックの４隅の深度値が使用されてよく、最大深度値が選択され、視差ベクトルに変換される。他の３Ｄコーディング技法によれば、ＢＶＳＰは、各４×４または８×８ブロックに対してある方法で利用され、対応する深度ブロックが、視差動きベクトルを生成するために使用される。視差ベクトル導出プロセスと同様に、（精緻化された視差ベクトルによって識別された）深度ブロックの４隅が使用されてよく、最大深度値が、視差動きベクトルに変換されるように選択される。

[0139]本開示の技法は、いくつかの潜在的な問題に対処し得る。一例として、インターモードにおけるＤ−ＭＶＰでは、１つのＭＢ中の様々なパーティションブロックのためのＤＶを導出するために、深度−ＤＶ変換が複数回実行される必要があり、そのことが、現在のＭＢがパーティション／サブブロックに分割されるとき、メモリからアクセスされるべき深度サンプルの数を増す。別の例として、スキップ／直接モードにおけるＤ−ＭＶＰでは、関連付けられた深度ブロックの４隅のサンプルの最大深度値を取ることによって、視差ベクトルがＭＢについて導出され、これは、高いメモリアクセス帯域幅を必要とする。別の例として、ＢＶＳＰモードでは、現在の下位領域の関連付けられた深度ブロックの４隅の深度サンプルの最大値を取ることによって、視差ベクトルがサイズＫ×Ｋの下位領域について導出され、これは、高いメモリアクセス帯域幅を犠牲にして行われる。別の例として、スキップ／直接ＭＢでは、ビュー間動きベクトルが利用可能ではないとき、従来の中央値ベース動きベクトル予測が使用される。別の例として、３Ｄ−ＨＥＶＣでは、視差ベクトルがビュー間予測された隣接ブロックから導出されるとき、現在のブロックのための視差ベクトルを精緻化することは、参照深度ブロックの４隅にアクセスすることのみを必要とする。視差ベクトルがＢＶＳＰコーディングされた隣接ブロックから導出されるとき、現在のブロックのための視差ベクトルを精緻化することと、ＢＶＳＰモードでコーディングされたＰＵのための４×４または８×８下位領域のための視差動きベクトルを生成することとは、わずかに異なる設計を必要とし、その設計は、参照ブロックのすべてのサンプルにアクセスすることを必要とする。

[0140]本開示は、深度マップにアクセスすることによって視差ベクトルが導出されるとき、視差（動き）ベクトル導出プロセスを簡略化し得る技法を導入する。これらの技法の説明は、主に３Ｄ−ＡＶＣに焦点を合わせ得るが、同様の考えが３Ｄ−ＨＥＶＣに適用可能であり得ることを理解されたい。より詳細には、本開示は、深度−視差変換方式が利用されるとき、様々なインター予測モード（スキップ／直接、インターを含む）ならびにＢＶＳＰモードのための、簡略化および統合された視差ベクトル導出方式を提供する。計算およびメモリアクセスが簡略化され得る。

[0141]図７は、８×８深度ブロック１７０の一例を示す。深度ブロック１７０の４隅のサンプルは、１７２Ａ〜１７２Ｄと標示される。ビットストリーム中の「ｒｅｄｕｃｅｄ＿ｒｅｓｏｌｕｔｉｏｎ＿ｆｌａｇ」は、深度ビューがテクスチャビューに対して低減された解像度を有するかどうか、または、深度ビューがテクスチャビューと同じ解像度を有するかどうかを示し得る。ｒｅｄｕｃｅｄ＿ｒｅｓｏｌｕｔｉｏｎ＿ｆｌａｇが１に等しい場合、テクスチャビュー中の１６×１６マクロブロックは、対応するテクスチャビュー中の、８×８深度ブロック１７０など、対応する（すなわち、コロケートされた）８×８深度ブロックを有することになる。ｒｅｄｕｃｅｄ＿ｒｅｓｏｌｕｔｉｏｎ＿ｆｌａｇが０に等しい場合、、テクスチャビュー中の１６×１６マクロブロックは、対応するテクスチャビュー中の対応する（すなわち、コロケートされた）１６×１６深度ブロックを有することになる。以下のいくつかの例について、深度ブロック１７０を参照することによって説明する。

[0142]本開示の１つの技法によれば、非ベーステクスチャビューコンポーネントをコーディングするとき、ビデオデコーダ３０は、現在のテクスチャブロックを含んでいるマクロブロックに対応する深度ブロックにアクセスすることによって、マクロブロック全体のためのただ１つの視差ベクトルを導出し得る。現在のＭＢがスキップ／直接モードでコーディングされるか、他のインターモードでコーディングされるかにかかわらず、視差ベクトルがＭＢ内の任意のブロックについて必要とされるときは常に、ビデオデコーダ３０は、同じＭＢレベル視差ベクトル導出から同じ唯一の視差ベクトルを一度導出し得る。ビデオデコーダ３０は、たとえば、隅のサンプル１７２Ａ〜１７２Ｄの深度値にアクセスし、４隅のサンプルから最大深度値を決定することによって、視差ベクトルを導出し得る。ビデオデコーダ３０は、次いで、たとえば、ルックアップテーブルまたは上記の式（１）と（２）とを使用して、最大深度値を視差値に変換し得る。いくつかの実装形態では、ビデオデコーダ３０は、４隅のサンプル以外の深度値にアクセスすることによって、および／または、最大値以外の値を識別することによって、視差ベクトルを導出し得る。

[0143]一例として、非ベーステクスチャビューのマクロブロックについて、ビデオデコーダ３０は、マクロブロックに対応する深度ブロックの位置を特定し、深度ブロックの少なくとも１つの深度値に基づいて、マクロブロックのための視差ベクトルを導出し得る。ビデオデコーダ３０は、導出された視差ベクトルに基づいてマクロブロックの第１のサブブロックをコーディングし、導出された視差ベクトルに基づいてマクロブロックの第２のサブブロックをコーディングし得る。深度ブロックおよびマクロブロックは、コロケートされ得る。ビデオデコーダ３０は、深度ブロックの２つ以上の隅のサンプルの深度値を含む、深度値のセットを決定することによって、マクロブロックのための視差ベクトルを導出し、深度値のセットから、最大深度値を識別し得る。ビデオデコーダ３０は、たとえば、スキップモードおよび直接モードのうちの１つを使用して、第１のサブブロックをコーディングし、スキップモードまたは直接モード以外のインター予測モードを使用して、第２のサブブロックをコーディングし得る。

[0144]スキップ／直接モードとインター予測との間の１つの潜在的な差分が、次いで、マクロブロックのとき）スキップ／直接モードを使用してコーディングされ、いかなる区分もないようになり、すなわち、１６×１６のＭＢサイズが完全にコーディングされる。ＭＢが、スキップ／直接以外のモード（すなわち、インターモード）を使用してコーディングされるとき、ＭＢ区分が存在し得る。また、各ＭＢパーティションがサブブロック（すなわち、Ｈ．２６４／ＡＶＣサブブロック）にさらに区分され得る。本開示の技法によれば、ＭＢのために導出された同じ視差ベクトルが、スキップ／直接およびインターモードなど、すべてのモードのために使用され得る。

[0145]本開示の別の技法によれば、同じビュー内の深度ビューコンポーネントの対応する深度ブロックから視差ベクトルを導出するとき、現在のＭＢの対応する深度ブロックの左下（１７２Ａ）および右下（１７２Ｂ）隅の深度サンプルのみがアクセスされる。図７に示されるように、典型的には、ＭＢは、３Ｄ−ＡＶＣにおいて、同じビュー中の８×８参照ブロックに対応する。深度ブロックは、典型的には、（半分に水平および垂直ダウンサンプドされて）より低い空間解像度を有する。したがって、１６×１６マクロブロックは、８×８深度ブロックに対応する。本開示の１つの技法によれば、隅のサンプル１７２Ａおよび１７２Ｂのみが、ＭＢ全体のための視差ベクトルを導出するためにアクセスされる。さらに、アクセスされた深度サンプルの最大深度値は、それを視差ベクトルに変換するために使用される。代替的に、参照深度ブロックの左上（１７２Ｃ）および右下（１７２Ｂ）隅のサンプルのみがアクセスされる。代替的に、参照深度ブロックの左上（１７２Ｃ）および右上（１７２Ｄ）隅のサンプルのみがアクセスされる。代替的に、参照深度ブロックの左下（１７２Ａ）および右下（１７２Ｂ）隅のサンプルのみがアクセスされる。代替的に、参照深度ブロックの左下（１７２Ａ）および右上（１７２Ｄ）隅のサンプルのみがアクセスされる。代替的に、参照深度ブロックの右下（１７２Ｂ）および右上（１７２Ｄ）隅のサンプルのみがアクセスされる。代替的に、対応する深度ブロック内に位置する任意の他の２つのサンプルがアクセスされ、たとえば、１つの中心ピクセルおよび１つの隅のピクセル、または２つの中心ピクセルなどである。代替的に、２つのサンプルがアクセスされるとき、最大値ではなく、これらの２つの深度サンプルの平均／最小値が使用され得る。

[0146]本開示の別の技法によれば、同様の深度−視差変換方法が、ＭＢパーティション内でサイズＫ×Ｋの下位領域ごとに視差ベクトルを導出するために、ＢＶＳＰモードにおいて使用され得る。参照深度ブロックが、Ｋ×Ｋ下位領域について最初に識別され、ＭＢレベル視差ベクトル導出におけるものと同様に、参照深度ブロックの相対座標（relative coordination）における位置（たとえば、Ｋ×Ｋ下位領域に対応する／コロケートされた参照深度ブロックの右下および左下隅）をもつ同じ隅のサンプルがアクセスされる。代替的に、参照深度ブロックのより少数の隅のサンプルが、ＢＶＳＰのためにアクセスされ得る。

[0147]本開示の別の技法によれば、現在の３Ｄ−ＡＶＣのスキップ／直接モードでは、ビュー間動きベクトルが利用不可能であるとき、動きベクトル予測子が、３つの隣接ブロックの動きベクトルの中間を使用するのではなく、参照インデックスを含む、第１の利用可能な空間ネイバーの動きベクトルであるように設定される。空間ネイバーのいずれかが０以上の参照ピクチャインデックスを有するかどうかを、順にチェックする。真である場合、現在のＭＢの動きベクトルおよび参照ピクチャインデックスは、それぞれ、空間隣接ブロックの動きベクトルおよび参照インデックスに等しくなるように設定され、チェックプロセスが終了する。

[0148]本開示の別の技法によれば、ＮＢＤＶが３Ｄ−ＡＶＣのために使用され、参照ビューの深度マップが、視差ベクトルを精緻化するために使用されるとき、同じ２つの隅のサンプルが、精緻化された視差ベクトルに変換されるべき１つの最適な深度値を得るために使用され得る。

[0149]本開示の別の技法によれば、ＮＢＤＶが３Ｄ−ＡＶＣのために使用され、参照ビューの深度マップが、ＢＶＳＰモードで視差動きベクトルを生成するために使用されるとき、同じ２つの隅のサンプルが、視差動きベクトルに変換されるべき１つの最適な深度値を得るために使用され得る。

[0150]本開示の別の技法によれば、３Ｄ−ＨＥＶＣでは、同様に、ＢＶＳＰモードで視差動きベクトルのための参照ブロックにアクセスすることは、隣接ブロックの隅のサンプルを単にチェックすることによって、ある方法で整合され得る。言い換えれば、Ｋ×Ｋ下位領域ごとに、ビデオデコーダ３０は、Ｋ×Ｋ下位領域を含んでいる予測ユニットの視差ベクトルによって識別されたＫ×Ｋ下位領域の参照深度ブロックの隅のサンプルのみをチェックする。さらに、上記で説明されたような簡略化は、ＭＢブロックではなく、ＰＵまたはＣＵに精緻化を適用することによって、３Ｄ−ＨＥＶＣに適用可能であり得る。

[0151]上記で説明された技法を実装する態様について、スキップ／直接モードにおける視差ベクトル導出から始めて、以下でより詳細に説明する。この例では、現在のピクチャに対する現在のＭＢの左上サンプルのロケーションは、（ｘ，ｙ）によって示される。１つの深度値（Ｄ）は、次のように参照深度ビュー中の左下および右下隅のピクセルから、現在のＭＢについて選択される。

ただし、関数ｍａｘ（・）は、Ｄｉ（ｉは０から１である）の最大値を返し、Ｄｉは、次のように計算されるｉ番目のピクセルロケーションにおける深度値を示す。

ここで、ＳＭＤ＿ＰＯＳは、「ｒｅｄｕｃｅｄ＿ｒｅｓｏｌｕｔｉｏｎ＿ｆｌａｇ」がそれぞれ１および０に等しいとき、７および１５に等しい。１に等しい「ｒｅｄｕｃｅｄ＿ｒｅｓｏｌｕｔｉｏｎ＿ｆｌａｇ」は、あるビューコンポーネントペアの深度ビューコンポーネントが同じビューコンポーネントペアのテクスチャビューコンポーネントのルーマ成分よりも低い空間解像度を有すること、ならびに、深度ビューコンポーネントの幅と高さの両方が、すべてのテクスチャビューコンポーネントの幅および高さの半分であることを指定する。０に等しい「ｒｅｄｕｃｅｄ＿ｒｅｓｏｌｕｔｉｏｎ＿ｆｌａｇ」は、深度ビューコンポーネントとテクスチャビューコンポーネントの両方が存在するとき、それらが同じ空間解像度を有することを指定する。最後に、視差ベクトルの水平成分が、式（１）と（２）とを使用して、選択された深度値Ｄから計算され、視差ベクトルの垂直成分は、常に０に設定される。

[0152]インターモードにおける視差ベクトル導出について、次に説明する。この例では、現在のピクチャに対する（現在のパーティション／下位領域が位置する）現在のＭＢの左上位置は、（ｘ，ｙ）によって示される。１つの深度値（Ｄ）は、次のように参照深度ビュー中の左下および右下隅のピクセルから、現在のＭＢについて選択される。

ここで、ＳＭＤ＿ＰＯＳおよびｒｅｄｕｃｅｄ＿ｒｅｓｏｌｕｔｉｏｎ＿ｆｌａｇは、上記で説明されたように機能する。最後に、視差ベクトルの水平成分が、式（１）と（２）、またはルックアップテーブルを使用して、選択された深度値Ｄから計算され、視差ベクトルの垂直成分は、０に設定され得る。

[0153]ＢＶＳＰモードにおける視差ベクトル導出について、次に説明する。Ｋ×Ｋ（ただし、Ｋは８または４であり得る）による下位領域のサイズ、現在のピクチャに対する現在のＭＢパーティション内の１つの下位領域の左上位置は、（ｘ，ｙ）によって示される。１つの深度値（Ｄ）は、次のように参照深度ビュー中の左下および右下隅のピクセルから、サイズＫ×Ｋの下位領域ごとに選択される。

ただし、関数ｍａｘ（・）は、Ｄｉ（ｉは０から１である）の最大値を返し、Ｄｉは、次におけるｉ番目の深度ピクセルロケーションを示す。

ここで、ＶＳＰ＿Ｓは次のように計算される。

および、ｒｅｄｕｃｅｄ＿ｒｅｓｏｌｕｔｉｏｎ＿ｆｌａｇは、上記で定義されたように機能する。最後に、視差ベクトルの水平成分が、式（１）と（２）、またはルックアップテーブルを使用して、選択された深度値Ｄから計算され得、視差ベクトルの垂直成分は、０に設定され得る。

[0154]ビュー間動きが利用可能ではないときのスキップ／直接モードにおけるＭＶＰについて、次に説明する。この例では、ｉが０、１および２に等しい、（０および１に等しいＸについての）動きベクトルＭｖｃ＿Ｘ［ｉ］および参照インデックスＲｉｃ＿Ｘ［ｉ］が、現在のＭＢの空間ネイバーＡ、ＢおよびＣにそれぞれ示される。現在のスキップ／直接ＭＢに対応するベースビュー中の参照ブロックがイントラモードで符号化されるとき、現在のＭＢのための予測された動きベクトル（Ｍｖｐ０，Ｍｖｐ１）および参照インデックス（Ｒｉ０，Ｒｉ１）が次のように計算される。

１．Ｍｖｐ０，Ｍｖｐ１の両方をゼロ動きベクトル［０，０］に等しく初期化し、参照インデックスＲｉ０，Ｒｉ１が−１に等しく設定される。

２．すべての空間候補ネイバーが−１に等しい参照インデックスを有する（すなわち、すべてのｉ＝０、１、２について、Ｒｉｃ＿０［ｉ］＝−１およびＲｉｃ＿１［ｉ］＝−１）とき、現在のＭＢの動きベクトルおよび参照インデックスがゼロに設定される。

３．０から２であるｉについて、以下が適用される。

〇ｉ番目（ｉ＝０、１、２）の空間ネイバーがゼロ以上の参照インデックスを有する場合、予測された動きベクトルＭｖｐ０とＭｖｐ１とを、それぞれ、動きベクトルＭｖＣ＿０［ｉ］およびＭｖＣ＿１［ｉ］に等しくなるように設定する。さらに、参照インデックスＲｉ０およびＲｉ１が、それぞれ、参照インデックスＲｉｃ＿０［ｉ］およびＲｉｃ＿１［ｉ］に等しく設定される。

[0155]図８は、本開示で説明される技法を実装し得るビデオエンコーダの一例を示すブロック図である。たとえば、図８は、３Ｄ−ＡＶＣ準拠または３Ｄ−ＨＥＶＣ準拠のいずれかのビデオエンコーダを表し得る、ビデオエンコーダ２０を示す。ビデオエンコーダ２０について、ＰＵ、ＴＵ、およびＣＵなど、あるＨＥＶＣ用語を使用して説明するが、ビデオエンコーダ２０に関して説明される技法はまた、Ｈ．２６４規格に従ってコーディングされたビデオとともに実行され得ることを理解されたい。

[0156]ビデオエンコーダ２０は、ビデオスライス内のビデオブロックのイントラコーディングとインターコーディングとを実行することができる。たとえば、ビデオエンコーダ２０は、インター予測符号化またはイントラ予測符号化を実行できる。イントラコーディングは、所与のビデオフレームまたはピクチャ内のビデオの空間的冗長性を低減または除去するために、空間的予測に依拠する。インターコーディングは、ビデオシーケンスの隣接フレームもしくはピクチャ内の時間的冗長性、または、異なるビュー中のピクチャ間の冗長性を低減または除去するために、時間的予測またはビュー間予測に依拠する。イントラモード（Ｉモード(登録商標)）は、いくつかの空間ベースの圧縮モードのいずれかを指すことがある。単方向予測（Ｐモード）または双方向予測（Ｂモード）などのインターモードは、いくつかの時間ベースの圧縮モードのいずれかを指すことがある。

[0157]図８の例では、ビデオエンコーダ２０は、ビデオデータメモリ４０と、予測処理ユニット４２と、参照ピクチャメモリ６４と、加算器５０と、変換処理ユニット５２と、量子化処理ユニット５４と、エントロピー符号化ユニット５６とを含む。予測処理ユニット４２は、動きおよび視差推定ユニット４４と、動きおよび視差補償ユニット４６と、イントラ予測ユニット４８とを含む。ビデオブロック再構成のために、ビデオエンコーダ２０はまた、逆量子化処理ユニット５８と、逆変換処理ユニット６０と、加算器６２とを含む。再構成されたビデオからブロッキネスアーティファクトを除去するためにブロック境界をフィルタ処理するために、デブロッキングフィルタ（図８に図示せず）も含まれ得る。所望される場合、デブロッキングフィルタは、一般に、加算器６２の出力をフィルタ処理することになる。デブロッキングフィルタに加えて、（ループ内またはループ後の）追加ループフィルタも使用され得る。

[0158]ビデオデータメモリ４０は、ビデオエンコーダ２０の構成要素によって符号化されるべきビデオデータを記憶し得る。ビデオデータメモリ４０に記憶されたビデオデータは、たとえば、ビデオソース１８から取得され得る。参照ピクチャメモリ６４は、（たとえば、イントラ予測コーディングモードまたはインター予測コーディングモードとも呼ばれる、イントラコーディングモードまたはインターコーディングモードで）ビデオエンコーダ２０によってビデオデータを符号化する際に使用するための、参照ビデオデータを記憶する復号ピクチャバッファ（ＤＰＢの一例である。ビデオデータメモリ４０および参照ピクチャメモリ６４は、同期ＤＲＡＭ（ＳＤＲＡＭ）、磁気抵抗ＲＡＭ（ＭＲＡＭ）、抵抗ＲＡＭ（ＲＲＡＭ（登録商標））、または他のタイプのメモリデバイスを含む、ダイナミックランダムアクセスメモリ（ＤＲＡＭ）など、様々なメモリデバイスのいずれかによって形成され得る。ビデオデータメモリ４０および参照ピクチャメモリ６４は、同じメモリデバイスまたは別個のメモリデバイスによって提供され得る。様々な例では、ビデオデータメモリ４０は、ビデオエンコーダ２０の他の構成要素とともにオンチップであるか、またはそれらの構成要素に対してオフチップであり得る。

[0159]ビデオエンコーダ２０は、ビデオデータを受信し、区分ユニット（図示せず）は、データをビデオブロックに区分する。この区分は、スライス、タイル、または他のより大きいユニットへの区分、ならびにビデオブロック区分（たとえば、マクロブロックパーティション、およびパーティションのサブブロック）をも含み得る。ビデオエンコーダ２０は、概して、符号化されるべきビデオスライス内のビデオブロックを符号化する構成要素を示している。スライスは、複数のビデオブロックに（および、場合によっては、タイルと呼ばれるビデオブロックのセットに）分割され得る。予測処理ユニット４２は、誤差結果（たとえば、コーディングレートおよびひずみレベル）に基づいて現在のビデオブロックのために、複数のイントラコーディングモード（イントラ予測コーディングモード）のうちの１つ、または複数のインターコーディングモード（インター予測コーディングモード）のうちの１つなど、複数の可能なコーディングモードのうちの１つを選択し得る。予測処理ユニット４２は、たとえば、現在のブロックをコーディングするために、ＢＶＳＰモードを選択し得る。予測処理ユニット４２は、得られたイントラコーディングされたブロックまたはインターコーディングされたブロックを、残差ブロックデータを生成するために加算器５０に与え、参照ピクチャとして使用するための符号化されたブロックを再構成するために加算器６２に与え得る。

[0160]予測処理ユニット４２内のイントラ予測ユニット４８は、空間圧縮を行うために、コーディングされるべき現在のブロックと同じフレームまたはスライス中の１つまたは複数の隣接ブロックに対する現在のビデオブロックのイントラ予測コーディングを実行し得る。予測処理ユニット４２内の動きおよび視差推定ユニット４４ならびに動きおよび視差補償ユニット４６は、時間圧縮を行うために、１つまたは複数の参照ピクチャ中の１つまたは複数の予測ブロックに対する現在のビデオブロックのインター予測コーディングを実行する。

[0161]動きおよび視差推定ユニット４４は、ビデオシーケンスの所定のパターンに従ってビデオスライスのためのインター予測モードを決定するように構成され得る。所定のパターンは、シーケンス中のビデオスライスをＰスライスまたはＢスライスに指定し得る。動きおよび視差推定ユニット４４と動きおよび視差補償ユニット４６とは、高度に統合され得るが、概念的な目的のために別々に示されている。動きおよび視差推定ユニット４４によって実行される動き推定は、ビデオブロックの動きを推定する動きベクトルを生成するプロセスである。動きベクトルは、たとえば、参照ピクチャ内の予測ブロックに対する、現在のビデオフレームまたはピクチャ内のビデオブロックの変位を示し得る。

[0162]予測ブロックは、絶対値差分和（ＳＡＤ：sum of absolute difference）、２乗差分和（ＳＳＤ：sum of square difference）、または他の差分メトリックによって決定され得るピクセル差分に関して、コーディングされるべきビデオブロックにぴったり一致することがわかるブロックである。いくつかの例では、ビデオエンコーダ２０は、参照ピクチャメモリ６４に記憶された参照ピクチャのサブ整数ピクセル位置の値を計算し得る。たとえば、ビデオエンコーダ２０は、参照ピクチャの１／４ピクセル位置、１／８ピクセル位置、または他の分数ピクセル位置の値を補間し得る。したがって、動きおよび視差推定ユニット４４は、フルピクセル位置と分数ピクセル位置とに対する動き探索を実行し、分数ピクセル精度で動きベクトルを出力し得る。

[0163]動きおよび視差推定ユニット４４は、ビデオブロックの位置を参照ピクチャの予測ブロックの位置と比較することによって、インターコーディングされた（インター予測コーディングされた）スライスにおけるビデオブロックのための動きベクトルを計算する。参照ピクチャは、第１の参照ピクチャリスト（ＲｅｆＰｉｃＬｉｓｔ０）または第２の参照ピクチャリスト（ＲｅｆＰｉｃＬｉｓｔ１）から選択され得、それらの参照ピクチャリストの各々は、参照ピクチャメモリ６４に記憶された１つまたは複数の参照ピクチャを識別する。動きおよび視差推定ユニット４４は、エントロピー符号化ユニット５６と動きおよび視差補償ユニット４６とに計算された動きベクトルを送る。

[0164]動きおよび視差補償ユニット４６によって実行される動き補償は、動き推定によって決定された動きベクトルに基づいて予測ブロックをフェッチまたは生成すること、場合によってはサブピクセル精度への補間を実行することを伴い得る。現在のビデオブロックの動きベクトルを受信すると、動きおよび視差補償ユニット４６は、動きベクトルが参照ピクチャリストのうちの１つにおいて指す予測ブロックの位置を特定し得る。ビデオエンコーダ２０は、コーディングされている現在のビデオブロックのピクセル値から予測ブロックのピクセル値を減算し、ピクセル差分値を形成することによって、残差ビデオブロックを形成する。ピクセル差分値は、ブロックの残差データを形成し、ルーマ差分成分とクロマ差分成分の両方を含み得る。加算器５０は、この減算演算を実行する１つまたは複数の構成要素を表す。動きおよび視差補償ユニット４６はまた、ビデオスライスのビデオブロックを復号する際にビデオデコーダ３０が使用するための、ビデオブロックとビデオスライスとに関連するシンタックス要素を生成し得る。

[0165]いくつかの例では、動きおよび視差補償ユニット４６は、現在のビュー中の現在のブロックのためにＢＶＳＰを実行し得る。すなわち、動きおよび視差補償ユニット４６は、第１のビュー中の参照ピクチャメモリ６４のピクチャを決定し得る。上記でより詳細に説明されたように、動きおよび視差補償ユニット４６は、深度ビュー中の対応するブロックにアクセスすることによって、現在のブロックのための視差ベクトルを決定し得る。次いで、深度ブロックの深度値を使用して、動きおよび視差補償ユニット４６は、予測されたブロックが、第１のビューおよび現在のビューとは異なる第２のビュー中で形成されるように、現在のブロック中のピクセルの位置に対して決定された、第１のビュー中のピクチャのピクセル値をワーピングし得る。動きおよび視差補償ユニット４６は、この予測されたブロックを、残差を計算することにおいて、および、現在のブロックを再生することにおいてそれぞれ使用するために、加算器５０および加算器６２に与え得る。同様に、本開示の技法によれば、ビデオエンコーダ２０は、動き情報が、予測されたブロック（すなわち、ＢＶＳＰ参照ブロック）がそこから合成される第１のビュー中のピクチャを識別する値を有する参照インデックスを含むように、現在のブロックのための動き情報を定義するシンタックスデータを符号化し得る。

[0166]イントラ予測ユニット４８は、上記で説明されたように、動きおよび視差推定ユニット４４と動きおよび視差補償ユニット４６とによって実行されるインター予測の代替として、現在のブロックをイントラ予測し得る。特に、イントラ予測ユニット４８は、現在のブロックを符号化するために使用するべきイントラ予測モードを決定し得る。いくつかの例では、イントラ予測ユニット４８は、たとえば、別個の符号化パス中に、様々なイントラ予測モードを使用して現在のブロックを符号化し得、イントラ予測ユニット４８（または、いくつかの例では、モード選択ユニット）は、テストされたモードから使用するのに適切なイントラ予測モードを選択し得る。たとえば、イントラ予測ユニット４８は、様々なテストされたイントラ予測モードのためのレートひずみ分析を使用してレートひずみ値を計算し、テストされたモードの中で最良のレートひずみ特性を有するイントラ予測モードを選択することができる。レートひずみ分析は、概して、符号化されたブロックと、符号化されたブロックを生成するために符号化された元の符号化されていないブロックとの間のひずみ（または誤差）の量、ならびに符号化されたブロックを生成するために使用されるビットレート（すなわち、ビット数）を決定する。イントラ予測ユニット４８は、どのイントラ予測モードがブロックについて最良のレートひずみ値を呈するかを決定するために、様々な符号化されたブロックのひずみおよびレートから比率を計算し得る。

[0167]いずれの場合も、ブロックのイントラ予測モードを選択した後に、イントラ予測ユニット４８は、ブロックについての選択されたイントラ予測モードを示す情報をエントロピー符号化ユニット５６に提供し得る。エントロピー符号化ユニット５６は、本開示の技法に従って、選択されたイントラ予測モードを示す情報を符号化し得る。ビデオエンコーダ２０は、送信ビットストリーム中に、複数のイントラ予測モードインデックステーブルおよび複数の修正されたイントラ予測モードインデックステーブル（コードワードマッピングテーブルとも呼ばれる）と、様々なブロックの符号化コンテキストの定義と、コンテキストの各々のために使用すべき、最確イントラ予測モード、イントラ予測モードインデックステーブル、および修正されたイントラ予測モードインデックステーブルの指示とを含み得る構成データを含み得る。

[0168]予測処理ユニット４２が、インター予測またはイントラ予測のいずれかを介して、現在のビデオブロックのための予測ブロックを生成した後、ビデオエンコーダ２０は、現在のビデオブロックから予測ブロックを減算することによって残差ビデオブロックを形成する。残差ブロックにおける残差ビデオデータは、変換処理ユニット５２に適用され得る。変換処理ユニット５２は、離散コサイン変換（ＤＣＴ）または概念的に同様の変換のような変換を使用して、残差ビデオデータを残差変換係数に変換する。変換処理ユニット５２は、残差ビデオデータをピクセル領域から周波数領域などの変換領域に変換し得る。

[0169]変換処理ユニット５２は、得られた変換係数を量子化処理ユニット５４に送り得る。量子化処理ユニット５４は、ビットレートをさらに低減するために変換係数を量子化する。量子化プロセスは、係数の一部または全部に関連するビット深度を低減し得る。量子化の程度は、量子化パラメータを調整することによって変更され得る。いくつかの例では、量子化処理ユニット５４は、次いで、量子化変換係数を含む行列の走査を実行し得る。代替的に、エントロピー符号化ユニット５６が走査を実行し得る。

[0170]量子化の後、エントロピー符号化ユニット５６は量子化変換係数をエントロピー符号化する。たとえば、エントロピー符号化ユニット５６は、コンテキスト適応型可変長コーディング（ＣＡＶＬＣ）、コンテキスト適応型バイナリ算術コーディング（ＣＡＢＡＣ）、シンタックスベースコンテキスト適応型バイナリ算術コーディング（ＳＢＡＣ）、確率間隔区分エントロピー（ＰＩＰＥ）コーディングまたは別のエントロピー符号化方法もしくは技法を実行し得る。エントロピー符号化ユニット５６によるエントロピー符号化の後、符号化されたビットストリームは、ビデオデコーダ３０に送信されるか、またはビデオデコーダ３０が後で送信するかもしくは取り出すためにアーカイブされ得る。エントロピー符号化ユニット５６はまた、コーディングされている現在のビデオスライスのための動きベクトルと他のシンタックス要素とをエントロピー符号化することができる。

[0171]逆量子化処理ユニット５８および逆変換処理ユニット６０は、参照ピクチャの参照ブロックとして後で使用する目的でピクセル領域において残差ブロックを再構成するために、それぞれ逆量子化および逆変換を適用する。動きおよび視差補償ユニット４６は、残差ブロックを参照ピクチャリストのうちの１つ内の参照ピクチャのうちの１つの予測ブロックに加算することによって参照ブロックを計算し得る。動きおよび視差補償ユニット４６はまた、動き推定において使用するためのサブ整数ピクセル値を計算するために、再構成された残差ブロックに１つまたは複数の補間フィルタを適用し得る。加算器６２は、参照ピクチャメモリ６４に記憶するための参照ブロックを生成するために、再構成された残差ブロックを動きおよび視差補償ユニット４６によって生成された動き補償予測ブロックに加算する。参照ブロックは、後続のビデオフレームまたはピクチャ中のブロックをインター予測するために、動きおよび視差推定ユニット４４と動きおよび視差補償ユニット４６とによって参照ブロックとして使用され得る。

[0172]このようにして、ビデオエンコーダ２０は、本開示で説明される１つまたは複数の例示的な技法を実装するように構成され得るビデオエンコーダの一例である。たとえば、ビデオデータメモリ４０は、ビデオデータを記憶する。ビデオデータは、依存ビューのテクスチャビデオコンポーネントと、そのテクスチャビューコンポーネントに対応する深度ビューコンポーネントとを含んでよく、その各々を、ビデオエンコーダ２０は、３Ｄ−ＡＶＣ準拠または３Ｄ−ＨＥＶＣ準拠ビデオコーディングプロセスにおいて符号化することになる。

[0173]本開示で説明される技法では、ビデオエンコーダ２０は、３Ｄ−ＡＶＣ準拠または３Ｄ−ＨＥＶＣ準拠ビデオコーディングプロセスにおいて、ビデオデータの依存ビューのテクスチャビューコンポーネントを符号化するように構成される、１つまたは複数のプロセッサを含み得る。上記で説明されたように、３Ｄ−ＡＶＣにおける各ビューは、テクスチャビューコンポーネントと深度ビューコンポーネントとを含む。３Ｄ−ＡＶＣにおいて、１つのベースビューと、１つまたは複数のエンハンスメントビューまたは依存ビューとがあり、ただし、１つまたは複数のエンハンスメントビューまたは依存ビューのテクスチャビューコンポーネントは、ビュー間予測され得る。

[0174]テクスチャビューコンポーネントを符号化するために、ビデオエンコーダ２０は、少なくとも１つの隣接ブロックが、依存ビュー以外のビュー中のビュー間参照ピクチャを参照する視差動きベクトルを用いてビュー間予測されるかどうかを決定するために、テクスチャビューコンポーネント中の現在のブロックの１つまたは複数の隣接ブロックの動き情報を評価するように構成され得る。ビデオエンコーダ２０は、隣接ブロックのうちの１つのための視差動きベクトルに基づいて、現在のブロックのための視差ベクトルを導出し得る。テクスチャ優先コーディングのために、ビデオエンコーダ２０は、テクスチャビューコンポーネントを符号化することに続いて、テクスチャビューコンポーネントに対応する、ビデオデータの深度ビューコンポーネントを符号化し得る。

[0175]いくつかの例では、ビデオエンコーダ２０の予測処理ユニット４２は、視差ベクトル導出およびＢＶＳＰコーディングのための本開示で説明される例を実装するように構成されたプロセッサの一例であり得る。いくつかの例では、予測処理ユニット４２以外のユニット（たとえば、１つまたは複数のプロセッサ）が、上記で説明された例を実装することができる。いくつかの例では、予測処理ユニット４２は、ビデオエンコーダ２０の１つまたは複数の他のユニットとともに、上記で説明された例を実装することができる。いくつかの例では、ビデオエンコーダ２０のプロセッサ（図８には図示せず）は、単独で、またはビデオエンコーダ２０の他のプロセッサとともに、上記で説明された例を実装することができる。

[0176]図９は、本開示で説明される技法を実装し得るビデオデコーダの一例を示すブロック図である。図９は、本開示で説明される技法を実装し得るビデオデコーダの一例を示すブロック図である。たとえば、図９は、３Ｄ−ＡＶＣ準拠または３Ｄ−ＨＥＶＣ準拠のいずれかのビデオデコーダを表し得る、ビデオデコーダ３０を示す。ビデオデコーダ３０について、ＰＵ、ＴＵ、およびＣＵなど、あるＨＥＶＣ用語を使用して説明するが、ビデオデコーダ３０に関して説明される技法はまた、Ｈ．２６４規格に従ってコーディングされたビデオとともに実行され得ることを理解されたい。

[0177]ビデオデコーダ３０は、インター予測復号またはイントラ予測復号を実行することができる。図９は、ビデオデコーダ３０を示す。図９の例では、ビデオデコーダ３０は、ビデオデータメモリ６９と、エントロピー復号ユニット７０と、予測処理ユニット７１と、逆量子化処理ユニット７６と、逆変換処理ユニット７８と、加算器８０と、参照ピクチャメモリ８２とを含む。予測処理ユニット７１は、動きおよび視差補償ユニット７２と、イントラ予測ユニット７４とを含む。ビデオデコーダ３０は、いくつかの例では、図８のビデオエンコーダ２０に関して説明された符号化パスとは概して逆の復号パスを実行し得る。

[0178]ビデオデータメモリ６９は、ビデオエンコーダ３０の構成要素によって復号されるべき、符号化されたビデオビットストリームなどのビデオデータを記憶し得る。ビデオデータメモリ６９に記憶されたビデオデータは、たとえば、ストレージデバイス３４から、カメラなどのローカルビデオソースから、ビデオデータのワイヤードもしくはワイヤレスネットワーク通信を介して、または物理データ記憶媒体にアクセスすることによって取得され得る。ビデオデータメモリ６９は、符号化されたビデオビットストリームからの符号化されたビデオデータを記憶する、コーディングされたピクチャバッファ（ＣＰＢ）を形成し得る。

[0179]参照ピクチャメモリ８２は、（たとえば、イントラコーディングモードまたはインターコーディングモードで）ビデオデコーダ３０によってビデオデータを復号する際に使用するための、参照ビデオデータを記憶する、復号されたピクチャバッファ（ＤＰＢ）の一例である。ビデオデータメモリ６９および参照ピクチャメモリ８２は、同期ＤＲＡＭ（ＳＤＲＡＭ）、磁気抵抗ＲＡＭ（ＭＲＡＭ）、抵抗ＲＡＭ（ＲＲＡＭ）、または他のタイプのメモリデバイスを含む、ダイナミックランダムアクセスメモリ（ＤＲＡＭ）など、様々なメモリデバイスのいずれかによって形成され得る。ビデオデータメモリ６９および参照ピクチャメモリ８２は、同じメモリデバイスまたは別個のメモリデバイスによって提供され得る。様々な例では、ビデオデータメモリ６９は、ビデオデコーダ３０の他の構成要素とともにオンチップであるか、またはそれらの構成要素に対してオフチップであり得る。

[0180]復号プロセス中に、ビデオデコーダ３０は、ビデオエンコーダ２０から、符号化されたビデオスライスのビデオブロックと、関連付けられるシンタックス要素とを表す、符号化されたビデオビットストリームを受信する。ビデオデコーダ３０のエントロピー復号ユニット７０は、量子化係数と、動きベクトルと、他のシンタックス要素とを生成するために、ビットストリームをエントロピー復号する。エントロピー復号ユニット７０は、動きベクトルと他のシンタックス要素とを予測処理ユニット７１に転送する。ビデオデコーダ３０は、ビデオスライスレベルおよび／またはビデオブロックレベルでシンタックス要素を受信し得る。

[0181]ビデオスライスがイントラコーディングされた（Ｉ）スライスとしてコーディングされるとき、予測処理ユニット７１のイントラ予測ユニット７４は、シグナリングされたイントラ予測モードと、現在のフレームまたはピクチャの、前に復号されたブロックからのデータとに基づいて、現在のビデオスライスのビデオブロックのための予測データを生成し得る。ビデオフレームがインターコーディングされた（すなわち、Ｂ、またはＰ）スライスとしてコーディングされるとき、予測処理ユニット７１の動きおよび視差補償ユニット７２は、エントロピー復号ユニット７０から受信された動きベクトルおよび他のシンタックス要素に基づいて、現在のビデオスライスのビデオブロックのための予測ブロックを生成する。予測ブロックは、参照ピクチャリストのうちの１つ内の参照ピクチャのうちの１つから生成され得る。ビデオデコーダ３０は、参照ピクチャメモリ８２に記憶された参照ピクチャに基づいて、デフォルト構成技法を使用して参照ピクチャリスト（ＲｅｆＰｉｃＬｉｓｔ０およびＲｅｆＰｉｃＬｉｓｔ１）を構成し得る。

[0182]動きおよび視差補償ユニット７２は、動きベクトルと他のシンタックス要素とを解析することによって現在のビデオスライスのビデオブロックについての予測情報を決定し、復号されている現在のビデオブロックのための予測ブロックを生成するために、予測情報を使用する。たとえば、動きおよび視差補償ユニット７２は、ビデオスライスのビデオブロックをコーディングするために使用される予測モード（たとえば、イントラ予測またはインター予測）と、インター予測スライスタイプ（たとえば、ＢスライスまたはＰスライス）と、スライスの参照ピクチャリストのうちの１つまたは複数についての構成情報と、スライスの各インター符号化されたビデオブロックのための動きベクトルと、スライスの各インターコーディングされたビデオブロックについてのインター予測ステータスと、現在のビデオスライス中のビデオブロックを復号するための他の情報とを決定するために、受信されたシンタックス要素のいくつかを使用する。

[0183]動きおよび視差補償ユニット７２はまた、補間フィルタに基づいて補間を実行し得る。動きおよび視差補償ユニット７２は、参照ブロックのサブ整数ピクセルの補間値を計算するために、ビデオブロックの符号化中にビデオエンコーダ２０によって使用された補間フィルタを使用し得る。この場合、動きおよび視差補償ユニット７２は、受信されたシンタックス要素からビデオエンコーダ２０によって使用された補間フィルタを決定し、予測ブロックを生成するために、その補間フィルタを使用し得る。

[0184]動きおよび視差補償ユニット７２は、現在のビュー中の現在のブロックのための後方ビュー合成予測を実行し得る。すなわち、動きおよび視差補償ユニット７２は、第１のビュー中の参照ピクチャメモリ８２のピクチャを決定し得る。上記でより詳細に説明されたように、動きおよび視差補償ユニット７２は、現在のブロックに対応する深度ブロックを決定し得、深度ブロックの深度値を使用して、動きおよび視差補償ユニット７２は、予測されたブロック（すなわち、ＢＶＳＰ参照ブロック）が、第１のビューおよび現在のビューとは異なる第２のビュー中で形成されるように、現在のブロック中のピクセルの位置に対して決定された、第１のビュー中のピクチャのピクセル値をワーピングし得る。動きおよび視差補償ユニット７２は、この予測されたブロックを、残差を計算することにおいて、および、現在のブロックを再生することにおいてそれぞれ使用するために、加算器５０および加算器８０に与え得る。同様に、本開示の技法によれば、ビデオデコーダ３０は、動き情報が、予測されたブロックがそこから合成される第１のビュー中のピクチャを識別する値を有する参照インデックスを含むように、現在のブロックのための動き情報を定義するシンタックスデータを復号し得る。

[0185]逆量子化処理ユニット７６は、ビットストリーム中で与えられ、エントロピー復号ユニット７０によって復号された、量子化変換係数を逆量子化（inverse quantize）、（すなわち、逆量子化（de-quantize））する。逆量子化プロセスは、量子化の程度を決定するために、同様に、適用されるべき逆量子化の程度を決定するために、ビデオスライス中の各ビデオブロックについてビデオエンコーダ２０によって計算される量子化パラメータを使用することを含み得る。逆変換処理ユニット７８は、ピクセル領域において残差ブロックを生成するために、逆変換（たとえば、逆ＤＣＴ、逆整数変換、または概念的に同様の逆変換プロセス）を変換係数に適用する。

[0186]動きおよび視差補償ユニット７２が、動きベクトルと他のシンタックス要素とに基づいて現在のビデオブロックのための予測ブロックを生成した後に、ビデオデコーダ３０は、逆変換処理ユニット７８からの残差ブロックを動きおよび視差補償ユニット７２によって生成された対応する予測ブロックと加算することによって、復号されたビデオブロックを形成する。加算器８０は、この加算演算を実行する１つまたは複数の構成要素を表す。所望される場合、ブロッキングアーティファクトを除去するために復号されたブロックをフィルタ処理するデブロッキングフィルタも適用され得る。ピクセル遷移を平滑化するために、または場合によってはビデオ品質を改善するために、（コーディングループ内またはコーディングループ後のいずれかの）他のループフィルタも使用され得る。次いで、所与のピクチャ中の復号されたビデオブロックは、その後の動き補償に使用される参照ピクチャを記憶する参照ピクチャメモリ８２に記憶される。参照ピクチャメモリ８２はまた、図１のディスプレイデバイス３２などのディスプレイデバイス上に後で提示するための、復号されたビデオを記憶する。

[0187]このようにして、ビデオデコーダ３０は、本開示で説明される１つまたは複数の例示的な技法を実装するように構成され得るビデオデコーダの一例である。たとえば、ビデオデータメモリ６９は、ビデオデータを記憶する。ビデオデータは、そこからビデオデコーダ３０が依存ビューのテクスチャビデオコンポーネントと、そのテクスチャビューコンポーネントに対応する深度ビューコンポーネントとを復号することができる情報を含んでよく、その各々を、ビデオエンコーダ２０は、３Ｄ−ＡＶＣ準拠または３Ｄ−ＨＥＶＣ準拠ビデオコーディングプロセスにおいて符号化される。

[0188]本開示で説明される技法では、ビデオデコーダ３０は、３Ｄ−ＡＶＣ準拠または３Ｄ−ＨＥＶＣ準拠ビデオコーディングプロセスにおいて、ビデオデータの依存ビューのテクスチャビューコンポーネントを復号するように構成される、１つまたは複数のプロセッサを含み得る。テクスチャビューコンポーネントを復号するために、ビデオデコーダ３０は、少なくとも１つの隣接ブロックが、依存ビュー以外のビュー中のビュー間参照ピクチャを参照する視差動きベクトルを用いてビュー間予測されるかどうかを決定するために、テクスチャビューコンポーネント中の現在のブロックの１つまたは複数の隣接ブロックの動き情報を評価するように構成され得る。ビデオエンコーダ３０は、隣接ブロックのうちの１つのための視差動きベクトルに基づいて、現在のブロックのための視差ベクトルを導出し得る。テクスチャ優先コーディングのために、ビデオエンコーダ３０は、テクスチャビューコンポーネントを復号することに続いて、テクスチャビューコンポーネントに対応する、ビデオデータの深度ビューコンポーネントを復号し得る。

[0189]いくつかの例では、ビデオデコーダ３０の予測処理ユニット７１は、視差ベクトル導出およびＢＶＳＰコーディングのための本開示で説明される例を実装するように構成されたプロセッサの一例であり得る。いくつかの例では、予測処理ユニット７１以外のユニット（たとえば、１つまたは複数のプロセッサ）が、上記で説明された例を実装することができる。いくつかの例では、予測処理ユニット７１は、ビデオデコーダ３０の１つまたは複数の他のユニットとともに、上記で説明された例を実装することができる。さらにいくつかの他の例では、ビデオデコーダ３０のプロセッサ（図９には図示せず）は、単独で、またはビデオデコーダ３０の他のプロセッサとともに、上記で説明された例を実装することができる。

[0190]図１０は、本開示の技法による例示的な３Ｄビデオコーディングプロセスを示すフローチャートである。図１０の技法は、３Ｄ−ＡＶＣ準拠ビデオまたは３Ｄ−ＨＥＶＣ準拠ビデオのいずれかに適用可能であり得る。図１０の技法について、たとえば、ビデオエンコーダ２０などのビデオエンコーダ、またはビデオデコーダなどのビデオデコーダであり得る、一般的なビデオコーダに関して説明する。ビデオコーダは、第１のテクスチャビューのブロックが、ＢＶＳＰモードを使用してコーディングされるべきであると決定する（１１０）。ビデオ復号を実行するとき、ビデオデコーダ３０は、たとえば、第１のテクスチャビューのブロックがブロックベースビュー合成モードを使用してコーディングされるべきであることを示す、シンタックス要素を受信することによって、第１のテクスチャビューのブロックがＢＶＳＰモードを使用して復号されるべきであると決定し得る。ビデオ符号化を実行するとき、ビデオエンコーダ２０は、たとえば、いくつかのコーディングパスを実行することと、所望のレートひずみトレードオフを生成するモードとして、ＢＶＳＰモードを識別することとによって、第１のテクスチャビューのブロックがＢＶＳＰモードを使用してコーディングされるべきであると決定し得る。

[0191]ビデオコーダは、深度ビュー中で、第１のテクスチャビューのブロックに対応する深度ブロックの位置を特定する（１１２）。３Ｄ−ＡＶＣでは、この例におけるブロックは、マクロブロックまたはマクロブロックパーティションのＫ×Ｋ下位領域を指すことがある。３Ｄ−ＨＥＶＣでは、ブロックはまた、Ｋ×Ｋ下位領域を指すことがある。対応する深度ブロックは、たとえば、３Ｄ−ＡＶＣでは、コロケートされた深度ブロックであってよく、または、３Ｄ−ＨＥＶＣでは、ＮＢＤＶを使用して生成された視差ベクトルによって識別される参照ベースビュー（すなわち、第２のビュー）中の深度ブロックであってよい。ビデオコーダは、深度ブロックの２つ以上の隅の位置のための深度値を決定する（１１４）。深度値に基づいて、ビデオコーダは、ブロックのための視差ベクトルを導出する（１１６）。視差ベクトルを使用して、ビデオコーダは、第２のテクスチャビューのブロックの位置を特定する（１１８）。ビデオコーダは、第２のテクスチャビューのブロックを使用して、第１のテクスチャビューのブロックをインター予測する（１２０）。第１のテクスチャビューは、たとえば、非ベーステクスチャビューであってよく、第２のテクスチャビューは、たとえば、ベーステクスチャビューであってよい。図１０の技法が３Ｄ−ＡＶＣ準拠ビデオコーダによって実装されるとき、第１のテクスチャビューのブロックは、たとえば、マクロブロックパーティションのサブブロックであり得る。図１０の技法が３Ｄ−ＨＥＶＣ準拠コーダによって実装されるとき、第１のテクスチャビューのブロックは、たとえば、予測ユニットであり得る。

[0192]図１１は、本開示の技法による例示的な３Ｄビデオコーディングプロセスを示すフローチャートである。図１１の技法について、３Ｄ−ＡＶＣ用語を使用して説明するが、それらの技法は、潜在的に、３Ｄ−ＨＥＶＣなどの他のビデオコーディング規格に拡張され得る。図１１の技法について、たとえば、ビデオエンコーダ２０などのビデオエンコーダ、またはビデオデコーダなどのビデオデコーダであり得る、一般的なビデオコーダに関して説明する。ビデオコーダは、第１のテクスチャビュー、第１の深度ビュー、第２のテクスチャビュー、および第２の深度ビューに対して、テクスチャ優先コーディングを実行する（１２２）。第１のテクスチャビューおよび第１のベース深度ビューは、たとえば、ベースビューであり得るが、一方第２のテクスチャビューおよび第２の深度ビューは、非ベースビューである。

[0193]第２のテクスチャビューのマクロブロックについて、ビデオコーダは、第１の深度ビュー中で、マクロブロックに対応する深度ブロックの位置を特定する（１２４）。深度ブロックの少なくとも１つの深度値に基づいて、ビデオコーダは、マクロブロックのための視差ベクトルを導出する（１２６）。ビデオコーダは、たとえば、深度ブロックの２つ以上の隅のサンプルの深度値を含む、深度値のセットを決定することによって、視差ベクトルを導出し、深度値のセットから、最大深度値を識別し得る。最大深度値が、次いで、深度値を視差値に変換する変換テーブルに基づいて、または、何らかの他の技法を使用して、視差ベクトルに変換され得る。ビデオコーダは、導出された視差ベクトルに基づいて、マクロブロックの第１のサブブロックをコーディングする（１２８）。ビデオコーダは、導出された視差ベクトルに基づいて、マクロブロックの第２のサブブロックをコーディングする（１３０）。ビデオコーダは、たとえば、スキップモードおよび直接モードのうちの１つを使用して、第１のサブブロックをコーディングし、スキップモードまたは直接モード以外のインター予測モードを使用して、第２のサブブロックをコーディングし得る。図１１の例では、サブブロックは、たとえば、Ｈ．２６４／ＡＶＣサブブロックであってよく、または、マクロブロックパーティションであってよい。

[0194]１つまたは複数の例では、説明された機能は、ハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の組合せで実装され得る。ソフトウェアで実装される場合、機能は、１つまたは複数の命令またはコードとしてコンピュータ可読媒体上に記憶されるか、またはコンピュータ可読媒体を介して送信され、ハードウェアベースの処理ユニットによって実行され得る。コンピュータ可読媒体は、データ記憶媒体などの有形媒体に対応するコンピュータ可読記憶媒体、または、たとえば、通信プロトコルに従って、ある場所から別の場所へのコンピュータプログラムの転送を可能にする任意の媒体を含む通信媒体を含み得る。このようにして、コンピュータ可読媒体は、一般に、（１）非一時的である有形コンピュータ可読記憶媒体、または、（２）信号もしくは搬送波などの通信媒体に対応し得る。データ記憶媒体は、本開示で説明される技法を実装するための命令、コードおよび／またはデータ構造を取り出すために、１つもしくは複数のコンピュータ、または１つもしくは複数のプロセッサによってアクセスされ得る任意の利用可能な媒体であり得る。コンピュータプログラム製品はコンピュータ可読媒体を含み得る。

[0195]限定ではなく例として、そのようなコンピュータ可読記憶媒体は、ＲＡＭ、ＲＯＭ、ＥＥＰＲＯＭ（登録商標）、ＣＤ−ＲＯＭまたは他の光ディスクストレージ、磁気ディスクストレージ、または他の磁気ストレージデバイス、フラッシュメモリ、あるいは、命令またはデータ構造の形態の所望のプログラムコードを記憶するために使用されコンピュータによってアクセスされ得る、任意の他の媒体を備え得る。また、いかなる接続もコンピュータ可読媒体と適切に呼ばれる。たとえば、命令が、同軸ケーブル、光ファイバーケーブル、ツイストペア、デジタル加入者回線（ＤＳＬ）、または赤外線、無線、およびマイクロ波などのワイヤレス技術を使用して、ウェブサイト、サーバ、または他のリモートソースから送信される場合には、同軸ケーブル、光ファイバーケーブル、ツイストペア、ＤＳＬ、または赤外線、無線、およびマイクロ波などのワイヤレス技術は、媒体の定義に含まれる。ただし、コンピュータ可読記憶媒体およびデータ記憶媒体は、接続、搬送波、信号、または他の一時媒体を含まないが、代わりに非一時的有形記憶媒体を対象とすることを理解されたい。本明細書で使用されるディスク（disk）およびディスク（disc）は、コンパクトディスク（disc）（ＣＤ）、レーザーディスク（登録商標）（disc）、光ディスク（disc）、デジタル多用途ディスク（disc）（ＤＶＤ）、フロッピー（登録商標）ディスク（disk）およびＢｌｕ−ｒａｙディスク（disc）を含み、一方ディスク（disk）は、通常、データを磁気的に再生し、ディスク（disc）は、データをレーザーで光学的に再生する。上記の組合せもコンピュータ可読媒体の範囲内に含まれるべきである。

[0196]命令は、１つもしくは複数のデジタル信号プロセッサ（ＤＳＰ）のような１つもしくは複数のプロセッサ、汎用マイクロプロセッサ、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブル論理アレイ（ＦＰＧＡ）、または他の等価な集積回路もしくはディスクリート論理回路によって実行され得る。したがって、本明細書で使用される「プロセッサ」という用語は、前述の構造、または本明細書で説明された技法の実装に適した任意の他の構造のいずれかを指し得る。加えて、いくつかの態様では、本明細書に記載された機能は、符号化および復号のために構成された専用のハードウェアモジュールおよび／もしくはソフトウェアモジュール内に設けられる場合があるか、または複合コーデックに組み込まれる場合がある。また、本技法は、１つまたは複数の回路または論理要素において完全に実装され得る。

[0197]本開示の技法は、ワイヤレスハンドセット、集積回路（ＩＣ）、もしくはＩＣのセット（たとえば、チップセット）を含む、多種多様なデバイスまたは装置において実装され得る。本開示では、開示される技法を実行するように構成されたデバイスの機能的態様を強調するために様々な構成要素、モジュール、またはユニットが説明されたが、それらの構成要素、モジュール、またはユニットは、必ずしも異なるハードウェアユニットによって実現する必要があるとは限らない。むしろ、前述のように、適切なソフトウェアおよび／またはファームウェアとともに、様々なユニットがコーデックハードウェアユニットにおいて組み合わせられ得るか、または前述のような１つもしくは複数のプロセッサを含む、相互動作可能なハードウェアユニットの集合体よって設けられ得る。

[0198]様々な例について説明した。これらおよび他の例は、以下の特許請求の範囲内である。

[0198]様々な例について説明した。これらおよび他の例は、以下の特許請求の範囲内である。

以下に、本願出願の当初の特許請求の範囲に記載された発明を付記する。
[Ｃ１]
３次元（３Ｄ）ビデオデータをコーディングする方法であって、
第１のテクスチャビュー、第１の深度ビュー、第２のテクスチャビュー、および第２の深度ビューに対して、テクスチャ優先コーディングを実行することと、
前記第２のテクスチャビューのマクロブロックについて、前記マクロブロックに対応する前記第１の深度ビューの深度ブロックの位置を特定することと、
前記深度ブロックの少なくとも１つの深度値に基づいて、前記マクロブロックのための視差ベクトルを導出することと、
前記導出された視差ベクトルに基づいて、前記マクロブロックの第１のサブブロックをコーディングすることと、
前記導出された視差ベクトルに基づいて、前記マクロブロックの第２のサブブロックをコーディングすることとを備える方法。
[Ｃ２]
前記第１のテクスチャビューがベーステクスチャビューを備え、前記第２のテクスチャビューが非ベーステクスチャビューを備え、前記第１の深度ビューがベース深度ビューを備え、前記第２の深度ビューが非ベース深度ビューを備える、Ｃ１に記載の方法。
[Ｃ３]
前記マクロブロックが１６×１６ブロックを備え、ここにおいて、前記深度ブロックが、８×８深度ブロックまたは１６×１６深度ブロックのうちの１つを備える、Ｃ１に記載の方法。
[Ｃ４]
前記マクロブロックの空間隣接ブロックまたは時間隣接ブロックのうちの１つからの視差動きベクトルに基づいて、前記深度ブロックを決定することをさらに備える、Ｃ１に記載の方法。
[Ｃ５]
前記マクロブロックのための前記視差ベクトルを導出することが、
深度値のセットを決定することと、ここにおいて、前記深度値のセットは、前記深度ブロックの２つ以上の隅のサンプルの深度値を備える、
前記深度値のセットから、最大深度値を識別することとを備える、Ｃ１に記載の方法。
[Ｃ６]
第１の動きベクトルを使用して、前記第１のサブブロックをコーディングすることと、ここにおいて、前記第１の動きベクトルは、前記視差ベクトルを使用して決定される、
第２の動きベクトルを使用して、前記第２のサブブロックをコーディングすることと、ここにおいて、前記第２の動きベクトルは、前記視差ベクトルを使用して決定され、ここにおいて、前記第１の動きベクトルは、前記第２の動きベクトルとは異なるをさらに備える、Ｃ１に記載の方法。
[Ｃ７]
前記マクロブロックの前記第１のサブブロックをコーディングすることが、
前記視差ベクトルを使用して、第２のテクスチャビュー中の前記第１のサブブロックの対応するブロックの位置を特定することと、
前記対応するブロックのための動き情報を決定することと、
前記対応するブロックのための前記動き情報を使用して、前記第１のサブブロックをコーディングすることとを備える、Ｃ１に記載の方法。
[Ｃ８]
前記視差ベクトルを使用して決定された動き情報に基づいて、前記マクロブロックのすべてのサブブロックをコーディングすることをさらに備える、Ｃ１に記載の方法。
[Ｃ９]
前記第１のサブブロックが、３Ｄ−ＡＶＣビデオコーディング規格に従ってコーディングされた、第１のマクロブロックパーティションまたは第１のサブブロックのうちの１つを備え、ここにおいて、前記第２のサブブロックが、前記３Ｄ−ＡＶＣビデオコーディング規格による、第２のマクロブロックパーティションまたは第２のサブブロックのうちの１つを備える、Ｃ１に記載の方法。
[Ｃ１０]
前記３Ｄビデオデータをコーディングする前記方法が、前記３Ｄビデオデータを復号する方法を備える、Ｃ１に記載の方法。
[Ｃ１１]
前記３Ｄビデオデータをコーディングする前記方法が、前記３Ｄビデオデータを符号化する方法を備える、Ｃ１に記載の方法。
[Ｃ１２]
３次元（３Ｄ）ビデオデータをコーディングするためのデバイスであって、
第１のテクスチャビュー、第１の深度ビュー、第２のテクスチャビュー、および第２の深度ビューに対して、テクスチャ優先コーディングを実行することと、前記第２のテクスチャビューのマクロブロックについて、前記マクロブロックに対応する前記第１の深度ビューの深度ブロックの位置を特定することと、前記深度ブロックの少なくとも１つの深度値に基づいて、前記マクロブロックのための視差ベクトルを導出することと、前記導出された視差ベクトルに基づいて、前記マクロブロックの第１のサブブロックをコーディングすることと、前記導出された視差ベクトルに基づいて、前記マクロブロックの第２のサブブロックをコーディングすることとを行うように構成されたビデオコーダを備えるデバイス。
[Ｃ１３]
前記第１のテクスチャビューがベーステクスチャビューを備え、前記第２のテクスチャビューが非ベーステクスチャビューを備え、前記第１の深度ビューがベース深度ビューを備え、前記第２の深度ビューが非ベース深度ビューを備える、Ｃ１２に記載のデバイス。
[Ｃ１４]
前記マクロブロックが１６×１６ブロックを備え、ここにおいて、前記深度ブロックが、８×８深度ブロックまたは１６×１６深度ブロックのうちの１つを備える、Ｃ１２に記載のデバイス。
[Ｃ１５]
前記マクロブロックの空間隣接ブロックまたは時間隣接ブロックのうちの１つからの視差動きベクトルに基づいて、前記深度ブロックを決定することをさらに備える、Ｃ１２に記載のデバイス。
[Ｃ１６]
前記ビデオコーダが、深度値のセットを決定することと、ここにおいて、前記深度値のセットは、前記深度ブロックの２つ以上の隅のサンプルの深度値を備える、前記深度値のセットから、最大深度値を識別することとを行うことによって、前記マクロブロックのための前記視差ベクトルを導出するように構成される、Ｃ１２に記載のデバイス。
[Ｃ１７]
前記ビデオコーダが、第１の動きベクトルを使用して、前記第１のサブブロックをコーディングすることと、ここにおいて、前記第１の動きベクトルは、前記視差ベクトルを使用して決定される、第２の動きベクトルを使用して、前記第２のサブブロックをコーディングすることと、ここにおいて、前記第２の動きベクトルは、前記視差ベクトルを使用して決定され、およびここにおいて、前記第１の動きベクトルは、前記第２の動きベクトルとは異なる、を行うようにさらに構成される、Ｃ１２に記載のデバイス。
[Ｃ１８]
前記ビデオコーダが、前記視差ベクトルを使用して、第２のテクスチャビュー中の前記第１のサブブロックの対応するブロックの位置を特定することと、前記対応するブロックのための動き情報を決定することと、前記対応するブロックのための前記動き情報を使用して、前記第１のサブブロックをコーディングすることとによって、前記マクロブロックの前記第１のサブブロックをコーディングするようにさらに構成される、Ｃ１２に記載のデバイス。
[Ｃ１９]
前記ビデオコーダが、前記視差ベクトルを使用して決定された動き情報に基づいて、前記マクロブロックのすべてのサブブロックをコーディングするようにさらに構成される、Ｃ１２に記載のデバイス。
[Ｃ２０]
前記第１のサブブロックが、３Ｄ−ＡＶＣビデオコーディング規格に従ってコーディングされた、第１のマクロブロックパーティションまたは第１のサブブロックのうちの１つを備え、ここにおいて、前記第２のサブブロックが、前記３Ｄ−ＡＶＣビデオコーディング規格による、第２のマクロブロックパーティションまたは第２のサブブロックのうちの１つを備える、Ｃ１２に記載のデバイス。
[Ｃ２１]
前記ビデオコーダがビデオデコーダを備える、Ｃ１２に記載のデバイス。
[Ｃ２２]
前記ビデオコーダがビデオエンコーダを備える、Ｃ１２に記載のデバイス。
[Ｃ２３]
前記デバイスが、
集積回路と、
マイクロプロセッサと、
ビデオデコーダを備えるワイヤレス通信デバイスとのうちの少なくとも１つを備える、Ｃ１２に記載のデバイス。
[Ｃ２４]
３次元（３Ｄ）ビデオデータをコーディングするためのデバイスであって、
第１のテクスチャビュー、第１の深度ビュー、第２のテクスチャビュー、および第２の深度ビューに対して、テクスチャ優先コーディングを実行するための手段と、
前記第２のテクスチャビューのマクロブロックについて、前記マクロブロックに対応する前記第１の深度ビューの深度ブロックの位置を特定するための手段と、
前記深度ブロックの少なくとも１つの深度値に基づいて、前記マクロブロックのための視差ベクトルを導出するための手段と、
前記導出された視差ベクトルに基づいて、前記マクロブロックの第１のサブブロックをコーディングするための手段と、
前記導出された視差ベクトルに基づいて、前記マクロブロックの第２のサブブロックをコーディングするための手段とを備えるデバイス。
[Ｃ２５]
前記第１のテクスチャビューがベーステクスチャビューを備え、前記第２のテクスチャビューが非ベーステクスチャビューを備え、前記第１の深度ビューがベース深度ビューを備え、前記第２の深度ビューが非ベース深度ビューを備える、Ｃ２４に記載のデバイス。
[Ｃ２６]
前記マクロブロックのための前記視差ベクトルを導出するための前記手段が、
深度値のセットを決定するための手段と、ここにおいて、前記深度値のセットは、前記深度ブロックの２つ以上の隅のサンプルの深度値を備える、
前記深度値のセットから、最大深度値を識別するための手段とを備える、Ｃ２４に記載のデバイス。
[Ｃ２７]
第１の動きベクトルを使用して、前記第１のサブブロックをコーディングするための手段と、ここにおいて、前記第１の動きベクトルは、前記視差ベクトルを使用して決定される、
第２の動きベクトルを使用して、前記第２のサブブロックをコーディングするための手段と、ここにおいて、前記第２の動きベクトルは、前記視差ベクトルを使用して決定され、およびここにおいて、前記第１の動きベクトルは、前記第２の動きベクトルとは異なる、をさらに備える、Ｃ２４に記載のデバイス。
[Ｃ２８]
前記マクロブロックの前記第１のサブブロックをコーディングするための前記手段が、
前記視差ベクトルを使用して、第２のテクスチャビュー中の前記第１のサブブロックの対応するブロックの位置を特定するための手段と、
前記対応するブロックのための動き情報を決定するための手段と、
前記対応するブロックのための前記動き情報を使用して、前記第１のサブブロックをコーディングするための手段とを備える、Ｃ２４に記載のデバイス。
[Ｃ２９]
前記視差ベクトルを使用して決定された動き情報に基づいて、前記マクロブロックのすべてのサブブロックをコーディングするための手段をさらに備える、Ｃ２４に記載のデバイス。
[Ｃ３０]
１つまたは複数のプロセッサによって実行されたとき、前記１つまたは複数のプロセッサに、
第１のテクスチャビュー、第１の深度ビュー、第２のテクスチャビュー、および第２の深度ビューに対して、テクスチャ優先コーディングを実行することと、
前記第２のテクスチャビューのマクロブロックについて、前記マクロブロックに対応する前記第１の深度ビューの深度ブロックの位置を特定することと、
前記深度ブロックの少なくとも１つの深度値に基づいて、前記マクロブロックのための視差ベクトルを導出することと、
前記導出された視差ベクトルに基づいて、前記マクロブロックの第１のサブブロックをコーディングすることと、
前記導出された視差ベクトルに基づいて、前記マクロブロックの第２のサブブロックをコーディングすることとを行わせる命令を記憶する、コンピュータ可読記憶媒体。

Claims

３次元（３Ｄ）ビデオデータをコーディングする方法であって、
第１のテクスチャビュー、第１の深度ビュー、第２のテクスチャビュー、および第２の深度ビューに対して、テクスチャ優先コーディングを実行することと、
前記第２のテクスチャビューのマクロブロックについて、前記マクロブロックに対応する前記第１の深度ビューの深度ブロックの位置を特定することと、
前記深度ブロックの少なくとも１つの深度値に基づいて、前記マクロブロックのための視差ベクトルを導出することと、
前記導出された視差ベクトルに基づいて、前記マクロブロックの第１のサブブロックをコーディングすることと、
前記導出された視差ベクトルに基づいて、前記マクロブロックの第２のサブブロックをコーディングすることと
を備える方法。
前記第１のテクスチャビューがベーステクスチャビューを備え、前記第２のテクスチャビューが非ベーステクスチャビューを備え、前記第１の深度ビューがベース深度ビューを備え、前記第２の深度ビューが非ベース深度ビューを備える、請求項１に記載の方法。
前記マクロブロックが１６×１６ブロックを備え、ここにおいて、前記深度ブロックが、８×８深度ブロックまたは１６×１６深度ブロックのうちの１つを備える、請求項１に記載の方法。
前記マクロブロックの空間隣接ブロックまたは時間隣接ブロックのうちの１つからの視差動きベクトルに基づいて、前記深度ブロックを決定すること
をさらに備える、請求項１に記載の方法。
前記マクロブロックのための前記視差ベクトルを導出することが、
深度値のセットを決定することと、ここにおいて、前記深度値のセットは、前記深度ブロックの２つ以上の隅のサンプルの深度値を備える、
前記深度値のセットから、最大深度値を識別することと
を備える、請求項１に記載の方法。
第１の動きベクトルを使用して、前記第１のサブブロックをコーディングすることと、ここにおいて、前記第１の動きベクトルは、前記視差ベクトルを使用して決定される、
第２の動きベクトルを使用して、前記第２のサブブロックをコーディングすることと、ここにおいて、前記第２の動きベクトルは、前記視差ベクトルを使用して決定され、ここにおいて、前記第１の動きベクトルは、前記第２の動きベクトルとは異なる
をさらに備える、請求項１に記載の方法。
前記マクロブロックの前記第１のサブブロックをコーディングすることが、
前記視差ベクトルを使用して、第２のテクスチャビュー中の前記第１のサブブロックの対応するブロックの位置を特定することと、
前記対応するブロックのための動き情報を決定することと、
前記対応するブロックのための前記動き情報を使用して、前記第１のサブブロックをコーディングすることと
を備える、請求項１に記載の方法。
前記視差ベクトルを使用して決定された動き情報に基づいて、前記マクロブロックのすべてのサブブロックをコーディングすること
をさらに備える、請求項１に記載の方法。
前記第１のサブブロックが、３Ｄ−ＡＶＣビデオコーディング規格に従ってコーディングされた、第１のマクロブロックパーティションまたは第１のサブブロックのうちの１つを備え、ここにおいて、前記第２のサブブロックが、前記３Ｄ−ＡＶＣビデオコーディング規格による、第２のマクロブロックパーティションまたは第２のサブブロックのうちの１つを備える、請求項１に記載の方法。
前記３Ｄビデオデータをコーディングする前記方法が、前記３Ｄビデオデータを復号する方法を備える、請求項１に記載の方法。
前記３Ｄビデオデータをコーディングする前記方法が、前記３Ｄビデオデータを符号化する方法を備える、請求項１に記載の方法。
３次元（３Ｄ）ビデオデータをコーディングするためのデバイスであって、
第１のテクスチャビュー、第１の深度ビュー、第２のテクスチャビュー、および第２の深度ビューに対して、テクスチャ優先コーディングを実行することと、前記第２のテクスチャビューのマクロブロックについて、前記マクロブロックに対応する前記第１の深度ビューの深度ブロックの位置を特定することと、前記深度ブロックの少なくとも１つの深度値に基づいて、前記マクロブロックのための視差ベクトルを導出することと、前記導出された視差ベクトルに基づいて、前記マクロブロックの第１のサブブロックをコーディングすることと、前記導出された視差ベクトルに基づいて、前記マクロブロックの第２のサブブロックをコーディングすることとを行うように構成されたビデオコーダ
を備えるデバイス。
前記第１のテクスチャビューがベーステクスチャビューを備え、前記第２のテクスチャビューが非ベーステクスチャビューを備え、前記第１の深度ビューがベース深度ビューを備え、前記第２の深度ビューが非ベース深度ビューを備える、請求項１２に記載のデバイス。
前記マクロブロックが１６×１６ブロックを備え、ここにおいて、前記深度ブロックが、８×８深度ブロックまたは１６×１６深度ブロックのうちの１つを備える、請求項１２に記載のデバイス。
前記マクロブロックの空間隣接ブロックまたは時間隣接ブロックのうちの１つからの視差動きベクトルに基づいて、前記深度ブロックを決定すること
をさらに備える、請求項１２に記載のデバイス。
前記ビデオコーダが、深度値のセットを決定することと、ここにおいて、前記深度値のセットは、前記深度ブロックの２つ以上の隅のサンプルの深度値を備える、前記深度値のセットから、最大深度値を識別することとを行うことによって、前記マクロブロックのための前記視差ベクトルを導出するように構成される、請求項１２に記載のデバイス。
前記ビデオコーダが、第１の動きベクトルを使用して、前記第１のサブブロックをコーディングすることと、ここにおいて、前記第１の動きベクトルは、前記視差ベクトルを使用して決定される、第２の動きベクトルを使用して、前記第２のサブブロックをコーディングすることと、ここにおいて、前記第２の動きベクトルは、前記視差ベクトルを使用して決定され、およびここにおいて、前記第１の動きベクトルは、前記第２の動きベクトルとは異なる、を行うようにさらに構成される、請求項１２に記載のデバイス。
前記ビデオコーダが、前記視差ベクトルを使用して、第２のテクスチャビュー中の前記第１のサブブロックの対応するブロックの位置を特定することと、前記対応するブロックのための動き情報を決定することと、前記対応するブロックのための前記動き情報を使用して、前記第１のサブブロックをコーディングすることとによって、前記マクロブロックの前記第１のサブブロックをコーディングするようにさらに構成される、請求項１２に記載のデバイス。
前記ビデオコーダが、前記視差ベクトルを使用して決定された動き情報に基づいて、前記マクロブロックのすべてのサブブロックをコーディングするようにさらに構成される、請求項１２に記載のデバイス。
前記第１のサブブロックが、３Ｄ−ＡＶＣビデオコーディング規格に従ってコーディングされた、第１のマクロブロックパーティションまたは第１のサブブロックのうちの１つを備え、ここにおいて、前記第２のサブブロックが、前記３Ｄ−ＡＶＣビデオコーディング規格による、第２のマクロブロックパーティションまたは第２のサブブロックのうちの１つを備える、請求項１２に記載のデバイス。
前記ビデオコーダがビデオデコーダを備える、請求項１２に記載のデバイス。
前記ビデオコーダがビデオエンコーダを備える、請求項１２に記載のデバイス。
前記デバイスが、
集積回路と、
マイクロプロセッサと、
ビデオデコーダを備えるワイヤレス通信デバイスと
のうちの少なくとも１つを備える、請求項１２に記載のデバイス。
３次元（３Ｄ）ビデオデータをコーディングするためのデバイスであって、
第１のテクスチャビュー、第１の深度ビュー、第２のテクスチャビュー、および第２の深度ビューに対して、テクスチャ優先コーディングを実行するための手段と、
前記第２のテクスチャビューのマクロブロックについて、前記マクロブロックに対応する前記第１の深度ビューの深度ブロックの位置を特定するための手段と、
前記深度ブロックの少なくとも１つの深度値に基づいて、前記マクロブロックのための視差ベクトルを導出するための手段と、
前記導出された視差ベクトルに基づいて、前記マクロブロックの第１のサブブロックをコーディングするための手段と、
前記導出された視差ベクトルに基づいて、前記マクロブロックの第２のサブブロックをコーディングするための手段と
を備えるデバイス。
前記第１のテクスチャビューがベーステクスチャビューを備え、前記第２のテクスチャビューが非ベーステクスチャビューを備え、前記第１の深度ビューがベース深度ビューを備え、前記第２の深度ビューが非ベース深度ビューを備える、請求項２４に記載のデバイス。
前記マクロブロックのための前記視差ベクトルを導出するための前記手段が、
深度値のセットを決定するための手段と、ここにおいて、前記深度値のセットは、前記深度ブロックの２つ以上の隅のサンプルの深度値を備える、
前記深度値のセットから、最大深度値を識別するための手段と
を備える、請求項２４に記載のデバイス。
第１の動きベクトルを使用して、前記第１のサブブロックをコーディングするための手段と、ここにおいて、前記第１の動きベクトルは、前記視差ベクトルを使用して決定される、
第２の動きベクトルを使用して、前記第２のサブブロックをコーディングするための手段と、ここにおいて、前記第２の動きベクトルは、前記視差ベクトルを使用して決定され、およびここにおいて、前記第１の動きベクトルは、前記第２の動きベクトルとは異なる、
をさらに備える、請求項２４に記載のデバイス。
前記マクロブロックの前記第１のサブブロックをコーディングするための前記手段が、
前記視差ベクトルを使用して、第２のテクスチャビュー中の前記第１のサブブロックの対応するブロックの位置を特定するための手段と、
前記対応するブロックのための動き情報を決定するための手段と、
前記対応するブロックのための前記動き情報を使用して、前記第１のサブブロックをコーディングするための手段と
を備える、請求項２４に記載のデバイス。
前記視差ベクトルを使用して決定された動き情報に基づいて、前記マクロブロックのすべてのサブブロックをコーディングするための手段
をさらに備える、請求項２４に記載のデバイス。
１つまたは複数のプロセッサによって実行されたとき、前記１つまたは複数のプロセッサに、
第１のテクスチャビュー、第１の深度ビュー、第２のテクスチャビュー、および第２の深度ビューに対して、テクスチャ優先コーディングを実行することと、
前記第２のテクスチャビューのマクロブロックについて、前記マクロブロックに対応する前記第１の深度ビューの深度ブロックの位置を特定することと、
前記深度ブロックの少なくとも１つの深度値に基づいて、前記マクロブロックのための視差ベクトルを導出することと、
前記導出された視差ベクトルに基づいて、前記マクロブロックの第１のサブブロックをコーディングすることと、
前記導出された視差ベクトルに基づいて、前記マクロブロックの第２のサブブロックをコーディングすることと
を行わせる命令を記憶する、コンピュータ可読記憶媒体。