JP6370891B2

JP6370891B2 - 深さブロックの視差に基づく高度な深さインターコーディング

Info

Publication number: JP6370891B2
Application number: JP2016517046A
Authority: JP
Inventors: ジャン、リ; チェン、イン; カークゼウィックズ、マルタ
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2013-05-31
Filing date: 2014-05-30
Publication date: 2018-08-08
Anticipated expiration: 2034-05-30
Also published as: WO2014194218A1; KR20160016841A; EP3005704A1; JP2016526348A; US20140355666A1; US10009621B2; CN105247870A

Description

[0001]本願は、２０１３年５月３１日に出願された米国仮出願番号６１／８２９，９１９の利益を主張し、全体の内容が参照によりここに組み込まれる。

[0002]本開示は、ビデオコーディング（すなわち、ビデオデータの符号化および／または復号）に関する。

[0003]デジタルビデオ機能は、デジタルテレビジョン、デジタルダイレクトブロードキャストシステム、ワイヤレスブロードキャストシステム、個人用デジタル補助装置（ＰＤＡ）、ラップトップまたはデスクトップコンピュータ、タブレットコンピュータ、ｅブックリーダー、デジタルカメラ、デジタル録音デバイス、デジタルメディアプレイヤ、ビデオゲームデバイス、ビデオゲームコンソール、セルラーまたは衛星無線電話、いわゆる「スマートフォン」、ビデオテレビ会議デバイス、ビデオストリーミングデバイスなどを含む広範囲にわたるデバイスに組み込まれ得る。デジタルビデオデバイスは、ＭＰＥＧ−２、ＭＰＥＧ−４、ＩＴＵ−ＴＨ．２６３、ＩＴＵ−ＴＨ．２６４／ＭＰＥＧ−４、パート１０、先進ビデオコーディング（ＡＶＣ）、現在開発中の高効率ビデオコーディング（ＨＥＶＣ）の標準、およびこういった標準の拡張によって定義される標準において説明されるようなビデオコーディング技術を実施する。ビデオデバイスは、こういったビデオ圧縮技術を実施することによって、より効率的にデジタルビデオ情報を送信、受信、符号化、復号、および／または記憶し得る。

[0004]ビデオ圧縮技術は、ビデオシーケンスに内在する冗長性を低減するあるいは除去するために空間的（イントラピクチャ）予測および／または時間的（インターピクチャ）予測を実行する。ブロックベースビデオコーディングのために、ビデオスライス（すなわちビデオフレームまたはビデオフレームの一部）は、複数のビデオブロックに分割され得る。ピクチャのイントラコード化された（Ｉ）スライス内のビデオブロックは、同じピクチャ内で隣接するブロック内の参照サンプルに関する空間的予測を用いて符号化される。ピクチャのインターコード化された（ＰまたはＢ）スライス内のビデオブロックは、同じピクチャ内で隣接するブロック内の参照サンプルに関する空間的予測または他の参照ピクチャ内の参照サンプルに関する時間的予測を使用し得る。ピクチャはフレームと呼ばれても良い。参照ピクチャは参照フレームと呼ばれても良い。

[0005]空間的または時間的予測は、コード化されるべきブロックのための予測ブロックをもたらす。残差データは、コード化されるべきオリジナルのブロックと予測ブロックの間の画素差を表す。インターコード化されたブロックは、予測ブロックを形成する参照サンプルのブロックを指し示す動きベクトルにしたがって符号化され、残差データは、コード化されたブロックと予測ブロックの間の差分を示す。イントラコード化されたブロックは、イントラコーディングモードと残差データにしたがって符号化される。さらなる圧縮のために、残差データはピクセルドメインから変換ドメインに変換され得、その結果、残差係数が生じ、それらは次に量子化され得る。初めに２次元アレイに配置される量子化された係数は、複数の係数から成る１次元ベクトルを作成するために走査され得、エントロピーコーディングは、さらにいっそう圧縮を実現するために適用され得る。

[0006]マルチビューコーディングビットストリームは、例えば複数の視点からのビュー(views)を符号化することによって生成され得る。開発されてきた、あるいは現在開発中のいくつかの３次元（３Ｄ）ビデオの標準はマルチビューコーディングの態様を利用する。例えば、異なるビューは、３Ｄビデオをサポートするために左右の目の視点を送信し得る。別法として、いくつかの３Ｄビデオコーディングのプロセスは、いわゆるマルチビュープラス深さコーディングを適用し得る。マルチビュープラス深さコーディングにおいて、３Ｄビデオビットストリームは、テクスチャビュー構成要素だけでなく、深さビュー構成要素も含み得る。例えば、各ビューは１つのテクスチャビュー構成要素と１つの深さビュー構成要素を備え得る。

[0007]一般に、本開示は、３Ｄ−ＨＥＶＣコーデックを用いた２つ以上のビュープラス深さのコーディングを含む高度なコーデックに基づく３Ｄビデオコーディングに関する。特に、本開示は、深さビューコーディングのための視差ベクトル（disparity vectors）に関する技術を説明する。

[0008]１つの例において、本開示は、ビデオデータを復号する方法を説明する。ビデオデータのピクチャのスライスの各々のコーディングユニット（ＣＵ）の各予測ユニット（ＰＵ）に関して、ビデオデータを復号するための方法は、少なくとも１つの隣接するサンプルの少なくとも１つの再構築された深さサンプルの少なくとも１つの深さ値に少なくとも部分的に基づいて、少なくとも１つの視差値を決定することを含む。さらに、この方法は、少なくとも１つの視差値に少なくとも部分的に基づいて、少なくとも１つの視差ベクトルを決定することを含み、ここにおいて、少なくとも１つの視差ベクトルは、各々のＣＵに関する。この方法は、少なくとも１つの視差ベクトルに少なくとも部分的に基づいて、各々のＣＵに関するコーディングブロックを再構築することをも含む。

[0009]別の例において、本開示は、ピクチャと関連付けられるデータを記憶するように構成されたメモリと、そのメモリと通信を行う１つまたは複数のプロセッサとを備えるビデオコーディングデバイスに関し、およびビデオデータのピクチャのスライスの各々のＣＵの各ＰＵに関して、１つまたは複数のプロセッサが少なくとも１つの隣接するサンプルの少なくとも１つの再構築された深さサンプルの少なくとも１つの深さ値に少なくとも部分的に基づいて、少なくとも１つの視差値を決定するように構成される。さらに、１つまたは複数のプロセッサは、少なくとも１つの視差値に少なくとも部分的に基づいて、少なくとも１つの視差ベクトルを決定するように構成され、ここにおいて、少なくとも１つの視差ベクトルは、各々のＣＵに関する。１つまたは複数のプロセッサはまた、少なくとも１つの視差ベクトルに少なくとも部分的に基づいて、各々のＣＵに関するコーディングブロックを再構築するように構成される。

[0010]別の例において、本開示は、実行されると、本開示にしたがった技術を実行するためのビデオ復号デバイスを構成する命令を記憶したコンピュータ可読記憶媒体に関する。ビデオデータのピクチャのスライスの各々のＣＵの各ＰＵに関して、命令は、少なくとも１つの隣接するサンプルの少なくとも１つの再構築された深さサンプルの少なくとも１つの深さ値に少なくとも部分的に基づいて、少なくとも１つの視差値を決定するようにビデオ復号デバイスを構成する。さらに、命令は、少なくとも１つの視差値に少なくとも部分的に基づいて、少なくとも１つの視差ベクトルを決定するようにビデオ復号デバイスを構成し、ここにおいて、少なくとも１つの視差ベクトルは、各々のＣＵに関する。命令はまた、少なくとも１つの視差ベクトルに少なくとも部分的に基づいて、各々のＣＵに関するコーディングブロックを再構築するようにビデオ復号デバイスを構成する。

[0011]別の例において、本開示は、ビデオデータを符号化する方法を説明する。ビデオデータのピクチャのスライスの各々のＣＵの各ＰＵに関して、この方法は、少なくとも１つの隣接するサンプルの少なくとも１つの再構築された深さサンプルの少なくとも１つの深さ値に少なくとも部分的に基づいて、少なくとも１つの視差値を決定することを含む。この方法は、少なくとも１つの視差値に少なくとも部分的に基づいて、少なくとも１つの視差ベクトルを決定することをも含み、ここにおいて、少なくとも１つの視差ベクトルは、各々のＣＵに関する。この方法は、少なくとも１つの視差ベクトルに少なくとも部分的に基づいて、各々のＣＵに関するコーディングブロックを符号化された描写（representation）を生成することをも含む。

[0012]別の例において、本開示は、１つまたは複数のプロセッサを備えるビデオコーディングデバイスに関する。ビデオデータのピクチャのスライスの各々のＣＵの各ＰＵに関して、１つまたは複数のプロセッサは、少なくとも１つの隣接するサンプルの少なくとも１つの再構築された深さサンプルの少なくとも１つの深さ値に少なくとも部分的に基づいて、少なくとも１つの視差値を決定するように構成される。さらに、１つまたは複数のプロセッサは、少なくとも１つの視差値に少なくとも部分的に基づいて、少なくとも１つの視差ベクトルを決定するように構成され、ここにおいて、少なくとも１つの視差ベクトルは、各々のＣＵに関する。１つまたは複数のプロセッサはまた、少なくとも１つの視差ベクトルに少なくとも部分的に基づいて、各々のＣＵに関するコーディングブロックの符号化された描写を生成するように構成される。

[0013]別の例において、本開示は、実行されると、本開示にしたがった技術を実行するためのビデオ符号化デバイスを構成する命令を記憶したコンピュータ可読記憶媒体に関する。ビデオデータのピクチャのスライスの各々のＣＵの各ＰＵに関して、命令は、少なくとも１つの隣接するサンプルの少なくとも１つの再構築された深さサンプルの少なくとも１つの深さ値に少なくとも部分的に基づいて、少なくとも１つの視差値を決定するようにビデオ復号デバイスを構成する。さらに、命令は、少なくとも１つの視差値に少なくとも部分的に基づいて、少なくとも１つの視差ベクトルを決定するようにビデオ復号デバイスを構成し、ここにおいて、少なくとも１つの視差ベクトルは、各々のＣＵに関する。命令はまた、少なくとも１つの視差ベクトルに少なくとも部分的に基づいて、各々のＣＵに関するコーディングブロックの符号化された描写を生成するようにビデオ復号デバイスを構成する。

[0014]本開示の１つまたは複数の例の詳細は、添付の図面と下記の詳細な説明において説明される。他の特徴、目的、および利点は、詳細な説明、図面、および特許請求の範囲から明らかになる。

[0015] 図１は、本開示において説明される技術を利用し得るビデオコーディングシステムの例を示すブロック図である。 [0016] 図２は、マルチビューコーディングの復号順序の例を示す概念図である。 [0017] 図３は、本開示において説明される技術にしたがったマルチビューコーディングのための予測構造の例を示す概念図である。 [0018] 図４は、本開示において説明される技術にしたがった隣接ベースの視差ベクトルの誘導(neighbor-based disparity vector derivation)（ＮＢＤＶ）のための現在の予測ユニット（ＰＵ）の空間的に隣接するブロックを示す概念図である。 [0019] 図５は、本開示において説明される技術にしたがった後方ワーピング（backward warping）に基づいて、ブロックベースのビュー合成予測(block-based view synthesis prediction)（ＢＶＳＰ）を行うための参照ビューからの深さブロック誘導の視覚化例の概念図である。 [0020] 図６は、本開示において説明される技術にしたがった高度な残差予測（ＡＲＰ）の予測構造の例を示す概念図である。 [0021] 図７は、本開示において説明される技術にしたがった現在の深さブロックの視差ベクトルを抽出するために使用される参照サンプルの例を示す概念図である。 [0022] 図８は、本開示において説明される技術を実施し得るビデオエンコーダの例を示すブロック図である。 [0023] 図９は、本開示において説明される技術を実施し得るビデオデコーダの例を示すブロック図である。 [0024] 図１０は、本開示における１つまたは複数の態様にしたがった復号技術の例を示すフロー図である。 [0025] 図１１は、本開示における１つまたは複数の態様にしたがった符号化技術の例を示すフロー図である。

詳細な説明

[0026]３Ｄ−ＨＥＶＣにおける深さコーディング（depth coding）が、ＨＥＶＣコーディングと、インタービュー参照ピクチャを利用する典型的な動き補償である視差補償の最初に構築される。深さ情報をより好適に表すために、３Ｄ−ＨＥＶＣイントラコーディングにおいて、種々の拡張深さコーディングツールが適用される。拡張深さコーディングツールの全ては、非矩形のパーティション（non-rectangular partitions）に深さブロックを分割することを可能にする。こういった分割ベースの深さイントラコーディングモードは、深さモデリングモード(Depth Modeling Modes)（ＤＭＭ）、領域境界チェーン(Region Boundary Chain)（ＲＢＣ）コーディングおよび簡略化された深さコーディング(Simplified Depth Coding)（ＳＤＣ）を含む。ＤＭＭ、ＲＢＣまたはＳＤＣにおいて、各深さＰＵは、１つまたは２つの部分に分割され得、かつ各部分は、一定の値、すなわちＤＣ値によって表される。各パーティションに関するＤＣ値は、隣接する参照サンプルを用いて予測され、および残差値は予測誤差を補償するためにさらにコード化され得る。

[0027]ＤＭＭとＲＢＣ両方の方法は、深さＰＵを２つの部分に分割するが、それらは分割パターンの表現については相違がある。ＤＭＭにおいて、ウェッジレットと輪郭パターン（wedgelet and contour pattern）を含む２つのタイプの分割パターンが適用される。ウェッジレットパターンは、特定の直線を用いて深さＰＵを分割する（segments）。ウェッジレットとは異なり、ＲＢＣは、一連の連結されたチェーンを用いて、明確に分割パターンを表し、各チェーンは、１つのサンプルと０から７までのインデックス付の８個の連結サンプル（eight-connectivity samples）のうちの１つの連結であり得、輪郭パターンは、深さＰＵをそれぞれが別個のサブ領域を含み得る２つのイレギュラーなパーティションへの分割をサポートできる。深さブロックの輪郭のパーティションは、同じ場所を共有するテクスチャ（co-located texture）を解析することによって計算され得る。さらに、分割パターンをシグナリングするための異なる方法は、１）ウェッジレットパターンの既定のセットから選択されたウェッジレットパターンインデックスを明確にシグナリングすること、２）隣接するイントラ予測モードを用いる現在のウェッジレットパターンとウェッジレットパターンを予測すること、３）再構築された同じ場所を共有するテクスチャブロックに基づいて、分割パターンを抽出すること、を含む、ウェッジレットモードで利用される。

[0028]動きパラメータ継承(Motion Parameter Inheritance)（ＭＰＩ）は統合候補リスト生成を修正することによって実施されてきた。同じ場所を共有するテクスチャブロックの動き情報から生成され得る１つの付加的な統合候補は、ＨＥＶＣ統合モードによって作成されたオリジナルの空間的および時間的な候補に加えて、現在の深さブロックの統合リストに追加され得る。

[0029]高度なインタービューコーディングスキームは、深さコーディングに適用されない。深さコーディングにおいて、視差ベクトルを抽出するために、テクスチャコーディングにおいて用いられる隣接ベースの視差ベクトルの誘導（ＮＢＤＶ）スキームを利用することは、より精度が低くかつより複雑になり得る。したがって、本開示に説明される技術は、隣接するブロックにおける１つまたは複数の再構築された深さサンプルから現在の深さブロックに関する視差ベクトルを生成する。抽出された視差ベクトルは、インタービュー動き予測と高度な残差予測を含む高度なインタービューコーディングツールに利用され得る。

[0030]深さブロックに関する視差ベクトル誘導は、ＰＵレベルまたはＣＵレベルにおいて生じ得る。ＣＵレベルの視差ベクトル誘導において、ＣＵの全てのＰＵに関して、現在のＰＵをカバーするコーディングユニット（ＣＵ）の隣接するブロックにおける再構築された深さサンプルのうちの１つの深さ値は、所定の参照ビューの対応するブロックに対する視差ベクトルに変換されるために（to be converted to a disparity vector to a corresponding block of a given reference view）利用され得る。視差値から視差ベクトルへの変換は、カメラパラメータに基づき得る。複数の視差ベクトルは、参照ビューに対応するそれぞれが抽出され得る。

[0031]例えば、少なくとも１つの視差値を決定する際に、システムは、各々のＰＵの２つ以上の隣接するサンプルに少なくとも部分的に基づいて、２つ以上の視差値を決定し得る。少なくとも１つの視差値に少なくとも部分的に基づいて少なくとも１つの視差ベクトルを決定する際に、システムは、２つ以上の視差値に少なくとも部分的に基づいて２つ以上の視差ベクトルを決定し得る。ＰＵの左上のサンプルは、座標（ｘ，ｙ）を有し、２つ以上の再構築された深さサンプルは、ＰＵの上部に隣接する行、ＰＵの左側に隣接する列、各々のＰＵの特別な隣接するブロックに配置された任意のサンプル、座標（ｘ−１，ｙ＋１）を有するサンプル、座標（ｘ＋１，ｙ−１）を有するサンプル、およびＰＵのサイズがＷ×Ｈによって表される場合は、座標（ｘ−１，ｙ＋Ｈ−１）を有するサンプルと座標（ｘ＋Ｗ−１，ｙ−１）を有するサンプル、のうちの少なくとも２つ以上からのものである。

[0032]ＰＵをカバーするＣＵの隣接するサンプルは下記のとおり選択され得る。現在のＰＵをカバーするＣＵ内の左上のサンプルの座標は（ｘ，ｙ）と表され得る。１つの例において、現在のＰＵをカバーするＣＵの左上に隣接するサンプルが選択され得る。左上に隣接するサンプルは（ｘ−１，ｙ−１）の座標を有する。さらに、現在のＰＵをカバーするＣＵの上部に隣接する行または左側に隣接する列に配置された任意のサンプルが使用され得る。さらに、現在のＰＵをカバーするＣＵの空間的に隣接するブロックに配置される任意のサンプルが使用され得る。

[0033]別法として、現在のＰＵがコード化されると、現在のＰＵをカバーするＣＵの２つ以上の使用可能な隣接するサンプルは、現在のＰＵに関する１つ又は複数の視差ベクトルを抽出するために使用され得る。例えば、座標（ｘ，ｙ−１）を有する別の上部のサンプルと座標（ｘ−１，ｙ）を有する別の左側のサンプルが使用され得る。別法として、（ｘ−１，ｙ＋１）または（ｘ＋１，ｙ−１）の座標を有するサンプルが使用され得る。ＣＵのサイズが２Ｎ×２Ｎによって表され得る場合は、（ｘ−１，ｙ＋２Ｎ−１）および（ｘ＋２Ｎ−１，ｙ−１）の座標を有する任意のサンプルが使用され得る。さらに、上部に隣接する行、左側に隣接する列、または現在のＰＵをカバーするＣＵの空間的に隣接するブロックの任意のサンプルが使用され得る。

[0034]例えば、少なくとも１つの視差値を決定する際に、システムは、各々のＣＵの２つ以上の隣接するサンプルに少なくとも部分的に基づいて、２つ以上の視差値を決定し得る。各々のＣＵの左上のサンプルは、座標（ｘ，ｙ）を有し、２つ以上の再構築された深さサンプルは、各々のＣＵの左上に隣接するサンプル、各々のＣＵの上部に隣接する行、各々のＣＵの左側に隣接する列、各々のＣＵの特別な隣接するブロックに配置された任意のサンプル、座標（ｘ−１，ｙ＋１）を有するサンプル、座標（ｘ＋１，ｙ−１）を有するサンプル、および各々のＣＵのサイズが２Ｎ×２Ｎで表される場合は、座標（ｘ−１，ｙ＋２Ｎ−１）を有するサンプルと座標（ｘ＋２Ｎ−１，ｙ−１）を有するサンプル、のうちの少なくとも２つ以上からのものである。

[0035]別法として、現在のＰＵがコード化されると、現在のＰＵをカバーする最大ＣＵ（ＬＣＵ）の１つまたは複数の使用可能な隣接するサンプルが、現在のＰＵに関する１つまたは複数の視差ベクトルを抽出するために使用され得る。いくつかの例において、上述したサンプルのうちのいくつかはＬＣＵのために使用され得る。

[0036]ＰＵレベルの視差ベクトル誘導に関して、各ＰＵについて、隣接するブロックにおいて再構築された深さサンプルのうちの１つの深さ値は、所定の参照ビューの対応するブロックに対する視差ベクトルに変換されるために利用され得る。視差値から視差ベクトルへの変換は、カメラパラメータに基づき得る。参照ビューにそれぞれ対応する複数の視差ベクトルが抽出され得る。

[0037]図１は、本開示において説明される技術を利用し得るビデオコーディングシステム１０の例を示すブロック図である。ここで使用されるように、「ビデオコーダ」という用語は一般に、ビデオエンコーダとビデオデコーダの両方を指す。本開示において、「ビデオコーディング」または「コーディング」という用語は一般に、ビデオ符号化またはビデオ復号を指し得る。

[0038]図１に示されたように、ビデオコーディングシステム１０は、ソースデバイス１２とデスティネーションデバイス１４を含む。ソースデバイス１２は符号化されたビデオデータを生成する。したがって、ソースデバイス１２は、ビデオ符号化デバイスまたはビデオ符号化装置と称され得る。デスティネーションデバイス１４は、ソースデバイス１２によって生成された符号化されたビデオデータを復号し得る。したがって、デスティネーションデバイス１４は、ビデオ復号デバイスまたはビデオ復号装置と称され得る。ソースデバイス１２とデスティネーションデバイス１４は、ビデオコーディングデバイスまたはビデオコーディング装置の例であり得る。

[0039]ソースデバイス１２とデスティネーションデバイス１４は、デスクトップコンピュータ、モバイルコンピューティングデバイス、ノートブック（例えばラップトップ）コンピュータ、タブレットコンピュータ、セットトップボックス、いわゆる「スマート」フォンのようなテレフォンハンドセット、テレビジョン、カメラ、表示デバイス、デジタルメディアプレイヤ、ビデオゲームコンソール、自動車内に設置されたコンピュータなどを含む広範囲にわたるデバイスを備え得る。

[0040]デスティネーションデバイス１４は、チャネル１６を介してソースデバイス１２から符号化されたビデオデータを受信し得る。チャネル１６は、ソースデバイス１２からデスティネーションデバイス１４へ符号化されたビデオデータを移動することが可能な１つまたは複数のメディアまたはデバイスを備え得る。一例において、チャネル１６は、ソースデバイス１２が、符号化されたビデオデータを直接デスティネーションデバイス１４に即時送信することを可能にする１つまたは複数の通信メディアを備え得る。この例において、ソースデバイス１２は、ワイヤレス通信プロトコルのような通信の標準にしたがって、符号化されたビデオデータを変調し得、デスティネーションデバイス１４に変調されたビデオデータを送信し得る。１つまたは複数の通信メディアは、無線周波数（ＲＦ）スペクトルあるいは１つまたは複数の物理伝送線路(physical transmission lines)のようなワイヤレスおよび／またはワイヤード通信メディアを含み得る。１つまたは複数の通信メディアは、ローカルエリアネットワーク、広域ネットワーク、またはグローバルネットワーク（例えば、インターネット）のようなパケットベースネットワークの一部を形成し得る。１つまたは複数の通信メディアは、ソースデバイス１２からデスティネーションデバイス１４への通信を容易にするルータ、スイッチ、基地局、または他の機器を含み得る。

[0041]別の例において、チャネル１６は、ソースデバイス１２によって生成された符号化されたビデオデータを記憶する記憶媒体を含み得る。この例において、デスティネーションデバイス１４は、例えば、ディスクアクセスまたはカードアクセスを介して記憶媒体にアクセスし得る。記憶媒体は、Ｂｌｕ−ｒａｙ（登録商標）ディスク、ＤＶＤ，ＣＤ−ＲＯＭ、フラッシュメモリ、または符号化されたビデオデータを記憶するための他の適切なデジタル記憶メディアのように、ローカルにアクセスされる様々なデータ記憶メディアを含み得る。

[0042]さらなる例において、チャネル１６は、ソースデバイス１２によって生成された、符号化されたビデオデータを記憶するファイルサーバまたは別の中間記憶デバイスを含み得る。この例において、デスティネーションデバイス１４は、ストリーミングまたはダウンロードを介してファイルサーバまたは他の中間記憶デバイスに記憶された、符号化されたビデオデータにアクセスし得る。ファイルサーバは、符号化されたビデオデータを記憶し、該符号化されたビデオデータをデスティネーションデバイス１４に送信することが可能なサーバのタイプであり得る。ファイルサーバの例は、ウェブサーバ（例えば、ウェブサイト用の）ファイル転送プロトコル（ＦＴＰ）サーバ、ネットワーク接続型記憶（ＮＡＳ）デバイス、およびローカルディスクドライブを含む。

[0043]デスティネーションデバイス１４は、インターネット接続のような標準のデータ接続を介して符号化されたビデオデータにアクセスし得る。データ接続のタイプの例は、ワイヤレスチャネル（例えば、Ｗｉ−Ｆｉ（登録商標）接続）、ワイヤード接続（例えば、ＤＳＬ、ケーブルモデムなど）、またはファイルサーバに記憶された、符号化されたビデオデータにアクセスするのに適切な両方の組合せを含み得る。ファイルサーバからの符号化されたビデオデータの送信は、ストリーミング送信、ダウンロード送信、またはその両方の組合せであり得る。

[0044]本開示の技術は、ワイヤレスアプリケーションまたは設定に限定されるものではない。この技術は、例えば、インターネットを介した、無線テレビ放送、ケーブルテレビ送信、衛星テレビ送信、ストリーミングビデオ送信のような様々なマルチメディアアプリケーション、データ記憶媒体に記憶するためのビデオデータの符号化、データ記憶媒体に記憶されたビデオデータの復号、あるいは他のアプリケーション、をサポートするビデオコーディングに適用され得る。いくつかの例において、ビデオコーディングシステム１０は、ビデオストリーミング、ビデオの再生、ビデオ放送、および／またはビデオ電話のようなアプリケーションをサポートするための一方向または双方向のビデオ送信をサポートするように構成され得る。

[0045]図１は、単に一例であり、本開示の技術は、符号化デバイスおよび復号デバイスの間にいずれかのデータ通信を必ずしも含まないビデオコーディング設定（例えば、ビデオ符号化またはビデオ復号）に適用し得る。他の例において、データはローカルメモリから検索され、ネットワークなどを介してストリーミングされる。ビデオ符号化デバイスは、データを符号化してメモリに記憶し得、および／またはビデオ復号デバイスは、メモリからデータを検索して復号し得る。多くの例において、符号化および復号は相互に通信を行わないデバイスによって実行され得るが、単にデータを符号化してメモリに記憶しおよび／またはメモリからデータを検索して復号するのみである。

[0046]図１の例において、ソースデバイス１２は、ビデオソース１８、ビデオエンコーダ２０、および出力インターフェース２２を含む。いくつかの例において、出力インターフェース２２は、変調器／復調器（モデム）および／または送信機を含み得る。ビデオソース１８は、例えばビデオカメラなどのビデオキャプチャデバイス、前にキャプチャしたビデオデータを含むビデオアーカイブ、ビデオコンテンツプロバイダからビデオデータを受信するためのビデオフィードインターフェース、および／またはビデオデータを生成するためのコンピュータグラフィックスシステム、またはビデオデータのソースなどの組合せを含み得る。

[0047]ビデオエンコーダ２０は、ビデオソース１８からのビデオデータを符号化し得る。いくつかの例において、ソースデバイス１２は、出力インターフェース２２を介してデスティネーションデバイス１４に符号化されたビデオデータを直接送信する。他の例において、符号化されたビデオデータは、デスティネーションデバイス１４が復号および／または再生のために後からアクセスするための記憶媒体またはファイルサーバ上にも記憶され得る。

[0048]本開示の技術は、ビデオエンコーダ２０のようなビデオエンコーダの要素によって実行され得る。この技術において、ビデオデータのピクチャのスライスの各々のコーディングユニットの各予測ユニットに関して、ビデオエンコーダ２０は、少なくとも１つの隣接サンプルの少なくとも１つの再構築された深さサンプルの少なくとも１つの深さ値に少なくとも部分的に基づいて、少なくとも１つの視差値を決定し得る。ビデオエンコーダ２０は、少なくとも１つの視差値に少なくとも部分的に基づいて、少なくとも１つの視差ベクトルを決定し得、ここにおいて、少なくとも１つの視差ベクトルが各々のコーディングユニットに関する。ビデオエンコーダ２０は、少なくとも１つの視差ベクトルに少なくとも部分的に基づいて、各々のコーディングユニットに関するコーディングブロックの符号化された描写を生成し得る。

[0049]図１の例において、デスティネーションデバイス１４は、入力インターフェース２８、ビデオデコーダ３０、および表示デバイス３２を含む。いくつかの例において、入力インターフェース２８は、受信機および／またはモデムを含む。入力インターフェース２８は、チャネル１６を介して符号化されたビデオデータを受信し得る。表示デバイス３２は、デスティネーションデバイス１４と統合され得るか、またはデスティネーションデバイス１４の外部にあり得る。一般に、表示デバイス３２は、復号されたビデオデータを表示する。表示デバイス３２は、液晶ディスプレイ（ＬＣＤ）、プラズマディスプレイ、有機発光ダイオード（ＯＬＥＤ）ディスプレイ、または別のタイプの表示デバイスのような様々な表示デバイスを備え得る。

[0050]本開示の技術は、ビデオデコーダ３０のようなビデオデコーダの要素によって実行され得る。ビデオデータのピクチャのスライスの各々のコーディングユニットの各予測ユニットに関して、ビデオデコーダ３０は、少なくとも１つの隣接するサンプルの少なくとも１つの再構築された深さサンプルの少なくとも１つの深さ値に少なくとも部分的に基づいて、少なくとも１つの視差値を決定し得る。ビデオデコーダ３０は、少なくとも１つの視差値に少なくとも部分的に基づいて、少なくとも１つの視差ベクトルを決定し得、ここにおいて、少なくとも１つの視差ベクトルが各々のコーディングユニットに関する。ビデオデコーダ３０は、少なくとも１つの視差ベクトルに少なくとも部分的に基づいて、各々のコーディングユニットに関するコーディングブロックを再構築し得る。

[0051]ビデオエンコーダ２０およびビデオデコーダ３０はそれぞれ、１つまた複数のマイクロプロセッサ、デジタル信号プロセッサ（ＤＳＰ）、アプリケーション特定集積回路（ＡＳＩＣ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、ディスクリート論理、ハードウェア、またはそれらの任意の組合せのような様々な適切な回路のいずれかとして実装され得る。この技術がソフトウェアにおいて部分的に実施される場合、デバイスは適切な非一時的なコンピュータ可読記憶媒体内にソフトウェアのための命令を記憶し得、本開示の技術を実行するために、１つまた複数のプロセッサを用いてハードウェア内の命令を実行し得る。（ハードウェア、ソフトウェア、ハードウェアとソフトウェアの組合せなどを含む）前述のいずれかは、１つまたは複数のプロセッサであると考えられ得る。ビデオエンコーダ２０およびビデオデコーダ３０のそれぞれは１つまた複数のエンコーダまたはデコーダ内に含まれ得、それらのうちのいずれかは、それぞれのデバイス内の組み合されたエンコーダ／デコーダ（ＣＯＤＥＣ）の一部として統合され得る。

[0052]本開示は、一般的に、特定の情報をビデオデコーダ３０のような別のデバイスに「シグナリング」するビデオエンコーダ２０に言及し得る。「シグナリング」という用語は、一般的に、圧縮されたビデオデータを復号するために使用されるシンタックス要素および／または他のデータの通信を指し得る。こういった通信は、即時にまたはほぼ即時に発生し得る。別法として、符号化時に符号化されたビットストリームにおいて、例えばファイルサーバまたはストリーミングサーバを介してリモートにアクセス可能な記憶媒体またはローカルにアクセス可能な記憶デバイスといったコンピュータ可読記憶媒体に、例えばシンタックス要素を記憶する場合、こういった通信は、一定時間にわたって発生し得、次にこの媒体に記憶された後は、いつでも復号デバイスによって検索され得る。

[0053]いくつかの例において、ビデオエンコーダ２０およびビデオデコーダ３０は、スケーラブルビデオコーディング（ＳＶＣ）拡張、マルチビュービデオコーディング（ＭＶＣ）拡張、およびＭＶＣベースの３ＤＶ拡張を含む、ＩＳＯ／ＩＥＣＭＰＥＧ−４ビジュアルおよびＩＴＵ−ＴＨ．２６４（ＩＳＯ／ＩＥＣＭＰＥＧ−４ＡＶＣとしても知られる）のようなビデオ圧縮の標準にしたがって動作する。いくつかの例において、ＭＶＣベースの３ＤＶに準拠する任意の適法なビットストリームは、例えば、ステレオハイプロファイルなどのＭＶＣプロファイルに適合し得るサブビットストリームを常に含む。Ｈ．２６４／ＡＶＣのＭＶＣ拡張の共同文書は、２０１０年３月の「一般的なオーディオビジュアルサービスのための高度なビデオコーディング」ＩＴＵ−Ｔ推薦Ｈ．２６４において説明される。さらに、Ｈ．２６４／ＡＶＣに対する３次元ビデオ（３ＤＶ）コーディング拡張、すなわちＡＶＣベースの３ＤＶを生成するために現在進行中の取り組みがある。他の例において、ビデオエンコーダ２０およびビデオデコーダ３０は、ＩＴＵ−ＴＨ．２６１、ＩＳＯ／ＩＥＣＭＰＥＧ−１ビジュアル、ＩＴＵ−ＴＨ．２６２またはＩＳＯ／ＩＥＣＭＰＥＧ−２ビジュアル、ＩＴＵ−ＴＨ．２６３、ＩＳＯ／ＩＥＣＭＰＥＧ−４ビジュアル、およびＩＴＵ−ＴＨ．２６４、ＩＳＯ／ＩＥＣビジュアルにしたがって動作し得る。

[0054]図１の例において、ビデオエンコーダ２０およびビデオデコーダ３０は、ＩＴＵ−Ｔビデオコーディング専門家グループ（ＶＣＥＧ）とＩＳＯ／ＩＥＣ動画専門家グループ（ＭＰＥＧ）のビデオコーディング（ＪＣＴ−ＶＣ）に関する共同協力チームによって現在開発中の高効率ビデオコーディング（ＨＥＶＣ）の標準にしたがって動作し得る。「ＨＥＶＣ作業ドラフト１０」と称される近く発表されるＨＥＶＣの標準のドラフトは、ブロス氏およびその他による「高効率ビデオコーディング（ＨＥＶＣ）テキスト仕様書ドラフト１０」に記載されており、２０１３年１月にスイスのジュネーブにて開催された、ＩＴＵ−ＴＳＧ１６ＷＰ３およびＩＳＯ／ＩＥＣＪＴＣ１／ＳＣ２９／ＷＧ１１のビデオコーディング（ＪＣＴ−ＶＣ）に関する共同協力チームによる第１２回の会議にて発表され、２０１３年５月３１よりｈｔｔｐ：／／ｐｈｅｎｉｘ．ｉｔ−ｓｕｄｐａｒｉｓ．ｅｕ／ｊｃｔ／ｄｏｃ＿ｅｎｄ＿ｕｓｅｒ／ｄｏｃｕｍｅｎｔｓ／１２＿Ｇｅｎｅｖａ／ｗｇ１１／ＪＣＴＶＣ−Ｌ１００３−ｖ３４．ｚｉｐから使用可能である。

[0055]さらに、スケーラブルビデオコーディング、マルチビューコーディング、およびＨＥＶＣに関する３ＤＶ拡張を作成するために現在進行中の取り組みがある。ＨＥＶＣのＳＶＣ拡張はＳＨＥＶＣと称され得る。ＨＥＶＣの３ＤＶ拡張は、ＨＥＶＣベースの３ＤＶまたは３Ｄ−ＨＥＶＣと称され得る。３Ｄ−ＨＥＶＣは、２０１１年１１月／１２月にスイスのジュネーブにて発表された、シュワルツ氏およびその他による「フラウンホーファーＨＨＩ（ＨＥＶＣに準拠した構成Ａ）、ＩＳＯ／ＩＥＣＪＴＣ１／ＳＣ２９／ＷＧ１１,Ｄｏｃ.ＭＰＥＧ１１／Ｍ２２５７０による３Ｄビデオビデオコーディングの技術提案の説明」、以下「ｍ２２５７０」と称す、および２０１１年１１月／１２月にスイスのジュネーブにて発表された、シュワルツ氏およびその他による「フラウンホーファーＨＨＩ（ＨＥＶＣに準拠した構成Ｂ）、ＩＳＯ／ＩＥＣＪＴＣ１／ＳＣ２９／ＷＧ１１，Ｄｏｃ．ＭＰＥＧ１１／Ｍ２２５７１による３Ｄビデオコーディングの技術提案の説明」、以下「ｍ２２５７１」と称す、において提案された解決法に部分的に基づく。３Ｄ−ＨＥＶＣに関する参照ソフトウェアの説明は、２０１２年２月に米国のサンノゼにて発表された、シュワルツ氏およびその他による「ＨＥＶＣベースの３Ｄビデオコーディングに関して検討中のテストモデル」、ＩＳＯ／ＩＥＣＪＴＣ１／ＳＣ２９／ＷＧ１１ＭＰＥＧ２０１１／Ｎ１２５５９において使用可能である。参照ソフトウェア、すなわちＨＴＭバージョン３．０は、ｈｔｔｐｓ：／／ｈｅｖｃ．ｈｈｉ．ｆｒａｕｎｈｏｆｅｒ．ｄｅ／ｓｖｎ／ｓｖｎ＿３ＤＶＣＳｏｆｔｗａｒｅ／ｔａｇｓ／ＨＴＭ−３．０／から、２０１３年５月３１日より使用可能である。

[0056]Ｈ．２６４／ＡＶＣ、ＨＥＶＣ、および他のビデオコーディングの標準において、ビデオシーケンスは一連のピクチャを含み得る。ピクチャは「フレーム」とも称され得る。ピクチャは３つのサンプルアレイを含み得、Ｓ_Ｌ、Ｓ_ＣｂおよびＳ_Ｃｒと表示される。Ｓ_Ｌは、ルーマサンプルの２次元アレイ（すなわちブロック）である。Ｓ_Ｃｂは、Ｃｂクロミナンスサンプルの２次元アレイである。Ｓ_Ｃｒは、Ｃｒクロミナンスサンプルの２次元アレイである。クロミナンスサンプルは、ここで、「クロマ」サンプルとも称され得る。他の例において、ピクチャは単色であり得、およびルーマサンプルのアレイを含むのみであり得る。

[0057]Ｈ．２６４／ＡＶＣにおいて、各ピクチャは、マクロブロック（ＭＢｓ）のセットに分割され得る。マクロブロックは、３つのサンプルアレイを有するピクチャのルーマサンプルの１６×１６のブロックとクロマサンプルの２つの対応するブロック、または単色のピクチャ、または３つの別個の色平面を使用してコード化されるピクチャのサンプルの１６×１６のブロックである。

[0058]ビデオエンコーダ２０は、インター予測またはイントラ予測を用いてマクロブロックを符号化し得る。ビデオエンコーダ２０がインター予測を用いてマクロブロックを符号化する場合、ビデオエンコーダ２０は、現在のピクチャ（すなわちマクロブロックを含むピクチャ）以外の１つまたは複数のピクチャのサンプルに基づいて、マクロブロックに関する１つまたは複数の予測ブロックを生成する。インター予測を用いて符号化されたマクロブロックは、インターマクロブロックと称され得る。ビデオエンコーダ２０がイントラ予測を用いてマクロブロックを符号化する場合、ビデオエンコーダ２０は、現在のピクチャ内のサンプルに基づいて、マクロブロックに関する１つまたは複数の予測ブロックを生成する。イントラ予測を用いて符号化されたマクロブロックは、イントラマクロブロックと称され得る。

[0059]Ｈ．２６４／ＡＶＣにおいて、各インターマクロブロックは、４つの異なる方法、すなわち、１つの１６×１６のマクロブロックパーティション、２つの１６×８のマクロブロックパーティション、２つの８×１６のマクロブロックパーティション、あるいは４つの８×８のマクロブロックパーティションに分割され得る。

[0060]１つのＭＢにおける異なるＭＢのパーティションは、各方向に関して異なる参照インデックス値（すなわちＲｅｆＰｉｃＬｉｓｔ０またはＲｅｆＰｉｃＬｉｓｔ１）を有し得る。ＭＢが４つの８×８のＭＢパーティションに分割されない場合、ＭＢはそれぞれの方向にＭＢパーティション全体について１つだけ動きベクトルを有し得る。

[0061]ＭＢが４つの８×８のＭＢパーティションに分割される場合、それぞれの８×８のＭＢパーティションはさらにサブブロックに分割され得る。８×８のＭＢパーティションからサブブロックを取得するために４つの異なる方法、すなわち、１つの８×８のサブブロック、２つの８×４のサブブロック、２つの４×８のサブブロック、あるいは４つの４×４のサブブロックがある。

[0062]それぞれのサブブロックはそれぞれの方向に異なる動きベクトルを有し得る。８×８のＭＢパーティションがどのようにサブブロックに分割されるかは、サブブロックパーティションと名づけられている。

[0063]上述したとおり、マルチビューコーディング（ＭＶＣ）は、Ｈ．２６４／ＡＶＣの拡張である。マルチビューコーディングにおいて、異なる視点から、同じ場面の複数の物のビューが存在し得る。「アクセスユニット」という用語は、同じ時間インスタンスに対応するピクチャのセットを指すために使用される。したがって、ビデオデータは、時間にわたって生じる一連のアクセスユニットとして概念化され得る。「ビュー構成要素」とは、単一のアクセスユニットにおけるビューのコード化された描写であり得る。本開示において、「ビュー」は、同じビュー識別子に関連付けられる一連のビュー構成要素を指し得る。

[0064]ＶＣＥＧとＭＰＥＧの３Ｄビデオコーディング（ＪＣＴ−３Ｃ）に関する共同協力チームは、ＨＥＶＣに基づく３ＤＶの標準を開発しており、それに対して、標準化の取り組みの一部は、ＨＥＶＣ（ＭＶ−ＨＥＶＣ）に基づくマルチビュービデオコーデックの標準化とＨＥＶＣ（３Ｄ−ＨＥＶＣ）に基づく３Ｄビデオコーディングについての別の部分を含む。３Ｄ−ＨＥＶＣに関して、テクスチャビューと深さビューの両方が含まれかつサポートされ得るため、新しいコーディングツールは、コーディングユニット／予測ユニットレベルにおいてそれらを含む。３Ｄ−ＨＥＶＣ（３Ｄ−ＨＴＭバージョン６．０）に関する最新のソフトウェア３Ｄ−ＨＴＭは、ｈｔｔｐｓ：／／ｈｅｖｃ．ｈｈｉ．ｆｒａｕｎｈｏｆｅｒ．ｄｅ／ｓｖｎ／ｓｖｎ＿３ＤＶＣＳｏｆｔｗａｒｅ／ｔａｇｓ／ＨＴＭ−６．０／において、２０１３年５月３１日より使用可能である。

[0065]最新の基準ソフトウェアの説明は、３Ｄ−ＨＥＶＣの作業ドラフトと同様に、ｈｔｔｐ：／／ｐｈｅｎｉｘ．ｉｔ−ｓｕｄｐａｒｉｓ．ｅｕ／ｊｃｔ２／ｄｏｃ＿ｅｎｄ＿ｕｓｅｒ／ｄｏｃｕｍｅｎｔｓ／３＿Ｇｅｎｅｖａ／ｗｇ１１／ＪＣＴ３Ｖ−Ｃ１００５−ｖ２．ｚｉｐ、ＩＴＵ−ＴＳＧ１６ＷＰ３およびＩＳＯ／ＩＥＣＪＴＣ１／ＳＣ２９／ＷＧ１１の３Ｄビデオコーディング拡張の開発に関して２０１３年１月１７日から２３日にかけてスイスのジュネーブで開催された共同協力チームによる第３回会議における、ゲールハルト・テック氏、クシシュトフ・ウェグナー氏、イン・チェン氏、セフン・イェ氏による「３Ｄ−ＨＥＶＣテストモデル３」ＪＣＴ３Ｖ−Ｃ１００５＿ｓｐｅｃ＿ｄ１において、２０１３年５月３１日より使用可能である。

[0066]ピクチャの符号化された描写を生成するために、ビデオエンコーダ２０は、コーディングツリーユニット（ＣＴＵｓ）のセットを生成し得る。ＣＴＵのそれぞれは、複数のルーマサンプルから成るコーディングツリーブロック、複数のクロマサンプルから成る２つの対応するコーディングツリーブロック、およびコーディングツリーブロックのサンプルをコード化するために用いられるシンタックス構造であり得る。コーディングツリーブロックは、Ｎ×Ｎのサンプルから成るブロック（an NxN block of samples）であり得る。ＣＴＵは、「ツリーブロック」または「最大コーディングユニット」（ＬＣＵ）とも称され得る。ＨＥＶＣのＣＴＵは、Ｈ．２６４／ＡＶＣのような他のビデオコーディングの標準のマクロブロックに概ね類似し得る。しかし、ＣＴＵは、必ずしも特定のサイズに限定されるわけではなく、１つまたは複数のコーディングユニット（ＣＵｓ）を含み得る。スライスは、ラスター走査において、連続して順序付けられた整数のＣＴＵを含み得る。

[0067]本開示は、１つまたは複数のサンプルのブロックと、１つまたは複数のサンプルのブロックのサンプルをコード化するために用いられるシンタックス構造を指すために、「ビデオユニット」または「ビデオブロック」という用語を使用し得る。ビデオユニットのタイプの例は、ＣＴＵ、ＣＵ、ＰＵ、変換ユニット（ＴＵｓ）、マクロブロック、マクロブロックパーティションなどを含み得る。

[0068]コード化されたＣＴＵを生成するために、ビデオエンコーダ２０は、コーディングツリーブロックをコーディングブロックに分割するために、ＣＴＵのコーディングツリーブロック上で再帰的に四分木分割を実行し得、そのため、「コーディングツリーユニット」という名である。コーディングブロックは、Ｎ×Ｎのサンプルのブロックである。ＣＵは、ルーマサンプルアレイ、Ｃｂサンプルアレイ、およびＣｒサンプルアレイ、およびコーディングブロックのサンプルをコード化するために用いられるシンタックス構造を有するピクチャのルーマサンプルのコーディングブロックと２つの対応するクロマサンプルのコーディングブロックであり得る。ビデオエンコーダ２０は、ＣＵのコーディングブロックを１つまたは複数の予測ブロックに分割し得る。予測ブロックは、同じ予測が適用されるサンプルの矩形（すなわち正方形または非正方形）ブロックであり得る。ＣＵの予測ユニット（ＰＵ）は、ピクチャのルーマサンプルの予測ブロック、２つの対応するクロマサンプルの予測ブロック、および予測ブロックのサンプルを予測するために用いられるシンタックス構造であり得る。ビデオエンコーダ２０は、予測ルーマ、ルーマに関するＣｂおよびＣｒブロック、およびＣＵの各ＰＵのＣｂおよびＣｒ予測ブロックを生成し得る。

[0069]ビデオエンコーダ２０は、ＰＵに関する予測ブロックを生成するためにイントラ予測またはインター予測を使用し得る。ビデオエンコーダ２０がＰＵの予測ブロックを生成するためにイントラ予測を用いる場合、ビデオエンコーダ２０は、ＰＵと関連付けられるピクチャの復号されたサンプルに基づいてＰＵの予測ブロックを生成し得る。

[0070]ビデオエンコーダ２０がＰＵの予測ブロックを生成するためにインター予測を用いる場合、ビデオエンコーダ２０は、ＰＵと関連付けられるピクチャ以外の１つまたは複数のピクチャの復号されたサンプルに基づいて、ＰＵの予測ブロックを生成し得る。インター予測は、一方向のインター予測（すなわち一方向予測）または双方向のインター予測（すなわち双方向予測）であり得る。一方向予測または双方向予測を実行するために、ビデオエンコーダ２０は、現在のスライスに関する第１の参照ピクチャリスト（ＲｅｆＰｉｃＬｉｓｔ０）および第２の参照ピクチャリスト（ＲｅｆＰｉｃＬｉｓｔ１）を生成し得る。参照ピクチャリストのそれぞれは、１つまたは複数の参照ピクチャを含み得る。一方向予測を用いる場合、ビデオエンコーダ２０は、参照ピクチャ内の参照場所を決定するために、ＲｅｆＰｉｃＬｉｓｔ０およびＲｅｆＰｉｃＬｉｓｔ１のいずれかまたは両方における参照ピクチャを検索し得る。さらに、一方向予測を用いる場合、ビデオエンコーダ２０は、参照場所に対応するサンプルに少なくとも部分的に基づいて、ＰＵに関する予測サンプルブロックを生成し得る。さらに、一方向予測を用いる場合、ビデオエンコーダ２０は、ＰＵの予測ブロックと参照場所の間の空間的置換を示す単一の動きベクトルを生成し得る。ＰＵの予測ブロックと参照場所の間の空間的置換を示すために、動きベクトルは、ＰＵの予測ブロックと参照場所の間の水平置換を特定する水平成分を含み得、およびＰＵの予測ブロックと参照場所の間の垂直置換を特定する垂直成分を含み得る。

[0071]ＰＵを符号化するために双方向予測を用いる場合、ビデオエンコーダ２０は、ＲｅｆＰｉｃＬｉｓｔ０における参照ピクチャ内の第１の参照場所とＲｅｆＰｉｃＬｉｓｔ１における参照ピクチャ内の第２の参照場所を決定し得る。ビデオエンコーダ２０は次に、第１および第２の参照場所に対応するサンプルに少なくとも部分的に基づいて、ＰＵに関する予測ブロックを生成し得る。さらに、ＰＵを符号化するために双方向予測を用いる場合、ビデオエンコーダ２０は、ＰＵのサンプルブロックと第１の参照場所の間の空間的置換を示す第１のＭＶとＰＵの予測ブロックと第２の参照場所の間の空間的置換を示す第２のＭＶを生成し得る。

[0072]ビデオエンコーダ２０がＣＵの１つまたは複数のＰＵに関する予測ルーマ、ＣｂおよびＣｒブロックを生成した後、ビデオエンコーダ２０は、ＣＵに関するルーマ残差ブロックを生成し得る。ＣＵのルーマ残差ブロック内の各サンプルは、ＣＵの予測ルーマブロックのうちの１つ中のルーマサンプルとＣＵのオリジナルのルーマコーディングブロック内の対応するサンプルの間の差を示す。さらに、ビデオエンコーダ２０は、ＣＵに関するＣｂ残差ブロックを生成し得る。ＣＵのＣｂ残差ブロック内の各サンプルは、ＣＵの予測Ｃｂブロックのうちの１つ中のＣｂサンプルとＣＵのオリジナルのＣｂコーディングブロック中の対応するサンプルの間の差を示し得る。ビデオエンコーダ２０は、ＣＵに関するＣｒ残差ブロックをも生成し得る。ＣＵのＣｒ残差ブロック内の各サンプルは、ＣＵの予測Ｃｒブロックのうちの１つ中のＣｒサンプルとＣＵのオリジナルのＣｒコーディングブロック中の対応するサンプルの間の差を示し得る。

[0073]さらに、ビデオエンコーダ２０は、ＣＵのルーマ、ＣｂおよびＣｒ残差ブロックを１つまたは複数のルーマ、ＣｂおよびＣｒ変換ブロックに分解するために、四分木分割を用い得る。変換ブロックは、同じ変換が適用されるサンプルの矩形ブロックであり得る。ＣＵの変換ユニット（ＴＵ）は、ルーマサンプルの変換ブロック、２つの対応するクロマサンプルの変換ブロック、および変換ブロックのサンプルを変換するために用いられるシンタックス構造であり得る。したがって、ＣＵの各ＴＵは、ルーマ変換ブロック、Ｃｂ変換ブロック、およびＣｒ変換ブロックと関連付けられ得る。ＴＵと関連付けられるルーマ変換ブロックは、ＣＵのルーマ残差ブロックのサブブロックであり得る。Ｃｂ変換ブロックは、ＣＵのＣｂ残差ブロックのサブブロックであり得る。Ｃｒ変換ブロックは、ＣＵのＣｒ残差ブロックのサブブロックであり得る。

[0074]ビデオエンコーダ２０は、ＴＵに関するルーマ係数ブロックを生成するために、ＴＵのルーマ変換ブロックに１つまたは複数の変換を適用し得る。係数ブロックは、変換係数の２次元アレイであり得る。変換係数はスカラー量であり得る。ビデオエンコーダ２０は、ＴＵに関するＣｂ係数ブロックを生成するために、ＴＵのＣｂ変換ブロックに１つまたは複数の変換を適用し得る。ビデオエンコーダ２０は、ＴＵに関するＣｒ係数ブロックを生成するために、ＴＵのＣｒ変換ブロックに１つまたは複数の変換を適用し得る。

[0075]係数ブロック（例えば、ルーマ係数ブロック、Ｃｂ係数ブロック、またはＣｒ係数ブロック）を生成した後、ビデオエンコーダ２０は係数ブロックを量子化し得る。量子化とは一般的に、変換係数が変換係数を表すために用いられるデータの量をできる限り減らし、さらなる圧縮を提供するために量子化されるプロセスを指す。さらに、ビデオエンコーダ２０は、変換係数を逆量子化し、ピクチャのＣＵのＴＵの変換ブロックを再構築するために、変換係数に逆変換を適用し得る。ビデオエンコーダ２０は、ＣＵのコーディングブロックを再構築するために、ＣＵのＴＵの再構築された変換ブロックとＣＵのＰＵの予測ブロックを使用し得る。ピクチャの各ＣＵのコーディングブロックを再構築することによって、ビデオエンコーダ２０はピクチャを再構築し得る。ビデオエンコーダ２０は、復号されたピクチャバッファ（ＤＰＢ）に再構築されたピクチャを記憶し得る。ビデオエンコーダ２０は、インター予測とイントラ予測のためにＤＰＢ内の再構築されたピクチャを使用し得る。

[0076]ビデオエンコーダ２０が係数ブロックを量子化した後、ビデオエンコーダ２０は、量子化された変換係数を示すシンタックス要素をエントロピー符号化し得る。例えば、ビデオエンコーダ２０は、量子化された変換係数を示すシンタックス要素に関してコンテキスト適応型２値算術コーディング（ＣＡＢＣＡ）を実行し得る。ビデオエンコーダ２０は、ビットストリーム内にエントロピー符号化されたシンタックス要素を出力し得る。

[0077]ビデオエンコーダ２０は、コード化されたピクチャと関連データの描写を形成する一連のビットを含むビットストリームを出力し得る。ビットストリームは、一連のネットワーク抽象化レイヤ（ＮＡＬ）ユニットを備え得る。ＮＡＬユニットのそれぞれは、ＮＡＬユニットヘッダを含み、ローバイトシーケンスペイロード(a raw byte sequence payload)（ＲＢＳＰ）をカプセル化する。ＮＡＬユニットヘッダは、ＮＡＬユニットタイプコードを示すシンタックス要素を含み得る。ＮＡＬユニットのＮＡＬユニットヘッダによって特定されたＮＡＬユニットタイプコードは、ＮＡＬユニットのタイプを示す。ＲＢＳＰは、ＮＡＬユニット内でカプセル化される整数のバイトを含むシンタックス構造であり得る。いくつかの例において、ＲＢＳＰはゼロビットを含む。

[0078]ＮＡＬユニットの異なるタイプは、ＲＢＳＰの異なるタイプをカプセル化し得る。例えば、第１のタイプのＮＡＬユニットは、ピクチャパラメータセット（ＰＰＳ）に関するＲＢＳＰをカプセル化し得、第２のタイプのＮＡＬユニットはコード化されたスライスに関するＲＢＳＰをカプセル化し得、第３のタイプのＮＡＬユニットは補助拡張情報（ＳＥＩ）に関するＲＢＳＰをカプセル化し得る、などである。ＰＰＳは、ゼロ以上の全体にコード化されたピクチャに適用するシンタックス要素を含み得るシンタックス構造である。（パラメータセットとＳＥＩメッセージに関するＲＢＳＰとは対照的に）ビデオコーディングデータに関するＲＢＳＰをカプセル化するＮＡＬユニットは、ビデオコーディングレイヤ（ＶＣＬ）ＮＡＬユニットと称され得る。コード化されたスライスをカプセル化するＮＡＬユニットは、ここでは、コード化されたスライスＮＡＬユニットと称され得る。コード化されたスライスに関するＲＢＳＰは、スライスヘッダとスライスデータを含み得る。

[0079]ビデオデコーダ３０はビットストリームを受け取り得る。さらに、ビデオデコーダ３０は、ビットストリームからのシンタックス要素を復号するためにビットストリームを解析し得る。ビデオデコーダ３０は、ビットストリームから復号されたシンタックス要素に少なくとも部分的に基づいて、ビデオデータのピクチャを再構築し得る。ビデオデータを再構築するためのプロセスは、ビデオエンコーダ２０によって実行されるプロセスと一般的に相互に関係し得る。例えば、ビデオデコーダ３０は、現在のＣＵのＰＵに関する予測ブロックを決定するために、ＰＵの動きベクトルを使用し得る。ビデオデコーダ３０は、ＰＵに関する予測ブロックを生成するために、複数のＰＵの１つまたは複数の動きベクトルを使用し得る。

[0080]さらに、ビデオデコーダ３０は、現在のＣＵのＴＵと関連付けられる係数ブロックを逆量子化し得る。ビデオデコーダ３０は、現在のＣＵのＴＵと関連付けられる変換ブロックを再構築するために、係数ブロックに関して逆変換を実行し得る。ビデオデコーダ３０は、現在のＣＵのＰＵに関する予測サンプルブロックのサンプルを現在のＣＵのＴＵの変換ブロックの対応するサンプルに加えることによって、現在のＣＵのコーディングブロックを再構築し得る。ピクチャの各ＣＵに関するコーディングブロックを再構築することによって、ビデオデコーダ３０はピクチャを再構築し得る。ビデオデコーダ３０は、他のピクチャを復号する際に出力および／または使用するために、復号されたピクチャバッファ内に復号されたピクチャを記憶し得る。

[0081]ビデオコーダ（例えば、ビデオエンコーダ２０またはビデオデコーダ３０）がピクチャの現在のスライスのコーディングを開始するときに、ビデオコーダは第１の参照ピクチャリスト（すなわちリスト０）を初期化し得る。さらに、現在のスライスがＢスライスである場合、ビデオコーダは、第２の参照ピクチャリスト（すなわちリスト１）を初期化し得る。本開示は、リスト０を「ＲｅｆＰｉｃＬｉｓｔ０」と称し、リスト１を「ＲｅｆＰｉｃＬｉｓｔ１」と称し得る。ビデオコーダが参照ピクチャリスト（例えば、リスト０またはリスト１）を初期化した後に、ビデオコーダは、参照ピクチャリスト内の参照ピクチャの順序を修正し得る。言い換えると、ビデオコーダは、参照ピクチャリスト修正（ＲＰＬＭ）プロセスを実行し得る。ビデオコーダは、参照ピクチャの順序を、ある特定の参照ピクチャが参照ピクチャリスト内の２つ以上の位置に出現し得る場合を含む任意の順序に修正し得る。

[0082]いくつかの場合において、ビデオエンコーダ２０は、統合モードまたは高度な動きベクトル予測（ＡＭＶＰ）モードを用いてＰＵの動き情報をシグナリングし得る。言い換えると、ＨＥＶＣにおいて、動きパラメータの予測ために２つのモードが存在し、その一方は統合モードであり、他方がＡＭＶＰである。ＰＵの動き情報は、ＰＵの（１つまたは複数の）動きベクトルとＰＵの（１つまたは複数の）参照インデックスを含み得る。ビデオエンコーダ２０が統合モードを用いて現在のＰＵの動き情報をシグナリングする場合、ビデオエンコーダ２０は、統合候補リスト（すなわち動きベクトル予測器（ＭＶＰ）候補リスト）を生成する。言い換えると、ビデオエンコーダ２０は、動きベクトル予測器リスト構築プロセスを実行し得る。統合候補リストは、統合候補（すなわちＭＶＰ候補）のセットを含む。統合候補リストは、空間的または時間的に現在のＰＵに隣接するＰＵの動き情報を示す統合候補を含み得る。すなわち、統合モードにおいて、動きパラメータ（例えば、参照インデックス、動きベクトル、など）の候補リストは、構築され、ここで、候補は空間的および時間的に隣接するブロックからのものである。

[0083]さらに、統合モードにおいて、ビデオエンコーダ２０は、統合候補リストから統合候補を選択し、選択された統合候補によって示された動き情報を現在のＰＵの動き情報として使用し得る。ビデオエンコーダ２０は、選択された統合候補の統合候補リスト内の位置をシグナリングし得る。例えば、ビデオエンコーダ２０は、インデックスを候補リストに送信することによって、選択された動きベクトルパラメータをシグナリングし得る。ビデオデコーダ３０は、ビットストリームから、候補リストへのインデックス（すなわち、候補リストインデックス）を取得し得る。さらに、ビデオデコーダ３０は、同じ統合候補リストを生成し、選択された統合候補の位置の表示に基づいて、選択された統合候補を決定し得る。ビデオデコーダ３０は次に、現在のＰＵに関する予測ブロックを生成するために、選択された統合候補の動き情報を使用し得る。すなわち、ビデオデコーダ３０は、候補リストインデックスに少なくとも部分的に基づいて、候補リスト内で選択された候補を決定し得、ここにおいて、選択された候補は、現在のＰＵに関する動きベクトルを特定する。このように、デコーダ側で、インデックスが復号されると、インデックスが指す対応するブロックの全ての動きパラメータが現在のＰＵによって受け継がれることになる。

[0084]スキップモードは統合モードに類似している。スキップモードにおいて、ビデオエンコーダ２０およびビデオデコーダ３０は、ビデオエンコーダ２０およびビデオデコーダ３０が統合モードで統合候補リストを使用するのと同じ方法で統合候補リストを生成および使用する。しかし、ビデオエンコーダ２０がスキップモードを用いて現在のＰＵの動き情報をシグナリングする場合、ビデオエンコーダ２０は、現在のＰＵに関する残差データのいずれもシグナリングしない。したがって、ビデオデコーダ３０は、統合候補リスト内で選択された候補の動き情報によって示された参照ブロックをＰＵに関する予測ブロックとして使用し得る。

[0085]ＡＭＶＰモードは、ビデオエンコーダ２０が候補リストを生成し、候補のリストから候補を選択する点で統合モードに類似している。しかし、ビデオエンコーダ２０がＡＭＶＰモードを用いて現在のＰＵの動き情報をシグナリングする場合、ビデオエンコーダ２０もまた、候補リスト内で選択された候補の位置をシグナリングするのに加えて、現在のＰＵと参照インデックスに関する動きベクトル差（ＭＶＤ）をシグナリングし得る。現在のＰＵに関するＭＶＤは、現在のＰＵの動きベクトルとＡＭＶＰ候補リストから選択された候補の動きベクトルの間の差を示し得る。一方向予測において、ビデオエンコーダ２０は、現在のＰＵに関する１つのＭＶＤと１つの参照インデックスをシグナリングし得る。双方向予測において、ビデオエンコーダ２０は、現在のＰＵに関する２つのＭＶＤと２つの参照インデックスをシグナリングし得る。このように、ビデオエンコーダ２０は、インデックスを候補リストに送信することによって選択された動きベクトルをシグナリングし、および参照インデックス値とＭＶＤをシグナリングし得る。言い換えると、現在のＰＵに関する動きベクトルを表すビットストリーム内のデータは、参照インデックスを表すデータと、候補リストに対応するインデックス、およびＭＶＤを含み得る。

[0086]さらに、現在のＰＵの動き情報がＡＭＶＰモードを用いてシグナリングされる場合、ビデオエンコーダ３０は、ビットストリームから、現在のＰＵに関するＭＶＤと候補リストインデックスを取得し得る。ビデオデコーダ３０は、同じＡＭＶＰ候補リストを生成し、ＡＭＶＰ候補リスト内で選択された候補の位置の表示に基づいて、選択された候補を決定し得る。ビデオデコーダ３０は、選択された候補によって示された動きベクトルにＭＶＤを追加することによって、現在のＰＵの動きベクトルを回復し得る。すなわち、ビデオデコーダ３０は、選択された候補とＭＶＤによって示された動きベクトルに少なくとも部分的に基づいて、現在のＰＵの動きベクトルを決定し得る。ビデオデコーダ３０は次に、現在のＰＵに関する予測ブロックを生成するために、回復された動きベクトルまたは現在のＰＵの動きベクトルを使用し得る。

[0087]現在のＰＵ（すなわち現在のＰＵとは異なる時間インスタンスにあるＰＵ）に時間的に隣接するＰＵの動き情報に基づく統合候補リストまたはＡＭＶＰ候補リスト内の候補は、時間的な動きベクトル予測器（ＴＭＶＰ）と称され得る。ＴＭＰＶは、ＨＥＶＣのコーディング効率を向上させるために使用され、他のコーディングツールとは異なる。ＴＭＶＰを決定するために、ビデオコーダは、現在のＰＵと同じ場所を共有するＰＵを含む参照ピクチャを最初に識別し得る。すなわち、ビデオコーダは、復号されたピクチャバッファ内、さらに具体的には参照ピクチャリスト内のフレームの動きベクトルにアクセスする。言い換えると、ビデオコーダは、同じ場所を共有するピクチャを識別し得る。

[0088]インター予測されたスライスにおいて、ＴＭＶＰが全体にコード化されたビデオシーケンスに関してイネーブルされると（シーケンスパラメータセット内のｓｐｓ＿ｔｅｍｐｏｒａｌ＿ｍｖｐ＿ｅｎａｂｌｅ＿ｆｌａｇが１に設定される）、ビデオエンコーダ２０は、ＴＭＶＰが現在のスライスに関してイネーブルされたかどうかを示すためにスライスヘッダ内のｓｌｉｃｅ＿ｔｅｍｐｏｒａｌ＿ｍｖｐ＿ｅｎａｂｌｅ＿ｆｌａｇをシグナリングし得る。

[0089]現在のピクチャの現在のスライスがＢスライス（すなわち双方向にインター予測されたＰＵを含むことが可能なスライス）である場合、ビデオエンコーダ２０は、スライスヘッダにおいて、同じ場所を共有するピクチャがＲｅｆＰｉｃＬｉｓｔ０またはＲｅｆＰｉｃＬｉｓｔ１からのものであるかどうかを示すシンタックス要素（例えば、ｃｏｌｌｏｃａｔｅｄ＿ｆｒｏｍ＿１０＿ｆｌａｇ）をシグナリングし得る。ビデオデコーダ３０が同じ場所を共有するピクチャを含む参照ピクチャリストを識別した後、ビデオデコーダ３０は、識別された参照ピクチャリストにおいてピクチャ（すなわち同じ場所を共有するピクチャ）を識別するために、スライスヘッダにおいてシグナリングされ得る別のシンタックス要素（例えば、ｃｏｌｌｏｃａｔｅｄ＿ｒｅｆ＿ｉｄｘ）を使用し得る。

[0090]ビデオコーダは、同じ場所を共有するピクチャを確認することによって同じ場所を共有するＰＵを識別し得る。ＴＭＶＰは、同じ場所を共有するＰＵを含むＣＵの右下のＰＵの動き情報か、あるいはこのＰＵを含むＣＵの中央のＰＵ内の右下のＰＵの動き情報を示し得る。同じ場所を共有するＰＵを含むＣＵの右下のＰＵは、ＰＵの予測ブロックの右下のサンプルの直下および右の場所をカバーするＰＵであり得る。言い換えると、ＴＭＶＰは、参照ピクチャ内にあり、かつ現在のＰＵの右下角と同じ場所を共有する場所をカバーするＰＵの動き情報を示すか、あるいはＴＭＶＰは、参照ピクチャ内にあり、かつ現在のＰＵの中央と同じ場所を共有する場所をカバーするＰＵの動き情報を示し得る。

[0091]上記のプロセスによって識別された動きベクトルが、統合モードまたはＡＭＶＰモードのための動き候補を生成するために使用される場合、動きベクトルは、（ＰＯＣ値によって影響される）時間的な場所に基づいてスケールされ得る。例えば、現在のピクチャと参照ピクチャのＰＯＣ値の間の差分がより小さい場合より、現在のピクチャと参照ピクチャのＰＯＣ値の間の差分が大きい場合に、ビデオコーダは、より大きい量だけ動きベクトルの大きさを増大させ得る。

[0092]３Ｄ−ＨＥＶＣは、異なる視点からの同一場面の複数のビューを提供する。３Ｄ−ＨＥＶＣに関する標準化の取り組みの一部は、ＨＥＶＣに基づくマルチビュービデオコーデックの標準化を含む。同様に、ＨＥＶＣベースの３ＤＶにおいて、異なるビューから再構築されたビュー構成要素に基づくインタービュー予測がイネーブルされる。Ｈ．２６４／ＡＶＣにおけるＭＶＣのように、３Ｄ−ＨＥＶＣはインタービュー動き予測（ＩＭＰ）をサポートする。３Ｄ−ＨＥＶＣにおいて、ＩＭＰは、ＨＥＶＣの標準で用いられる動き補償に類似しており、かつ同じまたは類似のシンタックス要素を利用し得る。しかし、ビデオコーダがＰＵに対してＩＭＰを実行する場合、ビデオコーダは、ＰＵと同じアクセスユニット内だが異なるビューにあるピクチャを参照ピクチャとして使用し得る。対照的に、従来の動き補償は、参照ピクチャとして異なるアクセスユニット内のピクチャを使用するだけである。したがって、３Ｄ−ＨＥＶＣにおいて、従属ビューにおけるブロックの動きパラメータは、同じアクセスユニットの他のビューにおける既にコード化された動きパラメータに基づいて予測または推測される。

[0093]ビデオコーダは、現在のＰＵの動き情報が統合モードまたはＡＭＶＰモードを用いてシグナリングされる場合、候補リスト（例えば、統合候補リストまたはＡＭＶＰ候補リスト）を生成し得る。３Ｄ−ＨＥＶＣにおいて、候補リストは、候補リスト内の他の候補と同じ方法で使用され得るインタービュー予測候補を含み得る。インタービュー予測候補は、参照ピクチャのＰＵ（すなわち参照ＰＵ）の動き情報を特定する。参照ピクチャは、現在のＰＵと同じアクセスユニット内だが、現在のＰＵとは異なるビュー内に存在し得る。参照ＰＵを決定するために、ビデオコーダは、現在のＰＵに関する視差ベクトルを決定するために、視差ベクトル構築プロセスを実行し得る。現在のＰＵに関する視差ベクトルは、現在のＰＵと参照テクスチャピクチャ内の場所の間の水平空間的置換(horizontal spatial displacement)を示し得る。参照ＰＵは、視差ベクトルによって示される場所をカバーする参照テクスチャピクチャのＰＵであり得る。

[0094]視差動きベクトルは、インタービュー参照ピクチャ内の場所を指す動きベクトルである。インタービュー参照ピクチャは、現在のＰＵと同じアクセスユニット内だが、異なるビューにあるテクスチャピクチャである。空間的視差ベクトル（「ＳＤＶ」）は、現在のＰＵに空間的に隣接するＰＵの視差動きベクトルである。言い換えると、ＳＤＶは、空間的に隣接するＰＵによって特定され、インタービュー参照ピクチャ内の場所を示す動きベクトルであり、ここにおいて、空間的に隣接するＰＵは現在のＰＵに空間的に隣接する。時間的視差ベクトル（「ＴＤＶ」）は、現在のＰＵと同じビュー内で、かつ現在のＰＵとは異なるアクセスユニット内にある現在のＰＵと同じ場所を共有するＰＵの視差動きベクトルである。言い換えると、ＴＤＶは、同じアクセスユニットを用いて、参照ピクチャまたはインタービューピクチャのいずれかにおける同じ場所を共有するＬＣＵ、同じ場所を共有するＰＵからの視差動きベクトルであり得る。別法として、ＴＭＶＰに使用されたピクチャからの同じ場所を共有するＰＵの動きベクトルまたはＴＭＶＰによって生成された動きベクトルが視差ベクトルである場合、そのベクトルはまたＴＤＶとして扱われる。現在のＰＵの空間的に隣接するまたは時間的に隣接するＰＵがインタービュー動き予測を用いてコード化される場合、空間的に隣接するまたは時間的に隣接するＰＵの視差ベクトルは暗黙視差ベクトル（「ＩＤＶ」）である。

[0095]ビデオコーダは、ＩＭＰのために直接ＳＤＶ、ＴＤＶ、またはＩＤＶから選択された視差ベクトルを使用し得る。上述されたとおり、ビデオエンコーダは、統合／スキップモードまたはＡＭＶＰモードを用いて現在のＰＵの動き情報をシグナリングする場合、現在のＰＵに関するＭＶＰ候補リストを生成し得る。ビデオコーダは、インタービュー参照ピクチャにおいて参照ＰＵを決定するために、選択された視差ベクトル候補によって特定された視差ベクトルを使用し得る。ビデオコーダは、統合モードまたはＡＭＶＰモードに関するＭＶ候補リストにおけるインタービュー予測ＭＶ候補として参照ＰＵの動き情報を含み得る。

[0096]シンタックス要素ｐａｒｔ＿ｍｏｄｅは、現在のＣＵの分割モードを特定する。ＨＥＶＣにおけるｐａｒｔ＿ｍｏｄｅの値は下記のとおり限定される。１つのＣＵのコーディングモードがＭＯＤＥ＿ＩＮＴＲＡに等しい場合、ｐａｒｔ＿ｍｏｄｅは０または１に等しいものとする。別の場面で、１つのＣＵのコーディングモードがＭＯＤＥ＿ＩＮＴＥＲに等しい場合、下記があてはまる。現在のＣＵのサイズが最小ＣＵのサイズより大きく、非対称の動きパーティションがイネーブルされる場合、ｐａｒｔ＿ｍｏｄｅは、境界も含めて０から２までの範囲であり、かつ境界も含めて４から７までの範囲とする。別の場面で、現在のＣＵのサイズが最小ＣＵのサイズより大きく、非対称の動きパーティションがディスエーブルされる場合、ｐａｒｔ＿ｍｏｄｅは、境界も含めて０から２までの範囲とする。別の場面で、現在のＣＵのサイズが８に等しい場合、ｐａｒｔ＿ｍｏｄｅの値は、境界も含めて０から２までの範囲とする。別の場面（現在のＣＵのサイズが８より大きい）で、ｐａｒｔ＿ｍｏｄｅの値は、境界も含めて０から３までの範囲とする。

[0097]ｐａｒｔ＿ｍｏｄｅと可変ＰａｒｔＭｏｄｅの関連する値の間の関係は、下記の表１に定義される。ｐａｒｔ＿ｍｏｄｅが存在しない場合、現在のＣＵのパーティションモードは、ＰＡＲＴ＿２Ｎ×２Ｎに等しいものと推測されることに留意のこと。

[0098]ＮＢＤＶは、全てのビューに関するテクスチャ−第１のコーディング順序を用いる３Ｄ−ＨＥＶＣおける視差ベクトル誘導方法のために用いられる。現在の３Ｄ−ＨＥＶＣ設計において、ＮＢＤＶは、参照ビューの深さマップから深さデータを検索するためにも用いられ得る。

[0099]視差ベクトルは、２つのビューの間の視差の推定器に用いられる。隣接するブロックは、ビデオコーディングにおいてほとんど同じ動き／視差情報を共有するため、現在のブロックは、優れた予測器として隣接するブロック内の動きベクトル情報を使用し得る。この考えにしたがって、ＮＢＤＶは、異なるビューにおける視差ベクトルを推測するために隣接する視差情報を使用する。

[0100]様々な空間的および時間的に隣接するブロックがまず定義される。空間的および時間的に隣接するブロックのそれぞれは次に、現在のブロックと候補ブロックの間の相関関係の優先度によって決定される予め定義された順序で確認される。視差動きベクトル（すなわち、インタービュー参照ピクチャを指す動きベクトル）が候補内に発見されると、視差動きベクトルは視差ベクトルに変換される。隣接するブロックの２つのセットが利用される。一方のセットは空間的に隣接するブロックからのものであり、もう一方のセットは時間的に隣接するブロックからのものである。

[0101]３Ｄ−ＨＥＶＣは、Ｌ．チャン氏およびその他による「３Ｄ−ＣＥ５．ｈ：視差ベクトル生成結果」文献ＪＣＴ３Ｖ−Ａ００９７において提案されたＮＢＤＶ方法を最初に採用した。暗黙視差ベクトルは、Ｊ．スン氏およびその他による「３Ｄ−ＣＥ５．ｈ：ＨＥＶＣベースの３Ｄビデオコーディングに関する視差ベクトル誘導の簡略化」文献ＪＣＴ３Ｖ−Ａ０１２６に簡略化されたＮＢＤＶと共に含まれていた。Ｊ．カン氏およびその他による「３Ｄ−ＣＥ５．ｈ関連：視差ベクトル誘導に関する改良」文献番号ＪＣＴ３Ｖ−Ｂ００４７において、ＮＢＤＶは、復号されたピクチャバッファ内に記憶された暗黙の視差ベクトルを取り除くことによってさらに簡略化されるが、ＲＡＰピクチャ選択を用いてコーディング利得も改良した。

[0102]図２は、マルチビューコーディング復号順序の例を示す概念の図である。図２の例において、各正方形はビュー構成要素に対応する。正方形の列はアクセスユニットに対応する。各アクセスユニットは、時間インスタンスの全てのビューのコード化されたピクチャを含むように定義され得る。正方形の行はビューに対応する。図２の例において、アクセスユニットは、Ｔ０…Ｔ８とラベル付けされ、ビューはＳ０…Ｓ８とラベル付けされる。アクセスユニットの各ビュー構成要素は、次のアクセスユニットの任意のビュー構成要素より前に復号されるため、図２の復号順序は、時間−第１のコーディング(time-first coding)と称され得る。アクセスユニットの復号順序は、ビューの出力または表示の順序に一致し得ない。

[0103]マルチビューコーディングはインタービュー予測をサポートする。インタービュー予測はＨ．２６４／ＡＶＣ、ＨＥＶＣ、または他のビデオコーディングの標準で用いられるインター予測に類似しており、類似のシンタックス要素を使用し得る。しかし、ビデオコーダが現在のビデオユニット（例えば、マクロブック）に対してインタービュー予測を実行する場合、ビデオコーダは、現在のビデオユニットと同じアクセスユニット内ではあるが、異なるビューにあるピクチャを参照ピクチャとして使用し得る。対照的に、従来のインター予測は、参照ピクチャとして異なるアクセスユニット内のピクチャを使用するのみである。

[0104]マルチビューコーディングにおいて、ビデオデコーダ（例えば、ビデオデコーダ３０）がいずれかの他のビュー内のピクチャを参照することをなくビュー内のピクチャを復号可能な場合、ビューは、「基本ビュー（base view）」と称され得る。非基本ビューのうちの１つにおいてピクチャをコード化する場合、ピクチャが異なるビュー内にあるが、ビデオコーダが現在コード化しているピクチャと同じ時間インスタンス（すなわちアクセスユニット）内にある場合、ビデオコーダ（例えば、ビデオエンコーダ２０またはビデオデコーダ３０）は、ピクチャを参照ピクチャリスト（例えば、ＲｅｆＰｉｃＬｉｓｔ０またはＲｅｆＰｉｃＬｉｓｔ１）に加え得る。他のインター予測参照ピクチャと同様に、ビデオコーダは、参照ピクチャリストの任意の位置にインタービュー予測参照ピクチャを挿入し得る。

[0105]図３は、本開示において説明される技術にしたがったマルチビューコーディングのための予測構造の例を示す概念図である。図３のマルチビュー予測構造は、時間的およびインタービュー予測を含む。図３の例において、各正方形はビュー構成要素に対応する。「Ｉ」とラベル付けされた正方形は、イントラ予測されるビュー構成要素である。「Ｐ」とラベル付けされた正方形は、一方向にインター予測されるビュー構成要素である。「Ｂ」および「ｂ」とラベル付けされた正方形は、双方向にインター予測されるビュー構成要素である。「ｂ」とラベル付けされた正方形は、参照ピクチャとして「Ｂ」とラベル付けされた正方形を用い得る。第１の正方形から第２の正方形までを指し示す矢印は、第１の正方形が、インター予測において、第２の正方形に関する参照ピクチャとして使用可能であることを示す。図３において垂直矢印によって示されるように、同じアクセスユニットの異なるビューにおけるビュー構成要素は、参照ピクチャとして使用可能であり得る。同じアクセスユニットの別のビュー構成要素に関する参照ピクチャとしてのアクセスユニットの１つのビュー構成要素の使用はインタービュー予測と称され得る。したがって、マルチビュービデオコーディングのための（各ビュー内のインターピクチャ予測とインタービュー予測の両方を含む）典型的なＭＶＣ予測構造が図３に示され、ここにおいて、予測は矢印によって示され、被参照オブジェクトは、参照予測のためにオブジェクトからの位置を使用する。

[0106]Ｈ．２６４／ＡＶＣのＭＶＣ拡張において、インタービュー予測はＨ．２６４／ＡＶＣの動き補償のシンタックスを使用する視差動き補償によってサポートされ得るが、異なるビューにおけるピクチャが参照ピクチャとして使用されることを可能にする。２つのビューのコード化は、Ｈ．２６４／ＡＶＣのＭＶＣ拡張によってもサポートされ得る。Ｈ．２６４／ＡＶＣのＭＶＣ拡張の利点の一つは、ＭＶＣエンコーダが３Ｄビデオ入力として３つ以上のビューを取得し得、かつＭＶＣデコーダが例えばマルチビュー描写を復号し得る点である。その結果、ＭＶＣデコーダを用いる任意のレンダラ（renderer）は、３つ以上のビューを有する３Ｄビデオコンテンツを要求し得る。

[0107]Ｈ．２６４／ＡＶＣのＭＶＣ拡張において、インタービュー予測は、同じアクセスユニット（すなわち同じ時間インスタンスを有する）におけるピクチャの間で許可される。言い換えると、ＭＶＣにおいて、インタービュー予測は、ビュー間の相関関係を取り除くために、同じアクセスユニット（すなわち同じ時間インスタンスを有する）の異なるビューから取得されたピクチャの間で実行される。非基本ビューのうちの１つ内のピクチャをコード化する場合、ピクチャが異なるビュー内にあるが同じ時間インスタンスを有していれば、ピクチャは参照ピクチャリストに加えられ得る。言い換えると、インタービュー予測を用いてコード化されたピクチャは、他の非基本ビューのインタービュー予測のために参照ピクチャリストに加えられえる。言い換えると、インタービュー予測を用いてコード化されたピクチャは、他の非基本ビューのインタービュー予測のために参照ピクチャリストに加えられえる。インタービュー予測参照ピクチャは、ちょうど任意のインター予測参照ピクチャのように参照ピクチャリストの任意の位置に配置され得る。

[0108]さらに、マルチビュービデオコーディングのコンテキストにおいて、２つのタイプの動きベクトルが存在し得る。一方のタイプの動きベクトルは、時間的参照ピクチャを指し示す通常の動きベクトルであり、対応する時間的インター予測は動き補償予測（ＭＣＰ）である。他方のタイプの動きベクトルは、異なるビュー（すなわちインタービュー参照ピクチャ）におけるピクチャを指し示す視差動きベクトルであり、対応するインター予測は視差補償予測（ＤＣＰ）である。

[0109]図４は、本開示において説明される技術にしたがった隣接ベースの視差ベクトルの誘導（ＮＢＤＶ）のための現在の予測ユニット（ＰＵ）の空間的に隣接するブロックを示す概念図である。現在のＮＢＤＶにおいて、５個の空間的に隣接するブロックが現在のＰＵに関する視差ベクトル誘導のために用いられる。５個の空間的に隣接するブロックは、現在のＰＵの左下、左、右上、上、および左上のブロックであり、それぞれＡ０、Ａ１、Ｂ０、Ｂ１、およびＢ２によって示される。５個の空間的に隣接するブロックは、ＨＥＶＣにおける統合モードで使用される空間的に隣接するブロックと同じであることが留意されるべきである。したがって、追加のメモリアクセスは必要とされない。

[0110]時間的に隣接するブロックを確認するために、候補ピクチャの構築プロセスが最初に実行される。現在のビューから最大２個の参照ピクチャが候補ピクチャとして扱われ得る。同じ場所を共有する参照ピクチャは、最初に候補ピクチャリストに挿入され、次に、参照インデックスの昇順に残りの候補ピクチャが挿入される。両方の参照ピクチャリストにおいて同じ参照インデックスを有する参照ピクチャが使用可能な場合、同じ場所を共有するピクチャの同じ参照ピクチャリストにおける一方が他方に先行する。候補ピクチャリスト内の各候補ピクチャに関して、３つの候補領域が時間的に隣接するブロックを抽出すために決定される。

[0111]ブロックがインタービュー動き予測を用いてコード化される場合、視差ベクトルは、異なるビューにおいて対応するブロックを選択するために抽出される必要があり得る。抽出された視差ベクトルとも称される暗黙視差ベクトル（ＩＤＶ）は、インタービュー動き予測において抽出される視差ベクトルと称される。ブロックが動き予測を用いてコード化さたとしても、抽出された視差ベクトルは、下記のブロックをコード化する目的で破棄されることはない。ＮＢＤＶプロセスは、時間的に隣接するブロックにおける視差動きベクトル、空間的に隣接するブロックにおける視差動きベクトル、次に暗黙の視差ベクトルを順に確認し得る。視差ベクトルが発見されると、プロセスは終了する。

[0112]視差動きベクトルまたは前のプロセスの間に発見されたＩＤＶが無い場合、ＮＢＤＶは、使用不可能であるとマークされる。この場合、ＮＢＤＶは使用不可能な視差ベクトルを返すと考えられ得る。しかし、ＮＢＤＶが使用不可能な結果を返しても、ゼロ視差ベクトルは、視差ベクトルを必要とする他のコーディングプロセスによって使用可能である。３Ｄ−ＨＥＶＣは、参照ビューの深さがアクセスされるのを可能にする。この場合、深さは後方ビュー合成予測（ＢＶＳＰ）のために用いられるべき視差ベクトルまたは視差動きベクトルを精密化するためにも用いられ得る。

[0113]使用可能な視差ベクトルがＮＢＤＶプロセスから抽出される場合、視差ベクトルは、参照ビューの深さマップから深さデータを検索することによってさらに精密化される。精密化プロセスは２つのステップを含む。第１に、対応する深さブロックは、基本ビューのような前にコード化された参照深さビューにおいて抽出された視差ベクトルを用いることによって配置される。対応する深さブロックのサイズは、現在のＰＵのサイズと同じである。第２に、対応する深さブロックの４つの角のピクセルから１つの深さ値が選択され、精密化された視差ベクトルの水平成分に変換される。視差ベクトルの垂直成分は変わらない。

[0114]使用可能な視差ベクトルを抽出すための上記のプロセスは、ＮＢＤＶ精密化（ＮＢＤＶ−Ｒ）または深さ指向ＮＢＤＶ（Ｄｏ−ＮＢＤＶ）とも呼ばれる。しかし、ＮＢＤＶが使用可能な視差ベクトルを提供しない（したがって、ＮＢＤＶの結果が使用不可能である）場合、上記のＮＢＤＶ−Ｒプロセスはスキップされ、ゼロ視差ベクトルが直接返される。

[0115]精密化された視差ベクトルがインタービュー動き予測に使用される一方で、精密化されていない視差ベクトルがインタービュー残差予測に使用されることが留意される。さらに、精密化された視差ベクトルは、後方ＶＳＰモードを用いてコード化される場合、１つのＰＵの動きベクトルとして記憶される。

[0116]ＨＥＶＣは、ＡＭＶＰおよび統合モードに関する候補リストの概念を導入するので、３Ｄ−ＨＥＶＣにおいて、インタービュー動き予測は、新しい候補を導入することによって実現される。ＡＭＶＰ候補リストの生成を変更するためのアクティビティは存在したが、そのアクティビティを行う利点は小さいと考えられたため、ＡＭＶＰモードは、現在の３Ｄ−ＨＥＶＣにおいて変更されないままであった。インタービュー動き予測の主な実現化は統合モードの修正によって達成される。

[0117]３Ｄ−ＨＥＶＣにおいて、最大６個の統合候補が統合候補リストに挿入され得る。ＨＥＶＣにおける統合モードの復号プロセスによってリストに挿入される候補を維持する一方で、２つのさらなる候補が統合候補リストに加えられ得る。それらは、参照ブロックの動き情報にアクセスすることから抽出される候補、すなわちインタービュー候補であり、その候補は現在のブロックの視差ベクトルから変換される。

[0118]インタービュー候補は、視差ベクトルによって配置された参照ブロックの動きベクトルを再利用することによって抽出され、その関連の参照ビューはＮＢＤＶプロセスから抽出される。さらに、統合候補の参照インデックスは、動きベクトルが参照ビューにおいて指し示すアクセスユニットと同じアクセスユニット（時間インスタンス）内の（現在のピクチャの参照ピクチャリストにおける）ピクチャを識別するために設定される。

[0119]ビデオコーダは、他の候補を生成するために、インタービュー参照ピクチャを識別する参照インデックスを用いて視差ベクトルを視差動きベクトルに変換する。この候補はインタービュー候補の使用可能性に関わらず挿入される。ＨＥＶＣにおける統合プロセスと同様に、ビデオコーダは、図４に示されたように、Ａ１およびＢ１によって示された空間的に隣接するからの候補のみと比較することによって、追加の候補に対して枝刈り（pruning）を適用する。

[0120]ＪＣＴ３Ｖ−Ｃ０１５２において提案されたように、後方ワーピングＶＳＰ（ＢＶＳＰ）アプローチは、３Ｄ−ＡＶＣにおけるブロックベースのＶＳＰと同じである。これら２つの技術の両方は、動きベクトル差を送信するのを避けるために、後方ワーピングとブロックベースのＶＳＰを用い、かつより正確な動きベクトルを用いる。しかし、実施の詳細は、異なるプラットフォームが原因で異なる。用語ＢＶＳＰは、３Ｄ−ＨＥＶＣにおける後方ワーピングＶＳＰアプローチを示すためにも使用され得る。

[0121]３Ｄ−ＨＴＭにおいて、テクスチャ第１のコーディングが共通のテスト条件に適用される。したがって、対応する非基本深さビューは、１つの非基本テクスチャビューを復号し、深さ情報がＢＶＳＰを実行するために推測および用いられる場合に使用不可能である。

[0122]図５は、本開示において説明される技術にしたがった後方ワーピングに基づいて、ブロックベースのビュー合成予測（ＢＶＳＰ）を行うために、参照ビューからの深さブロック誘導の視覚化例の概念図である。図５は、どのように参照ビューからの深さブロックが配置され、次にＢＶＳＰ予測に用いられるかの３つのステップを示す。ブロックに関する深さ情報を推定するために、初めに隣接するブロックから視差ベクトルを抽出することが提案される。次に、抽出された視差ベクトルは、参照ビューから深さブロックを取得するために使用される。ＨＴＭ５.１テストモデルは、ＮＢＤＶ（隣接するブロック視差ベクトル）として知られる視差ベクトル予測器を抽出するプロセスを含む。（ｄｖｘ，ｄｖｙ）にＮＢＤＶ関数（function）から識別された視差ベクトルを表示させ、現在のブロック位置は、（ｂｌｏｃｋｘ，ｂｌｏｃｋｙ）と表示される。深さブロックは、参照ビューの深さイメージにおける（ｂｌｏｃｋｘ＋ｄｖｘ，ｂｌｏｃｋｙ＋ｄｖｙ）においてフェッチされ得る。フェッチされた深さブロックは現在のＰＵの同じサイズを有するはずであり、それは次に、現在のＰＵに関して後方ワーピングを行うために用いられる。ＢＶＳＰがシーケンスにおいてイネーブルされる場合、インタービュー動き予測のためのＮＢＤＶプロセスが変更される。

[0123]ＢＶＳＰがイネーブルされる場合のＮＢＤＶのプロセスへの１つ目の差分は、時間的に隣接するブロックのそれぞれに関して、それが視差動きベクトルを使用する場合、視差動きベクトルが視差ベクトルとして返されることを含む。視差ベクトルは、深さ情報部分にアクセスした状態で、ＮＢＤＶの精密化で説明されたようにさらに精密化される。

[0124]別の差分は、空間的に隣接するブロックのそれぞれに関して、下記の条件を参照ピクチャリスト０と参照ピクチャリスト１に順に適用する。その条件とは、空間的に隣接するブロックが視差動きベクトルを使用する場合、視差動きベクトルは視差ベクトルとして返され、それは上述したとおりさらに精密化される。別法として、空間的に隣接するブロックがＢＶＳＰモードを用いる場合、関連する動きベクトルは視差ベクトルとして返される。視差ベクトルは、上述したのと同様の方法でさらに精密化される。しかし、最大深さ値は、４つの角のピクセルではなく対応する深さブロックの全てのピクセルから選択され、精密化された視差ベクトルの垂直成分は０に設定される。

[0125]さらに別の差分は、空間的に隣接するブロックのそれぞれに関して、各ブロックがＩＤＶを使用する場合、ＩＤＶは視差ベクトルとして返され、およびそれが上述したとおりさらに精密化されることを含む。さらなる差分は、視差動きベクトルが使用可能でない場合、精密化プロセスは適用されず、かつ視差ベクトルはゼロベクトルとして抽出されることを含む。

[0126]視差動きベクトル誘導プロセスのために、ＢＶＳＰモードでコード化された１つのＰＵ内の各サブ領域（４×４のブロック）に関して、対応する４×４の深さブロックは、前述した精密化された視差ベクトルを用いて参照深さビュー内に最初に配置される。第２に、対応する深さブロックにおいて１６個の深さピクセルの最大値が選択される。第３に、その最大値は、視差動きベクトルの水平成分に変換される。視差動きベクトルの垂直成分は０に設定される。

[0127]図６は、本開示において説明される技術にしたがった高度な残差予測（ＡＲＰ）の予測構造の例を示す概念図である。現在の３Ｄ−ＨＥＶＣにおいて、２つのビューの残差信号の間の相関をさらに効率的に利用するために、インタービュー残差予測は、いわゆる高度な残差予測（ＡＲＰ）によって実現された。ＡＲＰにおいて、視差ベクトルを用いて識別された参照ブロックの残差は、図６に示されるように、参照ビューに関する残差ピクチャを保持し、残差ピクチャにおける参照ブロック内の残差を直接予測する代わりに、オンザフライで（on-the-fly）生成される。

[0128]図６に示すように、非基本ビューにおける現在のブロックの残差４０を好適に予測するために、ビデオコーダは、視差ベクトル４４を用いて参照ブロック４２を識別し得る。参照ブロック４２の動き補償は、予測信号４３と参照ブロック４２の再構築された信号の間の残差を抽出するために呼び出される。ＡＲＰモードが呼び出されると、予測された残差は、例えば、非基本ビューの参照ピクチャにおけるブロック４１からの動き補償によって生成された非基本ビューの予測信号のトップに加えられる。ＡＲＰモードの利点の１つは、（ＡＲＰに関する残差を生成する場合）参照ブロック４２によって使用される動きベクトル４５は、現在のブロック４０の動きベクトル４６を用いてアラインされるため、現在のブロックの残差信号は、さらに正確に予測され得ることである。したがって、残差のエネルギーは顕著に低減され得る。

[0129]基本（例えば、参照）および非基本ビューの間の量子化差分は予測の正確さが劣ることにつながる可能性があるため、２つの重み付け係数が、参照ビュー：０．５および１から生成された残差に適応的に適用され得る。

[0130]基本（例えば、参照）ビューにおけるさらなる動き補償がメモリアクセスと演算の著しい増加を必要とし得るので、コーディング効率のわずかな犠牲によってより実質的な設計を行うための種々の方法が実施され得る。最初に、ＡＲＰモードは、特にビデオエンコーダ２０のようなエンコーダでの計算を減らすために、ＰＵが２Ｎ×２Ｎを用いてコード化される場合にのみイネーブルされる。第２に、双線形フィルタは、ＡＲＰモードを用いてコード化されたブロックへのメモリアクセスを顕著に減らすために、参照ブロックと現在のブロックの両方の動き補償のために用いられ得る。第３に、キャッシュ効率を高めるために、動きベクトルは、非基本ビューにおいて異なるピクチャを指し示し得るが、基本ビューにおける参照ピクチャは固定される。この場合、現在のブロックの動きベクトルは、ピクチャの距離に基づいてスケールされる必要があり得る。

[0131]図７は、本開示において説明される技術にしたがった現在の深さブロックの視差ベクトルを抽出するために使用される参照サンプルの例を示す概念図である。図７は、現在のＰＵに対応する現在の深さブロック５０を含む。現在の深さブロック５０は幅Ｗおよび高さＨを有する。３つの隣接する参照サンプルは現在の深さブロックに関して図示される。

[0132]１つの例において、現在の深さブロック５０の左上に隣接するサンプル５４が選択される。図７に示されるように、現在の深さブロック５０内の左上のサンプル５２が（ｘ，ｙ）の座標を有する場合、左上に隣接するサンプル５４は、（ｘ−１，ｙ−１）の座標を有する。別法として、現在の深さブロック５０の上部に隣接する行または左側に隣接する列に配置された任意のサンプルが使用され得る。別法として、現在の深さブロック５０の空間的に隣接するブロックに配置された任意のサンプルが使用され得る。

[0133]別法として、現在の深さブロック５０がコード化される場合、２つ以上の使用可能な隣接するサンプルが現在の深さブロック５０に関する１つまたは複数の視差ベクトルを抽出するために使用され得る。例えば、座標（ｘ，ｙ−１）を有する別の上部サンプル５６と座標（ｘ−１，ｙ）を有する別の左側のサンプル５８が使用され得る。別法として、（ｘ−１，ｙ＋１）および（ｘ＋１，ｙ−１）の座標を有するサンプルが使用され得る。別法として、（ｘ−１，ｙ＋Ｈ−１）および（ｘ＋Ｗ−１，ｙ−１）の座標を有するサンプルは、図７に示された左側に隣接する角または上部に隣接する角のように、現在の深さブロック５０のサイズがＷ×Ｈで表される場合に使用され得る。別法として、現在の深さブロック５０の上部に隣接する行の任意のサンプルが使用され得る。別法として、現在の深さブロック５０の左側に隣接する列の任意のサンプルが使用され得る。別法として、現在の深さブロック５０の空間的に隣接するブロックの任意のサンプルが使用され得る。

[0134]他の別法は、上述されたとおりＣＵレベルとＰＵレベルの解決法に適用可能ならば、ブロックレベルの視差ベクトル誘導に適用され得る。２つ以上の隣接する深さサンプルが視差ベクトルを抽出するために使用される場合、１つのサンプルが下記の手段のうちの１つによって選択され得る。第１に、インデックスが、複数のサンプルのうちのいずれが視差ベクトルに変換されるために選択されかを示すブロック（ＰＵまたはＣＵ）レベルにおいてシグナリングされ得る。

[0135]第２に、複数の視差ベクトルが変換される。その数は深さサンプルの数と同じであっても良い。複数の視差ベクトルは、インタービュー予測に用いられる予測器を生成するために使用される。例えば、複数の動きベクトル候補が生成され、統合候補リストに挿入され得る。

[0136]第３に、数学関数が、例えば、メジアン、最大、または平均関数のような複数の深さサンプルの値に適用され、関数の出力値が一意的な視差ベクトルに変換されるために使用され得る。例えば、ＣＵレベルの視差ベクトル誘導プロセスにおいて、現在の深さブロック５０を変換するＣＵ内の左上のサンプルの座標は（ｘ，ｙ）と表され、ＣＵのサイズは２Ｎ×２Ｎであり、座標（ｘ−１，ｙ−１）、（ｘ−１，ｙ）、および（ｘ，ｙ−１）を有する３つのサンプルの中間値（medium value）が使用される。別の例において、座標（ｘ−１，ｙ−１）、（ｘ−１，ｙ＋２Ｎ）、（ｘ−１，ｙ＋２Ｎ−１）、（ｘ＋２Ｎ，ｙ−１）および（ｘ＋２Ｎ−１，ｙ−１）を有する５つのサンプルの最大値が使用され得る。

[0137]例えば、少なくとも１つの視差値を決定する際に、システムは、各々のＣＵの２つ以上の隣接するサンプルに少なくとも部分的に基づいて、２つ以上の視差値を決定し得る。各々のＣＵの左上のサンプルは、座標（ｘ，ｙ）を有し、２つ以上の再構築された深さサンプルは、各々のＣＵの左上に隣接するサンプル、各々のＣＵの上部に隣接する行、各々のＣＵの左側に隣接する列、各々のＣＵの空間的に隣接するブロックに配置された任意のサンプル、座標（ｘ−１，ｙ＋１）を有するサンプル、座標（ｘ＋１，ｙ−１）を有するサンプル、および各々のＣＵのサイズが２Ｎ×２Ｎで表される場合は、座標（ｘ−１，ｙ＋２Ｎ−１）を有するサンプルと座標（ｘ＋２Ｎ−１，ｙ−１）を有するサンプル、のうちの少なくとも２つ以上からのものである。

[0138]視差ベクトルを抽出するために使用されるサンプルを選択するために数学関数を適用する別の例において、３つのサンプルのうちのメジアン値が使用される。例えば、ＰＵレベルの視差ベクトル誘導プロセスの場合、現在のＰＵ内の左上のサンプルの座標が（ｘ，ｙ）およびＷ×ＨによるＰＵサイズによって表され、座標（ｘ−１，ｙ−１）、（ｘ−１，ｙ）、および（ｘ，ｙ−１）を有する３つのサンプルの中間値が使用される。別の例において、座標（ｘ−１，ｙ−１）、（ｘ−１，ｙ＋Ｈ）、（ｘ−１，ｙ＋Ｈ−１）、（ｘ＋Ｗ，ｙ−１）、および（ｘ＋Ｗ−１，ｙ−１）を有する５つのサンプルの最大値が使用され得る。

[0139]例えば、少なくとも１つの視差値を決定する際に、システムは、各々のＰＵの２つ以上の隣接するサンプルに少なくとも部分的に基づいて、２つ以上の視差値を決定し得る。少なくとも１つの視差値に少なくとも部分的に基づいて少なくとも１つの視差ベクトルを決定する際に、システムは、２つ以上の視差値に少なくとも部分的に基づいて２つ以上の視差ベクトルを決定し得る。ＰＵの左上のサンプルは座標（ｘ，ｙ）を有し、２つ以上の再構築された深さサンプルは、ＰＵの上部に隣接する行、ＰＵの左側に隣接する列、各々のＣＵの空間的に隣接するブロックに配置された任意のサンプル、座標（ｘ−１，ｙ＋１）を有するサンプル、座標（ｘ＋１，ｙ−１）を有するサンプル、およびＰＵサイズがＷ×Ｈによって表される場合は、座標（ｘ−１，ｙ＋Ｈ−１）を有するサンプルと座標（ｘ＋Ｗ−１，ｙ−１）を有するサンプル、のうちの少なくとも２つ以上からのものである。

[0140]上記の例は、３Ｄ−ＨＥＶＣのテクスチャビューコーディングで用いられるＮＢＤＶプロセスと組み合わされても良い。ＮＢＤＶプロセスと同じプロシージャが最初に適用され得る。視差ベクトルがＮＢＤＶプロセスから発見されない場合、上記の方法のうちの１つが現在の深さブロックに関する視差ベクトルを得るためにさらに適用され得る。

[0141]いくつかの例において、１つまたは複数のサンプルは、別法においてのみ記載されたグループから選択され得る。他の例において、１つまたは複数のサンプルがそのグループのうちのいずれかから選択され得る。

[0142]深さブロックに関する視差ベクトルは、複数の方法において利用され得る。例えば、視差ベクトルは、参照ブロックを識別するために使用され得、および参照ブロックの動き情報は、現在のブロックの現在の動きを予測するために使用される。さらに具体的には、参照ブロックの動きベクトルは、統合またはＡＭＶＰ候補リスト内に挿入されるべき新しい候補を生成するために使用され得る。さらに、視差ベクトルは、視差動きベクトルに変換されるために使用され得る。このような変換された候補は、統合またはＡＭＶＰ候補リスト内に挿入され得る。さらに、視差ベクトルは、ＡＲＰが現在の深さブロックに適用され得る場所から参照ブロックを識別するために使用され得る。

[0143]図８は、本開示の技術を実施し得るビデオエンコーダ２０の例を示すブロック図である。図８は、説明の目的で提供されており、本開示で広義に例示および説明された技術を限定したものであると考えられるべきではない。説明のために、本開示は、ＨＥＶＣコーディングのコンテキストにおいてビデオエンコーダ２０を説明する。しかし、本開示の技術は、他のコーディングの標準または方法に適用可能であり得る。

[0144］図８の例において、ビデオエンコーダ２０は、予測処理ユニット１００、残差生成ユニット１０２、変換処理ユニット１０４、量子化ユニット１０６、逆量子化ユニット１０８、逆変換処理ユニット１１０、再構築ユニット１１２、フィルタユニット１１４、復号されたピクチャバッファ１１６、およびエントロピー符号化ユニット１１８を含む。予測処理ユニット１００は、インター予測処理ユニット１２０およびイントラ予測処理ユニット１２６を含む。インター予測処理ユニット１２０は、動き推定ユニット１２２および動き補償ユニット１２４を含む。他の例において、ビデオエンコーダ２０は、より多くの、またはより少ない、または異なる機能を有する構成要素を含み得る。

[0145］ビデオデコーダ２０はビデオデータを受信し得る。ビデオエンコーダ２０は、ビデオデータのピクチャのスライスにおける各ＣＴＵを符号化し得る。複数のＣＴＵのうちのそれぞれは、同じサイズのルーマコーディングツリーブロック（ＣＴＢｓ）と対応するピクチャのＣＴＢと関連付けられ得る。ＣＴＵを符号化する一部として、予測処理ユニット１００は、ＣＴＵのＣＴＢを革新的により小さいブロックに分割するために四分木分割を実行し得る。より小さいブロックは、ＣＵのコーディングブロックであり得る。例えば、予測処理ユニット１００は、ＣＴＵと関連付けられるＣＴＢを４つの同じサイズのサブブロックに分割し、サブブロックのうちの１つまたは複数を４つの同じサイズのサブサブブロックに分割する、などである。

[0146]ビデオエンコーダ２０は、ＣＵ（すなわちコード化されたＣＵ）の符号化された描写を生成するためにＣＴＵのＣＵを符号化し得る。ＣＵを符号化する一部として、予測処理ユニット１００は、ＣＵの１つまたは複数のＰＵの間でＣＵと関連付けられるコーディングブロックを分割し得る。したがって、各ＰＵは、ルーマ予測ブロックと関連付けられかつ対応するクロマ予測ブロックであり得る。ビデオエンコーダ２０およびビデオデコーダ３０は、様々なサイズを有するＰＵをサポートし得る。ＣＵのサイズは、ＣＵのルーマコーディングブロックのサイズを指し、ＰＵのサイズは、ＰＵのルーマ予測ブロックのサイズを指し得る。特定のＣＵのサイズが２Ｎ×２Ｎであると仮定すると、ビデオエンコーダ２０およびビデオデコーダ３０は、イントラ予測のために２Ｎ×２ＮまたはＮ×ＮのＰＵのサイズ、２Ｎ×２Ｎ、２Ｎ×Ｎ、Ｎ×２Ｎ、Ｎ×Ｎの左右対称なＰＵのサイズまたはインター予測のための同様のサイズをサポートし得る。ビデオエンコーダ２０およびビデオデコーダ３０は、インター予測のために２Ｎ×ｎＵ、２Ｎ×ｎＤ、ｎＬ×２Ｎ、およびｎＲ×２ＮのＰＵのサイズに関して非対称的に分割することをもサポートし得る。

[0147]インター予測処理ユニット１２０は、ＣＵの各ＰＵに対してインター予測を実行することによってＰＵに関する予測データを生成し得る。ＰＵに関する予測データは、ＰＵの予測ブロックとＰＵに関する動き情報を含み得る。インター予測処理ユニット１２０は、ＰＵがＩスライスにあるか、Ｐスライスにあるか、またはＢスライスにあるかに依存してＣＵのＰＵに対して異なる動作を実行し得る。Ｉスライスにおいて、全てのＰＵはイントラ予測される。そのため、ＰＵがＩスライスにある場合、インター予測処理ユニット１２０は、ＰＵに対してインター予測を実行しない。したがって、Ｉモードで符号化されたビデオブロックに関して、予測ブロックは、同じフレーム内の前に符号化された隣接するブロックから空間的予測を用いて形成される。

[0148]ＰスライスにおけるＰＵは、イントラ予測されるか、または一方向にインター予測され得る。例えば、ＰＵがＰスライスにある場合、動き推定ユニット１２２は、ＰＵに関する参照領域に関して、参照ピクチャ（例えば、「ＲｅｆＰｉｃＬｉｓｔ０」）のリストにおいて参照ピクチャを検索し得る。ＰＵに関する参照領域は、ＰＵの予測ブロックに最も密接に対応するサンプルブロックを含む参照ピクチャ内の領域であり得る。動き推定ユニット１２２は、ＰＵに関する参照領域を含む参照ピクチャのＲｅｆＰｉｃＬｉｓｔ０における位置を示す参照インデックスを生成し得る。さらに、動き推定ユニット１２２は、ＰＵの予測ブロックと参照領域と関連付けられる参照場所との間の空間的置換を示す動きベクトルを生成し得る。例えば、動きベクトルは、現在の復号されたピクチャにおける座標から参照ピクチャにおける座標までのオフセットを提供する２次元ベクトルであり得る。動き推定ユニット１２２は、ＰＵの動き情報として参照インデックスと動きベクトルを出力し得る。動き補償ユニット１２４は、ＰＵの動きベクトルによって示される参照場所において、実際のまたは補間サンプルに基づいてＰＵの予測ブロックを生成し得る。

[0149]ＢスライスにおけるＰＵは、イントラ予測されるか、一方向にインター予測されるか、または双方向にインター予測され得る。そのため、ＰＵがＢスライスにある場合、動き推定ユニット１２２は、ＰＵに関して一方向予測または双方向予測を実行し得る。ＰＵに関して一方向予測を実行するために、動き推定ユニット１２２は、ＰＵに関する参照領域について、ＲｅｆＰｉｃＬｉｓｔ０または第２の参照ピクチャリスト（「ＲｅｆＰｉｃＬｉｓｔ１」）の参照ピクチャを検索し得る。動き推定ユニット１２２は、ＰＵの動き情報として、参照領域を含む参照ピクチャのＲｅｆＰｉｃＬｉｓｔ０またはＲｅｆＰｉｃＬｉｓｔ１における位置を示す参照インデックス、参照領域と関連付けられる参照場所とＰＵのサンプルブロックとの間の空間的置換を示す動きベクトル、および参照ピクチャがＲｅｆＰｉｃＬｉｓｔ０であるかＲｅｆＰｉｃＬｉｓｔ１であるかを示す１つ又は複数の予測方向インジケータを出力し得る。動き補償ユニット１２４は、ＰＵの動きベクトルによって示される参照領域において、実際のまたは補間サンプルに少なくとも部分的に基づいてＰＵの予測ブロックを生成し得る。

[0150]ＰＵに関する双方向のインター予測を実行するために、動き推定ユニット１２２は、ＰＵに関する参照領域についてのＲｅｆＰｉｃＬｉｓｔ０において参照ピクチャを検索し得、およびＰＵに関する別の参照領域についてのＲｅｆＰｉｃＬｉｓｔ１において参照ピクチャをも検索し得る。動き推定ユニット１２２は、参照領域を含む参照ピクチャのＲｅｆＰｉｃＬｉｓｔ０およびＲｅｆＰｉｃＬｉｓｔ１における位置を示す参照インデックスを生成し得る。さらに、動き推定ユニット１２２は、参照領域と関連付けられる参照場所とＰＵのサンプルブロックの間の空間的置換を示す動きベクトルを生成し得る。ＰＵの動き情報は、ＰＵの参照インデックスとＭＶを含み得る。動き補償ユニット１２４は、ＰＵの動きベクトルによって示される参照領域において、実際のまたは補間サンプルに少なくとも部分的に基づいてＰＵの予測ブロックを生成し得る。

[0151］イントラ予測処理ユニット１２６は、ＰＵに対してイントラ予測を実行することによってＰＵに関する予測データを生成し得る。ＰＵに関する予測データは、ＰＵに関する予測ブロックと様々なシンタックス要素を含み得る。イントラ予測処理ユニット１２６は、Ｉスライス、Ｐスライス、およびＢスライスにおけるＰＵに対してイントラ予測を実行し得る。

[0152]ＰＵに対してイントラ予測を実行するために、イントラ予測処理ユニット１２６は、ＰＵに関する予測データの複数のセットを生成するために、複数のイントラ予測モードを使用し得る。イントラ予測処理ユニット１２６は、隣接するＰＵのサンプルに基づいて、ＰＵに関する予測ブロックを生成し得る。ＰＵ、ＣＵ、およびＣＴＵに関して左から右、上部から下部への符号化順序を仮定すると、隣接するＰＵは、ＰＵの上部、上部および右側、上部および左側、またはＰＵの左側に存在し得る。イントラ予測処理ユニット１２６は、様々な数のイントラ予測モードを使用し得る。いくつかの例において、イントラ予測モードの数はＰＵの予測ブロックのサイズに依存し得る。

[0153]予測処理ユニット１００は、ＰＵに関してインター予測処理ユニット１２０によって生成された予測データまたはＰＵに関してイントラ予測処理ユニット１２６によって生成された予測データのうちからＣＵのＰＵに関する予測データを選択し得る。いくつかの例において、予測処理ユニット１００は、予測データのセットのレート／ひずみメトリックに基づいて、ＣＵのＰＵに関する予測データを選択する。選択された予測データの予測ブロックは、ここでは、選択された予測ブロックと称され得る。

[0154]残差生成ユニット１０２は、ＣＵのルーマ、ＣｂおよびＣｒコーディングブロックおよびＣＵのＰＵの選択された予測ルーマ、ＣｂおよびＣｒブロックに基づいて、ＣＵのルーマ、ＣｂおよびＣｒ残差ブロックを生成し得る。例えば、残差生成ユニット１０２は、残差ブロック内の各サンプルが、ＣＵのコーディングブロック内のサンプルとＣＵのＰＵの対応する選択された予測ブロック内の対応するサンプルの間の差に等しい値を有するようにＣＵの残差ブロックを生成し得る。

[0155］本開示の技術は、ビデオエンコーダ２０の残差生成ユニット１０２のようなビデオエンコーダの要素によって実行され得るが、他の例において、図８に図示された、または図示されないビデオエンコーダ２０の他の要素が本開示の技術を実行し得る。この技術において、ビデオデータのピクチャのスライスの各々のコーディングユニットの各予測ユニットに関して、残差生成ユニット１０２は、少なくとも１つの隣接するサンプルの少なくとも１つの再構築された深さサンプルの少なくとも１つの深さ値に少なくとも部分的に基づいて、少なくとも１つの視差値を決定し得る。残差生成ユニット１０２は、少なくとも１つの視差値に少なくとも部分的に基づいて、少なくとも１つの視差ベクトルを決定し得、ここにおいて、少なくとも１つの視差ベクトルは、各々のコーディングユニットに関する。残差生成ユニット１０２は、少なくとも１つの視差ベクトルに少なくとも部分的に基づいて、各々のコーディングユニットに関するコーディングブロックの符号化された描写を生成し得る。

[0156]変換処理ユニット１０４は、ＣＵに関連付けられる残差ブロックをＣＵのＴＵに関連付けられる変換ブロックに分割するために四分木分割を実行し得る。したがって、ＴＵは、ルーマ変換ブロックと２つのクロマ変換ブロックと関連付けられ得る。ＣＵのＴＵのルーマおよびクロマ変換ブロックのサイズと位置は、ＣＵのＰＵの予測ブロックのサイズと位置に基づいても良いし基づかなくても良い。「残差四分木」（ＲＱＴ）として知られる四分木構造は、複数の領域のそれぞれと関連付けられるノードを含み得る。ＣＵのＴＵは、ＲＱＴの葉ノードに対応し得る。

[0157]変換処理ユニット１０４は、１つまたは複数の変換をＴＵの変換ブロックに適用することによって、ＣＵの各ＴＵに関する係数ブロックを生成し得る。変換処理ユニット１０４は、様々な変換をＴＵと関連付けられる変換ブロックに適用し得る。例えば、変換処理ユニット１０４は、ディスクリートコサイン変換（ＤＣＴ）、方向性変換、または概念的に類似する変換をブロックに適用し得る。いくつかの例において、変換処理ユニット１０４は、変換を変換ブロックに適用しない。こういった例において、変換ブロックは、係数ブロックとして扱われ得る。

[0158]量子化ユニット１０６は、係数ブロックにおける変換係数を量子化し得る。量子化プロセスは、変換係数のうちのいくつかまたは全てと関連付けられるビット深さを低減し得る。例えば、ｎビットの変換係数は、量子化の間ｍビット変換係数に四捨五入され（be round down）得、ここにおいて、ｎはｍよりも大きい。量子化ユニット１０６は、ＣＵに関連付けられる量子化パラメータ（ＱＰ）値に基づいて、ＣＵのＴＵに関連付けられる係数ブロックを量子化し得る。ビデオエンコーダ２０は、ＣＵと関連付けられるＱＰ値を調整することによって、ＣＵに関連付けられる係数ブロックに適用される量子化の程度を調整し得る。量子化は、情報の損失を生み出す可能性があり、したがって、量子化された変換係数はオリジナルのものより低い正確さを有し得る。

[0159]逆量子化ユニット１０８と逆変換処理ユニット１１０は、係数ブロックから残差ブロックを再構築するために、係数ブロックに各々逆量子化および逆変換を適用し得る。再構築ユニット１１２は、ＴＵに関連付けられる再構築された変換ブロックを生成するために、予測処理ユニット１００によって生成された１つまたは複数の予測ブロックから再構築された残差ブロックを対応するサンプルに加え得る。この方法で、ＣＵの各ＴＵに関する変換ブロックを再構築することによって、ビデオエンコーダ２０は、ＣＵのコーディングブロックを再構築し得る。

[0160]フィルタユニット１１４は、ＣＵと関連付けられるコーディングブロックにおけるブロッキングアーチファクト（blocking artifacts）を減少させるために、１つまたは複数のデブロッキング動作（deblocking operations）を実行し得る。復号されたピクチャバッファ１１６は、フィルタユニット１１４が再構築されたコーディングブロックに対して１つまたは複数のデブロッキング動作を実行した後、再構築されたコーディングブロックを記憶し得る。インター予測ユニット１２０は、他のピクチャのＰＵに対してインター予測を実行するために、再構築されたコーディングブロックを含む参照ピクチャを使用し得る。さらに、イントラ予測処理ユニット１２６は、ＣＵと同じピクチャにおける他のＰＵに対してイントラ予測を実行するために、復号されたピクチャバッファ１１６において再構築されたコーディングブロックを使用し得る。

[0161]エントロピー符号化ユニット１１８は、ビデオエンコーダ２０の他の機能を有する構成要素からデータを受信し得る。例えば、エントロピー符号化ユニット１１８は、量子化ユニット１０６から係数ブロックを受信し得、および予測処理ユニット１００からシンタックス要素を受信し得る。エントロピー符号化ユニット１１８は、エントロピー符号化されたデータを生成するためのデータに対して１つまたは複数のエントロピー符号化動作を実行し得る。例えば、エントロピー符号化ユニット１１８は、データに対して、コンテキスト適応型可変長コーディング（ＣＡＶＬＣ）動作、ＣＡＢＡＣ動作、可変長対可変長（Ｖ２Ｖ）コーディング動作、シンタックスベースのコンテキスト適応型バイナリ算術コーディング（ＳＢＡＣ）動作、可能性インターバル分割エントロピー（ＰＩＰＥ）コーディング動作、指数ゴロム符号化動作（Exponential-Golomb encoding operation）、または別のタイプのエントロピー符号化動作を実行し得る。ビデオエンコーダ２０は、エントロピー符号化ユニット１１８によって生成されたエントロピー符号化されたデータを含むビットストリームを出力し得る。例えば、ビットストリームは、ＣＵに関するＲＱＴを表すデータを含み得る。ビットストリームは、エントロピー符号化されないシンタックス要素をも含み得る。

[0162]図９は、本開示で説明された技術を実施し得るビデオデコーダ３０の例を示すブロック図である。図９は、説明の目的で提供されており、本開示で広義に例示および説明された技術に限定するものではない。説明のために、本開示は、ＨＥＶＣコーディングのコンテキストにおいてビデオデコーダ３０について説明する。しかし、本開示の技術は、他のコーディングの標準または方法にも適用可能であり得る。

[0163]図９の例において、ビデオデコーダ３０は、エントロピー復号ユニット１５０、予測処理ユニット１５２、逆量子化ユニット１５４、逆変換処理ユニット１５６、再構築ユニット１５８、フィルタユニット１６０、および復号されたピクチャバッファ１６２を含む。予測処理ユニット１５２は、動き補償ユニット１６４およびイントラ予測処理ユニット１６６を含む。他の例において、ビデオエンコーダ３０は、より多くの、またはより少ない、または異なる機能を有する構成要素を含み得る。

[0164]エントロピー復号ユニット１５０は、ＮＡＬユニットを受信し、シンタックス要素を復号するためのＮＡＬユニットを解析し得る。エントロピー復号ユニット１５０は、ＮＡＬユニットにおいて、エントロピー符号化されたシンタックス要素をエントロピー復号し得る。予測処理ユニット１５２、逆量子化ユニット１５４、逆変換処理ユニット１５６、再構築ユニット１５８、およびフィルタユニット１６０は、ビットストリームから取り出されたシンタックス要素に基づいて、復号されたビデオデータを生成し得る。

[0165]ビットストリームのＮＡＬユニットは、コード化されたスライスＮＡＬユニットを含み得る。ビットストリームを復号する一部として、エントロピー復号ユニット１５０は、コード化されたスライスＮＡＬユニットからシンタックス要素を取り出してエントロピー復号し得る。複数のコード化されたスライスのそれぞれは、スライスヘッダとスライスデータを含み得る。スライスヘッダは、スライスに関係するシンタックス要素を含み得る。スライスヘッダにおけるシンタックス要素は、スライスを含むピクチャと関連付けられるＰＰＳを識別するシンタックス要素を含み得る。

[0166]ビットストリームからシンタックス要素を復号することに加えて、ビデオデコーダ３０は、ＣＵに対して再構築動作を実行し得る。ＣＵに対して再構築動作を実行するために、ビデオデコーダ３０は、ＣＵの各ＴＵに対して再構築動作を実行し得る。ＣＵの各ＴＵに関する再構築動作を実行することによって、ビデオデコーダ３０は、ＣＵの残差ブロックを再構築し得る。

[0167]ＣＵのＴＵに対して再構築動作を実行する一部として、逆量子化ユニット１５４は、ＴＵと関連付けられる係数ブロックを逆量子化、すなわち逆量子化（de-quantize）し得る。逆量子化ユニット１５４は、逆量子化ユニット１５４が適用する量子化の程度、同様に逆量子化の程度を決定するために、ＴＵのＣＵと関連付けられるＱＰ値を使用し得る。

[0168]逆量子化ユニット１５４が係数ブロックを逆量子化した後、逆変換処理ユニット１５６は、ＴＵと関連付けられる残差ブロックを生成するための係数ブロックに１つまたは複数の逆変換を適用し得る。例えば、逆変換処理ユニット１５６は、係数ブロックに、逆ＤＣＴ、逆整数変換、逆Ｋａｒｈｕｎｅｎ−Ｌｏｅｖｅ変換（ＫＬＴ）、逆回転変換、逆方向性変換、または別の逆変換を適用し得る。

[0169]ＰＵがイントラ予測を使用して符号化される場合、イントラ予測処理ユニット１６６は、ＰＵに関する予測ブロックを生成するためにイントラ予測を実行し得る。イントラ予測処理ユニット１６６は、空間的に隣接するＰＵの予測ブロックに基づいて、ＰＵに関する予測ルーマ、ＣｂおよびＣｒブロックを生成するためにイントラ予測モードを使用し得る。イントラ予測処理ユニット１６６は、ビットストリームから復号された１つまたは複数のシンタックス要素に基づいて、ＰＵのためのイントラ予測モードを決定し得る。

[0170]予測処理ユニット１５２は、ビットストリームから取り出されたシンタックス要素に基づいて、第１の参照ピクチャリスト（ＲｅｆＰｉｃＬｉｓｔ０）および第２の参照ピクチャリスト（ＲｅｆＰｉｃＬｉｓｔ１）を構築し得る。さらに、ＰＵがインター予測を用いて符号化される場合、エントロピー復号ユニット１５０は、ＰＵに関する動き情報を取り出し得る。動き補償ユニット１６４は、ＰＵの動き情報に基づいて、ＰＵに関する１つまたは複数の参照領域を決定し得る。動き補償ユニット１６４は、ＰＵに関する１つまたは複数の参照ブロックにおける複数のサンプルブロックに基づいて、ＰＵに関する予測ルーマ、ＣｂおよびＣｒブロックを生成し得る。

[0171]再構築ユニット１５８は、ＣＵのルーマ、ＣｂおよびＣｒコーディングブロックを再構築するために、既定どおりに、ＣＵのＴＵに関連付けられるルーマ、ＣｂおよびＣｒ変換ブロックとＣＵのＰＵの予測ルーマ、ＣｂおよびＣｒブロック、すなわちイントラ予測データまたはインター予測データのいずれかを使用し得る。例えば、再構築ユニット１５８は、ＣＵのルーマ、ＣｂおよびＣｒコーディングブロックを再構築するために、ルーマ、ＣｂおよびＣｒ変換ブロックのサンプルを対応する予測ルーマ、ＣｂおよびＣｒブロックのサンプルを加え得る。

[0172]本開示の技術は、ビデオデコーダ３０の再構築ユニット１５８によって実行され得るが、他の例において、図９に図示された、または図示されていないビデオデコーダ３０の他の要素が本開示の技術を実行し得る。ビデオデータのピクチャのスライスの各々のコーディングユニットの各予測ユニットに関して、再構築ユニット１５８は、少なくとも１つの隣接するサンプルの少なくとも１つの再構築された深さサンプルの少なくとも１つの深さ値に少なくとも部分的に基づいて、少なくとも１つの視差値を決定し得る。再構築ユニット１５８は、少なくとも１つの視差値に少なくとも部分的に基づいて、少なくとも１つの視差ベクトルを決定し得、ここにおいて、少なくとも１つの視差ベクトルは、各々のコーディングユニットに関する。再構築ユニット１５８は、少なくとも１つの視差ベクトルに少なくとも部分的に基づいて、各々のコーディングユニットに関するコーディングブロックを再構築し得る。

[0173]フィルタユニット１６０は、ＣＵのルーマ、ＣｂおよびＣｒコーディングブロックと関連するブロッキングアーチファクトを減少させるためにデブロッキング動作を実行し得る。ビデオデコーダ３０は、ＣＵのルーマ、ＣｂおよびＣｒコーディングブロックを復号されたピクチャバッファ１６２内に記憶し得る。復号されたピクチャバッファ１６２は、次の動き補償、イントラ予測、図１の表示デバイス３２のような表示デバイスへの表示のために参照ピクチャを提供し得る。例えば、ビデオデコーダ３０は、復号されたピクチャバッファ１６２におけるルーマ、ＣｂおよびＣｒブロックに基づいて、他のＣＵのＰＵに対するイントラ予測またはインター予測動作を実行し得る。このように、ビデオデコーダ３０は、ビットストリームから解析し、ルーマ係数ブロックの係数レベルを変換し、変換係数レベルを逆量子化し、変換ブロックを生成するためにその変換係数レベルに変換を適用し、変換ブロックに少なくとも部分的に基づいてコーディングブロックを生成し、および表示のためにコーディングブロックを出力し得る。

[0174]図１０は、本開示の１つまたは複数の態様にしたがった復号技術の例を示すフロー図である。この技術は、ビデオデコーダ３０の再構築ユニット１５８のようなビデオデコーダの要素によって実行され得る。この技術において、ビデオデータのピクチャのスライスの各々のコーディングユニットの各予測ユニットに関して、再構築ユニット１５８は、少なくとも１つの隣接するサンプルの少なくとも１つの再構築された深さサンプルの少なくとも１つの深さ値に少なくとも部分的に基づいて、少なくとも１つの視差値を決定し得る（２００）。再構築ユニット１５８は、少なくとも１つの視差値に少なくとも部分的に基づいて、少なくとも１つの視差ベクトルを決定し得、ここにおいて、少なくとも１つの視差ベクトルは、各々のコーディングユニットに関する（２０２）。再構築ユニット１５８は、少なくとも１つの視差ベクトルに少なくとも部分的に基づいて、各々のコーディングユニットに関するコーディングブロックを再構築し得る（２０４）。

[0175]図１１は、本開示の１つまたは複数の態様にしたがった符号化技術の例を示すフロー図である。この技術は、ビデオエンコーダ２０の残差生成ユニット１０２のようなビデオエンコーダの要素によって実行され得る。この技術において、ビデオデータのピクチャのスライスの各々のコーディングユニットの各予測ユニットに関して、残差生成ユニット１０２は、少なくとも１つの隣接するサンプルの少なくとも１つの再構築された深さサンプルの少なくとも１つの深さ値に少なくとも部分的に基づいて、少なくとも１つの視差値を決定し得る（２１０）。残差生成ユニット１０２は、少なくとも１つの視差値に少なくとも部分的に基づいて、少なくとも１つの視差ベクトルを決定し得、ここにおいて、少なくとも１つの視差ベクトルは、各々のコーディングユニットに関する（２１２）。残差生成ユニット１０２は、少なくとも１つの視差ベクトルに少なくとも部分的に基づいて、各々のコーディングユニットに関するコーディングブロックの符号化された描写を生成し得る（２１４）。

[0176]１つまたは複数の例において、記載された機能は、ハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の組合せで実施され得る。ソフトウェアで実装される場合、この機能は、１つまた複数の命令またはコードとして、コンピュータ可読媒体上に記憶されるか、またはコンピュータ可読媒体を介して送信され、ならびにハードウェアベースの処理ユニットによって実行され得る。コンピュータ可読媒体は、データ記憶媒体のような実体のある媒体、または例えば、通信プロトコルにしたがって、ある場所から別の場所へコンピュータプログラムの転送を容易にする任意の媒体を含む通信媒体に対応するコンピュータ可読記憶媒体を含み得る。この方法において、コンピュータ可読媒体は一般的に、（１）非一時的な実体のあるコンピュータ可読記憶媒体、または（２）信号または搬送波のような通信媒体に対応し得る。データ記憶媒体は、本開示で説明された技術の実施のために命令、コード、および／またはデータ構造を検索するための１つまたは複数のコンピュータまたは１つまたは複数のプロセッサによってアクセスされ得るいずれか使用可能な媒体であり得る。コンピュータプログラムプロダクトは、コンピュータ可読媒体を含み得る。

[0177]限定ではなく例として、こういったコンピュータ可読記憶媒体は、ＲＡＭ、ＲＯＭ、ＥＥＰＲＯＭ（登録商標）、ＣＤ−ＲＯＭまたは他の光学ディスク記憶装置、磁気ディスク記憶装置または他の磁気記憶デバイス、フラッシュメモリ、または命令またはデータ構造の形式で所望のプログラムコードを記憶するために用いることが可能なおよびコンピュータによってアクセス可能な任意の他の媒体を備えることができる。同様に、任意の接続は、コンピュータ可読媒体と適切に呼ばれ得る。例えば、命令が、同軸ケーブル、光ファイバーケーブル、ツイストペア、デジタル加入者線（ＤＳＬ）、または赤外線、無線およびマイクロ波のようなワイヤレス技術を用いるウェブサイト、サーバ、または他のリモートソースから送信される場合、同軸ケーブル、光ファイバーケーブル、ツイストペア、ＤＳＬ、または赤外線、無線およびマイクロ波のようなワイヤレス技術が媒体の定義に含まれる。しかし、コンピュータ可読記憶媒体およびデータ記憶媒体は、接続、搬送波、信号、または他の一時的な媒体を含まないが、代わりに非一時的な実体のある記憶媒体に関することが理解されるべきである。ここで用いられたようなディスク（ｄｉｓｋ）およびディスク（ｄｉｓｃ）は、コンパクトディスク（ＣＤ）、レーザーディスク（登録商標）、光学ディスク、（ＣＤ）、デジタル多用途ディスク（ＤＶＤ）、フロッピー（登録商標）ディスク、およびＢｌｕｅ−ｒａｙディスクを含み、ここで、ディスク（ｄｉｓｋ）が通常データを磁気的に再生する一方で、ディスク（ｄｉｓｃ）はレーザを用いて光学的にデータを再生する。上記の組合せもまた、コンピュータ可読媒体の範囲に含まれるべきである。

[0178]命令は、１つまたは複数のデジタル信号プロセッサ（ＤＳＰ）、汎用マイクロプロセッサ、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブル論理アレイ（ＦＰＧＡ）、または他の等価の集積またはディスクリート論理のような１つまたは複数のプロセッサによって実行可能であり得る。従って、ここで使用されたような用語「プロセッサ」は、前述の構造またはここで説明された技術の実施に適切な任意の他の構造のいずれかを指し得る。さらに、いくつかの態様において、ここで説明された機能は、符号化および復号のために構成された専用のハードウェアおよび／またはソフトウェアモジュール内に提供されるか、または組み合わされたコーデック内に組み込まれ得る。同様に、この技術は、１つまたは複数の回路または論理要素において十分に実施され得る。

[0179]本開示の技術は、ワイヤレスハンドセット、集積回路（ＩＣ）、またはＩＣのセット（例えばチップセット）を含む多種多様なデバイスまたは装置において実施され得る。種々の構成要素、モジュールまたはユニットは、開示された技術を実行するように構成されたデバイスの機能的態様を強調するために本開示において説明されるが、必ずしも異なるハードウェアユニットによる実現を必要とするわけではない。むしろ、上述したとおり、様々なユニットは、コーデックハードウェアユニットに組み込まれるか、あるいは適切なソフトウェアおよび／またはファームウェアと連結して、上述したような１つまたは複数のプロセッサを含む相互運用ハードウェアユニットの収集によって提供され得る。

[0180]本開示の種々の例が説明されてきた。これらおよび他の例は、下記の請求項の範囲内にある。
以下に、本願出願の当初の特許請求の範囲に記載された発明を付記する。
[Ｃ１]
深さビューデータを復号する方法であって、
前記方法は、
前記深さビューデータのピクチャのスライスの各々のコーディングユニット（ＣＵ）の各予測ユニット（ＰＵ）に関して、
少なくとも１つの隣接するサンプルの少なくとも１つの再構築された深さサンプルの少なくとも１つの深さ値に少なくとも部分的に基づいて、少なくとも１つの視差値を決定することと、
前記少なくとも１つの視差値に少なくとも部分的に基づいて、少なくとも１つの視差ベクトルを決定することと、ここにおいて、前記少なくとも１つの視差ベクトルは前記各々のＣＵに関し、
前記少なくとも１つの視差ベクトルに少なくとも部分的に基づいて、前記各々のＣＵに関するコーディングブロックを再構築することと、
を備える、方法。
[Ｃ２]
前記少なくとも１つの視差ベクトルを決定することは、２つ以上の隣接する深さサンプルに少なくとも部分的に基づいて、１つの視差ベクトルを決定することを備え、前記方法は、
選択された隣接する深さサンプルを識別するインデックス値を決定することと、ここにおいて、前記インデックス値はブロックレベルにおいてシグナリングされ、
前記２つ以上の隣接する深さサンプルのうちの１つを選択するために、前記２つ以上の隣接する深さサンプルの前記値に数学関数を適用することと、
のうちの少なくとも１つに基づいて、前記２つ以上の隣接する深さサンプルのうちの１つの隣接する深さサンプルを選択することと、
を備える、Ｃ１に記載の方法。
[Ｃ３]
前記少なくとも１つの視差ベクトルを決定することは、２つ以上の隣接する深さサンプルに少なくとも部分的に基づいて、２つ以上の視差ベクトルを決定することを備え、
前記方法は、前記２つ以上の隣接する深さサンプルに基づいて、２つ以上の視差値を前記２つ以上の視差ベクトルに変換すること、をさらに備えるＣ１に記載の方法。
[Ｃ４]
前記少なくとも１つの視差ベクトルを少なくとも１つの視差動きベクトルに変換すること、
をさらに備える、Ｃ１に記載の方法。
[Ｃ５]
前記少なくとも１つの視差値を決定することは、前記各々のＰＵの２つ以上の隣接するサンプルに少なくとも部分的に基づいて、２つ以上の視差値を決定することをさらに備え、ここにおいて、前記少なくとも１つの視差値に少なくとも部分的に基づいて前記少なくとも１つの視差ベクトルを決定することは、前記２つ以上の視差値に少なくとも部分的に基づいて２つ以上の視差ベクトルを決定することをさらに備え、前記ＰＵの左上のサンプルは座標（ｘ，ｙ）を有し、前記２つ以上の再構築された深さサンプルは、
前記ＰＵの左上に隣接するサンプルと、
前記ＰＵの上部に隣接する行と、
前記ＰＵの左側に隣接する列と、
前記各々のＰＵの特別な隣接するブロックに配置される任意のサンプルと、
座標（ｘ−１，ｙ＋１）を有するサンプルと、
座標（ｘ＋１，ｙ−１）を有するサンプルと、
前記ＰＵのサイズがＷ×Ｈによって表される場合は、座標（ｘ−１，ｙ＋Ｈ−１）を有するサンプルと座標（ｘ＋Ｗ−１，ｙ−１）を有するサンプルと、
のうちの少なくとも２つ以上からのものである、Ｃ１に記載の方法。
[Ｃ６]
前記少なくとも１つの視差値を決定することは、前記各々のＣＵの２つ以上の隣接するサンプルに少なくとも部分的に基づいて、２つ以上の視差値を決定することをさらに備え、ここにおいて、前記各々のＣＵの左上のサンプルは前記座標（ｘ，ｙ）を有し、前記２つ以上の再構築された深さサンプルは、
前記各々のＣＵの左上に隣接するサンプルと、
前記各々のＣＵの上部に隣接する行と、
前記各々のＣＵの左側に隣接する列と、
前記各々のＣＵの特別な隣接するブロックに配置される任意のサンプルと、
座標（ｘ−１，ｙ＋１）を有するサンプルと、
座標（ｘ＋１，ｙ−１）を有するサンプルと、
前記各々のＣＵのサイズが２Ｎ×２Ｎによって表される場合は、座標（ｘ−１，ｙ＋２Ｎ−１）を有するサンプルと座標（ｘ＋２Ｎ−１，ｙ−１）を有するサンプルと、
のうちの少なくとも２つ以上からのものである、Ｃ５に記載の方法。
[Ｃ７]
前記２つ以上の隣接するサンプルは、前記ＰＵの最大コーディングユニット（ＬＵＣ）の隣接するサンプルである、Ｃ５に記載の方法。
[Ｃ８]
前記少なくとも１つの隣接するサンプルは、各々のＣＵの隣接である、Ｃ１に記載の方法。
[Ｃ９]
前記少なくとも１つの再構築された深さサンプルは、
前記ＰＵの左上に隣接するサンプルと、
前記ＰＵの上部に隣接する行と、
前記ＰＵの左側に隣接する列と、
前記ＰＵの特別な隣接するブロックに配置される任意のサンプルと、
のうちの少なくとも１つからのものである、Ｃ１に記載の方法。
[Ｃ１０]
前記少なくとも１つの視差ベクトルを決定することは、任意の使用可能な視差ベクトルを識別できなかった実行された隣接ベースの視差ベクトルの誘導（ＮＢＤＶ）プロセスに応答する、Ｃ１に記載の方法。
[Ｃ１１]
前記少なくとも１つの視差ベクトルに基づいて参照ブロックを識別することと、
動きベクトルと前記識別された参照ブロックの参照インデックスに少なくとも部分的に基づいて前記ＰＵの現在の動きを予測することと、
前記動きベクトルと参照インデックスに少なくとも部分的に基づいて決定された候補を統合されたまたは高度な動きベクトル予測（ＡＭＶＰ）候補リストに挿入することと、
をさらに備える、Ｃ１に記載の方法。
[Ｃ１２]
前記少なくとも１つの視差ベクトルを決定することは、カメラパラメータに少なくとも部分的に基づいて、前記視差ベクトルを決定することを備える、Ｃ１に記載の方法。
[Ｃ１３]
前記１つまたは複数のカメラパラメータは２つのビューの水平置換を含む、Ｃ１２に記載の方法。
[Ｃ１４]
深さビューデータのピクチャと関連付けられるデータを記憶するように構成されたメモリと、
前記メモリと通信を行いおよび
深さビューデータの前記ピクチャのスライスの各々のコーディングユニット（ＣＵ）の各予測ユニット（ＰＵ）に関して、
少なくとも１つの隣接するサンプルの少なくとも１つの再構築された深さサンプルの少なくとも１つの深さ値に少なくとも部分的に基づいて、少なくとも１つの視差値を決定することと、
前記少なくとも１つの視差値に少なくとも部分的に基づいて、少なくとも１つの視差ベクトルを決定することと、ここにおいて、前記少なくとも１つの視差ベクトルは前記各々のＣＵに関し、
前記少なくとも１つの視差ベクトルに少なくとも部分的に基づいて、前記各々のＣＵに関するコーディングブロックを再構築することと、
を行うように構成された１つまたは複数のプロセッサと、
を備える、ビデオデータを復号するためのデバイス。
[Ｃ１５]
前記少なくとも１つの視差ベクトルを決定することは、２つ以上の隣接する深さサンプルに少なくとも部分的に基づいて、１つの視差ベクトルを決定するように構成された前記デバイスを備え、ここにおいて、前記デバイスは、
選択された隣接する深さサンプルを識別するインデックス値を決定することと、ここにおいて、前記インデックス値はブロックレベルにおいてシグナリングされ、および
前記２つ以上の隣接する深さサンプルのうちの１つを選択するために、前記２つ以上の隣接する深さサンプルの前記値に数学関数を適用することと、
のうちの少なくとも１つに基づいて、前記２つ以上の隣接する深さサンプルのうちの１つの隣接する深さサンプルを選択すること、
を行うようにさらに構成される、Ｃ１４に記載のデバイス。
[Ｃ１６]
前記デバイスは、前記少なくとも１つの視差ベクトルを少なくとも１つの視差動きベクトルに変換するようにさらに構成される、Ｃ１４に記載のデバイス。
[Ｃ１７]
実行されると、
前記深さビューデータのピクチャのスライスの各々のコーディングユニット（ＣＵ）の各予測ユニット（ＰＵ）に関して、
少なくとも１つの隣接するサンプルの少なくとも１つの再構築された深さサンプルの少なくとも１つの深さ値に少なくとも部分的に基づいて、少なくとも１つの視差値を決定することと、
前記少なくとも１つの視差値に少なくとも部分的に基づいて、少なくとも１つの視差ベクトルを決定することと、ここにおいて、前記少なくとも１つの視差ベクトルは前記各々のＣＵに関し、
前記少なくとも１つの視差ベクトルに少なくとも部分的に基づいて、前記各々のＣＵに関するコーディングブロックを再構築することと、
を行うようにビデオ復号デバイスを構成する命令を記憶した、コンピュータ可読記憶媒体。
[Ｃ１８]
前記少なくとも１つの視差ベクトルを決定することは、２つ以上の隣接する深さサンプルに少なくとも部分的に基づいて、１つの視差ベクトルを決定するように前記デバイスをさらに構成する前記命令を備え、ここにおいて、前記命令は、
選択された隣接する深さサンプルを識別するインデックス値を決定することと、ここにおいて、前記インデックス値はブロックレベルにおいてシグナリングされ、および
前記２つ以上の隣接する深さサンプルのうちの１つを選択するために、前記２つ以上の隣接する深さサンプルの前記値に数学関数を適用することと、
のうちの少なくとも１つに基づいて、前記２つ以上の隣接する深さサンプルのうちの１つの隣接する深さサンプルを選択すること、
を行うように前記デバイスをさらに構成する、Ｃ１７に記載のコンピュータ可読記憶媒体。
[Ｃ１９]
深さビューデータを符号化する方法であって、
前記方法は、
前記ビデオデータのピクチャのスライスの各々のコーディングユニット（ＣＵ）の各予測ユニット（ＰＵ）に関して、
少なくとも１つの隣接するサンプルの少なくとも１つの再構築された深さサンプルの少なくとも１つの深さ値に少なくとも部分的に基づいて、少なくとも１つの視差値を決定することと、
前記少なくとも１つの視差値に少なくとも部分的に基づいて、少なくとも１つの視差ベクトルを決定することと、ここにおいて、前記少なくとも１つの視差ベクトルは前記各々のＣＵに関し、
前記少なくとも１つの視差ベクトルに少なくとも部分的に基づいて、前記各々のＣＵに関するコーディングブロックの符号化された描写を生成することと、
を備える、方法。
[Ｃ２０]
前記少なくとも１つの視差ベクトルを決定することは、２つ以上の隣接する深さサンプルに少なくとも部分的に基づいて、１つの視差ベクトルを決定することを備え、前記方法は、
選択された隣接する深さサンプルを識別するインデックス値を決定することと、ここにおいて、前記インデックス値はブロックレベルにおいてシグナリングされ、および
前記２つ以上の隣接する深さサンプルのうちの１つを選択するために、前記２つ以上の隣接する深さサンプルの前記値に数学関数を適用することと、
のうちの少なくとも１つに基づいて、前記２つ以上の隣接する深さサンプルのうちの１つの隣接する深さサンプルを選択すること、
をさらに備える、Ｃ１９に記載の方法。
[Ｃ２１]
前記少なくとも１つの視差ベクトルを決定することは、２つ以上の隣接する深さサンプルに少なくとも部分的に基づいて、２つ以上の視差ベクトルを決定することを備え、

前記方法は、前記２つ以上の隣接する深さサンプルに基づいて、２つ以上の視差値を２つ以上の視差ベクトルに変換すること、をさらに備える、Ｃ１９に記載の方法。
[Ｃ２２]
前記視差ベクトルを視差動きベクトルに変換することをさらに備える、Ｃ１９に記載の方法。
[Ｃ２３]
前記少なくとも１つの視差値を決定することは、前記各々のＰＵの２つ以上の隣接するサンプルに少なくとも部分的に基づいて、２つ以上の視差値を決定することをさらに備え、ここにおいて、前記少なくとも１つの視差値に少なくとも部分的に基づいて前記少なくとも１つの視差ベクトルを決定することは、前記２つ以上の視差値に少なくとも部分的に基づいて２つ以上の視差ベクトルを決定することをさらに備え、前記ＰＵの左上のサンプルは座標（ｘ，ｙ）を有し、前記２つ以上の再構築された深さサンプルは、
前記ＰＵの左上に隣接するサンプルと、
前記ＰＵの上部に隣接する行と、
前記ＰＵの左側に隣接する列と、
前記各々のＣＵの特別な隣接するブロックに配置される任意のサンプルと、
座標（ｘ−１，ｙ＋１）を有するサンプルと、
座標（ｘ＋１，ｙ−１）を有するサンプルと、
前記ＰＵのサイズがＷ×Ｈによって表される場合は、座標（ｘ−１，ｙ＋Ｈ−１）を有するサンプルと座標（ｘ＋Ｗ−１，ｙ−１）を有するサンプルと、
のうちの少なくとも２つ以上からのものである、Ｃ１９に記載の方法。
[Ｃ２４]
少なくとも１つの視差値を決定することは、前記各々のＣＵの２つ以上の隣接するサンプルに少なくとも部分的に基づいて、２つ以上の視差値を決定することをさらに備え、ここにおいて、前記各々のＣＵの左上のサンプルは前記座標（ｘ，ｙ）を有し、前記２つ以上の再構築された深さサンプルは、
座標（ｘ−１，ｙ＋１）を有するサンプルと、
座標（ｘ＋１，ｙ−１）を有するサンプルと、
前記各々のＣＵのサイズが２Ｎ×２Ｎによって表される場合は、座標（ｘ−１，ｙ＋２Ｎ−１）を有するサンプルと座標（ｘ＋２Ｎ−１，ｙ−１）を有するサンプルと、
のうちの少なくとも２つ以上からのものである、Ｃ２３に記載の方法。
[Ｃ２５]
前記２つ以上の隣接するサンプルは、前記ＰＵの最大コーディングユニット（ＬＵＣ）の隣接するサンプルである、Ｃ２３に記載の方法。
[Ｃ２６]
前記少なくとも１つの再構築された深さサンプルは、
前記ＰＵの左上に隣接するサンプルと、
前記ＰＵの上部に隣接する行と、
前記ＰＵの左側に隣接する列と、
前記ＰＵの特別な隣接するブロックに配置される任意のサンプルと、
のうちの少なくとも１つからのものである、Ｃ１９に記載の方法。
[Ｃ２７]
前記少なくとも１つの視差ベクトルを決定することは、任意の使用可能な視差ベクトルを識別できなかった実行された隣接ベースの視差ベクトルの誘導（ＮＢＤＶ）プロセスに応答する、Ｃ１９に記載の方法。
[Ｃ２８]
前記視差ベクトルに基づいて参照ブロックを識別することと、
動きベクトルと前記識別された参照ブロックの参照インデックスに少なくとも部分的に基づいて前記ＰＵの現在の動きを予測することと、
前記動きベクトルと参照インデックスに少なくとも部分的に基づいて決定された候補を統合されたまたは高度な動きベクトル予測（ＡＭＶＰ）候補リストに挿入することと、
をさらに備える、Ｃ１９に記載の方法。
[Ｃ２９]
前記視差値に少なくとも部分的に基づいて視差ベクトルを決定することは、前記視差値とカメラパラメータに少なくとも部分的に基づいて前記視差ベクトルを決定することを備える、Ｃ１９に記載の方法。
[Ｃ３０]
前記１つまたは複数のカメラパラメータは２つのビューの水平置換を含む、Ｃ２９に記載の方法。

Claims

深さビューデータを復号する方法であって、
前記方法は、
前記深さビューデータのピクチャのスライスの各々のコーディングユニット（ＣＵ）の現在の予測ユニット（ＰＵ）に関して、
２つ以上の隣接するサンプルの２つ以上の再構築された深さサンプルの２つ以上の深さ値に少なくとも部分的に基づいて、少なくとも１つの視差値を決定することと、ここにおいて、前記２つ以上の隣接するサンプルは、前記現在のＰＵの外部にあり、前記現在のＰＵに隣接し、２つ以上の異なるＰＵ内に配置され、前記少なくとも１つの視差値は、前記２つ以上の再構築された深さサンプル間の差を示し、
前記少なくとも１つの視差値に少なくとも部分的に基づいて、少なくとも１つの視差ベクトルを決定することと、ここにおいて、前記少なくとも１つの視差ベクトルは前記各々のＣＵに関し、
前記少なくとも１つの視差ベクトルに少なくとも部分的に基づいて、前記各々のＣＵに関するコーディングブロックを再構築することと、
を備える、方法。
前記少なくとも１つの視差ベクトルを決定することは、２つ以上の隣接する深さサンプルに少なくとも部分的に基づいて、１つの視差ベクトルを決定することを備え、前記方法は、
前記１つの視差ベクトルを決定するために、前記２つ以上の隣接する深さサンプルのうちの１つを選択するために、前記２つ以上の隣接する深さサンプルの値に数学関数を適用することに基づいて、前記２つ以上の隣接する深さサンプルから１つの深さサンプルを選択すること、前記数学関数は、メジアン、最大および平均のうちの１つを取得することを備え、
をさらに備える、請求項１に記載の方法。
前記少なくとも１つの視差ベクトルを決定することは、２つ以上の隣接する深さサンプルに少なくとも部分的に基づいて、２つ以上の視差ベクトルを決定することを備え、
前記方法は、カメラパラメータに基づいて、２つ以上の視差値を前記２つ以上の視差ベクトルに変換すること、をさらに備える、請求項１に記載の方法。
インタービュー参照ピクチャを識別する参照インデックスを使用して、前記少なくとも１つの視差ベクトルを少なくとも１つの視差動きベクトルに変換すること、
をさらに備える、請求項１に記載の方法。
前記少なくとも１つの視差値を決定することは、前記現在のＰＵの外部の２つ以上の隣接するサンプルに少なくとも部分的に基づいて、２つ以上の視差値を決定することをさらに備え、ここにおいて、前記少なくとも１つの視差値に少なくとも部分的に基づいて前記少なくとも１つの視差ベクトルを決定することは、前記２つ以上の視差値に少なくとも部分的に基づいて２つ以上の視差ベクトルを決定することをさらに備え、前記現在のＰＵの左上のサンプルは座標（ｘ，ｙ）を有し、前記２つ以上の再構築された深さサンプルは、
前記現在のＰＵの左上に隣接するサンプルと、
前記現在のＰＵの上部に隣接する行と、
前記現在のＰＵの左側に隣接する列と、
座標（ｘ−１，ｙ＋１）を有するサンプルと、
座標（ｘ＋１，ｙ−１）を有するサンプルと、
前記ＰＵのサイズがＷ×Ｈによって表される場合は、座標（ｘ−１，ｙ＋Ｈ−１）を有するサンプルと座標（ｘ＋Ｗ−１，ｙ−１）を有するサンプルと、
のうちの少なくとも２つ以上からのものである、請求項１に記載の方法。
前記少なくとも１つの視差値を決定することは、前記各々のＣＵの外部の２つ以上の隣接するサンプルに少なくとも部分的に基づいて、２つ以上の視差値を決定することをさらに備え、ここにおいて、前記各々のＣＵの左上のサンプルは前記座標（ｘ，ｙ）を有し、前記２つ以上の再構築された深さサンプルは、
前記各々のＣＵの左上に隣接するサンプルと、
前記各々のＣＵの上部に隣接する行と、
前記各々のＣＵの左側に隣接する列と、
座標（ｘ−１，ｙ＋１）を有するサンプルと、
座標（ｘ＋１，ｙ−１）を有するサンプルと、
前記各々のＣＵのサイズが２Ｎ×２Ｎによって表される場合は、座標（ｘ−１，ｙ＋２Ｎ−１）を有するサンプルと座標（ｘ＋２Ｎ−１，ｙ−１）を有するサンプルと、
のうちの少なくとも２つ以上からのものである、請求項５に記載の方法。
前記２つ以上の隣接するサンプルは、前記現在のＰＵの最大コーディングユニット（ＬＵＣ）の隣接するサンプルである、請求項５に記載の方法。
前記２つ以上の隣接するサンプルは、前記各々のＣＵの外部の隣接するサンプルである、請求項１に記載の方法。
前記２つ以上の再構築された深さサンプルは、
前記現在のＰＵの左上に隣接するサンプルと、
前記現在のＰＵの上部に隣接する行と、
前記現在のＰＵの左側に隣接する列と、
のうちの２つ以上からのものである、請求項１に記載の方法。
前記少なくとも１つの視差ベクトルを決定することは、任意の使用可能な視差ベクトルを識別できなかった実行された隣接ベースの視差ベクトルの誘導（ＮＢＤＶ）プロセスに応答する、請求項１に記載の方法。
前記少なくとも１つの視差ベクトルに基づいて、インタービュー参照ピクチャの他のビューの参照ピクチャにおける参照ブロックを識別することと、
動きベクトルと前記識別された参照ブロックの参照インデックスに少なくとも部分的に基づいて前記現在のＰＵの現在の動きを予測することと、
前記動きベクトルと参照インデックスに少なくとも部分的に基づいて決定された候補を、統合されたまたは高度な動きベクトル予測（ＡＭＶＰ）候補リストに挿入することと、
をさらに備える、請求項１に記載の方法。
深さビューデータを符号化する方法であって、
前記方法は、
前記深さビューデータのピクチャのスライスの各々のコーディングユニット（ＣＵ）の現在の予測ユニット（ＰＵ）に関して、
２つ以上の隣接するサンプルの２つ以上の再構築された深さサンプルの２つ以上の深さ値に少なくとも部分的に基づいて、少なくとも１つの視差値を決定することと、ここにおいて、前記２つ以上の隣接するサンプルは、前記現在のＰＵの外部にあり、前記現在のＰＵに隣接し、２つ以上の異なるＰＵ内に配置され、前記少なくとも１つの視差値は、前記２つ以上の再構築された深さサンプル間の差を示し、
前記少なくとも１つの視差値に少なくとも部分的に基づいて、少なくとも１つの視差ベクトルを決定することと、ここにおいて、前記少なくとも１つの視差ベクトルは前記各々のＣＵに関し、
前記少なくとも１つの視差ベクトルに少なくとも部分的に基づいて、前記各々のＣＵに関するコーディングブロックの符号化されたデータを生成することと、
を備える、方法。
深さビューデータのピクチャと関連付けられるデータを記憶するように構成されたメモリと、
前記メモリと通信を行いおよび
深さビューデータの前記ピクチャのスライスの各々のコーディングユニット（ＣＵ）の現在の予測ユニット（ＰＵ）に関して、
２つ以上の隣接するサンプルの２つ以上の再構築された深さサンプルの２つ以上の深さ値に少なくとも部分的に基づいて、少なくとも１つの視差値を決定することと、ここにおいて、前記２つ以上の隣接するサンプルは、前記現在のＰＵの外部にあり、前記現在のＰＵに隣接し、２つ以上の異なるＰＵ内に配置され、前記少なくとも１つの視差値は、前記２つ以上の再構築された深さサンプル間の差を示し、
前記少なくとも１つの視差値に少なくとも部分的に基づいて、少なくとも１つの視差ベクトルを決定することと、ここにおいて、前記少なくとも１つの視差ベクトルは前記各々のＣＵに関し、
前記少なくとも１つの視差ベクトルに少なくとも部分的に基づいて、前記各々のＣＵに関するコーディングブロックを再構築することと、
を行うように構成された１つまたは複数のプロセッサと、
を備える、ビデオデータを復号するためのデバイス。
深さビューデータのピクチャと関連付けられるデータを記憶するように構成されたメモリと、
前記メモリと通信を行いおよび
深さビューデータの前記ピクチャのスライスの各々のコーディングユニット（ＣＵ）の現在の予測ユニット（ＰＵ）に関して、
２つ以上の隣接するサンプルの２つ以上の再構築された深さサンプルの２つ以上の深さ値に少なくとも部分的に基づいて、少なくとも１つの視差値を決定することと、ここにおいて、前記２つ以上の隣接するサンプルは、前記現在のＰＵの外部にあり、前記現在のＰＵに隣接し、２つ以上の異なるＰＵ内に配置され、前記少なくとも１つの視差値は、前記２つ以上の再構築された深さサンプル間の差を示し、
前記少なくとも１つの視差値に少なくとも部分的に基づいて、少なくとも１つの視差ベクトルを決定することと、ここにおいて、前記少なくとも１つの視差ベクトルは前記各々のＣＵに関し、
前記少なくとも１つの視差ベクトルに少なくとも部分的に基づいて、前記各々のＣＵに関するコーディングブロックの符号化されたデータを生成することと、
を行うように構成された１つまたは複数のプロセッサと、
を備える、ビデオデータを符号化するためのデバイス。
実行されると、請求項１乃至１２のいずれか一項に従う方法を実行するようにデバイスを構成する命令を記憶した、コンピュータ可読記憶媒体。