JP6246919B2

JP6246919B2 - 深度イントラコーディングのためのウェッジレットパターン拡張

Info

Publication number: JP6246919B2
Application number: JP2016522805A
Authority: JP
Inventors: ジャオ、シン; ジャン、リ; チェン、イン; カークゼウィックズ、マルタ
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2013-10-15
Filing date: 2014-10-15
Publication date: 2017-12-13
Anticipated expiration: 2034-10-15
Also published as: CN105612747B; KR101776545B1; BR112016008369B1; EP3058738A1; HUE047082T2; HK1219596A1; BR112016008369A2; CN105612747A; US9544601B2; WO2015057861A1; EP3058738B1; ES2745282T3; US20150103906A1; JP2016537860A; KR20160070761A

Description

[0001]本出願は、その内容全体が参照によって本明細書に組み込まれている、２０１３年１０月１５日に出願された米国仮出願第６１／８９１，２０３号の利益を主張する。

[0002]本開示は、ビデオコーディングに関する。

[0003]デジタルビデオ能力は、デジタルテレビジョン、デジタルダイレクトブロードキャストシステム、ワイヤレスブロードキャストシステム、携帯情報端末（ＰＤＡ）、ラップトップコンピュータもしくはデスクトップコンピュータ、タブレットコンピュータ、電子ブックリーダー、デジタルカメラ、デジタル記録デバイス、デジタルメディアプレーヤ、ビデオゲームデバイス、ビデオゲーム機、セルラー電話機もしくは衛星無線電話機、いわゆる「スマートフォン」、ビデオ会議デバイス、ビデオストリーミングデバイスなどを含む広範囲のデバイスに組み込まれ得る。デジタルビデオデバイスは、ＭＰＥＧ−２、ＭＰＥＧ−４、ＩＴＵ−ＴＨ．２６３、ＩＴＵ−ＴＨ．２６４／ＭＰＥＧ−４，Ｐａｒｔ１０，アドバンストビデオコーディング（ＡＶＣ）、現在開発中の高効率ビデオコーディング（ＨＥＶＣ）規格によって定義された規格、およびそのような規格の拡張に記載されているもののような、ビデオ圧縮技法を実装する。これらのビデオデバイスは、そのようなビデオ圧縮技法を実装することによって、デジタルビデオ情報をより効率的に送信し、受信し、符号化し、復号し、および／または記憶することができる。

[0004]ビデオ圧縮技法は、ビデオシーケンスに固有の冗長性を低減または除去するために、空間的（ピクチャ内）予測および／または時間的（ピクチャ間）予測を実行する。ブロックベースのビデオコーディングの場合、ビデオスライス（すなわち、ピクチャまたはピクチャの一部分）は、ツリーブロック、コーディングユニット（ＣＵ）および／またはコーディングノードと呼ばれることもあるビデオブロックに区分され得る。ピクチャのイントラコーディングされた（Ｉ）スライス中のビデオブロックは、同じピクチャ中の隣接ブロック中の参照サンプルに対する空間的予測を使用して符号化される。ピクチャのインターコーディングされた（ＰまたはＢ）スライスの中のビデオブロックは、同じピクチャの中の隣接ブロック中の参照サンプルに対する空間的予測、または他の参照ピクチャ中の参照サンプルに対する時間的予測を使用し得る。

[0005]空間的予測または時間的予測は、コーディングされるべきブロックの予測ブロックをもたらす。残差データは、コーディングされるべき元のブロックと予測ブロックとの間のピクセル差分を表す。インターコーディングされたブロックは、予測ブロックを形成する参照サンプルのブロックを指す動きベクトル、およびコーディングされたブロックと予測ブロックとの間の差分を示す残差データに従って符号化される。イントラコーディングされたブロックは、イントラコーディングモードおよび残差データに従って符号化される。さらなる圧縮のために、残差データは空間領域から変換領域に変換されて、残差変換係数が得られ得、その残差変換係数は、次いで量子化され得る。最初に２次元アレイで構成される量子化変換係数は、変換係数の１次元ベクトルを生成するために走査されてよく、エントロピーコーディングが、さらなる圧縮を達成するために適用されてよい。

[0006]本開示の技法は一般に、ビデオデータのイントラ予測されたブロックに関するパーティションパターンを、より小さいサイズのブロックに関連するパーティションパターンに基づいて導出することに関する。いくつかの例では、イントラ予測されたブロックは、深度マップのブロックであり得、パーティションパターンは、サブブロックを二等分する線形線によって分割された２つのパーティションにサブブロックを区分する線ベースのパーティションパターンであり得る。

[0007]一例では、本開示は、ビデオデータを復号する方法について説明し、本方法は、第１のサイズのブロックに関連するパーティションパターンを決定することと、第１のサイズのブロックに関連する決定されたパーティションパターンに基づいて、第２のサイズの深度ブロックに関するパーティションパターンを決定することと、ここにおいて、第２のサイズが第１のサイズよりも大きい、深度ブロックに関する決定されたパーティションパターンに基づいて、深度ブロックをイントラ予測復号することとを備える。

[0008]一例では、本開示は、ビデオデータを符号化する方法について説明し、本方法は、第１のサイズのブロックに関連するパーティションパターンを決定することと、第１のサイズのブロックに関連する決定されたパーティションパターンに基づいて、第２のサイズの深度ブロックに関するパーティションパターンを決定することと、ここにおいて、第２のサイズが第１のサイズよりも大きい、深度ブロックに関する決定されたパーティションパターンに基づいて、深度ブロックをイントラ予測符号化することとを備える。

[0009]一例では、本開示は、ビデオコーディングのためのデバイスについて説明し、本デバイスは、第１のサイズのブロックに関連する１つまたは複数のパーティションパターンを記憶するビデオデータメモリと、１つまたは複数のプロセッサを備えるビデオコーダとを備える。ビデオコーダは、記憶された１つまたは複数のパーティションパターンから、第１のサイズのブロックに関連するパーティションパターンを決定することと、第１のサイズのブロック関連する決定されたパーティションパターンに基づいて、第２のサイズの深度ブロックに関するパーティションパターンを決定することと、ここにおいて、第２のサイズが第１のサイズよりも大きい、深度ブロックに関する決定されたパーティションパターンに基づいて、深度ブロックをイントラ予測コーディングすることとを行うように構成され得る。

[0010]一例では、本開示は、ビデオコーディングのためのデバイスの１つまたは複数のプロセッサによって実行されたときに、１つまたは複数のプロセッサに、第１のサイズのブロックに関連するパーティションパターンを決定することと、第１のサイズのブロックに関連する決定されたパーティションパターンに基づいて、第２のサイズの深度ブロックに関するパーティションパターンを決定することと、ここにおいて、第２のサイズが第１のサイズよりも大きい、深度ブロックに関する決定されたパーティションパターンに基づいて、深度ブロックをイントラ予測コーディングすることとを行わせる命令を記憶したコンピュータ可読記憶媒体について説明する。

[0011]本開示の１つまたは複数の例の詳細は、添付図面および下記の説明に記載される。他の特徴、目的、および利点は、その説明および図面、ならびに特許請求の範囲から明らかになろう。

[0012]深度コーディングのための本開示の技法を利用し得る例示的なビデオ符号化および復号システム１０を示すブロック図。 [0013]方向性イントラ予測モードに関連する予測方向を概して示す図。 [0014]深度モデリングモード（ＤＭＭ）の例を示す概念図。深度モデリングモード（ＤＭＭ）の例を示す概念図。 [0015]パーティションパターンの例を示す概念図。パーティションパターンの例を示す概念図。パーティションパターンの例を示す概念図。パーティションパターンの例を示す概念図。パーティションパターンの例を示す概念図。パーティションパターンの例を示す概念図。 [0016]１／２サンプル精度のパーティションパターンサンプルのマッピングを示す概念図。１／２サンプル精度のパーティションパターンサンプルのマッピングを示す概念図。 [0017]深度コーディングのための技法を実装し得るビデオエンコーダの一例を示すブロック図。 [0018]深度コーディングのための技法を実装し得るビデオデコーダの一例を示すブロック図。 [0019]ビデオデータを復号する例示的な方法を示すフローチャート。 [0020]ビデオデータを符号化する例示的な方法を示すフローチャート。 [0021]領域境界チェーンコーディングモードを示す概念図。

[0022]たとえば３次元（３Ｄ）−ＨＥＶＣ（高効率ビデオコーディング）規格による３Ｄビデオコーディングでは、（テクスチャビューのテクスチャコンポーネントとも呼ばれる）キャプチャされたビデオデータが深度ビューの対応する深度マップに関連付けられる、マルチビュービデオ＋深度フォーマットを使用して、３Ｄビデオデータが表される。たとえば、テクスチャビューのテクスチャコンポーネントは、実際のビデオコンテンツを表し、テクスチャコンポーネントに対応する深度コンポーネントは、テクスチャコンポーネント中のピクセルの相対深度を表す深度マップを提供する。ビデオエンコーダは、テクスチャコンポーネントと深度マップとを符号化し、テクスチャコンポーネントと深度マップとを３Ｄビデオビットストリーム中に多重化するように構成される。ビデオデコーダは、３Ｄビデオビットストリームを受信し、３Ｄビデオデータを再構成するためにテクスチャコンポーネントと深度マップとを復号する。

[0023]ビデオエンコーダのビデオ符号化能力とビデオデコーダの復号能力とを活用するために、ルーマサンプルが深度値を表すグレースケールビデオとして深度マップが形成される。このようにして、深度値を符号化および復号するための何らかの追加の特殊な符号化および復号の技法を利用する必要なく、ビデオエンコーダおよびビデオデコーダの既存の能力を使用して、深度値が符号化され復号され得る。

[0024]たとえば、ビデオのピクチャをコーディングするために、ビデオエンコーダは、インター予測符号化および／またはイントラ予測符号化を利用するように構成され得、ビデオデコーダは、インター予測復号および／またはイントラ予測復号を利用するように構成され得る。ビデオエンコーダおよびビデオデコーダは、同様にそれぞれ、深度マップをコーディングするためのインター予測およびイントラ予測の符号化および復号の技法を使用することができる。

[0025]場合によっては、深度マップは、シャープエッジと定数領域（constant area）とを含み、シャープエッジは、エッジの一方の側のルーマ値とエッジの他方の側のルーマ値との間に比較的大きい差があるときに発生する。深度マップサンプルのそのような異なる統計値（たとえば、ルーマ値）に起因して、２次元（２Ｄ）ビデオコーデックに基づいて深度マップのために設計された異なるコーディング方式があり得る。たとえば、２次元ビデオコーディングの場合、深度マップがないことがある。一方、深度マップを含む３Ｄビデオコーディングの場合、深度マップを符号化および復号するために追加のビデオコーディング技法が有用であり得る。

[0026]たとえば、３Ｄ−ＨＥＶＣ規格は、ＨＥＶＣ規格において定義されるような２Ｄビデオコーディングに関する概念を３Ｄビデオコーディングに拡張する。３Ｄ−ＨＥＶＣ規格は、イントラ予測符号化および復号のためにＨＥＶＣ規格において定義されるイントラ予測モードを使用する。さらに、３Ｄ−ＨＥＶＣ規格は、深度マップのスライスのイントラ予測ユニットを符号化または復号する（すなわち、深度スライスの予測ユニット（ＰＵ）をイントラ予測する）ために、ＨＥＶＣイントラ予測モードとともに深度モデリングモード（ＤＭＭ）を導入した。

[0027]ＤＭＭでは、深度マップのブロックが２つの領域に区分され、各領域が定数値によって表される。ビデオエンコーダは、深度マップのブロックをイントラ予測するためにビデオエンコーダが使用する領域の各々に関する予測値を決定する。ビデオエンコーダは、領域の各々に関する予測値をビデオデコーダにシグナリングすることもでき、またはビデオデコーダは、ビデオエンコーダからの明示的なシグナリングなしで予測値を決定するように構成され得る。いずれの場合も、ビデオデコーダは、深度マップのブロックをイントラ予測するために予測値を利用することができる。

[0028]（深度ブロックと呼ばれる）深度マップのブロックを区分する方法のうちの１つは、ウェッジレット区分と呼ばれる。ウェッジレット区分では、ビデオエンコーダは、深度ブロックを二等分して２つの領域を生成する線形線を決定する。このようにして、ウェッジレット区分は、線ベースの区分と考えられることがあり、いくつかの例では、非長方形パーティションを形成し得る（ただし、長方形パーティションを形成する可能性もある）。線形線は、深度ブロックの１つの側にある点から開始し、深度ブロックの反対側または直交側にある点で終了することがある。一例として、一方位では、線形線は、深度ブロックの左側にある点から開始し、深度ブロックの上側にある点で終了することがある。別の方位では、線形線は、深度ブロックの上側にある点から開始し、深度ブロックの下側にある点で終了することがある。

[0029]ウェッジレットパターンは、深度マップのブロックが二等分線形線により２つの領域に区分され得る１つの方法を指し、ブロックのために存在し得るウェッジレットパターンの数は、ブロックサイズの関数であり得る。たとえば、所与の解像度（たとえば、１ピクセル、１／２ピクセル、または１／４ピクセル）で、より小さいサイズのブロック（たとえば、４×４ブロック）の場合、より大きいサイズのブロック（たとえば、６４×６４）と比較して、ブロックの側に沿ってより少ない点がある。したがって、より大きいサイズのブロックと比較して、より小さいサイズのブロックの各側に沿ってより少ない開始点および終了点があり、より少ないウェッジレットパターンが生じる。

[0030]ＤＭＭモードのうちの１つが利用される例では、ビデオエンコーダは、深度ブロックに関するウェッジレットパターンを決定し、決定されたウェッジレットパターンに基づいてウェッジレットパターンをイントラ予測することができる。ビデオデコーダは、ブロックを復号するために逆のプロセスを実行するように構成され得るので、ビデオデコーダは、ビデオエンコーダが決定したウェッジレットパターンと同じウェッジレットパターンを決定することができる。たとえば、いくつかの例では、ビデオエンコーダおよびビデオデコーダはそれぞれ、ウェッジレットパターンのリストを記憶することができる。ビデオエンコーダは、ビデオビットストリームにおいて、決定されたウェッジレットパターンを識別するウェッジレットパターンのリストへのインデックスをシグナリングすることができる。次いでビデオデコーダは、ウェッジレットパターンのリストのシグナリングされたインデックスに基づいて、ビデオエンコーダと同じウェッジレットパターンを決定することができる。別の例として、ビデオエンコーダは、深度ブロックに関するウェッジレットパターンを、対応するテクスチャブロックのビデオコンテンツ特性から決定することができる。ビデオデコーダは、ビデオデコーダが決定するウェッジレットパターンおよびビデオエンコーダが決定するウェッジレットパターンが同じウェッジレットパターンになるように、ウェッジレットパターンを決定するためのビデオエンコーダと同じ技法を実施するように構成され得る。

[0031]ウェッジレットパターンを決定する上記の例では、ビデオエンコーダおよびビデオデコーダは、すべてのブロックサイズに関するすべてのウェッジレットパターンについての情報を記憶するように構成され得る。しかしながら、より大きいブロックサイズの場合、比較的多数のウェッジレットパターンを記憶するために必要なメモリの量は、望ましくないほど大きいことがある。たとえば、３Ｄ−ＨＥＶＣ規格のいくつかのドラフトは、６４×６４サイズの深度ブロックに関するウェッジレットパターンをまったく持たないことを提案した。言い換えれば、６４×６４サイズの深度ブロックに関するウェッジレットパターンを記憶するための大きいサイズのメモリを持つ不利益は、６４×６４サイズの深度ブロックをイントラ予測するためにウェッジレットパターンを使用する利益を圧倒すると考えられた。

[0032]本開示で説明する技法では、ビデオコーダ（たとえば、ビデオエンコーダまたはビデオデコーダ）は、パーティションパターン（たとえば、ウェッジレットパターン）を、第１のサイズのブロックのパーティションパターンから決定し（たとえば、第１のサイズのブロックに関連するパーティションパターンを決定し）、第１のサイズのブロックに関連する決定されたパーティションパターンに基づいて、第２のサイズの深度ブロックに関するパーティションパターンを決定することができ、第１のサイズが第２のサイズよりも小さい。ビデオコーダは、決定されたパーティションパターンに基づいて、第２のサイズの深度ブロックをイントラ予測コーディングする（たとえば、符号化または復号する）ことができる。いくつかの例では、ビデオコーダは、第２のサイズの深度ブロックサブブロック（たとえば、深度ブロック内のブロック）のパーティションパターンからのパーティションパターンを利用することができる。一例として、第２のサイズの深度ブロックはＮ×Ｎブロックであり得、サブブロックはＭ×Ｍブロックであり得、ＭがＮよりも小さく、Ｎ×Ｎブロック内にある。

[0033]いくつかの例では、特定のブロックサイズに関して記憶されるためにビデオコーダが必要とするパーティションパターンの数は、特定のブロックサイズの深度ブロックに関するパーティションパターンが、より小さいサイズのブロックに関連するパーティションパターンから決定される場合には（すなわち、それに基づいて）減らされ得る。たとえば、ビデオコーダは、より小さいサイズのブロックに関連するパーティションパターンを記憶し、そして後に、より小さいサイズのブロックの記憶されたパーティションパターンから、より大きいサイズのブロックに関するパーティションパターンを決定することができる。

[0034]たとえば、以前にビデオコーダが第１のサイズの深度ブロックに関するＹ個のパーティションパターンと、第２のサイズの深度ブロックに関するＸ個のパーティションパターンとを記憶しており、第１のサイズが第２のサイズよりも小さいと仮定する。この例では、ビデオコーダは、第２のサイズのブロックに関するパーティションパターンを決定するためにＹ個のパーティションパターンを使用することができるので、ビデオコーダは、第２のサイズの深度ブロックに関するＸ個のパーティションパターンよりも少ないパーティションパターンを記憶する必要があり得る。

[0035]第１のサイズのブロックに関するパーティションパターンからは決定できない第２のサイズのブロックに関連するパーティションパターンがいくつかあることも考えられ得る。したがって、いくつかの例では、ビデオコーダは依然として、第２のサイズの深度ブロックに関するいくつかの（たとえば、少なくとも１つの）パーティションパターンを記憶し得るが、記憶される必要のあるパーティションパターンの数は、従来の技法と比較して減らされ得る。いくつかの例では、ビデオコーダは、第２の、より大きいサイズのブロックに関するパーティションパターンをまったく記憶せず、代わりに、第１の、より小さいサイズのブロックに関するパーティションパターンから、第２の、より大きいサイズのブロックに関するパーティションパターンを決定することがある。

[0036]図１は、深度コーディングのための本開示の技法を利用し得る例示的なビデオ符号化および復号システム１０を示すブロック図である。図１に示すように、システム１０は、宛先デバイス１４によって後で復号されるべき符号化ビデオデータを提供するソースデバイス１２を含む。特に、ソースデバイス１２は、コンピュータ可読媒体１６を介してビデオデータを宛先デバイス１４に提供する。ソースデバイス１２および宛先デバイス１４は、デスクトップコンピュータ、ノートブック（すなわち、ラップトップ）コンピュータ、タブレットコンピュータ、セットトップボックス、いわゆる「スマート」フォンなどの電話ハンドセット、いわゆる「スマート」パッド、テレビジョン、カメラ、ディスプレイデバイス、デジタルメディアプレーヤ、ビデオゲーム機、ビデオストリーミングデバイスなどを含む、広範囲にわたるデバイスのいずれかを備え得る。場合によっては、ソースデバイス１２および宛先デバイス１４は、ワイヤレス通信に対する機能を備え得る。

[0037]宛先デバイス１４は、コンピュータ可読媒体１６を介して、復号されるべき符号化ビデオデータを受信することができる。コンピュータ可読媒体１６は、ソースデバイス１２から宛先デバイス１４に符号化ビデオデータを移動することができる、任意のタイプの媒体またはデバイスを備え得る。一例では、コンピュータ可読媒体１６は、ソースデバイス１２が符号化ビデオデータを宛先デバイス１４にリアルタイムで直接送信するのを可能にするための通信媒体を備え得る。

[0038]符号化ビデオデータは、ワイヤレス通信プロトコルなどの通信標準規格に従って変調され、宛先デバイス１４に送信され得る。通信媒体は、無線周波（ＲＦ）スペクトルまたは１つもしくは複数の物理伝送線路など、任意のワイヤレスまたはワイヤード通信媒体を備え得る。通信媒体は、ローカルエリアネットワーク、ワイドエリアネットワーク、またはインターネットなどのグローバルネットワークなどのパケットベースのネットワークの一部を形成し得る。通信媒体は、ルータ、スイッチ、基地局、またはソースデバイス１２から宛先デバイス１４への通信を容易にするために有用であり得る任意の他の機器を含み得る。

[0039]いくつかの例では、符号化データは、出力インターフェース２２からストレージデバイスへ出力され得る。同様に、符号化データは、ストレージデバイスから入力インターフェースによってアクセスされ得る。ストレージデバイスは、ハードドライブ、Ｂｌｕｅ−ｒａｙディスク、ＤＶＤ、ＣＤ−ＲＯＭ、フラッシュメモリ、揮発性もしくは不揮発性のメモリ、または符号化ビデオデータを記憶するための任意の他の適切なデジタル記憶媒体など、様々な分散されたまたはローカルにアクセスされるデータ記憶媒体のいずれかを含み得る。さらなる例では、ストレージデバイスは、ソースデバイス１２によって生成された符号化ビデオを記憶することができるファイルサーバまたは別の中間ストレージデバイスに対応し得る。

[0040]宛先デバイス１４は、ストリーミングまたはダウンロードを介して、ストレージデバイスから記憶されたビデオデータにアクセスすることができる。ファイルサーバは、符号化ビデオデータを記憶でき、符号化ビデオデータを宛先デバイス１４に送信できる、任意のタイプのサーバとすることができる。例示的なファイルサーバは、（たとえば、ウェブサイト用の）ウェブサーバ、ＦＴＰサーバ、ネットワークアタッチドストレージ（ＮＡＳ）デバイス、またはローカルディスクドライブを含む。宛先デバイス１４は、インターネット接続を含む、任意の標準データ接続を介して、符号化ビデオデータにアクセスすることができる。これは、ファイルサーバ上に記憶された符号化ビデオデータにアクセスするのに適した、ワイヤレスチャネル（たとえば、Ｗｉ−Ｆｉ（登録商標）接続）、ワイヤード接続（たとえば、ＤＳＬ、ケーブルモデムなど）、またはその両方の組合せを含み得る。ストレージデバイスからの符号化ビデオデータの送信は、ストリーミング送信、ダウンロード送信、またはその組合せとすることができる。

[0041]本開示の技法は、ワイヤレス応用またはワイヤレス設定に必ずしも制限されない。本技法は、無線テレビジョンブロードキャスト、ケーブルテレビジョン送信、衛星テレビジョン送信、ＨＴＴＰ上の動的適応ストリーミング（ＤＡＳＨ：dynamic adaptive streaming over HTTP）などのインターネットストリーミングビデオ送信、データ記憶媒体上に符号化されたデジタルビデオ、データ記憶媒体上に記憶されたデジタルビデオの復号、または他の応用例など、様々なマルチメディア応用のいずれかをサポートするビデオコーディングに適用され得る。いくつかの例では、システム１０は、ビデオストリーミング、ビデオ再生、ビデオブロードキャスト、および／またはビデオ電話などの応用をサポートするために一方向または双方向のビデオ送信をサポートするように構成され得る。

[0042]図１の例では、ソースデバイス１２は、ビデオソース１８と、ビデオエンコーダ２０と、出力インターフェース２２とを含む。宛先デバイス１４は、入力インターフェース２８と、ビデオデコーダ３０と、ディスプレイデバイス３２とを含む。本開示によれば、ソースデバイス１２のビデオエンコーダ２０は、マルチビューコーディングにおける動きベクトル予測のための技法を適用するように構成され得る。他の例では、ソースデバイスおよび宛先デバイスは他の構成要素または構成を含み得る。たとえば、ソースデバイス１２は、外部カメラなどの外部のビデオソース１８からビデオデータを受信し得る。同様に、宛先デバイス１４は、集積ディスプレイデバイスを含むのではなく、外部のディスプレイデバイスとインターフェースしてもよい。

[0043]図１の図示のシステム１０は一例にすぎない。本開示による技法は、任意のデジタルビデオ符号化および／または復号デバイスによって実行され得る。概して、本開示の技法はビデオ符号化デバイスおよびビデオ復号デバイスによって実行されるが、本技法は、一般に「コーデック」と呼ばれるビデオエンコーダ／デコーダによって実行されてもよい。その上、本開示の技法は、ビデオプリプロセッサによって実行されてもよい。ソースデバイス１２および宛先デバイス１４は、宛先デバイス１４に送信するためのコーディングされたビデオデータをソースデバイス１２が生成するコーディングデバイスの例にすぎない。いくつかの例では、デバイス１２、１４は、デバイス１２、１４の各々がビデオ符号化構成要素とビデオ復号構成要素とを含むように、実質的に対称の形で動作することができる。したがって、システム１０は、たとえば、ビデオストリーミング、ビデオ再生、ビデオブロードキャスト、またはビデオ電話のためのビデオデバイス１２、１４の間の一方向または双方向のビデオ送信をサポートし得る。

[0044]ソースデバイス１２のビデオソース１８は、ビデオカメラなどのビデオキャプチャデバイス、前にキャプチャされたビデオを含んでいるビデオアーカイブ、および／またはビデオコンテンツプロバイダからビデオを受信するためのビデオフィードインターフェースを含み得る。さらなる代替案として、ビデオソース１８は、ソースビデオとしてコンピュータグラフィックスベースのデータまたは、生ビデオと、アーカイブされたビデオと、コンピュータ生成ビデオとの組合せを生成することができる。場合によっては、ビデオソース１８がビデオカメラである場合、ソースデバイス１２および宛先デバイス１４は、いわゆるカメラ付き電話またはビデオ付き電話を形成し得る。しかしながら、上記で述べたように、本開示で説明する技法は、一般にビデオコーディングに適用可能であり、ワイヤレスおよび／またはワイヤードの応用例に適用され得る。各場合において、キャプチャされたビデオ、前にキャプチャされたビデオ、またはコンピュータ生成ビデオは、ビデオエンコーダ２０によって符号化され得る。次いで、符号化ビデオ情報は、出力インターフェース２２によってコンピュータ可読媒体１６に出力され得る。

[0045]コンピュータ可読媒体１６は、ワイヤレスブロードキャストまたはワイヤードネットワーク送信などの一時媒体、またはハードディスク、フラッシュドライブ、コンパクトディスク、デジタルビデオディスク、Ｂｌｕ−ｒａｙ（登録商標）ディスク、または他のコンピュータ可読媒体などの記憶媒体（すなわち、非一時的記憶媒体）を含み得る。いくつかの例では、ネットワークサーバ（図示せず）は、たとえば、ネットワーク送信を介して、ソースデバイス１２から符号化ビデオデータを受信し、宛先デバイス１４に符号化ビデオデータを提供することができる。同様に、ディスクスタンピング設備など、媒体製造設備のコンピューティングデバイスは、ソースデバイス１２から符号化ビデオデータを受信し、その符号化ビデオデータを含んでいるディスクを生成することができる。したがって、様々な例では、コンピュータ可読媒体１６は、様々な形態の１つまたは複数のコンピュータ可読媒体を含むと理解され得る。

[0046]本開示では、概して、ビデオエンコーダ２０が、ある情報をビデオデコーダ３０などの別のデバイスに「シグナリング」することに言及することがある。ただし、ビデオエンコーダ２０は、いくつかのシンタックス要素をビデオデータの様々な符号化部分に関連付けることによって情報をシグナリングし得ることを理解されたい。すなわち、ビデオエンコーダ２０は、ビデオデータの様々な符号化部分のヘッダにいくつかのシンタックス要素を格納することによって、データを「シグナリング」することができる。場合によっては、そのようなシンタックス要素は、ビデオデコーダ３０によって受信され、復号されるより前に、符号化され、記憶され（たとえば、コンピュータ可読媒体１６に記憶され）得る。したがって、「シグナリング」という用語は全般に、圧縮されたビデオデータを復号するためのシンタックスまたは他のデータの通信を、そのような通信がリアルタイムで発生するか、またはほぼリアルタイムで発生するか、またはある期間にわたって発生するかにかかわらず指すことがあり、ある期間にわたる通信は、シンタックス要素を符号化の時点で媒体に記憶し、次いで、シンタックス要素がこの媒体に記憶された後の任意の時点で復号デバイスによって取り出され得るときに、発生し得る。

[0047]宛先デバイス１４の入力インターフェース２８はコンピュータ可読媒体１６から情報を受信する。コンピュータ可読媒体１６の情報は、ビデオエンコーダ２０によって定義され、またビデオデコーダ３０によって使用される、ブロックおよび他のコーディングされたユニット、たとえば、ＧＯＰの特性および／または処理を記述するシンタックス要素を含む、シンタックス情報を含み得る。ディスプレイデバイス３２は、復号されたビデオデータをユーザに表示し、陰極線管（ＣＲＴ）、液晶ディスプレイ（ＬＣＤ）、プラズマディスプレイ、有機発光ダイオード（ＯＬＥＤ）ディスプレイ、または別のタイプのディスプレイデバイスなどの様々なディスプレイデバイスのうちのいずれかを備え得る。

[0048]図１には示されないが、いくつかの態様では、ビデオエンコーダ２０およびビデオデコーダ３０は、それぞれオーディオエンコーダおよびオーディオデコーダと統合されてよく、共通のデータストリームまたは別個のデータストリーム中のオーディオとビデオの両方の符号化を処理するための、適切なＭＵＸ−ＤＥＭＵＸユニット、または他のハードウェアおよびソフトウェアを含み得る。適用可能な場合、ＭＵＸ−ＤＥＭＵＸユニットは、ＩＴＵＨ．２２３マルチプレクサプロトコル、またはユーザデータグラムプロトコル（ＵＤＰ）などの他のプロトコルに準拠し得る。

[0049]ビデオエンコーダ２０およびビデオデコーダ３０はそれぞれ、適用可能なとき、１つまたは複数のマイクロプロセッサ、デジタル信号プロセッサ（ＤＳＰ）、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、ディスクリート論理回路、ソフトウェア、ハードウェア、ファームウェア、またはそれらの任意の組合せのような、種々の好適なエンコーダまたはデコーダ回路のいずれかとして実装され得る。ビデオエンコーダ２０およびビデオデコーダ３０の各々は１つまたは複数のエンコーダまたはデコーダ中に含まれ得、そのいずれもが合成ビデオエンコーダ／デコーダ（コーデック）の一部として組み込まれ得る。ビデオエンコーダ２０および／またはビデオデコーダ３０を含むデバイスは、集積回路、マイクロプロセッサ、および／または携帯電話のようなワイヤレス通信デバイスを備え得る。

[0050]ビデオコーディング規格の一例としては、ＪｏｉｎｔＶｉｄｅｏＴｅａｍ（ＪＶＴ）として知られる共同パートナーシップの成果として、ＩＳＯ／ＩＥＣＭｏｖｉｎｇＰｉｃｔｕｒｅＥｘｐｅｒｔｓＧｒｏｕｐ（ＭＰＥＧ）とともにＩＴＵ−ＴＶｉｄｅｏＣｏｄｉｎｇＥｘｐｅｒｔｓＧｒｏｕｐ（ＶＣＥＧ）によって策定されたＩＴＵ−ＴＨ．２６４／ＭＰＥＧ−４（ＡＶＣ）規格がある。別のビデオコーディング規格は、それのスケーラブルビデオコーディング（ＳＶＣ）およびマルチビュービデオコーディング（ＭＶＣ）拡張を含む、Ｈ．２６４規格を含む。Ｈ．２６４規格は、ＩＴＵ−ＴＳｔｕｄｙＧｒｏｕｐによるＩＴＵ−Ｔ勧告Ｈ．２６４、ＡｄｖａｎｃｅｄＶｉｄｅｏＣｏｄｉｎｇｆｏｒｇｅｎｅｒｉｃａｕｄｉｏｖｉｓｕａｌｓｅｒｖｉｃｅｓに記載されている。ＪｏｉｎｔＶｉｄｅｏＴｅａｍ（ＪＶＴ）はＨ．２６４／ＭＰＥＧ−４ＡＶＣへの拡張に取り組み続けている。ＭＶＣの最新のジョイントドラフトは、「Ａｄｖａｎｃｅｄｖｉｄｅｏｃｏｄｉｎｇｆｏｒｇｅｎｅｒｉｃａｕｄｉｏｖｉｓｕａｌｓｅｒｖｉｃｅｓ」、ＩＴＵ−Ｔ勧告Ｈ．２６４、２０１０年３月に記載されている。

[0051]いくつかの例では、ビデオエンコーダ２０およびビデオデコーダ３０は、高効率ビデオコーディング（ＨＥＶＣ）規格およびＨＥＶＣ規格の拡張に従って動作し得、ＨＥＶＣテストモデル（ＨＭ）に準拠し得る。ＨＥＶＣが、ＩＴＵ−ＴＶｉｄｅｏＣｏｄｉｎｇＥｘｐｅｒｔｓＧｒｏｕｐ（ＶＣＥＧ）とＩＳＯ／ＩＥＣＭｏｔｉｏｎＰｉｃｔｕｒｅＥｘｐｅｒｔｓＧｒｏｕｐ（ＭＰＥＧ）とのＪｏｉｎＣｏｌｌａｂｏｒａｔｉｏｎＴｅａｍｏｎＶｉｄｅｏＣｏｄｉｎｇ（ＪＣＴ−ＶＣ）によって開発された。ＨＥＶＣの最近のドラフトは、ｈｔｔｐ：／／ｐｈｅｎｉｘ．ｉｎｔ−ｅｖｒｙ．ｆｒ／ｊｃｔ／ｄｏｃ＿ｅｎｄ＿ｕｓｅｒ／ｄｏｃｕｍｅｎｔｓ／１２＿Ｇｅｎｅｖａ／ｗｇ１１／ＪＣＴＶＣ−Ｌ１００３−ｖ１４．ｚｉｐから入手可能である。ＨＥＶＣ規格化の取組みは、ＨＥＶＣテストモデル（ＨＭ）と呼ばれるビデオコーディングデバイスの発展的モデルに基づいていた。ＨＭは、たとえばＩＴＵ−ＴＨ．２６４／ＡＶＣに従う既存のデバイスに対する、ビデオコーディングデバイスの複数の追加能力を仮定する。たとえば、Ｈ．２６４は９個のイントラ予測符号化モードを提供するが、ＨＭは３５個ものイントラ予測符号化モードを提供し得る。

[0052]概して、ＨＭの作業モデルは、ビデオピクチャ（または「フレーム」）が、ルーマサンプルとクロマサンプルの両方を含む一連のツリーブロックまたは最大コーディングユニット（ＬＣＵ）に分割され得ることを記述する。ビットストリーム内のシンタックスデータが、ピクセルの数に関して最大のコーディングユニットであるＬＣＵのサイズを定義し得る。スライスは、コーディング順序での、いくつかの連続するツリーブロックを含む。ピクチャは、１つまたは複数のスライスに区分され得る。各ツリーブロックは、４分木に従ってコーディングユニット（ＣＵ）に分割され得る。一般に、４分木データ構造は、１ＣＵあたり１つのノードを含み、ルートノードがツリーブロックに対応する。ＣＵが４つのサブＣＵに分割される場合には、ＣＵに対応するノードは、４つのリーフノードを含み、リーフノードの各々がサブＣＵのうちの１つに対応する。

[0053]４分木データ構造の各ノードは、対応するＣＵのシンタックスデータを提供し得る。たとえば、４分木中のノードは、そのノードに対応するＣＵがサブＣＵに分割されるのかどうかを示す分割フラグを含むことができる。ＣＵのシンタックス要素は、再帰的に定義され得、ＣＵがサブＣＵに分割されるかどうかに依存することができる。ＣＵがさらに分割されない場合、そのＣＵはリーフＣＵと呼ばれる。本開示では、元のリーフＣＵの明示的な分割が存在しない場合でも、リーフＣＵの４つのサブＣＵもリーフＣＵと呼ばれる。たとえば、１６×１６サイズのＣＵがさらに分割されない場合、４つの８×８サブＣＵも、１６×１６ＣＵが分割されなくても、リーフＣＵと呼ばれる。

[0054]ＣＵは、ＣＵがサイズの特異性を有しないことを別にすれば、Ｈ．２６４規格のマクロブロックと同様の目的を有する。たとえば、ツリーブロックは、（サブＣＵとも呼ばれる）４つの子ノードに分割されてよく、各子ノードは、今度は親ノードとなり、別の４つの子ノードに分割されてよい。４分木のリーフノードと呼ばれる、最後の分割されていない子ノードは、リーフＣＵとも呼ばれるコーディングノードを備える。コーディングされたビットストリームに関連するシンタックスデータは、最大ＣＵ深度と呼ばれる、ツリーブロックが分割され得る最大回数を定義することができ、コーディングノードの最小サイズを定義することもできる。それに応じて、ビットストリームは最小コーディングユニット（ＳＣＵ）を定義することもできる。本開示は、「ブロック」という用語を、ＨＥＶＣのコンテキストにおいてＣＵ、ＰＵ、またはＴＵのうちのいずれか、または他の規格のコンテキストにおいて類似のデータ構造（たとえば、Ｈ．２６４／ＡＶＣのマクロブロックおよびそのサブブロック）を指すために使用する。

[0055]ＣＵは、コーディングノードと、コーディングノードに関連付けられた予測ユニット（ＰＵ）および変換ユニット（ＴＵ）とを含む。ＣＵのサイズは、コーディングノードのサイズに対応し、形状において正方形でなければならない。ＣＵのサイズは、８×８ピクセルから、６４×６４ピクセル以上の最大値を有するツリーブロックのサイズまでに及び得る。各ＣＵは、１つまたは複数のＰＵと１つまたは複数のＴＵとを包含し得る。ＣＵに関連付けられたシンタックスデータは、たとえば、１つまたは複数のＰＵへのＣＵの区分を記述することができる。区分モードは、ＣＵがスキップモード符号化もしくは直接モード符号化されるのか、イントラ予測モード符号化されるのか、またはインター予測モード符号化されるのかの間で異なる可能性がある。ＰＵは、形状において非正方形に区分され得る。ＣＵに関連付けられたシンタックスデータは、たとえば、４分木に従う１つまたは複数のＴＵへのＣＵの区分を記述することもできる。ＴＵは、形状において正方形または非正方形（たとえば、長方形）とすることができる。

[0056]ＨＥＶＣ規格は、ＣＵごとに異なり得る、ＴＵに従う変換を可能にする。ＴＵは、通常、区分されたＬＣＵについて定義される所与のＣＵ内のＰＵのサイズに基づくサイズを与えられるが、必ずそうなっているとは限らない。ＴＵは、通常、ＰＵ以下のサイズである。いくつかの例では、ＣＵに対応する残差サンプルは、「残差４分木」（ＲＱＴ）として知られている４分木構造を使用して、より小さいユニットに副分割され得る。ＲＱＴのリーフノードは、変換ユニット（ＴＵ）と呼ばれる場合がある。ＴＵに関連付けられたピクセル差分値は、変換係数を生成するために変換され得、変換係数は量子化され得る。

[0057]リーフＣＵは、１つまたは複数の予測ユニット（ＰＵ）を含むことができる。一般に、ＰＵは、対応するＣＵのすべてまたは一部分に対応する空間的エリアを表し、ＰＵの参照サンプルを取り出すためのデータを含むことができる。さらに、ＰＵは、予測に関するデータを含む。たとえば、ＰＵがイントラモード符号化（たとえば、イントラ予測符号化）されるとき、ＰＵのデータは、残差４分木（ＲＱＴ）に含まれ得、このＲＱＴは、ＰＵに対応するＴＵのイントラ予測モードを記述するデータを含むことができる。別の例として、ＰＵがインターモード符号化（たとえば、インター予測符号化）されるとき、ＰＵは、ＰＵの１つまたは複数の動きベクトルを定義するデータを含み得る。ＰＵの動きベクトルを定義するデータは、たとえば、動きベクトルの水平成分、動きベクトルの垂直成分、動きベクトルの解像度（たとえば、１／４ピクセル精度または１／８ピクセル精度）、動きベクトルが指す参照ピクチャ、および／または動きベクトル用の参照ピクチャリスト（たとえば、ＲｅｆＰｉｃＬｉｓｔ０またはＲｅｆＰｉｃＬｉｓｔ１）を記述することができる。

[0058]１つまたは複数のＰＵを有するリーフＣＵは、１つまたは複数の変換ユニット（ＴＵ）をも含むことができる。変換ユニットは、上述したように、（ＴＵ４分木構造とも呼ばれる）ＲＱＴを使用して指定され得る。たとえば、分割フラグは、リーフＣＵが４つの変換ユニットに分割されるのかどうかを示すことができる。その場合に、各変換ユニットは、さらなるサブＴＵにさらに分割され得る。ＴＵがさらに分割されないとき、そのＴＵはリーフＴＵと呼ばれることがある。一般に、イントラコーディングの場合、リーフＣＵに属するすべてのリーフＴＵは同じイントラ予測モードを共有する。すなわち、同じイントラ予測モードが、概して、リーフＣＵのすべてのＴＵの予測値を計算するために適用される。イントラコーディングの場合、ビデオエンコーダ２０は、イントラ予測モードを使用して各リーフＴＵの残差値を、ＴＵに対応するＣＵの一部分と元のブロックとの間の差分として計算し得る。ＴＵは、必ずしもＰＵのサイズに制限されるとは限らない。したがって、ＴＵは、ＰＵよりも大きくまたは小さくなり得る。イントラコーディング（たとえば、イントラ予測コーディング）の場合、ＰＵは、同じＣＵの対応するリーフＴＵとコロケートされ得る。いくつかの例では、リーフＴＵの最大サイズは、対応するリーフＣＵのサイズに対応することができる。

[0059]さらに、リーフＣＵのＴＵは、残差４分木（ＲＱＴ）と呼ばれるそれぞれの４分木データ構造にも関連付けられ得る。すなわち、リーフＣＵは、そのリーフＣＵがＴＵにどのように区分されるのかを示す４分木を含むことができる。ＴＵ４分木のルートノードは、一般に、リーフＣＵに対応し、ＣＵ４分木のルートノードは、一般に、ツリーブロック（またはＬＣＵ）に対応する。分割されないＲＱＴのＴＵは、リーフＴＵと呼ばれる。一般に、本開示は、別段に記載されていない限り、ＣＵおよびＴＵという用語を、それぞれ、リーフＣＵおよびリーフＴＵを指すために使用する。

[0060]ビデオシーケンスは、一般に一連のピクチャを含む。本明細書で説明する「ピクチャ」および「フレーム」という用語は互換的に使用され得る。すなわち、ビデオデータを含んでいるピクチャは、ビデオフレームまたは単に「フレーム」と呼ばれることがある。ピクチャグループ（ＧＯＰ）は、概して、ビデオピクチャのうちの一連の１つまたは複数を備える。ＧＯＰは、ＧＯＰ中に含まれるいくつかのピクチャを記述するシンタックスデータを、ＧＯＰのヘッダ中、ピクチャのうちの１つもしくは複数のヘッダ中、または他の場所に含み得る。ピクチャの各スライスは、それぞれのスライスのための符号化モードを記述するスライスシンタックスデータを含み得る。ビデオエンコーダ２０は、一般に、ビデオデータを符号化するために、個々のビデオスライス内のビデオブロックに作用する。ビデオブロックはＣＵ内のコーディングノードに対応する場合がある。ビデオブロックは、固定サイズまたは可変サイズを有することができ、指定されたコーディング規格に従ってサイズが異なり得る。

[0061]例として、ＨＭは、様々なＰＵサイズでの予測をサポートする。特定のＣＵのサイズが２Ｎ×２Ｎであると仮定すると、ＨＭは、２Ｎ×２ＮまたはＮ×ＮのＰＵサイズでのイントラ予測と、２Ｎ×２Ｎ、２Ｎ×Ｎ、Ｎ×２Ｎ、またはＮ×Ｎの対称ＰＵサイズでのインター予測とをサポートする。ＨＭは、２Ｎ×ｎＵ、２Ｎ×ｎＤ、ｎＬ×２Ｎ、およびｎＲ×２ＮのＰＵサイズでのインター予測のための非対称区分をもサポートする。非対称区分では、ＣＵの一方の方向は、区分されず、他方の方向は、２５％と７５％とに区分される。ＣＵのうちで２５％パーティションに対応する部分は、「ｎ」とそれに続く「Ｕｐ（上）」、「Ｄｏｗｎ（下）」、「Ｌｅｆｔ（左）」、または「Ｒｉｇｈｔ（右）」の表示とによって示される。したがって、たとえば、「２Ｎ×ｎＵ」は、上部で２Ｎ×０．５ＮＰＵ、および下部で２Ｎ×１．５ＮＰＵに水平に区分される２Ｎ×２ＮＣＵを指す。

[0062]本開示では、「Ｎ×Ｎ（NxN）」および「Ｎ×Ｎ（N by N）」は、垂直寸法および水平寸法の観点からビデオブロックのピクセル寸法、たとえば、１６×１６（16x16）ピクセルまたは１６×１６（16 by 16）ピクセルを指すために互換的に使用され得る。一般に、１６×１６ブロックは、垂直方向に１６ピクセルを有し（ｙ＝１６）、水平方向に１６ピクセルを有する（ｘ＝１６）。同様に、Ｎ×Ｎブロックは、一般に、垂直方向にＮピクセル、水平方向にＮピクセルを有し、Ｎが非負の整数値を表す。ブロック中のピクセルは、行および列に配列され得る。さらに、ブロックは、必ずしも、水平方向において垂直方向と同じ数のピクセルを有するとは限らない。たとえば、ブロックはＮ×Ｍピクセルを備え得、この場合、Ｍは必ずしもＮに等しいとは限らない。

[0063]ＣＵのＰＵを使用したイントラ予測コーディングまたはインター予測コーディングに続いて、ビデオエンコーダ２０は、ＣＵのＴＵに関する残差データを計算することができる。ＰＵは、（ピクセル領域とも呼ばれる）空間領域において予測ピクセルデータを生成する方法またはモードを記述するシンタックスデータを備えることができ、ＴＵは、残差ビデオデータに対する変換、たとえば離散コサイン変換（ＤＣＴ）、整数変換、ウェーブレット変換、または概念的に同様の変換の適用に続く変換領域での係数を備えることができる。残差データは、符号化されていないピクチャのピクセルとＰＵに対応する予測値との間のピクセル差分に対応することができる。ビデオエンコーダ２０は、ＣＵに関する残差データを含むＴＵを形成し、次いで、ＣＵに関する変換係数を生成するためにＴＵを変換することができる。

[0064]変換係数を生成するためのすべての変換に続いて、ビデオエンコーダ２０は、変換係数の量子化を実行することができる。量子化は、一般に、係数を表すために使用されるデータの量をできるだけ低減するために、変換係数が量子化され、さらなる圧縮を実現するプロセスを指す。量子化プロセスは、係数の一部またはすべてに関連付けられたビット深度を低減し得る。たとえば、ｎビット値は、量子化中にｍビット値に切り捨てられ得、ここで、ｎはｍよりも大きい。

[0065]量子化の後に、ビデオエンコーダ２０は、変換係数を走査して、量子化変換係数を含む２次元行列から１次元ベクトルを生成し得る。走査は、アレイの前部により高いエネルギー（したがって、より低い周波数）係数を配置し、アレイの後部により低いエネルギー（したがって、より高い周波数）係数を配置するように設計され得る。

[0066]いくつかの例では、ビデオエンコーダ２０は、エントロピー符号化され得るシリアル化ベクトルを生成するために、量子化変換係数を走査するために所定の走査順序を利用し得る。他の例では、ビデオエンコーダ２０は、適応走査を実行することができる。量子化変換係数を走査して１次元ベクトルを形成した後に、ビデオエンコーダ２０は、たとえば、コンテキスト適応型可変長コーディング（ＣＡＶＬＣ：context-adaptive variable length coding）、コンテキスト適応型バイナリ算術コーディング（ＣＡＢＡＣ：context-adaptive binary arithmetic coding）、シンタックスベースコンテキスト適応型バイナリ算術コーディング（ＳＢＡＣ：syntax-based context-adaptive binary arithmetic coding）、確率間隔区分エントロピー（ＰＩＰＥ：Probability Interval Partitioning Entropy）コーディング、または別のエントロピー符号化方法に従って、１次元ベクトルをエントロピー符号化し得る。ビデオエンコーダ２０は、ビデオデータを復号する際のビデオデコーダ３０による使用のために、符号化ビデオデータに関連付けられたシンタックス要素をエントロピー符号化することもできる。

[0067]ビデオエンコーダ２０は、さらに、ブロックベースのシンタックスデータ、ピクチャベースのシンタックスデータ、およびＧＯＰベースのシンタックスデータなどのシンタックスデータを、たとえば、ピクチャヘッダ、ブロックヘッダ、スライスヘッダ、またはＧＯＰヘッダ中でビデオデコーダ３０に送り得る。ＧＯＰシンタックスデータは、それぞれのＧＯＰ中のピクチャの数を記述し得、ピクチャシンタックスデータは、対応するピクチャを符号化するために使用される符号化／予測モードを示し得る。

[0068]ビデオデコーダ３０は、ビデオデータを復号し、ピクチャを再構成するために、ビデオエンコーダ２０が符号化目的で利用したのとは逆の手順を一般に実行するように構成され得る。たとえば、ビデオデコーダ３０は、シグナリングされたビットストリームからシンタックス要素とビデオデータとを受信することができ、ピクチャを再構成するためにビデオデータをイントラ予測復号および／またはインター予測復号するために、逆の動作を実行することができる。

[0069]上記の説明は、ビデオエンコーダ２０およびビデオデコーダ３０がＨＥＶＣ規格に基づいてビデオデータを符号化および復号することができる例示的な方法を提供している。本開示で説明する技法では、ビデオエンコーダ２０およびビデオデコーダ３０は、３次元（３Ｄ）ビデオ符号化および復号のために構成され得る。たとえば、ビデオエンコーダ２０およびビデオデコーダ３０は、ＨＥＶＣビデオコーディング規格を活用する開発中のビデオコーディング規格を使用する３Ｄビデオ符号化および復号のために構成され得る。ただし、本開示で説明する技法は、そのように限定されず、他の３Ｄビデオ符号化および復号技法に拡張され得る。

[0070]ＪＣＴ−３Ｖでは、マルチビュー拡張（ＭＶ−ＨＥＶＣ）および３Ｄビデオ拡張（３Ｄ−ＨＥＶＣ）と呼ばれる、開発中の２つのＨＥＶＣ拡張がある。３Ｄ−ＨＥＶＣのための最新の参照ソフトウェア３Ｄ−ＨＴＭバージョン８．０が、２０１４年１０月１３日時点では以下のリンクからダウンロードされ得る。［３Ｄ−ＨＴＭバージョン８．０］：ｈｔｔｐｓ：／／ｈｅｖｃ．ｈｈｉ．ｆｒａｕｎｈｏｆｅｒ．ｄｅ／ｓｖｎ／ｓｖｎ＿３ＤＶＣＳｏｆｔｗａｒｅ／ｔａｇｓ／ＨＴＭ−８．０／。最新のワーキングドラフト（文書番号：Ｅ１００１（ＪＣＴ３Ｖ−Ｅ１００１））は、以下から入手できる。ｈｔｔｐ：／／ｐｈｅｎｉｘ．ｉｔ−ｓｕｄｐａｒｉｓ．ｅｕ／ｊｃｔ２／ｄｏｃ＿ｅｎｄ＿ｕｓｅｒ／ｄｏｃｕｍｅｎｔｓ／５＿Ｖｉｅｎｎａ／ｗｇ１１／ＪＣＴ３Ｖ−Ｅ１００１−ｖ３．ｚｉｐ（ただし、このリンクは無効になる可能性がある）。ＪＣＴ３Ｖ−Ｅ１００１文書は、Ｓｕｌｌｉｖａｎらによる「３Ｄ−ＨＥＶＣＤｒａｆｔＴｅｘｔ１」と題するものであり、同じく２０１４年１０月１３日時点ではｈｔｔｐ：／／ｐｈｅｎｉｘ．ｉｔ−ｓｕｄｐａｒｉｓ．ｅｕ／ｊｃｔ２／ｄｏｃ＿ｅｎｄ＿ｕｓｅｒ／ｃｕｒｒｅｎｔ＿ｄｏｃｕｍｅｎｔ．ｐｈｐ？ｉｄ＝１３６１から入手可能である。

[0071]一般に、３Ｄビデオコーディング技法を使用してコーディングされたビデオデータは、３次元効果を生成するためにレンダリングされ、表示され得る。たとえば、（たとえば、わずかに異なる水平位置を有する２つのカメラパースペクティブに対応する）異なるビューの２つの画像は、一方の画像が閲覧者の左眼によって見られ、他方の画像が閲覧者の右眼によって見られるように、実質的に同時に表示され得る。

[0072]この３Ｄ効果は、たとえば、立体視（stereoscopic）ディスプレイまたは自動立体視（autostereoscopic）ディスプレイを使用して達成され得る。立体視ディスプレイは、２つの画像を相応にフィルタ処理するアイウェア（eyewear）とともに使用され得る。たとえば、パッシブ眼鏡は、正しい眼が正しい画像を閲覧することを保証するために偏光レンズまたは異なる色のレンズを使用して画像をフィルタ処理し得る。アクティブ眼鏡は、別の例として、立体視ディスプレイと協調して交互のレンズを迅速に閉じ得、それにより、左眼画像を表示することと右眼画像を表示することとを交互に行い得る。自動立体視ディスプレイは、眼鏡が必要とされないような方法で２つの画像を表示する。たとえば、自動立体視ディスプレイは、各画像が閲覧者の適切な眼に投影されるように構成されたミラーまたはプリズムを含み得る。

[0073]３Ｄビデオコーディングでは、複数のビューが存在し、各ビューは、テクスチャピクチャおよび深度ピクチャ、または単にテクスチャコンポーネントおよび深度マップと呼ばれる複数のピクチャを含む。各テクスチャコンポーネントは、１つの深度マップに対応し得る。テクスチャコンポーネントは、画像コンテンツを含むことができ、対応する深度マップは、テクスチャ中のピクセルの相対深度を示す。実質的に同時に表示されるべき異なるビューのテクスチャコンポーネントは、同様の画像コンテンツを含むが、異なるビューのテクスチャ中のオブジェクト間に水平視差がある。テクスチャおよび深度マップについて以下でより詳細に説明する。

[0074]３Ｄ−ＨＥＶＣでは、アクセスユニットが、実質的に同時に表示されるべきテクスチャピクチャとそれらの対応する深度ピクチャとを含む。各ビュー中のテクスチャピクチャおよび深度ピクチャは、どのビューにピクチャが属するかを識別するための一意のビュー識別子（ビューｉｄ）またはビュー順序インデックスを有する。しかしながら、同じビューの深度ピクチャおよびテクスチャピクチャは、異なるレイヤ識別子（レイヤｉｄ）を有することがある。

[0075]本開示の技法は、テクスチャコンポーネントと深度マップとをコーディングすることによって３Ｄビデオデータをコーディングすることに関する。概して、「テクスチャ」という用語は、画像のルミナンス（輝度または「ルーマ」）値と画像のクロミナンス（色または「クロマ」）値とを表すために使用される。いくつかの例では、テクスチャ画像（すなわち、テクスチャピクチャ）は、１セットのルミナンスデータと、青色相（Ｃｂ）および赤色相（Ｃｒ）のための２セットのクロミナンスデータとを含む場合がある。４：２：２または４：２：０などの特定のクロマフォーマットでは、クロマデータは、ルーマデータに対してダウンサンプリングされる。言い換えれば、クロミナンスピクセルの空間解像度は、対応するルミナンスピクセルの空間解像度よりも低い（たとえば、ルミナンス解像度の１／２または１／４）ことがある。

[0076]深度データは、一般に、対応するテクスチャデータについての深度値を記述する。たとえば、深度画像（たとえば、深度ピクチャ）は、対応するテクスチャピクチャの対応するテクスチャデータについての深度をそれぞれ記述する深度ピクセルのセットを含む場合がある。深度データは、対応するテクスチャデータについての水平視差を決定するために使用され得る。したがって、テクスチャデータと深度データとを受信するデバイスは、一方のビュー（たとえば、左眼ビュー）のための第１のテクスチャピクチャを表示し、深度値に基づいて決定された水平視差値だけ第１のピクチャのピクセル値をオフセットすることによって、他方のビュー（たとえば、右眼ビュー）のための第２のテクスチャピクチャを生成するように第１のテクスチャピクチャを変更するために深度データを使用することができる。一般に、水平視差（または単に「視差」）は、右ビュー中の対応するピクセルに対する第１のビュー中のピクセルの水平空間オフセットを表し、２つのピクセルは、２つのビュー中で表される同じオブジェクトの同じ部分に対応する。

[0077]さらに他の例では、画像プレーンに直交するｚ次元におけるピクセルについて深度データが定義され得、その結果、画像について定義されたゼロ視差プレーンに対して、所与のピクセルに関連付けられた深度が定義される。そのような深度は、ピクセルを表示するための水平視差を作成するために使用され得、その結果、ピクセルは、ゼロ視差プレーンに対するピクセルのｚ次元深度値に応じて、左眼と右眼で異なるように表示される。ゼロ視差プレーンはビデオシーケンスの異なる部分に対して変化する場合があり、ゼロ視差プレーンに対する深度の量も変化する場合がある。ゼロ視差プレーン上に位置するピクセルは、左眼と右眼とに対して同様に定義され得る。ゼロ視差プレーンの前に位置するピクセルは、ピクセルが画像プレーンに直交するｚ方向の画像から出てくるように見える知覚を作成するように、（たとえば、水平視差を用いて）左眼と右眼とに対して異なるロケーションに表示され得る。ゼロ視差プレーンの後ろに位置するピクセルは、深度をわずかに知覚する程度に、わずかなぼかしとともに表示されてよく、または（たとえば、ゼロ視差プレーンの前に位置するピクセルの水平視差とは反対の水平視差を用いて）左眼と右眼とに対して異なるロケーションに表示され得る。他の多くの技法も、画像の深度データを伝達または定義するために使用され得る。

[0078]２次元ビデオデータは、概して、その各々が特定の時間インスタンスに対応する、個別ピクチャのシーケンスとしてコーディングされる。すなわち、各ピクチャは、シーケンス中の他の画像の再生時間に対する関連する再生時間を有する。これらのピクチャはテクスチャピクチャまたはテクスチャ画像と考えられ得る。深度ベースの３Ｄビデオコーディングでは、シーケンス中の各テクスチャピクチャは（深度マップとも呼ばれる）深度ピクチャにも対応し得る。すなわち、テクスチャピクチャに対応する深度マップは、対応するテクスチャピクチャのための深度データを表す。マルチビュービデオデータは、様々な異なるビューのためのデータを含んでよく、各ビューは、テクスチャピクチャと、対応する深度ピクチャとのそれぞれのシーケンスを含み得る。

[0079]上述したように、ピクチャは特定の時間インスタンスに対応し得る。ビデオデータは、アクセスユニットのシーケンスを使用して表され得、各アクセスユニットは、特定の時間インスタンスに対応するすべてのデータを含む。したがって、たとえば、マルチビュービデオデータ＋深度の場合、共通時間インスタンスについての各ビューからのテクスチャピクチャ＋テクスチャピクチャの各々についての深度マップはすべて、特定のアクセスユニット内に含まれ得る。アクセスユニットは、テクスチャピクチャに対応するテクスチャコンポーネントのためのデータと、深度マップに対応する深度コンポーネントのためのデータとを含み得る。

[0080]このようにして、３Ｄビデオデータは、キャプチャまたは生成されたビュー（テクスチャコンポーネント）が対応する深度マップに関連する、マルチビュービデオ＋深度フォーマットを使用して表され得る。その上、３Ｄビデオコーディングでは、テクスチャコンポーネントおよび深度マップはコーディングされ、３Ｄビデオビットストリーム中に多重化され得る。深度マップはグレースケール画像としてコーディングされ得、深度マップの「ルーマ」サンプル（すなわち、ピクセル）は深度値を表す。一般に、深度データのブロック（深度マップのサンプルのブロック）は深度ブロックと呼ばれることがある。深度値は、深度サンプルに関連するルーマ値を指すことがある。

[0081]いずれの場合も、イントラコーディングおよびインターコーディング方法（たとえば、イントラ予測符号化および復号ならびにインター予測符号化および復号の技法）が深度マップコーディングに適用され得る。たとえば、上述したように、深度マップは、対応するテクスチャピクチャについての深度値を示すが、ビデオエンコーダ２０およびビデオデコーダ３０は、深度マップがグレースケール画像として形成されるので、ビデオコーディング技法を使用して深度マップを符号化および復号することができ、深度マップのルーマサンプルは、対応するテクスチャピクチャ中の対応するピクセルの相対深度を示す。

[0082]深度マップは、通常、シャープエッジと定数領域とを含み、深度マップ中のエッジは、一般に、対応するテクスチャピクチャの対応するテクスチャデータとの強い相関を提示する。テクスチャと対応する深度との間の異なる統計値および相関により、異なるコーディング方式が、２Ｄビデオコーデックに基づく深度マップのために設計されており、設計され続ける。たとえば、ベースＨＥＶＣ規格において利用可能なものと比べて、深度マップをビデオコーディングするための、テクスチャと対応する深度との間の異なる統計値と相関とを活用する追加のビデオコーディング方式があり得る。

[0083]一例として、現在のＨＥＶＣ規格では、各予測ユニット（ＰＵ）のルーマ成分のためのイントラ予測技法は、（２から３４までインデックス付けされた）３３個の角度予測モードと、（１によりインデックス付けされた）ＤＣモードと、（０によりインデックス付けされた）平面モードとを利用することができる。図２は、方向性イントラ予測モードに関連する予測方向を概して示している。たとえば、上述のように、ＨＥＶＣ規格は、平面モード（モード０）と、ＤＣモード（モード１）と、３３個の方向性予測モード（モード２〜３４）とを含む、３５個のイントラ予測モードを含み得る。平面モードの場合、いわゆる「平面」関数を使用して予測が実行される。（たとえば、ＤＣ予測値を生成するための）ＤＣモードの場合、ブロック内のピクセル値の平均化に基づいて予測が実行され得る。方向性予測モードの場合、（そのモードによって示される）特定の方向に沿った隣接ブロックの再構成されたピクセルに基づいて予測が実行される。概して、図２に示されている矢印の末端は、値がそこから取り出される隣接ピクセルのうちの相対的な１つを表し、矢印のヘッドは、予測ブロックを形成するために取り出された値が伝搬される方向を表す。

[0084]３Ｄ−ＨＥＶＣ規格は、イントラ予測モードの、ＨＥＶＣ規格と同じ定義を使用する。さらに、３Ｄ−ＨＥＶＣは、深度マップの深度スライスの深度ブロック（たとえば、予測ユニット）をイントラ予測符号化または復号するために、ＨＥＶＣイントラ予測モードとともに深度モデリングモード（ＤＭＭ）を導入した。ＤＭＭは、深度マップのインター予測コーディング（符号化または復号）のための深度マップにおけるシャープエッジの表現に、より適している。

[0085]３Ｄ−ＨＥＶＣワーキングドラフトのいくつかの先行バージョンは、４つのＤＭＭモード、すなわち、モード１（明示的ウェッジレットシグナリング）と、モード２（イントラ予測ウェッジレット区分）と、モード３（コンポーネント間ウェッジレット区分）と、モード４（コンポーネント間輪郭区分）とを提供している。すべての４つのモードにおいて、ビデオエンコーダ２０またはビデオデコーダ３０などのビデオコーダは、ＤＭＭパターンによって指定された２つの領域に深度ブロックを区分することができ、各領域が定数値によって表される。ＤＭＭパターンは、明示的にシグナリングされる（モード１）か、空間的に隣接するブロックによって予測される（モード２）か、またはコロケートテクスチャブロックを使用して予測される（モード３およびモード４）かのいずれかであり得る。

[0086]３Ｄ−ＨＥＶＣワーキングドラフトのいくつかのバージョンは、ＤＭＭモード２を除去し、ＤＭＭモード１、３および４を残した。３Ｄ−ＨＥＶＣワーキングドラフトのいくつかのバージョンは、ＤＭＭモード３も除去し、ＤＭＭモード１および４を残した。

[0087]言い換えれば、ＤＭＭに新しいイントラ予測モードがある。これらのモードにおいて、ビデオエンコーダ２０およびビデオデコーダ３０は、（パーティションパターンと呼ばれる）ＤＭＭパターンによって指定された２つの領域に深度ブロックを区分するように構成され得、各領域が定数値によって表される。たとえば、ビデオエンコーダ２０は、深度ブロックをイントラ予測符号化するために異なるパーティションパターン（パーティションパターンの例は上述している）を使用し、どのパーティションパターンが（たとえば、圧縮およびビデオ品質の点で）最適なコーディングをもたらしたかを決定するように構成され得る。その場合に、ビデオエンコーダ２０は、決定されたパーティションパターンを使用して深度ブロックをイントラ予測符号化することができる。ビデオデコーダ３０は、深度ブロックをイントラ予測復号するために、ビデオエンコーダ２０とは逆のプロセスを実行するので、ビデオデコーダ３０は、深度ブロックをイントラ予測復号するために、ビデオエンコーダ２０が決定したのと同じパーティションパターンを決定するように構成され得る。

[0088]ビデオエンコーダ２０は、深度モデリングモードを示す情報をビデオデコーダ３０にシグナリングすることができ、ビデオデコーダ３０は、深度モデリングモードを示すシグナリングされた情報から、パーティションパターンを決定することができる。たとえば、深度モデリングモードが１（ＤＭＭモード１）であることを示す情報をビデオエンコーダ２０がシグナリングした場合、ビデオデコーダ３０は、深度ブロックに関するパーティションパターンを識別するビデオエンコーダ２０からの情報のビットストリームをパースするように構成され得る。言い換えれば、ＤＭＭモード１が使用されるべきであるとビデオエンコーダ２０が決定した場合、ビデオエンコーダ２０は、ＤＭＭモードが使用されることを示す情報を明示的にシグナリングし、深度ブロックに関するパーティションパターンを識別するためにビデオデコーダ３０が使用する情報をシグナリングすることができる。このようにして、深度ブロックをイントラ予測コーディングするためにビデオエンコーダ２０およびビデオデコーダ３０が使用するパーティションパターン（たとえば、ＤＭＭパターン）は同じとなる。

[0089]ＤＭＭモード３および４の場合、ビデオエンコーダ２０は、ＤＭＭモードがモード３または４であることを示す情報をシグナリングし得るが、深度ブロックに関するパーティションパターンを識別する情報をシグナリングしないことがある。むしろ、ビデオデコーダ３０は、対応するテクスチャピクチャ中のコロケートテクスチャブロックから、深度ブロックに関するパーティションパターンを決定するように構成され得る。ビデオエンコーダ２０およびビデオデコーダ３０はそれぞれ、ＤＭＭモード３の場合に対応するテクスチャピクチャ中のコロケートテクスチャブロックからパーティションパターン（たとえば、ＤＭＭパターン）を決定するための同じプロセスを実施するように構成され、ＤＭＭモード４の場合に対応するテクスチャピクチャ中のコロケートテクスチャブロックからパーティションパターン（たとえば、ＤＭＭパターン）を決定するための同じプロセスを実施するように構成され得る。

[0090]ウェッジレット区分と輪郭区分とを含む、ＤＭＭにおいて定義されている２つのタイプの区分モードがある。図３Ａおよび図３Ｂは、深度モデリングモード（ＤＭＭ）の例を示す概念図である。図３Ａは、８×８ブロックに関するウェッジレットパターンの一例を示し、図３Ｂは、８×８ブロックに関する輪郭パターンの例上に示す。

[0091]図３Ａは、たとえば、ウェッジレット区分を使用して区分された深度ブロック１１０を示し、図３Ｂは、別の例として、輪郭区分を使用して区分された深度ブロック１３０を示す。３Ｄ−ＨＥＶＣは、深度スライスのイントラ予測ユニットをコーディングするために、イントラ予測モードとともに、ブロックを区分するための深度モデリングモード（ＤＭＭ）のための技法を含む。ＨＴＭバージョン３．１は、場合によっては深度マップ中のよりシャープなエッジをより良く表し得る、深度マップのイントラコーディングのためのＤＭＭ方法を適用する。

[0092]ウェッジレット区分と輪郭区分とを含む、ＤＭＭにおいて定義されている２つの区分モデルがある。この場合も、図３Ａはウェッジレット区分の一例を示しており、図３Ｂは輪郭区分の一例を示している。深度ブロック１１０および１３０内の各個々の正方形は、それぞれ、深度ブロック１１０および１３０のそれぞれの個々のピクセルを表す。正方形内の数値は、対応するピクセルが領域１１２（図３Ａの例における値「０」）に属するのか、領域１１４（図３Ａの例における値「１」）に属するのかを表す。また、図３Ａにおいて、ピクセルが領域１１２（白い正方形）に属するのか、領域１１４（灰色の影つき正方形）に属するのかを示すために陰影が使用される。

[0093]各パターン（すなわち、ウェッジレットと輪郭の両方）は、対応するサンプル（すなわち、ピクセル）が領域Ｐ₁に属するのかＰ₂に属するのか（Ｐ₁は図３Ａ中の領域１１２と図３Ｂ中の領域１３２とに対応し、Ｐ₂は図３Ａ中の領域１１４と図３Ｂ中の領域１３４Ａ、１３４Ｂとに対応する）を標示するサイズｕ_B×ｖ_B２進数字のアレイによって画定され得、ｕ_Bおよびｖ_Bはそれぞれ、現在のＰＵの水平サイズおよび垂直サイズを表す。図３Ａおよび図３Ｂの例では、ＰＵは、それぞれブロック１１０および１３０に対応する。ビデオエンコーダ２０およびビデオデコーダ３０などのビデオコーダは、コーディングの開始（たとえば、符号化の開始または復号の開始）時に、ウェッジレットパターンを初期化し得る。

[0094]図３Ａの例に示すように、ウェッジレット区分の場合、深度ブロック１１０は、（Ｘｓ，Ｙｓ）に位置する開始点１１８と（Ｘｅ，Ｙｅ）に位置する終了点１２０とをもつ直線１１６によって２つの領域、すなわち、領域１１２と領域１１４とに区分される。図３Ａの例では、開始点１１８は点（８，０）として定義され得、終了点１２０は点（０，８）として定義され得る。

[0095]図３Ｂの例に示すように、輪郭区分の場合、深度ブロック１３０などの深度ブロックは２つの不規則形状領域に区分され得る。図３Ｂの例では、深度ブロック１３０は領域１３２と領域１３４Ａ、１３４Ｂとに区分される。領域１３４Ａ中のピクセルは領域１３４Ｂ中のピクセルに直接隣接しないが、領域１３４Ａおよび１３４Ｂは、深度ブロック１３０のＰＵを予測する目的で１つの単一の領域を形成するように画定される。輪郭区分は、ウェッジレット区分よりもフレキシブルであるが、シグナリングすることが相対的により困難であり得る。ＤＭＭモード４では、３Ｄ−ＨＥＶＣの場合、輪郭区分パターンは、コロケートテクスチャブロックの再構成されたルーマサンプルを使用して暗黙的に導出される。

[0096]このようにして、ビデオエンコーダ２０およびビデオデコーダ３０などのビデオコーダは、深度ブロック１１０のピクセルが（領域「Ｐ₁」と呼ばれることもある）領域１１２に属するのか、（領域「Ｐ₂」と呼ばれることもある）領域１１４に属するのかを決定するために、開始点１１８と終了点１２０とによって画定された線１１６を使用し得る。同様に、ビデオコーダは、深度ブロック１３０のピクセルが（領域「Ｐ₁」と呼ばれることもある）領域１３２に属するのか、（領域「Ｐ₂」と呼ばれることもある）領域１３４に属するのかを決定するために、図５Ｂの線１３６、１３８を使用し得る。領域「Ｐ１」および「Ｐ２」は、ＤＭＭに従って区分された異なる領域のためのデフォルト命名規則であり、したがって、深度ブロック１１０の領域Ｐ₁は、深度ブロック１３０の領域Ｐ₁と同じ領域と考えられるべきでない。

[0097]上記のように、ＤＭＭの各々は、ＤＭＭがウェッジレット区分を使用するのかまたは輪郭区分を使用するのか、およびパターンが明示的にシグナリングされるのかまたは暗黙的に決定されるのかによって定義され得る。ＤＭＭプロセスは、（図２に示す）ＨＥＶＣにおいて指定されたイントラ予測モードの代替として組み込まれ得る。ＤＭＭが適用されるのかまたは従来のイントラ予測が適用されるのかを指定するために、ＰＵごとに１ビットフラグがシグナリングされ得る。

[0098]図３Ａおよび図３Ｂに示すように、Ｎ×Ｎパーティションパターンは、Ｎ×Ｎ２進ブロックを示す。本開示では、Ｎ×Ｎ２進ブロックの位置（ｉ，ｊ）における値は、位置（ｉ，ｊ）におけるパーティションパターンのパーティション値と呼ばれ、ｉ，ｊ＝０，１，．．．，Ｎ−１である。Ｎ×Ｎパーティションパターンの位置ごとに、２進数字値は、現在の位置のパーティション（０または１）を示す。

[0099]たとえば、図３Ａは、線形線（たとえば、直線１１６）が深度ブロック１１０を二等分するウェッジレットパターンの一例を示している。ただし、多くの異なるウェッジレットパターンがあり得る。たとえば、図３Ａに示すような、（０，８）から開始して（８，０）において終了する線形線ではなく、別の例では、（１，８）から開始して（８，１）において終了する線形線も可能である。ウェッジレットパターンのさらに多くのそのような例があり得る。

[0100]一般に、ウェッジレットパターンの数は、ブロックサイズの関数であり得る。たとえば、より大きいサイズの深度ブロックは、より小さいサイズの深度ブロックよりも多くの開始点と終了点とを含み、これは、より大きいサイズの深度ブロックの場合にはより小さいサイズの深度ブロックの場合よりも多くの可能なウェッジレットパターンがあることを意味する。

[0101]初期化中、ビデオコーダ（たとえば、ビデオエンコーダ２０およびビデオデコーダ３０）は、すべての利用可能なウェッジレットパターンを生成することができ、ウェッジレットパターンリストを構成する。この目的で、開始点位置および終了点位置のすべての可能な組合せのウェッジレットパターンが生成され、ビデオコーダは、コーディングプロセスの前にブロックサイズごとに開始点位置と終了点位置とをルックアップテーブルに記憶する。深度ブロックのイントラ予測にどのウェッジレットパターンを使用すべきかをビデオエンコーダ２０が識別する例では、ビデオエンコーダ２０は、ウェッジレットパターンのルックアップテーブルへのインデックスをシグナリングすることができ、このインデックスは、深度ブロックをイントラ予測符号化するためにビデオエンコーダ２０が使用したウェッジレットパターンを識別する。ビデオデコーダ３０は、初期化中にビデオデコーダ３０が構成したウェッジレットパターンのルックアップテーブルへのインデックスを受信する。次いでビデオデコーダ３０は、インデックスによって識別されたウェッジレットパターンを決定し、深度ブロックのイントラ予測復号にそのウェッジレットパターンを使用することができる。このようにして、ビデオエンコーダ２０およびビデオデコーダ３０は、それぞれ、イントラ予測符号化およびイントラ予測復号に同じウェッジレットパターンを利用することができる。

[0102]開始点位置および終了点位置の可能な組合せは、開始点位置と終了点位置とをつなぐパーティション境界線の方位に応じて、６つのカテゴリーに分類され得る。たとえば、深度ブロックを二等分する線形線が、最上行から左列、最下行、または右列に延び得る。深度ブロックを二等分する線形線が、左列から最下行または右列に延び得る（最上行への延びは、先行事例ですでにカバーされている）。深度ブロックを二等分する線形線が、最下行から右列に延び得る（他は、先行事例ですでにカバーされている）。この方法では、深度ブロックを二等分する線形線のための６つのカテゴリーがある。これらの６つのカテゴリーを以下の表１に記載する。

[0103]Ｎ×Ｎウェッジレットパーティションパターンを生成するにあたり、開始点（ｘＳ，ｙＳ）および終了点（ｘＥ，ｙＥ）位置を仮定すると、ビデオエンコーダ２０およびビデオデコーダ３０は最初に、すべてのサンプルが０に初期化された一時的Ｋ×Ｋパーティションパターンを生成し、ここで、１／２サンプル（１／２ピクセル）精度の場合にＫは２Ｎに等しく、他の場合にＫはＮに等しい。ビデオエンコーダ２０およびビデオデコーダ３０は、（ｘＳ，ｙＳ）と（ｘＥ，ｙＥ）とをつなぐパーティション境界線を形成するサンプルを１に設定し、一時的パーティションパターンを２つの部分（たとえば、図４に示すような部分Ａおよび部分Ｂ）として分割することができる。

[0104]図４Ａ〜図４Ｆは、一時的パーティションパターンの例を示す概念図である。たとえば、図４Ａ〜図４Ｆは、パーティション境界線（すなわち、深度ブロックを二等分する線形線）によって分割される２つの部分を示している。

[0105]ビデオエンコーダ２０およびビデオデコーダ３０が一時的パーティションパターンを２つの部分として分割した後、ビデオエンコーダ２０およびビデオデコーダ３０は、パーティション１となる２つの部分のうちの１つを選択する。ビデオエンコーダ２０およびビデオデコーダ３０は、ウェッジレットパターン境界線の方位に基づいて、部分のうちのどちらがパーティション１となるかを選択するように構成され得る。ビデオエンコーダ２０およびビデオデコーダ３０は、同じ方法で部分のうちのどちらがパーティション１となるかを選択するように構成されるので、ビデオエンコーダ２０およびビデオデコーダ３０は、パーティション１となる同じ部分を選択する。また、他方の部分（すなわち、パーティション１ではないパーティション）はデフォルトによってパーティション０となるので、ビデオエンコーダ２０およびビデオデコーダ３０は、パーティション０となる同じ部分を選択する。

[0106]上述のように、表１によって示されるように、ウェッジレットパターンの２つのパーティションに深度ブロックを二等分する線形線の６つの方位があり得る。図４Ａ〜図４Ｆは、そのような方位の例を示している。図４Ａ〜図４Ｆはそれぞれ、それぞれの方位の一例を示しており、他の例もあり得ることを理解されたい。たとえば、図４Ｂは、方位１の場合であり、上記の表１は、方位１が右列から最上行までであることを示している。図４Ｂでは、線形線は（８，５）から開始し、（４，０）において終了する。方位１の別の例では、線形線は（８，７）から開始し、（１，０）において終了し得る。

[0107]下記の表２は、ビデオエンコーダ２０およびビデオデコーダ３０がパーティション境界の方位に基づいて、どちらの部分がパーティション１となるかを選択する方法を示している。たとえば、ビデオエンコーダ２０およびビデオデコーダ３０は最初に、パーティション境界の方位（すなわち、深度ブロックを二等分する線形線の方位）を決定することができる。次いで、ビデオエンコーダ２０およびビデオデコーダ３０は、二等分線形線によって作成された２つのパーティションのうちのどちらのパーティションが１と識別されるべきか、またどちらのパーティションが０と識別されるべきかを決定することができる。

[0108]一例として、表２に示すように、方位パーティション境界が０である場合、ビデオエンコーダ２０およびビデオデコーダ３０は、１により識別されるパーティションとして部分Ａを選択する。図４Ａは、Ａと標示されたパーティションが１と識別されることになり、Ｂと標示されたパーティションが０と識別されることになる一例を示している。ただし、図４Ａは方位パーティション境界１の一例であり、方位パーティション境界１の他の例がある。ビデオエンコーダ２０およびビデオデコーダ３０は、表２に記載の基準に基づいて方位１〜５の場合に、どちらのパーティションが１と識別され、どちらのパーティションが０と識別されるかを決定するための同様の機能を実行することができる。

[0109]図４Ａ〜図４Ｆに示す例では、線形線は深度ブロック内のピクセル（たとえば、サンプル）から開始し、深度ブロック内のピクセル（たとえば、サンプル）において終了する。そのような例では、線形線は、フルサンプル精度を有すると考えられ得る。しかしながら、本開示で説明する技法は、そのように限定されない。たとえば、技法は、１／２サンプル精度または場合によっては１／４サンプル精度に拡張され得る。

[0110]１／２サンプル精度の場合、ビデオエンコーダ２０およびビデオデコーダ３０は、ｂＰａｔｔｅｒｎと呼ばれるＮ×Ｎパーティションパターンを、一時的Ｋ×Ｋ（Ｋ＝２Ｎ）パーティションパターンｂＴｅｍｐＰａｔｔｅｒｎのダウンサンプリングされたバージョンとして生成することができる。この例では、ｂＰａｔｔｅｒｎ［ｉ］［ｊ］＝ｂＴｅｍｐＰａｔｔｅｒｎ［ｍ］［ｎ］であり、ｉ，ｊ＝０，１，．．．，Ｎ−１、そしてｍ，ｎ＝０，１，．．．，２Ｎ−１である。本開示では、一時的Ｋ×Ｋパーティションパターンは、開始位置（ｘＳ，ｙＳ）と終了位置（ｘＥ，ｙＥ）とを有するこのＮ×Ｎパーティションパターンの対応するウェッジレットパターンと呼ばれ、この対応するウェッジレットパターンは、開始位置（２×ｘＳ，２×ｙＳ）と終了位置（２×ｘＥ，２×ｙＥ）とを有するサイズ２Ｎ×２Ｎを有する。１／２サンプル精度のために、２×ｘＳ、２×ｙＳ、２×ｘＥおよび２×ｙＥは整数であるが、ｘＳ、ｙＳ、ｘＥ、およびｙＥは分数であり得る。（ｉ，ｊ）と（ｍ，ｎ）との間のマッピングは、パーティション境界線の方位に依存する。技法は、１／４サンプル精度の場合も同様に拡張され得る。

[0111]以下では、１／２サンプル精度の場合のパーティションパターンを生成する例について説明する。例示のために、例は、方位０および方位１に関して説明される。

[0112]図５Ａおよび図５Ｂは、１／２サンプル精度のパーティションパターンサンプルのマッピングを示す概念図である。たとえば、図５Ａおよび図５Ｂは、（たとえば、１／２サンプル精度の）２Ｎ×２ＮパーティションパターンサンプルからＮ×Ｎパーティションパターンサンプルへのマッピングを示している。図５Ａは、開始点が最上行にあり、終了点が左列にある方位０の例を示している。図５Ｂは、開始点が右列にあり、終了点が最上行にある方位１の例を示している。

[0113]図５Ａおよび図５Ｂでは、影つきブロックは、ダウンサンプリングされたＮ×Ｎパーティションパターンのサンプルを示している。たとえば、図５Ａおよび図５Ｂにおけるブロックは、サイズが２Ｎ×２Ｎであり、図５Ａおよび図５Ｂでは、影つきサンプルは、２Ｎ×２Ｎブロックにおいて１つおきのサンプルを示し、結果的にＮ×Ｎブロックとなる。

[0114]いくつかの例では、方位０を有するウェッジレットパターンを生成するために、ビデオエンコーダ２０およびビデオデコーダ３０は、方位０を有するウェッジレットパターンのすべての可能な開始点と終了点とをカバーするように、開始点（（ｘＳ，ｙＳ））を（０，０）から（２Ｎ−１，０）にループし、終了点（（ｘＥ，ｙＥ））を（０，０）から（０，２Ｎ−１）にループすることができる。ビデオエンコーダ２０およびビデオデコーダ３０はまた、方位０の場合にｍ＝２ｉおよびｎ＝２ｊとして、（ｉ，ｊ）を（ｍ，ｎ）にマッピングすることができる。方位１の場合、ビデオエンコーダ２０およびビデオデコーダ３０は、方位１を有するウェッジレットパターンのすべての可能な開始点と終了点とをカバーするように、開始点（（ｘＳ，ｙＳ））を（２Ｎ−１，０）から（２Ｎ−１，２Ｎ−１）にループし、終了点（（ｘＥ，ｙＥ））を（２Ｎ−１，０）から（０，０）にループすることができる。ビデオエンコーダ２０およびビデオデコーダ３０はまた、方位１の場合にｍ＝２ｉ＋１およびｎ＝２ｊとして、（ｉ，ｊ）を（ｍ，ｎ）にマッピングすることができる。

[0115]他の方位の場合、ビデオエンコーダ２０およびビデオデコーダ３０は同様に、方位に基づいて開始点と終了点とをループすることができる。すべての方位のマッピングの式は、ｍ＝２ｉ＋オフセットＸおよびｎ＝２ｊ＋オフセットＹと一般化され得、オフセットＸ、オフセットＹは、表３に指定された移動値である。ビデオエンコーダ２０およびビデオデコーダ３０は、方位の各々のマッピングのために、式＝ｍ＝２ｉ＋オフセットＸおよびｎ＝２ｊ＋オフセットＹを実施することができ、オフセットＸおよびオフセットＹは表３によって定義されている。

[0116]上述のように、初期化中、ビデオエンコーダ２０およびビデオデコーダ３０はそれぞれ、すべてのウェッジレットパターンの開始点および終了点（すなわち、方位ごとに２つのパーティションに深度ブロックを二等分する異なる可能な線形線の開始点および終了点）を含むウェッジレットパターンリストを構成することができる。場合によっては、２つのウェッジレットパターンが同じであり得る。ただし、ビデオエンコーダ２０およびビデオデコーダ３０は、ウェッジレットパターンリストが唯一の固有のパターンを含むように、重複するウェッジレットパターンをウェッジレットパターンリスト初期化プロセス中に除去することができる。

[0117]ウェッジレットパターンリストを生成する際、ウェッジレットパターンを生成するために使用される開始位置および終了位置の解像度は、ブロックサイズに依存する。３２×３２ブロックの場合、可能な開始位置および終了位置は、２サンプルの精度を有するロケーションに制限される。１６×１６ブロックの場合、フルサンプル精度が使用され、４×４および８×８ブロックの場合、１／２サンプル精度が使用される。したがって、異なるブロックサイズで可能なウェッジレットパターンは異なり得る。一般に、可能なウェッジレットパターンの数は、ブロックのサイズに正比例する（すなわち、ブロックサイズが大きくなるほど、ウェッジレットパターンは多くなり、ブロックサイズが小さくなるほど、ウェッジレットパターンは少なくなる）。

[0118]ウェッジレットパターンリスト初期化プロセス中に、重複するウェッジレットパターンをウェッジレットリストに追加するのを回避するために、ビデオエンコーダ２０およびビデオデコーダ３０はそれぞれ、新たに生成されたウェッジレットパターンがリスト中の現在のウェッジレットパターンのいずれかと同じパターンを表していないときのみ、新たに生成されたウェッジレットパターンをウェッジレットリストの終わりに追加することができる。サイズＮ×Ｎの２つのウェッジレットパターン（すなわち、パターンＡ［ｉ］［ｊ］、パターンＢ［ｉ］［ｊ］、ｉ，ｊ＝０，１，．．．，Ｎ−１）を比較するとき、［０，Ｎ−１］の範囲におけるｉおよびｊのすべての可能な組合せにおいて、パターンＡ［ｉ］［ｊ］が常にパターンＢ［ｉ］［ｊ］に等しいか、またはパターンＡ［ｉ］［ｊ］がパターンＢ［ｉ］［ｊ］に等しいことが決してない場合、パターンＡはパターンＢと同じであると考えられる。

[0119]異なるブロックサイズと開始点位置および終了点位置の異なる精度とに起因して、以下の表４に記載のように、異なる数および異なるパターンのウェッジレットパターンが、異なるブロックサイズに利用可能である。より大きいブロックサイズの場合、ウェッジレットパターンの総数は格段に大きいことがあり、パターン生成の記憶要件および複雑性が高まり得る。

[0120]ウェッジレットリスト初期化の詳細なプロセスが、ワーキングドラフトＪＣＴ３Ｖ−Ｅ１００１のＨ．８．４．４．２．１２、Ｈ．８．４．４．２．１２．１およびＨ．８．４．４．２．１２．２に指定されている。上述のように、ＪＣＴ３Ｖ−Ｅ１００１文書は、Ｓｕｌｌｉｖａｎらによる「３Ｄ−ＨＥＶＣＤｒａｆｔＴｅｘｔ１」と題するものであり、２０１４年１０月１３日時点ではｈｔｔｐ：／／ｐｈｅｎｉｘ．ｉｔ−ｓｕｄｐａｒｉｓ．ｅｕ／ｊｃｔ２／ｄｏｃ＿ｅｎｄ＿ｕｓｅｒ／ｃｕｒｒｅｎｔ＿ｄｏｃｕｍｅｎｔ．ｐｈｐ？ｉｄ＝１３６１から入手可能である。

[0121]ブロックサイズ依存型ウェッジレットパターン設計に関するいくつかの問題があり得る。たとえば、大きいブロックサイズの場合、利用可能なウェッジレットパターンの総数は、非常に大きいことがある。表４に示すように、１６×１６のブロックサイズの場合、ウェッジレットパターンの総数は１３９４であり、３２×３２のブロックサイズの場合、ウェッジレットパターンの総数は１５０３である。多数のウェッジレットパターンは、大規模メモリ要件をもたらし、これは望ましくないことがある。言い換えれば、ビデオエンコーダ２０およびビデオデコーダ３０は、ウェッジレットパターンのすべてを記憶するために大きいサイズのメモリを必要とし得る。また、ウェッジレットパターンリストを構成するために、特により大きいブロックサイズの場合には、比較的多数のウェッジレットパターンがあるので、ビデオエンコーダ２０およびビデオデコーダ３０は、ウェッジレットパターンを取り出すためにメモリユニットに対する望ましくない数のメモリ呼出しを必要とし得る。

[0122]この理由（すなわち、多数のパターン）により、ウェッジレットパターンは６４×６４ＰＵの場合にはサポートされない。たとえば、既存のブロックサイズ依存型ウェッジレットパターン設計では、深度ブロックのイントラ予測にウェッジレットパターンを使用することに関連する利益が、６４×６４サイズの深度ブロックに関するウェッジレットパターンの数の多さに圧倒され得る。したがって、６４×６４サイズのブロックに関するウェッジレットパターンに基づくイントラ予測に関連する利益がある場合でも、既存の技法は、６４×６４サイズのブロックに関するウェッジレットパターンに基づくそのようなイントラ予測をサポートしないことがある。

[0123]既存のブロックサイズ依存型ウェッジレットパターン設計に伴う問題の別の例として、３Ｄ−ＨＥＶＣでは、ウェッジレットパターンを生成するプロセスが、特にブロックがより大きいサイズを有するときに複雑であり得る。さらに、３Ｄ−ＨＥＶＣは、ブロックサイズごとに、１セットのウェッジレットパターンが記憶されることを必要とし得る。しかしながら、６４×６４サイズのブロックの場合、ウェッジレットパターンを使用するイントラ予測はサポートされないことがあるので、現在のウェッジレットパターン設計では、６４×６４サイズのブロックに関してウェッジレットパターンが記憶される必要はない。

[0124]既存のブロックサイズ依存型ウェッジレットパターン設計に伴う問題のまた別の例として、ウェッジレットパターンリスト初期化中に、ビデオエンコーダ２０およびビデオデコーダ３０は、重複するウェッジレットパターンを追加するのを回避するために、２つのウェッジレットパターン間でかなりの数の比較計算を実行することを求められ得る。そのような比較計算は、計算の複雑性を高め、ビデオエンコーダ２０またはビデオデコーダ３０にとって望ましくない。

[0125]本開示で説明する技法は、深度イントラコーディングのための簡略化された深度パーティションパターン生成に関する。以下の例では、深度イントラコーディングのためのそのような簡略化された深度パーティションパターン生成のための技法について説明する。以下の例示的な技法は、ビデオエンコーダ２０およびビデオデコーダ３０によって実行され得る。たとえば、ビデオエンコーダ２０および／またはビデオデコーダ３０は、深度データをイントラコーディング（たとえば、それぞれイントラ予測符号化またはイントラ予測復号）することができる。また、例示的な技法が別個に実行されることがあり、または１つもしくは複数の技法が組合せで実行されることがある。

[0126]さらに、簡潔のために、本開示で説明する技法は、ビデオコーダに関して説明され得る。ビデオコーダの例としては、ビデオデータの符号化について説明するときのビデオエンコーダ２０、およびビデオデータの復号について説明するときのビデオデコーダ３０がある。本開示は、「コーディングする」または「コーディング」という用語を使用することもある。この文脈では、コーディングするという用語は、符号化するまたは復号するを総称的に指し得、コーディングという用語は、符号化または復号を総称的に指し得る。たとえば、ビデオコーダはコーディングすることができ、これは、ビデオエンコーダ２０が符号化することができること、またはビデオデコーダ３０が復号することができることを意味する。

[0127]上述のように、既存のブロックサイズ依存型ウェッジレットパターン設計に伴う問題のうちの１つは、より大きいサイズのブロックの場合、ウェッジレットパターンの数があまりにも大きくなって、望ましくない量のメモリを必要とし、計算性の複雑性を高めることである。本開示で説明する技法では、より大きいサイズの深度ブロックに関するウェッジレットパターンに依拠するのではなく、より大きいサイズの深度ブロックに関するウェッジレットパターンが、より小さいサイズのブロックに関するウェッジレットパターンから決定され得る。このようにして、ビデオエンコーダ２０およびビデオデコーダ３０は、より小さいサイズのブロックに関するウェッジレットパターン（たとえば、パーティションパターン）を記憶し、より大きいサイズのブロックに関するウェッジレットパターンをより少なく記憶するか、またはまったく記憶しないことがあり、その理由は、ビデオエンコーダ２０およびビデオデコーダ３０が、より小さいサイズのブロックに関するウェッジレットパターンのうちのウェッジレットパターンから、より大きいサイズの深度ブロックに関するウェッジレットパターンを決定し得ることにある。

[0128]一例として、ビデオエンコーダ２０およびビデオデコーダ３０は、第１のブロックサイズのブロックに関するパーティションパターンリスト（たとえば、ウェッジレットパターンリスト）を構成するように構成され得る。パーティションパターンリストは、第１のブロックサイズのブロックに関連する１つまたは複数のパーティションパターンを含むことができる。第１のブロックサイズよりも大きい第２のブロックサイズの深度ブロックのイントラ予測符号化の場合、ビデオエンコーダ２０は、第１のブロックサイズのブロックに関するパーティションパターンから決定されたパーティションパターン（たとえば、ウェッジレットパターン）を使用して、第２のサイズの深度ブロックをイントラ予測符号化することができる。言い換えれば、ビデオエンコーダ２０は、第１のサイズのブロックに関連するパーティションパターンを使用して、第２のサイズの深度ブロックをイントラ予測符号化することができる。深度モデリングモード（ＤＭＭ）１の場合、ビデオエンコーダ２０は、第１のブロックサイズの１つまたは複数のパーティションパターン関連ブロックを含むパーティションパターンリストへのインデックスをシグナリングすることができる。

[0129]第２のブロックサイズの深度ブロックのイントラ予測復号の場合、ビデオデコーダ３０は、第１のブロックサイズのブロックに関連する１つまたは複数のパーティションパターンを含むパーティションパターンリストへのインデックスを受信することができ、インデックスから第１のサイズのブロックに関連するパーティションパターンを決定することができる。ここでも、パーティションパターンは、復号される深度ブロックの第２のブロックサイズよりも小さい第１のブロックサイズのブロックに関連付けられる。次いでビデオデコーダ３０は、決定されたパーティションパターンから、第２のブロックサイズの深度ブロックに関するパーティションパターンを決定することができる。ビデオデコーダ３０は、決定されたパーティションパターンに基づいて、第２のサイズの深度ブロックをイントラ予測復号することができる。

[0130]上述のように、より大きいサイズのブロックに関するパーティションパターン（たとえば、ウェッジレットパターン）を記憶することは、より大きいサイズのブロックに利用可能なパーティションパターンの数が比較的大きいので、望ましくないことがある。より小さいサイズのブロックに関するパーティションパターンに基づいて、より大きいサイズのブロックに関するパーティションパターンを決定することによって、より大きいサイズのブロックに関して記憶される必要のあるパーティションパターンの数は低減され得る。たとえば、前の例では、ビデオエンコーダ２０およびビデオデコーダ３０は、第１のブロックサイズのブロックに関連する１つまたは複数のパーティションパターンを含むパーティションパターンリストを構成し、第２のより大きいサイズの深度ブロックに関するパーティションパターンを決定するために、パーティションパターンリストからパーティションパターンのうちの１つを使用することができる。したがって、ビデオエンコーダ２０およびビデオデコーダ３０が、第２のサイズのパーティションパターンに関するパーティションパターンリストを構成した場合、より小さいブロックサイズに関するパーティションパターンからパーティションパターンの一部が決定され得るので、パーティションパターンリスト中のパーティションパターンの数は低減されることになる。

[0131]いくつかの例では、ビデオエンコーダ２０およびビデオデコーダ３０は、いくつかのブロックサイズに関するパーティションリストパターンを構成しないこともある。そのような例では、ビデオエンコーダ２０およびビデオデコーダ３０は、ビデオエンコーダ２０およびビデオデコーダ３０がパーティションリストパターンを構成したブロックサイズの深度ブロックに関するパーティションパターンを決定するために、より小さいサイズのブロックに関連するパーティションパターンに依拠し得る。

[0132]また、より大きいブロックサイズの場合は、パーティションパターンリストにより少ないパーティションパターンがあること、またはパーティションパターンがまったくないことがあるので、パーティションパターンを記憶するために必要とされるメモリの量の減少があり得る。その上、より大きいブロックサイズの場合は、パーティションパターンリストにより少ないパーティションパターンがあること、またはパーティションパターンがまったくないことがあるので、パーティションパターンを生成する計算の複雑性および重複がないようにするためにパーティションパターンを比較する複雑性も低減され得る。

[0133]上述のように、より小さいサイズのブロックに関するパーティションパターンに基づいて、より大きいサイズの深度ブロックに関するパーティションパターンを決定することによって、本開示で説明する技法は、メモリ要件を低減し、複雑性を低減することができる。いくつかの例では、より小さいサイズのブロックは、より大きいサイズの深度ブロック内のブロックであり得る。しかしながら、本開示で説明する技法は、そのように限定されない。いくつかの例では、より小さいサイズのブロックは必ずしも、イントラ予測符号化または復号されている実際のブロックである必要はない。そうではなく、より小さいサイズのブロックは、より大きいサイズのブロックに関するパーティションパターンを決定するためにパーティションパターンが使用される概念的ブロックであり得る。

[0134]一例として、イントラ予測符号化または復号される深度ブロックが３２×３２サイズの深度ブロックであると仮定する。この例では、エンコーダ２０は、サイズ１６×１６のブロックに関するパーティションパターンリストへのインデックスをシグナリングすることができる。ビデオデコーダ３０は、サイズ１６×１６のブロックに関するパーティションパターンリストへのインデックスを受信し、サイズ１６×１６のブロックに関するパーティションパターンからパーティションパターンを決定することができる。この例では、ビデオエンコーダ２０とビデオデコーダ３０の両方は、サイズ１６×１６のブロックに関する決定されたパーティションパターンから、３２×３２サイズの深度ブロックに関するパーティションパターンを決定するように構成され得る。一例として、ビデオエンコーダ２０およびビデオデコーダ３０は、３２×３２サイズの深度ブロックに関するパーティションパターンを決定するために、サイズ１６×１６のブロックに関する決定されたパーティションパターンをアップサンプリングすることができる。

[0135]より小さいサイズのブロック（そのパーティションパターンリストを、ビデオエンコーダ２０およびビデオデコーダ３０がより大きいサイズのブロックに関するパーティションパターンを決定するために使用する）は、より大きいサイズのブロックの一部である必要はないが、本開示で説明する技法は、より小さいサイズのブロックがより大きいサイズのブロック内のブロックである例とともに説明される。たとえば、深度コーディング（たとえば、深度ブロックのイントラ予測コーディング）の一例では、パーティションパターンは、ブロックサイズとは無関係である。

[0136]本開示で説明する技法において、ビデオエンコーダ２０およびビデオデコーダ３０が、より大きいサイズのブロックに関するパーティションパターンを決定するための中間ステップとして、より小さいサイズのブロックに関するパーティションパターンを決定し得ることを理解されたい。たとえば、より小さいサイズのブロックは、より小さいサイズのブロックのパーティションパターンに基づいてイントラ予測符号化または復号されないことがある。そうではなく、より小さいサイズのブロックは、より大きいサイズのブロックのイントラ予測の一部としてイントラ予測符号化または復号され得る。

[0137]一例として、現在の深度ブロック（たとえば、現在の深度ＰＵ）はＮ×Ｎのサイズを有すると仮定する。この例では、現在の深度ブロックは、整数個のＭ×Ｍ（Ｍ＜Ｎ）ブロックを含む。一例として、現在の深度ブロック（たとえば、イントラ予測符号化または復号されるべき深度ブロック）が３２×３２サイズのブロックである場合、３２×３２サイズのブロック内に４個の１６×１６サイズのブロック、または３２×３２サイズのブロック内に６４個の４×４サイズのブロックがある。

[0138]いくつかの例では、ビデオエンコーダ２０は、１つの特定のＭ×Ｍブロック（たとえば、Ｍは４に等しい）と、線ベースのパーティションパターン（たとえば、２つのパーティションにＭ×Ｍブロックを二等分する線形線を画定するウェッジレットパターン）とを識別する情報をシグナリングすることができる。ビデオデコーダ３０は、Ｍ×Ｍブロックと線ベースのパーティションパターンとを識別する情報を受信することができる。特定のＭ×Ｍブロックの線ベースのパーティションパターンに基づいて、ビデオエンコーダ２０およびビデオデコーダ３０は、全体的Ｎ×ＮＰＵに関する線ベースのパーティションを決定する（たとえば、導出する）ことができる。言い換えれば、Ｍ×Ｍブロックに関するパーティションパターンに基づいて、ビデオエンコーダ２０およびビデオデコーダ３０は、Ｎ×Ｎ深度ブロック全体に関するパーティションパターンを決定することができ、ここで、Ｎ×Ｎ深度ブロックはＭ×Ｍブロックを含む。

[0139]一例では、線ベースのパーティションパターンは、現在の３Ｄ−ＨＥＶＣの場合のように、特定のＭ×Ｍブロックに適用されるＤＭＭ１のウェッジレットパターンであり得る。たとえば、ビデオエンコーダ２０は、深度モデリングモード（ＤＭＭ）が１であることを示す情報をシグナリングし、Ｎ×Ｎブロック内のＭ×Ｍブロックを識別する情報をシグナリングし、Ｍ×Ｍブロックに関するパーティションパターンを識別するために使用される情報をシグナリングすることができる。（たとえば、サイズＭ×Ｍのブロックに関するパーティションパターンリストへのインデックス値）。ビデオデコーダ３０は、ＤＭＭが１であることを示す情報を受信し、Ｍ×Ｍブロックを識別する受信された情報に基づいてＮ×Ｎブロック内のＭ×Ｍブロックを決定し、（たとえば、サイズＭ×Ｍのブロックに関するパーティションパターンリストへのインデックス値に基づいて）Ｍ×Ｍブロックに関するパーティションパターンを決定することができる。次いでビデオデコーダ３０は、Ｍ×Ｍブロックに関する決定されたパーティションパターンに基づいて、全体的Ｎ×Ｎブロックに関するパーティションパターンを決定することができる。

[0140]本明細書で説明する「全体的」ブロックは、ブロックに含まれ得るサブブロックを含む、ブロック全体を含み得る。したがって、４個のサブブロックを有するブロックの場合、全体的ブロックは、４個のサブブロックのすべてを含むブロック全体を指し得る。

[0141]たとえば、ビデオエンコーダ２０は、イントラ深度符号化（イントラ予測符号化）のためにブロック（たとえば、深度ＰＵであるＮ×Ｎブロック）のサブブロックに関する線ベースのパーティションパターン（たとえば、２つのパーティションにＭ×Ｍブロックを二等分する線形線を画定するウェッジレットパターン）を決定することができ、ここにおいて、サブブロックがブロックよりも小さい。いくつかの例では、ビデオエンコーダ２０は、ブロックのサブブロックに関する線ベースのパーティションパターンを、決定される線ベースのパーティションパターンをブロックのサイズに基づかせることなく（すなわち、ブロックサイズとは無関係に）決定することができる。ビデオエンコーダ２０は、サブブロックに関する線ベースのパーティションパターンに基づいて、ブロックに関する線ベースのパーティションパターンを決定することができる。ビデオエンコーダ２０は、ブロックに関する決定された線ベースのパーティションパターンに基づいて、ブロックをイントラ符号化する（イントラ予測符号化する）ことができる。ビデオエンコーダ２０は、サブブロックに関する線ベースのパーティションパターンを示す情報をシグナリングする（たとえば、サブブロックに関する線ベースのパーティションパターンを示す情報を符号化する）ことができる。いくつかの例では、ビデオエンコーダ２０は、ビデオエンコーダ２０が線ベースのパーティションパターンを決定した、ブロック内のサブブロックを識別するために使用される情報をシグナリングすることができるが、これは、あらゆる例において必要とされるとは限らない。

[0142]ビデオエンコーダ２０は、ブロックに関する線ベースのパーティションパターンを示す情報をシグナリングしないことがある。たとえば、ビデオエンコーダ２０は、ブロックに関する線ベースのパーティションパターンを示す情報を符号化するのを回避すること、または符号化しないことがある。むしろ、ビデオエンコーダ２０は、サブブロックに関する線ベースのパーティションパターンを示す情報をシグナリングすることがある。

[0143]ビデオデコーダ３０は、イントラ深度復号のために（たとえば、イントラ予測復号のために）ブロックのサブブロックに関する線ベースのパーティションパターンを示す情報を受信する（たとえば、サブブロックに関する線ベースのパーティションパターンを示す情報を復号する）ことができる。ビデオデコーダ３０は、サブブロックに関する線ベースのパーティションパターンに基づいて、ブロックに関する線ベースのパーティションパターンを決定することができる。ビデオデコーダ３０は、ブロックに関する決定された線ベースのパーティションパターンに基づいて、ブロックをイントラ復号する（イントラ予測復号する）ことができる。いくつかの例では、ビデオデコーダ３０は、ビデオデコーダ３０によって線ベースのパーティションパターンが受信された、ブロック内のサブブロックを識別するために使用される情報を受信することができるが、これは、あらゆる例において必要とされるとは限らない。ビデオデコーダ３０は、ブロックに関する線ベースのパーティションパターンを示す情報を受信することなく、ブロックに関する線ベースのパーティションパターンを決定することができる。むしろ、ビデオデコーダ３０は、サブブロックから線ベースのパーティションパターンを決定することがある。また、ビデオデコーダ３０は、ブロックに関する線ベースのパーティションパターンを、決定される線ベースのパーティションパターンをブロックのサイズに基づかせることなく（すなわち、ブロックサイズとは無関係に）決定することができる。

[0144]Ｍ×Ｍサブブロックは必ずしも、より大きいＮ×Ｎブロック内に入るブロックである必要はないことを理解されたい。そうではなく、Ｍ×Ｍサブブロックは、Ｎ×Ｎブロックに関する線ベースのパーティションパターンを決定する目的で線ベースのパーティションパターンが使用される概念的ブロックであり得る。言い換えれば、上記の例では、ビデオエンコーダ２０は、第１のサイズ（たとえば、３２×３２）の深度ブロックに関するパーティションパターン（たとえば、ウェッジレットパターンのような線ベースのパーティションパターン）を、第２のより小さいサイズ（たとえば、１６×１６）のブロックに関するパーティションパターンに基づいて決定することができる。ビデオエンコーダ２０は、決定されたパーティションパターンに基づいて深度ブロックをイントラ予測符号化することができる。ビデオデコーダ３０は同様に、第１のサイズ（たとえば、３２×３２）の深度ブロックに関するパーティションパターンを、第２のより小さいサイズ（たとえば、１６×１６）のブロックに関するパーティションパターンに基づいて決定することができる。ここでも、このより小さいサイズのブロックは、ピクチャ中または深度ブロック内の実際のブロックである必要はなく、代わりに、より大きいブロックに関するパーティションパターンを決定するためにパーティションパターンが使用される概念的ブロックである。

[0145]いくつかの例では、ビデオエンコーダ２０は、第２のサイズのブロックに関するパーティションパターンを識別する情報をシグナリングし、ビデオデコーダ３０は、シグナリングされた情報に基づいて第２のサイズのブロックに関するパーティションパターンを決定する。たとえば、ビデオエンコーダ２０は、第２のサイズのパーティションパターンに関するパーティションパターンリストへのインデックスをシグナリングすることができ、インデックスによって識別されるパーティションパターンは、ビデオエンコーダ２０が第１のサイズの深度ブロックに関するパーティションパターンを決定するために利用したパーティションパターンである。ビデオデコーダ３０は、第２のサイズのパーティションパターンに関するパーティションパターンリストへのインデックスを受信し、第２のサイズのブロックに関するパーティションパターンに基づいて、第１のサイズの深度ブロックに関するパーティションパターンを決定することができる。

[0146]上記の例では、より小さいサイズのブロックは概念的ブロックであり、必ずしも、深度ブロックを含むピクチャのブロック、または深度ブロック内のブロックであるとは限らない。ただし、いくつかの例では、より小さいブロックは、より大きいサイズのブロック内のブロックであり得る。より小さいサイズのブロックがより大きいサイズのブロック内のブロックである（たとえば、１６×１６ブロックが、３２×３２ブロック内の４個の１６×１６ブロックのうちの１つである）例では、ビデオエンコーダ２０は、より大きいサイズのブロック中のより小さいサイズのブロックのロケーションを識別する情報をシグナリングすることができる。次いでビデオデコーダ３０は、より小さいサイズのブロックに関するパーティションパターンおよびより大きいサイズのブロック内のより小さいサイズのブロックの位置に基づいて、より大きいサイズのブロックに関するパーティションパターンを決定することができる。たとえば、ビデオデコーダ３０は、より小さいサイズのブロックを二等分する線形線を、より大きいサイズのブロックのエッジに線形線がぶつかるまで、外側に拡張することができる。より大きいサイズのブロックの得られる二等分は、より小さいサイズのブロックのパーティションパターンから決定された、より大きいサイズのブロックに関するパーティションパターンであり得る。

[0147]言い換えれば、ビデオデコーダ３０は、サブブロックに関するパーティションパターンの線形線を深度ブロックの境界まで拡張することができる。得られる線形線は、深度ブロックをイントラ予測復号するために使用される、深度ブロックに関するパーティションパターンであり得る。ビデオエンコーダ２０は同様に、サブブロックに関するパーティションパターンの線形線を深度ブロックの境界まで拡張することができ、得られる線形線は、深度ブロックをイントラ予測符号化するために使用される、深度ブロックに関するパーティションであり得る。

[0148]いくつかの例では、ビデオエンコーダ２０は、より小さいサイズのブロックの位置を識別する情報をシグナリングする必要はないことがある。そのような例では、ビデオデコーダ３０は、ビデオデコーダ３０がより大きいサイズの深度ブロックに関するパーティションパターンを決定するためにパーティションパターンを拡張する際の起点となるブロックとして、所定のより小さいサイズのブロックを使用するように事前構成され得る。

[0149]たとえば、ビデオエンコーダ２０は、ｉおよびｊが０からＮ／Ｍ−１まで（両端の値を含む）の範囲内にある相対水平および垂直インデックス（ｉ，ｊ）とともに、ビデオデコーダ３０が受信する特定のＭ×Ｍブロック（すなわち、サブブロック）のインデックスをシグナリングすることができる。この例では、Ｍ×Ｍブロックの左上位置は（Ｍ×ｉ，Ｎ×ｊ）である。このようにして、ビデオデコーダ３０は、Ｍ×Ｍブロックの位置を決定し、さらに、以下でより詳細に説明するように、線形線を拡張することによって全体的Ｎ×Ｎブロックに関するパーティションパターンを決定することができる。

[0150]ビデオエンコーダ２０およびビデオデコーダ３０は、それぞれ、バイパスモードまたはコンテキストモデリングのいずれかにより、Ｍ×Ｍブロックの位置（ｉ，ｊ）を符号化または復号することができる。言い換えれば、ビデオエンコーダ２０は、線ベースのパーティションパターンが決定されたサブブロックを識別するためにバイパスモードまたはコンテキストモデリングを使用して位置（ｉ，ｊ）を符号化することができ、ビデオデコーダ３０は、線ベースのパーティションパターンが受信されたサブブロックを識別するためにバイパスモードまたはコンテキストモデリングを使用して位置（ｉ，ｊ）を復号することができる。

[0151]代替または追加として、ビデオエンコーダ２０およびビデオデコーダ３０は、現在のＰＵの左境界Ｍ×Ｍブロックまたは下境界Ｍ×Ｍブロックのいずれかにおいて常に開始するように特定のＭ×Ｍブロックを設定するように事前構成され得る。この場合、ビデオエンコーダ２０は、フラグをシグナリングすることができ、たった１つのオフセットがエンコーダによってさらにシグナリングされる。たとえば、この例では、ビデオエンコーダ２０は、線ベースのパーティションパターンが決定されたサブブロックを識別するためのフラグと１つのオフセットとをシグナリングすることができ、ビデオデコーダ３０は、線ベースのパーティションパターンが受信されたサブブロックを識別するためのフラグと１つのオフセットとを受信することができる。

[0152]場合によっては、１つのＮ×Ｎブロック内のＭ×Ｍユニット中の水平および垂直インデックスをシグナリングする代わりに、ビデオエンコーダ２０は、４分木構造によってＭ×Ｍブロックを識別することができ、各レベル表現が、ゼロまたはより多くの「０」と１つの「１」を有し、「１」に達すると終了し、より低いレベルに進む。この例では、ビデオエンコーダ２０は、サブブロックを識別するための情報をシグナリングする必要がないことがあり、ビデオデコーダ３０は、サブブロックを識別するための情報を受信する必要がないことがある。たとえば、ビデオデコーダ３０は同様に、Ｎ×Ｎ深度ブロックに関するパーティションパターンを決定するためにビデオデコーダ３０がパーティションパターンを決定したＭ×Ｍブロックを決定するために、４分木構造を使用することができる。

[0153]いくつかの例では、ビデオエンコーダ２０およびビデオデコーダ３０は、特定のＭ×Ｍブロックの線ベースのパーティションパターンをより大きいＮ×Ｎブロックに拡張することを、利用可能な場合にＮ×Ｎブロック内のすべてのＭ×Ｍブロックのパーティションパターンが全体的ＰＵ（すなわち、全体的深度ブロック）に関する線ベースのパーティションを一緒に形成する方法で、行うことができる。たとえば、特定のＭ×Ｍブロックの右上隅に、Ｎ×Ｎブロック内の別のＭ×Ｍブロックの左下隅がある。いくつかの例では、ビデオエンコーダ２０およびビデオデコーダ３０は、特定のＭ×Ｍブロックを二等分する線形線（たとえば、パーティション線）を、特定のＭ×Ｍブロックの右上隅に連結された他方のブロックを通って拡張することができる。同様に、特定のＭ×Ｍブロックの左下隅に、Ｎ×Ｎブロック内のまた別のＭ×Ｍブロックの右上隅がある。いくつかの例では、ビデオエンコーダ２０およびビデオデコーダ３０は、特定のＭ×Ｍブロックを二等分する線形線（たとえば、パーティション線）を、特定のＭ×Ｍブロックの左下隅に連結された他方のブロックを通って拡張することができる。このようにして、ビデオエンコーダ２０およびビデオデコーダ３０は、特定のＭ×Ｍブロックの線ベースのパーティションを全体的ＰＵに拡張することができる。

[0154]上述のように、ビデオエンコーダ２０およびビデオデコーダ３０は、より小さいサイズのブロックを二等分する線形線を、より大きいサイズの深度ブロックに関するパーティションパターンを決定するためにより大きいサイズのブロックを線形線が二等分するように、拡張するように構成され得る。いくつかの例では、特定のＭ×Ｍの線ベースのパーティションパターンを現在のＰＵに（すなわち、全体的なより大きいサイズの深度ブロックに）拡張するために、ビデオエンコーダ２０およびビデオデコーダ３０は、最初に、パーティション境界線関数ｙ＝ａ×ｘ＋ｂを、Ｍ×Ｍパーティションパターンの（Ｍ×ｉ，Ｍ×ｊ）と開始点位置および終了点位置とによって導出することができ、ａおよびｂがそれぞれ、パーティション境界線の傾きおよび切片を表す。言い換えれば、ビデオエンコーダ２０およびビデオデコーダ３０は、傾き−線の式に基づいて線形線の線−式を決定することができる。パーティション境界線関数により、ビデオエンコーダ２０およびビデオデコーダ３０は、Ｎ×Ｎ２進ブロックである（ｂＰａｔｔｅｒｎと呼ばれる）Ｎ×Ｎパーティションパターンを、ｂＰａｔｔｅｒｎ［ｘ］［ｙ］＝（ｙ−ａ×ｘ）＜ｂ？１：０として導出することができ、ここでｘ，ｙ＝０，１，．．．Ｎ−１である。一例では、さらに、ａおよびｂは整数に丸められる。

[0155]ＤＭＭモード３または４が可能であるとき、特定のＭ×Ｍブロックが、ビデオエンコーダ２０によってシグナリングされ、ビデオデコーダ３０によって受信され得る。さらに、Ｍ×Ｍブロック内で、ビデオエンコーダ２０は線ベースのパーティションパターン（たとえば、ウェッジレットパターン）を、現在の３Ｄ−ＨＥＶＣの場合のように、ビデオエンコーダ２０がＭ×ＭのＰＵ（すなわち、Ｍ×Ｍブロック）に関してＤＭＭモード３でウェッジレットパターンをシグナリングする方法と同様の方法でシグナリングする。この場合、ビデオエンコーダ２０は、Ｍ×ＭのＰＵ（すなわち、Ｍ×Ｍブロック）に対するウェッジレットサブセットインデックスをシグナリングすることができる。

[0156]上述のように、本開示で説明する技法により、より大きいサイズのブロックに必要とされるパーティションパターンの数の減少があり得る。たとえば、本開示で説明する技法では、Ｎ／Ｍ（または２×Ｎ／Ｍ）個までのＭ×Ｍブロックのみがパーティションを必要とし得る（すなわち、ビデオエンコーダ２０およびビデオデコーダ３０は、Ｎ／Ｍ（または２×Ｎ／Ｍ）個までのＭ×Ｍブロックのみを含むパーティションリストを構成する必要があり得る）。したがって、ビデオエンコーダ２０は、単に、Ｎ／Ｍ（または２×Ｎ／Ｍ）個までのＭ×Ｍブロックに関するパーティションパターンをシグナリングし、Ｎ／Ｍ（または２×Ｎ／Ｍ）個までのＭ×Ｍブロックを導出または拡張する必要があり得る。同様に、ビデオデコーダ３０は、単に、Ｎ／Ｍ（または２×Ｎ／Ｍ）個までのＭ×Ｍブロックに関するパーティションパターンを受信し、Ｎ／Ｍ（または２×Ｎ／Ｍ）個までのＭ×Ｍブロックを導出または拡張する必要があり得る。

[0157]さらに、上述のように、本開示で説明する技法は、記憶される必要のあるパーティションパターンの数を減らし、パーティションパターンを使用してイントラ予測を実施する複雑性を低減することができる。したがって、技法は、６４×６４サイズの深度ブロックに関する線ベースの区分（たとえば、ウェッジレット区分）をサポートすることに伴う問題を克服することができる。言い換えれば、現在の３Ｄ−ＨＥＶＣの場合のように、３２×３２までの線ベースのパーティションのみをサポートする代わりに、本開示で説明する技法を使用して、ウェッジレットパターンは、６４×６４であり得るＮ×ＮのＰＵに拡張される。

[0158]Ｎ×Ｎサイズの深度ブロック（すなわち、３２×３２以下のサイズの深度ブロックに限定されない）に関する線ベースのパーティションパターンを使用するための技法について説明することに加えて、本開示は、線ベースの区分（たとえば、ウェッジレット区分）のためにイントラ予測符号化および復号を実施する効率性を高めるための技法について説明する。たとえば、ビデオエンコーダ２０において、ＤＭＭ１においてＮ×Ｎ深度ＰＵ（すなわち、深度ブロック）のウェッジレット探索プロセスを加速させるために、元の深度ピクチャにおける現在の深度ＰＵ（すなわち、深度ブロック）の左上、右上、左下および右下のサンプルが同じ値を有するとき、ビデオエンコーダ２０は、ウェッジレットパターン探索プロセスを省略することができ、ビデオエンコーダ２０は、現在のＰＵ（すなわち、現在の深度ブロック）のためにＤＭＭ１を選択することのないように構成され得る。

[0159]別の例として、代替または追加として、ビデオエンコーダ２０は、複数の隣接する現在の深度ＰＵの値をチェックすることができる。ビデオエンコーダ２０は、隣接する現在の深度ＰＵの値に基づいて、探索プロセスが省略され、ＤＭＭ１であるかどうかを決定することができ、決定に基づいて現在のＰＵのためにＤＭＭ１を選択することができる。代替または追加として、ビデオエンコーダ２０は、元の深度ピクチャにおける現在の深度ＰＵの左上、右上、左下および右下のサンプルが同じ値を有するとき、ウェッジレットパターン探索を省略し、１サンプルパーティションパターン（たとえば、左上サンプルは、すべての他のサンプルの異なる部分に属する）を選択することができる。

[0160]いくつかの例では、ＤＭＭ３モードでは、コロケートテクスチャルーマイントラモードによって指定されるＮ×Ｎウェッジレットサブセットが空である場合、ビデオエンコーダ２０は、現在のＰＵのためにＤＭＭ３モードを省略することができる。コロケートテクスチャルーマイントラモードが空であることは、コロケートテクスチャブロックのルーマ成分がイントラ予測符号化または復号されないことを意味する。たとえば、コロケートテクスチャブロックのルーマ成分がイントラ予測コーディングされる場合、利用可能なルーマイントラモードはない。代替または追加として、ビデオデコーダ３０は、コロケートテクスチャルーマイントラモードによって指定されるＮ×Ｎウェッジレットサブセットが空である場合に、ビデオデコーダ３０によって復号されるＤＭＭモードインデックスが決して現在のＰＵのためのＤＭＭ３モードではあり得ないように、制約され得る。

[0161]上述のように、ＤＭＭ３の場合、ビデオエンコーダ２０およびビデオデコーダ３０は、コロケートテクスチャブロックに基づいて、深度ブロックに関するパーティションパターンを決定することができる。しかしながら、本開示で説明する技法は、そのように限定されない。いくつかの例では、ＤＭＭ３モードにおいて、ビデオエンコーダ２０およびビデオデコーダ３０は、現在のＮ×ＮのＰＵとコロケートされたルーマブロックによってウェッジレットパーティションパターンを導出しないことがある。そうではなく、ビデオエンコーダ２０およびビデオデコーダ３０は、現在のＭ×Ｍブロックとコロケートされたルーマブロックによって線ベースのパーティションパターンを決定し得る。

[0162]Ｎ×ＮのＰＵの開始／終了点位置の１／２サンプル精度を使用するウェッジレットパターンの場合、ビデオエンコーダ２０およびビデオデコーダ３０は、対応するウェッジレットパターンとともに２Ｎ×２ＮのＰＵにおいて決定位置（２ｍ，２ｎ）が属するパーティションに基づいて、位置（ｍ，ｎ）がどのパーティションに属するかを決定することができる。ビデオエンコーダ２０およびビデオデコーダ３０は、（オフセットＸ，オフセットＹ）のオフセットベクトルにより、２Ｎ×２Ｎブロックにおいて決定位置（２ｍ，２ｎ）を移動させることなく、位置（ｍ，ｎ）がどのパーティションに属するかを決定することができ、ここにおいて、オフセットＸまたはオフセットＹが０または１に等しく、現在の３Ｄ−ＨＥＶＣの場合のように様々な条件に依存する。

[0163]図６は、深度コーディングのための技法を実装し得るビデオエンコーダ２０の一例を示すブロック図である。ビデオエンコーダ２０は、ビデオスライス内のビデオブロックのイントラコーディングとインターコーディングとを実行し得る。イントラコーディング（すなわち、イントラ予測コーディング）は、所与のビデオフレームまたはピクチャ内のビデオの空間的冗長性を低減または除去するために空間的予測に依拠する。インターコーディング（すなわち、インター予測コーディング）は、ビデオシーケンスの隣接するフレームまたはピクチャ中のビデオの時間的冗長性を低減または除去するために時間的予測に依拠する。イントラモード（Ｉモード）は、いくつかの空間ベースのコーディングモードのいずれかを指し得る。単一方向予測（Ｐモード）または双予測（Ｂモード）などのインターモードは、いくつかの時間ベースのコーディングモードのいずれかを指し得る。

[0164]上述のように、ビデオエンコーダ２０は、マルチビュービデオコーディングを実行するように適応され得る。いくつかの事例では、ビデオエンコーダ２０は、時間インスタンス中の各ビューがビデオデコーダ３０のなどのデコーダによって処理され得るように、マルチビューＨＥＶＣをコーディングするように構成され得る。ＨＥＶＣ−３Ｄの場合、各ビューに対するテクスチャマップ（すなわち、ルーマ値およびクロマ値）を符号化することに加えて、ビデオエンコーダ２０はさらに、各ビューに対する深度マップを符号化し得る。

[0165]いずれの場合も、図６に示すように、ビデオエンコーダ２０は、符号化されるべきビデオピクチャ内の現在のビデオブロックを受信する。図６の例では、ビデオエンコーダ２０は、ビデオメモリデータ３９と、モード選択ユニット４０と、（復号済みピクチャバッファ（ＤＰＢ）とも呼ばれる）参照ピクチャメモリ６４と、加算器５０と、変換処理ユニット５２と、量子化ユニット５４と、エントロピー符号化ユニット５６とを含む。そして、モード選択ユニット４０は、動き補償ユニット４４と、動き推定ユニット４２と、イントラ予測ユニット４６と、パーティションユニット４８とを含む。ビデオブロック再構成のために、ビデオエンコーダ２０はまた、逆量子化ユニット５８と、逆変換ユニット６０と、加算器６２とを含む。再構成されたビデオからブロッキネスアーティファクトを除去するためにブロック境界をフィルタ処理するためのデブロッキングフィルタ（図６には図示せず）も含まれ得る。所望される場合、デブロッキングフィルタは、通常、加算器６２の出力をフィルタ処理することになる。デブロッキングフィルタに加えて、追加のフィルタ（ループ内またはループ後）も使用され得る。そのようなフィルタは簡潔のために示されていないが、所望される場合、（ループ内フィルタとして）加算器５０の出力をフィルタ処理することができる。

[0166]図６に示すように、ビデオデータメモリ３９は、ビデオピクチャ内の現在のビデオブロックを符号化するために使用されるビデオデータを受信する。ビデオデータメモリ３９は、（たとえば、ビデオデータを記憶するように構成された）ビデオエンコーダ２０の構成要素によって符号化されるべきビデオデータを記憶するか、またはビデオピクチャを符号化するために使用されるべきビデオデータを記憶することができる。たとえば、ビデオデータメモリ３９は、異なるサイズのブロックに関するパーティションパターン（たとえば、ウェッジレットパーティションパターン）を記憶することができる。ビデオデータメモリ３９は、ビデオエンコーダ２０によって実施される初期化プロセスの一部としてパーティションパターンを記憶することができる。

[0167]いくつかの例では、ビデオデータメモリ３９に記憶されるビデオデータは、たとえば、ビデオソース１８から取得される場合がある。（復号ピクチャバッファ（ＤＰＢ）とも呼ばれる）参照ピクチャメモリ６４は、（たとえば、イントラコーディングモードまたはインターコーディングモードで）ビデオエンコーダ２０によってビデオデータを符号化する際に使用するための参照ビデオデータを記憶する。ビデオデータメモリ３９および参照ピクチャメモリ６４は、同期ＤＲＡＭ（ＳＤＲＡＭ）、磁気抵抗ＲＡＭ（ＭＲＡＭ）、抵抗ＲＡＭ（ＲＲＡＭ（登録商標））、または他のタイプのメモリデバイスを含む、ダイナミックランダムアクセスメモリ（ＤＲＡＭ）など、様々なメモリデバイスのいずれかによって形成され得る。ビデオデータメモリ３９および参照ピクチャメモリ６４は、同じメモリデバイスまたは別個のメモリデバイスによって設けられ得る。様々な例では、ビデオデータメモリ３９は、ビデオエンコーダ２０の他の構成要素とともにオンチップであってよく、またはそれらの構成要素に対してオフチップであってもよい。

[0168]符号化プロセス中に、ビデオエンコーダ２０は、コーディングされるべきビデオフレームまたはスライスを受信する。フレームまたはスライスは複数のビデオブロックに分割され得る。動き推定ユニット４２および動き補償ユニット４４は、時間的予測を行うために、１つまたは複数の参照フレーム中の１つまたは複数のブロックに対して、受信されたビデオブロックのインター予測コーディングを実行する。イントラ予測ユニット４６は代替的に、空間的予測を行うために、コーディングされるべきブロックと同じフレームまたはスライス中の１つまたは複数の隣接ブロックに対して、受信されたビデオブロックのイントラ予測コーディング（たとえば、イントラ予測符号化）を実行し得る。ビデオエンコーダ２０は、たとえば、ビデオデータの各ブロックに適切なコーディングモードを選択するために、複数のコーディングパスを実行することができる。

[0169]さらに、パーティションユニット４８は、以前のコーディングパスにおける以前の区分方式の評価に基づいて、ビデオデータのブロックをサブブロックに区分することができる。たとえば、パーティションユニット４８は、最初に、フレームまたはスライスをＬＣＵに区分し、レートひずみ分析（たとえば、レートひずみ最適化）に基づいて、ＬＣＵの各々をサブＣＵに区分することができる。モード選択ユニット４０は、サブＣＵへのＬＣＵの区分を示す４分木データ構造をさらに生成することができる。４分木のリーフノードＣＵは、１つまたは複数のＰＵと１つまたは複数のＴＵとを含み得る。

[0170]モード選択ユニット４０は、たとえば、誤差結果に基づいてコーディングモードのうちの１つ、すなわち、イントラまたはインターを選択し、得られたイントラコーディングまたはインターコーディングされたブロックを、残差ブロックデータを生成するために加算器５０に与え、参照フレームとして使用するための符号化されたブロックを再構成するために加算器６２に与え得る。モード選択ユニット４０はまた、動きベクトル、イントラモードインジケータ、パーティション情報、および他のそのようなシンタックス情報など、シンタックス要素をエントロピーコーディングユニット５６に与え得る。

[0171]動き推定ユニット４２および動き補償ユニット４４は、高度に統合され得るが、概念的な目的のために別々に示されている。動き推定ユニット４２によって実行される動き推定は、ビデオブロックの動きを推定する動きベクトルを生成するプロセスである。動きベクトルは、たとえば、現在のフレーム（または他のコーディングされたユニット）内でコーディングされている現在のブロックに対する参照フレーム（または他のコーディングされたユニット）内の予測ブロックに対する現在のビデオフレームまたはピクチャ内のビデオブロックのＰＵの変位を示すことができる。予測ブロックは、絶対差分和（ＳＡＤ：sum of absolute difference）、２乗差分和（ＳＳＤ：sum of square difference）、または他の差分メトリックによって決定され得るピクセル差分に関して、コーディングされるべきブロックにぴったり一致することがわかるブロックである。いくつかの例では、ビデオエンコーダ２０は、参照ピクチャメモリ６４に記憶された参照ピクチャのサブ整数ピクセル位置の値を計算し得る。たとえば、ビデオエンコーダ２０は、参照ピクチャの１／４ピクセル位置、１／８ピクセル位置、または他の分数のピクセル位置の値を補間することができる。したがって、動き推定ユニット４２は、フルピクセル位置および分数ピクセル位置に対する動き探索を実行し、分数ピクセル精度を有する動きベクトルを出力することができる。

[0172]動き推定ユニット４２は、ＰＵの位置を参照ピクチャの予測ブロックの位置と比較することによって、インターコーディングされたスライス中のビデオブロックのＰＵに関する動きベクトルを計算する。参照ピクチャは、その各々が、参照ピクチャメモリ６４に記憶された１つまたは複数の参照ピクチャを識別する、第１の参照ピクチャリスト（リスト０）または第２の参照ピクチャリスト（リスト１）から選択され得る。動き推定ユニット４２は、計算された動きベクトルをエントロピー符号化ユニット５６と動き補償ユニット４４とに送る。

[0173]動き補償ユニット４４によって実行される動き補償は、動き推定ユニット４２によって決定された動きベクトルに基づいて予測ブロックを取り出し、またはこれを生成することを含むことができる。やはり、動き推定ユニット４２および動き補償ユニット４４は、いくつかの例で、機能的に統合され得る。現在のビデオブロックのＰＵに関する動きベクトルを受信すると、動き補償ユニット４４は、参照ピクチャリストのうちの１つにおいて動きベクトルが指す予測ブロックを位置特定することができる。加算器５０は、以下で説明するように、コーディングされている現在のビデオブロックのピクセル値から予測ブロックのピクセル値を減算し、ピクセル差分値を形成することによって、残差ビデオブロックを形成する。一般に、動き推定ユニット４２は、ルーマ成分に対して動き推定を実行し、動き補償ユニット４４は、クロマ成分とルーマ成分の両方に関して、ルーマ成分に基づいて計算された動きベクトルを使用する。モード選択ユニット４０は、ビデオスライスのビデオブロックを復号する際のビデオデコーダ３０による使用のために、ビデオブロックとビデオスライスとに関連付けられたシンタックス要素を生成することもできる。

[0174]イントラ予測ユニット４６は、上述のように、動き推定ユニット４２と動き補償ユニット４４とによって実行されるインター予測の代替として、現在のブロックをイントラ予測し得る。特に、イントラ予測ユニット４６は、現在のブロックを符号化するために使用すべきイントラ予測モードを決定することができる。いくつかの例では、イントラ予測ユニット４６は、たとえば別々の符号化パス中に、様々なイントラ予測モードを使用して現在のブロックを符号化することができ、イントラ予測ユニット４６（または、いくつかの例ではモード選択ユニット４０）は、テストされたモードから使用すべき適切なイントラ予測モードを選択することができる。

[0175]たとえば、イントラ予測ユニット４６は、様々なテストされたイントラ予測モードのためのレートひずみ分析を使用してレートひずみ値を計算し、テストされたモードの間で最良のレートひずみ特性を有するイントラ予測モードを選択し得る。レートひずみ分析は、概して、符号化ブロックと、符号化ブロックを生成するために符号化された元の符号化されていないブロックとの間のひずみ（または誤差）の量、ならびに符号化ブロックを生成するために使用されるビットレート（すなわち、ビット数）を決定する。イントラ予測ユニット４６は、どのイントラ予測モードがブロックについて最良のレートひずみ値を呈するかを決定するために、様々な符号化されたブロックのひずみおよびレートから比を計算することができる。

[0176]さらに、イントラ予測ユニット４６は、深度マップの深度ブロックをコーディングするように構成され得る。たとえば、イントラ予測ユニット４６は、深度スライスのイントラ予測されたＰＵをコーディングするために、（たとえば、上記で図２に関して説明したように）ベース（２Ｄ）ＨＥＶＣ規格からのイントラ予測モードと、（たとえば、上記で図３Ａおよび図３Ｂに関して説明したように）深度モデリングモード（ＤＭＭ）と、（たとえば、以下で図１０に関して説明するように）領域境界チェーンコーディングとを使用する。

[0177]いずれの場合も、ビデオエンコーダ２０は、コーディングされている元のビデオブロックから、モード選択ユニット４０からの予測データを減算することによって残差ビデオブロックを形成する。加算器５０は、この減算演算を実行する１つまたは複数の構成要素を表す。変換処理ユニット５２は、離散コサイン変換（ＤＣＴ）または概念的に同様の変換などの変換を残差ブロックに適用して、残差変換係数値を備えるビデオブロックを生成する。変換処理ユニット５２は、ＤＣＴと概念的に同様である他の変換を実行することができる。ウェーブレット変換、整数変換、サブバンド変換、または他のタイプ変換も使用され得る。

[0178]いずれの場合も、変換処理ユニット５２は、残差ブロックに変換を適用して、残差変換係数のブロックを生成する。変換は、ピクセル値領域からの残差情報を、周波数領域のような変換領域に変換することができる。変換処理ユニット５２は、得られた変換係数を量子化ユニット５４に送り得る。量子化ユニット５４は、ビットレートをさらに低減するために、変換係数を量子化する。量子化プロセスは、係数の一部またはすべてに関連付けられたビット深度を低減し得る。量子化の程度は、量子化パラメータを調整することによって、変更され得る。いくつかの例では、量子化ユニット５４は次いで、量子化変換係数を含む行列の走査を実行することができる。代替的に、エントロピー符号化ユニット５６が走査を実行することができる。

[0179]量子化に続いて、エントロピー符号化ユニット５６は、量子化変換係数をエントロピーコーディングする。たとえば、エントロピー符号化ユニット５６は、コンテキスト適応型可変長コーディング（ＣＡＶＬＣ）、コンテキスト適応型バイナリ算術コーディング（ＣＡＢＡＣ）、シンタックスベースコンテキスト適応型バイナリ算術コーディング（ＳＢＡＣ）、確率間隔区分エントロピー（ＰＩＰＥ）コーディング、または別のエントロピーコーディング技法を実行することができる。コンテキストベースのエントロピーコーディングの場合、コンテキストは、隣接ブロックに基づき得る。エントロピー符号化ユニット５６によるエントロピーコーディングに続いて、符号化されたビットストリームは、別のデバイス（たとえば、ビデオデコーダ３０）に送信され、または後の送信もしくは取出のためにアーカイブされ得る。

[0180]逆量子化ユニット５８および逆変換ユニット６０は、たとえば参照ブロックとして後で使用するために、ピクセル領域中で残差ブロックを再構成するために、それぞれ逆量子化と逆変換とを適用する。動き補償ユニット４４は、参照ピクチャメモリ６４のフレームのうちの１つの予測ブロックに残差ブロックを加算することによって参照ブロックを計算し得る。動き補償ユニット４４はまた、動き推定において使用するためのサブ整数ピクセル値を計算するために、再構成された残差ブロックに１つまたは複数の補間フィルタを適用し得る。加算器６２は、参照ピクチャメモリ６４に記憶するための再構成されたビデオブロックを生成するために、動き補償ユニット４４によって生成された動き補償予測ブロックに再構成された残差ブロックを加算する。再構成されたビデオブロックは、動き推定ユニット４２および動き補償ユニット４４によって、後続のビデオフレーム中のブロックをインターコーディングするために参照ブロックとして使用され得る。

[0181]この意味で、ビデオエンコーダ２０は、本開示で説明する１つまたは複数の例示的技法を実装するように構成され得る。たとえば、イントラ予測ユニット４６は、本開示で説明する深度ブロックのための例示的なイントラ予測符号化技法を実装するように構成され得る。いくつかの例では、イントラ予測ユニット４６は、他のプロセッサとの組合せで、本開示で説明する技法を実装するように構成され得る。

[0182]いくつかの例では、ビデオエンコーダ２０は、第１のサイズのブロックに関するパーティションパターンからパーティションパターンを決定する（たとえば、サイズ１６×１６のブロックに関連するパーティションパターンを決定する）ように構成され得る。ビデオエンコーダ２０は、第１のサイズのブロックに関するパーティションパターンからの決定されたパーティションパターンに基づいて、第２のサイズの深度ブロックに関するパーティションを決定する（たとえば、サイズ１６×１６のブロックに関連する決定されたパーティションパターンに基づいて、サイズ３２×３２の深度ブロックに関するパーティションを決定する）ことができ、ここで、第２のサイズが第１のサイズよりも大きい。ビデオエンコーダ２０は、深度ブロックに関する決定されたパーティションパターンに基づいて、深度ブロックをイントラ予測符号化することができる。

[0183]この例では、サイズ１６×１６のブロック（たとえば、第１のサイズのブロック）は、深度ブロックを含むピクチャ内の実際のブロックではないことがある。そうではなく、サイズ１６×１６のブロックは概念的ブロックであり、サイズ１６×１６のブロックに使用されるパーティションパターンが代わりにサイズ３２×３２のブロック（たとえば、第２のサイズの深度ブロック）に使用される。ただし、いくつかの例では、サイズ１６×１６のブロックは、ピクチャの実際のブロック、またはサイズ３２×３２のブロック内のブロックであり得る。

[0184]ビデオエンコーダ２０は、イントラ深度符号化のために深度ブロック（たとえば、現在のＰＵであるＮ×Ｎブロック）のサブブロック（たとえば、Ｍ×Ｍブロック）に関するパーティションパターン（たとえば、線ベースのパーティションパターン）を決定するように構成され得る。ビデオエンコーダ２０は、サブブロックに関するパーティションパターンに基づいて、全体的深度ブロックに関するパーティションパターン（たとえば、線ベースのパーティションパターン）を決定することができる。ビデオエンコーダ２０は、深度ブロックに関する決定されたパーティションパターンに基づいて、深度ブロックをイントラ符号化することができる。

[0185]ビデオエンコーダ２０は、サブブロックに関するパーティションパターンを示す情報を符号化することがある。ビデオエンコーダ２０はまた、深度ブロックに関するパーティションパターンを示す情報の符号化を回避する（たとえば、符号化しない）ことがある。ビデオエンコーダ２０はまた、深度ブロックに関するパーティションパターンを深度ブロックのサイズに基づかせることなく（たとえば、ブロックサイズとは無関係に）、深度ブロックに関するパーティションパターンを決定することができる。ビデオエンコーダ２０はまた、いくつかの例では、パーティションパターンが決定されたサブブロックを識別するための情報（たとえば、インデックスまたはフラグおよび１つのオフセット）を（たとえば、バイパスモードおよび／またはコンテキストモデリングを使用して）符号化し、シグナリングすることができる。

[0186]図７は、深度コーディングのための技法を実装し得るビデオデコーダ３０の一例を示すブロック図である。図７の例では、ビデオデコーダ３０は、ビデオデータメモリ６９と、エントロピー復号ユニット７０と、動き補償ユニット７２、動きベクトル予測ユニット７３、およびイントラ予測ユニット７４を含む予測処理ユニット７１とを含む。ビデオデコーダ３０はまた、逆量子化ユニット７６と、逆変換処理ユニット７８と、参照フレームメモリ８２と、加算器８０とを含む。ビデオデコーダ３０は、いくつかの例では、ビデオエンコーダ２０（図６）に関して説明した符号化パスとは概して逆の復号パスを実行することができる。動き補償ユニット７２は、エントロピー復号ユニット７０から受信された動きベクトルに基づいて予測データを生成することができ、イントラ予測ユニット７４は、エントロピー復号ユニット７０から受信されたイントラ予測モードインジケータに基づいて予測データを生成することができる。

[0187]図７の例では、ビデオデータメモリ６９は、符号化ビデオを受信する。ビデオデータメモリ６９は、ビデオデコーダ３０の構成要素によって復号されるために、符号化ビデオビットストリームなど、（たとえば、ビデオデータを記憶するように構成された）ビデオデータを記憶し得る。ビデオデータメモリ６８はまた、ビデオデータを復号してピクチャを再構成するためにビデオデコーダ３０の構成要素によって使用されるビデオデータを記憶することができる。たとえば、ビデオデータメモリ６９は、異なるサイズのブロックに関するパーティションパターン（たとえば、ウェッジレットパーティションパターン）を記憶することができる。ビデオデータメモリ６９は、ビデオエンコーダ３０によって実施される初期化プロセスの一部としてパーティションパターンを記憶することができる。

[0188]ビデオデータメモリ６９に記憶されたビデオデータは、カメラなどのローカルビデオソースから、ビデオデータのワイヤードもしくはワイヤレスのネットワーク通信を介して、または物理データ記憶媒体にアクセスすることによって取得され得る。ビデオデータメモリ６９は、符号化ビデオビットストリームからの符号化ビデオデータを記憶するコーディング済みピクチャバッファ（ＣＰＢ）を形成し得る。

[0189]参照ピクチャメモリ８２は、（たとえば、イントラコーディングモードまたはインターコーディングモードで）ビデオデコーダ３０によってビデオデータを復号する際に使用するための参照ビデオデータを記憶する復号済みピクチャバッファ（ＤＰＢ）の一例である。ビデオデータメモリ６９および参照ピクチャメモリ８２は、同期ＤＲＡＭ（ＳＤＲＡＭ）、磁気抵抗ＲＡＭ（ＭＲＡＭ）、抵抗ＲＡＭ（ＲＲＡＭ）、または他のタイプのメモリデバイスを含む、ダイナミックランダムアクセスメモリ（ＤＲＡＭ）など、様々なメモリデバイスのいずれかによって形成され得る。ビデオデータメモリ６９および参照ピクチャメモリ８２は、同じメモリデバイスまたは別個のメモリデバイスによって設けられ得る。様々な例では、ビデオデータメモリ６９は、ビデオデコーダ３０の他の構成要素とともにオンチップであってよく、またはそれらの構成要素に対してオフチップであってもよい。

[0190]復号プロセス中に、ビデオデコーダ３０はビデオエンコーダ２０から、符号化ビデオスライスのビデオブロックと関連付けられるシンタックス要素とを表す符号化ビデオビットストリームを受信する。ビデオデコーダ３０のエントロピー復号ユニット７０は、量子化された係数と、動きベクトルまたはイントラ予測モードインジケータと、他のシンタックス要素とを生成するために、ビットストリームをエントロピー復号する。エントロピー復号ユニット７０は、動きベクトルと他のシンタックス要素とを動き補償ユニット７２に転送する。エントロピー復号ユニット７０は、イントラ予測ユニット７４にイントラ予測復号のための情報を転送する。ビデオデコーダ３０は、ビデオスライスレベルおよび／またはビデオブロックレベルでシンタックス要素を受信することができる。

[0191]上述のように、ビデオデコーダ３０は、マルチビュービデオコーディングを実行するように適応され得る。いくつかの例では、ビデオデコーダ３０は、マルチビューＨＥＶＣを復号するように構成され得る。ＨＥＶＣ−３Ｄの場合、各ビューに対するテクスチャ値（すなわち、ルーマ値およびクロマ値）を復号することに加えて、ビデオデコーダ３０はさらに、各ビューに対する深度マップを復号し得る。

[0192]いずれの場合も、ビデオスライスがイントラコーディングされた（Ｉ）スライスとしてコーディングされるとき、イントラ予測ユニット７４は、シグナリングされたイントラ予測モードと、現在のフレームまたはピクチャの以前復号されたブロックからのデータとに基づいて、現在のビデオスライスのビデオブロックのための予測データを生成し得る。

[0193]イントラ予測ユニット７４はまた、深度データをイントラコーディングし得る。たとえば、イントラ予測ユニット７４は、深度スライスのイントラ予測されたＰＵをコーディングするために、（たとえば、上記で図２に関して説明したように）ベース（２Ｄ）ＨＥＶＣ規格からのイントラ予測モードと、（たとえば、上記で図３Ａおよび図３Ｂに関して説明したように）深度モデリングモード（ＤＭＭ）と、（たとえば、以下で図１０に関して説明するように）領域境界チェーンコーディングとを使用する。

[0194]ビデオフレームがインターコーディングされた（すなわち、Ｂ（双方向予測された）、Ｐ（前のフレームから予測された）またはＧＰＢ（一般化されたＰまたはＢスライス））スライスとしてコーディングされるとき、動き補償ユニット７２は、エントロピー復号ユニット７０から受信された動きベクトルと他のシンタックス要素とに基づいて、現在のビデオスライスのビデオブロックのための予測ブロックを生成する。予測ブロックは、参照ピクチャリストのうちの１つ内の参照ピクチャのうちの１つから生成され得る。ビデオデコーダ３０は、参照フレームメモリ８２に記憶された参照ピクチャに基づいて、デフォルト構成技法を使用して、参照フレームリスト、すなわち、リスト０とリスト１とを構成し得る。

[0195]動き補償ユニット７２は、動きベクトルと他のシンタックス要素とをパースすることによって現在のビデオスライスのビデオブロックのための予測情報を決定し、復号されている現在のビデオブロックのための予測ブロックを生成するために、その予測情報を使用する。たとえば、動き補償ユニット７２は、ビデオスライスのビデオブロックをコーディングするために使用される予測モード（たとえば、イントラまたはインター予測）と、インター予測スライスタイプ（たとえば、Ｂスライス、Ｐスライス、またはＧＰＢスライス）と、スライスに関する参照ピクチャリストのうちの１つまたは複数に関する構成情報と、スライスの各インター符号化ビデオブロックに関する動きベクトルと、スライスの各インターコーディングされたビデオブロックに関するインター予測ステータスと、現在のビデオスライス中のビデオブロックを復号するための他の情報とを決定するために、受信されたシンタックス要素のうちのいくつかを使用する。

[0196]動き補償ユニット７２はまた、補間フィルタに基づいて、補間を実行することができる。動き補償ユニット７２は、参照ブロックのサブ整数ピクセルのための補間値を計算するために、ビデオブロックの符号化中にビデオエンコーダ２０によって使用された補間フィルタを使用し得る。この場合に、動き補償ユニット７２は、受信されたシンタックス要素からビデオエンコーダ２０によって使用された補間フィルタを決定し、予測ブロックを生成するために補間フィルタを使用し得る。

[0197]逆量子化ユニット７６は、ビットストリーム中で提供され、エントロピー復号ユニット８０によって復号された、量子化変換係数を逆量子化（inverse quantize）、すなわち、逆量子化（de-quantize）する。逆量子化プロセスは、量子化の程度を決定し、同様に、適用されるべき逆量子化の程度を決定するための、ビデオスライス中の各ビデオブロックに関してビデオデコーダ３０によって計算される量子化パラメータＱＰ_Yの使用を含み得る。

[0198]逆変換処理ユニット７８は、ピクセル領域において残差ブロックを生成するために、逆変換、たとえば、逆ＤＣＴ、逆整数変換、または概念的に同様の逆変換プロセスを変換係数に適用する。動き補償ユニット７２またはイントラ予測ユニット７４が、動きベクトルまたは他のシンタックス要素に基づいて現在のビデオブロック（たとえば、テクスチャブロックまたは深度ブロック）のための予測ブロックを生成した後、ビデオデコーダ３０は、逆変換ユニット７８からの残差ブロックを、動き補償ユニット８２またはイントラ予測ユニット７４によって生成された対応する予測ブロックと加算することによって、復号されたビデオブロックを形成する。加算器９０は、この加算演算を実行する１つまたは複数の構成要素を表す。

[0199]所望される場合、ブロッキネスアーティファクトを除去するために復号されたブロックをフィルタ処理するためのデブロッキングフィルタも適用され得る。ピクセル推移を平滑化し、または他の形でビデオ品質を改善するために、他のループフィルタ（コーディングループ内またはコーディングループの後のいずれであれ）も使用され得る。その後、所与のフレームまたはピクチャ中の復号されたビデオブロックは、参照ピクチャメモリ８２に記憶され、参照ピクチャメモリ８２は、後続の動き補償に使用される参照ピクチャを記憶する。参照ピクチャメモリ８２はまた、復号されたビデオを図１のディスプレイデバイス３２などのディスプレイデバイス上に後で表示できるように記憶する。

[0200]この意味で、ビデオデコーダ３０は、本開示で説明する１つまたは複数の例示的技法を実装するように構成され得る。たとえば、イントラ予測ユニット７２は、本開示で説明する深度ブロックのための例示的なイントラ予測復号技法を実装するように構成され得る。いくつかの例では、イントラ予測ユニット７２は、単独で、または他のプロセッサとの組合せで、本開示で説明する技法を実装するように構成され得る。

[0201]いくつかの例では、ビデオデコーダ３０は、第１のサイズのブロックに関するパーティションパターンからパーティションパターンを決定する（たとえば、サイズ１６×１６のブロックに関連するパーティションパターンを決定する）ように構成され得る。ビデオデコーダ３０は、第１のサイズのブロックに関するパーティションパターンからの決定されたパーティションパターンに基づいて、第２のサイズの深度ブロックに関するパーティションを決定する（たとえば、サイズ１６×１６のブロックの決定されたパーティションパターンに基づいて、サイズ３２×３２の深度ブロックに関するパーティションを決定する）ことができき、ここで、第２のサイズが第１のサイズよりも大きい。ビデオデコーダ３０は、深度ブロックに関する決定されたパーティションパターンに基づいて、深度ブロックをイントラ予測復号することができる。

[0202]この例では、サイズ１６×１６のブロック（たとえば、第１のサイズのブロック）は、深度ブロックを含むピクチャ内の実際のブロックではないことがある。そうではなく、サイズ１６×１６のブロックは概念的ブロックであり、サイズ１６×１６のブロックに使用されるパーティションパターンが代わりにサイズ３２×３２のブロック（たとえば、第２のサイズの深度ブロック）に使用される。ただし、いくつかの例では、サイズ１６×１６のブロックは、ピクチャの実際のブロック、またはサイズ３２×３２のブロック内のブロックであり得る。

[0203]たとえば、ビデオデコーダ３０は、イントラ深度復号のために深度ブロック（たとえば、現在のＰＵであるＮ×Ｎブロック）のサブブロック（たとえば、Ｍ×Ｍブロック）に関するパーティションパターンを決定する（たとえば、パーティションパターンを示す情報を受信する）ように構成され得る。パーティションパターンは、線ベースのパーティションパターンであり得る。ビデオデコーダ３０は、サブブロックに関するパーティションパターンに基づいて、全体的深度ブロックに関するパーティションパターン（たとえば、線ベースのパーティションパターン）を決定することができる。ビデオデコーダ３０は、深度ブロックに関する決定されたパーティションパターンに基づいて、深度ブロックをイントラ復号することができる。

[0204]ビデオデコーダ３０は、サブブロックに関するパーティションパターンを示す情報を復号することがある。ビデオデコーダ３０はまた、深度ブロックに関するパーティションパターンを示す情報の復号を回避する（たとえば、復号しない）ことがある。言い換えれば、ビデオデコーダ３０は、深度ブロックに関するパーティションパターンを示す情報を受信することなく、深度ブロックに関するパーティションパターンを決定することができる。

[0205]ビデオデコーダ３０はまた、深度ブロックに関するパーティションパターンを深度ブロックのサイズに基づかせることなく（たとえば、ブロックサイズとは無関係に）、深度ブロックに関するパーティションパターンを決定することができる。ビデオデコーダ３０はまた、いくつかの例では、パーティションパターンが決定されたサブブロックを識別するための受信された情報（たとえば、インデックスまたはフラグおよび１つのオフセット）を（たとえば、バイパスモードおよび／またはコンテキストモデリングを使用して）復号することができる。

[0206]上記で説明した技法は、その両方が一般にビデオコーダと呼ばれることがある、ビデオエンコーダ２０（図１および図６）および／またはビデオデコーダ３０（図１および図７）によって実行され得る。さらに、ビデオコーディングは、概して、適用可能な場合、ビデオ符号化および／またはビデオ復号を指すことがある。

[0207]図８は、ビデオデータを復号する例示的な方法を示すフローチャートである。図示のように、ビデオデコーダ３０は、第１のサイズのブロックに関するパーティションパターンを構成し、記憶することができる（８００）。たとえば、ビデオデコーダ３０は、初期化の一部として第１のサイズのブロックに関連する（たとえば、サイズ１６×１６のブロックに関する）１つまたは複数のパーティションパターンを含むパーティションパターンリストを構成し、第１のサイズのブロックに関連するパーティションパターンリストをビデオメモリデータ６９に記憶することができる。

[0208]ビデオデコーダ３０は、第１のサイズのブロックに関連するパーティションパターンを決定することができる（８０２）。たとえば、ビデオデコーダ３０は、第１のサイズのブロックに関連するパーティションパターンリストへのインデックスを受信することができる。ビデオデコーダ３０は、パーティションパターンリストへのインデックスによって参照されるパーティションパターンを識別することができる。ビデオデコーダ３０は、識別されたパーティションパターンに基づいて、第１のサイズのブロックに関連するパーティションパターンからパーティションパターンを決定することができる（すなわち、ビデオデコーダ３０は、パーティションパターンリストへの受信されたインデックスに基づいて、第１のサイズのブロックに関するパーティションパターンからパーティションパターンを決定することができる）。

[0209]ビデオデコーダ３０は、第１のサイズ（たとえば、１６×１６）のブロックに関するパーティションパターンからの決定されたパーティションパターンに基づいて、第２のサイズ（たとえば、３２×３２）の深度ブロックに関するパーティションパターンを決定することができる（８０４）。この例では、第２のサイズは、第１のサイズよりも大きい。

[0210]第１のサイズのブロックは必ずしも、ピクチャ内の実際のブロックである必要はない。むしろ、ビデオデコーダ３０が第２のより大きいサイズの深度ブロックに関するパーティションパターンを決定するために使用するのは、第１のサイズのブロックのパーティションパターンである。ただし、いくつかの例では、第１のサイズのブロックは、深度ブロック内などのピクチャ内の実際のブロックであり得る。

[0211]いくつかの例では、ビデオデコーダ３０は、深度ブロック内のサブブロックを識別する情報を受信することができ、サブブロックのサイズが第１のサイズである。そのような例では、ビデオデコーダ３０は、サブブロックに関するパーティションパターンを決定することができる。ビデオデコーダ３０はまた、サブブロックに関する決定されたパーティションパターンに基づいて、第２のサイズの深度ブロックに関するパーティションパターンを決定することができる。また、これらの例示的な技法では、ビデオデコーダ３０は、第２のサイズの深度ブロックに関するパーティションパターンを、サブブロックに関するパーティションパターンの線形線を深度ブロックの境界まで拡張することによって決定することができる。得られる線形線は、深度ブロックに関するパーティションパターンを備える。

[0212]ビデオデコーダ３０は、深度ブロックに関する決定されたパーティションパターンに基づいて、深度ブロックをイントラ予測復号することができる（８０６）。たとえば、ビデオデコーダ３０は、深度ブロックをイントラ予測復号するために、ＤＭＭに依拠する３Ｄ−ＨＥＶＣにおいて説明されるイントラ予測復号技法を実施することができる。いくつかの例では、第１のサイズのブロックに関するパーティションパターンからのパーティションパターンは、第１のサイズのブロックに関する複数の線ベースのパーティションパターンからの線ベースのパーティションパターン（たとえば、第１のサイズのブロックに関する複数のウェッジレットパターンからのウェッジレットパターン）を備える。また、深度ブロックに関するパーティションパターンは、２つのパーティションに深度ブロックを区分する深度ブロックに関する線ベースのパーティションパターンを備える。いくつかの例では、ビデオデコーダ３０は、第２のサイズの深度ブロックに関するパーティションパターンを示す情報を受信することなく、第２のサイズの深度ブロックに関するパーティションパターンを決定することができる。

[0213]図９は、ビデオデータを符号化する例示的な方法を示すフローチャートである。図示のように、ビデオエンコーダ２０は、第１のサイズのブロックに関連するパーティションパターンを構成し、記憶することができる（９００）。たとえば、ビデオエンコーダ２０は、初期化の一部として第１のサイズのブロックに関連する（たとえば、サイズ１６×１６のブロックに関する）パーティションパターンリストを構成し、第１のサイズのブロックに関するパーティションパターンリストをビデオメモリデータ３９に記憶することができる。

[0214]ビデオエンコーダ２０は、第１のサイズのブロックに関連するパーティションパターンを決定することができる（９０２）。たとえば、ビデオエンコーダ２０は、第２のより大きいサイズの深度ブロックに関するパーティションパターンを決定するために使用され得る適切なパーティションパターンを選択するために、複数の符号化パスを実施することができる。次いでビデオエンコーダ２０は、パーティションパターンリスト中でパーティションパターンを識別することができる。たとえば、ビデオエンコーダ２０は、構成されたパーティションパターンリスト中で識別されたパーティションパターンから、第１のサイズのブロックに関連するパーティションパターンからのパーティションパターンを決定することができる。ビデオエンコーダ２０は、第１のサイズのブロックに関するパーティションパターンからの決定するパーティションパターンを識別する構成されたパーティションパターンリストへのインデックスをシグナリングすることができ、ビデオデコーダ３０が、深度ブロックをイントラ予測復号するためにそのインデックスを使用する。

[0215]ビデオエンコーダ２０は、第１のサイズのブロックに関するパーティションパターンからの決定されたパーティションパターン（たとえば、サイズ１６×１６のブロックに関連するパーティションパターン）に基づいて、第２のサイズ（たとえば、３２×３２）の深度ブロックに関するパーティションパターンを決定することができる（９０４）。この例では、第２のサイズは、第１のサイズよりも大きい。

[0216]第１のサイズのブロックは必ずしも、ピクチャ内の実際のブロックである必要はない。むしろ、ビデオエンコーダ２０が第２のより大きいサイズの深度ブロックに関するパーティションパターンを決定するために使用するのは、第１のサイズのブロックのパーティションパターンである。ただし、いくつかの例では、第１のサイズのブロックは、深度ブロック内などのピクチャ内の実際のブロックであり得る。

[0217]いくつかの例では、ビデオエンコーダ２０は、深度ブロック内のサブブロックを識別することができ、サブブロックのサイズが第１のサイズである。そのような例では、ビデオエンコーダ２０は、識別されたサブブロックに関するパーティションパターンを決定することができる。ビデオエンコーダ２０はまた、識別されたサブブロックに関する決定されたパーティションパターンに基づいて、第２のサイズの深度ブロックに関するパーティションパターンを決定することができる。また、これらの例示的な技法では、ビデオエンコーダ２０は、第２のサイズの深度ブロックに関するパーティションパターンを、サブブロックに関するパーティションパターンの線形線を深度ブロックの境界まで拡張することによって決定することができる。得られる線形線は、深度ブロックに関するパーティションパターンを画定する。

[0218]ビデオエンコーダ２０は、深度ブロックに関する決定されたパーティションパターンに基づいて、深度ブロックをイントラ予測符号化することができる（９０６）。たとえば、ビデオエンコーダ２０は、深度ブロックをイントラ予測符号化するために、ＤＭＭに依拠する３Ｄ−ＨＥＶＣにおいて説明されるイントラ予測符号化技法を実施することができる。いくつかの例では、第１のサイズのブロックに関するパーティションパターンからのパーティションパターンは、第１のサイズのブロックに関する複数の線ベースのパーティションパターンからの線ベースのパーティションパターン（たとえば、第１のサイズのブロックに関する複数のウェッジレットパターンからのウェッジレットパターン）を備える。また、深度ブロックに関するパーティションパターンは、２つのパーティションに深度ブロックを区分する深度ブロックに関する線ベースのパーティションパターンを備える。いくつかの例では、ビデオエンコーダ２０は、第２のサイズの深度ブロックに関するパーティションパターンを識別する情報をシグナリングしないことがある。

[0219]以下では、本開示で説明する例示的な技法を実施するいくつかの例について説明する。以下では、ボールド体およびイタリック体の文字を包含する二重角括弧（［［］］）は、現在の技法に対する削除を示し、下線は、現在の技法に対する追加を示す。以下の例示的な技法が、別個に、または組合せで適用され得る。

[0220]深度モードパラメータシンタックスの場合

[0221]深度モードパラメータイントラセマンティクスの場合：
．．．
ｗｅｄｇｅ＿ｆｕｌｌ＿ｔａｂ＿ｉｄｘ［ｘ０］［ｙ０］は、ＤｅｐｔｈＩｎｔｒａＭｏｄｅ［ｘ０］［ｙ０］がＩＮＴＲＡ＿ＤＥＰ＿ＤＭＭ＿ＷＦＵＬＬに等しいときの、対応する４×４パターンリストにおけるウェッジレットパターンのインデックスを指定する。
ｗｅｄｇｅ＿ｓｕｂ＿ｃｏｌ［ｘ０］［ｙ０］およびｗｅｄｇｅ＿ｓｕｂ＿ｒｏｗ［ｘ０］［ｙ０］は、ウェッジレットパターンがシグナリングされる４×４ブロックの位置を指定する。
ｗｅｄｇｅ＿ｐｒｅｄｔｅｘ＿ｔａｂ＿ｉｄｘ［ｘ０］［ｙ０］は、ＤｅｐｔｈＩｎｔｒａＭｏｄｅ［ｘ０］［ｙ０］がＩＮＴＲＡ＿ＤＥＰ＿ＤＭＭ＿ＷＰＲＥＤＴＥＸに等しいときの、現在の予測ユニット内の４×４ブロックのウェッジレットパターンのインデックスを指定する。
．．．
[0222]復号プロセスの場合
Ｈ．８．４．４．２．７イントラ予測モードＩＮＴＲＡ＿ＤＭＭ＿ＷＦＵＬＬの指定
このプロセスへの入力は以下の通りである。
− 現在のピクチャの左上サンプルに対する現在のブロックの左上サンプルを指定するサンプルロケーション（ｘＴｂ，ｙＴｂ）
− ｘ＝−１、ｙ＝−１．．ｎＴｂＳ×２−１、およびｘ＝０．．ｎＴｂＳ×２−１、ｙ＝−１である、隣接サンプルｐ［ｘ］［ｙ］
− 変換ブロックサイズを指定する変数ｎＴｂＳ
このプロセスの出力は以下の通りである。
− ｘ，ｙ＝０．．ｎＴｂＳ−１である、予測サンプルｐｒｅｄＳａｍｐｌｅｓ［ｘ］［ｙ］
ｘ，ｙ＝０．．ｎＴｂＳ−１である予測サンプルｐｒｅｄＳａｍｐｌｅｓ［ｘ］［ｙ］の値は、次の順序のステップによって指定されるように導出される。
１．下位条項Ｈ．８．４．４．２．１２．３に指定されているウェッジレットパターン拡張プロセスは、Ｌｏｇ２（ｎＴｂＳ）、ｗｅｄｇｅ＿ｆｕｌｌ＿ｔａｂ＿ｉｄｘ［ｘＴｂ］［ｙＴｂ］、ｗｅｄｇｅ＿ｓｕｂ＿ｃｏｌ［ｘＴｂ］［ｙＴｂ］およびｗｅｄｇｅ＿ｓｕｂ＿ｒｏｗ［ｘＴｂ］［ｙＴｂ］を入力として引き起こされ、出力は、ｗｅｄｇｅＰａｔｔｅｒｎに割り当てられる。［［２進パーティションパターンを指定する、ｘ，ｙ＝０．．ｎＴｂＳ−１である、変数ｗｅｄｇｅＰａｔｔｅｒｎ［ｘ］［ｙ］は、以下のように導出される。

２．下位条項Ｈ．８．４．４．２．１１に指定されている深度パーティション値導出および割当てプロセスは、隣接サンプルｐ［ｘ］［ｙ］、２進パターンｗｅｄｇｅＰａｔｔｅｒｎ［ｘＴｂ］［ｙＴｂ］、変換サイズｎＴｂＳ、ｄｍｍ＿ｄｃ＿ｆｌａｇ［ｘＴｂ］［ｙＴｂ］に等しく設定されたｄｃＯｆｆｓｅｔＡｖａｉｌＦｌａｇ、０に等しく設定されたｉｎｔｒａＣｈａｉｎＦｌａｇ、ならびにＤＣオフセットのＤｃＯｆｆｓｅｔ［ｘＴｂ］［ｙＴｂ］［０］およびＤｃＯｆｆｓｅｔ［ｘＴｂ］［ｙＴｂ］［１］を入力として引き起こされ、出力は、ｐｒｅｄＳａｍｐｌｅｓ［ｘ］［ｙ］に割り当てられる。
３．［［ｘ，ｙ＝０．．ｎＴｂｓ−１（両端値を含む）として、以下が適用される。
− ＷｅｄｇｅＩｄｘ［ｘＴｂ＋ｘ］［ｙＴｂ＋ｙ］は、ｗｅｄｇｅ＿ｆｕｌｌ＿ｔａｂ＿ｉｄｘ［ｘＴｂ］［ｙＴｂ］に等しく設定される。］］
Ｈ．８．４．４．２．８イントラ予測モードＩＮＴＲＡ＿ＤＭＭ＿ＷＰＲＥＤＴＥＸの指定
このプロセスへの入力は以下の通りである。
− 現在のピクチャの左上サンプルに対する現在のブロックの左上サンプルを指定するサンプルロケーション（ｘＴｂ，ｙＴｂ）
− ｘ＝−１、ｙ＝−１．．ｎＴｂＳ×２−１、およびｘ＝０．．ｎＴｂＳ×２−１、ｙ＝−１である、隣接サンプルｐ［ｘ］［ｙ］
− 変換ブロックサイズを指定する変数ｎＴｂＳ
このプロセスの出力は以下の通りである。
− ｘ，ｙ＝０．．ｎＴｂＳ−１である、予測サンプルｐｒｅｄＳａｍｐｌｅｓ［ｘ］［ｙ］
ｘ，ｙ＝０．．ｎＴｂＳ−１である予測サンプルｐｒｅｄＳａｍｐｌｅｓ［ｘ］［ｙ］の値は、以下の通りである。
− ｔｅｘｔｕｒｅＩｎｔｒａＰｒｅｄＭｏｄｅに応じて、変数ｗｅｄｇｅＩｄｘが、以下で指定されるように導出される。

− 下位条項Ｈ．８．４．４．２．１２．３に指定されているウェッジレットパターン拡張プロセスは、Ｌｏｇ２（ｎＴｂＳ）、ｗｅｄｇｅＩｄｘ、ｗｅｄｇｅ＿ｓｕｂ＿ｃｏｌ［ｘＴｂ］［ｙＴｂ］およびｗｅｄｇｅ＿ｓｕｂ＿ｒｏｗ［ｘＴｂ］［ｙＴｂ］を入力として引き起こされ、出力は、ｗｅｄｇｅＰａｔｔｅｒｎに割り当てられる。［［２進パーティションパターンを指定する、ｘ，ｙ＝０．．ｎＴｂＳ−１である、変数ｗｅｄｇｅＰａｔｔｅｒｎ［ｘ］［ｙ］は、以下のように導出される。

− 下位条項Ｈ．８．４．４．２．１１に指定されている深度パーティション値導出および割当てプロセスは、隣接サンプルｐ［ｘ］［ｙ］、２進パターンｗｅｄｇｅＰａｔｔｅｒｎ［ｘ］［ｙ］、変換サイズｎＴ、ｄｍｍ＿ｄｃ＿ｆｌａｇ［ｘＴｂ］［ｙＴｂ］に等しく設定されたｄｃＯｆｆｓｅｔＡｖａｉｌＦｌａｇ、０に等しく設定されたｉｎｔｒａＣｈａｉｎＦｌａｇ、ならびにＤＣオフセットのＤｃＯｆｆｓｅｔ［ｘＴｂ］［ｙＴｂ］［０］およびＤｃＯｆｆｓｅｔ［ｘＴｂ］［ｙＴｂ］［１］を入力として引き起こされ、出力は、ｐｒｅｄＳａｍｐｌｅｓ［ｘ］［ｙ］に割り当てられる。
Ｈ．８．４．４．２．１２．３ウェッジレットパターン拡張プロセス
このプロセスへの入力は以下の通りである。
− ２進パーティションパターンサイズを指定する変数ｌｏｇ２ＢｌｋＳｉｚｅ
− ４×４ウェッジレットインデックスを指定する変数ｓｕｂＩｄｘ
− 左上４×４ブロックの水平位置を指定する変数ｘＳｕｂ
− 左上４×４ブロックの垂直位置を指定する変数ｙＳｕｂ
このプロセスの出力は以下の通りである。
− サイズ（１＜＜ｌｏｇ２ＢｌｋＳｉｚｅ）×（１＜＜ｌｏｇ２ＢｌｋＳｉｚｅ）の２進アレイｗｅｄｇｅＰａｔｔｅｒｎ［ｘ］［ｙ］
４×４ウェッジレットパターンのパーティション線開始位置を指定する変数ｘＳおよびｙＳは、次のように導出される。

４×４ウェッジレットパターンのパーティション線終了位置を指定する変数ｘＥおよびｙＥは、次のように導出される。

ｌｏｇ２ＢｌｋＳｉｚｅが２に等しい場合、以下が適用される。
− ＷｅｄｇｅＰａｔｔｅｒｎＴａｂｌｅ［２］［ｓｕｂＩｄｘ］がｗｅｄｇｅＰａｔｔｅｒｎに割り当てられる。
そうでない場合、以下が適用される。
− ｘＳ！＝ｘＥまたはｙＳ！＝ｙＥの場合、以下が適用される。

− そうでない場合、以下が適用される。

− ｙＳｕｂ＝＝０の場合、以下が適用される。

− そうでない場合、以下が適用される。

Ｈ．８．４．４．３深度値再構成プロセス
このプロセスへの入力は以下の通りである。
− 現在のピクチャの左上ルーマサンプルに対する現在のブロックの左上ルーマサンプルを指定するルーマロケーション（ｘＴｂ，ｙＴｂ）
− 変換ブロックサイズを指定する変数ｎＴｂＳ
− ｘ，ｙ＝０．．ｎＴｂＳ−１である、予測サンプルｐｒｅｄＳａｍｐｌｅｓ［ｘ］［ｙ］
− イントラ予測モードｐｒｅｄＭｏｄｅＩｎｔｒａ
このプロセスの出力は以下の通りである。
− ｘ，ｙ＝０．．ｎＴｂＳ−１である、再構成された深度値サンプルｒｅｓＳａｍｐｌｅｓ［ｘ］［ｙ］
ｐｒｅｄＭｏｄｅＩｎｔｒａに応じて、２進セグメント化パターンを指定する、ｘ，ｙ＝０．．ｎＴｂｓ−１である、アレイｗｅｄｇｅＰａｔｔｅｒｎ［ｘ］［ｙ］は、次のように導出される。
− ｐｒｅｄＭｏｄｅＩｎｔｒａがＩＮＴＲＡ＿ＤＭＭ＿ＷＦＵＬＬに等しい場合、下位条項Ｈ．８．４．４．２．１２．３に指定されているウェッジレットパターン拡張プロセスは、Ｌｏｇ２（ｎＴｂＳ）、ｗｅｄｇｅ＿ｆｕｌｌ＿ｔａｂ＿ｉｄｘ［ｘＴｂ］［ｙＴｂ］、ｗｅｄｇｅ＿ｓｕｂ＿ｃｏｌ［ｘＴｂ］［ｙＴｂ］およびｗｅｄｇｅ＿ｓｕｂ＿ｒｏｗ［ｘＴｂ］［ｙＴｂ］を入力として引き起こされ、出力は、ｗｅｄｇｅＰａｔｔｅｒｎに割り当てられる。［［以下が適用される。

− そうでない（ｐｒｅｄＭｏｄｅＩｎｔｒａがＩＮＴＲＡ＿ＤＭＭ＿ＷＦＵＬＬに等しくない）場合、以下が適用される。
− ｘ，ｙ＝０．．ｎＴｂＳ−１として、ｗｅｄｇｅＰａｔｔｅｒｎ［ｘ］［ｙ］が０に等しく設定される。
ｄｌｔ＿ｆｌａｇ［ｎｕｈ＿ｌａｙｅｒ＿ｉｄ］に応じて、再構成された深度値サンプルｒｅｓＳａｍｐｌｅｓ［ｘ］［ｙ］が、以下で指定されるように導出される。
− ｄｌｔ＿ｆｌａｇ［ｎｕｈ＿ｌａｙｅｒ＿ｉｄ］が０に等しい場合、以下が適用される。
− ｘ，ｙ＝０．．ｎＴｂＳ−１として、再構成された深度値サンプルｒｅｓＳａｍｐｌｅｓ［ｘ］［ｙ］が、以下で指定されるように導出される。

− そうでない（ｄｌｔ＿ｆｌａｇ［ｎｕｈ＿ｌａｙｅｒ＿ｉｄ］が１に等しい）場合、以下が適用される。
− 変数ｄｃＰｒｅｄ［０］およびｄｃＰｒｅｄ［１］が、以下で指定されるように導出される。

− そうでなく、ｐｒｅｄＭｏｄｅＩｎｔｒａがＩＮＴＲＡ＿ＰＬＡＮＡＲに等しい場合、以下が適用される。

− そうでない（ｐｒｅｄＭｏｄｅＩｎｔｒａがＩＮＴＲＡ＿ＤＭＭ＿ＷＦＵＬＬに等しい）場合、以下が適用される。

− ｘ，ｙ＝０．．ｎＴｂＳ−１として、再構成された深度値サンプルｒｅｓＳａｍｐｌｅｓ［ｘ］［ｙ］が、以下で指定されるように導出される。

[0223]第２の例示的な技法では、第１の例示的な技法に類似するが、現在の３Ｄ−ＨＥＶＣの復号プロセスに対する以下の変更も含まれる。この第２の例示的な技法は、Ｎ×ＮウェッジレットパターンによりＮ×ＮのＰＵにおいて位置（ｍ，ｎ）がどのパーティションに属するかを、対応するウェッジレットパターンにより２Ｎ×２ＮのＰＵにおいて決定位置（２ｍ，２ｎ）がどのパーティションに属するかと、２Ｎ×２Ｎのブロックにおける決定位置（２ｍ，２ｎ）の移動、すなわち、（２ｍ，２ｎ）に加えられる（オフセットＸ，オフセットＹ）のオフセットベクトルとに従って導出するために説明され、ここにおいて、オフセットＸまたはオフセットＹが０または１に等しく、現在の３Ｄ−ＨＥＶＣの場合のような様々な条件への依存が取り除かれる。いくつかの例では、この変更は、例１に関して上記で説明した技法とともに行われ得る。他の例では、この変更は、第１の例示的な技法において説明した技法とは無関係に行われることもある。
Ｈ．８．４．４．２．１２．１ウェッジレットパターン生成プロセス
．．．
４．ｘ，ｙ＝０．．ｐａｔｔｅｒｎＳｉｚｅ−１である、２進パーティションパターンｗｅｄｇｅＰａｔｔｅｒｎ［ｘ］［ｙ］が、以下で指定されるように導出される。
− ｒｅｓＳｈｉｆｔが１に等しい場合、以下が適用される。
− ［［ｗｅｄｇｅＯｒｉに応じて、変数ｘＯＦＦおよびｙＯｆｆが表Ｈ−８に指定されているように設定される。

− ］］
− ｘ，ｙ＝０．．ｐａｔｔｅｒｎＳｉｚｅ−１として、以下が適用される。

− そうでない（ｒｅｓＳｈｉｆｔが１に等しくない）場合、ｗｅｄｇｅＰａｔｔｅｒｎはｃｕｒＰａｔｔｅｒｎに等しく設定される。

[0224]第１の例示的な技法に類似するが、（第１の例示的な技法に対する、下線およびボールド体とともに示される）以下の変更はまた、Ｎ×Ｎ（Ｎ＞４）ウェッジレットパターンのための提案される方法における１サンプルパーティション（パーティションパターンにおける左上サンプルは、すべての他のサンプルの異なるパーティションに属する）をカバーするようにさらに含まれ、そのような１サンプルパーティションは、第１の例示的な技法を使用して生成されることが可能ではないことがある。
Ｈ．８．４．４．２．１２．３ウェッジレットパターン拡張プロセス
このプロセスへの入力は以下の通りである。
− ２進パーティションパターンサイズを指定する変数ｌｏｇ２ＢｌｋＳｉｚｅ
− ４×４ウェッジレットインデックスを指定する変数ｓｕｂＩｄｘ
− 左上４×４ブロックの水平位置を指定する変数ｘＳｕｂ
− 左上４×４ブロックの垂直位置を指定する変数ｙＳｕｂ
このプロセスの出力は以下の通りである。
− サイズ（１＜＜ｌｏｇ２ＢｌｋＳｉｚｅ）×（１＜＜ｌｏｇ２ＢｌｋＳｉｚｅ）の２進アレイｗｅｄｇｅＰａｔｔｅｒｎ［ｘ］［ｙ］
４×４ウェッジレットパターンのパーティション線開始位置を指定する変数ｘＳおよびｙＳは、次のように導出される。

− そうでない場合、以下が適用される。

− ｘＳｕｂ＝＝０＆＆ｙＳｕｂ＝＝０の場合、以下が適用される。

− そうでなく、ｙＳｕｂ＝＝０の場合、以下が適用される。

− そうでない場合、以下が適用される。

[0225]本開示の技法について概して３Ｄ−ＨＥＶＣに関して説明したが、本技法はこのように限定されない。上記で説明した技法はまた、他の現在の規格またはまだ開発されていない将来の規格に適用可能であり得る。たとえば、深度コーディングのための技法はまた、ＨＥＶＣのマルチビュー拡張（たとえば、いわゆるＭＶ−ＨＥＶＣ）、ＨＥＶＣへのスケーラブル拡張、または深度コンポーネントを有する他の現在もしくは将来の規格に適用可能であり得る。

[0226]以下では、３Ｄ−ＨＥＶＣにおけるイントラ予測モードに関するいくつかのさらなる技法について説明する。本開示は、本開示で説明する技法を理解するのをさらに助けるために提供される。ただし、いくつかの技法は、本開示に必要とされず、本開示で説明する技法とともに利用され得るか、または本開示で説明する技法の別の例であり得る。

[0227]領域境界チェーンコーディングモードの場合、３Ｄ−ＨＥＶＣでは、領域境界チェーンコーディングモードは、深度スライスのイントラ予測ユニットをコーディングするためにＨＥＶＣイントラ予測モードおよびＤＭＭモードとともに導入される。簡潔のために、「領域境界チェーンコーディングモード」は、本明細書で説明する本文、表および図において簡潔のために「チェーンコーディング」によって示される。

[0228]ビデオエンコーダ２０は、チェーンの開始位置、チェーンコードの数、およびチェーンコードごとの、および方向インデックスにより、ＰＵのチェーンコーディングをシグナリングし得る。チェーンは、サンプルとそれの８連結性サンプルのうちの１つとの間の連結である。図１０に示すように、８つの異なるタイプのチェーンがあり、各々は、０から７にわたる方向インデックスを割り当てられる。

[0229]図１０は、領域境界チェーンコーディングモードを示す概念図である。たとえば、図１０の上部分は、チェーンコーディングにおいて定義される８個の可能なタイプのチェーンを示している。図１０の下部分は、チェーンコーディングにおける１つの深度ＰＵパーティションパターンとコーディングされたチェーンとを示している。

[0230]チェーンコーディングプロセスの一例が図１０に示されている。図１０に示す任意のパーティションパターンをシグナリングするために、ビデオエンコーダ２０は、パーティションパターンを識別することができ、ビットストリームにおける以下の情報を符号化する。ビデオエンコーダ２０は、チェーンが上境界から開始することをシグナリングするために、１ビット「０」を符号化し得る。ビデオエンコーダ２０は、上境界における開始位置「３」をシグナリングするために、３ビット「０１１」を符号化し得る。ビデオエンコーダ２０は、チェーンの総数が７であることをシグナリングするために、４ビット「０１１０」を符号化し得る。ビデオエンコーダ３０は、一連の連結チェーンインデックス「３、３、３、７、１、１、１」を符号化することができ、各チェーンインデックスが、ルックアップテーブルを使用してコードワードに変換される。

[0231]３Ｄ−ＨＥＶＣは、（たとえば、ＤＭＭに関して上記で説明した、コロケートテクスチャコンポーネントに基づく区分ではなく）パーティション境界の明示的シグナリングを可能にする領域境界チェーンコーディングモードを含む。上述のように、本開示では、「領域境界チェーンコーディングモード」を「チェーンコーディング」と呼ぶことがある。

[0232]概して、チェーンは、サンプルとそれの８連結性サンプルのうちの１つとの間の連結である。図１０のブロック１６０によって示されているように、８つの異なるチェーン方向タイプがあり、各々は、０から７にわたる方向インデックスを割り当てられる。チェーン方向タイプは、ビデオコーダが深度ブロックのパーティションを決定するのを助け得る。

[0233]たとえば、図１０の例は、区分構造を示すチェーン１６６によって分離された第１のパーティション１６２と第２のパーティション１６４とを含む。（ビデオエンコーダ２０などの）ビデオエンコーダは、ＰＵのためのチェーン１６６を決定し、それを符号化されたビットストリーム中でシグナリングし得、（ビデオデコーダ３０などの）ビデオデコーダは、符号化ビットストリームからのチェーン１６６を表すデータをパースし得る。

[0234]概して、チェーン１６６は、開始位置と、チェーン中のリンクの数（たとえば、チェーンコードの数）の指示と、チェーンコードごとの方向インデックスとを含む。チェーン１６６のための他のタイプのシグナリングも使用され得る。一例では、図１０の例に示された任意のパーティションパターンをシグナリングするために、ビデオエンコーダ２０は、チェーン１６６が上境界から開始することを示すために１ビット（たとえば、０）を符号化し得る。ビデオエンコーダ２０は、チェーン１６６が上境界の第３の深度サンプルの後に開始することを示すために３ビット（たとえば、０１１）を符号化し得る。ビデオエンコーダ２０は、チェーン１６６中に合計７つのリンクがあることを示すために４ビット（たとえば、０１１０）を符号化し得る。ビデオエンコーダ２０はまた、（たとえば、ブロック１６０に従って）各チェーンリンクの方向を示すために一連の連結チェーンインデックス（たとえば、３，３，３，７，１，１，１）を符号化し得る。いくつかの例では、ビデオエンコーダ２０は、ルックアップテーブルを使用して各インデックスをコードワードに変換し得る。ビデオデコーダ３０などのビデオデコーダは、ブロックの区分パターンを決定するために、上記で説明したシグナリングをパースし得る。ビデオデコーダ３０は、次いで、各パーティションのための深度値を復号し得る。

[0235]本開示で説明する技法は、簡略深度コーディング（ＳＤＣ）とともに機能することもできるが、技法はそのように限定されず、ＳＤＣが利用されない例において機能し得る。以下では、簡略深度コーディング（ＳＤＣ）モードについて説明する。ＳＤＣモードは、深度スライスのイントラＰＵをコーディングするために、ＨＥＶＣイントラ予測モード、ＤＭＭモード、およびチェーンコーディングモードとともに導入されている。現在の３Ｄ−ＨＥＶＣでは、ＳＤＣは、２Ｎ×２ＮＰＵパーティションサイズのためにのみ適用される。量子化変換係数をコーディングする代わりに、ＳＤＣモードは、以下の２つのタイプの情報を用いて深度ブロックを表す。（１）ＤＭＭモード１（２つのパーティション）と平面（１つのパーティション）とを含む、現在の深度ブロックのパーティションのタイプ、および（２）パーティションごとに、（ピクセル領域における）残差値がビットストリームにおいてシグナリングされる。

[0236]それぞれ平面およびＤＭＭモード１のパーティションタイプに対応するＳＤＣモード１とＳＤＣモード２とを含む２つのサブモードが、ＳＤＣにおいて定義される。簡略残差コーディングがＳＤＣにおいて使用される。簡略残差コーディングでは、ＰＵのパーティションごとに１つのＤＣ残差値がシグナリングされ、変換または量子化は適用されない。

[0237]例に応じて、本明細書で説明した方法のうちのいずれかのいくつかの動作またはイベントは、異なる順序で実行されてよく、互いに追加、統合、または完全に除外され得る（たとえば、すべての説明された動作またはイベントが、本方法の実施のために必要であるとは限らない）ことを理解されたい。その上、いくつかの例では、動作またはイベントは、連続してではなく、同時に、たとえば、マルチスレッド処理、割込み処理、または複数のプロセッサを通じて実行され得る。加えて、本開示の特定の態様が、明確さの目的のため、単一のモジュールまたはユニットによって実行されるものとして説明されているが、本開示の技法は、ビデオコーダに関連付けられているユニットまたはモジュールの組合せによって実行され得ることを理解されたい。

[0238]技法の様々な態様の特定の組合せについて上記で説明したが、これらの組合せは、本開示で説明した技法の例を示すために与えられたものにすぎない。したがって、本開示の技法は、これらの例示的な組合せに限定されるべきでなく、本開示で説明した技法の様々な態様の任意の想起可能な組合せを包含し得る。

[0239]１つまたは複数の例では、説明した機能は、ハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の組合せで実装され得る。ソフトウェアで実装される場合、機能は、コンピュータ可読媒体上の１つもしくは複数の命令またはコード上に記憶され、あるいはこれを介して伝送され、ハードウェアベースの処理ユニットによって実行され得る。コンピュータ可読媒体は、データ記憶媒体などの有形の媒体に対応するコンピュータ可読記憶媒体、または、たとえば、通信プロトコルに従う、ある場所から別の場所へのコンピュータプログラムの転送を容易にする任意の媒体を含む通信媒体を含み得る。

[0240]このようにして、コンピュータ可読媒体は、一般に、（１）非一時的である有形のコンピュータ可読記憶媒体、または（２）信号または搬送波のような通信媒体に対応し得る。データ記憶媒体は、本開示で説明する技法の実装のための命令、コードおよび／またはデータ構造を取り出すために、１つもしくは複数のコンピュータまたは１つもしくは複数のプロセッサによってアクセスされ得る、任意の利用可能な媒体であり得る。コンピュータプログラム製品はコンピュータ可読記憶媒体とパッケージング材料とを含み得る。

[0241]限定ではなく例として、そのようなコンピュータ可読記憶媒体は、ＲＡＭ、ＲＯＭ、ＥＥＰＲＯＭ（登録商標）、ＣＤ−ＲＯＭもしくは他の光ディスクストレージ、磁気ディスクストレージ、もしくは他の磁気ストレージデバイス、フラッシュメモリ、または、命令またはデータ構造の形態の所望のプログラムコードを記憶するために使用され得、コンピュータによってアクセスされ得る任意の他の媒体を備え得る。また、任意の接続が、コンピュータ可読媒体と適切に呼ばれる。たとえば、命令が、ウェブサイト、サーバ、または他の遠隔ソースから、同軸ケーブル、光ファイバーケーブル、ツイストペア、デジタル加入者回線（ＤＳＬ）、または赤外線、無線、およびマイクロ波などのワイヤレス技術を使用して送信される場合、同軸ケーブル、光ファイバーケーブル、ツイストペア、ＤＳＬ、または赤外線、無線、マイクロ波などのワイヤレス技術は、媒体の定義に含まれる。

[0242]ただし、コンピュータ可読記憶媒体およびデータ記憶媒体は、接続、搬送波、信号、または他の一時的媒体を含まないが、代わりに、非一時的な有形記憶媒体を対象とすることを理解されたい。本明細書で使用するディスク（disk）およびディスク（disc）は、コンパクトディスク（disc）（ＣＤ）、レーザーディスク（登録商標）（disc）、光ディスク（disc）、デジタル多用途ディスク（disc）（ＤＶＤ）、フロッピー（登録商標）ディスク（disk）、およびｂｌｕ−ｒａｙディスク（disc）を含み、ディスク（disk）は、通常、データを磁気的に再生し、ディスク（disc）は、データをレーザーで光学的に再生する。上記の組合せも、コンピュータ可読媒体の範囲の中に含まれるべきである。

[0243]命令は、１つもしくは複数のデジタル信号プロセッサ（ＤＳＰ）、汎用マイクロプロセッサ、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、または他の同等の集積回路もしくはディスクリート論理回路などの１つまたは複数のプロセッサによって実行され得る。したがって、「プロセッサ」という用語は、本明細書で使用されるときに、前述の構造のいずれかまたは本明細書で説明した技法の実装に適切な任意の他の構造を指すことができる。加えて、いくつかの態様では、本明細書で説明した機能は、符号化および復号のために構成されるか、または複合コーデックに組み込まれる、専用のハードウェアモジュールおよび／またはソフトウェアモジュール内で提供され得る。また、本技法は、１つまたは複数の回路または論理素子において完全に実装され得る。

[0244]本開示の技法は、ワイヤレスハンドセット、集積回路（ＩＣ）またはＩＣのセット（たとえば、チップセット）を含む、多種多様なデバイスまたは装置で実装され得る。様々な構成要素、モジュール、またはユニットは、開示されている技術を実行するように構成されたデバイスの機能的態様を強調するように本開示において説明されているが、異なるハードウェアユニットによる実現を必ずしも必要としない。そうではなく、上記で説明したように、様々なユニットは、コーデックハードウェアユニット中で組み合わせられるか、または上記で説明した１つまたは複数のプロセッサを含む、適切なソフトウェアおよび／またはファームウェアとともに相互動作可能なハードウェアユニットの集合によって提供され得る。

[0245]本開示の様々な態様が説明されてきた。これらおよび他の態様は以下の特許請求の範囲内に入る。
以下に、本願出願の当初の特許請求の範囲に記載された発明を付記する。
［Ｃ１］
ビデオデータを復号する方法であって、
第１のサイズのブロックに関連するパーティションパターンを決定することと、
前記第１のサイズの前記ブロックに関連する前記決定されたパーティションパターンに基づいて、第２のサイズの深度ブロックに関するパーティションパターンを決定することと、ここにおいて、前記第２のサイズが前記第１のサイズよりも大きい、
前記深度ブロックに関する前記決定されたパーティションパターンに基づいて、前記深度ブロックをイントラ予測復号することと
を備える方法。
［Ｃ２］
前記第１のサイズのブロックに関連する前記パーティションパターンは、サイズ１６×１６のブロックに関連するパーティションパターンを備え、前記第２のサイズの前記深度ブロックに関する前記パーティションパターンを決定することは、サイズ１６×１６の前記ブロックに関連する前記決定されたパーティションパターンに基づいて、サイズ３２×３２の前記深度ブロックに関する前記パーティションパターンを決定することを備える、Ｃ１に記載の方法。
［Ｃ３］
前記第１のサイズの前記ブロックに関連する１つまたは複数のパーティションパターンを含むパーティションパターンリストを構成することと、
前記パーティションパターンリストへのインデックスを受信することと
をさらに備え、
前記第１のサイズの前記ブロックに関連する前記パーティションパターンを決定することは、前記パーティションパターンリストへの前記受信されたインデックスに基づいて、前記第１のサイズの前記ブロックに関連する前記パーティションパターンを決定することを備える、Ｃ１に記載の方法。
［Ｃ４］
前記深度ブロック内のサブブロックを識別する情報を受信することをさらに備え、前記サブブロックのサイズが前記第１のサイズであり、
前記第１のサイズのブロックに関連する前記パーティションパターンを決定することは、前記サブブロックに関する前記パーティションパターンを決定することを備え、
前記第２のサイズの前記深度ブロックに関する前記パーティションパターンを決定することは、前記サブブロックに関する前記決定されたパーティションパターンに基づいて、前記第２のサイズの前記深度ブロックに関する前記パーティションパターンを決定することを備える、Ｃ１に記載の方法。
［Ｃ５］
前記サブブロックに関する前記決定されたパーティションパターンに基づいて、前記第２のサイズの前記深度ブロックに関する前記パーティションパターンを決定することは、前記サブブロックに関する前記パーティションパターンの線形線を前記深度ブロックの境界まで拡張することを備え、得られる線形線が、前記深度ブロックに関する前記パーティションパターンを画定する、Ｃ４に記載の方法。
［Ｃ６］
前記第１のサイズの前記ブロックに関連する前記決定されたパーティションパターンは、前記第１のサイズの前記ブロックに関連する複数の線ベースのパーティションパターンからの線ベースのパーティションパターンを備え、前記深度ブロックに関する前記パーティションパターンは、２つのパーティションに前記深度ブロックを区分する前記深度ブロックに関する線ベースのパーティションパターンを備える、Ｃ１に記載の方法。
［Ｃ７］
前記第２のサイズの前記深度ブロックに関する前記パーティションパターンを決定することは、前記第２のサイズの前記深度ブロックに関する前記パーティションパターンを示す情報を受信することなく、前記第２のサイズの前記深度ブロックに関する前記パーティションパターンを決定することを備える、Ｃ１に記載の方法。
［Ｃ８］
ビデオデータを符号化する方法であって、
第１のサイズのブロックに関連するパーティションパターンを決定することと、
前記第１のサイズの前記ブロックに関連する前記決定されたパーティションパターンに基づいて、第２のサイズの深度ブロックに関するパーティションパターンを決定することと、ここにおいて、前記第２のサイズが前記第１のサイズよりも大きい、
前記深度ブロックに関する前記決定されたパーティションパターンに基づいて、前記深度ブロックをイントラ予測符号化することと
を備える方法。
［Ｃ９］
前記第１のサイズのブロックに関連する前記パーティションパターンは、サイズ１６×１６のブロックに関連するパーティションパターンを備え、前記第２のサイズの前記深度ブロックに関する前記パーティションパターンを決定することは、サイズ１６×１６の前記ブロックに関連する前記決定されたパーティションパターンに基づいて、サイズ３２×３２の前記深度ブロックに関する前記パーティションパターンを決定することを備える、Ｃ８に記載の方法。
［Ｃ１０］
前記第１のサイズの前記ブロックに関連する１つまたは複数のパーティションパターンを含むパーティションパターンリストを構成すること
をさらに備え、
前記第１のサイズの前記ブロックに関連する前記パーティションパターンを決定することは、前記構成されたパーティションパターンリストにおいて識別されたパーティションパターンから、前記第１のサイズの前記ブロックに関連する前記パーティションパターンを決定することを備える、Ｃ８に記載の方法。
［Ｃ１１］
前記第１のサイズの前記ブロックに関連する前記決定されたパーティションパターンを識別する前記構成されたパーティションパターンリストへのインデックスをシグナリングすることをさらに備え、ビデオデコーダが、前記深度ブロックをイントラ予測復号するために前記インデックスを使用する、Ｃ１０に記載の方法。
［Ｃ１２］
前記深度ブロック内のサブブロックを識別することをさらに備え、前記サブブロックのサイズが前記第１のサイズであり、
前記第１のサイズの前記ブロックに関連する前記パーティションパターンを決定することは、前記識別されたサブブロックに関する前記パーティションパターンを決定することを備え、
前記第２のサイズの前記深度ブロックに関する前記パーティションパターンを決定することは、前記識別されたサブブロックに関する前記決定されたパーティションに基づいて、前記第２のサイズの前記深度ブロックに関する前記パーティションパターンを決定することを備える、Ｃ８に記載の方法。
［Ｃ１３］
前記識別されたサブブロックに関する前記決定されたパーティションパターンに基づいて、前記第２のサイズの前記深度ブロックに関する前記パーティションパターンを決定することは、前記識別されたサブブロックに関する前記パーティションパターンの線形線を前記深度ブロックの境界まで拡張することを備え、得られる線形線が、前記深度ブロックに関する前記パーティションパターンを画定する、Ｃ１２に記載の方法。
［Ｃ１４］
前記第１のサイズの前記ブロックに関連する前記パーティションパターンは、前記第１のサイズの前記ブロックに関連する複数の線ベースのパーティションパターンからの線ベースのパーティションパターンを備え、前記深度ブロックに関する前記パーティションパターンは、２つのパーティションに前記深度ブロックを区分する前記深度ブロックに関する線ベースのパーティションパターンを備える、Ｃ８に記載の方法。
［Ｃ１５］
ビデオコーディングのためのデバイスであって、
第１のサイズのブロックに関連する１つまたは複数のパーティションパターンを記憶するビデオデータメモリと、
１つまたは複数のプロセッサを備えるビデオコーダとを備え、前記ビデオコーダは、
前記記憶された１つまたは複数のパーティションパターンから、前記第１のサイズの前記ブロックに関連するパーティションパターンを決定することと、
前記第１のサイズの前記ブロック関連する前記決定されたパーティションパターンに基づいて、第２のサイズの深度ブロックに関するパーティションパターンを決定することと、ここにおいて、前記第２のサイズが前記第１のサイズよりも大きい、
前記深度ブロックに関する前記決定されたパーティションパターンに基づいて、前記深度ブロックをイントラ予測コーディングすることと
を行うように構成される、デバイス。
［Ｃ１６］
前記第１のサイズのブロックに関連する前記パーティションパターンは、サイズ１６×１６のブロック関連するパーティションパターンを備え、前記第２のサイズの前記深度ブロックは、サイズ３２×３２の深度ブロックを備え、前記ビデオコーダは、サイズ１６×１６の前記ブロックに関連する前記決定されたパーティションパターンに基づいて、サイズ３２×３２の前記深度ブロックに関する前記パーティションパターンを決定するように構成される、Ｃ１５に記載のデバイス。
［Ｃ１７］
前記ビデオコーダはビデオデコーダを備え、
前記ビデオデコーダは、
前記第１のサイズの前記ブロックに関連する１つまたは複数のパーティションパターンを含むパーティションパターンリストを構成することと、
前記パーティションパターンリストへのインデックスを受信することと
を行うように構成され、
前記第１のサイズの前記ブロックに関連する前記パーティションパターンを決定するために、前記ビデオデコーダは、前記パーティションパターンリストへの前記受信されたインデックスに基づいて、前記第１のサイズの前記ブロックに関連する前記パーティションパターンを決定するように構成され、
前記深度ブロックをイントラ予測コーディングするために、前記ビデオデコーダは、前記深度ブロックに関する前記決定されたパーティションパターンに基づいて、前記深度ブロックをイントラ予測復号するように構成される、Ｃ１５に記載のデバイス。
［Ｃ１８］
前記ビデオコーダはビデオデコーダを備え、
前記ビデオデコーダは、前記深度ブロック内のサブブロックを識別する情報を受信するように構成され、前記サブブロックのサイズが前記第１のサイズであり、
前記第１のサイズの前記ブロックに関連する前記パーティションパターンを決定するために、前記ビデオデコーダは、前記サブブロックに関する前記パーティションパターンを決定するように構成され、
前記第２のサイズの前記深度ブロックに関する前記パーティションパターンを決定するために、前記ビデオデコーダは、前記サブブロックに関する前記決定されたパーティションパターンに基づいて、前記第２のサイズの前記深度ブロックに関する前記パーティションパターンを決定するように構成される、Ｃ１５に記載のデバイス。
［Ｃ１９］
前記ビデオコーダはビデオデコーダを備え、
前記第２のサイズの前記深度ブロックに関する前記パーティションパターンを決定するために、前記ビデオデコーダは、前記第２のサイズの前記深度ブロックに関する前記パーティションパターンを示す情報を受信することなく、前記第２のサイズの前記深度ブロックに関する前記パーティションパターンを決定するように構成される、Ｃ１５に記載のデバイス。
［Ｃ２０］
前記ビデオコーダはビデオエンコーダを備え、
前記ビデオエンコーダは、前記第１のサイズの前記ブロックに関連する１つまたは複数のパーティションパターンを含むパーティションパターンリストを構成するように構成され、
前記第１のサイズの前記ブロックに関連する前記パーティションパターンを決定するために、前記ビデオエンコーダは、前記構成されたパーティションパターンリストにおいて識別されたパーティションパターンから、前記第１のサイズの前記ブロックに関連する前記パーティションパターンを決定するように構成され、
前記深度ブロックをイントラ予測コーディングするために、前記ビデオエンコーダは、前記深度ブロックに関する前記決定されたパーティションパターンに基づいて、前記深度ブロックをイントラ予測符号化するように構成される、Ｃ１５に記載のデバイス。
［Ｃ２１］
前記ビデオエンコーダは、前記第１のサイズの前記ブロックに関連する前記決定されたパーティションパターンを識別する前記構成されたパーティションパターンリストへのインデックスをシグナリングするように構成され、ビデオデコーダが、前記深度ブロックをイントラ予測復号するために前記インデックスを使用する、Ｃ２０に記載のデバイス。
［Ｃ２２］
前記ビデオコーダはビデオエンコーダを備え、
前記ビデオエンコーダは、前記深度ブロック内のサブブロックを識別するように構成され、前記サブブロックのサイズが前記第１のサイズであり、
前記第１のサイズの前記ブロックに関連する前記パーティションパターンを決定するために、前記ビデオエンコーダは、前記識別されたサブブロックに関する前記パーティションパターンを決定するように構成され、
前記第２のサイズの前記深度ブロックに関する前記パーティションパターンを決定するために、前記ビデオエンコーダは、前記識別されたサブブロックに関する前記決定されたパーティションに基づいて、前記第２のサイズの前記深度ブロックに関する前記パーティションパターンを決定するように構成される、Ｃ１５に記載のデバイス。
［Ｃ２３］
前記第１のサイズの前記ブロックに関連する前記パーティションパターンは、前記第１のサイズの前記ブロックに関連する複数の線ベースのパーティションパターンからの線ベースのパーティションパターンを備え、前記深度ブロックに関する前記パーティションパターンは、２つのパーティションに前記深度ブロックを区分する前記深度ブロックに関する線ベースのパーティションパターンを備える、Ｃ１５に記載のデバイス。
［Ｃ２４］
集積回路（ＩＣ）、
マイクロコントローラ、および
前記ビデオコーダを備えるワイヤレスデバイス
のうちの１つを備える、Ｃ１５に記載のデバイス。
［Ｃ２５］
ビデオコーディングのためのデバイスの１つまたは複数のプロセッサによって実行されたときに、前記１つまたは複数のプロセッサに、
第１のサイズのブロックに関連するパーティションパターンを決定することと、
前記第１のサイズの前記ブロックに関連する前記決定されたパーティションパターンに基づいて、第２のサイズの深度ブロックに関するパーティションパターンを決定することと、ここにおいて、前記第２のサイズが前記第１のサイズよりも大きい、
前記深度ブロックに関する前記決定されたパーティションパターンに基づいて、前記深度ブロックをイントラ予測コーディングすることと
を行わせる命令を記憶したコンピュータ可読記憶媒体。
［Ｃ２６］
前記第１のサイズの前記ブロックに関連する前記パーティションパターンは、サイズ１６×１６のブロックに関するパーティションパターンを備え、前記１つまたは複数のプロセッサに、前記第２のサイズの前記深度ブロックに関する前記パーティションパターンを決定することを行わせる前記命令は、前記１つまたは複数のプロセッサに、サイズ１６×１６の前記ブロックに関する前記決定されたパーティションパターンに基づいて、サイズ３２×３２の前記深度ブロックに関する前記パーティションパターンを決定することを行わせる命令を備える、Ｃ２５に記載のコンピュータ可読記憶媒体。
［Ｃ２７］
前記第１のサイズのブロックに前記関連する前記パーティションパターンは、前記第１のサイズの前記ブロックに関連する複数の線ベースのパーティションパターンからの線ベースのパーティションパターンを備え、前記深度ブロックに関する前記パーティションパターンは、２つのパーティションに前記深度ブロックを区分する前記深度ブロックに関する線ベースのパーティションパターンを備える、Ｃ２５に記載のコンピュータ可読記憶媒体。

Claims

ビデオデータを復号する方法であって、
第１のサイズのブロックの１つまたは複数のパーティションパターンを含むパーティションパターンリストを構成することと、
前記パーティションパターンリストへのインデックスを受信することと、
前記受信された前記パーティションパターンリストへのインデックスに基づいて、前記第１のサイズの前記ブロックのパーティションパターンを決定することと、
前記第１のサイズの前記ブロックの前記決定されたパーティションパターンに基づいて、第２のサイズの深度ブロックに関するパーティションパターンを決定することと、ここにおいて、前記第２のサイズが前記第１のサイズよりも大きく、前記深度ブロックは、３次元（３Ｄ）ビデオコーディングのフレームワークにおける深度マップのブロックである、
前記第１のサイズの前記ブロックの前記決定されたパーティションパターンを使用して前記第１のサイズの前記ブロックをイントラ予測復号することなく、前記深度ブロックに関する前記決定されたパーティションパターンに基づいて、前記深度ブロックをイントラ予測復号することと
を備える方法。
前記第１のサイズのブロックの前記パーティションパターンは、サイズ１６×１６のブロックのパーティションパターンを備え、前記第２のサイズの前記深度ブロックに関する前記パーティションパターンを決定することは、サイズ１６×１６の前記ブロックの前記決定されたパーティションパターンに基づいて、サイズ３２×３２の前記深度ブロックに関する前記パーティションパターンを決定することを備える、請求項１に記載の方法。
前記深度ブロック内のサブブロックを識別する情報を受信することをさらに備え、前記サブブロックのサイズが前記第１のサイズであり、
前記第１のサイズのブロックの前記パーティションパターンを決定することは、前記サブブロックに関する前記パーティションパターンを決定することを備え、
前記第２のサイズの前記深度ブロックに関する前記パーティションパターンを決定することは、前記サブブロックに関する前記決定されたパーティションパターンに基づいて、前記第２のサイズの前記深度ブロックに関する前記パーティションパターンを決定することを備える、請求項１に記載の方法。
前記サブブロックに関する前記決定されたパーティションパターンに基づいて、前記第２のサイズの前記深度ブロックに関する前記パーティションパターンを決定することは、前記サブブロックに関する前記パーティションパターンの線形線を前記深度ブロックの境界まで拡張することを備え、得られる線形線が、前記深度ブロックに関する前記パーティションパターンを画定する、請求項３に記載の方法。
前記第１のサイズの前記ブロックの前記決定されたパーティションパターンは、前記第１のサイズの前記ブロックの複数の線ベースのパーティションパターンからの線ベースのパーティションパターンを備え、前記深度ブロックに関する前記パーティションパターンは、２つのパーティションに前記深度ブロックを区分する前記深度ブロックに関する線ベースのパーティションパターンを備える、請求項１に記載の方法。
前記第２のサイズの前記深度ブロックに関する前記パーティションパターンを決定することは、前記第２のサイズの前記深度ブロックに関する前記パーティションパターンを示す情報を受信することなく、前記第２のサイズの前記深度ブロックに関する前記パーティションパターンを決定することを備える、請求項１に記載の方法。
ビデオデータを符号化する方法であって、
第１のサイズのブロックの１つまたは複数のパーティションパターンを含むパーティションパターンリストを構成することと、
前記パーティションパターンリストに基づいて、前記第１のサイズの前記ブロックのパーティションパターンを決定することと、
前記第１のサイズの前記ブロックの前記決定されたパーティションパターンに基づいて、第２のサイズの深度ブロックに関するパーティションパターンを決定することと、ここにおいて、前記第２のサイズが前記第１のサイズよりも大きく、前記深度ブロックは、３次元（３Ｄ）ビデオコーディングのフレームワークにおける深度マップのブロックである、
前記第１のサイズの前記ブロックの前記決定されたパーティションパターンを使用して前記第１のサイズの前記ブロックをイントラ予測符号化することなく、前記深度ブロックに関する前記決定されたパーティションパターンに基づいて、前記深度ブロックをイントラ予測符号化することと、
前記第１のサイズの前記ブロックの前記決定されたパーティションパターンを識別する前記構成されたパーティションパターンリストへのインデックスをシグナリングすることと
を備え、ビデオデコーダは、前記深度ブロックをイントラ予測復号するために前記インデックスを使用する、方法。
前記第１のサイズのブロックの前記パーティションパターンは、サイズ１６×１６のブロックのパーティションパターンを備え、前記第２のサイズの前記深度ブロックに関する前記パーティションパターンを決定することは、サイズ１６×１６の前記ブロックの前記決定されたパーティションパターンに基づいて、サイズ３２×３２の前記深度ブロックに関する前記パーティションパターンを決定することを備える、請求項７に記載の方法。
前記第１のサイズの前記ブロックの前記パーティションパターンを決定することは、前記構成されたパーティションパターンリストにおいて識別されたパーティションパターンから、前記第１のサイズの前記ブロックの前記パーティションパターンを決定することを備える、請求項７に記載の方法。
前記深度ブロック内のサブブロックを識別することをさらに備え、前記サブブロックのサイズが前記第１のサイズであり、
前記第１のサイズの前記ブロックの前記パーティションパターンを決定することは、前記識別されたサブブロックに関する前記パーティションパターンを決定することを備え、
前記第２のサイズの前記深度ブロックに関する前記パーティションパターンを決定することは、前記識別されたサブブロックに関する前記決定されたパーティションに基づいて、前記第２のサイズの前記深度ブロックに関する前記パーティションパターンを決定することを備える、請求項７に記載の方法。
前記識別されたサブブロックに関する前記決定されたパーティションパターンに基づいて、前記第２のサイズの前記深度ブロックに関する前記パーティションパターンを決定することは、前記識別されたサブブロックに関する前記パーティションパターンの線形線を前記深度ブロックの境界まで拡張することを備え、得られる線形線が、前記深度ブロックに関する前記パーティションパターンを画定する、請求項１０に記載の方法。
前記第１のサイズの前記ブロックの前記パーティションパターンは、前記第１のサイズの前記ブロックの複数の線ベースのパーティションパターンからの線ベースのパーティションパターンを備え、前記深度ブロックに関する前記パーティションパターンは、２つのパーティションに前記深度ブロックを区分する前記深度ブロックに関する線ベースのパーティションパターンを備える、請求項７に記載の方法。
ビデオコーディングのためのデバイスであって、
第１のサイズのブロックの１つまたは複数のパーティションパターンを記憶するビデオデータメモリと、
１つまたは複数のプロセッサを備えるビデオコーダと
を備え、前記ビデオコーダは、
前記第１のサイズの前記ブロックの前記１つまたは複数のパーティションパターンを含むパーティションパターンリストを構成することと、
前記パーティションパターンリストに基づいて、前記記憶された１つまたは複数のパーティションパターンから、前記第１のサイズの前記ブロックのパーティションパターンを決定することと、ここにおいて、前記パーティションパターンリスト中の前記パーティションパターンは、前記パーティションパターンリスト中のインデックスによって識別される、
前記第１のサイズの前記ブロックの前記決定されたパーティションパターンに基づいて、第２のサイズの深度ブロックに関するパーティションパターンを決定することと、ここにおいて、前記第２のサイズが前記第１のサイズよりも大きく、前記深度ブロックは、３次元（３Ｄ）ビデオコーディングのフレームワークにおける深度マップのブロックである、
前記第１のサイズの前記ブロックの前記決定されたパーティションパターンを使用して前記第１のサイズの前記ブロックをイントラ予測コーディングすることなく、前記深度ブロックに関する前記決定されたパーティションパターンに基づいて、前記深度ブロックをイントラ予測コーディングすることと
を行うように構成される、デバイス。
前記第１のサイズのブロックの前記パーティションパターンは、サイズ１６×１６のブロックのパーティションパターンを備え、前記第２のサイズの前記深度ブロックは、サイズ３２×３２の深度ブロックを備え、前記ビデオコーダは、サイズ１６×１６の前記ブロックの前記決定されたパーティションパターンに基づいて、サイズ３２×３２の前記深度ブロックに関する前記パーティションパターンを決定するように構成される、請求項１３に記載のデバイス。
前記ビデオコーダはビデオデコーダを備え、
前記ビデオデコーダは、
前記パーティションパターンリストへの前記インデックスを受信することを行うように構成され、
前記第１のサイズの前記ブロックの前記パーティションパターンを決定するために、前記ビデオデコーダは、前記受信された前記パーティションパターンリストへのインデックスに基づいて、前記第１のサイズの前記ブロックの前記パーティションパターンを決定するように構成され、
前記深度ブロックをイントラ予測コーディングするために、前記ビデオデコーダは、前記深度ブロックに関する前記決定されたパーティションパターンに基づいて、前記深度ブロックをイントラ予測復号するように構成される、請求項１３に記載のデバイス。
前記ビデオコーダはビデオデコーダを備え、
前記ビデオデコーダは、前記深度ブロック内のサブブロックを識別する情報を受信するように構成され、前記サブブロックのサイズが前記第１のサイズであり、
前記第１のサイズの前記ブロックの前記パーティションパターンを決定するために、前記ビデオデコーダは、前記サブブロックに関する前記パーティションパターンを決定するように構成され、
前記第２のサイズの前記深度ブロックに関する前記パーティションパターンを決定するために、前記ビデオデコーダは、前記サブブロックに関する前記決定されたパーティションパターンに基づいて、前記第２のサイズの前記深度ブロックに関する前記パーティションパターンを決定するように構成される、請求項１３に記載のデバイス。
前記ビデオコーダはビデオデコーダを備え、
前記第２のサイズの前記深度ブロックに関する前記パーティションパターンを決定するために、前記ビデオデコーダは、前記第２のサイズの前記深度ブロックに関する前記パーティションパターンを示す情報を受信することなく、前記第２のサイズの前記深度ブロックに関する前記パーティションパターンを決定するように構成される、請求項１３に記載のデバイス。
前記ビデオコーダはビデオエンコーダを備え、
前記深度ブロックをイントラ予測コーディングするために、前記ビデオエンコーダは、前記深度ブロックに関する前記決定されたパーティションパターンに基づいて、前記深度ブロックをイントラ予測符号化するように構成される、請求項１３に記載のデバイス。
前記ビデオエンコーダは、前記第１のサイズの前記ブロックの前記決定されたパーティションパターンを識別する前記構成されたパーティションパターンリストへの前記インデックスをシグナリングするように構成され、ビデオデコーダが、前記深度ブロックをイントラ予測復号するために前記インデックスを使用する、請求項１８に記載のデバイス。
前記ビデオコーダはビデオエンコーダを備え、
前記ビデオエンコーダは、前記深度ブロック内のサブブロックを識別するように構成され、前記サブブロックのサイズが前記第１のサイズであり、
前記第１のサイズの前記ブロックの前記パーティションパターンを決定するために、前記ビデオエンコーダは、前記識別されたサブブロックに関する前記パーティションパターンを決定するように構成され、
前記第２のサイズの前記深度ブロックに関する前記パーティションパターンを決定するために、前記ビデオエンコーダは、前記識別されたサブブロックに関する前記決定されたパーティションに基づいて、前記第２のサイズの前記深度ブロックに関する前記パーティションパターンを決定するように構成される、請求項１３に記載のデバイス。
前記第１のサイズの前記ブロックの前記パーティションパターンは、前記第１のサイズの前記ブロックの複数の線ベースのパーティションパターンからの線ベースのパーティションパターンを備え、前記深度ブロックに関する前記パーティションパターンは、２つのパーティションに前記深度ブロックを区分する前記深度ブロックに関する線ベースのパーティションパターンを備える、請求項１３に記載のデバイス。
集積回路（ＩＣ）、マイクロコントローラ、ワイヤレスデバイス、デスクトップコンピュータ、ラップトップコンピュータ、タブレットコンピュータ、セットトップボックス、電話ハンドセット、テレビジョン、カメラ、ディスプレイデバイス、デジタルメディアプレーヤ、ビデオゲーム機、またはビデオストリーミングデバイスのうちの少なくとも１つを備える、請求項１３に記載のデバイス。
ビデオコーディングのためのデバイスの１つまたは複数のプロセッサによって実行されたときに、前記１つまたは複数のプロセッサに、
第１のサイズのブロックの１つまたは複数のパーティションパターンを含むパーティションパターンリストを構成することと、
前記パーティションパターンリストに基づいて、前記第１のサイズの前記ブロックのパーティションパターンを決定することと、ここにおいて、前記パーティションパターンリスト中の前記パーティションパターンは、前記パーティションパターンリスト中のインデックスによって識別される、
前記第１のサイズの前記ブロックの前記決定されたパーティションパターンに基づいて、第２のサイズの深度ブロックに関するパーティションパターンを決定することと、ここにおいて、前記第２のサイズが前記第１のサイズよりも大きく、前記深度ブロックは、３次元（３Ｄ）ビデオコーディングのフレームワークにおける深度マップのブロックである、
前記第１のサイズの前記ブロックの前記決定されたパーティションパターンを使用して前記第１のサイズの前記ブロックをイントラ予測コーディングすることなく、前記深度ブロックに関する前記決定されたパーティションパターンに基づいて、前記深度ブロックをイントラ予測コーディングすることと
を行わせる命令を記憶した非一時的コンピュータ可読記憶媒体。
前記第１のサイズの前記ブロックの前記パーティションパターンは、サイズ１６×１６のブロックに関するパーティションパターンを備え、前記１つまたは複数のプロセッサに、前記第２のサイズの前記深度ブロックに関する前記パーティションパターンを決定することを行わせる前記命令は、前記１つまたは複数のプロセッサに、サイズ１６×１６の前記ブロックに関する前記決定されたパーティションパターンに基づいて、サイズ３２×３２の前記深度ブロックに関する前記パーティションパターンを決定することを行わせる命令を備える、請求項２３に記載の非一時的コンピュータ可読記憶媒体。
前記第１のサイズのブロックの前記パーティションパターンは、前記第１のサイズの前記ブロックの複数の線ベースのパーティションパターンからの線ベースのパーティションパターンを備え、前記深度ブロックに関する前記パーティションパターンは、２つのパーティションに前記深度ブロックを区分する前記深度ブロックに関する線ベースのパーティションパターンを備える、請求項２３に記載の非一時的コンピュータ可読記憶媒体。