JP2015531561A

JP2015531561A - スケーラブルビデオコーディングのための重み付け予測モード

Info

Publication number: JP2015531561A
Application number: JP2015531230A
Authority: JP
Inventors: セレジン、バディム; チェン、ジャンレ; リ、シャン; ラパカ、クリシュナカンス
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2012-09-07
Filing date: 2013-09-06
Publication date: 2015-11-02
Also published as: CN104737537B; EP2893704B1; WO2014039802A2; EP3687169A1; WO2014039802A3; ES2892479T3; US9906786B2; KR20150052259A; EP2893704A2; EP3687169B1; CN104737537A; US20140072041A1

Abstract

いくつかの態様による、ビデオデータをコーディングするための装置は、メモリと、メモリと通信しているプロセッサとを含む。メモリは、ベースレイヤビデオ情報およびエンハンスメントレイヤビデオ情報などのビデオ情報を記憶するように構成される。プロセッサは、現在のビデオユニットの少なくとも１つの色成分の重み付けレイヤ間予測子および重み付けレイヤ内予測子に少なくとも基づいてエンハンスメントレイヤビデオ情報の現在のビデオユニットの値を判断するように構成される。

Description

[0001]本開示は、ビデオコーディングおよび圧縮に関し、詳細には、スケーラブルビデオコーディング（ＳＶＣ：scalable video coding）に関する。

[0002]デジタルビデオ機能は、デジタルテレビジョン、デジタルダイレクトブロードキャストシステム、ワイヤレスブロードキャストシステム、携帯情報端末（ＰＤＡ）、ラップトップまたはデスクトップコンピュータ、タブレットコンピュータ、電子ブックリーダ、デジタルカメラ、デジタル記録デバイス、デジタルメディアプレーヤ、ビデオゲームデバイス、ビデオゲームコンソール、セルラーまたは衛星無線電話、いわゆる「スマートフォン」、ビデオ遠隔会議デバイス、ビデオストリーミングデバイスなどを含む、広範囲にわたるデバイスに組み込まれ得る。デジタルビデオデバイスは、ＭＰＥＧ−２、ＭＰＥＧ−４、ＩＴＵ−ＴＨ．２６３、ＩＴＵ−ＴＨ．２６４／ＭＰＥＧ−４，Ｐａｒｔ１０，ＡｄｖａｎｃｅｄＶｉｄｅｏＣｏｄｉｎｇ（ＡＶＣ）、現在開発中の高効率ビデオコーディング（ＨＥＶＣ：High Efficiency Video Coding）規格によって定義された規格、およびそのような規格の拡張に記載されているビデオコーディング技法など、ビデオコーディング技法を実装する。ビデオデバイスは、そのようなビデオコーディング技法を実装することによって、デジタルビデオ情報をより効率的に送信、受信、符号化、復号、および／または記憶し得る。

[0003]ビデオコーディング技法は、ビデオシーケンスに固有の冗長性を低減または除去するための空間的（イントラピクチャ）予測および／または時間的（インターピクチャ）予測を含む。ブロックベースのビデオコーディングの場合、ビデオスライス（たとえば、ビデオフレームまたはビデオフレームの一部分）が、ツリーブロック、コーディングユニット（ＣＵ）および／またはコーディングノードと呼ばれることもあるビデオブロックに区分され得る。ピクチャのイントラコーディングされた（Ｉ）スライス中のビデオブロックは、同じピクチャ中の近隣ブロック中の参照サンプルに対する空間的予測を使用して符号化される。ピクチャのインターコーディングされた（ＰまたはＢ）スライス中のビデオブロックは、同じピクチャ中の近隣ブロック中の参照サンプルに対する空間的予測、または他の参照ピクチャ中の参照サンプルに対する時間的予測を使用し得る。ピクチャはフレームと呼ばれることがあり、参照ピクチャは参照フレームと呼ばれることがある。

[0004]空間的予測または時間的予測は、コーディングされるべきブロックの予測ブロックを生じる。残差データは、コーディングされるべき元のブロックと予測ブロックとの間のピクセル差分を表す。インターコード化ブロックは、予測ブロックを形成する参照サンプルのブロックを指す動きベクトルと、コード化ブロックと予測ブロックとの間の差分を示す残差データとに従って符号化される。イントラコード化ブロックは、イントラコーディングモードと残差データとに従って符号化される。さらなる圧縮のために、残差データは、ピクセル領域から変換領域に変換されて、残差変換係数が得られ得、その残差変換係数は、次いで量子化され得る。量子化変換係数は、最初は２次元アレイで構成され、変換係数の１次元ベクトルを生成するために走査され得、なお一層の圧縮を達成するために、エントロピーコーディングが適用され得る。

[0005]いくつかのブロックベースのビデオコーディングおよび圧縮方式は、スケーラブルビデオコーディング（ＳＶＣ）などのスケーラブル技法を利用する。概して説明するように、スケーラブルビデオコーディングは、ベースレイヤおよび１つまたは複数のスケーラブルエンハンスメントレイヤが使用されるビデオコーディングを指す。ＳＶＣの場合、ベースレイヤは、一般に、ベースレベルの品質でビデオデータを搬送する。１つまたは複数のエンハンスメントレイヤは追加ビデオデータを搬送して、より高い空間レベル、時間レベルおよび／または（信号対雑音比またはＳＮＲとも呼ばれる）品質レベルをサポートする。場合によっては、ベースレイヤは、エンハンスメントレイヤの送信よりも信頼できる方法で送信され得る。

[0006]これらのレイヤの各々は、特定のコーディング順序でコーディングされ得る（たとえば、左から右およびラインごと、上から下に連続的にコーディングされ得る）１つまたは複数のビデオブロックを含み得る。レイヤは、レイヤの空間解像度に応じて同じブロックサイズまたは異なるブロックサイズを有し得る。

[0007]本発明のシステム、方法、およびデバイスは、それぞれいくつかの態様を有し、それらのうちの単一の態様が、単独でそれの望ましい属性を担当するとは限らない。次に、以下の特許請求の範囲によって表される本発明の範囲を限定することなしに、いくつかの特徴について手短に説明する。この説明を考察すれば、特に「発明を実施するための形態」と題するセクションを読めば、本発明の特徴が、ビデオデータの第１のレイヤの重み付け予測子およびビデオデータの第２のレイヤの重み付け予測子に基づいてビデオ情報のブロックの予測子を判断することを含む利点をどのように提供するかが理解されよう。

[0008]一実施形態では、デジタルビデオをコーディングするための装置を提供する。本装置は、ベースレイヤビデオ情報とエンハンスメントレイヤビデオ情報とを記憶するように構成されたメモリを含む。本装置は、メモリと通信しているプロセッサをさらに含む。プロセッサは、現在のブロックの少なくとも１つの色成分の重み付けレイヤ間予測子および現在のブロックの少なくとも１つの色成分の重み付けレイヤ内予測子に少なくとも基づいてエンハンスメントレイヤビデオ情報の現在のブロックの予測子を判断することを行うように構成される。

[0009]別の実施形態では、ビデオを復号する方法を提供する。復号する方法は、ベースレイヤビデオ情報とエンハンスメントレイヤビデオ情報とを定義するビデオビットストリームを取得することを含む。本方法はまた、現在のブロックの少なくとも１つの色成分の重み付けレイヤ間予測子および現在のブロックの少なくとも１つの色成分の重み付けレイヤ内予測子に少なくとも基づいてエンハンスメントレイヤビデオ情報の現在のブロックの予測子を判断することを含む。

[0010]追加の実施形態では、ビデオを符号化する方法を提供する。符号化する方法は、ベースレイヤビデオ情報とエンハンスメントレイヤビデオ情報とを定義するビデオビットストリームを生成することを含む。符号化する方法はまた、現在のブロックの少なくとも１つの色成分の重み付けレイヤ間予測子および現在のブロックの少なくとも１つの色成分の重み付けレイヤ内予測子に少なくとも基づいてエンハンスメントレイヤビデオ情報の現在のブロックの予測子を判断することを含む。

[0011]さらなる実施形態では、実行可能な命令を備えるコンピュータ可読記憶媒体を提供する。命令は、装置に、ベースレイヤビデオ情報とエンハンスメントレイヤビデオ情報とを取得することを行わせる。命令はまた、装置に、現在のブロックの少なくとも１つの色成分の重み付けレイヤ間予測子および現在のブロックの少なくとも１つの色成分の重み付けレイヤ内予測子に少なくとも基づいてエンハンスメントレイヤビデオ情報の現在のブロックの予測子を判断することを行わせる。

[0012]またさらなる実施形態では、デジタルビデオをコーディングするための装置を提供する。本装置は、ベースレイヤビデオ情報とエンハンスメントレイヤビデオ情報とを取得するための手段を含む。本装置は、現在のブロックの少なくとも１つの色成分の重み付けレイヤ間予測子および現在のブロックの少なくとも１つの色成分の重み付けレイヤ内予測子に少なくとも基づいてエンハンスメントレイヤビデオ情報の現在のブロックの予測子を判断するための手段をさらに含む。

[0013]１つまたは複数の例の詳細は、添付の図面および以下の説明に記載されている。他の特徴、目的、および利点は、その説明および図面から、ならびに特許請求の範囲から明らかになろう。

[0014]本開示で説明する態様による技法を利用し得る例示的なビデオ符号化および復号システムを示すブロック図。 [0015]本開示で説明する態様による技法を実装し得るビデオエンコーダの一例を示すブロック図。 [0016]本開示で説明する態様による技法を実装し得るビデオデコーダの一例を示すブロック図。 [0017]エンハンスメントレイヤビデオユニットの例示的な予測を示すブロック図。 [0018]エンハンスメントレイヤビデオユニットの例示的な重み付けモード予測を示すブロック図。 [0019]１つまたは複数の予測モードに従って生成される重み付け予測を使用してビデオユニットの値を判断するための例示的なプロセスの流れ図。 [0020]ブロックサイズ上の重み付けモードベースの使用を制限するための例示的なプロセスの流れ図。 [0021]重み付けモードとの動き補償の使用を制限するための例示的なプロセスの流れ図。 [0022]本開示の態様による、一般化残差予測のための例示的な方法を示すフローチャート。本開示の態様による、一般化残差予測のための例示的な方法を示すフローチャート。 [0023]本開示の態様による、シングルループ復号を使用した一般化残差予測のための例示的な方法を示すフローチャート。 [0024]本開示の態様による、マルチループ復号を使用した一般化残差予測のための例示的な方法を示すフローチャート。本開示の態様による、マルチループ復号を使用した一般化残差予測のための例示的な方法を示すフローチャート。 [0025]本開示の態様による、一般化残差予測パラメータをシグナリングするための例示的な方法を示すフローチャート。 [0026]本開示の態様による、一般化残差予測パラメータを導出するための例示的な方法を示すフローチャート。 [0027]本開示の態様による、一般化残差予測においてレイヤをアップサンプリングまたはダウンサンプリングするための例示的な方法を示すフローチャート。 [0028]本開示の態様による、一般化残差予測において動き情報を再マッピング、アップサンプリング、またはダウンサンプリングするための例示的な方法を示すフローチャート。 [0029]本開示の態様による、一般化残差予測において重み係数を判断するための例示的な方法を示すフローチャート。

[0030]概して説明するように、本開示は、ビデオコーディングを関連させる。ビデオコーディングプロセス中に、個別のビデオユニットの構成要素（たとえば、ピクセルまたはピクセルのブロック）に関して予測が行われ得る。たとえば、いくつかのピクセルまたはピクセルのブロックのルーマおよび／またはクロマ値が他の情報から予測され得る。デコーダが値を適切に予測するように構成される場合、予測値がビットストリームから除外され得るので、これにより、コンピューティングリソース（たとえば、帯域幅、ストレージスペース）を節約することが可能になる。シングルレイヤビデオコーディングでは、予測は、一般的に、（たとえば、コーディングされているビデオの同じフレーム中の他のビデオユニットに基づく）空間的なものであるか、または（たとえば、前のフレームまたは後のフレームの対応するビデオユニットに基づく）時間的なものである。スケーラブルビデオコーディング（ＳＶＣ）では、ビデオ情報は、ベースレイヤおよび任意の数のエンハンスメントレイヤなどの複数のレイヤとして論理的または物理的にコーディングされ得る。したがって、ＳＶＣビデオの個別のフレームは、複数のレイヤのビデオ情報を包含し得る。ＳＶＣでは、エンハンスメントレイヤフレーム中のブロックの予測は、上記で説明したように、空間もしくは時間に基づいて行われるか、またはレイヤ間に基づいて（たとえば、同じフレームのためのベースレイヤの対応するビデオユニットに基づいて）行われ得る。しかしながら、場合によっては、上述の予測方法（たとえば、空間的予測、時間的予測、またはレイヤ間予測）のうちの１つに従って行われる予測は、画質の点で他の予測モードに勝る実質的な利点を与えないことがある。さらに、個々の予測モードはそれ自体の制限を有する。複数の予測モードに従って行われる予測を組み合わせることは、場合によっては、画質の点で単一の予測モードに従って行われる予測の使用に勝る利点を与え得る。

[0031]本開示の態様は、ビデオユニットの最終予測を生成するために複数の予測方法またはモードに従って行われる予測を組み合わせることに関する。いくつかの実施形態では、合成モードまたは重み付けモードと呼ばれることがある新しい予測モードが定義され得る。合成モードまたは重み付けモードでは、他の個別の予測モードに従って行われる予測は、最終予測にダイバーシティを追加するために重み付けされ組み合わされ得る（たとえば、重み付けレイヤ間予測が重み付けレイヤ内予測と組み合わされ得る）。最終予測にダイバーシティを追加することによって、たとえば、単一の予測モードが、他の予測モードに勝るまたは複数の予測モードに従って行われる予測の組合せに勝る実質的な利点を与えない場合、より良い予測に結果し得る。たとえば、空間的予測（たとえば、以下でより詳細に説明するイントラ予測）は、時間的予測またはレイヤ間予測（たとえば、それぞれ、以下でより詳細に説明するインター予測またはイントラＢＬ予測）よりもわずかしか良好でない結果またはまったく良好でない結果を与え得る。インター予測は、重み付けされた方式で１つまたは複数の他の予測と組み合わされ得る。予測は、１つのモードに従って行われる予測が異なるモードに従って行われる予測よりも所与のビデオユニットの最終予測でより重度に重み付けされるように重み付けされ得る。合成予測は、随意に正規化され得る。このようにして生成された最終予測子は、任意の単一の予測子よりも実質的に良好な結果を与え得る。

[0032]いくつかの実施形態では、重み付けモードで使用される重みは、ビデオユニットの個別の色成分（たとえば、ルーマおよび両方のクロマ）のうちの１つまたは複数ごとに異なり得る。たとえば、重みの第１のセット（たとえば、０．５および０．５）が、ビデオユニットのルーマ成分のそれぞれ２つの異なる予測子に適用され得る。重みの第２のセット（たとえば、０および１）が、クロマ成分のそれぞれ２つの異なる予測子に適用され得る。いくつかの実施形態では、重み付けモードは、ルーマ成分だけになど、ビデオユニットの構成要素に選択的に適用され得る。

[0033]本明細書で説明する重み付けモードまたは合成モードで最終予測子を生成するために組み合わされ得る予測は、イントラＢＬ予測など、インター予測、イントラ予測、および／またはレイヤ間予測に限定されない。むしろ、重み付けモードでビデオユニットの任意の予測が使用され得る。たとえば、残差予測技法を使用して再構成されるベースレイヤブロックに基づくエンハンスメントレイヤブロックの予測も使用され得る。このレイヤ間残差予測では、ベースレイヤの残差は、エンハンスメントレイヤ中の現在ブロックまたは他のビデオユニットを予測するために使用され得る。残差は、ビデオユニットの時間的予測とソースビデオユニット（たとえば、入力ビデオユニット）の時間的予測との間の差分として定義され得る。本明細書では一般化残差予測とも呼ばれるレイヤ間残差予測では、ベースレイヤの残差が現在のエンハンスメントレイヤの現在のブロックの予測に組み込まれる。残差予測技法について、以下でより詳細に説明する。重み付けモードで最終予測子を生成するために他の予測技法も組み合わされ得る。

[0034]本開示の追加の態様は、ビデオコーディング、ビデオ情報ストレージ、またはビットストリーム送信のパフォーマンスに対して重み付けモードの実装が有し得るあらゆる悪影響を低減するかまたはなくすことに関する。いくつかの実施形態では、重み付けモードは、いくつかのより大きいブロックサイズのためにのみ使用され得る。これにより、コード化ビットストリーム中に含まれる追加の重み付けモード情報の量を最小限に抑えることができる。追加の実施形態では、重み付けモードで使用されるときにいくつかの予測モードが限定または制限され得る。たとえば、最終予測子が重み付けモードで生成されているとき、エンハンスメントレイヤブロックのために単方向動き予測のみが使用され得る。これにより、コード化ビットストリーム中に含まれる動き補償情報の量と関連する計算複雑さとを低減することができる。さらなる実施形態では、重み付けモードで使用されるときに、場合によっては、いくつかの予測モードが改変され得る。たとえば、双方向動き補償情報がビットストリーム中に含まれる場合でも、単方向予測がいくつかのブロックサイズのために使用され、それによって、コーディング複雑さを低減し得る。別の例として、重み付けモードフラグがビットストリーム中でシグナリングされる場合でも、双方向動き補償情報が含まれるとき、または予測されるべきブロックがあるサイズを下回るとき、重み付けモードが使用されないことがあり、さもなければ、重み付けモードが使用されることになる。

[0035]本開示で説明する技法は、概して、スケーラブルビデオコーディング（ＳＶＣ）および３Ｄビデオコーディングに関係する。たとえば、本技法は、高効率ビデオコーディング（ＨＥＶＣ）スケーラブルビデオコーディング（ＳＶＣ）拡張に関係し、それとともにまたはそれの中で使用され得る。ＳＶＣは、（信号対雑音（ＳＮＲ）とも呼ばれる）品質スケーラビリティ、空間スケーラビリティおよび／または時間スケーラビリティを与えるために使用され得る。ＳＶＣ拡張では、ビデオ情報の複数のレイヤがあり得る。最下位レベルにあるレイヤはベースレイヤ（ＢＬ：base layer）として働き、最上位にあるレイヤはエンハンストレイヤ（ＥＬ：enhanced layer）として働き得る。「エンハンストレイヤ」は「エンハンスメントレイヤ」と呼ばれることがあり、これらの用語は互換的に使用され得る。中間にあるすべてのレイヤは、ＥＬまたはＢＬの一方または両方として働き得る。たとえば、中間にあるレイヤは、ベースレイヤまたは介在エンハンスメントレイヤ（intervening enhancement layer）など、それの下のレイヤのためのＥＬであり、同時にそれの上のエンハンスメントレイヤのためのＢＬとして働き得る。

[0036]単に説明のために、本開示で説明する技法は、単に２つのレイヤ（たとえば、ベースレイヤなどの下位レベルレイヤと、エンハンストレイヤなどの上位レベルレイヤ）を含む例を用いて説明する。本開示で説明する例が、複数のベースレイヤおよびエンハンスメントレイヤをもつ例にも拡張され得ることを理解されたい。

[0037]エンハンスメントレイヤは、ベースレイヤとは異なる空間解像度を有し得る。たとえば、ＥＬとＢＬとの間の空間アスペクト比は、１．０、１．５、２．０または他の異なる比であり得る。言い換えれば、ＥＬの空間アスペクトは、ＢＬの空間アスペクトの１．０倍、１．５倍、または２．０倍に等しくなり得る。いくつかの例では、ＥＬのスケーリングファクタはＢＬよりも大きくなり得る。たとえば、ＥＬ中のピクチャのサイズは、ＢＬ中のピクチャのサイズよりも大きくなり得る。このようにして、限定はしないが、ＥＬの空間解像度がＢＬの空間解像度よりも大きくなることが可能であり得る。

[0038]ビデオコーディング規格は、ＩＴＵ−ＴＨ．２６１、ＩＳＯ／ＩＥＣＭＰＥＧ−１Ｖｉｓｕａｌ、ＩＴＵ−ＴＨ．２６２またはＩＳＯ／ＩＥＣＭＰＥＧ−２Ｖｉｓｕａｌ、ＩＴＵ−ＴＨ．２６３、ＩＳＯ／ＩＥＣＭＰＥＧ−４Ｖｉｓｕａｌ、およびそれのスケーラブルビデオコーディング（ＳＶＣ）拡張とマルチビュービデオコーディング（ＭＶＣ：Multiview Video Coding）拡張とを含む、（ＩＳＯ／ＩＥＣＭＰＥＧ−４ＡＶＣとしても知られる）ＩＴＵ−ＴＨ．２６４を含む。さらに、新しいビデオコーディング規格、すなわち、高効率ビデオコーディング（ＨＥＶＣ）が、ＩＴＵ−ＴＶｉｄｅｏＣｏｄｉｎｇＥｘｐｅｒｔｓＧｒｏｕｐ（ＶＣＥＧ）とＩＳＯ／ＩＥＣＭｏｔｉｏｎＰｉｃｔｕｒｅＥｘｐｅｒｔｓＧｒｏｕｐ（ＭＰＥＧ）とのＪｏｉｎｔＣｏｌｌａｂｏｒａｔｉｏｎＴｅａｍｏｎＶｉｄｅｏＣｏｄｉｎｇ（ＪＣＴ−ＶＣ）によって開発されている。２０１２年６月７日現在、http://wg11.sc29.org/jct/doc_end_user/current_document.php?id=5885/JCTVC-I1003-v2からＨＥＶＣの最近のドラフトが入手可能である。２０１２年６月７日現在、http://phenix.it-sudparis.eu/jct/doc_end_user/documents/9_Geneva/wg11/JCTVC-I1003-v3.zipから「ＨＥＶＣワーキングドラフト７」と呼ばれるＨＥＶＣ規格の別の最近のドラフトがダウンロード可能である。ＨＥＶＣワーキングドラフト７についての完全引用は、文書ＨＣＴＶＣ−Ｉ１００３、Ｂｒｏｓｓら、「High Efficiency Video Coding (HEVC) Text Specification Draft 7」、ＩＴＵ−ＴＳＧ１６ＷＰ３およびＩＳＯ／ＩＥＣＪＴＣ１／ＳＣ２９／ＷＧ１１のＪｏｉｎｔＣｏｌｌａｂｏｒａｔｉｖｅＴｅａｍｏｎＶｉｄｅｏＣｏｄｉｎｇ（ＪＣＴ−ＶＣ）、第９回会合：ジュネーブ、スイス、２０１２年４月２７日〜２０１２年５月７日である。これらの参照の各々は、その全体が参照により組み込まれる。

[0039]添付の図面を参照しながら新規のシステム、装置、および方法の様々な態様について以下でより十分に説明する。ただし、本開示は、多くの異なる形態で実施され得、本開示全体にわたって提示される任意の特定の構造または機能に限定されるものと解釈されるべきではない。むしろ、これらの態様は、本開示が周到で完全になり、本開示の範囲を当業者に十分に伝えるように与えられる。本明細書の教示に基づいて、本開示の範囲は、本開示の他の態様とは無関係に実装されるにせよ、または本開示の他の態様と組み合わせて実装されるにせよ、本明細書で開示する新規のシステム、装置、および方法のいかなる態様をもカバーするものであることを、当業者なら諒解されたい。たとえば、本明細書に記載の態様の複数またはサブセットを使用しても、装置は実装され得、または方法は実施され得る。さらに、本開示の範囲は、本明細書の開示の様々な態様に加えてまたはそれらの態様以外に、他の構造、機能、または構造および機能を使用して実施されるそのような装置またはそのような方法をカバーするものとする。本明細書で開示する任意の態様が請求項の１つまたは複数の要素によって実施され得ることを理解されたい。

[0040]本明細書では特定の態様について説明するが、これらの態様の多くの変形および置換は本開示の範囲内に入る。好ましい態様のいくつかの利益および利点について説明するが、本開示の範囲は特定の利益、使用、または目的に限定されるものではない。むしろ、本開示の態様は、様々なワイヤレス技術、システム構成、ネットワーク、および伝送プロトコルに広く適用可能であるものとし、それらのいくつかを例として、図および好適な態様についての以下の説明において示す。発明を実施するための形態および図面は、本開示を限定するものではなく説明するものにすぎず、本開示の範囲は添付の特許請求の範囲およびそれの均等物によって定義される。

[0041]図１は、本開示で説明する態様による技法を利用し得る例示的なビデオ符号化および復号システムを示すブロック図である。図１に示すように、システム１０は、宛先デバイス１４によって後で復号されるべき符号化ビデオデータを与えるソースデバイス１２を含む。特に、ソースデバイス１２は、コンピュータ可読媒体１６を介してビデオデータを宛先デバイス１４に与える。ソースデバイス１２および宛先デバイス１４は、デスクトップコンピュータ、ノートブック（たとえば、ラップトップ）コンピュータ、タブレットコンピュータ、セットトップボックス、いわゆる「スマート」フォンなどの電話ハンドセット、いわゆる「スマート」パッド、テレビジョン、カメラ、ディスプレイデバイス、デジタルメディアプレーヤ、ビデオゲームコンソール、ビデオストリーミングデバイスなどを含む、広範囲にわたるデバイスのいずれかを備え得る。場合によっては、ソースデバイス１２および宛先デバイス１４は、ワイヤレス通信のために装備され得る。

[0042]宛先デバイス１４は、コンピュータ可読媒体１６を介して復号されるべき符号化ビデオデータを受信し得る。コンピュータ可読媒体１６は、ソースデバイス１２から宛先デバイス１４に符号化されたビデオデータを移動させることができる任意のタイプの媒体またはデバイスを備え得る。一例では、コンピュータ可読媒体１６は、ソースデバイス１２が、符号化ビデオデータを宛先デバイス１４にリアルタイムで直接送信することを可能にするための通信媒体を備え得る。符号化ビデオデータは、ワイヤレス通信プロトコルなどの通信規格に従って変調され、宛先デバイス１４に送信され得る。通信媒体は、無線周波数（ＲＦ）スペクトルまたは１つもしくは複数の物理伝送線路など、任意のワイヤレスまたはワイヤード通信媒体を備え得る。通信媒体は、ローカルエリアネットワーク、ワイドエリアネットワーク、またはインターネットなどのグローバルネットワークなど、パケットベースネットワークの一部を形成し得る。通信媒体は、ソースデバイス１２から宛先デバイス１４への通信を可能にするために有用であり得るルータ、スイッチ、基地局、または任意の他の機器を含み得る。

[0043]いくつかの例では、符号化データは、出力インターフェース２２からストレージデバイスに出力され得る。同様に、符号化データは、入力インターフェースによってストレージデバイスからアクセスされ得る。ストレージデバイスは、ハードドライブ、ブルーレイ（登録商標）ディスク、ＤＶＤ、ＣＤ−ＲＯＭ、フラッシュメモリ、揮発性もしくは不揮発性メモリ、または符号化ビデオデータを記憶するための任意の他の好適なデジタル記憶媒体など、様々な分散されたまたはローカルにアクセスされるデータ記憶媒体のいずれかを含み得る。さらなる一例では、ストレージデバイスは、ソースデバイス１２によって生成された符号化ビデオを記憶し得るファイルサーバまたは別の中間ストレージデバイスに対応し得る。宛先デバイス１４は、ストリーミングまたはダウンロードを介してストレージデバイスから、記憶されたビデオデータにアクセスし得る。ファイルサーバは、符号化ビデオデータを記憶し、その符号化ビデオデータを宛先デバイス１４に送信することが可能な任意のタイプのサーバであり得る。例示的なファイルサーバは、（たとえば、ウェブサイトのための）ウェブサーバ、ＦＴＰサーバ、ネットワーク接続ストレージ（ＮＡＳ）デバイス、またはローカルディスクドライブを含む。宛先デバイス１４は、インターネット接続を含む、任意の標準のデータ接続を介して符号化ビデオデータにアクセスし得る。これは、ファイルサーバに記憶された符号化ビデオデータにアクセスするのに好適であるワイヤレスチャネル（たとえば、Ｗｉ−Ｆｉ（登録商標）接続）、ワイヤード接続（たとえば、ＤＳＬ、ケーブルモデムなど）、または両方の組合せを含み得る。ストレージデバイスからの符号化ビデオデータの送信は、ストリーミング送信、ダウンロード送信、またはそれらの組合せであり得る。

[0044]本開示の技法は、必ずしもワイヤレス適用例または設定に限定されるとは限らない。本技法は、オーバージエアテレビジョン放送、ケーブルテレビジョン送信、衛星テレビジョン送信、動的適応ストリーミングオーバーＨＴＴＰ（ＤＡＳＨ：dynamic adaptive streaming over HTTP）などのインターネットストリーミングビデオ送信、データ記憶媒体上に符号化されたデジタルビデオ、データ記憶媒体に記憶されたデジタルビデオの復号、または他の適用例など、様々なマルチメディア適用例のいずれかをサポートするビデオコーディングに適用され得る。いくつかの例では、システム１０は、ビデオストリーミング、ビデオ再生、ビデオブロードキャスティング、および／またはビデオテレフォニーなどの適用例をサポートするために、一方向または双方向のビデオ送信をサポートするように構成され得る。

[0045]図１の例では、ソースデバイス１２は、ビデオソース１８と、ビデオエンコーダ２０と、出力インターフェース２２とを含む。宛先デバイス１４は、入力インターフェース２８と、ビデオデコーダ３０と、ディスプレイデバイス３２とを含む。本開示によれば、ソースデバイス１２のビデオエンコーダ２０は、複数の規格または規格拡張に準拠するビデオデータを含むビットストリームをコーディングするための技法を適用するように構成され得る。他の例では、ソースデバイスおよび宛先デバイスは他の構成要素または構成を含み得る。たとえば、ソースデバイス１２は、外部カメラなど、外部ビデオソース１８からビデオデータを受信し得る。同様に、宛先デバイス１４は、内蔵ディスプレイデバイスを含むのではなく、外部ディスプレイデバイスとインターフェースし得る。

[0046]図１の図示のシステム１０は一例にすぎない。現在のブロックの動きベクトル予測子の候補リストの候補を判断するための技法は、任意のデジタルビデオ符号化および／または復号デバイスによって実行され得る。概して、本開示の技法はビデオ符号化デバイスによって実行されるが、本技法は、一般に「コーデック」と呼ばれるビデオエンコーダ／デコーダによっても実行され得る。さらに、本開示の技法は、ビデオプリプロセッサによっても実行され得る。ソースデバイス１２および宛先デバイス１４は、ソースデバイス１２が宛先デバイス１４に送信するためのコード化ビデオデータを生成するような、コーディングデバイスの例にすぎない。いくつかの例では、デバイス１２、１４は、デバイス１２、１４の各々がビデオ符号化構成要素とビデオ復号構成要素とを含むように、実質的に対称的に動作し得る。したがって、システム１０は、たとえば、ビデオストリーミング、ビデオ再生、ビデオブロードキャストまたはビデオ電話のための、ビデオデバイス１２とビデオデバイス１４との間の一方向または双方向のビデオ送信をサポートし得る。

[0047]ソースデバイス１２のビデオソース１８は、ビデオカメラなどのビデオキャプチャデバイス、あらかじめキャプチャされたビデオを含んでいるビデオアーカイブ、および／またはビデオコンテンツプロバイダからビデオを受信するためのビデオフィードインターフェースを含み得る。さらなる代替として、ビデオソース１８は、ソースビデオとしてのコンピュータグラフィックスベースのデータ、またはライブビデオとアーカイブビデオとコンピュータ生成ビデオとの組合せを生成し得る。場合によっては、ビデオソース１８がビデオカメラである場合、ソースデバイス１２および宛先デバイス１４は、いわゆるカメラフォンまたはビデオフォンを形成し得る。ただし、上述のように、本開示で説明する技法は、概してビデオコーディングに適用可能であり得、ワイヤレスおよび／またはワイヤード適用例に適用され得る。各場合において、キャプチャされたビデオ、以前にキャプチャされたビデオ、またはコンピュータ生成ビデオは、ビデオエンコーダ２０によって符号化され得る。符号化されたビデオ情報は、次いで、出力インターフェース２２によってコンピュータ可読媒体１６上に出力され得る。

[0048]コンピュータ可読媒体１６は、ワイヤレスブロードキャストまたはワイヤードネットワーク送信などの一時媒体、またはハードディスク、フラッシュドライブ、コンパクトディスク、デジタルビデオディスク、ブルーレイディスク、または他のコンピュータ可読媒体などの記憶媒体（すなわち、非一時的記憶媒体）を含み得る。いくつかの例では、ネットワークサーバ（図示せず）は、ソースデバイス１２から符号化ビデオデータを受信し、たとえば、ネットワーク送信、直接ワイヤード通信などを介して、その符号化ビデオデータを宛先デバイス１４に与え得る。同様に、ディスクスタンピング設備など、媒体製造設備のコンピューティングデバイスは、ソースデバイス１２から符号化ビデオデータを受信し、その符号化ビデオデータを含んでいるディスクを生成し得る。したがって、様々な例では、コンピュータ可読媒体１６は、様々な形態の１つまたは複数のコンピュータ可読媒体を含むと理解され得る。

[0049]宛先デバイス１４の入力インターフェース２８は、コンピュータ可読媒体１６から情報を受信する。コンピュータ可読媒体１６の情報は、ビデオエンコーダ２０によって定義され、またビデオデコーダ３０によって使用される、ブロックおよび他のコード化ユニット、たとえば、ＧＯＰの特性および／または処理を記述するシンタックス要素を含む、シンタックス情報を含み得る。ディスプレイデバイス３２は、復号されたビデオデータをユーザに対して表示し、陰極線管（ＣＲＴ）、液晶ディスプレイ（ＬＣＤ）、プラズマディスプレイ、有機発光ダイオード（ＯＬＥＤ）ディスプレイ、または別のタイプのディスプレイデバイスなど、様々なディスプレイデバイスのいずれかを備え得る。

[0050]ビデオエンコーダ２０およびビデオデコーダ３０は、現在開発中の高効率ビデオコーディング（ＨＥＶＣ）規格などのビデオコーディング規格に従って動作し得、ＨＥＶＣテストモデル（ＨＭ）に準拠し得る。代替的に、ビデオエンコーダ２０およびビデオデコーダ３０は、代替的にＭＰＥＧ−４，Ｐａｒｔ１０，ＡｄｖａｎｃｅｄＶｉｄｅｏＣｏｄｉｎｇ（ＡＶＣ）と呼ばれるＩＴＵ−ＴＨ．２６４規格など、他のプロプライエタリ規格もしくは業界規格、またはそのような規格の拡張に従って動作し得る。ただし、本開示の技法は、限定はしないが、上記に記載した規格のいずれかを含む特定のコーディング規格に限定されない。ビデオコーディング規格の他の例としては、ＭＰＥＧ−２およびＩＴＵ−ＴＨ．２６３がある。図１には示されていないが、いくつかの態様では、ビデオエンコーダ２０およびビデオデコーダ３０は、それぞれオーディオエンコーダおよびオーディオデコーダと統合され得、適切なＭＵＸ−ＤＥＭＵＸユニット、または他のハードウェアおよびソフトウェアを含んで、共通のデータストリームまたは別個のデータストリーム中のオーディオとビデオの両方の符号化を処理し得る。適用可能な場合、ＭＵＸ−ＤＥＭＵＸユニットは、ＩＴＵＨ．２２３マルチプレクサプロトコル、またはユーザデータグラムプロトコル（ＵＤＰ）などの他のプロトコルに準拠し得る。

[0051]ビデオエンコーダ２０およびビデオデコーダ３０はそれぞれ、１つまたは複数のマイクロプロセッサ、デジタル信号プロセッサ（ＤＳＰ）、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、ディスクリート論理、ソフトウェア、ハードウェア、ファームウェアまたはそれらの任意の組合せなど、様々な好適なエンコーダ回路のいずれかとして実装され得る。本技法が部分的にソフトウェアで実装されるとき、デバイスは、好適な非一時的コンピュータ可読媒体にソフトウェアの命令を記憶し、１つまたは複数のプロセッサを使用してその命令をハードウェアで実行して、本開示の技法を実行し得る。ビデオエンコーダ２０およびビデオデコーダ３０の各々は１つまたは複数のエンコーダまたはデコーダ中に含まれ得、そのいずれも、それぞれのデバイスにおいて複合エンコーダ／デコーダ（コーデック）の一部として統合され得る。ビデオエンコーダ２０および／またはビデオデコーダ３０を含むデバイスは、集積回路、マイクロプロセッサ、および／またはセルラー電話などのワイヤレス通信デバイスを備え得る。

[0052]ＪＣＴ−ＶＣは、ＨＥＶＣ規格の開発に取り組んでいる。ＨＥＶＣ規格化の取り組みは、ＨＥＶＣテストモデル（ＨＭ）と呼ばれるビデオコーディングデバイスの発展的モデルに基づく。ＨＭは、たとえば、ＩＴＵ−ＴＨ．２６４／ＡＶＣに従う既存のデバイスに対してビデオコーディングデバイスのいくつかの追加の能力を仮定する。たとえば、Ｈ．２６４は９つのイントラ予測符号化モードを提供するが、ＨＭは３３個ものイントラ予測符号化モードを提供し得る。

[0053]概して、ＨＭの作業モデルは、ビデオフレームまたはピクチャが、ルーマサンプルとクロマサンプルの両方を含む一連のツリーブロックまたは最大コーディングユニット（ＬＣＵ：largest coding unit）に分割され得ることを記載している。ビットストリーム内のシンタックスデータが、ピクセルの数に関して最大コーディングユニットであるＬＣＵのサイズを定義し得る。スライスは、コーディング順序でいくつかの連続するツリーブロックを含む。ビデオフレームまたはピクチャは、１つまたは複数のスライスに区分され得る。各ツリーブロックは、４分木に従ってコーディングユニット（ＣＵ）に分割され得る。概して、４分木データ構造はＣＵごとに１つのノードを含み、ルートノードはツリーブロックに対応する。ＣＵが４つのサブＣＵに分割された場合、ＣＵに対応するノードは４つのリーフノードを含み、リーフノードの各々はサブＣＵのうちの１つに対応する。

[0054]４分木データ構造の各ノードは、対応するＣＵのシンタックスデータを与え得る。たとえば、４分木のノードは、そのノードに対応するＣＵがサブＣＵに分割されるかどうかを示す分割フラグを含み得る。ＣＵのシンタックス要素は、再帰的に定義され得、かつＣＵがサブＣＵに分割されるかどうかに依存し得る。ＣＵがさらに分割されない場合、そのＣＵはリーフＣＵと呼ばれる。本開示では、元のリーフＣＵの明示的分割が存在しない場合でも、リーフＣＵの４つのサブＣＵをリーフＣＵとも呼ぶ。たとえば、１６×１６サイズのＣＵがさらに分割されない場合、この１６×１６ＣＵが決して分割されなくても、４つの８×８サブＣＵをリーフＣＵとも呼ぶ。

[0055]ＣＵは、ＣＵがサイズの差異を有さないことを除いて、Ｈ．２６４規格のマクロブロックと同様の目的を有する。たとえば、ツリーブロックは、４つの子ノード（サブＣＵとも呼ばれる）に分割され得、各子ノードは、今度は親ノードとなり、別の４つの子ノードに分割され得る。４分木のリーフノードと呼ばれる、最後の分割されていない子ノードは、リーフＣＵとも呼ばれるコーディングノードを備える。コード化ビットストリームに関連するシンタックスデータは、最大ＣＵ深さと呼ばれる、ツリーブロックが分割され得る最大回数を定義し得、また、コーディングノードの最小サイズを定義し得る。それに応じて、ビットストリームは最小コーディングユニット（ＳＣＵ：smallest coding unit）をも定義し得る。本開示では、ＨＥＶＣのコンテキストにおけるＣＵ、ＰＵ、もしくはＴＵ、または他の規格のコンテキストにおける同様のデータ構造（たとえば、Ｈ．２６４／ＡＶＣにおけるマクロブロックおよびそれのサブブロック）のいずれかを指すために「ブロック」という用語を使用する。

[0056]ＣＵは、コーディングノードと、コーディングノードに関連する予測ユニット（ＰＵ：prediction unit）および変換ユニット（ＴＵ：transform unit）とを含む。ＣＵのサイズは、コーディングノードのサイズに対応し、かつ形状が方形でなければならない。ＣＵのサイズは、８×８ピクセルから最大６４×６４以上のピクセルを有するツリーブロックのサイズまでに及び得る。各ＣＵは、１つまたは複数のＰＵと、１つまたは複数のＴＵとを含み得る。ＣＵに関連するシンタックスデータは、たとえば、ＣＵを１つまたは複数のＰＵに区分することを記述し得る。区分モードは、ＣＵが、スキップモード符号化もしくはダイレクトモード符号化されるか、イントラ予測モード符号化されるか、またはインター予測モード符号化されるかによって異なり得る。ＰＵは、形状が非方形になるように区分され得る。ＣＵに関連するシンタックスデータは、たとえば、４分木に従って、ＣＵを１つまたは複数のＴＵに区分することも記述し得る。ＴＵは、形状が方形または非方形（たとえば、矩形）であり得る。

[0057]ＨＥＶＣ規格は、ＣＵごとに異なり得るＴＵに従う変換を可能にする。ＴＵは、一般に、区分されたＬＣＵについて定義された所与のＣＵ内のＰＵのサイズに基づいてサイズ決定されるが、常にそうであるとは限らない。ＴＵは、一般にＰＵと同じサイズであるかまたはＰＵよりも小さい。いくつかの例では、ＣＵに対応する残差サンプルは、「残差クワッドツリー」（ＲＱＴ：residual quad tree）として知られるクワッドツリー構造を使用して、より小さいユニットに再分割され得る。ＲＱＴのリーフノードは変換ユニット（ＴＵ）と呼ばれることがある。ＴＵに関連するピクセル差分値は、量子化され得る変換係数を生成するために変換され得る。

[0058]リーフＣＵは、１つまたは複数の予測ユニット（ＰＵ）を含み得る。概して、ＰＵは、対応するＣＵの全部または一部分に対応する空間的エリアを表し、そのＰＵの参照サンプルを取り出すためのデータを含み得る。その上、ＰＵは、予測に関係するデータを含む。たとえば、ＰＵがイントラモード符号化されるとき、ＰＵについてのデータは、ＰＵに対応するＴＵについてのイントラ予測モードを記述するデータを含み得る残差４分木（ＲＱＴ）中に含まれ得る。別の例として、ＰＵがインターモード符号化されるとき、ＰＵは、ＰＵのための１つまたは複数の動きベクトルを定義するデータを含み得る。ＰＵの動きベクトルを定義するデータは、たとえば、動きベクトルの水平成分、動きベクトルの垂直成分、動きベクトルの解像度（たとえば、１／４ピクセル精度または１／８ピクセル精度）、動きベクトルが指す参照ピクチャ、および／または動きベクトルの参照ピクチャリスト（たとえば、リスト０、リスト１、またはリストＣ）を記述し得る。

[0059]１つまたは複数のＰＵを有するリーフＣＵはまた、１つまたは複数の変換ユニット（ＴＵ）を含み得る。変換ユニットは、上記で説明したように、（ＴＵ４分木構造とも呼ばれる）ＲＱＴを使用して指定され得る。たとえば、分割フラグは、リーフＣＵが４つの変換ユニットに分割されるかどうかを示し得る。次いで、各変換ユニットは、さらに、さらなるサブＴＵに分割され得る。ＴＵがさらに分割されないとき、そのＴＵはリーフＴＵと呼ばれることがある。概して、イントラコーディングの場合、リーフＣＵに属するすべてのリーフＴＵは同じイントラ予測モードを共有する。すなわち、概して、リーフＣＵのすべてのＴＵの予測値を計算するために同じイントラ予測モードが適用される。イントラコーディングの場合、ビデオエンコーダは、イントラ予測モードを使用して各リーフＴＵの残差値をＴＵに対応するＣＵの一部と元のブロックとの間の差分として計算し得る。ＴＵは、必ずしもＰＵのサイズに制限されるとは限らない。したがって、ＴＵはＰＵよりも大きくまたは小さくなり得る。イントラコーディングの場合、ＰＵは、同じＣＵの対応するリーフＴＵとコロケートされ得る。いくつかの例では、リーフＴＵの最大サイズは、対応するリーフＣＵのサイズに対応し得る。

[0060]さらに、リーフＣＵのＴＵはまた、残差４分木（ＲＱＴ）と呼ばれる、それぞれの４分木データ構造に関連付けられ得る。すなわち、リーフＣＵは、リーフＣＵがどのようにＴＵに区分されるかを示す４分木を含み得る。ＴＵ４分木のルートノードは概してリーフＣＵに対応し、ＣＵ４分木のルートノードは概してツリーブロック（またはＬＣＵ）に対応する。分割されないＲＱＴのＴＵはリーフＴＵと呼ばれる。概して、本開示では、特に明記しない限り、リーフＣＵおよびリーフＴＵに言及するためにそれぞれＣＵおよびＴＵという用語を使用する。

[0061]ビデオシーケンスは、一般に、一連のビデオフレームまたはピクチャを含む。ピクチャグループ（ＧＯＰ）は、概して、ビデオピクチャのうちの一連の１つまたは複数を備える。ＧＯＰは、ＧＯＰ中に含まれるいくつかのピクチャを記述するシンタックスデータを、ＧＯＰのヘッダ中、ピクチャのうちの１つまたは複数のヘッダ中、または他の場所に含み得る。ピクチャの各スライスは、それぞれのスライスの符号化モードを記述するスライスシンタックスデータを含み得る。ビデオエンコーダ２０は、一般に、ビデオデータを符号化するために個々のビデオスライス内のビデオブロックに対して動作する。ビデオブロックは、ＣＵ内のコーディングノードに対応し得る。ビデオブロックは、固定サイズまたは可変サイズを有し得、かつ指定のコーディング規格に応じてサイズが異なり得る。

[0062]一例として、ＨＭは、様々なＰＵサイズでの予測をサポートする。特定のＣＵのサイズが２Ｎ×２Ｎであると仮定すると、ＨＭは、２Ｎ×２ＮまたはＮ×ＮのＰＵサイズでのイントラ予測をサポートし、２Ｎ×２Ｎ、２Ｎ×Ｎ、Ｎ×２Ｎ、またはＮ×Ｎの対称的なＰＵサイズでのインター予測をサポートする。ＨＭはまた、２Ｎ×ｎＵ、２Ｎ×ｎＤ、ｎＬ×２Ｎ、およびｎＲ×２ＮのＰＵサイズでのインター予測のための非対称区分をサポートする。非対称区分では、ＣＵの一方向は区分されないが、他の方向は２５％と７５％とに区分される。２５％の区分に対応するＣＵの部分は、「ｎ」とその後ろに付く「Ｕｐ」、「Ｄｏｗｎ」、「Ｌｅｆｔ」、または「Ｒｉｇｈｔ」という表示によって示される。したがって、たとえば、「２Ｎ×ｎＵ」は、上部の２Ｎ×０．５ＮＰＵと下部の２Ｎ×１．５ＮＰＵとで水平方向に区分された２Ｎ×２ＮＣＵを指す。

[0063]本開示では、「Ｎ×Ｎ（NxN）」および「Ｎ×Ｎ（N by N）」は、垂直寸法および水平寸法に関するビデオブロックのピクセル寸法、たとえば、１６×１６（16x16）ピクセルまたは１６×１６（16 by 16）ピクセルを指すために互換的に使用され得る。概して、１６×１６ブロックは、垂直方向に１６ピクセルを有し（ｙ＝１６）、水平方向に１６ピクセルを有する（ｘ＝１６）。同様に、Ｎ×Ｎブロックは、概して、垂直方向にＮピクセルを有し、水平方向にＮピクセルを有し、ただし、Ｎは非負整数値を表す。ブロック中のピクセルは行と列で構成され得る。さらに、ブロックは、必ずしも、水平方向に垂直方向と同じ数のピクセルを有さなくてもよい。たとえば、ブロックはＮ×Ｍピクセルを備え得、ただし、Ｍは必ずしもＮに等しいとは限らない。

[0064]ＣＵのＰＵを使用したイントラ予測コーディングまたはインター予測コーディングの後、ビデオエンコーダ２０は、ＣＵのＴＵのための残差データを計算し得る。ＰＵは、（ピクセル領域とも呼ばれる）空間領域において予測ピクセルデータを生成する方法またはモードを記述するシンタックスデータを備え得、ＴＵは、変換、たとえば、残差ビデオデータへの離散コサイン変換（ＤＣＴ）、整数変換、ウェーブレット変換、または概念的に同様の変換の適用後に、変換領域において係数を備え得る。残差データは、符号化されていないピクチャのピクセルと、ＰＵに対応する予測値との間のピクセル差分に対応し得る。ビデオエンコーダ２０は、ＣＵのための残差データを含むＴＵを形成し、次いで、ＴＵを変換して、ＣＵの変換係数を生成し得る。

[0065]変換係数を生成するための任意の変換の後に、ビデオエンコーダ２０は、変換係数の量子化を実行し得る。量子化は、その最も広い通常の意味を有することが意図された広義の用語である。一実施形態では、量子化は、係数を表すために使用されるデータの量をできるだけ低減するために変換係数が量子化され、さらなる圧縮を行うプロセスを指す。量子化プロセスは、係数の一部または全部に関連するビット深度を低減し得る。たとえば、量子化中にｎビット値がｍビット値に切り捨てられ得、ただし、ｎはｍよりも大きい。

[0066]量子化の後に、ビデオエンコーダは、変換係数を走査して、量子化変換係数を含む２次元行列から１次元ベクトルを生成し得る。走査は、より高いエネルギー（したがってより低い周波数）の係数をアレイの前方に配置し、より低いエネルギー（したがってより高い周波数）の係数をアレイの後方に配置するように設計され得る。いくつかの例では、ビデオエンコーダ２０は、エントロピー符号化され得るシリアル化ベクトルを生成するために、量子化変換係数を走査するためにあらかじめ定義された走査順序を利用し得る。他の例では、ビデオエンコーダ２０は適応型走査を実行し得る。量子化変換係数を走査して１次元ベクトルを形成した後に、ビデオエンコーダ２０は、たとえば、コンテキスト適応型可変長コーディング（ＣＡＶＬＣ：context-adaptive variable length coding）、コンテキスト適応型バイナリ算術コーディング（ＣＡＢＡＣ：context-adaptive binary arithmetic coding）、シンタックスベースコンテキスト適応型バイナリ算術コーディング（ＳＢＡＣ：syntax-based context-adaptive binary arithmetic coding）、確率間隔区分エントロピー（ＰＩＰＥ：Probability Interval Partitioning Entropy）コーディング、または別のエントロピー符号化方法に従って１次元ベクトルをエントロピー符号化し得る。ビデオエンコーダ２０はまた、ビデオデータを復号する際にビデオデコーダ３０が使用するための符号化ビデオデータに関連するシンタックス要素をエントロピー符号化し得る。

[0067]ＣＡＢＡＣを実行するために、ビデオエンコーダ２０は、送信されるべきシンボルに、コンテキストモデル内のコンテキストを割り当て得る。コンテキストは、たとえば、シンボルの隣接値が非０であるか否かに関係し得る。ＣＡＶＬＣを実行するために、ビデオエンコーダ２０は、送信されるべきシンボルのための可変長コードを選択し得る。ＶＬＣにおけるコードワードは、比較的短いコードが優勢シンボルに対応し、より長いコードが劣勢シンボルに対応するように構成され得る。このようにして、ＶＬＣの使用は、たとえば、送信されるべき各シンボルのために等長コードワードを使用するよりも、ビット節約を達成し得る。確率判断は、シンボルに割り当てられたコンテキストに基づき得る。

[0068]ビデオエンコーダ２０は、さらに、ブロックベースのシンタックスデータ、フレームベースのシンタックスデータ、およびＧＯＰベースのシンタックスデータなどのシンタックスデータを、たとえば、フレームヘッダ、ブロックヘッダ、スライスヘッダ、またはＧＯＰヘッダ中でビデオデコーダ３０に送り得る。ＧＯＰシンタックスデータは、それぞれのＧＯＰ中のいくつかのフレームを記述し得、かつフレームシンタックスデータは、対応するフレームを符号化するために使用される符号化／予測モードを示し得る。

[0069]図２は、本開示で説明する態様による技法を実装し得るビデオエンコーダの例を示すブロック図である。ビデオエンコーダ２０は、本開示の技法のいずれかまたはすべてを実行するように構成され得る。一例として、モード選択ユニット４０は、本開示で説明する技法のいずれかまたはすべてを実行するように構成され得る。ただし、本開示の態様はそのように限定されない。いくつかの例では、本開示で説明する技法は、ビデオエンコーダ２０の様々な構成要素間で共有され得る。いくつかの例では、追加としてまたは代わりに、プロセッサ（図示せず）が、本開示で説明する技法のいずれかまたはすべてを実行するように構成され得る。

[0070]いくつかの実施形態では、モード選択ユニット４０、動き推定ユニット４２、動き補償ユニット４４、レイヤ間予測ユニット４５、イントラ予測ユニット４６、重み付け予測ユニット４７、もしくはモード選択ユニット４０の別の構成要素（図示済みまたは図示せず）、またはエンコーダ２０の別の構成要素（図示済みまたは図示せず）が本開示の技法を実行し得る。たとえば、モード選択ユニット４０は、符号化するためのビデオデータを受信し得、符号化するためのビデオデータは、ベースレイヤと対応する１つまたは複数のエンハンスメントレイヤとに符号化され得る。モード選択ユニット４０、動き推定ユニット４２、動き補償ユニット４４、レイヤ間予測ユニット４５、イントラ予測ユニット４６、重み付け予測ユニット４７、またはエンコーダ２０の別の適切なユニットは、イントラ予測、インター予測、イントラＢＬ予測などのレイヤ間予測、一般化残差予測などを含む２つ以上の重み付け予測の組合せに少なくとも部分的に基づいて現在のビデオユニットの値を判断し得る。エンコーダ２０は、ビデオユニットを符号化し、ビットストリーム中で（１つまたは複数の）重み係数または重み情報をシグナリングすることができる。

[0071]ビデオエンコーダ２０は、ビデオスライス内のビデオブロックのイントラコーディングおよびインターコーディングを実行し得る。イントラコーディングは、所与のビデオフレームまたはピクチャ内のビデオの空間的冗長性を低減または除去するために空間的予測に依拠する。インターコーディングは、ビデオシーケンスの隣接フレームまたはピクチャ内のビデオの時間的冗長性を低減または除去するために時間的予測に依拠する。イントラモード（Ｉモード）は、いくつかの空間ベースのコーディングモードのいずれかを指し得る。単方向予測（Ｐモード）または双方向予測（Ｂモード）などのインターモードは、いくつかの時間ベースのコーディングモードのいずれかを指し得る。

[0072]図２に示すように、ビデオエンコーダ２０は、符号化されるべきビデオフレーム内の現在のビデオブロックを受信する。図１の例では、ビデオエンコーダ２０は、モード選択ユニット４０と、参照フレームメモリ６４と、加算器５０と、変換処理ユニット５２と、量子化ユニット５４と、エントロピーコーディングユニット５６とを含む。モード選択ユニット４０は、今度は、動き補償ユニット４４と、動き推定ユニット４２と、レイヤ間予測ユニット４５と、イントラ予測ユニット４６と、重み付け予測ユニット４７と、パーティションユニット４８とを含む。ビデオブロック再構成のために、ビデオエンコーダ２０はまた、逆量子化ユニット５８と、逆変換ユニット６０と、加算器６２とを含む。再構成されたビデオからブロッキネスアーティファクトを除去するためにブロック境界をフィルタ処理するデブロッキングフィルタ（図２に図示せず）も含まれ得る。所望される場合、デブロッキングフィルタは、一般に、加算器６２の出力をフィルタ処理することになる。また、デブロッキングフィルタに加えて追加のフィルタ（ループ内またはループ後）が使用され得る。そのようなフィルタは、簡潔のために示されていないが、所望される場合、（ループ内フィルタとして）加算器６２の出力をフィルタ処理し得る。

[0073]符号化プロセス中に、ビデオエンコーダ２０は、コーディングされるべきビデオフレームまたはスライスを受信する。フレームまたはスライスは複数のビデオブロックに分割され得る。動き推定ユニット４２および動き補償ユニット４４は、時間的予測を行うために、１つまたは複数の参照フレーム中の１つまたは複数のブロックに対して、受信されたビデオブロックのインター予測コーディングを実行する。レイヤ間予測ユニット４５は、以下でより詳細に説明するように、ベースレイヤのコロケートブロックなど、ビデオ情報の異なるレイヤの１つまたは複数のブロックに対して受信されたビデオブロックのレイヤ間予測コーディングを代替的に実行し得る。イントラ予測ユニット４６は、代替的に、空間的予測を行うために、コーディングされるべきブロックと同じフレームまたはスライス中の１つまたは複数の隣接ブロックに対して受信されたビデオブロックのイントラ予測コーディングを実行し得る。ビデオエンコーダ２０は、たとえば、ビデオデータのブロックごとに適切なコーディングモードを選択するために、複数のコーディングパスを実行し得る。重み付け予測ユニット４７は、以下でより詳細に説明するように、様々な予測モードに従って行われる予測の組合せを使用して重み付け予測を代替的に実行し得る。

[0074]その上、パーティションユニット４８は、前のコーディングパスにおける前の区分方式の評価に基づいて、ビデオデータのブロックをサブブロックに区分し得る。たとえば、パーティションユニット４８は、初めにフレームまたはスライスをＬＣＵに区分し、レートひずみ分析（たとえば、レートひずみ最適化）に基づいてＬＣＵの各々をサブＣＵに区分し得る。モード選択ユニット４０は、ＬＣＵをサブＣＵに区分することを示す４分木データ構造をさらに生成し得る。４分木のリーフノードＣＵは、１つまたは複数のＰＵおよび１つまたは複数のＴＵを含み得る。

[0075]モード選択ユニット４０は、たとえば、誤差結果に基づいて、コーディングモード、すなわち、イントラまたはインターのうちの１つを選択することができ、残差ブロックデータを生成するために、得られたイントラコーディングされたブロックまたはインターコーディングされたブロックを加算器５０に与え、かつ参照フレームとして使用するための符号化されたブロックを復元するために、得られたイントラコーディングされたブロックまたはインターコーディングされたブロックを加算器６２に与える。モード選択ユニット４０はまた、動きベクトル、イントラモードインジケータ、パーティション情報、および他のそのようなシンタックス情報などのシンタックス要素をエントロピーコーディングユニット５６に与える。

[0076]動き推定ユニット４２および動き補償ユニット４４は、高度に統合され得るが、概念的な目的のために別々に示してある。動き推定ユニット４２によって実行される動き推定は、ビデオブロックの動きを推定する動きベクトルを生成するプロセスである。動きベクトルは、たとえば、現在のフレーム（または他のコード化ユニット）内でコーディングされている現在のブロックに対する参照フレーム（または他のコード化ユニット）内の予測ブロックに対する現在のビデオフレームまたはピクチャ内のビデオブロックのＰＵの変位を示し得る。予測ブロックは、絶対値差分和（ＳＡＤ：sum of absolute difference）、２乗差分和（ＳＳＤ：sum of square difference）、または他の差分メトリックによって判断され得るピクセル差分に関して、コーディングされるべきブロックにぴったり一致することがわかるブロックである。いくつかの例では、ビデオエンコーダ２０は、参照フレームメモリ６４に記憶された参照ピクチャのサブ整数ピクセル位置の値を計算し得る。たとえば、ビデオエンコーダ２０は、参照ピクチャの１／４ピクセル位置、１／８ピクセル位置、または他の分数ピクセル位置の値を補間し得る。したがって、動き推定ユニット４２は、フルピクセル位置と分数ピクセル位置とに対する動き探索を実行し、分数ピクセル精度で動きベクトルを出力し得る。

[0077]動き推定ユニット４２は、ＰＵの位置を参照ピクチャの予測ブロックの位置と比較することによって、インターコード化スライスにおけるビデオブロックのＰＵのための動きベクトルを計算する。参照ピクチャは、第１の参照ピクチャリスト（リスト０）または第２の参照ピクチャリスト（リスト１）から選択され得、それらの参照ピクチャリストの各々は、参照フレームメモリ６４に記憶された１つまたは複数の参照ピクチャを識別する。動き推定ユニット４２は、計算された動きベクトルをエントロピー符号化ユニット５６と動き補償ユニット４４とに送る。

[0078]動き補償ユニット４４によって実行される動き補償は、動き推定ユニット４２によって判断された動きベクトルに基づいて予測ブロックをフェッチまたは生成することに関与し得る。この場合も、いくつかの例では、動き推定ユニット４２および動き補償ユニット４４は機能的に統合され得る。現在のビデオブロックのＰＵについての動きベクトルを受信すると、動き補償ユニット４４は、動きベクトルが参照ピクチャリストのうちの１つにおいて指す予測ブロックの位置を特定し得る。加算器５０は、以下で説明するように、コーディングされている現在のビデオブロックのピクセル値から予測ブロックのピクセル値を減算し、ピクセル差分値を形成することによって、残差ビデオブロックを形成する。概して、動き推定ユニット４２はルーマ成分に対して動き推定を実行し、かつ動き補償ユニット４４は、クロマ成分とルーマ成分の両方のためにルーマ成分に基づいて計算された動きベクトルを使用する。モード選択ユニット４０はまた、ビデオスライスのビデオブロックを復号する際にビデオデコーダ３０が使用するためのビデオブロックとビデオスライスとに関連するシンタックス要素を生成し得る。

[0079]イントラ予測ユニット４６は、上記で説明したように、動き推定ユニット４２と動き補償ユニット４４とによって実行されるインター予測の代替として、現在ブロックをイントラ予測または計算し得る。特に、イントラ予測ユニット４６は、現在のブロックを符号化するために使用すべきイントラ予測モードを判断し得る。いくつかの例では、イントラ予測ユニット４６は、たとえば、別個の符号化パス中に、様々なイントラ予測モードを使用して現在のブロックを符号化し得、イントラ予測ユニット４６（または、いくつかの例では、モード選択ユニット４０）は、テストされたモードから使用するのに適切なイントラ予測モードを選択し得る。

[0080]たとえば、イントラ予測ユニット４６は、様々なテストされたイントラ予測モードのためのレートひずみ分析を使用してレートひずみ値を計算し、テストされたモードの中で最良のレートひずみ特性を有するイントラ予測モードを選択し得る。レートひずみ分析は、概して、符号化ブロックと、符号化ブロックを生成するために符号化された元の符号化されていないブロックとの間のひずみ（または誤差）の量、ならびに符号化ブロックを生成するために使用されるビットレート（すなわち、ビット数）を判断する。イントラ予測ユニット４６は、どのイントラ予測モードがブロックについて最良のレートひずみ値を呈するかを判断するために、様々な符号化ブロックのひずみおよびレートから比率を計算し得る。

[0081]ブロックのためのイントラ予測モードを選択した後に、イントラ予測ユニット４６は、ブロックのための選択されたイントラ予測モードを示す情報をエントロピーコーディングユニット５６に提供し得る。エントロピーコーディングユニット５６は、選択されたイントラ予測モードを示す情報を符号化し得る。ビデオエンコーダ２０は、送信ビットストリーム中に、複数のイントラ予測モードインデックステーブルおよび複数の変更されたイントラ予測モードインデックステーブル（コードワードマッピングテーブルとも呼ばれる）と、様々なブロックの符号化コンテキストの定義と、コンテキストの各々について使用すべき、最確イントラ予測モード、イントラ予測モードインデックステーブル、および変更されたイントラ予測モードインデックステーブルの指示とを含み得る構成データを含み得る。

[0082]ビデオエンコーダ２０は、コーディングされている元のビデオブロックから、モード選択ユニット４０からの予測データを減算することによって残差ビデオブロックを形成する。加算器５０は、この減算演算を実行する１つまたは複数の構成要素を表す。変換処理ユニット５２は、離散コサイン変換（ＤＣＴ）または概念的に同様の変換などの変換を残差ブロックに適用し、残差変換係数値を備えるビデオブロックを生成する。変換処理ユニット５２は、ＤＣＴと概念的に同様である他の変換を実行し得る。ウェーブレット変換、整数変換、サブバンド変換または他のタイプの変換も使用され得る。いずれの場合も、変換処理ユニット５２は、変換を残差ブロックに適用し、残差変換係数のブロックを生成する。変換は、残差情報をピクセル値領域から周波数領域などの変換領域に変換し得る。変換処理ユニット５２は、得られた変換係数を量子化ユニット５４に送り得る。量子化ユニット５４は、ビットレートをさらに低減するために変換係数を量子化する。量子化プロセスは、係数の一部または全部に関連するビット深度を低減し得る。量子化の程度は、量子化パラメータを調整することによって変更され得る。いくつかの例では、量子化ユニット５４は、次いで、量子化変換係数を含む行列の走査を実行し得る。代替的に、エントロピー符号化ユニット５６が走査を実行し得る。

[0083]量子化の後、エントロピーコーディングユニット５６は、量子化変換係数をエントロピーコーディングする。たとえば、エントロピーコーディングユニット５６は、コンテキスト適応型可変長コーディング（ＣＡＶＬＣ）、コンテキスト適応型バイナリ算術コーディング（ＣＡＢＡＣ）、シンタックスベースコンテキスト適応型バイナリ算術コーディング（ＳＢＡＣ）、確率間隔区分エントロピー（ＰＩＰＥ）コーディングまたは別のエントロピーコーディング技法を実行し得る。コンテキストベースのエントロピーコーディングの場合、コンテキストは、隣接するブロックに基づき得る。エントロピーコーディングユニット５６によるエントロピーコーディングの後、符号化されたビットストリームは、別のデバイス（たとえば、ビデオデコーダ３０）に送信されるか、または後で送信するかまたは取り出すためにアーカイブされ得る。

[0084]逆量子化ユニット５８および逆変換ユニット６０は、それぞれ逆量子化および逆変換を適用して、たとえば参照ブロックとして後で使用するために、ピクセル領域中で残差ブロックを再構成する。動き補償ユニット４４は、残差ブロックを参照フレームメモリ６４のフレームのうちの１つの予測ブロックに加算することによって参照ブロックを計算し得る。動き補償ユニット４４はまた、再構成された残差ブロックに１つまたは複数の補間フィルタを適用して、動き推定において使用するサブ整数ピクセル値を計算し得る。加算器６２は、再構成された残差ブロックを、動き補償ユニット４４によって生成された動き補償予測ブロックに加算して、参照フレームメモリ６４に記憶するための再構成されたビデオブロックを生成する。再構成されたビデオブロックは、後続のビデオフレーム中のブロックをインターコーディングするために動き推定ユニット４２および動き補償ユニット４４によって参照ブロックとして使用され得る。

[0085]図３は、本開示で説明する態様による技法を実装し得るビデオデコーダの例を示すブロック図である。ビデオデコーダ３０は、本開示の技法のいずれかまたはすべてを実行するように構成され得る。一例として、動き補償ユニット７２、レイヤ間予測ユニット７３、イントラ予測ユニット７４、および／または重み付け予測ユニット７５は、本開示で説明する技法のいずれかまたはすべてを実行するように構成され得る。ただし、本開示の態様はそのように限定されない。いくつかの例では、本開示で説明する技法は、ビデオデコーダ３０の様々な構成要素間で共有され得る。いくつかの例では、追加としてまたは代わりに、プロセッサ（図示せず）が、本開示で説明する技法のいずれかまたはすべてを実行するように構成され得る。

[0086]いくつかの実施形態では、エントロピー復号ユニット７０、動き補償ユニット７２、レイヤ間予測ユニット７３、イントラ予測ユニット７４、重み付け予測ユニット７５、またはデコーダ３０の別の構成要素（図示済みまたは図示せず）が本開示の技法を実行し得る。たとえば、エントロピー復号ユニット７０は、符号化ビデオビットストリームを受信し得、符号化ビデオビットストリームは、ベースレイヤと対応する１つまたは複数のエンハンスメントレイヤとに関するデータを符号化し得る。動き補償ユニット７２、レイヤ間予測ユニット７３、イントラ予測ユニット７４、重み付け予測ユニット７５、またはデコーダ３０の別の適切なユニットは、イントラ予測、インター予測、イントラＢＬ予測、一般化残差予測などを含む２つ以上の重み付け予測の組合せに少なくとも部分的に基づいて現在のビデオユニットの値を判断し得る。デコーダ３０は、ビデオユニットを復号し、ビットストリーム中で（１つまたは複数の）重み係数または重み情報を受信することができる。

[0087]図３の例では、ビデオデコーダ３０は、エントロピー復号ユニット７０と、動き補償ユニット７２と、レイヤ間予測ユニット７３と、イントラ予測ユニット７４と、重み付け予測ユニット７５と、逆量子化ユニット７６と、逆変換ユニット７８と、参照フレームメモリ８２と、加算器８０とを含む。ビデオデコーダ３０は、いくつかの例では、ビデオエンコーダ２０（図２）に関して説明した符号化パスとは概して逆の復号パスを実行し得る。動き補償ユニット７２は、エントロピー復号ユニット７０から受信された動きベクトルに基づいて予測データを生成し得、イントラ予測ユニット７４は、エントロピー復号ユニット７０から受信されたイントラ予測モードインジケータに基づいて予測データを生成し得る。

[0088]復号プロセス中に、ビデオデコーダ３０は、ビデオエンコーダ２０から、符号化ビデオスライスのビデオブロックと、関連するシンタックス要素とを表す符号化ビデオビットストリームを受信する。ビデオデコーダ３０のエントロピー復号ユニット７０は、量子化係数、動きベクトルまたはイントラ予測モードインジケータ、および他のシンタックス要素を生成するためにビットストリームをエントロピー復号する。エントロピー復号ユニット７０は、動きベクトルと他の予測シンタックス要素とを動き補償ユニット７２に転送する。ビデオデコーダ３０は、ビデオスライスレベルおよび／またはビデオブロックレベルでシンタックス要素を受信し得る。

[0089]ビデオスライスがイントラコード化（Ｉ）スライスとしてコーディングされるとき、イントラ予測ユニット７４は、シグナリングされたイントラ予測モードと、現在フレームまたはピクチャの、前に復号されたブロックからのデータとに基づいて、現在のビデオスライスのビデオブロックのための予測データを生成し得る。ビデオフレームがインターコード化（たとえば、Ｂ、ＰまたはＧＰＢ）スライスとしてコーディングされるとき、動き補償ユニット７２は、エントロピー復号ユニット７０から受信された動きベクトルと他のシンタックス要素とに基づいて、現在のビデオスライスのビデオブロックのための予測ブロックを生成する。予測ブロックは、参照ピクチャリストのうちの１つ内の参照ピクチャのうちの１つから生成され得る。ビデオデコーダ３０は、参照フレームメモリ９２に記憶された参照ピクチャに基づいて、デフォルトの構成技法を使用して、参照フレームリスト、すなわち、リスト０およびリスト１を構成し得る。動き補償ユニット７２は、動きベクトルと他のシンタックス要素とをパースすることによって現在のビデオスライスのビデオブロックのための予測情報を判断し、その予測情報を使用して、復号されている現在のビデオブロックのための予測ブロックを生成する。たとえば、動き補償ユニット７２は、ビデオスライスのビデオブロックをコーディングするために使用される予測モード（たとえば、イントラまたはインター予測）と、インター予測スライスタイプ（たとえば、Ｂスライス、Ｐスライス、またはＧＰＢスライス）と、スライスの参照ピクチャリストのうちの１つまたは複数のための構成情報と、スライスの各インター符号化ビデオブロックのための動きベクトルと、スライスの各インターコード化ビデオブロックのためのインター予測ステータスと、現在のビデオスライス中のビデオブロックを復号するための他の情報とを判断するために、受信されたシンタックス要素のいくつかを使用する。

[0090]動き補償ユニット７２はまた、補間フィルタに基づいて補間を実行し得る。動き補償ユニット７２は、ビデオブロックの符号化中にビデオエンコーダ２０によって使用された補間フィルタを使用して、参照ブロックのサブ整数ピクセルの補間値を計算し得る。この場合、動き補償ユニット７２は、受信されたシンタックス要素からビデオエンコーダ２０によって使用された補間フィルタを判断し、その補間フィルタを使用して予測ブロックを生成し得る。

[0091]逆量子化ユニット７６は、ビットストリーム中で与えられ、エントロピー復号ユニット８０によって復号された量子化変換係数を逆量子化（inverse quantize）、たとえば、逆量子化（de-quantize）する。逆量子化プロセスは、量子化の程度を判断し、同様に、適用されるべき逆量子化の程度を判断するための、ビデオスライス中のビデオブロックごとにビデオデコーダ３０によって計算される量子化パラメータＱＰ_Yの使用を含み得る。

[0092]逆変換ユニット７８は、ピクセル領域において残差ブロックを生成するために、逆変換、たとえば逆ＤＣＴ、逆整数変換、または概念的に同様の逆変換プロセスを変換係数に適用する。

[0093]動き補償ユニット８２が、動きベクトルと他のシンタックス要素とに基づいて現在のビデオブロックのための予測ブロックを生成した後に、ビデオデコーダ３０は、逆変換ユニット７８からの残差ブロックを動き補償ユニット７２によって生成された対応する予測ブロックに加算することによって、復号されたビデオブロックを形成する。加算器９０は、この加算演算を実行する１つまたは複数の構成要素を表す。所望される場合、ブロッキネスアーティファクトを除去するために、復号ブロックをフィルタ処理するためにデブロッキングフィルタも適用され得る。ピクセル遷移を平滑化するために、または場合によってはビデオ品質を改善するために、他のループフィルタも（コーディングループ中またはコーディングループ後のいずれかで）使用され得る。所与のフレームまたはピクチャ中の復号されたビデオブロックは、次いで、その後の動き補償のために使用される参照ピクチャを記憶する参照ピクチャメモリ９２に記憶される。参照フレームメモリ８２はまた、図１のディスプレイデバイス３２などのディスプレイデバイス上での後の表示のための、復号されたビデオを記憶する。

[0094]上記で説明した例示的なエンコーダ２０およびデコーダ３０は、例にすぎず、限定するものではない。いくつかの実施形態では、本明細書で説明する技法を実行し、機能を与えるように構成されたエンコーダまたはデコーダは、追加の構成要素またはより少ない構成要素を含み得る。いくつかの実施形態では、他の構成要素またはデバイスは、コンピュータ可読媒体に記憶された特定の命令を実行するように構成された汎用コンピュータプロセッサなど、本明細書で説明する機能を与え得る。

[0095]上記で説明したように、重み付けモード予測は、様々な予測モードに従って生成される個別の予測の組合せを含み得る。たとえば、単一の重み付けモード予測は、イントラ予測および／またはインター予測を含み得る。ＳＶＣ固有の予測モードはまた、重み付けモードの個別の予測を与えるために使用され得る。たとえば、イントラＢＬモード、差分領域イントラモードに従って行われる予測、一般化残差予測などは、互いにおよび／またはインター予測、イントラ予測などと組み合わされ得る。これらおよび他の予測モードについて以下でより詳細に説明する。上述の予測モードは、例にすぎず、限定するものではない。概して、任意の予測モードまたは技法に従って行われる予測は、本明細書で説明する重み付けモードで組み合わされ得る。

[0096]図４Ａに、レイヤ内予測とレイヤ間予測の両方を含む、特定のビデオユニットの例示的な予測を示す。エンハンスメントレイヤ（ＥＬ）フレーム１４０のブロックまたは他のビデオユニットは、同じフレーム中と異なるフレーム中の両方および同じレイヤ中または異なるレイヤ中の両方の様々なソースから予測され得る。図４Ａに示すように、現在のブロック１４２は、同じフレーム１４０中および同じレイヤ（ＥＬ）中の別のブロック１４４から（Ａ）において予測され得る。現在のブロック１４２はまた、同じレイヤ中の参照フレーム１３０中の対応するブロック１３２から（Ｂ）において予測され得る。現在のブロック１４２はまた、異なるレイヤ−ベースレイヤ（ＢＬ）のフレーム１２０中の対応するブロック１２２から（Ｃ）において予測され得る。ＥＬが、異なる解像度、たとえば、より大きい解像度を有する場合、そのＢＬ（たとえば、ＥＬが空間魅力を与える）、対応するＥＬブロックを予測するより前にＥＬの解像度に一致するようにＢＬ再構成ブロックのアップサンプリングが適用され得る。

[0097]レイヤ間予測のいくつかの例としては、レイヤ間イントラ予測、レイヤ間動き予測、およびレイヤ間残差予測があり得る。レイヤ間イントラ予測またはＩｎｔｒａＢＬは、ベースレイヤ中のコロケートブロックの再構成を使用してエンハンスメントレイヤ中の現在ブロックを予測する。レイヤ間動き予測は、ベースレイヤの動きを使用してエンハンスメントレイヤ中の動作を予測する。レイヤ間残差予測は、ベースレイヤの残差を使用してエンハンスメントレイヤの残差を予測する。

[0098]レイヤ間残差予測では、ベースレイヤの残差は、エンハンスメントレイヤ中の現在ブロックを予測するために使用され得る。残差は、ビデオユニットの時間的予測とソースビデオユニットとの間の差分として定義され得る。いくつかの実施形態では、現在ＥＬブロックは、エンハンスメントレイヤからの残差、エンハンスメントレイヤからの時間的予測、およびベースレイヤからの残差を使用して再構成され得る。現在ブロックは以下の式に従って再構成され得る。

上式で、

（または

）は現在ブロックの再構成を示し、ｒ_eはエンハンスメントレイヤからの残差を示し、Ｐ_e（Ｐ_c）はエンハンスメントレイヤからの時間的予測を示し、ｒ_bはベースレイヤからの残差予測を示す。

[0099]エンハンスメントレイヤ中のブロックのためにレイヤ間残差予測を使用するために、ベースレイヤ中のコロケートブロックはインターコード化ブロックであるべきであり、コロケートベースレイヤブロックの残差は、（たとえば、ＳＶＣにおけるレイヤは異なる空間解像度を有し得るので）エンハンスメントレイヤの空間解像度比に従ってアップサンプリングされ得る。レイヤ間残差予測では、エンハンスメントレイヤの残差とアップサンプリングされたベースレイヤの残差との間の差分がビットストリーム中でコーディングされ得る。ベースレイヤの残差は、ベースレイヤの量子化ステップとエンハンスメントレイヤの量子化ステップとの間の比に基づいて正規化され得る。レイヤ間残差予測については、以下でより詳細に説明する。

[00100]最終予測にさらなるダイバーシティを追加するために、上記で説明した予測モードまたは他の予測モードからの予測子が重み付けされ組み合わされて、重み付けモード予測子を生成し得る。図４Ｂに、重み付けモードで生成された現在のブロック１４２の例示的な予測を示す。同じレイヤ中のブロック１４４からのイントラ予測は、重み付けされ、ベースレイヤ中のブロック１２２からの重み付けイントラＢＬ予測と組み合わされ得る。別の例では、同じレイヤ中のブロック１３２からのインター予測は、重み付けされ、ベースレイヤ中のブロック１２２からの重み付けイントラＢＬ予測と組み合わされ得る。もう１つの例では、３つすべての前述の予測（イントラ予測、インター予測およびレイヤ間予測）が、重み付けされ組み合わされ得る。したがって、ブロック１４２の再構成は、いくつかの個別の予測から判断された多様な予測に基づき得る。これは、個別の予測モードに固有の誤りおよび他の制限を回避するのに役立ち得る。

[00101]概して説明するように、重み付けモード予測子は、次のように判断され得る。

上式で、Ｐｒｅｄｉｃｔｏｒ_iは、ある予測モードからの予測子であり、ｗ_iは、予測モードに対応する重みであり、Ｎｏｒｍは、正規化ファクタである。合計は、予測モードの数ｉにわたって実行される。いくつかの実施形態では、予測モードの数ｉは３以上であり得る。

[00102]式（２）における重みおよび正規化ファクタは、任意の数（たとえば、浮動小数点数または整数）であり得、色成分ごとに異なり得る。１つの特定の非限定的な実施形態では、ルーマ成分については、ｗ₁＝１、ｗ₂＝１、およびＮｏｒｍ＝２であり、一方、クロマ成分については、ｗ₁＝０、ｗ₂＝１、およびＮｏｒｍ＝１である。これらの重みは、例示的なものにすぎない。いくつかの実施形態では、重みは、予測されているビデオユニットの各色成分について同じであり得る。

[00103]いくつかの実施形態では、次のように追加の制約が式（２）に課され得る。

式（３）に示すように、正規化ファクタＮｏｒｍは、重み係数の和に等しくなり得る。そのような制約がＮｏｒｍに課されるとき、式（２）は、複数の予測子の重み付け平均を生成することができる。

[00104]図５に、重み付けモードを使用して、ピクセルまたはピクセルのブロックなどの現在のビデオユニットの値を判断するための例示的な方法またはプロセス５００を示す。たとえば、上記で説明したエンコーダ２０またはデコーダ３０などのデジタルビデオコーダは、重み付けモードで予測を生成するためにプロセス５００を使用し得る。いくつかの実施形態では、プロセス５００は、何らかの他の構成要素または装置によって実行され得る。例示的に、以下の説明は、図３中のデコーダ３０の重み付け予測ユニット７５および他の構成要素に関するプロセス５００のステップについて説明する。

[00105]プロセス５００は、ブロック５０２において開始する。ブロック５０４において、ビデオ情報が記憶される。たとえば、ブロック５０４において、ベースレイヤ、エンハンスメントレイヤ、アップサンプリングされたレイヤ、ダウンサンプリングされたレイヤ、基準レイヤ、または任意の組合せに関連するビデオ情報が記憶され得る。

[00106]ブロック５０６において、個別の予測モードに従って生成される重み付け予測を使用して、現在のビデオユニット（ピクセルまたはピクセルのブロックなど）の値が判断（または予測）される。重み付けモードは、ビデオユニットのすべての色成分またはそれらのいくつかのサブセットに適用され得る。たとえば、重み付けモードは、ルーマと両方のクロマとに適用され得、または代替的に、重み付けモードは、ルーマ成分にのみなど、１つまたは複数の構成要素に選択的に適用され得る。重み付けモードでは、ビデオユニットの値は、ビデオユニットの少なくとも１つの色成分の１つまたは複数の重み付け予測を使用して判断され得る。たとえば、利用されている個別の予測モードに応じて、ビデオ情報の１つまたは複数の色成分に重み係数を選択的に適用することによって値が判断され得る。

[00107]図４Ｂ中の例に戻ると、ＥＬブロック１４２の重み付けモード予測は、イントラ予測とイントラＢＬ予測の両方を使用して行われる予測に基づくべきである。第１に、イントラ予測は、ＥＬブロック１４４からの値と重み係数とを使用してＥＬブロック１４２中のビデオユニットに対して行われ得る。重み係数は、任意の数のファクタに基づいて判断され得る。いくつかの実施形態では、最終重み付けモード予測において使用される各予測のための重み係数は、各予測（たとえば、この場合はイントラ予測およびイントラＢＬ予測）が一様に重み付けされるように判断され得る。いくつかの実施形態では、重み係数は、予測されるべきビデオユニットのロケーションに少なくとも部分的に基づき得る。同じレイヤおよびフレーム中の以前に再構成されたビデオユニットまたはブロックに近接しているサブブロックまたはピクセルなどのビデオユニットの場合、イントラ予測のためにイントラＢＬ予測よりも高い重み係数が使用され得る。図４Ｂの例では、ＥＬブロック１４２の上部に近接している、したがって、以前に再構成されたＥＬブロック１４４に近接しているピクセルまたは他のビデオユニットのイントラ予測は、１に近いかまたは１に等しい重みを与えられ得る。ＥＬブロック１４２の下部にあるビデオユニットについて重みが０に近くなるかまたは０に等しくなるなど、ＥＬブロック１４２の上部から遠くにあるビデオユニットのイントラ予測はより低い重みが与えられ得る。この例は、例示的なものにすぎず、垂直予測方向など、多くの詳細を仮定している。当業者なら諒解するように、重み係数を判断するための他のファクタおよび技法が使用され得る。

[00108]５０８において、プロセス５００は、個別の予測モードに従って行われる予測に適用されるべき追加の重み係数があるかどうかを判断する。そうである場合、プロセス５００は５０６に戻る。図４Ｂの例に戻ると、ＥＬブロック１４２中の所与のビデオユニットのイントラＢＬ予測は、ベースレイヤ中のコロケートするまたは場合によっては対応するブロック１２２からの重み付け予測であり得る。ＥＬブロック１４２の上部に近いビデオユニットについて、重み係数は、イントラＢＬ予測について０に近いかまたは０に等しくなり得る。イントラＢＬ予測の重み係数は、ＥＬブロック１４２の下部により近いかまたはＥＬブロック１４２の下部にあるビデオユニットについて１に近くなるかまたは１に等しくなり得る。現在のビデオユニットの値は、すべての重み付け予測の和として判断されるか、または重み付け予測子の選択されたグループの和として判断され得る。

[00109]ブロック５０８において追加の重み係数がない場合、プロセスは、ブロック５１０において終了し得る。

[00110]重み付けモードは、少なくともブロック、ＰＵ、ＣＵ、ＬＣＵ、スライス、フレーム、シーケンスレベルまたは他の場所において追加のフラグ（たとえば、ｗｅｉｇｈｔｅｄ＿ｍｏｄｅ＿ｆｌａｇ＝０または１）としてコード化ビットストリーム中で明確にシグナリングされ得る。たとえば、上記のプロセス５００を実装するエンコーダ２０は、重み付けモードが使用されるべきであると最初に判断し、次いで、後に続く特定のブロック、ＰＵ、ＣＵ、ＬＣＵ、スライス、フレームまたはシーケンスレベルについてのビデオ情報が重み付けモードで符号化されることをデコーダが知り得るようにビットストリーム中で重み付けモードフラグをシグナリングし得る。プロセス５００を実装するデコーダ３０は、重み付けモードフラグを検出し、次いで、プロセス５００を使用して、ビットストリームの少なくとも一部分を復号し得る。代替的に、重み付けモードを使用すべきかどうかの判断は、ＢＬ情報、ＥＬ情報、それらの何らかの組合せなどから導出され得る。

[00111]いくつかの実施形態では、重み付けモードフラグがシグナリングされる場合、ブロック、ＰＵ、ＣＵ、ＬＣＵ、スライス、フレーム、シーケンスレベルまたは他の場所ごとに重みもシグナリングされ得る。代替的に、上記で説明したように、重み付けモードで使用される重みは、固定される（たとえば、２つの予測が組み合わされるとき、ｗ_i＝１または０．５）か、以前に再構成されたネイバーから導出されるか、またはブロック境界からの距離に基づいて判断され得る。たとえば、イントラ重み付けモードの場合、イントラ予測はすぐ隣のネイバーピクセルに対して良い相関を有し得るので、ブロック境界に閉じられたピクセルについてイントラ予測モードにより大きい重みが与えられ得る。

[00112]いくつかの実施形態では、重みは、１つまたは複数のエントリをもつリストに編成され得、ここで、１つまたは複数の重みがリストの各重みインデックスに割り当てられる。重みインデックスは、ビットストリーム中でシグナリングされ得る。このリストは、固定であるか、または場合によってはエンコーダとデコーダの両方に知らされ得る。他の実施形態では、リストは、暗黙的にまたは明示的に導出される。たとえば、重みリストは、前のコード化ブロックから取得された重みのヒット率に基づいて判断され得る。代替または追加として、リストは、重み付けモードの異なる予測モードごとに異なり得る。たとえば、１つのリストがイントラ予測ブロックのために使用され得、別のリストがインター予測ブロックのために使用され得る。これらのリストは、たとえば、以前に処理されたブロックからの統計値に基づいて別個に更新され得る。このモードの使用量は、スライス、ピクチャ、シーケンスヘッダまたはビデオパラメータセットなど、１つまたは複数のヘッダ中のシンタックス要素によって示され得る。

[00113]１つの特定の非限定的な実施形態では、式（２）におけるＰｒｅｄｉｃｔｏｒ₁は、再構成された（たとえば、空間スケーラビリティの場合はアップサンプリングされた）ＢＬブロックまたはイントラＢＬ予測子であり得る。従来のイントラまたはインターモード予測子がＰｒｅｄｉｃｔｏｒ₂として使用され得る。ルーマ成分のために重みｗ₁＝１およびｗ₂＝１ならびにＮｏｒｍ＝２が使用され得、両方のクロマ成分のためにｗ₁＝０、ｗ₂＝１、およびＮｏｒｍ＝１が使用され得る。

[00114]上記の例におけるＰｒｅｄｉｃｔｏｒ₂がイントラ予測モードに従って生成される予測子であるとき、ルーマ成分および／またはクロマ成分を予測するために、すべてのイントラ方向またはそれのいくつかのサブセットが使用され得る。いくつかの実施形態では、イントラ方向のオーバーヘッドを低減するために、両方のクロマ成分のためにイントラＤＣまたはＤＭ予測が使用され得る。したがって、（１つまたは複数の）クロマイントラ方向をシグナリングする必要がない。これにより、最良のイントラ方向を探索することが必要なくなるので、オーバーヘッドシグナリングとエンコーダ複雑さのいずれかまたは両方が低減され得る。

[00115]重み付けモードの適用例に応じて異なるシンタックス構造が使用され得る。たとえば、ＣＵ、ＰＵなどごとに「ｗｅｉｇｈｔｅｄ＿ｍｏｄｅ」フラグがシグナリングされ得る。ベースブロックの様々なアップサンプリングに重み付けが適用される場合、フラグは、ルーマおよびクロマイントラ予測方向の前にシグナリングされ得る。そのような場合、ルーマおよび／またはクロマインター方向のシグナリングが抑制され得る。

[00116]また別の例として、ＢＬブロックに異なるアップサンプリングフィルタが適用され得、重み付けモードが差分アップサンプラの結果に適用され得る。当業者なら諒解するように、他のモード組合せ、重み、および正規化ファクタが使用され得る。

[00117]いくつかの実施形態では、すべてのブロックの重み付けモードフラグをコーディングするために１つのコンテキストモデルが使用される。他の実施形態では、コンテキストモデルは、どの個別の予測モードが重み付けモードとともに使用されるかに依存し得る。たとえば、１つのコンテキストモデルがイントラ予測ブロックに割り当てられ得、別のコンテキストモデルがインター予測ブロックに割り当てられ得る。

[00118]追加の実施形態では、コンテキストモデルは、どのインター予測モード（たとえば、単予測または双予測）が使用されるかに従って分離され得る。たとえば、単予測ブロックが、１つのコンテキストモデルを使用することができ、双予測ブロックが、別のコンテキストモデルを使用することができる。さらなる実施形態では、コンテキストモデルは、イントラ方向、マージフラグ、スキップフラグ、ＣＵ深度またはスライスタイプなどの他のファクタに依存し得る。ＥＬコンテキストモデル初期化のために使用される既存の初期化テーブルから最良のＣＡＢＡＣ初期化テーブルを判断するために、重み付けモードコンテキストモデルコストが使用され得る。

[00119]いくつかの状況では、重み付けモードの使用によってもたらされる帯域幅要件および／またはコーディング複雑さは、パフォーマンスを劣化させるかまたはさもなければ不満足な結果をもたらし得る。たとえば、エンハンスメントレイヤのために双方向サブピクセル（サブペル）動き補償を使用し、ベースレイヤのためにアップサンプリングを使用する重み付けモードは、ＨＥＶＣ単一レイヤコーディング技法と比較すると、新しい「ワーストケースシナリオ」になり得る。ＨＥＶＣ単一レイヤコーディングでは、「ワーストケースシナリオ」は、双方向予測にのみ関与する。重み付けモードを使用してＳＶＣの帯域幅要件および／またはコーディング複雑さを低減するために、図６および図７に関して以下で説明する技法およびプロセスが適用され得る。

[00120]図６に、いくつかのブロックサイズに重み付けモードの使用を制限するための例示的なプロセス６００を示す。有利には、これにより、重み付けモード固有の情報をシグナリングするのに必要な帯域幅を低減することができる。プロセス６００は、エンコーダ２０の重み付け予測ユニット４７、デコーダ３０の重み付け予測ユニット７５、または上記で説明したエンコーダ２０および／もしくはデコーダ３０の何らかの他の構成要素など、任意の数の構成要素またはデバイスによって実装され得る。

[00121]プロセス６００は、ブロック６０２において開始する。６０４において、再構成されるべき現在のＥＬブロックのサイズが判断される。たとえば、ブロックサイズは、間に様々なサイズを含む４×４から３２×３２の範囲にあり得る。

[00122]決定ブロック６０６において、プロセス６００を実装する構成要素またはデバイスは、上で判断されたサイズがしきい値を超えるかどうかを判断することができる。そうである場合、プロセス６００は６０８に進み、そこで、図５に関して上記で説明したように、予測に重み係数を選択的に適用することによって、現在のＥＬブロック中のビデオユニットの少なくとも１つの色成分の値が判断される。たとえば、８×８よりも大きいかまたは１６×１６よりも大きいブロックが、重み付け予測モードを使用してコーディング（たとえば、符号化または復号）され得る。

[00123]６０６において上で判断したように、しきい値を満たすかまたはそれを超えることができないブロックについては、プロセス６００は６１０に進む。６１０において、現在のブロック中のビデオユニットの値は、（たとえば、複数の予測モードに従って行われる重み付け予測を加算することなしに）個別の予測モードを使用して生成される。

[00124]いくつかの実施形態では、必ずしもしきい値サイズが使用されるとは限らないことがある。代わりに、重み付けモードが使用され得るブロックサイズのリストまたはグループが維持され得る。いくつかの実施形態では、重み付けモードが使用され得る最小ブロックサイズおよびパーティションモードが定義され得る。１つの特定の非限定的な例では、８×８以上の、２Ｎ×２Ｎに等しいパーティションモードを有するＣＵサイズのためだけに重み付けモードが使用され得る。そのようなブロックについては、プロセス６００は、上記で説明したように６０８に進む。２Ｎ×２Ｎ以外のパーティションモードを有する８×８ＣＵについては、重み付けモードが禁止、制限、または、抑制され得（たとえば、エンコーダ２０によってそのＣＵについて重み付けモードフラグがシグナリングされないか、またはデコーダ３０によって重み付けモードフラグが無視され）、プロセス６００は６１０に進む。

[00125]また別の実施形態として、いくつかの個別の予測モードとのみ重み付けモードが使用され得る。たとえば、イントラ残差予測モード、インタースキップモードなどを使用するとき、重み付けモードが抑制され得る（重み付けモードフラグがシグナリングされないか、または、シグナリングされた重み付けモードフラグが無視される）。別の例として、いくつかのイントラ方向を使用して行われるイントラ予測とのみ重み付けモードが使用され得る。さらなる例として、重み付けモードが使用されるとき、いくつかのタイプの動き補償が抑制、制限、または限定され得、またはいくつかのタイプの動き補償が使用されるとき、重み付けモードが抑制され得る。

[00126]図７に、いくつかのタイプの動き補償予測モードをもつ重み付けモードの使用を限定、制限、または抑制するための例示的なプロセス７００を示す。有利には、これにより、そのようなモードが使用されるとき重み付けモード固有の情報をシグナリングするのに必要な帯域幅を低減することができる。また、これにより、重み付けモードを使用してビデオユニット値を判断する複雑さを低減することができる。プロセス７００は、エンコーダ２０の重み付け予測ユニット４７、デコーダ３０の重み付け予測ユニット７５、または上記で説明したエンコーダ２０および／もしくはデコーダ３０の何らかの他の構成要素など、任意の数の構成要素またはデバイスによって実装され得る。

[00127]プロセス７００は、ブロック７０２において開始する。ブロック７０４において、プロセス７００を実行する構成要素またはデバイスは、現在のブロックのために動き補償が使用されるべきであると判断し得る。決定ブロック７０６において、プロセス７００に実行する構成要素またはデバイスは、動き補償が双方向であるかどうか、またはさもなければ、双予測が使用されるべきであるかを判断し得る。たとえば、マージモードでは、インター予測のために使用される動きベクトル候補が双方向であり得る。そうである場合、プロセス７００は７０８に進む。そうでない場合、プロセス７００は７１０に進む。

[00128]７０８において、（たとえば、エンコーダ２０において）帯域幅を節約するために、または（たとえば、デコーダ３０において）コーディング複雑さを低減するために、現在のビデオユニットまたはブロックの動き補償が単方向予測に変換され得る。１つの特定の非限定的な実施形態では、重み付けモードのために両方ではなく単Ｌ０方向または単Ｌ１方向のいずれかを使用するインター予測がイントラＢＬ予測と組み合わせて使用される。双方向動きベクトルは、動き補償の前またはその間に、単Ｌ０または単Ｌ１動きベクトルのいずれかに変換される（たとえば、Ｌ０またはＬ１リストのいずれかから単一の動きベクトルが使用される）。代替的に、双方向動きベクトル候補が、マージリスト構成中に単方向（単Ｌ０または単Ｌ１のいずれか）動きベクトルに変換され得る。

[00129]いくつかの実施形態では、ルーマ成分についてのみ双予測が抑制されるかまたは単方向予測に変換され得、一方、クロマ成分は双予測であり得る。いくつかの実施形態では（たとえば、ＡＭＶＰモードに基づく重み付けモードについて）、双方向動きベクトルがエンコーダにおいて抑制され、単方向動きベクトルのみがビットストリーム中でコーディングされる。追加の実施形態では、ビットストリームが、単Ｌ０または単Ｌ１方向のみを含んでいるように、インター方向シグナリングが制限され得る。したがって、双方向に関連するいかなる冗長ビットもビットストリーム中に含まれ得ない。さらなる実施形態では、整数ペル動きベクトルのみが使用される。したがって、双方向予測の場合であっても補間を行う必要がないので、帯域幅が低減され得る。

[00130]いくつかの実施形態では、シグナリングするシンタックス要素の変化を回避するために規範的なビットストリーム制約を適用することによって重み付けモードでは双予測が制限される。コーディングは、重み付けモードが使用される場合、双予測（たとえば、双予測に関連するすべてのシンタックス）をビットストリーム中でシグナリングすることができないという制限とともに実行され得る。たとえば、重み付けモードが使用可能である場合（たとえば、ｗｅｉｇｈｔｅｄ＿ｍｏｄｅ＿ｆｌａｇが１に等しくなるとき）、双方向動きベクトル、双方向インター方向および（リストＬ０およびリストＬ０のための）２つの参照インデックスはビットストリーム中に存在することができない。むしろ、単方向動き情報（単方向動きベクトル、単方向インター方向、およびただ１つの参照インデックス）のみがビットストリーム中に存在することができる。この制限は、ｍｅｒｇｅ＿ｉｎｄｅｘ、ＭＶＰｉｄｘ、ＭＶＤなどの関連するシンタックスも制約に準拠し、双予測につながらないことを暗示する。

[00131]図６〜図７に関して上記で説明したブロックサイズおよび動き予測制限ならびに抑制技法は組み合わされ得る。重み付けモードは、特定のブロックサイズおよびパーティションモードのためにのみ双方向予測を利用し得る。１つの特定の非限定的な例として、たとえば、１６×１６から始まるＣＵサイズおよびパーティションモード２Ｎ×２Ｎのために、重み付けモードを用いる双方向予測が使用され得る。１６×１６のＣＵおよび２Ｎ×２Ｎ以外のパーティションモードについては、上記で説明したように、重み付けモードのために単方向予測のみが使用され得る。さらに、同じく上記で説明したように、マージモード動きベクトル候補は単方向候補に変換され得、それらのブロックについてＡＭＶＰモードのためのインター方向シグナリングが単方向に制限され得る。いくつかの実施形態では、（たとえば、２Ｎ×２Ｎでないパーティションモードで１６×１６のサイズを有する）いくつかのＣＵについて、所与のＣＵ中のいくつかの予測ユニットのためにのみ（たとえば、第１の予測ユニットのためにのみ）双方向予測がブロックまたは抑制され得、他のもののために（たとえば、第２のＰＵのために）双予測が使用され得る。上記の例について８×８および１６×１６のＣＵブロックサイズに関して説明したが、本技法は任意の他のサイズを有するブロックに容易に適用され得る。

[00132]いくつかの実施形態では、重み付けモードは、ブロックサイズまたはインター方向に従って重み付けモード予測の挙動を変更することによってシンタックス変更なしに抑制または制限され得る。たとえば、双方向動きベクトルがデコーダにシグナリングされ得、複雑さを低減するために双予測が重み付けモードについて制限される場合、重み付けモードがシグナリングされる（たとえば、「ｗｅｉｇｈｔｅｄ＿ｍｏｄｅ＿ｆｌａｇ」が１に等しくなる）場合でも、重み付けモードの代わりに通常のインター予測が実行される。単方向動きベクトルが存在し、重み付けモードがシグナリングされる場合、重み付けモード予測が実行される。

[00133]ＨＥＶＣ単一レイヤコーディングの現在の「ワーストケース」内の「ワーストケース」複雑さを保つために、重み付けモードの条件付きシグナリングが使用され得る。たとえば、重み付けモードは、８×４および４×８のＰＵについて抑制または制限され得る。しかしながら、重み付けモードは、依然として、すべてのＣＵサイズについてシグナリングされ得る。重み付けモードがシグナリングされる（たとえば、「ｗｅｉｇｈｔｅｄ＿ｍｏｄｅ＿ｆｌａｇ」が１に等しくなる）とき、ＰＵサイズの検査が予測段階に実行され得る。ＰＵサイズが４×８または８×４である場合、重み付けモードがシグナリングされたとしても、重み付けモード予測の代わりに、通常のインター予測が実行される（たとえば、単方向予測または双方向予測）。単方向動きベクトルがシグナリングされ、ＰＵブロックサイズが８×４または４×８でない場合のみ、重み付け予測が実行されることになる。動きベクトルシグナリングは、マージモードまたはＡＭＶＰモードのいずれかを通して行われ得る。いくつかの実施形態では、重み付けモードは、８×４または４×８以外のブロックサイズについて同様に制限され得る。さらに、重み付けモードの制限は、パーティションモードに基づき得、または動き情報のために重み付けモードとマージモードシグナリングが使用されるのかＡＭＶＰモードシグナリングが使用されるのかに基づき得る。

[00134]帯域幅および／またはコーディング複雑さを低減するために、上記の技法のいずれも単独でまたは組み合わせて採用され得る。

[00135]次に図８〜図１５を参照すると、一般化残差予測（ＧＲＰ）モードについてより詳細に説明する。上記で説明したように、重み付けモードは、ＧＲＰを含む任意のタイプの予測を使用し得る。以下で説明するＧＲＰ技法は、ＳＶＣにおけるレイヤ間残差予測および差分領域動き補償（difference domain motion compensation）に関係する問題に対処し得る。ＧＲＰでは、以下で説明するように、一般化残差予測の様々な構成要素のために重みが使用される。インター予測ブロックでは、すべてのＧＲＰ重みのために重み付けモードが使用され得る。いくつかの実施形態では、重み付けモードは、いくつかのＧＲＰ重みにのみ適用され得る。たとえば、重み付けモードは、単に、ＧＲＰ重みが２に等しいときのみ使用され得る。この場合、重み付けモードフラグまたは他の重み付けモード情報は、モード依存性を活用するためにＧＲＰ重みの後にシグナリングされるべきである。この例では、たとえば、ＧＲＰ重み≠２であるとき、いくつかのＧＲＰ重みについて重み付けモードフラグシグナリングがスキップまたは抑制され得、それによって帯域幅および／またはストレージ要件を低減し得る。別の実施形態では、たとえば、ＧＲＰ重み＝１または２であるとき、重み付けモードがいくつかのＧＲＰ重みとともに使用され、したがって、たとえば、ＧＲＰ重み＝０であるとき、組合せモードでは使用されるＧＲＰ重みについての重み付けモードフラグまたは情報をシグナリングすることは不要になる。ＧＲＰ重みと重み付けモード抑制の他の組合せが使用され得る。

[00136]Ｈ．２６４のＳＶＣ拡張は、デコーダの低複雑さを維持するために動き補償のシングルループ復号を必要とする。概して、次のように現在ブロックの時間的予測と残差とを加算することによって、動き補償が実行される。

上式で、

は現在フレームを示し、ｒは残差を示し、Ｐは時間的予測を示す。シングルループ復号では、ＳＶＣにおける各サポートされるレイヤは、単一の動き補償ループを用いて復号され得る。これを達成するために、上位レイヤをレイヤ間イントラ予測するために使用されるすべてのレイヤが、制約付きイントラ予測を使用してコーディングされる。制約付きイントラ予測では、イントラモードブロックが、隣接インターコード化ブロックからのサンプルを参照することなしにイントラコーディングされる。一方、ＨＥＶＣは、複数の動き補償ループを使用してＳＶＣレイヤが復号され得る、ＳＶＣのためのマルチループ復号を可能にする。たとえば、最初にベースレイヤが完全に復号され、次いでエンハンスメントレイヤが復号される。

[00137]上記で説明した、式（１）において公式化される残差予測は、Ｈ．２６４ＳＶＣ拡張における効率的な技法であり得る。しかしながら、特に、マルチループ復号がＨＥＶＣＳＶＣ拡張において使用されるとき、それの性能はＨＥＶＣＳＶＣ拡張においてさらに改善され得る。

[00138]マルチループ復号の場合、残差予測の代わりに差分領域動き補償が使用され得る。ＳＶＣでは、エンハンスメントレイヤが、ピクセル領域コーディングまたは差分領域コーディングを使用してコーディングされ得る。ピクセル領域コーディングでは、非ＳＶＣＨＥＶＣレイヤに関して、エンハンスメントレイヤピクセルのための入力ピクセルがコーディングされ得る。一方、差分領域コーディングでは、エンハンスメントレイヤの差分値がコーディングされ得る。差分値は、エンハンスメントレイヤのための入力ピクセルと、対応するスケーリングされたベースレイヤ再構成ピクセルとの間の差分であり得る。そのような差分値は、差分領域動き補償のための動き補償において使用され得る。

[00139]差分領域を使用したインターコーディングの場合、現在予測ブロックは、エンハンスメントレイヤ参照ピクチャ中の対応する予測ブロックサンプルと、スケーリングされたベースレイヤ参照ピクチャ中の対応する予測ブロックサンプルとの間の差分値に基づいて判断される。差分値は差分予測ブロック（difference predicted block）と呼ばれることがある。エンハンスメントレイヤ再構成サンプルを取得するために、コロケートベースレイヤ再構成サンプルが差分予測ブロックに追加される。

[00140]ただし、ピクセル領域と差分領域の両方のために動き推定および動き補償がしばしば使用されるので、レイヤ間予測において差分領域動き補償を使用することによって動き推定および動き補償の２つのセットがもたらされる。動き推定および動き補償の２つのセットをもたらすとバッファおよび計算コストがより高くなり得、これは、エンコーダまたはデコーダにとって実際的ではないことがある。さらに、動きベクトルの２つのセットが、異なるプロパティを有し、コーディングユニット（ＣＵ）レベルでインターリーブするとき、動きフィールドは不規則になり得るので、動きベクトルの２つのセットをコーディングするとコーディング効率が低下し得る。さらに、差分領域における動き推定では、ベースレイヤおよびエンハンスメントレイヤが同じ動きを共有することが必要となる。さらに、２つのレイヤ間の差分ピクチャの導出が各レイヤの完全に再構成されたピクチャに基づくので、差分領域動き補償はシングルループ復号と協働しない。したがって、差分領域動き補償を使用するときに動き推定および動き補償の２つのセットを有するという冗長性を回避することが有利であろう。また、シングルループ復号に差分領域動き補償を拡張することが有利であろう。

[00141]上記で説明したように、レイヤ間残差予測は、現在のビデオユニット、たとえば、ブロックまたはフレームを予測する際に基準レイヤの残差を使用する。一般化残差予測では、現在のビデオユニットのレイヤ間残差予測は、現在のレイヤの残差、現在のレイヤの時間的予測、および基準レイヤの残差に基づき得る。基準レイヤの残差は、重み係数によって調整され得る。重み係数は、様々なタイプの情報に基づき、それを含み得る。そのような情報の例としては、重み候補の数、重みステップ、重みインデックス、および重みテーブルがあり得る。

[00142]本開示の態様によるＧＲＰフレームワークは、重み係数を組み込むことによって様々なタイプの残差予測に適応し得る。重み係数を適宜に調整することによって、残差予測の有効なコーディング利得がもたらされ得る。さらに、ＧＲＰフレームワークでは、従来の残差予測では必ずしもベースレイヤであるとは限らない基準レイヤを使用して残差予測が実行され得る。たとえば、現在のエンハンスメントレイヤから基準レイヤが導出され得る。重み係数が１に設定されるとき、ＧＲＰはまた、従来の残差予測に適応し得る。ＧＲＰフレームワークがシングルループ復号とマルチループ復号の両方とともに使用され得る。さらに、ＧＲＰフレームワークでは、差分領域における動き推定は必要ないことがあり、したがって、現在のレイヤおよびエンハンスメントレイヤは、動き推定のために同じ動きを共有する必要はない。ＧＲＰフレームワークは、多くの異なるタイプの残差予測に適用され得、式（１）において定義されている従来の残差予測および差分領域動き補償は、ＧＲＰフレームワークを使用する２つの具体的なシナリオである。本技法は、ＨＥＶＣのスケーラブル拡張における動き補償のパフォーマンスを改善し得、ＨＥＶＣの３Ｄビデオコーディング拡張にも適用され得る。

[00143]いくつかの態様によれば、現在の（たとえば、エンハンスメント）レイヤの予測と基準（たとえば、ベース）レイヤの予測との間の差分値が差分予測子として採用され得る。いくつかの実施形態では、差分値は、差分ピクセルと呼ばれることがある。エンハンスメントレイヤおよびベースレイヤは異なる品質ターゲットを有し得るので、現在のレイヤおよびベースレイヤの時間的予測の動きは異なり得る。いくつかの状況では、差分値を使用した再構成が、より効率的になり得、かつ／またはより良い結果をもたらし得る。たとえば、シーン変化または切断があり、したがって、連続フレームが互いにまったく異なり得るとき、差分予測子を使用した再構成が選好され得る。重み係数が差分値に適用され得る。そのような技法は、重み付け差分予測（ＷＤＰ：weighted difference prediction）と呼ばれることがある。いくつかの実施形態では、ＷＤＰは、ＧＲＰフレームワークの拡張として実装され得る。

[00144]図８Ａおよび図８Ｂは、それぞれ、残差ピクセル（たとえば、

）および差分ピクセル（たとえば、Ｐ_c−Ｐ_r）を使用した一般化残差予測のための例示的な方法を示すフローチャートである。本開示で説明する技法は、一般化残差予測（ＧＲＰ）フレームワークを与え得る。上記で説明したように、レイヤ間残差予測は、現在のビデオユニット、たとえば、ブロックまたはフレームを予測する際に基準レイヤの残差を使用する。一般化残差予測では、現在のビデオユニットのレイヤ間残差予測は、現在のレイヤの残差、現在のレイヤの時間的予測、および基準レイヤの残差に基づき得る。基準レイヤの残差は、重み係数によって調整され得る。ＧＲＰ方式は、次のように定義され得る。

上式で、

は現在フレームの再構成を示し、ｒ_cは現在レイヤからの残差予測を示し、Ｐ_cは同じレイヤからの時間的予測を示し、ｒ_rは基準レイヤからの残差予測を示し、ｗは重み係数を示す。

[00145]重み係数は、様々なタイプの情報に基づき、それを含み得る。そのような情報の例としては、重み候補の数、重みステップ、重みインデックス、および重みテーブルがあり得る。重み候補の数は、基準レイヤの残差に適用されるのに利用可能な異なる重み係数の数を示し得る。重みステップは、利用可能な重み係数間の増分またはユニットのサイズを示し得る。重みインデックスは、利用可能な重み係数の間の特定の重み係数を示し得る。重みテーブルは、重み係数に関する情報を含むことができ、ルックアップテーブルと同様に重みインデックスによってアクセスされ得る。特定の例では、０．０、０．５、および１．０の３つの重み係数候補が利用可能であり得る。この例では、３つの重み係数候補が利用可能であるので、重み候補の数は３である。３つの重み候補間の重みステップは０．５である。各重み候補は、重みインデックスによって識別され得る。重み係数０はインデックス０によって識別され、重み係数０．５はインデックス１によって識別され、重み係数１．０はインデックス２によって識別される。小数部をシグナリングすることはコストがかかり得るので、重みステップおよびインデックスが重み係数を導出するために使用され得る。

[00146]本開示の態様によるＧＲＰフレームワークは、重み係数を組み込むことによって様々なタイプの残差予測に適応し得る。重み係数を適宜に調整することによって、残差予測の有効なコーディング利得がもたらされ得る。ＧＲＰは、残差予測において基準レイヤについての重み情報を組み込むことによってメモリの量と計算コストとを低減しながら、コーディング性能を改善し得る。たとえば、重み付け残差予測がより正確であるので、ＧＲＰは、コーディング性能を改善することができる。また、たとえば、差分領域動き補償の場合のように動き補償ループの２つのセットが典型的には使用されないので、メモリの量および計算コストが低減され得る。さらに、ＧＲＰフレームワークでは、従来の残差予測では必ずしもベースレイヤであるとは限らない基準レイヤを使用して残差予測が実行され得る。たとえば、現在のレイヤのエンハンスメントレイヤから基準レイヤが導出され得る。重み係数が１に設定されるとき、ＧＲＰはまた、従来の残差予測に適応し得る。ＧＲＰフレームワークがシングルループ復号とマルチループ復号の両方とともに使用され得る。

[00147]差分領域動き補償に関して、ＧＲＰフレームワークはシングルループ復号において適用され得る。上記で説明したように、Ｈ．２６４では、レイヤ間の差分ピクチャが各レイヤの完全に再構成されたピクチャに基づいて計算されなければならないので、差分領域動き補償はシングルループ復号シナリオでは採用され得ない。差分領域動き補償において差分ピクチャを取得するために、各レイヤの完全な再構成がしばしば使用され、レイヤごとに、完全な再構成のために１つの動き補償ループが使用され得る。たとえば、２つのレイヤの完全な再構成を得るために２つの動き補償ループがしばしば使用される。したがって、シングルループ復号において差分領域動き補償は採用され得ない。対照的に、ＧＲＰは、シングルループ復号とマルチループ復号の両方をサポートし得る。さらに、ＧＲＰフレームワークでは、差分領域における動き推定は必要がないことがある。したがって、現在のレイヤおよびエンハンスメントレイヤは、動き推定のために同じ動きを共有する必要はない。ＧＲＰフレームワークは、多くの異なるタイプの残差予測に適用可能であり、式（１）において定義されている従来の残差予測および差分領域動き補償は、ＧＲＰフレームワークを使用する２つの具体的なシナリオである。

[00148]次に、本開示の態様による一般化残差予測のための例示的な方法について図８Ａを参照しながら説明する。プロセス８００Ａは、エンコーダ（たとえば、図２に示したエンコーダ）、デコーダ（たとえば、図３に示したデコーダ）、または任意の他の構成要素によって実行され得る。プロセス８００Ａのステップについて図３のデコーダ３０に関して説明するが、プロセス８００Ａは、上述のように、エンコーダなどの他の構成要素によって実行され得る。

[00149]ブロック８０１Ａにおいて、デコーダ３０は、基準レイヤからの残差予測に重み係数を適用する。上記で説明したように、一般化残差予測（ＧＲＰ）は、基準レイヤからの残差に重み係数を適用し得る。重み係数は、シングルループ復号などの特定のシナリオに最適になるように判断され得る。重み係数は、重み候補の数、重みステップ、重みインデックス、および重みテーブルなどの情報を含み得る。

[00150]ブロック８０２Ａにおいて、デコーダ３０は、エンハンスメントレイヤから残差予測を取得する。ブロック８０３Ａにおいて、デコーダ３０は、エンハンスメントレイヤから時間的予測を取得する。

[00151]ブロック８０４Ａにおいて、デコーダ３０は、重み係数によって調整された基準レイヤからの残差予測、エンハンスメントレイヤからの残差予測、およびエンハンスメントレイヤからの時間的予測に基づいて現在のビデオユニットを判断する。上記で説明したように、ＧＲＰでは、現在のビデオユニットは、式（５）に従って予測され得る。

[00152]次に、本開示の態様による一般化残差予測のための例示的な方法について図８Ｂを参照しながら説明する。プロセス８００Ｂは、エンコーダ（たとえば、図２に示したエンコーダ）、デコーダ（たとえば、図３に示したデコーダ）、または任意の他の構成要素によって実行され得る。プロセス８００Ｂのステップについて図３のデコーダ３０に関して説明するが、プロセス８００Ｂは、上述のように、エンコーダなどの他の構成要素によって実行され得る。

[00153]ブロック８０１Ｂにおいて、デコーダ３０は、差分予測に重み係数を適用する。一般化残差予測（ＧＲＰ）は、現在のまたはエンハンスメントレイヤの予測（Ｐ_e）と基準またはベースレイヤの予測（Ｐ_b）との間の差分に重み係数を適用し得る。重み係数は、マルチループ復号などの特定のシナリオに最適になるように判断され得る。重み係数は、重み候補の数、重みステップ、重みインデックス、および重みテーブルなどの情報を含み得る。

[00154]ブロック８０２Ｂにおいて、デコーダ３０は、エンハンスメントレイヤから残差予測を取得する。ブロック８０３Ｂにおいて、デコーダ３０は、基準レイヤにおける現在のピクチャの再構成を取得する。

[00155]ブロック８０４Ｂにおいて、デコーダ３０は、重み係数によって調整された差分予測、エンハンスメントレイヤからの残差予測、および基準レイヤ再構成に基づいて現在のビデオユニットを判断する。現在のビデオユニットは、以下で説明する式（７Ｂ）に従って予測され得る。

[00156]図８Ａおよび図８Ｂに関して説明した本開示の態様による一般化残差予測のための例示的な方法は、シーケンス、ピクチャ、フレームのグループ、フレーム、スライスのグループ、スライス、コーディングユニット（ＣＵ）のグループ、コーディングユニット（ＣＵ）、予測ユニット（ＰＵ）のグループ、予測ユニット（ＰＵ）、ブロック、またはピクセルの領域など、様々なコーディングレベルで実装され得る。さらに、図８Ａおよび図８Ｂに関して説明したすべての実施形態は、別個に、または互いに組み合わせて実装され得る。

[00157]図９は、本開示の態様による、シングルループ復号を使用した一般化残差予測のための例示的な方法を示すフローチャートである。上記で説明したように、シングルループ復号では、エンハンスメントレイヤの動き補償のために１つのループが使用される。シングルループ復号のシナリオでは、ベースレイヤの完全な再構成は利用不可能である。したがって、ベースレイヤの正規化残差がベース残差予測子として直接採用され得る。エンハンスメントレイヤの場合、再構成

は、次のように判断され得る。

上式で、ｒ_eおよびＰ_eは、エンハンスメントレイヤの逆量子化された残差および時間的予測を示し、ｒ_bは、（空間的にスケーラブルな場合はアップサンプリングされた）正規化ベースレイヤ残差予測子を示し、ｒ_b’は、ベースレイヤ残差を示し、Ｑ_eおよびＱ_bは、それぞれ、エンハンスメントレイヤおよびベースレイヤの量子化ステップを示す。

[00158]次に、本開示の態様によるシングルループ復号を使用した一般化残差予測のための例示的な方法について図９を参照しながら説明する。プロセス９００は、エンコーダ（たとえば、図２に示したエンコーダ）、デコーダ（たとえば、図３に示したデコーダ）、または任意の他の構成要素によって実行され得る。プロセス９００のステップについて図３のデコーダ３０に関して説明するが、プロセス９００は、上述のように、エンコーダなどの他の構成要素によって実行され得る。ブロック９０１において、デコーダ３０は、ＧＲＰフレームワークのためのシングルループ復号において基準レイヤから残差予測の重み係数を判断する。ブロック９０２において、デコーダ３０は、重み係数によって調整されたＲＬからの残差予測、ＥＬからの残差予測、およびＥＬからの時間的予測に基づいて現在のビデオユニットを判断する。たとえば、式（６）に関して上記で説明したように、ＲＬ残差予測のために正規化ベースレイヤ残差が使用され得る。図９に関して説明した本開示の態様によるシングルループ復号を使用した一般化残差予測のための例示的な方法は、シーケンス、ピクチャ、フレームのグループ、フレーム、スライスのグループ、スライス、コーディングユニット（ＣＵ）のグループ、コーディングユニット（ＣＵ）、予測ユニット（ＰＵ）のグループ、予測ユニット（ＰＵ）、ブロック、またはピクセルの領域など、様々なコーディングレベルで実装され得る。さらに、図９に関して説明したすべての実施形態は、別個に、または互いに組み合わせて実装され得る。

[00159]図１０Ａおよび図１０Ｂは、本開示の態様による、マルチループ復号を使用した一般化残差予測のための例示的な方法を示すフローチャートである。上記で説明したように、マルチループ復号では、エンハンスメントレイヤの動き補償のために複数のループが使用される。マルチループ復号のシナリオでは、エンハンスメントレイヤを符号化／復号するとき、ベースレイヤの完全な再構成が利用可能である。したがって、以前にコーディングされたエンハンスメントレイヤの再構成と（必要な場合、アップサンプリングされた）ベースレイヤとの間の差分値が残差予測子として採用され得る。エンハンスメントレイヤの場合、再構成

は、次のように判断され得る。

上式で、ｒ_eｒ_eは、エンハンスメントレイヤ中の現在のビデオユニットの逆量子化された残差を示し、Ｐ_eおよびＰ_bは、それぞれ、エンハンスメントレイヤおよびベースレイヤ中の現在のビデオユニットの時間的予測を示し、

は、ベースレイヤ中の現在のビデオユニットの完全な再構成を示す。エンハンスメントレイヤおよびベースレイヤは異なる品質ターゲットを有し得るので、時間的予測Ｐ_eおよびＰ_bの動きは異なり得る。

[00160]ベースレイヤおよびエンハンスメントレイヤが同じ動きを有する場合、時間的予測Ｐ_eおよびＰ_bの動きは同じであり、式（７Ａ）が直接採用され得る。エンハンスメントレイヤのインタービデオユニットを復号するときに、それのエンハンスメントレイヤおよびベースレイヤの時間的予測Ｐ_eおよびＰ_bが両方とも利用可能である。ベースレイヤの再構成

も利用可能である。したがって、再構成

は、逆量子化された残差ｒ_eおよびｗから取得され得、それらは、図１１および図１２に関してより詳細に説明するようにシグナリングされるか、または導出され得る。

[00161]ベースレイヤおよびエンハンスメントレイヤが異なる動きを有する場合、エンハンスメントレイヤおよびベースレイヤの時間的予測Ｐ_eおよびＰ_bの動きは異なり、ベースレイヤの残差およびエンハンスメントレイヤの残差は相関し得ない。そのような場合、残差予測が良好な結果をもたらさないことがある。残差予測のパフォーマンスを改善するために、エンハンスメントレイヤおよびベースレイヤの時間的予測が同じ動きを共有すると仮定され得る。ＥＬおよびＢＬの時間的予測が同じ動きを共有すると仮定することに加えて、またはその代わりに、残差予測子を生成するために、ベースレイヤの動きまたはエンハンスメントレイヤの動きのいずれかが別のレイヤに適用されるように強制され得る。たとえば、Ｐ_bを得るために、エンハンスメントレイヤの時間的予測Ｐ_eの動きがベースレイヤに適用され得る。そのような場合、Ｐ_eとＰ_bの両方がＰ_eの動きを用いて生成され得るので、エンハンスメントレイヤを復号するためにしばしば２つの動き補償が使用される。

[00162]別の実施形態では、現在の（たとえば、エンハンスメント）レイヤの予測と基準（たとえば、ベース）レイヤの予測との間の差分値が差分予測子として採用され得る。エンハンスメントレイヤの場合、再構成

は、次のように判断され得る。

上式で、ｒ_eは、エンハンスメントレイヤ中の現在のビデオユニットの逆量子化された残差を示し、Ｐ_eおよびＰ_bは、それぞれ、エンハンスメントレイヤおよびベースレイヤ中の現在のビデオユニットの時間的予測を示し、

は、ベースレイヤ中の現在のビデオユニットの完全な再構成を示す。エンハンスメントレイヤおよびベースレイヤは異なる品質ターゲットを有し得るので、時間的予測Ｐ_eおよびＰ_bの動きは異なり得る。多くの状況では、式（７Ａ）による再構成が式（７Ｂ）による再構成よりも効率的になる。しかしながら、いくつかの状況では、式（７Ｂ）による再構成が、より効率的なものになり、かつ／またはより良い結果をもたらすことになる。たとえば、シーン変化または切断があり、したがって、連続フレームが互いにまったく異なるとき、式（７Ｂ）による再構成が選好される。

[00163]一実施形態では、異なる重みインデックスが通常のＧＲＰ重み係数とＷＤＰ重み係数とに割り当てられる。たとえば、一実施形態では、４つの重みインデックスがＣＵレベルで許可される。重みインデックス０、１、および２は、式（７Ａ）が予測計算のために使用されることを示し、ここで、それぞれ、ｗ＝０、０．５、および１である。重みインデックス３は、式（７Ｂ）が予測計算のために使用されることを示し、ｗ＝０．５である。別の実施形態では、ＧＲＰ重み係数（たとえば、式（７Ａ））がすべて無効化され、ＷＤＰ重み係数（たとえば、式（７Ｂ））のみが許可される。限定はしないが、パラメータシグナリング／導出方法、重み係数判断方法、関連ピクチャ／動きアップサンプリング、ダウンサンプリング方法などを含む、ＧＲＰに関して本明細書で説明するすべての方法がＷＤＰにも適用され得る。

[00164]次に、本開示の態様によるマルチループ復号を使用した一般化残差予測のための例示的な方法について図１０Ａおよび図１０Ｂを参照しながら説明する。プロセス１０００Ａおよびプロセス１０００Ｂは、エンコーダ（たとえば、図２に示したエンコーダ）、デコーダ（たとえば、図３に示したデコーダ）、または任意の他の構成要素によって実行され得る。プロセス１０００Ａおよびプロセス１０００Ｂのステップについて図３のデコーダ３０に関して説明するが、プロセス１０００Ａおよびプロセス１０００Ｂは、上述のように、エンコーダなどの他の構成要素によって実行され得る。

[00165]図１０Ａを参照すると、ブロック１００１Ａにおいて、デコーダ３０は、ＧＲＰフレームワークのためのマルチループ復号において基準レイヤから残差予測の重み係数を判断する。ブロック１００２Ａにおいて、デコーダ３０は、重み係数によって調整されたＲＬからの残差予測、ＥＬからの残差予測、およびＥＬからの時間的予測に基づいて現在のビデオユニットを判断する。たとえば、式（７）に関して上記で説明したように、ＲＬ残差予測のために

が使用され得る。

[00166]図１０Ｂを参照すると、ブロック１００１Ｂにおいて、デコーダ３０は、ＧＲＰフレームワークのためのマルチループ復号において差分予測の重み係数を判断する。ブロック１００２Ｂにおいて、デコーダ３０は、重み係数によって調整された差分予測、ＥＬからの残差予測、およびＲＬ再構成（たとえば、基準レイヤ中の現在のピクチャの完全な再構成）に基づいて現在のビデオユニットを判断する。たとえば、式（７Ｂ）に関して上記で説明したように、差分予測のためにＰ_e−Ｐ_b（またはＰ_c−Ｐ_r）が使用され得る。

[00167]図１０Ａおよび図１０Ｂに関して説明した本開示の態様によるマルチループ復号を使用した一般化残差予測のための例示的な方法は、シーケンス、ピクチャ、フレームのグループ、フレーム、スライスのグループ、スライス、コーディングユニット（ＣＵ）のグループ、コーディングユニット（ＣＵ）、予測ユニット（ＰＵ）のグループ、予測ユニット（ＰＵ）、ブロック、またはピクセルの領域など、様々なコーディングレベルで実装され得る。さらに、図１０Ａおよび図１０Ｂに関して説明したすべての実施形態は、別個に、または互いに組み合わせて実装され得る。

[00168]いくつかの状況では、残差ピクセル（たとえば、

）および差分ピクセル（たとえば、Ｐ_e−Ｐ_b）は、割り当てられたビット深度または所望のビット深度を越えて拡大し得る。たとえば、いくつかの状況では、これらのピクセルは、８ビットまたは１６ビットで表すことができないことがある。これにより、ハードウェア実装形態の複雑化がもたらされ得る。したがって、いくつかの実施形態では、限定はしないが、８ビットまたは１６ビットの表現など、各々が所望の範囲内に必ず入るようにするために残差ピクセルまたは差分ピクセルを切り捨てるためにクリッピングが実行される。

[00169]図１１は、本開示の態様による、一般化残差予測パラメータをシグナリングするための例示的な方法を示すフローチャートである。上記で説明したように、重み情報は、重み候補の数と、重みステップ（または重みテーブル）と、重みインデックスとを含み得る。重み係数ｗは、そのような重み情報に基づいて判断され得る。重み候補の数は、Ｎ_wによって示され得る。重みステップは、Ｓ_wによって示され、重みテーブルは、Ｗ_Tによって示され得る。重みインデックスは、ｉ_wによって示され得る。一実施形態では、重み係数ｗは、次のように重みステップＳ_wおよび重みインデックスｉ_wに基づいて導出される。

別の実施形態では、ｗは、インデックスｉ_wに従ってルックアップテーブルＷ_Tから取得され得る。

[00170]限定はしないが、Ｎ_wと、Ｓ_wと、Ｗ_Tと、ｉ_wとを含み得る重み係数情報は、様々な方法でシグナリングされ得る。いくつかの実施形態では、重みステップＳ_wまたは重みテーブルＷ_Tはハードコーディングされるか、またはシグナリングされ得る。Ｓ_wまたはＷ_Tは、シーケンスレベルまたはピクチャレベルでシグナリングされ得る。重みインデックスｉ_wは、ＣＵおよびＰＵなどのより低いレベルでシグナリングされ得る。

[00171]一実施形態では、重みステップＳ_wは、３ビット量子化で表され（Ｓ_wは、１／８、２／８、．．．、８／８であり得る）、シーケンスパラメータセット（ＳＰＳ）において符号なし整数指数ゴロムコーディングされる。Ｎ_w≧１であることを考慮すると、（Ｎ_w−１）はまた、ＳＰＳにおいて符号なし整数指数ゴロムコーディングされる。重みインデックスｉ_wは、最初に、（Ｎ_wを最大数として）短縮単項コードで２値化され、次いで、ＣＡＢＡＣコーディングされる。ＣＡＢＡＣコーディングでは、第１のビンが１つのコンテキストでコーディングされ、ビンの残りが別のコンテキストでコーディングされる。重みインデックスｉ_wをコーディングするために、コンテキストは、以前にコーディングされたパラメータに依存し得る。たとえば、左上のＣＵなど、空間的に隣接するＣＵのｉ_wは、現在のＣＵの重みインデックスｉ_wのコンテキストとして使用され得る。また、現在のＣＵがスキップコーディングされるのかまたはマージコーディングされるのかなどの現在のＣＵのタイプ、または現在のＣＵのサイズがコンテキストとして使用され得る。

[00172]他の実施形態では、異なるＣＵモードは、重み係数シグナリング方法が異なり得る。たとえば、スキップモードおよびマージモードについて、３つの重み係数（ｗ＝０、ｗ＝０．５、およびｗ＝１など）が選択され、シグナリングされ得る。スキップモードおよびマージモード以外のインターモードについては、２つの重み係数のみ（ｗ＝０およびｗ＝１など）が選択され、シグナリングされ得る。代替的に、インターモード、他のスキップモードおよびマージモードについて、ただ１つの固定重み係数が適用され得る。そのような場合、重み係数のための追加のシグナリングは使用され得ない。

[00173]次に、本開示の態様による一般化残差予測パラメータをシグナリングするための例示的な方法について図１１を参照しながら説明する。プロセス１１００は、エンコーダ（たとえば、図２に示したエンコーダ）、デコーダ（たとえば、図３に示したデコーダ）、または任意の他の構成要素によって実行され得る。プロセス１１００のステップについて図２のエンコーダ２０に関して説明するが、プロセス１１００は、上述のように、デコーダなどの他の構成要素によって実行され得る。ブロック１１０１において、エンコーダ２０は、重みステップまたは重みテーブルをシグナリングする。ブロック１１０２において、エンコーダ２０は、重み候補の数をシグナリングする。ブロック１１０３において、エンコーダ２０は、重みインデックスをシグナリングする。プロセス１１００のステップは、異なる順序で実行され得る。たとえば、重み候補の数は、重みステップ（または重みテーブル）の前にシグナリングされ得る。図１１に関して説明した本開示の態様による一般化残差予測パラメータをシグナリングするための例示的な方法は、シーケンス、ピクチャ、フレームのグループ、フレーム、スライスのグループ、スライス、コーディングユニット（ＣＵ）のグループ、コーディングユニット（ＣＵ）、予測ユニット（ＰＵ）のグループ、予測ユニット（ＰＵ）、ブロック、またはピクセルの領域など、様々なコーディングレベルで実装され得る。さらに、図１１に関して説明したすべての実施形態は、別個に、または互いに組み合わせて実装され得る。

[00174]図１２は、本開示の態様による、一般化残差予測パラメータを導出するための例示的な方法を示すフローチャートである。ＧＲＰパラメータは、図１１に関して説明したようにシグナリングされ得る。ＧＲＰパラメータはまた、ビットストリーム中に含まれる情報から導出され得る。ＧＲＰパラメータは、ビットストリーム中の情報から完全にまたは部分的に導出され得る。一実施形態では、重みステップＳ_wは、関係するＣＵサイズに従ってＣＵレベルで導出される。重みステップＳ_wとＣＵサイズとの間の例示的なマッピングを以下の表に記載する。

[00175]別の実施形態では、重み候補の最大数は、ＣＵモード、ＣＵサイズ、および量子化など、以前にコーディングされた情報に基づいてＣＵレベルで調整される。たとえば、１６×１６よりも小さいＣＵの場合、たとえば、シグナリングコストを節約するために２つの重み候補のみが許可され得る。

[00176]次に、本開示の態様による一般化残差予測パラメータを導出するための例示的な方法について図１２を参照しながら説明する。プロセス１２００は、エンコーダ（たとえば、図２に示したエンコーダ）、デコーダ（たとえば、図３に示したデコーダ）、または任意の他の構成要素によって実行され得る。プロセス１２００のステップについて図３のデコーダ３０に関して説明するが、プロセス１２００は、上述のように、エンコーダなどの他の構成要素によって実行され得る。

[00177]ブロック１２０１において、デコーダ３０は、重み情報を判断するために、ビットストリームから情報を取得するか、または以前にコーディングされた情報を取得する。たとえば、上記で説明したように、ＧＲＰパラメータは、ＣＵサイズに基づき得る。または、ＧＲＰパラメータは、ＣＵモード、ＣＵサイズ、および量子化など、以前にコーディングされた情報に基づき得る。ブロック１２０２において、デコーダ３０は、ブロック１２０１において取得された情報に基づいて一般化残差予測のための１つまたは複数のパラメータを判断する。たとえば、デコーダ３０は、ＣＵサイズに基づいて重みステップＳ_wを判断し得る。デコーダ３０はまた、ＣＵサイズに基づいて重み候補の数Ｎ_wを判断し得る。デコーダ３０はまた、ＣＵモード、ＣＵサイズ、および量子化など、以前にコーディングされた情報に基づいて重み情報を調整し得る。図８に関して説明した本開示の態様による一般化残差予測パラメータを導出するための例示的な方法は、シーケンス、ピクチャ、フレームのグループ、フレーム、スライスのグループ、スライス、コーディングユニット（ＣＵ）のグループ、コーディングユニット（ＣＵ）、予測ユニット（ＰＵ）のグループ、予測ユニット（ＰＵ）、ブロック、またはピクセルの領域など、様々なコーディングレベルで実装され得る。さらに、図１２に関して説明したすべての実施形態は、別個に、または互いに組み合わせて実装され得る。

[00178]図１３は、本開示の態様による、一般化残差予測においてレイヤをアップサンプリングまたはダウンサンプリングするための例示的な方法を示すフローチャートである。レイヤ間予測プロセスでは、エンハンスメントレイヤの空間アスペクト比に一致するようにアップサンプリングまたはダウンサンプリングフィルタ処理プロセスがベースレイヤピクチャに適用される。ベースレイヤおよびエンハンスメントレイヤのピクチャサイズが同一であるときでも、平滑化フィルタなどのフィルタ処理プロセスがやはり適用され得る。概して、１つの固定アップサンプリング、ダウンサンプリング、および平滑化フィルタセットが使用されハードコーディングされる。フィルタは、（位相と呼ばれることがある）フラクショナルピクセルシフトに従ってセットから選択され得、フラクショナルピクセルシフトは、ベースレイヤピクチャとエンハンスメントレイヤピクチャとの間の空間アスペクト比に基づいて計算される。

[00179]ＧＲＰフレームワークでは、レイヤ間予測パフォーマンスを改善するために可変のフィルタ処理セットが適用され得る。フィルタ処理セットは、シーケンスまたはピクチャレベルでハードコーディングされるか、またはシグナリングされ得る。フィルタセットインデックスは、ＣＵおよびＰＵなどのより低いレベルでシグナリングされるか、または導出され得る。フィルタセットインデックスは、重み係数ｗの値に基づいて導出され得るか、または重みインデックスｉ_wに基づいて導出され得る。フィルタ処理セットインデックスと重み係数ｗとの間のまたはフィルタ処理セットと重みインデックスｉ_wとの間の導出マッピングテーブルは、シーケンスまたはピクチャレベルでハードコーディングされるか、またはシグナリングされ得る。

[00180]次に、本開示の態様による一般化残差予測においてレイヤをアップサンプリングまたはダウンサンプリングするための例示的な方法について図１３を参照しながら説明する。プロセス１３００は、エンコーダ（たとえば、図２に示したエンコーダ）、デコーダ（たとえば、図３に示したデコーダ）、または任意の他の構成要素によって実行され得る。プロセス１３００のステップについて図３のデコーダ３０に関して説明するが、プロセス１３００は、上述のように、エンコーダなどの他の構成要素によって実行され得る。

[00181]ブロック１３０１において、デコーダ３０は、基準レイヤをアップサンプリングすべきか、またはエンハンスメントレイヤをダウンサンプリングすべきかを判断する。空間スケーラビリティでは、そのようなアップサンプリングおよびダウンサンプリングは、レイヤ間予測が同じ解像度で実行され得るように実行される。ブロック１３０２において基準レイヤがアップサンプリングされることになると判断される場合、デコーダ３０は、ブロック１３０３において、エンハンスメントレイヤの解像度に基準レイヤをアップサンプリングする。一方、ブロック１３０２においてエンハンスメントレイヤがダウンサンプリングされることになると判断される場合、デコーダ３０は、ブロック１３０４において、基準レイヤの解像度にエンハンスメントレイヤをダウンサンプリングする。ブロック１３０５において、デコーダ３０は、アップサンプリングまたはダウンサンプリングされたピクチャに平滑化フィルタを適用する。平滑化フィルタは、エンハンスメントレイヤピクチャおよび基準レイヤピクチャが同じである場合でも適用され得る。平滑化フィルタは適宜に選択され得る。ブロック１３０６において、デコーダ３０は、アップサンプリングまたはダウンサンプリングされたピクチャに基づいてＧＲＰを使用して現在のビデオユニットを判断する。

[00182]図１３に関して説明した本開示の態様による一般化残差予測においてレイヤをアップサンプリングまたはダウンサンプリングするための例示的な方法は、シーケンス、ピクチャ、フレームのグループ、フレーム、スライスのグループ、スライス、コーディングユニット（ＣＵ）のグループ、コーディングユニット（ＣＵ）、予測ユニット（ＰＵ）のグループ、予測ユニット（ＰＵ）、ブロック、またはピクセルの領域など、様々なコーディングレベルで実装され得る。さらに、図１３に関して説明したすべての実施形態は、別個に、または互いに組み合わせて実装され得る。

[00183]図１４は、本開示の態様による、一般化残差予測において動き情報を再マッピング、アップサンプリング、またはダウンサンプリングするための例示的な方法を示すフローチャートである。場合によっては、残差予測子を生成するために１つのレイヤの動き情報を別のレイヤに適用するとき、１つのレイヤにおいて利用可能な基準が別のレイヤにおいてで利用可能でないことがある。そのような場合、動き再マッピングが必要となる。一実施形態では、基準は、１つのレイヤにおいてのみ利用可能である場合、提案されたＧＲＰフレームワークにおける残差予測子を生成するためにこの基準が使用されることがないように利用不可能なものとしてマーキングされる。別の実施形態では、利用不可能な基準が、関係する基準リストの最初の基準と置き換えられ、動きがゼロ動きに設定される。

[00184]３Ｄビデオコーディングでは、ＳＶＣビデオデータはまた、異なるビューのビデオデータを含む。ビューは異なる角度に関係し得るので、異なるビューの間に視差が存在し得る。３Ｄビデオコーディングのコンテキストで動きが再マッピングされる場合、動きを再マッピングする際に視差ベクトルが考慮され得る。

[00185]空間的にスケーラブルな場合、エンハンスメントレイヤとベースレイヤとの間の異なる解像度により、動きベクトルがアップサンプリングまたはダウンサンプリングされ得る。一実施形態では、動きベクトルスケーリングは、解像度比に直接基づく。別の実施形態では、直接スケーリングの後に追加の位相シフト（＋１または−１）が適用され得る。追加の位相シフトは、ビットストリーム中でシグナリングされるか、または、ＰＵサイズ、動きベクトル、ＣＵ深度などの以前にコーディングされた情報に基づいて導出され得る。

[00186]次に、本開示の態様による動き情報を再マッピング、アップサンプリング、またはダウンサンプリングするための例示的な方法について図１４を参照しながら説明する。プロセス１４００は、エンコーダ（たとえば、図２に示したエンコーダ）、デコーダ（たとえば、図３に示したデコーダ）、または任意の他の構成要素によって実行され得る。プロセス１４００のステップについて図３のデコーダ３０に関して説明するが、プロセス１４００は、上述のように、エンコーダなどの他の構成要素によって実行され得る。ブロック１４０１において、動き情報の基準がレイヤのうちの１つにおいて利用可能でない場合、デコーダ３０は、ブロック１４０２において、動き情報を再マッピングする。たとえば、別のレイヤにおける対応する基準が利用不可能である場合、デコーダ３０は、基準を利用不可能なものとしてマークすることができる。または、デコーダ３０は、関係する基準リスト中の基準にその基準を再マッピングし得る。ブロック１４０１においてインター予測のために使用されるレイヤにおいて動き情報のための基準が利用可能である場合、デコーダ３０は、ブロック１４０３に示すように、さらなる処理を実行し得ない。ブロック１４０４において、空間ＳＶＣが使用される場合、デコーダ３０は、ブロック１４０５において、基準レイヤ動き情報をアップサンプリングすべきか、またはエンハンスメントレイヤ動き情報をダウンサンプリングすべきかを判断する。空間スケーラビリティが使用されない場合、デコーダ３０は、ブロック１４０６に示すようにさらなる処理を実行し得ない。ブロック１４０７において、基準レイヤ動き情報がアップサンプリングされることになると判断される場合、デコーダ３０は、ブロック１００８において、エンハンスメントレイヤの解像度に基準レイヤ動き情報をアップサンプリングする。一方、ブロック１４０７においてエンハンスメントレイヤ動き情報がダウンサンプリングされることになると判断される場合、デコーダ３０は、ブロック１４０９において、基準レイヤの解像度にエンハンスメントレイヤ動き情報をダウンサンプリングする。ブロック１４１０において、デコーダ３０は、アップサンプルまたはダウンサンプリングされたピクチャを使用してＧＲＰを使用して現在のビデオユニットを判断する。

[00187]図１０に関して説明した本開示の態様による動き情報を再マッピング、アップサンプリング、またはダウンサンプリングするための例示的な方法は、シーケンス、ピクチャ、フレームのグループ、フレーム、スライスのグループ、スライス、コーディングユニット（ＣＵ）のグループ、コーディングユニット（ＣＵ）、予測ユニット（ＰＵ）のグループ、予測ユニット（ＰＵ）、ブロック、またはピクセルの領域など、様々なコーディングレベルで実装され得る。さらに、図１４に関して説明したすべての実施形態は、別個に、または互いに組み合わせて実装され得る。

[00188]図１５は、本開示の態様による、一般化残差予測において符号化の重み係数を判断するための例示的な方法を示すフローチャートである。例示的な方法は、エンコーダ側の最適化に適用され得る。一実施形態では、各重み係数候補でのＣＵレートひずみコストを確認することによってＣＵごとに最良の重み係数ｗが判断される。コストが最も小さい重み係数がＣＵの重み係数ｗとして選択される。別の実施形態では、ベースレイヤ時間的予測Ｐ_bにエンハンスメントレイヤ時間的予測Ｐ_eの動きを適用することによって残差予測子が導出される。重み係数ｗは次のように判断され得る。

上式で、Ｉは、エンハンスメントレイヤのソースピクチャを示し、

は、差分ブロック（Ｉ−Ｐ_e）および

のドット積の和を示す。

[00189]次に、本開示の態様による一般化残差予測において符号化の重み係数を判断するための例示的な方法について図１５を参照しながら説明する。プロセス１５００は、エンコーダ（たとえば、図２に示したエンコーダ）、デコーダ（たとえば、図３に示したデコーダ）、または任意の他の構成要素によって実行され得る。プロセス１５００のステップについて図２のエンコーダ２０に関して説明するが、プロセス１５００は、上述のように、デコーダなどの他の構成要素によって実行され得る。ブロック１５０１において、エンコーダ２０は、ＢＬ時間的予測にＥＬ時間的予測の動きを適用することによってＥＬの残差予測を導出する。ブロック１５０２において、デコーダ３０は、導出された残差予測に基づいて重み係数を導出する。図１５に関して説明した本開示の態様による一般化残差予測において符号化の重み係数を判断するための例示的な方法は、シーケンス、ピクチャ、フレームのグループ、フレーム、スライスのグループ、スライス、コーディングユニット（ＣＵ）のグループ、コーディングユニット（ＣＵ）、予測ユニット（ＰＵ）のグループ、予測ユニット（ＰＵ）、ブロック、またはピクセルの領域など、様々なコーディングレベルで実装され得る。さらに、図１５に関して説明したすべての実施形態は、別個に、または互いに組み合わせて実装され得る。

[0190]例によっては、本明細書で説明された技法のうちいずれかの、いくつかの行為またはイベントは、異なるシーケンスで実行され得、追加、マージ、または完全に除外され得る（たとえば、すべての説明した作用またはイベントが、本技法の実施のために必要であるとは限らない）ことを認識されたい。さらに、いくつかの例では、行為またはイベントは、連続的にではなく、たとえば、マルチスレッド処理、割込み処理、または複数のプロセッサを通して、同時に実行され得る。

[0191]１つまたは複数の例では、説明した機能は、ハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の組合せで実装され得る。ソフトウェアで実装される場合、機能は、１つまたは複数の命令またはコードとしてコンピュータ可読媒体上に記憶されるか、またはコンピュータ可読媒体を介して送信され、ハードウェアベースの処理ユニットによって実行され得る。コンピュータ可読媒体は、たとえば、通信プロトコルに従って、ある場所から別の場所へのコンピュータプログラムの転送を可能にする任意の媒体を含むデータ記憶媒体または通信媒体などの有形媒体に対応するコンピュータ可読記憶媒体を含み得る。このようにして、コンピュータ可読媒体は、概して、（１）非一時的である有形コンピュータ可読記憶媒体、または（２）信号または搬送波などの通信媒体に対応し得る。データ記憶媒体は、本開示で説明した技法の実装のための命令、コードおよび／またはデータ構造を取り出すために１つもしくは複数のコンピュータまたは１つもしくは複数のプロセッサによってアクセスされ得る任意の利用可能な媒体であり得る。コンピュータプログラム製品はコンピュータ可読媒体を含み得る。

[0192]限定ではなく例として、そのようなコンピュータ可読記憶媒体は、ＲＡＭ、ＲＯＭ、ＥＥＰＲＯＭ（登録商標）、ＣＤ−ＲＯＭもしくは他の光ディスクストレージ、磁気ディスクストレージ、もしくは他の磁気ストレージデバイス、フラッシュメモリ、または命令またはデータ構造の形態の所望のプログラムコードを記憶するために使用され得、コンピュータによってアクセスされ得る、任意の他の媒体を備えることができる。また、いかなる接続もコンピュータ可読媒体と適切に呼ばれる。たとえば、命令が、同軸ケーブル、光ファイバーケーブル、ツイストペア、デジタル加入者回線（ＤＳＬ）、または赤外線、無線、およびマイクロ波などのワイヤレス技術を使用して、ウェブサイト、サーバ、または他のリモートソースから送信される場合、同軸ケーブル、光ファイバーケーブル、ツイストペア、ＤＳＬ、または赤外線、無線、およびマイクロ波などのワイヤレス技術は、媒体の定義に含まれる。ただし、コンピュータ可読記憶媒体およびデータ記憶媒体は、接続、搬送波、信号、または他の一時媒体を含まないが、代わりに非一時的有形記憶媒体を対象とすることを理解されたい。本明細書で使用するディスク（disk）およびディスク（disc）は、コンパクトディスク（disc）（ＣＤ）、レーザーディスク（登録商標）（disc）、光ディスク（disc）、デジタル多用途ディスク（disc）（ＤＶＤ）、フロッピー（登録商標）ディスク（disk）およびブルーレイディスク（disc）を含み、ディスク（disk）は、通常、データを磁気的に再生し、ディスク（disc）は、データをレーザで光学的に再生する。上記の組合せもコンピュータ可読媒体の範囲内に含まれるべきである。

[0193]命令は、１つまたは複数のデジタル信号プロセッサ（ＤＳＰ）、汎用マイクロプロセッサ、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブル論理アレイ（ＦＰＧＡ）、または他の等価な集積回路もしくはディスクリート論理回路などの１つまたは複数のプロセッサによって実行され得る。したがって、本明細書で使用する「プロセッサ」という用語は、前述の構造、または本明細書で説明した技法の実装に好適な他の構造のいずれかを指し得る。さらに、いくつかの態様では、本明細書で説明した機能は、符号化および復号のために構成された専用ハードウェアおよび／もしくはソフトウェアモジュール内に与えられ得、または複合コーデックに組み込まれ得る。また、本技法は、１つまたは複数の回路または論理要素において十分に実装され得る。

[0194]本開示の技法は、ワイヤレスハンドセット、集積回路（ＩＣ）、またはＩＣのセット（たとえば、チップセット）を含む、多種多様なデバイスまたは装置において実装され得る。本開示では、開示する技法を実行するように構成されたデバイスの機能的態様を強調するために様々な構成要素、モジュール、またはユニットについて説明したが、それらの構成要素、モジュール、またはユニットを、必ずしも異なるハードウェアユニットによって実現する必要があるとは限らない。むしろ、上記で説明したように、様々なユニットが、好適なソフトウェアおよび／またはファームウェアとともに、上記で説明した１つまたは複数のプロセッサを含めて、コーデックハードウェアユニットにおいて組み合わせられるか、または相互動作ハードウェアユニットの集合によって与えられ得る。

[0195]様々な例について説明した。これらおよび他の例は以下の特許請求の範囲内に入る。

[0195]様々な例について説明した。これらおよび他の例は以下の特許請求の範囲内に入る。
以下に、出願当初の特許請求の範囲に記載された発明を付記する。
［Ｃ１］
ベースレイヤビデオ情報とエンハンスメントレイヤビデオ情報とを記憶するように構成されたメモリと、
前記メモリと通信しているプロセッサとを備え、前記プロセッサが、現在のブロックの少なくとも１つの色成分の重み付けレイヤ間予測子および前記現在のブロックの前記少なくとも１つの色成分の重み付けレイヤ内予測子に少なくとも基づいてエンハンスメントレイヤビデオ情報の前記現在のブロックの予測子を判断するように構成された、
デジタルビデオをコーディングするための装置。
［Ｃ２］
前記プロセッサが、正規化ファクタを使用するようにさらに構成され、前記正規化ファクタが、前記重み付けレイヤ間予測子に関連する重み係数と前記重み付けレイヤ内予測子に関連する重み係数との和を備える、Ｃ１に記載の装置。
［Ｃ３］
前記重み付けレイヤ内予測子が、重み係数と、空間的予測子または時間的予測子のうちの少なくとも１つとの積を備える、Ｃ２に記載の装置。
［Ｃ４］
前記重み付けレイヤ間予測子が、重み係数と、時間的予測子、空間的予測子、または残差予測子のうちの少なくとも１つとの積を備える、Ｃ１に記載の装置。
［Ｃ５］
前記プロセッサが、前記現在のブロックの１つまたは複数の追加の重み付け予測子に少なくとも部分的に基づいて前記現在のブロックの前記予測子を判断するようにさらに構成され、前記重み付けレイヤ間予測子、前記重み付けレイヤ内予測子、および前記１つまたは複数の追加の重み付け予測子の各々が、異なるビデオコーディングモードに関連付けられる、Ｃ１に記載の装置。
［Ｃ６］
前記プロセッサが、前記現在のブロックの第２の色成分の第２の重み付けレイヤ間予測子および前記現在のブロックの前記第２の色成分の第２の重み付けレイヤ内予測子に少なくとも基づいて前記現在のブロックの前記予測子を判断するようにさらに構成された、Ｃ１に記載の装置。
［Ｃ７］
前記レイヤ間予測子の第１の重み係数が、前記第２のレイヤ間予測子の第２の重み係数とは異なる、Ｃ６に記載の装置。
［Ｃ８］
前記プロセッサが、前記現在のブロックの空間的に隣接するブロック、第２のエンハンスメントレイヤブロックと前記現在のブロックとの間の距離、または前記現在のブロックのブロック境界からの前記現在のブロック中のピクセルの距離のうちの少なくとも１つに基づいて少なくとも１つの重み係数を判断するようにさらに構成された、Ｃ１に記載の装置。
［Ｃ９］
前記プロセッサが、重み係数のあらかじめ定義されたリストに少なくとも基づいて重み係数を判断するようにさらに構成された、Ｃ１に記載の装置。
［Ｃ１０］
前記プロセッサが、重み係数の前記あらかじめ定義されたリスト中の重み付けインデックスを識別するようにさらに構成され、前記重み付けインデックスが前記重み付け係数に関連付けられる、Ｃ９に記載の装置。
［Ｃ１１］
前記プロセッサは、前記現在のブロックの前記予測子が、前記重み付けレイヤ間予測子および前記重み付けレイヤ内予測子に少なくとも基づいて判断されるべきであると判断したことに応答して、前記現在のブロックの少なくとも１つの色成分に関連するインター方向のシグナリングを妨げるように構成された、Ｃ１に記載の装置。
［Ｃ１２］
前記プロセッサは、残差予測モードに関連する重み係数が制限値であると判断したことに応答して、エンハンスメントレイヤブロックの予測子が、重み付けレイヤ間予測子および重み付けレイヤ内予測子に少なくとも基づいて判断されるべきであることを示すフラグのシグナリングを防げるように構成された、Ｃ１に記載の装置。
［Ｃ１３］
前記プロセッサは、前記重み付けレイヤ内予測子に関連する予測モードが制限予測モードでないと判断したことに応答して、前記重み付けレイヤ間予測子および前記重み付けレイヤ内予測子に少なくとも基づいて前記現在のブロックの前記予測子を判断するように構成された、Ｃ１に記載の装置。
［Ｃ１４］
前記プロセッサは、前記現在のブロックの前記予測子が、前記重み付けレイヤ間予測子および前記重み付けレイヤ内予測子に少なくとも基づいて判断されるべきであることを示すフラグを判断するようにさらに構成され、前記フラグをコーディングするために使用されるコンテキストモデルが、前記現在のブロックに関連する予測モード、前記現在のブロックに関連するインター方向、前記現在のブロックに関連するイントラ方向、マージフラグ、スキップフラグ、ＣＵ深度、またはスライスタイプからなる群のうちの少なくとも１つに基づいて判断される、Ｃ１に記載の装置。
［Ｃ１５］
前記プロセッサは、前記現在のブロックが所定の値よりも大きいサイズを有するビデオ情報のブロックを備えると判断したことに応答して、前記重み付けレイヤ間予測子および前記重み付けレイヤ内予測子に少なくとも基づいて前記現在のブロックの前記予測子を判断するようにさらに構成された、Ｃ１に記載の装置。
［Ｃ１６］
前記プロセッサが、前記現在のブロックの前記予測子を判断するために動き補償情報の使用を単方向動き補償情報に制限するようにさらに構成された、Ｃ１に記載の装置。
［Ｃ１７］
前記プロセッサが、双方向動きベクトルを単方向動きベクトルに変換するようにさらに構成された、Ｃ１６に記載の装置。
［Ｃ１８］
前記変換された双方向動きベクトルが前記現在のブロックのルーマ成分に関連付けられ、前記現在のブロックのクロマ成分に関連する双方向動きベクトルが単方向動きベクトルに変換されない、Ｃ１７に記載の装置。
［Ｃ１９］
前記プロセッサが、補間を実行することなしに前記現在のブロックの前記予測子を判断するようにさらに構成された、Ｃ１に記載の装置。
［Ｃ２０］
前記プロセッサが、前記現在のブロックの少なくとも１つの色成分を判断するために使用される補間フィルタ長さを制限するようにさらに構成された、Ｃ１に記載の装置。
［Ｃ２１］
前記プロセッサは、前記現在のブロックがブロックサイズ基準とパーティションモード基準とを満たすときのみ、前記重み付けレイヤ間予測子および前記重み付けレイヤ内予測子に少なくとも基づいて前記現在のブロックの前記予測子を判断するようにさらに構成された、Ｃ１に記載の装置。
［Ｃ２２］
前記プロセッサは、前記現在のブロックが、ブロックサイズしきい値以上のブロックサイズとパーティションモードしきい値に等しいパーティションモードとを有するときは双方向予測を使用し、前記現在のブロックが、前記ブロックサイズしきい値よりも小さいブロックサイズまたは前記パーティションモードしきい値に等しくないパーティションモードを有するときは単方向予測を使用して、前記現在のブロックの前記予測子を判断するようにさらに構成された、Ｃ１に記載の装置。
［Ｃ２３］
前記プロセッサは、前記重み付けレイヤ間予測子および前記重み付けレイヤ内予測子に少なくとも基づいて前記現在のブロックをコーディングするとき、双方向シンタックス要素のシグナリングを妨げるようにさらに構成された、Ｃ１に記載の装置。
［Ｃ２４］
前記プロセッサは、
前記現在のブロックの前記予測子が、前記重み付けレイヤ間予測子および前記重み付けレイヤ内予測子に少なくとも基づいて判断されるべきであることを示すフラグを識別することと、
前記現在のブロックが制限ブロックサイズに等しくないブロックサイズを有するときのみ、および前記重み付けレイヤ内予測子を判断するために単方向予測が使用されるべきであるときのみ、前記重み付けレイヤ間予測子および前記重み付けレイヤ内予測子に少なくとも基づいて前記現在のブロックの前記予測子を判断することと
を行うようにさらに構成された、Ｃ１に記載の装置。
［Ｃ２５］
ビットストリームから抽出された高レベルシンタックスに応答して、前記重み付けレイヤ間予測子および前記重み付けレイヤ内予測子に少なくとも基づいて前記現在のブロックの前記予測子を判断するように構成されたデコーダを備える、Ｃ１に記載の装置。
［Ｃ２６］
前記現在のブロックの前記予測子が前記重み付けレイヤ間予測子および前記重み付けレイヤ内予測子に少なくとも基づいて判断されるべきであることを示すフラグをシグナリングするように構成されたエンコーダを備え、前記フラグは、前記現在のブロックが、ブロックサイズしきい値以上のブロックサイズとパーティションモードしきい値に等しいパーティションモードとを有すると判断したことに応答してのみシグナリングされる、Ｃ１に記載の装置。
［Ｃ２７］
デスクトップコンピュータ、ノートブックコンピュータ、タブレットコンピュータ、セットトップボックス、電話ハンドセット、テレビジョン、カメラ、ディスプレイデバイス、デジタルメディアプレーヤ、ビデオゲームコンソール、およびビデオストリーミングデバイスからなる前記群から選択されるデバイスの一部である、Ｃ１に記載の装置。
［Ｃ２８］
ベースレイヤビデオ情報とエンハンスメントレイヤビデオ情報とを定義するビデオビットストリームを取得することと、
現在のブロックの少なくとも１つの色成分の重み付けレイヤ間予測子および前記現在のブロックの前記少なくとも１つの色成分の重み付けレイヤ内予測子に少なくとも基づいてエンハンスメントレイヤビデオ情報の前記現在のブロックの予測子を判断することと
を備える、ビデオを復号する方法。
［Ｃ２９］
正規化ファクタを使用することをさらに備え、前記正規化ファクタが、前記重み付けレイヤ間予測子に関連する重み係数と前記重み付けレイヤ内予測子に関連する重み係数との和を備える、Ｃ２８に記載の方法。
［Ｃ３０］
前記重み付けレイヤ間予測子が、重み係数と、時間的予測子、空間的予測子、または残差予測子のうちの少なくとも１つとの積を備える、Ｃ２８に記載の方法。
［Ｃ３１］
前記現在のブロックの１つまたは複数の追加の重み付け予測子に少なくとも部分的に基づいて前記現在のブロックの前記予測子を判断することをさらに備え、前記重み付けレイヤ間予測子、前記重み付けレイヤ内予測子、および前記１つまたは複数の追加の重み付け予測子の各々が、異なるビデオコーディングモードに関連付けられる、Ｃ２８に記載の方法。
［Ｃ３２］
前記現在のブロックの第２の色成分の第２の重み付けレイヤ間予測子および前記現在のブロックの前記第２の色成分の第２の重み付けレイヤ内予測子に少なくとも基づいて前記現在のブロックの前記予測子を判断することをさらに備える、Ｃ２８に記載の方法。
［Ｃ３３］
前記レイヤ間予測子の第１の重み係数が、前記第２のレイヤ間予測子の第２の重み係数とは異なる、Ｃ３２に記載の方法。
［Ｃ３４］
前記現在のブロックの空間的に隣接するブロック、第２のエンハンスメントレイヤブロックと前記現在のブロックとの間の距離、または前記現在のブロックのブロック境界からの前記現在のブロック中のピクセルの距離のうちの少なくとも１つに基づいて少なくとも１つの重み係数を判断することをさらに備える、Ｃ２８に記載の方法。
［Ｃ３５］
重み係数のあらかじめ定義されたリストに少なくとも基づいて重み係数を判断することをさらに備える、Ｃ２８に記載の方法。
［Ｃ３６］
重み係数の前記あらかじめ定義されたリスト中の重み付けインデックスを識別することをさらに備え、前記重み付けインデックスが前記重み付け係数に関連付けられる、Ｃ３５に記載の方法。
［Ｃ３７］
前記重み付けレイヤ内予測子に関連する予測モードが制限予測モードでないと判断したことに応答して、前記重み付けレイヤ間予測子および前記重み付けレイヤ内予測子に少なくとも基づいて前記現在のブロックの前記予測子を判断することをさらに備える、Ｃ２８に記載の方法。
［Ｃ３８］
前記現在のブロックの前記予測子が、前記重み付けレイヤ間予測子および前記重み付けレイヤ内予測子に少なくとも基づいて判断されるべきであることを示すフラグを判断することをさらに備え、前記フラグをコーディングするために使用されるコンテキストモデルが、前記現在のブロックに関連する予測モード、前記現在のブロックに関連するインター方向、前記現在のブロックに関連するイントラ方向、マージフラグ、スキップフラグ、ＣＵ深度、またはスライスタイプからなる群のうちの少なくとも１つに基づいて判断される、Ｃ２８に記載の方法。
［Ｃ３９］
前記現在のブロックが所定の値よりも大きいサイズを有するビデオ情報のブロックを備えると判断したことに応答して、前記重み付けレイヤ間予測子および前記重み付けレイヤ内予測子に少なくとも基づいて前記現在のブロックの前記予測子を判断することをさらに備える、Ｃ２８に記載の方法。
［Ｃ４０］
前記現在のブロックの前記予測子を判断するために動き補償情報の使用を単方向動き補償情報に制限することをさらに備える、Ｃ２８に記載の方法。
［Ｃ４１］
双方向動きベクトルを単方向動きベクトルに変換することをさらに備える、Ｃ４０に記載の方法。
［Ｃ４２］
前記変換された双方向動きベクトルが前記現在のブロックのルーマ成分に関連付けられ、前記現在のブロックのクロマ成分に関連する双方向動きベクトルが単方向動きベクトルに変換されない、Ｃ４１に記載の方法。
［Ｃ４３］
補間を実行することなしに前記現在のブロックの前記予測子を判断することをさらに備える、Ｃ２８に記載の方法。
［Ｃ４４］
前記現在のブロックの少なくとも１つの色成分を判断するために使用される補間フィルタ長さを制限することをさらに備える、Ｃ２８に記載の方法。
［Ｃ４５］
前記現在のブロックがブロックサイズ基準とパーティションモード基準とを満たすときのみ、前記重み付けレイヤ間予測子および前記重み付けレイヤ内予測子に少なくとも基づいて前記現在のブロックの前記予測子を判断することをさらに備える、Ｃ２８に記載の方法。
［Ｃ４６］
前記現在のブロックが、ブロックサイズしきい値以上のブロックサイズとパーティションモードしきい値に等しいパーティションモードとを有するときは双方向予測を使用し、前記現在のブロックが、前記ブロックサイズしきい値よりも小さいブロックサイズまたは前記パーティションモードしきい値に等しくないパーティションモードを有するときは単方向予測を使用して、前記現在のブロックの前記予測子を判断することをさらに備える、Ｃ２８に記載の方法。
［Ｃ４７］
前記現在のブロックの前記予測子が、前記重み付けレイヤ間予測子および前記重み付けレイヤ内予測子に少なくとも基づいて判断されるべきであることを示すフラグを識別することと、
前記現在のブロックが制限ブロックサイズに等しくないブロックサイズを有するときのみ、および前記重み付けレイヤ内予測子を判断するために単方向予測が使用されるべきであるときのみ、前記重み付けレイヤ間予測子および前記重み付けレイヤ内予測子に少なくとも基づいて前記現在のブロックの前記予測子を判断することと
をさらに備える、Ｃ２８に記載の方法。
［Ｃ４８］
ベースレイヤビデオ情報とエンハンスメントレイヤビデオ情報とを定義するビデオビットストリームを生成することと、
現在のブロックの少なくとも１つの色成分の重み付けレイヤ間予測子および前記現在のブロックの前記少なくとも１つの色成分の重み付けレイヤ内予測子に少なくとも基づいてエンハンスメントレイヤビデオ情報の前記現在のブロックの予測子を判断することと
を備える、ビデオを符号化する方法。
［Ｃ４９］
正規化ファクタを使用することをさらに備え、前記正規化ファクタが、前記重み付けレイヤ間予測子に関連する重み係数と前記重み付けレイヤ内予測子に関連する重み係数との和を備える、Ｃ４８に記載の方法。
［Ｃ５０］
前記重み付けレイヤ間予測子が、重み係数と、時間的予測子、空間的予測子、または残差予測子のうちの少なくとも１つとの積を備える、Ｃ４８に記載の方法。
［Ｃ５１］
前記現在のブロックの１つまたは複数の追加の重み付け予測子に少なくとも部分的に基づいて前記現在のブロックの前記予測子を判断することをさらに備え、前記重み付けレイヤ間予測子、前記重み付けレイヤ内予測子、および前記１つまたは複数の追加の重み付け予測子の各々が、異なるビデオコーディングモードに関連付けられる、Ｃ４８に記載の方法。
［Ｃ５２］
前記現在のブロックの第２の色成分の第２の重み付けレイヤ間予測子および前記現在のブロックの前記第２の色成分の第２の重み付けレイヤ内予測子に少なくとも基づいて前記現在のブロックの前記予測子を判断することをさらに備える、Ｃ４８に記載の方法。
［Ｃ５３］
前記レイヤ間予測子の第１の重み係数が、前記第２のレイヤ間予測子の第２の重み係数とは異なる、Ｃ５２に記載の方法。
［Ｃ５４］
前記現在のブロックの空間的に隣接するブロック、第２のエンハンスメントレイヤブロックと前記現在のブロックとの間の距離、または前記現在のブロックのブロック境界からの前記現在のブロック中のピクセルの距離のうちの少なくとも１つに基づいて少なくとも１つの重み係数を判断することをさらに備える、Ｃ４８に記載の方法。
［Ｃ５５］
重み係数のあらかじめ定義されたリストに少なくとも基づいて重み係数を判断することをさらに備える、Ｃ４８に記載の方法。
［Ｃ５６］
重み係数の前記あらかじめ定義されたリスト中の重み付けインデックスを識別することをさらに備え、前記重み付けインデックスが前記重み付け係数に関連付けられる、Ｃ５５に記載の方法。
［Ｃ５７］
前記現在のブロックの前記予測子が、前記重み付けレイヤ間予測子および前記重み付けレイヤ内予測子に少なくとも基づいて判断されるべきであると判断したことに応答して、前記現在のブロックの少なくとも１つの色成分に関連するインター方向のシグナリングを妨げることをさらに備える、Ｃ４８に記載の方法。
［Ｃ５８］
残差予測モードに関連する重み係数が制限値であると判断したことに応答して、エンハンスメントレイヤブロックの予測子が、重み付けレイヤ間予測子および重み付けレイヤ内予測子に少なくとも基づいて判断されるべきであることを示すフラグのシグナリングを防げることをさらに備える、Ｃ４８に記載の方法。
［Ｃ５９］
前記重み付けレイヤ内予測子に関連する予測モードが制限予測モードでないと判断したことに応答して、前記重み付けレイヤ間予測子および前記重み付けレイヤ内予測子に少なくとも基づいて前記現在のブロックの前記予測子を判断することをさらに備える、Ｃ４８に記載の方法。
［Ｃ６０］
前記現在のブロックの前記予測子が、前記重み付けレイヤ間予測子および前記重み付けレイヤ内予測子に少なくとも基づいて判断されるべきであることを示すフラグを判断することをさらに備え、前記フラグをコーディングするために使用されるコンテキストモデルが、前記現在のブロックに関連する予測モード、前記現在のブロックに関連するインター方向、前記現在のブロックに関連するイントラ方向、マージフラグ、スキップフラグ、ＣＵ深度、またはスライスタイプからなる群のうちの少なくとも１つに基づいて判断される、Ｃ４８に記載の方法。
［Ｃ６１］
前記現在のブロックが所定の値よりも大きいサイズを有するビデオ情報のブロックを備えると判断したことに応答して、前記重み付けレイヤ間予測子および前記重み付けレイヤ内予測子に少なくとも基づいて前記現在のブロックの前記予測子を判断することをさらに備える、Ｃ４８に記載の方法。
［Ｃ６２］
前記現在のブロックの前記予測子を判断するために動き補償情報の使用を単方向動き補償情報に制限することをさらに備える、Ｃ４８に記載の方法。
［Ｃ６３］
双方向動きベクトルを単方向動きベクトルに変換することをさらに備える、Ｃ６２に記載の方法。
［Ｃ６４］
前記変換された双方向動きベクトルが前記現在のブロックのルーマ成分に関連付けられ、前記現在のブロックのクロマ成分に関連する双方向動きベクトルが単方向動きベクトルに変換されない、Ｃ６３に記載の方法。
［Ｃ６５］
補間を実行することなしに前記現在のブロックの前記予測子を判断することをさらに備える、Ｃ４８に記載の方法。
［Ｃ６６］
前記現在のブロックの少なくとも１つの色成分を判断するために使用される補間フィルタ長さを制限することをさらに備える、Ｃ４８に記載の方法。
［Ｃ６７］
前記現在のブロックがブロックサイズ基準とパーティションモード基準とを満たすときのみ、前記重み付けレイヤ間予測子および前記重み付けレイヤ内予測子に少なくとも基づいて前記現在のブロックの前記予測子を判断することをさらに備える、Ｃ４８に記載の方法。
［Ｃ６８］
前記現在のブロックが、ブロックサイズしきい値以上のブロックサイズとパーティションモードしきい値に等しいパーティションモードとを有するときは双方向予測を使用し、前記現在のブロックが、前記ブロックサイズしきい値よりも小さいブロックサイズまたは前記パーティションモードしきい値に等しくないパーティションモードを有するときは単方向予測を使用して、前記現在のブロックの前記予測子を判断することをさらに備える、Ｃ４８に記載の方法。
［Ｃ６９］
前記重み付けレイヤ間予測子および前記重み付けレイヤ内予測子に少なくとも基づいて前記現在のブロックをコーディングするとき、双方向シンタックス要素のシグナリングを妨げることをさらに備える、Ｃ４８に記載の方法。
［Ｃ７０］
前記現在のブロックの前記予測子が、前記重み付けレイヤ間予測子および前記重み付けレイヤ内予測子に少なくとも基づいて判断されるべきであることを示すフラグを識別することと、
前記現在のブロックが制限ブロックサイズに等しくないブロックサイズを有するときのみ、および前記重み付けレイヤ内予測子を判断するために単方向予測が使用されるべきであるときのみ、前記重み付けレイヤ間予測子および前記重み付けレイヤ内予測子に少なくとも基づいて前記現在のブロックの前記予測子を判断することと
をさらに備える、Ｃ４８に記載の方法。
［Ｃ７１］
装置のプロセッサによって実行可能な命令を備えるコンピュータ可読記憶媒体であって、前記命令が、前記装置に、
ベースレイヤビデオ情報とエンハンスメントレイヤビデオ情報とを取得し記憶することと、
現在のブロックの少なくとも１つの色成分の重み付けレイヤ間予測子および前記現在のブロックの前記少なくとも１つの色成分の重み付けレイヤ内予測子に少なくとも基づいてエンハンスメントレイヤビデオ情報の前記現在のブロックの予測子を判断することと
を行わせる、コンピュータ可読記憶媒体。
［Ｃ７２］
前記命令が、前記装置に、前記現在のブロックの前記予測子を判断するために動き補償情報の使用を単方向動き補償情報に制限することをさらに行わせる、Ｃ７１に記載のコンピュータ可読記憶媒体。
［Ｃ７３］
ベースレイヤビデオ情報とエンハンスメントレイヤビデオ情報とを取得するための手段と、
現在のブロックの少なくとも１つの色成分の重み付けレイヤ間予測子および前記現在のブロックの前記少なくとも１つの色成分の重み付けレイヤ内予測子に少なくとも基づいてエンハンスメントレイヤビデオ情報の前記現在のブロックの予測子を判断するための手段と
を備える、デジタルビデオをコーディングするための装置。
［Ｃ７４］
前記現在のブロックが所定の値よりも大きいサイズを有するビデオ情報のブロックを備えると判断したことに応答して、前記重み付けレイヤ間予測子および前記重み付けレイヤ内予測子に少なくとも基づいて前記現在のブロックの前記予測子を判断するための手段をさらに備える、Ｃ７３に記載の装置。

Claims

ベースレイヤビデオ情報とエンハンスメントレイヤビデオ情報とを記憶するように構成されたメモリと、
前記メモリと通信しているプロセッサとを備え、前記プロセッサが、現在のブロックの少なくとも１つの色成分の重み付けレイヤ間予測子および前記現在のブロックの前記少なくとも１つの色成分の重み付けレイヤ内予測子に少なくとも基づいてエンハンスメントレイヤビデオ情報の前記現在のブロックの予測子を判断するように構成された、
デジタルビデオをコーディングするための装置。
前記プロセッサが、正規化ファクタを使用するようにさらに構成され、前記正規化ファクタが、前記重み付けレイヤ間予測子に関連する重み係数と前記重み付けレイヤ内予測子に関連する重み係数との和を備える、請求項１に記載の装置。
前記重み付けレイヤ内予測子が、重み係数と、空間的予測子または時間的予測子のうちの少なくとも１つとの積を備える、請求項２に記載の装置。
前記重み付けレイヤ間予測子が、重み係数と、時間的予測子、空間的予測子、または残差予測子のうちの少なくとも１つとの積を備える、請求項１に記載の装置。
前記プロセッサが、前記現在のブロックの１つまたは複数の追加の重み付け予測子に少なくとも部分的に基づいて前記現在のブロックの前記予測子を判断するようにさらに構成され、前記重み付けレイヤ間予測子、前記重み付けレイヤ内予測子、および前記１つまたは複数の追加の重み付け予測子の各々が、異なるビデオコーディングモードに関連付けられる、請求項１に記載の装置。
前記プロセッサが、前記現在のブロックの第２の色成分の第２の重み付けレイヤ間予測子および前記現在のブロックの前記第２の色成分の第２の重み付けレイヤ内予測子に少なくとも基づいて前記現在のブロックの前記予測子を判断するようにさらに構成された、請求項１に記載の装置。
前記レイヤ間予測子の第１の重み係数が、前記第２のレイヤ間予測子の第２の重み係数とは異なる、請求項６に記載の装置。
前記プロセッサが、前記現在のブロックの空間的に隣接するブロック、第２のエンハンスメントレイヤブロックと前記現在のブロックとの間の距離、または前記現在のブロックのブロック境界からの前記現在のブロック中のピクセルの距離のうちの少なくとも１つに基づいて少なくとも１つの重み係数を判断するようにさらに構成された、請求項１に記載の装置。
前記プロセッサが、重み係数のあらかじめ定義されたリストに少なくとも基づいて重み係数を判断するようにさらに構成された、請求項１に記載の装置。
前記プロセッサが、重み係数の前記あらかじめ定義されたリスト中の重み付けインデックスを識別するようにさらに構成され、前記重み付けインデックスが前記重み付け係数に関連付けられる、請求項９に記載の装置。
前記プロセッサは、前記現在のブロックの前記予測子が、前記重み付けレイヤ間予測子および前記重み付けレイヤ内予測子に少なくとも基づいて判断されるべきであると判断したことに応答して、前記現在のブロックの少なくとも１つの色成分に関連するインター方向のシグナリングを妨げるように構成された、請求項１に記載の装置。
前記プロセッサは、残差予測モードに関連する重み係数が制限値であると判断したことに応答して、エンハンスメントレイヤブロックの予測子が、重み付けレイヤ間予測子および重み付けレイヤ内予測子に少なくとも基づいて判断されるべきであることを示すフラグのシグナリングを防げるように構成された、請求項１に記載の装置。
前記プロセッサは、前記重み付けレイヤ内予測子に関連する予測モードが制限予測モードでないと判断したことに応答して、前記重み付けレイヤ間予測子および前記重み付けレイヤ内予測子に少なくとも基づいて前記現在のブロックの前記予測子を判断するように構成された、請求項１に記載の装置。
前記プロセッサは、前記現在のブロックの前記予測子が、前記重み付けレイヤ間予測子および前記重み付けレイヤ内予測子に少なくとも基づいて判断されるべきであることを示すフラグを判断するようにさらに構成され、前記フラグをコーディングするために使用されるコンテキストモデルが、前記現在のブロックに関連する予測モード、前記現在のブロックに関連するインター方向、前記現在のブロックに関連するイントラ方向、マージフラグ、スキップフラグ、ＣＵ深度、またはスライスタイプからなる群のうちの１つに少なくとも基づいて判断される、請求項１に記載の装置。
前記プロセッサは、前記現在のブロックが所定の値よりも大きいサイズを有するビデオ情報のブロックを備えると判断したことに応答して、前記重み付けレイヤ間予測子および前記重み付けレイヤ内予測子に少なくとも基づいて前記現在のブロックの前記予測子を判断するようにさらに構成された、請求項１に記載の装置。
前記プロセッサが、前記現在のブロックの前記予測子を判断するために動き補償情報の使用を単方向動き補償情報に制限するようにさらに構成された、請求項１に記載の装置。
前記プロセッサが、双方向動きベクトルを単方向動きベクトルに変換するようにさらに構成された、請求項１６に記載の装置。
前記変換された双方向動きベクトルが前記現在のブロックのルーマ成分に関連付けられ、前記現在のブロックのクロマ成分に関連する双方向動きベクトルが単方向動きベクトルに変換されない、請求項１７に記載の装置。
前記プロセッサが、補間を実行することなしに前記現在のブロックの前記予測子を判断するようにさらに構成された、請求項１に記載の装置。
前記プロセッサが、前記現在のブロックの少なくとも１つの色成分を判断するために使用される補間フィルタ長さを制限するようにさらに構成された、請求項１に記載の装置。
前記プロセッサは、前記現在のブロックがブロックサイズ基準とパーティションモード基準とを満たすときのみ、前記重み付けレイヤ間予測子および前記重み付けレイヤ内予測子に少なくとも基づいて前記現在のブロックの前記予測子を判断するようにさらに構成された、請求項１に記載の装置。
前記プロセッサは、前記現在のブロックが、ブロックサイズしきい値以上のブロックサイズとパーティションモードしきい値に等しいパーティションモードとを有するときは双方向予測を使用し、前記現在のブロックが、前記ブロックサイズしきい値よりも小さいブロックサイズまたは前記パーティションモードしきい値に等しくないパーティションモードを有するときは単方向予測を使用して、前記現在のブロックの前記予測子を判断するようにさらに構成された、請求項１に記載の装置。
前記プロセッサは、前記重み付けレイヤ間予測子および前記重み付けレイヤ内予測子に少なくとも基づいて前記現在のブロックをコーディングするとき、双方向シンタックス要素のシグナリングを妨げるようにさらに構成された、請求項１に記載の装置。
前記プロセッサは、
前記現在のブロックの前記予測子が、前記重み付けレイヤ間予測子および前記重み付けレイヤ内予測子に少なくとも基づいて判断されるべきであることを示すフラグを識別することと、
前記現在のブロックが制限ブロックサイズに等しくないブロックサイズを有するときのみ、および前記重み付けレイヤ内予測子を判断するために単方向予測が使用されるべきであるときのみ、前記重み付けレイヤ間予測子および前記重み付けレイヤ内予測子に少なくとも基づいて前記現在のブロックの前記予測子を判断することと
を行うようにさらに構成された、請求項１に記載の装置。
ビットストリームから抽出された高レベルシンタックスに応答して、前記重み付けレイヤ間予測子および前記重み付けレイヤ内予測子に少なくとも基づいて前記現在のブロックの前記予測子を判断するように構成されたデコーダを備える、請求項１に記載の装置。
前記現在のブロックの前記予測子が前記重み付けレイヤ間予測子および前記重み付けレイヤ内予測子に少なくとも基づいて判断されるべきであることを示すフラグをシグナリングするように構成されたエンコーダを備え、前記フラグは、前記現在のブロックが、ブロックサイズしきい値以上のブロックサイズとパーティションモードしきい値に等しいパーティションモードとを有すると判断したことに応答してのみシグナリングされる、請求項１に記載の装置。
デスクトップコンピュータ、ノートブックコンピュータ、タブレットコンピュータ、セットトップボックス、電話ハンドセット、テレビジョン、カメラ、ディスプレイデバイス、デジタルメディアプレーヤ、ビデオゲームコンソール、およびビデオストリーミングデバイスからなる前記群から選択されるデバイスの一部である、請求項１に記載の装置。
ベースレイヤビデオ情報とエンハンスメントレイヤビデオ情報とを定義するビデオビットストリームを取得することと、
現在のブロックの少なくとも１つの色成分の重み付けレイヤ間予測子および前記現在のブロックの前記少なくとも１つの色成分の重み付けレイヤ内予測子に少なくとも基づいてエンハンスメントレイヤビデオ情報の前記現在のブロックの予測子を判断することと
を備える、ビデオを復号する方法。
正規化ファクタを使用することをさらに備え、前記正規化ファクタが、前記重み付けレイヤ間予測子に関連する重み係数と前記重み付けレイヤ内予測子に関連する重み係数との和を備える、請求項２８に記載の方法。
前記重み付けレイヤ間予測子が、重み係数と、時間的予測子、空間的予測子、または残差予測子のうちの少なくとも１つとの積を備える、請求項２８に記載の方法。
前記現在のブロックの１つまたは複数の追加の重み付け予測子に少なくとも部分的に基づいて前記現在のブロックの前記予測子を判断することをさらに備え、前記重み付けレイヤ間予測子、前記重み付けレイヤ内予測子、および前記１つまたは複数の追加の重み付け予測子の各々が、異なるビデオコーディングモードに関連付けられる、請求項２８に記載の方法。
前記現在のブロックの第２の色成分の第２の重み付けレイヤ間予測子および前記現在のブロックの前記第２の色成分の第２の重み付けレイヤ内予測子に少なくとも基づいて前記現在のブロックの前記予測子を判断することをさらに備える、請求項２８に記載の方法。
前記レイヤ間予測子の第１の重み係数が、前記第２のレイヤ間予測子の第２の重み係数とは異なる、請求項３２に記載の方法。
前記現在のブロックの空間的に隣接するブロック、第２のエンハンスメントレイヤブロックと前記現在のブロックとの間の距離、または前記現在のブロックのブロック境界からの前記現在のブロック中のピクセルの距離のうちの１つに少なくとも基づいて少なくとも１つの重み係数を判断することをさらに備える、請求項２８に記載の方法。
重み係数のあらかじめ定義されたリストに少なくとも基づいて重み係数を判断することをさらに備える、請求項２８に記載の方法。
重み係数の前記あらかじめ定義されたリスト中の重み付けインデックスを識別することをさらに備え、前記重み付けインデックスが前記重み付け係数に関連付けられる、請求項３５に記載の方法。
前記重み付けレイヤ内予測子に関連する予測モードが制限予測モードでないと判断したことに応答して、前記重み付けレイヤ間予測子および前記重み付けレイヤ内予測子に少なくとも基づいて前記現在のブロックの前記予測子を判断することをさらに備える、請求項２８に記載の方法。
前記現在のブロックの前記予測子が、前記重み付けレイヤ間予測子および前記重み付けレイヤ内予測子に少なくとも基づいて判断されるべきであることを示すフラグを判断することをさらに備え、前記フラグをコーディングするために使用されるコンテキストモデルが、前記現在のブロックに関連する予測モード、前記現在のブロックに関連するインター方向、前記現在のブロックに関連するイントラ方向、マージフラグ、スキップフラグ、ＣＵ深度、またはスライスタイプからなる群のうちの１つに少なくとも基づいて判断される、請求項２８に記載の方法。
前記現在のブロックが所定の値よりも大きいサイズを有するビデオ情報のブロックを備えると判断したことに応答して、前記重み付けレイヤ間予測子および前記重み付けレイヤ内予測子に少なくとも基づいて前記現在のブロックの前記予測子を判断することをさらに備える、請求項２８に記載の方法。
前記現在のブロックの前記予測子を判断するために動き補償情報の使用を単方向動き補償情報に制限することをさらに備える、請求項２８に記載の方法。
双方向動きベクトルを単方向動きベクトルに変換することをさらに備える、請求項４０に記載の方法。
前記変換された双方向動きベクトルが前記現在のブロックのルーマ成分に関連付けられ、前記現在のブロックのクロマ成分に関連する双方向動きベクトルが単方向動きベクトルに変換されない、請求項４１に記載の方法。
補間を実行することなしに前記現在のブロックの前記予測子を判断することをさらに備える、請求項２８に記載の方法。
前記現在のブロックの少なくとも１つの色成分を判断するために使用される補間フィルタ長さを制限することをさらに備える、請求項２８に記載の方法。
前記現在のブロックがブロックサイズ基準とパーティションモード基準とを満たすときのみ、前記重み付けレイヤ間予測子および前記重み付けレイヤ内予測子に少なくとも基づいて前記現在のブロックの前記予測子を判断することをさらに備える、請求項２８に記載の方法。
前記現在のブロックが、ブロックサイズしきい値以上のブロックサイズとパーティションモードしきい値に等しいパーティションモードとを有するときは双方向予測を使用し、前記現在のブロックが、前記ブロックサイズしきい値よりも小さいブロックサイズまたは前記パーティションモードしきい値に等しくないパーティションモードを有するときは単方向予測を使用して、前記現在のブロックの前記予測子を判断することをさらに備える、請求項２８に記載の方法。
前記現在のブロックの前記予測子が、前記重み付けレイヤ間予測子および前記重み付けレイヤ内予測子に少なくとも基づいて判断されるべきであることを示すフラグを識別することと、
前記現在のブロックが制限ブロックサイズに等しくないブロックサイズを有するときのみ、および前記重み付けレイヤ内予測子を判断するために単方向予測が使用されるべきであるときのみ、前記重み付けレイヤ間予測子および前記重み付けレイヤ内予測子に少なくとも基づいて前記現在のブロックの前記予測子を判断することと
をさらに備える、請求項２８に記載の方法。
ベースレイヤビデオ情報とエンハンスメントレイヤビデオ情報とを定義するビデオビットストリームを生成することと、
現在のブロックの少なくとも１つの色成分の重み付けレイヤ間予測子および前記現在のブロックの前記少なくとも１つの色成分の重み付けレイヤ内予測子に少なくとも基づいてエンハンスメントレイヤビデオ情報の前記現在のブロックの予測子を判断することと
を備える、ビデオを符号化する方法。
正規化ファクタを使用することをさらに備え、前記正規化ファクタが、前記重み付けレイヤ間予測子に関連する重み係数と前記重み付けレイヤ内予測子に関連する重み係数との和を備える、請求項４８に記載の方法。
前記重み付けレイヤ間予測子が、重み係数と、時間的予測子、空間的予測子、または残差予測子のうちの少なくとも１つとの積を備える、請求項４８に記載の方法。
前記現在のブロックの１つまたは複数の追加の重み付け予測子に少なくとも部分的に基づいて前記現在のブロックの前記予測子を判断することをさらに備え、前記重み付けレイヤ間予測子、前記重み付けレイヤ内予測子、および前記１つまたは複数の追加の重み付け予測子の各々が、異なるビデオコーディングモードに関連付けられる、請求項４８に記載の方法。
前記現在のブロックの第２の色成分の第２の重み付けレイヤ間予測子および前記現在のブロックの前記第２の色成分の第２の重み付けレイヤ内予測子に少なくとも基づいて前記現在のブロックの前記予測子を判断することをさらに備える、請求項４８に記載の方法。
前記レイヤ間予測子の第１の重み係数が、前記第２のレイヤ間予測子の第２の重み係数とは異なる、請求項５２に記載の方法。
前記現在のブロックの空間的に隣接するブロック、第２のエンハンスメントレイヤブロックと前記現在のブロックとの間の距離、または前記現在のブロックのブロック境界からの前記現在のブロック中のピクセルの距離のうちの１つに少なくとも基づいて少なくとも１つの重み係数を判断することをさらに備える、請求項４８に記載の方法。
重み係数のあらかじめ定義されたリストに少なくとも基づいて重み係数を判断することをさらに備える、請求項４８に記載の方法。
重み係数の前記あらかじめ定義されたリスト中の重み付けインデックスを識別することをさらに備え、前記重み付けインデックスが前記重み付け係数に関連付けられる、請求項５５に記載の方法。
前記現在のブロックの前記予測子が、前記重み付けレイヤ間予測子および前記重み付けレイヤ内予測子に少なくとも基づいて判断されるべきであると判断したことに応答して、前記現在のブロックの少なくとも１つの色成分に関連するインター方向のシグナリングを妨げることをさらに備える、請求項４８に記載の方法。
残差予測モードに関連する重み係数が制限値であると判断したことに応答して、エンハンスメントレイヤブロックの予測子が、重み付けレイヤ間予測子および重み付けレイヤ内予測子に少なくとも基づいて判断されるべきであることを示すフラグのシグナリングを防げることをさらに備える、請求項４８に記載の方法。
前記重み付けレイヤ内予測子に関連する予測モードが制限予測モードでないと判断したことに応答して、前記重み付けレイヤ間予測子および前記重み付けレイヤ内予測子に少なくとも基づいて前記現在のブロックの前記予測子を判断することをさらに備える、請求項４８に記載の方法。
前記現在のブロックの前記予測子が、前記重み付けレイヤ間予測子および前記重み付けレイヤ内予測子に少なくとも基づいて判断されるべきであることを示すフラグを判断することをさらに備え、前記フラグをコーディングするために使用されるコンテキストモデルが、前記現在のブロックに関連する予測モード、前記現在のブロックに関連するインター方向、前記現在のブロックに関連するイントラ方向、マージフラグ、スキップフラグ、ＣＵ深度、またはスライスタイプからなる群のうちの１つに少なくとも基づいて判断される、請求項４８に記載の方法。
前記現在のブロックが所定の値よりも大きいサイズを有するビデオ情報のブロックを備えると判断したことに応答して、前記重み付けレイヤ間予測子および前記重み付けレイヤ内予測子に少なくとも基づいて前記現在のブロックの前記予測子を判断することをさらに備える、請求項４８に記載の方法。
前記現在のブロックの前記予測子を判断するために動き補償情報の使用を単方向動き補償情報に制限することをさらに備える、請求項４８に記載の方法。
双方向動きベクトルを単方向動きベクトルに変換することをさらに備える、請求項６２に記載の方法。
前記変換された双方向動きベクトルが前記現在のブロックのルーマ成分に関連付けられ、前記現在のブロックのクロマ成分に関連する双方向動きベクトルが単方向動きベクトルに変換されない、請求項６３に記載の方法。
補間を実行することなしに前記現在のブロックの前記予測子を判断することをさらに備える、請求項４８に記載の方法。
前記現在のブロックの少なくとも１つの色成分を判断するために使用される補間フィルタ長さを制限することをさらに備える、請求項４８に記載の方法。
前記現在のブロックがブロックサイズ基準とパーティションモード基準とを満たすときのみ、前記重み付けレイヤ間予測子および前記重み付けレイヤ内予測子に少なくとも基づいて前記現在のブロックの前記予測子を判断することをさらに備える、請求項４８に記載の方法。
前記現在のブロックが、ブロックサイズしきい値以上のブロックサイズとパーティションモードしきい値に等しいパーティションモードとを有するときは双方向予測を使用し、前記現在のブロックが、前記ブロックサイズしきい値よりも小さいブロックサイズまたは前記パーティションモードしきい値に等しくないパーティションモードを有するときは単方向予測を使用して、前記現在のブロックの前記予測子を判断することをさらに備える、請求項４８に記載の方法。
前記重み付けレイヤ間予測子および前記重み付けレイヤ内予測子に少なくとも基づいて前記現在のブロックをコーディングするとき、双方向シンタックス要素のシグナリングを妨げることをさらに備える、請求項４８に記載の方法。
前記現在のブロックの前記予測子が、前記重み付けレイヤ間予測子および前記重み付けレイヤ内予測子に少なくとも基づいて判断されるべきであることを示すフラグを識別することと、
前記現在のブロックが制限ブロックサイズに等しくないブロックサイズを有するときのみ、および前記重み付けレイヤ内予測子を判断するために単方向予測が使用されるべきであるときのみ、前記重み付けレイヤ間予測子および前記重み付けレイヤ内予測子に少なくとも基づいて前記現在のブロックの前記予測子を判断することと
をさらに備える、請求項４８に記載の方法。
装置のプロセッサによって実行可能な命令を備えるコンピュータ可読記憶媒体であって、前記命令が、前記装置に、
ベースレイヤビデオ情報とエンハンスメントレイヤビデオ情報とを取得し記憶することと、
現在のブロックの少なくとも１つの色成分の重み付けレイヤ間予測子および前記現在のブロックの前記少なくとも１つの色成分の重み付けレイヤ内予測子に少なくとも基づいてエンハンスメントレイヤビデオ情報の前記現在のブロックの予測子を判断することと
を行わせる、コンピュータ可読記憶媒体。
前記命令が、前記装置に、前記現在のブロックの前記予測子を判断するために動き補償情報の使用を単方向動き補償情報に制限することをさらに行わせる、請求項７１に記載のコンピュータ可読記憶媒体。
ベースレイヤビデオ情報とエンハンスメントレイヤビデオ情報とを取得するための手段と、
現在のブロックの少なくとも１つの色成分の重み付けレイヤ間予測子および前記現在のブロックの前記少なくとも１つの色成分の重み付けレイヤ内予測子に少なくとも基づいてエンハンスメントレイヤビデオ情報の前記現在のブロックの予測子を判断するための手段と
を備える、デジタルビデオをコーディングするための装置。
前記現在のブロックが所定の値よりも大きいサイズを有するビデオ情報のブロックを備えると判断したことに応答して、前記重み付けレイヤ間予測子および前記重み付けレイヤ内予測子に少なくとも基づいて前記現在のブロックの前記予測子を判断するための手段をさらに備える、請求項７３に記載の装置。