JP2022548990A

JP2022548990A - ベクトルクリッピングを用いるアフィンコーディング

Info

Publication number: JP2022548990A
Application number: JP2022518301A
Authority: JP
Inventors: ルサノフスキー、ドミトロ; カルチェビチ、マルタ; ジャン、ヤン
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2019-09-29
Filing date: 2020-09-28
Publication date: 2022-11-22
Also published as: EP4035395A1; WO2021062401A1; CN114402617A; US20210099729A1; US11317111B2; KR20220064970A; AU2020353234A1

Abstract

ビデオコーディングおよび圧縮のためのシステム、方法、およびコンピュータ可読記憶媒体について説明する。いくつかの例は、ビデオコーディングおよび圧縮のためのアフィンコーディングモードを含む。一例は、ビデオデータをコーディングするための装置であり、本装置は、メモリとメモリに結合された１つまたは複数のプロセッサとを備える。１つまたは複数のプロセッサは、ビデオデータから現在のコーディングブロックを取得することと、現在のコーディングブロックのための制御データを決定することと、制御データから１つまたは複数のアフィン動きベクトルクリッピングパラメータを決定することとを行うように構成される。１つまたは複数のプロセッサは、現在のコーディングブロックのサンプルを選択することと、現在のコーディングブロックのサンプルのためのアフィン動きベクトルを決定することと、クリッピングされたアフィン動きベクトルを生成するために１つまたは複数のアフィン動きベクトルクリッピングパラメータを使用してアフィン動きベクトルをクリッピングすることとをさらに行う。【選択図】図１８Ｂ

Description

[0001]本出願は、ビデオコーディングおよび圧縮に関する。より詳細には、本出願は、ビデオコーディングおよび圧縮のためのアフィンコーディングモードに関する。

[0002]多くのデバイスおよびシステムは、ビデオデータが消費のために処理および出力されることを可能にする。デジタルビデオデータは、一般に、ビデオ消費者およびプロバイダの需要を満たすための大量のデータを含む。たとえば、ビデオデータの消費者は、高い品質、忠実度、解像度、フレームレートなどのビデオを望む。その結果、これらの需要を満たすために必要とされる大量のビデオデータは、ビデオデータを処理および記憶する通信ネットワークおよびデバイスに負担をかける。

[0003]様々なビデオコーディング技法が、ビデオデータを圧縮するために使用され得る。ビデオコーディング技法は、１つまたは複数のビデオコーディング規格に従って実施され得る。たとえば、ビデオコーディング規格は、高効率ビデオコーディング（ＨＥＶＣ）、アドバンストビデオコーディング（ＡＶＣ）、ムービングピクチャエクスパーツグループ（ＭＰＥＧ）２パート２コーディング、ＶＰ９、ＡｌｌｉａｎｃｅｏｆＯｐｅｎＭｅｄｉａ（ＡＯＭｅｄｉａ）Ｖｉｄｅｏ１（ＡＶ１）、エッセンシャルビデオコーディング（ＥＶＣ）などを含む。ビデオコーディングは、概してビデオ画像またはシーケンス中に存在する冗長を利用する予測方法（たとえば、インター予測、イントラ予測など）を利用する。ビデオコーディング技法の重要な目標は、ビデオ品質に対する劣化を回避するかまたは最小限に抑えながら、より低いビットレートを使用する形式にビデオデータを圧縮することである。常に発展しつつあるビデオサービスが利用可能になるとともに、改善されたコーディング精度または効率をもつ符号化技法が必要とされる。

[0004]本明細書では、改善されたビデオ処理のためのシステムおよび方法について説明する。いくつかの例では、ビデオデータを効率的に符号化および復号するためにアフィンコーディングモードを使用するビデオコーディング技法について説明する。

[0005]１つの例示的な例では、ビデオデータをコーディングする方法について説明する。本方法は、ビデオデータから現在のコーディングブロックを取得することと、現在のコーディングブロックのための制御データを決定することと、制御データから１つまたは複数のアフィン動きベクトルクリッピングパラメータを決定することと、現在のコーディングブロックのサンプルを選択することと、現在のコーディングブロックのサンプルのためのアフィン動きベクトルを決定することと、クリッピングされたアフィン動きベクトルを生成するために１つまたは複数のアフィン動きベクトルクリッピングパラメータを使用してアフィン動きベクトルをクリッピングすることと、を備える。

[0006]別の例示的な例では、非一時的コンピュータ可読記憶媒体について説明する。非一時的コンピュータ可読記憶媒体は、１つまたは複数のプロセッサによって実行されたとき、１つまたは複数のプロセッサに、ビデオデータから現在のコーディングブロックを取得することと、現在のコーディングブロックのための制御データを決定することと、制御データから１つまたは複数のアフィン動きベクトルクリッピングパラメータを決定することと、現在のコーディングブロックのサンプルを選択することと、現在のコーディングブロックのサンプルのためのアフィン動きベクトルを決定することと、クリッピングされたアフィン動きベクトルを生成するために１つまたは複数のアフィン動きベクトルクリッピングパラメータを使用してアフィン動きベクトルをクリッピングすることと、を行わせる命令を備える。

[0007]別の例示的な例では、ビデオデータをコーディングするための別の装置について説明する。本装置は、ビデオデータから現在のコーディングブロックを取得するための手段と、現在のコーディングブロックのための制御データを決定するための手段と、制御データから１つまたは複数のアフィン動きベクトルクリッピングパラメータを決定するための手段と、現在のコーディングブロックのサンプルを選択するための手段と、現在のコーディングブロックのサンプルのためのアフィン動きベクトルを決定するための手段と、クリッピングされたアフィン動きベクトルを生成するために１つまたは複数のアフィン動きベクトルクリッピングパラメータを使用してアフィン動きベクトルをクリッピングするための手段と、を備える。

[0008]さらなる例示的な例では、ビデオデータをコーディングするための装置について説明する。本装置は、メモリと、メモリに結合された１つまたは複数のプロセッサとを備え、１つまたは複数のプロセッサは、ビデオデータから現在のコーディングブロックを取得することと、現在のコーディングブロックのための制御データを決定することと、制御データから１つまたは複数のアフィン動きベクトルクリッピングパラメータを決定することと、現在のコーディングブロックのサンプルを選択することと、現在のコーディングブロックのサンプルのためのアフィン動きベクトルを決定することと、クリッピングされたアフィン動きベクトルを生成するために１つまたは複数のアフィン動きベクトルクリッピングパラメータを使用してアフィン動きベクトルをクリッピングすることと、を行うように構成される。

[0009]いくつかの態様では、制御データは、フルサンプルユニット中での関連する水平座標と関連する垂直座標とを用いたロケーションと、現在のコーディングブロックの幅を指定する幅変数と、現在のコーディングブロックの高さを指定する高さ変数と、動きベクトルの水平変化と、動きベクトルの垂直変化と、ベーススケーリングされた動きベクトルとを備える。いくつかの例では、制御データは、サンプル中の現在のコーディングブロックに関連するピクチャの高さと、サンプル中のピクチャの幅とをさらに含むことができる。

[0010]いくつかの態様では、１つまたは複数のアフィン動きベクトルクリッピングパラメータは、水平最大変数と、水平最小変数と、垂直最大変数と、垂直最小変数とを備える。いくつかの態様では、水平最小変数は、水平最小ピクチャ値と水平最小動きベクトル値とから選択される最大値によって定義される。

[0011]いくつかの態様では、水平最小ピクチャ値は、関連する水平座標から決定される。いくつかの態様では、水平最小動きベクトル値は、中心動きベクトル値と、ビデオデータに関連する解像度値またはブロックエリアサイズに基づく値のアレイ（たとえば、現在のコーディングブロックの幅×高さ）と、現在のコーディングブロックの幅を指定する幅変数とから決定される。いくつかの態様では、中心動きベクトル値は、ベーススケーリングされた動きベクトルと、動きベクトルの水平変化と、幅変数と、高さ変数とから決定される。いくつかの態様では、ベーススケーリングされた動きベクトルは、現在のコーディングブロックの左上隅に対応し、制御点動きベクトル値から決定される。いくつかの態様では、垂直最大変数は、垂直最大ピクチャ値と垂直最大動きベクトル値とから選択される最小値によって定義される。

[0012]いくつかの態様では、垂直最大ピクチャ値は、ピクチャの高さと、関連する垂直座標と、高さ変数とから決定される。いくつかの態様では、垂直最大動きベクトル値は、中心動きベクトル値と、ビデオデータに関連する解像度値またはブロックエリアサイズに基づく値のアレイ（たとえば、現在のコーディングブロックの幅×高さ）と、現在のコーディングブロックの幅を指定する高さ変数とから決定される。

[0013]いくつかの態様では、例は、ビデオデータから複数の現在のコーディングブロックを連続的に取得することと、複数の現在のコーディングブロックのブロックのためにコーディングブロックごとにアフィン動きベクトルクリッピングパラメータのセットを決定することと、複数の現在のコーディングブロックのためのブロックごとのアフィン動きベクトルクリッピングパラメータのセットを使用して対応する参照ピクチャの部分をフェッチすることとを行う。

[0014]いくつかの態様では、例は、現在のコーディングブロックに関連する参照ピクチャを識別することと、１つまたは複数のアフィン動きベクトルクリッピングパラメータによって定義された参照ピクチャの部分を記憶することとを行う。いくつかの態様では、例は、クリッピングされたアフィン動きベクトルによって示される参照ピクチャからの参照ピクチャデータを使用して現在のコーディングブロックを処理することを行う。

[0015]いくつかの態様では、現在のコーディングブロックのサンプルのためのアフィン動きベクトルは、第１のベーススケーリングされた動きベクトル値と、動きベクトル値の第１の水平変化と、動きベクトル値の第１の垂直変化と、第２のベーススケーリングされた動きベクトル値と、動きベクトル値の第２の水平変化と、動きベクトル値の第２の垂直変化と、サンプルの水平座標と、サンプルの垂直座標とに従って決定される。いくつかのそのような態様では、制御データは、導出表からの値を備える。

[0016]いくつかの態様では、上記で説明された装置は、１つまたは複数のピクチャをキャプチャするためのカメラをもつモバイルデバイスを含むことができる。いくつかの態様では、上記で説明された装置は、１つまたは複数のピクチャを表示するためのディスプレイを含むことができる。本発明の概要は、請求される主題の主要なまたは本質的な特徴を識別するものではなく、請求される主題の範囲を決定するために独立して使用されるものでもない。本主題は、本特許の明細書全体、いずれかまたはすべての図面、および各請求項の適切な部分を参照することによって理解されたい。

[0017]上記のことは、他の特徴および実施形態とともに、以下の明細書、特許請求の範囲、および添付の図面を参照すると、より明らかになろう。

[0018]様々な実装形態の例は、以下の図面を参照しながら以下で詳細に説明される。

[0019]いくつかの例による、符号化デバイスおよび復号デバイスを示すブロック図。 [0020]いくつかの例による、マージモードのための空間隣接動きベクトル候補を示す概念図。 [0021]いくつかの例による、高度動きベクトル予測（ＡＭＶＰ）モードのための空間隣接動きベクトル候補を示す概念図。 [0022]いくつかの例による、時間的動きベクトル予測子（ＴＭＶＰ）候補を示す概念図。 [0023]いくつかの例による、動きベクトルスケーリングを示す概念図。 [0024]いくつかの例による、履歴ベースの動きベクトル予測子（ＨＭＶＰ）表を示す図。 [0025]いくつかの例による、隣接しない空間マージ候補をフェッチすることを示す図。 [0026]いくつかの例による、ＭＶＰ予測において利用される空間的および時間的ロケーションを示す概念図。 [0027]いくつかの例による、ＭＶＰ予測において利用される空間的および時間的ロケーションの態様を示す概念図。 [0028]いくつかの例による、空間ＭＶＰ（Ｓ－ＭＶＰ）のための訪問順序を示す図。 [0029]いくつかの例による、空間的に反転されたパターン代替を示す図。 [0030]いくつかの例による、現在のブロックのための簡略化されたアフィン動きモデルを示す図。 [0031]いくつかの例による、ブロックのサブブロックの動きベクトルフィールドを示す図。 [0032]いくつかの例による、アフィンインター（ＡＦ＿ＩＮＴＥＲ）モードでの動きベクトル予測を示す図。 [0033]いくつかの例による、アフィンマージ（ＡＦ＿ＭＥＲＧＥ）モードでの動きベクトル予測を示す図。いくつかの例による、アフィンマージ（ＡＦ＿ＭＥＲＧＥ）モードでの動きベクトル予測を示す図。 [0034]いくつかの例による、現在のブロックのためのアフィン動きモデルを示す図。 [0035]いくつかの例による、現在のブロックのための別のアフィン動きモデルを示す図。 [0036]いくつかの例による、現在のブロックと候補ブロックとを示す図。 [0037]いくつかの例による、現在のブロック、現在のブロックの制御点、および候補ブロックを示す図。 [0038]いくつかの例による、ＭＰＥＧ５ＥＶＣにおけるアフィンモデルと空間近傍とを示す図。 [0039]いくつかの例による、アフィンモデルと空間近傍との態様を示す図。 [0040]いくつかの例による、アフィンモデルと空間近傍との態様を示す図。 [0041]いくつかの例による、しきい値を使用してクリッピングすることの態様を示す図。 [0042]いくつかの例による、しきい値を使用してクリッピングすることの態様を示す図。 [0043]いくつかの例による、しきい値を使用してクリッピングすることの態様を示す図。 [0044]本明細書で説明される例による、アフィンモデルを用いてコーディングすることのプロセスを示すフローチャート。 [0045]いくつかの例による、ビデオ符号化デバイスを示すブロック図。 [0046]いくつかの例による、ビデオ復号デバイスを示すブロック図。

[0047]本開示のいくつかの態様および実施形態が以下で提供される。当業者に明らかであるように、これらの態様および実施形態のうちのいくつかは独立して適用され得、それらのうちのいくつかは組み合わせて適用され得る。以下の説明では、説明の目的で、本出願の実施形態の完全な理解を与えるために具体的な詳細が記載される。ただし、様々な実施形態は、これらの具体的な詳細なしに実施され得ることが明らかであろう。図および説明は限定するものではない。

[0048]以下の説明は、例示的な実施形態のみを与えるものであり、本開示の範囲、適用性、または構成を限定するものではない。そうではなく、例示的な実施形態の以下の説明は、例示的な実施形態を実装することを可能にする説明を当業者に与える。添付の特許請求の範囲に記載されるように、本出願の趣旨および範囲から逸脱することなく、要素の機能および構成において様々な変更が行われ得ることを理解されたい。

[0049]上述のように、本明細書では、改善されたビデオ処理のための例について説明する。いくつかの例では、ビデオデータを効率的に符号化および復号するためにアフィンコーディングモードを使用するビデオコーディング技法について説明する。アフィンモデルは、ビデオ中のいくつかのタイプの画像動きに関連するフローパターン、詳細には、カメラの動き（たとえば、視点のまたはビデオストリームのための位置をキャプチャする動き）に関連するフローパターンを近似するために使用され得るモデルである。ビデオ処理システムは、アフィン動きモデルを使用してビデオをコーディングするように構成されるアフィンコーディングモードを含むことができる。ビデオコーディングのためのアフィンモードのさらなる詳細について以下で説明する。本明細書で説明される例は、アフィンコーディングモードにおけるメモリ帯域幅の使用を改善することによってビデオコーディングデバイスの動作を改善する動作および構造を含む。いくつかの例では、メモリ帯域幅の改善は、アフィンコーディングモードによって使用される動きベクトルをクリッピングすることによって生成され、これは、アフィンコーディングのために使用される可能な参照エリア（および、たとえば、関連データ）を制限することによってローカルバッファにおいて使用されるデータを低減することができる。

[0050]いくつかのシステムは、アフィンコーディングのためのフィルタサンプルをフェッチするために使用されるメモリアクセス動作の数を大幅に増加させることができるサンプルごとの動きベクトル生成を使用する。多数のフェッチ動作は、ローカルバッファが参照データに適応することが可能な場合にシステムによって扱われ得るが、各フェッチのための参照データが大きい（たとえば、復号ピクチャバッファのためのサイズなどのローカルバッファサイズを超える）場合、メモリ帯域幅の使用は、システムパフォーマンスを劣化させる可能性がある。参照ピクチャのアクセスに関連するメモリ帯域幅の使用を制限することによって、多数のフェッチ動作が、劣化したメモリ帯域幅のパフォーマンスなしに使用され、それによって、デバイス動作を改善し得る。本明細書で説明される例は、より大きいビデオコーディングシステムのコンテキスト内で、ビデオコーディングデバイスの部分としてそのような利益を与えることができる。

[0051]ビデオコーディングデバイスは、ビデオデータを効率的に符号化および復号するためのビデオ圧縮技法を実装する。ビデオ圧縮技法は、ビデオシーケンスに固有の冗長を低減または除去するために、空間予測（たとえば、イントラフレーム予測またはイントラ予測）、時間予測（たとえば、インターフレーム予測またはインター予測）、（ビデオデータの異なるレイヤにわたる）レイヤ間予測、および／または他の予測技法を含む、異なる予測モードを適用することを含み得る。ビデオエンコーダは、元のビデオシーケンスの各ピクチャを（以下でより詳細に説明される）ビデオブロックまたはコーディングユニットと呼ばれる矩形領域に区分することができる。これらのビデオブロックは、特定の予測モードを使用して符号化され得る。

[0052]ビデオブロックは、１つまたは複数のやり方で、より小さいブロックの１つまたは複数のグループに分割され得る。ブロックは、コーディングツリーブロック、予測ブロック、変換ブロック、および／または他の好適なブロックを含むことができる。概して「ブロック」への言及は、別段に規定されていない限り、そのようなビデオブロック（たとえば、当業者によって理解されるように、コーディングツリーブロック、コーディングブロック、予測ブロック、変換ブロック、または他の適切なブロックもしくはサブブロック）を指すことがある。さらに、これらのブロックの各々はまた、本明細書では、互換的に「ユニット」（たとえば、コーディングツリーユニット（ＣＴＵ）、コーディングユニット、予測ユニット（ＰＵ）、変換ユニット（ＴＵ）など）と呼ばれることがある。いくつかの場合には、ユニットは、ビットストリーム中で符号化されるコーディング論理ユニットを示し得、ブロックは、プロセスがターゲットとするビデオフレームバッファの一部分を示し得る。

[0053]インター予測モードの場合、ビデオエンコーダは、参照フレームまたは参照ピクチャと呼ばれる、別の時間ロケーション中にあるフレーム（またはピクチャ）中で符号化されているブロックと同様のブロックを探索することができる。ビデオエンコーダは、その探索を、符号化されるべきブロックからのある空間変位に制限し得る。最良マッチが、水平変位成分と垂直変位成分とを含む２次元（２Ｄ）動きベクトルを使用して特定され得る。イントラ予測モードの場合、ビデオエンコーダは、同じピクチャ内の前に符号化された隣接ブロックからのデータに基づいて、空間予測技法を使用して、予測されたブロックを形成し得る。

[0054]ビデオエンコーダは予測誤差を決定し得る。たとえば、予測は、符号化されているブロック中のピクセル値と予測されたブロック中のピクセル値との間の差分として決定され得る。予測誤差は残差と呼ばれることもある。ビデオエンコーダはまた、変換係数を生成するために変換符号化を使用して（たとえば、離散コサイン変換（ＤＣＴ）の形態、離散サイン変換（ＤＳＴ）の形態、または他の好適な変換を使用して）予測誤差に変換を適用し得る。変換の後に、ビデオエンコーダは変換係数を量子化し得る。量子化変換係数と動きベクトルとは、シンタックス要素を使用して表され、制御情報とともに、ビデオシーケンスのコード化表現を形成し得る。いくつかの事例では、ビデオエンコーダはシンタックス要素をエントロピーコーディングし、それにより、さらに、それらの表現のために必要とされるビット数を低減し得る。

[0055]ビデオデコーダは、上記で説明されたシンタックス要素および制御情報を使用して、現在のフレームを復号するための予測データ（たとえば、予測ブロック）を構築し得る。たとえば、ビデオデコーダは、予測されたブロックと圧縮された予測誤差とを加え得る。ビデオデコーダは、量子化係数を使用して変換基底関数を重み付けすることによって、圧縮された予測誤差を決定し得る。再構築されたフレームと元のフレームとの間の差分は、再構築誤差と呼ばれる。

[0056]以下でより詳細に説明されるように、本明細書では、履歴ベースの動きベクトル予測に改善を与えるための（「システムおよび技法」と総称される）システム、装置、方法（プロセスとも呼ばれる）、およびコンピュータ可読媒体について説明する。本明細書で説明されるシステムおよび技法は、ビデオがブロックごとに再構築される様々なブロックベースのビデオコーディング技法のうちの１つまたは複数に適用され得る。たとえば、本明細書で説明されるシステムおよび技法は、既存のビデオコーデック（たとえば、高効率ビデオコーディング（ＨＥＶＣ）、アドバンストビデオコーディング（ＡＶＣ）、または他の好適な既存のビデオコーデック）のいずれかに適用され得るか、ならびに／あるいは、たとえば、汎用ビデオコーディング（ＶＶＣ）、共同探査モデル（ＪＥＭ）、ＶＰ９、ＡＶ１、エッセンシャルビデオコーディング（ＥＶＣ）、および／または開発中のもしくは開発されることになる他のビデオコーディング規格など、任意の開発されているビデオコーディング規格および／または将来のビデオコーディング規格のための効率的なコーディングツールであり得る。

[0057]本明細書では説明されるシステムおよび技法の様々な態様について、図に関して本明細書で説明する。図１は、本明細書で説明される例による、アフィンコーディングモードで動作することができる符号化デバイス１０４と復号デバイス１１２とを含むシステム１００の一例を示すブロック図である。符号化デバイス１０４はソースデバイスの一部であり得、復号デバイス１１２は（クライアントデバイスとも呼ばれる）受信デバイスの一部であり得る。ソースデバイスおよび／または受信デバイスは、モバイルもしくは固定電話ハンドセットなどの電子デバイス（たとえば、スマートフォン、セルラー電話など）、デスクトップコンピュータ、ラップトップもしくはノートブックコンピュータ、タブレットコンピュータ、セットトップボックス、テレビジョン、カメラ、ディスプレイデバイス、デジタルメディアプレーヤ、ビデオゲームコンソール、インターネットプロトコル（ＩＰ）カメラ、１つもしくは複数のサーバデバイスを含むサーバシステム中のサーバデバイス（たとえば、ビデオストリーミングサーバシステムもしくは他の好適なサーバシステム）、ヘッドマウントディスプレイ（ＨＭＤ）、ヘッドアップディスプレイ（ＨＵＤ）、スマートグラス（たとえば、仮想現実（ＶＲ）グラス、拡張現実（ＡＲ）グラス、もしくは他のスマートグラス）、または任意の他の好適な電子デバイスを含み得る。

[0058]システム１００の構成要素は、電子回路もしくは他の電子ハードウェアを含むことができ、および／またはこれらを使用して実装されることが可能であり、これは、１つもしくは複数のプログラム可能な電子回路（たとえば、マイクロプロセッサ、グラフィック処理ユニット（ＧＰＵ）、デジタル信号プロセッサ（ＤＳＰ）、中央処理装置（ＣＰＵ）、および／または他の適切な電子回路）を含むことができ、ならびに／または、本明細書において説明される様々な動作を実施するためのコンピュータソフトウェア、ファームウェア、もしくはこれらの任意の組合せを含むことができ、および／もしくは、これらを使用して実装され得る。

[0059]システム１００がいくつかの構成要素を含むように示されているが、システム１００が図１に示されている構成要素よりも多いまたは少ない構成要素を含むことができることを、当業者は諒解されよう。たとえば、システム１００はまた、いくつかの例では、記憶装置１０８および記憶装置１１８以外の１つもしくは複数のメモリデバイス（たとえば、１つもしくは複数のランダムアクセスメモリ（ＲＡＭ）構成要素、読取り専用メモリ（ＲＯＭ）構成要素、キャッシュメモリ構成要素、バッファ構成要素、データベース構成要素、および／もしくは他のメモリデバイス）、１つもしくは複数のメモリデバイスと通信しているおよび／またはそれに電気的に接続された１つもしくは複数の処理デバイス（たとえば、１つもしくは複数のＣＰＵ、ＧＰＵ、および／もしくは他の処理デバイス）、ワイヤレス通信を実施するための（たとえば、各ワイヤレスインターフェースのための１つもしくは複数のトランシーバとベースバンドプロセッサとを含む）１つもしくは複数のワイヤレスインターフェース、１つもしくは複数の有線接続を介した通信を実施するための１つもしくは複数のワイヤードインターフェース（たとえば、ユニバーサルシリアルバス（ＵＳＢ）入力などのシリアルインターフェース、ライトニングコネクタ、および／もしくは他のワイヤードインターフェース）、ならびに／または図１に示されていない他の構成要素を含むことができる。

[0060]本明細書で説明されるコーディング技法は、（たとえば、インターネットを介した）ストリーミングビデオ送信、テレビジョン放送もしくは送信、データ記憶媒体上に記憶するためのデジタルビデオの符号化、データ記憶媒体上に記憶されたデジタルビデオの復号、または他の適用例を含む、様々なマルチメディア適用例におけるビデオコーディングに適用可能である。いくつかの例では、システム１００は、ビデオ会議、ビデオストリーミング、ビデオ再生、ビデオブロードキャスティング、ゲーム、および／またはビデオテレフォニーなどの適用例をサポートするために、一方向または双方向のビデオ送信をサポートすることができる。

[0061]符号化デバイス１０４（またはエンコーダ）は、符号化ビデオビットストリームを生成するためにビデオコーディング規格またはプロトコルを使用してビデオデータを符号化するために使用され得る。ビデオコーディング規格の例は、ＩＴＵ－ＴＨ．２６１、ＩＳＯ／ＩＥＣＭＰＥＧ－１Ｖｉｓｕａｌ、ＩＴＵ－ＴＨ．２６２またはＩＳＯ／ＩＥＣＭＰＥＧ－２Ｖｉｓｕａｌ、ＩＴＵ－ＴＨ．２６３、ＩＳＯ／ＩＥＣＭＰＥＧ－４Ｖｉｓｕａｌ、そのスケーラブルビデオコーディング（ＳＶＣ）拡張とマルチビュービデオコーディング（ＭＶＣ）拡張とを含む（ＩＳＯ／ＩＥＣＭＰＥＧ－４ＡＶＣとしても知られる）ＩＴＵ－ＴＨ．２６４、および高効率ビデオコーディング（ＨＥＶＣ）またはＩＴＵ－ＴＨ．２６５を含む。範囲およびスクリーンコンテンツコーディング拡張、３Ｄビデオコーディング（３Ｄ－ＨＥＶＣ）ならびにマルチビュー拡張（ＭＶ－ＨＥＶＣ）ならびにスケーラブル拡張（ＳＨＶＣ）を含む、マルチレイヤビデオコーディングに対処するＨＥＶＣへの様々な拡張が存在する。ＨＥＶＣおよびそれの拡張は、ＩＴＵ－Ｔビデオコーディングエキスパートグループ（ＶＣＥＧ）およびＩＳＯ／ＩＥＣモーションピクチャエキスパートグループ（ＭＰＥＧ）の共同コラボレーションチームオンビデオコーディング（ＪＣＴ－ＶＣ）ならびに共同コラボレーションチームオン３Ｄビデオコーディング拡張開発（ＪＣＴ－３Ｖ）によって開発された。

[0062]ＭＰＥＧとＩＴＵ－ＴＶＣＥＧとはまた、汎用ビデオコーディング（ＶＶＣ）という名前の次世代のビデオコーディング規格のための新しいビデオコーディングツールを調査および開発するために共同調査ビデオチーム（ＪＶＥＴ）を編成した。参照ソフトウェアは、ＶＶＣテストモデル（ＶＴＭ）と呼ばれる。ＶＶＣの目的は、（たとえば、特に、３６０°全方向没入型マルチメディア、高ダイナミックレンジ（ＨＤＲ）ビデオなど）より高品質のビデオサービスおよび新生のアプリケーションの展開を助ける、既存のＨＥＶＣ規格を超える圧縮性能における顕著な改善を提供することである。ＶＰ９、ＡｌｌｉａｎｃｅｏｆＯｐｅｎＭｅｄｉａ（ＡＯＭｅｄｉａ）Ｖｉｄｅｏ１（ＡＶ１）およびエッセンシャルビデオコーディング（ＥＶＣ）は、本明細書で説明される技法が適用され得る他のビデオコーディング規格である。

[0063]本明細書で説明される多くの実施形態は、ＶＴＭ、ＶＶＣ、ＨＥＶＣ、ＡＶＣ、および／またはそれらの拡張などのビデオコーデックを使用して実施され得る。しかしながら、本明細書で説明される技法およびシステムは、ＭＰＥＧ、ＪＰＥＧ（または静止画像のための他のコーディング規格）、ＶＰ９、ＡＶ１、それらの拡張、あるいはすでに利用可能であるか、またはまだ利用可能ではないか、もしくは開発されていない他の好適なコーディング規格など、他のコーディング規格にも適用可能であり得る。したがって、本明細書で説明される技法およびシステムは、特定のビデオコーディング規格を参照しながら説明され得るが、当業者は、説明がその特定の規格にのみ適用されると解釈されるべきではないことを諒解されよう。

[0064]図１を参照すると、ビデオソース１０２は、符号化デバイス１０４にビデオデータを与え得る。ビデオソース１０２は、ソースデバイスの一部であり得るか、またはソースデバイス以外のデバイスの一部であり得る。ビデオソース１０２は、ビデオキャプチャデバイス（たとえば、ビデオカメラ、カメラフォン、ビデオフォンなど）、記憶されたビデオを含んでいるビデオアーカイブ、ビデオデータを与えるビデオサーバもしくはコンテンツプロバイダ、ビデオサーバもしくはコンテンツプロバイダからビデオを受信するビデオフィードインターフェース、コンピュータグラフィックスビデオデータを生成するためのコンピュータグラフィックスシステム、そのようなソースの組合せ、または任意の他の好適なビデオソースを含み得る。

[0065]ビデオソース１０２からのビデオデータは、１つまたは複数の入力ピクチャを含み得る。ピクチャは、「フレーム」と呼ばれることもある。ピクチャまたはフレームは、いくつかの場合には、ビデオの一部である静止画像である。いくつかの例では、ビデオソース１０２からのデータは、ビデオの一部でない静止画像であり得る。ＨＥＶＣ、ＶＶＣ、および他のビデオコーディング仕様では、ビデオシーケンスは、一連のピクチャを含むことができる。ピクチャは、Ｓ_L、Ｓ_CbおよびＳ_Crと示される、３つのサンプルアレイを含み得る。Ｓ_Lはルーマサンプルの２次元アレイであり、Ｓ_CbはＣｂクロミナンスサンプルの２次元アレイであり、Ｓ_CrはＣｒクロミナンスサンプルの２次元アレイである。クロミナンスサンプルは、本明細書では「クロマ」サンプルと呼ばれることもある。他の事例では、ピクチャは、モノクロームであり得、ルーマサンプルのアレイのみを含み得る。

[0066]符号化デバイス１０４のエンコーダエンジン１０６（またはエンコーダ）は、符号化されたビデオビットストリームを生成するためにビデオデータを符号化する。いくつかの例では、符号化ビデオビットストリーム（または「ビデオビットストリーム」または「ビットストリーム」）は、一連の１つまたは複数のコード化ビデオシーケンスである。コード化ビデオシーケンス（ＣＶＳ）は、ベースレイヤ中の、いくつかのプロパティをもつランダムアクセスポイントピクチャを有するアクセスユニット（ＡＵ）で始まり、ベースレイヤ中の、いくつかのプロパティをもつランダムアクセスポイントピクチャを有する次のＡＵまでの、次のＡＵを含まない一連のＡＵを含む。たとえば、ＣＶＳを開始するランダムアクセスポイントピクチャのいくつかのプロパティは、１に等しいＲＡＳＬフラグ（たとえば、ＮｏＲａｓｌＯｕｔｐｕｔＦｌａｇ）を含み得る。他の場合、（０に等しいＲＡＳＬフラグをもつ）ランダムアクセスポイントピクチャはＣＶＳを開始しない。アクセスユニット（ＡＵ）は、１つまたは複数のコード化ピクチャと、同じ出力時間を共有するコード化ピクチャに対応する制御情報とを含む。ピクチャのコード化スライスは、ビットストリームレベルにおいて、ネットワークアブストラクションレイヤ（ＮＡＬ）ユニットと呼ばれるデータユニット中にカプセル化される。たとえば、ＨＥＶＣビデオビットストリームは、ＮＡＬユニットを含む１つまたは複数のＣＶＳを含み得る。ＮＡＬユニットの各々はＮＡＬユニットヘッダを有する。一例では、ヘッダは、（マルチレイヤ拡張を除いて）Ｈ．２６４／ＡＶＣでは１バイトであり、ＨＥＶＣでは２バイトである。ＮＡＬユニットヘッダ中のシンタックス要素は、指定されたビットをとり、したがって、特にトランスポートストリーム、リアルタイムトランスポート（ＲＴＰ）プロトコル、ファイルフォーマットなど、すべての種類のシステムおよびトランスポートレイヤに可視である。

[0067]ビデオコーディングレイヤ（ＶＣＬ）ＮＡＬユニットと非ＶＣＬＮＡＬユニットとを含む、ＮＡＬユニットの２つのクラスがＨＥＶＣ規格に存在する。ＶＣＬＮＡＬユニットは、コード化ビデオビットストリームを形成するコード化ピクチャデータを含む。たとえば、コード化ビデオビットストリームを形成するビットのシーケンスは、ＶＣＬＮＡＬユニット中に存在する。ＶＣＬＮＡＬユニットは、コード化ピクチャデータの（以下で説明される）１つのスライスまたはスライスセグメントを含むことができ、非ＶＣＬＮＡＬユニットは、１つまたは複数のコード化ピクチャに関係する制御情報を含む。いくつかの場合には、ＮＡＬユニットはパケットと呼ばれることがある。ＨＥＶＣＡＵは、コード化ピクチャデータを含んでいるＶＣＬＮＡＬユニットと、（もしあれば）コード化ピクチャデータに対応する非ＶＣＬＮＡＬユニットとを含む。非ＶＣＬＮＡＬユニットは、他の情報に加えて、符号化ビデオビットストリームに関係する高レベル情報をもつパラメータセットを含んでいることがある。たとえば、パラメータセットは、ビデオパラメータセット（ＶＰＳ）と、シーケンスパラメータセット（ＳＰＳ）と、ピクチャパラメータセット（ＰＰＳ）とを含み得る。場合によっては、ビットストリームの各スライスまたは他の部分は、復号デバイス１１２がビットストリームのスライスまたは他の部分を復号するために使用され得る情報にアクセスすることを可能にするために単一のアクティブなＰＰＳ、ＳＰＳ、および／またはＶＰＳを参照することができる。

[0068]ＮＡＬユニットは、ビデオ中のピクチャのコード化表現など、ビデオデータのコード化表現を形成するビットのシーケンス（たとえば、符号化ビデオビットストリーム、ビットストリームのＣＶＳなど）を含んでいることがある。エンコーダエンジン１０６は、各ピクチャを複数のスライスに区分することによってピクチャのコード化表現を生成する。スライスは、スライス中の情報が、同じピクチャ内の他のスライスからのデータへの依存性なしにコーディングされるように、他のスライスから独立している。スライスは、独立しているスライスセグメントを含む１つまたは複数のスライスセグメントと、存在する場合、前のスライスセグメントに依存する１つまたは複数の依存するスライスセグメントとを含む。

[0069]ＨＥＶＣでは、スライスは、ルーマサンプルおよびクロマサンプルのコーディングツリーブロック（ＣＴＢ）に区分される。ルーマサンプルのＣＴＢおよびクロマサンプルの１つまたは複数のＣＴＢは、サンプルのためのシンタックスとともに、コーディングツリーユニット（ＣＴＵ）と呼ばれる。ＣＴＵは、「ツリーブロック」または「最大コーディングユニット」（ＬＣＵ）とも呼ばれることもある。ＣＴＵは、ＨＥＶＣ符号化のための基本処理ユニットである。ＣＴＵは、様々なサイズの複数のコーディングユニット（ＣＵ）にスプリットされ得る。ＣＵは、コーディングブロック（ＣＢ）と呼ばれるルーマおよびクロマサンプルアレイを含んでいる。

[0070]ルーマおよびクロマＣＢは、予測ブロック（ＰＢ）にさらにスプリットされ得る。ＰＢは、（利用可能なとき、または使用のために有効にされたとき）インター予測またはイントラブロックコピー（ＩＢＣ）予測のために同じ動きパラメータを使用するルーマ成分またはクロマ成分のサンプルのブロックである。ルーマＰＢおよび１つまたは複数のクロマＰＢは、関連するシンタックスとともに、予測ユニット（ＰＵ）を形成する。インター予測の場合、動きパラメータのセット（たとえば、１つまたは複数の動きベクトル、参照インデックスなど）は、ＰＵごとにビットストリーム中でシグナリングされ、ルーマＰＢおよび１つまたは複数のクロマＰＢのインター予測のために使用される。動きパラメータは動き情報と呼ばれることもある。ＣＢはまた、１つまたは複数の変換ブロック（ＴＢ）に区分され得る。ＴＢは、予測残差信号をコーディングするために残差変換（たとえば、場合によっては、同じ２次元変換）が適用される色成分のサンプルの正方形ブロックを表現する。変換ユニット（ＴＵ）は、ルーマおよびクロマサンプルのＴＢと、対応するシンタックス要素とを表現する。変換コーディングについては、以下でより詳細に説明する。

[0071]ＣＵのサイズは、コーディングモードのサイズに対応し、形状が正方形であり得る。たとえば、ＣＵのサイズは、８×８サンプル、１６×１６サンプル、３２×３２サンプル、６４×６４サンプル、または対応するＣＴＵのサイズまでの任意の他の適切なサイズであり得る。「Ｎ×Ｎ」という句は、本明細書では、垂直寸法および水平寸法に関するビデオブロックのピクセル寸法（たとえば、８ピクセル×８ピクセル）を指すために使用される。ブロック中のピクセルは行および列に配置され得る。いくつかの実施形態では、ブロックは、水平方向において垂直方向と同じ数のピクセルを有するとは限らない。ＣＵに関連するシンタックスデータは、たとえば、１つまたは複数のＰＵへのＣＵの区分を記述し得る。区分モードは、ＣＵがイントラ予測モード符号化されるか、それともインター予測モード符号化されるかの間で異なる場合がある。ＰＵは、形状が非正方形に区分され得る。ＣＵに関連付けられるシンタックスデータは、たとえば、ＣＴＵに従う１つまたは複数のＴＵへのＣＵの区分をも記述し得る。ＴＵは、形状が正方形または非正方形であり得る。

[0072]ＨＥＶＣ規格によれば、変換は、変換ユニット（ＴＵ）を使用して実施され得る。ＴＵは、異なるＣＵでは異なり得る。ＴＵは、所与のＣＵ内のＰＵのサイズに基づいてサイズ決定され得る。ＴＵは、ＰＵと同じサイズであるか、またはＰＵよりも小さいことがある。いくつかの例では、ＣＵに対応する残差サンプルは、残差４分木（ＲＱＴ）として知られる４分木構造を使用して、より小さいユニットに再分割され得る。ＲＱＴのリーフノードはＴＵに対応し得る。ＴＵに関連するピクセル差分値は、変換係数を作り出すために変換され得る。変換係数は、エンコーダエンジン１０６によって量子化され得る。

[0073]ビデオデータのピクチャがＣＵに区分されると、エンコーダエンジン１０６は、予測モードを使用して各ＰＵを予測する。予測ユニットまたは予測ブロックは、（以下で説明される）残差を得るために元のビデオデータから減算される。ＣＵごとに、シンタックスデータを使用してビットストリーム内で予測モードがシグナリングされ得る。予測モードは、イントラ予測（もしくはピクチャ内予測）またはインター予測（もしくはピクチャ間予測）を含み得る。イントラ予測は、ピクチャ内の空間的に隣接するサンプル間の相関を利用する。たとえば、イントラ予測を使用して、各ＰＵは、たとえば、ＰＵに関する平均値を見つけるためのＤＣ予測、平坦面をＰＵに適合させるための平面予測、隣接データから外挿するための方向予測、または任意の他の好適なタイプの予測を使用して、同じピクチャ中の隣接画像データから予測される。インター予測は、画像サンプルのブロックについての動き補償予測を導出するためにピクチャ間の時間相関を使用する。たとえば、インター予測を使用して、各ＰＵは、（出力順序において現在ピクチャの前または後の）１つまたは複数の参照ピクチャ中の画像データからの動き補償予測を使用して予測される。ピクチャ間予測を使用してピクチャエリアをコーディングすべきなのか、ピクチャ内予測を使用してピクチャエリアをコーディングすべきなのかの決定は、たとえば、ＣＵレベルにおいて行われ得る。

[0074]エンコーダエンジン１０６および（以下でより詳細に説明される）デコーダエンジン１１６は、ＶＶＣに従って動作するように構成され得る。ＶＶＣによれば、（エンコーダエンジン１０６および／またはデコーダエンジン１１６などの）ビデオコーダは、ピクチャを複数のコーディングツリーユニット（ＣＴＵ）に区分する（ここで、ルーマサンプルのＣＴＢとクロマサンプルの１つまたは複数のＣＴＢとが、サンプルのためのシンタックスとともに、ＣＴＵと呼ばれる）。ビデオコーダは、４分木２分木（ＱＴＢＴ）構造またはマルチタイプツリー（ＭＴＴ）構造など、ツリー構造に従ってＣＴＵを区分することができる。ＱＴＢＴ構造は、ＨＥＶＣのＣＵとＰＵとＴＵとの間の分離など、複数の区分タイプの概念を除去する。ＱＴＢＴ構造は、４分木区分に従って区分される第１のレベルと、２分木区分に従って区分される第２のレベルとを含む、２つのレベルを含む。ＱＴＢＴ構造のルートノードは、ＣＴＵに対応する。２分木のリーフノードは、コーディングユニット（ＣＵ）に対応する。

[0075]ＭＴＴ区分構造では、ブロックは、４分木区分と、２分木区分と、１つまたは複数のタイプのトリプルツリー区分とを使用して区分され得る。トリプルツリー区分は、ブロックが３つのサブブロックにスプリットされる区分である。いくつかの例では、トリプルツリー区分は、中心を通って元のブロックを分割することなしに、ブロックを３つのサブブロックに分割する。ＭＴＴにおける区分タイプ（たとえば、４分木、２分木、およびトリプルツリー）は、対称的または非対称的であり得る。

[0076]いくつかの例では、ビデオコーダは、ルミナンス成分とクロミナンス成分との各々を表現するために単一のＱＴＢＴまたはＭＴＴ構造を使用することができ、他の例では、ビデオコーダは、ルミナンス成分のための１つのＱＴＢＴまたはＭＴＴ構造、および両方のクロミナンス成分のための別のＱＴＢＴまたはＭＴＴ構造（またはそれぞれのクロミナンス成分のための２つのＱＴＢＴおよび／またはＭＴＴ構造）など、２つ以上のＱＴＢＴまたはＭＴＴ構造を使用することができる。

[0077]ビデオコーダは、ＨＥＶＣによる４分木区分、ＱＴＢＴ区分、ＭＴＴ区分、または他の区分構造を使用するように構成され得る。説明の目的で、本明細書の説明は、ＱＴＢＴ区分を指すことがある。しかしながら、本開示の技法は、４分木区分、または同様に他のタイプの区分を使用するように構成されたビデオコーダにも適用され得ることを理解されたい。

[0078]いくつかの例では、ピクチャの１つまたは複数のスライスは、スライスタイプを割り当てられる。スライスタイプは、イントラコード化スライス（Ｉスライス）と、インターコード化Ｐスライスと、インターコード化Ｂスライスとを含む。Ｉスライス（イントラコード化フレーム、独立して復号可能）は、イントラ予測によってのみコーディングされるピクチャのスライスであり、したがって、Ｉスライスは、スライスの任意の予測ユニットまたは予測ブロックを予測するためにフレーム内のデータのみを必要とするので、独立して復号可能である。Ｐスライス（単方向予測されるフレーム）は、イントラ予測を用いて、および単方向インター予測を用いてコーディングされ得るピクチャのスライスである。Ｐスライス内の各予測ユニットまたは予測ブロックは、イントラ予測またはインター予測のいずれかを用いてコーディングされる。インター予測が適用されるとき、予測ユニットまたは予測ブロックは、１つの参照ピクチャによってのみ予測され、したがって、参照サンプルは、１つのフレームの１つの参照領域からのみのものである。Ｂスライス（双方向予測フレーム）は、イントラ予測を用いて、およびインター予測（たとえば、双予測または単予測のいずれか）を用いてコーディングされ得るピクチャのスライスである。Ｂスライスの予測ユニットまたは予測ブロックは、２つの参照ピクチャから双方向予測され得、ここで、各ピクチャが１つの参照領域を導き、双方向予測されたブロックの予測信号を作り出すために、２つの参照領域のサンプルセットが（たとえば、等しい重みを用いて、または異なる重みを用いて）重み付けされる。上記で説明されたように、１つのピクチャのスライスが独立してコーディングされる。いくつかの場合には、ピクチャは、ただ１つのスライスとしてコーディングされ得る。

[0079]上記のように、ピクチャ内予測は、ピクチャ内の空間的に隣接するサンプル間の相関を利用する。（「イントラモード」とも呼ばれる）複数のイントラ予測モードがある。いくつかの例では、ルーマブロックのイントラ予測は、平面モードと、ＤＣモードと、３３個の角モード（たとえば、対角イントラ予測モードおよび対角イントラ予測モードに隣接する角モード）とを含む３５個のモードを含む。イントラ予測の３５個のモードは、以下で表１に示されているようにインデックス付けされる。他の例では、３３個の角モードによってまだ表されていない予測角度を含むより多くのイントラモードが定義され得る。他の例では、角モードに関連する予測角度は、ＨＥＶＣにおいて使用されるものとは異なり得る。

[0080]ピクチャ間予測は、画像サンプルのブロックについての動き補償予測を導出するためにピクチャ間の時間相関を使用する。並進運動モデルを使用して、前に復号されたピクチャ（参照ピクチャ）中のブロックの位置は、動きベクトル（Δｘ，Δｙ）によって示され、Δｘは、現在ブロックの位置に対する参照ブロックの水平変位を指定し、Δｙはその垂直変位を指定する。いくつかの場合には、動きベクトル（Δｘ，Δｙ）は、（整数精度とも呼ばれる）整数サンプル精度であり得、その場合、動きベクトルは、参照フレームの整数ペルグリッド（または整数ピクセルサンプリンググリッド）を指す。いくつかの場合には、動きベクトル（Δｘ，Δｙ）は、参照フレームの整数ペルグリッドに制限されることなしに、基礎をなすオブジェクトの移動をより正確にキャプチャするために、（分数ペル精度または非整数精度とも呼ばれる）分数サンプル精度のものであり得る。動きベクトルの精度は、動きベクトルの量子化レベルによって表され得る。たとえば、量子化レベルは、整数精度（たとえば、１ピクセル）または分数ペル精度（たとえば、１／４ピクセル、１／２ピクセル、または他のサブピクセル値）であり得る。対応する動きベクトルが分数サンプル精度を有するとき、予測信号を導出するために、参照ピクチャに補間が適用される。たとえば、整数位置において利用可能なサンプルは、分数位置における値を推定するために、（たとえば、１つまたは複数の補間フィルタを使用して）フィルタ処理され得る。前に復号された参照ピクチャは、参照ピクチャリストへの参照インデックス（ｒｅｆＩｄｘ）によって示される。動きベクトルおよび参照インデックスは、動きパラメータと呼ばれることがある。単予測と双予測とを含む、２つの種類のピクチャ間予測が実施され得る。

[0081]双予測を使用するインター予測の場合、動きパラメータの２つのセット（Δｘ₀、Δｙ₀、ｒｅｆＩｄｘ₀、および、Δｘ₁、Δｙ₁、ｒｅｆＩｄｘ₁）が、（同じ参照ピクチャから、または場合によっては異なる参照ピクチャから）２つの動き補償予測を生成するために使用される。たとえば、双予測の場合、各予測ブロックは、２つの動き補償予測信号を使用し、Ｂ予測ユニットを生成する。２つの動き補償予測は、最終の動き補償予測を得るために組み合わせられる。たとえば、２つの動き補償予測は、平均化によって組み合わせられ得る。別の例では、重み付け予測が使用され得、その場合、異なる重みが、各動き補償予測に適用され得る。双予測において使用され得る参照ピクチャは、リスト０およびリスト１として示される、２つの別個のリストに記憶される。動きパラメータは、動き推定プロセスを使用してエンコーダにおいて導出され得る。

[0082]単予測を使用するインター予測の場合、動きパラメータ（Δｘ₀，Δｙ₀，ｒｅｆＩｄｘ₀）の１つのセットが、参照ピクチャから動き補償予測を生成するために使用される。たとえば、単予測の場合、各予測ブロックは、高々１つの動き補償予測信号を使用し、Ｐ予測ユニットを生成する。

[0083]ＰＵは、予測プロセスに関係するデータ（たとえば、動きパラメータまたは他の好適なデータ）を含み得る。たとえば、ＰＵがイントラ予測を使用して符号化されるとき、ＰＵは、ＰＵのためのイントラ予測モードを記述するデータを含み得る。別の例として、ＰＵがインター予測を使用して符号化されるとき、ＰＵは、ＰＵのための動きベクトルを定義するデータを含み得る。ＰＵのための動きベクトルを定義するデータは、たとえば、動きベクトルの水平成分（Δｘ）、動きベクトルの垂直成分（Δｙ）、動きベクトルの解像度（たとえば、整数精度、１／４ピクセル精度、または１／８ピクセル精度）、動きベクトルが指す参照ピクチャ、参照インデックス、動きベクトルのための参照ピクチャリスト（たとえば、リスト０、リスト１、またはリストＣ）、またはそれらの任意の組合せを記述し得る。

[0084]イントラ予測および／またはインター予測を使用して予測を実行した後に、符号化デバイス１０４は、変換および量子化を実施することができる。たとえば、予測の後に、エンコーダエンジン１０６は、ＰＵに対応する残差値を計算し得る。残差値は、コーディングされているピクセルの現在ブロック（ＰＵ）と、現在ブロックを予測するために使用される予測ブロック（たとえば、現在ブロックの予測されたバージョン）との間のピクセル差分値を備え得る。たとえば、（たとえば、インター予測またはイントラ予測を使用して）予測ブロックを生成した後に、エンコーダエンジン１０６は、現在ブロックから、予測ユニットによって作り出された予測ブロックを減算することによって、残差ブロックを生成することができる。残差ブロックは、現在ブロックのピクセル値と予測ブロックのピクセル値との間の差分を定量化するピクセル差分値のセットを含む。いくつかの例では、残差ブロックは、２次元ブロックフォーマット（たとえば、ピクセル値の２次元行列またはアレイ）で表され得る。そのような例では、残差ブロックはピクセル値の２次元表現である。

[0085]予測が実施された後に残存し得るいずれの残差データも、離散コサイン変換（ＤＣＴ）、離散サイン変換（ＤＳＴ）、整数変換、ウェーブレット変換、他の好適な変換関数、またはそれらの任意の組合せに基づき得るブロック変換を使用して変換される。いくつかの場合には、１つまたは複数のブロック変換（たとえば、サイズ３２×３２、１６×１６、８×８、４×４、または他の好適なサイズのカーネル）が各ＣＵにおける残差データに適用され得る。いくつかの例では、エンコーダエンジン１０６によって実装される変換および量子化プロセスのためにＴＵが使用され得る。１つまたは複数のＰＵを有する所与のＣＵは、１つまたは複数のＴＵをも含み得る。以下でさらに詳細に説明されるように、残差値は、ブロック変換を使用して変換係数に変換され得、エントロピーコーディングのためのシリアル化変換係数を作り出すために、ＴＵを使用して量子化および走査され得る。

[0086]いくつかの実施形態では、ＣＵのＰＵを使用したイントラ予測コーディングまたはインター予測コーディングの後に、エンコーダエンジン１０６は、ＣＵのＴＵのための残差データを計算し得る。ＰＵは、空間領域（またはピクセル領域）においてピクセルデータを備え得る。前記のように、残差データは、符号化されていないピクチャのピクセルとＰＵに対応する予測値との間のピクセル差分値に対応し得る。エンコーダエンジン１０６は、（ＰＵを含む）ＣＵのための残差データを含む１つまたは複数のＴＵを形成し得、ＣＵのための変換係数を生成するためにＴＵを変換し得る。ＴＵは、ブロック変換の適用の後に変換領域において係数を備え得る。

[0087]エンコーダエンジン１０６は、変換係数の量子化を実施し得る。量子化は、係数を表すために使用されるデータの量を低減するために変換係数を量子化することによって、さらなる圧縮を与える。たとえば、量子化は、係数の一部または全部に関連するビット深度を低減し得る。一例では、ｎビット値をもつ係数は、量子化中にｍビット値に切り捨てられ得、ｎはｍよりも大きい。

[0088]量子化が実施されると、コード化ビデオビットストリームは、量子化変換係数と、予測情報（たとえば、予測モード、動きベクトル、ブロックベクトルなど）と、区分情報と、他のシンタックスデータなどの任意の他の好適なデータとを含む。コード化ビデオビットストリームの異なる要素は、エンコーダエンジン１０６によってエントロピー符号化され得る。いくつかの例では、エンコーダエンジン１０６は、エントロピー符号化され得るシリアル化ベクトルを作り出すために、量子化変換係数を走査するためにあらかじめ定義された走査順序を利用し得る。いくつかの例では、エンコーダエンジン１０６は適応型走査を実施し得る。ベクトル（たとえば、１次元ベクトル）を形成するために量子化変換係数を走査した後に、エンコーダエンジン１０６は、ベクトルをエントロピー符号化し得る。たとえば、エンコーダエンジン１０６は、コンテキスト適応型可変長コーディング、コンテキスト適応型バイナリ算術コーディング、シンタックスベースコンテキスト適応型バイナリ算術コーディング、確率間隔区分エントロピーコーディング、または別の好適なエントロピー符号化技法を使用し得る。

[0089]符号化デバイス１０４の出力部１１０は、通信リンク１２０を介して受信デバイスの復号デバイス１１２に、符号化ビデオビットストリームデータを構成するＮＡＬユニットを送り得る。復号デバイス１１２の入力部１１４はＮＡＬユニットを受信し得る。通信リンク１２０は、ワイヤレスネットワーク、ワイヤードネットワーク、またはワイヤードネットワークとワイヤレスネットワークとの組合せによって与えられるチャネルを含み得る。ワイヤレスネットワークは、任意のワイヤレスインターフェースまたはワイヤレスインターフェースの組合せを含み得、任意の好適なワイヤレスネットワーク（たとえば、インターネットまたは他のワイドエリアネットワーク、パケットベースネットワーク、ＷｉＦｉ（登録商標）、無線周波数（ＲＦ）、ＵＷＢ、ＷｉＦｉ－Ｄｉｒｅｃｔ、セルラー、ロングタームエボリューション（ＬＴＥ（登録商標））、ＷｉＭａｘ（登録商標）など）を含み得る。ワイヤードネットワークは、任意のワイヤードインターフェース（たとえば、ファイバー、イーサネット（登録商標）、電力線イーサネット、同軸ケーブルを介したイーサネット、デジタル信号線（ＤＳＬ）など）を含み得る。ワイヤードおよび／またはワイヤレスネットワークは、基地局、ルータ、アクセスポイント、ブリッジ、ゲートウェイ、スイッチなど、様々な機器を使用して実装され得る。符号化ビデオビットストリームデータは、ワイヤレス通信プロトコルなどの通信規格に従って変調され、受信デバイスに送信され得る。

[0090]いくつかの例では、符号化デバイス１０４は、符号化ビデオビットストリームデータを記憶装置１０８に記憶し得る。出力部１１０は、エンコーダエンジン１０６から、または記憶装置１０８から符号化ビデオビットストリームデータを取り出し得る。記憶装置１０８は、様々な分散されたまたはローカルにアクセスされるデータ記憶媒体のいずれかを含み得る。たとえば、記憶装置１０８は、ハードドライブ、記憶ディスク、フラッシュメモリ、揮発性もしくは不揮発性メモリ、または符号化ビデオデータを記憶するための任意の他の好適なデジタル記憶媒体を含み得る。記憶装置１０８は、インター予測において使用するための参照ピクチャを記憶するための復号ピクチャバッファ（ＤＰＢ）をも含むことができる。さらなる例では、記憶装置１０８は、ソースデバイスによって生成された符号化ビデオを記憶することができるファイルサーバまたは別の中間ストレージデバイスに対応し得る。そのような場合、復号デバイス１１２を含む受信デバイスは、ストリーミングまたはダウンロードを介してストレージデバイスから記憶されたビデオデータにアクセスすることができる。ファイルサーバは、符号化ビデオデータを記憶することと、その符号化ビデオデータを受信デバイスに送信することとが可能な任意のタイプのサーバであり得る。例示的なファイルサーバとしては、（たとえば、ウェブサイトのための）ウェブサーバ、ＦＴＰサーバ、ネットワーク接続記憶（ＮＡＳ）デバイス、またはローカルディスクドライブがある。受信デバイスは、インターネット接続を含む、任意の標準のデータ接続を通して符号化ビデオデータにアクセスし得る。アクセスは、ワイヤレスチャネル（たとえば、Ｗｉ－Ｆｉ（登録商標）接続）、ワイヤード接続（たとえば、ＤＳＬ、ケーブルモデムなど）、または、ファイルサーバに記憶された符号化ビデオデータにアクセスするのに適した、両方の組合せを含み得る。記憶装置１０８からの符号化ビデオデータの送信は、ストリーミング送信、ダウンロード送信、またはそれらの組合せであり得る。

[0091]復号デバイス１１２の入力部１１４は、符号化ビデオビットストリームデータを受信し、ビデオビットストリームデータをデコーダエンジン１１６に、またはデコーダエンジン１１６による後の使用のために記憶装置１１８に与え得る。たとえば、記憶装置１１８は、インター予測において使用するための参照ピクチャを記憶するためのＤＰＢを含むことができる。復号デバイス１１２を含む受信デバイスは、記憶装置１０８を介して復号されるべき符号化ビデオデータを受信することができる。符号化ビデオデータは、ワイヤレス通信プロトコルなどの通信規格に従って変調され、受信デバイスに送信され得る。送信された符号化ビデオデータのための通信媒体は、無線周波数（ＲＦ）スペクトルまたは１つもしくは複数の物理伝送線路などの、任意のワイヤレスまたは有線の通信媒体を備え得る。通信媒体は、ローカルエリアネットワーク、ワイドエリアネットワーク、またはインターネットなどのグローバルネットワークなど、パケットベースネットワークの一部を形成し得る。通信媒体は、ルータ、スイッチ、基地局、またはソースデバイスから受信デバイスへの通信を可能にするために有用であり得る任意の他の機器を含み得る。

[0092]デコーダエンジン１１６は、（たとえば、エントロピーデコーダを使用して）エントロピー復号し、符号化ビデオデータを構成する１つまたは複数のコード化ビデオシーケンスの要素を抽出することによって、符号化ビデオビットストリームデータを復号し得る。デコーダエンジン１１６は、符号化ビデオビットストリームデータを再スケーリングし、符号化ビデオビットストリームデータに対して逆変換を実施し得る。残差データが、デコーダエンジン１１６の予測段階にパスされる。デコーダエンジン１１６は、ピクセルのブロック（たとえば、ＰＵ）を予測する。いくつかの例では、逆変換の出力（残差データ）に予測が加算される。

[0093]ビデオ復号デバイス１１２は、復号ビデオをビデオ宛先デバイス１２２に出力し得、ビデオ宛先デバイス１２２は、復号ビデオデータをコンテンツの消費者に表示するためのディスプレイまたは他の出力デバイスを含み得る。いくつかの態様では、ビデオ宛先デバイス１２２は、復号デバイス１１２を含む受信デバイスの一部であり得る。いくつかの態様では、ビデオ宛先デバイス１２２は、受信デバイス以外の別個のデバイスの一部であり得る。

[0094]いくつかの実施形態では、ビデオ符号化デバイス１０４および／またはビデオ復号デバイス１１２は、それぞれオーディオ符号化デバイスおよびオーディオ復号デバイスと統合され得る。ビデオ符号化デバイス１０４および／またはビデオ復号デバイス１１２はまた、１つもしくは複数のマイクロプロセッサ、デジタル信号プロセッサ（ＤＳＰ）、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、ディスクリート論理、ソフトウェア、ハードウェア、ファームウェア、またはそれらの任意の組合せなど、上記で説明されたコーディング技法を実装するために必要である他のハードウェアまたはソフトウェアを含み得る。ビデオ符号化デバイス１０４およびビデオ復号デバイス１１２は、それぞれのデバイスにおいて複合エンコーダ／デコーダ（コーデック）の一部として統合され得る。

[0095]図１に示されている例示的なシステムは、本明細書で使用され得る１つの例示的な例である。本明細書で説明される技法を使用してビデオデータを処理するための技法は、任意のデジタルビデオ符号化および／または復号デバイスによって実施され得る。概して、本開示の技法はビデオ符号化デバイスまたはビデオ復号デバイスによって実施されるが、本技法は、一般に「コーデック」と呼ばれる複合ビデオエンコーダ／デコーダによっても実施され得る。さらに、本開示の技法はまた、ビデオプリプロセッサによって実施され得る。ソースデバイスおよび受信デバイスは、ソースデバイスが受信デバイスに送信するためのコード化ビデオデータを生成するような、コーディングデバイスの例にすぎない。いくつかの例では、ソースデバイスおよび受信デバイスは、デバイスの各々がビデオ符号化構成要素とビデオ復号構成要素とを含むように、実質的に対称的に動作し得る。したがって、例示的なシステムは、たとえば、ビデオストリーミング、ビデオ再生、ビデオブロードキャスティング、またはビデオテレフォニーのための、ビデオデバイス間の一方向または双方向のビデオ送信をサポートし得る。

[0096]ＨＥＶＣ規格に対する拡張は、ＭＶ－ＨＥＶＣと呼ばれるマルチビュービデオコーディング拡張と、ＳＨＶＣと呼ばれるスケーラブルビデオコーディング拡張とを含む。ＭＶ－ＨＥＶＣ拡張およびＳＨＶＣ拡張は、階層化コーディングの概念を共有し、異なるレイヤが符号化ビデオビットストリーム中に含まれる。コード化ビデオシーケンス中の各レイヤは、一意のレイヤ識別子（ＩＤ）によってアドレス指定される。レイヤＩＤは、ＮＡＬユニットがそれに関連するレイヤを識別するために、ＮＡＬユニットのヘッダ中に存在し得る。ＭＶ－ＨＥＶＣでは、異なるレイヤは、たいてい、ビデオビットストリーム中の同じシーンの異なるビューを表す。ＳＨＶＣでは、異なる空間解像度（またはピクチャ解像度）で、または異なる再構築忠実度でビデオビットストリームを表す異なるスケーラブルレイヤが与えられる。スケーラブルレイヤは、（レイヤＩＤ＝０である）ベースレイヤと（レイヤＩＤ＝１、２、．．．ｎである）１つまたは複数のエンハンスメントレイヤとを含み得る。ベースレイヤは、ＨＥＶＣの第１のバージョンのプロファイルに適合し得、ビットストリーム中の利用可能な最下位レイヤを表す。エンハンスメントレイヤは、ベースレイヤと比較して、増加された空間解像度、時間解像度もしくはフレームレート、および／または再構築忠実度（もしくは品質）を有する。エンハンスメントレイヤは、階層的に編成されており、下位レイヤに依存すること（または依存しないこと）がある。いくつかの例では、単一規格コーデックを使用して、異なるレイヤがコーディングされ得る（たとえば、ＨＥＶＣ、ＳＨＶＣ、または他のコーディング規格を使用して、すべてのレイヤが符号化される）。いくつかの例では、多規格コーデックを使用して、異なるレイヤがコーディングされ得る。たとえば、ベースレイヤは、ＡＶＣを使用してコーディングされ得るが、１つまたは複数のエンハンスメントレイヤは、ＨＥＶＣ規格に対するＳＨＶＣ拡張および／またはＭＶ－ＨＥＶＣ拡張を使用してコーディングされ得る。

[0097]上記で説明したように、各ブロックについて、（本明細書では動きパラメータとも呼ばれる）動き情報のセットが利用可能であり得る。動き情報のセットは、前方予測方向および後方予測方向のための動き情報を含むことができる。ここで、前方予測方向および後方予測方向は、双方向予測モードの２つの予測方向であり、「前方」および「後方」という用語は、必ずしも幾何学の意味を有するとは限らない。代わりに、前方および後方は、現在ピクチャ、スライス、またはブロックの参照ピクチャリスト０（ＲｅｆＰｉｃＬｉｓｔ０）および参照ピクチャリスト１（ＲｅｆＰｉｃＬｉｓｔ１）に対応することができる。いくつかの例では、ピクチャ、スライス、またはブロックについて１つの参照ピクチャリストのみが利用可能であるとき、ＲｅｆＰｉｃＬｉｓｔ０のみが利用可能であり、スライスの各ブロックの動き情報は常に前方である。いくつかの例では、ＲｅｆＰｉｃＬｉｓｔ０は、現在のピクチャに時間的に先行する参照ピクチャを含み、ＲｅｆＰｉｃＬｉｓｔ１は、現在のピクチャの時間的に後にくる参照ピクチャを含む。場合によっては、復号プロセスでは、動きベクトルが関連する参照インデックスとともに使用され得る。関連する参照インデックスをもつそのような動きベクトルは、動き情報の単予測セットとして示される。

[0098]各予測方向について、動き情報は、参照インデックスと動きベクトルとを含んでいることがある。場合によっては、簡単のために、動きベクトルは、動きベクトルが関連する参照インデックスを有する方法と仮定され得る関連する情報を有することができる。参照インデックスは、現在参照ピクチャリスト（ＲｅｆＰｉｃＬｉｓｔ０またはＲｅｆＰｉｃＬｉｓｔ１）中の参照ピクチャを識別するために使用され得る。動きベクトルは、現在ピクチャにおける座標位置から、参照インデックスによって識別される参照ピクチャにおける座標へのオフセットを与える水平成分と垂直成分とを有することができる。たとえば、参照インデックスは、現在ピクチャ中のブロックのために使用されるべきである特定の参照ピクチャを示すことができ、動きベクトルは、参照ピクチャ中で、最も良く一致したブロック（現在ブロックに最も良く一致するブロック）が参照ピクチャ中のどこにあるかを示すことができる。

[0099]ビデオコーディング規格において、ピクチャの表示順序を識別するためにピクチャ順序カウント（ＰＯＣ）が使用され得る。１つのコード化ビデオシーケンス内の２つのピクチャが同じＰＯＣ値を有し得る事例があるが、１つのコード化ビデオシーケンス内で、同じＰＯＣ値をもつ２つのピクチャはあまり発生しない。複数のコード化ビデオシーケンスがビットストリーム中に存在するとき、同じＰＯＣ値をもつピクチャは、復号順序に関して互いに近いことがある。ピクチャのＰＯＣ値は、特に、参照ピクチャリスト構築、ＨＥＶＣの場合のような参照ピクチャセットの導出、および／または動きベクトルスケーリングのために使用され得る。

[0100]Ｈ．２６４／ＡＶＣでは、各インターマクロブロック（ＭＢ）は、特に、１つの１６×１６マクロブロック区分と、２つの１６×８マクロブロック区分と、２つの８×１６マクロブロック区分と、４つの８×８マクロブロック区分とを含む、４つの異なる方法に区分され得る。１つのマクロブロック中の異なるマクロブロック区分は、予測方向ごとに異なる参照インデックス値（たとえば、ＲｅｆＰｉｃＬｉｓｔ０およびＲｅｆＰｉｃＬｉｓｔ１のための異なる参照インデックス値）を有し得る。

[0101]場合によっては、マクロブロックが４つの８×８のマクロブロック区分に区分されないとき、マクロブロックは、各マクロブロック区分について各予測方向に１つの動きベクトルしか有することができない。場合によっては、マクロブロックが４つの８×８のマクロブロック区分に区分されるとき、各８×８のマクロブロック区分は、その各々が各予測方向に異なる動きベクトルを有することができるサブブロックにさらに区分され得る。８×８のマクロブロック区分は、特に、１つの８×８のサブブロックと、２つの８×４のサブブロックと、２つの４×８のサブブロックと、４つの４×４のサブブロックとを含むサブブロックに異なる方法で分割され得る。各サブブロックは、予測方向ごとに異なる動きベクトルを有することができる。したがって、動きベクトルは、サブブロックに等しいかまたはそれよりも高いレベルにおいて存在することができる。

[0102]ＨＥＶＣでは、スライス中の最大のコーディングユニットは、コーディングツリーブロック（ＣＴＢ）またはコーディングツリーユニット（ＣＴＵ）と呼ばれる。ＣＴＢは４分木を含んでおり、そのノードはコーディングユニットである。ＣＴＢのサイズは、ＨＥＶＣメインプロファイルにおいて１６×１６ピクセルから６４×６４ピクセルにわたることができる。場合によっては、８×８ピクセルのＣＴＢサイズがサポートされ得る。ＣＴＢは、４分木方式でコーディングユニット（ＣＵ）に再帰的に分割され得る。ＣＵは、ＣＴＢと同じサイズであり、８×８ピクセル程度に小さくなり得る。場合によっては、各コーディングユニットは、イントラ予測モードまたはインター予測モードのいずれかなどの１つのモードを用いてコーディングされる。ＣＵがインター予測モードを使用してインターコーディングされるとき、ＣＵは、２つもしくは４つの予測ユニット（ＰＵ）にさらに区分され得るか、または、さらなる区分が適用されないとき、１つのＰＵとして扱われ得る。１つのＣＵ中に２つのＰＵが存在するとき、２つのＰＵは、１／２サイズの長方形、あるいはＣＵの１／４または３／４サイズである２つの長方形であり得る。

[0103]ＣＵがインターコーディングされるとき、ＰＵごとに動き情報の１つのセットが存在し得、これは、一意のインター予測モードで導出され得る。たとえば、各ＰＵは、動き情報のセットを導出するために１つのインター予測モードを用いてコーディングされ得る。場合によっては、ＣＵがイントラ予測モードを使用してイントラコーディングされるとき、ＰＵ形状は、２Ｎ×２ＮおよびＮ×Ｎであり得る。各ＰＵ内で、単一のイントラ予測モードがコーディングされる（一方、クロマ予測モードがＣＵレベルでシグナリングされる）。場合によっては、現在のＣＵサイズがＳＰＳにおいて定義されている最も小さいＣＵサイズに等しくなるとき、Ｎ×ＮのイントラＰＵの形状が可能になる。

[0104]ＨＥＶＣにおける動き予測の場合、マージモードと高度動きベクトル予測（ＡＭＶＰ）モードとを含む、予測ユニット（ＰＵ）のための２つのインター予測モードがある。スキップは、マージの特殊な場合と見なされる。ＡＭＶＰモードまたはマージモードのいずれかでは、動きベクトル（ＭＶ）候補リストが、複数の動きベクトル予測子について維持される。現在のＰＵの、動きベクトル、ならびにマージモードにおける参照インデックスは、ＭＶ候補リストから１つの候補をとることによって生成される。

[0105]いくつかの例では、ＭＶ候補リストは、マージモードのための最高５つの候補とＡＭＶＰモードのための２つの候補とを含んでいる。他の例では、異なる数の候補が、マージモードおよび／またはＡＭＶＰモードのためのＭＶ候補リスト中に含まれ得る。マージ候補は、動き情報のセットを含んでいることがある。たとえば、動き情報のセットは、両方の参照ピクチャリスト（リスト０およびリスト１）に対応する動きベクトルと、参照インデックスとを含むことができる。マージ候補がマージインデックスによって識別される場合、現在ブロックの予測のために参照ピクチャが使用され、ならびに関連する動きベクトルが決定される。しかしながら、リスト０またはリスト１のいずれかからの各々の潜在的な予測方向に対するＡＭＶＰモードのもとでは、ＡＭＶＰ候補が動きベクトルのみを含んでいるので、ＭＶ予測子（ＭＶＰ）インデックスとともに参照インデックスがＭＶ候補リストに明示的にシグナリングされる必要がある。ＡＭＶＰモードでは、予測される動きベクトルはさらに改良され得る。

[0106]マージ候補は、動き情報の完全セットに対応し得るが、ＡＭＶＰ候補は、特定の予測方向についての１つの動きベクトルと参照インデックスとを含んでいることがある。両方のモードのための候補は、同じ空間および時間隣接ブロックから同様に導出される。

[0107]いくつかの例では、マージモードは、インター予測ＰＵが、空間的に隣接する動きデータ位置と２つの時間的にコロケートされた動きデータ位置のうちの１つとのグループから選択される動きデータ位置を含むインター予測ＰＵから、１つまたは複数の同じ動きベクトルと、予測方向と、１つまたは複数の参照ピクチャインデックスとを継承することを可能にする。ＡＭＶＰモードの場合、ＰＵの１つまたは複数の動きベクトルは、エンコーダによって構築されたＡＭＶＰ候補リストからの１つまたは複数の動きベクトル予測子（ＭＶＰ）に対して予測的にコーディングされ得る。いくつかの事例では、ＰＵの単一方向インター予測の場合、エンコーダは、単一のＡＭＶＰ候補リストを生成することができる。いくつかの事例では、ＰＵの双方向予測の場合、エンコーダは、１つが前方予測方向からの空間および時間隣接ＰＵの動きデータを使用し、１つが後方予測方向からの空間および時間隣接ＰＵの動きデータを使用する、２つのＡＭＶＰ候補リストを生成することができる。

[0108]両方のモードのための候補は、空間および／または時間隣接ブロックから導出され得る。たとえば、図２Ａおよび図２Ｂは、ＨＥＶＣ中の空間隣接候補を示す概念図を含む。図２Ａは、マージモードのための空間隣接動きベクトル（ＭＶ）候補を示す。図２Ｂは、ＡＭＶＰモードのための空間隣接動きベクトル（ＭＶ）候補を示す。空間ＭＶ候補は、特定のＰＵ（ＰＵ０）について、隣接ブロックから導出されるが、ブロックから候補を生成する方法は、マージモードおよびＡＭＶＰモードについて異なる。

[0109]マージモードでは、エンコーダは、様々な動きデータ位置からマージング候補を考慮することによって、マージング候補リストを形成することができる。たとえば、図２Ａに示されているように、最高４つの空間ＭＶ候補が、図２Ａにおいて番号０～４で示されている空間的に隣接する動きデータ位置に関して導出され得る。ＭＶ候補は、番号０～４によって示されている順序で、マージング候補リスト中で順序付けられ得る。たとえば、位置および順序は、左位置（０）と、上位置（１）と、右上位置（２）と、左下位置（３）と、左上位置（４）とを含むことができる。

[0110]図２Ｂに示されているＡＭＶＰモードでは、隣接ブロックは、２つのグループ、すなわち、ブロック０および１を含む左グループと、ブロック２、３、および４を含む上グループとに分割される。各グループについて、シグナリングされた参照インデックスによって示された参照ピクチャと同じ参照ピクチャを参照する隣接ブロック中の潜在的候補は、グループの最終候補を形成するために選定されるべき最高優先度を有する。すべての隣接ブロックが、同じ参照ピクチャを指す動きベクトルを含んでいるとは限らない可能性がある。したがって、そのような候補が見つけられ得ない場合、第１の利用可能な候補は、最終候補を形成するためにスケーリングされることになり、したがって、時間距離差分が補償され得る。

[0111]図３Ａおよび図３Ｂは、ＨＥＶＣにおける時間的動きベクトル予測を示す概念図を含む。時間的動きベクトル予測子（ＴＭＶＰ）候補が、使用可能および利用可能な場合、空間動きベクトル候補の後にＭＶ候補リストに追加される。ＴＭＶＰ候補のための動きベクトル導出のプロセスは、マージモードとＡＭＶＰモードの両方について同じである。しかしながら、いくつかの事例では、マージモードでのＴＭＶＰ候補のためのターゲット参照インデックスは、常に０に設定される。

[0112]ＴＭＶＰ候補導出のための１次ブロックロケーションは、空間隣接候補を生成するために使用される上および左ブロックへのバイアスを補償するための、ブロック「Ｔ」として図３Ａに示されているような、コロケートされたＰＵの外側の右下ブロックである。しかしながら、そのブロックが現在ＣＴＢ（またはＬＣＵ）行の外側に位置するか、または動き情報が利用可能でない場合、ブロックはＰＵの中心ブロックと置換される。ＴＭＶＰ候補のための動きベクトルは、スライスレベルで示されている、コロケートされたピクチャのコロケートされたＰＵから導出される。ＡＶＣにおける時間直接モードと同様に、ＴＭＶＰ候補の動きベクトルは、動きベクトルスケーリングを受けることがあり、動きベクトルスケーリングは距離差分を補償するために実施される。

[0113]動き予測の他の態様はまた、ＨＥＶＣ、ＶＶＣ、および他のビデオコーディング仕様においてカバーされている。たとえば、一態様は動きベクトルスケーリングを含む。動きベクトルスケーリングでは、動きベクトルの値は、プレゼンテーション時間におけるピクチャ間の距離に比例すると見なされる。いくつかの例では、第１の動きベクトルは、第１の参照ピクチャと第１の動きベクトルを含む第１の包含ピクチャとを含む２つのピクチャに関連付けられ得る。第１の動きベクトルは、第２の動きベクトルを予測するために利用され得る。第２の動きベクトルを予測するために、第１の包含ピクチャと第１の動きの第１の参照ピクチャとの間の第１の距離が、第１の参照ピクチャと第１の包含ピクチャとに関連するピクチャ順序カウント（ＰＯＣ）値に基づいて計算され得る。

[0114]第２の参照ピクチャと第２の包含ピクチャとは、予測されることになる第２の動きベクトルに関連付けられ得、ここで、第２の参照ピクチャは、第１の参照ピクチャとは異なり得、第２の包含ピクチャは、第１の包含ピクチャとは異なり得る。第２の参照ピクチャと第２の包含ピクチャとの間の第２の距離は、第２の参照ピクチャと第２の包含ピクチャとに関連するＰＯＣ値に基づき計算され得、ここで、第２の距離は、第１の距離とは異なり得る。第２の動きベクトルを予測するために、第１の動きベクトルは、第１の距離と第２の距離とに基づいてスケーリングされ得る。空間的に隣接する候補の場合、それぞれ、第１の動きベクトルおよび第２の動きベクトルの第１の包含ピクチャおよび第２の包含ピクチャは同じであり得るが、第１の参照ピクチャおよび第２の参照ピクチャは異なり得る。いくつかの例では、動きベクトルスケーリングは、空間的におよび時間的に隣接する候補について、ＴＭＶＰおよびＡＭＶＰモードに適用され得る。

[0115]動き予測の別の態様は擬似動きベクトル候補生成を含む。たとえば、動きベクトル候補リストが完全でない場合、擬似動きベクトル候補が生成され、すべての候補が取得されるまで動きベクトル候補リストの最後に挿入される。マージモードでは、２つのタイプの擬似ＭＶ候補、すなわち、Ｂスライスについてのみ導出された複合候補を含む第１のタイプと、第１のタイプが十分な擬似候補を与えない場合にＡＭＶＰのためにのみ使用されるゼロ候補を含む第２のタイプとがある。すでに動きベクトル候補リスト中にあり、関係する動き情報を有する候補の各ペアについて、双方向複合動きベクトル候補が、リスト０中のピクチャを参照する第１の候補の動きベクトルと、リスト１中のピクチャを参照する第２の候補の動きベクトルとの組合せによって導出され得る。

[0116]マージモードおよびＡＭＶＰモードの別の態様は、候補挿入のためのプルーニングプロセスを含む。たとえば、異なるブロックからの候補は偶然同じであり得、これはマージおよび／またはＡＭＶＰ候補リストの効率を減少させる。問題を解決するために、プルーニングプロセスが適用され得る。プルーニングプロセスは、同一または複製の候補を挿入するのを回避するために候補を現在の候補リスト中にすでに存在する候補と比較することを含む。比較の複雑性を低減するために、プルーニングプロセスは、候補リスト中に挿入されることになるすべての潜在的な候補よりも少ない候補に実施され得る。

[0117]いくつかの例では、拡張動きベクトル予測が実装され得る。たとえば、いくつかのインターコーディングツールは、現在のブロックのための動きベクトル予測またはマージ予測の候補リストが導出または改良され得ることに従ってＶＶＣなどのビデオコーディング規格において指定されている。そのような手法の例について以下で説明する。

[0118]履歴ベース動きベクトル予測（ＨＭＶＰ）は、各ブロックが、すぐ隣り合う因果的隣接動きフィールドの中のＭＶに加えて、過去から復号されたＭＶのリストからそのＭＶ予測子を見つけることを可能にする動きベクトル予測方法である。たとえば、ＨＭＶＰを使用して、現在のブロックのための１つまたは複数のＭＶ予測子は、すぐ隣り合う因果的隣接動きフィールドの中のＭＶに加えて、前に復号されたＭＶのリストから取得または予測され得る。前に復号されたＭＶのリスト中のＭＶ予測子は、ＨＭＶＰ候補と呼ばれる。ＨＭＶＰ候補は、インターコード化ブロックに関連する動き情報を含むことができる。複数のＨＭＶＰ候補をもつＨＭＶＰ表は、スライスのための符号化および／または復号プロセス中に維持され得る。いくつかの例では、ＨＭＶＰ表は、動的に更新され得る。たとえば、インターコード化ブロックを復号した後に、新しいＨＭＶＰ候補としてＨＭＶＰ表に復号されたインターコード化ブロックの関連する動き情報を追加することによって、ＨＭＶＰ表は更新され得る。いくつかの例では、新しいスライスが遭遇されるときにＨＭＶＰ表は空にされ得る。

[0119]場合によっては、インターコード化ブロックがあるときはいつでも、関連する動き情報は、新たなＨＭＶＰ候補として先入れ先出し（ＦＩＦＯ）方式でテーブルに挿入され得る。制約ＦＩＦＯ規則が適用され得る。テーブルにＨＭＶＰを挿入するとき、テーブルの中に同一のＨＭＶＰがあるかどうかを見つけるために、第一に冗長性チェックが適用され得る。見つかった場合、その特定のＨＭＶＰがテーブルから除去され、以後のすべてのＨＭＶＰ候補は移動され得る。

[0120]いくつかの例では、ＨＭＶＰ候補は、マージ候補リスト構築プロセスにおいて使用され得る。場合によっては、テーブルの中の最後のエントリから最初のエントリまでのすべてのＨＭＶＰ候補が、ＴＭＶＰ候補の後に挿入される。ＨＭＶＰ候補に対してプルーニングが適用され得る。利用可能なマージ候補の総数が、シグナリングされた最大許容マージ候補に到達すると、マージ候補リスト構築プロセスは終了され得る。

[0121]いくつかの例では、ＨＭＶＰ候補は、ＡＭＶＰ候補リスト構築プロセスにおいて使用され得る。場合によっては、テーブルの中の最後のＫ個のＨＭＶＰ候補の動きベクトルは、ＴＭＶＰ候補の後に挿入される。いくつかの実装形態では、ＡＭＶＰターゲット参照ピクチャと同じ参照ピクチャを伴うＨＭＶＰ候補だけが、ＡＭＶＰ候補リストを構築するために使用される。ＨＭＶＰ候補に対してプルーニングが適用され得る。

[0122]図４は、ＨＭＶＰ表４００の一例を示すブロック図である。ＨＭＶＰ表４００は、先入れ先出し（ＦＩＦＯ）ルールを使用して管理されるストレージデバイスとして実装され得る。たとえば、ＭＶ予測子を含むＨＭＶＰ候補は、ＨＭＶＰ表４００中に記憶され得る。ＨＭＶＰ候補は、それらが符号化または復号される順序で記憶され得る。一例では、ＨＭＶＰ候補がＨＭＶＰ表４００中に記憶される順序は、ＨＭＶＰ候補が構築された時間に対応することができる。たとえば、復号デバイス１１２などのデコーダ中に実装されるとき、ＨＭＶＰ候補は、復号されたインターコード化ブロックの動き情報を含むように構築され得る。いくつかの例では、ＨＭＶＰ表４００からの１つまたは複数のＨＭＶＰ候補は、復号されることになる現在のブロックの動きベクトル予測のために使用され得る動きベクトル予測子を含むことができる。いくつかの例では、１つまたは複数のＨＭＶＰ候補は、１つまたは複数のそのような前に復号されたブロックを含むことができ、これは、それらがＦＩＦＯ方式でＨＭＶＰ表４００の１つまたは複数のエントリ中に復号された時間順序で記憶され得る。

[0123]ＨＭＶＰ候補インデックス４０２は、ＨＭＶＰ表４００に関連付けられるように示されている。ＨＭＶＰ候補インデックス４０２は、ＨＭＶＰ表４００の１つまたは複数のエントリを識別することができる。ＨＭＶＰ候補インデックス４０２は、例示的な例に従ってインデックス値０から４を含むことが示されており、ここで、ＨＭＶＰ候補インデックス４０２のインデックス値の各々は、対応するエントリに関連付けられる。ＨＭＶＰ表４００は、他の例では、図４に関して図示および説明されるものよりも多いまたは少ないエントリを含むことができる。ＨＭＶＰ候補は、構築されるときに、ＦＩＦＯ方式でＨＭＶＰ表４００にポピュレートされる。たとえば、ＨＭＶＰ候補は、復号されるときに、一端においてＨＭＶＰ表４００に挿入され、それらが別の端からＨＭＶＰ表４００を出るまでＨＭＶＰ表４００のエントリを通して連続的に移動される。したがって、シフトレジスタなどのメモリ構造は、いくつかの例では、ＨＭＶＰ表４００を実装するために使用され得る。一例では、インデックス値０は、ＨＭＶＰ表４００の第１のエントリをポイントすることができ、ここで、第１のエントリは、ＨＭＶＰ候補が挿入されるＨＭＶＰ表４００の第１の端に対応することができる。相応して、インデックス値４は、ＨＭＶＰ表４００の第２のエントリをポイントすることができ、ここで、第２のエントリは、ＨＭＶＰ候補がＨＭＶＰ表４００から出るかそれから空にされるＨＭＶＰ表４００の第２の端に対応することができる。したがって、インデックス値０で第１のエントリに挿入されるＨＭＶＰ候補は、ＨＭＶＰ候補がインデックス値４で第２のエントリに達するまでより新しいまたはより最近復号されたＨＭＶＰ候補に場所を空けるためにＨＭＶＰ表４００を横断することができる。したがって、所与の時間にＨＭＶＰ表４００中に存在するＨＭＶＰ候補のうち、インデックス値４で第２のエントリ中のＨＭＶＰ候補は、最も古いまたは最も過去の候補であり得るが、インデックス値０で第１のエントリ中のＨＭＶＰ候補は、最も若いまたは最も最近の候補であり得る。概して、第２のエントリ中でＨＭＶＰ候補は、第１のエントリ中のＨＭＶＰ候補よりも古いまたはそれより以前に構築されたＨＭＶＰ候補であり得る。

[0124]図４では、ＨＭＶＰ表４００の異なる状態が、参照番号４００Ａ、４００Ｂ、および４００Ｃで識別される。参照番号４００Ａのための状態を参照すると、ＨＭＶＰ候補ＨＭＶＰ０からＨＭＶＰ４は、それぞれのインデックス値４から０でＨＭＶＰ表４００のエントリ中に存在することが示されている。たとえば、ＨＭＶＰ０は、インデックス値０でＨＭＶＰ表４００の第１のエントリに挿入された最も古いまたは最も過去のＨＭＶＰ候補であり得る。ＨＭＶＰ０は、ＨＭＶＰ０が参照番号４００Ａのための状態に示されているインデックス値４の第２のエントリに達するまでより以前に挿入されたより新しいＨＭＶＰ候補ＨＭＶＰ１からＨＭＶＰ４に場所を空けるために連続的にシフトされ得る。相応して、ＨＭＶＰ４は、インデックス値０で第１のエントリに挿入されることになる最も最近のＨＭＶＰ候補であり得る。したがって、ＨＭＶＰ０は、ＨＭＶＰ４に対してＨＭＶＰ表４００中でより古いまたはより以前のＨＭＶＰ候補である。

[0125]いくつかの例では、ＨＭＶＰ候補ＨＭＶＰ０からＨＭＶＰ４のうちの１つまたは複数は、冗長であり得る動きベクトル情報を含むことができる。たとえば、冗長ＨＭＶＰ候補は、ＨＭＶＰ表４００中に記憶された１つまたは複数の他のＨＭＶＰ候補中の動きベクトル情報と同一である動きベクトル情報を含むことができる。冗長ＨＭＶＰ候補の動きベクトル情報が１つまたは複数の他のＨＭＶＰ候補から取得され得るので、ＨＭＶＰ表４００中に冗長ＨＭＶＰ候補を記憶することが回避され得る。冗長ＨＭＶＰ候補がＨＭＶＰ表４００中に記憶されることを回避することによって、ＨＭＶＰ表４００のリソースがより効率的に利用され得る。いくつかの例では、ＨＭＶＰ表４００中にＨＭＶＰ候補を記憶する前に、ＨＭＶＰ候補が冗長であるのかどうかを決定するために冗長検査が実施され得る（たとえば、一致があるのかどうかを決定するためにＨＭＶＰ候補の動きベクトル情報が、すでに記憶されている他のＨＭＶＰ候補の動きベクトル情報と比較され得る）。

[0126]いくつかの例では、ＨＭＶＰ表４００の参照番号４００Ｂのための状態は、上記で説明された冗長検査の概念図である。いくつかの例では、ＨＭＶＰ候補は、それらが復号されるときにＨＭＶＰ表４００中にポピュレートされ得、冗長検査は、ＨＭＶＰ候補が記憶される前にしきい値テストとして実施されるのではなく、周期的に実施され得る。たとえば、参照番号４００Ｂのための状態に示されているように、ＨＭＶＰ候補ＨＭＶＰ１およびＨＭＶＰ３は、冗長候補として識別され得る（すなわち、それらの動き情報は、ＨＭＶＰ表４００中の他のＨＭＶＰ候補のうちの１つの動き情報と同一である）。冗長ＨＭＶＰ候補ＨＭＶＰ１およびＨＭＶＰ３は、除去され得、残りのＨＭＶＰ候補は、相応してシフトされ得る。

[0127]たとえば、参照番号４００Ｃのための状態に示されているように、ＨＭＶＰ候補ＨＭＶＰ２およびＨＭＶＰ４は、より古いエントリに対応するより高いインデックス値にシフトされ、一方、ＨＭＶＰ表４００の最後の第２のエントリ中にすでにあるＨＭＶＰ０は、さらにシフトされることが示されていない。いくつかの例では、ＨＭＶＰ候補ＨＭＶＰ２およびＨＭＶＰ４をシフトすることは、より新しいＨＭＶＰ候補のためにＨＭＶＰ表４００中のスペースを解放することができる。したがって、新しいＨＭＶＰ候補ＨＭＶＰ５およびＨＭＶＰ６が、ＨＭＶＰ表４００にシフトされることが示されており、ＨＭＶＰ６は、最も新しいか、または最も最近復号された動きベクトル情報を含んでおり、インデックス値０で第１のエントリに記憶される。

[0128]いくつかの例では、ＨＭＶＰ表４００からのＨＭＶＰ候補のうちの１つまたは複数は、現在のブロックの動き予測のために使用され得る他の候補リストを構築するために使用され得る。たとえば、ＨＭＶＰ表４００からの１つまたは複数のＨＭＶＰ候補は、たとえば、追加のマージ候補としてマージ候補リストに追加され得る。いくつかの例では、同じＨＭＶＰ表４００または別のそのようなＨＭＶＰ表からの１つまたは複数のＨＭＶＰ候補は、たとえば、追加のＡＭＶＰ予測子として、高度動きベクトル予測（ＡＭＶＰ）候補リストに追加され得る。

[0129]たとえば、マージ候補リスト構築プロセスでは、ＨＭＶＰ表４００のエントリ中に記憶されたＨＭＶＰ候補の一部または全部がマージ候補リスト中に挿入され得る。いくつかの例では、マージ候補リスト中にＨＭＶＰ候補を挿入することは、マージ候補リスト中で時間的動きベクトル予測子（ＴＭＶＰ）候補の後にＨＭＶＰ候補を挿入することを含むことができる。図３Ａおよび図３Ｂに関して前に説明したように、ＴＭＶＰ候補は、使用可能および利用可能な場合、空間動きベクトル候補の後にＭＶ候補リストに追加され得る。

[0130]いくつかの例では、上記で説明されたプルーニングプロセスは、マージ候補リストを構築する際にＨＭＶＰ候補に対して適用され得る。たとえば、マージ候補リスト中のマージ候補の総数が許容可能なマージ候補の最大数に到達すると、マージ候補リスト構築プロセスは、終了され得、それ以上ＨＭＶＰ候補がマージ候補リストに挿入されないことがある。マージ候補リスト中の許容可能なマージ候補の最大数は、あらかじめ決定された数であるか、または、たとえば、エンコーダからマージ候補リストが構築され得るデコーダにシグナリングされ得る数であり得る。

[0131]マージ候補リストを構築することのいくつかの例では、１つまたは複数の他の候補がマージ候補リスト中に挿入され得る。いくつかの例では、現在のブロックに隣接しないことがある前にコーディングされたブロックの動き情報は、より効率的な動きベクトル予測のために利用され得る。たとえば、隣接しない空間マージ候補がマージ候補リストを構築する際に使用され得る。場合によっては、（たとえば、すべての目的のためにその全体が参照により本明細書に組み込まれるＪＶＥＴ－Ｋ０２２８に記載されている）隣接しない空間マージ候補の構築は、２つの隣接しない近傍位置からの（たとえば、図５に示されているように以下で説明されるように左／上に最も近接した隣接しないブロックからの）新しい空間候補の導出を伴う。ブロックは、現在のブロックに対して１つのＣＴＵの最大距離内に制限され得る。隣接しない候補のフェッチプロセスは、前に復号されたブロックを垂直方向に追跡することで開始する。垂直逆追跡は、インターブロックに遭遇するかまたは追跡して戻った距離が１つのＣＴＵサイズに到達したときに停止する。フェッチプロセスは、前に復号されたブロックを水平方向に追跡する。水平フェッチプロセスを停止するための基準は、正常にフェッチされた垂直に隣接しない候補があるのかどうかに依存する。垂直に隣接しない候補がフェッチされない場合、水平フェッチプロセスは、インターブロックに遭遇するかまたは追跡して戻った距離が１つのＣＴＵサイズしきい値を上回ったときに停止する。フェッチされた垂直に隣接しない候補がある場合、水平フェッチプロセスは、垂直の隣接しない候補とは異なるＭＶを含んでいるインターブロックに遭遇するかまたは追跡して戻った距離がＣＴＵサイズしきい値を超えたときに停止する。いくつかの例では、隣接しない空間マージ候補は、マージ候補リスト中のＴＭＶＰ候補の前に挿入され得る。いくつかの例では、隣接しない空間マージ候補は、ＴＭＶＰ候補の後に挿入されるＨＭＶＰ候補のうちの１つまたは複数を含むことができる同じマージ候補リスト中のＴＭＶＰ候補の前に挿入され得る。以下で図５を参照しながら、マージ候補リストに挿入され得る１つまたは複数の隣接しない空間マージ候補を識別し、フェッチすることについて説明する。

[0132]図５は、コーディングされるべき現在のブロック５０２を含むピクチャまたはスライス５００を示すブロック図である。いくつかの例では、マージ候補リストは、現在のブロック５０２をコーディングするために構築され得る。たとえば、現在のブロックのための動きベクトルは、マージ候補リスト中の１つまたは複数のマージ候補から取得され得る。マージ候補リストは、隣接しない空間マージ候補を決定することを含むことができる。たとえば、隣接しない空間マージ候補は、現在のブロック５０２に対して２つの隣接しない近傍位置から導出された新しい空間候補を含むことができる。

[0133]（現在のブロック５０２の左上の）左上のブロックＢ₂５１０と、（現在のブロック５０２の上の）上のブロックＢ₁５１２と、（現在のブロック５０２の右上の）右上のブロックＢ₀５１４と、（現在のブロック５０２の左の）左のブロックＡ₁５１６と、（現在のブロック５０２の左下の）左下のブロックＡ₀５１８とを含む現在のブロック５０２のいくつかの隣接または近傍ブロックを示す。いくつかの例では、隣接しない空間マージ候補は、現在のブロックの上のおよび／または左の最も近くの隣接しないブロックから取得され得る。

[0134]いくつかの例では、現在のブロック５０２のための隣接しない空間マージ候補は、前に復号されたブロックを垂直方向（現在のブロック５０２の上）におよび／または水平方向（現在のブロック５０２の左）に追跡することを含むことができる。垂直に追跡して戻った距離５０４は、現在のブロック５０２（たとえば、現在のブロック５０２の上部境界）と垂直に隣接しないブロックＶ_N５２０とに対する垂直距離を示す。水平に追跡して戻った距離５０６は、現在のブロック５０２（たとえば、現在のブロック５０２の左境界）と水平に隣接しないブロックＨ_N５２２とに対する水平距離を示す。垂直に追跡して戻った距離５０４と水平に追跡して戻った距離５０６とは、１つのコーディングツリーユニット（ＣＴＵ）のサイズに等しい最大距離に抑制される。

[0135]垂直に隣接しないブロックＶ_N５２０および水平に隣接しないブロックＨ_N５２２などの隣接しない空間マージ候補は、それぞれ、垂直方向および水平方向に前の復号されたブロックを追跡することによって識別され得る。たとえば、垂直に隣接しないブロックＶ_N５２０をフェッチすることは、インターコード化ブロックが（１つのＣＴＵの最大サイズに制約された）垂直に追跡して戻った距離５０４内に存在するのかどうかを決定するために垂直逆追跡プロセスを含むことができる。そのようなブロックは、存在する場合、垂直に隣接しないブロックＶ_N５２０として識別される。いくつかの例では、水平逆追跡プロセスは、垂直逆追跡プロセスの後に実施され得る。水平逆追跡プロセスは、インターコード化ブロックが（１つのＣＴＵの最大サイズに制約される）水平に追跡して戻った距離５０６内に存在するのかどうかを決定することを含むことができ、そのようなブロックは、発見される場合、水平に隣接しないブロックＨ_N５２２として識別される。

[0136]いくつかの例では、垂直に隣接しないブロックＶ_N５２０および水平に隣接しないブロックＨ_N５２２のうちの１つまたは複数は、隣接しない空間マージ候補として使用するためにフェッチされ得る。垂直に隣接しないブロックＶ_N５２０が垂直逆追跡プロセス中に識別される場合、フェッチプロセスは、垂直に隣接しないブロックＶ_N５２０をフェッチすることを含むことができる。フェッチプロセスは、水平逆追跡プロセスに進む。垂直に隣接しないブロックＶ_N５２０が垂直逆追跡プロセスにおいて識別されない場合、インターコード化ブロックに遭遇するかまたは水平に追跡して戻った５０６距離が最大距離を超えるとき、水平逆追跡プロセスが終了され得る。垂直に隣接しないブロックＶ_N５２０が識別され、フェッチされる場合、垂直に隣接しないブロックＶ_N５２０中に含まれているＭＶとは異なるＭＶを含んでいるインターコード化ブロックに遭遇するとき、または水平に追跡して戻った５０６距離が最大距離を超える場合、水平逆追跡プロセスが終了される。前述のように、垂直に隣接しないブロックＶ_N５２０および水平に隣接しないブロックＨ_N５２２などのフェッチされた隣接しない空間マージ候補のうちの１つまたは複数は、マージ候補リスト中でＴＭＶＰ候補の前に追加される。

[0137]再び図４を参照すると、場合によっては、ＨＭＶＰ候補はまた、ＡＭＶＰ候補リストを構築する際に使用され得る。ＡＭＶＰ候補リスト構築プロセスでは、同じＨＭＶＰ表４００（またはマージ候補リスト構築のために使用されるＨＭＶＰ表とは異なるＨＭＶＰ表）のエントリ中に記憶されたＨＭＶＰ候補の一部または全部がＡＭＶＰ候補リスト中で挿入され得る。いくつかの例では、ＡＭＶＰ候補リスト中にＨＭＶＰ候補を挿入することは、ＡＭＶＰ候補リスト中でＴＭＶＰ候補の後にＨＭＶＰ候補のエントリのセット（たとえば、ｋ個の最も最近のまたは最も過去のエントリ）を挿入することを含むことができる。いくつかの例では、上記で説明されたプルーニングプロセスは、ＡＭＶＰ候補リストを構築する際にＨＭＶＰ候補に対して適用され得る。いくつかの例では、ＡＭＶＰターゲット参照ピクチャと同じである参照ピクチャをもつＨＭＶＰ候補だけが、ＡＭＶＰ候補リストを構築するために使用され得る。

[0138]したがって、履歴ベースの動きベクトル予測子（ＨＭＶＰ）予測モードは、１つまたは複数のＨＭＶＰ候補を含むＨＭＶＰ表４００などの履歴ベースのルックアップテーブルの使用を伴うことができる。ＨＭＶＰ候補は、マージモードおよびＡＭＶＰモードなどのインター予測モードにおいて使用され得る。いくつかの例では、異なるインター予測モードは、ＨＭＶＰ表４００からＨＭＶＰ候補を選択するために異なる方法を使用することができる。

[0139]場合によっては、代替動きベクトル予測設計が使用され得る。たとえば、空間ＭＶＰ（Ｓ－ＭＶＰ）予測および時間ＭＶＰ（Ｔ－ＭＶＰ）予測のための代替設計が利用され得る。たとえば、マージモード（場合によっては、マージモードはスキップモードまたはダイレクトモードと呼ばれることがある）のいくつかの実装形態では、図６Ａ、図６Ｂ、および図６Ｃに示されている空間的および時間的ＭＶＰ候補は、ＭＶＰリストを充填するために図に示されている所与の順序で訪問され得る（または探索もしくは選択され得る）。

[0140]図６Ａは、現在のブロック６００のためのＭＶＰ候補Ａ、Ｂ、（Ｃ，Ａ１｜Ｂ１）、Ａ０、Ｂ２のロケーションを示す。図６Ｂは、現在のブロック６００のためのフォールバック候補Ｈとともに中心位置６１０における時間的にコロケートされたネイバーを示す。ＭＶＰ予測において利用される空間的および時間的ロケーションは、図６Ａに示されている通りである。Ｓ－ＭＶＰのための訪問順序（たとえば、探索順序もしくは選択順序）の一例を探索順序付きブロック０、１、２、３、４、および５とともに図６Ｃに示す。探索順序付きブロック０～５のためのものである（図６Ｃの順序と比較して）空間的に反転されたパターン代替を図６Ｄに示す。

[0141]ＭＶＰ候補として利用される空間ネイバーは、図６Ｃにマークされた訪問順序をもつ２段プロセスを用いて実装されるＡ、Ｂ、（Ｃ，Ａ１｜Ｂ１）、Ａ０、Ｂ２である。
１．グループ１
ａ．（ＨＥＶＣ表記法でＢ０とコロケートされた）Ａ、Ｂ、Ｃ
ｂ．ＣロケーションにおけるＭＶＰの利用可能性とブロック区分のタイプとに応じてＡ１またはＢ１。
２．グループ２
ａ．Ａ０およびＢ２
[0142]ＭＶＰ候補として利用される時間的にコロケートされたネイバーは、現在のブロックの中心位置６１０にコロケートされたブロックおよび現在のブロックの外の最も右下のロケーションのブロックである。
１．グループ３
ａ．Ｃ、Ｈ
ｂ．Ｈロケーションがコロケートされたピクチャの外部にあるとわかる場合、フォールバックＨ位置が代わりに使用され得る。

[0143]いくつかの実装形態では、使用されるブロック区分およびコーディング順序に応じて、図６Ｄに示されているように、逆Ｓ－ＭＶＰ候補順序が使用され得る。

[0144]ＨＥＶＣおよび以前のビデオコーディング規格では、並進運動モデルのみが、動き補償予測（ＭＣＰ）に適用される。たとえば、並進運動ベクトルは、ピクチャの各ブロック（たとえば、各ＣＵまたは各ＰＵ）のために決定され得る。しかしながら、現実世界では、不規則な動きの中でも、ズーム（たとえば、ズームインおよび／またはアウト）、回転、遠近動きを含む並進運動以外のより多くの種類の動きがある。ＩＴＵ－ＴＶＣＥＧおよびＭＰＥＧによる共同探査モデル（ＪＥＭ）において、アフィン変換動き補償予測は、アフィンコーディングモードを使用してコーディング効率を改善するために適用され得る。

[0145]図７は、２つの対応する制御点５１０および５１２のベクトル７２０

およびベクトル７２２

として示される２つの動きベクトルによって記述される現在のブロック７０２のアフィン動きフィールドを示す図である。制御点７１０の動きベクトル７２０

と制御点７１２の動きベクトル７２２

とを使用して、現在のブロック７０２の動きベクトルフィールド（ＭＶＦ）は、以下の式によって記述され得る。

[0146]式（１）において、ｖ_xおよびｖ_yは、現在のブロック７０２内の各ピクセルのための動きベクトルを形成し、ｘおよびｙは、現在のブロック７０２内の各ピクセルの位置を与え（たとえば、ブロック中の左上のピクセルは、座標またはインデックス（ｘ，ｙ）＝（０，０）を有することができ）、（ｖ_0x，ｖ_0y）は、左上隅の制御点７１０の動きベクトルであり、ｗは、現在のブロック７０２の幅であり、（ｖ_1x，ｖ_1y）は、右上隅の制御点７１２の動きベクトル７２２である。ｖ_0xおよびｖ_1xの値は、それぞれの動きベクトルのための水平の値であり、ｖ_0yおよびｖ_1yの値は、それぞれの動きベクトルのための垂直の値である。追加の制御点（たとえば、４つの制御点、６つの制御点、８つの制御点、または何らかの他の数の制御点）は、たとえば、現在のブロック７０２の下隅、現在のブロック７０２の中心、または現在のブロック７０２中の他の位置に追加の制御点ベクトルを追加することによって定義され得る。

[0147]上記の式（１）は、４パラメータの動きモデルを示し、ここで、４つのアフィンパラメータａ、ｂ、ｃ、およびｄは、

、

、ｃ＝ｖ_0x、ｄ＝ｖ_0yとして定義される。式（１）を使用して、左上隅の制御点７１０の動きベクトル（ｖ_0x，ｖ_0y）と右上隅の制御点７１２の動きベクトル（ｖ_1x，ｖ_1y）とを仮定すれば、現在のブロックの各ピクセルのための動きベクトルは、各ピクセルロケーションの座標（ｘ，ｙ）を使用して計算され得る。たとえば、現在のブロック７０２の左上のピクセル位置について、（ｘ，ｙ）の値は、（０，０）に等しくなり得、その場合、左上のピクセルのための動きベクトルは、Ｖ_x＝ｖ_0xおよびＶ_y＝ｖ_0yになる。ＭＣＰをさらに簡略化するために、ブロックベースのアフィン変換予測が適用され得る。

[0148]図８は、図示されたサブブロック８０４、８０６、および８０８を含むサブブロックに分割された（たとえば、現在のブロック６００または現在のブロック７０２と同様であり得る）現在のブロック８０２のブロックベースのアフィン変換予測を示す図である。図８に示されている例は、計１６個のサブブロックをもつ４×４の区分を含む。任意の好適な区分と対応する数のサブブロックとが他の例では使用され得る。動きベクトルは、式（１）を使用して各サブブロックのために導出され得る。４×４のそれぞれのサブブロックの動きベクトルを導出するいくつかの例では、（図８に示されているように）各サブブロックの中心のサンプルの動きベクトルは、それぞれ対応するサブブロックの中心のサンプルから、サブブロック８０４のために導出された動きベクトル８０５、サブブロック８０６のために導出された動きベクトル８０７、およびサブブロック８０８のために導出された動きベクトル８０９によって示されているように式（１）に従って計算される。他の例では、他のサンプルが使用され得る。いくつかの例では、得られたそれぞれの動きベクトルは、たとえば、１／１６の分数精度または他の好適な精度（たとえば、１／４、１／８など）に丸められ得る。動き補償は、各サブブロックの予測を生成するためにサブブロックの導出された動きベクトルを使用して適用され得る。たとえば、復号デバイスは、制御点８２０の動きベクトル

および制御点８１２の動きベクトル

８２２を記述する４つのアフィンパラメータ（ａ、ｂ、ｃ、ｄ）を受信することができ、各サブブロックの中心サンプルのロケーションを記述するピクセル座標インデックスに従ってサブブロックごとの動きベクトルを計算することができる。ＭＣＰの後に、各サブブロックの高精度の動きベクトルは、上記のように、丸められ得、並進運動ベクトルと同じ精度として保存され得る。さらに、いくつかの例では、アフィンモードでの動きベクトルは、アフィンコーディングモードでアフィン動きベクトルとして動きベクトルを使用するアフィンコーディング動作中に使用されることになる参照データを制限するために制限され得る。いくつかのそのような例では、クリッピングは、以下で、特に、図１８Ａ、図１８Ｂ、および図１８Ｃに関してより詳細に説明されるように、そのようなベクトルに適用され得る。

[0149]図９は、アフィンインター（ＡＦ＿ＩＮＴＥＲ）モードでの動きベクトル予測の一例を示す図である。ＪＥＭでは、２つのアフィン動きモード、すなわち、アフィンインター（ＡＦ＿ＩＮＴＥＲ）モードおよびアフィンマージ（ＡＦ＿ＭＥＲＧＥ）モードがある。いくつかの例では、ＣＵが８つのピクセルよりも長い幅と高さとを有するとき、ＡＦ＿ＩＮＴＥＲモードが適用され得る。ＡＦ＿ＩＮＴＥＲモードがブロックに適用されたのかどうかを示すためにアフィンフラグが、ブロックに関して（たとえば、ＣＵレベルで）ビットストリーム中に配置され得る（またはシグナリングされ得る）。図９の例において、ＡＦ＿ＩＮＴＥＲモードでは、動きベクトルペアの候補リストは、隣接ブロックを使用して構築され得る。たとえば、現在のブロック９０２の左上隅に位置するサブブロック９１０について、動きベクトルｖ₀は、サブブロック９１０の左上の隣接ブロック９２０と、サブブロック９１０の上の隣接ブロックＢ９２２と、サブブロック９１０の左の隣接ブロックＣ９２４とから選択され得る。さらなる例として、現在のブロック９０２の右上隅に位置するサブブロック９１２について、動きベクトルｖ₁は、それぞれ、上および右上の方向の隣接ブロックＤ９２６および隣接ブロックＥ９２８から選択され得る。動きベクトルペアの候補リストは、隣接ブロックを使用して構築され得る。たとえば、ブロックＡ９２０、Ｂ９２２、Ｃ９２４、Ｄ９２６、およびＥ９２８にそれぞれ対応する動きベクトルｖ_A、ｖ_B、ｖ_C、ｖ_D、およびｖ_Eを仮定すれば、動きベクトルペアの候補リストは、｛（ｖ₀，ｖ₁）｜ｖ₀＝｛ｖ_A，ｖ_B，ｖ_C｝，ｖ₁＝｛ｖ_D，ｖ_E｝｝として表され得る。

[0150]上記のように、図９に示されているように、ＡＦ＿ＩＮＴＥＲモードでは、動きベクトルｖ₀は、ブロックＡ９２０、Ｂ９２２、またはＣ９２４の動きベクトルから選択され得る。隣接ブロック（たとえば、ブロックＡ、Ｂ、またはＣ）からの動きベクトルは、参照リストと隣接ブロックのための参照のＰＯＣと、現在のＣＵ（たとえば、現在のブロック９０２）のための参照のＰＯＣと、現在のＣＵのＰＯＣとの間の関係とに従ってスケーリングされ得る。これらの例では、ＰＯＣの一部または全部は、参照リストから決定され得る。隣接ブロックＤ９２６またはＥ９２８からのｖ₁の選択は、ｖ₀の選択と同様である。

[0151]場合によっては、候補リストの数が２よりも少ない場合、候補リストは、ＡＭＶＰ候補の各々を複製することによって動きベクトルペアでパディングされ得る。候補リストが２つよりも多いとき、いくつかの例では、候補リスト中の候補は、最初に、隣接動きベクトルの整合性に従って分類され得る（たとえば、整合性は、動きベクトルペア候補中の２つの動きベクトル間の類似性に基づき得る）。そのような例では、最初の２つの候補が保たれ、残りが、破棄され得る。

[0152]いくつかの例では、レートひずみ（ＲＤ）コスト検査は、現在のＣＵ（たとえば、現在のブロック９０２）の制御点動きベクトル予測（ＣＰＭＶＰ）としてどの動きベクトルペア候補が選択されるのかを決定するために使用され得る。場合によっては、候補リスト中のＣＰＭＶＰの位置を示すインデックスは、ビットストリーム中でシグナリングされ得る（あるいは示され得る）。現在のアフィンＣＵのＣＰＭＶＰが（動きベクトルペア候補に基づいて）決定されると、アフィン動き推定が適用され得、制御点動きベクトル（ＣＰＭＶ）が決定され得る。場合によっては、ＣＰＭＶとＣＰＭＶＰとの差がビットストリーム中でシグナリングされ得る。ＣＰＭＶとＣＰＭＶＰとの両方は、並進運動ベクトルの２つのセットを含み、その場合、アフィン動き情報のシグナリングコストは、並進運動のシグナリングコストより高くなる。

[0153]図１０Ａおよび図１０Ｂは、ＡＦ＿ＭＥＲＧＥモードでの動きベクトル予測の一例を示す。現在のブロック８０２（たとえば、ＣＵ）がＡＦ＿ＭＥＲＧＥモードを使用してコーディングされるとき、動きベクトルは、有効な隣接する再構築されたブロックから取得され得る。たとえば、アフィンモードを用いてコーディングされた有効な隣接する再構築されたブロックからの第１のブロックは、候補ブロックとして選択され得る。図１０Ａに示されているように、隣接ブロックは、隣接ブロックＡ１０２０、Ｂ１０２２、Ｃ１０２４、Ｄ１０２６、およびＥ１０２８のセットの中から選択され得る。隣接ブロックは、候補ブロックとして選択されるための特定の選択順序で検討され得る。選択順序の一例は、左のネイバー（たとえば、ブロックＡ１０２０）、それに続く上のネイバー（ブロックＢ１０２２）、右上のネイバー（ブロックＣ１０２４）、左下のネイバー（ブロックＤ１０２６）、左上のネイバー（ブロックＥ１０２８）である。

[0154]上記のように、選択された隣接ブロックは、アフィンモードを用いてコーディングされている（たとえば、選択順序の）第１のブロックであり得る。たとえば、ブロックＡ８２０は、アフィンモードでコーディングされていることがある。図１０Ｂに示されているように、ブロックＡ１０２０は、隣接ＣＵ１００４中に含まれ得る。隣接ＣＵ１００４について、隣接ＣＵ１００４の左上隅（ｖ₂１０３０）、右上隅（ｖ₃１０３２）、および左下隅（ｖ₄１０３４）のための動きベクトルが導出されていることがある。上記の例では、現在のブロック１００２の左上隅のための制御点動きベクトルｖ₀１０４０は、ｖ₂１０３０、ｖ₃１０３２、およびｖ₄１０３４に従って計算される。現在のブロック１００２の右上隅のための制御点動きベクトルｖ₁１０４２が決定され得る。

[0155]現在のブロック１００２の制御点動きベクトル（ＣＰＭＶ）ｖ₀１０４０およびｖ₁１０４２が導出されると、現在のブロック１００２のための動きベクトルフィールドを決定するために式（１）が適用され得る。現在のブロック１００２がＡＦ＿ＭＥＲＧＥモードを用いてコーディングされるのかどうかを識別するために、アフィンモードでコーディングされた少なくとも１つの隣接ブロックがあるとき、アフィンフラグがビットストリーム中に含まれ得る。

[0156]多くの場合、アフィン動き推定のプロセスは、元のブロックとアフィン動き予測ブロックとの間のひずみを最小化することによってエンコーダ側でブロックのためのアフィン動きを決定することを含む。アフィン動きが並進運動よりも多くのパラメータを有するので、アフィン動き推定は、並進運動推定よりも複雑になり得る。場合によっては、信号のテイラー展開に基づく高速アフィン動き推定方法が、アフィン動きパラメータ（たとえば、４パラメータモデルにおけるアフィン動きパラメータａ、ｂ、ｃ、ｄ）を決定するために実施され得る。

[0157]高速アフィン動き推定は、勾配ベースのアフィン動き探索を含むことができる。たとえば、時間ｔ（ただし、ｔ０は、参照ピクチャの時間である）におけるピクセル値Ｉ_tを仮定すれば、ピクセル値Ｉ_tのための１次テイラー展開は次のように決定され得る。

[0158]ここで、

および

は、それぞれ、ｘおよびｙ方向のピクセル勾配Ｇ_0x、Ｇ_0yであり、一方、

および

は、ピクセル値Ｉ_tのための動きベクトル成分Ｖ_xおよびＶ_yを示す。現在のブロック中のピクセルＩ_tのための動きベクトルは、参照ピクチャ中のピクセルＩ_toをポイントする。

[0159]したがって、式（２）は以下のように式（３）として書き直され得る。

[0160]ピクセル値Ｉ_toのためのアフィン動きＶ_xおよびＶ_yは、予測（Ｉ_to＋Ｇ_x0・Ｖ_x＋Ｇ_y0・Ｖ_y）と元の信号との間のひずみを最小化することによって解かれ得る。４パラメータのアフィンモデルを一例として取る。

[0161]ここで、ｘおよびｙは、ピクセルまたはサブブロックの位置を示す。式（４）および（５）を式（３）に取り込み、式（３）を使用して元の信号と予測との間のひずみを最小化すると、アフィンパラメータのａ、ｂ、ｃ、ｄの解が決定され得る。

[0162]制御点のためのアフィン動きベクトルを定義するアフィン動きパラメータが決定されると、ピクセルごとのまたはサブブロックごとの動きベクトルが、アフィン動きパラメータを使用して（たとえば、式（１）でも表される式（４）および（５）を使用して）決定され得る。式（３）は、現在のブロック（たとえば、ＣＵ）のピクセルごとに実行され得る。たとえば、現在のブロックが１６ピクセル×１６ピクセルである場合、２５６ピクセルにわたる全体的な値を最小化することによって現在のブロックのためのアフィン動きパラメータ（ａ，ｂ，ｃ，ｄ）を導出するために、式（６）の最小２乗解が、使用され得る。

[0163]ビデオデータのためのアフィン動きモデルにおいて任意の数のパラメータが使用され得る。たとえば、６パラメータのアフィン動きまたは他のアフィン動きが、４パラメータのアフィン動きモデルについて上記で説明されたアフィン動きと同じ方法で解かれ得る。たとえば、６パラメータのアフィン動きモデルは、次のように記述され得る。

[0164]式（７）では、（ｖ_x，ｖ_y）は、座標（ｘ，ｙ）の動きベクトルであり、ａ、ｂ、ｃ、ｄ、ｅ、およびｆは、６つのアフィンパラメータである。ブロックのためのアフィン動きモデルはまた、ブロックの３つの隅の３つの動きベクトル（ＭＶ）

、

、および

によって記述され得る。

[0165]図１１は、３つの対応する制御点１１１０、１１１２、および１１１４の３つの動きベクトル１１２０、１１２２、および１１２４によって記述される現在のブロック１１０２のアフィン動きフィールドを示す図である。動きベクトル１１２０（たとえば、

）は、現在のブロック１１０２の左上隅に位置する制御点１１１０にあり、動きベクトル１１２２（たとえば、

）は、現在のブロック１１０２の右上隅に位置する制御点１１１２にあり、動きベクトル１１２４（たとえば、

）は、現在のブロック１１０２の左下隅に位置する制御点１１１４にある。現在のブロック１１０２の動きベクトルフィールド（ＭＶＦ）は、以下の式によって記述され得る。

[0166]式（８）は、６パラメータのアフィン動きモデルを表し、ここで、ｗおよびｈは、現在のブロック１１０２の幅および高さである。

[0167]４パラメータの動きモデルについて、上記の式（１）を参照しながら説明したが、現在のブロックの幅および高さを使用する簡略化された４パラメータのアフィンモデルが以下の式によって記述され得る。

[0168]式（９）に基づくブロックのための簡略化された４パラメータのアフィンモデルは、ブロックの４隅のうちの２つにある２つの動きベクトル

および

によって記述され得る。動きフィールドは、次のように記述され得る。

[0169]前述のように、動きベクトル

を、本明細書では制御点動きベクトル（ＣＰＭＶ）と呼ぶ。４パラメータのアフィン動きモデルのためのＣＰＭＶは、６パラメータのアフィン動きモデルのためのＣＰＭＶと必ずしも同じであるとは限らない。いくつかの例では、異なるＣＰＭＶが、アフィン動きモデルのために選択され得る。

[0170]図１２は、現在のブロック１２０２のアフィン動きモデルのための制御点ベクトルの選択を示す図である。現在のブロック１２０２のための４つの制御点１２１０、１２１２、１２１４、および１２１６が示されている。動きベクトル１２２０（たとえば、

）は、現在のブロック１２０２の左上隅に位置する制御点１２１０にあり、動きベクトル１２２２（たとえば、

）は、現在のブロック１２０２の右上隅に位置する制御点１２１２にあり、動きベクトル１２２４（たとえば、

）は、現在のブロック１２０２の左下隅に位置する制御点１２１４にあり、動きベクトル１２２６（たとえば、

）は、現在のブロック１２０２の右下隅に位置する制御点１２１６にある。

[0171]一例では、（式（１）または式（１０）のいずれかによる）４パラメータのアフィン動きモデルについて、制御点ペアは、４つの動きベクトル

の任意の２つから選択され得る。別の例では、６パラメータのアフィン動きモデルについて、制御点ペアは、４つの動きベクトル

の任意の３つから選択され得る。選択された制御点動きベクトルに基づいて、現在のブロック１００２のための他の動きベクトルは、たとえば、導出されたアフィン動きモデルを使用して計算され得る。

[0172]いくつかの例では、代替アフィン動きモデル表現がまた、使用され得る。たとえば、デルタ動きベクトルに基づくアフィン動きモデルは、座標（ｘ₀，ｙ₀）のアンカー動きベクトル

と、水平デルタ動きベクトル

と、垂直デルタ動きベクトル

とによって表され得る。概して、座標（ｘ，ｙ）の動きベクトル

は、

として計算され得る。

[0173]いくつかの例では、ＣＰＭＶに基づくアフィン動きモデル表現は、デルタ動きベクトルを用いた代替アフィン動きモデル表現に変換され得る。たとえば、デルタ動きベクトルアフィン動きモデル表現中の

は、左上のＣＰＭＶ

、

と同じである。これらのベクトル演算では、加算、除算、および乗算が要素ごとに適用されることに留意されたい。

[0174]いくつかの例では、アフィン動きベクトル予測は、アフィン動き予測子を使用して実施され得る。いくつかの例では、現在のブロックのためのアフィン動き予測子は、隣接するコード化ブロックのアフィン動きベクトルまたは法線動きベクトルから導出され得る。上記で説明されたように、アフィン動き予測子は、（たとえば、アフィンマージ（ＡＦ＿ＭＥＲＧＥ）モードを使用して継承される）継承されたアフィン動きベクトル予測子と（たとえば、アフィンインター（ＡＦ＿ＩＮＴＥＲ）モードを使用して構築される）構築されたアフィン動きベクトル予測子とを含むことができる。

[0175]継承されたアフィン動きベクトル予測子（ＭＶＰ）は、現在のブロックの予測されたＣＰＭＶを導出するために隣接コード化ブロックの１つまたは複数のアフィン動きベクトルを使用する。継承されたアフィンＭＶＰは、現在のブロックが隣接コード化ブロックと同じアフィン動きモデルを共有するという仮定に基づく。隣接コード化ブロックは、隣接ブロックまたは候補ブロックと呼ばれる。隣接ブロックは、異なる空間的にまたは時間的に隣接するロケーションから選択され得る。

[0176]図１３は、隣接ブロック１３０２（ブロックＡ）からの現在のブロック１３０２の継承されたアフィンＭＶＰを示す図である。隣接ブロック１３０２のアフィン動きベクトルは、制御点１３２０、１３２２、および１３２４におけるそれぞれの動きベクトル１３３０、１３３２、および１３３４

に関して

、

のように表される。一例では、隣接ブロック１３０４のサイズは、パラメータ（ｗ，ｈ）によって表され得、ここで、ｗは、隣接ブロック１３０４の幅であり、ｈは高さである。隣接ブロック１３０４の制御点の座標は、（ｘ０，ｙ０）、（ｘ１，ｙ１）、および（ｘ２，ｙ２）として表される。

、

として表されるアフィン動きベクトル１３４０、１３４２、および１３４４は、それぞれの制御点１３１０、１３１２、および１３１４において現在のブロック１３０２のために予測され得る。現在のブロック１３０２のための予測されたアフィン動きベクトル

、

は、以下の式に記述されているように式（８）中の（ｘ，ｙ）を現在のブロック１３０２の制御点と隣接ブロック１３０４の左上の制御点との間の座標差で置き換えることによって導出され得る。

[0177]式（１１）～（１３）において、（ｘ０’，ｙ０’）、（ｘ１’，ｙ１’）、および（ｘ２’，ｙ２’）は、現在のブロック１１０２の制御点の座標である。デルタＭＶとして表される場合、

であり、

である。

[0178]同様に、隣接コード化ブロック（たとえば、隣接ブロック１３０４）のアフィン動きモデルが４パラメータのアフィン動きモデルである場合、現在のブロック１１０２のための制御点においてアフィン動きベクトルを導出する際に式（１０）が適用され得る。いくつかの例では、４パラメータのアフィン動きモデルを取得するために式（１０）を使用することは、上記の式（１３）を回避することを含むことができる。

[0179]図１４は、現在のブロック１４０２のための継承されたアフィンＭＶＰモデルにおいて使用するための隣接候補ブロックのための可能なロケーションを示す図である。たとえば、現在のブロックの制御点１４１０、１４１２、および１４１４におけるアフィン動きベクトル１４４０、１４４２、および１４４４または

は、隣接ブロック１４３０（ブロックＡ０）、１４２６（ブロックＢ０）、１４２８（ブロックＢ１）、１４３２（ブロックＡ１）および／または１４２０（ブロックＢ２）のうちの１つから導出され得る。場合によっては、隣接ブロック１４２４（ブロックＡ２）および／または１４２２（ブロックＢ３）がまた、使用され得る。より詳細には、現在のブロック１４０２の左上隅に位置する制御点１４１０における動きベクトル１４４０（たとえば、

）は、制御点１４１０の左上に位置する隣接ブロック１４２０（ブロックＢ２）、制御点１４１０の上に位置する隣接ブロック１４２２（ブロックＢ３）、または制御点１４１０の左に位置する隣接ブロック１４２４（ブロックＡ２）から継承され得、現在のブロック１４０２の右上隅に位置する制御点１４１２における動きベクトル１４４２または

は、制御点１４１０の上に位置する隣接ブロック１４２６（ブロックＢ０）または制御点１４１０の右上に位置する隣接ブロック１４２８（ブロックＢ１）から継承され得、現在のブロック１４０２の左下隅に位置する制御点１４１４における動きベクトル１４４４または

は、制御点１４１０の左に位置する隣接ブロック１４３０（ブロックＡ０）または制御点１４１０の左下に位置する隣接ブロック１４３２（ブロックＡ１）から継承され得る。

[0180]現在、いくつかの設計では（たとえば、ＭＰＥＧ５エッセンシャルビデオコーディング（ＥＶＣ）では）、アフィン継承が、上記のＣＴＵ行中のアフィンコード化隣接ブロックからのものであるとき、左下のおよび右下のサブブロックＭＶがＣＰＭＶとして採用され、４パラメータのアフィンモデルが、常に、現在のＣＵのＣＰＭＶを導出するために使用される。

[0181]図１５は、ＭＰＥＧ５ＥＶＣにおけるアフィンモデルと空間近傍とを示す図である。図１５は、サブブロック１５４２および１５４４を有する隣接候補ブロック１５４０をもつ現在のＣＴＵ１５００ならびに左ネイバーサブブロック１５５２および左下のネイバーサブブロック１５５４を示す。図１５が、ＣＴＵを使用する例示的な例を与えるが、他の例では、現在のＣＴＵは、ＣＵ、ＰＵ、ＴＵなどの別のブロックであり得る。現在のＣＴＵ１５００は、制御点１５１０、１５１２、および１５１４と関連するＣＰＭＶ１５２０、１５２２、および１５２４とをもつ現在のブロック１５０２を含む。左上のＣＰＭＶ１５２０は、

と呼ばれ、右上のＣＰＭＶ１５２２は、

として示される。図示の例では、ＣＰＭＶ１５２０および１５２２は、現在のＣＴＵ１５００の上に位置する候補ブロック１５４０を含む隣接アフィンコード化ＣＵの関連するＭＶ

（図示せず）を有する左下のサブブロック１５４２と動きベクトル

（図示せず）を有する右下のサブブロック１５４４とのための動きベクトルによって導出されることになる現在のＣＵ（たとえば、現在のブロック１５０２）のＣＰＭＶとして指定される。
ＣＰＭＶ１５２０および１５２２は、図１５において

および

として示されており、以下の式によって導出され得、

ここで、ｎｅｉＷは、隣接ブロックの幅であり、ｃｕｒＷは、現在のブロックの幅であり、ｐｏｓＮｅｉＸは、隣接ブロックの左上のピクセル（または、いくつかの例では、サンプル）のｘ座標であり、ｐｏｓＣｕｒＸは、現在のブロックの左上のピクセル（または、いくつかの例では、サンプル）のｘ座標である。

[0182]場合によっては、ＡＦ＿４＿ＩＮＴＥＲモード、ＡＦ＿６＿ＩＮＴＥＲ、およびＡＦ＿ＭＥＲＧＥモードの３つのアフィン予測動きモードがある。マージ／スキップフラグが真であり（たとえば、１の値に等しく）、ＣＵのための幅と高さとの両方が、８つのサンプル（または他の数のサンプル）であるとき、アフィンマージモードが使用されるのかどうかを示すために、ＣＵレベル（または他のブロックレベル）でのアフィンフラグがビットストリーム中でシグナリングされる。また、ＣＵが、ＡＦ＿ＭＥＲＧＥとしてコーディングされるとき、最大値４（または、場合によっては、他の値）をもつマージ候補インデックスが、アフィンマージ候補リスト中のどの動き情報候補がＣＵのために使用されるのかを指定するためにシグナリングされる。

[0183]アフィンマージ候補リストは、以下のステップとして構築され得る。１）モデルベースのアフィン候補を挿入し、ここで、モデルベースの候補は、それの有効な空間隣接アフィンコード化ブロックのアフィン動きモデルから導出される。候補位置のための走査順序は、図６Ａ、図６Ｂ、および／または図６Ｃのマージリスト順序と同じであり得、０から５までの位置を含む。２）制御点ベースのアフィン候補を挿入する。アフィンマージリストサイズに対する制限が満たされない場合、制御点ベースのアフィン候補が挿入される。制御点ベースのアフィン候補は、アフィンマージ候補を形成するために各制御点の隣接動き情報を組み合わせることによって候補が構築されることを意味する。

[0184]（ＣＰ１～ＣＰ４として示される）４つの制御点またはＣＰの総数は、それぞれ、座標（０，０）、（Ｗ，０）、（Ｈ，０）および（Ｗ，Ｈ）で使用され、ここで、ＷおよびＨは、現在のブロックの幅および高さである。

[0185]アフィンマージリストの構築プロセスの複雑性を簡略化するために、制御点ベースのアフィンマージ候補を導出するときにスケーリングは実行されない。制御点動きベクトルが異なる参照インデックスをポイントしているか、または参照インデックスが無効である場合、候補は、利用不可能であると見なされることになる。

[0186]マージ／スキップフラグが偽であり（たとえば、０の値に等しく）、ＣＵのための幅と高さとの両方が、１６個のサンプル（または、場合によっては、他の数のサンプル）であるとき、アフィンインターモード（たとえば、ＡＦ＿４＿ＩＮＴＥＲモードまたはＡＦ＿６＿ＩＮＴＥＲモード）が使用されるのかどうかを示すために、ＣＵレベルでのアフィンフラグがビットストリーム中でシグナリングされる。ＣＵがアフィンインターモードとしてコーディングされるとき、ＣＵのために４パラメータのアフィンモデルが使用されるのかまたは６パラメータのアフィンモデルが使用されるのかを指定するためにモデルフラグがシグナリングされる。モデルフラグが真である（たとえば、１の値に等しい）場合、ＡＦ＿６＿ＩＮＴＥＲモード（６パラメータのアフィンモデル）が適用され、３つのＭＶＤがパースされることになり、そうでない場合、モデルフラグが偽である（たとえば、０の値に等しい）場合、ＡＦ＿４＿ＩＮＴＥＲモード（４パラメータのアフィンモデル）が適用され、２つのＭＶＤがパースされることになる。

[0187]アフィンＡＭＶＰ候補リストは、以下のステップとして構築され得る。1）モデルベースのアフィン候補を挿入する。２）制御点ベースのアフィン候補を挿入する。３）並進ベースのアフィンＡＭＶＰ候補を挿入する。４）０動きベクトルでパディングする。

[0188]アフィンマージ候補リスト中の候補の数が２（または、場合によっては、他の値）よりも小さい場合、リストが満ちるまで、０の参照インデックスをもつ０動きベクトルが挿入される。リスト構築の複雑性を低減するために、プルーニングは適用されない。

[0189]小さいブロックサイズ（たとえば、４×８および８×４サイズ）のためのサンプル導出アフィンモードが実行され得る。ＭＰＥＧ５ＥＶＣでは、アフィンコーディングのための最小ブロックサイズは、８×８に等しくなるように設定される。しかしながら、エンコーダは、４×８でまたは８×４のサブブロックサイズでアフィン予測を実装するように選択することができる。ＭＰＥＧ５ＥＶＣは、拡張補間フィルタ（ＥＩＦ：enhanced interpolation filter）を通してそのようなサブブロックサイズのためのアフィン予測を指定する。ＥＩＦは、サンプルごとに独立して動きベクトルを計算するサンプルごとの予測を用いるアフィン予測を可能にする。ＭＶが参照ピクチャの外をポイントするのを防ぐために、サンプルごとの得られたＭＶは、ピクチャサイズにクリッピングされる。下記のＭＰＥＧＥＶＣの抜粋は、「＜ｈｉｇｈｌｉｇｈｔ＞」シンボルと「＜ｈｉｇｈｌｉｇｈｔｅｎｄ＞」シンボルとの間の下線付きの（以下、下線は省略する）テキスト（たとえば、「＜ｈｉｇｈｌｉｇｈｔ＞強調テキスト＜ｈｉｇｈｌｉｇｈｔｅｎｄ＞」）でマークされるＥＩＦを用いたアフィン予測の実装を示す。
ａｆｆｉｎｅ＿ｆｌａｇが１に等しく、変数ｓｂＷｉｄｔｈ、ｓｂＨｅｉｇｈｔのうちの１つが８より小さい場合、以下が適用される。
－動きベクトルの水平変化ｄＸと、動きベクトルの垂直変化ｄＹと、ベース動きベクトルｍｖＢａｓｅＳｃａｌｅｄとは、入力としてルーマコーディングブロック幅ｎＣｂＷと、ルーマコーディングブロック高さｎＣｂＨと、制御点動きベクトルの数ｎｕｍＣｐＭｖと、制御点動きベクトルｃｐＭｖＬＸ［ｃｐＩｄｘ］、ただし、ｃｐＩｄｘ＝０．．ｎｕｍＣｐＭｖ－１とを用いて節８．５．３．９に指定されているプロセスを呼び出すことによって導出される。
－アレイｐｒｅｄＳａｍｐｌｅｓＬＸ_Lは、入力としてルーマロケーション（ｘＳｂ，ｙＳｂ）と、ルーマコーディングブロック幅ｎＣｂＷと、ルーマコーディングブロック高さｎＣｂＨと、動きベクトルの水平変化ｄＸと、動きベクトルの垂直変化ｄＹと、ベース動きベクトルｍｖＢａｓｅＳｃａｌｅｄと、参照アレイｒｅｆＰｉｃＬＸ_Lと、サンプルｂｉｔＤｅｐｔｈｂｉｔＤｅｐｔｈ_Yと、ピクチャ幅ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓと、高さｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓとを用いて節８．５．４．３に指定されている拡張補間フィルタのための補間プロセスを呼び出すことによって導出される。

[0190]１．１．１．１制御点動きベクトルからのアフィン動きモデルパラメータのための導出プロセス
プロセスの入力は、以下の通りである。
－ルーマコーディングブロックの幅および高さを指定する２つの変数ｃｂＷｉｄｔｈおよびｃｂＨｅｉｇｈｔ、
－制御点動きベクトルの数ｎｕｍＣｐＭｖ、
－制御点動きベクトルｃｐＭｖＬＸ［ｃｐＩｄｘ］、ただし、ｃｐＩｄｘ＝０．．ｎｕｍＣｐＭｖ－１であり、Ｘは０または１である。

[0191]プロセスの出力は、以下の通りである。
－動きベクトルの水平変化ｄＸ、
－動きベクトルの垂直変化ｄＹ、
－ルーマコーディングブロックの左上隅に対応する動きベクトルｍｖＢａｓｅＳｃａｌｅｄ。

[0192]変数ｌｏｇ２ＣｂＷおよびｌｏｇ２ＣｂＨは、次のように導出される。

[0193]動きベクトルの水平変化ｄＸは、次のように導出される。

[0194]動きベクトルの垂直変化ｄＹは、次のように導出される。
－ｎｕｍＣｐＭｖが３に等しくなる場合、ｄＹは、次のように導出される。

－そうでない場合（ｎｕｍＣｐＭｖが２に等しくなる）、ｄＹは、次のように導出される。

[0195]ルーマコーディングブロックの左上隅に対応する動きベクトルｍｖＢａｓｅＳｃａｌｅｄは、次のように導出される。

[0196]１．１．１．２拡張補間フィルタのための補間プロセス
プロセスの入力は、以下の通りである。
－フルサンプルユニット中でのロケーション（ｘＣｂ，ｙＣｂ）、
－現在のコーディングブロックの幅および高さを指定する２つの変数ｃｂＷｉｄｔｈおよびｃｂＨｅｉｇｈｔ、
－動きベクトルの水平変化ｄＸ、
－動きベクトルの垂直変化ｄＹ、
－動きベクトルｍｖＢａｓｅＳｃａｌｅｄ、
－選択された参照ピクチャサンプルアレイｒｅｆＰｉｃＬＸ、
－サンプルビット深度ｂｉｔＤｅｐｔｈ、
－サンプル中のピクチャの幅ｐｉｃ＿ｗｉｄｔｈ、
－サンプル中のピクチャの高さｐｉｃ＿ｈｅｉｇｈｔ。

[0197]プロセスの出力は、以下の通りである。
－予測サンプル値の（ｃｂＷｉｄｔｈ）×（ｃｂＨｅｉｇｈｔ）のアレイｐｒｅｄＳａｍｐｌｅｓＬＸ。

[0198]変数ｓｈｉｆｔ１、ｓｈｉｆｔ２、ｓｈｉｆｔ３、ｏｆｆｓｅｔ１、ｏｆｆｓｅｔ２、およびｏｆｆｓｅｔ３は、次のように導出される。
ｓｈｉｆｔ０は、ｂｉｔＤｅｐｔｈ－６に等しく設定され、ｏｆｆｓｅｔ０は、２^shift1-1に等しくなり、
ｓｈｉｆｔ１は、１１に等しく設定され、ｏｆｆｓｅｔ１は、１０２４に等しくなる。
＜ｈｉｇｈｌｉｇｈｔ＞ｘ＝－１．．ｃｂＷｉｄｔｈおよびｙ＝－１．．ｃｂＨｅｉｇｈｔの場合、以下が適用される。
－動きベクトルｍｖＸは、次のように導出される。

－変数ｘＩｎｔ、ｙＩｎｔ、ｘＦｒａｃおよびｙＦｒａｃは次のように導出される。

[0199]所与のアレイｒｅｆＰｉｃＬＸ内のロケーション（ｘＩｎｔ，ｙＩｎｔ）は、次のように導出される。

[0200]変数ａ_x,y、ａ_x+1,y、ａ_x,y+1、ａ_x+1,y+1は、次のように導出される。

[0201]ロケーション（ｘ，ｙ）に対応するサンプル値ｂ_x,yは、次のように導出される。

[0202]拡張補間フィルタ係数ｅＦ［］は、｛－１，１０，－１｝として指定される。

[0203]変数ｓｈｉｆｔ２、ｓｈｉｆｔ３、ｏｆｆｓｅｔ２、およびｏｆｆｓｅｔ３は、次のように導出される。
ｓｈｉｆｔ２は、４に等しく設定され、ｏｆｆｓｅｔ２は、８に等しくなり、
ｓｈｉｆｔ３は、１５－ｂｉｔＤｅｐｔｈに等しく設定され、ｏｆｆｓｅｔ３は、２^shift3-1に等しくなる。

[0204]ｘ＝０．．ｃｂＷｉｄｔｈー１およびｙ＝－１．．ｃｂＨｅｉｇｈｔの場合、以下が適用される。

[0205]ｘ＝０．．ｃｂＷｉｄｔｈー１およびｙ＝０．．ｃｂＨｅｉｇｈｔ－１の場合、以下が適用される。

[0206]拡張補間フィルタ（ＥＩＦ）に導入されたサンプルごとのＭＶ生成は、フィルタサンプルをフェッチするために必要とされるメモリアクセスの数を潜在的に増加させ、したがって、メモリ帯域幅を増加することができる。メモリアクセスの数の増加は、単予測におけるブロックサイズ４×８もしくは８×４（もしくは他のブロックサイズ）のための一般に使用される１メモリフェッチまたは双予測ブロックのための２メモリフェッチよりもはるかに高くなり得る。

[0207]上記で説明されたように、多数のフェッチ動作は、必要とされる参照エリアがローカルバッファ中で利用可能である場合などに問題にならないことがある。現在のＥＩＦ設計は、ピクチャ境界にＭＶクリッピングを導入し、これは、ピクチャ全体がローカルバッファにおいて利用可能であることを必要とする。上記のように、本明細書では、アフィンモードコーディングを改善する技法およびシステムについて説明する。本明細書で説明される技法の各々は、個々にまたは任意の組合せで実施され得る。いくつかの例では、本明細書で説明されるシステムおよび技法は、場合によっては,ブロックサイズに応じて設定され得るある限界に（たとえば、ＥＩＦによって）アフィンサンプル生成からアクセスされ得る参照ピクチャエリアを（制限（restriction）または制約（constrain）を使用して）抑制する。いくつかの例では、システムおよび技法は、たとえば、８×８未満もしくは４×８未満もしくは８×４未満のいくつかのブロックサイズまたは他のブロックサイズへの制限または制約を適用する。場合によっては、制限または制約は、ブロックの寸法に応じて指定され得る。

[0208]制限または制約は、異なる手法を通して課され得る。そのような制約の１つの例示的で非限定的な例は、次のように実装され、アフィン動き制約についてのＭＰＥＧＥＶＣの記述に対する修正として説明され得る。たとえば、符号化デバイスおよび／または復号デバイスは、１つまたは複数のアフィン動きベクトルまたはそれらの出力（たとえば、アフィン動きベクトルによってポイントされた参照サンプルの座標）を制約および／またはクリッピングすることができ、したがって、制約／クリッピングすることは、より高い粒度（たとえば、サブブロックまたはサンプル）のアフィンベクトルが許可されたエリアを超えないことになることを保証する。そのような制約が導入され得る形態の２つの例は、ビットストリーム要件（準拠）と規範的な復号プロセスとを含む。１つまたは複数のアフィン動きベクトル（ＭＶ）のクリッピングを通して実装され得る規範的な復号プロセスの１つの例示的な例は、以下の通りである（「＜ｉｎｓｅｒｔ＞」シンボルと「＜ｉｎｓｅｒｔｅｎｄ＞」シンボルとの間の下線付きの（以下、下線は省略）テキスト（たとえば、「＜ｉｎｓｅｒｔ＞追加されたテキスト＜ｉｎｓｅｒｔｅｎｄ＞）でマークされるテキストを追加することによって上記の強調された部分を修正する。
動きベクトルｍｖＸは、次のように導出される。

ここで、クリッピングパラメータは、ブロックサイズと、現在のブロック／サンプル座標と、ＭＶとの関数として導出される。

[0209]上記の場合、空間座標のクリッピングは、必要とされず、１つまたは複数の実装から除去され得、これは、上記の対応するセクション８－７３４および８－７３５に関して＜ｄｅｌｅｔｅ＞シンボルと＜ｄｅｌｅｔｅｅｎｄ＞シンボルとの間の取り消し線（以下、取り消し線は省略）テキスト（＜ｄｅｌｅｔｅ＞削除されたテキスト＜ｄｅｌｅｔｅｅｎｄ＞）として以下に示す。
＜ｄｅｌｅｔｅ＞ｘＩｎｔ＝Ｃｌｉｐ３（ＭｉｎＸ，ＭａｘＸ－１，ｘＩｎｔ）（８－７３４）
ｙＩｎｔ＝Ｃｌｉｐ３（ＭｉｎＹ，ＭａｘＹ－１，ｙＩｎｔ）（８－７３５）＜ｄｅｌｅｔｅｅｎｄ＞
ｉｉｉ．次のようにデータフェッチのための実際の座標のクリッピングを通して実装され得る規範的な復号プロセス

[0210]いくつかの例では、クリッピングパラメータは、たとえば、ＭＶｖ０（左上のＣＰ）によってまたはアフィンモデルによって与えられる他のＭＶ（たとえば、ｖ１またはｖ２）によってポイントされるＸ／Ｙ座標からのアフィンブロックの異なる空間位置のために導出される１つまたは複数のＭＶを考慮に入れることによって導出され得る。そのような実装形態の一例は、しきい値を使用して以下の通りである。

[0211]図１６は、いくつかの例による、アフィンモデルと空間近傍との態様を示す図である。図１６は、現在のＣＴＵ１５００ならびに隣接するブロックおよびサブブロックと図１５からの上記の関連する制御点および動きベクトルとを示す。図１６が、ＣＴＵを使用する例示的な例を与えるが、他の例では、現在のＣＴＵは、ＣＵ、ＰＵ、ＴＵなどの別のブロックであり得る。

[0212]上記で詳述したように、現在のブロック１５０２のアフィンコーディングは、参照データを使用することができる。そのような参照データは、図１６に示される参照１６７０からのものであり得る。場合によっては、参照１６７０は、現在のブロック１５０２のための参照ピクチャとして識別されるピクチャの部分であり得る。いくつかの状況下では、アフィン動きベクトルは、参照ピクチャの大きく異なる部分への指示と矛盾し得る（たとえば、現在のブロックとの大きな変化を有することができる）。たとえば、上記で説明されたように、アフィン動きは、変化する視点（たとえば、カメラ位置の移動）による動きに関連付けられ得るので、アフィン動きベクトルは、ブロックにわたってかなり一致することが予想され得る。いくつかの状況では、しかしながら、ブロックの１つのサンプルのためのアフィン動きベクトルは、ブロックの別のサンプルのためのアフィン動きベクトルとは大きく異なる（たとえば、大規模な大きさで異なる方向にポイントしている）。そのような状況が発生するとき、アフィン動きベクトルによって示される参照データ（たとえば、参照１６７０）にアクセスするために使用されるメモリ帯域幅は、パフォーマンスを劣化させる可能性がある。

[0213]本明細書で説明される例は、アフィン動きベクトルによって場合によっては示され得る参照１６７０中のデータを（たとえば、境界エリア１６６０に）制限するためにアフィン動きベクトルのクリッピングを実施するデバイス（たとえば、符号化デバイス１０４または復号デバイス１１２）を含むことができる。いくつかの例では、そのようなクリッピングは、しきい値（たとえば、上記の「しきい値」）を用いて行われ得る。いくつかの例では、しきい値は、図１６に示されているように、（たとえば、現在のブロック１５０２をコーディングする際に使用するためにメモリまたはＤＣＢ中に記憶される参照１６７０のエリアであるメモリアクセス領域と見なされ得る）境界エリア１６６０を定義するために基準として利用されるブロックサイズのユーザおよび／またはシステムに指定された比率であり得る。参照１６７０（たとえば、参照ピクチャまたは参照ブロックなどの参照ピクチャの部分）は、アフィン動きベクトル（たとえば、クリッピングパラメータ）に適用される制限に基づいて１つまたは複数のアフィン動きベクトルによってポイントされ得る境界エリア１６６０（たとえば、参照１６７０の部分）を含む。矢印１６９０は、現在のブロック１５０２と境界エリア１６６０との中のサンプルまたはポイントの間の関係を示し、したがって、アフィン動きベクトルは、境界エリア１６６０に（たとえば、クリッピングパラメータによって）制限される。異なるアフィン動きパラメータに応じて、現在のブロック１５０２のサンプルとアフィンベクトルによって示される境界エリア１６６０の中のデータとの間の関係は、アフィンコーディングモードでコーディングされた特定のアフィン動きに一致するように変化させることができる。現在のブロック（たとえば、現在のブロック１５０２）のサンプルと参照ピクチャから参照されるデータ（たとえば、参照１６７０中の境界エリア１６６０からのデータ）との間の関係に関係するさらなる詳細について、図１８Ａ、図１８Ｂ、および図１８Ｃに関して以下で詳細に説明する。多くの状況では、アフィン動きベクトルは、現在のブロック（たとえば、現在のブロック１５０２）にわたって（たとえば、上記で説明されたように視点の移動などのアフィン動きの性質により）一致する値を有することになり、その場合、アフィン動きベクトルを制限することからのパフォーマンスの劣化は、一般に、制限されることになる。

[0214]境界エリア１６６０への可能な参照データの制限は、メモリ帯域幅に関連するパフォーマンス劣化を防ぐことができ、メモリ中にバッファリングされ、現在のブロック１５０２のアフィンコーディングのために使用され得る管理しやすいサイズに参照されることになる可能なデータを制限することができる。本明細書で説明されるクリッピングパラメータ（たとえば、（ｃｂＷｉｄｔｈ）×（ｃｂＨｅｉｇｈｔ）アレイ、水平最大変数、水平最小変数、垂直最大変数、および垂直最小変数などの変数、または現在のブロック１５０２などの現在のブロックのためのアフィン動きベクトルによって示された参照ピクチャデータを制限するために使用される任意の他のそのようなパラメータ）は、現在のブロック１５０２および参照１６７０のコンテキストで境界エリア１６６０を定義するために様々な例で使用され得、現在のブロック１５０２をコーディングする際に使用するために境界エリア１６６０に関連する参照データを記憶するためにさらに使用され得る。

[0215]図１７は、いくつかの例による、アフィンモデルと空間近傍との態様を示す図である。図１６と同様に、図１７は、現在のＣＴＵ１５００ならびに隣接するブロックおよびサブブロックと図１５からの関連する制御点および動きベクトルとを示す。図１７が、ＣＴＵを使用する例示的な例を与えるが、他の例では、現在のＣＴＵは、ＣＵ、ＰＵ、ＴＵなどの別のブロックであり得る。いくつかの例では、図１７によって示され、上記で説明されたように、クリッピングパラメータは、アフィンブロックの異なる空間位置のために導出された１つまたは複数の動きベクトル（たとえば、アフィンサブブロックのために生成された実際のアフィンＭＶ）または現在のブロック内のアフィンサンプルを考慮に入れることによって導出され得る。例示的な実装形態は、次のクリッピングパラメータ

[0216]と、次のようなクリッピングされた動きベクトル

とを含むことができる。

[0217]他の例は、そのような動きベクトルとクリッピングパラメータとの他の実装形態を含むことができる。

[0218]上記のように、しきい値（たとえば、アフィン動きベクトルによって示され得る参照データを制限するために使用される境界エリア１６６０を示すしきい値）は、図１７に示されているように、メモリアクセス領域（たとえば、境界エリア１７６０）を定義するための基準として利用されるブロックサイズのユーザおよび／またはシステムに指定された比率であり得る。図１７では、（たとえば、図１６の境界エリア１６６０と同様の）参照境界エリア１７６０は、現在のブロック１５０２のサンプルからのアフィン動きベクトル（たとえば、境界エリア１７６０の外の参照ピクチャからのデータが示されることを防ぐ所与のクリッピング制限）によってポイントされ得る参照ピクチャのデータのための境界エリアを指定する。現在のブロックの参照エリア１７５０は、（たとえば、矢印１７９０に関連する並進運動が使用されるという仮定の下で）中央ロケーションのための動きベクトルによってポイントされる現在のブロック１５０２のブロックサイズの代表例を示す。現在のブロック１５０２を処理するためにアクセス可能な参照ピクチャのエリア（たとえば、境界エリア１７６０）は、以下でより詳細に説明されるように、アフィンベクトルの許容できる変動により現在のブロックの参照エリア１７５０よりも大きい。現在のブロック１５０２のサンプルロケーションのために生成されるまたはサブブロック１５４２、１５４４、１５５２、もしくは１５５４などの関係するサブブロックからのベクトルのために生成されるアフィン動きベクトルは、アフィンコーディングの部分として実装される制約またはクリッピングパラメータに従って境界エリア１６６０内のロケーションにポイントする。クリッピングまたはしきい値制限を受けるアフィン動きベクトルと関連する参照データとのさらなる詳細について、図１８Ａ、図１８Ｂ、および図１８Ｃに関して以下で説明する。

[0219]いくつかの例では、ＣＵのためのＣＰ動きベクトルをスケーリングおよび／もしくはクリッピングすることが実施され得るか、または得られた動きベクトル変化パラメータ（ｄＸｍｖ，ｄＹｍｖ）は、より高い粒度（たとえば、サブブロックまたはサンプル）のアフィンベクトルが（たとえば、境界エリア１６６０もしくは１７６０などの）許可されたエリアを超えるであろうことを検証するために使用され得る。そのような制約が導入され得る形態の２つの例は、（たとえば、準拠のための）ビットストリーム要件と規範的な復号プロセスとを含む。規範的な復号プロセスは、アフィン動きベクトルに課せられた制約を保証するためにＣＰＭＶのクリッピングを通して、またはＣＰＭＶもしくは変化パラメータを再調整／スケーリングすることを通して実装され得る。

[0220]いくつかの例では、ＣＰロケーションのＭＶ｛ｖ０，ｖ１，ｖ２｝は、アフィンＭＶ導出でのそれらの利用の前にクリッピングされ得る。たとえば、ＣＰＭＶのうちの１つ（たとえば、ｖ０）は、ベースと見なされ得、他のＣＰＭＶ（たとえば、ｖ１およびｖ２）は、他のＣＰＭＶが境界エリアの外をポイントしているのかどうかを決定するためにチェックされ得る（これは、境界ブロック違反が識別されるのかどうかをチェックすることと呼ばれることがある）。そのような境界ブロック違反が識別される場合、識別されたベクトルは、比例的にスケーリングされ、境界エリア内でポイントされ得、それの片側（隅）は、ベースＭＶ（たとえば、ｖ０）によって指定される。同様の技法が、３つのＣＰ動きベクトルよりも少数（たとえば、ｖ０、ｖ１、ｖ２よりも少数）を有するアフィン動きモデルおよび／または３つのＣＰ動きベクトルよりも多数（たとえば、ｖ０、ｖ１、ｖ２よりも多数）を有するアフィン動きモデルに適用され得る。

[0221]別の例では、ｖ０、ｖ１およびｖ２の動き情報は、変更されないままであり得るが、しかしながら、アフィンパラメータｄＸおよびｄＹは、アフィンＭＶが境界ブロックの外をポイントするのを防ぐために相応にスケーリングされることになる。そのような実装形態の一例を、「＜ｉｎｓｅｒｔ２＞」シンボルと「＜ｉｎｓｅｒｔｅｎｄ２＞」シンボルとの間の下線付き（以下、下線は省略）のテキストでマークされるテキスト（たとえば、「＜ｉｎｓｅｒｔ２＞追加されたテキスト＜ｉｎｓｅｒｔｅｎｄ２＞）を用いて以下で示す。同様の技法が、３つのＣＰ動きベクトルよりも少数（たとえば、ｖ０、ｖ１、ｖ２よりも少数）を有するアフィン動きモデルおよび／または３つのＣＰ動きベクトルよりも多数（たとえば、ｖ０、ｖ１、ｖ２よりも多数）を有するアフィン動きモデルに適用され得る。
１．１．１．３制御点動きベクトルからのアフィン動きモデルパラメータのための導出プロセス
プロセスの入力は、以下の通りである。
－ルーマコーディングブロックの幅および高さを指定する２つの変数ｃｂＷｉｄｔｈおよびｃｂＨｅｉｇｈｔ、
－制御点動きベクトルの数ｎｕｍＣｐＭｖ、
－制御点動きベクトルｃｐＭｖＬＸ［ｃｐＩｄｘ］、ただし、ｃｐＩｄｘ＝０．．ｎｕｍＣｐＭｖ－１であり、Ｘは０または１である。
プロセスの出力は、以下の通りである。
－動きベクトルの水平変化ｄＸ、
－動きベクトルの垂直変化ｄＹ、
－ルーマコーディングブロックの左上隅に対応する動きベクトルｍｖＢａｓｅＳｃａｌｅｄ。
変数ｌｏｇ２ＣｂＷおよびｌｏｇ２ＣｂＨは、次のように導出される。

＜ｉｎｓｅｒｔ１＞クリップｃｐＭｖＬＸ動きベクトルを（ｗＢＢ，ｈＢＢ，ｃｂＷｉｄｔｈ，ｃｂＨｅｉｇｈｔ，ｘＣｂ，ｙＣｂ，ｒａｔｉｏ）の境界ブロックサイズへ呼び出す＜ｉｎｓｅｒｔｅｎｄ１＞
動きベクトルの水平変化ｄＸは、次のように導出される。

動きベクトルの垂直変化ｄＹは、次のように導出される。
－ｎｕｍＣｐＭｖが３に等しくなる場合、ｄＹは、次のように導出される。

＜ｉｎｓｅｒｔ２＞ｃｐＭｖＬＸ動きベクトルと、境界エリアパラメータと、現在のブロックパラメータｃｂＷｉｄｔｈ、ｃｂＨｅｉｇｈｔと、局所座標とからスケーリングパラメータｓｃＤＸおよびｓｃＤＹを導出する。得られたＭＶが境界ブロックの外をポイントするのを防ぐために比例的にｄＸおよびｄＹパラメータをスケーリングする。＜ｉｎｓｅｒｔｅｎｄ２＞

ルーマコーディングブロックの左上隅に対応する動きベクトルｍｖＢａｓｅＳｃａｌｅｄは、次のように導出される。

[0222]いくつかの例では、動き補償のためにアクセス可能な動きベクトルおよび／または空間座標は、ピクチャ境界の代わりにしきい値に対してクリッピングされる。しきい値を使用して動きベクトルまたは空間座標をクリッピングすることは、（たとえば、ＥＶＣ規格において提示されるクリッピングプロセスなどの）既存のクリッピングプロセスから利益を得るために実施され得る。たとえば、クリッピングのパラメータは、次のように作表されたパラメータからブロックごとに１回計算され得る（強調テキストは、「＜ｈｉｇｈｌｉｇｈｔ＞」シンボルと「＜ｈｉｇｈｌｉｇｈｔｅｎｄ＞」シンボルとの間の下線で（以下、下線は省略）マークされる（たとえば、「＜ｈｉｇｈｌｉｇｈｔ＞強調テキスト＜ｈｉｇｈｌｉｇｈｔｅｎｄ＞）。

[0223]本明細書で説明されるように、アフィンサンプル生成は、ＥＶＣ、ＶＶＣ、および／または他の既存のもしくは開発されることになっているコーディング規格などの規格ベースのコーディングを含むビデオコーディング（たとえば、ビデオ符号化および／または復号）のために使用され得る。ビデオコーディングにおけるアフィンコーディングモードは、予測処理動作を用いてコーディングされている現在のブロック（たとえば、現在のブロック１５０２）のためのノンリレーショナル動きベクトルを可能にする。いくつかのそのようなものシステムでは、上記で説明されたように、現在のブロック（たとえば、ＣＵ、ＣＴＵ、ＰＵ、ＴＵ、または他のブロック）全体のための単一の動きベクトルはない。代わりに、ブロック内のいくつかのサンプルが独立したアフィン動きベクトルを有する。そのようなブロック中の各サンプルは、ブロックのために識別された参照ピクチャの周りを遠く離れてポイントすることができる独立した動きベクトルを有し得る。限界なしに動作するアフィンモードコーダは、（たとえば、ＤＰＢの容量を超える参照ピクチャデータを使用して）コーディングする際に予測動作のために有意なメモリリソースを使用して広いエリアの参照ピクチャからのエリアを呼び出すかまたはフェッチすることができる。いくつかのそのようなシステムでは、拡張補間フィルタ（ＥＩＦ）が、サンプルごとに独立した動きベクトルを生成し、そのようなベクトルのためのデータを別々にフェッチすることは、帯域幅集約的であり、有意な計算リソースを使用する可能性がある。フェッチされた参照データは、動きベクトルによって示される参照ピクチャのエリアからサンプルを記憶するメモリ中に記憶（たとえば、バッファ）される。許容できるパフォーマンスを与えるために、メモリにフェッチされ得る参照可能なデータは、本明細書で説明される例に従ってパラメータをクリッピングすることによって制限され得る。

[0224]制限は、座標を制限すること、アフィンモード予測によって使用される動きベクトルを制限すること、クリッピングのためのアフィンパラメータを修正すること、定義されたエリアの外にあるベクトルをクリッピングするために使用される区分表を用いて水平および垂直動きベクトルに対する制約をクリッピングすること、他のそのような制限を使用することを含む様々な方法で行われ得る。いくつかの例は、動きベクトルの大きさを中央ロケーションの周りのある境界（たとえば、以下で説明される図１６の境界エリア１６６０または図１７の境界エリア１７６０または図１８の中心位置１８５４の周りの境界エリア１８１０）によって制限するように制限するデバイスおよびプロセスを含む。いくつかのそのような例は、現在のブロックを得ること、アフィン予測のための制御点を得ること、合成動きベクトルを生成すること、ブロックの中央に位置するサンプルのための動きベクトルを近似することによって動作することができる。いくつかのそのような例では、中心ロケーションは、参照からデータを（たとえば、参照ピクチャからの境界エリア１６６０または１７６０からデータを）記憶するためにＤＰＢとともに使用され得る。いくつかの例では、ブロックのために許可されるアフィン動きベクトルの最小値－最大値（ｍｉｎ－ｍａｘ）偏差が、ベクトルのための制限領域の外をポイントするあらゆるベクトルが制限領域にクリッピングされた状態で定義され得る。

[0225]いくつかの例では、異なるブロックサイズに対して、異なる参照エリアのサイズをフェッチするようにコーディングデバイスによってアフィンコーディングモードの動作が構成される。いくつかの例では、サイズ比は、特定のデバイスまたはシステムのために（たとえば、パフォーマンスの劣化なしに）計算量的に実現可能であるものにデバイス構成によって関連付けられる。いくつかの例では、サンプルごとに、コーディングデバイスは、一定数の参照サンプルをフェッチするようにアフィンコーディングモードによって構成される。本明細書で説明されるいくつかのそのような例では、いくつかのブロックサイズのためのしきい値は、アフィンコーディングモードの部分として示される。他の例では、他のしきい値が使用され得る。いくつかの例では、アフィン動きベクトルクリッピングパラメータは、参照ピクチャ中の中央ベクトルと他の入力値とからアフィンコーディングモード動作の部分として導出され得る。動きベクトルをもつ中央サンプルをもついくつかのそのような例では、動きベクトルは、参照ピクチャ中の位置をポイントする。そのような例における参照ピクチャ中の位置は、参照エリアの中央ロケーションを与える。参照エリアのサイズは、いくつかの例では、中央の動きベクトルによって識別される中央ロケーションによって固定される偏差値によって定義される。

[0226]いくつかの例では、クリッピングパラメータは、ブロックサイズに依存する偏差である。たとえば、偏差Ａおよび偏差Ｂは、Ｄｅｖｉａｔｉｏｎ＿Ａ［５］＝｛１６，８０，２２４，５１２，１０８８｝、Ｄｅｖｉａｔｉｏｎ＿Ｂ［５］＝｛１６，９６，２４０，５２８，１１０４｝として上記で説明された指定された値を有する。そのような値は、画像解像度などのいくつかのサイズ値に基づいて指定され、異なるサイズ値（たとえば、異なる画像解像度）をもつ画像によって異なることになる。

[0227]上記で説明されたように、いくつかの例では、アフィンコーディングを受ける現在のブロック中のサンプルは、参照ピクチャをポイントするアフィン動きベクトルを有する。動きベクトルは、参照可能なエリア（たとえば、境界エリア１６６０または１７６０などのエリア）が定義される中心位置を設定する。アフィン動きベクトルは、アフィンコーディング動作の部分として標準アフィン動きベクトル生成プロセスから定義される。制御点動きベクトルが決定され、サブブロックまたはサンプルの動きベクトルは、アフィン動きモデルに基づいてアフィンコーディング動作の部分として導出される。

[0228]図１８Ａは、いくつかの例による、しきい値を使用してクリッピングすることの態様を示す図である。図１８Ａの例に示されているように、ブロック１８６０は、本明細書で説明される例によるＥＩＦアフィンコーディングの実装形態をもつ現在のＣＵである。ブロック１８６０のサンプル１８５２から中央動きベクトル１８５０によってポイントされる参照ピクチャのブロックサイズエリア１８６２は、ブロック１８６０（ＣＵ）と同じサイズの参照ブロックサイズエリア１８６２を定義する。境界エリア１８１０および参照ブロックサイズエリア１８６２の中心位置１８５４。エリア１８６４、１８６６、および１８６８は、サンプル１８５２、１８４２、および１８３２に対応する動きベクトル１８５０、１８４０、および１８３０のための許容偏差を示す。いくつかの例では、エリア１８６４、１８６６、および１８６８のためのエリアサイズは、（たとえば、８のサイズについて）（（ＭＶ（ｃｅｎｔｅｒ）－１）／（ＭＶ（ｃｅｎｔｅｒ）＋１））個の整数ピクセルによって与えられる偏差によって定義される。

[0229]上記で説明されたように定義された制限または偏差を用いて、いくつかの例では、サンプル１８３２に関連する左上の位置１８３４は、エリア１８６４のための中央のＭＶ（ｃｅｎｔｅｒ）－１／ＭＶ（ｃｅｎｔｅｒ）＋１（たとえば、中央動きベクトル１８３０）によって依然として制限される偏差幅／２（ｗ／２）および高さ／２（ｈ／２）によって動きベクトルに関連するシフトを可能にすることができる。（たとえば、中央動きベクトル１８３０およびサンプル１８３２に関連する）エリア１８６４および位置１８３４のために示された偏差および境界は、現在のブロック１８６０のためのすべてのサンプルに適用されるとき、現在のブロック１８６０のサンプルのためのメモリアクセスの有効な境界ブロック１８１０を導入する。図１８Ａの例では、境界ブロック１８１０は、位置１８３４および１８４４の周りのエリア１８６４および１８６８などのエリア１８６２の端にある極端な位置の周りの境界エリアによって生じるｄｅｖｉａｔｉｏｎ＿ｏｎ＿ｍｖがプラスされた（たとえば、現在のブロック１８６０と同じサイズである）参照ブロックサイズエリア１８６２と見なされ得る。エリア１８６４、１８６６、および１８６８のサイズに関連する偏差に動きベクトルを制限するために現在のブロック１８６０のあらゆるサンプルに対して（たとえば、これらのエリアが、同じサイズになり、現在のブロック１８６０からのサンプルのためのすべての他のアフィン動きベクトルのための偏差は同じサイズになることになるように）クリッピング制限を配置することによって、本明細書で説明されるようにアフィンモードは、クラントブロック１８６０内のあらゆる動きベクトルに対して制限を導入する。いくつかの例では、動きベクトルが境界ブロック内にある場合でも、そのような制限が動きベクトルに適用される。そのような解決策は、アフィン動きに対する「並進化（translationalization）」を効果的に与え、これについて、図１８Ｂおよび図１８Ｃに関して以下でさらに説明する。

[0230]図１８Ｂは、いくつかの例による、しきい値を使用してクリッピングすることの態様を示す図である。図１８Ｂは、対応するサンプル１８３２、１８４２、および１８７２のためのアフィン動きベクトル１８３６、１８４７、および１８７７の特定のセットをもつ現在のブロック１８６０の一例を示す。上記で説明されたように、各サンプルは、特定のサンプルに関連するアフィンベクトルのための最大偏差を定義するエリアに関連付けられる。サンプル１８３２は、エリア１８６４に関連付けられ、サンプル１８４２は、エリア１８６８に関連付けられ、サンプル１８７２は、エリア１８７６に関連付けられる。上記で説明されたように、アフィン動きベクトルが、（たとえば、サンプルのための中心ベクトルによって示される）そのベクトルのための定義された限界エリアの外にある場合、アフィン動きベクトルは、サンプルのための関連するエリアから逸脱せず、したがって、境界ブロック１８１０からも逸脱しないことになるクリッピングされたアフィン動きベクトルを生成するようにクリッピング動作で調整される。境界ブロック１８１０のためのデータが、上記で説明されたように、ローカルバッファ中に記憶され得るので、コーディングデバイスは、追加の参照データをフェッチし、過大なメモリ帯域幅の使用でデバイスパフォーマンスを劣化させることなしに現在のブロック１８６０のすべてのサンプルのために動作を実施することができる。

[0231]図１８Ｂの例では、サンプル１８３２のためのアフィン動きベクトル１８３６は、（たとえば、サンプル１８３２に関連する中心位置１８３４をもつ）エリア１８６４の外にある。アフィン動きベクトル１８３６は、エリア１８６４および境界ブロック１８１０の境界内をポイントするクリッピングされたアフィン動きベクトル１８３８を作成するためにアフィンモード動作によってクリッピングされる。対照的に、中心位置１８７４およびエリア１８７６に関連するサンプル１８７２のための動きベクトル１８７７は、位置１８７５をポイントする。アフィン動きベクトル１８７７によって示される位置１８７５がエリア１８７６内にあるので、アフィン動きベクトル１８７７はクリッピングされない。同様に、中心位置１８４４およびエリア１８６８に関連するサンプル１８４２のための動きベクトル１８４７は、位置１８４５をポイントし、これは、エリア１８６８と境界ブロック１８１０との両方の内にあり、したがって、アフィン動きベクトル１８４７は、クリッピングされない。

[0232]図１８Ａについて上記で説明されたように、サンプル１８５２のための中心位置１８５４は、中心動きベクトル１８５０を定義するために使用される。中心動きベクトル１８５０が大きい動きを示すのかまたは小さい動きを示すのかにかかわらず、サンプル１８３２、１８４２、１８７２、および他のサンプルを含むその現在のブロック１８６０のためのすべての他のサンプルのための境界エリアは、並進であり得る中央ベクトル（たとえば、現在のブロックと同じ大きさだが異なる位置または交点をもつ平行ベクトル）に基づく関連するクリッピングエリアを有する。様々な例では、関連するエリアの位置の変化（たとえば、サンプル１８７２および１８３２の位置の間の差）が一致することになる異なるサンプル位置の間の位置の変化は、位置１８７４および１８３４の間の差と同じになり、エリア１８７６および１８６４の間の差と同じになることになる。制限エリアとそれらの対応するサンプルとの間の関係は、上記で言及したアフィン動きに対する「並進化」である。

[0233]図１８Ｃは、いくつかの例による、しきい値を使用してクリッピングすることの態様を示す図である。図１８Ｃは、図１８Ｂと同様だが、異なるアフィン動きベクトルをもつ一例を示す。図１８Ｃの例では、サンプル１８３２のためのアフィンベクトル１８３６は、図１８Ｂの場合と同じであるが、しかしながら、それぞれのサンプル１８７２および１８４２のための動きベクトル１８８６および１８９６が異なる。動きベクトル１８３６と同様に、動きベクトル１８９６は、許容可能な動きベクトル偏差を超え、したがって、動きベクトル１８９６は、境界ブロック１８１０およびエリア１８６８内にある位置１８９７をポイントするクリッピングされた動きベクトル１８９８を生成するために処理される。図１８Ｃの例では、アフィン動きベクトル１８８６は、境界ブロック１８１０内をポイントするが、クリッピングされる。アフィン動きベクトル１８８６が、エリア１８７６によって示される許容可能な変動を超えるので、それは、サンプル１８７２のための中心位置１８７４に関連するエリア１８７６内にある位置１８８７をポイントするクリッピングされた動きベクトル１８８８を生成するプロセスである。上記の例では、動きベクトル１８８６が境界ブロック１８１０内の位置をポイントするが、動きベクトル１８８６は、クリッピングパラメータによりクリッピングされる。境界エリア１８１０内でそのようなクリッピングパラメータを適用することは、クリッピング動作を簡略化し、システムリソースの効率的な使用を与えることができる。

[0234]別の例では、（たとえば、上記で説明されたエリア１８７６に関連する動きベクトル１８８６に対する制限などの境界ブロック内の動きに対する制限なしに）メモリエリアのみが境界ブロックによって定義され得る。そのような例では、メモリ境界ブロック（たとえば、境界エリア１６６０、１７６０、または１８１０）は、たとえば、整数精度をもつ最終的なｘ／ｙ座標上に実装され得る。そのような一例は、境界ブロック内での無制限なアフィン動きベクトルを可能にすることになる。そのような例では、動きベクトル１８３６および１８９６は、クリッピングされることになるが、動きベクトル１８８６によって示される参照データが境界ブロック１８１０内にあるので、動きベクトル１８８６は、クリッピングされないことになり、メモリ中に記憶され、エリア１８７６に関連する追加の制限なしにアフィンコーディングのために利用可能になることになる。そのような例では、追加のコンピューティングリソースは、（たとえば、参照データに対する同じ境界エリア１６６０、１７６０、または１８１０の制限ありだが、エリア１８６４、１８７６、および１８６８などの境界ブロック内の動きベクトルごとの個々のエリア制限なしに）他の例のメモリ帯域幅パフォーマンスを維持しながら、より複雑なクリッピング動作を構造化するためのリソースを犠牲にしてクリッピングを構造化し、改善されたパフォーマンスを可能にするために使用され得る。

[0235]偏差制限の一例は、以下の通りである（強調テキストは、「＜ｈｉｇｈｌｉｇｈｔ＞」シンボルと「＜ｈｉｇｈｌｉｇｈｔｅｎｄ＞」シンボルとの間の下線で（以下、下線は省略）マークされる（たとえば、「＜ｈｉｇｈｌｉｇｈｔ＞強調テキスト＜ｈｉｇｈｌｉｇｈｔｅｎｄ＞）。

[0236]そのような解決策のための実装の一例を与える仕様テキストの一例は、「＜ｉｎｓｅｒｔ１＞」シンボルと「＜ｉｎｓｅｒｔｅｎｄ１＞」シンボルとの間の下線付きの（以下、下線は省略）テキストでマークされるテキスト（たとえば、「＜ｉｎｓｅｒｔ１＞追加されたテキスト＜ｉｎｓｅｒｔｅｎｄ１＞）を用いて以下で示す。

[0237]１．１．１．４拡張補間フィルタのための補間プロセス
プロセスの入力は、以下の通りである。
－フルサンプルユニット中でのロケーション（ｘＣｂ，ｙＣｂ）、
－現在のコーディングブロックの幅および高さを指定する２つの変数ｃｂＷｉｄｔｈおよびｃｂＨｅｉｇｈｔ、
－動きベクトルの水平変化ｄＸ、
－動きベクトルの垂直変化ｄＹ、
－動きベクトルｍｖＢａｓｅＳｃａｌｅｄ、
－選択された参照ピクチャサンプルアレイｒｅｆＰｉｃＬＸ、
－サンプルビット深度ｂｉｔＤｅｐｔｈ、
－サンプル中のピクチャの幅ｐｉｃ＿ｗｉｄｔｈ、
－サンプル中のピクチャの高さｐｉｃ＿ｈｅｉｇｈｔ。
プロセスの出力は、以下の通りである。
－予測サンプル値の（ｃｂＷｉｄｔｈ）×（ｃｂＨｅｉｇｈｔ）のアレイｐｒｅｄＳａｍｐｌｅｓＬＸ。

[0238]変数ｓｈｉｆｔ１、ｓｈｉｆｔ２、ｓｈｉｆｔ３、ｏｆｆｓｅｔ１、ｏｆｆｓｅｔ２、およびｏｆｆｓｅｔ３は、次のように導出される。
ｓｈｉｆｔ０は、ｂｉｔＤｅｐｔｈ－６に等しく設定され、ｏｆｆｓｅｔ０は、２^shift1-1に等しくなり、
ｓｈｉｆｔ１は、１１に等しく設定され、ｏｆｆｓｅｔ１は、１０２４に等しくなる。
＜ｉｎｓｅｒｔ＞変数ｈｏｒ＿ｍａｘ、ｖｅｒ＿ｍａｘ、ｈｏｒ＿ｍｉｎおよびｖｅｒ＿ｍｉｎは、フルサンプルユニット中のロケーション（ｘＣｂ，ｙＣｂ）と、現在のコーディングブロックの幅と高さとを指定する２つの変数ｃｂＷｉｄｔｈおよびｃｂＨｅｉｇｈｔと、動きベクトルの水平変化ｄＸと、動きベクトルの垂直変化ｄＹと、動きベクトルｍｖＢａｓｅＳｃａｌｅｄと、サンプル中のピクチャの幅ｐｉｃ＿ｗｉｄｔｈと、サンプル中のピクチャの高さｐｉｃ＿ｈｅｉｇｈｔと、出力としてｈｏｒ＿ｍａｘ、ｖｅｒ＿ｍａｘ、ｈｏｒ＿ｍｉｎおよびｖｅｒ＿ｍｉｎとを用いて０に指定されているプロセスを呼び出すことによって導出される。＜ｉｎｓｅｒｔ＞
[0239]ｘ＝－１．．ｃｂＷｉｄｔｈー１およびｙ＝－１．．ｃｂＨｅｉｇｈｔの場合、以下が適用される。
－動きベクトルｍｖＸは、次のように導出される。

＜ｉｎｓｅｒｔ＞１．１．１．５アフィン動きベクトルのためのクリッピングパラメータの導出
プロセスの入力は、以下の通りである。
－フルサンプルユニット中でのロケーション（ｘＣｂ，ｙＣｂ）、
－現在のコーディングブロックの幅および高さを指定する２つの変数ｃｂＷｉｄｔｈおよびｃｂＨｅｉｇｈｔ、
－動きベクトルの水平変化ｄＸ、
－動きベクトルの垂直変化ｄＹ、
－動きベクトルｍｖＢａｓｅＳｃａｌｅｄ、
－サンプル中のピクチャの幅ｐｉｃ＿ｗｉｄｔｈ、
－サンプル中のピクチャの高さｐｉｃ＿ｈｅｉｇｈｔ。
プロセスの出力は、以下の通りである。
－最大および最小許容動きベクトルの水平および垂直成分を示すｈｏｒ＿ｍａｘ、ｖｅｒ＿ｍａｘ、ｈｏｒ＿ｍｉｎおよびｖｅｒ＿ｍｉｎ。
中心動きベクトルｍｖ＿ｃｅｎｔｅｒは、次のように導出される。

節８．５．３．１０において指定されている動きベクトルのための丸めプロセスは、入力としてｍｖ＿ｃｅｎｔｅｒと、５に等しく設定されたｒｉｇｈｔＳｈｉｆｔと、０に等しく設定されたｌｅｆｔＳｈｉｆｔとを用いて呼び出され、丸められた動きベクトルが、ｍｖ＿ｃｅｎｔｅｒとして戻される。
動きベクトルｍｖ＿ｃｅｎｔｅｒは、次のようにクリッピングされる。

変数ｓｍｖ＿ｈｏｒ＿ｍｉｎ、ｍｖ＿ｖｅｒ＿ｍｉｎ、ｍｖ＿ｈｏｒ＿ｍａｘおよびｍｖ＿ｖｅｒ＿ｍａｘは、次のように導出される。

ただし、ｄｅｖｉａｔｉｏｎＡおよびｄｅｖｉａｔｉｏｎＢは、次のようにｋ＝０．．４について指定される。
ｄｅｖｉａｔｉｏｎＡ［ｋ］＝｛１６，８０，２２４，５１２，１０８８｝、
ｄｅｖｉａｔｉｏｎＢ［ｋ］｛１６，９６，２４０，５２８，１１０４｝。
変数ｈｏｒ＿ｍａｘ＿ｐｉｃ、ｖｅｒ＿ｍａｘ＿ｐｉｃ、ｈｏｒ＿ｍｉｎ＿ｐｉｃおよびｖｅｒ＿ｍｉｎ＿ｐｉｃは、次のように導出される。

最大および最小許容動きベクトルの水平および垂直成分を示す出力ｈｏｒ＿ｍａｘ、ｖｅｒ＿ｍａｘ、ｈｏｒ＿ｍｉｎおよびｖｅｒ＿ｍｉｎは、次のように導出される。

[0240]図１９は、本明細書で説明される例による、クリッピングパラメータを用いたアフィンコーディングのプロセス１９００を示すフローチャートである。いくつかの例では、プロセス１９００は、符号化デバイス１０４または復号デバイス１１２によって実施される。いくつかの例では、プロセス１９００は、デバイスの処理回路によって実行されたとき、デバイスにプロセス１９００の動作を実施させるコンピュータ可読記憶媒体中の命令として実施され得る。

[0241]ブロック１９０２において、プロセス１９００は、ビデオデータから現在のコーディングブロックを取得する動作を含む。そのような動作は、複数のコーディングブロックを処理する連続動作の部分であり得、クリッピングパラメータが、ブロックごとに決定され、現在のブロックの各サンプルのために使用される。１つのブロックがコーディングされ、動作が次のブロックに移動すると、クリッピングパラメータの新しいセットが、新しいブロックのために決定され、新しいブロックの各サンプルのために使用され得る。プロセス１９００のいくつかの例では、制御データは、導出表からの値を備える。

[0242]ブロック１９０４において、プロセス１９００は、現在のコーディングブロックのための制御データを決定する動作を含む。いくつかの例では、制御データは、フルサンプルユニット中のロケーション（ｘＣｂ，ｙＣｂ）と、現在のコーディングブロックの幅および高さを指定する２つの変数ｃｂＷｉｄｔｈおよびｃｂＨｅｉｇｈｔと、動きベクトルの水平変化ｄＸと、動きベクトルの垂直変化ｄＹと、動きベクトルｍｖＢａｓｅＳｃａｌｅｄと、サンプル中のピクチャの幅ｐｉｃ＿ｗｉｄｔｈと、サンプル中のピクチャの高さｐｉｃ＿ｈｅｉｇｈｔとからなる上記の説明された入力を含むことができる。他の例では、他の組合せまたはグループのデータが使用され得る。別の例では、制御データは、フルサンプルユニット中での関連する水平座標と関連する垂直座標とを用いたロケーションと、現在のコーディングブロックの幅を指定する幅変数と、現在のコーディングブロックの高さを指定する高さ変数と、動きベクトルの水平変化と、動きベクトルの垂直変化と、ベーススケーリングされた動きベクトルと、サンプル中の現在のコーディングブロックに関連するピクチャの高さと、サンプル中のピクチャの幅とを備える。

[0243]ブロック１９０６において、プロセス１９００は、制御データから１つまたは複数のアフィン動きベクトルクリッピングパラメータを決定する動作を含む。いくつかの例では、アフィン動きベクトルクリッピングパラメータは、水平最大変数と、水平最小変数と、垂直最大変数と、垂直最小変数とを備える。

[0244]いくつかの例では、水平最小変数は、水平最小ピクチャ値と水平最小動きベクトル値とから選択される最大値によって定義される。いくつかのそのような例では、水平最小変数（ｈｏｒ＿ｍｉｎ）は、水平最小ピクチャ値（ｈｏｒ＿ｍｉｎ＿ｐｉｃ）と水平最小動きベクトル値（ｍｖ＿ｈｏｒ＿ｍｉｎ）とから選択される最大値によってｈｏｒ＿ｍｉｎ＝ｍａｘ（ｈｏｒ＿ｍｉｎ＿ｐｉｃ，ｍｖ＿ｈｏｒ＿ｍｉｎ）として定義される。

[0245]いくつかのそのような例では、水平最小ピクチャ値（ｈｏｒ＿ｍｉｎ＿ｐｉｃ）は、関連する水平座標から決定される。いくつかのそのような例では、ここにおいて、ｈｏｒ＿ｍｉｎ＿ｐｉｃは、ｈｏｒ＿ｍｉｎ＿ｐｉｃ＝（－１２８－ｘＣｂ）として定義される。

[0246]いくつかの例では、水平最小動きベクトル値は、中心動きベクトル値と、ビデオデータに関連する解像度値またはブロックエリアサイズに基づく値のアレイ（たとえば、現在のコーディングブロックの幅×高さ）と、現在のコーディングブロックの幅を指定する幅変数とから決定される。いくつかのそのような例では、ｍｖ＿ｈｏｒ＿ｍｉｎは、ｍｖ＿ｈｏｒ＿ｍｉｎ＝ｍｖ＿ｃｅｎｔｅｒ［０］－ｄｅｖｉａｔｉｏｎＡ［ｌｏｇ２ＣｂＷｉｄｔｈ－３］として定義され、ここで、ｍｖ＿ｃｅｎｔｅｒ［０］は、中心動きベクトル値であり、ｄｅｖｉａｔｉｏｎＡは、ビデオデータに関連する解像度値またはブロックエリアサイズに基づく値のアレイ（たとえば、現在のコーディングブロックの幅×高さ）であり、ｃｂＷｉｄｔｈは、現在のコーディングブロックの幅を指定する幅変数である。

[0247]いくつかの例では、中心動きベクトル値は、ベーススケーリングされた動きベクトルと、動きベクトルの水平変化と、幅変数と、高さ変数とから決定される。いくつかのそのような例では、中心動きベクトル値は、次のように定義される。

[0248]いくつかの例では、ベーススケーリングされた動きベクトルは、現在のコーディングブロックの左上隅に対応し、制御点動きベクトル値から決定される。いくつかの例では、ｍｖＢａｓｅＳｃａｌｅｄは、ルーマコーディングブロックの左上隅に対応し、ｍｖＢａｓｅＳｃａｌｅｄ［０］＝ｃｐＭｖＬＸ［０］［０］＜＜７、ｍｖＢａｓｅＳｃａｌｅｄ［１］＝ｃｐＭｖＬＸ［０］［１］＜＜７のように定義され、ここで、ｃｐＭｖＬＸは、制御点動きベクトルである。

[0249]ブロック１９０６の上記の態様は、水平最小変数（ｈｏｒ＿ｍｉｎ）に関連するパラメータを決定するための動作について主に説明する。ベクトルクリッピングのための水平、垂直、最大、および最小パラメータの他の組合せの各々は、水平最大変数と、垂直最大変数と、垂直最小変数とのための要素を含む本明細書で説明される同様の例を有することができる。

[0250]いくつかの例では、水平最大変数は、水平最大ピクチャ値と水平最大動きベクトル値とから選択される最小値によって定義される。いくつかの例では、水平最大ピクチャ値は、ピクチャの幅と、関連する水平座標と、幅変数とから決定される。いくつかの例では、水平最大動きベクトル値は、中心動きベクトル値と、ビデオデータに関連する解像度値またはブロックエリアサイズに基づく値のアレイ（たとえば、現在のコーディングブロックの幅×高さ）と、現在のコーディングブロックの幅を指定する幅変数とから決定される。いくつかの例では、中心動きベクトル値は、ベーススケーリングされた動きベクトルと、動きベクトルの水平変化と、幅変数と、高さ変数とから決定される。いくつかの例では、ベーススケーリングされた動きベクトルは、現在のコーディングブロックの隅に対応し、制御点動きベクトル値から決定される。

[0251]いくつかの例では、垂直最大変数は、垂直最大ピクチャ値と垂直最大動きベクトル値とから選択される最小値によって定義される。いくつかの例では、垂直最大ピクチャ値は、ピクチャの高さと、関連する垂直座標と、高さ変数とから決定される。いくつかの例では、垂直最大動きベクトル値は、中心動きベクトル値と、ビデオデータに関連する解像度値またはブロックエリアサイズに基づく値のアレイ（たとえば、現在のコーディングブロックの幅×高さ）と、現在のコーディングブロックの幅を指定する高さ変数とから決定される。

[0252]いくつかの例では、垂直最小変数は、垂直最小ピクチャ値と垂直最小動きベクトル値とから選択される最大値によって定義される。いくつかの例では、垂直最小ピクチャ値は、関連する垂直座標から決定される。いくつかの例では、垂直最小動きベクトル値は、中心動きベクトル値と、ビデオデータに関連する解像度値またはブロックエリアサイズに基づく値のアレイ（たとえば、現在のコーディングブロックの幅×高さ）と、現在のコーディングブロックの高さを指定する高さ変数とから決定される。

[0253]ブロック１９０６の部分として、水平最大変数と、垂直最大変数と、垂直最小変数とのための要素を含む導出を含むパラメータの追加の特定の導出が実施され得る。いくつかの例では、以下を含むこれらの変数が本明細書で説明される詳細および本明細書で説明される他のそのような詳細に従って決定され得る。

ただし、ｄｅｖｉａｔｉｏｎＡおよびｄｅｖｉａｔｉｏｎＢは、ｄｅｖｉａｔｉｏｎＡ［ｋ］＝｛１６，８０，２２４，５１２，１０８８｝およびｄｅｖｉａｔｉｏｎＢ［ｋ］｛１６，９６，２４０，５２８，１１０４｝としてｋ＝０．．４について指定される。

他の例では、クリッピングのためのパラメータを決定するための他の同様のプロセスが使用され得る。

[0254]ブロック１９０８において、プロセス１９００は、現在のコーディングブロックのサンプルを選択する動作を含む。上記で説明されたように、現在のブロックのためのサンプルの選択された数が使用され得るか、または現在のブロック各サンプルが使用され得る。ＥＶＣベースの例示的なアフィン予測が異なる手法を用いて実装され得る。１つの例示的なＥＶＣ手法は、サブブロックのための並進運動予測を利用する。ＥＶＣアフィン予測の別の例は、より精細な粒度ｙ（たとえば、ピクセルワイズ）の動き予測を使用する。異なる手法は、サンプルを選択するために関連する動作を有することができる。

[0255]ブロック１９１０において、プロセス１９００は、現在のコーディングブロックのサンプルのためのアフィン動きベクトルを決定する動作を含む。いくつかの例では、現在のブロックのサンプルのためのアフィン動きベクトルは、第１のベーススケーリングされた動きベクトル値と、動きベクトル値の第１の水平変化と、動きベクトル値の第１の垂直変化と、第２のベーススケーリングされた動きベクトル値と、動きベクトル値の第２の水平変化と、動きベクトル値の第２の垂直変化と、サンプルの水平座標と、サンプルの垂直座標とに従って決定される。いくつかの例では、ｍｖＸとして指定される動きベクトルは、ｍｖＸ［０］＝（ｍｖＢａｓｅＳｃａｌｅｄ［０］＋ｄＸ［０］＊ｘ＋ｄＹ［０］＊ｙ）、ｍｖＸ［１］＝（ｍｖＢａｓｅＳｃａｌｅｄ［１］＋ｄＸ［１］＊ｘ＋ｄＹ［１］＊ｙを使用して導出され得る。

[0256]ブロック１９１２において、プロセス１９００は、クリッピングされたアフィン動きベクトルを生成するために１つまたは複数のアフィン動きベクトルクリッピングパラメータを使用してアフィン動きベクトルをクリッピングする動作を含む。いくつかの例では、アフィン動きベクトルは、ｍｖＸ［０］＝Ｃｌｉｐ３（ｈｏｒ＿ｍｉｎ，ｈｏｒ＿ｍａｘ，ｍｖＸ［０］）、およびｍｖＸ［１］＝Ｃｌｉｐ３（ｖｅｒ＿ｍｉｎ，ｖｅｒ＿ｍａｘ，ｍｖＸ［１］）に従ってクリッピングされる。

[0257]上記のブロックに加えて、プロセス１９００のいくつかの要素は、追加の動作、介在する動作、またはいくつかのブロックの動作の繰返しを含むことができる。いくつかの例では、そのような追加の動作は、現在のコーディングブロックに関連する参照ピクチャを識別することと、アフィン動きベクトルクリッピングパラメータによって定義された参照ピクチャの部分を記憶することとを行う動作を含むことができる。いくつかのそのような動作は、参照ピクチャの部分が、現在のコーディングブロックを使用したアフィン動き処理動作のためにメモリバッファ中に記憶されるところで機能することができる。

[0258]同様に、いくつかの繰返し動作は、ビデオデータから複数の現在のコーディングブロックを連続的に取得することと、複数の現在のコーディングブロックのブロックのためにコーディングブロックごとにアフィン動きベクトルクリッピングパラメータのセットを決定することと、複数の現在のコーディングブロックのためのブロックごとのアフィン動きベクトルクリッピングパラメータのセットを使用して対応する参照ピクチャの部分をフェッチすることとを行う動作を含むことができる。任意のそのような例では、動作は、クリッピングされたアフィン動きベクトルによって示される参照ピクチャからの参照ピクチャデータを使用して現在のブロックを処理することをさらに含むことができる。そのようなブロックは、ルーマコーディングブロックであるか、またはアフィンコーディングモードでコーディングされているビデオデータのための任意の他のそのようなブロックであり得る。そのようなプロセス１９００は、メモリと１つまたは複数のプロセッサとをもつデバイスを含む本明細書における任意のデバイスによって実行され得る。そのようなデバイスは、ディスプレイデバイスをもつデバイスと、ディスプレイデバイスは、１つまたは複数のプロセッサに結合され、ビデオデータから画像を表示するように構成される、１つまたは複数のプロセッサに結合された１つまたは複数のワイヤレスインターフェースと、１つまたは複数のワイヤレスインターフェースは、１つまたは複数のベースバンドプロセッサと１つまたは複数のトランシーバとを備える、を含むことができる。他のそのようなデバイスは、本明細書で説明される他の構成要素を含むことができる。

[0259]いくつかの例では、本明細書で説明されるプロセスは、符号化デバイス１０４、復号デバイス１１２、および／または任意の他のコンピューティングデバイスなどのコンピューティングデバイスまたは装置によって実施され得る。いくつかの場合には、コンピューティングデバイスまたは装置は、本明細書で説明されるプロセスのステップを行うように構成されたデバイスのプロセッサ、マイクロプロセッサ、マイクロコンピュータ、または他の構成要素を含み得る。いくつかの例では、コンピューティングデバイスまたは装置は、ビデオフレームを含むビデオデータ（たとえば、ビデオシーケンス）をキャプチャするように構成されたカメラを含み得る。たとえば、コンピューティングデバイスは、ビデオコーデックを含むことも含まないこともあるカメラデバイスを含み得る。別の例として、コンピューティングデバイスは、カメラをもつモバイルデバイス（たとえば、デジタルカメラ、ＩＰカメラなどのカメラデバイス、カメラを含むモバイルフォンもしくはタブレット、またはカメラをもつ他のタイプのデバイス）を含み得る。場合によっては、コンピューティングデバイスは、画像を表示するためのディスプレイを含み得る。いくつかの例では、ビデオデータをキャプチャするカメラまたは他のキャプチャデバイスは、コンピューティングデバイスとは別個であり、その場合、コンピューティングデバイスは、キャプチャされたビデオデータを受信する。コンピューティングデバイスは、ビデオデータを通信するように構成されたネットワークインターフェース、トランシーバ、および／または送信機をさらに含み得る。ネットワークインターフェース、トランシーバ、および／または送信機は、インターネットプロトコル（ＩＰ）ベースのデータまたは他のネットワークデータを通信するように構成され得る。

[0260]本明細書で説明されるプロセスは、ハードウェア、コンピュータ命令、またはそれらの組合せで実装され得る。コンピュータ命令のコンテキストでは、動作は、１つまたは複数のプロセッサによって実行されたとき、具陳された動作を実施する１つまたは複数のコンピュータ可読記憶媒体に記憶されたコンピュータ実行可能命令を表す。概して、コンピュータ実行可能命令は、特定の機能を実施するか、または特定のデータタイプを実装する、ルーチン、プログラム、オブジェクト、構成要素、データ構造などを含む。動作が説明される順序は、限定として解釈されるものではなく、任意の数の説明される動作は、プロセスを実装するために任意の順序でおよび／または並行して組み合わせられ得る。

[0261]さらに、本明細書で説明されるプロセスは、実行可能命令で構成された１つもしくは複数のコンピュータシステムの制御下で実施され得、まとめて１つもしくは複数のプロセッサ上で、ハードウェアによって、またはそれらの組合せで実行するコード（たとえば、実行可能命令、１つもしくは複数のコンピュータプログラム、または１つもしくは複数のアプリケーション）として実装され得る。上述のように、コードは、たとえば、１つまたは複数のプロセッサによって実行可能な複数の命令を備えるコンピュータプログラムの形態で、コンピュータ可読または機械可読記憶媒体に記憶され得る。コンピュータ可読または機械可読記憶媒体は非一時的であり得る。

[0262]本明細書で説明されたコーディング技法は、例示的なビデオ符号化および復号システム（たとえば、システム１００）において実装され得る。いくつかの例では、システムは、宛先デバイスによって後で復号されるべき符号化ビデオデータを与えるソースデバイスを含む。特に、ソースデバイスは、コンピュータ可読媒体を介してビデオデータを宛先デバイスに与える。ソースデバイスおよび宛先デバイスは、デスクトップコンピュータ、ノートブック（すなわち、ラップトップ）コンピュータ、タブレットコンピュータ、セットトップボックス、いわゆる「スマート」フォンなどの電話ハンドセット、いわゆる「スマート」パッド、テレビジョン、カメラ、ディスプレイデバイス、デジタルメディアプレーヤ、ビデオゲームコンソール、ビデオストリーミングデバイスなどを含む、広範囲にわたるデバイスのいずれかを備え得る。いくつかの場合には、ソースデバイスおよび宛先デバイスはワイヤレス通信のために装備され得る。

[0263]宛先デバイスは、コンピュータ可読媒体を介して復号されるべき符号化ビデオデータを受信し得る。コンピュータ可読媒体は、ソースデバイスから宛先デバイスに符号化ビデオデータを移動することが可能な任意のタイプの媒体またはデバイスを備え得る。一例では、コンピュータ可読媒体は、ソースデバイスが符号化ビデオデータを宛先デバイスにリアルタイムで直接送信することを可能にするための通信媒体を備え得る。符号化ビデオデータは、ワイヤレス通信プロトコルなどの通信規格に従って変調され、宛先デバイスに送信され得る。通信媒体は、無線周波数（ＲＦ）スペクトルまたは１つもしくは複数の物理伝送線路など、任意のワイヤレスまたはワイヤード通信媒体を備え得る。通信媒体は、ローカルエリアネットワーク、ワイドエリアネットワーク、またはインターネットなどのグローバルネットワークなど、パケットベースネットワークの一部を形成し得る。通信媒体は、ソースデバイスから宛先デバイスへの通信を促進するために有用であり得る、ルータ、スイッチ、基地局、または任意の他の機器を含み得る。

[0264]いくつかの例では、符号化データは、出力インターフェースから記憶デバイスに出力され得る。同様に、符号化データは、入力インターフェースによって記憶デバイスからアクセスされ得る。記憶デバイスは、ハードドライブ、Ｂｌｕ－ｒａｙ（登録商標）ディスク、ＤＶＤ、ＣＤ－ＲＯＭ、フラッシュメモリ、揮発性もしくは不揮発性メモリ、または符号化ビデオデータを記憶するための任意の他の好適なデジタル記憶媒体など、様々な分散されたまたはローカルにアクセスされるデータ記憶媒体のいずれかを含み得る。さらなる一例では、記憶デバイスは、ソースデバイスによって生成された符号化ビデオを記憶し得るファイルサーバまたは別の中間記憶デバイスに対応し得る。宛先デバイスは、ストリーミングまたはダウンロードを介して記憶デバイスから記憶されたビデオデータにアクセスし得る。ファイルサーバは、符号化ビデオデータを記憶することと、その符号化ビデオデータを宛先デバイスに送信することとが可能な任意のタイプのサーバであり得る。例示的なファイルサーバは、（たとえば、ウェブサイトのための）ウェブサーバ、ＦＴＰサーバ、ネットワーク接続ストレージ（ＮＡＳ）デバイス、またはローカルディスクドライブを含む。宛先デバイスは、インターネット接続を含む、任意の標準のデータ接続を通して符号化ビデオデータにアクセスし得る。接続は、ワイヤレスチャネル（たとえば、Ｗｉ－Ｆｉ接続）、ワイヤード接続（たとえば、ＤＳＬ、ケーブルモデムなど）、または、ファイルサーバに記憶された符号化ビデオデータにアクセスするのに適した、両方の組合せを含み得る。ストレージデバイスからの符号化ビデオデータの送信は、ストリーミング送信、ダウンロード送信、またはそれらの組合せであり得る。

[0265]本開示の技法は、必ずしもワイヤレス適用例または設定に限定されるとは限らない。本技法は、オーバージエアテレビジョン放送、ケーブルテレビジョン送信、衛星テレビジョン送信、動的適応ストリーミングオーバーＨＴＴＰ（ＤＡＳＨ）などのインターネットストリーミングビデオ送信、データ記憶媒体上に符号化されたデジタルビデオ、データ記憶媒体に記憶されたデジタルビデオの復号、または他の適用例など、様々なマルチメディア適用例のいずれかをサポートするビデオコーディングに適用され得る。いくつかの例では、システムは、ビデオストリーミング、ビデオ再生、ビデオブロードキャスティング、および／またはビデオテレフォニーなどの適用例をサポートするために、一方向または双方向のビデオ送信をサポートするように構成され得る。

[0266]一例では、ソースデバイスは、ビデオソースと、ビデオエンコーダと、出力インターフェースとを含む。宛先デバイスは、入力インターフェースと、ビデオデコーダと、ディスプレイデバイスとを含み得る。ソースデバイスのビデオエンコーダは、本明細書で開示される技法を適用するように構成され得る。他の例では、ソースデバイスおよび宛先デバイスは、他の構成要素または構成を含み得る。たとえば、ソースデバイスは、外部カメラなどの外部ビデオソースからビデオデータを受信し得る。同様に、宛先デバイスは、一体型ディスプレイデバイスを含むのではなく、外部ディスプレイデバイスとインターフェースし得る。

[0267]上記の例示的なシステムは一例にすぎない。ビデオデータを並行して処理するための技法は、任意のデジタルビデオ符号化および／または復号デバイスによって実施され得る。概して、本開示の技法はビデオ符号化デバイスによって実施されるが、本技法は、一般に「コーデック」と呼ばれるビデオエンコーダ／デコーダによっても実施され得る。その上、本開示の技法はビデオプリプロセッサによっても実施され得る。ソースデバイスおよび宛先デバイスは、ソースデバイスが宛先デバイスに送信するためのコード化ビデオデータを生成するような、コーディングデバイスの例にすぎない。いくつかの例では、ソースデバイスおよび宛先デバイスは、デバイスの各々がビデオ符号化構成要素とビデオ復号構成要素とを含むように、実質的に対称的に動作し得る。したがって、例示的なシステムは、たとえば、ビデオストリーミング、ビデオ再生、ビデオブロードキャスティング、またはビデオテレフォニーのための、ビデオデバイス間の一方向または双方向のビデオ送信をサポートし得る。

[0268]ビデオソースは、ビデオカメラなどのビデオキャプチャデバイス、前にキャプチャされたビデオを含んでいるビデオアーカイブ、および／またはビデオコンテンツプロバイダからビデオを受信するためのビデオフィードインターフェースを含み得る。さらなる代替として、ビデオソースは、ソースビデオとしてのコンピュータグラフィックスベースのデータ、またはライブビデオとアーカイブビデオとコンピュータ生成ビデオとの組合せを生成し得る。いくつかの場合には、ビデオソースがビデオカメラである場合、ソースデバイスおよび宛先デバイスは、いわゆるカメラフォンまたはビデオフォンを形成し得る。ただし、上述のように、本開示で説明される技法は、概してビデオコーディングに適用可能であり得、ワイヤレスおよび／またはワイヤード適用例に適用され得る。各場合において、キャプチャされたビデオ、プリキャプチャされたビデオ、またはコンピュータ生成ビデオは、ビデオエンコーダによって符号化され得る。符号化ビデオ情報は、出力インターフェースによってコンピュータ可読媒体上に出力され得る。

[0269]述べられたように、コンピュータ可読媒体は、ワイヤレスブロードキャストもしくはワイヤードネットワーク送信などの一時媒体、またはハードディスク、フラッシュドライブ、コンパクトディスク、デジタルビデオディスク、Ｂｌｕ－ｒａｙディスク、もしくは他のコンピュータ可読媒体などの記憶媒体（すなわち、非一時的記憶媒体）を含み得る。いくつかの例では、ネットワークサーバ（図示せず）は、たとえば、ネットワーク送信を介して、ソースデバイスから符号化ビデオデータを受信し、その符号化ビデオデータを宛先デバイスに与え得る。同様に、ディスクスタンピング設備など、媒体製造設備のコンピューティングデバイスは、ソースデバイスから符号化ビデオデータを受信し、その符号化ビデオデータを含んでいるディスクを作り出し得る。したがって、コンピュータ可読媒体は、様々な例において、様々な形態の１つまたは複数のコンピュータ可読媒体を含むことが理解され得る。

[0270]宛先デバイスの入力インターフェースはコンピュータ可読媒体から情報を受信する。コンピュータ可読媒体の情報は、ビデオエンコーダによって定義され、またビデオデコーダによって使用される、ブロックおよび他のコード化ユニット、たとえば、ピクチャグループ（ＧＯＰ）の特性および／または処理を記述するシンタックス要素を含む、シンタックス情報を含み得る。ディスプレイデバイスは、復号ビデオデータをユーザに対して表示し、陰極線管（ＣＲＴ）、液晶ディスプレイ（ＬＣＤ）、プラズマディスプレイ、有機発光ダイオード（ＯＬＥＤ）ディスプレイ、または別のタイプのディスプレイデバイスなど、様々なディスプレイデバイスのいずれかを備え得る。本出願の様々な実施形態が説明された。

[0271]符号化デバイス１０４および復号デバイス１１２の具体的な詳細が、それぞれ図２０および図２１に示されている。図２０は、本開示で説明される技法のうちの１つまたは複数を実装し得る例示的な符号化デバイス１０４を示すブロック図である。符号化デバイス１０４は、たとえば、本明細書で説明されるシンタックス構造（たとえば、ＶＰＳ、ＳＰＳ、ＰＰＳ、または他のシンタックス要素のシンタックス構造）を生成し得る。符号化デバイス１０４は、ビデオスライス内のビデオブロックのイントラ予測コーディングおよびインター予測コーディングを実施し得る。前に説明されたように、イントラコーディングは、所与のビデオフレームまたはピクチャ内の空間冗長性を低減または除去するために、空間予測に少なくとも部分的に依拠する。インターコーディングは、ビデオシーケンスの隣接フレームまたは周囲のフレーム内の時間冗長性を低減または除去するために、時間予測に少なくとも部分的に依拠する。イントラモード（Ｉモード）は、いくつかの空間ベースの圧縮モードのいずれかを指すことがある。単方向予測（Ｐモード）または双予測（Ｂモード）などのインターモードは、いくつかの時間ベースの圧縮モードのいずれかを指すことがある。

[0272]符号化デバイス１０４は、区分ユニット３５と、予測処理ユニット４１と、フィルタユニット６３と、ピクチャメモリ６４と、加算器５０と、変換処理ユニット５２と、量子化ユニット５４と、エントロピー符号化ユニット５６とを含む。予測処理ユニット４１は、動き推定ユニット４２と、動き補償ユニット４４と、イントラ予測処理ユニット４６とを含む。ビデオブロック再構築のために、符号化デバイス１０４はまた、逆量子化ユニット５８と、逆変換処理ユニット６０と、加算器６２とを含む。フィルタユニット６３は、デブロッキングフィルタ、適応ループフィルタ（ＡＬＦ）、およびサンプル適応オフセット（ＳＡＯ）フィルタなど、１つまたは複数のループフィルタを表現するものとする。フィルタユニット６３は、図２０では、ループ内フィルタであるとして示されているが、他の構成では、フィルタユニット６３はループ後フィルタとして実装され得る。後処理デバイス５７は、符号化デバイス１０４によって生成された符号化ビデオデータに対して追加の処理を実施し得る。本開示の技法は、いくつかの事例では、符号化デバイス１０４によって実装され得る。しかしながら、他の事例では、本開示の技法のうちの１つまたは複数は、後処理デバイス５７によって実装され得る。

[0273]図２０に示されているように、符号化デバイス１０４はビデオデータを受信し、区分ユニット３５はデータをビデオブロックに区分する。区分はまた、たとえば、ＬＣＵおよびＣＵの４分木構造に従って、スライス、スライスセグメント、タイル、または他のより大きいユニットへの区分、ならびにビデオブロック区分を含み得る。符号化デバイス１０４は、概して、符号化されるべきビデオスライス内のビデオブロックを符号化する構成要素を示す。スライスは、複数のビデオブロックに（および場合によっては、タイルと呼ばれるビデオブロックのセットに）分割され得る。予測処理ユニット４１は、誤差結果（たとえば、コーディングレートおよびひずみレベルなど）に基づいて現在のビデオブロックについて、複数のイントラ予測コーディングモードのうちの１つ、または複数のインター予測コーディングモードのうちの１つなど、複数の可能なコーディングモードのうちの１つを選択し得る。予測処理ユニット４１は、得られたイントラコード化ブロックまたはインターコード化ブロックを、残差ブロックデータを生成するために加算器５０に与え、参照ピクチャとして使用するための符号化ブロックを再構築するために加算器６２に与え得る。

[0274]予測処理ユニット４１内のイントラ予測処理ユニット４６は、空間圧縮を行うために、コーディングされるべき現在のブロックと同じフレームまたはスライス中の１つまたは複数の隣接ブロックに対して現在のビデオブロックのイントラ予測コーディングを実施し得る。予測処理ユニット４１内の動き推定ユニット４２および動き補償ユニット４４は、時間圧縮を行うために、１つまたは複数の参照ピクチャ中の１つまたは複数の予測ブロックに対して現在のビデオブロックのインター予測コーディングを実施する。

[0275]動き推定ユニット４２は、ビデオシーケンスに対する所定のパターンに従って、ビデオスライスのためのインター予測モードを決定するように構成され得る。所定のパターンは、シーケンス中のビデオスライスを、Ｐスライス、Ｂスライス、またはＧＰＢスライスに指定し得る。動き推定ユニット４２と動き補償ユニット４４とは、高度に統合され得るが、概念的な目的のために別個に示されている。動き推定ユニット４２によって実施される動き推定は、ビデオブロックについての動きを推定する動きベクトルを生成するプロセスである。動きベクトルは、たとえば、参照ピクチャ内の予測ブロックに対する、現在のビデオフレームまたはピクチャ内のビデオブロックの予測ユニット（ＰＵ）の変位を示し得る。

[0276]予測ブロックは、絶対差分和（ＳＡＤ）、２乗差分和（ＳＳＤ）、または他の差分メトリックによって決定され得るピクセル差分に関して、コーディングされるべきビデオブロックのＰＵにぴったり一致することがわかるブロックである。いくつかの例では、符号化デバイス１０４は、ピクチャメモリ６４に記憶された参照ピクチャのサブ整数ピクセル位置についての値を計算し得る。たとえば、符号化デバイス１０４は、参照ピクチャの１／４ピクセル位置、１／８ピクセル位置、または他の分数ピクセル位置の値を補間し得る。したがって、動き推定ユニット４２は、フルピクセル位置および分数ピクセル位置に対して動き探索を実施し、分数ピクセル精度で動きベクトルを出力し得る。

[0277]動き推定ユニット４２は、ＰＵの位置を参照ピクチャの予測ブロックの位置と比較することによって、インターコード化スライス中のビデオブロックのＰＵについての動きベクトルを計算する。参照ピクチャは、第１の参照ピクチャリスト（リスト０）または第２の参照ピクチャリスト（リスト１）から選択され得、それらの各々は、ピクチャメモリ６４に記憶された１つまたは複数の参照ピクチャを識別する。動き推定ユニット４２は、計算された動きベクトルをエントロピー符号化ユニット５６と動き補償ユニット４４とに送る。

[0278]動き補償ユニット４４によって実施される動き補償は、動き推定によって決定された動きベクトルに基づいて予測ブロックをフェッチまたは生成すること、場合によっては、サブピクセル精度への補間を実施することを伴い得る。現在のビデオブロックのＰＵのための動きベクトルを受信すると、動き補償ユニット４４は、動きベクトルが参照ピクチャリストにおいて指す予測ブロックの位置を特定し得る。符号化デバイス１０４は、コーディングされている現在のビデオブロックのピクセル値から予測ブロックのピクセル値を減算し、ピクセル差分値を形成することによって、残差ビデオブロックを形成する。ピクセル差分値は、ブロックのための残差データを形成し、ルーマ差分成分とクロマ差分成分の両方を含み得る。加算器５０は、減算演算を実施する１つまたは複数の構成要素を表現する。動き補償ユニット４４はまた、ビデオスライスのビデオブロックを復号する際に復号デバイス１１２が使用するための、ビデオブロックとビデオスライスとに関連するシンタックス要素を生成し得る。

[0279]イントラ予測処理ユニット４６は、上記で説明されたように、動き推定ユニット４２と動き補償ユニット４４とによって実施されるインター予測の代替として、現在ブロックをイントラ予測し得る。特に、イントラ予測処理ユニット４６は、現在ブロックを符号化するために使用すべきイントラ予測モードを決定し得る。いくつかの例では、イントラ予測処理ユニット４６は、たとえば、別個の符号化パス中に様々なイントラ予測モードを使用して現在ブロックを符号化し得、イントラ予測処理ユニット４６は、テストされたモードから使用するのに適切なイントラ予測モードを選択し得る。たとえば、イントラ予測処理ユニット４６は、様々なテストされたイントラ予測モードのためにレートひずみ分析を使用してレートひずみ値を計算し得、テストされたモードの中で最良のレートひずみ特性を有するイントラ予測モードを選択し得る。レートひずみ分析は、概して、符号化ブロックと、符号化ブロックを作り出すために符号化されたブロックと元の符号化されていないブロックとの間のひずみ（または誤差）の量、ならびに符号化ブロックを作り出すために使用されるビットレート（すなわち、ビット数）を決定する。イントラ予測処理ユニット４６は、どのイントラ予測モードがブロックについて最良のレートひずみ値を呈するかを決定するために、様々な符号化ブロックのためのひずみおよびレートから比を計算し得る。

[0280]いずれの場合も、ブロックのためのイントラ予測モードを選択した後に、イントラ予測処理ユニット４６は、ブロックのための選択されたイントラ予測モードを示す情報をエントロピー符号化ユニット５６に与え得る。エントロピー符号化ユニット５６は、選択されたイントラ予測モードを示す情報を符号化し得る。符号化デバイス１０４は、様々なブロックのための符号化コンテキストの構成データ定義、ならびにコンテキストの各々について使用すべき、最確イントラ予測モード、イントラ予測モードインデックステーブル、および修正されたイントラ予測モードインデックステーブルの指示を送信ビットストリーム中に含め得る。ビットストリーム構成データは、複数のイントラ予測モードインデックステーブルと、（コードワードマッピングテーブルとも呼ばれる）複数の修正されたイントラ予測モードインデックステーブルとを含み得る。

[0281]予測処理ユニット４１が、インター予測またはイントラ予測のいずれかを介して、現在のビデオブロックのための予測ブロックを生成した後、符号化デバイス１０４は、現在のビデオブロックから予測ブロックを減算することによって残差ビデオブロックを形成する。残差ブロック中の残差ビデオデータは、１つまたは複数のＴＵ中に含まれ、変換処理ユニット５２に適用され得る。変換処理ユニット５２は、離散コサイン変換（ＤＣＴ）または概念的に同様の変換などの変換を使用して、残差ビデオデータを残差変換係数に変換する。変換処理ユニット５２は、残差ビデオデータをピクセル領域から周波数領域などの変換領域に変換し得る。

[0282]変換処理ユニット５２は、得られた変換係数を量子化ユニット５４に送り得る。量子化ユニット５４は、ビットレートをさらに低減するために、変換係数を量子化する。量子化プロセスは、係数の一部または全部に関連するビット深度を低減し得る。量子化の程度は、量子化パラメータを調整することによって修正され得る。いくつかの例では、量子化ユニット５４は、量子化変換係数を含む行列の走査を実施し得る。代替的に、エントロピー符号化ユニット５６が走査を実施し得る。

[0283]量子化の後に、エントロピー符号化ユニット５６は、量子化変換係数をエントロピー符号化する。たとえば、エントロピー符号化ユニット５６は、コンテキスト適応型可変長コーディング（ＣＡＶＬＣ）、コンテキスト適応型バイナリ算術コーディング（ＣＡＢＡＣ）、シンタックスベースコンテキスト適応型バイナリ算術コーディング（ＳＢＡＣ）、確率間隔区分エントロピー（ＰＩＰＥ）コーディングまたは別のエントロピー符号化技法を実施し得る。エントロピー符号化ユニット５６によるエントロピー符号化の後に、符号化ビットストリームは復号デバイス１１２に送信されるか、または復号デバイス１１２が後で送信するかもしくは取り出すためにアーカイブされ得る。エントロピー符号化ユニット５６はまた、コーディングされている現在のビデオスライスのための動きベクトルと他のシンタックス要素とをエントロピー符号化し得る。

[0284]逆量子化ユニット５８および逆変換処理ユニット６０は、参照ピクチャの参照ブロックとして後で使用するためにピクセル領域において残差ブロックを再構築するために、それぞれ逆量子化および逆変換を適用する。動き補償ユニット４４は、残差ブロックを参照ピクチャリスト内の参照ピクチャのうちの１つの予測ブロックに加算することによって参照ブロックを計算し得る。動き補償ユニット４４はまた、動き推定において使用するためのサブ整数ピクセル値を計算するために、再構築された残差ブロックに１つまたは複数の補間フィルタを適用し得る。加算器６２は、ピクチャメモリ６４に記憶するための参照ブロックを作り出すために、再構築された残差ブロックを動き補償ユニット４４によって作り出された動き補償予測ブロックに加算する。参照ブロックは、後続のビデオフレームまたはピクチャ中のブロックをインター予測するために、動き推定ユニット４２および動き補償ユニット４４によって参照ブロックとして使用され得る。

[0285]符号化デバイス１０４は、本明細書で説明される技法のいずれかを実施し得る。本開示のいくつかの技法は、概して符号化デバイス１０４に関して説明されたが、上述のように、本開示の技法のうちのいくつかは後処理デバイス５７によっても実装され得る。

[0286]図２０の符号化デバイス１０４は、本明細書で説明される変換コーディング技法のうちの１つまたは複数を実施するように構成されたビデオエンコーダの一例を表す。符号化デバイス１０４は、図２１に関して上記で説明されたプロセスを含む、本明細書で説明される技法のいずれかを実施し得る。

[0287]図２１は、例示的な復号デバイス１１２を示すブロック図である。復号デバイス１１２は、エントロピー復号ユニット８０と、予測処理ユニット８１と、逆量子化ユニット８６と、逆変換処理ユニット８８と、加算器９０と、フィルタユニット９１と、ピクチャメモリ９２とを含む。予測処理ユニット８１は、動き補償ユニット８２と、イントラ予測処理ユニット８４とを含む。復号デバイス１１２は、いくつかの例では、図２０からの符号化デバイス１０４に関して説明された符号化パスとは概して逆の復号パスを実施し得る。

[0288]復号プロセス中に、復号デバイス１１２は、符号化デバイス１０４によって送られた、符号化ビデオスライスのビデオブロックと、関連するシンタックス要素とを表す符号化ビデオビットストリームを受信する。いくつかの実施形態では、復号デバイス１１２は、符号化デバイス１０４から符号化ビデオビットストリームを受信し得る。いくつかの実施形態では、復号デバイス１１２は、サーバ、メディアアウェアネットワーク要素（ＭＡＮＥ）、ビデオエディタ／スプライサ、または上記で説明された技法のうちの１つまたは複数を実装するように構成された他のそのようなデバイスなど、ネットワークエンティティ７９から符号化ビデオビットストリームを受信し得る。ネットワークエンティティ７９は、符号化デバイス１０４を含むことも、含まないこともある。本開示で説明される技法のうちのいくつかは、ネットワークエンティティ７９が符号化ビデオビットストリームを復号デバイス１１２に送信するより前に、ネットワークエンティティ７９によって実装され得る。いくつかのビデオ復号システムでは、ネットワークエンティティ７９および復号デバイス１１２は別個のデバイスの部分であり得るが、他の事例では、ネットワークエンティティ７９に関して説明される機能は、復号デバイス１１２を備える同じデバイスによって実施され得る。

[0289]復号デバイス１１２のエントロピー復号ユニット８０は、量子化係数と、動きベクトルと、他のシンタックス要素とを生成するためにビットストリームをエントロピー復号する。エントロピー復号ユニット８０は、動きベクトルと他のシンタックス要素とを予測処理ユニット８１に転送する。復号デバイス１１２は、ビデオスライスレベルおよび／またはビデオブロックレベルのシンタックス要素を受信し得る。エントロピー復号ユニット８０は、ＶＰＳ、ＳＰＳ、およびＰＰＳなど、１つまたは複数のパラメータセット中の固定長シンタックス要素と可変長シンタックス要素の両方を処理し、パースし得る。

[0290]ビデオスライスがイントラコード化（Ｉ）スライスとしてコーディングされたとき、予測処理ユニット８１のイントラ予測処理ユニット８４は、シグナリングされたイントラ予測モードと、現在のフレームまたはピクチャの前に復号されたブロックからのデータとに基づいて、現在のビデオスライスのビデオブロックのための予測データを生成し得る。ビデオフレームがインターコード化（すなわち、Ｂ、ＰまたはＧＰＢ）スライスとしてコーディングされたとき、予測処理ユニット８１の動き補償ユニット８２は、エントロピー復号ユニット８０から受信された動きベクトルおよび他のシンタックス要素に基づいて、現在のビデオスライスのビデオブロックのための予測ブロックを作り出す。予測ブロックは、参照ピクチャリスト内の参照ピクチャのうちの１つから作り出され得る。復号デバイス１１２は、ピクチャメモリ９２に記憶された参照ピクチャに基づいて、デフォルトの構築技法を使用して、参照フレームリスト、すなわち、リスト０とリスト１とを構築し得る。

[0291]動き補償ユニット８２は、動きベクトルと他のシンタックス要素とをパースすることによって現在のビデオスライスのビデオブロックのための予測情報を決定し、復号されている現在のビデオブロックのための予測ブロックを作り出すために、その予測情報を使用する。たとえば、動き補償ユニット８２は、ビデオスライスのビデオブロックをコーディングするために使用される予測モード（たとえば、イントラまたはインター予測）と、インター予測スライスタイプ（たとえば、Ｂスライス、Ｐスライス、またはＧＰＢスライス）と、スライスのための１つまたは複数の参照ピクチャリストのための構築情報と、スライスの各インター符号化ビデオブロックのための動きベクトルと、スライスの各インターコード化ビデオブロックのためのインター予測ステータスと、現在のビデオスライス中のビデオブロックを復号するための他の情報とを決定するために、パラメータセット中の１つまたは複数のシンタックス要素を使用し得る。

[0292]動き補償ユニット８２はまた、補間フィルタに基づいて補間を実施し得る。動き補償ユニット８２は、参照ブロックのサブ整数ピクセルのための補間値を計算するために、ビデオブロックの符号化中に符号化デバイス１０４によって使用された補間フィルタを使用し得る。上記の場合、動き補償ユニット８２は、受信されたシンタックス要素から符号化デバイス１０４によって使用された補間フィルタを決定し得、予測ブロックを作り出すためにその補間フィルタを使用し得る。

[0293]逆量子化ユニット８６は、ビットストリーム中で与えられ、エントロピー復号ユニット８０によって復号された量子化変換係数を逆量子化、すなわち、量子化解除する。逆量子化プロセスは、量子化の程度を決定し、同様に、適用されるべきである逆量子化の程度を決定するための、ビデオスライス中のビデオブロックごとに符号化デバイス１０４によって計算される量子化パラメータの使用を含み得る。逆変換処理ユニット８８は、ピクセル領域における残差ブロックを作り出すために、逆変換（たとえば、逆ＤＣＴまたは他の好適な逆変換）、逆整数変換、または概念的に同様の逆変換プロセスを変換係数に適用する。

[0294]動き補償ユニット８２が、動きベクトルおよび他のシンタックス要素に基づいて現在のビデオブロックのための予測ブロックを生成した後に、復号デバイス１１２は、逆変換処理ユニット８８からの残差ブロックを動き補償ユニット８２によって生成された対応する予測ブロックと加算することによって、復号ビデオブロックを形成する。加算器９０は、加算演算を実施する１つまたは複数の構成要素を表現する。所望される場合、（コーディングループ内またはコーディングループ後のいずれかの）ループフィルタも、ピクセル遷移を平滑化するために、またはさもなければビデオ品質を改善するために使用され得る。フィルタユニット９１は、デブロッキングフィルタ、適応ループフィルタ（ＡＬＦ）、およびサンプル適応オフセット（ＳＡＯ）フィルタなど、１つまたは複数のループフィルタを表現するものとする。図２１では、フィルタユニット９１はループ内フィルタであるとして示されているが、他の構成では、フィルタユニット９１はループ後フィルタとして実装され得る。所与のフレームまたはピクチャ中の復号ビデオブロックは、後続の動き補償のために使用される参照ピクチャを記憶するピクチャメモリ９２に記憶される。ピクチャメモリ９２はまた、図１に示されているビデオ宛先デバイス１２２など、ディスプレイデバイス上で後で提示するために復号ビデオを記憶する。

[0295]図２１の復号デバイス１１２は、本明細書で説明される変換コーディング技法のうちの１つまたは複数を実施するように構成されたビデオデコーダの一例を表す。復号デバイス１１２は、図２１に関して上記で説明されたプロセス１９００を含む、本明細書で説明される技法のいずれかを実施し得る。

[0296]上記の説明では、本出願の態様がそれの特定の実施形態を参照しながら説明されたが、本出願の主題はそれに限定されないことを、当業者は認識されよう。したがって、本出願の例示的な実施形態が本明細書で詳細に説明されているが、従来技術によって限定される場合を除いて、発明的概念が、場合によっては様々に具体化および採用され得、添付の特許請求の範囲が、そのような変形形態を含むように解釈されるものであることを理解されたい。上記で説明された主題の様々な特徴および態様は、個々にまたは一緒に使用され得る。さらに、実施形態は、本明細書のより広い趣旨および範囲から逸脱せずに、本明細書において説明される環境およびアプリケーションを超える、任意の数の環境およびアプリケーションにおいて利用され得る。したがって、本明細書および図面は、制限的なものというよりもむしろ例示的なものとして考慮されるべきである。例示の目的のために、方法は、特定の順序で説明された。代替実施形態では、方法は、説明された順序とは異なる順序で実施され得ることを諒解されたい。

[0297]本明細書で使用される、よりも小さい（「＜」）、および、よりも大きい（「＞」）のシンボルまたは専門用語は、本明細書の範囲から逸脱することなく、それぞれ、よりも小さいかまたはそれに等しい（「≦」）、および、よりも大きいかまたはそれに等しい（「≧」）のシンボルと置き換えられ得ることを、当業者は諒解されよう。

[0298]構成要素が、ある動作を実施する「ように構成されて」いるものとして説明される場合、そのような構成は、たとえば、動作を実施するように電子回路または他のハードウェアを設計することによって、動作を実施するようにプログラマブル電子回路（たとえば、マイクロプロセッサ、または他の好適な電子回路）をプログラムすることによって、またはそれらの任意の組合せによって、達成され得る。

[0299]セット「のうちの少なくとも１つ」、および／またはセットのうちの「１つもしくは複数」を具陳するクレームの文言または他の文言は、セットのうちの１つのメンバーまたは（任意の組合せにおける）セットのうちの複数のメンバーがクレームを満たすことを示す。たとえば、「ＡおよびＢのうちの少なくとも１つ」を具陳する特許請求の範囲の文言は、Ａ、Ｂ、またはＡおよびＢを意味する。別の例では、「Ａ、Ｂ、およびＣのうちの少なくとも１つ」を具陳する特許請求の範囲の文言は、Ａ、Ｂ、Ｃ、またはＡおよびＢ、またはＡおよびＣ、またはＢおよびＣ、またはＡおよびＢおよびＣを意味する。文言セットの「うちの少なくとも１つ」および／またはセットのうちの「１つもしくは複数」は、セットにリストされている項目にセットを限定しない。たとえば、「ＡおよびＢのうちの少なくとも１つ」を具陳するクレームの文言は、Ａ、Ｂ、またはＡおよびＢを意味することができ、さらに、ＡおよびＢのセットにリストされていない項目を含むことができる。

[0300]本明細書において開示される実施形態に関連して説明される、様々な例示的な論理ブロック、モジュール、回路、およびアルゴリズムステップは、電子ハードウェア、コンピュータソフトウェア、ファームウェア、または、これらの組合せとして実装され得る。ハードウェアとソフトウェアとの互換性を明確に例示するために、様々な例示的な構成要素、ブロック、モジュール、回路、およびステップは、一般に、それらの機能性の観点から上述されている。そのような機能性がハードウェアとして実装されるか、またはソフトウェアとして実装されるかは、特定の適用例およびシステム全体に課される設計制約条件に依存する。熟練した技術者は、説明された機能性を特定の適用例ごとに様々な手法で実装し得るが、そのような実装上の決定は、本出願の範囲からの逸脱を引き起こすものとして解釈されるべきではない。

[0301]本明細書において説明される技法は、電子ハードウェア、コンピュータソフトウェア、ファームウェア、または、これらの任意の組合せにおいても実装され得る。そのような技法は、汎用コンピュータ、ワイヤレス通信デバイスハンドセット、またはワイヤレス通信デバイスハンドセットおよび他のデバイスにおける適用を含む複数の用途を有する集積回路デバイスなど、様々なデバイスのいずれかにおいて実装され得る。モジュールまたは構成要素として説明された特徴は、集積論理デバイスに一緒に、または個別であるが相互運用可能な論理デバイスとして別個に実装され得る。ソフトウェアで実装された場合、本技法は、実行されたとき、上記で説明された方法のうちの１つまたは複数を実施する命令を含むプログラムコードを備えるコンピュータ可読データ記憶媒体によって、少なくとも部分的に実現され得る。コンピュータ可読データ記憶媒体は、パッケージングマテリアルを含み得る、コンピュータプログラム製品の一部を形成し得る。コンピュータ可読媒体は、同期型ダイナミックランダムアクセスメモリ（ＳＤＲＡＭ）などのランダムアクセスメモリ（ＲＡＭ）、読取り専用メモリ（ＲＯＭ）、不揮発性ランダムアクセスメモリ（ＮＶＲＡＭ）、電気消去可能プログラマブル読取り専用メモリ（ＥＥＰＲＯＭ（登録商標））、フラッシュメモリ、磁気または光学データ記憶媒体など、メモリまたはデータ記憶媒体を備え得る。本技法は、追加または代替として、伝搬信号または電波など、命令またはデータ構造の形態でプログラムコードを搬送または伝達し、コンピュータによってアクセスされ、読み取られ、および／または実行され得るコンピュータ可読通信媒体によって、少なくとも部分的に実現され得る。

[0302]プログラムコードは、１つまたは複数のデジタル信号プロセッサ（ＤＳＰ）、汎用マイクロプロセッサ、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブル論理アレイ（ＦＰＧＡ）、または他の等価の集積回路もしくはディスクリート論理回路など、１つまたは複数のプロセッサを含み得るプロセッサによって実行され得る。そのようなプロセッサは、本開示で説明された技法のいずれかを実施するように構成され得る。汎用プロセッサはマイクロプロセッサであり得るが、代替として、プロセッサは、任意の従来のプロセッサ、コントローラ、マイクロコントローラ、または状態機械であり得る。プロセッサは、コンピューティングデバイスの組合せ、たとえば、ＤＳＰとマイクロプロセッサとの組合せ、複数のマイクロプロセッサ、ＤＳＰコアを併用する１つもしくは複数のマイクロプロセッサ、または、任意の他のそのような構成としても実装され得る。したがって、本明細書において使用されるような「プロセッサ」という用語は、前述の構造のいずれか、前述の構造の任意の組合せ、または、本明細書において説明される技法の実装に適した任意の他の構造もしくは装置を指し得る。さらに、いくつかの態様では、本明細書で説明された機能は、符号化および復号のために構成された専用のソフトウェアモジュールまたはハードウェアモジュール内に提供され得、あるいは複合ビデオエンコーダ／デコーダ（コーデック）に組み込まれ得る。

[0303]本開示の例示的な例は、以下を含む。

[0304]例１。ビデオデータを処理する方法であって、ビデオデータの１つまたは複数のブロックを取得することと、ビデオデータのブロックを予測するために使用するためのアフィン動きベクトルを決定することと、ここにおいて、アフィン動きベクトルを使用してアクセス可能な少なくとも参照ピクチャのエリアは、制約に基づいて制限される、を備える方法。

[0305]例２。制約は、ブロックのサイズに基づく、例１に記載の方法。

[0306]例３。制約に従ってアフィン動きベクトルをクリッピングすることをさらに備える、例１から２のいずれか１つに記載の方法。

[0307]例４。制約に従って、少なくとも１つの参照ピクチャから少なくとも１つのサンプルの参照サンプル座標をクリッピングすること、参照サンプル座標は、アフィン動きベクトルを使用して決定される、をさらに備える、例１から２のいずれか１つに記載の方法。

[0308]例５。ブロックのサイズに応じてクリッピングパラメータを導出することをさらに備える、例１から４のいずれか１つに記載の方法。

[0309]例６。１つまたは複数の作表されたパラメータからブロックごとに１回、アフィン動きベクトルと参照サンプル座標のうちの少なくとも１つをクリッピングするためのパラメータを計算することをさらに備える、例１から５のいずれか１つに記載の方法。

[0310]例７。ビデオデータを記憶するように構成されたメモリと、例１から６のいずれかに従ってビデオデータを処理するように構成されたプロセッサとを備える装置。

[0311]例８。装置がデコーダを含む、例７に記載の装置。

[0312]例９。装置がエンコーダを含む、例７に記載の装置。

[0313]例１０。装置がモバイルデバイスである、例７から９のいずれか１つに記載の装置。

[0314]例１１。ビデオデータを表示するように構成されたディスプレイをさらに備える、例７から１０のいずれか１つに記載の装置。

[0315]例１２。１つまたは複数のピクチャをキャプチャするように構成されたカメラをさらに備える、例７から１１のいずれか１つに記載の装置。

[0316]例１３。プロセッサによって実行されたとき、例１から６のいずれかに記載の方法を実施する命令を記憶したコンピュータ可読媒体。

[0317]例１４。ビデオデータをコーディングするための装置であって、メモリと、メモリに結合された１つまたは複数のプロセッサとを備え、１つまたは複数のプロセッサは、ビデオデータから現在のコーディングブロックを取得することと、現在のコーディングブロックのための制御データを決定することと、制御データから１つまたは複数のアフィン動きベクトルクリッピングパラメータを決定することと、現在のコーディングブロックのサンプルを選択することと、現在のコーディングブロックのサンプルのためのアフィン動きベクトルを決定することと、クリッピングされたアフィン動きベクトルを生成するために１つまたは複数のアフィン動きベクトルクリッピングパラメータを使用してアフィン動きベクトルをクリッピングすることと、を行うように構成された、装置。

[0318]例１５。制御データは、フルサンプルユニット中での関連する水平座標と関連する垂直座標とを用いたロケーションと、現在のコーディングブロックの幅を指定する幅変数と、現在のコーディングブロックの高さを指定する高さ変数と、動きベクトルの水平変化と、動きベクトルの垂直変化と、ベーススケーリングされた動きベクトルと、サンプル中の現在のコーディングブロックに関連するピクチャの高さと、サンプル中のピクチャの幅とを備える、例１４に記載の装置。

[0319]例１６。１つまたは複数のアフィン動きベクトルクリッピングパラメータは、水平最大変数と、水平最小変数と、垂直最大変数と、垂直最小変数とを備える、例１５に記載の装置。

[0320]例１７。水平最小変数は、水平最小ピクチャ値と水平最小動きベクトル値とから選択される最大値によって定義される、例１６に記載の装置。

[0321]例１８。水平最小ピクチャ値は、関連する水平座標から決定される、例１７に記載の装置。

[0322]例１９。水平最小動きベクトル値は、中心動きベクトル値と、ビデオデータに関連する解像度値またはブロックエリアサイズに基づく値のアレイ（たとえば、現在のコーディングブロックの幅×高さ）と、現在のコーディングブロックの幅を指定する幅変数とから決定される、例１８に記載の装置。

[0323]例２０。中心動きベクトル値は、ベーススケーリングされた動きベクトルと、動きベクトルの水平変化と、幅変数と、高さ変数とから決定される、例１９に記載の装置。

[0324]例２１。ベーススケーリングされた動きベクトルは、現在のコーディングブロックの左上隅に対応し、制御点動きベクトル値から決定される、例２０に記載の装置。

[0325]例２２。水平最大変数は、水平最大ピクチャ値と水平最大動きベクトル値とから選択される最小値によって定義される、上記の例１６～２１に記載の装置。

[0326]例２３。水平最大ピクチャ値は、ピクチャの幅と、関連する水平座標と、幅変数とから決定される、例２２に記載の装置。

[0327]例２４。水平最大動きベクトル値は、中心動きベクトル値と、ビデオデータに関連する解像度値またはブロックエリアサイズに基づく値のアレイ（たとえば、現在のコーディングブロックの幅×高さ）と、現在のコーディングブロックの幅を指定する幅変数とから決定される、例２３に記載の装置。

[0328]例２５。中心動きベクトル値は、ベーススケーリングされた動きベクトルと、動きベクトルの水平変化と、幅変数と、高さ変数とから決定される、例２４に記載の装置。

[0329]例２６。ベーススケーリングされた動きベクトルは、現在のコーディングブロックの隅に対応し、制御点動きベクトル値から決定される、例２５に記載の装置。

[0330]例２７。垂直最大変数は、垂直最大ピクチャ値と垂直最大動きベクトル値とから選択される最小値によって定義される、上記の例１６～２６に記載の装置。

[0331]例２８。垂直最大ピクチャ値は、ピクチャの高さと、関連する垂直座標と、高さ変数とから決定される、例２７に記載の装置。

[0332]例２９。垂直最大動きベクトル値は、中心動きベクトル値と、ビデオデータに関連する解像度値またはブロックエリアサイズに基づく値のアレイ（たとえば、現在のコーディングブロックの幅×高さ）と、現在のコーディングブロックの幅を指定する高さ変数とから決定される、例２８に記載の装置。

[0333]例３０。垂直最小変数は、垂直最小ピクチャ値と垂直最小動きベクトル値とから選択される最大値によって定義される、上記の例１６～３０に記載の装置。

[0334]例３１。垂直最小ピクチャ値は、関連する垂直座標から決定される、例３０に記載の装置。

[0335]例３２。垂直最小動きベクトル値は、中心動きベクトル値と、ビデオデータに関連する解像度値またはブロックエリアサイズに基づく値のアレイ（たとえば、現在のコーディングブロックの幅×高さ）と、現在のコーディングブロックの高さを指定する高さ変数とから決定される、例３１に記載の装置。

[0336]例３３。１つまたは複数のプロセッサは、ビデオデータから複数の現在のコーディングブロックを連続的に取得することと、複数の現在のコーディングブロックのブロックのためにコーディングブロックごとにアフィン動きベクトルクリッピングパラメータのセットを決定することと、複数の現在のコーディングブロックのためのブロックごとのアフィン動きベクトルクリッピングパラメータのセットを使用して対応する参照ピクチャの部分をフェッチすることとを行うように構成された、例１４～３２に記載の装置。

[0337]例３４。１つまたは複数のプロセッサは、現在のコーディングブロックに関連する参照ピクチャを識別することと、１つまたは複数のアフィン動きベクトルクリッピングパラメータによって定義された参照ピクチャの部分を記憶することとを行うように構成された、例１４～３３に記載の装置。

[0338]例３５。１つまたは複数のプロセッサに結合されたメモリバッファ、ここにおいて、参照ピクチャの部分は、現在のコーディングブロックを使用したアフィン動き処理動作のためにメモリバッファ中に記憶される、をさらに備える、例３４に記載の装置。

[0339]例３６。１つまたは複数のプロセッサは、クリッピングされたアフィン動きベクトルによって示される参照ピクチャからの参照ピクチャデータを使用して現在のコーディングブロックを処理することを行うように構成された、例１４～３５に記載の装置。

[0340]例３７。現在のコーディングブロックのサンプルのためのアフィン動きベクトルは、第１のベーススケーリングされた動きベクトル値と、動きベクトル値の第１の水平変化と、動きベクトル値の第１の垂直変化と、第２のベーススケーリングされた動きベクトル値と、動きベクトル値の第２の水平変化と、動きベクトル値の第２の垂直変化と、サンプルの水平座標と、サンプルの垂直座標とに従って決定される、例１４－３６に記載の装置。

[0341]例３８。制御データは、導出表からの値を備える、例１４～３７に記載の装置。

[0342]例３９。現在のコーディングブロックは、ルーマコーディングブロックである、例１４～３８に記載の装置。

[0343]例４０。１つまたは複数のプロセッサに結合された、ビデオデータからの画像を表示するように構成されたディスプレイデバイスと、１つまたは複数のプロセッサに結合された１つまたは複数のワイヤレスインターフェースと、１つまたは複数のワイヤレスインターフェースは、１つまたは複数のベースバンドプロセッサと１つまたは複数のトランシーバとを備える、をさらに備える、例１４～３９に記載の装置。

[0344]例４１。ビデオデータをコーディングする方法であって、ビデオデータから現在のコーディングブロックを取得することと、現在のコーディングブロックのための制御データを決定することと、制御データから１つまたは複数のアフィン動きベクトルクリッピングパラメータを決定することと、現在のコーディングブロックのサンプルを選択することと、現在のコーディングブロックのサンプルのためのアフィン動きベクトルを決定することと、クリッピングされたアフィン動きベクトルを生成するために１つまたは複数のアフィン動きベクトルクリッピングパラメータを使用してアフィン動きベクトルをクリッピングすることとを備える方法。

[0345]例４２。例１４～４０のいずれかによる例４１に記載の方法。

[0346]例４３。コーディングデバイスの１つまたは複数のプロセッサによって実行されたとき、デバイスに、上記の例１４～４０のいずれかに従ってビデオデータに対してビデオコーディング動作を実施させる命令を備える非一時的コンピュータ可読記憶媒体。

[0347]例４４。ビデオデータをコーディングするための装置であって、ビデオデータから現在のコーディングブロックを取得するための手段と、現在のコーディングブロックのための制御データを決定するための手段と、制御データから１つまたは複数のアフィン動きベクトルクリッピングパラメータを決定するための手段と、現在のコーディングブロックのサンプルを選択するための手段と、現在のコーディングブロックのサンプルのためのアフィン動きベクトルを決定するための手段と、クリッピングされたアフィン動きベクトルを生成するために１つまたは複数のアフィン動きベクトルクリッピングパラメータを使用してアフィン動きベクトルをクリッピングするための手段とを備える装置。

[0348]例４５。ビデオデータをコーディングするための装置であって、上記の例１４～４０のいずれかによる、例４４に記載の装置。

[0349]例４６。１つまたは複数のプロセッサによって実行されたとき、１つまたは複数のプロセッサに、ビデオデータから現在のコーディングブロックを取得することと、現在のコーディングブロックのための制御データを決定することと、制御データから１つまたは複数のアフィン動きベクトルクリッピングパラメータを決定することと、現在のコーディングブロックのサンプルを選択することと、現在のコーディングブロックのサンプルのためのアフィン動きベクトルを決定することと、クリッピングされたアフィン動きベクトルを生成するために１つまたは複数のアフィン動きベクトルクリッピングパラメータを使用してアフィン動きベクトルをクリッピングすることとを行わせる命令を記憶する、非一時的コンピュータ可読記憶媒体。

[0350]例４７。１つまたは複数のプロセッサに、上記の例１４～４０のいずれかに従って動作させる命令を含む、例４６に記載の非一時的コンピュータ可読媒体。

Claims

ビデオデータをコーディングするための装置であって、
メモリと、
前記メモリに結合された１つまたは複数のプロセッサと、を備え、前記１つまたは複数のプロセッサは、
前記ビデオデータから現在のコーディングブロックを取得することと、
前記現在のコーディングブロックのための制御データを決定することと、
前記制御データから１つまたは複数のアフィン動きベクトルクリッピングパラメータを決定することと、
前記現在のコーディングブロックのサンプルを選択することと、
前記現在のコーディングブロックの前記サンプルのためのアフィン動きベクトルを決定することと、
クリッピングされたアフィン動きベクトルを生成するために、前記１つまたは複数のアフィン動きベクトルクリッピングパラメータを使用して、前記アフィン動きベクトルをクリッピングすることと、
を行うように構成された、装置。
前記制御データは、
フルサンプルユニット中での関連する水平座標と関連する垂直座標とを用いたロケーションと、
前記現在のコーディングブロックの幅を指定する幅変数と、
前記現在のコーディングブロックの高さを指定する高さ変数と、
動きベクトルの水平変化と、
動きベクトルの垂直変化と、
ベーススケーリングされた動きベクトルと、
サンプル中の前記現在のコーディングブロックに関連するピクチャの高さと、
サンプル中の前記ピクチャの幅と、
を備える、請求項１に記載の装置。
前記１つまたは複数のアフィン動きベクトルクリッピングパラメータは、
水平最大変数と、
水平最小変数と、
垂直最大変数と、
垂直最小変数と、
を備える、請求項２に記載の装置。
前記水平最小変数は、水平最小ピクチャ値と水平最小動きベクトル値とから選択される最大値によって定義される、請求項３に記載の装置。
前記水平最小ピクチャ値は、前記関連する水平座標から決定される、請求項４に記載の装置。
前記水平最小動きベクトル値は、中心動きベクトル値と、前記ビデオデータに関連する解像度値に基づく値のアレイと、前記現在のコーディングブロックの前記幅を指定する前記幅変数とから決定される、請求項５に記載の装置。
前記中心動きベクトル値は、前記ベーススケーリングされた動きベクトルと、動きベクトルの前記水平変化と、前記幅変数と、前記高さ変数とから決定される、請求項６に記載の装置。
前記ベーススケーリングされた動きベクトルは、前記現在のコーディングブロックの左上隅に対応し、制御点動きベクトル値から決定される、請求項７に記載の装置。
前記水平最大変数は、水平最大ピクチャ値と水平最大動きベクトル値とから選択される最小値によって定義される、請求項３に記載の装置。
前記水平最大ピクチャ値は、前記ピクチャの前記幅と、前記関連する水平座標と、前記幅変数とから決定される、請求項９に記載の装置。
前記水平最大動きベクトル値は、中心動きベクトル値と、前記ビデオデータに関連する解像度値に基づく値のアレイと、前記現在のコーディングブロックの前記幅を指定する前記幅変数とから決定される、請求項１０に記載の装置。
前記中心動きベクトル値は、前記ベーススケーリングされた動きベクトルと、動きベクトルの前記水平変化と、前記幅変数と、前記高さ変数とから決定される、請求項１１に記載の装置。
前記ベーススケーリングされた動きベクトルは、前記現在のコーディングブロックの隅に対応し、制御点動きベクトル値から決定される、請求項１２に記載の装置。
前記垂直最大変数は、垂直最大ピクチャ値と垂直最大動きベクトル値とから選択される最小値によって定義される、請求項３に記載の装置。
前記垂直最大ピクチャ値は、前記ピクチャの前記高さと、前記関連する垂直座標と、前記高さ変数とから決定される、請求項１４に記載の装置。
前記垂直最大動きベクトル値は、中心動きベクトル値と、前記ビデオデータに関連するブロックエリアサイズに基づく値のアレイと、前記現在のコーディングブロックの前記幅を指定する前記高さ変数とから決定される、請求項１５に記載の装置。
前記垂直最小変数は、垂直最小ピクチャ値と垂直最小動きベクトル値とから選択される最大値によって定義される、請求項３に記載の装置。
前記垂直最小ピクチャ値は、前記関連する垂直座標から決定される、請求項１７に記載の装置。
前記垂直最小動きベクトル値は、中心動きベクトル値と、前記ビデオデータに関連するデータブロックエリアサイズと、前記現在のコーディングブロックの前記高さを指定する前記高さ変数とから決定される、請求項１８に記載の装置。
前記１つまたは複数のプロセッサは、
前記ビデオデータから複数の現在のコーディングブロックを連続的に取得することと、
前記複数の現在のコーディングブロックのブロックのためにコーディングブロックごとにアフィン動きベクトルクリッピングパラメータのセットを決定することと、
前記複数の現在のコーディングブロックのための前記ブロックごとのアフィン動きベクトルクリッピングパラメータの前記セットを使用して、対応する参照ピクチャの部分をフェッチすることと、
を行うように構成された、請求項１に記載の装置。
前記１つまたは複数のプロセッサは、
前記現在のコーディングブロックに関連する参照ピクチャを識別することと、
前記１つまたは複数のアフィン動きベクトルクリッピングパラメータによって定義された前記参照ピクチャの部分を記憶することと、
を行うように構成された、請求項１に記載の装置。
前記１つまたは複数のプロセッサに結合されたメモリバッファをさらに備え、
前記参照ピクチャの前記部分は、前記現在のコーディングブロックを使用したアフィン動き処理動作のために前記メモリバッファ中に記憶される、
請求項２１に記載の装置。
前記１つまたは複数のプロセッサは、
前記クリッピングされたアフィン動きベクトルによって示される参照ピクチャからの参照ピクチャデータを使用して、前記現在のコーディングブロックを処理すること、
を行うように構成された、請求項１に記載の装置。
前記現在のコーディングブロックの前記サンプルのための前記アフィン動きベクトルは、第１のベーススケーリングされた動きベクトル値と、動きベクトル値の第１の水平変化と、動きベクトル値の第１の垂直変化と、第２のベーススケーリングされた動きベクトル値と、動きベクトル値の第２の水平変化と、動きベクトル値の第２の垂直変化と、前記サンプルの水平座標と、前記サンプルの垂直座標とに従って決定される、請求項１に記載の装置。
前記制御データは、導出表からの値を備える、請求項１に記載の装置。
前記現在のコーディングブロックは、ルーマコーディングブロックである、請求項１に記載の装置。
前記１つまたは複数のプロセッサに結合された、前記ビデオデータからの画像を表示するように構成されたディスプレイデバイスと、
前記１つまたは複数のプロセッサに結合された１つまたは複数のワイヤレスインターフェースと、前記１つまたは複数のワイヤレスインターフェースは、１つまたは複数のベースバンドプロセッサと１つまたは複数のトランシーバとを備える、
をさらに備える、請求項１に記載の装置。
ビデオデータをコーディングする方法であって、
前記ビデオデータから現在のコーディングブロックを取得することと、
前記現在のコーディングブロックのための制御データを決定することと、
前記制御データから１つまたは複数のアフィン動きベクトルクリッピングパラメータを決定することと、
前記現在のコーディングブロックのサンプルを選択することと、
前記現在のコーディングブロックの前記サンプルのためのアフィン動きベクトルを決定することと、
クリッピングされたアフィン動きベクトルを生成するために、前記１つまたは複数のアフィン動きベクトルクリッピングパラメータを使用して、前記アフィン動きベクトルをクリッピングすることと、
を備える方法。
前記制御データは、
フルサンプルユニット中での関連する水平座標と関連する垂直座標とを用いたロケーションと、
前記現在のコーディングブロックの幅を指定する幅変数と、
前記現在のコーディングブロックの高さを指定する高さ変数と、
動きベクトルの水平変化と、
動きベクトルの垂直変化と、
ベーススケーリングされた動きベクトルと、
を備える、請求項２８に記載の方法。
前記１つまたは複数のアフィン動きベクトルクリッピングパラメータは、
水平最大変数と、
水平最小変数と、
垂直最大変数と、
垂直最小変数と、
を備える、請求項２９に記載の方法。
前記水平最小変数は、水平最小ピクチャ値と水平最小動きベクトル値とから選択される最大値によって定義される、請求項３０に記載の方法。
前記水平最小ピクチャ値は、前記関連する水平座標から決定される、請求項３１に記載の装置。
前記水平最小動きベクトル値は、中心動きベクトル値と、ブロックエリアサイズに基づく値のアレイと、前記現在のコーディングブロックの前記幅を指定する前記幅変数とから決定される、請求項３２に記載の方法。
前記中心動きベクトル値は、前記ベーススケーリングされた動きベクトルと、動きベクトルの前記水平変化と、前記幅変数と、前記高さ変数とから決定される、請求項３３に記載の方法。
前記ベーススケーリングされた動きベクトルは、前記現在のコーディングブロックの左上隅に対応し、制御点動きベクトル値から決定される、請求項３４に記載の方法。
前記水平最大変数は、水平最大ピクチャ値と水平最大動きベクトル値とから選択される最小値によって定義される、請求項３０に記載の方法。
前記水平最大ピクチャ値は、前記関連する水平座標と、前記幅変数とから決定される、請求項３６に記載の方法。
前記水平最大動きベクトル値は、中心動きベクトル値と、前記ビデオデータに関連するブロックエリアサイズに基づく値のアレイと、前記現在のコーディングブロックの前記幅を指定する前記幅変数とから決定される、請求項３７に記載の方法。
前記中心動きベクトル値は、前記ベーススケーリングされた動きベクトルと、動きベクトルの前記水平変化と、前記幅変数と、前記高さ変数とから決定される、請求項３８に記載の方法。
前記ベーススケーリングされた動きベクトルは、前記現在のコーディングブロックの隅に対応し、制御点動きベクトル値から決定される、請求項３９に記載の方法。
前記垂直最大変数は、垂直最大ピクチャ値と垂直最大動きベクトル値とから選択される最小値によって定義される、請求項３０に記載の方法。
前記垂直最大ピクチャ値は、前記関連する垂直座標と、前記高さ変数とから決定される、請求項４１に記載の方法。
前記垂直最大動きベクトル値は、中心動きベクトル値と、前記ビデオデータに関連するブロックエリアサイズに基づく値のアレイと、前記現在のコーディングブロックの前記幅を指定する前記高さ変数とから決定される、請求項４２に記載の方法。
前記垂直最小変数は、垂直最小ピクチャ値と垂直最小動きベクトル値とから選択される最大値によって定義される、請求項３０に記載の方法。
前記垂直最小ピクチャ値は、前記関連する垂直座標から決定される、請求項４４に記載の方法。
前記垂直最小動きベクトル値は、中心動きベクトル値と、前記ビデオデータに関連するブロックエリアサイズに基づく値のアレイと、前記現在のコーディングブロックの前記高さを指定する前記高さ変数とから決定される、請求項４５に記載の方法。
前記ビデオデータから複数の現在のコーディングブロックを連続的に取得することと、
前記複数の現在のコーディングブロックのブロックのためにコーディングブロックごとにアフィン動きベクトルクリッピングパラメータのセットを決定することと、
前記複数の現在のコーディングブロックのための前記ブロックごとのアフィン動きベクトルクリッピングパラメータの前記セットを使用して、対応する参照ピクチャの部分をフェッチすることと、
をさらに備える、請求項２８に記載の方法。
前記現在のコーディングブロックに関連する参照ピクチャを識別することと、
前記１つまたは複数のアフィン動きベクトルクリッピングパラメータによって定義された前記参照ピクチャの部分を記憶することと、
をさらに備える、請求項２８に記載の装置。
前記参照ピクチャの前記部分は、前記現在のコーディングブロックを使用したアフィン動き処理動作のためにメモリバッファ中に記憶される、請求項４８に記載の方法。
前記クリッピングされたアフィン動きベクトルによって示される参照ピクチャからの参照ピクチャデータを使用して、前記現在のコーディングブロックを処理すること、
をさらに備える、請求項２８に記載の装置。
前記現在のコーディングブロックの前記サンプルのための前記アフィン動きベクトルは、第１のベーススケーリングされた動きベクトル値と、動きベクトル値の第１の水平変化と、動きベクトル値の第１の垂直変化と、第２のベーススケーリングされた動きベクトル値と、動きベクトル値の第２の水平変化と、動きベクトル値の第２の垂直変化と、前記サンプルの水平座標と、前記サンプルの垂直座標とに従って決定される、請求項１に記載の方法。
前記制御データは、導出表からの値を備える、請求項２８に記載の方法。
前記現在のコーディングブロックは、ルーマコーディングブロックである、請求項２８に記載の方法。
１つまたは複数のプロセッサによって実行されたとき、前記１つまたは複数のプロセッサに、
ビデオデータから現在のコーディングブロックを取得することと、
前記現在のコーディングブロックのための制御データを決定することと、
前記制御データから１つまたは複数のアフィン動きベクトルクリッピングパラメータを決定することと、
前記現在のコーディングブロックのサンプルを選択することと、
前記現在のコーディングブロックの前記サンプルのためのアフィン動きベクトルを決定することと、
クリッピングされたアフィン動きベクトルを生成するために、前記１つまたは複数のアフィン動きベクトルクリッピングパラメータを使用して、前記アフィン動きベクトルをクリッピングすることと、
を行わせる命令を記憶する、非一時的コンピュータ可読記憶媒体。