JP7295230B2

JP7295230B2 - スライス／タイル／ｌｃｕの行ごとのルックアップテーブルのリセット

Info

Publication number: JP7295230B2
Application number: JP2021523108A
Authority: JP
Inventors: リージャン; カイジャン; ホンビンリウ; ユエワン
Original assignee: Beijing ByteDance Network Technology Co Ltd; ByteDance Inc
Current assignee: Beijing ByteDance Network Technology Co Ltd; ByteDance Inc
Priority date: 2018-06-29
Filing date: 2019-07-01
Publication date: 2023-06-20
Anticipated expiration: 2039-07-01
Also published as: TW202015418A; TWI723443B; US20200204820A1; CN110662063B; EP3791587A1; WO2020003266A1; CN110662063A; JP2021530182A; KR102648120B1; KR20210024503A; US10778997B2

Description

この特許明細書は、映像符号化および復号化技術、デバイスおよびシステムに関する。

映像圧縮の進歩にもかかわらず、デジタル映像は、依然として、インターネットおよび他のデジタル通信ネットワークにおいて最大の帯域幅の使用量を占めている。映像の受信および表示が可能な接続されたユーザ機器の数が増加するにつれ、デジタル映像の使用に対する帯域幅需要は増大し続けることが予想される。

本明細書は、動き候補を含むテーブルを使用してデジタル映像を符号化および復号化するための方法、システム、およびデバイスを開示する。

１つの例示的な態様において、映像処理方法は、現在の映像領域における１つ以上の映像ブロックとそのビットストリーム表現との間の変換のために、映像における以前の映像領域からの動き情報を無効にすることを決定することと、動き候補を記憶するテーブルをリセットすることによって変換を行うことと、を含むように提供される。

さらに別の例示的な態様において、映像処理方法は、第１の映像領域における第１の映像ブロックと、動き候補を含むテーブルに基づいて第１の映像領域を含む映像データのビットストリーム表現との間で、第１の変換を行うことであって、各動き候補が対応する動き情報に関連付けられる、ことと、第２の変換のために、第１の変換に利用された動き情報の使用を無効にするためにテーブルをリセットすることと、第２の映像領域における第２の映像ブロックと映像データのビットストリーム表現との間で、リセットすることに起因してテーブルからの動き情報を使用することなく、第２の変換を行うことと、を含むように提供される。

別の例示的な態様において、映像処理方法は、テーブルおよびテーブルに割り当てられたカウンタを維持することであって、各テーブルは、動き候補を含み、各動き候補は、対応する動き情報に関連付けられる、ことと、テーブルを使用して映像領域の第１の映像ブロックと映像領域を含む映像データのビットストリーム表現との間で変換を行うことと、変換に基づいて、１つ以上のテーブルを更新することと、を含むように提供される。

さらに別の代表的な態様では、本明細書で説明される様々な技法は、非一時的なコンピュータ可読媒体に記憶されるコンピュータプログラム製品として実施され得る。このコンピュータプログラム製品は、本明細書に記載の方法を実行するためのプログラムコードを含む。

さらに別の代表的な態様において、映像デコーダ装置は、本明細書で説明されるような方法を実装してもよい。

１つ以上の実装形態の詳細は、添付の添付ファイル、図面、および以下の説明に記載されている。他の特徴は、説明および図面、並びに特許請求の範囲の記載から明らかとなろう。

映像エンコーダの実装形態の例を示すブロック図である。Ｈ．２６４映像符号化規格におけるマクロブロックの分割を示す。符号化ブロック（ＣＢ：ＣｏｄｉｎｇＢｌｏｃｋ）を予測ブロック（ＰＵ：ＰｒｅｄｉｃｔｉｏｎＢｌｏｃｋ）に分割する例を示す。ＣＴＢをＣＢおよび変換ブロック（ＴＢ：ＴｒａｎｓｆｏｒｍＢｌｏｃｋ）に細分するための例示的な実装形態を示す。実線はＣＢ境界を示し、点線はＴＢ境界を示し、その分割を含むＣＴＢの例、および対応する４分木を含む。映像データを分割するための４分木２分木（ＱＴＢＴ：ＱｕａｄＴｒｅｅＢｉｎａｒｙＴｒｅｅ）構造の一例を示す。映像ブロックの分割の例を示す。４分木の分割の例を示す。ツリー型信号通知の例を示す。マージ候補リスト構築のための導出処理の一例を示す。空間的マージ候補の位置の例を示す。空間的マージ候補の冗長性チェックに考慮される候補対の例を示す。Ｎ×２Ｎおよび２Ｎ×Ｎパーティションの第２のＰＵの位置の例を示す。時間的マージ候補のための動きベクトルのスケーリングを示す。時間的マージ候補の候補位置とその同一位置のピクチャを示す。結合双方向予測マージ候補の例を示す。動きベクトル予測候補の導出処理の例を示す。空間的動きベクトル候補のための動きベクトルのスケーリングの例を示す。ＣＵの動き予測のための例示的なＡＴＭＶＰ（ＡｌｔｅｒｎａｔｉｖｅＴｅｍｐｏｒａｌＭｏｔｉｏｎＶｅｃｔｏｒＰｒｅｄｉｃｔｉｏｎ）を示す。ソースブロックおよびソースピクチャの識別の一例を絵で示す。４つのサブブロックおよび近傍のブロックを有する１つのＣＵの例を示す。バイラテラルマッチングの例を示す。テンプレートマッチングの例を示す。ＦＲＵＣ（ＦｒａｍｅＲａｔｅＵｐＣｏｎｖｅｒｓｉｏｎ）における一方の動き推定（ＭＥ：ＭｏｔｉｏｎＥｓｔｉｍａｔｉｏｎ）の例を示す。バイラテラルテンプレートマッチングに基づくＤＭＶＲの例を示す。空間的マージ候補を導出するために使用する空間的に近傍のブロックの例を示す。ルックアップテーブル更新のための代表的な位置の選択方法の一例を示す。新しい動き情報のセットでルックアップテーブルを更新する例を示す。新しい動き情報のセットでルックアップテーブルを更新する例を示す。本明細書に記載されるビジュアルメディアの復号化またはビジュアルメディアの符号化技術を実装するためのハードウェアプラットフォームの一例を示すブロック図である。例示の映像処理方法を示すフローチャートである。例示の映像処理方法を示すフローチャートである。別の例示の映像処理方法を示すフローチャートである。提案されたＨＭＶＰ方法による復号化フローチャートの一例を示す。提案されるＨＭＶＰ方法を用いたテーブルの更新の例を示す。冗長性除去に基づくＬＵＴ更新方法（１つの冗長性動き候補を除去する）の例を示す。冗長性除去に基づくＬＵＴ更新方法（１つの冗長性動き候補を除去する）の例を示す。冗長性除去に基づくＬＵＴ更新方法（複数の冗長性動き候補を除去する）の例を示す。冗長性除去に基づくＬＵＴ更新方法（複数の冗長性動き候補を除去する）の例を示す。タイプ１のブロックとタイプ２のブロックとの相違点の一例を示す。

本明細書では、理解を容易にするために章の見出しを使用しており、１つの章に開示された実施形態をその章にのみ限定するものではない。さらに、特定の実施形態は、ＶＶＣ（ＶｅｒｓａｔｉｌｅＶｉｄｅｏＣｏｄｉｎｇ）または他の特定の映像コーデックを参照して説明されたが、開示された技術は、他の映像符号化技術にも適用可能である。さらに、いくつかの実施形態は映像符号化ステップを詳細に説明しているが、符号化を復号化する、対応するステップはデコーダによって実行されることが理解されよう。さらに、映像処理という用語は、映像符号化または圧縮、映像の復号化または展開、および映像の画素がある圧縮形式から別の圧縮形式へ、または別の圧縮ビットレートで表現される映像のコード変換を含む。

１．導入

本明細書は、映像符号化技術に関する。具体的には、映像符号化における動き情報の符号化（例えば、マージモード、ＡＭＶＰモード）に関する。ＨＥＶＣのような既存の映像符号化規格に適用してもよいし、規格（ＶｅｒｓａｔｉｌｅＶｉｄｅｏＣｏｄｉｎｇ）を確定させるために適用してもよい。本発明は、将来の映像符号化規格または映像コーデックにも適用可能である。

簡単な説明

映像符号化規格は、主に周知のＩＴＵ－ＴおよびＩＳＯ／ＩＥＣ規格の開発によって発展してきた。ＩＴＵ－ＴはＨ．２６１とＨ．２６３を作り、ＩＳＯ／ＩＥＣはＭＰＥＧ－１とＭＰＥＧ－４Ｖｉｓｕａｌを作り、両団体はＨ．２６２／ＭＰＥＧ－２ＶｉｄｅｏとＨ．２６４／ＭＰＥＧ－４ＡＶＣ（ＡｄｖａｎｃｅｄＶｉｄｅｏＣｏｄｉｎｇ）とＨ．２６５／ＨＥＶＣ規格を共同で作った。Ｈ．２６２以来、映像符号化規格は、時間予測と変換符号化が利用されるハイブリッド映像符号化構造に基づく。典型的なＨＥＶＣエンコーダフレームワークの一例を図１に示す。

２．１パーティション構造

２．１．１Ｈ．２６４／ＡＶＣにおけるパーティションツリー構造

以前の規格における符号化層のコアは、１６×１６ブロックの輝度サンプルを含み、通常の４：２：０カラーサンプリングの場合、２つの対応する８×８ブロックの彩度サンプル含むマクロブロックであった。

イントラ符号化されたブロックは、画素間の空間的相関を利用するために空間予測を使用する。２つのパーティションを規定する。１６×１６および４×４である。

インター符号化されたブロックは、ピクチャ間の動きを推定することで、空間的予測の代わりに時間予測を用いる。動きは、１６×１６マクロブロックまたはそのサブマクロブロックパーティションのいずれかに対して独立して推定できる。１６×８、８×１６、８×８、８×４、４×８、４×４（図２参照）。１つのサブマクロブロックパーティション当たり１つの動きベクトル（ＭＶ：ＭｏｔｉｏｎＶｅｃｔｏｒ）のみが許可される。

２．１．２ＨＥＶＣにおけるパーティションツリー構造

ＨＥＶＣにおいて、ＣＴＵは、様々な局所的特徴に適応するように、符号化ツリーと呼ばれる４分木構造を用いてＣＵに分割される。インターピクチャ（時間的）予測またはイントラピクチャ（空間的）予測を使用する、ピクチャ領域を符号化するかどうかの決定は、ＣＵレベルで行われる。各ＣＵは、ＰＵ分割タイプに応じて１つ、２つまたは４つのＰＵに更に分割することができる。１つのＰＵの内部では、同じ予測処理が適用され、ＰＵ単位で関連情報がデコーダに送信される。ＰＵ分割タイプに基づく予測処理を適用して残差ブロックを得た後、ＣＵのための符号化ツリーに類似した別の４分木構造に基づいて、ＣＵを変換ユニット（ＴＵ）に分割することができる。ＨＥＶＣ構造の重要な特徴の１つは、ＣＵ、ＰＵ、ＴＵを含む複数のパーティション概念を有することである。

以下、ＨＥＶＣを使用したハイブリッド映像符号化に関連する様々な特徴に焦点を当てる。

１）符号化ツリーユニットおよび符号化ツリーブロック（ＣＴＢ）構造：ＨＥＶＣにおける類似した構造は、符号化ツリーユニット（ＣＴＵ）であり、この符号化ツリーユニットは、エンコーダによって選択されたサイズを有し、従来のマクロブロックよりも大きくてもよい。ＣＴＵは、輝度ＣＴＢと、対応する彩度ＣＴＢおよび構文要素とからなる。輝度ＣＴＢのサイズＬ×Ｌは、Ｌ＝１６、３２、または６４のサンプルとして選択することができ、より大きいサイズは、一般的に、より優れた圧縮を有効にする。ＨＥＶＣは、次いで、ツリー構造および４分木の様な信号通知を使用して、ＣＴＢをより小さなブロックに分割することをサポートする。

２）符号化ユニット（ＣＵ）および符号化ブロック（ＣＢ）：ＣＴＵの４分木の構文は、その輝度および彩度ＣＢのサイズおよび位置を指定する。４分木のルートはＣＴＵに関連付けられる。従って、輝度ＣＴＢのサイズは、輝度ＣＢに対してサポートされる最大のサイズである。ＣＴＵを輝度ＣＢおよび彩度ＣＢに分割することは、共に信号通知されることである。１つの輝度ＣＢおよび通常２つの彩度ＣＢは、関連する構文と共に、１つの符号化ユニット（ＣＵ）を形成する。ＣＴＢは、１つのＣＵのみを含んでもよく、または複数のＣＵを形成するように分割されてもよく、各ＣＵは、それに関連付けられた予測ユニット（ＰＵ）への分割と、１つの変換ユニット（ＴＵ）のツリーとを有する。

３）予測ユニットおよび予測ブロック（ＰＢ）：インターピクチャまたはイントラピクチャ予測を使用してピクチャ領域を符号化するかどうかの決定は、ＣＵレベルで行われる。ＰＵの分割構造は、そのルートがＣＵレベルにある。基本的な予測タイプの決定に基づいて、次に、輝度および彩度ＣＢのサイズをさらに分割し、輝度および彩度予測ブロック（ＰＢ）から予測することができる。ＨＥＶＣは、６４×６４から４×４の可変ＰＢサイズのサンプルをサポートする。図３は、Ｍ×ＭのＣＵのための許可されたＰＢの例を示す。

４）ＴＵおよび変換ブロック：予測残差は、ブロック変換を使用して符号化される。ＴＵツリー構造は、そのルートがＣＵレベルにある。この輝度ＣＢ残差は、輝度変換ブロック（ＴＢ）と同一であってもよいし、小さな輝度ＴＢにさらに分割されてもよい。彩度ＴＢについても同様である。正方形ＴＢサイズ４×４、８×８、１６×１６、および３２×３２に対して、離散コサイン変換（ＤＣＴ）の整数基底関数に類似した整数基底関数が規定される。輝度イントラピクチャ予測残差の４×４変換のために、離散サイン変換（ＤＳＴ）の形式から導出される整数変換が代替的に指定される。

図４は、ＣＴＢをＣＢ［及び変換ブロック（ＴＢ）］に細分する例を示す。実線はＣＢ境界を示し、点線はＴＢ境界を示す。（ａ）ＣＴＢとその分割（ｂ）対応する４分木。

２．１．２．１変換ブロックおよびユニットへのツリー構造の分割

残差符号化の場合、ＣＢは、変換ブロック（ＴＢ）に再帰的に分割することができる。この分割は、残差４分木によって信号通知される。図４に示すように、１つのブロックを再帰的に象限に分割することができるように、正方形のＣＢおよびＴＢの分割のみを指定する。サイズＭ×Ｍの所与の輝度ＣＢに対して、フラグは、それがサイズＭ／２×Ｍ／２の４つのブロックに分割されるかどうかを信号通知する。さらなる分割が可能である場合、ＳＰＳに示される残留４分木の最大深さによって信号通知されるように、各象限には、それが４つの象限に分割されているかどうかを示すフラグが割り当てられる。残差４分木の結果得られる葉ノードブロックは、変換符号化によってさらに処理される変換ブロックである。エンコーダは、それが使用することになる最大および最小輝度ＴＢサイズを示す。ＣＢサイズが最大ＴＢサイズよりも大きい場合、分割は非明示的に行われる。分割により、示された最小値よりも小さい輝度ＴＢサイズとなる場合、分割は、非明示的に行われない。輝度ＴＢサイズが４×４である場合を除き、彩度ＴＢサイズは、各次元において輝度ＴＢサイズの半分であり、この場合、４つの４×４輝度ＴＢによって覆われる領域には１つの４×４彩度ＴＢが使用される。イントラピクチャ予測ＣＵの場合、最近の近傍のＴＢ（ＣＢ内またはＣＢ外）の復号サンプルを、イントラピクチャ予測のための参照データとして用いる。

従来の規格とは対照的に、ＨＥＶＣ設計により、インターピクチャ予測ＣＵのために１つのＴＢが複数のＰＢにまたがることが可能となり、４分木構造のＴＢの分割の潜在的な符号化効率の利点が最大となる。

２．１．２．２親子ノード

ＣＴＢは、４分木構造に基づいて分割され、そのノードは符号化ユニットである。４分木構造における複数のノードは、葉ノードおよび非葉ノードを含む。葉ノードは、ツリー構造内に子ノードを持たない（すなわち、葉ノードはそれ以上分割されない）。非葉ノードは、ツリー構造のルートノードを含む。ルートノードは、映像データの最初の映像ブロック（例えば、ＣＴＢ）に対応する。複数のノードのうちのそれぞれの非ルートノードにおいて、それぞれの非ルートノードは、それぞれの非ルートノードのツリー構造における親ノードに対応する映像ブロックのサブブロックである映像ブロックに対応する。複数の非葉ノードのそれぞれの非葉ノードは、ツリー構造において１つ以上の子ノードを有する。

２．１．３ＪＥＭにおけるより大きいＣＴＵを有する４分木＋２分木ブロック構造

ＨＥＶＣを超えた将来の映像符号化技術を探索するため、２０１５年には、ＶＣＥＧとＭＰＥＧが共同でＪＶＥＴ（ＪｏｉｎｔＶｉｄｅｏＥｘｐｌｏｒａｔｉｏｎＴｅａｍ）を設立した。それ以来、多くの新しい方法がＪＶＥＴによって採用され、ＪＥＭ（ＪｏｉｎｔＥｘｐｌｏｒａｔｉｏｎＭｏｄｅ）と呼ばれる参照ソフトウェアに組み込まれてきた。

２．１．３．１ＱＴＢＴブロックの分割構造

ＨＥＶＣとは異なり、ＱＴＢＴ構造は、複数のパーティションタイプの概念を削除する。すなわち、ＣＵ、ＰＵ、ＴＵのコンセプトの切り離しを取り除き、ＣＵパーティションの形状の柔軟性を向上させる。ＱＴＢＴブロック構造において、ＣＵは正方形または長方形のいずれかを有することができる。図５に示すように、まず、符号化ツリーユニット（ＣＴＵ）を４分木構造で分割する。４分木の葉ノードは、２分木構造によってさらに分割される。２分木の分割には、対称水平分割と対称垂直分割の２つの分割タイプがある。２分木の葉ノードは、符号化ユニット（ＣＵ）と呼ばれ、このセグメント化は、それ以上の分割を行うことなく、予測および変換処理に使用される。これは、ＱＴＢＴの符号化ブロック構造において、ＣＵ、ＰＵおよびＴＵが同じブロックサイズを有することを意味する。ＪＥＭにおいて、ＣＵは、しばしば異なる色成分の符号化ブロック（ＣＢ）からなり、例えば、４：２：０彩度フォーマットのＰおよびＢスライスの場合、１つのＣＵは１つの輝度ＣＢおよび２つの彩度ＣＢを含み、また、ＣＵは、しばしば単一の成分のＣＢからなり、例えば、Ｉスライスの場合、１つのＣＵは、１つの輝度ＣＢのみ、または、２つの彩度ＣＢのみを含む。

ＱＴＢＴ分割スキームに対して以下のパラメータを規定する。
－ＣＴＵのサイズ：１つの４分木のルートノードのサイズ、ＨＥＶＣと同じ概念
－ＭｉｎＱＴＳｉｚｅ：最小許容の４分木の葉ノードサイズ
－ＭａｘＢＴＳｉｚｅ：最大許容の２分木のルートノードサイズ
－ＭａｘＢＴＤｅｐｔｈ：最大許容の２分木の深さ
－ＭｉｎＢＴＳｉｚｅ：最小許容の２分木の葉ノードのサイズ

ＱＴＢＴの分割構造の一例において、ＣＴＵのサイズを、２つの対応する６４×６４ブロックの彩度サンプルを有する１２８×１２８の輝度サンプルとして設定し、ＭｉｎＱＴＳｉｚｅを１６×１６として設定し、ＭａｘＢＴＳｉｚｅを６４×６４として設定し、ＭｉｎＢＴＳｉｚｅ（幅および高さの両方について）を４×４として設定し、ＭａｘＢＴＤｅｐｔｈを４として設定する。４分木の分割は、まずＣＴＵに適用され、４分木の葉ノードを生成する。４分木の葉ノードは、１６×１６（即ち、ＭｉｎＱＴＳｉｚｅ）から１２８×１２８（即ち、ＣＴＵサイズ）までのサイズを有することが可能である。葉４分木のノードが１２８×１２８である場合、サイズがＭａｘＢＴＳｉｚｅ（すなわち、６４×６４）を超えるため、２分木によってさらに分割されない。そうでない場合、葉４分木のノードは、２分木によってさらに分割されることができる。従って、この４分木の葉ノードは、２分木のルートノードでもあり、その２分木の深さは０である。２分木の深さがＭａｘＢＴＤｅｐｔｈ（すなわち、４）に達した場合、それ以上の分割は考慮されない。２分木のノードの幅がＭｉｎＢＴＳｉｚｅ（すなわち、４）に等しい場合、それ以上の水平分割は考慮されない。同様に、２分木のノードの高さがＭｉｎＢＴＳｉｚｅに等しい場合、それ以上の垂直分割は考慮されない。２分木の葉ノードは、さらに分割することなく、予測および変換処理によってさらに処理される。ＪＥＭにおいて、最大ＣＴＵサイズは、２５６×２５６個の輝度サンプルである。

図５（左）はＱＴＢＴを用いたブロックの分割の例を示し、図５（右）は対応するツリー表現を示す。実線は４分木の分割を表し、点線は２分木の分割を表す。２分木の各分割（即ち、非葉）ノードにおいて、１つのフラグが、どの分割タイプ（即ち、水平または垂直）が使用されるかを示すために信号通知される。ここで、０は、水平分割を表し、１は、垂直分割を表す。４分木の分割の場合、４分木の分割は常にブロックを水平および垂直に分割し、等分したサイズの４つのサブブロックを生成するため、分割タイプを示す必要はない。

さらに、ＱＴＢＴ方式は、輝度および彩度が別個のＱＴＢＴ構造を有する能力をサポートする。現在、ＰおよびＢスライスの場合、１つのＣＴＵにおける輝度および彩度ＣＴＢは、同じＱＴＢＴ構造を共有する。しかしながら、Ｉスライスの場合、輝度ＣＴＢはＱＴＢＴ構造によってＣＵに分割され、彩度ＣＴＢは別のＱＴＢＴ構造によって彩度ＣＵに分割される。これは、１つのＩスライスにおける１つのＣＵが１つの輝度成分の１つの符号化ブロックまたは２つの彩度成分の１つの符号化ブロックからなり、１つのＰまたはＢスライスにおける１つのＣＵが３つの色成分すべての符号化ブロックからなることを意味する。

ＨＥＶＣにおいて、小さなブロックのためのインター予測は、動き補償のメモリアクセスを低減するために制限され、その結果、４×８および８×４ブロックのために双方向予測はサポートされず、４×４ブロックのためにインター予測はサポートされない。ＪＥＭのＱＴＢＴにおいて、これらの制限は取り除かれる。

２．１．４ＶＶＣの３分木

一部の映像符号化技術は、４分木および２分木以外のツリータイプをサポートする。本実装形態において、図６（ｄ）、（ｅ）に示すように、３分木（ＴＴ）パーティションを２つ以上、すなわち、水平および垂直の中心側の３分木を導入する。

図６は、（ａ）４分木分割、（ｂ）垂直２分木分割、（ｃ）水平２分木分割、（ｄ）垂直中心側３分木分割、（ｅ）水平中心側３分木分割を示す。

いくつかの実装形態において、２つのレベルのツリー、すなわち、領域ツリー（４分木）および予測ツリー（２分木または３分木）がある。ＣＴＵは、まず、領域ツリー（ＲＴ）によって分割される。ＲＴリーフは、予測ツリー（ＰＴ）によってさらに分割されてもよい。ＰＴ葉はまた、最大ＰＴ深さに達するまで、ＰＴでさらに分割されてもよい。ＰＴ葉が基本符号化ユニットである。便宜上、ここでもＣＵと呼ぶ。１つのＣＵをさらに分割することはできない。予測および変換は両方ともＪＥＭと同様にＣＵに適用される。パーティション構造全体を「マルチタイプツリー」と呼ぶ。

２．１．５分割構造の例

この応答で使用されるツリー構造は、マルチツリータイプ（Ｍｕｌｔｉ－ＴｒｅｅＴｙｐｅ：ＭＴＴ）と呼ばれ、ＱＴＢＴを一般化したものである。ＱＴＢＴにおいて、図５に示すように、まず、符号化ツリーユニット（ＣＴＵ）を４分木構造で分割する。４分木の葉ノードは、２分木構造によってさらに分割される。

ＭＴＴの基本構造は、２つのタイプのツリーノードを構成する。図７に示すように、領域ツリー（ＲＴ）および予測ツリー（ＰＴ）は、９つのタイプのパーティションをサポートする。

図７は、（ａ）４分木分割、（ｂ）垂直２分木分割、（ｃ）水平２分木分割、（ｄ）垂直３分木分割、（ｅ）水平３分木分割、（ｆ）水平上方非対称２分木分割、（ｇ）水平下方非対称２分木分割、（ｈ）垂直左非対称２分木分割、（ｉ）垂直右非対称２分木分割を示す。

１つの領域ツリーは、１つのＣＴＵを４×４サイズの領域ツリーの葉ノードになるように正方形のブロックに再帰的に分割することができる。領域ツリーにおける各ノードにおいて、予測ツリーは、２分木（ＢＴ）、３分木（ＴＴ）、および非対称２分木（ＡＢＴ）の３つのツリータイプのうちの１つから形成されることができる。ＰＴ分割において、予測ツリーの枝に４分木のパーティションを有することは禁止される。ＪＥＭにおけるように、輝度ツリーおよび彩度ツリーは、Ｉ個のスライスに分けられる。ＲＴおよびＰＴの信号通知方法を図８に示す。

２．２ＨＥＶＣ／Ｈ．２６５におけるインター予測

各インター予測されたＰＵは、１つまたは２つの参照ピクチャリストのための動きパラメータを有する。動きパラメータは、動きベクトルおよび参照ピクチャインデックスを含む。２つの参照ピクチャリストのうちの１つの参照ピクチャリストの使用は、ｉｎｔｅｒ＿ｐｒｅｄ＿ｉｄｃを使用して信号通知されてもよい。動きベクトルは、予測因子に関連する差分として明確に符号化されてもよく、このような符号化モードは、ＡＭＶＰモードと呼ばれる。

１つのＣＵがスキップモードにて符号化される場合、１つのＰＵがこのＣＵに関連付けられ、有意な残差係数がなく、符号化された動きベクトル差分も参照ピクチャインデックスもない。マージモードを指定し、これにより、現在のＰＵのための動きパラメータを、空間的および時間的候補を含む近傍のＰＵから取得する。マージモードは、スキップモードのためだけでなく、任意のインター予測されたＰＵに適用することができる。マージモードの代替としては、動きパラメータの明確な送信であり、各参照ピクチャリストおよび参照ピクチャリストの使用に対する参照ピクチャインデックスに対応する動きベクトルをＰＵごとに明確に信号通知することである。

２つの参照ピクチャリストのうちの１つを使用することを信号通知が示す場合、サンプルのうちの１つのブロックからＰＵを生成する。これを「単一予測」と呼ぶ。ＰスライスおよびＢスライスの両方に対して単一予測が利用可能である。

両方の参照ピクチャリストを使用することを信号通知が示す場合、サンプルのうちの２つのブロックからＰＵを生成する。これを「双方向予測」と呼ぶ。Ｂスライスのみに双方向予測が利用可能である。

以下、ＨＥＶＣに規定されるインター予測モードについて詳細に説明する。まず、マージモードについて説明する。

２．２．１マージモード

２．２．１．１マージモードの候補の導出

マージモードを使用してＰＵを予測する場合、ビットストリームからマージ候補リストにおけるエントリを指すインデックスを構文解析し、これを使用して動き情報を検索する。このリストの構成は、ＨＥＶＣ規格で規定されており、以下のステップのシーケンスに基づいてまとめることができる。
・ステップ１：初期候補の導出
ｏステップ１．１：空間的候補の導出
ｏステップ１．２：空間的候補の冗長性チェック
ｏステップ１．３：時間的候補の導出
・ステップ２：追加候補の挿入
ｏステップ２．１：双方向予測候補の作成
ｏステップ２．２：動きゼロ候補の挿入

これらのステップは図９にも概略的に示されている。空間的マージ候補の導出のために、５つの異なる位置にある候補の中から最大４つのマージ候補を選択する。時間的マージ候補の導出のために、２つの候補の中から最大１つのマージ候補を選択する。デコーダ側ではＰＵごとに一定数の候補を想定しているので、候補数がスライスヘッダで信号通知されるマージ候補の最大数（ＭａｘＮｕｍＭｅｒｇｅＣａｎｄ）に達しない場合、追加候補を生成する。候補の数は一定であるので、最良マージ候補のインデックスは、短縮された単項２値化（ＴＵ：ｔｒｕｎｃａｔｅｄｕｎａｒｙｂｉｎａｒｉｚａｔｉｏｎ）を使用して符号化される。ＣＵのサイズが８に等しい場合、現在のＣＵのすべてのＰＵは、２Ｎ×２Ｎ予測ユニットのマージ候補リストと同じ１つのマージ候補リストを共有する。

以下、上述したステップに関連付けられた動作を詳しく説明する。

２．２．１．２空間的候補の導出

空間的マージ候補の導出において、図１０に示す位置にある候補の中から、最大４つのマージ候補を選択する。導出の順序はＡ_１、Ｂ_１、Ｂ_０、Ａ_０、Ｂ_２である。位置Ａ_１、Ｂ_１、Ｂ_０、Ａ_０のいずれかのＰＵが利用可能でない場合（例えば、別のスライスまたはタイルに属しているため）、またはイントラ符号化された場合にのみ、位置Ｂ_２が考慮される。位置Ａ_１の候補を加えた後、残りの候補を加えると、冗長性チェックを受け、それにより、同じ動き情報を有する候補を確実にリストから排除でき、符号化効率を向上させることができる。計算の複雑性を低減するために、前述の冗長性チェックにおいて、考えられる候補対のすべてを考慮することはしない。代わりに、図１１において矢印でリンクされた対のみを考慮し、冗長性チェックに使用される対応する候補が同じ動き情報を有していない場合にのみ、その候補をリストに加える。重複した動き情報の別のソースは、２Ｎ×２Ｎとは異なるパーティションに関連付けられた「第２のＰＵ」である。一例として、図１２は、それぞれＮ×２Ｎおよび２Ｎ×Ｎの場合の第２のＰＵを示す。現在のＰＵをＮ×２Ｎに分割する場合、リスト構成に位置Ａ_１の候補は考慮されない。実際、この候補を加えることにより、同じ動き情報を有する２つの予測ユニットが導かれることとなり、１つの符号化ユニットに１つのＰＵのみを有するためには冗長である。同様に、現在のＰＵを２Ｎ×Ｎに分割する場合、位置Ｂ_１は考慮されない。

２．２．１．３時間的候補の導出

このステップにおいて、１つの候補のみがリストに追加される。具体的には、この時間的マージ候補の導出において、所与の参照ピクチャリストにおける現在のピクチャとの間に最小のＰＯＣ差を有するピクチャに属する同一位置のＰＵ（ｃｏ－ｌｏｃａｔｅｄＰＵ）に基づいて、スケーリングされた動きベクトルを導出する。スライスヘッダにおいて、同一位置のＰＵの導出に用いられる参照ピクチャリストが明確に信号通知される。図１３に点線で示すように、時間的マージ候補のスケーリングされた動きベクトルが得られる。これは、ＰＯＣ距離ｔｂおよびｔｄを利用して、同一位置のＰＵの動きベクトルからスケーリングしたものである。ｔｂは、現在のピクチャの参照ピクチャと現在のピクチャのＰＯＣ差として規定され、ｔｄは、同一位置のＰＵの参照ピクチャと同一位置のピクチャのＰＯＣ差として規定する。時間的マージ候補の参照ピクチャインデックスをゼロに等しく設定する。このスケーリング処理の実際的な実現については、ＨＥＶＣ仕様に記載されている。Ｂスライスの場合、２つの動きベクトル、即ち、１つは参照ピクチャリスト０のためのもの、もう１つは参照ピクチャリスト１のためのものを取得し、これらを組み合わせることによって、双方向予測マージ候補を形成する。時間的マージ候補のための動きベクトルのスケーリングの説明。

参照フレームに属する同一位置のＰＵ（Ｙ）において、図１４に示すように、候補Ｃ_０と候補Ｃ_１との間で時間的候補の位置を選択する。位置Ｃ_０のＰＵが利用可能でない場合、イントラ符号化されている場合、または現在のＣＴＵの外側にある場合、位置Ｃ_１が使用される。そうでない場合、位置Ｃ_０が時間的マージ候補の導出に使用される。

２．２．１．４追加候補の挿入

空間的－時間的マージ候補の他に、２つの追加のタイプのマージ候補、すなわち、結合双方向予測マージ候補およびゼロマージ候補がある。空間的－時間的マージ候補を利用して、結合双方向予測マージ候補を生成する。結合双方向予測マージ候補は、Ｂスライスのみに使用される。最初の候補の第１の参照ピクチャリスト動きパラメータと別の候補の第２の参照ピクチャリスト動きパラメータとを組み合わせることで、結合双方向予測候補を生成する。これら２つのタプルが異なる動きの仮説を提供する場合、これらのタプルは、新しい双方向予測候補を形成する。一例として、図１５は、オリジナルリスト（左側）における、ｍｖＬ０およびｒｅｆＩｄｘＬ０、またはｍｖＬ１およびｒｅｆＩｄｘＬ１を有する２つの候補を用いて、最終リスト（右側）に加えられる結合双方向予測マージ候補を生成する場合を示す。これらの追加のマージ候補を生成するために考慮される組み合わせについては、様々な規則が存在する。

ゼロ動き候補を挿入し、マージ候補リストにおける残りのエントリを埋めることにより、ＭａｘＮｕｍＭｅｒｇｅＣａｎｄ容量にヒットする。これらの候補は、空間的変位がゼロであり、新しいゼロ動き候補をリストに加える度にゼロから始まり増加する参照ピクチャインデックスを有する。これらの候補が使用する参照フレームの数は、それぞれ、一方向予測の場合は１つ、双方向予測の場合は２つである。最終的には、これらの候補に対して冗長性チェックは行われない。

２．２．１．５並列処理のための動き推定領域

符号化処理を高速化するために、動き推定を並列に行うことができ、それによって、所与の領域内のすべての予測ユニットの動きベクトルを同時に導出する。１つの予測ユニットは、その関連する動き推定が完了するまで、隣接するＰＵから動きパラメータを導出することができないので、空間的近傍からのマージ候補の導出は、並列処理に干渉する可能性がある。符号化効率と処理待ち時間との間のトレードオフを緩和するために、ＨＥＶＣは、動き推定領域（ＭＥＲ：ＭｏｔｉｏｎＥｓｔｉｍａｔｉｏｎＲｅｇｉｏｎ）を規定し、そのサイズは、「ｌｏｇ２＿ｐａｒａｌｌｅｌ＿ｍｅｒｇｅ＿ｌｅｖｅｌ＿ｍｉｎｕｓ２」構文要素を使用してピクチャパラメータセットにおいて信号通知される。１つのＭＥＲを規定するとき、同じ領域にあるマージ候補は使用不可としてマークされ、それゆえにリスト構築においては考慮されない。
７．３．２．３ピクチャパラメータセットＲＢＳＰ構文
７．３．２．３．１一般ピクチャパラメータセットＲＢＳＰ構文

ｌｏｇ２＿ｐａｒａｌｌｅｌ＿ｍｅｒｇｅ＿ｌｅｖｅｌ＿ｍｉｎｕｓ２＋２は、８．５．３．２．２．２節で指定されたマージモードの輝度動きベクトルの導出処理と、８．５．３．２．３節で指定された空間的マージ候補の導出処理で使用される変数Ｌｏｇ２ＰａｒＭｒｇＬｅｖｅｌの値を指定する。ｌｏｇ２＿ｐａｒａｌｌｅｌ＿ｍｅｒｇｅ＿ｌｅｖｅｌ＿ｍｉｎｕｓ２の値は、０～ＣｔｂＬｏｇ２ＳｉｚｅＹ－２を含む範囲内とする。
変数Ｌｏｇ２ＰａｒＭｒｇＬｅｖｅｌは、以下のように導出される。
Ｌｏｇ２ＰａｒＭｒｇＬｅｖｅｌ＝ｌｏｇ２＿ｐａｒａｌｌｅｌ＿ｍｅｒｇｅ＿ｌｅｖｅｌ＿ｍｉｎｕｓ２＋２（７－３７）
注３：Ｌｏｇ２ＰａｒＭｒｇＬｅｖｅｌの値は、マージ候補リストを並列に導出する組み込み能力を示す。例えば、Ｌｏｇ２ＰａｒＭｒｇＬｅｖｅｌが６に等しい場合、６４×６４ブロックに含まれたすべての予測ユニット（ＰＵ）および符号化ユニット（ＣＵ）のためのマージ候補リストを並列に導出することができる。

２．２．２ＡＭＶＰモードにおける動きベクトル予測

動きベクトル予測は、動きベクトルと近傍のＰＵとの間の空間的－時間的相関を利用し、これを動きパラメータの明確な伝送に用いる。まず、左側、上側の時間的に近傍のＰＵの位置の可用性をチェックし、冗長な候補を取り除き、ゼロベクトルを加えることで、候補リストの長さを一定にすることで、動きベクトル候補リストを構築する。次いで、エンコーダは、候補リストから最良の予測因子を選択し、選択された候補を示す対応するインデックスを送信することができる。マージインデックスの信号通知と同様に、最良の動きベクトル候補のインデックスは、短縮された単項を使用して符号化される。この場合の符号化対象の最大値は２である（例えば、図２～図８）。以下の章では、動きベクトル予測候補の導出処理の詳細を説明する。

２．２．２．１動きベクトル予測候補の導出

図１６に、動きベクトル予測候補の導出処理をまとめる。

動きベクトル予測において、空間的動きベクトル候補と時間的動きベクトル候補という２つのタイプの動きベクトル候補が考慮される。空間的動きベクトル候補の導出のために、図１１に示したように、５つの異なる位置にある各ＰＵの動きベクトルに基づいて、最終的には２つの動きベクトル候補を導出する。

時間的動きベクトル候補の導出のために、２つの異なる同一位置の配置に基づいて導出された２つの候補から１つの動きベクトル候補を選択する。空間的－時間的候補の最初のリストを作成した後、リストにおける重複した動きベクトル候補を除去する。可能性のある候補の数が２よりも多い場合、関連づけられた参照ピクチャリストにおける参照ピクチャインデックスが１よりも大きい動きベクトル候補をリストから削除する。空間的－時間的動きベクトル候補の数が２未満である場合は、追加のゼロ動きベクトル候補をリストに加える。

２．２．２．２空間的動きベクトル候補

空間的動きベクトル候補の導出において、図１１に示したような位置にあるＰＵから導出された５つの可能性のある候補のうち、動きマージと同じ位置にあるものを最大２つの候補を考慮する。現在のＰＵの左側のための導出の順序は、Ａ_０、Ａ_１、スケーリングされたＡ_０、スケーリングされたＡ_１として規定される。現在のＰＵの上側のための導出の順序は、Ｂ_０、Ｂ_１、Ｂ_２、スケーリングされたＢ_０、スケーリングされたＢ_１、スケーリングされたＢ_２として規定される。そのため、辺ごとに、動きベクトル候補として使用できる場合が４つ、すなわち空間的スケーリングを使用する必要がない２つの場合と、空間的スケーリングを使用する２つの場合とがある。４つの異なる場合をまとめると、以下のようになる。
・空間的スケーリングなし
－（１）同じ参照ピクチャリスト、かつ、同じ参照ピクチャインデックス（同じＰＯＣ）
－（２）異なる参照ピクチャリスト、かつ、同じ参照ピクチャ（同じＰＯＣ）
・空間的スケーリング
－（３）同じ参照ピクチャリスト、かつ、異なる参照ピクチャ（異なるＰＯＣ）
－（４）異なる参照ピクチャリスト、かつ、異なる参照ピクチャ（異なるＰＯＣ）

最初に非空間的スケーリングの場合をチェックし、次に空間的スケーリングを行う。参照ピクチャリストにかかわらず、ＰＯＣが近傍のＰＵの参照ピクチャと現在のＰＵの参照ピクチャとで異なる場合、空間的スケーリングを考慮する。左側候補のすべてのＰＵが利用可能でないか、またはイントラ符号化されている場合、上側の動きベクトルのスケーリングは、左側および上側のＭＶ候補の並列導出に役立つ。そうでない場合、上側の動きベクトルに対して空間的スケーリングは許可されない。

空間的スケーリング処理において、図１７に示すように、時間的スケーリングと同様にして、近傍のＰＵの動きベクトルをスケーリングする。主な違いは、現在のＰＵの参照ピクチャリストおよびインデックスを入力として与え、実際のスケーリング処理は時間的スケーリングと同じであることである。

２．２．２．３時間的動きベクトル候補

参照ピクチャインデックスを導出する以外は、時間的マージ候補を導出するための処理は、すべて、空間的動きベクトル候補を導出するための処理と同じである（図６参照）。参照ピクチャインデックスはデコーダに信号通知される。

２．２．２．４ＡＭＶＰ情報の信号通知

ＡＭＶＰモードの場合、ビットストリームにおいて、４つの部分、すなわち、予測方向、参照インデックス、ＭＶＤ、およびｍｖ予測因子候補インデックスを信号通知することができる。
構文テーブル：

７．３．８．９動きベクトル差構文

２．３ＪＥＭ（ＪｏｉｎｔＥｘｐｌｏｒａｔｉｏｎＭｏｄｅｌ）における新しいインター予測方法

２．３．１サブＣＵに基づく動きベクトル予測

ＱＴＢＴを有するＪＥＭにおいて、各ＣＵは、各予測方向に対して最大１つの動きパラメータのセットを有することができる。エンコーダにおいて、大きなＣＵをサブＣＵに分割し、大きなＣＵのすべてのサブＣＵの動き情報を導出することにより、２つのサブＣＵレベルの動きベクトル予測方法を考慮する。ＡＴＭＶＰ（ＡｌｔｅｒｎａｔｉｖｅＴｅｍｐｏｒａｌＭｏｔｉｏｎＶｅｃｔｏｒＰｒｅｄｉｃｔｉｏｎ）方法により、各ＣＵが、配列された参照ピクチャにおける現在のＣＵよりも小さい複数のブロックから複数の動き情報のセットをフェッチすることが可能となる。ＳＴＭＶＰ（Ｓｐａｔｉａｌ－ＴｅｍｐｏｒａｌＭｏｔｉｏｎＶｅｃｔｏｒＰｒｅｄｉｃｔｉｏｎ）法において、時間的動きベクトル予測因子および空間的近傍動きベクトルを使用して、サブＣＵの動きベクトルを再帰的に導出する。

サブＣＵ動き予測のためにより正確な動きフィールドを維持するために、参照フレームの動き圧縮は現在無効にされている。

２．３．１．１代替の時間的動きベクトル予測

ＡＴＭＶＰ（ＡｌｔｅｒｎａｔｉｖｅＴｅｍｐｏｒａｌＭｏｔｉｏｎＶｅｃｔｏｒＰｒｅｄｉｃｔｉｏｎ）において、動きベクトルＴＭＶＰ（ＴｅｍｐｏｒａｌＭｏｔｉｏｎＶｅｃｔｏｒＰｒｅｄｉｃｔｉｏｎ）法は、現在のＣＵより小さいブロックから複数セットの動き情報（動きベクトルおよび参照インデックスを含む）をフェッチすることで修正される。図１８に示すように、サブＣＵは、正方形のＮ×Ｎブロックの正方形である（デフォルトでは、Ｎは４に設定される）。

ＡＴＭＶＰは、ＣＵ内のサブＣＵの動きベクトルを２つのステップで予測する。第１のステップは、参照ピクチャにおける対応するブロックを、いわゆる時間的ベクトルで特定することである。この参照ピクチャを動きソースピクチャと呼ぶ。第２のステップは、図１８に示すように、現在のＣＵをサブＣＵに分割し、各サブＣＵに対応するブロックから各サブＣＵの動きベクトルならびに参照インデックスを取得する。

第１のステップにおいて、現在のＣＵの空間的に近傍のブロックの動き情報によって、参照ピクチャおよび対応するブロックを決定する。近傍のブロックの繰り返し走査処理を回避するために、現在のＣＵのマージ候補リストにおける最初のマージ候補を用いる。最初の利用可能な動きベクトルおよびその関連する参照インデックスを、時間的ベクトルおよび動きソースピクチャのインデックスに設定する。このように、ＡＴＭＶＰでは、ＴＭＶＰに比べて、対応するブロックをより正確に特定することができ、対応するブロック（配列されたブロックと呼ばれることがある）は、常に現在のＣＵに対して右下または中心位置にある。１つの例において、最初のマージ候補が左側の近傍のブロック（即ち、図１９のＡ_１）からのものである場合、関連するＭＶおよび参照ピクチャを利用して、ソースブロックおよびソースピクチャを特定する。

図１９は、ソースブロックおよびソースピクチャの特定の例を示す。

第２のステップにおいて、現在のＣＵの座標に時間ベクトルを加えることで、動きソースピクチャにおける時間的ベクトルによって、サブＣＵの対応するブロックを特定する。サブＣＵごとに、その対応するブロックの動き情報（中心サンプルを覆う最小の動きグリッド）を使用して、サブＣＵの動き情報を導出する。対応するＮ×Ｎブロックの動き情報を特定した後、ＨＥＶＣのＴＭＶＰと同様に、現在のサブＣＵの動きベクトルおよび参照インデックスに変換され、動きスケーリングや他の手順が適用される。例えば、デコーダは、低遅延条件（すなわち、現在のピクチャのすべての参照ピクチャのＰＯＣが現在のピクチャのＰＯＣよりも小さい）が満たされているかどうかをチェックし、場合によっては、動きベクトルＭＶ_ｘ（参照ピクチャリストＸに対応する動きベクトル）を使用して、各サブＣＵの動きベクトルＭＶ_ｙ（Ｘが０または１に等しく、Ｙが１－Ｘに等しい）を予測する。

２．３．１．２空間的－時間的動きベクトル予測

この方法において、サブＣＵの動きベクトルは、ラスタスキャンの順に沿って再帰的に導出される。図２０にこの概念を示す。４つの４×４サブＣＵであるＡ、Ｂ、Ｃ、およびＤを含む８×８ＣＵを考える。現在のフレームの近傍の４×４ブロックには、ａ、ｂ、ｃ、ｄというラベルが付けられている。

サブＣＵＡの動き導出は、その２つの空間的近傍を特定することで始まる。第１の近傍は、サブＣＵＡの上のＮ×Ｎブロックである（ブロックｃ）。このブロックｃが利用可能でないか、またはイントラ符号化されている場合、サブＣＵＡより上の他のＮ×Ｎブロックをチェックする（ブロックｃから始まり、左から右へ）。第２の近傍は、サブＣＵＡの左側のブロックである（ブロックｂ）。ブロックｂが利用可能でないか、またはイントラ符号化されている場合、サブＣＵＡの左側の他のブロックをチェックする（ブロックｂから始まり、上から下へ）。各リストの近傍のブロックから得られた動き情報を、所与のリストの第１の参照フレームにスケーリングする。次に、ＨＥＶＣに規定されているＴＭＶＰ（ＴｅｍｐｏｒａｌＭｏｔｉｏｎＶｅｃｔｏｒＰｒｅｄｉｃｔｏｒ）導出と同様の手順に従って、サブブロックＡのＴＭＶＰを導出する。位置Ｄにおける配列されたブロックの動き情報をフェッチし、それに応じてスケーリングする。最後に、動き情報を検索し、スケーリングした後、参照リストごとにすべての利用可能な動きベクトル（３まで）を別々に平均する。この平均化された動きベクトルを現在のサブＣＵの動きベクトルとする。

図２０は、４つのサブブロック（Ａ－Ｄ）およびその近傍のブロックを有する１つのＣＵの例を示す。

２．３．１．３サブＣＵ動き予測モード信号通知

サブＣＵモードは追加のマージ候補として有効とされ、モードを信号通知するために追加の構文要素は必要とされない。ＡＴＭＶＰモードおよびＳＴＭＶＰモードを表すように、各ＣＵのマージ候補リストに２つの追加のマージ候補を加える。シーケンスパラメータセットがＡＴＭＶＰおよびＳＴＭＶＰが有効であることを示す場合、７個までのマージ候補を使用する。追加のマージ候補の符号化ロジックは、ＨＭにおけるマージ候補の場合と同じであり、つまり、ＰまたはＢスライスにおける各ＣＵについて、２つの追加のマージ候補に対して２回以上のＲＤチェックが必要となる。

ＪＥＭにおいて、マージインデックスのすべてのビンは、ＣＡＢＡＣによって符号化されたコンテキストである。一方、ＨＥＶＣにおいては、最初のビンのみが符号化されたコンテキストであり、残りのビンはバイパス符号化されたコンテキストである。

２．３．２適応型動きベクトル差分解像度

ＨＥＶＣにおいて、ｕｓｅ＿ｉｎｔｅｇｅｒ＿ｍｖ＿ｆｌａｇがスライスヘッダにおいて０であるとき、１／４輝度サンプルの単位で動きベクトル差分（ＭＶＤ：ＭｏｔｉｏｎＶｅｃｔｏｒＤｉｆｆｅｒｅｎｃｅ）（動きベクトルとＰＵの予測動きベクトルとの差）が信号通知される。ＪＥＭにおいて、ＬＡＭＶＲ（ＬｏｃａｌｌｙＡｄａｐｔｉｖｅＭｏｔｉｏｎＶｅｃｔｏｒＲｅｓｏｌｕｔｉｏｎ）が導入される。ＪＥＭにおいて、ＭＶＤは、１／４輝度サンプル、整数輝度サンプル、または４つの輝度サンプルの単位復号化できる。ＭＶＤ解像度は符号化ユニット（ＣＵ）レベルで制御され、ＭＶＤ解像度フラグは、少なくとも１つの非ゼロＭＶＤの構成要素を有する各ＣＵに対して条件付きで信号通知される。

少なくとも１つの非ゼロＭＶＤの構成要素を有するＣＵの場合、１／４輝度サンプルＭＶ精度がＣＵにおいて使用されるか否かを示すために、第１のフラグが信号通知される。第１のフラグ（１に等しい）が、１／４輝度サンプルＭＶ精度が使用されていないことを示す場合、整数輝度サンプルＭＶ精度が使用されるかまたは４輝度サンプルＭＶ精度が使用されるかを示すために、別のフラグが信号通知される。

ＣＵの第１のＭＶＤ解像度フラグがゼロであるか、またはＣＵに対して符号化されていない（つまり、ＣＵにおけるすべてのＭＶＤがゼロである）場合、ＣＵに対して１／４輝度サンプルＭＶ解像度が使用される。ＣＵが整数輝度サンプルＭＶ精度または４輝度サンプルＭＶ精度を使用する場合、ＣＵのＡＭＶＰ候補リストにおけるＭＶＰを対応する精度に丸める。

エンコーダにおいて、ＣＵレベルのＲＤチェックは、どのＭＶＤ解像度をＣＵに用いるかを決定するために用いられる。すなわち、１つのＭＶＤ解像度ごとに３回、ＣＵレベルのＲＤチェックを行う。エンコーダの速度を速めるために、ＪＥＭにおいては、以下の符号化方式が適用される。

通常の１／４輝度サンプルＭＶＤ解像度を有するＣＵのＲＤチェック中、現在のＣＵの動き情報（整数輝度サンプル精度）が記憶される。整数輝度サンプルおよび４輝度サンプルのＭＶＤ解像度を有する同じＣＵのＲＤチェック中に、記憶された動き情報（丸められた後）は、更なる小範囲の動きベクトル改良の開始点として使用されるので、時間がかかる動き推定処理が３回重複しない。

４輝度サンプルＭＶＤ解像度を有するＣＵのＲＤチェックを条件付きで呼び出す。ＣＵの場合、整数輝度サンプルＭＶＤ解像度のＲＤコストが１／４輝度サンプルＭＶＤ解像度のそれよりもはるかに大きい場合、ＣＵのための４輝度サンプルＭＶＤ解像度のＲＤチェックは省略される。

２．３．３パターンマッチング動きベクトルの導出

ＰＭＭＶＤ（ＰａｔｔｅｒｎＭａｔｃｈｅｄＭｏｔｉｏｎＶｅｃｔｏｒＤｅｒｉｖａｔｉｏｎ）モードは、ＦＲＵＣ（Ｆｒａｍｅ－ＲａｔｅＵｐＣｏｎｖｅｒｓｉｏｎ）技術に基づく特殊なマージモードである。このモードでは、ブロックの動き情報は信号通知されず、デコーダ側で導出される。

そのマージフラグが真である場合、ＦＲＵＣフラグは、ＣＵに信号通知される。ＦＲＵＣフラグが偽である場合、マージインデックスは信号通知され、通常のマージモードが使用される。ＦＲＵＣフラグが真である場合、追加のＦＲＵＣモードフラグを信号通知して、どの方法（バイラテラルマッチングまたはテンプレートマッチング）を使用してブロックの動き情報を導出するかを示す。

エンコーダ側では、ＣＵのためにＦＲＵＣマージモードを使用するかどうかの決定は、通常のマージ候補に対して行われるのと同じように、ＲＤコスト選択に基づく。つまり、ＲＤコスト選択を使用して、１つのＣＵに対して２つのマッチングモード（バイラテラルマッチングおよびテンプレートマッチング）を両方チェックする。最小コストに導くものが、更に、他のＣＵモードと比較される。ＦＲＵＣマッチングモードが最も効率的なものである場合、ＣＵに対してＦＲＵＣフラグを真に設定し、関連するマッチングモードを使用する。

ＦＲＵＣマージモードにおける動き導出処理は、２つのステップを有する。まず、ＣＵレベルの動き探索を実行し、次に、サブＣＵレベルの動き改良を実行する。ＣＵレベルでは、バイラテラルマッチングまたはテンプレートマッチングに基づいて、ＣＵ全体のための初期の動きベクトルを導出する。まず、ＭＶ候補のリストを生成し、最小マッチングコストに導く候補を、さらなるＣＵレベル改善の開始点として選択する。そして、開始点付近のバイラテラルマッチングまたはテンプレートマッチングに基づく局所検索を行い、最小マッチングコストとなるＭＶ結果をＣＵ全体のＭＶとする。続いて、導出されたＣＵ動きベクトルを開始点として、サブＣＵレベルでの動き情報をさらに改良する。

例えば、Ｗ×ＨＣＵ動き情報導出のために、以下の導出処理を行う。第１のステージにおいて、Ｗ×ＨＣＵ全体のためのＭＶが導出される。第２のステージにおいて、ＣＵは、Ｍ×ＭのサブＣＵにさらに分割される。Ｍの値は、（１６）のように計算されるが、Ｄは、予め定義された分割深さであり、ＪＥＭにおいてデフォルトで３に設定される。そして、各サブＣＵのＭＶを導出する。

図２１に示すように、このバイラテラルマッチングは、２つの異なる参照ピクチャにおける現在のＣＵの動き軌跡に沿った２つのブロック間の最も近いマッチングを見出すことにより、現在のＣＵの動き情報を導出するために用いられる。連続した動き軌跡を仮定すると、２つの参照ブロックを指す動きベクトルＭＶ０およびＭＶ１は、現在のピクチャと２つの参照ピクチャとの間の時間的距離、例えばＴＤ０およびＴＤ１に比例する。特殊なケースとしては、現在のピクチャが時間的に２つの参照ピクチャの間にあり、現在のピクチャから２つの参照ピクチャまでの時間的な距離が同じである場合、バイラテラルマッチングはミラーに基づく双方向ＭＶとなる。

図２２に示すように、現在のピクチャにおけるテンプレート（現在のＣＵの上側および／または左側の近傍のブロック）と、参照ピクチャにおけるブロック（テンプレートと同じサイズ）との間の最も近いマッチングを見出すことで、テンプレートマッチングを使用して、現在のＣＵの動き情報を導出する。前述のＦＲＵＣマージモード以外に、テンプレートマッチングは、ＡＭＶＰモードにも適用される。ＪＥＭにおいて、ＨＥＶＣと同様、ＡＭＶＰは２つの候補を有する。テンプレートマッチング法を用いることで、新しい候補を導出する。テンプレートマッチングによって新規に導出された候補が、第１の既存のＡＭＶＰ候補と異なる場合、ＡＭＶＰ候補リストの最初に挿入し、次に、リストサイズを２（第２の既存のＡＭＶＰ候補を取り除くことを意味する）に設定する。ＡＭＶＰモードに適用される場合、ＣＵレベル検索のみが適用される。

２．３．３．１ＣＵレベルＭＶ候補セット

ＣＵレベルのＭＶ候補セットは、以下からなる。
（ｉ）現在のＣＵがＡＭＶＰモードになっている場合の元のＡＭＶＰ候補
（ｉｉ）すべてのマージ候補、
（ｉｉｉ）補間ＭＶフィールド内の複数のＭＶ。
（ｉｖ）上と左の近傍の動きベクトル

バイラテラルマッチングを使用する場合、マージ候補の各有効なＭＶを入力として使用して、バイラテラルマッチングを仮定してＭＶ対を生成する。例えば、マージ候補の１つの有効なＭＶは、参照リストＡにおいて（ＭＶａ，ｒｅｆａ）である。そして、その対をなすバイラテラルＭＶの参照ピクチャｒｅｆｂが他の参照リストＢにおいて見出され、ｒｅｆａおよびｒｅｆｂは、時間的に現在のピクチャの異なる側にある。参照リストＢにおいてこのようなｒｅｆｂが利用可能でない場合、ｒｅｆｂをｒｅｆａとは異なる参照として決定し、現在のピクチャとの時間的距離はリストＢにおける最小値である。ｒｅｆｂを決定した後、現在のピクチャとｒｅｆａ，ｒｅｆｂとの時間的距離に基づいてＭＶａをスケーリングすることでＭＶｂを導出する。

補間されたＭＶフィールドからの４つのＭＶもＣＵレベル候補リストに追加する。より具体的には、現在のＣＵの位置（０，０）、（Ｗ／２，０）、（０，Ｈ／２）、（Ｗ／２，Ｈ／２）の補間ＭＶを加算する。

ＡＭＶＰモードでＦＲＵＣを適用する場合、元のＡＭＶＰ候補をＣＵレベルＭＶ候補セットにも加える。

ＣＵレベルにおいて、ＡＭＶＰＣＵのための最大１５個のＭＶおよびマージＣＵのための最大１３個のＭＶを候補リストに加える。

２．３．３．２サブＣＵレベルＭＶ候補セット

サブＣＵレベルのＭＶ候補セットは、以下からなる。
（ｉ）ＣＵレベルの検索から決定されたＭＶ、
（ｉｉ）上、左、左上、右上の近傍のＭＶ、
（ｉｉｉ）参照ピクチャからの並置されたＭＶのスケーリングされたバージョン、
（ｉｖ）最大４つのＡＴＭＶＰ候補、
（ｖ）最大４つのＳＴＭＶＰ候補

参照ピクチャからのスケーリングされたＭＶは、以下のように導出される。両方のリストにおける参照ピクチャをすべてトラバースする。参照ピクチャにおけるサブＣＵの配列位置にあるＭＶは、開始ＣＵレベルＭＶの参照に対してスケーリングされる。

ＡＴＭＶＰおよびＳＴＭＶＰの候補は、最初の４つの候補に限定される。

サブＣＵレベルにおいて、最大１７個のＭＶが候補リストに追加される。

２．３．３．３補間ＭＶフィールドの生成

フレームを符号化する前に、一方のＭＥに基づいてピクチャ全体に対して補間動きフィールドを生成する。そして、この動きフィールドを後にＣＵレベルまたはサブＣＵレベルのＭＶ候補として使用してもよい。

まず、両方の参照リストにおける各参照ピクチャの動きフィールドは、４×４ブロックレベルでトラバースされる。各４×４ブロックにおいて、現在のピクチャ（図２３に示す）の４×４ブロックを通過するブロックに関連する動きで、補間動きがまだ割り当てられていない場合、時間的距離ＴＤ０およびＴＤ１に基づいて（ＨＥＶＣにおけるＴＭＶＰのＭＶスケーリングと同様に）、参照ブロックの動きを現在のピクチャにスケーリングし、スケーリングされた動きを現在のフレームのブロックに割り当てる。４×４ブロックにスケーリングされたＭＶが割り当てられていない場合、ブロックの動きは、補間された動きフィールドにおいて利用不可能であるとマークされる。

２．３．３．４補間およびマッチングコスト

１つの動きベクトルが１つの分数のサンプル位置を指す場合、動きの補償された補間が必要である。複雑性を低減するために、通常の８タップＨＥＶＣ補間の代わりに、バイラテラルマッチングおよびテンプレートマッチングの両方に双線形補間を使用する。

マッチングコストの計算は、異なるステップでは少し異なる。ＣＵレベルの候補セットから候補を選択する場合、マッチングコストは、バイラテラルマッチングまたはテンプレートマッチングの差分の絶対値の和（ＳＡＤ）である。開始ＭＶを決定した後、サブＣＵレベル検索におけるバイラテラルマッチングのマッチングコストＣを以下のように算出する。

ここで、ｗは、経験的に４に設定された重み係数であり、ＭＶおよびＭＶ^Ｓは、それぞれ、現在のＭＶおよび開始ＭＶを示す。ＳＡＤは、依然として、サブＣＵレベル検索におけるテンプレートマッチングのマッチングコストとして使用される。

ＦＲＵＣモードにおいて、ＭＶは、輝度サンプルのみを使用することによって導出される。導出された動きは、ＭＣインター予測のために、輝度および彩度の両方に使用される。ＭＶを決定した後、輝度用の８タップ補間フィルタおよび彩度用の４タップ補間フィルタを使用して、最終的なＭＣを行う。

２．３．３．５ＭＶの改良

ＭＶ改良は、バイラテラルマッチングコストまたはテンプレートマッチングコストの基準を有するパターンに基づくＭＶ検索である。ＪＥＭでは、２つの検索パターン、即ち、ＵＣＢＤＳ（ＵｎｒｅｓｔｒｉｃｔｅｄＣｅｎｔｅｒ－ＢｉａｓｅｄＤｉａｍｏｎｄＳｅａｒｃｈ）およびＣＵレベルおよびサブＣＵレベルでのＭＶ改良のための適応的横断検索をそれぞれサポートする。ＣＵおよびサブＣＵレベルのＭＶ改善の両方のために、ＭＶは、１／４輝度サンプルＭＶの正確度で直接検索され、これに続いて１／８輝度サンプルＭＶの改良が行われる。ＣＵおよびサブＣＵステップのためのＭＶ改良の検索範囲は、８つの輝度サンプルに等しく設定される。

２．３．３．６テンプレートマッチングＦＲＵＣマージモードにおける予測方向の選択

バイラテラルマッチングマージモードにおいては、２つの異なる参照ピクチャにおける現在のＣＵの動き軌跡に沿った２つのブロック間の最も近いマッチングに基づいて、ＣＵの動き情報を導出するため、双方向予測が常に適用される。テンプレートマッチングマージモードについては、そのような制限はない。テンプレートマッチングマージモードにおいて、エンコーダは、ｌｉｓｔ０からの単一予測、ｌｉｓｔ１からの単一予測、またはＣＵのための双方向予測のうちから選択することができる。選択は、テンプレートマッチングコストに基づいて、以下のように行う。
ｃｏｓｔＢｉ≦ｆａｃｔｏｒ＊ｍｉｎ（ｃｏｓｔ０，ｃｏｓｔ１）の場合
双方向予測を用いる。
それ以外の場合において、ｃｏｓｔ０≦ｃｏｓｔ１の場合
ｌｉｓｔ０からの単一予測を用いる。
そうでない場合、
ｌｉｓｔ１からの単一予測を用いる。

ここで、ｃｏｓｔ０はｌｉｓｔ０テンプレートマッチングのＳＡＤであり、ｃｏｓｔ１はｌｉｓｔ１テンプレートマッチングのＳＡＤであり、ｃｏｓｔＢｉは双方向予測テンプレートマッチングのＳＡＤである。ｆａｃｔｏｒの値が１．２５である場合、選択処理が双方向予測に偏っていることを意味する。このインター予測方向選択は、ＣＵレベルのテンプレートマッチング処理にのみ適用される。

２．３．４デコーダ側動きベクトル改良

双方向予測演算において、１つのブロック領域を予測するために、ｌｉｓｔ０の動きベクトル（ＭＶ）およびｌｉｓｔ１のＭＶをそれぞれ使用して構成される２つの予測ブロックを組み合わせ、１つの予測信号を形成する。ＤＭＶＲ（Ｄｅｃｏｄｅｒ－ｓｉｄｅＭｏｔｉｏｎＶｅｃｔｏｒＲｅｆｉｎｅｍｅｎｔ）方法において、バイラテラルテンプレートマッチング処理によって、双方向予測の２つの動きベクトルをさらに改良する。追加の動き情報を送信することなく改良されたＭＶを得るために、デコーダにおいてバイラテラルテンプレートマッチングを適用し、バイラテラルテンプレートと参照ピクチャにおける再構成サンプルとの間の歪みに基づく検索を行う。

ＤＭＶＲにおいて、図２３に示すように、ｌｉｓｔ０の最初のＭＶ０とｌｉｓｔ１のＭＶ１とから、それぞれ、２つの予測ブロックの重み付け結合（すなわち、平均）としてバイラテラルテンプレートを生成する。テンプレートマッチング操作は、生成されたテンプレートと参照ピクチャにおけるサンプル領域（最初の予測ブロックの付近）との間のコスト尺度を計算することからなる。２つの参照ピクチャの各々について、テンプレートコストが最小となるＭＶを、そのリストの更新されたＭＶと見なし、元のＭＶに置き換える。ＪＥＭにおいて、各リストに対して９つのＭＶ候補を検索する。９つのＭＶ候補は、元のＭＶと、水平または垂直方向のいずれかまたは両方向に元のＭＶに対してオフセットしている１つの輝度サンプルを有する８つの周囲のＭＶを含む。最後に、２つの新しいＭＶ、即ち、図２４に示すようなＭＶ０’およびＭＶ１’を使用して、最終的な双方向予測結果を生成する。差分の絶対値の和（ＳＡＤ）をコスト尺度として使用する。

ＤＭＶＲは、追加の構文要素を送信することなく、過去の参照ピクチャからの１つのＭＶと、将来の参照ピクチャからの１つのＭＶとの間の双方向予測のマージモードに適用される。ＪＥＭにおいて、ＣＵに対してＬＩＣ、アフィン動き、ＦＲＵＣ、またはサブＣＵマージ候補が有効である場合、ＤＭＶＲは適用されない。

２．３．５バイラテラルマッチングの改良を伴うマージ／スキップモード

まず、利用可能な候補の数が最大候補サイズ１９に達するまで、空間的に近傍のブロックおよび時間的に近傍のブロックの動きベクトルおよび参照インデックスを冗長性チェック付き候補リストに挿入することで、マージ候補リストを構築する。マージ／スキップモードのマージ候補リストは、予め規定された挿入順に基づいて、ＨＥＶＣ（結合候補およびゼロ候補）に用いられる空間的候補（図１１）、時間的候補、アフィン候補、ＡＴＭＶＰ（ＡｄｖａｎｃｅｄＴｅｍｐｏｒａｌＭＶＰ）候補、ＳＴＭＶＰ（ＳｐａｔｉａｌＴｅｍｐｏｒａｌＭＶＰ）候補、および追加候補を挿入することで構築される。

－ブロック１～４の空間的候補

－ブロック１～４の外挿アフィン候補

－ＡＴＭＶＰ

－ＳＴＭＶＰ

－仮想アフィン候補

－空間的候補（ブロック５）（利用可能な候補の数が６よりも少ない場合にのみ使用される）。

－外挿アフィン候補（ブロック５）

－時間的候補（ＨＥＶＣのように導出）

－外挿アフィン候補に続く非隣接空間的候補（図２５に示すブロック６～４９）。

－結合候補

－ゼロ候補

なお、ＩＣフラグは、ＳＴＭＶＰおよびアフィンを除き、マージ候補から継承される。また、最初の４つの空間的候補について、双方向予測のものを単一予測のものの前に挿入する。

いくつかの実施形態において、現在のブロックに接続されていないブロックにアクセスすることができる。非隣接ブロックが非イントラモードにて符号化されている場合、関連する動き情報を追加のマージ候補として追加してもよい。

２．３．６共有マージリストＪＶＥＴ－Ｍ０１７０

小さなスキップ／マージ符号化されたＣＵを並列処理することを有効にするために、ＣＵ分割木における１つの祖先ノードのすべての葉の符号化ユニット（ＣＵ）に対して同じマージ候補リストを共有することが提案される。祖先ノードをマージ共有ノードと呼ぶ。マージ共有ノードが葉ＣＵであるように見せかけて、マージ共有ノードにおいて共有マージ候補リストを生成する。

Ｔｙｐｅ－２の定義において、復号化の構文解析段階において、ＣＴＵ内部のＣＵごとにマージ共有ノードを決定する。また、マージ共有ノードは、葉ＣＵの祖先ノードであり、以下の２つの基準を満たさなければならない。

マージ共有ノードのサイズは、サイズ閾値以上であること。

マージ共有ノードにおいて、子ＣＵのサイズは、サイズ閾値よりも小さいこと。

さらに、マージ共有ノードのサンプルがピクチャ境界の外側にないことを保証する必要がある。構文解析段階において、祖先ノードが基準（１）および（２）を満たすが、ピクチャ境界の外側にいくつかのサンプルを有する場合、この祖先ノードはマージ共有ノードではないので、先に進んでその子ＣＵのためのマージ共有ノードを見出す。

図３５に、Ｔｙｐｅ－１とＴｙｐｅ－２の定義の違いの一例を示す。本例において、親ノードは、３つの子ＣＵに３分割される。親ノードのサイズは１２８である。Ｔｙｐｅ－１の定義の場合、３つの子ＣＵは別々のマージ共有ノードである。しかし、Ｔｙｐｅ－２の定義の場合、親ノードはマージ共有ノードである。

提案した共用マージ候補リストアルゴリズムは、並進マージ（マージモードおよびトライアングルマージモードを含む、履歴に基づく候補もサポートされる）およびサブブロックに基づくマージモードをサポートする。すべての種類のマージモードにおいて、共有マージ候補リストアルゴリズムの挙動は基本的に同じに見え、マージ共有ノードが葉ＣＵであるように見せるだけの候補をマージ共有ノードに生成する。それには２つの大きな利点がある。第１の利点は、マージモードのための並列処理を有効にすることであり、第２の利点は、すべての葉ＣＵのすべての計算をマージ共有ノードに共有することである。そのため、ハードウェアコーデックのためのすべてのマージモードのハードウェアコストを大幅に低減することができる。提案した共有マージ候補リストアルゴリズムにより、エンコーダとデコーダはマージモードの並列符号化に容易に対応でき、マージモードのサイクルバジェット問題を軽減する。

２．３．７タイル群

ＪＶＥＴ－Ｌ０６８６では、タイルグループに代えるためスライスが削除され、ＨＥＶＣ構文要素ｓｌｉｃｅ＿ａｄｄｒｅｓｓがタイルグループの最初のタイルのアドレスとしてｔｉｌｅ＿ｇｒｏｕｐ＿ｈｅａｄｅｒ内のｔｉｌｅ＿ｇｒｏｕｐ＿ａｄｄｒｅｓｓに置き換えられる（ピクチャ内に複数のタイルがある場合）。

３．本明細書に開示される実施形態が解決しようとする課題の例

現在のＨＥＶＣ設計は、動き情報をよりよく符号化するために、現在のブロックの近傍のブロック（現在のブロックの隣）の相関をとることができる。しかしながら、近傍のブロックが、異なる動き軌跡を有する異なる対象に対応する可能性がある。この場合、その近傍のブロックからの予測は効率的ではない。

非隣接ブロックの動き情報からの予測は、全ての動き情報（一般的には４×４レベル）をキャッシュに記憶するコストをかけることになり、付加的な符号化利得をもたらし、ハードウェア実装の複雑性を大幅に増大させる。

４．いくつかの例

既存の実装形態の欠点を克服するために、様々な実施形態において、ブロックの動き情報を予測するために、少なくとも１つの動き候補が記憶された１つ以上のルックアップテーブルを使用するＬＵＴに基づく動きベクトル予測技術を実装し、より高い符号化効率を有する映像符号化を提供することができる。各ＬＵＴは、それぞれが対応する動き情報に関連付けられた１つ以上の動き候補を含んでもよい。動き候補の動き情報は、予測方向、参照インデックス／ピクチャ、動きベクトル、ＬＩＣフラグ、アフィンフラグ、ＭＶＤ（ＭｏｔｉｏｎＶｅｃｔｏｒＤｅｒｉｖａｔｉｏｎ）精度、および／またはＭＶＤ値の一部または全部を含んでもよい。動き情報は、動き情報がどこに由来しているかを示すために、ブロック位置情報をさらに含んでもよい。

開示される技術に基づいたＬＵＴに基づく動きベクトル予測は、既存のおよび将来の映像符号化規格の両方を向上させることができ、様々な実施形態のために以下の例で解明される。ＬＵＴは、履歴データ（例えば、既に処理されたブロック）に基づいて符号化／復号化処理を行うことを可能にするため、ＬＵＴに基づく動きベクトル予測は、ＨＭＶＰ（Ｈｉｓｔｏｒｙ－ｂａｓｅｄＭｏｔｉｏｎＶｅｃｔｏｒＰｒｅｄｉｃｔｉｏｎ）法と呼ぶこともできる。ＬＵＴに基づく動きベクトル予測方法において、以前に符号化されたブロックからの動き情報を有する１つまたは複数のテーブルは、符号化／復号化処理の間、維持される。ＬＵＴに記憶されたこれらの動き候補をＨＭＶＰ候補と称する。１つのブロックの符号化／復号化の間、ＬＵＴにおける関連付けられた動き情報を動き候補リスト（例えば、マージ／ＡＭＶＰ候補リスト）に追加して、１つのブロックを符号化／復号化した後に、ＬＵＴを使用してもよい。更新されたＬＵＴは、その後、後続のブロックを符号化するために用いられる。つまり、ＬＵＴにおける動き候補の更新は、ブロックの符号化／復号化の順に基づく。以下の例は、一般的な概念を説明するための例であると考えられるべきである。これらの例は狭い意味で解釈されるべきではない。さらに、これらの例は、任意の方法で組み合わせることができる。

いくつかの実施形態において、１つのブロックの動き情報を予測するために、少なくとも１つの動き候補が記憶された１つ以上のルックアップテーブルを用いてもよい。実施形態は、動き候補を用いて、ルックアップテーブルに記憶された動き情報のセットを示すことができる。従来のＡＭＶＰまたはマージモードの場合、実施形態では、動き情報を記憶するためにＡＭＶＰまたはマージ候補を使用してもよい。

以下の実施例は、一般的な概念を説明する。

ルックアップテーブルの例

例Ａ１：各ルックアップテーブルは、各候補がその動き情報に関連付けられた１つ以上の動き候補を含んでもよい。
ｉ．動き候補の動き情報は、ここでは、予測方向、参照インデックス／ピクチャ、動きベクトル、ＬＩＣフラグ、アフィンフラグ、ＭＶＤ精度、ＭＶＤ値の一部または全部を含んでもよい。
・ルックアップテーブルごとに１つのカウンタをさらに割り当ててもよい。
ｉ．ピクチャ／スライス／ＬＣＵ（ＣＴＵ）の行／タイルの符号化／復号化の開始時に、カウンタをゼロに初期化してもよい。
ｉｉ．一例において、カウンタは、ＣＴＵ／ＣＴＢ／ＣＵ／ＣＢ／ＰＵ／一定の領域サイズ（例えば、８×８または１６×１６）を符号化／復号化した後に更新されてもよい。
ｉｉｉ．一例において、１つの候補をルックアップテーブルに加える度に、カウンタを１つずつ増加させる。
ｉｖ．一例において、カウンタは、テーブルのサイズ（許容される動き候補の数）以下であるべきである。
ｖ．代替的に、カウンタを使用して、いくつの動き候補をルックアップテーブルに追加しようとしたかを示してもよい（これらのうちのいくつかはルックアップテーブルに含まれていたが、後にテーブルから削除してもよい）。この場合、カウンタはテーブルのサイズよりも大きくてもよい。

ＬＵＴの選択

例Ｂ１：１つのブロックを符号化する場合、１つのルックアップテーブルからの動き候補の一部または全部を順にチェックすることができる。１つのブロックを符号化する間に１つの動き候補をチェックする際に、この動き候補を動き候補リスト（例えば、ＡＭＶＰ、マージ候補リスト）に加えてもよい。

ルックアップテーブルの使用法

例Ｃ１：チェック対象のルックアップテーブルにおける動き候補の総数は、予め規定されてもよい。

例Ｃ２：１つのルックアップテーブルに含まれる１つ以上の動き候補は、１つのブロックによって直接継承されてもよい。
ａ．それらをマージモード符号化に使用してもよい。すなわち、マージ候補リスト導出処理において動き候補をチェックしてもよい。

例Ｃ３：ルックアップテーブルに含まれる動き候補は、ブロックの動き情報を符号化するための予測モジュールとして用いられてもよい使用してもよい。
ａ．それらをＡＭＶＰモード符号化に使用してもよい。すなわち、ＡＭＶＰ候補リスト導出処理において動き候補をチェックしてもよい。

ルックアップテーブルの更新

例Ｄ１：動き情報を有するブロックを符号化した後（すなわち、ＩｎｔｒａＢＣモード、インター符号化モード）に、１つ以上のルックアップテーブルを更新してもよい。
・１つのイントラ制約ブロックを符号化した後、ルックアップテーブルを空にしてもよい。

例Ｄ２：現在のＬＣＵの行を符号化するために、上側のＬＣＵの行の動き情報を有するテーブルに保存された動き情報を無効にしてもよい。
ａ．この場合、新しいスライス／タイル／ＬＣＵの行の始まりにおいて、ＬＵＴの中の利用可能な動き候補の数を０にリセットしてもよい。

例Ｄ３：新しい時間層インデックスを使用してスライス／タイルを符号化する開始時に、ＬＵＴの中の利用可能な動き候補の数を０にリセットすることができる。

例Ｄ４：ルックアップテーブルをリセットするかどうかは、さらに、タイルを横断する予測を有効（または無効）にする指示に依存することができる。
ａ．一例において、このような指示が、タイルを横断する予測が許可されないことを示す場合、新しいタイルを符号化する前に、ルックアップテーブルをリセット（例えば、空に）しなければならない。
ｂ．一例において、このような指示が、タイルを横断する予測が許可されることを示すと、新しいタイルを符号化する前に、ルックアップテーブルをリセット（例えば、空に）する必要はない。すなわち、第２のタイルを符号化するためのルックアップテーブルは、第１のタイルを符号化するために使用されるテーブルに依存し得る。

例Ｄ５：上記の項目のすべてにおいて、ルックアップテーブルは、符号化された情報、または前回符号化されたブロックからの符号化された情報から導出された情報を、復号化順に示している。
ａ．ルックアップテーブルは、並進動き情報、またはアフィン動き情報、またはアフィンモデルパラメータ、またはイントラモード情報、または照明補償情報等を含んでもよい。
ｂ．代替的に、ルックアップテーブルは、並進動き情報、またはアフィン動き情報、またはアフィンモデルパラメータ、またはイントラモード情報、または照明補償情報等のような情報を少なくとも２種類含んでもよい。

追加の例示的な実施形態

以前符号化されたブロックの動き情報としてＨＭＶＰ候補を規定する、ＨＭＶＰ（Ｈｉｓｔｏｒｙ－ｂａｓｅｄＭＶＰ）方法が提案される。符号化／復号化処理中、複数のＨＭＶＰ候補を有するテーブルが維持される。新しいスライスに遭遇した場合、テーブルは空になる。インター符号化されたブロックがあるときはいつでも、関連する動き情報を新しいＨＭＶＰ候補としてテーブルの最後のエントリに加える。全体の符号化フローを図３１に示す。

一例において、テーブルサイズはＬ（例えば、Ｌ＝１６または６、または４４）に設定され、これは、最大Ｌ個のＨＭＶＰ候補をテーブルに追加することができることを示す。

１つの実施形態（例１１．ｇ．ｉに対応する）において、以前符号化されたブロックからのＨＭＶＰ候補がＬ個よりも多く存在する場合、テーブルが常に最新の以前符号化されたＬ個の動き候補を含むように、先入れ先出し（ＦＩＦＯ：Ｆｉｒｓｔ－Ｉｎ－Ｆｉｒｓｔ－Ｏｕｔ）規則が適用される。図３２は、ＦＩＦＯ規則を適用してＨＭＶＰ候補を除去し、提案される方法で使用されるテーブルに新しいものを追加する例を示す。

別の実施形態（発明１１．ｇ．ｉｉｉに対応する）において、新しい動き候補を追加するときはいつでも（例えば、現在のブロックがインター符号化され、非アフィンモードであるなど）、まず、冗長性チェック処理を適用し、ＬＵＴに同じまたは類似した動き候補があるかどうかを識別する。

いくつかの例を以下に示す。

図３３Ａは、新しい動き候補を追加する前に、ＬＵＴが満杯であった場合の例を示す。

図３３Ｂは、新しい動き候補を追加する前に、ＬＵＴが満杯でない場合の例を示す。

図３３Ａおよび図３３Ｂは、ともに、冗長性除去に基づくＬＵＴ更新方法（１つの冗長性動き候補を除去する）の例を示す。

図３４Ａおよび図３４Ｂは、冗長性除去に基づくＬＵＴ更新方法（複数の冗長性動き候補を除去する、図では２つの候補を示す）の２つの場合の例示の実装形態を示す。

図３４Ａは、新しい動き候補を追加する前に、ＬＵＴが満杯であった場合の例を示す。

図３４Ｂは、新しい動き候補を追加する前に、ＬＵＴが満杯でない場合の例を示す。

ＨＭＶＰ候補は、マージ候補リスト構築処理において使用され得る。ＴＭＶＰ候補の後に、テーブルにおける最後のエントリから最初のエントリ（または最後のＫ０のＨＭＶＰ、例えば、Ｋ０＝１６または６）までのすべてのＨＭＶＰ候補を挿入する。ＨＭＶＰ候補に対してプルーニングを適用する。利用可能なマージ候補の総数が信号通知された最大許容マージ候補に達すると、マージ候補リスト構築処理を終了する。代替的に、加算された動き候補の総数が、所与の値に達すると、ＬＵＴからの動き候補のフェッチを終了する。

同様に、ＨＭＶＰ候補は、ＡＭＶＰ候補リスト構築処理において使用されてもよい。ＴＭＶＰ候補の後に、テーブルにおける最後のＫ１個のＨＭＶＰ候補の動きベクトルを挿入する。ＡＭＶＰ対象参照ピクチャと同じ参照ピクチャを有するＨＭＶＰ候補のみを用いて、ＡＭＶＰ候補リストを構築する。ＨＭＶＰ候補に対してプルーニングを適用する。一例において、Ｋ１は４に設定される。

図２８は、映像処理装置２８００のブロック図である。装置２８００は、本明細書に記載の方法の１つ以上を実装するために使用してもよい。装置２８００は、スマートフォン、タブレット、コンピュータ、ＩｏＴ（ＩｎｔｅｒｎｅｔｏｆＴｈｉｎｇｓ）受信機等により実装されてよい。装置２８００は、１つ以上のプロセッサ２８０２と、１つ以上のメモリ２８０４と、映像処理ハードウェア２８０６と、を含んでよい。１つまたは複数のプロセッサ２８０２は、本明細書に記載される１つ以上の方法を実装するように構成されてもよい。１または複数のメモリ２８０４は、本明細書で説明される方法および技術を実装するために使用されるデータおよびコードを記憶するために使用してもよい。映像処理ハードウェア２８０６は、本明細書に記載される技術をハードウェア回路にて実装するために用いられてもよい。

図２９Ａは、映像処理方法２９００の例のフローチャートである。方法２９００は、ステップ２９０２において、現在の映像領域における１つ以上の映像ブロックとそのビットストリーム表現との間の変換のために、映像における前の映像領域からの動き情報を使用不可にすることを決定することを含む。方法２９００は、さらに、ステップ２９０４において、動き候補を記憶するテーブルをリセットすることで変換を行うことを含む。

図２９Ｂは、映像処理方法２９１０の例のフローチャートである。方法２９１０は、ステップ２９１２において、動き候補を含むテーブルに基づいて、第１の映像領域における第１の映像ブロックと、第１の映像領域を含む映像データのビットストリーム表現との間で第１の変換を行うことを含み、各動き候補は、対応する動き情報に関連付けられる。方法２９１０は、さらに、ステップ２９１４において、第２の変換のために、第１の変換に使用された動き情報を使用できないようにするために、テーブルをリセットすることを含む。方法２９１０は、ステップ２９１６において、リセットすることに起因してテーブルからの動き情報を使用することなく、第２の映像領域における第２の映像ブロックと映像データのビットストリーム表現との間で第２の変換を行うことをさらに含む。

図３０は、映像処理方法３０００の例のフローチャートである。方法３０００は、ステップ３００２において、テーブルおよびテーブルに割り当てられたカウンタを維持することを含み、各テーブルは動き候補を含み、各動き候補は対応する動き情報に関連付けられる。方法３０００は、さらに、ステップ３００４において、テーブルを使用して、映像領域における第１の映像ブロックと、映像領域を含む映像データのビットストリーム表現との間で変換を行うことを含む。方法３０００は、ステップ３００６において、変換に基づいて１つ以上のテーブルを更新することをさらに含む。上述した方法／技術の特徴および実施形態を、項目に基づくフォーマットを使用して以下に説明する。

１．現在の映像領域における１つ以上の映像ブロックとそのビットストリーム表現との間の変換のために、映像における前の映像領域からの動き情報を使用不可にすることを決定することと、動き候補を記憶するテーブルをリセットすることで前記変換を行うことと、を有する、映像処理方法。

２．動き候補を含むテーブルに基づいて、第１の映像領域における第１の映像ブロックと、前記第１の映像領域を含む映像データのビットストリーム表現との間で第１の変換を行うことであって、各動き候補は、対応する動き情報に関連付けられている、ことと、第２の変換のために、前記第１の変換に利用される動き情報の使用を無効にするために前記テーブルをリセットすることと、前記リセットに起因して前記テーブルからの動き情報を使用することなく、第２の映像領域における第２の映像ブロックと前記映像データのビットストリーム表現との間で前記第２の変換を行うことと、を有する、映像処理方法。

３．前記テーブルを前記第１の変換に使用する前に、第２のリセットを行う、第２項に記載の方法。

４．前記テーブルをリセットする前に、前記第１の変換の後にテーブルを更新することと、前記更新されたテーブルに基づいて、前記第１の映像領域における別の映像ブロックと、前記映像データのビットストリーム表現との間で再び変換を行うことと、
をさらに有する、第２項に記載の方法。

５．前記第２の変換の後、テーブルを更新することと、前記更新されたテーブルに基づいて、前記第２の映像領域における別の映像ブロックと、前記映像データのビットストリーム表現との間で別の変換を行うことと、をさらに有する、第２項に記載の方法。

６．前記テーブルにおける利用可能な動き候補の数がゼロにリセットされる、第１または２項に記載の方法。

７．前記テーブルが空にされる、第１または２項に記載の方法。

８．前記以前の映像領域、前記現在の映像領域、前記第１の映像領域、または前記第２の映像領域のうちの少なくとも１つが、映像データにおけるスライス、タイル、ブリック、またはＬＣＵ（ＬａｒｇｅｓｔＣｏｄｉｎｇＵｎｉｔ）の行を含む、第１または２項に記載の方法。

９．現在のＬＣＵ（ＬａｒｇｅｓｔＣｏｄｉｎｇＵｎｉｔ）の行の上側にあるＬＣＵの行に対応する前記テーブルに記憶された動き情報は、前記現在のＬＣＵの行を処理することに対して無効とされる、第１または２項に記載の方法。

１０．前記映像データのスライス、タイル、ブリックまたはＬＣＵの行のうちの少なくとも１つを含む映像領域の変換の開始時に、前記利用可能な動き候補の数をゼロにリセットする、第１または２項に記載の方法。

１１．新しい時間層インデックスを有するスライスまたはタイルのうちの少なくとも１つを含む映像領域の変換の開始時に、利用可能な動き候補の数が０である、第１または２項に記載の方法。

１２．前記テーブルの前記リセットすることは、横断タイル予測の有効または無効状態の指示に依存する、第１または２項に記載の方法。

１３．前記横断タイル予測が許可されないことを前記指示が示す場合、新しいタイルを符号化する前に前記テーブルをリセットする、第１２項に記載の方法。

１４．前記横断タイル予測が許可されることを前記指示が示す場合、新しいタイルを符号化する前に前記テーブルをリセットしない、第１２項に記載の方法。

１５．第２のタイトルを符号化するための前記テーブルは、第１のタイルを符号化するために使用されるテーブルに記憶される前記動き情報に依存する、第１４項に記載の方法。

１６．前記変換は、前記テーブルに基づいて行われる、第１または２項に記載の方法。

１７．前記変換は、前記テーブルを使用せずに行われる、第１または２項に記載の方法。

１８．テーブルおよびテーブルに割り当てられたカウンタを維持することであって、各テーブルは動き候補を含み、各動き候補は対応する動き情報に関連付けられている、ことと、前記テーブルを用いて、映像領域における第１の映像ブロックと、前記映像領域を含む映像データのビットストリーム表現との間で変換を行うことと、前記変換に基づいて１つ以上のテーブルを更新することと、を有する、映像処理方法。

１９．別の映像領域の変換の開始時にカウンタをゼロ値に初期化する、第１８項に記載の方法。

２０．前記映像領域は、新しいピクチャ、新しいスライス、新しいタイル、新しいブリック、新しいＣＴＵの行のうちの少なくとも１つを含む、第１９項に記載の方法。

２１．前記第１の映像ブロックの前記変換を行った後、カウンタを更新することをさらに含む、第１８項に記載の方法。

２２．前記映像領域は、符号化ツリーユニット、符号化ツリーブロック、符号化ユニット、符号化ブロックまたは予測ユニットのうちの１つを含む、第１８項に記載の方法。

２３．前記映像領域は、固定領域サイズを有する、第１８項に記載の方法。

２４．前記固定領域のサイズは、８×８または１６×１６である、第２３項に記載の方法。

２５．１つの動き候補を前記対応するテーブルに追加する度にカウンタを増加させる、第１８項に記載の方法。

２６．カウンタは対応するテーブルのために利用可能な動き候補の数を示し、前記カウンタは前記対応するテーブルの前記サイズよりも大きくない、第１８項に記載の方法。

２７．カウンタは、対応するテーブルに対して、前記対応するテーブルに追加された動き候補の数を示す、第１８項に記載の方法。

２８．１つのイントラ制約ブロックに対して前記変換を行った後、前記テーブルを空にする、第１または２項に記載の方法。

２９．前記テーブルは、ルックアップテーブルに対応する、第１～２８項のいずれか１項に記載の方法。

３０．動き候補は、予測方向、参照ピクチャインデックス、動きベクトル値、強度補償フラグ、アフィンフラグ、動きベクトル差精度または動きベクトル差分値のうち少なくとも１つを含む動き情報に関連付けられる、第１～２８項のいずれか１項に記載の方法。

３１．前記動き候補は、イントラモード符号化のためのイントラ予測モードの動き候補に対応する、第１～３０項のいずれか１項に記載の方法。

３２．前記動き候補は、ＩＣパラメータ符号化のための照明補償パラメータを含む動き候補に対応する、第１～３０項のいずれか１項に記載の方法。

３３．前記変換に基づいて、１つ以上のテーブルを更新することをさらに有する、第１～３２項のいずれか１項に記載の方法。

３４．前記１つ以上のテーブルを更新することは、前記変換を行った後、前記第１の映像ブロックの前記動き情報に基づいて１つ以上のテーブルを更新することを含む、第３３項に記載の方法。

３５．前記更新されたテーブルに基づいて、前記映像データの後続の映像ブロックと前記映像データの前記ビットストリーム表現との間で変換を行うことをさらに有する、第３４項に記載の方法。

３６．前記変換を行うことは、映像データから前記ビットストリーム表現を生成することを含む、第１～３５項のいずれか１項に記載の方法。

３７．前記変換を行うことは、前記ビットストリーム表現の前記映像データを映像データに生成することを含む、第１～３５項のいずれか１項に記載の方法。

３８．プロセッサと、命令を搭載した非一時的メモリとを備える装置であって、前記命令は、前記プロセッサにより実行された際に、前記プロセッサに、請求項１～３７のいずれか１つ以上に記載の前記方法を実装させる、装置。

３９．非一時的なコンピュータ可読媒体に記憶されたコンピュータプログラム製品であって、第１～３７項のいずれか１項に記載の方法を実行するためのプログラムコードを含む、コンピュータプログラム製品。

以上、説明の目的で本開示の技術の特定の実施形態を説明したが、本発明の範囲から逸脱することなく様々な修正が可能であることは、理解されるであろう。従って、本開示の技術は、添付の特許請求の範囲による場合を除き、限定されない。

本明細書に記載された開示された、およびその他の実施形態、モジュール、および機能操作の実装形態は、本明細書に開示された構造およびその構造的等価物を含め、デジタル電子回路、またはコンピュータソフトウェア、ファームウェア、若しくはハードウェアで実施されてもよく、またはそれらの１つ以上の組み合わせで実施してもよい。開示された、およびその他の実施形態は、１つ以上のコンピュータプログラム製品、すなわち、データ処理装置によって実装されるため、またはデータ処理装置の操作を制御するために、コンピュータ可読媒体上に符号化されたコンピュータプログラム命令の１つ以上のモジュールとして実施することができる。このコンピュータ可読媒体は、機械可読記憶装置、機械可読記憶基板、記憶装置、機械可読伝播信号をもたらす物質の組成物、またはこれらの１つ以上の組み合わせであってもよい。「データ処理装置」という用語は、例えば、プログラマブルプロセッサ、コンピュータ、または複数のプロセッサ、若しくはコンピュータを含む、データを処理するためのすべての装置、デバイス、および機械を含む。この装置は、ハードウェアの他に、当該コンピュータプログラムの実行環境を作るコード、例えば、プロセッサファームウェア、プロトコルスタック、データベース管理システム、オペレーティングシステム、またはこれらの１つ以上の組み合わせを構成するコードを含んでもよい。伝播信号は、人工的に生成した信号、例えば、機械で生成した電気、光、または電磁信号であり、適切な受信装置に送信するための情報を符号化するために生成される。

コンピュータプログラム（プログラム、ソフトウェア、ソフトウェアアプリケーション、スクリプト、またはコードとも呼ばれる）は、コンパイルされた言語または解釈された言語を含む任意の形式のプログラミング言語で記述することができ、それは、スタンドアロンプログラムとして、またはコンピューティング環境で使用するのに適したモジュール、コンポーネント、サブルーチン、または他のユニットとして含む任意の形式で展開することができる。コンピュータプログラムは、必ずしもファイルシステムにおけるファイルに対応するとは限らない。プログラムは、他のプログラムまたはデータを保持するファイルの一部（例えば、マークアップ言語文書に格納された１つ以上のスクリプト）に記録されていてもよいし、当該プログラム専用の単一のファイルに記憶されていてもよいし、複数の調整ファイル（例えば、１つ以上のモジュール、サブプログラム、またはコードの一部を格納するファイル）に記憶されていてもよい。１つのコンピュータプログラムを、１つのサイトに位置する１つのコンピュータ、または複数のサイトに分散され通信ネットワークによって相互接続される複数のコンピュータで実行させるように展開可能である。

本明細書に記載されたプロセスおよびロジックフローは、入力データ上で動作し、出力を生成することによって機能を実行するための１つ以上のコンピュータプログラムを実行する１つ以上のプログラマブルプロセッサによって行うことができる。プロセスおよびロジックフローはまた、特別目的のロジック回路、例えば、ＦＰＧＡ（ＦｉｅｌｄＰｒｏｇｒａｍｍａｂｌｅＧａｔｅＡｒｒａｙ）またはＡＳＩＣ（ＡｐｐｌｉｃａｔｉｏｎＳｐｅｃｉｆｉｃＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ）によって実行することができ、装置はまた、特別目的のロジック回路として実装することができる。

コンピュータプログラムの実行に適したプロセッサは、例えば、汎用および専用マイクロプロセッサの両方、並びに任意の種類のデジタルコンピュータの任意の１つ以上のプロセッサを含む。一般的に、プロセッサは、リードオンリーメモリまたはランダムアクセスメモリまたはその両方から命令およびデータを受信する。コンピュータの本質的な要素は、命令を実行するためのプロセッサと、命令およびデータを記憶するための１つ以上の記憶装置とである。一般的に、コンピュータは、データを記憶するための１つ以上の大容量記憶デバイス、例えば、磁気、光磁気ディスク、または光ディスクを含んでもよく、またはこれらの大容量記憶デバイスからデータを受信するか、またはこれらにデータを転送するように動作可能に結合されてもよい。しかしながら、コンピュータは、このようなデバイスを有する必要はない。コンピュータプログラム命令およびデータを記憶するのに適したコンピュータ可読媒体は、あらゆる形式の不揮発性メモリ、媒体、および記憶装置を含み、例えば、ＥＰＲＯＭ、ＥＥＰＲＯＭ、フラッシュ記憶装置、磁気ディスク、例えば内部ハードディスクまたはリムーバブルディスク、光磁気ディスク、およびＣＤ－ＲＯＭおよびＤＶＤ－ＲＯＭディスク等の半導体記憶装置を含む。プロセッサおよびメモリは、専用ロジック回路によって補完されてもよく、または専用ロジック回路に組み込まれてもよい。

この特許明細書は多くの詳細を含むが、これらは、任意の発明の範囲または特許請求の範囲を限定するものと解釈されるべきではなく、むしろ、特定の発明の特定の実施形態に特有であり得る特徴の説明と解釈されるべきである。本特許明細書において別の実施形態の文脈で説明されている特定の特徴は、１つの例において組み合わせて実装してもよい。逆に、単一の例の文脈で説明された様々な特徴は、複数の実施形態において別個にまたは任意の適切なサブコンビネーションで実装してもよい。さらに、特徴は、特定の組み合わせで作用するものとして上記に記載され、最初にそのように主張されていてもよいが、主張された組み合わせからの１つ以上の特徴は、場合によっては、組み合わせから抜粋されることができ、主張された組み合わせは、サブ組み合わせまたはサブ組み合わせのバリエーションに向けられてもよい。

同様に、動作は図面において特定の順番で示されているが、これは、所望の結果を達成するために、このような動作が示された特定の順番でまたは連続した順番で実行されること、または示された全ての操作が実行されることを必要とするものと理解されるべきではない。また、本特許明細書に記載されている例における様々なシステムの構成要素の分離は、全ての実施形態においてこのような分離を必要とするものと理解されるべきではない。

いくつかの実装形態および例のみが記載されており、この特許明細書に記載され図示されている内容に基づいて、他の実施形態、拡張および変形が可能である。

Claims

映像データをコーディングする方法であって、
映像内の画像の第１の映像領域をコーディングする前に、動き候補を含む１または複数のテーブルをリセットすることと、
前記第１の映像領域内の映像ブロックをコーディングし、前記映像ブロックに対して導出された動き情報を用いて前記１または複数のテーブルを更新するか否かを決定することと、
前記１または複数のテーブルを更新する際に、前記１または複数のテーブルにおける同一または類似に対する冗長性チェック処理を実行することと、
前記第１の映像領域内の前記映像ブロックの後続の映像ブロックに対する動き情報を導出することと、
前記後続の映像ブロックに対して導出された前記動き情報を用いて前記後続の映像ブロックをコーディングすることと
を有し、
前記後続の映像ブロックに対する前記動き情報を導出するために用いられる動き候補リスト構成処理の間、前記１または複数のテーブルからの１または複数の候補を、選択して追加する、方法。
前記第１の映像領域とは異なる第２の映像領域の前記コーディングの間、前記第１の映像領域から導出された前記テーブル内の動き候補の使用を無効化すること
を更に有する、請求項１に記載の方法。
前記第１の映像領域、および、前記第２の映像領域はそれぞれ、コーディングツリーユニット（ＣｏｄｉｎｇＴｒｅｅＵｎｉｔ）の行、タイル、または、スライスの１つを有する、請求項２に記載の方法。
前記１または複数のテーブルからの前記１または複数の候補の配列は、前記１または複数の候補の前記テーブルへの追加の順序に基づく、請求項１に記載の方法。
前記第１の映像領域は、他のＣＴＵ（ＣｏｄｉｎｇＴｒｅｅＵｎｉｔ）の行である前記第２の映像領域の上側のＣＴＵ（ＣｏｄｉｎｇＴｒｅｅＵｎｉｔ）の行である、請求項２に記載の方法。
前記リセットすることは、前記１または複数のテーブルにおいて利用可能な動き候補の数をゼロにリセットすることを有する、請求項１に記載の方法。
前記テーブルに対するカウンターを維持すること、を更に有し、
前記カウンターは、前記テーブル内の利用可能な動き候補の数を示し、
前記カウンターは、前記テーブルのサイズよりも大きくない、
請求項１に記載の方法。
前記映像ブロックに対する動き情報の導出に応じて、少なくとも前記映像ブロックのサイズに基づいて、前記カウンターが増加するか否かを判定すること、
を更に有する請求項７に記載の方法。
前記カウンターは、前記テーブルをリセットすることに応じて、ゼロに初期化される、請求項７に記載の方法。
前記テーブル内の前記動き候補は、予測方向、参照画像インデックス、動きベクタ値、強度補償フラグ、アフィンフラグ、動きベクタ差分精度、および動きベクタ差分値の少なくとも１つを含む動き情報と関連付けられている、請求項１に記載の方法。
前記テーブルをリセットすることは、更に映像領域を横断する予測が有効か否かに基づいて判定される、請求項１に記載の方法。
前記１または複数のテーブルの前記１または複数の候補をチェックすることは、最大の許可数に達していない前記動き候補リストにおける動き候補の数に少なくとも基づいて決定される、請求項１に記載の方法。
前記動き候補リストは、マージ候補リスト、または、ＡＭＶＰ（ＡｄｖａｎｃｅｄＭｏｔｉｏｎＶｅｃｔｏｒＰｒｅｄｉｃｔｉｏｎ）の候補リストである、請求項１に記載の方法。
前記コーディングする処理は、映像ブロックを映像ビットストリームに符号化することを含む、請求項１～１３のいずれか一項の方法。
前記コーディングする処理は、映像ビットストリームから映像ブロックを復号化することを含む、請求項１～１３のいずれか一項の方法。
プロセッサと、命令を有する非一時的メモリを有する、映像コーディング装置であって、
前記命令は、前記プロセッサによって実行された際に、前記プロセッサに、
映像内の画像の第１の映像領域をコーディングする前に、動き候補を含む１または複数のテーブルをリセットすることと、
前記第１の映像領域内の映像ブロックをコーディングし、前記映像ブロックに対して導出された動き情報を用いて前記１または複数のテーブルを更新するか否かを決定することと、
前記１または複数のテーブルを更新する際に、前記１または複数のテーブルにおける同一または類似に対する冗長性チェック処理を実行することと、
前記第１の映像領域内の前記映像ブロックの後続の映像ブロックに対する動き情報を導出することと、
前記後続の映像ブロックに対して導出された前記動き情報を用いて前記後続の映像ブロックをコーディングすることと
を行わせ、
前記後続の映像ブロックに対する前記動き情報を導出するために用いられた動き候補リスト構成処理の間、前記１または複数のテーブルからの１または複数の候補を、選択して追加する、映像コーディング装置。
プロセッサに、
映像内の画像の第１の映像領域をコーディングする前に、動き候補を含む１または複数のテーブルをリセットすることと、
前記第１の映像領域内の映像ブロックをコーディングし、前記映像ブロックに対して導出された動き情報を用いて前記１または複数のテーブルを更新するか否かを決定することと、
前記１または複数のテーブルを更新する際に、前記１または複数のテーブルにおける同一または類似に対する冗長性チェック処理を実行することと、
前記第１の映像領域内の前記映像ブロックの後続の映像ブロックに対する動き情報を導出することと、
前記後続の映像ブロックに対して導出された前記動き情報を用いて前記後続の映像ブロックをコーディングすることと
を行わせ、
前記後続の映像ブロックに対する前記動き情報を導出するために用いられた動き候補リスト構成処理の間、前記１または複数のテーブルからの１または複数の候補を、選択して追加する、命令を格納した非一時的コンピュータ可読記憶媒体。
映像のビットストリームを格納するための方法であって、
映像内の画像の第１の映像領域をコーディングする前に、動き候補を含む１または複数のテーブルをリセットすることと、
前記第１の映像領域の映像ブロックから前記ビットストリームを生成し、前記映像ブロックに対して導出された動き情報を用いて前記１または複数のテーブルを更新するか否かを決定することと、
前記１または複数のテーブルを更新する際に、前記１または複数のテーブルにおける同一または類似に対する冗長性チェック処理を実行することと、
前記第１の映像領域内の前記映像ブロックの後続の映像ブロックに対する動き情報を導出することと、
前記後続の映像ブロックに対して導出された前記動き情報を用いて前記後続の映像ブロックから前記ビットストリームを生成することと、
前記ビットストリームを、非一時的コンピュータ可読記録媒体に格納することと、
を有し、
前記後続の映像ブロックに対する前記動き情報を導出するために用いられる動き候補リスト構成処理の間、前記１または複数のテーブルからの１または複数の候補が、選択して追加される、方法。