JP2021530154A

JP2021530154A - 効率的なアフィンマージ動きベクトル導出

Info

Publication number: JP2021530154A
Application number: JP2020573104A
Authority: JP
Inventors: ザン，カイ; ザン，リー; リュウ，ホンビン; ワン，ユエ
Original assignee: Beijing ByteDance Network Technology Co Ltd; ByteDance Inc
Current assignee: Beijing ByteDance Network Technology Co Ltd; ByteDance Inc
Priority date: 2018-07-01
Filing date: 2019-07-01
Publication date: 2021-11-04
Also published as: CN110677675A; US20220046267A1; JP2023181441A; EP3804327A1; US20210058637A1; US20240098295A1; TW202021356A; WO2020008334A1; TWI731363B; CN114374850A; KR20210024487A; CN110677675B

Abstract

効率的なアフィンマージ動きベクトル導出のためのビデオ処理方法が開示される。１つの態様で、ビデオ処理方法は、現在のビデオブロックをサブブロックに分けることと、サブブロックごとに動きベクトルを導出することであり、各サブブロックの動きベクトルがポジション規則に従ってそのサブブロックの位置と関連付けられることと、サブブロックの動きベクトルに基づいて現在のビデオブロックのビットストリーム表現を処理することとを含むよう提供される。

Description

本特許文献は、ビデオ符号化及び復号化技術、デバイス、及びシステムに関係がある。

ビデオ圧縮の進歩に関わらず、デジタルビデオは、インターネット及び他のデジタル通信ネットワークで最大のバンド幅使用を依然として占めている。ビデオを受信及び表示可能な被接続ユーザデバイスの数が増えるにつれて、デジタルビデオ利用のためのバンド幅需要は成長し続けると予想される。

本文書は、サブブロックに基づく符号化、特に、アフィン動き符号化モードを使用する場合の性能を改善するためにビデオ符号化及び復号化実施形態で使用され得る技術を開示する。

一例となる態様で、ビデオ処理方法は、現在のブロックをサブブロックに分けることと、サブブロックごとに動きベクトルを導出することであり、各サブブロックの動きベクトルがポジション規則に従ってそのサブブロックの位置と関連付けられることと、サブブロックの動きベクトルを用いて現在のブロックのビットストリーム表現を処理することとを含むよう提供される。

他の態様では、ビデオ処理方法は、アフィンモードを使用する、現在のブロックと現在のブロックのビットストリーム表現との間の変換のために、ポジション規則に基づいて現在のブロックの制御点での動きベクトルを導出することと、動きベクトルを用いて現在のブロックとビットストリーム表現との間の変換を実行することとを有し、ポジション規則が、導出のための非隣接近傍ブロックの使用を除くことを定めるよう提供される。

他の態様では、ビデオ処理の方法は、現在のブロックと現在のブロックのビットストリーム表現との間の変換のために、１つ以上の隣接ブロックの位置に基づいて妥当性基準を満足する１つ以上の隣接ブロックからのマージ候補を含めることによってアフィンマージ候補のリストを決定することと、動きベクトルを用いて現在のブロックとビットストリーム表現との間の変換を実行することとを有するよう提供される。

更なる他の例となる態様では、本明細書で記載されるビデオ符号化方法を実装するビデオエンコーダデバイスが開示される。

更なる他の代表的な態様では、本明細書で記載される様々な技術は、非一時的なコンピュータ可読媒体に記憶されているコンピュータプログラム製品として具現されてもよい。コンピュータプログラム製品は、本明細書で記載される方法を実行するためのプログラムコードを含む。

更なる他の代表的な態様では、ビデオデコーダ装置が、本明細書で記載される方法を実装してもよい。

１つ以上の実施の詳細は、添付の書類、図面、及び以下の説明において示される。他の特徴は、明細書及び図面から、並びに特許請求の範囲から明らかである。

サブブロックに基づく予測の例を示す。簡単化されたアフィン動きも出るの例を表す。サブブロックごとのアフィン動きベクトル場（ＭＶＦ）の例を示す。ＡＦ＿ＩＮＴＥＲモードのための動きベクトル予測（ＭＶＰ）の例を示す。ＡＦ＿ＭＥＲＧＥ符号化モードのための候補の例を表す。ＡＦ＿ＭＥＲＧＥ符号化モードのための候補の例を表す。符号化ユニット（ＣＵ）のためのアドバンスド時間動きベクトル予測子（ＡＴＭＶＰ）のプロセスの例を示す。４つのサブブロック（Ａ〜Ｄ）を有する１つのＣＵ及びその隣接ブロック（ａ〜ｄ）の例を示す。ビデオ符号化におけるオプティカルフロー軌跡の例を示す。ブロック拡張なしの双方向オプティカル（ＢＩＯ）符号化技術の例を示し、ブロックの外にあるアクセス位置の例を示す。ブロック拡張なしの双方向オプティカル（ＢＩＯ）符号化技術の例を示し、余分のメモリアクセス及び計算を回避するために使用されるパディングの例を示す。バイラテラルマッチングの例を示す。テンプレートマッチングの例を示す。フレームレートアップコンバージョン（ＦＲＵＣ）におけるユニラテラル動き推定（ＭＥ）の例を示す。織り込み予測の実施例を表す。異なるサブブロックごとにＭＶを導出するために異なる位置の例を示し、星は異なる位置を表す。ｖ_０ｘ及びｖ_０ｙを導出するための隣接ブロックの例を示す。アフィンモードで符号化された左隣のブロックからアフィンマージモードのためのＭＶを導出する例を示す。アフィンモードで符号化された上隣のブロックからアフィンマージモードのためのＭＶを導出する例を示す。異なる符号化ツリーユニット（ＣＴＵ）に属する隣接ブロック及び現在のブロックの例を示し、そのような隣接ブロックからのアフィンマージ候補は妥当でないとして扱われる。開示されている技術に従う２つの分割パターンによる織り込み予測の例を示す。開示されている技術に従ってブロックが４×４サブブロックに分けられる分割パターンの例を示す。開示されている技術に従ってブロックが８×８サブブロックに分けられる分割パターンの例を示す。開示されている技術に従ってブロックが４×８サブブロックに分けられる分割パターンの例を示す。開示されている技術に従ってブロックが８×４サブブロックに分けられる分割パターンの例を示す。開示されている技術に従ってブロックが一様でないサブブロックに分けられる分割パターンの例を示す。開示されている技術に従ってブロックが一様でないサブブロックに分けられる分割パターンの他の例を示す。開示されている技術に従ってブロックが一様でないサブブロックに分けられる分割パターンの更なる他の例を示す。本文書で記載される視覚媒体復号化又は視覚媒体符号化技術を実装するハードウェアプラットフォームの例のブロック図である。ビデオ処理の方法の例のフローチャートである。ビデオ処理の方法の他の例のフローチャートである。ビデオ処理の方法の他の例のフローチャートである。

項目見出しは、読みやすさを改善するために本文書中で使用され、項目内で記載されている技術及び実施形態をその項目にのみ制限しない。

ビデオの圧縮率を改善するために、研究者は、継続的に、ビデオ符号化するための新しい技術を探している。

１．イントロダクション
本特許文献は、ビデオ／イメージ符号化技術に関係がある。具体的に、それは、ビデオ／イメージ符号化におけるサブブロックに基づく予測に関係がある。それは、ＨＥＶＣのような既存のビデオ符号化規格、又は最終決定されるべき規格（バーサタイルビデオ符号化）に適用されてよい。それはまた、将来のビデオ／イメージ符号化規格又はビデオ／イメージコーデックにも適用可能である。

簡潔な解説
サブブロックに基づく予測は、ＨＥＶＣＡｎｎｅｘＩ（３Ｄ−ＨＥＶＣ）によってビデオ符号化規格に最初に導入される。サブブロックに基づく予測により、符号化ユニット（Coding Unit，ＣＵ）又は予測ユニット（Prediction Unit，ＰＵ）などのブロックは、いくつかの重なり合わないサブブロックに分けられる。異なるサブブロックは、参照インデックス又は動きベクトル（Motion Vector，ＭＶ）などの異なる動き情報を割り当てられてよく、動き補償（Motion Compensation，ＭＣ）は、サブブロックごとに個別に実行される。図１は、サブブロックに基づく予測の概念を表す。

ＨＥＶＣを越える将来のビデオ符号化技術を探求すべく、Joint Video Exploration Team（ＪＶＥＴ）は、２０１５年にＶＣＥＧ及びＭＰＥＧによって合同で設立された。それ以来、多くの新しい方法がＪＶＥＴによって採用され、Joint Exploration Model（ＪＥＭ）と名付けられた参照ソフトウェアに入れられた。

ＪＥＭでは、サブブロックに基づく予測は、アフィン予測、選択的時間動きベクトル予測（Alternative Temporal Motion Vector Prediction，ＡＴＭＶＰ）、空間時間動きベクトル予測（Spatial-Temporal Motion Vector Prediction，ＳＴＭＶＰ）、双方向オプティカルフロー（Bi-directional Optical flow，ＢＩＯ）及びフレームレートアップコンバージョン（Frame-Rate Up Conversion，ＦＲＵＣ）などのいくつかの符号化ツールにおいて採用される。

２．１アフィン予測
ＨＥＶＣでは、平行移動モデルが動き補償予測（Motion Compensation Prediction，ＭＣＰ）のために適用される。現実世界では、多くの種類の動き、例えば、ズームイン／アウト、回転、視点動作（perspective motions）及び他の不規則な動きがある。ＪＥＭでは、簡単化されたアフィン変換動き補償予測が適用される。図２に示されるように、ブロックのアフィン動き場は、２つの制御点動きベクトルによって記述される。

ブロックの動きベクトル場（Motion Vector field，ＭＶＦ）は、次の式によって記述される：

式（１）中、ｍ（ｖ_０ｘ，ｖ_０ｙ）は、左上角の制御点の動きベクトルであり、（ｖ_１ｘ，ｖ_１ｙ）は、右上角の制御点の動きベクトルである。

動き補償予測を更に簡単にするために、サブブロックに基づくアフィン変換予測が適用される。サブブロックサイズＭ×Ｎは、式（２）で見られるように導出される。式（２）中、ＭｖＰｒｅは、動きベクトル分数精度（ＪＥＭでは１／１６）であり、（ｖ_２ｘ，ｖ_２ｙ）は、式（１）に従って計算される左下制御点の動きベクトルである：

式（２）によって導出された後、Ｍ及びＮは、夫々ｗ及びｈの約数にするよう、必要に応じて下方に調整されるべきである。

各Ｍ×Ｎサブブロックの動きベクトルを導出するために、図３に示されるように、各サブブロックの中心サンプルの動きベクトルは、式（１）に従って計算され、１／１６分数精度に丸められる。次いで、動き補償補間フィルタが、導出された動きベクトルによる各サブブロックの予測を生成するよう適用される。

ＭＣＰの後、各サブブロックの高精度の動きベクトルは丸められ、通常の動きベクトルと同じ精度でセーブされる。

ＪＥＭでは、２つのアフィン動きモード、すなわちＡＦ＿ＩＮＴＥＲモード及びＡＦ＿ＭＥＲＧＥモードがある。幅及び高さの両方が８よりも大きいＣＵの場合に、ＡＦ＿ＩＮＴＥＲモードが適用され得る。ＣＵレベルでのアフィンフラグは、ＡＦ＿ＩＮＴＥＲモードが使用されるかどうかを示すためにビットストリームにおいて伝送される。このモードでは、動きベクトル対｛（ｖ_０，ｖ_１）｜ｖ_０＝｛ｖ_Ａ，ｖ_Ｂ，ｖ_Ｃ｝，ｖ_１＝｛ｖ_Ｄ，ｖ_Ｅ｝｝を有する候補リストが、隣接するブロックを用いて構成される。図４に示されるように、ｖ_０は、ブロックＡ、Ｂ又はＣの動きベクトルから選択される。隣接するブロックからの動きベクトルは、参照リストと、隣接するブロックのためのリファレンスのＰＯＣと、現在のＣＵのためのリファレンスのＰＯＣ、及び現在のＣＵのＰＯＣの間の関係とに従って、スケーリングされる。そして、隣接するブロックＤ及びＥからｖ_１を選択するアプローチは同様である。候補リストの数が２よりも小さい場合に、リストは、ＡＭＶＰ候補の夫々を複製することによって構成された動きベクトル対によってパディングされる。候補リストが２よりも大きい場合には、候補は、最初に、隣接する動きベクトルの一貫性（ペア候補に含まれる２つの動きベクトルの類似性）に従ってソートされ、最初の２つの候補のみが保持される。ＲＤコストチェックは、どの動きベクトル対候補が現在のＣＵの制御点動きベクトル予測（ＣＰＭＶＰ）として選択されるかを決定するために使用される。そして、候補リスト内のＣＰＭＶＰの位置を示すインデックスが、ビットストリームにおいて伝送される。現在のアフィンＣＵのＣＰＭＶＰが決定された後、アフィン動き推定が適用され、制御点動きベクトル（ＣＰＭＶ）が求められる。次いで、ＣＰＭＶとＣＰＭＶＰとの差が、ビットストリームにおいて伝送される。

ＣＵがＡＦ＿ＭＥＲＧＥモードにおいて適用される場合に、それは、有効な隣接する再構成されたブロックから、アフィンモードで符号化された第１ブロックを得る。そして、候補ブロックの選択順序は図５Ａに示されるように左、上、右上、左下、左上の順である。隣接する左下ブロックＡが図５Ｂに示されるようにアフィンモードで符号化される場合に、ブロックＡを含むＣＵの左上角、右上角、及び左下角の動きベクトルｖ_２、ｖ_３及びｖ_４が導出される。そして、現在のＣＵの左上角の動きベクトルｖ_０は、ｖ_２、ｖ_３及びｖ_４に従って計算される。次に、現在のＣＵの右上の動きベクトルｖ_１が計算される。

現在のＣＵのＣＰＭＶｖ_０及びｖ_１が導出された後、簡単化されたアフィン動きモデル式（１）に従って、現在のＣＵのＭＶＦが生成される。現在のＣＵがＡＦ＿ＭＥＲＧＥモードで符号化されているかどうかを特定するために、少なくとも１つの隣接ブロックがアフィンモードで符号化されている場合に、アフィンフラグがビットストリームにおいて伝送される。

２．２ＡＴＭＶＰ
選択的時間動きベクトル予測（ＡＴＭＶＰ）法では、動きベクトルの時間動きベクトル予測（ＴＭＶＰ）は、現在のＣＵよりも小さいブロックから複数組の動き情報（動きベクトル及び参照インデックスを含む）をフェッチすることによって変更される。図６に示されるように、サブＣＵは、正方形のＮ×Ｎブロックである（Ｎは、デフォルトで４にセットされる）。

ＡＴＭＶＰは、ＣＵ内のサブＣＵの動きベクトルを２つのステップで予測する。第１ステップは、いわゆる時間ベクトルにより参照ピクチャ内の対応するブロックを識別することである。参照ピクチャは、モーションソースピクチャ（motion source picture）と呼ばれる。第２ステップは、現在のＣＵをサブＣＵに分け、図６に示されるように、各サブＣＵに対応するブロックから各サブＣＵの参照インデックスとともに動きベクトルを取得することである。

第１ステップで、参照ピクチャ及び対応するブロックは、現在のＣＵの空間的隣接ブロックの動き情報によって決定される。隣接するブロックの繰り返しの走査プロセスを回避するために、現在のＣＵのマージ候補リスト内の第１マージ候補が使用される。第１の利用可能な動きベクトル及びその関連する参照インデックスは、時間ベクトル及びモーションソースピクチャへのインデックスであるようセットされる。このように、ＡＴＭＶＰでは、対応するブロックは、ＭＴＶＰと比較して、より正確に特定され得る。このとき、対応するブロック（同一位置ブロック（collocated block）と時々呼ばれる）は常に、現在のＣＵに対して右下又は中心の位置にある。

第２ステップで、サブＣＵの対応するブロックは、現在のＣＵの座標に時間ベクトルを加えることによって、モーションソースピクチャにおける時間ベクトルによって特定される。サブＣＵごとに、その対応するブロック（中心サンプルをカバーする最小のモーショングリッド）の動き情報が、そのサブＣＵの動き情報を導出するために使用される。対応するＮ×Ｎブロックの動き情報が特定された後、それは、ＨＥＶＣのＴＭＶＰと同じように、現在のサブＣＵの動きベクトル及び参照インデックスに変換される。このとき、モーションスケーリング及び他のプロシージャが適用される。例えば、デコーダは、低遅延条件（すなわち、現在のピクチャの全ての参照ピクチャのＰＯＣが、現在のピクチャのＰＯＣよりも小さい）が満足されるかどうかをチェックし、場合により、サブＣＵごとに動きベクトルＭＶｙを予測するために動きベクトルＭＶｘ（参照ピクチャリストＸに対応する動きベクトル）を使用する（Ｘは０又は１に等しく、Ｙは１−Ｘに等しい）。

３．ＳＴＭＶＰ
この方法では、サブＣＵの動きベクトルは、ラスタスキャン順序に従って、再帰的に導出される。図７は、この概念を表す。４つの４×４サブＣＵＡ、Ｂ、Ｃ及びＤを含む８×８ＣＵを考える。現在のフレームにおける隣接する４×４ブロックは、ａ、ｂ、ｃ及びｄと表記される。

サブＣＵＡの動き導出は、その２つの空間的隣接ブロックを特定することによって開始する。第１隣接ブロックは、サブＣＵＡの上にあるＮ×Ｎブロック（ブロックｃ）である。このブロックｃが利用可能でないか、又はイントラ符号化されている場合には、サブＣＵＡの上にある他のＮ×Ｎブロックが（ブロックｃから開始して左から右へ）チェックされる。第２隣接ブロックは、サブＣＵＡの左にあるブロック（ブロックｂ）である。ブロックｂが利用可能でないか、又はイントラ符号化されている場合には、サブＣＵの左にある他のブロックが（ブロックｂから開始して上から下へ）チェックされる。各リストの隣接ブロックから得られた動き情報は、所与のリストの第１参照フレームに合わせて調整される。次に、サブブロックＡの時間動きベクトル予測子（ＴＭＶＰ）が、ＨＥＶＣで定められているＴＭＶＰ導出の同じプロシージャに従うことによって、導出される。位置Ｄにある同一位置ブロックの動き情報は、然るべくフェッチ及びスケーリングされる。最終的に、動き情報を取り出しスケーリングした後、全ての利用可能な動きベクトル（最大で３つまで）は、参照リストごとに別々に平均化される。平均化された動きベクトルは、現在のサブＣＵの動きベクトルとして割り当てられる。

４．ＢＩＯ
双方向オプティカルフロー（ＢＩＯ）は、双予測（bi-prediction）のためにブロックワイズの動き補償に加えて実行されるサンプルワイズの動き精緻化である。サンプルレベルの動き精緻化は、シグナリングを使用しない。

Ｉ^（ｋ）は、ブロック動き補償後のリファレンスｋ（ｋ＝０，１）からのルーマ値であり、∂Ｉ^（ｋ）／∂ｘ、∂Ｉ^（ｋ）／∂ｙは、夫々、Ｉ（ｋ）勾配の水平及び垂直成分である、とする。オプティカルフローが有効であるすると、動きベクトル場（ｖ_ｘ，ｖ_ｙ）は、式：

によって与えられる。

このオプティカルフロー式を各サンプルの動き軌跡のエルミート補間（Hermite interpolation）と組み合わせることで、最後には関数値Ｉ（ｋ）及び導関数∂Ｉ^（ｋ）／∂ｘ、∂Ｉ^（ｋ）／∂ｙの両方に一致する一意の三次多項式が得られる。ｔ＝０でのこの多項式の値がＢＩＯ予測である：

ここで、τ_０及びτ_１は、図８に示されるように参照フレームまでの距離を表す。距離τ_０及びτ_１は、Ｒｅｆ０及びＲｅｆ１のＰＯＣに基づいて計算される。すなわち、τ_０＝ＰＯＣ（現在）−ＰＯＣ（Ｒｅｆ０）、τ_１＝ＰＯＣ（Ｒｅｆ１）−ＰＯＣ（現在）である。両方の予測が同じ時間方向から（両方とも過去から又両方とも未来から）もたらされる場合に、符号は異なる（すなわち、τ_０・τ_１＜０）。この場合に、ＢＩＯは、予測が同じ時点からでない（すなわち、τ_０≠τ_１）場合にのみ適用され、両方の参照領域は非ゼロの動きを有し（ＭＶｘ_０，ＭＶｙ_０，ＭＶｘ_１，ＭＶｙ_１≠０）、ブロック動きベクトルは時間的距離に比例する（ＭＶｘ_０／ＭＶｘ_１＝ＭＶｙ_０／ＭＶｙ_１＝−τ_０／τ_１）。

動きベクトル場（ｖ_ｘ，ｖ_ｙ）は、点Ａ及びＢでの値の間の差Δを最小化にすることによって決定される（図９Ａ及び図９Ｂの参照フレーム面及び動き軌跡の交点）。モデルは、Δのために局所テイラー転換の最初の線形項しか使用しない：

上記の式中の全ての値は、これまで表記から省略されていたサンプル位置（ｉ´，ｊ´）に依存する。動きが局所周囲エリアにおいて一貫しているとすると、Ｍが２に等しいとして、現在予測されている点（ｉ，ｊ）を中心とした（２Ｍ＋１）×（２Ｍ＋１）の正方形窓Ω内でΔを最小化する：

この最適化問題のために、ＪＥＭは、最初に垂直方向において、次いで水平方向において最小化を行う簡単なアプローチを使用する。これにより、次が得られる：

ここで、

である。

ゼロ又は非常に小さい値による除算を回避するために、正則化パラメータｒ及びｍが式（７）及び式（８）に導入される：

ｒ＝５００・４^ｄ−８（１０）
ｍ＝７００・４^ｄ−８（１１）

ここで、ｄは、ビデオサンプルのビットデプスである。

ＢＩＯのメモリアクセスを通常の双予測動き補償の場合と同じに保つために、全ての予測及び勾配値Ｉ^（ｋ）、∂Ｉ^（ｋ）／∂ｘ、∂Ｉ^（ｋ）／∂ｙは、現在のブロック内の位置についてのみ計算される。式（９）において、予測されているブロックの境界上にある現在予測されている点に中心がある（２Ｍ＋１）×（２Ｍ＋１）の正方形窓Ωは、ブロックの外にある点にアクセスする必要がある（図９Ａに図示）。ＪＥＭでは、ブロックの外にあるＩ^（ｋ）、∂Ｉ^（ｋ）／∂ｘ、∂Ｉ^（ｋ）／∂ｙの値は、ブロック内の最も近い利用可能な値に等しくセットされる。例えば、これは、図９Ｂに示されるように、パディングとして実施され得る。

ＢＩＯによれば、動き場はサンプルごとに精緻化され得ることが可能である。計算複雑性を軽減するよう、ＢＩＯのブロックに基づく設計がＪＥＭでは使用される。動き精緻化は、４×４ブロックに基づいて計算される。ブロックに基づくＢＩＯでは、４×４ブロック内の全てのサンプルの式（９）中のｓ_ｎの値は集計され、次いで、ｓ_ｎの集計値は、４×４ブロックのＢＩＯ動きベクトルを導出するために使用される。より具体的に、次の式が、ブロックに基づくＢＩＯ導出のために使用される：

ここで、ｂ_ｋは、予測されているブロックのｋ番目の４×４ブロックに属するサンプルの組を表し、式（７）及び式（８）中のｓ_ｎは、関連する動きベクトルオフセットを導出するよう（（ｓ_ｎ，ｂｋ）＞＞４）によって置換される。

いくつかの場合に、ＢＩＯのＭＶレジメントは、ノイズ又は不規則な動きにより信頼できないことがある。そのため、ＭＶレジメントの大きさは、閾値ｔｈＢＩＯにクリップされる。閾値は、現在のピクチャの参照ピクチャが全て１方向からであるかどうかに基づいて決定される。現在のピクチャの全ての参照ピクチャが１方向からである場合には、閾値の値は１２×２^１４−ｄにセットされ、そうでない場合には、それは１２×２^１３−ｄにセットされる。

ＢＩＯの勾配は、ＨＥＶＣ動き補償プロセス（二次元可分ＦＩＲ）と一致する動作を用いて動き補償補間と同時に計算される。この二次元可分ＦＩＲのための入力は、動き補償プロセスの場合と同じ参照フレームサンプルであり、ブロック動きベクトルの分数部分に応じた分数位置（ｆｒａｃＸ，ｆｒａｃＹ）である。水平勾配∂Ｉ／∂ｘの場合に、信号は、最初に、スケール除去シフトｄ−８で分数位置ｆｒａｃＹに対応するＢＩＯｆｉｌｔｅｒＳを用いて垂直に補間され、次いで、勾配フィルタＢＩＯｆｉｌｔｅｒＧが、１８−ｄによるスケール除去シフトで分数位置ｆｒａｃＸに対応する水平方向において適用される。垂直勾配∂Ｉ／∂ｙの場合に、最初に、勾配フィルタは、スケール除去シフトｄ−８で分数位置ｆｒａｃＹに対応するＢＩＯｆｉｌｔｅｒＧを用いて垂直に適用され、次いで、信号変位が、１８−ｄによるスケール除去シフトで分数位置ｆｒａｃＸに対応する水平方向においてＢＩＯｆｉｌｔｅｒＳを用いて実行される。勾配計算及び信号変位のための補間フィルタＢＩＯｆｉｌｔｅｒＧ、ＢＩＯｆｉｌｔｅｒＦの長さは、合理的な複雑さを保つために、より短い（６タップ）。表は、ＢＩＯにおいてブロック動きベクトルの異なる分数位置ごとに勾配計算に使用されるフィルタを示す。表は、ＢＩＯにおいて予測信号生成のために使用される補間フィルタを示す。

ＪＥＭでは、ＢＩＯは、２つの予測が異なる参照ピクチャからである場合に、全ての双予測されたブロックに適用される。ＬＩＣがＣＵのために有効である場合に、ＢＩＯは無効にされる。

ＪＥＭでは、ＯＢＭＣが、通常のＭＣプロセスの後でブロックに適用される。計算複雑性を軽減するよう、ＢＩＯは、ＯＢＭＣプロセス中に適用されない。これは、ＢＩＯが、ブロックのＭＣプロセスにおいて、それ自身のＭＣを使用する場合にのみ適用され、ＯＢＭＣプロセス中に隣接ブロックのＭＶが使用される場合にはＭＣプロセスにおいて適用されないことを意味する。

２．５ＦＲＵＣ
ＦＲＵＣフラグは、ＣＵについて、そのマージフラグが真である場合に伝送される。ＦＲＵＣフラグが偽である場合に、マージインデックスが伝送され、通常のマージモードが使用される。ＦＲＵＣフラグが真である場合には、どの方法（バイラテラルマッチング又はテンプレートマッチング）がブロックの動き情報を導出するために使用されるべきかを示すために、追加的なＦＲＵＣモードフラグが伝送される。

エンコーダの側では、通常のマージ候補について行われるように、ＣＵのためにＦＲＵＣマージモードを使用することがＲＦコスト選択に基づくかどうかが決定される。すなわち、２つのマッチングモード（バイラテラルマッチング及びテンプレートマッチング）は両方とも、ＲＦコスト選択を使用することによってＣＵについてチェックされる。最低コストをもたらす１つが、他のＣＵモードと更に比較される。ＦＲＵＣマッチングモードが最も効率的なモードである場合に、ＦＲＵＣフラグは、そのＣＵについて真にセットされ、関連するマッチングモードが使用される。

ＦＲＵＣマージモードにおける動き導出プロセスは２つのステップを有する。ＣＵレベル動き探索が最初に行われ、次いで、サブＣＵレベルの動き精緻化が続く。ＣＵレベルでは、バイラテラルマッチング又はテンプレートマッチングに基づいてＣＵ全体について初期動きベクトルが導出される。最初に、ＭＶ候補のリストが生成され、最低マッチングコストをもたらす候補が、更なるＣＵレベル精緻化のための開始点として選択される。次いで、開始点の周りのバイラテラルマッチング又はテンプレートマッチングに基づく局所探索が行われ、最低マッチングコストをもたらすＭＶが、ＣＵ全体のＭＶとなる。その後に、動き情報は、導出されたＣＵ動きベクトルを開始点として用いてサブＣＵレベルで更に精緻化される。

例えば、次の導出プロセスが、Ｗ×ＨのＣＵの動き情報導出のために実行される。第１段階で、Ｗ×ＨのＣＵ全体のＭＶが導出される。第２段階で、ＣＵは、Ｍ×ＭのサブＣＵに更に分けられる。Ｍの値は、式（１３）で見られるように計算され、Ｄは、ＪＥＭではデフォルトで３にセットされる予め定義された分割デプスである。次いで、サブＣＵごとのＭＶが導出される。

図１０に示されるように、バイラテラルマッチングは、２つの異なる参照ピクチャにおいて現在のＣＵの動き軌跡に沿って２つのブロック間の最も近い一致を見つけることによって、現在のＣＵの動き情報を導出するために使用される。連続的な動き軌跡を仮定して、２つの参照ブロックを指す動きベクトルＭＶ０及びＭＶ１は、現在のピクチャと２つの参照ピクチャとの間の時間的距離、すなわち、ＴＤ０及びＴＤ１に比例するはずである。特別な場合として、現在のピクチャが時間的に２つの参照ピクチャの間にあり、現在のピクチャから２つの参照ピクチャまでの時間的距離が同じである場合に、バイラテラルマッチングは、ミラーに基づく双方向ＭＶになる。

図１１に示されるように、テンプレートマッチングは、現在のピクチャにおけるテンプレート（現在のＣＵの上及び／又は左隣のブロック）と参照ピクチャにおけるブロック（テンプレートと同じサイズ）との間の最も近い一致を見つけることによって、現在のＣＵの動き情報を導出するために使用される。上記のＦＲＵＣマージモードを除いて、テンプレートマッチングは、ＡＭＶＰモードにも適用される。ＪＥＭでは、ＨＥＶＣで行われるように、ＡＭＶＰは２つの候補を有する。テンプレートマッチング法によれば、新しい候補が導出される。テンプレートマッチングによる新たに導出された候補が、最初に存在しているＡＭＶＰ候補と異なる場合には、それは、ＡＭＶＰ候補リストの初めに挿入され、次いで、リストサイズは２にセットされる（すなわち、２番目に存在するＡＭＶＰ候補を削除する）。ＡＭＶＰモードに適用される場合に、ＣＵレベル探索のみが適用される。

［ＣＵレベルのＭＶ候補セット］
ＣＵレベルでのＭＶ候補セットは：
（ｉ）現在のＣＵがＡＭＶＰモードにある場合に、原ＡＭＶＰ候補、
（ｉｉ）全てのマージ候補、
（ｉｉｉ）補間されたＭＶ場におけるいくつかのＭＶ（後述される）、
（ｉｖ）上及び左隣の動きベクトル
から成る。

バイラテラルマッチングを使用する場合に、マージ候補の夫々の有効なＭＶは、バイラテラルマッチングを仮定して、ＭＶ対を生成するために入力として使用される。例えば、マージ候補の１つの有効なＭＶは、参照リストＡで（ＭＶａ，ｒｅｆａ）である。次いで、その対となるバイラテラルＭＶの参照ピクチャｒｅｆｂは、ｒｅｆａ及びｒｅｆｂが時間的に現在のピクチャの異なる側にあるように、他の参照リストＢで見つけられる。そのようなｒｅｆｂが参照リストＢで利用可能でない場合に、ｒｅｆｂは、ｒｅｆａとは異なるリファレンスとして決定され、現在のピクチャまでのその時間的距離は、リストＢにおける最小距離になる。ｒｅｆｂが決定された後、ＭＶｂは、現在のピクチャとｒｅｆａ、ｒｅｆｂとの間の時間的距離に基づいてＭＶａをスケーリングすることによって導出される。

補間されたＭＶ場からの４つのＭＶも、ＣＵレベル候補リストに加えられる。より具体的に、現在のＣＵの位置（０，０）、（Ｗ／２，０）、（０，Ｈ／２）及び（Ｗ／２，Ｈ／２）での補間されたＭＶが加えられる。

ＦＲＵＣがＡＭＶＰモードで適用される場合に、原ＡＭＶＰ候補も、ＣＵレベルＭＶ候補セットに加えられる。

ＣＵレベルでは、ＡＭＶＰＣＵの場合には最大１５個までのＭＶが、マージＣＵの場合には最大１３個までのＭＶが、候補リストに加えられる。

［サブＣＵレベルのＭＶ候補セット］
サブＣＵレベルでのＭＶ候補セットは：
（ｉ）ＣＵレベル探索から決定されたＭＶ、
（ｉｉ）上、左、左上及び右上の隣接するＭＶ、
（ｉｉｉ）参照ピクチャからの同一位置ＭＶのスケーリングされたバージョン、
（ｉｖ）最大４個のＡＴＭＶＰ候補、
（ｖ）最大４個のＳＴＭＶＰ候補
から成る。

参照ピクチャからのスケーリングされたＭＶは、次のように導出される。両リスト内の全ての参照ピクチャはトラバースされる。参照ピクチャ内のサブＣＵの同一配置位置でのＭＶは、開始ＣＵレベルＭＶのリファレンスに合わせて調整される。

ＡＴＭＶＰ及びＳＴＭＶＰ候補は、最初の４つの候補に限定される。

サブＣＵレベルでは、最大１７個のＭＶが、候補リストに加えられる。

［補間されたＭＶ場の生成］
フレームを符号化する前に、補間された動き場が、ユニラテラルＭＥに基づいてピクチャ全体について生成される。次いで、動き場は、ＣＵレベル又はサブＣＵレベルのＭＶ候補として後に使用されてよい。

第１に、両参照リストにおける各参照ピクチャの動き場は、４×４ブロックレベルでトラバースされる。４×４のブロックごとに、現在のピクチャの４×４ブロックを通過するブロックに動きが関連付けられ、ブロックが如何なる補間された動きも割り当てられていない場合に、参照ブロックの動きは、時間的な距離ＴＤ０及びＴＤ１に従って現在のピクチャに合わせて調整され（ＨＥＶＣのＴＭＶＰのＭＶスケーリングと同じ方法）、スケーリングされた動きは、現在のフレーム内のブロックに割り当てられる。スケーリングされたＭＶが４×４ブロックに割り当てられない場合に、ブロックの動きは、補間された動き場で使用不可としてマークされる。

［補間及びマッチングコスト］
動きベクトルが分数サンプル位置を指す場合に、動き補償された補間が必要とされる。複雑さを軽減するよう、通常の８タップＨＥＶＣ補間の代わりに、双線形補間が、バイラテラルマッチング及びテンプレートマッチングの両方のために使用される。

マッチングコストの計算は、異なるステップで少し異なる。ＣＵレベルでの候補セットから候補を選択する場合に、マッチングコストは、バイラテラルマッチング又はテンプレートマッチングのＳＡＤ（sum of absolute difference）である。開始ＭＶが決定された後、サブＣＵレベル探索でのバイラテラルマッチングのマッチングコストＣは、次のように計算される：

ここで、ｗは、経験的に４にセットされる重み係数であり、ＭＶ及びＭＶ^Ｓは、夫々、現在のＭＶ及び開始ＭＶを示す。ＳＡＤは、サブＣＵレベル探索でのテンプレートマッチングのマッチングコストとしても依然として使用される。

ＦＲＵＣモードで、ＭＶは、ルーマサンプルのみを使用することによって導出される。導出された動きは、ＭＣインター予測のためにルーマ及びクロマの両方について使用される。ＭＶが決定された後、最終的なＭＣは、ルーマのための８タップ補間フィルタ及びクロマのための４タップ補間フィルタを用いて実行される。

［ＭＶ精緻化］
ＭＶ精緻化は、バイラテラルマッチング又はテンプレートマッチングの基準によるパターンに基づくＭＶ探索である。ＪＥＭでは、２つの探索パターンがサポートされる。夫々ＣＵレベル及びサブＣＵレベルでのＭＶ精緻化のための制約なし中心バイアス化ダイヤモンド探索アルゴリズム（unrestricted center-biased diamond search，ＵＣＢＤＳ）及び適応横断探索（adaptive cross search）である。ＣＵレベル及びサブＣＵレベルの両方の精緻化のために、ＭＶは、４分の１ルーマサンプルＭＶ精度で直接探索され、この後に、８分の１ルーマサンプルＭＶ精緻化が続く。ＣＵ及びサブＣＵステップのためのＭＶ精緻化の探索範囲は、８個のルーマサンプルに等しくセットされる。

［テンプレートマッチングＦＲＵＣマージモードでの予測方向の選択］
バイラテラルマッチングマージモードでは、ＣＵの動き情報が、２つの異なる参照ピクチャにおける現在のＣＵの動き軌跡に沿った２つのブロック間の最も近い一致に基づき導出されるので、双予測が常に適用される。テンプレートマッチングマージモード場合には、そのような制限はない。テンプレートマッチングマージモードでは、エンコーダは、ＣＵのためにリスト０からの片予測（uni-prediction）、リスト１からの片予測、又は双予測から選択することができる。選択は、次のように、テンプレートマッチングコストに基づく：

ｃｏｓｔＢｉ≦ｆａｃｔｏｒ×ｍｉｎ（ｃｏｓｔ０，ｃｏｓｔ１）の場合、
双予測が使用される；
そうではなく、ｃｏｓｔ０≦ｃｏｓｔ１の場合、
リスト０からの片予測が使用される；
上記以外の場合、
リスト１からの片予測が使用される。

ｃｏｓｔ０は、リスト０のテンプレートマッチングのＳＡＤであり、ｃｏｓｔ１は、リスト１のテンプレートマッチングのＳＡＤであり、ｃｏｓｔＢｉは、双予測のテンプレートマッチングのＳＡＤである。ｆａｃｔｏｒの値は１．２５に等しく、すなわち、選択プロセスは双予測の方に偏っている。

インター予測方向選択は、ＣＵレベルのテンプレートマッチングプロセスにのみ適用される。

［織り込み予測の例］
織り込み予測（interweaved prediction）によれば、ブロックは、１つよりも多い分割パターンによりサブブロックに分けられる。分割パターンは、サブブロックのサイズ及びサブブロックの位置を含む、ブロックをサブブロックに分ける方法として定義される。分割パターンごとに、対応する予測ブロックは、分割パターンに基づいて各サブブロックの動き情報を導出することによって生成され得る。従って、１つの予測方向についてさえ、複数の予測ブロックが、多数の分割パターンによって生成され得る。代替的に、予測方向ごとに、ただ１つの分割パターンしか適用されなくてもよい。

Ｘ個の分割パターンが存在し、Ｐ_０，Ｐ_１，・・・，Ｐ_Ｘ−１と表される現在のブロックのＸ個の予測ブロックが、Ｘ個の分割パターンを用いて、サブブロックに基づく予測によって生成されるとする。Ｐと表される現在のブロックの最終的な予測は：

として生成され得る。

ここで、（ｘ，ｙ）は、ブロック内のピクセルの座標であり、ｗ_ｉ（ｘ，ｙ）は、Ｐ_ｉの重み値である。一般性を失わずに、

であることが考えられ、ここで、Ｎは非負値である。図１３は、２つの分割パターンによる織り込み予測の例を示す。

３．記載される実施形態によって解決される課題の例
図５に示されるようにアフィンマージＭＶ導出プロセスには２つの潜在的な欠点がある。

第１に、ＣＵの左上の点の座標及びＣＵのサイズは、ＣＵに属する各４×４ブロックによって保持されるべきである。この情報は、ＨＥＶＣでは保持されるよう求められない。

第２に、デコーダは、現在のＣＵに隣接しない４×４ブロックのＭＶにアクセスしなければならない。ＨＥＶＣでは、デコーダは、現在のＣＵに隣接する４×４ブロックのＭＶにアクセスしさえすればよい。

４．実施形態の例
織り込み予測及びアフィンマージＭＶ導出プロセスを含むサブブロックに基づく予測を更に改善するいくつかの方法を提案する。

以下の技術及び実施形態の列挙は、一般概念を説明するための例と考えられるべきである。更に、それらの技術は、ビデオ符号化中に、又は相応して符号化プロセス中に、一緒に動作するよう組み合わされ得る。留意すべきは、ここで、「符号化」との語は、非圧縮フォーマットでのソースビデオが他の符号化フォーマットに符号化される「トランスコーディング」を含む点である。

サブブロックのＭＶ導出
１．一実施形態で、サブブロックのＭＶは、そのサブブロックの中心について導出される。
ａ．代替的に、サブブロックのＭＶは、そのサブブロック内の如何なる位置についても導出され、その位置は、サブブロックの中心になくてもよい。
ｂ．代替的に、ＭＶが導出される位置は、サブブロックごとに異なってよい。（位置は、各サブブロックに関連する。）
ｃ．ＭＶが導出される位置は、サブブロックの配置に依存してよい。図１４は例を示す。
ｄ．Ｍ×Ｎによってサブブロックを表す。このとき、中心位置は（（Ｍ＞＞１）＋ａ）×（（Ｎ＞＞１）＋ｂ）と表すことができ、ａ、ｂは０又は−１である。

図１４は、異なるサブブロックごとにＭＶを導出するための異なる位置の例を示す。星は位置を表す。明らかなように、様々な異なる位置が、ＭＶ導出のために使用されてよい。

効率的なアフィンマージＭＶ導出
２．一実施形態で、制御点でのＭＶ（例えば、左上の点でのｍｖ０及び右上の点でのｍｖ１）は、アフィンマージＭＶ導出プロセスにおいて、隣接する近傍ブロックの情報によってのみ導出される。一例において、隣接するＣＵのサイズ及び左上の点の座標、並びに現在のＣＵに隣接しない４×４ブロックのＭＶは、アフィンマージモードにより現在のＣＵのＭＶを導出するために必要とされない。
ａ．一実施形態で、アフィンパラメータ（例えば、式（１）中の４パラメータアフィンモードのためのａ、ｂ、ｃ及びｄ）は、アフィンモード（アフィンインターモード及びアフィンマージモードを含む）で符号化された各ブロックにおいて保持される。
ｉ．ブロックがアフィンマージモードで符号化される場合に、それは、アフィンモードで符号化された隣接ブロックからの４つのパラメータを引き継ぐ。
ｉｉ．一例において、４つのパラメータは、リスト０及びリスト１について異なっている。
ｉｉｉ．一例において、両方の参照ピクチャリストのパラメータが保持されてよい。代替的に、ひと組のアフィンパラメータしか、双予測のためでさえ保持されなくてもよい。代替的に、多重仮説（multiple hypothesis）の場合に、２組のアフィンパラメータが保持され、各１つが、双予測のための１つの参照ピクチャリストに対応する。
ｂ．一実施形態で、ひと組のアフィンパラメータの一部（例えば、４パラメータアフィンのための式（１）中の２つのパラメータ（ａ及びｂ））のみが、アフィンモード（アフィンインターモード及びアフィンマージモードを含む）で符号化された各ブロックにおいて保持される。ブロックがアフィンマージモードで符号化される場合に、それは、アフィンモードで符号化された隣接ブロックから、保持されている一部のパラメータを引き継ぐ。
ｉ．一例において、異なる参照ピクチャ又は異なる参照ピクチャリストは、全ての関連する一部のアフィンパラメータを保持してよい。
ｉｉ．２つのパラメータは、リスト０及びリスト１について異なっている。
ｃ．一実施形態で、式（１）中のｖ_０ｘ及びｖ_０ｙ（ｃ及びｄとも表される）は、現在のブロックの左上角に隣接するブロックから導出される。次の例では、現在のブロックは、アフィンモードで符号化された隣接ブロックＧにマージされることが考えられる。
ｉ．一例において、図１５に示される３つの隣接ブロックＲ、Ｓ及びＴは、（ｖ_０ｘ，ｖ_０ｙ）を導出するために使用される。３つのブロックにおけるＭＶは、ＭＶ（Ｒ）、ＭＶ（Ｓ）及びＭＶ（Ｔ）と表記される。
（ａ）一例において、（ｖ_０ｘ，ｖ_０ｙ）は、Ｘがインター符号化される場合に、ＭＶ（Ｘ）に等しくセットされる（ＸはＲ、Ｓ又はＴであることができる）。
（ｂ）一例において、（ｖ_０ｘ，ｖ_０ｙ）は、Ｒ、Ｓ及びＴがインター符号化される場合に、ＭＶ（Ｒ）、ＭＶ（Ｓ）及びＭＶ（Ｔ）の平均に等しくセットされる。
（ｃ）一例において、（ｖ_０ｘ，ｖ_０ｙ）は、Ｘ及びＹがインター符号化される場合に、ＭＶ（Ｘ）及びＭＶ（Ｙ）の平均に等しくセットされる（Ｘ及びＹはＲ、Ｓ又はＴであることができる）。
（ｄ）一例において、（ｖ_０ｘ，ｖ_０ｙ）は、ＭＶ（Ｘ）に等しくセットされ、ＭＶ（Ｘ）は、ブロックＧの同じリファレンスを参照する。
ｉｉ．一例において、（ｖ_０ｘ，ｖ_０ｙ）は、時間的隣接ブロックのＭＶから導出される。
ｉｉｉ．一例において、（ｖ_０ｘ，ｖ_０ｙ）は、ブロックＧのリファレンスに合わせて調整される。
ｄ．一実施形態で、アフィンマージモードで符号化されたブロックのＭＶは、アフィンモードで符号化されたＳ（４パラメータアフィンモードの場合にＳ＝２、６パラメータアフィンモードの場合にＳ＝３）個の左隣のブロックから導出される。図１６Ａは、例を示す。Ｌ０及びＬ１は、アフィンモードで符号化された２つの左隣のブロックである。Δは、２つの左隣のブロック間の距離である。２つのブロックの動きベクトルは、夫々（ｍｖＬ_０ ^ｘ，ｍｖＬ_０ ^ｙ）及び（ｍｖＬ_１ ^ｘ，ｍｖＬ_１ ^ｙ）である。（ｍｖ_０ ^ｘ、ｍｖ_０ ^ｙ）は、式（１）中の現在のブロックの左上制御点でのＭＶ（別名、（ｖ_０ｘ，ｖ_０ｙ））である。２つのブロックの１つ（例えば、Ｌ０）と左上制御点との間のｙ距離は、Φと表記される。留意されるべきは、距離は、ブロックの上、真ん中、又は下から測定され得る点である。図１６Ａでは、それは下から測定されている。
ｉ．一例において、式（１）中のａ及びｂは、ａ＝（ｍｖＬ_１ ^ｙ−ｍｖＬ_０ ^ｙ）／Δ、ｂ＝（ｍｖＬ_１ ^ｘ−ｍｖＬ_０ ^ｘ）／Δとして導出され得る。
ｉｉ．Δは固定数であることができる。
（ａ）それは、１、４、８、１６などの２^Ｎの形をとることができる。この場合に、上記のａ及びｂを計算するための除算演算は、シフト演算として実施され得る。
ｉｉｉ．Δは、ブロックの高さに応じた数であることができる。
ｉｖ．Δは、Ｌ０とＬ１との間の全ての左隣のブロック（Ｌ０及びＬ１の両方を含む）がアフィンモードで符号化され、同じ参照ピクチャを共有することを満足する最大長さとして導出され得る。
ｖ．（ｍｖ_０ ^ｘ、ｍｖ_０ ^ｙ）は、ｍｖ_０ ^ｘ＝ｍｖＬ_０ ^ｘ＋ｂΦ、ｍｖ_０ ^ｙ＝ｍｖＬ_０ ^ｙ−ａΦとして導出され得る。
ｖｉ．ΦがＬ１と左上制御点との間のｙ距離である場合に、（ｍｖ_０ ^ｘ、ｍｖ_０ ^ｙ）は、ｍｖ_０ ^ｘ＝ｍｖＬ_１ ^ｘ＋ｂΦ、ｍｖ_０ ^ｙ＝ｍｖＬ_１ ^ｙ−ａΦとして導出され得る。
ｅ．一実施形態で、アフィンマージモードで符号化されたブロックのＭＶは、アフィンモードで符号化されたＳ（４パラメータアフィンモードの場合にＳ＝２、６パラメータアフィンモードの場合にＳ＝３）個の上隣のブロックから導出される。図１６Ｂは、例を示す。Ｔ０及びＴ１は、アフィンモードで符号化された２つの上隣のブロックである。Δは、２つの上隣のブロック間の距離である。２つのブロックの動きベクトルは、夫々（ｍｖＴ_０ ^ｘ，ｍｖＴ_０ ^ｙ）及び（ｍｖＴ_１ ^ｘ，ｍｖＴ_１ ^ｙ）である。（ｍｖ_０ ^ｘ、ｍｖ_０ ^ｙ）は、式（１）中の現在のブロックの左上制御点でのＭＶ（別名、（ｖ_０ｘ，ｖ_０ｙ））である。２つのブロックの１つ（例えば、Ｔ０）と左上制御点との間のｘ距離は、Φと表記される。留意されるべきは、距離は、ブロックの左、真ん中、又は右から測定され得る点である。図１６Ｂでは、それは右から測定されている。
ｉ．一例において、式（１）中のａ及びｂは、ａ＝（ｍｖＴ_１ ^ｙ−ｍｖＴ_０ ^ｙ）／Δ、ｂ＝（ｍｖＴ_１ ^ｘ−ｍｖＴ_０ ^ｘ）／Δとして導出され得る。
ｉｉ．Δは固定数であることができる。
（ａ）それは、１、４、８、１６などの２^Ｎの形をとることができる。この場合に、上記のａ及びｂを計算するための除算演算は、シフト演算として実施され得る。
ｉｉｉ．Δは、ブロックの高さに応じた数であることができる。
ｉｖ．Δは、Ｔ０とＴ１との間の全ての上隣のブロック（Ｔ０及びＴ１の両方を含む）がアフィンモードで符号化され、同じ参照ピクチャを共有することを満足する最大長さとして導出され得る。
ｖ．（ｍｖ_０ ^ｘ、ｍｖ_０ ^ｙ）は、ｍｖ_０ ^ｘ＝ｍｖＴ_０ ^ｘ−ａΦ、ｍｖ_０ ^ｙ＝ｍｖＴ_０ ^ｙ−ｂΦとして導出され得る。
ｖｉ．ΦがＴ１と左上制御点との間のｘ距離である場合に、（ｍｖ_０ ^ｘ、ｍｖ_０ ^ｙ）は、ｍｖ_０ ^ｘ＝ｍｖＴ_１ ^ｘ−ａΦ、ｍｖ_０ ^ｙ＝ｍｖＴ_１ ^ｙ−ｂΦとして導出され得る。

図１６Ａ及び１６Ｂは、アフィンモードで符号化された左隣のブロックから（図１６Ａ）又はアフィンモードで符号化された上隣のブロックから（図１６Ｂ）アフィンマージモードのＭＶを導出する例を示す。
ｆ．アフィンマージモードで符号化されたブロックのＭＶは、アフィンモードで符号化された非隣接ブロックから導出されてよい。
ｇ．アフィンマージモードで符号化されたブロックのＭＶを導出するためにどの隣接ブロックが使用されるかは、ブロック形状に依存し得る。
ｉ．サイズがＭ×Ｎ（Ｍ＞Ｎ）であるブロックの場合に、アフィンマージモードで符号化されたブロックのＭＶは、アフィンモードで符号化された上隣のブロックから導出される。
ｉｉ．サイズがＭ×Ｎ（Ｍ＜Ｎ）であるブロックの場合に、アフィンマージモードで符号化されたブロックのＭＶは、アフィンモードで符号化された左隣のブロックから導出される。
ｉｉｉ．サイズがＭ×Ｎ（Ｍ＝Ｎ）であるブロックの場合に、アフィンマージモードで符号化されたブロックのＭＶは、現在のブロックの左上角に隣接するブロックから導出される。
３．一実施形態で、隣接ブロックからのアフィンマージ候補が妥当なアフィンマージ候補であるかどうかは、隣接ブロックの配置に依存する。
ａ．一例において、隣接ブロックからのアフィンマージ候補は、隣接ブロックが現在のＣＴＵ（Coding Tree Unit）とは異なるＣＴＵ（例えば、最大ＣＵ（ＬＣＵ））に属する場合に、妥当でないとして扱われる（マージ候補リストに入れられない）。
ｂ．代替的に、隣接ブロックからのアフィンマージ候補は、隣接ブロックが、図１７に示されるように、現在のＣＴＵラインとは異なるＣＵＴラインに属する場合に、妥当でないとして扱われる（マージ候補リストに入れられない）。
ｃ．代替的に、隣接ブロックからのアフィンマージ候補は、隣接ブロックがスライスとは異なるスライスに属する場合に、妥当でないとして扱われる（マージ候補リストに入れられない）。
ｄ．代替的に、隣接ブロックからのアフィンマージ候補は、隣接ブロックがタイルとは異なるタイルに属する場合に、妥当でないとして扱われる（マージ候補リストに入れられない）。

図１７は、異なるＣＴＵラインに属する現在のブロック及び隣接ブロックの例を示す。この例では、隣接ブロックからのアフィンマージ候補は、隣接ブロックが現在のＣＴＵラインとは異なるＣＴＵラインに属する場合に、妥当でないとして扱われる（マージ候補リストに入れられない）。

［織り込み予測の例］
図１８は、開示される技術に従って、２つの分割パターンによる織り込み予測の例を示す。現在のブロック１３００は、複数のパターンに分割され得る。例えば、図１８に示されるように、現在のブロックは、パターン０（１３０１）及びパターン１（１３０２）の両方に分割される。２つの予測ブロックＰ_０（１３０３）及びＰ_１（１３０４）が生成される。現在のブロック１３００の最終的な予測ブロックＰ（１３０５）は、Ｐ_０（１３０３）及びＰ_１（１３０４）の加重和を計算することによって生成され得る。

より一般的には、Ｘ個の分割パターンを考えると、Ｐ_０，Ｐ_１，・・・Ｐ_Ｘ−１と表される現在のブロックのＸ個の予測ブロックが、Ｘ個の分割パターンを用いて、サブブロックに基づく予測によって生成され得る。Ｐと表される現在のブロックの最終的な予測は：

として生成され得る。

ここで、（ｘ，ｙ）は、ブロック内のピクセルの座標であり、ｗ_ｉ（ｘ，ｙ）は、Ｐ_ｉの重み値である。一例として、制限なしに、重みは：

と表現され得る。

Ｎは非負値である。代替的に、式（１６）のビットシフト演算は：

とも表現され得る。

２の累乗である重みの和は、浮動小数点除算の代わりにビットシフト演算を行うことによって、加重和Ｐのより効率的な計算を可能にする。

分割パターンは、サブブロックの異なる形状、又はサイズ、又は位置を有することができる。いくつかの実施形態で、分割パターンは、不規則なサブブロックサイズを含んでもよい。図１９Ａ〜Ｇは、１６×１６ブロックの分割パターンのいくつかの例を示す。図１９Ａで、ブロックは、開示されている技術に従って４×４サブブロックに分けられる。このパターンは、ＪＥＭでも使用される。図１９Ｂは、開示されている技術に従って、８×８サブブロックに分けられるブロックの例を示す。図１９Ｃは、開示されている技術に従って４×８サブブロックに分けられるブロックの例を示す。図１９Ｄは、開示されている技術に従って８×４サブブロックに分けられるブロックの例を示す。図１９Ｅでは、ブロックの一部が、開示されている技術に従って４×４サブブロックに分けられる。ブロック境界にあるピクセルは、２×４、４×２又は２×２のようなサイズを有するより小さいサブブロックにおいて分けられる。いくつかのサブブロックは、より大きいサブブロックを形成するようマージされてよい。図１９Ｆは、６×４、４×６又は６×６のようなサイズを有するより大きいサブブロックを形成するようマージされる、４×４サブブロック及び２×４サブブロックのような隣接サブブロックの例を示す。図１９Ｇでは、ブロックの一部が、８×８サブブロックに分けられる。ブロック境界にあるピクセルは、代わりに、８×４、４×８又は４×４のようなサイズを有するより小さいサブブロックにおいて分けられる。

サブブロックに基づく予測におけるサブブロックの形状及びサイズは、符号化ブロックの形状及び／又はサイズ、及び／又は符号化ブロック情報に基づいて、決定され得る。例えば、いくつかの実施形態で、サブブロックは、現在のブロックがＭ×Ｎのサイズを有する場合に、４×Ｎ（又は８×Ｎなど）のサイズを有する。すなわち、サブブロックは、現在のブロックと同じ高さを有する。いくつかの実施形態で、サブブロックは、現在のブロックがＭ×Ｎのサイズを有する場合に、Ｍ×４（又はＭ×８など）のサイズを有する。すなわち、サブブロックは、現在のブロックと同じ幅を有する。いくつかの実施形態で、サブブロックは、現在のブロックがＭ×Ｎ（Ｍ＞Ｎ）のサイズを有する場合に、Ａ×Ｂ（Ａ＞Ｂ）（例えば、８×４）のサイズを有する。代替的に、サブブロックはＢ×ＡＴＭＶＰ（例えば、４×８）のサイズを有することができる。

いくつかの実施形態で、現在のブロックはＭ×Ｎのサイズを有する。サブブロックは、Ｍ×Ｎ≦Ｔ（あるいは、Ｍｉｎ（Ｍ，Ｎ）≦Ｔ又はＭａｘ（Ｍ，Ｎ）≦Ｔなど）の場合に、Ａ×Ｂのサイズを有し、サブブロックは、Ｍ×Ｎ＞Ｔ（あるいは、Ｍｉｎ（Ｍ，Ｎ）＞Ｔ又はＭａｘ（Ｍ，Ｎ）＞Ｔなど）の場合に、Ｃ×Ｄのサイズを有し、ここで、Ａ≦ＣかつＢ≦Ｄである。例えば、Ｍ×Ｎ≦２５６の場合に、サブブロックは４×４のサイズであることができる。いくつかの実施形態で、サブブロックは８×８のサイズを有する。

いくつかの実施形態で、織り込み予測を適用すべきかどうかは、インター予測方向に基づいて決定され得る。例えば、いくつかの実施形態で、織り込み予測は、双予測に適用され得るが、片予測には適用されない。他の例として、多重仮説が適用される場合に、織り込み予測は、１よりも多い参照ブロックがあるときに、１つの予測方向に適用され得る。

いくつかの実施形態で、どのように織り込み予測を適用すべきかも、インター予測方向に基づいて決定され得る。いくつかの実施形態で、サブブロックに基づく予測により双予測されたブロックは、２つの異なる参照リストについて２つの異なる分割パターンによりサブブロックに分けられる。例えば、双予測されたブロックは、参照リスト０（Ｌ０）から予測される場合に、図１９Ｃに示されるように４×８サブブロックに分けられる。同じブロックは、参照リスト１（Ｌ１）から予測される場合に、図１９Ｄに示されるように８×４サブブロックに分けられる。最終的な予測Ｐは：

と計算される。

ここで、Ｐ^０及びＰ^１は、夫々、Ｌ０及びＬ１からの予測であり、ｗ^０及びｗ^１は、夫々、Ｌ０及びＬ１のための重み値である。式（１６）に示されるように、重み値は、ｗ^０（ｘ，ｙ）＋ｗ^１（ｘ，ｙ）＝１＜＜Ｎ（ここで、Ｎは非負整数値である）と決定され得る。各方向における予測のために使用されるサブブロックはより少ないので（例えば、８×８サブブロックに対して４×８サブブロック）、既存のサブブロックに基づく方法と比較して，計算に必要とされるバンド幅は小さい。より大きいサブブロックを使用することによって、予測結果はまた、ノイズ干渉の影響を受けにくくなる。

いくつかの実施形態で、サブブロックに基づく予測により片予測されたブロックは、同じ参照リストについて２つ以上の異なる分割パターンによりサブブロックに分けられる。例えば、リストＬ（Ｌ＝０又は１）の予測Ｐ^Ｌは：

と計算される。

ここで、ＸＬは、リストＬの分割パターンの数である。Ｐ_ｉ ^Ｌ（ｘ，ｙ）は、ｉ番目の分割パターンにより生成された予測であり、ｗ_ｉ ^Ｌ（ｘ，ｙ）は、Ｐ_ｉ ^Ｌ（ｘ，ｙ）の重み値である。例えば、ＸＬが２である場合に、２つの分割パターンがリストＬについて適用される。第１分割パターンで、ブロックは、図１９Ｃに示されるように４×８サブブロックに分けられる。第２分割パターンで、ブロックは、図１９Ｄに示されるように、８×４サブブロックに分けられる。

いくつかの実施形態で、サブブロックに基づく予測により双予測されたブロックは、夫々Ｌ０及びＬ１からの２つの片予測されたブロックの組み合わせと見なされる。各リストからの予測は、上記の例で記載されるように導出され得る。最終的な予測Ｐは、

と計算され得る。

ここで、パラメータａ及びｂは、２つの内部予測ブロックに適用される２つの付加的な重みである。この具体例では、ａ及びｂは両方とも１にセットされ得る。上記の例と同様に、各方向における予測のために使用されるサブブロックはより少ないので（例えば、８×８サブブロックに対して４×８サブブロック）、バンド幅利用は、既存のサブブロックに基づく方法よりも良いか、又はそれと同等である。同時に、予測結果は、より大きいサブブロックを使用することによって、改善され得る。

いくつかの実施形態で、単一の非一様パターンが、夫々の片予測されたブロックにおいて使用され得る。例えば、リストＬ（例えば、Ｌ０又はＬ１）ごとに、ブロックは、異なるパターンに分割される（例えば、図１９Ｅ又は図１９Ｆに示される）。より少数のサブブロックの使用は、バンド幅の需要を小さくする。サブブロックの非一様性はまた、予測結果のロバスト性を向上させる。

いくつかの実施形態で、多重仮説符号化ブロックの場合に、予測方向（又は参照ピクチャリスト）ごとに異なる分割パターンによって生成された１つよりも多い予測ブロックが存在し得る。複数の予測ブロックが、付加的な重みが適用された最終的な予測を生成するために使用され得る。例えば、付加的な重みは１／Ｍにセットされてよく、Ｍは、生成された予測ブロックの総数である。

いくつかの実施形態で、エンコーダは、織り込み予測を適用すべきかどうか及びどのように織り込み予測を適用すべきかを決定することができる。次いで、エンコーダは、シーケンスレベル、ピクチャレベル、ビューレベル、スライスレベル、ＣＴＵ（ＬＣＵとしても知られる）レベル、ＣＵレベル、ＰＵレベル、ツリーユニット（ＴＵ）レベル、又は領域レベル（複数のＣＵ／ＰＵ／ＴＵ／ＬＣＵを含んでよい）でデコーダへ決定に対応する情報を送信することができる。情報は、シーケンスパラメータセット（ＳＰＳ）、ビューパラメータセット（ＶＰＳ）、ピクチャパラメータセット（ＰＰＳ）、スライスヘッダ（ＳＨ）、ＣＴＵ／ＬＣＵ、ＣＵ、ＰＵ、ＴＵ、又は領域の第１ブロックにおいて伝送され得る。

いくつかの実施で、織り込み予測は、アフィン予測、ＡＴＭＶＰ、ＳＴＭＶＰ、ＦＲＵＣ、又はＢＩＯのような既存のサブブロック方法に適用される。そのような場合に、更なるシグナリングコストは必要とされない。いくつかの実施で、織り込み予測によって生成された新しいサブブロックマージ候補は、マージリストに挿入され得る（例えば、織り込み予測＋ＡＴＭＶＰ、織り込み予測＋ＳＴＭＶＰ、織り込み予測＋ＦＲＵＣ、など）。

いくつかの実施形態で、現在のブロックによって使用される分割パターンは、空間的及び／又は時間的隣接ブロックからの情報に基づいて導出され得る。例えば、関連情報を伝送するエンコーダに依存する代わりに、エンコーダ及びデコーダの両方が、時間的隣接（例えば、同じブロックの前に使用された分割パターン）又は空間的隣接（例えば、隣接するブロックによって使用された分割パターン）に基づいて分割パターンを取得する用所定の規則の組を採用することができる。

いくつかの実施形態で、重み値ｗは固定であることができる。例えば、全ての分割パターンは、等しく重み付けされ得る。すなわち、ｗ_ｉ（ｘ，ｙ）＝１である。いくつかの実施形態で、重み値は、使用される分割パターンに加えてブロックの位置に基づいて決定され得る。例えば、ｗ_ｉ（ｘ，ｙ）は、異なる（ｘ，ｙ）ごとに異なってよい。いくつかの実施形態で、重み値は、サブブロック予測に基づく符号化技術（例えば、アフィン又はＡＴＭＶＰ）及び／又は他の符号化情報（例えば、スキップ若しくは非スキップモード、及び／又はＭＶ情報）に更に依存してもよい。

いくつかの実施形態で、エンコーダは、重み値を決定し、その値をシーケンスレベル、スライスレベル、ＣＴＵ／ＬＣＵレベル、ＣＵレベル、ＰＵレベル、または領域レベル（複数のＣＵ／ＰＵ／ＴＵ／ＬＣＵを含んでよい）でデコーダへ送信してよい。重み値は、シーケンスパラメータセット（ＳＰＳ）、ビューパラメータセット（ＶＰＳ）、ピクチャパラメータセット（ＰＰＳ）、スライスヘッダ（ＳＨ）、ＣＴＵ／ＬＣＵ、ＣＵ、ＰＵ、ＴＵ、又は領域の第１ブロックにおいて伝送され得る。いくつかの実施形態で、重み値は、空間的及び／又は時間的隣接ブロックの重み値から導出され得る。

本明細書で開示される織り込み予測技術は、サブブロックに基づく予測の１つ、いくつか、又は全ての符号化技術に適用可能であることが知られる。例えば、織り込み予測技術は、アフィン予測に適用可能であり、一方、サブブロックに基づく予測の他の符号化技術（例えば、ＡＴＭＶＰ、ＳＴＭＶＰ、ＦＲＵＣ又はＢＩＯ）は、織り込み予測を使用しない。他の例として、アフィン、ＡＴＭＶＰ、及びＳＴＭＶＰの全てが、本明細書で開示される織り込み予測技術を適用する。

図２０は、例となるビデオビットストリーム処理装置２０００のブロック図である。装置２０００は、本明細書で記載される方法の１つ以上を実装するために使用されてよい。装置２０００は、スマートフォン、タブレット、コンピュータ、インターネット・オブ・シングス（ＩｏＴ）レシーバ、などにおいて具現されてよい。装置２０００は、１つ以上のプロセッサ２００２、１つ以上のメモリ２００４、及びビデオ処理ハードウェア２００６を含んでよい。プロセッサ２００２は、本特許文献で記載される１つ以上の方法を実装するよう構成されてよい。メモリ（複数を含む）２００４は、本明細書で記載される方法及び技術を実装するために使用されるデータ及びコードを記憶するために使用されてよい。ビデオ処理ハードウェア２００６は、本文書で記載されるいくつかの技術をハードウェア回路において実装するために使用されてよい。留意すべきは、プロセッサ２００２のエレクトロニクスからのメモリ２００４及び回路２００６の部分的又は完全な外在性は任意であり、実施選択である。

図２１は、例となるビデオ処理方法２１００のフローチャートを示す。方法２１００は、現在のブロックをサブブロックに分けること（２１０２）を含む。方法２１００は、サブブロックごとに動きベクトルを導出することと（２１０４）を更に含み、各サブブロックの動きベクトルは、ポジション規則に従ってそのサブブロックの位置と関連付けられる。方法２１００は、サブブロックの動きベクトルを用いて現在のブロックのビットストリーム表現を処理すること（２１０６）を更に含む。

図２２は、例となるビデオ処理方法２２００のフローチャートである。方法２２００は、アフィンモードを使用する、現在のブロックと現在のブロックのビットストリーム表現との間の変換のために、ポジション規則に基づいて現在のブロックの制御点での動きベクトルを導出すること（２２０２）を含む。方法２２００は、動きベクトルを使用して、現在のブロックとビットストリーム表現との間の変換を実行すること（２２０４）を更に含む。いくつかの実施で、ポジション規則は、導出のための非隣接近傍ブロックの使用を除くことを定めてよい。いくつかの実施で、動きベクトルは、現在のブロックの少なくとも１つの非隣接４×４ブロックを含む隣接符号化ユニットの情報を使用せずに導出され得る。いくつかの実施で、方法は、前に変換された隣接ブロックの少なくともいくつかのアフィンパラメータを保持及び再利用することを更に含む。いくつかの実施で、少なくともいくつかのアフィンパラメータの保持及び再利用は、互いに別々に２つのステップで実行され得る。

図２３は、例となるビデオ処理方法２３００のフローチャートである。方法は、現在のブロックと現在のブロックのビットストリーム表現との間の変換のために、１つ以上の隣接ブロックの位置に基づいて妥当性基準を満足する１つ以上の隣接ブロックからのマージ候補を含めることによって変換のためのアフィンマージ候補のリストを決定すること（２３０２）を含む。方法２３００は、動きベクトルを用いて現在のブロックとビットストリーム表現との間の変換を実行すること（２３０４）を更に含む。

上記の方法／技術の更なる特徴及び実施形態は、箇条書きで以下に記載される。

１．ビデオ処理の方法（例えば、図２１に示される方法２１００）であって、
現在のブロックをサブブロックに分けることと、
サブブロックごとに動きベクトルを導出することとであり、各サブブロックの前記動きベクトルは、ポジション規則に従ってそのサブブロックの位置と関連付けられる、ことと、
前記サブブロックの動きベクトルを用いて前記現在のブロックのビットストリーム表現を処理することと
を有する方法。

２．前記ポジション規則は、前記位置が対応するサブブロックの中心であることを定める、
１項に記載の方法。

３．前記対応するサブブロックは、サイズＭ×Ｎを有し、前記中心は、（（Ｍ＞＞１）＋ａ）×（（Ｎ＞＞１）＋ｂ）として定義され、Ｍ及びＮは自然数であり、ａ、ｂは０又は−１である、
項２に記載の方法。

４．前記ポジション規則は、前記位置が対応するサブブロックの非中心位置であることを定める、
項１に記載の方法。

５．前記ポジション規則によって指定される位置は、動きベクトルが異なるサブブロックでは異なる位置で導出されることをもたらす、
項１に記載の方法。

６．ビデオ処理方法（例えば、図２２に示される方法２２００）であって、
アフィンモードを使用する、現在のブロックと該現在のブロックのビットストリーム表現との間の変換のために、ポジション規則に基づいて前記現在のブロックの制御点での動きベクトルを導出することと、
前記動きベクトルを使用して、前記現在のブロックと前記ビットストリーム表現との間の前記変換を実行することと
を有し、
前記ポジション規則は、前記導出のための非隣接近傍ブロックの使用を除くことを定める、
方法。

７．動きベクトルは、前記現在のブロックの少なくとも１つの非隣接４×４ブロックを含む隣接符号化ユニットの情報を使用せずに導出される、
項６に記載の方法。

８．前に変換された隣接ブロックの少なくともいくつかのアフィンパラメータを保持及び再利用することを更に含む、
項７に記載の方法。

９．前記現在のブロックは、アフィンモードで符号化された隣接ブロックから前記少なくともいくつかのアフィンパラメータを引き継ぐ、
項８に記載の方法。

１０．前記少なくともいくつかのアフィンパラメータは、リスト０及びリスト１参照フレームについて異なる、
項８に記載の方法。

１１．前記少なくともいくつかのアフィンパラメータは、２つの組を有し、各組は、多重仮説参照ピクチャリストの１つのためである、
項８に記載の方法。

１２．前記少なくともいくつかのアフィンパラメータは、４つのアフィンパラメータのうちの２つを有する、
項８乃至１１のいずれかに記載の方法。

１３．前記現在のブロックの左上角の動きベクトル（ｖ_０ｘ，ｖ_０ｙ）は、前記現在のブロックの前記左上角に隣接するブロックから導出され、前記現在のブロックは、前記アフィンモードで符号化された隣接ブロックにマージされる、
項６に記載の方法。

１４．前記動きベクトル（ｖ_０ｘ，ｖ_０ｙ）を導出するために、対応する動きベクトルＭＶ（Ｒ）、ＭＶ（Ｓ）及びＭＶ（Ｔ）を夫々有している３つの隣接ブロックＲ、Ｓ及びＴを使用することを更に含み、
Ｘがインター符号化される場合に、前記動きベクトル（ｖ_０ｘ，ｖ_０ｙ）はＭＶ（Ｘ）に等しくセットされ、ＸはＲ、Ｓ又はＴである、
項１３に記載の方法。

１５．前記動きベクトル（ｖ_０ｘ，ｖ_０ｙ）を導出するために、対応する動きベクトルＭＶ（Ｒ）、ＭＶ（Ｓ）及びＭＶ（Ｔ）を夫々有している３つの隣接ブロックＲ、Ｓ及びＴを使用することを更に含み、
Ｒ、Ｓ及びＴがインター符号化される場合に、前記動きベクトル（ｖ_０ｘ，ｖ_０ｙ）はＭＶ（Ｒ）、ＭＶ（Ｓ）及びＭＶ（Ｔ）の平均に等しくセットされる、
項１３に記載の方法。

１６．前記動きベクトル（ｖ_０ｘ，ｖ_０ｙ）を導出するために、対応する動きベクトルＭＶ（Ｒ）、ＭＶ（Ｓ）及びＭＶ（Ｔ）を夫々有している３つ隣接ブロックＲ、Ｓ及びＴを使用することを更に含み、
Ｘ及びＹがインター符号化される場合に、前記動きベクトル（ｖ_０ｘ，ｖ_０ｙ）は、ＭＶ（Ｘ）及びＭＶ（Ｙ）の平均に等しくセットされ、Ｘ及びＹはＲ、Ｓ又はＴである、
項１３に記載の方法。

１７．前記動きベクトル（ｖ_０ｘ，ｖ_０ｙ）は、時間的隣接ブロックの動きベクトルから導出される、
項１３に記載の方法。

１８．前記動きベクトル（ｖ_０ｘ，ｖ_０ｙ）は、前記隣接ブロックのリファレンスにスケーリングされる、
項１３に記載の方法。

１９．前記動きベクトルは、前記アフィンモードで符号化された左隣のブロックから導出される、
項６に記載の方法。

２０．前記アフィンモードで符号化されたブロックの動きベクトルは、前記アフィンモードで符号化されたＳ個の上隣のブロックから導出され、Ｓは、４パラメータアフィンモードの場合に２に等しい、
項６に記載の方法。

２１．２個の上隣のブロックの間の距離は、２^Ｎの形で固定値であり、Ｎは整数である、
項２０に記載の方法。

２２．前記上隣のブロックの間の距離は、前記アフィンモードで符号化されたブロックの高さに依存する、
項２０に記載の方法。

２３．前記上隣のブロックの間の距離は、全ての上隣のブロックが前記アフィンモードで符号化され、同じ参照ピクチャを共有することを満足する最大長さとして導出される、
項２０に記載の方法。

２４．前記現在のブロックの左上制御点での動きベクトル（ｍｖ_０ ^ｘ，ｍｖ_０ ^ｙ）は、ｉ）ｍｖ_０ ^ｘ＝ｍｖＴ_０ ^ｘ−ａΦ及びｍｖ_０ ^ｙ＝ｍｖＴ_０ ^ｙ−ｂΦ又はｉｉ）ｍｖ_０ ^ｘ＝ｍｖＴ_１ ^ｘ−ａΦ及びｍｖ_０ ^ｙ＝ｍｖＴ_１ ^ｙ−ｂΦとして導出され、Φは、前記左上制御点と前記アフィンモードで符号化された２つの上隣のブロックＴ０及びＴ１のうちの１つとの間の距離である、
項２０に記載の方法。

２５．前記現在のブロックは、Ｍ×Ｎピクセルのサイズを有し、Ｍ及びＮは整数であり、前記動きベクトルは、Ｍ＜Ｎの場合に左側隣接ブロックから導出される、
項６に記載の方法。

２６．前記現在のブロックは、Ｍ×Ｎピクセルのサイズを有し、Ｍ及びＮは整数であり、前記動きベクトルは、Ｍ＞Ｎの場合に上側隣接ブロックから導出される、
項６に記載の方法。

２７．前記現在のブロックは、Ｍ×Ｎピクセルのサイズを有し、Ｍ及びＮは整数であり、前記動きベクトルは、Ｍ＝Ｎの場合に左上角に隣接するブロックから導出される、
項６に記載の方法。

２８．ビデオ処理の方法（例えば、図２３に示される方法２３００）であって、
現在のブロックと該現在のブロックのビットストリーム表現との間の変換のために、１つ以上の隣接ブロックの位置に基づいて妥当性基準を満足する前記１つ以上の隣接ブロックからのマージ候補を含めることによって前記変換のためのアフィンマージ候補のリストを決定することと、
動きベクトルを用いて前記現在のブロックと前記ビットストリーム表現との間の前記変換を実行することと
を有する方法。

２９．隣接ブロックは、現在のＣＴＵ（Coding Tree Unit）とは異なるＣＴＵからであり、前記隣接ブロックからのアフィンマージモード候補は妥当でない、
項２８に記載の方法。

３０．現在のＣＴＵは現在のＣＴＵラインに属し、前記隣接ブロックは、前記現在のＣＴＵラインとは異なるＣＴＵラインに属し、前記隣接ブロックからのアフィンマージモード候補は妥当でない、
項２８に記載の方法。

３１．前記現在のブロックは現在のスライスに属し、前記隣接ブロックは、前記現在のスライスとは異なるスライスに属し、前記隣接ブロックからのアフィンマージモード候補は妥当でない、
項２８に記載の方法。

３２．前記現在のブロックは現在のタイルに属し、前記隣接ブロックは、前記現在のタイルとは異なるタイルに属し、前記隣接ブロックからのアフィンマージモード候補は妥当でない、
項２８に記載の方法。

３３．ビデオ処理の方法であって、
アフィンモードを使用する、現在のブロックと該現在のブロックのビットストリーム表現との間の変換のために、１つ以上の隣接する近傍ブロックに基づいて前記現在のブロックの制御点での動きベクトルを導出することと、
前記動きベクトルを用いて前記現在のブロックと前記ビットストリーム表現との間の前記変換を実行することと
を有する方法。

３４．アフィンモードを使用する前記現在のブロックの制御点での前記動きベクトルは、上にある前記１つ以上の隣接する近傍ブロックから引き継がれる、
項３３に記載の方法。

３５．前記隣接する近傍ブロックはまた、アフィンモードによって符号化される、
項３３に記載の方法。

３６．前記隣接する近傍ブロックは、４パラメータアフィンモードによって符号化される、
項３５に記載の方法。

３７．アフィンモードを使用する前記現在のブロックの制御点での前記動きベクトルは、前記１つ以上の隣接する近傍ブロックの左下及び右下制御点動きベクトルから引き継がれる、
項３６に記載の方法。

３８．前記変換は、前記現在のブロックから前記ビットストリーム表現を生成することを含む、
上記の項のいずれかに記載の方法。

３９．前記変換は、前記ビットストリーム表現から前記現在のブロックを生成することを含む、
上記の項のいずれかに記載の方法。

４０．項１乃至３９の１つ以上に記載の方法を実装するよう構成されるプロセッサを有するビデオ復号化装置。

４１．項１乃至３９の１つ以上に記載の方法を実装するよう構成されるプロセッサを有するビデオ符号化装置。

４２．プロセッサによって実行される場合に、該プロセッサに、項１乃至３９の１つ以上に記載の方法を実施させる命令を有するコードが記憶されているコンピュータ可読プログラム媒体。

以上から、目下開示されている技術の具体的な実施形態は、実例のために本明細書で記載されており、様々な変更は、発明の範囲から外れずに行われ得ることが理解されるだろう。従って、目下開示されている技術は、添付の特許請求の範囲による場合を除いて制限されない。

本文書で記載される開示されている及び他の実施形態、モジュール及び機能動作は、デジタル電子回路で、又は本文書で開示される構造及びそれらの構造的な同等物を含むコンピュータソフトウェア、ファームウェア、若しくはハードウェアで、又はそれらの１つ以上の組み合わせで実装され得る。開示されている及び他の実施形態は、１つ以上のコンピュータプログラム製品、例えば、データ処理装置による実行のために又はその動作を制御するためにコンピュータ可読媒体で符号化されているコンピュータプログラム命令の１つ以上のモジュール、として実装され得る。コンピュータ可読媒体は、マシン読み出し可能な記憶デバイス、マシン読み出し可能な記憶担体、メモリデバイス、マシン読み出し可能な伝搬信号を実現する組成物、又はそれらの１つ以上の組み合わせであることができる。「データ処理装置」との語は、一例として、プログラム可能なプロセッサ、コンピュータ、又は複数のプロセッサ若しくはコンピュータを含む、データを処理するための全ての装置、デバイス、及びマシンを包含する。装置は、問題となっているコンピュータプログラムのための実行環境を作り出すコード、例えば、プロセッサファームウェア、プロトコルスタック、データベース管理システム、オペレーティングシステム、又はそれらの１つ以上の組み合わせを構成するコードを、ハードウェアに加えて含むことができる。伝搬信号は、人工的に生成された信号、例えば、マシンにより生成された電気的、光学的、又は電磁気的な信号であって、適切な受信装置への伝送のために情報を符号化するよう生成される信号である。

コンピュータプログラム（プログラム、ソフトウェア、ソフトウェアアプリケーション、スクリプト、又はコードとしても知られる）は、コンパイル済み又は解釈済みの言語を含む如何なる形式のプログラミング言語でも記述可能であり、それは、スタンドアロンプログラムとして、又はモジュール、コンポーネント、サブルーチン、若しくはコンピューティング環境での使用に適した他のユニットとしてを含め、如何なる形式でも展開され得る。コンピュータプログラムは、必ずしもファイルシステム内のファイルに対応しない。プログラムは、他のプログラム若しくはデータを保持するファイルの部分（例えば、マークアップ言語文書で保持されている１つ以上のスクリプト）で、問題となっているプログラムに専用の単一ファイルで、又は複数の協調ファイル（例えば、１つ以上のモジュール、サブプログラム、若しくはコードの部分を保持するファイル）で記憶され得る。コンピュータプログラムは、１つのコンピュータで、又は１つの場所に位置するか若しくは複数の場所にわたって分布し、通信ネットワークによって相互接続されている複数のコンピュータで実行されるよう展開され得る。

本文書で記載されるプロセス及びロジックフローは、入力データに作用して出力を生成することによって機能を実行するよう１つ以上のコンピュータプログラムを実行する１つ以上のプログラム可能なプロセッサによって実行可能である。プロセス及びロジックフローはまた、特別目的のロジック回路、例えば、ＦＰＧＡ（Field Programmable Gate Array）又はＡＳＩＣ（Application-Specific Integrated Circuit）としても実装され得る。

コンピュータプログラムの実行に適したプロセッサは、一例として、汎用マイクロプロセッサ及び専用プロセッサの両方、並びにあらゆる種類のデジタルコンピュータのいずれか１つ以上のプロセッサを含む。一般に、プロセッサは、リード・オンリー・メモリ若しくはランダム・アクセス・メモリまたは両方から命令及びデータを受け取る。コンピュータの必須の要素は、命令を実行するプロセッサと、命令及びデータを記憶する１つ以上のメモリデバイスとである。一般に、コンピュータはまた、データを記憶する１つ以上の大容量記憶デバイス、例えば、磁気若しくは光学磁気ディスク又は光ディスクを含むか、あるいは、それとの間のデータの受信、転送、若しくはその両方のために動作上結合される。しかし、コンピュータは、そのようなデバイスを有する必要がない。コンピュータプログラム命令及びデータを記憶するのに適したコンピュータ可読媒体は、一例として、半導体メモリデバイス、例えば、ＥＰＲＯＭ、ＥＥＰＲＯＭ、及びフラッシュメモリデバイス；磁気ディスク、例えば、内蔵ハードディスク及びリムーバブルディスク；光学磁気ディスク；並びにＣＤ−ＲＯＭ及びＤＶＤ−ＲＯＭディスクを含む、全ての形態の不揮発性メモリ、媒体、及びメモリデバイスを含む。プロセッサ及びメモリは、特別目的のロジック回路によって補完されるか、あるいは、それに組み込まれ得る。

本文書は多くの詳細を含むが、それらは、あらゆる発明の又は請求され得るものの範囲に対する制限として解釈されるべきではなく、むしろ、特定の発明の特定の実施形態に固有であり得る特徴の記載として解釈されるべきである。別個の実施形態に関連して本特許文献中で記載される特定の特徴はまた、単一の実施形態では組み合わせて実装され得る。反対に、単一の実施形態に関連して記載される様々な特徴はまた、複数の実施形態で別々に、又は任意の適切な組み合わせで、実装され得る。更に、特徴は、特定の組み合わせで動作するものとして先に記載され、そのようなものとして最初に請求されることさえあるが、請求されている組み合わせからの１つ以上の特徴は、いくつかの場合に、その組み合わせから切り取ることが可能であり、請求されている組み合わせは、サブコンビネーション又はサブコンビネーションのバリエーションに向けられてもよい。

同様に、動作は、図面において特定の順序で表されるが、これは、所望の結果を得るために、そのような動作が図示されている特定の順序で若しくは順番に実行されること、又は全ての表されている動作が実行されることを必要とするものとして理解されるべきではない。更に、本特許文献中で記載される実施形態における様々なシステムコンポーネントの分離は、全ての実施形態でそのような分離を必要とするものとして理解されるべきではない。

ほんの２、３の実施及び例が記載され、他の実施、拡張及び変形は、本特許文献で記載及び例示されているものに基づいて行われ得る。

［関連出願の相互参照］
適用される特許法及びパリ条約に従う規則の下で、本願は、２０１８年７月１日付けで出願された国際特許出願第ＰＣＴ／ＣＮ２０１８／０９３９４３号、及び２０１８年７月１３日付けで出願された国際特許出願第ＰＣＴ／ＣＮ２０１８／０９５５６８号の優先権及び利益を適時に主張してなされるものである。米国法の下での全ての目的のために、国際特許出願第ＰＣＴ／ＣＮ２０１８／０９３９４３号及び国際特許出願第ＰＣＴ／ＣＮ２０１８／０９５５６８号の全開示は、本願の開示の部分として参照により援用される。

［関連出願の相互参照］
本願は、２０１８年７月１日付けで出願された国際特許出願第ＰＣＴ／ＣＮ２０１８／０９３９４３号、及び２０１８年７月１３日付けで出願された国際特許出願第ＰＣＴ／ＣＮ２０１８／０９５５６８号の優先権及び利益を適時に主張してなされるものである。国際特許出願第ＰＣＴ／ＣＮ２０１８／０９３９４３号及び国際特許出願第ＰＣＴ／ＣＮ２０１８／０９５５６８号の全開示は、本願の開示の部分として参照により援用される。

Claims

ビデオ処理の方法であって、
現在のブロックをサブブロックに分けることと、
サブブロックごとに動きベクトルを導出することとであり、各サブブロックの前記動きベクトルは、ポジション規則に従ってそのサブブロックの位置と関連付けられる、ことと、
前記サブブロックの動きベクトルを用いて前記現在のブロックのビットストリーム表現を処理することと
を有する方法。
前記ポジション規則は、前記位置が対応するサブブロックの中心であることを定める、
請求項１に記載の方法。
前記対応するサブブロックは、サイズＭ×Ｎを有し、前記中心は、（（Ｍ＞＞１）＋ａ）×（（Ｎ＞＞１）＋ｂ）として定義され、Ｍ及びＮは自然数であり、ａ、ｂは０又は−１である、
請求項２に記載の方法。
前記ポジション規則は、前記位置が対応するサブブロックの非中心位置であることを定める、
請求項１に記載の方法。
前記ポジション規則によって指定される位置は、動きベクトルが異なるサブブロックでは異なる位置で導出されることをもたらす、
請求項１に記載の方法。
ビデオ処理方法であって、
アフィンモードを使用する、現在のブロックと該現在のブロックのビットストリーム表現との間の変換のために、ポジション規則に基づいて前記現在のブロックの制御点での動きベクトルを導出することと、
前記動きベクトルを使用して、前記現在のブロックと前記ビットストリーム表現との間の前記変換を実行することと
を有し、
前記ポジション規則は、前記導出のための非隣接近傍ブロックの使用を除くことを定める、
方法。
動きベクトルは、前記現在のブロックの少なくとも１つの非隣接４×４ブロックを含む隣接符号化ユニットの情報を使用せずに導出される、
請求項６に記載の方法。
前に変換された隣接ブロックの少なくともいくつかのアフィンパラメータを保持及び再利用することを更に含む、
請求項７に記載の方法。
前記現在のブロックは、アフィンモードで符号化された隣接ブロックから前記少なくともいくつかのアフィンパラメータを引き継ぐ、
請求項８に記載の方法。
前記少なくともいくつかのアフィンパラメータは、リスト０及びリスト１参照フレームについて異なる、
請求項８に記載の方法。
前記少なくともいくつかのアフィンパラメータは、２つの組を有し、各組は、多重仮説参照ピクチャリストの１つのためである、
請求項８に記載の方法。
前記少なくともいくつかのアフィンパラメータは、４つのアフィンパラメータのうちの２つを有する、
請求項８乃至１１のうちいずれか一項に記載の方法。
前記現在のブロックの左上角の動きベクトル（ｖ_０ｘ，ｖ_０ｙ）は、前記現在のブロックの前記左上角に隣接するブロックから導出され、前記現在のブロックは、前記アフィンモードで符号化された隣接ブロックにマージされる、
請求項６に記載の方法。
前記動きベクトル（ｖ_０ｘ，ｖ_０ｙ）を導出するために、対応する動きベクトルＭＶ（Ｒ）、ＭＶ（Ｓ）及びＭＶ（Ｔ）を夫々有している３つの隣接ブロックＲ、Ｓ及びＴを使用することを更に含み、
Ｘがインター符号化される場合に、前記動きベクトル（ｖ_０ｘ，ｖ_０ｙ）はＭＶ（Ｘ）に等しくセットされ、ＸはＲ、Ｓ又はＴである、
請求項１３に記載の方法。
前記動きベクトル（ｖ_０ｘ，ｖ_０ｙ）を導出するために、対応する動きベクトルＭＶ（Ｒ）、ＭＶ（Ｓ）及びＭＶ（Ｔ）を夫々有している３つの隣接ブロックＲ、Ｓ及びＴを使用することを更に含み、
Ｒ、Ｓ及びＴがインター符号化される場合に、前記動きベクトル（ｖ_０ｘ，ｖ_０ｙ）はＭＶ（Ｒ）、ＭＶ（Ｓ）及びＭＶ（Ｔ）の平均に等しくセットされる、
請求項１３に記載の方法。
前記動きベクトル（ｖ_０ｘ，ｖ_０ｙ）を導出するために、対応する動きベクトルＭＶ（Ｒ）、ＭＶ（Ｓ）及びＭＶ（Ｔ）を夫々有している３つ隣接ブロックＲ、Ｓ及びＴを使用することを更に含み、
Ｘ及びＹがインター符号化される場合に、前記動きベクトル（ｖ_０ｘ，ｖ_０ｙ）は、ＭＶ（Ｘ）及びＭＶ（Ｙ）の平均に等しくセットされ、Ｘ及びＹはＲ、Ｓ又はＴである、
請求項１３に記載の方法。
前記動きベクトル（ｖ_０ｘ，ｖ_０ｙ）は、時間的隣接ブロックの動きベクトルから導出される、
請求項１３に記載の方法。
前記動きベクトル（ｖ_０ｘ，ｖ_０ｙ）は、前記隣接ブロックのリファレンスにスケーリングされる、
請求項１３に記載の方法。
前記動きベクトルは、前記アフィンモードで符号化された左隣のブロックから導出される、
請求項６に記載の方法。
前記アフィンモードで符号化されたブロックの動きベクトルは、前記アフィンモードで符号化されたＳ個の上隣のブロックから導出され、Ｓは、４パラメータアフィンモードの場合に２に等しい、
請求項６に記載の方法。
２個の上隣のブロックの間の距離は、２^Ｎの形で固定値であり、Ｎは整数である、
請求項２０に記載の方法。
前記上隣のブロックの間の距離は、前記アフィンモードで符号化されたブロックの高さに依存する、
請求項２０に記載の方法。
前記上隣のブロックの間の距離は、全ての上隣のブロックが前記アフィンモードで符号化され、同じ参照ピクチャを共有することを満足する最大長さとして導出される、
請求項２０に記載の方法。
前記現在のブロックの左上制御点での動きベクトル（ｍｖ_０ ^ｘ，ｍｖ_０ ^ｙ）は、ｉ）ｍｖ_０ ^ｘ＝ｍｖＴ_０ ^ｘ−ａΦ及びｍｖ_０ ^ｙ＝ｍｖＴ_０ ^ｙ−ｂΦ又はｉｉ）ｍｖ_０ ^ｘ＝ｍｖＴ_１ ^ｘ−ａΦ及びｍｖ_０ ^ｙ＝ｍｖＴ_１ ^ｙ−ｂΦとして導出され、Φは、前記左上制御点と前記アフィンモードで符号化された２つの上隣のブロックＴ０及びＴ１のうちの１つとの間の距離である、
請求項２０に記載の方法。
前記現在のブロックは、Ｍ×Ｎピクセルのサイズを有し、Ｍ及びＮは整数であり、前記動きベクトルは、Ｍ＜Ｎの場合に左側隣接ブロックから導出される、
請求項６に記載の方法。
前記現在のブロックは、Ｍ×Ｎピクセルのサイズを有し、Ｍ及びＮは整数であり、前記動きベクトルは、Ｍ＞Ｎの場合に上側隣接ブロックから導出される、
請求項６に記載の方法。
前記現在のブロックは、Ｍ×Ｎピクセルのサイズを有し、Ｍ及びＮは整数であり、前記動きベクトルは、Ｍ＝Ｎの場合に左上角に隣接するブロックから導出される、
請求項６に記載の方法。
ビデオ処理の方法であって、
現在のブロックと該現在のブロックのビットストリーム表現との間の変換のために、１つ以上の隣接ブロックの位置に基づいて妥当性基準を満足する前記１つ以上の隣接ブロックからのマージ候補を含めることによって前記変換のためのアフィンマージ候補のリストを決定することと、
動きベクトルを用いて前記現在のブロックと前記ビットストリーム表現との間の前記変換を実行することと
を有する方法。
隣接ブロックは、現在のＣＴＵとは異なるＣＴＵからであり、前記隣接ブロックからのアフィンマージモード候補は妥当でない、
請求項２８に記載の方法。
現在のＣＴＵは現在のＣＴＵラインに属し、前記隣接ブロックは、前記現在のＣＴＵラインとは異なるＣＴＵラインに属し、前記隣接ブロックからのアフィンマージモード候補は妥当でない、
請求項２８に記載の方法。
前記現在のブロックは現在のスライスに属し、前記隣接ブロックは、前記現在のスライスとは異なるスライスに属し、前記隣接ブロックからのアフィンマージモード候補は妥当でない、
請求項２８に記載の方法。
前記現在のブロックは現在のタイルに属し、前記隣接ブロックは、前記現在のタイルとは異なるタイルに属し、前記隣接ブロックからのアフィンマージモード候補は妥当でない、
請求項２８に記載の方法。
ビデオ処理の方法であって、
アフィンモードを使用する、現在のブロックと該現在のブロックのビットストリーム表現との間の変換のために、１つ以上の隣接する近傍ブロックに基づいて前記現在のブロックの制御点での動きベクトルを導出することと、
前記動きベクトルを用いて前記現在のブロックと前記ビットストリーム表現との間の前記変換を実行することと
を有する方法。
アフィンモードを使用する前記現在のブロックの制御点での前記動きベクトルは、上にある前記１つ以上の隣接する近傍ブロックから引き継がれる、
請求項３３に記載の方法。
前記隣接する近傍ブロックはまた、アフィンモードによって符号化される、
請求項３３に記載の方法。
前記隣接する近傍ブロックは、４パラメータアフィンモードによって符号化される、
請求項３５に記載の方法。
アフィンモードを使用する前記現在のブロックの制御点での前記動きベクトルは、前記１つ以上の隣接する近傍ブロックの左下及び右下制御点動きベクトルから引き継がれる、
請求項３６に記載の方法。
前記変換は、前記現在のブロックから前記ビットストリーム表現を生成することを含む、
請求項１乃至３７のうちいずれか一項に記載の方法。
前記変換は、前記ビットストリーム表現から前記現在のブロックを生成することを含む、
請求項１乃至３７のうちいずれか一項に記載の方法。
請求項１乃至３９のうちいずれか一項に記載の方法を実装するよう構成されるプロセッサを有するビデオ復号化装置。
請求項１乃至３９のうちいずれか一項に記載の方法を実装するよう構成されるプロセッサを有するビデオ符号化装置。
プロセッサによって実行される場合に、該プロセッサに、請求項１乃至３９のうちいずれか一項に記載の方法を実施させる命令を有するコードが記憶されているコンピュータ可読プログラム媒体。