JP2024008948A - 動き候補リスト構築プロセスの条件付き実行 - Google Patents

動き候補リスト構築プロセスの条件付き実行 Download PDF

Info

Publication number
JP2024008948A
JP2024008948A JP2023182535A JP2023182535A JP2024008948A JP 2024008948 A JP2024008948 A JP 2024008948A JP 2023182535 A JP2023182535 A JP 2023182535A JP 2023182535 A JP2023182535 A JP 2023182535A JP 2024008948 A JP2024008948 A JP 2024008948A
Authority
JP
Japan
Prior art keywords
block
candidate
merge
motion
list
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2023182535A
Other languages
English (en)
Inventor
ザン,リー
Li Zhang
ザン,カイ
Kai Zhang
リュウ,ホンビン
Hongbin Liu
ワン,ユエ
Yue Wang
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing ByteDance Network Technology Co Ltd
ByteDance Inc
Original Assignee
Beijing ByteDance Network Technology Co Ltd
ByteDance Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing ByteDance Network Technology Co Ltd, ByteDance Inc filed Critical Beijing ByteDance Network Technology Co Ltd
Publication of JP2024008948A publication Critical patent/JP2024008948A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/58Motion compensation with long-term prediction, i.e. the reference frame for a current frame not being the temporally closest one
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】 非矩形分割を用い得るビジュアルメディア処理方法が提供される。【解決手段】 ビジュアルメディア処理方法は、ビジュアルメディアデータの第1の映像ブロックが幾何学的分割モード(GPM)を使用し、ビジュアルメディアデータの第2の映像ブロックが非GPMモードを使用することを決定するステップと、統一剪定プロセスに基づいて、第1の映像ブロックのための第1のマージリスト及び第2の映像ブロックのための第2のマージリストを構築するステップと、を含み、第1のマージリスト及び第2のマージリストはマージ候補を有し、上記剪定プロセスは、マージリストに新たなマージ候補を、該新たなマージ候補の動き情報と該マージリスト内の少なくとも1つのマージ候補の動き情報とを比較することに基づいて追加することを含み、GPMは、第1の映像ブロックを、動き予測を別々に適用する複数の予測パーティションに分けることを有し、少なくとも1つのパーティションは、非矩形の形状を持つ。【選択図】 図23

Description

この出願は、2020年6月4日に出願された国際特許出願第PCT/CN2020/094306号に基づくものである2021年12月3日に国内移行された特願2021-571916に基づき、当該国際特許出願は、2019年6月4日に出願された国際特許出願第PCT/CN2019/089970号の優先権及び利益を主張するものである。上記特許出願の全てをそれらの全体にてここに援用する。
この文書は、映像及び画像の符号化及び復号技術に関する。
デジタル映像は、インターネット及び他のデジタル通信ネットワークにおいて最大の帯域幅使用を占めている。映像を受信して表示することが可能な接続ユーザ装置の数が増えるにつれて、デジタル映像使用に対する帯域幅需要が増加し続けることが予期される。
開示される技術は、例えば三角分割モードなどの非矩形分割を用いて映像ビットストリームの符号化又は復号を実行するために、映像又は画像デコーダ又はエンコーダの実施形態によって使用され得る。
一態様例において、ビジュアルメディア処理の方法が開示される。当該方法は、ビジュアルメディアデータの第1の映像ブロックが幾何学的分割モード(GPM)を使用し、ビジュアルメディアデータの第2の映像ブロックが非GPMモードを使用することを決定するステップと、統一剪定プロセスに基づいて、前記第1の映像ブロックのための第1のマージリスト及び前記第2の映像ブロックのための第2のマージリストを構築するステップであり、当該第1のマージリスト及び当該第2のマージリストはマージ候補を有し、前記統一剪定プロセスは、マージリストに新たなマージ候補を、該新たなマージ候補の動き情報と該マージリスト内の少なくとも1つのマージ候補の動き情報とを比較することに基づいて追加することを含む、ステップと、を含み、前記GPMは、前記第1の映像ブロックを、動き予測を別々に適用する複数の予測パーティションに分けることを有し、少なくとも1つのパーティションは、非矩形の形状を持つ。
他の一態様例において、別のビジュアルメディア処理の方法が開示される。当該方法は、ビジュアルメディアデータの現在映像ブロックと前記ビジュアルメディアデータのビットストリーム表現との間での変換のために、前記現在映像ブロックに適用可能な動き情報の初期値をルールに基づいて決定するステップであり、前記ルールは、前記現在映像ブロックに対してサブブロックベース時間動きベクトル予測子コーディング(SbTMVP)モードが利用可能であるかを、前記現在映像ブロックの隣接ブロックの参照リスト(リストXと表記)に基づいて検査することを規定し、ただし、Xは整数であり、Xの値は、少なくとも、前記隣接ブロックの符号化条件に依存する、ステップと、前記決定に基づいて前記変換を実行するステップと、を含む。
更なる他の一態様例において、別のビジュアルメディア処理の方法が開示される。当該方法は、ビジュアルメディアデータの現在映像ブロックと前記ビジュアルメディアデータのビットストリーム表現との間での変換のために、前記現在映像ブロックの1つ以上のサブブロックに対する1つ以上のコロケート動きベクトルをルールに基づいて導出するステップであり、前記ルールは、前記現在映像ブロックを前記ビットストリーム表現へと符号化するのに使用される符号化ツールに関係なく前記1つ以上のコロケート動きベクトルを導出する統一導出プロセスを使用することを規定する、ステップと、前記1つ以上のコロケート動きベクトルを有するマージリストを用いて前記変換を実行するステップと、を含む。
更なる他の一態様例において、別のビジュアルメディア処理の方法が開示される。当該方法は、ビジュアルメディアデータの現在映像ブロックの寸法に関連する1つ以上の条件を特定するステップであり、前記現在映像ブロックにイントラブロックコピー(IBC)モードが適用される、ステップと、前記現在映像ブロックの前記寸法に関連する前記1つ以上の条件が満たされるかに基づいて、前記現在映像ブロック向けの動き候補リストの動き候補リスト構築プロセスを決定するステップと、前記動き候補リストに基づいて前記現在映像ブロックと前記現在映像ブロックのビットストリーム表現との間での変換を実行するステップと、を含む。
更なる他の一態様例において、別のビジュアルメディア処理の方法が開示される。当該方法は、ビジュアルメディアデータの現在映像ブロックと前記ビジュアルメディアデータのビットストリーム表現との間での変換のために、前記変換のために符号化技術が無効にされることの決定を行うステップであり、前記ビットストリーム表現は、前記符号化技術のためのマージ候補の最大数がゼロであることを指し示すフィールドを含むように構成される、ステップと、前記符号化技術が無効にされることの前記決定に基づいて前記変換を実行するステップと、を含む。
更なる他の一態様例において、別のビジュアルメディア処理の方法が開示される。当該方法は、現在映像ブロックと該現在映像ブロックのビットストリーム表現との間での変換のために、ルールを用いて決定を行うステップであり、前記ルールは、前記ビットストリーム表現内の第1の構文要素が、前記現在映像ブロックに適用される少なくとも1つの符号化技術に関連するマージ候補の最大数を指し示す前記ビットストリーム表現内の第2の構文要素に基づいて条件付きで含められることを規定する、ステップと、前記決定に基づいて前記現在映像ブロックと前記現在映像ブロックのビットストリーム表現との間での前記変換を実行するステップと、を含む。
他の一態様例において、上述の方法は、プロセッサを有するビデオデコーダ装置によって実装され得る。
他の一態様例において、上述の方法は、プロセッサを有するビデオエンコーダ装置によって実装され得る。
更なる他の一態様例において、これらの方法は、プロセッサ実行可能命令の形態で具現化されてコンピュータ読み取り可能プログラム媒体に格納され得る。
これら及び他の態様が本文書に更に記載される。
マージ候補リスト構築のための導出プロセスを示している。 空間マージ候補の位置の例を示している。 空間マージ候補の冗長性検査に考慮される候補ペアの例を示している。 N×2N及び2N×Nパーティションの第2の予測ユニット(PU)の位置の例を示している。 時間マージ候補に対する動きベクトルスケーリングの説明図を示している。 時間マージ候補C0及びC1の候補位置の例を示している。 結合双予測マージ候補の例を示している。 動きベクトル予測候補に関する導出プロセスの例を示している。 空間動きベクトル候補に対する動きベクトルスケーリングの例を示している。 4パラメータアフィンモード(左)及び6パラメータアフィンモデル(右)に関する単純化したアフィン動きモデルの例を示している。 サブブロックごとのアフィン動きベクトル場の例を示している。 アフィンマージモードに関する候補位置の例を示している。 変更マージリスト構築プロセスの例を示している。 三角パーティションベースのインター予測の例を示している。 第1の重み付け係数グループを適用するCUの例を示している。 動きベクトルストレージの例を示している。 最終動きベクトル表現(UMVE)探索プロセスの例を示している。 UMVE探索点の例を示している。 DMVRにおけるリスト0とリスト1との間でミラーリングされるMVD(0,1)の例を示している。 1回のイテレーションで検査され得るMVを示している。 イントラブロックコピーの一例である。 映像処理装置の一例を示している。 映像処理方法の一例に関するフローチャートである。 開示される技術が実装され得る映像処理システムの一例のブロック図である。 ビジュアルメディア処理方法の一例に関するフローチャートである。 ビジュアルメディア処理方法の一例に関するフローチャートである。 ビジュアルメディア処理方法の一例に関するフローチャートである。 ビジュアルメディア処理方法の一例に関するフローチャートである。 ビジュアルメディア処理方法の一例に関するフローチャートである。 ビジュアルメディア処理方法の一例に関するフローチャートである。 ビジュアルメディア処理方法の一例に関するフローチャートである。
本文書は、解凍又は復号されたデジタル映像又は画像の品質を向上させるために画像又は映像ビットストリームのデコーダによって使用されることができる様々な技術を提供する。簡潔さのため、用語“映像”は、ここでは、一連のピクチャ(伝統的に映像(ビデオ)と呼ばれる)及び個々の画像の両方を含むように使用される。また、ビデオエンコーダも、更なる符号化のために使用される復号フレームを再構成するために、符号化のプロセスにおいてこれらの技術を実装し得る。
本文書では、理解を容易にするためにセクション見出しを使用するが、それらは実施形態及び技術を対応するセクションに限定するものではない。従って、1つのセクションからの実施形態を、他のセクションからの実施形態と組み合わせることができる。
1. 概要
この文献は映像符号化技術に関する。具体的には、これは、三角予測モードを含むマージコーディングに関連する。これは、HEVCのような既存の映像符号化標準に適用されてもよいし、成立される標準(バーサタイルビデオコーディング)に適用されてもよい。これは、将来の映像符号化標準又は映像コーデックにも適用可能である。
2. 冒頭説明
映像符号化標準は、主に、周知のITU-T及びISO/IEC標準の開発を通じて発展してきた。ITU-TがH.261及びH.263を作成し、ISO/IECがMPEG-1及びMPEG-4 Visualを作成し、そして、これら2つの組織が共同で、H.262/MPEG-2 Video及びH.264/MPEG-4 AVC(Advanced Video Coding)及びH.265/HEVC標準を作成した。H.262以来、映像符号化標準は、時間予測に加えて変換符号化が利用されるハイブリッド映像符号化構造に基づいている。HEVCの先の将来の映像符号化技術を探求するため、2015年にVCEGとMPEGが共同でJVET(Joint Video Exploration Team)を設立した。それ以来、数多くの新しい方法が、JVETによって採用され、共同探索モデルJEM(Joint Exploration Model)と名付けられたリファレンスソフトウェアに入れられてきた。2018年4月には、HEVCと比較して50%のビットレート低減を目指すVVC標準に取り組むべく、VCEG(Q6/16)とISO/IEC JTC1 SC29/WG11(MPEG)との間でJVET(Joint Video Expert Team)を発足させた。
VVCドラフトの最新版、すなわち、バーサタイルビデオコーディング(ドラフト5)は:
http://phenix.it-sudparis.eu/jvet/doc_end_user/documents/14_Geneva/wg11/JVET-N1001-v7.zip
にて見つけることができる。
VTMと呼ばれるVVCの最新リファレンスソフトウェアは:
https://vcgit.hhi.fraunhofer.de/jvet/VVCSoftware_VTM/tags/VTM-5.0
にて見つけることができる。
2.1 HEVC/H.265におけるインター予測
インター符号化される符号化ユニット(CU)について、それは、パーティションモードに従って、1つの予測ユニット(PU)、2つのPUで符号化され得る。インター予測による各PUは、1つ又は2つの参照ピクチャリストに関する動きパラメータを有する。動きパラメータは、動きベクトル及び参照ピクチャインデックスを含む。2つの参照ピクチャリストのうちの1つの使用がまた、inter_pred_idcを用いて信号伝達され得る。動きベクトルは、予測子に対するデルタとして明示的に符号化され得る。
CUがスキップモードで符号化される場合、そのCUに1つのPUが関連付けられ、有意な残差係数は存在せず、符号化された動きベクトルデルタ又は参照ピクチャインデックスは存在しない。マージモードが規定されており、それによれば、現在PUに関する動きパラメータが、空間候補及び時間候補を含め、隣接するPUから取得される。マージモードは、スキップモードに対してだけでなく、任意のインター予測PUに適用されることができる。マージモードに代わるものは、動きパラメータの明示的な伝送であり、それにおいては、動きベクトル(より正確には、動きベクトル予測子と比較した動きベクトル差(MVD))、各参照ピクチャリストに関する対応する参照ピクチャインデックス、及び参照ピクチャリスト使用が、PUごとに明示的に信号伝達される。このようなモードを、この開示においては、アドバンスト動きベクトル予測(Advanced motion vector prediction;AMVP)と呼ぶ。
2つの参照ピクチャリストのうちの一方が使用されることを信号伝達が指し示すとき、そのPUは、1つのブロックのサンプルから生成される。これは、“片予測(uni-prediction)”と呼ばれている。片予測は、Pスライス及びBスライスの両方で利用可能である。
それら参照ピクチャリストの両方が使用されることを信号伝達が指し示すとき、そのPUは、2つのブロックのサンプルから生成される。これは、“双予測(bi-prediction)”と呼ばれている。双予測は、Bスライスでのみ利用可能である。
以下のテキストは、HEVCにて規定されるインター予測モードについての詳細を提供するものである。マージモードから説明を始めることとする。
2.1.1 参照ピクチャリスト
HEVCにおいて、インター予測という用語は、現在復号されているピクチャ以外の参照ピクチャのデータ要素(例えば、サンプル値又は動きベクトル)から導出される予測を表記するために使用される。H.264/AVCにおいてと同様に、ピクチャは複数の参照ピクチャから予測されることができる。インター予測に使用される参照ピクチャは、1つ以上の参照ピクチャリストに編成される。予測信号を作成するためにリスト内の参照ピクチャのうちのどれが使用されるべきかを参照インデックスが特定する。
Pスライスには、リスト0なる単一の参照ピクチャリストが使用され、Bスライスには、リスト0及びリスト1なる2つの参照ピクチャリストが使用される。なお、リスト0/1に含まれる参照ピクチャは、キャプチャ/表示順に関して過去及び将来のピクチャからであり得る。
2.1.2 マージモード
2.1.2.1 マージモードに関する候補の導出
マージモードを使用してPUが予測されるとき、マージ候補リスト内のエントリを指すインデックスがビットストリームから構文解析され、動き情報を取り出すために使用される。このリストの構築は、HEVC標準に規定されており、以下の一連のステップに従って要約され得る:
・ ステップ1:当初候補導出
- ステップ1.1:空間候補導出
- ステップ1.2:空間候補に関する冗長性検査
- ステップ1.3:時間候補導出
・ ステップ2:追加候補挿入
- ステップ2.1:双予測候補の作成
- ステップ2.2:ゼロ動き候補の挿入。
図1にも、これらのステップを概略的に示す。空間マージ候補導出のために、5つの異なる位置にある候補の中から最大4つのマージ候補が選択される。時間マージ候補導出のために、2つの候補の中から最大1つのマージ候補が選択される。デコーダで各PUに対して一定数の候補が仮定されるので、ステップ1から得られた候補の数が、スライスヘッダ内で信号伝達されるマージ候補の最大数(MaxNumMergeCand)に達しない場合、追加候補が生成される。候補の数は一定であるので、最良のマージ候補のインデックスが、truncated unary binarization(TU)を用いて符号化される。CUのサイズが8に等しい場合、現在CUの全てのPUが、2N×2N予測ユニットのマージ候補リストと同じものである単一のマージ候補リストを共有する。
以下にて、上述のステップに関連する処理を詳述する。
2.1.2.2 空間候補導出
空間マージ候補の導出では、図2に示す位置にある候補の中から最大4つのマージ候補が選択される。導出の順序はA、B、B、A、及びBである。位置Bは、位置A、B、B、AのうちのいずれかのPUが利用可能でない場合(例えば、それが別のスライス又はタイルに属するため)又はイントラ符号化される場合にのみ考慮される。位置Aの候補が追加された後、残りの候補の追加は、符号化効率が向上されるように、同じ動き情報を有する候補がリストから除外されることを保証する冗長性検査にかけられる。計算複雑性を低減させるために、前述の冗長性検査では、可能な全ての候補ペアが考慮されるわけではない。その代わりに、図3の矢印で結び付けられたペアのみが考慮され、冗長性検査に使用される対応する候補が同じ動き情報を持たない場合にのみ、候補がリストに追加される。重複動き情報の別の発生源は、2N×2Nとは異なる分割に関連する“第2のPU”である。一例として、図4は、それぞれ、N×2N及び2N×Nの場合の第2のPUを示している。現在PUがN×2Nに分割されるとき、Aにある候補はリスト構築に考慮されない。実際、この候補を追加することは、同じ動き情報を有する2つの予測ユニットにつながることになり、それは、符号化ユニット内に1つのみのPUを有することには冗長である。同様に、現在PUが2N×Nに分割されるとき、位置Bは考慮されない。
2.1.2.3 時間候補導出
このステップでは、1つの候補のみがリストに追加される。特に、この時間マージ候補の導出では、コロケートピクチャ内のコロケートPUに基づいて、スケーリングされた動きベクトルが導出される。コロケートPUの導出に使用される参照ピクチャリストは、スライスヘッダ内で明示的に信号伝達される。時間マージ候補に関するスケーリングされた動きベクトルは、図5に点線で示すようにして得られ、それは、POC距離tb及びtdを用いて、コロケートPU(col_PU)の動きベクトルからスケーリングされるものであり、ここで、tbは、現在ピクチャ(curr_pic)の参照ピクチャ(curr_ref)と現在ピクチャとの間のPOC差であると定義され、tdは、コロケートピクチャ(col_pic)の参照ピクチャ(col_ref)とコロケートピクチャとの間のPOC差であると定義される。時間マージ候補の参照ピクチャインデックスは、ゼロに等しく設定される。スケーリングプロセスの実際の具現化はHEVC仕様書に定められている。Bスライスでは、一方が参照ピクチャリスト0に関し、他方が参照ピクチャリスト1に関するものである2つの動きベクトルが得られ、これらが組み合わされて、双予測マージ候補をなす。
2.1.2.4 コロケートピクチャ及びコロケートPU
TMVPが有効にされる場合(すなわち、slice_temporal_mvp_enabled_flagが1に等しい)、コロケートピクチャを表す変数ColPicが、次のように導出される:
- 現在スライスがBスライスであり、信号伝達されるcollocated_from_10_flagが0に等しい場合、ColPicはRefPicList1[collocated_ref_idx]に等しく設定され;
- それ以外の場合(slice_typeがBに等しく且つcollocated_from_l0_flagが1に等しい、又はslice_typeがPに等しい)、ColPicはRefPicList0[collocated_ref_idx]に等しく設定され;
ただし、collocated_ref_idx及びcollocated_from_10_flagは、スライスヘッダ内で信号伝達され得る2つの構文要素である。
参照フレームに属するコロケートPU(Y)では、図6に示すように、時間候補に関する位置が、候補C及びCの間で選択される。位置CのPUが利用可能でない、又はイントラ符号化される、又は現在符号化ツリーユニット(CTU、最大符号化ユニットLCUとしても知られる)行の外側にある場合、位置Cが使用される。それ以外の場合には、位置Cが時間マージ候補の導出に使用される。
関連する構文要素は、次のように記述される:
Figure 2024008948000002
2.1.2.5 TMVP候補に関するMVの導出
より具体的には、TMVP候補を導出するために、以下のステップが実行される:
1)参照ピクチャリストX=0に設定し、ターゲット参照ピクチャを、リストX内の0に等しいインデックスを有する参照ピクチャ(すなわちcurr_ref)に設定する;
2)現在スライスがBスライスである場合、参照ピクチャリストX=1に設定し、ターゲット参照ピクチャを、リストX内の0に等しいインデックスを有する参照ピクチャ(すなわちcurr_ref)に設定する。curr_refを指すリストXに関するMVを取得するために、コロケート動きベクトルの導出プロセスを呼び出す。
コロケート動きベクトルの導出プロセスを、次のサブセクション2.1.2.5.1で説明する。
2.1.2.5.1 コロケート動きベクトルの導出プロセス
コロケートブロックについて、それは、片予測又は双予測でイントラ符号化又はインター符号化され得る。それがイントラ符号化される場合、TMVP候補は利用不可に設定される。
それがリストAからの片予測である場合、リストAの動きベクトルがターゲット参照ピクチャリストXにスケーリングされる。
それが双予測であり且つターゲット参照ピクチャリストがXである場合、リストAの動きベクトルがターゲット参照ピクチャリストXにスケーリングされ、Aは、以下のルールに従って決定される:
- 参照ピクチャがいずれも、現在ピクチャに比べて大きいPOC値を持たない場合、AはXに等しく設定される;
- そうでない場合、Aはcollocated_from_10_flagに等しく設定される。
JCTVC-W1005-v4の関連作業草案は、次の通り記載されている。
8.5.3.2.9 コロケート動きベクトルの導出プロセス
このプロセスへの入力は以下である:
- 現在予測ブロックを規定する変数currPb、
- ColPicによって規定されるコロケートピクチャの内側のコロケート予測ブロックを規定する変数colPb、
- ColPbによって規定されるコロケートルマ予測ブロックの左上サンプルを、ColPicによって規定されるコロケートピクチャの左上ルマサンプルに対して規定するルマ位置(xColPb,yColPb)、
- Xを0又は1とする参照インデックスrefIdxLX。
このプロセスの出力は以下である:
- 動きベクトル予測mvLXCol
- 利用可用性フラグavailableFlagLXCol。
変数currPicは現在ピクチャを規定する。
配列predFlagL0Col[x][y]、mvL0Col[x][y]、及びrefIdxL0Col[x][y]が、ColPicによって規定されるコロケートピクチャのそれぞれPredFlagL0[x][y]、MvL0[x][y]、及びRefIdxL0[x][y]に等しく設定され、配列predFlagL1Col[x][y]、mvL1Col[x][y]、及びrefIdxL1Col[x][y]が、ColPicによって規定されるコロケートピクチャのそれぞれPredFlagL1[x][y]、MvL1[x][y]、及びRefIdxL1[x][y]に等しく設定される。
変数mvLXCol及びavailableFlagLXColが、次のように導出される:
- colPbがイントラ予測モードで符号化される場合、mvLXColの両方のコンポーネントが0に等しく設定され、availableFlagLXColが0に等しく設定される。
- それ以外の場合、動きベクトルmvCol、参照インデックスrefIdxCol、及び参照リスト識別子listColが、次のように導出される:
- predFlagL0Col[xColPb][yColPb]が0に等しい場合、mvCol、refIdxCol、及びlistColが、それぞれ、mvL1Col[xColPb][yColPb]、refIdxL1Col[xColPb][yColPb]、及びL1に等しく設定される;
- そうでなく、predFlagL0Col[xColPb][yColPb]が1に等しく且つpredFlagL1Col[xColPb][yColPb]が0に等しい場合、mvCol、refIdxCol、及びlistColが、それぞれ、mvL0Col[xColPb][yColPb]、refIdxL0Col[xColPb][yColPb]、及びL0に等しく設定される;
- それ以外の場合(predFlagL0Col[xColPb][yColPb]が1に等しく且つpredFlagL1Col[xColPb][yColPb]が1に等しい)、以下の割り当てが行われる:
- NoBackwardPredFlagが1に等しい場合、mvCol、refIdxCol、及びlistColが、それぞれ、mvLXCol[xColPb][yColPb]、refIdxLXCol[xColPb][yColPb]、及びLXに等しく設定される;
- それ以外の場合、mvCol、refIdxCol、及びlistColが、それぞれ、mvLNCol[xColPb][yColPb]、refIdxLNCol[xColPb][yColPb]、及びLNに等しく設定され、Nはcollocated_from_l0_flagの値である;
そして、mvLXCol及びavailableFlagLXColが、次のように導出される:
- LongTermRefPic(currPic,currPb,refIdxLX,LX)がLongTermRefPic(ColPic,colPb,refIdxCol,listCol)に等しくない場合、mvLXColの両方のコンポーネントが0に等しく設定され、availableFlagLXColが0に等しく設定される;
- それ以外の場合、変数availableFlagLXColが1に等しく設定され、refPicListCol[refIdxCol]が、ColPicによって規定されるコロケートピクチャ内の予測ブロックcolPbを含むスライスの参照ピクチャリストlistCol内の参照インデックスrefIdxColを有するピクチャであるように設定され、以下が適用される:
colPocDiff=DiffPicOrderCnt(ColPic,refPicListCol[refIdxCol]) (2-1)
currPocDiff=DiffPicOrderCnt(currPic,RefPicListX[refIdxLX]) (2-2)
- RefPicListX[refIdxLX]が長期参照ピクチャである、又はcolPocDiffがcurrPocDiffに等しい場合、mvLXColが、次のように導出される:
mvLXCol=mvCol (2-3)
- それ以外の場合、次のように、mvLXColが、動きベクトルmvColのスケーリングされたバージョンとして導出され:
tx=(16384+(Abs(td)>>1))/td (2-4)
distScaleFactor=Clip3(-4096,4095,(tb*tx+32)>>6) (2-5)
mvLXCol=Clip3(-32768,32767,Sign(distScaleFactor*mvCol)*
((Abs(distScaleFactor*mvCol)+127)>>8)) (2-6)
ここで、td及びtbは、次のように導出される:
td=Clip3(-128,127,colPocDiff) (2-7)
tb=Clip3(-128,127,currPocDiff) (2-8)
NoBackwardPredFlagの定義は、以下である:
変数NoBackwardPredFlagは、次のように導出される:
- DiffPicOrderCnt(aPic,CurrPic)が、現在スライスのRefPicList0又はRefPicList1内の各ピクチャaPicに対して0以下である場合、NoBackwardPredFlagは1に設定される;
- それ以外の場合、NoBackwardPredFlagは0に等しく設定される。
2.1.1.4 追加候補挿入
空間及び時間マージ候補の他に、結合双予測マージ候補及びゼロマージ候補という2つの更なるタイプのマージ候補が存在する。結合双予測マージ候補は、空間及び時間マージ候補を利用することによって生成される。結合双予測マージ候補はBスライスのみに使用される。結合双予測候補は、当初候補の第1の参照ピクチャリスト動きパラメータを別のものの第2の参照ピクチャリスト動きパラメータと組み合わせることによって生成される。これら2つのタプルが異なる動き仮説を提供する場合、それらは新たな双予測候補を形成する。一例として、図7は、mvL0とrefIdxL0、又はmvL1とrefIdxL1、を有するものである元のリスト(左側)内の2つの候補を用いて、最終的なリスト(右側)に追加される結合双予測マージ候補が作成される場合を示している。これらの追加マージ候補を生成するために考慮される組み合わせに関するルールが数多く存在する。
マージ候補リストの残りのエントリを埋め、それ故にMaxNumMergeCand容量に達するように、ゼロ動き候補が挿入される。これらの候補は、ゼロの空間変位と、ゼロから始まり、新たなゼロ動き候補がリストに追加される度に増加する参照ピクチャインデックスと、を有する。最後に、これらの候補に対して冗長性検査は行われない。
2.1.3 AMVP
AMVPは、隣接PUとの動きベクトルの空間-時間相関を利用し、それが動きパラメータの明示的伝送に使用される。各参照ピクチャリストに対して、先ず、左上の時間的に隣接するPU位置の利用可能性を検査し、冗長候補を除去し、そして、ゼロベクトルを追加して候補リストを一定長さにすることによって、動きベクトル候補リストが構築される。そして、エンコーダは、候補リストから最良の予測子を選択し、選択した候補を指し示す対応するインデックスを送信することができる。同様に、マージインデックス信号伝達では、最良の動きベクトル候補のインデックスがtruncated unaryを用いて符号化される。この場合に符号化される最大値は2である(図8を参照)。以下のセクションにて、動きベクトル予測候補の導出プロセスの詳細を提供する。
2.1.3.1 AMVP候補の導出
図8は、動きベクトル予測候補に関する導出プロセスをまとめている。
動きベクトル予測では、空間動きベクトル候補及び時間動きベクトル候補の2種類の動きベクトル候補が考慮される。空間動きベクトル候補導出では、図2で示したような5つの異なる位置にある各PUの動きベクトルに基づいて、最終的に2つの動きベクトル候補が導出される。
時間動きベクトル候補導出では、2つの異なるコロケート位置に基づいて導出されるものである2つの候補から、1つの動きベクトル候補が選択される。空間-時間候補の第1のリストが作成された後、リスト内の重複した動きベクトル候補が除去される。可能性ある候補の数が2よりも多い場合、関連する参照ピクチャリスト内でその参照ピクチャインデックスが1よりも大きい動きベクトル候補がリストから削除される。空間-時間動きベクトル候補の数が2より少ない場合、追加のゼロ動きベクトル候補がリストに追加される。
2.1.3.2 空間動きベクトル候補
空間動きベクトル候補の導出においては、図2で示したような位置にあるPUから導出されるものである5つの可能性ある候補の中の最大2つの候補が考慮され、それらの位置は動きマージの位置と同じである。現在PUの左側についての導出の順序が、A、A、及びスケーリングされたA、スケーリングされたAとして定められる。現在PUの上側についての導出の順序が、B、B、B、スケーリングされたB、スケーリングされたB、スケーリングされたBとして定められる。従って、各側について、動きベクトル候補として使用され得る4つのケースが存在し、2つのケースは空間スケーリングを使用する必要がなく、2つのケースでは空間スケーリングが使用される。それら4つの異なるケースは、以下のようにまとめられる:
・ 空間スケーリングなし
- (1)同一参照ピクチャリスト、且つ同一参照ピクチャインデックス(同一POC)
- (2)異なる参照ピクチャリスト、しかし、同一参照ピクチャ(同一POC)
・ 空間スケーリング
- (3)同一参照ピクチャリスト、しかし、異なる参照ピクチャ(異なるPOC)
- (4)異なる参照ピクチャリスト、且つ異なる参照ピクチャ(異なるPOC)。
空間スケーリングなしのケースが最初に検査され、空間スケーリングが続く。空間スケーリングは、参照ピクチャリストにかかわらず、隣接PUの参照ピクチャと現在PUの参照ピクチャとの間でPOCが異なる場合に考慮される。左候補の全てのPUが利用可能でない又はイントラ符号化される場合、左及び上のMV候補の並列導出を助けるために、上の動きベクトルに対するスケーリングが可能にされる。それ以外の場合には、上の動きベクトルに対して空間スケーリングは可能にされない。
空間スケーリングプロセスでは、図9として示すように、隣接PUの動きベクトルが、時間スケーリングに関してと同様のやり方でスケーリングされる。主な違いは、参照ピクチャリスト及び現在PUのインデックスが入力として与えられることであり、実際のスケーリングプロセスは時間スケーリングのそれと同じである。
2.1.3.3 時間動きベクトル候補
参照ピクチャインデックスの導出は別にして、時間マージ候補の導出のための全てのプロセスは、空間動きベクトル候補の導出に関してと同じである(図6を参照)。参照ピクチャインデックスがデコーダに信号伝達される。
2.2 VVCにおけるインター予測方法
例えば、MVDを信号伝達するための適応動きベクトル差レゾリューション(Adaptive Motion Vector difference Resolution;AMVR)、動きベクトル差付きマージ(Merge with Motion Vector Differences;MMVD)、三角予測モード(Triangular prediction mode;TPM)、結合インター-イントラモード(Combined intra-inter prediction;CIIP)アドバンストTMVP(ATMVP、SbTMVPとしても知られる)、アフィン予測モード、一般化双予測(Generalized Bi-Prediction;GBI)、デコーダ側動きベクトル精緻化(Decoder-side Motion Vector Refinement;DMVR)、及び双方向オプティカルフロー(Bi-directional Optical flow;BIO、BDOFとしても知られる)などの、インター予測改良のための新たな符号化ツールが幾つか存在する。
3つの異なるマージリスト構築プロセスがVVCでサポートされる:
1)サブブロックマージ候補リスト:これは、ATMVP候補及びアフィンマージ候補を含む。1つのマージリスト構築プロセスが、アフィンモード及びATMVPモードの双方で共有される。ここで、ATMVP候補及びアフィンマージ候補が順に追加され得る。サブブロックマージリストサイズはスライスヘッダ内で信号伝達され、最大値は5である;
2)通常マージリスト:インター符号化ブロックでは、1つのマージリスト構築プロセスが共有される。ここで、空間/時間マージ候補、HMVP、ペアワイズマージ候補、及びゼロ動き候補が、順に挿入され得る。通常マージリストサイズはスライスヘッダ内で信号伝達され、最大値は6である。MMVD、TPM、CIIPは、通常マージリストを当てにする;
3)IBCマージリスト:これは、通常マージリストと同様のやり方で行われる。
同様に、3つのAMVPリストがVVCでサポートされる:
1)アフィンAMVP候補リスト;
2)通常AMVP候補リスト;
3)IBC AMVP候補リスト:JVET-N0843の採用によりIBCマージリストと同じ構築プロセス。
2.2.1 VVCにおける符号化ブロック構造
VVCでは、ピクチャを正方形又は長方形のブロックに分割するために、四分木/二分木/三分木(Quad-Tree/Binary-Tree/Ternary-Tree;QT/BT/TT)構造が採用されている。
QT/BT/TTの他に、VVCではIフレーム用に別個のツリー(デュアル符号化ツリーとしても知られる)も採用されている。別個のツリーでは、ルマコンポーネントとクロマコンポーネントとについて別々に符号化ブロック構造が信号伝達される。
さらに、2~3の特定の符号化方法で符号化されるブロックを除いて(例えば、PUがTUに等しいがCUよりも小さいものであるイントラサブパーティション予測、及びPUはCUに等しいがTUはPUよりも小さいものである、インター符号化ブロックに対するサブブロック変換など)、CUはPU及びTUに等しく設定される。
2.2.2 アフィン予測モード
HEVCでは、動き補償予測(motion compensation prediction;MCP)に並進動きモデルのみが適用されている。一方、現実世界では、例えばズームイン/アウト、回転、遠近動作、及び他の不規則な動きといった、多くの種類の動きが存在する。VVCでは、4パラメータアフィンモデル及び6パラメータアフィンモデルを用いて、簡略化されたアフィン変換動き補償予測が適用されている。図10に示すように、ブロックのアフィン動き場が、4パラメータアフィンモデルでは2つの制御点動きベクトル(CPMV)、そして6パラメータアフィンモデルでは3つのCPMVによって記述される。
ブロックの動きベクトル場(motion vector field;MVF)は、4パラメータアフィンモデル(4つのパラメータが変数a、b、e及びfとして規定される)では式(1)、そして6パラメータアフィンモデル(6つのパラメータが変数a、b、c、d、e及びfとして規定される)では式(2)の次式:
Figure 2024008948000003
によって記述され、ここで、(mv ,mv )は、左上角の制御点の動きベクトルであり、(mv ,mv )は、右上角の制御点の動きベクトルであり、(mv ,mv )は左下角の制御点の動きベクトルであり、これら3つの動きベクトルの全てを制御点動きベクトル(CPMV)と呼び、(x,y)は、現在ブロック内の左上サンプルに対する代表点の座標を表し、(mv(x,y),mv(x,y))は、(x,y)にあるサンプルに関して導出される動きベクトルである。CP動きベクトルは、(アフィンAMVPモードにおいてのように)信号伝達されるか、あるいは、(アフィンマージモードにおいてのように)オンザフライで導出されるかし得る。w及びhは、現在ブロックの幅及び高さである。実際には、除算は、丸め演算を用いた右シフトによって実行される。VTMでは、代表点は、サブブロックの中心位置であると定められ、例えば、現在ブロック内の左上のサンプルに対するサブブロックの左上角の座標が(xs,ys)であるとき、代表点の座標は(xs+2,ys+2)であると定められる。各サブブロック(すなわち、VTMでは4×4)に対して、代表点を使用して、サブブロック全体の動きベクトルを導出する。
動き補償予測を更に単純化するために、サブブロックベースのアフィン変換予測が適用される。各M×Nサブブロック(現行VVCではM及びNはどちらも4に設定される)の動きベクトルを導出するため、図11に示すように、各サブブロックの中心サンプルの動きベクトルが、式(1)及び(2)に従って計算され、1/16の分数精度に丸められる。次いで、1/16ペル用の動き補償補間フィルタを適用して、導出された動きベクトルを有する各サブブロックの予測を生成する。1/16ペル用の補間フィルタはアフィンモードによって導入される。
MCPの後、各サブブロックの高精度動きベクトルが丸められ、通常動きベクトルと同じ精度で保存される。
2.2.3 ブロック全体に対するマージ
2.2.3.1 並進通常マージモードのマージリスト構築
2.2.3.1.1 履歴ベース動きベクトル予測(HMVP)
マージリスト設計とは異なり、VVCでは、履歴ベース動きベクトル予測(History-based Motion Vector Prediction;HMVP)法が採用されている。
HMVPでは、先行して符号化された動き情報が格納される。先行符号化ブロックの動き情報はHMVP候補として定義される。複数のHMVP候補が、HMVPテーブルと名付けられたテーブルに格納され、このテーブルが、エンコード/デコードプロセス中にオンザフライで維持管理される。HMVPテーブルは、新たなタイル/LCU行/スライスを符号化/復号し始めるときにエンプティにされる。インター符号化ブロック及び非サブブロックの非TPMモードがあるとき常に、関連する動き情報が、新たなHMVP候補としてテーブルの最後のエントリに追加される。全体の符号化フローを図12に示す。
2.2.3.1.2 通常マージリスト構築プロセス
通常(regular)マージリスト(並進運動向け)の構築は、以下の一連のステップに従ってまとめることができる:
・ ステップ1:空間候補の導出;
・ ステップ2:HMVP候補の挿入;
・ ステップ3:ペアワイズ平均候補の挿入;
・ ステップ4:デフォルト動き候補。
HMVP候補は、AMVP候補リスト構築プロセス及びマージ候補リスト構築プロセスの両方で使用され得る。図13は、変更マージ候補リスト構築プロセス(ドット付きのボックスを用いて示す)を示している。TMVP候補の挿入後にマージ候補リストが満杯でない場合、HMVPテーブルに格納されたHMVP候補を用いてマージ候補リストを充たし得る。ブロックは通常、動き情報に関して、最も近い隣接ブロックと、より高い相関を持つことを考慮して、テーブル中のHMVP候補がインデックスの降順に挿入される。テーブルの最後のエントリが最初にリストに追加され、最初のエントリが最後に追加される。同様に、冗長性除去がHMVP候補に適用される。利用可能なマージ候補の総数が、信号伝達されることが許されるマージ候補の最大数に達すると、マージ候補リスト構築プロセスは終了される。
なお、全ての空間/時間/HMVP候補が非IBCモードで符号化される。それ以外の場合、それは、通常マージ候補リストに追加されることが許されない。
HMVPテーブルは、最大5つの通常動き候補を含み、それらの各々が唯一無二である。
2.2.3.1.2.1 剪定プロセス
候補は、冗長性検査に使用される対応する候補が同じ動き情報を持たない場合にのみリストに追加される。このような比較プロセスを剪定(プルーニング)プロセスと呼ぶ。
空間候補の間での剪定プロセスは、現在ブロックに対するTPMの使用に依存する。
現在ブロックがTPMモードを用いずに符号化されるとき(例えば、通常マージ、MMVD、CIIP)、空間マージ候補に対するHEVC剪定プロセス(すなわち、5剪定)が利用される。
2.2.4 三角予測モード(TPM)
VVCでは、インター予測のために三角パーティションモードがサポートされる。三角パーティションモードは、8×8以上であり且つMMVD又はCIIPモードではなくマージモードで符号化されるCUのみに適用される。これらの条件を満たすCUについて、三角パーティションモードが適用されるか否かを指し示すためにCUレベルのフラグが信号伝達される。
このモードが使用される場合、CUは、図14に示すように、対角スプリット又は逆対角スプリットのいずれかを用いて、2つの三角形のパーティションに等分される。CU内の各三角パーティションが、それ自身の動きを用いてインター予測され、各パーティションに対して片予測のみが許され、すなわち、各パーティションが、1つの動きベクトル及び1つの参照インデックスを有する。この片予測動き制約は、各CUに対して2つの動き補償予測のみが必要でされる従来の双予測と同じであることを確保するために適用される。
現在CUが三角パーティションモードを使用して符号化されることをCUレベルフラグが指し示す場合、三角パーティションの方向(対角又は逆対角)を指し示すフラグ、及び2つのマージインデックス(各パーティションに対して1つ)が更に信号伝達される。三角パーティションの各々を予測した後、対角エッジ又は逆対角エッジに沿ったサンプル値が、適応重みを用いた混合処理を用いて調節される。これは、CU全体に関する予測信号であり、変換及び量子化プロセスは、他の予測モードにおいてのようにCU全体に適用される。最後に、三角パーティションモードを用いて予測されたCUの動き場が4×4単位で格納される。
通常マージ候補リストは、追加の動きベクトル剪定なしで三角パーティションマージ予測のために再利用される。通常マージ候補リスト内の各マージ候補に対して、そのL0又はL1動きベクトルの一方且つそれのみが三角予測に使用される。加えて、L0対L1で動きベクトルを選択する順序は、そのマージインデックスパリティに基づく。このスキームを用いて、通常マージリストを直接的に使用することができる。
2.2.4.1 TPM向けのマージリスト構築プロセス
基本的に、JVET-N0340で提案されるように通常マージリスト構築プロセスが適用される。しかし、いくらかの変更が加えられる。
具体的には、以下が適用される:
1)剪定プロセスをどのように行うかは、現在ブロックに対するTPMの使用に依存し、
- 現在ブロックがTPMで符号化されない場合、空間マージ候補に適用されるHEVC 5剪定が呼び出される;
- そうでない場合(現在ブロックがTPMで符号化される場合)、新たな空間マージ候補を追加する時に完全剪定が適用される。すなわち、B1がA1と比較され、B0がA1及びB1と比較され、A0がA1、B1及びB0と比較され、そして、B2がA1、B1、A0及びB0と比較される;
2)B2からの動き情報を検査すべきかについての条件は、現在ブロックに対するTPMの使用に依存し、
- 現在ブロックがTPMで符号化されない場合、B2を検査する前に4つ未満の空間マージ候補しか存在しない場合にのみ、B2がアクセスされて検査される;
- そうでない場合(現在ブロックがTPMで符号化される場合)、B2を追加する前に利用可能な空間マージ候補が何個あるかに関係なく、B2は常にアクセスされて検査される。
2.2.4.2 適応重み付けプロセス
各三角予測ユニットを予測した後、CU全体についての最終的な予測を導出するために、2つの三角予測ユニット間の対角線エッジに適応重み付けプロセスが適用される。2つの重み付け係数グループが、以下のように定義される:
・ 第1重み付け係数グループ:輝度サンプル及び色度サンプルに対して、それぞれ、{7/8,6/8,4/8,2/8,1/8}及び{7/8,4/8,1/8}が使用される;
・ 第2重み付け係数グループ:輝度サンプル及び色度サンプルに対して、それぞれ、{7/8,6/8,5/8,4/8,3/8,2/8,1/8}及び{6/8,4/8,2/8}が使用される。
重み付け係数グループは、2つの三角予測ユニットの動きベクトルの比較に基づいて選択される。第2重み付け係数グループは、以下の条件のうちのいずれか1つが真である場合に使用される:
- 2つの三角予測ユニットの参照ピクチャが互いに異なる;
- 2つの動きベクトルの水平値の差の絶対値が16ピクセルよりも大きい;
- 2つの動きベクトルの垂直値の差の絶対値が16ピクセルよりも大きい。
それ以外の場合、第1重み付け係数グループが使用される。一例を図15に示す。
2.2.4.3 動きベクトルストレージ
三角予測ユニットの動きベクトル(図16のMv1及びMv2)は、4×4グリッドに格納される。各4×4グリッドについて、CU内での該4×4グリッドの位置に応じて、片予測又は双予測のいずれかの動きベクトルが格納される。図16に示すように、非加重領域に位置する(すなわち、対角エッジに位置しない)4×4グリッドに対しては、Mv1又はMv2のいずれかである片予測動きベクトルが格納される。一方で、加重領域に位置する4×4グリッドに対しては、双予測動きベクトルが格納される。双予測動きベクトルは、以下のルールに従ってMv1及びMv2から導出される:
1)Mv1及びMv2が相異なる方向(L0又はL1)からの動きベクトルを持つ場合、Mv1とMv2とを単純に結合して双予測動きベクトルを形成する;
2)Mv1及びMv2の両方が同じL0(又はL1)方向からである場合、
- Mv2の参照ピクチャがL1(又はL0)参照ピクチャリスト内のピクチャと同じである場合、Mv2がそのピクチャにスケーリングされる。Mv1とスケーリングされたMv2とを結合して双予測動きベクトルを形成する;
- Mv1の参照ピクチャがL1(又はL0)参照ピクチャリスト内のピクチャと同じである場合、Mv1がそのピクチャにスケーリングされる。スケーリングされたMv1とMv2とを結合して双予測動きベクトルを形成する;
- それ以外の場合、加重領域に対してMv1のみが格納される。
2.2.4.4 マージモード向けの構文テーブル、セマンティクス、及び復号プロセス
Figure 2024008948000004
Figure 2024008948000005
Figure 2024008948000006
7.4.6.1 一般スライスヘッダセマンティクス
six_minus_max_num_merge_candは、スライス内でサポートされるマージ動きベクトル予測(MVP)候補の最大数を6から差し引いたものを規定する。マージMVP候補の最大スMaxNumMergeCandは、次のように導出される:
MaxNumMergeCand=6-six_minus_max_num_merge_cand (7-57)
MaxNumMergeCandの値は、両端を含めて1から6の範囲内とする。
five_minus_max_num_subblock_merge_candは、スライス内でサポートされるサブブロックベースマージ動きベクトル予測(MVP)候補の最大数を5から差し引いたものを規定する。five_minus_max_num_subblock_merge_candが存在しないとき、それは、5-sps_sbtmvp_enabled_flagに等しいと推定される。サブブロックベースマージMVP候補の最大数MaxNumSubblockMergeCandは、次のように導出される:
MaxNumSubblockMergeCand=5-five_minus_max_num_subblock_merge_cand (7-58)
MaxNumSubblockMergeCandの値は、両端を含めて1から5
の範囲内とする。
7.4.8.5 符号化ユニットセマンティクス
0に等しいpred_mode_flagは、現在符号化ユニットがインター予測モードで符号化されることを規定する。1に等しいpred_mode_flagは、現在符号化ユニットがイントラ予測モードで符号化されることを規定する。
pred_mode_flagが存在しないとき、それは次のように推定される:
- cbWidthが4に等しく且つcbHeightが4に等しい場合、pred_mode_flagは1に等しいと推定される;
- それ以外の場合、pred_mode_flagは、Iスライスを復号するときは1に等しく、P又はBスライスを復号するときは0に等しいと推測される。
変数CuPredMode[x][y]は、x=x0..x0+cbWidth-1及びy=y0..y0+cbHeight-1に対して、次のように導出される:
- pred_mode_flagが0に等しい場合、CuPredMode[x][y]はMODE_INTERに等しく設定される;
- それ以外の場合(pred_mode_flagが1に等しい)、CuPredMode[x][y]はMODE_INTRAに等しく設定される。
1に等しいpred_mode_ibc_flagは、現在符号化ユニットがIBC予測モードで符号化されることを規定する。0に等しいpred_mode_ibc_flagは、現在符号化ユニットがIBC予測モードで符号化されないことを規定する。
pred_mode_ibc_flagが存在しないとき、それは次のように推定される:
- cu_skip_flag[x0][y0]が1に等しく、cbWidthが4に等しく、且つcbHeightが4に等しい場合、pred_mode_ibc_flagは1に等しいと推定される;
- そうでなく、cbWidth及びcbHeightの両方が128に等しい場合、pred_mode_ibc_flagは0に等しいと推定される;
- それ以外の場合、pred_mode_ibc_flagは、Iスライスを復号するときはsps_ibc_enabled_flagの値に等しいと推測され、P又はBスライスを復号するときは0に等しいと推測される。
pred_mode_ibc_flagが1に等しいとき、変数CuPredMode[x][y]は、x=x0..x0+cbWidth-1及びy=y0..y0+cbHeight-1に対して、MODE_IBCに等しいように設定される。
general_merge_flag[x0][y0]は、現在符号化ユニットに関するインター予測パラメータが隣接インター予測パーティションから推測されるかを規定する。配列インデックスx0、y0は、検討される符号化ブロックの左上ルマサンプルの位置(x0,y0)を、ピクチャの左上ルマサンプルに対して規定する。
general_merge_flag[x0][y0]が存在しないとき、それは次のように推定される:
- cu_skip_flag[x0][y0]が1に等しい場合、general_merge_flag[x0][y0]は1に等しいと推定される;
- それ以外の場合、general_merge_flag[x0][y0]は0に等しいと推定される。
mvp_l0_flag[x0][y0]は、リスト0の動きベクトル予測子インデックスを規定し、x0、y0は、検討される符号化ブロックの左上ルマサンプルの位置(x0,y0)を、ピクチャの左上ルマサンプルに対して規定する。mvp_l0_flag[x0][y0]が存在しないとき、それは0に等しいと推定される。
mvp_l1_flag[x0][y0]は、l0及びリスト0をそれぞれl1及びリスト1に置き換えて、mvp_l0_flagと同じ意味を持つ。
inter_pred_idc[x0][y0]は、表7-10に従って、現在符号化ユニットにリスト0が使用されるのか、リスト1が使用されるのか、それとも双予測が使用されるのかを規定する。配列インデックスx0、y0は、検討される符号化ブロックの左上ルマサンプルの位置(x0,y0)を、ピクチャの左上ルマサンプルに対して規定する。
Figure 2024008948000007
inter_pred_idc[x0][y0]が存在しないとき、それはPRED_L0に等しいと推定される。
7.4.8.7 マージデータセマンティクス
1に等しいregular_merge_flag[x0][y0]は、現在符号化ユニットのインター予測パラメータを生成するために通常マージモードが使用されることを規定する。配列インデックスx0、y0は、検討される符号化ブロックの左上ルマサンプルの位置(x0,y0)を、ピクチャの左上ルマサンプルに対して規定する。
regular_merge_flag[x0][y0]が存在しないとき、それは次のように推定される:
- 以下の全ての条件が真である場合、regular_merge_flag[x0][y0]は1に等しいと推定される:
- sps_mmvd_enabled_flagが0に等しい;
- general_merge_flag[x0][y0]が1に等しい;
- cbWidth*cbHeightが32に等しい;
- それ以外の場合、regular_merge_flag[x0][y0]は0に等しいと推定される。
1に等しいmmvd_merge_flag[x0][y0]は、現在符号化ユニットのインター予測パラメータを生成するために動きベクトル差付きマージモードが使用されることを規定する。配列インデックスx0、y0は、検討される符号化ブロックの左上ルマサンプルの位置(x0,y0)を、ピクチャの左上ルマサンプルに対して規定する。
mmvd_merge_flag[x0][y0]が存在しないとき、それは次のように推定される:
- 以下の全ての条件が真である場合、mmvd_merge_flag[x0][y0]は1に等しいと推定される:
- sps_mmvd_enabled_flagが1に等しい;
- general_merge_flag[x0][y0]が1に等しい;
- cbWidth*cbHeightが32に等しい;
- regular_merge_flag[x0][y0]が0に等しい;
- それ以外の場合、mmvd_merge_flag[x0][y0]は0に等しいと推定される。
mmvd_cand_flag[x0][y0]は、mmvd_distance_idx[x0][y0]及びmmvd_direction_idx[x0][y0]から導出される動きベクトル差とともに、マージ候補リスト内の最初の候補(0)が使用されるのか、それとも2番目の候補(1)が使用されるのかを規定する。配列インデックスx0、y0は、検討される符号化ブロックの左上ルマサンプルの位置(x0,y0)を、ピクチャの左上ルマサンプルに対して規定する。mmvd_cand_flag[x0][y0]が存在しないとき、それは0に等しいと推定される。
mmvd_distance_idx[x0][y0]は、表7-12に規定されるように、MmvdDistance[x0][y0]を導出するのに使用されるインデックスを規定する。配列インデックスx0、y0は、検討される符号化ブロックの左上ルマサンプルの位置(x0,y0)を、ピクチャの左上ルマサンプルに対して規定する。
Figure 2024008948000008
mmvd_direction_idx[x0][y0]は、表7-13に規定されるように、MmvdSign[x0][y0]を導出するのに使用されるインデックスを規定する。配列インデックスx0、y0は、検討される符号化ブロックの左上ルマサンプルの位置(x0,y0)を、ピクチャの左上ルマサンプルに対して規定する。
Figure 2024008948000009
マージ+MVDオフセットMmvdOffset[x0][y0]の両方のコンポーネントが、次のように導出される:
MmvdOffset[x0][y0][0]=(MmvdDistance[x0][y0]<<2)*MmvdSign[x0][y0][0]
(7-124)
MmvdOffset[x0][y0][1]=(MmvdDistance[x0][y0]<<2)*MmvdSign[x0][y0][1]
(7-125)
merge_subblock_flag[x0][y0]は、現在符号化ユニットに関するサブブロックベースインター予測パラメータが隣接ブロックから推定されるかを規定する。配列インデックスx0、y0は、検討される符号化ブロックの左上ルマサンプルの位置(x0,y0)を、ピクチャの左上ルマサンプルに対して規定する。merge_subblock_flag[x0][y0]が存在しないとき、それは0に等しいと推定される。
merge_subblock_idx[x0][y0]は、サブブロックベースマージ候補リストのマージ候補インデックスを規定し、x0、y0は、検討される符号化ブロックの左上ルマサンプルの位置(x0,y0)を、ピクチャの左上ルマサンプルに対して規定する。merge_subblock_idx[x0][y0]が存在しないとき、それは0に等しいと推定される。
ciip_flag[x0][y0]は、現在符号化ユニットに結合インターピクチャマージ・イントラピクチャ予測が適用されるかを規定する。配列インデックスx0、y0は、検討される符号化ブロックの左上ルマサンプルの位置(x0,y0)を、ピクチャの左上ルマサンプルに対して規定する。ciip_flag[x0][y0]が存在しないとき、それは0に等しいと推定される。
ciip_flag[x0][y0]が1に等しいとき、x=xCb..xCb+cbWidth-1及びy=yCb..yCb+cbHeight-1での変数IntraPredModeY[x][y]が、INTRA_PLANARに等しいように設定される
現在符号化ユニットの予測サンプルを生成するために三角形の形状に基づく動き補償が使用されるかを規定するものである変数MergeTriangleFlag[x0][y0]が、Bスライスを復号するときに、次のように導出される:
- 以下の全ての条件が満たされる場合、MergeTriangleFlag[x0][y0]は1に等しく設定される:
- sps_triangle_enabled_flagが1に等しい;
- slice_typeがBに等しい;
- general_merge_flag[x0][y0]が1に等しい;
- MaxNumTriangleMergeCandが2以上である;
- cbWidth*cbHeightが64以上である;
- regular_merge_flag[x0][y0]が0に等しい;
- mmvd_merge_flag[x0][y0]が0に等しい;
- merge_subblock_flag[x0][y0]が0に等しい;
- cip_flag[x0][y0]が0に等しい;
- それ以外の場合、MergeTriangleFlag[x0][y0]は0に等しく設定される。
merge_triangle_split_dir[x0][y0]は、マージ三角モードの分割方向を規定する。配列インデックスx0、y0は、検討される符号化ブロックの左上ルマサンプルの位置(x0,y0)を、ピクチャの左上ルマサンプルに対して規定する。merge_triangle_split_dir[x0][y0]が存在しないとき、それは0に等しいと推定される。
merge_triangle_idx0[x0][y0]は、三角形の形状に基づく動き補償候補リストの最初のマージ候補インデックスを規定し、x0、y0は、検討される符号化ブロックの左上ルマサンプルの位置(x0,y0)を、ピクチャの左上ルマサンプルに対して規定する。merge_triangle_idx0[x0][y0]が存在しないとき、それは0に等しいと推定される。
merge_triangle_idx1[x0][y0]は、三角形の形状に基づく動き補償候補リストの2番目のマージ候補インデックスを規定し、x0、y0は、検討される符号化ブロックの左上ルマサンプルの位置(x0,y0)を、ピクチャの左上ルマサンプルに対して規定する。merge_triangle_idx1[x0][y0]が存在しないとき、それは0に等しいと推定される。
merge_idx[x0][y0]は、マージ候補リストのマージ候補インデックスを規定し、x0、y0は、検討される符号化ブロックの左上ルマサンプルの位置(x0,y0)を、ピクチャの左上ルマサンプルに対して規定する。
merge_idx[x0][y0]が存在しないとき、それは次のように推定される:
- mmvd_merge_flag[x0][y0]が1に等しい場合、merge_idx[x0][y0]は、mmvd_cand_flag[x0][y0]に等しいと推定される;
- それ以外の場合(mmvd_merge_flag[x0][y0]が0に等しい)、merge_idx[x0][y0]は0に等しいと推定される。
2.2.4.4.1 復号プロセス
JVET-N0340にて提供される復号プロセスは、以下のように定められている。
8.5.2.2 マージモード向けのルマ動きベクトルの導出プロセス
このプロセスは、general_merge_flag[xCb][yCb]が1に等しいときにのみ呼び出され、(xCb,yCb)は、現在ルマ符号化ブロックの左上サンプルを、現在ピクチャの左上ルマサンプルに対して規定する。
このプロセスへの入力は以下である:
- 現在ピクチャの左上ルマサンプルに対する現在ルマ符号化ブロックの左上サンプルのルマ位置(xCb,yCb);
- ルマサンプル内の現在符号化ブロックの幅を規定する変数cbWidth;
- ルマサンプル内の現在符号化ブロックの高さを規定する変数cbHeight。
このプロセスの出力は以下である:
- 1/16分数サンプル精度でのルマ動きベクトルmvL0[0][0]及びmvL1[0][0];
- 参照インデックスrefIdxL0及びrefIdxL1;
- 予測リスト利用フラグpredFlagL0[0][0]及びpredFlagL1[0][0];
- 双予測重みインデックスbcwIdx;
- マージ候補リストmergeCandList。
双予測重みインデックスbcwIdxは0に等しく設定される。
動きベクトルmvL0[0][0]及びmvL1[0][0]、参照インデックスrefIdxL0及びrefIdxL1、並びに予測利用フラグpredFlagL0[0][0]及びpredFlagL1[0][0]は、以下の順序付けられたステップによって導出される:
1. 第8.5.2.3項に規定される隣接符号化ユニットからの空間マージ候補の導出プロセスが、ルマ符号化ブロック位置(xCb,yCb)、ルマ符号化ブロック幅cbWidth、ルマ符号化ブロック高さcbHeightを入力として呼び出され、その出力は、Xが0又は1での、利用可能性フラグavailableFlagA0、availableFlagA1、availableFlagB0、availableFlagB1、及びavailableFlagB2、参照インデックスrefIdxLXA0、refIdxLXA1、refIdxLXB0、refIdxLXB1、及びrefIdxLXB2、予測リスト利用フラグpredFlagLXA0、predFlagLXA1、predFlagLXB0、predFlagLXB1、及びpredFlagLXB2、並びに動きベクトルmvLXA0、mvLXA1、mvLXB0、mvLXB1、及びmvLXB2と、双予測重みインデックスbcwIdxA0、bcwIdxA1、bcwIdxB0、bcwIdxB1、bcwIdxB2である;
2. Xが0又は1での参照インデックスrefIdxLXCol、及び時間マージ候補Colに対する双予測重みインデックスbcwIdxColが、0に等しく設定される;
3. 第8.5.2.11項に規定される時間ルマ動きベクトル予測の導出プロセスが、ルマ位置(xCb,yCb)、ルマ符号化ブロック幅cbWidth、ルマ符号化ブロック高さcbHeight、及び変数refIdxL0Colを入力として呼び出され、その出力は、利用可能性フラグavailableFlagL0Col、及び時間動きベクトルmvL0Colである。変数availableFlagCol、predFlagL0Col及びpredFlagL1Colが次のように導出される:
availableFlagCol=availableFlagL0Col (8-263)
predFlagL0Col=availableFlagL0Col (8-264)
predFlagL1Col=0 (8265)
4. slice_typeがBに等しいとき、第8.5.2.11項に規定される時間ルマ動きベクトル予測の導出プロセスが、ルマ位置(xCb,yCb)、ルマ符号化ブロック幅cbWidth、ルマ符号化ブロック高さcbHeight、及び変数refIdxL1Colを入力として呼び出され、その出力は、利用可能性フラグavailableFlagL1Col、及び時間動きベクトルmvL1Colである。変数availableFlagCol及びpredFlagL1Colが次のように導出される:
availableFlagCol=availableFlagL0Col||availableFlagL1Col (8-266)
predFlagL1Col=availableFlagL1Col (8-267)
5. マージ候補リストmergeCandListが次のように構築される:
i=0
if(availableFlagA1)
mergeCandList[i++]=A1
if(availableFlagB1)
mergeCandList[i++]=B1
if(availableFlagB0)
mergeCandList[i++]=B0 (8-268)
if(availableFlagA0)
mergeCandList[i++]=A0
if(availableFlagB2)
mergeCandList[i++]=B2
if(availableFlagCol)
mergeCandList[i++]=Col
6. 変数numCurrMergeCand及びnumOrigMergeCandが、mergeCandList内のマージ候補の数に等しく設定される;
7. numCurrMergeCandが(MaxNumMergeCand-1)よりも小さく、且つnumHmvpCandが0よりも大きいとき、以下が適用される:
- 第8.5.2.6項に規定される履歴ベースマージ候補の導出プロセスが、mergeCandList及びnumCurrMergeCandを入力とし、変更されたmergeCandList及びnumCurrMergeCandを出力として呼び出される;
- numOrigMergeCandがnumCurrMergeCandに等しく設定される;
8. numCurrMergeCandがMaxNumMergeCandよりも小さく且つ1よりも大きい場合、以下が適用される:
- 第8.5.2.4項に規定されるペアワイズ平均マージ候補の導出プロセスが、mergeCandList、該mergeCandList内の全候補Nの、参照インデックスrefIdxL0N及びrefIdxL1N、予測リスト利用フラグpredFlagL0N及びpredFlagL1N、動きベクトルmvL0N及びmvL1N、並びにnumCurrMergeCandを入力として呼び出され、その出力が、mergeCandList、numCurrMergeCand、mergeCandListに追加される候補avgCandの、参照インデックスrefIdxL0avgCand及びrefIdxL1avgCand、予測リスト利用フラグpredFlagL0avgCand及びpredFlagL1avgCand、並びに動きベクトルmvL0avgCand及びmvL1avgCandに割り当てられる。mergeCandListに追加される候補avgCandの双予測重みインデックスbcwIdxが0に等しく設定される;
- numOrigMergeCandがnumCurrMergeCandに等しく設定される;
9. 第8.5.2.5項に規定されるゼロ動きベクトルマージ候補の導出プロセスが、mergeCandList、該mergeCandList内の全候補Nの、参照インデックスrefIdxL0N及びrefIdxL1N、予測リスト利用フラグpredFlagL0N及びpredFlagL1N、動きベクトルmvL0N及びmvL1N、並びにnumCurrMergeCandを入力として呼び出され、その出力が、mergeCandList、numCurrMergeCand、mergeCandListに追加される全ての新たな候補zeroCandmの、参照インデックスrefIdxL0zeroCandm及びrefIdxL1zeroCandm、予測リスト利用フラグpredFlagL0zeroCandm及びpredFlagL1zeroCandm、並びに動きベクトルmvL0zeroCandm及びmvL1zeroCandmに割り当てられる。mergeCandListに追加される全ての新たな候補zeroCandmの双予測重みインデックスbcwIdxが0に等しく設定される。追加される候補の数numZeroMergeCandは、(numCurrMergeCand-numOrigMergeCand)に等しく設定される。numZeroMergeCandが0よりも大きいとき、mは、両端を含めて0からnumZeroMergeCand-1までの範囲である。
10. Nをマージ候補リストmergeCandList内の位置merge_idx[xCb][yCb]にある候補である(N=mergeCandList[merge_idx[xCb][yCb])の位置の候補とし、Xを0又は1により置き換えて、以下の割り当てが行われる:
refIdxLX=refIdxLXN (8-269)
predFlagLX[0][0]=predFlagLXN (8-270)
mvLX[0][0][0]=mvLXN[0] (8-271)
mvLX[0][0][1]=mvLXN[1] (8-272)
bcwIdx=bcwIdxN (8-273)
11. mmvd_merge_flag[xCb][yCb]が1に等しいとき、以下が適用される:
- 8.5.2.7に規定されるマージ動きベクトル差の導出プロセスが、ルマ位置(xCb,yCb)、参照インデックスrefIdxL0及びrefIdxL1、並びに予測リスト利用フラグpredFlagL0[0][0]及びpredFlagL1[0][0]を入力とし、動きベクトル差mMvdL0及びmMvdL1を出力として呼び出される;
- 0又は1であるXで、次のように、マージ動きベクトルmvLXに動きベクトル差mMvdLXが加えられる:
mvLX[0][0][0]+=mMvdLX[0] (8-274)
mvLX[0][0][1]+=mMvdLX[1] (8-275)
mvLX[0][0][0]=Clip3(-217,217-1,mvLX[0][0][0]) (8-276)
mvLX[0][0][1]=Clip3(-217,217-1,mvLX[0][0][1]) (8-277)
8.5.2.3 空間マージ候補の導出プロセス
このプロセスへの入力は以下である:
- 現在ピクチャの左上ルマサンプルに対する現在ルマ符号化ブロックの左上サンプルのルマ位置(xCb,yCb);
- ルマサンプル内の現在符号化ブロックの幅を規定する変数cbWidth;
- ルマサンプル内の現在符号化ブロックの高さを規定する変数cbHeight。
このプロセスの出力は、0又は1であるXで、以下である:
- 隣接符号化ユニットの利用可能性フラグavailableFlagA0、availableFlagA1、availableFlagB0、availableFlagB1、及びavailableFlagB2
- 隣接符号化ユニットの参照インデックスrefIdxLXA0、refIdxLXA1、refIdxLXB0、refIdxLXB1、及びrefIdxLXB2
- 隣接符号化ユニットの予測リスト利用フラグpredFlagLXA0、predFlagLXA1、predFlagLXB0、predFlagLXB1、及びpredFlagLXB2
- 隣接符号化ユニットの1/16分数サンプル精度での動きベクトルmvLXA0、mvLXA1、mvLXB0、mvLXB1、及びmvLXB2
- 双予測重みインデックスgbiIdxA0、gbiIdxA1、gbiIdxB0、gbiIdxB1、及びgbiIdxB2
availableFlagA1、refIdxLXA1、predFlagLXA1、及びmvLXA1の導出のため、以下が適用される:
- 隣接ルマ符号化ブロックの内側のルマ位置(xNbA1,yNbA1)が(xCb-1,yCb+cbHeight-1)に等しく設定される;
- 第6.4.X項[Ed.(BB):Neighbouring blocks availability checking process tbd]に規定されるブロックの利用可能性導出プロセスが、(xCb,yCb)に等しく設定される現在ルマ位置(xCurr,yCurr)及び隣接ルマ位置(xNbA1,yNbA1)を入力として呼び出され、その出力が、ブロック利用可能性フラグavailableA1に割り当てられる;
- 変数availableFlagA1、refIdxLXA1、predFlagLXA1、及びmvLXA1が、次のように導出される:
- availableA1がFALSEに等しい場合、0又は1であるXで、availableFlagA1が0に等しく設定され、mvLXA1の両方のコンポーネントが0に等しく設定され、refIdxLXA1が-1に等しく設定され、predFlagLXA1が0に等しく設定され、そして、gbiIdxA1が0に等しく設定される;
- それ以外の場合、availableFlagA1は1に等しく設定されて、以下の割り当てが行われる:
mvLXA1=MvLX[xNbA1][yNbA1] (8-294)
refIdxLXA1=RefIdxLX[xNbA1][yNbA1] (8-295)
predFlagLXA1=PredFlagLX[xNbA1][yNbA1] (8-296)
gbiIdxA1=GbiIdx[xNbA1][yNbA1] (8-297)
availableFlagB1、refIdxLXB1、predFlagLXB1、及びmvLXB1の導出のため、以下が適用される:
- 隣接ルマ符号化ブロックの内側のルマ位置(xNbB1,yNbB1)が(xCb+cbWidth-1,yCb-1)に等しく設定される;
- 第6.4.X項[Ed.(BB):Neighbouring blocks availability checking process tbd]に規定されるブロックの利用可能性導出プロセスが、(xCb,yCb)に等しく設定される現在ルマ位置(xCurr,yCurr)及び隣接ルマ位置(xNbB1,yNbB1)を入力として呼び出され、その出力が、ブロック利用可能性フラグavailableB1に割り当てられる;
- 変数availableFlagB1、refIdxLXB1、predFlagLXB1、及びmvLXB1が、次のように導出される:
- 以下の条件のうちの1つ以上が真である場合、0又は1であるXで、availableFlagB1が0に等しく設定され、mvLXB1の両方のコンポーネントが0に等しく設定され、refIdxLXB1が-1に等しく設定され、predFlagLXB1が0に等しく設定され、そして、gbiIdxB1が0に等しく設定される;
- availableB1がFALSEに等しい;
- availableA1がTRUEに等しく、且つルマ位置(xNbA1,yNbA1)及び(xNbB1,yNbB1)が同じ動きベクトル及び同じ参照インデックスを持つ;
- それ以外の場合、availableFlagB1は1に等しく設定されて、以下の割り当てが行われる:
mvLXB1=MvLX[xNbB1][yNbB1] (8-298)
refIdxLXB1=RefIdxLX[xNbB1][yNbB1] (8-299)
predFlagLXB1=PredFlagLX[xNbB1][yNbB1] (8-300)
gbiIdxB1=GbiIdx[xNbB1][yNbB1] (8-301)
availableFlagB0、refIdxLXB0、predFlagLXB0、及びmvLXB0の導出のため、以下が適用される:
- 隣接ルマ符号化ブロックの内側のルマ位置(xNbB0,yNbB0)が(xCb+cbWidth,yCb-1)に等しく設定される;
- 第6.4.X項[Ed.(BB):Neighbouring blocks availability checking process tbd]に規定されるブロックの利用可能性導出プロセスが、(xCb,yCb)に等しく設定される現在ルマ位置(xCurr,yCurr)及び隣接ルマ位置(xNbB0,yNbB0)を入力として呼び出され、その出力が、ブロック利用可能性フラグavailableB0に割り当てられる;
- 変数availableFlagB0、refIdxLXB0、predFlagLXB0、及びmvLXB0が、次のように導出される:
- 以下の条件のうちの1つ以上が真である場合、0又は1であるXで、availableFlagB0が0に等しく設定され、mvLXB0の両方のコンポーネントが0に等しく設定され、refIdxLXB0が-1に等しく設定され、predFlagLXB0が0に等しく設定され、そして、gbiIdxB0が0に等しく設定される;
- availableB0がFALSEに等しい;
- availableB1がTRUEに等しく、且つルマ位置(xNbB1,yNbB1)及び(xNbB0,yNbB0)が同じ動きベクトル及び同じ参照インデックスを持つ;
- availableA1がTRUEに等しく、ルマ位置(xNbA1,yNbA1)及び(xNbB0,yNbB0)が同じ動きベクトル及び同じ参照インデックスを持ち、且つmerge_triangle_flag[xCb][yCb]が1に等しい;
- それ以外の場合、availableFlagB0は1に等しく設定されて、以下の割り当てが行われる:
mvLXB0=MvLX[xNbB0][yNbB0] (8-302)
refIdxLXB0=RefIdxLX[xNbB0][yNbB0] (8-303)
predFlagLXB0=PredFlagLX[xNbB0][yNbB0] (8-304)
gbiIdxB0=GbiIdx[xNbB0][yNbB0] (8-305)
availableFlagA0、refIdxLXA0、predFlagLXA0、及びmvLXA0の導出のため、以下が適用される:
- 隣接ルマ符号化ブロックの内側のルマ位置(xNbA0,yNbA0)が(xCb-1,yCb+cbWidth)に等しく設定される;
- 第6.4.X項[Ed.(BB):Neighbouring blocks availability checking process tbd]に規定されるブロックの利用可能性導出プロセスが、(xCb,yCb)に等しく設定される現在ルマ位置(xCurr,yCurr)及び隣接ルマ位置(xNbA0,yNbA0)を入力として呼び出され、その出力が、ブロック利用可能性フラグavailableA0に割り当てられる;
- 変数availableFlagA0、refIdxLXA0、predFlagLXA0、及びmvLXA0が、次のように導出される:
- 以下の条件のうちの1つ以上が真である場合、0又は1であるXで、availableFlagA0が0に等しく設定され、mvLXA0の両方のコンポーネントが0に等しく設定され、refIdxLXA0が-1に等しく設定され、predFlagLXA0が0に等しく設定され、そして、gbiIdxA0が0に等しく設定される;
- availableA0がFALSEに等しい;
- availableA1がTRUEに等しく、且つルマ位置(xNbA1,yNbA1)及び(xNbA0,yNbA0)が同じ動きベクトル及び同じ参照インデックスを持つ;
- availableB1がTRUEに等しく、ルマ位置(xNbB1,yNbB1)及び(xNbA0,yNbA0)が同じ動きベクトル及び同じ参照インデックスを持ち、且つmerge_triangle_flag[xCb][yCb]が1に等しい;
- availableB0がTRUEに等しく、ルマ位置(xNbB0,yNbB0)及び(xNbA0,yNbA0)が同じ動きベクトル及び同じ参照インデックスを持ち、且つmerge_triangle_flag[xCb][yCb]が1に等しい;
- それ以外の場合、availableFlagA0は1に等しく設定されて、以下の割り当てが行われる:
mvLXA0=MvLX[xNbA0][yNbA0] (8-306)
refIdxLXA0=RefIdxLX[xNbA0][yNbA0] (8-307)
predFlagLXA0=PredFlagLX[xNbA0][yNbA0] (8-308)
gbiIdxA0=GbiIdx[xNbA0][yNbA0] (8-309)
availableFlagB2、refIdxLXB2、predFlagLXB2、及びmvLXB2の導出のため、以下が適用される:
- 隣接ルマ符号化ブロックの内側のルマ位置(xNbB2,yNbB2)が(xCb-1,yCb-1)に等しく設定される;
- 第6.4.X項[Ed.(BB):Neighbouring blocks availability checking process tbd]に規定されるブロックの利用可能性導出プロセスが、(xCb,yCb)に等しく設定される現在ルマ位置(xCurr,yCurr)及び隣接ルマ位置(xNbB2,yNbB2)を入力として呼び出され、その出力が、ブロック利用可能性フラグavailableB2に割り当てられる;
- 変数availableFlagB2、refIdxLXB2、predFlagLXB2、及びmvLXB2が、次のように導出される:
- 以下の条件のうちの1つ以上が真である場合、0又は1であるXで、availableFlagB2が0に等しく設定され、mvLXB2の両方のコンポーネントが0に等しく設定され、refIdxLXB2が-1に等しく設定され、predFlagLXB2が0に等しく設定され、そして、gbiIdxB2が0に等しく設定される;
- availableB2がFALSEに等しい;
- availableA1がTRUEに等しく、且つルマ位置(xNbA1,yNbA1)及び(xNbB2,yNbB2)が同じ動きベクトル及び同じ参照インデックスを持つ;
- availableB1がTRUEに等しく、且つルマ位置(xNbB1,yNbB1)及び(xNbB2,yNbB2)が同じ動きベクトル及び同じ参照インデックスを持つ;
- availableB0がTRUEに等しく、ルマ位置(xNbB0,yNbB0)及び(xNbB2,yNbB2)が同じ動きベクトル及び同じ参照インデックスを持ち、且つmerge_triangle_flag[xCb][yCb]が1に等しい;
- availableA0がTRUEに等しく、ルマ位置(xNbA0,yNbA0)及び(xNbB2,yNbB2)が同じ動きベクトル及び同じ参照インデックスを持ち、且つmerge_triangle_flag[xCb][yCb]が1に等しい;
- availableFlagA0+availableFlagA1+availableFlagB0+availableFlagB1が4に等しく、且つmerge_triangle_flag[xCb][yCb]が0に等しい;
- それ以外の場合、availableFlagB2は1に等しく設定されて、以下の割り当てが行われる:
mvLXB2=MvLX[xNbB2][yNbB2] (8-310)
refIdxLXB2=RefIdxLX[xNbB2][yNbB2] (8-311)
predFlagLXB2=PredFlagLX[xNbB2][yNbB2] (8-312)
gbiIdxB2=GbiIdx[xNbB2][yNbB2] (8-313)
2.2.5 MMVD
JVET-L0054では、最終動きベクトル表現(UMVE、これはMMVDとしても知られる)が提示されている。UMVEは、提案する動きベクトル表現法とともにスキップモード又はマージモードのいずれかに使用される。
UMVEは、VVCにおける通常のマージ候補リストに含まれるものと同じマージ候補を再利用する。マージ候補の中で、ベース候補を選択することができ、それが、提案する動きベクトル表現法によって更に拡張される。
UMVEは、開始点と、動きの大きさと、動きの方向とを用いてMVDを表現する新たな動きベクトル差(MVD)表現法を提供する。
この提案する技術は、マージ候補リストをそのまま使用する。しかし、デフォルトのマージタイプ(MRG_TYPE_DEFAULT_N)の候補だけがUMVE拡張に関して検討される。
ベース候補インデックスが開始点を規定する。ベース候補インデックスは、次のとおり、リスト内の候補の中で最良の候補を指し示す。
Figure 2024008948000010
ベース候補の数が1に等しい場合、ベース候補IDXは信号伝達されない。
距離インデックスは、動きの大きさの情報である。距離インデックスは、開始点情報からの予め定められた距離を指し示す。予め定められた距離は次のとおりである。
Figure 2024008948000011
方向インデックスは、開始点に対するMVDの方向を表す。方向インデックスは、下に示す4つの方向を表すことができる。
Figure 2024008948000012
UMVEフラグは、スキップフラグ又はマージフラグを送信した直後に送信される。スキップフラグ又はマージフラグが真である場合、UMVEフラグが構文解析される。UMVEフラグが1に等しい場合、UMVE構文が構文解析される。しかし、1でない場合には、AFFINEフラグが構文解析される。AFFINEフラグが1に等しい場合、それはAFFINEモードである。しかし、1でない場合には、スキップ/マージインデックスがVTMのスキップ/マージモードのために構文解析される。
UMVE候補のための追加のラインバッファは必要でない。ソフトウェアのスキップ/マージ候補が直接的にベース候補として使用されるからである。入力UMVEインデックスを用いて、動き補償の直前にMVの補充が決定される。このために長いラインバッファを保持する必要はない。
現行の一般的なテスト条件では、マージ候補リスト内の最初のマージ候補又は2番目のマージ候補のいずれかがベース候補として選択され得る。
UMVEは、MV差付きマージ(Merge with MV Differences;MMVD)としても知られている。
2.2.6 結合イントラ-インター予測(CIIP)
JVET-L0100にて多重仮説(multi-hypothesis)予測が提案されており、それにおいては、結合イントラ・インター予測が、複数の仮説を生成するための1つの手法である。
イントラモードを改善するために多重仮説予測が適用される場合、多重仮説予測は、1つのイントラ予測と1つのマージインデックス予測とを組み合わせる。マージCU内で、マージモードに関して1つのフラグが信号伝達され、該フラグが真である場合にイントラ候補リストからイントラモードが選択される。ルマコンポーネントに対して、イントラ候補リストは、1つのイントラ予測モード、すなわち、プレーナモードのみから導出される。イントラ及びインター予測からの予測ブロックに適用される重みは、2つの隣接ブロック(A1及びB1)の符号化モード(イントラ又は非イントラ)によって決定される。
2.2.7 サブブロックベース技術でのマージ
全てのサブブロック関係の動き候補を、非サブブロックマージ候補用の通常マージリストに加えての別個のマージリストに入れることが提案される。
サブブロック関係の動き候補は、‘サブブロックマージ候補リスト’という名の別個のマージリストに入れられる。
一例において、サブブロックマージ候補リストは、ATMVP候補及びアフィンマージ候補を含む。
サブブロックマージ候補リストは、次の順に候補で充たされる:
a. ATMVP候補(利用可能であることもあればないこともある);
b. アフィンマージリスト(継承アフィン候補及び構築アフィン候補を含む);
c. ゼロMV 4パラメータアフィンモデルとしてのパディング。
2.2.7.1.1 ATMVP(サブブロック時間動きベクトル予測子SbTMVPとしても知られる)
ATMVPの基本アイディアは、1つのブロックに対して複数セットの時間動きベクトル予測子を導出するというものである。各サブブロックに一組の動き情報が割り当てられる。ATMVPマージ候補が生成されるとき、全体ブロックレベルではなく、8×8レベルで動き補償が行われる。
現行設計では、ATMVPは、CU内のサブCUの動きベクトルを、以下の2つのサブセクション2.2.7.1.1.1及び2.2.7.1.1.2にそれぞれ記載する2つのステップで予測する。
2.2.7.1.1.1 初期化動きベクトルの導出
初期化動きベクトルをtempMvにより表記する。ブロックA1が利用可能であり且つ非イントラ符号化されるとき(すなわち、インターモード又はIBCモードで符号化される)、初期化動きベクトルを導出するために、以下が適用される:
- 以下の条件の全てが真である場合、tempMvは、mvL1A1により表記されるリスト1のブロックA1の動きベクトルに等しく設定される:
- リスト1の参照ピクチャインデックスが利用可能であり(-1に等しくない)、且つそれがコロケートピクチャと同じPOC値を持つ(すなわち、DiffPicOrderCnt(ColPic,RefPicList[1][refIdxL1A1])が0に等しい);
- 全ての参照ピクチャが現在ピクチャと比較して大きいPOCを持たない(すなわち、現在スライスの全ての参照ピクチャリスト内の全てのピクチャaPicに対して、DiffPicOrderCnt(aPic,currPic)が0以下である);
- 現在スライスがBスライスに等しい;
- collocated_from_l0_flagが0に等しい;
- そうでなく、以下の条件の全てが真である場合、tempMvは、mvL0A1により表記されるリスト0のブロックA1の動きベクトルに等しく設定される:
- リスト0の参照ピクチャインデックスが利用可能である(-1に等しくない);
- それが、コロケートピクチャと同じPOC値を持つ(すなわち、DiffPicOrderCnt(ColPic,RefPicList[0][refIdxL0A1])が0に等しい);
- それ以外の場合、ゼロ動きベクトルが初期化MVとして使用される。
対応するブロック(現在ブロックの中心位置に丸められたMVを加え、必要に応じて、ある特定の範囲内となるようにクリッピングされる)が、初期化動きベクトルと共にスライスヘッダ内で信号伝達されるコロケートピクチャ内で特定される。
ブロックがインター符号化される場合、第2ステップに進む。そうでない場合、ATMVP候補はNOT利用可能に設定される。
2.2.7.1.1.2 サブCU動き導出
第2ステップは、現在CUを複数のサブCUに分割し、コロケートピクチャ内の各サブCUに対応するブロックから各サブCUの動き情報を取得するというものである。
サブCUの対応するブロックがインターモードで符号化される場合、この動き情報を利用し、従来のTMVPプロセスでの処理と変わらないコロケートMVに関する導出プロセスを呼び出すことによって、現在サブCUの最終的な動き情報を導出する。基本的に、対応するブロックが片予測又は双予測向けのターゲットリストXから予測される場合は、動きベクトルが利用され、そうでなく、それが片予測又は双予測向けのターゲットリストY(Y=1-X)から予測され、且つNoBackwardPredFlagが1に等しい場合、リストYに関するMVが利用される。それ以外の場合、動き候補は見出されないとし得る。
初期化MV及び現在サブCUの位置によって特定されるコロケートピクチャ内のブロックがイントラ符号化又はIBC符号化されるか、あるいは、前述のように動き候補が見出されないかである場合、以下が更に適用される。
コロケートピクチャRcol内の動き場をフェッチするために使用される動きベクトルをMVcolと表記する。MVスケーリングによる影響を最小化するために、MVcolを導出するのに使用される空間候補リスト内のMVは、次の手法で選択される:候補MVの参照ピクチャがコロケートピクチャである場合、このMVが選択され、如何なるスケーリングもなしでMVcolとして使用される。そうでない場合、コロケートピクチャに最も近い参照ピクチャを有するMVが選択されて、スケーリングを用いてMVcolを導出する。
JVET-N1001におけるコロケート動きベクトル導出プロセスに関係する復号プロセスを、以下、ATMVPに関係する部分を太字の下線付きの斜体フォントで強調して記載する:
8.5.2.12 コロケート動きベクトルの導出プロセス
このプロセスへの入力は以下である:
- 現在符号化ブロックを規定する変数currCb;
- ColPicによって規定されるコロケートピクチャの内側のコロケート符号化ブロックを規定する変数colCb;
- colCbによって規定されるコロケート符号化ブロックの左上サンプルを、ColPicによって規定されるコロケートピクチャの左上ルマサンプルに対して規定するルマ位置(xColCb,yColCb);
- 0又は1であるXでの参照インデックスrefIdxLX;
- サブブロック時間マージ候補を指し示すフラグsbFlag。
このプロセスの出力は以下である:
- 1/16分数サンプル精度での動きベクトル予測mvLXCol;
- 利用可能性フラグavailableFlagLXCol。
変数currPicは現在ピクチャを規定する。
配列predFlagL0Col[x][y]、mvL0Col[x][y]、及びrefIdxL0Col[x][y]が、それぞれ、ColPicによって規定されるコロケートピクチャのPredFlagL0[x][y]、MvDmvrL0[x][y]、及びRefIdxL0[x][y]に等しく設定され、配列predFlagL1Col[x][y]、mvL1Col[x][y]、及びrefIdxL1Col[x][y]が、それぞれ、ColPicによって規定されるコロケートピクチャのPredFlagL1[x][y]、MvDmvrL1[x][y]、及びRefIdxL1[x][y]に等しく設定される。
変数mvLXCol及びavailableFlagLXColが次のように導出される:
- colCbがイントラ又はIBC予測モードで符号化される場合、mvLXColの両方のコンポーネントが0に等しく設定され、availableFlagLXColが0に等しく設定される;
- それ以外の場合、動きベクトルmvCol、参照インデックスrefIdxCol、及び参照リスト識別子listColが、次のように導出される:
- sbFlagが0に等しい場合、availableFlagLXColが1に設定されて、以下が適用される:
- predFlagL0Col[xColCb][yColCb]が0に等しい場合、mvCol、refIdxCol、及びlistColが、それぞれ、mvL1Col[xColCb][yColCb]、refIdxL1Col[xColCb][yColCb]、及びL1に等しく設定される;
- そうでなく、predFlagL0Col[xColCb][yColCb]が1に等しく且つpredFlagL1Col[xColCb][yColCb]が0に等しい場合、mvCol、refIdxCol、及びlistColが、それぞれ、mvL0Col[xColCb][yColCb]、refIdxL0Col[xColCb][yColCb]、及びL0に等しく設定される;
- それ以外の場合(predFlagL0Col[xColCb][yColCb]が1に等しく且つpredFlagL1Col[xColCb][yColCb]が1に等しい)、以下の割り当てが行われる:
- NoBackwardPredFlagが1に等しい場合、mvCol、refIdxCol、及びlistColが、それぞれ、mvLXCol[xColCb][yColCb]、refIdxLXCol[xColCb][yColCb]、及びLXに等しく設定される;
- それ以外の場合、mvCol、refIdxCol、及びlistColが、それぞれ、mvLNCol[xColCb][yColCb]、refIdxLNCol[xColCb][yColCb]、及びLNに等しく設定され、Nはcollocated_from_l0_flagの値である;
(外1)
Figure 2024008948000013
- availableFlagLXColがTRUEに等しいとき、mvLXCol及びavailableFlagLXColが、次のように導出される:
- LongTermRefPic(currPic,currCb,refIdxLX,LX)がLongTermRefPic(ColPic,colCb,refIdxCol,listCol)に等しくない場合、mvLXColの両方のコンポーネントが0に等しく設定され、availableFlagLXColが0に等しく設定される;
- それ以外の場合、変数availableFlagLXColが1に等しく設定され、refPicList[listCol][refIdxCol]が、ColPicによって規定されるコロケートピクチャ内の符号化ブロックcolCbを含むスライスの参照ピクチャリストlistCol内の参照インデックスrefIdxColを有するピクチャであるように設定され、以下が適用される:
colPocDiff=DiffPicOrderCnt(ColPic,refPicList[listCol][refIdxCol])
(8-402)
currPocDiff=DiffPicOrderCnt(currPic,RefPicList[X][refIdxLX])
(8-403)
- 第8.5.2.15節に規定されるコロケート動きベクトルに対する時間動きバッファ圧縮プロセスが、mvColを入力とし、変更されたmvColを出力として呼び出される;
- RefPicList[X][refIdxLX]が長期参照ピクチャである、又はcolPocDiffがcurrPocDiffに等しい場合、mvLXColが、次のように導出される:
mvLXCol=mvCol (8-404)
- それ以外の場合、次のように、mvLXColが、動きベクトルmvColのスケーリングされたバージョンとして導出され:
tx=(16384+(Abs(td)>>1))/td (8-405)
distScaleFactor=Clip3(-4096,4095,(tb*tx+32)>>6) (8-406)
mvLXCol=Clip3(-131072,131071,(distScaleFactor*mvCol+
128-(distScaleFactor*mvCol>=0))>>8)) (8-407)
ここで、td及びtbは、次のように導出される:
td=Clip3(-128,127,colPocDiff) (8-408)
tb=Clip3(-128,127,currPocDiff) (8-409)
2.2.8 通常インターモード(AMVP)
2.2.8.1 AMVP動き候補リスト
HEVCにおけるAMVP設計と同様に、最大2つのAMVP候補が導出され得る。しかしながら、TMVP候補の後にHMVP候補も追加され得る。HMVPテーブル内のHMVP候補は、インデックスの昇順に(すなわち、最も古いものである0に等しいインデックスから)検討される。その参照ピクチャがターゲット参照ピクチャと同じ(すなわち、同じPOC値)であるかを見出すために、最大4つのHMVP候補が検査され得る。
2.2.8.2 AMVR
HEVCでは、スライスヘッダ内でuse_integer_mv_flagが0に等しい場合に、(動きベクトルとPUの予測動きベクトルとの間の)動きベクトル差(MVD)が、1/4ルマサンプルの単位で信号伝達される。VVCでは、局所適応動きベクトルレゾリューション(locally adaptive motion vector resolution;AMVR)が導入されている。VVCにおいて、MVDは、1/4ルマサンプル、整数ルマサンプル、4ルマサンプル(すなわち、1/4ペル、1ペル、4ペル)の単位で符号化されることができる。このMVD分解能は、符号化ユニット(CU)レベルで制御され、MVD分解能フラグが、少なくとも1つの非ゼロのMVD成分を持つ各CUに対して条件付きで信号伝達される。
少なくとも1つの非ゼロのMVD成分を持つCUに対して、そのCUで1/4ルマサンプルMV精度が使用されるかを指し示すために、第1のフラグが信号伝達される。1/4ルマサンプルMV精度が使用されないことを第1のフラグ(1に等しい)が指し示す場合、整数ルマサンプルMV精度又は4ルマサンプルMV精度が使用されるかを指し示すために、別のフラグが信号伝達される。
CUの第1のMVD分解能フラグがゼロである又はCUに対して符号化されない(CU内の全てのMVDがゼロであることを意味する)場合、1/4ルマサンプルMV分解能がそのCUに対して使用される。CUが整数ルマサンプルMV精度又は4ルマサンプルMV精度を使用する場合、そのCUに関するAMVP候補リスト内のMVPは、対応する精度に丸められる。
2.2.8.3 JVET-N1001-v2における対称動きベクトル差
JVET-N1001-v2では、双予測における動き情報コーディングに対称動きベクトル差(SMVD)が適用される。
先ず、スライスレベルにて、SMVDモードで使用されるリスト0/1の参照ピクチャインデックスをそれぞれ指し示すための変数RefIdxSymL0及びRefIdxSymL1が、N1001-v2に規定される次のステップを用いて導出される。これら2つの変数のうちの少なくとも一方が-1に等しいとき、SMVDモードは無効にされる。
2.2.9 動き情報の精緻化
2.2.9.1 デコーダ側動きベクトル精緻化(DMVR)
双予測演算では、1つのブロック領域の予測のために、list0の動きベクトル(MV)とlist1のMVとを用いて形成される2つの予測ブロックが結合されて単一の予測信号を形成する。デコーダ側動きベクトル精緻化(decoder-side motion vector refinement;DMVR)法においては、双予測の二つの動きベクトルが更に精緻化される。
VVCにおけるDMVRでは、リスト0とリスト1との間でのMVDミラーリングが図19に示すように仮定され、MVを精緻化するため、すなわち、幾つかのMVD候補の中で最良のMVDを見つけるために、バイラテラルマッチングが実行される。2つの参照ピクチャリストのMVをMVL0(L0X,L0Y)及びMVL1(L1X,L1Y)により表記する。コスト関数(例えば、SAD)を最小化し得るリスト0の(MvdX,MvdY)により表記されるMVDが、最良のMVDとして定められる。SAD関数の場合、それは、リスト0参照ピクチャ内の動きベクトル(L0X+MvdX,L0Y+MvdY)で導出されるリスト0の参照ブロックと、リスト1参照ピクチャ内の動きベクトル(L1X-MvdX,L1Y-MvdY)で導出されるリスト1の参照ブロックとの間のSADとして定義される。
この動きベクトル精緻化プロセスが2回繰り返され得る。各イテレーションにおいて、図20に示すように、多くて6つの(整数ペル精度の)MVDが、2つのステップで検査され得る。第1ステップで、MVD(0,0)、(-1,0)、(1,0)、(0,-1)、(0,1)が検査される。第2ステップで、MVD(-1,-1)、(-1,1)、(1,-1)又は(1,1)のうちの1つが選択され、更に検査される。関数Sad(x,y)がMVD(x,y)のSAD値を返すとする。第2ステップで検査される(MvdX,MvdY)により表記されるMVDは、以下のように決定される:
MvdX=-1;
MvdY=-1;
If(Sad(1,0)<Sad(-1,0))
MvdX=1;
If(Sad(0,1)<Sad(0,-1))
MvdY=1;
最初のイテレーションにおいて、開始点は、信号伝達されるMVであり、2回目のイテレーションにおいて、開始点は、信号伝達されるMVに最初のイテレーションで選択された最良MVDを加えたものである。DMVRは、一方の参照ピクチャが先行ピクチャであり、他方の参照ピクチャが後続ピクチャであり、且つこれら2つの参照ピクチャが現在ピクチャから同じピクチャオーダカウント距離を持つときにのみ適用される。
DMVRのプロセスを更に単純化するために、JVET-M0147はJEMにおける設計に幾つかの変更を提案した。より具体的には、VTM-4.0(間もなくリリースされる)に採用されたDMVR設計は、以下の主な特徴を有する:
・ list0とlist1の間の(0,0)位置SADが閾値よりも小さいときの早期終了;
・ list0とlist1との間のSADが何らかの位置でゼロであるときの早期終了;
・ W及びHはブロックの幅及び高さであるとして、DMVRに関するブロックサイズ:W*H>=64&&H>=8;
・ CUサイズ>16×16のDMVRに対してCUを複数の16×16サブブロックに分割する。CUの幅又は高さのみが16よりも大きい場合、垂直方向又は水平方向にそれのみが分割される;
・ 参照ブロックサイズ(W+7)*(H+7)(ルマに関して);
・ 25ポイントSADベース整数ペル探索(すなわち、(±)2精緻化探索範囲、単一ステージ);
・ バイリニア補間ベースのDMVR;
・ “パラメトリック誤差表面方程式”ベースのサブペル精緻化。この手順は、最小SADコストがゼロに等しくなく、且つ最良のMVDが最後のMV精緻化イテレーションにおいて(0,0)である場合にのみ実行される;
・ (必要に応じて)参照ブロックパディングありでのルマ/クロマMC;
・ MC及びTMVPのみに使用される精緻化MV。
2.2.9.1.1 DMVRの使用法
以下の条件が全て真であるとき、DMVRが有効にされ得る:
- SPS内のDMVR有効化フラグ(すなわち、sps_dmvr_enabled_flag)が1に等しい;
- TPMフラグ、インターアフィンフラグ、サブブロックマージフラグ(ATMVP又はアフィンマージのいずれか)、MMVDフラグが全て0に等しい;
- マージフラグが1に等しい;
- 現在ブロックが双予測され、現在ピクチャとリスト1の参照ピクチャとの間のPOC距離が、リスト0の参照ピクチャと現在ピクチャとの間のPOC距離に等しい;
- 現在CUの高さが8以上である;
- ルマサンプルの数(CUの幅*高さ)が64以上である。
2.2.9.1.2 “パラメトリック誤差表面方程式”
当該方法は、以下のようにまとめられる:
1. パラメトリック誤差表面フィッティングが、中心位置が所与のイテレーションにおいて最良のコスト位置である場合にのみ計算される;
2. 中心位置コスト、及び中心から(-1,0)、(0,-1)、(1,0)及び(0,1)の位置のコストを用いて、以下の形態:
E(x,y)=A(x-x0)2+B(y-y0)2+C
の2Dパラボリック誤差表面方程式をフィッティングし、ここで、(x,y)は最小コストの位置に対応し、Cは最小コスト値に対応する。5つの未知数の5つの方程式を解くことにより、(x,y)が:
x0=(E(-1,0)-E(1,0))/(2(E(-1,0)+E(1,0)-2E(0,0)))
=(E(0,-1)-E(0,1))/(2((E(0,-1)+E(0,1)-2E(0,0)))
として計算される。(x,y)は、除算が実行される精度(すなわち、何ビットの商が計算されるか)を調節することによって、任意の必要なサブピクセル精度まで計算されることができる。1/16ペル精度の場合、商の絶対値における4ビットだけ計算すればよく、これは、CUごとに必要とされる2回の除算の高速シフト減算ベースの実装に資する;
3. 計算された(x,y)を整数距離精緻化MVに加算して、サブピクセル精度のデルタMVを得る。
2.3 イントラブロックコピー
HEVCスクリーンコンテンツコーディング拡張(HEVC-SCC)及び現行のVVCテストモデル(VTM-4.0)にて、現在ピクチャ参照としても知られるイントラブロックコピー(IBC)が採用されている。IBCは、動き補償の概念をインターフレームコーディングからイントラフレームコーディングまで拡張する。図21に示すように、IBCが適用されるとき、現在ブロックは、同じピクチャ内の参照ブロックによって予測される。現在ブロックが符号化又は復号される前に、参照ブロック内のサンプルが既に再構成されていなければならない。IBCは、大抵のカメラキャプチャシーケンスに対してそれほど効率的ではないが、スクリーンコンテンツに対して有意な符号化利得を示す。その理由は、スクリーンコンテンツピクチャ内には例えばアイコン及びテキスト文字などの多数の繰り返しパターンが存在するからである。IBCは、それらの繰り返しパターン間の冗長性を効果的に除去することができる。HEVC-SCCでは、インター符号化される符号化ユニット(CU)がその参照ピクチャとして現在ピクチャを選択する場合に、IBCを適用することができる。この場合、MVはブロックベクトル(BV)と呼び変えられ、BVは常に整数ピクセル精度を持つ。メインプロファイルHEVCとの互換性があるように、現在ピクチャは、復号ピクチャバッファ(DPB)内で“長期”参照ピクチャとしてマークされる。なお、同様に、マルチビュー/3D映像符号化標準において、インタビュー参照ピクチャも“長期”参照ピクチャとしてマークされる。
BVがその参照ブロックを見つけた後、参照ブロックをコピーすることによって予測を生成することができる。元の信号から参照ピクセルを差し引くことによって、残差を得ることができる。その後、他の符号化モードにおいてのように、変換及び量子化を適用することができる。
しかしながら、参照ブロックが、ピクチャの外側にあったり、現在ブロックと重なり合ったり、再構成された領域の外側にあったり、あるいは、何らかの制約によって制限される有効領域の外側にあったりする場合、一部又は全てのピクセル値が定まらない。基本的に、このような問題に対処するには2つのソリューションがある。1つは、例えばビットストリーム適合において、そのような状況を許容しないものである。もう1つは、それらの定まらないピクセル値に対してパディングを適用するものである。以下のサブセクションにて、それらソリューションを詳細に説明する。
2.3.1 VVCテストモデル(VTM4.0)におけるIBC
現行のVVCテストモデル、すなわち、VTM-4.0設計では、参照ブロック全体が現在符号化ツリーユニット(CTU)であるべきであり、且つ現在ブロックと重なり合わない。従って、参照ブロック又は予測ブロックをパディングする必要はない。IBCフラグは、現在CUの予測モードとして符号化される。故に、各CUに対して、MODE_INTRA、MODE_INTER、及びMODE_IBCの3つの予測モードが存在する。
2.3.1.1 IBCマージモード
IBCマージモードでは、IBCマージ候補リスト内のエントリを指すインデックスがビットストリームから構文解析される。IBCマージリストの構築は、以下の一連の手順に従ってまとめることができる:
・ ステップ1:空間候補の導出;
・ ステップ2:HMVP候補の挿入;
・ ステップ3:ペアワイズ平均候補の挿入;
空間マージ候補の導出では、図2に示すようにA、B、B、A、及びBに示す位置にある候補の中から最大4つのマージ候補が選択される。導出の順序はA、B、B、A、及びBである。位置Bは、位置A、B、B、AのうちのいずれかのPUが利用可能でない(例えば、それが別のスライス又はタイルに属するため)又はIBCモードで符号化されない場合にのみ考慮される。位置Aの候補が追加された後、残りの候補の挿入は、符号化効率が向上されるように、同じ動き情報を持つ候補がリストから除外されることを確保する冗長性検査にかけられる。
空間候補の挿入後、IBCマージリストのサイズが依然として最大IBCマージリストサイズよりも小さい場合、HMVPテーブルからのIBC候補が挿入され得る。HMVP候補を挿入するときに冗長性検査が行われる。
最後に、ペアワイズ平均候補がIBCマージリストに挿入される。
マージ候補によって特定される参照ブロックが、ピクチャの外側にあったり、現在ブロックと重なり合ったり、再構成された領域の外側にあったり、あるいは、何らかの制約によって制限される有効領域の外側にあったりする場合、そのマージ候補は無効なマージ候補と呼ばれる。
なお、無効なマージ候補がIBCマージリストに挿入されてもよい。
2.3.1.2 IBC AMVPモード
IBC AMVPモードでは、IBC AMVPリスト内のエントリを指すAMVPインデックスがビットストリームから構文解析される。IBC AMVPリストの構築は、以下の一連の手順に従ってまとめることができる:
・ ステップ1:空間候補の導出;
- 利用可能な候補が見つかるまでA、Aを検査する;
- 利用可能な候補が見つかるまでB、B、Bを検査する;
・ ステップ2:HMVP候補の挿入;
・ ステップ3:ゼロ候補の挿入;
空間候補の挿入後、IBC AMVPリストのサイズが依然として最大IBC AMVPリストサイズよりも小さい場合、HMVPテーブルからのIBC候補が挿入され得る。
最後に、ゼロ候補がIBC AMVPリストに挿入される。
2.3.1.3 クロマIBCモード
現行VVCでは、クロマIBCモードにおける動き補償はサブブロックレベルで実行される。クロマブロックは、幾つかのサブブロックに分割されることになる。各サブブロックが、対応するルマブロックがブロックベクトルを持っているかと、それが存在する場合の有効性とを決定する。現行VTMにはエンコーダ制約があり、現在クロマCU内の全てのサブブロックが有効なルマブロックベクトルを持つ場合にクロマIBCモードがテストされることになる。例えば、YUV 420映像で、クロマブロックはN×Mであり、コロケートのルマ領域は2N×2Mである。クロマブロックのサブブロックサイズは2×2である。クロマmv導出、そしてブロックコピープロセスを実行するための幾つかのステップが存在する:
1)先ず、クロマブロックが(N>>1)*(M>>1)サブブロックに分割される;
2)左上サンプルの座標を(x,y)とする各サブブロックが、座標を(2x,2y)とする同じ左上サンプルをカバーする対応するルマブロックをフェッチする;
3)エンコーダが、フェッチされたルマブロックのブロックベクトル(bv)を検査する。以下の条件のうちの1つが満たされる場合、そのbvは無効とみなされる:
a. 対応するルマブロックのbvが存在しない;
b. bvによって特定される予測ブロックが未だ再構築されていない;
c. bvによって特定される予測ブロックが現在ブロックと部分的又は完全に重なっている;
4)サブブロックのクロマ動きベクトルが、対応するルマサブブロックの動きベクトルに設定される。
全てのサブブロックが有効なbvを見つけた場合に、エンコーダでIBCモードが許可される。
2.3.2 (VTM5.0における)IBC用の単一のBVリスト
JVET-N0843がVVCに採用されている。JVET-N0843では、IBCにおけるマージモード及びAMVPモード向けのBV予測子は、以下の要素で構成されるものである共通の予測子リストを共有する:
・ 2つの空間隣接位置(図2においてのようなA1、B1);
・ 5つのHMVPエントリ;
・ デフォルトのゼロベクトル。
リスト内の候補の数は、スライスヘッダから導出される変数によって制御される。マージモードでは、このリストの最初の最大6つのエントリが使用され、AMVPモードでは、このリストの最初の2つのエントリが使用される。また、このリストは、共有マージリスト領域要件(SMR内で同じリストを共有)に準拠する。
上述のBV予測子候補リストに加えて、JVET-N0843は、HMVP候補と既存のマージ候補(A1、B1)との間での剪定処理を単純化することも提案した。その単純化では、最初のHMVP候補を(1つ以上の)空間マージ候補と比較するだけであるので、最大で2回の剪定処理が存在することになる。
3. 問題点
マージモードの現行設計は以下の問題を有し得る:
1. 通常マージリスト構築プロセスが、現在ブロックに対するTPMの使用に依存する:
a. TPM符号化ブロックでは、空間マージ候補の間で完全剪定が適用される;
b. 非TPM符号化ブロックでは、空間マージ候補の間で部分的剪定が適用される;
2. 現行設計によれば、全てのマージ関連ツール(IBCマージ、通常マージ、MMVD、サブブロックマージ、CIIP、TPMを含む)が、general_merge_flagという名称の1つのフラグによって信号伝達される。しかしながら、このフラグが真であるときに、全てのマージ関連ツールが無効にされるように信号伝達されたり導出されることになったりすることが可能になってしまっている。この場合にどのように対処するのか知れていない。また、マージモードをオフにすることは許されず、すなわち、マージ候補の最大数が0に等しくないものとされている。しかしながら、高スループットのエンコーダ/デコーダでは、マージモードを強制的に無効にすることを必要とすることがある;
3. ATMVPプロセスでの初期化MVの決定が、スライスタイプ、全ての参照ピクチャのPOC値、collocated_from_l0_flagなどに依存し、そのことがMVのスループットを遅らせる;
4. コロケートMVの導出プロセスが、例えば追加ロジックを必要とする従来のTMVPプロセス又はATMVPプロセスなどの、サブブロック技術の使用に依存する;
5. ATMVP符号化ブロック内のサブCUについて、たとえそれに対応するコロケートブロックがインター符号化されても、そのサブCUの動き情報が、対応するコロケートブロックから導出されずに、他の動き情報で充たされることが可能になってしまっている。このような設計は、符号化効率及びスループットの両方にとって次善的である。
6. HEVC仕様は、現在ピクチャ内又は参照ピクチャ内の1つの隣接ブロックの利用可能性を、そのブロックが構成されているか又は異なるCTU行/スライス内にあるかなどに基づいて定めている。しかしながら、VVCでは、複数の符号化方法が導入されている。ブロックの利用可能性の異なる定義を定める必要があり得る。
4. 技術及び実施形態の例
以下の詳細な列挙は、一般的概念を説明するための例とみなされるべきである。これらの実施形態は狭義に解釈されるべきではない。さらに、これらの技術は、任意のやり方で組み合わされることができる。例えば、この文書で説明される実施形態は、現在映像ブロックが少なくとも2つの非矩形サブブロックに分割される幾何学的パーティションモード(GPM)に適用可能である。非矩形ブロックは、矩形以外の任意の幾何学的形状のものとすることができる。例えば、GPMは、第1の映像ブロックを、動き予測を別々に適用する複数の予測パーティションに分けることを有し、少なくとも1つのパーティションが、非矩形の形状を持つ。また、ここでの実施形態は、代替時間動きベクトル予測コーディング(ATMVP)の例を用いて説明されるが、一部の実施形態において、サブブロックベース時間動きベクトル予測子コーディング(SbTMVP)も適用可能である。
A0、A1、B0、B1、B2等として表記される隣接ブロックが図2に示されている:
1. 従来のマージ及びTPM符号化ブロック向けの通常マージリスト構築プロセスが、現在ブロックの符号化方法から切り離される:
a. 一例において、1つのブロックにTPMが適用されるときに、部分的剪定が空間マージ候補に適用される:
i. 一例において、2つの候補が互いに比較されるかが、非TPMマージ符号化ブロックに使用されるのと同じやり方で決定される;
ii. 一例において、B1がA1と比較され、B0がB1と比較され、A0がA1と比較され、B2がB1及びA1と比較される;
iii. あるいは、1つのブロックにTPMが使用されなくても、完全剪定が空間マージ候補に適用される;
iv. あるいは、さらに、一部の特定のブロック寸法に対して完全剪定が適用されてもよい:
1. 例えば、TPMが許容されるブロック寸法に対して完全剪定が適用され得る;
2. 例えば、ブロックサイズが、例えば16又は32又は64ルマサンプルといった、M*H未満のサンプルを含むとき、完全剪定は許可されない;
3. 例えば、ブロックの幅>th1又は>=th1であり、且つ/或いはブロックの高さ>th2又は>=th2である場合、完全剪定は許可されない;
b. 一例において、B2を検査するかは、1つのブロックにTPMが適用されるときにB2を検査する前の利用可能なマージ候補の数に基づく:
i. あるいは、非TPMマージ符号化ブロックに対して利用可能なマージ候補の数にかかわらず、B2は常に検査される;
2. ATMVPが利用可能であるか否かを決定するためにブロックを特定するのに使用される初期化MVが、単に、空間隣接ブロック(例えば、A1)のリストX情報を当てにすることができ、Xは、時間動きベクトル予測のために使用されるコロケートピクチャがそこから導出されるところに設定される(例えば、collocated_from_l0_flag):
a. あるいは、Xは、全ての参照リスト内の全ての参照ピクチャ内が、現在ピクチャと比較して小さいPOC値又はそれ以下のPOC値を持つかに従って決定される:
i. 一例において、それが真である場合、Xは1に設定される。そうでない場合、Xは0に設定される;
b. あるいは、空間隣接ブロック(例えば、A1)のリストXに関連する参照ピクチャが利用可能であり、且つコロケートピクチャと同じPOC値を持つ場合、初期化MVは、その空間隣接ブロックのリストXに関連するMVに設定される。そうでない場合、デフォルトMV(例えば(0,0))が利用される;
c. あるいは、HMVPテーブルに格納された動き情報が、ATMVPにおける初期化MVとして使用されてもよい:
i. 例えば、HMVPテーブルに格納された最初の利用可能な動き情報が使用され得る;
ii. 例えば、特定の参照ピクチャ(例えば、コロケートピクチャ)に関連付けられた、HMVPテーブルに格納された最初の利用可能な動き情報が使用され得る;
d. あるいは、Xは例えば0又は1などの固定数である;
3. サブブロックベース符号化ツール及び非サブブロックベース符号化ツールに使用されるコロケートMVの導出プロセスを揃えることができ、すなわち、特定の符号化ツールの使用からプロセスが独立になる:
a. 一例において、サブブロックベース符号化ツール向けのコロケートMVの導出プロセスの全体又は一部が、TMVPに使用されるものに揃えられる:
i. 一例において、それがリストYからの片予測である場合、リストYの動きベクトルがターゲット参照ピクチャリストXにスケーリングされる;
ii. 一例において、それが双予測であり且つターゲット参照ピクチャリストがXである場合、リストYの動きベクトルがターゲット参照ピクチャリストXにスケーリングされ、Yは以下のルールに従って決定され得る:
- 参照ピクチャのいずれもが、現在ピクチャと比較して大きいPOCを持たない場合、又は全ての参照ピクチャが、現在ピクチャと比較して小さいPOC値を持つ場合、YはXに等しく設定される;
- それ以外の場合、Yはcollocated_from_l0_flagに等しく設定される;
b. 一例において、TMVP向けのコロケートMVの導出プロセスの全体又は一部が、サブブロックベース符号化ツールに使用されるものに揃えられる;
4. 動き候補リスト構築プロセス(例えば、通常マージリスト、IBCマージ/AMVPリスト)が、ブロック寸法及び/又はマージ共有条件に依存し得る。ブロックの幅及び高さをそれぞれW及びと表記する。条件Cは、WとH及び/又はマージ共有条件に依存し得る:
a. 一例において、条件Cが満たされる場合、空間マージ候補の導出がスキップされる;
b. 一例において、条件Cが満たされる場合、HMVP候補の導出がスキップされる;
c. 一例において、条件Cが満たされる場合、ペアワイズマージ候補の導出がスキップされる;
d. 一例において、条件Cが満たされる場合、最大剪定処理回数が減らされ又は0に設定される;
e. 一例において、条件Cは、W*Hが閾値(例えば、64又は32)よりも小さい又はそれ以下であるときに満たされる;
f. 一例において、条件Cは、W及び/又はHが閾値(例えば、4又は8)よりも小さい又はそれ以下であるときに満たされる;
g. 一例において、条件Cは、現在ブロックが共有ノードの下にあるときに満たされる;
5. 許容される通常マージ候補の最大数/許容されるIBC候補の最大数/許容されるサブブロックマージ候補の最大数を0に設定することができる。従って、特定のツールを無効にすることができ、関連する構文要素を信号伝達する必要がない:
a. 一例において、許容される通常マージ候補の最大数が0に等しいとき、通常マージリストを当てにする符号化ツールが無効にされ得る。該符号化ツールは、通常マージ、MMVD、CIIP、TPM、DMVRなどとし得る;
b. 一例において、許容されるIBC候補の最大数が0に等しいとき、IBC AMVP及び/又はIBCマージが無効にされ得る;
c. 一例において、許容されるサブブロックベースマージ候補の最大数が0に等しいとき、例えばATMVP、アフィンマージモードといったサブブロックベース技術あ無効にされ得る;
d. 許容される候補の最大数に従ってツールが無効にされるとき、関連する構文要素の信号伝達はスキップされる:
i. あるいは、さらに、マージ関連ツールの信号伝達は、許容される候補の最大数が0に等しくないかを検査する必要があるとし得る;
ii. あるいは、さらに、マージ関連ツールに関するプロセスの呼び出しは、許容される候補の最大数が0に等しくないかを検査する必要があるとし得る;
6. general_merge_flag及び/又はcu_skip_flagの信号伝達が、許容される通常のマージ候補の最大数/許容されるIBC候補の最大数/許容されるサブブロックマージ候補の最大数/マージ関連の符号化ツールの使用に依存することができる:
a. 一例において、マージ関連の符号化ツールは、IBCマージ、通常マージ、MMVD、サブブロックマージ、CIIP、TPM、DMVRなどを含み得る;
b. 一例において、許容される通常マージ候補の最大数、許容されるIBCマージ/AMVP候補の最大数、許容されるサブブロックマージ候補の最大数が0に等しいとき、general_merge_flag及び/又はcu_skip_flagは信号伝達されない:
i. あるいは、さらに、general_merge_flag及び/又はcu_skip_flagは0であると推定される;
7. 適合ビットストリームは、現在ブロックのgeneral_merge_flag又はcu_skip_flagが真であるときに、IBCマージ、通常マージ、MMVD、サブブロックマージ、CIIP、TPM、DMVRなどを含むのマージ関連ツールのうちの少なくとも1つが有効にされることを満足するものとする;
8. 適合ビットストリームは、現在ブロックの(general_merge_flag又はcu_skip_flag)が真であり、且つ1つのスライス/タイル/ブリック/ピクチャ/現在ブロックに対してIBCが無効にされるときに、通常マージ、MMVD、サブブロックマージ、CIIP、TPM、DMVRなどを含むマージ関連ツールのうちの少なくとも1つが有効にされることを満足するものとする;
9. 適合ビットストリームは、現在ブロックの(general_merge_flag又はcu_skip_flag)が真であり、且つ1つのスライス/タイル/ブリック/ピクチャ/現在ブロックに対してMMVDが無効にされるときに、IBCマージ、通常マージ、サブブロックマージ、CIIP、TPMを含むマージ関連ツールのうちの少なくとも1つが有効にされることを満足するものとする;
10. 適合ビットストリームは、現在ブロックの(general_merge_flag又はcu_skip_flag)が真であり、且つ1つのスライス/タイル/ブリック/ピクチャ/現在ブロックに対してCIIPが無効にされるときに、IBCマージ、通常マージ、MMVD、サブブロックマージ、TPMを含むマージ関連ツールのうちの少なくとも1つが有効にされることを満足するものとする;
11. 適合ビットストリームは、現在ブロックの(general_merge_flag又はcu_skip_flag)が真であり、且つ1つのスライス/タイル/ブリック/ピクチャ/現在ブロックに対してTPMが無効にされるときに、IBCマージ、通常マージ、MMVD、サブブロックマージ、CIIPを含むマージ関連ツールのうちの少なくとも1つが有効にされることを満足するものとする;
12. 適合ビットストリームは、現在ブロックのgeneral_merge_flag又はcu_skip_flagが真であるときに、IBCマージ、通常マージ、MMVD、サブブロックマージ、CIIP、TPMを含む有効にされたマージ関連ツールのうちの少なくとも1つが適用されることを満足するものとする。第1ブロックを符号化するとき、第2ブロックの利用可能性の検査は、第1ブロックの符号化モード情報に依存することができ、例えば、第1ブロックと第2ブロックとに異なるモードが使用される場合、第2ブロックは、他条件の検査結果(例えば、構築済みである)にかかわらず、利用不可として扱われてもよい:
a. 一例において、第1ブロックがインター符号化され、第2ブロックがIBC符号化される場合、第2ブロックは利用不可としてマークされる;
b. 一例において、第1ブロックがIBC符号化され、第2ブロックがインター符号化される場合、第2ブロックは利用不可としてマークされる;
c. 第2ブロックが利用不可としてマークされるとき、関連する符号化情報(例えば、動き情報)は、第1ブロックを符号化するのに利用されることが許されない。
5. 実施形態
最新のVVC作業草案(JVET-N1001_v7)に加えて提案する変更が、以下に与えられる。削除されるテキストを、太字の大文字にしたフォントでマークする。新たに追加される部分を、太字の下線付きの斜体フォントで強調する。
5.1 実施形態#1
この実施形態は、非TPM符号化ブロックに対する剪定プロセスを、TPM符号化ブロックに対する剪定プロセスに揃える、すなわち、非TPM符号化ブロックに対して完全剪定操作とするものである。
8.5.2.3 空間マージ候補の導出プロセス
このプロセスへの入力は以下である:
- 現在ピクチャの左上ルマサンプルに対する現在ルマ符号化ブロックの左上サンプルのルマ位置(xCb,yCb);
- ルマサンプル内の現在符号化ブロックの幅を規定する変数cbWidth;
- ルマサンプル内の現在符号化ブロックの高さを規定する変数cbHeight。
このプロセスの出力は、0又は1であるXで、以下である:
- 隣接符号化ユニットの利用可能性フラグavailableFlagA0、availableFlagA1、availableFlagB0、availableFlagB1、及びavailableFlagB2
- 隣接符号化ユニットの参照インデックスrefIdxLXA0、refIdxLXA1、refIdxLXB0、refIdxLXB1、及びrefIdxLXB2
- 隣接符号化ユニットの予測リスト利用フラグpredFlagLXA0、predFlagLXA1、predFlagLXB0、predFlagLXB1、及びpredFlagLXB2
- 隣接符号化ユニットの1/16分数サンプル精度での動きベクトルmvLXA0、mvLXA1、mvLXB0、mvLXB1、及びmvLXB2
- 双予測重みインデックスgbiIdxA0、gbiIdxA1、gbiIdxB0、gbiIdxB1、及びgbiIdxB2
availableFlagA1、refIdxLXA1、predFlagLXA1、及びmvLXA1の導出のため、以下が適用される:
- 隣接ルマ符号化ブロックの内側のルマ位置(xNbA1,yNbA1)が(xCb-1,yCb+cbHeight-1)に等しく設定される;
- 第6.4.X項[Ed.(BB):Neighbouring blocks availability checking process tbd]に規定されるブロックの利用可能性導出プロセスが、(xCb,yCb)に等しく設定される現在ルマ位置(xCurr,yCurr)及び隣接ルマ位置(xNbA1,yNbA1)を入力として呼び出され、その出力が、ブロック利用可能性フラグavailableA1に割り当てられる;
- 変数availableFlagA1、refIdxLXA1、predFlagLXA1、及びmvLXA1が、次のように導出される:
- availableA1がFALSEに等しい場合、0又は1であるXで、availableFlagA1が0に等しく設定され、mvLXA1の両方のコンポーネントが0に等しく設定され、refIdxLXA1が-1に等しく設定され、predFlagLXA1が0に等しく設定され、そして、gbiIdxA1が0に等しく設定される;
- それ以外の場合、availableFlagA1は1に等しく設定されて、以下の割り当てが行われる:
mvLXA1=MvLX[xNbA1][yNbA1] (8-294)
refIdxLXA1=RefIdxLX[xNbA1][yNbA1] (8-295)
predFlagLXA1=PredFlagLX[xNbA1][yNbA1] (8-296)
gbiIdxA1=GbiIdx[xNbA1][yNbA1] (8-297)
availableFlagB1、refIdxLXB1、predFlagLXB1、及びmvLXB1の導出のため、以下が適用される:
- 隣接ルマ符号化ブロックの内側のルマ位置(xNbB1,yNbB1)が(xCb+cbWidth-1,yCb-1)に等しく設定される;
- 第6.4.X項[Ed.(BB):Neighbouring blocks availability checking process tbd]に規定されるブロックの利用可能性導出プロセスが、(xCb,yCb)に等しく設定される現在ルマ位置(xCurr,yCurr)及び隣接ルマ位置(xNbB1,yNbB1)を入力として呼び出され、その出力が、ブロック利用可能性フラグavailableB1に割り当てられる;
- 変数availableFlagB1、refIdxLXB1、predFlagLXB1、及びmvLXB1が、次のように導出される:
- 以下の条件のうちの1つ以上が真である場合、0又は1であるXで、availableFlagB1が0に等しく設定され、mvLXB1の両方のコンポーネントが0に等しく設定され、refIdxLXB1が-1に等しく設定され、predFlagLXB1が0に等しく設定され、そして、gbiIdxB1が0に等しく設定される;
- availableB1がFALSEに等しい;
- availableA1がTRUEに等しく、且つルマ位置(xNbA1,yNbA1)及び(xNbB1,yNbB1)が同じ動きベクトル及び同じ参照インデックスを持つ;
- それ以外の場合、availableFlagB1は1に等しく設定されて、以下の割り当てが行われる:
mvLXB1=MvLX[xNbB1][yNbB1] (8-298)
refIdxLXB1=RefIdxLX[xNbB1][yNbB1] (8-299)
predFlagLXB1=PredFlagLX[xNbB1][yNbB1] (8-300)
gbiIdxB1=GbiIdx[xNbB1][yNbB1] (8-301)
availableFlagB0、refIdxLXB0、predFlagLXB0、及びmvLXB0の導出のため、以下が適用される:
- 隣接ルマ符号化ブロックの内側のルマ位置(xNbB0,yNbB0)が(xCb+cbWidth,yCb-1)に等しく設定される;
- 第6.4.X項[Ed.(BB):Neighbouring blocks availability checking process tbd]に規定されるブロックの利用可能性導出プロセスが、(xCb,yCb)に等しく設定される現在ルマ位置(xCurr,yCurr)及び隣接ルマ位置(xNbB0,yNbB0)を入力として呼び出され、その出力が、ブロック利用可能性フラグavailableB0に割り当てられる;
- 変数availableFlagB0、refIdxLXB0、predFlagLXB0、及びmvLXB0が、次のように導出される:
- 以下の条件のうちの1つ以上が真である場合、0又は1であるXで、availableFlagB0が0に等しく設定され、mvLXB0の両方のコンポーネントが0に等しく設定され、refIdxLXB0が-1に等しく設定され、predFlagLXB0が0に等しく設定され、そして、gbiIdxB0が0に等しく設定される;
(外2)
Figure 2024008948000014
- それ以外の場合、availableFlagB0は1に等しく設定されて、以下の割り当てが行われる:
mvLXB0=MvLX[xNbB0][yNbB0] (8-302)
refIdxLXB0=RefIdxLX[xNbB0][yNbB0] (8-303)
predFlagLXB0=PredFlagLX[xNbB0][yNbB0] (8-304)
gbiIdxB0=GbiIdx[xNbB0][yNbB0] (8-305)
availableFlagA0、refIdxLXA0、predFlagLXA0、及びmvLXA0の導出のため、以下が適用される:
- 隣接ルマ符号化ブロックの内側のルマ位置(xNbA0,yNbA0)が(xCb-1,yCb+cbWidth)に等しく設定される;
- 第6.4.X項[Ed.(BB):Neighbouring blocks availability checking process tbd]に規定されるブロックの利用可能性導出プロセスが、(xCb,yCb)に等しく設定される現在ルマ位置(xCurr,yCurr)及び隣接ルマ位置(xNbA0,yNbA0)を入力として呼び出され、その出力が、ブロック利用可能性フラグavailableA0に割り当てられる;
- 変数availableFlagA0、refIdxLXA0、predFlagLXA0、及びmvLXA0が、次のように導出される:
- 以下の条件のうちの1つ以上が真である場合、0又は1であるXで、availableFlagA0が0に等しく設定され、mvLXA0の両方のコンポーネントが0に等しく設定され、refIdxLXA0が-1に等しく設定され、predFlagLXA0が0に等しく設定され、そして、gbiIdxA0が0に等しく設定される;
(外3)
Figure 2024008948000015
- それ以外の場合、availableFlagA0は1に等しく設定されて、以下の割り当てが行われる:
mvLXA0=MvLX[xNbA0][yNbA0] (8-306)
refIdxLXA0=RefIdxLX[xNbA0][yNbA0] (8-307)
predFlagLXA0=PredFlagLX[xNbA0][yNbA0] (8-308)
gbiIdxA0=GbiIdx[xNbA0][yNbA0] (8-309)
availableFlagB2、refIdxLXB2、predFlagLXB2、及びmvLXB2の導出のため、以下が適用される:
- 隣接ルマ符号化ブロックの内側のルマ位置(xNbB2,yNbB2)が(xCb-1,yCb-1)に等しく設定される;
- 第6.4.X項[Ed.(BB):Neighbouring blocks availability checking process tbd]に規定されるブロックの利用可能性導出プロセスが、(xCb,yCb)に等しく設定される現在ルマ位置(xCurr,yCurr)及び隣接ルマ位置(xNbB2,yNbB2)を入力として呼び出され、その出力が、ブロック利用可能性フラグavailableB2に割り当てられる;
- 変数availableFlagB2、refIdxLXB2、predFlagLXB2、及びmvLXB2が、次のように導出される:
- 以下の条件のうちの1つ以上が真である場合、0又は1であるXで、availableFlagB2が0に等しく設定され、mvLXB2の両方のコンポーネントが0に等しく設定され、refIdxLXB2が-1に等しく設定され、predFlagLXB2が0に等しく設定され、そして、gbiIdxB2が0に等しく設定される;
(外4)
Figure 2024008948000016
- それ以外の場合、availableFlagB2は1に等しく設定されて、以下の割り当てが行われる:
mvLXB2=MvLX[xNbB2][yNbB2] (8-310)
refIdxLXB2=RefIdxLX[xNbB2][yNbB2] (8-311)
predFlagLXB2=PredFlagLX[xNbB2][yNbB2] (8-312)
gbiIdxB2=GbiIdx[xNbB2][yNbB2] (8-313)
5.2 実施形態#2
この実施形態は、TPM符号化ブロックに対する剪定プロセスを、非TPM符号化ブロックに対する剪定プロセスに揃える、すなわち、TPM符号化ブロックに対して限られた剪定操作とするものである。
8.5.2.3 空間マージ候補の導出プロセス
このプロセスへの入力は以下である:
- 現在ピクチャの左上ルマサンプルに対する現在ルマ符号化ブロックの左上サンプルのルマ位置(xCb,yCb);
- ルマサンプル内の現在符号化ブロックの幅を規定する変数cbWidth;
- ルマサンプル内の現在符号化ブロックの高さを規定する変数cbHeight。
このプロセスの出力は、0又は1であるXで、以下である:
- 隣接符号化ユニットの利用可能性フラグavailableFlagA0、availableFlagA1、availableFlagB0、availableFlagB1、及びavailableFlagB2
- 隣接符号化ユニットの参照インデックスrefIdxLXA0、refIdxLXA1、refIdxLXB0、refIdxLXB1、及びrefIdxLXB2
- 隣接符号化ユニットの予測リスト利用フラグpredFlagLXA0、predFlagLXA1、predFlagLXB0、predFlagLXB1、及びpredFlagLXB2
- 隣接符号化ユニットの1/16分数サンプル精度での動きベクトルmvLXA0、mvLXA1、mvLXB0、mvLXB1、及びmvLXB2
- 双予測重みインデックスgbiIdxA0、gbiIdxA1、gbiIdxB0、gbiIdxB1、及びgbiIdxB2
availableFlagA1、refIdxLXA1、predFlagLXA1、及びmvLXA1の導出のため、以下が適用される:
- 隣接ルマ符号化ブロックの内側のルマ位置(xNbA1,yNbA1)が(xCb-1,yCb+cbHeight-1)に等しく設定される;
- 第6.4.X項[Ed.(BB):Neighbouring blocks availability checking process tbd]に規定されるブロックの利用可能性導出プロセスが、(xCb,yCb)に等しく設定される現在ルマ位置(xCurr,yCurr)及び隣接ルマ位置(xNbA1,yNbA1)を入力として呼び出され、その出力が、ブロック利用可能性フラグavailableA1に割り当てられる;
- 変数availableFlagA1、refIdxLXA1、predFlagLXA1、及びmvLXA1が、次のように導出される:
- availableA1がFALSEに等しい場合、0又は1であるXで、availableFlagA1が0に等しく設定され、mvLXA1の両方のコンポーネントが0に等しく設定され、refIdxLXA1が-1に等しく設定され、predFlagLXA1が0に等しく設定され、そして、gbiIdxA1が0に等しく設定される;
- それ以外の場合、availableFlagA1は1に等しく設定されて、以下の割り当てが行われる:
mvLXA1=MvLX[xNbA1][yNbA1] (8-294)
refIdxLXA1=RefIdxLX[xNbA1][yNbA1] (8-295)
predFlagLXA1=PredFlagLX[xNbA1][yNbA1] (8-296)
gbiIdxA1=GbiIdx[xNbA1][yNbA1] (8-297)
availableFlagB1、refIdxLXB1、predFlagLXB1、及びmvLXB1の導出のため、以下が適用される:
- 隣接ルマ符号化ブロックの内側のルマ位置(xNbB1,yNbB1)が(xCb+cbWidth-1,yCb-1)に等しく設定される;
- 第6.4.X項[Ed.(BB):Neighbouring blocks availability checking process tbd]に規定されるブロックの利用可能性導出プロセスが、(xCb,yCb)に等しく設定される現在ルマ位置(xCurr,yCurr)及び隣接ルマ位置(xNbB1,yNbB1)を入力として呼び出され、その出力が、ブロック利用可能性フラグavailableB1に割り当てられる;
- 変数availableFlagB1、refIdxLXB1、predFlagLXB1、及びmvLXB1が、次のように導出される:
- 以下の条件のうちの1つ以上が真である場合、0又は1であるXで、availableFlagB1が0に等しく設定され、mvLXB1の両方のコンポーネントが0に等しく設定され、refIdxLXB1が-1に等しく設定され、predFlagLXB1が0に等しく設定され、そして、gbiIdxB1が0に等しく設定される;
- availableB1がFALSEに等しい;
- availableA1がTRUEに等しく、且つルマ位置(xNbA1,yNbA1)及び(xNbB1,yNbB1)が同じ動きベクトル及び同じ参照インデックスを持つ;
- それ以外の場合、availableFlagB1は1に等しく設定されて、以下の割り当てが行われる:
mvLXB1=MvLX[xNbB1][yNbB1] (8-298)
refIdxLXB1=RefIdxLX[xNbB1][yNbB1] (8-299)
predFlagLXB1=PredFlagLX[xNbB1][yNbB1] (8-300)
gbiIdxB1=GbiIdx[xNbB1][yNbB1] (8-301)
availableFlagB0、refIdxLXB0、predFlagLXB0、及びmvLXB0の導出のため、以下が適用される:
- 隣接ルマ符号化ブロックの内側のルマ位置(xNbB0,yNbB0)が(xCb+cbWidth,yCb-1)に等しく設定される;
- 第6.4.X項[Ed.(BB):Neighbouring blocks availability checking process tbd]に規定されるブロックの利用可能性導出プロセスが、(xCb,yCb)に等しく設定される現在ルマ位置(xCurr,yCurr)及び隣接ルマ位置(xNbB0,yNbB0)を入力として呼び出され、その出力が、ブロック利用可能性フラグavailableB0に割り当てられる;
- 変数availableFlagB0、refIdxLXB0、predFlagLXB0、及びmvLXB0が、次のように導出される:
- 以下の条件のうちの1つ以上が真である場合、0又は1であるXで、availableFlagB0が0に等しく設定され、mvLXB0の両方のコンポーネントが0に等しく設定され、refIdxLXB0が-1に等しく設定され、predFlagLXB0が0に等しく設定され、そして、gbiIdxB0が0に等しく設定される;
(外5)
Figure 2024008948000017
- それ以外の場合、availableFlagB0は1に等しく設定されて、以下の割り当てが行われる:
mvLXB0=MvLX[xNbB0][yNbB0] (8-302)
refIdxLXB0=RefIdxLX[xNbB0][yNbB0] (8-303)
predFlagLXB0=PredFlagLX[xNbB0][yNbB0] (8-304)
gbiIdxB0=GbiIdx[xNbB0][yNbB0] (8-305)
availableFlagA0、refIdxLXA0、predFlagLXA0、及びmvLXA0の導出のため、以下が適用される:
- 隣接ルマ符号化ブロックの内側のルマ位置(xNbA0,yNbA0)が(xCb-1,yCb+cbWidth)に等しく設定される;
- 第6.4.X項[Ed.(BB):Neighbouring blocks availability checking process tbd]に規定されるブロックの利用可能性導出プロセスが、(xCb,yCb)に等しく設定される現在ルマ位置(xCurr,yCurr)及び隣接ルマ位置(xNbA0,yNbA0)を入力として呼び出され、その出力が、ブロック利用可能性フラグavailableA0に割り当てられる;
- 変数availableFlagA0、refIdxLXA0、predFlagLXA0、及びmvLXA0が、次のように導出される:
- 以下の条件のうちの1つ以上が真である場合、0又は1であるXで、availableFlagA0が0に等しく設定され、mvLXA0の両方のコンポーネントが0に等しく設定され、refIdxLXA0が-1に等しく設定され、predFlagLXA0が0に等しく設定され、そして、gbiIdxA0が0に等しく設定される;
(外6)
Figure 2024008948000018
- それ以外の場合、availableFlagA0は1に等しく設定されて、以下の割り当てが行われる:
mvLXA0=MvLX[xNbA0][yNbA0] (8-306)
refIdxLXA0=RefIdxLX[xNbA0][yNbA0] (8-307)
predFlagLXA0=PredFlagLX[xNbA0][yNbA0] (8-308)
gbiIdxA0=GbiIdx[xNbA0][yNbA0] (8-309)
availableFlagB2、refIdxLXB2、predFlagLXB2、及びmvLXB2の導出のため、以下が適用される:
- 隣接ルマ符号化ブロックの内側のルマ位置(xNbB2,yNbB2)が(xCb-1,yCb-1)に等しく設定される;
- 第6.4.X項[Ed.(BB):Neighbouring blocks availability checking process tbd]に規定されるブロックの利用可能性導出プロセスが、(xCb,yCb)に等しく設定される現在ルマ位置(xCurr,yCurr)及び隣接ルマ位置(xNbB2,yNbB2)を入力として呼び出され、その出力が、ブロック利用可能性フラグavailableB2に割り当てられる;
- 変数availableFlagB2、refIdxLXB2、predFlagLXB2、及びmvLXB2が、次のように導出される:
- 以下の条件のうちの1つ以上が真である場合、0又は1であるXで、availableFlagB2が0に等しく設定され、mvLXB2の両方のコンポーネントが0に等しく設定され、refIdxLXB2が-1に等しく設定され、predFlagLXB2が0に等しく設定され、そして、gbiIdxB2が0に等しく設定される;
(外7)
Figure 2024008948000019
- それ以外の場合、availableFlagB2は1に等しく設定されて、以下の割り当てが行われる:
mvLXB2=MvLX[xNbB2][yNbB2] (8-310)
refIdxLXB2=RefIdxLX[xNbB2][yNbB2] (8-311)
predFlagLXB2=PredFlagLX[xNbB2][yNbB2] (8-312)
gbiIdxB2=GbiIdx[xNbB2][yNbB2] (8-313)
5.3 実施形態#3
この実施形態は、B2の検査を呼び出すための条件を揃えるものである。
8.5.2.3 空間マージ候補の導出プロセス
このプロセスへの入力は以下である:
- 現在ピクチャの左上ルマサンプルに対する現在ルマ符号化ブロックの左上サンプルのルマ位置(xCb,yCb);
- ルマサンプル内の現在符号化ブロックの幅を規定する変数cbWidth;
- ルマサンプル内の現在符号化ブロックの高さを規定する変数cbHeight。
このプロセスの出力は、0又は1であるXで、以下である:
- 隣接符号化ユニットの利用可能性フラグavailableFlagA0、availableFlagA1、availableFlagB0、availableFlagB1、及びavailableFlagB2
- 隣接符号化ユニットの参照インデックスrefIdxLXA0、refIdxLXA1、refIdxLXB0、refIdxLXB1、及びrefIdxLXB2
- 隣接符号化ユニットの予測リスト利用フラグpredFlagLXA0、predFlagLXA1、predFlagLXB0、predFlagLXB1、及びpredFlagLXB2
- 隣接符号化ユニットの1/16分数サンプル精度での動きベクトルmvLXA0、mvLXA1、mvLXB0、mvLXB1、及びmvLXB2
- 双予測重みインデックスgbiIdxA0、gbiIdxA1、gbiIdxB0、gbiIdxB1、及びgbiIdxB2
availableFlagA1、refIdxLXA1、predFlagLXA1、及びmvLXA1の導出のため、以下が適用される:
- 隣接ルマ符号化ブロックの内側のルマ位置(xNbA1,yNbA1)が(xCb-1,yCb+cbHeight-1)に等しく設定される;
- 第6.4.X項[Ed.(BB):Neighbouring blocks availability checking process tbd]に規定されるブロックの利用可能性導出プロセスが、(xCb,yCb)に等しく設定される現在ルマ位置(xCurr,yCurr)及び隣接ルマ位置(xNbA1,yNbA1)を入力として呼び出され、その出力が、ブロック利用可能性フラグavailableA1に割り当てられる;
- 変数availableFlagA1、refIdxLXA1、predFlagLXA1、及びmvLXA1が、次のように導出される:
...
availableFlagB1、refIdxLXB1、predFlagLXB1、及びmvLXB1の導出のため、以下が適用される:
- 隣接ルマ符号化ブロックの内側のルマ位置(xNbB1,yNbB1)が(xCb+cbWidth-1,yCb-1)に等しく設定される;
...
availableFlagB0、refIdxLXB0、predFlagLXB0、及びmvLXB0の導出のため、以下が適用される:
- 隣接ルマ符号化ブロックの内側のルマ位置(xNbB0,yNbB0)が(xCb+cbWidth,yCb-1)に等しく設定される;
...
availableFlagA0、refIdxLXA0、predFlagLXA0、及びmvLXA0の導出のため、以下が適用される:
- 隣接ルマ符号化ブロックの内側のルマ位置(xNbA0,yNbA0)が(xCb-1,yCb+cbWidth)に等しく設定される;
...
availableFlagB2、refIdxLXB2、predFlagLXB2、及びmvLXB2の導出のため、以下が適用される:
- 隣接ルマ符号化ブロックの内側のルマ位置(xNbB2,yNbB2)が(xCb-1,yCb-1)に等しく設定される;
- 第6.4.X項[Ed.(BB):Neighbouring blocks availability checking process tbd]に規定されるブロックの利用可能性導出プロセスが、(xCb,yCb)に等しく設定される現在ルマ位置(xCurr,yCurr)及び隣接ルマ位置(xNbB2,yNbB2)を入力として呼び出され、その出力が、ブロック利用可能性フラグavailableB2に割り当てられる;
- 変数availableFlagB2、refIdxLXB2、predFlagLXB2、及びmvLXB2が、次のように導出される:
- 以下の条件のうちの1つ以上が真である場合、0又は1であるXで、availableFlagB2が0に等しく設定され、mvLXB2の両方のコンポーネントが0に等しく設定され、refIdxLXB2が-1に等しく設定され、predFlagLXB2が0に等しく設定され、そして、gbiIdxB2が0に等しく設定される;
(外8)
Figure 2024008948000020
- それ以外の場合、availableFlagB2は1に等しく設定されて、以下の割り当てが行われる:
mvLXB2=MvLX[xNbB2][yNbB2] (8-310)
refIdxLXB2=RefIdxLX[xNbB2][yNbB2] (8-311)
predFlagLXB2=PredFlagLX[xNbB2][yNbB2] (8-312)
gbiIdxB2=GbiIdx[xNbB2][yNbB2] (8-313)
5.4 実施形態#4
この実施形態は、B2の検査を呼び出すための条件を揃えるものである。
8.5.2.3 空間マージ候補の導出プロセス
このプロセスへの入力は以下である:
- 現在ピクチャの左上ルマサンプルに対する現在ルマ符号化ブロックの左上サンプルのルマ位置(xCb,yCb);
- ルマサンプル内の現在符号化ブロックの幅を規定する変数cbWidth;
- ルマサンプル内の現在符号化ブロックの高さを規定する変数cbHeight。
このプロセスの出力は、0又は1であるXで、以下である:
- 隣接符号化ユニットの利用可能性フラグavailableFlagA0、availableFlagA1、availableFlagB0、availableFlagB1、及びavailableFlagB2
- 隣接符号化ユニットの参照インデックスrefIdxLXA0、refIdxLXA1、refIdxLXB0、refIdxLXB1、及びrefIdxLXB2
- 隣接符号化ユニットの予測リスト利用フラグpredFlagLXA0、predFlagLXA1、predFlagLXB0、predFlagLXB1、及びpredFlagLXB2
- 隣接符号化ユニットの1/16分数サンプル精度での動きベクトルmvLXA0、mvLXA1、mvLXB0、mvLXB1、及びmvLXB2
- 双予測重みインデックスgbiIdxA0、gbiIdxA1、gbiIdxB0、gbiIdxB1、及びgbiIdxB2
availableFlagA1、refIdxLXA1、predFlagLXA1、及びmvLXA1の導出のため、以下が適用される:
- 隣接ルマ符号化ブロックの内側のルマ位置(xNbA1,yNbA1)が(xCb-1,yCb+cbHeight-1)に等しく設定される;
- 第6.4.X項[Ed.(BB):Neighbouring blocks availability checking process tbd]に規定されるブロックの利用可能性導出プロセスが、(xCb,yCb)に等しく設定される現在ルマ位置(xCurr,yCurr)及び隣接ルマ位置(xNbA1,yNbA1)を入力として呼び出され、その出力が、ブロック利用可能性フラグavailableA1に割り当てられる;
- 変数availableFlagA1、refIdxLXA1、predFlagLXA1、及びmvLXA1が、次のように導出される:
...
availableFlagB1、refIdxLXB1、predFlagLXB1、及びmvLXB1の導出のため、以下が適用される:
- 隣接ルマ符号化ブロックの内側のルマ位置(xNbB1,yNbB1)が(xCb+cbWidth-1,yCb-1)に等しく設定される;
...
availableFlagB0、refIdxLXB0、predFlagLXB0、及びmvLXB0の導出のため、以下が適用される:
- 隣接ルマ符号化ブロックの内側のルマ位置(xNbB0,yNbB0)が(xCb+cbWidth,yCb-1)に等しく設定される;
...
availableFlagA0、refIdxLXA0、predFlagLXA0、及びmvLXA0の導出のため、以下が適用される:
- 隣接ルマ符号化ブロックの内側のルマ位置(xNbA0,yNbA0)が(xCb-1,yCb+cbWidth)に等しく設定される;
...
availableFlagB2、refIdxLXB2、predFlagLXB2、及びmvLXB2の導出のため、以下が適用される:
- 隣接ルマ符号化ブロックの内側のルマ位置(xNbB2,yNbB2)が(xCb-1,yCb-1)に等しく設定される;
- 第6.4.X項[Ed.(BB):Neighbouring blocks availability checking process tbd]に規定されるブロックの利用可能性導出プロセスが、(xCb,yCb)に等しく設定される現在ルマ位置(xCurr,yCurr)及び隣接ルマ位置(xNbB2,yNbB2)を入力として呼び出され、その出力が、ブロック利用可能性フラグavailableB2に割り当てられる;
- 変数availableFlagB2、refIdxLXB2、predFlagLXB2、及びmvLXB2が、次のように導出される:
- 以下の条件のうちの1つ以上が真である場合、0又は1であるXで、availableFlagB2が0に等しく設定され、mvLXB2の両方のコンポーネントが0に等しく設定され、refIdxLXB2が-1に等しく設定され、predFlagLXB2が0に等しく設定され、そして、gbiIdxB2が0に等しく設定される;
(外9)
Figure 2024008948000021
- それ以外の場合、availableFlagB2は1に等しく設定されて、以下の割り当てが行われる:
mvLXB2=MvLX[xNbB2][yNbB2] (8-310)
refIdxLXB2=RefIdxLX[xNbB2][yNbB2] (8-311)
predFlagLXB2=PredFlagLX[xNbB2][yNbB2] (8-312)
gbiIdxB2=GbiIdx[xNbB2][yNbB2] (8-313)
5.5 実施形態#5
この実施形態は、ATMVPプロセスにおける初期化MVの決定を単純化するものである。
8.5.5.4 サブブロックベース時間マージベース動きデータの導出プロセス
このプロセスへの入力は以下である:
- 現在符号化ブロックを含むルマ符号化ツリーブロックの左上サンプルの位置(xCtb,yCtb);
- 右下の中央サンプルをカバーするコロケートルマ符号化ブロックの左上サンプルの位置(xColCtrCb,yColCtrCb);
- 隣接符号化ユニットの利用可能性フラグavailableFlagA1
- 隣接符号化ユニットの参照インデックスrefIdxLXA1
- 隣接符号化ユニットの予測リスト利用フラグpredFlagLXA1
- 隣接符号化ユニットの1/16分数サンプル精度での動きベクトルmvLXA1
このプロセスの出力は以下である:
- 動きベクトルctrMvL0及びctrMvL1;
- 予測リスト利用フラグctrPredFlagL0及びctrPredFlagL1;
- 時間動きベクトルtempMv。
変数tempMvは次のように設定される:
tempMv[0]=0 (8-529)
tempMv[1]=0 (8-530)
変数currPicは現在ピクチャを規定する。
availableFlagA1がTRUEに等しいとき、以下が適用される:
(外10)
Figure 2024008948000022
ColPicの内側のコロケートブロックの位置(xColCb,yColCb)が、次のように導出される:
xColCb=Clip3(xCtb,
Min(CurPicWidthInSamplesY-1,xCtb+(1<<CtbLog2SizeY)+3),
xColCtrCb+(tempMv[0]>>4)) (8-531)
yColCb=Clip3(yCtb,
Min(CurPicHeightInSamplesY-1,yCtb+(1<<CtbLog2SizeY)-1),
yColCtrCb+(tempMv[1]>>4)) (8-532)
配列colPredModeが、ColPicによって規定されるコロケートピクチャの予測モード配列CuPredModeに等しく設定される。
動きベクトルctrMvL0及びctrMvL1、並びに予測リスト利用フラグctrPredFlagL0及びctrPredFlagL1が、次のように導出される:
...
5.6 実施形態#6
サブブロックベースの方法及び非サブブロックベースの方法でコロケートMVの導出プロセスを揃えることの例。
8.5.2.12 コロケート動きベクトルの導出プロセス
このプロセスへの入力は以下である:
- 現在符号化ブロックを規定する変数currCb;
- ColPicによって規定されるコロケートピクチャの内側のコロケート符号化ブロックを規定する変数colCb;
- colCbによって規定されるコロケート符号化ブロックの左上サンプルを、ColPicによって規定されるコロケートピクチャの左上ルマサンプルに対して規定するルマ位置(xColCb,yColCb);
- 0又は1であるXでの参照インデックスrefIdxLX;
- サブブロック時間マージ候補を指し示すフラグsbFlag。
このプロセスの出力は以下である:
- 1/16分数サンプル精度での動きベクトル予測mvLXCol;
- 利用可能性フラグavailableFlagLXCol。
変数currPicは現在ピクチャを規定する。
配列predFlagL0Col[x][y]、mvL0Col[x][y]、及びrefIdxL0Col[x][y]が、それぞれ、ColPicによって規定されるコロケートピクチャのPredFlagL0[x][y]、MvDmvrL0[x][y]、及びRefIdxL0[x][y]に等しく設定され、配列predFlagL1Col[x][y]、mvL1Col[x][y]、及びrefIdxL1Col[x][y]が、それぞれ、ColPicによって規定されるコロケートピクチャのPredFlagL1[x][y]、MvDmvrL1[x][y]、及びRefIdxL1[x][y]に等しく設定される。
変数mvLXCol及びavailableFlagLXColが次のように導出される:
- colCbがイントラ又はIBC予測モードで符号化される場合、mvLXColの両方のコンポーネントが0に等しく設定され、availableFlagLXColが0に等しく設定される;
- それ以外の場合、動きベクトルmvCol、参照インデックスrefIdxCol、及び参照リスト識別子listColが、次のように導出される:
(外11)
Figure 2024008948000023
(外12)
Figure 2024008948000024
- availableFlagLXColがTRUEに等しいとき、mvLXCol及びavailableFlagLXColが、次のように導出される:
- LongTermRefPic(currPic,currCb,refIdxLX,LX)がLongTermRefPic(ColPic,colCb,refIdxCol,listCol)に等しくない場合、mvLXColの両方のコンポーネントが0に等しく設定され、availableFlagLXColが0に等しく設定される;
- それ以外の場合、変数availableFlagLXColが1に等しく設定され、refPicList[listCol][refIdxCol]が、ColPicによって規定されるコロケートピクチャ内の符号化ブロックcolCbを含むスライスの参照ピクチャリストlistCol内の参照インデックスrefIdxColを有するピクチャであるように設定され、以下が適用される:
...
図22は、映像処理装置2200のブロック図である。装置2200は、ここに記載される方法のうちの1つ以上を実装するために使用され得る。装置2200は、スマートフォン、タブレット、コンピュータ、モノのインターネット(IoT)受信器にて具現化され得る。装置2200は、1つ以上のプロセッサ2202、1つ以上のメモリ2204、及び映像処理ハードウェア2206を含み得る。(1つ以上の)プロセッサ2202は、本文書に記載される1つ以上の方法を実行するように構成され得る。(1つ以上の)メモリ2204は、ここに記載される方法及び技術を実行するのに使用されるデータ及びコードを格納するために使用され得る。映像処理ハードウェア2206は、本文書に記載される一部の技術をハードウェア回路にて実装するために使用され得る。映像処理ハードウェア2206は、部分的に又は完全に、専用ハードウェア又はグラフィカルプロセッサユニット(GPU)又は特殊化された信号処理ブロックの形態で、(1つ以上の)プロセッサ2202内に含まれ得る。
ここで、本文書の一部の実施形態を、項ベースのフォーマットで提示する。
第4節の項目1に記載される技術の一部の実施形態例は以下を含む。
1. 映像処理の方法(例えば、図23に示される方法2300)であって、現在映像ブロックが少なくとも2つの非矩形サブブロックに分割される三角パーティションモード(TMP)を用いて分割される現在映像ブロックのマージリスト構築に剪定プロセスを適用するステップ(2302)であり、前記剪定プロセスは、非TMPパーティションを用いて分割される別の映像ブロックの別の剪定プロセスと同じである、ステップと、前記マージリスト構築に基づいて、前記現在映像ブロックと前記現在映像ブロックのビットストリーム表現との間での変換を実行するステップ(2304)と、を有する方法。
2. 前記剪定プロセスは、前記現在映像ブロックの空間マージ候補に部分的剪定を使用することを有する、項1に記載の方法。
3. 前記剪定プロセスは、前記現在映像ブロックの寸法に基づいて完全剪定を使用すべきか又は部分的剪定を使用すべきかを規定するブロック寸法ルールに基づいて、前記現在映像ブロックに完全剪定又は部分的剪定を適用することを有する、項1に記載の方法。
4. 前記剪定プロセスは、前記マージリスト構築プロセスにおいて異なる順序の隣接ブロックを使用することを有する、項1に記載の方法。
第4節の項目2に記載される技術の一部の実施形態例は以下を含む。
1. 映像処理の方法であって、現在映像ブロックと該現在映像ブロックのビットストリーム表現との間での変換において、前記変換に対する代替時間動きベクトル予測子コーディング(ATMVP)モードの利用可能性について、前記現在映像ブロックの隣接ブロックのリストXに基づいて決定するステップであり、ただし、Xは整数であり、Xの値は、前記現在映像ブロックの符号化条件に依存する、ステップと、前記ATMVPモードの前記利用可能性に基づいて前記変換を実行するステップと、を有する方法。
2. Xは、前記現在映像ブロックと前記ビットストリーム表現との間での前記変換に使用される時間動きベクトル予測がそこから行われるところであるコロケート映像ピクチャの位置を指し示す、項1に記載の方法。
3. Xは、前記現在映像ブロック向けの全ての参照リスト内の全ての参照ピクチャのピクチャオーダカウント(POC)を、前記現在映像ブロックの現在映像ピクチャのPOCと比較することによって決定される、項1に記載の方法。
4. 前記比較することが、POCが前記現在映像ブロックのPOC以下であることを示す場合に、X=1に設定し、それ以外の場合に、X=0に設定する、項3に記載の方法。
5. 前記ATMVPモードにおいて動き情報を初期化するために、履歴ベース動きベクトル予測子テーブルに格納された動き情報が使用される、項1に記載の方法。
第4節の項目3に記載される技術の一部の実施形態例は以下を含む。
1. 映像処理の方法であって、現在映像ブロックと該現在映像ブロックのビットストリーム表現との間での変換において、各サブブロックがそれ自身の動き情報を導出することが可能な少なくとも2つのサブブロックに前記現在映像ブロックが分割されるサブブロックベース符号化技術が前記変換に使用されることを決定するステップと、コロケート動きベクトルに対するブロックベース導出プロセスと揃えられた前記現在映像ブロックに対するマージリスト構築プロセスを用いて前記変換を実行するステップと、を有する方法。
2. 前記マージリスト構築プロセス及び前記導出プロセスは、リストYからの片予測を実行することを有し、リストYの動きベクトルが、ターゲット参照ピクチャリストXにスケーリングされる、項1に記載の方法。
3. 前記マージリスト構築プロセス及び前記導出プロセスは、ターゲット参照ピクチャリストXを用いて双予測を実行することを有し、リストYの動きベクトルが、リストXの動きベクトルにスケーリングされ、Yは、ルールに従って決定される、項1に記載の方法。
第4節の項目4に記載される技術の一部の実施形態例は以下を含む。
1. 映像処理の方法であって、映像ピクチャの現在映像ブロックの寸法、及び/又は異なる符号化ツールからのマージ候補が共有されるマージ共有状態の有効化に基づいて、条件が満たされていることと、条件が満たされていないこととの間で決定を行うステップと、前記条件に基づいて前記現在映像ブロックと前記現在映像ブロックのビットストリーム表現との間での変換を実行するステップと、を有する方法。
2. 前記変換を実行するステップは、前記条件が満たされている場合に空間マージ候補を導出することをスキップすることを有する、項1に記載の方法。
3. 前記変換を実行するステップは、前記条件が満たされている場合に履歴ベース動きベクトル候補を導出することをスキップすることを有する、項1に記載の方法。
4. 前記条件が満たされていることは、前記現在映像ブロックが前記映像ピクチャ内の共有ノードの下にあることに基づいて決定される、項1乃至3のいずれかに記載の方法。
第4節の項目5に記載される技術の一部の実施形態例は以下を含む。
1. 映像処理の方法であって、現在映像ブロックと該現在映像ブロックのビットストリーム表現との間での変換において、前記変換のために符号化ツールが無効にされることの決定を行うステップであり、前記ビットストリーム表現は、前記符号化ツールに関するマージ候補の最大数がゼロであることのインジケーションを提供するように構成される、ステップと、前記符号化ツールが無効にされることの前記決定を用いて前記変換を実行するステップと、を有する方法。
2. 前記符号化ツールは、前記現在映像ブロックのピクセルが前記現在映像ブロックの映像領域内の他のピクセルから符号化されるものであるイントラブロックコピーに相当する、項1に記載の方法。
3. 前記符号化ツールはサブブロック符号化ツールである、項1に記載の方法。
4. 前記サブブロック符号化ツールは、アフィン符号化ツール又は代替動きベクトル予測子ツールである、項3に記載の方法。
5. 前記変換を実行するステップは、前記符号化ツールに関係する構文要素をスキップすることによって前記ビットストリームを処理することを含む、項1乃至4のいずれかに記載の方法。
第4節の項目6に記載される技術の一部の実施形態例は以下を含む。
1. 映像処理の方法であって、現在映像ブロックと該現在映像ブロックのビットストリーム表現との間での変換において、ルールを用いて決定を行うステップであり、前記ルールは、前記ビットストリーム表現内の第1の構文要素が、前記変換において使用される符号化ツールによって用いられるマージ候補の最大数を指し示す第2の構文要素に基づいて条件付きで存在することを規定する、ステップと、前記決定に基づいて前記現在映像ブロックと前記現在映像ブロックのビットストリーム表現との間での前記変換を実行するステップと、を有する方法。
2. 前記第1の構文要素はマージフラグに相当する、項1に記載の方法。
3. 前記第1の構文要素はスキップフラグに相当する、項1に記載の方法。
4. 前記符号化ツールはサブバンド符号化ツールであり、前記第2の構文要素は、前記サブバンド符号化ツールに関する最大許容マージ候補に相当する、項1乃至3のいずれか一項に記載の方法。
34. 前記変換は、前記現在映像ブロックから前記ビットストリーム表現を生成することを含む、項1乃至33のいずれかに記載の方法。
35. 前記変換は、前記ビットストリーム表現から前記現在映像ブロックのサンプルを生成することを含む、項1乃至33のいずれかに記載の方法。
36. 項1乃至35のいずれかに記載の方法を実装するように構成されたプロセッサを有する映像処理装置。
37. コードを格納したコンピュータ読み取り可能媒体であって、前記コードは、実行時にプロセッサに項1乃至35のいずれかに記載の方法を実行させる、コンピュータ読み取り可能媒体。
図24は、ここに開示される様々な技術が実装され得る映像処理システム2400の一例を示すブロック図である。様々な実装は、システム2400のコンポーネントの一部又は全てを含み得る。システム2400は、映像コンテンツを受信する入力2402を含み得る。映像コンテンツは、例えば8ビット又は10ビットのマルチコンポーネント(多成分)ピクセル値といった、ロー(未加工)又は未圧縮のフォーマットで受信されてもよいし、あるいは圧縮又は符号化されたフォーマットで受信されてもよい。入力2402は、ネットワークインタフェース、周辺バスインタフェース、又はストレージインタフェースを表し得る。ネットワークインタフェースの例は、イーサネット(登録商標)、パッシブ光ネットワーク(PON)などの有線インタフェース、及びWi-Fi(登録商標)若しくはセルラーインタフェースなどの無線インタフェースを含む。
システム2400は、本文書に記載される様々なコーディング又は符号化方法を実装し得る符号化コンポーネント2404を含み得る。符号化コンポーネント2404は、入力2402から符号化コンポーネント2404の出力まで映像の平均ビットレートを低減させて、映像の符号化表現を生成し得る。符号化技術は、それ故に、映像圧縮技術又は映像トランスコーディング技術と呼ばれることがある。符号化コンポーネント2404の出力は、格納されるか、コンポーネント2406によって表されるように接続されて通信を介して伝送されるかし得る。入力2402で受信された映像の格納又は通信されるビットストリーム(又は符号化)表現は、ディスプレイインタフェース2410に送られるピクセル値又は表示可能映像を生成するためにコンポーネント2408によって使用され得る。ビットストリーム表現からユーザが見ることができる映像を生成するプロセスは、映像解凍と呼ばれることがある。また、特定の映像処理操作が“符号化”の操作又はツールとして参照されることがあるが、理解されることには、符号化のツール又は操作はエンコーダで使用され、符号化の結果を裏返す対応する復号のツール又は操作がデコーダで実行されることになる。
周辺バスインタフェース又はディスプレイインタフェースの例は、ユニバーサルシリアルバス(USB)又は高精細マルチメディアインタフェース(HDMI(登録商標))又はディスプレイポート(Displayport)などを含み得る。ストレージインタフェースの例は、SATA(serial advanced technology attachment)、PCI、IDEインタフェースなどを含む。本文書に記載される技術は、例えば携帯電話、ラップトップ、スマートフォン、又はデジタルデータ処理及び/又は映像表示を実行することが可能な他の装置などの、種々のエレクトロニクス装置にて具現化され得る。
図25は、ビジュアルメディア処理方法の一例についてのフローチャートである。このフローチャートのステップは、この文書の第4節の実施形態1に関連して説明されている。ステップ2502にて、当該プロセスは、ビジュアルメディアデータの第1の映像ブロックが幾何学的分割モード(GPM)を使用し、ビジュアルメディアデータの第2の映像ブロックが非GPMモードを使用することを決定する。ステップ2504にて、当該プロセスは、統一剪定プロセスに基づいて、第1の映像ブロックのための第1のマージリスト及び第2の映像ブロックのための第2のマージリストを構築し、当該第1のマージリスト及び当該第2のマージリストはマージ候補を有し、統一剪定プロセスは、マージリストに新たなマージ候補を、該新たなマージ候補の動き情報と該マージリスト内の少なくとも1つのマージ候補の動き情報とを比較することに基づいて追加することを含み、GPMは、第1の映像ブロックを、動き予測を別々に適用する複数の予測パーティションに分けることを有し、少なくとも1つのパーティションは、非矩形の形状を持つ。
図26は、ビジュアルメディア処理方法の一例についてのフローチャートである。このフローチャートのステップは、この文書の第4節の実施形態2に関連して説明されている。ステップ2602にて、当該プロセスは、ビジュアルメディアデータの現在映像ブロックとビジュアルメディアデータのビットストリーム表現との間での変換のために、現在映像ブロックに適用可能な動き情報の初期値をルールに基づいて決定し、ルールは、現在映像ブロックに対してサブブロックベース時間動きベクトル予測子コーディング(SbTMVP)モードが利用可能であるかを、現在映像ブロックの隣接ブロックの参照リスト(リストXと表記)に基づいて検査することを規定し、ただし、Xは整数であり、Xの値は、少なくとも、隣接ブロックの符号化条件に依存する。ステップ2604にて、当該プロセスは、決定に基づいて変換を実行する。
図27は、ビジュアルメディア処理方法の一例についてのフローチャートである。このフローチャートのステップは、この文書の第4節の実施形態3に関連して説明されている。ステップ2702にて、当該プロセスは、ビジュアルメディアデータの現在映像ブロックとビジュアルメディアデータのビットストリーム表現との間での変換のために、現在映像ブロックの1つ以上のサブブロックに対する1つ以上のコロケート動きベクトルをルールに基づいて導出し、ルールは、現在映像ブロックをビットストリーム表現へと符号化するのに使用される符号化ツールに関係なく1つ以上のコロケート動きベクトルを導出する統一導出プロセスを使用することを規定する。ステップ2704にて、当該プロセスは、1つ以上のコロケート動きベクトルを有するマージリストを用いて変換を実行する。
図28は、ビジュアルメディア処理方法の一例についてのフローチャートである。このフローチャートのステップは、この文書の第4節の実施形態4に関連して説明されている。ステップ2802にて、当該プロセスは、ビジュアルメディアデータの現在映像ブロックの寸法に関連する1つ以上の条件を特定し、現在映像ブロックにイントラブロックコピー(IBC)モードが適用される。ステップ2804にて、当該プロセスは、現在映像ブロックの寸法に関連する1つ以上の条件が満たされるかに基づいて、現在映像ブロック向けの動き候補リストの動き候補リスト構築プロセスを決定する。ステップ2806にて、当該プロセスは、動き候補リストに基づいて現在映像ブロックと現在映像ブロックのビットストリーム表現との間での変換を実行する。
図29は、ビジュアルメディア処理方法の一例についてのフローチャートである。このフローチャートのステップは、この文書の第4節の実施形態5に関連して説明されている。ステップ2902にて、当該プロセスは、ビジュアルメディアデータの現在映像ブロックとビジュアルメディアデータのビットストリーム表現との間での変換のために、変換のために符号化技術が無効にされることの決定を行い、ビットストリーム表現は、符号化技術のためのマージ候補の最大数がゼロであることを指し示すフィールドを含むように構成される。ステップ2904にて、当該プロセスは、符号化技術が無効にされることの決定に基づいて変換を実行する。
図30は、ビジュアルメディア処理方法の一例についてのフローチャートである。このフローチャートのステップは、この文書の第4節の実施形態6に関連して説明されている。ステップ3002にて、当該プロセスは、現在映像ブロックと該現在映像ブロックのビットストリーム表現との間での変換のために、ルールを用いて決定を行い、ルールは、ビットストリーム表現内の第1の構文要素が、現在映像ブロックに適用される少なくとも1つの符号化技術に関連するマージ候補の最大数を指し示すビットストリーム表現内の第2の構文要素に基づいて条件付きで含められることを規定する。ステップ3004にて、当該プロセスは、決定に基づいて現在映像ブロックと現在映像ブロックのビットストリーム表現との間での変換を実行する。
図31は、ビジュアルメディア処理方法の一例についてのフローチャートである。このフローチャートのステップは、この文書の第4節の実施形態4に関連して説明されている。ステップ3102にて、当該プロセスは、映像の現在映像ブロックと映像のビットストリーム表現との間での変換のために、現在映像ブロックの寸法に関連する1つ以上の条件に基づく動きリスト構築プロセスを使用して、動き候補リストを構築する。ステップ3104にて、当該プロセスは、動き候補リストを用いて変換を実行し、動き候補リストは、ゼロ個以上のイントラブロックコピーモード候補及び/又はゼロ個以上のアドバンスト動きベクトル予測子候補を含む。
ここで、本文書の一部の実施形態を、項ベースのフォーマットで提示する。
A1. ビジュアルメディア処理方法であって、
ビジュアルメディアデータの第1の映像ブロックが幾何学的分割モード(GPM)を使用し、ビジュアルメディアデータの第2の映像ブロックが非GPMモードを使用することを決定するステップと、
統一剪定プロセスに基づいて、前記第1の映像ブロックのための第1のマージリスト及び前記第2の映像ブロックのための第2のマージリストを構築するステップであり、当該第1のマージリスト及び当該第2のマージリストはマージ候補を有し、前記統一剪定プロセスは、マージリストに新たなマージ候補を、該新たなマージ候補の動き情報と該マージリスト内の少なくとも1つのマージ候補の動き情報とを比較することに基づいて追加することを含む、ステップと、
を有し、
前記GPMは、前記第1の映像ブロックを、動き予測を別々に適用する複数の予測パーティションに分けることを有し、少なくとも1つのパーティションは、非矩形の形状を持つ、
方法。
従って、剪定プロセスは、映像ブロックがGPMを用いて処理されるのか、それとも他の従来からの分割モードを用いて処理されるのかにかかわらずに、異なる映像ブロックに同様に適用される統一剪定プロセスである。
例えば、項A1は、代わりに、ビジュアルメディアデータの現在映像ブロックと前記ビジュアルメディアデータのビットストリーム表現との間での変換のために、構築ルールに基づいて動き候補を有するマージリストを構築するステップを有する方法として実装されてもよい。当該方法は更に、前記マージリストを使用して前記変換を実行するステップを含み得る。構築ルールは、マージ候補リストを構築するために、統一された構築手順を使用し得る。統一された構築手順は、例えば、GPMで分割される現在映像ブロックのためのマージリストが、GPM手順で分割されない第2の映像ブロックと同じ構築手順を用いて構築され得るような統一された手法で剪定プロセスを適用することができ、例えば、第1及び第2の映像ブロックのためのそれぞれ第1及び第2のマージリストの双方を生成するために同じ剪定プロセスを使用することを含む。
A2. 前記マージリスト内の前記マージ候補は空間マージ候補であり、前記統一剪定プロセスは部分的剪定プロセスである、項A1に記載の方法。
A3. 前記統一剪定プロセスに基づいて構築される前記第1のマージリスト又は前記第2のマージリストは、前記第1の映像ブロック及び/又は前記第2の映像ブロックの隣接映像ブロックからの最大4つの空間マージ候補を含む、項A1乃至A2のいずれか一項に記載の方法。
A4. 前記第1の映像ブロック及び/又は前記第2の映像ブロックの隣接映像ブロックは、左上隅にある1つの映像ブロック(B2と表記)、共通の辺を共有する右上隅にある2つの映像ブロック(B1及びB0と表記)、及び共通の辺を共有する左下隅にある2つの映像ブロック(A1及びA0と表記)を含む、項A1乃至A3のいずれか一項に記載の方法。
A5. 前記新たなマージ候補の前記動き情報を前記マージリスト内の前記少なくとも1つのマージ候補の前記動き情報と比較することは、B1とA1との比較、B1とB0との比較、A0とA1との比較、B2とA1との比較、及びB2とB1との比較を含む順序付けられたシーケンスでペアごとの比較を実行することに関連付けられ、さらに、前記動き情報を比較することは、前記第1の映像ブロックと前記第2の映像ブロックとで同じである、項A4に記載の方法。
A6. 前記統一剪定プロセスは、前記第1の映像ブロック又は前記第2の映像ブロックが1つ以上の閾値条件を満たすことに基づいて、前記空間マージ候補に選択的に適用される完全剪定プロセスである、項A1に記載の方法。
A7. 前記1つ以上の閾値条件は、前記第1の映像ブロックの寸法、及び/又は前記第2の映像ブロックの寸法、及び/又は前記第1の映像ブロック内のサンプルの数、及び/又は前記第2の映像ブロック内のサンプルの数に関係する、項A6に記載の方法。
A8. B2が関与する比較は、前記第1のマージリスト又は前記第2のマージリスト内の利用可能なマージ候補の数に基づいて選択的に実行される、項A4乃至A7のいずれか一項に記載の方法。
A9. 隣接映像ブロックは、非GPMモードを使用して分割され、B2が関与する比較は、前記第1のマージリスト又は前記第2のマージリスト内の利用可能なマージ候補の数に基づいて常に実行される、項A4乃至A7のいずれか一項に記載の方法。
B1. ビジュアルメディア処理のための方法であって、
ビジュアルメディアデータの現在映像ブロックと前記ビジュアルメディアデータのビットストリーム表現との間での変換のために、前記現在映像ブロックに適用可能な動き情報の初期値をルールに基づいて決定するステップであり、前記ルールは、前記現在映像ブロックに対してサブブロックベース時間動きベクトル予測子コーディング(SbTMVP)モードが利用可能であるかを、前記現在映像ブロックの隣接ブロックの参照リスト(リストXと表記)に基づいて検査することを規定し、ただし、Xは整数であり、Xの値は、少なくとも、前記隣接ブロックの符号化条件に依存する、ステップと、
前記決定に基づいて前記変換を実行するステップと、
を有する方法。
B2. Xは、前記現在映像ブロックと前記ビットストリーム表現との間での前記変換に使用される時間動きベクトル予測がそこから行われるところであるコロケート映像ピクチャの位置を指し示す、項B1に記載の方法。
B3. Xは、前記現在映像ブロック向けの全ての参照リスト内の全ての参照ピクチャのピクチャオーダカウント(POC)を、前記現在映像ブロックの現在映像ピクチャのPOCと比較することによって決定される、項B1に記載の方法。
B4. 前記比較することの結果が、前記現在映像ブロック向けの全ての参照リスト内の全ての参照ピクチャの前記POCが前記現在映像ブロックの前記現在映像ピクチャの前記POC以下であることを指し示す場合に、X=1に設定し、それ以外の場合に、X=0に設定する、項B3に記載の方法。
B5. 前記隣接ブロックのリストXに関連する参照ピクチャが利用可能であり、且つ該参照ピクチャのPOCが前記コロケート映像ピクチャのPOCと同じである場合、当該方法は更に、
前記SbTMVPモードにおける動き情報の前記初期値を、前記現在映像ブロックの前記隣接ブロックのリストXに関連する動き情報に設定するステップ、
を有する、項B2に記載の方法。
B6. 前記SbTMVPモードにおける動き情報の前記初期値を設定するために、履歴ベース動きベクトル予測子テーブルに格納された動き情報が使用される、項B1に記載の方法。
B7. 前記履歴ベース動きベクトル予測子テーブルに格納された前記動き情報は、前記履歴ベース動きベクトル予測子テーブル内の最初の利用可能な動き情報である、項B6に記載の方法。
B8. 前記最初の利用可能な動き情報は参照ピクチャに関連する、項B7に記載の方法。
B9. 前記参照ピクチャはコロケートピクチャである、項B8に記載の方法。
B10. Xは所定の値である、項B1に記載の方法。
B11. Xは0又は1である、項B10に記載の方法。
C1. ビジュアルメディア処理方法であって、
ビジュアルメディアデータの現在映像ブロックと前記ビジュアルメディアデータのビットストリーム表現との間での変換のために、前記現在映像ブロックの1つ以上のサブブロックに対する1つ以上のコロケート動きベクトルをルールに基づいて導出するステップであり、前記ルールは、前記現在映像ブロックを前記ビットストリーム表現へと符号化するのに使用される符号化ツールに関係なく前記1つ以上のコロケート動きベクトルを導出する統一導出プロセスを使用することを規定する、ステップと、
前記1つ以上のコロケート動きベクトルを有するマージリストを用いて前記変換を実行するステップと、
を有する方法。
C2. 前記導出プロセスが、リストYと表記する参照ピクチャリストからの片予測を利用する場合、前記リストYの動きベクトルが、リストXと表記するターゲット参照ピクチャリストにスケーリングされ、ただし、X、Yは整数であり、Xの値は、少なくとも、前記現在映像ブロックに使用される前記符号化ツールに依存する、項C1に記載の方法。
C3. 前記導出プロセスが、リストYと表記するターゲット参照ピクチャリストからの双予測を利用する場合、前記ルールは更に、前記リストYの動きベクトルを、リストXと表記するターゲット参照ピクチャリストにスケーリングすることを規定し、ただし、X、Yは整数であり、Xの値は、少なくとも、前記現在映像ブロックに使用される前記符号化ツールに依存する、項C1に記載の方法。
C4. 前記ルールは更に、前記現在映像ブロック向けの全ての参照リスト内の全ての参照ピクチャのピクチャオーダカウント(POC)を前記現在映像ブロックの現在映像ピクチャのPOCと比較することによってXを決定することを規定する、項C2乃至C3のいずれか一項に記載の方法。
C5. 前記ルールは更に、前記現在映像ブロック向けの全ての参照リスト内の全ての参照ピクチャのPOCを前記現在映像ブロックの前記現在映像ピクチャの前記POCと比較することによってYを決定することを規定する、項C4に記載の方法。
C6. 前記比較することの結果が、前記現在映像ブロック向けの全ての参照リスト内の全ての参照ピクチャのPOCが前記現在映像ブロックの前記現在映像ピクチャの前記POC以下であることを指し示す場合、前記ルールは、Y=Xに設定することを規定し、それ以外の場合、前記ルールは、前記現在映像ブロックと前記ビットストリーム表現との間での前記変換に使用される時間動きベクトル予測がそこから行われるところであるコロケート映像ピクチャの位置にXを設定することを規定する、項C5に記載の方法。
D1. ビジュアルメディア処理のための方法であって、
ビジュアルメディアデータの現在映像ブロックの寸法に関連する1つ以上の条件を特定するステップであり、前記現在映像ブロックにイントラブロックコピー(IBC)モードが適用される、ステップと、
前記現在映像ブロックの前記寸法に関連する前記1つ以上の条件が満たされるかに基づいて、前記現在映像ブロック向けの動き候補リストの動き候補リスト構築プロセスを決定するステップと、
前記動き候補リストに基づいて前記現在映像ブロックと前記現在映像ブロックのビットストリーム表現との間での変換を実行するステップと、
を有する方法。
D2. ビジュアルメディア処理のための方法であって、
映像の現在映像ブロックと前記映像のビットストリーム表現との間での変換のために、前記現在映像ブロックの寸法に関連する1つ以上の条件に基づく動きリスト構築プロセスを使用して、動き候補リストを構築するステップと、
前記動き候補リストを用いて前記変換を実行するステップであり、前記動き候補リストは、ゼロ個以上のイントラブロックコピーモード候補及び/又はゼロ個以上のアドバンスト動きベクトル予測子候補を含む、ステップと、
を有する方法。
D3. 前記動き候補リスト構築プロセスは、前記1つ以上の条件が満たされた場合に、空間マージ候補の導出をスキップすることを有する、項D1乃至D2のいずれか一項に記載の方法。
D4. 前記動き候補リスト構築プロセスは、前記1つ以上の条件が満たされた場合に、履歴ベース動きベクトル候補の導出をスキップすることを有する、項D1乃至D2のいずれか一項に記載の方法。
D5. 前記動き候補リスト構築プロセスは、前記1つ以上の条件が満たされた場合に、ペアワイズマージ候補の導出をスキップすることを有する、項D1乃至D2のいずれか一項に記載の方法。
D6. 前記動き候補リスト構築プロセスは、前記1つ以上の条件が満たされた場合に、最大剪定処理の総数を減少させることを有する、項D1乃至D2のいずれか一項に記載の方法。
D7. 前記最大剪定処理の総数はゼロに減少される、項D6に記載の方法。
D8. 前記1つ以上の条件は、前記現在映像ブロックの幅と前記現在映像ブロックの高さとの積が閾値以下である場合に満たされる、項D1乃至D7のいずれか一項に記載の方法。
D9. 前記閾値は64、32又は16である、項D8に記載の方法。
D10. 前記1つ以上の条件は、前記現在映像ブロックの幅及び/又は前記現在映像ブロックの高さが閾値未満である場合に満たされる、項D1乃至D9のいずれか一項に記載の方法。
D11. 前記閾値は4又は8である、項D10に記載の方法。
D12. 前記動き候補リストは、IBCマージリスト又はIBC動きベクトル予測リストを含む、項D1乃至D2のいずれか一項に記載の方法。
E1. ビジュアルメディア処理のための方法であって、
ビジュアルメディアデータの現在映像ブロックと前記ビジュアルメディアデータのビットストリーム表現との間での変換のために、前記変換のために符号化技術が無効にされることの決定を行うステップであり、前記ビットストリーム表現は、前記符号化技術のためのマージ候補の最大数がゼロであることを指し示すフィールドを含むように構成される、ステップと、
前記符号化技術が無効にされることの前記決定に基づいて前記変換を実行するステップと、
を有する方法。
E2. 前記ビットストリーム表現は更に、前記符号化技術のためのマージ候補の前記最大数がゼロであることを前記フィールドが指し示すことに基づいて、1つ以上の構文要素のシグナリングをスキップするように構成される、項E1に記載の方法。
E3. 前記符号化技術は、前記現在映像ブロックのサンプルが前記現在映像ブロックの映像領域内の他のサンプルから符号化されるものであるイントラブロックコピーに相当する、項E1に記載の方法。
E4. 前記符号化技術はサブブロック符号化技術である、項E1に記載の方法。
E5. 前記サブブロック符号化技術は、アフィン符号化技術又は代替動きベクトル予測子技術である、項E4に記載の方法。
E6. 適用される前記符号化技術は、結合イントラ-イントラ予測(CIIP)、幾何学的パーティションモード(GPM)、デコーダ動きベクトル精緻化(DMVR)、サブブロックマージ、イントラブロックコピーマージ、通常マージ、又は動きベクトル差付きマージ(MMVD)のうちの1つを含む、項E1乃至E2のいずれか一項に記載の方法。
F1. ビジュアルメディア処理のための方法であって、
現在映像ブロックと該現在映像ブロックのビットストリーム表現との間での変換のために、ルールを用いて決定を行うステップであり、前記ルールは、前記ビットストリーム表現内の第1の構文要素が、前記現在映像ブロックに適用される少なくとも1つの符号化技術に関連するマージ候補の最大数を指し示す前記ビットストリーム表現内の第2の構文要素に基づいて条件付きで含められることを規定する、ステップと、
前記決定に基づいて前記現在映像ブロックと前記現在映像ブロックのビットストリーム表現との間での前記変換を実行するステップと、
を有する方法。
F2. 前記第1の構文要素はマージフラグに相当する、項F1に記載の方法。
F3. 前記第1の構文要素はスキップフラグに相当する、項F1に記載の方法。
F4. マージ候補の前記最大数はゼロである、項F1乃至F3のいずれか一項に記載の方法。
F5. 前記第2の構文要素は、前記ビットストリーム表現に含められることからスキップされ、当該方法は更に、
前記第2の構文要素がゼロであると推定するステップ、
を有する、項F4に記載の方法。
F6. 前記少なくとも1つの符号化技術は、結合イントラ-イントラ予測(CIIP)、幾何学的パーティションモード(GPM)、デコーダ動きベクトル精緻化(DMVR)、サブブロックマージ、イントラブロックコピーマージ、通常マージ、又は動きベクトル差付きマージ(MMVD)を含む、項F1乃至F5のいずれか一項に記載の方法。
F7. 前記ルールは更に、前記第1の構文要素がブールの真に相当し且つ前記少なくとも1つの符号化技術が有効にされることを特定することを規定する、項F1乃至F6のいずれか一項に記載の方法。
F8. 前記ルールは更に、スライス、タイル、ブリック、ピクチャ、又は現在映像ブロックに対してイントラブロックコピー(IBC)技術を無効にすることを規定する、項F7に記載の方法。
F9. 前記ルールは更に、スライス、タイル、ブリック、ピクチャ、又は現在映像ブロックに対して動きベクトル差付きマージ(MMVD)技術を無効にすることを規定する、項F7に記載の方法。
F10. 前記ルールは更に、スライス、タイル、ブリック、ピクチャ、又は現在映像ブロックに対して結合イントラ-イントラ予測(CIIP)技術を無効にすることを規定する、項F7に記載の方法。
F11. 前記ルールは更に、スライス、タイル、ブリック、ピクチャ、又は現在映像ブロックに対して幾何学的パーティションモード(GPM)技術を無効にすることを規定する、項F7に記載の方法。
G1. 前記変換は、前記現在映像ブロックから前記ビットストリーム表現を生成することを含む、項A1乃至F11のいずれかに記載の方法。
G2. 前記変換は、前記ビットストリーム表現から前記現在映像ブロックのサンプルを生成することを含む、項A1乃至F11のいずれかに記載の方法。
G3. 項A1乃至F11のいずれかに記載の方法を実装するように構成されたプロセッサを有する映像処理装置。
G4. 項A1乃至F11のいずれかに記載の方法を実装するように構成されたプロセッサを有する映像符号化装置。
G5. 項A1乃至F11のいずれかに記載の方法を実装するように構成されたプロセッサを有する映像復号装置。
G6. コードを格納したコンピュータ読み取り可能媒体であって、前記コードは、実行時にプロセッサに項A1乃至F11のいずれかに記載の方法を実行させる、コンピュータ読み取り可能媒体。
本文書において、用語“映像処理”又は“ビジュアルメディア処理”は、映像符号化、映像復号、映像圧縮又は映像解凍を指し得る。例えば、映像圧縮アルゴリズムが、映像のピクセル表現から対応するビットストリーム表現への変換又はその逆の変換の間に適用され得る。現在映像ブロックのビットストリーム表現は、例えば、構文によって規定されるように、ビットストリーム内でコロケートにある又は異なるところに広がったビットに対応し得る。例えば、マクロブロックは、変換され符号化された誤差残差値に関して符号化されることができ、また、ビットストリーム内のヘッダ及び他のフィールド内のビットを使用して符号化されることができる。さらに、変換中に、デコーダは、上のソリューションに記載されるように、決定に基づいて、何らかのフィールドが存在し得る又は存在しないという知識を用いて、ビットストリームを構文解析し得る。同様に、エンコーダは、特定の構文フィールドが含められるべきか否かを決定し、それら構文フィールドを符号化表現に含める又は符号化表現から除外することによって、然るべく符号化表現を生成し得る。
開示される及びその他のソリューション、この文書に記述される例、実施形態、モジュール及び機能動作は、この文書に開示されている構造及びそれらに構造的に均等なものを含め、デジタル電子回路、又はコンピュータソフトウェア、ファームウェア、若しくはハードウェアにて、あるいはこれらのうちの1つ以上の組み合わせにて実施されることができる。開示される及びその他の実施形態は、1つ以上のコンピュータプログラムプロダクトとして実装されることができ、すなわち、データ処理装置による実行のための、又はデータ処理装置の動作を制御するための、コンピュータ読み取り可能媒体にエンコードされたコンピュータプログラム命令の1つ以上のモジュールとして実装されることができる。コンピュータ読み取り可能媒体は、機械読み取り可能記憶装置、機械読み取り可能記憶基板、メモリ装置、機械読み取り可能な伝搬信号を生じさせる物質の組成、又はそれらのうちの1つ以上の組み合わせとすることができる。用語“データ処理装置”は、例として、プログラマブルプロセッサ、コンピュータ、又は複数のプロセッサ若しくはコンピュータを含め、データを処理するあらゆる装置、デバイス、及び機械を包含する。装置は、ハードウェアに加えて、例えば、プロセッサファームウェア、プロトコルスタック、データベース管理システム、オペレーティングシステム、又はそれらのうちの1つ以上の組み合わせを構成するコードといった、問題としているコンピュータプログラムのための実行環境を作り出すコードを含むことができる。伝播される信号は、人工的に生成される信号であり、例えば、適切な受信器装置への伝送のために情報をエンコードするために生成される機械生成による電気信号、光信号、又は電磁信号である。
コンピュータプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、スクリプト、又はコードとしても知られる)は、コンパイル型又はインタープリタ型の言語を含め、如何なる形態のプログラミング言語で記述されてもよく、また、スタンドアロンプログラムとして、又はコンピューティング環境での使用に適したモジュール、コンポーネント、サブルーチン、若しくは他のユニットとして、を含め、如何なる形態で展開されてもよい。コンピュータプログラムは、必ずしもファイルシステム内のファイルに対応するわけではない。プログラムは、他のプログラム若しくはデータを保持するファイルの一部(例えば、マークアップ言語文書に格納された1つ以上のスクリプト)に格納されてもよいし、問題としているプログラムに専用の単一ファイルに格納されてもよいし、あるいは、複数の連携ファイル(例えば、1つ以上のモジュール、サブプログラム、又はコードの部分を格納するファイル)に格納されてもよい。コンピュータプログラムは、1つのコンピュータ上で実行されるように展開されてもよいし、あるいは、一箇所に配置された、又は複数箇所に分散されて通信ネットワークによって相互接続された、複数のコンピュータ上で実行されるように展開されてもよい。
この文書に記載されるプロセス及び論理フローは、入力データについて演算して出力を生成することによって機能を実行するよう、1つ以上のコンピュータプログラムを実行する1つ以上のプログラマブルプロセッサによって実行されることができる。これらのプロセス及び論理フローはまた、例えばFPGA(フィールドプログラマブルゲートアレイ)又はASIC(特定用途向け集積回路)といった専用の論理回路によって実行されることもでき、また、装置も、そのような専用の論理回路として実装されることができる。
コンピュータプログラムの実行に適したプロセッサは、例として、汎用及び専用の双方のマイクロプロセッサ、及び任意の種類のデジタルコンピュータの任意の1つ以上のプロセッサを含む。一般に、プロセッサは、読み出し専用メモリ若しくはランダムアクセスメモリ又はこれらの両方から命令及びデータを受信する。コンピュータの必須要素は、命令を実行するためのプロセッサと、命令及びデータを格納する1つ以上のメモリデバイスである。一般に、コンピュータはまた、例えば磁気ディスク、磁気光ディスク、又は光ディスクといった、データを格納するための1つ以上の大容量ストレージ装置を含み、あるいは、大容量ストレージ装置からデータを受信したり、それにデータを転送したりするように動作的に結合される。しかしながら、コンピュータは、そのような装置を有する必要はない。コンピュータプログラム命令及びデータを格納するのに適したコンピュータ読み取り可能媒体は、例として、例えばEPROM、EEPROM、及びフラッシュメモリデバイスといった半導体メモリデバイス、例えば内部ハードディスク又はリムーバブルディスクといった磁気ディスク;光磁気ディスク;並びにCD ROM及びDVD-ROMディスクを含め、あらゆる形態の不揮発性メモリ、媒体及びメモリデバイスを含む。プロセッサ及びメモリは、専用の論理回路によって補われたり、それに組み込まれたりしてもよい。
この特許文書は数多くの詳細が含んでいるが、それらは、いずれかの主題又は特許請求され得るものの範囲についての限定として解釈されるべきでなく、むしろ、特定の技術の特定の実施形態に特有とし得る機構の説明として解釈されるべきである。別々の実施形態の文脈でこの特許文書に記載されている特定の複数の機構が、単一の実施形態にて組み合わせて実装されることもできる。逆に、単一の実施形態の文脈で説明されている種々の機構が、複数の実施形態にて別々に、又は何らかの好適なサブコンビネーションで実装されることもできる。さらには、複数の機構が、特定の組み合わせにて作用するものとして上述され、さらには当初はそのように特許請求されていることがあり得るが、場合によって、特許請求されている組み合わせからの1以上の機構を組み合わせから除くこともでき、また、特許請求されている組み合わせをサブコンビネーション又はサブコンビネーションのバリエーションへと導いてもよい。
同様に、図面には処理が特定の順序で示されるが、このことは、所望の結果を達成するために、それらの動作が図示される特定の順序で若しくは順番に実行されること、又は図示される全ての処理が実行されることを要求するものとして理解されるべきでない。また、この特許文書に記載されている実施形態における種々のシステムコンポーネントの分離は、全ての実施形態においてそのような分離を必要とするものとして理解されるべきでない。
ほんの少しの実装及び例を記載したのみであり、この特許文書に記載及び図示されているものに基づいて、他の実装、拡張及び変形が行われ得る。

Claims (25)

  1. 映像データを処理する方法であって、
    映像の第1ブロックと前記映像のビットストリームとの間での第1の変換において、前記第1ブロックが、予測モードである幾何学的パーティションモードでコーディングされることを決定するステップと、
    前記第1ブロック向けの候補リストを構築するステップであり、当該構築は、前記候補リスト内の利用可能な候補の数に基づいて、特定の隣接ブロックB2における空間候補の利用可能性を検査することを含み、該特定の隣接ブロックB2は前記第1ブロックの左上隅にある、ステップと、
    前記候補リストに基づいて、前記第1ブロックの第1の幾何学的パーティションについての第1の動き情報と、前記第1ブロックの第2の幾何学的パーティションについての第2の動き情報とを決定するステップと、
    前記第1の動き情報及び前記第2の動き情報に基づいて導出される予測サンプルの加重和に基づいて、予測前記第1ブロックのサンプルについての最終的な予測を生成するための重み付けプロセスを適用するステップと、
    前記適用に基づいて前記第1の変換を実行するステップと、
    を有する方法。
  2. 前記候補リスト内の利用可能な候補の前記数が4であるとき、前記特定の隣接ブロックB2における前記空間候補は利用可能でない、請求項1に記載の方法。
  3. 前記候補リストは、剪定プロセスに基づいて構築され、該剪定プロセスは、同じ空間候補を避けるために少なくとも2つの空間候補の間で動き情報を比較することを有する、請求項1に記載の方法。
  4. 前記剪定プロセスに基づいて前記第1ブロック向けの前記候補リストを構築することは、前記第1ブロックの左下隅に隣接する特定の隣接ブロックA1における空間候補の利用可能性を検査することを含み、該検査は、
    前記候補リストが、前記第1ブロックの右上隅に隣接する特定の隣接ブロックB1における空間候補を含むときに、前記特定の隣接ブロックA1における前記空間候補と前記特定の隣接ブロックB1における前記空間候補との間で動き情報を比較し、
    A1における前記空間候補の前記動き情報がB1におけるそれと同じであることを該比較の結果が指し示すことに基づいて、前記特定の隣接ブロックA1における前記空間候補は利用可能でないと決定する、
    ことを有する、請求項3に記載の方法。
  5. 前記剪定プロセスに基づいて前記第1ブロック向けの前記候補リストを構築することは、前記第1ブロックの右上隅にある特定の隣接ブロックB0における空間候補の利用可能性を検査することを含み、該検査は、
    前記候補リストが、前記第1ブロックの右上隅に隣接する特定の隣接ブロックB1における空間候補を含むときに、前記特定の隣接ブロックB0における前記空間候補と前記特定の隣接ブロックB1における前記空間候補との間で動き情報を比較し、
    B0における前記空間候補の前記動き情報がB1におけるそれと同じであることを該比較の結果が指し示すことに基づいて、前記特定の隣接ブロックB0における前記空間候補は利用可能でないと決定する、
    ことを有する、請求項3に記載の方法。
  6. 前記剪定プロセスに基づいて前記第1ブロック向けの前記候補リストを構築することは、前記第1ブロックの左下隅にある特定の隣接ブロックA0における空間候補の利用可能性を検査することを含み、該検査は、
    前記候補リストが、前記第1ブロックの左下隅に隣接する特定の隣接ブロックA1における空間候補を含むときに、前記特定の隣接ブロックA0における前記空間候補と前記特定の隣接ブロックA1における前記空間候補との間で動き情報を比較し、
    A0における前記空間候補の前記動き情報がA1におけるそれと同じであることを該比較の結果が指し示すことに基づいて、前記特定の隣接ブロックA0における前記空間候補は利用可能でないと決定する、
    ことを有する、請求項3に記載の方法。
  7. 前記特定の隣接ブロックB2における前記空間候補の前記利用可能性を検査することは更に、
    前記候補リストが、前記第1ブロックの左下隅に隣接する特定の隣接ブロックA1及び前記第1ブロックの右上隅に隣接する特定の隣接ブロックB1における空間候補を含むときに、前記特定の隣接ブロックB2における前記空間候補と前記特定の隣接ブロックA1及びB1における前記空間候補との間で動き情報を比較し、
    B2における前記空間候補の前記動き情報がA1又はB1におけるそれと同じであることを該比較の結果が指し示すことに基づいて、前記特定の隣接ブロックB2における前記空間候補は利用可能でないと決定する、
    ことを含む、請求項3に記載の方法。
  8. 前記第1の動き情報が第1の参照ピクチャリストLXからであり且つ前記第2の動き情報が第2の参照ピクチャリストL(1-X)からであることに応答して、前記第1ブロックの加重領域内のm×nサブブロックについての第2の単一セットの動き情報を格納するステップであり、該第2の単一セットの動き情報は双予測動き情報を有し、X=0又はX=1である、ステップ、
    を更に有する請求項1に記載の方法。
  9. 前記第1ブロックの非加重領域内のm×nサブブロックについての第3の単一セットの動き情報を格納するステップであり、該第3の単一セットの動き情報は、前記第1の動き情報又は前記第2の動き情報に基づく片予測動き情報を有する、ステップ、
    を更に有する請求項1に記載の方法。
  10. イントラブロックコピーモードでコーディングされる隣接ブロックに対応する空間候補は、前記第1ブロック向けの前記候補リストから除外され、前記イントラブロックコピーモードでは、前記隣接ブロックの予測サンプルは、ブロックベクトルによって決定されるのと同じ復号映像領域のサンプル値のブロックから導出される、請求項1に記載の方法。
  11. 映像データを処理する方法であって、
    前記映像中の第2ブロックと前記映像の前記ビットストリームとの間での第2の変換において、前記第2ブロックが第1の予測モードでコーディングされることを決定するステップであり、前記第1の予測モードでは、ブロックベクトルによって決定されるのと同じ復号映像領域のサンプル値のブロックから予測サンプルが導出される、ステップと、
    前記第2ブロックの幅及び高さに関連する条件が満たされるかに基づいて、前記第2ブロック向けの動き候補リストの動き候補リスト構築プロセスを決定するステップであり、該条件は、前記第2ブロックの前記幅と前記高さとの積が閾値以下であるときに満たされる、ステップと、
    前記動き候補リストに基づいて前記第2の変換を実行するステップと、
    を更に有する請求項1に記載の方法。
  12. 前記条件が満たされるとき、前記動き候補リスト構築プロセスの空間マージ候補の導出がスキップされる、請求項11に記載の方法。
  13. 前記動き候補リスト構築プロセスは、
    少なくとも1つの空間候補を前記動き候補リストに追加すること、
    少なくとも1つの履歴ベース動きベクトル予測子候補を前記動き候補リストに追加すること、又は
    少なくとも1つのゼロ候補を前記動き候補リストに追加すること、
    のうちの少なくとも1つを含む、請求項11に記載の方法。
  14. 少なくとも1つの空間候補を前記動き候補リストに追加することは、
    特定の隣接ブロックC1における空間候補の利用可能性を検査し、該特定の隣接ブロックC1は、前記第2ブロックの左下隅に隣接し、
    前記特定の隣接ブロックC1が利用可能であることに応答して、前記特定の隣接ブロックC1における前記空間候補を前記動き候補リストに追加し、
    特定の隣接ブロックD1における空間候補の利用可能性を検査し、該特定の隣接ブロックD1は、前記第2ブロックの右上隅に隣接する、
    ことを含み、
    前記特定の隣接ブロックD1が利用可能であることに応答して、第1の冗長性検査が実行され、該第1の冗長性検査は、特定の隣接ブロックC1における前記空間候補の動き情報と同じ動き情報を有する特定の隣接ブロックD1における前記空間候補が、前記動き候補リストから排除されることを確保する、
    請求項13に記載の方法。
  15. 前記動き候補リスト構築プロセスは、
    前記少なくとも1つの空間候補を追加した後に、前記動き候補リストのサイズが、前記第1の予測モードに関する許容最大リストサイズよりも小さい場合に、前記少なくとも1つの履歴ベース動きベクトル予測子候補を前記動き候補リストに追加すること、
    を含む、請求項13に記載の方法。
  16. 第2の冗長性検査が実行され、該第2の冗長性検査は、前記少なくとも1つの履歴ベース動きベクトル予測子候補を追加するときに、同じ動き情報を有する候補が前記動き候補リストから排除されることが適用されることを確保する、請求項15に記載の方法。
  17. 前記動き候補リスト構築プロセスは、
    前記動き候補リストのサイズが、前記第1の予測モードに関する許容最大リストサイズよりも小さいことに応答して、前記少なくとも1つのゼロ候補を前記動き候補リストに追加すること、
    を含む、請求項13に記載の方法。
  18. 前記映像中の第3ブロックと前記映像の前記ビットストリームとの間での第3の変換において、前記第3ブロックが第2の予測モードでコーディングされることを決定するステップであり、前記第2の予測モードでは、信号伝達される動きベクトル予測子が、前記ビットストリーム内で明示的に信号伝達されるオフセットに基づいて精緻化される、ステップと、
    前記第3ブロックの幅及び高さに関連する条件が満たされるかに基づいて、前記第3ブロック向けの第2の動き候補リストの第2の動き候補リスト構築プロセスを決定するステップであり、前記第3ブロックの前記幅及び前記高さに関連する該条件は、前記第3ブロックの前記幅と前記高さとの積が第2の閾値以下であるときに満たされる、ステップと、
    前記第2の動き候補リストに基づいて前記第3の変換を実行するステップと、
    を更に有する請求項11に記載の方法。
  19. 一般マージツールを指し示すフラグが第4ブロックに対して有効にされるとき、通常マージ、動きベクトル差付きマージモード(MMVD)、サブブロックマージ、結合イントラ-イントラ予測(CIIP)、又は幾何学的パーティションモード(GPM)から選択される少なくとも1つのコーディング技術が、前記第4ブロックに対して適用され、
    前記動きベクトル差付きマージモードは、現在ブロックの動き情報を導出するのに使用される動きベクトル表現を有し、該動きベクトル表現は、動きベクトル差を表す第1のパラメータと、ベース候補リストからのベース候補を指し示す第2のパラメータとを有し、前記第1のパラメータは、動きの大きさ及び動きの向きを有し、
    前記サブブロックマージでは、現在ブロックが、少なくとも1つのサブブロックに分割され、該少なくとも1つのサブブロックの動き情報が、コロケートピクチャ内の映像領域に基づいて導出され、該映像領域の位置は、前記現在ブロックの左下隅に隣接する特定の隣接ブロックが利用可能であることに応答して、該特定の隣接ブロックに関する特定の動き情報に設定されるデフォルト動き情報に初期化された時間動き情報に基づいて導出され、
    前記CIIPモードでは、前記現在ブロックの予測信号が、少なくともイントラ予測信号及びインター予測信号に基づいて生成される、
    請求項11に記載の方法。
  20. 前記第1の予測モードはイントラブロックコピーモードである、請求項11に記載の方法。
  21. 前記変換は、前記第1ブロックを前記ビットストリームへと符号化することを含む、請求項1乃至20のいずれかに記載の方法。
  22. 前記変換は、前記ビットストリームから前記第1ブロックを復号することを含む、請求項1乃至20のいずれかに記載の方法。
  23. プロセッサと、命令を有する非一時的なメモリと、を有する映像データを処理する装置であって、前記命令は、前記プロセッサによって実行されると、前記プロセッサに、
    映像の第1ブロックと前記映像のビットストリームとの間での第1の変換において、前記第1ブロックが、予測モードである幾何学的パーティションモードでコーディングされることを決定させ、
    前記第1ブロック向けの候補リストを構築させ、当該構築は、前記候補リスト内の利用可能な候補の数に基づいて、特定の隣接ブロックB2における空間候補の利用可能性を検査することを含み、該特定の隣接ブロックB2は前記第1ブロックの左上隅にあり、
    前記候補リストに基づいて、前記第1ブロックの第1の幾何学的パーティションについての第1の動き情報と、前記第1ブロックの第2の幾何学的パーティションについての第2の動き情報とを決定させ、
    前記第1の動き情報及び前記第2の動き情報に基づいて導出される予測サンプルの加重和に基づいて、予測前記第1ブロックのサンプルについての最終的な予測を生成するための重み付けプロセスを適用させ、
    前記適用に基づいて前記第1の変換を実行させる、
    装置。
  24. 命令を格納した非一時的なコンピュータ読み取り可能記憶媒体であって、前記命令は、プロセッサに、
    映像の第1ブロックと前記映像のビットストリームとの間での第1の変換において、前記第1ブロックが、予測モードである幾何学的パーティションモードでコーディングされることを決定させ、
    前記第1ブロック向けの候補リストを構築させ、当該構築は、前記候補リスト内の利用可能な候補の数に基づいて、特定の隣接ブロックB2における空間候補の利用可能性を検査することを含み、該特定の隣接ブロックB2は前記第1ブロックの左上隅にあり、
    前記候補リストに基づいて、前記第1ブロックの第1の幾何学的パーティションについての第1の動き情報と、前記第1ブロックの第2の幾何学的パーティションについての第2の動き情報とを決定させ、
    前記第1の動き情報及び前記第2の動き情報に基づいて導出される予測サンプルの加重和に基づいて、予測前記第1ブロックのサンプルについての最終的な予測を生成するための重み付けプロセスを適用させ、
    前記適用に基づいて前記第1の変換を実行させる、
    コンピュータ読み取り可能記憶媒体。
  25. 映像のビットストリームを格納する方法であって、
    映像の第1ブロックと前記映像のビットストリームとの間での第1の変換において、前記第1ブロックが、予測モードである幾何学的パーティションモードでコーディングされることを決定するステップと、
    前記第1ブロック向けの候補リストを構築するステップであり、当該構築は、前記候補リスト内の利用可能な候補の数に基づいて、特定の隣接ブロックB2における空間候補の利用可能性を検査することを含み、該特定の隣接ブロックB2は前記第1ブロックの左上隅にある、ステップと、
    前記候補リストに基づいて、前記第1ブロックの第1の幾何学的パーティションについての第1の動き情報と、前記第1ブロックの第2の幾何学的パーティションについての第2の動き情報とを決定するステップと、
    前記第1の動き情報及び前記第2の動き情報に基づいて導出される予測サンプルの加重和に基づいて、予測前記第1ブロックのサンプルについての最終的な予測を生成するための重み付けプロセスを適用するステップと、
    前記適用に基づいて前記ビットストリームを生成するステップと、
    前記ビットストリームを非一時的なコンピュータ読み取り可能記録媒体に格納するステップと、
    を有する方法。
JP2023182535A 2019-06-04 2023-10-24 動き候補リスト構築プロセスの条件付き実行 Pending JP2024008948A (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
CN2019089970 2019-06-04
CNPCT/CN2019/089970 2019-06-04
JP2021571916A JP7425808B2 (ja) 2019-06-04 2020-06-04 動き候補リスト構築プロセスの条件付き実行
PCT/CN2020/094306 WO2020244569A1 (en) 2019-06-04 2020-06-04 Conditional implementation of motion candidate list construction process

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2021571916A Division JP7425808B2 (ja) 2019-06-04 2020-06-04 動き候補リスト構築プロセスの条件付き実行

Publications (1)

Publication Number Publication Date
JP2024008948A true JP2024008948A (ja) 2024-01-19

Family

ID=73652347

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2021571979A Active JP7446339B2 (ja) 2019-06-04 2020-06-04 幾何学的分割モードコーディングを用いた動き候補リスト
JP2021571916A Active JP7425808B2 (ja) 2019-06-04 2020-06-04 動き候補リスト構築プロセスの条件付き実行
JP2023182535A Pending JP2024008948A (ja) 2019-06-04 2023-10-24 動き候補リスト構築プロセスの条件付き実行

Family Applications Before (2)

Application Number Title Priority Date Filing Date
JP2021571979A Active JP7446339B2 (ja) 2019-06-04 2020-06-04 幾何学的分割モードコーディングを用いた動き候補リスト
JP2021571916A Active JP7425808B2 (ja) 2019-06-04 2020-06-04 動き候補リスト構築プロセスの条件付き実行

Country Status (6)

Country Link
US (2) US11611743B2 (ja)
EP (2) EP3963883A4 (ja)
JP (3) JP7446339B2 (ja)
KR (2) KR20220016075A (ja)
CN (2) CN114097228B (ja)
WO (2) WO2020244568A1 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220103854A1 (en) * 2019-01-31 2022-03-31 Mediatek Inc. Method and Apparatus of Combined Inter and Intra Prediction for Video Coding
CN117395397A (zh) 2019-06-04 2024-01-12 北京字节跳动网络技术有限公司 使用临近块信息的运动候选列表构建
CN114097228B (zh) 2019-06-04 2023-12-15 北京字节跳动网络技术有限公司 具有几何分割模式编解码的运动候选列表
CN114175636B (zh) 2019-07-14 2024-01-12 北京字节跳动网络技术有限公司 自适应参数集中的自适应环路滤波的指示
WO2021057996A1 (en) 2019-09-28 2021-04-01 Beijing Bytedance Network Technology Co., Ltd. Geometric partitioning mode in video coding
CN117652142A (zh) * 2021-04-09 2024-03-05 抖音视界有限公司 用于视频处理的方法、设备和介质
EP4320863A1 (en) * 2021-04-09 2024-02-14 Beijing Dajia Internet Information Technology Co., Ltd. Geometric partition mode with explicit motion signaling
WO2023094216A1 (en) * 2021-11-25 2023-06-01 Interdigital Vc Holdings France, Sas Method and device for picture encoding and decoding
WO2023143119A1 (en) * 2022-01-28 2023-08-03 Mediatek Inc. Method and apparatus for geometry partition mode mv assignment in video coding system
US20230336773A1 (en) * 2022-04-18 2023-10-19 Tencent America LLC On motion compensated picture boundary padding

Family Cites Families (155)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050111545A1 (en) 2003-11-25 2005-05-26 Ram Prabhakar Dynamic packet size control for MPEG-4 data partition mode
CN101415121B (zh) * 2007-10-15 2010-09-29 华为技术有限公司 一种自适应的帧预测的方法及装置
JP5526032B2 (ja) * 2007-10-16 2014-06-18 トムソン ライセンシング ジオメトリック分割されたスーパブロックをビデオ符号化およびビデオ復号する方法および装置
TWI428023B (zh) 2008-11-18 2014-02-21 Ind Tech Res Inst 解碼方法及裝置
KR101098739B1 (ko) 2008-11-24 2011-12-23 한국전자통신연구원 비디오 신호의 부호화/복호화 장치 및 방법
US9036692B2 (en) * 2010-01-18 2015-05-19 Mediatek Inc. Motion prediction method
WO2011089849A1 (en) * 2010-01-20 2011-07-28 Semiconductor Energy Laboratory Co., Ltd. Portable electronic device
US8879632B2 (en) 2010-02-18 2014-11-04 Qualcomm Incorporated Fixed point implementation for geometric motion partitioning
US9819966B2 (en) 2010-09-01 2017-11-14 Qualcomm Incorporated Filter description signaling for multi-filter adaptive filtering
US9807424B2 (en) 2011-01-10 2017-10-31 Qualcomm Incorporated Adaptive selection of region size for identification of samples in a transition zone for overlapped block motion compensation
US9826238B2 (en) 2011-06-30 2017-11-21 Qualcomm Incorporated Signaling syntax elements for transform coefficients for sub-sets of a leaf-level coding unit
JP5884697B2 (ja) * 2011-09-28 2016-03-15 株式会社Jvcケンウッド 動画像符号化装置、動画像符号化方法、動画像符号化プログラム、送信装置、送信方法及び送信プログラム
US20130107973A1 (en) 2011-10-28 2013-05-02 Qualcomm Incorporated Loop filtering control over tile boundaries
US20130114717A1 (en) * 2011-11-07 2013-05-09 Qualcomm Incorporated Generating additional merge candidates
US9451277B2 (en) * 2012-02-08 2016-09-20 Qualcomm Incorporated Restriction of prediction units in B slices to uni-directional inter prediction
US10003810B2 (en) * 2012-03-22 2018-06-19 Mediatek Inc. Method and apparatus of scalable video coding
US9549180B2 (en) 2012-04-20 2017-01-17 Qualcomm Incorporated Disparity vector generation for inter-view prediction for video coding
US20130294513A1 (en) * 2012-05-07 2013-11-07 Qualcomm Incorporated Inter layer merge list construction for video coding
US20130329007A1 (en) 2012-06-06 2013-12-12 Qualcomm Incorporated Redundancy removal for advanced motion vector prediction (amvp) in three-dimensional (3d) video coding
US20130336406A1 (en) * 2012-06-14 2013-12-19 Qualcomm Incorporated Redundancy removal for merge/skip mode motion information candidate list construction
US9749645B2 (en) 2012-06-22 2017-08-29 Microsoft Technology Licensing, Llc Coded-block-flag coding and derivation
US9088770B2 (en) 2012-08-15 2015-07-21 Intel Corporation Size based transform unit context derivation
US20140071235A1 (en) 2012-09-13 2014-03-13 Qualcomm Incorporated Inter-view motion prediction for 3d video
US9491461B2 (en) 2012-09-27 2016-11-08 Qualcomm Incorporated Scalable extensions to HEVC and temporal motion vector prediction
US9699450B2 (en) 2012-10-04 2017-07-04 Qualcomm Incorporated Inter-view predicted motion vector for 3D video
WO2014053086A1 (en) 2012-10-05 2014-04-10 Mediatek Singapore Pte. Ltd. Method and apparatus of motion vector derivation 3d video coding
US9357214B2 (en) 2012-12-07 2016-05-31 Qualcomm Incorporated Advanced merge/skip mode and advanced motion vector prediction (AMVP) mode for 3D video
US9357212B2 (en) 2012-12-07 2016-05-31 Qualcomm Incorporated Advanced residual prediction in scalable and multi-view video coding
US9538180B2 (en) 2012-12-17 2017-01-03 Qualcomm Incorporated Motion vector prediction in video coding
CN109982094A (zh) 2013-04-02 2019-07-05 Vid拓展公司 针对可伸缩视频编码的增强型时间运动向量预测
US9609347B2 (en) 2013-04-04 2017-03-28 Qualcomm Incorporated Advanced merge mode for three-dimensional (3D) video coding
US9288507B2 (en) 2013-06-21 2016-03-15 Qualcomm Incorporated More accurate advanced residual prediction (ARP) for texture coding
US9716899B2 (en) 2013-06-27 2017-07-25 Qualcomm Incorporated Depth oriented inter-view motion vector prediction
WO2015003383A1 (en) 2013-07-12 2015-01-15 Mediatek Singapore Pte. Ltd. Methods for inter-view motion prediction
WO2015007159A1 (en) 2013-07-15 2015-01-22 Mediatek Singapore Pte. Ltd. Method of disparity derived depth coding in 3d video coding
US10171818B2 (en) 2013-07-24 2019-01-01 Microsoft Technology Licensing, Llc Scanning orders for non-transform coding
US9762927B2 (en) 2013-09-26 2017-09-12 Qualcomm Incorporated Sub-prediction unit (PU) based temporal motion vector prediction in HEVC and sub-PU design in 3D-HEVC
US10567806B2 (en) 2013-11-15 2020-02-18 Mediatek Inc. Method of block-based adaptive loop filtering
US9432685B2 (en) 2013-12-06 2016-08-30 Qualcomm Incorporated Scalable implementation for parallel motion estimation regions
US20150271515A1 (en) * 2014-01-10 2015-09-24 Qualcomm Incorporated Block vector coding for intra block copy in video coding
WO2015131387A1 (en) 2014-03-07 2015-09-11 Qualcomm Incorporated Simplified sub-prediction unit (sub-pu) motion parameter inheritence (mpi)
WO2015135169A1 (en) 2014-03-13 2015-09-17 Qualcomm Incorporated Constrained depth intra mode coding for 3d video coding
CN103942793B (zh) 2014-04-16 2016-11-16 上海交通大学 基于热扩散的视频一致运动区域检测方法
WO2015180014A1 (en) * 2014-05-26 2015-12-03 Mediatek Singapore Pte. Ltd. An improved merge candidate list construction method for intra block copy
KR20170018838A (ko) 2014-06-16 2017-02-20 퀄컴 인코포레이티드 3d―hevc 에서의 간략화된 병합 후보의 시프팅 및 병합 리스트 유도
WO2015195944A1 (en) 2014-06-19 2015-12-23 Vid Scale, Inc. Methods and systems for intra block copy search enhancement
US10027981B2 (en) * 2014-09-01 2018-07-17 Hfi Innovation Inc. Method of intra picture block copy for screen content and video coding
EP3192261A1 (en) 2014-09-12 2017-07-19 VID SCALE, Inc. Inter-component de-correlation for video coding
EP3198872A1 (en) * 2014-09-26 2017-08-02 VID SCALE, Inc. Intra block copy coding with temporal block vector prediction
GB2531003A (en) 2014-10-06 2016-04-13 Canon Kk Method and apparatus for vector encoding in video coding and decoding
US9854237B2 (en) * 2014-10-14 2017-12-26 Qualcomm Incorporated AMVP and merge candidate list derivation for intra BC and inter prediction unification
US11477477B2 (en) * 2015-01-26 2022-10-18 Qualcomm Incorporated Sub-prediction unit based advanced temporal motion vector prediction
CN107431817B (zh) 2015-01-29 2020-03-24 Vid拓展公司 用于调色板译码的方法及装置
US10057574B2 (en) 2015-02-11 2018-08-21 Qualcomm Incorporated Coding tree unit (CTU) level adaptive loop filter (ALF)
GB2539213A (en) * 2015-06-08 2016-12-14 Canon Kk Schemes for handling an AMVP flag when implementing intra block copy coding mode
US10356416B2 (en) 2015-06-09 2019-07-16 Qualcomm Incorporated Systems and methods of determining illumination compensation status for video coding
CN105141957B (zh) 2015-07-31 2019-03-15 广东中星电子有限公司 图像和视频数据编解码的方法和设备
CA2995507C (en) * 2015-09-02 2021-05-25 Mediatek Inc. Method and apparatus of decoder side motion derivation for video coding
US10218975B2 (en) 2015-09-29 2019-02-26 Qualcomm Incorporated Transform precision manipulation in video coding
US10812822B2 (en) * 2015-10-02 2020-10-20 Qualcomm Incorporated Intra block copy merge mode and padding of unavailable IBC reference region
EP3357227A1 (en) 2015-10-02 2018-08-08 VID SCALE, Inc. Color correction with a lookup table
EP3357245A4 (en) * 2015-11-05 2019-03-13 MediaTek Inc. METHOD AND DEVICE OF INTERPRESSATION USING AN AVERAGE MOTION VECTOR FOR VIDEO CODING
US10200719B2 (en) 2015-11-25 2019-02-05 Qualcomm Incorporated Modification of transform coefficients for non-square transform units in video coding
US11563938B2 (en) 2016-02-15 2023-01-24 Qualcomm Incorporated Geometric transforms for filters for video coding
FI20165256L (fi) * 2016-03-24 2017-09-25 Nokia Technologies Oy Laitteisto, menetelmä ja tietokoneohjelma videokoodaukseen ja -dekoodaukseen
FI20165257A (fi) * 2016-03-24 2017-09-25 Nokia Technologies Oy Laitteisto, menetelmä ja tietokoneohjelma videokoodaukseen ja -dekoodaukseen
KR20190015216A (ko) 2016-05-05 2019-02-13 브이아이디 스케일, 인크. 인트라 코딩을 위한 제어 포인트 기반의 인트라 방향 표현
US10560718B2 (en) * 2016-05-13 2020-02-11 Qualcomm Incorporated Merge candidates for motion vector prediction for video coding
US10419755B2 (en) 2016-05-16 2019-09-17 Qualcomm Incorporated Confusion of multiple filters in adaptive loop filtering in video coding
US11095922B2 (en) 2016-08-02 2021-08-17 Qualcomm Incorporated Geometry transformation-based adaptive loop filtering
US10326986B2 (en) 2016-08-15 2019-06-18 Qualcomm Incorporated Intra video coding using a decoupled tree structure
US10271069B2 (en) 2016-08-31 2019-04-23 Microsoft Technology Licensing, Llc Selective use of start code emulation prevention
US10721489B2 (en) 2016-09-06 2020-07-21 Qualcomm Incorporated Geometry-based priority for the construction of candidate lists
US10448010B2 (en) 2016-10-05 2019-10-15 Qualcomm Incorporated Motion vector prediction for affine motion models in video coding
WO2018099269A1 (en) * 2016-11-29 2018-06-07 Mediatek Inc. Method and apparatus of merge mode derivation for video coding
US20180184127A1 (en) 2016-12-22 2018-06-28 Qualcomm Incorporated Determining neighboring samples for bilateral filtering in video coding
US10506230B2 (en) 2017-01-04 2019-12-10 Qualcomm Incorporated Modified adaptive loop filter temporal prediction for temporal scalability support
US11025903B2 (en) 2017-01-13 2021-06-01 Qualcomm Incorporated Coding video data using derived chroma mode
CN106961606B (zh) 2017-01-26 2020-04-07 浙江工业大学 基于纹理划分特征的hevc帧内编码模式选择方法
KR102559063B1 (ko) 2017-02-24 2023-07-24 주식회사 케이티 비디오 신호 처리 방법 및 장치
EP3586513A4 (en) * 2017-03-16 2020-12-09 MediaTek Inc METHOD AND APPARATUS FOR REFINING MOTION BASED ON A BIDIRECTIONAL OPTICAL FLOW FOR VIDEO CODING
US10523934B2 (en) * 2017-05-31 2019-12-31 Mediatek Inc. Split based motion vector operation reduction
WO2019001734A1 (en) * 2017-06-30 2019-01-03 Huawei Technologies Co., Ltd. ENCODER, DECODER, COMPUTER PROGRAM, AND COMPUTER PROGRAM PRODUCT FOR PROCESSING A FRAME OF A VIDEO SEQUENCE
US10778974B2 (en) 2017-07-05 2020-09-15 Qualcomm Incorporated Adaptive loop filter with enhanced classification methods
US11172203B2 (en) * 2017-08-08 2021-11-09 Mediatek Inc. Intra merge prediction
CN116744018A (zh) * 2017-08-29 2023-09-12 Sk电信有限公司 视频编码方法、视频解码方法和传输比特流的方法
CN111567045A (zh) * 2017-10-10 2020-08-21 韩国电子通信研究院 使用帧间预测信息的方法和装置
US10785494B2 (en) 2017-10-11 2020-09-22 Qualcomm Incorporated Low-complexity design for FRUC
CN111213379B (zh) 2017-10-16 2023-11-21 数字洞察力有限公司 用于将图像编码/解码的方法、装置和存储比特流的记录介质
US20190116374A1 (en) 2017-10-17 2019-04-18 Qualcomm Incorporated Coding motion information of video data using coding structure-based candidate list construction
WO2019079611A1 (en) 2017-10-18 2019-04-25 Huawei Technologies Co., Ltd. GENERATION OF MOVEMENT VECTOR CANDIDATES LIST DEPENDING ON THE AVAILABILITY OF A NEIGHBORING BLOCK
JP2021016016A (ja) * 2017-10-20 2021-02-12 シャープ株式会社 動画像符号化装置及び動画像復号装置
KR20200095464A (ko) 2017-11-01 2020-08-10 브이아이디 스케일, 인크. 비디오 코딩에서 적응적 루프 필터를 단순화하기 위한 방법
SG11202002881XA (en) 2017-11-14 2020-05-28 Qualcomm Inc Unified merge candidate list usage
US10721469B2 (en) 2017-11-28 2020-07-21 Qualcomm Incorporated Line buffer reduction for adaptive loop filtering in video coding
WO2019136657A1 (en) * 2018-01-11 2019-07-18 Qualcomm Incorporated Video coding using local illumination compensation
US20190238845A1 (en) 2018-01-26 2019-08-01 Qualcomm Incorporated Adaptive loop filtering on deblocking filter results in video coding
CN111886861B (zh) * 2018-02-22 2023-12-22 Lg电子株式会社 根据图像编码系统中的块划分结构的图像解码方法和设备
CN108449599B (zh) * 2018-03-23 2021-05-18 安徽大学 一种基于面透射变换的视频编码与解码方法
JP7088606B2 (ja) 2018-04-02 2022-06-21 エスゼット ディージェイアイ テクノロジー カンパニー リミテッド 動画処理方法、画像処理装置、プログラム、符号化デバイス、及び復号化デバイス
US20190306502A1 (en) 2018-04-02 2019-10-03 Qualcomm Incorporated System and method for improved adaptive loop filtering
US10397603B1 (en) * 2018-05-08 2019-08-27 Tencent America LLC Method and apparatus for video coding
US10506251B2 (en) * 2018-05-08 2019-12-10 Tencent America LLC Method and apparatus for video coding
EP3791586A1 (en) 2018-06-29 2021-03-17 Beijing Bytedance Network Technology Co. Ltd. Concept of using one or multiple look up tables to store motion information of previously coded in order and use them to code following blocks
BR112020024142A2 (pt) 2018-06-29 2021-03-02 Beijing Bytedance Network Technology Co., Ltd. método para processamento de vídeo, aparelho para codificação de dados de vídeo, meio de armazenamento e meio de gravação legíveis por computador não transitório
TWI731358B (zh) 2018-06-29 2021-06-21 大陸商北京字節跳動網絡技術有限公司 改進的時域運動向量預測推導
CN110677668B (zh) 2018-07-01 2022-06-21 北京字节跳动网络技术有限公司 空间运动压缩
TWI748202B (zh) 2018-07-02 2021-12-01 大陸商北京字節跳動網絡技術有限公司 Lamvr中取整和修剪的順序
US10531090B1 (en) * 2018-07-02 2020-01-07 Tencent America LLC Method and apparatus for video coding
US11051010B2 (en) 2018-07-18 2021-06-29 Mediatek Inc. Merge candidates with multiple hypothesis
US10362330B1 (en) * 2018-07-30 2019-07-23 Tencent America LLC Combining history-based motion vector prediction and non-adjacent merge prediction
US10523963B1 (en) * 2018-07-30 2019-12-31 Tencent America LLC Method and apparatus for merge mode in video coding
WO2020044196A1 (en) 2018-08-26 2020-03-05 Beijing Bytedance Network Technology Co., Ltd. Combined history-based motion vector predictor and multi-motion model decoding
CN111064961B (zh) 2018-09-12 2023-06-09 北京字节跳动网络技术有限公司 视频处理方法和装置
CN112740685A (zh) 2018-09-19 2021-04-30 韩国电子通信研究院 图像编码/解码方法和装置以及存储有比特流的记录介质
TWI821408B (zh) 2018-09-23 2023-11-11 大陸商北京字節跳動網絡技術有限公司 塊級別的運動向量平面模式
TWI822863B (zh) 2018-09-27 2023-11-21 美商Vid衡器股份有限公司 360度視訊寫碼樣本導出
WO2020084554A1 (en) 2018-10-24 2020-04-30 Beijing Bytedance Network Technology Co., Ltd. Searching based motion candidate derivation for sub-block motion vector prediction
WO2020088689A1 (en) 2018-11-02 2020-05-07 Beijing Bytedance Network Technology Co., Ltd. Usage of hmvp candidates in geometry partition prediction mode
CN117979023A (zh) 2018-11-06 2024-05-03 北京字节跳动网络技术有限公司 具有几何分割的帧间预测的边信息信令
WO2020094078A1 (en) 2018-11-06 2020-05-14 Beijing Bytedance Network Technology Co., Ltd. Position dependent storage of motion information
CN112997495B (zh) 2018-11-10 2024-02-20 北京字节跳动网络技术有限公司 当前图片参考中的取整
CN112970258B (zh) 2018-11-13 2023-08-18 北京字节跳动网络技术有限公司 用于子块预测块的多假设
WO2020098695A1 (en) 2018-11-13 2020-05-22 Beijing Bytedance Network Technology Co., Ltd. Construction method for a single type motion candidate list
WO2020098807A1 (en) 2018-11-17 2020-05-22 Beijing Bytedance Network Technology Co., Ltd. Controlling merge with motion vector differencing mode
WO2020103936A1 (en) 2018-11-22 2020-05-28 Beijing Bytedance Network Technology Co., Ltd. Pruning method for inter prediction with geometry partition
WO2020108571A1 (en) 2018-11-28 2020-06-04 Beijing Bytedance Network Technology Co., Ltd. Extension method for motion reference in intra block copy mode
CN113170150B (zh) 2018-12-03 2024-02-27 北京字节跳动网络技术有限公司 基于历史的运动矢量预测(hmvp)模式的部分修剪方法
WO2020135465A1 (en) 2018-12-28 2020-07-02 Beijing Bytedance Network Technology Co., Ltd. Modified history based motion prediction
CN109874011B (zh) * 2018-12-28 2020-06-09 杭州海康威视数字技术股份有限公司 编码方法、解码方法及装置
WO2020140242A1 (zh) 2019-01-03 2020-07-09 北京大学 视频处理方法和装置
WO2020143741A1 (en) 2019-01-10 2020-07-16 Beijing Bytedance Network Technology Co., Ltd. Invoke of lut updating
CN113383554B (zh) 2019-01-13 2022-12-16 北京字节跳动网络技术有限公司 LUT和共享Merge列表之间的交互
WO2020147805A1 (en) 2019-01-17 2020-07-23 Beijing Bytedance Network Technology Co., Ltd. Deblocking filtering using motion prediction
US10904557B2 (en) * 2019-01-22 2021-01-26 Tencent America LLC Method and apparatus for video coding
CN117714694A (zh) 2019-02-17 2024-03-15 北京字节跳动网络技术有限公司 处理视频数据的方法、装置和计算机可读记录介质
WO2020176636A1 (en) 2019-02-27 2020-09-03 Futurewei Technologies, Inc. Luma mapping with chroma scaling adaptation parameter set in video coding
KR102393325B1 (ko) 2019-02-28 2022-05-02 엘지전자 주식회사 Aps 시그널링 기반 비디오 또는 영상 코딩
BR112021014711A2 (pt) 2019-03-11 2021-09-28 Panasonic Intellectual Property Corporation Of America Codificador, decodificador, método de codificação e método de decodificação
SG11202109980WA (en) 2019-03-11 2021-10-28 Huawei Tech Co Ltd Sub-picture level filtering in video coding
CN116389769A (zh) 2019-03-13 2023-07-04 北京大学 视频处理方法和设备
CN113574889B (zh) 2019-03-14 2024-01-12 北京字节跳动网络技术有限公司 环路整形信息的信令和语法
CN115243056A (zh) 2019-03-24 2022-10-25 抖音视界有限公司 视频处理中的多参数自适应环路滤波
KR102647470B1 (ko) 2019-04-15 2024-03-14 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 비선형 적응형 루프 필터링에서 파라미터의 시간적 예측
CN117499679A (zh) 2019-04-16 2024-02-02 北京字节跳动网络技术有限公司 用于视频编解码的自适应环路滤波
US11284114B2 (en) 2019-04-23 2022-03-22 Qualcomm Incorporated Adaptive loop filter set index signaling
KR20210135337A (ko) 2019-05-14 2021-11-12 엘지전자 주식회사 적응적 루프 필터 기반 비디오 또는 영상 코딩
US11019334B2 (en) 2019-05-17 2021-05-25 Qualcomm Incorporated Multiple adaptive loop filter sets for video coding
CN114097228B (zh) 2019-06-04 2023-12-15 北京字节跳动网络技术有限公司 具有几何分割模式编解码的运动候选列表
CN117395397A (zh) 2019-06-04 2024-01-12 北京字节跳动网络技术有限公司 使用临近块信息的运动候选列表构建
US11166033B2 (en) 2019-06-06 2021-11-02 Qualcomm Incorporated Adaptation parameter set in access unit in video coding
US11736688B2 (en) 2019-06-21 2023-08-22 Qualcomm Incorporated Adaptive loop filter signalling
CN114175636B (zh) 2019-07-14 2024-01-12 北京字节跳动网络技术有限公司 自适应参数集中的自适应环路滤波的指示
US11432016B2 (en) 2019-12-05 2022-08-30 Hfi Innovation Inc. Methods and apparatuses of syntax signaling constraint for cross-component adaptive loop filter in video coding system
US11563980B2 (en) 2020-04-02 2023-01-24 Qualcomm Incorporated General constraint information syntax in video coding

Also Published As

Publication number Publication date
EP3963883A1 (en) 2022-03-09
EP3963883A4 (en) 2023-06-14
EP3963889A4 (en) 2023-01-25
CN113994698B (zh) 2023-11-24
US11611743B2 (en) 2023-03-21
JP7446339B2 (ja) 2024-03-08
KR20220016075A (ko) 2022-02-08
WO2020244569A1 (en) 2020-12-10
CN114097228B (zh) 2023-12-15
JP2022536090A (ja) 2022-08-12
JP2022536622A (ja) 2022-08-18
US11463687B2 (en) 2022-10-04
CN114097228A (zh) 2022-02-25
KR20220016839A (ko) 2022-02-10
US20220086433A1 (en) 2022-03-17
EP3963889A1 (en) 2022-03-09
JP7425808B2 (ja) 2024-01-31
WO2020244568A1 (en) 2020-12-10
CN113994698A (zh) 2022-01-28
US20220094914A1 (en) 2022-03-24

Similar Documents

Publication Publication Date Title
JP7446339B2 (ja) 幾何学的分割モードコーディングを用いた動き候補リスト
WO2020259426A1 (en) Motion candidate list construction for intra block copy mode
CN114128258B (zh) 视频编解码中的变换块尺寸的限制
WO2020244659A1 (en) Interactions between sub-block based intra block copy and different coding tools
CN114450959A (zh) 视频编解码中的几何分割模式
JP7460661B2 (ja) 映像符号化のための動き候補リストの構成
CN113545076A (zh) 基于图片头中的信息启用bio
CN113966616B (zh) 使用临近块信息的运动候选列表构建

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20231122