JP2024512647A - 明示的な動きシグナリングを用いた幾何学的分割 - Google Patents

明示的な動きシグナリングを用いた幾何学的分割 Download PDF

Info

Publication number
JP2024512647A
JP2024512647A JP2023560089A JP2023560089A JP2024512647A JP 2024512647 A JP2024512647 A JP 2024512647A JP 2023560089 A JP2023560089 A JP 2023560089A JP 2023560089 A JP2023560089 A JP 2023560089A JP 2024512647 A JP2024512647 A JP 2024512647A
Authority
JP
Japan
Prior art keywords
gpm
flag
geometric
prediction
mvr
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2023560089A
Other languages
English (en)
Inventor
シウ、シャオユ
チェン、ウェイ
クオ、チャーウェイ
チェン、イーウェン
ジュー、ホンジェン
ワン、シァンリン
ユー、ビン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Dajia Internet Information Technology Co Ltd
Original Assignee
Beijing Dajia Internet Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Dajia Internet Information Technology Co Ltd filed Critical Beijing Dajia Internet Information Technology Co Ltd
Publication of JP2024512647A publication Critical patent/JP2024512647A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/577Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

幾何学的分割モード(GPM)でビデオブロックを復号するための方法、装置、及び非一時的コンピュータ可読記憶媒体が提供される。本方法は、ビデオブロックを第1及び第2の幾何学的分割に分割することと、第1の幾何学的分割のための第1の予測リストを取得することと、第2の幾何学的分割のための第2の予測リストを取得することと、第1及び第2の予測リストに基づいて第1及び第2の幾何学的分割に明示的動きシグナリング(EMS)を伴うGPMを適用することによって、第1及び第2の幾何学的分割のための動きベクトル(MV)を取得することと、MVに基づいて第1及び第2の幾何学的分割の予測サンプルを取得することとを含む。

Description

[関連出願の相互参照]
本出願は、2021年4月9日に出願された米国特許仮出願第63/173,303号に基づくとともに、それに対する優先権を主張するものであり、その開示は、あらゆる目的のためにその全体を、本明細書の一部を構成するものとして援用する。
本開示は、ビデオコーディング、及び圧縮に関する。より詳細には、本開示は、幾何学的分割(GPM)モードのコーディング効率を改善することに関する方法、及び装置に関する。
様々なビデオコーディング技法が、ビデオデータを圧縮するために使用され得る。ビデオコーディングは、1以上のビデオコーディング規格に従って実行される。例えば、最近では、いくつかの周知のビデオコーディング規格には多用途ビデオコーディング(VCC)、高効率ビデオコーディング(HEVC、H.265又はMPEG-H Part2としても知られる)、及びアドバンスド・ビデオコーディング(AVC、H.264又はMPEG-4 Part10としても知られる)が含まれ、これらはISO/IEC MPEG、及びITU-T VECGによって共同開発される。AOMedia Video 1(AV1)は、Alliance for Open Media(AOM)によって、その前の標準VP9の後継として開発された。オーディオビデオコーディング(AVS)は、デジタルオーディオ、及びデジタルビデオ圧縮規格を指すが、中国のオーディオ及びビデオコーディング規格ワークグループによって開発された別のビデオ圧縮規格シリーズである。既存のビデオコーディング規格のほとんどは、有名なハイブリッドビデオコーディングフレームワーク上に構築され、すなわち、ビデオ画像又はシーケンスに存在する冗長性を低減するためにブロックベースの予測方法(例えば、インター予測、イントラ予測)を使用し、予測誤差のエネルギーを圧縮するために変換コーディングを使用する。ビデオコーディング技法の重要な目標は、ビデオ品質の劣化を回避又は最小限に抑えながら、ビデオデータをより低いビットレートを使用する形式に圧縮することである。
本開示は、ビデオコーディングのための方法及び装置、並びにその非一時的コンピュータ可読記憶媒体を提供する。
幾何学的分割モード(GPM)でビデオブロックを復号する方法が提供される。本方法は、ビデオブロックを第1の幾何学的分割と第2の幾何学的分割とに分割することを含み得る。本方法は、第1の幾何学的分割のための第1の動きベクトル精緻化(MVR)を取得することと、第2の幾何学的分割のための第2のMVRを取得することとを含み得る。本方法は、第1及び第2の予測リストに基づいて、明示的動きシグナリング(EMS)を伴うGPMを、第1及び第2の幾何学的分割に適用することによって、第1及び第2の幾何学的分割の動きベクトル(MV)を取得することを含み得る。本方法は、MVに基づいて第1及び第2の幾何学的分割の予測サンプルを取得することを含み得る。
本開示の第2の態様によれば、GPMにおいてビデオブロックを復号する方法が提供される。本方法は、ビデオブロックを第1及び第2の幾何学的分割に区分することと、第1の幾何学的分割のための第1のMVと、第2の幾何学的分割のための第2のMVとを取得することとを含み得る。本方法は、第1及び第2の予測リストに基づいて、第1及び第2の幾何学的分割にMVRを伴うGPM、又はEMSを伴うGPMを適用することによって、第1及び第2の幾何学的分割のMVを取得することを含み得る。本方法は、MVに基づいて第1及び第2の幾何学的分割の予測サンプルを取得することを含み得る。
本開示の第3の態様によれば、ビデオコーディングのための装置が提供される。本装置は、1以上のプロセッサと、非一時的コンピュータ可読記憶媒体とを含み得る。非一時的コンピュータ可読記憶媒体は、1以上のプロセッサによって実行可能な命令を記憶するように構成される。1以上のプロセッサは、命令の実行の際に、第1又は第2の態様における方法を実行するように構成される。
本開示の第4の態様によれば、非一時的なコンピュータ可読記憶媒体が提供される。非一時的コンピュータ可読記憶媒体は、1以上のコンピュータプロセッサに、1以上のコンピュータプロセッサによって実行されるときに、第1の態様又は第2の態様における方法を実行させるコンピュータ実行可能命令を記憶し得る。
添付の図面は、本明細書に組み込まれ、本明細書の一部を構成するが、詳細な説明と共に本開示と一致する実施例を例示し、本開示の原理を説明するのに役立つ。
図1は、本開示の一実施例によるエンコーダのブロック図である。 図2は、本開示の一実施例によるデコーダのブロック図である。 図3Aは、本開示の一実施例に係るマルチタイプツリー構造におけるブロック分割を例示する図である。 図3Bは、本開示の一実施例に係るマルチタイプツリー構造におけるブロック分割を例示する図である。 図3Cは、本開示の一実施例に係るマルチタイプツリー構造におけるブロック分割を例示する図である。 図3Dは、本開示の一実施例に係るマルチタイプツリー構造におけるブロック分割を例示する図である。 図3Eは、本開示の一実施例に係るマルチタイプツリー構造におけるブロック分割を例示する図である。 図4は、本開示の一実施例に係る、許可された幾何学的分割(GPM)の図である。 図5は、本開示の一実施例に係る片予測動きベクトル選択を例示する表である。 図6Aは、本開示の一実施例に係る動きベクトル差分(MMVD)モードの図である。 図6Bは、本開示の一実施例に係るMMVDモードの図である。 図7は、本開示の一実施例による、GPMにおいてビデオブロックを復号化する方法である。 図8は、本開示の一実施例による、GPMにおいてビデオブロックを復号化する方法である。 図9は、本開示の一実施例によるユーザインタフェースと結合されたコンピューティング環境を例示する図である。
ここで、実施形態について詳細に説明するが、その実施例は添付の図面に例示されている。以下の説明では、異なる図面において同じ番号が、別途示されない限り、同一又は類似の要素を表す、添付図面を参照する。以下の実施形態の説明に記載される具体例は、本開示と一致するすべての具体例を表すわけではない。むしろ、それらは、添付の特許請求の範囲に記載されるように、本開示に関連する態様と一致する装置及び方法の例示にすぎない。
本開示で使用される用語は、特定の実施形態を説明するためのものにすぎず、本開示を限定することを意図するものではない。本開示、及び添付の特許請求の範囲で使用されるように、単数形「a」、「an」、及び「the」は文脈が明らかに他のものを示唆するものでない限り、複数形も含むことを意図している。本明細書で使用される「及び/又は」という用語も、関連して列挙された品目のうちの1以上の、いずれか又はすべての可能な組合せを示唆、及び含むことを意図していることが理解されるべきである。
「第1の」、「第2の」、「第3の」等の用語は様々な情報を説明するために本明細書で使用され得るが、情報はこれらの用語によって限定されるべきではないことを理解されたい。これらの用語は、あるカテゴリの情報を他のものから区別するためにのみ使用される。例えば、本開示の範囲から逸脱することなく、第1の情報を第2の情報と呼ぶことができ、同様に、第2の情報を第1の情報と呼ぶこともできる。本明細書で使用するとき、用語「の場合(if)」は、文脈に応じて「のとき(when)」又は「の際(upon)」又は「の判断に応じて(in response to a judgment)」を意味すると理解することができる。
第1世代のAVS規格は、中国の国家規格「情報技術、アドバンスド・オーディオビデオコーディング、パート2:ビデオ」(AVS1として知られている)及び「情報技術、アドバンスド・オーディオビデオコーディングパート16:ラジオテレビビデオ」(AVS+として知られている)を含む。これは、MPEG-2規格と比較して、同じ知覚品質で約50%のビットレートの節約を提供することができる。2006年2月、中国の国家規格として、AVS1規格ビデオパートが公表された。第2世代のAVS規格は、主に追加のHDテレビ番組の伝送を対象とする一連の中国の国家規格「Information Technology, Efficient Multimedia Coding」(AVS2として知られている)を含む。AVS2のコーディング効率はAVS+の2倍である。2016年5月、中国の国家規格としてAVS2が発行された。一方、AVS2規格ビデオパートは、IEEE(Institute of Electrical and Electronics Engineers)によって、実用のための1つの国際規格として提出された。AVS3規格は、最新の国際規格HEVCのコーディング効率を超えることを目的としたUHDビデオアプリケーションのための1つの新しい世代のビデオコーディング規格である。2019年3月、第68回AVS会議では、AVS3-P2ベースラインが終了し、HEVC規格よりも約30%のビットレート削減が可能となった。現在、AVS3規格の参照実施を実証するために、高性能モデル(HPM)と呼ばれる1つの参照ソフトウェアがAVSグループによって維持されている。
HEVCと同様に、AVS3規格は、ブロックベースのハイブリッドビデオコーディングフレームワークに基づいて構築される。
図1は、VVCのためのブロックベースのビデオエンコーダの一般的な図を示す。具体的には、図1は典型的なエンコーダ100を示す。エンコーダ100は、ビデオ入力110と、動き補償112と、動き推定114と、イントラ/インターモード決定116と、ブロック予測器140と、加算器128と、変換130と、量子化132と、予測関連情報142と、イントラ予測118と、ピクチャバッファ120と、逆量子化134と、逆変換136と、加算器126と、メモリ124と、ループ内フィルタ122と、エントロピーコーディング138と、ビットストリーム144とを有する。
エンコーダ100において、ビデオフレームは、処理のために複数のビデオブロックに分割される。所与のビデオブロックごとに、インター予測手法又はイントラ予測手法のいずれかに基づいて予測が形成される。
現在のビデオブロックと、ビデオ入力110の一部と、ブロック予測器140の一部であるその予測器との間の差分を表す予測残差は、加算器128から変換130に送られる。変換係数は、次いで、変換130からエントロピー低減のための量子化132に送られる。次いで、量子化された係数は、エントロピーコーディング138に供給されて、圧縮されたビデオビットストリームを生成する。図1に示すように、ビデオブロック分割情報、動きベクトル(MV)、参照ピクチャインデックス、及びイントラ予測モードなどの、イントラ/インターモード決定116からの予測関連情報142もまた、エントロピーコーディング138を通して供給され、圧縮ビットストリーム144に保存される。圧縮ビットストリーム144は、ビデオビットストリームを含む。
エンコーダ100では、予測の目的で画素を再構成するために、デコーダ関連回路も必要とされる。第1に、逆量子化134及び逆変換136によって予測残差が再構成される。この再構成された予測残差は、ブロック予測器140と組み合わされて、現在のビデオブロックのためのフィルタリングされていない再構成画素を生成する。
空間予測(又は「イントラ予測」)は、現在のビデオブロックと同じビデオフレーム中の既にコーディングされた隣接ブロック(参照サンプルと呼ばれる)のサンプルからの画素を使用して、現在のビデオブロックを予測する。
時間予測(「インター予測」とも呼ばれる)は、既にコーディングされたビデオピクチャからの再構成された画素を使用して、現在のビデオブロックを予測する。時間予測は、ビデオ信号に固有の時間的冗長性を低減する。時間予測は、ビデオ信号に固有の時間的冗長性を低減する。所与のコーディングユニット(CU)、又はコーディングブロックのための時間予測信号は、通常、現在のCUとその時間基準との間の動きの量及び方向を示す1以上のMVによってシグナリングされる。さらに、複数の参照ピクチャがサポートされる場合、1つの参照ピクチャインデックスが追加的に送られるが、それは、時間予測信号が参照ピクチャストア内のどの参照ピクチャから来るかを識別するために使用される。
動き推定114は、ビデオ入力110及びピクチャバッファ120からの信号を取り込み、動き推定信号を動き補償112に出力する。動き推定114は、ビデオ入力110及びピクチャバッファ120からの信号を取り込み、動き推定信号を動き補償112に出力する。動き補償112は、ビデオ入力110、ピクチャバッファ120からの信号、及び動き推定114からの動き推定信号を取り込み、イントラ/インターモード決定116に、動き補償信号を出力する。
空間及び/又は時間予測が実行された後、エンコーダ100内のイントラ/インターモード決定116は例えば、レート歪み最適化方法に基づいて、最良の予測モードを選択する。ブロック予測器140は次いで、現在のビデオブロックから減算され、結果として生じる予測残差は変換130及び量子化132を使用して非相関化される。得られた量子化された残差係数は、逆量子化134によって逆量子化され、逆変換136によって逆変換されて、再構成された残差が形成されるが、それは次いで予測ブロックに加算されて戻され、CUの再構成された信号を形成する。デブロッキングフィルタ、サンプル適応オフセット(SAO)、及び/又は適応ループ内フィルタ(ALF)などのさらなるループ内フィルタリング122は、再構成されたCUがピクチャバッファ120の参照ピクチャストアに入れられ、将来のビデオブロックをコーディングするために使用される前に、再構成されたCUに適用され得る。出力ビデオビットストリーム144を形成するために、コーディングモード(インター又はイントラ)、予測モード情報、動き情報、及び量子化残差係数はすべて、エントロピーコーディングユニット138に送られてさらに圧縮され且つパックされ、ビットストリームを形成する。
図1は、一般的なブロックベースのハイブリッドビデオコーディングシステムのブロック図を示す。入力ビデオ信号は、(コーディングユニット(CU)と呼ばれる)ブロックごとに処理される。クワッドツリーのみに基づいてブロックを分割するHEVCとは異なり、AVS3では、1つのコーディングツリーユニット(CTU)がCUに分割され、クワッド/バイナリ/拡張クワッドツリーに基づいて様々なローカル特性に適応される。さらに、HEVCにおける複数の分割ユニットタイプの概念が除去される。すなわち、AVS3では、CU、予測ユニット(PU)、及び変換ユニット(TU)の分離が存在せず、その代わりに、各CUはさらなる分割なしに、予測と変換の両方のための基本ユニットとして常に使用される。AVS3のツリー分割構造では、まず、1つのCTUがクワッドツリー構造に基づいて分割される。次いで、各クワッドツリーリーフノードは、バイナリ及び拡張クワッドツリー構造に基づいてさらに分割され得る。
図3A、図B、図3C、図3D、図3eに示すように、4分割、水平2分割、垂直2分割、水平拡張クワッドツリー分割、垂直拡張クワッドツリー分割の5種類がある。
図3Aは、本開示による、マルチタイプツリー構造におけるブロック4分割を例示する図を示す。
図3Bは、本開示による、マルチタイプツリー構造におけるブロック垂直2分割を例示する図を示す。
図3Cは、本開示による、マルチタイプツリー構造におけるブロック水平2分割を例示する図を示す。
図3Dは、本開示による、マルチタイプツリー構造におけるブロック垂直3分割を例示する図を示す。
図3Eは、本開示による、マルチタイプツリー構造におけるブロック水平3分割を例示する図を示す。
図1では、空間予測及び/又は時間予測が実行され得る。空間予測(又は「イントラ予測」)は、同じビデオピクチャ/スライス中の既にコーディングされた隣接ブロック(参照サンプルと呼ばれる)のサンプルからの画素を使用して、現在のビデオブロックを予測する。空間予測は、ビデオ信号に固有の空間的冗長性を低減する。時間予測(「インター予測」又は「動き補償予測」とも呼ばれる)は、既にコーディングされたビデオピクチャから再構成された画素を使用して、現在のビデオブロックを予測する。時間予測は、ビデオ信号に固有の時間的冗長性を低減する。所与のCUのための時間予測信号は、通常、現在のCUとその時間基準との間の動きの量及び方向を示す1以上の動きベクトル(MV)によってシグナリングされる。また、複数の参照ピクチャがサポートされる場合、1つの参照ピクチャインデックスが追加的に送られるが、それは、時間予測信号が参照ピクチャストア内のどの参照ピクチャから来るかを識別するために使用される。空間及び/又は時間予測の後、エンコーダ内のモード決定ブロックは例えば、レート歪み最適化方法に基づいて、最良の予測モードを選択する。予測ブロックは次いで、現在のビデオブロックから減算され、予測残差は変換を使用して非相関化され、次いで量子化される。量子化された残差係数は逆量子化され、逆変換されて、再構成された残差を形成するが、それは次いで予測ブロックに加算されて戻され、CUの再構成された信号を形成する。デブロッキングフィルタ、サンプル適応オフセット(SAO)、及び適応ループ内フィルタ(ALF)等のさらなるループ内フィルタリングは、再構成されたCUが参照ピクチャストアに入れられ、将来のビデオブロックをコーディングするための参照として使用される前に、再構成されたCUに適用され得る。出力ビデオビットストリームを形成するために、コーディングモード(インター又はイントラ)、予測モード情報、動き情報、及び量子化残差係数はすべて、エントロピーコーディングユニットに送られてさらに圧縮され且つパックされる。
図2は、VVCのためのビデオデコーダの一般的なブロック図を示す。具体的には、図2は典型的なデコーダ200のブロック図を示す。デコーダ200は、ビットストリーム210と、エントロピー復号化212と、逆量子化214と、逆変換216と、加算器218と、イントラ/インターモード選択220と、イントラ予測222と、メモリ230と、ループ内フィルタ228と、動き補償224と、ピクチャバッファ226と、予測関連情報234と、ビデオ出力232とを有する。
デコーダ200は、図1のエンコーダ100に存在する再構成関連セクションと同様である。デコーダ200において、入力ビデオビットストリーム210は、エントロピー復号化212を通して最初に復号化され、量子化された係数レベル及び予測関連情報を導出する。量子化された係数レベルは、次いで、逆量子化214及び逆変換216を通して処理され、再構成された予測残差が得られる。イントラ/インターモード選択220において実施されるブロック予測機構は、復号化された予測情報に基づいて、イントラ予測222又は動き補償224のいずれかを実行するように構成される。フィルタリングされていない再構成画素のセットは、逆変換216から再構成された予測残差と、ブロック予測機構によって生成された予測出力とを、加算器218を使用して合計することにより得られる。
再構成されたブロックはさらに、参照ピクチャストアとして機能するピクチャバッファ226に記憶される前に、ループ内フィルタ228を経てもよい。ピクチャバッファ226中の再構成されたビデオは、ディスプレイデバイスを駆動するために送信されてもよく、ならびに将来のビデオブロックを予測するために使用されてもよい。インループフィルタ228がオンにされる状況では、これらの再構成画素に対してフィルタリング動作が実行され、最終的な再構成ビデオ出力232が導出される。
図2は、ブロックベースのビデオデコーダの一般的なブロック図を示す。ビデオビットストリームは、エントロピー復号化ユニットにおいて最初にエントロピー復号化される。コーディングモード及び予測情報は(イントラコードされている場合には)空間予測ユニット又は(インターコードされている場合には)時間予測ユニットのいずれかに送られ、予測ブロックを形成する。残差変換係数は、逆量子化ユニット及び逆変換ユニットに送られ、残差ブロックを再構成する。次いで、予測ブロックと残差ブロックとが加算される。再構成されたブロックはさらに、参照ピクチャストアに記憶される前に、ループ内フィルタリングを経てもよい。次いで、参照ピクチャストア内の再構成されたビデオは、表示するために送出され、将来のビデオブロックを予測するために使用される。
本開示の焦点は、VVC及びAVS3規格の両方で使用される幾何学的分割モード(GPM)のコーディング性能を改善することである。AVS3では、その手段は角加重予測(AWP)としても知られており、これはGPMの同じ設計精神に従っているが、特定の設計の細部ではわずかな相違がある。本開示の説明を容易にするために、以下では、VVC規格における既存のGPM設計を、GPM/AWP手段の主要な態様を説明するための一例として使用する。一方、VVC及びAVS3規格の両方に適用される動きベクトル差分を用いたマージモード(MMVD)と呼ばれる他の従来のインター予測技術も、本発明において提案される技術と密接に関連していることを考慮して、簡潔に記載する。その後、現在のGPM/AWP設計のいくつかの欠点を確認する。最後に、提案される方法を詳細に示す。本開示全体を通して、VVC規格における既存のGPM設計を例として使用するが、最新のビデオコーディング技術の当業者にとっては、提案される技術は、同じ又は同様の設計精神を有する他のGPM/AWP設計又は他のコーディング手段にも適用され得ることに留意されたい。
[幾何学的分割モード(GPM)]
VVCでは、インター予測のために幾何学的分割モードがサポートされる。幾何学的分割モードは、1つの特殊マージモードとして1つのCUレベルフラグによってシグナリングされる。現在のGPM設計では、8×64と64×8を除く、幅と高さの両方が8以上64以下で取り得るCUサイズごとに、合計64個の分割がGPMモードでサポートされている。
このモードを使用するとき、CUは、図4に示されるように、幾何学的に位置する直線によって2つの部分に分割される(以下で説明する)。分割線の箇所は、具体的な分割の角度パラメータ及びオフセットパラメータから数学的に導出される。CU内の幾何学的分割の各部分は、それ自体の動きを使用してインター予測されるが、片予測のみが、各分割に対して許可される。すなわち、各部分は1つの動きベクトルと1つの参照インデックスとを有する。片予測動き制約は、従来の双予測と同じことを保証するために適用され、各CUに対して2つの動き補償予測のみが必要とされる。幾何学的分割モードを現在のCUに使用する場合、幾何学的分割の分割モード(角度及びオフセット)を示す幾何学的分割インデックス、及び2つのマージインデックス(各分割に1つ)がさらにシグナリングされる。最大GPM候補サイズの数は、シーケンスレベルで明示的にシグナリングされる。
図4は許容されるGPM分割を示すが、各ピクチャにおける分割は、1つの同一の分割方向を有している。
[片予測候補リスト構成]
1つの幾何学的分割のための片予測動きベクトルを導出するために、最初に、1つの片予測候補リストが、標準マージ候補リスト生成処理から直接導出される。nを、幾何学的片予測候補リストにおける片予測動きのインデックスとして表す。n番目のマージ候補のLX動きベクトル(Xはnのパリティに等しい)は、幾何学的分割モードのためのn番目の片予測動きベクトルとして使用される。
これらの動きベクトルは、図5(後述)において「x」で記録されている。n個の拡張マージ候補の対応するLX動きベクトルが存在しない場合、同じ候補のL(1-X)動きベクトルが、幾何学的分割モードのための片予測動きベクトルとして代わりに使用される。
図5は、GPMのためのマージ候補リストの動きベクトルからの片予測動きベクトル選択を示す。
[幾何学的分割エッジに沿ったブレンド]
各幾何学的分割がそれ自体の動きを使用して得られた後、2つの片予測信号にブレンディングを適用し、幾何学的分割エッジ周りのサンプルが導出される。CUの各位置に対するブレンディング重みは、各個々のサンプル位置から対応する分割エッジまでの距離に基づいて導出される。
[GPMシグナリング設計]
現在のGPM設計によれば、GPMの使用は、CUレベルで1つのフラグをシグナリングすることによって示される。フラグは、現在のCUがマージモード又はスキップモードのいずれかによってコーディングされるときにのみシグナリングされる。具体的には、フラグが1に等しいとき、それは現在のCUがGPMによって予測されることを示している。そうでない場合(フラグが0に等しい)、CUは、標準マージモード、動きベクトル差分とのマージモード、インター及びイントラ予測の組み合わせ等の、別のマージモードによってコーディングされる。GPMが現在のCUに対して有効にされるとき、1つのシンタックス要素、すなわちmerge_gpm_partition_idxがさらにシグナリングされて、適用された幾何学的分割モード(図4に示されるように、CUを2つの分割に分割するCU中心からの直線の方向及びオフセットを指定する)を示す。その後、2つのシンタックス要素merge_gpm_idx0及びmerge_gpm_idx1がシグナリングされ、第1及び第2のGPM分割のために使用される片予測マージ候補のインデックスを示す。より具体的には、これらの2つのシンタックス要素が「片予測マージリスト構成」の部分で説明されるように、片予測マージリストから2つのGPM分割の単方向MVを決定するために使用される。現行のGPM設計によれば、2つの単方向MVをより異ならせるために、2つのインデックスが同じであることはあり得ない。そのような従来の知識に基づいて、第1のGPM分割の片予測マージインデックスは、最初にシグナリングされるとともに予測器として使用され、第2のGPM分割の片予測マージインデックスのシグナリングオーバーヘッドを低減する。詳細には、第2の片予測マージインデックスが第1の片予測マージインデックスよりも小さい場合、その元の値が直接シグナリングされる。そうでない場合(第2の片予測マージインデックスが第1の片予測マージインデックスよりも大きい場合)、その値は、ビットストリームにシグナリングされる前に1だけ減算される。デコーダ側では、第1の片予測マージインデックスが最初に復号化される。次いで、第2の片予測マージインデックスの復号化のために、パースされた値が第1の片予測マージインデックスよりも小さい場合、第2の片予測マージインデックスはパース値に等しく設定される。そうでない場合(パースされた値が第1の片予測マージインデックス以上の場合)、第2の片予測マージインデックスは、パースされた値に1を加えたものに等しく設定される。表1は、現在のVVC仕様においてGPMモードのために使用される既存のシンタックス要素を示す。
一方、現在のGPM設計では、2つの片予測マージインデックス、すなわち、merge_gpm_idx0及びmerge_gpm_idx1の二値化のために、切り捨てられた単進符号が使用される。さらに、2つの片予測マージインデックスは同じであることができないので、異なる最大値が、merge_gpm_idx0及びmerge_gpm_idx1についてそれぞれMaxGPMMergeCand-1及びMaxGPMMergeCand-2に等しく設定される2つの片予測マージインデックスのコードワードを切り捨てるために使用される。MaxGPMMergeCandは、片予測マージリスト内の候補の数である。
GPM/AWPモードが適用されるとき、2つの異なる二値化方法を適用して、構文merge_gpm_partition_idxをバイナリビットのストリングに変換する。具体的には、シンタックス要素がVVC規格及びAVS3規格において、それぞれ、固定長コード及び切り捨てバイナリコードによって二値化される。一方、AVS3におけるAWPモードでは、シンタックス要素の値の二値化に異なる最大値が用いられる。具体的には、AVS3では、VVCにおいて許容されるGPM/AWP分割モードの数は56(すなわち、merge_gpm_partition_idxの最大値は55)であり、一方で、その数は64(すなわち、merge_gpm_partition_idxの最大値は63)に増加される。
[動きベクトル差分とのマージモード(MMVD)]
1つの現在のブロックの動き情報をその空間的/時間的隣接部から導出する従来のマージモードに加えて、MMVD/UMVEモードは、1つの特殊なマージモードとしてVVC規格及びAVS規格の両方に導入される。具体的にはVVC及びAVS3の両方において、モードはコーディングブロックレベルで1つのMMVDフラグによってシグナリングされる。MMVDモードでは、標準マージモードのためのマージリストの最初の2つの候補がMMVDのための2つの基本マージ候補として選択される。1つの基本マージ候補が選択され、シグナリングされた後、追加のシンタックス要素がシグナリングされ、選択されたマージ候補の動きに追加される動きベクトル差分(MVDs)が示される。MMVDシンタックス要素は、基本マージ候補を選択するためのマージ候補フラグと、MVDの大きさを指定するための距離インデックスと、MVD方向を示すための方向インデックスとを含む。
既存のMMVD設計では距離インデックスがMVDの大きさを指定し、MVDの大きさは開始点からの所定のオフセットの1つのセットに基づいて定義される。オフセットは開始MV(すなわち、選択された基本マージ候補のMVs)の水平成分又は垂直成分のいずれかに追加される。
図6Aは、L0基準のためのMMVDモードを示す。図6Bは、L1基準のためのMMVDモードを示す。
表2は、それぞれ、AVS3において適用されるMVDオフセットを示す。
表3に示されるように、方向インデックスは、シグナリングされたMVDの信号を指定するために使用される。MVD符号の意味は、開始MVに応じて変わることができることに留意されたい。開始MVがそのPOCが両方とも現在のピクチャのPOCよりも大きいか、又はその両方が現在のピクチャのPOCよりも小さい2つの参照ピクチャを指すMVをもつ片予測MV又は双予測MVであるとき、シグナリングされた符号は、開始MVに追加されたMVDの符号である。開始MVが一方のピクチャのPOCが現在のピクチャよりも大きく、他方のピクチャのPOCが現在のピクチャよりも小さい2つの参照ピクチャを指す双予測MVであるとき、シグナリングされた符号がL0 MVDに適用され、シグナリングされた符号の反対の値がL1 MVDに適用される。
[標準インターモードのためのモーションシグナリング]
HEVC規格と同様に、マージ/スキップモードに加えて、VVC及びAVS3の両方は、1つのインターCUがビットストリーム中でその動き情報を明示的に指定することを可能にする。全体として、VVC及びAVS3の両方における動き情報シグナリングは、HEVC規格におけるものと同じに維持される。具体的には、1つのインター予測シンタックス、すなわち、inter_pred_idcは最初にシグナリングされ、予測信号がリストL0、L1、又は両方からのものであるかどうかが示される。それぞれの使用される参照リストについて、対応する参照ピクチャは、対応する参照リストのための1つの参照ピクチャインデックスref_idx_lx (x=0,1)をシグナリングすることによって識別され、対応するMVは、MV予測子(MVP)を選択するために使用され、ターゲットMVと選択されたMVPとの間の動きベクトル差(MVD)に続く1つのMVPインデックスmvp_lx_flag (x=0,1)によって表される。さらに、VVC規格では、1つの制御フラグmvd_l1_zero_flagがスライスレベルでシグナリングされる。mvd_l1_zero_flagが0に等しいとき、L1 MVDはビットストリーム中でシグナリングされ、そうでなければ(mvd_L1_zero_flagが1に等しいとき)、L1 MVDはシグナリングされず、その値は、エンコーダ及びデコーダにおいて常に0と予測される。
[CUレベル重みによる双予測]
VVC及びAVS3より前の従来の規格では、重み付け予測(WP)が適用されないとき、2つの参照ピクチャから得られる片予測信号を平均化することによって、双予測信号が生成される。VVCでは、1つのコーディング手段、すなわちCUレベル重み(BCW)による双予測を導入し、双予測の効率を改善した。具体的には、単純平均化の代わりに、BCWにおける双予測は以下のように示されるように、2つの予測信号の重み付き平均化を可能にすることによって拡張される:
VVCでは、現在のピクチャが1つの低遅延ピクチャであるとき、1つのBCWコーディングブロックの重みは所定の重み値のセットw∈{-2,3,4,5,10}から選択されることが許可され、4の重みは2つの片予測信号が等しく重み付けされる従来の双予測の場合を表す。低遅延の場合、3つの重みw∈{3,4,5}のみが許可される。一般的に言えば、WPとBCWとの間にはいくつかの設計類似性があるが、2つのコーディング手段は、異なる粒度で明るさ変化問題を解決することを目標としている。しかしながら、WPとBCWとの間の相互作用は、潜在的にVVC設計を複雑にする可能性があるので、2つのツールを同時に有効にすることは許可されない。具体的には、WPが1つのスライスに対して有効にされるとき、スライス中のすべての双予測CUのためのBCW重みはシグナリングされず、4であると推測される(すなわち、等しい重みが適用される)。
[幾何学的分割モード(GPM)の改善]
上述のように、2つのGPM分割の予測サンプルを生成するために使用される単方向動きは、正規マージ候補から直接取得される。空間的/時間的隣接ブロックのMV間に強い相関がない場合、マージ候補から導出された単方向MVは、各GPM分割の真の動きを捕捉するのに十分に正確でないことがある。動き推定はより正確な動きを提供することができるが、これは既存の単方向MVの上に適用され得る任意の動き精緻化に起因して、無視できないシグナリングオーバーヘッドを犠牲にする。一方、MVMDモードはVVC及びAVS3規格の両方において利用されるが、これはMVDシグナリングオーバーヘッドを低減するための1つの効率的なシグナリング機構であることが証明されている。したがって、GPMをMMVDモードと組み合わせることも有益であり得る。そのような組み合わせは、より正確なMVを提供することによって、GPMツールの全体的なコーディング効率を潜在的に改善することができ、各GPM分割の個々の動きを捕捉する。
前述のように、VVC及びAVS3規格の両方において、GPMモードは、マージ/スキップモードにのみ適用される。そのような設計は、すべての非マージインターCUがGPMの柔軟な非矩形分割から恩恵を受けることができないと仮定すると、コーディング効率の点で最適ではない場合がある。一方、上記と同じ理由により、正規のマージ/スキップモードから導出された片予測動き候補は、2つの幾何学的分割の真の動きを捕捉するために必ずしも正確ではない。そのような分析に基づいて、非マージインターモード(すなわち、ビットストリーム中でそれらの動き情報を明示的にシグナリングするCU)へのGPMモードの妥当な拡張によって、余分のコーディング利得が予想され得る。しかしながら、MV精度の改善は、シグナリングオーバーヘッドの増加を犠牲にする。したがって、GPMモードを明示的なインターモードに効率的に適用するためには、2つの幾何学的分割に対してより正確なMVを提供しながら、シグナリングコストを最小化することができる1つの効果的なシグナリング方式を識別することが重要であろう。
[提案される方法]
本開示では、各GPM分割に適用される既存の単方向MVの上にさらなる動き精緻化を適用することによって、GPMのコーディング効率をさらに改善するための方法を提案する。提案した方法を、動きベクトル精緻化(GPM-MVR)による幾何学的分割モードと名付ける。さらに、提案された方式では、動き精緻化が既存のMMVD設計の1つの同様の方法で、すなわち、動き精緻化の所定のMVDの大きさ及び方向のセットに基づいてシグナリングされる。
本開示の一態様では、GPMモードを明示的インターモードに拡張するための解決法を提供する。説明を容易にするために、これらの方式を、明示的な動きシグナリング(GPM-EMS)を伴う幾何学的分割モードとして命名する。具体的には、通常のインターモードとのより良い調和を達成するために、既存の動きシグナリング機構、すなわち、MVP+MVDが2つの幾何学的分割の対応する単方向MVを指定するために、提案されたGPM-EMS方式において利用される。
[別個の動きベクトル精密化を用いた幾何学的分割モード]
GPMのコーディング効率を改善するために、この部分では、別個の動きベクトル精緻化を伴う1つの改善された幾何学的分割モードを提案する。具体的には、GPM分割が与えられると、提案される方法は最初に、既存のシンタックスmerge_gpm_idx0及びmerge_gpm_idx1を使用して、既存の片予測マージ候補リストから2つのGPM分割のための単方向MVを識別し、それらをベースMVとして使用する。2つのベースMVが決定された後、2つの新しいシンタックス要素のセットが導入され、2つのGPM分割のベースMVの上に別々に適用される動き精緻化の値が指定される。具体的には、2つのフラグ、すなわち、gpm_mvr_partIdx0_enable_flag及びgpm_mvr_partIdx1_enable_flagは最初に、GPM-MVRが第1及び第2のGPM分割にそれぞれ適用されるかどうかを示す信号である。1つのGPM分割のフラグが1に等しいとき、分割のベースMVに適用されるMVRの対応する値がMMVDスタイルでシグナリングされ、すなわち、MVRの大きさを指定するための1つの距離インデックス(シンタックス要素gpm_mvr_partIdx0_distance_idx及びgpm_mvr_partIdx1_distance_idxによって示される)と、MVRの方向を指定するための1つの方向インデックス(シンタックス要素gpm_mvr_partIdx0_direction_idx及びgpm_mvr_partIdx1_distance_idxによって示される)と、がシグナリングされる。表4は、提案されるGPM-MVR方法によって導入されるシンタックス要素を示す。表4において、新たに追加されたシンタックス要素は、イタリック太字体である。
表4に示されるような提案されたシンタックス要素に基づいて、デコーダにおいては、各GPM分割の片予測サンプルを生成するために使用される最終MVは、シグナリングされた動きベクトル精緻化と対応するベースMVとの合計に等しい。実際にはMVRの大きさ及び方向の異なるセットが事前定義され、提案されるGPM-MVR方式に適用され得、それは動きベクトル精度とシグナリングオーバーヘッドとの間の様々なトレードオフを提供し得る。1つの特定の例では、提案されたGPM-MVR方式のためのVVC規格で使用される8つのMVDオフセット(すなわち、1/4, 1/2, 1, 2, 4, 8, 16、及び32pel)及び4つのMVD方向(すなわち、+/x、及びy軸)を再使用することを提案する。別の例では、AVS3規格で使用される既存の5つのMVDオフセット{1/4-, 1/2-, 1-, 2-及び4-pel}及び4つのMVD方向(すなわち、+/x、及びy軸)が提案されるGPM-MVR方式に適用される。
「GPMシグナリング設計」の部分で説明したように、2つのGPM分割に使用される単方向MVは同一であることができないので、2つの片予測マージインデックスが異なることを強制する1つの制約が既存のGPM設計に適用される。しかしながら、提案されたGPM-MVR方式では、既存のGPM単方向MVの上に更なる動き精緻化が適用される。したがって、2つのGPM分割のベースMVが同一であるときでさえ、2つの動きベクトル精緻化の値が同じでない限り、2つの分割を予測するために使用される最終的な単方向MVは、依然として異なり得る。上記の考察に基づいて、提案されるGPM-MVR方式が適用されるとき、(2つの片予測マージインデックスを異なるように制限する)制約が除去される。さらに、2つの片予測マージインデックスは同一であることが許可されるので、同じ最大値MaxGPMMergeCand-1がmerge_gpm_idx0とmerge_gpm_idx1の両方の二値化に使用されるが、ここで、MaxGPMMergeCandは、片予測マージリスト中の候補の数である。
上記で分析されたように、2つのGPM分割の片予測マージインデックス(すなわち、merge_gpm_idx0及びmerge_gpm_idx1)が同一であるとき、2つの動きベクトル精緻化の値は、2つの分割に使用される最終MVが異なることを確実にするために同じであることができない。そのような条件に基づいて、本開示の一実施形態では、2つのGPM分割の片予測マージインデックスが同じ(すなわち、merge_gpm_idx0がmerge_gpm_idx1に等しい)とき、第2のGPM分割のMVRのシグナリングオーバーヘッドを低減するために、第1のGPM分割のMVRを使用するための1つのシグナリング冗長除去方法が提案される。一実施例では、以下のシグナリング条件が適用される:
最初に、フラグgpm_mvr_partIdx0_enable_flagが0に等しい(すなわち、GPM-MVRが最初のGPM分割に適用されない)とき、gpm_mvr_partIdx1_enable_flagのフラグはシグナリングされず、1であると推測される(すなわち、GPM-MVRが2番目のGPM分割に適用される)。
次に、両方のフラグgpm_mvr_partIdx0_enable_flagとgpm_mvr_partIdx1_enable_flagが1に等しく(すなわち、GPM-MVRが2つのGPM分割に適用される)、gpm_mvr_partIdx0_direction_idxがgpm_mvr_partIdx1_direction_idxに等しい(すなわち、2つのGPM分割のMVRは同じ方向を持つ)とき、第1のGPM分割のMVRの大きさ(すなわち、gpm_mvr_partIdx0_distance_idx)が第2のGPM分割のMVRの大きさを予測するために使用される(すなわち、gpm_mvr_partIdx1_distance_idx)。具体的には、gpm_mvr_partIdx1_distance_idxがgpm_mvr_partIdx0_distance_idxよりも小さい場合、その元の値が直接シグナリングされる。そうでない場合(gpm_mvr_partIdx1_distance_idxがgpm_mvr_partIdx0_distance_idxより大きい)、その値はビットストリームにシグナリングされる前に1減算される。デコーダ側ではgpm_mvr_partIdx1_distance_idxの値を復号するために、解析された値がgpm_mvr_partIdx0_distance_idxよりも小さい場合、gpm_mvr_partIdx1_distance_idxは解析値に等しく設定され、そうでない場合(解析された値はgpm_mvr_partIdx0_distance_idx以上)、gpm_mvr_partIdx1_distance_idxは解析された値に1を加えたに設定される。そのような場合、オーバーヘッドをさらに低減するために、異なる最大値MaxGPMMVRDistance-1及びMaxGPMMVRDistance-2を、gpm_mvr_partIdx0_distance_idx及びgpm_mvr_partIdx1_distance_idxの二値化に使用することができ、ここで、MaxGPMMVRDistanceは、動きベクトル精緻化のために許容される大きさの数である。
別の例では、MVRの大きさがMVRの大きさの前でシグナリングされるように、シグナリング順序をgpm_mvr_partIdx0_direction_idx/gpm_mvr_partIdx1_direction_idx及びgpm_mvr_partIdx0_distance_idx/gpm_mvr_partIdx1_distance_idxに切り替えることが提案される。このようにして、上記と同じ論理に従って、エンコーダ/デコーダは、第1のGPM分割のMVR方向を使用して、第2のGPM分割のMVR方向のシグナリングを調整することができる。別の実施例では、第2のGPM分割のMVRの大きさ及び方向を最初にシグナリングし、それらを使用して、第2のGPM分割のMVRの大きさ及び方向のシグナリングを調整することが提案される。
別の実施例では、既存のGPMシンタックス要素のシグナリングの前に、GPM-MVR関連シンタックス要素をシグナリングすることが提案される。具体的には、そのような設計では2つのフラグgpm_mvr_partIdx0_enable_flag及びgpm_mvr_partIdx1_enable_flagが最初にシグナリングされ、GPM-MVRが第1及び第2のGPM分割にそれぞれ適用されるかどうかを示す。1つのGPM分割のフラグが1に等しいとき、距離インデックス(シンタックス要素gpm_mvr_partIdx0_distance_idx及びgpm_mvr_partIdx1_distance_idxによって示される)及び方向インデックス(シンタックス要素gpm_mvr_partIdx0_direction_idx及びgpm_mvr_partIdx1_distance_idxによって示される)MVRの方向を特定する。その後、既存のシンタックスmerge_gpm_idx0及びmerge_gpm_idx1は2つのGPM分割、すなわち、ベースMVのための単方向MVを識別するためにシグナリングされる。表5は、提案されるGPM-MVRシグナリング方式を例示している。表5において、新たに追加されたシンタックス要素は、イタリック太字体である。
表4のシグナリング方法と同様に、表5のGPM-MVRシグナリング方法が適用されるとき、特定の条件が適用され得る、2つのGPM分割の予測に使用される結果として生じるMVが同一でないことを保証する。具体的には、第1及び第2のGPM分割に適用されるMVRの値に応じて、片予測マージインデックスmerge_gpm_idx0及びmerge_gpm_idx1のシグナリングを制約するために以下の条件が提案される:
第1に、gpm_mvr_partIdx0_enable_flag及びgpm_mvr_partIdx1_enable_flagの両方の値が0に等しい(すなわち、GPM-MVRが両方のGPM分割に対して無効)とき、merge_gpm_idx0及びmerge_gpm_idx1の値は、同じであることができない;
第2に、gpm_mvr_partIdx0_enable_flagが1に等しく(すなわち、GPM-MVRが第1のGPM分割に対して有効にされ)、gpm_mvr_partIdx1_enable_flagが0に等しい(すなわち、GPM-MVRが第2のGPM分割に対して無効にされる)とき、merge_gpm_idx0及びmerge_gpm_idx1の値は同一であることが許可される。
第3に、gpm_mvr_partIdx0_enable_flagが0に等しく(すなわち、GPM-MVRが第1のGPM分割に対して無効にされ)、gpm_mvr_partIdx1_enable_flagが1に等しい(すなわち、GPM-MVRが第2のGPM分割に対して有効にされる)とき、merge_gpm_idx0及びmerge_gpm_idx1の値は同一であることが許可される。
第4に、gpm_mvr_partIdx0_enable_flag及びgpm_mvr_partIdx1_enable_flagの両方の値が1に等しい(すなわち、GPM-MVRが2つのGPM分割の両方に対して無効にされる)とき、merge_gpm_idx0及びmerge_gpm_idx1の値が同一であるかどうかの決定は、2つのGPM分割に適用される(gpm_mvr_partIdx0_direction_idx及びgpm_mvr_partIdx0_distance_idx、ならびにgpm_mvr_partIdx1_direction_idx及びgpm_mvr_partIdx1_distance_idxによって示されるように)MVRの値に依存する。2つのMVRの値が等しい場合、merge_gpm_idx0及びmerge_gpm_idx1は同一であることが許可されない。そうでない場合(2つのMVRの値が等しくない場合)、merge_gpm_idx0とmerge_gpm_idx1の値は同じになる。
上記4つの場合において、merge_gpm_idx0及びmerge_gpm_idx1の値が同一であることが許可されないとき、一方の分割のインデックス値を他方の分割のインデックス値の予測器として使用することができる。1つの方法では、最初にmerge_gpm_idx0をシグナリングし、その値を使用してmerge_gpm_idx1を予測することが提案される。グナリングし、その値を使用してmerge_gpm_idx1を予測することが提案される。具体的には、エンコーダにおいて、merge_gpm_idx1がmerge_gpm_idx0よりも大きいとき、デコーダに送信されるmerge_gpm_idx1の値は1だけ低減される。デコーダにおいて、merge_gpm_idx1の受信値がmerge_gpm_idx0の受信値以上であるとき、merge_gpm_idx1の値は1だけ増加される。別の方法では、最初にmerge_gpm_idx1をシグナリングし、その値を使用してmerge_gpm_idx0を予測することが提案される。したがって、そのような場合、エンコーダにおいて、merge_gpm_idx0がmerge_gpm_idx1よりも大きいとき、デコーダに送られるmerge_gpm_idx0の値は1だけ低減される。デコーダにおいて、merge_gpm_idx0の受信値がmerge_gpm_idx1の受信値以上であるとき、merge_gpm_idx0の値は1だけ増加される。さらに、既存のGPMシグナリング設計と同様に、異なる最大値MaxGPMMergeCand-1及びMaxGPMMergeCand-2を、シグナリング順序に従った第1及び第2のインデックス値の二値化のためにそれぞれ使用することができる。一方、2つのインデックス値の間に相関がないためmerge_gpm_idx0とmerge_gpm_idx1の値が同一であることが許容されるとき、2つのインデックス値の2値化には、同じ最大値MaxGPMMergeCand-1が用いられる。
上記の方法では、シグナリングコストを低減するために、merge_gpm_idx0及びmerge_gpm_idx1の二値化に異なる最大値を適用することができる。対応する最大値の選択は、(gpm_mvr_partIdx0_enable、gpm_mvr_partIdx1_enable、gpm_mvr_partIdx0_direction_idx、gpm_mvr_partIdx1_direction_idx、gpm_mvr_partIdx0_distance_idx、及びgpm_mvr_partIdx1_distance_idx_によって示されるように)MVRの復号化された値に依存する。そのような設計は異なるGPMシンタックス要素間に望ましくない構文解析依存性を導入し、これは全体的な構文解析に影響を及ぼす可能性がある。このような問題を解決するために、一実施形態では、merge_gpm_idx0及びmerge_gpm_idx1の値を解析するために、常に1つの同じ最大値(例えば、MaxGPMMergeCand-1)を使用することが提案される。そのような方法が使用されるとき、2つのGPM分割の2つの復号されたMVが同じであることを防ぐために、1つのビットストリーム適合性制約が使用され得る。別の方法では、2つのGPM分割の復号化されたMVが同じであることを許可されるように、そのような非同一性制約を除去することもできる。一方、そのような方法が適用されるとき(すなわち、merge_gpm_idx0とmerge_gpm_idx1とに同じ最大値を使用するとき)、merge_gpm_idx0/merge_gpm_idx1と他のGPM-MVRシンタックス要素との間に構文依存性はない。したがって、これらのシンタックス要素をシグナリングする順序は、もはや重要ではない。一例では、merge_gpm_idx0/merge_gpm_idx1のシグナリングを、gpm_mvr_partIdx0_enable、gpm_mvr_partIdx1_enable、gpm_mvr_partIdx0_direction_idx、gpm_mvr_partIdx1_direction_idx、gpm_mvr_partIdx0_distance_idx、及びgpm_mvr_partIdx1_distance_idxのシグナリングの前に移動することが提案される。
[対称運動ベクトル精緻化を用いた幾何学的分割モード]
上記で説明したGPM-MVR方法の場合、2つの別個のMVR値がシグナリングされ、1つのMVR値は、1つのGPM分割のみのベースMVを改善するために適用される。このような方法は、GPM分割ごとに独立した動き精緻化を可能にすることによって、予測精度の改善に関して効率的であり得る。しかしながら、そのような柔軟な動きの改良は、GMP-MVRシンタックス要素の2つの異なるセットがエンコーダからデコーダに送信される必要があると仮定すると、シグナリングオーバーヘッドを増加させるという犠牲を伴う。シグナリングオーバーヘッドを低減するために、この部分では、対称動きベクトル精緻化を伴う1つの幾何学的分割モードを提案する。具体的には、この方法では1つの単一のMVR値が1つのGPM CUのためにシグナリングされ、現在のピクチャのピクチャ順序カウント(POC)値と2つのGPM分割に関連付けられた参照ピクチャとの間の対称関係に従って、2つのGPM分割の両方のために使用される。表6は、提案された方法が適用されるときのシンタックス要素を示す。表6において、新たに追加されたシンタックス要素は、イタリック太字体である。
表6に示すように、(merge_gpm_idx0及びmerge_gpm_idx1に基づいて)2つのGPM分割のベースMVが選択された後、1つのフラグgpm_mvr_enable_flagがシグナリングされて、GPM-MVRモードが現在のGPM CUに適用されるか否かが示される。フラグが1に等しいとき、それは、2つのGPM分割のベースMVを強化するために動き精緻化が適用されることを示す。そうでない場合(フラグがゼロに等しいとき)、それは、2つの分割のいずれにも動き精緻化が適用されないことを示す。GPM-MVRモードが無効にされる場合、追加のシンタックス要素は、方向インデックスgpm_mvr_direction_idx及びマグニチュードインデックスgpm_mvr_distance_idxによって適用されたMVRの値を指定するためにさらにシグナリングされる。さらに、MMVDモードと同様に、MVR符号の意味は、現在のピクチャのPOCとGPM分割の2つの参照ピクチャとの間の関係に従って変わり得る。具体的には2つの参照ピクチャの両方のPOCが現在のピクチャのPOCよりも大きいか又は小さいとき、シグナリングされた符号は両方の2つのベースMVに追加されるMVRの符号である。そうでない場合(一方の参照ピクチャのPOCが現在ピクチャよりも大きく、他方の参照ピクチャのPOCが現在ピクチャよりも小さいとき)、シグナリングされた符号が第1のGPM分割のMVRに適用され、反対の符号が第2のGPM分割に適用される。表6において、merge_gpm_idx0及びmerge_gpm_idx1の値は同一であることが許容される。
別の実施例では、2つのGPM分割に対するGPM-MVRモードの有効化/無効化を別々に制御するために、2つの異なるフラグをシグナリングすることが提案される。しかしながら、GPM-MVRモードが無効にされるとき、シンタックス要素gpm_mvr_direction_idx及びgpm_mvr_distance_idxに基づいて、ただ1つのMVRがシグナリングされる。そのようなシグナリング方法の対応するシンタックステーブルを表7に示す。表7において、新たに追加されたシンタックス要素は、イタリック太字体である。
表7のシグナリング方法が適用されるとき、merge_gpm_idx0及びmerge_gpm_idx1の値は同一であることが許可される。しかしながら、2つのGPM分割に適用される結果として生じるMVが冗長でないことを保証するために、フラグgpm_mvr_partIdx0_enable_flagが0に等しい(すなわち、GPM-MVRが第1のGPM分割に適用されない)とき、フラグgpm_mvr_partIdx1_enable_flagはシグナリングされず、1であると推論される(すなわち、GPM-MVRが第2のGPM分割に適用される)。
[GPM-MVRに対する許容MVRの適応]
上述のGPM-MVR方法では、1つの固定グループのMVR値が1つのビデオシーケンス内のエンコーダ及びデコーダの両方においてGPM CUのために使用される。このような設計は、高解像度又は激しい動きを有するビデオコンテンツには最適ではない。これらの場合、MVは、固定されたMVR値がこれらのブロックの実際の動きを捕捉するのに最適でない可能性があるように、はるかに大きい傾向がある。本開示では、GPM-MVRモードのコーディング効率をさらに改善するために、シーケンスレベル、ピクチャ/スライスピクチャ、コーディングブロック群レベルなど、様々なコーディングレベルでGPM-MVRモードによって選択されることが許可されるMVR値の適応をサポートすることが提案される。たとえば、複数のMVRセットならびに対応するコードワードは、異なるビデオシーケンスの特定の動き特性に従ってオフラインで導出され得る。エンコーダは最良のMVRセットを選択し、選択されたセットの対応するインデックスをデコーダにシグナリングすることができる。
[GPM-MVR速度歪み最適化のためのエンコーダ速度アップロジック]
提案されたGPM-MVR方式の場合、各GPM分割に対して最適なMVRを決定するために、エンコーダは、適用されているMVR値をそれぞれ変化させて、各GPM分割のレート歪みコストを複数回テストする必要があり得る。これは、GPMモードの符号化の複雑さを著しく増加させる可能性がある。符号化複雑性の問題に対処するために、この部分では、以下の高速符号化論理を提案する:
第1に、VVCとAVS3に適用されるクワッド/バイナリ/ターナリブロック分割構造のために、レート歪最適化(RDO)プロセス中に一つの同じコーディングブロックをチェックすることができ、それぞれは一つの異なる分割経路を介して分割される。現行のVTM/HPMエンコーダの実施では、1つの同じCUが異なるブロック分割の組合せによって取得されるときはいつでも、GPM及びGPM-MVRモードが、他のインターコーディングモード及びイントラコーディングモードとともに常にテストされる。一般的に言えば、異なる分割経路の場合、1つのCUの隣接ブロックのみが異なる可能性があるが、これは1つのCUが選択する最適なコーディングモードに比較的わずかな影響を及ぼすはずである。そのような考慮に基づいて、適用されるGPM RDOの総数を低減するために、1つのCUのRDコストが初めてチェックされるときにGPMモードが選択されるかどうかの決定を記憶することが提案される。その後、同じCUが再度(別の分割経路によって)RDO処理によってチェックされるとき、GPM(GPM-MVRを含む)のRDコストは、最初にCUのためにGPMが選択された場合にのみチェックされる。1つのCUの初期RDチェックのためにGPMが選択されないときであって、同じCUが別の分割経路を介して達成されるとき、GPM(GPM-MVRなし)のみがテストされる。別の方法では1つのCUの最初のRDチェックのためにGPMが選択されないとき、GPMとGPM-MVRの両方は同じCUが別の分割経路を介して達成されるときにテストされない。
別の方法では、1つの軟判定方法が1つの同じCUが複数回コーディングされるときにGPM(GPM-MVRを含む)RDチェックをスキップするために適用される。たとえば、CUが初めてコーディングされるとき、エンコーダは、GPMモード(GPM-MVRを含む)のRDコストをベストモードのコストと比較することができる。次いで、同じCUが別の分割経路を通してコーディングされるとき、GPMモードのRDチェック(GPM-MVRを含む)は、第1の経路において、GPM RDコストが1つの閾値を乗算する最良モードのRDコストより悪くない場合にのみ行われる。
第2に、GPM-MVRモードのためのGPM分割の数を減らすために、1つのCUのRDコストが初めてチェックされるとき、最小のRDコストなしに最初のM個のGPM分割モードを維持することが提案される。その後、同じCUが(別の分割経路 によって)RDO処理によってチェックされるとき、それらのM GPM分割モードのみがGPM-MVRモードについてテストされる。
第3に、1の最初のRDO処理のためにテストされるGPM分割の個数を減らすために、2つのGPM分割に対して様々な片予測マージ候補を使用するときに、最初に総絶対差分を計算することが提案される。次いで、1つの特定の分割モードの下の各GPM分割について、最小のSAD値を有する最良の片予測マージ候補を選択し、2つのGPM分割の最良の片予測マージ候補のSAD値の合計に等しい、分割モードの対応するSAD値を計算する。次に、次のRD処理について、前のステップのための最良のSAD値を有する最初のN個の分割モードのみが、GPM-MVRモードについてテストされる。
[明示的運動シグナリングを用いた幾何学的分割]
この部分では、GPMモードの2つの単方向MVがエンコーダからデコーダに明示的にシグナリングされる、通常のインターモードの双方向予測にGPMモードを拡張するための複数の方法が提案される。
第1の解決法(解決法1)では、GPMモードの2つの単方向MVをシグナリングするために双方向予測の既存の動きシグナリングを完全に再利用することが提案される。表8は、新たに追加されたシンタックス要素がイタリック太字体で提案された方式の修正されたシンタックステーブルを示す。表8に示すように、この解決法では、シグナリングL0及びL1動き情報のすべての既存のシンタックス要素が2つのGPM分割の単方向MVをそれぞれ示すために完全に再利用される。さらに、L0 MVは常に第1のGPM分割に関連付けられ、L1 MVは常に第2のGPM分割に関連付けられると仮定される。一方、表8では、インター予測シンタックス、すなわち、inter_pred_idcはGPMフラグ(すなわち、gpm_flag)の前でシグナリングされ、inter_pred_idcの値を使用して、gpm_flagの存在を条件付けることができる。具体的には、フラグgpm_flagが、inter_pred_idcがPRED_biに等しく(すなわち、双予測)、inter_affine_flag及びsym_mvd_flagの両方が0に等しい(すなわち、CUがアフィンモードでもSMVDモードでもコーディングされない)ときにのみシグナリングされる必要がある。フラグgpm_flagがシグナリングされないとき、その値は常に0であると推測される(すなわち、GPMモードが無効にされる)。gpm_flagが1であるとき、別のシンタックス要素gpm_partition_idxが、現在のCUのための選択されたGPMモード(合計64個のGPM分割のうち)を示すためにさらにシグナリングされる。
別の方法では、フラグgpm_flagのシグナリングを他のインターシグナリングシンタックス要素の前に置いて、gpm_flagの値を使用して、他のインターシンタックス要素が存在する必要があるか否かを決定することができるようにすることが提案される。表9は、新たに追加されたシンタックス要素がイタリック太字体である場合にそのような方法が適用されるときの対応するシンタックステーブルを示す。図から分かるように、gpm_flagは、まず、表9においてシグナリングされる。gpm_flagが1に等しいとき、inter_pred_idc、inter_affine_flag、及びsym_mvd_flagの対応するシグナリングはバイパスされ得る。代替的又は追加的に、3つのシンタックス要素の対応する値は、それぞれPRED_BI、0、及び0として推論され得る。
表8と表9の両方で、SMVDモードとGPMモードを組み合わせることはできない。別の例では、現在のCUがGPMモードによってコーディングされるときにSMVDモードを可能にすることが提案される。そのような組み合わせが許可されるとき、SMVDの同じ設計に従うことによって、2つのGPM分割のMVDは第1のGPM分割のMVDのみがシグナリングされる必要があり、第2のGPM分割のMVDが常に第1のMVDに対して対称であるように、対称であると仮定される。そのような方法が適用される場合、gpm_flag上のsym_mvd_flagの対応するシグナリング条件を除去することができる。
上述のように、第1の解決法では、第1のGPM分割にはL0 MVが使用され、第2のGPM分割にはL1 MVが使用されると常に仮定する。そのような設計は、この方法が2つのGPM分割のMVが1つの同じ予測リスト(L0又はL1のいずれか)から来ることを禁止するという意味で、最適ではない場合がある。このような問題を解決するために、表10に示されるようなシグナリング設計を用いて、1つの代替GPM-EMS方式、解決法2が提案される。表10において、新たに追加されたシンタックス要素は、イタリック太字体である。表10に示すように、フラグgpm_flagが最初にシグナリングされる。フラグが1に等しい(すなわち、GPMが有効にされる)とき、シンタックスgpm_partition_idxは、選択されたGPMモードを指定するようにシグナリングされる。次いで、1つの追加のフラグgpm_pred_dir_flag0がシグナリングされて、第1のGPM分割のMVが由来する対応する予測リストを示す。フラグgpm_pred_dir_flag0が1に等しいとき、それは第1のGPM分割のMVがL1から来ることを示し、そうでないとき(フラグが0に等しい)、それは第1のGPM分割のMVがL0から来ることを示す。その後、既存のシンタックス要素ref_idx_L0 MVp_l0_flag及びmvd_coding()は、第1のGPM分割の参照ピクチャインデックス、mvpインデックス及びMVDの値をシグナリングするために利用される。一方、第1の分割と同様に、別のシンタックス要素gpm_pred_dir_flag1が第2のGPM分割の対応する予測リストを選択するために導入され、続いて、既存のシンタックス要素ref_idx_L1 MVp_l1_flag、及びmvd_coding()が第2のGPM分割のMVを導出するために使用される。
最後に、GPMモードが2つの片予測分割(分割エッジ上のブレンディングサンプルを除く)からなることを考慮すると、双方向オプティカルフロー、デコーダ側動きベクトル精緻化(DMVR)、及びCU重み付き双方向予測(BCW)などの双方向予測のために特に設計されたVVC及びAVS3内のいくつかの既存のコーディングツールは、提案されたGPM-EMS方式が1つのインターCUに対して無効にされるときに自動的にバイパスされ得ることが言及されるべきである。たとえば、提案されたGPM-EMSのうちの1つが1つのCUに対して有効にされるとき、BCWがGPMモードに適用され得ない場合、シグナリングオーバーヘッドを低減するために、対応するBCW重みがCUに対してさらにシグナリングされる必要はない。
[GPM-MVRとGPM-EMSの組み合わせ]
この部分では、幾何学的分割を持つ1つのCUに対してGPM-MVRとGPM-EMSを組み合わせることを提案する。具体的にはマージベースの動きシグナリング又は明示的シグナリングのうちの1つのみが2つのGPM分割の片予測MVをシグナリングするために適用され得るGPM-MVR又はGPM-EMSのいずれかとは異なり、提案された方式では、1)GPM-MVRベースの動きシグナリングを使用する1つの分割と、GPM-EMSベースの動きシグナリングを使用する他の分割、2)GPM-MVRベースの動きシグナリングを使用する2つの分割、3)GPM-EMSベースの動きシグナリングを使用する2つの分割を許可する。表4のGPM-MVRシグナリング及び表10のGPM-EMSを使用して、表11は、提案されたGPM-MVR及びGPM-EMSが組み合わされた後の対応するシンタックステーブルを示す。表11において、新たに追加されたシンタックス要素は、イタリック太字体である。表11に示されるように、2つの追加のシンタックス要素gpm_merge_flag0及びgpm_merge_flag1が分割#1及び#2に対してそれぞれ導入され、それらは、対応する分割がGPM-MVRベースのマージシグナリング又はGPM-EMSベースの明示的シグナリングを使用することを指定する。フラグが1であるとき、そのGPM片予測動きが、merge_gpm_idxX、gpm_mvr_partIdxX_enabled_flag、gpm_mvr_partIdxX_direction_idx、及びgpm_mvr_partIdxX_distance_idxを介してシグナリングされる分割に対してGPM-MVRベースシグナリングが有効であることを手段し、ここで、X=0、1である。そうでない場合、フラグが0である場合、分割の片予測動きが、シンタックス要素gpm_pred_dir_flagX、ref_idx_lX、mvp_lX_flag及びmvd_lXを使用してGPM-EMS方式によって明示的にシグナリングされることを手段し、ここでX=0, 1である。
上記の方法は、特定用途向け集積回路(ASIC)、デジタル信号プロセッサ(DSP)、デジタル信号処理デバイス(DSPD)、プログラマブル論理デバイス(PLD)、フィールドプログラマブルゲートアレイ(FPGA)、コントローラ、マイクロコントローラ、マイクロプロセッサ、又は他の電子構成要素を含む、1以上の回路を含む装置を使用して実施されてもよい。この装置は上記の方法を実行するために、上記回路を他のハードウェア又はソフトウェア構成要素と組み合わせて使用することができる。上記で開示した各モジュール、サブモジュール、ユニット、又はサブユニットは、1以上の回路を少なくとも部分的に使用して実施され得る。
図9は、ユーザインタフェース960に結合されたコンピューティング環境(又はコンピューティングデバイス)910を示す。コンピューティング環境910は、データ処理サーバの一部とすることができる。いくつかの実施形態では、コンピューティングデバイス910は、本開示の様々な例に従って、上記で説明したような様々な方法又は処理(符号化/復号化方法又は処理など)のいずれかを実行することができる。コンピューティング環境910は、プロセッサ920と、メモリ940と、I/Oインタフェース950とを含み得る。
プロセッサ920は、典型的にはディスプレイ、データ取得、データ通信、及び画像処理に関連する動作など、コンピューティング環境910の全体的な動作を制御する。プロセッサ920は、上述の方法におけるステップのすべて又はいくつかを実行するための命令を実行するための1以上のプロセッサを含み得る。さらに、プロセッサ920は、プロセッサ920と他の構成要素との間の相互作用を容易にする1以上のモジュールを含み得る。プロセッサは、CPU(Central Processing Unit)、マイクロプロセッサ、シングルチップマシン、GPUなどであってもよい。
メモリ940は、コンピューティング環境910の動作をサポートするための様々なタイプのデータを記憶するように構成される。メモリ940は、所定のソフトウェア942を含むことができる。そのようなデータの例は、コンピューティング環境910上で動作する任意のアプリケーション又は方法、ビデオデータセット、画像データなどのための命令を含んでいる。メモリ940は、スタティックランダムアクセスメモリ(SRAM)、電気的消去可能プログラマブル読取り専用メモリ(EEPROM)、消去可能プログラマブル読取り専用メモリ(EPROM)、プログラマブル読取り専用メモリ(PROM)、読取り専用メモリ(ROM)、磁気メモリ、フラッシュメモリ、磁気又は光ディスクなど、任意のタイプの揮発性又は不揮発性メモリ装置、又はそれらの組合せを使用することによって実施されてもよい。
I/Oインタフェース950は、プロセッサ920と、キーボード、クリックホイール、ボタンなどの周辺インタフェースモジュールとの間のインタフェースを提供する。ボタンはホームボタン、スタートスキャンボタン、及びストップスキャンボタンを含むことができるが、これらに限定されない。I/Oインタフェース950は、エンコーダ及びデコーダと結合することができる。
いくつかの実施形態では、上述の方法を実行するための、コンピューティング環境910内のプロセッサ920によって実行可能な、メモリ940に含まれるような複数のプログラムを備える非一時的コンピュータ可読記憶媒体も提供される。例えば、非一時的なコンピュータ可読記憶媒体は、ROM、RAM、CD-ROM、磁気テープ、フロッピー(登録商標)ディスク、光データ記憶装置などであってもよい。
非一時的コンピュータ可読記憶媒体は1以上のプロセッサを有するコンピューティングデバイスによって実行されるための複数のプログラムをその中に記憶しているが、複数のプログラムは、1以上のプロセッサによって実行されたとき、コンピューティングデバイスに、動き予測のための上記の方法を実行させる。
いくつかの実施形態では、コンピューティング環境910が上記の方法を実行するために、1以上の特定用途向け集積回路(ASIC)、デジタル信号プロセッサ(DSP)、デジタル信号処理デバイス(DSPD)、プログラマブル論理デバイス(PLD)、フィールドプログラマブルゲートアレイ(FPGA)、グラフィカル処理ユニット(GPU)、コントローラ、マイクロコントローラ、マイクロプロセッサ、又は他の電子構成要素を用いて実施され得る。
図7は、本開示の一例による、GPMにおいてビデオブロックを復号化するための方法を示すフローチャートである。
ステップ701において、プロセッサ920は、ビデオブロックを第1及び第2の幾何学的分割に分割することができる。
ステップ702において、プロセッサ920は第1の幾何学的分割のための第1の予測リストを取得し、第2の幾何学的分割のための第2の予測リストを取得することができる。
いくつかの実施例では、第1の予測リストはリストL0であり得、第2の予測リストはリストL1であり得る。
ステップ703において、プロセッサ920は、第1及び第2の予測リストに基づいて第1及び第2の幾何学的分割にEMSを伴うGPMを適用することによって、第1及び第2の幾何学的分割のMVを取得することができる。
いくつかの実施例では、EMSを伴うGPMを第1及び第2の幾何学的分割に適用することは、表10に示されるように、解決法2に従って実施してもよい。
いくつかの実施例では、プロセッサ920が第1の幾何学的分割のための1以上の第1のシンタックス要素を受信し得る。1以上の第1のシンタックス要素は参照ピクチャインデックスシンタックス要素ref_idx_l0と、MVPインデックスフラグmvp_l0_flagと、第1のMVDコーディングシンタックス要素mvd_codingとを含み得、参照ピクチャインデックスref_idx_l0は第1の幾何学的分割の参照ピクチャインデックスを示し得、MVPインデックスフラグmvp_l0_flagは第1の幾何学的分割のMVPインデックスを示し得、第1のMVDコーディングシンタックス要素mvd_codingは第1の幾何学的分割のMVDを示し得る。
いくつかの実施例では、プロセッサ920が第2の幾何学的分割のための1以上の第2のシンタックス要素を受信し得る。1以上の第2のシンタックス要素は参照ピクチャインデックスシンタックス要素ref_idx_l1と、MVPインデックスフラグmvp_l1_flagと、第2のMVDコーディングシンタックス要素mvd_codingとを含み得るが、参照ピクチャインデックスref_idx_l1は第2の幾何学的分割の参照ピクチャインデックスを示し得、MVPインデックスフラグmvp_l1_flagは第2の幾何学的分割のMVPインデックスを示し得、第2のMVDコーディングシンタックス要素mvd_codingは第2の幾何学的分割のMVDを示し得る。
いくつかの実施例では、プロセッサ920が第1のGPM予測方向フラグgpm_pred_dir_flag0を受信し、第2のGPM予測方向フラグgpm_pred_dir_flag1を受信することによって、第1の予測リスト及び第2の予測リストを取得することができるが、第1のGPM予測方向フラグgpm_pred_dir_flag0は第1の幾何学的分割のMVがそこからであるという対応する予測リストを示し得、第2のGPM予測方向フラグgpm_pred_dir_flag1は第2の幾何学的分割のMVがそこからであるという対応する予測リストを示し得る。
いくつかの実施例では、プロセッサ920が第1のGPM予測方向フラグgpm_pred_dir_flag0が1に等しいと決定したことに応答して、第1の幾何学的分割のMVがリストL1からであると決定し、第1のGPM予測方向フラグgpm_pred_dir_flag0が0に等しいと決定したことに応答して、第1の幾何学的分割のMVがリストL0からであると決定し得る。
いくつかの実施例では、プロセッサ920が第2のGPM予測方向フラグgpm_pred_dir_flag1が1に等しいと決定したことに応答して、第2の幾何学的分割のMVがリストL0からであると決定し得、第2のGPM予測方向フラグgpm_pred_dir_flag1が0に等しいと決定したことに応答して、第2の幾何学的分割のMVがリストL1からであると決定し得る。
いくつかの実施例では、EMSを伴うGPMを第1及び第2の幾何学的分割に適用することは、表8に示される解決法1(オプション1)及び表9に示される解決法1(オプション2)に従って実施され得る。
いくつかの実施例では、プロセッサ920がGPMフラグgpm_flagを条件付ける1以上のシンタックス要素を受信し得る。GPMフラグgpm_flagは、GPMモードが第1の幾何学的分割又は第2の幾何学的分割に対して無効にされているかどうかを示し得る。
いくつかの実施例では、1以上のシンタックス要素が、双予測が適用されるかどうかを示すインター予測シンタックス要素inter_pred_idcと、ビデオブロックがアフィンモードによってコーディングされるかどうかを示すアフィンモードシンタックス要素inter_affine_flagとを含み得る。プロセッサ920はインター予測シンタックス要素inter_pred_idcが、双予測が適用されることを示し、アフィンモードシンタックス要素inter_affine_flagが、ビデオブロックがアフィンモードによってコーディングされないことを示すと決定したことに応答して、GPMフラグgpm_flagを受信し得る。
いくつかの実施例では、1以上のシンタックス要素が、ビデオブロックがSMVDモードによってコーディングされているかどうかを示すSMVDシンタックス要素sym_mvd_flagをさらに含み得る。プロセッサ920はインター予測シンタックス要素inter_pred_idcが、双予測が適用されることを示すと決定したことに応答して、GPMフラグgpm_flagを受信し得、アフィンモードシンタックス要素inter_affine_flagはビデオブロックがアフィンモードによってコーディングされないことを示し、SMVDシンタックス要素sym_mvd_flagはビデオブロックがSMVDモードによってコーディングされないことを示す。
いくつかの実施例では、プロセッサ920が、GPMフラグgpm_flagが1に等しいと決定したことに応答して、ビデオブロックのための選択されたGPMモードを示すGPM分割シンタックス要素gpm_partition_idxを受信し得る。
いくつかの実施例では、プロセッサ920が、GMPフラグgpm_flagがシグナリングされないと決定したことに応答して、GMPフラグgpm_flagの値が0に等しいと推論し得る。
いくつかの実施例では、プロセッサ920が1以上のシンタックス要素を条件付けるためにGPMフラグgpm_flagを受信することができ、GPMフラグgpm_flagはGPMモードが第1の幾何学的分割又は第2の幾何学的分割に対して有効であるかどうかを示す。1以上のシンタックス要素は、双予測が適用されるかどうかを示すインター予測シンタックス要素inter_pred_idcと、ビデオブロックがアフィンモードによってコーディングされるかどうかを示すアフィンモードシンタックス要素inter_affine_flagとを含み得る。
いくつかの実施例では、プロセッサ920が、GPMフラグgpm_flagが1に等しいと決定したことに応答して、インター予測シンタックス要素inter_pred_idcとアフィンモードシンタックス要素inter_affine_flagとをバイパスし得る。
いくつかの実施例では、1以上のシンタックス要素が、ビデオブロックがSMVDモードによってコーディングされているかどうかを示すSMVDシンタックス要素sym_mvd_flagをさらに含み得る。プロセッサ920は、GPMフラグgpm_flagが1に等しいと判断したことに応答して、インター予測シンタックス要素inter_pred_idc、アフィンモードシンタックス要素inter_affine_flag、及びSMVDシンタックス要素sym_mvd_flagをバイパスし得る。
いくつかの実施例では、プロセッサ920が、双予測が適用されることを示すPRED_biとしてインター予測シンタックス要素inter_pred_idcを推論し、ビデオブロックがアフィンモードによってコーディングされないことを示す0としてアフィンモードシンタックス要素inter_affine_flagを推論し、GMPフラグが1に等しいと決定したことに応答して、ビデオブロックがSMVDモードによってコーディングされないことを示す0としてSMVDシンタックス要素sym_mvd_flagを推論し得る。
ステップ704において、プロセッサ920は、MVに基づいて第1及び第2の幾何学的分割の予測サンプルを取得することができる。
図8は、本開示の一例による、GPMにおいてビデオブロックを復号化するための方法を示すフローチャートである。
ステップ801において、プロセッサ920は、ビデオブロックを第1及び第2の幾何学的分割に分割することができる。
ステップ802において、プロセッサ920は第1の幾何学的分割のための第1の予測リストを取得し、第2の幾何学的分割のための第2の予測リストを取得してもよい。
いくつかの実施例では、第1の予測リストはリストL0であり得、第2の予測リストはリストL1であり得る。
ステップ803において、プロセッサ920は、第1及び第2の予測リストに基づいて第1及び第2の幾何学的分割にMVRを伴うGPM又はEMSを伴うGPMを適用することによって、第1及び第2の幾何学的分割のMVを取得することができる。
いくつかの実施例では、プロセッサ920が第1及び第2の幾何学的分割のためのMVを、第1及び第2の予測リストに基づいて第1及び第2の幾何学的分割にMVRを伴うGPMを適用すること、第1及び第2の予測リストに基づいて第1及び第2の幾何学的分割にEMSを伴うGPMを適用すること、又は第1又は第2の幾何学的分割にMVRを伴うGPMを適用すること、及び第1及び第2の予測リストに基づいて第2又は第1の幾何学的分割にEMSを伴うGPMを適用することによって取得することができる。
いくつかの実施例では、プロセッサ920はさらに、第1の幾何学的分割のための第1のGPMマージフラグgpm_merge_flag0を受信して、MVRでGPMを指定するか、又はEMSを伴うGPMが第1の幾何学的分割に適用され、第2の幾何学的分割のための第2のGPMマージフラグgpm_merge_flag1を受信して、MVRでGPMを指定するか、又はEMSを伴うGPMが第2の幾何学的分割に適用される。
いくつかの実施例ではプロセッサ920はさらに、第1の幾何学的分割のためのMVRを有するGPMを有効にし、第1のGPMマージフラグgpm_merge_flag0が1に等しいと決定したことに応答して第1の幾何学的分割のための複数の第1のシンタックス要素を受信し得るが、複数の第1のシンタックス要素は、merge_gpm_idx0、gpm_mvr_partIdx0_enabled_flag、gpm_mvr_partIdx0_direction_idx、及びgpm_mvr_partIdx0_distance_idを含んでもよい。
いくつかの実施例ではプロセッサ920はさらに、第1の幾何学的分割のためのEMSを伴うGPMを有効にし、第1のGPMマージフラグgpm_merge_flag0が0に等しいと決定したことに応答して第1の幾何学的分割のための複数の第2のシンタックス要素を明示的に受信し得るが、複数の第2のシンタックス要素はGPM予測方向フラグgpm_pred_dir_flag0と、参照ピクチャインデックスref_idx_l0と、MVPインデックスフラグmvp_l0_flagと、mvd_l0とを含んでもよい。
いくつかの実施例ではプロセッサ920が第2の幾何学的分割のためのMVRを有するGPMをさらに有効にし、第2のGPMマージフラグgpm_merge_flag1が1に等しいと判定することに応答して、第2の幾何学的分割のための複数の第1のシンタックス要素を受信することができ、ここで、複数の第1のシンタックス要素はmerge_gpm_idx1、gpm_mvr_partIdx1_enabled_flag、gpm_mvr_partIdx1_direction_idx、及びgpm_mvr_partIdx1_distanceを含んでもよい。
いくつかの実施例ではプロセッサ920が第2の幾何学的分割についてEMSを有するGPMをさらに有効にし、第2のGPMマージフラグgpm_merge_flag1が0に等しいと判断することに応答して、第2の幾何学的分割についての複数の第2の構文要素を明示的に受信することができ、ここで、複数の第2の構文要素はGPM予測方向フラグgpm_pred_dir_flag1、参照画像インデックスref_idx_L1 MVPインデックスフラグmvp_l1_flag、及びmvd_l1を含んでもよい。
ステップ804において、プロセッサ920は、MVに基づいて第1及び第2の幾何学的分割の予測サンプルを取得することができる。
いくつかの実施例では、GPM中のビデオブロックを復号するための装置が提供される。装置はプロセッサ920と、プロセッサによって実行可能な命令を記憶するように構成されたメモリ940とを含み、プロセッサは命令の実行の際に、図7又は図8に示す方法を実行するように構成される。
いくつかの他の実施例では、その中に記憶された命令を有する、非一時的コンピュータ可読記憶媒体が提供される。命令がプロセッサ920によって実行されるとき、命令はプロセッサに、図7又は図8に示されるような方法を実行させる。
本開示の他の実施例は、本明細書の考察及び本明細書に開示される本開示の実施から当業者に明らかであろう。本出願はその一般的な原理に従い、当技術分野で知られている又は慣例的な実践の範囲内にあるような本開示からの逸脱を含む、本開示の任意の変形、使用、又は適応を包含することが意図される。本明細書及び実施例は、例示的なものに過ぎないと考えられることを意図している。
本開示は、提示され、添付の図面に示された正確な例に限定されず、その範囲から逸脱することなく、様々な修正及び変更を行うことができることが理解されよう。

Claims (22)

  1. ビデオブロックを第1及び第2の幾何学的分割に分割することと、
    第1の幾何学的分割のための第1の予測リストを取得し、第2の幾何学的分割のための第2の予測リストを取得することと、
    前記第1の予測リスト及び前記第2の予測リストに基づいて、明示的な動きシグナリング(EMS)を有するGPMを第1及び第2の幾何学的分割に適用することによって、第1及び第2の幾何学的分割の動きベクトル(MV)を得ることと、
    MVに基づいて前記第1の幾何学的分割及び第2の幾何学的分割の予測サンプルを得ることと、
    を備える、幾何学的分割モード(GPM)でビデオブロックを復号化するための方法。
  2. 参照ピクチャインデックスシンタックス要素ref_idx_l0と、動きベクトル予測(MVP)インデックスフラグmvp_l0_flagと、第1の動きベクトル差分(MVD)コーディングシンタックス要素mvd_codingとを備える、第1の幾何学的分割のための1以上の第1のシンタックス要素を受信し、 参照ピクチャインデックスref_idx_l0が第1の幾何学的分割の参照ピクチャインデックスを示しMVPインデックスフラグmvp_l0_flagが第1の幾何学的分割のMVPインデックスを示し、第1のMVDコーディングシンタックス要素mvd_codingが第1の幾何学的分割のMVDを示し、
    参照ピクチャインデックスシンタックス要素ref_idx_l1と、動きベクトル予測(MVP)インデックスフラグmvp_l1_flagと、第2のMVDコーディングシンタックス要素mvd_codingとを備える、第2の幾何学的分割のための1以上の第2のシンタックス要素を受信し、 参照ピクチャインデックスref_idx_l1が第2の幾何学的分割の参照ピクチャインデックスを示し、MVPインデックスフラグmvp_l1_flagが第2の幾何学的分割のMVPインデックスを示し、第2のMVDコードシンタックス要素mvd_codingが第2の幾何学的分割のMVDを示す、前記GPMをEMSによってさらに適用する、請求項1記載の方法。
  3. 前記第1の予測リストがリストL0であり、前記第2の予測リストがリストL1である、請求項1に記載の方法。
  4. 前記第1の幾何学的分割のための前記第1の予測リストを取得することと、前記第2の幾何学的分割のための前記第2の予測リストを取得することとが、
    前記第1の幾何学的分割のMVが対応する予測リストからのものであることを示す第1のGPM予測方向フラグgpm_pred_dir_flag0を受信することと、
    前記第2の幾何学的分割のMVが対応する予測リストからのものであることを示す第2のGPM予測方向フラグgpm_pred_dir_flag1を受信すること、とを備える、請求項3記載の方法。
  5. 第1のGPM予測方向フラグgpm_pred_dir_flag0が1に等しいと決定したことに応答して、第1の幾何学的分割のMVがリストL1からのものであると決定することと、
    第1のGPM予測方向フラグgpm_pred_dir_flag0が0に等しいと決定したことに応答して、第1の幾何学的分割のMVがリストL0からのものであると決定することと、
    をさらに備える、請求項4記載の方法。
  6. 第2のGPM予測方向フラグgpm_pred_dir_flag1が1に等しいと決定したことに応答して、第2の幾何学的分割のMVがリストL0からのものであると決定することと、
    第2のGPM予測方向フラグgpm_pred_dir_flag1が0に等しいと決定したことに応答して、第2の幾何学的分割のMVがリストL1からのものであると決定することと、
    をさらに備える、請求項4記載の方法。
  7. 第1の幾何学的分割又は第2の幾何学的分割に対してGPMモードが有効であるかどうかを示すGPMフラグgpm_flagを条件付ける1以上のシンタックス要素を受信することをさらに含む、請求項1記載の方法。
  8. 前記1以上のシンタックス要素は、双予測が適用されるかどうかを示すインター予測シンタックス要素inter_pred_idcと、前記ビデオブロックがアフィンモードによってコーディングされるかどうかを示すアフィンモードシンタックス要素inter_affine_flagとを備え、
    前記方法はさらに、インター予測シンタックス要素inter_pred_idcには双予測が適用されることを示し、アフィンモードシンタックス要素inter_affine_flagはビデオブロックがアフィンモードによってコーディングされていないことを示すと決定することに応答して、GPMフラグgpm_flagを受信することを備える、請求項7記載の方法。
  9. 前記1以上のシンタックス要素は、前記ビデオブロックがSMVDモードによってコーディングされるかどうかを示す、対称動きベクトル差分(SMVD)シンタックス要素sym_mvd_flagをさらに備え、
    前記方法はさらに、インター予測シンタックス要素inter_pred_idcには双予測が適用されることを示し、アフィンモードシンタックス要素inter_affine_flagはビデオブロックがアフィンモードによってコーディングされていないことを示し、SMVDシンタックス要素sym_mvd_flagはビデオブロックがSMVDモードによってコーディングされていないことを示すと決定したことに応答して、GPMフラグgpm_flagを受信することを備える、請求項8に記載の方法。
  10. GPMフラグgpm_flagが1に等しいと決定したことに応答して、ビデオブロックのための選択されたGPMモードを示すGPM分割シンタックス要素gpm_partition_idxを受信することをさらに含む、請求項9記載の方法。
  11. GMPフラグgpm_flagをシグナリングしないと決定したことに応答して、GMPフラグgpm_flagの値が0に等しいことを推測することをさらに含む、請求項9記載の方法。
  12. 1以上のシンタックス要素を条件付けるGPMフラグgpm_flagを受信し、GPMフラグgpm_flagが、GPMモードが第1の幾何学的分割又は第2の幾何学的分割に対して有効であるかどうかを示すことをさらに含む、請求項1記載の方法。
  13. 前記1以上のシンタックス要素は、双予測が適用されるかどうかを示すインター予測シンタックス要素inter_pred_idcと、前記ビデオブロックがアフィンモードによってコーディングされるかどうかを示すアフィンモードシンタックス要素inter_affine_flagとを備え、
    前記方法はさらに、GPMフラグgpm_flagが1に等しいと決定したことに応答して、インター予測シンタックス要素inter_pred_idc及びアフィンモードシンタックス要素inter_affine_flagをバイパスすることを備える、請求項12に記載の方法。
  14. 前記1以上のシンタックス要素は、前記ビデオブロックがSMVDモードによってコーディングされるかどうかを示す、対称動きベクトル差分(SMVD)シンタックス要素sym_mvd_flagをさらに備え、
    前記方法はさらに、GPMフラグgpm_flagが1に等しいと決定したことに応答して、インター予測シンタックス要素inter_pred_idc及びアフィンモードシンタックス要素inter_affine_flag、及びSMVDシンタックス要素sym_mvd_flagをバイパスすることを備える、請求項13に記載の方法。
  15. GMPフラグgpm_flagが1に等しいと決定したことに応答して、インター予測シンタックス要素inter_pred_idcを、双予測が適用されることを示すPRED_BIとして推論し、アフィンモードシンタックス要素inter_affine_flagを、ビデオブロックがアフィンモードによってコーディングされていないことを示す0として推論し、ビデオブロックがSMVDモードによってコーディングされていないことを示すSMVDシンタックス要素sym_mvd_flagを0として推論することをさらに含む、請求項14に記載の方法。
  16. ビデオブロックを第1及び第2の幾何学的分割に分割することと、
    第1の幾何学的分割のための第1の予測リストを取得し、第2の幾何学的分割のための第2の予測リストを取得することと、
    前記第1の幾何学的分割及び前記第2の幾何学的分割に対する動きベクトル(MV)を、前記第1の予測リスト及び前記第2の予測リストに基づいて前記第1の幾何学的分割及び前記第2の幾何学的分割に明示的動きシグナリング(EMS)を有するGPMを適用することによって得ることと、
    MVに基づいて前記第1の幾何学的分割及び第2の幾何学的分割の予測サンプルを得ることと、
    を含む、幾何学的分割モード(GPM)でビデオブロックを復号化するための方法。
  17. 前記第1の予測リスト及び前記第2の予測リストに基づく前記第1の幾何学的分割及び前記第2の幾何学的分割へMVRによってGPMを適用することと、
    前記第1の予測リスト及び前記第2の予測リストに基づく前記第1の幾何学的分割及び前記第2の幾何学的分割へEMSによってGPMを適用すること、又は
    MVRを有するGPMを前記第1の幾何学的分割又は前記第2の幾何学的分割に適用し、EMSを有するGPMを、前記第1の予測リスト及び前記第2の予測リストに基づいて前記第2の幾何学的分割又は前記第1の幾何学的分割に適用することと、
    によって前記第1の幾何学的分割及び前記第2の幾何学的分割の前記MVを取得することをさらに備える、請求項16に記載の方法。
  18. 第1の幾何学的分割に対して第1のGPMマージフラグgpm_merge_flag0を受信して、MVRでGPMを指定するか、又はEMSでGPMを最初の幾何学的分割に適用することと、
    第2の幾何学的分割に対して第2のGPMマージフラグgpm_merge_flag1を受信して、MVRでGPMを指定するか、又はEMSでGPMを第2の幾何学的分割に適用することと、
    をさらに含む、請求項17記載の方法。
  19. 第1のGPMマージフラグgpm_merge_flag0が1に等しいと決定したことに応答して、第1の幾何学的分割のためのMVRを有するGPMを有効にし、第1の幾何学的分割のための複数の第1のシンタックス要素を受信することを可能にし、複数の第1のシンタックス要素は、merge_gpm_idx0、gpm_mvr_partidx0_enabled_flag、gpm_mvr_partidx0_direction_idx、及びgpm_mvr_partidx0_distance_idxを含み、また、
    第1のGPMマージフラグgpm_merge_flag0が0に等しいと決定したことに応答して、第1の幾何学的分割のためのEMSを伴うGPMを有効にし、第1の幾何学的分割のための複数の第2のシンタックス要素を明示的に受信し、複数の第2のシンタックス要素は、GPM予測方向フラグgpm_pred_dir_flag0、参照ピクチャインデックスref_idx_l0、動きベクトル予測(MVP)インデックスフラグmvp_l0_flag、及びmvd_l0を含むこと、
    をさらに含む、請求項18記載の方法。
  20. 第2のGPMマージフラグgpm_merge_flag1が1に等しいと決定したことに応答して、第2の幾何学的分割のためのMVRを有するGPMを有効にし、第2の幾何学的分割のための複数の第1のシンタックス要素を受信し、複数の第1のシンタックス要素は、merge_gpm_idx1、gpm_mvr_partidx1_enabled_flag、gpm_mvr_partidx1_direction_idx、及びgpm_mvr_partidx1_distance_idxを含み、また、
    第2のGPMマージフラグgpm_merge_flag1が0に等しいと決定したことに応答して、第2の幾何学的分割のためのEMSを有するGPMを有効にし、第2の幾何学的分割のための複数の第2のシンタックス要素を明示的に受信し、複数の第2のシンタックス要素は、GPM予測方向フラグgpm_pred_dir_flag1と、参照ピクチャインデックスref_idx_l1と、動きベクトル予測(MVP)インデックスフラグmvp_l1_flagと、mvd_l1とを含むこと、
    をさらに含む、請求項18記載の方法。
  21. 1以上のプロセッサと、
    1以上のプロセッサによって実行可能な命令を記憶するように構成された非一時的コンピュータ可読記憶媒体と、を含み、
    前記1以上のプロセッサが、前記命令の実行の際に、請求項1から20のいずれか1項に記載の方法を実行するように構成されている、ビデオコーディングのための装置。
  22. 1以上のコンピュータプロセッサに、前記1以上のコンピュータプロセッサによって実行されるときに、請求項1から20のいずれか1項に記載の方法を実行させる、コンピュータ実行可能命令を記憶する非一時的コンピュータ可読記憶媒体。
JP2023560089A 2021-04-09 2022-04-11 明示的な動きシグナリングを用いた幾何学的分割 Pending JP2024512647A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202163173303P 2021-04-09 2021-04-09
US63/173,303 2021-04-09
PCT/US2022/024302 WO2022217159A1 (en) 2021-04-09 2022-04-11 Geometric partition mode with explicit motion signaling

Publications (1)

Publication Number Publication Date
JP2024512647A true JP2024512647A (ja) 2024-03-19

Family

ID=83546612

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023560089A Pending JP2024512647A (ja) 2021-04-09 2022-04-11 明示的な動きシグナリングを用いた幾何学的分割

Country Status (6)

Country Link
US (1) US20240048700A1 (ja)
EP (1) EP4320863A1 (ja)
JP (1) JP2024512647A (ja)
KR (1) KR20230157507A (ja)
CN (1) CN117121482A (ja)
WO (1) WO2022217159A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024099334A1 (en) * 2022-11-08 2024-05-16 Douyin Vision Co., Ltd. Method, apparatus, and medium for video processing

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3847814A4 (en) * 2018-11-06 2021-07-14 Beijing Bytedance Network Technology Co. Ltd. POSITION DEPENDENT STORAGE, MOVEMENT INFORMATION
WO2020094051A1 (en) * 2018-11-06 2020-05-14 Beijing Bytedance Network Technology Co., Ltd. Signaling of side information for inter prediction with geometric partitioning
CN114097228B (zh) * 2019-06-04 2023-12-15 北京字节跳动网络技术有限公司 具有几何分割模式编解码的运动候选列表
WO2021015581A1 (ko) * 2019-07-23 2021-01-28 한국전자통신연구원 기하학적 분할을 사용하는 영상 부호화/복호화를 위한 방법, 장치 및 기록 매체

Also Published As

Publication number Publication date
US20240048700A1 (en) 2024-02-08
EP4320863A1 (en) 2024-02-14
WO2022217159A1 (en) 2022-10-13
KR20230157507A (ko) 2023-11-16
CN117121482A (zh) 2023-11-24

Similar Documents

Publication Publication Date Title
US11310526B2 (en) Hardware friendly constrained motion vector refinement
CA3126882C (en) Intra block copy merge list simplification
US11051010B2 (en) Merge candidates with multiple hypothesis
JP2022519883A (ja) デコーダ側精緻化ツールのサイズ選択アプリケーション
CN113141783A (zh) 用于多重假设的帧内预测
EP4037320A1 (en) Boundary extension for video coding
US20230115074A1 (en) Geometric partition mode with motion vector refinement
US20240048700A1 (en) Geometric partition mode with explicit motion signaling
KR102437696B1 (ko) 비디오 코딩을 위한 모션 벡터 예측
US20240098250A1 (en) Geometric partition mode with motion vector refinement
US20240073440A1 (en) Methods and devices for geometric partition mode with motion vector refinement
RU2808631C2 (ru) Ведение таблиц для хранения кандидатов предсказания вектора движения на основе истории
KR20240021295A (ko) 모션 벡터 세분화를 갖는 기하학적 파티션 모드를 위한 방법 및 장치
CN117597922A (zh) 用于利用运动矢量细化的几何分区模式的方法和设备
CN116158079A (zh) 用于视频编解码的加权ac预测
CN117643054A (zh) 具有运动矢量细化的几何分区模式

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230928

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230928