JP2022523287A - 通常コード化ビンの数の削減 - Google Patents

通常コード化ビンの数の削減 Download PDF

Info

Publication number
JP2022523287A
JP2022523287A JP2021535626A JP2021535626A JP2022523287A JP 2022523287 A JP2022523287 A JP 2022523287A JP 2021535626 A JP2021535626 A JP 2021535626A JP 2021535626 A JP2021535626 A JP 2021535626A JP 2022523287 A JP2022523287 A JP 2022523287A
Authority
JP
Japan
Prior art keywords
predictors
binary
weighting
forming
coding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021535626A
Other languages
English (en)
Other versions
JPWO2020185468A5 (ja
Inventor
ルリアネック,ファブリス
ポワリエ,タンギ
チェン,ヤ
Original Assignee
インターデジタル ヴイシー ホールディングス, インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from EP19305278.4A external-priority patent/EP3709657A1/en
Application filed by インターデジタル ヴイシー ホールディングス, インコーポレイテッド filed Critical インターデジタル ヴイシー ホールディングス, インコーポレイテッド
Publication of JP2022523287A publication Critical patent/JP2022523287A/ja
Publication of JPWO2020185468A5 publication Critical patent/JPWO2020185468A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/577Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

CABACで符号化するために、非2値構文要素の値が、2値化処理を介して、2値シーケンス(ビン文字列)にマッピングされる。2値算術コーディングエンジンは、通常の(コンテキストベースの)モードとバイパスモードでビンを符号化または復号化する。【選択図】図11A

Description

本実施形態は、概して、ビデオ符号化または復号のための方法および装置、より具体的には、エントロピー符号化および復号における通常のコード化ビンの数を削減する方法および装置に関する。
高い圧縮効率を達成するために、画像およびビデオのコーディングスキームは、通常、予測および変換を用いて、ビデオコンテンツの空間的および時間的冗長性を活用する。一般に、イントラまたはインター予測は、イントラまたはインターピクチャ相関を活用するために使用され、次いで、元のブロックと予測ブロックとの間の差、多くの場合、予測誤差または予測残差と称される差が、変換され、量子化され、エントロピーコード化される。ビデオを再構築するために、圧縮データは、エントロピーコーディング、量子化、変換、および予測に対応する逆処理によって復号される。
一実施形態によれば、ビデオ復号の方法が提供され、方法は、ビットストリームから複数の2値シンボルを復号することであって、複数の2値シンボルの第1の2値シンボルは、コンテキストベースのモードを使用してエントロピー復号され、第1の2値シンボルに続く各2値シンボルは、バイパスモードでエントロピー復号される、復号することと、2値化スキームに対応する、複数の2値シンボルによって表されるインデックスを取得することと、2つの予測因子の重み付け和としてブロックの予測を形成することであって、インデックスは、重み付け和を形成するときに2つの予測因子の重み付けに使用されるそれぞれの重み係数を示す、形成することと、を含む。
一実施形態によれば、ビデオ符号化の方法が提供され、方法は、符号化されるブロックにアクセスすることと、2つの予測因子の重み付け和としてブロックの予測を形成することと、重み付け和を形成するときに2つの予測因子の重み付けに使用されるそれぞれの重み係数を示すためのインデックスを符号化することと、を含み、インデックスは、2値化スキームを使用して、複数の2値シンボルに2値化され、複数の2値シンボルの第1の2値シンボルは、コンテキストベースのモードを使用してエントロピー符号化され、第1の2値シンボルに続く各2値シンボルは、バイパスモードでエントロピー符号化される。
別の実施形態によれば、1つ以上のプロセッサを含むビデオ復号のための装置が提供され、この1つ以上のプロセッサは、ビットストリームから複数の2値シンボルを復号することであって、複数の2値シンボルの第1の2値シンボルが、コンテキストベースのモードを使用してエントロピー復号され、第1の2値シンボルに続く各2値シンボルが、バイパスモードでエントロピー復号される、復号することと、2値化スキームに対応する、複数の2値シンボルによって表されるインデックスを取得することと、2つの予測因子の重み付け和としてブロックの予測を形成することであって、インデックスは、重み付け和を形成するときに2つの予測因子の重み付けに使用されるそれぞれの重み係数を示す、形成することと、を行うように構成されている。
別の実施形態によれば、1つ以上のプロセッサを含むビデオ符号化のための装置が提供され、1つ以上のプロセッサが、符号化されるブロックにアクセスし、2つの予測因子の重み付け和としてブロックの予測を形成し、重み付け和を形成するときに、2つの予測因子の重み付けに使用されるそれぞれの重み係数を示すためにインデックスを符号化するように構成され、インデックスは、2値化スキームを使用して、複数の2値シンボルに2値化され、複数の2値シンボルの第1の2値シンボルが、コンテキストベースのモードを使用してエントロピー符号化され、第1の2値シンボルに続く各2値シンボルが、バイパスモードでエントロピー符号化される。
別の実施形態によれば、ビデオ復号の装置が提供され、装置は、ビットストリームから複数の2値シンボルを復号する手段であって、複数の2値シンボルの第1の2値シンボルは、コンテキストベースのモードを使用してエントロピー復号され、第1の2値シンボルに続く各2値シンボルは、バイパスモードでエントロピー復号される、復号する手段と、2値化スキームに対応する、複数の2値シンボルによって表されるインデックスを取得する手段と、2つの予測因子の重み付け和としてブロックの予測を形成する手段であって、インデックスは、重み付け和を形成するときに2つの予測因子の重み付けに使用されるそれぞれの重み係数を示す、形成する手段と、を含む。
別の実施形態によれば、ビデオ符号化の装置が提供され、装置は、符号化されるブロックにアクセスする手段と、2つの予測因子の重み付け和としてブロックの予測を形成する手段と、重み付け和を形成するときに2つの予測因子の重み付けに使用されるそれぞれの重み係数を示すためのインデックスを符号化する手段とを含み、インデックスは、2値化スキームを使用して、複数の2値シンボルに2値化され、複数の2値シンボルの第1の2値シンボルは、コンテキストベースのモードを使用してエントロピー符号化され、第1の2値シンボルに続く各2値シンボルは、バイパスモードでエントロピー符号化される。
ビデオ符号化器の一実施形態のブロック図を示す。 圧縮されたHEVCピクチャを表すためのコーディングツリーユニットおよびコーディングツリーの概念を示す図解例である。 コーディングツリーユニットの、コーディングユニット、予測ユニット、および変換ユニットへの分割を示す図解例である。 ビデオ復号器の一実施形態のブロック図を示す。 CABAC復号処理を示す。 CABAC符号化処理を示す。 クアッドツリープラスバイナリツリー(QTBT)のCTU表現を示す図解例である。 コーディングユニットの分割モードを示す図解例である。 VVCドラフト4でのGBiインデックスのコーディング処理を示す。 VVCドラフト4でのGBiインデックスの解析処理を示す。 一実施形態によるGBiインデックスのコーディング処理を示し、図11Aは、別の実施形態によるGBiインデックスのコーディング処理を示す。 一実施形態によるGBiインデックスの解析処理を示し、図12Aは別の実施形態によるGBiインデックスの解析処理を示し、図12Bおよび図12Cは、それぞれ非低遅延モードおよび低遅延モードで、gbiCodingIndexの2値化およびコーディング/解析処理を示し、図12Dは、デフォルトのGBIモードを信号通知する第1のビンが0に等しい場合のツリーを示す。 AMVPモードでの動きベクトル予測因子候補リストの構築を示す図解例である。 AMVP候補リストを構築するために考慮される空間的および時間的動きベクトル予測候補を示す図解例である。 VVCドラフト4のAMVPにおける動きベクトル予測インデックスのCABACコーディングを示す。 一実施形態による、mvp_l0_flagおよびmvp_l1_flag構文要素のバイパスコーディング処理を示す。 VVCドラフト5のSBTツールの原理を示す。 VVCドラフト5でのINTERコーディングユニットのSBTモードの復号処理を示す。 一実施形態によるSBTモード復号処理を示し、図19Bは、別の実施形態によるSBTモード復号処理を示す。 4x8および8x4のINTRAコーディングユニットに対して許容されるISP分割を示し、図20Bは、4x8または8x4とは異なるサイズのINTRAコーディングユニットに対して許容されるISP分割を示す。 複数の基準線イントラ予測の原理を示す。 VVCドラフト5での「intra_luma_ref_idx」構文要素の解析処理を示す。 一実施形態による、「Intra_luma_ref_idx」構文要素の簡略化された解析処理を示す。 本実施形態の態様を実装することができる、システムのブロック図を示す。
図1は、高効率ビデオコーディング(HEVC)符号化器などのビデオ符号化器100の例を示している。図1はまた、JVET(Joint Video Exploration Team)によって開発中のVVC(バーサタイルビデオコーディング)符号化器などの、HEVC規格を改良した符号化器またはHEVCに類似した技術を採用した符号化器を示すことができる。
本出願では、「再構築された(reconstructed)」および「復号された(decoded)」という用語は、互換的に使用することができ、「符号化された(encoded)」または「コード化された(coded)」という用語は、互換的に使用することができ、「画像(image)」、「ピクチャ(picture)」、および「フレーム(frame)」という用語は、互換的に使用することができる。必須ではないが、通常は、「再構築された」という用語は、符号化器側において使用される一方で「復号された」は、復号器側において使用される。
符号化される前に、ビデオシーケンスは事前符号化処理(101)、例えば、入力色ピクチャに色変換(例えば、RGB4:4:4からYCbCr4:2:0への変換)を適用すること、または、(例えば、色成分のうちの1つのヒストグラム等化を使用して)圧縮に対してより復元力のある信号分布を得るために、入力ピクチャ成分の再マッピングを実行することを経る場合がある。メタデータは、事前処理に関連付けることができ、ビットストリームに添付することができる。
1つ以上のピクチャでビデオシーケンスを符号化するために、ピクチャは、例えば、各スライスが1つ以上のスライスセグメントを含むことができる1つ以上のスライスに区切られる(102)。HEVCでは、スライスセグメントは、コーディングユニットと、予測ユニットと、変換ユニットと、に編成される。HEVC仕様は、「ブロック」と「ユニット」とを区別し、ここで「ブロック」は、サンプルアレイの特定の領域(例えば、輝度、Y)をアドレス指定し、「ユニット」は、すべての符号化された色成分(Y、Cb、Cr、またはモノクロ)、構文要素、およびブロックに関連付けられている予測データ(例えば、動きベクトル)の併置されたブロックを含む。
図2に示されているような、HEVCに従うコーディングでは、ピクチャは、構成可能サイズ(通常、64×64、128×128、または256×256ピクセル)を有する正方形のコード化ツリーブロック(CTB)に区切られ、コード化ツリーブロックの連続したセットは、スライスにグループ化される。コーディングツリーユニット(CTU)は、符号化された色成分のCTBを包含する。CTBは、図3に示すように、コーディングブロック(CB)へのクアッドツリーパーティショニングのルートであり、コーディングブロックは、1つ以上の予測ブロック(PB)に区切ることができ、変換ブロック(TB)へのクアッドツリーパーティションのルートを形成する。コーディングブロック、予測ブロック、および変換ブロックに対応して、コード化ユニット(CU)は、予測ユニット(PU)と、変換ユニット(TU)のツリー構造セットと、を含み、PUは、すべての色成分の予測情報を含み、TUは、各色成分の残差コード化構文構造を含む。輝度成分のCB、PB、およびTBのサイズは、対応するCU、PU、およびTUに適用される。本出願では、「ブロック(block)」という用語は、例えば、CTU、CU、PU、TU、CB、PB、およびTBのいずれかを指すために使用することができる。加えて、「ブロック」は、H.264/AVCまたは他のビデオコーディング規格で指定されているマクロブロックおよびパーティションを指すためにも使用することができ、より一般的には、様々なサイズのデータのアレイを指すために使用することができる。
符号化器100では、以下に説明されているように、ピクチャが、符号化器要素によって符号化される。符号化されるピクチャは、例えば、CUのユニットで処理される。各コーディングユニットは、イントラモードまたはインターモードのいずれかを使用して符号化される。コーディングユニットがイントラモードで符号化される場合、イントラ予測を実行する(160)。インターモードでは、動き推定(175)および動き補償(170)が行われる。符号化器は、イントラモードまたはインターモードのどちらをコーディングユニットの符号化に使用するかを決定し(105)、予測モードフラグによってイントラ/インター決定を示す。予測残差は、元の画像ブロックから予測されたブロックを減算することにより計算される(110)。
次いで、予測残差が変換され(125)、量子化される(130)。量子化された変換係数に加えて、動きベクトルおよび他の構文要素は、ビットストリームを出力するためにエントロピーコード化される(145)。非限定的な例として、コンテキストベースの適応型2値算術コーディング(CABAC)を使用して、構文要素をビットストリームに符号化することができる。
CABACで符号化するために、非2値構文要素の値は、2値化処理を介して、ビン文字列と呼ばれる2値シーケンスにマッピングされる。ビンの場合、コンテキストモデルが選択される。「コンテキストモデル」は、1つ以上のビンの確率モデルであり、直近のコード化されたシンボルの統計に応じて、一連の利用可能なモデルから選ばれる。各ビンのコンテキストモデルは、コンテキストモデルインデックス(「コンテキストインデックス」としても使用される)によって識別され、異なるコンテキストインデックスが異なるコンテキストモデルに対応する。コンテキストモデルは、各ビンが「1」または「0」である確率を記憶し、適応型または静的型とすることができる。静的モデルは、ビン「0」および「1」に対して等しい確率でコーディングエンジンをトリガする。適応コーディングエンジンでは、ビンの実際のコード化値に基づいてコンテキストモデルが更新される。適応モデルおよび静的モデルに対応する動作モードは、それぞれ、通常モードおよびバイパスモードと呼ばれる。コンテキストに基づいて、2値算術コーディングエンジンは、対応する確率モデルにしたがってビンを符号化または復号する。
符号化器はまた、変換をスキップし、例えば、4×4TUベースで非変換残差信号に直接量子化を適用することができる。符号化器はまた、変換および量子化の双方をバイパスすることもでき、すなわち、残差は、変換または量子化処理を適用せずに直接コード化される。直接PCMコーディングでは、予測は適用されず、コード化ユニットサンプルは、ビットストリームに直接コード化される。
符号化器は、符号化されたブロックを復号して、さらに予測するための参照を提供する。量子化された変換係数は非量子化され(140)、逆変換され(150)、予測残差を復号する。復号された予測残差と予測されたブロックとを組み合わせて(155)、画像ブロックが再構築される。ループ内フィルタ(165)は、再構築されたピクチャに適用され、例えば、デブロッキング/SAO(サンプル適合オフセット)フィルタリングを実行し、符号化アーティファクトを低減する。フィルタリングされた画像は、参照ピクチャバッファ(180)に記憶される。
図4は、HEVC復号器のような例示的なビデオ復号器200のブロック図を示している。復号器200では、以下に説明されているように、ビットストリームが、復号器要素によって復号される。ビデオ復号器200は、全般的に、図1で説明されたような符号化パスの逆の復号パスを実行し、これは、ビデオデータの符号化の一部として、ビデオ復号を実行する。図4はまた、VVC復号器のようなHEVC規格を改良した復号器またはHEVCに類似した技術を採用した復号器を示すことができる。
特に、復号器の入力は、ビデオ符号化器100によって生成され得るビデオビットストリームを含む。ビットストリームは、まずエントロピー復号され(230)、変換係数、動きベクトル、ピクチャパーティショニング情報、および他のコード化された情報が得られる。エントロピーコーディングにCABACが使用される場合、コンテキストモデルは、符号化器コンテキストモデルと同じ方法で初期化され、構文要素は、コンテキストモデルに基づいてビットストリームから復号される。
図5は、入力コード化ビットストリームが与えられた場合の構文要素のCABAC復号処理を示している。これは、図6の構文要素コーディング処理の逆の処理である。
図5の処理への入力は、コード化されたビットストリームを含み、典型的には、HEVCまたはVVCのようなビデオ圧縮規格に準拠している。復号処理の任意の時点で、復号器は次に復号される構文要素を認識する。これは、標準化されたビットストリーム構文および復号処理で完全に指定される。さらに、復号する現在の構文要素がどのように2値化されるか(つまり、それぞれが「1」または「0」に等しいビンと呼ばれる2値シンボルのシーケンスとして表される)、およびビン文字列の各ビンがどのように符号化されているかも認識される。
したがって、CABAC復号処理の第1段階(図5の左側)は、一連のビンを復号する。復号器は、ビンごとに、ビンがバイパスモードまたは通常モードのどちらに従って符号化されているかを認識する。バイパスモードは、ビットストリーム内のビットをシンプルに読み取り、そのようにして取得したビット値を現在のビンに割り当てることで構成される。このモードには、単純であるため高速であるという利点がある。これは通常効率的であるため、統計的分布が均一なビン、つまり「1」または「0」に等しくなる確率が等しいビンに使用される。
反対に、現在のビンがバイパスモードでコード化されていない場合は、いわゆる通常モードで、つまりコンテキストベースの算術コーディングによってコード化されていることを意味する。その場合、考慮されるビンの復号は次のように進められる。最初に、コンテキストモデラーモジュールを使用して、現在のビンを復号するためのコンテキストが取得される。コンテキストの目標は、コンテキスト情報または事前情報Xが与えられた場合に、現在のビンの値が「0」である条件付き確率を取得することである。ここでの事前Xは、現在のビンが復号された時点で、符号化器側と復号器側の両方で同期的に使用可能な、すでに復号されている構文要素の値であり得る。
通常、ビンの復号に使用される事前Xは標準で指定されており、復号する現在のビンと統計的に相関しているために選択される。このコンテキスト情報を使用する利点は、ビンのコーディングのレートコストを削減することである。これは、ビンとXの相関が高い場合、Xが与えられた場合のビンの条件付きエントロピーが低くなるという事実に基づいている。情報理論では、H(bin│X)<H(bin)という関係がよく知られている。
これは、ビンとXが統計的に相関している場合、Xを知っているビンの条件付きエントロピーがビンのエントロピーよりも低いことを意味する。したがって、コンテキスト情報Xは、ビンが「0」または「1」である確率を取得するために使用される。これらの条件付き確率が与えられると、通常の復号エンジンは2値ビンの算術復号を実行する。次に、ビンの値を使用して、現在のコンテキスト情報Xを認識し、現在のビンに関連付けられた条件付き確率の値を更新する。これはコンテキストモデルの更新と呼ばれる。ビンが復号(またはコード化)されている限り、各ビンのコンテキストモデルを更新すると、各2値要素のコンテキストモデリングを段階的に改良できる。したがって、CABAC復号器は、通常符号化された各ビンの統計的動作を段階的に学習する。コンテキストモデラーとコンテキストモデルの更新ステップは、符号化器側と復号器側で厳密に同じ動作であることに留意されたい。
現在のビンの通常の算術復号またはそのバイパス復号は、コード化方法に応じて、一連の復号されたビンにつながる。
次に、図5の右側に示されているCABAC復号の第2のフェーズでは、この一連の2値シンボルを構文要素に変換する。構文要素はフラグの形式をとり得、その場合、現在復号されているビンの値を直接取得する。他方、現在の構文要素の2値化が、考慮されている標準仕様にしたがっていくつかのビンのセットに対応する場合、2値コードワードから構文要素への変換が行われる。
これにより、符号化器によって実行された2値化の逆のステップが進められる。したがって、ここで実行される逆変換は、それぞれの復号された2値化バージョンに基づいて、これらの構文要素の値を取得する。
例えば、最後の有意な係数位置のプレフィックスコードとマージインデックス(マージ候補のリスト内の候補の位置を示す)に対応する構文要素は、トランケートされたライス(truncated Rice)2値化を使用して2値化される。最後の有意係数位置フラグの場合、すべてのビンは通常モードで符号化され、マージインデックスの場合、第1のビンは通常モードで符号化され、他のビンはバイパスモードで符号化される。
ピクチャパーティショニング情報は、ピクチャが区切られる方法、例えば、CTUのサイズ、およびCTUがCUに、および適用可能な場合はPUに分割される方法を示す。したがって、復号器は、復号されたピクチャパーティショニング情報にしたがって、例えば、ピクチャをCTUに分割し(235)、各CTUをCUに分割することができる。変換係数は、予測残差を復号するために、非量子化され(240)、かつ逆変換される(250)。
復号された予測残差と予測されたブロックとを組み合わせて(255)、画像ブロックが再構築される。予測ブロックは、イントラ予測(260)または動き補償予測(すなわち、インター予測)(275)から取得することができる(270)。ループ内フィルタ(265)は、再構築された画像に適用される。フィルタリングされた画像は、参照ピクチャバッファ(280)に記憶される。
復号されたピクチャは、事後復号処理(285)、例えば、逆色変換(例えば、YCbCr 4:2:0からRGB 4:4:4への変換)または事前符号化処理(101)で行われる再マッピング処理の逆を実行する逆再マッピングをさらに経ることができる。事後復号処理は、事前符号化処理において導出され、かつビットストリームで信号通知された、メタデータを使用することができる。
最近、圧縮ドメインでより柔軟な方法でピクチャデータを表現するために、圧縮ドメインでの新しいコーディングツリーユニット表現を含む新興のビデオ圧縮ツールが提案されている。コーディングツリーのより柔軟な表現により、HEVC規格のCU/PU/TUアレンジメントと比較して圧縮効率を向上させ得る。
一例では、クアッドツリープラスバイナリツリー(QTBT)コーディングツールは、柔軟性を向上させる新しいツールである。QTBTコーディングツリーは、コーディングユニットをクアッドツリー方式およびバイナリツリー方式の両方で分割することができる。QTBTテクノロジでは、CUは、正方形または長方形の形状を有する。コーディングユニットのサイズは、常に2の累乗であり、通常は、4~128である。コーディングツリーユニットを表すQTBTコーディングツリーの例を図7に示す。
コーディングユニットの分割は、符号化器側で、最低レート歪みコストでCTUのQTBT表現を決定することによって実行され得る、レート歪み最適化手順を経て決定される。CTUのQTBT分解は、2つの段階で構成され、実線がクアッドツリー分解フェーズを表し、破線がクアッドツリーリーフに空間的に埋め込まれた2値分解を表す、図7に例示されるように、最初にCTUがクアッドツリー方式で分割され、次に、各クアッドツリーリーフをさらに2値方式で分割することができる。イントラスライスでは、輝度ブロックと彩度ブロックのパーティショニング構造が分離され、独立して決定される。
予測ユニットまたは変換ユニットへのCUパーティショニングは採用されない。言い換えると、各コーディングユニットは体系的に、単一の予測ユニット(2N×2N予測ユニットパーティションタイプ)と単一の変換ユニット(変換ツリーへの分割なし)で構成されている。
水平または垂直トリプルツリー分割モード(HOR_TRIPLE、VER_TRIPLE)と呼ばれる、VVC(Versatile Video Coding)ビデオ圧縮規格で採用されている追加のCU分割モードは、コーディングユニット(CU)を3つのサブコーディングユニット(サブCU)に分割することからなり、それぞれのサイズは、図8に示すように、考慮される空間分割の方向で親CUサイズの1/4、1/2、および1/4に等しい。
本実施形態は、構文要素の符号化と復号を対象とする。いくつかの実施形態において、複雑さを低減するために、いくつかのイントラまたはインター予測パラメータのエントロピーコーディングが変更される。
上記のように、多くの2値シンボル(またはビン)は、コンテキスト適応型2値算術コーディング処理によってコード化および復号される。この処理には、ビンをコード化する、通常モードおよびバイパスモードの、2つの方法が伴う。バイパスコーディングモードは、通常のコーディングモードよりもはるかに複雑ではない。したがって、バイパスコーディングと比較して通常のコーディングモードでコーディング効率の改善がまったくまたはほとんど得られない場合、通常のコーディング処理をバイパスコーディング処理に置き換えることは有利である。
一実施形態では、バイパスコーディング処理は、一般化されたバイ予測インデックスを表すビン文字列の第1の1つ以上のビンに信号を送るために使用される。別の実施形態では、通常のコーディング処理の代わりにバイパスコーディング処理を使用して、AMVPモードにてコード化されたコーディングユニット(CU)の動きベクトルを符号化するためにどの動きベクトル予測因子が使用されるかを信号で伝える。
実際、これらの構文要素で符号化するビンの条件付きエントロピーは、現在のVVCコーディングシステムでこれらのビンにコンテキストベースの算術コーディングを使用しているにもかかわらず、1ビットの情報に近いことが検出されている。さらに、実験結果は、提案されたバイパスコーディングを使用することによるVVC圧縮性能への影響がごくわずかであることを示している。
以下では、一般化されたバイ予測インデックスと動きベクトル予測因子のシグナリングについてさらに詳しく説明する。
一般化されたバイ予測インデックスのシグナリング
VVCドラフト4の一般化されたバイ予測
VVCドラフト4(「Versatile Video Coding(Draft 4)」、B.Bross et al.、13thJVET meeting、January 9-18,2019,Marrakechを参照)においては、インターCUがいわゆる一般化されたバイ予測(GBi)の使用を介して一時的に予測され得る。一般化されたバイ予測において、バイ予測ブロックの時間予測は、次の式に従って、2つの参照ブロックの重み付け平均として計算される。
bipred=((8-w)×P+w×P+4)>>3
およびPは時間的予測因子であり、そしてwは、以下のセットで選択される。
-低遅延画像(過去のすべての参照画像がある)の場合、w ∈{-2、3、4、5、10}である。非低遅延画像(少なくとも1つの過去と1つの将来の参照画像がある)の場合、w∈{3、4、5}である。
-GBiの重みwは、符号化器側のレート歪み最適化処理に基づいて選択され、ビットストリームで信号通知される。GBiは、アフィン動き補償や適応動きベクトル解像度など、VVCのさまざまな動き補償ツールとも組み合わされている。
CUの予測に使用されるGBiの重みを信号通知する構文要素は、GBiインデックスと呼ばれる。
VVCドラフト4(符号化器)でのGBiインデックスのコーディング
VVCドラフト4では、GBiインデックスは最初に別のインデックスgbiCodingIndexに変換される。デフォルトの重み(等しい重み)を使用するかどうかを示すフラグが決定される。フラグは、デフォルト重みw=4(予測因子PおよびPの両方について等しい重み)については1に、および他の重みについては0に設定される。残りのgbiCodingIndexは、トランケートされたライス(トランケートされた単項)ビン文字列を使用して2値化される。トランケートされたライスビン文字列のフラグまたは各ビンは、専用のCABACコンテキストを使用してCABACで符号化される。特に、フラグは、コンテキストモデルID0でコンテキストベースにコード化されている(つまり、通常モードを使用している)。ビンである、ビン1、ビン2、およびビン3は、それぞれコンテキストモデルID4、5、および6でコンテキストベースにコード化されている。
表1は、低遅延モードのGBiインデックス(GBiIdx)コーディングを示しており、GBiモードの数はnumGBiModes=5に設定されており、第1のビンに加えてビンの最大数はnumBins=3に設定されている。
Figure 2022523287000002
表2は、非低遅延モードのGBiインデックスコーディングを示しており、GBiモードの数はnumGBiModes=3に設定されており、第1のビンに加えてビンの最大数はnumBins=1に設定されている。
Figure 2022523287000003
表1と表2に示されているフラグとビン文字列の連結は、gbiCodingIndexのトランケートされたライス2値化と直接見なすことができることに注意されたい。つまり、gbiCodingIndexは、トランケートされたライス(トランケートされた単項)ビン文字列を使用して2値化される。各ビンは専用のCABACコンテキストを用いて、CABACで符号化されている。特に、第1のビン、ビン0は、コンテキストモデルID0でコンテキストベースにコード化されている(つまり、通常モードを使用している)。第1のビンは、デフォルトの重みw=4(予測因子PおよびPの両方で等しい重み)の場合は1に設定され、その他の重みの場合は0に設定されることに注意されたい。したがって、第1のビンは、デフォルトの重みを使用するか否かを示すフラグと見なすこともできる。次に、後続のビンである、ビン1、ビン2、およびビン3は、それぞれコンテキストモデルID4、5、および6でコンテキストベースにコード化される。
図9は、VVCドラフト4におけるようなGBiインデックスのコーディングを示している。ステップ910で、変数Idxが0に設定される。ステップ920で、現在のCUに関連付けられたGBiIdx値は、表1および表2の列「gbiCodingIndex」によって定義されたテーブルGbiCodingOrderを介して、gbiCodingIndexに変換される。ステップ930で、フラグ(gbiCodingIndex==0)が符号化され、これは、値gbiCodingIndexがゼロに等しいかどうかを示す。ゼロ値は、現在のCUのGBiIdx値がGBI_DEFAULTに等しい場合に対応し、これは、デフォルトのバイ予測モード、つまり、w=4の場合に対応する。gbiCodingIndexの値がゼロ(940)の場合、処理は終了する。
それ以外の場合、符号化器はスライスが低遅延タイプであるかどうかをチェックする(945)。スライスが低遅延タイプの場合、numGbiModesは5に設定され(950)、スライスが低遅延タイプでない場合、numGbiModesは3に設定される(955)。ステップ960で、Idxは1に設定される。ステップ965で、コンテキストモデルIDcontextIdが4に設定される。ステップ970で、numBinsは、numGbiModes-2に設定される。gbiCodingIndexは、bin文字列に2値化される。次に、gbiCodingIndexを表すビンは、すべてのビンが符号化される(990)まで、対応するcontextIdを使用して(985)、1つずつ符号化される(980)。処理はステップ999で終了する。
図10は、VVCドラフト4におけるようなGBiインデックスの解析を示している。復号器は、ビットストリームから値「Idx」を復号し、復号された値IdxとCUレベルのGBiIdxパラメータをリンクするマッピングテーブルGbiParsingOrderを使用して、「Idx」を入力CUに関連付けられた実際のGBiIdxに変換する。
より具体的には、ステップ1010で、変数Idxが0に設定される。ステップ1020で、値gbiCodingIndexがゼロ(gbiCodingIdx==0)に等しいかどうかを示すフラグが、コンテキストId=0を使用して復号される。ゼロ値は、現在のCUのGBiIdx値がGBI_DEFAULTに等しい場合に対応し、これは、デフォルトのバイ予測モード、つまり、w=4の場合に対応する。復号されたシンボルが1の場合、復号器はステップ1090に進む。
それ以外の場合、フラグが1の場合(1025)、ステップ1030でIdxが1に設定される。ステップ1035で、コンテキストモデルIDcontextIdが4に設定される。復号器は、スライスが低遅延タイプであるかどうかをチェックする(1040)。スライスが低遅延タイプの場合、numGbiModesは5に設定され(1045)、スライスが低遅延タイプでない場合、numGbiModesは3に設定される(1050)。ステップ1060において、numBinsはnumGbiModes-2に設定される。次に、gbiCodingIndexを表すビンは、1に等しいビンシンボルが見つかるか、numBinsビンが解析されるまで(1085)、対応するcontextIdを使用して(1080)1つずつ反復的に復号される(1070)。各反復で、変数Idxがインクリメントされる。ステップ1090で、「Idx」はテーブルGbiParsingOrderを介してGBiインデックスに変換される。処理はステップ1099で終了する。
提案されたGBiインデックスコーディング処理(符号化器)
表3と表4は、それぞれ低遅延モードと非低遅延モードのGBiインデックス(GBiIdx)コーディングに対する提案された変更を示している。この提案された方法では、第1のビンはバイパスモード(表では「b」として表される)で符号化され、他のビンは通常モードで符号化される。
Figure 2022523287000004
Figure 2022523287000005
図11は、一実施形態による、提案されたGBiIdxパラメータコーディング処理を示す。ステップ1165で、contextIdは5に設定される。ステップ1170で、表3または表4のトランケートされたライスビン文字列の第1のビンは、コンテキストベースの算術コーディングモードの代わりに、バイパスモードで符号化される。他のビンは、もしあれば、図9に記載されたものと同様に、通常モードで符号化される。この提案された実施形態の利点は、CUレベルのGBiIdxパラメータを符号化する際の複雑さが軽減されることである。
提案されたGBi解析処理(復号器)
図12は、一実施形態による、GBiIdxパラメータ解析処理に対する提案された変更を示す。見てわかるように、提案されたGBiIdx解析処理の第1のステップは、図10に記載されたものと同じである。次に、最初に復号されたシンボルが0(GBI_DEFAULTベースではない)に等しい場合、トランケートされたライスの2値化された文字列を表す一連のビンが解析される。提案された実施形態によれば、この文字列の第1のビンは、コンテキストベースの算術復号モードの代わりに、バイパスモードを使用して解析される。他のビンは、従来技術と同じ方法で復号される。この提案された実施形態の利点は、GBiIdx CUレベルパラメータを解析する際の複雑さが軽減されることである。
上記では、インデックスが複数のビンで表されている場合、第1のビンはバイパスモードでコード化され、残りのビンは通常モードで符号化される。より一般的には、2つ以上のビン(ビン文字列の先頭)をバイパスモードで符号化でき、残りのビンは通常モードで符号化される。また、トランケートされたライス2値化は上記の例で説明されているが、提案されたコーディング方法は他の2値化スキームに適用できることに注意されたい。加えて、GBiインデックスは、上記の構文要素の例として使用される。ただし、上記の方法は他の構文要素に適用できる。
それ以外の構文要素を符号化する場合、例えば、前述のようにマージインデックスを符号化する場合は、バイパスモードと通常モードの両方が使用されることに注意されたい。特に、マージインデックスを符号化するには、第1のビンを通常モードで符号化し、これは、おそらくコンテキスト情報を使用して符号化する方が効率的であるためである。残りのビンでは、確率がよりランダムに分散される場合があり、等しい確率に対応するバイパスモードも同様に機能し得る。そのような符号化は、第1のビンがバイパスモードで符号化され、残りのビンが通常モードで符号化される、本実施形態で提案されるものと反対であることに留意されたい。
別の実施形態によれば、デフォルトGBiインデックス(GBI_DEFAULT)が重み係数w=4に対応するどうかを示す、第1のフラグのみが、通常モードで符号化される。この実施形態では、そのフラグに続くトランケートされたライスビン文字列のすべてのビンは、バイパスモードで符号化される。この実施形態の利点は、GBiインデックスのコーディングおよび構文解析の複雑さがさらに軽減されることであるが、コーディング効率がわずかに低下するという犠牲を払う可能性がある。図11Aは、この実施形態による、提案されたgbiCodingIndexコーディング処理を示す。ステップ1180で、表3または表4のトランケートされたライスビン文字列のビンは、コンテキストベースの算術コーディングモードの代わりに、バイパスモードで連続的に符号化される。この提案された実施形態の利点は、ビデオ圧縮効率の点でペナルティなしに、CUレベルのGBiIdxパラメータを符号化する際の複雑さをさらに軽減することである。
図12Aは、この実施形態による、gbiCodingIndex解析処理に対する提案された変更を示す。見てわかるように、提案されたgbiCodingIndex解析処理の第1のステップは、図10で説明したものと同じである。次に、最初に復号されたシンボルが0に等しい場合(非GBI_DEFAULTの場合)、トランケートされたライス2値化された文字列を表す一連のビンが解析される。提案された実施形態によれば、この文字列のビンは、コンテキストベースの算術復号モードの代わりに、バイパスモードを使用して解析される(1280)。
表4Aは、この提案された実施形態(図11A、図12Aに記載される)をgbiCodingIndexコーディングに使用した場合のVTM-4.0の圧縮性能を、図10のgbiCodingIndex解析方法と結合される、図9のgbiCodingIndexコーディング方法によるVTM-4.0の性能と比較して示す。表に提示されている数値は、同じ客観的なビデオ品質での、提案された方法の平均ビットレート削減に対応している。したがって、負の数はビットレートの削減、したがってコーディング効率の向上を示し、正の数はビットレートの増加、したがってコーディング効率の低下を示す。Y、U、およびV列はそれぞれ、輝度、彩度Cb、および彩度Crの成分に対応する。この実施形態は、図9の方法と比較して、輝度において平均ビットレート変更をもたらさず、したがって、より多くのバイパスコード化ビンの使用による複雑さの低減にもかかわらず、ビデオ圧縮効率にペナルティを導入しないことが分かる。
Figure 2022523287000006
以下では、提案されたgbiCodingIndexコーディングおよび解析方法がコーディング効率を損なわない理由、つまり、トランケートされたライス(TR)ビン文字列から発行されたビンのバイパスコーディングがこれらのビンの算術コーディングと同じくらい効率的である理由を説明する。
算術コーディングは、シャノン限界に非常に近いビットレート、つまりそれが符号化するシンボルのエントロピーを達成することが知られているため、最適またはほぼ最適なエントロピーコーディング方法である。
処理のバイパスコーディング部分の最適性は、gbiCodingIndexのコード化に使用される2値化がハフマンツリーに密接に対応していることを意味する。これは、バイパスモードでgbiCodingIndexのビンをコード化するためのTR2値化が、ハフマンツリーに対応することを意味する。ハフマンコーディングは、最適な可変長コーディング方法である。さらに、ハフマンコーディングは、特定の条件が満たされた場合に、信号通知されたビンのエントロピーに等しい平均コード長を生成することが知られている。特に、ハフマンツリーの各ブランチに関連付けられた確率がダイアディックである場合、つまり、負の2の累乗、すなわち1/2(ここで、nは正の整数値である)に等しい場合、ハフマンコーディングが最適である。
図12Bおよび図12Cの2つのツリーは、それぞれ、非低遅延モードおよび低遅延ピクチャ間コーディング構成での、提案された解決策から生じるgbiCodingIndexの2値化およびコーディング/解析処理を示している。埋められたノードは通常の(コンテキストベースの)コード化されたビンに対応し、埋められていないノードはバイパスコード化されたビンに対応する。xを、コンテキストベースのコード化されたビンが0に等しい確率とする。図12Bおよび図12Cのツリーの各エッジに関連付けられた値は、2値化されたgbiCodingIndexのビンが1または0に等しい確率に対応する。例えば、2値化されたgbiCodingIndexの第2のビンが0に等しい確率は
Figure 2022523287000007
であり、このビンが1に等しい確率も
Figure 2022523287000008
である。図12Dは、デフォルトのGBIモードを信号で伝える第1のビンが0に等しいことを知っている、2値化されたgbiCodingIndexのバイパスコード化されたビンのコーディング/構文解析に対応するツリーを示す。すでに説明したように、これらのビンのバイパスコーディングの最適性は、図12Dのツリーが、最適であり、したがってダイアディックに関連付けられた確率値を有するハフマンコーディングツリーであることを示している。
構文要素のトランケートされたライス(TR)2値化から生じるビン文字列の確率は、常にダイアディックであるとは限らない。例えば、VVC仕様には、トランケートされたライス2値化に続いて2値化され、構文要素last_sig_coeff_x_prefixやlast_sig_coeff_y_prefixなど、すべてのビンがコンテキストベースでコード化されている他の構文要素がいくつかある。これらの2つのパラメータはトランケートされたライス2値化され、すべてのビンはコンテキストベースでコード化される。それらの一部をバイパスコーディングすると、圧縮効率が低下し、これは、バイパスコード化されたビンのダイアディック確率分布を伴う、対応するバイパスコーディングが最適なハフマンコーディング処理に対応していないことを示す。
この実施形態では、TR2値化後のgbiCodingIndexのビン文字列の確率がダイアディックに近く、したがってバイパスコーディングパスを適用することは、最適なハフマンコーディング処理に対応する一方で、通常モードにおける算術コーディングよりも計算の複雑さが低いことを認識する。
動きベクトル予測因子のシグナリング
VVCドラフト4のAMVPモードでの動きベクトル予測コーディング
AMVP動きベクトルコーディングモードは、次の要素を使用してCUの動きベクトルをコーディングすることに関連している。
-インター予測方向であり、現在のCUを予測するためにバイ予測またはユニ予測が使用されているかどうかを示し、ユニ予測の場合はどの参照ピクチャリストが使用されているかを示す。
-参照ピクチャインデックス(複数可)であり、関与する各参照ピクチャリストで、どの参照ピクチャ(複数可)が現在のCUを予測するために使用されているのかを示す。
-動きベクトル予測因子であり、現在のCUを予測するために使用される各参照ピクチャについて、現在のCUの実際の動きベクトルを予測するために使用される。このMV予測因子(またはMVP、またはAMVP候補)は、2つの候補を含むMV予測因子リストの符号化器によって選択される。どのMV候補が選択されたかは、関連する参照ピクチャリストL0およびL1ごとに、それぞれmvp_l0_flagおよびmvp_l1_flagと記されたフラグを介して信号通知される。
-動きベクトルであり、各参照ピクチャリストL0およびL1ごとに、現在のCUの実際の動きベクトルとそれぞれの動きベクトル予測因子との間の差である。
AMVP動きベクトル予測候補リストの構成を図13および図14に示す。この処理は基本的に、現在のCUの周囲の5つの空間位置から最大2つの空間候補を選択し、それらを剪定して最大2つを維持することで構成される。次に、現在のスライスのいわゆる併置されたスライスにおいて、右下の位置Hに対応する空間位置で、または利用できない場合は中心位置「中心」で、時間的MV予測候補が求められる。次に、剪定処理が空間候補と時間候補の間に適用され、リストは全体で最大2つの要素までゼロの動きベクトルで埋められる。最終的に、AMVP候補リストには正確に2つの動きベクトル予測候補が含まれる。
したがって、それぞれmvp_l0_flagおよびmvp_l1_flagと記された単一のフラグがビットストリームで信号通知され、復号器側で解析されて、AMVPリストに含まれる2つの要素のうちどのAMVP候補が、各参照ピクチャリストL0およびL1における現在のCUの動きベクトルを予測するために使用されるかを示す。
考慮される参照ピクチャリストL0またはL1に応じて、フラグmvp_l0_flagまたはmvp_l1_flagを解析する処理が図15に示されている。これは、2値シンボル「シンボル」のコンテキストベースの算術復号(1510)で構成される。これは、単一のCABACコンテキストを採用している。考慮される参照ピクチャリスト内の現在のPUまたはCUのMV予測因子インデックスには、復号されたシンボルの値が与えられる(PUは、HEVCにて使用されているように、現在のCU内の動きパーティションであり得、VVCドラフト4において、PUパーティショニングが使用されないので、PUはCUに対応する)(1520)。
提案されている方法:バイパスモードにおけるmvp_l0_flagおよびmvp_l1_flagのコーディング
複数のコード化されたビデオシーケンスにわたって、mvp_l0_flagおよびmvp_l1_flag構文要素を信号通知する、CABACに使用される平均エントロピーが1ビットの情報に非常に近いことが測定されているが、これは、単純なバイパスコーディング処理と比較して、これらのフラグのCABACコーディングによって利益がもたらされないことを意味する。
したがって、本実施形態では、バイパスコーディングモードを介してこれらのフラグを符号化および解析することが提案される。図16は、1つの所与の参照ピクチャリストについて、1つのCUまたはPUのMV予測因子インデックスを復号する(1610、1620)ために提案された解析処理を示している。図15の処理との違いは、関係するビンのCABAC復号が、このビンのバイパス復号によって置き換えられることである(1610)。符号化器側では、mvp_l0_flagまたはmvp_l1_flagを表す2値シンボルがバイパスモードで符号化される。この実施形態の利点は、コーディング効率への影響はほとんどなく、VVCのコーディングおよび解析処理の複雑さが軽減されることである。
さらなる実施形態によれば、mvp_l0_flagは、考慮されるCUがSMVD(対称動きベクトル差)モードでコード化されているか否かに応じて、異なる方法でコード化され得る。VVCのSMVD動きベクトルコーディング処理は、第1の参照ピクチャリストL0に関して所与のCUの動きベクトル差をコード化することからなる。次に、他の参照ピクチャリスト(L1)において考慮されたCUの動きベクトル差が、L0の動きベクトル差から導き出される。実際、このモードにおいては、2つの動きベクトルは対称である。L1動きベクトルは、両方の成分でL0動きベクトルの反対に等しくなる。この実施形態では、SMVDの場合のMVP候補は、通常モードで符号化され得、一方、従来のAMVP動きベクトルコーディングモードのMVP候補は、バイパスモードでコード化され得る。これは、古典的なmvp_l0_flagとsmvd_mvp_l0flagの2つの別個の構文要素を指定できることを意味し、後者は、SMVDモードでCUの動きベクトルを予測するために使用されるMVを指定するために使用される。
別の実施形態によれば、古典的なmvp_l0_flagは通常モードでコード化され得、一方、smvd_mvp_l0flagはバイパスモードでコード化され得る。変形によれば、古典的なmvp_l0_flagは通常モードでコード化され得、smvd_mvp_l0flagは、通常モードでもコード化されるが、通常のmvp_l0_flagのコード化に使用されるCABACコンテキストとは別個のコンテキストを用いる場合がある。
表5に、VVCドラフト4構文を例として使用して、上記で提案した方法によって構文に加えられた変更の例を示す。特に、構文要素mvp_l0_flagおよびmvp_l1_flagの記述子がae(v)からu(1)に変更されており、ここで、ae(v)はコンテキスト適応型算術エントロピーコード化構文要素を示し、u(n)はnビットを使用した符号なし整数を示す。
Figure 2022523287000009
Figure 2022523287000010
表6は、上記で提案した複雑さの軽減の面で得られた性能結果を示している。提案された簡略化による圧縮効率の変化がほとんどないことがわかる。
Figure 2022523287000011
上記では、VVCドラフト4に関する例が説明されている。以下では、サブブロック間変換のシグナリング、イントラサブパーティション(ISP)コーディングモード、複数の基準線イントラ予測、およびツール間のSMVD(対称動きベクトル差)を含むいくつかの例について、VVCドラフト5に関して説明されている(「VersatileVideo Coding(Draft 5)」、B.Bross et al.、14th JVET meeting、March19-27, 2019、Geneva,CHを参照)。
サブブロック変換のシグナリング
VVCドラフト5のサブブロック変換(SBT)
非ゼロの残差ブロックとして信号通知されるインター予測されたCUの場合、SBTツールはCUを2値方式で2つの変換ユニット(TU)に分割する。結果として得られる2つのTUの一方は非ゼロの残差を有し、他方はゼロの残差データのみを有する。適用される2値分割は、対称または非対称であり得る。対称分割の場合、結果として得られる2つのTUは等しいサイズを有し、これは、分割の方向においてCUのサイズの半分である。非対称2値分割の場合、一方のTUのサイズは分割方向に沿った1/4または親CUに等しく、他方のTUサイズは分割方向に沿ったCUのサイズの3/4である。
空間分割に加えて、残差が非ゼロのTUは、推定適応変換でコード化される。使用される1D変換は、図17に示されるように、非ゼロ残差TUの位置に依存し、ここで、部分「A」は、非ゼロ残差データを有するTUであり、他のTUは、ゼロ残差データのみを有する。
考慮されるコーディングユニットのTU分割は、3つのフラグを介して信号通知される。まず、cu_sbt_flagは、考慮されるCUにSBTを使用することを示している。次に、SBTを使用する場合、SBTタイプおよびSBT位置情報が信号通知される。これは、次の3つのコード化されたフラグの形式を取る。
-cu_sbt_quad_flagは、非対称2値分割の使用を示す。現在のCUで対称分割と非対称分割の両方が許容されている場合にコード化される。
-cu_sbt_horizontal_flagは、2値分割の方向を示す。現在のCU、および以前に信号通知されたSBT分割タイプ(非対称か否か)に対して、ホットゾーン分割と垂直分割の両方が許容されている場合にコード化される。
-cu_sbt_pos_flagは、考慮されるCUのテクスチャデータをコード化するために使用される非ゼロの残差TUの位置を示す。
VVCドラフト5では、上記の4つのフラグはコンテキストベースでコード化されている。この態様に対応するVVC仕様の部分を表7に示す。
Figure 2022523287000012
図18は、VVCドラフト5で指定されたSBTモードの復号処理を示している。ステップ1810で、cu_sbt_flagを復号するためのコンテキストIDは、ctxId=(幅*高さ)<=256?1:0として取得される。次に、ステップ1820で、2値シンボルcu_sbt_flagは、コンテキストctxIdによりCABAC復号される。cu_sbt_flagが0に等しい場合(1830)、サブブロック変換ツールは使用されない。それ以外の場合、cu_sbt_flagが0でない場合、2値シンボルcu_sbt_quad_flagは、ステップ1840において、コンテキストctxId=0によりCABAC復号される。ステップ1850で、復号器は、現在のCUに対して垂直および水平分割が許容されているか否かをチェックする。はいの場合、ステップ1860にて、cu_sbt_horizontal_flagを復号するコンテキストidはctxId=(cuWidth==cuHeight)? 0:(cuWidth<cuHeight?1:2)として取得される。次に、ステップ1870にて、2値シンボルcu_sbt_horizontal_flagは、コンテキストctxIdによりCABAC復号される。ステップ1880にて、2値シンボルcu_sbt_pos_flagは、コンテキストctxId=0によりCABAC復号される。処理はステップ1899において終了する。
SBTモードの簡略化されたコーディング
提案された実施形態によれば、「cu_sbt_pos_flag」は、通常の(コンテキストベースの)CABACモードの代わりにバイパスモードでコード化される。実際、「cu_sbt_pos_flag」のこの簡略化されたコーディングは、エントロピーコーディングを簡略化しながら、コーデックのコーディング効率全体にほとんど影響を与えない。
別の実施形態によれば、「cu_sbt_quad_flag」は、通常モードではなくバイパスモードでコード化される。この簡略化も、コーデックの性能にほとんど影響を与えない。
別の実施形態によれば、「cu_sbt_pos_flag」および「cu_sbt_quad_flag」の両方が、通常モードではなくバイパスモードでコード化される。
別の実施形態によれば、「cu_sbt_horizontal_flag」は、通常モードではなくバイパスモードでコード化される。この簡略化も、コーデックの性能にほとんど影響を与えない。
別の実施形態によれば、3つのフラグ「cu_sbt_pos_flag」、「cu_sbt_quad_flag」、および「cu_sbt_horizontal_flag」は、通常モードではなくバイパスモードでコード化される。表8のシミュレーション結果に示されているように、この全体的な変更から生じるコーディング効率の損失はほとんどない。
Figure 2022523287000013
図19Aは、「cu_sbt_pos_flag」および「cu_sbt_quad_flag」の両方がバイパスモードでコード化される(1940、1980)実施形態による復号処理を示す。図19Bは、3つのフラグ「cu_sbt_pos_flag」、「cu_sbt_quad_flag」および「cu_sbt_horizontal_flag」がバイパスモードでコード化される実施形態による復号処理を示す。
Figure 2022523287000014
VVCドラフト5の標準構文仕様は、表10に示すように変更できる。特に、構文要素cu_sbt_quad_flagおよびcu_sbt_pos_flagの記述子は、ae(v)からu(1)に変更される。
Figure 2022523287000015
イントラサブパーティションコーディングモードのシグナリング
VVCドラフト5におけるイントラサブパーティション
VVCドラフト5で指定されているイントラサブパーティション(ISP)コーディングモードは、INTRA CUを水平または垂直に2つまたは4つのサブパーティションに分割できる。表11に示すように、分割はブロックサイズによって異なる。基本的に、4x4CUをさらに分割することはできない。サイズ4x8または8x4のCUは、2つのTu(つまり、サブパーティション)に分割される。他のCUは4つのTuに分割される。
Figure 2022523287000016
図20Aは、4x8および8x4のINTRAコーディングユニットに対して許容されるISP分割を示し、図20Bは、4x8または8x4とは異なるサイズのINTRAコーディングユニットに対して許容されるISP分割を示す。ISPモードでコード化されたCUの内部では、TUは順次復号され、CUレベルで信号通知される同じイントラ予測モードを使用してTUからTUへイントラ予測される。最後に、残りのコーディングもサブパーティション内のサイズに応じて適合される。実際、サブパーティションはサイズ1xN、Nx1、2xN、またはNx2であり得、サイズ1x16、1x1、2x16、または16x2のコーディンググループがこれらのそれぞれの場合に使用される。
ISPコーディングモードは、VVCドラフト5の2つの連続するフラグを介して信号通知される。
-intra_subpartitions_mode_flagは、所与のイントラCUにISPモードを使用することを示す。
-intra_subpartitions_split_flagは、イントラサブパーティションへの分割の方向を示す。
上記の2つのフラグは、以下のように、考慮されるCUに関連付けられた「IntraSubPartitionsSplitType」の値を復号するために使用される。
IntraSubPartitionsSplitType=intra_subpartitions_mode_flag==0?0:(1+intra_subpartitions_split_flag)
「IntraSubPartitionsSplitType」値の意味を表12に示す。
Figure 2022523287000017
これらの2つのフラグは、表13に示すように、VVCドラフト5に従ってコンテキストベースでコード化されている。
Figure 2022523287000018
ISPモードの簡略化されたコーディング
一実施形態では、ビン「intra_subparitions_split_flag」、すなわち、CUのISPモードをコード化するために使用される第2のフラグは、バイパスモードでコード化される。この実施形態に関連するVVCドラフト5仕様への変更は、表14および表15に示されている。特に、構文要素「intra_subpartitions_split_flag」の記述子がae(v)からu(1)に変更される。
Figure 2022523287000019
Figure 2022523287000020
複数の基準線イントラ予測のシグナリング
VVCドラフト5の複数の基準線イントラ予測
VVCドラフト5のINTRA CUで使用される複数の基準線イントラ予測は、3つの基準線から選択された現在のCUの左上の1つの基準線と列に属する再構築された参照サンプルに基づいて輝度ブロックの角度イントラ予測を実行する。イントラ予測に使用される基準線は、構文要素「intra_luma_ref_idx」を介してビットストリームで信号通知される。各基準線は、図21に示すように、そのインデックスによって識別される。VVCドラフト5で実際に使用される基準は、図21に示される線0、線1、および線3である。この構文要素は、イントラ予測モードの前に信号通知される。基準線が線0と異なる場合、つまりCUに最も近い線の場合。
「intra_luma_ref_idx」は次のようにコード化されている。トランケートされたライスビン文字列として2値化される。これは、1に等しい一連の通常のCABACビンによってコード化され、0に等しい通常のCABACビンで終了することを意味する。全体として、最大3つのビンが信号通知される。
VVCドラフト5による「intra_luma_ref_idx」の復号処理を図22に示す。図22では、最大4本の基準線を伴う一般的な処理が使用されている。配列lineIDx[.]は、4つの線基準インデックスで構成され、値「MaxNumRefLInes」は、イントラ予測で許容される基準線の最大数を表す。「MaxNumRefLInes」はVVCの場合は3に等しく、配列lineIdxは以下の要素で構成される。
lineIdx={0、1、3}。
構文要素「intra_luma_ref_idx」のVVC復号処理は以下のように進められる。処理の出力は、復号されたmultiRefIdxである。特に、ステップ2210において、それは、現在のCUに対して複数の基準線が許容されているか否かをチェックする。はいの場合、出力値multiRefIdxは0に初期化される(2220)。MaxNumRefLinesが1より大きくない場合(2225)、処理は終了する。それ以外の場合、ステップ2230で、CABAC通常ビンがインデックス0の単一のCABACコンテキストで解析される。0に等しい場合、multiRefIdx値は変更されず、処理は終了する。それ以外の場合、multiRefIdxは、lineIdx[1]と等しく設定される。
MaxNumRefLinesが2よりも厳密に高い場合(2250)、ステップ2255で、第2の通常のCABACビンは、識別子1の単一のコンテキストで復号される。復号されたビンが0の場合、multiRefIdxは変更されず、処理は終了する。それ以外の場合、mutiRefIdxはlineIdx[2]と等しく設定される(2260)。MaxNumRefLinesが3よりも厳密に高い場合(2270)、第3の通常のCABACビンが識別子2の単一のコンテキストで復号される(2280)。復号されたビンが0の場合、multiRefIdxは変更されず、処理は終了する(2299)。それ以外の場合、mutiRefIdxはlineIdx[3]と等しく設定される(2290)。VVCドラフト5用に選択された設計では、上述したように最大3つの基準線を使用できるため、実際には、このステップはVVCドラフト5仕様に従って行われないことに留意されたい。したがって、条件付きの「MaxNumRefLines>3」は、VVCドラフト5の範囲では常に誤りである。
すでに説明され、表16に示されているように、VVCドラフト5のintra_luma_ref_idx構文要素を信号通知するように、2つの通常のコード化されたビンが使用されて、各ビンは単一のCABACコンテキストを使用する。
Figure 2022523287000021
複数の基準線インデックスの簡略化されたコーディング
一実施形態では、「intra_luma_ref_idx」構文要素のコーディングは簡略化され、この構文要素の第1のビンのみが通常モードでコード化される。この構文要素に対して提案された変更された構文解析処理が図23に示されている。特に、ステップ2355および2380において、第2のビンおよび第3のビンは、バイパスモードで復号される。他のステップは、図22に示されるものと同様である。
この実施形態にしたがって、VVCドラフト5仕様は表17に示すように変更できる。
Figure 2022523287000022
SMVDフラグのシグナリング
VVCドラフト5のSMVDフラグ
sym_mvd_flag構文要素は、INTERコーディングユニットに対称的な動きベクトル差を使用することを示す。VVCのSMVD動きベクトルコーディング処理は、第1の参照ピクチャリストL0に関して所与のCUの動きベクトル差をコード化する。次に、他の参照ピクチャリスト(L1)において考慮されたCUの動きベクトル差が、L0の動きベクトル差から導き出される。実際、このモードでは、2つの動きベクトルの差は対称的である。L1動きベクトル差は、x成分とy成分の両方で、L0動きベクトル差の反対に等しくなる。VVCドラフト5では、このsym_mvd_flagは、単一のCABACコンテキストを使用する通常のCABACモードでコード化および復号される。
SMVDフラグの簡略化されたコーディング
一実施形態では、バイパスモードでこのフラグを符号化および復号することが提案されている。提案された簡略化は、VVCの圧縮効率に影響を与えない。この実施形態によれば、VVCドラフト5構文仕様は、表18に示されるように変更することができる。特に、svm_mvd_flagの記述子がae(v)からu(1)に変更される。
Figure 2022523287000023
様々な方法が、本明細書に記載されており、それらの方法のそれぞれは、説明された方法を達成するための1つ以上のステップまたは行為を含む。本方法の正しい動作のために特定の順序のステップまたは行為が必要でない限り、特定のステップおよび/または行為の順序および/または使用は、変更されてもよく、または組み合わせられてもよい。
本出願に説明されている様々な方法および他の態様を使用して、図1および図4に示されるように、モジュール、例えば、ビデオ符号化器100および復号器200のエントロピー符号化および復号モジュール(145、230)を変更することができる。さらに、本態様は、VVCまたはHEVCに限定されるものではなく、例えば、他の標準規格および推奨、ならびに任意のそのような標準規格および推奨の拡張版に適用することができる。特に指示されていない限り、または技術的に除外されていない限り、本出願で説明される態様は、個別にまたは組み合わせて使用することができる。
本出願では様々な数値が使用され、例えば、コンテキストモデルIDが使用されている。特定の値は、例示的な目的のためであり、記載された態様は、これらの特定の値に限定されるものではない。
図24は、様々な態様および実施形態が実装されるシステムの一例のブロック図を示す。システム2400は、以下で説明される様々な構成要素を含む装置として具体化することができ、本出願で説明される態様の1つ以上を実行するように構成される。そのような装置の例は、これらに限定されるものではないが、パーソナルコンピュータ、ラップトップコンピュータ、スマートフォン、タブレットコンピュータ、デジタルマルチメディアセットトップボックス、デジタルテレビ受像機、パーソナルビデオ録画システム、コネクテッド家電、およびサーバなどの様々な電子装置を含む。システム2400の要素は、単独でも組み合わせでも、単一の集積回路、複数のIC、および/または別個の構成要素に具体化することができる。例えば、少なくとも1つの実施形態において、システム2400の処理および符号化器/復号器要素は、複数のICおよび/または個別の構成要素にわたって分散している。様々な実施形態において、システム2400は、他のシステムに、または他の電子装置に、例えば、通信バスを介して、または専用の入力および/または出力ポートを通して、通信可能に結合される。様々な実施形態において、システム2400は、本出願に記載の態様のうちの1つ以上を実装するように構成される。
システム2400は、例えば、本出願に記載の様々な態様を実装するために、そこにロードされる命令を実行するように構成された少なくとも1つのプロセッサ2410を含む。プロセッサ2410は、埋め込みメモリ、入力出力インターフェース、および当該技術分野において知られているような他の様々な回路を含むことができる。システム2400は、少なくとも1つのメモリ2420(例えば、揮発性メモリ装置、および/または不揮発性メモリ装置)を含む。システム2400は、これらに限定されるものではないが、EEPROM、ROM、PROM、RAM、DRAM、SRAM、フラッシュ、磁気ディスクドライブ、および/または光ディスクドライブを含む、不揮発性メモリおよび/または揮発性メモリを含むことができる記憶装置2440を含む。記憶装置2440は、非限定的な例として、内部記憶装置、付属記憶装置、および/またはネットワークアクセス可能記憶装置を含むことができる。
システム2400は、例えば、符号化されたビデオまたは復号されたビデオを提供するようにデータを処理するように構成された符号化器/復号器モジュール2430を含み、符号化器/復号器モジュール2430は、独自のプロセッサおよびメモリを含むことができる。符号化器/復号器モジュール2430は、符号化および/または復号機能を実行する装置に含まれ得るモジュール(複数可)を表す。公知であるように、装置は、符号化モジュールおよび復号モジュールの一方または両方を含むことができる。さらに、符号化器/復号器モジュール2430は、システム2400の別個の要素として実装されてもよく、または、当業者にとって公知のハードウェアとソフトウェアとの組み合わせとしてプロセッサ2410内に組み込まれてもよい。
本出願に記載の様々な態様を実行するようにプロセッサ2410または符号化器/復号器2430にロードされることになるプログラムコードは、記憶装置2440に記憶され、続いて、プロセッサ2410による実行のためにメモリ2420上にロードされ得る。様々な実施形態によれば、プロセッサ2410、メモリ2420、記憶装置2440、および符号化器/復号器モジュール2430のうちの1つ以上は、本出願に記載の処理の実行中、様々な項目のうちの1つ以上を記憶することができる。そのような記憶される項目は、これらに限定されるものではないが、入力ビデオ、復号されたビデオまたは復号されたビデオの一部、ビットストリーム、行列、変数、ならびに方程式、式、演算、および演算ロジックの処理からの中間結果または最終結果を含むことができる。
いくつかの実施形態において、プロセッサ2410および/または符号化器/復号器モジュール2430内のメモリは、命令を記憶し、符号化または復号中に必要となる処理のためのワーキングメモリを提供するために使用される。しかしながら、他の実施形態において、処理装置(例えば、処理装置は、プロセッサ2410または符号化器/復号器モジュール2430のいずれかとすることができる)の外部のメモリは、これらの機能のうちの1つ以上のために使用される。外部メモリは、メモリ2420および/または記憶装置2440とすることができ、例えば、ダイナミック揮発性メモリおよび/または不揮発性フラッシュメモリとすることができる。いくつかの実施形態において、テレビのオペレーティングシステムを記憶するために外部不揮発性フラッシュメモリが使用される。少なくとも1つの実施形態において、MPEG-2、HEVC、またはVVCなど、ビデオコーディングおよび復号動作のために、RAMなどの高速外部ダイナミック揮発性メモリがワーキングメモリとして使用される。
システム2400の要素への入力は、ブロック2405に示されるような様々な入力装置を介して提供され得る。そのような入力装置は、これらに限定されるものではないが、(i)例えば、ブロードキャスタによって無線を介して送信されたRF信号を受信するRF部、(ii)コンポジット入力端子、(iii)USB入力端子、および/または(iv)HDMI入力端子を含む。
様々な実施形態において、ブロック2405の入力装置は、当技術分野で周知であるような関連するそれぞれの入力処理要素を有する。例えば、RF部は、(i)所望の周波数を選択する(信号を選択する、またはある周波数帯域に信号を帯域制限する、とも称される)こと、(ii)選択された信号をダウンコンバートすること、(iii)(例えば)ある特定の実施形態ではチャネルと称される場合がある信号周波数帯域を選択するように、より狭い周波数帯域に再び帯域制限すること、(iv)ダウンコンバートされて帯域制限された信号を復調すること、(v)誤り訂正を実行すること、および(vi)逆多重化して所望のデータパケットストリームを選択することに適した要素に関連付けることができる。様々な実施形態のRF部は、これらの機能を実行する1つ以上の要素、例えば、周波数セレクタ、信号セレクタ、帯域リミッタ、チャネルセレクタ、フィルタ、ダウンコンバータ、復調器、誤り訂正器、およびデマルチプレクサを含む。RF部は、例えば、受信された信号をより低い周波数に(例えば、中間周波数またはベースバンドに近い周波数)、またはベースバンドにダウンコンバートすることを含む、様々なこれらの機能を実行するチューナを含むことができる。1つのセットトップボックスの実施形態において、RF部およびその関連付けられた入力処理要素は、有線(例えば、ケーブル)媒体経由で送信されたRF信号を受信し、フィルタリングし、ダウンコンバートし、所望の周波数帯域に再びフィルタリングすることによって、周波数選択を実行する。様々な実施形態は、上記(および他の)要素の順序を並べ替え、これらの要素のうちのいくつかを取り除き、および/または同様もしくは異なる機能を実行する他の要素を追加する。要素を追加することは、既存の要素間に要素を挿入すること、例えば、増幅器およびアナログ-デジタル変換器を挿入することを含むことができる。様々な実施形態において、RF部は、アンテナを含む。
さらに、USBおよび/またはHDMI端子は、USBおよび/またはHDMI接続にわたって他の電子装置にシステム2400を接続するためのそれぞれのインターフェースプロセッサを含むことができる。入力処理の様々な態様、例えば、リード・ソロモン誤り訂正を、例えば、必要に応じて、別個の入力処理IC内またはプロセッサ2410内に実装できることを理解されたい。同様に、USBまたはHDMIインターフェース処理の態様を、必要に応じて、別個のインターフェースIC内またはプロセッサ2410内に実装できる。復調され、誤り訂正され、かつ逆多重化されたストリームは、例えば、プロセッサ2410と、出力装置上での表示用に、必要に応じてデータストリームを処理するためにメモリおよび記憶要素と組み合わせて動作する符号化器/復号器2430と、を含む様々な処理要素に提供される。
システム2400の様々な要素は、一体型ハウジング内に提供することができ、一体型ハウジング内では、様々な要素が相互接続され、好適な接続配置2415、例えば、I2Cバス、配線、およびプリント回路基板を含む、当該技術分野において知られているような内部バスを使用して、それらの間でデータを送信することができる。
システム2400は、通信チャネル2490を介して他の装置との通信を可能にする通信インターフェース2450を含む。通信インターフェース2450は、これに限定されるものではないが、通信チャネル2490経由でデータを送受信するように構成されたトランシーバを含むことができる。通信インターフェース2450は、これらに限定されるものではないが、モデムまたはネットワークカードを含むことができ、通信チャネル2490は、例えば、有線および/または無線媒体内に実装することができる。
様々な実施形態において、データは、IEEE802.11などのWi-Fiネットワークを使用して、システム2400にストリーミングされる。これらの実施形態のWi-Fi信号は、Wi-Fi通信に適合された通信チャネル2490および通信インターフェース2450を介して受信される。これらの実施形態の通信チャネル2490は、アプリケーションをストリーミングすることおよび他のオーバー・ザ・トップ通信を可能にするインターネットを含む外部ネットワークへのアクセスを提供するアクセス点またはルータに通常接続される。他の実施形態は、入力ブロック2405のHDMI接続経由でデータを配信するセットトップボックスを使用して、ストリーミングされたデータをシステム2400に提供する。さらに他の実施形態は、入力ブロック2405のRF接続を使用して、ストリーミングされたデータをシステム2400に提供する。
システム2400は、ディスプレイ2465、スピーカ2475、および他の周辺装置2485を含む、様々な出力装置に出力信号を提供することができる。他の周辺装置2485には、様々な実施形態例において、スタンドアローンDVR、ディスクプレーヤ、ステレオシステム、照明システム、およびシステム2400の出力に基づき、機能を提供する他の装置のうちの1つ以上が含まれる。様々な実施形態において、システム2400と、ディスプレイ2465、スピーカ2475、または他の周辺装置2485との間で、AVリンク、CEC、またはユーザの介入の有無に関わらず、デバイス・ツー・デバイス制御を可能にする他の通信プロトコルなどの信号通知を使用して、制御信号が伝送される。出力装置は、それぞれのインターフェース2460、2470、および2480による専用接続を介してシステム2400に通信可能に結合することができる。あるいは、出力装置は、通信インターフェース2450を介して、通信チャネル2490を使用してシステム2400に接続することができる。ディスプレイ2465およびスピーカ2475は、例えば、テレビなどの電子装置内のシステム2400の他の構成要素と、単一のユニット内に一体化することができる。様々な実施形態において、ディスプレイインターフェース2460には、ディスプレイドライバ、例えば、タイミングコントローラ(T Con)チップが含まれる。
ディスプレイ2465およびスピーカ2475は、例えば、入力2405のRF部が別個のセットトップボックスの一部である場合、他の構成要素のうちの1つ以上から代替的に分離することができる。ディスプレイ2465およびスピーカ2475が外部構成要素である様々な実施形態において、例えば、HDMIポート、USBポート、またはCOMP出力を含む、専用出力接続を介して出力信号を提供することができる。
一実施形態によれば、ビデオ復号の方法が提供され、方法は、ビットストリームから複数の2値シンボルを復号することであって、複数の2値シンボルの第1の2値シンボルは、エントロピー復号エンジンのバイパスモードを使用して復号される、復号することと、2値化スキームに基づいて、複数の2値シンボルに応答する構文要素の値を生成することとを含む。
一実施形態によれば、ビデオ符号化の方法が提供され、構文要素の値を示す複数の2値シンボルにアクセスすることと、複数の2値シンボルを符号化することとを含み、複数の2値シンボルの第1の2値シンボルは、エントロピー符号化エンジンのバイパスモードを使用して符号化される。
別の実施形態によれば、1つ以上のプロセッサを含むビデオ復号のための装置が提供され、1つ以上のプロセッサは、ビットストリームから複数の2値シンボルを復号することであって、複数の2値シンボルの第1の2値シンボルは、エントロピー復号エンジンのバイパスモードを使用して復号される、2値シンボルを復号し2値化スキームに基づいて、複数の2値シンボルに応答する構文要素の値を生成するように構成される。装置は、さらに、1つ以上のプロセッサに結合された1つ以上のメモリを備えることができる。
別の実施形態によれば、1つ以上のプロセッサを含むビデオ符号化のための装置が提供され、1つ以上のプロセッサは、構文要素の値を示す複数の2値シンボルにアクセスし、複数の2値シンボルを符号化するように構成され、複数の2値シンボルの第1の2値シンボルは、エントロピー符号化エンジンのバイパスモードを使用して符号化される。
別の実施形態によれば、ビデオ復号の装置が提供され、ビットストリームから複数の2値シンボルを復号するための手段であって、複数の2値シンボルの第1の2値シンボルは、エントロピー復号エンジンのバイパスモードを使用して復号される、復号するための手段と、2値化スキームに基づいて、複数の2値シンボルに応答する構文要素の値を生成するための手段とを含む。
別の実施形態によれば、ビデオ符号化の装置が提供され、構文要素の値を示す複数の2値シンボルにアクセスするための手段と、複数の2値シンボルを符号化するための手段とを含み、複数の2値シンボルの第1の2値シンボルは、エントロピー符号化エンジンのバイパスモードを使用して符号化される。
別の実施形態によれば、符号化されたビデオを含む信号が、構文要素の値を示す複数の2値シンボルにアクセスすることと、複数の2値シンボルを符号化することとを実行することによって形成され、複数の2値シンボルの第1の2値シンボルは、エントロピー復号エンジンのバイパスモードを使用して符号化される。
一実施形態によれば、複数の2値シンボルの1つ以上の他の2値シンボルは、バイパスモードを使用して復号または符号化される。
一実施形態によれば、複数の2値シンボルの残りは、コンテキストベースで復号または符号化される。複数の2値シンボルの残りの各2値シンボルは、異なるコンテキストモデルを使用し得る。別の実施形態では、複数の2値シンボルのすべての2値シンボルは、バイパスモードを使用して復号または符号化される。
一実施形態によれば、2値フラグは、コンテキストベースの符号化または復号され、構文要素の値は、2値フラグにさらに応答して生成される。
一実施形態では、フラグは、ブロックの2つの時間的予測因子の重み付け平均を生成する際に等しい重みが適用されるか否かを示す。
一実施形態によれば、構文要素は、ブロックの2つの時間的予測因子の重み付け平均を生成する際に使用される重みのインデックスを示す。
一実施形態では、構文要素は、ブロックの動きベクトルを符号化または復号するためにどの動きベクトル予測因子が使用されるかを示す。
一実施形態では、SMVD(対称動きベクトル差)がブロックに適用されるかどうかが決定され、バイパスモードは、SMVDがブロックに適用される場合にのみ使用される。
一実施形態では、トランケートされたライス2値化が2値化スキームとして使用される。
一実施形態にいて、サブブロック変換が使用される場合に、現在のコーディングユニットのテクスチャデータをコード化するために使用される非ゼロ残差変換ユニットの位置を示す構文要素が、バイパスモードで符号化および復号される。
一実施形態では、非対称2値分割がサブブロック変換で使用されるか否かを示す構文要素は、バイパスモードで符号化および復号される。
一実施形態では、サブブロック変換で使用される2値分割の方向を示す構文要素は、バイパスモードで符号化および復号される。
一実施形態では、現在のコーディングユニットをサブパーティション内に分割する方向を示す構文要素は、バイパスモードで符号化および復号される。
一実施形態では、どの基準線がイントラ予測に使用されるかを示す構文要素を表すために使用される第1のビンは、通常モードで符号化および復号され、構文要素を表すために使用される1つ以上の残りのビンは、バイパスモードで符号化および復号される。
一実施形態において、対称動きベクトル差コーディングモードが現在のコーディングユニットに使用されるか否かを示す構文要素は、バイパスモードで符号化および復号される。
実施形態は、1つ以上のプロセッサによって実行されると、1つ以上のプロセッサに、上述した実施形態のいずれかに従う符号化方法または復号方法を実行させる命令を含むコンピュータプログラムを提供する。本実施形態のうちの1つ以上はまた、上述した方法のいずれかに従ってビデオデータを符号化または復号する命令を記憶したコンピュータ可読記憶媒体を提供する。1つ以上の実施形態はまた、上述した方法に従って生成されたビットストリームを記憶したコンピュータ可読記憶媒体を提供する。1つ以上の実施形態はまた、上述した方法に従って生成されたビットストリームを送信または受信する方法および装置を提供する。
様々な実装形態は、復号を伴う。本出願で使用される「復号」は、例えば、表示に適した最終出力を生成するために、受信した符号化されたシーケンスで実行される処理のすべてまたは一部を包含することができる。様々な実施形態では、そのような処理は、復号器によって通常実行される処理のうちの1つ以上、例えば、エントロピー復号、逆量子化、逆変換、および差分復号を含む。「復号処理」という句が、具体的に動作のサブセットを指すことを意図しているか、または概してより広い復号処理を指すことを意図しているかは、特定の説明の文脈に基づいて明確になり、当業者によって十分に理解されると考えられる。
様々な実装形態は、符号化を伴う。「復号」に関する上記の考察と同様に、本出願で使用される「符号化」は、例えば、符号化されたビットストリームを生成するために入力ビデオシーケンスで実行される処理のすべてまたは一部を包含することができる。
本明細書で使用される構文要素、例えば、GBiインデックスを特徴付けるために使用される構文は、説明的な用語であることに留意されたい。したがって、それらは、他の構文要素名の使用を排除するものではない。
本明細書で説明された実装形態および態様は、例えば、方法もしくは処理、装置、ソフトウェアプログラム、データストリーム、または信号に実装することができる。単一の実装形態の文脈でのみ考察される(例えば、方法としてのみ考察される)場合であっても、考察される特徴の実装はまた、他の形態(例えば、装置またはプログラム)で実装されてもよい。装置は、例えば、適切なハードウェア、ソフトウェア、およびファームウェアで実装することができる。この方法は、例えば、装置、例えば、コンピュータ、マイクロプロセッサ、集積回路、またはプログラマブルロジック装置を含む、一般に処理装置を指す、例えば、プロセッサに実装することができる。プロセッサはまた、通信装置、例えば、コンピュータ、携帯電話、ポータブル/パーソナルデジタルアシスタンス(「PDA」)、およびエンドユーザ間の情報の伝達を容易にする他の装置も含む。
「1つの実施形態」もしくは「一実施形態」、または「1つの実装形態」もしくは「一実装形態」、ならびにそれらの他の変形への言及は、実施形態に関連して説明された特定の特徴、構造、特性などが、少なくとも1つの実施形態に含まれることを意味する。したがって、本出願全体にわたって様々な箇所においてみられる、「1つの実施形態では」もしくは「一実施形態では」または「1つの実装形態では」もしくは「一実装形態では」という句、ならびに任意の他の変形の出現は、必ずしもすべてが同じ実施形態を指しているわけではない。
さらに、本出願は、情報の様々な部分を「判断する」ことに言及する場合がある。情報を決定することは、例えば、情報を推定すること、情報を計算すること、情報を予測すること、またはメモリから情報を検索することのうちの1つ以上を含むことができる。
さらに、本出願は、情報の様々な部分に「アクセスする」ことに言及する場合がある。情報にアクセスすることは、例えば、情報を受信すること、情報を検索すること(例えば、メモリから)、情報を記憶すること、情報を移動させること、情報をコピーすること、情報を計算すること、情報を決定すること、情報を予測すること、または情報を推定することのうちの1つ以上を含むことができる。
さらに、本出願は、情報の様々な部分を「受信する」ことに言及する場合がある。受信することは、「アクセスすること」と同様に、広義の用語であることが意図されている。情報を受信することは、例えば、情報にアクセスすること、または(例えば、メモリから)情報を検索することのうちの1つ以上を含むことができる。さらに、「受信すること」は、典型的には、何らかの方法で、動作中に、例えば、情報を記憶すること、情報を処理すること、情報を送信すること、情報を移動させること、情報をコピーすること、情報を消去すること、情報を計算すること、情報を決定すること、情報を予測すること、または情報を推定することを伴う。
例えば、「A/B」、「Aおよび/またはB」、ならびに「AおよびBのうちの少なくとも1つ」の場合、次の「/」、「および/または」、ならびに「のうちの少なくとも1つ」のいずれかの使用は、最初に挙げた選択肢(A)のみの選択、または2番目に挙げた選択肢(B)のみの選択、または両方の選択肢(AおよびB)の選択を網羅することを意図していることが分かるはずである。さらなる例として、「A、B、および/またはC」ならびに「A、B、およびCのうちの少なくとも1つ」の場合、そのような言い回しは、最初に挙げた選択肢(A)のみの選択、または2番目に挙げた選択肢(B)のみの選択、または3番目に挙げた選択肢(C)のみの選択、または最初および2番目に挙げた選択肢(AおよびB)のみの選択、または最初および3番目に挙げた選択肢(AおよびC)のみの選択、または2番目および3番目に挙げた選択肢(BおよびC)のみの選択、または3つすべての選択肢(AおよびBおよびC)の選択、を網羅することを意図している。これは、当業者にとって明らかなように、挙げられる項目の数だけ拡張され得る。
また、本明細書で使用される場合、「信号通知する」という単語は、とりわけ、対応する復号器に何かを指示することを指す。例えば、特定の実施形態では、符号化器は、区分的線形モデル内の区分の数を復号器に信号通知する。このようにして、実施形態では、同じパラメータが、符号化器側および復号器側の両方で使用される。したがって、例えば、符号化器は、特定のパラメータを復号器に送信することができ(明示的な信号通知)、その結果、復号器は、同じ特定のパラメータを使用することができる。逆に、復号器が既に特定のパラメータならびに他のパラメータを有する場合、信号通知は、送信(暗黙的な信号通知)を行わずに使用されて、復号器が簡単に特定のパラメータを認識して選択するのを可能にすることができる。任意の実際の機能の送信を回避することによって、ビットの節約が、様々な実施形態で実現される。信号通知は、様々な方法で達成できることが分かるはずである。例えば、1つ以上の構文要素、フラグなどが、様々な実施形態で、対応する復号器に情報を信号通知するために使用される。上記は、「信号通知する」という単語の動詞形に関するものであるが、「信号通知」という単語はまた、本明細書では、名詞として使用することもできる。
当業者にとって明らかであるように、実装形態は、例えば、記憶または送信することができる情報を搬送するようにフォーマットされる多種多様な信号を生成することができる。情報は、例えば、方法を実行する命令、または説明される実装形態のうちの1つにより生成されるデータを含むことができる。例えば、信号は、説明された実施形態のビットストリームを搬送するようにフォーマットされてもよい。そのような信号は、例えば、電磁波(例えば、スペクトルの無線周波数部分を使用して)として、またはベースバンド信号としてフォーマットされてもよい。フォーマットすることは、例えば、データストリームを符号化することと、搬送波を符号化データストリームで変調することと、を含むことができる。信号が搬送する情報は、例えば、アナログ情報またはデジタル情報とすることができる。信号は、既知のように、多種多様な異なる有線リンクまたは無線リンクを介して送信され得る。信号は、プロセッサ可読媒体に保存されてもよい。

Claims (28)

  1. 方法であって、
    ビットストリームから複数の2値シンボルを復号することであって、前記複数の2値シンボルの第1の2値シンボルは、コンテキストベースのモードを使用してエントロピー復号され、前記第1の2値シンボルに続く各2値シンボルは、バイパスモードでエントロピー復号される、復号することと、
    2値化スキームに対応する、前記複数の2値シンボルによって表されるインデックスを取得することと、
    2つの予測因子の重み付け和としてブロックの予測を形成することであって、前記インデックスは、前記重み付け和を形成するときに前記2つの予測因子の重み付けに使用されるそれぞれの重み係数を示す、形成することと、を含む、方法。
  2. 前記2値化スキームが、トランケートされたライス2値化スキームである、請求項1に記載の方法。
  3. 前記インデックスが、重み係数のセットから、前記重み付け和を形成するときに前記2つの予測因子のうちの1つを重み付けするための重み係数を示す、請求項1または2に記載の方法。
  4. 別の重み係数が、前記重み係数に応答して取得され、前記別の重み係数が、前記重み付け和を形成するときに前記2つの予測因子のうちの別の1つの重み付けに使用される、請求項3に記載の方法。
  5. 前記第1の2値シンボルは、前記重み付け和を形成するときに等しい重みが前記2つの予測因子に適用されるか否かを示す、請求項1~4のいずれか一項に記載の方法。
  6. 前記複数の2値シンボルの前記第2の2値シンボルは、前記重み付け和を形成するときに重み係数5が前記2つの予測因子のうちの1つに適用されるか否かを示す、請求項1~5のいずれか一項に記載の方法。
  7. 前記複数の2値シンボルの前記第3の2値シンボルは、前記重み付け和を形成するときに重み係数3が前記2つの予測因子のうちの1つに適用されるか否かを示す、請求項1~6のいずれか一項に記載の方法。
  8. 方法であって、
    符号化されるブロックにアクセスすることと、
    2つの予測因子の重み付け和として前記ブロックの予測を形成することと、
    前記重み付け和を形成するときに前記2つの予測因子の重み付けに使用されるそれぞれの重み係数を示すためのインデックスを符号化することと、を含み、
    前記インデックスは、2値化スキームを使用して、複数の2値シンボルに2値化され、
    前記複数の2値シンボルの前記第1の2値シンボルは、コンテキストベースのモードを使用してエントロピー符号化され、
    前記第1の2値シンボルに続く各2値シンボルは、バイパスモードでエントロピー符号化される、方法。
  9. 前記2値化スキームが、トランケートされたライス2値化スキームである、請求項8に記載の方法。
  10. 前記インデックスが、重み係数のセットから、前記重み付け和を形成するときに前記2つの予測因子のうちの1つを重み付けするための重み係数を示す、請求項8または9に記載の方法。
  11. 別の重み係数が、前記重み係数に応答して取得され、前記別の重み係数が、前記重み付け和を形成するときに前記2つの予測因子のうちの別の1つの重み付けに使用される、請求項10に記載の方法。
  12. 前記第1の2値シンボルは、前記重み付け和を形成するときに等しい重みが前記2つの予測因子に適用されるか否かを示す、請求項8~11のいずれか一項に記載の方法。
  13. 前記複数の2値シンボルの前記第2の2値シンボルは、前記重み付け和を形成するときに重み係数5が前記2つの予測因子のうちの1つに適用されるか否かを示す、請求項8~12のいずれか一項に記載の方法。
  14. 前記複数の2値シンボルの前記第3の2値シンボルは、前記重み付け和を形成するときに重み係数3が前記2つの予測因子のうちの1つに適用されるか否かを示す、請求項8~13のいずれか一項に記載の方法。
  15. 1つ以上のプロセッサを含む装置であって、前記1つ以上のプロセッサが、
    ビットストリームから複数の2値シンボルを復号することであって、前記複数の2値シンボルの第1の2値シンボルが、コンテキストベースのモードを使用してエントロピー復号され、前記第1の2値シンボルに続く各2値シンボルが、バイパスモードでエントロピー復号される、復号することと、
    2値化スキームに対応する、前記複数の2値シンボルによって表されるインデックスを取得することと、
    2つの予測因子の重み付け和としてブロックの予測を形成することであって、前記インデックスは、前記重み付け和を形成するときに前記2つの予測因子の重み付けに使用されるそれぞれの重み係数を示す、形成することとを行うように構成されている、装置。
  16. 前記2値化スキームが、トランケートされたライス2値化スキームである、請求項15に記載の装置。
  17. 前記インデックスが、重み係数のセットから、前記重み付け和を形成するときに前記2つの予測因子のうちの1つを重み付けするための重み係数を示す、請求項15または16に記載の装置。
  18. 別の重み係数が、前記重み係数に応答して取得され、前記別の重み係数が、前記重み付け和を形成するときに前記2つの予測因子のうちの別の1つの重み付けに使用される、請求項17に記載の装置。
  19. 前記第1の2値シンボルは、前記重み付け和を形成するときに等しい重みが前記2つの予測因子に適用されるか否かを示す、請求項15~18のいずれか一項に記載の装置。
  20. 前記複数の2値シンボルの前記第2の2値シンボルは、前記重み付け和を形成するときに重み係数5が前記2つの予測因子のうちの1つに適用されるか否かを示す、請求項15~19のいずれか一項に記載の装置。
  21. 前記複数の2値シンボルの前記第3の2値シンボルは、前記重み付け和を形成するときに重み係数3が前記2つの予測因子のうちの1つに適用されるか否かを示す、請求項15~20のいずれか一項に記載の装置。
  22. 1つ以上のプロセッサを含む装置であって、前記1つ以上のプロセッサが、
    符号化されるブロックにアクセスし、
    2つの予測因子の重み付け和として前記ブロックの予測を形成し、
    前記重み付け和を形成するときに前記2つの予測因子の重み付けに使用されるそれぞれの重み係数を示すためのインデックスを符号化するように構成され、
    前記インデックスは、2値化スキームを使用して、複数の2値シンボルに2値化され、
    前記複数の2値シンボルの前記第1の2値シンボルが、コンテキストベースのモードを使用してエントロピー符号化され、
    前記第1の2値シンボルに続く各2値シンボルが、バイパスモードでエントロピー符号化される、装置。
  23. 前記2値化スキームが、トランケートされたライス2値化スキームである、請求項22に記載の装置。
  24. 前記インデックスが、重み係数のセットから、前記重み付け和を形成するときに前記2つの予測因子のうちの1つを重み付けするための重み係数を示す、請求項22または23に記載の装置。
  25. 別の重み係数が、前記重み係数に応答して取得され、前記別の重み係数が、前記重み付け和を形成するときに前記2つの予測因子のうちの別の1つの重み付けに使用される、請求項24に記載の装置。
  26. 前記第1の2値シンボルは、前記重み付け和を形成するときに等しい重みが前記2つの予測因子に適用されるか否かを示す、請求項22~25のいずれか一項に記載の装置。
  27. 前記複数の2値シンボルの前記第2の2値シンボルは、前記重み付け和を形成するときに重み係数5が前記2つの予測因子のうちの1つに適用されるか否かを示す、請求項22~26のいずれか一項に記載の装置。
  28. 前記複数の2値シンボルの前記第3の2値シンボルは、前記重み付け和を形成するときに重み係数3が前記2つの予測因子のうちの1つに適用されるか否かを示す、請求項22~27のいずれか一項に記載の装置。
JP2021535626A 2019-03-11 2020-03-04 通常コード化ビンの数の削減 Pending JP2022523287A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP19305278.4A EP3709657A1 (en) 2019-03-11 2019-03-11 Reducing the number of regular coded bins
EP19305278.4 2019-03-11
EP19305693 2019-05-29
EP19305693.4 2019-05-29
PCT/US2020/021011 WO2020185468A1 (en) 2019-03-11 2020-03-04 Reducing the number of regular coded bins

Publications (2)

Publication Number Publication Date
JP2022523287A true JP2022523287A (ja) 2022-04-22
JPWO2020185468A5 JPWO2020185468A5 (ja) 2023-03-10

Family

ID=69954128

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021535626A Pending JP2022523287A (ja) 2019-03-11 2020-03-04 通常コード化ビンの数の削減

Country Status (8)

Country Link
US (1) US20220078428A1 (ja)
EP (1) EP3939324A1 (ja)
JP (1) JP2022523287A (ja)
KR (1) KR20210135249A (ja)
CN (1) CN113508600A (ja)
AU (1) AU2020236358A1 (ja)
MX (1) MX2021010928A (ja)
WO (1) WO2020185468A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113875243A (zh) * 2019-06-25 2021-12-31 英特尔公司 一般性旁路仓格和在熵编码中的应用
WO2020262992A1 (ko) * 2019-06-25 2020-12-30 한국전자통신연구원 영상 부호화/복호화 방법 및 장치

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100238889B1 (ko) * 1997-09-26 2000-01-15 전주범 형태 부호화를 위한 보더 화소 예측 장치 및 방법
GB201119180D0 (en) * 2011-11-07 2011-12-21 Sony Corp Data encoding and decoding
US20130114667A1 (en) * 2011-11-08 2013-05-09 Sony Corporation Binarisation of last position for higher throughput
WO2013109026A1 (ko) * 2012-01-18 2013-07-25 엘지전자 주식회사 엔트로피 부호화/복호화 방법 및 그 장치
KR102293126B1 (ko) * 2012-01-20 2021-08-25 지이 비디오 컴프레션, 엘엘씨 변환 계수 코딩
US9538172B2 (en) * 2012-04-11 2017-01-03 Qualcomm Incorporated Grouping bypass coded syntax elements in video coding
US9584802B2 (en) * 2012-04-13 2017-02-28 Texas Instruments Incorporated Reducing context coded and bypass coded bins to improve context adaptive binary arithmetic coding (CABAC) throughput
US9386307B2 (en) * 2012-06-14 2016-07-05 Qualcomm Incorporated Grouping of bypass-coded bins for SAO syntax elements
KR102269506B1 (ko) * 2013-10-18 2021-06-25 엘지전자 주식회사 멀티-뷰 비디오를 디코딩하는 비디오 디코딩 방법 및 장치
KR20160102067A (ko) * 2013-12-30 2016-08-26 퀄컴 인코포레이티드 3d 비디오 코딩에서의 델타 dc 잔차 코딩의 단순화
US10554988B2 (en) * 2017-03-22 2020-02-04 Qualcomm Incorporated Binary arithmetic coding with parameterized probability estimation finite state machines
US20180332298A1 (en) * 2017-05-10 2018-11-15 Futurewei Technologies, Inc. Bidirectional Prediction In Video Compression
WO2019190224A1 (ko) * 2018-03-30 2019-10-03 한국전자통신연구원 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
CN112913240A (zh) * 2018-10-22 2021-06-04 北京字节跳动网络技术有限公司 解码器侧运动矢量推导和其他编解码工具之间的并置
KR20210029819A (ko) * 2018-11-16 2021-03-16 삼성전자주식회사 양방향 예측을 이용한 영상의 부호화 및 복호화 방법, 및 영상의 부호화 및 복호화 장치
KR20200083339A (ko) * 2018-12-31 2020-07-08 한국전자통신연구원 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체

Also Published As

Publication number Publication date
US20220078428A1 (en) 2022-03-10
WO2020185468A1 (en) 2020-09-17
KR20210135249A (ko) 2021-11-12
MX2021010928A (es) 2021-10-13
AU2020236358A1 (en) 2021-11-11
CN113508600A (zh) 2021-10-15
EP3939324A1 (en) 2022-01-19

Similar Documents

Publication Publication Date Title
KR20210068451A (ko) 일반화된 양방향 예측 및 가중 예측
EP3709657A1 (en) Reducing the number of regular coded bins
KR20220036982A (ko) 비디오 인코딩 및 디코딩을 위한 이차 변환
US20220385922A1 (en) Method and apparatus using homogeneous syntax with coding tools
JP2022500891A (ja) スカラー量子化従属性のためのスカラー量子化器決定スキーム
JP2022504753A (ja) ビデオエンコーディングおよびデコーディングにおけるアフィンモードシグナリング
US11909974B2 (en) Chroma quantization parameter adjustment in video encoding and decoding
JP2022523287A (ja) 通常コード化ビンの数の削減
US20230421788A1 (en) Parameter grouping among plural coding units forvideo encoding and decoding
US20220150501A1 (en) Flexible allocation of regular bins in residual coding for video coding
US11962807B2 (en) Entropy coding for video encoding and decoding
US11463712B2 (en) Residual coding with reduced usage of local neighborhood
JP2022549312A (ja) コンテキストコード化bin(ccb)カウント方法の統合
WO2020185492A1 (en) Transform selection and signaling for video encoding or decoding
CN115039409A (zh) 用于视频编码和解码的残差处理
EP3963886A1 (en) Chroma processing for video encoding and decoding
JP7506063B2 (ja) ビデオ符号化および復号のための複数のコーディングユニットの中でグループ化するパラメータ
JP2024513657A (ja) ビデオエンコード及びデコードのためのテンプレートマッチング予測
CN114830656A (zh) 用于快速视频编码器的二次变换

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230302

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230302

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240213

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240513