JP2022547607A - コード化ツールとの変換サイズの相互作用 - Google Patents

コード化ツールとの変換サイズの相互作用 Download PDF

Info

Publication number
JP2022547607A
JP2022547607A JP2022516275A JP2022516275A JP2022547607A JP 2022547607 A JP2022547607 A JP 2022547607A JP 2022516275 A JP2022516275 A JP 2022516275A JP 2022516275 A JP2022516275 A JP 2022516275A JP 2022547607 A JP2022547607 A JP 2022547607A
Authority
JP
Japan
Prior art keywords
transform
size
block
encoding
coding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022516275A
Other languages
English (en)
Inventor
ナセル、カラム
ポイエー、タンギ
ガルピン、フランク
チェン、ヤー
Original Assignee
インターデジタル ヴイシー ホールディングス フランス,エスエーエス
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by インターデジタル ヴイシー ホールディングス フランス,エスエーエス filed Critical インターデジタル ヴイシー ホールディングス フランス,エスエーエス
Publication of JP2022547607A publication Critical patent/JP2022547607A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/625Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

離散トリガノメトリック変換を実装するための方法及び装置は、最大変換サイズに基づく。一実施形態では、マトリックスベースのイントラ予測は、最大変換サイズに関係なく、指定されたサイズまでのコード化ユニットサイズを有効化する。別の実施形態では、低周波数非分離性変換は、コード化ゲインを改善するために使用される。ビットストリーム内の構文を使用して、使用されるコード化ツールを示すことができる。【選択図】図4

Description

本実施形態のうちの少なくとも1つは、一般に、ビデオの符号化又は復号化、圧縮又は伸長のための方法又は装置に関する。
高い圧縮効率を実現するために、画像及びビデオの符号化方式は、通常、動きベクトル予測を含む予測、並びにビデオコンテンツの空間的冗長性及び時間的冗長性を活用した変換を採用している。一般に、フレーム内又はフレーム間の相関を利用するために、イントラ予測又はインター予測が使用され、次いで、しばしば予測誤差又は予測残差と呼ばれる原画像と予測画像の間の差分が、変換、量子化、及びエントロピ符号化される。ビデオを再構成するには、エントロピ符号化、量子化、変換、及び予測に対応する逆の処理によって、圧縮データを復号化する。
多用途ビデオコーディング(Versatile Video Coding、VVC)標準の開発において、最大変換サイズは、32~64の間で可変である。最大変換サイズは、他の変換コード化ツールと相互作用する。
本実施形態のうちの少なくとも1つは、一般に、ビデオの符号化又は復号化のための方法又は装置に関し、より具体的には、ビデオエンコーダ又はビデオデコーダにおける最大変換サイズと変換コード化ツールとの間の相互作用のための方法又は装置に関する。
第1の態様によれば、方法が提供される。この方法は、最大変換サイズに基づいて、コード化ツールを可能にするためのステップと、ブロックを含むサンプルのサブセット上で、離散トリガノメトリック変換の少なくとも一部分を実行することと、有効化されたコード化ツールを使用して、ブロックを符号化することと、を含む。
第2の態様によれば、方法が提供される。この方法は、最大変換サイズに基づいて、コード化ツールを可能にするためのステップと、ブロックを含むサンプルのサブセット上で、逆離散トリガノメトリック変換の少なくとも一部分を実行することと、有効化されたコード化ツールを使用して、ブロックを復号化することと、を含む。
別の態様によれば、装置が提供される。この装置は、プロセッサを備える。プロセッサは、前述した方法のいずれかを実行することによって、ビデオのブロックを符号化する、又はビットストリームを復号化するように構成することができる。
少なくとも一実施形態の別の一般的な態様によれば、復号化実施形態のいずれかに係る装置と、(i)信号を受信するように構成されたアンテナであって、信号がビデオブロックを含む、アンテナ、(ii)受信信号を、ビデオブロックを含む周波数帯域に制限するように構成されたバンドリミッタ、又は(iii)ビデオブロックを表す出力を表示するように構成されたディスプレイ、のうちの少なくとも1つと、を備えるデバイス、が提供される。
少なくとも一実施形態の別の一般的な態様によれば、説明した符号化実施形態又は変形形態のいずれかに従って生成されたデータコンテンツを含む非一時的なコンピュータ可読媒体が提供される。
少なくとも一実施形態の別の一般的な態様によれば、説明した符号化実施形態又は変形形態のいずれかに従って生成されたビデオデータを含む信号が提供される。
少なくとも一実施形態の別の一般的な態様によれば、ビットストリームは、説明した符号化実施形態又は変形形態のいずれかに従って生成されたデータコンテンツを含むようにフォーマットされる。
少なくとも一実施形態の別の一般的な態様によれば、コンピュータプログラム製品であって、プログラムがコンピュータによって実行されるとき、説明した復号化実施形態又は変形形態のいずれかをコンピュータに実行させる命令を含むコンピュータプログラム製品が提供される。
一般的な態様の上記及び他の態様、特徴、及び利点は、例示的な実施形態の以下の詳細な説明を添付の図面を参照しながら読み進めることによって明らかになるであろう。
標準の一般的なビデオ圧縮方式を示す。 標準の一般的なビデオ伸長方式を示す。 一般的な記載された態様の実装のための例示的なプロセッサベースのサブシステムを示す。 記載された態様の下の方法の一実施形態を示す。 記載された態様の下の方法の別の実施形態を示す。 説明された態様の下の例示的な装置を示す。
本実施形態のうちの少なくとも1つは、一般に、ビデオの符号化又は復号化のための方法又は装置に関し、より具体的には、ビデオエンコーダ又はビデオデコーダにおける最大変換サイズと変換コード化ツールとの間の相互作用のための方法又は装置に関する。
本明細書に記載の一般的な態様は、ビデオ圧縮の分野である。それは、VVCの最近の採用において、最大の変換サイズが32~64で変数になる、最大変換サイズと他の変換コード化ツールとの間の相互作用である。その値は、次のように計算される。
Figure 2022547607000002
最大変換サイズは、以下のツールと相互作用する。
1-ゼロ設定プロセス:最初に、VVCは、大きな変換サイズの複雑さを低減するために、ゼロ設定を実行する。2次元DCT2変換については、残りがゼロに設定されている間、左上の32×32の係数のみが保持される。すなわち、64×64、64×32、及び32×32について、DCT2は、水平方向及び垂直方向の両方で第1の32係数を計算し、非DCT2変換(DST7及びDCT8)は、ゼロ設定を実行して、左上の16×16の係数を保持する。JVET-00545の採用により、最大変換サイズが32であるときにゼロ設定がどのように実行されるかは解決されない。
ドラフトテキストの捕捉を以下に示し、ゼロ設定は、網掛けされている。
Figure 2022547607000003
これは、tu_mts_idxがゼロより大きい、すなわち、MTS変換が使用されることを意味する場合(DST7、DST7)、ゼロ設定幅及び高さが16に設定され、一方、tu_mts_idxがゼロ(DCT2)である場合、ゼロ設定は、32に設定されている。
2-MTSサイズ:MTS又は複数の変換選択は、DST7及びDCT8対間の選択が、DCT2変換対を強化する他の変換対として許可されるVVCに採用される変換ツールである。MTSは、4×4~32×32のブロックサイズについて実行される。すなわち、半分のサイズDCT2。JVET-00545の採用により、最大変換サイズが32である場合、MTSサイズがどのように考慮されるかは解決されない。
ドラフトテキストの捕捉を以下に示し、mtsサイズは、網掛けされている。
Figure 2022547607000004
Figure 2022547607000005
これは、MaxTbSizeYに関係なく、幅と高さの両方が32未満である場合、MTSがシグナリングされることを示す。
3-彩度変換サイズ:VVCでは、彩度サイズは輝度サイズの半分。すなわち、彩度変換ブロックは2×2~32×32で許容されるが、輝度サイズは4×4~64×64である。JVET-00545の採用により、最大変換サイズが32である場合、彩度サイズがどのように固定されるかは解決されない。
VVCスペックでは、彩度サイズは次のように計算される。

Figure 2022547607000006

maxTbWidth=(cIdx==0)?MaxTbSizeY:MaxTbSizeY/SubWidthC(8-41)
maxTbHeight=(cIdx==0)?MaxTbSizeY:MaxTbSizeY/SubHeightC(8-42)
cIdxは、色指数(輝度については0、彩度については1)である。
一般的な試験条件(common testing condition、CTC)では、4:2:0の彩度フォーマットが使用され、最大変換サイズ(MaxTbSizeY)は64である。したがって、最大変換サイズは、CTC中の彩度について32である。しかしながら、MaxTbSizeYが32である場合、彩度最大サイズは、現在のSPECに従って16である。
4-変換スキップサイズ:VVCでは、DCT2と同じ範囲を有するブロックサイズに対して変換スキップが実行される。言い換えれば、変換スキップは、4×4~64×64のブロックサイズのために実行される。JVET-00545の採用により、最大変換サイズが32である場合、変換スキップサイズがどのように固定されるかは解決されない。
VVC仕様では、最大変換スキップサイズは次のように定義される。
log2_transform_skip_max_size_minus2は、変換スキップに使用される最大ブロックサイズを指定し、0~3の範囲にあるものとする。
存在しない場合、log2_transform_skip_max_size_minus2の値は、0に等しいと推測される。
変数MaxTsSizeは、1<<(log2_transform_skip_max_size_minus2+2)に等しく設定される。
すなわち、最大MaxTsSizeは、MaxTbSizeY値に関係なく、4~32の値をとることができる。
5-BDCMサイズ:BD-PCMは、ブロックベースのデルタパルスコード変調である。それは、変換スキップ残差のコード化ツールである。それは、現在、変換スキップと同じサイズ条件で許可されている。すなわち、最大MaxTsSizeである。以下のテキストは、BDPCMフラグをコード化するための条件(網掛け)を示す。
Figure 2022547607000007
6-MIP
VVCドラフト6では、MIP(マトリックスベースのイントラ予測)は、予測信号が、参照サンプルに一定のシフトを有するいくつかの訓練された予測マトリックスを乗算することによって生成される、イントラ予測モードである。モードは、CUサイズが最大許容変換サイズ寸法以下であるときにシグナリングされる。この制限は、メモリ要件及びコード化の複雑さを制限するために必要であった。これは、MIPがマトリックスベースの方法であり、予測マトリックスがより大きなブロックについてより大きいためである。
最初に、最大変換サイズ(MaxTbSizeY)は、VTM5.0において64として常に保持される。しかしながら、VTM6.0では、この値は64又は32であり得る。VTM6.0のドラフトテキストのサンプルを以下に提供する(陰網掛け部分は、MIP部分を示す)。
Figure 2022547607000008
Figure 2022547607000009
MaxTbSizeY値が64に固定された。しかしながら、JVET-00545の採用では、MaxTbSizeYは、64又は32のいずれかであり得る。
直感的に、MaxTbSizeYが32である場合、MIPは32×32のCUサイズまでシグナリングされる。これにより、より大きいMIPがCUを使用することが妨げられ、したがってコード化効率が制限される。現在の記載された態様は、最大変換サイズに関係なく、最大64×64のCUのMIPを有効化することを提案する。これは、CUサイズがMaxTbSizeYよりも大きいときに、TUタイリングを有効化することによって行われる。
最初に、最大変換サイズは、VTM5.0において64として常に保持される。しかしながら、JVET-00545の最近の採用では、最大変換サイズ(MaxTbSizeY)は、SPSフラグ(sps_sbt_max_size_64_flag)によって制御される64又は32のいずれかであり得る。これが起こると、ゼロ設定プロセス、MTSサイズ、彩度変換サイズ、変換スキップサイズ、及びBDCMサイズをこの変更に適合させる必要がある。
一般的な態様は、最大変換サイズに従って、以下:ゼロ設定プロセス、MTSサイズ、彩度変換サイズ、変換スキップサイズ及びBDCMのツールのシグナリングを適合させることを提案する。影響を受けたコーデックモジュールは、図1及び図2のイントラコード化設計(160)及び260である。
実施形態1:ゼロ設定プロセス
この実施形態では、ゼロ設定プロセスは、最大変換サイズに依存する。このようにして、64の代わりに最大サイズが32である場合、ゼロ設定サイズは半分に減少する。これを以下のテキストに(イタリックで)示す
Figure 2022547607000010
これは、DCT2変換及び他のMTS変換(DST7及びDCT8)のために独立して行うこともできる。すなわち、DCT2のみのためにそれを行うことを望む場合:
Figure 2022547607000011
そうでない場合、DST7/DCT8のみについては
Figure 2022547607000012
実施形態2:MTSサイズ
MTSシグナリングは、32×32のサイズまで許可される。これは、それが64又は32のいずれであるかにかかわらず、MaxTbSizeYから独立している。MaxTbSizeYとの接続を行うために、MTSのシグナリングをMaxTbSizeY/2×MaxTbSizeY/2までサイズ変更することができる。これは、以下のスペックにイタリックで示されている:
Figure 2022547607000013
Figure 2022547607000014
これは、サブブロック変換(subblock transform、SBT)ツールに直接影響を及ぼすことに留意されたい。SBTは、DCT2、DST7、及びDCT8からの変換を意味的に選択するインターブロックのための変換ユニット分割ツールである。本明細書によれば、
変数implicitMtsEnabledは、次のように導出される。
-sps_mts_enabled_flagが1に等しく、以下の条件のうちの1つが真である場合、implicitMtsEnabledは1に等しく設定される:
-IntraSubPartitionsSplitTypeは、ISP_NO_SPLITに等しくない
-cu_sbt_flagが1に等しく、Max(nTbW、nTbH)は32以下である
-sps_explicit_mts_intra_enabled_flagは0に等しく、CuPredMode[0][xTbY][yTbY]はMODE_INTRAに等しく、lfnst_idx[x0][y0]は0に等しく、intra_mip_flag[x0][y0]は0に等しい
-そうでない場合、implicitMtsEnabledは0に等しい。
水平変換カーネルを指定する変数trTypeHor及び垂直変換カーネルを指定する変数trTypeVerは、以下のように導出される。
-cIdxが0より大きい場合、trTypeHor及びtrTypeVerは、0に等しい。
-そうでなければ、ImplicitMts有効が1に等しい場合、以下が適用される。
-IntraSubPartitionsSplitTypeがISP_NO_SPLITに等しくないか、又はsps_explicit_mts_intra_enabled_flagが0に等しく、CuPredMode[0][xTbY][yTbY]がMODE_INTRAに等しい場合、trTypeHor及びtrTypeVerは、以下のように導出される。
trTypeHor=(nTbW>=4&&nTbW<=16)?1:0(8-975)
trTypeVer=(nTbH>=4&&nTbH<=16)?1:0(8-976)
-そうでない場合(cu_sbt_flagが1に等しい)、trTypeHor及びtrTypeVerは、cu_sbt_horizontal_flag及びcu_sbt_pos_flagに応じて、表8~15に指定される。
-そうでない場合、trTypeHor及びtrTypeVerは、tu_mts_idx[xTbY][yTbY]に応じて、表8-14に指定されている。
Figure 2022547607000015
変換タイプ2が、DCT8を意味し、1はDST7を意味する。
すなわち、MTSがMaxTbSizeY/2に制限され、MaxTbSizeYが32である場合、サイズ32×32のDST7及びDCT8がサポートされていないため、上記の表を使用することができない。代わりに、DCT2を使用する必要がある。対応する仕様変更は、以下の通りである。
変数implicitMtsEnabledは、次のように導出される。
-sps_mts_enabled_flagが1に等しく、以下の条件のうちの1つが真である場合、inclipitMtsEnabledは1に等しく設定される:
-IntraSubPartitionsSplitTypeは、ISP_NO_SPLITに等しくない
-cu_sbt_flagが1に等しく、Max(nTbW、nTbH)は、MaxTbSizeY/2以下である
-sps_explicit_mts_intra_enabled_flagは0に等しく、CuPredMode[0][xTbY][yTbY]はMODE_INTRAに等しく、lfnst_idx[x0][y0]は0に等しく、intra_mip_flag[x0][y0]は0に等しい
実施形態3:彩度変換サイズ
VVCスペックによれば、彩度最大変換幅及び高さは、最大輝度1の半分であり得る。しかしながら、最大輝度変換サイズが32であり得るため、彩度の最大サイズは16であり得る。これは、少数であり、実際には有用ではないと思われる。したがって、この実施形態は、彩度サイズの最小を32に固定する。仕様は、次のように(イタリック)変更することができる。
maxTbWidth=(cIdx==0)?MaxTbSizeY:max(MaxTbSizeY/SubWidthC,32)(8-41)
maxTbHeight=(cIdx==0)?MaxTbSizeY:max(MaxTbSizeY/SubHeightC,32)(8-42)
実施形態4:変換スキップサイズ
変換スキップフラグは、32×32のサイズまでシグナリングすることができる。これは、64又は32のいずれであるかにかかわらず、最大変換ブロックサイズから独立している。最大変換サイズとの接続を行うために、テキストは以下のように修正される。
log2_transform_skip_max_size_minus2は、変換に使用される最大ブロックサイズを指定し、0~MaxTbLog2SizeY-3の範囲にあるものとする。
MaxTbLog2SizeYは、(VVCスペックに従って)以下のように計算される。
MaxTbLog2SizeY=sps_max_luma_transform_size_64_flag?6:5(7-28)
実施形態5:BDCM
BDPCMは、変換スキップと同じシグナリングされる条件を使用する。したがって、上記の実施形態4は、BDPCMにも適用可能である。
実施形態6:MIP
記載された一般的な態様は、最大変換サイズに関係なく、最大64×64のCUのMIPを有効化することを提案する。これは、CUサイズがMaxTbSizeYよりも大きいときに、TUタイリングを有効化することによって行われる。これは、MaxTbSizeYが32であるときに、コード化効率を改善することである。
本発明の基本的な考え方は、MaxTbSizeYに関係なく、最大サイズ64x64のCUのMIPを許可することである。これは、CUサイズが32×32より大きいときにMIPを有効化にすることによって、MaxTbSizeYが32に設定される場合のコード化性能を改善することである。実験的には、MIPが大きな寸法を有する配列についてより良好に機能することが示されている。以下の結果は、アンカーとしてVTMソフトウェアを取得することによって生成され、試験は、MIPを含まないVTMである。
Figure 2022547607000016
明らかに、MIPは、クラスA1(大きな寸法)で0.6%のゲイン及びクラスC(小さな寸法)で0.3%のゲインを与える。したがって、MaxTbSizeYが32である場合、64×64CUのMIPを有効化することは、大きな寸法を有する配列に対するコード化ゲインを提供する。更に、MIPの同じ構造が維持されるため、いかなる追加のツールも必要としない。
現在の設計と比較して、変換サイズがより小さい場合でも、エンコーダに対するより多くの柔軟性が、最大64×64のCUのMIPを実行することを可能にする。
これは、TUタイリングによって達成することができる。すなわち、CUを複数のTUに分散させ、MIPを独立して実行する。以下を行うための2つの方法がある。
1-TUタイリング、次いでMIP予測
2-MIP予測後のTUタイリング
すなわち、サイズ64×64、32×64又は64x32及びMaxTbSizeYのCUが32であることを考慮すると、第1のオプションは、CUを32×32のTUに分割して、32×32ブロックでMIPを実行し、予測信号を生成し、残差をコード化することである。そうする場合、再構成された32×32ブロックからの参照サンプルを使用して、予測信号を生成することができる。第2のオプションは、大きなCU(64×64、32×64又は64×32)でMIPを実行し、次いでCUをサイズ32×32のTUに分割し、残差をコード化することである。第2のオプションは、VTMの現在の設計とより一致している。これは、従来のイントラ予測(角度、DC又は平面)のために、予測信号はTUと同じサイズで生成され、その結果、参照サンプルが再構成されたブロックを使用して、隣接するブロックの予測を改善することができる。
対応する仕様は、以下にイタリックで示されている。
Figure 2022547607000017
Figure 2022547607000018
仕様テキストはすでに、変換ユニットが最大変換サイズよりも大きいときにTUタイリングをすでにサポートし、これは以下のテキスト(網掛け)で示される。
Figure 2022547607000019
実施形態7:LFNSTインデックス
仕様テキストにおいて、LFNST(低周波数非分離型変換)は、MaxTbSizeYまで許可される。当初の動機は、TU残差を復号化した後にLFNSTインデックスが復号化される、サイズ128×128の大きなCUを復号化するときの待ち時間の問題を回避することであった。したがって、LFNSTを当初は64であった最大変換サイズまで可能にすることが決定された。JVET-00545の採用により、待ち時間の問題は、CUサイズが64×64であり、MaxTbSizeYが32である場合には重要ではない。したがって、MaxTbSIzeYが32に設定されたときに、この場合のLFNSTインデックスがコード化ゲインを改善することを可能にすることができる。
対応する仕様変更は、イタリックで示されている。
Figure 2022547607000020
更に、LFNSTは、一次変換がDCT2である場合にのみ許可される(条件:tu_mts_idx [x0][y0]==0)ため、この条件を複数のTU’についてチェックする必要がある。変更は、以下の通りである。
Figure 2022547607000021
Figure 2022547607000022
すなわち、TUのいずれかがDCT2を使用していないかどうかをチェックする変数MTS_notDCT2を定義する。そうである場合、LFNSTは許可されていない。
本明細書において説明した一般的な態様の下での方法400の一実施形態が、図4に示されている。この方法は、開始ブロック401で開始し、制御は、最大変換サイズに基づいて、コード化ツールを有効化するためにブロック410に進む。制御は、ブロック410からブロック420に進み、ブロックを含むサンプルのサブセット上で、離散トリガノメトリック変換の少なくとも一部分を実行する。制御は、ブロック420からブロック430に進み、有効化されたコード化ツールを使用して、ブロックを符号化する。サンプルの変換されたサブセットを使用して、ブロックの変換係数を決定する。
本明細書において説明した一般的な態様の下での方法500の一実施形態が、図5に示されている。この方法は、開始ブロック501で開始し、制御は、最大変換サイズに基づいて、コード化ツールを有効化するためにブロック510に進む。制御は、ブロック510からブロック520に進み、ブロックを含むサンプルのサブセット上の逆離散トリガノメトリック変換の少なくとも一部分を実行する。制御は、ブロック520からブロック530に進み、有効化されたコード化ツールを使用して、ブロックを復号化する。
図6は、最大変換サイズに応じて、様々なコード化ツールを使用してビデオを圧縮、符号化、又は復号化するための装置600の一実施形態を示す。この装置は、プロセッサ1410を備えており、少なくとも1つのポートを通じてメモリ1420に相互接続することができる。プロセッサ1410及びメモリ1420の両方は、外部接続への1つ以上の追加の相互接続を有することもできる。
更にプロセッサ610は、ビットストリームにおいて情報を挿入又は受信し、説明した態様のいずれかを使用して圧縮、符号化、又は復号化するように構成されている。
本文書では、ツール、機能、実施形態、モデル、方法などを含めて、様々な態様について説明する。これらの態様の多くは、具体的に説明されており、少なくとも個々の特徴を示すために、しばしば本発明を制限するように読み取れることがある。しかしながら、これは説明を明確にすることを目的としており、それらの態様の適用又は範囲を限定するものではない。実際に、すべての異なる態様は、組み合わせる、又は入れ替えて、更なる態様を提供することができる。更に、これらの態様は、以前の出願に記載されている態様と組み合わせる、又は入れ替えることができる。
本文書に説明され、企図されている態様は、多くの異なる形態において実装することができる。以下の図1、図2、及び図3は、いくつかの実施形態を提供するが、他の実施形態も企図されており、図1、図2、及び図3の説明は、実装形態の範囲を制限しない。態様のうちの少なくとも1つは、一般に、ビデオの符号化及び復号化に関するものであり、少なくとも1つの別の態様は、一般に、生成又は符号化されたビットストリームを送信することに関する。これら及び別の態様は、方法、装置、説明した方法のいずれかに従ってビデオデータを符号化又は復号化するための命令を自身に格納したコンピュータ可読記憶媒体、及び/又は、説明した方法のいずれかに従って生成されたビットストリームを自身に格納したコンピュータ可読記憶媒体、として実装することができる。
本出願では、「再構成された」及び「復号化された」という用語は互換的に使用することができ、「ピクセル」及び「サンプル」という用語は互換的に使用することができ、「画像」、「ピクチャ」、及び「フレーム」という用語は互換的に使用することができる。通常では、必ずしもそうではないが、「再構成された」という用語はエンコーダ側で使用され、「復号化された」という用語はデコーダ側で使用される。
本明細書には様々な方法が説明されており、各方法は、説明した方法を実現するための1つ以上のステップ又はアクションを含む。方法を正しく動作させるためにステップ又はアクションの特定の順序が要求されない限りは、特定のステップ及び/又はアクションの順序及び/又は使用を、変更又は組み合わせることができる。
本文書に記載されている様々な方法及び他の態様を使用して、図1及び図2に示したようなビデオエンコーダ100及びビデオデコーダ200のモジュール、例えば、イントラ予測モジュール、エントロピ符号化モジュール、及び/又は復号化モジュール(160、360、145、330)を変更することができる。更に、本開示の態様は、VVC又はHEVCに限定されず、例えば、既存のものであれ将来開発されるものであれ、他の規格及び勧告、並びに任意のそのような規格及び勧告(VVC及びHEVCを含む)の拡張に適用することができる。特に明記されていない限り、又は技術的に不可能でない限り、本文書に記載されている態様は、個別に又は組み合わせて使用することができる。
本文書では、例えば、{{1,0}、{3,1}、{1,1}}のように様々な数値が使用されている。具体的な値は例示を目的としており、記載されている態様はこれらの具体的な値に限定されるものではない。
図1は、エンコーダ100を示している。このエンコーダ100の変形形態が考えられるが、明確さを目的として、以下では予想されるすべての変形形態を記載することなく、エンコーダ100について説明する。
ビデオシーケンスは、符号化される前に、符号化前処理(101)を受け得、例えば、入力カラーピクチャに色変換を適用する(例えば、RGB 4:4:4からYCbCr 4:2:0への変換)、圧縮に対してより耐性のある信号分布を得るために入力ピクチャ成分の再マッピングを実行する(例えば、色成分の1つのヒストグラム等化を使用する)。メタデータを前処理に関連付けて、ビットストリームに付加することができる。
エンコーダ100では、以下に説明するエンコーダ要素によってピクチャが符号化される。符号化されるピクチャは、例えば、CUというユニットに分割され(102)、処理される。各ユニットは、例えば、イントラモード又はインターモードのいずれかを使用して符号化される。ユニットがイントラモードで符号化される場合、イントラ予測(160)を実行する。インターモードでは、動き推定(175)及び動き補償(170)が実行される。エンコーダは、ユニットの符号化にイントラモード又はインターモードのうちのいずれか1つを使用するかを決定し(105)、イントラ/インターの決定を、例えば、予測モードフラグによって示す。予測残差は、例えば、元の画像ブロックから予測されたブロックを減算する(110)ことによって計算される。
次に、予測残差が変換され(125)、量子化される(130)。量子化された変換係数と、動きベクトル及び他のシンタックス要素がエントロピ符号化され(145)、ビットストリームを出力する。エンコーダは、変換をスキップして、変換されていない残差信号に量子化を直接適用することができる。エンコーダは、変換及び量子化の両方をバイパスすることができ、すなわち残差は、変換処理又は量子化処理を適用することなく直接符号化される。
エンコーダは、更なる予測のための参照データを提供するため、符号化されたブロックを復号化する。予測残差を復号化するため、量子化された変換係数が逆量子化され(140)、逆変換される(150)。復号化された予測残差と予測されたブロックを合成して(155)、画像ブロックが再構成される。再構成されたピクチャにインループフィルタ(165)が適用され、例えば、デブロッキング/SAO(サンプル適応オフセット:Sample Adaptive Offset)フィルタリングを実行し、符号化アーチファクトを低減する。フィルタリングされた画像が、参照ピクチャバッファ(180)に格納される。
図2は、ビデオデコーダ200のブロック図を示している。デコーダ200では、以下に説明するデコーダ要素によってビットストリームが復号化される。ビデオデコーダ200は、一般に、図1に説明したような符号化パスとは逆向きの復号化パスを実行する。エンコーダ100は、一般に、ビデオデータの符号化の一部としてビデオの復号化も実行する。
デコーダの入力はビデオビットストリームを含み、このビットストリームはビデオエンコーダ100によって生成することができる。ビットストリームは、最初にエントロピ復号化され(230)、変換係数、動きベクトル、及び他の符号化された情報を得る。ピクチャ分割情報は、ピクチャがどのように分割されているかを示す。したがってデコーダは、復号化されたピクチャ分割情報に従ってピクチャを分割することができる(235)。予測残差を復号化するために、変換係数が逆量子化(240)及び逆変換(250)される。復号化された予測残差と予測されたブロックを合成し(255)、画像ブロックを再構成する。予測されたブロックは、イントラ予測(260)又は動き補償された予測(すなわちインター予測)(275)から得ることができる(270)。再構成された画像にインループフィルタ(265)が適用される。フィルタリングされた画像が、参照ピクチャバッファ(280)に格納される。
復号化されたピクチャは、復号化後処理(285)を更に受けることができ、例えば、逆色変換(例えば、YCbCr 4:2:0からRGB 4:4:4への変換)、又は符号化前処理(101)で実行された再マッピング処理の逆を実行する逆再マッピングである。復号化後処理では、符号化前処理で導出されてビットストリームでシグナリングされたメタデータを使用することができる。
図3は、様々な態様及び実施形態が実装されているシステムの一例のブロック図を示している。システム1000は、以下に説明する様々な構成要素を含むデバイスとして具現化することができ、本文書に説明する態様のうちの1つ以上を実行するように構成されている。このようなデバイス装置の例としては、パーソナルコンピュータ、ラップトップコンピュータ、スマートフォン、タブレットコンピュータ、デジタルマルチメディアセットトップボックス、デジタルテレビ受信機、パーソナルビデオ録画システム、接続型家電、及びサーバなどの様々な電子デバイスが挙げられるが、これらに限定されない。システム1000の要素は、単独で又は組み合わせて、単一の集積回路、複数のIC、及び/又はディスクリート部品において具現化することができる。例えば、少なくとも一実施形態において、システム1000の処理要素及びエンコーダ/デコーダ要素は、複数のIC及び/又はディスクリート部品に分散される。様々な実施形態において、システム1000は、例えば、通信バスを介して、又は専用の入力ポート及び/又は出力ポートを通じて、他の同様のシステム、又は他の電子デバイスに通信可能に結合される。様々な実施形態において、システム1000は、本文書に記載されている態様のうちの1つ以上を実装するように構成されている。
システム1000は、例えば、本文書に記載された様々な態様を実装するために、自身にロードされた命令を実行するように構成された少なくとも1つのプロセッサ1010を含む。プロセッサ1010は、組み込みメモリ、入力出力インターフェース、及び当該技術分野で既知である他の様々な回路を含むことができる。システム1000は、少なくとも1つのメモリ1020(例えば、揮発性メモリデバイス及び/又は不揮発性メモリデバイス)を含む。システム1000は、記憶デバイス1040を含み、この記憶デバイスは、EEPROM、ROM、PROM、RAM、DRAM、SRAM、フラッシュ、磁気ディスクドライブ、及び/若しくは光ディスクドライブを含むが、これらに限定されない、不揮発性メモリ並びに/又は揮発性メモリを含むことができる。記憶デバイス1040は、非限定的な例として、内部記憶デバイス、外付け記憶デバイス、及び/又はネットワークアクセス可能な記憶デバイスを含むことができる。
システム1000は、例えば、データを処理して符号化ビデオ又は復号化ビデオを提供するように構成されたエンコーダ/デコーダモジュール1030を含み、エンコーダ/デコーダモジュール1030は、それ自身のプロセッサ及びメモリを含むことができる。エンコーダ/デコーダモジュール1030は、符号化機能及び/又は復号化機能を実行するためにデバイスに含めることのできるモジュールを表す。既知であるように、デバイスは、符号化モジュール及び復号化モジュールの一方又は両方を含むことができる。更に、エンコーダ/デコーダモジュール1030は、システム1000の別個の要素として実装することができる、又は当業者に既知であるように、ハードウェア及びソフトウェアの組み合わせとしてプロセッサ1010内に組み込むことができる。
本文書に記載された様々な態様を実行するためにプロセッサ1010又はエンコーダ/デコーダ1030にロードされるプログラムコードは、記憶デバイス1040に格納することができ、その後、プロセッサ1010による実行のためにメモリ1020にロードすることができる。様々な実施形態に従って、プロセッサ1010、メモリ1020、記憶デバイス1040、及びエンコーダ/デコーダモジュール1030のうちの1つ以上は、本文書に記載された処理の実行中に様々な項目のうちの1つ以上を格納することができる。そのような格納される項目としては、入力ビデオ、復号化されたビデオ又は復号化されたビデオの一部、ビットストリーム、行列、変数、更には方程式、数式、演算、及び演算論理の処理からの中間結果又は最終結果が挙げられるが、これらに限定されない。
いくつかの実施形態では、プロセッサ1010及び/又はエンコーダ/デコーダモジュール1030の内部のメモリは、命令を格納するためと、符号化又は復号化中に必要とされる処理のためのワーキングメモリを提供するために使用される。しかしながら、別の実施形態では、処理デバイス(処理デバイスは例えば、プロセッサ1010又はエンコーダ/デコーダモジュール1030のいずれかとすることができる)の外部のメモリが、これらの機能のうちの1つ以上のために使用される。外部メモリは、メモリ1020及び/又は記憶デバイス1040、例えば、ダイナミック揮発性メモリ及び/又は不揮発性フラッシュメモリとすることができる。いくつかの実施形態では、外部不揮発性フラッシュメモリが、テレビのオペレーティングシステムを格納するために使用される。少なくとも一実施形態では、RAMなどの高速な外部ダイナミック揮発性メモリが、MPEG-2、HEVC、又はVVC(多用途ビデオコーディング)などのビデオ符号化動作及び復号化動作のためのワーキングメモリとして使用される。
システム1000の要素への入力は、ブロック1130に示されるように、様々な入力デバイスを通じて提供することができる。このような入力デバイスとしては、(i)例えば、放送局によって無線で送信されるRF信号を受信するRF部、(ii)コンポジット入力端子、(iii)USB入力端子、及び/又は(iv)HDMI入力端子が挙げられるが、これらに限定されない。
様々な実施形態において、ブロック1130の入力デバイスは、当該技術分野で既知であるように、関連するそれぞれの入力処理要素を有する。例えば、RF部は、(i)所望の周波数を選択する(信号を選択する、又は信号を特定の周波数帯域に帯域制限するとも称される)、(ii)選択された信号をダウンコンバートする、(iii)(例えば)特定の実施形態においてチャネルと称され得る信号周波数帯域を選択するために、より狭い周波数帯域に再び帯域制限する、(iv)ダウンコンバートされて帯域制限された信号を復調する、(v)エラー訂正を実行する、及び(vi)逆多重化してデータパケットの所望のストリームを選択する、ために必要な要素を関連付けることができる。様々な実施形態のRF部は、これらの機能を実行する1つ以上の要素、例えば、周波数セレクタ、信号セレクタ、バンドリミッタ、チャネルセレクタ、フィルタ、ダウンコンバータ、復調器、エラー訂正器、及びデマルチプレクサを含む。RF部は、例えば、受信信号をより低い周波数(例えば、中間周波数又はベースバンドに近い周波数)又はベースバンドにダウンコンバートすることを含む、これらの機能のうちの様々な機能を実行するチューナを含むことができる。セットトップボックスの一実施形態では、RF部及びその関連する入力処理要素は、有線(例えば、ケーブル)媒体を介して送信されるRF信号を受信し、所望の周波数帯域にフィルタリング、ダウンコンバート、及び再フィルタリングすることによって周波数選択を実行する。様々な実施形態では、上述した(及び他の)要素の順序を並べ替える、これらの要素の一部を削除する、及び/又は、類似若しくは異なる機能を実行する他の要素を追加する。要素を追加することは、既存の要素の間に要素を挿入すること、例えば、増幅器及びアナログ-デジタル変換器を挿入することを含むことができる。様々な実施形態において、RF部は、アンテナを含む。
更に、USB端子及び/又はHDMI端子は、システム1000をUSB接続及び/又はHDMI接続を介して他の電子デバイスに接続するためのそれぞれのインターフェースプロセッサを含むことができる。入力処理の様々な側面、例えば、リード-ソロモンエラー訂正は、例えば、必要に応じて、別個の入力処理IC内で実装する、又はプロセッサ1010内で実装することができることを理解されたい。同様に、USB又はHDMIインターフェース処理の側面は、必要に応じて、別個のインターフェースIC内で、又はプロセッサ1010内で実装することができる。復調されてエラー訂正され、更に逆多重化されたストリームは、出力デバイス上に提示するための必要に応じてデータストリームを処理するため、例えば、プロセッサ1010、並びにメモリ及びストレージ要素と組み合わせて動作するエンコーダ/デコーダ1030を含む様々な処理要素に提供される。
システム1000の様々な要素は、統合されたハウジング内に設けることができ、統合されたハウジング内では、様々な要素は、適切な接続構成1140、例えば、I2Cバス、配線、及びプリント回路基板を含む、当該技術分野で既知の内部バスを使用して相互に接続され、互いの間でデータを送信することができる。
システム1000は、通信チャネル1060を介して他のデバイスとの通信を可能にする通信インターフェース1050を含む。通信インターフェース1050は、通信チャネル1060を介してデータを送信及び受信するように構成された送受信機を含むことができるが、これらに限定されない。通信インターフェース1050は、モデム又はネットワークカードを含むことができるが、これらに限定されず、通信チャネル1060は、例えば、有線媒体及び/又は無線媒体内に実装することができる。
データは、様々な実施形態において、IEEE802.11などの無線ネットワークを使用して、システム1000にストリーミングされる。これらの実施形態の無線信号は、例えば、Wi-Fi通信用に適合された通信チャネル1060及び通信インターフェース1050を介して受信される。これらの実施形態の通信チャネル1060は、一般には、ストリーミングアプリケーション及び他のオーバーザトップ通信を可能にするためにインターネットを含む外部ネットワークへのアクセスを提供するアクセスポイント又はルータに接続される。別の実施形態では、入力ブロック1130のHDMI接続を介してデータを配信するセットトップボックスを使用して、システム1000にストリーミングデータを提供する。更に別の実施形態では、入力ブロック1130のRF接続を使用してシステム1000にストリーミングデータを提供する。
システム1000は、ディスプレイ1100、スピーカ1110、及び他の周辺デバイス1120を含む様々な出力デバイスに出力信号を提供することができる。他の周辺デバイス1120は、実施形態の様々な例において、スタンドアロンDVR、ディスクプレーヤー、ステレオシステム、照明システム、及びシステム1000の出力に基づいて機能を提供する他のデバイス、のうちの1つ以上を含む。様々な実施形態において、制御信号は、AV.Link、CEC、又はユーザ介入あり又はなしでデバイス間制御を可能にする他の通信プロトコルなどのシグナリングを使用して、システム1000とディスプレイ1100、スピーカ1110、又は他の周辺デバイス1120との間で通信される。出力デバイスは、それぞれのインターフェース1070、1080、及び1090を通じた専用接続を介してシステム1000に通信可能に結合することができる。代替的に、出力デバイスは、通信インターフェース1050を介して通信チャネル1060を使用してシステム1000に接続することができる。ディスプレイ1100及びスピーカ1110は、例えば、テレビなどの電子デバイスにおいて、システム1000の他の構成要素とともに単一ユニットに統合することができる。様々な実施形態において、ディスプレイインターフェース1070は、ディスプレイドライバ、例えば、タイミングコントローラ(timing controller、T Con)チップを含む。
代替的に、例えば、入力1130のRF部が個別のセットトップボックスの一部である場合、ディスプレイ1100及びスピーカ1110を他の構成要素のうちの1つ以上から分離することができる。ディスプレイ1100及びスピーカ1110が外部構成要素である様々な実施形態では、出力信号は、例えば、HDMIポート、USBポート、又はCOMP出力を含む専用の出力接続を介して提供することができる。
実施形態は、プロセッサ1010によって実装されるコンピュータソフトウェアによって、又はハードウェアによって、又はハードウェアとソフトウェアの組み合わせによって、実行することができる。非限定的な例として、実施形態は、1つ以上の集積回路によって実装することができる。メモリ1020は、技術環境に適した任意のタイプとすることができ、非限定的な例として、光学メモリデバイス、磁気メモリデバイス、半導体ベースのメモリデバイス、固定メモリ、及び取り外し可能なメモリなどの任意の適切なデータ記憶技術を使用して実装することができる。プロセッサ1010は、技術環境に適した任意のタイプとすることができ、非限定的な例として、マイクロプロセッサ、汎用コンピュータ、特殊目的コンピュータ、及びマルチコアアーキテクチャに基づくプロセッサ、のうちの1つ以上を包含することができる。
様々な実装形態は、復号化することを含む。本出願で使用される「復号化」は、例えば、表示するのに適した最終出力を生成するために、受信した符号化シーケンスに対して実行される処理のすべて又は一部を包含することができる。様々な実施形態において、このような処理は、例えば、エントロピ復号化、逆量子化、逆変換、及び差動復号化など、デコーダによって一般的に実行される処理のうちの1つ以上を含む。様々な実施形態において、このような処理は、これらに加えて、又は代替的に、例えば、様々なイントラ予測参照配列(intra prediction reference arrays)に使用される重みのインデックスを抽出するなど、本出願に説明される様々な実装形態のデコーダによって実行される処理を含む。
更なる例として、一実施形態では「復号化」はエントロピ復号化のみを指し、別の実施形態では「復号化」は差動復号化のみを指し、別の実施形態では「復号化」はエントロピ復号化及び差動復号化の組み合わせを指す。「復号化処理」という句が、操作のサブセットを具体的に指すことを意図しているか、又はより広範な復号化処理を一般的に指すことを意図しているかは、特定の説明の文脈に基づいて明らかになり、当業者にはよく理解されると考えられる。
様々な実装形態は、符号化することを含む。本出願で使用される「符号化」は、「復号化」に関する上記の説明と同様に、例えば、符号化されたビットストリームを生成するために入力ビデオシーケンスに対して実行される処理のすべて又は一部を包含することができる。様々な実施形態において、このような処理は、例えば、分割、差動符号化、変換、量子化、及びエントロピ符号化など、エンコーダによって一般的に実行される処理のうちの1つ以上を含む。様々な実施形態において、このような処理は、これらに加えて、又は代替的に、例えば、イントラ予測参照配列の重み付けなど、本出願に説明される様々な実装形態のエンコーダによって実行される処理を含む。
更なる例として、一実施形態では、「符号化」は、エントロピ符号化のみを指し、別の実施形態では、「符号化」は、差動符号化のみを指し、別の実施形態では、「符号化」は、差動符号化とエントロピ符号化との組み合わせを指す。「符号化処理」という句が、操作のサブセットを具体的に指すことを意図しているか、又はより広範な符号化処理を一般的に指すことを意図しているかは、特定の説明の文脈に基づいて明らかになり、当業者にはよく理解されると考えられる。
本明細書で使用されるシンタックス要素は、説明上の用語であることに留意されたい。したがって、これらは他のシンタックス要素名の使用を排除するものではない。
図がフローチャートとして提示されている場合、その図は対応する装置のブロック図も提供するものと理解されたい。同様に、図がブロック図として提示されている場合、その図は対応する方法/処理のフローチャートも提供するものと理解されたい。
様々な実施形態では、レート歪み計算又はレート歪み最適化に言及している。符号化処理時、通常では、しばしば計算の複雑性の制約が与えられて、レートと歪みの間のバランス又はトレードオフが考慮される。レート歪み最適化は、通常、レートと歪みの加重和であるレート歪み関数を最小化するように定式化される。レート歪み最適化問題を解くには、様々なアプローチがある。例えば、これらのアプローチは、すべての考慮されるモード又は符号化パラメータ値を含むすべての符号化オプションの広範なテストに基づき得、それらの符号化コスト、並びに符号化及び復号化後の再構成された信号の関連する歪みの完全な評価を伴う。また、符号化の複雑さを軽減するために、より高速なアプローチ、特に、再構成された信号ではなく、予測又は予測残差信号に基づく近似歪みの計算を使用することもできる。これらの2つのアプローチを組み合わせて使用することもでき、例えば、可能な符号化オプションの一部のみに対して近似歪みを使用し、他の符号化オプションに対しては完全な歪みを使用することができる。別のアプローチでは、可能な符号化オプションのサブセットのみを評価する。より一般的には、多くのアプローチは、最適化を実行するために様々な技術のいずれかを採用するが、最適化は、必ずしも符号化コスト及び関連する歪みの両方の完全な評価ではない。
本明細書に記載された実装形態及び態様は、例えば、方法又はプロセス、装置、ソフトウェアプログラム、データストリーム、又は信号において実装することができる。たとえ単一の形式の実装形態の文脈でのみ説明されている場合でも(例えば、方法としてのみ説明されている)、説明された特徴の実装形態は、他の形式(例えば、装置又はプログラム)でも実装することができる。装置は、例えば、適切なハードウェア、ソフトウェア、及びファームウェアにおいて実装することができる。方法は、例えば、プロセッサにおいて実装することができ、プロセッサは、例えば、コンピュータ、マイクロプロセッサ、集積回路、又はプログラマブルロジックデバイスを含む一般的な処理デバイスを指す。更にプロセッサは、例えば、コンピュータ、携帯電話、ポータブル/パーソナルデジタルアシスタント(「portable/personal digital assistant、PDA」)、及びエンドユーザ間の情報の通信を容易にする他のデバイスなどの通信デバイスを含む。
「一実施形態」又は「実施形態」又は「一実装形態」又は「実装形態」、及びそれらの他の変形形態の言及は、実施形態に関連して説明される特定の特徴、構造、特性などが、少なくとも一実施形態に含まれることを意味する。したがって、本文書を通じて様々な場所に現れる「一実施形態において」又は「実施形態において」又は「一実装形態において」又は「実装形態において」という句、及び他の変形は、必ずしもすべてが同じ実施形態を指すわけではない。
更に、本文書は、様々な情報を「決定すること」に言及し得る。情報を決定することは、例えば、情報を推定すること、情報を計算すること、情報を予測すること、又はメモリから情報を取得することのうちの1つ以上を含むことができる。
更に、本文書は、様々な情報に「アクセスすること」に言及し得る。情報にアクセスすることは、例えば、情報を受信すること、(例えば、メモリから)情報を取得すること、情報を格納すること、情報を移動すること、情報をコピーすること、情報を計算すること、情報を決定すること、情報を予測すること、又は情報を推定することのうちの1つ以上を含むことができる。
更に、本文書は、様々な情報を「受信する」ことに言及し得る。受信することは、「アクセスする」と同様に、広義の用語であることを意図している。情報を受信することは、例えば、情報にアクセスすること、又は(例えば、メモリから)情報を取得することのうちの1つ以上を含むことができる。更に、「受信する」は、一般には、例えば、情報を格納する、情報を処理する、情報を送信する、情報を移動する、情報をコピーする、情報を消去する、情報を計算する、情報を決定する、情報を予測する、又は情報を推定するなどの操作時に、何らかの形で関与する。
「/」、「及び/又は」、「のうちの少なくとも1つ」のいずれかの使用、例えば、「A/B」、「A及び/又はB」、「A及びBのうちの少なくとも1つ」の場合、最初にリストされた選択肢(A)のみの選択、又は2番目にリストされた選択肢(B)のみの選択、又は両方の選択肢(A及びB)の選択を包含することを意図しているものと理解されたい。更なる例として、「A、B、及び/又はC」及び「A、B、及びCのうちの少なくとも1つ」の場合、このような句は、最初にリストされた選択肢(A)のみの選択、又は2番目にリストされた選択肢(B)のみの選択、又は3番目にリストされた選択肢(C)のみの選択、又は、最初及び2番目にリストされた選択肢(A及びB)のみの選択、又は、最初及び3番目にリストされた選択肢(A及びC)のみの選択、又は、2番目及び3番目にリストされた選択肢(B及びC)のみの選択、又は3つの選択肢(A及びB及びC)すべての選択、を包含するように意図されている。このことは、当該技術分野及び関連技術分野の通常の技術を有する者に明らかであるように、リストされた項目の数だけ拡張することができる。
また、本明細書で使用される「シグナリングする」という語は、特に、対応するデコーダに対して何かを示すことを意味する。例えば、特定の実施形態では、エンコーダは、イントラ予測参照配列に使用される複数の重みのうちの特定の1つをシグナリングする。このように、ある実施形態では、同じパラメータがエンコーダ側とデコーダ側の両方で使用される。したがって、例えば、エンコーダは、デコーダが同じ特定のパラメータを使用することができるように、特定のパラメータをデコーダに送信する(明示的なシグナリング)ことができる。逆に、デコーダがすでにその特定のパラメータ及び他のパラメータを有する場合は、単にデコーダがその特定のパラメータを認識及び選択することを可能にするように、送信を行わないシグナリング(暗黙的なシグナリング)を使用することができる。実際の機能の送信を回避することにより、様々な実施形態において、ビットの節約が実現される。シグナリングは、様々な方法で達成できることを理解されたい。例えば、1つ以上のシンタックス要素、フラグなどが、様々な実施形態において、対応するデコーダに情報をシグナリングするために使用される。上の説明は、語「信号(signal)」の動詞形に関するものであるが、語「信号」は、本明細書では名詞としても使用され得る。
この当業者には明らかであるように、実装形態では、例えば、格納又は送信することができる情報を伝えるようにフォーマットされた様々な信号を生成することができる。これらの情報は、例えば、方法を実行するための命令、又は説明されている実装形態の1つによって生成されるデータを含むことができる。例えば、説明されている実施形態のビットストリームを伝えるように信号をフォーマットすることができる。このような信号は、例えば、電磁波として(例えば、スペクトルの無線周波数部分を使用する)、又はベースバンド信号としてフォーマットすることができる。フォーマットすることは、例えば、データストリームを符号化すること、及び符号化されたデータストリームで搬送波を変調することを含むことができる。信号が伝える情報は、例えば、アナログ情報又はデジタル情報とすることができる。信号は、既知であるように、様々な異なる有線リンク又は無線リンクを介して送信することができる。信号は、プロセッサ可読媒体に格納することができる。
実施形態は、様々な異なる請求項のカテゴリ及びタイプにわたり、以下の特徴又はエンティティの1つ以上を単独又は組み合わせにおいて含むことができる。
・最大変換サイズに関係なく、決定されたサイズまでのコード化ユニットのマトリックスベースのイントラ予測を有効化すること。
・コード化ユニットのサイズが最大変換サイズよりも大きいときに、変換ユニットのタイリングを有効化すること。
・低周波数非分離性変換(low-frequency non-separable transform、LFNST)を決定されたサイズまで有効化すること。
・いかなる変換ユニットも、変換としてDCT2を使用していないかどうかを示すが、そのように示されている場合、LFNSTを許可しないシンタックス要素についてビットストリームに含めること、又はビットストリームをチェックすること。
・説明したシンタックス要素又はそのバリエーションのうちの1つ以上を含むビットストリーム又は信号。
・説明したシンタックス要素又はそのバリエーションのうちの1つ以上を含むビットストリーム又は信号を作成及び/又は送信及び/又は受信及び/又は復号化すること。
・説明した実施形態のいずれかに従ってインループフィルタリングを実行するテレビ、セットトップボックス、携帯電話、タブレット、又は他の電子デバイス。
・説明した実施形態のいずれかに従ってインループフィルタリングを実行し、得られた画像を(例えば、モニタ、スクリーン、又は他のタイプのディスプレイを使用して)表示するテレビ、セットトップボックス、携帯電話、タブレット、又は他の電子デバイス。
・符号化された画像を含む信号を受信するために(例えば、チューナを使用して)チャネルをチューニングし、説明した実施形態のいずれかに従ってインループフィルタリングを実行する、テレビ、セットトップボックス、携帯電話、タブレット、又は他の電子デバイス。
・符号化された画像を含む信号を(例えば、アンテナを使用して)無線で受信し、説明した実施形態のいずれかに従ってインループフィルタリングを実行するテレビ、セットトップボックス、携帯電話、タブレット、又は他の電子デバイス。
様々な他の一般化された、並びに特定化された発明及び請求項も、本開示全体を通じてサポート及び企図されている。

Claims (15)

  1. ビデオ符号化のための方法であって、
    最大変換サイズに基づいて、コード化ツールを有効化することと、
    ブロックを含むサンプルのサブセット上で、離散トリガノメトリック変換の少なくとも一部分を実行することと、
    前記有効化されたコード化ツールを使用して、前記ブロックを符号化することと、を含む、方法。
  2. 装置であって、
    プロセッサであって、
    最大変換サイズに基づいて、コード化ツールを有効化することと、
    ブロックを含むサンプルのサブセット上で、離散トリガノメトリック変換の少なくとも一部分を実行することと、
    前記有効化されたコード化ツールを使用して、前記ブロックを符号化することと、を行うように構成されている、プロセッサを備える、装置。
  3. 方法であって、
    最大変換サイズに基づいて、コード化ツールを有効化することと、
    ブロックを含むサンプルのサブセット上で、逆離散トリガノメトリック変換の少なくとも一部分を実行することと、
    前記有効化されたコード化ツールを使用して、前記ブロックを復号化することと、を含む、方法。
  4. 装置であって、
    プロセッサであって、
    最大変換サイズに基づいて、コード化ツールを有効化することと、
    ブロックを含むサンプルのサブセット上で、逆離散トリガノメトリック変換の少なくとも一部分を実行することと、
    前記有効化されたコード化ツールを使用して、前記ブロックを復号化することと、を行うように構成されているプロセッサを備える、装置。
  5. 前記コード化ツールが、マトリックスベースのイントラ予測である、請求項1若しくは請求項3に記載の方法、又は請求項2若しくは請求項4に記載の装置。
  6. 前記コード化ツールが、変換ユニットタイリングである、請求項1若しくは請求項3に記載の方法、又は請求項2若しくは請求項4に記載の装置。
  7. 前記コード化ツールが、決定された変換サイズまでの低周波数非分離型変換(LFNST)である、請求項1若しくは請求項3に記載の方法、又は請求項2若しくは請求項4に記載の装置。
  8. 前記決定された変換サイズが、32×32である、請求項7に記載の方法又は装置。
  9. いかなる変換ユニットも、DCT2を使用しない場合、前記LFNSTが許可されない、請求項7に記載の方法又は装置。
  10. 前記コード化ツールが、ビットストリームで示される、請求項1若しくは請求項3に記載の方法、又は請求項2若しくは請求項4に記載の装置。
  11. 前記決定された変換サイズが、64×64である、請求項7に記載の方法又は装置。
  12. デバイスであって、
    請求項4~11のいずれか一項に記載の装置と、
    (i)信号を受信するように構成されたアンテナであって、前記信号がビデオブロックを含む、アンテナ、(ii)受信信号を、前記ビデオブロックを含む周波数帯域に制限するように構成されたバンドリミッタ、及び(iii)ビデオブロックを表す出力を表示するように構成されたディスプレイ、のうちの少なくとも1つと、を備える、デバイス。
  13. 請求項1及び5~11のいずれか一項に記載の方法に従って生成された、又は請求項2及び5~11のいずれか一項に記載の装置によって生成された、プロセッサを使用して再生するためのデータコンテンツを含む、非一時的なコンピュータ可読媒体。
  14. プロセッサを使用して再生するための、請求項1及び5~11のいずれか一項に記載の方法に従って、又は請求項2及び5~11のいずれか一項に記載の装置によって生成されたビデオデータを含む、信号。
  15. コンピュータプログラム製品であって、前記プログラムがコンピュータによって実行されるとき、請求項1、3及び5~11のいずれか一項に記載の方法を前記コンピュータに実行させる命令を含む、コンピュータプログラム製品。

JP2022516275A 2019-09-13 2020-09-08 コード化ツールとの変換サイズの相互作用 Pending JP2022547607A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP19306103 2019-09-13
EP19306103.3 2019-09-13
EP19306152.0 2019-09-20
EP19306152 2019-09-20
PCT/EP2020/074996 WO2021048077A1 (en) 2019-09-13 2020-09-08 Transform size interactions with coding tools

Publications (1)

Publication Number Publication Date
JP2022547607A true JP2022547607A (ja) 2022-11-14

Family

ID=72322472

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022516275A Pending JP2022547607A (ja) 2019-09-13 2020-09-08 コード化ツールとの変換サイズの相互作用

Country Status (8)

Country Link
US (1) US20230143712A1 (ja)
EP (1) EP4029270A1 (ja)
JP (1) JP2022547607A (ja)
KR (1) KR20220057630A (ja)
CN (1) CN114631314A (ja)
MX (1) MX2022003022A (ja)
TW (1) TW202118299A (ja)
WO (1) WO2021048077A1 (ja)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11240534B2 (en) * 2019-04-05 2022-02-01 Qualcomm Incorporated Extended multiple transform selection for video coding
KR20210133301A (ko) * 2019-06-06 2021-11-05 엘지전자 주식회사 변환에 기반한 영상 코딩 방법 및 그 장치
CN114208178A (zh) * 2019-08-06 2022-03-18 交互数字Vc控股法国有限公司 用于视频编码和解码的二次变换

Also Published As

Publication number Publication date
US20230143712A1 (en) 2023-05-11
CN114631314A (zh) 2022-06-14
EP4029270A1 (en) 2022-07-20
MX2022003022A (es) 2022-06-14
WO2021048077A1 (en) 2021-03-18
KR20220057630A (ko) 2022-05-09
TW202118299A (zh) 2021-05-01

Similar Documents

Publication Publication Date Title
KR20220047725A (ko) 암시적 다중 변환 선택을 위한 변환 선택
CN112352427B (zh) 基于图像块的非对称二元分区的视频编码和解码的方法和装置
US20240089437A1 (en) Chroma quantization parameter adjustment in video encoding and decoding
CN114208178A (zh) 用于视频编码和解码的二次变换
US20220046244A1 (en) Directions for wide angle intra prediction
JP2023543985A (ja) 多用途ビデオコーディングのためのテンプレートマッチング予測
KR20210058846A (ko) 인트라 변환 코딩 및 광각 인트라 예측의 조화
JP2021528893A (ja) 可変重みを使用する複数参照イントラ予測
US20240031606A1 (en) Karhunen loeve transform for video coding
JP2023516940A (ja) ローカルクロマ量子化パラメータ制御のための高レベルの制約フラグ
JP2022547607A (ja) コード化ツールとの変換サイズの相互作用
US20220224902A1 (en) Quantization matrices selection for separate color plane mode
US20220368890A1 (en) Most probable mode signaling with multiple reference line intra prediction
US20210266582A1 (en) Illumination compensation in video coding
EP3664450A1 (en) Method and device for picture encoding and decoding
JP2023504372A (ja) ジョイントクロマの符号化されたブロックに対するスケーリング処理
CN113170149A (zh) 用于图片编码和解码的方法和设备
EP3861746A1 (en) Block size based motion vector coding in affine mode
KR20210028645A (ko) 다수의 영역에 대한 인-루프 필터
CN114788275A (zh) 用于联合Cb-Cr编码的量化矩阵的推导

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220517

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20220610

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20220712

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230908

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20231121