JP7568375B2 - 画像およびビデオコーディングのための高精度変換および量子化 - Google Patents
画像およびビデオコーディングのための高精度変換および量子化 Download PDFInfo
- Publication number
- JP7568375B2 JP7568375B2 JP2023122411A JP2023122411A JP7568375B2 JP 7568375 B2 JP7568375 B2 JP 7568375B2 JP 2023122411 A JP2023122411 A JP 2023122411A JP 2023122411 A JP2023122411 A JP 2023122411A JP 7568375 B2 JP7568375 B2 JP 7568375B2
- Authority
- JP
- Japan
- Prior art keywords
- current block
- transform
- block
- video
- bit depth
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/12—Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
- H04N19/126—Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/132—Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/18—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/184—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Discrete Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
本出願は、2019年9月21日に出願された、国際特許出願番号PCT/CN2019/107140について優先権および利益を主張する、2020年9月16日に出願された、国際特許出願第PCT/CN2020/115533号に基づく、特願2022-517816の分割出願である。上記の出願の開示全体は、この出願の開示の一部として参照により包含されている。
本文書は、画像およびビデオコーディング技術に関する。具体的には、画像およびビデオコーディングにおける変換、量子化、逆量子化、および逆変換に関する。これは、HEVCのような既存のビデオコーディング規格、または、完成される標準(バーサタイルビデオコーディング(Versatile Video Coding))に対して適用され得る。これは、また、将来のビデオコーディング規格またはビデオコーデックに対しても適用可能である。
ビデオコーディング規格は、主に、周知のITU-TおよびISO/IEC規格の開発を通じて発展してきた。ITU-TはH.261とH.263を製作し、ISO/IECはMPEG-1とMPEG-4 Visualを製作し、そして、2つの組織はH.262/MPEG-2 Video、H.264/MPEG-4 Advanced Video Coding(AVC)、およびH.265/HEVC規格を共同で作成した。H.262から、ビデオコーディング規格は、時間的予測と変換コーディングが利用されるハイブリッドビデオコーディング構造に基づいている。HEVCを越えた将来のビデオコーディング技術を探求するため、2015年にVCEGとMPEGが共同で共同ビデオ探査チーム(Joint Exploration Team、JVET)を設立した。それ以来、JVETによって多くの新しい方法が採用され、JEM(Joint Exploration Model)と名付けられた参照ソフトウェアに入れられた。2018年4月には、VCEG(Q6/16)とISO/IEC JTC1 SC29/WG11(MPEG)の合同ビデオエキスパートチーム(JVET)を発足されて、HEVCに対して50%のビットレート低減を目指すVVC規格に取り組んでいる。
2.1.1 高周波ゼロイングを使用する大きいブロックサイズ変換
VTM5では、64×64までのサイズの大きいブロックサイズ変換が可能であり、これは主に、例えば、1080pおよび4Kシーケンスの、高解像度ビデオに有用である。高周波変換係数は、サイズ(幅または高さ、もしくは、幅および高さの両方)が64に等しい変換ブロックに対してゼロ出力(zeroed out)され、その結果、低周波係数のみが保持される。たとえば、M×N変換ブロックでは、Mをブロック幅、Nをブロック高さとして、Mが64に等しい場合、変換係数の左32列(column)のみが保持される。同様に、Nが64に等しい場合、変換係数の上32行(row)のみが保持される。大きいブロックについて変換スキップモードが使用される場合、いかなる値もゼロ出力されることなくブロック全体が使用される。
HEVCで使用されてきたDCT-IIに加えて、多重変換選択(Multiple Transform Selection、MTS)スキームが、インター(inter)コード化ブロックおよびイントラ(intra)コード化ブロックの両方の残差コード化に使用される。DCT8/DST7から選択された複数の変換が使用される。新しく導入される変換行列は、DST-VIIとDCT-VIIIである。テーブル1は、選択されたDST/DCTの基本機能を示している。
-幅および高さの両方が、32以下である
-CBFフラグが1に等しい
変換ユニットが大きい場合、大きい変換コアを必要とすることがあり、これは、小さい変換と比較してより複雑になる。従って、現在のVVC設計では、変換ユニットが十分に大きい場合、必要な変換サイズが低減されるように、変換係数の所定の部分が0に設定される。
nonZeroW=Min(nTbW,(trTypeHor>0)?16:32)
nonZeroH=Min(nTbH,(trTypeVer>0)?16:32)
VTM5では、縮小二次変換(reduced secondary transform)として知られている、低周波非分離変換(low-frequency non-separable transform、LFNST)が、図1に示すように、前方一次変換と(エンコーダでの)量子化との間、および、逆量子化と(デコーダ側での)逆一次変換との間において適用される。LFNSTでは、ブロックサイズに応じて、4×4非分離変換または8×8非分離変換が適用される。例えば、4×4のLFNSTは小さいブロック(すなわち、min(width,height)<8)について適用され、そして、8×8のLFNSTは大きいブロック(すなわち、min(width,height)>4)について適用される。
LFNST(低周波非分離変換)は、非分離変換を適用するために、直接マトリクス乗算アプローチに基づいており、その結果、多重反復なしで単一パスにおいて実装される。しかしながら、非分離変換マトリクスのディメンションは、計算の複雑性、および、変換係数を保管するためのメモリ空間を最小化するために低減される必要がある。従って、縮小非分離変換(または、RST)法が、LFNSTにおいて使用されている。縮小非分離変換の主なアイデアは、N(8×8のNSSTにおいてNは一般的に64に等しい)ディメンションベクトル(dimensional vector)を、異なる空間におけるRディメンションベクトルにマッピングすることである。ここで、N/R(R<N)は、減少因子(reduction factor)である。従って、N×Nマトリクスの代わりに、RSTマトリクスは、以下のようにR×Nマトリクスになる。
全部で4個の変換集合が存在し、そして、変換集合あたり2個の非分離変換行列(カーネル)がLFNSにおいて使用される。イントラ予測モードから変換集合(transform set)へのマッピングは、表3に示すように、事前に定義されている。各変換集合に対して、選択された非分離二次変換候補は、明示的に信号化されたLFNSTインデックスによって、さらに指定される。インデックスは、変換係数の後で、イントラCU毎に一度ビットストリームにおいて信号化される。
前方8×8LFNSTは、16×48行列を使用し、その結果、所与の8×8領域内の左上4×4領域においてのみ非ゼロ係数を生成する。言い換えれば、LFNSTが適用されると、左上4×4領域を除く8×8領域は、ゼロ係数だけを生成する。結果として、左上4×4以外の8×8ブロック領域内で非ゼロ要素(non-zero element)が検出された場合、LFNSTインデックスはコード化されない。これは、LFNSTが適用されなかったことを意味するからである。そうした場合に、LFNSTインデックスはゼロであると推定される。LFNSTインデックスが0に等しい場合、LFNSTは適用されない。そうでなければ、LFNSTが適用される。加えて、LFNSTインデックスはコンテキストコード化されるが、イントラ予測モードに依存せず、そして、最初のビンのみがコンテキストコード化される。
a.ブロックサイズが、所与の閾値以上である(W>=4&&H>=4)
b.変換スキップモードフラグがゼロに等しい
VTMにおいて、サブブロック変換は、インター予測CUについて導入されている。この変換モードでは、残差ブロックのサブ部分のみがCUについてコード化される。cu_cbfが1に等しい場合、cu_sbt_flagは、残りのブロック全体または残りのブロックのサブ部分がコード化されているか否かを示すために、信号化され得る。前者の場合、CUの変換タイプを決定するために、インターMTS情報がさらに解析される。後者の場合、残差ブロックの一部が推定適応変換でコード化され、そして、残差ブロックの他の部分はゼロ出力される。
VTM5では、最大QPが51から63に拡張されており、そして、それに応じて初期QPの信号方式が変更された。SliceQpYの初期値は、slice_qp_deltaの非ゼロ値がコード化されるとき、スライスセグメント層で修正される。具体的には、init_qp_minus26の値が(-26+QpBdOffsetY)から+37までの範囲であるように変更される。VTM5では、変換ブロックのサイズが4のべき乗でない場合、変換係数は、181/256(または181/128)による乗算ではなく、QPまたはQPレベルスケールテーブルへの修正と共に処理され、変換プロセスによる暗黙のスケーリングを補償する。
・MatrixType:30=2(イントラ&IBC/インターについて2)×3(Y/Cb/Cr成分)×5(正方形TBサイズ:ルマについて4×4から64×64まで、クロマについて2×2から32×32まで)
・MatrixType_DC:14=2(イントラ&IBC/インターについて2×Y成分について1)×3(TBサイズ:16×16、32×32、64×64)+4(イントラ&IBC/インターについて2×Cb/Cr成分について2)×2(TBサイズ:16×16、32×32)
VTM5は、クロマ残差を結合して(jointly)コード化するモードをサポートしている。このモードが起動されると、1個の単一結合残存ブロックが、同じトランスフォーメーションユニットにおけるCbおよびCrブロックの両方について信号化される。次に、Cb残差が信号化残差に等しく設定され、そして、Cr残差が信号化残差の符号を打ち消すこと(negating)によって設定される。換言すれば、デコーダでは、クロマブロックを再構成するために、信号化された結合残差がCb予測ブロックに加えられ、かつ、Cr予測ブロックから差し引かれる。結合残差は、通常のクロマ残差コード化プロセスを使用してコード化されている。フラグは、CbおよびCrのコード化ブロックフラグ(cbf)の両方が1である場合、結合残差モードが使用されるか否かを示すフラグが、ビットストリームのフラグで信号化される。
resJoint=(resCb-resCr)/2
1.現在、VVC設計は、変換ブロックの幅および高さを使用して、変換および逆変換の最中のビットシフトの数を決定しており、それは、処理精度を低下させ得る。
2.現在、VVC設計は、変換ブロックの幅および高さを使用して、量子化および逆量子化の最中のビットシフトの数を決定しており、それは、処理精度を低下させ得る。
3.現在、VVC量子化設計は、いくつかのブロックサイズに対して16ビットダイナミックレンジからの量子化残差をもたらし得るものであり、それは、その後16ビットにクリッピングすることのために符号化効率を低下させる。
4.現在、エネルギーを変換されたブロックについて整列させるために変換スキップに対して左シフトが適用されているが、これは不必要である。
以下のリストは、一般的な概念を説明するための例として考慮されるべきである。これらの項目は狭義に解釈すべきではない。さらに、これらのアイテムは、任意の方法で組み合わせることができる。
1.変換スキップブロックについてデコーディングされた係数の残差(例えばtsShift)への変換に使用されるスケール化係数(scaling factor)は、ブロックサイズに依存しない。
a.一つの例において、スケール化係数は、一定である。
i.一つの例において、スケール化係数は、1として設定され得る。
b.一つの例において、スケール化係数は、内部ビット深度に依存し得る。
i.一つの例において、スケール化係数は、(15-internal_bit_depth)として設定され得る。
c.一つの例において、スケール化された変換係数の変換プロセスは呼び出されず、そして、変換係数のスケール化プロセスの出力は、中間残差サンプルを生成するための入力であり、すなわち、ビットシフトなしである。
2.変換されたブロックについて、逆量子化のためのビットシフトの数は、実際の変換サイズ(例えば、ゼロ出力(zeroing-out)領域を考慮しないサイズ)に依存し得る。
a.一つの例において、逆量子化のためのビットシフトの数は、実際の変換の高さに依存し得る。すなわち、4.2.1.3で説明されたnonZeroH。
3.変換されたブロックについて、逆変換のためのビットシフトの数は、変換ブロックのサイズおよび実際の変換サイズに依存し得る。
a.一つの例において、逆変換のためのビットシフトの数は、変換ブロックのサイズに依存し得る。
b.一つの例において、逆変換のためのビットシフトの数は、変換ブロックの高さに依存し得る。
c.一つの例において、逆変換のためのビットシフトの数は、実際の変換の高さに依存し得る。
d.一つの例において、逆変換のためのビットシフトの数は、実際の変換サイズに依存し得る。
e.一つの例において、変換ブロックのサイズが実際の変換サイズと異なるブロックに対する逆変換のためのビットシフトの数は、変換ブロックサイズが実際の変換サイズと等しいブロックとは異なり得る。
f.一つの例において、変換ブロックの高さが実際の変換高さと異なるブロックに対する逆変換のためのビットシフトの数は、変換ブロックの高さが実際の変換高さに等しいブロックとは異なり得る。
4.変換されたブロックについて、逆量子化のためのビットシフトの数は、キャップされた(capped)変換ブロックサイズに依存し得る。
a.一つの例においては、変換ブロックサイズが32×32以上の場合、逆量子化のためのビットシフトの数は、16×16ブロックサイズに従ってよい。
b.一つの例において、キャップされた変換ブロックサイズを適用するか否か、及び/又は、適用する方法は、量子化パラメータに依存し得る。
c.一つの例において、キャップされた変換ブロックサイズを適用するか否か、及び/又は、適用する方法は、ブロック幅がブロック高さの偶数倍であるかに依存し得る。
d.一つの例において、キャップされた変換ブロックサイズを適用するか否か、及び/又は、適用する方法は、ブロック高さがブロック幅の偶数倍であるかに依存し得る。
5.可逆コーディングが使用される場合、変換及び/又は量子化プロセスは、ビットシフトなしで適用され得る。
a.一つの例においては、シーケンス/ピクチャ/サブピクチャ/スライス/タイル群/タイル/ブリック/CTU行/CTU/CU/PU/TU/サブブロックレベルフラグが、ビットストリームの中へ追加され、現在ビデオユニットが可逆(lossless)コーディングによってコード化されているか否かを示すことができる。
i.一つの例において、可逆コーディングが使用される場合、現在ビデオユニットの対応する可逆フラグは、1に等しく設定され得る。
b.一つの例において、可逆コーディングが使用される場合、エンコーディングフレームが元のフレームとビット正確(bit-exact)である、逆変換が適用され得る。
i.一つの例において、可逆コード化ブロックに対する変換サイズは、M×N(例えば、M=N=4)に固定され得る。
ii.一つの例において、可逆コード化ブロックに対する変換コアは、ウォルシュ・アダマール変換(Walsh Hadamard Transform)であってよい。
iii.一つの例において、変換スキップは、可逆コード化ブロックに対して使用され得る。
c.一つの例においては、現在ビデオユニットに可逆コーディングが使用される場合、デコーディングされた係数を残差(例えばtsShift)に変換する際に使用されるスケール化係数は、1(例えば、スケール化なし)に設定され得る。
d.一つの例においては、現在ビデオユニットに可逆コーディングが使用される場合、逆変換のためのビットシフトの数は、0に等しくてよい(例えば、ビットシフトなし)。
e.一つの例においては、現在ビデオユニットに対して可逆コーディングが使用される場合、量子化パラメータは、N(N=4など、例えば、量子化なし)に設定され得る。
f.一つの例においては、現在ビデオユニットに対して可逆コーディングが使用される場合、逆量子化のためのビットシフトの数は、0に等しくてよい(例えば、ビットシフトなし)。
以下の変更、太字のイタリック体でマーク付けされているもの、および、括弧
{{ }}内に含まれる削除は、JVET-O2001-vEに基づいている。
Claims (13)
- ビデオデータを処理する方法であって、
ビデオの現在ブロックと、前記ビデオのビットストリームとの間の変換を実行するステップであり、前記変換は、
ルールに従って、現在ブロックのスケール化された変換係数を導出するために、前記現在ブロックの変換係数についてスケーリングプロセスを実行するステップであり、前記ルールは、前記現在ブロックがブロックベースの差分パルス符号変調(BDPCM)モードでコード化される場合に、前記スケーリングプロセスで使用されるビット深さシフト変数が、前記現在ブロックのサイズから独立していることを規定する、ステップ、を含み、
ビット深さオフセットおよび前記ビット深さシフト変数は、クリップ操作の前に、前記スケール化された変換係数を導出するために使用され、かつ、前記ビット深さオフセットは、前記ビット深さシフト変数に基づいて導出される、
方法。 - 前記ビット深さシフト変数bdShift1は、事前に定義されている、
請求項1に記載の方法。 - 前記ルールは、さらに、
前記スケール化された変換係数に対する変換プロセスが前記現在ブロックについてスキップされる場合に、前記スケーリングプロセスにおいて使用される前記ビット深さシフト変数が、前記現在ブロックのサイズから独立していること、
を規定する、
請求項1または2に記載の方法。 - 前記ブロックベースの差分パルス符号変調(BDPCM)モードでコード化されたブロックについて前記ビット深さシフト変数および前記ビット深さオフセットは、前記スケール化された変換係数について変換プロセスがスキップされる、ブロックに対する前記ビット深さシフト変数および前記ビット深さオフセットと同一である、
請求項1乃至3いずれか一項に記載の方法。 - 前記ルールは、さらに、
前記現在ブロックが前記ブロックベースの差分パルス符号変調(BDPCM)モードでコード化される場合に、前記現在ブロックの変換係数のためのスケーリングプロセスについて、明示的スケール化マトリクスがディセーブルされること、
を規定する、
請求項1乃至4いずれか一項に記載の方法。 - 前記現在ブロックの変換係数のスケーリングプロセスにおいて、フラットなスケール化マトリクスが使用される、
請求項1乃至5いずれか一項に記載の方法。 - 前記フラットなスケール化マトリクスの値は、16に等しい、
請求項6いずれか一項に記載の方法。 - 前記スケーリングプロセスは、スケール化動作または逆スケール化動作を含み、かつ、
前記変換プロセスは、転換動作または逆転換動作を含む、
請求項3に記載の方法。 - 前記変換は、前記現在ブロックを前記ビットストリームへとエンコーディングすることを含む、
請求項1乃至8いずれか一項に記載の方法。 - 前記変換は、前記ビットストリームから前記現在ブロックをデコーディングすることを含む、
請求項1乃至8いずれか一項に記載の方法。 - プロセッサと、命令を有する非一時メモリとを備える、ビデオデータを処理する装置であって、前記プロセッサによって前記命令が実行されると、前記プロセッサに、
ビデオの現在ブロックと、前記ビデオのビットストリームとの間の変換を実行させ、前記変換は、
ルールに従って、現在ブロックのスケール化された変換係数を導出するために、前記現在ブロックの変換係数についてスケーリングプロセスを実行するステップであり、前記ルールは、前記現在ブロックがブロックベースの差分パルス符号変調(BDPCM)モードでコード化される場合に、前記スケーリングプロセスで使用されるビット深さシフト変数が、前記現在ブロックのサイズから独立していることを規定する、ステップ、を含み、
ビット深さオフセットおよび前記ビット深さシフト変数は、クリップ操作の前に、前記スケール化された変換係数を導出するために使用され、かつ、前記ビット深さオフセットは、前記ビット深さシフト変数に基づいて導出される、
装置。 - 命令を保管している非一時的なコンピュータで読取り可能な記憶媒体であって、プロセッサに、
ビデオの現在ブロックと、前記ビデオのビットストリームとの間の変換を実行させ、前記変換は、
ルールに従って、現在ブロックのスケール化された変換係数を導出するために、前記現在ブロックの変換係数についてスケーリングプロセスを実行するステップであり、前記ルールは、前記現在ブロックがブロックベースの差分パルス符号変調(BDPCM)モードでコード化される場合に、前記スケーリングプロセスで使用されるビット深さシフト変数が、前記現在ブロックのサイズから独立していることを規定する、ステップ、を含み、
ビット深さオフセットおよび前記ビット深さシフト変数は、クリップ操作の前に、前記スケール化された変換係数を導出するために使用され、かつ、前記ビット深さオフセットは、前記ビット深さシフト変数に基づいて導出される、
コンピュータで読取り可能な記憶媒体。 - ビデオのビットストリームを保管する方法であって、前記方法は、
前記ビデオの現在ブロックから前記ビデオのビットストリームを生成するステップと、
前記ビットストリームを非一時的なコンピュータで読取り可能な記憶媒体に保管するステップと、を含み、
前記生成するステップは、
ルールに従って、現在ブロックのスケール化された変換係数を導出するために、前記現在ブロックの変換係数についてスケーリングプロセスを実行するステップであり、前記ルールは、前記現在ブロックがブロックベースの差分パルス符号変調(BDPCM)モードでコード化される場合に、前記スケーリングプロセスで使用されるビット深さシフト変数が、前記現在ブロックのサイズから独立していることを規定する、ステップ、を含み、
ビット深さオフセットおよび前記ビット深さシフト変数は、クリップ操作の前に、前記スケール化された変換係数を導出するために使用され、かつ、前記ビット深さオフセットは、前記ビット深さシフト変数に基づいて導出される、
方法。
Applications Claiming Priority (4)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CNPCT/CN2019/107140 | 2019-09-21 | ||
| CN2019107140 | 2019-09-21 | ||
| PCT/CN2020/115533 WO2021052355A1 (en) | 2019-09-21 | 2020-09-16 | High precision transform and quantization for image and video coding |
| JP2022517816A JP7323712B2 (ja) | 2019-09-21 | 2020-09-16 | 画像およびビデオコーディングのための高精度変換および量子化 |
Related Parent Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2022517816A Division JP7323712B2 (ja) | 2019-09-21 | 2020-09-16 | 画像およびビデオコーディングのための高精度変換および量子化 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2023153169A JP2023153169A (ja) | 2023-10-17 |
| JP7568375B2 true JP7568375B2 (ja) | 2024-10-16 |
Family
ID=74883161
Family Applications (2)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2022517816A Active JP7323712B2 (ja) | 2019-09-21 | 2020-09-16 | 画像およびビデオコーディングのための高精度変換および量子化 |
| JP2023122411A Active JP7568375B2 (ja) | 2019-09-21 | 2023-07-27 | 画像およびビデオコーディングのための高精度変換および量子化 |
Family Applications Before (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2022517816A Active JP7323712B2 (ja) | 2019-09-21 | 2020-09-16 | 画像およびビデオコーディングのための高精度変換および量子化 |
Country Status (6)
| Country | Link |
|---|---|
| US (2) | US11683500B2 (ja) |
| EP (1) | EP4018648A4 (ja) |
| JP (2) | JP7323712B2 (ja) |
| KR (1) | KR102661314B1 (ja) |
| CN (2) | CN117376550A (ja) |
| WO (1) | WO2021052355A1 (ja) |
Families Citing this family (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN114365490B (zh) | 2019-09-09 | 2024-06-18 | 北京字节跳动网络技术有限公司 | 高精度图像和视频编解码的系数缩放 |
| US20240121403A1 (en) * | 2021-02-03 | 2024-04-11 | Interdigital Vc Holdings France, Sas | Metadata for signaling information representative of an energy consumption of a decoding process |
| AU2021202142A1 (en) * | 2021-04-07 | 2022-10-27 | Canon Kabushiki Kaisha | Tool selection for feature map encoding vs regular video encoding |
| CN117203959A (zh) * | 2021-04-27 | 2023-12-08 | 抖音视界有限公司 | 用于视频处理的方法、设备和介质 |
| US12568224B2 (en) * | 2022-07-11 | 2026-03-03 | Samsung Electronics Co., Ltd. | EVC decoding complexity metrics |
| US20250113031A1 (en) * | 2023-09-29 | 2025-04-03 | Tencent America LLC | Adaptive quantization shifting offset for video and image compression |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2021045188A1 (ja) | 2019-09-06 | 2021-03-11 | ソニー株式会社 | 画像処理装置および方法 |
Family Cites Families (55)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN1225128C (zh) | 2003-12-31 | 2005-10-26 | 中国科学院计算技术研究所 | 直接编码模式下确定参考图像块的方法 |
| KR101144539B1 (ko) * | 2008-06-05 | 2012-05-14 | 한국전자통신연구원 | 스케일러블 비디오 코딩 비트스트림의 적응 변환 장치 및 그 방법 |
| KR101885258B1 (ko) * | 2010-05-14 | 2018-08-06 | 삼성전자주식회사 | 비디오 신호의 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치 |
| EP2679012B1 (en) | 2011-02-21 | 2015-08-26 | Dolby Laboratories Licensing Corporation | Floating point video coding |
| GB2492333B (en) | 2011-06-27 | 2018-12-12 | British Broadcasting Corp | Video encoding and decoding using transforms |
| GB2561487B (en) * | 2011-10-18 | 2019-01-02 | Kt Corp | Method for encoding image, method for decoding image, image encoder, and image decoder |
| US20130127987A1 (en) | 2011-11-18 | 2013-05-23 | Qualcomm Incorporated | Signaling depth ranges for three-dimensional video coding |
| US20130272390A1 (en) * | 2012-04-16 | 2013-10-17 | Qualcomm Incorporated | Uniform granularity for quantization matrix in video coding |
| DK2869557T3 (da) * | 2012-06-29 | 2023-11-06 | Electronics & Telecommunications Res Inst | Fremgangsmåde og anordning til kodning/afkodning af billeder |
| CN112969073A (zh) * | 2012-07-02 | 2021-06-15 | 韩国电子通信研究院 | 图像编码/解码方法和非暂时性计算机可读记录介质 |
| JP6401161B2 (ja) | 2012-08-06 | 2018-10-03 | ヴィド スケール インコーポレイテッド | マルチレイヤビデオコーディングにおける空間レイヤのためのサンプリンググリッド情報 |
| AU2012232992A1 (en) | 2012-09-28 | 2014-04-17 | Canon Kabushiki Kaisha | Method, apparatus and system for encoding and decoding the transform units of a coding unit |
| US20140286412A1 (en) * | 2013-03-25 | 2014-09-25 | Qualcomm Incorporated | Intra dc prediction for lossless coding in video coding |
| HK1222075A1 (zh) | 2013-09-20 | 2017-06-16 | Vid Scale, Inc. | 提供3d查找表編碼以用於色域可伸縮性的系統和方法 |
| EP3033878A4 (en) * | 2013-10-14 | 2017-04-05 | HFI Innovation Inc. | Method of residue differential pulse-code modulation for hevc range extension |
| US9571837B2 (en) | 2013-11-01 | 2017-02-14 | Broadcom Corporation | Color blending prevention in video coding |
| US10531116B2 (en) | 2014-01-09 | 2020-01-07 | Qualcomm Incorporated | Adaptive motion vector resolution signaling for video coding |
| US9877035B2 (en) * | 2014-03-17 | 2018-01-23 | Qualcomm Incorporated | Quantization processes for residue differential pulse code modulation |
| US10897629B2 (en) | 2014-06-19 | 2021-01-19 | Vid Scale, Inc. | Methods and systems for intra block copy search enhancement |
| JP2017522839A (ja) | 2014-06-20 | 2017-08-10 | シャープ株式会社 | 整合パレット符号化 |
| US20150373327A1 (en) * | 2014-06-20 | 2015-12-24 | Qualcomm Incorporated | Block adaptive color-space conversion coding |
| CN105706450B (zh) | 2014-06-23 | 2019-07-16 | 微软技术许可有限责任公司 | 根据基于散列的块匹配的结果的编码器决定 |
| US10412387B2 (en) | 2014-08-22 | 2019-09-10 | Qualcomm Incorporated | Unified intra-block copy and inter-prediction |
| WO2016081939A1 (en) | 2014-11-21 | 2016-05-26 | Vid Scale, Inc. | One-dimensional transform modes and coefficient scan order |
| US10368072B2 (en) | 2015-05-29 | 2019-07-30 | Qualcomm Incorporated | Advanced arithmetic coder |
| CN106331703B (zh) | 2015-07-03 | 2020-09-08 | 华为技术有限公司 | 视频编码和解码方法、视频编码和解码装置 |
| WO2017156669A1 (en) | 2016-03-14 | 2017-09-21 | Mediatek Singapore Pte. Ltd. | Methods for motion vector storage in video coding |
| US11758136B2 (en) * | 2016-06-24 | 2023-09-12 | Electronics And Telecommunications Research Institute | Method and apparatus for transform-based image encoding/decoding |
| US10462462B2 (en) | 2016-09-29 | 2019-10-29 | Qualcomm Incorporated | Motion vector difference coding technique for video coding |
| US11356693B2 (en) | 2016-09-29 | 2022-06-07 | Qualcomm Incorporated | Motion vector coding for video coding |
| US10616582B2 (en) | 2016-09-30 | 2020-04-07 | Qualcomm Incorporated | Memory and bandwidth reduction of stored data in image/video coding |
| US10979732B2 (en) | 2016-10-04 | 2021-04-13 | Qualcomm Incorporated | Adaptive motion vector precision for video coding |
| US10542280B2 (en) | 2017-01-09 | 2020-01-21 | QUALCOMM Incorpated | Encoding optimization with illumination compensation and integer motion vector restriction |
| CN107801024B (zh) | 2017-11-09 | 2019-07-12 | 北京大学深圳研究生院 | 一种用于帧内预测的边界滤波方法 |
| CN107896330B (zh) | 2017-11-29 | 2019-08-13 | 北京大学深圳研究生院 | 一种用于帧内和帧间预测的滤波方法 |
| CN107995489A (zh) | 2017-12-20 | 2018-05-04 | 北京大学深圳研究生院 | 一种用于p帧或b帧的帧内帧间组合预测方法 |
| US10567801B2 (en) * | 2018-03-07 | 2020-02-18 | Tencent America LLC | Method and apparatus for video coding with primary and secondary transforms |
| WO2019172798A1 (en) * | 2018-03-07 | 2019-09-12 | Huawei Technologies Co., Ltd. | Method and apparatus for residual sign prediction in transform domain |
| WO2019244055A1 (en) | 2018-06-19 | 2019-12-26 | Beijing Bytedance Network Technology Co., Ltd. | Mode dependent mvd precision set |
| EP3815376A1 (en) | 2018-07-02 | 2021-05-05 | Beijing Bytedance Network Technology Co. Ltd. | Luts with intra prediction modes and intra mode prediction from non-adjacent blocks |
| TWI735929B (zh) | 2018-08-04 | 2021-08-11 | 大陸商北京字節跳動網絡技術有限公司 | 更新的mv或推導的mv的裁剪 |
| CN118540472A (zh) | 2018-08-29 | 2024-08-23 | Vid拓展公司 | 视频编码和解码的方法和装置 |
| EP4325859A3 (en) | 2018-09-19 | 2024-05-15 | Beijing Bytedance Network Technology Co., Ltd. | Syntax reuse for affine mode with adaptive motion vector resolution |
| WO2020058961A1 (en) | 2018-09-23 | 2020-03-26 | Beijing Bytedance Network Technology Co., Ltd. | Modification of motion vector with adaptive motion vector resolution |
| PH12019000380A1 (en) | 2018-12-17 | 2020-09-28 | Nokia Technologies Oy | An apparatus, a method and a computer program for video coding and decoding |
| CN117499668A (zh) | 2018-12-21 | 2024-02-02 | 北京字节跳动网络技术有限公司 | 具有运动矢量差的Merge模式中的运动矢量精度 |
| CN113366839B (zh) | 2019-01-31 | 2024-01-12 | 北京字节跳动网络技术有限公司 | 视频编解码中的细化量化步骤 |
| WO2020156538A1 (en) | 2019-02-03 | 2020-08-06 | Beijing Bytedance Network Technology Co., Ltd. | Interaction between mv precisions and mv difference coding |
| KR20230157529A (ko) | 2019-04-01 | 2023-11-16 | 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 | 히스토리 기반 움직임 벡터 예측을 위한 보간 필터 사용 |
| JP7319386B2 (ja) | 2019-04-19 | 2023-08-01 | 北京字節跳動網絡技術有限公司 | 異なる動きベクトル微調整における勾配計算 |
| CN117714685A (zh) * | 2019-06-18 | 2024-03-15 | Lg 电子株式会社 | 图像解码方法和装置 |
| CN120956894A (zh) | 2019-07-19 | 2025-11-14 | 韦勒斯标准与技术协会公司 | 处理视频信号的方法和设备 |
| EP4000266A4 (en) * | 2019-08-20 | 2022-10-26 | Beijing Bytedance Network Technology Co., Ltd. | Residual coding for transform skipped blocks |
| US12010315B2 (en) * | 2019-08-31 | 2024-06-11 | Lg Electronics Inc. | Method for decoding video for residual coding and device therefor |
| CN114365490B (zh) | 2019-09-09 | 2024-06-18 | 北京字节跳动网络技术有限公司 | 高精度图像和视频编解码的系数缩放 |
-
2020
- 2020-09-16 CN CN202311551330.5A patent/CN117376550A/zh active Pending
- 2020-09-16 JP JP2022517816A patent/JP7323712B2/ja active Active
- 2020-09-16 EP EP20865940.9A patent/EP4018648A4/en active Pending
- 2020-09-16 CN CN202080066274.4A patent/CN114731392B/zh active Active
- 2020-09-16 WO PCT/CN2020/115533 patent/WO2021052355A1/en not_active Ceased
- 2020-09-16 KR KR1020227008042A patent/KR102661314B1/ko active Active
-
2022
- 2022-03-18 US US17/699,032 patent/US11683500B2/en active Active
-
2023
- 2023-06-02 US US18/328,548 patent/US20230308659A1/en active Pending
- 2023-07-27 JP JP2023122411A patent/JP7568375B2/ja active Active
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2021045188A1 (ja) | 2019-09-06 | 2021-03-11 | ソニー株式会社 | 画像処理装置および方法 |
Non-Patent Citations (4)
| Title |
|---|
| Benjamin Bross, Jianle Chen, and Shan Liu,Versatile Video Coding (Draft 6),Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11,JVET-O2001,15th Meeting: Gothenburg, SE,2019年07月31日,pp.151,282-285 |
| Hong-Jheng Jhu, et al.,Non-CE8: Quantization unification for palette escape and transform skip,Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11,JVET-P515-v2,16th Meeting: Geneva, CH,2019年10月,pp.1-9 |
| Jizheng Xu, et al.,Non-CE6: Transform skip with a fixed transform shift,Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11,JVET-P0538,16th Meeting: Geneva, CH,2019年09月,pp.1-7 |
| Takeshi Tsukuba, Masaru Ikeda, Yoichi Yagasaki, and Teruhiko Suzuki,On Scaling for Transform Skip,Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11,JVET-P0272-v1,16th Meeting: Geneva, CH,2019年09月,pp.1-8 |
Also Published As
| Publication number | Publication date |
|---|---|
| KR20220062518A (ko) | 2022-05-17 |
| KR102661314B1 (ko) | 2024-04-30 |
| CN114731392B (zh) | 2025-01-03 |
| JP2023153169A (ja) | 2023-10-17 |
| US20220232224A1 (en) | 2022-07-21 |
| US20230308659A1 (en) | 2023-09-28 |
| JP7323712B2 (ja) | 2023-08-08 |
| CN114731392A (zh) | 2022-07-08 |
| WO2021052355A1 (en) | 2021-03-25 |
| EP4018648A4 (en) | 2022-11-23 |
| BR112022005133A2 (pt) | 2022-10-11 |
| US11683500B2 (en) | 2023-06-20 |
| EP4018648A1 (en) | 2022-06-29 |
| CN117376550A (zh) | 2024-01-09 |
| JP2022549795A (ja) | 2022-11-29 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7514359B2 (ja) | ビデオ・データ処理方法、装置、記憶媒体及び記憶方法 | |
| JP7568375B2 (ja) | 画像およびビデオコーディングのための高精度変換および量子化 | |
| JP7680119B2 (ja) | ビデオ・データ処理方法、装置、及び記憶媒体 | |
| JP7623421B2 (ja) | 多重変換行列のコンテキストモデリングおよび選択 | |
| JP7509944B2 (ja) | コーディング映像における二次変換の使用 | |
| JP7684495B2 (ja) | ビデオ・データを処理する方法、装置、及び記憶媒体 | |
| CN114365490B (zh) | 高精度图像和视频编解码的系数缩放 | |
| CN114258680B (zh) | 经变换跳过的块的残差编解码 | |
| CN114270817B (zh) | 基于位置的系数缩放 | |
| CN113728631A (zh) | 帧内子块分割和多变换选择 | |
| CN113994679B (zh) | 关于上下文编解码二进制位的数量的限制 | |
| CN117296323A (zh) | 基于特征的变换选择 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230825 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240507 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240805 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240903 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20241001 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7568375 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |






















































