JP2023530630A - ビデオ符号化のための適応量子化器設計 - Google Patents
ビデオ符号化のための適応量子化器設計 Download PDFInfo
- Publication number
- JP2023530630A JP2023530630A JP2022576094A JP2022576094A JP2023530630A JP 2023530630 A JP2023530630 A JP 2023530630A JP 2022576094 A JP2022576094 A JP 2022576094A JP 2022576094 A JP2022576094 A JP 2022576094A JP 2023530630 A JP2023530630 A JP 2023530630A
- Authority
- JP
- Japan
- Prior art keywords
- quantization
- video
- adjustment
- transition point
- adjustment curve
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013461 design Methods 0.000 title description 15
- 230000003044 adaptive effect Effects 0.000 title description 11
- 238000013139 quantization Methods 0.000 claims abstract description 349
- 238000000034 method Methods 0.000 claims abstract description 92
- 230000007704 transition Effects 0.000 claims description 62
- 241000023320 Luma <angiosperm> Species 0.000 claims description 17
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 claims description 17
- 239000011159 matrix material Substances 0.000 claims description 16
- 238000009795 derivation Methods 0.000 claims description 12
- 230000003362 replicative effect Effects 0.000 claims 1
- 238000001914 filtration Methods 0.000 abstract description 17
- 238000007906 compression Methods 0.000 abstract description 6
- 230000006835 compression Effects 0.000 abstract description 6
- 230000011664 signaling Effects 0.000 description 21
- 239000013598 vector Substances 0.000 description 14
- 235000019580 granularity Nutrition 0.000 description 13
- 230000006870 function Effects 0.000 description 12
- 230000008569 process Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 9
- 238000013507 mapping Methods 0.000 description 8
- 239000000203 mixture Substances 0.000 description 7
- 238000009472 formulation Methods 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 230000001965 increasing effect Effects 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 238000005192 partition Methods 0.000 description 3
- 230000002123 temporal effect Effects 0.000 description 3
- 101100314364 Caenorhabditis elegans tpk-1 gene Proteins 0.000 description 2
- 238000007476 Maximum Likelihood Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 241000385654 Gymnothorax tile Species 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000013213 extrapolation Methods 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 235000019587 texture Nutrition 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
- H04N19/126—Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/174—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/186—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/80—Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
- H04N19/82—Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
Description
本出願は、2020年6月22日に出願された米国仮特許出願第63/042,451号を主張する、2021年2月8日に出願された米国仮特許出願第63/147,163号の米国特許法第119条(e)の下での利益を更に主張する、2021年4月19日に出願された米国特許出願第17/234,596号に対する優先権を主張するものであり、それらの内容は、その全体が参照により本明細書に組み込まれる。
AV1仕様では、量子化インデックス(q_idx)は、0~255(又は合計256)のデータ範囲を有する。より少ない量子化インデックス、例えば、色成分に対するビット深度精度の各増分ごとに6つの追加の量子化インデックスの増分で8ビットコンテンツに対してAVC/HEVC及びVVCそれぞれについて52及び64を有するMPEG4-AVC、HEVC、及びVVCなどのMPEGビデオ符号化規格に対して、AV1は、より精細な数のステップサイズ(256)を有することが観察される。しかしながら、AV1における量子化ステップサイズ(q_step)へのこれらのq_idxのマッピングは、図7に示されるように、AVC/HEVC又はVVCと比較してより低い勾配を有することが観察される。例えば、VVCでは、q_stepは、指数関数的に大きくなる(~pow(q_idx/6,2)、すなわち、6つのインデックスごとにサイズが2倍になる)。結果として、q_stepは、より高いq_idx値において比較的非常に大きく、はるかに低いビットレートとなる。対照的に、AV1ステップサイズは、より低いq_idxにおいてほぼ線形に変化し、より高いq_idxにおいて指数関数的に増加し、より高いq_idxにおいて比較的より小さいq_stepをもたらす。AV1はまた、図7に示されるように、AC係数及びDC係数についてq_idxからq_stepへの別個のマッピングを有することも注目に値する。
シンタックス要素「base_q_idx」は、ベースフレームq_idxを指定するためにシーケンス/フレームヘッダにおいて符号化される。base_q_idxは、8ビットで固定長符号化される。base_q_idxは、全てのAC係数に対するベースオフセットとして機能する。ルマAC係数以外の係数については、以下で説明するように、追加のデルタオフセットをビットストリームでシグナリングすることができる。Final_q_idxは、次のように計算される。
図1
図2
図3
図4
i=0の場合、operating_quant_step_size_table[k]=table_TIdxN0[k]であり、式中、kは、0からTP0-1までの範囲である。
(i>0)である場合、operating_quant_step_size_table[k]=operating_quant_step_size_table[global_transition_point]+table_TIdxNi[k-global_transition_point]であり、
式中、global_transition_point=0からi-1までの各TPiにおける全ての要素数の合計であり、kは、global_transition_pointからTPiまでの範囲である。
K=0である場合、
operating_quant_step_size_table[m]=weightN0*table_TIdxN0[regionStartN0+m]、式中、mは、0からTP0の範囲である。
(K>0)である場合、
operating_quant_step_size_table[m]=operating_quant_step_size_table[global_transition_point]+weightNk*table_TIdxNk[regionStartNk+m-global_transition_point]、式中、
global_transition_point=0からk-1までの全てのTPkの合計であり、mは、global_transition_pointからTPk-1までの範囲である。
K=0である場合、
operating_quant_step_size_table[m]=weightN0*table_TIdxN0[regionStartN0+m]、式中、mは、0からTP0の範囲である。
(K>0)である場合、
operating_quant_step_size_table[m]=weightNk*table_TIdxNk[regionStartNk+m-global_transition_point]、式中、
global_transition_point=0からk-1までの全てのTPkの合計であり、mは、global_transition_pointからTPk-1までの範囲である。
図5
図6
量子化調整テーブルの生成をサポートするための例示的なシンタックス
●planeが0に等しい場合、dc_q(get_qindex(0,segment_id)+DeltaQYDc)を返す。
●さもなければ、planeが1に等しい場合、dc_q(get_qindex(0,segment_id)+DeltaQUDc)を返す。
●そうでない場合(planeが2に等しい)、dc_q(get_qindex(0,segment_id)+DeltaQVDc)を返す。
●planeが0に等しい場合、ac_q(get_qindex(0,segment_id))を返す。
●さもなければ、planeが1に等しい場合、ac_q(get_qindex(0,segment_id)+DeltaQUAc)を返す。
●そうでない場合(planeが2に等しい)、ac_q(get_qindex(0,segment_id)+DeltaQVAc)を返す。
関数get_qindex(ignoreDeltaQ,segmentId)は、現在のブロックの量子化器インデックス、例えば、更なる説明で使用される「q_Idx」を返すことができる。
1に等しいseparate_Ydc_q_paramsは、ルマDC量子化テーブルパラメータが別々に符号化されることを示す。0に等しいseparate_Ydc_q_paramsは、別個のルマDC量子化テーブルパラメータがシグナリングされず、ルマAC量子化テーブルパラメータから導出されないことを示す。存在しない場合、その値は0であると仮定される。
1に等しいdifferent_chroma_quant_paramは、クロマ(U及びV)量子化テーブルパラメータが別々に符号化されることを示す。0に等しいdifferent_chroma_quant_paramは、別個のクロマ(U及びV)量子化テーブルパラメータがシグナリングされず、ルマ量子化テーブルパラメータから導出されないことを示す。存在しない場合、その値は0であると仮定される。
1に等しいseparate_uv_quant_paramは、クロマU成分及びクロマV成分の量子化テーブルパラメータが別々に符号化されることを示す。0に等しいseparate_uv_quant_paramは、クロマU成分及びクロマV成分の量子化テーブルパラメータがシグナリングされず、共有されないことを示す。存在しない場合、その値は0であると仮定される。
1に等しいseparate_Udc_q_paramsは、クロマU DC成分の量子化テーブルパラメータが別々に符号化されることを示す。0に等しいseparate_Udc_q_paramsは、クロマU DC成分の量子化テーブルパラメータが別々に符号化されず、クロマU AC成分と共有されないことを示す。存在しない場合、その値は0であると仮定される。
1に等しいseparate_Vdc_q_paramsは、クロマV DC成分の量子化テーブルパラメータが別々に符号化されることを示す。0に等しいseparate_Vdc_q_paramsは、クロマV DC成分の量子化テーブルパラメータが別々に符号化されず、クロマV AC成分と共有されないことを示す。存在しない場合、その値は0であると仮定される。
1に等しいseparate_UVdc_q_paramsは、クロマU及びクロマV DC成分の量子化テーブルパラメータが別々に符号化されることを示す。0に等しいseparate_UVdc_q_paramsは、クロマU及びクロマV DC成分の量子化テーブルパラメータが別々に符号化されず、クロマU AC成分と共有されないことを示す。存在しない場合、その値は0であると仮定される。
typeは、以下のマッピングに従ったビデオコンテンツを表す:0のタイプ値は、ルマACであり、1は、ルマDCであり、2は、クロマU ACであり、3は、クロマV ACであり、4は、クロマV ACであり、5は、クロマV DCである。
num_pivot points[type]は、特定のタイプの量子化ステップサイズテーブルを導出するために合計で使用されるピボットポイントの数を指定する。
TableIdx[type][idx]は、特定のタイプの量子化ステップサイズテーブル及びピボットポイントインデックスを導出するために使用される量子化ステップサイズテンプレートインデックスを指定する。
transition_point[type][idx]は、特定のタイプの量子化ステップサイズテーブル及びピボットポイントインデックスを導出するための遷移点インデックスを指定する。
1に等しいweights_appliedは、特定のタイプの量子化ステップサイズテーブル及びピボットポイントインデックスを導出するために重みが適用される場合を示す。0に等しいweights_appliedは、重みが1に等しいと推測されることを示す。存在しない場合、weights_appliedの値は、0に等しい。
weightNrIdxは、特定のタイプの量子化ステップサイズテーブル及びピボットポイントインデックスを導出するために使用される重み分子値を指定する。
weightDrIdxは、特定のタイプの量子化ステップサイズテーブル及びピボットポイントインデックスを導出するために使用される重み分母値を指定する。
1に等しいnon_zero_idx_enabledは、量子化ステップサイズテンプレート内のフレキシブル開始領域が有効化されていることを示す。0に等しいnon_zero_idx_enabledは、量子化ステップサイズテンプレート内のフレキシブル開始領域が有効化されておらず、regionStartIdxが0であると推測されることを示す。存在しない場合、non_zero_idx_enabledは、0であると推測される。
regionStartIdxは、特定のタイプの量子化ステップサイズテーブル及びピボットポイントインデックスを導出するために使用される特定の量子化ステップサイズテーブルテンプレート内の開始インデックスを指定する。
量子化調整曲線の動的生成
a.qStep_mode=0は、デフォルト量子化調整曲線のセットが予め決定され、固定されていることを示すことができる。この場合、所定の量子化調整曲線を構築するために、圧縮されたビットストリームで更なる情報がシグナリングされる必要はなく、したがって、量子化ステップモードパラメータは、必要とされなくてもよい。
b.qStep_mode=1は、長さが所定の関係によって互いに関係付けられている識別された数の間隔で量子化調整曲線が生成されることを示すことができる。例えば、間隔は、利用可能な数の量子化インデックス(qidx)にわたって2のべき乗関係(例えば、8、8*20、8*21、8*23)に従って増加する長さを有するように定義することができる。量子化調整値は、様々な手段に従って各間隔内で生成することができる。一例では、デフォルトテーブルに所定の量子化調整値を提供することができ、テーブル値は、各間隔の長さに従ってテーブル値をスケーリングして、先行する間隔の最高量子化調整値に従ってオフセットを適用することによって、各間隔にわたって拡張することができる。デフォルトテーブルは、指数関数的に増加するプロファイルによるなどの、所望のプロファイルに従ってインデックス値によって増加する量子化調整値を含むことができる。代替的に、デフォルトテーブルは、インデックス値によって線形に増加する量子化調整値を含むことができる。この例では、量子化ステップモードパラメータは、曲線の数(NumTransistionInterval_minus1)と、各曲線を指定するテーブル内の量子化ステップエントリの数(numOstepsinInterval)とを含むことができる。
c.qStep_mode=2は、第1の量子化調整曲線がシグナリングされ、他の量子化調整曲線は、シグナリングされた第1の曲線を複製することによって生成されることを示すことができる。この例では、量子化ステップモードパラメータは、シグナリングされた第1の曲線を定義するテーブル内の量子化ステップサイズエントリの数と、シグナリングされた第1の曲線を定義するテーブル内の各エントリの量子化ステップサイズ値とを含むことができる。
d.qStep_mode=3は、各量子化調整曲線が明示的にシグナリングされることを示すことができる。例えば、各曲線は、テーブルによって定義することができ、各テーブルは、シグナリングすることができる。この例では、量子化ステップモードパラメータは、テーブルの数を含むことができ、次いで、各テーブルについて、各テーブル内の量子化ステップサイズのリストとともに、そのテーブル内のエントリの数を含むことができる。
a.遷移間隔タイプ:間隔ウィンドウは、曲線のセグメントと見なすることができる。固定及び可変のいずれかである間隔ウィンドウを有することが有益であり得る。可変量子化モード選択方式は、符号化システムに柔軟性を提供する。
b.遷移間隔にわたる対称性:一実装形態では、Qステップは、各間隔の後に2倍になり得る(例えば、N番目の間隔のQステップは、N-1番目の間隔からの対応するQステップの2倍である)。可変量子化モード選択方式は、符号器と復号器との間でQステップ情報を交換するために暗黙的なシグナリングを提供し、それを活用し、それによって、そのようなシステムにおける符号化効率を高めることができる。
c.間隔長の指数関数的(特に2のべき乗)導出:一実装形態では、例えば、間隔長は、各間隔の後に2倍になり得る(例えば、N番目の間隔の長さは、N-1番目の間隔の2倍である)。可変量子化モード選択方式は、符号器と復号器との間で間隔情報を交換するために暗黙的なシグナリングを提供し、それを活用し、更に、そのようなシステムにおける符号化効率を高めることができる。
qStep_mode=0
NumTransitionInterval_minus1 -この値プラス1は、間隔内のqstepの数がシグナリングされる、256のQstep範囲内の間隔の数を指定する。
NumQstepsInInterval[i] -「i」番目の遷移間隔内のqStep点の数。
「i」番目の遷移間隔についてNumQstepsInIntervalがシグナリングされないとき、NumQstepsInIntervalは、32に等しいと推測される。
遷移の値NumQstepsInInterval[NumTransitionInterval_minus1]は、256-(NumQstepsInInterval[0]からNumQstepsInInterval[NumTransitionInterval_minus1]までの合計)であると推測される。
多くの場合、実際には、NumQstepsInInterval[0-NumTransitionInterval_minus1]の合計は、256未満である。
qStep_mode=1の一態様では、numQstepsInIntervalは、可変長コードを用いて前の間隔からデルタ符号化することができ、Initial_qIdx_factorの値は、いくつかの実装形態ではビットストリームでシグナリングすることができる。
qStep_mode=2
K=0である場合、
量子化調整曲線の代替セット及び予測
a.グローバルパラメータセット(例えば、シーケンスヘッダ)からのコピーを指定するためのフラグ。このフラグが有効にされている場合、パラメータは、グローバルパラメータセットからコピーすることによって導出される。
b.(a)においてフラグが無効にされている場合、特定のタイルヘッダから(例えば、現在と同じタイルIDを有する時間ピクチャのタイルヘッダから)コピーするために、別のフラグをシグナリングすることができる。
要約すると、現在のヘッダ(例えば、タイル)について、どこから情報をコピーすることができるかを指定するために、それをシグナリングすることができる。
改善された量子化器に基づく符号化拡張
J=歪み+ラムダ*レート
式中、歪みは、符号化された信号が元の入力とどれだけ異なるかを示すことができる品質の任意のメトリックであってもよく、例えば、絶対値の和又は二乗差として計算することができ、レートは、現在最適化されている対応する情報を符号化するために必要なビット数の実際の値又は近似値のいずれかを示す。変数ラムダは、より低い歪み又はより低いレートのいずれかに向かう決定プロセスの選好をもたらす制御パラメータである。そのような最適化では、ラグランジュコストJを使用して複数の代替符号化モード又はパラメータが評価され、そのようなコストが通常は最小になるものが符号化モードとして選択される。モデルは、復号の複雑さ/電力のコスト、パケット損失によるコスト推定値、後処理による品質などの、追加のコストパラメータをサポートするように拡張することができる。
ラムダ=アルファ*2^((q_idx-12)/3)
ラムダ=アルファ*f(q_step)
AVC及びHEVCでは、q_stepは、次の形式である。
Claims (22)
- 量子化方法であって、
符号化されたビデオデータを表すデータストリームでシグナリングされる遷移点データであって、前記遷移点データが、新しい量子化調整曲線の導出に使用されることになるデフォルト調整曲線の要素を識別する、遷移点データから、前記新しい量子化調整曲線を導出することと、
処理されることになるビデオの要素について、処理されることになるビデオの前記要素に関連付けられたインデックス値に従って、前記新しい量子化調整曲線から量子化調整値を導出することと、
前記量子化調整値から量子化パラメータを導出することと、
量子化動作において、前記量子化パラメータをビデオの前記要素に適用することと、
を含む、方法。 - 前記遷移点データが、デフォルト調整曲線を識別するテーブルインデックスと、前記新しい量子化調整曲線の導出に使用される前記テーブルへのインデックスの範囲と、を含む、請求項1に記載の方法。
- 前記遷移点データが、前記新しい量子化調整曲線の導出のためにデフォルト調整曲線の前記要素に適用されるスケーリングを識別するスケーリング値を含む、請求項1に記載の方法。
- 前記量子化動作が、ビデオ符号器によって実行される変換係数の量子化である、請求項1に記載の方法。
- 前記量子化動作が、ビデオ復号器によって実行される変換係数の逆量子化である、請求項1に記載の方法。
- 前記曲線に沿った各インデックス位置における前記新しい量子化調整曲線が、変換係数の個別の行列に適用される量子化調整の量子化行列を表す、請求項1に記載の方法。
- 前記デフォルト調整曲線がそれぞれ、量子化ステップサイズのテーブルによって表され、
前記遷移点データが、前記テーブルのうちのどれが前記テーブルへのインデックスのどの範囲にわたって前記新しい量子化調整曲線に寄与するかを示す、前記テーブル間の遷移を定義し、
前記量子化調整値が、前記インデックス値の前記遷移点データによって選択された前記テーブルの前記量子化ステップサイズのエントリから導出される、
請求項1に記載の方法。 - 前記データストリームの異なる部分に対して遷移点データの異なるセットが存在し、前記データストリームの前記異なる部分の各々に対して新しい量子化調整曲線が導出される、請求項1に記載の方法。
- 前記異なる部分が、AC係数及びDC係数である、請求項8に記載の方法。
- 前記異なる部分が、ルマ係数及びクロマ係数である、請求項8に記載の方法。
- 前記異なる部分が、Iフレーム、Pフレーム、及びBフレームである、請求項8に記載の方法。
- 遷移点データの後のセットが、遷移点データの前のセットから予測される、請求項8に記載の方法。
- 前記遷移点データが、選択された量子化ステップモードと、前記選択された量子化ステップモードの選択されたパラメータと、を含む、請求項1に記載の方法。
- 前記量子化調整値に基づいてフィルタ強度を導出することと、
前記導出されたフィルタ強度でインループフィルタをビデオの前記要素に適用することと、
を更に含む、請求項1に記載の方法。 - 量子化方法であって、
量子化ステップモードと、符号化されたビデオデータを表すデータストリームでシグナリングされた前記選択された量子化ステップモードの任意の関連付けられたモードパラメータとから新しい量子化調整曲線を導出することと、
処理されることになるビデオの要素について、処理されることになるビデオの前記要素に関連付けられたインデックス値に従って、前記新しい量子化調整曲線から量子化調整値を導出することと、
前記量子化調整値から量子化パラメータを導出することと、
量子化動作において、前記量子化パラメータをビデオの前記要素に適用することと、
を含む、方法。 - 前記選択された量子化ステップモードが、既定のモードであり、モードパラメータが、前記選択された量子化ステップモードに関連付けられていない、請求項15に記載の方法。
- 前記選択された量子化ステップモードが、直前の量子化調整曲線から2倍の勾配を有する線形量子化調整曲線を含む、請求項15に記載の方法。
- 前記選択された量子化ステップモードが、1つの量子化調整曲線を指定する関連付けられたパラメータを含み、サブシーケンス量子化調整曲線が、前記1つの量子化調整曲線を複製することによって決定される、請求項15に記載の方法。
- 前記選択された量子化ステップモードが、各量子化調整曲線に対する量子化ステップサイズのテーブルを定義する関連付けられたパラメータを含む、請求項15に記載の方法。
- 前記量子化調整値に基づいてフィルタ強度を導出することと、
前記導出されたフィルタ強度でインループフィルタをビデオの前記要素に適用することと、
を更に含む、請求項15に記載の方法。 - 符号化システムであって、
量子化パラメータをビデオの要素に適用する量子化器と、
前記量子化器を制御するコントローラと、
命令を記憶するメモリと、
を備え、前記命令が、前記コントローラによって実行されると、
符号化されたビデオデータを表すデータストリームでシグナリングされる遷移点データであって、前記遷移点データが、新しい量子化調整曲線の導出に使用されることになるデフォルト調整曲線の要素を識別する、遷移点データから、前記新しい量子化調整曲線を導出させ、
処理されることになるビデオの前記要素について、処理されることになるビデオの前記要素に関連付けられたインデックス値に従って、前記新しい量子化調整曲線から量子化調整値を導出させ、
前記量子化調整値から前記量子化パラメータを導出させる、
符号化システム。 - 命令を記憶する非一時的記憶媒体であって、前記命令が、プロセッサ上で実行されると、
量子化ステップモードと、符号化されたビデオデータを表すデータストリームでシグナリングされた前記選択された量子化ステップモードの任意の関連付けられたモードパラメータとから新しい量子化調整曲線を導出させ、
処理されることになるビデオの要素について、処理されることになるビデオの前記要素に関連付けられたインデックス値に従って、前記新しい量子化調整曲線から量子化調整値を導出させ、
前記量子化調整値から量子化パラメータを導出させ、
量子化動作において、前記量子化パラメータをビデオの前記要素に適用させる、
非一時的記憶媒体。
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063042451P | 2020-06-22 | 2020-06-22 | |
US63/042,451 | 2020-06-22 | ||
US202163147163P | 2021-02-08 | 2021-02-08 | |
US63/147,163 | 2021-02-08 | ||
US17/234,596 US11979572B2 (en) | 2020-06-22 | 2021-04-19 | Adaptive quantizer design for video coding |
US17/234,596 | 2021-04-19 | ||
PCT/US2021/035879 WO2021262419A1 (en) | 2020-06-22 | 2021-06-04 | Adaptive quantizer design for video coding |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023530630A true JP2023530630A (ja) | 2023-07-19 |
Family
ID=79022184
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022576094A Pending JP2023530630A (ja) | 2020-06-22 | 2021-06-04 | ビデオ符号化のための適応量子化器設計 |
Country Status (5)
Country | Link |
---|---|
US (1) | US11979572B2 (ja) |
EP (1) | EP4169250A1 (ja) |
JP (1) | JP2023530630A (ja) |
CN (1) | CN115868160A (ja) |
WO (1) | WO2021262419A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US12100185B2 (en) * | 2021-06-18 | 2024-09-24 | Tencent America LLC | Non-linear quantization with substitution in neural image compression |
US11909975B2 (en) * | 2021-06-18 | 2024-02-20 | Tencent America LLC | Dependent scalar quantization with substitution in neural image compression |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3858528B2 (ja) * | 1999-08-17 | 2006-12-13 | 株式会社ニコン | 電子カメラ、および画像処理プログラムを記録した記録媒体 |
US9001889B2 (en) * | 2009-05-16 | 2015-04-07 | Thomson Licensing | Methods and apparatus for improved quantization rounding offset adjustment for video encoding and decoding |
US9854275B2 (en) * | 2011-06-25 | 2017-12-26 | Qualcomm Incorporated | Quantization in video coding |
US9510020B2 (en) * | 2011-10-20 | 2016-11-29 | Qualcomm Incorporated | Intra pulse code modulation (IPCM) and lossless coding mode deblocking for video coding |
US9414054B2 (en) | 2012-07-02 | 2016-08-09 | Microsoft Technology Licensing, Llc | Control and use of chroma quantization parameter values |
US10091507B2 (en) * | 2014-03-10 | 2018-10-02 | Euclid Discoveries, Llc | Perceptual optimization for model-based video encoding |
WO2020243206A1 (en) * | 2019-05-28 | 2020-12-03 | Dolby Laboratories Licensing Corporation | Quantization parameter signaling |
-
2021
- 2021-04-19 US US17/234,596 patent/US11979572B2/en active Active
- 2021-06-04 JP JP2022576094A patent/JP2023530630A/ja active Pending
- 2021-06-04 CN CN202180041364.2A patent/CN115868160A/zh active Pending
- 2021-06-04 EP EP21736430.6A patent/EP4169250A1/en active Pending
- 2021-06-04 WO PCT/US2021/035879 patent/WO2021262419A1/en unknown
Also Published As
Publication number | Publication date |
---|---|
US11979572B2 (en) | 2024-05-07 |
US20210400273A1 (en) | 2021-12-23 |
CN115868160A (zh) | 2023-03-28 |
EP4169250A1 (en) | 2023-04-26 |
WO2021262419A1 (en) | 2021-12-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11363264B2 (en) | Sample adaptive offset control | |
KR102412271B1 (ko) | 인루프 필터링을 적용한 예측 방법을 이용한 영상 부호화/복호화 방법 및 장치 | |
CN108605127B (zh) | 滤波视频数据的经解码块的方法和装置及存储介质 | |
US8331449B2 (en) | Fast encoding method and system using adaptive intra prediction | |
RU2543552C2 (ru) | Фильтр с внутренним сглаживанием для кодирования видео | |
US9300967B2 (en) | Sample adaptive offset control | |
JP5204269B2 (ja) | ビデオ・コーデック量子化のための方法および装置 | |
KR101538704B1 (ko) | 보간 필터를 적응적으로 사용하여 영상을 부호화 및 복호화하는 방법 및 장치 | |
JP2020018024A (ja) | ビデオ符号化方法、ビデオ復号方法、ビデオエンコーダ、及びビデオデコーダ | |
KR101641808B1 (ko) | 비디오 코딩에서 적응 루프 필터 및 샘플 적응 오프셋에 대한 최대 코딩 유닛 (lcu) 또는 파티션-기반 신택스 | |
JP2021036676A (ja) | ビデオ符号化/復号化システムのための多次元量子化技術 | |
KR20130045151A (ko) | 복원 블록을 생성하는 방법 및 장치 | |
JP2023530630A (ja) | ビデオ符号化のための適応量子化器設計 | |
JP2006054902A (ja) | 画像符号化方法 | |
CN114930844A (zh) | 用于视频编解码的残差和系数编解码 | |
WO2023138562A1 (zh) | 图像解码方法、图像编码方法及相应的装置 | |
CN116137658A (zh) | 视频编码方法及装置 | |
US20240040120A1 (en) | Incremental transform set construction and transform signaling for video coding | |
US20240129461A1 (en) | Systems and methods for cross-component sample offset filter information signaling | |
JP2024120052A (ja) | 4:4:4色差フォーマットにおけるビデオコーディングの方法及び装置 | |
CN118715777A (zh) | 采用由直接mv投影(dmvp)生成的虚拟参考帧的预测视频编码 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221209 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240131 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240221 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20240521 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20240722 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240821 |