JP7383808B2 - ビデオコーディング及び復号のための高レベルシンタックス - Google Patents
ビデオコーディング及び復号のための高レベルシンタックス Download PDFInfo
- Publication number
- JP7383808B2 JP7383808B2 JP2022524729A JP2022524729A JP7383808B2 JP 7383808 B2 JP7383808 B2 JP 7383808B2 JP 2022524729 A JP2022524729 A JP 2022524729A JP 2022524729 A JP2022524729 A JP 2022524729A JP 7383808 B2 JP7383808 B2 JP 7383808B2
- Authority
- JP
- Japan
- Prior art keywords
- lmcs
- slice
- aps
- picture
- decoding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 claims description 83
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 claims description 67
- 241000023320 Luma <angiosperm> Species 0.000 claims description 61
- 238000013507 mapping Methods 0.000 claims description 33
- 230000003044 adaptive effect Effects 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 8
- 230000006978 adaptation Effects 0.000 claims description 3
- 238000004891 communication Methods 0.000 description 38
- 230000008569 process Effects 0.000 description 26
- 239000013598 vector Substances 0.000 description 25
- 238000012545 processing Methods 0.000 description 15
- 238000010586 diagram Methods 0.000 description 13
- 238000001914 filtration Methods 0.000 description 12
- 230000015654 memory Effects 0.000 description 12
- 238000000605 extraction Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 11
- 238000013139 quantization Methods 0.000 description 11
- 208000031212 Autoimmune polyendocrinopathy Diseases 0.000 description 9
- 230000002123 temporal effect Effects 0.000 description 9
- 239000011159 matrix material Substances 0.000 description 8
- 230000001419 dependent effect Effects 0.000 description 7
- 235000019395 ammonium persulphate Nutrition 0.000 description 6
- 238000000261 appearance potential spectroscopy Methods 0.000 description 6
- 239000000284 extract Substances 0.000 description 6
- 101150039623 Clip1 gene Proteins 0.000 description 5
- 230000008901 benefit Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 5
- 230000002829 reductive effect Effects 0.000 description 5
- 230000009466 transformation Effects 0.000 description 5
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 4
- 238000007906 compression Methods 0.000 description 4
- 230000006835 compression Effects 0.000 description 4
- 238000005538 encapsulation Methods 0.000 description 4
- 230000036961 partial effect Effects 0.000 description 4
- 238000005192 partition Methods 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 230000006872 improvement Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 108091000069 Cystinyl Aminopeptidase Proteins 0.000 description 1
- 102100020872 Leucyl-cystinyl aminopeptidase Human genes 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000009849 deactivation Effects 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 229910044991 metal oxide Inorganic materials 0.000 description 1
- 150000004706 metal oxides Chemical class 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000000153 supplemental effect Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/117—Filters, e.g. for pre-processing or post-processing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/174—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/184—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
-CPUで示される、マイクロプロセッサなどの中央処理装置311
-本発明を実施するためのコンピュータプログラムを格納するためのROMと表記される読み出し専用メモリ306
-本発明の実施形態の方法の実行可能コード、ならびにデジタル画像のシーケンスを符号化する方法および/または本発明の実施形態によるビットストリームを復号する方法を実施するために必要な変数およびパラメータを記録するように適合されたレジスタを格納する、RAMで示されるランダムアクセスメモリ312
-処理されるデジタルデータが送信または受信される通信ネットワーク303に接続された通信インターフェース302
に接続された通信バス313を備える。
-本発明の1つ以上の実施形態の方法を実施するためのコンピュータプログラム、および本発明の1つ以上の実施形態の実施中に使用または生成されるデータを格納するための、ハードディスクなどのデータ記憶手段304
-ディスク306のためのディスクドライブ305であり、ディスクドライブは、ディスク306からデータを読み取るか、または前記ディスクにデータを書き込むように適合されている
-キーボード310または他の任意のポインティング手段によって、ユーザとのグラフィカルインターフェースとして機能するおよび/またはデータを表示するスクリーン309
表1 シンタックスAUD
表2 pic_typeの解釈
NALユニットスライスレイヤは表3に示すように、スライスヘッダとスライスデータとを含む。
適応パラメータセット(APS)NALユニット605は、シンタックス要素を示す表4において定義される。
・ ALF_AP: ALFパラメータの場合
・ LMCSパラメータのLMCS_APS
・ スケーリングリスト相対パラメータのSCALING_APS
表4 適応パラメータセットシンタックス
ALFパラメータは、適応ループフィルタデータシンタックス要素(表5)に記載されている。先ず、ALFフィルタがルマおよび/またはクロマのために送信されるかどうかを指定するために、2つのフラグが使用される。ルマフィルタフラグが有効な場合、クリップ値が通知されているかどうかを知るために別のフラグが復号される(alf_luma_clip_flag)。次に、通知されるフィルタの数は、alf_luma_num_filters_signalled_minus1シンタックス要素を使用して復号される。必要に応じて、ALF係数デルタ”alf_luma_coeff_delta_idx”を表すシンタックス要素が、有効なフィルタごとに復号される。そして、各フィルタの係数毎に絶対値と符号を復号する。
以下の表6に、aps_params_typeパラメータが1(LMCS_APS)に設定されている場合に、適応パラメータセット(APS)シンタックス構造でコーディングされるすべてのLMCSシンタックス要素を示す。4つまでのLMCS APSは、符号化されたビデオシーケンスにおいて使用されることができるが、単一のLMCS APSのみが、所与のピクチャに対して使用されることができる。
スケーリングリストは、量子化に使用される量子化マトリクスを更新する可能性を提供する。VVCでは、このスケーリングマトリクスがスケーリングリストデータシンタックス要素(表7)に記載されているように、APS内のsである。このシンタックスは、フラグscaling_matrix_for_lfnst_disabled_flagに基づいてLFNST(Low Frequency Non-Separable Transform)ツールにスケーリングマトリクスを使用するかどうかを指定する。次に、スケーリングマトリクスを構築するために必要なシンタックス要素が復号される(scaling_list_copy_mode_flag、scaling_list_pred_mode_flag、scaling_list_pred_id_delta、scaling_list_dc_coef、scaling_list_delta_coef)。
ピクチャヘッダは、各ピクチャの先頭で送信される。ピクチャヘッダテーブルシンタックスには現在、82のシンタックス要素と、約60のテスト条件またはループが含まれている。これは、標準の以前の草案における以前のヘッダと比較して非常に大きい。これらすべてのパラメータの完全な説明は、JVET_P2001-VEにある。表8は、現在のピクチャヘッダ復号シンタックスにおけるこれらのパラメータを示している。この簡略化されたテーブルバージョンでは、読みやすくするためにいくつかのシンタックス要素がグループ化されている。
・ このピクチャ、参照フレーム、またはそわないの使用
・ 出力フレーム
・ 必要に応じてサブピクチャの使用
・ 必要に応じて参照ピクチャリスト
・ 必要に応じて色平面
・ オーバライドフラグが有効な場合の分割更新
・ 必要に応じてデルタQPパラメータ
・ 必要に応じて動き情報パラメータ
・ 必要に応じてALFパラメータ
・ 必要に応じてSAOパラメータ
・ 必要に応じて量子化パラメータ
・ 必要に応じてLMCSパラメータ
・ 必要に応じてスケーリングリストパラメータ
・ 必要に応じてピクチャヘッダ拡張
固定長の最初の3つのフラグは、ビットストリーム内のピクチャ特性に関連する情報を与えるnon_reference_picture_flag、gdr_pic_flag、no_output_of_prior_pics_flagである。
・ ph_pic_parameter_set_id
・ ph_poc_msb_present_flag
・ poc_msb_val
サブピクチャパラメータSubpic_parameter()は、SPSで有効になっている場合、およびサブピクチャid通知が無効になっている場合に有効になる。それはまた、仮想境界に関するいくつかの情報を含む。サブピクチャパラメータに対して、8つのシンタックス要素が定義される。
・ ph_subpic_id_signalling_present_flag
・ ph_subpic_id_len_minus1
・ ph_subpic_id
・ ph_loop_filter_across_virtual_boundaries_disabled_present_flag
・ ph_num_ver_virtual_boundaries
・ ph_virtual_boundaries_pos_x
・ ph_num_hor_virtual_boundaries
・ ph_virtual_boundaries_pos_y
次に、シーケンスが別々のカラープレーンを含む場合は、カラープレーンid”colour_plane_id”が復号され、存在する場合は、その後にpic_output_flagが続く。
・ pic_rpl_present_flag
・ pic_rpl_sps_flag
・ pic_rpl_idx
・ pic_poc_lsb_lt
・ pic_delta_poc_msb_present_flag
・ pic_delta_poc_msb_cycle_lt
必要に応じて、他の8つのシンタックス要素を含む参照ピクチャリスト構造”ref_pic_list_struct”に関連するシンタックス要素の別のグループも復号できる。
・ partition_constraints_override_flag
・ pic_log2_diff_min_qt_min_cb_intra_slice_luma
・ pic_log2_diff_min_qt_min_cb_inter_slice
・ pic_max_mtt_hierarchy_depth_inter_slice
・ pic_max_mtt_hierarchy_depth_intra_slice_luma
・ pic_log2_diff_max_bt_min_qt_intra_slice_luma
・ pic_log2_diff_max_tt_min_qt_intra_slice_luma
・ pic_log2_diff_max_bt_min_qt_inter_slice
・ pic_log2_diff_max_tt_min_qt_inter_slice
・ pic_log2_diff_min_qt_min_cb_intra_slice_chroma
・ pic_max_mtt_hierarchy_depth_intra_slice_chroma
・ pic_log2_diff_max_bt_min_qt_intra_slice_chroma
・ pic_log2_diff_max_tt_min_qt_intra_slice_chroma
これらの分割パラメータの後、4つのデルタQPシンタックス要素”Delta_QP_Parameters()”は、必要に応じて復号される可能性がある。
・ pic_cu_qp_delta_subdiv_intra_slice
・ pic_cu_qp_delta_subdiv_inter_slice
・ pic_cu_chroma_qp_offset_subdiv_intra_slice
・ pic_cu_chroma_qp_offset_subdiv_inter_slice
pic_joint_cbcr_sign_flagは、必要に応じて復号され、その後に3つのSAOシンタックス要素”SAO_parameters()”のセットが続く。
・ pic_sao_enabled_present_flag
・ pic_sao_luma_enabled_flag
・ pic_sao_chroma_enabled_flag
次に、ALFがSPSレベルで有効になっている場合、ALF APS idシンタックス要素のセットが復号される。
・ pic_dep_quant_enabled_flag
・ sign_data_hiding_enabled_flag
3つのデブロッキングフィルタシンタックス要素のセット”deblocking_filter_parameters()”は、必要に応じて復号される。
・ pic_deblocking_filter_override_present_flag
・ pic_deblocking_filter_override_flag
・ pic_deblocking_filter_disabled_flag
・ pic_beta_offset_div2
・ pic_tc_offset_div2
LMCS APS IDシンタックス要素のセットは、SPSにおいてLMCSが有効にされた場合に、その後に復号される。まず、pic_lmcs_enabled_flagが復号され、現在のピクチャに対してLMCSが有効かどうかが判断される。LMCSが有効な場合、Id値は復号されたpic_lmcs_aps_idである。クロマの場合、pic_chroma_residual_scale_flagのみが復号され、クロマについて方法が有効または無効になる。
スライスヘッダは、各スライスの先頭で送信される。スライスヘッダテーブルシンタックスには、現在57個のシンタックス要素が含まれている。これは、標準の以前のバージョンにおける以前のスライスヘッダと比較して非常に大きい。すべてのスライスヘッダパラメータの完全な説明は、JVET_P2001-VEにある。表9は、現在のピクチャヘッダ復号シンタックスにおけるこれらのパラメータを示している。この簡略化されたテーブルバージョンでは、テーブルを読みやすくするためにいくつかのシンタックス要素がグループ化されている。
slice_cb_qp_offset、slice_cr_qp_offset、slice_joint_cbcr_qp_offset、
cu_chroma_qp_offset_enabled_flag
表8に示すように、3つのツールALF、LMCSおよびスケーリングリストのAPS ID情報は、ピクチャヘッダシンタックス要素の最後にある。
いくつかのストリーミングアプリケーションは、ビットストリームの特定の部分のみを抽出する。これらの抽出は、空間的(サブピクチャとして)であっても、時間的(ビデオシーケンスのサブパート)であってもよい。次に、これらの抽出された部分を他のビットストリームとマージすることができる。いくつかの他のものは、いくつかのフレームのみを抽出することによってフレームレートを低減する。一般に、これらのストリーミングアプリケーションの主な目的は、許容帯域幅の最大値を使用して、エンドユーザに最大品質を提供することである。
クロマスケーリングを伴うルママッピング(LMCS)技法は、VVCのようなビデオデコーダにおいてループフィルタを適用する前にブロックに適用されるサンプル値変換方法である。
シンタックス要素lmcs_min_bin_idxは、クロマスケーリングを伴うルママッピング(LMCS)構築プロセスにて用いられる最小ビンインデックスを指定する。lmcs_min_bin_idxの値は、0~15の範囲である必要がある。
順方向および逆方向ルママッピングプロセスを適用するために、いくつかの中間変数およびデータ配列が必要とされる。
次に、i=lmcs_min_bin_idx…LmcsMaxBinIdxである変数lmcsDeltaCW[i]は、以下のように計算される。
新しい変数lmcsCW[i]は、次のように導出される。
- i=0…lmcs_min_bin_idx-1について、lmcsCW[i]は0に等しく設定される。
- i=lmcs_min_bin_idx…LmcsMaxBinIdxについて、以下が適用される。
lmcsCW[i]の値は、(OrgCW>>3)から(OrgCW<<<3-1)の範囲内である。
- i=LmcsMaxBinIdx+1…15について、lmcsCW[i]は0に等しく設定される。
i=0…16である変数LmcsPivot[i]、i=0…15である変数ScaleCoeff[i]およびInvScaleCoeff[i]は、以下のように計算される。
for(i=0;i<=15;i++){
LmcsPivot[i+1]=LmcsPivot[i]+lmcsCW[i]
ScaleCoeff[i]=(lmcsCW[i]*(1<<11)+(1<<(Log2(OrgCW)-1)))>>(Log2(OrgCW))
if(lmcsCW[i]==0)
InvScaleCoeff[i]=0
else
InvScaleCoeff[i]=OrgCW*(1<<11)/lmcsCW[i]
順方向ルママッピング
図7に示すように、LMCSがルマに適用される場合、predMapSamples[i][j]と呼ばれるルマリマップサンプルは、予測サンプルpredSamples[i][j]から得られる。
idxY=predSamples[i][j]>>Log2(OrgCW)
次に、セクション0の中間変数idxY、LmcsPivot[idxY]およびInputPivot[idxY]を使用して、predMapSamples[i][j]を以下のように導出する。
+(ScaleCoeff[idxY]*(predSamples[i][j]-InputPivot[idxY])+(1<<10))>>11
ルマ再構成サンプル
再構成プロセスは、予測ルマサンプルpredMapSample[i][j]および残差ルマサンプルresiSamples[i][j]から得られる。
上記の関係において、Clip1関数は、再構成されたサンプルが0と1<<BitDepth-1の間であることを確実にするためのクリッピング関数である。
図7による逆ルママッピングを適用する場合、以下の動作が、処理される現在のブロックの各サンプルrecSample[i][j]に適用される。
idxY=recSamples[i][j]>>Log2(OrgCW)
逆マッピングされたルマサンプルinvLumaSample[i][j]を、以下に基づいて以下のように導出する。
(recSample[i][j]-LmcsPivot[idxYInv])+(1<<10))>>11
次に、クリッピング動作を行って、最終サンプルを得る。
クロマスケーリング
クロマスケーリングのためのLMCSセマンティクス
表6のシンタックス要素lmcs_delta_abs_crsは、変数lmcsDeltaCrsの絶対コードワード値を指定する。lmcs_delta_abs_crsの値は、0及び7の範囲内である。存在しない場合、lmcs_delta_abs_crsは0に等しいと推測される。
クロマスケーリングプロセスを適用するために、いくつかの中間変数が必要とされる。
i=0…15である変数ChromaScaleCoeff[i]は、次のように導出される。
ChromaScaleCoeff[i]=(1<<11)
else
ChromaScaleCoeff[i]=OrgCW*(1<<11)/(lmcsCW[i]+lmcsDeltaCrs)
クロマスケーリングプロセス
第1のステップにおいて、変数invAvgLumaは、現在の対応するクロマブロックの周りの再構成されたルマサンプルの平均ルマ値を計算するために導出される。平均ルマは、対応するクロマブロックを囲む左および上のルマブロックから計算される。サンプルが使用できない場合、変数invAvgLumaは次のように設定される。
セクション0の中間配列LmcsPivot[]に基づいて、変数idxYInvは次のように導出される。
if(invAvgLuma<LmcsPivot[idxYInv+1]) break
}
IdxYInv=Min(idxYInv,15)
変数varScaleは、以下のように導出される。
変換が現在のクロマブロックに適用されるとき、再構成されたクロマピクチャサンプル配列recSamplesは、以下のように導出される。
Sign(resiSamples[i][j])*((Abs(resiSamples[i][j])*varScale+(1<<10))>>11))
現在のブロックに対して変換が適用されていない場合、以下が適用される。
エンコーダの考察
LMCSエンコーダの基本原理はまず、それらのダイナミックレンジセグメントが平均分散よりも低いコードワードを有する範囲に、より多くのコードワードを割り当てることである。この代替の定式化では、LMCSの主な目標が、平均分散よりも高いコードワードを有するそれらのダイナミックレンジセグメントに、より少ないコードワードを割り当てることである。このようにして、ピクチャの滑らかな領域は、平均よりも多くのコードワードで符号化され、逆もまた同様である。
以下の説明は、ピクチャヘッダのためのシンタックス要素の次の表の詳細または代替を提供する。表10は、従来技術の構文解析問題を解決するために、LMCS、ALFおよびスケーリングリストのAPS ID情報がピクチャヘッダの先頭に近づくように設定されているピクチャヘッダの修正例を示す(上記の表8を参照)。この変化は、ストライクスルーおよび下線付きテキストによって示される。このシンタックス要素のテーブルを用いて、APS IDの追跡は、より低い複雑性を有する。
・ APS ID LMCS
・ APS IDスケーリングリスト
・ LNSTメソッドのスケーリングマトリクスを有効にするための情報を含むAPSスケーリングリスト
・ APS ID ALFリスト
・ クリッピング値の通知に関する情報を含むAPS ALFリスト
1つの例では、APS ID関連のシンタックス要素がピクチャヘッダの先頭、または先頭付近に設定される。
・ 構文解析ツールのパラメータなしでビデオシーケンスの一部をカットまたは分割または抽出するために、ビットストリームを構文解析する必要があるストリーミングアプリケーションに役立つシンタックス要素
・ 現在のピクチャが参照ピクチャとして決して使用されないことを示すシンタックス要素(例えばnon_reference_picture_flag)で、これは、1に等しいとき、ピクチャが参照ピクチャとして決して使用されないことを示す。この情報は多くのストリーミングアプリケーションに役立つため、APS ID LMCSシンタックス要素のセットの前にこのフラグを設定することを勧める。
・ 現在のピクチャが漸進的復号リフレッシュピクチャであることを示すシンタックス要素(例えばgdr_pic_flagシンタックス)で、これは、1に等しい場合、現在のピクチャがGDRピクチャであることを示す。このタイプのピクチャは、ビットストリームが前のピクチャから独立していることを意味する。これは、多くのストリーミングアプリケーションにとって重要な情報である。同じ理由で、APS ID LMCSシンタックス要素セットは、gdr_pic_flagが有効になっている場合に復号されるrecovery_poc_cntシンタックス要素の後にある必要がある。
・ 復号ピクチャバッファ内の以前に復号されたピクチャの変更を示すシンタックス要素(例えばno_output_of_prior_pics_flag)で、これは、復号ピクチャバッファ(DBP)に影響する。これは、多くのアプリケーションにとって重要な情報である。
・ ph_pic_parameter_set_idおよび/またはPPS情報に関するその他のシンタックス要素。実際、PPS idは、多くのアプリケーションに必要とされる。
・ サブピクチャ情報に関連するシンタックス要素。実際、これらの情報は、一部のストリーミングアプリケーションにとってビットストリーム抽出のために重要である。
・ ピクチャヘッダで送信されるピクチャタイプ情報。実際、ピクチャタイプは、多くのアプリケーションにとって重要な情報である。
・ デブロッキングフィルタパラメータのセット;これらのパラメータは、スライスデータ復号にのみ必要とされるデブロッキングフィルタのためのものである。
・ 量子化パラメータのセット;これらのパラメータは、スライスデータの構文解析および復号に必要とされる。
・ SAOパラメータのセット;これらのパラメータは、スライスデータの構文解析と復号に必要である。
・ pic_joint_cbcr_sign_flagフラグ;これらのパラメータは、スライスデータの構文解析と復号に必要である。
・ 動きパラメータのセット;これらのパラメータは、スライスデータの構文解析と復号に必要である。
・ QPオフセットパラメータのセット;これらのパラメータは、スライスデータの構文解析と復号に必要である。
・ 分割パラメータのセット;これらのパラメータは、スライスデータの構文解析と復号に必要である。
・ 参照ピクチャリストパラメータのセット;これらのパラメータは、スライスデータの構文解析と復号に必要である。
・ pic_output_flフラグ;これらのパラメータはスライスデータの復号に必要である。
・ colour_plane_idフラグ;これらのパラメータは、スライスデータの構文解析と復号に必要である。
ビットストリームには、いくつかの再同期フレームまたはスライスがある。これらのフレームを使用することにより、以前の復号情報を考慮せずにビットストリームを読み出すことができる。例えば、クリーンランダムアクセスピクチャ(CRAピクチャ)は、その復号処理において、それ自体以外のピクチャをインター予測のために参照しない。これは、このピクチャのスライスがイントラまたはIBCであることを意味している。VVCでは、CRAピクチャが、各VCL NALユニットがCRA_NUTに等しいnal unit_typeを有するIRAP(Intra Random Access Point)ピクチャである。
スライスヘッダ内のAPS ID関連情報
以下の説明は、スライスヘッダにおけるシンタックス要素のテーブルの修正に関連する実施形態のものである。この表では、ALFのAPS ID情報が前述の構文解析の問題を解決するためにスライスヘッダの先頭に近い位置に設定されている。表11の変更されたスライスヘッダは、シンタックス要素(上の表9を参照)の現在のスライスヘッダの記述と、取り消し線と下線で示された変更に基づいている。
表11に示すように、一実施形態では、APS ID ALFシンタックス要素セットがスライスヘッダの先頭またはその付近に設定される。特に、ALF APSは、クリッピング値の通知に関連するシンタックス要素を少なくとも含む。
・ 現在のスライスのPOCを示すslice_pic_order_cnt_lsbシンタックス要素。この情報は多くのストリーミングアプリケーションに役立つため、APS ID ALFシンタックス要素のセットの前にこのフラグを設定することが好ましい。
・ 現在のスライスのサブピクチャIDを示すslice_subpic_idシンタックス要素。この情報は多くのストリーミングアプリケーションに役立つため、APS ID ALFシンタックス要素のセットの前にこのフラグを設定することが好ましい。
・ スライスのアドレスを示すslice_addressシンタックス要素。この情報は多くのストリーミングアプリケーションに役立つため、APS ID ALFシンタックス要素のセットの前にこのフラグを設定することが好ましい。
・ num_tiles_in_slice_minusシンタックス要素。この情報は多くのストリーミングアプリケーションに役立つため、APS ID ALFシンタックス要素のセットの前にこのフラグを設定することが好ましい。
・ 現在のスライスのタイプを示すslice_type要素。この情報は多くのストリーミングアプリケーションに役立つため、APS ID ALFシンタックス要素のセットの前にこのフラグを設定することが好ましい。
・ スライスヘッダの参照ピクチャリストパラメータのセット。実際、これらのパラメータは、スライスデータ復号に必要とされる。
・ スライスヘッダ内のCABAC初期化フラグのセット。実際、このフラグはスライスデータ復号専用である。
・ スライスヘッダ内の並置された予測パラメータのセット。実際、これらのパラメータは、スライスデータ復号に必要とされる。
・ スライスヘッダ内の重み付き予測パラメータのセット。実際、これらのパラメータは、スライスデータ復号に必要とされる。
・ スライスヘッダ内の量子化パラメータ更新パラメータのセット。実際、これらのパラメータは、スライスデータ復号に必要とされる。
・ スライスヘッダ内のSAO有効化フラグのセット。実際、これらのパラメータは、スライスデータ復号に必要とされる。
図9は、本発明の実施形態による、エンコーダ150またはデコーダ100のうちの少なくとも1つおよび通信ネットワーク199を備えるシステム191 195を示す。一実施形態によれば、システム195は例えば、デコーダ100を含むユーザ端末またはデコーダ100と通信可能なユーザ端末のユーザインターフェースを介してデコーダ100にアクセスできるユーザにコンテンツ(例えば、ビデオ/オーディオコンテンツを表示/出力またはストリーミングするためのビデオおよびオーディオコンテンツ)を処理し提供するためのものである。このようなユーザ端末は、コンピュータ、携帯電話、タブレット、または(提供/ストリーミングされた)コンテンツをユーザに提供/表示することができる任意の他のタイプのデバイスであってもよい。システム195は通信ネットワーク200を介して(連続ストリームまたは信号の形で-例えば、以前のビデオ/オーディオが表示/出力されている間)ビットストリーム101を取得/受信する。一実施形態によれば、システム191はコンテンツを処理し、処理されたコンテンツ、例えば、後で表示/出力/ストリーミングするために処理されたビデオおよびオーディオコンテンツを格納するためのものである。システム191はエンコーダ150によって受信され処理された(本発明によるデブロッキングフィルタによるフィルタリングを含む)オリジナルの画像シーケンス151を含むコンテンツを取得/受信し、エンコーダ150は、通信ネットワーク191を介してデコーダ100に通信されるビットストリーム101を生成する。次に、ビットストリーム101はいくつかの方法でデコーダ100に通信され、例えば、エンコーダ150によって事前に生成され、ユーザが記憶装置からコンテンツ(すなわち、ビットストリームデータ)を要求するまで、通信ネットワーク200内の記憶装置(例えば、サーバまたはクラウドストレージ)にデータとして格納され、その時点で、データが記憶装置からデコーダ100に通信/ストリーミングされる。また、システム191 195は、ユーザに対して、(例えば、ユーザ端末に表示されるユーザインターフェースのためのデータを通信することで)、記憶装置に格納されたコンテンツのコンテンツ情報(例えば、コンテンツのタイトルや、コンテンツを識別、選択、および要求するためのその他のメタ/格納位置データ)を配信/ストリーミングしたり、要求されたコンテンツを記憶装置からユーザ端末に配信/ストリーミングできるように、コンテンツのユーザ要求を受信して処理するためのコンテンツ提供装置を備えてもよい。あるいは、エンコーダ150が、ユーザがコンテンツを要求するときに、ビットストリーム101を生成し、それをデコーダ100に直接通信/ストリーミングする。次いで、デコーダ100はビットストリーム101(または信号)を受信し、本発明によるデブロッキングフィルタでフィルタリングを実行してビデオ信号109および/またはオーディオ信号を取得/生成し、これをユーザ端末が使用して、要求されたコンテンツをユーザに提供する。
ネットワークカメラ
図11は、ネットワークカメラ2102及びクライアント装置2104を含むネットワークカメラシステム2100を示す図である。
図12は、スマートフォン2200を示す図である。
Claims (8)
- ビットストリームから画像データを復号する方法であって、
ここで、前記ビットストリームは、1つ以上のスライスを含むことが可能なピクチャを復号するときに使用されるシンタックス要素を含むピクチャヘッダと、スライスを復号するときに使用されるシンタックス要素を含むスライスヘッダと、を含み、
ここで、前記復号する方法は、
少なくとも、LMCS(Luma Mapping with Chroma Scaling)が前記ピクチャ内で使用され得るかを示すシンタックス要素を、前記ピクチャヘッダにおいて構文解析することと、
前記LMCSが前記ピクチャ内で使用され得るとき、少なくとも、LMCS APS(Adaptation Parameter Set)のIDに関するシンタックス要素を、前記ピクチャヘッダにおいて構文解析することと、
前記LMCSが前記ピクチャ内で使用され得るとき、前記スライスヘッダにおいて、ALF(Adaptive Loop Filter)APSのIDに関するシンタックス要素の直後、かつ、前記LMCS以外の所定の復号ツールに関連するシンタックス要素の前に、少なくとも、前記LMCSが前記スライスにおいて使用されるかを特定するためのシンタックス要素を構文解析することと、
復号されたシンタックス要素を用いて前記ビットストリームから前記画像データを復号することと
を含むことを特徴とする方法。 - 前記LMCSが前記スライスにおいて使用されるかを特定するためのシンタックス要素はフラグであることを特徴とする請求項1に記載の方法。
- 画像データをビットストリームに符号化する方法であって、
ここで、前記ビットストリームは、1つ以上のスライスを含むことが可能なピクチャを復号するときに使用されるシンタックス要素を含むピクチャヘッダと、スライスを復号するときに使用されるシンタックス要素を含むスライスヘッダと、を含み、
前記符号化する方法は、
少なくとも、LMCS(Luma Mapping with Chroma Scaling)が前記ピクチャ内で使用され得るかを示すシンタックス要素を、前記ピクチャヘッダにおいて符号化することと、
前記LMCSが前記ピクチャ内で使用され得るとき、少なくとも、LMCS APS(Adaptation Parameter Set)のIDに関するシンタックス要素を、前記ピクチャヘッダにおいて符号化することと、
前記LMCSが前記ピクチャ内で使用され得るとき、前記スライスヘッダにおいて、ALF(Adaptive Loop Filter)APSのIDに関するシンタックス要素の直後、かつ、前記LMCS以外の所定の復号ツールに関連するシンタックス要素の前に、少なくとも、前記LMCSが前記スライスにおいて使用されるかを特定するためのシンタックス要素を符号化することと
を含むことを特徴とする方法。 - 前記LMCSが前記スライスにおいて使用されるかを特定するためのシンタックス要素はフラグであることを特徴とする請求項3に記載の方法。
- ビットストリームから画像データを復号するためのデコーダであって、前記デコーダは、請求項1に記載の方法を実行するように構成されていることを特徴とするデコーダ。
- 画像データをビットストリームに符号化するためのエンコーダであって、前記エンコーダは、請求項3に記載の方法を実行するように構成されていることを特徴とするエンコーダ。
- コンピュータに、請求項1に記載の方法を実行させることを特徴とするコンピュータプログラム。
- コンピュータに、請求項3に記載の方法を実行させることを特徴とするコンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2023185011A JP7561256B2 (ja) | 2020-03-05 | 2023-10-27 | ビデオコーディング及び復号のための高レベルシンタックス |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB2003219.9A GB2592656B (en) | 2020-03-05 | 2020-03-05 | High level syntax for video coding and decoding |
GB2003219.9 | 2020-03-05 | ||
PCT/EP2021/054931 WO2021175736A1 (en) | 2020-03-05 | 2021-02-26 | High level syntax for video coding and decoding |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023185011A Division JP7561256B2 (ja) | 2020-03-05 | 2023-10-27 | ビデオコーディング及び復号のための高レベルシンタックス |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023507877A JP2023507877A (ja) | 2023-02-28 |
JP7383808B2 true JP7383808B2 (ja) | 2023-11-20 |
Family
ID=70278218
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022524729A Active JP7383808B2 (ja) | 2020-03-05 | 2021-02-26 | ビデオコーディング及び復号のための高レベルシンタックス |
JP2023185011A Active JP7561256B2 (ja) | 2020-03-05 | 2023-10-27 | ビデオコーディング及び復号のための高レベルシンタックス |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023185011A Active JP7561256B2 (ja) | 2020-03-05 | 2023-10-27 | ビデオコーディング及び復号のための高レベルシンタックス |
Country Status (8)
Country | Link |
---|---|
US (6) | US12003779B2 (ja) |
EP (1) | EP4115618A1 (ja) |
JP (2) | JP7383808B2 (ja) |
KR (1) | KR20220138008A (ja) |
CN (1) | CN115244935A (ja) |
GB (1) | GB2592656B (ja) |
TW (1) | TWI828970B (ja) |
WO (1) | WO2021175736A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022108421A1 (ko) * | 2020-11-23 | 2022-05-27 | 현대자동차주식회사 | 적응적 대체 모드를 이용한 영상 부호화 및 복호화 방법 |
EP4443587A1 (en) | 2022-10-25 | 2024-10-09 | LG Energy Solution, Ltd. | Polymer solid electrolyte and all-solid-state battery comprising same |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130101034A1 (en) | 2011-10-19 | 2013-04-25 | Panasonic Corporation | Image coding method, image decoding method, image coding apparatus, image decoding apparatus, and image coding and decoding apparatus |
WO2021170091A1 (en) | 2020-02-29 | 2021-09-02 | Beijing Bytedance Network Technology Co., Ltd. | Constrains for high level syntax elements |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2745290A1 (en) * | 2011-09-27 | 2014-06-25 | Koninklijke Philips N.V. | Apparatus and method for dynamic range transforming of images |
WO2020224525A1 (en) * | 2019-05-03 | 2020-11-12 | Mediatek Inc. | Methods and apparatuses of syntax signaling and referencing constraint in video coding system |
WO2021033749A1 (en) * | 2019-08-22 | 2021-02-25 | Sharp Kabushiki Kaisha | Systems and methods for signaling picture information in video coding |
-
2020
- 2020-03-05 GB GB2003219.9A patent/GB2592656B/en active Active
-
2021
- 2021-02-23 TW TW110106251A patent/TWI828970B/zh active
- 2021-02-26 KR KR1020227033338A patent/KR20220138008A/ko active Search and Examination
- 2021-02-26 US US17/909,160 patent/US12003779B2/en active Active
- 2021-02-26 WO PCT/EP2021/054931 patent/WO2021175736A1/en unknown
- 2021-02-26 JP JP2022524729A patent/JP7383808B2/ja active Active
- 2021-02-26 CN CN202180018944.XA patent/CN115244935A/zh active Pending
- 2021-02-26 EP EP21709909.2A patent/EP4115618A1/en active Pending
-
2023
- 2023-10-27 JP JP2023185011A patent/JP7561256B2/ja active Active
-
2024
- 2024-05-03 US US18/654,672 patent/US20240292037A1/en active Pending
- 2024-05-03 US US18/654,656 patent/US20240298035A1/en active Pending
- 2024-05-03 US US18/654,626 patent/US20240305825A1/en active Pending
- 2024-05-03 US US18/654,638 patent/US20240305826A1/en active Pending
- 2024-05-03 US US18/654,610 patent/US20240292036A1/en active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130101034A1 (en) | 2011-10-19 | 2013-04-25 | Panasonic Corporation | Image coding method, image decoding method, image coding apparatus, image decoding apparatus, and image coding and decoding apparatus |
WO2013057884A1 (ja) | 2011-10-19 | 2013-04-25 | パナソニック株式会社 | 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置及び画像符号化復号装置 |
WO2021170091A1 (en) | 2020-02-29 | 2021-09-02 | Beijing Bytedance Network Technology Co., Ltd. | Constrains for high level syntax elements |
JP2023515185A (ja) | 2020-02-29 | 2023-04-12 | 北京字節跳動網絡技術有限公司 | ハイレベルシンタックス要素のための制約 |
Non-Patent Citations (2)
Title |
---|
Benjamin Bross, et al.,Versatile Video Coding (Draft 7),Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 16th Meeting: Geneva, CH, 1-11 Oct. 2019,JVET-P2001-vE,2019年12月31日,pp.33-86,庁内DB(送付可) |
Benjamin Bross, Jianle Chen, Shan Liu, Ye-Kui Wang,Versatile Video Coding (Draft 8) [online], JVET-Q JVET-Q2001-vD,ITU-T インターネット<URL:https://jvet-experts.org/doc_end_user/documents/17_Brussels/wg11/JVET-Q2001-v1.zip>,2020年01月18日,pp.34-87 |
Also Published As
Publication number | Publication date |
---|---|
GB2592656A (en) | 2021-09-08 |
US20240292037A1 (en) | 2024-08-29 |
CN115244935A (zh) | 2022-10-25 |
TWI828970B (zh) | 2024-01-11 |
US20230089002A1 (en) | 2023-03-23 |
US20240298035A1 (en) | 2024-09-05 |
JP2024001274A (ja) | 2024-01-09 |
GB2592656A9 (en) | 2023-02-01 |
US20240292036A1 (en) | 2024-08-29 |
JP2023507877A (ja) | 2023-02-28 |
JP7561256B2 (ja) | 2024-10-03 |
US12003779B2 (en) | 2024-06-04 |
GB2592656B (en) | 2023-04-19 |
US20240305826A1 (en) | 2024-09-12 |
GB202003219D0 (en) | 2020-04-22 |
KR20220138008A (ko) | 2022-10-12 |
EP4115618A1 (en) | 2023-01-11 |
WO2021175736A1 (en) | 2021-09-10 |
TW202135532A (zh) | 2021-09-16 |
US20240305825A1 (en) | 2024-09-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7403633B2 (ja) | ビデオの符号化及び復号のための高レベルシンタックス | |
JP7475455B2 (ja) | ビデオの符号化および復号のためのハイレベルシンタックス | |
JP7434580B2 (ja) | ビデオの符号化及び復号のための高レベルシンタックス | |
US20230145618A1 (en) | High level syntax for video coding and decoding | |
JP7561256B2 (ja) | ビデオコーディング及び復号のための高レベルシンタックス | |
JP2024105712A (ja) | ビデオの符号化及び復号のための高レベルシンタックス | |
GB2613299A (en) | High level syntax for video coding and decoding | |
GB2613300A (en) | High level syntax for video coding and decoding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220623 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230627 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230707 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230901 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231010 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231108 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7383808 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |