JP7422901B2 - ビデオコーディングのための方法、装置、非一時的コンピュータ可読記憶媒体およびプログラム - Google Patents
ビデオコーディングのための方法、装置、非一時的コンピュータ可読記憶媒体およびプログラム Download PDFInfo
- Publication number
- JP7422901B2 JP7422901B2 JP2022570739A JP2022570739A JP7422901B2 JP 7422901 B2 JP7422901 B2 JP 7422901B2 JP 2022570739 A JP2022570739 A JP 2022570739A JP 2022570739 A JP2022570739 A JP 2022570739A JP 7422901 B2 JP7422901 B2 JP 7422901B2
- Authority
- JP
- Japan
- Prior art keywords
- picture
- flag
- equal
- syntax element
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 70
- 229920000069 polyphenylene sulfide Polymers 0.000 claims description 2
- 230000002123 temporal effect Effects 0.000 description 29
- 239000013598 vector Substances 0.000 description 23
- 238000010586 diagram Methods 0.000 description 22
- 230000011664 signaling Effects 0.000 description 21
- 230000008569 process Effects 0.000 description 20
- 238000012545 processing Methods 0.000 description 14
- 230000004044 response Effects 0.000 description 14
- 238000004891 communication Methods 0.000 description 10
- 238000009795 derivation Methods 0.000 description 9
- 238000000638 solvent extraction Methods 0.000 description 9
- 230000006978 adaptation Effects 0.000 description 8
- 238000005192 partition Methods 0.000 description 7
- 238000011084 recovery Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 238000013139 quantization Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 230000009471 action Effects 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 4
- 230000002457 bidirectional effect Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 241001482237 Pica Species 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 1
- 241000023320 Luma <angiosperm> Species 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000004549 pulsed laser deposition Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/174—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/119—Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/188—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a video data packet, e.g. a network abstraction layer [NAL] unit
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
- H04N19/423—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/44—Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Computing Systems (AREA)
- Theoretical Computer Science (AREA)
Description
本出願は、2020年5月20日に出願された米国仮出願番号第63/027,718号、タイトル「ビデオ符号化におけるシンタックス要素のシグナリング」に対する優先権を主張し、その全体が参照により援用される。
2018年4月10日から20日にかけて、米国のサンディエゴで行われた第10回JVET会議において、JVETは、その参照ソフトウェア実装形態としてのVVCおよびVVCテストモード1(VVc Test Model 1:VTM1)の第1ドラフトを規定した。VVCの初期の新しい符号化機能として、ネストされたマルチタイプツリーを伴うクワッドツリーを含むことが決定された。マルチタイプツリーは、2分割および3分割の両方を含む符号化ブロック分割構造である。それ以降、符号化プロセスおよび復号化プロセスの両方が実装された参照ソフトウェアVTMが開発され、その後のJVET会議で更新された。
図3は、本開示のいくつかの実装形態に従った複数のCTU302に分割されたピクチャ300の例を示す図である。
HEVCでは、CTUは、符号化ツリーと呼ばれる4要素ツリー構造を使用してCUに分割されて、種々のローカル特性に適応される。インターピクチャ(時間)またはイントラピクチャ(空間)予測を使用してピクチャエリアを符号化するかどうかの判定は、リーフCUレベルで行われる。各リーフCUは、PU分割タイプに従って、さらに、1つ、2つ、または4つのPUに分割され得る。1つのPU内では、同じ予測プロセスが行われ、関連する情報が、PU単位で復号器に伝送される。PU分割タイプに基づく予測プロセスの実行による残差ブロックの取得後、リーフCUは、CUの符号化ツリーと類似の別の4要素ツリー構造に従って、変換ユニット(Transform Unit:TU)に分割することができる。HEVC構造の主要な特性の1つは、CU、PU、およびTUを含む複数の分割概念を有することである。
VVCでは、シンタックスシグナリングのビットストリームの最初の層は、ビットストリームがNALユニットのセットに分割されているNALである。いくつかのNALユニットは、SPSおよびPPSなどの共通制御パラメータを復号器にシグナリングする。その他のものは、ビデオデータを含んでいる。ビデオ符号化層(Video Coding Layer:VCL)NALユニットは、符号化されたビデオのスライスを含んでいる。符号化されたピクチャは、アクセスユニットと呼ばれ、かつ1つまたは複数のスライスとして符号化される場合がある。
ph_temporal_mvp_enabled_flagは、ピクチャヘッダ(PH)に関連付けられたスライスのインター予測に時間的動きベクトル予測子が使用できるかどうかを特定する。ph_temporal_mvp_enabled_flagが0に等しい場合、PHに関連付けられたスライスのシンタックス要素は、スライスの復号化の際に時間的動きベクトル予測子が使用されないように制約されるものとする。その他の場合(ph_temporal_mvp_enabled_flagが1に等しい場合)、時間的動きベクトル予測子は、PHに関連付けられたスライスの復号化の際に使用されてよい。存在しない場合、ph_temporal_mvp_enabled_flagの値は、0に等しいと推測される。復号化されたピクチャバッファ(Decoded Picture Buffer:DPB)内で、現在のピクチャと同じ空間分解能を有する参照ピクチャがない場合、ph_temporal_mvp_enabled_flagの値は0に等しいものとする。
- rpl_info_in_ph_flagが1に等しい場合、slice_collocated_from_l0_flagは、ph_collocated_from_l0_flagに等しいと推測される。
- その他の場合(rpl_info_in_ph_flagが0に等しく、slice_typeがPに等しい場合)、slice_collocated_from_l0_flagの値は、1に等しいと推測される。
slice_collocated_ref_idxが存在しない場合、下記が適用される。
-rpl_info_in_ph_flagが1に等しい場合、slice_collocated_ref_idxの値は、ph_collocated_ref_idxに等しいと推測される。
-その他の場合(rpl_info_in_ph_flagが0に等しい場合)、slice_collocated_ref_idxの値は、0に等しいと推測される。
本プロセスは、非IDRピクチャのスライスごとに復号化プロセスの最初に起動される。参照ピクチャは、参照インデックスを通してアドレス指定される。参照インデックスは、参照ピクチャリストへのインデックスである。Iスライスを復号化する場合、スライスデータの復号化に参照ピクチャリストを使用しない。Pスライスを復号化する場合、スライスデータの復号化に参照ピクチャリスト0(すなわち、RefPicList[0])のみが使用される。Bスライスを復号化する場合、スライスデータの復号化に参照ピクチャリスト0および参照ピクチャリスト1(すなわち、RefPicList[1])の両方が使用される。
-PicOutputWidthL*2は、refPicWidthInLumaSamples以上である。
-PicOutputHeightL*2は、refPicHeightInLumaSamples以上である。
-PicOutputWidthLは、refPicWidthInLumaSamples*8以下である。
-PicOutputHeightLは、refPicHeightInLumaSamples*8以下である。
-PicOutputWidthL*pic_width_max_in_luma_samplesは、refPicOutputWidthL*(pic_width_in_luma_samples-Max(8,MinCbSizeY))以上である。
-PicOutputHeightL*pic_height_max_in_luma_samplesは、refPicOutputHeightL*(pic_height_in_luma_samples-Max(8,MinCbSizeY))以上である。
HEVCと同様に、VVC規格では、NALユニットの基本情報を特定するために、各NALユニットの初めに、全長2バイトの1つのNALユニットヘッダテーブルが、シグナリングされる。表3は、現在のNALユニットヘッダに存在するシンタックス要素を示している。
低遅延およびエラー回復は、実用的なビデオ伝送システムで考慮されるべき2つの重要な因子である。IRAPピクチャを定期的に挿入するイントラリフレッシュは、時間的ピクチャ間のエラー伝播を制限するために、かつビットストリームのエラー回復能力を高めるために一般的に使用される。しかし、インター符号化の符号化効率がイントラ符号化よりもはるかに優れているため、固定伝送速度でネットワークを通して送られる場合に、比較的大きなサイズのイントラピクチャは、場合により遅延問題の原因になることがある。このことは、望ましくないネットワーク輻輳およびパケット損失につながる可能性がある。このような問題を解決するために、図5に示すように、複数のインターピクチャ間でイントラ符号化領域を分散する段階的イントラリフレッシュ(GDR)がVVC規格に採用された。図5に示すように、2つの領域が画定される。部分2は、クリーン領域を表している。クリーン領域は、現在のGDR期間にリフレッシュされた画素に相当し、かつダーティ領域は、リフレッシュされていない1つの領域に相当する。部分1は、イントラ符号化が適用された符号化ブロックを表している。GDRの原理は、同じGDR期間内の時間的参照ピクチャのリフレッシュされた領域のみから派生する画素を使用してクリーン領域の画素が再構築されることを保証することである。現在のVVCでは、ピクチャヘッダ内でシグナリングされる3つのGDR関連シンタックス要素ph_gdr_or_irap_pic_flag、ph_gdr_pic_flagおよびph_recovery_poc_cntが存在する。表5は、ピクチャヘッダ内の対応するGDRシグナリングおよび関連付けられた意味を示している。
1つのピクチャ内のスライスのNALタイプが同一である必要があるHEVC規格とは異なり、1つのピクチャ内でIRAPおよび非IRAPのNALユニットタイプの混在が可能である。このような機能の目的は、サブピクチャを用いる領域ベースランダムアクセスにある。例えば、360度ビデオストリーミングの場合、ある360度ビデオの一部の領域は、他の領域よりもより多くのユーザに視聴される可能性がある。符号化効率と平均ビューポイント切替遅延とのトレードオフを改善するために、より頻繁にIRAPピクチャを使用して、他の領域よりもより視聴されている領域を符号化することができる。このような理由のために、1つのフラグpps_mixed_nalu_types_in_pic_flagがPPSに導入される。フラグが1に等しい場合、そのフラグはPPSを参照する各ピクチャが2つ以上のNALユニットを有し、かつNALユニットが同じ値のnal_unit_typeを有していないことを示す。その他の場合(フラグが0に等しい場合)、PPSを参照する各ピクチャが1つまたは複数のNALユニットを有し、かつPPSを参照する各ピクチャのNALユニットが同じ値のnal_unit_typeを有する。加えて、フラグpps_mixed_nalu_types_in_pic_flagが1に等しい場合、任意の特定のピクチャに対して、一部のNALユニットが1つの特定のIRAP NALユニットタイプを有し、他のものが1つの特定の非IRAP NALユニットタイプを有するという1つのビットストリーム適合制約がさらに適用される。換言すれば、下記のように規定されているように、任意の特定のピクチャのNALユニットは、2つ以上のIRAP NALユニットタイプを有することができず、かつ2つ以上の非IRAP NALユニットタイプを有することができない。
-pps_mixed_nalu_types_in_pic_flagが0に等しい場合、nal_unit_typeの値はピクチャの全てのVCL NALユニットに対して同じであり、かつピクチャまたはPUは、ピクチャまたはPUの符号化されたスライスNALユニットと同じNALユニットタイプを有すると見なされる。
-その他の場合(pps_mixed_nalu_types_in_pic_flagが1に等しい場合)、下記が適用される。
-ピクチャは、少なくとも2つのサブピクチャを有するものとする。
-ピクチャのVCL NALユニットは、2つ以上の異なるnal_unit_type値を有する。
-GDR_NUTに等しいnal_unit_typeを有するピクチャのVCL NALユニットはない。
-ピクチャの少なくとも1つのサブピクチャのVCL NALユニットが、IDR_W_RADL、IDR_N_LP、またはCRA_NUTに等しいnal_unit_typeの特定の値を有する場合、ピクチャ内の他のサブピクチャのVCL NALユニットは全て、TRAIL_NUTに等しいnal_unit_typeを有するものとする。
DPB内で、現在のピクチャと同じ空間分解能を有する参照ピクチャがない場合、ph_temporal_mvp_enabled_flagの値は0に等しいものとする。
イントラランダムアクセスポイント(IRAP)ピクチャ:全てのVCL NALユニットがIDR_W_RADL以上からCRA_NUT以下の範囲の同じ値のnal_unit_typeを有する符号化されたピクチャである。
段階的復号化リフレッシュ(GDR)ピクチャ:各VCL NALユニットがGDR_NUTに等しいnal_unit_typeを有するピクチャである。
-sps_dmvr_enabled_flagが1に等しく、かつsps_dmvr_pic_present_flagが0に等しい場合、ph_disable_dmvr_flagの値は0に等しいと推測される。
-sps_dmvr_enabled_flagが1に等しく、かつsps_dmvr_pic_present_flagが1に等しい場合、ph_disable_dmvr_flagの値は1に等しいと推測される。
-その他の場合(sps_dmvr_enabled_flagが0に等しい場合)、ph_disable_dmvr_flagの値は1に等しいと推測される。
-全ての条件がph_disable_dmvr_flagの値の導出のために考慮され、その値が明確にシグナリングされるか、または暗黙に導出される場合:sps_dmvr_enabled_flagが1に等しく、かつsps_dmvr_pic_present_flagが0に等しい場合、ph_disable_dmvr_flagの値は0に等しいと推測される。
-sps_dmvr_enabled_flagが0に等しく、かつsps_dmvr_pic_present_flagが0に等しい場合、ph_disable_dmvr_flagの値は1に等しいと推測される。
-sps_dmvr_enabled_flagが1に等しく、かつsps_dmvr_pic_present_flagが1に等しく、さらにrpl_info_in_ph_flagが0に等しい場合、ph_disable_dmvr_flagの値はXに等しいと推測される(Xは明確にシグナリングされる)。
-sps_dmvr_enabled_flagが1に等しく、かつsps_dmvr_pic_present_flagが1に等しく、さらにrpl_info_in_ph_flagが1に等しく、またnum_ref_entries[1][RplsIdx[1]]>0の場合、ph_disable_dmvr_flagの値はXに等しいと推測される(Xは明確にシグナリングされる)。
-その他の場合(sps_dmvr_enabled_flagが1に等しく、かつsps_dmvr_pic_present_flagが1に等しく、さらにrpl_info_in_ph_flagが1に等しく、またnum_ref_entries[1][RplsIdx[1]]==0の場合)、ph_disable_dmvr_flagの値は1に等しいと推測される。
ph_disable_dmvr_flagが存在しない場合、下記が適用される。
-sps_dmvr_enabled_flagが1に等しく、かつsps_dmvr_pic_present_flagが0に等しい場合、ph_disable_dmvr_flagの値は0に等しいと推測される。
-sps_dmvr_enabled_flagが0に等しく、かつsps_dmvr_pic_present_flagが0に等しい場合、ph_disable_dmvr_flagの値は1に等しいと推測される。
-その他の場合(sps_dmvr_enabled_flagが1に等しく、かつsps_dmvr_pic_present_flagが1に等しく、さらにrpl_info_in_ph_flagが1に等しく、またnum_ref_entries[1][RplsIdx[1]]==0の場合)、ph_disable_dmvr_flagの値は1に等しいと推測される。
ph_disable_dmvr_flagが存在しない場合、下記が適用される。
-sps_dmvr_enabled_flagが1に等しく、かつsps_dmvr_pic_present_flagが0に等しい場合、ph_disable_dmvr_flagの値は0に等しいと推測される。
-その他の場合(sps_dmvr_enabled_flagが0に等しいか、またはsps_dmvr_pic_present_flagが1に等しい場合)、ph_disable_dmvr_flagの値は1に等しいと推測される。
ph_disable_dmvr_flagが存在しない場合、下記が適用される。
-sps_dmvr_pic_present_flagが0に等しい場合)、ph_disable_dmvr_flagの値は1-sps_dmvr_enabled_flagに等しいと推測される。
-sps_dmvr_pic_present_flagが1に等しく、かつrpl_info_in_ph_flagが0に等しい場合、ph_disable_dmvr_flagの値は1-sps_dmvr_enabled_flagに等しいと推測される。
-sps_dmvr_pic_present_flagが1に等しく、かつrpl_info_in_ph_flagが1に等しく、さらにnum_ref_entries[1][RplsIdx[1]]>0の場合、ph_disable_dmvr_flagの値は1-sps_dmvr_enabled_flagに等しいと推測される。
-その他の場合(sps_dmvr_pic_present_flagが1に等しく、かつrpl_info_in_ph_flagが1に等しく、さらにnum_ref_entries[1][RplsIdx[1]]==0の場合)、ph_disable_dmvr_flagの値は1に等しいと推測される。
ph_disable_dmvr_flagが存在しない場合、下記が適用される。
-sps_dmvr_pic_present_flagが0に等しい場合、ph_disable_dmvr_flagの値は1-sps_dmvr_enabled_flagに等しいと推測される。
-その他の場合、ph_disable_dmvr_flagの値は、1に等しいと推測される。
-sps_bdof_enabled_flagが1に等しく、かつsps_bdof_pic_present_flagが0に等しい場合、ph_disable_bdof_flagの値は0に等しいと推測される。
-sps_bdof_enabled_flagが1に等しく、かつsps_bdof_pic_present_flagが1に等しい場合、ph_disable_dmvr_flagの値は1に等しいと推測される。
-その他の場合(sps_bdof_enabled_flagが0に等しい場合)、ph_disable_bdof_flagの値は1に等しいと推測される。
全ての条件がph_disable_bdof_flagの値の導出のために考慮され、その値が明確にシグナリングされるか、または暗黙に導出される場合:
-sps_bdof_enabled_flagが1に等しく、かつsps_bdof_pic_present_flagが0に等しい場合、ph_disable_bdof_flagの値は0に等しいと推測される。
-sps_bdof_enabled_flagが0に等しく、かつsps_bdof_pic_present_flagが0に等しい場合、ph_disable_bdof_flagの値は1に等しいと推測される。
-sps_bdof_enabled_flagが1に等しく、かつsps_bdof_pic_present_flagが1に等しく、さらにrpl_info_in_ph_flagが0に等しい場合、ph_disable_bdof_flagの値はXに等しいと推測される(Xは明確にシグナリングされる)。
-sps_bdof_enabled_flagが1に等しく、かつsps_bdof_pic_present_flagが1に等しく、さらにrpl_info_in_ph_flagが1に等しく、またnum_ref_entries[1][RplsIdx[1]]>0の場合、ph_disable_bdof_flagの値はXに等しいと推測される(Xは明確にシグナリングされる)。
-その他の場合(sps_bdof_enabled_flagが1に等しく、かつsps_bdof_pic_present_flagが1に等しく、さらにrpl_info_in_ph_flagが1に等しく、またnum_ref_entries[1][RplsIdx[1]]==0の場合)、ph_disable_bdof_flagの値は1に等しいと推測される。
ph_disable_bdof_flagが存在しない場合、下記が適用される。
-sps_bdof_enabled_flagが1に等しく、かつsps_bdof_pic_present_flagが0に等しい場合、ph_disable_bdof_flagの値は0に等しいと推測される。
-sps_bdof_enabled_flagが0に等しく、かつsps_bdof_pic_present_flagが0に等しい場合、ph_disable_bdof_flagの値は1に等しいと推測される。
-その他の場合(sps_bdof_enabled_flagが1に等しく、かつsps_bdof_pic_present_flagが1に等しく、さらにrpl_info_in_ph_flagが1に等しく、またnum_ref_entries[1][RplsIdx[1]]==0の場合)、ph_disable_bdof_flagの値は1に等しいと推測される。
ph_disable_bdof_flagが存在しない場合、下記が適用される。
-sps_bdof_enabled_flagが1に等しく、かつsps_bdof_pic_present_flagが0に等しい場合、ph_disable_bdof_flagの値は0に等しいと推測される。
-その他の場合(sps_bdof_enabled_flagが0に等しいか、またはsps_bdof_pic_present_flagが1に等しい場合)、ph_disable_bdof_flagの値は1に等しいと推測される。
ph_disable_bdof_flagが存在しない場合、下記が適用される。
-sps_bdof_pic_present_flagが0に等しい場合、ph_disable_bdof_flagの値は1-sps_bdof_enabled_flagに等しいと推測される。
-sps_bdof_pic_present_flagが1に等しく、かつrpl_info_in_ph_flagが0に等しい場合、ph_disable_bdof_flagの値は1-sps_bdof_enabled_flagに等しいと推測される。
-sps_bdof_pic_present_flagが1に等しく、かつrpl_info_in_ph_flagが1に等しく、さらにnum_ref_entries[1][RplsIdx[1]]>0の場合、ph_disable_bdof_flagの値は1-sps_bdof_enabled_flagに等しいと推測される。
-その他の場合(sps_bdof_pic_present_flagが1に等しく、かつrpl_info_in_ph_flagが1に等しく、さらにnum_ref_entries[1][RplsIdx[1]]==0の場合)、ph_disable_bdof_flagの値は1に等しいと推測される。
ph_disable_bdof_flagが存在しない場合、下記が適用される。
-sps_bdof_pic_present_flagが0に等しい場合、ph_disable_bdof_flagの値は1-sps_bdof_enabled_flagに等しいと推測される。
-その他の場合、ph_disable_bdof_flagの値は、1に等しいと推測される。
-num_ref_entries[0][RplsIdx[0]]が1より大きい場合、ph_collocated_from_l0_flagの値は1であると推測される。
-その他の場合(num_ref_entries[1][RplsIdx[1]]が1より大きい場合)、ph_collocated_from_l0_flagの値は0であると推測される。
pps_weighted_bipred_flagおよびwp_info_in_ph_flagの両方が1に等しい場合、num_l1_weightsは参照ピクチャリスト1内のエントリに対してシグナリングされた重みの数を特定する。num_l1_weightsの値は、0以上からMin(15,num_ref_entries[1][RplsIdx[1]])以下の範囲とする。存在しない場合、num_l1_weightsの値は、0に等しいと推測される。
slice_collocated_ref_idxによって参照される参照ピクチャのpic_width_in_luma_samplesおよびpic_height_in_luma_samplesの値は、それぞれ、現在のピクチャのpic_width_in_luma_samplesおよびpic_height_in_luma_samplesの値と等しく、かつRprConstraintsActive[slice_collocated_from_l0_flag?0:1][slice_collocated_ref_idx]は0に等しいことが、ビットストリーム適合の要件である。
1に等しいpps_mixed_nalu_types_in_pic_flagは、PPSを参照するIRAPピクチャでもGDRピクチャでもない各ピクチャが2つ以上のVCL NALユニットを有し、かつVCL NALユニットは同じ値のnal_unit_typeを有していないことを特定する。0に等しいpps_mixed_nalu_types_in_pic_flagは、PPSを参照するIRAPピクチャでもGDRピクチャでもない各ピクチャが1つまたは複数のVCL NALユニットを有し、かつPPSを参照する各ピクチャのVCL NALユニットが同じ値のnal_unit_typeを有していることを特定する。
1に等しいph_gdr_pic_flagは、PHに関連付けられたピクチャはGDRピクチャであることを特定する。0に等しいph_gdr_pic_flagは、PHに関連付けられたピクチャはGDRピクチャではないことを特定する。存在しない場合、ph_gdr_pic_flagの値は、0に等しいと推測される。sps_gdr_enabled_flagが0に等しい場合、ph_gdr_pic_flagの値は、0に等しいものとする。ph_gdr_or_irap_pic_flagが1に等しく、かつpps_mixed_nalu_types_in_pic_flagが1に等しい場合、ph_gdr_pic_flagの値は1に等しくなければならない。ph_gdr_or_irap_pic_flagが1に等しく、ph_gdr_pic_flagが0に等しい場合、PHに関連付けられたピクチャはIRAPピクチャである。
1に等しいpps_mixed_nalu_types_in_pic_flagは、PPSを参照する各非IRAPピクチャが2つ以上のVCL NALユニットを有し、かつVCL NALユニットが同じ値のnal_unit_typeを有していないことを特定する。0に等しいpps_mixed_nalu_types_in_pic_flagは、PPSを参照する各非IRAPピクチャが1つまたは複数のVCL NALユニットを有し、かつPPSを参照する各ピクチャのVCL NALユニットが同じ値のnal_unit_typeを有することを特定する。
ロー図である。
ロー図である。ステップ902で、プロセッサ620はシンタックス要素を受信する。シンタックス要素は、前述したようにピクチャに関連付けられたPPS内でシグナリングされるpps_mixed_nalu_types_in_pic_flagであってよい。ステップ904で、プロセッサ620はシンタックス要素の値に基づいて復号化プロセスを実施する。
Claims (5)
- ビデオコーディングのための方法であって、
復号器によって、ピクチャパラメータセット(Picture Parameter Set:PPS)に対応するピクチャが2つ以上のネットワーク抽象化層(Network Abstraction Layer:NAL)ユニットを含んでいるかどうか、および、前記2つ以上のNALユニットが同じNALユニットタイプを有しているかどうかを特定する、前記PPS内の第1のシンタックス要素を受信することと、
前記復号器によって、ピクチャヘッダ(Picture Header:PH)に対応するピクチャがイントラランダムアクセスポイント(Intra Random Access Point:IRAP)ピクチャまたは段階的復号化リフレッシュ(Gradual Decoding Refresh:GDR)ピクチャであるかどうかを特定する、前記PH内の第2のシンタックス要素を受信することと、
前記復号器によって、前記第2のシンタックス要素の値に基づいて前記第1のシンタックス要素の値を判定することと、
を含む方法であって、
前記第2のシンタックス要素の値に基づいて前記第1のシンタックス要素の値を判定することは、前記第2のシンタックス要素の値が1であると判定するのに応じて、前記復号器によって、前記第1のシンタックス要素の値が0であると判定し、0である前記第1のシンタックス要素の前記値は、前記PPSに対応する各ピクチャが2つ以上のVCL NALユニットを含んでおり、かつ前記2つ以上のVCL NALユニットが同じNALユニットタイプを有していることを特定し、1である前記第2のシンタックス要素の前記値は、前記PHに対応する前記ピクチャがIRAPピクチャまたはGDRピクチャであることを特定すること、
を含む、方法。 - 1に等しい前記第1のシンタックス要素の前記値は、前記PPSに対応する各ピクチャが2つ以上のビデオ符号化層(Video Coding Layer:VCL)NALユニットを含んでおり、かつ前記2つ以上のVCL NALユニットが同じNALユニットタイプを有していないことを特定し、0に等しい前記第2のシンタックス要素の前記値は、前記PHに対応する前記ピクチャがGDRピクチャではないことを特定する、
請求項1に記載の方法。 - ビデオコーディングのための装置であって、
1つまたは複数のプロセッサと、
前記1つまたは複数のプロセッサによって実行される命令を記憶するように構成されたメモリとを備え、
前記1つまたは複数のプロセッサは、前記命令が実行されると、請求項1または2に記載の方法を実施するように構成される、装置。 - ビデオコーディングのための非一時的コンピュータ可読記憶媒体であって、1つまたは複数のコンピュータプロセッサによって実行されると、前記1つまたは複数のコンピュータプロセッサに請求項1または2に記載の方法を実施させる、コンピュータ実行可能命令を記憶する、非一時的コンピュータ可読記憶媒体。
- プロセッサによって実行されると、請求項1または2に記載の方法を実施する命令を有する、コンピュータ可読記憶媒体に記憶されたプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2023184964A JP2024023200A (ja) | 2020-05-20 | 2023-10-27 | ビデオ符号化の際のシンタックス要素のシグナリングの方法および装置 |
JP2024031365A JP2024059937A (ja) | 2020-05-20 | 2024-03-01 | ビデオ符号化のための方法、非一時的コンピュータ可読記憶媒体、コンピュータプログラム、および、ビデオ符号化方法によって生成されるビットストリームを記憶する方法 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063027718P | 2020-05-20 | 2020-05-20 | |
US63/027,718 | 2020-05-20 | ||
PCT/US2021/033502 WO2021236988A1 (en) | 2020-05-20 | 2021-05-20 | Methods and apparatuses for signaling of syntax elements in video coding |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023184964A Division JP2024023200A (ja) | 2020-05-20 | 2023-10-27 | ビデオ符号化の際のシンタックス要素のシグナリングの方法および装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023522482A JP2023522482A (ja) | 2023-05-30 |
JP7422901B2 true JP7422901B2 (ja) | 2024-01-26 |
Family
ID=78707695
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022570739A Active JP7422901B2 (ja) | 2020-05-20 | 2021-05-20 | ビデオコーディングのための方法、装置、非一時的コンピュータ可読記憶媒体およびプログラム |
JP2023184964A Pending JP2024023200A (ja) | 2020-05-20 | 2023-10-27 | ビデオ符号化の際のシンタックス要素のシグナリングの方法および装置 |
JP2024031365A Pending JP2024059937A (ja) | 2020-05-20 | 2024-03-01 | ビデオ符号化のための方法、非一時的コンピュータ可読記憶媒体、コンピュータプログラム、および、ビデオ符号化方法によって生成されるビットストリームを記憶する方法 |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023184964A Pending JP2024023200A (ja) | 2020-05-20 | 2023-10-27 | ビデオ符号化の際のシンタックス要素のシグナリングの方法および装置 |
JP2024031365A Pending JP2024059937A (ja) | 2020-05-20 | 2024-03-01 | ビデオ符号化のための方法、非一時的コンピュータ可読記憶媒体、コンピュータプログラム、および、ビデオ符号化方法によって生成されるビットストリームを記憶する方法 |
Country Status (7)
Country | Link |
---|---|
US (1) | US20230110988A1 (ja) |
EP (1) | EP4154541A4 (ja) |
JP (3) | JP7422901B2 (ja) |
KR (2) | KR20240042167A (ja) |
CN (2) | CN117278750A (ja) |
MX (1) | MX2022014528A (ja) |
WO (1) | WO2021236988A1 (ja) |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170111642A1 (en) * | 2015-10-14 | 2017-04-20 | Qualcomm Incorporated | Support of random access and switching of layers and sub-layers in multi-layer video files |
WO2021236888A1 (en) * | 2020-05-20 | 2021-11-25 | Beijing Dajia Internet Information Technology Co., Ltd. | General constraint information and signaling of syntax elements in video coding |
-
2021
- 2021-05-20 WO PCT/US2021/033502 patent/WO2021236988A1/en unknown
- 2021-05-20 CN CN202310868493.XA patent/CN117278750A/zh active Pending
- 2021-05-20 CN CN202180036777.1A patent/CN115516864A/zh active Pending
- 2021-05-20 MX MX2022014528A patent/MX2022014528A/es unknown
- 2021-05-20 JP JP2022570739A patent/JP7422901B2/ja active Active
- 2021-05-20 KR KR1020247009097A patent/KR20240042167A/ko active Search and Examination
- 2021-05-20 KR KR1020227044648A patent/KR20230004941A/ko active IP Right Grant
- 2021-05-20 EP EP21809825.9A patent/EP4154541A4/en active Pending
-
2022
- 2022-11-18 US US17/990,654 patent/US20230110988A1/en active Pending
-
2023
- 2023-10-27 JP JP2023184964A patent/JP2024023200A/ja active Pending
-
2024
- 2024-03-01 JP JP2024031365A patent/JP2024059937A/ja active Pending
Non-Patent Citations (4)
Title |
---|
BROSS, Benjamin et al.,Versatile Video Coding (Draft 9),Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 18th Meeting: by teleconference, 15-24 April 2020, [JVET-R2001-vA],JVET-R2001 (version 10),ITU-T,2020年05月15日,<URL:https://jvet-experts.org/doc_end_user/documents/18_Alpbach/wg11/JVET-R2001-v10.zip>: JVET-R2001-vA.docx: pp.45-52,113-130 |
CHEN, Lulin et al.,AHG9: On signalling the mixed NAL unit type flag,Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 18th Meeting: by teleconference, 15-24 April 2020, [JVET-R0085-v1],JVET-R0085 (version 1),ITU-T,2020年04月03日,<URL:https://jvet-experts.org/doc_end_user/documents/18_Alpbach/wg11/JVET-R0085-v1.zip>: JVET-R0085-v1.docx: pp.1-5 |
COBAN, Muhammed et al.,AHG9: On mixed nal unit type signalling and PPS cleanup,Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 18th Meeting: by teleconference, 15-24 April 2020, [JVET-R0315],JVET-R0315 (version 3),ITU-T,2020年04月11日,<URL:https://jvet-experts.org/doc_end_user/documents/18_Alpbach/wg11/JVET-R0315-v3.zip>: JVET-R0315.docx: pp.1-7 |
XIU, Xiaoyu et al.,AHG9: On IRAP and GDR picture signaling in picture header,Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 19th Meeting: by teleconference, 22 June -1 July 2020, [JVET-S0135],JVET-S0135 (version 1),ITU-T,2020年05月23日,<URL:https://jvet-experts.org/doc_end_user/documents/19_Teleconference/wg11/JVET-S0135-v1.zip>: JVET-S0135.docx: pp.1-2 |
Also Published As
Publication number | Publication date |
---|---|
EP4154541A4 (en) | 2023-10-25 |
JP2024059937A (ja) | 2024-05-01 |
CN117278750A (zh) | 2023-12-22 |
JP2024023200A (ja) | 2024-02-21 |
MX2022014528A (es) | 2023-02-27 |
WO2021236988A1 (en) | 2021-11-25 |
KR20230004941A (ko) | 2023-01-06 |
CN115516864A (zh) | 2022-12-23 |
EP4154541A1 (en) | 2023-03-29 |
JP2023522482A (ja) | 2023-05-30 |
US20230110988A1 (en) | 2023-04-13 |
KR20240042167A (ko) | 2024-04-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7337948B2 (ja) | エンコーダ、デコーダ、および対応する方法 | |
US20230031699A1 (en) | Methods and apparatuses for signaling of syntax elements in video coding | |
US20230040224A1 (en) | Methods and apparatuses for signaling of syntax elements in video coding | |
JP7422901B2 (ja) | ビデオコーディングのための方法、装置、非一時的コンピュータ可読記憶媒体およびプログラム | |
CN115668941A (zh) | 视频编解码中语法元素的信令 | |
WO2021236888A1 (en) | General constraint information and signaling of syntax elements in video coding | |
KR102667418B1 (ko) | 비디오 코딩에서의 신택스 엘리먼트의 시그널링을 위한 방법 및 장치 | |
KR20240074008A (ko) | 비디오 코딩에서의 신택스 엘리먼트의 시그널링을 위한 방법 및 장치 | |
KR20240074908A (ko) | 비디오 코딩에서의 신택스 엘리먼트의 시그널링을 위한 방법 및 장치 | |
KR20240074907A (ko) | 비디오 코딩에서의 신택스 엘리먼트의 시그널링을 위한 방법 및 장치 | |
KR20240074009A (ko) | 비디오 코딩에서의 신택스 엘리먼트의 시그널링을 위한 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230111 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230111 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20230123 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230411 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230609 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20230627 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231027 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20231107 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231219 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240116 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7422901 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |