JP2023515626A - エンコーダ、デコーダ、および対応するシグナリングの方法、ならびにパラメータセット内のセマンティクス - Google Patents
エンコーダ、デコーダ、および対応するシグナリングの方法、ならびにパラメータセット内のセマンティクス Download PDFInfo
- Publication number
- JP2023515626A JP2023515626A JP2022552224A JP2022552224A JP2023515626A JP 2023515626 A JP2023515626 A JP 2023515626A JP 2022552224 A JP2022552224 A JP 2022552224A JP 2022552224 A JP2022552224 A JP 2022552224A JP 2023515626 A JP2023515626 A JP 2023515626A
- Authority
- JP
- Japan
- Prior art keywords
- dpb
- value
- sps
- syntax element
- syntax
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 142
- 230000011664 signaling Effects 0.000 title abstract description 29
- 230000002123 temporal effect Effects 0.000 claims abstract description 82
- 239000000872 buffer Substances 0.000 claims abstract description 59
- 238000012545 processing Methods 0.000 claims description 63
- 238000004590 computer program Methods 0.000 claims description 5
- 239000010410 layer Substances 0.000 description 149
- 238000013139 quantization Methods 0.000 description 77
- 238000000638 solvent extraction Methods 0.000 description 40
- 238000004891 communication Methods 0.000 description 38
- 238000005192 partition Methods 0.000 description 29
- 230000008569 process Effects 0.000 description 28
- 239000013598 vector Substances 0.000 description 23
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 21
- 238000010586 diagram Methods 0.000 description 19
- 230000006870 function Effects 0.000 description 19
- 230000005540 biological transmission Effects 0.000 description 16
- 238000003491 array Methods 0.000 description 14
- 241000023320 Luma <angiosperm> Species 0.000 description 11
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 11
- 238000001914 filtration Methods 0.000 description 9
- 230000000295 complement effect Effects 0.000 description 8
- 230000006835 compression Effects 0.000 description 8
- 238000007906 compression Methods 0.000 description 8
- 239000011229 interlayer Substances 0.000 description 8
- 238000009795 derivation Methods 0.000 description 7
- 230000003044 adaptive effect Effects 0.000 description 6
- 230000001419 dependent effect Effects 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 238000007781 pre-processing Methods 0.000 description 5
- 238000013500 data storage Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 238000012805 post-processing Methods 0.000 description 4
- 230000011218 segmentation Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000012937 correction Methods 0.000 description 3
- 239000000835 fiber Substances 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 2
- 101150114515 CTBS gene Proteins 0.000 description 2
- 101150039623 Clip1 gene Proteins 0.000 description 2
- 230000002146 bilateral effect Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000006837 decompression Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000009499 grossing Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000007620 mathematical function Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 101100489396 Caenorhabditis elegans zip-2 gene Proteins 0.000 description 1
- 244000050403 Iris x germanica Species 0.000 description 1
- 238000012952 Resampling Methods 0.000 description 1
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000005352 clarification Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 230000002427 irreversible effect Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 229920000069 polyphenylene sulfide Polymers 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000007727 signaling mechanism Effects 0.000 description 1
- 229910052710 silicon Inorganic materials 0.000 description 1
- 239000010703 silicon Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/184—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/187—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
- H04N19/31—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the temporal domain
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
- H04N19/423—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/119—Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
本特許出願は、2020年2月28日に出願したPCT/EP/2020/055269、2020年6月9日に出願したPCT/EP/2020/065989、および2020年6月9日に出願したPCT/EP/2020/065999の優先権を主張するものである。上述の特許出願の開示は、参照によりその全体が本明細書に組み込まれる。
第2のシンタックス要素の値がDPBシンタックス要素がDPBパラメータシンタックス構造内に存在することを指定すると判定する(判定される)とき、DPBパラメータシンタックス構造からDPBシンタックス要素の値を取得すること、または
第2のシンタックス要素の値がDPBシンタックス要素がDPBパラメータシンタックス構造内に存在しないことを指定すると判定する(判定される)とき、DPBシンタックス要素の値を、DPBパラメータシンタックス構造内の最上位の時間サブレイヤに適用される別のDPBシンタックス要素の値に等しいように設定することを含んでよい。
SPSから第3のシンタックス要素の値を取得するステップであって、第3のシンタックス要素の値が、ビデオシーケンス内に存在する時間サブレイヤの最大数を決定するために使用される、ステップをさらに含む。第3のシンタックス要素の値は、1つの時間サブレイヤのみ存在する場合、0であってよい。ビデオシーケンス内に存在する時間サブレイヤの最大数の決定は、コーディング効率に関して有利である場合がある、単に第3のシンタックス要素をシグナリングすることによって容易にされる。
第1のシンタックス要素の値がDPBパラメータシンタックス構造がSPS内に存在することを指定すると判定する(判定される)とき、第3のシンタックス要素の値に基づいて、ビデオビットストリーム内の時間サブレイヤの最大数が1よりも大きいかどうかを判定することと、時間サブレイヤの最大数が1より大きいと判定する(判定される)とき、SPSから第2のシンタックス要素の値を取得することとを含んでよい。たとえば、時間サブレイヤの最大数が1より大きいと判定されるときにのみ、第2のシンタックス要素の値が、SPSから取得されてよい。それによって、時間レイヤの最大数が1以下である(すなわち、1つの時間サブレイヤのみ存在する)場合、第2のシンタックス要素の値がまったく読まれない可能性があり(たとえば、この場合に、それが無意味になる場合)、単一の時間レイヤに関して、DPBシンタックス要素がSPS内で常にシグナリングされる可能性があるので、コーディング効率がさらに高められる場合がある。
SPS内の復号ピクチャバッファDPBパラメータシンタックス構造の存在を判定するステップと、
SPS内のDPBパラメータシンタックス構造の存在の判定に基づいて、第1のシンタックス要素(たとえば、フラグ)の値をSPSに符号化するステップであって、第1のシンタックス要素の値が、DPBパラメータシンタックス構造がSPS内に存在するかどうかを指定するために使用される、ステップと、
DPBパラメータシンタックス構造がSPS内に存在すると判定するとき(判定されるとき、たとえば、判定されるときにのみ)、DPBパラメータシンタックス構造内のDPBシンタックス要素の存在を判定するステップであって、DPBシンタックス要素が、ビデオシーケンス内の最上位の時間サブレイヤを除く時間サブレイヤに適用される、ステップと、
DPBパラメータシンタックス構造内のDPBシンタックス要素の存在の判定に基づいて、第2のシンタックス要素(たとえば、フラグ)の値をSPSに符号化するステップであって、第2のシンタックス要素の値が、DPBパラメータシンタックス構造内のDPBシンタックス要素の存在を指定するために使用される、ステップとを含む。
SPSから第1のシンタックス要素(たとえば、フラグ)の値を取得するように構成された取得ユニットであって、第1のシンタックス要素の値が、復号ピクチャバッファDPBパラメータシンタックス構造がビデオビットストリーム内にコーディングされたSPS内に存在するかどうかを指定するために使用される、取得ユニットと、
第1のシンタックス要素の値がDPBパラメータシンタックス構造がSPS内に存在することを指定するかどうかを判定するように構成された判定ユニットとを含み、
取得ユニットは、少なくとも、第1のシンタックス要素の値がDPBパラメータシンタックス構造がSPS内に存在することを指定すると判定するとき(判定されるとき、たとえば、判定されるときにのみ)、SPSから第2のシンタックス要素(たとえば、フラグ)の値を取得するようにさらに構成され、第2のシンタックス要素の値は、DPBパラメータシンタックス構造内のDPBシンタックス要素の存在を指定するために使用され、DPBシンタックス要素は、ビデオシーケンス内の最上位の時間サブレイヤを除く時間サブレイヤに適用される。
第2のシンタックス要素の値がDPBシンタックス要素がDPBパラメータシンタックス構造内に存在することを指定すると判定する(判定される)とき、DPBパラメータシンタックス構造からDPBシンタックス要素の値を取得すること、または
第2のシンタックス要素の値がDPBシンタックス要素がDPBパラメータシンタックス構造内に存在しないことを指定すると判定する(判定される)とき、DPBシンタックス要素の値を、DPBパラメータシンタックス構造内の最上位の時間サブレイヤに適用される別のDPBシンタックス要素の値に等しいように設定することを含んでよい。
第1のシンタックス要素の値がDPBパラメータシンタックス構造がSPS内に存在することを指定すると判定する(判定される)とき、第3のシンタックス要素の値に基づいて、ビデオビットストリーム内の時間サブレイヤの最大数が1よりも大きいかどうかを判定することと、時間サブレイヤの最大数が1より大きいと判定する(判定される)とき、SPSから第2のシンタックス要素の値を取得することとを含んでよい。
SPS内の復号ピクチャバッファDPBパラメータシンタックス構造の存在を判定するように構成された判定ユニットと、
SPS内のDPBパラメータシンタックス構造の存在の判定に基づいて、第1のシンタックス要素(たとえば、フラグ)の値をSPSに符号化するように構成された符号化ユニットであって、第1のシンタックス要素の値が、DPBパラメータシンタックス構造がSPS内に存在するかどうかを指定するために使用される、符号化ユニットとを含み、
判定ユニットは、DPBパラメータシンタックス構造がSPS内に存在すると判定するとき(判定されるとき、たとえば、判定されるときにのみ)、DPBパラメータシンタックス構造内のDPBシンタックス要素の存在を判定するようにさらに構成され、DPBシンタックス要素は、ビデオシーケンス内の最上位の時間サブレイヤを除く時間サブレイヤに適用され、
符号化ユニットは、DPBパラメータシンタックス構造内のDPBシンタックス要素の存在の判定に基づいて、第2のシンタックス要素(たとえば、フラグ)の値をSPSに符号化するようにさらに構成され、第2のシンタックス要素の値は、DPBパラメータシンタックス構造内のDPBシンタックス要素の存在を指定するために使用される。
図2は、本出願の技術を実装するように構成される例示的なビデオエンコーダ20の概略的なブロック図を示す。図2の例において、ビデオエンコーダ20は、入力201(または入力インターフェース201)、残差計算ユニット204、変換処理ユニット206、量子化ユニット208、逆量子化ユニット210、逆変換処理ユニット212、再構築ユニット214、ループフィルタユニット220、復号ピクチャバッファ(DPB: decoded picture buffer)230、モード選択ユニット260、エントロピー符号化ユニット270、および出力272(または出力インターフェース272)を含む。モード選択ユニット260は、インター予測ユニット244、イントラ予測ユニット254、および区分けユニット262を含む可能性がある。インター予測ユニット244は、動き推定ユニットおよび動き補償ユニット(図示せず)を含む可能性がある。図2に示されたビデオエンコーダ20は、ハイブリッドビデオエンコーダまたはハイブリッドビデオコーデックによるビデオエンコーダとも呼ばれる可能性がある。
エンコーダ20は、たとえば、入力201を介してピクチャ17(またはピクチャデータ17)、たとえば、ビデオまたはビデオシーケンスを形成するピクチャのシーケンスのピクチャを受け取るように構成される可能性がある。受け取られたピクチャまたはピクチャデータは、前処理されたピクチャ19(または前処理されたピクチャデータ19)である可能性もある。簡単にするために、以下の説明は、ピクチャ17に言及する。ピクチャ17は、(特に、ビデオコーディングにおいて、現在のピクチャをその他のピクチャ、たとえば、同じビデオシーケンス、つまり、現在のピクチャも含むビデオシーケンスの既に符号化されたおよび/または復号されたピクチャと区別するために)現在のピクチャまたはコーディングされるピクチャとも呼ばれる可能性がある。
残差計算ユニット204は、たとえば、サンプル毎に(ピクセル毎に)ピクチャブロック203のサンプル値から予測ブロック265のサンプル値を差し引いてサンプル領域において残差ブロック205を取得することによって、ピクチャブロック203および予測ブロック265(予測ブロック265についてのさらなる詳細は後で与えられる)に基づいて残差ブロック205(残差205とも呼ばれる)を計算するように構成される可能性がある。
変換処理ユニット206は、残差ブロック205のサンプル値に対して変換、たとえば、離散コサイン変換(DCT)または離散サイン変換(DST)を適用して変換領域において変換係数207を取得するように構成される可能性がある。変換係数207は、変換残差係数とも呼ばれ、変換領域において残差ブロック205を表現する可能性がある。
量子化ユニット208は、たとえば、スカラー量子化またはベクトル量子化を適用することによって変換係数207を量子化して量子化された係数209を取得するように構成される可能性がある。量子化された係数209は、量子化された変換係数209または量子化された残差係数209とも呼ばれる可能性がある。
逆量子化ユニット210は、たとえば、量子化ユニット208と同じ量子化ステップサイズに基づいてまたはそれを使用して、量子化ユニット208により適用された量子化方式の逆を適用することによって、量子化された係数に量子化ユニット208の逆量子化を適用して量子化解除された係数211を取得するように構成される。量子化解除された係数211は、量子化解除された残差係数211とも呼ばれ、--量子化による損失が原因で概して変換係数と同一ではないが--変換係数207に対応する可能性がある。
逆変換処理ユニット212は、変換処理ユニット206によって適用された変換の逆変換、たとえば、逆離散コサイン変換(DCT)または逆離散サイン変換(DST)またはその他の逆変換を適用してサンプル領域において再構築された残差ブロック213(または対応する量子化解除された係数213)を取得するように構成される。再構築された残差ブロック213は、変換ブロック(transform block)213とも呼ばれる可能性がある。
再構築ユニット214(たとえば、加算器または合算器214)は、たとえば、再構築された残差ブロック213のサンプル値と予測ブロック265のサンプル値とを--サンプル毎に--足すことによって予測ブロック265に変換ブロック213(すなわち、再構築された残差ブロック213)を足してサンプル領域において再構築されたブロック215を取得するように構成される。
ループフィルタユニット220(または短く「ループフィルタ」220)は、再構築されたブロック215をフィルタリングしてフィルタリングされたブロック221を取得する、または概して、再構築されたサンプルをフィルタリングしてフィルタリングされたサンプルを取得するように構成される。ループフィルタユニットは、たとえば、ピクセルの遷移を平滑化するかまたはそれ以外の方法でビデオの品質を改善するように構成される。ループフィルタユニット220は、デブロッキングフィルタ、サンプル適応オフセット(SAO: sample-adaptive offset)フィルタ、または1つもしくは複数のその他のフィルタ、たとえば、バイラテラルフィルタ、適応ループフィルタ(ALF: adaptive loop filter)、鮮鋭化、平滑化フィルタ、もしくは共同フィルタ(collaborative filter)、もしくはこれらの任意の組合せなどの1つまたは複数のループフィルタを含む可能性がある。ループフィルタユニット220は図2にループ内フィルタであるものとして示されるが、その他の構成において、ループフィルタユニット220は、ループ後フィルタとして実装される可能性がある。フィルタリングされたブロック221は、フィルタリングされた再構築されたブロック221とも呼ばれる可能性がある。
復号ピクチャバッファ(DPB)230は、ビデオエンコーダ20によってビデオデータを符号化するための参照ピクチャまたは概して参照ピクチャデータを記憶するメモリである可能性がある。DPB230は、同期DRAM(SDRAM)を含むダイナミックランダムアクセスメモリ(DRAM)、磁気抵抗RAM(MRAM)、抵抗変化型RAM(RRAM: resistive RAM)、またはその他の種類のメモリデバイスなどの様々なメモリデバイスのいずれかによって形成される可能性がある。復号ピクチャバッファ(DPB)230は、1つまたは複数のフィルタリングされたブロック221を記憶するように構成される可能性がある。復号ピクチャバッファ230は、同じ現在のピクチャまたは異なるピクチャ、たとえば、既に再構築されたピクチャのその他の既にフィルタリングされたブロック、たとえば、既に再構築され、フィルタリングされたブロック221を記憶するようにさらに構成される可能性があり、たとえば、インター予測のために、完全な既に再構築された、つまり、復号されたピクチャ(および対応する参照ブロックおよびサンプル)ならびに/または部分的に再構築された現在のピクチャ(および対応する参照ブロックおよびサンプル)を提供する可能性がある。復号ピクチャバッファ(DPB)230は、たとえば、再構築されたブロック215がループフィルタユニット220によってフィルタリングされない場合、1つもしくは複数のフィルタリングされていない再構築されたブロック215もしくは概してフィルタリングされていない再構築されたサンプルを記憶し、または再構築されたブロックもしくはサンプルの任意のその他のさらに処理されたバージョンを記憶するようにも構成される可能性がある。
モード選択ユニット260は、区分けユニット262、インター予測ユニット244、およびイントラ予測ユニット254を含み、元のピクチャデータ、たとえば、元のブロック203(現在のピクチャ17の現在のブロック203)と、再構築されたピクチャデータ、たとえば、同じ(現在の)ピクチャの、および/またはたとえば復号ピクチャバッファ230もしくはその他のバッファ(たとえば、図示されていないラインバッファ)からの1つもしくは複数の既に復号されたピクチャからのフィルタリングされたおよび/またはフィルタリングされていない再構築されたサンプルまたはブロックとを受け取るかまたは取得するように構成される。再構築されたピクチャデータは、予測ブロック265または予測子(predictor)265を取得するための予測、たとえば、インター予測またはイントラ予測のための参照ピクチャデータとして使用される。
区分けユニット262は、現在のブロック203をより小さな区画、たとえば、正方形または長方形のサイズのより小さなブロックに区分けする(または分割する)可能性がある。これらのより小さなブロック(下位ブロックとも呼ばれる可能性がある)は、より一層小さな区画にさらに区分けされる可能性がある。これは、木区分けまたは階層的木区分けとも呼ばれ、たとえば、ルートツリーレベル0(階層レベル0、深さ0)のルートブロックが、再帰的に区分けされ、たとえば、次に低いツリーレベルの2つ以上のブロック、たとえば、ツリーレベル1(階層レベル1、深さ1)のノードに区分けされる可能性があり、これらのブロックが、次に低いレベル、たとえば、ツリーレベル2(階層レベル2、深さ2)の2つ以上のブロックに再び区分けされる可能性があり、たとえば、終了基準が満たされる、たとえば、最大のツリーの深さまたは最小のブロックサイズが達せられるので区分けが終了されるまで以下同様である。さらに区分けされないブロックは、木の葉ブロックまたは葉ノードとも呼ばれる。2つの区画への区分けを使用する木は、二分木(BT)と呼ばれ、3つの区画への区分けを使用する木は、三分木(TT)と呼ばれ、4つの区画への区分けを使用する木は、四分木(QT)と呼ばれる。
1組のイントラ予測モードは、たとえばHEVCにおいて定義された35個の異なるイントラ予測モード、たとえば、DC(もしくは平均)モードおよび平面モードのような非方向性モード、または方向性モードを含む可能性があり、あるいはたとえばVVCのために定義された67個の異なるイントラ予測モード、たとえば、DC(もしくは平均)モードおよび平面モードのような非方向性モード、または方向性モードを含む可能性がある。
1組の(または可能な)インター予測モードは、利用可能な参照ピクチャ(つまり、たとえば、DBP230に記憶された前の少なくとも部分的に復号されたピクチャ)ならびにその他のインター予測パラメータ、たとえば、最もよく一致する参照ブロックを探索するために参照ピクチャ全体が使用されるのかもしくは参照ピクチャの一部のみ、たとえば、現在のブロックのエリアの周りの探索窓(search window)エリアのみが使用されるか、ならびに/またはたとえば、ピクセル補間、たとえば、半/セミペル(half/semi-pel)および/もしくは4分の1ペル補間が適用されるか否かに依存する。
エントロピー符号化ユニット270は、たとえば、ビデオデコーダ30がパラメータを受信し、復号のために使用する可能性があるように、たとえば、符号化されたビットストリーム21の形態で出力272を介して出力され得る符号化されたピクチャデータ21を得るために、量子化された係数209、インター予測パラメータ、イントラ予測パラメータ、ループフィルタパラメータ、および/またはその他のシンタックス要素に対して、たとえば、エントロピー符号化アルゴリズムもしくは方式(たとえば、可変長コーディング(VLC: variable length coding)方式、コンテキスト適応VLC方式(CAVLC: context adaptive VLC)、算術コーディング方式、2値化、コンテキスト適応2値算術コーディング(CABAC: context adaptive binary arithmetic coding)、シンタックスに基づくコンテキスト適応2値算術コーディング(SBAC: syntax-based context-adaptive binary arithmetic coding)、確率間隔区分エントロピー(PIPE: probability interval partitioning entropy)コーディング、もしくは別のエントロピー符号化方法もしくは技術)またはバイパス(bypass)(非圧縮)を適用するように構成される。符号化されたビットストリーム21は、ビデオデコーダ30に送信されるか、または後の送信またはビデオデコーダ30による取り出しのためにメモリに記憶される可能性がある。
図3は、本出願の技術を実装するように構成されるビデオデコーダ30の例を示す。ビデオデコーダ30は、復号されたピクチャ331を取得するために、たとえば、エンコーダ20によって符号化された符号化されたピクチャデータ21(たとえば、符号化されたビットストリーム21)を受信するように構成される。符号化されたピクチャデータまたはビットストリームは、符号化されたピクチャデータ、たとえば、符号化されたビデオスライス(および/またはタイルグループもしくはタイル)のピクチャブロックならびに関連するシンタックス要素を表すデータを復号するための情報を含む。
エントロピー復号ユニット304は、ビットストリーム21(または概して符号化されたピクチャデータ21)を解析し、たとえば、符号化されたピクチャデータ21にエントロピー復号を実行して、たとえば、量子化された係数309ならびに/あるいは復号されたコーディングパラメータ(図3に示さず)、たとえば、インター予測パラメータ(たとえば、参照ピクチャインデックスおよび動きベクトル)、イントラ予測パラメータ(たとえば、イントラ予測モードもしくはインデックス)、変換パラメータ、量子化パラメータ、ループフィルタパラメータ、および/またはその他のシンタックス要素のいずれかまたはすべてを取得するように構成される。エントロピー復号ユニット304は、エンコーダ20のエントロピー符号化ユニット270に関連して説明された符号化方式に対応する復号アルゴリズムまたは方式を適用するように構成される可能性がある。エントロピー復号ユニット304は、インター予測パラメータ、イントラ予測パラメータ、および/またはその他のシンタックス要素をモード適用ユニット360に提供し、その他のパラメータをデコーダ30のその他のユニットに提供するようにさらに構成される可能性がある。ビデオデコーダ30は、ビデオスライスのレベルおよび/またはビデオブロックのレベルでシンタックス要素を受信する可能性がある。スライスおよびそれぞれのシンタックス要素に加えて、またはスライスおよびそれぞれのシンタックス要素の代替として、タイルグループおよび/またはタイルならびにそれぞれのシンタックス要素が、受信されるおよび/または使用される可能性がある。
逆量子化ユニット310は、(たとえば、エントロピー復号ユニット304によって、たとえば、解析および/または復号することによって)符号化されたピクチャデータ21から量子化パラメータ(QP)(または概して逆量子化に関連する情報)および量子化された係数を受け取り、復号された量子化された係数309に対して量子化パラメータに基づいて逆量子化を適用して、変換係数311とも呼ばれる可能性がある量子化解除された係数311を取得するように構成される可能性がある。逆量子化プロセスは、量子化の度合いと、同様に、適用されるべき逆量子化の度合いとを決定するために、ビデオスライス(またはタイルまたはタイルグループ)内の各ビデオブロックに関してビデオエンコーダ20によって決定された量子化パラメータを使用することを含む可能性がある。
逆変換処理ユニット312は、変換係数311とも呼ばれる量子化解除された係数311を受け取り、サンプル領域において再構築された残差ブロック213を取得するために、量子化解除された係数311に変換を適用するように構成される可能性がある。再構築された残差ブロック213は、変換ブロック313とも呼ばれる可能性がある。変換は、逆変換、たとえば、逆DCT、逆DST、逆整数変換、または概念的に同様の逆変換プロセスである可能性がある。逆変換処理ユニット312は、量子化解除された係数311に適用される変換を決定するために、(たとえば、エントロピー復号ユニット304によって、たとえば、解析および/または復号することによって)符号化されたピクチャデータ21から変換パラメータまたは対応する情報を受け取るようにさらに構成される可能性がある。
再構築ユニット314(たとえば、加算器または合算器314)は、たとえば、再構築された残差ブロック313のサンプル値と予測ブロック365のサンプル値とを足すことによって予測ブロック365に再構築された残差ブロック313を足してサンプル領域において再構築されたブロック315を取得するように構成される可能性がある。
(コーディングループ内かまたはコーディングループの後かのどちらかの)ループフィルタユニット320は、たとえば、ピクセルの遷移を平滑化するかまたはそれ以外の方法でビデオの品質を改善するために再構築されたブロック315をフィルタリングしてフィルタリングされたブロック321を取得するように構成される。ループフィルタユニット320は、デブロッキングフィルタ、サンプル適応オフセット(SAO)フィルタ、または1つもしくは複数のその他のフィルタ、たとえば、バイラテラルフィルタ、適応ループフィルタ(ALF)、鮮鋭化、平滑化フィルタ、もしくは共同フィルタ、もしくはこれらの任意の組合せなどの1つまたは複数のループフィルタを含む可能性がある。ループフィルタユニット320は図3にループ内フィルタであるものとして示されるが、その他の構成において、ループフィルタユニット320は、ループ後フィルタとして実装される可能性がある。
それから、ピクチャの復号されたビデオブロック321は、その他のピクチャに関するその後の動き補償のための参照ピクチャとしておよび/またはディスプレイ上にそれぞれ出力するために復号されたピクチャ331を記憶する復号ピクチャバッファ330に記憶される。
インター予測ユニット344は、インター予測ユニット244と(特に動き補償ユニットと)同一である可能性があり、イントラ予測ユニット354は、インター予測ユニット254と機能的に同一である可能性があり、(たとえば、エントロピー復号ユニット304によって、たとえば、解析および/または復号することによって)符号化されたピクチャデータ21から受け取られた区分けおよび/または予測パラメータまたはそれぞれの情報に基づいて分割または区分けの判断および予測を実行する。モード適用ユニット360は、予測ブロック365を得るために、(フィルタリングされたまたはフィルタリングされていない)再構築されたピクチャ、ブロック、またはそれぞれのサンプルに基づいてブロック毎に予測(イントラまたはインター予測)を実行するように構成される可能性がある。
ux = ( mvx+2bitDepth ) % 2bitDepth (1)
mvx = ( ux >= 2bitDepth-1 ) ? (ux - 2bitDepth ) : ux (2)
uy = ( mvy+2bitDepth ) % 2bitDepth (3)
mvy = ( uy >= 2bitDepth-1 ) ? (uy - 2bitDepth ) : uy (4)
式中、mvxは、画像ブロックまたは下位ブロックの動きベクトルの水平成分であり、mvyは、画像ブロックまたは下位ブロックの動きベクトルの垂直成分であり、uxおよびuyは、中間値を示す。
ux= ( mvpx + mvdx +2bitDepth ) % 2bitDepth (5)
mvx = ( ux >= 2bitDepth-1 ) ? (ux - 2bitDepth ) : ux (6)
uy= ( mvpy + mvdy +2bitDepth ) % 2bitDepth (7)
mvy = ( uy >= 2bitDepth-1 ) ? (uy - 2bitDepth ) : uy (8)
vx = Clip3(-2bitDepth-1, 2bitDepth-1 -1, vx)
vy = Clip3(-2bitDepth-1, 2bitDepth-1 -1, vy)
式中、vxは、画像ブロックまたは下位ブロックの動きベクトルの水平成分であり、vyは、画像ブロックまたは下位ブロックの動きベクトルの垂直成分であり、x、y、およびzは、MVのクリッピングプロセスの3つの入力値にそれぞれ対応し、関数Clip3の定義は、以下の通りである。
パラメータセットは、基本的に類似しており、同じ基本的な設計目標--つまり、ビットレートの効率、誤り耐性、およびシステムレイヤインターフェースの提供--を共有する。HEVC(H.265)には、AVCおよびVVCにおいてそれらに対応するものと類似しているビデオパラメータセット(VPS)、シーケンスパラメータセット(SPS)、およびピクチャパラメータセット(PPS)を含むパラメータセットの階層が存在する。各スライスは、単一のアクティブなPPS、SPS、およびVPSを参照して、スライスを復号するために使用される情報にアクセスする。PPSは、ピクチャ内のすべてのスライスに適用される情報を含み、したがって、ピクチャ内のすべてのスライスは、同じPPSを参照しなければならない。異なるピクチャのスライスが、同じPPSを参照することも許される。同様に、SPSは、同じコーディングされたビデオシーケンス(coded video sequence)内のすべてのピクチャに適用される情報を含む。
スケーラブルビデオコーディングは、ビデオを複数のレイヤにコーディングするメカニズムを提供し、各レイヤは、同じビデオシーンの品質の表現を表す。基本レイヤ(BL: base layer)は、最も低い品質の表現である。1つまたは複数の拡張レイヤ(EL: enhancement layer)は、下位レイヤを参照してコーディングされ、改善されたビデオ品質を提供する場合がある。スケーラブルコーディングされたビデオビットストリームのレイヤのサブセットを復号することは、より低い、しかし許容可能な品質のビデオをもたらす。これは、概してビットレートの低下がビデオ品質をより落ち込ませる非スケーラブルビデオビットストリームと比較してより支障の少ない劣化(more graceful degradation)を可能にする。
SPSは、コーディングされたビデオシーケンスの1つのレイヤに適用され、コーディングされたビデオシーケンス内でピクチャ毎に変化しないパラメータを含む。
シーケンスパラメータセット(SPS: sequence parameter set): 各ピクチャヘッダ内で発見されるシンタックス要素によって参照されるPPS内で発見されるシンタックス要素の内容によって決定される、0個以上のCLVS全体に適用されるシンタックス要素を含むシンタックス構造。
復号ピクチャバッファ
復号ピクチャバッファ(DPB)は、復号されたピクチャを参照のために、たとえば、インター予測のための参照ピクチャとして記憶するために使用されるバッファである。VVC草案で開示された例においては、シーケンスパラメータセット(SPS)内のDBPに関するパラメータの関連シンタックス要素が強調されている。
MaxLatencyPictures[ i ] = max_num_reorder_pics[ i ] + max_latency_increase_plus1[ i ] - 1 (112)
max_latency_increase_plus1[ i ]が0に等しいとき,対応する制限は示されない。
max_latency_increase_plus1[ i ]の値は、0および232 - 2を含んで0から232 - 2までの範囲内にある。subLayerInfoFlagが0に等しいため、0およびmaxSubLayersMinus1 - 1を含んで0からmaxSubLayersMinus1 - 1までの範囲内のiに対してmax_latency_increase_plus1[ i ]が存在しないとき、max_latency_increase_plus1[ i ]は、max_latency_increase_plus1[ maxSubLayersMinus1 ]に等しいと推測される。
VVC草案において、sps_sublayer_dpb_params_flagのセマンティクスは、以下のように定義されている。
sps_sublayer_dpb_params_flagは、SPS内のdpb_parameters( )シンタックス構造内のmax_dec_pic_buffering_minus1[ i ]、max_num_reorder_pics[ i ]、およびmax_latency_increase_plus1[ i ]シンタックス要素の存在を制御するために使用される。存在しないとき、sps_sub_dpb_params_info_present_flagの値は、0に等しいと推測される。
存在しないとき、sps_sub_dpb_params_info_present_flagの値は、0に等しいと推測される
に誤記があった。sps_sub_dpb_params_info_present_flagは他のどこにも定義されておらず、最後の文は以下のように修正される。
存在しないとき、sps_sublayer_dpb_params_flagの値は、0に等しいと推測される
第1の実施形態によれば、sps_sublayer_dpb_params_flagのセマンティクスは、以下のように修正される。
sps_sublayer_dpb_params_flagは、sps_max_sublayers_minus1が0より大きいとき、0およびsps_max_sublayers_minus1 - 1を含んで0からsps_max_sublayers_minus1 - 1までの範囲内のiに対して、SPS内のdpb_parameters( )シンタックス構造内のmax_dec_pic_buffering_minus1[ i ]、max_num_reorder_pics[ i ]、およびmax_latency_increase_plus1[ i ]シンタックス要素の存在を制御するために使用される。sps_max_sublayers_minus1が0に等しいとき、sps_sublayer_dpb_params_flagの値は0に等しいと推測され、SPSを参照する唯一のサブレイヤに関して、max_dec_pic_buffering_minus1[ 0 ]、max_num_reorder_pics[ 0 ]、およびmax_latency_increase_plus1[ 0 ]が常にシグナリングされる。
sps_sublayer_dpb_params_flagは、sps_max_sublayers_minus1が0より大きいとき、0およびsps_max_sublayers_minus1 - 1を含んで0からsps_max_sublayers_minus1 - 1までの範囲内のiに対して、SPS内のdpb_parameters( )シンタックス構造内のmax_dec_pic_buffering_minus1[ i ]、max_num_reorder_pics[ i ]、およびmax_latency_increase_plus1[ i ]シンタックス要素の存在を制御するために使用される。sps_max_sublayers_minus1が0に等しいとき、sps_sublayer_dpb_params_flagの値は1に等しいと推測され、SPSを参照する唯一のサブレイヤに関して、max_dec_pic_buffering_minus1[ 0 ]、max_num_reorder_pics[ 0 ]、およびmax_latency_increase_plus1[ 0 ]が常にシグナリングされる。
sps_sublayer_dpb_params_flagは、sps_max_sublayers_minus1が0より大きいとき、0およびsps_max_sublayers_minus1 - 1を含んで0からsps_max_sublayers_minus1 - 1までの範囲内のiに対して、SPS内のdpb_parameters( )シンタックス構造内のmax_dec_pic_buffering_minus1[ i ]、max_num_reorder_pics[ i ]、およびmax_latency_increase_plus1[ i ]シンタックス要素の存在を制御するために使用される。sps_max_sublayers_minus1が0に等しいとき、SPSを参照する唯一のサブレイヤに関して、max_dec_pic_buffering_minus1[ 0 ]、max_num_reorder_pics[ 0 ]、およびmax_latency_increase_plus1[ 0 ]が常にシグナリングされる。
sps_sublayer_dpb_params_flagは、sps_max_sublayers_minus1が0より大きいとき、0およびsps_max_sublayers_minus1 - 1を含んで0からsps_max_sublayers_minus1 - 1までの範囲内のiに対して、SPS内のdpb_parameters( )シンタックス構造内のmax_dec_pic_buffering_minus1[ i ]、max_num_reorder_pics[ i ]、およびmax_latency_increase_plus1[ i ]シンタックス要素の存在を制御するために使用される。sps_max_sublayers_minus1が0に等しいとき、sps_sublayer_dpb_params_flagの値は意味を持たず、SPSを参照する唯一のサブレイヤに関して、max_dec_pic_buffering_minus1[ 0 ]、max_num_reorder_pics[ 0 ]、およびmax_latency_increase_plus1[ 0 ]が常にシグナリングされる。
データ構造dpb_parameter( )は、SPSにおいて呼び出されるだけでなく、VPSにおいても呼び出される可能性がある。以下は、dpb_parameter( )が呼び出されるVPSのスナップショットである。
ならびに
vps_sublayer_dpb_params_flagは、VPS内のdpb_parameters( )シンタックス構造内のmax_dec_pic_buffering_minus1[ ]、max_num_reorder_pics[ ]、およびmax_latency_increase_plus1[ ]シンタックス要素の存在を制御するために使用される。存在しないとき、vps_sub_dpb_params_info_present_flagは、0に等しいと推測される。
一例において、vps_sublayer_dpb_params_present_flagのセマンティクスは、以下のように修正される。
vps_sublayer_dpb_params_present_flagは、VPS内のvps_dpb_max_tid[ i ]が0より大きいとき、0およびvps_dpb_max_tid[ i ] - 1を含んで0からvps_dpb_max_tid[ i ] - 1までの範囲内のjに対して、VPS内のdpb_parameters( )シンタックス構造内のmax_dec_pic_buffering_minus1[ j ]、max_num_reorder_pics[ j ]、およびmax_latency_increase_plus1[ j ]シンタックス要素の存在を制御するために使用される。存在しないとき、vps_sub_dpb_params_info_present_flagは、0に等しいと推測される。
vps_dpb_max_tid[ i ]のiとの混同を避けるために、シンタックス要素配列max_dec_pic_buffering_minus1[ ]、max_num_reorder_pics[ ]、およびmax_latency_increase_plus1[ ]の範囲を指定するためにiではなくjが使用されることが留意される。
インター予測が実行されるとき、参照ピクチャは、同じレイヤからの復号された画像かまたは下位レイヤからの参照ピクチャであることが可能である。後者の場合、低いレイヤの参照ピクチャは、レイヤ間参照ピクチャ(ILRP: inter-layer reference picture)と呼ばれ、1つまたは複数のILRPを含む下位レイヤは、参照(または従属)レイヤと呼ばれる。
変数dependencyFlag[ i ][ j ]、NumDirectRefLayers[ i ]、DirectRefLayerIdx[ i ][ d ]、NumRefLayers[ i ]、RefLayerIdx[ i ][ r ]、およびLayerUsedAsRefLayerFlag[ j ]は、以下のように導出される。
for( i = 0; i <= vps_max_layers_minus1; i++ ) {
for( j = 0; j <= vps_max_layers_minus1; j++ ) {
dependencyFlag[ i ][ j ] = vps_direct_ref_layer_flag[ i ][ j ]
for( k = 0; k < i; k++ )
if( vps_direct_ref_layer_flag[ i ][ k ] && dependencyFlag[ k ][ j ] )
dependencyFlag[ i ][ j ] = 1
}
LayerUsedAsRefLayerFlag[ i ] = 0
}
for( i = 0; i <= vps_max_layers_minus1; i++ ) {
for( j = 0, d = 0, r = 0; j <= vps_max_layers_minus1; j++ ) { (37)
if( vps_direct_ref_layer_flag[ i ][ j ] ) {
DirectRefLayerIdx[ i ][ d++ ] = j
LayerUsedAsRefLayerFlag[ j ] = 1
}
if( dependencyFlag[ i ][ j ] )
RefLayerIdx[ i ][ r++ ] = j
}
NumDirectRefLayers[ i ] = d
NumRefLayers[ i ] = r
}
0に等しいvps_direct_ref_layer_flag[ i ][ j ]は、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤでないことを指定する。1に等しいvps_direct_ref_layer_flag[ i ][ j ]は、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであることを指定する。0およびvps_max_layers_minus1を含んで0からvps_max_layers_minus1までの範囲内のiおよびjに対してvps_direct_ref_layer_flag[ i ][ j ]が存在しないとき、vps_direct_ref_layer_flag[ i ][ j ]は、0に等しいと推測される。vps_independent_layer_flag[ i ]が0に等しいときは、vps_direct_ref_layer_flag[ i ][ j ]の値が1に等しいような、0およびi - 1を含んで0からi - 1までの範囲内のjの少なくとも1つの値が存在する。
一例において、変数dependencyFlag[ i ][ j ]、NumDirectRefLayers[ i ]、DirectRefLayerIdx[ i ][ d ]、NumRefLayers[ i ]、RefLayerIdx[ i ][ r ]、およびLayerUsedAsRefLayerFlag[ j ]の導出プロセスは、以下のように修正される。
変数dependencyFlag[ i ][ j ]、NumDirectRefLayers[ i ]、DirectRefLayerIdx[ i ][ d ]、NumRefLayers[ i ]、RefLayerIdx[ i ][ r ]、およびLayerUsedAsRefLayerFlag[ j ]は、以下のように導出される。
for( i = 0; i <= vps_max_layers_minus1; i++ ) {
for( j = 0; j < i; j++ ) {
dependencyFlag[ i ][ j ] = vps_direct_ref_layer_flag[ i ][ j ]
for( k = 0; k < i; k++ )
if( vps_direct_ref_layer_flag[ i ][ k ] && dependencyFlag[ k ][ j ] )
dependencyFlag[ i ][ j ] = 1
}
LayerUsedAsRefLayerFlag[ i ] = 0
}
for( i = 0; i <= vps_max_layers_minus1; i++ ) {
for( j = 0, d = 0, r = 0; j <i; j++ ) { (37)
if( vps_direct_ref_layer_flag[ i ][ j ] ) {
DirectRefLayerIdx[ i ][ d++ ] = j
LayerUsedAsRefLayerFlag[ j ] = 1
}
if( dependencyFlag[ i ][ j ] )
RefLayerIdx[ i ][ r++ ] = j
}
NumDirectRefLayers[ i ] = d
NumRefLayers[ i ] = r
}
別の例において、変数dependencyFlag[ i ][ j ]、NumDirectRefLayers[ i ]、DirectRefLayerIdx[ i ][ d ]、NumRefLayers[ i ]、RefLayerIdx[ i ][ r ]、およびLayerUsedAsRefLayerFlag[ j ]の導出プロセスは、以下のように修正される。
変数dependencyFlag[ i ][ j ]、NumDirectRefLayers[ i ]、DirectRefLayerIdx[ i ][ d ]、NumRefLayers[ i ]、RefLayerIdx[ i ][ r ]、およびLayerUsedAsRefLayerFlag[ j ]は、以下のように導出される。
for( i = 0; i <= vps_max_layers_minus1; i++ ) {
for( j = 0; j < i; j++ ) {
dependencyFlag[ i ][ j ] = vps_direct_ref_layer_flag[ i ][ j ]
for( k = j+1; k < i; k++ )
if( vps_direct_ref_layer_flag[ i ][ k ] && dependencyFlag[ k ][ j ] )
dependencyFlag[ i ][ j ] = 1
}
LayerUsedAsRefLayerFlag[ i ] = 0
}
for( i = 0; i <= vps_max_layers_minus1; i++ ) {
for( j = 0, d = 0, r = 0; j < i; j++ ) { (37)
if( vps_direct_ref_layer_flag[ i ][ j ] ) {
DirectRefLayerIdx[ i ][ d++ ] = j
LayerUsedAsRefLayerFlag[ j ] = 1
}
if( dependencyFlag[ i ][ j ] )
RefLayerIdx[ i ][ r++ ] = j
}
NumDirectRefLayers[ i ] = d
NumRefLayers[ i ] = r
}
別の例において、変数dependencyFlag[ i ][ j ]、NumDirectRefLayers[ i ]、DirectRefLayerIdx[ i ][ d ]、NumRefLayers[ i ]、RefLayerIdx[ i ][ r ]、およびLayerUsedAsRefLayerFlag[ j ]の導出プロセスは、以下のように修正される。
変数dependencyFlag[ i ][ j ]、NumDirectRefLayers[ i ]、DirectRefLayerIdx[ i ][ d ]、NumRefLayers[ i ]、RefLayerIdx[ i ][ r ]、およびLayerUsedAsRefLayerFlag[ j ]は、以下のように導出される。
for( i = 0; i <= vps_max_layers_minus1; i++ ) {
for( j = 0; j <= vps_max_layers_minus1; j++ ) {
dependencyFlag[ i ][ j ] = vps_direct_ref_layer_flag[ i ][ j ]
for( k = j+1; k < i; k++ )
if( vps_direct_ref_layer_flag[ i ][ k ] && dependencyFlag[ k ][ j ] )
dependencyFlag[ i ][ j ] = 1
}
LayerUsedAsRefLayerFlag[ i ] = 0
}
for( i = 0; i <= vps_max_layers_minus1; i++ ) {
for( j = 0, d = 0, r = 0; j <= vps_max_layers_minus1; j++ ) { (37)
if( vps_direct_ref_layer_flag[ i ][ j ] ) {
DirectRefLayerIdx[ i ][ d++ ] = j
LayerUsedAsRefLayerFlag[ j ] = 1
}
if( dependencyFlag[ i ][ j ] )
RefLayerIdx[ i ][ r++ ] = j
}
NumDirectRefLayers[ i ] = d
NumRefLayers[ i ] = r
}
それに対応して、vps_direct_ref_layer_flag[ i ][ j ]のセマンティクスは、以下のように変更される。
0に等しいvps_direct_ref_layer_flag[ i ][ j ]は、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤでないことを指定する。1に等しいvps_direct_ref_layer_flag[ i ][ j ]は、インデックスjを有するレイヤがインデックスiを有するレイヤの直接参照レイヤであることを指定する。1およびvps_max_layers_minus1を含んで1からvps_max_layers_minus1までの範囲内のiならびに0およびi-1を含んで0からi-1までの範囲内のjjに対してvps_direct_ref_layer_flag[ i ][ j ]が存在しないとき、vps_direct_ref_layer_flag[ i ][ j ]は、0に等しいと推測される。vps_independent_layer_flag[ i ]が0に等しいときは、vps_direct_ref_layer_flag[ i ][ j ]の値が1に等しいような、0およびi - 1を含んで0からi - 1までの範囲内のjの少なくとも1つの値が存在する。
vps_direct_ref_layer_flag[i][j]と同様の依存関係を表すいくつかのその他の変数シンタックス要素が存在し、それらの範囲が同じように変更される。
http://phenix.it-sudparis.eu/jvet/doc_end_user/documents/17_Brussels/wg11/JVET-Q2001-v13.zip
を有するITU JVET-Q2001-v13におけるSPS内でのサブピクチャのシグナリングの一部のスナップショットを示す。本出願の残りの部分において、この文書は、簡略化のためにVVC草案8と呼ばれる。
・ピクチャ内のサブピクチャiの左上の座標の水平成分を示すsubpic_ctu_top_left_x[ i ]、または
・ピクチャ内のサブピクチャiの左上の座標の垂直成分を示すsubpic_ctu_top_left_y[ i ]、または
・ピクチャ内のサブピクチャiの幅を示すsubpic_width_minus1[ i ]、または
・ピクチャ内のサブピクチャiの高さを示すsubpic_height_minus1[ i ]
CTUへのピクチャの区分け
ピクチャは、コーディングツリーユニット(CTU)のシーケンスに分割される。用語CTUは、CTB(コーディングツリーブロック)と交換可能なように使用されることがある。例において、用語CTUは、ITU-T H.265のCTUの定義と同じである。3つのサンプル配列を有するピクチャに関して、CTUは、ルマサンプルのN×Nのブロックと、クロマサンプルの2つの対応するブロックとを含む。図6は、CTUに分割されたピクチャの例を示す。CTUのサイズは、(不完全なCTUが存在し得る場合)ピクチャの境界にあるCTUを除いて同じでなければならない。
一部の例においては、タイルが有効化されるとき、ピクチャは、垂直方向および/または水平方向の境界によって分けられたCTUの長方形のグループに分割される。垂直方向および水平方向のタイルの境界は、それぞれ、 から下におよび左のピクチャの境界から右のピクチャの境界に向かってピクチャと交差する。水平方向のタイルの境界および垂直方向のタイルの境界の位置に関連するインジケーション情報が、ビットストリームにコーディングされる。
1.タイルは、左から右および上から下にラスタスキャン順にスキャンされ、これは、タイルスキャン順と呼ばれる。これは、左上のタイルから始まって、まず、同じタイル行内のすべてのタイルが左から右にスキャンされることを意味する。それから、2番目のタイル行(1つ下のタイル行)内の最初のタイルから始まって、2番目のタイル行内のすべてのタイルが左から右にスキャンされる。すべてのタイルがスキャンされるまで、このプロセスが繰り返される。
2.タイルに関して、このタイル内のCTUは、ラスタスキャン順にスキャンされる。各CTU行に関して、CTUは、左から右にスキャンされ、CTU行は、上から下にスキャンされる。図7は、タイル内のCTUのスキャン順を例示しており、CTUに対応する数字が、スキャン順を示す。
処理は、エンコーダまたはデコーダにおけるCTUの符号化または復号を指す。スキャン順は、ピクチャ内の特定の区画のインデックス付けに関連する。CTUは、指定されたスキャン順に従ってピクチャ内で昇順にインデックス付けされる。タイル内のCTUスキャン順は、タイル内のCTUがどのようにインデックス付けされるかを意味し、これは、CTUが処理される順番(すなわち、処理順)と同じでない可能性がある。
スライスの概念は、各スライスが同じピクチャのその他スライスとは独立して復号可能であるような方法でピクチャの区分けを提供し、復号は、エントロピー、残差、および予測復号を指す。タイルとの違いは、スライスが必ずしも長方形ではない任意の形状を有することができ(区分けの可能性の点でより柔軟)、スライスの区分けの目的が並列処理ではなく、送信環境におけるパケットサイズのマッチングおよび誤り耐性であることである。
サブピクチャは、ピクチャの長方形区画であってよい。サブピクチャは、ピクチャまるごとまたはピクチャの一部であることが可能である。サブピクチャは、各サブピクチャがビデオシーケンス全体のその他のサブピクチャとは独立して復号可能であるような方法でのピクチャの区分けである。VVC草案8においては、サブピクチャiに関してsubpic_treated_as_pic_flag[i]のインジケーションが真である(たとえば、subpic_treated_as_pic_flag[i]の値が1である)とき、そのサブピクチャiは、ビデオシーケンス全体のその他のサブピクチャとは独立して復号可能である。
サブピクチャ0に関して、
・subpic_ctu_top_left_x[ 0 ]は、シグナリングされず、0と推測される。
・subpic_ctu_top_left_y[ 0 ]は、シグナリングされず、0と推測される。
・subpic_width_minus1[ 0 ]、値は8である。
・subpic_height_minus1[ 0 ]、値は11である。
サブピクチャ1に関して、
・subpic_ctu_top_left_x[ 1 ]、値は9である。
・subpic_ctu_top_left_y[ 1 ]、値は0である。
・subpic_width_minus1[ 1 ]、値は8である。
・subpic_height_minus1[ 1 ]、値は5である。
サブピクチャ2に関して、
・subpic_ctu_top_left_x[ 2 ]、値は9である。
・subpic_ctu_top_left_y[ 2 ]、値は6である。
・subpic_width_minus1[ 2 ]は、シグナリングされず、8と推測される。
・subpic_height_minus1[ 2 ]は、シグナリングされず、5と推測される。
復号ピクチャバッファ
復号ピクチャバッファ(DPB)は、復号されたピクチャを参照のために、たとえば、インター予測のための参照ピクチャとして記憶するために使用されるバッファである。VVC草案(たとえば、ITU JVET-Q2001-v13)で開示された例においては、シーケンスパラメータセット(SPS)内のDBPに関するパラメータの関連シンタックス要素が強調されている。
(出力レイヤセット(OLS): レイヤの指定された組からなるレイヤの組であり、レイヤの組内の1つまたは複数のレイヤが、出力レイヤとして指定される。)
MaxLatencyPictures[ i ] = max_num_reorder_pics[ i ] + max_latency_increase_plus1[ i ] - 1 (7-111)
max_latency_increase_plus1[ i ]が0に等しいとき,対応する制限は示されない。
max_latency_increase_plus1[ i ]の値は、0および232 - 2を含んで0から232 - 2までの範囲内にある。subLayerInfoFlagが0に等しいため、0およびmaxSubLayersMinus1 - 1を含んで0からmaxSubLayersMinus1 - 1までの範囲内のiに関してmax_latency_increase_plus1[ i ]が存在しないとき、max_latency_increase_plus1[ i ]は、max_latency_increase_plus1[ maxSubLayersMinus1 ]に等しいと推測される。
第10の実施形態によれば、シンタックス要素sps_sublayer_dpb_params_flagの値が、シンタックス要素sps_ptl_dpb_hrd_params_present_flagの値に基づいてビットストリームに以下のようにコーディングされる。
第11の実施形態によれば、シンタックス要素sps_sublayer_dpb_params_flagの値が、シンタックス要素sps_ptl_dpb_hrd_params_present_flagの値に基づいてビットストリームに以下のようにコーディングされる。
第12の実施形態によれば、シンタックス要素sps_sublayer_dpb_params_flagの値が、シンタックス要素sps_ptl_dpb_hrd_params_present_flagの値に基づいてビットストリームに以下のようにコーディングされる。
スライスは、整数個の完全なタイルまたはピクチャのタイル内の整数個の連続した完全なCTU行からなる。その結果、それぞれの垂直方向のスライスの境界は、常に、垂直方向のタイルの境界でもある。スライスの水平方向の境界は、タイルの境界ではないが、タイル内の水平方向のCTUの境界からなる可能性があり、これは、タイルが複数の長方形スライスに分割され、長方形スライスの各々がタイル内の整数個の連続した完全なCTU行からなるときに発生する。
ラスタスキャンスライスの定義を以下のようにさらに制限することが、提案される。
ラスタスキャンスライスモードにおいて、スライスは、ピクチャのタイルのラスタスキャンの完全なタイルのシーケンスを含み、このピクチャは、長方形でない形状を形成する少なくとも1つのスライスを含む。
- スライスアドレスは、ラスタスキャンタイルインデックスである。
- slice_addressの長さは、Ceil( Log2( NumTilesInPic ) )ビットである。
- slice_addressの値は、0およびNumTilesInPic - 1を含んで0からNumTilesInPic - 1までの範囲内にある。
- スライスアドレスは、スライスのサブピクチャレベルスライスインデックスである。
- slice_addressの長さは、Ceil( Log2( NumSlicesInSubpic[ CurrSubpicIdx ] ) )ビットである。
- slice_addressの値は、0およびNumSlicesInSubpic[ CurrSubpicIdx ] - 1を含んで0からNumSlicesInSubpic[ CurrSubpicIdx ] - 1までの範囲内にある。
- rect_slice_flagが0に等しいか、またはsubpic_info_present_flagが0に等しい場合、slice_addressの値は、同じコーディングされたピクチャのいかなるその他のコーディングされたスライスのNALユニットのslice_addressの値とも等しくない。
- そうでない場合、slice_subpic_idの値およびslice_addressの値のペアは、同じコーディングされたピクチャのいかなるその他のコーディングされたスライスのNALユニットのslice_subpic_idの値およびslice_addressの値のペアとも等しくない。
- ピクチャのスライスの形状は、各CTUが、復号されるときに、ピクチャの境界からなるかまたは既に復号されたCTUの境界からなるその左の境界全体および上の境界全体を有するようなものである。
ビットストリームを取得するステップであって、シーケンスパラメータセットSPSが、ビットストリームにコーディングされる、ステップ、
ビットストリームに従って第1のシンタックス要素sps_max_sublayers_minus1の値を取得するステップであって、第1のシンタックス要素sps_max_sublayers_minus1の値が、SPSを参照するコーディングされたレイヤビデオシーケンスCLVS内に存在する時間サブレイヤの最大数を示すために使用される、ステップ、
ビットストリームに従って第2のシンタックス要素sps_ptl_dpb_hrd_params_present_flagの値を取得するステップであって、第2のシンタックス要素sps_ptl_dpb_hrd_params_present_flagの値が、復号ピクチャバッファDPBパラメータシンタックス構造(たとえば、dpb_prameters)がSPS内に存在するかどうかを示すために使用される、ステップ、
第1のシンタックス要素sps_max_sublayers_minus1の値が第1のデフォルト値より大きい(たとえば、第1のデフォルト値は0に等しい)とき、および第2のシンタックス要素sps_ptl_dpb_hrd_params_present_flagの値が第2のデフォルト値に等しい(たとえば、第2のデフォルト値は1に等しい)とき、ビットストリームから第3のシンタックス要素sps_sublayer_dpb_params_flagの値を解析するステップであって、第3のシンタックス要素sps_sublayer_dpb_params_flagの値が、SPS内のDPBパラメータシンタックス構造(たとえば、dpb_prameters)内のシンタックス要素(たとえば、sps_max_sublayers_minus1が0より大きいとき、0およびsps_max_sublayers_minus1 - 1を含んで0からsps_max_sublayers_minus1 - 1までの範囲のiに対するmax_dec_pic_buffering_minus1[ i ]、max_num_reorder_pics[ i ]、および/またはmax_latency_increase_plus1[ i ])の存在を制御するために使用される、ステップを含む、方法。
ビットストリームを取得するステップであって、シーケンスパラメータセットSPSが、ビットストリームにコーディングされる、ステップ、
ビットストリームに従って第1のシンタックス要素sps_max_sublayers_minus1の値を取得するステップであって、第1のシンタックス要素sps_max_sublayers_minus1の値が、SPSを参照するコーディングされたレイヤビデオシーケンスCLVS内に存在する時間サブレイヤの最大数を指定するために使用される、ステップ、
ビットストリームに従って第2のシンタックス要素sps_ptl_dpb_hrd_params_present_flagの値を取得するステップであって、第2のシンタックス要素sps_ptl_dpb_hrd_params_present_flagの値が、復号ピクチャバッファDPBパラメータシンタックス構造(たとえば、dpb_prameters)がSPS内に存在するかどうかを指定するために使用される、ステップ、
第2のシンタックス要素sps_ptl_dpb_hrd_params_present_flagの値が第2のデフォルト値に等しい(たとえば、第2のデフォルト値は1に等しい)かどうかを判定するステップ、
第2のシンタックス要素sps_ptl_dpb_hrd_params_present_flagの値が第2のデフォルト値に等しいと判定されるとき、第1のシンタックス要素sps_max_sublayers_minus1の値が第1のデフォルト値より大きい(たとえば、第1のデフォルト値は0に等しい)かどうかを判定するステップ、
第1のシンタックス要素sps_max_sublayers_minus1の値が第1のデフォルト値より大きい(たとえば、第1のデフォルト値は0に等しい)と判定されるとき、ビットストリームから第3のシンタックス要素sps_sublayer_dpb_params_flagの値を解析するステップであって、第3のシンタックス要素sps_sublayer_dpb_params_flagの値が、SPS内のDPBパラメータシンタックス構造(たとえば、dpb_prameters)内のシンタックス要素(たとえば、sps_max_sublayers_minus1が0より大きいとき、0およびsps_max_sublayers_minus1 - 1を含んで0からsps_max_sublayers_minus1 - 1までの範囲のiに対するmax_dec_pic_buffering_minus1[ i ]、max_num_reorder_pics[ i ]、および/またはmax_latency_increase_plus1[ i ])の存在を制御するために使用される、ステップを含む、方法。
インデックスiを有するレイヤのインデックスjを有する間接参照レイヤを、i未満のインデックスを有する少なくとも1つのレイヤのみから決定するステップ、
現在のピクチャに関してレイヤ間予測が有効化されるとき、インデックスjを有する間接参照レイヤ内で現在のピクチャの参照ピクチャを取得するステップ、
インデックスjを有する間接参照レイヤからの参照ピクチャを使用して現在のピクチャを予測するステップを含む、方法。
iより小さく、jより大きいインデックスを有する少なくとも1つのレイヤの中でのみ、インデックスiを有するレイヤの直接参照レイヤであるインデックスkを有するレイヤが存在すると判定するときに、インデックスiを有するレイヤのインデックスjを有する間接参照レイヤを決定するステップであって、インデックスjを有するレイヤが、インデックスkを有する直接参照レイヤの参照レイヤである、ステップ、
現在のピクチャに関してレイヤ間予測が有効化されるとき、インデックスjを有する間接参照レイヤ内で現在のピクチャの参照ピクチャを取得するステップ、
インデックスjを有する間接参照レイヤからの参照ピクチャを使用して現在のピクチャを予測するステップを含む、方法。
ビットストリームを取得するステップであって、ピクチャパラメータセットPPSが、ビットストリームにコーディングされる、ステップ、
ビットストリームに従って現在のピクチャのタイル列の数NumTileColumnsを取得する(たとえば、現在のピクチャは、長方形でない形状を形成する少なくとも1つのスライスを含む)ステップ、
ビットストリームに従って現在のピクチャのタイル行の数NumTileRowsを取得するステップ、
タイル列の数NumTileColumnsおよびタイル行の数NumTileRowsに従って変数NumTilesInPicの値を取得するステップ、
変数NumTilesInPicの値が予め設定された値よりも大きい(たとえば、予め設定された値は3である)とき、ビットストリームからシンタックス要素rect_slice_flagの値を解析するステップであって、シンタックス要素rect_slice_flagの値が、PPS内でスライス情報がシグナリングされるかどうかを指定するために使用される、ステップを含む、方法。
プロセッサに結合され、プロセッサによって実行するためのプログラミングを記憶する非一時的コンピュータ可読ストレージ媒体であって、プログラミングが、プロセッサによって実行されるときに、実施形態1から19のいずれか1つに記載の方法を実施するようにデコーダを構成する、非一時的コンピュータ可読ストレージ媒体とを含むデコーダ。
本出願において使用される数学演算子は、Cプログラミング言語において使用される数学演算子に似ている。しかし、整数の除算および算術シフト演算の結果は、より厳密に定義され、累乗および実数値の除算などの追加の演算が、定義される。付番およびカウントの規則は、概して0から始まり、たとえば、「第1」は、0番と等価であり、「第2」は、1番と等価であり、以下同様である。
以下の算術演算子が、以下の通り定義される。
+ 加算
- 減算(2引数の演算子として)または否定(単項前置演算子として)
* 行列の乗算を含む乗算
xy 累乗。xのy乗を規定する。その他の文脈で、そのような表記は、累乗として解釈されるように意図されない上付きの書き込みのために使用される。
/ 結果のゼロへの切り捨てを行う整数の除算。たとえば、7 / 4および-7 / -4は、1に切り捨てられ、-7 / 4および7 / -4は、-1に切り捨てられる。
÷ 切り捨てまたは丸めが意図されない数学的方程式の除算を表すために使用される。
x % y 法。x >= 0およびy > 0である整数xおよびyに関してのみ定義されるx割るyの余り。
以下の論理演算子が、以下の通り定義される。
x && y xおよびyのブール論理「積」
x || y xおよびyのブール論理「和」
! ブール論理「否定」
x ? y : z xが真であるかまたは0に等しくない場合、値yと評価され、そうでない場合、値zと評価される。
以下の関係演算子が、以下の通り定義される。
> より大きい
>= 以上
< 未満
<= 以下
== 等しい
!= 等しくない
以下のビット演算子が、以下の通り定義される。
& ビット毎の「論理積」。整数引数に対する演算のとき、整数値の2の補数表現に対して作用する。別の引数よりも少ないビットを含む2進数引数に対する演算のとき、より短い引数が、0に等しいさらに上位桁のビットを追加することによって拡張される。
| ビット毎の「論理和」。整数引数に対する演算のとき、整数値の2の補数表現に対して作用する。別の引数よりも少ないビットを含む2進数引数に対する演算のとき、より短い引数が、0に等しいさらに上位桁のビットを追加することによって拡張される。
^ ビット毎の「排他的論理和」。整数引数に対する演算のとき、整数値の2の補数表現に対して作用する。別の引数よりも少ないビットを含む2進数引数に対する演算のとき、より短い引数が、0に等しいさらに上位桁のビットを追加することによって拡張される。
x>>y xの2の補数による整数の表現の、2進数のy桁分の算術右シフト。この関数は、yの非負の整数値に対してのみ定義される。右シフトの結果として最上位ビット(MSB)にシフトされるビットは、シフト演算の前のxのMSBに等しい値を有する。
x<<y xの2の補数による整数の表現の、2進数のy桁分の算術左シフト。この関数は、yの非負の整数値に対してのみ定義される。左シフトの結果として最下位ビット(LSB)にシフトされるビットは、0に等しい値を有する。
以下の算術演算子が、以下の通り定義される。
= 代入演算子
++ インクリメント、つまり、x++は、x = x + 1と等価であり、配列のインデックスに使用されるとき、インクリメント演算の前に変数の値と評価される。
-- デクリメント、つまり、x--は、x = x - 1と等価であり、配列のインデックスに使用されるとき、デクリメント演算の前に変数の値と評価される。
+= 指定された量のインクリメント、つまり、x += 3は、x = x + 3と等価であり、x += (-3)は、x = x + (-3)と等価である。
-= 指定された量のデクリメント、つまり、x -= 3は、x = x - 3と等価であり、x -= (-3)は、x = x - (-3)と等価である。
以下の表記が、値の範囲を指定するために使用される。
x = y..z xは、x、y、およびzが整数値であり、zがyよりも大きいものとして、yおよびzを含んでyからzまでの整数値を取る。
以下の数学関数が、定義される。
Atan( x ) 引数xに作用し、ラジアンを単位として-π÷2およびπ÷2を含んで-π÷2からπ÷2までの範囲の出力値を有する三角法の逆正接関数
Clip1Y( x ) = Clip3( 0, ( 1 << BitDepthY ) - 1, x )
Clip1C( x ) = Clip3( 0, ( 1 << BitDepthC ) - 1, x )
Floor(x) x以下の最大の整数。
Log2( x ) xの2を底とする対数。
Log10( x ) xの10を底とする対数。
Tan( x ) ラジアンを単位とする引数xに作用する三角法の正接関数
式中の優先順位が括弧を使用して明示されないとき、以下のルールが、適用される。
- より高い優先度の演算は、より低い優先度のいかなる演算よりも前に評価される。
- 同じ優先度の演算は、左から右に順に評価される。
本文中、以下の形態で、すなわち、
if( 条件0 )
ステートメント0
else if( 条件1 )
ステートメント1
...
else /* 残りの条件に関する情報を伝えるコメント */
ステートメントn
の形態で数学的に記述される論理演算のステートメントは、以下のように記述される可能性がある。
以下のように... / ...以下が適用される。
- 条件0の場合、ステートメント0
- そうではなく、条件1の場合、ステートメント1
- ...
- それ以外の場合(残りの条件に関する情報を伝えるコメント)、ステートメントn
if( 条件0a && 条件0b )
ステートメント0
else if( 条件1a || 条件1b )
ステートメント1
...
else
ステートメントn
の形態で数学的に記述される論理演算のステートメントは、以下のように記述される可能性がある。
以下のように... / ...以下が適用される。
- 以下の条件のすべてが真である場合、ステートメント0
- 条件0a
- 条件0b
- そうでなく、以下の条件のうちの1つまたは複数が真である場合、ステートメント1
- 条件1a
- 条件1b
- ...
- それ以外の場合、ステートメントn
if( 条件0 )
ステートメント0
if( 条件1 )
ステートメント1
の形態で数学的に記述される論理演算のステートメントは、以下のように記述される可能性がある。
条件0のとき、ステートメント0
条件1のとき、ステートメント1
10 ビデオコーディングシステム、コーディングシステム
12 送信元デバイス
13 符号化されたピクチャデータ、通信チャネル
14 送信先デバイス
16 ピクチャソース
17 ピクチャ、ピクチャデータ、生ピクチャ、生ピクチャデータ、モノクロピクチャ、カラーピクチャ、現在のピクチャ
18 プリプロセッサ、前処理ユニット、ピクチャプリプロセッサ
19 前処理されたピクチャ、前処理されたピクチャデータ
20 ビデオエンコーダ、エンコーダ
21 符号化されたピクチャデータ、符号化されたビットストリーム
22 通信インターフェース、通信ユニット
28 通信インターフェース、通信ユニット
30 デコーダ、ビデオデコーダ
31 復号されたピクチャデータ、復号されたピクチャ
32 ポストプロセッサ、後処理ユニット
33 後処理されたピクチャデータ、後処理されたピクチャ
34 ディスプレイデバイス
46 処理回路
100 ビデオエンコーダ
201 入力、入力インターフェース
203 ピクチャブロック、元のブロック、現在のブロック、区分けされたブロック、現在のピクチャブロック
204 残差計算ユニット、残差計算
205 残差ブロック、残差
206 変換処理ユニット、変換
207 変換係数
208 量子化ユニット、量子化
209 量子化された係数、量子化された変換係数、量子化された残差係数
210 逆量子化ユニット、逆量子化
211 量子化解除された係数、量子化解除された残差係数
212 逆変換処理ユニット、(逆)変換
213 再構築された残差ブロック、逆量子化された係数、変換ブロック
214 再構築ユニット、加算器、合算器
215 再構築されたブロック
216 バッファ
220 ループフィルタユニット、ループフィルタ
221 フィルタリングされたブロック、フィルタリングされた再構築されたブロック
230 復号ピクチャバッファ(DPB)
231 復号されたピクチャ
244 インター予測ユニット
254 イントラ予測ユニット、インター予測ユニット、イントラ予測
260 モード選択ユニット
262 区分けユニット、区分け
265 予測ブロック、予測子
266 シンタックス要素
270 エントロピー符号化ユニット、エントロピーコーディング
272 出力、出力インターフェース
304 エントロピー復号ユニット、残差計算、エントロピー復号
309 量子化された係数
310 逆量子化ユニット、逆量子化
311 量子化解除された係数、変換係数
312 逆変換処理ユニット、(逆)変換、出力
313 再構築された残差ブロック
314 再構築ユニット、合算器、加算器
315 再構築されたブロック
320 ループフィルタ、ループフィルタユニット、ループフィルタリングユニット
321 フィルタリングされたブロック、復号されたビデオブロック
330 復号ピクチャバッファ(DPB)、復号ピクチャバッファ(DBP)
331 復号されたピクチャ
344 インター予測ユニット
354 イントラ予測ユニット、イントラ予測
360 モード適用ユニット
362 区分け
365 予測ブロック
400 ビデオコーディングデバイス
410 着信ポート、入力ポート
420 受信機ユニット(Rx)
430 プロセッサ、論理ユニット、中央演算処理装置(CPU)
440 送信機ユニット(Tx)
450 発信ポート、出力ポート
460 メモリ
470 コーディングモジュール
500 装置
502 プロセッサ
504 メモリ
506 データ
508 オペレーティングシステム
510 アプリケーションプログラム
512 バス
514 二次ストレージ
518 ディスプレイ
1600 ビデオ復号装置
1610 取得ユニット
1620 判定ユニット
1700 ビデオ符号化装置
1710 判定ユニット
1720 符号化ユニット
3100 コンテンツ供給システム
3102 キャプチャデバイス
3104 通信リンク
3106 端末デバイス
3108 スマートフォン、スマートパッド
3110 コンピュータ、ラップトップ
3112 ネットワークビデオレコーダ(NVR)/デジタルビデオレコーダ(DVR)
3114 TV
3116 セットトップボックス(STB)
3118 テレビ会議システム
3120 ビデオ監視システム
3122 携帯情報端末(PDA)
3124 車載デバイス
3126 ディスプレイ
3202 プロトコル進行ユニット
3204 多重分離ユニット
3206 ビデオデコーダ
3208 オーディオデコーダ
3210 字幕デコーダ
3212 同期ユニット
3214 ビデオ/オーディオディスプレイ
3216 ビデオ/オーディオ/字幕ディスプレイ
Claims (21)
- 復号デバイスによって実施される、ビデオビットストリームを復号する方法であって、シーケンスパラメータセットSPSが、前記ビデオビットストリームにコーディングされ、ビデオシーケンスに適用されるシンタックス要素を含み、方法が、
前記SPSから第1のシンタックス要素の値を取得するステップ(1410)であって、前記第1のシンタックス要素の前記値が、復号ピクチャバッファDPBパラメータシンタックス構造が前記SPS内に存在するかどうかを指定するために使用される、ステップ(1410)と、
少なくとも、前記第1のシンタックス要素の前記値が前記DPBパラメータシンタックス構造が前記SPS内に存在することを指定すると判定するときに、前記SPSから第2のシンタックス要素の値を取得するステップ(1420)であって、前記第2のシンタックス要素の前記値が、前記DPBパラメータシンタックス構造内のDPBシンタックス要素の存在を指定するために使用され、前記DPBシンタックス要素が、前記ビデオシーケンス内の最上位の時間サブレイヤを除く時間サブレイヤに適用される、ステップ(1420)とを含む、方法。 - 前記第2のシンタックス要素の前記値に基づいて前記DPBシンタックス要素の値を取得するステップと、
前記DPBシンタックス要素の前記値に基づいて前記ビデオシーケンスを再構築するステップとをさらに含む請求項1に記載の方法。 - 前記第2のシンタックス要素の前記値に基づいて前記DPBシンタックス要素の前記値を取得するステップが、
前記第2のシンタックス要素の前記値が前記DPBシンタックス要素が前記DPBパラメータシンタックス構造内に存在することを指定すると判定するとき、前記DPBパラメータシンタックス構造から前記DPBシンタックス要素の前記値を取得すること、または
前記第2のシンタックス要素の前記値が前記DPBシンタックス要素が前記DPBパラメータシンタックス構造内に存在しないことを指定すると判定するとき、前記DPBシンタックス要素の前記値を、前記DPBパラメータシンタックス構造内の前記最上位の時間サブレイヤに適用される別のDPBシンタックス要素の値に等しいように設定することを含む請求項2に記載の方法。 - 前記DPBシンタックス要素の前記値に基づいて前記ビデオシーケンスを再構築するステップが、前記DPBシンタックス要素の前記値に基づいてDPBを構成することと、前記DPBを使用して前記ビデオシーケンスを再構築することとを含む請求項2または3に記載の方法。
- 前記DPBシンタックス要素の前記値に基づいて前記ビデオシーケンスを再構築するステップが、使用されるDPBが前記DPBシンタックス要素の前記値によって指定された要件を満たすという判定に基づいて前記ビデオシーケンスを再構築することを含む請求項2または3に記載の方法。
- 前記SPSから第3のシンタックス要素の値を取得するステップであって、前記第3のシンタックス要素の前記値が、前記ビデオシーケンス内に存在する時間サブレイヤの最大数を決定するために使用される、ステップをさらに含む請求項1から5のいずれか一項に記載の方法。
- 前記SPSから前記第2のシンタックス要素の前記値を取得するステップが、
前記第1のシンタックス要素の前記値が前記DPBパラメータシンタックス構造が前記SPS内に存在することを指定すると判定するとき、前記第3のシンタックス要素の前記値に基づいて、前記ビデオビットストリーム内の前記時間サブレイヤの前記最大数が1よりも大きいかどうかを判定することと、
時間サブレイヤの前記最大数が1より大きいと判定するとき、前記SPSから前記第2のシンタックス要素の前記値を取得することとを含む請求項6に記載の方法。 - 符号化デバイスによって実施される、ビデオビットストリームを符号化する方法であって、シーケンスパラメータセットSPSが、前記ビデオビットストリームに符号化され、ビデオシーケンスに適用されるシンタックス要素を含み、方法が、
前記SPS内の復号ピクチャバッファDPBパラメータシンタックス構造の存在を判定するステップ(1510)と、
前記SPS内の前記DPBパラメータシンタックス構造の前記存在の判定に基づいて、第1のシンタックス要素の値を前記SPSに符号化するステップ(1520)であって、前記第1のシンタックス要素の前記値が、前記DPBパラメータシンタックス構造が前記SPS内に存在するかどうかを指定するために使用される、ステップ(1520)と、
前記DPBパラメータシンタックス構造が前記SPS内に存在すると判定するとき、前記DPBパラメータシンタックス構造内のDPBシンタックス要素の存在を判定するステップ(1530)であって、前記DPBシンタックス要素が、前記ビデオシーケンス内の最上位の時間サブレイヤを除く時間サブレイヤに適用される、ステップ(1530)と、
前記DPBパラメータシンタックス構造内の前記DPBシンタックス要素の前記存在の判定に基づいて、第2のシンタックス要素の値を前記SPSに符号化するステップ(1540)であって、前記第2のシンタックス要素の前記値が、前記DPBパラメータシンタックス構造内の前記DPBシンタックス要素の前記存在を指定するために使用される、ステップ(1540)とを含む、方法。 - 前記DPBシンタックス要素が前記DPBパラメータシンタックス構造内に存在すると判定するとき、前記DPBシンタックス要素の値を決定するステップと、前記DPBシンタックス要素の前記値に基づいて前記ビデオシーケンスを再構築するステップとをさらに含む請求項8に記載の方法。
- 前記DPBシンタックス要素の前記値を、前記DPBパラメータシンタックス構造内の前記最上位の時間サブレイヤに適用される別のDPBシンタックス要素の値に等しいように設定するステップと、前記DPBシンタックス要素の前記値に基づいて前記ビデオシーケンスを再構築するステップとをさらに含む請求項8に記載の方法。
- 前記DPBシンタックス要素の前記値に基づいて前記ビデオシーケンスを再構築するステップが、前記DPBシンタックス要素の前記値を満たすようにDPBを構成することと、前記DPBを使用して前記ビデオシーケンスを再構築することとを含む請求項9または10に記載の方法。
- 前記DPBパラメータシンタックス構造が前記SPS内に存在すると判定され、前記ビデオビットストリーム内の時間サブレイヤの最大数が1より大きいとき、前記DPBパラメータシンタックス構造内のDPBシンタックス要素の存在が判定される請求項8から11のいずれか一項に記載の方法。
- コーディングされたビデオビットストリームを復号するための装置(1600)であって、
前記ビデオビットストリームにコーディングされたSPSから第1のシンタックス要素の値を取得するように構成された取得ユニット(1610)であって、前記第1のシンタックス要素の前記値が、復号ピクチャバッファDPBパラメータシンタックス構造が前記SPS内に存在するかどうかを指定するために使用される、取得ユニット(1610)と、
前記第1のシンタックス要素の前記値が前記DPBパラメータシンタックス構造が前記SPS内に存在することを指定するかどうかを判定するように構成された判定ユニット(1620)とを含み、
前記取得ユニットが、少なくとも、前記第1のシンタックス要素の前記値が前記DPBパラメータシンタックス構造が前記SPS内に存在することを指定すると判定するときに、前記SPSから第2のシンタックス要素の値を取得するようにさらに構成され、前記第2のシンタックス要素の前記値が、前記DPBパラメータシンタックス構造内のDPBシンタックス要素の存在を指定するために使用され、前記DPBシンタックス要素が、前記ビデオシーケンス内の最上位の時間サブレイヤを除く時間サブレイヤに適用される、装置(1600)。 - ビデオビットストリームを符号化するための装置(1700)であって、
前記ビデオビットストリームに符号化されたSPS内の復号ピクチャバッファDPBパラメータシンタックス構造の存在を判定するように構成された判定ユニット(1710)と、
前記SPS内の前記DPBパラメータシンタックス構造の前記存在の判定に基づいて、第1のシンタックス要素の値を前記SPSに符号化するように構成された符号化ユニット(1720)であって、前記第1のシンタックス要素の前記値が、前記DPBパラメータシンタックス構造が前記SPS内に存在するかどうかを指定するために使用される、符号化ユニット(1720)とを含み、
前記判定ユニット(1710)が、前記DPBパラメータシンタックス構造が前記SPS内に存在すると判定するとき、前記DPBパラメータシンタックス構造内のDPBシンタックス要素の存在を判定するようにさらに構成され、前記DPBシンタックス要素が、前記ビデオシーケンス内の最上位の時間サブレイヤを除く時間サブレイヤに適用され、
前記符号化ユニット(1720)が、前記DPBパラメータシンタックス構造内の前記DPBシンタックス要素の前記存在の判定に基づいて、第2のシンタックス要素の値を前記SPSに符号化するようにさらに構成され、前記第2のシンタックス要素の前記値が、前記DPBパラメータシンタックス構造内の前記DPBシンタックス要素の前記存在を指定するために使用される、装置(1700)。 - 請求項8から12のいずれか一項に記載の方法を実施するための処理回路を含むエンコーダ。
- 請求項1から7のいずれか一項に記載の方法を実行するための処理回路を含むデコーダ。
- コンピュータまたはプロセッサ上で実行されるときに請求項1から12のいずれか一項に記載の方法を実行するためのプログラムコードを含むコンピュータプログラム製品。
- 1つまたは複数のプロセッサと、
前記プロセッサに結合され、前記プロセッサによって実行するためのプログラミングを記憶する非一時的コンピュータ可読ストレージ媒体であって、前記プログラミングが、前記プロセッサによって実行されるときに、請求項1から7のいずれか一項に記載の方法を実行するようにデコーダを構成する、非一時的コンピュータ可読ストレージ媒体と
を含むデコーダ。 - 1つまたは複数のプロセッサと、
前記プロセッサに結合され、前記プロセッサによって実行するためのプログラミングを記憶する非一時的コンピュータ可読ストレージ媒体であって、前記プログラミングが、前記プロセッサによって実行されるときに、請求項8から12のいずれか一項に記載の方法を実施するようにエンコーダを構成する、非一時的コンピュータ可読ストレージ媒体とを含むエンコーダ。 - コンピュータデバイスによって実行されるとき、前記コンピュータデバイスに請求項1から12のいずれか一項に記載の方法を実行させるプログラムコードを運ぶ非一時的コンピュータ可読媒体。
- 符号化されたビットストリームを含む非一時的ストレージ媒体であって、前記ビットストリームが、ビデオ信号または画像信号の現在のピクチャを複数のブロックに分割することによって生成され、複数のシンタックス要素を含み、前記複数のシンタックス要素が、SPS内の第1のシンタックス要素を含み、前記第1のシンタックス要素の値が、復号ピクチャバッファDPBパラメータシンタックス構造が前記SPS内に存在するかどうかを指定するために使用され、前記第1のシンタックス要素の前記値が前記DPBパラメータシンタックス構造が前記SPS内に存在することを指定する場合、前記ビットストリームが、前記SPS内の第2のシンタックス要素をさらに含み、前記第2のシンタックス要素の値が、前記DPBパラメータシンタックス構造内のDPBシンタックス要素の存在を指定するために使用され、前記DPBシンタックス要素が、前記ビデオシーケンス内の最上位の時間サブレイヤを除く時間サブレイヤに適用される、非一時的ストレージ媒体。
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP2020055269 | 2020-02-28 | ||
EPPCT/EP2020/055269 | 2020-02-28 | ||
EPPCT/EP2020/065999 | 2020-06-09 | ||
EPPCT/EP2020/065989 | 2020-06-09 | ||
EP2020065989 | 2020-06-09 | ||
EP2020065999 | 2020-06-09 | ||
PCT/CN2021/078313 WO2021170124A1 (en) | 2020-02-28 | 2021-02-27 | An encoder, a decoder and corresponding methods of signaling and semantics in parameter sets |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023515626A true JP2023515626A (ja) | 2023-04-13 |
Family
ID=77490726
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022552224A Pending JP2023515626A (ja) | 2020-02-28 | 2021-02-27 | エンコーダ、デコーダ、および対応するシグナリングの方法、ならびにパラメータセット内のセマンティクス |
Country Status (10)
Country | Link |
---|---|
US (2) | US11533497B2 (ja) |
EP (1) | EP4101171A4 (ja) |
JP (1) | JP2023515626A (ja) |
KR (1) | KR20220143936A (ja) |
CN (1) | CN115211114A (ja) |
AU (1) | AU2021225986A1 (ja) |
CA (1) | CA3169560A1 (ja) |
CL (1) | CL2022002338A1 (ja) |
MX (1) | MX2022010702A (ja) |
WO (1) | WO2021170124A1 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021091256A1 (ko) * | 2019-11-05 | 2021-05-14 | 엘지전자 주식회사 | 영상/비디오 코딩 방법 및 장치 |
CA3173179A1 (en) * | 2020-03-24 | 2021-09-30 | Biao Wang | An encoder, a decoder and corresponding methods for video or picture bitstream |
KR20220161441A (ko) * | 2020-03-31 | 2022-12-06 | 인터디지털 브이씨 홀딩스 프랑스 | 비디오 인코딩 및 디코딩을 위한 방법 및 장치 |
WO2021222813A1 (en) * | 2020-05-01 | 2021-11-04 | Beijing Dajia Internet Information Technology Co., Ltd. | High-level syntax for video coding |
US11503342B2 (en) * | 2020-06-10 | 2022-11-15 | Sharp Kabushiki Kaisha | Systems and methods for signaling sequence parameter information in video coding |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
PL2901688T3 (pl) * | 2012-09-28 | 2020-05-18 | Nokia Technologies Oy | Aparat i sposób do kodowania i dekodowania wideo |
SG10201913551WA (en) | 2013-04-07 | 2020-03-30 | Dolby Int Ab | Signaling change in output layer sets |
US9819941B2 (en) * | 2013-10-10 | 2017-11-14 | Qualcomm Incorporated | Signaling for sub-decoded picture buffer (sub-DPB) based DPB operations in video coding |
US10205954B2 (en) * | 2013-10-23 | 2019-02-12 | Qualcomm Incorporated | Carriage of video coding standard extension bitstream data using MPEG-2 systems |
JP6472449B2 (ja) * | 2014-01-02 | 2019-02-20 | シャープ株式会社 | ビデオシーケンスを復号するための方法 |
WO2015102042A1 (en) | 2014-01-02 | 2015-07-09 | Sharp Kabushiki Kaisha | Parameter set signaling |
US10306269B2 (en) * | 2014-10-10 | 2019-05-28 | Qualcomm Incorporated | Operation point for carriage of layered HEVC bitstream |
-
2021
- 2021-02-27 CA CA3169560A patent/CA3169560A1/en active Pending
- 2021-02-27 KR KR1020227033091A patent/KR20220143936A/ko active Search and Examination
- 2021-02-27 AU AU2021225986A patent/AU2021225986A1/en active Pending
- 2021-02-27 CN CN202180017572.9A patent/CN115211114A/zh active Pending
- 2021-02-27 JP JP2022552224A patent/JP2023515626A/ja active Pending
- 2021-02-27 EP EP21760115.2A patent/EP4101171A4/en active Pending
- 2021-02-27 WO PCT/CN2021/078313 patent/WO2021170124A1/en unknown
- 2021-02-27 MX MX2022010702A patent/MX2022010702A/es unknown
-
2022
- 2022-02-25 US US17/681,003 patent/US11533497B2/en active Active
- 2022-08-26 CL CL2022002338A patent/CL2022002338A1/es unknown
- 2022-12-15 US US18/066,863 patent/US11943459B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US20230199203A1 (en) | 2023-06-22 |
US20220182649A1 (en) | 2022-06-09 |
CN115211114A (zh) | 2022-10-18 |
CA3169560A1 (en) | 2021-09-02 |
AU2021225986A1 (en) | 2022-09-29 |
WO2021170124A1 (en) | 2021-09-02 |
MX2022010702A (es) | 2022-11-10 |
EP4101171A1 (en) | 2022-12-14 |
US11943459B2 (en) | 2024-03-26 |
EP4101171A4 (en) | 2023-06-07 |
CL2022002338A1 (es) | 2023-03-31 |
US11533497B2 (en) | 2022-12-20 |
KR20220143936A (ko) | 2022-10-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11533497B2 (en) | Encoder, a decoder and corresponding methods of signaling and semantics in parameter sets | |
JP2023508060A (ja) | ビデオコーディングのためのクロスコンポーネント適応ループフィルタリング | |
JP7391991B2 (ja) | イントラ平滑化のための方法および装置 | |
JP7483869B2 (ja) | エンコーダ、デコーダ、および対応する方法 | |
JP7372465B2 (ja) | シーケンスパラメータセット内でのサブピクチャのシグナリングのためのエンコーダ、デコーダ、および対応する方法 | |
US11729391B2 (en) | Encoder, a decoder and corresponding methods simplifying signaling slice header syntax elements | |
JP2022541700A (ja) | イントラ予測モードに関連するエンコーダ、デコーダ、および対応する方法 | |
JP7328446B2 (ja) | クロミナンス量子化パラメータのシグナリングのための方法及び装置 | |
JP2023512694A (ja) | 高レベルシンタックスのシグナリングについてのエンコーダ、デコーダ、および対応する方法 | |
WO2021190525A1 (en) | An encoder, a decoder and corresponding methods | |
JP2023100701A (ja) | イントラ予測のためのイントラモードコーディングを使用するエンコーダ、デコーダ、および対応する方法 | |
JP7509902B2 (ja) | スライス用のピクチャパーティション情報をシグナリングするためのデコーダ及び対応する方法 | |
JP7414976B2 (ja) | エンコーダ、デコーダ、および、対応する方法 | |
WO2021185278A1 (en) | An encoder, a decoder and corresponding methods | |
JP7524327B2 (ja) | エンコーダ、デコーダ、および対応する方法 | |
JP2023509052A (ja) | エンコーダ、デコーダ、および対応する方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221111 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221111 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20231227 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240115 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20240415 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240716 |