JP7436646B2 - ピクチャヘッダのシグナリングを簡略化するためのエンコーダ、デコーダ及び対応する方法 - Google Patents
ピクチャヘッダのシグナリングを簡略化するためのエンコーダ、デコーダ及び対応する方法 Download PDFInfo
- Publication number
- JP7436646B2 JP7436646B2 JP2022521534A JP2022521534A JP7436646B2 JP 7436646 B2 JP7436646 B2 JP 7436646B2 JP 2022521534 A JP2022521534 A JP 2022521534A JP 2022521534 A JP2022521534 A JP 2022521534A JP 7436646 B2 JP7436646 B2 JP 7436646B2
- Authority
- JP
- Japan
- Prior art keywords
- picture
- slice
- inter
- pic
- flag
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 106
- 230000011664 signaling Effects 0.000 title description 12
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 claims description 85
- 241000023320 Luma <angiosperm> Species 0.000 claims description 64
- 238000005192 partition Methods 0.000 claims description 55
- 238000012545 processing Methods 0.000 claims description 50
- 239000013598 vector Substances 0.000 claims description 39
- 238000000354 decomposition reaction Methods 0.000 claims description 19
- 230000002123 temporal effect Effects 0.000 claims description 16
- 238000013139 quantization Methods 0.000 description 77
- 230000006854 communication Effects 0.000 description 29
- 238000004891 communication Methods 0.000 description 29
- 239000000872 buffer Substances 0.000 description 20
- 230000008569 process Effects 0.000 description 20
- 230000006870 function Effects 0.000 description 18
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 15
- 238000010586 diagram Methods 0.000 description 14
- 230000005540 biological transmission Effects 0.000 description 13
- 238000000638 solvent extraction Methods 0.000 description 13
- 230000009466 transformation Effects 0.000 description 9
- 230000000295 complement effect Effects 0.000 description 8
- 238000001914 filtration Methods 0.000 description 8
- 230000003044 adaptive effect Effects 0.000 description 7
- 238000003491 array Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 6
- 230000006835 compression Effects 0.000 description 6
- 238000007906 compression Methods 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 5
- 238000007781 pre-processing Methods 0.000 description 5
- 230000002457 bidirectional effect Effects 0.000 description 4
- 238000013500 data storage Methods 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 239000011449 brick Substances 0.000 description 3
- 238000004590 computer program Methods 0.000 description 3
- 238000012805 post-processing Methods 0.000 description 3
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 2
- VBRBNWWNRIMAII-WYMLVPIESA-N 3-[(e)-5-(4-ethylphenoxy)-3-methylpent-3-enyl]-2,2-dimethyloxirane Chemical compound C1=CC(CC)=CC=C1OC\C=C(/C)CCC1C(C)(C)O1 VBRBNWWNRIMAII-WYMLVPIESA-N 0.000 description 2
- 101150039623 Clip1 gene Proteins 0.000 description 2
- 230000002146 bilateral effect Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000009795 derivation Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 238000009499 grossing Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000007620 mathematical function Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 229920000069 polyphenylene sulfide Polymers 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 241001502919 Gambusia luma Species 0.000 description 1
- 241001674048 Phthiraptera Species 0.000 description 1
- 238000012952 Resampling Methods 0.000 description 1
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000007175 bidirectional communication Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000002427 irreversible effect Effects 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 229910052710 silicon Inorganic materials 0.000 description 1
- 239000010703 silicon Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/96—Tree coding, e.g. quad-tree coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/20—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/44—Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
本特許出願は、2019年10月10日に出願された米国仮出願第62/913,730号に対する優先権を主張し、その全内容を参照により援用する。
本出願(開示)の実施形態は、概してピクチャ処理の分野に関し、より詳細には、ピクチャのシグナリングを簡略化することに関する。
現在ピクチャがIピクチャであるか否かを決定するステップと、
ビットストリームを復号デバイスに送信するステップであり、ビットストリームのピクチャヘッダは、現在ピクチャがIピクチャであるか否かを示すフラグを含み、現在ピクチャがIピクチャであるとき、インター予測のために設計されたシンタックスエレメントはピクチャヘッダでシグナリングされず、或いは、現在ピクチャがP又はBピクチャであるとき、インター予測のために設計されたシンタックスエレメントはピクチャヘッダでシグナリングされる、ステップとを含む。
図2は、本願の技術を実現するように構成された例示的なビデオエンコーダ20の概略ブロック図を示す。図2の例では、ビデオエンコーダ20は、入力201(又は入力インタフェース201)と、残差計算ユニット204と、変換処理ユニット206と、量子化ユニット208と、逆量子化ユニット210と、逆変換処理ユニット212と、再構成ユニット214と、ループフィルタユニット220と、復号ピクチャバッファ(DPB, decoded picture buffer)230と、モード選択ユニット260と、エントロピー符号化ユニット270と、出力272(又は出力インタフェース272)とを含む。モード選択ユニット260は、インター予測ユニット244と、イントラ予測処理ユニット254と、パーティションユニット262とを含んでもよい。インター予測ユニット244は、動き推定ユニット及び動き補償ユニット(図示せず)を含んでもよい。図2に示すようなビデオエンコーダ20はまた、ハイブリッドビデオエンコーダ又はハイブリッドビデオコーデックによるビデオエンコーダとも呼ばれてもよい。
エンコーダ20は、例えば、入力201を介して、ピクチャ17(又はピクチャデータ17)、例えば、ビデオ又はビデオシーケンスを形成するピクチャのシーケンスのピクチャを受信するように構成されてもよい。受信したピクチャ又はピクチャデータはまた、前処理ピクチャ19(前処理ピクチャデータ19)でもよい。簡潔にするために、以下の説明はピクチャ17を参照する。ピクチャ17はまた、(特に、ビデオコーディングにおいて、現在ピクチャを他のピクチャ、例えば、同じビデオシーケンス、すなわち、現在ピクチャも含むビデオシーケンスの前に符号化及び/又は復号されたピクチャと区別するために)現在ピクチャ又はコーディングされるべきピクチャとも呼ばれてもよい。
残差計算ユニット204は、ピクチャブロック203及び予測ブロック265(予測ブロック265に関する更なる詳細は以下に提供される)に基づいて、例えば、サンプル毎に(ピクセル毎に)ピクチャブロック203のサンプル値から予測ブロック265のサンプル値を減算して、サンプルドメインにおける残差ブロック205を取得することにより、残差ブロック205を計算するように構成されてもよい。
変換処理ユニット206は、残差ブロック205のサンプル値に対して変換、例えば、離散コサイン変換(DCT, discrete cosine transform)又は離散サイン変換(DST, discrete sine transform)を適用して、変換ドメインにおける変換係数207を取得するように構成されてもよい。変換係数207はまた、変換残差係数とも呼ばれ、変換ドメインにおける残差ブロック205を表してもよい。
量子化ユニット208は、例えば、スカラー量子化又はベクトル量子化を適用することにより、変換係数207を量子化して、量子化された係数209を取得するように構成されてもよい。量子化された係数209はまた、量子化された変換係数209又は量子化された残差係数209とも呼ばれてもよい。
逆量子化ユニット210は、例えば、量子化ユニット208と同じ量子化ステップサイズに基づいて或いはこれを使用して、量子化ユニット208により適用された量子化方式の逆を適用することにより、量子化された係数に対して量子化ユニット208の逆量子化を適用して、反量子化された係数211を取得するように構成される。反量子化された係数211はまた、反量子化された残差係数211とも呼ばれ、典型的には量子化による損失のため変換係数と同一ではないが、変換係数207に対応してもよい。
逆変換処理ユニット212は、変換処理ユニット206により適用された変換の逆変換、例えば、逆離散コサイン変換(DCT, discrete cosine transform)若しくは逆離散サイン変換(DST, discrete sine transform)又は他の逆変換を適用して、サンプルドメインにおける再構成された残差ブロック213(又は対応する反量子化された係数213)を取得するように構成される。再構成された残差ブロック213はまた、変換ブロック213とも呼ばれてもよい。
再構成ユニット214(例えば、加算器又は合計器214)は、変換ブロック213(すなわち、再構成された残差ブロック213)を予測ブロック265に加算して、例えば、再構成された残差ブロック213のサンプル値と予測ブロック265のサンプル値とをサンプル毎に加算することにより、サンプルドメインにおける再構成されたブロック215を取得するように構成される。
ループフィルタユニット220(又は略して「ループフィルタ」220)は、再構成されたブロック215をフィルタリングして、フィルタリングされたブロック221を取得するように、或いは一般的に、再構成されたサンプルをフィルタリングして、フィルタリングされたサンプルを取得するように構成される。ループフィルタユニットは、例えば、ピクセル遷移を平滑化するように、或いは、ビデオ品質を改善するように構成される。ループフィルタユニット220は、デブロッキングフィルタ、サンプル適応オフセット(SAO, sample-adaptive offset)フィルタ又は1つ以上の他のフィルタ、例えば、バイラテラルフィルタ、適応ループフィルタ(ALF, adaptive loop filter)、シャープ化、平滑化フィルタ若しくは協調フィルタ、又はこれらのいずれかの組み合わせのような1つ以上のループフィルタを含んでもよい。ループフィルタユニット220はインループフィルタであるとして図2に示されているが、他の構成では、ループフィルタユニット220はポストループフィルタとして実現されてもよい。フィルタリングされたブロック221はまた、フィルタリングされた再構成ブロック221とも呼ばれてもよい。
復号ピクチャバッファ(DPB, decoded picture buffer)230は、ビデオエンコーダ20によりビデオデータを符号化するために、参照ピクチャ又は一般的に参照ピクチャデータを記憶するメモリでもよい。DPB230は、シンクロナスDRAM(SDRAM, synchronous DRAM)を含むダイナミックランダムアクセスメモリ(DRAM, dynamic random access memory)、磁気抵抗RAM(MRAM, magnetoresistive RAM)、抵抗RAM(RRAM, resistive RAM)、又は他のタイプのメモリデバイスのような様々なメモリデバイスのうちいずれかにより形成されてもよい。復号ピクチャバッファ(DPB, decoded picture buffer)230は、1つ以上のフィルタリングされたブロック221を記憶するように構成されてもよい。復号ピクチャバッファ230は、同じ現在ピクチャ又は異なるピクチャ、例えば、前に再構成されたピクチャの他の前にフィルタリングされたブロック、例えば、前に再構成されてフィルタリングされたブロック221を記憶するように更に構成されてもよく、例えば、インター予測のために、完全な前に再構成された、すなわち、復号されたピクチャ(及び対応する参照ブロック及びサンプル)、及び/又は部分的に再構成された現在ピクチャ(及び対応する参照ブロック及びサンプル)を提供してもよい。復号ピクチャバッファ(DPB, decoded picture buffer)230はまた、1つ以上のフィルタリングされていない再構成ブロック215、又は一般的には、例えば、再構成されたブロック215がループフィルタユニット220によりフィルタリングされない場合には、フィルタリングされていない再構成サンプル、又は再構成されたブロック若しくはサンプルのいずれかの他の更に処理されたバージョンを記憶するように構成されてもよい。
モード選択ユニット260は、パーティションユニット262と、インター予測ユニット244と、イントラ予測ユニット254とを含み、元のピクチャデータ、例えば、元のブロック203(現在ピクチャ17の現在ブロック203)と、再構成ピクチャデータ、例えば、同じ(現在)ピクチャの及び/又は1つ又は複数の前に復号されたピクチャからの、例えば、復号ピクチャバッファ230又は他のバッファ(例えば、図示しないラインバッファ)からのフィルタリングされた及び/又はフィルタリングされていない再構成サンプル又はブロックとを受信又は取得するように構成される。再構成ピクチャデータは、予測ブロック265又は予測子265を取得するために、予測、例えば、インター予測又はイントラ予測のための参照ピクチャデータとして使用される。
パーティションユニット262は、現在ブロック203を、より小さいパーティション、例えば正方形又は長方形サイズのより小さいブロックにパーティション(又は分割)してもよい。これらのより小さいブロック(サブブロックとも呼ばれてもよい)は、一層小さいパーティションに更にパーティションされてもよい。これはまた、ツリーパーティション又は階層ツリーパーティションとも呼ばれ、例えば、ルートツリーレベル0(階層レベル0、深度0)におけるルートブロックは、再帰的にパーティションされ、例えば、次のより下のツリーレベルの2つ以上のブロック、例えば、ツリーレベル1(階層レベル1、深度1)におけるノードにパーティションされてもよく、これらのブロックは、例えば、終了基準が充足されたため、例えば、最大ツリー深度又は最小ブロックサイズに達したため、パーティションが終了するまで、再び、次のより下のツリーレベル、例えば、ツリーレベル2(階層レベル2、深度2)の2つ以上のブロックにパーティションされる、等でもよい。更にパーティションされないブロックはまた、ツリーのリーフブロック又はリーフノードとも呼ばれる。2つのパーティションへのパーティションを使用するツリーは、二分木(BT, binary-tree)と呼ばれ、3つのパーティションへのパーティションを使用するツリーは三分木(TT, ternary-tree)と呼ばれ、4つのパーティションへのパーティションを使用するツリーは四分木(QT, quad-tree)と呼ばれる。
イントラ予測モードのセットは、35個の異なるイントラ予測モード、例えば、DC(又は平均)モード及びプラナーモードのような非方向性モード、又は例えば、HEVCで定義されたような方向性モードを含んでもよく、或いは、67個の異なるイントラ予測モード、例えば、DC(又は平均)モード及びプラナーモードのような非方向性モード、又は例えば、VVCについて定義されたような方向性モードを含んでもよい。
インター予測モードのセット(又は可能なもの)は、利用可能な参照ピクチャ(すなわち、例えば、DBP230に記憶された、前の少なくとも部分的に復号されたピクチャ)及び他のインター予測パラメータ、例えば、最良の適合する参照ブロックを探索するために全体の参照ピクチャが使用されるか、参照ピクチャの部分のみ、例えば、現在ブロックの領域の周辺の探索ウインドウ領域が使用されるか、及び/又は、例えば、ピクセル補間、例えばハーフ/セミペル及び/又は4分の1ペル補間が適用されるか否かに依存する。
エントロピー符号化ユニット270は、量子化された係数209、インター予測パラメータ、イントラ予測パラメータ、ループフィルタパラメータ及び/又は他のシンタックスエレメントに対して、例えば、エントロピー符号化アルゴリズム又は方式(例えば、可変長コーディング(VLC, variable length coding)方式、コンテキスト適応型VLC方式(CAVLC, context adaptive VLC, scheme)、算術コーディング方式、二値化、コンテキスト適応型バイナリ算術コーディング(CABAC, context adaptive binary arithmetic coding)、シンタックスベースのコンテキスト適応型バイナリ算術コーディング(SBAC, syntax-based context-adaptive binary arithmetic coding)、確率区間区分エントロピー(PIPE, probability interval partitioning entropy)コーディング又は他のエントロピー符号化方法若しくは技術)を適用するか或いは迂回して(非圧縮)、例えば、符号化ビットストリーム21の形式で出力272を介して出力できる符号化ピクチャデータ21を取得するように構成され、それにより、例えば、ビデオデコーダ30は、復号のためにパラメータを受信して使用してもよい。符号化ビットストリーム21は、ビデオデコーダ39に送信されてもよく、或いは、ビデオデコーダ30による後の送信又は取り出しのためにメモリに記憶されてもよい。
図3は、本願の技術を実現するように構成されたビデオデコーダ30の例を示す。ビデオデコーダ30は、復号ピクチャ331を取得するために、例えば、エンコーダ20により符号化された符号化ピクチャデータ21(例えば、符号化ビットストリーム21)を受信するように構成される。符号化ピクチャデータ又はビットストリームは、符号化ピクチャデータを複合するための情報、例えば、符号化ビデオスライス(及び/又はタイルグループ又はタイル)のピクチャブロック及び関連するシンタックスエレメントを表すデータを含む。
エントロピー復号ユニット304は、ビットストリーム21(又は一般的には符号化ピクチャデータ21)をパースし、例えば、符号化ピクチャデータ21に対してエントロピー復号を実行して、例えば、量子化された係数309及び/又は復号されたコーディングパラメータ(図3に図示せず)、例えば、インター予測パラメータ(例えば、参照ピクチャインデックス及び動きベクトル)、イントラ予測パラメータ(例えば、イントラ予測モード又はインデックス)、変換パラメータ、量子化パラメータ、ループフィルタパラメータ及び/又は他のシンタックスエレメントのうちいずれか又は全てを取得するように構成される。エントロピー復号ユニット304は、エンコーダ20のエントロピー符号化ユニット270に関して説明したような符号化方式に対応する復号アルゴリズム又は方式を適用するように構成されてもよい。エントロピー復号ユニット304は、インター予測パラメータ、イントラ予測パラメータ及び/又は他のシンタックスエレメントをモード適用ユニット360に提供し、他のパラメータをデコーダ30の他のユニットに提供するように更に構成されてもよい。ビデオデコーダ30は、ビデオスライスレベル及び/又はビデオブロックレベルのシンタックスエレメントを受信してもよい。スライス及びそれぞれのシンタックスエレメントに加えて或いはその代替として、タイルグループ及び/又はタイル及びそれぞれのシンタックスエレメントが受信及び/又は使用されてもよい。
逆量子化ユニット310は、符号化ピクチャデータ21から(例えば、エントロピー復号ユニット304により例えばパース及び/又は復号することにより)量子化パラメータ(QP, quantization parameter)(又は一般的に逆量子化に関する情報)及び量子化された係数を受信し、量子化パラメータに基づいて、復号済みの量子化された係数309に対して逆量子化を適用して、変換係数311とも呼ばれてもよい反量子化された係数311を取得するように構成されてもよい。逆量子化プロセスは、量子化の程度、及び同様に適用されるべき逆量子化の程度を決定するために、ビデオスライス(又はタイル若しくはタイルグループ)内の各ビデオブロックについてビデオエンコーダ20により決定された量子化パラメータの使用を含んでもよい。
逆変換処理ユニット312は、変換係数311とも呼ばれる反量子化された係数311を受信し、サンプルドメインにおいて再構成された残差ブロック213を取得するために反量子化された係数311に変換を適用するように構成されてもよい。再構成された残差ブロック213はまた、変換ブロック313とも呼ばれてもよい。変換は、逆変換、例えば、逆DCT、逆DST、逆整数変換又は概念的に同様の逆変換プロセスでもよい。逆変換処理ユニット312は、符号化ピクチャデータ21から(例えば、エントロピー復号ユニット304により例えばパース及び/又は復号することにより)変換パラメータ又は対応する情報を受信して、反量子化された係数311に適用されるべき変換を決定するように更に構成されてもよい。
再構成ユニット314(例えば、加算器又は合計器314)は、再構成された残差ブロック313を予測ブロック365に加算して、例えば、再構成された残差ブロック313のサンプル値と予測ブロック365のサンプル値とを加算することにより、サンプルドメインにおける再構成されたブロック315を取得するように構成されてもよい。
(コーディングループ内又はコーディングループの後のいずれかの)ループフィルタユニット320は、再構成されたブロック315をフィルタリングして、フィルタリングされたブロック321を取得するように、例えば、ピクセル遷移を円滑化するように或いはビデオ品質を改善するように構成される。ループフィルタユニット320は、デブロッキングフィルタ、サンプル適応オフセット(SAO, sample-adaptive offset)フィルタ又は1つ以上の他のフィルタ、例えば、バイラテラルフィルタ、適応ループフィルタ(ALF, adaptive loop filter)、シャープ化、平滑化フィルタ若しくは協調フィルタ、又はこれらのいずれかの組み合わせのような1つ以上のループフィルタを含んでもよい。ループフィルタユニット320はインループフィルタであるとして図3に示されるが、他の構成では、ループフィルタユニット320はポストループフィルタとして実現されてもよい。
ピクチャの復号ビデオブロック321は、次いで、他のピクチャのための後の動き補償のための参照ピクチャとして及び/又はそれぞれの表示の出力のために復号ピクチャ331を記憶する復号ピクチャバッファ330に記憶される。
インター予測ユニット344は、インター予測ユニット244(特に、動き補償ユニット)と同一でもよく、イントラ予測ユニット354は、インター予測ユニット254と機能的に同一でもよく、パーティション及び/又は予測パラメータ又は符号化ピクチャデータ21から(例えば、エントロピー復号ユニット304により例えばパース及び/又は復号することにより)受信したそれぞれの情報に基づいて、分割又はパーティション判断及び予測を実行する。モード適用ユニット360は、再構成ピクチャ、ブロック又はそれぞれの(フィルタリングされた或いはフィルタリングされていない)サンプルに基づいて、ブロック毎に予測(イントラ又はインター予測)を実行して、予測ブロック365を取得するように構成されてもよい。
ux=(mvx+2bitDepth)%2bitDepth (1)
mvx=(ux>=2bitDepth-1)?(ux-2bitDepth):ux (2)
uy=(mvy+2bitDepth)%2bitDepth (3)
mvy=(uy>=2bitDepth-1)?(uy-2bitDepth):uy (4)
ここで、mvxは画像ブロック又はサブブロックの動きベクトルの水平成分であり、mvyは画像ブロック又はサブブロックの動きベクトルの垂直成分であり、ux及びuyは中間値を示す。
ux=(mvpx+mvdx+2bitDepth)%2bitDepth (5)
mvx=(ux>=2bitDepth-1)?(ux-2bitDepth):ux (6)
uy=(mvpy+mvdy+2bitDepth)%2bitDepth (7)
mvy=(uy>=2bitDepth-1)?(uy-2bitDepth):uy (8)
vx=Clip3(-2bitDepth-1,2bitDepth-1-1,vx)
vy=Clip3(-2bitDepth-1,2bitDepth-1-1,vy)
ここで、vxは画像ブロック又はサブブロックの動きベクトルの水平成分であり、vyは画像ブロック又はサブブロックの動きベクトルの垂直成分であり、x、y及びzはそれぞれMVクリッピングプロセスの3つの入力値に対応し、関数Clip3の定義は以下の通りである。
最新技術のコーデックにおけるパラメータセットは、基本的に同様であり、同じ基本的な設計目標、すなわち、ビットレート効率、エラー回復力及びシステムレイヤインタフェースの提供を共有する。HEVC(H.265)では、ビデオパラメータセット(VPS, Video Parameter Set)、シーケンスパラメータセット(SPS, Sequence Parameter Set)及びピクチャパラメータセット(PPS, Picture Parameter Set)を含むパラメータセットの階層が存在し、これらはAVC及びVVCにおけるこれらの対応するものと同様である。各スライスは、スライスを復号するために使用される情報にアクセスするために、単一のアクティブなPPS、SPS及びVPSを参照する。PPSは、ピクチャ内の全てのスライスに適用する情報を含み、したがって、ピクチャ内の全てのスライスは、同じPPSを参照しなければならない。異なるピクチャ内のスライスも、同じPPSを参照することが許可される。同様に、SPSは、同じコーディングされたビデオシーケンス内の全てのピクチャに適用する情報を含む。
PPSは、同じコーディングされたビデオシーケンス内の異なるピクチャについて変化し得るパラメータを含む。しかし、複数のピクチャは、異なるスライスコーディングタイプ(I、P及びB)を有するものであっても、同じPPSを参照してもよい。スライスヘッダ内ではなくピクチャパラメータセット内にこれらのパラメータを含めることは、ビットレート効率を改善でき、PPSがより信頼性が高く送信されるとき、エラー回復力を提供できる。
シンタックスエレメントの値が1である場合、時間MV予測は、当該PPSを参照するスライスで無効化される。
シンタックスエレメントの値が2である場合、時間MV予測は、当該PPSを参照するスライスで有効化される。
シンタックスエレメントの値が0である場合、スライスの時間MV予測の適用を制御するために、第2のシンタックスエレメントがスライスヘッダに含まれる。従来技術(JVET-O2001-vE)によれば、0に等しいpps_temporal_mvp_enabled_idcは、PPSを参照するスライスのIに等しくないslice_typeを有するスライスのスライスヘッダにシンタックスエレメントslice_temporal_mvp_enabled_flagが存在することを指定する。1又は2に等しいpps_temporal_mvp_enabled_idcは、PPSを参照するスライスのスライスヘッダにslice_temporal_mvp_enabled_flagが存在しないことを指定する。3に等しいpps_temporal_mvp_enabled_idcは、ITU-T|ISO/IECによる将来の使用のために留保される。
・tile_cols_width_minus1は、ピクチャがタイルに均等に分割されるときのCTBの単位での各タイルの幅を指定する。
・tile_rows_height_minus1は、ピクチャがタイルに均等に分割されるときのCTBの単位での各タイルの高さを指定する。
・num_tile_columns_minus1は、ピクチャ内のタイル列の数を指定する。
・num_tile_rows_minus1は、ピクチャ内のタイル行の数を指定する。
最新技術のビデオコーデックでは、ビットストリームは、ネットワーク抽象レイヤ(NAL, network abstraction layer)ユニットと呼ばれるデータユニットのシーケンスから構成される。いくつかのNALユニットは、全体のコーディングされたビデオシーケンス又はその中のピクチャのサブセットに関するハイレベルな情報を搬送するパラメータセットを含む。他のNALユニットは、様々なピクチャタイプの1つに属するスライスの形式でコーディングされたサンプルを搬送する。適応パラメータセット(APS, adaptation parameter set)は、ALFフィルタ制御データ(例えば、フィルタ係数)をカプセル化するために使用されるパラメータセットである。
スライスセグメントヘッダは、参照PPSへのインデックスを含む。スライスセグメントヘッダは、スライスの開始アドレスを識別するデータを含む。スライスタイプ(I、P又はB)、ピクチャ出力フラグ等を含み、いくつかのパラメータは、スライスの最初のスライスセグメントのみに含まれる。ルマ及びクロマについて別々にSAOを有効化すること、スライスの間でデブロッキングフィルタ動作を有効化すること、及び初期スライス量子化パラメータ(QP, quantization parameter)値を含み、いくつかのコーディングツールパラメータの存在は、ツールがSPS又はPPSで有効化されている場合、スライスヘッダに存在する。デブロッキングフィルタパラメータは、スライスセグメントヘッダ又はPPSのいずれかに存在してもよい。
それぞれのコーディングされたスライスは、典型的には、スライスデータにより後続されるスライスヘッダから構成される。スライスヘッダは、スライスのための制御情報を搬送し、スライスデータは、コーディングされたサンプルを搬送する。図9及び11は、文書JVET-O2001-vEによるスライスヘッダを例示する。さらに、図10aは、スライスデータの一部であるコーディングツリーユニットのシンタックス構造を例示する。
ピクチャヘッダ(PH, Picture header)は、コーディングされたピクチャの全てのスライスに適用するシンタックスエレメントを含むシンタックス構造である。図10bは、文書JVET-P1006(http://phenix.it-sudparis.eu/jvet/doc_end_user/documents/16_Geneva/wg11/JVET-P1006-v2.zip)によるピクチャヘッダを例示する。例えば、pic_temporal_mvp_enabled_flagは、ピクチャヘッダに関連する全てのスライスについて、時間動きベクトル予測子がインター予測に使用できるか否かを指定する。pic_temporal_mvp_enabled_flagが0に等しい場合、ピクチャヘッダに関連するスライスのシンタックスエレメントは、スライスの復号において時間動きベクトル予測子が使用されないように制約されるものとする。そうでない場合(pic_temporal_mvp_enabled_flagが1に等しい場合)、時間動きベクトル予測子は、ピクチャヘッダに関連するスライスの復号において使用されてもよい。
-sps_temporal_mvp_enabled_flagが0に等しい場合、pic_temporal_mvp_enabled_flagの値は0に等しいと推定される。
-そうでない場合(sps_temporal_mvp_enabled_flagが1に等しい場合)、pic_temporal_mvp_enabled_flagの値はpps_temporal_mvp_enabled_idc-1に等しいと推定される。
MaxNumMergeCand=6-picsix_minus_max_num_merge_cand (7-111)
-sps_affine_enabled_flagが0に等しい場合、pic_five_minus_max_num_subblock_merge_candの値は5-(sps_sbtmvp_enabled_flag&&pic_temporal_mvp_enabled_flag)に等しいと推定される。
-そうでない場合(sps_affine_enabled_flagが1に等しい場合)、pic_five_minus_max_num_subblock_merge_candの値はpps_five_minus_max_num_subblock_merge_cand_plus1-1に等しいと推定される。
MaxNumSubblockMergeCand=5-pic_five_minus_max_num_subblock_merge_cand (7-112)
MaxNumTriangleMergeCand=MaxNumMergeCand-pic_max_num_merge_cand_minus_max_num_triangle_cand (7-113)
MaxNumIbcMergeCand=6-pic_six_minus_max_num_ibc_merge_cand (7-114)
ビットストリームをパースするステップと、
ビットストリームのピクチャヘッダからフラグを取得するステップであり、フラグは、現在ピクチャがIピクチャであるか否かを示す、ステップと
を含む方法。
フラグをビットストリームのピクチャヘッダにシグナリングするステップであり、フラグは、現在ピクチャがIピクチャであるか否かを示す、ステップと
ビットストリームを送信するステップと
を含む方法。
本願で使用される数学演算子は、Cプログラミング言語で使用されるものと同様である。しかし、整数除算及び算術シフト演算の結果は、より正確に定義され、指数計算及び実数値の除算のような更なる演算子が定義される。番号付け及び計数規則は、一般的に0から始まり、例えば、「第1」は0番目と等価であり、「第2」は1番目と等価である、等である。
以下の論理演算子は以下のように定義される。
x&&y x及びyのブール論理「積」
x||y x及びyのブール論理「和」
! ブール論理「否定」
x?y:z xが真である場合又は0に等しくない場合、yの値に評価され、そうでない場合、zの値に評価される
以下の関係演算子は以下のように定義される。
> よりも大きい
>= 以上
< 未満
<= 以下
== 等しい
!= 等しくない
関係演算子が値「na」(not applicable)を割り当てられたシンタックスエレメント又は変数に適用されるとき、値「na」は、シンタックスエレメント又は変数の個別の値として扱われる。値「na」は、いずれかの他の値に等しくないと考えられる。
以下のビット演算子は以下のように定義される。
& ビット毎の「積」。整数の引数に対して演算するとき、整数値の2の補数表現に対して演算する。他の引数よりも少ないビットを含む二値の引数に対して演算するとき、より短い引数は、0に等しいより上位のビットを追加することにより拡張される。
| ビット毎の「和」。整数の引数に対して演算するとき、整数値の2の補数表現に対して演算する。他の引数よりも少ないビットを含む二値の引数に対して演算するとき、より短い引数は、0に等しいより上位のビットを追加することにより拡張される。
^ ビット毎の「排他和」。整数の引数に対して演算するとき、整数値の2の補数表現に対して演算する。他の引数よりも少ないビットを含む二値の引数に対して演算するとき、より短い引数は、0に等しいより上位のビットを追加することにより拡張される。
x>>y y個の二進数字によるxの2の補数整数表現の算術右シフト。この関数は、yの非負整数値についてのみ定義される。右シフトの結果としての最上位ビット(MSB, most significant bit)にシフトされたビットは、シフト演算前のxのMSBに等しい値を有する。
x<<y y個の二進数字によるxの2の補数整数表現の算術左シフト。この関数は、yの非負整数値についてのみ定義される。左シフトの結果としての最下位ビット(LSB, least significant bit)にシフトされたビットは、0に等しい値を有する。
以下の代入演算子は以下のように定義される。
= 代入演算子
++ インクリメント。すなわち、x++はx=x+1に等しい。配列インデックスにおいて使用されるとき、インクリメント演算の前の変数の値に評価される。
-- デクリメント。すなわち、x--はx=x-1に等しい。配列インデックスにおいて使用されるとき、デクリメント演算の前の変数の値に評価される。
+= 指定された量だけのインクリメント。すなわちx+=3はx=x+3に等しく、x+=(-3)はx=x+(-3)に等しい。
-= 指定された量だけのデクリメント。すなわちx-=3はx=x-3に等しく、x-=(-3)はx=x-(-3)に等しい。
以下の表記が値の範囲を指定するために使用される。
x=y..z xはy以上z以下の整数値をとり、x、y及びzは整数であり、zはyよりも大きい。
以下の数学関数が定義される。
Atan(x) 三角法の逆正接関数。引数xに対して演算し、ラジアンの単位の-π÷2以上π÷2以下の範囲の出力値を有する。
Clip1Y(x)=Clip3(0,(1<<BitDepthY)-1,x)
Clip1C(x)=Clip3(0,(1<<BitDepthC)-1,x)
Floor(x) x以下の最大の整数。
Log2(x) xの2を底とする対数。
Log10(x) xの10を底とする対数。
Sqrt(x)=√x
Swap(x,y)=(y,x)
Tan(x) ラジアンの単位の引数xに対して演算する三角法の正接関数。
式の優先順位が括弧の使用により明示的に示されないとき、以下の規則が当てはまる。
-より高い優先度の演算は、より低い優先度のいずれかの演算の前に評価される。
-同じ優先度の演算は、左から右に順次評価される。
テキストにおいて、以下の形式:
if(条件0)
ステートメント0
else(条件1)
ステートメント1
...
else /*残りの条件に関する参考注記*/
ステートメントn
で数学的に記述されるような論理演算のステートメントは、以下の方式で記述されてもよい。
...以下の通り/...以下が当てはまる:
-条件0である場合、ステートメント0
-そうでなく、条件1である場合、ステートメント1
-...
-そうでない場合(残りの条件に関する参考注記)、ステートメントn
テキストにおけるそれぞれの「…である場合…、そうでなく、…である場合…、そうでない場合…」のステートメントは、「…である場合」が直後に続く「…以下の通り」又は「…以下が当てはまる」で導入される。「…である場合…、そうでなく、…である場合…、そうでない場合…」の最後の条件は、常に「そうでない場合、…」である。交互に配置される「…である場合…、そうでなく、…である場合…、そうでない場合…」のステートメントは、「そうでない場合、…」で終わる「…以下の通り」又は「…以下が当てはまる」に一致させることにより識別できる。
if(条件0a&&条件0b)
ステートメント0
else if(条件1a||条件1b)
ステートメント1
...
else
ステートメントn
で数学的に記述されるような論理演算のステートメントは、以下の方式で記述されてもよい。
...以下の通り/...以下が当てはまる:
-以下の条件の全てが真である場合、ステートメント0:
-条件0a
-条件0b
-そうでなく、以下の条件のうち1つ以上が真である場合、ステートメント1:
-条件1a
-条件1b
-…
-そうでない場合、ステートメントn
if(条件0)
ステートメント0
if(条件1)
ステートメント1
で数学的に記述されるような論理演算のステートメントは、以下の方式で記述されてもよい。
条件0であるとき、ステートメント0
条件1であるとき、ステートメント1
Claims (18)
- 復号デバイスにより実現されるコーディングの方法であって、
ビットストリームをパースして前記ビットストリームのピクチャヘッダから第1のフラグを取得するステップであり、前記第1のフラグは、現在ピクチャがIピクチャであるか否かを示す、ステップと、
前記現在ピクチャがIピクチャであることを前記第1のフラグが示すとき、インター予測のために設計されたシンタックスエレメントは前記ピクチャヘッダでシグナリングされず、前記ビットストリームのシーケンスパラメータセット(SPS)内のインター予測のために設計されたシンタックスエレメントの値に等しいと推定され、或いは、前記現在ピクチャがP又はBピクチャであることを前記第1のフラグが示し、パーティション制約パラメータが前記ピクチャヘッダに存在することを第2のフラグが示すとき、前記ピクチャヘッダからインター予測のために設計されたシンタックスエレメントを取得するステップであり、前記第2のフラグはpartition_constraints_override_flagである、ステップと
を含む方法。 - インター予測のために設計された前記シンタックスエレメントは、pic_log2_diff_min_qt_min_cb_inter_sliceを含み、
前記現在ピクチャがP又はBピクチャであることを前記第1のフラグが示すとき、pic_log2_diff_min_qt_min_cb_inter_sliceは、コーディングツリーユニット(CTU)の四分木分割から生じたルマリーフブロックのルマサンプルにおける最小サイズの2を底とする対数と、前記ピクチャヘッダに関連するP又はBピクチャを有するスライス内のルマコーディングユニット(CU)についてのルマサンプルにおける最小ルマコーディングブロックサイズの2を底とする対数との間の差を指定し、或いは、
前記現在ピクチャがIピクチャであることを前記第1のフラグが示すとき、pic_log2_diff_min_qt_min_cb_lumaの値は、sps_log2_diff_min_qt_min_cb_inter_sliceに等しいと推定される、請求項1に記載の方法。 - インター予測のために設計された前記シンタックスエレメントは、pic_max_mtt_hierarchy_depth_inter_sliceを更に含み、
前記現在ピクチャがP又はBピクチャであることを前記第1のフラグが示すとき、pic_max_mtt_hierarchy_depth_inter_sliceは、スライス内の四分木リーフのマルチタイプツリー分割から生じたコーディングユニットについての最大階層深度を指定し、或いは、
前記現在ピクチャがIピクチャであることを前記第1のフラグが示すとき、pic_max_mtt_hierarchy_depth_inter_sliceの値は、sps_max_mtt_hierarchy_depth_inter_sliceに等しいと推定される、請求項1又は2に記載の方法。 - pic_max_mtt_hierarchy_depth_inter_sliceが0に等しくないとき、インター予測のために設計された前記シンタックスエレメントは、pic_log2_diff_max_bt_min_qt_inter_sliceを更に含み、
前記現在ピクチャがP又はBピクチャであることを前記第1のフラグが示すとき、pic_log2_diff_max_bt_min_qt_inter_sliceは、二分木分割を使用して分割できるルマコーディングブロックのルマサンプルにおける最大サイズ(幅又は高さ)の2を底とする対数と、前記スライス内のCTUの四分木分割から生じたルマリーフブロックのルマサンプルにおける最小サイズ(幅又は高さ)の2を底とする対数との間の差を指定し、或いは、
前記現在ピクチャがIピクチャであることを前記第1のフラグが示すとき、pic_log2_diff_max_bt_min_qt_inter_sliceの値はsps_log2_diff_max_bt_min_qt_inter_sliceに等しいと推定される、請求項3に記載の方法。 - pic_max_mtt_hierarchy_depth_inter_sliceが0に等しくないとき、インター予測のために設計された前記シンタックスエレメントは、pic_log2_diff_max_tt_min_qt_inter_sliceを更に含み、
前記現在ピクチャがP又はBピクチャであることを前記第1のフラグが示すとき、pic_log2_diff_max_tt_min_qt_inter_sliceは、三分木分割を使用して分割できるルマコーディングブロックのルマサンプルにおける最大サイズ(幅又は高さ)の2を底とする対数と、スライス内のCTUの四分木分割から生じたルマリーフブロックのルマサンプルにおける最小サイズ(幅又は高さ)の2を底とする対数との間の差を指定し、或いは、
前記現在ピクチャがIピクチャであることを前記第1のフラグが示すとき、pic_log2_diff_max_tt_min_qt_inter_sliceの値はsps_log2_diff_max_tt_min_qt_inter_sliceに等しいと推定される、請求項3又は4に記載の方法。 - インター予測のために設計された前記シンタックスエレメントは、pic_cu_qp_delta_subdiv_inter_sliceを更に含み、
前記現在ピクチャがP又はBピクチャであることを前記第1のフラグが示すとき、pic_cu_qp_delta_subdiv_inter_sliceは、インタースライス内でcu_qp_delta_abs及びcu_qp_delta_sign_flagを伝達するコーディングユニットの最大cbSubdiv値を指定し、或いは、
前記現在ピクチャがIピクチャであることを前記第1のフラグが示すとき、pic_cu_qp_delta_subdiv_inter_sliceの値は0に等しいと推定される、請求項1乃至5のうちいずれか1項に記載の方法。 - インター予測のために設計された前記シンタックスエレメントは、pic_cu_chroma_qp_offset_subdiv_inter_sliceを更に含み、
前記現在ピクチャがP又はBピクチャであることを前記第1のフラグが示すとき、pic_cu_chroma_qp_offset_subdiv_inter_sliceは、cu_chroma_qp_offset_flagを伝達するインタースライス内のコーディングユニットの最大cbSubdiv値を指定し、或いは、
前記現在ピクチャがIピクチャであることを前記第1のフラグが示すとき、pic_cu_chroma_qp_offset_subdiv_inter_sliceの値は0に等しいと推定される、請求項1乃至6のうちいずれか1項に記載の方法。 - インター予測のために設計された前記シンタックスエレメントは、pic_temporal_mvp_enabled_flagを更に含み、
前記現在ピクチャがP又はBピクチャであることを前記第1のフラグが示すとき、pic_temporal_mvp_enabled_flagは、前記ピクチャヘッダに関連するスライスについて、時間動きベクトル予測子がインター予測に使用できるか否かを指定し、或いは、
前記現在ピクチャがIピクチャであることを前記第1のフラグが示すとき、sps_temporal_mvp_enabled_flagが0に等しい場合、pic_temporal_mvp_enabled_flagの値は0に等しいと推定され、そうでなく、sps_temporal_mvp_enabled_flagが1に等しい場合、pic_temporal_mvp_enabled_flagの値はpps_temporal_mvp_enabled_idc-1に等しいと推定される、請求項1乃至7のうちいずれか1項に記載の方法。 - 前記第1のフラグはph_all_intra_flagとして命名される、請求項1乃至8のうちいずれか1項に記載の方法。
- Iピクチャは、イントラ予測ブロックのみを含み、一方、P又はBピクチャは、インター予測ブロックを含む、請求項1乃至9のうちいずれか1項に記載の方法。
- 請求項1乃至10のうちいずれか1項に記載の方法を実行するための処理回路を含むデコーダ。
- デコーダであって、
1つ以上のプロセッサと、
前記1つ以上のプロセッサに結合され、前記1つ以上のプロセッサに請求項1乃至10のうちいずれか1項に記載の方法を実行させるための、前記1つ以上のプロセッサによる実行のためのプログラミングを記憶する非一時的なコンピュータ読み取り可能記憶媒体と
を含むデコーダ。 - 復号デバイスであって、
ビットストリームをパースして前記ビットストリームのピクチャヘッダから第1のフラグを取得するように構成された取得ユニットであり、前記第1のフラグは、現在ピクチャがIピクチャであるか否かを示す、取得ユニットと、
前記第1のフラグに基づいて前記現在ピクチャがIピクチャであるか否かを決定するように構成された決定ユニットと
を含み、
前記取得ユニットは、前記現在ピクチャがP又はBピクチャであることを前記第1のフラグが示すとき、前記ピクチャヘッダからインター予測のために設計されたシンタックスエレメントを取得するように更に構成され、
第2のフラグは、パーティション制約パラメータが前記ピクチャヘッダに存在することを示し、前記第2のフラグはpartition_constraints_override_flagであり、
前記現在ピクチャがIピクチャであることを前記第1のフラグが示すとき、インター予測のために設計されたシンタックスエレメントは前記ピクチャヘッダでシグナリングされず、前記ビットストリームのシーケンスパラメータセット(SPS)内のインター予測のために設計されたシンタックスエレメントの値に等しいと推定される、デバイス。 - インター予測のために設計された前記シンタックスエレメントは、pic_log2_diff_min_qt_min_cb_inter_sliceを含み、
前記現在ピクチャがP又はBピクチャであることを前記第1のフラグが示すとき、pic_log2_diff_min_qt_min_cb_inter_sliceは、コーディングツリーユニット(CTU)の四分木分割から生じたルマリーフブロックのルマサンプルにおける最小サイズの2を底とする対数と、前記ピクチャヘッダに関連するP又はBピクチャを有するスライス内のルマコーディングユニット(CU)についてのルマサンプルにおける最小ルマコーディングブロックサイズの2を底とする対数との間の差を指定し、或いは、
前記現在ピクチャがIピクチャであることを前記第1のフラグが示すとき、pic_log2_diff_min_qt_min_cb_lumaの値は、sps_log2_diff_min_qt_min_cb_inter_sliceに等しいと推定される、請求項13に記載のデバイス。 - インター予測のために設計された前記シンタックスエレメントは、pic_max_mtt_hierarchy_depth_inter_sliceを更に含み、
前記現在ピクチャがP又はBピクチャであることを前記第1のフラグが示すとき、pic_max_mtt_hierarchy_depth_inter_sliceは、スライス内の四分木リーフのマルチタイプツリー分割から生じたコーディングユニットについての最大階層深度を指定し、或いは、
前記現在ピクチャがIピクチャであることを前記第1のフラグが示すとき、pic_max_mtt_hierarchy_depth_inter_sliceの値は、sps_max_mtt_hierarchy_depth_inter_sliceに等しいと推定される、請求項13又は14に記載のデバイス。 - pic_max_mtt_hierarchy_depth_inter_sliceが0に等しくないとき、インター予測のために設計された前記シンタックスエレメントは、pic_log2_diff_max_bt_min_qt_inter_sliceを更に含み、
前記現在ピクチャがP又はBピクチャであることを前記第1のフラグが示すとき、pic_log2_diff_max_bt_min_qt_inter_sliceは、二分木分割を使用して分割できるルマコーディングブロックのルマサンプルにおける最大サイズ(幅又は高さ)の2を底とする対数と、前記スライス内のCTUの四分木分割から生じたルマリーフブロックのルマサンプルにおける最小サイズ(幅又は高さ)の2を底とする対数との間の差を指定し、或いは、
前記現在ピクチャがIピクチャであることを前記第1のフラグが示すとき、pic_log2_diff_max_bt_min_qt_inter_sliceの値はsps_log2_diff_max_bt_min_qt_inter_sliceに等しいと推定される、請求項15に記載のデバイス。 - pic_max_mtt_hierarchy_depth_inter_sliceが0に等しくないとき、インター予測のために設計された前記シンタックスエレメントは、pic_log2_diff_max_tt_min_qt_inter_sliceを更に含み、
前記現在ピクチャがP又はBピクチャであることを前記第1のフラグが示すとき、pic_log2_diff_max_tt_min_qt_inter_sliceは、三分木分割を使用して分割できるルマコーディングブロックのルマサンプルにおける最大サイズ(幅又は高さ)の2を底とする対数と、スライス内のCTUの四分木分割から生じたルマリーフブロックのルマサンプルにおける最小サイズ(幅又は高さ)の2を底とする対数との間の差を指定し、或いは、
前記現在ピクチャがIピクチャであることを前記第1のフラグが示すとき、pic_log2_diff_max_tt_min_qt_inter_sliceの値はsps_log2_diff_max_tt_min_qt_inter_sliceに等しいと推定される、請求項15又は16に記載のデバイス。 - Iピクチャは、イントラ予測ブロックのみを含み、P又はBピクチャは、インター予測ブロックを含む、請求項13乃至17のうちいずれか1項に記載のデバイス。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2024017638A JP2024055894A (ja) | 2019-10-10 | 2024-02-08 | ピクチャヘッダのシグナリングを簡略化するためのエンコーダ、デコーダ及び対応する方法 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962913730P | 2019-10-10 | 2019-10-10 | |
US62/913,730 | 2019-10-10 | ||
PCT/CN2020/120110 WO2021068918A1 (en) | 2019-10-10 | 2020-10-10 | An encoder, a decoder and corresponding methods for simplifying signalling picture header |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2024017638A Division JP2024055894A (ja) | 2019-10-10 | 2024-02-08 | ピクチャヘッダのシグナリングを簡略化するためのエンコーダ、デコーダ及び対応する方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022551313A JP2022551313A (ja) | 2022-12-08 |
JP7436646B2 true JP7436646B2 (ja) | 2024-02-21 |
Family
ID=75437739
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022521534A Active JP7436646B2 (ja) | 2019-10-10 | 2020-10-10 | ピクチャヘッダのシグナリングを簡略化するためのエンコーダ、デコーダ及び対応する方法 |
JP2024017638A Pending JP2024055894A (ja) | 2019-10-10 | 2024-02-08 | ピクチャヘッダのシグナリングを簡略化するためのエンコーダ、デコーダ及び対応する方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2024017638A Pending JP2024055894A (ja) | 2019-10-10 | 2024-02-08 | ピクチャヘッダのシグナリングを簡略化するためのエンコーダ、デコーダ及び対応する方法 |
Country Status (10)
Country | Link |
---|---|
US (1) | US20220256196A1 (ja) |
EP (1) | EP4035396A4 (ja) |
JP (2) | JP7436646B2 (ja) |
KR (1) | KR20220070542A (ja) |
CN (2) | CN114503592A (ja) |
AU (1) | AU2020363130A1 (ja) |
BR (2) | BR112022006694A2 (ja) |
CA (1) | CA3157535A1 (ja) |
MX (1) | MX2022004380A (ja) |
WO (1) | WO2021068918A1 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021068954A1 (en) * | 2019-10-12 | 2021-04-15 | Beijing Bytedance Network Technology Co., Ltd. | High level syntax for video coding tools |
JP7346731B2 (ja) | 2019-11-05 | 2023-09-19 | エルジー エレクトロニクス インコーポレイティド | 映像/ビデオコーディングのための映像情報処理方法及び装置 |
CN118200603A (zh) * | 2019-11-05 | 2024-06-14 | Lg 电子株式会社 | 图像/视频编译方法和装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000224545A (ja) | 1999-02-01 | 2000-08-11 | Matsushita Electric Ind Co Ltd | 動画像記録装置および動画像再生装置 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7738554B2 (en) * | 2003-07-18 | 2010-06-15 | Microsoft Corporation | DC coefficient signaling at small quantization step sizes |
JP4531058B2 (ja) * | 2004-10-29 | 2010-08-25 | シャープ株式会社 | 動画像復号装置 |
US8396134B2 (en) * | 2006-07-21 | 2013-03-12 | Vidyo, Inc. | System and method for scalable video coding using telescopic mode flags |
CN101217652B (zh) * | 2007-12-26 | 2010-09-29 | 武汉大学 | 视频图像编解码过程中的图像信息记录和提取方法 |
PL3833022T3 (pl) * | 2012-04-12 | 2022-05-30 | Jvckenwood Corporation | Konstrukcja listy kandydatów do scalania |
JP5197864B2 (ja) * | 2012-04-12 | 2013-05-15 | 株式会社東芝 | 画像復号化方法及び装置 |
CN104365100A (zh) * | 2012-04-15 | 2015-02-18 | 三星电子株式会社 | 用于并行处理的视频编码方法和装置以及视频解码方法和装置 |
JP6352248B2 (ja) * | 2013-04-04 | 2018-07-04 | シャープ株式会社 | 画像復号装置、および画像符号化装置 |
KR101851479B1 (ko) * | 2014-01-03 | 2018-04-23 | 노키아 테크놀로지스 오와이 | 파라미터 세트 코딩 |
GB2524476B (en) * | 2014-03-14 | 2016-04-27 | Canon Kk | Method, device and computer program for optimizing transmission of motion vector related information when transmitting a video stream |
US10834419B2 (en) * | 2016-04-13 | 2020-11-10 | Qualcomm Incorporated | Conformance constraint for collocated reference index in video coding |
CN117201775A (zh) * | 2016-09-13 | 2023-12-08 | 韩国电子通信研究院 | 视频编码/解码方法和装置以及存储比特流的记录介质 |
CN109963155B (zh) * | 2017-12-23 | 2023-06-06 | 华为技术有限公司 | 图像块的运动信息的预测方法、装置及编解码器 |
CN110121073B (zh) * | 2018-02-06 | 2021-07-09 | 浙江大学 | 一种双向帧间预测方法及装置 |
-
2020
- 2020-10-10 CA CA3157535A patent/CA3157535A1/en active Pending
- 2020-10-10 KR KR1020227015581A patent/KR20220070542A/ko active Search and Examination
- 2020-10-10 JP JP2022521534A patent/JP7436646B2/ja active Active
- 2020-10-10 CN CN202080069479.8A patent/CN114503592A/zh active Pending
- 2020-10-10 MX MX2022004380A patent/MX2022004380A/es unknown
- 2020-10-10 BR BR112022006694A patent/BR112022006694A2/pt unknown
- 2020-10-10 EP EP20874784.0A patent/EP4035396A4/en active Pending
- 2020-10-10 CN CN202210484428.2A patent/CN115209161B/zh active Active
- 2020-10-10 AU AU2020363130A patent/AU2020363130A1/en active Pending
- 2020-10-10 WO PCT/CN2020/120110 patent/WO2021068918A1/en active Application Filing
- 2020-10-10 BR BR122022009445-7A patent/BR122022009445A2/pt unknown
-
2022
- 2022-04-08 US US17/716,349 patent/US20220256196A1/en active Pending
-
2024
- 2024-02-08 JP JP2024017638A patent/JP2024055894A/ja active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000224545A (ja) | 1999-02-01 | 2000-08-11 | Matsushita Electric Ind Co Ltd | 動画像記録装置および動画像再生装置 |
Non-Patent Citations (5)
Title |
---|
BROSS, Benjamin et al.,Versatile Video Coding (Draft 6),JVET-O2001 (version 14),ITU,2019年07月31日,pp.37-40, 50-54, 87-97, 120-129,[online],[retrieved on 2023-06-23],Retrieved from the Internet: <URL: https://jvet-experts.org/doc_end_user/documents/15_Gothenburg/wg11/JVET-O2001-v14.zip>,JVET-O2001-vE.docx |
DENG, Zhipin et al.,AHG9: PH and SH Syntax Cleanups,JVET-Q0116 (version 1),ITU,2019年12月30日,pp.1-8,[online],[retrieved on 2023-06-23],Retrieved from the Internet: <URL: https://jvet-experts.org/doc_end_user/documents/17_Brussels/wg11/JVET-Q0116-v1.zip>,JVET-Q0116-v1.docx |
HANNUKSELA, Miska,AHG17: Carriage of Tile Group Header Parameters in Higher Level Structures,JVET-M0260 (version 1),ITU,2019年01月02日,pp.1-9,[online],[retrieved on 2023-06-23],Retrieved from the Internet: <URL: https://jvet-experts.org/doc_end_user/documents/13_Marrakech/wg11/JVET-M0260-v1.zip>,JVET-M0260.docx |
HENDRY,AHG9: A Summary of HLS Contributions on Picture Header, Slice Header, and Access Unit Delimiter,JVET-Q0684 (version 2),ITU,2020年01月09日,pp.1-13,[online],[retrieved on 2023-06-23],Retrieved from the Internet: <URL: https://jvet-experts.org/doc_end_user/documents/17_Brussels/wg11/JVET-Q0684-v2.zip>,JVET-Q0684_v2.docx |
WAN, Wade et al.,AHG17: Text for Picture Header,JVET-P1006 (version 2),ITU,2019年10月09日,pp.45-48,[online],[retrieved on 2023-12-27],Retrieved from the Internet: <URL: https://jvet-experts.org/doc_end_user/documents/16_Geneva/wg11/JVET-P1006-v2.zip>,JVET-P1006_SpecText-v2.docx |
Also Published As
Publication number | Publication date |
---|---|
EP4035396A1 (en) | 2022-08-03 |
EP4035396A4 (en) | 2022-11-30 |
CN115209161A (zh) | 2022-10-18 |
CN115209161B (zh) | 2023-05-12 |
US20220256196A1 (en) | 2022-08-11 |
WO2021068918A1 (en) | 2021-04-15 |
CN114503592A (zh) | 2022-05-13 |
CA3157535A1 (en) | 2021-04-15 |
MX2022004380A (es) | 2022-08-08 |
AU2020363130A1 (en) | 2022-05-05 |
KR20220070542A (ko) | 2022-05-31 |
JP2024055894A (ja) | 2024-04-19 |
JP2022551313A (ja) | 2022-12-08 |
BR122022009445A2 (pt) | 2022-08-09 |
BR112022006694A2 (pt) | 2022-07-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7483869B2 (ja) | エンコーダ、デコーダ、および対応する方法 | |
US11876997B2 (en) | Encoder, decoder and corresponding methods of most probable mode list construction for blocks with multi-hypothesis prediction | |
JP7391991B2 (ja) | イントラ平滑化のための方法および装置 | |
JP7372465B2 (ja) | シーケンスパラメータセット内でのサブピクチャのシグナリングのためのエンコーダ、デコーダ、および対応する方法 | |
JP7436646B2 (ja) | ピクチャヘッダのシグナリングを簡略化するためのエンコーダ、デコーダ及び対応する方法 | |
JP2024026231A (ja) | イントラ予測モードに関連するエンコーダ、デコーダ、および対応する方法 | |
JP2023153193A (ja) | クロミナンス量子化パラメータのシグナリングのための方法及び装置 | |
KR20220143943A (ko) | 슬라이스 헤더 신택스 엘리먼트의 시그널링을 단순화하는 인코더, 디코더, 및 대응하는 방법 | |
AU2024201141A1 (en) | The method and apparatus for intra sub-partitions coding mode | |
KR20220051402A (ko) | 가중 예측을 위한 하이-레벨 시그널링의 방법 및 장치 | |
JP2023126795A (ja) | ビデオコーディングにおけるクロマイントラ予測のための方法及び装置 | |
US20220159263A1 (en) | Encoder, a decoder and corresponding methods of chroma intra mode derivation | |
KR20210103572A (ko) | 타일 구성 시그널링을 위한 인코더, 디코더 및 대응 방법 | |
US20230007270A1 (en) | Decoder and corresponding methods to signal picture partitioning information for slices | |
EP3991435A1 (en) | Method and apparatus of sample adaptive offset in-loop filter with application region size constraint | |
JP7414976B2 (ja) | エンコーダ、デコーダ、および、対応する方法 | |
JP2024096145A (ja) | エンコーダ、デコーダ、および対応する方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220519 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220519 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230623 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230704 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230929 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240109 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240208 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7436646 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |