JP7423758B2 - 重み付き予測のための高レベルシグナリングの方法および装置 - Google Patents
重み付き予測のための高レベルシグナリングの方法および装置 Download PDFInfo
- Publication number
- JP7423758B2 JP7423758B2 JP2022514798A JP2022514798A JP7423758B2 JP 7423758 B2 JP7423758 B2 JP 7423758B2 JP 2022514798 A JP2022514798 A JP 2022514798A JP 2022514798 A JP2022514798 A JP 2022514798A JP 7423758 B2 JP7423758 B2 JP 7423758B2
- Authority
- JP
- Japan
- Prior art keywords
- prediction
- weighted
- video
- coding
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 148
- 230000011664 signaling Effects 0.000 title description 17
- 230000008569 process Effects 0.000 claims description 37
- 238000003860 storage Methods 0.000 claims description 31
- 238000004590 computer program Methods 0.000 claims description 5
- 238000013139 quantization Methods 0.000 description 76
- 238000012545 processing Methods 0.000 description 54
- 230000006854 communication Effects 0.000 description 35
- 238000004891 communication Methods 0.000 description 35
- 238000000638 solvent extraction Methods 0.000 description 25
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 23
- 239000000872 buffer Substances 0.000 description 23
- 238000005192 partition Methods 0.000 description 23
- 239000013598 vector Substances 0.000 description 23
- 238000010586 diagram Methods 0.000 description 22
- 230000006870 function Effects 0.000 description 20
- 230000005540 biological transmission Effects 0.000 description 13
- 241000023320 Luma <angiosperm> Species 0.000 description 12
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 12
- 230000006835 compression Effects 0.000 description 11
- 238000007906 compression Methods 0.000 description 11
- 238000003491 array Methods 0.000 description 9
- 230000000295 complement effect Effects 0.000 description 9
- 238000001914 filtration Methods 0.000 description 8
- 238000006243 chemical reaction Methods 0.000 description 7
- 230000009466 transformation Effects 0.000 description 7
- 230000003044 adaptive effect Effects 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 6
- 238000007781 pre-processing Methods 0.000 description 6
- 238000013500 data storage Methods 0.000 description 4
- 230000014509 gene expression Effects 0.000 description 4
- 238000012805 post-processing Methods 0.000 description 4
- 230000002123 temporal effect Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 2
- 101150114515 CTBS gene Proteins 0.000 description 2
- 101150039623 Clip1 gene Proteins 0.000 description 2
- 238000012952 Resampling Methods 0.000 description 2
- 239000000654 additive Substances 0.000 description 2
- 230000000996 additive effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000002457 bidirectional effect Effects 0.000 description 2
- 230000002146 bilateral effect Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 230000006837 decompression Effects 0.000 description 2
- 238000009795 derivation Methods 0.000 description 2
- 238000009499 grossing Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000007620 mathematical function Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 206010011878 Deafness Diseases 0.000 description 1
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 1
- 230000007175 bidirectional communication Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 229910052710 silicon Inorganic materials 0.000 description 1
- 239000010703 silicon Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/573—Motion compensation with multiple frame prediction using two or more reference frames in a given prediction direction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/13—Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
- H04N19/159—Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/577—Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
この特許出願は、2019年9月6日に出願された国際特許出願第PCT/RU2019/000625号への優先権を主張する。上述の特許出願の開示は、その全体が参照によりここに組み込まれる。
図2は、本出願の技法を実現するように構成される例示のビデオエンコーダ20の概略ブロック図を表す。図2の例では、ビデオエンコーダ20は、入力201(または入力インターフェース201)、残差計算ユニット204、変換処理ユニット206、量子化ユニット208、逆量子化ユニット210、および逆変換処理ユニット212、再構成ユニット214、ループフィルタユニット220、デコードされたピクチャバッファ(decoded picture buffer(DPB))230、モード選択ユニット260、エントロピーエンコードユニット270、および出力272(または出力インターフェース272)を備える。モード選択ユニット260は、インター予測ユニット244、イントラ予測ユニット254、および区分ユニット262を含んでよい。インター予測ユニット244は、動き推定ユニットおよび動き補償ユニット(表されていない)を含んでよい。図2に表されたようなビデオエンコーダ20は、ハイブリッドビデオエンコーダ、またはハイブリッドビデオコーデックによるビデオエンコーダとも呼ばれ得る。
エンコーダ20は、ピクチャ17(またはピクチャデータ17)、例えば、ビデオまたはビデオシーケンスを形成するピクチャのシーケンスのピクチャを、例えば、入力201を介して受信するように構成され得る。受信されるピクチャまたはピクチャデータはまた、前処理されたピクチャ19(または前処理されたピクチャデータ19)であってよい。簡潔さの目的のために、以下の説明はピクチャ17に言及する。ピクチャ17は、現在のピクチャ、または(同じビデオシーケンス、すなわち、やはり現在のピクチャを備えるビデオシーケンスの他のピクチャ、例えば、前にエンコードされ、かつ/またはデコードされたピクチャから現在のピクチャを区別するために、特にビデオコーディングにおいて)コーディングされるべきピクチャとも呼ばれ得る。
残差計算ユニット204は、例えば、サンプルごとに(ピクセルごとに)ピクチャブロック203のサンプル値から予測ブロック265のサンプル値を減算することによって、ピクチャブロック203および予測ブロック265(予測ブロック265についてのさらなる詳細は後で提供される)に基づいて残差ブロック205(残差205とも呼ばれる)を計算して、サンプル領域における残差ブロック205を取得するように構成され得る。
変換処理ユニット206は、残差ブロック205のサンプル値において変換、例えば、離散コサイン変換(discrete cosine transform(DCT))または離散サイン変換(discrete sine transform(DST))を適用して、変換領域における変換係数207を取得するように構成され得る。変換係数207は、変換残差係数とも呼ばれ、変換領域における残差ブロック205を表現してよい。
量子化ユニット208は、例えば、スカラー量子化またはベクトル量子化を適用することによって、変換係数207を量子化して量子化された係数209を取得するように構成され得る。量子化された係数209は、量子化された変換係数209または量子化された残差係数209とも呼ばれ得る。
逆量子化ユニット210は、例えば、量子化ユニット208と同じ量子化ステップサイズに基づいて、またはそれを使用して、量子化ユニット208によって適用される量子化方式の逆を適用することによって、量子化された係数において量子化ユニット208の逆量子化を適用して量子化解除された係数211を取得するように構成される。量子化解除された係数211は、量子化解除された残差係数211とも呼ばれ、量子化による損失に起因して典型的には変換係数と同一でないが、変換係数207に対応し得る。
逆変換処理ユニット212は、変換処理ユニット206によって適用される変換の逆変換、例えば、逆離散コサイン変換(DCT)または逆離散サイン変換(DST)、または他の逆変換を適用して、サンプル領域における再構成された残差ブロック213(または、対応する量子化解除された係数213)を取得するように構成される。再構成された残差ブロック213は、変換ブロック213とも呼ばれ得る。
再構成ユニット214(例えば、加算器または合算器214)は、例えば、再構成された残差ブロック213のサンプル値と予測ブロック265のサンプル値を、サンプルごとに、加算することによって、変換ブロック213(すなわち、再構成された残差ブロック213)を予測ブロック265に加算してサンプル領域における再構成されたブロック215を取得するように構成される。
ループフィルタユニット220(または、短縮して「ループフィルタ」220)は、再構成されたブロック215をフィルタ処理してフィルタ処理されたブロック221を取得するように、または一般に、再構成されたサンプルをフィルタ処理してフィルタ処理されたサンプルを取得するように構成される。ループフィルタユニットは、例えば、ピクセル遷移を平滑化し、またはそうでなくビデオ品質を改善するように構成される。ループフィルタユニット220は、デブロッキングフィルタ、サンプル適応オフセット(Sample-Adaptive Offset(SAO))フィルタ、または1つまたは複数の他のフィルタ、例えば、バイラテラルフィルタ、適応ループフィルタ(Adaptive Loop Filter(ALF))、鮮鋭化、平滑化フィルタ、または協調フィルタ、またはそれらの任意の組み合わせのような1つまたは複数のループフィルタを備えてよい。ループフィルタユニット220はループ内フィルタであるとして図2に表されているが、他の構成では、ループフィルタユニット220は、ポストループフィルタとして実現されてよい。フィルタ処理されたブロック221は、フィルタ処理された再構成されたブロック221とも呼ばれ得る。
デコードされたピクチャバッファ(DPB)230は、ビデオエンコーダ20によってビデオデータをエンコードするための、参照ピクチャまたは一般に参照ピクチャデータを記憶するメモリであってよい。DPB 230は、同期DRAM(synchronous DRAM(SDRAM))を含むダイナミックランダムアクセスメモリ(dynamic random access memory(DRAM))、磁気抵抗RAM(magnetoresistive RAM(MRAM))、抵抗性RAM(resistive RAM(RRAM(登録商標)))、または他のタイプのメモリデバイスのような、様々なメモリデバイスのうちのいずれかによって形成され得る。デコードされたピクチャバッファ(DPB)230は、1つまたは複数のフィルタ処理されたブロック221を記憶するように構成され得る。デコードされたピクチャバッファ230は、以前にフィルタ処理された他のブロック、例えば、同じ現在のピクチャの、または異なるピクチャの、以前に再構成され、フィルタ処理されたブロック221、例えば、以前に再構成されたピクチャを記憶するようにさらに構成されてよく、例えば、インター予測のために、以前に再構成され、すなわちデコードされた完全なピクチャ(および、対応する参照ブロックおよびサンプル)、および/または部分的に再構成された現在のピクチャ(および、対応する参照ブロックおよびサンプル)を提供し得る。例えば、再構成されたブロック215が、ループフィルタユニット220によってフィルタ処理されていない、または再構成されたブロックまたはサンプルのさらに処理された任意の他のバージョンであるならば、デコードされたピクチャバッファ(DPB)230はまた、1つまたは複数のフィルタ処理されていない再構成されたブロック215、または一般に、フィルタ処理されていない再構成されたサンプルを記憶するように構成されてよい。
モード選択ユニット260は、区分ユニット262、インター予測ユニット244、およびイントラ予測ユニット254を備え、元のピクチャデータ、例えば、元のブロック203(現在のピクチャ17の現在のブロック203)、および同じ(現在の)ピクチャの、かつ/または1つまたは複数の以前にデコードされたピクチャからの、例えば、デコードされたピクチャバッファ230または他のバッファ(例えば、表されていないラインバッファ)からの、再構成されたピクチャデータ、例えば、フィルタ処理された、および/またはフィルタ処理されていない再構成されたサンプルまたはブロックを受信または取得するように構成される。再構成されたピクチャデータは、予測ブロック265または予測子265を取得するために、予測、例えば、インター予測またはイントラ予測のための参照ピクチャデータとして使用される。
区分ユニット262は、現在のブロック203をより小さい区分、例えば、正方形または長方形のサイズのより小さいブロックに、区分(または分割)し得る。これらのより小さいブロック(サブブロックとも呼ばれ得る)は、いっそう小さい区分にさらに区分され得る。これは、ツリー区分または階層的ツリー区分とも呼ばれ、例えば、ルートツリーレベル0(階層レベル0、深度0)におけるルートブロックは、再帰的に区分され、例えば、次に低いツリーレベルの2つ以上のブロック、例えば、ツリーレベル1(階層レベル1、深度1)におけるノードに区分されてよく、これらのブロックは再び、例えば、終了基準が充足され、例えば、最大ツリー深度または最小ブロックサイズが到達されたので区分が終了されるまで、次に低いレベル、例えば、ツリーレベル2(階層レベル2、深度2)などの2つ以上のブロックに区分されてよい。さらに区分されないブロックは、ツリーのリーフブロックまたはリーフノードとも呼ばれる。2つの区分への区分を使用するツリーは2分木(Binary-Tree(BT))と呼ばれ、3つの区分への区分を使用するツリーは3分木(Ternary-Tree(TT))と呼ばれ、4つの区分への区分を使用するツリーは4分木(Quad-Tree(QT))と呼ばれる。
イントラ予測モードのセットは、例えば、HEVCにおいて定義されるように、35個の異なるイントラ予測モード、例えば、DC(または平均)モードおよび平面モードのような無方向性モード、または方向性モードを備えてよく、または、例えば、VVCについて定義されるように、67個の異なるイントラ予測モード、例えば、DC(または平均)モードおよび平面モードのような無方向性モード、または方向性モードを備えてよい。
インター予測モードのセット(または可能なインター予測モード)は、利用可能な参照ピクチャ(すなわち、例えば、DBP 230に記憶されている、少なくとも部分的にデコードされた以前のピクチャ)、および他のインター予測パラメータ、例えば、最も良く整合する参照ブロックを探索するために参照ピクチャ全体が使用されるか、または参照ピクチャの一部のみ、例えば、現在のブロックのエリアの周囲の探索ウィンドウエリアが使用されるか、および/または、例えば、ピクセル補間、例えば、ハーフ/セミペルおよび/またはクォーターペル補間が適用されるか否かに依存する。
エントロピーエンコードユニット270は、量子化された係数209、インター予測パラメータ、イントラ予測パラメータ、ループフィルタパラメータ、および/または他のシンタックス要素において、例えば、エントロピーエンコードアルゴリズムまたは方式(例えば、可変長コーディング(variable length coding(VLC))方式、コンテキスト適応VLC方式(context adaptive VLC scheme(CAVLC))、算術コーディング方式、2値化、コンテキスト適応バイナリ算術コーディング(context adaptive binary arithmetic coding(CABAC))、シンタックスを基にしたコンテキスト適応バイナリ算術コーディング(syntax-based context-adaptive binary arithmetic coding(SBAC))、確率区間区分エントロピー(probability interval partitioning entropy(PIPE))コーディング、または別のエントロピーエンコード方法論または技法)、またはバイパス(圧縮なし)を適用して、例えば、エンコードされたビットストリーム21の形式で、出力272を介して出力されることが可能であるエンコードされたピクチャデータ21を取得するように構成され、それによって、例えば、ビデオデコーダ30は、デコードのためにパラメータを受信および使用し得る。エンコードされたビットストリーム21は、ビデオデコーダ30へ伝送され、またはビデオデコーダ30による後の伝送または取り出しのためにメモリに記憶され得る。
図3は、この本出願の技法を実現するように構成されるビデオデコーダ30の一例を表す。ビデオデコーダ30は、例えば、エンコーダ20によってエンコードされた、エンコードされたピクチャデータ21(例えば、エンコードされたビットストリーム21)を受信して、デコードされたピクチャ331を取得するように構成される。エンコードされたピクチャデータまたはビットストリームは、エンコードされたピクチャデータをデコードするための情報、例えば、エンコードされたビデオスライス(および/または、タイルグループまたはタイル)のピクチャブロックを表現するデータ、および関連付けられたシンタックス要素を備える。
エントロピーデコードユニット304は、ビットストリーム21(または一般にエンコードされたピクチャデータ21)を構文解析し、例えば、エンコードされたピクチャデータ21へのエントロピーデコードを実行して、例えば、量子化された係数309および/またはデコードされたコーディングパラメータ(図3に表されていない)、例えば、インター予測パラメータ(例えば、参照ピクチャインデックスおよび動きベクトル)、イントラ予測パラメータ(例えば、イントラ予測モードまたはインデックス)、変換パラメータ、量子化パラメータ、ループフィルタパラメータ、および/または他のシンタックス要素のうちのいずれかまたは全てを取得するように構成される。エントロピーデコードユニット304は、エンコーダ20のエントロピーエンコードユニット270に関して説明されたようなエンコード方式に対応するデコードアルゴリズムまたは方式を適用するように構成され得る。エントロピーデコードユニット304は、モード適用ユニット360にインター予測パラメータ、イントラ予測パラメータ、および/または他のシンタックス要素を、デコーダ30の他のユニットに他のパラメータを提供するようにさらに構成され得る。ビデオデコーダ30は、ビデオスライスレベルおよび/またはビデオブロックレベルにおいてシンタックス要素を受信し得る。スライスおよびそれぞれのシンタックス要素に加えて、またはそれらの代替として、タイルグループおよび/またはタイルおよびそれぞれのシンタックス要素が受信および/または使用され得る。
逆量子化ユニット310は、(例えば、エントロピーデコードユニット304によって、例えば、構文解析および/またはデコードすることによって)エンコードされたピクチャデータ21から量子化パラメータ(quantization parameter(QP))(または一般に逆量子化に関する情報)および量子化された係数を受信し、量子化パラメータに基づいて、デコードされた量子化された係数309において逆量子化を適用して、変換係数311とも呼ばれ得る量子化解除された係数311を取得するように構成され得る。逆量子化プロセスは、量子化の程度、および同様に、適用されるべき逆量子化の程度を決定するために、ビデオスライス(またはタイルまたはタイルグループ)の中のビデオブロックごとにビデオエンコーダ20によって決定された量子化パラメータの使用を含んでよい。
逆変換処理ユニット312は、変換係数311とも呼ばれる量子化解除された係数311を受信し、サンプル領域において再構成された残差ブロック213を取得するために量子化解除された係数311に変換を適用するように構成され得る。再構成された残差ブロック213は、変換ブロック313とも呼ばれ得る。変換は、逆変換、例えば、逆DCT、逆DST、逆整数変換、または概念的に類似の逆変換プロセスであってよい。逆変換処理ユニット312は、量子化解除された係数311に適用されるべき変換を決定するために、(例えば、エントロピーデコードユニット304によって、例えば、構文解析および/またはデコードすることによって)エンコードされたピクチャデータ21から変換パラメータまたは対応する情報を受信するようにさらに構成され得る。
再構成ユニット314(例えば、加算器または合算器314)は、例えば、再構成された残差ブロック313のサンプル値と予測ブロック365のサンプル値とを加算することによって、予測ブロック365に再構成された残差ブロック313を加算して、サンプル領域において再構成されたブロック315を取得するように構成され得る。
(コーディングループ内またはコーディングループの後のいずれかの)ループフィルタユニット320は、例えば、ピクセル遷移を平滑化し、またはビデオ品質をそうでなく改善するために、再構成されたブロック315をフィルタ処理してフィルタ処理されたブロック321を取得するように構成される。ループフィルタユニット320は、デブロッキングフィルタ、サンプル適応オフセット(sample-adaptive offset(SAO))フィルタ、または1つまたは複数の他のフィルタ、例えば、バイラテラルフィルタ、適応ループフィルタ(adaptive loop filter(ALF))、鮮鋭化、平滑化フィルタ、または協調フィルタ、またはそれらの任意の組み合わせのような1つまたは複数のループフィルタを備えてよい。ループフィルタユニット320はループ内フィルタであるとして図3に表されているが、他の構成では、ループフィルタユニット320はポストループフィルタとして実現されてよい。
ピクチャのデコードされたビデオブロック321は、次いで、他のピクチャについての続く動き補償のために、かつ/または出力されるそれぞれ表示のために、参照ピクチャとしてデコードされたピクチャ331を記憶するデコードされたピクチャバッファ330に記憶される。
インター予測ユニット344は、インター予測ユニット244と(特に動き補償ユニットと)同一であってよく、イントラ予測ユニット354は、機能においてインター予測ユニット254と同一であってよく、区分および/または予測パラメータ、またはエンコードされたピクチャデータ21から(例えば、エントロピーデコードユニット304によって、例えば、構文解析および/またはデコードすることによって)受信されたそれぞれの情報に基づいて、分割または区分決定および予測を実行する。モード適用ユニット360は、(フィルタ処理された、またはフィルタ処理されていない)再構成されたピクチャ、ブロック、またはそれぞれのサンプルに基づいて、ブロックごとに予測(イントラまたはインター予測)を実行して、予測ブロック365を取得するように構成され得る。
ux = ( mvx + 2bitDepth ) % 2bitDepth (1)
mvx = ( ux >= 2bitDepth-1 ) ? ( ux - 2bitDepth ) : ux (2)
uy = ( mvy + 2bitDepth ) % 2bitDepth (3)
mvy = ( uy >= 2bitDepth-1 ) ? ( uy - 2bitDepth ) : uy (4)
ここで、mvxは画像ブロックまたはサブブロックの動きベクトルの水平成分であり、mvyは画像ブロックまたはサブブロックの動きベクトルの垂直成分であり、uxおよびuyは中間値を示す。
ux = ( mvpx + mvdx +2bitDepth ) % 2bitDepth (5)
mvx = ( ux >= 2bitDepth-1 ) ? ( ux - 2bitDepth ) : ux (6)
uy = ( mvpy + mvdy +2bitDepth ) % 2bitDepth (7)
mvy = ( uy >= 2bitDepth-1 ) ? ( uy - 2bitDepth ) : uy (8)
vx = Clip3(-2bitDepth-1, 2bitDepth-1 -1, vx)
vy = Clip3(-2bitDepth-1, 2bitDepth-1 -1, vy)
ここで、vxは画像ブロックまたはサブブロックの動きベクトルの水平成分であり、vyは画像ブロックまたはサブブロックの動きベクトルの垂直成分であり、x、y、およびzはそれぞれ、MVクリッピングプロセスの3つの入力値に対応し、関数Clip3の定義は以下の通りである。
f=(p0+p1+1)>>1
として実行される。重み付き双予測について、予測は
f=((p0×w0+p1×w1+2logWD)>>(logWD+1))+((o0+o1+1)>>1)
として実行される。重み付き予測が、フェードイン、フェードアウト、またはクロスフェードのような照明変化を補償することができることを留意する価値がある。
- 1に等しいsps_weighted_pred_flagは、SPSを参照するPスライスに重み付き予測が適用されてよいことを指定する。0に等しいsps_weighted_pred_flagは、SPSを参照するPスライスに重み付き予測が適用されないことを指定する。
- 1に等しいsps_weighted_bipred_flagは、SPSを参照するBスライスに明示的な重み付き予測が適用されてよいことを指定する。0に等しいsps_weighted_bipred_flagは、SPSを参照するBスライスに明示的な重み付き予測が適用されないことを指定する。
- 0に等しいpps_weighted_pred_flagは、PPSを参照するPスライスに重み付き予測が適用されないことを指定する。1に等しいpps_weighted_pred_flagは、PPSを参照するPスライスに重み付き予測が適用されることを指定する。sps_weighted_pred_flagが0に等しいとき、pps_weighted_pred_flagの値は0に等しいものとする。
- 0に等しいpps_weighted_bipred_flagは、PPSを参照するBスライスに明示的な重み付き予測が適用されないことを指定する。1に等しいpps_weighted_bipred_flagは、PPSを参照するBスライスに明示的な重み付き予測が適用されることを指定する。sps_weighted_bipred_flagが0に等しいとき、pps_weighted_bipred_flagの値は0に等しいものとする。
ChromaOffsetL0[ i ][ j ] = Clip3( -128, 127, (128 + delta_chroma_offset_l0[ i ][ j ] - ( (128 * ChromaWeightL0[ i ][ j ] ) >> ChromaLog2WeightDenom ) ) )
- スライスヘッダ内に存在するならば、ref_pic_list_struct( listIdx, rplsIdx )シンタックス構造は、現在のピクチャ(そのスライスを含むピクチャ)の参照ピクチャリストlistIdxを指定する。
- そうでなければ(SPS内に存在する)、ref_pic_list_struct( listIdx, rplsIdx )シンタックス構造は、参照ピクチャリストlistIdxのための候補を指定し、この節の残りの中で指定されるセマンティックにおける用語「現在のピクチャ」は、(1)SPSに含まれるref_pic_list_struct( listIdx, rplsIdx )シンタックス構造のリストの中へのインデックスに等しいref_pic_list_idx[ listIdx ]を含む1つまたは複数のスライスを有し、かつ(2)SPSを参照するCVS内にある、各ピクチャを指す。
for( i = 0, NumLtrpEntries[ listIdx ][ rplsIdx ] = 0; i < num_ref_entries[ listIdx ][ rplsIdx ]; i++ )
if(!inter_layer_ref_pic_flag[ listIdx ][ rplsIdx ][ i ] && !st_ref_pic_flag[ listIdx ][ rplsIdx ][ i ] )
NumLtrpEntries[ listIdx ][ rplsIdx ]++
if( sps_weighted_pred_flag || sps_weighted_bipred_flag )
AbsDeltaPocSt[ listIdx ][ rplsIdx ][ i ] = abs_delta_poc_st[ listIdx ][ rplsIdx ][ i ]
else
AbsDeltaPocSt[ listIdx ][ rplsIdx ][ i ] = abs_delta_poc_st[ listIdx ][ rplsIdx ][ i ] + 1
for( i = 0; i < num_ref_entries[ listIdx ][ rplsIdx ]; i++ )
if( !inter_layer_ref_pic_flag[ listIdx ][ rplsIdx ][ i ] && st_ref_pic_flag[ listIdx ][ rplsIdx ][ i ] )
DeltaPocValSt[ listIdx ][ rplsIdx ][ i ] = ( strp_entry_sign_flag[ listIdx ][ rplsIdx ][ i ] ) ? AbsDeltaPocSt[ listIdx ][ rplsIdx ][ i ] : 0 - AbsDeltaPocSt[ listIdx ][ rplsIdx ][ i ]
if( sps_weighted_pred_flag || sps_weighted_bipred_flag )
AbsDeltaPocSt[ listIdx ][ rplsIdx ][ i ] = abs_delta_poc_st[ listIdx ][ rplsIdx ][ i ]
else
AbsDeltaPocSt[ listIdx ][ rplsIdx ][ i ] = abs_delta_poc_st[ listIdx ][ rplsIdx ][ i ] + 1
1101. コーディングされるべきシンタックス要素を決定し、シンタックス要素は、参照ピクチャリスト構造および少なくとも1つの高レベルシンタックス(HLS)重み付き予測パラメータを含み、
1102. 少なくとも1つのHLS重み付き予測パラメータをコーディングし、
1103. 少なくとも1つのHLS重み付き予測パラメータのコーディングに続いて参照ピクチャリスト構造をコーディングする
ステップを備える。
1201. コーディングされるべきシンタックス要素を決定し、シンタックス要素は、参照ピクチャリスト構造および少なくとも1つの高レベルシンタックス(HLS)重み付き予測パラメータを含み、参照ピクチャリスト構造から導出される参照ピクチャリストは、同じピクチャ順序カウント(POC)パラメータを有する参照ピクチャを備え、
1202. コーディング順序で後の位置を有するシンタックス要素の2値化に対する制限を伴ってコーディング順序で決定されたシンタックス要素をコーディングし、少なくとも1つのHLS重み付き予測パラメータがコーディング順序で参照ピクチャリスト構造の後にコーディングされるとき、シンタックス要素の2値化に対する制限は、参照ピクチャリストが、0に等しいデルタPOC値を有する少なくとも1つの要素を有するときのみ、少なくとも1つのHLS重み付き予測パラメータをコーディングすることを備える、
ステップを備える。
1301. ビットストリームを受信し、
1302. ビットストリームをエントロピーデコードしてシンタックス要素を取得し、シンタックス要素は、参照ピクチャリスト構造および少なくとも1つの高レベルシンタックス(HLS)重み付き予測パラメータを備え、シンタックス要素の中で、少なくとも1つのHLS重み付き予測パラメータは、参照ピクチャリスト構造より前にエントロピーデコードされ、
1303. 取得されたシンタックス要素に基づいて予測を実行して予測ブロックを取得し、
1304. 予測ブロックに基づいて再構成されたブロックを再構成し、
1305. 再構成されたブロックに基づいてデコードされたピクチャを取得する
ことを備える。
1401. ビットストリームを受信し、
1402. ビットストリームをエントロピーデコードしてシンタックス要素を取得し、シンタックス要素は、参照ピクチャリスト構造および予め設定されたフラグを含み、予め設定されたフラグの値は、シンタックス要素が少なくとも1つの高レベルシンタックス(HLS)重み付き予測パラメータを含むかどうかを示し、
1403. 取得されたシンタックス要素に基づいて予測を実行して予測ブロックを取得し、
1404. 予測ブロックに基づいて再構成されたブロックを再構成し、
1405. 再構成されたブロックに基づいてデコードされたピクチャを取得する
ことを備える。
シグナリングされるべきシンタックス要素を決定するステップであって、シンタックス要素が、参照ピクチャリストおよび少なくとも1つのHLS重み付き予測パラメータを含む、ステップと、
コーディング順序で後の位置を有するシンタックス要素の2値化に対する制限を伴ってコーディング順序で決定されたシンタックス要素をシグナリングするステップとを備える。
重み付き単予測のためのシーケンスパラメータセットフラグが0に設定されるとき、参照ピクチャリストの要素についての修正されたデルタPOC値をシグナリングすることを備え、修正されたデルタPOC値(abs_delta_poc_st)が、コーディングプロセスにおいて使用されているデルタPOC値(AbsDeltaPocSt)よりも小さい、例示的な実施形態2の方法。
少なくとも1つのHLS重み付き予測パラメータが重み付き双予測のためのシーケンスパラメータセットフラグを含み、かつ重み付き双予測のためのシーケンスパラメータセットフラグが0に設定されるとき、参照ピクチャリストの要素についての修正されたデルタPOC値をシグナリングすることであって、修正されたデルタPOC値(abs_delta_poc_st)が、コーディングプロセスにおいて使用されているデルタPOC値(AbsDeltaPocSt)よりも小さい、前記シグナリングすること、または
少なくとも1つのHLS重み付き予測パラメータが、重み付き双予測のためのシーケンスパラメータセットフラグおよび重み付き単予測のためのシーケンスパラメータセットフラグを含み、かつ重み付き双予測のためのシーケンスパラメータセットフラグおよび重み付き単予測のためのシーケンスパラメータセットフラグのうちの少なくとも1つが0に設定されるとき、参照ピクチャリストの要素についての修正されたデルタPOC値をシグナリングすることであって、修正されたデルタPOC値(abs_delta_poc_st)が、コーディングプロセスにおいて使用されているデルタPOC値(AbsDeltaPocSt)よりも小さい、前記シグナリングすること、または
少なくとも1つのHLS重み付き予測パラメータが、重み付き双予測のためのシーケンスパラメータセットフラグおよび重み付き単予測のためのシーケンスパラメータセットフラグを含み、かつ重み付き双予測のためのシーケンスパラメータセットフラグと重み付き単予測のためのシーケンスパラメータセットフラグの両方が0に設定されるとき、参照ピクチャリストの要素についての修正されたデルタPOC値をシグナリングすることであって、修正されたデルタPOC値(abs_delta_poc_st)が、コーディングプロセスにおいて使用されているデルタPOC値(AbsDeltaPocSt)よりも小さい、前記シグナリングすること
を備える、例示的な実施形態3の方法。
参照ピクチャリストが、0に等しいデルタPOC値を有する少なくとも1つの要素を有するときのみ、少なくとも1つのHLS重み付き予測パラメータをシグナリングすることを備える、例示的な実施形態1から3のうちのいずれか1つの方法。
ビットストリームを受信するステップと、
ビットストリームをエントロピーデコードしてシンタックス要素を取得するステップであって、シンタックス要素が、参照ピクチャリストおよび少なくとも1つのHLS重み付き予測パラメータを含み、要素の中で、少なくとも1つのHLS重み付き予測パラメータが参照ピクチャリストの前に提示される、ステップと、
取得されたシンタックス要素に基づいて予測を実行して予測ブロックを取得するステップと、
予測ブロックに基づいて再構成されたブロックを再構成するステップと、
再構成されたブロックに基づいてデコードされたピクチャを取得するステップと
を備える、デコーダによるデコード方法。
ビットストリームを受信するステップと、
ビットストリームをエントロピーデコードしてシンタックス要素を取得するステップであって、シンタックス要素が、参照ピクチャリストおよび予め設定されたフラグを含み、予め設定されたフラグの値が、シンタックス要素が少なくとも1つのHLS重み付き予測パラメータを含むかどうかを示す、ステップと、
取得されたシンタックス要素に基づいて予測を実行して予測ブロックを取得するステップと、
予測ブロックに基づいて再構成されたブロックを再構成するステップと、
再構成されたブロックに基づいてデコードされたピクチャを取得するステップと
を備える、デコーダによるデコード方法。
参照ピクチャリストに対応する予め設定されたフラグの値が、0に等しいデルタPOC値を有するいかなる要素も有さないとき、シンタックス要素が少なくとも1つのHLS重み付き予測パラメータを含まない、例示的な実施形態11の方法。
1つまたは複数のプロセッサと、
プロセッサに結合され、プロセッサによる実行のためのプログラミングを記憶する非一時的コンピュータ可読記憶媒体とを備え、プログラミングは、プロセッサによって実行されたとき、例示的な実施形態8から14のうちのいずれか1つのうちのいずれか1つによる方法を実行するようにデコーダを構成する、デコーダ。
1つまたは複数のプロセッサと、
プロセッサに結合され、プロセッサによる実行のためのプログラミングを記憶する非一時的コンピュータ可読記憶媒体とを備え、プログラミングは、プロセッサによって実行されたとき、例示的な実施形態1から7のうちのいずれか1つのうちのいずれか1つによる方法を実行するようにエンコーダを構成する、エンコーダ。
この出願において使用される数学演算子は、Cプログラミング言語において使用されるものと類似である。しかし、整数除算および算術シフト演算の結果がより精密に定義され、べき乗および実数値除算のような追加の演算が定義される。番号付けおよび計数の規約は、一般に、0から始まり、例えば、「第1」が0番目と等価であり、「第2」が1番目と等価である、などである。
以下の算術演算子は以下のように定義される。
+ 加算。
- 減算(2つの引数の演算子として)または符号反転(単項前置演算子として)。
* 乗算、行列乗算を含む。
xy べき乗。xのy乗を指定する。他の文脈では、そのような表記法は、べき乗としての解釈のために意図されない上付き文字にするために使用される。
/ 結果の0への切り捨てを伴う整数除算。例えば、7/4および-7/-4は1に切り捨てられ、-7/4および7/-4は-1に切り捨てられる。
÷ 切り捨てまたは丸めが意図されない、数式における除算を表記するために使用される。
x % y 法。x>=0かつy>0となる整数xおよびyのみについて定義される、xをyで除算した剰余。
以下の論理演算子は以下のように定義される。
x && y xとyのブール論理の「論理積」。
x || y xとyのブール論理の「論理和」。
! ブール論理の「否定」。
x ? y : z xがTRUE、すなわち0に等しくないならば、yの値に評価し、そうでなければ、zの値に評価する。
以下の関係演算子は以下のように定義される。
> よりも大きい。
>= 以上。
< よりも小さい。
<= 以下。
== 等しい。
!= 等しくない。
以下のビット単位演算子は以下のように定義される。
& ビット単位の「論理積」。整数の引数に対して演算するとき、整数値の2の補数表現に対して演算する。別の引数よりも少ないビットを含む2進数の引数に対して演算するとき、より短い引数は、0に等しいより上位のビットを追加することによって拡張される。
| ビット単位の「論理和」。整数の引数に対して演算するとき、整数値の2の補数表現に対して演算する。別の引数よりも少ないビットを含む2進数の引数に対して演算するとき、より短い引数は、0に等しいより上位のビットを追加することによって拡張される。
^ ビット単位の「排他的論理和」。整数の引数に対して演算するとき、整数値の2の補数表現に対して演算する。別の引数よりも少ないビットを含む2進数の引数に対して演算するとき、より短い引数は、0に等しいより上位のビットを追加することによって拡張される。
x >> y xの2の補数整数表現の、2進数のy桁だけの算術右シフト。この関数は、yの非負の整数値に対してのみ定義される。右シフトの結果として最上位ビット(most significant bit(MSB))にシフトされるビットは、そのシフト演算の前のxのMSBに等しい値を有する。
x << y xの2の補数整数表現の、2進数のy桁だけの算術左シフト。この関数は、yの非負の整数値に対してのみ定義される。左シフトの結果として最下位ビット(least significant bit(LSB))にシフトされるビットは、0に等しい値を有する。
以下の算術演算子は以下のように定義される。
= 割当て演算子。
++ インクリメント、すなわち、x++はx = x + 1と等価であり、アレイインデックスにおいて使用されるとき、インクリメント演算の前の変数の値に評価する。
-- デクリメント、すなわち、x--はx = x - 1と等価であり、アレイインデックスにおいて使用されるとき、デクリメント演算の前の変数の値に評価する。
+= 指定された量だけのインクリメント、すなわち、x += 3はx = x + 3と等価でありx += (-3)はx = x + (-3)と等価である。
-= 指定された量だけのデクリメント、すなわち、x -= 3はx = x - 3と等価であり、x -= (-3)はx = x - (-3)と等価である。
値の範囲を指定するために以下の表記法が使用される。
x=y..z xは、yから始まりzまでの両端を含む整数値をとり、x、y、およびzは整数であり、zはyよりも大きい。
以下の数学関数が定義される。
Atan(x) 引数xに対して演算し、ラジアンの単位での-π÷2からπ÷2までの両端を含む範囲内の出力値を有する、三角法の逆正接関数。
Clip1Y( x ) = Clip3( 0, ( 1 << BitDepthY ) - 1, x )
Clip1C( x ) = Clip3( 0, ( 1 << BitDepthC ) - 1, x )
Floor(x) x以下の最大の整数。
Log2(x) 2を底とするxの対数。
Log10(x) 10を底とするxの対数。
Tan(x) ラジアンの単位での引数xに対して演算する、三角法の正接関数。
式における優先順位の順序が括弧の使用によって明示的には示されないとき、以下の規則が適用される。
- より高い優先順位の演算は、より低い優先順位の任意の演算の前に評価される。
- 同じ優先順位の演算は、左から右へ順次に評価される。
本文の中で、以下の形式で数学的に記述されることになるような論理演算のステートメント、すなわち、
if(条件0)
ステートメント0
else if(条件1)
ステートメント1
...
else /* 残りの条件における説明的な注釈 */
ステートメントn
は、以下の形態で説明され得る。
...以下のように/...以下が適用される
- 条件0ならば、ステートメント0
- そうでなく、条件1ならば、ステートメント1
- ...
- そうでなければ(残りの条件における説明的な注釈)、ステートメントn。
if(条件0a && 条件0b)
ステートメント0
else if(条件1a || 条件1b)
ステートメント1
...
else
ステートメントn
は、以下の形態で説明され得る。
...以下のように/...以下が適用される
- 以下の条件の全てが真であるならば、ステートメント0:
- 条件0a
- 条件0b
- そうでなく、以下の条件のうちの1つまたは複数が真であるならば、ステートメント1:
- 条件1a
- 条件1b
- ...
- そうでなければ、ステートメントn
if(条件0)
ステートメント0
if(条件1)
ステートメント1
は、以下の形態で説明され得る。
条件0のとき、ステートメント0
条件1のとき、ステートメント1。
12 ソースデバイス
13 通信チャネル
14 宛先デバイス
16 ピクチャソース
17 ピクチャ、ピクチャデータ、未処理ピクチャ、未処理ピクチャデータ
18 プリプロセッサ、前処理ユニット
19 前処理されたピクチャ、前処理されたピクチャデータ
20 ビデオエンコーダ
21 エンコードされたピクチャデータ
22 通信インターフェース、通信ユニット
28 通信インターフェース、通信ユニット
30 ビデオデコーダ、ショートデコーダ
31 デコードされたピクチャ、デコードされたピクチャデータ
32 ポストプロセッサ、後処理ユニット
33 後処理されたピクチャ、後処理されたピクチャデータ
34 ディスプレイデバイス
46 処理回路
201 入力、入力インターフェース
203 ピクチャブロック
204 残差計算ユニット
205 残差ブロック、残差
206 変換処理ユニット
207 変換係数
208 量子化ユニット
209 量子化された係数、量子化変換係数、量子化残差係数
210 逆量子化ユニット
211 量子化解除された係数、量子化解除された残差係数
212 逆変換処理ユニット
213 再構成された残差ブロック、対応する量子化解除された係数、変換ブロック
214 再構成ユニット
215 再構成されたブロック
220 ループフィルタユニット
221 フィルタ処理されたブロック、フィルタ処理された再構成されたブロック
230 デコードされたピクチャバッファ
231 デコードされたピクチャ
244 インター予測ユニット
254 イントラ予測ユニット
260 モード選択ユニット
262 区分ユニット
265 予測ブロック、予測子
266 シンタックス要素
270 エントロピーエンコードユニット
272 出力、出力インターフェース
304 エントロピーデコードユニット
309 量子化された係数
310 逆量子化ユニット
311 変換係数、量子化解除された係数
312 逆変換処理ユニット
313 再構成された残差ブロック、変換ブロック
314 再構成ユニット、加算器
315 再構成されたブロック
320 ループフィルタユニット
321 フィルタ処理されたブロック、ピクチャのデコードされたビデオブロック
330 デコードされたピクチャバッファ(DPB)
331 デコードされたピクチャ
332 出力
344 インター予測ユニット
354 イントラ予測ユニット
360 モード適用ユニット
365 予測ブロック
400 ビデオコーディングデバイス
410 入口ポート、入力ポート
420 受信機ユニット
430 プロセッサ、論理ユニット、中央処理ユニット
440 送信機ユニット
450 出口ポート、出力ポート
460 メモリ
470 コーディングモジュール
500 装置
502 プロセッサ
504 メモリ
506 コードおよびデータ
508 オペレーティングシステム
510 アプリケーションプログラム
512 バス
514 2次ストレージ
518 ディスプレイ
610 ビデオ分析
611 統計値
631 状態値
660 エンコードエンジン
1500 デコーダ
1501 プロセッサ
1502 非一時的コンピュータ可読記憶媒体
1600 デコーダ
1601 受信手段
1602 エントロピーデコード手段
1603 予測手段
1604 再構成手段
1605 取得手段
1700 エンコーダ
1701 プロセッサ
1702 非一時的コンピュータ可読記憶媒体
1800 エンコーダ
1801 決定手段
1802 コーディング手段
3100 コンテンツ供給システム
3102 キャプチャデバイス
3104 通信リンク
3106 端末デバイス
3108 スマートフォン/パッド
3110 コンピュータ/ラップトップ
3112 ネットワークビデオレコーダ/デジタルビデオレコーダ
3114 TV
3116 セットトップボックス
3118 ビデオ会議システム
3120 ビデオ監視システム
3122 携帯情報端末
3124 車両搭載型デバイス
3126 ディスプレイ
3202 プロトコル進行ユニット
3204 多重化解除ユニット
3206 ビデオデコーダ
3208 オーディオデコーダ
3210 サブタイトルデコーダ
3212 同期ユニット
3214 ビデオ/オーディオディスプレイ
3216 ビデオ/オーディオ/サブタイトルディスプレイ
Claims (16)
- エンコード方法であって、
- コーディングされるべきシンタックス要素を決定するステップであって、前記シンタックス要素が、参照ピクチャリスト構造および少なくとも1つの高レベルシンタックス(HLS)重み付き予測パラメータを含む、ステップと、
- シーケンスパラメータセット(SPS)シンタックス内に前記少なくとも1つのHLS重み付き予測パラメータをコーディングするステップと、
- 前記少なくとも1つのHLS重み付き予測パラメータの前記コーディングに続いて前記SPSシンタックス内に前記参照ピクチャリスト構造をコーディングするステップと
を備える方法。 - 前記参照ピクチャリスト構造から導出される参照ピクチャリストが、同じピクチャ順序カウント(POC)パラメータを有する参照ピクチャを備える、請求項1に記載の方法。
- 前記少なくとも1つのHLS重み付き予測パラメータが、重み付き単予測のためのシーケンスパラメータセットフラグおよび重み付き双予測のためのシーケンスパラメータセットフラグのうちの少なくとも1つを備える、請求項1または2に記載の方法。
- 前記参照ピクチャリスト構造の前記コーディングが、前記参照ピクチャリスト構造の少なくとも一部のコーディングに対する制限を備える、請求項1から3のいずれか一項に記載の方法。
- 前記参照ピクチャリスト構造の少なくとも一部の前記コーディングに対する前記制限が、
重み付き単予測のためのシーケンスパラメータセットフラグが0に設定されるとき、参照ピクチャリストの要素についての修正されたデルタPOC値をコーディングすることを備え、前記修正されたデルタPOC値(abs_delta_poc_st)が、コーディングプロセスにおいて使用されているデルタPOC値(AbsDeltaPocSt)よりも小さい、請求項4に記載の方法。 - 前記修正されたデルタPOC値が、コーディングプロセスにおいて使用されている前記デルタPOC値よりも1だけ小さい、請求項5に記載の方法。
- デコーダによるデコード方法であって、
シーケンスパラメータセット(SPS)シンタックスを含むビットストリームを受信するステップと、
前記ビットストリームをデコードして前記SPSシンタックスのシンタックス要素を取得するステップであって、前記シンタックス要素が、参照ピクチャリスト構造および少なくとも1つの高レベルシンタックス(HLS)重み付き予測パラメータを備え、前記シンタックス要素の中で、前記少なくとも1つのHLS重み付き予測パラメータが前記参照ピクチャリスト構造より前にデコードされる、ステップと、
前記取得されたシンタックス要素に基づいて予測を実行して予測ブロックを取得するステップと、
前記予測ブロックに基づいて再構成されたブロックを再構成するステップと、
前記再構成されたブロックに基づいてデコードされたピクチャを取得するステップと
を備える、デコード方法。 - 前記少なくとも1つのHLS重み付き予測パラメータが、重み付き単予測のためのシーケンスパラメータセットフラグおよび重み付き双予測のためのシーケンスパラメータセットフラグのうちの少なくとも1つを含む、請求項7に記載の方法。
- シンタックス要素を取得するための前記ビットストリームの前記デコードが、エントロピーデコードによって実行される、請求項7または8に記載の方法。
- 前記取得されたシンタックス要素に基づいて予測を実行して予測ブロックを取得するステップが、
前記少なくとも1つのHLS重み付き予測パラメータ、および前記参照ピクチャリスト構造の中のシンタックス要素に基づいて、デルタPOCの値を取得するステップと、
デルタPOCの前記値に基づいて予測を実行するステップと
を備える、請求項7から9のいずれか一項に記載の方法。 - 前記少なくとも1つのHLS重み付き予測パラメータに基づいてデルタPOCの前記値を取得するステップが、
デルタPOCの前記値が0の値を有することを許容されるかどうかを前記少なくとも1つのHLS重み付き予測パラメータの前記値に基づいて決定するステップと、
デルタPOCの値の前記値が0の値を有することを許容されないことが決定されるとき、前記参照ピクチャリスト構造の中の前記シンタックス要素のインクリメントされた値を使用してデルタPOCの前記値を復元するステップと
を備える、請求項10に記載の方法。 - 前記参照ピクチャリスト構造の中の前記シンタックス要素がabs_delta_poc_stであり、デルタPOCの前記値が、以下、すなわち、
if( sps_weighted_pred_flag || sps_weighted_bipred_flag )
AbsDeltaPocSt[ listIdx ][ rplsIdx ][ i ] = abs_delta_poc_st[ listIdx ][ rplsIdx ][ i ]
else
AbsDeltaPocSt[ listIdx ][ rplsIdx ][ i ] = abs_delta_poc_st[ listIdx ][ rplsIdx ][ i ] + 1
のように取得され、AbsDeltaPocSt[ listIdx ][ rplsIdx ][ i ]がデルタPOCの絶対値であり、abs_delta_poc_st[ listIdx ][ rplsIdx ][ i ]が前記参照ピクチャリスト構造の中の前記シンタックス要素である、請求項10または11に記載の方法。 - プログラムが記録されたコンピュータ可読記憶媒体であって、前記プログラムが、請求項1から12のいずれかに記載の方法をコンピュータに実行させる、コンピュータ可読記憶媒体。
- デコーダであって、
1つまたは複数のプロセッサと、
前記プロセッサに結合され、前記プロセッサによる実行のためのプログラミングを記憶する非一時的コンピュータ可読記憶媒体とを備え、前記プログラミングが、前記プロセッサによって実行されたとき、請求項7から12のいずれか一項に記載の方法を実行するように前記デコーダを構成する、デコーダ。 - エンコーダであって、
1つまたは複数のプロセッサと、
前記プロセッサに結合され、前記プロセッサによる実行のためのプログラミングを記憶する非一時的コンピュータ可読記憶媒体とを備え、前記プログラミングが、前記プロセッサによって実行されたとき、請求項1から6のいずれか一項に記載の方法を実行するように前記エンコーダを構成する、エンコーダ。 - 請求項1から12のいずれかに記載の方法をコンピュータに実行させるように構成された、媒体に記憶されたコンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2024003947A JP2024032777A (ja) | 2019-09-06 | 2024-01-15 | 重み付き予測のための高レベルシグナリングの方法および装置 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RUPCT/RU2019/000625 | 2019-09-06 | ||
RU2019000625 | 2019-09-06 | ||
PCT/RU2020/050214 WO2021045653A1 (en) | 2019-09-06 | 2020-09-07 | Method and apparatus of high-level signaling for weighted prediction |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2024003947A Division JP2024032777A (ja) | 2019-09-06 | 2024-01-15 | 重み付き予測のための高レベルシグナリングの方法および装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022547293A JP2022547293A (ja) | 2022-11-11 |
JP7423758B2 true JP7423758B2 (ja) | 2024-01-29 |
Family
ID=74853278
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022514798A Active JP7423758B2 (ja) | 2019-09-06 | 2020-09-07 | 重み付き予測のための高レベルシグナリングの方法および装置 |
JP2024003947A Pending JP2024032777A (ja) | 2019-09-06 | 2024-01-15 | 重み付き予測のための高レベルシグナリングの方法および装置 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2024003947A Pending JP2024032777A (ja) | 2019-09-06 | 2024-01-15 | 重み付き予測のための高レベルシグナリングの方法および装置 |
Country Status (10)
Country | Link |
---|---|
US (1) | US20220201336A1 (ja) |
EP (1) | EP4022920A4 (ja) |
JP (2) | JP7423758B2 (ja) |
KR (1) | KR20220051402A (ja) |
CN (1) | CN114342403A (ja) |
AU (1) | AU2020342180A1 (ja) |
BR (1) | BR112022003969A2 (ja) |
CA (1) | CA3150261A1 (ja) |
MX (1) | MX2022002782A (ja) |
WO (1) | WO2021045653A1 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
MX2022003550A (es) * | 2019-09-24 | 2022-06-02 | Huawei Tech Co Ltd | Pruebas de conformidad hrd en ols. |
CN115136606A (zh) | 2020-02-19 | 2022-09-30 | 字节跳动有限公司 | 参考图片列表的权重的信令通知 |
WO2024080916A1 (en) * | 2022-10-13 | 2024-04-18 | Telefonaktiebolaget Lm Ericsson (Publ) | Inter-predicted reference picture lists |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130259130A1 (en) | 2012-04-03 | 2013-10-03 | Qualcomm Incorporated | Weighted prediction parameter coding |
US20140056356A1 (en) | 2012-08-21 | 2014-02-27 | Motorola Mobility Llc | Method and apparatus for efficient signaling of weighted prediction in advanced coding schemes |
US20150103898A1 (en) | 2012-04-09 | 2015-04-16 | Vid Scale, Inc. | Weighted prediction parameter signaling for video coding |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008088497A2 (en) * | 2006-12-21 | 2008-07-24 | Thomson Licensing | Methods and apparatus for improved signaling using high level syntax for multi-view video coding and decoding |
US9357229B2 (en) * | 2010-07-28 | 2016-05-31 | Qualcomm Incorporated | Coding motion vectors in video coding |
MY178305A (en) * | 2013-10-11 | 2020-10-07 | Vid Scale Inc | High level syntax for hevc extensions |
US10110925B2 (en) * | 2014-01-03 | 2018-10-23 | Hfi Innovation Inc. | Method of reference picture selection and signaling in 3D and multi-view video coding |
JP7450611B2 (ja) * | 2018-10-02 | 2024-03-15 | インターデジタル ヴイシー ホールディングス, インコーポレイテッド | 一般化された双予測および重み付き予測 |
-
2020
- 2020-09-07 KR KR1020227011008A patent/KR20220051402A/ko active Search and Examination
- 2020-09-07 BR BR112022003969A patent/BR112022003969A2/pt unknown
- 2020-09-07 EP EP20861081.6A patent/EP4022920A4/en active Pending
- 2020-09-07 CA CA3150261A patent/CA3150261A1/en active Pending
- 2020-09-07 WO PCT/RU2020/050214 patent/WO2021045653A1/en unknown
- 2020-09-07 JP JP2022514798A patent/JP7423758B2/ja active Active
- 2020-09-07 AU AU2020342180A patent/AU2020342180A1/en active Pending
- 2020-09-07 MX MX2022002782A patent/MX2022002782A/es unknown
- 2020-09-07 CN CN202080062458.3A patent/CN114342403A/zh active Pending
-
2022
- 2022-03-04 US US17/687,384 patent/US20220201336A1/en active Pending
-
2024
- 2024-01-15 JP JP2024003947A patent/JP2024032777A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130259130A1 (en) | 2012-04-03 | 2013-10-03 | Qualcomm Incorporated | Weighted prediction parameter coding |
US20150103898A1 (en) | 2012-04-09 | 2015-04-16 | Vid Scale, Inc. | Weighted prediction parameter signaling for video coding |
US20140056356A1 (en) | 2012-08-21 | 2014-02-27 | Motorola Mobility Llc | Method and apparatus for efficient signaling of weighted prediction in advanced coding schemes |
Non-Patent Citations (3)
Title |
---|
Takeshi Chujoh, Eiich Sasaki, and Tomohiro Ikai,AHG17: A bugfix of SPS flags and reference picture list structure,Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11,JVET-P0235-v1,16th Meeting: Geneva, CH,2019年09月,pp.1-3 |
Vadim Seregin, Muhammed Coban, Adarsh K. Ramasubramonian, and Marta Karczewicz,AHG17: On zero delta POC in reference picture structure,Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11,JVET-O0244-v1,15th Meeting: Gothenburg, SE,2019年06月,pp.1-3 |
Ye-Kui Wang, et al.,AHG2: Editorial input on VVC draft text,JVET-P0113-v1_DraftText.docx,2019年09月,pp.37-40,55,https://jvet-experts.org/doc_end_user/documents/16_Geneva/wg11/JVET-P0113-v1.zip |
Also Published As
Publication number | Publication date |
---|---|
KR20220051402A (ko) | 2022-04-26 |
CA3150261A1 (en) | 2021-03-11 |
EP4022920A4 (en) | 2022-11-16 |
JP2024032777A (ja) | 2024-03-12 |
JP2022547293A (ja) | 2022-11-11 |
BR112022003969A2 (pt) | 2022-05-24 |
WO2021045653A1 (en) | 2021-03-11 |
EP4022920A1 (en) | 2022-07-06 |
AU2020342180A1 (en) | 2022-03-31 |
CN114342403A (zh) | 2022-04-12 |
MX2022002782A (es) | 2022-05-13 |
US20220201336A1 (en) | 2022-06-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11405610B2 (en) | Encoder, a decoder and corresponding methods for intra prediction | |
CN115567717B (zh) | 编码器、解码器及对应方法和装置 | |
JP7483869B2 (ja) | エンコーダ、デコーダ、および対応する方法 | |
JP7423758B2 (ja) | 重み付き予測のための高レベルシグナリングの方法および装置 | |
CA3167535A1 (en) | Method and apparatus of harmonizing weighted prediction with non-rectangular merge modes | |
KR20210139446A (ko) | 인트라 스무딩을 위한 방법 및 장치 | |
JP7436646B2 (ja) | ピクチャヘッダのシグナリングを簡略化するためのエンコーダ、デコーダ及び対応する方法 | |
JP2022552727A (ja) | シーケンスパラメータセット内でのサブピクチャのシグナリングのためのエンコーダ、デコーダ、および対応する方法 | |
JP2023153193A (ja) | クロミナンス量子化パラメータのシグナリングのための方法及び装置 | |
JP7384998B2 (ja) | クロマイントラモード導出のエンコーダ、デコーダ、および対応する方法 | |
JP2023126744A (ja) | 幾何学的区分けモードのためのサンプルの距離の計算 | |
US20220247999A1 (en) | Method and Apparatus of Harmonizing Weighted Prediction with Non-Rectangular Merge Modes | |
JP2023515189A (ja) | スライス用のピクチャパーティション情報をシグナリングするためのデコーダ及び対応する方法 | |
WO2020251419A2 (en) | Method and apparatus of harmonizing weighted prediction with affine model based motion compensation for inter prediction | |
JP7414976B2 (ja) | エンコーダ、デコーダ、および、対応する方法 | |
WO2021134393A1 (en) | Method and apparatus of deblocking filtering between boundaries of blocks predicted using weighted prediction and non-rectangular merge modes |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220419 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220419 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230510 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230522 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20230816 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231114 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231218 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240117 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7423758 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |