JP7471328B2 - エンコーダ、デコーダ、および対応する方法 - Google Patents
エンコーダ、デコーダ、および対応する方法 Download PDFInfo
- Publication number
- JP7471328B2 JP7471328B2 JP2021576391A JP2021576391A JP7471328B2 JP 7471328 B2 JP7471328 B2 JP 7471328B2 JP 2021576391 A JP2021576391 A JP 2021576391A JP 2021576391 A JP2021576391 A JP 2021576391A JP 7471328 B2 JP7471328 B2 JP 7471328B2
- Authority
- JP
- Japan
- Prior art keywords
- dmvr
- prediction
- picture
- region
- current picture
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 189
- 230000033001 locomotion Effects 0.000 claims description 158
- 239000013598 vector Substances 0.000 claims description 129
- 230000001143 conditioned effect Effects 0.000 claims description 5
- 238000013139 quantization Methods 0.000 description 81
- 230000008569 process Effects 0.000 description 61
- 238000012545 processing Methods 0.000 description 58
- 230000003287 optical effect Effects 0.000 description 54
- 230000006854 communication Effects 0.000 description 36
- 238000004891 communication Methods 0.000 description 36
- 241000023320 Luma <angiosperm> Species 0.000 description 30
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 30
- 238000005192 partition Methods 0.000 description 30
- 230000006870 function Effects 0.000 description 26
- 230000002457 bidirectional effect Effects 0.000 description 25
- 238000003860 storage Methods 0.000 description 25
- 238000000638 solvent extraction Methods 0.000 description 23
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 22
- 239000000872 buffer Substances 0.000 description 22
- 230000005540 biological transmission Effects 0.000 description 14
- 238000010586 diagram Methods 0.000 description 14
- 238000003491 array Methods 0.000 description 11
- 238000004364 calculation method Methods 0.000 description 11
- 230000006835 compression Effects 0.000 description 11
- 238000007906 compression Methods 0.000 description 11
- 230000000295 complement effect Effects 0.000 description 9
- 238000006073 displacement reaction Methods 0.000 description 9
- 238000001914 filtration Methods 0.000 description 9
- 239000011449 brick Substances 0.000 description 8
- 230000011664 signaling Effects 0.000 description 7
- 230000008901 benefit Effects 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 6
- 238000007781 pre-processing Methods 0.000 description 6
- 230000003044 adaptive effect Effects 0.000 description 5
- 238000013500 data storage Methods 0.000 description 5
- 230000002123 temporal effect Effects 0.000 description 5
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 238000012805 post-processing Methods 0.000 description 4
- 230000002146 bilateral effect Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 230000006837 decompression Effects 0.000 description 2
- 238000009795 derivation Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 238000005111 flow chemistry technique Methods 0.000 description 2
- 238000009499 grossing Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000007620 mathematical function Methods 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 238000010561 standard procedure Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- VBRBNWWNRIMAII-WYMLVPIESA-N 3-[(e)-5-(4-ethylphenoxy)-3-methylpent-3-enyl]-2,2-dimethyloxirane Chemical compound C1=CC(CC)=CC=C1OC\C=C(/C)CCC1C(C)(C)O1 VBRBNWWNRIMAII-WYMLVPIESA-N 0.000 description 1
- 101150039623 Clip1 gene Proteins 0.000 description 1
- 238000012952 Resampling Methods 0.000 description 1
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007175 bidirectional communication Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 229910052710 silicon Inorganic materials 0.000 description 1
- 239000010703 silicon Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 230000009012 visual motion Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
- H04N19/517—Processing of motion vectors by encoding
- H04N19/52—Processing of motion vectors by encoding by predictive encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/577—Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/109—Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/174—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/523—Motion estimation or motion compensation with sub-pixel accuracy
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
この特許出願は、2019年6月21日に出願されたインド特許出願第IN201931024825号の優先権を主張する。上述の特許出願の開示は、その全体が参照によりここに組み込まれる。
複数のピクチャのうちの現在のピクチャの少なくとも1つの領域に対してデコーダ動きベクトル精緻化(DMVR)を基にしたインター双予測が有効化されるかどうかを決定するステップと、DMVRを基にしたインター双予測が有効化されるかどうかを決定した結果に基づいて、シーケンスパラメータセット(SPS)レベルより低い階層のシンタックス構造レベルにおいてDMVRに対する無効化フラグ(例えば、1ビットのフラグ)の値を設定するステップとを備え、無効化フラグの値は、現在のピクチャの少なくとも1つの領域に対してDMVRを基にしたインター双予測が有効化されるか否かを指定する。
複数のピクチャのうちの現在のピクチャの少なくとも1つの領域に対して双方向オプティカルフロー(BDOF)インター予測が有効化されるかどうかを決定するステップと、
BDOFインター予測が有効化されるかどうかを決定した結果に基づいて、シーケンスパラメータセットレベル(SPS)より低い階層のシンタックス構造レベルにおいてBDOFに対する無効化フラグ(例えば、1ビットのフラグ)の値を設定するステップであって、無効化フラグの値は、現在のピクチャの少なくとも1つの領域に対してBDOFインター予測が有効化されるか否かを指定する、ステップとを備える。
DMVR決定ユニットは、計算された第2の総和が、計算された第1の総和よりも大きいとき、現在のピクチャの後続のピクチャに対してDMVRインター双予測が有効化されるべきでないことを決定するように構成されてよい。
BDOFインター予測が有効化されるかどうかを決定した結果に基づいて、シーケンスパラメータセットレベル(SPS)より低い階層のシンタックス構造レベルにおいてBDOFに対する無効化フラグ(例えば、1ビットのフラグ)の値を設定するように構成された第1のBDOFフラグ設定ユニットであって、無効化フラグの値は、現在のピクチャの少なくとも1つの領域に対してBDOFインター予測が有効化されるか否かを指定する、第1のBDOFフラグ設定ユニットとを備える。
図2は、本出願の技法を実現するように構成される例示のビデオエンコーダ20の概略ブロック図を表す。図2の例では、ビデオエンコーダ20は、入力201(または入力インターフェース201)、残差計算ユニット204、変換処理ユニット206、量子化ユニット208、逆量子化ユニット210、および逆変換処理ユニット212、再構成ユニット214、ループフィルタユニット220、デコードされたピクチャバッファ(decoded picture buffer(DPB))230、モード選択ユニット260、エントロピーエンコードユニット270、および出力272(または出力インターフェース272)を備える。モード選択ユニット260は、インター予測ユニット244、イントラ予測ユニット254、および区分ユニット262を含んでよい。インター予測ユニット244は、動き推定ユニットおよび動き補償ユニット(表されていない)を含んでよい。図2に表されたようなビデオエンコーダ20は、ハイブリッドビデオエンコーダ、またはハイブリッドビデオコーデックによるビデオエンコーダとも呼ばれ得る。
エンコーダ20は、ピクチャ17(またはピクチャデータ17)、例えば、ビデオまたはビデオシーケンスを形成するピクチャのシーケンスのピクチャを、例えば、入力201を介して受信するように構成され得る。受信されるピクチャまたはピクチャデータはまた、前処理されたピクチャ19(または前処理されたピクチャデータ19)であってよい。簡潔さの目的のために、以下の説明はピクチャ17に言及する。ピクチャ17は、現在のピクチャ、または(同じビデオシーケンス、すなわち、やはり現在のピクチャを備えるビデオシーケンスの他のピクチャ、例えば、前にエンコードされ、かつ/またはデコードされたピクチャから現在のピクチャを区別するために、特にビデオコーディングにおいて)コーディングされるべきピクチャとも呼ばれ得る。
残差計算ユニット204は、例えば、サンプルごとに(ピクセルごとに)ピクチャブロック203のサンプル値から予測ブロック265のサンプル値を減算することによって、ピクチャブロック203および予測ブロック265(予測ブロック265についてのさらなる詳細は後で提供される)に基づいて残差ブロック205(残差205とも呼ばれる)を計算して、サンプル領域における残差ブロック205を取得するように構成され得る。
変換処理ユニット206は、残差ブロック205のサンプル値において変換、例えば、離散コサイン変換(discrete cosine transform(DCT))または離散サイン変換(discrete sine transform(DST))を適用して、変換領域における変換係数207を取得するように構成され得る。変換係数207は、変換残差係数とも呼ばれ、変換領域における残差ブロック205を表現してよい。
量子化ユニット208は、例えば、スカラー量子化またはベクトル量子化を適用することによって、変換係数207を量子化して量子化された係数209を取得するように構成され得る。量子化された係数209は、量子化された変換係数209または量子化された残差係数209とも呼ばれ得る。
逆量子化ユニット210は、例えば、量子化ユニット208と同じ量子化ステップサイズに基づいて、またはそれを使用して、量子化ユニット208によって適用される量子化方式の逆を適用することによって、量子化された係数において量子化ユニット208の逆量子化を適用して量子化解除された係数211を取得するように構成される。量子化解除された係数211は、量子化解除された残差係数211とも呼ばれ、量子化による損失に起因して典型的には変換係数と同一でないが、変換係数207に対応し得る。
逆変換処理ユニット212は、変換処理ユニット206によって適用される変換の逆変換、例えば、逆離散コサイン変換(DCT)または逆離散サイン変換(DST)、または他の逆変換を適用して、サンプル領域における再構成された残差ブロック213(または、対応する量子化解除された係数213)を取得するように構成される。再構成された残差ブロック213は、変換ブロック213とも呼ばれ得る。
再構成ユニット214(例えば、加算器または合算器214)は、例えば、再構成された残差ブロック213のサンプル値と予測ブロック265のサンプル値を、サンプルごとに、加算することによって、変換ブロック213(すなわち、再構成された残差ブロック213)を予測ブロック265に加算してサンプル領域における再構成されたブロック215を取得するように構成される。
ループフィルタユニット220(または、短縮して「ループフィルタ」220)は、再構成されたブロック215をフィルタ処理してフィルタ処理されたブロック221を取得するように、または一般に、再構成されたサンプルをフィルタ処理してフィルタ処理されたサンプルを取得するように構成される。ループフィルタユニットは、例えば、ピクセル遷移を平滑化し、またはそうでなくビデオ品質を改善するように構成される。ループフィルタユニット220は、デブロッキングフィルタ、サンプル適応オフセット(Sample-Adaptive Offset(SAO))フィルタ、または1つまたは複数の他のフィルタ、例えば、バイラテラルフィルタ、適応ループフィルタ(Adaptive Loop Filter(ALF))、鮮鋭化、平滑化フィルタ、または協調フィルタ、またはそれらの任意の組み合わせのような1つまたは複数のループフィルタを備えてよい。ループフィルタユニット220はループ内フィルタであるとして図2に表されているが、他の構成では、ループフィルタユニット220は、ポストループフィルタとして実現されてよい。フィルタ処理されたブロック221は、フィルタ処理された再構成されたブロック221とも呼ばれ得る。
デコードされたピクチャバッファ(DPB)230は、ビデオエンコーダ20によってビデオデータをエンコードするための、参照ピクチャまたは一般に参照ピクチャデータを記憶するメモリであってよい。DPB 230は、同期DRAM(synchronous DRAM(SDRAM))を含むダイナミックランダムアクセスメモリ(dynamic random access memory(DRAM))、磁気抵抗RAM(magnetoresistive RAM(MRAM))、抵抗性RAM(resistive RAM(RRAM(登録商標)))、または他のタイプのメモリデバイスのような、様々なメモリデバイスのうちのいずれかによって形成され得る。デコードされたピクチャバッファ(DPB)230は、1つまたは複数のフィルタ処理されたブロック221を記憶するように構成され得る。デコードされたピクチャバッファ230は、以前にフィルタ処理された他のブロック、例えば、同じ現在のピクチャの、または異なるピクチャの、以前に再構成され、フィルタ処理されたブロック221、例えば、以前に再構成されたピクチャを記憶するようにさらに構成されてよく、例えば、インター予測のために、以前に再構成され、すなわちデコードされた完全なピクチャ(および、対応する参照ブロックおよびサンプル)、および/または部分的に再構成された現在のピクチャ(および、対応する参照ブロックおよびサンプル)を提供し得る。例えば、再構成されたブロック215が、ループフィルタユニット220によってフィルタ処理されていない、または再構成されたブロックまたはサンプルのさらに処理された任意の他のバージョンであるならば、デコードされたピクチャバッファ(DPB)230はまた、1つまたは複数のフィルタ処理されていない再構成されたブロック215、または一般に、フィルタ処理されていない再構成されたサンプルを記憶するように構成されてよい。
モード選択ユニット260は、区分ユニット262、インター予測ユニット244、およびイントラ予測ユニット254を備え、元のピクチャデータ、例えば、元のブロック203(現在のピクチャ17の現在のブロック203)、および同じ(現在の)ピクチャの、かつ/または1つまたは複数の以前にデコードされたピクチャからの、例えば、デコードされたピクチャバッファ230または他のバッファ(例えば、表されていないラインバッファ)からの、再構成されたピクチャデータ、例えば、フィルタ処理された、および/またはフィルタ処理されていない再構成されたサンプルまたはブロックを受信または取得するように構成される。再構成されたピクチャデータは、予測ブロック265または予測子265を取得するために、予測、例えば、インター予測またはイントラ予測のための参照ピクチャデータとして使用される。
区分ユニット262は、現在のブロック203をより小さい区分、例えば、正方形または長方形のサイズのより小さいブロックに、区分(または分割)し得る。これらのより小さいブロック(サブブロックとも呼ばれ得る)は、いっそう小さい区分にさらに区分され得る。これは、ツリー区分または階層的ツリー区分とも呼ばれ、例えば、ルートツリーレベル0(階層レベル0、深度0)におけるルートブロックは、再帰的に区分され、例えば、次に低いツリーレベルの2つ以上のブロック、例えば、ツリーレベル1(階層レベル1、深度1)におけるノードに区分されてよく、これらのブロックは再び、例えば、終了基準が充足され、例えば、最大ツリー深度または最小ブロックサイズが到達されたので区分が終了されるまで、次に低いレベル、例えば、ツリーレベル2(階層レベル2、深度2)などの2つ以上のブロックに区分されてよい。さらに区分されないブロックは、ツリーのリーフブロックまたはリーフノードとも呼ばれる。2つの区分への区分を使用するツリーは2分木(Binary-Tree(BT))と呼ばれ、3つの区分への区分を使用するツリーは3分木(Ternary-Tree(TT))と呼ばれ、4つの区分への区分を使用するツリーは4分木(Quad-Tree(QT))と呼ばれる。
イントラ予測モードのセットは、例えば、HEVCにおいて定義されるように、35個の異なるイントラ予測モード、例えば、DC(または平均)モードおよび平面モードのような無方向性モード、または方向性モードを備えてよく、または、例えば、VVCについて定義されるように、67個の異なるイントラ予測モード、例えば、DC(または平均)モードおよび平面モードのような無方向性モード、または方向性モードを備えてよい。
インター予測モードのセット(または可能なインター予測モード)は、利用可能な参照ピクチャ(すなわち、例えば、DBP 230に記憶されている、少なくとも部分的にデコードされた以前のピクチャ)、および他のインター予測パラメータ、例えば、最も良く整合する参照ブロックを探索するために参照ピクチャ全体が使用されるか、または参照ピクチャの一部のみ、例えば、現在のブロックのエリアの周囲の探索ウィンドウエリアが使用されるか、および/または、例えば、ピクセル補間、例えば、ハーフ/セミペルおよび/またはクォーターペル補間が適用されるか否かに依存する。
エントロピーエンコードユニット270は、量子化された係数209、インター予測パラメータ、イントラ予測パラメータ、ループフィルタパラメータ、および/または他のシンタックス要素において、例えば、エントロピーエンコードアルゴリズムまたは方式(例えば、可変長コーディング(variable length coding(VLC))方式、コンテキスト適応VLC方式(context adaptive VLC scheme(CAVLC))、算術コーディング方式、2値化、コンテキスト適応バイナリ算術コーディング(context adaptive binary arithmetic coding(CABAC))、シンタックスを基にしたコンテキスト適応バイナリ算術コーディング(syntax-based context-adaptive binary arithmetic coding(SBAC))、確率区間区分エントロピー(probability interval partitioning entropy(PIPE))コーディング、または別のエントロピーエンコード方法論または技法)、またはバイパス(圧縮なし)を適用して、例えば、エンコードされたビットストリーム21の形式で、出力272を介して出力されることが可能であるエンコードされたピクチャデータ21を取得するように構成され、それによって、例えば、ビデオデコーダ30は、デコードのためにパラメータを受信および使用し得る。エンコードされたビットストリーム21は、ビデオデコーダ30へ伝送され、またはビデオデコーダ30による後の伝送または取り出しのためにメモリに記憶され得る。
図3は、この本出願の技法を実現するように構成されるビデオデコーダ30の一例を表す。ビデオデコーダ30は、例えば、エンコーダ20によってエンコードされた、エンコードされたピクチャデータ21(例えば、エンコードされたビットストリーム21)を受信して、デコードされたピクチャ331を取得するように構成される。エンコードされたピクチャデータまたはビットストリームは、エンコードされたピクチャデータをデコードするための情報、例えば、エンコードされたビデオスライス(および/または、タイルグループまたはタイル)のピクチャブロックを表現するデータ、および関連付けられたシンタックス要素を備える。
エントロピーデコードユニット304は、ビットストリーム21(または一般にエンコードされたピクチャデータ21)を構文解析し、例えば、エンコードされたピクチャデータ21へのエントロピーデコードを実行して、例えば、量子化された係数309および/またはデコードされたコーディングパラメータ(図3に表されていない)、例えば、インター予測パラメータ(例えば、参照ピクチャインデックスおよび動きベクトル)、イントラ予測パラメータ(例えば、イントラ予測モードまたはインデックス)、変換パラメータ、量子化パラメータ、ループフィルタパラメータ、および/または他のシンタックス要素のうちのいずれかまたは全てを取得するように構成される。エントロピーデコードユニット304は、エンコーダ20のエントロピーエンコードユニット270に関して説明されたようなエンコード方式に対応するデコードアルゴリズムまたは方式を適用するように構成され得る。エントロピーデコードユニット304は、モード適用ユニット360にインター予測パラメータ、イントラ予測パラメータ、および/または他のシンタックス要素を、デコーダ30の他のユニットに他のパラメータを提供するようにさらに構成され得る。ビデオデコーダ30は、ビデオスライスレベルおよび/またはビデオブロックレベルにおいてシンタックス要素を受信し得る。スライスおよびそれぞれのシンタックス要素に加えて、またはそれらの代替として、タイルグループおよび/またはタイルおよびそれぞれのシンタックス要素が受信および/または使用され得る。
逆量子化ユニット310は、(例えば、エントロピーデコードユニット304によって、例えば、構文解析および/またはデコードすることによって)エンコードされたピクチャデータ21から量子化パラメータ(quantization parameter(QP))(または一般に逆量子化に関する情報)および量子化された係数を受信し、量子化パラメータに基づいて、デコードされた量子化された係数309において逆量子化を適用して、変換係数311とも呼ばれ得る量子化解除された係数311を取得するように構成され得る。逆量子化プロセスは、量子化の程度、および同様に、適用されるべき逆量子化の程度を決定するために、ビデオスライス(またはタイルまたはタイルグループ)の中のビデオブロックごとにビデオエンコーダ20によって決定された量子化パラメータの使用を含んでよい。
逆変換処理ユニット312は、変換係数311とも呼ばれる量子化解除された係数311を受信し、サンプル領域において再構成された残差ブロック213を取得するために量子化解除された係数311に変換を適用するように構成され得る。再構成された残差ブロック213は、変換ブロック313とも呼ばれ得る。変換は、逆変換、例えば、逆DCT、逆DST、逆整数変換、または概念的に類似の逆変換プロセスであってよい。逆変換処理ユニット312は、量子化解除された係数311に適用されるべき変換を決定するために、(例えば、エントロピーデコードユニット304によって、例えば、構文解析および/またはデコードすることによって)エンコードされたピクチャデータ21から変換パラメータまたは対応する情報を受信するようにさらに構成され得る。
再構成ユニット314(例えば、加算器または合算器314)は、例えば、再構成された残差ブロック313のサンプル値と予測ブロック365のサンプル値とを加算することによって、予測ブロック365に再構成された残差ブロック313を加算して、サンプル領域において再構成されたブロック315を取得するように構成され得る。
(コーディングループ内またはコーディングループの後のいずれかの)ループフィルタユニット320は、例えば、ピクセル遷移を平滑化し、またはビデオ品質をそうでなく改善するために、再構成されたブロック315をフィルタ処理してフィルタ処理されたブロック321を取得するように構成される。ループフィルタユニット320は、デブロッキングフィルタ、サンプル適応オフセット(sample-adaptive offset(SAO))フィルタ、または1つまたは複数の他のフィルタ、例えば、バイラテラルフィルタ、適応ループフィルタ(adaptive loop filter(ALF))、鮮鋭化、平滑化フィルタ、または協調フィルタ、またはそれらの任意の組み合わせのような1つまたは複数のループフィルタを備えてよい。ループフィルタユニット320はループ内フィルタであるとして図3に表されているが、他の構成では、ループフィルタユニット320はポストループフィルタとして実現されてよい。
ピクチャのデコードされたビデオブロック321は、次いで、他のピクチャについての続く動き補償のために、かつ/または出力されるそれぞれ表示のために、参照ピクチャとしてデコードされたピクチャ331を記憶するデコードされたピクチャバッファ330に記憶される。
インター予測ユニット344は、インター予測ユニット244と(特に動き補償ユニットと)同一であってよく、イントラ予測ユニット354は、機能においてインター予測ユニット254と同一であってよく、区分および/または予測パラメータ、またはエンコードされたピクチャデータ21から(例えば、エントロピーデコードユニット304によって、例えば、構文解析および/またはデコードすることによって)受信されたそれぞれの情報に基づいて、分割または区分決定および予測を実行する。モード適用ユニット360は、(フィルタ処理された、またはフィルタ処理されていない)再構成されたピクチャ、ブロック、またはそれぞれのサンプルに基づいて、ブロックごとに予測(イントラまたはインター予測)を実行して、予測ブロック365を取得するように構成され得る。
ux = ( mvx + 2bitDepth ) % 2bitDepth (1)
mvx = ( ux >= 2bitDepth-1 ) ? ( ux - 2bitDepth ) : ux (2)
uy = ( mvy + 2bitDepth ) % 2bitDepth (3)
mvy = ( uy >= 2bitDepth-1 ) ? ( uy - 2bitDepth ) : uy (4)
ここで、mvxは画像ブロックまたはサブブロックの動きベクトルの水平成分であり、mvyは画像ブロックまたはサブブロックの動きベクトルの垂直成分であり、uxおよびuyは中間値を示す。
ux = ( mvpx + mvdx +2bitDepth ) % 2bitDepth (5)
mvx = ( ux >= 2bitDepth-1 ) ? ( ux - 2bitDepth ) : ux (6)
uy = ( mvpy + mvdy +2bitDepth ) % 2bitDepth (7)
mvy = ( uy >= 2bitDepth-1 ) ? ( uy - 2bitDepth ) : uy (8)
vx = Clip3(-2bitDepth-1, 2bitDepth-1 -1, vx)
vy = Clip3(-2bitDepth-1, 2bitDepth-1 -1, vy)
ここで、vxは画像ブロックまたはサブブロックの動きベクトルの水平成分であり、vyは画像ブロックまたはサブブロックの動きベクトルの垂直成分であり、x、y、およびzはそれぞれ、MVクリッピングプロセスの3つの入力値に対応し、関数Clip3の定義は以下の通りである。
動きベクトルは、通常、少なくとも部分的にエンコーダ側において決定され、コーディングされたビットストリーム内でデコーダにシグナリングされる。しかし、動きベクトルはまた、ビットストリーム内で示される初期動きベクトルから始めてデコーダにおいて(かつエンコーダにおいても)精緻化されてよい。そのような場合、例えば、初期動きベクトルによって指し示される、既にデコードされたピクセルのパッチ間の類似度が、初期動きベクトルの確度を改善するために使用され得る。そのような動き精緻化は、シグナリングオーバーヘッドを減少させる利点を提供し、初期動きの確度は、エンコーダとデコーダの両方において同じやり方で改善され、従って、精緻化のための追加のシグナリングが必要とされない。
・(MV0, MV1)
・(MV0 + (0,1), MV1 + (0,-1))
・(MV0 + (1,0), MV1 + (-1,0))
・(MV0 + (0,-1), MV1 + (0,1))
・(MV0 + (-1,0), MV1 + (1,0))
・...
・初期MVペアの分数部分を最も近い整数位置に丸め、再構成された参照ピクチャの整数グリッド値を取得する。
・2タップ(例えば、双線形)の分離可能な双線形補間を実行して、初期MVペアによって示された分数ピクセル確度における予測されたサンプル値を取得する。
・より高いタップの(例えば、8タップまたは6タップの)分離可能な補間を実行して、初期MVペアによって示された分数ピクセル確度における予測されたサンプル値を取得する。
・現在のピクチャから、サンプルのコーディングされたブロックの双予測のために使用される2つの参照ピクチャまでの(均一なフレームレートでサンプリングされるときの)ピクチャの数での距離は等しく、現在のピクチャの両側にある。
・初期MVペアを使用して取得される2つの予測ブロック間の初期非類似度は、予め決定されたサンプルごとのしきい値よりも小さい。
双方向オプティカルフローは、双予測のためにシグナリングされる以外のビットストリーム内での明示的な追加のシグナリングなしで、ブロックの双予測の確度を改善するプロセスである。それは図2の中のインター予測ユニット(244)および図3の中の344の一部である。
双予測 = 予測1 * W1 + 予測2 * W2 + K
によって実行されることが可能であり、ここで、W1およびW2は、ビットストリーム内でシグナリングされ得るか、またはエンコーダ側においてまたはデコーダ側において予め定義され得る重み付け係数である。Kは、また、ビットストリーム内でシグナリングされ、またはエンコーダ側においてまたはデコーダ側において予め定義され得る加算的な係数である。一例として、双予測は、
双予測 = (予測1 + 予測2)/2
を使用して取得されてよく、ここで、W1およびW2が1/2に設定されKが0に設定される。
I(x,y,t) = I(x+ dx ,y+ dy ,t+dt)
によって与えられる。I(x,y,t)は、(x,y,t)の座標におけるピクセルの強度(サンプル値)を指定する。
1. サンプル勾配を計算する。
2. 第1の予測と第2の予測との間の差分を計算する。
3. オプティカルフロー方程式を使用して取得される2つの参照パッチ間の誤差Δを最小化する、ピクセルまたはピクセルのグループの変位を計算する。
4. 以下のようなオプティカルフロー方程式の実装を採用する。
predBIO=1/2・(I(0)+I(1)+vx/2・(τ1∂I(1)/∂x-τ0∂I(0)/∂x)+vy/2・(τ1∂I(1)/∂y-τ0∂I(0)/∂y))
ここで、predBIOは、オプティカルフロー精緻化プロセスの出力である修正された予測を指定する。
・∂I(x, y, t) / ∂x = I(x + 1, y, t) - I(x - 1, y, t)
・∂I(x, y, t) / ∂y = I(x, y + 1, t) - I(x, y - 1, t)
双方向オプティカルフロー(BDOF)ツールがVVCの中に含まれる。前にBIOと呼ばれたBDOFが、JEMの中に含められた。JEMバージョンと比較して、VVCにおけるBDOFは、特に乗算の数および乗数のサイズの観点から、ずっと少ない計算を要求する、より簡単なバージョンである。
- CUが「真の」双予測モードを使用してコーディングされている、すなわち、2つの参照ピクチャのうちの一方が表示順序で現在のピクチャの前にあり、他方が表示順序で現在のピクチャの後にある。
- 2つの参照ピクチャから現在のピクチャまでの距離(すなわち、POC差分)が同じである。
- 両方の参照ピクチャが短期参照ピクチャである。
- CUがアフィンモードまたはATMVPマージモードを使用してコーディングされていない。
- CUが、64個よりも多くのルーマサンプルを有する。
- CUの高さとCUの幅の両方が、8ルーマサンプルよりも大きいかまたはそれに等しい。
- BCW重みインデックスが、等しい重みを示す。
- 現在のCUに対してWPが有効化されていない。
- 現在のCUに対してCIIPモードが使用されていない。
predBDOF(x,y)=(I(0)(x,y)+I(1)(x,y)+b(x,y)+ooffset) >> shift (3-5)
マージモードのMVの確度を増加させるために、バイラテラル整合を基にしたデコーダ側動きベクトル精緻化がVVCにおいて適用される。双予測動作では、精緻化されたMVは、参照ピクチャリストL0および参照ピクチャリストL1内の初期MVの周囲で探索される。BM方法は、参照ピクチャリストL0およびリストL1内の2つの候補ブロックの間のひずみを計算する。図7に例示されたように、初期MVの周囲の各MV候補に基づく赤のブロックの間のSADが計算される。最小のSADを有するMV候補が、精緻化されたMVになり、双予測された信号を生成するために使用される。VVCでは、以下のモードおよび特徴を用いてコーディングされているCUに対してDMVRが適用されることが可能である。
- 双予測MVを用いた、CUレベルのマージモード。
- 現在のピクチャに関して、過去に1つの参照ピクチャがあり、将来に別の参照ピクチャがある。
- 2つの参照ピクチャから現在のピクチャまでの距離(すなわち、POC差分)が同じである。
- 両方の参照ピクチャが短期参照ピクチャである。
- CUが、64個よりも多くのルーマサンプルを有する。
- CUの高さとCUの幅の両方が、8個のルーマサンプルよりも大きいかまたはそれに等しい。
- BCW重みインデックスが、等しい重みを示す。
- 現在のブロックに対してWPが有効化されていない。
- 現在のブロックに対してCIIPモードが使用されていない。
双予測MVを用いた、CUレベルのマージモード。
現在のピクチャに関して、過去に1つの参照ピクチャがあり、将来に別の参照ピクチャがある。
両方の参照ピクチャから現在のピクチャまでの距離(すなわち、POC差分)が同じである。
CUが、64個よりも多くのルーマサンプルを有する。
CUの高さとCUの幅の両方が、8個のルーマサンプルよりも大きいかまたはそれに等しい。
BCW重みインデックスが、等しい重みを示す。
現在のブロックに対してWPが有効化されていない。
DVMRでは、探索ポイントが初期MVを囲んでおり、MVオフセットはMV差分ミラーリング規則に従う。言い換えれば、候補MVペア(MV0,MV1)によって表記される、DMVRによってチェックされるいかなるポイントも、以下の2つの式に従う。
MV0' = MV0 + MV_offset (3-6)
MV1' = MV1 - MV_offset (3-7)
ここで、MV_offsetは、参照ピクチャのうちの1つの中の、初期MVと精緻化されたMVの間の精緻化オフセットを表現する。精緻化探索範囲は、初期MVからの2つの整数ルーマサンプルである。探索は、整数サンプルオフセット探索段階、および分数サンプル精緻化段階を含む。
E(x,y) = A(x - xmin)2 + B(y - ymin)2 + C (3-8)
ここで、(xmin,ymin)は、最小コストを有する分数位置に対応し、Cは、最小コスト値に対応する。5つの探索ポイントのコスト値を使用することによって上記の式を解くことによって、(xmin,ymin)は、
xmin = (E(-1,0) - E(1,0))/(2(E(-1,0) + E(1,0) - 2E(0,0))) (3-9)
ymin = (E(0,-1) - E(0,1))/(2((E(0,-1) + E(0,1) - 2E(0,0))) (3-10)
として算出される。
VVCでは、MVの解像度は1/16ルーマサンプルである。分数位置におけるサンプルは、8タップ補間フィルタを使用して補間される。DMVRでは、探索ポイントが、整数サンプルオフセットを有する初期分数ペルMVを囲んでおり、従って、それらの分数位置のサンプルは、DMVR探索プロセスのために補間される必要がある。計算複雑度を減少させるために、双線形補間フィルタが、DMVRにおける探索プロセスのために分数サンプルを生成するために使用される。別の重要な効果は、2サンプルの探索範囲を有する双線形フィルタを使用することによって、DVMRが、通常の動き補償プロセスと比較してより多くの参照サンプルにアクセスしないことである。DMVR探索プロセスを用いて、精緻化されたMVが達成された後、通常の8タップ補間フィルタが適用されて最終予測を生成する。通常のMCプロセスへの、より多くの参照サンプルにアクセスしないために、元のMVに基づく補間プロセスのために必要とされないが、精緻化されたMVに基づく補間プロセスのために必要とされるサンプルが、それらの利用可能なサンプルからパディングされる。
CUの幅および/または高さが16個のルーマサンプルよりも大きいとき、それは、16個のルーマサンプルに等しい幅および/または高さを有するサブブロックにさらに分割される。DMVR探索プロセスのための最大ユニットサイズは、16×16に限定される。
この発明では、より大きい粒度においてMVRが有効化されるときにMVRを条件的に無効化するために、シーケンスパラメータセットよりも細かい粒度において(例えば、PPSについてはSPSレベルにおいて、スライスについてはSPS/PPSレベルにおいてなど)フラグが提案される。同様に、この発明は、より大きい粒度においてBDOFが有効化されるときにBDOFを条件的に無効化するために、シーケンスパラメータセットよりも細かい粒度においてフラグを提案する。
この実施形態では、いつSPSレベルにおいてMVRが有効化されていても(すなわち、SPSレベルにおいてsps_dmvr_enabled_flagが1に設定されている)MVRを無効化するために、ピクチャパラメータセット(PPS)レベルフラグpps_disable_dmvr_flagが提案される。
if (sps_dmvr_enabled_flag)
pps_disable_dmvr_flag
- id、pps_picture_parameter_set_idを有するピクチャパラメータセット内でpps_disable_dmvr_flagが1としてデコードされるとき、pps_picture_parameter_set_idを使用するスライスがMVRを無効化する(すなわち、通常のマージモードコーディングユニットに対してデコーダ側動きベクトル精緻化が実行されないものとする)。sps_dmvr_enabled_flagが1であり、かつpps_disable_dmvr_flagが0としてデコードされるとき、pps_picture_parameter_set_idを使用するスライスがMVRを有効化する(すなわち、通常のマージモードコーディングユニットのサブブロックに対してデコーダ側動きベクトル精緻化が実行されるものとする)。
if (sps_bdof_enabled_flag)
pps_disable_bdof_flag
この実施形態では、いつSPSにおいてMVRが有効化されていても(すなわち、SPSレベルにおいてsps_dmvr_enabled_flagが1に設定されている)MVRを無効化するために、スライスヘッダレベルフラグslice_disable_dmvr_flagが提案される。
if (sps_dmvr_enabled_flag)
slice_disable_dmvr_flag
if (sps_bdof_enabled_flag)
slice_disable_bdof_flag
この実施形態では、エンコーダは、ビデオの現在のフレーム内でのスクリーンコンテンツの存在を検出するための方法を使用し、それを使用して、それぞれ、所与のアクセスユニットまたはスライスに対して、実施形態1において説明されたpps_disable_dmvr_flagを1に、または実施形態2において説明されたslice_disable_dmvr_flagを1に設定する。
この実施形態では、エンコーダは、DMVRを用いて、およびDMVRなしで取得された予測残差に対して、絶対変換差分の和(sum of absolute transform differences, SATD)を基にしたコスト計算の総和を実行する。再帰の後のコーディングユニットに対する、DMVRを用いた、およびDMVRなしのSATDを基にしたコストが、現在のフレームの全てのコーディングユニットに渡って別個に累積される。DMVRを用いた累積されたコストがDMVRなしの累積されたコストよりも大きいとき、エンコーダがシーン変化を検出するかまたはイントラピクチャをエンコードするかのいずれかまで、提案されるpps_disable_dmvr_flagを現在のフレームに対して1に設定することによって、または現在のフレームを再エンコードすることにより、提案されるpps_disable_dmvr_flagを現在のフレームに対して1に設定することによって、またはエンコーダの順序での後続のピクチャに対してpps_disable_dmvr_flagを1に設定することによって、DMVRを無効化するための決定が行われる。そして、DMVRを用いた累積されたコストがDMVRなしの累積されたコストよりも大きいという結論に基づいて、または現在のフレームまたは後続のピクチャに対するpps_disable_dmvr_flagの値に基づいて、現在のフレームまたは後続のピクチャがエンコードされて現在のフレームまたは後続のピクチャに対するコーディングされたデータを取得する。用語、再エンコードは、実際には現在のフレームをエンコードする第2のパスを指す。DMVRは、DMVRを用いた、およびDMVRなしのコストを累積した後、現在のフレームの第1のパスの間に最初に有効化された(ここで、DMVRを適用すべき条件を現在のCUが満たすとき、DMVRを用いることが標準的に要求される)。ここで、フレームレベルにおいて、DMVRなしのコストがより良いならば、フレーム全体が、ここでPPSレベルにおいてDMVRが無効化されて再びエンコードされる。
ビデオビットストリームのシーケンスパラメータセットからデコーダ動きベクトル精緻化を基にしたインター双予測(DMVR)に対する有効化フラグを構文解析するステップであって、DMVRが、シーケンスパラメータセットに関連付けられた複数のピクチャに対して実行されることを有効化されるかどうかを、DMVRに対する有効化フラグが指定する、ステップと、
ビデオビットストリームのピクチャパラメータセットからDMVRに対する無効化フラグを構文解析するステップであって、DMVRが、ピクチャパラメータセットに関連付けられた現在のピクチャに対して実行されることを無効化されるかどうかを、DMVRに対する無効化フラグが指定し、現在のピクチャが、複数のピクチャに属する、ステップと、
少なくとも2つの条件が満たされる場合には、現在のピクチャ内の現在のブロックに対してDMVRを実行して、現在のブロックの予測されたサンプル値を取得するステップであって、少なくとも2つの条件が、DMVRが複数のピクチャに対して実行されることを有効化されることをDMVRに対する有効化フラグの値が指定すること、およびDMVRが現在のピクチャに対して実行されることを有効化されることをDMVRに対する無効化フラグの値が指定することを備える、ステップとを備える。
DMVRが現在のピクチャに対して実行されることを無効化されることを、DMVRに対する無効化フラグの値が指定する場合には、現在のピクチャに対してDMVR以外の予測動作を実行して、現在のピクチャの予測されたサンプル値を取得することをさらに備える。
ビデオビットストリームのシーケンスパラメータセットから双方向オプティカルフロー(BDOF)に対する有効化フラグを構文解析するステップであって、BDOFが、シーケンスパラメータセットに関連付けられた複数のピクチャに対して実行されることを有効化されるかどうかを、BDOFに対する有効化フラグが指定する、ステップと、
ビデオビットストリームのピクチャパラメータセットからBDOFに対する無効化フラグを構文解析するステップであって、BDOFが、ピクチャパラメータセットに関連付けられた現在のピクチャに対して実行されることを無効化されるかどうかを、BDOFに対する無効化フラグが指定し、現在のピクチャが、複数のピクチャに属する、ステップと、
少なくとも2つの条件が満たされる場合には、現在のピクチャ内の現在のブロックに対してBDOFを実行して、現在のブロックの予測されたサンプル値を取得するステップであって、少なくとも2つの条件が、BDOFが複数のピクチャに対して実行されることを有効化されることをBDOFに対する有効化フラグの値が指定すること、およびBDOFが現在のピクチャに対して実行されることを有効化されることをBDOFに対する無効化フラグの値が指定することを備える、ステップとを備える。
BDOFが現在のピクチャに対して実行されることを無効化されることを、BDOFに対する無効化フラグの値が指定する場合には、現在のピクチャに対してBDOF以外の予測動作を実行して、現在のピクチャの予測されたサンプル値を取得することをさらに備える。
ビデオビットストリームのシーケンスパラメータセットからデコーダ動きベクトル精緻化を基にしたインター双予測(DMVR)に対する有効化フラグを構文解析するステップであって、DMVRが、シーケンスパラメータセットに関連付けられた複数のピクチャに対して実行されることを有効化されるかどうかを、DMVRに対する有効化フラグが指定する、ステップと、
ビデオビットストリームのスライスヘッダからDMVRに対する無効化フラグを構文解析するステップであって、DMVRが、スライスヘッダに関連付けられた現在のスライスに対して実行されることを無効化されるかどうかを、DMVRに対する無効化フラグが指定し、現在のスライスが、複数のピクチャ内の現在のピクチャに属する、ステップと、
少なくとも2つの条件が満たされる場合には、現在のスライス内の現在のブロックに対してDMVRを実行して、現在のブロックの予測されたサンプル値を取得するステップであって、少なくとも2つの条件が、DMVRが複数のピクチャに対して実行されることを有効化されることをDMVRに対する有効化フラグの値が指定すること、およびDMVRが現在のスライスに対して実行されることを有効化されることをDMVRに対する無効化フラグの値が指定することを備える、ステップとを備える。
DMVRが現在のスライスに対して実行されることを無効化されることを、DMVRに対する無効化フラグの値が指定する場合には、現在のピクチャに対してDMVR以外の予測動作を実行して、現在のスライスの予測されたサンプル値を取得することをさらに備える。
ビデオビットストリームのシーケンスパラメータセットから双方向オプティカルフロー(BDOF)に対する有効化フラグを構文解析するステップであって、BDOFが、シーケンスパラメータセットに関連付けられた複数のピクチャに対して実行されることを有効化されるかどうかを、BDOFに対する有効化フラグが指定する、ステップと、
ビデオビットストリームのスライスヘッダからBDOFに対する無効化フラグを構文解析するステップであって、BDOFが、スライスヘッダに関連付けられた現在のスライスに対して実行されることを無効化されるかどうかを、BDOFに対する無効化フラグが指定し、現在のスライスが、複数のピクチャ内の現在のピクチャに属する、ステップと、
少なくとも2つの条件が満たされる場合には、現在のスライス内の現在のブロックに対してBDOFを実行して、現在のブロックの予測されたサンプル値を取得するステップであって、少なくとも2つの条件が、BDOFが複数のピクチャに対して実行されることを有効化されることをBDOFに対する有効化フラグの値が指定すること、およびBDOFが現在のスライスに対して実行されることを有効化されることをBDOFに対する無効化フラグの値が指定することを備える、ステップとを備える。
BDOFが現在のスライスに対して実行されることを無効化されることを、BDOFに対する無効化フラグの値が指定する場合には、現在のピクチャに対してBDOF以外の予測動作を実行して、現在のスライスの予測されたサンプル値を取得することをさらに備える。
DMVRまたはBDOFに対する、提案されるピクチャパラメータセットレベルまたはスライスレベルの無効化フラグは、標準的でないアルゴリズムが、DMVRまたはBDOFの背後の仮定が満たされるかどうかを見るためにコンテンツを分析することを可能にし、従って、DMVRまたはBDOFを無効化するために提案されたフラグを使用する。従って、仮定が満たされないときにDMVRまたはBDOFを有効化することによって招かれるいかなるコーディング損失も回避される。
この出願において使用される数学演算子は、Cプログラミング言語において使用されるものと類似である。しかし、整数除算および算術シフト演算の結果がより精密に定義され、べき乗および実数値除算のような追加の演算が定義される。番号付けおよび計数の規約は、一般に、0から始まり、例えば、「第1」が0番目と等価であり、「第2」が1番目と等価である、などである。
以下の算術演算子は以下のように定義される。
+ 加算。
- 減算(2つの引数の演算子として)または符号反転(単項前置演算子として)。
* 乗算、行列乗算を含む。
xy べき乗。xのy乗を指定する。他の文脈では、そのような表記法は、べき乗としての解釈のために意図されない上付き文字にするために使用される。
/ 結果の0への切り捨てを伴う整数除算。例えば、7/4および-7/-4は1に切り捨てられ、-7/4および7/-4は-1に切り捨てられる。
÷ 切り捨てまたは丸めが意図されない、数式における除算を表記するために使用される。
x % y 法。x>=0かつy>0となる整数xおよびyのみについて定義される、xをyで除算した剰余。
以下の論理演算子は以下のように定義される。
x && y xとyのブール論理の「論理積」。
x || y xとyのブール論理の「論理和」。
! ブール論理の「否定」。
x ? y : z xがTRUE、すなわち0に等しくないならば、yの値に評価し、そうでなければ、zの値に評価する。
以下の関係演算子は以下のように定義される。
> よりも大きい。
>= 以上。
< よりも小さい。
<= 以下。
== 等しい。
!= 等しくない。
以下のビット単位演算子は以下のように定義される。
& ビット単位の「論理積」。整数の引数に対して演算するとき、整数値の2の補数表現に対して演算する。別の引数よりも少ないビットを含む2進数の引数に対して演算するとき、より短い引数は、0に等しいより上位のビットを追加することによって拡張される。
| ビット単位の「論理和」。整数の引数に対して演算するとき、整数値の2の補数表現に対して演算する。別の引数よりも少ないビットを含む2進数の引数に対して演算するとき、より短い引数は、0に等しいより上位のビットを追加することによって拡張される。
^ ビット単位の「排他的論理和」。整数の引数に対して演算するとき、整数値の2の補数表現に対して演算する。別の引数よりも少ないビットを含む2進数の引数に対して演算するとき、より短い引数は、0に等しいより上位のビットを追加することによって拡張される。
x >> y xの2の補数整数表現の、2進数のy桁だけの算術右シフト。この関数は、yの非負の整数値に対してのみ定義される。右シフトの結果として最上位ビット(most significant bit(MSB))にシフトされるビットは、そのシフト演算の前のxのMSBに等しい値を有する。
x << y xの2の補数整数表現の、2進数のy桁だけの算術左シフト。この関数は、yの非負の整数値に対してのみ定義される。左シフトの結果として最下位ビット(least significant bit(LSB))にシフトされるビットは、0に等しい値を有する。
以下の算術演算子は以下のように定義される。
= 割当て演算子。
++ インクリメント、すなわち、x++はx = x + 1と等価であり、アレイインデックスにおいて使用されるとき、インクリメント演算の前の変数の値に評価する。
-- デクリメント、すなわち、x--はx = x - 1と等価であり、アレイインデックスにおいて使用されるとき、デクリメント演算の前の変数の値に評価する。
+= 指定された量だけのインクリメント、すなわち、x += 3はx = x + 3と等価でありx += (-3)はx = x + (-3)と等価である。
-= 指定された量だけのデクリメント、すなわち、x -= 3はx = x - 3と等価であり、x -= (-3)はx = x - (-3)と等価である。
値の範囲を指定するために以下の表記法が使用される。
x=y..z xは、yから始まりzまでの全てを含む整数値をとり、x、y、およびzは整数であり、zはyよりも大きい。
以下の数学関数が定義される。
Atan(x) 引数xに対して演算し、ラジアンの単位での-π÷2からπ÷2の全てを含む範囲内の出力値を有する、三角法の逆正接関数。
Clip1Y( x ) = Clip3( 0, ( 1 << BitDepthY ) - 1, x )
Clip1C( x ) = Clip3( 0, ( 1 << BitDepthC ) - 1, x )
Floor(x) x以下の最大の整数。
Log2(x) 2を底とするxの対数。
Log10(x) 10を底とするxの対数。
Tan(x) ラジアンの単位での引数xに対して演算する、三角法の正接関数。
式における優先順位の順序が括弧の使用によって明示的には示されないとき、以下の規則が適用される。
- より高い優先順位の演算は、より低い優先順位の任意の演算の前に評価される。
- 同じ優先順位の演算は、左から右へ順次に評価される。
本文の中で、以下の形式で数学的に記述されることになるような論理演算のステートメント、すなわち、
if(条件0)
ステートメント0
else if(条件1)
ステートメント1
...
else /* 残りの条件における説明的な注釈 */
ステートメントn
は、以下の形態で説明され得る。
...以下のように/...以下が適用される
- 条件0ならば、ステートメント0
- そうでなく、条件1ならば、ステートメント1
- ...
- そうでなければ(残りの条件における説明的な注釈)、ステートメントn
if(条件0a && 条件0b)
ステートメント0
else if(条件1a || 条件1b)
ステートメント1
...
else
ステートメントn
は、以下の形態で説明され得る。
...以下のように/...以下が適用される
- 以下の条件の全てが真であるならば、ステートメント0:
- 条件0a
- 条件0b
- そうでなく、以下の条件のうちの1つまたは複数が真であるならば、ステートメント1:
- 条件1a
- 条件1b
- ...
- そうでなければ、ステートメントn
if(条件0)
ステートメント0
if(条件1)
ステートメント1
は、以下の形態で説明され得る。
条件0のとき、ステートメント0
条件1のとき、ステートメント1
12 ソースデバイス
13 通信チャネル
14 宛先デバイス
16 ピクチャソース
17 ピクチャ、ピクチャデータ、未加工ピクチャ、未加工ピクチャデータ
18 プリプロセッサ、前処理ユニット
19 前処理されたピクチャ、前処理されたピクチャデータ
20 ビデオエンコーダ
21 エンコードされたピクチャデータ
22 通信インターフェース、通信ユニット
28 通信インターフェース、通信ユニット
30 ビデオデコーダ、ショートデコーダ
31 デコードされたピクチャ、デコードされたピクチャデータ
32 ポストプロセッサ、後処理ユニット
33 後処理されたピクチャ、後処理されたピクチャデータ
34 ディスプレイデバイス
46 処理回路
201 入力、入力インターフェース
203 ピクチャブロック
204 残差計算ユニット
205 残差ブロック、残差
206 変換処理ユニット
207 変換係数
208 量子化ユニット
209 量子化された係数、量子化された変換係数、量子化された残差係数
210 逆量子化ユニット
211 量子化解除された係数、量子化解除された残差係数
212 逆変換処理ユニット
213 再構成された残差ブロック、対応する量子化解除された係数、変換ブロック
214 再構成ユニット
215 再構成されたブロック
220 ループフィルタユニット
221 フィルタ処理されたブロック、フィルタ処理された再構成されたブロック
230 デコードされたピクチャバッファ
231 デコードされたピクチャ
244 インター予測ユニット
254 イントラ予測ユニット
260 モード選択ユニット
262 区分ユニット
265 予測ブロック、予測子
266 シンタックス要素
270 エントロピーエンコードユニット
272 出力、出力インターフェース
304 エントロピーデコードユニット
309 量子化された係数
310 逆量子化ユニット
311 変換係数、量子化解除された係数
312 逆変換処理ユニット
313 再構成された残差ブロック、変換ブロック
314 再構成ユニット、加算器
315 再構成されたブロック
320 ループフィルタユニット
321 フィルタ処理されたブロック、ピクチャのデコードされたビデオブロック
330 デコードされたピクチャバッファ(DPB)
331 デコードされたピクチャ
332 出力
344 インター予測ユニット
354 イントラ予測ユニット
360 モード適用ユニット
365 予測ブロック
400 ビデオコーディングデバイス
410 入口ポート、入力ポート
420 受信機ユニット
430 プロセッサ、論理ユニット、中央処理ユニット
440 送信機ユニット
450 出口ポート、出力ポート
460 メモリ
470 コーディングモジュール
500 装置
502 プロセッサ
504 メモリ
506 コードおよびデータ
508 オペレーティングシステム
510 アプリケーションプログラム
512 バス
514 2次ストレージ
518 ディスプレイ
1400 デバイス
1410 DMVR決定ユニット
1420 DMVRフラグ設定ユニット
1500 デバイス
1510 BDOFインター予測決定ユニット
1520 BDOFフラグ設定ユニット
1600 デバイス
1610 第1の構文解析ユニット
1620 第2の構文解析ユニット
1630 DMVR実行ユニット
1700 デバイス
1710 第1の構文解析ユニット
1720 第2の構文解析ユニット
1730 BDOF実行ユニット
3100 コンテンツ供給システム
3102 キャプチャデバイス
3104 通信リンク
3106 端末デバイス
3108 スマートフォン/パッド
3110 コンピュータ/ラップトップ
3112 ネットワークビデオレコーダ/デジタルビデオレコーダ
3114 TV
3116 セットトップボックス
3118 ビデオ会議システム
3120 ビデオ監視システム
3122 携帯情報端末
3124 車両搭載型デバイス
3126 ディスプレイ
3202 プロトコル進行ユニット
3204 多重化解除ユニット
3206 ビデオデコーダ
3208 オーディオデコーダ
3210 サブタイトルデコーダ
3212 同期ユニット
3214 ビデオ/オーディオディスプレイ
3216 ビデオ/オーディオ/サブタイトルディスプレイ
Claims (19)
- エンコードデバイス内で実現される、複数のピクチャのためのコーディングされたデータを備えるビデオビットストリームをエンコードする方法であって、
前記複数のピクチャのうちの現在のピクチャの少なくとも1つの領域に対してデコーダ動きベクトル精緻化(DMVR)を基にしたインター双予測が有効化されるかどうかを決定するステップと、
DMVRを基にしたインター双予測が有効化されるかどうかを前記決定した結果に基づいて、シーケンスパラメータセット(SPS)レベルより低い階層のシンタックス構造レベルにおいてDMVRに対する無効化フラグの値を設定するステップであって、前記無効化フラグの前記値が、前記現在のピクチャの少なくとも1つの領域に対してDMVRを基にしたインター双予測が有効化されるか否かを指定し、前記領域に対するDMVRは、初期MVペアを使用して取得される2つの予測ブロック間の初期非類似度が予め決定されたサンプルごとのしきい値よりも小さいかどうかに条件付けられる、ステップと
を備える方法。 - 前記現在のピクチャの前記少なくとも1つの領域が、前記現在のピクチャであり、前記無効化フラグが、ピクチャパラメータセット(PPS)レベルにおいて設定される、請求項1に記載の方法。
- 前記現在のピクチャの前記少なくとも1つの領域が、前記現在のピクチャのスライスであり、前記無効化フラグが、スライスヘッダレベルにおいて設定される、請求項1に記載の方法。
- 少なくとも1つの予め定義された条件が充足されるとき、DMVRを基にしたインター双予測が無効化されることが決定される、請求項1から3のいずれか一項に記載の方法。
- 2つの参照ピクチャのそれぞれの少なくとも1つの領域から前記現在のピクチャの少なくとも1つの領域までの動きベクトル差分を決定するステップであって、前記2つの参照ピクチャのうちの一方が表示順序で前記現在のピクチャの前にあり、他方が表示順序で前記現在のピクチャの後にある、ステップをさらに備え、前記少なくとも1つの予め定義された条件が、前記決定された動きベクトル差分が同じ絶対値かつ反対の符号を有しないことを含む、請求項4に記載の方法。
- 前記少なくとも1つの領域に対してDMVRを基にしたインター双予測が有効化されるかどうかを前記決定するステップが、前記現在のピクチャの少なくとも前記1つの領域内にスクリーンコンテンツが存在するかどうかを決定するステップを備え、前記少なくとも1つの予め定義された条件が、前記現在のピクチャの少なくとも1つの領域内にスクリーンコンテンツが存在することが決定されることを備える、請求項4または5に記載の方法。
- 前記現在のピクチャの少なくとも1つの領域内にスクリーンコンテンツが存在するかどうかを決定するステップが、
それぞれ、前記現在のピクチャの少なくとも1つの領域のM個のサンプルの各々から始めて、前記現在のピクチャの少なくとも1つの領域のブロックに対するNビットのハッシュ値を計算するステップであって、N、M、およびKが整数値である、ステップと、
K個のエントリを有するハッシュテーブルを構築するステップであって、前記K個のエントリの各々がブロックのカウント値を含み、前記ブロックのカウント値に対して予め定義された値に等しいNビットのハッシュ値が計算される、ステップと、
1よりも大きいカウント値を備える前記エントリの総和を決定するステップとを備え、
前記エントリの前記決定された総和が予め定義されたしきい値を超えるとき、前記現在のピクチャの少なくとも1つの領域内にスクリーンコンテンツが存在することが決定される、請求項6に記載の方法。 - 前記ブロックが4×4個のサンプルからなる、請求項7に記載の方法。
- 前記予め定義されたしきい値が、前記現在のピクチャの少なくとも1つの領域の前記サンプルの総数の予め定義されたパーセンテージを表現する、請求項7または8に記載の方法。
- 前記少なくとも1つの領域に対してDMVRを基にしたインター双予測が有効化されるかどうかを前記決定するステップが、
デコーダ動きベクトル精緻化を基にしたインター双予測を実行することなく、少なくとも1つの領域のコーディングユニットの予測残差におけるコストの第1の総和を計算するステップと、
動きベクトル精緻化を実行するとともに、少なくとも1つの領域の前記コーディングユニットの前記予測残差におけるコストの第2の総和を計算するステップとを備え、
前記計算された第2の総和が、前記計算された第1の総和よりも大きいとき、DMVRを基にしたインター双予測が無効化されることが決定される、請求項2または3に記載の方法。 - 前記コストが、絶対変換差分(SATD)を基にしたコストである、請求項10に記載の方法。
- 前記現在のピクチャの前記少なくとも1つの領域が、前記現在のピクチャであり、
前記計算された第2の総和が、前記計算された第1の総和よりも大きいとき、前記現在のピクチャの後続のピクチャに対してDMVRインター双予測が有効化されるべきでないことが決定される、請求項10または11に記載の方法。 - 前記SPSレベルにおいてDMVRに対して有効化フラグを設定するステップをさらに備え、前記有効化フラグが、前記複数のピクチャに対してDMVRを基にしたインター双予測が有効化されるか否かを指定する、請求項1から12のいずれか一項に記載の方法。
- デコードデバイスによって実現される、ビデオビットストリームをデコードする方法であって、前記ビデオビットストリームが、複数のピクチャのためのコーディングされたデータを含み、前記デコードする方法が、
前記ビデオビットストリームのシーケンスパラメータセットからデコーダ動きベクトル精緻化(DMVR)に対する有効化フラグを構文解析するステップであって、DMVRに対する前記有効化フラグが、前記シーケンスパラメータセットに関連付けられた前記複数のピクチャに対してDMVRを基にしたインター双予測が有効化されるか否かを指定する、ステップと、
前記ビデオビットストリームのシーケンスパラメータセット(SPS)レベルより低い階層のシンタックス構造レベルのシンタックス構造からDMVRに対する無効化フラグを構文解析するステップであって、DMVRに対する前記無効化フラグが、前記シンタックス構造に関連付けられた現在のピクチャの少なくとも1つの領域に対してDMVRを基にしたインター双予測が無効化されるか否かを指定し、前記現在のピクチャが、前記複数のピクチャに属する、ステップと、
少なくとも1つの予め定義された条件が充足されるとき、前記現在のピクチャの少なくとも1つの領域内の現在のブロックに対してDMVRを基にしたインター双予測を実行して、前記現在のブロックの予測されたサンプル値を取得するステップであって、前記少なくとも1つの予め定義された条件は、DMVRを基にしたインター双予測が有効化されることを前記無効化フラグの前記構文解析された値が指定することを備え、前記領域に対するDMVRは、初期MVペアを使用して取得される2つの予測ブロック間の初期非類似度が予め決定されたサンプルごとのしきい値よりも小さいかどうかに条件付けられる、ステップと
を備える方法。 - 前記現在のピクチャの前記少なくとも1つの領域が、前記現在のピクチャであり、前記シンタックス構造が、ピクチャパラメータセット(PPS)である、請求項14に記載の方法。
- 前記現在のピクチャの前記少なくとも1つの領域が、前記現在のピクチャのスライスであり、前記シンタックス構造が、スライスヘッダである、請求項14に記載の方法。
- DMVRに対する前記有効化フラグの前記構文解析された値が、DMVRが有効化されることを指定するとき、前記現在のブロックに対してDMVRを基にしたインター双予測が実行される、請求項14に記載の方法。
- 複数のピクチャのためのコーディングされたデータを備えるビデオビットストリームをエンコードするように構成されたデバイスであって、
前記複数のピクチャのうちの現在のピクチャの少なくとも1つの領域に対してデコーダ動きベクトル精緻化(DMVR)を基にしたインター双予測が有効化されるかどうかを決定するように構成されたDMVR決定ユニットと、
DMVRを基にしたインター双予測が有効化されるかどうかを前記決定した結果に基づいて、シーケンスパラメータセット(SPS)レベルより低い階層のシンタックス構造レベルにおいてDMVRに対する無効化フラグの値を設定するように構成された第1のDMVRフラグ設定ユニットとを備え、前記無効化フラグの前記値が、前記現在のピクチャの少なくとも1つの領域に対してDMVRを基にしたインター双予測が有効化されるか否かを指定し、前記領域に対するDMVRは、初期MVペアを使用して取得される2つの予測ブロック間の初期非類似度が予め決定されたサンプルごとのしきい値よりも小さいかどうかに条件付けられる、デバイス。 - 複数のピクチャのためのコーディングされたデータを備えるビデオビットストリームをデコードするように構成されたデバイスであって、
前記ビデオビットストリームのシーケンスパラメータセットからデコーダ動きベクトル精緻化(DMVR)に対する有効化フラグを構文解析するように構成された第1の構文解析ユニットであって、DMVRに対する前記有効化フラグが、前記シーケンスパラメータセットに関連付けられた前記複数のピクチャに対してDMVRを基にしたインター双予測が有効化されるか否かを指定する、第1の構文解析ユニットと、
前記ビデオビットストリームのシーケンスパラメータセット(SPS)レベルより低い階層のシンタックス構造レベルのシンタックス構造からDMVRに対する無効化フラグを構文解析するように構成された第2の構文解析ユニットであって、DMVRに対する前記無効化フラグが、前記シンタックス構造に関連付けられた現在のピクチャの少なくとも1つの領域に対してDMVRを基にしたインター双予測が無効化されるか否かを指定し、前記現在のピクチャが、前記複数のピクチャに属する、第2の構文解析ユニットと、
少なくとも1つの予め定義された条件が充足されるとき、前記現在のピクチャの少なくとも1つの領域内の現在のブロックに対してDMVRを基にしたインター双予測を実行して、前記現在のブロックの予測されたサンプル値を取得するように構成されたDMVR実行ユニットであって、前記少なくとも1つの予め定義された条件は、DMVRを基にしたインター双予測が有効化されることを前記無効化フラグの前記構文解析された値が指定することを備え、前記領域に対するDMVRは、初期MVペアを使用して取得される2つの予測ブロック間の初期非類似度が予め決定されたサンプルごとのしきい値よりも小さいかどうかに条件付けられる、DMVR実行ユニットと
を備えるデバイス。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
IN201931024825 | 2019-06-21 | ||
IN201931024825 | 2019-06-21 | ||
PCT/CN2020/097297 WO2020253858A1 (en) | 2019-06-21 | 2020-06-20 | An encoder, a decoder and corresponding methods |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022537064A JP2022537064A (ja) | 2022-08-23 |
JP7471328B2 true JP7471328B2 (ja) | 2024-04-19 |
Family
ID=74040654
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021576391A Active JP7471328B2 (ja) | 2019-06-21 | 2020-06-20 | エンコーダ、デコーダ、および対応する方法 |
Country Status (13)
Country | Link |
---|---|
US (1) | US20220116648A1 (ja) |
EP (1) | EP3987794A4 (ja) |
JP (1) | JP7471328B2 (ja) |
KR (2) | KR20240145090A (ja) |
CN (5) | CN116996693A (ja) |
AU (1) | AU2020294736A1 (ja) |
BR (1) | BR112021025924A2 (ja) |
CA (1) | CA3144099A1 (ja) |
CL (1) | CL2021003427A1 (ja) |
IL (1) | IL289227A (ja) |
MX (1) | MX2021016105A (ja) |
WO (1) | WO2020253858A1 (ja) |
ZA (1) | ZA202110875B (ja) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114513666B (zh) * | 2019-06-17 | 2023-01-17 | 北京达佳互联信息技术有限公司 | 用于视频编解码中的解码器侧运动矢量细化的方法和装置 |
EP3991432A1 (en) * | 2019-07-01 | 2022-05-04 | InterDigital VC Holdings France, SAS | Bi-directional optical flow refinement of affine motion compensation |
WO2021006617A1 (ko) * | 2019-07-08 | 2021-01-14 | 현대자동차주식회사 | 인터 예측을 이용하여 비디오를 부호화 및 복호화하는 방법 및 장치 |
US11641475B2 (en) * | 2019-09-12 | 2023-05-02 | Alibaba Group Holding Limited | Method and apparatus for encoding or decoding video |
JP2022547599A (ja) * | 2019-09-12 | 2022-11-14 | アリババ グループ ホウルディング リミテッド | 映像符号化情報をシグナリングするための方法及び装置 |
MX2022002916A (es) | 2019-09-19 | 2022-04-06 | Beijing Bytedance Network Tech Co Ltd | Derivacion de posiciones de muestra de referencia en codificacion de video. |
KR20220070437A (ko) | 2019-10-05 | 2022-05-31 | 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 | 비디오 코딩 툴의 레벨 기반 시그널링 |
CN114556918A (zh) | 2019-10-12 | 2022-05-27 | 北京字节跳动网络技术有限公司 | 细化视频编解码工具的使用和信令 |
MX2022004200A (es) | 2019-10-13 | 2022-05-02 | Beijing Bytedance Network Tech Co Ltd | Interaccion entre remuestreo de imagen de referencia y herramientas de codificacion de video. |
CN112135126B (zh) * | 2019-11-05 | 2021-09-21 | 杭州海康威视数字技术股份有限公司 | 一种编解码方法、装置、设备及机器可读存储介质 |
WO2021129866A1 (en) | 2019-12-27 | 2021-07-01 | Beijing Bytedance Network Technology Co., Ltd. | Signaling of slice types in video pictures headers |
CN117546469A (zh) * | 2021-06-28 | 2024-02-09 | 北京达佳互联信息技术有限公司 | 用于视频编解码的残差和系数编解码 |
US11968356B2 (en) * | 2022-03-16 | 2024-04-23 | Qualcomm Incorporated | Decoder-side motion vector refinement (DMVR) inter prediction using shared interpolation filters and reference pixels |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016519499A (ja) | 2013-04-05 | 2016-06-30 | キヤノン株式会社 | 動き情報圧縮スキームに従ってインタレイヤ動き情報予測により画像をエンコーディングまたはデコーディングするための方法および装置 |
WO2019085892A1 (en) | 2017-11-02 | 2019-05-09 | Mediatek Inc. | Method and apparatus for video coding |
WO2020197083A1 (ko) | 2019-03-22 | 2020-10-01 | 엘지전자 주식회사 | Dmvr 및 bdof 기반의 인터 예측 방법 및 장치 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4877449B2 (ja) * | 2004-11-04 | 2012-02-15 | カシオ計算機株式会社 | 動画像符号化装置および動画像符号化処理プログラム |
US20150103925A1 (en) * | 2013-10-15 | 2015-04-16 | Qualcomm Incorporated | Parallel extensions of parameter sets |
US10547847B2 (en) * | 2015-09-24 | 2020-01-28 | Lg Electronics Inc. | AMVR-based image coding method and apparatus in image coding system |
US10750203B2 (en) * | 2016-12-22 | 2020-08-18 | Mediatek Inc. | Method and apparatus of adaptive bi-prediction for video coding |
US10630978B2 (en) * | 2017-05-12 | 2020-04-21 | Blackberry Limited | Methods and devices for intra-coding in video compression |
BR112020000032A2 (pt) * | 2017-07-03 | 2020-07-14 | Vid Scale, Inc. | dispositivo e método de codificação de dados de vídeo. |
JP7382332B2 (ja) * | 2017-11-01 | 2023-11-16 | ヴィド スケール インコーポレイテッド | マージモード用のサブブロック動き導出およびデコーダサイド動きベクトル精緻化 |
US11184630B2 (en) * | 2018-09-28 | 2021-11-23 | Tencent America LLC | Method and apparatus for video coding |
CN112868238B (zh) * | 2018-10-23 | 2023-04-21 | 北京字节跳动网络技术有限公司 | 局部照明补偿和帧间预测编解码之间的并置 |
CN113170093B (zh) * | 2018-11-20 | 2023-05-02 | 北京字节跳动网络技术有限公司 | 视频处理中的细化帧间预测 |
US10491240B1 (en) * | 2019-01-17 | 2019-11-26 | Cyborg Inc. | Systems and methods for variable length codeword based, hybrid data encoding and decoding using dynamic memory allocation |
KR102612802B1 (ko) * | 2019-03-05 | 2023-12-13 | 엘지전자 주식회사 | 인터 예측을 위한 비디오 신호의 처리 방법 및 장치 |
CN115190317A (zh) * | 2019-04-02 | 2022-10-14 | 抖音视界有限公司 | 解码器侧运动矢量推导 |
CN113711609B (zh) * | 2019-04-19 | 2023-12-01 | 北京字节跳动网络技术有限公司 | 利用光流的预测细化过程中的增量运动矢量 |
-
2020
- 2020-06-20 BR BR112021025924A patent/BR112021025924A2/pt unknown
- 2020-06-20 WO PCT/CN2020/097297 patent/WO2020253858A1/en unknown
- 2020-06-20 JP JP2021576391A patent/JP7471328B2/ja active Active
- 2020-06-20 EP EP20826192.5A patent/EP3987794A4/en active Pending
- 2020-06-20 CA CA3144099A patent/CA3144099A1/en active Pending
- 2020-06-20 KR KR1020247032363A patent/KR20240145090A/ko unknown
- 2020-06-20 CN CN202310984397.1A patent/CN116996693A/zh active Pending
- 2020-06-20 CN CN202310991017.7A patent/CN117440170A/zh active Pending
- 2020-06-20 CN CN202310986592.8A patent/CN117440169A/zh active Pending
- 2020-06-20 KR KR1020227002114A patent/KR102712842B1/ko active IP Right Grant
- 2020-06-20 AU AU2020294736A patent/AU2020294736A1/en active Pending
- 2020-06-20 CN CN202080043894.6A patent/CN114009040B/zh active Active
- 2020-06-20 CN CN202310987656.6A patent/CN117812270A/zh active Pending
- 2020-06-20 MX MX2021016105A patent/MX2021016105A/es unknown
-
2021
- 2021-12-20 US US17/556,594 patent/US20220116648A1/en active Pending
- 2021-12-20 CL CL2021003427A patent/CL2021003427A1/es unknown
- 2021-12-21 IL IL289227A patent/IL289227A/en unknown
- 2021-12-23 ZA ZA2021/10875A patent/ZA202110875B/en unknown
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016519499A (ja) | 2013-04-05 | 2016-06-30 | キヤノン株式会社 | 動き情報圧縮スキームに従ってインタレイヤ動き情報予測により画像をエンコーディングまたはデコーディングするための方法および装置 |
WO2019085892A1 (en) | 2017-11-02 | 2019-05-09 | Mediatek Inc. | Method and apparatus for video coding |
WO2020197083A1 (ko) | 2019-03-22 | 2020-10-01 | 엘지전자 주식회사 | Dmvr 및 bdof 기반의 인터 예측 방법 및 장치 |
Also Published As
Publication number | Publication date |
---|---|
CN117440170A (zh) | 2024-01-23 |
NZ783895A (en) | 2024-02-23 |
JP2022537064A (ja) | 2022-08-23 |
WO2020253858A8 (en) | 2021-02-25 |
CL2021003427A1 (es) | 2022-08-05 |
KR20220024817A (ko) | 2022-03-03 |
IL289227A (en) | 2022-02-01 |
CN117812270A (zh) | 2024-04-02 |
MX2021016105A (es) | 2022-04-06 |
US20220116648A1 (en) | 2022-04-14 |
KR102712842B1 (ko) | 2024-09-30 |
CN114009040A (zh) | 2022-02-01 |
KR20240145090A (ko) | 2024-10-04 |
CA3144099A1 (en) | 2020-12-24 |
CN117440169A (zh) | 2024-01-23 |
EP3987794A4 (en) | 2022-09-07 |
WO2020253858A1 (en) | 2020-12-24 |
CN116996693A (zh) | 2023-11-03 |
BR112021025924A2 (pt) | 2022-02-22 |
CN114009040B (zh) | 2023-08-04 |
AU2020294736A1 (en) | 2022-01-27 |
ZA202110875B (en) | 2022-09-28 |
EP3987794A1 (en) | 2022-04-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7471328B2 (ja) | エンコーダ、デコーダ、および対応する方法 | |
US11895292B2 (en) | Encoder, decoder and corresponding methods of boundary strength derivation of deblocking filter | |
US11909959B2 (en) | Encoder, a decoder and corresponding methods for merge mode | |
WO2020181997A1 (en) | An encoder, a decoder and corresponding methods for inter prediction | |
KR102616714B1 (ko) | 광학 흐름 정제를 위한 조기 종료 | |
JP7564132B2 (ja) | 幾何学的分割モードのためのクロマサンプル重みの導出 | |
CN114125468A (zh) | 帧内预测方法和装置 | |
KR102611845B1 (ko) | 옵티컬 플로 기반 비디오 인터 예측 | |
CN113615173A (zh) | 对仿射译码块进行光流预测修正的方法及装置 | |
KR20210088688A (ko) | Ibc 병합 리스트를 사용하는 인코더, 디코더 및 대응하는 방법들 | |
CN113228632B (zh) | 用于局部亮度补偿的编码器、解码器、以及对应方法 | |
RU2824186C2 (ru) | Кодер, декодер и соответствующие способы | |
US11997296B2 (en) | Motion field storage optimization for a line buffer | |
JP2024109748A (ja) | 平面モードのためのイントラ予測における複雑さ減少のエンコーダ、デコーダ、および対応する方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220218 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220218 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230320 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230327 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230627 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231010 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20240110 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240115 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240325 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240409 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7471328 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |