JP7488256B2 - 隣接サンプル依存パラメトリックモデルに基づいたコーディングモードの簡易化 - Google Patents
隣接サンプル依存パラメトリックモデルに基づいたコーディングモードの簡易化 Download PDFInfo
- Publication number
- JP7488256B2 JP7488256B2 JP2021524143A JP2021524143A JP7488256B2 JP 7488256 B2 JP7488256 B2 JP 7488256B2 JP 2021524143 A JP2021524143 A JP 2021524143A JP 2021524143 A JP2021524143 A JP 2021524143A JP 7488256 B2 JP7488256 B2 JP 7488256B2
- Authority
- JP
- Japan
- Prior art keywords
- samples
- current block
- prediction
- parameters
- adjacent samples
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000001419 dependent effect Effects 0.000 title description 5
- 238000000034 method Methods 0.000 claims description 87
- 239000000523 sample Substances 0.000 claims description 46
- 238000009795 derivation Methods 0.000 claims description 26
- 239000013074 reference sample Substances 0.000 claims description 18
- 238000012937 correction Methods 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 2
- 230000008569 process Effects 0.000 description 43
- 241000023320 Luma <angiosperm> Species 0.000 description 34
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 34
- 238000012545 processing Methods 0.000 description 31
- 239000013256 coordination polymer Substances 0.000 description 29
- 230000015654 memory Effects 0.000 description 29
- 238000004891 communication Methods 0.000 description 18
- 238000013459 approach Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 14
- 230000006835 compression Effects 0.000 description 11
- 238000007906 compression Methods 0.000 description 11
- 230000011664 signaling Effects 0.000 description 11
- 230000006870 function Effects 0.000 description 9
- 238000013139 quantization Methods 0.000 description 7
- 238000012360 testing method Methods 0.000 description 7
- 239000000872 buffer Substances 0.000 description 6
- 238000013461 design Methods 0.000 description 6
- 230000002123 temporal effect Effects 0.000 description 6
- 230000009466 transformation Effects 0.000 description 6
- 238000005457 optimization Methods 0.000 description 5
- 239000013598 vector Substances 0.000 description 5
- 239000000654 additive Substances 0.000 description 4
- 230000000996 additive effect Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 230000002093 peripheral effect Effects 0.000 description 4
- 238000000638 solvent extraction Methods 0.000 description 4
- 238000001914 filtration Methods 0.000 description 3
- 238000002156 mixing Methods 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 238000005192 partition Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000005286 illumination Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000003936 working memory Effects 0.000 description 2
- 101100149023 Bacillus subtilis (strain 168) secA gene Proteins 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000003466 anti-cipated effect Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 229920001690 polydopamine Polymers 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/593—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/109—Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/11—Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/132—Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
- H04N19/159—Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/186—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
以下のセクションは、異なる変形例のCCLMを説明する。
その初期のバージョンの(JVET_K1002を参照)では、CCLMモードは、式(1)のように、線形モデルを使用して同一のブロックまたはCUの再構築されたルマサンプルに基づいて、クロマサンプルを予測することから構成される。
predC(i,j)=a.recL’(i,j)+b 式(1)
predC(i,j)は、CU内の予測されたクロマサンプルを表し、recL’(i,j)は、同一のCUのダウンサンプルされた、再構築されたルマサンプルを表す。パラメータaおよびbは、式(2)および式(3)のように、カレントブロックの周りの隣接した再構築されたルマサンプルおよびクロマサンプルの間の回帰誤差を最小化することによって導出される。
a=(SLC-SL.SC)/(SLL-SL.SL) 式(2)
b=SC-a.SL 式(3)
L(i,j)は、ダウンサンプルされた最上の隣接した再構築されたルマサンプルおよびダウンサンプルされた左の隣接した再構築されたルマサンプルを表し、C(i,j)は、最上の隣接した再構築されたクロマサンプルおよび左の隣接した再構築されたクロマサンプルを表し、Nは、カレントクロマコーディングブロックの幅および高さの最小値の2倍に等しく、SL、SC、SLL、SLCは、以下のように定義される(記号Σは、最上の隣接したサンプルおよび左の隣接したサンプルにわたった合計を表す)。
-SL=ΣL(n)
-SC=ΣC(n)
-SLC=N・Σ(L(n)・C(n))
-SLL=N・Σ(L(n)・L(n))
MDLMモードは、JVET-L0338において提案された基本的なCCLM設計の改良であり、(top+left)参照サンプルテンプレートに加えて、線形モデル係数αおよびβを導出するよう、左専用テンプレート(left-only template)または最上専用テンプレート(top-only template)を選択することが可能である。これは、LM_AおよびLM_L値と称される2つの新たなCCLMモードが追加されることを意味する。
現在のCCLM係数導出処理では、CCLMモード(CCLMまたはMDLM)の最上テンプレートを取得するようダウンサンプリングするために、2つのルマラインバッファが原則として使用されるが、従来のルマ成分イントラ予測においては1つのルマラインバッファのみが使用される。ラインバッファを減少させるために、CTUの最上境界に沿ったCUに対し、LM_Lモードのみが使用される。このケースでは、追加のラインバッファが必要とされない。
このツールでは、デコーダは、予測されることになるカレントブロックの左および/または最上部において局所化されたいくつかの再構築されたピクチャサンプル、ならびに動き補償されたブロックの左および/または最上部において局所化された参照ピクチャサンプルに基づいて、いくつかの予測パラメータを計算する(図4)。考慮される従来技術のコーデック(JEM)では、所与のブロックに対するLCIの使用は、LICフラグと称される、このブロックに関連付けられたフラグに依存する。
dist=Σ(r∈Vcur,s∈Vref)(Rcur(r)-a.Rref(s)-b)2
式(4)
Rcur(r)は、隣接した再構築されたサンプルであり、Rref(s)は、参照サンプルである。aおよびbの導出は、aおよびbが前のセクション(式(2)および式(3))において導出された方式と同様である。
pred(i,j)=a.ref(i,j)+b 式(5)
ref(i,j)は、カレントブロックの時間予測に対して使用される参照ブロックである。
a=(CB-CA)/(LB-LA) 式(6)
b=CA-a.LA 式(7)
(LA,CA)は、それに対してLAが全てのルマ値の間で最小値を有する、隣接した再構築されたサンプルにおけるルマ値およびクロマ値のカップルであり、(LB,CB)は、それに対してLBが全てのルマ値の間で最大値を有する、隣接した再構築されたサンプルにおけるルマ値およびクロマ値のカップルである。
-パラメトリックモデルのパラメータを導出するために使用されるサンプルの選択の簡易化:サンプルは、予め定義された位置からフェッチされる
-パラメトリックモデルのパラメータの導出のときに代替的なコーディングモードを使用することは信頼性を有しない
-場合によってはビットストリームにおいてシグナリングされる、パラメトリックモデルのパラメータの導出に補正項(corrective term)を挿入すること
-LICとCCLMとの間でのパラメトリックモデルのパラメータの導出処理を統一すること
-インターブロックおよび混合イントラ-インターブロックに対してCCLMを拡張すること。
1つの実施形態では、パラメトリックモデルのパラメータの導出を簡易化するために、パラメータは、サンプルが空間的に離れるように選択された、隣接サンプルの少なくとも2つのサンプルから導出される。
-最上サンプルおよび左サンプルの両方が利用可能である場合(ステップ401)、最も右の位置にある外側の最上ラインの利用可能なサンプルが選択され(RrefA,RcurA)、最も下の位置にある外側の左カラムの利用可能なサンプルが選択される(RrefB,RcurB)(ステップ403)(図9における例示を参照)
-他に、最上サンプルが利用可能である場合(ステップ402)、最も右の位置にある外側の最上ラインの利用可能なサンプルが選択され(RrefA,RcurA)、最も左の位置にある外側の最上ラインの利用可能なサンプルが選択される(RrefB,RcurB)(ステップ405)(図10における例示を参照)
-他に、左サンプルが利用可能である場合(ステップ404)、最も下の位置にある外側の左カラムの利用可能なサンプルが選択され(RrefA,RcurA)、最も上の位置にある外側の左カラムの利用可能なサンプルが選択される(RrefB,RcurB)(ステップ407)(図11における例示を参照)
-そうでなければ、CCLMモードが適用されない(ステップ406)。
a=(RcurB-RcurA)/(RrefB-RrefA) 式(8)
b=RcurA-a.RrefA 式(9)
また、いずれかの位置pについてのブロック内の予測は、式(10)のように計算される。
Pcur(p)=a.Rref(p)+b 式(10)
この実施形態では、パラメトリックモデルのパラメータの導出を簡易化するために、パラメータは、図12に示されるように、サンプルが空間的に離れるように選択された、隣接サンプルの少なくとも3つのサンプルから導出される。概念は、図13および図14に示されるMDLMのケースにも適用される。
線形パラメータの計算は、除算を伴う。LMSのケースでは、それは、式(11)から構成される。
a=(SLC-SL.SC)/(SLL-SL.SL) 式(11)
a=(RcurB-RcurA)/(RrefB-RrefA) 式(12)
-Den>T1である場合、
-T1はブロックサイズに依存することがある予め定義された閾値であり、Bはサンプルビット深度である。例えば、
-T1=T2×W×H×2B
-T2は予め定義された閾値である
-(WxH>Nmin)である場合、線形パラメータ導出が適用される
-WおよびHは、ブロックの幅および高さである
そうでなければ、簡易化されたモデルが使用される。
-加算的モデル:aが1に強制され(forced to)、bのみが導出される。
Pcur(p)=Rref(p)+b
-スケーリングモデル:bが0に強制され、aのみが導出される。
Pcur(p)=a.Rref(p)
実施形態では、線形パラメータを導出するために使用される式に補正パラメータCPが導入される。
-Num’=CP×Num、およびa=Num’/Den
-Num’=(Num+CP×sign(Num))、およびa=Num’/Den
-Den’=CP×Den、およびa=Num/Den’
-Den’=(Den+CP×sign(Den))、およびa=Num/Den’
-Num’=(Num+(abs(Num)>>K2)×sign(Num))、およびa=Num’/Den
-Den’=(Den+(abs(Den)>>K2)×sign(Den))、およびa=Num/Den’
または代わりに、CPは、以下のように、負の補正を使用して増加することができ、
-Num’=(Num-(abs(Num)>>K2)×sign(Num))、およびa=Num’/Den
-Den’=(Den-(abs(Den)>>K2)×sign(Den))、およびa=Num/Den’
または代わりに、CPは、以下のように、負の補正を使用して増加することができ、
-Num’=(Num-(abs(Num)>>K2)×sign(Num))、およびa=Num’/Den
-Den’=(Den-(abs(Den)>>K2)×sign(Den))、およびa=Num/Den’
K2は、所与の予め定義された値、例えば、CP=k/64と同等のK2=6である。abs(x)は、xの加群(module)を返す関数である。
実装態様を容易にするために、実装態様を複雑にすることがある、線形パラメータの導出に伴う除算をルックアップテーブルによって達成することができる。
a=(Num×Int((1<<K0)/Den)+offset0)>>K0としての除算なしに達成することができ、K0は、除算の精度に対応する所与の値であり、offset0は、典型的には(1<<(K0-1))に等しい所与のオフセット値であり、Int()は、整数演算子または床演算子(最も近い下限整数値に丸める)。
a=(Num×(1<<Int(Den/(1<<K1)))×Int((1<<K0)/(Den%K1))+offset0)>>K0
K1は、LUTの最大サイズ((1<<K1)に等しい)を固定する所与のパラメータであり、「%」は、モジュロ演算子である。
divLUT[k]=Int(2K0/(k+CP)) 式(13)
divLUT[k]=Int(2K0/(k×CP)) 式(14)
divLUT[k]=Int((2K0+CP)/k) 式(15)
divLUT[k]=Int((2K0×CP)/k) 式(16)
LICの現在の設計では、線形パラメータを導出するためにLMS処理が適用される。現在のCCLMでは、線形パラメータは、参照ルマサンプルの最小値および最大値に対応するサンプルの2つの集合から導出される。
a=(RcurB-RcurA)/(RrefB-RrefA) 式(17)
b=RcurA-a.RrefA 式(18)
いずれかの位置pについてのブロックにおける予測は、式(19)のように計算される。
Pcur(p)=a.Rref(p)+b 式(19)
現在の設計では、CCLMのみがイントラCUまたはイントラブロックに適用される。
-ルマ成分がインターモードを使用してコーディングされる。
-ルマ成分サンプルの予測および再構築の全処理が実行される。
-ルマブロックサンプルの全再構築まで、完全再構築処理が実行される。
-ブロックのクロマ成分サンプルが、ブロックの再構築されたルマサンプルを使用して、CCLMモードを使用して、すなわち、ブロックの隣接した再構築されたルマサンプルおよびクロマサンプルからの計算された線形パラメータを使用して予測される。
-これは、ブロックのクロマ成分サンプルが時間予測を使用して構築されないことを意味する。
VTM(Versatilie Video Coding Test Model)では、新たなモード、混合イントラ-インターが導入されている。モードは、1つのイントラ予測および1つのマージインデックス付けされた時間予測を組み合わせる。マージCUでは、フラグが真であるとき、イントラ候補リストからイントラモードを選択するよう、1つのフラグがマージモードに対してシグナリングされる。ルマ成分に対し、DCモード、平面モード、水平モード、および垂直モードを含む4つのイントラ予測モードからイントラ候補リストが導出され、イントラ候補リストのサイズは、ブロック形状に応じて3または4であってもよい。CU幅がCU高さの2倍よりも大きいとき、水平モードは、イントラモードリストから除外され、CU高さがCU幅の2倍よりも大きいとき、垂直モードは、イントラモードリストから除去される。イントラモードインデックスによって選択された1つのイントラ予測モードおよびマージインデックスによって選択された1つのマージインデックス付けされた予測は、重み付け平均を使用して組み合わされる。クロマ成分に対し、DMは、余分なシグナリングなしに常に適用される。
-ルマ成分が混合イントラ-インターモードを使用してコーディングされる。
-ルマ成分サンプルの予測および再構築の全処理が実行される。
-ブロックのクロマ成分サンプルが、ブロックの再構築されたルマサンプルを使用して、CCLMモードを使用して、すなわち、ブロックの隣接した再構築されたルマサンプルおよびクロマサンプルから計算された線形パラメータを使用して予測される。
その実際の実装態様では、コントリビューションJVET-L0191におけるCCLM処理は、以下のように達成される(Bはルマ信号およびクロマ信号のビット深度を表す)。
-パラメータshift、add、diff、およびkが以下のように導出される。
-(B>8)である場合、shiftが(B-9)に等しく設定され、そうでなければ、shiftが0に等しく設定される(ステップ501)
-(shift>0)である場合、addが(1<<(shift-1))に等しく設定され、そうでなければ、addが0に等しく設定される(ステップ502)
-diff=(LB-LA+add)>>shift (ステップ503)
-shift_pred=16
-diffが0よりも大きい場合(ステップ504)、以下が適用される、
-div=((CB-CA)×LUT_low[diff-1]+215)>>16(ステップ505)
-a=((CB-CA)×LUT_high[diff-1]+div+add)>>shift(ステップ506)
-そうでなければ(ステップ504)、以下が適用される、
-a=0(ステップ507)
-bが以下のように導出される(ステップ508)
-b=CA-((a×LA)>>shift_pred)
LUT_highおよびLUT_lowは、512個の要素の2つのルックアップテーブルであり、その各々は、以下のように導出される。
LUT_high[x]=Floor(216/diff)
LUT_low[x]=Floor(232/diff)-Floor(216/diff)x216
Floor(x)は、x以下の最大整数である。
-Pcur(p)=((pRef(p)×a)>>shift_pred)+b
-512の整数の2つのルックアップテーブル、LUT_highおよびLUT_lowが必要とされる。
-8ビットよりも多い信号に対し、パラメータaを導出するために(B-9)の右シフトが適用され、それは、精度の損失につながることがある。
-予測サンプルPcur(p)を生成するとき、パラメータkによる右シフトが式の第1の項に適用され、それは、精度の損失につながることがある。
1つの実施形態では、ルックアップテーブルLUT_lowを除去することによって処理が簡易化される。パラメータaが以下のように導出される。
a=((CB-CA)×LUT_high[diff-1]+add)>>shift
LUT_high[x]=Floor((216+(diff/2))/diff)
これは、2の係数だけメモリの必要性を低減させることを可能にする。
1つの実施形態では、ルックアップテーブルへのアクセスが以下のように修正される。
shift=(LB-LA)/2K、または同様に、
shift=(LB-LA)>>K
KはBよりも少ない整数値である。
-ルックアップテーブルのサイズを2K個の要素に減少させる。K=8であるとき、これは、JVET-L0191の参照の実装態様における512個の代わりに、256個の要素にテーブルを制限する。
-2Bがルックアップテーブルのサイズよりも大きい場合でさえ、(LB-LA)が2Kより小さいときのaの計算において精度を高める。これは、2Bが実際のルックアップテーブルのサイズ(512個)よりも大きいとすぐに、(LB-LA)が(B-9)によって分割される、JVET-L0191の参照の実装態様におけるケースではない。
-shift>0である場合、shift=1+Floor(Log2(shift))
Log2(x)は、xの二進対数である。
-(LB-LA)が0~255である場合、shiftが0に等しく設定される
-そうでなく、(LB-LA)が256~511である場合、shiftが1に等しく設定される
-そうでなく、(LB-LA)が512~1023である場合、shiftが2に等しく設定される
この処理は、(diff-1)の値が最大テーブルインデックス値内に残ることを保証する。
1つの実施形態では、予測信号の計算における精度を高めるために、パラメータbが以下のように計算される、
b=(CA<<shift_pred)-(a×LA)+(1<<(shift_pred-1))
また、線形予測が以下のように実行される。
Pcur(p)=(pRef(p)×a+b)>>shift_pred
-デコーダおよび/またはエンコーダにおいて適用されるコーディングモード処理を修正すること。
-デコーダおよび/またはエンコーダにおいていくつかの拡張されたコーディングモード予測方法を有効にすること。
-デコーダが使用するコーディングモード予測方法を識別することを可能にするシンタックス要素をシグナリングに挿入すること。
-それらのシンタックス要素に基づいて、デコーダにおいて適用するコーディングモード予測方法を選択すること。
-デコーダにおいて導出するためのコーディングモード予測方法を適用すること。
-上記予測処理により、およびルックアップテーブルの除去によりパラメータを導出すること。
-上記予測処理により、およびルックアップテーブルの修正によりパラメータを導出すること。
-線形予測を使用して予測パラメータを導出すること。
-議論された実施形態のいずれかに従ってエンコーダにおいて残差を適応させること。
-説明されたシンタックス要素またはその変形例のうちの1つまたは複数を含むビットストリームまたは信号。
-説明された実施形態のいずれかに従って生成された情報を搬送するシンタックスを含むビットストリームまたは信号。
-説明された実施形態のいずれかに従って生成すること、送信すること、受信すること、および/または復号すること。
-説明された実施形態のいずれかに従った方法、処理、装置、命令を記憶した媒体、データを記憶した媒体、または信号。
-エンコーダによって使用されるものに対応する方式においてデコーダがコーディングモードを判定することを可能にするシンタックス要素をシグナリングに挿入すること。
-説明されたシンタックス要素またはその変形例のうちの1つまたは複数を含むビットストリームまたは信号を生成すること、送信すること、受信すること、および/または復号すること。
-説明された実施形態のいずれかに従ってコーディングモード判定を実行するTV、セットトップボックス、携帯電話、タブレット、または他の電子デバイス。
-説明された実施形態のいずれかに従ってコーディングモード判定を実行し、結果として生じた画像を表示する(例えば、モニタ、スクリーン、または他のタイプのディスプレイを使用して)TV、セットトップボックス、携帯電話、タブレット、または他の電子デバイス。
-符号化された画像を含む信号を受信するようチャネルを選択し、帯域制限し、または同調し(例えば、チューナを使用して)、説明された実施形態のいずれかに従ってコーディングモード判定を実行するTV、セットトップボックス、携帯電話、タブレット、または他の電子デバイス。
-符号化された画像を含む信号を無線で受信し(例えば、アンテナを使用して)、コーディングモード判定を実行するTV、セットトップボックス、携帯電話、タブレット、または他の電子デバイス。
Claims (21)
- カレントブロック内の少なくとも1つの隣接サンプルから、ならびに前記カレントブロック内の隣接サンプルおよび参照フレーム内の参照サンプルから計算されたパラメトリックモデルから、前記カレントブロック内のサンプルの予測を判定するステップであって、前記隣接サンプルが相互に最大の距離に位置し、前記カレントブロックの上の隣接サンプルの最上行に、隣接サンプルの左カラムに、ならびに最上参照行および左参照カラムの交差にそれぞれ位置するように、前記パラメトリックモデルのパラメータが空間的制約を有する隣接サンプルから導出される、ステップと、
前記予測に基づいて、前記カレントブロック内の前記サンプルを符号化するステップと
を備えたことを特徴とする方法。 - カレントブロック内の少なくとも1つ隣接サンプルから、ならびに前記カレントブロック内の隣接サンプルおよび参照フレーム内の参照サンプルから計算されたパラメトリックモデルから、前記カレントブロック内のサンプルの予測を判定し、前記隣接サンプルが相互に最大の距離に位置し、前記カレントブロックの上の隣接サンプルの最上行に、隣接サンプルの左カラムに、ならびに最上参照行および左参照カラムの交差にそれぞれ位置するように、前記パラメトリックモデルのパラメータが空間的制約を有する隣接サンプルから導出され、
前記予測に基づいて、前記カレントブロック内の前記サンプルを符号化する、
ように構成されたプロセッサを備えたことを特徴とする装置。 - カレントブロック内の少なくとも1つ隣接サンプルから、ならびに前記カレントブロック内の隣接サンプルおよび参照フレーム内の参照サンプルから計算されたパラメトリックモデルから、前記カレントブロック内のサンプルの予測を判定するステップであって、前記隣接サンプルが相互に最大の距離に位置し、前記カレントブロックの上の隣接サンプルの最上行に、隣接サンプルの左カラムに、ならびに最上参照行および左参照カラムの交差にそれぞれ位置するように、前記パラメトリックモデルのパラメータが空間的制約を有する隣接サンプルから導出される、ステップと、
前記予測に基づいて、前記カレントブロック内の前記サンプルを復号するステップと、
を備えたことを特徴とする方法。 - カレントブロック内の少なくとも1つ隣接サンプルから、ならびに前記カレントブロック内の隣接サンプルおよび参照フレーム内の参照サンプルから計算されたパラメトリックモデルから、前記カレントブロック内のサンプルの予測を判定し、前記隣接サンプルが相互に最大の距離に位置し、前記カレントブロックの上の隣接サンプルの最上行に、隣接サンプルの左カラムに、ならびに最上参照行および左参照カラムの交差にそれぞれ位置するように、前記パラメトリックモデルのパラメータが空間的制約を有する隣接サンプルから導出され、
前記予測に基づいて、前記カレントブロック内の前記サンプルを復号する、
ように構成されたプロセッサを備えたことを特徴とする装置。 - 前記パラメトリックモデルは、線形モデルから導出される、ことを特徴とする請求項1または3に記載の方法。
- 前記パラメトリックモデルの前記パラメータは、ルックアップテーブルにより導出される、ことを特徴とする請求項1または3に記載の方法。
- 前記パラメトリックモデルの前記パラメータは、空間的距離制約を有する隣接サンプルのうちの少なくとも2つのサンプルから導出される、ことを特徴とする請求項1または3に記載の方法。
- 前記パラメトリックモデルの前記パラメータは、少なくとも3つの隣接サンプルから導出され、前記3つの隣接サンプルは、前記カレントブロックの上の隣接サンプルの最も右の最上行に、隣接サンプルの左カラムの下に、ならびに最上参照行および左参照カラムの交差にそれぞれ位置する、ことを特徴とする請求項1または3に記載の方法。
- 線形パラメータ導出が良好に定義される場合、線形モデルに基づく予測が使用され、そうでなければ、代替的なモードが使用される、ことを特徴とする請求項1または3に記載の方法。
- 前記パラメトリックモデルのパラメータの導出は、補正パラメータを含む、ことを特徴とする請求項1または請求項3に記載の方法。
- インターコーディングされたブロックのクロマ成分を予測するためのクロスコンポーネント線形モデルが有効にされる、ことを特徴とする請求項1または請求項3に記載の方法。
- 前記パラメトリックモデルは、線形モデルから導出される、ことを特徴とする請求項2または4に記載の装置。
- 前記パラメトリックモデルの前記パラメータは、ルックアップテーブルにより導出される、ことを特徴とする請求項2または4に記載の装置。
- 前記パラメトリックモデルの前記パラメータは、空間的距離制約を有する隣接サンプルのうちの少なくとも2つのサンプルから導出される、ことを特徴とする請求項2または4に記載の装置。
- 前記パラメトリックモデルの前記パラメータは、少なくとも3つの隣接サンプルから導出され、前記3つの隣接サンプルは、前記カレントブロックの上の隣接サンプルの最も右の最上行に、隣接サンプルの左カラムの下に、ならびに最上参照行および左参照カラムの交差にそれぞれ位置する、ことを特徴とする請求項2または4に記載の装置。
- 線形パラメータ導出が良好に定義される場合、線形モデルに基づく予測が使用され、そうでなければ、代替的なモードが使用される、ことを特徴とする請求項2または4に記載の装置。
- 前記パラメトリックモデルのパラメータの導出は、補正パラメータを含む、ことを特徴とする請求項2または4に記載の装置。
- インターコーディングされたブロックのクロマ成分を予測するためのクロスコンポーネント線形モデルが有効にされる、ことを特徴とする請求項2または4に記載の装置。
- 請求項4および12乃至18のいずれか一項に従った装置と、
(i)ビデオブロックを含む信号を受信するように構成されたアンテナ、(ii)前記受信された信号を、前記ビデオブロックを含む周波数の帯域に制限するように構成された帯域リミッタ、および(iii)前記ビデオブロックを表す出力を表示するように構成されたディスプレイと、のうちに少なくとも1つと、
を備えたことを特徴とするデバイス。 - コンピュータによって実行されると、前記コンピュータに、請求項1、3、および5乃至11のいずれか一項に記載の方法を実行させる命令を含む、ことを特徴とする非一時的コンピュータ可読媒体。
- コンピュータによって実行されると、前記コンピュータに、請求項1、3、および5乃至11のいずれか一項に記載の方法を実行させる命令を含む、ことを特徴とするコンピュータプログラム。
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP18306448 | 2018-11-05 | ||
EP18306448.4 | 2018-11-05 | ||
EP18306676.0 | 2018-12-12 | ||
EP18306676 | 2018-12-12 | ||
EP18306690 | 2018-12-13 | ||
EP18306690.1 | 2018-12-13 | ||
PCT/US2019/059310 WO2020096877A1 (en) | 2018-11-05 | 2019-11-01 | Simplifications of coding modes based on neighboring samples dependent parametric models |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022506628A JP2022506628A (ja) | 2022-01-17 |
JP7488256B2 true JP7488256B2 (ja) | 2024-05-21 |
Family
ID=69159921
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021524143A Active JP7488256B2 (ja) | 2018-11-05 | 2019-11-01 | 隣接サンプル依存パラメトリックモデルに基づいたコーディングモードの簡易化 |
Country Status (7)
Country | Link |
---|---|
US (1) | US20220078405A1 (ja) |
EP (1) | EP3878183A1 (ja) |
JP (1) | JP7488256B2 (ja) |
KR (1) | KR20210083353A (ja) |
CN (1) | CN112970264A (ja) |
IL (1) | IL282804A (ja) |
WO (1) | WO2020096877A1 (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3902251A4 (en) * | 2018-12-21 | 2022-09-21 | Samsung Electronics Co., Ltd. | ENCODING METHOD AND APPARATUS THEREOF, AND DECODING METHOD AND APPARATUS THEREOF |
CN113273212A (zh) * | 2019-01-02 | 2021-08-17 | 夏普株式会社 | 预测图像生成装置、运动图像解码装置、运动图像编码装置以及预测图像生成方法 |
EP4367885A1 (en) * | 2021-07-06 | 2024-05-15 | Nokia Technologies Oy | An apparatus, a method and a computer program for cross-component parameter calculation |
WO2023096472A1 (ko) * | 2021-11-29 | 2023-06-01 | 주식회사 윌러스표준기술연구소 | 비디오 신호 처리 방법 및 이를 위한 장치 |
WO2023116716A1 (en) * | 2021-12-21 | 2023-06-29 | Mediatek Inc. | Method and apparatus for cross component linear model for inter prediction in video coding system |
WO2024002807A1 (en) * | 2022-07-01 | 2024-01-04 | Interdigital Ce Patent Holdings, Sas | Signaling corrections for a convolutional cross-component model |
WO2024074131A1 (en) * | 2022-10-07 | 2024-04-11 | Mediatek Inc. | Method and apparatus of inheriting cross-component model parameters in video coding system |
WO2024074129A1 (en) * | 2022-10-07 | 2024-04-11 | Mediatek Inc. | Method and apparatus of inheriting temporal neighbouring model parameters in video coding system |
WO2024074753A1 (en) * | 2022-10-07 | 2024-04-11 | Nokia Technologies Oy | An apparatus, a method and a computer program for video coding and decoding |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013517669A (ja) | 2010-01-14 | 2013-05-16 | サムスン エレクトロニクス カンパニー リミテッド | 動きベクトルを符号化/復号化する方法及び装置 |
US20180063531A1 (en) | 2016-08-26 | 2018-03-01 | Qualcomm Incorporated | Unification of parameters derivation procedures for local illumination compensation and cross-component linear model prediction |
US20180098070A1 (en) | 2016-10-05 | 2018-04-05 | Qualcomm Incorporated | Systems and methods for adaptive selection of weights for video coding |
JP2022516180A (ja) | 2019-01-03 | 2022-02-24 | 華為技術有限公司 | クロマブロック予測方法及び装置 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10574993B2 (en) * | 2015-05-29 | 2020-02-25 | Qualcomm Incorporated | Coding data using an enhanced context-adaptive binary arithmetic coding (CABAC) design |
US10652575B2 (en) * | 2016-09-15 | 2020-05-12 | Qualcomm Incorporated | Linear model chroma intra prediction for video coding |
WO2018116925A1 (ja) * | 2016-12-21 | 2018-06-28 | シャープ株式会社 | イントラ予測画像生成装置、画像復号装置、および画像符号化装置 |
CN114501005A (zh) * | 2017-04-28 | 2022-05-13 | 夏普株式会社 | 图像解码装置以及图像编码装置 |
WO2019004283A1 (ja) * | 2017-06-28 | 2019-01-03 | シャープ株式会社 | 動画像符号化装置及び動画像復号装置 |
MX2020001290A (es) * | 2017-08-03 | 2020-03-12 | Sharp Kk | Sistemas y metodos para particionar bloques de video en un corte de interprediccion de datos de video. |
JP2021016016A (ja) * | 2017-10-20 | 2021-02-12 | シャープ株式会社 | 動画像符号化装置及び動画像復号装置 |
-
2019
- 2019-11-01 JP JP2021524143A patent/JP7488256B2/ja active Active
- 2019-11-01 WO PCT/US2019/059310 patent/WO2020096877A1/en unknown
- 2019-11-01 EP EP19835879.8A patent/EP3878183A1/en active Pending
- 2019-11-01 KR KR1020217017075A patent/KR20210083353A/ko unknown
- 2019-11-01 US US17/291,164 patent/US20220078405A1/en active Pending
- 2019-11-01 CN CN201980071930.7A patent/CN112970264A/zh active Pending
-
2021
- 2021-04-29 IL IL282804A patent/IL282804A/en unknown
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013517669A (ja) | 2010-01-14 | 2013-05-16 | サムスン エレクトロニクス カンパニー リミテッド | 動きベクトルを符号化/復号化する方法及び装置 |
US20180063531A1 (en) | 2016-08-26 | 2018-03-01 | Qualcomm Incorporated | Unification of parameters derivation procedures for local illumination compensation and cross-component linear model prediction |
US20180098070A1 (en) | 2016-10-05 | 2018-04-05 | Qualcomm Incorporated | Systems and methods for adaptive selection of weights for video coding |
JP2019531029A (ja) | 2016-10-05 | 2019-10-24 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | 照度補償のためのテンプレートサイズを適応的に決定するシステムおよび方法 |
JP2022516180A (ja) | 2019-01-03 | 2022-02-24 | 華為技術有限公司 | クロマブロック予測方法及び装置 |
Also Published As
Publication number | Publication date |
---|---|
KR20210083353A (ko) | 2021-07-06 |
CN112970264A (zh) | 2021-06-15 |
JP2022506628A (ja) | 2022-01-17 |
IL282804A (en) | 2021-06-30 |
US20220078405A1 (en) | 2022-03-10 |
EP3878183A1 (en) | 2021-09-15 |
WO2020096877A1 (en) | 2020-05-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7488256B2 (ja) | 隣接サンプル依存パラメトリックモデルに基づいたコーディングモードの簡易化 | |
JP7299221B2 (ja) | 隣接サンプルに応じた線形モデルに基づく映像符号化及び復号のための方法と装置 | |
JP7502278B2 (ja) | 双予測を使用するビデオエンコーディングおよびデコーディングのための方法および装置 | |
US11985306B2 (en) | Method and apparatus for video encoding and decoding with matrix based intra-prediction | |
US20240214553A1 (en) | Spatial local illumination compensation | |
KR20230104895A (ko) | 기하학적 파티션을 사용한 인트라 예측 | |
US20220150485A1 (en) | Intra prediction mode partitioning | |
WO2020018207A1 (en) | Wide angle intra prediction and position dependent intra prediction combination | |
CN112335240A (zh) | 使用可变权重的多参考帧内预测 | |
US20220021871A1 (en) | Intra prediction mode extension | |
KR20220123643A (ko) | 삼각형 병합 모드에서의 서브-블록 병합 후보들 | |
WO2020254264A1 (en) | Method and device for picture encoding and decoding using position dependent intra prediction combination | |
US20230336721A1 (en) | Combining abt with vvc sub-block-based coding tools | |
WO2024033116A1 (en) | Geometric partition mode boundary prediction | |
WO2023194104A1 (en) | Temporal intra mode prediction | |
WO2023194103A1 (en) | Temporal intra mode derivation | |
TW202416714A (zh) | 基於可用參考樣本之幀內預測模式改善 | |
KR20220052991A (ko) | 스위칭가능한 보간 필터들 | |
CN118120231A (zh) | 改善解码器侧帧内模式导出中的角度离散化 | |
KR20240072180A (ko) | Isp 모드를 사용한 템플릿 기반 인트라 모드 도출(timd)의 확장 | |
EP4070547A1 (en) | Scaling process for joint chroma coded blocks | |
CN114270829A (zh) | 局部照明补偿标志继承 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210707 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221101 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20231206 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231212 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240312 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240409 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240509 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7488256 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |