JP2022501906A - 双方向オプティカルフローのための複雑性低減およびビット幅制御 - Google Patents
双方向オプティカルフローのための複雑性低減およびビット幅制御 Download PDFInfo
- Publication number
- JP2022501906A JP2022501906A JP2021515221A JP2021515221A JP2022501906A JP 2022501906 A JP2022501906 A JP 2022501906A JP 2021515221 A JP2021515221 A JP 2021515221A JP 2021515221 A JP2021515221 A JP 2021515221A JP 2022501906 A JP2022501906 A JP 2022501906A
- Authority
- JP
- Japan
- Prior art keywords
- array
- gradient
- sample
- horizontal
- optical flow
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000003287 optical effect Effects 0.000 title claims abstract description 153
- 230000002457 bidirectional effect Effects 0.000 title claims abstract description 138
- 230000009467 reduction Effects 0.000 title abstract description 14
- 238000003079 width control Methods 0.000 title description 7
- 230000033001 locomotion Effects 0.000 claims abstract description 238
- 238000000034 method Methods 0.000 claims abstract description 131
- 238000003491 array Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 abstract description 24
- 239000013598 vector Substances 0.000 abstract description 11
- 238000004364 calculation method Methods 0.000 abstract description 9
- 239000000523 sample Substances 0.000 description 151
- 238000004891 communication Methods 0.000 description 40
- 238000007792 addition Methods 0.000 description 22
- 238000005516 engineering process Methods 0.000 description 16
- 238000009795 derivation Methods 0.000 description 14
- 238000013461 design Methods 0.000 description 12
- 230000015654 memory Effects 0.000 description 12
- 238000012360 testing method Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 10
- 239000013074 reference sample Substances 0.000 description 10
- 230000005540 biological transmission Effects 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 5
- 230000001413 cellular effect Effects 0.000 description 5
- 230000002093 peripheral effect Effects 0.000 description 5
- 241000700159 Rattus Species 0.000 description 4
- 230000006835 compression Effects 0.000 description 4
- 238000007906 compression Methods 0.000 description 4
- 239000010410 layer Substances 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 230000002146 bilateral effect Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 2
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 2
- 241000760358 Enodes Species 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 229910001416 lithium ion Inorganic materials 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- QELJHCBNGDEXLD-UHFFFAOYSA-N nickel zinc Chemical compound [Ni].[Zn] QELJHCBNGDEXLD-UHFFFAOYSA-N 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 229920001690 polydopamine Polymers 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 239000002356 single layer Substances 0.000 description 2
- 230000005355 Hall effect Effects 0.000 description 1
- 101000969688 Homo sapiens Macrophage-expressed gene 1 protein Proteins 0.000 description 1
- HBBGRARXTFLTSG-UHFFFAOYSA-N Lithium ion Chemical compound [Li+] HBBGRARXTFLTSG-UHFFFAOYSA-N 0.000 description 1
- 102100021285 Macrophage-expressed gene 1 protein Human genes 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 229960000106 biosimilars Drugs 0.000 description 1
- OJIJEKBXJYRIBZ-UHFFFAOYSA-N cadmium nickel Chemical compound [Ni].[Cd] OJIJEKBXJYRIBZ-UHFFFAOYSA-N 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000011248 coating agent Substances 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 239000000446 fuel Substances 0.000 description 1
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 229910052987 metal hydride Inorganic materials 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/132—Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/14—Coding unit complexity, e.g. amount of activity or edge presence estimation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
- H04N19/159—Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
- H04N19/517—Processing of motion vectors by encoding
- H04N19/52—Processing of motion vectors by encoding by predictive encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/563—Motion estimation with padding, i.e. with filling of non-object values in an arbitrarily shaped picture block or region for estimation purposes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/577—Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
Description
本出願は、(2018年9月21日に出願された)米国特許仮出願第62/734763号、(2018年9月28日に出願された)米国特許仮出願第62/738655号、および(2019年1月7日に出願された)米国特許仮出願第62/789331号の利益を米国特許法第119条(e)に基づいて主張する非仮出願であり、それらは全て、「Complexity Reduction and Bit-Width Control for Bi-Directional Optical Flow」と題され、参照によりそれらの全体が本明細書に組み込まれている。
図1Aは、1つまたは複数の開示されている実施形態が実装され得る例示的な通信システム100を示す図である。通信システム100は、音声、データ、ビデオ、メッセージング、ブロードキャストなどのコンテンツを複数の無線ユーザに提供する、多元接続システムであり得る。通信システム100は、複数の無線ユーザが、無線帯域幅を含むシステムリソースの共有を通じてそのようなコンテンツにアクセスすることを可能にする。例えば、通信システム100は、符号分割多元接続(CDMA)、時分割多元接続(TDMA)、周波数分割多元接続(FDMA)、直交FDMA(OFDMA)、シングルキャリアFDMA(SC−FDMA)、ゼロテールユニークワードDFT拡散OFDM(ZT UW DTS−s OFDM)、ユニークワードOFDM(UW−OFDM)、リソースブロックフィルタOFDM、フィルタバンクマルチキャリア(FBMC)など、1つまたは複数のチャネルアクセス方法を利用することができる。
ブロックベースのビデオコーディング
HEVCのように、VVCは、ブロックベースのハイブリッドビデオコーディングフレームワーク上に構築される。図2Aは、ブロックベースのハイブリッドビデオ符号化システムのブロック図を示す。入力ビデオ信号103は、(コーディングユニット(CU)と呼ばれる)ブロックごとに処理される。VTM−1.0では、CUは最大128×128ピクセルにすることができる。しかしながら、四分木のみに基づいてブロックを区分化するHEVCとは異なり、VTM−1.0では、コーディングツリーユニット(CTU)は、四分木/二分木/三分木に基づいて様々なローカル特性に適応するように、CUに分割される。さらに、HEVCにおける複数パーティションユニットタイプの概念が削除され、CU、予測ユニット(PU)、および変換ユニット(TU)の分離がVVCでは存在しなくなった。代わりに、各CUは、さらなる区分化なしで予測と変換の両方の基本単位として常に使用される。マルチタイプツリー構造では、1つのCTUが最初に四分木構造によって区分化される。各四分木リーフノードは、二分木および三分木構造でさらに区分化され得る。図3A〜図3Eに示されるように、4区分化、水平2区分化、垂直2区分化、水平3区分化、垂直3区分化の5つの分割タイプがある。
ビデオコーディングにおける従来の双予測は、既に再構成された参照ピクチャから得られた2つの時間予測ブロックの単純な組み合わせである。しかしながら、ブロックベースの動き補償(MC)の制約により、2つの予測ブロックのサンプルの間で観察できる残りの小さな動きがあり、それによって動き補償予測の効率が低下する可能性がある。この問題を解決するために、BMS−2.0において双方向オプティカルフロー(BIO)が適用され、ブロック内部の全てのサンプルに対するそのような動きの影響を低減する。具体的には、BIOは、双予測が使用されたときにブロックベースの動き補償予測に加えて実行されるサンプルごとの動き精緻化である。現在のBIO設計では、1つのブロック内の各サンプルの精緻化された動きベクトルの導出は、古典的なオプティカルフローモデルに基づいている。I(k)(x,y)を、参照ピクチャリストk(k=0,1)から得られた予測ブロックの座標(x,y)におけるサンプル値とすると、∂I(k)(x,y)/∂xおよび∂I(k)(x,y)/∂yは、サンプルの水平勾配および垂直勾配である。オプティカルフローモデルが与えられると、(x,y)における動き精緻化(vx,vy)は、
r=500・4BD-8
m=700・4BD-8 (8)
として定義され、ここで、BDは、入力ビデオのビット深度である。式(4)によって導出された動き精緻化に基づいて、カレントCUの最終的双予測信号は、以下に指定されるように、オプティカルフロー方程式(1)に基づいて動き軌道に沿ってL0/L1予測サンプルを補間することによって計算され得る:
前述の規格HEVCと同様に、VVCにおける双予測されたCUに関して、MVが分数のサンプル位置を指す場合、L0/L1予測信号、すなわち、I(0)(x,y)およびI(1)(x,y)が、後の平均化演算の精度を維持するために中間の高精度(すなわち、16ビット)で生成される。さらに、2つのMVのいずれかが整数である場合、(参照ピクチャから直接取り出される)対応する予測サンプルの精度は、平均化が適用される前に中間精度に向上される。中間ビット深度での双予測信号が与えられ、入力ビデオが10ビットであると仮定して、表1は、「オプティカルフローモデルに基づく双予測での予測」の節で示されたようなBIOプロセスの各段階で必要とされる中間パラメータのビット幅をまとめている。
この節では、既存のBIO設計に対して計算複雑性分析が実行される。具体的には、BMS−2.0の現在のBIO実装に従って、BIOが適用された状態で最終的な動き補償予測を生成するために使用される演算(例えば、乗算および加算)の数が計算される。さらに、以下の議論を容易にするために、BIOにより予測されるカレントCUのサイズがW×Hに等しく、WはCUの幅でありHは高さであると仮定する。
式(3)に示されるように、各4×4ブロックの局所動き精緻化(vx,vy)を導出するために、必要とされるサンプル値および勾配値の両方が、サンプルの周りの6×6周囲ウィンドウ内の全てのサンプルについて計算される。従って、CU内の全てのサンプルについて局所動き精緻化(vx,vy)を導出するために、(W+2)×(H+2)サンプルの勾配がBIOによって使用される。さらに、式(7)に示されるように、水平勾配と垂直勾配の両方が、2つの隣接サンプルの間の差を直接計算することによって得られる。従って、(W+2)×(H+2)勾配値を計算するために、L0とL1の両方の予測方向での予測サンプルの総数が(W+4)×(H+4)に等しくなる。現在の動き補償は2D分離可能有限インパルス応答(FIR)8タップフィルタに基づくので、L0およびL1予測サンプルの生成に使用される乗算と加算の両方の数は、((W+4)×(H+4+7)×8+(W+4)×(H+4)×8)×2に等しい。
式(7)に示されるように、勾配は2つの隣接する予測サンプルから直接計算されるので、サンプルごとに1つのみの加算が必要とされる。L0とL1の両方の(W+2)x(H+2)の拡張された領域で水平勾配と垂直勾配の両方が導出されることを考慮すると、勾配の導出に必要な加算の総数は、((W+2)×(H+2))×2×2に等しい。
式(5)および(6)に示されるように、BIOによって拡張領域(W+2)x(H)内の全てのサンプルについて計算される5つの相関パラメータ(すなわち、S1、S2、S3、S5、およびS6)がある。さらに、各サンプル位置において5つのパラメータを計算するために使用される5つの乗算と3つの加算がある。従って、相関パラメータを計算するための乗算および加算の総数はそれぞれ、((W+2)×(H+2))×5および((W+2)×(H+2))×3に等しい。
上述のように、BIO動き精緻化(vx,vy)は、カレントCU内の各4×4ブロックについて別々に導出される。各4×4ブロックの動き精緻化を導出するために、6×6周囲領域内の5つの相関パラメータの合計が計算される。従って、この段階で、5つの相関パラメータの総和は、総計で(W/4)×(H/4)×6×6×5の加算を使用する。
式(4)に示されるように、各4×4ブロックの局所動き精緻化(vx,vy)を導出するために、調節パラメータrをS1およびS3に追加するための2つの加算がある。さらに、vyの値を計算するための1つの乗算および加算がある。従って、CU内の全ての4×4ブロックについての動き精緻化を導出するために、使用される乗算および加算の数はそれぞれ、(W/4)×(H/4)および(W/4)×(H/4)×3に等しい。
式(9)に示されるように、導出された動き精緻化が与えられると、各サンプル位置における最終的予測サンプル値を導出するために、2つの乗算および6つの加算がさらに使用される。この段階で、総計でW×H×2の乗算およびW×H×6の加算が行われる。
上述のように、BIOは、動き補償段階で使用される動きベクトルの粒度および精度の両方を改善することによって、双予測での予測の効率を向上することができる。BIOはコーディング性能を効率的に改善することができるが、実際のハードウェア実装の複雑性が大幅に増大する。本開示では、BMS−2.0の現在のBIO設計に存在する以下の複雑性問題が特定される。
HEVC規格と同様に、MVが参照ピクチャにおける分数のサンプル位置を指すとき、予測ブロックの予測サンプルを補間するために、動き補償段階で2D分離可能FIRフィルタが適用される。具体的には、最初に、MVの水平分数成分に応じて中間サンプルを導出するために1つの補間フィルタが水平方向に適用され、次に、MVの垂直分数成分に応じて上記の水平分数サンプル上に別の補間フィルタが垂直に適用される。入力が10ビットビデオ(すなわち、BD=10)であると仮定して、表2は、動き補償プロセスからの補間されたサンプルの最悪の場合のビット幅に対応する半サンプル位置を水平および垂直MVが指すことを仮定して、VTM/BMS−2.0での動き補償予測プロセスのビット幅測定を示している。具体的には、最初の段階で、正および負のフィルタ係数に関連付けられた入力参照サンプルの値をそれぞれ最大入力値(すなわち、2BD−1)および最小入力値(すなわち、0)に設定することによって、最初の補間プロセス(水平補間)後の中間データの最悪の場合のビット幅が計算される。次いで、第2の補間の入力値の値を、第1の補間から出力された最悪の可能な値に設定することによって、第2の補間プロセス(垂直補間)の最悪の場合のビット幅が得られる。
上記の複雑性分析に基づいて、表3および表4は、現在のBIOに従って異なるCUサイズについてサンプルごとに行う必要がある乗算および加算の数を示し、それらを、VTM/BMS−2.0での最悪の場合の計算複雑性に対応する通常の4×4の双予測されたCUの複雑性統計値と比較する。4×4の双予測されたCUについて、補間フィルタの長さ(例えば、8)が与えられると、乗算および加算の総数は、(4×(4+7)×8+4×4×8)×2=960(すなわち、サンプルあたり60)および(4×(4+7)×8+4×4×8)×2+4×4×2=992(すなわち、サンプルあたり62)に等しい。
上述された問題の少なくともいくつかを解決するために、この節では、コーディング利得を維持しながら、BIOに基づく動き補償予測の複雑性を低減する方法が提案される。第1に、実装コストを低減するために、本開示では、ハードウェアBIO実装に使用される内部ビット幅を低減するためのビット幅制御方法が提案される。いくつかの提案される方法では、BIOが有効にされた動き補償予測は、15ビットの乗算器および32ビット内の中間値を用いて実装され得る。
上記で指摘されたように、BMS−2.0における現在のBIOの実装は、HEVCの動き補償補間の実装の場合よりもはるかに大きい、33ビットの乗算器および中間パラメータの43ビットのビット幅を使用する。従って、ハードウェアおよびソフトウェアにBIOを実装するのに非常にコストがかかる。この節では、BIOに必要なビット幅を低減するためのビット幅制御方法が提案される。例示的方法では、以下に示されるように、中間パラメータの全体的ビット幅を低減するために、式(6)における水平中間パラメータアレイΨx(i,j)、垂直中間パラメータアレイΨy(i,j)、および信号差パラメータアレイθ(i,j)のうちの1つまたは複数がそれぞれ最初にnaビットおよびnbビット下位方向にシフトされる:
・ 中間BIOパラメータの妥当な内部ビット幅を提供するために、naが3に設定され、nbが6に設定される。
・ HEVCの動き補償に使用される乗算器と同じ1つの15ビット乗算器によって、BIOに関与する全ての乗算が行われることが可能であるように、nS2が12に設定される。
θ(i,j)=(I(1)(i,j)≫nb)−(I(0)(i,j)≫nb) (16)
上に示されたように、BMS−2.0における既存のBIO設計は、通常の双予測の最悪の場合の計算複雑性と比較して大きな複雑性増大(例えば、乗算および加算の数)をもたらす。以下では、BIOの最悪の場合の計算複雑性を低減する方法が提案される。
上述のように、カレントCUがW×Hであると仮定すると、拡張された領域(W+2)×(H+2)におけるサンプルの勾配は、CU内の全ての4×4ブロックについての動き精緻化を導出するために計算される。既存のBIO設計では、動き補償に使用される同じ補間フィルタ(8タップフィルタ)が、これらの拡張されたサンプルを生成するために使用される。表3および表4に示されるように、拡張された領域でのサンプルの補間による複雑性は、BIOの複雑性ボトルネックである。従って、BIO複雑性を低減するために、8タップ補間フィルタを使用する代わりに、BIO CUの拡張された周囲領域でのサンプルの生成のために、タップ長がより短い簡略化された補間フィルタを使用することが提案される。他方で、拡張されたサンプルの生成では、参照ピクチャからのより多くの参照サンプルにアクセスする必要があるため、これがBIOのメモリ帯域幅を増大させる可能性がある。メモリ帯域幅増大を回避するために、BMS−2.0の現在のBIOで使用されている参照サンプルパディングが適用されることが可能であり、この場合、CUの通常の動き補償の通常の参照領域(すなわち、(W+7)×(H+7))の外側の参照サンプルが、通常の参照領域の最も近い境界サンプルによってパディングされる。パディングされた参照サンプルのサイズを計算するために、拡張されたサンプルを生成するために使用される簡略化されたフィルタの長さをNと仮定すると、通常の参照領域の上下左右の各境界に沿ったパディングされた参照サンプルの数Mは、以下と等しい。
図5および図6に示されるように、上述のBIO複雑度低減方法は、やはりカレントCUの各境界の周りの予測サンプルの2つの追加の行/列を補間するように動作する。簡略化されたフィルタを使用して操作の数を減らすが、補間される必要のあるサンプルの数のため、ある程度の複雑性増大が依然として生じる。BIO複雑性をさらに低減するために、いくつかの実施形態では、拡張されたサンプルの数を各CU境界で2つの行/列から単一の行/列に低減する方法が提案される。具体的には、現在のBIOによって(W+4)×(H+4)サンプルを使用する代わりに、いくつかの実施形態では、さらなる複雑性低減のために(W+2)×(H+2)サンプルのみを使用する。しかしながら、式(7)に示されるように、各サンプルの勾配計算は、左と右の隣接要素(水平勾配の場合)または上と下の隣接要素(垂直勾配の場合)の両方のサンプル値を使用する。従って、拡張された領域サイズを(W+2)×(H+2)に低減することにより、方法はCU内のサンプルの勾配値を計算できるだけであり、従って、既存のBIO動き精緻化は、CU領域の四隅に配置された4×4ブロックに対して直接実行されることができない。この問題に対処するために、いくつかの実施形態では、CU外のサンプル位置の勾配(すなわち、
HEVCでは、各予測ユニットは、予測方向に対して最大で1つのMVを有する。対照的に、現在のVTM/BMS−2.0では、高度時間動きベクトル予測(ATMVP)およびアフィン予測を含む2つのサブブロックレベルインター予測技法が含まれる。それらのコーディングモードでは、ビデオブロックはさらに複数の小さなサブブロックに分割され、各サブブロックについての動き情報が個別に導出される。各サブブロックについての動き情報は、動き補償段階でブロックの予測信号を生成するために使用される。他方で、BMS−2.0の現在のBIOは、CUレベルの動き補償予測に加えて、4×4サブブロックレベルでの動き精緻化を提供することができる。サブブロックでコーディングされたCUの動きフィールドの細かな粒度により、BIOによる精緻化された動きから得られる追加のコーディング利点は非常に限られる可能性がある。いくつかの実施形態では、BIOは、サブブロックモードによってコーディングされたCUについて無効にされる。
VVCにおいて、いくつかのインター双予測モードは、動きが線形であり、リスト0とリスト1の動きベクトルが対称であるという仮定に基づいている。これらのモードは、非特許文献2に記載されたMVDとのマージモード(Merge with MVD mode:MMVD)、および非特許文献3に記載されたバイラテラルマッチングを用いるデコーダ側MV導出を含む。これらのモードは対称的動きを使用して予測を生成するため、これらの予測に対してBIOを適用することは効率的ではない可能性がある。複雑性を低減するために、いくつかの実施形態では、BIOは、MMVDまたはバイラテラルマッチングを用いるデコーダ側MV導出などの対称モードを使用して予測されるコーディングユニットについて無効にされる。
図8は、コーディングされたビットストリーム構造の例を示す図である。コーディングされたビットストリーム1300は、いくつかのNAL(ネットワーク抽象化層)ユニット1301を含む。NALユニットは、コーディングされたスライスデータ1306のようなコーディングされたサンプルデータ、またはパラメータセットデータ、スライスヘッダ1305、若しくは付加拡張情報データ1307(SEIメッセージと呼ばれることもある)のような高レベル構文メタデータを含んでよい。パラメータセットは、複数のビットストリーム層(例えば、ビデオパラメータセット1302(VPS))に適用してよい、または1つの層内のコーディングされたビデオシーケンス(例えば、シーケンスパラメータセット1303(SPS))に適用してよい、または1つのコーディングされたビデオシーケンス内のいくつかのコーディングされたピクチャ(例えば、ピクチャパラメータセット1304(PPS))に適用してよい基本的構文要素を含む高レベル構文構造である。パラメータセットは、ビデオビットストリームのコーディングされたピクチャと一緒に送信されてよく、または(信頼できるチャネルを使用する帯域外送信、ハードコーティングなどを含む)他の手段を介して送信されてよい。スライスヘッダ1305は、比較的小さくまたは特定のスライス若しくはピクチャタイプにのみ関連するいくらかのピクチャ関連情報を含み得る高レベル構文構造である。SEIメッセージ1307は、復号プロセスによって必要とされないかもしれないが、ピクチャ出力タイミングまたは表示並びに損失検出および隠蔽などの様々な他の目的のために使用され得る情報を搬送する。
図9は、通信システムの例を示す図である。通信システム1400は、エンコーダ1402、通信ネットワーク1404、およびデコーダ1406を備え得る。エンコーダ1402は、有線接続または無線接続であり得る接続1408を介して通信ネットワーク1404と通信できる。エンコーダ1402は、図2Aのブロックベースのビデオエンコーダと同様であってよい。エンコーダ1402は、単一層コーデック(例えば図2A)または多層コーデックを含み得る。デコーダ1406は、有線接続または無線接続であり得る接続1410を介して通信ネットワーク1404と通信できる。デコーダ1406は、図2Bのブロックベースのビデオデコーダと同様であってよい。デコーダ1406は、単一層コーデック(例えば図2B)または多層コーデックを含み得る。
いくつかの実施形態では、ビデオを符号化または復号するための方法が提供される。この方法は、双方向オプティカルフローを使用してコーディングされたビデオにおける少なくとも1つのカレントブロックについて、第1の参照ピクチャからの第1の予測信号に基づいて第1の勾配成分を計算するステップと、第2の参照ピクチャからの第2の予測信号に基づいて第2の勾配成分を計算するステップと、第1の勾配成分と第2の勾配成分を合計し、得られた合計の下位方向ビットシフトを実行して、縮小ビット幅相関パラメータを生成するステップと、縮小ビット幅相関パラメータに少なくとも部分的に基づいて動き精緻化を計算するステップと、計算された動き精緻化を使用して双方向オプティカルフローを用いてブロックを予測するステップとを含む。
θ(i,j)=(I(1)(i,j)−I(0)(i,j))≫nb
である。
計算された水平および垂直動き精緻化を使用して双方向オプティカルフローを用いてブロックを予測するステップとを含む。いくつかのそのような実施形態では、
S1=Σ(i,j)∈ΩΨx(i,j)・Ψx(i,j)、
S2=Σ(i,j)∈ΩΨx(i,j)・Ψy(i,j)、
S3=Σ(i,j)∈Ωθ(i,j)・Ψx(i,j)、
S5=Σ(i,j)∈ΩΨy(i,j)・Ψy(i,j)、および
S6=Σ(i,j)∈Ωθ(i,j)・Ψy(i,j)
である。
θ(i,j)=(I(1)(i,j)≫nb)−(I(0)(i,j)≫nb)
である。
第2の参照ピクチャからの縮小ビット幅の第2の予測信号に基づいて縮小ビット幅の第2の勾配成分を計算するステップは、
Claims (15)
- ビデオコーディング方法であって、
双方向オプティカルフローを使用してコーディングされたビデオにおける少なくとも1つのカレントブロックについて、
第1の参照ピクチャからの第1の予測信号アレイI(0)(i,j)に基づいて第1の水平勾配アレイ
第2の参照ピクチャからの第2の予測信号アレイI(1)(i,j)に基づいて第2の水平勾配アレイ
(i)前記第1の水平勾配アレイおよび(ii)前記第2の水平勾配アレイの合計に対して右ビットシフトを実行することを含む方法によって、縮小ビット幅水平中間パラメータアレイΨx(i,j)を計算するステップと、
前記縮小ビット幅水平中間パラメータアレイに少なくとも部分的に基づいて少なくとも水平動き精緻化vxを計算するステップと、
少なくとも前記水平動き精緻化vxを使用して双方向オプティカルフローを用いて前記カレントブロックの予測を生成するステップと
を含む方法。 - 前記第1の予測信号アレイI(0)(i,j)と前記第2の予測信号アレイI(1)(i,j)との差を計算することを含む方法によって、信号差パラメータアレイθ(i,j)を計算するステップと、
(i)前記信号差パラメータアレイθ(i,j)と(ii)前記水平勾配中間パラメータアレイΨx(i,j)との要素ごとの乗算の成分を合計することによって、信号水平勾配相関パラメータS3を計算するステップと
をさらに含み、
前記水平動き精緻化vxを計算するステップは、前記信号水平勾配相関パラメータS3をビットシフトして前記水平動き精緻化vxを得ることを含む、
請求項1の方法。 - 前記信号差パラメータアレイθ(i,j)を計算するステップは、前記第1の予測信号アレイI(0)(i,j)と前記第2の予測信号アレイI(1)(i,j)との差を計算する前に、前記第1の予測信号アレイI(0)(i,j)と前記第2の予測信号アレイI(1)(i,j)とのそれぞれに対して右ビットシフトを実行することを含む、請求項2の方法。
- 第1の参照ピクチャからの第1の予測信号アレイI(0)(i,j)に基づいて第1の垂直勾配アレイ
第2の参照ピクチャからの第2の予測信号アレイI(1)(i,j)に基づいて第2の垂直勾配アレイ
(i)前記第1の垂直勾配アレイおよび(ii)前記第2の垂直勾配アレイの合計に対して右ビットシフトを実行することを含む方法によって、縮小ビット幅垂直中間パラメータアレイΨy(i,j)を計算するステップと、
前記縮小ビット幅水平中間パラメータアレイΨx(i,j)および前記縮小ビット幅垂直中間パラメータアレイΨy(i,j)に少なくとも部分的に基づいて、垂直動き精緻化vyを計算するステップと
をさらに含み、
前記カレントブロックの予測は、前記水平動き精緻化vxおよび前記垂直動き精緻化vyを使用して生成される、請求項1乃至3のいずれか一項の方法。 - (i)水平中間パラメータアレイΨx(i,j)と(ii)垂直中間パラメータアレイΨy(i,j)との要素ごとの乗算の成分を合計することを含む方法によって、相互勾配相関パラメータS2を計算するステップをさらに含み、
前記垂直動き精緻化vyを計算するステップは、(i)前記水平動き精緻化vxと(ii)前記相互勾配相関パラメータS2との積を決定するステップを含む、
請求項4の方法。 - (i)前記水平動き精緻化vxと(ii)前記相互勾配相関パラメータS2との積を決定するステップは、
前記相互勾配相関パラメータS2を、最上位ビットMSBパラメータ部分S2,mと最下位ビットLSBパラメータ部分S2,sとに分離するステップと、
(i)前記水平動き精緻化vxと(ii)MSBパラメータ部分S2,mとのMSB積を決定するステップと、
(i)前記水平動き精緻化vxと(ii)LSBパラメータ部分S2,SとのLSB積を決定するステップと、
前記MSB積の左ビットシフトを実行して、ビットシフトされたMSB積を生成するステップと、
前記LSB積と前記ビットシフトされたMSB積とを加算するステップと
を含む、請求項5の方法。 - 前記信号差パラメータアレイθ(i,j)の少なくともいくつかの値を計算するステップは、予測信号アレイI(0)(i,j)、I(1)(i,j)の外側のサンプルを、前記予測信号アレイの内側のそれぞれの最も近い境界サンプルでパディングするステップを含む、請求項2乃至8のいずれか一項の方法。
- 信号水平勾配相関パラメータS3および相互勾配相関パラメータS2は、前記カレントブロックにおけるサブブロックごとに計算される、請求項2乃至11のいずれか一項の方法。
- エンコーダによって実行される、請求項1乃至12のいずれか一項の方法。
- デコーダによって実行される、請求項1乃至12のいずれか一項の方法。
- プロセッサと、請求項1乃至14のいずれかの方法を実行するように構成された命令を格納する非一時的コンピュータ可読記憶媒体とを備えたシステム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2023111403A JP7553659B2 (ja) | 2018-09-21 | 2023-07-06 | 双方向オプティカルフローのための複雑性低減およびビット幅制御 |
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862734763P | 2018-09-21 | 2018-09-21 | |
US62/734,763 | 2018-09-21 | ||
US201862738655P | 2018-09-28 | 2018-09-28 | |
US62/738,655 | 2018-09-28 | ||
US201962789331P | 2019-01-07 | 2019-01-07 | |
US62/789,331 | 2019-01-07 | ||
PCT/US2019/051560 WO2020061082A1 (en) | 2018-09-21 | 2019-09-17 | Complexity reduction and bit-width control for bi-directional optical flow |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023111403A Division JP7553659B2 (ja) | 2018-09-21 | 2023-07-06 | 双方向オプティカルフローのための複雑性低減およびビット幅制御 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2022501906A true JP2022501906A (ja) | 2022-01-06 |
JPWO2020061082A5 JPWO2020061082A5 (ja) | 2022-04-18 |
JP7311589B2 JP7311589B2 (ja) | 2023-07-19 |
Family
ID=68104762
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021515221A Active JP7311589B2 (ja) | 2018-09-21 | 2019-09-17 | 双方向オプティカルフローのための複雑性低減およびビット幅制御 |
JP2023111403A Active JP7553659B2 (ja) | 2018-09-21 | 2023-07-06 | 双方向オプティカルフローのための複雑性低減およびビット幅制御 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023111403A Active JP7553659B2 (ja) | 2018-09-21 | 2023-07-06 | 双方向オプティカルフローのための複雑性低減およびビット幅制御 |
Country Status (8)
Country | Link |
---|---|
US (4) | US11470308B2 (ja) |
EP (1) | EP3854089A1 (ja) |
JP (2) | JP7311589B2 (ja) |
KR (2) | KR20240142584A (ja) |
CN (2) | CN118474345A (ja) |
IL (1) | IL281581A (ja) |
TW (2) | TW202402055A (ja) |
WO (1) | WO2020061082A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7223858B2 (ja) | 2019-01-09 | 2023-02-16 | ベイジン ダジア インターネット インフォメーション テクノロジー カンパニー リミテッド | ビデオコーディングの方法、ビデオコーディングデバイス、コンピュータ可読記憶媒体およびコンピュータプログラム |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118474345A (zh) | 2018-09-21 | 2024-08-09 | Vid拓展公司 | 用于双向光流的复杂度降低和位宽控制 |
WO2020084465A1 (en) | 2018-10-22 | 2020-04-30 | Beijing Bytedance Network Technology Co., Ltd. | Simplified coding of generalized bi-directional index |
CN112997485A (zh) * | 2018-11-05 | 2021-06-18 | 北京字节跳动网络技术有限公司 | 用于具有细化的帧间预测的插值 |
CN113228681A (zh) * | 2018-12-21 | 2021-08-06 | 韩国电子通信研究院 | 图像编码/解码方法和装置以及存储比特流的记录介质 |
PT3909247T (pt) * | 2019-02-08 | 2024-05-13 | Beijing Dajia Internet Information Tech Co Ltd | Método e dispositivo para aplicação seletiva de refinamento de vetor de movimento do lado do descodificador para codificação de vídeo |
KR20220112864A (ko) * | 2019-03-15 | 2022-08-11 | 베이징 다지아 인터넷 인포메이션 테크놀로지 컴퍼니 리미티드 | 양방향 광 흐름을 위한 비트-폭 제어를 위한 방법 및 디바이스 |
GB2585039A (en) * | 2019-06-25 | 2020-12-30 | Sony Corp | Image data encoding and decoding |
US11736720B2 (en) * | 2019-09-03 | 2023-08-22 | Tencent America LLC | Motion vector refinement methods for video encoding |
US11936904B2 (en) | 2019-09-20 | 2024-03-19 | Telefonaktiebolaget Lm Ericsson (Publ) | Methods of video encoding and/or decoding with bidirectional optical flow simplification on shift operations and related apparatus |
CN114079784A (zh) * | 2020-08-20 | 2022-02-22 | Oppo广东移动通信有限公司 | 帧间预测方法、编码器、解码器以及计算机存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011129084A1 (ja) * | 2010-04-12 | 2011-10-20 | パナソニック株式会社 | 空間予測方法、画像復号方法、および画像符号化方法 |
WO2018166357A1 (en) * | 2017-03-16 | 2018-09-20 | Mediatek Inc. | Method and apparatus of motion refinement based on bi-directional optical flow for video coding |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2991878B2 (ja) * | 1992-11-27 | 1999-12-20 | 三菱電機株式会社 | オプティカルフロー演算回路 |
JPH06168239A (ja) | 1992-11-27 | 1994-06-14 | Toshiba Corp | 文書作成装置 |
KR102539009B1 (ko) * | 2015-06-08 | 2023-05-31 | 브이아이디 스케일, 인크. | 스크린 콘텐츠 코딩을 위한 인트라 블록 카피 모드 |
US20180242004A1 (en) * | 2015-08-23 | 2018-08-23 | Lg Electronics Inc. | Inter prediction mode-based image processing method and apparatus therefor |
US10341659B2 (en) * | 2016-10-05 | 2019-07-02 | Qualcomm Incorporated | Systems and methods of switching interpolation filters |
US10986367B2 (en) * | 2016-11-04 | 2021-04-20 | Lg Electronics Inc. | Inter prediction mode-based image processing method and apparatus therefor |
CN110115032B (zh) * | 2016-12-22 | 2021-07-20 | 联发科技股份有限公司 | 用于视频编解码的运动细化的方法以及装置 |
US10931969B2 (en) * | 2017-01-04 | 2021-02-23 | Qualcomm Incorporated | Motion vector reconstructions for bi-directional optical flow (BIO) |
US10701366B2 (en) * | 2017-02-21 | 2020-06-30 | Qualcomm Incorporated | Deriving motion vector information at a video decoder |
US11206419B2 (en) * | 2017-05-17 | 2021-12-21 | Kt Corporation | Method and device for video signal processing |
CN110771169A (zh) * | 2017-06-09 | 2020-02-07 | 韩国电子通信研究院 | 视频编码/解码方法和装置以及存储比特流的记录介质 |
US10904565B2 (en) * | 2017-06-23 | 2021-01-26 | Qualcomm Incorporated | Memory-bandwidth-efficient design for bi-directional optical flow (BIO) |
BR112020000032A2 (pt) * | 2017-07-03 | 2020-07-14 | Vid Scale, Inc. | dispositivo e método de codificação de dados de vídeo. |
CN111052742A (zh) * | 2017-09-30 | 2020-04-21 | 深圳市大疆创新科技有限公司 | 图像处理 |
US10776688B2 (en) * | 2017-11-06 | 2020-09-15 | Nvidia Corporation | Multi-frame video interpolation using optical flow |
US11109053B2 (en) * | 2018-03-05 | 2021-08-31 | Panasonic Intellectual Property Corporation Of America | Encoding method, decoding method, encoder, and decoder |
WO2019238008A1 (en) | 2018-06-11 | 2019-12-19 | Mediatek Inc. | Method and apparatus of bi-directional optical flow for video coding |
EP3834416A4 (en) | 2018-08-17 | 2022-08-17 | HFI Innovation Inc. | METHODS AND APPARATUS FOR VIDEO PROCESSING WITH BIDIRECTIONAL PREDICTION IN VIDEO CODING SYSTEMS |
CN118474345A (zh) | 2018-09-21 | 2024-08-09 | Vid拓展公司 | 用于双向光流的复杂度降低和位宽控制 |
-
2019
- 2019-09-17 CN CN202410474083.1A patent/CN118474345A/zh active Pending
- 2019-09-17 EP EP19780070.9A patent/EP3854089A1/en active Pending
- 2019-09-17 KR KR1020247030758A patent/KR20240142584A/ko active Search and Examination
- 2019-09-17 US US17/276,448 patent/US11470308B2/en active Active
- 2019-09-17 WO PCT/US2019/051560 patent/WO2020061082A1/en unknown
- 2019-09-17 KR KR1020217008062A patent/KR102708989B1/ko active IP Right Grant
- 2019-09-17 CN CN201980060852.0A patent/CN112715030B/zh active Active
- 2019-09-17 JP JP2021515221A patent/JP7311589B2/ja active Active
- 2019-09-18 TW TW112132633A patent/TW202402055A/zh unknown
- 2019-09-18 TW TW108133511A patent/TWI834722B/zh active
-
2021
- 2021-03-17 IL IL281581A patent/IL281581A/en unknown
-
2022
- 2022-10-10 US US17/962,928 patent/US11968358B2/en active Active
- 2022-10-10 US US17/962,918 patent/US12003703B2/en active Active
-
2023
- 2023-07-06 JP JP2023111403A patent/JP7553659B2/ja active Active
-
2024
- 2024-02-09 US US18/438,202 patent/US20240205389A1/en active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011129084A1 (ja) * | 2010-04-12 | 2011-10-20 | パナソニック株式会社 | 空間予測方法、画像復号方法、および画像符号化方法 |
US20130028530A1 (en) * | 2010-04-12 | 2013-01-31 | Virginie Drugeon | Spatial prediction method, image decoding method, and image coding method |
WO2018166357A1 (en) * | 2017-03-16 | 2018-09-20 | Mediatek Inc. | Method and apparatus of motion refinement based on bi-directional optical flow for video coding |
Non-Patent Citations (1)
Title |
---|
XIAOYU XIU, YUWEN HE, YAN YE , CHEN-YEN LAI, YU-CHI SU,TZU-DER CHUANG, CHING-YEH CHEN,YU-WEN HUANG,: "CE9-related: A simplified design of bi-directional optical flow (BIO) [online]", JVET-L JVET-L0591, JPN6023022274, 3 October 2018 (2018-10-03), pages 1 - 9, ISSN: 0005077373 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7223858B2 (ja) | 2019-01-09 | 2023-02-16 | ベイジン ダジア インターネット インフォメーション テクノロジー カンパニー リミテッド | ビデオコーディングの方法、ビデオコーディングデバイス、コンピュータ可読記憶媒体およびコンピュータプログラム |
Also Published As
Publication number | Publication date |
---|---|
US12003703B2 (en) | 2024-06-04 |
CN112715030A (zh) | 2021-04-27 |
CN118474345A (zh) | 2024-08-09 |
US11470308B2 (en) | 2022-10-11 |
US20230053233A1 (en) | 2023-02-16 |
EP3854089A1 (en) | 2021-07-28 |
KR20210071958A (ko) | 2021-06-16 |
KR102708989B1 (ko) | 2024-09-23 |
JP7553659B2 (ja) | 2024-09-18 |
TW202402055A (zh) | 2024-01-01 |
CN112715030B (zh) | 2024-04-23 |
US11968358B2 (en) | 2024-04-23 |
JP7311589B2 (ja) | 2023-07-19 |
TW202025751A (zh) | 2020-07-01 |
US20220038679A1 (en) | 2022-02-03 |
TWI834722B (zh) | 2024-03-11 |
KR20240142584A (ko) | 2024-09-30 |
IL281581A (en) | 2021-05-31 |
US20230050213A1 (en) | 2023-02-16 |
US20240205389A1 (en) | 2024-06-20 |
WO2020061082A1 (en) | 2020-03-26 |
JP2023118924A (ja) | 2023-08-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7553659B2 (ja) | 双方向オプティカルフローのための複雑性低減およびビット幅制御 | |
KR102612975B1 (ko) | 광류를 사용한 인터 예측 개선을 위한 시스템, 장치 및 방법 | |
US20220191502A1 (en) | Methods and apparatus for prediction refinement for decoder side motion vector refinement with optical flow | |
US20240107024A1 (en) | Affine motion model derivation method | |
JP7552988B2 (ja) | オプティカルフローによる動き補償のための精度精緻化 | |
US20220182634A1 (en) | Methods and systems for post-reconstruction filtering | |
US20220132136A1 (en) | Inter prediction bandwidth reduction method with optical flow compensation | |
RU2811563C2 (ru) | Системы, устройства и способы для уточнения интерпрогнозирования с помощью оптического потока | |
WO2024133624A1 (en) | Local illumination compensation with extended models |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210519 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20210414 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20210727 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220408 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220408 |
|
TRDD | Decision of grant or rejection written | ||
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230530 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230606 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230706 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7311589 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |