JP2023528780A - ビデオコーディングにおけるニューラルネットワークベースのフィルタ - Google Patents
ビデオコーディングにおけるニューラルネットワークベースのフィルタ Download PDFInfo
- Publication number
- JP2023528780A JP2023528780A JP2022572477A JP2022572477A JP2023528780A JP 2023528780 A JP2023528780 A JP 2023528780A JP 2022572477 A JP2022572477 A JP 2022572477A JP 2022572477 A JP2022572477 A JP 2022572477A JP 2023528780 A JP2023528780 A JP 2023528780A
- Authority
- JP
- Japan
- Prior art keywords
- region
- offset
- samples
- neural network
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 137
- 238000001914 filtration Methods 0.000 claims abstract description 39
- 238000013139 quantization Methods 0.000 claims abstract description 11
- 238000000034 method Methods 0.000 claims description 86
- 230000004044 response Effects 0.000 claims description 12
- 238000013527 convolutional neural network Methods 0.000 description 44
- 238000012937 correction Methods 0.000 description 30
- 230000008569 process Effects 0.000 description 25
- 230000006870 function Effects 0.000 description 21
- 230000015654 memory Effects 0.000 description 20
- 238000004891 communication Methods 0.000 description 18
- 238000012545 processing Methods 0.000 description 17
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 13
- 238000012549 training Methods 0.000 description 13
- 239000013598 vector Substances 0.000 description 11
- 241000023320 Luma <angiosperm> Species 0.000 description 10
- 230000004913 activation Effects 0.000 description 9
- 230000011664 signaling Effects 0.000 description 9
- 230000008901 benefit Effects 0.000 description 6
- 230000003044 adaptive effect Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000005192 partition Methods 0.000 description 5
- 230000009467 reduction Effects 0.000 description 5
- 230000009471 action Effects 0.000 description 4
- 239000000203 mixture Substances 0.000 description 4
- 230000003190 augmentative effect Effects 0.000 description 3
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 230000002093 peripheral effect Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000002146 bilateral effect Effects 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 238000006880 cross-coupling reaction Methods 0.000 description 2
- 238000009795 derivation Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 230000003936 working memory Effects 0.000 description 2
- 241001502919 Gambusia luma Species 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 229920001690 polydopamine Polymers 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/117—Filters, e.g. for pre-processing or post-processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/132—Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/147—Data rate or code amount at the encoder output according to rate distortion criteria
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/154—Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/80—Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
- H04N19/82—Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/85—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/85—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
- H04N19/86—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
Description
1. ピクセル分類。
2. エンコーダのみ:フィルタパラメータ(例えば、DBF、SAO、ALFだがBFでない)の決定。
3. 符号化/復号化フィルタパラメータ(例えば、DBF、SAO、ALFだがBFでない)。
4. クラス依存フィルタリング。
off(c)=diff(c)/N(c) (式1)
及びΣxは、現在のブロックの全てのサンプル「x」に対する和を示す。
filter_luma_flag、filter_chroma_flagは、それぞれ、ルーマ又はクロマサンプルブロックが(NNフィルタを用いて)補正されるか否かを指定する。
idx_filter_off_val_luma[k]は、結合されるべきK個のNN出力を推論するために使用されるべきNNのK個のインデックス{ki}i=0,1を導出することを可能にする。例えば、ki=idx_filter_off_val_luma[i]である。
一実施形態では、kiの値は、ki+1≧kiとなるように、コーディング前に(例えば、昇順に)順序付けられる。ki+1=kiの場合を可能にすることにより、実際に使用されるNNフィルタの数(cpt_scale_off)がK個未満のNNフィルタであり、結果的にK個未満のスケーリングパラメータが符号化される場合に対処することが可能になる。変数cpt_scale_offは、非0スケーリングパラメータオフセットkの数に対応する。
一例では、識別子は、いくつのNNが結合されるかを示す。例えば、K=2の場合、k0=k1の場合は、1つの単一のNNのみが使用され(相互結合なし)、かつ1つのスケーリングパラメータのみがコーディングされる場合を管理することを可能にする。
変形例では、K個のインデックス{ki}i=0,1は以下のように導出される。
別の変形例では、N個の可能なインデックスは、各ブロックについてNNパラメータ(nn_filter())をコーディングする前に更新されるテーブルに順序付けられる。更新は、最も可能性の高いインデックス(例えば、前にコーディングされた左ブロック及び上ブロックによって使用されたインデックス)をリストの上部に移動することによって行われる。このようにして、古いコーディングされたインデックスはゆっくりとリストの下部に行くが、最近使用されたインデックスはリストの上部にある。コーディングされた値(idx_filter_off_val_luma[i])は、予測なしの(pred_idx_filter[i]=0)、このリスト内のフィルタに対応するインデックス(フィルタインデックス自体ではない)を表す。
scale_off_diff_abs[i]は、スケーリングパラメータ値オフセットiを以下のように導出することを可能にする。
idx_filter_off_val_chromaは、結合されるべきK個のNN出力を推論するために使用されるべきNNのインデックスkCを導出することを可能にする。例えば、kC=idx_filter_off_val_chromaである。実際、表2の例では、クロマ成分cIdx=1及びcIdx=2のフィルタインデックスは同一である。
補正のモデル:
-線形補正モデル。パラメータは{オフセットk,バイアス}である
-加法補正モデル:
1) 段階1:メインデータセットMDをk個のデータセットDb(b=1,...,k)に分割する。
2) k個のNNフィルタを別々にトレーニングする。
3) 段階2:k個のデータセットDb(b=1,...,k)を次のように再生成する:MD内の各データ「I」について、損失を最小化するNNフィルタ「t」を選択し、Dtに「i」を付加する。次に、k個のフィルタをDb(b=1,...,k)で再トレーニングする。
4) 3)を繰り返す。
1) 段階1:メインデータセットMDをk個のデータセットDb(b=1,...,k)に分割する。
2) k個のNNフィルタを別々にトレーニングする。
3) 段階2:
○ MD内の各データ「i」について:
● 「i」のデータセット候補のリストをC(i)={0,...(k-1)}に初期化する
● 各フィルタbで得られた損失Lb(i)を計算する。
● 「i」は「配置されていない」とマークされる
○ MD内の各データ「i」について:
○ (データ「i」が1つのデータセット内に配置されていないとマークされる)間は、
● t=argmink{Lk(i)} (k=tは、k∈C(i)でLk(i)を最小化するフィルタである)
● カード{Dt<N}の場合、Dtにデータ「i」を付加する
● そうではなく、Dt内の1つのデータ「d」が損失Lt(d)>Lt(i)を有する場合、Dt内で「d」を「i」に置き換え、「d」は「配置されていない」になり(そのようにマークされ)、「i」は「配置されている」とマークされる
● そうでない場合、リストC(i)から「t」を削除する
4) k個のフィルタをDb(b=1,...,k)で再トレーニングする。
5) 3)を繰り返す。
Claims (38)
- 方法であって、
ピクチャの領域の再構成されたサンプルのバージョンにアクセスすることと、
ニューラルネットワークを使用して、前記領域の前記再構成されたサンプルのバージョンに基づいて前記領域内の複数のサンプルのうちのそれぞれのサンプルについて重みを生成することと、
前記領域について前記ニューラルネットワークに対応する単一オフセットパラメータを符号化又は復号化することと、
前記領域内の前記複数のサンプルを調整することによって前記領域をフィルタリングすることであって、前記領域内のサンプルが、前記サンプルについての重み及び前記領域についての前記オフセットに応答して調整される、フィルタリングすることと、を含む、方法。 - 重みが、前記領域内の各サンプルについて生成される、請求項1に記載の方法。
- 前記領域の前記再構成されたサンプルのバージョンが、前記領域の予測及び前記領域の予測残差に基づく、請求項1又は2に記載の方法。
- 前記単一オフセットが、符号化される前に量子化される、請求項1~3のいずれか一項に記載の方法。
- 前記領域について符号化されるべきサンプルと前記領域について前記再構成されたサンプルのバージョンとの重み付け平均差に応答して前記オフセットを取得すること、
を更に含む、請求項1~4のいずれか一項に記載の方法。 - 前記領域を前記フィルタリングすることが、
前記サンプルについての前記重みによって前記領域についての前記オフセットをスケーリングすることであって、前記スケーリングされたオフセットが、前記サンプルを調整するために前記サンプルに加算される、スケーリングすることを含む、請求項1~5のいずれか一項に記載の方法。 - 前記重みが、前記領域の量子化パラメータ、前記ピクチャのピクチャタイプ、前記領域の分類のうちの少なくとも1つに更に応答して生成される、請求項1~6のいずれか一項に記載の方法。
- 複数のニューラルネットワークが使用される、請求項1~7のいずれか一項に記載の方法。
- 前記領域をフィルタリングするために前記複数のニューラルネットワークのネットワークを選択することを更に含む、請求項8に記載の方法。
- 前記複数のニューラルネットワークのうちの各ネットワークが、前記領域の分類に対応する、請求項8又は9に記載の方法。
- 前記複数のニューラルネットワークが、1つの単一オフセットパラメータを共有する、請求項8~10のいずれか一項に記載の方法。
- 別個のオフセットパラメータが、前記複数のニューラルネットワークのうちの各ネットワークに関連付けられる、請求項8~10のいずれか一項に記載の方法。
- 別のニューラルネットワークを使用して、前記領域の前記再構成されたサンプルのバージョンに基づいて前記領域内の前記複数のサンプルのうちの前記それぞれのサンプルについて別の重みを生成することと、
前記領域について前記別のニューラルネットワークに対応する別の単一オフセットパラメータを符号化又は復号化することと、を更に含み、
前記領域内の前記サンプルが、前記サンプルについての前記別の重み及び前記領域についての前記別のオフセットに更に応答して調整される、
請求項1~12のいずれか一項に記載の方法。 - 重み付けされた和が、前記サンプルをフィルタリングするために前記領域内の前記サンプルに加算され、前記オフセットが、前記サンプルについての前記重みによって重み付けされ、前記別のオフセットが、前記別の重みによって重み付けされて、前記重み付けされた和を形成する、請求項13に記載の方法。
- 前記ニューラルネットワーク及び前記別のニューラルネットワークが、複数のニューラルネットワークから選択される、請求項13又は14に記載の方法。
- 前記ニューラルネットワークを示すインデックス及び前記別のニューラルネットワークを示す別のインデックスが、ビットストリーム中でシグナリングされる、請求項15に記載の方法。
- 前記オフセットが、前記別のオフセットとは異なり、前記ニューラルネットワークが、前記別のニューラルネットワークと同じである、請求項13~15のいずれか一項に記載の方法。
- 前記領域が、コーディングツリーブロック、コーディングブロック、又はコーディングブロックの分割である、請求項1~17のいずれか一項に記載の方法。
- 装置であって、1つ以上のプロセッサを備え、前記1つ以上のプロセッサが、
ピクチャの領域の再構成されたサンプルのバージョンにアクセスすることと、
ニューラルネットワークを使用して、前記領域の前記再構成されたサンプルのバージョンに基づいて前記領域内の複数のサンプルのうちのそれぞれのサンプルについて重みを生成することと、
前記領域について単一オフセットパラメータを符号化又は復号化することと、
前記領域内の前記複数のサンプルを調整することによって前記領域をフィルタリングすることであって、前記領域内のサンプルが、前記サンプルについての重み及び前記領域についての前記オフセットに応答して調整される、フィルタリングすることと、を行うように構成されている、装置。 - 重みが、前記領域内の各サンプルについて生成される、請求項19に記載の装置。
- 前記領域の前記再構成されたサンプルのバージョンが、前記領域の予測及び前記領域の予測残差に基づく、請求項19又は20に記載の装置。
- 前記単一オフセットが、符号化される前に量子化される、請求項19~21のいずれか一項に記載の装置。
- 前記1つ以上のプロセッサが、
前記領域について符号化されるべきサンプルと前記領域について前記再構成されたサンプルのバージョンとの重み付け平均差に応答して前記オフセットを取得するように更に構成されている、請求項19~22のいずれか一項に記載の装置。 - 前記1つ以上のプロセッサが、
前記サンプルについての前記重みによって前記領域についての前記オフセットをスケーリングすることであって、前記スケーリングされたオフセットが、前記サンプルを調整するために前記サンプルに加算される、スケーリングすることによって、前記サンプルをフィルタリングするように構成されている、請求項19~23のいずれか一項に記載の装置。 - 前記重みが、前記領域の量子化パラメータ、前記ピクチャのピクチャタイプ、前記領域の分類のうちの少なくとも1つに更に応答して生成される、請求項19~24のいずれか一項に記載の装置。
- 複数のニューラルネットワークが使用される、請求項19~25のいずれか一項に記載の装置。
- 前記領域をフィルタリングするために前記複数のニューラルネットワークのネットワークを選択することを更に含む、請求項26に記載の装置。
- 前記複数のニューラルネットワークのうちの各ネットワークが、前記領域の分類に対応する、請求項26又は27に記載の装置。
- 前記複数のニューラルネットワークが、1つの単一オフセットパラメータを共有する、請求項26~28のいずれか一項に記載の装置。
- 別個のオフセットパラメータが、前記複数のニューラルネットワークのうちの各ネットワークに関連付けられる、請求項26~28のいずれか一項に記載の装置。
- 前記1つ以上のプロセッサが、
別のニューラルネットワークを使用して、前記領域の前記再構成されたサンプルのバージョンに基づいて前記領域内の前記複数のサンプルのうちの前記それぞれのサンプルについて別の重みを生成することと、
前記領域について前記別のニューラルネットワークに対応する別の単一オフセットパラメータを符号化又は復号化することと、を行うように更に構成されており、
前記領域内の前記サンプルが、前記サンプルについての前記別の重み及び前記領域についての前記別のオフセットに更に応答して調整される、請求項19~30のいずれか一項に記載の装置。 - 重み付けされた和が、前記サンプルをフィルタリングするために前記領域内の前記サンプルに加算され、前記オフセットが、前記サンプルについての前記重みによって重み付けされ、前記別のオフセットが、前記別の重みによって重み付けされて、前記重み付けされた和を形成する、請求項31に記載の装置。
- 前記ニューラルネットワーク及び前記別のニューラルネットワークが、複数のニューラルネットワークから選択される、請求項31又は32に記載の装置。
- 前記ニューラルネットワークを示すインデックス及び前記別のニューラルネットワークを示す別のインデックスが、ビットストリーム中でシグナリングされる、請求項33に記載の装置。
- 前記オフセットが、前記別のオフセットとは異なり、前記ニューラルネットワークが、前記別のニューラルネットワークと同じである、請求項31~33のいずれか一項に記載の装置。
- 前記領域が、コーディングツリーブロック、コーディングブロック、又はコーディングブロックの分割である、請求項19~35のいずれか一項に記載の装置。
- 請求項1~18のいずれか一項に記載の方法を実行することによって形成される、ビットストリームを含む信号。
- 請求項1~18のいずれか一項に記載の方法に従って、ビデオを符号化又は復号化するための命令を記憶したコンピュータ可読記憶媒体。
Applications Claiming Priority (9)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP20305591.8 | 2020-06-04 | ||
EP20305591 | 2020-06-04 | ||
EP20306417 | 2020-11-20 | ||
EP20306417.5 | 2020-11-20 | ||
EP20306628.7 | 2020-12-21 | ||
EP20306628 | 2020-12-21 | ||
EP21305444.8 | 2021-04-07 | ||
EP21305444 | 2021-04-07 | ||
PCT/EP2021/063771 WO2021244884A1 (en) | 2020-06-04 | 2021-05-24 | Neural network based filter in video coding |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023528780A true JP2023528780A (ja) | 2023-07-06 |
Family
ID=76059905
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022572477A Pending JP2023528780A (ja) | 2020-06-04 | 2021-05-24 | ビデオコーディングにおけるニューラルネットワークベースのフィルタ |
Country Status (5)
Country | Link |
---|---|
US (1) | US20230188713A1 (ja) |
EP (1) | EP4162680A1 (ja) |
JP (1) | JP2023528780A (ja) |
CN (1) | CN115943629A (ja) |
WO (1) | WO2021244884A1 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20220337824A1 (en) * | 2021-04-07 | 2022-10-20 | Beijing Dajia Internet Information Technology Co., Ltd. | System and method for applying neural network based sample adaptive offset for video coding |
CN116366841A (zh) * | 2021-12-28 | 2023-06-30 | 维沃移动通信有限公司 | 环路滤波方法及终端 |
CN118525512A (zh) * | 2022-01-04 | 2024-08-20 | 瑞典爱立信有限公司 | 用于图像编码和解码的滤波 |
WO2023156365A1 (en) * | 2022-02-15 | 2023-08-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoder, decoder and methods for coding a picture using a soft classification |
WO2024019343A1 (ko) * | 2022-07-20 | 2024-01-25 | 현대자동차주식회사 | 다양한 잡음 및 특성에 적응적인 비디오 인루프 필터 |
WO2024025280A1 (en) * | 2022-07-27 | 2024-02-01 | Samsung Electronics Co., Ltd. | Method and system for content-based scaling for artificial intelligence based in-loop filters |
WO2024164963A1 (en) * | 2023-02-08 | 2024-08-15 | Mediatek Inc. | Method and apparatus for improving performance of neural network filter based video coding |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7591630B2 (en) * | 2003-08-29 | 2009-09-22 | Casepick Systems, Llc | Materials-handling system using autonomous transfer and transport vehicles |
KR102539009B1 (ko) * | 2015-06-08 | 2023-05-31 | 브이아이디 스케일, 인크. | 스크린 콘텐츠 코딩을 위한 인트라 블록 카피 모드 |
WO2017036370A1 (en) * | 2015-09-03 | 2017-03-09 | Mediatek Inc. | Method and apparatus of neural network based processing in video coding |
KR101974261B1 (ko) * | 2016-06-24 | 2019-04-30 | 한국과학기술원 | Cnn 기반 인루프 필터를 포함하는 부호화 방법과 장치 및 복호화 방법과 장치 |
EP3451293A1 (en) * | 2017-08-28 | 2019-03-06 | Thomson Licensing | Method and apparatus for filtering with multi-branch deep learning |
EP3685577A4 (en) * | 2017-10-12 | 2021-07-28 | MediaTek Inc. | METHOD AND DEVICE OF A NEURAL NETWORK FOR VIDEO ENCODING |
CN110401836B (zh) * | 2018-04-25 | 2022-04-26 | 杭州海康威视数字技术股份有限公司 | 一种图像解码、编码方法、装置及其设备 |
KR102634068B1 (ko) * | 2018-08-24 | 2024-02-05 | 지티이 코포레이션 | 시각 미디어 인코딩 및 디코딩을 위한 평면 예측 모드 |
US10311334B1 (en) * | 2018-12-07 | 2019-06-04 | Capital One Services, Llc | Learning to process images depicting faces without leveraging sensitive attributes in deep learning models |
WO2020257629A1 (en) * | 2019-06-19 | 2020-12-24 | Beijing Dajia Internet Information Technology Co., Ltd. | Methods and apparatus for prediction refinement with optical flow |
EP4022902A4 (en) * | 2019-09-25 | 2022-11-23 | Huawei Technologies Co., Ltd. | TRIANGULAR FUSION MODE HARMONIZATION WITH WEIGHTED PREDICTION |
CN113225565A (zh) * | 2020-02-04 | 2021-08-06 | 苹果公司 | 多阶段块编码 |
-
2021
- 2021-05-24 EP EP21727169.1A patent/EP4162680A1/en active Pending
- 2021-05-24 US US17/925,479 patent/US20230188713A1/en active Pending
- 2021-05-24 WO PCT/EP2021/063771 patent/WO2021244884A1/en active Application Filing
- 2021-05-24 JP JP2022572477A patent/JP2023528780A/ja active Pending
- 2021-05-24 CN CN202180042531.5A patent/CN115943629A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
WO2021244884A1 (en) | 2021-12-09 |
CN115943629A (zh) | 2023-04-07 |
US20230188713A1 (en) | 2023-06-15 |
EP4162680A1 (en) | 2023-04-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7425241B2 (ja) | 双方向オプティカルフローに基づく映像符号化及び復号化 | |
JP2023528780A (ja) | ビデオコーディングにおけるニューラルネットワークベースのフィルタ | |
EP3861740B1 (en) | Generalized bi-prediction and weighted prediction | |
EP3706046A1 (en) | Method and device for picture encoding and decoding | |
CN112771874B (zh) | 用于画面编码和解码的方法和设备 | |
CN112913244A (zh) | 使用用于重叠块运动补偿的块扩展的视频编码或解码 | |
CN114631311A (zh) | 将同质语法与编码工具一起使用的方法和装置 | |
JP2023500503A (ja) | 符号化及び復号化方法並びに装置 | |
US20230156232A1 (en) | Adaptive application of generalized sample offset | |
US20230156185A1 (en) | Generalized sample offset | |
US11973964B2 (en) | Video compression based on long range end-to-end deep learning | |
CN116888963A (zh) | 广义样本偏移的自适应应用 | |
US20240031611A1 (en) | Deep prediction refinement | |
EP3675500A1 (en) | Quantization parameter prediction in video encoding and decoding | |
JP2022541723A (ja) | アフィン及びsbtmvp動きベクトル予測モードのためのhmvc | |
KR20210124241A (ko) | 조명 보상을 이용한 픽처 인코딩 및 디코딩을 위한 방법 및 디바이스 | |
CN114026857A (zh) | 用于视频编码和解码的单索引量化矩阵设计 | |
US12126799B2 (en) | Method and device for picture encoding and decoding | |
US12034978B2 (en) | Lower-complexity sample offset filter | |
US20240155148A1 (en) | Motion flow coding for deep learning based yuv video compression | |
WO2024119821A1 (zh) | 视频数据处理方法、装置、存储介质、设备和程序产品 | |
EP3618443A1 (en) | Illumination compensation in video coding | |
WO2024002879A1 (en) | Reconstruction by blending prediction and residual | |
CN114270858A (zh) | 用于视频编码和解码的量化矩阵预测 | |
WO2020072397A1 (en) | Block size based motion vector coding in affine mode |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230127 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20230221 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20230327 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20231121 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240524 |