JP2023537823A - ビデオ処理方法、装置、機器、デコーダ、システム及び記憶媒体 - Google Patents
ビデオ処理方法、装置、機器、デコーダ、システム及び記憶媒体 Download PDFInfo
- Publication number
- JP2023537823A JP2023537823A JP2022581541A JP2022581541A JP2023537823A JP 2023537823 A JP2023537823 A JP 2023537823A JP 2022581541 A JP2022581541 A JP 2022581541A JP 2022581541 A JP2022581541 A JP 2022581541A JP 2023537823 A JP2023537823 A JP 2023537823A
- Authority
- JP
- Japan
- Prior art keywords
- video
- resolution
- network model
- video sequence
- sub
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 36
- 238000012545 processing Methods 0.000 claims description 107
- 238000000034 method Methods 0.000 claims description 62
- 238000007906 compression Methods 0.000 claims description 36
- 230000008569 process Effects 0.000 claims description 33
- 230000006870 function Effects 0.000 claims description 29
- 230000006835 compression Effects 0.000 claims description 21
- 238000012549 training Methods 0.000 claims description 21
- 230000004927 fusion Effects 0.000 claims description 18
- 230000007246 mechanism Effects 0.000 claims description 18
- 230000004913 activation Effects 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 12
- 230000002123 temporal effect Effects 0.000 claims description 11
- 238000000605 extraction Methods 0.000 claims description 10
- 238000013528 artificial neural network Methods 0.000 claims description 7
- 238000007781 pre-processing Methods 0.000 claims description 7
- 238000007499 fusion processing Methods 0.000 claims description 3
- 230000002708 enhancing effect Effects 0.000 claims description 2
- 230000003190 augmentative effect Effects 0.000 claims 1
- 238000004364 calculation method Methods 0.000 claims 1
- 239000003607 modifier Substances 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 20
- 238000012805 post-processing Methods 0.000 description 15
- 230000000694 effects Effects 0.000 description 14
- 238000013461 design Methods 0.000 description 10
- 230000009467 reduction Effects 0.000 description 8
- 230000005540 biological transmission Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 4
- 230000006872 improvement Effects 0.000 description 4
- 238000011176 pooling Methods 0.000 description 4
- 230000001360 synchronised effect Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000013480 data collection Methods 0.000 description 3
- 230000002787 reinforcement Effects 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000003213 activating effect Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000007907 direct compression Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000009191 jumping Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/85—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4053—Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4007—Scaling of whole images or parts thereof, e.g. expanding or contracting based on interpolation, e.g. bilinear interpolation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4046—Scaling of whole images or parts thereof, e.g. expanding or contracting using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/60—Image enhancement or restoration using machine learning, e.g. neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/70—Denoising; Smoothing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/10—Processing, recording or transmission of stereoscopic or multi-view image signals
- H04N13/106—Processing image signals
- H04N13/156—Mixing image signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
- H04N19/31—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the temporal domain
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10016—Video; Image sequence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Television Systems (AREA)
- Image Processing (AREA)
Abstract
Description
第1解像度のビデオ系列を取得することであって、前記ビデオ系列は、少なくとも1つのビデオフレームを含む、ことと、
前記ビデオ系列を超解像度ネットワークモデルに入力して、第2解像度のターゲットビデオ系列を得ることと、を含み、
ここで、前記超解像度ネットワークモデルは、少なくとも第1サブネットワークモデル及び第2サブネットワークモデルを含み、前記第1サブネットワークモデルは、前記ビデオ系列の解像度を向上させるために用いられ、前記第2サブネットワークモデルは、前記第1サブネットワークモデルの出力結果内の少なくとも1つのフレームの画質を向上させるために用いられる。
前記取得ユニットは、第1解像度のビデオ系列を取得するように構成され、前記ビデオ系列は、少なくとも1つのビデオフレームを含み、
前記処理ユニットは、前記ビデオ系列を超解像度ネットワークモデルに入力して、第2解像度のターゲットビデオ系列を得るように構成され、
ここで、前記超解像度ネットワークモデルは、少なくとも第1サブネットワークモデル及び第2サブネットワークモデルを含み、前記第1サブネットワークモデルは、前記ビデオ系列の解像度を向上させるために用いられ、前記第2サブネットワークモデルは、前記第1サブネットワークモデルの出力結果内の少なくとも1つのフレームの画質を向上させるために用いられる。
前記メモリは、プロセッサで実行可能なコンピュータプログラムを記憶するために用いられ、
前記プロセッサは、前記コンピュータプログラムが実行されるときに、第1態様に記載の方法を実行するために用いられる。
前記普通デコーダは、ビットストリームを解析して、第1解像度のビデオ系列を取得するために用いられ、
前記ビデオ処理装置は、前記ビデオ系列を超解像度ネットワークモデルに入力して、第2解像度のターゲットビデオ系列を得るように構成され、
ここで、前記超解像度ネットワークモデルは、少なくとも第1サブネットワークモデル及び第2サブネットワークモデルを含み、前記第1サブネットワークモデルは、前記ビデオ系列の解像度を調整するために用いられ、前記第2サブネットワークモデルは、前記第1サブネットワークモデルの出力結果内の少なくとも1つのフレームの画質を調整するために用いられる。
前記前処理装置は、第2解像度の入力ビデオ系列を受信した後、受信した入力ビデオ系列を前処理して、第1解像度のビデオ系列を得るように構成され、
前記普通エンコーダは、前記ビデオ系列に対してビデオ圧縮を行い、ビットストリームを生成し、前記ビットストリームを前記標準デコーダに伝送するように構成され、
前記普通デコーダは、前記ビットストリームを解析して、前記第1解像度のビデオ系列を取得するように構成され、
前記ビデオ処理装置は、前記ビデオ系列を超解像度ネットワークモデルに入力して、第2解像度のターゲットビデオ系列を得るように構成され、
ここで、前記超解像度ネットワークモデルは、少なくとも第1サブネットワークモデル及び第2サブネットワークモデルを含み、前記第1サブネットワークモデルは、前記ビデオ系列の解像度を向上させるために用いられ、前記第2サブネットワークモデルは、前記第1サブネットワークモデルの出力結果内の少なくとも1つのフレームの画質を向上させるために用いられる。
前記第1サブネットワークモデルによって、前記ビデオ系列に対して解像度向上処理を行い、第2解像度の初期ビデオ系列を得ることであって、ここで、前記第2解像度は、前記第1解像度より高い、ことと、
前記第2サブネットワークモデルによって、前記初期ビデオ系列内の少なくとも1つのフレームに対して品質強化処理を行い、前記ターゲットビデオ系列を得ることと、を含み得る。
前記第1サブネットワークモデルによって、前記ビデオ系列に対して解像度向上処理を行い、第2解像度の初期ビデオ系列を得ることであって、ここで、前記初期ビデオ系列は、前記少なくとも1つのビデオフレーム及び少なくとも1つの補間フレームを含む、ことと、
前記第2サブネットワークモデルによって、前記初期ビデオ系列内の少なくとも1つのフレームに対して品質強化処理を行い、前記ターゲットビデオ系列を得ることと、を含み得る。
前記第1サブネットワークモデルによって、前記ビデオ系列に対して解像度向上処理を行い、第2解像度の初期ビデオ系列を得ることであって、ここで、前記第2解像度は、前記第1解像度より高く、且つ前記初期ビデオ系列は、前記少なくとも1つのビデオフレーム及び少なくとも1つの補間フレームを含む、ことと、
前記第2サブネットワークモデルによって、前記初期ビデオ系列内の少なくとも1つのフレームに対して品質強化処理を行い、前記ターゲットビデオ系列を得ることと、を含み得る。
前記第3サブネットワークモデルによって、前記ターゲットビデオ系列内の補間フレームに対して品質強化処理を行い、ターゲット補間フレームを得ることと、
前記ターゲット補間フレームに基づいて、前記ターゲットビデオ系列を更新することと、を更に含み得る。
前記ビデオ系列に基づいて、少なくとも1つの次元の初期エピポーラ平面画像EPI画像集合を構築することであって、ここで、各次元の初期EPI画像集合は、1つの分岐モジュールに対応する、ことと、
前記少なくとも1つの次元の初期EPI画像集合を前記少なくとも1つの分岐モジュールに対応的に入力して、少なくとも1つのターゲットEPI画像集合を得ることと、
前記融合モジュールによって、前記少なくとも1つのターゲットEPI画像集合に対して融合処理を行い、前記初期ビデオ系列を得ることと、を含み得、
ここで、前記初期EPI画像集合内の各EPI画像の解像度は、第1解像度であり、前記ターゲットEPI画像集合内の各EPI画像の解像度は、第2解像度である。
前記ビデオ系列を並べ重ねることによって、立体ビデオ集合を形成することであって、ここで、前記立体ビデオ集合の次元は、水平解像度次元、垂直解像度次元、及びフレームレート次元を含む、ことと、
前記立体ビデオ集合の1つの次元に基づいて、前記立体ビデオ集合の前記1つの次元で前記立体ビデオ集合に対して少なくとも一回のスライス操作を行った後、少なくとも1つのEPI画像を抽出し、前記少なくとも1つのEPI画像から、前記立体ビデオ集合の前記1つの次元における初期EPI画像集合を構成することと、
前記立体ビデオ集合の少なくとも1つの次元に基づいて、前記少なくとも1つの次元の初期EPI画像集合を得ることと、を含み得る。
前記融合モジュールによって、前記少なくとも1つのターゲットEPI画像集合に対して加重平均処理を行い、前記初期ビデオ系列を得ることを含み得る。
前記立体ビデオ集合の1つの次元における初期EPI画像集合を対象にして、前記アップサンプリングモジュールによって、前記初期EPI画像集合に対して解像度を向上させ、第1EPI画像集合を得ることと、
前記畳み込み計算モジュールによって、前記第1EPI画像集合に対して畳み込み演算を行い、前記立体ビデオ集合の1つの次元におけるターゲットEPI画像集合を得ることと、を更に含み得る。
処理待ちの補間フレーム及び所定の1つ又は複数のビデオフレームを取得することと、
前記補間フレーム及び前記所定の1つ又は複数のビデオフレームを第3サブネットワークモデルに入力して、前記補間フレームに対応するターゲット補間フレームを得ることと、を含み得る。
前記ターゲットビデオ系列の再生順序に基づいて、処理待ちの補間フレームと、前記補間フレームに隣接する1つ前のビデオフレーム及び次のビデオフレームを取得することと、
前記補間フレーム、前記1つ前のビデオフレーム、及び前記次のビデオフレームを、前記第3サブネットワークモデルに入力して、前記補間フレームに対応するターゲット補間フレームを得ることと、を含み得る。
前記第1畳み込みモジュール及び前記アテンションメカニズムモジュールによって、前記補間フレーム及び前記所定の1つ又は複数のビデオフレームに対して特徴抽出を行い、特徴画像を得ることと、
前記第2畳み込みモジュールによって、前記特徴画像に対して畳み込み演算を行い、残差画像を得ることと、
前記加算モジュールによって、前記強化された補間フレームと前記残差画像とを重ね合わせて、前記補間フレームに対応するターゲット補間フレームを得ることと、を含み得る。
前記第1畳み込みモジュール及び前記アテンションメカニズムモジュールによって、前記補間フレーム、前記1つ前のビデオフレーム及び前記次のビデオフレームに対して特徴抽出を行い、特徴画像を得ることと、
前記第2畳み込みモジュールによって、前記特徴画像に対して畳み込み演算を行い、残差画像を得ることと、
前記加算モジュールによって、前記強化された補間フレームと前記残差画像とを重ね合わせて、前記ターゲット補間フレームを得ることと、を含み得る。
前記超解像度ネットワークモデルのモデルパラメータを決定することと、
決定されたモデルパラメータに基づいて、前記超解像度ネットワークモデルを構築することと、を更に含み得る。
訓練サンプルを取得することであって、ここで、前記訓練サンプルは、少なくとも第1解像度の複数のビデオフレーム及び第2解像度の複数のビデオフレームを含む、ことと、
前記訓練サンプルを利用して、ニューラルネットワークに基づく超解像度ネットワークモデルを訓練して、前記モデルパラメータを得ることと、を含み得る。
ビットストリームを解析することにより、前記モデルパラメータを取得することを含み得る。
取得ユニット1201は、第1解像度のビデオ系列を取得するように構成され、ここで、前記ビデオ系列は、少なくとも1つのビデオフレームを含み、
処理ユニット1202は、前記ビデオ系列を超解像度ネットワークモデルに入力して、第2解像度のターゲットビデオ系列を得るように構成され、
ここで、前記超解像度ネットワークモデルは、少なくとも第1サブネットワークモデル及び第2サブネットワークモデルを含み、前記第1サブネットワークモデルは、前記ビデオ系列の解像度を向上させるために用いられ、前記第2サブネットワークモデルは、前記第1サブネットワークモデルの出力結果内の少なくとも1つのフレームの画質を向上させるために用いられる。
処理ユニット1202はさらに、前記第3サブネットワークモデルによって、前記ターゲットビデオ系列内の補間フレームに対して品質強化処理を行い、ターゲット補間フレームを得、前記ターゲット補間フレームに基づいて、前記ターゲットビデオ系列を更新するように構成される。
処理ユニット1202はさらに、前記ビデオ系列に基づいて、少なくとも1つの次元の初期エピポーラ平面画像EPI画像集合を構築し、各次元の初期EPI画像集合は、1つの分岐モジュールに対応し、前記少なくとも1つの次元の初期EPI画像集合を前記少なくとも1つの分岐モジュールに対応的に入力して、少なくとも1つのターゲットEPI画像集合を得、前記融合モジュールによって、前記少なくとも1つのターゲットEPI画像集合に対して融合処理を行い、前記初期ビデオ系列を得るように構成され、前記初期EPI画像集合内の各EPI画像の解像度は、第1解像度であり、前記ターゲットEPI画像集合内の各EPI画像の解像度は、第2解像度である。
処理ユニット1202はさらに、前記立体ビデオ集合の1つの次元における初期EPI画像集合を対象にして、前記アップサンプリングモジュールによって、前記初期EPI画像集合に対して解像度を向上させ、第1EPI画像集合を得、前記畳み込み計算モジュールによって、前記第1EPI画像集合に対して畳み込み演算を行い、前記立体ビデオ集合の1つの次元におけるターゲットEPI画像集合を得るように構成される。
処理ユニット1202はさらに、前記補間フレーム及び前記所定の1つ又は複数のビデオフレームを第3サブネットワークモデルに入力して、前記補間フレームに対応するターゲット補間フレームを得るように構成される。
取得ユニット1201はさらに、前記ターゲットビデオ系列の再生順序に基づいて、処理待ちの補間フレームと、前記補間フレームに隣接する1つ前のビデオフレーム及び次のビデオフレームを取得するように構成され、
処理ユニット1202はさらに、前記補間フレーム、前記1つ前のビデオフレーム、及び前記次のビデオフレームを、前記第3サブネットワークモデルに入力して、前記補間フレームに対応するターゲット補間フレームを得るように構成される。
処理ユニット1202はさらに、前記第1畳み込みモジュール及び前記アテンションメカニズムモジュールによって、前記補間フレーム及び前記所定の1つ又は複数のビデオフレームに対して特徴抽出を行い、特徴画像を得、前記第2畳み込みモジュールによって、前記特徴画像に対して畳み込み演算を行い、残差画像を得、前記加算モジュールによって、前記強化された補間フレームと前記残差画像とを重ね合わせて、前記補間フレームに対応するターゲット補間フレームを得るように構成される。
処理ユニット1202はさらに、前記訓練サンプルを利用して、ニューラルネットワークに基づく超解像度ネットワークモデルを訓練して、前記モデルパラメータを得るように構成される。
第1解像度のビデオ系列を取得することであって、前記ビデオ系列は、少なくとも1つのビデオフレームを含む、ことと、
前記ビデオ系列を超解像度ネットワークモデルに入力して、第2解像度のターゲットビデオ系列を得ることと、を実行し、
ここで、前記超解像度ネットワークモデルは、少なくとも第1サブネットワークモデル及び第2サブネットワークモデルを含み、前記第1サブネットワークモデルは、前記ビデオ系列の解像度を向上させるために用いられ、前記第2サブネットワークモデルは、前記第1サブネットワークモデルの出力結果内の少なくとも1つのフレームの画質を向上させるために用いられる。
ビデオ処理装置120は、前記ビデオ系列を超解像度ネットワークモデルに入力して、第2解像度のターゲットビデオ系列を得るように構成され、
ここで、前記超解像度ネットワークモデルは、少なくとも第1サブネットワークモデル及び第2サブネットワークモデルを含み、前記第1サブネットワークモデルは、前記ビデオ系列の解像度を調整するために用いられ、前記第2サブネットワークモデルは、前記第1サブネットワークモデルの出力結果内の少なくとも1つのフレームの画質を調整するために用いられる。
ビデオ処理装置120はさらに、前記第1指示フラグビットに基づいて、前記第1サブネットワークモデルによって、前記ビデオ系列に対して解像度向上処理を行い、第2解像度の初期ビデオ系列を得るように構成され、前記第2解像度は、前記第1解像度より高い。
ビデオ処理装置120はさらに、前記第2指示フラグビットに基づいて、前記第1サブネットワークモデルによって、前記ビデオ系列に対して解像度向上処理を行い、第2解像度の初期ビデオ系列を得るように構成され、前記初期ビデオ系列は、前記少なくとも1つのビデオフレーム及び少なくとも1つの補間フレームを含む。
ビデオ処理装置120はさらに、前記第3指示フラグビットに基づいて、前記第2サブネットワークモデルによって、前記初期ビデオ系列内の少なくとも1つのフレームに対して品質強化処理を行い、前記ターゲットビデオ系列を得るように構成される。
ビデオ処理装置120はさらに、前記モデルパラメータに基づいて、前記超解像度ネットワークモデルを構築するように構成される。
普通エンコーダ1612は、前記ビデオ系列に対してビデオ圧縮を行い、ビットストリームを生成し、前記ビットストリームを前記標準デコーダに伝送するように構成され、
普通デコーダ1501は、前記ビットストリームを解析して、前記第1解像度のビデオ系列を取得するように構成される。
ここで、前記超解像度ネットワークモデルは、少なくとも第1サブネットワークモデル及び第2サブネットワークモデルを含み、前記第1サブネットワークモデルは、前記ビデオ系列の解像度を向上させるために用いられ、前記第2サブネットワークモデルは、前記第1サブネットワークモデルの出力結果内の少なくとも1つのフレームの画質を向上させるために用いられる。
普通エンコーダ1612はさらに、前記第1指示フラグビットをビットストリームに書き込むように構成される。
普通エンコーダ1612はさらに、前記第2指示フラグビットをビットストリームに書き込むように構成される。
普通エンコーダ1612はさらに、前記モデルパラメータをビットストリームに書き込むように構成される。
ビデオ処理装置120はさらに、前記第1指示フラグビットに基づいて、前記第1サブネットワークモデルによって、前記ビデオ系列に対して解像度向上処理を行い、第2解像度の初期ビデオ系列を得るように構成され、前記第2解像度は、前記第1解像度より高い。
ビデオ処理装置120はさらに、前記第2指示フラグビットに基づいて、前記第1サブネットワークモデルによって、前記ビデオ系列に対して解像度向上処理を行い、第2解像度の初期ビデオ系列を得るように構成され、前記初期ビデオ系列は、前記少なくとも1つのビデオフレーム及び少なくとも1つの補間フレームを含む。
ビデオ処理装置120はさらに、前記第3指示フラグビットに基づいて、前記第2サブネットワークモデルによって、前記初期ビデオ系列内の少なくとも1つのフレームに対して品質強化処理を行い、前記ターゲットビデオ系列を得るように構成される。
ビデオ処理装置120はさらに、前記モデルパラメータに基づいて、前記超解像度ネットワークモデルを構築するように構成される。
Claims (35)
- ビデオ機器に適用されるビデオ処理方法であって、
第1解像度のビデオ系列を取得することであって、前記ビデオ系列は、少なくとも1つのビデオフレームを含む、ことと、
前記ビデオ系列を超解像度ネットワークモデルに入力して、第2解像度のターゲットビデオ系列を得ることと、を含み、
前記超解像度ネットワークモデルは、少なくとも第1サブネットワークモデル及び第2サブネットワークモデルを含み、前記第1サブネットワークモデルは、前記ビデオ系列の解像度を向上させるために用いられ、前記第2サブネットワークモデルは、前記第1サブネットワークモデルの出力結果内の少なくとも1つのフレームの画質を向上させるために用いられる、ビデオ処理方法。 - 前記ビデオ系列の解像度は、前記ビデオ系列の空間解像度と前記ビデオ系列の時間解像度のうちの少なくとも1つを含む、
請求項1に記載のビデオ処理方法。 - 前記ビデオ系列を超解像度ネットワークモデルに入力して、第2解像度のターゲットビデオ系列を得ることは、
前記第1サブネットワークモデルによって、前記ビデオ系列に対して解像度向上処理を行い、第2解像度の初期ビデオ系列を得ることであって、前記第2解像度は、前記第1解像度より高い、ことと、
前記第2サブネットワークモデルによって、前記初期ビデオ系列内の少なくとも1つのフレームに対して品質強化処理を行い、前記ターゲットビデオ系列を得ることと、を含む、
請求項1に記載のビデオ処理方法。 - 前記ビデオ系列を超解像度ネットワークモデルに入力して、第2解像度のターゲットビデオ系列を得ることは、
前記第1サブネットワークモデルによって、前記ビデオ系列に対して解像度向上処理を行い、第2解像度の初期ビデオ系列を得ることであって、前記初期ビデオ系列は、前記少なくとも1つのビデオフレーム及び少なくとも1つの補間フレームを含む、ことと、
前記第2サブネットワークモデルによって、前記初期ビデオ系列内の少なくとも1つのフレームに対して品質強化処理を行い、前記ターゲットビデオ系列を得ることと、を含む、
請求項1に記載のビデオ処理方法。 - 前記第1サブネットワークモデルは、分岐融合超解像度ネットワークモデルであり、前記第2サブネットワークモデルは、品質強化ネットワークモデルである、
請求項1に記載のビデオ処理方法。 - 前記第2サブネットワークモデルはさらに、第3サブネットワークモデルを含み、前記ビデオ処理方法は、
前記第3サブネットワークモデルによって、前記ターゲットビデオ系列内の補間フレームに対して品質強化処理を行い、ターゲット補間フレームを得ることと、
前記ターゲット補間フレームに基づいて、前記ターゲットビデオ系列を更新することと、を更に含む、
請求項4に記載のビデオ処理方法。 - 前記第3サブネットワークモデルは、補間フレーム強化ネットワークモデルである、
請求項6に記載のビデオ処理方法。 - 前記第1サブネットワークモデルは、少なくとも1つの分岐モジュール及び1つの融合モジュールを含み、
前記第1サブネットワークモデルによって、前記ビデオ系列を処理して、第2解像度の初期ビデオ系列を得ることは、
前記ビデオ系列に基づいて、少なくとも1つの次元の初期エピポーラ平面画像(EPI)画像集合を構築することであって、各次元の初期EPI画像集合は、1つの分岐モジュールに対応する、ことと、
前記少なくとも1つの次元の初期EPI画像集合を前記少なくとも1つの分岐モジュールに対応的に入力して、少なくとも1つのターゲットEPI画像集合を得ることと、
前記融合モジュールによって、前記少なくとも1つのターゲットEPI画像集合に対して融合処理を行い、前記初期ビデオ系列を得ることと、を含み、
前記初期EPI画像集合内の各EPI画像の解像度は、第1解像度であり、前記ターゲットEPI画像集合内の各EPI画像の解像度は、第2解像度である、
請求項3に記載のビデオ処理方法。 - 前記ビデオ系列に基づいて、少なくとも1つの次元の初期EPI画像集合を構築することは、
前記ビデオ系列を並べ重ねることによって、立体ビデオ集合を形成することであって、前記立体ビデオ集合の次元は、水平解像度次元、垂直解像度次元、及びフレームレート次元を含む、ことと、
前記立体ビデオ集合の1つの次元に基づいて、前記立体ビデオ集合の前記1つの次元で前記立体ビデオ集合に対して少なくとも一回のスライス操作を行った後、少なくとも1つのEPI画像を抽出し、前記少なくとも1つのEPI画像から、前記立体ビデオ集合の前記1つの次元における初期EPI画像集合を構成することと、
前記立体ビデオ集合の少なくとも1つの次元に基づいて、前記少なくとも1つの次元の初期EPI画像集合を得ることと、を含む、
請求項8に記載のビデオ処理方法。 - 前記分岐モジュールは、アップサンプリングモジュール及び畳み込み計算モジュールを含み、前記ビデオ処理方法は、
前記立体ビデオ集合の1つの次元における初期EPI画像集合を対象にして、前記アップサンプリングモジュールによって、前記初期EPI画像集合に対して解像度を向上させ、第1EPI画像集合を得ることと、
前記畳み込み計算モジュールによって、前記第1EPI画像集合に対して畳み込み演算を行い、前記立体ビデオ集合の1つの次元におけるターゲットEPI画像集合を得ることと、を更に含む、
請求項8に記載のビデオ処理方法。 - 前記融合モジュールによって、前記少なくとも1つのターゲットEPI画像集合に対して融合処理を行い、前記初期ビデオ系列を得ることは、
前記融合モジュールによって、前記少なくとも1つのターゲットEPI画像集合に対して加重平均処理を行い、前記初期ビデオ系列を得ることを含む、
請求項8に記載のビデオ処理方法。 - 前記第3サブネットワークモデルによって、前記ターゲットビデオ系列内の補間フレームに対して品質強化処理を行い、ターゲット補間フレームを得ることは、
処理待ちの補間フレーム及び所定の1つ又は複数のビデオフレームを取得することと、
前記補間フレーム及び前記所定の1つ又は複数のビデオフレームを第3サブネットワークモデルに入力して、前記補間フレームに対応するターゲット補間フレームを得ることと、を含む、
請求項6に記載のビデオ処理方法。 - 前記所定の1つ又は複数のビデオフレームは、隣接する2つのビデオフレームを含み、前記第3サブネットワークモデルによって、前記ターゲットビデオ系列内の補間フレームに対して品質強化処理を行い、ターゲット補間フレームを得ることは、
前記ターゲットビデオ系列の再生順序に基づいて、処理待ちの補間フレームと、前記補間フレームに隣接する1つ前のビデオフレーム及び次のビデオフレームを取得することと、
前記補間フレーム、前記1つ前のビデオフレーム、及び前記次のビデオフレームを、前記第3サブネットワークモデルに入力して、前記補間フレームに対応するターゲット補間フレームを得ることと、を含む、
請求項12に記載のビデオ処理方法。 - 前記第3サブネットワークモデルは、第1畳み込みモジュール、アテンションメカニズムモジュール、第2畳み込みモジュール、及び加算モジュールを含み、且つ前記第1畳み込みモジュールは、活性化関数を含み、前記第2畳み込みモジュールは、活性化関数を含まない、
請求項12に記載のビデオ処理方法。 - 前記第1畳み込みモジュールの数は、1つ又は複数であり、前記アテンションメカニズムモジュールの数は、1つ又は複数であり、前記第2畳み込みモジュールの数は、1つであり、前記加算モジュールの数は、1つであり、
前記補間フレーム及び前記所定の1つ又は複数のビデオフレームを前記第3サブネットワークモデルに入力して、前記補間フレームに対応するターゲット補間フレームを得ることは、
前記第1畳み込みモジュール及び前記アテンションメカニズムモジュールによって、前記補間フレーム及び前記所定の1つ又は複数のビデオフレームに対して特徴抽出を行い、特徴画像を得ることと、
前記第2畳み込みモジュールによって、前記特徴画像に対して畳み込み演算を行い、残差画像を得ることと、
前記加算モジュールによって、前記強化された補間フレームと前記残差画像とを重ね合わせて、前記補間フレームに対応するターゲット補間フレームを得ることと、を含む、
請求項14に記載のビデオ処理方法。 - 前記ビデオ処理方法は、
前記超解像度ネットワークモデルのモデルパラメータを決定することと、
決定されたモデルパラメータに基づいて、前記超解像度ネットワークモデルを構築することと、を更に含む、
請求項1~15のいずれか一項に記載のビデオ処理方法。 - 前記超解像度ネットワークモデルのモデルパラメータを決定することは、
訓練サンプルを取得することであって、前記訓練サンプルは、少なくとも第1解像度の複数のビデオフレーム及び第2解像度の複数のビデオフレームを含む、ことと、
前記訓練サンプルを利用して、ニューラルネットワークに基づく超解像度ネットワークモデルを訓練して、前記モデルパラメータを得ることと、を含む、
請求項16に記載のビデオ処理方法。 - 前記超解像度ネットワークモデルのモデルパラメータを決定することは、
ビットストリームを解析することにより、前記モデルパラメータを取得することを含む、
請求項16に記載のビデオ処理方法。 - ビデオ機器に適用されるビデオ処理装置であって、前記ビデオ処理装置は、取得ユニットと、処理ユニットと、を備え、
前記取得ユニットは、第1解像度のビデオ系列を取得するように構成され、前記ビデオ系列は、少なくとも1つのビデオフレームを含み、
前記処理ユニットは、前記ビデオ系列を超解像度ネットワークモデルに入力して、第2解像度のターゲットビデオ系列を得るように構成され、
前記超解像度ネットワークモデルは、少なくとも第1サブネットワークモデル及び第2サブネットワークモデルを含み、前記第1サブネットワークモデルは、前記ビデオ系列の解像度を向上させるために用いられ、前記第2サブネットワークモデルは、前記第1サブネットワークモデルの出力結果内の少なくとも1つのフレームの画質を向上させるために用いられる、ビデオ処理装置。 - プロセッサで実行可能なコンピュータプログラムを記憶するメモリと、
前記コンピュータプログラムが実行されるときに、請求項1~18のいずれか一項に記載の方法を実行するプロセッサと、を備える、ビデオ機器。 - 第1プロセッサによって実行されるときに、請求項1~18のいずれか一項に記載の方法を実行するコンピュータプログラムを記憶した、コンピュータ記憶媒体。
- 普通デコーダと、ビデオ処理装置と、を備えるデコーダであって、
前記普通デコーダは、ビットストリームを解析して、第1解像度のビデオ系列を取得するために用いられ、
前記ビデオ処理装置は、前記ビデオ系列を超解像度ネットワークモデルに入力して、第2解像度のターゲットビデオ系列を得るように構成され、
前記超解像度ネットワークモデルは、少なくとも第1サブネットワークモデル及び第2サブネットワークモデルを含み、前記第1サブネットワークモデルは、前記ビデオ系列の解像度を調整するために用いられ、前記第2サブネットワークモデルは、前記第1サブネットワークモデルの出力結果内の少なくとも1つのフレームの画質を調整するために用いられる、デコーダ。 - 前記普通デコーダはさらに、ビットストリームを解析して、第1指示フラグビットを取得するように構成され、前記第1指示フラグビットは、前記第1解像度のビデオ系列が、前記超解像度ネットワークモデルによって前記ビデオ系列の空間解像度を向上させる必要があることを示すために用いられ、
前記ビデオ処理装置はさらに、前記第1指示フラグビットに基づいて、前記第1サブネットワークモデルによって、前記ビデオ系列に対して解像度向上処理を行い、第2解像度の初期ビデオ系列を得るように構成され、前記第2解像度は、前記第1解像度より高い、
請求項22に記載のデコーダ。 - 前記普通デコーダはさらに、ビットストリームを解析して、前記第2指示フラグビットを取得するように構成され、前記第2指示フラグビットは、前記第1解像度のビデオ系列が、前記超解像度ネットワークモデルによって前記ビデオ系列の時間解像度を向上させる必要があることを示すために用いられ、
前記ビデオ処理装置はさらに、前記第2指示フラグビットに基づいて、前記第1サブネットワークモデルによって、前記ビデオ系列に対して解像度向上処理を行い、第2解像度の初期ビデオ系列を得るように構成され、前記初期ビデオ系列は、前記少なくとも1つのビデオフレーム及び少なくとも1つの補間フレームを含む、
請求項22に記載のデコーダ。 - 前記普通デコーダはさらに、ビットストリームを解析して、前記第3指示フラグビットを取得するように構成され、前記第3指示フラグビットは、前記第1解像度のビデオ系列が、前記超解像度ネットワークモデルによって前記ビデオ系列の画質を向上させる必要があることを示すために用いられ、
前記ビデオ処理装置はさらに、前記第3指示フラグビットに基づいて、前記第2サブネットワークモデルによって、前記初期ビデオ系列内の少なくとも1つのフレームに対して品質強化処理を行い、前記ターゲットビデオ系列を得るように構成される、
請求項22に記載のデコーダ。 - 前記普通デコーダはさらに、ビットストリームを解析して、前記超解像度ネットワークモデルのモデルパラメータを取得するように構成され、
前記ビデオ処理装置はさらに、前記モデルパラメータに基づいて、前記超解像度ネットワークモデルを構築するように構成される、
請求項22に記載のデコーダ。 - エンコーダと、デコーダと、を備えるビデオシステムであって、前記エンコーダは、前処理装置と、普通エンコーダと、を備え、前記デコーダは、普通デコーダと、ビデオ処理装置と、を備え、
前記前処理装置は、第2解像度の入力ビデオ系列を受信した後、受信した入力ビデオ系列を前処理して、第1解像度のビデオ系列を得るように構成され、
前記普通エンコーダは、前記ビデオ系列に対してビデオ圧縮を行い、ビットストリームを生成し、前記ビットストリームを前記標準デコーダに伝送するように構成され、
前記普通デコーダは、前記ビットストリームを解析して、前記第1解像度のビデオ系列を取得するように構成され、
前記ビデオ処理装置は、前記ビデオ系列を超解像度ネットワークモデルに入力して、第2解像度のターゲットビデオ系列を得るように構成され、
前記超解像度ネットワークモデルは、少なくとも第1サブネットワークモデル及び第2サブネットワークモデルを含み、前記第1サブネットワークモデルは、前記ビデオ系列の解像度を向上させるために用いられ、前記第2サブネットワークモデルは、前記第1サブネットワークモデルの出力結果内の少なくとも1つのフレームの画質を向上させるために用いられる、ビデオシステム。 - 前記前処理装置は、受信した入力ビデオ系列に対してダウンサンプリング処理を行い、第1解像度のビデオ系列を得、第1指示フラグビットを設定するように構成され、前記第1指示フラグビットは、前記第1解像度のビデオ系列が、前記超解像度ネットワークモデルによって前記ビデオ系列の空間解像度を向上させる必要があることを示すために用いられ、
前記普通エンコーダはさらに、前記第1指示フラグビットをビットストリームに書き込むように構成される、
請求項27に記載のビデオシステム。 - 前記前処理装置は、受信した入力ビデオ系列に対してフレームレート調整処理を行い、第1解像度のビデオ系列を得、第2指示フラグビットを設定するように構成され、前記第2指示フラグビットは、前記第1解像度のビデオ系列が、前記超解像度ネットワークモデルによって前記ビデオ系列の時間解像度を向上させる必要があることを示すために用いられ、
前記普通エンコーダはさらに、前記第2指示フラグビットをビットストリームに書き込むように構成される、
請求項27に記載のビデオシステム。 - 前記普通エンコーダはさらに、前記ビデオ系列に対してビデオ圧縮を行った後、圧縮されたビデオ系列の画質が所定の画質基準を満たすか否かを判断し、第3指示フラグビットを設定し、前記第3指示フラグビットをビットストリームに書き込むように構成され、前記第3指示フラグビットは、前記第1解像度のビデオ系列が、前記超解像度ネットワークモデルによって前記ビデオ系列の画質を向上させる必要があることを示すために用いられる、
請求項27に記載のビデオシステム。 - 前記前処理装置はさらに、訓練サンプルを取得し、前記訓練サンプルを利用して、ニューラルネットワークに基づく超解像度ネットワークモデルを訓練して、前記超解像度ネットワークモデルのモデルパラメータを得るように構成され、前記訓練サンプルは、少なくとも第1解像度の複数のビデオフレーム及び第2解像度の複数のビデオフレームを含み、
前記普通エンコーダはさらに、前記モデルパラメータをビットストリームに書き込むように構成される、
請求項27に記載のビデオシステム。 - 前記普通デコーダはさらに、ビットストリームを解析して、前記第1指示フラグビットを取得するように構成され、
前記ビデオ処理装置はさらに、前記第1指示フラグビットに基づいて、前記第1サブネットワークモデルによって、前記ビデオ系列に対して解像度向上処理を行い、第2解像度の初期ビデオ系列を得るように構成され、前記第2解像度は、前記第1解像度より高い、
請求項27に記載のビデオシステム。 - 前記普通デコーダはさらに、ビットストリームを解析して、前記第2指示フラグビットを取得するように構成され、
前記ビデオ処理装置はさらに、前記第2指示フラグビットに基づいて、前記第1サブネットワークモデルによって、前記ビデオ系列に対して解像度向上処理を行い、第2解像度の初期ビデオ系列を得るように構成され、前記初期ビデオ系列は、前記少なくとも1つのビデオフレーム及び少なくとも1つの補間フレームを含む、
請求項27に記載のビデオシステム。 - 前記普通デコーダはさらに、ビットストリームを解析して、前記第3指示フラグビットを取得するように構成され、
前記ビデオ処理装置はさらに、前記第3指示フラグビットに基づいて、前記第2サブネットワークモデルによって、前記初期ビデオ系列内の少なくとも1つのフレームに対して品質強化処理を行い、前記ターゲットビデオ系列を得るように構成される、
請求項27に記載のビデオシステム。 - 前記普通デコーダはさらに、ビットストリームを解析して、前記超解像度ネットワークモデルのモデルパラメータを取得するように構成され、
前記ビデオ処理装置はさらに、前記モデルパラメータに基づいて、前記超解像度ネットワークモデルを構築するように構成される、
請求項27に記載のビデオシステム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2020/101968 WO2022011571A1 (zh) | 2020-07-14 | 2020-07-14 | 视频处理方法、装置、设备、解码器、系统及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023537823A true JP2023537823A (ja) | 2023-09-06 |
Family
ID=79555969
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022581541A Pending JP2023537823A (ja) | 2020-07-14 | 2020-07-14 | ビデオ処理方法、装置、機器、デコーダ、システム及び記憶媒体 |
Country Status (5)
Country | Link |
---|---|
EP (1) | EP4145383A4 (ja) |
JP (1) | JP2023537823A (ja) |
KR (1) | KR102710861B1 (ja) |
CN (1) | CN115943422A (ja) |
WO (1) | WO2022011571A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2621248B (en) * | 2020-11-27 | 2024-09-04 | V Nova Int Ltd | Video encoding using pre-processing |
CN114584675B (zh) * | 2022-05-06 | 2022-08-02 | 中国科学院深圳先进技术研究院 | 一种自适应视频增强方法和装置 |
JP7508525B2 (ja) | 2022-10-21 | 2024-07-01 | キヤノン株式会社 | 情報処理装置、情報処理方法及びプログラム |
CN115409716B (zh) * | 2022-11-01 | 2023-02-07 | 杭州网易智企科技有限公司 | 视频处理方法、装置、存储介质及设备 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11354577B2 (en) * | 2017-03-15 | 2022-06-07 | Samsung Electronics Co., Ltd | System and method for designing efficient super resolution deep convolutional neural networks by cascade network training, cascade network trimming, and dilated convolutions |
CN107563965A (zh) * | 2017-09-04 | 2018-01-09 | 四川大学 | 基于卷积神经网络的jpeg压缩图像超分辨率重建方法 |
US10552944B2 (en) * | 2017-10-13 | 2020-02-04 | Adobe Inc. | Image upscaling with controllable noise reduction using a neural network |
CN109949255B (zh) * | 2017-12-20 | 2023-07-28 | 华为技术有限公司 | 图像重建方法及设备 |
CN110136055B (zh) * | 2018-02-02 | 2023-07-14 | 腾讯科技(深圳)有限公司 | 图像的超分辨率方法和装置、存储介质、电子装置 |
CN110428378B (zh) * | 2019-07-26 | 2022-02-08 | 北京小米移动软件有限公司 | 图像的处理方法、装置及存储介质 |
CN110705699B (zh) * | 2019-10-18 | 2022-05-31 | 厦门美图之家科技有限公司 | 超分辨率重建方法、装置、电子设备和可读存储介质 |
-
2020
- 2020-07-14 EP EP20945341.4A patent/EP4145383A4/en active Pending
- 2020-07-14 KR KR1020227045271A patent/KR102710861B1/ko active IP Right Grant
- 2020-07-14 WO PCT/CN2020/101968 patent/WO2022011571A1/zh unknown
- 2020-07-14 CN CN202080102940.5A patent/CN115943422A/zh active Pending
- 2020-07-14 JP JP2022581541A patent/JP2023537823A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
WO2022011571A1 (zh) | 2022-01-20 |
EP4145383A1 (en) | 2023-03-08 |
KR102710861B1 (ko) | 2024-09-26 |
CN115943422A (zh) | 2023-04-07 |
KR20230038144A (ko) | 2023-03-17 |
EP4145383A4 (en) | 2023-06-21 |
US20230100615A1 (en) | 2023-03-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2023537823A (ja) | ビデオ処理方法、装置、機器、デコーダ、システム及び記憶媒体 | |
US11610283B2 (en) | Apparatus and method for performing scalable video decoding | |
US11250595B2 (en) | Tiled image compression using neural networks | |
CN109451308B (zh) | 视频压缩处理方法及装置、电子设备及存储介质 | |
WO2019001108A1 (zh) | 视频处理的方法和装置 | |
EP4365820A1 (en) | Video super-resolution network, and video super-resolution, encoding and decoding processing method and device | |
JP6188005B2 (ja) | 濃淡画像符号化装置及び復号装置 | |
CN113747242B (zh) | 图像处理方法、装置、电子设备及存储介质 | |
CN115606179A (zh) | 用于使用学习的下采样特征进行图像和视频编码的基于学习的下采样的cnn滤波器 | |
CN109949222A (zh) | 基于语义图的图像超分辨率重建方法 | |
KR20220157402A (ko) | 이미지 리스케일링 | |
WO2023130333A1 (zh) | 编解码方法、编码器、解码器以及存储介质 | |
CN114979672A (zh) | 视频编码方法、解码方法、电子设备及存储介质 | |
CN116797975A (zh) | 一种视频分割方法、装置、计算机设备及存储介质 | |
JP2016201800A (ja) | 第1のダイナミックレンジを有する画像を生成、符号化、または復号するための方法およびデバイス、ならびに対応するコンピュータプログラム製品およびコンピュータ可読媒体 | |
CN118488202A (zh) | 图像压缩的处理方法、装置、电子设备及存储介质 | |
CN112601095B (zh) | 一种视频亮度和色度分数插值模型的创建方法及系统 | |
JP2015019364A (ja) | 画像圧縮装置及び方法 | |
US12126840B2 (en) | Video processing method and apparatus, and device, decoder, system and storage medium | |
CN113132732B (zh) | 一种人机协同的视频编码方法及视频编码系统 | |
CN116137017A (zh) | 超分辨率视频的确定方法和电子设备 | |
KR20230145096A (ko) | 신경망 기반 픽처 프로세싱에서의 보조 정보의 독립적 위치결정 | |
CN111901595A (zh) | 一种基于深度神经网络的视频编码方法及装置、介质 | |
WO2022246809A1 (zh) | 编解码方法、码流、编码器、解码器以及存储介质 | |
Hu et al. | Efficient image compression method using image super-resolution residual learning network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230615 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230615 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240513 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240524 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240805 |