JP7471734B2 - メタ学習による滑らかな品質管理を用いた品質適応型のニューラル・ネットワーク・ベースのループフィルタ - Google Patents
メタ学習による滑らかな品質管理を用いた品質適応型のニューラル・ネットワーク・ベースのループフィルタ Download PDFInfo
- Publication number
- JP7471734B2 JP7471734B2 JP2022564638A JP2022564638A JP7471734B2 JP 7471734 B2 JP7471734 B2 JP 7471734B2 JP 2022564638 A JP2022564638 A JP 2022564638A JP 2022564638 A JP2022564638 A JP 2022564638A JP 7471734 B2 JP7471734 B2 JP 7471734B2
- Authority
- JP
- Japan
- Prior art keywords
- neural network
- adaptive
- shared
- parameter
- video data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013528 artificial neural network Methods 0.000 title claims description 66
- 238000003908 quality control method Methods 0.000 title description 7
- 238000000034 method Methods 0.000 claims description 79
- 230000003044 adaptive effect Effects 0.000 claims description 59
- 238000012549 training Methods 0.000 claims description 45
- 239000013598 vector Substances 0.000 claims description 14
- 238000010200 validation analysis Methods 0.000 claims description 13
- 238000012545 processing Methods 0.000 claims description 11
- 238000013139 quantization Methods 0.000 claims description 10
- 238000001914 filtration Methods 0.000 claims description 9
- 238000005192 partition Methods 0.000 claims description 7
- 230000006978 adaptation Effects 0.000 claims description 6
- 238000007781 pre-processing Methods 0.000 claims description 3
- 238000004590 computer program Methods 0.000 claims 1
- 230000008569 process Effects 0.000 description 18
- 238000010586 diagram Methods 0.000 description 11
- 230000006835 compression Effects 0.000 description 9
- 238000007906 compression Methods 0.000 description 9
- 238000004891 communication Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 230000007246 mechanism Effects 0.000 description 5
- 230000000007 visual effect Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 241000023320 Luma <angiosperm> Species 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000007596 consolidation process Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 229920001098 polystyrene-block-poly(ethylene/propylene) Polymers 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004984 smart glass Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/80—Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
- H04N19/82—Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/109—Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/117—Filters, e.g. for pre-processing or post-processing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/85—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
- H04N19/86—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
本出願は、2021年4月19日に出願された米国仮特許出願第63/176,787号に基づき、それに対する優先権を主張するものであり、その開示は参照によりその全体が本明細書に組み込まれる。
式中、
110 ユーザデバイス
120 プラットフォーム
122 クラウドコンピューティング環境
124 コンピューティングリソース
124-1 アプリケーション(「APP」)
124-2 仮想マシン(「VM」)
124-3 仮想ストレージ(「VS」)
124-4 ハイパーバイザ(「HYP」)
130 ネットワーク
200 デバイス
210 バス
220 プロセッサ
230 メモリ
240 ストレージコンポーネント
250 入力コンポーネント
260 出力コンポーネント
270 通信インターフェース
300A メタNNLFアーキテクチャ
305 共有NNLF NN
310 適応NNLF NN
300B メタNNLFアーキテクチャ
325 共有NNLFレイヤi
330 共有NNLFレイヤi+1
335 適応NNLFレイヤi
340 適応NNLFレイヤi+1
400 装置
412 SNNLFPインターフェース部
414 ANNLFP予測部
416 ANNLFPインターフェース部
500 訓練装置
510 タスクサンプラ
520 内側ループ損失生成器
530 内側ループ更新部
540 メタ損失生成器
550 メタ更新部
560 重み更新部
600A 方法のフローチャート
600B 方法のフローチャート
Claims (12)
- 共有ニューラルネットワークモジュール及び適応ニューラルネットワークモジュールを含むメタニューラルネットワークにおいて、メタ学習を使用したニューラル・ネットワーク・ベースのループフィルタリングに基づくビデオエンハンスメントのための方法であって、前記方法は少なくとも1つのプロセッサによって実行され、前記方法は、
再構成されたビデオデータを受信するステップと、
前記再構成されたビデオデータと関連付けられた1つまたは複数の品質係数を受信するステップと、
ニューラル・ネットワーク・ベースのループフィルタにおける複数の層の各々について、
前記共有ニューラルネットワークモジュールによって、第1の共有パラメータを有する第1の共有ニューラル・ネットワーク・ループ・フィルタを使用して、前の層からの前の結合出力に基づいて、前記適応ニューラルネットワークモジュールと共有される第1の共有出力を生成するステップであって、前記第1の共有パラメータは、前記メタニューラルネットワークの基礎となるモデルパラメータが前記共有ニューラルネットワークモジュールのために分離されたパラメータである、ステップと、
前記適応ニューラルネットワークモジュールによって、
前記1つまたは複数の品質係数に適応的な第1の適応パラメータを有する第1の適応ニューラル・ネットワーク・ループ・フィルタを使用して、前記前の層からの前記前の結合出力に基づいて第1の適応出力を生成するステップであって、前記第1の適応パラメータは、前記基礎となるモデルパラメータが前記適応ニューラルネットワークモジュールのために分離されたパラメータである、ステップと、
第1の結合出力を生成するために前記第1の共有出力と前記第1の適応出力とを結合するステップと、
前記ニューラル・ネットワーク・ベースのループフィルタの最後の層の結合出力に基づいて、アーチファクトが減少した強化されたビデオデータを生成するステップと
を含む、方法。 - 前記ニューラル・ネットワーク・ベースのループフィルタを使用して前記強化されたビデオデータを生成する前記ステップは、
前記ニューラル・ネットワーク・ベースのループフィルタにおける複数の層の各々について、
前記第1の共有ニューラル・ネットワーク・ループ・フィルタを使用して、前記前の層からの出力に基づいて共有特徴を生成するステップと、
前記適応ニューラルネットワークモジュールに含まれる予測ニューラルネットワークを使用して、前記前の層からの前記出力、前記共有特徴、前記第1の適応パラメータ、および前記1つまたは複数の品質係数に基づいて、推定適応パラメータを計算するステップと、
前記共有特徴および前記推定適応パラメータに基づいて、現在の層の出力を生成するステップと、
前記ニューラル・ネットワーク・ベースのループフィルタの最後の層の出力に基づいて、前記強化されたビデオデータを生成するステップと
を含む、請求項1に記載の方法。 - 前記予測ニューラルネットワークを訓練するステップは、
前記1つまたは複数の品質係数、前記第1の共有パラメータ、前記第1の適応パラメータ、および前記予測ニューラルネットワークの予測パラメータに基づいて、前記1つまたは複数の品質係数に対応する訓練データのための第1の損失、および前記1つまたは複数の品質係数に対応する検証データのための第2の損失を生成するステップと、
前記生成された第1の損失の勾配および前記生成された第2の損失の勾配に基づいて、前記予測パラメータを更新するステップと
を含む、請求項2に記載の方法。 - 前記再構成されたビデオデータと関連付けられた前記1つまたは複数の品質係数は、コーディング・ツリー・ユニット・パーティション、量子化パラメータ、デブロッキングフィルタ境界強度、コーディングユニット動きベクトル、およびコーディングユニット予測モードのうちの少なくとも1つを含む、請求項1に記載の方法。
- 前記ニューラル・ネットワーク・ベースのループフィルタを訓練するステップは、
前記1つまたは複数の品質係数、前記第1の共有パラメータ、および前記第1の適応パラメータに基づいて、前記1つまたは複数の品質係数に対応する訓練データのための内側ループ損失を生成するステップと、
前記生成された内側ループ損失の勾配に基づいて、前記第1の共有パラメータおよび前記第1の適応パラメータを第1に更新するステップと、
前記1つまたは複数の品質係数、前記第1に更新された第1の共有パラメータ、および前記第1に更新された第1の適応パラメータに基づいて、前記1つまたは複数の品質係数に対応する検証データのためのメタ損失を生成するステップと、
前記生成されたメタ損失の勾配に基づいて、前記第1に更新された第1の共有パラメータ、および前記第1に更新された第1の適応パラメータを第2に更新するステップと
を含む、請求項2に記載の方法。 - 前記受信された再構成されたビデオデータを生成するステップは、
量子化されたビデオデータおよび動きベクトルデータを含むビデオデータのストリームを受信するステップと、
復元された残差を取得するために、逆変換を使用して量子化データの前記ストリームを逆量子化するステップと、
前記復元された残差および前記動きベクトルデータに基づいて前記再構成されたビデオデータを生成するステップと
を含む、請求項1に記載の方法。 - 前記強化されたビデオデータに、デブロッキングフィルタ、適応ループフィルタ、サンプル適応オフセット、および交差成分適応ループフィルタのうちの少なくとも1つを適用することを含む強化後処理をさらに含む、請求項1に記載の方法。
- 前記強化されたビデオデータを生成する前に、前記方法は、前記強化されたビデオデータに、デブロッキングフィルタ、適応ループフィルタ、サンプル適応オフセット、および交差成分適応ループフィルタのうちの少なくとも1つを適用することを含む強化前処理を含む、請求項1に記載の方法。
- 前記再構成されたビデオデータは、複数の再構成された入力フレームを含み、請求項1に記載の方法は、前記複数の再構成された入力フレームのうちの現在のフレームに適用される、請求項1に記載の方法。
- 前記結合するステップは、加算、連結、または乗算のうちの少なくとも1つを含む、請求項1に記載の方法。
- プログラムコードを記憶するように構成された少なくとも1つのメモリと、
前記プログラムコードを読み出し、前記プログラムコードによって命令されるように動作するように構成された少なくとも1つのプロセッサであって、前記プログラムコードが、請求項1~10のいずれか一項に記載の方法を行うように構成された装置。 - コンピュータに、請求項1~10のいずれか一項に記載の方法を実行させるためのコンピュータプログラム。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202163176787P | 2021-04-19 | 2021-04-19 | |
US63/176,787 | 2021-04-19 | ||
US17/703,292 US11750847B2 (en) | 2021-04-19 | 2022-03-24 | Quality-adaptive neural network-based loop filter with smooth quality control by meta-learning |
US17/703,292 | 2022-03-24 | ||
PCT/US2022/021870 WO2022225643A1 (en) | 2021-04-19 | 2022-03-25 | Quality-adaptive neural network-based loop filter with smooth quality control by meta-learning |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023527655A JP2023527655A (ja) | 2023-06-30 |
JP7471734B2 true JP7471734B2 (ja) | 2024-04-22 |
Family
ID=83694578
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022564638A Active JP7471734B2 (ja) | 2021-04-19 | 2022-03-25 | メタ学習による滑らかな品質管理を用いた品質適応型のニューラル・ネットワーク・ベースのループフィルタ |
Country Status (6)
Country | Link |
---|---|
US (1) | US11750847B2 (ja) |
EP (1) | EP4115620A4 (ja) |
JP (1) | JP7471734B2 (ja) |
KR (1) | KR20220165770A (ja) |
CN (1) | CN115516865A (ja) |
WO (1) | WO2022225643A1 (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019182159A1 (ja) | 2018-03-23 | 2019-09-26 | シャープ株式会社 | 画像フィルタ装置、画像復号装置、及び画像符号化装置 |
US20200213587A1 (en) | 2017-08-28 | 2020-07-02 | Interdigital Vc Holdings, Inc. | Method and apparatus for filtering with mode-aware deep learning |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190289327A1 (en) * | 2018-03-13 | 2019-09-19 | Mediatek Inc. | Method and Apparatus of Loop Filtering for VR360 Videos |
CN111010568B (zh) | 2018-10-06 | 2023-09-29 | 华为技术有限公司 | 插值滤波器的训练方法、装置及视频图像编解码方法、编解码器 |
US11490085B2 (en) | 2021-01-14 | 2022-11-01 | Tencent America LLC | Model sharing by masked neural network for loop filter with quality inputs |
-
2022
- 2022-03-24 US US17/703,292 patent/US11750847B2/en active Active
- 2022-03-25 JP JP2022564638A patent/JP7471734B2/ja active Active
- 2022-03-25 CN CN202280003901.9A patent/CN115516865A/zh active Pending
- 2022-03-25 EP EP22777937.8A patent/EP4115620A4/en active Pending
- 2022-03-25 KR KR1020227039138A patent/KR20220165770A/ko active Search and Examination
- 2022-03-25 WO PCT/US2022/021870 patent/WO2022225643A1/en unknown
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200213587A1 (en) | 2017-08-28 | 2020-07-02 | Interdigital Vc Holdings, Inc. | Method and apparatus for filtering with mode-aware deep learning |
WO2019182159A1 (ja) | 2018-03-23 | 2019-09-26 | シャープ株式会社 | 画像フィルタ装置、画像復号装置、及び画像符号化装置 |
Non-Patent Citations (2)
Title |
---|
Cheung Auyeung et al.,EE1.1: A comparison of depthwise separable convolution and regular convolution with the JVET-T0057 neural network based in-loop filter [online],JVET-U0060(JVET-U0060.docx), [2023年11月17日検索],インターネット <URL: https://jvet-experts.org/doc_end_user/documents/21_Teleconference/wg11/JVET-U0060-v2.zip>,2021年01月07日 |
Jihong Kang et al.,MULTI-MODAL/MULTI-SCALE CONVOLUTIONAL NEURAL NETWORK BASED IN-LOOP FILTER DESIGN FOR NEXT GENERATION VIDEO CODEC [online],Published in: 2017 IEEE International Conference on Image Processing (ICIP), [2023年11月17日検索],2018年02月22日,pp.26-30,インターネット <URL: https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=8296236>,DOI: 10.1109/ICIP.2017.8296236 |
Also Published As
Publication number | Publication date |
---|---|
KR20220165770A (ko) | 2022-12-15 |
US11750847B2 (en) | 2023-09-05 |
JP2023527655A (ja) | 2023-06-30 |
WO2022225643A1 (en) | 2022-10-27 |
EP4115620A1 (en) | 2023-01-11 |
US20220345752A1 (en) | 2022-10-27 |
CN115516865A (zh) | 2022-12-23 |
EP4115620A4 (en) | 2023-07-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7411113B2 (ja) | 品質入力を有するループフィルタのためのマスクされたニューラルネットワークによるモデル共有 | |
JP2023506057A (ja) | イントラ予測残差を用いたマルチスケールニューラル画像圧縮のための方法および装置、およびコンピュータプログラム | |
CN114747207A (zh) | 用于利用后滤波进行逐块神经图像压缩的方法和装置 | |
JP7483030B2 (ja) | 潜在特徴領域におけるイントラ予測によるニューラル画像圧縮 | |
KR102633549B1 (ko) | 대체 신경 잔차 압축을 위한 방법 및 장치 | |
JP7471733B2 (ja) | 滑らかな品質制御による適応ニューラル画像圧縮のための代替の入力最適化 | |
JP7471734B2 (ja) | メタ学習による滑らかな品質管理を用いた品質適応型のニューラル・ネットワーク・ベースのループフィルタ | |
JP7438611B2 (ja) | 品質適応型ニューラル・ネットワーク・ベースのループフィルタのための代替品質ファクター学習 | |
KR20220156896A (ko) | 적응적 인트라-예측에 의한 신경 이미지 압축 | |
JP7408835B2 (ja) | マルチタスクニューラルネットワークを使用するマルチ品質ループフィルタによるビデオ処理の方法、装置及びコンピュータプログラム | |
JP7471730B2 (ja) | メタ学習によるレート制御を用いた適応ニューラル画像圧縮のための方法、装置及びプログラム | |
JP7434605B2 (ja) | メタ学習によるスムーズな品質制御を用いた適応ニューラル画像圧縮のための方法、装置、非一時的コンピュータ可読媒体、およびコンピュータプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221024 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221024 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20231124 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231127 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240227 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240311 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240404 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7471734 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |