JP2023525233A - ニューラル画像圧縮における置換の多学習率のための方法および装置 - Google Patents
ニューラル画像圧縮における置換の多学習率のための方法および装置 Download PDFInfo
- Publication number
- JP2023525233A JP2023525233A JP2022564637A JP2022564637A JP2023525233A JP 2023525233 A JP2023525233 A JP 2023525233A JP 2022564637 A JP2022564637 A JP 2022564637A JP 2022564637 A JP2022564637 A JP 2022564637A JP 2023525233 A JP2023525233 A JP 2023525233A
- Authority
- JP
- Japan
- Prior art keywords
- image
- input image
- nic
- alternative
- block
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000006835 compression Effects 0.000 title claims abstract description 30
- 238000007906 compression Methods 0.000 title claims abstract description 30
- 238000000034 method Methods 0.000 title claims description 58
- 230000001537 neural effect Effects 0.000 title claims description 17
- 238000012549 training Methods 0.000 claims abstract description 30
- 238000013528 artificial neural network Methods 0.000 claims abstract description 21
- 238000013507 mapping Methods 0.000 claims abstract description 21
- 230000008569 process Effects 0.000 claims description 19
- 238000005457 optimization Methods 0.000 claims description 9
- 238000005192 partition Methods 0.000 claims description 2
- 238000000638 solvent extraction Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 9
- 238000004891 communication Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 238000012545 processing Methods 0.000 description 8
- 238000007781 pre-processing Methods 0.000 description 7
- 230000001419 dependent effect Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000007596 consolidation process Methods 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000013442 quality metrics Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004984 smart glass Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
- G06T9/002—Image coding using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/117—Filters, e.g. for pre-processing or post-processing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/119—Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/14—Coding unit complexity, e.g. amount of activity or edge presence estimation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/147—Data rate or code amount at the encoder output according to rate distortion criteria
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/184—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2212/00—Indexing scheme relating to accessing, addressing or allocation within memory systems or architectures
- G06F2212/45—Caching of specific data in cache memory
- G06F2212/455—Image or video data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/00007—Time or data compression or expansion
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04Q—SELECTING
- H04Q2213/00—Indexing scheme relating to selecting arrangements in general and for multiplex systems
- H04Q2213/034—Codec; PCM compression
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
Description
110 ユーザデバイス
120 プラットフォーム
124 コンピューティングリソース
124-1 アプリケーション
124-2 仮想マシン
124-3 仮想化ストレージ
124-4 ハイパーバイザ
130 ネットワーク
200 デバイス
210 バス
220 プロセッサ
230 メモリ
240 ストレージコンポーネント
250 入力コンポーネント
260 出力コンポーネント
270 通信インターフェース
300 符号化マッピング
310 復号マッピング
400 画像
410 ブロック
500 方法
510 動作
520 動作
530 動作
540 動作
600 装置
610 受信コード
620 決定コード
630 符号化コード
640 マッピングコード
Claims (20)
- 少なくとも1つのプロセッサによって実行されるニューラルネットワークを使用した置換型エンドツーエンド(E2E)ニューラル画像圧縮(NIC)の方法であって、前記方法が、
E2E NICフレームワークへの入力画像を受信するステップと、
前記E2E NICフレームワークのトレーニングモデルに基づいて代替画像を決定するステップと、
ビットストリームを生成するために前記代替画像を符号化するステップと、
圧縮表現を生成するために前記代替画像を前記ビットストリームにマッピングするステップと
を含む、方法。 - 前記入力画像を1つまたは複数のブロックに分割するステップと、
前記E2E NICフレームワークの前記トレーニングモデルに基づいて、前記1つまたは複数のブロックの各々のための代替ブロックを決定するステップと、
ブロックビットストリームを生成するために前記代替ブロックを符号化するステップと、
圧縮済みブロックを生成するために前記代替ブロックを前記ブロックビットストリームにマッピングするステップと
をさらに含み、
前記1つまたは複数のブロックが同じサイズを有し、前記1つまたは複数のブロックの各ブロックが異なる学習率を有する、
請求項1に記載の方法。 - 前記代替画像が、
代替表現を生成するために前記入力画像の要素を調整するステップと、
前記代替画像として使用するために前記入力画像と前記代替表現との間の歪み損失が最も小さい前記要素を選択するステップと
を含む、前記E2E NICフレームワークの前記トレーニングモデルの最適化プロセスを実行することによって決定される、
請求項1に記載の方法。 - 前記E2E NICフレームワークの前記トレーニングモデルが、前記入力画像の学習率、前記入力画像の更新回数、および歪み損失に基づいてトレーニングされる、請求項1に記載の方法。
- 複数の代替画像が、学習率に基づいて決定され、
前記学習率が、前記入力画像の特性に基づいて選択される、
請求項4に記載の方法。 - 前記入力画像の前記特性が、前記入力画像のRGB分散および前記入力画像のRD性能のうちの一方である、請求項5に記載の方法。
- 前記E2E NICフレームワークの前記トレーニングモデルが、予めトレーニングされた画像符号化に基づく人工ニューラルネットワークであり、
前記人工ニューラルネットワークのパラメータが固定され、前記入力画像を更新するために勾配が使用される、
請求項1に記載の方法。 - ニューラルネットワークを使用する置換型エンドツーエンド(E2E)ニューラル画像圧縮(NIC)のための装置であって、前記装置が、
プログラムコードを記憶するように構成された少なくとも1つのメモリと、
前記プログラムコードを読み取り、前記プログラムコードによって命令されるように動作するように構成された少なくとも1つのプロセッサであって、前記プログラムコードが、
少なくとも1つのプロセッサにE2E NICフレームワークへの入力画像を受信させるように構成された受信コードと、
少なくとも1つのプロセッサに前記E2E NICフレームワークのトレーニングモデルに基づいて代替画像を決定させるように構成された第1の決定コードと、
ビットストリームを生成するために、少なくとも1つのプロセッサに前記代替画像を符号化させるように構成された第1の符号化コードと、
圧縮表現を生成するために、少なくとも1つのプロセッサに前記代替画像を前記ビットストリームにマッピングさせるように構成された第1のマッピングコードと
を含む、少なくとも1つのプロセッサと
を備える、装置。 - 少なくとも1つのプロセッサに前記入力画像を1つまたは複数のブロックに分割させるように構成された分割コードと、
少なくとも1つのプロセッサに前記E2E NICフレームワークの前記トレーニングモデルに基づいて前記1つまたは複数のブロックの各々のための代替ブロックを決定させるように構成された第2の決定コードと、
ブロックビットストリームを生成するために、少なくとも1つのプロセッサに前記代替ブロックを符号化させるように構成された第2の符号化コードと、
圧縮済みブロックを生成するために、少なくとも1つのプロセッサに前記代替ブロックを前記ブロックビットストリームにマッピングさせるように構成された第2のマッピングコードと
をさらに含み、
前記1つまたは複数のブロックが同じサイズを有し、前記1つまたは複数のブロックの各ブロックが異なる学習率を有する、
請求項8に記載の装置。 - 前記代替画像が、
代替表現を生成するために、少なくとも1つのプロセッサに前記入力画像の要素を調整させるように構成された調整コードと、
前記代替画像として使用するために、少なくとも1つのプロセッサに前記入力画像と前記代替表現との間の歪み損失が最も小さい前記要素を選択させるように構成された選択コードとを含む、前記E2E NICフレームワークの前記トレーニングモデルの最適化プロセスを実行することによって決定される、
請求項8に記載の装置。 - 前記E2E NICフレームワークの前記トレーニングモデルが、前記入力画像の学習率、前記入力画像の更新回数、および歪み損失に基づいてトレーニングされる、請求項8に記載の装置。
- 複数の代替画像が、学習率に基づいて決定され、
前記学習率が、前記入力画像の特性に基づいて選択される、
請求項11に記載の装置。 - 前記入力画像の前記特性が、前記入力画像のRGB分散および前記入力画像のRD性能のうちの一方である、請求項12に記載の装置。
- 前記E2E NICフレームワークの前記トレーニングモデルが、予めトレーニングされた画像符号化に基づく人工ニューラルネットワークであり、
前記人工ニューラルネットワークのパラメータが固定され、前記入力画像を更新するために勾配が使用される、
請求項8に記載の装置。 - 置換型エンドツーエンド(E2E)ニューラル画像圧縮(NIC)のために少なくとも1つのプロセッサによって実行されると、前記少なくとも1つのプロセッサに、
E2E NICフレームワークへの入力画像を受信させ、
前記E2E NICフレームワークのトレーニングモデルに基づいて代替画像を決定させ、
ビットストリームを生成するために前記代替画像を符号化させ、
圧縮表現を生成するために前記代替画像を前記ビットストリームにマッピングさせる命令を記憶する、非一時的コンピュータ可読媒体。 - 前記命令が、少なくとも1つのプロセッサによって実行されると、前記少なくとも1つのプロセッサにさらに、
前記入力画像を1つまたは複数のブロックに分割させ、
前記E2E NICフレームワークの前記トレーニングモデルに基づいて、前記1つまたは複数のブロックの各々のための代替ブロックを決定させ、
ブロックビットストリームを生成するために前記代替ブロックを符号化させ、
圧縮済みブロックを生成するために前記代替ブロックを前記ブロックビットストリームにマッピングさせ、
前記1つまたは複数のブロックが同じサイズを有し、前記1つまたは複数のブロックの各ブロックが異なる学習率を有する、請求項15に記載の非一時的コンピュータ可読媒体。 - 前記命令が、少なくとも1つのプロセッサによって実行されると、前記少なくとも1つのプロセッサにさらに、
代替表現を生成するために、前記入力画像の要素を調整することと、
前記代替画像として使用するために、前記入力画像と前記代替表現との間の歪み損失が最も小さい前記要素を選択することとを含む、前記E2E NICフレームワークの前記トレーニングモデルの最適化プロセスを実行させる、請求項15に記載の非一時的コンピュータ可読媒体。 - 前記E2E NICフレームワークの前記トレーニングモデルが、前記入力画像の学習率、前記入力画像の更新回数、および歪み損失に基づいてトレーニングされる、請求項15に記載の非一時的コンピュータ可読媒体。
- 複数の代替画像が、学習率に基づいて決定され、
前記学習率が、前記入力画像の特性に基づいて選択され、
前記入力画像の前記特性が、前記入力画像のRGB分散または前記入力画像のRD性能のうちの一方である、請求項18に記載の非一時的コンピュータ可読媒体。 - 前記E2E NICフレームワークの前記トレーニングモデルが、予めトレーニングされた画像符号化に基づく人工ニューラルネットワークであり、
前記人工ニューラルネットワークのパラメータが固定され、前記入力画像を更新するために勾配が使用される、請求項15に記載の非一時的コンピュータ可読媒体。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202163176204P | 2021-04-16 | 2021-04-16 | |
US63/176,204 | 2021-04-16 | ||
US17/499,959 | 2021-10-13 | ||
US17/499,959 US20220343552A1 (en) | 2021-04-16 | 2021-10-13 | Method and apparatus for multi-learning rates of substitution in neural image compression |
PCT/US2021/055039 WO2022220868A1 (en) | 2021-04-16 | 2021-10-14 | Method and apparatus for multi-learning rates of substitution in neural image compression |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023525233A true JP2023525233A (ja) | 2023-06-15 |
JP7493617B2 JP7493617B2 (ja) | 2024-05-31 |
Family
ID=83191841
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022564637A Active JP7493617B2 (ja) | 2021-04-16 | 2021-10-14 | ニューラル画像圧縮における置換の多学習率のための方法および装置 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20220343552A1 (ja) |
EP (1) | EP4100919A4 (ja) |
JP (1) | JP7493617B2 (ja) |
KR (1) | KR20220164562A (ja) |
CN (1) | CN115485729A (ja) |
WO (1) | WO2022220868A1 (ja) |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ES2310157B1 (es) * | 2008-06-20 | 2009-09-03 | Universitat De Valencia, Estudi Genera | Compresion de imagenes en color basada en representaciones perceptuales no lineales y en aprendizaje de maquina. |
GB2509311B (en) * | 2012-12-21 | 2016-12-14 | Canon Kk | Method and device for determining residual data for encoding or decoding at least part of an image |
US10432953B2 (en) | 2016-02-05 | 2019-10-01 | Deepmind Technologies Limited | Compressing images using neural networks |
KR102285064B1 (ko) * | 2017-10-30 | 2021-08-04 | 한국전자통신연구원 | 은닉 변수를 이용하는 영상 및 신경망 압축을 위한 방법 및 장치 |
US10930020B2 (en) * | 2018-08-09 | 2021-02-23 | Electronic Arts Inc. | Texture compression using a neural network |
US11159789B2 (en) * | 2018-10-24 | 2021-10-26 | City University Of Hong Kong | Generative adversarial network based intra prediction for video coding |
US20200160565A1 (en) * | 2018-11-19 | 2020-05-21 | Zhan Ma | Methods And Apparatuses For Learned Image Compression |
GB2581808B (en) * | 2019-02-26 | 2022-08-10 | Imperial College Innovations Ltd | Scene representation using image processing |
US11729406B2 (en) | 2019-03-21 | 2023-08-15 | Qualcomm Incorporated | Video compression using deep generative models |
US11057634B2 (en) * | 2019-05-15 | 2021-07-06 | Disney Enterprises, Inc. | Content adaptive optimization for neural data compression |
JP7491041B2 (ja) | 2019-05-22 | 2024-05-28 | 富士通株式会社 | 画像コーディング装置、確率モデル生成装置及び画像デコーディング装置 |
US11876988B2 (en) | 2021-01-19 | 2024-01-16 | Tencent America LLC | Method and apparatus for task-adaptive pre-processing for neural image compression |
-
2021
- 2021-10-13 US US17/499,959 patent/US20220343552A1/en active Pending
- 2021-10-14 EP EP21928340.5A patent/EP4100919A4/en active Pending
- 2021-10-14 JP JP2022564637A patent/JP7493617B2/ja active Active
- 2021-10-14 WO PCT/US2021/055039 patent/WO2022220868A1/en unknown
- 2021-10-14 KR KR1020227038635A patent/KR20220164562A/ko not_active Application Discontinuation
- 2021-10-14 CN CN202180031022.2A patent/CN115485729A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
KR20220164562A (ko) | 2022-12-13 |
US20220343552A1 (en) | 2022-10-27 |
WO2022220868A1 (en) | 2022-10-20 |
EP4100919A1 (en) | 2022-12-14 |
CN115485729A (zh) | 2022-12-16 |
JP7493617B2 (ja) | 2024-05-31 |
EP4100919A4 (en) | 2023-08-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7374340B2 (ja) | ニューラル画像圧縮のためのタスク適応型前処理のための方法、装置およびコンピュータプログラム | |
US11582470B2 (en) | Method and apparatus for multi-scale neural image compression with intra-prediction residuals | |
US11488329B2 (en) | Method and apparatus for multi-rate neural image compression with stackable nested model structures | |
US11810331B2 (en) | Neural image compression with latent feature-domain intra-prediction | |
KR102632258B1 (ko) | 종단간 이미지 압축을 위한 피처 치환 방법 및 장치 | |
US11652994B2 (en) | Neural image compression with adaptive intra-prediction | |
JP7493617B2 (ja) | ニューラル画像圧縮における置換の多学習率のための方法および装置 | |
US20220345717A1 (en) | Method and apparatus for dynamic learning rates of substitution in neural image compression | |
US20230319298A1 (en) | Method and apparatus for optimizing end-to-end neural image compression framework | |
US20230186525A1 (en) | System, method, and computer program for content adaptive online training for multiple blocks in neural image compression | |
US20230186526A1 (en) | System, method, and computer program for content adaptive online training for multiple blocks based on certain patterns | |
US20230186081A1 (en) | System, method, and computer program for iterative content adaptive online training in neural image compression |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221024 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221024 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20231129 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240109 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240403 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240422 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240521 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7493617 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |