JP7508573B2 - 深層強化学習によるエンドツーエンドニューラル圧縮のための方法及び装置 - Google Patents
深層強化学習によるエンドツーエンドニューラル圧縮のための方法及び装置 Download PDFInfo
- Publication number
- JP7508573B2 JP7508573B2 JP2022555102A JP2022555102A JP7508573B2 JP 7508573 B2 JP7508573 B2 JP 7508573B2 JP 2022555102 A JP2022555102 A JP 2022555102A JP 2022555102 A JP2022555102 A JP 2022555102A JP 7508573 B2 JP7508573 B2 JP 7508573B2
- Authority
- JP
- Japan
- Prior art keywords
- quantization
- keys
- neural network
- module
- generating
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 110
- 238000007906 compression Methods 0.000 title claims description 39
- 230000006835 compression Effects 0.000 title claims description 36
- 230000001537 neural effect Effects 0.000 title claims description 29
- 230000002787 reinforcement Effects 0.000 title claims description 14
- 238000013139 quantization Methods 0.000 claims description 144
- 230000009471 action Effects 0.000 claims description 41
- 238000013528 artificial neural network Methods 0.000 claims description 36
- 238000012549 training Methods 0.000 claims description 19
- 238000005070 sampling Methods 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims 1
- 230000008569 process Effects 0.000 description 29
- 238000004364 calculation method Methods 0.000 description 27
- 238000010586 diagram Methods 0.000 description 17
- 238000012360 testing method Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 9
- 238000004891 communication Methods 0.000 description 7
- 230000001419 dependent effect Effects 0.000 description 6
- 238000005457 optimization Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 5
- 238000013461 design Methods 0.000 description 4
- 230000007774 longterm Effects 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 230000008570 general process Effects 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000003068 static effect Effects 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000013179 statistical model Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 238000007596 consolidation process Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004984 smart glass Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
- G06T9/002—Image coding using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/13—Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/147—Data rate or code amount at the encoder output according to rate distortion criteria
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
- H04N19/423—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/91—Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
本願は、2020年12月29日に出願された米国仮特許出願第63/131,670号、及び2021年9月16日に出願された米国特許出願第17/476,859号に基づいて、それらの優先権を主張し、それらの開示内容を全て参照により本明細書に組み込むものとする。
(外1)
(以下「y―」等と記載する。)に量子化されるコンパクトな表現yを計算する。この離散値化された量子化された表現y―は、その後、記憶及び伝送を容易にするためにロスレスにエントロピーエンコードされることができる。デコーダ側では、離散値化された量子化された表現y―は、ロスレスエントロピーデコーディングから復元されることができ、画像又はビデオシーケンスzを再構成するためのDNNデコーダへの入力として使用される。
(外2)
(以下「yt~」等と記載する。)
にエンコードする。以下、対応する3段階のデコーディングプロセス510を説明する。コンパクトな表現yt~を受信した後、エントロピーデコーディングモジュール550は、コンパクトな表現yt~に基づいて、エントロピーデコーダを用いて、デコード表現yt ―’を復元する。実施形態では、ロスレスエントロピーコーディング方法は、エントロピーエンコーダ及びエントロピーデコーダによって用いられるため、デコード表現と量子化された表現とは同じである(即ち、
(外3)
)。次に、逆量子化モジュール560は、デコード表現yt ―’に基づいて、逆量子化器を用いて、逆量子化された表現yt’を計算する。最後に、DNNデコーディングモジュール570は、逆量子化された表現yt’に基づいて、DNNデコーダを用いて、再構成された出力ztを生成する。
(外4)
、即ち、QKKt,i及びQSSt,i-1に基づいて関連するQ値v* iを持つ行動a* jを選択し、そして報酬Φ(Yt,i+1,Kt,i+1,Y’t,i+1)を取得することは、リプレイメモリに追加される。リプレイメモリは通常、最大記憶制限があり、その制限に達すると、最も古い経験が最新のものに置き換えられる。
(外5)
から一連の経験をサンプリングする。状態予測モジュール710における各経験
(外6)
に対して、ターゲット状態予測器StateTは、経験におけるQKYt,l及びQSSt,l-1に基づいてターゲットQSs^t,lを予測する。ターゲットQS
(外7)
(以下、「s^t、l」等と記載する。)
及びターゲット鍵生成器KeyTに基づいて、鍵計算モジュール700はターゲット鍵K^t、l+1を計算する。ターゲット鍵K^t、l+1、ターゲットQSS^t、l及びターゲット再構成器ReconTに基づいて、再構成モジュール800は、1バッチのターゲット逆量子化された数字
(外8)
を計算する。次に、歪み計算モジュール900は、経験における元の表現Yt,l+1とデコード表現Y^’t,l+1との間のターゲット歪み
(外9)
を計算する。レート計算モジュール910は、K^t、l+1に基づいてターゲットレート損失R(K^t、l+1)を計算する。次に、ターゲット報酬
(外10)
は、報酬計算モジュール920において、次のように計算される。
(外11)
を次のように計算する。
(外12)
は、QKK^t,l+1及びQSS^t,lが与えられた場合の行動αj *についてターゲット状態予測器StateTが予測するQ値である。ハイパーパラメータγは、0から1の間で評価される割引率であり、システムが短期的な報酬に対して長期的な報酬をどの程度重要視するかを決定している。割引率が小さいほど、システムは長期的な報酬をあまり重要視しないが、短期的な報酬にのみ関心を持つ。次に、損失計算モジュール1001は、
(外13)
及び経験からのvj *、例えば、2つの報酬の差のLkノルムに基づいて、ターゲット損失
(外14)
を次のように計算する。
(外15)
は、モデルパラメータを更新するための追加の正規化項として、その最適化目的関数に加重加算することが可能である。前述したように、ここでは、状態予測器、鍵生成器、及び再構成器は、異なるタイムスタンプで更新されることができる。
Claims (7)
- 少なくとも1つのプロセッサが実行する、深層強化学習を用いるエンドツーエンドニューラル画像圧縮の方法であって、
入力をエンコードするステップと、
前記入力の複数のエンコード表現を生成するステップと、
1組の以前の量子化状態に基づいて、第1のニューラルネットワークを用いて、1組の量子化鍵を生成するステップであって、前記1組の量子化鍵における各量子化鍵及び前記1組の以前の量子化状態における各以前の量子化状態は、前記複数のエンコード表現に対応する、ステップと、
第2のニューラルネットワークを用いて、前記1組の量子化鍵に基づいて、前記複数のエンコード表現の逆量子化された表現を表す1組の逆量子化された数字を生成するステップと、
前記1組の逆量子化された数字に基づいて、再構成された出力を生成するステップと、
を含む方法。 - 前記入力の前記複数のエンコード表現は、数字のストリームである、請求項1に記載の方法。
- 前記1組の量子化鍵をエントロピーエンコードすることによって、1組のエンコードされた量子化鍵を生成するステップと、
前記1組のエンコードされた量子化鍵をエントロピーデコードすることによって、1組のデコードされた量子化鍵を生成するステップと、をさらに含み、
前記1組の逆量子化された数字は、前記第2のニューラルネットワークを用いて、前記1組のデコードされた量子化鍵に基づいて生成され、
前記第2のニューラルネットワークは、DRL逆量子化ニューラルネットワークである、請求項1に記載の方法。 - 前記第1のニューラルネットワークをトレーニングすることによって、前記1組の以前の量子化状態と前記1組の量子化鍵とに基づいて、1組の現在の量子化状態を生成するステップをさらに含み、
前記第1のニューラルネットワークは、DRL量子化ニューラルネットワークである、請求項1に記載の方法。 - 前記第1のニューラルネットワークは、すべての可能な行動のq値を計算し、最適なq値を持つ最適な行動として行動をランダムに選択し、選択された前記最適な行動の報酬を生成し、1組の選択された最適な行動をサンプリングし、前記第1のニューラルネットワークの重みパラメータを更新して歪み損失を最小化することによってトレーニングされる、請求項4に記載の方法。
- 深層強化学習を用いるエンドツーエンドニューラル画像圧縮のための装置であって、
プログラムコードを記憶するように構成されている少なくとも1つのメモリと、
前記プログラムコードを読み取り、前記プログラムコードの指示通りに動作するように構成されている少なくとも1つのプロセッサと、を備え、
前記プログラムコードは、
前記少なくとも1つのプロセッサに、請求項1乃至5のうちのいずれか一項に記載の方法を実行させるように構成されている、装置。 - コンピュータに、請求項1乃至5のうちのいずれか一項に記載の方法を実行させるように構成される、コンピュータプログラム。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063131670P | 2020-12-29 | 2020-12-29 | |
US63/131,670 | 2020-12-29 | ||
US17/476,859 | 2021-09-16 | ||
US17/476,859 US11917154B2 (en) | 2020-12-29 | 2021-09-16 | End-to-end neural compression with deep reinforcement learning |
PCT/US2021/051953 WO2022146508A1 (en) | 2020-12-29 | 2021-09-24 | Method and apparatus for end-to-end neural compression with deep reinforcement learning |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023521292A JP2023521292A (ja) | 2023-05-24 |
JP7508573B2 true JP7508573B2 (ja) | 2024-07-01 |
Family
ID=82118053
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022555102A Active JP7508573B2 (ja) | 2020-12-29 | 2021-09-24 | 深層強化学習によるエンドツーエンドニューラル圧縮のための方法及び装置 |
Country Status (6)
Country | Link |
---|---|
US (2) | US11917154B2 (ja) |
EP (1) | EP4073759A4 (ja) |
JP (1) | JP7508573B2 (ja) |
KR (1) | KR102650523B1 (ja) |
CN (1) | CN115298697A (ja) |
WO (1) | WO2022146508A1 (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019115865A1 (en) | 2017-12-13 | 2019-06-20 | Nokia Technologies Oy | An apparatus, a method and a computer program for video coding and decoding |
JP2020053820A (ja) | 2018-09-26 | 2020-04-02 | 株式会社Preferred Networks | 量子化及び符号化器作成方法、圧縮器作成方法、圧縮器作成装置及びプログラム |
Family Cites Families (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20180040319A (ko) * | 2016-10-12 | 2018-04-20 | 가온미디어 주식회사 | 영상 처리 방법, 그를 이용한 영상 복호화 및 부호화 방법 |
US10666943B2 (en) * | 2017-09-15 | 2020-05-26 | Futurewei Technologies, Inc. | Block partition structure in video compression |
US10721471B2 (en) * | 2017-10-26 | 2020-07-21 | Intel Corporation | Deep learning based quantization parameter estimation for video encoding |
US10827173B2 (en) * | 2017-11-13 | 2020-11-03 | Electronics And Telecommunications Research Institute | Method and apparatus for quantization |
US20190370638A1 (en) * | 2018-06-01 | 2019-12-05 | Thales Canada Inc | System for and method of data encoding and/or decoding using neural networks |
KR102030384B1 (ko) * | 2018-06-19 | 2019-11-08 | 광운대학교 산학협력단 | 잔차 계수 부호화/복호화 방법 및 장치 |
US11509703B2 (en) * | 2018-09-26 | 2022-11-22 | Vmware, Inc. | System and method for widescale adaptive bitrate selection |
WO2020150942A1 (zh) | 2019-01-23 | 2020-07-30 | 深圳市大疆创新科技有限公司 | 用于图像编解码的方法和装置 |
US10798386B2 (en) | 2019-01-25 | 2020-10-06 | At&T Intellectual Property I, L.P. | Video compression with generative models |
US11386582B1 (en) * | 2019-02-06 | 2022-07-12 | MLVX Technologies | System and process for reducing time of transmission for single-band, multiple-band or hyperspectral imagery using machine learning based compression |
US11625562B2 (en) * | 2019-02-11 | 2023-04-11 | Hrl Laboratories, Llc | System and method for human-machine hybrid prediction of events |
US10930263B1 (en) * | 2019-03-28 | 2021-02-23 | Amazon Technologies, Inc. | Automatic voice dubbing for media content localization |
US20220232219A1 (en) * | 2019-06-11 | 2022-07-21 | Lg Electronics Inc. | Image or video coding based on temporal motion information in units of subblocks |
US11218700B2 (en) * | 2019-07-01 | 2022-01-04 | Qualcomm Incorporated | Minimum allowed quantization parameter for transform skip mode and palette mode in video coding |
US20210058620A1 (en) * | 2019-08-23 | 2021-02-25 | Qualcomm Incorporated | Chroma quantization parameter (qp) derivation for video coding |
US11276180B1 (en) * | 2019-09-27 | 2022-03-15 | Amazon Technologies, Inc. | Techniques for encoding video data |
US20210146531A1 (en) * | 2019-11-20 | 2021-05-20 | Nvidia Corporation | Guided uncertainty-aware policy optimization: combining model-free and model-based strategies for sample-efficient learning |
US11276392B2 (en) * | 2019-12-12 | 2022-03-15 | Sorenson Ip Holdings, Llc | Communication of transcriptions |
KR20210083935A (ko) * | 2019-12-27 | 2021-07-07 | 삼성전자주식회사 | 뉴럴 네트워크의 파라미터들을 양자화하는 방법 및 장치 |
US11468328B2 (en) * | 2020-02-24 | 2022-10-11 | Qualcomm Incorporated | Managing information transmission for wireless communication |
US11616983B2 (en) * | 2020-05-05 | 2023-03-28 | Tencent America LLC | Joint component secondary transform |
CN114868394A (zh) * | 2020-06-30 | 2022-08-05 | 谷歌有限责任公司 | 用于图像压缩的梯度预测器 |
US11310504B2 (en) * | 2020-07-30 | 2022-04-19 | Tencent America LLC | Complexity reduction for 32-p and 64-p LGT |
US11190760B1 (en) * | 2020-10-15 | 2021-11-30 | Tencent America LLC | Neural network based coefficient sign prediction |
US20210067785A1 (en) * | 2020-11-17 | 2021-03-04 | Intel Corporation | Video encoding rate control for intra and scene change frames using machine learning |
CN112435306A (zh) * | 2020-11-20 | 2021-03-02 | 上海北昂医药科技股份有限公司 | G显带染色体hdr图像重建方法 |
US11558617B2 (en) | 2020-11-30 | 2023-01-17 | Tencent America LLC | End-to-end dependent quantization with deep reinforcement learning |
US20220215265A1 (en) | 2021-01-04 | 2022-07-07 | Tencent America LLC | Method and apparatus for end-to-end task-oriented latent compression with deep reinforcement learning |
-
2021
- 2021-09-16 US US17/476,859 patent/US11917154B2/en active Active
- 2021-09-24 KR KR1020227020136A patent/KR102650523B1/ko active IP Right Grant
- 2021-09-24 EP EP21916120.5A patent/EP4073759A4/en active Pending
- 2021-09-24 CN CN202180021365.0A patent/CN115298697A/zh active Pending
- 2021-09-24 JP JP2022555102A patent/JP7508573B2/ja active Active
- 2021-09-24 WO PCT/US2021/051953 patent/WO2022146508A1/en unknown
-
2024
- 2024-01-23 US US18/420,372 patent/US20240171743A1/en active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019115865A1 (en) | 2017-12-13 | 2019-06-20 | Nokia Technologies Oy | An apparatus, a method and a computer program for video coding and decoding |
JP2020053820A (ja) | 2018-09-26 | 2020-04-02 | 株式会社Preferred Networks | 量子化及び符号化器作成方法、圧縮器作成方法、圧縮器作成装置及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
KR102650523B1 (ko) | 2024-03-25 |
JP2023521292A (ja) | 2023-05-24 |
US11917154B2 (en) | 2024-02-27 |
KR20220098383A (ko) | 2022-07-12 |
CN115298697A (zh) | 2022-11-04 |
WO2022146508A1 (en) | 2022-07-07 |
EP4073759A4 (en) | 2023-03-08 |
EP4073759A1 (en) | 2022-10-19 |
US20220210416A1 (en) | 2022-06-30 |
US20240171743A1 (en) | 2024-05-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7416489B2 (ja) | 深層強化学習を用いたエンドツーエンドのタスク指向型潜在圧縮のための方法、装置およびコンピュータプログラム | |
KR20220082921A (ko) | 인트라-예측 잔차들에 의한 멀티-스케일 신경 이미지 압축을 위한 방법 및 장치 | |
US20230122449A1 (en) | Substitutional quality factor learning in the latent space for neural image compression | |
US11652994B2 (en) | Neural image compression with adaptive intra-prediction | |
JP7471733B2 (ja) | 滑らかな品質制御による適応ニューラル画像圧縮のための代替の入力最適化 | |
JP7508573B2 (ja) | 深層強化学習によるエンドツーエンドニューラル圧縮のための方法及び装置 | |
KR102632258B1 (ko) | 종단간 이미지 압축을 위한 피처 치환 방법 및 장치 | |
US11909975B2 (en) | Dependent scalar quantization with substitution in neural image compression | |
JP7434605B2 (ja) | メタ学習によるスムーズな品質制御を用いた適応ニューラル画像圧縮のための方法、装置、非一時的コンピュータ可読媒体、およびコンピュータプログラム | |
US20230186525A1 (en) | System, method, and computer program for content adaptive online training for multiple blocks in neural image compression | |
JP2024518239A (ja) | ニューラル画像圧縮における反復的なコンテンツ適応型オンライントレーニングのためのシステム、方法、及びコンピュータプログラム | |
CN115336261A (zh) | 用于通过元学习进行率控制的自适应神经图像压缩的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221012 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20231013 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231031 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240130 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240521 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240619 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7508573 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |