JP7233875B2 - 作成方法、コンピュータ及びプログラム - Google Patents
作成方法、コンピュータ及びプログラム Download PDFInfo
- Publication number
- JP7233875B2 JP7233875B2 JP2018181024A JP2018181024A JP7233875B2 JP 7233875 B2 JP7233875 B2 JP 7233875B2 JP 2018181024 A JP2018181024 A JP 2018181024A JP 2018181024 A JP2018181024 A JP 2018181024A JP 7233875 B2 JP7233875 B2 JP 7233875B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- quantized
- quantization
- parameters
- creating
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
まず、本発明の実施の形態における変換器作成装置10の機能構成について、図1を参照しながら説明する。図1は、本発明の実施の形態における変換器作成装置10の機能構成の一例を示す図である。
次に、上記の量子化部102の詳細な機能構成について、図2を参照しながら説明する。図2は、本発明の実施の形態における量子化部102の詳細な機能構成の一例を示す図である。
次に、最適化時における量子化部102による量子化の概略について、図3を参照しながら説明する。図3は、最適化時における量子化部102による量子化の概略の一例を説明する図である。分割部111による中間データの分割数をKとした場合、最適化時における量子化部102による量子化は、k=1からk=Kまで順に実行される。図3では、k≧2として、k回目の量子化を実行する場合について説明する。
次に、本発明の実施の形態における変換器作成装置10の最適化処理の詳細について、図4を参照しながら説明する。図4は、最適化処理の一例を示すフローチャートである。
本発明の効果について、図6を参照しながら説明する。図6は、本発明の効果の一例を示す図である。図6は、縦軸を1-MSSSIM、横軸をbpp(bits per pixel)とした場合における本発明の手法で得られた圧縮器と、従来手法で得られた圧縮器との比較結果である。1-MSSSIMはその値が低い程、歪みが小さいことを表し、bppはその値が低い程、圧縮率が高いことを表す。なお、bppは、情報量IをH×Wで除算することで得られる。
Nick Johnston, Damien Vincent, David Minnen, Michele Covell, Saurabh Singh, Troy Chinen, Sung Jin Hwang, Joel Shor, and George Toderici. Improved lossy image compression with priming and spatially adaptive bit rates for recurrent networks. arXiv preprint arXiv:1703.10114, 2017.
<変換器作成装置10のハードウェア構成>
最後に、本発明の実施の形態における変換器作成装置10のハードウェア構成について、図7を参照しながら説明する。図7は、本発明の実施の形態における変換器作成装置10のハードウェア構成の一例を示す図である。
101 分析部
102 量子化部
103 統合部
104 最適化部
111 分割部
112 CNN計算部
113 誤差計算部
114 量子化計算部
115 情報量計算部
116 算術符号化部
Claims (14)
- 非可逆圧縮によりデータを圧縮する圧縮器における量子化及び符号化器の作成方法であって、
前記データの量子化及び符号化において、既に量子化された別のデータを用いて、前記データの量子化先の標本空間、および、量子化された前記データが従う確率分布を、所定の関数により決定する手順、
をコンピュータが実行する作成方法。 - 前記標本空間を用いて量子化された前記データを、前記確率分布に従って算術符号化する手順を前記コンピュータがさらに実行する請求項1に記載の作成方法。
- 前記確率分布を用いて、前記量子化された前記データを算術符号化によって保存する場合に必要な情報量を計算する手順と、
少なくとも前記情報量を用いて前記所定の関数を更新する手順と、
を前記コンピュータがさらに実行する請求項1又は2に記載の作成方法。 - 前記決定する手順は、前記データがn番目(3≦n)のデータである場合に、既に量子化された別のデータとして、1番目からn-1番目のデータの各データが量子化されたデータを用いて、前記標本空間、および、前記確率分布を、前記所定の関数により決定する、請求項1乃至3のいずれか1項に記載の作成方法。
- 前記所定の関数はニューラルネットワークであり、
前記ニューラルネットワークの内部パラメータを、前記非可逆圧縮における圧縮性能が高くなるように最適化することで、前記量子化先の標本空間を決定する、請求項1乃至4のいずれか1項に記載の作成方法。 - 請求項1乃至4のいずれか1項に記載の圧縮器について、当該圧縮器を作成する方法であって、
第1のパラメータに従って、前記データとして、圧縮対象データを変換した中間データを作成する分析手順と、
第2のパラメータに従って、前記中間データの量子化先の前記標本空間を前記決定する手順において決定し、前記標本空間を用いて前記中間データを量子化した量子化データを作成する量子化手順と、
第3のパラメータに従って、前記量子化データを変換した復元データを作成する統合手順と、
前記圧縮対象データと前記復元データとの歪みと、前記量子化データを算術符号化によって保存する場合に必要な情報量と、に基づいて、前記第1のパラメータと、前記第2のパラメータと、前記第3のパラメータとを最適化する最適化手順と、
をコンピュータが実行する作成方法。 - 請求項1乃至4のいずれか1項に記載の圧縮器について、当該圧縮器を作成する方法であって、分析器、量子化器、統合器及び最適化部を実現するコンピュータが、
前記分析器により、前記データとして、圧縮対象データを変換した中間データを作成する分析手順と、
前記量子化器により、前記中間データの量子化先の前記標本空間を前記決定する手順において決定し、前記標本空間を用いて前記中間データを量子化した量子化データを作成する量子化手順と、
前記統合器により、前記量子化データを変換した復元データを作成する統合手順と、
前記最適化部により、前記圧縮対象データと前記復元データとの歪みと、前記量子化データを算術符号化によって保存する場合に必要な情報量と、に基づいて、前記分析器のパラメータと、前記量子化器のパラメータと、前記統合器のパラメータとを最適化する最適化手順と、
を実行する作成方法。 - 前記量子化手順は、
前記中間データの各要素をK個のグループに分割した上で、k(k=1,・・・,K)番目のグループに属する要素で構成されるk番目の中間データを用いて、該k番目の中間データに対応するk番目の量子化データと、該k番目の量子化データを算術符号化によって保存する場合に必要なk番目の情報量とをk=1からk=Kまで順に作成することで、前記k番目の情報量のk=1からk=Kまでの総和で表される前記情報量と、前記k番目の量子化データのk=1からk=Kまでの結合で表される前記量子化データとを作成する、請求項7又は8に記載の作成方法。 - 前記量子化器には、k≧2である場合に、1番目の量子化データからk-1番目の量子化データまでを入力として、k番目の中間データを予測したk番目の予測値データと、前記k番目の中間データと前記k番目の予測値データとの近さを表すk番目の指標値データと、前記k番目の中間データを量子化する場合の量子化幅を表すk番目の量子化幅データとを出力するニューラルネットワークが含まれ、
前記量子化手順は、
前記k番目の予測値データと前記k番目の量子化幅データと前記k番目の中間データとを用いて、前記k番目の量子化データを作成し、
前記k番目の予測値データと前記k番目の指標値データとによって決定される累積分布関数と、前記k番目の量子化データと、前記k番目の量子化幅データとを用いて、前記k番目の情報量を作成する、請求項9に記載の作成方法。 - k=1である場合、前記k番目の予測値データと、前記k番目の指標値データと、前記k番目の量子化幅データとは、予め保存されている第1のパラメータと第2のパラメータと第3のパラメータとからそれぞれ作成され、
前記量子化器のパラメータには、前記ニューラルネットワークのパラメータと、前記第1のパラメータと、前記第2のパラメータと、前記第3のパラメータとが含まれる、請求項10に記載の作成方法。 - 前記k番目の量子化データの各要素は、前記k番目の予測値データの各要素と前記k番目の中間データの各要素との差を、前記k番目の量子化幅データの各要素でそれぞれ量子化したものであり、
前記k番目の情報量は、前記k番目の量子化データの各要素と、前記k番目の量子化データの各要素と、前記累積分布関数の集合の各要素とによって決定される出現確率の和である、請求項10又は11に記載の作成方法。 - 請求項1乃至12のいずれか1項に記載の作成方法を実行するコンピュータ。
- 請求項1乃至12のいずれか1項に記載の作成方法をコンピュータに実行させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018181024A JP7233875B2 (ja) | 2018-09-26 | 2018-09-26 | 作成方法、コンピュータ及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018181024A JP7233875B2 (ja) | 2018-09-26 | 2018-09-26 | 作成方法、コンピュータ及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020053820A JP2020053820A (ja) | 2020-04-02 |
JP7233875B2 true JP7233875B2 (ja) | 2023-03-07 |
Family
ID=69997781
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018181024A Active JP7233875B2 (ja) | 2018-09-26 | 2018-09-26 | 作成方法、コンピュータ及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7233875B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11790566B2 (en) * | 2020-05-12 | 2023-10-17 | Tencent America LLC | Method and apparatus for feature substitution for end-to-end image compression |
US11917154B2 (en) * | 2020-12-29 | 2024-02-27 | Tencent America LLC | End-to-end neural compression with deep reinforcement learning |
CN114037071B (zh) * | 2021-09-18 | 2023-08-08 | 宁波大学 | 获取用于图像前处理以抵抗jpge压缩失真的神经网络的方法 |
WO2024142897A1 (ja) * | 2022-12-26 | 2024-07-04 | ソニーセミコンダクタソリューションズ株式会社 | 情報処理装置、及び情報処理方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012104940A (ja) | 2010-11-08 | 2012-05-31 | Nippon Telegr & Teleph Corp <Ntt> | 動画像符号化装置、動画像符号化方法及びプログラム |
JP2019140680A (ja) | 2018-02-09 | 2019-08-22 | 株式会社Preferred Networks | オートエンコーダ装置、データ処理システム、データ処理方法及びプログラム |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0353782A (ja) * | 1989-07-21 | 1991-03-07 | Matsushita Electric Ind Co Ltd | 画像符号化装置 |
KR0139154B1 (ko) * | 1994-07-08 | 1998-06-15 | 김광호 | 신경망을 이용한 부호화방법 및 그 장치 |
-
2018
- 2018-09-26 JP JP2018181024A patent/JP7233875B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012104940A (ja) | 2010-11-08 | 2012-05-31 | Nippon Telegr & Teleph Corp <Ntt> | 動画像符号化装置、動画像符号化方法及びプログラム |
JP2019140680A (ja) | 2018-02-09 | 2019-08-22 | 株式会社Preferred Networks | オートエンコーダ装置、データ処理システム、データ処理方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2020053820A (ja) | 2020-04-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7233875B2 (ja) | 作成方法、コンピュータ及びプログラム | |
US11902369B2 (en) | Autoencoder, data processing system, data processing method and non-transitory computer readable medium | |
US11221990B2 (en) | Ultra-high compression of images based on deep learning | |
US7245241B2 (en) | Image coding with scalable context quantization | |
US12026925B2 (en) | Channel-wise autoregressive entropy models for image compression | |
JP2014525183A (ja) | 2dマトリクスにエンコーディングパラメータを保存する画像圧縮のための方法および装置 | |
US20220215595A1 (en) | Systems and methods for image compression at multiple, different bitrates | |
JP2017085603A (ja) | 領域ベースの画像圧縮 | |
US20220392117A1 (en) | Data compression and decompression system and method thereof | |
CN111641826B (zh) | 对数据进行编码、解码的方法、装置与系统 | |
JP2000032461A (ja) | 画像符号化方法、画像復号方法及び装置及びコンピュ―タプログラム製品 | |
US7583849B2 (en) | Lossless image compression with tree coding of magnitude levels | |
Zhang et al. | Lossless image compression using a multi-scale progressive statistical model | |
JP2022187683A5 (ja) | ||
Mahmud | An improved data compression method for general data | |
WO2021145105A1 (ja) | データ圧縮装置、およびデータ圧縮方法 | |
CN107231556B (zh) | 一种图像云储存设备 | |
Thakker et al. | Lossy Image Compression-A Comparison Between Wavelet Transform, Principal Component Analysis, K-Means and Autoencoders | |
JPH08331563A (ja) | さざ波変換を利用した映像圧縮方法 | |
Gray et al. | Image compression and tree-structured vector quantization | |
US20240291503A1 (en) | System and method for multi-type data compression or decompression with a virtual management layer | |
JP7534239B2 (ja) | 演算装置、圧縮方法 | |
Thanki et al. | Classification in Data Compression | |
US20230268931A1 (en) | Data compression system and data compression method | |
US7747093B2 (en) | Method and apparatus for predicting the size of a compressed signal |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210922 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220729 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220802 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220929 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230104 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230119 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230207 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230222 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7233875 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |