CN109903351A - 基于卷积神经网络和传统编码相结合的图像压缩方法 - Google Patents
基于卷积神经网络和传统编码相结合的图像压缩方法 Download PDFInfo
- Publication number
- CN109903351A CN109903351A CN201910157799.8A CN201910157799A CN109903351A CN 109903351 A CN109903351 A CN 109903351A CN 201910157799 A CN201910157799 A CN 201910157799A CN 109903351 A CN109903351 A CN 109903351A
- Authority
- CN
- China
- Prior art keywords
- image
- network
- neural networks
- enhcnn
- deccnn
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明属于数字图像处理技术领域,具体为一种基于卷积神经网络和传统编码相结合的图像压缩方法。本发明方法包括:利用卷积神经网络decCNN减少图像的高频信息分量;利用传统编码模块对图像进行压缩,得到用于存储以及传输的图像编码;将得到的编码数据进行解码,得到重构图像;利用卷积神经网络enhCNN对解码后的图像进行增强,提升重构效果。实验结果表明,在实现更高的压缩比时还能得到更好的图像重构质量,大大降低图像数据在存储、传输等过程中所需要占据的资源。
Description
技术领域
本发明属于数字图像处理技术领域,具体涉及一种图像压缩方法。
背景技术
随着计算机技术和网络通信技术不断地发展,实时视频通信、视频监控等领域越来越受到广泛关注。步入信息化时代后,互联网中的流动数据日益增加,对于当前的硬件技术所能提供的网络带宽以及存储资源来说是非常大的负担。图像数据作为互联网最重要的资源,对其进行有效的压缩无疑是很有意义的。图像压缩技术(Image Compression)是用尽可能少的数据来表示原始图像,同时允许恢复后的重构图像的质量有一定程度的失真,极大地减缓了图像数据存储、传输等过程的压力。
传统的图像编码标准比如JPEG(Joint Photographic Experts Group),以及能达到更高的压缩比的JPEG2000等都能通过去除图像中的冗余数据来减少用来表示图像的数据量,从而在获取更高的压缩比的同时保持很好的图像质量。
近年来利用深度学习进行图像压缩的研究层出不穷,比如 Toderici团队[1, 2]利用循环神经网络(Recurrent Neural Network,RNN)对图像进行渐进压缩,从而得到不同的压缩比;结合卷积神经网络(Convolutional Neural Network, CNN)来做图像压缩的有很多,如 Balle等人[3]使用一种加性噪声来代替量化过程中的不可导过程,Wangmeng等人人[4]基于权重来对图像的不同位置使用不同的压缩比,Mentzer等人[4]使用先验概率来对网络进行训练。这些人提出的方案都取得了很好的效果,而且每一种网络框架都是在神经网络的堆叠下构成的,整个过程都可以进行训练。
同样,也有利用神经网络和传统技术相结合的压缩方法,比如Feng等人[5]提出了使用传统技术压缩经CNN处理后的低分辨率图像。
发明内容
为了克服现有技术的不足,本发明的目的在于提供一种基于卷积神经网络和传统编码相结合的图像压缩方法,以减少在存储、传输图像数据时所需要消耗的资源。
本发明提供的基于卷积神经网络和传统编码相结合的图像压缩方法,具体步骤为:
(1)利用卷积神经网络减少图像的高频信息分量;
(2)使用传统压缩技术对图像进行压缩,得到编码数据,再对其解码得到重构图像;
(3)利用卷积神经网络对解码后的图像进行增强,提升重构效果。
进一步的,步骤(1)中,所述利用卷积神经网络减少图像的高频信息分量,是将图像输入卷积网络decCNN,提取特征,减少图像中的高频信息分量,得到与输入图像相同分辨率的图像。其中,decCNN网络主要包括3个卷积层:conv1,conv2,conv3。
进一步的,步骤(2)中,在经过前处理之后,图像中的高频信息更少,然后使用传统的压缩技术(比如JPEG)将处理后的图像进行压缩。由于传统压缩方法主要是压缩图像中的高频信息,对色彩的信息保留较好,因此处理包含较少高频分量的图像时,其压缩过程中的图像损失会更少。图像经过压缩后得到的编码表示可用于传输以及存储。最后,利用JPEG等技术将得到的编码表示进行解码,得到与输入图像相同分辨率的的重构图像。
进一步的,步骤(3)中,卷积神经网络enhCNN用于将重构图像进行增强,消除重构图像中的block效应等损失。enhCNN由20个卷积模块所构成,第一个卷积块包括一个卷积层conv和一个激活函数层relu,中间的18个卷积模块都是由一个卷积层conv、一个BN层以及一个relu层组成,最后再经过一个卷积层得到最终的输出图像。
由于整个压缩过程包含两个卷积神经网络以及一个传统编码过程,因此要对两段网络分别采取不同的损失函数。enhCNN网络所采用的损失函数是计算网络的输出与解码后的图和输入图像做的差之间的L2损失,这样使得网络的输出近似为解码后图像与输入原图之间的残差,网络最后得到的结果和解码后图像相加就能减小与输入原图之间的误差,从而达到更好的恢复效果;decCNN网络所采用的损失函数是计算网络最终输出与输入原图之间的L2损失和解码后的图与输入原图之间的L2损失相加的和。
进一步的,网络模型的训练方法如下:
采用交替训练,首先固定decCNN 网络的参数不变,更新enhCNN网络的参数来最小化enhCNN网络的损失函数;然后固定enhCNN网络的参数,训练decCNN网络,更新其参数用来最小化decCNN网络的损失函数。这样不断交替训练,直到两个网络的损失函数达到平衡。
进一步的,由于在传统编码的过程中有一步很重要的量化操作,用来产生离散的编码值,所以将传统方法结合在卷积网络中会由于其离散型导致网络训练受阻,因此将这个方法中的离散化过程设为输入与输出之间的梯度值不改变,这样使得网络能够正常的训练。
本发明的有益效果在于:本发明设计了一个端到端的图像压缩方法,在传统编码压缩图像前,首先使用CNN对图像进行前处理,减少图像的高频信息分量,降低传统编码压缩的图像失真,最后再利用CNN对解码后的图进行修复,使得最终重构图像更接近输入原图。实验结果表明,在实现相同的视觉效果时,本发明能得到更高的压缩比,将同一张图像压缩得更小。这样在实现更高的压缩比时还能得到更好的图像重构质量,大大降低了图像数据在存储、传输等过程中所需要占据的资源。
附图说明
图1为本发明的网络框架图。
图2为本发明的流程图。
图3为测试图像kodim23.png的压缩R-D曲线图。
图4为测试图像Lena.jpg的压缩效果对比图。
具体实施方式
下面通过实施例对本发明进行进一步说明,但是本发明的保护范围不局限于所述实施例。
采用图1中的网络结构,用400张大小为481×321的图像训练神经网络。
具体实施方法是:
(1)训练时,采用[7]所使用的方法,随机裁剪图像到180×180,再把裁剪后的图裁成64张大小为40×40的小图,裁剪时采用步长为20。设初始学习率为0.01,经过80个epoch之后衰减到0.0001。用Adam随机梯度下降的方法,最小化损失函数。批的大小设为64;
首先进行交替训练:固定decCNN网络的参数,最小化enhCNN网络的损失函数,让网络学习图像增强任务,再固定enhCNN网络的参数,最小化decCNN网络的损失函数,让网络学习减少高频信息的任务。经过一个epoch之后再次交替训练;
(2)测试时,将图像I调整大小到768×512,输入到训练好的模型中,模型输出当前图像压缩成更小的编码表示以及解码后的最终重构图像。计算重构图像与输入原始图像之间的PSNR(Peak signal-to-noise ratio)值作为网络的损失参数,编码表示的BPP(bit perpixel)作为衡量压缩后的比特率。在测试不同的压缩质量因子后,绘制成R-D(Rate-Distortion)曲线。
图3为测试图像kodim23.png的R-D曲线,可以看到经过本发明中的网络测试的结果要比直接用传统编码进行压缩的效果要好。在相同压缩比下本发明能实现更好的重构质量,在相同图像重构质量下能获得更高的压缩比。
图4为本发明测试图像Lena.png在相同的比特率0.156bpp下的压缩效果对比。图4(a)是原始图像,图(b)是直接使用JPEG压缩后的重构图,图(c)是采用本发明中的网络结构所得到的重构图。可以看到图(b)有很多地方存在块效应失真,而图(c)并没有这样的失真。
参考文献
[1] G. Toderici, S. M. O’Malley, S. J. Hwang, D. Vincent, D. Min[1]nen,S. Baluja, M. Covell, and R. Sukthankar. Variable rate image compression withrecurrent neural networks. International Conference on LearningRepresentations, (2016).
[2] G. Toderici, D. Vincent, N. Johnston, S. J. Hwang, D. Min[1]nen, J.Shor, and M. Covell. Full resolution image com[1]pression with recurrentneural networks. IEEE Conference on Computer Vision and Pattern Recognition,(2017).
[3] J. Balle, V. Laparra, and E. P. Simoncelli. End-to-end optimizedimage compression. International Conference on Learning Representations,(2017).
[4] M. Li, W. Zuo, S. Gu, D. Zhao, and D. Zhang. Learning convolutionalnetworks for content-weighted image compression. IEEE Conference on ComputerVision and Pattern Recognition, (2018).
[5] F Mentzer , E Agustsson , M Tschannen , et al. ConditionalProbability Models for Deep Image Compression. IEEE Conference on ComputerVision and Pattern Recognition, (2018).
[6] W Tao , F Jiang , S Liu , et al. An End-to-End Compression FrameworkBased on Convolutional Neural Networks. Data Compression Conference, (2017).
[7] Y. Chen and T. Pock, “Trainable nonlinear reaction diffusion: Aflexible framework for fast and effective image restoration,” arXiv:1508.02848, (2015).。
Claims (4)
1.基于卷积神经网络和传统编码相结合的图像压缩方法,其特征在于,具体步骤如下:
(1)利用卷积神经网络减少图像的高频信息分量:将图像输入卷积网络decCNN,提取特征,减少图像中的高频信息分量,得到与输入图像相同分辨率的图像;其中,decCNN网络包括3个卷积层:conv1,conv2,conv3;
(2)使用压缩技术对图像进行压缩,得到编码数据,再对其解码得到重构图像;
(3)利用卷积神经网络enhCNN对解码后的图像进行增强,提升重构效果;所述enhCNN由20个卷积模块所构成,第一个卷积模块包括一个卷积层conv和一个激活函数层relu,中间的18个卷积模块都是由一个卷积层conv、一个BN层以及一个relu层组成,最后卷积模块为一个卷积层conv,用于输出图像。
2.根据权利要求1所述的方法,其特征在于,网络模型的训练过程如下:
采用交替训练,首先固定decCNN 网络的参数不变,更新enhCNN网络的参数来最小化enhCNN网络的损失函数;然后固定enhCNN网络的参数,训练decCNN网络,更新其参数用来最小化decCNN网络的损失函数;这样不断交替训练,直道两个网络的损失函数达到平衡。
3. 根据权利要求2所述的方法,其特征在于, enhCNN网络采用的损失函数是计算网络的输出与解码后的图和输入图像做的差之间的L2损失;decCNN网络采用的损失函数是计算网络最终输出与输入原图之间的L2损失和解码后的图与输入原图之间的L2损失相加的和。
4.根据权利要求1、2或3所述的方法,其特征在于,步骤(2)中,编码过程中产生离散的编码值,离散化过程中设置输入与输出之间的梯度值不改变。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910157799.8A CN109903351B (zh) | 2019-03-02 | 2019-03-02 | 基于卷积神经网络和传统编码相结合的图像压缩方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910157799.8A CN109903351B (zh) | 2019-03-02 | 2019-03-02 | 基于卷积神经网络和传统编码相结合的图像压缩方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109903351A true CN109903351A (zh) | 2019-06-18 |
CN109903351B CN109903351B (zh) | 2023-05-30 |
Family
ID=66946155
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910157799.8A Active CN109903351B (zh) | 2019-03-02 | 2019-03-02 | 基于卷积神经网络和传统编码相结合的图像压缩方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109903351B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110493596A (zh) * | 2019-09-02 | 2019-11-22 | 西北工业大学 | 一种基于神经网络的视频编码框架 |
CN110880194A (zh) * | 2019-12-03 | 2020-03-13 | 山东浪潮人工智能研究院有限公司 | 一种基于卷积神经网络的图像压缩方法 |
WO2021018218A1 (zh) * | 2019-07-29 | 2021-02-04 | 杭州海康威视数字技术股份有限公司 | 一种数据存储方法、及其数据获取方法、装置 |
CN113034625A (zh) * | 2019-12-25 | 2021-06-25 | 武汉Tcl集团工业研究院有限公司 | 一种基于图片的无损压缩方法、智能终端及存储介质 |
CN113256744A (zh) * | 2020-02-10 | 2021-08-13 | 武汉Tcl集团工业研究院有限公司 | 一种图像编码、解码方法及系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105830134A (zh) * | 2013-12-16 | 2016-08-03 | 来特荣国际有限公司 | 面向加密通信的图像压缩扩展方法及装置、程序以及存储介质 |
CN106372577A (zh) * | 2016-08-23 | 2017-02-01 | 北京航空航天大学 | 一种基于深度学习的交通标志自动识别与标注方法 |
CN106709875A (zh) * | 2016-12-30 | 2017-05-24 | 北京工业大学 | 一种基于联合深度网络的压缩低分辨率图像复原方法 |
CN108921910A (zh) * | 2018-07-30 | 2018-11-30 | 浙江大学 | 基于可伸缩卷积神经网络的jpeg编码压缩图像复原的方法 |
CN109034034A (zh) * | 2018-07-12 | 2018-12-18 | 广州麦仑信息科技有限公司 | 一种基于强化学习算法优化卷积神经网络的静脉识别方法 |
CN109146989A (zh) * | 2018-07-10 | 2019-01-04 | 华南理工大学 | 一种通过搭建神经网络生成花鸟艺术字图像的方法 |
WO2019008752A1 (ja) * | 2017-07-07 | 2019-01-10 | 三菱電機株式会社 | データ処理装置、データ処理方法および圧縮データ |
-
2019
- 2019-03-02 CN CN201910157799.8A patent/CN109903351B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105830134A (zh) * | 2013-12-16 | 2016-08-03 | 来特荣国际有限公司 | 面向加密通信的图像压缩扩展方法及装置、程序以及存储介质 |
CN106372577A (zh) * | 2016-08-23 | 2017-02-01 | 北京航空航天大学 | 一种基于深度学习的交通标志自动识别与标注方法 |
CN106709875A (zh) * | 2016-12-30 | 2017-05-24 | 北京工业大学 | 一种基于联合深度网络的压缩低分辨率图像复原方法 |
WO2019008752A1 (ja) * | 2017-07-07 | 2019-01-10 | 三菱電機株式会社 | データ処理装置、データ処理方法および圧縮データ |
CN109146989A (zh) * | 2018-07-10 | 2019-01-04 | 华南理工大学 | 一种通过搭建神经网络生成花鸟艺术字图像的方法 |
CN109034034A (zh) * | 2018-07-12 | 2018-12-18 | 广州麦仑信息科技有限公司 | 一种基于强化学习算法优化卷积神经网络的静脉识别方法 |
CN108921910A (zh) * | 2018-07-30 | 2018-11-30 | 浙江大学 | 基于可伸缩卷积神经网络的jpeg编码压缩图像复原的方法 |
Non-Patent Citations (1)
Title |
---|
常子鹏等: "基于深度学习的岩心图像压缩模型研究", 《电脑知识与技术》 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021018218A1 (zh) * | 2019-07-29 | 2021-02-04 | 杭州海康威视数字技术股份有限公司 | 一种数据存储方法、及其数据获取方法、装置 |
CN110493596A (zh) * | 2019-09-02 | 2019-11-22 | 西北工业大学 | 一种基于神经网络的视频编码框架 |
CN110493596B (zh) * | 2019-09-02 | 2021-09-17 | 西北工业大学 | 一种基于神经网络的视频编码系统及方法 |
CN110880194A (zh) * | 2019-12-03 | 2020-03-13 | 山东浪潮人工智能研究院有限公司 | 一种基于卷积神经网络的图像压缩方法 |
CN113034625A (zh) * | 2019-12-25 | 2021-06-25 | 武汉Tcl集团工业研究院有限公司 | 一种基于图片的无损压缩方法、智能终端及存储介质 |
CN113256744A (zh) * | 2020-02-10 | 2021-08-13 | 武汉Tcl集团工业研究院有限公司 | 一种图像编码、解码方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN109903351B (zh) | 2023-05-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107018422B (zh) | 基于深度卷积神经网络的静止图像压缩方法 | |
CN107197260B (zh) | 基于卷积神经网络的视频编码后置滤波方法 | |
CN109903351A (zh) | 基于卷积神经网络和传统编码相结合的图像压缩方法 | |
CN110751597B (zh) | 基于编码损伤修复的视频超分辨方法 | |
CN103607591B (zh) | 结合超分辨率重建的视频图像压缩方法 | |
CN107463989B (zh) | 一种基于深度学习的图像去压缩伪影方法 | |
CN112734867B (zh) | 一种基于空谱特征分离提取的多光谱图像压缩方法及系统 | |
Tsai et al. | Learning binary residual representations for domain-specific video streaming | |
CN110351568A (zh) | 一种基于深度卷积网络的视频环路滤波器 | |
CN111711817B (zh) | 一种结合卷积神经网络的hevc帧内编码压缩性能优化方法 | |
CN103489203A (zh) | 基于字典学习的图像编码方法及系统 | |
CN107181949A (zh) | 一种结合超分辨率和残差编码技术的图像压缩框架 | |
CN109495744A (zh) | 基于联合生成对抗网络的大倍率遥感影像压缩方法 | |
CN109361919A (zh) | 一种联合超分辨率和去压缩效应的图像编码性能提升方法 | |
CN109922339A (zh) | 结合多采样率下采样和超分辨率重建技术的图像编码框架 | |
CN105392009A (zh) | 基于块自适应采样和超分辨率重建的低码率图像编码方法 | |
CN111726638A (zh) | 一种结合去压缩效应与超分辨率的hevc编码优化方法 | |
Zhang et al. | Efficient CTU-based intra frame coding for HEVC based on deep learning | |
CN110545426B (zh) | 基于编码损伤修复cnn的空域可分级视频编码方法 | |
Mali et al. | Neural JPEG: End-to-end image compression leveraging a standard JPEG encoder-decoder | |
CN102724495A (zh) | 基于率失真的Wyner-Ziv帧量化方法 | |
CN111080729A (zh) | 基于Attention机制的训练图片压缩网络的构建方法及系统 | |
Yang et al. | Graph-convolution network for image compression | |
Pu et al. | Image compression based on task-specific information | |
CN112565765B (zh) | 一种多点视频的分级编解码方法和传输装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |