CN111510578A - 基于强化学习的jpeg压缩图像重建方法 - Google Patents
基于强化学习的jpeg压缩图像重建方法 Download PDFInfo
- Publication number
- CN111510578A CN111510578A CN202010244589.5A CN202010244589A CN111510578A CN 111510578 A CN111510578 A CN 111510578A CN 202010244589 A CN202010244589 A CN 202010244589A CN 111510578 A CN111510578 A CN 111510578A
- Authority
- CN
- China
- Prior art keywords
- compressed
- jpeg
- processing tool
- compressed image
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/41—Bandwidth or redundancy reduction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Multimedia (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明涉及一种基于强化学习的JPEG压缩图像重建方法,包括下列步骤:第一步:制作JPEG压缩图像数据集:对于已经公开的图像数据集,进行4种不同程度的JPEG压缩生成含有压缩噪声的图片。第二步:设计JPEG压缩图像恢复工具:针对4种不同程度的JPEG压缩,分别训练重建算法参数,获得4个压缩图像恢复工具。第三步:训练最优处理工具选择网络,面对不同程度的压缩图片选择最合适的恢复工具。
Description
技术领域
本发明属于图像处理技术领域,涉及一种基于机器学习技术,采用强化学习重建JPEG压缩图像的方法。
背景技术
随着大数据时代的到来,图像信息因其更具有直观性,更加通俗易懂,已经是日常生活中必不可少的信息来源。虽然数字化技术已经非常成熟,但是存储器的存储容量、通信干线的信道带宽以及计算机的处理速度任然承受着较大压力。为了缓解压力,在传输或者保存图像时都经过了压缩编码。JPEG压缩编码常用的压缩方式。图像数据的冗余主要有:相邻位置的像素之间有一定的相关性,会产生空间上的冗余;同时在图像序列中,不同帧之间也会有一定的相关性,会产生时间上的冗余;还有频带冗余等。虽然图像压缩编码可以提高图像存储、传输以及处理的速度,节省存储空间,但是也会降低图像的分辨率,缺失细节信息,影响了图像的后续处理。
压缩图像重建是指从已有的低分辨率图像中恢复出损失的高频信息,进而获得高分辨率图像的技术。近年来,海内外诸多学者都对重建压缩图像进行了研究。Wang等设计了一种深度双域基础上的快速重建模型,利用了深度网络强大的学习能力以及专家系统[1];Yu等利用卷积神经网络实现人工痕迹的无缝衰减,并通过层次分解和联合使用大幅度卷积和反卷积网络来加速[2];在特定的先验知识(比如量化表)的帮助下,Liu等提出了一种分解压缩图片的方法,将压缩图片分为结构层和细节层分别采用不同的处理方法[3];Kang等先对图像进行去块操作后再进行重建,以避免压缩图像上的块痕迹对重建造成影响[4]。
[1]WangZ,LiuD,Chang S,etal.D3:Deep dual-domainbasedfastrestoration ofJPEG-compressedimages[C]//Proceedings oftheIEEE ConferenceonComputerVisionand Pattern Recognition.2016:2764-2772.
[2]YuK,DongC,LoyC C,etal.DeepConvolutionNetworksforCompressionArtifacts Reduction[J].arXivpreprintarXiv:1608.02778.2016.
[3]LiY,GuoF,TanRT,etal.AcontrastenhancementframeworkwithJPEGartifacts suppression[C]//EuropeanConferenceonComputerVision.SpringerInternational Publishing,2014:174-188.
[4]KangLW,HsuC C,etal.Self-learning-basedsingleimage super-resolutionofhighly compressedimage[C]
发明内容
本发明提供一种JPEG压缩图像重建方法,基于强化学习的方法对JPEG压缩图像重建,针对不同程度的压缩图片,自主采取最合适的重建方法,提高图像的细节信息,便于后续的处理,提高效率和准确率。
技术方案如下:
一种基于强化学习的JPEG压缩图像重建方法,包括下列步骤:
第一步:制作JPEG压缩图像数据集
对于已经公开的图像数据集,划分训练集和测试集,用matlab对训练集和测试集进行预处理,进行4种不同程度的JPEG压缩生成含有压缩噪声的图片。
第二步:设计JPEG压缩图像恢复工具
针对4种不同程度的JPEG压缩,分别训练重建算法参数,并生成对应的meta文件,获得4个压缩图像恢复工具,每个工具对恢复某个特定压缩程度的图片效果最好。采取的是生成对抗网络恢复重建算法。
第三步:训练最优处理工具选择网络
对压缩图像进行重建时,4个压缩图像恢复工具的恢复效果不同,利用DQN强化学习算法设计自主选择最优处理工具的网络,将选择问题看作马尔科夫过程,用回报函数来评价每一个动作。面对不同的当前状态,采取最合适的动作来转换状态使得回报函数最大化,将处理工具的选择视为离散的动作,面对不同程度的压缩图片选择最合适的恢复工具。
第四步:模型性能测试
将测试集中的4种不同程度JPEG压缩后的图片输入最优处理工具选择网络中,输出各图片最优恢复算法对应的标号,并对压缩图片进行对应的重建操作,得到重建后的图像;通过计算没有压缩的原始图片和重建后的图像之间的峰值功率信噪比PSNR,对模型的性能进行评估,PSNR值越高,恢复效果越好。
优选地,第三步包括:
(1)设环境状态St={It,vt},其中It表示输入的压缩图片向量,vt表示历史动作向量,第一步时,vt为0向量;t时刻个体采取的动作At∈{4个工具},采取动作即选择一种工具处理压缩图片,获得重建后图片,转换状态至St+1,同时得到环境的奖励Rt,计算公式如下:
Rt=||Itarget-It-1||2-||Itarget-It||2
其中Itarget表示无压缩原图;累计回报函数Q(t)=E(Rt+1+λRt+2+λ2Rt+3+…|St),其中E是期望函数,λ是衰减因子,累计回报函数Q(t)最大化与选择最优处理工具问题等价。
(2)确定训练最优处理工具选择网络参数调整方案:Batch设置为32,学习率设置为0.0001,探索率初值0.1,迭代次数设置为100000次,测试时将Batch设置为1,即每次只处理一张图像,训练最优处理工具选择网络参数,使得目标函数累计回报函数Q(t)最大化。
(3)训练迭代结束或者累计回报函数Q(t)收敛时,得到压缩图片最优处理工具选择网络:输入压缩图片,输出最优处理工具对应的标号。
本发明提出的基于强化学习的JPEG压缩图像重建方法,泛化能力好,重建之后的图片效果较好,提高了图片后续处理的效率。
附图说明
附图1 JPEG压缩图_1
附图2模型重建结果图_1
附图3 JPEG压缩图_2
附图4模型重建结果图_2
附图5 JPEG压缩图_3
附图6模型重建结果图_3
具体实施方式
为使本发明的技术方案更加清楚,下面结合附图对本发明具体实施方式做进一步地描述。
第一步:制作JPEG压缩图像数据集。
将DIV2K数据集按照15:1的比例分为训练集,测试集。用matlab对训练集和测试集进行预处理,采用JPEG压缩生成含有压缩噪声的图片,获得750张训练集图片,50张测试集图片。数据集中图片的压缩程度不同。本发明中使用了4种不同程度的JPEG压缩,如表2所示。
表2 JPEG压缩质量因子
第二步:设计JPEG压缩图像恢复工具。
针对4种不同程度的JPEG压缩,分别训练重建算法参数,并生成对应的meta文件,获得4个压缩图像恢复工具,每个处理工具对恢复某个特定压缩程度的图片效果最好。本发明采取的是生成对抗网络恢复重建算法。
第三步:训练最优处理工具选择网络。
当压缩图像输入模型中,4个处理工具的恢复效果不同,所以应当设计自主选择最优处理工具的网络。强化学习算法,将决策看作马尔科夫过程,用回报函数来评价每一个动作。面对不同的当前状态,采取最合适的动作来转换状态使得回报函数最大化。本发明采用DQN强化学习算法,将处理工具的选择视为离散的动作,面对不同程度的压缩图片选择最合适的恢复工具。
本发明DQN算法中,环境状态St={It,vt},其中It表示当前的输入的图片向量,vt表示历史动作向量,第一步时,vt为0向量;t时刻个体采取的动作At∈{4个工具},采取动作即选择一种工具处理图片,得到状态St+1;环境的奖励Rt:
Rt=||Itarget-It-1||2-||Itarget-It||2
其中Itarget表示无压缩原图;累计回报函数Q(t)=E(Rt+1+λRt+2+λ2Rt+3+…|St),其中E是期望函数,λ是衰减因子,累计回报函数Q(t)最大化与选择最优处理工具问题等价。
由于本发明所使用的数据尺寸较大,经过多次实验结果,最终决定训练参数调整方案:Batch设置为32,学习率设置为0.0001,探索率初值0.1,网络更新频率1000,迭代次数设置为100000次。测试检测模型时,测试时将Batch设置为1,即每次只处理一张图像。训练网络参数,使得目标函数Q(t)最大化。实验环境为Ubuntu16.04操作系统,利用NVIDIA公司6GB显存的RTX2060GPU进行网络的训练并利用CUDA进行训练的加速。
网络迭代结束或者收敛时,得到压缩图片最优处理工具选择网络,输入压缩图片,输出最优处理工具对应的标号。
第四步:模型性能测试。
将测试集中的4种不同程度JPEG压缩后的图片输入最优处理工具选择网络中,输出各图片最优恢复算法对应的标号,并对压缩图片进行对应的重建操作,得到重建后的图像。通过计算没有压缩的原始图片和重建后的图像之间的峰值功率信噪比PSNR,对模型的性能进行评估,PSNR值越高,恢复效果越好。
PSNR的定义为:
其中m,n,c表示图像的尺寸,本发明中为256,256,8;x为没有压缩的原始图片,y时重建后的图片,MAXI是像素最大值,即为255。
对实验数据进行分析与处理,评价本系统重建JPEG压缩图片的性能。测试后结果如表1所示,对比可知,模型重建效果较好,在一定程度上提高了图片质量。
Claims (3)
1.一种基于强化学习的JPEG压缩图像重建方法,包括下列步骤:
第一步:制作JPEG压缩图像数据集
对于已经公开的图像数据集,划分训练集和测试集,用matlab对训练集和测试集进行预处理,进行4种不同程度的JPEG压缩生成含有压缩噪声的图片。
第二步:设计JPEG压缩图像恢复工具
针对4种不同程度的JPEG压缩,分别训练重建算法参数,并生成对应的meta文件,获得4个压缩图像恢复工具,每个工具对恢复某个特定压缩程度的图片效果最好。
第三步:训练最优处理工具选择网络
对压缩图像进行重建时,4个压缩图像恢复工具的恢复效果不同,利用DQN强化学习算法设计自主选择最优处理工具的网络,将选择问题看作马尔科夫过程,用回报函数来评价每一个动作。面对不同的当前状态,采取最合适的动作来转换状态使得回报函数最大化,将处理工具的选择视为离散的动作,面对不同程度的压缩图片选择最合适的恢复工具。
第四步:模型性能测试
将测试集中的4种不同程度JPEG压缩后的图片输入最优处理工具选择网络中,输出各图片最优恢复算法对应的标号,并对压缩图片进行对应的重建操作,得到重建后的图像;通过计算没有压缩的原始图片和重建后的图像之间的峰值功率信噪比PSNR,对模型的性能进行评估,PSNR值越高,恢复效果越好。
2.根据权利要求1所述的方法,其特征在于,第二步,采用生成对抗网络恢复重建算法。
3.根据权利要求1所述的方法,其特征在于,第三步包括:
(1)设环境状态St={It,vt},其中It表示输入的压缩图片向量,vt表示历史动作向量,第一步时,vt为0向量;t时刻个体采取的动作At∈{4个工具},采取动作即选择一种工具处理压缩图片,获得重建后图片,转换状态至St+1,同时得到环境的奖励Rt,计算公式如下:
Rt=||Itarget-It-1||2-||Itarget-It||2
其中Itarget表示无压缩原图;累计回报函数Q(t)=E(Rt+1+λRt+2+λ2Rt+3+…|St),其中E是期望函数,λ是衰减因子,累计回报函数Q(t)最大化与选择最优处理工具问题等价。
(2)确定训练最优处理工具选择网络参数调整方案:Batch设置为32,学习率设置为0.0001,探索率初值0.1,迭代次数设置为100000次,测试时将Batch设置为1,即每次只处理一张图像,训练最优处理工具选择网络参数,使得目标函数累计回报函数Q(t)最大化。
(3)训练迭代结束或者累计回报函数Q(t)收敛时,得到压缩图片最优处理工具选择网络:输入压缩图片,输出最优处理工具对应的标号。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010244589.5A CN111510578B (zh) | 2020-03-31 | 2020-03-31 | 基于强化学习的jpeg压缩图像重建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010244589.5A CN111510578B (zh) | 2020-03-31 | 2020-03-31 | 基于强化学习的jpeg压缩图像重建方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111510578A true CN111510578A (zh) | 2020-08-07 |
CN111510578B CN111510578B (zh) | 2021-07-09 |
Family
ID=71875732
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010244589.5A Active CN111510578B (zh) | 2020-03-31 | 2020-03-31 | 基于强化学习的jpeg压缩图像重建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111510578B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104217388A (zh) * | 2014-01-22 | 2014-12-17 | 河南师范大学 | 一种基于fssvm的图像水印嵌入、提取的方法与装置 |
CN104361548A (zh) * | 2014-10-28 | 2015-02-18 | 河南师范大学 | 基于bp神经网络数字图像压缩的图像水印嵌入与提取方法 |
CN106124413A (zh) * | 2016-07-18 | 2016-11-16 | 天津大学 | 一种基于双像素的提高太赫兹波压缩感知成像质量的装置 |
WO2017175231A1 (en) * | 2016-04-07 | 2017-10-12 | Carmel Haifa University Economic Corporation Ltd. | Image dehazing and restoration |
-
2020
- 2020-03-31 CN CN202010244589.5A patent/CN111510578B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104217388A (zh) * | 2014-01-22 | 2014-12-17 | 河南师范大学 | 一种基于fssvm的图像水印嵌入、提取的方法与装置 |
CN104361548A (zh) * | 2014-10-28 | 2015-02-18 | 河南师范大学 | 基于bp神经网络数字图像压缩的图像水印嵌入与提取方法 |
WO2017175231A1 (en) * | 2016-04-07 | 2017-10-12 | Carmel Haifa University Economic Corporation Ltd. | Image dehazing and restoration |
CN106124413A (zh) * | 2016-07-18 | 2016-11-16 | 天津大学 | 一种基于双像素的提高太赫兹波压缩感知成像质量的装置 |
Non-Patent Citations (2)
Title |
---|
SRI MUKTSAR SAHIB: "Compressed Image Optimization Using Intelligent Water Drop Algorithm", 《INTERNATIONAL JOURNAL OF INNOVATIVE SCIENCE, ENGINEERING & TECHNOLOGY》 * |
梁晓玲: "运用MATLAB 进行数字图像的分析及有关处理", 《中国新通信》 * |
Also Published As
Publication number | Publication date |
---|---|
CN111510578B (zh) | 2021-07-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112884851B (zh) | 基于展开迭代优化算法的深度压缩感知网络的构建方法 | |
Chen et al. | Exploiting intra-slice and inter-slice redundancy for learning-based lossless volumetric image compression | |
Wu et al. | A gan-based tunable image compression system | |
US5754702A (en) | Scale oriented interband prediction method for image data compression and reconstruction | |
CN109903351B (zh) | 基于卷积神经网络和传统编码相结合的图像压缩方法 | |
CN111489305B (zh) | 基于强化学习的图像增强方法 | |
Chen et al. | Two-stage octave residual network for end-to-end image compression | |
CN111669588B (zh) | 一种超低时延的超高清视频压缩编解码方法 | |
Wang et al. | Adaptive image compression using GAN based semantic-perceptual residual compensation | |
Yadav et al. | Flow-MotionNet: A neural network based video compression architecture | |
CN112492313B (zh) | 一种基于生成对抗网络的图片传输系统 | |
Chen et al. | Generative Visual Compression: A Review | |
CN111510578B (zh) | 基于强化学习的jpeg压缩图像重建方法 | |
CN111489306A (zh) | 基于强化学习的图像去噪方法 | |
Gao et al. | Extremely low bit-rate image compression via invertible image generation | |
Li et al. | Multirate Progressive Entropy Model for Learned Image Compression | |
Chen et al. | Movi-codec: Deep video compression without motion | |
Gao et al. | Volumetric end-to-end optimized compression for brain images | |
CN114494472A (zh) | 基于深度自注意力变换网络的图像压缩方法 | |
CN113194312A (zh) | 结合视觉显著性的行星科学探测图像自适应量化编码系统 | |
CN113822801A (zh) | 基于多分支卷积神经网络的压缩视频超分辨率重建方法 | |
Hu et al. | A Decoupled Spatial-Channel Inverted Bottleneck For Image Compression | |
Saudagar | Learning based coding for medical image compression | |
Chen et al. | Blind JPEG Compression Artifacts Removal by Integrating Channel Regulation With Exit Strategy | |
CN117893624B (zh) | 基于四元数神经网络的彩色图像无损压缩与解压缩方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |