CN112261415A - 基于过拟合卷积自编码网络的图像压缩编码方法 - Google Patents

基于过拟合卷积自编码网络的图像压缩编码方法 Download PDF

Info

Publication number
CN112261415A
CN112261415A CN202011152119.2A CN202011152119A CN112261415A CN 112261415 A CN112261415 A CN 112261415A CN 202011152119 A CN202011152119 A CN 202011152119A CN 112261415 A CN112261415 A CN 112261415A
Authority
CN
China
Prior art keywords
image
coding
network
self
convolution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011152119.2A
Other languages
English (en)
Other versions
CN112261415B (zh
Inventor
张凌飞
何刚
张壮壮
曹庭炜
薛顺鑫
王永胜
张占辉
吴先鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qinghai Nationalities University
Original Assignee
Qinghai Nationalities University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qinghai Nationalities University filed Critical Qinghai Nationalities University
Priority to CN202011152119.2A priority Critical patent/CN112261415B/zh
Publication of CN112261415A publication Critical patent/CN112261415A/zh
Application granted granted Critical
Publication of CN112261415B publication Critical patent/CN112261415B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/167Position within a video image, e.g. region of interest [ROI]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明提供了一种基于过拟合卷积自编码网络的图像压缩编码方法,涉及图像编码技术领域,其包括:构建卷积自编码神经网络;生成训练数据集;训练卷积自编码网络;利用网络对高清自然图像进行编解码。本发明解决了现有图像编码损伤方法中未利用网络过拟合的特性和针对图像编码损伤的修复不足的问题,增强了网络针对编码损伤的学习能力,让深度学习网络有针对地参与到编解码过程,既节省了图像存储开销,又能保证压缩图像的质量,进一步提升了图像压缩编解码处理的速度与效果。

Description

基于过拟合卷积自编码网络的图像压缩编码方法
技术领域
本发明涉及图像编码技术领域,特别是涉及一种基于过拟合卷积自编码网络的图像压缩编码方法。
背景技术
随着技术发展,图像的视觉质量得到了大幅提升,其数据量也随之增长,给图像数据的存储和传输带来了较大的压力。
编码是一种在传输信息中降低信息冗余数据的有效手段,可减少传输压力,适应更为广泛的传输条件。针对图像进行编码后,编解码后得到的图像虽然有效减少了存储容量,与原始图像相比却具有压缩编码损伤,主观上表征为较明显的图像失真,具体体现为方块效应、振铃效应等视觉失真。
图像超分辨技术作为图像的后处理技术,在图像的压缩编码传输应用场景中,可用于编码后图像的质量增强。作为深度学习网络中的一种,卷积自编码网络是一种旨在将输入复制到输出的神经网络。该类型网络通过将输入压缩成一种隐藏空间表示后重构这种表示的输出。由于具有卷积层和自编码等结构,能够很好地提取图像特征,可在保留图像细节的前提下完成编码后图像的编码损伤修复,进而完成修复图像编码损伤的功能。
目前利用深度学习网络的过拟合结果的图像处理办法还很少,主要是避免深度学习网络产生过拟合结果,提高网络的网络泛化能力,增大了训练难度,也不能有效修复图像编码后损伤。
发明内容
针对现有技术中的上述问题,本发明提供了一种基于过拟合卷积自编码网络的图像压缩编码方法,解决了现有图像编码损伤方法中未利用网络过拟合的特性和针对图像编码损伤的修复不足的问题,增强了网络针对编码损伤的学习能力,让深度学习网络有针对地参与到编解码过程,既节省了图像存储开销,又能保证压缩图像的质量,进一步提升了图像压缩编解码处理的速度与效果。
为了达到上述发明目的,本发明采用的技术方案如下:
提供基于过拟合卷积自编码网络的图像压缩编码方法,其包括:
S1,构建卷积自编码网络
S11,搭建编码子网络,其结构依次为:第一卷积层→ReLU激活层→第二卷积层→第三卷积层→ReLU激活层→第四卷积层→ReLU激活层→第四卷积层→ReLU激活层→第四卷积层→ReLU激活层→第四卷积层→ReLU激活层→第四卷积层→ReLU激活层;
S12,搭建解码子网络,其结构依次为:第四卷积层→ReLU激活层→第四卷积层→ReLU激活层→第四卷积层→ReLU激活层→第四卷积层→ReLU激活层→第四卷积层→ReLU激活层→第一转置卷积层→ReLU激活层→第二转置卷积层→ReLU激活层→第三转置卷积层→Sigmoid激活层;
S13,设置卷积自编码网络的各层参数,将第一、第二、第三和第四卷积层的卷积核均设置为3,输入通道数分别为1、8、32、32,输出通道数分别为8、16、32、32,步长均为1;将第一、第二和第三转置卷积层的卷积核分别设置为4、4、3,输入通道数分别为32、16、8,输出通道数分别为16、8、1,步长分别为2、2、1;
S2,生成训练数据集
选取要压缩的n(n≥500)幅高清自然图像,对图像进行预处理,将所选的每幅图像进行前景和背景区域划分后转换成YUV420p数据格式图像;
将每幅图像输入到编码器中进行编码,得到编码后的图像编码码流;将编码后的图像编码码流输入到解码器中进行解码,得到多幅解码后的重建图像;
将所有YUV420p数据格式图像与解码后的重建图像构成一个训练数据集;
S3,训练卷积自编码网络
初始化卷积自编码网络,将训练数据集输入到卷积自编码网络中,在网络中遍历训练集,采用随机梯度下降法,对卷积自编码网络的参数进行迭代更新,直至图像损失loss值的均值收敛后终止迭代,得到训练好的卷积自编码网络;
S4,利用卷积自编码网络对高清自然图像进行编解码
提取一幅未被选择过的高清自然图像输入到训练好的卷积自编码网络中,得到编解码后的图像。
本发明的有益效果为:由于本发明构建并训练了由编码子网络和解码子网络组成的卷积自编码网络,利用训练导致网络过拟合后针对性更强的特性,使得本发明能够更好地修复目标图像的编码损伤。
由于本发明利用生成的训练集训练了卷积自编码网络,针对图像特有的编码损伤生成数据集,克服了现有技术网络使用的训练集对编码损伤针对不足,导致网络不能很好地修复重建图像的编码损伤的问题,使得本发明能够增强网络针对编码损伤的学习能力,提升解码后的图像质量。
在生成训练数据集中,对每幅图像进行前景和背景区域划分,一方面能够在低码率下保护重点区域,提高重点区域的图像质量,以降低工作机的处理工作量,提高处理速度,同时能够利用图像的区域划分信息调整编码策略,从而达到整体效果的提升。
附图说明
图1为基于过拟合卷积自编码网络的图像压缩编码方法的流程图。
具体实施方式
下面对本发明的具体实施方式进行描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
该基于过拟合卷积自编码网络的图像压缩编码方法,其包括:
S1,构建卷积自编码网络
S11,搭建编码子网络,其结构依次为:第一卷积层→ReLU激活层→第二卷积层→第三卷积层→ReLU激活层→第四卷积层→ReLU激活层→第四卷积层→ReLU激活层→第四卷积层→ReLU激活层→第四卷积层→ReLU激活层→第四卷积层→ReLU激活层。
S12,搭建解码子网络,其结构依次为:第四卷积层→ReLU激活层→第四卷积层→ReLU激活层→第四卷积层→ReLU激活层→第四卷积层→ReLU激活层→第四卷积层→ReLU激活层→第一转置卷积层→ReLU激活层→第二转置卷积层→ReLU激活层→第三转置卷积层→Sigmoid激活层。
S13,设置卷积自编码网络的各层参数,将第一、第二、第三和第四卷积层的卷积核均设置为3,输入通道数分别为1、8、32、32,输出通道数分别为8、16、32、32,步长均为1;将第一、第二和第三转置卷积层的卷积核分别设置为4、4、3,输入通道数分别为32、16、8,输出通道数分别为16、8、1,步长分别为2、2、1。
S2,生成训练数据集
选取要压缩的n(n≥500)幅高清自然图像,优选n=800,所选取的n幅高清自然图像中,每幅图像的长不小于1280像素,宽不小于720像素,且长和宽均为8的倍数,对图像进行预处理,将所选的每幅图像进行前景和背景区域划分后转换成YUV420p数据格式图像。
对图像进行前景和背景区域划分的方法为:
将第一图像下采样,得到第二图像,并预先设定需要划分的图像类别,基于所述的第二图像,确定第二图像的每一个宏块的图像类别,根据确定后的每一个宏块的图像类别情况,做区域联通处理,获取最终的图像区域划分;图像类别包括人脸、运动宏块、字幕和平坦宏块、极度可压缩宏块。
将每幅图像输入到编码器中进行编码,得到编码后的图像编码码流;将编码后的图像编码码流输入到解码器中进行解码,得到多幅解码后的重建图像。
将所有YUV420p数据格式图像与解码后的重建图像构成一个训练数据集。
S3,训练卷积自编码网络
初始化卷积自编码网络,将训练数据集输入到卷积自编码网络中,在网络中遍历训练集,采用随机梯度下降法,对卷积自编码网络的参数进行迭代更新,直至图像损失loss值的均值收敛后终止迭代,得到训练好的卷积自编码网络。
迭代更新卷积神经网络参数的方法如下:
第一步,将卷积神经网络的参数均初始化为高斯随机数,所述高斯随机数的均值为0,方差为1。
第二步,按照下式,计算所有图像损失loss值的均值:
Figure BDA0002739225330000051
其中,
Figure BDA0002739225330000052
表示所有图像损失值的均值,
Figure BDA0002739225330000053
表示卷积自编码网络生成的所有图像,y表示所有上述图像对应的训练集中的标签图像,∑表示求和操作,θ表示卷积神经网络中需要被迭代更新的参数,N表示批处理的大小,
Figure BDA0002739225330000061
为Charbonnier惩罚函数,
Figure BDA0002739225330000062
表示卷积自编码网络生成的第i幅图像,y(i)表示与上述图像对应的训练集中的标签图像。
第三步,按照下式,更新卷积自编码网络中的每一个参数值,直至图像损失loss值的均值收敛:
Figure BDA0002739225330000063
其中,θx′表示卷积自编码网络中第x个参数更新后的值,θx表示卷积自编码网络中第x个参数更新前的值,
Figure BDA0002739225330000064
表示求导操作。
S4,利用卷积自编码网络对高清自然图像进行编解码
提取一幅未被选择过的高清自然图像输入到训练好的卷积自编码网络中,得到编解码后的图像。
下面结合仿真实验对本发明的效果做进一步的说明:
仿真实验条件:
本发明的仿真实验的硬件平台为:处理器为Intel i7-7280 CPU,主频为3.60GHz,内存16GB,显卡为Nvidia GeForce 2080Ti GPU,显存为11GB。
本发明的仿真实验的软件平台为:Windows 10操作系统,Python3.6,Tensorflow1.14以及x265编码器。
本发明仿真实验所使用用以制作训练集的图像数据集为DIV2K的高清晰度自然图像,该数据集为2017年NTIRE图像超分辨竞赛公布所公布的数据集,涵盖具有丰富的自然纹理信息的1000张2K分辨率图片,均为RGB格式。选取其中已公开的800张训练类别图片。
本发明仿真实验所采用的测试图片集同样为DIV2K的800张高清晰度自然图。
2.仿真内容及其结果分析:
本发明仿真实验采用本发明和一个现有技术(JPEG图像压缩编码方法),先利用现有技术对输入的图像进行特殊的编解码处理,获得修复编码损伤后的编码图像。
利用目前通常采用的峰值信噪比PSNR值作为客观评价指标对本发明的图像超分辨处理效果进行评价。利用下述公式,分别计算本发明的仿真实验中PSNR值,包括网络输出的修复后的解码图像对应的原始未编码的图像的PSNR值:
Figure BDA0002739225330000071
Figure BDA0002739225330000072
其中,In为第一幅图像的第n个像素值,Pn为第二幅图像的第n个像素值。
结合PSNR值的计算结果可以看出,相比较于JPEG图像压缩编码的结果,PSNR值和主观评价分别有所提升,计算结果PSNR值越高说明图像质量越相近,图像的质量越高,证明本发明可以得到质量更好的编解码后的视频图像。
以上仿真实验表明:本发明方法利用搭建的卷积自编码网络,能够学习到图像编码损伤,并有针对性地对编解码后的重建图像进行编码损伤修复,结合网络所提取到高清晰度图像的细节特征,显著地改善了由于图像压缩编码损伤导致的图像失真,主观和客观上均提升了图像质量,解决了现有技术方法中仅利用高清晰度图像的细节特征,导致不能良好地修复编码损伤的问题。同时,本方法采用使深度学习网络过拟合的训练方式,让深度学习网络有针对地参与到编解码过程,既节省了图像存储开销,又能保证压缩图像的质量,进一步提升了图像压缩编解码处理的速度,是一种非常实用的图像压缩编码方法。

Claims (5)

1.一种基于过拟合卷积自编码网络的图像压缩编码方法,其特征在于,包括:
S1,构建卷积自编码网络
S11,搭建编码子网络,其结构依次为:第一卷积层→ReLU激活层→第二卷积层→第三卷积层→ReLU激活层→第四卷积层→ReLU激活层→第四卷积层→ReLU激活层→第四卷积层→ReLU激活层→第四卷积层→ReLU激活层→第四卷积层→ReLU激活层;
S12,搭建解码子网络,其结构依次为:第四卷积层→ReLU激活层→第四卷积层→ReLU激活层→第四卷积层→ReLU激活层→第四卷积层→ReLU激活层→第四卷积层→ReLU激活层→第一转置卷积层→ReLU激活层→第二转置卷积层→ReLU激活层→第三转置卷积层→Sigmoid激活层;
S13,设置卷积自编码网络的各层参数,将第一、第二、第三和第四卷积层的卷积核均设置为3,输入通道数分别为1、8、32、32,输出通道数分别为8、16、32、32,步长均为1;将第一、第二和第三转置卷积层的卷积核分别设置为4、4、3,输入通道数分别为32、16、8,输出通道数分别为16、8、1,步长分别为2、2、1;
S2,生成训练数据集
选取要压缩的n(n≥500)幅高清自然图像,对图像进行预处理,将所选的每幅图像进行前景和背景区域划分后转换成YUV420p数据格式图像;
将每幅图像输入到编码器中进行编码,得到编码后的图像编码码流;将编码后的图像编码码流输入到解码器中进行解码,得到多幅解码后的重建图像;
将所有YUV420p数据格式图像与解码后的重建图像构成一个训练数据集;
S3,训练卷积自编码网络
初始化卷积自编码网络,将训练数据集输入到卷积自编码网络中,在网络中遍历训练集,采用随机梯度下降法,对卷积自编码网络的参数进行迭代更新,直至图像损失loss值的均值收敛后终止迭代,得到训练好的卷积自编码网络;
S4,利用卷积自编码网络对高清自然图像进行编解码
提取一幅未被选择过的高清自然图像输入到训练好的卷积自编码网络中,得到编解码后的图像。
2.根据权利要求1所述的基于过拟合卷积自编码网络的图像压缩编码方法,其特征在于,所选取的n幅高清自然图像中,每幅图像的长不小于1280像素,宽不小于720像素,且长和宽均为8的倍数。
3.根据权利要求1所述的基于过拟合卷积自编码网络的图像压缩编码方法,其特征在于,对图像进行前景和背景区域划分的方法为:
将第一图像下采样,得到第二图像,并预先设定需要划分的图像类别,基于所述的第二图像,确定第二图像的每一个宏块的图像类别,根据确定后的每一个宏块的图像类别情况,做区域联通处理,获取最终的图像区域划分。
4.根据权利要求3所述的基于过拟合卷积自编码网络的图像压缩编码方法,其特征在于,所述的图像类别包括人脸、运动宏块、字幕和平坦宏块、极度可压缩宏块。
5.根据权利要求1所述的基于过拟合卷积自编码网络的图像压缩编码方法,其特征在于,步骤S3中所述迭代更新卷积神经网络参数的方法如下:
第一步,将卷积神经网络的参数均初始化为高斯随机数,所述高斯随机数的均值为0,方差为1;
第二步,按照下式,计算所有图像损失loss值的均值:
Figure FDA0002739225320000021
其中,
Figure FDA0002739225320000031
表示所有图像损失值的均值,
Figure FDA0002739225320000032
表示卷积自编码网络生成的所有图像,y表示所有上述图像对应的训练集中的标签图像,∑表示求和操作,θ表示卷积神经网络中需要被迭代更新的参数,N表示批处理的大小,
Figure FDA0002739225320000033
为Charbonnier惩罚函数,
Figure FDA0002739225320000034
表示卷积自编码网络生成的第i幅图像,y(i)表示与上述图像对应的训练集中的标签图像;
第三步,按照下式,更新卷积自编码网络中的每一个参数值,直至图像损失loss值的均值收敛:
Figure FDA0002739225320000035
其中,θ′x表示卷积自编码网络中第x个参数更新后的值,θx表示卷积自编码网络中第x个参数更新前的值,
Figure FDA0002739225320000036
表示求导操作。
CN202011152119.2A 2020-10-23 2020-10-23 基于过拟合卷积自编码网络的图像压缩编码方法 Active CN112261415B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011152119.2A CN112261415B (zh) 2020-10-23 2020-10-23 基于过拟合卷积自编码网络的图像压缩编码方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011152119.2A CN112261415B (zh) 2020-10-23 2020-10-23 基于过拟合卷积自编码网络的图像压缩编码方法

Publications (2)

Publication Number Publication Date
CN112261415A true CN112261415A (zh) 2021-01-22
CN112261415B CN112261415B (zh) 2022-04-08

Family

ID=74261806

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011152119.2A Active CN112261415B (zh) 2020-10-23 2020-10-23 基于过拟合卷积自编码网络的图像压缩编码方法

Country Status (1)

Country Link
CN (1) CN112261415B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180075581A1 (en) * 2016-09-15 2018-03-15 Twitter, Inc. Super resolution using a generative adversarial network
CN108765338A (zh) * 2018-05-28 2018-11-06 西华大学 基于卷积自编码卷积神经网络的空间目标图像复原方法
CN109035267A (zh) * 2018-06-22 2018-12-18 华东师范大学 一种基于深度学习的图像目标抠取方法
WO2019001095A1 (zh) * 2017-06-26 2019-01-03 杭州海康威视数字技术股份有限公司 一种视频编码方法、解码方法、装置及电子设备
CN110087092A (zh) * 2019-03-11 2019-08-02 西安电子科技大学 基于图像重构卷积神经网络的低码率视频编解码方法
CN110533591A (zh) * 2019-08-20 2019-12-03 西安电子科技大学 基于编解码器结构的超分辨图像重建方法
CN110751597A (zh) * 2019-10-12 2020-02-04 西安电子科技大学 基于编码损伤修复的视频超分辨方法
CN111754403A (zh) * 2020-06-15 2020-10-09 南京邮电大学 一种基于残差学习的图像超分辨率重构方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180075581A1 (en) * 2016-09-15 2018-03-15 Twitter, Inc. Super resolution using a generative adversarial network
WO2019001095A1 (zh) * 2017-06-26 2019-01-03 杭州海康威视数字技术股份有限公司 一种视频编码方法、解码方法、装置及电子设备
CN108765338A (zh) * 2018-05-28 2018-11-06 西华大学 基于卷积自编码卷积神经网络的空间目标图像复原方法
CN109035267A (zh) * 2018-06-22 2018-12-18 华东师范大学 一种基于深度学习的图像目标抠取方法
CN110087092A (zh) * 2019-03-11 2019-08-02 西安电子科技大学 基于图像重构卷积神经网络的低码率视频编解码方法
CN110533591A (zh) * 2019-08-20 2019-12-03 西安电子科技大学 基于编解码器结构的超分辨图像重建方法
CN110751597A (zh) * 2019-10-12 2020-02-04 西安电子科技大学 基于编码损伤修复的视频超分辨方法
CN111754403A (zh) * 2020-06-15 2020-10-09 南京邮电大学 一种基于残差学习的图像超分辨率重构方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
GANG HE; CHANG WU; LEI LI; JINJIA ZHOU; XIANGLIN WANG;ET AL: "A Video Compression Framework Using an Overfitted Restoration Neural Network", 《 2020 IEEE/CVF CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION WORKSHOPS (CVPRW)》 *

Also Published As

Publication number Publication date
CN112261415B (zh) 2022-04-08

Similar Documents

Publication Publication Date Title
Wang et al. Multi-level wavelet-based generative adversarial network for perceptual quality enhancement of compressed video
CN110415172B (zh) 一种面向混合分辨率码流中人脸区域的超分辨率重建方法
CN110751597B (zh) 基于编码损伤修复的视频超分辨方法
CN110751649B (zh) 视频质量评估方法、装置、电子设备及存储介质
CN107155110A (zh) 一种基于超分辨率技术的图片压缩方法
CN107463989A (zh) 一种基于深度学习的图像去压缩伪影方法
Luo et al. Lattice network for lightweight image restoration
CN108921910A (zh) 基于可伸缩卷积神经网络的jpeg编码压缩图像复原的方法
CN110717868A (zh) 视频高动态范围反色调映射模型构建、映射方法及装置
CN112132158A (zh) 一种基于自编码网络的可视化图片信息嵌入方法
CN114936977A (zh) 一种基于通道注意力和跨尺度特征融合的图像去模糊方法
CN111754400B (zh) 一种高效的图片超分辨率重建方法
Yadav et al. Flow-MotionNet: A neural network based video compression architecture
CN117522694A (zh) 一种基于扩散模型的图像超分辨率重建方法及系统
CN117541505A (zh) 基于跨层注意力特征交互和多尺度通道注意力的去雾方法
CN112261415B (zh) 基于过拟合卷积自编码网络的图像压缩编码方法
CN117152019A (zh) 一种基于双分支特征处理的低照度图像增强方法和系统
CN116416216A (zh) 基于自监督特征提取的质量评价方法、存储介质及终端
CN115587934A (zh) 基于损失分类与双分支网络的图像超分辨率重建和去雾方法及系统
CN115375540A (zh) 一种基于深度学习算法的太赫兹图像超分辨方法
Bao et al. Image Compression for Wireless Sensor Network: A Model Segmentation‐Based Compressive Autoencoder
CN115601242B (zh) 一种适用于硬件部署的轻量级图像超分辨率重建方法
CN117173263B (zh) 基于增强型多尺度残差生成对抗网络的图像压缩方法
CN111031312B (zh) 基于网络实现注意力机制的图像压缩方法
Xiong et al. Texture-guided Coding for Deep Features

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant