CN115052148A - 一种基于模型分割压缩自编码器的图像压缩算法 - Google Patents

一种基于模型分割压缩自编码器的图像压缩算法 Download PDF

Info

Publication number
CN115052148A
CN115052148A CN202210868534.0A CN202210868534A CN115052148A CN 115052148 A CN115052148 A CN 115052148A CN 202210868534 A CN202210868534 A CN 202210868534A CN 115052148 A CN115052148 A CN 115052148A
Authority
CN
China
Prior art keywords
network
image
feature map
pixel blocks
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210868534.0A
Other languages
English (en)
Other versions
CN115052148B (zh
Inventor
包学才
叶辰
何海清
吴沂航
聂菊根
韩龙哲
谭文群
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanchang Institute of Technology
Original Assignee
Nanchang Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanchang Institute of Technology filed Critical Nanchang Institute of Technology
Priority to CN202210868534.0A priority Critical patent/CN115052148B/zh
Publication of CN115052148A publication Critical patent/CN115052148A/zh
Application granted granted Critical
Publication of CN115052148B publication Critical patent/CN115052148B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Processing (AREA)

Abstract

本发明涉及一种基于模型分割压缩自编码器的图像压缩算法包括:图像数据集的获取、数据集的预处理、构建MS‑CAE网络模型、MS‑CAE网络模型的训练。MS‑CAE网络模型包括:编码网络和解码网络;所述编码网络及其权值参数部署在边缘设备,用于对输入的像素块进行压缩;所述解码网络及其权值参数部署在云端设备,用于获取压缩后的像素块,对其进行升维,得到升维后的像素块;将所述升维后的像素块进行拼接,重构处完整的图像。本发明针对传感网络节点和云端的计算资源特眯,优化了图像压缩模型的模型复杂度和重构图像质量,获得了良好的效果。

Description

一种基于模型分割压缩自编码器的图像压缩算法
技术领域
本发明涉及图像压缩技术领域,特别是涉及一种基于模型分割压缩自编码器的图像压缩算法。
背景技术
环境监测是生态环境保护的基础,图像监测作为直观且取证的重要数据,已成为目前各类监测的重要手段。然而,对于偏远地区的图像监测,无线传感监测节点的计算和存储资源有限,难以存储与发送复杂且数量庞大的图像数据,所以需要对图像信息压缩并且进行传输。另一方面,为了方便云端接收端获取图像,需要对这些图像信息解析,实现直接观测、图像识别与目标检测等工作,就要求高分辨率的图像。因此,如何提升传感网络中图像的压缩与传输效率,减少云端图像存储的容量,并提高云端设备解析的图像质量是现有技术所存在的问题。
发明内容
为了克服现有技术的不足,本发明的目的是提供一种基于模型分割压缩自编码器的图像压缩算法,本发明根据传感网络的实际需求对训练完备的模型进行分割。提高了模型的训练速度,实现了模型分割后的部署工作,提高了重构压缩图像质量。
为实现上述目的,本发明提供了如下方案:
一种基于模型分割压缩自编码器的图像压缩算法,包括:
图像数据集的获取、数据集的预处理、构建MS-CAE网络模型、MS-CAE网络模型的训练;
数据集的预处理包括:对获取的图像数据集进行分割处理,将填充图像分割为像素块;
MS-CAE网络模型包括:编码网络和解码网络;
所述编码网络及其权值参数部署在边缘设备,用于对输入的像素块进行压缩;
减小所述编码网络的规模,用于减小所述边缘设备的负担;
所述解码网络及其权值参数部署在云端设备,用于获取压缩后的像素块,对其进行升维,得到升维后的像素块;
增大所述解码网络的规模,用于提升解码图像的质量;
将所述升维后的像素块进行拼接,重构处完整的图像。
优选地,所述图像数据集包括:肖像、卡通、游戏、自然风光、广告图案、城市场景、医学影像七大类图像,包含具有1280×720分辨率的多张图片。
优选地,图像数据集的分割处理包括:
将输入的720p图像分割为60个128*128*3小像素块。
优选地,编码网络的训练过程包括:
将60个128*128*3小像素块输入编码网络中,所述编码网络对输入的所述小像素块进行特征降维处理,其中,所述小像素块进入EN_conv1层,通过卷积单元Conv5/2p1.5,得到64*64*64的特征图;所述64*64*64的特征图进入EN_conv2层,通过卷积单元Conv5/2p1.5,形成32*32*128的特征图;将32*32*128特征图与三层两个相同的卷积层EN_block1、EN_block2和EN_block3层经过卷积单元Conv3/1p1进行特征的线性叠加,形成新的32*32*128的特征图;整合线性叠加所获取的特征,新的32*32*128的特征图进入EN_conv3,通过卷积单元Conv5/1p2,将其压缩为32*32*32的压缩特征图,并发送至解码网络。
优选地,所述解码网络的训练过程为:
对所述32*32*32的压缩特征图通过量化器进行量化,得到量化系数;
所述量化系数作为所述解码网络的输入,进入up_DEconv1层,通过卷积单元Conv3/1p1升维形成32*32*64的特征图;通过卷积单元ConvTransposed2/2p1将32*32*64的特征图升维形成64*64*128的特征图,并将其发送至残差块网络进行处理;将处理后产生的64*64*128的特征图通过三层两个相同的卷积层DE_blcok1、DE_block2和DE_block3层经过卷积单元Conv3/1p1进行特征线性叠加进行特征升维,形成新的64*64*128的特征图;将新的64*64*128的特征图输入up_DEconv2层,通过卷积单元Conv3/1p1将64*64*128的特征图升维形成128*128*32的特征图;将128*128*32的特征图通过卷积单元Conv5/1p2将128*128*32的特征图变成128*128*256的特征图;将128*128*256的特征图输入up_DEconv3层,通过卷积单元Conv3/1p1将128*128*256的特征图变成128*128*16的特征图;将128*128*16的特征图通过卷积单元Conv3/1p2形成128*128*3的重构图像像素块,将重构图像像素块按顺序进行拼接,重构出完整图像。
优选地,将64*64*128的特征图发送至残差块网络进行处理包括:
64*64*128的特征图首先通过残差块网络的Conv1/1,进行一次正则化BatchNormal处理,再通过PReLU函数激活,通过Conv3/1p1,进行一次正则化BatchNormal处理,再通过PReLU函数激活,通过Conv1/1,进行一次正则化BatchNormal处理,在通过PReLU函数激活,将三次残差迭代的结果送入SUM函数进行加权并通过PReLU函数激活,输出残差块函数迭代的结果。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明提供了一种基于模型分割压缩自编码器的图像压缩算法时,能够根据重构图像质量的不同调整压缩比率,实现高比率压缩或者高分辨率图像的重构;灵活性较高;压缩图像的时间减少;传输压缩图像文件的效率高;重构图像具有高分辨率等特征。实现了水环境图像监测的需求,在算法模型中修改了编码网络和解码网络的结构,在重构图像时采用残差网络块进行特征迭代,提高重构系数的精度同时减少系数冗余,使之更为适用于水环境图像的压缩工作,促进了偏远地区的无线传感网络的图像监测工作,传输效率的提升也符合能源节约的新时代主题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的实施例中的整体流程图;
图2为本发明提供的实施例中的压缩自编码器的网络架构;
图3为本发明提供的实施例中的峰值信噪比PSNR性能对比图;
图4为本发明提供的实施例中的结构相似度SSIM性能对比图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供提供一种基于模型分割压缩自编码器的图像压缩算法,本发明根据传感网络的实际需求对训练完备的模型进行分割。提高了模型的训练速度,实现了模型分割后的部署工作,提高了重构压缩图像质量。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
如图1-4所示,本发明提供了一种基于模型分割压缩自编码器的图像压缩算法,包括:
图像数据集的获取、数据集的预处理、构建MS-CAE网络模型、MS-CAE网络模型的训练;
数据集的预处理包括:对获取的图像数据集进行分割处理,将填充图像分割为像素块,对训练MS-CAE网络使用的每幅720p的图像分割进行像素块分割,即每幅图像被分割为60个小像素块;
MS-CAE网络模型包括:编码网络和解码网络;
所述编码网络及其权值参数部署在边缘设备,用于对输入的像素块进行压缩;编码网络将预处理过程输出的60个三通道128×128小像素块作为输入,通过首次特征降维,产生64个64×64的特征图;简化编码网络结构,通过将128个的32×32特征块与三层两个相同的Conv3/1p1卷积层进行特征线性叠加,尽可能保留出现频率较低的特征矩阵系数用于图像特征提取;像素块通过编码网络将128×128的小像素块压缩成为32个32×32的特征图作为无线传感网络节点存储与传输的压缩图像文件;由于编码网络压缩图像后形成的特征矩阵图存在系数冗余,因此,引入量化器将特征矩阵的系数进行量化,即采用向下舍入的方式,取不大于系数x本身的整数,再结合数学期望和随机概率合理保留系数小数部分,以保证特征系数的精度;量化特征系数之后,通过两次卷积操作将压缩特征图进行特征升维,即将32×32的特征图升维成64×64的特征图;
所述解码网络及其权值参数部署在云端设备,用于获取压缩后的像素块,对其进行升维,得到升维后的像素块;为了防止梯度消失、网络退化问题,设置由三个较小卷积单元组成的残差块网络进行若干次迭代处理以保证系数精度与防止系数冗余;再将通过残差块网络处理后产生的128通道64×64的特征图通过三层两个相同的Conv3/1p1卷积层进行特征线性叠加进行特征升维;为了在云端计算机设备上获取与原图像大小一致的高分辨率重构图像,将上一步骤产生的128通道的64×64的特征图升维成3通道的128×128像素块;通过像素块拼接,将重构的64个128×128像素块按顺序进行拼接,重构出完整的图像用于监测需求
将所述升维后的像素块进行拼接,重构处完整的图像。
进一步的,所述图像数据集包括:肖像、卡通、游戏、自然风光、广告图案、城市场景、医学影像七大类图像,包含具有1280×720分辨率的2285张图片。
进一步的,图像数据集的分割处理包括:
将输入的720p图像分割为60个三通道128×128小像素块,图像像素块分块预处理操作:像素块分割的目的是将720p(1280×720×3)像素的训练图像分割成128p(128×128×3)像素。具体操作如下:
首先,填充图像的宽度(1280×720×3→1280×768×3)。接着,将图像分割成小的像素块(128×128×3)。最后,将批量的像素块打包输入到MS-CAE网络中。。
进一步的,包括:
减小所述编码网络的规模,用于减小所述边缘设备的负担;
增大所述解码网络的规模,用于提升解码图像的质量
将模型分割分别部署于无线传感网络的边缘设备和云端设备。为了减轻WSN中边缘设备的负担,将相对较小规模的编码网络的模型参数部署至边缘设备。此外,为了提高重构图像的质量,将更复杂的解码网络模型的权值参数部署至云端设备中。
进一步的,包括:
所述编码网络对输入的所述小像素块进行特征降维处理,进入EN_conv1层,通过卷积单元,得到64*64*64的特征图;所述64*64*64的特征图进入EN_conv2层,通过卷积单元Conv5/2p1.5,形成32*32*128的特征图;将32*32*128特征图与三层两个相同的卷积层EN_block1、EN_block2和EN_block3层经过卷积单元Conv3/1p1进行特征的线性叠加;整合线性叠加所获取的特征,进入EN_conv3,通过卷积单元Conv5/1p2,将32*32*128的特征图压缩为32*32*32的压缩特征图。
进一步的,所述编码网络还包括:
对所述32*32*32的压缩特征图通过量化器进行量化,得到量化系数;
所述量化系数作为所述解码网络的输入,通过两次卷积操作将压缩特征图进行特征升维,将32*32*32的特征图升维成64*64*64的特征图。
进一步的,所述解码网络还包括:
残差块网络;
所述残差块网络包括:三个较小卷积单元,用于进行多次迭代处理,保证系数精度与防止系数冗余;
对经过所述残差块网络处理后的特征图进行特性线性叠加与特性升维处理,得到128*128像素块;
对所述像素块进行拼接,得到重构图像。
更进一步的,本发明所设计的算法模型详细训练过程如下:
步骤1:获取训练图像数据集,输入尺寸为1280*720*3的RGB图像;
步骤2:进行图像分块的预处理操作,将720p(1280×720×3)像素的训练图像分割成128p(128×128×3)像素。首先,填充图像的宽度(1280×720×3→1280×768×3)。接着,将图像分割成小的像素块(128×128×3)。最后,将批量的像素块打包输入到MS-CAE网络中;
步骤3:进入EN_conv1层,通过卷积单元Conv5/2p1.5(卷积核为5*5,步长为2,填充大小为1.5),形成64*64*64的特征图;
步骤4:进入EN_conv2层,通过卷积单元Conv5/2p1.5,形成32*32*128的特征图;
步骤5:通过将32*32*128特征图与三层两个相同的卷积层EN_block1、EN_block2和EN_block3层经过卷积单元Conv3/1p1(卷积核为3,步长为1,填充大小为1)进行特征的线性叠加,形成32*32*128的特征图,尽可能保留出现频率较低的特征矩阵系数用于图像特征提取;
步骤6:接着,整合线性叠加所获取的特征,进入EN_conv3,通过卷积单元Conv5/1p2(卷积核为5,步长为1,填充大小为2),将32*32*128的特征图压缩为32*32*32的压缩特征图;
步骤7:将32*32*32的压缩特征图经过量化器将特征矩阵的系数进行量化,采用向下舍入的方式,取不大于系数x本身的整数,再结合数学期望和随机概率合理保留系数小数部分,以保证特征系数的精度,量化后得到量化系数矩阵;
步骤8:量化系数进入解码网络,用于重构图像,进入up_DEconv1层,通过卷积单元Conv3/1p1升维形成32*32*64的特征图;
步骤9:通过卷积单元ConvTransposed2/2p1(卷积核为2,步长为2,填充大小为1)将32*32*64的特征图进一步升维形成64*64*128的特征图;
步骤10:为了防止梯度消失、网络退化问题,设置由三个较小卷积单元(Conv1/1、Conv3/1p1与Conv1/1),系数进入残差块网络时,首先通过Conv1/1(卷积核为1,步长为1,填充大小为1),进行一次正则化BatchNormal处理,再通过PReLU函数激活;其次,通过Conv3/1p1(卷积核为3,步长为1,填充大小为1),进行一次正则化BatchNormal处理,再通过PReLU函数激活;接着,通过Conv1/1(卷积核为1,步长为1,填充大小为1),进行一次正则化BatchNormal处理,在通过PReLU函数激活。最后,将三次残差迭代的结果送入SUM函数进行加权并通过PReLU函数激活,输出残差块函数迭代的结果。
步骤11:通过将残差块网络处理后产生的64*64*128的特征图通过三层两个相同的卷积层DE_blcok1、DE_block2和DE_block3层经过卷积单元Conv3/1p1进行特征线性叠加进行特征升维,形成64*64*128的特征图;
步骤12:进一步升维操作,进入up_DEconv2层,通过卷积单元Conv3/1p1将64*64*128的特征图升维形成128*128*32的特征图;再通过卷积单元Conv5/1p2将128*128*32的特征图变成128*128*256的特征图;
步骤13:进入up_DEconv3层,通过卷积单元Conv3/1p1将128*128*256的特征图变成128*128*16尺寸的特征图;最后,通过卷积单元Conv3/1p2(卷积核为3,步长为1,填充大小为2)形成128*128*3的重构图像像素块。
上述涉及的卷积核单元的详细描述如表1所示:
表1:
Figure BDA0003759617770000081
在各个比特率下,将本发明方法与JPEG、JPEG2000、FRIC-RNN与传统CAE算法相比,在较低的每个像素比特位数(bitperpixel,bbp)下,峰值信噪比PSNR性能明显高于其他算法,在bbp等于0.4-1.0之间,结构相似度SSIM同样优于其他算法。
将本发明方法与JPEG、JPEG2000、FRIC-RNN与传统CAE算法进行压缩单幅图像所需要的平均运行时间的对比结果如表2所示:
表2:
Figure BDA0003759617770000082
Figure BDA0003759617770000091
本发明针对无线传感网络中的水环境监测问题,提供一种模型分割的压缩自编码器算法模型实现图像压缩与重构。首先,将图像划分为若干个像素块,编码像素块并输出压缩特征图。其次,将量化器输出的量化编码系数作为解码网络的输入进行解码得到重构图像。最后,将训练完成的MS-CAE网络模型分为编码网络和解码网络两部分分别部署至无线传感网络中的边缘设备与云端设备。
本发明的有益效果如下:
能够根据重构图像质量的不同调整压缩比率,实现高比率压缩或者高分辨率图像的重构;灵活性较高;压缩图像的时间减少;传输压缩图像文件的效率高;重构图像具有高分辨率等特征。实现了水环境图像监测的需求,在算法模型中修改了编码网络和解码网络的结构,在重构图像时采用残差网络块进行特征迭代,提高重构系数的精度同时减少系数冗余,使之更为适用于水环境图像的压缩工作,促进了偏远地区的无线传感网络的图像监测工作,传输效率的提升也符合能源节约的新时代主题。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

Claims (6)

1.一种基于模型分割压缩自编码器的图像压缩算法,其特征在于,包括:
图像数据集的获取、数据集的预处理、构建MS-CAE网络模型、MS-CAE网络模型的训练;
数据集的预处理包括:对获取的图像数据集进行分割处理,将填充图像分割为像素块;
MS-CAE网络模型包括:编码网络和解码网络;
所述编码网络及其权值参数部署在边缘设备,用于对输入的像素块进行压缩;
减小所述编码网络的规模,用于减小所述边缘设备的负担;
所述解码网络及其权值参数部署在云端设备,用于获取压缩后的像素块,对其进行升维,得到升维后的像素块;
增大所述解码网络的规模,用于提升解码图像的质量;
将所述升维后的像素块进行拼接,重构处完整的图像。
2.根据权利要求1所述的图像压缩算法,其特征在于,所述图像数据集包括:肖像、卡通、游戏、自然风光、广告图案、城市场景、医学影像七大类图像,包含具有1280×720分辨率的多张图片。
3.根据权利要求1所述的图像压缩算法,其特征在于,图像数据集的分割处理包括:
将输入的720p图像分割为60个128*128*3小像素块。
4.根据权利要求1所述的图像压缩算法,其特征在于,编码网络的训练过程包括:
将60个128*128*3小像素块输入编码网络中,所述编码网络对输入的所述小像素块进行特征降维处理,其中,所述小像素块进入EN_conv1层,通过卷积单元Conv5/2p1.5,得到64*64*64的特征图;所述64*64*64的特征图进入EN_conv2层,通过卷积单元Conv5/2p1.5,形成32*32*128的特征图;将32*32*128特征图与三层两个相同的卷积层EN_block1、EN_block2和EN_block3层经过卷积单元Conv3/1p1进行特征的线性叠加,形成新的32*32*128的特征图;整合线性叠加所获取的特征,新的32*32*128的特征图进入EN_conv3,通过卷积单元Conv5/1p2,将其压缩为32*32*32的压缩特征图,并发送至解码网络。
5.根据权利要求4所述的图像压缩算法,其特征在于,所述解码网络的训练过程为:
对所述32*32*32的压缩特征图通过量化器进行量化,得到量化系数;
所述量化系数作为所述解码网络的输入,进入up_DEconv1层,通过卷积单元Conv3/1p1升维形成32*32*64的特征图;通过卷积单元ConvTransposed2/2p1将32*32*64的特征图升维形成64*64*128的特征图,并将其发送至残差块网络进行处理;将处理后产生的64*64*128的特征图通过三层两个相同的卷积层DE_blcok1、DE_block2和DE_block3层经过卷积单元Conv3/1p1进行特征线性叠加进行特征升维,形成新的64*64*128的特征图;将新的64*64*128的特征图输入up_DEconv2层,通过卷积单元Conv3/1p1将64*64*128的特征图升维形成128*128*32的特征图;将128*128*32的特征图通过卷积单元Conv5/1p2将128*128*32的特征图变成128*128*256的特征图;将128*128*256的特征图输入up_DEconv3层,通过卷积单元Conv3/1p1将128*128*256的特征图变成128*128*16的特征图;将128*128*16的特征图通过卷积单元Conv3/1p2形成128*128*3的重构图像像素块,将重构图像像素块按顺序进行拼接,重构出完整图像。
6.根据权利要求5所述的图像压缩算法,其特征在于,将64*64*128的特征图发送至残差块网络进行处理包括:
64*64*128的特征图首先通过残差块网络的Conv1/1,进行一次正则化BatchNormal处理,再通过PReLU函数激活,通过Conv3/1p1,进行一次正则化BatchNormal处理,再通过PReLU函数激活,通过Conv1/1,进行一次正则化BatchNormal处理,在通过PReLU函数激活,将三次残差迭代的结果送入SUM函数进行加权并通过PReLU函数激活,输出残差块函数迭代的结果。
CN202210868534.0A 2022-07-21 2022-07-21 一种基于模型分割压缩自编码器的图像压缩算法 Active CN115052148B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210868534.0A CN115052148B (zh) 2022-07-21 2022-07-21 一种基于模型分割压缩自编码器的图像压缩算法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210868534.0A CN115052148B (zh) 2022-07-21 2022-07-21 一种基于模型分割压缩自编码器的图像压缩算法

Publications (2)

Publication Number Publication Date
CN115052148A true CN115052148A (zh) 2022-09-13
CN115052148B CN115052148B (zh) 2023-04-25

Family

ID=83167797

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210868534.0A Active CN115052148B (zh) 2022-07-21 2022-07-21 一种基于模型分割压缩自编码器的图像压缩算法

Country Status (1)

Country Link
CN (1) CN115052148B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060067405A1 (en) * 2004-09-30 2006-03-30 Raju Hormis Motion estimation for video processing using 2-D (spatial) convolution
CN108921910A (zh) * 2018-07-30 2018-11-30 浙江大学 基于可伸缩卷积神经网络的jpeg编码压缩图像复原的方法
CN111681293A (zh) * 2020-06-09 2020-09-18 西南交通大学 一种基于卷积神经网络的sar图像压缩方法
CN112767423A (zh) * 2021-02-05 2021-05-07 吉林师范大学 一种基于改进SegNet的遥感图像建筑物分割方法
CN113554720A (zh) * 2021-07-22 2021-10-26 南京航空航天大学 一种基于多方向卷积神经网络的多光谱图像压缩方法及系统
KR102338913B1 (ko) * 2021-03-15 2021-12-14 주식회사 도터 혈관내 광단층 영상에서의 생분해성 스텐트를 포함하는 딥러닝 기반 영상 분할 방법

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060067405A1 (en) * 2004-09-30 2006-03-30 Raju Hormis Motion estimation for video processing using 2-D (spatial) convolution
CN108921910A (zh) * 2018-07-30 2018-11-30 浙江大学 基于可伸缩卷积神经网络的jpeg编码压缩图像复原的方法
CN111681293A (zh) * 2020-06-09 2020-09-18 西南交通大学 一种基于卷积神经网络的sar图像压缩方法
CN112767423A (zh) * 2021-02-05 2021-05-07 吉林师范大学 一种基于改进SegNet的遥感图像建筑物分割方法
KR102338913B1 (ko) * 2021-03-15 2021-12-14 주식회사 도터 혈관내 광단층 영상에서의 생분해성 스텐트를 포함하는 딥러닝 기반 영상 분할 방법
CN113554720A (zh) * 2021-07-22 2021-10-26 南京航空航天大学 一种基于多方向卷积神经网络的多光谱图像压缩方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
孙浩然: "基于参数量化的轻量级图像压缩神经网络研究" *

Also Published As

Publication number Publication date
CN115052148B (zh) 2023-04-25

Similar Documents

Publication Publication Date Title
Johnston et al. Improved lossy image compression with priming and spatially adaptive bit rates for recurrent networks
CN110225350B (zh) 基于生成式对抗网络的自然图像压缩方法
Yadav et al. A review on image compression techniques
Zhang et al. Msfc: Deep feature compression in multi-task network
CN113079378B (zh) 图像处理方法、装置和电子设备
WO2022122965A1 (en) Method and data processing system for lossy image or video encoding, transmission and decoding
CN103686177A (zh) 一种图像压缩、解压方法、压缩、解压装置以及系统
Zebang et al. Densely connected AutoEncoders for image compression
Zhang et al. Learned scalable image compression with bidirectional context disentanglement network
CN112750175B (zh) 基于八度卷积和语义分割的图像压缩方法及系统
CN112991169B (zh) 基于图像金字塔和生成对抗网络的图像压缩方法及系统
CN111885384B (zh) 带宽受限下基于生成对抗网络的图片处理和传输方法
CN113962882A (zh) 一种基于可控金字塔小波网络的jpeg图像压缩伪影消除方法
CN113450421A (zh) 一种基于增强深度学习的无人机侦察图像压缩与解压方法
CN112906874A (zh) 卷积神经网络特征图数据压缩方法及装置
Pinheiro et al. NF-PCAC: Normalizing Flow based Point Cloud Attribute Compression
CN115052148B (zh) 一种基于模型分割压缩自编码器的图像压缩算法
CN114501011B (zh) 图像压缩方法、图像解压缩方法及装置
Li et al. Compression artifact removal with stacked multi-context channel-wise attention network
CN113658282A (zh) 一种图像压缩解压缩方法及其装置
CN113141506A (zh) 基于深度学习的图像压缩神经网络模型、及其方法和设备
Siddeq Novel methods of image compression for 3D reconstruction
CN114882133B (zh) 一种图像编解码方法、系统、设备及介质
WO2023178662A1 (en) Image and video coding using multi-sensor collaboration and frequency adaptive processing
Teng et al. Light Field Compression Based on Graph Sample and Aggregaet Algorithm

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant