CN115914630B - 一种图像压缩方法、装置、设备及存储介质 - Google Patents

一种图像压缩方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN115914630B
CN115914630B CN202310016678.8A CN202310016678A CN115914630B CN 115914630 B CN115914630 B CN 115914630B CN 202310016678 A CN202310016678 A CN 202310016678A CN 115914630 B CN115914630 B CN 115914630B
Authority
CN
China
Prior art keywords
feature
integer
image
compression
preset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310016678.8A
Other languages
English (en)
Other versions
CN115914630A (zh
Inventor
梁永生
鲍有能
罗灿
谭文
李超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Graduate School Harbin Institute of Technology
Original Assignee
Shenzhen Graduate School Harbin Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Graduate School Harbin Institute of Technology filed Critical Shenzhen Graduate School Harbin Institute of Technology
Priority to CN202310016678.8A priority Critical patent/CN115914630B/zh
Publication of CN115914630A publication Critical patent/CN115914630A/zh
Application granted granted Critical
Publication of CN115914630B publication Critical patent/CN115914630B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本申请公开了一种图像压缩方法、装置、设备及存储介质,涉及图像处理技术领域,应用于编码器,包括:基于预设特征提取规则提取原始图像的数值为复数的初始特征;根据预设特征压缩规则对初始特征进行压缩以得到压缩特征;提取压缩特征的实部和虚部,并对实部和虚部进行量化以得到相应的第一整数和第二整数;将第一整数以及第二整数转换为二进制码流,以得到与原始图像对应的图像压缩结果。这样一来,本申请可以利用复数神经网络提取图像的信息,并且可以对相应的实部和虚部分别进行编码,这样可以更丰富地表达图像中的信息,相比于实数网络在实数值上的运算和表征,复数神经网络利用在相位上的表达,可以提高图像压缩的鲁棒性,减少噪声的干扰。

Description

一种图像压缩方法、装置、设备及存储介质
技术领域
本发明涉及图像处理技术领域,特别涉及一种图像压缩方法、装置、设备及存储介质。
背景技术
图像和视频的压缩对于高效的数据存储和传输是十分重要的。传统的图像压缩方法,如JPEG(Joint Photographic Experts Group,一种图像文件格式)、JPEG2000(jointPhotographic Experts Group 2000,一种图像压缩标准)和BPG(Better PortableGraphics,更好的可移植图形)等技术被广泛应用。传统的压缩方法均采用:分块-变换-量化-编码的压缩框架,其性能依赖手工设计的模块,在优化时均是单个模块独立优化,故整体性能难以达到最优。
随着深度学习的发展,越来越多工作聚焦于基于卷积神经网络的端到端图像压缩技术端到端的图像压缩(后续简称端到端)指的是对编码系统整体优化,克服了传统编码方法各模块独立优化的问题,目前端到端的方法在性能上已经超越了传统的方法。然而,最近一些工作发现卷积神经网络(Convolutional neural network,简称CNN)对抗攻击性能差,即对输入样本故意添加一些人无法察觉的细微的干扰,导致模型以高置信度给出一个错误的输出。对于图像压缩任务,如图1所示,攻击样本指的是在原始待压缩图像中添加人眼无法察觉的噪声,神经网络模型指的是适用于图像压缩任务的神经网络。将上述的攻击样本输入到神经网络模型中,神经网络输出的样本(对于图像压缩任务,输出图像为解码之后的图像)会产生大量的噪声。神经网络图像压缩模型的可攻击性,导致其在一些重要领域之内无法大规模部署,极大的限制了神经网络图像压缩模型的发展。
发明内容
有鉴于此,本发明的目的在于提供一种图像压缩方法、装置、设备及存储介质。可以更丰富地表达图像中的信息,减少噪声的干扰。其具体方案如下:
第一方面,本申请提供了一种图像压缩方法,应用于编码器,包括:
基于预设特征提取规则提取原始图像的数值为复数的初始特征;
根据预设特征压缩规则对所述初始特征进行压缩以得到压缩特征;
提取所述压缩特征的实部和虚部,并对所述实部和所述虚部进行量化以得到相应的第一整数和第二整数;
将所述第一整数以及所述第二整数转换为二进制码流,以得到与所述原始图像对应的图像压缩结果。
可选的,所述基于预设特征提取规则提取原始图像的数值为复数的初始特征,包括:
对所述原始图像进行复数值卷积以得到第一特征;
利用预设非线性激活函数对所述第一特征进行处理,得到第二特征;
对所述第二特征进行卷积,并利用预设融合函数对卷积后特征对应的相位和幅值进行融合以得到第三特征;
将所述第三特征与所述原始图像进行特征融合,得到所述初始特征。
可选的,所述对所述第二特征进行卷积,并利用预设融合函数对卷积后特征对应的相位和幅值进行融合以得到第三特征,包括:
利用预设复数卷积层对所述第二特征进行卷积,得到所述卷积后特征;
提取所述卷积后特征的相位和幅值;
利用所述预设融合函数对所述相位和所述幅值进行融合以得到所述第三特征。
可选的,所述根据预设特征压缩规则对所述初始特征进行压缩以得到压缩特征,包括:
基于预设压缩级数对所述初始特征进行相应级数的特征提取处理,以得到所述压缩特征。
可选的,所述对所述实部和所述虚部进行量化以得到相应的第一整数和第二整数,包括:
基于预设量化步长对所述实部和所述虚部的浮点数进行量化,以得到所述第一整数以及所述第二整数。
第二方面,本申请提供了一种图像压缩方法,应用于解码器,包括:
对图像压缩结果的二进制码流进行解码以得到第一整数和第二整数;
对所述第一整数以及所述第二整数进行组合以得到包含相应实部和虚部的压缩特征;
基于预设特征压缩规则对所述压缩特征进行解压缩,得到目标特征;
基于与预设特征提取规则对应的图像还原规则,将所述目标特征还原为相应的原始图像。
第三方面,本申请提供了一种图像压缩装置,应用于编码器,包括:
初始特征确定模块,用于基于预设特征提取规则提取原始图像的数值为复数的初始特征;
压缩特征确定模块,用于根据预设特征压缩规则对所述初始特征进行压缩以得到压缩特征;
特征量化模块,用于提取所述压缩特征的实部和虚部,并对所述实部和所述虚部进行量化以得到相应的第一整数和第二整数;
整数转换模块,用于将所述第一整数以及所述第二整数转换为二进制码流,以得到与所述原始图像对应的图像压缩结果。
第四方面,本申请提供了一种图像压缩装置,应用于解码器,包括:
结果解码模块,用于对图像压缩结果的二进制码流进行解码以得到第一整数和第二整数;
整数组合模块,用于对所述第一整数以及所述第二整数进行组合以得到包含相应实部和虚部的压缩特征;
目标特征确定模块,用于基于预设特征压缩规则对所述压缩特征进行解压缩,得到目标特征;
特征还原模块,用于基于与预设特征复数提取规则对应的图像还原规则,将所述目标特征还原为相应的原始图像。
第五方面,本申请提供了一种电子设备,包括:
存储器,用于保存计算机程序;
处理器,用于执行所述计算机程序以实现上述的图像压缩方法。
第六方面,本申请提供了一种计算机可读存储介质,用于保存计算机程序,所述计算机程序被处理器执行时实现上述的图像压缩方法。
由此可见,本申请中首先基于预设特征提取规则提取原始图像的数值为复数的初始特征;然后根据预设特征压缩规则对所述初始特征进行压缩以得到压缩特征;再提取所述压缩特征的实部和虚部,并对所述实部和所述虚部进行量化以得到相应的第一整数和第二整数;然后将所述第一整数以及所述第二整数转换为二进制码流,以得到与所述原始图像对应的图像压缩结果。这样一来,本申请可以提取图像的复数值特征,然后根据预设特征压缩规则对特征进行压缩,可以得到深层次、全面的特征信息;并且本申请可以提取复数值特征的实部和虚部,然后进行分别编码,这样可以更丰富地表达图像信息,相比于实数网络在实数值上的运算和表征,复数神经网络利用了在相位上的表达,可以提高网络模型的鲁棒性,能够减少图像中细微干扰对图像压缩的影响。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请公开的一种图像噪声攻击样本前后对比图;
图2为本申请公开的一种图像压缩方法流程图;
图3为本申请公开的一种具体的图像压缩方法流程图;
图4为本申请公开的另一种具体的图像压缩方法流程图;
图5为本申请公开的又一种具体的图像压缩方法流程图;
图6为本申请公开的一种复数值特征提取流程图;
图7为本申请公开的一种图像压缩装置结构示意图;
图8为本申请公开的另一种图像压缩装置结构示意图;
图9为本申请公开的一种电子设备结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
现有的端到端图像压缩算法均在实数域进行操作,网络模型中的参数都是实数。可以理解的是,复数神经网络具有更丰富的信息表达能力,相比于实数网络在实数值上的运算和表征,复数神经网络由于利用了在相位上的表达,所以可以提高网络模型的鲁棒性。但是复数神经网络只是应用在分类、识别等任务,没有工作将其应用在图像压缩上,是因为直接将复数神经网络应用在图像压缩上的性能很差;由此,本申请提供一种具有抗模型攻击的端到端图像压缩算法,首先将原有的实数值图像压缩算法扩充到复数域,使待压缩图像具有更加丰富的信息表达。同时针对图像压缩任务的特点,可以提取图像的复数值特征,并对复数值特征进行实部和虚部的分别编码。这样可以提高网络模型的鲁棒性,能够减少图像中细微干扰对图像压缩的影响。
参见图2所示,本发明实施例公开了一种图像压缩方法,包括:
步骤S11、基于预设特征提取规则提取原始图像的数值为复数的初始特征。
本实施例中,可以基于所述特征提取规则提取得到原始图像复数值特征,也即所述初始特征,可以理解的是,复数神经网络具有更丰富的表达能力,相比于实数网络在实数值上的运算和表征,复数神经网络利用了在相位上的表达,在提高神经网络模型的鲁棒性方面具有一定的效果。
步骤S12、根据预设特征压缩规则对所述初始特征进行压缩以得到压缩特征。
本实施例中,得到所述初始特征之后,可以根据所述预设特征压缩规则对所述初始特征进行压缩以得到所述压缩特征,可以包括:基于预设压缩级数对所述初始特征进行相应级数的特征提取处理,以得到所述压缩特征。具体的,可以将上述步骤S11的过程进行多次重复, 即多级的“复数值特征提取”;这样可以对深层次的特征信息进行挖掘,并且以串行的方式对特征信息进行压缩挖掘可以提高获取到深层次特征信息的效率。
步骤S13、提取所述压缩特征的实部和虚部,并对所述实部和所述虚部进行量化以得到相应的第一整数和第二整数。
本实施例中,得到所述压缩特征之后,可以理解的是,所述压缩特征是一个复数,可以分别提取所述压缩特征的所述实部和所述虚部;相应的,得到所述实部和所述虚部之后,可以包括:基于预设量化步长对所述实部和所述虚部的浮点数进行量化,以得到所述第一整数以及所述第二整数。具体的,可以根据所述预设量化步长对所述实部和所述虚部进行量化取整,可以理解的是,量化步长可以影响最终图像的质量;需要指出的是,本实施例中对实部和虚部的量化是指取整操作,可以是均匀取整,也可以是非均匀取整也即矢量量化。
步骤S14、将所述第一整数以及所述第二整数转换为二进制码流,以得到与所述原始图像对应的图像压缩结果。
本实施例中,得到所述第一整数以及所述第二整数之后,可以通过熵编码技术将所述第一整数以及所述第二整数转化为一个二进制码流,也即得到与所述原始图像对应的所述图像压缩结果;需要指出的是,所述熵编码技术可以是哈夫曼编码、算数编码、香农编码等方法,可以理解的是,二进制码流可以通过信号进行传输,以便于解码器对码流进行处理得到相应的图像。
由此可见,本申请可以通过复数神经网络提取原始图像的复数值特征并进行多级特征提取的处理,这样可以使待压缩的原始图像具有更加丰富的信息表达;并且可以针对得到的复数值特征提取相应的实部和虚部,再分别对实部和虚部进行编码,这样可以优化复数神经网络在图像压缩上的性能。
上述实施例中介绍了对原始图像进行多级特征提取,并对复数值特征的实部和虚部分别进行编码的具体步骤,可以丰富表达图像的信息,并且可以提高性能;下面实施例将对提取原始图像的复数值特征的相关步骤进行详细介绍,参见图3所示,本发明实施例公开了一种图像压缩方法,包括:
步骤S21、对原始图像进行复数值卷积以得到第一特征。
本实施例中,首先可以通过复数卷积层对所述原始图像进行复数卷积处理,可以理解的是,所述复数卷积可以是通过单个复数卷积层,也可以是多个复数卷积级联的多层复数卷积。这样可以得到为复数的所述第一特征。
步骤S22、利用预设非线性激活函数对所述第一特征进行处理,得到第二特征。
本实施例中,得到所述第一特征之后,可以利用所述预设非线性激活函数对所述第一特征进行处理;需要指出的是,在一种具体的实施例中,所述预设非线性激活函数可以是ReLU(Linear rectification function,线性整流函数),也可以包括但不限于:正切函数,Sigmoid函数,Soft sign 函数等不同的非线性激活函数。这样的非线性激活函数可以在相应的神经网络中加入非线性因素,可以提高神经网络的表达能力。可以理解的是,本实施例可以通过所述预设非线性激活函数相应的神经网络对所述第一特征进行处理,这样可以得到所述第二特征。
步骤S23、对所述第二特征进行卷积,并利用预设融合函数对卷积后特征对应的相位和幅值进行融合以得到第三特征。
本实施例中,得到所述第二特征之后,可以包括:利用预设复数卷积层对所述第二特征进行卷积,得到所述卷积后特征;具体的,可以通过复数卷积层对所述第二特征进行卷积以增强相应的卷积后特征;得到所述卷积后特征之后,可以包括:提取所述卷积后特征的相位和幅值;利用所述预设融合函数对所述相位和所述幅值进行融合以得到所述第三特征。具体的,可以提取所述卷积后特征的相位和幅值;可以理解的是,在一种具体的实施例中,可以将卷积后特征记为
Figure 133943DEST_PATH_IMAGE001
,然后可以提取/>
Figure 764120DEST_PATH_IMAGE001
的相位/>
Figure 474588DEST_PATH_IMAGE002
和幅值/>
Figure 749711DEST_PATH_IMAGE003
,可以表示为:
Figure 596444DEST_PATH_IMAGE004
,/>
Figure 666031DEST_PATH_IMAGE005
其中
Figure 863795DEST_PATH_IMAGE006
表示计算复数/>
Figure 677030DEST_PATH_IMAGE001
的模长,/>
Figure 643849DEST_PATH_IMAGE007
表示计算复数/>
Figure 618758DEST_PATH_IMAGE001
的相位角度。
进一步的,本实施例中可以利用所述预设融合函数将所述相位以及所述幅值进行融合,可以得到融合后的所述第三特征;需要指出的是,在一种具体的实施例中,可以利用sigmoid函数对相位
Figure 569397DEST_PATH_IMAGE002
和幅值/>
Figure 920743DEST_PATH_IMAGE003
进行融合得到第三特征,可以表示为:
Figure 7648DEST_PATH_IMAGE008
其中,
Figure 153459DEST_PATH_IMAGE009
为融合后的第三特征,/>
Figure 60235DEST_PATH_IMAGE010
为逐元素乘法。
步骤S24、将所述第三特征与所述原始图像进行特征融合,得到所述初始特征。
本实施例中,得到所述第三特征之后,可以利用所述第三特征与所述原始图像进行特征融合,这样可以得到所述初始特征;可以理解的是,在一种具体的实施例中,将第三特征
Figure 480852DEST_PATH_IMAGE009
与原始图像/>
Figure 156684DEST_PATH_IMAGE011
进行特征融合,可以表示为:
Figure 738975DEST_PATH_IMAGE012
其中
Figure 398626DEST_PATH_IMAGE013
是将第三特征与原始图像进行特征融合后得到的初始特征。/>
步骤S25、根据预设特征压缩规则对所述初始特征进行压缩以得到压缩特征。
步骤S26、提取所述压缩特征的实部和虚部,并对所述实部和所述虚部进行量化以得到相应的第一整数和第二整数。
步骤S27、将所述第一整数以及所述第二整数转换为二进制码流,以得到与所述原始图像对应的图像压缩结果。
其中,关于上述步骤S25、S26和S27更加具体的处理过程可以参考前述实施例中公开的相应内容,在此不再进行赘述。
由此可见,本实施例可以通过复数卷积层提取原始图像的复数值特征,也即第一特征,然后基于预设激活函数对第一特征进行激活,可以得到第二特征,再通过复数注意力模块增强相应的复数值特征可以得到第三特征,进一步的,通过预设融合函数将得到的第三特征的相位和幅值进行融合得到融合后特征,最后将融合后特征与原始图像进行特征融合以得到初始特征;这样可以深层次,全面地挖掘原始图像的信息,并且利用相位上的表达可以减小原始图像中的噪声对图像信息的干扰,提高了相应网络模型的鲁棒性。
下面实施例将具体介绍解码器对原始图像对应的图像压缩结果进行解码的具体步骤,参见图4所示,本发明实施例公开了一种图像压缩方法,包括:
步骤S31、对图像压缩结果的二进制码流进行解码以得到第一整数和第二整数。
本实施例中,得到所述图像压缩结果的二进制码流之后,可以通过熵解码技术对所述二进制码流进行处理可以转化为所述第一整数以及所述第二整数;可以理解的是,这样根据二进制编码得到第一整数和第二整数的过程是前述实施例中将第一整数和第二整数转化为二进制码流的逆过程。
步骤S32、对所述第一整数以及所述第二整数进行组合以得到包含相应实部和虚部的压缩特征。
本实施例中,得到所述第一整数以及所述第二整数之后,可以对所述第一整数以及所述第二整数进行组合;可以理解的是,所述第一整数以及所述第二整数是前述实施例中复数值特征的实部和虚部经过量化得到的整数;需要指出的是,本实施例中,可以直接将所述第一整数以及所述第二整数进行组合,也即将实部和虚部进行组合,可以得到为复数值的所述压缩特征。在一种具体的实施例中,所述第一整数也即实部可以表示为
Figure 91776DEST_PATH_IMAGE014
,所述第二整数也即虚部可以表示为/>
Figure 153273DEST_PATH_IMAGE015
,这样一来,得到的压缩特征可以表示为:
Figure 921114DEST_PATH_IMAGE016
步骤S33、基于预设特征压缩规则对所述压缩特征进行解压缩,得到目标特征。
本实施例中,得到所述压缩特征之后,可以基于所述预设特征压缩规则对所述压缩特征进行解压缩处理;可以理解的是,编码器通过所述预设特征压缩规则可以多级提取原始图像的复数值特征;相应的,在解码端可以对多级的复数值特征进行解调解压,这样可以得到所述目标特征。
步骤S34、基于与预设特征提取规则对应的图像还原规则,将所述目标特征还原为相应的原始图像。
本实施例中,得到所述目标特征规则之后,可以利用与所述预设特征提取规则对应的所述图像还原规则将所述目标特征还原为相应的原始图像。需要指出的是,本实施例中,还原得到的原始图像的质量在编码器基于预设量化步长对原始图像对应的复数值特征的实部和虚部进行量化的过程中,就已经确定了,在解码端可以对编码器传输的二进制码流进行还原得到相应质量的原始图像。
由此可见,本实施例可以对图像压缩结果的二进制码流进行解码以得到第一整数和第二整数;然后对所述第一整数以及所述第二整数进行组合以得到包含相应实部和虚部的压缩特征;然后基于预设特征压缩规则对所述压缩特征进行解压缩,得到目标特征;再基于与预设特征提取规则对应的图像还原规则,将所述目标特征还原为相应的原始图像。这样一来,本申请可以通过复数值特征对原始图像的信息进行更丰富的表达,可以减小原始图像中的噪声对还原得到的图像的干扰,提高了图像压缩网络模型的鲁棒性。
本实施例将结合图5所示的流程图对本申请的技术方案进行介绍,包括:
本实施例中,输入的原始图像
Figure 802482DEST_PATH_IMAGE011
经过复数特征提取单元,可以得到一个复数值特征/>
Figure 299322DEST_PATH_IMAGE017
;复数特征提取单元分可以为三个基础模块:复数值卷积、复数值激活和复数值注意力模块;如图6所示为一种复数值特征提取流程图;具体的,输入的图像/>
Figure 949747DEST_PATH_IMAGE011
经过复数值卷积可以得到复数域的特征,可以表示为/>
Figure 139419DEST_PATH_IMAGE018
;然后/>
Figure 508084DEST_PATH_IMAGE019
经过一个激活模块可以得到/>
Figure 808615DEST_PATH_IMAGE020
,可以理解的是,该激活模块中含有一个非线性的激活函数,这样在神经网络中加入非线性因素,提高神经网络的表达能力;得到/>
Figure 313546DEST_PATH_IMAGE020
之后,可以利用复数注意力模块对/>
Figure 408541DEST_PATH_IMAGE020
进行处理;具体的,在复数值注意力模块中,/>
Figure 264501DEST_PATH_IMAGE020
首先可以经过复数卷积层进行特征增强,这样的到的增强后的特征可以记作/>
Figure 103144DEST_PATH_IMAGE001
,再提取/>
Figure 728161DEST_PATH_IMAGE001
的相位/>
Figure 994057DEST_PATH_IMAGE002
和幅值/>
Figure 337314DEST_PATH_IMAGE003
,然后可以根据前述实施例中的预设融合公式将相位/>
Figure 714068DEST_PATH_IMAGE002
和幅值/>
Figure 193591DEST_PATH_IMAGE003
进行融合,融合之后可以得到特征/>
Figure 895968DEST_PATH_IMAGE009
,需要指出的是,在具体的实施例中,所述预设融合函数包括但不限于:正弦函数、余弦函数、正切函数、SoftMax(归一化函数)等函数。最后得到的特征/>
Figure 460942DEST_PATH_IMAGE009
与输入的图像/>
Figure 906966DEST_PATH_IMAGE011
可以进行特征融合,这样可以得到图像对应的复数值特征。
进一步的,通过上述步骤可以得到图像对应的复数值特征, 为了挖掘更深层次的图像特征,可以将上述过程进行多次重复,同时为了提高压缩的效率,可以构造多级的“复数值特征提取”单元,为便于理解,可以将上述多级特征提取的过程表示为:
Figure 503645DEST_PATH_IMAGE021
其中
Figure 111344DEST_PATH_IMAGE022
表示最终得到的压缩挖掘后的所述压缩特征,/>
Figure 898035DEST_PATH_IMAGE023
表示多级的“复数值特征提取”的级数,可以理解的是,级数可以根据实际的需求灵活设定。
进一步的,通过上述步骤得到的特征
Figure 882171DEST_PATH_IMAGE024
是一个复数,可以分别提取该复数实部
Figure 336286DEST_PATH_IMAGE025
和虚部/>
Figure 583728DEST_PATH_IMAGE026
,具体可以表示为:
Figure 857714DEST_PATH_IMAGE027
,/>
Figure 379963DEST_PATH_IMAGE028
其中,
Figure 688584DEST_PATH_IMAGE029
表示实部对应的整数,/>
Figure 638086DEST_PATH_IMAGE030
表示虚部对应的整数。
需要指出的是,通过上述步骤得到实部
Figure 930527DEST_PATH_IMAGE029
和虚部/>
Figure 990887DEST_PATH_IMAGE030
之后,可以经过量化单元
Figure 419594DEST_PATH_IMAGE031
,可以理解的是,该单元/>
Figure 539997DEST_PATH_IMAGE031
可以基于预设量化步长将浮点数压缩为整数,这样可以进一步压缩数据,可以将量化得到的数据记为第一整数/>
Figure 788575DEST_PATH_IMAGE032
和第二整数/>
Figure 918205DEST_PATH_IMAGE015
,具体如下:
Figure 204349DEST_PATH_IMAGE033
,/>
Figure 495653DEST_PATH_IMAGE034
/>
可以理解的是,所述第一整数
Figure 497107DEST_PATH_IMAGE032
和所述第二整数/>
Figure 164849DEST_PATH_IMAGE015
为量化之后的实部和虚部,然后可以通过无损编码模块,将量化之后的实部和虚部转化为一个二进制码流。
可以理解的是,图像解压缩的过程属于上述图像压缩过程的逆过程;首先可以通过无损解码模块将相应的二进制码流还原为第一整数
Figure 568148DEST_PATH_IMAGE032
和第二整数/>
Figure 30354DEST_PATH_IMAGE015
。进一步的,可以将第一整数/>
Figure 253525DEST_PATH_IMAGE032
和第二整数/>
Figure 990536DEST_PATH_IMAGE015
,也即实部/>
Figure 982763DEST_PATH_IMAGE032
和虚部/>
Figure 615870DEST_PATH_IMAGE015
组合成一个复数;需要指出的是,此时得到的复数是编码端的多级复数特征提取单元得到的复数值特征,相应的,在解码端也可多次解调,即多级的“复数值特征解调”单元,为便于表述,将上述解调单元表示为/>
Figure 591916DEST_PATH_IMAGE035
,具体的,多级解调单元可以表示为:
Figure 601460DEST_PATH_IMAGE036
其中
Figure 713773DEST_PATH_IMAGE037
表示解压的图像,/>
Figure 783360DEST_PATH_IMAGE038
表示多级的“解调-解压”单元的级数,这样一来,通过解码器可以将二进制码流转化为相应的图像。
由此可见,本实施例中,可以通过提取原始图像的复数值特征,并且可以深层次挖掘图像的信息,这样可以减少原始图像中的噪声对图像信息的干扰;并且本实施例可以对得到的复数值特征的实部和虚部分别进行编码,这样可以提高复数值神经网络在图像压缩中的性能,进而可以提高图像压缩网络模型的鲁棒性。
如图7所示,本实施例公开了一种图像压缩装置,应用于编码器,包括:
初始特征确定模块11,用于基于预设特征提取规则提取原始图像的数值为复数的初始特征;
压缩特征确定模块12,用于根据预设特征压缩规则对所述初始特征进行压缩以得到压缩特征;
特征量化模块13,用于提取所述压缩特征的实部和虚部,并对所述实部和所述虚部进行量化以得到相应的第一整数和第二整数;
整数转换模块14,用于将所述第一整数以及所述第二整数转换为二进制码流,以得到与所述原始图像对应的图像压缩结果。
由此可见,本申请可以提取图像的复数值特征,然后根据预设特征压缩规则对特征进行压缩,可以得到深层次、全面的特征信息;并且本申请可以提取复数值特征的实部和虚部,然后分别进行编码,这样可以更丰富地表达图像信息,能够减少图像中细微干扰对图像压缩的影响。
在一种具体的实施例中,所述初始特征确定模块11,可以包括:
第一特征确定单元,用于对所述原始图像进行复数值卷积以得到第一特征;
第二特征确定单元,用于利用预设非线性激活函数对所述第一特征进行处理,得到第二特征;
第三特征确定子模块,用于对所述第二特征进行卷积,并利用预设融合函数对卷积后特征对应的相位和幅值进行融合以得到第三特征;
初始特征确定单元,用于将所述第三特征与所述原始图像进行特征融合,得到所述初始特征。
相应的,在一种具体的实施例中,所述第三特征确定子模块,可以包括:
第二特征卷积单元,用于利用预设复数卷积层对所述第二特征进行卷积,得到所述卷积后特征;
信息提取单元,用于提取所述卷积后特征的相位和幅值;
信息融合单元,用于利用所述预设融合函数对所述相位和所述幅值进行融合以得到所述第三特征。
在一种具体的实施例中,所述压缩特征确定模块12,可以包括:
压缩特征确定单元,用于基于预设压缩级数对所述初始特征进行相应级数的特征提取处理,以得到所述压缩特征。
在一种具体的实施例中,所述特征量化模块13,可以包括:
特征量化单元,用于基于预设量化步长对所述实部和所述虚部的浮点数进行量化,以得到所述第一整数以及所述第二整数。
相应的,如图8所示,本申请实施例公开了一种图像压缩装置,应用于解码器,包括:
结果解码模块21,用于对图像压缩结果的二进制码流进行解码以得到第一整数和第二整数;
整数组合模块22,用于对所述第一整数以及所述第二整数进行组合以得到包含相应实部和虚部的压缩特征;
目标特征确定模块23,用于基于预设特征压缩规则对所述压缩特征进行解压缩,得到目标特征;
特征还原模块24,用于基于与预设特征复数提取规则对应的图像还原规则,将所述目标特征还原为相应的原始图像。
进一步的,本申请实施例还公开了一种电子设备,图9是根据一示例性实施例示出的电子设备30结构图,图中的内容不能认为是对本申请的使用范围的任何限制。
图9为本申请实施例提供的一种电子设备30的结构示意图。该电子设备 30,具体可以包括:至少一个处理器31、至少一个存储器32、电源33、通信接口34、输入输出接口35和通信总线36。其中,所述存储器32用于存储计算机程序,所述计算机程序由所述处理器31加载并执行,以实现前述任一实施例公开的图像压缩方法中的相关步骤。另外,本实施例中的电子设备30具体可以为电子计算机。
本实施例中,电源33用于为电子设备30上的各硬件设备提供工作电压;通信接口34能够为电子设备30创建与外界设备之间的数据传输通道,其所遵循的通信协议是能够适用于本申请技术方案的任意通信协议,在此不对其进行具体限定;输入输出接口35,用于获取外界输入数据或向外界输出数据,其具体的接口类型可以根据具体应用需要进行选取,在此不进行具体限定。
另外,存储器32作为资源存储的载体,可以是只读存储器、随机存储器、磁盘或者光盘等,其上所存储的资源可以包括操作系统321、计算机程序322等,存储方式可以是短暂存储或者永久存储。
其中,操作系统321用于管理与控制电子设备30上的各硬件设备以及计算机程序322,其可以是Windows Server、Netware、Unix、Linux等。计算机程序322除了包括能够用于完成前述任一实施例公开的由电子设备30执行的图像压缩方法的计算机程序之外,还可以进一步包括能够用于完成其他特定工作的计算机程序。
进一步的,本申请还公开了一种计算机可读存储介质,用于存储计算机程序;其中,所述计算机程序被处理器执行时实现前述公开的图像压缩方法。关于该方法的具体步骤可以参考前述实施例中公开的相应内容,在此不再进行赘述。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本申请所提供的技术方案进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (9)

1.一种图像压缩方法,其特征在于,应用于编码器,包括:
基于预设特征提取规则提取原始图像的数值为复数的初始特征;
根据预设特征压缩规则对所述初始特征进行压缩以得到压缩特征;
提取所述压缩特征的实部和虚部,并对所述实部和所述虚部进行量化以得到相应的第一整数和第二整数;
将所述第一整数以及所述第二整数转换为二进制码流,以得到与所述原始图像对应的图像压缩结果;
其中,所述基于预设特征提取规则提取原始图像的数值为复数的初始特征,包括:
对所述原始图像进行复数值卷积以得到第一特征;
利用预设非线性激活函数对所述第一特征进行处理,得到第二特征;
对所述第二特征进行卷积,并利用预设融合函数对卷积后特征对应的相位和幅值进行融合以得到第三特征;
将所述第三特征与所述原始图像进行特征融合,得到所述初始特征。
2.根据权利要求1所述的图像压缩方法,其特征在于,所述对所述第二特征进行卷积,并利用预设融合函数对卷积后特征对应的相位和幅值进行融合以得到第三特征,包括:
利用预设复数卷积层对所述第二特征进行卷积,得到所述卷积后特征;
提取所述卷积后特征的相位和幅值;
利用所述预设融合函数对所述相位和所述幅值进行融合以得到所述第三特征。
3.根据权利要求1所述的图像压缩方法,其特征在于,所述根据预设特征压缩规则对所述初始特征进行压缩以得到压缩特征,包括:
基于预设压缩级数对所述初始特征进行相应级数的特征提取处理,以得到所述压缩特征。
4.根据权利要求1至3任一项所述的图像压缩方法,其特征在于,所述对所述实部和所述虚部进行量化以得到相应的第一整数和第二整数,包括:
基于预设量化步长对所述实部和所述虚部的浮点数进行量化,以得到所述第一整数以及所述第二整数。
5.一种图像压缩方法,其特征在于,应用于解码器,包括:
对图像压缩结果的二进制码流进行解码以得到第一整数和第二整数;其中,所述图像压缩结果为利用如权利要求1至4任一项所述图像压缩方法得到的图像压缩结果;
对所述第一整数以及所述第二整数进行组合以得到包含相应实部和虚部的压缩特征;
基于预设特征压缩规则对所述压缩特征进行解压缩,得到目标特征;
基于与预设特征提取规则对应的图像还原规则,将所述目标特征还原为相应的原始图像。
6.一种图像压缩装置,其特征在于,应用于编码器,包括:
初始特征确定模块,用于基于预设特征提取规则提取原始图像的数值为复数的初始特征;
压缩特征确定模块,用于根据预设特征压缩规则对所述初始特征进行压缩以得到压缩特征;
特征量化模块,用于提取所述压缩特征的实部和虚部,并对所述实部和所述虚部进行量化以得到相应的第一整数和第二整数;
整数转换模块,用于将所述第一整数以及所述第二整数转换为二进制码流,以得到与所述原始图像对应的图像压缩结果;
其中,所述初始特征确定模块,包括:
第一特征确定单元,用于对所述原始图像进行复数值卷积以得到第一特征;
第二特征确定单元,用于利用预设非线性激活函数对所述第一特征进行处理,得到第二特征;
第三特征确定子模块,用于对所述第二特征进行卷积,并利用预设融合函数对卷积后特征对应的相位和幅值进行融合以得到第三特征;
初始特征确定单元,用于将所述第三特征与所述原始图像进行特征融合,得到所述初始特征。
7.一种图像压缩装置,其特征在于,应用于解码器,包括:
结果解码模块,用于对图像压缩结果的二进制码流进行解码以得到第一整数和第二整数;其中,所述图像压缩结果为利用如权利要求6所述的应用于编码器的图像压缩装置得到的图像压缩结果;
整数组合模块,用于对所述第一整数以及所述第二整数进行组合以得到包含相应实部和虚部的压缩特征;
目标特征确定模块,用于基于预设特征压缩规则对所述压缩特征进行解压缩,得到目标特征;
特征还原模块,用于基于与预设特征复数提取规则对应的图像还原规则,将所述目标特征还原为相应的原始图像。
8.一种电子设备,其特征在于,包括:
存储器,用于保存计算机程序;
处理器,用于执行所述计算机程序以实现如权利要求1至5任一项所述的图像压缩方法。
9.一种计算机可读存储介质,其特征在于,用于保存计算机程序,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述的图像压缩方法。
CN202310016678.8A 2023-01-06 2023-01-06 一种图像压缩方法、装置、设备及存储介质 Active CN115914630B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310016678.8A CN115914630B (zh) 2023-01-06 2023-01-06 一种图像压缩方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310016678.8A CN115914630B (zh) 2023-01-06 2023-01-06 一种图像压缩方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN115914630A CN115914630A (zh) 2023-04-04
CN115914630B true CN115914630B (zh) 2023-05-30

Family

ID=85744617

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310016678.8A Active CN115914630B (zh) 2023-01-06 2023-01-06 一种图像压缩方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN115914630B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022126588A1 (zh) * 2020-12-18 2022-06-23 深圳先进技术研究院 基于双编码融合网络模型的pet-mri图像去噪方法、装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1148067C (zh) * 2001-06-01 2004-04-28 中国科学院计算技术研究所 合成孔径雷达复数图像数据压缩方法
CN111583165B (zh) * 2019-02-19 2023-08-08 京东方科技集团股份有限公司 图像处理方法、装置、设备及存储介质
CN114581544A (zh) * 2022-05-09 2022-06-03 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) 图像压缩方法、计算机设备及计算机存储介质
CN115200702A (zh) * 2022-06-17 2022-10-18 北京理工大学 基于复数神经网络的计算成像方法及装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022126588A1 (zh) * 2020-12-18 2022-06-23 深圳先进技术研究院 基于双编码融合网络模型的pet-mri图像去噪方法、装置

Also Published As

Publication number Publication date
CN115914630A (zh) 2023-04-04

Similar Documents

Publication Publication Date Title
US10499086B2 (en) Video data encoding and decoding methods and apparatuses
Rawat et al. A Hybrid Image Compression Scheme Using DCT and Fractal Image Compression.
CN111641832B (zh) 编码方法、解码方法、装置、电子设备及存储介质
WO2020237646A1 (zh) 图像处理方法、设备及计算机可读存储介质
Cohen et al. Lightweight compression of neural network feature tensors for collaborative intelligence
KR100529311B1 (ko) 신경 회로망을 이용하여 가변 길이 부호화 비트 스트림의길이를 선택하는 장치 및 방법
CN103873877A (zh) 远程桌面的图像传输方法及装置
CN111641826B (zh) 对数据进行编码、解码的方法、装置与系统
Siddeq et al. Applied minimized matrix size algorithm on the transformed images by DCT and DWT used for image compression
Xiang et al. Adaptive and dynamic multi-grouping scheme for absolute moment block truncation coding
Rojatkar et al. Image compression techniques: lossy and lossless
CN115776571B (zh) 一种图像压缩方法、装置、设备及存储介质
CN115866252B (zh) 一种图像压缩方法、装置、设备及存储介质
WO2024061316A1 (zh) 数据压缩的方法、数据解压缩的方法和相关设备
CN115914630B (zh) 一种图像压缩方法、装置、设备及存储介质
KR100989686B1 (ko) 데이터 소스에 의해 생성된 비트 심볼들을 처리하기 위한 방법 및 장치, 컴퓨터 판독가능 매체, 컴퓨터 프로그램 요소
CN115361556A (zh) 一种基于自适应的高效视频压缩算法及其系统
Thepade et al. New clustering algorithm for Vector Quantization using Slant transform
Panda et al. Competency assessment of image compression in the lossy and lossless domain
US6125211A (en) Progressive image transmission
CN111787326A (zh) 一种熵编码及熵解码的方法和装置
Ahmed et al. Audio Compression Using Transform Coding with LZW and Double Shift Coding
Alqadi et al. ZJICD algorithm for JPEG image compression/decompression
Oo Study on Speech Compression and Decompression by using Discrete Wavelet Transform [J]
Liu et al. A semantic compression scheme for digital images based on vector quantization and data hiding

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant