CN115834890A - 一种图像压缩方法、装置、设备及存储介质 - Google Patents
一种图像压缩方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN115834890A CN115834890A CN202310082419.5A CN202310082419A CN115834890A CN 115834890 A CN115834890 A CN 115834890A CN 202310082419 A CN202310082419 A CN 202310082419A CN 115834890 A CN115834890 A CN 115834890A
- Authority
- CN
- China
- Prior art keywords
- image
- signal
- signals
- preset
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000007906 compression Methods 0.000 title claims abstract description 85
- 230000006835 compression Effects 0.000 title claims abstract description 83
- 238000000034 method Methods 0.000 title claims abstract description 66
- 238000012545 processing Methods 0.000 claims abstract description 67
- 238000013528 artificial neural network Methods 0.000 claims abstract description 44
- 238000012549 training Methods 0.000 claims abstract description 21
- 230000006870 function Effects 0.000 claims description 34
- 238000005070 sampling Methods 0.000 claims description 32
- 238000004590 computer program Methods 0.000 claims description 15
- 230000006837 decompression Effects 0.000 claims description 8
- 230000005540 biological transmission Effects 0.000 abstract description 7
- 210000005036 nerve Anatomy 0.000 abstract 1
- 239000000047 product Substances 0.000 description 15
- 238000004891 communication Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000001537 neural effect Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 230000004913 activation Effects 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 230000000750 progressive effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Image Processing (AREA)
Abstract
本申请公开了一种图像压缩方法、装置、设备及存储介质,涉及图像处理技术领域,包括:基于预设图像码率对原始图像的像素坐标进行编码得到若干编码信号;根据图像码率对编码信号进行分组得到若干分组信号;利用预设多层感知机网络对分组信号进行处理得到若干第一目标信号,并利用点乘运算对第一目标信号进行处理得到点乘后信号;利用预设多层感知机网络对点乘后信号进行处理以得到与图像RGB值对应的第二目标信号;基于预设损失函数和第二目标信号对预设神经网络进行训练得到训练后网络参数,并基于训练后网络参数生成图像压缩结果。由此可见,本申请可以通过隐式神经得到与预设图像码率对应的信号,能很好适应设备硬件的性能并提升了传输效率。
Description
技术领域
本发明涉及图像处理技术领域,特别涉及一种图像压缩方法、装置、设备及存储介质。
背景技术
图像压缩对于数据的高效传输与存储十分必要。近年来,在深度学习技术飞速发展的前提下,基于深度学习的图像压缩技术被众多学者进行研究。其中,以基于卷积神经网络的端到端图像压缩方法所得到的率失真性能最优,远远超过了传统的JPEG(JointPhotographic Experts Group,一种压缩标准)、BPG(Better Portable Graphics,更好的可移植图形)等方法。然而,由于目前端到端图像压缩模型存储要求高,且模型训练时间长,难以部署到常用设备中。
基于隐式神经表示的图像压缩方法可以解决存储要求高的问题。隐式神经表示通常采用的多层感知机模型,结构与基于卷积神经网络的端到端图像压缩模型相比,更加简单,训练后所得到的模型更加轻量,更加适用于图像压缩数据的存储和传输。
然而,由于使用隐式神经表示进行图像压缩,主要在于将网络模型参数作为图像压缩后的数据进行传输,因此在模型结构固定的情况下,所对应的图像码率固定,率失真性能也相应固定。但从实际应用而言,图像压缩模型要尽可能根据不同的算力和需求,给出不同码率下的对应质量的图像,以适应设备硬件的性能与传输的效率。
发明内容
有鉴于此,本发明的目的在于提供一种图像压缩方法、装置、设备及存储介质,能够得到不同码率的图像,并且模型轻量,易于部署。其具体方案如下:
第一方面,本申请提供了一种图像压缩方法,应用于编码端,包括:
基于预设图像码率对原始图像的像素坐标进行编码以得到若干个编码信号;
根据图像码率对所述编码信号进行分组,得到与不同图像码率分别对应的若干组分组信号;其中,每组所述分组信号包含相应图像码率下的各像素频率对应的所述编码信号;
利用第一预设多层感知机网络分别对各所述分组信号进行处理以得到若干个第一目标信号,并利用点乘运算对所述第一目标信号进行处理得到点乘后信号;
利用第二预设多层感知机网络对所述点乘后信号进行处理以得到与图像RGB值对应的第二目标信号;
基于预设损失函数以及所述第二目标信号对预设神经网络进行训练,以得到训练后网络参数,并基于所述训练后网络参数生成所述原始图像的图像压缩结果。
可选的,所述基于预设图像码率对原始图像的像素坐标进行编码以得到若干个编码信号,包括:
根据所述原始图像中与像素坐标对应的图像元素的频率数量以及所述预设图像码率的数量确定采样的总频率数;
从预设正态分布中选出与所述总频率数相同数量的采样值;
基于所述采样值的从小到大的顺序对相应的像素坐标进行采样处理,以得到所述编码信号。
可选的,所述利用点乘运算对所述第一目标信号进行处理得到点乘后信号,包括:
对所述第一目标信号中的若干个信号分量进行点乘处理以得到点乘后信号。
可选的,所述方法还包括:
对所述点乘后信号以及所述第一目标信号中的若干个信号分量进行点乘以得到新的点乘后信号。
可选的,所述利用第二预设多层感知机网络对所述点乘后信号进行处理以得到与图像RGB值对应的第二目标信号,包括:
利用所述第二预设多层感知机网络对所述点乘后信号进行处理以得到与不同图像码率对应的若干个处理后信号;其中,所述处理后信号具有与RGB三通道对应的信号维度;
对各所述处理后信号进行加权处理,得到所述第二目标信号。
第二方面,本申请提供了一种图像解压缩方法,应用于解码端,包括:
获取原始图像的图像尺寸大小以及相应的图像压缩结果;
将所述图像压缩结果输入预设神经网络,然后将基于所述图像尺寸大小确定的各像素坐标输入至所述预设神经网络,以得到各所述像素坐标分别对应的RGB值;
基于所述RGB值以及目标图像码率确定出与所述目标图像码率对应的图像。
第三方面,本申请提供了一种图像压缩装置,应用于编码端,包括:
像素编码模块,用于基于预设图像码率对原始图像的像素坐标进行编码以得到若干个编码信号;
信号分组模块,用于根据图像码率对所述编码信号进行分组,得到与不同图像码率分别对应的若干组分组信号;其中,每组所述分组信号包含相应图像码率下的各像素频率对应的所述编码信号;
信号点乘模块,用于利用第一预设多层感知机网络分别对各所述分组信号进行处理以得到若干个第一目标信号,并利用点乘运算对所述第一目标信号进行处理得到点乘后信号;
信号确定模块,用于利用第二预设多层感知机网络对所述点乘后信号进行处理以得到与图像RGB值对应的第二目标信号;
压缩结果确定模块,用于基于预设损失函数以及所述第二目标信号对预设神经网络进行训练,以得到训练后网络参数,并基于所述训练后网络参数生成所述原始图像的图像压缩结果。
第四方面,本申请提供了一种图像解压缩装置,应用于解码端,包括:
信息获取模块,用于获取原始图像的图像尺寸大小以及相应的图像压缩结果;
坐标处理模块,用于将所述图像压缩结果输入预设神经网络,然后将基于所述图像尺寸大小确定的各像素坐标输入至所述预设神经网络,以得到各所述像素坐标分别对应的RGB值;
图像确定模块,用于基于所述RGB值以及目标图像码率确定出与所述目标图像码率对应的图像。
第五方面,本申请提供了一种电子设备,包括:
存储器,用于保存计算机程序;
处理器,用于执行所述计算机程序以实现如上述的图像压缩方法。
第六方面,本申请提供了一种计算机可读存储介质,用于保存计算机程序,所述计算机程序被处理器执行时实现如上述的图像压缩方法。
由此可见,本申请可以基于预设图像码率对原始图像的像素坐标进行编码以得到若干个编码信号;然后根据图像码率对所述编码信号进行分组,得到与不同图像码率分别对应的若干组分组信号;其中,每组所述分组信号包含相应图像码率下的各像素频率对应的所述编码信号;再利用第一预设多层感知机网络分别对各所述分组信号进行处理以得到若干个第一目标信号,并利用点乘运算对所述第一目标信号进行处理得到点乘后信号;然后利用第二预设多层感知机网络对所述点乘后信号进行处理以得到与图像RGB值对应的第二目标信号;最后基于预设损失函数以及所述第二目标信号对预设神经网络进行训练,以得到训练后网络参数,并基于所述训练后网络参数生成所述原始图像的图像压缩结果。这样一来,本申请可以根据所需要的预设图像码率的个数,利用第一预设多层感知机网络对位置编码信号进行处理;并且可以通过点乘的方式对信号进行连接处理得到对应不同码率点的信号,然后通过第二预设多层感知机网络对信号进行处理,这样可以减少过程中的参数量,进而使整体处理模型更轻量化。进一步的,预设损失函数中可以保证每个输出信号的率失真性能,基于隐式神经表示的图像压缩过程对存储要求比较低,更便于使用。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请公开的一种图像压缩方法流程图;
图2为本申请公开的一种具体的图像压缩方法流程图;
图3为本申请公开的一种具体的图像压缩方法流程图;
图4为本申请公开的一种具体的图像解压缩方法流程图;
图5为本申请公开的一种具体的图像压缩方法流程图;
图6为本申请公开的一种率失真性能对比图;
图7为本申请公开的一种图像压缩装置结构示意图;
图8为本申请公开的一种图像解压缩装置结构示意图;
图9为本申请公开的一种电子设备结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明能够在一个轻量的图像压缩模型中,得到不同码率大小的图像。主要从两点出发,为保证输出的多个图像率失真性能呈现逐渐增加的形式,以达到随着网络参数增加率失真性能增加的效果,可以通过对于图像中的坐标进行不同频率的编码,可以提取出相应的频率成分,以便于控制输入信号的带宽。其中,使用的频率通过零均值高斯分布采样所得。而对位置进行编码之后的信号可以从低频到高频依次传入网络模型中,达到率失真性能递增的效果。为实现一个网络模型能够拥有多个输出,可以通过变换网络深度来实现。每个输出都需要更高频率的信号输入,该高频信号经过一层神经网络后与已有的网络输出进行点乘,保证在上一个输出的基础上增加更多高频信息。此外,多输出网络中还有一个输出共享结构,能够将网络最终的输出从多维转化为3维,以对应于图像的RGB三个值。可见,本申请的图像处理网络能够随着网络的逐渐增加,而率失真性也随之增加,并可以保证对应码率点的率失真性能相似,实现更加轻量的码率可变的图像压缩模型。
参见图1所示,本发明实施例公开了一种图像压缩方法,包括:
步骤S11、基于预设图像码率对原始图像的像素坐标进行编码以得到若干个编码信号。
本实施例中,首先可以基于所述预设图像码率对所述原始图像的像素坐标进行编码;可以理解的是,图像中的信号包括高频分量和低频分量,位置编码的操作如下:
步骤S12、根据图像码率对所述编码信号进行分组,得到与不同图像码率分别对应的若干组分组信号;其中,每组所述分组信号包含相应图像码率下的各像素频率对应的所述编码信号。
本实施例中,对所述原始图像进行编码得到所述编码信号之后,可以根据图像码率对所述编码信号进行分组;可以理解的是,前述步骤S11可以对整个原始图像的像素坐标进行编码得到相应数量的编码信号,进一步的,这些编码信号也对应不同的图像码率;在本实施例中,可以根据图像码率对所述编码信号进行分组,这样可以得到与图像码率对应的不同组的所述分组信号;需要指出的是,所述分组信号包含相应码率下的整个所述原始图像对应的编码信号,也即单个分组信号包含相应码率下整个图像的信息。
步骤S13、利用第一预设多层感知机网络分别对各所述分组信号进行处理以得到若干个第一目标信号,并利用点乘运算对所述第一目标信号进行处理得到点乘后信号。
本实施例中,得到若干组分组信号之后,可以利用所述第一预设多层感知机网络对各所述分组信号进行处理;需要指出的是,所述第一预设多层感知机网络中可以采用不同的激活函数来提高率失真性能,包括但不限于:ReLU函数,Sigmoid函数,正弦函数等。这样处理之后,可以得到若干个第一目标信号;进一步的,可以对不同的所述第一目标信号进行点乘处理,点乘处理可以将不同的信号结合起来,这样可以补充更多关于图像的细节信息,需要指出的是,这样可以得到若干数量个点乘后信号。
步骤S14、利用第二预设多层感知机网络对所述点乘后信号进行处理以得到与图像RGB值对应的第二目标信号。
本实施例中,得到若干个点乘后信号之后,可以利用第二预设多层感知机网络对所述点乘后信号进行处理;需要指出的是,所述第二预设多层感知机网络可以对其中所有的信号进行权重共享,这样可以大大减少网络模型的参数量;并且,可以设置输出信号维度为3,这样可以对应图像的RGB值。
步骤S15、基于预设损失函数以及所述第二目标信号对预设神经网络进行训练,以得到训练后网络参数,并基于所述训练后网络参数生成所述原始图像的图像压缩结果。
本实施例中,得到所述第二目标信号之后,可以基于预设损失函数利用所述第二目标信号对所述预设神经网络进行训练,在训练完成后可可以得到训练后神经网络,并可以得到所述训练后神经网络的所述训练后网络参数;需要指出的是,可以基于所述训练后网络参数生成与所述原始图像对应的图像压缩结果,在一种具体的实施例中,可以将训练后网络参数转化为码流进行传输。
由此可见,本申请可以基于预设图像码率对原始图像的像素坐标进行编码以得到若干个编码信号;然后根据图像码率对所述编码信号进行分组,得到与不同图像码率分别对应的若干组分组信号;其中,每组所述分组信号包含相应图像码率下的各像素频率对应的所述编码信号;再利用第一预设多层感知机网络分别对各所述分组信号进行处理以得到若干个第一目标信号,并利用点乘运算对所述第一目标信号进行处理得到点乘后信号;然后利用第二预设多层感知机网络对所述点乘后信号进行处理以得到与图像RGB值对应的第二目标信号;最后基于预设损失函数以及所述第二目标信号对预设神经网络进行训练,以得到训练后网络参数,并基于所述训练后网络参数生成所述原始图像的图像压缩结果。这样一来,本申请可以根据所需要的预设图像码率的个数,利用第一预设多层感知机网络对位置编码信号进行处理;并且可以通过点乘的方式对信号进行连接处理,这样低码率点处的性能表现也能够帮助调整更高码率点处的性能;进一步的,本实施例可以通过第二预设多层感知机网络对信号进行处理,这样可以共享信号的权重,以减少过程中的参数量,进而使整体的网络模型更轻量化。进一步的,预设损失函数中可以考虑所有的信号,可以保证每个输出信号的率失真性能,并且这样基于隐式神经表示的图像压缩过程对存储要求比较低,更便于使用。
下面实施例将围绕对与原始图像对应的像素坐标进行编码的过程展开,参见图2所示,本发明实施例公开了一种图像压缩方法,包括:
步骤S21、根据原始图像中与像素坐标对应的图像元素的频率数量以及预设图像码率的数量确定采样的总频率数。
本实施例中,得到编码信号的过程可以首先确定采样的总频率数;在一种具体的实施例中,首先确定像素坐标也即像素输入信号包含的频率数量,然后根据所需要的码率点数也即前述预设图像码率确定出需要采样的总码率数,总码率数应满足公式:
步骤S22、从预设正态分布中选出与所述总频率数相同数量的采样值。
本实施例中,得到需要采样的所述总频率数之后,可以根据需要采样的总频率数,从零均值正态分布中生成相应数量的采样值;需要指出的是,采样值的选取是从零均值正态分布中所得,可以采用方差为15的正态分布。其中,正态分布的均值可以为0、1、2、3等整数,方差也可以为13、14、15、16等整数。
步骤S23、基于所述采样值的从小到大的顺序对相应的像素坐标进行采样处理,以得到所述编码信号。
本实施例中,得到一定数量的采样值后,可以基于所述采样值的从小到大的顺序对相应的像素坐标进行采样处理,以得到所述编码信号;具体的,首先根据采样值的绝对值大小将其从小到大排列,这样可以保证位置编码后所得信号频率从低到高排列,然后对相应的像素进行采样,这样可以得到所述编码信号;可以理解的是,在一种具体的实施例中,采样可以得到频率值,然后对于输入图像的坐标编码,即:
步骤S24、利用第一预设多层感知机网络分别对各所述分组信号进行处理以得到若干个第一目标信号,并利用点乘运算对所述第一目标信号进行处理得到点乘后信号。
步骤S25、利用第二预设多层感知机网络对所述点乘后信号进行处理以得到与图像RGB值对应的第二目标信号。
步骤S26、基于预设损失函数以及所述第二目标信号对预设神经网络进行训练,以得到训练后网络参数,并基于所述训练后网络参数生成所述原始图像的图像压缩结果。
其中,关于上述步骤S24、S25和S26更加具体的处理过程可以参考前述实施例中公开的相应内容,在此不再进行赘述。
由此可见,本申请实施例中可以根据原始图像中与像素坐标对应的图像元素的频率数量以及预设图像码率的数量确定采样的总频率数,然后从预设正态分布中选出与所述总频率数相同数量的采样值,再基于所述采样值的从小到大的顺序对相应的像素坐标进行采样处理,以得到所述编码信号。这样一来,本申请可以根据预设图像码率的数量以及图像元素的频率数量对图像进行采样,并且可以利用从小到大顺序的采样值保证采样得到的信号频率是递进关系,达到率失真性能递增的效果。
下面实施例将针对得到分组信号之后对信号进行点乘的相关步骤进行详细介绍,参见图3所示,本发明实施例公开了一种图像压缩方法,包括:
步骤S31、基于预设图像码率对原始图像的像素坐标进行编码以得到若干个编码信号。
步骤S32、根据图像码率对所述编码信号进行分组,得到与不同图像码率分别对应的若干组分组信号;其中,每组所述分组信号包含相应图像码率下的各像素频率对应的所述编码信号。
步骤S33、利用第一预设多层感知机网络分别对各所述分组信号进行处理以得到若干个第一目标信号。
步骤S34、利用点乘运算对所述第一目标信号进行处理得到点乘后信号。
本实施例中,得到若干个所述第一目标信号之后, 可以利用点乘运算对所述第一目标信号进行点乘处理;可以理解的是,在一种具体的实施例中,前述步骤S33可以将分组后的分组信号、分别经过预设的多层感知机网络、得到、,然后可以对和进行点乘,点乘能够将两个经过处理的不同频率的信号相结合。点乘后可以经过预设的多层感知机网络,得到信号,也即所述点乘后信号。
步骤S35、对所述点乘后信号以及所述第一目标信号中的若干个信号分量进行点乘以得到新的点乘后信号。
本实施例中,需要指出的是,还可以对所述点成后信号以及所述第一目标信号中的信号分量进行点乘处理;在一种具体的实施例中,可以将通过步骤S33得到的信号与步骤S34得到的进行点乘处理,然后可以经过预设的多层感知机网络,得到信号,也即新的点乘后信号。这样可以在信号的基础上补充更多的细节信息。进一步的,根据需要码率点数的不同,可以进行与步骤S33和步骤S34相同的操作,可以基于点乘操作得到点乘后信号。
步骤S36、利用第二预设多层感知机网络对所述点乘后信号进行处理以得到与不同图像码率对应的若干个处理后信号;其中,所述处理后信号具有与RGB三通道对应的信号维度。
步骤S37、对各所述处理后信号进行加权处理,得到所述第二目标信号。
步骤S38、基于预设损失函数以及所述第二目标信号对预设神经网络进行训练,以得到训练后网络参数,并基于所述训练后网络参数生成所述原始图像的图像压缩结果。
其中,关于上述步骤S31、S32、S33、S36、S37和S38更加具体的处理过程可以参考前述实施例中公开的相应内容,在此不再进行赘述。
由此可见,本申请实施例中可以对第一目标信号进行点乘处理,并且可以对点乘后信号以及第一目标信号进行点乘处理,这样可以在信号中补充更多的细节信息;并且过程中可以考虑所需要的图像码率再对相应的信号进行点乘处理,这样可以提高模型整体的率失真性能。
参见图4示,本发明实施例公开了一种图像解压缩方法,包括:
步骤S41、获取原始图像的图像尺寸大小以及相应的图像压缩结果。
本实施例中,对图像进行解码操作时,需要获取原始图像的尺寸大小以及相应的图像压缩结果;可以理解的是,通过尺寸大小可以确定出图像的像素坐标信息,这样可以便于后续通过像素坐标还原图像的像素信息。
步骤S42、将所述图像压缩结果输入预设神经网络,然后将基于所述图像尺寸大小确定的各像素坐标输入至所述预设神经网络,以得到各所述像素坐标分别对应的RGB值。
本实施例中,得到所述图像压缩结果之后,可以将所述图像压缩结果输入所述预设神经网络;需要指出的是,在前述实施例得到图像压缩结果的过程中可以是对第一神经网络进行训练,然后得到所述图像压缩结果;本实施例中,所述预设神经网络可以是与训练前的第一神经网络相同的神经网络;可以理解的是,只需要将通过所述图像压缩结果转化后的网络参数代入到所述预设神经网络中,就可以得到一个训练好的神经网络。然后,就可以通过在输入所述图像压缩结果后的所述预设神经网络中输入图像的像素坐标,即可得到与像素坐标对应的图像的RGB值。
步骤S43、基于所述RGB值以及目标图像码率确定出与所述目标图像码率对应的图像。
本实施例中,得到与各所述像素坐标对应的所述RGB值之后,可以基于所述目标图像码率确定出相应的RGB值,然后可以得到与所述目标图像码率对应的图像;可以理解的是,在一种具体的实施例中,可以基于所述RGB值得到所述图像压缩结果中包含的所有码率一一对应的不同图像。
由此可见,本申请实施例中可以基于原始图像的尺寸大小确定出图像的像素坐标信息,然后可以将图像压缩结果输入预设神经网络,之后在输入图像压缩结果后的神经网络中输入原始图像的像素坐标,即可得到相应坐标的RGB值,也即得到了解压后的图像;并且,本申请实施例可以输出一个目标码率的图像或者输出全部码率的解压后图像,这样可以满足不同的使用场景。
本实施例结合图5所示的流程图对本申请的技术方案进行介绍,包括:
相应的,得到分组信号之后,可以将、分别经过多层感知机网络和进行处理得到和该类型网络可以提高率失真性能;相应的,可以将输出的信号和进行点乘,点乘能够将两个经过处理的不同频率的信号相结合。点乘后经多层感知机网络,得到信号。可以理解的是,信号可以通过共享网络处理或者再与信号进行点乘处理;依此类推,信号经过网络处理后可以与点乘后信号再次进行点乘再经过网络可以得到。
进一步的,可以将所有的信号都经过共享网络也即一个相同的多层感知机网络,可以得到信号,该网络对于所有的信号权重共享,这样可以大大减少网络模型的参数量。需要指出的是,可以设置该共享网络输出信号维度为3,以对应于图像的RGB值,该共享网络中可以使用不同的激活函数,包括但不限于:ReLU函数,Sigmoid函数,正弦函数,同时,共享网络中也可以不采用激活函数,直接输出。然后可以将得到的经过加权公式确定出最终输出信号,本实施例中将已有的按照相同权重相加,权重的大小应与根据具体的情况来确定,具体公式如下:
此处,代表均方误差损失函数,表示每个坐标上的对应的RGB特征值。需要指出的是,训练中采用的函数表示一种损失函数,以获得预测值与真实值之间的差异。具体实施方式可以是各种回归问题损失函数,包括但不限于:均方误差、平均绝对值误差、Huber损失等。其次,训练中的loss函数选取各函数直接相加,而相加时采用的具体权重大小应根据具体要求来确定。进一步需要指出的是,本申请使用的、以及共享网络均为多层感知机网络,所选取的网络深度可以是1、2、3、4等整数,宽度可以是10、20、30等整数。并且,、以及共享网络的网络深度和宽度可设置相同,也可不同。
需要指出的是,在神经网络训练完成后,训练后的神经网络的参数即为原始图像对应的图像压缩结果。在解码端,只需将参数再代入相应的神经网络中,并输入图像坐标,网络的输出即是解压后的图像。
如图6所示的率失真性能对比图是在Kodak数据集上进行训练所得的训练结果。性能指标采用峰值信噪比(Peak Signal Noise Ratio,简称PSNR),主要计算重建出来的与原图像之间的PSNR值。码率大小的计算公式如下:
所对应的模型参数量应包括、、和共享网络参数,在的参数量基础上加上及,之后的参数量大小也类似计算。在本实验中,设置每部分位置编码后的信号包含的频率数为8,输出的码率点数量为4,因此,在一个模型中可以得到输出多个结果。
实验结果表明,根据本申请公开的图像压缩方法得到的码率可变的图像压缩网络模型可以在一个模型中实现多个输出,并且率失真性能与经典模型相比相似。
由此可见,本申请实施例中采用点乘连接的方法与将这两个信号直接连接相比,大大减小了模型的参数量,保证模型的轻量化;并且在进行神经网络训练时,loss函数中包含了所有的输出信号与原信号之间的误差函数。此处考虑所有输出信号,可以保证每个输出信号的率失真性能。
如图7所示,本发明实施例公开了一种图像压缩装置,应用于编码端,包括:
像素编码模块11,用于基于预设图像码率对原始图像的像素坐标进行编码以得到若干个编码信号;
信号分组模块12,用于根据图像码率对所述编码信号进行分组,得到与不同图像码率分别对应的若干组分组信号;其中,每组所述分组信号包含相应图像码率下的各像素频率对应的所述编码信号;
信号点乘模块13,用于利用第一预设多层感知机网络分别对各所述分组信号进行处理以得到若干个第一目标信号,并利用点乘运算对所述第一目标信号进行处理得到点乘后信号;
信号确定模块14,用于利用第二预设多层感知机网络对所述点乘后信号进行处理以得到与图像RGB值对应的第二目标信号;
压缩结果确定模块15,用于基于预设损失函数以及所述第二目标信号对预设神经网络进行训练,以得到训练后网络参数,并基于所述训练后网络参数生成所述原始图像的图像压缩结果。
由此可见,本申请可以基于所需要的预设图像码率的个数对原始图像的像素坐标进行编码,然后利用第一预设多层感知机网络对位置编码信号进行处理;并且可以通过点乘的方式对不同的信号进行连接处理,可以得到对应不同图像码率的信号,然后通过第二预设多层感知机网络对信号进行处理,这样可以减少过程中的参数量,进而使整体处理模型更轻量化。进一步的,预设损失函数中可以考虑所有的信号,可以保证每个输出信号的率失真性能。
在一种具体的实施例中,所述像素编码模块11,可以包括:
总频率数确定单元,用于根据所述原始图像中与像素坐标对应的图像元素的频率数量以及所述预设图像码率的数量确定采样的总频率数;
采样值确定单元,用于从预设正态分布中选出与所述总频率数相同数量的采样值;
像素坐标采样单元,用于基于所述采样值的从小到大的顺序对相应的像素坐标进行采样处理,以得到所述编码信号。
在一种具体的实施例中,所述信号点乘模块13,可以包括:
第一信号点乘单元,用于对所述第一目标信号中的若干个信号分量进行点乘处理以得到点乘后信号。
在另一种具体的实施例中,所述信号点乘模块13,还可以包括:
第二信号点乘单元,用于对所述点乘后信号以及所述第一目标信号中的若干个信号分量进行点乘以得到新的点乘后信号。
在一种具体的实施例中,所述信号确定模块14,包括:
信号处理单元,用于利用所述第二预设多层感知机网络对所述点乘后信号进行处理以得到与不同图像码率对应的若干个处理后信号;其中,所述处理后信号具有与RGB三通道对应的信号维度;
信号加权单元,用于对各所述处理后信号进行加权处理,得到所述第二目标信号。
如图8所示,本发明实施例公开了一种图像解压缩装置,应用于解码端,包括:
信息获取模块21,用于获取原始图像的图像尺寸大小以及相应的图像压缩结果;
坐标处理模块22,用于将所述图像压缩结果输入预设神经网络,然后将基于所述图像尺寸大小确定的各像素坐标输入至所述预设神经网络,以得到各所述像素坐标分别对应的RGB值;
图像确定模块23,用于基于所述RGB值以及目标图像码率确定出与所述目标图像码率对应的图像。
本申请可以基于原始图像的尺寸大小确定出图像的像素坐标,再根据相应的图像压缩结果对预设神经网络进行处理可以得到包含图像压缩信息的神经网络,然后可以输入图像的像素坐标获取相应的RGB值,进而可以根据目标码率得到相应的图像。这样得到不同码率对应质量的图像,可以适应设备硬件的性能与传输的效率。
进一步的,本申请实施例还公开了一种电子设备,图9是根据一示例性实施例示出的电子设备30结构图,图中的内容不能认为是对本申请的使用范围的任何限制。
图9为本申请实施例提供的一种电子设备30的结构示意图。该电子设备 30,具体可以包括:至少一个处理器31、至少一个存储器32、电源33、通信接口34、输入输出接口35和通信总线36。其中,所述存储器32用于存储计算机程序,所述计算机程序由所述处理器31加载并执行,以实现前述任一实施例公开的图像压缩方法中的相关步骤。另外,本实施例中的电子设备30具体可以为电子计算机。
本实施例中,电源33用于为电子设备30上的各硬件设备提供工作电压;通信接口34能够为电子设备30创建与外界设备之间的数据传输通道,其所遵循的通信协议是能够适用于本申请技术方案的任意通信协议,在此不对其进 行具体限定;输入输出接口35,用于获取外界输入数据或向外界输出数据,其具体的接口类型可以根据具体应用需要进行选取,在此不进行具体限定。
另外,存储器32作为资源存储的载体,可以是只读存储器、随机存储器、磁盘或者光盘等,其上所存储的资源可以包括操作系统321、计算机程序322等,存储方式可以是短暂存储或者永久存储。
其中,操作系统321用于管理与控制电子设备30上的各硬件设备以及计算 机程序322,其可以是Windows Server、Netware、Unix、Linux等。计算机程序322除了包括能够用于完成前述任一实施例公开的由电子设备30执行的图像压缩方法的计算机程序之外,还可以进一步包括能够用于完成其他特定工作的计算机程序。
进一步的,本申请还公开了一种计算机可读存储介质,用于存储计算机程序;其中,所述计算机程序被处理器执行时实现前述公开的图像压缩方法。关于该方法的具体步骤可以参考前述实施例中公开的相应内容,在此不再进行赘述。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本申请所提供的技术方案进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (10)
1.一种图像压缩方法,其特征在于,应用于编码端,包括:
基于预设图像码率对原始图像的像素坐标进行编码以得到若干个编码信号;
根据图像码率对所述编码信号进行分组,得到与不同图像码率分别对应的若干组分组信号;其中,每组所述分组信号包含相应图像码率下的各像素频率对应的所述编码信号;
利用第一预设多层感知机网络分别对各所述分组信号进行处理以得到若干个第一目标信号,并利用点乘运算对所述第一目标信号进行处理得到点乘后信号;
利用第二预设多层感知机网络对所述点乘后信号进行处理以得到与图像RGB值对应的第二目标信号;
基于预设损失函数以及所述第二目标信号对预设神经网络进行训练,以得到训练后网络参数,并基于所述训练后网络参数生成所述原始图像的图像压缩结果。
2.根据权利要求1所述的图像压缩方法,其特征在于,所述基于预设图像码率对原始图像的像素坐标进行编码以得到若干个编码信号,包括:
根据所述原始图像中与像素坐标对应的图像元素的频率数量以及所述预设图像码率的数量确定采样的总频率数;
从预设正态分布中选出与所述总频率数相同数量的采样值;
基于所述采样值的从小到大的顺序对相应的像素坐标进行采样处理,以得到所述编码信号。
3.根据权利要求1所述的图像压缩方法,其特征在于,所述利用点乘运算对所述第一目标信号进行处理得到点乘后信号,包括:
对所述第一目标信号中的若干个信号分量进行点乘处理以得到点乘后信号。
4.根据权利要求3所述的图像压缩方法,其特征在于,还包括:
对所述点乘后信号以及所述第一目标信号中的若干个信号分量进行点乘以得到新的点乘后信号。
5.根据权利要求1至4任一项所述的图像压缩方法,其特征在于,所述利用第二预设多层感知机网络对所述点乘后信号进行处理以得到与图像RGB值对应的第二目标信号,包括:
利用所述第二预设多层感知机网络对所述点乘后信号进行处理以得到与不同图像码率对应的若干个处理后信号;其中,所述处理后信号具有与RGB三通道对应的信号维度;
对各所述处理后信号进行加权处理,得到所述第二目标信号。
6.一种图像解压缩方法,其特征在于,应用于解码端,包括:
获取原始图像的图像尺寸大小以及相应的图像压缩结果;
将所述图像压缩结果输入预设神经网络,然后将基于所述图像尺寸大小确定的各像素坐标输入至所述预设神经网络,以得到各所述像素坐标分别对应的RGB值;
基于所述RGB值以及目标图像码率确定出与所述目标图像码率对应的图像。
7.一种图像压缩装置,其特征在于,应用于编码端,包括:
像素编码模块,用于基于预设图像码率对原始图像的像素坐标进行编码以得到若干个编码信号;
信号分组模块,用于根据图像码率对所述编码信号进行分组,得到与不同图像码率分别对应的若干组分组信号;其中,每组所述分组信号包含相应图像码率下的各像素频率对应的所述编码信号;
信号点乘模块,用于利用第一预设多层感知机网络分别对各所述分组信号进行处理以得到若干个第一目标信号,并利用点乘运算对所述第一目标信号进行处理得到点乘后信号;
信号确定模块,用于利用第二预设多层感知机网络对所述点乘后信号进行处理以得到与图像RGB值对应的第二目标信号;
压缩结果确定模块,用于基于预设损失函数以及所述第二目标信号对预设神经网络进行训练,以得到训练后网络参数,并基于所述训练后网络参数生成所述原始图像的图像压缩结果。
8.一种图像解压缩装置,其特征在于,应用于解码端,包括:
信息获取模块,用于获取原始图像的图像尺寸大小以及相应的图像压缩结果;
坐标处理模块,用于将所述图像压缩结果输入预设神经网络,然后将基于所述图像尺寸大小确定的各像素坐标输入至所述预设神经网络,以得到各所述像素坐标分别对应的RGB值;
图像确定模块,用于基于所述RGB值以及目标图像码率确定出与所述目标图像码率对应的图像。
9.一种电子设备,其特征在于,包括:
存储器,用于保存计算机程序;
处理器,用于执行所述计算机程序以实现如权利要求1至6任一项所述的图像压缩方法。
10.一种计算机可读存储介质,其特征在于,用于保存计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的图像压缩方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310082419.5A CN115834890B (zh) | 2023-02-08 | 2023-02-08 | 一种图像压缩方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310082419.5A CN115834890B (zh) | 2023-02-08 | 2023-02-08 | 一种图像压缩方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115834890A true CN115834890A (zh) | 2023-03-21 |
CN115834890B CN115834890B (zh) | 2023-04-28 |
Family
ID=85520896
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310082419.5A Active CN115834890B (zh) | 2023-02-08 | 2023-02-08 | 一种图像压缩方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115834890B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180330511A1 (en) * | 2017-05-11 | 2018-11-15 | Kla-Tencor Corporation | Learning based approach for aligning images acquired with different modalities |
CN112785494A (zh) * | 2021-01-26 | 2021-05-11 | 网易(杭州)网络有限公司 | 一种三维模型构建方法、装置、电子设备和存储介质 |
CN113657252A (zh) * | 2021-08-16 | 2021-11-16 | 福州大学 | 基于编码解码器的高效sar图像船舶目标检测方法 |
CN114581544A (zh) * | 2022-05-09 | 2022-06-03 | 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) | 图像压缩方法、计算机设备及计算机存储介质 |
US20220207646A1 (en) * | 2020-11-19 | 2022-06-30 | Samsung Electronics Co., Ltd. | Image generators with conditionally-independent pixel synthesis |
US20220311674A1 (en) * | 2021-03-24 | 2022-09-29 | Cisco Technology, Inc. | Application of network layer fec during predicted network events |
US20220308592A1 (en) * | 2021-03-26 | 2022-09-29 | Ohmnilabs, Inc. | Vision-based obstacle detection for autonomous mobile robots |
US20220385907A1 (en) * | 2021-05-21 | 2022-12-01 | Qualcomm Incorporated | Implicit image and video compression using machine learning systems |
-
2023
- 2023-02-08 CN CN202310082419.5A patent/CN115834890B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180330511A1 (en) * | 2017-05-11 | 2018-11-15 | Kla-Tencor Corporation | Learning based approach for aligning images acquired with different modalities |
US20220207646A1 (en) * | 2020-11-19 | 2022-06-30 | Samsung Electronics Co., Ltd. | Image generators with conditionally-independent pixel synthesis |
CN112785494A (zh) * | 2021-01-26 | 2021-05-11 | 网易(杭州)网络有限公司 | 一种三维模型构建方法、装置、电子设备和存储介质 |
US20220311674A1 (en) * | 2021-03-24 | 2022-09-29 | Cisco Technology, Inc. | Application of network layer fec during predicted network events |
US20220308592A1 (en) * | 2021-03-26 | 2022-09-29 | Ohmnilabs, Inc. | Vision-based obstacle detection for autonomous mobile robots |
US20220385907A1 (en) * | 2021-05-21 | 2022-12-01 | Qualcomm Incorporated | Implicit image and video compression using machine learning systems |
CN113657252A (zh) * | 2021-08-16 | 2021-11-16 | 福州大学 | 基于编码解码器的高效sar图像船舶目标检测方法 |
CN114581544A (zh) * | 2022-05-09 | 2022-06-03 | 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) | 图像压缩方法、计算机设备及计算机存储介质 |
Non-Patent Citations (1)
Title |
---|
田波;谭文斌;王军;: "基于人工神经网络的分布式视频编码边信息生成方法" * |
Also Published As
Publication number | Publication date |
---|---|
CN115834890B (zh) | 2023-04-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Dai et al. | Nonlinear transform source-channel coding for semantic communications | |
KR102618558B1 (ko) | 조건부 오토인코더를 이용한 가변-레이트 압축을 위한 장치 및 방법 | |
US11556799B2 (en) | Channel modelling in a data transmission system | |
CN108960333B (zh) | 基于深度学习的高光谱图像无损压缩方法 | |
WO2020237646A1 (zh) | 图像处理方法、设备及计算机可读存储介质 | |
WO2020062074A1 (en) | Reconstructing distorted images using convolutional neural network | |
US20120308128A1 (en) | Image data coding apparatus, method of controlling operation of same, and program therefor | |
US20230106778A1 (en) | Quantization for Neural Networks | |
CN113994348A (zh) | 对于深度神经网络压缩的线性神经重建 | |
CN114418121A (zh) | 模型训练方法、对象处理方法及装置、电子设备、介质 | |
US11699212B2 (en) | Method of controlling encoding of display data | |
WO2023050720A1 (zh) | 图像处理方法、图像处理装置、模型训练方法 | |
Beitollahi et al. | FLAC: Federated learning with autoencoder compression and convergence guarantee | |
CN115866253B (zh) | 一种基于自调制的通道间变换方法、装置、终端及介质 | |
CN115776571B (zh) | 一种图像压缩方法、装置、设备及存储介质 | |
CN115834890A (zh) | 一种图像压缩方法、装置、设备及存储介质 | |
US20030118244A1 (en) | Data compression method and system | |
US11856203B1 (en) | Neural face video compression using multiple views | |
CN115866252A (zh) | 一种图像压缩方法、装置、设备及存储介质 | |
CN115695810A (zh) | 一种基于语义通信的低比特率图像压缩编码方法 | |
TW202046726A (zh) | 用於壓縮的方法及系統 | |
US11670008B2 (en) | Processing display data for transmission | |
Chen et al. | Information Compression in the AI Era: Recent Advances and Future Challenges | |
CN115914630B (zh) | 一种图像压缩方法、装置、设备及存储介质 | |
CN114827289B (zh) | 一种通信压缩方法、系统、电子装置和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |