CN115834890A - 一种图像压缩方法、装置、设备及存储介质 - Google Patents

一种图像压缩方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN115834890A
CN115834890A CN202310082419.5A CN202310082419A CN115834890A CN 115834890 A CN115834890 A CN 115834890A CN 202310082419 A CN202310082419 A CN 202310082419A CN 115834890 A CN115834890 A CN 115834890A
Authority
CN
China
Prior art keywords
image
signal
signals
preset
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310082419.5A
Other languages
English (en)
Other versions
CN115834890B (zh
Inventor
梁永生
徐倩
鲍有能
谭文
李超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Institute Of Technology shenzhen Shenzhen Institute Of Science And Technology Innovation Harbin Institute Of Technology
Original Assignee
Harbin Institute Of Technology shenzhen Shenzhen Institute Of Science And Technology Innovation Harbin Institute Of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Institute Of Technology shenzhen Shenzhen Institute Of Science And Technology Innovation Harbin Institute Of Technology filed Critical Harbin Institute Of Technology shenzhen Shenzhen Institute Of Science And Technology Innovation Harbin Institute Of Technology
Priority to CN202310082419.5A priority Critical patent/CN115834890B/zh
Publication of CN115834890A publication Critical patent/CN115834890A/zh
Application granted granted Critical
Publication of CN115834890B publication Critical patent/CN115834890B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Image Processing (AREA)

Abstract

本申请公开了一种图像压缩方法、装置、设备及存储介质,涉及图像处理技术领域,包括:基于预设图像码率对原始图像的像素坐标进行编码得到若干编码信号;根据图像码率对编码信号进行分组得到若干分组信号;利用预设多层感知机网络对分组信号进行处理得到若干第一目标信号,并利用点乘运算对第一目标信号进行处理得到点乘后信号;利用预设多层感知机网络对点乘后信号进行处理以得到与图像RGB值对应的第二目标信号;基于预设损失函数和第二目标信号对预设神经网络进行训练得到训练后网络参数,并基于训练后网络参数生成图像压缩结果。由此可见,本申请可以通过隐式神经得到与预设图像码率对应的信号,能很好适应设备硬件的性能并提升了传输效率。

Description

一种图像压缩方法、装置、设备及存储介质
技术领域
本发明涉及图像处理技术领域,特别涉及一种图像压缩方法、装置、设备及存储介质。
背景技术
图像压缩对于数据的高效传输与存储十分必要。近年来,在深度学习技术飞速发展的前提下,基于深度学习的图像压缩技术被众多学者进行研究。其中,以基于卷积神经网络的端到端图像压缩方法所得到的率失真性能最优,远远超过了传统的JPEG(JointPhotographic Experts Group,一种压缩标准)、BPG(Better Portable Graphics,更好的可移植图形)等方法。然而,由于目前端到端图像压缩模型存储要求高,且模型训练时间长,难以部署到常用设备中。
基于隐式神经表示的图像压缩方法可以解决存储要求高的问题。隐式神经表示通常采用的多层感知机模型,结构与基于卷积神经网络的端到端图像压缩模型相比,更加简单,训练后所得到的模型更加轻量,更加适用于图像压缩数据的存储和传输。
然而,由于使用隐式神经表示进行图像压缩,主要在于将网络模型参数作为图像压缩后的数据进行传输,因此在模型结构固定的情况下,所对应的图像码率固定,率失真性能也相应固定。但从实际应用而言,图像压缩模型要尽可能根据不同的算力和需求,给出不同码率下的对应质量的图像,以适应设备硬件的性能与传输的效率。
发明内容
有鉴于此,本发明的目的在于提供一种图像压缩方法、装置、设备及存储介质,能够得到不同码率的图像,并且模型轻量,易于部署。其具体方案如下:
第一方面,本申请提供了一种图像压缩方法,应用于编码端,包括:
基于预设图像码率对原始图像的像素坐标进行编码以得到若干个编码信号;
根据图像码率对所述编码信号进行分组,得到与不同图像码率分别对应的若干组分组信号;其中,每组所述分组信号包含相应图像码率下的各像素频率对应的所述编码信号;
利用第一预设多层感知机网络分别对各所述分组信号进行处理以得到若干个第一目标信号,并利用点乘运算对所述第一目标信号进行处理得到点乘后信号;
利用第二预设多层感知机网络对所述点乘后信号进行处理以得到与图像RGB值对应的第二目标信号;
基于预设损失函数以及所述第二目标信号对预设神经网络进行训练,以得到训练后网络参数,并基于所述训练后网络参数生成所述原始图像的图像压缩结果。
可选的,所述基于预设图像码率对原始图像的像素坐标进行编码以得到若干个编码信号,包括:
根据所述原始图像中与像素坐标对应的图像元素的频率数量以及所述预设图像码率的数量确定采样的总频率数;
从预设正态分布中选出与所述总频率数相同数量的采样值;
基于所述采样值的从小到大的顺序对相应的像素坐标进行采样处理,以得到所述编码信号。
可选的,所述利用点乘运算对所述第一目标信号进行处理得到点乘后信号,包括:
对所述第一目标信号中的若干个信号分量进行点乘处理以得到点乘后信号。
可选的,所述方法还包括:
对所述点乘后信号以及所述第一目标信号中的若干个信号分量进行点乘以得到新的点乘后信号。
可选的,所述利用第二预设多层感知机网络对所述点乘后信号进行处理以得到与图像RGB值对应的第二目标信号,包括:
利用所述第二预设多层感知机网络对所述点乘后信号进行处理以得到与不同图像码率对应的若干个处理后信号;其中,所述处理后信号具有与RGB三通道对应的信号维度;
对各所述处理后信号进行加权处理,得到所述第二目标信号。
第二方面,本申请提供了一种图像解压缩方法,应用于解码端,包括:
获取原始图像的图像尺寸大小以及相应的图像压缩结果;
将所述图像压缩结果输入预设神经网络,然后将基于所述图像尺寸大小确定的各像素坐标输入至所述预设神经网络,以得到各所述像素坐标分别对应的RGB值;
基于所述RGB值以及目标图像码率确定出与所述目标图像码率对应的图像。
第三方面,本申请提供了一种图像压缩装置,应用于编码端,包括:
像素编码模块,用于基于预设图像码率对原始图像的像素坐标进行编码以得到若干个编码信号;
信号分组模块,用于根据图像码率对所述编码信号进行分组,得到与不同图像码率分别对应的若干组分组信号;其中,每组所述分组信号包含相应图像码率下的各像素频率对应的所述编码信号;
信号点乘模块,用于利用第一预设多层感知机网络分别对各所述分组信号进行处理以得到若干个第一目标信号,并利用点乘运算对所述第一目标信号进行处理得到点乘后信号;
信号确定模块,用于利用第二预设多层感知机网络对所述点乘后信号进行处理以得到与图像RGB值对应的第二目标信号;
压缩结果确定模块,用于基于预设损失函数以及所述第二目标信号对预设神经网络进行训练,以得到训练后网络参数,并基于所述训练后网络参数生成所述原始图像的图像压缩结果。
第四方面,本申请提供了一种图像解压缩装置,应用于解码端,包括:
信息获取模块,用于获取原始图像的图像尺寸大小以及相应的图像压缩结果;
坐标处理模块,用于将所述图像压缩结果输入预设神经网络,然后将基于所述图像尺寸大小确定的各像素坐标输入至所述预设神经网络,以得到各所述像素坐标分别对应的RGB值;
图像确定模块,用于基于所述RGB值以及目标图像码率确定出与所述目标图像码率对应的图像。
第五方面,本申请提供了一种电子设备,包括:
存储器,用于保存计算机程序;
处理器,用于执行所述计算机程序以实现如上述的图像压缩方法。
第六方面,本申请提供了一种计算机可读存储介质,用于保存计算机程序,所述计算机程序被处理器执行时实现如上述的图像压缩方法。
由此可见,本申请可以基于预设图像码率对原始图像的像素坐标进行编码以得到若干个编码信号;然后根据图像码率对所述编码信号进行分组,得到与不同图像码率分别对应的若干组分组信号;其中,每组所述分组信号包含相应图像码率下的各像素频率对应的所述编码信号;再利用第一预设多层感知机网络分别对各所述分组信号进行处理以得到若干个第一目标信号,并利用点乘运算对所述第一目标信号进行处理得到点乘后信号;然后利用第二预设多层感知机网络对所述点乘后信号进行处理以得到与图像RGB值对应的第二目标信号;最后基于预设损失函数以及所述第二目标信号对预设神经网络进行训练,以得到训练后网络参数,并基于所述训练后网络参数生成所述原始图像的图像压缩结果。这样一来,本申请可以根据所需要的预设图像码率的个数,利用第一预设多层感知机网络对位置编码信号进行处理;并且可以通过点乘的方式对信号进行连接处理得到对应不同码率点的信号,然后通过第二预设多层感知机网络对信号进行处理,这样可以减少过程中的参数量,进而使整体处理模型更轻量化。进一步的,预设损失函数中可以保证每个输出信号的率失真性能,基于隐式神经表示的图像压缩过程对存储要求比较低,更便于使用。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请公开的一种图像压缩方法流程图;
图2为本申请公开的一种具体的图像压缩方法流程图;
图3为本申请公开的一种具体的图像压缩方法流程图;
图4为本申请公开的一种具体的图像解压缩方法流程图;
图5为本申请公开的一种具体的图像压缩方法流程图;
图6为本申请公开的一种率失真性能对比图;
图7为本申请公开的一种图像压缩装置结构示意图;
图8为本申请公开的一种图像解压缩装置结构示意图;
图9为本申请公开的一种电子设备结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明能够在一个轻量的图像压缩模型中,得到不同码率大小的图像。主要从两点出发,为保证输出的多个图像率失真性能呈现逐渐增加的形式,以达到随着网络参数增加率失真性能增加的效果,可以通过对于图像中的坐标进行不同频率的编码,可以提取出相应的频率成分,以便于控制输入信号的带宽。其中,使用的频率通过零均值高斯分布采样所得。而对位置进行编码之后的信号可以从低频到高频依次传入网络模型中,达到率失真性能递增的效果。为实现一个网络模型能够拥有多个输出,可以通过变换网络深度来实现。每个输出都需要更高频率的信号输入,该高频信号经过一层神经网络后与已有的网络输出进行点乘,保证在上一个输出的基础上增加更多高频信息。此外,多输出网络中还有一个输出共享结构,能够将网络最终的输出从多维转化为3维,以对应于图像的RGB三个值。可见,本申请的图像处理网络能够随着网络的逐渐增加,而率失真性也随之增加,并可以保证对应码率点的率失真性能相似,实现更加轻量的码率可变的图像压缩模型。
参见图1所示,本发明实施例公开了一种图像压缩方法,包括:
步骤S11、基于预设图像码率对原始图像的像素坐标进行编码以得到若干个编码信号。
本实施例中,首先可以基于所述预设图像码率对所述原始图像的像素坐标进行编码;可以理解的是,图像中的信号包括高频分量和低频分量,位置编码的操作如下:
Figure SMS_1
位置编码通过对于图像中的坐标
Figure SMS_2
进行不同频率
Figure SMS_3
的编码,可以提取出相应的频率成分,以便于控制输入信号的带宽。而位置编码之后的信号从低频到高频依次传入网络模型中,可以达到率失真性能递增的效果。
步骤S12、根据图像码率对所述编码信号进行分组,得到与不同图像码率分别对应的若干组分组信号;其中,每组所述分组信号包含相应图像码率下的各像素频率对应的所述编码信号。
本实施例中,对所述原始图像进行编码得到所述编码信号之后,可以根据图像码率对所述编码信号进行分组;可以理解的是,前述步骤S11可以对整个原始图像的像素坐标进行编码得到相应数量的编码信号,进一步的,这些编码信号也对应不同的图像码率;在本实施例中,可以根据图像码率对所述编码信号进行分组,这样可以得到与图像码率对应的不同组的所述分组信号;需要指出的是,所述分组信号包含相应码率下的整个所述原始图像对应的编码信号,也即单个分组信号包含相应码率下整个图像的信息。
步骤S13、利用第一预设多层感知机网络分别对各所述分组信号进行处理以得到若干个第一目标信号,并利用点乘运算对所述第一目标信号进行处理得到点乘后信号。
本实施例中,得到若干组分组信号之后,可以利用所述第一预设多层感知机网络对各所述分组信号进行处理;需要指出的是,所述第一预设多层感知机网络中可以采用不同的激活函数来提高率失真性能,包括但不限于:ReLU函数,Sigmoid函数,正弦函数等。这样处理之后,可以得到若干个第一目标信号;进一步的,可以对不同的所述第一目标信号进行点乘处理,点乘处理可以将不同的信号结合起来,这样可以补充更多关于图像的细节信息,需要指出的是,这样可以得到若干数量个点乘后信号。
步骤S14、利用第二预设多层感知机网络对所述点乘后信号进行处理以得到与图像RGB值对应的第二目标信号。
本实施例中,得到若干个点乘后信号之后,可以利用第二预设多层感知机网络对所述点乘后信号进行处理;需要指出的是,所述第二预设多层感知机网络可以对其中所有的信号进行权重共享,这样可以大大减少网络模型的参数量;并且,可以设置输出信号维度为3,这样可以对应图像的RGB值。
步骤S15、基于预设损失函数以及所述第二目标信号对预设神经网络进行训练,以得到训练后网络参数,并基于所述训练后网络参数生成所述原始图像的图像压缩结果。
本实施例中,得到所述第二目标信号之后,可以基于预设损失函数利用所述第二目标信号对所述预设神经网络进行训练,在训练完成后可可以得到训练后神经网络,并可以得到所述训练后神经网络的所述训练后网络参数;需要指出的是,可以基于所述训练后网络参数生成与所述原始图像对应的图像压缩结果,在一种具体的实施例中,可以将训练后网络参数转化为码流进行传输。
由此可见,本申请可以基于预设图像码率对原始图像的像素坐标进行编码以得到若干个编码信号;然后根据图像码率对所述编码信号进行分组,得到与不同图像码率分别对应的若干组分组信号;其中,每组所述分组信号包含相应图像码率下的各像素频率对应的所述编码信号;再利用第一预设多层感知机网络分别对各所述分组信号进行处理以得到若干个第一目标信号,并利用点乘运算对所述第一目标信号进行处理得到点乘后信号;然后利用第二预设多层感知机网络对所述点乘后信号进行处理以得到与图像RGB值对应的第二目标信号;最后基于预设损失函数以及所述第二目标信号对预设神经网络进行训练,以得到训练后网络参数,并基于所述训练后网络参数生成所述原始图像的图像压缩结果。这样一来,本申请可以根据所需要的预设图像码率的个数,利用第一预设多层感知机网络对位置编码信号进行处理;并且可以通过点乘的方式对信号进行连接处理,这样低码率点处的性能表现也能够帮助调整更高码率点处的性能;进一步的,本实施例可以通过第二预设多层感知机网络对信号进行处理,这样可以共享信号的权重,以减少过程中的参数量,进而使整体的网络模型更轻量化。进一步的,预设损失函数中可以考虑所有的信号,可以保证每个输出信号的率失真性能,并且这样基于隐式神经表示的图像压缩过程对存储要求比较低,更便于使用。
下面实施例将围绕对与原始图像对应的像素坐标进行编码的过程展开,参见图2所示,本发明实施例公开了一种图像压缩方法,包括:
步骤S21、根据原始图像中与像素坐标对应的图像元素的频率数量以及预设图像码率的数量确定采样的总频率数。
本实施例中,得到编码信号的过程可以首先确定采样的总频率数;在一种具体的实施例中,首先确定像素坐标也即像素输入信号包含的频率数量
Figure SMS_4
,然后根据所需要的码率点数
Figure SMS_5
也即前述预设图像码率确定出需要采样的总码率数
Figure SMS_6
,总码率数
Figure SMS_7
应满足公式:
Figure SMS_8
步骤S22、从预设正态分布中选出与所述总频率数相同数量的采样值。
本实施例中,得到需要采样的所述总频率数之后,可以根据需要采样的总频率数,从零均值正态分布中生成相应数量的采样值;需要指出的是,采样值的选取是从零均值正态分布中所得,可以采用方差为15的正态分布。其中,正态分布的均值可以为0、1、2、3等整数,方差也可以为13、14、15、16等整数。
步骤S23、基于所述采样值的从小到大的顺序对相应的像素坐标进行采样处理,以得到所述编码信号。
本实施例中,得到一定数量的采样值后,可以基于所述采样值的从小到大的顺序对相应的像素坐标进行采样处理,以得到所述编码信号;具体的,首先根据采样值的绝对值大小将其从小到大排列,这样可以保证位置编码后所得信号频率从低到高排列,然后对相应的像素进行采样,这样可以得到所述编码信号;可以理解的是,在一种具体的实施例中,采样可以得到频率值
Figure SMS_9
,然后对于输入图像的坐标
Figure SMS_10
编码,即:
Figure SMS_11
Figure SMS_12
然后将
Figure SMS_13
Figure SMS_14
连接之后可以得到所述编码信号:
Figure SMS_15
步骤S24、利用第一预设多层感知机网络分别对各所述分组信号进行处理以得到若干个第一目标信号,并利用点乘运算对所述第一目标信号进行处理得到点乘后信号。
步骤S25、利用第二预设多层感知机网络对所述点乘后信号进行处理以得到与图像RGB值对应的第二目标信号。
步骤S26、基于预设损失函数以及所述第二目标信号对预设神经网络进行训练,以得到训练后网络参数,并基于所述训练后网络参数生成所述原始图像的图像压缩结果。
其中,关于上述步骤S24、S25和S26更加具体的处理过程可以参考前述实施例中公开的相应内容,在此不再进行赘述。
由此可见,本申请实施例中可以根据原始图像中与像素坐标对应的图像元素的频率数量以及预设图像码率的数量确定采样的总频率数,然后从预设正态分布中选出与所述总频率数相同数量的采样值,再基于所述采样值的从小到大的顺序对相应的像素坐标进行采样处理,以得到所述编码信号。这样一来,本申请可以根据预设图像码率的数量以及图像元素的频率数量对图像进行采样,并且可以利用从小到大顺序的采样值保证采样得到的信号频率是递进关系,达到率失真性能递增的效果。
下面实施例将针对得到分组信号之后对信号进行点乘的相关步骤进行详细介绍,参见图3所示,本发明实施例公开了一种图像压缩方法,包括:
步骤S31、基于预设图像码率对原始图像的像素坐标进行编码以得到若干个编码信号。
步骤S32、根据图像码率对所述编码信号进行分组,得到与不同图像码率分别对应的若干组分组信号;其中,每组所述分组信号包含相应图像码率下的各像素频率对应的所述编码信号。
步骤S33、利用第一预设多层感知机网络分别对各所述分组信号进行处理以得到若干个第一目标信号。
步骤S34、利用点乘运算对所述第一目标信号进行处理得到点乘后信号。
本实施例中,得到若干个所述第一目标信号之后, 可以利用点乘运算对所述第一目标信号进行点乘处理;可以理解的是,在一种具体的实施例中,前述步骤S33可以将分组后的分组信号
Figure SMS_18
Figure SMS_19
分别经过预设的多层感知机网络
Figure SMS_22
Figure SMS_17
得到
Figure SMS_20
Figure SMS_23
,然后可以对
Figure SMS_25
Figure SMS_16
进行点乘,点乘能够将两个经过处理的不同频率的信号相结合。点乘后可以经过预设的多层感知机网络
Figure SMS_21
,得到信号
Figure SMS_24
,也即所述点乘后信号。
步骤S35、对所述点乘后信号以及所述第一目标信号中的若干个信号分量进行点乘以得到新的点乘后信号。
本实施例中,需要指出的是,还可以对所述点成后信号以及所述第一目标信号中的信号分量进行点乘处理;在一种具体的实施例中,可以将通过步骤S33得到的信号
Figure SMS_26
与步骤S34得到的
Figure SMS_27
进行点乘处理,然后可以经过预设的多层感知机网络
Figure SMS_28
,得到信号
Figure SMS_29
,也即新的点乘后信号。这样可以在信号
Figure SMS_30
的基础上补充更多的细节信息。进一步的,根据需要码率点数的不同,可以进行与步骤S33和步骤S34相同的操作,可以基于点乘操作得到点乘后信号
Figure SMS_31
步骤S36、利用第二预设多层感知机网络对所述点乘后信号进行处理以得到与不同图像码率对应的若干个处理后信号;其中,所述处理后信号具有与RGB三通道对应的信号维度。
步骤S37、对各所述处理后信号进行加权处理,得到所述第二目标信号。
步骤S38、基于预设损失函数以及所述第二目标信号对预设神经网络进行训练,以得到训练后网络参数,并基于所述训练后网络参数生成所述原始图像的图像压缩结果。
其中,关于上述步骤S31、S32、S33、S36、S37和S38更加具体的处理过程可以参考前述实施例中公开的相应内容,在此不再进行赘述。
由此可见,本申请实施例中可以对第一目标信号进行点乘处理,并且可以对点乘后信号以及第一目标信号进行点乘处理,这样可以在信号中补充更多的细节信息;并且过程中可以考虑所需要的图像码率再对相应的信号进行点乘处理,这样可以提高模型整体的率失真性能。
参见图4示,本发明实施例公开了一种图像解压缩方法,包括:
步骤S41、获取原始图像的图像尺寸大小以及相应的图像压缩结果。
本实施例中,对图像进行解码操作时,需要获取原始图像的尺寸大小以及相应的图像压缩结果;可以理解的是,通过尺寸大小可以确定出图像的像素坐标信息,这样可以便于后续通过像素坐标还原图像的像素信息。
步骤S42、将所述图像压缩结果输入预设神经网络,然后将基于所述图像尺寸大小确定的各像素坐标输入至所述预设神经网络,以得到各所述像素坐标分别对应的RGB值。
本实施例中,得到所述图像压缩结果之后,可以将所述图像压缩结果输入所述预设神经网络;需要指出的是,在前述实施例得到图像压缩结果的过程中可以是对第一神经网络进行训练,然后得到所述图像压缩结果;本实施例中,所述预设神经网络可以是与训练前的第一神经网络相同的神经网络;可以理解的是,只需要将通过所述图像压缩结果转化后的网络参数代入到所述预设神经网络中,就可以得到一个训练好的神经网络。然后,就可以通过在输入所述图像压缩结果后的所述预设神经网络中输入图像的像素坐标,即可得到与像素坐标对应的图像的RGB值。
步骤S43、基于所述RGB值以及目标图像码率确定出与所述目标图像码率对应的图像。
本实施例中,得到与各所述像素坐标对应的所述RGB值之后,可以基于所述目标图像码率确定出相应的RGB值,然后可以得到与所述目标图像码率对应的图像;可以理解的是,在一种具体的实施例中,可以基于所述RGB值得到所述图像压缩结果中包含的所有码率一一对应的不同图像。
由此可见,本申请实施例中可以基于原始图像的尺寸大小确定出图像的像素坐标信息,然后可以将图像压缩结果输入预设神经网络,之后在输入图像压缩结果后的神经网络中输入原始图像的像素坐标,即可得到相应坐标的RGB值,也即得到了解压后的图像;并且,本申请实施例可以输出一个目标码率的图像或者输出全部码率的解压后图像,这样可以满足不同的使用场景。
本实施例结合图5所示的流程图对本申请的技术方案进行介绍,包括:
本实施例中,首先对输入的图像坐标进行位置编码,对原始图像中所有的像素坐标都进行编码后,可以将所得的信号按照频率排列的顺序连接,然后得到的信号如下所示:
Figure SMS_32
进一步的,可以根据图像码率对所述编码信号进行分组,可以得到不同码率点的分组信号
Figure SMS_33
,具体如下所示:
Figure SMS_34
其中,每个信号
Figure SMS_35
中包含
Figure SMS_36
个频率成分,且信号
Figure SMS_37
Figure SMS_38
的频率逐渐变高。需要指出的是,
Figure SMS_39
为每部分输入信号包含的频率数量。
相应的,得到分组信号
Figure SMS_49
之后,可以将
Figure SMS_43
Figure SMS_45
分别经过多层感知机网络
Figure SMS_51
Figure SMS_55
进行处理得到
Figure SMS_53
Figure SMS_56
该类型网络可以提高率失真性能;相应的,可以将输出的信号
Figure SMS_48
Figure SMS_52
进行点乘,点乘能够将两个经过处理的不同频率的信号相结合。点乘后经多层感知机网络
Figure SMS_40
,得到信号
Figure SMS_47
。可以理解的是,信号
Figure SMS_46
可以通过共享网络处理或者再与信号
Figure SMS_50
进行点乘处理;依此类推,信号
Figure SMS_54
经过
Figure SMS_57
网络处理后可以与点乘后信号
Figure SMS_41
再次进行点乘再经过网络
Figure SMS_44
可以得到
Figure SMS_42
进一步的,可以将所有的
Figure SMS_58
信号都经过共享网络也即一个相同的多层感知机网络,可以得到信号
Figure SMS_59
,该网络对于所有的
Figure SMS_60
信号权重共享,这样可以大大减少网络模型的参数量。需要指出的是,可以设置该共享网络输出信号维度为3,以对应于图像的RGB值,该共享网络中可以使用不同的激活函数,包括但不限于:ReLU函数,Sigmoid函数,正弦函数,同时,共享网络中也可以不采用激活函数,直接输出。然后可以将得到的
Figure SMS_61
经过加权公式确定出最终输出信号
Figure SMS_62
,本实施例中将已有的
Figure SMS_63
按照相同权重相加,权重的大小应与根据具体的情况来确定,具体公式如下:
Figure SMS_64
得到
Figure SMS_65
之后,可以利用与所有输出信号
Figure SMS_66
有关的loss函数对预设神经网络进行训练,loss函数具体表示如下:
Figure SMS_67
此处,
Figure SMS_70
代表均方误差损失函数
Figure SMS_74
Figure SMS_77
表示每个坐标上的对应的RGB特征值。需要指出的是,训练中采用的
Figure SMS_69
函数表示一种损失函数,以获得预测值
Figure SMS_72
与真实值
Figure SMS_75
之间的差异。具体实施方式可以是各种回归问题损失函数,包括但不限于:均方误差、平均绝对值误差、Huber损失等。其次,训练中的loss函数选取各
Figure SMS_78
函数直接相加,而相加时采用的具体权重大小应根据具体要求来确定。进一步需要指出的是,本申请使用的
Figure SMS_68
Figure SMS_71
以及共享网络均为多层感知机网络,所选取的网络深度可以是1、2、3、4等整数,宽度可以是10、20、30等整数。并且,
Figure SMS_73
Figure SMS_76
以及共享网络的网络深度和宽度可设置相同,也可不同。
需要指出的是,在神经网络训练完成后,训练后的神经网络的参数即为原始图像对应的图像压缩结果。在解码端,只需将参数再代入相应的神经网络中,并输入图像坐标,网络的输出即是解压后的图像。
如图6所示的率失真性能对比图是在Kodak数据集上进行训练所得的训练结果。性能指标采用峰值信噪比(Peak Signal Noise Ratio,简称PSNR),主要计算重建出来的
Figure SMS_79
与原图像之间的PSNR值。码率大小的计算公式如下:
Figure SMS_80
Figure SMS_83
所对应的模型参数量应包括
Figure SMS_84
Figure SMS_87
Figure SMS_82
和共享网络参数,
Figure SMS_85
Figure SMS_88
的参数量基础上加上
Figure SMS_90
Figure SMS_81
,之后的参数量大小也类似计算。在本实验中,设置每部分位置编码后的信号包含的频率数
Figure SMS_86
为8,输出的码率点数量
Figure SMS_89
为4,因此,在一个模型中可以得到输出多个结果。
实验结果表明,根据本申请公开的图像压缩方法得到的码率可变的图像压缩网络模型可以在一个模型中实现多个输出,并且率失真性能与经典模型相比相似。
由此可见,本申请实施例中采用点乘连接的方法与将这两个信号直接连接相比,大大减小了模型的参数量,保证模型的轻量化;并且在进行神经网络训练时,loss函数中包含了所有的输出信号与原信号之间的误差函数。此处考虑所有输出信号,可以保证每个输出信号的率失真性能。
如图7所示,本发明实施例公开了一种图像压缩装置,应用于编码端,包括:
像素编码模块11,用于基于预设图像码率对原始图像的像素坐标进行编码以得到若干个编码信号;
信号分组模块12,用于根据图像码率对所述编码信号进行分组,得到与不同图像码率分别对应的若干组分组信号;其中,每组所述分组信号包含相应图像码率下的各像素频率对应的所述编码信号;
信号点乘模块13,用于利用第一预设多层感知机网络分别对各所述分组信号进行处理以得到若干个第一目标信号,并利用点乘运算对所述第一目标信号进行处理得到点乘后信号;
信号确定模块14,用于利用第二预设多层感知机网络对所述点乘后信号进行处理以得到与图像RGB值对应的第二目标信号;
压缩结果确定模块15,用于基于预设损失函数以及所述第二目标信号对预设神经网络进行训练,以得到训练后网络参数,并基于所述训练后网络参数生成所述原始图像的图像压缩结果。
由此可见,本申请可以基于所需要的预设图像码率的个数对原始图像的像素坐标进行编码,然后利用第一预设多层感知机网络对位置编码信号进行处理;并且可以通过点乘的方式对不同的信号进行连接处理,可以得到对应不同图像码率的信号,然后通过第二预设多层感知机网络对信号进行处理,这样可以减少过程中的参数量,进而使整体处理模型更轻量化。进一步的,预设损失函数中可以考虑所有的信号,可以保证每个输出信号的率失真性能。
在一种具体的实施例中,所述像素编码模块11,可以包括:
总频率数确定单元,用于根据所述原始图像中与像素坐标对应的图像元素的频率数量以及所述预设图像码率的数量确定采样的总频率数;
采样值确定单元,用于从预设正态分布中选出与所述总频率数相同数量的采样值;
像素坐标采样单元,用于基于所述采样值的从小到大的顺序对相应的像素坐标进行采样处理,以得到所述编码信号。
在一种具体的实施例中,所述信号点乘模块13,可以包括:
第一信号点乘单元,用于对所述第一目标信号中的若干个信号分量进行点乘处理以得到点乘后信号。
在另一种具体的实施例中,所述信号点乘模块13,还可以包括:
第二信号点乘单元,用于对所述点乘后信号以及所述第一目标信号中的若干个信号分量进行点乘以得到新的点乘后信号。
在一种具体的实施例中,所述信号确定模块14,包括:
信号处理单元,用于利用所述第二预设多层感知机网络对所述点乘后信号进行处理以得到与不同图像码率对应的若干个处理后信号;其中,所述处理后信号具有与RGB三通道对应的信号维度;
信号加权单元,用于对各所述处理后信号进行加权处理,得到所述第二目标信号。
如图8所示,本发明实施例公开了一种图像解压缩装置,应用于解码端,包括:
信息获取模块21,用于获取原始图像的图像尺寸大小以及相应的图像压缩结果;
坐标处理模块22,用于将所述图像压缩结果输入预设神经网络,然后将基于所述图像尺寸大小确定的各像素坐标输入至所述预设神经网络,以得到各所述像素坐标分别对应的RGB值;
图像确定模块23,用于基于所述RGB值以及目标图像码率确定出与所述目标图像码率对应的图像。
本申请可以基于原始图像的尺寸大小确定出图像的像素坐标,再根据相应的图像压缩结果对预设神经网络进行处理可以得到包含图像压缩信息的神经网络,然后可以输入图像的像素坐标获取相应的RGB值,进而可以根据目标码率得到相应的图像。这样得到不同码率对应质量的图像,可以适应设备硬件的性能与传输的效率。
进一步的,本申请实施例还公开了一种电子设备,图9是根据一示例性实施例示出的电子设备30结构图,图中的内容不能认为是对本申请的使用范围的任何限制。
图9为本申请实施例提供的一种电子设备30的结构示意图。该电子设备 30,具体可以包括:至少一个处理器31、至少一个存储器32、电源33、通信接口34、输入输出接口35和通信总线36。其中,所述存储器32用于存储计算机程序,所述计算机程序由所述处理器31加载并执行,以实现前述任一实施例公开的图像压缩方法中的相关步骤。另外,本实施例中的电子设备30具体可以为电子计算机。
本实施例中,电源33用于为电子设备30上的各硬件设备提供工作电压;通信接口34能够为电子设备30创建与外界设备之间的数据传输通道,其所遵循的通信协议是能够适用于本申请技术方案的任意通信协议,在此不对其进 行具体限定;输入输出接口35,用于获取外界输入数据或向外界输出数据,其具体的接口类型可以根据具体应用需要进行选取,在此不进行具体限定。
另外,存储器32作为资源存储的载体,可以是只读存储器、随机存储器、磁盘或者光盘等,其上所存储的资源可以包括操作系统321、计算机程序322等,存储方式可以是短暂存储或者永久存储。
其中,操作系统321用于管理与控制电子设备30上的各硬件设备以及计算 机程序322,其可以是Windows Server、Netware、Unix、Linux等。计算机程序322除了包括能够用于完成前述任一实施例公开的由电子设备30执行的图像压缩方法的计算机程序之外,还可以进一步包括能够用于完成其他特定工作的计算机程序。
进一步的,本申请还公开了一种计算机可读存储介质,用于存储计算机程序;其中,所述计算机程序被处理器执行时实现前述公开的图像压缩方法。关于该方法的具体步骤可以参考前述实施例中公开的相应内容,在此不再进行赘述。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本申请所提供的技术方案进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (10)

1.一种图像压缩方法,其特征在于,应用于编码端,包括:
基于预设图像码率对原始图像的像素坐标进行编码以得到若干个编码信号;
根据图像码率对所述编码信号进行分组,得到与不同图像码率分别对应的若干组分组信号;其中,每组所述分组信号包含相应图像码率下的各像素频率对应的所述编码信号;
利用第一预设多层感知机网络分别对各所述分组信号进行处理以得到若干个第一目标信号,并利用点乘运算对所述第一目标信号进行处理得到点乘后信号;
利用第二预设多层感知机网络对所述点乘后信号进行处理以得到与图像RGB值对应的第二目标信号;
基于预设损失函数以及所述第二目标信号对预设神经网络进行训练,以得到训练后网络参数,并基于所述训练后网络参数生成所述原始图像的图像压缩结果。
2.根据权利要求1所述的图像压缩方法,其特征在于,所述基于预设图像码率对原始图像的像素坐标进行编码以得到若干个编码信号,包括:
根据所述原始图像中与像素坐标对应的图像元素的频率数量以及所述预设图像码率的数量确定采样的总频率数;
从预设正态分布中选出与所述总频率数相同数量的采样值;
基于所述采样值的从小到大的顺序对相应的像素坐标进行采样处理,以得到所述编码信号。
3.根据权利要求1所述的图像压缩方法,其特征在于,所述利用点乘运算对所述第一目标信号进行处理得到点乘后信号,包括:
对所述第一目标信号中的若干个信号分量进行点乘处理以得到点乘后信号。
4.根据权利要求3所述的图像压缩方法,其特征在于,还包括:
对所述点乘后信号以及所述第一目标信号中的若干个信号分量进行点乘以得到新的点乘后信号。
5.根据权利要求1至4任一项所述的图像压缩方法,其特征在于,所述利用第二预设多层感知机网络对所述点乘后信号进行处理以得到与图像RGB值对应的第二目标信号,包括:
利用所述第二预设多层感知机网络对所述点乘后信号进行处理以得到与不同图像码率对应的若干个处理后信号;其中,所述处理后信号具有与RGB三通道对应的信号维度;
对各所述处理后信号进行加权处理,得到所述第二目标信号。
6.一种图像解压缩方法,其特征在于,应用于解码端,包括:
获取原始图像的图像尺寸大小以及相应的图像压缩结果;
将所述图像压缩结果输入预设神经网络,然后将基于所述图像尺寸大小确定的各像素坐标输入至所述预设神经网络,以得到各所述像素坐标分别对应的RGB值;
基于所述RGB值以及目标图像码率确定出与所述目标图像码率对应的图像。
7.一种图像压缩装置,其特征在于,应用于编码端,包括:
像素编码模块,用于基于预设图像码率对原始图像的像素坐标进行编码以得到若干个编码信号;
信号分组模块,用于根据图像码率对所述编码信号进行分组,得到与不同图像码率分别对应的若干组分组信号;其中,每组所述分组信号包含相应图像码率下的各像素频率对应的所述编码信号;
信号点乘模块,用于利用第一预设多层感知机网络分别对各所述分组信号进行处理以得到若干个第一目标信号,并利用点乘运算对所述第一目标信号进行处理得到点乘后信号;
信号确定模块,用于利用第二预设多层感知机网络对所述点乘后信号进行处理以得到与图像RGB值对应的第二目标信号;
压缩结果确定模块,用于基于预设损失函数以及所述第二目标信号对预设神经网络进行训练,以得到训练后网络参数,并基于所述训练后网络参数生成所述原始图像的图像压缩结果。
8.一种图像解压缩装置,其特征在于,应用于解码端,包括:
信息获取模块,用于获取原始图像的图像尺寸大小以及相应的图像压缩结果;
坐标处理模块,用于将所述图像压缩结果输入预设神经网络,然后将基于所述图像尺寸大小确定的各像素坐标输入至所述预设神经网络,以得到各所述像素坐标分别对应的RGB值;
图像确定模块,用于基于所述RGB值以及目标图像码率确定出与所述目标图像码率对应的图像。
9.一种电子设备,其特征在于,包括:
存储器,用于保存计算机程序;
处理器,用于执行所述计算机程序以实现如权利要求1至6任一项所述的图像压缩方法。
10.一种计算机可读存储介质,其特征在于,用于保存计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的图像压缩方法。
CN202310082419.5A 2023-02-08 2023-02-08 一种图像压缩方法、装置、设备及存储介质 Active CN115834890B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310082419.5A CN115834890B (zh) 2023-02-08 2023-02-08 一种图像压缩方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310082419.5A CN115834890B (zh) 2023-02-08 2023-02-08 一种图像压缩方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN115834890A true CN115834890A (zh) 2023-03-21
CN115834890B CN115834890B (zh) 2023-04-28

Family

ID=85520896

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310082419.5A Active CN115834890B (zh) 2023-02-08 2023-02-08 一种图像压缩方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN115834890B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180330511A1 (en) * 2017-05-11 2018-11-15 Kla-Tencor Corporation Learning based approach for aligning images acquired with different modalities
CN112785494A (zh) * 2021-01-26 2021-05-11 网易(杭州)网络有限公司 一种三维模型构建方法、装置、电子设备和存储介质
CN113657252A (zh) * 2021-08-16 2021-11-16 福州大学 基于编码解码器的高效sar图像船舶目标检测方法
CN114581544A (zh) * 2022-05-09 2022-06-03 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) 图像压缩方法、计算机设备及计算机存储介质
US20220207646A1 (en) * 2020-11-19 2022-06-30 Samsung Electronics Co., Ltd. Image generators with conditionally-independent pixel synthesis
US20220311674A1 (en) * 2021-03-24 2022-09-29 Cisco Technology, Inc. Application of network layer fec during predicted network events
US20220308592A1 (en) * 2021-03-26 2022-09-29 Ohmnilabs, Inc. Vision-based obstacle detection for autonomous mobile robots
US20220385907A1 (en) * 2021-05-21 2022-12-01 Qualcomm Incorporated Implicit image and video compression using machine learning systems

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180330511A1 (en) * 2017-05-11 2018-11-15 Kla-Tencor Corporation Learning based approach for aligning images acquired with different modalities
US20220207646A1 (en) * 2020-11-19 2022-06-30 Samsung Electronics Co., Ltd. Image generators with conditionally-independent pixel synthesis
CN112785494A (zh) * 2021-01-26 2021-05-11 网易(杭州)网络有限公司 一种三维模型构建方法、装置、电子设备和存储介质
US20220311674A1 (en) * 2021-03-24 2022-09-29 Cisco Technology, Inc. Application of network layer fec during predicted network events
US20220308592A1 (en) * 2021-03-26 2022-09-29 Ohmnilabs, Inc. Vision-based obstacle detection for autonomous mobile robots
US20220385907A1 (en) * 2021-05-21 2022-12-01 Qualcomm Incorporated Implicit image and video compression using machine learning systems
CN113657252A (zh) * 2021-08-16 2021-11-16 福州大学 基于编码解码器的高效sar图像船舶目标检测方法
CN114581544A (zh) * 2022-05-09 2022-06-03 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) 图像压缩方法、计算机设备及计算机存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
田波;谭文斌;王军;: "基于人工神经网络的分布式视频编码边信息生成方法" *

Also Published As

Publication number Publication date
CN115834890B (zh) 2023-04-28

Similar Documents

Publication Publication Date Title
Dai et al. Nonlinear transform source-channel coding for semantic communications
KR102618558B1 (ko) 조건부 오토인코더를 이용한 가변-레이트 압축을 위한 장치 및 방법
US11556799B2 (en) Channel modelling in a data transmission system
CN108960333B (zh) 基于深度学习的高光谱图像无损压缩方法
WO2020237646A1 (zh) 图像处理方法、设备及计算机可读存储介质
WO2020062074A1 (en) Reconstructing distorted images using convolutional neural network
US20120308128A1 (en) Image data coding apparatus, method of controlling operation of same, and program therefor
US20230106778A1 (en) Quantization for Neural Networks
CN113994348A (zh) 对于深度神经网络压缩的线性神经重建
CN114418121A (zh) 模型训练方法、对象处理方法及装置、电子设备、介质
US11699212B2 (en) Method of controlling encoding of display data
WO2023050720A1 (zh) 图像处理方法、图像处理装置、模型训练方法
Beitollahi et al. FLAC: Federated learning with autoencoder compression and convergence guarantee
CN115866253B (zh) 一种基于自调制的通道间变换方法、装置、终端及介质
CN115776571B (zh) 一种图像压缩方法、装置、设备及存储介质
CN115834890A (zh) 一种图像压缩方法、装置、设备及存储介质
US20030118244A1 (en) Data compression method and system
US11856203B1 (en) Neural face video compression using multiple views
CN115866252A (zh) 一种图像压缩方法、装置、设备及存储介质
CN115695810A (zh) 一种基于语义通信的低比特率图像压缩编码方法
TW202046726A (zh) 用於壓縮的方法及系統
US11670008B2 (en) Processing display data for transmission
Chen et al. Information Compression in the AI Era: Recent Advances and Future Challenges
CN115914630B (zh) 一种图像压缩方法、装置、设备及存储介质
CN114827289B (zh) 一种通信压缩方法、系统、电子装置和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant