CN113949867B

CN113949867B - 一种图像处理的方法及装置

Info

Publication number: CN113949867B
Application number: CN202010687478.1A
Authority: CN
Inventors: 肖云雷; 刘阳兴
Original assignee: Wuhan TCL Group Industrial Research Institute Co Ltd
Current assignee: Wuhan TCL Group Industrial Research Institute Co Ltd
Priority date: 2020-07-16
Filing date: 2020-07-16
Publication date: 2023-06-20
Anticipated expiration: 2040-07-16
Also published as: CN113949867A

Abstract

本申请适用于图像处理技术领域，提供了一种图像处理的方法，包括：将待压缩图像输入非线性编码网络进行处理，输出第一特征图，非线性编码网络包括N个可变形卷积，N为大于1的整数，N个可变形卷积保留待压缩图像的有效信息的效率大于等于第一预设效率；将第一特征图输入先验编码网络进行处理，输出第二特征图；将第二特征图输入第一熵编码模型进行处理，输出第一概率图，以及对第二特征图和第一概率图进行算术编码，得到熵编码后的第一文件。采用本申请实施例有助于在最大程度的保留图像有效信息的同时，提高图像压缩的效率。

Description

一种图像处理的方法及装置

技术领域

本申请属于图像处理技术领域，尤其涉及一种图像处理的方法及装置。

背景技术

图像处理包括图像压缩和图像解压缩，现有的图像压缩和解压缩的方法主要有采用更好的可移植图形算法(Better Portable Graphics算法，BPG算法)。近些年，随着深度学习的发展，采用深度学习构造变分自编码网络可以获取到接近或者超过BPG文件的压缩效果。

但是，现有的基于深度学习的图像压缩和解压缩方法中，神经网络模型的学习能力不够强，图像压缩和图像解压缩的效率有待进一步提高。

发明内容

本申请实施例提供了一种图像处理的方法及装置，用于在最大程度的保留图像有效消息的同时，提高图像压缩的效率。

第一方面，本申请实施例提供了一种图像处理的方法，包括：

将待压缩图像输入非线性编码网络进行处理，输出第一特征图，非线性编码网络包括N个可变形卷积，N为大于1的整数，N个可变形卷积保留待压缩图像的有效信息的效率大于等于第一预设效率；

将第一特征图输入先验编码网络进行处理，输出第二特征图；

将第二特征图输入第一熵编码模型进行处理，输出第一概率图，以及对第二特征图和第一概率图进行算术编码，得到熵编码后的第一文件。

第二方面，本申请实施例提供了一种图像处理的装置，包括：

第一处理单元，用于将待压缩图像输入非线性编码网络进行处理，输出第一特征图，非线性编码网络包括N个可变形卷积，N为大于1的整数，N个可变形卷积保留待压缩图像的有效信息的效率大于等于第一预设效率；

第二处理单元，用于将第一特征图输入先验编码网络进行处理，输出第二特征图；

第三处理单元，用于将第二特征图输入第一熵编码模型进行处理，输出第一概率图，以及对第二特征图和第一概率图进行算术编码，得到熵编码后的第一文件。

第三方面，本申请实施例提供了一种图像处理的设备，包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序，处理器执行计算机程序时实现如上述第一方面的图像处理的方法。

第四方面，本申请实施例提供了一种计算机可读存储介质，计算机可读存储介质存储有计算机程序，计算机程序被处理器执行时实现如上述第一方面的图像处理的方法。

本申请实施例中，将待压缩图像输入非线性编码网络进行处理，输出第一特征图；将第一特征图输入先验编码网络进行处理，输出第二特征图；将第二特征图输入第一熵编码模型进行处理，输出第一概率图，以及对第二特征图和第一概率图进行算术编码，得到熵编码后的第一文件。由于可变形卷积能够最大程度的保留待压缩图像的有效信息，因此有助于在最大程度的保留图像有效信息的同时，提高图像压缩的效率。

附图说明

为了更清楚地说明本申请实施例或背景技术中的技术方案，下面将对本申请实施例或背景技术中所需使用的附图进行说明。

图1是本申请第一实施例提供的一种图像处理的方法的示意流程图；

图2是本申请第一实施例提供的一种图像处理的方法中非线性编码网络的示意图；

图3是本申请第一实施例提供的一种图像处理的方法中S104细化的示意流程图；

图4是本申请第一实施例提供的一种图像处理的方法中先验解码网络的示意图；

图5是本申请第一实施例提供的一种图像处理的方法中S1046细化的示意流程图；

图6是本申请第一实施例提供的一种图像处理的方法中混合逻辑斯谛分布模块的示意图；

图7是本申请第二实施例提供的另一种图像处理的方法的示意流程图；

图8是本申请第三实施例提供的另一种图像处理的方法的示意流程图；

图9是本申请第四实施例提供的图像处理的装置的示意图；

图10是本申请第五实施例提供的图像处理的设备的示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象，而不是用于描述特定顺序。此外，术语“包括”和“具有”以及它们任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元，而是可选地还包括没有列出的步骤或单元，或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。

在本申请中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本申请所描述的实施例可以与其它实施例相结合。

请参见图1，图1是本申请第一实施例提供的一种图像处理的方法的示意流程图。本实施例中一种图像处理的方法的执行主体为具有图像处理功能的设备，例如，台式电脑、服务器等等。如图1所示的图像处理的方法可包括：

S101：将待压缩图像输入非线性编码网络进行处理，输出第一特征图，非线性编码网络包括N个可变形卷积，N为大于1的整数，N个可变形卷积保留待压缩图像的有效信息的效率大于等于第一预设效率。

图像压缩是指损失一部分的图像主观或者客观质量，或者就是完全无损的前提下，通过编码像素信号的方法，用尽量少的空间存储图像，并且可以尽可能恢复该图像的质量。图像压缩的本质目的就是减少表示图片信息的矩阵中的冗余量，去除其中多余的数据，也就是把像素矩阵转变成在统计学层面上无相关关系的新的数据分布。

当用户需要压缩图像时，可以通过设备的交互界面触发图像压缩指令。设备在检测到图像压缩指令时，可以获取图像压缩指令中包含的待压缩的原始图像；或者设备根据图像压缩指令中包含的文件标识获取该文件标识对应的待压缩的原始图像。或者设备还可以接收其他设备发送的待压缩的原始图像，此处不做限制。

设备获取待压缩图像，将待压缩图像输入非线性编码网络进行处理，输出第一特征图。编码的过程就是卷积的过程，非线性编码网络包括N个可变形卷积，N为大于1的整数，N个可变形卷积用于最大程度的保留待压缩图像的有效信息。

其中，非线性编码网络用于从待压缩图像中提取第一特征图，本实施例中，非线性编码网络中可以采用两个可变形卷积和两个3x3的卷积共同来替换现有非线性编码网络中的两个5x5的卷积。如图2所示，图2为非线性编码网络的示意图，其中，非线性编码网络中的DeformableConv即为可变形卷积。GDN为广义分裂标准化，Generalized DivisiveNormalization，是一种激活函数。Conv代表卷积核，Conv192×3×5表示卷积核的大小为192×3×5。采用两个可变形卷积和两个3x3的卷积可以增强卷积的变换建模能力，保留更有用的信息，利于后面获取压缩图像。

第一预设效率可以是预先设置的，如果N个可变形卷积保留待压缩图像的有效信息的效率大于等于第一预设效率，那么N个可变形卷积能够最大程度的保留待压缩图像的有效信息。

S102：将第一特征图输入先验编码网络进行处理，输出第二特征图。

实际图像压缩过程需要存储中间特征，为了能够减少存储的内存，会对第一特征图进行量化，存储量化后的特征，会将浮点型(连续型)的数据矩阵转化成整数(离散型)，实现信号的多对一映射。所以设备对第一特征图进行量化处理，得到量化后的第一特征图。量化的过程可以基于随机噪声图对第一特征图进行量化处理，得到量化后的第一特征图。然后设备将量化后的第一特征图输入先验编码网络进行处理，得到第二特征图。其中，先验编码网络用于提取第二特征图。

S103：将第二特征图输入第一熵编码模型进行处理，输出第一概率图，以及对第二特征图和第一概率图进行算术编码，得到熵编码后的第一文件。

设备对第二特征图进行熵编码，设备预存第一熵编码模型，设备将第二特征图输入第一熵编码模型进行处理，输出第一概率图。熵(Entropy)编码是一个无损的过程，常见的熵编码有：香农(Shannon)编码、哈夫曼(Huffman)编码和算术编码(arithmeticcoding)。信息熵表示着信息中所包含的信息量大小，即熵的值越大那么信源所具有的信息量就越大，其中的不确定成分就越高。通常，一个信源表示的信息量是不确定的，可以用其出现的概率值大小来表示这一不确定性。出现的概率越大说明事件发生的可能性就越高，那么其中的不确定成分就越小，进而熵的值也会越小。

设备对第二特征图和第一概率图进行算术编码，得到熵编码后的第一文件。熵编码后的第一文件可以是二进制文件。算术编码是图像压缩的主要算法之一。是一种无损数据压缩方法，也是一种熵编码的方法。和其它熵编码方法不同的地方在于，其他的熵编码方法通常是把输入的消息分割为符号，然后对每个符号进行编码，而算术编码是直接把整个输入的消息编码为一个数n，n满足(0.0≤n<1.0)的条件。

在一些可能的实施例中，方法还包括：

S104：将第二特征图输入先验解码网络进行处理，输出M组均值、M组方差和权重参数，M为大于1的整数，先验解码网络包括混合逻辑斯谛分布模块，混合逻辑斯谛分布模块增加预测特征图包括的各个字符的概率的准确性的效率大于等于第二预设效率。

设备将第二特征图输入先验解码网络，输出M组均值、M组方差和权重参数，M为大于1的整数，先验解码网络包括混合逻辑斯谛分布模块，混合逻辑斯谛分布模块用于最大程度的增加预测特征图包括的各个字符的概率的准确性。逻辑斯谛分布即增长分布，增长分布的分布函数是“增长函数”，称“逻辑斯谛函数”(logistic function)，故增长分布也称为“逻辑斯谛分布”。逻辑斯谛分布(logistic distribution)是一种连续型的概率分布，记为L(μ,γ)，当时μ＝0，γ＝1，称为标准的逻辑斯谛分布。其中，逻辑斯谛分布拟合模块就是两组均值和方差以及权重参数，通过逻辑斯谛分布拟合模块得到的压缩参数更加的准确，有利于得到效果更好的压缩图像。

第二预设效率可以是预先设置的，如果混合逻辑斯谛分布模块增加预测特征图包括的各个字符的概率的准确性的效率大于等于第二预设效率，那么混合逻辑斯谛分布模块能够最大程度的增加预测特征图包括的各个字符的概率的准确性。

在一些可能的实施例中，先验解码网络还包括第一卷积核、第一激活函数、第二卷积核、第二激活函数和第三卷积核，如图3所示，S104可以包括S1041～S1046：

S1041：对第二特征图和第一卷积核进行卷积，得到第一卷积结果。

在本实施例中，先验解码网络还包括第一卷积核、第一激活函数、第二卷积核、第二激活函数和第三卷积核。激活函数，是在人工神经网络的神经元上运行的函数，负责将神经元的输入映射到输出端，激活函数是为了增加神经网络模型的非线性。卷积核就是图像处理时，给定输入图像，输入图像中一个小区域中像素加权平均后成为输出图像中的每个对应像素，其中权值由一个函数定义，这个函数称为卷积核。

设备对第二特征图和第一卷积核进行卷积，得到第一卷积结果。

S1042：根据第一卷积结果和第一激活函数获得第一输出结果。

设备根据第一卷积结果和第一激活函数获得第一输出结果。

S1043：对第一输出结果和第二卷积核进行卷积，得到第二卷积结果。

设备对第一输出结果和第二卷积核进行卷积，得到第二卷积结果。卷积操作过程简单的说，就是将卷积核与数据对应相乘，然后求和。

S1044：根据第二卷积结果和第二激活函数获得第二输出结果。

设备根据第二卷积结果和第二激活函数获得第二输出结果。

S1045：对第二输出结果和第三卷积核进行卷积，得到第三卷积结果。

设备对第二输出结果和第三卷积核进行卷积，得到第三卷积结果。

S1046：将第三卷积结果输入混合逻辑斯谛分布模块进行处理，输出M组均值、M组方差和权重参数。

设备将第三卷积结果输入混合逻辑斯谛分布模块进行处理，输出M组均值、M组方差和权重参数。

举例来说，如图4所示，第一卷积核的大小为192×5×5/2，对第二特征图和第一卷积核进行卷积，得到第一卷积结果，根据第一卷积结果和第一激活函数获得第一输出结果。第二卷积核的大小为288×5×5/2，对第一输出结果和第二卷积核进行卷积，得到第二卷积结果。根据第二卷积结果和第二激活函数获得第二输出结果。第三卷积核的大小为384×3×3，对第二输出结果和第三卷积核进行卷积，得到第三卷积结果。将第三卷积结果输入混合逻辑斯谛分布模块进行处理，输出M组均值、M组方差和权重参数。

在一些可能的实施例中，混合逻辑斯谛分布模块包括第四卷积核、第三激活函数、第五卷积核、第四激活函数、第六卷积核、第五激活函数和第七卷积核，如图5所示，S1046可以包括S10461～S10468：

S10461：对第三卷积结果和第四卷积核进行卷积，得到第四卷积结果。

在本实施例中，混合逻辑斯谛分布模块包括第四卷积核、第三激活函数、第五卷积核、第四激活函数、第六卷积核、第五激活函数和第七卷积核。设备对第三卷积结果和第四卷积核进行卷积，得到第四卷积结果。

S10462：根据第四卷积结果和第三激活函数获得第三输出结果。

设备根据第四卷积结果和第三激活函数获得第三输出结果。

S10463：对第三输出结果和第五卷积核进行卷积，得到第五卷积结果。

设备对第三输出结果和第五卷积核进行卷积，得到第五卷积结果。

S10464：根据第五卷积结果和第四激活函数获得第四输出结果。

设备根据第五卷积结果和第四激活函数获得第四输出结果。

S10465：对第四输出结果和第六卷积核进行卷积，得到第六卷积结果。

设备对第四输出结果和第六卷积核进行卷积，得到第六卷积结果

S10466：根据第六卷积结果和第五激活函数获得第五输出结果。

设备根据第六卷积结果和第五激活函数获得第五输出结果。

S10467：对第五输出结果和第七卷积核进行卷积，得到第七卷积结果。

设备对第五输出结果和第七卷积核进行卷积，得到第七卷积结果。

S10468：对第七卷积结果进行切片和激活，得到M组均值、M组方差和权重参数。

设备对第七卷积结果进行切片和激活，得到M组均值、M组方差和权重参数。

举例来说，如图6所示，图6为混合逻辑斯谛分布模块的示意图，混合逻辑斯谛分布模块包括第四卷积核、第三激活函数、第五卷积核、第四激活函数、第六卷积核、第五激活函数和第七卷积核。第四卷积核的大小为567×1×1，将第三卷积结果输入混合逻辑斯谛分布模块，先对第三卷积结果和第四卷积核进行卷积，得到第四卷积结果，根据第四卷积结果和第三激活函数获得第三输出结果。第五卷积核的大小为768×1×1，对第三输出结果和第五卷积核进行卷积，得到第五卷积结果。根据第五卷积结果和第四激活函数获得第四输出结果。第六卷积核的大小为1152×1×1，对第四输出结果和第六卷积核进行卷积，得到第六卷积结果。根据第六卷积结果和第五激活函数获得第五输出结果。第七卷积核的大小为1536×1×1，对第五输出结果和第七卷积核进行卷积，得到第七卷积结果。对第七卷积结果进行切片和激活，得到M组均值、M组方差和权重参数，其中，slice表示切片，softplus是激活函数。如图6中所示，Var1、Var2为得到的两组方差，Mean1、Mean2为得到的两组均值，w1、w2，w3和w4为权重参数。

S105：将第一特征图、M组均值、M组方差和权重参数输入第二熵编码模型进行处理，输出第二概率图，以及对第一特征图和第二概率图进行算术编码，得到熵编码后的第二文件。

设备将第一特征图、M组均值、M组方差和权重参数输入第二熵编码模型进行处理，输出第二概率图。具体第二熵编码网络中的熵编码公式可以为：

其中，p_y|z(y|z)是满足

的实际概率分布，即第二概率图。z表示待压缩图像，y表示第一特征图，w_i为权重参数，u_i为均值，/>

为方差。

设备对第一特征图和第二概率图进行算术编码，得到熵编码后的第二文件。熵编码后的第二文件可以是二进制文件。

本申请实施例中，将第二特征图输入先验解码网络进行处理，输出M组均值、M组方差和权重参数，将第一特征图、M组均值、M组方差和权重参数输入第二熵编码模型进行处理，输出第二概率图，以及对第一特征图和第二概率图进行算术编码，得到熵编码后的第二文件。由于混合逻辑斯谛分布模块能够最大程度的增加预测特征图包括的各个字符的概率的准确性，因此有助于在最大程度的保留图像有效信息的同时，提高图像压缩的效率。

请参见图7，图7是本申请第二实施例提供的另一种图像处理的方法的示意流程图。本实施例中另一种图像处理的方法的执行主体为具有图像处理功能的设备，例如，台式电脑、服务器等等。在本实施例中，S201～S205与第一实施例中的S101～S105相同，如图7所示，S206～S210具体如下：

S206：对第一概率图和熵编码后的第一文件进行算术解码，得到第二特征图。

设备对第一概率图和熵编码后的第一文件进行算术解码，得到第二特征图。算术编码进行解码时仅输入一个小数。解码前首先需要对区间[0,1)按照初始时的符号频度进行分割。然后观察输入的小数位于那个子区间。输出对应的符号，选择对应的子区间，然后从选择的子区间中继续进行下一轮的分割。不断的进行这个过程，直到所有的符号都解码出来。整个过程相当于算数编码时的逆运算。

S207：将第二特征图输入先验解码网络进行处理，输出M组均值、M组方差和权重参数。

设备将第二特征图输入先验解码网络进行处理，输出M组均值、M组方差和权重参数。

S208：将M组均值、M组方差和权重参数输入第二熵编码模型进行处理，输出第二概率图。

设备将M组均值、M组方差和权重参数输入第二熵编码模型进行处理，输出第二概率图。

S209：对第二概率图和熵编码后的第二文件进行算术解码，得到第一特征图。

设备对第二概率图和熵编码后的第二文件进行算术解码，得到第一特征图。

S210：将第一特征图输入非线性解码网络进行处理，输出解压缩图像。

设备中预先设置非线性解码网络，非线性解码网络用于对第一特征图进行解码还原，得到重构图像，即解压缩图像。在解码时候，通过将经过下采样的特征做相对的反卷积操作，可以得到解压缩图像。在本实施例中，通过非线性解码网络得到解压缩图像，由于可变形卷积用于最大程度的保留待压缩图像的有效信息，因此有助于在最大程度的保留图像有效信息的同时，提高图像解压缩的效率。

请参见图8，图8是本申请第三实施例提供的另一种图像处理的方法的示意流程图。本实施例中另一种图像处理的方法的执行主体为具有图像处理功能的设备，例如，台式电脑、服务器等等。在本实施例中，S301～S305与第一实施例中的S101～S105相同，如图8所示，S306～S309具体如下：

S306：在获得第一概率图的过程中，获得第一损失值。

设备对第二特征图进行熵编码，设备预存第一熵编码模型，设备将第二特征图输入第一熵编码模型进行处理，输出第一概率图。在获得第一概率图的过程中，获得第一损失值。

S307：在获得第二概率图的过程中，获得第二损失值。

设备将第一特征图、M组均值、M组方差和权重参数输入第二熵编码模型进行处理，输出第二概率图。在获得第二概率图的过程中，获得第二损失值。

S308：根据待压缩图像、解压缩图像和预存的损失函数获得第三损失值。

设备根据待压缩图像、解压缩图像计算损失值，由于对图像进行压缩，得到的压缩图像与原图像越接近，则效果越好，所以基于样本图像和其对应的压缩图像之间的差异和预存的损失函数可以确定第三损失值。在本实施例中，可以采用均方误差(Mean SquareError，MSE)函数做预存的损失函数。

S309：根据第一损失值、第二损失值、第三损失值和预存的损失值公式获得目标损失值，目标损失值用于优化非线性编码网络、先验编码网络、第一熵编码模型、先验解码网络、第二熵编码模型和非线性解码网络。

设备根据第一损失值loss_z_entropy、第二损失值loss_y_entropy、第三损失值loss_mse和预存的损失值公式获得目标损失值。损失值公式如下：

loss＝λ*loss_mse+loss_y_entropy+loss_z_entropy

其中，λ是预设权衡压缩比和图像质量的参数，λ越大，压缩比越小，但恢复出来的图像质量越好。

目标损失值用于优化非线性编码网络、先验编码网络、第一熵编码模型、先验解码网络、第二熵编码模型和非线性解码网络。

在本实施例中，根据第一损失值、第二损失值、第三损失值和预存的损失值公式获得目标损失值，得到的目标损失值更准确，并且目标损失值可以用于优化非线性编码网络、先验编码网络、第一熵编码模型、先验解码网络、第二熵编码模型和非线性解码网络，可以提升优化非线性编码网络、先验编码网络、第一熵编码模型、先验解码网络、第二熵编码模型和非线性解码网络的效率，得到更优化的非线性编码网络、先验编码网络、第一熵编码模型、先验解码网络、第二熵编码模型和非线性解码网络，有助于提高图像压缩的效率和图像解压缩的效率。

应理解，上述实施例中各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。

请参见图9，图9是本申请第四实施例提供的图像处理的装置的示意图。包括的各单元用于执行图1、图3、图5、图7～图8对应的实施例中的各步骤，具体请参阅图1、图3、图5、图7～图8各自对应的实施例中的相关描述。为了便于说明，仅示出了与本实施例相关的部分。参见图9，图像处理的装置9包括：

第一处理单元910，用于将待压缩图像输入非线性编码网络进行处理，输出第一特征图，非线性编码网络包括N个可变形卷积，N为大于1的整数，N个可变形卷积保留待压缩图像的有效信息的效率大于等于第一预设效率；

第二处理单元920，用于将第一特征图输入先验编码网络进行处理，输出第二特征图；

第三处理单元930，用于将第二特征图输入第一熵编码模型进行处理，输出第一概率图，以及对第二特征图和第一概率图进行算术编码，得到熵编码后的第一文件。

在一些可能的实施例中，图像处理的装置9还包括：

第四处理单元，用于将第二特征图输入先验解码网络进行处理，输出M组均值、M组方差和权重参数，M为大于1的整数，先验解码网络包括混合逻辑斯谛分布模块，混合逻辑斯谛分布模块增加预测特征图包括的各个字符的概率的准确性的效率大于等于第二预设效率；

第五处理单元，用于将第一特征图、M组均值、M组方差和权重参数输入第二熵编码模型进行处理，输出第二概率图，以及对第一特征图和第二概率图进行算术编码，得到熵编码后的第二文件。

在一些可能的实施例中，图像处理的装置9还包括：

第六处理单元，用于对第一概率图和熵编码后的第一文件进行算术解码，得到第二特征图；

第七处理单元，用于将第二特征图输入先验解码网络进行处理，输出M组均值、M组方差和权重参数；

第八处理单元，用于将M组均值、M组方差和权重参数输入第二熵编码模型进行处理，输出第二概率图；

第九处理单元，用于对第二概率图和熵编码后的第二文件进行算术解码，得到第一特征图；

第十处理单元，用于将第一特征图输入非线性解码网络进行处理，输出解压缩图像。

在一些可能的实施例中，先验解码网络还包括第一卷积核、第一激活函数、第二卷积核、第二激活函数和第三卷积核，在将第二特征图输入先验解码网络进行处理，输出M组均值、M组方差和权重参数方面，第四处理单元940具体用于：

对第二特征图和第一卷积核进行卷积，得到第一卷积结果；

根据第一卷积结果和第一激活函数获得第一输出结果；

对第一输出结果和第二卷积核进行卷积，得到第二卷积结果；

根据第二卷积结果和第二激活函数获得第二输出结果；

对第二输出结果和第三卷积核进行卷积，得到第三卷积结果；

将第三卷积结果输入混合逻辑斯谛分布模块进行处理，输出M组均值、M组方差和权重参数。

在一些可能的实施例中，混合逻辑斯谛分布模块包括第四卷积核、第三激活函数、第五卷积核、第四激活函数、第六卷积核、第五激活函数和第七卷积核，在将第三卷积结果输入混合逻辑斯谛分布模块进行处理，输出M组均值、M组方差和权重参数方面，第四处理单元具体用于：

对第三卷积结果和第四卷积核进行卷积，得到第四卷积结果；

根据第四卷积结果和第三激活函数获得第三输出结果；

对第三输出结果和第五卷积核进行卷积，得到第五卷积结果；

根据第五卷积结果和第四激活函数获得第四输出结果；

对第四输出结果和第六卷积核进行卷积，得到第六卷积结果；

根据第六卷积结果和第五激活函数获得第五输出结果；

对第五输出结果和第七卷积核进行卷积，得到第七卷积结果；

对第七卷积结果进行切片和激活，得到M组均值、M组方差和权重参数。

在一些可能的实施例中，图像处理的装置9还包括：

第十一处理单元，用于在获得第一概率图的过程中，获得第一损失值；

第十二处理单元，用于在获得第二概率图的过程中，获得第二损失值；

第十三处理单元，用于根据待压缩图像、解压缩图像和预存的损失函数获得第三损失值；

第十四处理单元，用于根据第一损失值、第二损失值、第三损失值和预存的损失值公式获得目标损失值，目标损失值用于优化非线性编码网络、先验编码网络、第一熵编码模型、先验解码网络、第二熵编码模型和非线性解码网络。

图10是本申请第五实施例提供的图像处理的设备的示意图。如图10所示，该实施例的图像处理的设备10包括：处理器100、存储器101以及存储在存储器101中并可在处理器100上运行的计算机程序102，例如图像处理的程序。处理器100执行计算机程序102时实现上述各个图像处理的方法实施例中的步骤，例如图1所示的步骤101至103。或者，处理器100执行计算机程序102时实现上述各装置实施例中各模块/单元的功能，例如图9所示模块910至930的功能。

示例性的，计算机程序102可以被分割成一个或多个模块/单元，一个或者多个模块/单元被存储在存储器101中，并由处理器100执行，以完成本申请。一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段，该指令段用于描述计算机程序102在图像处理的设备10中的执行过程。例如，计算机程序102可以被分割成第一处理单元、第二处理单元、第三处理单元、第四处理单元、第五处理单元，各单元具体功能如下：

图像处理的设备10可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。图像处理的设备可包括，但不仅限于，处理器100、存储器101。本领域技术人员可以理解，图10仅仅是图像处理的设备10的示例，并不构成对图像处理的设备10的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件，例如图像处理的设备还可以包括输入输出设备、网络接入设备、总线等。

所称处理器100可以是中央处理单元(Central Processing Unit，CPU)，还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

存储器101可以是图像处理的设备10的内部存储单元，例如图像处理的设备10的硬盘或内存。存储器101也可以是图像处理的设备10的外部存储设备，例如图像处理的设备10上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(SecureDigital,SD)卡，闪存卡(Flash Card)等。进一步地，存储器101还可以既包括图像处理的设备10的内部存储单元也包括外部存储设备。存储器101用于存储计算机程序以及图像处理的设备所需的其他程序和数据。存储器101还可以用于暂时地存储已经输出或者将要输出的数据。

需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本申请并不受所描述的动作顺序的限制，因为依据本申请，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本申请所必须的。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置，可通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如上述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性或其它的形式。

上述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

上述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储器中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储器中，包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例上述方法的全部或部分步骤。而前述的存储器包括：U盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储器中，存储器可以包括：闪存盘、只读存储器(英文：Read-Only Memory，简称：ROM)、随机存取器(英文：Random Access Memory，简称：RAM)、磁盘或光盘等。

以上对本申请实施例进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的一般技术人员，依据本申请的思想，在具体实现方式及应用范围上均会有改变之处，综上上述，本说明书内容不应理解为对本申请的限制。

Claims

1.一种图像处理的方法，其特征在于，包括：

将待压缩图像输入非线性编码网络进行处理，输出第一特征图，所述非线性编码网络包括N个可变形卷积，所述N为大于1的整数，所述N个可变形卷积保留所述待压缩图像的有效信息的效率大于等于第一预设效率；

将所述第一特征图输入先验编码网络进行处理，输出第二特征图；

将所述第二特征图输入第一熵编码模型进行处理，输出第一概率图，以及对所述第二特征图和所述第一概率图进行算术编码，得到熵编码后的第一文件。

2.如权利要求1所述的方法，其特征在于，所述方法还包括：

将所述第二特征图输入先验解码网络进行处理，输出M组均值、M组方差和权重参数，所述M为大于1的整数，所述先验解码网络包括混合逻辑斯谛分布模块，所述混合逻辑斯谛分布模块增加预测特征图包括的各个字符的概率的准确性的效率大于等于第二预设效率；

将所述第一特征图、所述M组均值、所述M组方差和所述权重参数输入第二熵编码模型进行处理，输出第二概率图，以及对所述第一特征图和所述第二概率图进行算术编码，得到熵编码后的第二文件。

3.如权利要求2所述的方法，其特征在于，所述方法还包括：

对所述第一概率图和所述熵编码后的第一文件进行算术解码，得到所述第二特征图；

将所述第二特征图输入所述先验解码网络进行处理，输出所述M组均值、所述M组方差和所述权重参数；

将所述M组均值、所述M组方差和所述权重参数输入所述第二熵编码模型进行处理，输出所述第二概率图；

对所述第二概率图和所述熵编码后的第二文件进行算术解码，得到所述第一特征图；

将所述第一特征图输入非线性解码网络进行处理，输出解压缩图像。

4.如权利要求2或3所述的方法，其特征在于，所述先验解码网络还包括第一卷积核、第一激活函数、第二卷积核、第二激活函数和第三卷积核，所述将所述第二特征图输入先验解码网络进行处理，输出M组均值、M组方差和权重参数，包括：

对所述第二特征图和所述第一卷积核进行卷积，得到第一卷积结果；

根据所述第一卷积结果和所述第一激活函数获得第一输出结果；

对所述第一输出结果和所述第二卷积核进行卷积，得到第二卷积结果；

根据所述第二卷积结果和所述第二激活函数获得第二输出结果；

对所述第二输出结果和所述第三卷积核进行卷积，得到第三卷积结果；

将所述第三卷积结果输入所述混合逻辑斯谛分布模块进行处理，输出M组均值、M组方差和权重参数。

5.如权利要求4所述的方法，其特征在于，所述混合逻辑斯谛分布模块包括第四卷积核、第三激活函数、第五卷积核、第四激活函数、第六卷积核、第五激活函数和第七卷积核，所述将所述第三卷积结果输入所述混合逻辑斯谛分布模块进行处理，输出M组均值、M组方差和权重参数，包括：

对所述第三卷积结果和所述第四卷积核进行卷积，得到第四卷积结果；

根据所述第四卷积结果和所述第三激活函数获得第三输出结果；

对所述第三输出结果和所述第五卷积核进行卷积，得到第五卷积结果；

根据所述第五卷积结果和所述第四激活函数获得第四输出结果；

对所述第四输出结果和所述第六卷积核进行卷积，得到第六卷积结果；

根据所述第六卷积结果和所述第五激活函数获得第五输出结果；

对所述第五输出结果和所述第七卷积核进行卷积，得到第七卷积结果；

对所述第七卷积结果进行切片和激活，得到M组均值、M组方差和权重参数。

6.如权利要求3所述的方法，其特征在于，所述方法还包括：

在获得所述第一概率图的过程中，获得第一损失值；

在获得所述第二概率图的过程中，获得第二损失值；

根据所述待压缩图像、所述解压缩图像和预存的损失函数获得第三损失值；

根据所述第一损失值、所述第二损失值、所述第三损失值和预存的损失值公式获得目标损失值，所述目标损失值用于优化所述非线性编码网络、所述先验编码网络、所述第一熵编码模型、所述先验解码网络、所述第二熵编码模型和所述非线性解码网络。

7.一种图像处理的装置，其特征在于，包括：

第一处理单元，用于将待压缩图像输入非线性编码网络进行处理，输出第一特征图，所述非线性编码网络包括N个可变形卷积，所述N为大于1的整数，所述N个可变形卷积保留所述待压缩图像的有效信息的效率大于等于第一预设效率；

第二处理单元，用于将所述第一特征图输入先验编码网络进行处理，输出第二特征图；

第三处理单元，用于将所述第二特征图输入第一熵编码模型进行处理，输出第一概率图，以及对所述第二特征图和所述第一概率图进行算术编码，得到熵编码后的第一文件。

8.如权利要求7所述的装置，其特征在于，所述装置还包括：

第四处理单元，用于将所述第二特征图输入先验解码网络进行处理，输出M组均值、M组方差和权重参数，所述M为大于1的整数，所述先验解码网络包括混合逻辑斯谛分布模块，所述混合逻辑斯谛分布模块用于最大程度的增加预测特征图包括的各个字符的概率的准确性；

第五处理单元，用于将所述第一特征图、所述M组均值、所述M组方差和所述权重参数输入第二熵编码模型进行处理，输出第二概率图，以及对所述第一特征图和所述第二概率图进行算术编码，得到熵编码后的第二文件。

9.如权利要求8所述的装置，其特征在于，所述装置还包括：

第六处理单元，用于对所述第一概率图和所述熵编码后的第一文件进行算术解码，得到所述第二特征图；

第七处理单元，用于将所述第二特征图输入所述先验解码网络进行处理，输出所述M组均值、所述M组方差和所述权重参数；

第八处理单元，用于将所述M组均值、所述M组方差和所述权重参数输入所述第二熵编码模型进行处理，输出所述第二概率图；

第九处理单元，用于对所述第二概率图和所述熵编码后的第二文件进行算术解码，得到所述第一特征图；

第十处理单元，用于将所述第一特征图输入非线性解码网络进行处理，输出解压缩图像。

10.一种图像处理的设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1-6任一项所述方法的步骤。

11.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1-6任一项所述方法的步骤。