CN106254879B

CN106254879B - 一种应用自编码神经网络的有损图像压缩方法

Info

Publication number: CN106254879B
Application number: CN201610798881.5A
Authority: CN
Inventors: 王平; 李青海; 简宋全; 窦钰景
Original assignee: Guangdong Fine Point Data Polytron Technologies Inc
Current assignee: Guangdong Fine Point Data Polytron Technologies Inc
Priority date: 2016-08-31
Filing date: 2016-08-31
Publication date: 2019-11-08
Anticipated expiration: 2036-08-31
Also published as: CN106254879A

Abstract

本发明提供一种应用自编码神经网络的有损图像压缩方法，该方法包括：步骤S1：对有损图像进行预处理得到采样图像；步骤S2：建立自编码神经网络模型；步骤S3：根据所述自编码神经网络模型计算隐藏层图像；步骤S4：将所述隐藏层图像作为新的采样图像进行后续压缩处理，得到最终的压缩图像。与现有技术相比，本发明提供的一种应用自编码神经网络的有损图像压缩方法由于在构造映射器的过程中使用了自编码神经网络使得图像再一次进行了冗杂信息的处理，即所谓的图像降维处理；同时该网络有着类似提取特征的作用，意味着在解压还原图像的过程中可以利用隐藏层特征的作用达到一定的去噪效果，提升了压缩率的同时还有着提升图像质量的效果。

Description

一种应用自编码神经网络的有损图像压缩方法

技术领域

本发明涉及图像处理技术领域，具体涉及一种应用自编码神经网络的有损图像压缩方法。

背景技术

随着大数据时代的到来，数据以爆炸性的速度增长着，巨量的数据携带着信息在人们之间传递着，而图像作为人类感知世界的视觉基础，是人类获取信息、表达信息和传递信息的重要手段。因此，如何保证图像准确快速地传递成为数字图像处理重要的问题之一，最直接的方法就是对图像进行压缩，即减少表示数字图像时需要的数据量，这样传递图像时既可以提高速率同时也可以保证图像信息的完整性与准确性。图像压缩正是图像处理的重要的一项关键技术，划分为有损图像压缩以及无损图像压缩。后者由于其解压后图像的完整性而被医疗行业等需要高精度图像的机构组织广泛使用，而有损图像压缩技术拥有保证重要信息量的完整情况下丢失一部分不必要的信息这一特性，从而因其更高的压缩率在一般的个人及其他机构更受欢迎。但是，传统的有损图像压缩技术的压缩率较低。

鉴于上述缺陷，本发明创作者经过长时间的研究和实践终于获得了本发明。

发明内容

为解决上述技术缺陷，本发明采用的技术方案在于，提供一种应用自编码神经网络的有损图像压缩方法，该方法包括以下步骤：

步骤S1：对有损图像进行预处理得到采样图像；

步骤S2：建立自编码神经网络模型；

步骤S3：根据所述自编码神经网络模型计算隐藏层图像；

步骤S4：将所述隐藏层图像作为新的采样图像进行后续压缩处理，得到最终的压缩图像。

较佳的，所述步骤S1具体包括：对原始有损图像进行颜色模式转换，并根据需要确定图像采样方式对转换后的图像进行采样，得到对应图像的采样图像。

较佳的，所述颜色模式转换具体为把RGB颜色空间转化为YCrCb颜色空间。

较佳的，所述图像采样方式包括：YUV411和YUV422，其意义为Y、Cb、Cr三个分量的数据取样比例一般是4：1：1或者4：2：2。

较佳的，所述步骤S2具体包括如下步骤：

步骤S21：将采样图像的转换为像素矩阵再变成一维数组，设像素为N；

步骤S22：根据压缩率的需要设置隐藏层的神经元数目M，M＜N；

步骤S23：训练自编码神经网络，得到最终的对应的两个权重矩阵，并将这两个权重矩阵记录为第一权重矩阵和第二权重矩阵，所述第一权重矩阵为输入层到隐藏层的连接矩阵，所述第二权重矩阵为隐藏层到输出层的连接矩阵；

步骤S24：将所述第一权重矩阵放到映射器中，将所述第二权重矩阵放到逆映射器中。

较佳的，所述步骤S23具体包括以下步骤：

步骤S231：初始化自编码神经网络，给各权值分别赋一个区间[-1,1]内的随机数，设定误差值e；

步骤S232：将采用图像的一维数组输入自编码神经网络；

步骤S233：计算采样图像的实际像素输出；

步骤S234：计算实际像素输出与相应的理想像素输出的误差E；

步骤S235：判断误差E是否小于设定的误差值e，若是，则执行步骤S236，若否，则执行步骤S237；

步骤S236：输出对应的两个权重矩阵结果；

步骤S237：输出对应的两个权重矩阵结果，调整对应的两个权重矩阵，重新计算输出像素结果，直至误差收敛，输出最终的对应的两个权重矩阵结果；

步骤S238：将对应的这两个权重矩阵记录为第一权重矩阵和第二权重矩阵，第一权重矩阵为输入层到隐藏层的连接矩阵，第二权重矩阵为隐藏层到输出层的连接矩阵。

较佳的，所述步骤S3具体包括：根据所述第一权重矩阵对采样图像进行处理，得到相应的隐藏层向量，并将该隐藏层向量按照从左到右，从上到下的顺序转化为图像像素格式，并且未能填补的像素以0填补，即得到隐藏层图像。

较佳的，所述步骤S4具体包括：对新的采样图像进行分层、离散余弦变换、Zigzag扫描排序、量化、DC系数的差分脉冲调制编码、DC系数的中间格式计算、AC系数的游程长度编码、AC系数的中间格式计算和熵编码。

与现有技术相比，本发明提供的一种应用自编码神经网络的有损图像压缩方法具有以下好处：

(1)该方法结合了图像处理方法与机器学习方法，使得该有损图像压缩方法既有图像处理方法的直观性和易理解性，也有着机器学习方法的严谨性以及准确性。

(2)利用自编码神经网络，不仅可以利用隐藏层达到图像压缩的效果，还可以根据输入以及隐藏层之间的权重联结定义出图像的特征，其中的隐藏神经元可能代表着图像重要的特征，这样就使得该压缩下不仅没有去掉有用的信息，还会保存相对重要的图形特征，有利于在压缩图片的同时对图像处理其他技术产生有用的信息。

(3)由于在构造映射器的过程中使用了自编码神经网络使得图像再一次进行了冗杂信息的处理，即所谓的图像降维处理；同时该网络有着类似提取特征的作用，意味着在解压还原图像的过程中可以利用隐藏层特征的作用达到一定的去噪效果，提升了压缩率的同时还有着提升图像质量的效果，一举多得。

附图说明

为了更清楚地说明本发明各实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍。

图1为本发明的一种应用自编码神经网络的有损图像压缩方法流程图；

图2为建立自编码神经网络模型的流程图；

图3为自编码神经网络训练的流程图。

具体实施方式

以下结合附图，对本发明上述的和另外的技术特征和优点作更详细的说明。

如图1所示，为本发明的一种应用自编码神经网络的有损图像压缩方法流程图，该方法包括以下步骤:

步骤S1：对有损图像进行预处理得到采样图像。

具体的，所述预处理包括：对原始有损图像进行颜色模式转换，并根据需要确定图像采样方式对转换后的图像进行采样，得到对应图像的采样图像。颜色模式转换具体为把RGB颜色空间转化为YCrCb颜色空间。通常采用两种采样方式：YUV411和YUV422。对应地，其意义为Y、Cb、Cr三个分量的数据取样比例一般是4：1：1或者4：2：2。

步骤S2：建立自编码神经网络模型。

如图2所示，为建立自编码神经网络模型的流程图，具体包括如下步骤：

步骤S21：将采样图像的转换为像素矩阵再变成一维数组，设像素为N。

步骤S22：根据压缩率的需要设置隐藏层的神经元数目M，M＜N。

步骤S23：训练自编码神经网络，得到最终的对应的两个权重矩阵，并将这两个权重矩阵记录为第一权重矩阵和第二权重矩阵，第一权重矩阵为输入层到隐藏层的连接矩阵，第二权重矩阵为隐藏层到输出层的连接矩阵。

步骤S24：将第一权重矩阵放到映射器中，将第二权重矩阵放到逆映射器中。

如图3所示，为自编码神经网络训练的流程图，具体包括以下步骤：

步骤S231：初始化自编码神经网络，给各权值分别赋一个区间[-1,1]内的随机数，设定误差值e。

步骤S232：将采用图像的一维数组输入自编码神经网络。

步骤S233：计算采样图像的实际像素输出。

步骤S234：计算实际像素输出与相应的理想像素输出的误差E。

如第i个像素的误差为：E_i＝(O_i-Y_i)²/2，而自编码神经网络关于整幅图像的误差为：ΣE_i。

步骤S235：判断误差E是否小于设定的误差值e，若是，则执行步骤S236，若否，则执行步骤S237。

步骤S236：输出对应的两个权重矩阵结果。

步骤S237：输出对应的两个权重矩阵结果，调整对应的两个权重矩阵，重新计算输出像素结果，直至误差收敛，输出最终的对应的两个权重矩阵结果。

步骤S3：根据自编码神经网络模型计算隐藏层图像。

具体的，根据训练后确定的第一权重矩阵对采样图像进行处理，得到相应的隐藏层向量，并将该隐藏层向量按照从左到右，从上到下的顺序转化为图像像素格式，并且未能填补的像素以0填补，即得到隐藏层图像。

步骤S4：将隐藏层图像作为新的采样图像进行后续压缩处理，得到最终的压缩图像。

具体的，将隐藏层图像作为新的采样图像进行后续压缩处理包括：对新的采样图像进行分层、离散余弦变换(DCT)、Zigzag扫描排序、量化、DC系数的差分脉冲调制编码、DC系数的中间格式计算、AC系数的游程长度编码、AC系数的中间格式计算、熵编码。

由于只在构造映射器的过程中用到了自编码神经网络，那么，该方法下的解压技术也只是在逆映射器的构造中添加对应的第二权重矩阵来把隐藏层图像近似转化为原图像。类似压缩过程，把隐藏层图像转化为一维向量并截取前M项，对截取后的向量应用权重矩阵2得到对应的近似采样图像，最后根据该采样图像还原图像。

本发明提供的一种应用自编码神经网络的有损图像压缩方法具有以下好处：

以上所述仅为本发明的较佳实施例，对本发明而言仅仅是说明性的，而非限制性的。本专业技术人员理解，在本发明权利要求所限定的精神和范围内可对其进行许多改变，修改，甚至等效，但都将落入本发明的保护范围内。

Claims

1.一种应用自编码神经网络的有损图像压缩方法，其特征在于，该方法包括以下步骤：

步骤S1：对有损图像进行预处理得到采样图像；

步骤S2：建立自编码神经网络模型；

步骤S3：根据所述自编码神经网络模型计算隐藏层图像；

步骤S4：将所述隐藏层图像作为新的采样图像进行后续压缩处理，得到最终的压缩图像；

所述步骤S2具体包括如下步骤：

步骤S21：将采样图像的转换为像素矩阵再变成一维数组:，设像素为N；

步骤S23：训练自编码神经网络，得到最终的对应的两个权重矩阵，并将这两个权重矩阵记录为第一权重矩阵和第二权重矩阵，所述第一权重矩阵为输入层到隐藏层的连接矩阵，所述第二权重矩阵为隐藏层到输出层的连接矩阵，其中，所述第一权重矩阵和所述第二权重矩阵在所述自编码神经网络的训练过程中可动态调整使误差小于设定误差值以得到最终的权重矩阵；

2.根据权利要求1所述的有损图像压缩方法，其特征在于，所述步骤S1具体包括：对原始有损图像进行颜色模式转换，并根据需要确定图像采样方式对转换后的图像进行采样，得到对应图像的采样图像。

3.根据权利要求2所述的有损图像压缩方法，其特征在于，所述颜色模式转换具体为把RGB颜色空间转化为YCrCb颜色空间。

4.根据权利要求3所述的有损图像压缩方法，其特征在于，所述图像采样方式包括：YUV411和YUV422，其意义为Y、Cb、Cr三个分量的数据取样比例一般是4：1：1或者4：2：2。

5.根据权利要求1所述的有损图像压缩方法，其特征在于，所述步骤S23具体包括以下步骤：

步骤S232：将采用图像的一维数组输入自编码神经网络；

步骤S233：计算采样图像的实际像素输出；

步骤S236：输出对应的两个权重矩阵结果；

6.根据权利要求5所述的有损图像压缩方法，其特征在于，所述步骤S3具体包括：根据所述第一权重矩阵对采样图像进行处理，得到相应的隐藏层向量，并将该隐藏层向量按照从左到右，从上到下的顺序转化为图像像素格式，并且未能填补的像素以0填补，即得到隐藏层图像。

7.根据权利要求6所述的有损图像压缩方法，其特征在于，所述步骤S4具体包括：对新的采样图像进行分层、离散余弦变换、Zigzag扫描排序、量化、DC系数的差分脉冲调制编码、DC系数的中间格式计算、AC系数的游程长度编码、AC系数的中间格式计算和熵编码。