CN111062409A

CN111062409A - 一种无监督图像特征的提取及分类方法

Info

Publication number: CN111062409A
Application number: CN201911048391.3A
Authority: CN
Inventors: 杨敬民; 杨东海; 陈志翔; 邢舒惠; 郑锦磊; 姚泽楠
Original assignee: Minnan Normal University
Current assignee: Minnan Normal University
Priority date: 2019-10-30
Filing date: 2019-10-30
Publication date: 2020-04-24

Abstract

本发明公开了一种无监督图像特征的提取及分类方法，其包括以下步骤：A：建立具有三个隐藏层的串行栈式自编码器网络，将图像原始数据进行降维后输入所述自编码器网络；B：预训练网络得到权重矩阵W和偏置b；采用贪婪算法训练第一个隐藏层后更新权重矩阵W和偏置b，得到第一隐藏层特征矩阵，输入第一隐藏层特征矩阵，采用贪婪算法训练第二隐藏层后再次更新权重矩阵W和偏置b，得到第二隐藏层特征矩阵；C：根据分类精度加权融合第一隐藏层特征矩阵和第二隐藏层特征矩阵的特征得到混阶特征矩阵H；D：混阶特征矩阵H通过SVM分类器进行分类，得到分类结果；E：通过比对，得到分类精度A。本发明具有缓解高维图像的“维数灾难”问题和识别精度高的优点。

Description

一种无监督图像特征的提取及分类方法

技术领域

本发明涉及一种无监督图像特征的提取及分类方法。

背景技术

图像处理与分类识别是深度学习领域的一个重要方向。近年来，随着深度学习的发展，深度学习所取得了举世瞩目的成绩。然而，现实中很多图像都具有较高的像素，比如数码相机、手机或者高清监控拍摄的图像像素都很高，原始图像高达几千万维，直接将原始的几千万维的图像数据转成向量输入到网络，因涉及到向量的计算问题，随着向量维数的增加，计算量呈指数倍增长，这种处理方式会有“维数灾难”的问题。

目前，对深度学习样本的研究主要还是基于对深度学习模型的改进、样本特征的提取和卷积网络的改进。传统用的方法针对如何减少深度学习的数据训练样本成本并且保证深度学习效果的研究，要么是对训练样本进行特征标注提取，要么对学习过程进行方法改进。这些研究都带来了成本的增加，并且样本数量并不能够有非常显著的减少。在深度学习中，训练数据越多，训练效果越好，需要用来学习的训练样本量很大，但是有时无法提供成代变迁的数据图片用来学习，标记训练数据不足或高成本成为制约深度学习的一大瓶颈。目前在机器学习领域主要有监督学习、无监督学习和半监督学习三大类，其中监督学习和半监督学习处理图像需要图像携带标签信息，通过图像和标签信息，达到图像的识别分类，传统的监督学习及半监督学习学习依赖于大量带标签数据作为样本进行训练，而大量带标签数据的采集成本非常高，因此对无标签图像的处理是监督学习和半监督学习面临的一大难题。

发明内容

本发明的目的在于克服现有技术之不足提供一种无监督图像特征的提取及分类方法。

本发明解决其技术问题所采用的技术方案是：

一种无监督图像特征的提取及分类方法，其包括以下步骤：

A：建立具有隐藏层的串行栈式自编码器网络，将图像原始数据进行降维后输入所述自编码器网络；

B：预训练网络得到权重矩阵W和偏置b，采用贪婪算法训练第一个隐藏层后更新权重矩阵W和偏置b，得到第一隐藏层特征矩阵，输入第一隐藏层特征矩阵，采用贪婪算法训练第二个隐藏层后再次更新权重矩阵W和偏置b，得到第二隐藏层特征矩阵；

C：计算第一隐藏层和第二隐藏层各自的分类精度Y_pq，其中，Y_pq表示第q隐藏层的第p次的分类精度，q∈{1，2}，p∈N⁺，根据分类精度的不同赋予第一隐藏层和第二隐藏层相应的权重，加权融合第一隐藏层特征矩阵和第二隐藏层特征矩阵的特征得到混阶特征矩阵H；

D：混阶特征矩阵H通过SVM分类器进行分类，得到分类结果；

E：通过将分类结果与图像原始数据的图像标签进行比对，得到分类精度A。

在另一较佳实施例中，步骤A中，所述自编码器是稀疏自编码器。

在另一较佳实施例中，所述稀疏自编码器的代价函数为

其中

为稀疏惩罚项，β为稀疏惩罚项的权重系数，S₂是隐藏层中隐藏神经元的数量，而j依次代表隐藏层中的每一个神经元，隐藏层神经元j的激活度

ρ为稀疏性参数。

在另一较佳实施例中，步骤B中，还包括微调所述自编码器网络。

在另一较佳实施例中，步骤B中，所述预训练的目标是最小化代价函数

以使得权重矩阵W和偏置b接近最优值。

在另一较佳实施例中，步骤B中，采用梯度下降法对所述权重矩阵W和所述偏置b进行更新，所述权重矩阵W更新过程为

所述偏置b更新过程为

其中α为学习率。

在另一较佳实施例中，步骤C中，对Y_pq进行标准化得到y_pq，权重为ω_q，

其中，k为常数，E(Y_pq)为信息熵，

其中，

其中，n表示融合的特征层数。

在另一较佳实施例中，步骤C中，所述混阶特征矩阵

其中，

表示对特征进行融合，h_q＝h_q-1*W_q表示第q层隐藏层的图像特征，当q＝1时，h₀＝X₁，X_q是输入的图像特征，W_q是对应的权重矩阵。

在另一较佳实施例中，步骤E中，还得到分类所用时间。

本发明的有益效果是：

1、采用无监督的方法实现图像特征提取，解决无标签图像的特征提取问题，对多个层次的特征根据分类精度进行特征的加权融合得到混阶特征矩阵，通过融合混阶特征矩阵以保留低阶和高阶图像特征，从而提高识别精度。

2、采用稀疏自编码器使得编码器具有更强的适应性，去掉数据的冗余信息，降低数据复杂度。

3、微调所述自编码器网络使整个网络接近整体最优。

4、采用梯度下降法对所述权重矩阵W和所述偏置b进行更新，促进收敛。

5、通过混阶特征矩阵保留低阶和高阶图像特征，从而提高识别精度。

6、获取分类所用时间方便调试比对。

7、通过对分类精度进行标准化处理提高求解速度。

以下结合附图及实施例对本发明作进一步详细说明；但本发明的一种无监督图像特征的提取及分类方法不局限于实施例。

附图说明

图1是本发明一较佳实施例的流程图；

图2是本发明一较佳实施例的工作流程图；

图3是本发明一较佳实施例的可视化第一层编码权重矩阵；

图4是本发明一较佳实施例的可视化第二层编码权重矩阵；

图5是本发明一较佳实施例采用MNIST数据集下的tSNE、SPE、DMP、LIP、LLE、PCA和MOSSAE算法的分类精度对比折线图；

图6是本发明一较佳实施例采用cifar-10数据集下的tSNE、SPE、DMP、LIP、LLE、PCA和MOSSAE算法的分类精度对比折线图；

图7是本发明一较佳实施例采用USPS数据集下的tSNE、SPE、DMP、LIP、LLE、PCA和MOSSAE算法的分类精度对比折线图；

图8是本发明一较佳实施例采用SVHN数据集下的tSNE、SPE、DMP、LIP、LLE、PCA和MOSSAE算法的分类精度对比折线图；

图9是本发明一较佳实施例采用MNIST数据集下的SAE、SSAE和MOSSAE算法的分类精度对比折线图；

图10是本发明一较佳实施例采用cifar-10数据集下SAE、SSAE和MOSSAE算法的分类精度对比折线图。

具体实施方式

实施例，参见图1至图4所示，一种无监督图像特征的提取及分类方法，其包括以下步骤：

A：建立具有三个隐藏层的串行栈式稀疏自编码器网络，将图像原始数据进行降维后输入所述稀疏自编码器网络，所述稀疏自编码器的代价函数为

其中

ρ为稀疏性参数；

B：预训练网络得到权重矩阵W和偏置b，所述预训练的目标是最小化代价函数

以使得权重矩阵W和偏置b接近最优值，采用贪婪算法训练第一个隐藏层后更新权重矩阵W和偏置b，得到第一隐藏层特征矩阵，输入第一隐藏层特征矩阵，采用贪婪算法训练第二个隐藏层后再次更新权重矩阵W和偏置b，得到第二隐藏层特征矩阵，采用梯度下降法对所述权重矩阵W和所述偏置b进行更新，所述权重矩阵W更新过程为

所述偏置b更新过程为

微调所述自编码器网络使整个网络接近整体最优；

C：计算第一隐藏层和第二隐藏层各自的分类精度Y_pq，其中，Y_pq表示第q隐藏层的第p次的分类精度，q∈{1，2}，p∈N⁺，对Y_pq进行标准化得到y_pq，根据分类精度的不同赋予第一隐藏层和第二隐藏层相应的权重

加权融合第一隐藏层特征矩阵和第二隐藏层特征矩阵的特征得到混阶特征矩阵H；其中，常数k＝2，E(Y_pq)为信息熵，

其中，

其中，n＝2表示融合的特征层数为两层，求解混阶特征矩阵

其中，

表示对特征进行融合，h_q＝h_q-1*W_q表示第q层隐藏层的图像特征，当q＝1时，h₀＝X₁，X_q是输入的图像特征，W_q是对应的权重矩阵；

D：混阶特征矩阵H通过SVM分类器进行分类，得到分类结果及分类所用时间；

本实施例的一种无监督图像特征的提取及分类方法的伪代码：

算法：一种无监督图像特征的提取及分类方法，即MOSSAE算法；

输入：图像原始数据，降维维度d，学习率α；

输出：混阶特征矩阵H及其图像的分类精度A；

1、预训练网络得到权重矩阵W和偏置b；

2、训练第一层；

3、for epoch＝1：k；

4、计算样本损失；

5、用梯度下降法更新权重矩阵W′和偏置b′；

6、end for；

7、得到隐藏层特征矩阵；

8、训练第二层，输入为上一层的特征矩阵；

9、重复步骤3至步骤7，至所有层训练完毕，微调整个网络；

10：采用类信息熵的方法对低阶特征和高阶特征进行权重赋值；

11、融合一阶特征和二阶特征得到混阶特征矩阵H；

12、利用H和SVM分类器得到图像分类结果；

13、使用图像标签及分类结果比对得到分类精度；

返回：混阶特征矩阵H，分类结果，分类精度A。

本实施例采用MNIST、cifar-10、USPS和SVHN 4个公开的数据集来进行验证，数据集的描述如表1所示：

表1数据集描述

对MNIST数据集采用自编码网络的第一隐藏层特征分类和第二隐藏层特征分类得到的分类精度如表2所示：

表2不同隐藏层特征在MNIST数据集上的分类精度

对分类精度进行标准化处理，标准化公式为：

min表示第q层分类精度样本数据中的最小值，max表示第q层分类精度样本数据中的最大值，参见表3所示：

表3对表2数据进行标准化后的数据

计算P(Y_pq)如表4所示：

表4各分类精度的P(Y_pq)

	第一隐藏层各分类精度的P(Y<sub>p1</sub>)	第二隐藏层各分类精度的P(Y<sub>p2</sub>)
			第1次	0.06	0.00
第2次	0.00	0.13
			第3次	0.12	0.17
第4次	0.06	0.09
			第5次	0.06	0.13
第6次	0.06	0.00
			第7次	0.00	0.04
第8次	0.18	0.00
			第9次	0.24	0.13
第10次	0.12	0.22
			第11次	0.12	0.09

通过表4计算第一隐藏层和第二隐藏层的信息熵如下：

E(Y_p1)＝0.86，E(Y_p2)＝0.83。

再计算第一隐藏层和第二隐藏层特征权重如下：

ω₁＝0.45，ω₂＝0.55。

将ω₁和ω₂代入式

即可得到混阶特征矩阵H，利用特征矩阵H可进一步得到MNIST上的分类精度，对于cifar-10、USPS和SVHN三个数据集上的分类精度的计算本实施例不再赘述。

参见图5至图8所示，本实施例的MOSSAE算法在特征提取之后，图像分类精度上都要高于现有的tSNE、SPE、DMP、LIP、LLE和PCA算法。

参见图9和图10所示，本实施例的MOSSAE算法在特征提取之后，图像分类精度上都要高于现有的单层的SAE和双层的SSAE算法，原因在于MOSSAE算法把多层的特征进行了融合，即对特征进行融合的分类效果要优于特征未融合的算法。

直接分类与降维后分类所用时间对比参见表5所示：

表5直接分类与降维后分类所用时间对比(秒)

可见，多数情况下本实施例的MOSSAE算法降维后分类比直接分类所用时间短，进一步表明本实施例的算法能有效提高分类效率。

非线性降维算法的网络训练时间对比参见表6所示：

表6非线性降维算法的网络训练时间对比(秒)

可见，本实施例的MOSSAE算法的网络训练所用的时间多数情况下要比其他算法所用的时间要短。

上述实施例仅用来进一步说明本发明的一种无监督图像特征的提取及分类方法，但本发明并不局限于实施例，凡是依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰，均落入本发明技术方案的保护范围内。