CN104850864A

CN104850864A - 一种基于卷积神经网络的非监督图像识别方法

Info

Publication number: CN104850864A
Application number: CN201510293495.6A
Authority: CN
Inventors: 谭轼; 武艳娇; 黄利今
Original assignee: Ying Zhi Source Shenzhen Intelligent System Co Ltd
Current assignee: Ying Zhi Source Shenzhen Intelligent System Co Ltd
Priority date: 2015-06-01
Filing date: 2015-06-01
Publication date: 2015-08-19

Abstract

本发明公开一种基于卷积神经网络的非监督图像识别方法，主要用于非监督学习的图像识别等领域。此方法包括卷积神经网络初始化，训练非监督图像识别网络两个部分，主要涉及到非监督图像识别过程。首先，利用带5个卷积层和3个全连接层的卷积神经网络形成非监督识别网络，并对数据随机分组得到初始的图像聚类中心；然后，在该卷积网络中加入类内约束，利用加入类内约束的目标函数训练网络以更新网络权重；最后，利用更新过的网络得到对应图像的特征进行聚类，更新聚类分组和聚类中心，并利用更新之后的分组继续训练网络。该方法提出的非监督的卷积神经网络具有强大的图像特征提取的功能，对于输入的图像具有较强的鲁棒能力，其非监督训练通过重建图像本身实现。该网络加入的类内约束则可以让样本在特征空间高度可分，实现更好的非监督图像识别功能。该方法可以获得优于传统方法的非监督图像识别效果。

Description

一种基于卷积神经网络的非监督图像识别方法

[技术领域]

本发明涉及模式识别、计算机视觉，特别涉及基于卷积神经网络的非监督图像识别方法。

[背景技术]

卷积神经网络对于图像处理具有的平移和尺度不变性，因此广泛应用于图像特征提取。传统的卷积神经网络多为有监督网络，不适用于非监督图像的识别。因此我们提出了基于卷积神经网络的非监督图像识别方法，可以利用图像本身作为训练卷积网络的监督信息，从而实现不利用图像分类标签的非监督识别。

为了实现更佳的图像识别结果，我们在该卷积网络中加入类内约束，加入的类内约束可以让样本在特征空间高度可分，实现非监督图像识别功能。该方法可以获得优于传统方法的非监督图像识别效果。

[发明内容]

为了解决现有技术存在的问题，本发明的目的是提供一种基于卷积神经网络的非监督图像识别方法，如图1所示，包括以下步骤：

步骤S1，建立带有5层卷积层和3层全连接层的卷积神经网络，其中最后一层全连接层与输入图像维度相同，该网络所有权重均随机初始化。

步骤S2，在卷积神经网络的特征层(第一个全连接层)加入类内约束函数，使同类样本靠近其聚类中心。加入的类内约束与样本重建函数一起构成卷积网络的目标函数。

步骤S3，将所有样本随机分组，并分别通过卷积神经网络映射到特征空间，然后计算所有组的特征表达的平均值，作为该组的聚类中心。

步骤S4，利用S2中的目标函数训练卷积神经网络，更新网络权重，进行非监督图像识别网络的训练。

步骤S5，利用S4得到的更新后的网络，计算所有样本的特征表达，与之前的聚类中心进行比较，将样本分配至距离最近的聚类中心。

步骤S6，利用S5中得到特征表达按新的分组计算每组的特征表达的均值作为新的聚类中心。

步骤S7，利用S6中更新的聚类中心代替S2中目标函数的聚类中心。

步骤S8，转到S4并循环，直到达到训练次数或者非监督图像识别网络收敛。

根据本发明的方法，可以利用卷积神经网络实现图像的重建，并在高度可分的特征层对样本进行聚类，在特征空间加入的类内约束，使得样本在特征空间的分布更加紧致。该方法不仅利用了卷积神经网络所具有的的尺度和平移不变性，并且在目标函数中加入了针对非监督图像识别问题的类内约束，适合于大多数非监督图像识别问题。

[附图说明]

图1是基于卷积神经网络的非监督图像识别方法的流程图。

[具体实施方式]

以下结合附图详细说明本发明技术方案中所涉及的各个细节问题。应当指出的是，所描述的实施例仅旨在便于理解，对本发明不起任何限定作用。图1是本发明的流程图，如图1所示，所述方法包括以下步骤：

步骤S1，建立带有5层卷积层和3层全连接层的卷积神经网络，其中最后一层全连接层与输入图像维度相同，该网络所有权重均随机初始化。其中，卷积层与全连接层的激活函数均为ReLU函数。每个卷积层的步长、卷积子大小、卷积子的个数均可以自由设置。

步骤S2，在卷积神经网络的特征层(第一个全连接层)加入类内约束函数，使同类样本靠近其聚类中心。加入的类内约束与样本重建函数一起构成卷积网络的目标函数。这样目标函数具体可以表示为：

其中c_k*是对应第n个样本x_n在特征空间的聚类中心，f(x_n)表示样本样本x_n在经过卷积层在特征空间(第一个全连接层)的表达，表示样本的特征表达f(x_n)经过全连接层的输出。

步骤S3，将所有样本随机分为k组，得到每个样本的初始聚类标签L＝[l₁,l₂,…,l_N]，其中N表示N个样本，l表示样本的标签，即所属的分类。然后，将所有样本通过初始网络得到对应的特征层表达，计算每组表达的均值作为初始的聚类中心C。

步骤S8，转到S4并循环，直到达到训练次数或非监督图像识别网络收敛。

[实施例]

为了详细说明本发明的具体实施方式，以某大型图像分类数据集为例说明。该数据集包含60000张彩色图像，共包含10类不同的物体识别图像，每张图像大小为32*32。利用提出的非监督图像识别方法对该数据库进行图像识别，将样本在非监督的情况下分为10类。具体步骤如下：

步骤S1，建立带有5层卷积层和3层全连接层的卷积神经网络，其中最后一层全连接层与输入图像维度相同，该网络所有权重均随机初始化。其中，卷积层与全连接层的激活函数均为ReLU函数。每个卷积层的步长均为1，卷积子大小均为3*3，每个卷积层的卷积子个数均设置为16，全连接层维数分别为4096、4096、3072。

步骤S3，将所有60000个样本随机分为10组，得到每个样本的初始聚类标签L＝[l₁,l₂,…,l_N]，其中N表示N个样本，l表示样本的标签，即所属的分类。然后，将所有样本通过初始网络得到对应的特征层表达，计算每组表达的均值作为初始的聚类中心C。

步骤S5，利用S4得到的更新后的网络，计算所有样本的特征表达，与之前的10个聚类中心进行比较，将样本分配至距离最近的聚类中心。

步骤S8，转到S4并循环，直到训练次数达到100次或非监督图像识别网络收敛。

以上所述，仅为本发明的具体实施方式之一，本发明的保护范围并不局限于此。任何熟悉该技术的人在本发明所揭露的技术范围内，可理解想到的变换或者替换，都应涵盖在本发明的范围之内。因此，本发明的保护范围应以权利要求书的保护范围为准。

Claims

1.一种基于卷积神经网络的非监督图像识别方法，主要包括步骤：

2.根据权利要求1所述的方法，利用卷积神经网络进行非监督图像识别，该网络输入与输出维度相等，从而利用重建原图像作为非监督训练的目标函数。

3.根据权利要求1所述的方法，在卷积神经网络的目标函数中加入类内约束，以得到更好的非监督图像识别结果。