CN108596274A

CN108596274A - 基于卷积神经网络的图像分类方法

Info

Publication number: CN108596274A
Application number: CN201810438711.5A
Authority: CN
Inventors: 姚杨; 姚一杨; 梅峰; 戴波; 王彦波; 张旭东; 叶伟静; 王凌
Original assignee: State Grid Zhejiang Electric Power Co Ltd; Information and Telecommunication Branch of State Grid Zhejiang Electric Power Co Ltd
Current assignee: State Grid Zhejiang Electric Power Co Ltd; Information and Telecommunication Branch of State Grid Zhejiang Electric Power Co Ltd
Priority date: 2018-05-09
Filing date: 2018-05-09
Publication date: 2018-09-28

Abstract

本发明提供了基于卷积神经网络的图像分类方法，属于图像处理领域，包括建立训练集，基于训练集对卷积神经网络模型进行训练，得到训练后的卷积神经网络模型；基于训练后的卷积神经网络模型提取样本图像的图像特征向量，将图像特征向量输入至广义回归神经网络进行处理，根据处理结果完成对样本图像的分类。通过在CNN可以从图像中提取特征的同时，利用广义回归神经网络的强大的函数逼近来识别图像，加强CNN的分类和处理能力，可以利用该方法学习图像多层高维特征，对图像进行高效快速地识别，提高了识别精度和泛化能力。

Description

基于卷积神经网络的图像分类方法

技术领域

本发明属于图像处理领域，特别涉及基于卷积神经网络的图像分类方法。

背景技术

随着科学技术的发展,图像识别技术已经逐渐应用于越来越多的领域，与此同时，图像识别的准确性、可靠性和实时要求也越来越严格。卷积神经网(CNN)可以很好地用于处理图像处理和理解任务，但该模型中的BP神经网络过于简单，需要大量的训练进行多次迭代。且BP采用下行梯度训练法，使模型收敛缓慢，容易达到局部优化，影响最终识别精度。

Fu.M.Y等提出了利用Hu不变矩进行特征值提取和交通标志检测的交通标志检测方法,该方法快速可靠识别率高。但它提取的表示是低维特征和无层次信息,仅限于简单的检测和识别工作，不需要更多的图像信息。Shen X等人采用灰度共生(GLCM)来提取图像的纹理信息，并使用已学习的表示来进行识别，该方法只能将低维特征手工提取为Hu不变矩，结合其他方法进行改进。牛晓晓等提出了CNN-svm模型来识别手写数字，该方法使用SVM来提高CNN的识别精度，但它只在简单的手写数字上进行实验。现有的图像识别方案，还存在以下缺点

1.BP神经网络采用下行梯度训练法，使模型收敛缓慢，容易达到局部优化，影响最终识别精度；

2.现有的卷积神经网络(CNN)在多个图像识别中识别精度不高。

发明内容

为了解决现有技术中存在的缺点和不足，本发明提供了用于提高识别精度的图像分类方法。

为了达到上述技术目的，本发明提供了基于卷积神经网络的图像分类方法，所述图像分类方法，包括：

建立训练集，基于训练集对卷积神经网络模型进行训练，得到训练后的卷积神经网络模型；

基于训练后的卷积神经网络模型提取样本图像的图像特征向量，将图像特征向量输入至广义回归神经网络进行处理，根据处理结果完成对样本图像的分类。

可选的，所述建立训练集，基于训练集对卷积神经网络模型进行训练，得到训练后的卷积神经网络模型，包括：

构建包括预设数量的动物图像样本和手势图像样本作为训练集，将训练集中的训练图像样本输入卷积神经网络中，获取卷积神经网络的输出值；

如果输出值呈收敛趋势，则结束对卷积神经网络的训练。

可选的，所述图像分类方法，包括：

如果输出值呈非收敛趋势，则计算当前输出值对应的残差；

根据残差对卷积神经网络中每层的权值和偏差按固定的学习速率进行更新；

根据更新后的卷积神经网络重复训练，直至输出值呈收敛趋势。

可选的，所述基于训练后的卷积神经网络模型提取样本图像的图像特征向量，包括：

利用训练好的卷积神经网络模型从样本图像中提取图像特征值；

基于得到的图像特征值建立列向量形式的图像特征向量。

可选的，所述将图像特征向量输入至广义回归神经网络进行处理，根据处理结果完成对样本图像的分类，包括：

基于图像特征向量X确定指数t_i表达式；

根据公式一获取广义回归神经网络的分类结果输出值

式中Y_i为第i个分类结果输出值，i的取值范围为自然数。

本发明提供的技术方案带来的有益效果是：

采用了CNN-GRNN混合模型来提高图像识别精度，借助在CNN内部用GRNN替换反向传播(BP)神经网络，具有较好的函数逼近能力，提高了CNN的泛化和鲁棒性。

附图说明

为了更清楚地说明本发明的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明提供的基于卷积神经网络的图像分类方法的流程示意图。

具体实施方式

为使本发明的结构和优点更加清楚，下面将结合附图对本发明的结构作进一步地描述。

实施例一

本发明提供了基于卷积神经网络的图像分类方法，如图1所示，所述图像分类方法，包括：

11、建立训练集，基于训练集对卷积神经网络模型进行训练，得到训练后的卷积神经网络模型；

12、基于训练后的卷积神经网络模型提取样本图像的图像特征向量，将图像特征向量输入至广义回归神经网络进行处理，根据处理结果完成对样本图像的分类。

在实施中，本实施例的一种基于改进的卷积神经网络的小样本图像识别方法，基于CNN-GRNN的图像分类的混合模型。在CNN可以从图像中提取特征的同时，利用广义回归神经网络的强大的函数逼近来识别图像，加强CNN的分类和处理能力，可以利用该方法学习图像多层高维特征，对图像进行高效快速地识别，提高了识别精度和泛化能力。克服了以往的卷积神经网络(CNN)在多个图像识别中识别精度不高,泛化能力不强的问题。采用GRNN模型进行分类，具有较好的函数逼近能力，网络只有一个变量，可以与小样本数据库一起工作，在网络训练中优于BP神经网络。

本实施例中提及到的广义神经网络(General Regression Neural Network，GRNN)由四层构成，即输入层、模式层、总和层和输出层。GRNN充满的输入层与层模式和在输入层神经元的个数等于学习实例的维数。模式层中的每个神经元都有自己的训练模式。模式层的输出是对输入表示和存储特性之间的差异进行宽宏化。

如果输出值呈收敛趋势，则结束对卷积神经网络的训练。

在实施中，建立的训练集中包括600个动物图像样本和700个手势图像，其中包含12条不同的狗，每种类型包含50个样本，以及14个不同的手势，每种手势包含50个图像，其中共550个样本用于训练卷积神经网络模型，剩余的750个样本用于测试。

在训练过程中，首先初始化所有卷积核的权重和偏差，接着将构建的训练集中用于训练的样本图像输入卷积神经网络模型中，获取卷积神经网络模型中的输出值O。

对卷积神经网络模型(Convolutional Neural Networks，CNN)的训练本质是通过误差E对卷积神经网络中每层的参数进行调整，这里的误差E通过比较输出O与标签y来计算误差E，计算公式如下：

式中的N表示样本集的数量，C表示样本类型的数量。

在得到误差E的数值后，用CNN判断训练后的卷积神经网络模型是否呈收敛趋势，如果呈收敛趋势则表明当前训练得到的CNN已经可以使用。否则还需要进行重复训练。

可选的，所述图像分类方法，包括：

如果输出值呈非收敛趋势，则计算当前输出值对应的残差；

在实施中，如果根据前述步骤确定需要对CNN进行重复训练，则计算输出的残差δ，对于给定的激活函数f,残差δ的计算公式如下：

残差通过输出层传递到前面层，计算每一层的残差，计算公式如下：

δ^l＝((W^(l)T)δ^(l+1))·f′(z^(l))；

用学习速率α更新每一层的权值和偏差，将α固定为0.5，处理公式分如下：

将迭代次数设为100次，重复上述过程至模型收敛，直至输出值呈收敛趋势完成训练。

基于得到的图像特征值建立列向量形式的图像特征向量。

在实施中，利用训练好的CNN提取图像代表特征；用模型将特征图像拉伸成列向量，即从样本图像中提取到的特征向量；让输出层与CNN特征提取器的特征向量充分连接。

基于图像特征向量X确定指数t_i表达式；

根据公式一获取广义回归神经网络的分类结果输出值

式中Y_i为第i个分类结果输出值，i的取值范围为自然数。

在实施中，利用GRNN对图像进行分类，其方法如下：

将GRNN作为分类器，GRNN可以在不迭代的情况下得到分类结果，利用上述得到的特征向量X＝(x₁,x₂,…,x_n)^T作为GRNN的输入，用如下公式计算输出，完成对图像的分类。计算公式如下：

其中Y表示对应输出的分类结果。

本发明提供了基于卷积神经网络的图像分类方法，包括建立训练集，基于训练集对卷积神经网络模型进行训练，得到训练后的卷积神经网络模型；基于训练后的卷积神经网络模型提取样本图像的图像特征向量，将图像特征向量输入至广义回归神经网络进行处理，根据处理结果完成对样本图像的分类。通过在CNN可以从图像中提取特征的同时，利用广义回归神经网络的强大的函数逼近来识别图像，加强CNN的分类和处理能力，可以利用该方法学习图像多层高维特征，对图像进行高效快速地识别，提高了识别精度和泛化能力。

上述实施例中的各个序号仅仅为了描述，不代表各部件的组装或使用过程中的先后顺序。

以上所述仅为本发明的实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.基于卷积神经网络的图像分类方法，其特征在于，所述图像分类方法，包括：

2.根据权利要求1所述的基于卷积神经网络的图像分类方法，其特征在于，所述建立训练集，基于训练集对卷积神经网络模型进行训练，得到训练后的卷积神经网络模型，包括：

如果输出值呈收敛趋势，则结束对卷积神经网络的训练。

3.根据权利要求2所述的基于卷积神经网络的图像分类方法，其特征在于，所述图像分类方法，包括：

如果输出值呈非收敛趋势，则计算当前输出值对应的残差；

4.根据权利要求1所述的基于卷积神经网络的图像分类方法，其特征在于，所述基于训练后的卷积神经网络模型提取样本图像的图像特征向量，包括：

基于得到的图像特征值建立列向量形式的图像特征向量。

5.根据权利要求1所述的基于卷积神经网络的图像分类方法，其特征在于，所述将图像特征向量输入至广义回归神经网络进行处理，根据处理结果完成对样本图像的分类，包括：

基于图像特征向量X确定指数t_i表达式；

根据公式一获取广义回归神经网络的分类结果输出值

式中Y_i为第i个分类结果输出值，i的取值范围为自然数。