CN108537277A

CN108537277A - 一种图像分类识别的方法

Info

Publication number: CN108537277A
Application number: CN201810316101.8A
Authority: CN
Inventors: 舒军; 杨露; 涂杏; 沈开斌; 李鑫武; 蒋明威; 吴柯; 舒心怡; 潘健; 王淑青; 陈张言; 徐成鸿; 李志愧; 刘伟
Original assignee: Hubei University of Technology
Current assignee: Hubei University of Technology
Priority date: 2018-04-10
Filing date: 2018-04-10
Publication date: 2018-09-14

Abstract

本发明公开了一种图像分类识别的方法，首先读取本地图片；然后生成批次，并打乱样本数据；接着构造图像分类识别模型；训练参数，直到图像分类识别模型到达稳定；最后保存图像分类识别模型，用来做相关图像识别。本发明通过结合LeNet、AlexNet、GoogleNet等传统算法有效的解决了识别准确率低，过拟合等问题。在图像识别，分类上有明显的改善，而且相对于层数较多、模型复杂的算法GoogleNet、R‑CNN等更加容易实现，在实际应用中更实用，稍加改变可以实现各种图像的分类识别。

Description

一种图像分类识别的方法

技术领域

本发明属于图像识别技术领域，涉及一种图像分类识别的方法，具体涉及一种结合LeNet、AlexNet、GoogleNet等传统算法的图像分类识别方法。

背景技术

计算机技术与数字图像处理的活跃发展，使得计算机视觉技术逐渐成了二十世纪以来的研究热点，目前，计算机视觉相关技术日趋成熟，如模式识别、图像处理及机器学习等技术都成功运用在了日常生活的方方面面，并发挥着重大的价值。深度学习作为机器学习的一个分支，是神经网络算法的衍生，其“全自动数据分析”的优势在图像、语音、文本等分类和识别上均取得了显著的效果，受到国内外学者的重视。

传统的CNN算法LeNet、AlexNet等都存在一些问题。传统的卷积神经网络，LeNet的图片识别准确率低，模型不够稳定。AlexNet加入dropout之后还是有明显的过拟合现象，而且需要计算的参数多，运行时间长。

发明内容

为了解决上述技术问题，本发明提供了一种结合LeNet、AlexNet、GoogleNet等传统算法的图像分类识别方法。

本发明所采用的技术方案是：一种图像分类识别的方法，其特征在于，包括以下步骤：

步骤1：读取本地图片；

步骤2：生成批次，并打乱样本数据；

步骤3：构造图像分类识别模型；

步骤4：训练图像分类识别模型各层网络的权重和偏置、损失函数、准确率直到图像分类识别模型到达稳定；

步骤5：保存图像分类识别模型，用来做相关图像识别。

本发明通过结合LeNet、AlexNet、GoogleNet等传统算法有效的解决了识别准确率低，过拟合等问题。在图像识别，分类上有明显的改善，而且相对于层数较多、模型复杂的算法GoogleNet、R-CNN等更加容易实现，在实际应用中更实用，只需改变图像样本即可实现各种图像的分类识别。

附图说明

图1为本发明实施例的流程图；

图2为本发明实施例的构造图像分类识别模型的流程图；

图3为本发明实施例的图像分类识别模型示意图。

具体实施方式

为了便于本领域普通技术人员理解和实施本发明，下面结合附图及实施例对本发明作进一步的详细描述，应当理解，此处所描述的实施示例仅用于说明和解释本发明，并不用于限定本发明。

请见图1和图2，本发明提供的一种图像分类识别的方法，其特征在于，包括以下步骤：

步骤1：读取本地图片；

本实施例以龙虾的检测图片为例，首先读取2万张图本地图片；

步骤2：生成批次，并打乱样本数据；

按照样本的顺序每32个为一批次，并随机打乱样本数据，以便于增强图像分类识别模型的稳定性；

步骤3：构造图像分类识别模型；

请见图3，本实施的图像分类识别模型有8层，包括两层1*1的卷积，2层5*5卷积，2层2*2池化层以及2层全连接层。

本实施例选用AdamOptimizer优化器进行参数的优化，训练，直到到达稳定(在tensorboard中观察损失函数、准确率基本不变时稳定)；具体实现包括以下步骤：

步骤1：输入分辨率为100*100的图片；

步骤2：进行卷积处理；

第一层卷积层：1*1的卷积，得到100*100的图片，并使用relu非线性激活函数；

第二层卷积层：5*5的卷积，得到96*96的图片,并使用relu非线性激活函数；

第一层降采样：2*2的降采样，得到48*48的图片；

第三层卷积层：1*1的卷积，得到48*48的图片,并使用relu非线性激活函数；

第四层卷积层：5*5的卷积，得到44*44的图片,并使用relu非线性激活函数；

第二层降采样：2*2的降采样，得到22*22的图片；

第一层全连接层：1024个神经元全连接,并使用relu非线性激活函数；

第二层全连接层：为输出层，用2个神经元全连接；

步骤3：输出；2类输出，本实施例为龙虾的检测，2个输出为龙虾好的为一类，坏的为一类；

步骤5：保存图像分类识别模型，用来做相关图像识别。

本实施例保存图像分类识别模型后结合opencv来识别新的图片。

本发明还可以在tensorboard中实现准确率acc，损失函数loss的可视化，观察这些参数的变化能够有效的检测图像分类识别模型。

本发明在LeNet模型的基础上结合AlexNet中的relu函数进行非线性激活，GoogleNet中的1*1的卷积模块，用很小的计算量增加一层特征变换和非线性化，以及去掉最后全连接层的思想，减少了一层全连接层，从而减少了模型参数。本发明有效的解决了LeNet模型不够稳定、识别准确率低和AlexNet模型过拟合问题。

应当理解的是，本说明书未详细阐述的部分均属于现有技术。

应当理解的是，上述针对较佳实施例的描述较为详细，并不能因此而认为是对本发明专利保护范围的限制，本领域的普通技术人员在本发明的启示下，在不脱离本发明权利要求所保护的范围情况下，还可以做出替换或变形，均落入本发明的保护范围之内，本发明的请求保护范围应以所附权利要求为准。

Claims

1.一种图像分类识别的方法，其特征在于，包括以下步骤：

步骤1：读取本地图片；

步骤2：生成批次，并打乱样本数据；

步骤3：构造图像分类识别模型；

步骤5：保存图像分类识别模型，用来做相关图像识别。

2.根据权利要求1所述的图像分类识别的方法，其特征在于：步骤2中，按照样本的顺序每32个为一批次，并随机打乱样本数据。

3.根据权利要求1所述的图像分类识别的方法，其特征在于：步骤3中，所述图像分类识别模型有8层，包括两层1*1的卷积，两层5*5卷积，两层2*2池化层以及两层全连接层。

4.根据权利要求3所述的图像分类识别的方法，其特征在于，步骤4中采用AdamOptimizer优化器进行参数的优化，训练，直到在tensorboard中观察损失函数、准确率基本不变；

具体实现包括以下子步骤：

步骤4.1：输入分辨率为100*100的图片；

步骤4.2：进行卷积处理；

第一层降采样：2*2的降采样，得到48*48的图片；

第二层降采样：2*2的降采样，得到22*22的图片；

第二层全连接层：为输出层，用2个神经元全连接；

步骤4.3：输出；包括2类输出。

5.根据权利要求1-4任意一项所述的图像分类识别的方法，其特征在于：在tensorboard中实现准确率acc，损失函数loss的可视化，观察这些参数的变化能够有效的检测图像分类识别模型。