CN108537277A - 一种图像分类识别的方法 - Google Patents

一种图像分类识别的方法 Download PDF

Info

Publication number
CN108537277A
CN108537277A CN201810316101.8A CN201810316101A CN108537277A CN 108537277 A CN108537277 A CN 108537277A CN 201810316101 A CN201810316101 A CN 201810316101A CN 108537277 A CN108537277 A CN 108537277A
Authority
CN
China
Prior art keywords
layer
image classification
picture
convolution
distinguishing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810316101.8A
Other languages
English (en)
Inventor
舒军
杨露
涂杏
沈开斌
李鑫武
蒋明威
吴柯
舒心怡
潘健
王淑青
陈张言
徐成鸿
李志愧
刘伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hubei University of Technology
Original Assignee
Hubei University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hubei University of Technology filed Critical Hubei University of Technology
Priority to CN201810316101.8A priority Critical patent/CN108537277A/zh
Publication of CN108537277A publication Critical patent/CN108537277A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Abstract

本发明公开了一种图像分类识别的方法,首先读取本地图片;然后生成批次,并打乱样本数据;接着构造图像分类识别模型;训练参数,直到图像分类识别模型到达稳定;最后保存图像分类识别模型,用来做相关图像识别。本发明通过结合LeNet、AlexNet、GoogleNet等传统算法有效的解决了识别准确率低,过拟合等问题。在图像识别,分类上有明显的改善,而且相对于层数较多、模型复杂的算法GoogleNet、R‑CNN等更加容易实现,在实际应用中更实用,稍加改变可以实现各种图像的分类识别。

Description

一种图像分类识别的方法
技术领域
本发明属于图像识别技术领域,涉及一种图像分类识别的方法,具体涉及一种结合LeNet、AlexNet、GoogleNet等传统算法的图像分类识别方法。
背景技术
计算机技术与数字图像处理的活跃发展,使得计算机视觉技术逐渐成了二十世纪以来的研究热点,目前,计算机视觉相关技术日趋成熟,如模式识别、图像处理及机器学习等技术都成功运用在了日常生活的方方面面,并发挥着重大的价值。深度学习作为机器学习的一个分支,是神经网络算法的衍生,其“全自动数据分析”的优势在图像、语音、文本等分类和识别上均取得了显著的效果,受到国内外学者的重视。
传统的CNN算法LeNet、AlexNet等都存在一些问题。传统的卷积神经网络,LeNet的图片识别准确率低,模型不够稳定。AlexNet加入dropout之后还是有明显的过拟合现象,而且需要计算的参数多,运行时间长。
发明内容
为了解决上述技术问题,本发明提供了一种结合LeNet、AlexNet、GoogleNet等传统算法的图像分类识别方法。
本发明所采用的技术方案是:一种图像分类识别的方法,其特征在于,包括以下步骤:
步骤1:读取本地图片;
步骤2:生成批次,并打乱样本数据;
步骤3:构造图像分类识别模型;
步骤4:训练图像分类识别模型各层网络的权重和偏置、损失函数、准确率直到图像分类识别模型到达稳定;
步骤5:保存图像分类识别模型,用来做相关图像识别。
本发明通过结合LeNet、AlexNet、GoogleNet等传统算法有效的解决了识别准确率低,过拟合等问题。在图像识别,分类上有明显的改善,而且相对于层数较多、模型复杂的算法GoogleNet、R-CNN等更加容易实现,在实际应用中更实用,只需改变图像样本即可实现各种图像的分类识别。
附图说明
图1为本发明实施例的流程图;
图2为本发明实施例的构造图像分类识别模型的流程图;
图3为本发明实施例的图像分类识别模型示意图。
具体实施方式
为了便于本领域普通技术人员理解和实施本发明,下面结合附图及实施例对本发明作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本发明,并不用于限定本发明。
请见图1和图2,本发明提供的一种图像分类识别的方法,其特征在于,包括以下步骤:
步骤1:读取本地图片;
本实施例以龙虾的检测图片为例,首先读取2万张图本地图片;
步骤2:生成批次,并打乱样本数据;
按照样本的顺序每32个为一批次,并随机打乱样本数据,以便于增强图像分类识别模型的稳定性;
步骤3:构造图像分类识别模型;
请见图3,本实施的图像分类识别模型有8层,包括两层1*1的卷积,2层5*5卷积,2层2*2池化层以及2层全连接层。
步骤4:训练图像分类识别模型各层网络的权重和偏置、损失函数、准确率直到图像分类识别模型到达稳定;
本实施例选用AdamOptimizer优化器进行参数的优化,训练,直到到达稳定(在tensorboard中观察损失函数、准确率基本不变时稳定);具体实现包括以下步骤:
步骤1:输入分辨率为100*100的图片;
步骤2:进行卷积处理;
第一层卷积层:1*1的卷积,得到100*100的图片,并使用relu非线性激活函数;
第二层卷积层:5*5的卷积,得到96*96的图片,并使用relu非线性激活函数;
第一层降采样:2*2的降采样,得到48*48的图片;
第三层卷积层:1*1的卷积,得到48*48的图片,并使用relu非线性激活函数;
第四层卷积层:5*5的卷积,得到44*44的图片,并使用relu非线性激活函数;
第二层降采样:2*2的降采样,得到22*22的图片;
第一层全连接层:1024个神经元全连接,并使用relu非线性激活函数;
第二层全连接层:为输出层,用2个神经元全连接;
步骤3:输出;2类输出,本实施例为龙虾的检测,2个输出为龙虾好的为一类,坏的为一类;
步骤5:保存图像分类识别模型,用来做相关图像识别。
本实施例保存图像分类识别模型后结合opencv来识别新的图片。
本发明还可以在tensorboard中实现准确率acc,损失函数loss的可视化,观察这些参数的变化能够有效的检测图像分类识别模型。
本发明在LeNet模型的基础上结合AlexNet中的relu函数进行非线性激活,GoogleNet中的1*1的卷积模块,用很小的计算量增加一层特征变换和非线性化,以及去掉最后全连接层的思想,减少了一层全连接层,从而减少了模型参数。本发明有效的解决了LeNet模型不够稳定、识别准确率低和AlexNet模型过拟合问题。
应当理解的是,本说明书未详细阐述的部分均属于现有技术。
应当理解的是,上述针对较佳实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。

Claims (5)

1.一种图像分类识别的方法,其特征在于,包括以下步骤:
步骤1:读取本地图片;
步骤2:生成批次,并打乱样本数据;
步骤3:构造图像分类识别模型;
步骤4:训练图像分类识别模型各层网络的权重和偏置、损失函数、准确率直到图像分类识别模型到达稳定;
步骤5:保存图像分类识别模型,用来做相关图像识别。
2.根据权利要求1所述的图像分类识别的方法,其特征在于:步骤2中,按照样本的顺序每32个为一批次,并随机打乱样本数据。
3.根据权利要求1所述的图像分类识别的方法,其特征在于:步骤3中,所述图像分类识别模型有8层,包括两层1*1的卷积,两层5*5卷积,两层2*2池化层以及两层全连接层。
4.根据权利要求3所述的图像分类识别的方法,其特征在于,步骤4中采用AdamOptimizer优化器进行参数的优化,训练,直到在tensorboard中观察损失函数、准确率基本不变;
具体实现包括以下子步骤:
步骤4.1:输入分辨率为100*100的图片;
步骤4.2:进行卷积处理;
第一层卷积层:1*1的卷积,得到100*100的图片,并使用relu非线性激活函数;
第二层卷积层:5*5的卷积,得到96*96的图片,并使用relu非线性激活函数;
第一层降采样:2*2的降采样,得到48*48的图片;
第三层卷积层:1*1的卷积,得到48*48的图片,并使用relu非线性激活函数;
第四层卷积层:5*5的卷积,得到44*44的图片,并使用relu非线性激活函数;
第二层降采样:2*2的降采样,得到22*22的图片;
第一层全连接层:1024个神经元全连接,并使用relu非线性激活函数;
第二层全连接层:为输出层,用2个神经元全连接;
步骤4.3:输出;包括2类输出。
5.根据权利要求1-4任意一项所述的图像分类识别的方法,其特征在于:在tensorboard中实现准确率acc,损失函数loss的可视化,观察这些参数的变化能够有效的检测图像分类识别模型。
CN201810316101.8A 2018-04-10 2018-04-10 一种图像分类识别的方法 Pending CN108537277A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810316101.8A CN108537277A (zh) 2018-04-10 2018-04-10 一种图像分类识别的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810316101.8A CN108537277A (zh) 2018-04-10 2018-04-10 一种图像分类识别的方法

Publications (1)

Publication Number Publication Date
CN108537277A true CN108537277A (zh) 2018-09-14

Family

ID=63479798

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810316101.8A Pending CN108537277A (zh) 2018-04-10 2018-04-10 一种图像分类识别的方法

Country Status (1)

Country Link
CN (1) CN108537277A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109840552A (zh) * 2019-01-14 2019-06-04 湖北工业大学 一种动态图像分类方法
CN110009055A (zh) * 2019-04-15 2019-07-12 中国计量大学 一种基于改进AlexNet的软壳虾特征提取方法
CN110210510A (zh) * 2019-04-15 2019-09-06 中国计量大学 一种基于深度卷积神经网络的次品虾快速识别方法
CN113224852A (zh) * 2021-05-28 2021-08-06 广东电网有限责任公司广州供电局 一种基于ai辅助决策的电力通信管理方法及系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105825235A (zh) * 2016-03-16 2016-08-03 博康智能网络科技股份有限公司 一种基于多特征图深度学习的图像识别方法
CN106778701A (zh) * 2017-01-20 2017-05-31 福州大学 一种加入Dropout的卷积神经网络的果蔬图像识别方法
CN107153810A (zh) * 2016-03-04 2017-09-12 中国矿业大学 一种基于深度学习的手写体数字识别方法及系统
CN107341447A (zh) * 2017-06-13 2017-11-10 华南理工大学 一种基于深度卷积神经网络和证据k近邻的人脸核实方法
CN107563439A (zh) * 2017-08-31 2018-01-09 湖南麓川信息科技有限公司 一种识别清洗食材图片的模型及识别食材类别的方法
CN107714057A (zh) * 2017-10-01 2018-02-23 南京邮电大学盐城大数据研究院有限公司 一种基于卷积神经网络的三分类情绪识别模型方法
CN107808132A (zh) * 2017-10-23 2018-03-16 重庆邮电大学 一种融合主题模型的场景图像分类方法
CN107886128A (zh) * 2017-11-10 2018-04-06 广东工业大学 一种羽毛球识别方法、系统、介质及设备

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107153810A (zh) * 2016-03-04 2017-09-12 中国矿业大学 一种基于深度学习的手写体数字识别方法及系统
CN105825235A (zh) * 2016-03-16 2016-08-03 博康智能网络科技股份有限公司 一种基于多特征图深度学习的图像识别方法
CN106778701A (zh) * 2017-01-20 2017-05-31 福州大学 一种加入Dropout的卷积神经网络的果蔬图像识别方法
CN107341447A (zh) * 2017-06-13 2017-11-10 华南理工大学 一种基于深度卷积神经网络和证据k近邻的人脸核实方法
CN107563439A (zh) * 2017-08-31 2018-01-09 湖南麓川信息科技有限公司 一种识别清洗食材图片的模型及识别食材类别的方法
CN107714057A (zh) * 2017-10-01 2018-02-23 南京邮电大学盐城大数据研究院有限公司 一种基于卷积神经网络的三分类情绪识别模型方法
CN107808132A (zh) * 2017-10-23 2018-03-16 重庆邮电大学 一种融合主题模型的场景图像分类方法
CN107886128A (zh) * 2017-11-10 2018-04-06 广东工业大学 一种羽毛球识别方法、系统、介质及设备

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109840552A (zh) * 2019-01-14 2019-06-04 湖北工业大学 一种动态图像分类方法
CN110009055A (zh) * 2019-04-15 2019-07-12 中国计量大学 一种基于改进AlexNet的软壳虾特征提取方法
CN110210510A (zh) * 2019-04-15 2019-09-06 中国计量大学 一种基于深度卷积神经网络的次品虾快速识别方法
CN110210510B (zh) * 2019-04-15 2020-12-29 中国计量大学 一种基于深度卷积神经网络的次品虾快速识别方法
CN110009055B (zh) * 2019-04-15 2020-12-29 中国计量大学 一种基于改进AlexNet的软壳虾特征提取方法
CN113224852A (zh) * 2021-05-28 2021-08-06 广东电网有限责任公司广州供电局 一种基于ai辅助决策的电力通信管理方法及系统

Similar Documents

Publication Publication Date Title
CN108537277A (zh) 一种图像分类识别的方法
Lu et al. A hybrid model of ghost-convolution enlightened transformer for effective diagnosis of grape leaf disease and pest
Dehuri et al. An improved swarm optimized functional link artificial neural network (ISO-FLANN) for classification
CN111126386B (zh) 场景文本识别中基于对抗学习的序列领域适应方法
Zhang et al. Chromosome classification with convolutional neural network based deep learning
Sabrol et al. Intensity based feature extraction for tomato plant disease recognition by classification using decision tree
Libo et al. Real-time detection of cole diseases and insect pests in wireless sensor networks
CN113749657A (zh) 一种基于多任务胶囊的脑电情绪识别方法
Monigari et al. Plant leaf disease prediction
Sharma et al. A New Dawn for Tomato-spotted wilt virus Detection and Intensity Classification: A CNN and LSTM Ensemble Model
Zhu et al. NAGNet: A novel framework for real‐time students' sentiment analysis in the wisdom classroom
Shafik et al. Using a novel convolutional neural network for plant pests detection and disease classification
Sheng et al. Disease diagnostic method based on cascade backbone network for apple leaf disease classification
Shao et al. A novel hybrid transformer-CNN architecture for environmental microorganism classification
Yang et al. Self-adaptive context and modal-interaction modeling for multimodal emotion recognition
Fan et al. Quantifying plant mimesis in fossil insects using deep learning
Tunc et al. Age group and gender classification using convolutional neural networks with a fuzzy logic-based filter method for noise reduction
Agarwal et al. Plant leaf disease classification using deep learning: A survey
CN109460485A (zh) 一种图像库建立方法、装置和存储介质
Jin et al. VGG-S: Improved Small Sample Image Recognition Model Based on VGG16
CN115035339A (zh) 一种基于人工智能的膀胱镜图像分类方法
Roy et al. Disease Detection in Paddy Crop using Machine Learning Techniques
Gao et al. A Multi-level spatial feature fusion-based transformer for intelligent defect recognition with small samples toward smart manufacturing system
Lyu et al. YOLO-SCL: a lightweight detection model for citrus psyllid based on spatial channel interaction
Lv et al. YOLOV5-CBAM-C3TR: an optimized model based on transformer module and attention mechanism for apple leaf disease detection

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180914