CN108537277A - 一种图像分类识别的方法 - Google Patents
一种图像分类识别的方法 Download PDFInfo
- Publication number
- CN108537277A CN108537277A CN201810316101.8A CN201810316101A CN108537277A CN 108537277 A CN108537277 A CN 108537277A CN 201810316101 A CN201810316101 A CN 201810316101A CN 108537277 A CN108537277 A CN 108537277A
- Authority
- CN
- China
- Prior art keywords
- layer
- image classification
- picture
- convolution
- distinguishing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
Abstract
本发明公开了一种图像分类识别的方法,首先读取本地图片;然后生成批次,并打乱样本数据;接着构造图像分类识别模型;训练参数,直到图像分类识别模型到达稳定;最后保存图像分类识别模型,用来做相关图像识别。本发明通过结合LeNet、AlexNet、GoogleNet等传统算法有效的解决了识别准确率低,过拟合等问题。在图像识别,分类上有明显的改善,而且相对于层数较多、模型复杂的算法GoogleNet、R‑CNN等更加容易实现,在实际应用中更实用,稍加改变可以实现各种图像的分类识别。
Description
技术领域
本发明属于图像识别技术领域,涉及一种图像分类识别的方法,具体涉及一种结合LeNet、AlexNet、GoogleNet等传统算法的图像分类识别方法。
背景技术
计算机技术与数字图像处理的活跃发展,使得计算机视觉技术逐渐成了二十世纪以来的研究热点,目前,计算机视觉相关技术日趋成熟,如模式识别、图像处理及机器学习等技术都成功运用在了日常生活的方方面面,并发挥着重大的价值。深度学习作为机器学习的一个分支,是神经网络算法的衍生,其“全自动数据分析”的优势在图像、语音、文本等分类和识别上均取得了显著的效果,受到国内外学者的重视。
传统的CNN算法LeNet、AlexNet等都存在一些问题。传统的卷积神经网络,LeNet的图片识别准确率低,模型不够稳定。AlexNet加入dropout之后还是有明显的过拟合现象,而且需要计算的参数多,运行时间长。
发明内容
为了解决上述技术问题,本发明提供了一种结合LeNet、AlexNet、GoogleNet等传统算法的图像分类识别方法。
本发明所采用的技术方案是:一种图像分类识别的方法,其特征在于,包括以下步骤:
步骤1:读取本地图片;
步骤2:生成批次,并打乱样本数据;
步骤3:构造图像分类识别模型;
步骤4:训练图像分类识别模型各层网络的权重和偏置、损失函数、准确率直到图像分类识别模型到达稳定;
步骤5:保存图像分类识别模型,用来做相关图像识别。
本发明通过结合LeNet、AlexNet、GoogleNet等传统算法有效的解决了识别准确率低,过拟合等问题。在图像识别,分类上有明显的改善,而且相对于层数较多、模型复杂的算法GoogleNet、R-CNN等更加容易实现,在实际应用中更实用,只需改变图像样本即可实现各种图像的分类识别。
附图说明
图1为本发明实施例的流程图;
图2为本发明实施例的构造图像分类识别模型的流程图;
图3为本发明实施例的图像分类识别模型示意图。
具体实施方式
为了便于本领域普通技术人员理解和实施本发明,下面结合附图及实施例对本发明作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本发明,并不用于限定本发明。
请见图1和图2,本发明提供的一种图像分类识别的方法,其特征在于,包括以下步骤:
步骤1:读取本地图片;
本实施例以龙虾的检测图片为例,首先读取2万张图本地图片;
步骤2:生成批次,并打乱样本数据;
按照样本的顺序每32个为一批次,并随机打乱样本数据,以便于增强图像分类识别模型的稳定性;
步骤3:构造图像分类识别模型;
请见图3,本实施的图像分类识别模型有8层,包括两层1*1的卷积,2层5*5卷积,2层2*2池化层以及2层全连接层。
步骤4:训练图像分类识别模型各层网络的权重和偏置、损失函数、准确率直到图像分类识别模型到达稳定;
本实施例选用AdamOptimizer优化器进行参数的优化,训练,直到到达稳定(在tensorboard中观察损失函数、准确率基本不变时稳定);具体实现包括以下步骤:
步骤1:输入分辨率为100*100的图片;
步骤2:进行卷积处理;
第一层卷积层:1*1的卷积,得到100*100的图片,并使用relu非线性激活函数;
第二层卷积层:5*5的卷积,得到96*96的图片,并使用relu非线性激活函数;
第一层降采样:2*2的降采样,得到48*48的图片;
第三层卷积层:1*1的卷积,得到48*48的图片,并使用relu非线性激活函数;
第四层卷积层:5*5的卷积,得到44*44的图片,并使用relu非线性激活函数;
第二层降采样:2*2的降采样,得到22*22的图片;
第一层全连接层:1024个神经元全连接,并使用relu非线性激活函数;
第二层全连接层:为输出层,用2个神经元全连接;
步骤3:输出;2类输出,本实施例为龙虾的检测,2个输出为龙虾好的为一类,坏的为一类;
步骤5:保存图像分类识别模型,用来做相关图像识别。
本实施例保存图像分类识别模型后结合opencv来识别新的图片。
本发明还可以在tensorboard中实现准确率acc,损失函数loss的可视化,观察这些参数的变化能够有效的检测图像分类识别模型。
本发明在LeNet模型的基础上结合AlexNet中的relu函数进行非线性激活,GoogleNet中的1*1的卷积模块,用很小的计算量增加一层特征变换和非线性化,以及去掉最后全连接层的思想,减少了一层全连接层,从而减少了模型参数。本发明有效的解决了LeNet模型不够稳定、识别准确率低和AlexNet模型过拟合问题。
应当理解的是,本说明书未详细阐述的部分均属于现有技术。
应当理解的是,上述针对较佳实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。
Claims (5)
1.一种图像分类识别的方法,其特征在于,包括以下步骤:
步骤1:读取本地图片;
步骤2:生成批次,并打乱样本数据;
步骤3:构造图像分类识别模型;
步骤4:训练图像分类识别模型各层网络的权重和偏置、损失函数、准确率直到图像分类识别模型到达稳定;
步骤5:保存图像分类识别模型,用来做相关图像识别。
2.根据权利要求1所述的图像分类识别的方法,其特征在于:步骤2中,按照样本的顺序每32个为一批次,并随机打乱样本数据。
3.根据权利要求1所述的图像分类识别的方法,其特征在于:步骤3中,所述图像分类识别模型有8层,包括两层1*1的卷积,两层5*5卷积,两层2*2池化层以及两层全连接层。
4.根据权利要求3所述的图像分类识别的方法,其特征在于,步骤4中采用AdamOptimizer优化器进行参数的优化,训练,直到在tensorboard中观察损失函数、准确率基本不变;
具体实现包括以下子步骤:
步骤4.1:输入分辨率为100*100的图片;
步骤4.2:进行卷积处理;
第一层卷积层:1*1的卷积,得到100*100的图片,并使用relu非线性激活函数;
第二层卷积层:5*5的卷积,得到96*96的图片,并使用relu非线性激活函数;
第一层降采样:2*2的降采样,得到48*48的图片;
第三层卷积层:1*1的卷积,得到48*48的图片,并使用relu非线性激活函数;
第四层卷积层:5*5的卷积,得到44*44的图片,并使用relu非线性激活函数;
第二层降采样:2*2的降采样,得到22*22的图片;
第一层全连接层:1024个神经元全连接,并使用relu非线性激活函数;
第二层全连接层:为输出层,用2个神经元全连接;
步骤4.3:输出;包括2类输出。
5.根据权利要求1-4任意一项所述的图像分类识别的方法,其特征在于:在tensorboard中实现准确率acc,损失函数loss的可视化,观察这些参数的变化能够有效的检测图像分类识别模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810316101.8A CN108537277A (zh) | 2018-04-10 | 2018-04-10 | 一种图像分类识别的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810316101.8A CN108537277A (zh) | 2018-04-10 | 2018-04-10 | 一种图像分类识别的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108537277A true CN108537277A (zh) | 2018-09-14 |
Family
ID=63479798
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810316101.8A Pending CN108537277A (zh) | 2018-04-10 | 2018-04-10 | 一种图像分类识别的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108537277A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109840552A (zh) * | 2019-01-14 | 2019-06-04 | 湖北工业大学 | 一种动态图像分类方法 |
CN110009055A (zh) * | 2019-04-15 | 2019-07-12 | 中国计量大学 | 一种基于改进AlexNet的软壳虾特征提取方法 |
CN110210510A (zh) * | 2019-04-15 | 2019-09-06 | 中国计量大学 | 一种基于深度卷积神经网络的次品虾快速识别方法 |
CN113224852A (zh) * | 2021-05-28 | 2021-08-06 | 广东电网有限责任公司广州供电局 | 一种基于ai辅助决策的电力通信管理方法及系统 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105825235A (zh) * | 2016-03-16 | 2016-08-03 | 博康智能网络科技股份有限公司 | 一种基于多特征图深度学习的图像识别方法 |
CN106778701A (zh) * | 2017-01-20 | 2017-05-31 | 福州大学 | 一种加入Dropout的卷积神经网络的果蔬图像识别方法 |
CN107153810A (zh) * | 2016-03-04 | 2017-09-12 | 中国矿业大学 | 一种基于深度学习的手写体数字识别方法及系统 |
CN107341447A (zh) * | 2017-06-13 | 2017-11-10 | 华南理工大学 | 一种基于深度卷积神经网络和证据k近邻的人脸核实方法 |
CN107563439A (zh) * | 2017-08-31 | 2018-01-09 | 湖南麓川信息科技有限公司 | 一种识别清洗食材图片的模型及识别食材类别的方法 |
CN107714057A (zh) * | 2017-10-01 | 2018-02-23 | 南京邮电大学盐城大数据研究院有限公司 | 一种基于卷积神经网络的三分类情绪识别模型方法 |
CN107808132A (zh) * | 2017-10-23 | 2018-03-16 | 重庆邮电大学 | 一种融合主题模型的场景图像分类方法 |
CN107886128A (zh) * | 2017-11-10 | 2018-04-06 | 广东工业大学 | 一种羽毛球识别方法、系统、介质及设备 |
-
2018
- 2018-04-10 CN CN201810316101.8A patent/CN108537277A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107153810A (zh) * | 2016-03-04 | 2017-09-12 | 中国矿业大学 | 一种基于深度学习的手写体数字识别方法及系统 |
CN105825235A (zh) * | 2016-03-16 | 2016-08-03 | 博康智能网络科技股份有限公司 | 一种基于多特征图深度学习的图像识别方法 |
CN106778701A (zh) * | 2017-01-20 | 2017-05-31 | 福州大学 | 一种加入Dropout的卷积神经网络的果蔬图像识别方法 |
CN107341447A (zh) * | 2017-06-13 | 2017-11-10 | 华南理工大学 | 一种基于深度卷积神经网络和证据k近邻的人脸核实方法 |
CN107563439A (zh) * | 2017-08-31 | 2018-01-09 | 湖南麓川信息科技有限公司 | 一种识别清洗食材图片的模型及识别食材类别的方法 |
CN107714057A (zh) * | 2017-10-01 | 2018-02-23 | 南京邮电大学盐城大数据研究院有限公司 | 一种基于卷积神经网络的三分类情绪识别模型方法 |
CN107808132A (zh) * | 2017-10-23 | 2018-03-16 | 重庆邮电大学 | 一种融合主题模型的场景图像分类方法 |
CN107886128A (zh) * | 2017-11-10 | 2018-04-06 | 广东工业大学 | 一种羽毛球识别方法、系统、介质及设备 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109840552A (zh) * | 2019-01-14 | 2019-06-04 | 湖北工业大学 | 一种动态图像分类方法 |
CN110009055A (zh) * | 2019-04-15 | 2019-07-12 | 中国计量大学 | 一种基于改进AlexNet的软壳虾特征提取方法 |
CN110210510A (zh) * | 2019-04-15 | 2019-09-06 | 中国计量大学 | 一种基于深度卷积神经网络的次品虾快速识别方法 |
CN110210510B (zh) * | 2019-04-15 | 2020-12-29 | 中国计量大学 | 一种基于深度卷积神经网络的次品虾快速识别方法 |
CN110009055B (zh) * | 2019-04-15 | 2020-12-29 | 中国计量大学 | 一种基于改进AlexNet的软壳虾特征提取方法 |
CN113224852A (zh) * | 2021-05-28 | 2021-08-06 | 广东电网有限责任公司广州供电局 | 一种基于ai辅助决策的电力通信管理方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108537277A (zh) | 一种图像分类识别的方法 | |
Lu et al. | A hybrid model of ghost-convolution enlightened transformer for effective diagnosis of grape leaf disease and pest | |
Dehuri et al. | An improved swarm optimized functional link artificial neural network (ISO-FLANN) for classification | |
CN111126386B (zh) | 场景文本识别中基于对抗学习的序列领域适应方法 | |
Zhang et al. | Chromosome classification with convolutional neural network based deep learning | |
Sabrol et al. | Intensity based feature extraction for tomato plant disease recognition by classification using decision tree | |
Libo et al. | Real-time detection of cole diseases and insect pests in wireless sensor networks | |
CN113749657A (zh) | 一种基于多任务胶囊的脑电情绪识别方法 | |
Monigari et al. | Plant leaf disease prediction | |
Sharma et al. | A New Dawn for Tomato-spotted wilt virus Detection and Intensity Classification: A CNN and LSTM Ensemble Model | |
Zhu et al. | NAGNet: A novel framework for real‐time students' sentiment analysis in the wisdom classroom | |
Shafik et al. | Using a novel convolutional neural network for plant pests detection and disease classification | |
Sheng et al. | Disease diagnostic method based on cascade backbone network for apple leaf disease classification | |
Shao et al. | A novel hybrid transformer-CNN architecture for environmental microorganism classification | |
Yang et al. | Self-adaptive context and modal-interaction modeling for multimodal emotion recognition | |
Fan et al. | Quantifying plant mimesis in fossil insects using deep learning | |
Tunc et al. | Age group and gender classification using convolutional neural networks with a fuzzy logic-based filter method for noise reduction | |
Agarwal et al. | Plant leaf disease classification using deep learning: A survey | |
CN109460485A (zh) | 一种图像库建立方法、装置和存储介质 | |
Jin et al. | VGG-S: Improved Small Sample Image Recognition Model Based on VGG16 | |
CN115035339A (zh) | 一种基于人工智能的膀胱镜图像分类方法 | |
Roy et al. | Disease Detection in Paddy Crop using Machine Learning Techniques | |
Gao et al. | A Multi-level spatial feature fusion-based transformer for intelligent defect recognition with small samples toward smart manufacturing system | |
Lyu et al. | YOLO-SCL: a lightweight detection model for citrus psyllid based on spatial channel interaction | |
Lv et al. | YOLOV5-CBAM-C3TR: an optimized model based on transformer module and attention mechanism for apple leaf disease detection |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180914 |