CN109871885B - 一种基于深度学习和植物分类学的植物识别方法 - Google Patents

一种基于深度学习和植物分类学的植物识别方法 Download PDF

Info

Publication number
CN109871885B
CN109871885B CN201910079097.2A CN201910079097A CN109871885B CN 109871885 B CN109871885 B CN 109871885B CN 201910079097 A CN201910079097 A CN 201910079097A CN 109871885 B CN109871885 B CN 109871885B
Authority
CN
China
Prior art keywords
plant
layer
neural network
image
species
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910079097.2A
Other languages
English (en)
Other versions
CN109871885A (zh
Inventor
朱悠翔
业宁
李若尘
张政
王香
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Forestry University
Original Assignee
Nanjing Forestry University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Forestry University filed Critical Nanjing Forestry University
Priority to CN201910079097.2A priority Critical patent/CN109871885B/zh
Publication of CN109871885A publication Critical patent/CN109871885A/zh
Application granted granted Critical
Publication of CN109871885B publication Critical patent/CN109871885B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本发明公开了一种基于深度学习和植物分类学的植物识别方法。将样本植物图像进行科、属、种的标记;将样本植物图像输入深度卷积神经网络中进行训练。将损失函数设定为科、属、种标签的交叉熵损失的加权和,通过随机梯度下降算法更新神经网络的权值,待该深度卷积神经网络收敛后结束训练并固定各层权值不再改变得到训练好的深度卷积神经网络。本发明通过将深度学习与植物分类学结合,引入科、属标签作为学习目标,提高了识别正确率。

Description

一种基于深度学习和植物分类学的植物识别方法
技术领域
本发明涉及植物识别技术领域,具体为一种基于深度学习和植物分类学的植物识别方法。
背景技术
图像识别领域目前一般来说有两类方法,一类是基于传统机器学习的识别方法,其特点是特征提取方式一般为人工定义;另一类是基于深度学习的方法,其特点是特征依靠深度卷积神经网络自动提取。然而,前者往往会引入人工偏差,后者会有一定程度的过拟合问题,影响识别性能。
现有专利CN201810030151.X,公开了一种植物种类识别方法以及装置,其通过获取待识别植物的花、叶以及整体植株三个部位中的至少两个部位的图片作为待识别图片;并基于预先保存的多个识别模型分别识别所述待识别图片中的每张图片,得到每个部位的预测识别结果;然后将所有的预测识别结果进行融合,得到所述待识别植物的种类。本方法根据叶、花和植株整体信息,融合利用整体和局部信息,对植物做精细的识别分析,从而得出准确的植物分类结果,可以让算法更具有鲁棒性,用户在使用该算法时,能够较以往更好地实现植物分类。该专利使用了跨媒体方法进行识别。
现有专利CN201611206559.5,公开了一种基于深度学习的跨媒体中草药植物图像检索方法。其步骤如下:1)通过OCR,文本结构化处理,从《植物分类学》等书籍中抽取植物分类描述文字2)使用中文分词工具,对所有植物分类描述文字进行包括分词和去停用词在内的预处理;3)用word2vec算法根据描述文本生成词向量;4)使用Fisher Vector将描述文本进行编码;5)利用卷积神经网络在图片集上进行训练,使网络结构收敛到最优状态;6)提取卷积神经网络的倒数第二层全连接层输出作为图片特征向量;7)融合文本特征与图片特征;8)使用线性核SVM分类器进行模型训练;9)用户检索时可输入图像、描述植物文本,之后利用4)、6)、7)、8)步得到最终的图片检索结果。该专利使用了跨媒体方法。
发明内容
发明目的:为提高植物识别的准确率,缓解深度卷积神经网络的过拟合问题,本发明提供一种基于深度学习和植物分类学的植物识别方法。
技术方案:为实现上述目的,本发明采用的技术方案为:
一种基于深度学习和植物分类学的植物识别方法,包括以下步骤:
步骤1,收集样本植物图像和待识别植物图像,将样本植物图像进行科、属、种的标记。
步骤2,将样本植物图像输入深度卷积神经网络中进行训练,所述深度卷积神经网络包括输入层、卷积层、池化层、全连接层和输出层,其中,输入层接收输入图像,卷积层和池化层用于图像特征提取,全连接层用于特征分类,输出层用于输出结果。输出层同时具有3个输出值,分别为该植物的科、属、种标记。
所述深度卷积神经网络的损失函数为植物科、属、种的交叉熵损失的加权和,即为:
l=alf+blg+cls
其中,l表示损失函数,lf、lg、ls分别为科、属、种的交叉熵损失函数,a、b、c分别为科、属、种损失函数的权重,f、g、s分别表示科、属、种; li为分别对于科、属、种的交叉熵损失函数。其中,yi表示真实概率分布,/>表示预测概率分布。n表示分类数,相应的,yij表示第j个分类的真实概率,/>表示第j个分类的预测概率。给定输入图片X,预测权值θi,则对第j个分类预测权值为θij,则
通过随机梯度下降算法更新深度卷积神经网络的各层权值。待训练损失函数小于一定损失阀值(即收敛)时,停止训练并固定各层权值不再改变,得到训练好的深度卷积神经网络。
所述随机梯度下降算法目标为:
min li
求解方法为,对于共m张训练图片,从1到m不断重复执行下式直到收敛:
θi:=θi-αgt
其中,gt就是所谓的随机梯度,它满足 表示li对于θi的偏导数,α是下降系数,对于每一次更新参数,不必遍历所有的训练集合,整体趋势是走向最小。
步骤3,将待识别植物图像输入到步骤2已训练好的深度卷积神经网络中,依据输出标记得到最终识别结果。
优选的:将收集的样本植物图像和待识别植物图像输入深度卷积神经网络训练前,应先进行数据增强处理,数据增强处理至少包括旋转、裁剪、放大。旋转是指将植物图像每旋转n度后进行一次采样,0<n<360。裁剪是指多次随机多次裁剪植物图像中的一部分后进行采样,应保证裁剪后图像面积不小于原始图像的二分之一。放大是指多次随机将图像中的一部分放大后再进行采样。
优选的:所述深度卷积神经网络中输入层、卷积层、池化层、全连接层、输出层的总层数应在10层以上。
优选的:训练过程包括前向传播和反向传播,在反向传播时,根据预先设定的学习速率更新网络的权值。
优选的:所述损失阀值一般为0.00001。
本发明相比现有技术,具有以下有益效果:
本发明依据现代植物分类学,通过引入科、属标签和种标签一起作为监督学习的目标,即将植物科、属、种的交叉熵损失的加权和作为深度卷积神经网络的损失函数。以此损失函数训练有效缓解了深度卷积神经网络的过拟合问题,提高了识别正确率。
附图说明
图1为本发明基于深度学习和植物分类学的植物识别方法的训练过程和系统建立过程。
图2为本发明基于深度学习和植物分类学的植物识别方法的识别过程。
图3为深度卷积神经网络模型的示意图。
具体实施方式
下面结合附图和具体实施例,进一步阐明本发明,应理解这些实例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
一种基于深度学习和植物分类学的植物识别方法,包括以下步骤:
步骤1,收集样本植物图像和待识别植物图像,收集方式可通过任何有摄像头的设备拍摄取得。收集完成后,建立植物图像数据库,根据植物分类学,对所收集到的样本植物图像进行科、属、种的标记,应确保每个物种的样本植物图像数量在100张以上,否则应补充收集。
将收集的样本植物图像和待识别植物图像输入深度卷积神经网络训练前,应先进行数据增强处理,数据增强处理至少包括旋转、裁剪、放大。旋转是指将植物图像每旋转n度后进行一次采样,0<n<360。裁剪是指多次随机多次裁剪植物图像中的一部分后进行采样,应保证裁剪后图像面积不小于原始图像的二分之一。放大是指多次随机将图像中的一部分放大后再进行采样。
步骤2,将样本植物图像输入深度卷积神经网络中进行训练,建立如图3所示的深度卷积神经网络模型,所述深度卷积神经网络包括输入层、卷积层、池化层、全连接层和输出层,第一层为输入层,紧接着为若干个卷积和池化层,之后为若干个全连接层,最后为输出层,所述深度卷积神经网络中输入层、卷积层、池化层、全连接层、输出层的总层数应在10层以上,其中,输入层接收输入图像,卷积层和池化层用于图像特征提取,全连接层用于特征分类,输出层用于输出结果。输出层同时具有3个输出值,分别为该植物的科、属、种标记。
所述深度卷积神经网络的损失函数为植物科、属、种的交叉熵损失的加权和,即为:
l=alf+blg+cls
其中,l表示损失函数,lf、lg、ls分别为科、属、种的交叉熵损失函数,a、b、c分别为科、属、种损失函数的权重,f、g、s分别表示科、属、种; 为分别对于科、属、种的交叉熵损失函数。其中,yi表示真实概率分布,/>表示预测概率分布。假设共有n个分类,相应的,yij表示第j个分类的真实概率,/>表示第j个分类的预测概率。给定输入图片X,预测权值θi,则对第j个分类预测权值为θij,则
通过随机梯度下降算法更新深度卷积神经网络的各层权值。待训练损失函数小于一定损失阀值(即收敛)时,停止训练并固定各层权值不再改变,得到训练好的深度卷积神经网络。
所述随机梯度下降算法目标为:
min li
求解方法为,对于共m张训练图片,从1到m不断重复执行下式直到收敛:
θi:=θi-αgt
其中,gt就是所谓的随机梯度,它满足 表示li对于θi的偏导数,α是下降系数,对于每一次更新参数,不必遍历所有的训练集合,整体趋势是走向最小。
训练过程包括前向传播和反向传播,在反向传播时,通过梯度下降算法更新深度卷积神经网络的各层权值,即反向逐层减去交叉熵损失对于该层权值的偏导数与设定学习率的乘积。待训练损失函数小于一定损失阀值(一般为0.00001)时,停止训练并固定各层权值不再改变,得到训练好的深度卷积神经网络。该训练好的深度卷积神经网络及其权值即为所述基于深度学习和植物分类学的植物识别系统,其输入为待识别植物图像,输出为该图像中植物的科、属、种。
步骤3,将待识别植物图像输入到步骤2已训练好的深度卷积神经网络中,依据输出标记得到最终识别结果。识别的过程仅包括前向传播,输出为植物图像数据库中具有的植物种类中的科、属、种。
本发明通过将深度学习与植物分类学结合,引入科、属标签作为学习目标,提高了识别正确率。
以上所述仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (4)

1.一种基于深度学习和植物分类学的植物识别方法,其特征在于,包括以下步骤:
步骤1,收集样本植物图像和待识别植物图像,将样本植物图像进行科、属、种的标记;
步骤2,将样本植物图像输入深度卷积神经网络中进行训练,所述深度卷积神经网络包括输入层、卷积层、池化层、全连接层和输出层,其中,输入层接收输入图像,卷积层和池化层用于图像特征提取,全连接层用于特征分类,输出层用于输出结果;输出层同时具有3个输出值,分别为该植物的科、属、种标记;
所述深度卷积神经网络的损失函数为植物科、属、种的交叉熵损失的加权和,即为:
其中,表示损失函数加权和,/>、/>、/>分别为科、属、种的交叉熵损失函数,/>、/>、/>分别为科、属、种损失函数的权重,/>分别表示科、属、种;
科、属、种的交叉熵损失函数为:
其中,,/>为分别对于科、属、种的交叉熵损失函数,/>表示分类数, />表示第j个分类的真实概率,/>表示第j个分类的预测概率,给定输入图片/>,预测权值/>,则对第j个分类预测权值为/>,则
训练过程包括前向传播和反向传播,在反向传播时,通过随机梯度下降算法更新深度卷积神经网络的各层权值,反向逐层减去交叉熵损失对于该层权值的偏导数与设定学习率的乘积,待训练损失函数小于一定损失阀值时,停止训练并固定各层权值不再改变,得到训练好的深度卷积神经网络;
随机梯度下降算法目标为:
求解方法为,对于共张训练图片,从1到/>不断重复执行下式直到收敛:
其中,表示随机梯度,满足/>,/>表示/>对于/>的偏导数,/>是下降系数;
步骤3,将待识别植物图像输入到步骤2已训练好的深度卷积神经网络中,依据输出标记得到最终识别结果。
2.根据权利要求1所述基于深度学习和植物分类学的植物识别方法,其特征在于:将收集的样本植物图像和待识别植物图像输入深度卷积神经网络训练前,先进行数据增强处理,数据增强处理至少包括旋转、裁剪、放大;旋转是指将植物图像每旋转n度后进行一次采样,0<n<360;裁剪是指多次随机多次裁剪植物图像中的一部分后进行采样,保证裁剪后图像面积不小于原始图像的二分之一;放大是指多次随机将图像中的一部分放大后再进行采样。
3.根据权利要求2所述基于深度学习和植物分类学的植物识别方法,其特征在于:所述深度卷积神经网络中输入层、卷积层、池化层、全连接层、输出层的总层数在10层以上。
4.根据权利要求3所述基于深度学习和植物分类学的植物识别方法,其特征在于:所述损失阀值为0.00001。
CN201910079097.2A 2019-01-28 2019-01-28 一种基于深度学习和植物分类学的植物识别方法 Active CN109871885B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910079097.2A CN109871885B (zh) 2019-01-28 2019-01-28 一种基于深度学习和植物分类学的植物识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910079097.2A CN109871885B (zh) 2019-01-28 2019-01-28 一种基于深度学习和植物分类学的植物识别方法

Publications (2)

Publication Number Publication Date
CN109871885A CN109871885A (zh) 2019-06-11
CN109871885B true CN109871885B (zh) 2023-08-04

Family

ID=66918162

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910079097.2A Active CN109871885B (zh) 2019-01-28 2019-01-28 一种基于深度学习和植物分类学的植物识别方法

Country Status (1)

Country Link
CN (1) CN109871885B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110619349A (zh) * 2019-08-12 2019-12-27 深圳市识农智能科技有限公司 植物图像分类方法及装置
CN110852341A (zh) * 2019-09-23 2020-02-28 平安科技(深圳)有限公司 基于深度学习的白术检测方法、及其相关设备
CN111274860B (zh) * 2019-11-08 2023-08-22 杭州安脉盛智能技术有限公司 一种基于机器视觉的在线自动烟叶等级分选的识别方法
CN111191741A (zh) * 2020-01-15 2020-05-22 中国地质调查局发展研究中心 一种岩石识别深度学习模型岩石分类约束继承性损失方法
CN111415368B (zh) * 2020-03-09 2022-03-04 武汉大学 一种基于深度学习的移动设备液滴滴速的快速测量方法
CN111784595B (zh) * 2020-06-10 2023-08-29 北京科技大学 一种基于历史记录的动态标签平滑加权损失方法及装置
CN113807133B (zh) * 2020-06-12 2023-09-01 广州极飞科技股份有限公司 植物生长区域的灌水状态的识别方法、装置和存储介质
CN112149682B (zh) * 2020-09-29 2023-08-15 青海大学 基于深度学习的悬钩子植物自动识别方法、存储介质和装置
CN112514779A (zh) * 2020-12-09 2021-03-19 广州大学华软软件学院 一种智能灌溉系统
CN113159075A (zh) * 2021-05-10 2021-07-23 北京虫警科技有限公司 昆虫的识别方法和装置
CN113344415A (zh) * 2021-06-23 2021-09-03 中国平安财产保险股份有限公司 基于深度神经网络的业务分配方法、装置、设备及介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107480611A (zh) * 2017-07-31 2017-12-15 浙江大学 一种基于深度学习卷积神经网络的裂缝识别方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10902252B2 (en) * 2017-07-17 2021-01-26 Open Text Corporation Systems and methods for image based content capture and extraction utilizing deep learning neural network and bounding box detection training techniques

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107480611A (zh) * 2017-07-31 2017-12-15 浙江大学 一种基于深度学习卷积神经网络的裂缝识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于科优先策略的植物图像识别;曹香滢等;《计算机应用》;20181110(第11期);第2节 *

Also Published As

Publication number Publication date
CN109871885A (zh) 2019-06-11

Similar Documents

Publication Publication Date Title
CN109871885B (zh) 一种基于深度学习和植物分类学的植物识别方法
Li et al. Unsupervised representation learning of image-based plant disease with deep convolutional generative adversarial networks
CN107194418B (zh) 一种基于对抗特征学习的水稻蚜虫检测方法
CN109635108B (zh) 一种基于人机交互的远程监督实体关系抽取方法
CN107368831A (zh) 一种自然场景图像中的英文文字和数字识别方法
WO2020164278A1 (zh) 一种图像处理方法、装置、电子设备和可读存储介质
CN111444367B (zh) 一种基于全局与局部注意力机制的图像标题生成方法
CN110135461B (zh) 基于分层注意感知深度度量学习的情感图像检索的方法
CN112231477A (zh) 一种基于改进胶囊网络的文本分类方法
Zhang et al. Automatic discrimination of text and non-text natural images
CN105930792A (zh) 一种基于视频局部特征字典的人体动作分类方法
WO2021128704A1 (zh) 一种基于分类效用的开集分类方法
CN107977670A (zh) 决策树和贝叶斯算法的突发事件分类分级方法、装置及系统
CN112307130B (zh) 一种文档级远程监督关系抽取方法及系统
CN108829810A (zh) 面向健康舆情的文本分类方法
CN109344720B (zh) 一种基于自适应特征选择的情感状态检测方法
CN110263174A (zh) —基于焦点关注的主题类别分析方法
CN114416979A (zh) 一种文本查询方法、设备和存储介质
Irie et al. A bayesian approach to multimodal visual dictionary learning
CN112434686B (zh) 针对ocr图片的端到端含错文本分类识别仪
CN112069307B (zh) 一种法律法条引用信息抽取系统
CN112541083A (zh) 一种基于主动学习混合神经网络的文本分类方法
CN112052869A (zh) 一种用户心理状态识别方法及系统
CN111460817A (zh) 一种刑事法律文书相关法条的推荐方法和系统
CN115357718B (zh) 主题集成服务重复材料发现方法、系统、设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant