CN109871885B

CN109871885B - 一种基于深度学习和植物分类学的植物识别方法

Info

Publication number: CN109871885B
Application number: CN201910079097.2A
Authority: CN
Inventors: 朱悠翔; 业宁; 李若尘; 张政; 王香
Original assignee: Nanjing Forestry University
Current assignee: Nanjing Forestry University
Priority date: 2019-01-28
Filing date: 2019-01-28
Publication date: 2023-08-04
Anticipated expiration: 2039-01-28
Also published as: CN109871885A

Abstract

本发明公开了一种基于深度学习和植物分类学的植物识别方法。将样本植物图像进行科、属、种的标记；将样本植物图像输入深度卷积神经网络中进行训练。将损失函数设定为科、属、种标签的交叉熵损失的加权和，通过随机梯度下降算法更新神经网络的权值，待该深度卷积神经网络收敛后结束训练并固定各层权值不再改变得到训练好的深度卷积神经网络。本发明通过将深度学习与植物分类学结合，引入科、属标签作为学习目标，提高了识别正确率。

Description

一种基于深度学习和植物分类学的植物识别方法

技术领域

本发明涉及植物识别技术领域，具体为一种基于深度学习和植物分类学的植物识别方法。

背景技术

图像识别领域目前一般来说有两类方法，一类是基于传统机器学习的识别方法，其特点是特征提取方式一般为人工定义；另一类是基于深度学习的方法，其特点是特征依靠深度卷积神经网络自动提取。然而，前者往往会引入人工偏差，后者会有一定程度的过拟合问题，影响识别性能。

现有专利CN201810030151.X，公开了一种植物种类识别方法以及装置，其通过获取待识别植物的花、叶以及整体植株三个部位中的至少两个部位的图片作为待识别图片；并基于预先保存的多个识别模型分别识别所述待识别图片中的每张图片，得到每个部位的预测识别结果；然后将所有的预测识别结果进行融合，得到所述待识别植物的种类。本方法根据叶、花和植株整体信息，融合利用整体和局部信息，对植物做精细的识别分析，从而得出准确的植物分类结果，可以让算法更具有鲁棒性，用户在使用该算法时，能够较以往更好地实现植物分类。该专利使用了跨媒体方法进行识别。

现有专利CN201611206559.5，公开了一种基于深度学习的跨媒体中草药植物图像检索方法。其步骤如下：1)通过OCR，文本结构化处理，从《植物分类学》等书籍中抽取植物分类描述文字2)使用中文分词工具，对所有植物分类描述文字进行包括分词和去停用词在内的预处理；3)用word2vec算法根据描述文本生成词向量；4)使用Fisher Vector将描述文本进行编码；5)利用卷积神经网络在图片集上进行训练，使网络结构收敛到最优状态；6)提取卷积神经网络的倒数第二层全连接层输出作为图片特征向量；7)融合文本特征与图片特征；8)使用线性核SVM分类器进行模型训练；9)用户检索时可输入图像、描述植物文本，之后利用4)、6)、7)、8)步得到最终的图片检索结果。该专利使用了跨媒体方法。

发明内容

发明目的：为提高植物识别的准确率，缓解深度卷积神经网络的过拟合问题，本发明提供一种基于深度学习和植物分类学的植物识别方法。

技术方案：为实现上述目的，本发明采用的技术方案为：

一种基于深度学习和植物分类学的植物识别方法，包括以下步骤：

步骤1，收集样本植物图像和待识别植物图像，将样本植物图像进行科、属、种的标记。

步骤2，将样本植物图像输入深度卷积神经网络中进行训练，所述深度卷积神经网络包括输入层、卷积层、池化层、全连接层和输出层，其中，输入层接收输入图像，卷积层和池化层用于图像特征提取，全连接层用于特征分类，输出层用于输出结果。输出层同时具有3个输出值，分别为该植物的科、属、种标记。

所述深度卷积神经网络的损失函数为植物科、属、种的交叉熵损失的加权和，即为：

l＝al_f+bl_g+cl_s

其中，l表示损失函数，l_f、l_g、l_s分别为科、属、种的交叉熵损失函数，a、b、c分别为科、属、种损失函数的权重，f、g、s分别表示科、属、种； l_i为分别对于科、属、种的交叉熵损失函数。其中，y_i表示真实概率分布，/>表示预测概率分布。n表示分类数，相应的，y_ij表示第j个分类的真实概率，/>表示第j个分类的预测概率。给定输入图片X，预测权值θ_i，则对第j个分类预测权值为θ_ij，则

通过随机梯度下降算法更新深度卷积神经网络的各层权值。待训练损失函数小于一定损失阀值(即收敛)时，停止训练并固定各层权值不再改变，得到训练好的深度卷积神经网络。

所述随机梯度下降算法目标为：

min l_i

求解方法为，对于共m张训练图片，从1到m不断重复执行下式直到收敛：

θ_i：＝θ_i-αg_t

其中，g_t就是所谓的随机梯度，它满足表示l_i对于θ_i的偏导数，α是下降系数，对于每一次更新参数，不必遍历所有的训练集合，整体趋势是走向最小。

步骤3，将待识别植物图像输入到步骤2已训练好的深度卷积神经网络中，依据输出标记得到最终识别结果。

优选的：将收集的样本植物图像和待识别植物图像输入深度卷积神经网络训练前，应先进行数据增强处理，数据增强处理至少包括旋转、裁剪、放大。旋转是指将植物图像每旋转n度后进行一次采样，0＜n＜360。裁剪是指多次随机多次裁剪植物图像中的一部分后进行采样，应保证裁剪后图像面积不小于原始图像的二分之一。放大是指多次随机将图像中的一部分放大后再进行采样。

优选的：所述深度卷积神经网络中输入层、卷积层、池化层、全连接层、输出层的总层数应在10层以上。

优选的：训练过程包括前向传播和反向传播，在反向传播时，根据预先设定的学习速率更新网络的权值。

优选的：所述损失阀值一般为0.00001。

本发明相比现有技术，具有以下有益效果：

本发明依据现代植物分类学，通过引入科、属标签和种标签一起作为监督学习的目标，即将植物科、属、种的交叉熵损失的加权和作为深度卷积神经网络的损失函数。以此损失函数训练有效缓解了深度卷积神经网络的过拟合问题，提高了识别正确率。

附图说明

图1为本发明基于深度学习和植物分类学的植物识别方法的训练过程和系统建立过程。

图2为本发明基于深度学习和植物分类学的植物识别方法的识别过程。

图3为深度卷积神经网络模型的示意图。

具体实施方式

下面结合附图和具体实施例，进一步阐明本发明，应理解这些实例仅用于说明本发明而不用于限制本发明的范围，在阅读了本发明之后，本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。

步骤1，收集样本植物图像和待识别植物图像，收集方式可通过任何有摄像头的设备拍摄取得。收集完成后，建立植物图像数据库，根据植物分类学，对所收集到的样本植物图像进行科、属、种的标记，应确保每个物种的样本植物图像数量在100张以上，否则应补充收集。

将收集的样本植物图像和待识别植物图像输入深度卷积神经网络训练前，应先进行数据增强处理，数据增强处理至少包括旋转、裁剪、放大。旋转是指将植物图像每旋转n度后进行一次采样，0<n<360。裁剪是指多次随机多次裁剪植物图像中的一部分后进行采样，应保证裁剪后图像面积不小于原始图像的二分之一。放大是指多次随机将图像中的一部分放大后再进行采样。

步骤2，将样本植物图像输入深度卷积神经网络中进行训练，建立如图3所示的深度卷积神经网络模型，所述深度卷积神经网络包括输入层、卷积层、池化层、全连接层和输出层，第一层为输入层，紧接着为若干个卷积和池化层，之后为若干个全连接层，最后为输出层，所述深度卷积神经网络中输入层、卷积层、池化层、全连接层、输出层的总层数应在10层以上，其中，输入层接收输入图像，卷积层和池化层用于图像特征提取，全连接层用于特征分类，输出层用于输出结果。输出层同时具有3个输出值，分别为该植物的科、属、种标记。

l＝al_f+bl_g+cl_s

其中，l表示损失函数，l_f、l_g、l_s分别为科、属、种的交叉熵损失函数，a、b、c分别为科、属、种损失函数的权重，f、g、s分别表示科、属、种；为分别对于科、属、种的交叉熵损失函数。其中，y_i表示真实概率分布，/>表示预测概率分布。假设共有n个分类，相应的，y_ij表示第j个分类的真实概率，/>表示第j个分类的预测概率。给定输入图片X，预测权值θ_i，则对第j个分类预测权值为θ_ij，则

所述随机梯度下降算法目标为：

min l_i

θ_i：＝θ_i-αg_t

训练过程包括前向传播和反向传播，在反向传播时，通过梯度下降算法更新深度卷积神经网络的各层权值，即反向逐层减去交叉熵损失对于该层权值的偏导数与设定学习率的乘积。待训练损失函数小于一定损失阀值(一般为0.00001)时，停止训练并固定各层权值不再改变，得到训练好的深度卷积神经网络。该训练好的深度卷积神经网络及其权值即为所述基于深度学习和植物分类学的植物识别系统，其输入为待识别植物图像，输出为该图像中植物的科、属、种。

步骤3，将待识别植物图像输入到步骤2已训练好的深度卷积神经网络中，依据输出标记得到最终识别结果。识别的过程仅包括前向传播，输出为植物图像数据库中具有的植物种类中的科、属、种。

本发明通过将深度学习与植物分类学结合，引入科、属标签作为学习目标，提高了识别正确率。

以上所述仅是本发明的优选实施方式，应当指出：对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种基于深度学习和植物分类学的植物识别方法，其特征在于，包括以下步骤：

步骤1，收集样本植物图像和待识别植物图像，将样本植物图像进行科、属、种的标记；

步骤2，将样本植物图像输入深度卷积神经网络中进行训练，所述深度卷积神经网络包括输入层、卷积层、池化层、全连接层和输出层，其中，输入层接收输入图像，卷积层和池化层用于图像特征提取，全连接层用于特征分类，输出层用于输出结果；输出层同时具有3个输出值，分别为该植物的科、属、种标记；

；

其中，表示损失函数加权和，/>、/>、/>分别为科、属、种的交叉熵损失函数，/>、/>、/>分别为科、属、种损失函数的权重，/>分别表示科、属、种；

科、属、种的交叉熵损失函数为：

；

其中，，/>为分别对于科、属、种的交叉熵损失函数，/>表示分类数， />表示第j个分类的真实概率，/>表示第j个分类的预测概率，给定输入图片/>，预测权值/>，则对第j个分类预测权值为/>，则

；

训练过程包括前向传播和反向传播，在反向传播时，通过随机梯度下降算法更新深度卷积神经网络的各层权值，反向逐层减去交叉熵损失对于该层权值的偏导数与设定学习率的乘积，待训练损失函数小于一定损失阀值时，停止训练并固定各层权值不再改变，得到训练好的深度卷积神经网络；

随机梯度下降算法目标为：

；

求解方法为，对于共张训练图片，从1到/>不断重复执行下式直到收敛：

；

其中，表示随机梯度，满足/>，/>表示/>对于/>的偏导数，/>是下降系数；

2.根据权利要求1所述基于深度学习和植物分类学的植物识别方法，其特征在于：将收集的样本植物图像和待识别植物图像输入深度卷积神经网络训练前，先进行数据增强处理，数据增强处理至少包括旋转、裁剪、放大；旋转是指将植物图像每旋转n度后进行一次采样，0<n<360；裁剪是指多次随机多次裁剪植物图像中的一部分后进行采样，保证裁剪后图像面积不小于原始图像的二分之一；放大是指多次随机将图像中的一部分放大后再进行采样。

3.根据权利要求2所述基于深度学习和植物分类学的植物识别方法，其特征在于：所述深度卷积神经网络中输入层、卷积层、池化层、全连接层、输出层的总层数在10层以上。

4.根据权利要求3所述基于深度学习和植物分类学的植物识别方法，其特征在于：所述损失阀值为0.00001。