CN112633257A - 基于改良卷积神经网络的马铃薯病害识别方法 - Google Patents
基于改良卷积神经网络的马铃薯病害识别方法 Download PDFInfo
- Publication number
- CN112633257A CN112633257A CN202110119316.2A CN202110119316A CN112633257A CN 112633257 A CN112633257 A CN 112633257A CN 202110119316 A CN202110119316 A CN 202110119316A CN 112633257 A CN112633257 A CN 112633257A
- Authority
- CN
- China
- Prior art keywords
- network
- convolutional neural
- cnn
- neural network
- potato
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013527 convolutional neural network Methods 0.000 title claims abstract description 64
- 238000000034 method Methods 0.000 title claims abstract description 43
- 244000061456 Solanum tuberosum Species 0.000 title claims abstract description 38
- 235000002595 Solanum tuberosum Nutrition 0.000 title claims abstract description 38
- 201000010099 disease Diseases 0.000 title claims abstract description 33
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 title claims abstract description 33
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 20
- 230000008569 process Effects 0.000 claims abstract description 14
- 230000003287 optical effect Effects 0.000 claims abstract description 11
- 235000012015 potatoes Nutrition 0.000 claims abstract description 5
- 238000012549 training Methods 0.000 claims description 30
- 230000003902 lesion Effects 0.000 claims description 14
- 238000007781 pre-processing Methods 0.000 claims description 10
- 238000012545 processing Methods 0.000 claims description 8
- 238000002372 labelling Methods 0.000 claims description 4
- 238000012216 screening Methods 0.000 claims description 2
- 206010039509 Scab Diseases 0.000 claims 1
- 238000001514 detection method Methods 0.000 abstract description 18
- 238000010801 machine learning Methods 0.000 abstract description 4
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 231100000915 pathological change Toxicity 0.000 abstract 2
- 230000036285 pathological change Effects 0.000 abstract 2
- 235000007688 Lycopersicon esculentum Nutrition 0.000 abstract 1
- 240000003768 Solanum lycopersicum Species 0.000 abstract 1
- 230000006870 function Effects 0.000 description 31
- 238000000605 extraction Methods 0.000 description 13
- 230000035945 sensitivity Effects 0.000 description 7
- 238000012360 testing method Methods 0.000 description 7
- 238000013528 artificial neural network Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 5
- 230000014509 gene expression Effects 0.000 description 5
- 238000010606 normalization Methods 0.000 description 5
- 239000013598 vector Substances 0.000 description 5
- 230000004913 activation Effects 0.000 description 4
- 238000011160 research Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000011176 pooling Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 239000013589 supplement Substances 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- HPTJABJPZMULFH-UHFFFAOYSA-N 12-[(Cyclohexylcarbamoyl)amino]dodecanoic acid Chemical compound OC(=O)CCCCCCCCCCCNC(=O)NC1CCCCC1 HPTJABJPZMULFH-UHFFFAOYSA-N 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 241000233622 Phytophthora infestans Species 0.000 description 1
- 241000233647 Phytophthora nicotianae var. parasitica Species 0.000 description 1
- 241000607479 Yersinia pestis Species 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 238000011897 real-time detection Methods 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
- G06F18/24137—Distances to cluster centroïds
- G06F18/2414—Smoothing the distance, e.g. radial basis function networks [RBFN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/02—Agriculture; Fishing; Forestry; Mining
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Business, Economics & Management (AREA)
- Animal Husbandry (AREA)
- Agronomy & Crop Science (AREA)
- Marine Sciences & Fisheries (AREA)
- Mining & Mineral Resources (AREA)
- Multimedia (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了基于改良卷积神经网络的马铃薯病害识别方法,涉及人工智能机器学习领域。本发明达到对不同种类、大小、生长环境的马铃薯的病变情况的精确识别,本发明的目的是,改进Faster R‑CNN算法,在原有网络结构基础上,进一步提升检测精确率与检测效率,不仅能处理具有复杂背景的小番茄病变图片,也能在采集光学图像中有效降低噪声影响,在数据采集过程中,本方法对图像进行了预处理操作,包括图像标注以及数据扩充,提升数据集的特征多样性,完善了图片质量,防止在模型训练过程中出现过拟合现象,充分发挥了深度卷积网络的优势,拥有操作简单,鲁棒性较佳,检测精度高,遗漏率低的优点。
Description
技术领域
本发明涉及人工智能机器学习领域,具体为基于改良卷积神经网络的马铃薯病害识别方法。
背景技术
卷积神经网络(CNN)是目前深度学习技术领域中非常具有代表性的神经网络之一,在图像分析和处理领域取得了众多突破性的进展,基于卷积神经网络取得了很多成就,包括图像特征提取分类、场景识别等,卷积神经网络相较于传统的图像处理算法的优点之一在于避免了对图像复杂的前期预处理过程,尤其是人工参与图像预处理过程,CNN 被证明比传统机器学习方法有着更优良的表现,在此基础上,引入Faster R-CNN 算法并对其进行改进,该算法是区域卷积神经网络的经典模型之一,于2015 年提出,是一种强大的 two-stage 目标检测与分类算法,能够利用共享卷积层将区域建议网络(Region proposalnetwork,RPN)与 Faster R-CNN 结构形成 1 个网络,增加了候选框生成速度和检测效率。本发明选取多种预训练的卷积神经网络结构作为 Faster R-CNN 的特征提取网络,通过深度学习的方式,精确识别预处理后的马铃薯图像的病变部位,病变种类,极大提高了马铃薯的病变检测效率。
发明内容
本发明的目的在于:为了解决未改进的Faster R- CNN算法检测效率不高的问题,提供基于改良卷积神经网络的马铃薯病害识别方法。
为实现上述目的,本发明提供如下技术方案:基于改良卷积神经网络的马铃薯病害识别方法, 包括以下步骤:
步骤一:获取数据集,在马铃薯的田间养殖数据集中筛选出各类常见病变样本,通过光学图像采集设备,采集不同天气环境下的各类病害的光学图像,保证了数据样本的权威性和代表性;
步骤二:数据预处理,包括对光学图像进行人工标注以及数据增强,由于卷积神经网络在训练过程中需要大量数据样本,否则无法精确提取数据图片的特征,预处理操作可以有效提升数据集的特征多样性,完善图片质量,而卷积神经网络需要进行有监督的训练,图像本身没有标签和语义,必须进行标注才能用于训练。
步骤三:引入改进后的Faster R- CNN算法,通过加入批标准化处理提高模型收敛速度,引入中间代价函数构建混合代价函数提高相似病斑的识别率方式改进 Faster R-CNN。
优选地,所述步骤一中光学图像采集设备为Canon EOS 5D Mark II,采集方式为人工拍摄。
优选地,所述步骤二中具体操作方式按照PASCAL VOC2007 标准,利用 Labelme标注工具标注健康和病斑区域的病害类型,之后将其存储。
优选地,所述步骤三中将改进后的Faster R- CNN算法引入,需要训练好的RPN(Region proposal network),产生proposal,由imageNet预训练模型初始化,将RPN生成的propasal作为Faster R- CNN网络的输入,再训练RPN网络,用训练的Faster R-CNN网络初始化RPN网络,固定共享卷积层,获得优质训练模型。
优选地,所述步骤三引入Faster R- CNN算法之后即可对马铃薯病变识别,识别过程为:先单独训练出RPN识别马铃薯病变部位,之后将其与FasterR-CNN网络结合,再将Faster R-CNN和对抗遮挡网络结合,得出了FasterR-CNN网络,完成了端到端的训练对马铃薯病变识别网络。
与现有技术相比,本发明的有益效果是:
1、本发明在对Faster R- CNN算法进行改进之后,外在表现在:综合考虑到马铃薯病变部位的粗粒度特征,细粒度特征,以及在大量特征样本中提取出有效特征,达到比原算法更高的检测率,构建Faster R-CNN模型后,对其进行改良,在多个测试特征提取网络上选择最优解,保证了该网络模型的检测速度与效率,同时在本研究思路的基础上,也可为后续针对连续帧视频的大田范围内的病害巡视监测奠定依据。
附图说明
图1为本发明的马铃薯病害识别流程图;
图2为本发明的混合代价函数训练方式图;
图3为本发明的Faster R-CNN网络结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“设置”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。下面根据本发明的整体结构,对其实施例进行说明。
本发明对Faster R-CNN算法的改良方法是:增加网络收敛速度,提升测试模型的泛化能力,在神经网络结构的卷积层中加入标准化处理,使用混合代价函数计算损失值,其中包括:
1、批量标准化处理。为了提高网络的收敛速度,避免梯度爆炸现象,减轻过拟合现象,在输入每一层卷积层单元之前,加入批量标准 实现了均值为0、方差为1的输入数据的标准正态分布,加快了网络的收敛速度,提高了网络的泛化能力,样本的归一化计算通过图像中像素总数的均值μ和σ方差来计算,表达式如下(1),(2)所示:
xi表示图像数据样本中第i个像素点的值,n表示图像数据样本像素点的总数,归一化方程如下(3)所示:
x表示数据样本中第i个像素归一化之后的像素值,ε为大于零的极小正数;
2、构建混合成本函数(C-S函数)。在马铃薯病害图像样本中,由于不同种类的马铃薯生长特性不同,不同病害在马铃薯叶片、茎上的表现不一致,病害影像也就无法精确识别,将中心代价函数(center loss)引入模型,并softmax loss函数相结合建立混合损失函数,可以增加类间特征的差异,增强了类内特征的凝聚力,使网络能提取出高区分点的特征,LC函数的表达式如下(4)所示:
N是训练中的小批量(mini-batch)数,f(xi)是RPN生成的第xi类第i个兴趣区域的特征,Cyi是第yi类特征的中心,函数(4)表明,在训练时,Lc的值不断减小,f(xi)逐渐逼近第Cyi类特征的中心,且随着迭代训练的增加,每类特征的分布都会聚集到其对应的特征中心,以实现类内特征的内聚性和类间的最大差异化,此时,混合代价函数(C-S函数)的表达式如下(5)所示:
LS表示 Softmax Loss 函数,LC表示中心代价函数,因为LS的值远小于LC的值,需要引入参数 λ 维持两个函数值平衡,λ 表示中心代价函数的权重,若值较小,中心损失项对网络几乎无影响,而值较大会导致网络出现不收敛的状况,在多次试验后得到经验值为0.02,混合代价函数的训练方式如图2。
在网络模型进行迭代时,(4)中的 Cyi更新依据为每个mini-batch中某一类别中所有个体的特征向量平均值,f(xi)的梯度及其特征中心Cyi的更新方式如下:
若δ(·)里的条件成立,δ(·)的值等于1;相反,若δ(·)的值为 0;第2行式中参数p 为更新迭代次数,α为控制学习率的参数,可以防止小部分标记有误的样本产生的波动,取值范围是0~1。
3、选择特征提取网络结构。从中国科学数据网,农田实地采集两部分获取测试数据集,挑选由害虫,真菌引发的多种常见马铃薯病害图像,分别使用VGG16,AlexNet,ResNet,GoogleNet这4种预训练卷积神经网络作为Faster R-CNN的卷积层部的特征提取网络,测试结果如下表所示:
由表可知,在Faster R-CNN 架构下的 VGG16、AlexNet、ResNet 和 GoogleNet4种特征提取网络的综合性能,VGG16的平均正确率最高,为98.21%,AlexNet的单张图片检测时间最短,为0.24秒,在 4 种不同特征提取网络下,利用 SGD 指数衰减法优化模型训练过程并进行测试,综合对比分析其识别性能和检测速度,不同的特征提取网络具有不同的结构和参数,其特征提取能力有所差异,AlexNet结构只有3个全连接层和5个卷积层且在第一层采用了 11×11 的大尺寸卷积核,当在底层设置大尺寸卷积核时仅对粗粒度特征响应敏感,而不趋向于响应细粒度特征,VGG16 中包含了 13 个卷积层和 3 个全连接层,其最大的特点是它采用了相对较小的卷积核尺寸(3×3)和最大池化尺寸(2×2),在保证感受野的同时能够提取出输入领域内更多非常细小的特征可以拟合更加复杂的特征,因此具有较高的精度,ResNet50随着网络结构的增加,其深度和参数也不断增多,会占用更多的存储资源和计算单元,神经网络在反向传播过程中造成梯度衰减,导致权重调整失效、训练退化,模型的实时性和识别性能降低,因此在本研究中,VGG16 特征提取网络更适合用于马铃薯病害检测的研究。
根据上述结果推导的实施过程:首先,根据改进后的Faster R-CNN目标检测算法,选取VGG16作为特征提取网络构建模型,包含input层,full connection层,conv层,Relu层,pooling层,Softmax层,其中:
input层:由采集设备所拍摄的马铃薯病变光学图像;
conv层:构成神经网络中的卷积层,对input层进行卷积操作;
relu层:神经网络中的一个激活函数,常见激活函数还包括tanh和sigmoid函数,其中引入relu函数的原因是:一,采用sigmoid等函数,算激活函数时(指数运算),计算量大,反向传播求误差梯度时,求导涉及除法,计算量相对大,而采用Relu激活函数,整个过程的计算量节省很多,二,对于深层网络,sigmoid函数反向传播时,很容易就会出现梯度消失的情况(在sigmoid接近饱和区时,变换太缓慢,导数趋于0,这种情况会造成信息丢失,从而无法完成深层网络的训练,三,ReLu会使一部分神经元的输出为0,这样就造成了网络的稀疏性,并且减少了参数的相互依存关系,缓解了过拟合问题的发生;
pooling层:图像在conv层进行卷积之后会得到维度很大的特征,pooling层将特征切成几个区域,取其最大值或平均值,得到新的、维度较小的特征;
Full connection层:这也是一种卷积层,它的参数基本和卷积层的参数一样,只是它的卷积核大小和原数据大小一致;
Softmax层:可以理解为归一化,如目前图片分类有10种,那经过 Softmax 层的输出就变成一个10维的向量,向量中的第一个值就是当前图片属于第一类的概率值,向量中的第二个值就是当前图片属于第二类的概率值,这一百维的向量之和为1,Softmax的输入层和输出层的维度是一样的,如果不一样,就在输入至 Softmax 层之前通过一层全Fullconnection层,其中Softmax层公式如下:
确定马铃薯病害种类,选择马铃薯早疫病,马铃薯晚疫病,马铃薯软腐病,马铃薯黑胫病作为训练集样本。
其次,利用采集设备,分别在各类天气条件下,拍摄4种病害表现的光学图像,拍摄背景为马铃薯实际生长环境,保证图像具有更大的代表性。
对数据集进行对比确认,使用标注工具对收集的病害图像做预处理操作,包括数据标注以及数据增强,并调整图像尺寸,使所有图像变为512*512*3。
本发明使用opencv中的cv2.resize()方法对图像做归一化操作。
对样本进行扩充,对35%图像进行空间变换操作,随机旋转(幅度范围选用0-60度)图像、平移(幅度比例为0-0.3)、缩放(幅度比例0-0.2)。
为了模拟摄像头在图片拍摄过程中可能产生的噪声,本发明对4种病害的30%的原始图像添加了方差为0.03的高斯噪声,作为数据补充。
将50%的原始图像对比度减小为原始图像的0.7倍,作为数据补充。
以上三种数据扩充方式均采用计算机视觉库opencv进行操作完成。
图像信息采集设备:针对图像拍摄和传输的便利性以及保证图片取样数据的完整性,本发明图像采集设备选用的是Canon EOS 5D Mark II ,它使用2110万有效像素的全画幅CMOS图像感应器,ISO感光度标准设置范围达到ISO 100至ISO 6400,并可以扩展到最低ISO 50和最高ISO 25600;通过HDMI接口,可以将相机连接高清电视以及电脑输出显示照片。相机的ISO感光度标准设置范围从ISO 100至ISO 6400,当使用感光度扩展功能时,最低达到ISO 50,而最高可以设置为ISO 12800或ISO 25600,相机在高ISO感光度下,可以选择降噪设置,分为标准、弱、强和关闭四级,此降噪功能可以在高速连拍时使用,而且连拍性能几乎不受影响(除“强”),保证了图片取样的完整性。
在图片采集并预处理之后,利用改良后的FasterR-CNN网络模型对样本进行训练,测试环境为:CPU:Intel Core i5 9400,GPU:Nvidia RTX 2060,操作系统:windows10专业版,机器学习框架:pytorch-gpu。
以VGG16作为特征提取网络,对模型进行训练,在FasterR-CNN中,即使对1000个区域提案进行分类的计算是共享的,但生成区域提案的算法部分与执行图像分类的部分不共享任何计算,在被称为FasterR-CNN的后续工作中,主要的见解是这两个部分-计算区域提案和图像分类-可以使用相同的特征图,从而分担计算负荷,利用卷积神经网络生成图像特征图,同时用于训练区域提案网络和图像分类器,由于这种共享计算,对象检测的速度有了显著的提高。
接着使用Pytorch-gpu进行目标检测,在Nvidia CUDA的加速下,把网络,损失函数转换到GPU上从而大幅提升训练效率。
接着,将改进之后的Faster R-CNN 算法与为改进的Faster R-CNN 算法以及当前流行的SSD算法进行对比测试。
特征提取网络均采用VGG16,测试集一致并预处理完毕,训练方式为随机梯度下降法(SGD),三种训练方法的最大迭代次数为5000,具有相同的初始学习率和dropout值,对比结果如下表所示:
与原Faster R-CNN模型相比,改进后的Faster R-CNN模型以 VGG16 特征提取网络,将单幅图像的检测时间减少了0.16秒,训练后对具各种病害图像识别的平均精度为0.93,平均召回率0.95,平均准确率达到98.21%,单张图像检测耗时为 0.26s。
本发明中,无论是在训练过程中还是在测试过程中,都加入批量归一化处理层后都能提高模型的数据处理速度,将中间损失函数引入到Faster R-CNN模型中,构造混合损失函数,使模型解决了类内差距问题大类别、小间隙的图像数据集具有更强的识别和分类性能,因此与未修改的Faster R-CNN模型相比,平均准确率更高增加了10%,与主流的目标检测算法SSD相比,该方法的准确率提高了0.053,单幅图像的检测时间减少了0.02 s,改进后的 Faster R-CNN 模型采用区域建议网络 RPN 代替原来的比较费时的 selectivesearch 算法,快速准确地找到2000多帧由RPN生成的图像兴趣区域,极大提高了目标检测的准确性和检测速度,本次对比实验表明改进后的Faster R-CNN与SSD相比,Faster R-CNN模型更适合马铃薯病害的检测,兼具粗粒度和细粒度的特点,能够满足实时检测的需求,在复杂背景下完成马铃薯病变区域识别。
尽管本文所提方法有着较好的性能,但仍存在本次试验所用数据量有限的问题,数据集对卷积神经网络来说并不是一个特别大的数据量,因此在今后将扩大图像数据集,建立代表性更大、样本特征更丰富的马铃薯病害数据库。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
Claims (5)
1.基于改良卷积神经网络的马铃薯病害识别方法,其特征在于,包括以下步骤:
步骤一:获取数据集,在马铃薯的田间养殖数据集中筛选出各类常见病变样本,通过光学图像采集设备,采集不同天气环境下的各类病害的光学图像,保证了数据样本的权威性和代表性:
步骤二:数据预处理,包括对光学图像进行人工标注以及数据增强,由于卷积神经网络在训练过程中需要大量数据样本,否则无法精确提取数据图片的特征:
预处理操作可以有效提升数据集的特征多样性,完善图片质量,而卷积神经网络需要进行有监督的训练,图像本身没有标签和语义,数据预处理可以提高训练效率:
步骤三:引入改进后的Faster R- CNN算法,通过加入批标准化处理提高模型收敛速度,引入中间代价函数构建混合代价函数提高相似病斑的识别率方式改进 Faster R-CNN。
2.根据权利要求1所述的基于改良卷积神经网络的马铃薯病害识别方法,其特征在于:所述步骤一中光学图像采集设备为Canon EOS 5D Mark II,采集方式为人工拍摄。
3.根据权利要求1所述的基于改良卷积神经网络的马铃薯病害识别方法,其特征在于:所述步骤二中具体操作方式按照PASCAL VOC2007 标准,利用 Labelme 标注工具标注健康和病斑区域的病害类型,之后将其存储。
4.根据权利要求1所述的基于改良卷积神经网络的马铃薯病害识别方法,其特征在于:所述步骤三中将改进后的Faster R- CNN算法引入,需要训练好的RPN(Region proposalnetwork),产生proposal,由imageNet预训练模型初始化,将RPN生成的propasal作为Faster R- CNN网络的输入,再训练RPN网络,用训练的Faster R-CNN网络初始化RPN网络,固定共享卷积层,获得优质训练模型。
5.根据权利要求1所述的基于改良卷积神经网络的马铃薯病害识别方法,其特征在于:所述步骤三引入Faster R- CNN算法之后即可对马铃薯病变识别,识别过程为:先单独训练出RPN识别马铃薯病变部位,之后将其与FasterR-CNN网络结合,再将Faster R-CNN和对抗遮挡网络结合,得出了FasterR-CNN网络,完成了端到端的训练对马铃薯病变识别网络。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110119316.2A CN112633257A (zh) | 2021-01-28 | 2021-01-28 | 基于改良卷积神经网络的马铃薯病害识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110119316.2A CN112633257A (zh) | 2021-01-28 | 2021-01-28 | 基于改良卷积神经网络的马铃薯病害识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112633257A true CN112633257A (zh) | 2021-04-09 |
Family
ID=75295122
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110119316.2A Pending CN112633257A (zh) | 2021-01-28 | 2021-01-28 | 基于改良卷积神经网络的马铃薯病害识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112633257A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113157889A (zh) * | 2021-04-21 | 2021-07-23 | 韶鼎人工智能科技有限公司 | 一种基于主题损失的视觉问答模型构建方法 |
CN113420794A (zh) * | 2021-06-04 | 2021-09-21 | 中南民族大学 | 一种基于深度学习的二值化Faster R-CNN柑橘病虫害识别方法 |
CN114240686A (zh) * | 2022-02-24 | 2022-03-25 | 深圳市旗扬特种装备技术工程有限公司 | 智慧渔业监测系统 |
CN114677673A (zh) * | 2022-03-30 | 2022-06-28 | 中国农业科学院农业信息研究所 | 一种基于改进yolo v5网络模型的马铃薯病害识别方法 |
CN115410196A (zh) * | 2022-10-31 | 2022-11-29 | 南昌理工学院 | 一种基于复杂背景下的小目标识别系统 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN209002058U (zh) * | 2018-09-14 | 2019-06-18 | 华东交通大学 | 一种基于农业监测的防尘摄像头 |
-
2021
- 2021-01-28 CN CN202110119316.2A patent/CN112633257A/zh active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN209002058U (zh) * | 2018-09-14 | 2019-06-18 | 华东交通大学 | 一种基于农业监测的防尘摄像头 |
Non-Patent Citations (4)
Title |
---|
付陈平: "基于遮挡网络和RPN的双通道目标检测研究", 《中国优秀博硕士学位论文全文数据库(硕士)工程科技Ⅱ辑》 * |
付陈平: "基于遮挡网络和RPN的双通道目标检测研究", 《中国优秀博硕士学位论文全文数据库(硕士)工程科技Ⅱ辑》, no. 1, 15 January 2020 (2020-01-15), pages 1 * |
樊湘鹏 等: "基于改进区域卷积神经网络的田间玉米叶部病害识别", 《华南农业大学学报》 * |
樊湘鹏 等: "基于改进区域卷积神经网络的田间玉米叶部病害识别", 《华南农业大学学报》, no. 6, 19 October 2020 (2020-10-19), pages 1 - 1 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113157889A (zh) * | 2021-04-21 | 2021-07-23 | 韶鼎人工智能科技有限公司 | 一种基于主题损失的视觉问答模型构建方法 |
CN113420794A (zh) * | 2021-06-04 | 2021-09-21 | 中南民族大学 | 一种基于深度学习的二值化Faster R-CNN柑橘病虫害识别方法 |
CN114240686A (zh) * | 2022-02-24 | 2022-03-25 | 深圳市旗扬特种装备技术工程有限公司 | 智慧渔业监测系统 |
CN114240686B (zh) * | 2022-02-24 | 2022-06-03 | 深圳市旗扬特种装备技术工程有限公司 | 智慧渔业监测系统 |
CN114677673A (zh) * | 2022-03-30 | 2022-06-28 | 中国农业科学院农业信息研究所 | 一种基于改进yolo v5网络模型的马铃薯病害识别方法 |
CN115410196A (zh) * | 2022-10-31 | 2022-11-29 | 南昌理工学院 | 一种基于复杂背景下的小目标识别系统 |
CN115410196B (zh) * | 2022-10-31 | 2023-02-07 | 南昌理工学院 | 一种基于复杂背景下的小目标识别系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11195051B2 (en) | Method for person re-identification based on deep model with multi-loss fusion training strategy | |
CN111553193B (zh) | 一种基于轻量级深层神经网络的视觉slam闭环检测方法 | |
WO2022160771A1 (zh) | 基于自适应多尺度特征提取模型的高光谱图像分类方法 | |
CN112633257A (zh) | 基于改良卷积神经网络的马铃薯病害识别方法 | |
CN107316307B (zh) | 一种基于深度卷积神经网络的中医舌图像自动分割方法 | |
CN111191660B (zh) | 一种基于多通道协同胶囊网络的结肠癌病理学图像分类方法 | |
CN110059586B (zh) | 一种基于空洞残差注意力结构的虹膜定位分割系统 | |
CN111476283A (zh) | 基于迁移学习的青光眼眼底图像识别方法 | |
CN110969191B (zh) | 基于相似性保持度量学习方法的青光眼患病概率预测方法 | |
CN110309868A (zh) | 结合无监督学习的高光谱图像分类方法 | |
CN112215119B (zh) | 一种基于超分辨率重建的小目标识别方法、装置及介质 | |
CN111400536B (zh) | 一种基于轻量化深度神经网络的低成本番茄叶片病害识别方法 | |
CN107909008A (zh) | 基于多通道卷积神经网络和粒子滤波的视频目标跟踪方法 | |
CN112150493A (zh) | 一种基于语义指导的自然场景下屏幕区域检测方法 | |
CN114998220B (zh) | 一种基于改进的Tiny-YOLO v4自然环境下舌像检测定位方法 | |
CN113657326A (zh) | 一种基于多尺度融合模块和特征增强的杂草检测方法 | |
CN113657294A (zh) | 一种基于计算机视觉的作物病虫害检测方法及系统 | |
CN110533100A (zh) | 一种基于机器学习进行cme检测和跟踪的方法 | |
CN110991349A (zh) | 一种基于度量学习的轻量级车辆属性识别方法 | |
CN111340019A (zh) | 基于Faster R-CNN的粮仓害虫检测方法 | |
CN110363218A (zh) | 一种胚胎无创评估方法及装置 | |
CN110717451A (zh) | 一种基于深度学习的药用植物叶部病害图像识别方法 | |
CN110096976A (zh) | 基于稀疏迁移网络的人体行为微多普勒分类方法 | |
CN117152503A (zh) | 一种基于伪标签不确定性感知的遥感图像跨域小样本分类方法 | |
CN114120359A (zh) | 一种基于堆叠沙漏网络的群养猪体尺测量方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210409 |
|
RJ01 | Rejection of invention patent application after publication |