CN115410070A - 基于改进的Unet网络结构用于农作物病害情况训练和评估方法 - Google Patents
基于改进的Unet网络结构用于农作物病害情况训练和评估方法 Download PDFInfo
- Publication number
- CN115410070A CN115410070A CN202211355295.5A CN202211355295A CN115410070A CN 115410070 A CN115410070 A CN 115410070A CN 202211355295 A CN202211355295 A CN 202211355295A CN 115410070 A CN115410070 A CN 115410070A
- Authority
- CN
- China
- Prior art keywords
- convolution
- basic
- network
- crop
- operator
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 201000010099 disease Diseases 0.000 title claims abstract description 86
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 title claims abstract description 86
- 238000012549 training Methods 0.000 title claims abstract description 53
- 238000000034 method Methods 0.000 title claims abstract description 48
- 238000012360 testing method Methods 0.000 claims abstract description 24
- 230000006870 function Effects 0.000 claims description 27
- 238000000605 extraction Methods 0.000 claims description 26
- 230000011218 segmentation Effects 0.000 claims description 24
- 230000004927 fusion Effects 0.000 claims description 23
- 238000012937 correction Methods 0.000 claims description 17
- 230000004913 activation Effects 0.000 claims description 16
- 238000010606 normalization Methods 0.000 claims description 15
- 238000012545 processing Methods 0.000 claims description 14
- 238000012952 Resampling Methods 0.000 claims description 11
- 238000011176 pooling Methods 0.000 claims description 11
- 238000005070 sampling Methods 0.000 claims description 7
- 230000006872 improvement Effects 0.000 claims description 4
- 230000009191 jumping Effects 0.000 claims description 4
- 230000005540 biological transmission Effects 0.000 claims description 2
- 238000011156 evaluation Methods 0.000 abstract description 7
- 238000004458 analytical method Methods 0.000 abstract description 3
- 238000012271 agricultural production Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 12
- 238000003709 image segmentation Methods 0.000 description 8
- 238000012544 monitoring process Methods 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000006866 deterioration Effects 0.000 description 2
- 230000008034 disappearance Effects 0.000 description 2
- 239000006185 dispersion Substances 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000011835 investigation Methods 0.000 description 2
- 230000003902 lesion Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000002265 prevention Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- JEIPFZHSYJVQDO-UHFFFAOYSA-N iron(III) oxide Inorganic materials O=[Fe]O[Fe]=O JEIPFZHSYJVQDO-UHFFFAOYSA-N 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012821 model calculation Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/082—Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
- G06V10/806—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/52—Surveillance or monitoring of activities, e.g. for recognising suspicious objects
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于改进的Unet网络结构用于农作物病害情况训练和评估方法,属于图像识别领域与农业生产领域。本发明包括:采集农作物叶片图像,形成农作物叶片图像数据集;将农作物叶片图像数据集划分出训练集和测试集;对Unet网络进行改进,得到改进的Unet网络;将训练集导入到改进的Unet网络中进行训练,用测试集对训练后的改进的Unet网络进行测试,测试通过后得到用于农作物病害情况评估方法的改进的Unet网络。本发明可以用于分析农作物病害情况,解决农作物病害分析严重依赖于人为的识别和判断,不能及时发现病害,造成病害进一步恶化的问题。
Description
技术领域
本发明涉及图像识别领域与农业生产领域,更具体地,涉及基于改进的Unet网络结构用于农作物病害情况训练和评估方法。
背景技术
农作物病害严重影响农作物的产量和质量,病发处多为叶部,其中叶部的大斑病和锈病最为常见。及时准确地识别并控制农作物病害可以将危害降到最低,目前常见的方法还是请农业专家实地勘察,基于专业知识和经验对农作物病害情况进行辨识,这种方法不仅主观性较强,而且费时费力、效率不高,严重依赖于人为的识别和判断,不能及时发现病害,造成病害进一步恶化。
发明内容
本发明旨在克服上述现有技术的至少一种缺陷,提供一种基于改进的Unet网络结构用于农作物病害情况训练和评估方法,用于农作物病害严重依赖于人为的识别和判断,不能及时发现病害,造成病害进一步恶化的问题。
本发明采取的技术方案是,一种农作物病害情况识别模型训练方法,所述训练方法基于Unet网络进行,所述Unet网络包括特征提取网络、特征融合网络和若干个第一卷积,所述方法包括:
采集农作物叶片图像,形成农作物叶片图像数据集;
将农作物叶片图像数据集划分出训练集和测试集;
对Unet网络进行改进,得到改进的Unet网络;
将训练集导入到改进的Unet网络中进行训练,用测试集对训练后的改进的Unet网络进行测试,测试通过后得到用于农作物病害情况识别方法的改进的Unet网络;
所述对Unet网络进行改进,具体为:
所述特征提取网络和特征融合网络分别包含若干个顺次连接的第一基本卷积算子;
在特征提取网络中,每个所述第一基本卷积算子后均连接有一个第一残差模块,每一个所述第一残差模块经最大池化处理后连接到下一个第一基本卷积算子;
在特征融合网络中,每个所述第一基本卷积算子后连接有一个第二残差模块,每一个所述第二残差模块经上采样处理后连接到下一个第一基本卷积算子;
特征提取网络中每个所述第一基本卷积算子还通过其后连接的所述第一残差模块连接至对应的第一卷积。
本发明通过修改原始的Unet架构,将残差模块合并到Unet体系结构的特征提取网络和特征融合网络中,提出了一种改进的Unet网络,改进的Unet网络可以直接从原始测量数据中直接重建图像,而不需要任何初始重建,随着网络的深入,残差模块的加入缓解了梯度消失的问题,进一步提高了改进Unet网络图像分割的性能。将该改进后的Unet网络应用到农作物病害情况识别模型中,可以提高农作物图像中病害情况的图像分割性能,从而提高农作物病害情况的识别率。
此外,作为对原始Unet架构的细化,在输入和输出之间的跳过连接,意味着Unet网络实际上学习了输入和输出之间的差异。
进一步的,所述第一残差模块和/或第二残差模块包括:
若干组顺序连接的第二卷积、第一批归一化和第一线性修正单元;
还包括一个跳过连接,所述跳过连接位于最后一组中的第二卷积和第一批归一化之间;
所述跳过连接还连接至第一组的第二卷积的输入端。
一个残差模块包含多个卷积层,这些卷积层对这个残差学习模块的输入数据进行变化,同时原始输入信息跳过这些卷积层直接传导至最后的批归一化中。传统的卷积神经网络或者全连接网络,在信息传递时,或多或少会存在信息丢失、损耗等问题,同时还会导致梯度消失或梯度爆炸,这使得很深的传统卷积神经网络无法训练。而残差模块通过提出残差学习的思想,在一定程度上解决了传统卷积神经网络无法训练的问题。通过将输入信息“绕道”传导至输出,保护了信息的完整性,整个网络只需要学习输入、输出和残差部分,极大程度上简化了学习的目标和难度。
进一步的,所述第一基本卷积算子包括:
顺次相连的第三卷积、第二批归一化和第二线性修正单元。
本发明通过第二批归一化不仅加快了模型的收敛速度,而且在一定程度缓解了深层网络中梯度弥散(特征分布较散)的问题,从而使得训练深层网络模型更加容易和稳定。而且第二线性修正单元的加入使得改进的Unet网络结构计算变得更快。因此,本发明设计第一基本卷积算子的架构,从而使得整个识别模型的训练变得容易、稳定,而且技术效率更快。
进一步的,还包括:
第一单元;
所述第一单元包括顺次连接的第二基本卷积算子、第四卷积和第三残差模块;
所述第二基本卷积算子与所述第一基本卷积算子结构相同,所述第三残差模块与所述第一残差模块结构相同;
所述特征提取网络中的最后一个所述第一残差模块经最大池化处理后连接所述第二基本卷积算子;
所述第三残差模块经上采样后连接所述特征融合网络中的第一个所述第一基本卷积算子。
本发明通过分别在特征提取网络的输出端和特征融合网络的输入端连接若干个第一单元,使得图像分割的效率更高。
进一步的,还包括:
第二单元;
所述第二单元包括顺次连接的第三基本卷积算子、第四残差模块、第五卷积和若干个第四基本卷积算子,所述第三基本卷积算子、第五基本卷积算子均与所述第一基本卷积算子结构相同,所述第四残差模块与所述第一残差模块结构相同;
所述第四残差模块经最大池化处理后连接所述特征提取网络中的第一个所述第一基本卷积算子;
所述特征融合网络中的最后一个所述第二残差模块经上采样后连接第一个所述第四基本卷积算子。
本发明通过分别在特征提取网络的输入端和特征融合网络的输出端连接若干个第二单元,使得图像分割的效率更高。
进一步的,还包括:
第三单元;
所述第三单元包括顺序连接的第六卷积和第五基本卷积算子,所述第五基本卷积算子与所述第一基本卷积算子结构相同;
所述第二单元中最后一个所述第四基本卷积算子经跳跃式传递后连接所述第五基本卷积算子;
所述特征提取网络中第一个所述第一基本卷积算子的输入端还连接所述第六卷积。
本发明通过分别在特征提取网络的输入端和特征融合网络的输出端连接若干个第三单元,或是在第二单元之后连接若干个第三单元,使得图像分割的效率更高。
本发明通过残差模块与基本卷积卷子的组合,不断优化改进的Unet网络的图像分割质量与分割效率。
因此,本发明设计第一~三单元的架构,从而使得整个识别模型的训练变得稳定,而且技术效率更快。
进一步的,还包括:
若干个注意力控制门:
所述第一卷积、第五卷积和第六卷积后均跳跃式连接一个所述注意力控制门至对应的第一卷积算子、第四基本卷积算子和第五基本卷积算子。
当输入的信息过多时,Unet网络模型会变得更复杂,本发明通过引入注意力控制门,可以减少改进的Unet网络的处理信息量,从而减少需要的计算资源。
进一步的,所述第三残差模块还通过门控信号连接第一个所述第一卷积后的注意力控制门;
最后一个所述第二残差模块还通过门控信号连接所述第五卷积后的注意力控制门;
最后一个所述第四基本卷积算子还通过门控信号连接所述第六卷积后的注意力控制门;
除最后一个所述第二残差模块外,其余所述第二残差模块均分别通过门控信号顺次连接除第一个所述第一卷积外其余的第一卷积后的注意力控制门。
注意力控制门通过允许当前网络层访问所有网络层产生的输出来克服传统结构的缺点,在实现输入与输出的对齐的同时还能够利用更多的原始数据的上下文信息。
进一步的,所述注意力控制门包括:
重采样函数、连接模块、张积量、激活函数、第三线性修正单元和若干个卷积核;
所述第一个所述卷积核的输入端连接门控信号;
第二个卷积核的输入端对应连接第一卷积或第四卷积或第五卷积;
第一个所述卷积核和第二个所述卷积核的输出端均连接所述连接模块的输入端;
所述连接模块的输出端连接第三线性修正单元的输入端;
第三线性修正单元的输出端连接第三个卷积核的输入端;
第二个所述卷积核的输出端连接激活函数的输入端;
激活函数的输出端连接重采样函数的输入端;
所述重采样函数的输出端连接张积量的输入端;
所述张积量的输入端还连接所述第一卷积或第四卷积或第五卷积的输出端。
通过门控信号将激活信息和上下文信息传送至所连接的注意力控制门,通过注意力控制门处理信息,加快计算效率。注意力控制门的加入,使得训练变得更加稳定并提高了模型学习的速度,在训练时,只需要更少的计算资源,提高了训练的计算效率。
将残差模块的作为注意力控制门的输入,用激活函数激活,得到这个残差模块的输出结果。用残差模块学习输出结果和输入结果之间的差值。
本发明还提供一种农作物病害情况评估方法,包括:
获得待检测的农作物叶片图像;
将待检测的农作物叶片图像输入到测试通过后得到用于农作物病害情况评估方法的改进的Unet网络结构,得到农作物叶片分割图像和病害区分割图像;
所述改进的Unet网络结构通过一种农作物病害情况识别模型训练方法获得;
通过计算病害区分割图像与农作物叶片分割图像的面积之比得出病害情况估计值。
本发明通过视频监控等系统获取到如树冠叶片等农作物叶片图像信息之后,输入至模型内,农作物叶片图片经过模型计算之后获取到叶片分割图像及病害区域分割图像,通过计算病害区与叶片图像像素点之比作为病害情况估计值。使得叶片中病害区域的占比通过数字直观地展现出来,不需请农业专家实地勘察,基于专业知识和经验对农作物病害情况进行辨识。通过视频监控便可及时发现病害,不用依赖于人为的识别和判断,避免造成病害进一步恶化。
与现有技术相比,本发明的有益效果为:
本发明设计了一种农作物病害情况评估方法。通过在摄像头内置测试通过的用于农作物病害情况评估方法的改进的Unet网络结构,可实现叶片区域的分割及病害区域的分割,通过计算两个分割区域的面积比来估计作物病害情况,可通过手持设备和终端进行实时巡检,比对病害情况的历史情况,及时预警病害并将病害综合分析结果及防治措施建议推送给种植户,防止病害进一步恶化,实现病害实时监测、及时干预。
附图说明
图1为本发明一种农作物病害情况识别模型训练方法的流程图。
图2为本发明一种改进的Unet网络结构。
图3为本发明的残差模块的结构示意图。
图4为本发明第一基本卷积算子的结构示意图。
图5为本发明第一单元的结构示意图。
图6为本发明第二单元的结构示意图。
图7为本发明第三单元的结构示意图。
图8为本发明注意力控制门的结构示意图。
图9为本发明另一种改进的Unet网络结构。
图10为本发明一种农作物病害情况评估方法流程图。
图11为本发明的农作物病害情况模型结构示意图。
图12为本发明的农作物病害情况识别系统示意图。
图13为本发明的农作物病害情况模型中间结果示意图。
图14为本发明的农作物病害情况模型输出结果示意图。
图中:Max Pooling 最大池化处理;Upsampling上采样;Skip+Concstenation跳过连接;Gating Signal门信号;Attention Gate注意力控制门;BasicConv基本卷积算子;Conv卷积;Res-block残差模块;BN批归一化;ReLu线性修正单元;Gelu激活函数;Resampler重采样函数;Aleaf农作物叶片分割图像的面积;Adisease病害区分割图像的面积;Darea病害情况估计值;c特征的通道数;h特征的高度;w特征的宽度;H图片的宽度;W图片的高度;D图片的深度;F对图像进行滤波操作;α注意系数;g分析门控信号。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
如图1所示,根据本发明的实施例,提供了一种农作物病害情况识别模型训练方法,所述训练方法基于Unet网络进行,所述Unet网络包括特征提取网络、特征融合网络和若干个第一卷积,所述方法包括:
S101、采集农作物叶片图像,形成农作物叶片图像数据集;
S102、将农作物叶片图像数据集划分出训练集和测试集;
S103、对Unet网络进行改进,得到改进的Unet网络;
S104、将训练集导入到改进的Unet网络中进行训练,用测试集对训练后的改进的Unet网络进行测试,测试通过后得到用于农作物病害情况评估方法的改进的Unet网络;
所述对Unet网络进行改进,具体为:
如图2所示,所述特征提取网络和特征融合网络分别包含若干个顺次连接的第一基本卷积算子;
在特征提取网络中,每个所述第一基本卷积算子后均连接有一个第一残差模块,每一个所述第一残差模块经最大池化处理后连接到下一个第一基本卷积算子;
在特征融合网络中,每个所述第一基本卷积算子后连接有一个第二残差模块,每一个所述第二残差模块经上采样处理后连接到下一个第一基本卷积算子;
特征提取网络中每个所述第一基本卷积算子还通过其后连接的所述第一残差模块连接至对应的第一卷积。
本实施例中,农作物叶片图像数据集中的农作物叶片图像在进行模型训练前,可以将农作物叶片图像数据集划分为训练集以及测试集,进行模型训练时,利用训练集训练模型,同时利用测试集测试训练过程中模型的效果,将测试结果反馈给模型并调整模型参数继续训练,最后得到训练好的模型。
在步骤S101中,采集得到农作物叶片图像后可以对农作物叶片图像进行一些预处理,形成可以直接输入模型中训练和测试的农作物叶片图像数据集。
进一步的,所述第一残差模块和/或第二残差模块包括:
若干组顺序连接的第二卷积、第一批归一化和第一线性修正单元;
还包括一个跳过连接,所述跳过连接位于最后一组中的第二卷积和第一批归一化之间;
所述跳过连接还连接至第一组的第二卷积的输入端。
具体地,如图3所示,本发明将残差模块分为主干分支和掩模分支两个分支。主干分支可以由三个3×3的第二卷积、两个第一批归一化(BN)和两个第一线性修正单元(ReLu)组成。在掩码分支中,在输入和输出之间添加了一个跳过连接,以执行标识映射。在主干分支和掩模分支的总和后面跟着一个第一批归一化和一个线性修正单元,使得在残差模块中,张积量的大小仍然保持不变。改进的Unet中的所有残差模块都具有相同数量的卷积层,以保持计算效率。
如图4所示,所述第一基本卷积算子包括:
顺次相连的第三卷积、第二批归一化和第二线性修正单元。
具体地,卷积是一种积分运算,用于求两个曲线重叠区域面积,可以用来消除噪声、特征增强。
批归一化(Batch Normalization,简称BN),是深度神经网络训练的技巧,不仅可以加快模型的收敛速度,而且在一定程度缓解了深层网络中梯度弥散(特征分布较散)的问题,从而使得训练深层网络模型更加容易和稳定。
BN就是对每一批数据进行归一化,对于训练中某一个数据(此数据还可以是网络中间的某一层输出),BN使得网络中任意一层均可以进行归一化处理。
线性修正单元(ReLU),又称线性整流函数,是一种人工神经网络中常用的激活函数(activation function)。ReLU作为神经网络中最常用的激活函数,只有输入超出阈值时才被激活,不过当输入为正的时候,导数不为零,从而允许基于梯度的学习。使用这个函数能使计算变得很快,因为无论是函数还是其导数都不包含复杂的数学运算。
进一步的,还包括:
第一单元;
如图5所示,所述第一单元包括顺次连接的第二基本卷积算子、第四卷积和第三残差模块;
所述第二基本卷积算子与所述第一基本卷积算子结构相同,所述第三残差模块与所述第一残差模块结构相同;
所述特征提取网络中的最后一个所述第一残差模块经最大池化处理后连接所述第二基本卷积算子;
所述第三残差模块经上采样后连接所述特征融合网络中的第一个所述第一基本卷积算子。
具体地,所述第二基本卷积算子的输入端为第一单元的输入端,所述第三残差模块的输出端为第一单元的输出端。
进一步的,还包括:
第二单元;
如图6所示,所述第二单元包括顺次连接的第三基本卷积算子、第四残差模块,第五卷积和若干个第四基本卷积算子,所述第三基本卷积算子、第五基本卷积算子均与所述第一基本卷积算子结构相同,所述第四残差模块与所述第一残差模块结构相同;
所述第四残差模块经最大池化处理后连接所述特征提取网络中的第一个所述第一基本卷积算子;
所述特征融合网络中的最后一个所述第二残差模块经上采样后连接第一个所述第四基本卷积算子。
具体地,第三基本卷积算子的输入端为第二单元的输入端,最后一个第四基本卷积算子的输出端为第二单元的输出端。第四残差模块的输出端为第二单元的另一输出端,第一个第四基本卷积算子的输出端为第二单元的另一输入端。
进一步的,还包括:
第三单元;
如图7所示,所述第三单元包括顺序连接的第六卷积和第五基本卷积算子,所述第五基本卷积算子与所述第一基本卷积算子结构相同;
所述第二单元中最后一个所述第四基本卷积算子经跳跃式传递后连接所述第五基本卷积算子;
所述特征提取网络中第一个所述第一基本卷积算子的输入端还连接所述第六卷积。
具体地,第六卷积的输入端为第三单元的输入端,第五基本卷积的输出端为第三单元的输出端。第三单元的输入端通过跳跃式连接输入的图像数据,第三单元的输出端输出后为经过图像分割的图像数据。
进一步的,还包括:
若干个注意力控制门:
所述第一卷积、第五卷积和第六卷积后均跳跃式连接一个所述注意力控制门至对应的第一卷积算子、第四基本卷积算子和第五基本卷积算子。
注意力控制门的加入,使得训练变得更加稳定并提高了模型学习的速度,在训练时,只需要更少的计算资源,因此提高了训练的计算效率。
进一步的,所述第三残差模块还通过门控信号连接第一个所述第一卷积后的注意力控制门;
最后一个所述第二残差模块还通过门控信号连接所述第五卷积后的注意力控制门;
最后一个所述第四基本卷积算子还通过门控信号连接所述第六卷积后的注意力控制门;
除最后一个所述第二残差模块外,其余所述第二残差模块均分别通过门控信号顺次连接除第一个所述第一卷积外其余的第一卷积后的注意力控制门。
具体地,跳过连接(Skip+Concstenation)用于关注叶面整体特征提取,门信号(Gating Signal)用于关注叶面局部特征提取,两种信号经过注意力机制(AttentionGate)处理之后,叶面全局和局部特征信息融合,使得局部特征更加显现。
进一步的,所述注意力控制门包括:
重采样函数、连接模块、张积量、若干个激活函数和若干个卷积核;
所述第一个所述卷积核的输入端连接门控信号;
第二个卷积核的输入端对应连接第一卷积或第四卷积或第五卷积;
第一个所述卷积核和第二个所述卷积核的输出端均连接所述连接模块的输入端;
所述连接模块的输出端连接第三线性修正单元的输入端;
第三线性修正单元的输出端连接第三个卷积核的输入端;
第二个所述卷积核的输出端连接激活函数的输入端;
激活函数的输出端连接重采样函数的输入端;
所述重采样函数的输出端连接张积量的输入端;
所述张积量的输入端还连接所述第一卷积或第四卷积或第五卷积。
如图8所示,注意力控制门的输入特征用注意力控制门中计算的注意系数(α)进行缩放,空间区域是通过分析门控信号(g)提供的激活信息和上下文信息,从一个较粗的尺度上收集这些信号来选择的注意力系数,并采用三线性插值法对注意力系数进行网格重采样。
具体地,本发明通过2×2最大池化运算,重复减少特征图的空间维度,使改进的Unet网络能够在不同的空间尺度上有效地学习局部和全局特征。
基于上述方案,本实施例将训练集输入到如图9所示的一种改进的Unet网络结构中,所述第一~五基本卷积算子均为3×3的基本卷积算子,所述第一~六卷积均为6×3的卷积,所述第一~四残差模块均为相同的残差模块。
训练集中的数据输入到第二单元以及第三单元中,输入到第二单元中的数据在经过3×3的基本卷积算子后通过残差模块经过特征提取网络,通过第一基本卷积和第一残差模块处理后进入到第一单元处理,再经过特征融合网络中第一基本卷积算子和第二残差模块处理后回到第二单元中两个3×3的基本卷积算子处理后,再经过第三单元中一个3×3的基本卷积算子。训练集中的数据还可以直接进入到第三单元,通过第三单元中的一个6×3的卷积后再经过注意力控制门后进入到第三单元中3×3的基本卷积算子。
且特征提取网络端除最后一层外,其余每一层数据均可在处理过程中通过6×3的卷积后通过不同的注意力控制门进入到特征融合网络端的同一层中,特征融合网络端的数据除第一层外,其他层的数据也可通过门控信号进入到上一层中的注意力控制门中,最终特征融合网络端整合所有的数据,输出最终的分割图像。
实施例2
如图10所示,本实施例一种农作物病害情况评估方法,包括:
S201、获得待检测的农作物叶片图像;
S202、将待检测的农作物叶片图像输入到测试通过后得到用于农作物病害情况评估方法的改进的Unet网络结构,得到农作物叶片分割图像和病害区分割图像;
所述改进的Unet网络结构通过一种农作物病害情况识别模型训练方法获得;
S203、通过计算病害区分割图像与农作物叶片分割图像的面积之比得出病害情况估计值。
如图11所示,本发明将树冠图像输入到如图9所示的一种改进的Unet网络结构,得到叶片分割图像以及病害区分割图像,通过病害区分割图像面积(Adisease)与叶片分割图像面积(Aleaf)作比得出病害情况估计值(Darea)。
如图12所示,本发明首先通过视频监控系统获取到树冠叶片图片信息以及通过手持设备获得农作物叶片之后,将图片信息输入到如实施例1中测试通过的农作物病害情况评估方法的改进的Unet网络结构,叶片分割处理的中间结果示意图如图13农作物病害情况模型中间结果示意图所示,最终该网络结构将待检测的农作物叶片图像分割为例如图14所示的农作物病害情况模型输出结果示意图中叶片分割图像及病害区域分割图像,最后通过计算病害区分割图像与农作物叶片分割图像的面积之比得出病害情况估计值。
系统根据病害情况估计值比对该农作物病害情况的历史情况,及时预警病害并将病害综合分析结果及防治措施建议推送给种植户。
显然,本发明的上述实施例仅仅是为清楚地说明本发明技术方案所作的举例,而并非是对本发明的具体实施方式的限定。凡在本发明权利要求书的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。
Claims (10)
1.一种农作物病害情况识别模型训练方法,所述训练方法基于Unet网络进行,所述Unet网络包括特征提取网络、特征融合网络和若干个第一卷积,其特征在于,所述方法包括:
采集农作物叶片图像,形成农作物叶片图像数据集;
将农作物叶片图像数据集划分出训练集和测试集;
对Unet网络进行改进,得到改进的Unet网络;
将训练集导入到改进的Unet网络中进行训练,用测试集对训练后的改进的Unet网络进行测试,测试通过后得到用于农作物病害情况识别方法的改进的Unet网络;
所述对Unet网络进行改进,具体为:
所述特征提取网络和特征融合网络分别包含若干个顺次连接的第一基本卷积算子;
在特征提取网络中,每个所述第一基本卷积算子后均连接有一个第一残差模块,每一个所述第一残差模块经最大池化处理后连接到下一个第一基本卷积算子;
在特征融合网络中,每个所述第一基本卷积算子后连接有一个第二残差模块,每一个所述第二残差模块经上采样处理后连接到下一个第一基本卷积算子;
特征提取网络中每个所述第一基本卷积算子还通过其后连接的所述第一残差模块连接至对应的第一卷积。
2.根据权利要求1所述的一种农作物病害情况识别模型训练方法,其特征在于,所述第一残差模块和/或第二残差模块包括:
若干组顺序连接的第二卷积、第一批归一化和第一线性修正单元;
还包括一个跳过连接,所述跳过连接位于最后一组中的第二卷积和第一批归一化之间;
所述跳过连接还连接至第一组的第二卷积的输入端。
3.根据权利要求1所述的一种农作物病害情况识别模型训练方法,其特征在于,所述第一基本卷积算子包括:
顺次相连的第三卷积、第二批归一化和第二线性修正单元。
4.根据权利要求2所述的一种农作物病害情况识别模型训练方法,其特征在于,还包括:
第一单元;
所述第一单元包括顺次连接的第二基本卷积算子、第四卷积和第三残差模块;
所述第二基本卷积算子与所述第一基本卷积算子结构相同,所述第三残差模块与所述第一残差模块结构相同;
所述特征提取网络中的最后一个所述第一残差模块经最大池化处理后连接所述第二基本卷积算子;
所述第三残差模块经上采样后连接所述特征融合网络中的第一个所述第一基本卷积算子。
5.根据权利要求4所述的一种农作物病害情况识别模型训练方法,其特征在于,还包括:
第二单元;
所述第二单元包括顺次连接的第三基本卷积算子、第四残差模块、第五卷积和若干个第四基本卷积算子,所述第三基本卷积算子、第五基本卷积算子均与所述第一基本卷积算子结构相同,所述第四残差模块与所述第一残差模块结构相同;
所述第四残差模块经最大池化处理后连接所述特征提取网络中的第一个所述第一基本卷积算子;
所述特征融合网络中的最后一个所述第二残差模块经上采样后连接第一个所述第四基本卷积算子。
6.根据权利要求5所述的一种农作物病害情况识别模型训练方法,其特征在于,还包括:
第三单元;
所述第三单元包括顺序连接的第六卷积和第五基本卷积算子,所述第五基本卷积算子与所述第一基本卷积算子结构相同;
所述第二单元中最后一个所述第四基本卷积算子经跳跃式传递后连接所述第五基本卷积算子;
所述特征提取网络中第一个所述第一基本卷积算子的输入端还连接所述第六卷积。
7.根据权利要求6所述的一种农作物病害情况识别模型训练方法,其特征在于,还包括:
若干个注意力控制门:
所述第一卷积、第五卷积和第六卷积后均跳跃式连接一个所述注意力控制门至对应的第一卷积算子、第四基本卷积算子和第五基本卷积算子。
8.根据权利要求7所述的一种农作物病害情况识别模型训练方法,其特征在于,
所述第三残差模块还通过门控信号连接第一个所述第一卷积后的注意力控制门;
最后一个所述第二残差模块还通过门控信号连接所述第五卷积后的注意力控制门;
最后一个所述第四基本卷积算子还通过门控信号连接所述第六卷积后的注意力控制门;
除最后一个所述第二残差模块外,其余所述第二残差模块均分别通过门控信号顺次连接除第一个所述第一卷积外其余的第一卷积后的注意力控制门。
9.根据权利要求8所述的一种农作物病害情况识别模型训练方法,其特征在于,所述注意力控制门包括:
重采样函数、连接模块、张积量、若干个激活函数和若干个卷积核;
所述第一个所述卷积核的输入端连接门控信号;
第二个卷积核的输入端对应连接第一卷积或第四卷积或第五卷积;
第一个所述卷积核和第二个所述卷积核的输出端均连接所述连接模块的输入端;
所述连接模块的输出端连接第三线性修正单元的输入端;
第三线性修正单元的输出端连接第三个卷积核的输入端;
第二个所述卷积核的输出端连接激活函数的输入端;
激活函数的输出端连接重采样函数的输入端;
所述重采样函数的输出端连接张积量的输入端;
所述张积量的输入端还连接所述第一卷积或第四卷积或第五卷积的输入端。
10.一种农作物病害情况评估方法,其特征在于,包括:
获得待检测的农作物叶片图像;
将待检测的农作物叶片图像输入到测试通过后得到用于农作物病害情况识别方法的改进的Unet网络结构,得到农作物叶片分割图像和病害区分割图像;
所述改进的Unet网络结构通过权利要求1~9任一项所述的一种农作物病害情况识别模型训练方法获得;
通过计算病害区分割图像与农作物叶片分割图像的面积之比得出病害情况估计值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211355295.5A CN115410070B (zh) | 2022-11-01 | 2022-11-01 | 基于改进的Unet网络结构用于农作物病害情况训练和评估方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211355295.5A CN115410070B (zh) | 2022-11-01 | 2022-11-01 | 基于改进的Unet网络结构用于农作物病害情况训练和评估方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115410070A true CN115410070A (zh) | 2022-11-29 |
CN115410070B CN115410070B (zh) | 2023-02-03 |
Family
ID=84169436
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211355295.5A Active CN115410070B (zh) | 2022-11-01 | 2022-11-01 | 基于改进的Unet网络结构用于农作物病害情况训练和评估方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115410070B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110689543A (zh) * | 2019-09-19 | 2020-01-14 | 天津大学 | 基于注意机制的改进卷积神经网络脑肿瘤图像分割方法 |
CN110717903A (zh) * | 2019-09-30 | 2020-01-21 | 天津大学 | 一种利用计算机视觉技术进行农作物病害检测的方法 |
CN111612790A (zh) * | 2020-04-29 | 2020-09-01 | 杭州电子科技大学 | 一种基于t型注意力结构的医学图像分割方法 |
CN114445715A (zh) * | 2022-03-24 | 2022-05-06 | 中南大学 | 一种基于卷积神经网络的农作物病害识别方法 |
CN115063602A (zh) * | 2022-07-13 | 2022-09-16 | 安徽成方智能科技有限公司 | 基于改进yolox-s网络的农作物病虫害识别方法 |
US20220309674A1 (en) * | 2021-03-26 | 2022-09-29 | Nanjing University Of Posts And Telecommunications | Medical image segmentation method based on u-net |
-
2022
- 2022-11-01 CN CN202211355295.5A patent/CN115410070B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110689543A (zh) * | 2019-09-19 | 2020-01-14 | 天津大学 | 基于注意机制的改进卷积神经网络脑肿瘤图像分割方法 |
CN110717903A (zh) * | 2019-09-30 | 2020-01-21 | 天津大学 | 一种利用计算机视觉技术进行农作物病害检测的方法 |
CN111612790A (zh) * | 2020-04-29 | 2020-09-01 | 杭州电子科技大学 | 一种基于t型注意力结构的医学图像分割方法 |
US20220309674A1 (en) * | 2021-03-26 | 2022-09-29 | Nanjing University Of Posts And Telecommunications | Medical image segmentation method based on u-net |
CN114445715A (zh) * | 2022-03-24 | 2022-05-06 | 中南大学 | 一种基于卷积神经网络的农作物病害识别方法 |
CN115063602A (zh) * | 2022-07-13 | 2022-09-16 | 安徽成方智能科技有限公司 | 基于改进yolox-s网络的农作物病虫害识别方法 |
Non-Patent Citations (3)
Title |
---|
OZAN OKTAY 等: "Attention U-Net: Learning Where to Look for the Pancreas", 《ARXIV:1804.03999V3》 * |
王波 等: "基于改进U-Net网络的甲状腺结节超声图像分割方法", 《电子与信息学报》 * |
赵小虎 等: "基于改进U-Net网络的多尺度番茄病害分割算法", 《计算机工程与应用》 * |
Also Published As
Publication number | Publication date |
---|---|
CN115410070B (zh) | 2023-02-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111161273B (zh) | 一种基于深度学习的医学超声图像分割方法 | |
CN110473188B (zh) | 一种基于Frangi增强和注意力机制UNet的眼底图像血管分割方法 | |
CN110647875B (zh) | 一种血细胞分割、识别模型构造的方法及血细胞识别方法 | |
CN112036335A (zh) | 一种反卷积引导的半监督植物叶部病害识别与分割方法 | |
CN110415230B (zh) | 一种基于深度学习的ct切片图像语义分割系统及方法 | |
CN112508953B (zh) | 基于深度神经网络的脑膜瘤快速分割定性方法 | |
CN111179275B (zh) | 一种医学超声图像分割方法 | |
CN106778845A (zh) | 一种基于叶色检测的植物生长状况监测方法 | |
CN109815855B (zh) | 一种基于机器学习的电子设备自动测试方法及系统 | |
CN115909006B (zh) | 基于卷积Transformer的乳腺组织图像分类方法及系统 | |
CN113155464B (zh) | 面向轴承故障识别的cnn模型可视化优化方法 | |
CN113688862A (zh) | 一种基于半监督联邦学习的脑影像分类方法及终端设备 | |
CN115439654B (zh) | 动态约束下的弱监督农田地块精细化分割方法及系统 | |
CN115471645A (zh) | 一种基于u型学生网络的知识蒸馏异常检测方法 | |
CN116109558A (zh) | 基于颈部半透明厚度测量值筛查胎儿染色体异常的方法 | |
CN117315380B (zh) | 一种基于深度学习的肺炎ct图像分类方法及系统 | |
Dong et al. | Supervised learning-based retinal vascular segmentation by m-unet full convolutional neural network | |
CN114067313A (zh) | 一种双线性残差网络模型的农作物叶部病害识别方法 | |
CN117589767A (zh) | 一种烟叶采收时间确定方法、电子设备和存储介质 | |
CN115410070B (zh) | 基于改进的Unet网络结构用于农作物病害情况训练和评估方法 | |
CN110320802B (zh) | 基于数据可视化的复杂系统信号时序识别方法 | |
CN116884036A (zh) | 基于YOLOv5DA的生猪姿态检测方法、装置、设备及介质 | |
CN112288694B (zh) | 基于掩膜区域卷积神经网络的变电设备缺陷识别的方法 | |
CN113160261B (zh) | 一种用于oct图像角膜层分割的边界增强卷积神经网络 | |
CN112488125B (zh) | 一种基于高速视觉诊断和bp神经网络的重建方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |