CN114841961B - 基于图像增强和改进YOLOv5的小麦赤霉病检测方法 - Google Patents
基于图像增强和改进YOLOv5的小麦赤霉病检测方法 Download PDFInfo
- Publication number
- CN114841961B CN114841961B CN202210482581.1A CN202210482581A CN114841961B CN 114841961 B CN114841961 B CN 114841961B CN 202210482581 A CN202210482581 A CN 202210482581A CN 114841961 B CN114841961 B CN 114841961B
- Authority
- CN
- China
- Prior art keywords
- module
- network
- image
- resolution
- layer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 63
- 206010039509 Scab Diseases 0.000 title claims abstract description 57
- 241000209140 Triticum Species 0.000 title claims abstract description 52
- 235000021307 Triticum Nutrition 0.000 title claims abstract description 52
- 201000010099 disease Diseases 0.000 claims abstract description 47
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 47
- 238000000605 extraction Methods 0.000 claims abstract description 13
- 238000012549 training Methods 0.000 claims abstract description 11
- 238000007781 pre-processing Methods 0.000 claims abstract description 5
- 230000004927 fusion Effects 0.000 claims description 20
- 238000012360 testing method Methods 0.000 claims description 14
- 238000002372 labelling Methods 0.000 claims description 8
- 230000007246 mechanism Effects 0.000 claims description 5
- 238000005070 sampling Methods 0.000 claims description 5
- 230000006872 improvement Effects 0.000 claims description 4
- 241000894007 species Species 0.000 claims description 3
- 230000009466 transformation Effects 0.000 claims description 3
- 238000001914 filtration Methods 0.000 claims description 2
- 238000000034 method Methods 0.000 description 11
- 238000004422 calculation algorithm Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 238000004519 manufacturing process Methods 0.000 description 4
- 235000013339 cereals Nutrition 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000002265 prevention Effects 0.000 description 3
- 241000607479 Yersinia pestis Species 0.000 description 2
- 238000012271 agricultural production Methods 0.000 description 2
- 230000009418 agronomic effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 230000001965 increasing effect Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 239000000575 pesticide Substances 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 208000031888 Mycoses Diseases 0.000 description 1
- 241001024327 Oenanthe <Aves> Species 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 231100000206 health hazard Toxicity 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 235000016709 nutrition Nutrition 0.000 description 1
- 230000035764 nutrition Effects 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000011435 rock Substances 0.000 description 1
- 238000005507 spraying Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0012—Biomedical image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4046—Scaling of whole images or parts thereof, e.g. expanding or contracting using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4053—Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/70—Denoising; Smoothing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/73—Deblurring; Sharpening
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/90—Dynamic range modification of images or parts thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
- G06T7/73—Determining position or orientation of objects or cameras using feature-based methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
- G06V10/806—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A40/00—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
- Y02A40/10—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Multimedia (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Quality & Reliability (AREA)
- Radiology & Medical Imaging (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明公开了基于图像增强和改进YOLOv5的小麦赤霉病检测方法,属于图像超分辨率领域和病害检测领域。包括收集小麦赤霉病害图像;对收集的小麦赤霉病害图像通过数据增强对图像数量进行扩充;对病害图像进行YOLOv5格式的标注并标记病害类别,形成小麦赤霉病数据集;利用超分辨网络对图像进行预处理,提高分辨率;将原有主干网络替换为Swin‑Transformer网络,构建改进的YOLOv5的小麦赤霉病害检测模型;利用按比例划分的数据集对构建的小麦赤霉病检测模型进行训练和模型误差分析。本发明利用超分辨率和改进后的YOLOv5网络模型增强了小麦赤霉病检测模型对特征的提取,从而提高了小麦赤霉病检测的准确率,能够有效的适用于实际的大田环境检测。
Description
所属技术领域
本发明涉及图像超分辨率及病害检测技术,具体涉及基于图像增强和改进YOLOv5的小麦赤霉病检测方法。
背景技术
小麦是我国乃至全世界的重要粮食作物之一。我国约有40%的人口以小麦作为为主要粮食,是营养比较丰富、经济价值较高的粮食。然而农作物病害严重制约着我国农作物的发展,一般流行年份可以引起10%到20%的产量损失。而小麦也经常受到各种病害的侵害,其中赤霉病是全球小麦生产中最主要的真菌性病害之一。与叶部病害不同,小麦赤霉病直接发生在小麦穗子上,侵染花器。这种感染不仅导致粮食产量降低,并且对食用的人畜健康构成危害。
目前在实际农业生产中,由于生产条件、气候地理因素、农民技术水平相对有限、往往利用主观经验进行大规模喷药或者农业植保专家利用田间抽样调查的方法对病害严重度进行评估,该方法无法对大面积区域进行有效检测、而且人工成本较高、农药效率低、检测到时往往防治已经太迟,严重影响赤霉病的防止效率。
随着人工智能和深度学习在图像处理、识别领域的日益发展。传统农业向智慧化和自动化发展,利用图像检测识别技术和农业场景相结合,有助于在生产过程中实现对农作物的病害受害状态进行实时的判断,及时采取相应的防治措施。从而实现农业生产的智能化发展,减少了物力人力,提高了生产效率。
在目前所有的病害检测算法中,机器学习和深度学习针对单独叶片上的病害识别被广泛的应用。但对于实际大田背景下的病害检测识别并不适用,存在实际病害区域的背景较复杂、图像采集时受采集设备、光线环境和天气条件等影响、病虫害数据集较少、分辨率较低等问题。造成检测时泛化能力差、鲁棒性差、识别准确率低,不利于田块的精准检测以及在不同数据集或野外条件下测试性能明显下降。因此,找出一种能适用于实际大田场景下的小麦赤霉病检测方法是十分有意义的。
在图像预处理阶段,目前的研究往往只是通过去噪和统一尺寸等方式对图像进行简单处理,就送入网络训练,而忽视了图像的某些特征。小麦赤霉病害图像处理中的分辨率直接影响着对特征的提取,超分辨率是可以无损提高图像分辨率的过程。因此,对小麦赤霉病害图像进行图像超分辨率重建具有重要意义。
发明内容
针对上述问题,本发明公开了基于图像增强和改进YOLOv5的小麦赤霉病检测方法,基于超分辨后的图像对图像进行小麦赤霉病害检测,解决了大田图像场景较复杂、病害尺寸太小、鲁棒性差、检测准确率较低的问题。
为实现上述发明目的,本申请提供的具体的技术方案如下:
一种基于图像增强和改进YOLOv5的小麦赤霉病检测方法,包括以下步骤:步骤1,构建小麦赤霉病数据集:收集小麦赤霉病图像,通过数据增强扩展图像数量,通过Labelme标注工具按照符合YOLOv5的格式对扩展后的图像进行标注,并划分图像为训练集和测试集;步骤2,构建图像超分辨率系统,将所述训练集输入该系统进行预处理,输出超分辨率图像以提高图像的分辨率,其中,图像超分辨率系统使用Esrgan超分辨率生成器生成对抗网络,包括加入RDDB模块的生成网络和RaGAN的对抗网络,通过判别器判别Esrgan超分辨率生成器输出的图像是否真实;步骤3,构建改进后的YOLOv5的赤霉病害检测系统对赤霉病进行检测,该系统包括依次连接的用于特征提取的Backbone网络、用于特征融合Neck网络和用于预测的Head网络,将步骤2输出的超分辨率图像输入改进后的YOLOv5网络中,以输出不同尺寸大小的预测病害目标;步骤4,基于测试集,验证赤霉病害检测系统的准确率:将测试集中的图像输入改进后YOLOv5目标检测模型,得到小麦赤霉病害种类以及病害位置的检测结果
根据以上步骤1、步骤2、步骤3、步骤4,利用Python对输入图片进行超分辨率和基于改进后YOLOv5检测算法相结合,该识别和检测结果可以存放在设置的文件中保存并对用户进行显示。
作为优选,数据增强为:首先,对图像进行线性亮度和对比度调整;其次,对处理过的图像进行尺度变换,以调整至统一大小;最后,通过翻转和添加高斯噪声对图像数据集随机添加噪声干扰并进行高斯滤波,实现图像集的扩充。
作为优选,对图像进行标注即为对图像进行分类,标注小麦赤霉病图像的病害种类以及病害位置,按照一定比例划分为训练集和检测集。
作为优选,步骤2中的图像超分辨率系统包括判别器网络、Esrgan超分辨率生成器和VGG网络,其中,判别器网络使用具有Ragan的网络模型,对生成的超分辨图片和真实的超分辨率图片进行判别,图像超分辨率系统的网络结构为VGG网络,用于判别真实图片的概率值,基于判别结果不断优化生成器,得到最终预期的重建后超分辨率样本。
作为优选,步骤2具体为:将图片输入到Esrgan超分辨率生成器网络提取浅层特征,然后通过层叠式残差密集模块RRDB提取深层特征;其中,残差密集模块RRDB包括3个Dense block模块,每个Dense block模块包括5个相同的卷积层和LReLU模块,彼此之间通过残差连接组成,每一层卷积层的输出都加入至下一层卷积层的输入,使得浅层特征与深层特征相加,以提高图像的分辨率。
作为优选,Backbone网络使用Swin-Transformer作为主干网络对超分辨率重建后的图像进行调整并提取特征;基于Backbone网络提取的不同维度的特征,Neck网络采用PFN+PAN模块进行融合,以提高对小尺寸目标检测,输出的融合后特征层至Head网络;Head网络有若干个输出头,在每个特征尺寸部分,再次通过一个卷积层得到预测结果,分别按照设置的不同分辨率输出预测病害尺寸的目标。
作为优选,Backbone网络包括依次连接的Patch Partiton模块、Linear-Emebedding模块、SwinTran-Block模块和Patch-Merging模块,其中SwinTran-Block模块和Patch-Merging重复相连三次;三个SwinTran-Block模块的输出接入Neck网络。
作为优选,SwinTran-Block模块包括两层串联的LX模块,其中LX模块包括依次通过残差连接的LayerNorm层、多头注意力机制MSA模块、LayerNorm层和MLP模块;将输入每一层LX模块的特征层与经过MSA模块输出的特征层相加,该相加的特征层输入下一层LayerNorm层中,且该相加的特征层与MLP模块输出的特征进行再次相加,将二次相加后的特征层输入下一层LX模块,实现特征的深度提取。
作为优选,Neck网络包括四个子模块,四个子模块均包括依次相连的卷积层Conv、融合层Concat和C3模块,第一、第二子模块的卷积层Conv与融合层Concat之间连接上采样Upsampling模块,Backbone模块输出的特征分别连接至第一、第二子模块的融合层Concat的输入以及第一子模块的卷积层Conv的输入;第一子模块的卷积层Conv的输出还连接第四子模块的融合层Concat的输入,第二子模块的卷积层Conv的输出还连接第三子模块的融合层Concat的输入;第二、第三、第四子模块的C3模块分别输出1*1卷积层至Head模块。
作为优选,Concat模块接受Backbone网络提取的不同尺度特征提取图后,将不同尺度的病害图像采用PFN+PAN进行融合,在输入C3模块之前,将输入分为两步,一部分通过BottleNeck进行计算,另一部分通过卷积最后进行融合Concat,最后再通过一个卷积层,能够精简网络结构,减少模型参数。
有益效果:
(1)本发明将超分辨率算法应用到农业病害识别领域,与传统通用的简单预处理不同,利用深度学习的方式进行超分辨率的重建,削弱图像中的噪声、模糊等,一定程度提高了病害的纹理信息,对后续的病害检测的特征提取提供了更多的有关病害部分的特征,提高了检测的准确率。
(2)本发明所提出的图像超分辨率和改进后YOLOv5的小麦赤霉病害检测方法,在数据上采用了农学专家所鉴定后数据集并进行了精准的标注,提高了病害检测识别的识别率。
(3)本发明提出了一种基于农业场景的小麦病害检测方法,对YOLOv5进行了改进。通过将原有的主干网络替换为Swin-Transformer网络,通过多头注意力机制和滑动窗口对特征进行提取,可以取得更好的识别结果。
该发明成功有效的解决了大田图像场景较复杂、病害尺寸太小、鲁棒性差、检测准确率较低的问题。
附图说明
下面是结合附图和具体实施方式对本发明进行进一步说明:
图1是本发明实施方式中提出的基于图像超分辨率和改进后YOLOv5的小麦赤霉病害检测方法实现流程图;
图2是本发明实施方式提出的Esrgan超分辨率生成器的结构示意图;
图3是本发明实施方式提出的改进后YOLOv5的小麦赤霉病网络模型的结构示意图。
图4是本发明实施方式提出的SwinTran-Block模块的结构示意图。
图5是本发明实施方式提出的C3模块的结构示意图;
图6是本发明实施方式的测试结果图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的在于提供基于图像超分辨率和改进后YOLOv5的小麦赤霉病害检测方法,能够适用于实际农业对病害的检测,从而提高检测病害的准确性。
为解决现在小麦赤霉病检测算法不适用于实际农业场景下的问题,本发明提出了一种基于图像超分辨率和改进后YOLOv5的小麦赤霉病害检测算法,结合Esrgan超分辨率模型,使得模型在对图像进行超分辨重建后,能够使重建后高分辨的图片提供更多相关病害区域的特征。通过训练改进后YOLOv5的小麦赤霉病害检测算法,提供出一个适用的实际大田场景小麦赤霉病检测方法。本发明可以有效的适用于农业场景,并且能对处于复杂背景区域病害进行有效识别。
图1为本发明提供基于图像增强和改进YOLOv5的小麦赤霉病检测方法流程示意图,包括以下步骤:
步骤1,构建小麦赤霉病数据集:收集小麦赤霉病图像,通过数据增强扩展图像数量,通过Labelme标注工具按照符合YOLOv5的格式对扩展后的图像进行标注,并划分图像为训练集和测试集。小麦赤霉病数据集的构建是收集了由农学专家鉴定后的小麦赤霉病图像共400张,完成收集后,通过数据增强方式例如改变图像亮度和对比度、尺度变换、翻转、添加高斯噪声等方式对数据集进行扩充,最终扩展到4000张图像。然后使用Labelme标注工具按照符合YOLOv5的txt格式进行标注病害种类以及病害位置,最终生成一个txt文件。然后将标注的数据集按照8:2的比例划分为训练集和测试集。
步骤2,构建图像超分辨率系统,将所述训练集输入该系统进行预处理,提高图像的分辨率。其中,图像超分辨率系统使用Esrgan生成对抗网络,生成对抗网络包括两个部分,即加入RDDB模块的生成网络和RaGAN的对抗网络,Esrgan超分辨率生成器通过低分辨率的图像生成高分辨率图像,由判别器进行判别是否真实。
图像超分辨率系统为一种生成对抗网络,通过两个尺度为2的子像素卷积层,提高图像4倍分辨率。图像超分辨率系统使用Esrgan超分辨率生成器生成对抗网络,如图2所示,为本发明提供的一种Esrgan超分辨率生成器结构示意图,包括加入RDDB模块的生成网络和RaGAN的对抗网络,通过判别器判别Esrgan超分辨率生成器输出的图像是否真实。判别器网络使用具有Ragan网络模型,对生成的高分辨图片和真实的高分辨率图片进行判别。图像超分辨率系统的网络结构为VGG网络,将判别真实图片的概率值。基于判别结果不断优化生成器最终不断优化生成器,得到最终预期的重建后超分辨率样本。
具体的,将图片输入到Esrgan超分辨率生成器网络提取浅层特征,然后通过层叠式残差密集模块RRDB提取深层特征;其中,残差密集模块RRDB包括3个Dense block模块,每个Dense block模块包括5个相同的卷积层和LReLU模块,彼此之间通过残差连接组成,每一层卷积层的输出都加入至下一层卷积层的输入,使得浅层特征与深层特征相加,以提高图像的分辨率。由于特征图大小始终没发生变化,经过一个上采样层进行放大,也就是利用两个已经训练好的卷积层来提高图像的分辨率。
步骤3,构建改进后的YOLOv5的赤霉病害检测系统对赤霉病进行检测,将步骤2中提高分辨率后的图像输入改进后的YOLOv5网络中,以输出不同尺寸大小的预测病害目标。
YOLOv5网络包括依次连接的用于特征提取的Backbone网络、用于特征融合Neck网络和用于预测的Head网络。Backbone网络使用Swin-Transformer作为主干网络对超分辨率重建后的图像进行调整并提取特征;基于Backbone网络提取的不同维度的特征,Neck网络采用PFN+PAN模块进行融合,以提高对小尺寸目标检测,输出的融合后特征层至Head网络;Head网络有若干个输出头,在每个特征尺寸部分,再次通过一个卷积层得到预测结果,分别按照设置的不同分辨率输出预测病害尺寸的目标。
改进后YOLOv5的赤霉病害检测系统是在将超分辨后提高了4倍图像分辨率的图像输入到改进后的YOLOv5检测模型中进行检测。
如图3所示,本基于改进后YOLOv5的包括进行特征提取的Backbone网络、用于特征融合Neck网络、用于预测的Head网络。Backbone网络使用多头注意力网络Swin-Transformer替换掉原有的CSPDarknet53主干网络,只利用注意力机制提高全上下文对病害的特征关注,增强特征表达能力。Backbone部分主要包括一个分割模块Patch Partiton、一个Linear-Emebedding模块、三个Patch-Merging模块及4个SwinTran-Block模块,主干网络中依次连接Patch Partiton模块、Linear-Emebedding模块、SwinTran-Block模块和Patch-Merging模块,其中SwinTran-Block模块和Patch-Merging模块依次相连三次,三个SwinTran-Block模块的输出接入Neck网络。
如图4所示,SwinTran-Block模块包括两个基于移位窗口配置的多头注意力机制模块MSA。SwinTran-Block模块包括依次连接的两层LX模块,每一层LX模块均包括依次连接的LayerNorm(LN)层、MSA、LayerNorm(LN)层和MLP层;第一层LX模块中的MLP模块的输出连接下一层LayerNorm层的输入,在每个MSA模块和每个MLP之前使用LayerNorm层,并在每个MSA和MLP之后使用残差连接。将输入每一层LX模块的特征层与经过MSA模块输出的特征层相加,该相加的特征层输入下一层LayerNorm层中,且该相加的特征层与MLP模块输出的特征进行再次相加,将二次相加后的特征层输入下一层LX模块,实现特征的深度提取。
Neck网络包括四个子模块,四个子模块均包括依次相连的卷积层Conv、融合层Concat和C3模块,第一、第二子模块的卷积层Conv与融合层Concat之间连接上采样Upsampling模块,Backbone模块输出的特征分别连接至第一、第二子模块的融合层Concat的输入以及第一子模块的卷积层Conv的输入;第一子模块的卷积层Conv的输出还连接第四子模块的融合层Concat的输入,第二子模块的卷积层Conv的输出还连接第三子模块的融合层Concat的输入;第二、第三、第四子模块的C3模块分别输出1*1卷积层至Head模块。
Neck部分接受Backbone网络提取的三层不同尺度特征提取图后,将不同尺度的病害图像采用PFN+PAN结构网络对的模块进行融合,采用了C3模块代替了BottleNeckCSP模块,如图5所示,在输入之前,将输入分为两步,一部分通过BottleNeck进行计算,另一部分通过卷积最后进行Concat,最后再通过一个卷积层。C3模块加强了CNN学习能力,减少内存消耗,减少计算瓶颈可以精简网络结构,减少模型参数。Head部分在每个特征尺寸部分,再次通过一个卷积层得到预测结果。
FPN结构是将不同分辨率大小的特征图进行下采样,PAN是自下而上的路径增强的网络结构能较好地保留浅层特征信息。
步骤4,基于测试集,验证本发明的准确率,将测试集中的图像输入改进后YOLOv5目标检测模型,得到小麦赤霉病害种类以及病害位置的检测结果。
病害数据显示系统皆是利用Python对输入图片进行超分辨率和基于改进后YOLOv5检测算法相结合,该识别和检测结果可以存放在设置的文件中保存并对用户进行显示。
如图6所示,为本发明的测试结果,下表1为测试数据,本发明基于改进YOLOv5的检测模型的精确率和召回率高,解决了大田图像场景较复杂、病害尺寸太小、鲁棒性差、检测准确率较低的问题。
表1
Method | 精确率 | 召回率 | Map |
改进YOLOv5 | 94.12% | 87.46% | 95.9% |
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (6)
1.一种基于图像增强和改进YOLOv5的小麦赤霉病检测方法,其特征在于,包括以下步骤:
步骤1,构建小麦赤霉病数据集:收集小麦赤霉病图像,通过数据增强扩展图像数量:首先,对图像进行线性亮度和对比度调整;其次,对处理过的图像进行尺度变换,以调整至统一大小;最后,通过翻转和添加高斯噪声对图像数据集随机添加噪声干扰并进行高斯滤波,实现图像集的扩充;
通过Labelme标注工具按照符合YOLOv5的格式对扩展后的图像进行标注,标注即为对图像进行分类,标注小麦赤霉病图像的病害种类以及病害位置,按照一定比例划分为训练集和测试集;
步骤2,构建图像超分辨率系统,将所述训练集输入该系统进行预处理,输出超分辨率图像以提高图像的分辨率,
其中,图像超分辨率系统包括判别器网络、Esrgan超分辨率生成器和VGG网络,使用Esrgan超分辨率生成器生成对抗网络,包括加入RDDB模块的生成网络和RaGAN的对抗网络,通过判别器判别Esrgan超分辨率生成器输出的超分辨率图片是否真实,通过VGG网络判别真实图片的概率值,基于判别结果不断优化生成器,得到最终预期的重建后超分辨率样本;
步骤3,构建改进后的YOLOv5的赤霉病害检测系统对赤霉病进行检测,该系统包括依次连接的用于特征提取的Backbone网络、用于特征融合Neck网络和用于预测的Head网络,
将步骤2输出的超分辨率图像输入改进后的YOLOv5网络中,以输出不同尺寸大小的预测病害目标,所述Backbone网络使用Swin-Transformer作为主干网络对超分辨率重建后的图像进行调整并提取特征;基于Backbone网络提取的不同维度的特征,Neck网络采用PFN+PAN模块进行融合,以提高对小尺寸目标检测,输出的融合后特征层至Head网络;Head网络有若干个输出头,在每个特征尺寸部分,再次通过一个卷积层得到预测结果,分别按照设置的不同分辨率输出预测病害尺寸的目标;
步骤4,基于测试集,验证赤霉病害检测系统的准确率:将测试集中的图像输入改进后YOLOv5目标检测模型,得到小麦赤霉病害种类以及病害位置的检测结果。
2.根据权利要求1所述的基于图像增强和改进YOLOv5的小麦赤霉病检测方法,其特征在于,步骤2具体为:将图片输入到Esrgan超分辨率生成器网络提取浅层特征,然后通过层叠式残差密集模块RRDB提取深层特征;其中,残差密集模块RRDB包括3个Dense block模块,每个Dense block模块包括5个相同的卷积层和LReLU模块,彼此之间通过残差连接组成,每一层卷积层的输出都加入至下一层卷积层的输入,使得浅层特征与深层特征相加,以提高图像的分辨率。
3.根据权利要求1所述的基于图像增强和改进YOLOv5的小麦赤霉病检测方法,其特征在于,所述Backbone网络包括依次连接的Patch Partiton模块、Linear-Emebedding模块、SwinTran-Block模块和Patch-Merging模块,其中SwinTran-Block模块和Patch-Merging重复相连三次;三个SwinTran-Block模块的输出接入Neck网络。
4.根据权利要求3所述的基于图像增强和改进YOLOv5的小麦赤霉病检测方法,其特征在于,所述SwinTran-Block 模块包括两层串联的LX模块,其中LX模块包括依次通过残差连接的LayerNorm层、多头注意力机制MSA模块、LayerNorm层和MLP模块;
将输入每一层LX模块的特征层与经过MSA模块输出的特征层相加,该相加的特征层输入下一层LayerNorm层中,且该相加的特征层与MLP模块输出的特征进行再次相加,将二次相加后的特征层输入下一层LX模块,实现特征的深度提取。
5.根据权利要求4所述的基于图像增强和改进YOLOv5的小麦赤霉病检测方法,其特征在于,所述Neck网络包括四个子模块,四个子模块均包括依次相连的卷积层Conv、融合层Concat和C3模块,第一、第二子模块的卷积层Conv与融合层Concat之间连接上采样Upsampling模块,Backbone模块输出的特征分别连接至第一、第二子模块的融合层Concat的输入以及第一子模块的卷积层Conv的输入;第一子模块的卷积层Conv的输出还连接第四子模块的融合层Concat的输入,第二子模块的卷积层Conv的输出还连接第三子模块的融合层Concat的输入;第二、第三、第四子模块的C3模块分别输出1*1卷积层至Head模块。
6.根据权利要求5所述的基于图像增强和改进YOLOv5的小麦赤霉病检测方法,其特征在于,Concat模块接受Backbone网络提取的不同尺度特征提取图后,将不同尺度的病害图像采用PFN+PAN进行融合,在输入C3模块之前,将输入分为两步,一部分通过BottleNeck进行计算,另一部分通过卷积最后进行融合Concat,最后再通过一个卷积层,能够精简网络结构,减少模型参数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210482581.1A CN114841961B (zh) | 2022-05-05 | 2022-05-05 | 基于图像增强和改进YOLOv5的小麦赤霉病检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210482581.1A CN114841961B (zh) | 2022-05-05 | 2022-05-05 | 基于图像增强和改进YOLOv5的小麦赤霉病检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114841961A CN114841961A (zh) | 2022-08-02 |
CN114841961B true CN114841961B (zh) | 2024-04-05 |
Family
ID=82567654
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210482581.1A Active CN114841961B (zh) | 2022-05-05 | 2022-05-05 | 基于图像增强和改进YOLOv5的小麦赤霉病检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114841961B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024077741A1 (en) * | 2022-10-13 | 2024-04-18 | Guangdong Oppo Mobile Telecommunications Corp., Ltd. | Convolutional neural network filter for super-resolution with reference picture resampling functionality in versatile video coding |
CN115546187A (zh) * | 2022-10-28 | 2022-12-30 | 北京市农林科学院 | 基于YOLO v5的农业病虫害检测方法及装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110956126A (zh) * | 2019-11-27 | 2020-04-03 | 云南电网有限责任公司电力科学研究院 | 一种联合超分辨率重建的小目标检测方法 |
CN113298718A (zh) * | 2021-06-22 | 2021-08-24 | 云南大学 | 一种单幅图像超分辨率重建方法及系统 |
CN114219984A (zh) * | 2021-12-14 | 2022-03-22 | 华南农业大学 | 一种基于改进YOLOv3的微小病虫害检测系统及其方法 |
WO2022057837A1 (zh) * | 2020-09-16 | 2022-03-24 | 广州虎牙科技有限公司 | 图像处理和人像超分辨率重建及模型训练方法、装置、电子设备及存储介质 |
-
2022
- 2022-05-05 CN CN202210482581.1A patent/CN114841961B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110956126A (zh) * | 2019-11-27 | 2020-04-03 | 云南电网有限责任公司电力科学研究院 | 一种联合超分辨率重建的小目标检测方法 |
WO2022057837A1 (zh) * | 2020-09-16 | 2022-03-24 | 广州虎牙科技有限公司 | 图像处理和人像超分辨率重建及模型训练方法、装置、电子设备及存储介质 |
CN113298718A (zh) * | 2021-06-22 | 2021-08-24 | 云南大学 | 一种单幅图像超分辨率重建方法及系统 |
CN114219984A (zh) * | 2021-12-14 | 2022-03-22 | 华南农业大学 | 一种基于改进YOLOv3的微小病虫害检测系统及其方法 |
Non-Patent Citations (1)
Title |
---|
张航 ; 程清 ; 武英洁 ; 王亚新 ; 张承明 ; 殷复伟 ; .一种基于卷积神经网络的小麦病害识别方法.山东农业科学.2018,(03),全文. * |
Also Published As
Publication number | Publication date |
---|---|
CN114841961A (zh) | 2022-08-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114841961B (zh) | 基于图像增强和改进YOLOv5的小麦赤霉病检测方法 | |
CN111986099A (zh) | 基于融合残差修正的卷积神经网络的耕地监测方法及系统 | |
CN111898432B (zh) | 一种基于改进YOLOv3算法的行人检测系统及方法 | |
CN115272828B (zh) | 一种基于注意力机制的密集目标检测模型训练方法 | |
US20220215656A1 (en) | Method, apparatus, device for image processing, and storage medium | |
CN113657326A (zh) | 一种基于多尺度融合模块和特征增强的杂草检测方法 | |
Chen et al. | Study on fusion clustering and improved YOLOv5 algorithm based on multiple occlusion of Camellia oleifera fruit | |
CN113628297A (zh) | 一种基于注意力机制和迁移学习的covid-19深度学习诊断系统 | |
CN114693616A (zh) | 一种基于改进目标检测模型与卷积神经网络的水稻病害检测方法、设备和介质 | |
CN115797781A (zh) | 农作物识别方法、装置、计算机设备和存储介质 | |
dos Santos Ferreira et al. | Unsupervised domain adaptation using transformers for sugarcane rows and gaps detection | |
Lu et al. | Citrus green fruit detection via improved feature network extraction | |
Zhang et al. | TPMv2: An end-to-end tomato pose method based on 3D key points detection | |
CN112070172A (zh) | 基于目标性分析的异常目标检测方法、装置及计算机设备 | |
CN117132802A (zh) | 一种田间小麦病虫害识别方法、装置及存储介质 | |
Vidanapathirana et al. | Pomegranate Farming Monitoring System | |
CN116012718B (zh) | 田间害虫检测方法、系统、电子设备及计算机存储介质 | |
Chen et al. | The Technology of Kiwifruit Pest and Disease Identification Based on Deep Learning | |
CN116486254A (zh) | 一种基于增强局部上下文监督信息的目标计数模型训练方法 | |
CN117333863A (zh) | 一种基于改进YOLOv8s的麦穗检测方法 | |
Liu | Analysis of Image Data Augmentation in Smart Agriculture | |
CN113343751A (zh) | 一种小目标果实的检测方法及系统 | |
Shobana et al. | Plant Disease Detection Using Deep Neural Network | |
Shi et al. | Crop plant automatic detecting based on in-field images by lightweight DFU-Net model | |
CN117876843A (zh) | 一种具有动态降低图像冗余的高效农作物病害识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |