CN115565168A - 一种基于注意力机制残差胶囊网络的甘蔗病害识别方法 - Google Patents
一种基于注意力机制残差胶囊网络的甘蔗病害识别方法 Download PDFInfo
- Publication number
- CN115565168A CN115565168A CN202211288394.6A CN202211288394A CN115565168A CN 115565168 A CN115565168 A CN 115565168A CN 202211288394 A CN202211288394 A CN 202211288394A CN 115565168 A CN115565168 A CN 115565168A
- Authority
- CN
- China
- Prior art keywords
- capsule
- sugarcane
- disease
- residual error
- sugarcane disease
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/68—Food, e.g. fruit or vegetables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/42—Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
Abstract
本发明公开一种基于注意力机制残差胶囊网络的甘蔗病害识别方法,包括步骤:S10,获取待识别的甘蔗病害图片;S20,将获取图片进行预处理;S30,将处理后图片经过甘蔗病害识别模型进行病害识别,并获得识别结果;所述甘蔗病害识别模型采用基于注意力机制残差胶囊网络构架,包括步骤:S31,将图片输入至残差提取模块进行特征提取,所述残差提取模块采用注意力机制;S32,再经过胶囊模块,通过主胶囊层将标量神经元转换为矢量神经元,并利用动态路由算法有选择地激活主胶囊层和数字胶囊层中的高层胶囊,获得病害识别结。本发明用以解决传统的农作物病害识别方法存在需要大量训练样本、训练耗时、训练参数过多、以及计算成本高的问题。
Description
技术领域
本发明属于农作物病害识别技术领域,特别是涉及一种基于注意力机制残差胶囊网络的甘蔗病害识别方法。
背景技术
甘蔗是一种重要的经济作物,其不仅是我国最重要的糖料作物,还是最主要的糖料作物。甘蔗病害是甘蔗减产和品质下降的主要原因之一,常见的甘蔗病害有蔗叶蟑、粉蚧、蝽蟓、螨类病等,精准快速地识别甘蔗病害可以有效地减少因甘蔗病害带来的减产。传统人工识别甘蔗病害,不仅费时费力而且时效性低。因此,为实现现代农业发展的精准化、智能化,在甘蔗种植过程中亟需一种准确、实时、高效的方法来进行甘蔗病害的自动识别,既能将种植者从繁琐、低效的工作中解放出来,又能确保作物得到及时诊断与治疗。如何使机器代替人识别作物病害,已成为21世纪农业自动化领域新的研究方向。
目前使用计算机视觉技术对农业生产进行智能化管控,已经成为许多国家农业发展的主要趋势。其中计算机视觉技术也是实现对农作物病害快速识别的有效手段之一。现有的基于图像的作物病害识别方法大致可分为基于传统机器学习和基于深度卷积神经网络两类方法。基于传统机器学习方法进行农作物病害识别一般包括三个步骤:病害分割、特征提取和分类器分类。这类方法的研究开展较早,也取得了显著的成果。但这些方法都是通过手工选取特征来构建病害分类器,需要消耗大量的时间进行图像预处理以及评估特征的有效性,而且由于植物类型、生长阶段、病害种类、环境光照等因素的影响,导致病害症状复杂,特征提取相当困难。而基于深度卷积神经网络由于其能够系统地从原始图像中自动学习特征。因此,基于深度卷积神经网络应用于农业病害识别并取得了显著的效果。综上所述,目前基于甘蔗病害研究存在一下问题:(1)甘蔗病害样本数据获取比较困难,导致样本数量不够、数据类别不均衡等问题;(2)CNN模型需要大量训练样本和参数,以及池化层操作过程中空间信息的丢失问题;(3)随着网络层数的增加,网络收敛速度减慢,图像分类准确率下降问题;(4)深层神经网络容易出现的梯度消失和梯度爆炸问题。
发明内容
为了解决上述问题,本发明提出了一种基于注意力机制残差胶囊网络的甘蔗病害识别方法,用以解决传统的农作物病害识别方法存在需要大量训练样本、训练耗时、训练参数过多、以及计算成本高的问题。
为达到上述目的,本发明采用的技术方案是:一种基于注意力机制残差胶囊网络的甘蔗病害识别方法,包括步骤:
S10,获取待识别的甘蔗病害图片;
S20,将获取图片进行预处理;
S30,将处理后图片经过甘蔗病害识别模型进行病害识别,并获得识别结果;
所述甘蔗病害识别模型采用基于注意力机制残差胶囊网络构架,包括步骤:
S31,将图片输入至残差提取模块进行特征提取,所述残差提取模块采用注意力机制;
S32,再经过胶囊模块,通过主胶囊层将标量神经元转换为矢量神经元,并利用动态路由算法有选择地激活主胶囊层和数字胶囊层中的高层胶囊,获得病害识别结果。
进一步的是,训练甘蔗病害识别模型的方法,包括步骤:
获取大量甘蔗病害图片,并建立相应的数据集;
通过Python将数据集中的甘蔗病害图片进行预处理;
将数据集输入基于注意力机制残差胶囊网络构架进行训练获得所述甘蔗病害识别模型。
进一步的是,将数据集输入基于注意力机制残差胶囊网络构架进行训练获得所述甘蔗病害识别模型,包括步骤:
根据甘蔗病害图片及其病害程度,将预处理后的甘蔗病害图片进行标签标记及其相对应的类别;
将不同类别的甘蔗病害图片输入到基于注意力机制残差提取模块中进行特征提取;通过使用小卷积核和身份映射来提取不同的特征,并利用残差提取模块进行特征融合;
将基于注意力机制残差模块提取的特征发送给胶囊模块,在胶囊模块中建立识别体系。
进一步的是,在对胶囊网络进行编码之前,使用激活函数来增加分类模型的非线性,使其在稍有负值时能获得更好的梯度流,从而保证胶囊网络能激活更多的神经元。
进一步的是,在残差提取模块中,处理过程包括步骤:
S311,将不同类别的甘蔗病害图片输入到基于注意力机制的残差模块中获取预设图像特征值;
S312,将每个通道的二维特征值顺着空间维度进行压缩,并将其作为全局特征上下文信息;
S313,将上阶段得到的压缩后的全局特征上下文信息与全连接层连接;
S314,对特征图进行重新标定,在得到通道间的权重调整参数后,将其与原特征图相乘,获得通道权重调整后的特征图。
进一步的是,在胶囊模块中,处理过程包括步骤:
S321,对输入向量做乘法,通过矩阵转化操作得到高级特征;
S322,对输入向量进行标量加权;并对得到向量求和:
S323,向量到向量的非线性转换后,胶囊输出最终识别结果。
采用本技术方案的有益效果:
本发明为了解决卷积神经网络所需要的大量数据,本发明不需要数据增强方式来扩充原始数据集。由于胶囊网络只能提取浅层特征,本发明以残差网络作为骨干网络以加强特征转移和特征利用,其独特的设计结构解决了深层神经网络容易出现的梯度消失和梯度爆炸问题以及有效改善随着卷积层数的增加训练效果降低的问题,并使模型收敛速度加快、分类准确率提高。胶囊网络通过主胶囊层将标量神经元转换为矢量神经元,并利用动态路由算法有选择地激活主胶囊层和数字胶囊层中的高层胶囊,获得病变识别结果。
本发明通过融合残差网络、胶囊网络及注意力机制,提出了一个新的残差胶囊网络模型。本发明以残差网络作为骨干网络并对其进行改进,设计融合残差网络和胶囊网络以提高模型识别性能,对甘蔗病害图像进行识别,避免了人为主观因素影响识别结果。本发明通过优化残差网络模型的结构和参数,构建基于残差胶囊网络的甘蔗病害图像识别模型,提高甘蔗病害图像的识别分类性能,并将甘蔗病害识别模型搭载到相应的应用程序上,实现快速有效的甘蔗病害识别。
利用本发明提出的方法,当种植者在无法确认甘蔗所患病害时可以通过手机拍照上传到相应地识别应用,这样可以实现快速、准确的识别,并且保证了低成本、耗时短,方便种植者及时的识别甘蔗病害并采取相应地防治措施,从而有效地减少识别错误而导致的经济损失。
附图说明
图1为本发明的一种基于注意力机制残差胶囊网络的甘蔗病害识别方法流程示意图;
图2为本发明实施例中注意力机制残差模块的结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图对本发明作进一步阐述。
在本实施例中,参见图1所示,本发明提出了一种基于注意力机制残差胶囊网络的甘蔗病害识别方法,包括步骤:
S10,获取待识别的甘蔗病害图片;
S20,将获取图片进行预处理;
S30,将处理后图片经过甘蔗病害识别模型进行病害识别,并获得识别结果;
所述甘蔗病害识别模型采用基于注意力机制残差胶囊网络构架,包括步骤:
S31,将图片输入至残差提取模块进行特征提取,所述残差提取模块采用注意力机制;
S32,再经过胶囊模块,通过主胶囊层将标量神经元转换为矢量神经元,并利用动态路由算法有选择地激活主胶囊层和数字胶囊层中的高层胶囊,获得病害识别结果。
作为上述实施例的优化方案,训练甘蔗病害识别模型的方法,包括步骤:
获取大量甘蔗病害图片,并建立相应的数据集;
通过Python将数据集中的甘蔗病害图片进行预处理;
将数据集输入基于注意力机制残差胶囊网络构架进行训练获得所述甘蔗病害识别模型。
具体的,将数据集输入基于注意力机制残差胶囊网络构架进行训练获得所述甘蔗病害识别模型,包括步骤:
根据甘蔗病害图片及其病害程度,将预处理后的甘蔗病害图片进行标签标记及其相对应的类别;
将不同类别的甘蔗病害图片输入到基于注意力机制残差提取模块中进行特征提取;通过使用小卷积核和身份映射来提取不同的特征,并利用残差提取模块进行特征融合;以保证胶囊模块编码对图像特征的充分提取;这种结构可以解决网络层简单叠加造成的多参数和模型退化的问题;其次,为残差模块引入注意力机,注意力机制可以调整每个通道的权重,帮助模型捕获到对识别任务更有帮助的语义信息,增强有用信息,抑制噪声等干扰元素的权重,减弱其对模型识别的负面影响,增强了卷积神经网络的表达能力,最终达到提高模型识别性能的目的;
将基于注意力机制残差模块提取的特征发送给胶囊模块,在胶囊模块中建立识别体系。
优选的,在对胶囊网络进行编码之前,使用激活函数来增加分类模型的非线性,使其在稍有负值时能获得更好的梯度流,从而保证胶囊网络能激活更多的神经元。
作为上述实施例的优化方案,在残差提取模块中,注意力机制残差模块结构如图2所示,处理过程包括步骤:
S311,将不同类别的甘蔗病害图片输入到基于注意力机制的残差模块中获取预设图像特征值;
S312,将每个通道的二维特征值顺着空间维度进行压缩,并将其作为全局特征上下文信息;
式中,Zc为输出特征图,Fsq()为Squeeze操作函数,uc为输入特征图,W、H为特征图的宽和高,(i,j)为特征图上的坐标位置;
S313,将上阶段得到的压缩后的全局特征上下文信息与全连接层连接,用于缩减通道数,减少网络的参数量和计算复杂度;
s=Fex(zc,Wi)=δ(W2σ(W1zc));
式中,s为通道间权重调整的参数,Fex()为Excitation操作函数,σ为ReLU激活函数,δ为Sigmoid函数,Wi是权重i取1或2;
S314,对特征图进行重新标定,在得到通道间的权重调整参数后,将其与原特征图相乘,获得通道权重调整后的特征图:
作为上述实施例的优化方案,在胶囊模块中,处理过程包括步骤:
S321,对输入向量做乘法,通过矩阵转化操作得到高级特征;
S322,对输入向量进行标量加权;并对得到向量求和:
式中,sj为l层胶囊的总输入,cij为胶囊i连接到胶囊j的连接概率,bij为胶囊i连接到胶囊j的先验概率;
S323,向量到向量的非线性转换;
式中,vj为1+l层的胶囊输出。
综上所述,本发明的主要特点在于:
①本发明提供了一种基于注意力机制残差胶囊网络的甘蔗病害识别系统。该模型在甘蔗病害识别任务中具有优异的表现,并且在使用少量数据集及控制模型占用内存容量的前提下,能够明显提升了模型的识别准确率,较好地平衡了模型复杂度与识别精度;
②本发明设计的融合残差胶囊网络。其中残差模块能够利用残差提取模块进行特征融合,以保证胶囊模块编码对图像特征的充分提取;其次,可以解决网络层简单叠加造成的多参数和模型退化的问题;
③利用残差模块提取的特征将其发送给胶囊模块,这有效地加强了特征转移和特征利用。胶囊模块通过主胶囊层将标量神经元转换为矢量神经元,并利用动态路由算法有选择地激活主胶囊层和数字胶囊层中的高层胶囊,获得病害识别结果。
以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。
Claims (6)
1.一种基于注意力机制残差胶囊网络的甘蔗病害识别方法,其特征在于,包括步骤:
S10,获取待识别的甘蔗病害图片;
S20,将获取图片进行预处理;
S30,将处理后图片经过甘蔗病害识别模型进行病害识别,并获得识别结果;
所述甘蔗病害识别模型采用基于注意力机制残差胶囊网络构架,包括步骤:
S31,将图片输入至残差提取模块进行特征提取,所述残差提取模块采用注意力机制;
S32,再经过胶囊模块,通过主胶囊层将标量神经元转换为矢量神经元,并利用动态路由算法有选择地激活主胶囊层和数字胶囊层中的高层胶囊,获得病害识别结果。
2.根据权利要求1所述的一种基于注意力机制残差胶囊网络的甘蔗病害识别方法,其特征在于,训练甘蔗病害识别模型的方法,包括步骤:
获取大量甘蔗病害图片,并建立相应的数据集;
通过Python将数据集中的甘蔗病害图片进行预处理;
将数据集输入基于注意力机制残差胶囊网络构架进行训练获得所述甘蔗病害识别模型。
3.根据权利要求2所述的一种基于注意力机制残差胶囊网络的甘蔗病害识别方法,其特征在于,将数据集输入基于注意力机制残差胶囊网络构架进行训练获得所述甘蔗病害识别模型,包括步骤:
根据甘蔗病害图片及其病害程度,将预处理后的甘蔗病害图片进行标签标记及其相对应的类别;
将不同类别的甘蔗病害图片输入到基于注意力机制残差提取模块中进行特征提取;通过使用小卷积核和身份映射来提取不同的特征,并利用残差提取模块进行特征融合;
将基于注意力机制残差模块提取的特征发送给胶囊模块,在胶囊模块中建立识别体系。
4.根据权利要求3所述的一种基于注意力机制残差胶囊网络的甘蔗病害识别方法,其特征在于,在对胶囊网络进行编码之前,使用激活函数来增加分类模型的非线性,使其在稍有负值时能获得更好的梯度流,从而保证胶囊网络能激活更多的神经元。
5.根据权利要求3所述的一种基于注意力机制残差胶囊网络的甘蔗病害识别方法,其特征在于,在残差提取模块中,处理过程包括步骤:
S311,将不同类别的甘蔗病害图片输入到基于注意力机制的残差模块中获取预设图像特征值;
S312,将每个通道的二维特征值顺着空间维度进行压缩,并将其作为全局特征上下文信息;
S313,将上阶段得到的压缩后的全局特征上下文信息与全连接层连接;
S314,对特征图进行重新标定,在得到通道间的权重调整参数后,将其与原特征图相乘,获得通道权重调整后的特征图。
6.根据权利要求3所述的一种基于注意力机制残差胶囊网络的甘蔗病害识别方法,其特征在于,在胶囊模块中,处理过程包括步骤:
S321,对输入向量做乘法,通过矩阵转化操作得到高级特征;
S322,对输入向量进行标量加权;并对得到向量求和:
S323,向量到向量的非线性转换后,胶囊输出最终识别结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211288394.6A CN115565168A (zh) | 2022-10-20 | 2022-10-20 | 一种基于注意力机制残差胶囊网络的甘蔗病害识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211288394.6A CN115565168A (zh) | 2022-10-20 | 2022-10-20 | 一种基于注意力机制残差胶囊网络的甘蔗病害识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115565168A true CN115565168A (zh) | 2023-01-03 |
Family
ID=84746046
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211288394.6A Pending CN115565168A (zh) | 2022-10-20 | 2022-10-20 | 一种基于注意力机制残差胶囊网络的甘蔗病害识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115565168A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116030454A (zh) * | 2023-03-28 | 2023-04-28 | 中南民族大学 | 一种基于胶囊网络和多语言模型的文字识别方法及系统 |
-
2022
- 2022-10-20 CN CN202211288394.6A patent/CN115565168A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116030454A (zh) * | 2023-03-28 | 2023-04-28 | 中南民族大学 | 一种基于胶囊网络和多语言模型的文字识别方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2022160771A1 (zh) | 基于自适应多尺度特征提取模型的高光谱图像分类方法 | |
AU2020102885A4 (en) | Disease recognition method of winter jujube based on deep convolutional neural network and disease image | |
CN110148120B (zh) | 一种基于cnn与迁移学习的病害智能识别方法及系统 | |
CN111696101A (zh) | 一种基于SE-Inception的轻量级茄科病害识别方法 | |
CN109886161B (zh) | 一种基于可能性聚类和卷积神经网络的道路交通标识识别方法 | |
CN113919443B (zh) | 一种基于图像分析烟叶成熟度状态概率计算方法 | |
CN111127423B (zh) | 一种基于cnn-bp神经网络算法水稻病虫害识别方法 | |
CN109871892A (zh) | 一种基于小样本度量学习的机器人视觉认知系统 | |
CN113610035B (zh) | 一种基于改进编解码网络的水稻分蘖期杂草分割识别方法 | |
CN112488963A (zh) | 一种用于农作物病害数据的增强方法 | |
CN109086823B (zh) | 一种小麦赤霉病病穗率自动统计方法 | |
CN113221913A (zh) | 一种基于高斯概率决策级融合的农林病虫害细粒度识别方法及装置 | |
CN113435254A (zh) | 一种基于哨兵二号影像的耕地深度学习提取方法 | |
CN115565168A (zh) | 一种基于注意力机制残差胶囊网络的甘蔗病害识别方法 | |
CN114092699A (zh) | 基于迁移学习的群猪图像分割的方法及系统 | |
CN113344077A (zh) | 一种基于卷积胶囊网络结构的抗噪茄科病害识别方法 | |
CN111191510B (zh) | 基于关系网络的复杂场景下遥感图像小样本目标识别方法 | |
CN110363240B (zh) | 一种医学影像分类方法与系统 | |
CN117132802A (zh) | 一种田间小麦病虫害识别方法、装置及存储介质 | |
DOUTOUM et al. | Classification of Guava Leaf Disease using Deep Learning | |
Enawugaw et al. | Machine Learning Based Soil-Type Classification | |
Jin et al. | An improved mask r-cnn method for weed segmentation | |
CN114462558A (zh) | 一种数据增广的监督学习图像缺陷分类方法与系统 | |
CN113627329A (zh) | 基于混合卷积网络的小麦种子高光谱图像分类方法及系统 | |
CN112487909A (zh) | 一种基于并联卷积神经网络的水果品种识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |