CN116843952A - 一种面向果蔬病害识别的小样本学习分类方法 - Google Patents
一种面向果蔬病害识别的小样本学习分类方法 Download PDFInfo
- Publication number
- CN116843952A CN116843952A CN202310658717.4A CN202310658717A CN116843952A CN 116843952 A CN116843952 A CN 116843952A CN 202310658717 A CN202310658717 A CN 202310658717A CN 116843952 A CN116843952 A CN 116843952A
- Authority
- CN
- China
- Prior art keywords
- feature
- fruit
- attention
- features
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 201000010099 disease Diseases 0.000 title claims abstract description 110
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 title claims abstract description 110
- 235000012055 fruits and vegetables Nutrition 0.000 title claims abstract description 71
- 238000000034 method Methods 0.000 title claims abstract description 60
- 238000012549 training Methods 0.000 claims description 54
- 230000006870 function Effects 0.000 claims description 37
- 230000004927 fusion Effects 0.000 claims description 25
- 239000013598 vector Substances 0.000 claims description 23
- 238000011176 pooling Methods 0.000 claims description 18
- 230000008569 process Effects 0.000 claims description 17
- 230000004913 activation Effects 0.000 claims description 16
- 238000009826 distribution Methods 0.000 claims description 16
- 238000004364 calculation method Methods 0.000 claims description 14
- 238000010586 diagram Methods 0.000 claims description 12
- 238000002474 experimental method Methods 0.000 claims description 12
- 230000008859 change Effects 0.000 claims description 7
- 239000000284 extract Substances 0.000 claims description 7
- 238000013508 migration Methods 0.000 claims description 7
- 230000005012 migration Effects 0.000 claims description 7
- 230000001419 dependent effect Effects 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 6
- 238000013461 design Methods 0.000 claims description 5
- 238000013507 mapping Methods 0.000 claims description 4
- 230000008447 perception Effects 0.000 claims description 4
- 230000003044 adaptive effect Effects 0.000 claims description 3
- 238000004590 computer program Methods 0.000 claims description 3
- 230000009467 reduction Effects 0.000 claims description 3
- 238000010276 construction Methods 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 11
- 238000012271 agricultural production Methods 0.000 abstract description 4
- 230000002265 prevention Effects 0.000 abstract 1
- 241000196324 Embryophyta Species 0.000 description 10
- 230000008676 import Effects 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000013135 deep learning Methods 0.000 description 4
- 238000013136 deep learning model Methods 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 238000010606 normalization Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 238000012795 verification Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 240000008067 Cucumis sativus Species 0.000 description 2
- 235000010799 Cucumis sativus var sativus Nutrition 0.000 description 2
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 2
- 240000007594 Oryza sativa Species 0.000 description 2
- 235000007164 Oryza sativa Nutrition 0.000 description 2
- 240000003768 Solanum lycopersicum Species 0.000 description 2
- 244000269722 Thea sinensis Species 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 239000006185 dispersion Substances 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000003902 lesion Effects 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 238000000513 principal component analysis Methods 0.000 description 2
- 235000009566 rice Nutrition 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 244000066764 Ailanthus triphysa Species 0.000 description 1
- 241000221785 Erysiphales Species 0.000 description 1
- 244000068988 Glycine max Species 0.000 description 1
- 235000010469 Glycine max Nutrition 0.000 description 1
- 206010063385 Intellectualisation Diseases 0.000 description 1
- 241000233679 Peronosporaceae Species 0.000 description 1
- 241000219998 Philenoptera violacea Species 0.000 description 1
- 240000001417 Vigna umbellata Species 0.000 description 1
- 235000011453 Vigna umbellata Nutrition 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000012850 discrimination method Methods 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000001617 migratory effect Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 210000003462 vein Anatomy 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/096—Transfer learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
- G06V10/806—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/68—Food, e.g. fruit or vegetables
Abstract
本发明属于技术推广服务技术领域,公开了一种面向果蔬病害识别的小样本学习分类方法,主要针对农业视觉场景下果蔬病害图像获取困难及数据集稀缺问题,导致病害识别网络模型识别性能较低、精度差的问题;通过挖掘现有数据集样本类内及类间关系,提出了一种基于小样本学习的类别相关重定向网络,提升了在果蔬病害领域的识别精度;通过将所提出的网络模型应用于移动端平台,可以更加有效地帮助农民解决果蔬病害的问题,进而根据病害类型采取防治措施,为农民在农业生产活动中农作物的保产及增产提供技术支持具有重要的理论意义及应用价值。
Description
技术领域
本发明属于信息技术服务技术领域,尤其涉及一种面向果蔬病害识别的小样本学习分类方法。
背景技术
果蔬病害问题发生时,因农民对于果蔬病害的知识相对缺乏,无法及时准确的判断,只能依靠经验丰富的专家通过现场判别。这一状况是我国果蔬病害防治困难的主要原因。但是,仅仅通过专家肉眼进行识别,不仅无法提高病害鉴别效率,而且果蔬在实际生产中更是复杂多样,病害种类繁多,更进一步的影响了病害识别的效果。所以,研究如何将人工智能部署在农业生产过程,研究高效的病害识别算法迫在眉睫。
目前面向果蔬病害识别的网络设计包括以下几种:
基于机器学习的病害识别网络,包括利用K-means聚类方法分割病斑区域,并结合全局颜色直方图、颜色相干向量、局部二值模式和完全局部二值模式提取苹果病斑的颜色和纹理特征,对3种苹果病害进行检测;对早疫病、晚疫病、叶霉病和叶斑病4种番茄叶部病害进行研究,分别采用逐步判别、贝叶斯判别及主成分分析提取番茄叶斑图像的颜色、纹理和形状信息等18个特征参数,并采用主成份分析和Fisher判别法提取特征参数并构建判别模型;通过提取苹果叶斑图像的颜色、纹理、形状等8个特征,采用反向传播神经网络模型对农作物图像中的病害类别开展识别任务;应用基于步骤的判别分析和贝叶斯判别方法对3种水稻病害(稻瘟病、条纹叶枯病和白叶枯病)进行分类识别。该方法创造了一定的成绩,但是仍存在一定程度的限制,如病害识别准确率较低及识别种类少。
基于深度学习的病害识别网络,深度学习方法最早被引入到基于叶脉模式的农作物图像识别中,使用3-6层的卷积神经网络分类了三种豆科植物,即白豆、红豆和大豆,设计了一个深度学习模型对14种作物和26种作物病害完成识别;利用深度卷积神经网络对黄瓜的霜霉病、炭疽病、白粉病和靶斑病进行症状级识别;提出了一种深度学习方法来识别黄瓜叶部的病害。该方法在某种程度上已经取得了良好的性能,原因是深度神经网络的训练依赖成千上万的图像数据集,但在实际的农业视觉领域中所采集的数据集的样本多样性匮乏,无法采集或标注足够的样本提供给深度神经网络完成训练。
基于小样本学习的病害识别网络,小样本学习中经典的孪生网络结合三元损失,以公开数据集P1antVillage中的38种果蔬病害图像为识别对象开展果蔬病害分类任务;采用小样本学习和Cayley-Klein度量相结合的方法实现茶叶病害类型预测任务,以3种茶树叶部病害为研究对象,对病斑进行分割后扩充分割病斑的数据集,取得了良好的性能;提出了一种新的关系网络可以有效地解决果蔬病害的学习问题,该方法利用P1antVillage中的8种植物病害作为研究对象,通过焦点损失函数来训练一个基于关系网络的果蔬病害分类器,从而实现病害诊断和预测;提出了一种基于对比损失的孪生网络和邻近算法分类器的小样本学习方法来解决果蔬病害分类问题。
通过上述分析,现有技术存在的问题及缺陷为:现有的病害识别方法识别准确率低、识别种类少;农业视觉场景下果蔬病害图像获取困难及数据集稀缺,导致病害识别网络模型识别性能较低、精度差。
发明内容
针对现有技术存在的问题,本发明提供了一种面向果蔬病害识别的小样本学习分类方法。
本发明是这样实现的,一种面向果蔬病害识别的小样本学习分类方法,该方法包括:
第一步,采用ResNet作为CRRNet的特征提取器用于提取特征,特征提取器首先对各个episodes中的支持集训练样本和查询样本提取特征,接着将得到的特征输入到CBAM用于捕捉样本的通道注意力和空间注意力,之后将得到的特征向量与元融合模块生成的权重进行矩阵相乘,从而学习出特征之间的相关性;
所述CBAM是使用中心损失和交叉熵损失联合训练卷积注意力模块和分类器生成的;
第二步,将输出的特征向量输入至权重生成器,以生成特征向量实现动态调整查询样本的特征分布,然后输入至空间注意力生成器进行目标位置定位;
第三步,对样本的分类概率进行计算:
其中,表示注意力模块中的核函数,可以对查询集样本特征/>与支持集样本特征xk,n之间的相似度进行计算。/>用于计算/>和/>间的余弦距离,/>表示支持集样本,/>表示查询集样本;
通过对支持集中的样本标签进行加权组合计算,获得查询集样本qi的分类概率ρi。
进一步,所述中心损失的表达式为:
其中,xi表示支持集中第i幅图像的特征图,cyi表示第i个类别特征图的中心。为了避免收敛速度慢,中心是基于相同标签的平均向量计算的。特征图的中心在每次迭代中并不总是变化,利用一个标量α来调整每个中心的学习速率,可以使得错误标记数据对模型的影响得到限制。α的取值为0到1之间,cj的更新方程可表示为:
其中,满足条件时μ(condition)=1,否则为0;
为了设计用于小样本学习图像分类的分类器,使用交叉熵损失LCE,它表示给定查询样本xi的概率得分:
其中,表示计算/>与/>的余弦距离。因此,交叉熵可以表示为:
类别相关性预训练阶段的损失函数可以表示为:
L=LCE+γLCT
其中,γ是一个超参数,用于平衡两个损失的有效性,在实验中,设置γ=0.01具有更好的性能。
进一步,所述交叉熵损失函数表达式为:
进一步,所述卷积注意力模块被用作自适应单元,从支持集样本中提取通道和空间中的依赖关系,获得类别相关性掩码AS与类别敏感特征RS,通道注意力模块在从每个类别标签稀疏激活特征通道后比较激活的通道,空间注意力生成器是通道注意力模块的配套,通过在空间上对特征进行连接来构造空间注意力图,卷积注意力模块侧重于导入特征并优化特征相关性表示,消除不必要的特征。
所述卷积注意力模块用来学习样本特征之间的相互依赖和空间位置关系,从而构建出一种类别相关性掩码,这个类别相关性掩码具备上下文信息及类别相关性特征,对于所输入的支持集样本sk,n,使用骨干网络进行特征提取后获得特征向量为/>
在卷积注意力模块中,通过注意力模块可以计算出特征向量的空间信息,进行全局最大池化和全局平均池化操作,并从中推导出平均池化的空间上下文描述子/>及最大池化的空间上下文描述子/>随后,输入至两个由全连接层组成的多层感知机(Multi-Layer Perceptron,MLP),输出类别相关性掩;
在MLP模块中将特征图的通道数压缩到原来的1/r倍(r表示reduction,即衰减率),之后对通道数进行扩张后输入至ReLU激活函数,将经过ReLU激活函数的结果进行逐元素相加后执行Sigmoid激活操作:
其中,σ表示sigmoid函数,‘+’表示逐元素求和以合并平均池化后的描述子和最大池化后的描述子。和/>为全连接层的参数;
最后,将输出的结果Mc(F)与原始特征图进行逐元素相乘,其计算过程如下:
其中,⊙表示逐元素相乘;
空间注意力模块可以有效地抑制空间维度的变化,从而使得特征的通道维度得到压缩,更加精准地定位目标,完成通道注意力操作后,将输出结果与原始特征图进行逐元素相乘得到As,经过最大池化和平均池化处理后,获得两个1×H×W的特征图,接下来使用拼接操作将它们拼接起来,然后利用一个7×7卷积模块将拼接后的特征图转换为一个通道。最后,使用Sigmoid函数来计算空间注意力,最终将计算结果与原始特征图进行逐元素相乘,使其变回的大小。其计算过程如下:
进一步,所述元融合模块可以从特征中提取出与当前任务相关的判别性信息,并将其应用于当前任务,从而实现动态捕捉上下文特征;
所述元融合模块将作为输入,进行全局平均池化计算后获得全局表示,随后使用多层感知机转化为类别感知权重w∈RNK×1,可表示为:
其中σ为ReLU激活函数。
在完成元融合模块的操作之后,对类感知权重w和相关性掩码As执行融合操作获得表示当前任务特征如式14所示:
6.如权利要求1所述的面向果蔬病害识别的小样本学习分类方法,其特征在于,所述权重生成器是给定当前任务特征,使用权重生成器进行训练之后,可以获得基于任务表示的重定向掩码:
其中,hφ为权重生成器,包括两个MLP和ReLU激活函数。
本发明另一目的在于提供一种面向果蔬病害识别的小样本学习分类系统,包括:
卷积注意力模块,联合中心损失及交叉熵损失的类别相关性预训练阶段可以使得CRRNet模型的特征提取器及卷积注意力模块学习到丰富的迁移知识;通过利用先验知识,模型能够在处理新的图像分类任务时获取更加准确的信息,以便更好地识别出不同的类别;
元融合模块,可以从特征中提取出与当前任务相关的判别性信息,并将其应用于当前任务,从而实现动态捕捉上下文特征;通过生成一系列的权重参数,实现重定向掩码的加权融合;
权重生成器可以学习到低维度的特征掩码,并且能够根据当前任务的需求,动态地调整查询集中的样本特征分布;
空间注意力生成器基于特征图推理出一个权重分布,再将这个权重分布加权到初始的特征图上;被加权特征图中,不同区域的特征赋有不同大小的权重,权重越大的特征则表示与当前任务更具有相关性,更容易被注意到;通过结合两个卷积层的全连接网络和单通道的最终输出映射实现构建。
8.如权利要求7所述的面向果蔬病害识别的小样本学习分类系统,其特征在于,所述元融合模块主要学习支持集中样本在特征空间的分布情况,旨在根据当前的新任务对支持集中的样本特征进行自适应融合,可以生成与当前任务相关的上下文特征表示;
所述权重生成器具有高度的灵活性,可以根据当前任务的需求,自动地为查询集中的样本特征赋予与当前任务相关的权重,突出有效信息出,同时减少不必要的信息;
所述空间注意力生成器通过结合两个卷积层的全连接网络和单通道的最终输出映射实现构建;在CRRNet模型中将查询集特征及权重生成器结果执行逐元素相乘后,作为空间注意力生成器的输入生成类依赖注意力图,能够获取目标对象属于相应支持集类别的空间位置;最终,将细化后的特征图输入到基于类感知特征的分类器中,以鉴别来自不同标签的不同样本;在空间注意力生成器的辅助下,分类器将更多的注意力集中在感兴趣的区域上。
本发明另一目的在于提供一种信息数据处理终端,所述信息数据处理终端用于执行所述的面向果蔬病害识别的小样本学习分类方法的步骤。
本发明另一目的在于提供一种计算机设备,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行所述的面向果蔬病害识别的小样本学习分类方法的步骤。
结合上述的技术方案和解决的技术问题,本发明所要保护的技术方案所具备的优点及积极效果为:
第一,针对上述现有技术存在的技术问题以及解决该问题的难度,紧密结合本发明的所要保护的技术方案以及研发过程中结果和数据等,详细、深刻地分析本发明技术方案如何解决的技术问题,解决问题之后带来的一些具备创造性的技术效果。具体描述如下:
本发明的技术方案有益效果在于:在果蔬病害识别小样本场景下设计图像分类网络模型实现新任务的泛化;本发明关键点和保护点如下:本发明使用小样本学习方法为果蔬病害识别场景下因样本数量缺乏导致的难以识别的问题进行了创新性的探索。
第二,把技术方案看做一个整体或者从产品的角度,本发明所要保护的技术方案具备的技术效果和优点,具体描述如下:
本发明涉及小样本学习图像分类算法,主要针对农业视觉场景下果蔬病害图像获取困难及数据集稀缺问题,导致病害识别网络模型识别性能较低、精度差的问题。通过挖掘现有数据集样本类内及类间关系,提出了一种基于小样本学习的类别相关重定向网络(Category Relevance Redirection Network for Few-Shot Classification,CRRNet),提升了在果蔬病害领域的识别精度,帮助农民在开展农业生产活动时便捷、快速的识别果蔬病害。
第三,作为本发明的权利要求的创造性辅助证据,还体现在以下几个重要方面:
(1)本发明的技术方案填补了国内外业内技术空白:本发明所提出的网络模型将病害图像直接输入至特征提取器,有效避免了果蔬病害的病斑提取及复杂背景分割过程,大大降低了识别过程中数据建模的复杂度。无需人工提取叶片病害图片的各类特征,只要将网络模型的参数进行训练,就能得到对应的特征。能够解决在实际场景中,通过使用迁移学习策略缓解特定果蔬病害数据集过小而引起的过拟合问题,充分利用已有的数据集在网络中完成训练并获得先验知识,进行病害特征的自动提取,并且提高准确率。
(2)本发明的技术方案是否解决了人们一直渴望解决、但始终未能获得成功的技术难题:本发明基于农业场景中的果蔬病害识别任务,将小样本学习和果蔬病害特征提取的迁移学习策略相结合的果蔬病害识别系统,既能提高模型的特征提取能力,保证准确率,又能加快识别速度。本技术方案所训练的模型实时性较好,所需存储空间小,能够在硬件和实际条件有要求的终端应用中良好运行,且当训练数据集发生变化时轻量级模型更易移植和替换。
(3)本发明的技术方案是否克服了技术偏见:本发明将网络模型分为的类别相关性预训练及类别重定向训练,完成训练后只需要一个网络分类层就可以将特征向量进行分类,无需多轮训练的调参过程。为病害识别模型后续能够在识别时间、存储空间要求较高的农业应用中提供理论支持。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图做简单的介绍,显而易见地,下面所描述的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的类别相关重定向网络结构示意图;
图2是本发明实施例提供的果蔬病害识别系统部署及应用流程图;
图3是本发明实施例提供的CRRNet.mlmodel文件信息示意图;
图4是本发明实施例提供的果蔬病害识别系统界面图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
针对现有技术存在的问题,本发明提供了一种面向果蔬病害识别的小样本学习分类方法,下面结合附图对本发明作详细的描述。
本发明提出了CRRNet,通过学习深度嵌入的度量空间,实现小样本学习图像分类任务。网络模型包括两个阶段,在类别相关性预训练阶段,使用中心损失和交叉熵损失联合训练卷积块注意力模块和分类器。在类别重定向训练阶段,设计了元融合块和权重生成器来表示加权查询集特征,然后将其输入到空间注意力生成器中,以获得用于分类的判别特征。使得网络模型在进行病害识别时不仅可以学习支持集样本的相关类别特征,还可以强调与当前任务相关的查询集样本的类别特征。
一、网络结构及损失函数
CRRNet结构如图1所示,共涵盖两个训练阶段,即类别相关性预训练阶段及类别重定向训练阶段。模型的关键模块包括特征提取器、CBAM、元融合模块、权重生成器、空间注意力生成器及分类器。采用ResNet作为CRRNet的特征提取器用于提取特征。特征提取器首先对各个episodes中的支持集训练样本和查询样本提取特征,接着将得到的特征输入到CBAM用于捕捉样本的通道注意力和空间注意力,之后将得到的特征向量与元融合模块生成的权重进行矩阵相乘,从而学习出特征之间的相关性。接下来,将输出的特征向量输入至权重生成器,以生成特征向量实现动态调整查询样本的特征分布,然后输入至空间注意力生成器进行目标位置定位。最后,对样本的分类概率进行计算。
其中,表示注意力模块中的核函数,可以对查询集样本特征/>与支持集样本特征xk,n之间的相似度进行计算。/>用于计算/>和/>间的余弦距离,/>表示支持集样本,/>表示查询集样本。最后,通过/>对支持集中的样本标签进行加权组合计算,获得查询集样本qi的分类概率ρi。
将整体CRRNet模型的训练步骤分为两个阶段,即类别相关性预训练阶段及类别重定向训练阶段,主要意图是提升网络模型CRRNet各部分的收敛速度,并为CRRNet提供更赋有判别性的可迁移性知识。在这两个训练阶段中,各个阶段采取不同的损失函数。
第一个训练阶段即类别相关性预训练阶段,通过结合使用中心损失函数和标准的交叉熵损失函数来监督训练预训练模块,以提高模型的准确性和可靠性。通过中心损失函数的联合监督,能够增加不同类别之间的距离,并大幅提高类内的紧凑性,从而提升CRRNet的识别准确率,为后续的类别重定向阶段的训练奠定基础。中心损失的表达式为:
其中,xi表示支持集中第i幅图像的特征图,cyi表示第i个类别特征图的中心。为了避免收敛速度慢,中心是基于相同标签的平均向量计算的。特征图的中心在每次迭代中并不总是变化,利用一个标量α来调整每个中心的学习速率,可以使得错误标记数据对模型的影响得到限制。α的取值为0到1之间,cj的更新方程可表示为:
其中,满足条件时μ(condition)=1,否则为0。通过中心损失,所提出的模块可以实现类间离散和类内紧凑。换句话说,中心损失有效地将同类的特征限制到一起,而不同类的特征分离。为了设计用于小样本学习图像分类的分类器,使用交叉熵损失LCE,它表示给定查询样本xi的概率得分:
其中,表示计算/>与/>的余弦距离。因此,交叉熵可以表示为:
综上所述,类别相关性预训练阶段的损失函数可以表示为:
L=LCE+γLCT
其中,γ是一个超参数,用于平衡两个损失的有效性,在实验中,设置γ=0.01具有更好的性能。
第二个训练阶段即类别重定向阶段,该训练阶段对整个CRRNet模型的所有模块开展训练。这个阶段的主要任务是基于支持集样本指导查询集样本完成图像分类任务,其交叉熵损失函数表达式为:
二、网络模块
1、类别相关性预训练
卷积注意力模块被用作自适应单元,从支持集样本中提取通道和空间中的依赖关系,获得类别相关性掩码AS与类别敏感特征RS。通道注意力模块在从每个类别标签稀疏激活特征通道后比较激活的通道。空间注意力生成器是通道注意力模块的配套,通过在空间上对特征进行连接来构造空间注意力图。卷积注意力模块侧重于导入特征并优化特征相关性表示,消除不必要的特征。
卷积注意力模块用来学习样本特征之间的相互依赖和空间位置关系,从而构建出一种类别相关性掩码。这个类别相关性掩码具备上下文信息及类别相关性特征。对于所输入的支持集样本sk,n,使用骨干网络进行特征提取后获得特征向量为/>在卷积注意力模块中,通过注意力模块可以计算出特征向量/>的空间信息,进行全局最大池化和全局平均池化操作,并从中推导出平均池化的空间上下文描述子及最大池化的空间上下文描述子/>随后,输入至两个由全连接层组成的多层感知机(Multi-Layer Perceptron,MLP),输出类别相关性掩码。在MLP模块中将特征图的通道数压缩到原来的1/r倍(r表示reduction,即衰减率),之后对通道数进行扩张后输入至ReLU激活函数。将经过ReLU激活函数的结果进行逐元素相加后执行Sigmoid激活操作:
其中,σ表示sigmoid函数,‘+’表示逐元素求和以合并平均池化后的描述子和最大池化后的描述子。和/>为全连接层的参数。
最后,将输出的结果Mc(F)与原始特征图进行逐元素相乘,其计算过程如下:
其中,⊙表示逐元素相乘。
通过使用卷积注意力模块中的通道注意力模块实现压缩特征的空间维度,在不改变通道维度的情况下提取出图像中有价值的信息。空间注意力模块可以有效地抑制空间维度的变化,从而使得特征的通道维度得到压缩,更加精准地定位目标。完成通道注意力操作后,将输出结果与原始特征图进行逐元素相乘得到As。经过最大池化和平均池化处理后,获得两个1×H×W的特征图,接下来使用拼接操作将它们拼接起来,然后利用一个7×7卷积模块将拼接后的特征图转换为一个通道。最后,使用Sigmoid函数来计算空间注意力,最终将计算结果与原始特征图进行逐元素相乘,使其变回的大小。其计算过程如下:
三、类别重定向训练
在此训练阶段中,使用支持集样本的特征图进行后续操作,使用元融合块及权重生成器为查询集样本生成重定向掩码Vq。同时,将查询集样本特征/>作为输入后与类别重定向掩码Vq进行逐元素相乘。最后,使用空间注意力生成器将特征图发送到分类器,以预测样本标签。
(1)元融合模块
使用元融合模块可以从特征中提取出与当前任务相关的判别性信息,并将其应用于当前任务,从而实现动态捕捉上下文特征。一般来说,不同的场景任务应表现出明显的差异,而类似任务之间应该存在共同的特征,而且在某些情况下,样本的数量和排列顺序不会影响结果。所以,元融合模块通过生成一系列的权重参数,实现重定向掩码的加权融合。
元融合模块将作为输入,进行全局平均池化计算后获得全局表示,随后使用多层感知机转化为类别感知权重w∈RNK×1,可表示为:
其中σ为ReLU激活函数。
在完成元融合模块的操作之后,对类感知权重w和相关性掩码As执行融合操作获得表示当前任务特征如式14所示:
(2)权重生成器
元学习是一种典型的参数生成思想,它通过分析样本的上下文来学习特定的参数,并将这些参数应用到新的任务中,以获得优异的泛化效果。神经网络模型中的卷积核参数及分类器权重由元学习器生成。尽管元学习器可以学习到大量的卷积层参数和分类权重,但由于这些参数的复杂性,它们的计算难度较高,因此训练所需的时间也会相应增加。如何将元学习器的计算量削减到一定程度是十分有必要的,通过使用权重生成器可以学习到低维度的特征掩码,并且能够根据当前任务的需求,动态地调整查询集中的样本特征分布。
详细地,给定当前任务特征,使用权重生成器进行训练之后,可以获得基于任务表示的重定向掩码:
其中,hφ为权重生成器,包括两个MLP和ReLU激活函数。
为了防止网络模型参数量过度,造成计算量增大以及深度学习模型的过拟合问题,深度学习方法中的L2规范化方法思路是对元素进行平方和计算,再取平方根。使用这种方法可以压缩模型的参数量,在一定程度上缓解过拟合现象。在本发明中,开展L2规范化对重定向掩码的大小进行限制,可以对收敛速度进行提速。
对于查询集样本qi使用特征提取器完成特征提取,可表示为/>再将规范后的类别重定向掩码Aq与特征提取器提取到的查询集样本特征向量/>进行逐元素相乘,最后得到查询样本特征/>
(3)空间注意力生成器
注意力机制的计算方法是基于特征图推理出一个权重分布,再将这个权重分布加权到初始的特征图上。被加权特征图中,不同区域的特征赋有不同大小的权重,权重越大的特征则表示与当前任务更具有相关性,更易于被注意到。在本发明中,小样本学习图像分类任务的目标特征分布在特征图中的不同位置,目标位置的定位需要深度学习网络分类模型捕捉目标的空间位置,在特征图中挖掘出同一通道不同位置像素的重要性,继而提升小样本学习图像分类任务的性能。
有学者提出了一种新的方法来处理小样本学习图像分类任务,即利用注意力机制,将支持集图像和查询集图像的特征图进行逐元素相乘,得到优化后的特征图,并利用这些特征图进行分类,以提高分类的准确性和效率。通过结合两个池化层和一个卷积层的最终输出来构建空间注意力生成器。将Vi q∈RC×H×W作为输入来生成空间注意力图,将细化后的特征图输入到分类器中,从而区分来自不同标签的样本。在空间注意力生成器的帮助下,分类器将更多的注意力集中在感兴趣的区域上,其计算步骤为:
其中,GSA表示空间注意力生成器,经过空间注意力生成器后的输出。
作为本发明的优选实施例,如图1所示,本发明实施例提供的面向果蔬病害识别的小样本学习分类方法的模块功能包括:
(1)联合中心损失及交叉熵损失的类别相关性预训练阶段可以使得CRRNet模型的特征提取器及卷积注意力模块学习到丰富的迁移知识。通过利用先验知识,模型能够在处理新的图像分类任务时获取更加准确的信息,以便更好地识别出不同的类别。
(2)类别重定向训练中的元融合块主要学习支持集中样本在特征空间的分布情况,旨在根据当前的新任务对支持集中的样本特征进行自适应融合,从而可以生成与当前任务相关的上下文特征表示。权重生成器具有高度的灵活性,它可以根据当前任务的需求,自动地为查询集中的样本特征赋予与当前任务相关的权重,从而使得有效的信息更加突出,同时也有效地减少了不必要的信息。
(3)空间注意力生成器通过结合两个卷积层的全连接网络和单通道的最终输出映射实现构建。在CRRNet模型中将查询集特征及权重生成器结果执行逐元素相乘后,作为空间注意力生成器的输入生成类依赖注意力图,能够获取目标对象属于相应支持集类别的空间位置。最终,将细化后的特征图输入到基于类感知特征的分类器中,以鉴别来自不同标签的不同样本。在空间注意力生成器的辅助下,分类器将更多的注意力集中在感兴趣的区域上,从而提升CRRNet模型在果蔬病害识别领域的性能。
四、面向果蔬病害识别的应用研究
1、数据集及预处理
本发明所使用的数据集是由Hughes等人于2015年提出的PlantVillage病害数据集。PlantVillage是由美国宾夕法尼亚州立大学和瑞士洛桑联邦理工学院牵头的一个非营利性项目。在该数据集中,健康植物及病害植物被注释并公开免费。PlantVillage数据集共包含54303张,共有38类叶片图像。所有图像都在非自然条件下采集,包括灰度图及彩色图。在实验中,所有图像都调整为256×256像素,为提高模型的泛化能力,在实验中对农作物病害图像进行数据增强,方法包括亮度、对比度、图像颜色以及饱和度的调整、随机旋转及水平翻转。按照二八原则将数据集划分为训练集和测试集。
为消除网络模型在训练中因样本特征之间的分布差异太大造成的网络模型识别性能低下的问题,在实验中采用离差标准化对图像进行归一化操作,使得图像像素值制约至(0,1)之间,训练阶段及测试阶段采用一样的归一化方法。其中,归一化操作的均值和方差分别为(0.525,0.483,0.456)和(0.263,0.256,0.235)。
2、实验及结果分析
对CRRNet果蔬病害识别的实验过程进行介绍,包括网络模型的超参数设置及实验过程,并将实验结果与现有的网络模型在数据集PlantVillage上进行实验的结果进行对比,从而验证所提出方法在果蔬病害识别任务中的有效性。
(1)训练过程及超参数设置
本实验所研究的果蔬病害识别任务是在小样本学习图像分类场景下采取3-way1-shot、5-way 1-shot及7-way 1-shot设定作为实验方案。在对CRRNet进行参数更新时,采用带有Nesterov动量的随机梯度下降方法实现参数更新,动量值为0.9。现有的研究证明加载在ImageNet数据集上的预训练权重后再训练果蔬病害数据集对病害识别是有效的。在CRRNet的预训练阶段即类别相关预训练阶段,起始学习率为0.1,衰减因子为0.1。在对PlantVillage数据集展开实验时,将CRRNet模型迭代次数设置为50次,batch size大小设置为64时性能达到最优。对于第二训练阶段即类别重定向训练阶段,采用固定学习率设置为0.001,并对网络模型迭代训练20次,并将每个batch中包含4个episode。下面将分析CRRNet在PlantVillage数据集测试阶段的含有95%的置信区的平均准确率。
(2)识别结果与分析
表1基于小样本学习方法的果蔬病害识别方法实验对比(%)
为了准确验证CRRNet在果蔬病害识别场景下识别效果和性能,本节将其与基于小样本学习的网络模型即匹配网络、关系网络及改进关系网络进行了实验结果对比与分析,如表1所示。
提出的CRRNet与匹配网络、关系网络及改进关系网络相比具有更高的分类性能,CRRNet在PlantVillage数据集上开展3-way 1-shot实验,识别准确率分别提高了39.19%,1.66%及0.25%。5-way 1-shot实验场景下,识别准确率分别提高了25.57%,5.24%及0.55%。7-way1-shot实验,识别准确率分别提高了38.58%,4.18%及0.98%。这是因为CRRNet所设计的类别相关重定向模块,可以通过捕获更具有判别性的特征来更好地获取作果蔬病害图像中的病害特征信息,从而达到很高的识别准确率。移动端部署与应用
为了实现实际农业生产活动中果蔬病害识别的任务,促进农业现代化及农业智能化,本节基于第三章提出的CRRNet模型进行移动端部署,开发适用于手机端IOS系统的果蔬病害识别应用。首先,对基于IOS操作系统的果蔬病害识别系统进行介绍,阐述深度学习模型在移动端的部署流程。随后介绍CRRNet模型在果蔬病害识别场景下的迁移与验证方案。最后,将CRRNet在移动端进行部署并设计应用功能界面实现果蔬病害识别任务。
(3)移动端部署流程
目前,许多研究者将深度学习模型在移动端完成了部署,实现了AI技术在许多方面的应用。本文所提出的基于小样本学习的果蔬病害识别算法在服务器上完成训练,随后通过移动端模型转化框架进行转换,最后将转换后的模型部署在移动端设备上。通过从移动端设备获取图片,完成病害类型的分类任务。部署及应用流程如图2所示。
果蔬病害识别系统主要功能包括拍照、图库、检测按钮及识别结果显示框组成。首先通过移动端手机的拍照功能对果蔬病害叶片拍照或从图库中选择病害叶片图像,随后自动将所选取的图像输入至模型,模型将所输入的图像进行推理并获得识别结果,并将识别结果返回至移动端的结果显示框。
(3)模型的迁移与验证
在对果蔬病害识别系统进行部署之前,需要将PyTorch框架转换至Core ML模型并验证,通过将训练好的PyTorch模型使用Python语言中的coremltools包及开放性神经网络交换(Open Neural Network Exchange,ONNX)包完成模型的转换,最后完成模型在移动端的部署。
详细过程及核心代码如下所示:
1、保存模型CRRNet训练参数(输出CRRNet.pth)
1.import torch
2.import CRRNet
3.#CRRNet模型导入
4.model=CRRNet()
5.#---CRRNet训练---
6.#保存模型参数,输出CRRNet.pth
7.torch.save(model.state_dict(),"./PlantDisease/CRRNet.pth")
2、使用ONNX包将CRRNet.pth转换为ONNX模型(输出CRRNet.onnx)
1.import torch
2.import CRRNet
3.#导入CRRNet模型
4.model=CRRNet()
5.#加载CRRNet权重
6.model.load_state_dict(torch.load("./PlantDisease/CRRNet.pth"))
7.#模型验证
8.model.eval()
9.#构建输入
10.fake_input=torch.rand(1,3,224,224)
11.#将模型转换为ONNX模型,输出CRRNet.onnx
12.torch.onnx.export(model,fake_input,"./PlantDisease/CRRNet.onnx")
3、使用coremltools包将CRRNet.onnx转换为Core ML(输出CRRNet.mlmodel)
1.import coremltools as ct
2.#将Onnx模型转换为Core ML模型
3.model=ct.converters.onnx.convert(model='./PlantDisease/CRRNet.onnx')
4.#保存Core ML模型,输出CRRNet.mlmodel
5.model.save('CRRNet.mlmodel')
CRRNet.mlmodel文件中包括模型介绍、图像处理及预测。通过将果蔬病害图像输入至mlmodel文件验证模型的输出结果,如图3所示。
(4)移动端部署与应用
完成模型的迁移及验证后,通过集成开发工具Xcode及开发语言Swift搭建果蔬病害识别手机端应用。通过图像选择器UIImagePickerController获取移动端中的相册或摄像头权限实现病害图像的选择,UIImageView为图像容器,使用导航栏协议方法UINavigationControllerDelegate实现页面之间的跳转,最后在VNCoreMLRequest中请求对模型的加载和预测,并将模型对病害图像的预测结果回传到界面。为验证CRRNet在移动端的应用性能,检验在移动端完成部署后的病害识别准确率,通过选取部分病害图像进行识别,结果显示CRRNet模型完成在移动端的部署后能够实现果蔬病害识别任务,识别界面如图4所示。
应当注意,本发明的实施方式可以通过硬件、软件或者软件和硬件的结合来实现。硬件部分可以利用专用逻辑来实现;软件部分可以存储在存储器中,由适当的指令执行系统,例如微处理器或者专用设计硬件来执行。本领域的普通技术人员可以理解上述的设备和方法可以使用计算机可执行指令和/或包含在处理器控制代码中来实现,例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本发明的设备及其模块可以由诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现,也可以用由各种类型的处理器执行的软件实现,也可以由上述硬件电路和软件的结合例如固件来实现。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,都应涵盖在本发明的保护范围之内。
Claims (10)
1.一种面向果蔬病害识别的小样本学习分类方法,其特征在于,该方法包括:
第一步,采用ResNet作为CRRNet的特征提取器用于提取特征,特征提取器首先对各个episodes中的支持集训练样本和查询样本提取特征,接着将得到的特征输入到CBAM用于捕捉样本的通道注意力和空间注意力,之后将得到的特征向量与元融合模块生成的权重进行矩阵相乘,从而学习出特征之间的相关性;
所述CBAM是使用中心损失和交叉熵损失联合训练卷积注意力模块和分类器生成的;
第二步,将输出的特征向量输入至权重生成器,以生成特征向量实现动态调整查询样本的特征分布,然后输入至空间注意力生成器进行目标位置定位;
第三步,对样本的分类概率进行计算:
其中,表示注意力模块中的核函数,可以对查询集样本特征/>与支持集样本特征xk,n之间的相似度进行计算;/>用于计算/>和/>间的余弦距离,/>表示支持集样本,/>表示查询集样本;
通过对支持集中的样本标签进行加权组合计算,获得查询集样本qi的分类概率ρi。
2.如权利要求1所述的面向果蔬病害识别的小样本学习分类方法,其特征在于,所述中心损失的表达式为:
其中,xi表示支持集中第i幅图像的特征图,cyi表示第i个类别特征图的中心;为了避免收敛速度慢,中心是基于相同标签的平均向量计算的;特征图的中心在每次迭代中并不总是变化,利用一个标量α来调整每个中心的学习速率,可以使得错误标记数据对模型的影响得到限制;α的取值为0到1之间,cj的更新方程可表示为:
其中,满足条件时μ(condition)=1,否则为0;
为了设计用于小样本学习图像分类的分类器,使用交叉熵损失LCE,它表示给定查询样本xi的概率得分:
其中,表示计算/>与/>的余弦距离;因此,交叉熵可以表示为:
类别相关性预训练阶段的损失函数可以表示为:
L=LCE+γLCT
其中,γ是一个超参数,用于平衡两个损失的有效性,在实验中,设置γ=0.01具有更好的性能。
3.如权利要求1所述的面向果蔬病害识别的小样本学习分类方法,其特征在于,所述交叉熵损失函数表达式为:
4.如权利要求1所述的面向果蔬病害识别的小样本学习分类方法,其特征在于,所述卷积注意力模块被用作自适应单元,从支持集样本中提取通道和空间中的依赖关系,获得类别相关性掩码AS与类别敏感特征RS,通道注意力模块在从每个类别标签稀疏激活特征通道后比较激活的通道,空间注意力生成器是通道注意力模块的配套,通过在空间上对特征进行连接来构造空间注意力图,卷积注意力模块侧重于导入特征并优化特征相关性表示,消除不必要的特征;
所述卷积注意力模块用来学习样本特征之间的相互依赖和空间位置关系,从而构建出一种类别相关性掩码,这个类别相关性掩码具备上下文信息及类别相关性特征,对于所输入的支持集样本sk,n,使用骨干网络进行特征提取后获得特征向量为/>
在卷积注意力模块中,通过注意力模块可以计算出特征向量 的空间信息,进行全局最大池化和全局平均池化操作,并从中推导出平均池化的空间上下文描述子/>及最大池化的空间上下文描述子/>随后,输入至两个由全连接层组成的多层感知机(Multi-Layer Perceptron,MLP),输出类别相关性掩;
在MLP模块中将特征图的通道数压缩到原来的1/r倍(r表示reduction,即衰减率),之后对通道数进行扩张后输入至ReLU激活函数,将经过ReLU激活函数的结果进行逐元素相加后执行Sigmoid激活操作:
其中,σ表示sigmoid函数,‘+’表示逐元素求和以合并平均池化后的描述子和最大池化后的描述子;和/>为全连接层的参数;
最后,将输出的结果Mc(F)与原始特征图进行逐元素相乘,其计算过程如下:
其中,⊙表示逐元素相乘;
空间注意力模块可以有效地抑制空间维度的变化,从而使得特征的通道维度得到压缩,更加精准地定位目标,完成通道注意力操作后,将输出结果与原始特征图进行逐元素相乘得到As,经过最大池化和平均池化处理后,获得两个1×H×W的特征图,接下来使用拼接操作将它们拼接起来,然后利用一个7×7卷积模块将拼接后的特征图转换为一个通道;最后,使用Sigmoid函数来计算空间注意力,最终将计算结果与原始特征图进行逐元素相乘,使其变回的大小;其计算过程如下:
5.如权利要求1所述的面向果蔬病害识别的小样本学习分类方法,其特征在于,所述元融合模块可以从特征中提取出与当前任务相关的判别性信息,并将其应用于当前任务,从而实现动态捕捉上下文特征;
所述元融合模块将作为输入,进行全局平均池化计算后获得全局表示,随后使用多层感知机转化为类别感知权重w∈RNK×1,可表示为:
其中σ为ReLU激活函数;
在完成元融合模块的操作之后,对类感知权重w和相关性掩码As执行融合操作获得表示当前任务特征如式14所示:
6.如权利要求1所述的面向果蔬病害识别的小样本学习分类方法,其特征在于,所述权重生成器是给定当前任务特征,使用权重生成器进行训练之后,可以获得基于任务表示的重定向掩码:
其中,hφ为权重生成器,包括两个MLP和ReLU激活函数。
7.一种面向果蔬病害识别的小样本学习分类系统,其特征在于,包括:
卷积注意力模块,联合中心损失及交叉熵损失的类别相关性预训练阶段可以使得CRRNet模型的特征提取器及卷积注意力模块学习到丰富的迁移知识;通过利用先验知识,模型能够在处理新的图像分类任务时获取更加准确的信息,以便更好地识别出不同的类别;
元融合模块,可以从特征中提取出与当前任务相关的判别性信息,并将其应用于当前任务,从而实现动态捕捉上下文特征;通过生成一系列的权重参数,实现重定向掩码的加权融合;
权重生成器可以学习到低维度的特征掩码,并且能够根据当前任务的需求,动态地调整查询集中的样本特征分布;
空间注意力生成器基于特征图推理出一个权重分布,再将这个权重分布加权到初始的特征图上;被加权特征图中,不同区域的特征赋有不同大小的权重,权重越大的特征则表示与当前任务更具有相关性,更容易被注意到;通过结合两个卷积层的全连接网络和单通道的最终输出映射实现构建。
8.如权利要求7所述的面向果蔬病害识别的小样本学习分类系统,其特征在于,所述元融合模块主要学习支持集中样本在特征空间的分布情况,旨在根据当前的新任务对支持集中的样本特征进行自适应融合,可以生成与当前任务相关的上下文特征表示;
所述权重生成器具有高度的灵活性,可以根据当前任务的需求,自动地为查询集中的样本特征赋予与当前任务相关的权重,突出有效信息出,同时减少不必要的信息;
所述空间注意力生成器通过结合两个卷积层的全连接网络和单通道的最终输出映射实现构建;在CRRNet模型中将查询集特征及权重生成器结果执行逐元素相乘后,作为空间注意力生成器的输入生成类依赖注意力图,能够获取目标对象属于相应支持集类别的空间位置;最终,将细化后的特征图输入到基于类感知特征的分类器中,以鉴别来自不同标签的不同样本;在空间注意力生成器的辅助下,分类器将更多的注意力集中在感兴趣的区域上。
9.一种信息数据处理终端,所述信息数据处理终端用于执行如权利要求1~6任意一项所述的面向果蔬病害识别的小样本学习分类方法的步骤。
10.一种计算机设备,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1~6任意一项所述的面向果蔬病害识别的小样本学习分类方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310658717.4A CN116843952A (zh) | 2023-06-06 | 2023-06-06 | 一种面向果蔬病害识别的小样本学习分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310658717.4A CN116843952A (zh) | 2023-06-06 | 2023-06-06 | 一种面向果蔬病害识别的小样本学习分类方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116843952A true CN116843952A (zh) | 2023-10-03 |
Family
ID=88162577
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310658717.4A Pending CN116843952A (zh) | 2023-06-06 | 2023-06-06 | 一种面向果蔬病害识别的小样本学习分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116843952A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117611924A (zh) * | 2024-01-17 | 2024-02-27 | 贵州大学 | 一种基于图文子空间联合学习的植物叶片表型病害分类方法 |
-
2023
- 2023-06-06 CN CN202310658717.4A patent/CN116843952A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117611924A (zh) * | 2024-01-17 | 2024-02-27 | 贵州大学 | 一种基于图文子空间联合学习的植物叶片表型病害分类方法 |
CN117611924B (zh) * | 2024-01-17 | 2024-04-09 | 贵州大学 | 一种基于图文子空间联合学习的植物叶片表型病害分类方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Jiang et al. | Real-time detection of apple leaf diseases using deep learning approach based on improved convolutional neural networks | |
CN109300121B (zh) | 一种心血管疾病诊断模型的构建方法、系统及该诊断装置 | |
Xu et al. | Light-YOLOv3: fast method for detecting green mangoes in complex scenes using picking robots | |
CN111291809B (zh) | 一种处理装置、方法及存储介质 | |
Pandey et al. | A robust deep attention dense convolutional neural network for plant leaf disease identification and classification from smart phone captured real world images | |
Gu et al. | A new deep learning method based on AlexNet model and SSD model for tennis ball recognition | |
Jiang et al. | Hyperspectral image classification with spatial consistence using fully convolutional spatial propagation network | |
Chen et al. | An improved Yolov3 based on dual path network for cherry tomatoes detection | |
CN113807399B (zh) | 一种神经网络训练方法、检测方法以及装置 | |
Yadav et al. | AFD-Net: Apple Foliar Disease multi classification using deep learning on plant pathology dataset | |
US11941865B2 (en) | Hyperspectral image classification method based on context-rich networks | |
Su et al. | LodgeNet: Improved rice lodging recognition using semantic segmentation of UAV high-resolution remote sensing images | |
Fang et al. | Multi-channel feature fusion networks with hard coordinate attention mechanism for maize disease identification under complex backgrounds | |
CN113435254A (zh) | 一种基于哨兵二号影像的耕地深度学习提取方法 | |
CN116843952A (zh) | 一种面向果蔬病害识别的小样本学习分类方法 | |
CN109492610A (zh) | 一种行人重识别方法、装置及可读存储介质 | |
Perveen et al. | Multidimensional Attention-Based CNN Model for Identifying Apple Leaf Disease. | |
Banerjee et al. | CNN-SVM Model for Accurate Detection of Bacterial Diseases in Cucumber Leaves | |
Abuhayi et al. | Chickpea disease classification using hybrid method | |
Raja et al. | A Novel Fuzzy-Based Modified GAN and Faster RCNN for Classification of Banana Leaf Disease | |
Bose et al. | Fine-Grained Independent Approach for Workout Classification Using Integrated Metric Transfer Learning | |
CN116977668A (zh) | 图像识别方法、装置、计算机设备及计算机存储介质 | |
Wang et al. | Strawberry ripeness classification method in facility environment based on red color ratio of fruit rind | |
Zhou et al. | Masked Spectral-Spatial Feature Prediction for Hyperspectral Image Classification | |
Hettiarachchi et al. | UrbanAgro: Utilizing advanced deep learning to support Sri Lankan urban farmers to detect and control common diseases in tomato plants |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |