CN116821698A - 基于半监督学习的小麦赤霉病孢子检测方法 - Google Patents
基于半监督学习的小麦赤霉病孢子检测方法 Download PDFInfo
- Publication number
- CN116821698A CN116821698A CN202311108676.8A CN202311108676A CN116821698A CN 116821698 A CN116821698 A CN 116821698A CN 202311108676 A CN202311108676 A CN 202311108676A CN 116821698 A CN116821698 A CN 116821698A
- Authority
- CN
- China
- Prior art keywords
- loss
- sample data
- spore
- representing
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 241000209140 Triticum Species 0.000 title claims abstract description 42
- 235000021307 Triticum Nutrition 0.000 title claims abstract description 42
- 206010039509 Scab Diseases 0.000 title claims abstract description 41
- 238000001514 detection method Methods 0.000 title claims abstract description 35
- 238000012549 training Methods 0.000 claims abstract description 52
- 230000008447 perception Effects 0.000 claims abstract description 10
- 210000004215 spore Anatomy 0.000 claims description 141
- 210000003046 sporozoite Anatomy 0.000 claims description 26
- 238000000034 method Methods 0.000 claims description 23
- 238000001914 filtration Methods 0.000 claims description 15
- 230000003044 adaptive effect Effects 0.000 claims description 8
- 230000001629 suppression Effects 0.000 claims description 3
- 238000002474 experimental method Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 201000010099 disease Diseases 0.000 description 3
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 3
- 238000002372 labelling Methods 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 241000223218 Fusarium Species 0.000 description 1
- 208000032369 Primary transmission Diseases 0.000 description 1
- 238000012271 agricultural production Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/0895—Weakly supervised learning, e.g. semi-supervised or self-supervised learning
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A40/00—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
- Y02A40/10—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
Abstract
本发明公开了一种基于半监督学习的小麦赤霉病孢子检测方法,包括:S1、将小麦赤霉病孢子样本数据经过数据增强分别输入到学生模型和教师模型,学生模型与教师模型之间互相学习;S2、在伪标签生成阶段引入动态自适应阈值,根据训练阶段过程中模型的损失来自动计算伪标签分配时使用的高阈值;S3、在训练阶段引入域感知损失来缓解有标记孢子样本数据和无标记孢子样本数据之间的差异;S4、输出有标记孢子样本数据的边界框位置、有标记孢子样本数据的类别、有标记孢子样本数据的置信度得分以及无标记孢子样本数据的伪标签。本发明可以使得无标记孢子样本数据在训练中逐渐发挥作用,提高模型的泛化能力和性能。
Description
技术领域
本发明涉及农业的深度学习技术领域,尤其涉及一种基于半监督学习的小麦赤霉病孢子检测方法。
背景技术
在小麦种植和农业生产过程中小麦赤霉病是一种常见且具有破坏性的病害。小麦赤霉病是由多种镰刀菌引起的,其孢子是病害的主要传播途径。因此,对小麦赤霉病孢子的检测可以帮助农民及时采取防治措施,减少病害造成的损失。
在传统的孢子检测方法中,常使用机器学习的方法进行检测或显微镜技术来识别和计数孢子。然而,这些方法存在如下的问题和局限性:
第一、传统孢子检测方法需要依赖经验丰富的专业人员进行孢子的标记和计数,这种方法的结果可能受到操作者主观判断和主观误差的影响,导致结果的不一致性和不可靠性;
第二、传统孢子检测方法需要大量的人力和时间投入,由于孢子数量巨大且分布广泛,对大规模的样本进行标记和计数是一项繁琐且耗时的工作,限制了其在实际应用中的效率;
第三、传统孢子检测方法由于标注过程的复杂性和人力资源的限制,获得足够数量的准确标注数据是具有困难性和时间性的,这导致了传统方法和深度学习方法在模型训练和泛化能力方面的限制。
综上所述,现有的孢子检测方法存在主观性、时间成本高和数据稀缺性的问题。这些问题限制了传统方法在准确性、效率和可扩展性方面的应用,且在农业实际应用场景中,由于涉及农作物孢子数据的稀缺性,获得大规模精确标记的图像是不可能的。因此,提供如何在有限的标注数据下利用好半监督学习的思想去解决小麦赤霉病孢子检测的实际问题是本领域技术人员亟需解决的问题。
发明内容
本发明的一个目的在于提出一种基于半监督学习的小麦赤霉病孢子检测方法,本发明采用Burn-In策略对有标记孢子样本数据和无标记孢子样本数据进行联合训练,使得无标记孢子样本数据在训练中逐渐发挥作用,提高模型的泛化能力和性能。
根据本发明实施例的一种基于半监督学习的小麦赤霉病孢子检测方法,包括如下步骤:
S1、将小麦赤霉病孢子样本数据经过数据增强分别输入到学生模型和教师模型,学生模型与教师模型之间互相学习;
S2、在伪标签生成阶段引入动态自适应阈值,根据训练阶段过程中模型的损失来自动计算伪标签分配时使用的高阈值;
S3、在训练阶段引入域感知损失来缓解有标记孢子样本数据和无标记孢子样本数据之间的差异;
S4、输出有标记孢子样本数据的边界框位置、有标记孢子样本数据的类别、有标记孢子样本数据的置信度得分以及无标记孢子样本数据的伪标签。
可选的,所述学生模型与教师模型之间互相学习包括:
学生模型利用梯度下降优化器对有标记孢子样本数据和无标记孢子样本数据对学生模型参数进行训练更新:
;
其中, 表示学生模型参数,/>表示学习率,/>表示半监督学习的小麦赤霉病孢子检测的总损失;
有标记孢子样本数据通过学生模型得到预测值,并与真实值计算回归损失、分类损失和置信度损失,无标记孢子样本数据利用教师模型得到伪标签,并作为学生模型对无标记孢子样本数据预测值的监督信息,以此计算无监督损失;
学生模型参数的训练更新以指数移动平均机制反馈给教师模型,对教师模型的参数进行训练更新:
;
其中,表示教师模型的参数,/>表示指数衰减参数。
可选的,所述S1具体包括:
S11、采用Burn-In策略的联合训练方式直接加入小麦赤霉病孢子样本数据;
S12、在Burn-In策略对有标记孢子样本数据进行预训练,并复制成一个教师模型和一个学生模型,获得具有伪标签生成能力的教师模型;
S13、将小麦赤霉病孢子样本数据中按照比例随机抽取有标记孢子样本数据和无标记孢子样本数据形成一个训练批次作为输入;
S14、有标记孢子样本数据和无标记孢子样本数据通过强数据增强后输入学生模型,无标记孢子样本数据再次通过弱数据增强送入教师模型;
S15、在有标记孢子样本数据上,学生模型进行由真实值矩形包围框的有监督训练,得到有监督损失:
;
其中,表示有监督分类损失,用于衡量模型对有标记孢子样本数据预测的类别与真实类别之间的差异,/>表示有监督回归损失,用于衡量模型对有标记孢子样本数据预测的边界框位置与真实边界框位置之间的差异,/>表示有监督置信度损失,用于计算模型对有标记孢子样本数据预测的置信度得分和真实置信度之间的差异;
S16、在无标记孢子样本数据上,教师模型进行无监督训练,教师模型对无标记孢子样本数据进行预测生成伪标签,经过综合置信度过滤得到的伪标签用来指导学生模型的训练,得到无监督损失:
;
其中,表示无监督分类损失,/>表示无监督回归损失,/>表示无监督置信度损失;
S17、计算总损失,总损失/>为有监督损失/>和无监督损失/>的加权和:
;
其中,表示无监督损失权重;
S18、教师模型根据学生模型的指数移动平均机制进行训练更新。
可选的,所述弱数据增强包括对无标记孢子样本数据进行水平翻转或随机裁剪,所述综合置信度为分类分数与置信度分数的乘积。
可选的,所述S2具体包括:
S21、通过非极大值抑制对无标记孢子样本数据进行预测生成的伪标签进行第一次过滤;
S22、使用低阈值和高阈值/>对第一次过滤后的伪标签进行二次过滤,将伪标签分为可靠伪标签、候选伪标签和不可靠伪标签;
S23、根据低阈值和高阈值/>划分,分别得到的三类伪标签的无监督损失/>:
当生成置信度分数大于高阈值时,无监督损失/>包括无监督分类损失/>、无监督回归损失/>和无监督置信度损失/>;
当生成置信度分数位于低阈值和高阈值/>之间时,无监督损失/>包括无监督回归损失/>和无监督置信度损失/>;
当生成置信度分数小于低阈值时,无监督损失/>包括无监督置信度损失。
可选的,所述可靠伪标签、候选伪标签和不可靠伪标签分类方法为:
当伪标签的得分大于高阈值为可靠伪标签;
当伪标签的得分位于低阈值和高阈值/>之间为候选伪标签;
当伪标签的得分小于低阈值为不可靠伪标签;
其中,表示教师模型对伪标签的第/>个样本预测的综合置信度,低阈值为固定阈值0.1,高阈值/>为动态自适应阈值;
高阈值动态自适应阈值为在每次训练迭代中使用有标记孢子样本数据产生的损失进行动态计算:
;
其中,表示训练的轮次,/>表示有标记孢子样本数据在每个循环轮次之后的有监督损失的平均值,/>和/>是两个大于1的常数,/>参数控制了阈值曲线的下降速率。
可选的,所述无监督分类损失为:
;
其中,表示交叉熵损失,/>表示学生模型针对无标记孢子样本数据预测的分类得分,/>表示教师模型针对伪标签输出的分类得分;
所述无监督回归损失为:
;
其中,表示损失函数,/>表示学生模型针对无标记孢子样本数据预测的回归得分,/>表示教师模型针对伪标签输出的回归得分;
所述无监督置信度损失为:
;
其中,表示学生模型针对无标记孢子样本数据预测的置信度得分,/>表示教师模型针对伪标签输出的综合置信度得分,/>表示教师模型针对伪标签输出的置信度得分,代表目标存在的可能性,当/>时,生成的伪标签中包含目标的概率为0。
可选的,所述S3具体包括:
S31、引入域感知损失缓解源域和目标域之间的差异,通过网络学习源域和目标域的特征;
S32、使用最小平方损失进行不同域之间的适应;
S33、得到小麦赤霉病孢子样本数据最终的有监督损失。
可选的,所述引入域感知损失:
;
其中,表示域感知损失,/>表示有标记孢子样本数据,/>表示无标记孢子样本数据,/>表示域分类器对于有标记孢子样本数据的预测输出,/>表示域分类器对于无标记孢子样本数据的预测输出,/>表示源域,/>表示目标域。
可选的,所述最终的有监督损失:
;
其中,包括了源域和目标域上的损失,/>用于控制域感知损失贡献的超参数。
本发明的有益效果是:
(1)本发明采用Burn-In策略对有标记孢子样本数据和无标记孢子样本数据进行联合训练,使得无标记孢子样本数据在训练中逐渐发挥作用,提高模型的泛化能力和性能。
(2)本发明在伪标签生成阶段,为了选择更准确的伪标签,将伪标签划分为可靠的伪标签、候选伪标签和不可靠的伪标签,并引入动态自适应阈值,动态计算过滤伪标签的高阈值,从而在半监督孢子检测训练期间产生高质量的伪标签。
(3)本发明引入域感知损失对模型的特征进行优化来区分有标记孢子样本数据和无标记孢子样本数据,提高模型的泛化性能。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明提出的一种基于半监督学习的小麦赤霉病孢子检测方法的网络结构图;
图2为本发明提出的一种基于半监督学习的小麦赤霉病孢子检测方法中伪标签分配策略示意图;
图3为本发明提出的一种基于半监督学习的小麦赤霉病孢子检测方法中域感知损失示意图。
具体实施方式
现在结合附图对本发明作进一步详细的说明。这些附图均为简化的示意图,仅以示意方式说明本发明的基本结构,因此其仅显示与本发明有关的构成。
参考图1-图3,一种基于半监督学习的小麦赤霉病孢子检测方法,包括如下步骤:
S1、将小麦赤霉病孢子样本数据经过数据增强分别输入到学生模型和教师模型,学生模型与教师模型之间互相学习;
本实施方式中,采用学生模型和教师模型的整体架构,利用原始的YOLOv5网络作为整个框架中学生模型和教师模型的基本检测器,S1具体包括:
S11、采用Burn-In策略的联合训练方式直接加入小麦赤霉病孢子样本数据;
S12、在Burn-In策略通过YOLOv5网络对有标记孢子样本数据进行预训练,并复制成一个教师模型和一个学生模型,获得具有伪标签生成能力的教师模型;
S13、将小麦赤霉病孢子样本数据中按照1:1的比例随机抽取有标记孢子样本数据和无标记孢子样本数据形成一个训练批次作为输入;
S14、有标记孢子样本数据和无标记孢子样本数据通过强数据增强后输入学生模型,无标记孢子样本数据再次通过弱数据增强送入教师模型;
S15、在有标记孢子样本数据上,学生模型进行由真实值矩形包围框的有监督训练,得到有监督损失:
;
其中,表示有监督分类损失,用于衡量模型对有标记孢子样本数据预测的类别与真实类别之间的差异,/>表示有监督回归损失,用于衡量模型对有标记孢子样本数据预测的边界框位置与真实边界框位置之间的差异,/>表示有监督置信度损失,用于计算模型对有标记孢子样本数据预测的置信度得分和真实置信度之间的差异;
S16、在无标记孢子样本数据上,教师模型进行无监督训练,教师模型对无标记孢子样本数据进行预测生成伪标签,经过综合置信度过滤得到的伪标签用来指导学生模型的训练,针对无标记孢子样本数据,得到无监督损失:
;
其中,表示无监督分类损失,/>表示无监督回归损失,/>表示无监督置信度损失;
S17、计算总损失,总损失/>为有监督损失/>和无监督损失/>的加权和:
;
其中,表示无监督损失权重;
S18、教师模型根据学生模型的指数移动平均机制进行训练更新。
本实施方式中,弱数据增强包括对无标记孢子样本数据进行水平翻转或随机裁剪,综合置信度为分类分数与置信度分数的乘积。
本实施方式中,学生模型与教师模型之间互相学习包括:
学生模型利用梯度下降优化器对有标记孢子样本数据和无标记孢子样本数据对学生模型参数进行训练更新:
;
其中, 表示学生模型参数,/>表示学习率,/>表示半监督学习的小麦赤霉病孢子检测的总损失;
有标记孢子样本数据通过学生模型得到预测值,并与真实值计算回归损失、分类损失和置信度损失,无标记孢子样本数据利用教师模型得到伪标签,并作为学生模型对无标记孢子样本数据预测值的监督信息,以此计算无监督损失;
学生模型参数的训练更新以指数移动平均机制反馈给教师模型,对教师模型的参数进行训练更新:
;
其中,表示教师模型的参数,/>表示指数衰减参数。
S2、在伪标签生成阶段引入动态自适应阈值,根据训练阶段过程中模型的损失来自动计算伪标签分配时使用的高阈值,有效地减少伪标签的错误率;
S2的目的是保证教师模型生成高质量的伪标签,通过引入动态自适应阈值,利用样本训练迭代产生的损失来动态计算生成伪标签的高阈值,更为精细地划分检测器生成的伪标签。
本实施方式中,经过弱数据增强的无标记孢子样本数据通过教师模型后得到大量的伪标签,S2具体包括:
S21、通过非极大值抑制对无标记孢子样本数据进行预测生成的伪标签进行第一次过滤;
S22、使用低阈值和高阈值/>对第一次过滤后的伪标签进行二次过滤,将伪标签分为可靠伪标签、候选伪标签和不可靠伪标签;
可靠伪标签、候选伪标签和不可靠伪标签分类方法为:
;
当伪标签的得分大于高阈值为可靠伪标签;
当伪标签的得分位于低阈值和高阈值/>之间为候选伪标签;
当伪标签的得分小于低阈值为不可靠伪标签;
其中,表示教师模型对伪标签的第/>个样本预测的综合置信度,低阈值为固定阈值0.1,高阈值/>为动态自适应阈值;
受到Dash的启发,高阈值动态自适应阈值为在每次训练迭代中使用有标记孢子样本数据产生的损失进行动态计算:
;
其中,表示训练的轮次,/>表示有标记孢子样本数据在每个循环轮次之后的有监督损失的平均值,/>和/>是两个大于1的常数,参数/>控制了阈值曲线的下降速率,在实施方式中,/>取值为1.0001,/>取值为1.1。
S23、为了充分利用生成的伪标签,本方法采用分而治之的策略计算无监督损失。根据低阈值和高阈值/>划分,分别得到的三类伪标签的无监督损失/>:
当生成置信度分数大于高阈值时,无监督损失/>包括无监督分类损失/>、无监督回归损失/>和无监督置信度损失/>;
当生成置信度分数位于低阈值和高阈值/>之间时,无监督损失/>包括无监督回归损失/>和无监督置信度损失/>;
当生成置信度分数小于低阈值时,无监督损失/>包括无监督置信度损失。
本实施方式中,无监督分类损失为:
;
其中,表示交叉熵损失,/>表示学生模型针对无标记孢子样本数据预测的分类得分,/>表示教师模型针对伪标签输出的分类得分;
无监督回归损失为:
;
其中,表示损失函数,/>表示学生模型针对无标记孢子样本数据预测的回归得分,/>表示教师模型针对伪标签输出的回归得分;
无监督置信度损失为:
;
其中,表示学生模型针对无标记孢子样本数据预测的置信度得分,/>表示教师模型针对伪标签输出的综合置信度得分,/>表示教师模型针对伪标签输出的置信度得分,代表目标存在的可能性,当/>时,生成的伪标签中包含目标的概率为0,因此损失计算如上式所示。
S3、在训练阶段引入域感知损失来缓解有标记孢子样本数据和无标记孢子样本数据之间的差异,以此来提高对小麦赤霉病孢子的检测,实现最佳性能。
本实施方式中,目的是缓解源域和目标域之间的差异,S3具体包括:
S31、引入域感知损失缓解源域和目标域之间的差异,通过网络学习源域和目标域的特征;
S32、使用最小平方损失进行不同域之间的适应;
S33、得到小麦赤霉病孢子样本数据最终的有监督损失。
现有的采用二分类交叉熵损失作为域分类损失:
;
其中,表示域分类器的预测输出,源域的标签为0,目标域的标签为1,这种带有sigmoid交叉熵的损失只评估了领域分类的正确性,但是未能衡量不同域之间的距离。
因此,本实施方式中,本发明使用最小平方损失进行不同域之间的适应,引入域感知损失:
;
其中,表示域感知损失,/>表示有标记孢子样本数据,/>表示无标记孢子样本数据,/>表示域分类器对于有标记孢子样本数据的预测输出,/>表示域分类器对于无标记孢子样本数据的预测输出,/>表示源域,/>表示目标域,这种损失可以直接将域标签和预测值相匹配,保留域之间的距离,稳定训练,提高模型的性能。
本实施方式中,最终的有监督损失:
;
其中,包括了源域和目标域上的损失,/>用于控制域感知损失贡献的超参数,在本实施方式中设置为 0.01。
S4、输出有标记孢子样本数据的边界框位置、有标记孢子样本数据的类别、有标记孢子样本数据的置信度得分以及无标记孢子样本数据的伪标签。
本实施方式中,本发明从三个方面对模型的性能进行评估:首先,将本发明方法与主流半监督目标检测方法SoftTeacher和OneTeacehr进行比较。如下表1所示:
由上表1可以看出,为了公平比较,所有的模型均在640x640图像分辨率下进行测试。AP50和 AP75分别代表 IoU 阈值为 0.50 和 0.75 的 mAP,其中数值越大表示效果越佳。最好的结果用粗体表示,第二好的结果用下划线表示。为了获得更好的结果,利用预训练模型进一步微调SoftTeacher和OneTeacher方法。当在孢子验证集上测试时,本发明方法在mAP、AP50和 AP75上比有监督的基线模型分别高出0.3%、0.4%和0.2%,达到83.8%、93.9%和89.4%。由于在完全标记的数据设置下,无标记的孢子检测数据集的规模不够大,因此提升的结果不大。而SoftTeacher和OneTeacher方法的性能均有略有下降。实验结果表明,本发明方法优于其他半监督检测的方法。此外,从参数量来看,有监督的基线模型参数量最少7.03M,SoftTeacher 的参数量最多为82.76M,而本发明方法的参数量为7.38M略高于有监督的基线模型。
其次,对域感知损失和动态自适应阈值模块进行逐步验证。如下表2和表3所示:
/>
由上表2-3可以看出,域感知损失被设计用于有效学习源域和目标域的数据特征信息,以形成更鲁棒的特征表达。该损失通过最小平方损失减少域之间的差异,比较表2中实验(b)和(c)的结果,在添加域感知损失之后mAP由72.7%提升为73%。同样地,比较表3中实验(b)和(c)的结果,在添加域感知损失之后mAP由76.1%提升为76.5%,AP50和 AP75也有相应的提升。这些观察结果表明,域感知损失可以在一定程度上提高模型的检测性能。
伪标签的生成是基于阈值生成的,使用固定阈值常常导致模型性能低下。采用动态自适应的方式来调整过滤伪标签的高阈值,以便获得更高质量的伪标签。观察表2中实验(c)和(d),将mAP提升到74.1%,相对于有监督的基线模型提高了1.9%。同样地,观察表3中实验(c)和(d),将mAP提升到77%,相对于有监督的基线模型提高了1.4%。这些观察结果表明,动态自适应阈值可以在一定程度上提高模型的检测性能。
由上述的实施方式可以看出本发明采用Burn-In策略对有标记孢子样本数据和无标记孢子样本数据进行联合训练,使得无标记孢子样本数据在训练中逐渐发挥作用,提高模型的泛化能力和性能。在伪标签生成阶段,为了选择更准确的伪标签,将伪标签划分为可靠的伪标签、候选伪标签和不可靠的伪标签,并引入动态自适应阈值,动态计算过滤伪标签的高阈值,从而在半监督孢子检测训练期间产生高质量的伪标签。引入域感知损失对模型的特征进行优化来区分有标记孢子样本数据和无标记孢子样本数据,提高模型的泛化性能。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。
Claims (10)
1.一种基于半监督学习的小麦赤霉病孢子检测方法,其特征在于,包括如下步骤:
S1、将小麦赤霉病孢子样本数据经过数据增强分别输入到学生模型和教师模型,学生模型与教师模型之间互相学习;
S2、在伪标签生成阶段引入动态自适应阈值,根据训练阶段过程中模型的损失来计算伪标签分配时使用的高阈值;
S3、在训练阶段引入域感知损失来缓解有标记孢子样本数据和无标记孢子样本数据之间的差异;
S4、输出有标记孢子样本数据的边界框位置、有标记孢子样本数据的类别、有标记孢子样本数据的置信度得分和无标记孢子样本数据的伪标签。
2.根据权利要求1所述的一种基于半监督学习的小麦赤霉病孢子检测方法,其特征在于,所述学生模型与教师模型之间互相学习包括:
学生模型利用梯度下降优化器对有标记孢子样本数据和无标记孢子样本数据对学生模型参数进行训练更新:
;
其中, 表示学生模型参数,/>表示学习率,/>表示半监督学习的小麦赤霉病孢子检测的总损失;
有标记孢子样本数据通过学生模型得到预测值,并与真实值计算回归损失、分类损失和置信度损失,无标记孢子样本数据利用教师模型得到伪标签,并作为学生模型对无标记孢子样本数据预测值的监督信息,以此计算无监督损失;
学生模型参数的训练更新以指数移动平均机制反馈给教师模型,对教师模型的参数进行训练更新:
;
其中,表示教师模型的参数,/>表示指数衰减参数。
3.根据权利要求2所述的一种基于半监督学习的小麦赤霉病孢子检测方法,其特征在于,所述S1具体包括:
S11、采用Burn-In策略的联合训练方式直接加入小麦赤霉病孢子样本数据;
S12、在Burn-In策略对有标记孢子样本数据进行预训练,并复制成一个教师模型和一个学生模型,获得具有伪标签生成能力的教师模型;
S13、将小麦赤霉病孢子样本数据中按照比例随机抽取有标记孢子样本数据和无标记孢子样本数据形成一个训练批次作为输入;
S14、有标记孢子样本数据和无标记孢子样本数据通过强数据增强后输入学生模型,无标记孢子样本数据再次通过弱数据增强送入教师模型;
S15、在有标记孢子样本数据上,学生模型进行由真实值矩形包围框的有监督训练,得到有监督损失:
;
其中,表示有监督分类损失,用于衡量模型对有标记孢子样本数据预测的类别与真实类别之间的差异,/>表示有监督回归损失,用于衡量模型对有标记孢子样本数据预测的边界框位置与真实边界框位置之间的差异,/>表示有监督置信度损失,用于计算模型对有标记孢子样本数据预测的置信度得分和真实置信度之间的差异;
S16、在无标记孢子样本数据上,教师模型进行无监督训练,教师模型对无标记孢子样本数据进行预测生成伪标签,经过综合置信度过滤得到的伪标签用来指导学生模型的训练,得到无监督损失:
;
其中,表示无监督分类损失,/>表示无监督回归损失,/>表示无监督置信度损失;
S17、计算总损失,总损失/>为有监督损失/>和无监督损失/>的加权和:
;
其中,表示无监督损失权重;
S18、教师模型根据学生模型的指数移动平均机制进行训练更新。
4.根据权利要求3所述的一种基于半监督学习的小麦赤霉病孢子检测方法,其特征在于,所述弱数据增强包括对无标记孢子样本数据进行水平翻转或随机裁剪,所述综合置信度为分类分数与置信度分数的乘积。
5.根据权利要求3所述的一种基于半监督学习的小麦赤霉病孢子检测方法,其特征在于,所述S2具体包括:
S21、通过非极大值抑制对无标记孢子样本数据进行预测生成的伪标签进行第一次过滤;
S22、使用低阈值和高阈值/>对第一次过滤后的伪标签进行二次过滤,将伪标签分为可靠伪标签、候选伪标签和不可靠伪标签;
S23、根据低阈值和高阈值/>划分,分别得到的三类伪标签的无监督损失/>:
当生成置信度分数大于高阈值时,无监督损失/>包括无监督分类损失/>、无监督回归损失/>和无监督置信度损失/>;
当生成置信度分数位于低阈值和高阈值/>之间时,无监督损失/>包括无监督回归损失/>和无监督置信度损失/>;
当生成置信度分数小于低阈值时,无监督损失/>包括无监督置信度损失/>。
6.根据权利要求5所述的一种基于半监督学习的小麦赤霉病孢子检测方法,其特征在于,所述可靠伪标签、候选伪标签和不可靠伪标签分类方法为:
;
当伪标签的得分大于高阈值为可靠伪标签;
当伪标签的得分位于低阈值和高阈值/>之间为候选伪标签;
当伪标签的得分小于低阈值为不可靠伪标签;
其中,表示教师模型对伪标签的第/>个样本预测的综合置信度,低阈值/>为固定阈值0.1,高阈值/>为动态自适应阈值;
高阈值动态自适应阈值为在每次训练迭代中使用有标记孢子样本数据产生的损失进行动态计算:
;
其中,表示训练的轮次,/>表示有标记孢子样本数据在每个循环轮次之后的有监督损失的平均值,/>和/>是两个大于1的常数,参数/>控制了阈值曲线的下降速率。
7.根据权利要求5所述的一种基于半监督学习的小麦赤霉病孢子检测方法,其特征在于,所述无监督分类损失为:
;
其中,表示交叉熵损失,/>表示学生模型针对无标记孢子样本数据预测的分类得分,/>表示教师模型针对伪标签输出的分类得分;
所述无监督回归损失为:
;
其中,表示损失函数,/>表示学生模型针对无标记孢子样本数据预测的回归得分,/>表示教师模型针对伪标签输出的回归得分;
所述无监督置信度损失为:
;
其中,表示学生模型针对无标记孢子样本数据预测的置信度得分,/>表示教师模型针对伪标签输出的综合置信度得分,/>表示教师模型针对伪标签输出的置信度得分,代表目标存在的可能性,当/>时,生成的伪标签中包含目标的概率为0。
8.根据权利要求5所述的一种基于半监督学习的小麦赤霉病孢子检测方法,其特征在于,所述S3具体包括:
S31、引入域感知损失缓解源域和目标域之间的差异,通过网络学习源域和目标域的特征;
S32、使用最小平方损失进行不同域之间的适应;
S33、得到小麦赤霉病孢子样本数据最终的有监督损失。
9.根据权利要求8所述的一种基于半监督学习的小麦赤霉病孢子检测方法,其特征在于,所述引入域感知损失:
;
其中,表示域感知损失,/>表示有标记孢子样本数据,/>表示无标记孢子样本数据,/>表示域分类器对于有标记孢子样本数据的预测输出,/>表示域分类器对于无标记孢子样本数据的预测输出,/>表示源域,/>表示目标域。
10.根据权利要求8所述的一种基于半监督学习的小麦赤霉病孢子检测方法,其特征在于,所述最终的有监督损失:
;
其中,包括了源域和目标域上的损失,/>用于控制域感知损失贡献的超参数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311108676.8A CN116821698B (zh) | 2023-08-31 | 2023-08-31 | 基于半监督学习的小麦赤霉病孢子检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311108676.8A CN116821698B (zh) | 2023-08-31 | 2023-08-31 | 基于半监督学习的小麦赤霉病孢子检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116821698A true CN116821698A (zh) | 2023-09-29 |
CN116821698B CN116821698B (zh) | 2024-01-05 |
Family
ID=88127898
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311108676.8A Active CN116821698B (zh) | 2023-08-31 | 2023-08-31 | 基于半监督学习的小麦赤霉病孢子检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116821698B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117372819A (zh) * | 2023-12-07 | 2024-01-09 | 神思电子技术股份有限公司 | 用于有限模型空间的目标检测增量学习方法、设备及介质 |
CN117670889A (zh) * | 2024-02-02 | 2024-03-08 | 长春理工大学 | 一种基于半监督学习的混合集成电路组件缺陷检测方法 |
CN117710970A (zh) * | 2024-02-05 | 2024-03-15 | 武汉互创联合科技有限公司 | 基于半监督算法的胚胎细胞多核目标检测方法 |
CN117710970B (zh) * | 2024-02-05 | 2024-05-03 | 武汉互创联合科技有限公司 | 基于半监督算法的胚胎细胞多核目标检测方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110082298A (zh) * | 2019-05-15 | 2019-08-02 | 南京农业大学 | 一种基于高光谱图像的小麦品种赤霉病综合抗性鉴定方法 |
CN113192022A (zh) * | 2021-04-27 | 2021-07-30 | 长治学院 | 基于深度学习的病原孢子识别计数方法和装置 |
WO2022241245A2 (en) * | 2021-05-13 | 2022-11-17 | Fluid-Screen, Inc. | Techniques for spore separation, detection, and quantification |
US20230154167A1 (en) * | 2021-11-15 | 2023-05-18 | Nec Laboratories America, Inc. | Source-free cross domain detection method with strong data augmentation and self-trained mean teacher modeling |
CN116524255A (zh) * | 2023-04-24 | 2023-08-01 | 西北农林科技大学 | 基于Yolov5-ECA-ASFF的小麦赤霉病孢子识别方法 |
CN116563738A (zh) * | 2023-06-08 | 2023-08-08 | 安徽理工大学 | 一种基于不确定性的多阶段引导的小目标半监督学习检测方法 |
CN116630971A (zh) * | 2023-07-24 | 2023-08-22 | 安徽大学 | 基于CRF_ResUnet++网络的小麦赤霉病孢子分割方法 |
-
2023
- 2023-08-31 CN CN202311108676.8A patent/CN116821698B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110082298A (zh) * | 2019-05-15 | 2019-08-02 | 南京农业大学 | 一种基于高光谱图像的小麦品种赤霉病综合抗性鉴定方法 |
CN113192022A (zh) * | 2021-04-27 | 2021-07-30 | 长治学院 | 基于深度学习的病原孢子识别计数方法和装置 |
WO2022241245A2 (en) * | 2021-05-13 | 2022-11-17 | Fluid-Screen, Inc. | Techniques for spore separation, detection, and quantification |
US20230154167A1 (en) * | 2021-11-15 | 2023-05-18 | Nec Laboratories America, Inc. | Source-free cross domain detection method with strong data augmentation and self-trained mean teacher modeling |
CN116524255A (zh) * | 2023-04-24 | 2023-08-01 | 西北农林科技大学 | 基于Yolov5-ECA-ASFF的小麦赤霉病孢子识别方法 |
CN116563738A (zh) * | 2023-06-08 | 2023-08-08 | 安徽理工大学 | 一种基于不确定性的多阶段引导的小目标半监督学习检测方法 |
CN116630971A (zh) * | 2023-07-24 | 2023-08-22 | 安徽大学 | 基于CRF_ResUnet++网络的小麦赤霉病孢子分割方法 |
Non-Patent Citations (3)
Title |
---|
JIN YUAN等: "SporeDet: A Real-Time Detection ofWheat Scab Spores", 《ICIC 2023》 * |
张林;张梦雅;康健;闫红飞;刘大群;: "一种快速检测小麦赤霉病菌种类的方法", 河南农业科学, no. 01 * |
李鑫铭;赵磊;邵宝民;王栋;: "一种新的基于形态学与Yolov3算法的显微镜图像中孢子识别方法", 智能计算机与应用, no. 05 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117372819A (zh) * | 2023-12-07 | 2024-01-09 | 神思电子技术股份有限公司 | 用于有限模型空间的目标检测增量学习方法、设备及介质 |
CN117372819B (zh) * | 2023-12-07 | 2024-02-20 | 神思电子技术股份有限公司 | 用于有限模型空间的目标检测增量学习方法、设备及介质 |
CN117670889A (zh) * | 2024-02-02 | 2024-03-08 | 长春理工大学 | 一种基于半监督学习的混合集成电路组件缺陷检测方法 |
CN117710970A (zh) * | 2024-02-05 | 2024-03-15 | 武汉互创联合科技有限公司 | 基于半监督算法的胚胎细胞多核目标检测方法 |
CN117710970B (zh) * | 2024-02-05 | 2024-05-03 | 武汉互创联合科技有限公司 | 基于半监督算法的胚胎细胞多核目标检测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN116821698B (zh) | 2024-01-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116821698B (zh) | 基于半监督学习的小麦赤霉病孢子检测方法 | |
CN108095716B (zh) | 一种基于置信规则库和深度神经网络的心电信号检测方法 | |
CN109977780A (zh) | 一种基于深度学习算法的硅藻的检测与识别方法 | |
CN109086799A (zh) | 一种基于改进卷积神经网络模型AlexNet的作物叶片病害识别方法 | |
CN110490242B (zh) | 图像分类网络的训练方法、眼底图像分类方法及相关设备 | |
CN103714261B (zh) | 二阶段混合模型的智能辅助医疗决策支持方法 | |
CN114841257B (zh) | 一种基于自监督对比约束下的小样本目标检测方法 | |
CN105718890A (zh) | 一种基于卷积神经网络的特定视频检测方法 | |
CN110826639B (zh) | 一种利用全量数据训练零样本图像分类方法 | |
WO2021170085A1 (zh) | 标注方法、关系抽取方法、存储介质和运算装置 | |
CN112819821B (zh) | 一种细胞核图像检测方法 | |
CN111105877A (zh) | 基于深度置信网络的慢性病精确干预方法及系统 | |
CN114663426A (zh) | 一种基于关键骨区定位的骨龄评估方法 | |
CN112183652A (zh) | 一种联邦机器学习环境下的边缘端偏见检测方法 | |
CN114722805A (zh) | 基于大小导师知识蒸馏的少样本情感分类方法 | |
CN114331122A (zh) | 重点人员风险等级评估方法及相关设备 | |
CN115761408A (zh) | 一种基于知识蒸馏的联邦域适应方法及系统 | |
CN111144462A (zh) | 一种雷达信号的未知个体识别方法及装置 | |
CN111898528B (zh) | 数据处理方法、装置、计算机可读介质及电子设备 | |
CN117274657A (zh) | 基于课程知识蒸馏的耐噪声木薯叶病害分类方法及系统 | |
WO2024032010A1 (zh) | 一种基于迁移学习策略的少样本目标实时检测方法 | |
CN117219127A (zh) | 认知状态识别方法以及相关设备 | |
CN111598580A (zh) | 一种基于XGBoost算法的区块链产品检测方法、系统及装置 | |
WO2023070843A1 (zh) | 多模态货币识别系统、方法、存储介质和终端 | |
CN112102285B (zh) | 一种基于多模态对抗训练的骨龄检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |