CN116821698A

CN116821698A - 基于半监督学习的小麦赤霉病孢子检测方法

Info

Publication number: CN116821698A
Application number: CN202311108676.8A
Authority: CN
Inventors: 黄章进; 原瑾
Original assignee: University of Science and Technology of China USTC
Current assignee: University of Science and Technology of China USTC
Priority date: 2023-08-31
Filing date: 2023-08-31
Publication date: 2023-09-29
Anticipated expiration: 2043-08-31
Also published as: CN116821698B

Abstract

本发明公开了一种基于半监督学习的小麦赤霉病孢子检测方法，包括：S1、将小麦赤霉病孢子样本数据经过数据增强分别输入到学生模型和教师模型，学生模型与教师模型之间互相学习；S2、在伪标签生成阶段引入动态自适应阈值，根据训练阶段过程中模型的损失来自动计算伪标签分配时使用的高阈值；S3、在训练阶段引入域感知损失来缓解有标记孢子样本数据和无标记孢子样本数据之间的差异；S4、输出有标记孢子样本数据的边界框位置、有标记孢子样本数据的类别、有标记孢子样本数据的置信度得分以及无标记孢子样本数据的伪标签。本发明可以使得无标记孢子样本数据在训练中逐渐发挥作用，提高模型的泛化能力和性能。

Description

基于半监督学习的小麦赤霉病孢子检测方法

技术领域

本发明涉及农业的深度学习技术领域，尤其涉及一种基于半监督学习的小麦赤霉病孢子检测方法。

背景技术

在小麦种植和农业生产过程中小麦赤霉病是一种常见且具有破坏性的病害。小麦赤霉病是由多种镰刀菌引起的，其孢子是病害的主要传播途径。因此，对小麦赤霉病孢子的检测可以帮助农民及时采取防治措施，减少病害造成的损失。

在传统的孢子检测方法中，常使用机器学习的方法进行检测或显微镜技术来识别和计数孢子。然而，这些方法存在如下的问题和局限性：

第一、传统孢子检测方法需要依赖经验丰富的专业人员进行孢子的标记和计数，这种方法的结果可能受到操作者主观判断和主观误差的影响，导致结果的不一致性和不可靠性；

第二、传统孢子检测方法需要大量的人力和时间投入，由于孢子数量巨大且分布广泛，对大规模的样本进行标记和计数是一项繁琐且耗时的工作，限制了其在实际应用中的效率；

第三、传统孢子检测方法由于标注过程的复杂性和人力资源的限制，获得足够数量的准确标注数据是具有困难性和时间性的，这导致了传统方法和深度学习方法在模型训练和泛化能力方面的限制。

综上所述，现有的孢子检测方法存在主观性、时间成本高和数据稀缺性的问题。这些问题限制了传统方法在准确性、效率和可扩展性方面的应用，且在农业实际应用场景中，由于涉及农作物孢子数据的稀缺性，获得大规模精确标记的图像是不可能的。因此，提供如何在有限的标注数据下利用好半监督学习的思想去解决小麦赤霉病孢子检测的实际问题是本领域技术人员亟需解决的问题。

发明内容

本发明的一个目的在于提出一种基于半监督学习的小麦赤霉病孢子检测方法，本发明采用Burn-In策略对有标记孢子样本数据和无标记孢子样本数据进行联合训练，使得无标记孢子样本数据在训练中逐渐发挥作用，提高模型的泛化能力和性能。

根据本发明实施例的一种基于半监督学习的小麦赤霉病孢子检测方法，包括如下步骤：

S1、将小麦赤霉病孢子样本数据经过数据增强分别输入到学生模型和教师模型，学生模型与教师模型之间互相学习；

S2、在伪标签生成阶段引入动态自适应阈值，根据训练阶段过程中模型的损失来自动计算伪标签分配时使用的高阈值；

S3、在训练阶段引入域感知损失来缓解有标记孢子样本数据和无标记孢子样本数据之间的差异；

S4、输出有标记孢子样本数据的边界框位置、有标记孢子样本数据的类别、有标记孢子样本数据的置信度得分以及无标记孢子样本数据的伪标签。

可选的，所述学生模型与教师模型之间互相学习包括：

学生模型利用梯度下降优化器对有标记孢子样本数据和无标记孢子样本数据对学生模型参数进行训练更新：

；

其中，表示学生模型参数，/>表示学习率，/>表示半监督学习的小麦赤霉病孢子检测的总损失；

有标记孢子样本数据通过学生模型得到预测值，并与真实值计算回归损失、分类损失和置信度损失，无标记孢子样本数据利用教师模型得到伪标签，并作为学生模型对无标记孢子样本数据预测值的监督信息，以此计算无监督损失；

学生模型参数的训练更新以指数移动平均机制反馈给教师模型，对教师模型的参数进行训练更新：

；

其中，表示教师模型的参数，/>表示指数衰减参数。

可选的，所述S1具体包括：

S11、采用Burn-In策略的联合训练方式直接加入小麦赤霉病孢子样本数据；

S12、在Burn-In策略对有标记孢子样本数据进行预训练，并复制成一个教师模型和一个学生模型，获得具有伪标签生成能力的教师模型；

S13、将小麦赤霉病孢子样本数据中按照比例随机抽取有标记孢子样本数据和无标记孢子样本数据形成一个训练批次作为输入；

S14、有标记孢子样本数据和无标记孢子样本数据通过强数据增强后输入学生模型，无标记孢子样本数据再次通过弱数据增强送入教师模型；

S15、在有标记孢子样本数据上，学生模型进行由真实值矩形包围框的有监督训练，得到有监督损失：

；

其中，表示有监督分类损失，用于衡量模型对有标记孢子样本数据预测的类别与真实类别之间的差异，/>表示有监督回归损失，用于衡量模型对有标记孢子样本数据预测的边界框位置与真实边界框位置之间的差异，/>表示有监督置信度损失，用于计算模型对有标记孢子样本数据预测的置信度得分和真实置信度之间的差异；

S16、在无标记孢子样本数据上，教师模型进行无监督训练，教师模型对无标记孢子样本数据进行预测生成伪标签，经过综合置信度过滤得到的伪标签用来指导学生模型的训练，得到无监督损失：

；

其中，表示无监督分类损失，/>表示无监督回归损失，/>表示无监督置信度损失；

S17、计算总损失，总损失/>为有监督损失/>和无监督损失/>的加权和：

；

其中，表示无监督损失权重；

S18、教师模型根据学生模型的指数移动平均机制进行训练更新。

可选的，所述弱数据增强包括对无标记孢子样本数据进行水平翻转或随机裁剪，所述综合置信度为分类分数与置信度分数的乘积。

可选的，所述S2具体包括：

S21、通过非极大值抑制对无标记孢子样本数据进行预测生成的伪标签进行第一次过滤；

S22、使用低阈值和高阈值/>对第一次过滤后的伪标签进行二次过滤，将伪标签分为可靠伪标签、候选伪标签和不可靠伪标签；

S23、根据低阈值和高阈值/>划分，分别得到的三类伪标签的无监督损失/>：

当生成置信度分数大于高阈值时，无监督损失/>包括无监督分类损失/>、无监督回归损失/>和无监督置信度损失/>；

当生成置信度分数位于低阈值和高阈值/>之间时，无监督损失/>包括无监督回归损失/>和无监督置信度损失/>；

当生成置信度分数小于低阈值时，无监督损失/>包括无监督置信度损失。

可选的，所述可靠伪标签、候选伪标签和不可靠伪标签分类方法为：

当伪标签的得分大于高阈值为可靠伪标签；

当伪标签的得分位于低阈值和高阈值/>之间为候选伪标签；

当伪标签的得分小于低阈值为不可靠伪标签；

其中，表示教师模型对伪标签的第/>个样本预测的综合置信度，低阈值为固定阈值0.1，高阈值/>为动态自适应阈值；

高阈值动态自适应阈值为在每次训练迭代中使用有标记孢子样本数据产生的损失进行动态计算：

；

其中，表示训练的轮次，/>表示有标记孢子样本数据在每个循环轮次之后的有监督损失的平均值，/>和/>是两个大于1的常数，/>参数控制了阈值曲线的下降速率。

可选的，所述无监督分类损失为：

；

其中，表示交叉熵损失，/>表示学生模型针对无标记孢子样本数据预测的分类得分，/>表示教师模型针对伪标签输出的分类得分；

所述无监督回归损失为：

；

其中，表示损失函数，/>表示学生模型针对无标记孢子样本数据预测的回归得分，/>表示教师模型针对伪标签输出的回归得分；

所述无监督置信度损失为：

；

其中，表示学生模型针对无标记孢子样本数据预测的置信度得分，/>表示教师模型针对伪标签输出的综合置信度得分，/>表示教师模型针对伪标签输出的置信度得分，代表目标存在的可能性，当/>时，生成的伪标签中包含目标的概率为0。

可选的，所述S3具体包括：

S31、引入域感知损失缓解源域和目标域之间的差异，通过网络学习源域和目标域的特征；

S32、使用最小平方损失进行不同域之间的适应；

S33、得到小麦赤霉病孢子样本数据最终的有监督损失。

可选的，所述引入域感知损失：

；

其中，表示域感知损失，/>表示有标记孢子样本数据，/>表示无标记孢子样本数据，/>表示域分类器对于有标记孢子样本数据的预测输出，/>表示域分类器对于无标记孢子样本数据的预测输出，/>表示源域，/>表示目标域。

可选的，所述最终的有监督损失：

；

其中，包括了源域和目标域上的损失，/>用于控制域感知损失贡献的超参数。

本发明的有益效果是：

（1）本发明采用Burn-In策略对有标记孢子样本数据和无标记孢子样本数据进行联合训练，使得无标记孢子样本数据在训练中逐渐发挥作用，提高模型的泛化能力和性能。

（2）本发明在伪标签生成阶段，为了选择更准确的伪标签，将伪标签划分为可靠的伪标签、候选伪标签和不可靠的伪标签，并引入动态自适应阈值，动态计算过滤伪标签的高阈值，从而在半监督孢子检测训练期间产生高质量的伪标签。

（3）本发明引入域感知损失对模型的特征进行优化来区分有标记孢子样本数据和无标记孢子样本数据，提高模型的泛化性能。

附图说明

附图用来提供对本发明的进一步理解，并且构成说明书的一部分，与本发明的实施例一起用于解释本发明，并不构成对本发明的限制。在附图中：

图1为本发明提出的一种基于半监督学习的小麦赤霉病孢子检测方法的网络结构图；

图2为本发明提出的一种基于半监督学习的小麦赤霉病孢子检测方法中伪标签分配策略示意图；

图3为本发明提出的一种基于半监督学习的小麦赤霉病孢子检测方法中域感知损失示意图。

具体实施方式

现在结合附图对本发明作进一步详细的说明。这些附图均为简化的示意图，仅以示意方式说明本发明的基本结构，因此其仅显示与本发明有关的构成。

参考图1-图3，一种基于半监督学习的小麦赤霉病孢子检测方法，包括如下步骤：

本实施方式中，采用学生模型和教师模型的整体架构，利用原始的YOLOv5网络作为整个框架中学生模型和教师模型的基本检测器，S1具体包括：

S12、在Burn-In策略通过YOLOv5网络对有标记孢子样本数据进行预训练，并复制成一个教师模型和一个学生模型，获得具有伪标签生成能力的教师模型；

S13、将小麦赤霉病孢子样本数据中按照1：1的比例随机抽取有标记孢子样本数据和无标记孢子样本数据形成一个训练批次作为输入；

；

S16、在无标记孢子样本数据上，教师模型进行无监督训练，教师模型对无标记孢子样本数据进行预测生成伪标签，经过综合置信度过滤得到的伪标签用来指导学生模型的训练，针对无标记孢子样本数据，得到无监督损失：

；

其中，表示无监督损失权重；

本实施方式中，弱数据增强包括对无标记孢子样本数据进行水平翻转或随机裁剪，综合置信度为分类分数与置信度分数的乘积。

本实施方式中，学生模型与教师模型之间互相学习包括：

；

其中，表示教师模型的参数，/>表示指数衰减参数。

S2、在伪标签生成阶段引入动态自适应阈值，根据训练阶段过程中模型的损失来自动计算伪标签分配时使用的高阈值，有效地减少伪标签的错误率；

S2的目的是保证教师模型生成高质量的伪标签，通过引入动态自适应阈值，利用样本训练迭代产生的损失来动态计算生成伪标签的高阈值，更为精细地划分检测器生成的伪标签。

本实施方式中，经过弱数据增强的无标记孢子样本数据通过教师模型后得到大量的伪标签，S2具体包括：

可靠伪标签、候选伪标签和不可靠伪标签分类方法为：

；

当伪标签的得分大于高阈值为可靠伪标签；

当伪标签的得分位于低阈值和高阈值/>之间为候选伪标签；

当伪标签的得分小于低阈值为不可靠伪标签；

受到Dash的启发，高阈值动态自适应阈值为在每次训练迭代中使用有标记孢子样本数据产生的损失进行动态计算：

；

其中，表示训练的轮次，/>表示有标记孢子样本数据在每个循环轮次之后的有监督损失的平均值，/>和/>是两个大于1的常数，参数/>控制了阈值曲线的下降速率，在实施方式中，/>取值为1.0001，/>取值为1.1。

S23、为了充分利用生成的伪标签，本方法采用分而治之的策略计算无监督损失。根据低阈值和高阈值/>划分，分别得到的三类伪标签的无监督损失/>：

本实施方式中，无监督分类损失为：

；

无监督回归损失为：

；

无监督置信度损失为：

；

其中，表示学生模型针对无标记孢子样本数据预测的置信度得分，/>表示教师模型针对伪标签输出的综合置信度得分，/>表示教师模型针对伪标签输出的置信度得分，代表目标存在的可能性，当/>时，生成的伪标签中包含目标的概率为0，因此损失计算如上式所示。

S3、在训练阶段引入域感知损失来缓解有标记孢子样本数据和无标记孢子样本数据之间的差异，以此来提高对小麦赤霉病孢子的检测，实现最佳性能。

本实施方式中，目的是缓解源域和目标域之间的差异，S3具体包括：

S32、使用最小平方损失进行不同域之间的适应；

S33、得到小麦赤霉病孢子样本数据最终的有监督损失。

现有的采用二分类交叉熵损失作为域分类损失：

；

其中，表示域分类器的预测输出，源域的标签为0，目标域的标签为1，这种带有sigmoid交叉熵的损失只评估了领域分类的正确性，但是未能衡量不同域之间的距离。

因此，本实施方式中，本发明使用最小平方损失进行不同域之间的适应，引入域感知损失：

；

其中，表示域感知损失，/>表示有标记孢子样本数据，/>表示无标记孢子样本数据，/>表示域分类器对于有标记孢子样本数据的预测输出，/>表示域分类器对于无标记孢子样本数据的预测输出，/>表示源域，/>表示目标域，这种损失可以直接将域标签和预测值相匹配，保留域之间的距离，稳定训练，提高模型的性能。

本实施方式中，最终的有监督损失：

；

其中，包括了源域和目标域上的损失，/>用于控制域感知损失贡献的超参数，在本实施方式中设置为 0.01。

本实施方式中，本发明从三个方面对模型的性能进行评估：首先，将本发明方法与主流半监督目标检测方法SoftTeacher和OneTeacehr进行比较。如下表1所示：

由上表1可以看出，为了公平比较，所有的模型均在640x640图像分辨率下进行测试。AP₅₀和 AP₇₅分别代表 IoU 阈值为 0.50 和 0.75 的 mAP，其中数值越大表示效果越佳。最好的结果用粗体表示，第二好的结果用下划线表示。为了获得更好的结果，利用预训练模型进一步微调SoftTeacher和OneTeacher方法。当在孢子验证集上测试时，本发明方法在mAP、AP₅₀和 AP₇₅上比有监督的基线模型分别高出0.3%、0.4%和0.2%，达到83.8%、93.9%和89.4%。由于在完全标记的数据设置下，无标记的孢子检测数据集的规模不够大，因此提升的结果不大。而SoftTeacher和OneTeacher方法的性能均有略有下降。实验结果表明，本发明方法优于其他半监督检测的方法。此外，从参数量来看，有监督的基线模型参数量最少7.03M，SoftTeacher 的参数量最多为82.76M，而本发明方法的参数量为7.38M略高于有监督的基线模型。

其次，对域感知损失和动态自适应阈值模块进行逐步验证。如下表2和表3所示：

/>

由上表2-3可以看出，域感知损失被设计用于有效学习源域和目标域的数据特征信息，以形成更鲁棒的特征表达。该损失通过最小平方损失减少域之间的差异，比较表2中实验（b）和（c）的结果，在添加域感知损失之后mAP由72.7%提升为73%。同样地，比较表3中实验（b）和（c）的结果，在添加域感知损失之后mAP由76.1%提升为76.5%，AP₅₀和 AP₇₅也有相应的提升。这些观察结果表明，域感知损失可以在一定程度上提高模型的检测性能。

伪标签的生成是基于阈值生成的，使用固定阈值常常导致模型性能低下。采用动态自适应的方式来调整过滤伪标签的高阈值，以便获得更高质量的伪标签。观察表2中实验（c）和（d)，将mAP提升到74.1%，相对于有监督的基线模型提高了1.9%。同样地，观察表3中实验（c）和（d)，将mAP提升到77%，相对于有监督的基线模型提高了1.4%。这些观察结果表明，动态自适应阈值可以在一定程度上提高模型的检测性能。

由上述的实施方式可以看出本发明采用Burn-In策略对有标记孢子样本数据和无标记孢子样本数据进行联合训练，使得无标记孢子样本数据在训练中逐渐发挥作用，提高模型的泛化能力和性能。在伪标签生成阶段，为了选择更准确的伪标签，将伪标签划分为可靠的伪标签、候选伪标签和不可靠的伪标签，并引入动态自适应阈值，动态计算过滤伪标签的高阈值，从而在半监督孢子检测训练期间产生高质量的伪标签。引入域感知损失对模型的特征进行优化来区分有标记孢子样本数据和无标记孢子样本数据，提高模型的泛化性能。

以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，根据本发明的技术方案及其发明构思加以等同替换或改变，都应涵盖在本发明的保护范围之内。

Claims

1.一种基于半监督学习的小麦赤霉病孢子检测方法，其特征在于，包括如下步骤：

S2、在伪标签生成阶段引入动态自适应阈值，根据训练阶段过程中模型的损失来计算伪标签分配时使用的高阈值；

S4、输出有标记孢子样本数据的边界框位置、有标记孢子样本数据的类别、有标记孢子样本数据的置信度得分和无标记孢子样本数据的伪标签。

2.根据权利要求1所述的一种基于半监督学习的小麦赤霉病孢子检测方法，其特征在于，所述学生模型与教师模型之间互相学习包括：

；

其中，表示教师模型的参数，/>表示指数衰减参数。

3.根据权利要求2所述的一种基于半监督学习的小麦赤霉病孢子检测方法，其特征在于，所述S1具体包括：

；

其中，表示无监督损失权重；

4.根据权利要求3所述的一种基于半监督学习的小麦赤霉病孢子检测方法，其特征在于，所述弱数据增强包括对无标记孢子样本数据进行水平翻转或随机裁剪，所述综合置信度为分类分数与置信度分数的乘积。

5.根据权利要求3所述的一种基于半监督学习的小麦赤霉病孢子检测方法，其特征在于，所述S2具体包括：

当生成置信度分数小于低阈值时，无监督损失/>包括无监督置信度损失/>。

6.根据权利要求5所述的一种基于半监督学习的小麦赤霉病孢子检测方法，其特征在于，所述可靠伪标签、候选伪标签和不可靠伪标签分类方法为：

；

当伪标签的得分大于高阈值为可靠伪标签；

当伪标签的得分位于低阈值和高阈值/>之间为候选伪标签；

当伪标签的得分小于低阈值为不可靠伪标签；

其中，表示教师模型对伪标签的第/>个样本预测的综合置信度，低阈值/>为固定阈值0.1，高阈值/>为动态自适应阈值；

；

其中，表示训练的轮次，/>表示有标记孢子样本数据在每个循环轮次之后的有监督损失的平均值，/>和/>是两个大于1的常数，参数/>控制了阈值曲线的下降速率。

7.根据权利要求5所述的一种基于半监督学习的小麦赤霉病孢子检测方法，其特征在于，所述无监督分类损失为：

；

所述无监督回归损失为：

；

所述无监督置信度损失为：

；

8.根据权利要求5所述的一种基于半监督学习的小麦赤霉病孢子检测方法，其特征在于，所述S3具体包括：

S32、使用最小平方损失进行不同域之间的适应；

S33、得到小麦赤霉病孢子样本数据最终的有监督损失。

9.根据权利要求8所述的一种基于半监督学习的小麦赤霉病孢子检测方法，其特征在于，所述引入域感知损失：

；

10.根据权利要求8所述的一种基于半监督学习的小麦赤霉病孢子检测方法，其特征在于，所述最终的有监督损失：

；