CN114743048A

CN114743048A - 检测异常秸秆图片的方法和检测装置

Info

Publication number: CN114743048A
Application number: CN202210367055.0A
Authority: CN
Inventors: 常志中; 王香珊; 汪国会
Original assignee: Heilongjiang Huida Technology Development Co ltd
Current assignee: Heilongjiang Huida Technology Development Co ltd
Priority date: 2022-04-08
Filing date: 2022-04-08
Publication date: 2022-07-12

Abstract

本申请提供一种检测异常秸秆图片的方法和检测装置，该方法包括：将多张待检测秸秆图片输入预先训练好的神经网络模型中；根据所述神经网络模型输出的分类结果和相似度结果确定所述多张待检测秸秆图片中的异常秸秆图片，其中，所述分类结果用于表示所述待检测秸秆图片的类别，所述相似度结果用于表示所述待检测秸秆图片与所述模板秸秆图片的相似度。该技术方案可以根据模型的输出结果确定待检测秸秆图片中的异常秸秆图片，从而可以在挑选错误数据时减少人工审核图片的数量。

Description

检测异常秸秆图片的方法和检测装置

技术领域

本申请涉及农业领域，并且更具体地，涉及一种检测异常秸秆图片的方法和检测装置。

背景技术

在农业领域中，经常需要对作业地块进行采集照片，以获取作业地块的一些信息。例如，通过采集的作业地块的照片进行神经网络模型的训练，后续可以直接通过该训练好的神经网络模型识别作业地块的秸秆类型，使得农机有选择地进行作业，从而提升农业自动化程度。但由于在具体作业时，在对作业地块进行采集照片时，会受到如遮挡、光线、拍摄角度以及各种干扰的影响，导致拍摄的图片与训练集偏差较大，会对作业地块的秸秆分类结果造成影响。

另外，在使用神经网络对作业地块的秸秆类型进行分类时，会有一定的准确率，例如准确率为90％，那么对于识别错误的10％来说，需要进行人工审核，以确定哪些图片是错误的，当数据量较大时，人工审核的工作量较大，会耗费大量精力和时间。

发明内容

本申请实施例提供了一种检测异常秸秆图片的方法和检测装置，该技术方案可以根据待检测秸秆图片与模板秸秆图片的差异程度确定待检测秸秆图片中的异常秸秆图片，从而可以减少用户在人工审核识别错误的数据时的工作量。

第一方面，提供一种检测异常秸秆图片的方法，所述方法包括：将多张待检测秸秆图片输入预先训练好的神经网络模型中；根据所述神经网络模型输出的分类结果和相似度结果确定所述多张待检测秸秆图片中的异常秸秆图片，其中，所述分类结果用于表示所述待检测秸秆图片的类别，所述相似度结果用于表示所述待检测秸秆图片与所述模板秸秆图片的相似度。

本申请实施例中，可以根据待检测秸秆图片与模板秸秆图片的差异程度确定待检测秸秆图片中的异常秸秆图片，从而可以减少用户在人工审核识别错误的数据时的工作量。

结合第一方面，在第一方面的一种实现方式中，所述根据所述神经网络模型输出的分类结果和相似度结果确定所述多张待检测秸秆图片中的异常秸秆图片，包括：当所述待检测秸秆图片与所述模板秸秆图片的相似度小于第一预设值时，确定所述待检测秸秆图片为异常秸秆图片。

结合第一方面，在第一方面的一种实现方式中，所述模板秸秆图片包括N种类型，所述当所述待检测秸秆图片与所述模板秸秆图片的相似度小于第一预设值时，确定所述待检测秸秆图片为异常秸秆图片，包括：当所述待检测秸秆图片与所述模板秸秆图片中的N种类型的N个相似度中最大的相似度小于第一预设值时，确定所述待检测秸秆图片为异常秸秆图片；其中，N为大于或等于2的整数。

基于本申请实施例，可以通过待检测秸秆图片与模板的相似度来确定是否为异常秸秆图片，从而有利于减少仍审核的工作量。

结合第一方面，在第一方面的一种实现方式中，所述根据所述神经网络模型输出的分类结果和相似度结果确定所述多张待检测秸秆图片中的异常秸秆图片，包括：当所述待检测秸秆图片的分类结果与所述相似度结果不一致时，确定所述待检测秸秆图片为异常秸秆图片。

基于本申请实施例，当待检测秸秆图片的分类结果与相似度结果不一致时，可以确定待检测秸秆图片为异常秸秆图片。

结合第一方面，在第一方面的一种实现方式中，所述模板秸秆图片包括N种类型，当所述待检测秸秆图片的分类结果与所述相似度结果不一致时，确定所述待检测秸秆图片为异常秸秆图片，包括：当所述待检测秸秆图片与所述待检测秸秆图片的分类结果对应的类型的相似度不是N个相似度中的最大值时，确定所述待检测秸秆图片为异常秸秆图片；其中，N为大于或等于2的整数。

结合第一方面，在第一方面的一种实现方式中，在所述将多张待检测秸秆图片输入训练好的神经网络模型中之前，所述方法还包括：

将训练数据集和模板数据输入神经网络模型中进行训练，或者，将训练数据集和模板数据的特征输入神经网络模型中进行训练。

本申请实施例中，通过加入模板数据或模板数据的特征对模型进行训练，可以给训练数据集提供一些参考，从而有利于确定训练数据集与不同模板之间的关联程度。

结合第一方面，在第一方面的一种实现方式中，所述将训练数据集和模板数据的特征输入神经网络模型中进行训练，包括：在所述神经网络模型中，将所述训练数据集的第一特征与第二特征进行自注意力学习，其中，所述第二特征为随机初始化得到的特征；将所述第二特征与所述第一特征进行自注意力学习后得到的第三特征与所述模板数据的第四特征进行交叉注意力学习。

基于本申请实施例，将训练数据集的第一特征与第二token进行自注意力学习，通过自注意力机制学习，可以使得网络模型学习作业地块中不同图片节点之间的关系，从而获取作业地块的全局表达；通过该交叉注意力学习，可以将作业地块的特征表示与模板的特征之间的关联特征进行了统一，从而可以模拟人的大脑在认识陌生事物时，通过先验知识进行理解和判断的过程。

结合第一方面，在第一方面的一种实现方式中，所述方法还包括：

将所述异常秸秆图片存放在第一集合中。

该技术方案有利于从该第一集合中寻找模型识别错误的秸秆图片。

结合第一方面，在第一方面的一种实现方式中，所述神经网络模型的损失函数为：

L_total＝α·L_cls+β·L_dis；

其中，

α表示分类损失函数的权重、β表示相似度损失函数的权重；w_i表示，类别的分值，c_i表示预测的类别；A_i表示模板秸秆图片特征的特征向量，B_i表示标准数据的特征向量，L_dis计算了两个向量之间的余弦距离。

本申请实施例中，增加了相似度损失函数，从而可以计算待检测秸秆图片与模板秸秆图片的相似度，以进行异常秸秆图片的识别。

结合第一方面，在第一方面的一种实现方式中，所述模板秸秆图片包括的类型包括以下中的至少两种：干扰、无秸秆、个别图片有秸秆、少量秸秆连片、大量秸秆连片、秸秆全量。

第二方面，提供一种检测装置，包括：输入模块，用于将多张待检测秸秆图片输入预先训练好的神经网络模型中；处理模块，用于根据所述神经网络模型输出的分类结果和相似度结果确定所述多张待检测秸秆图片中的异常秸秆图片；其中，所述分类结果用于表示所述待检测秸秆图片的类别，所述相似度结果用于表示所述待检测秸秆图片与所述模板秸秆图片的相似度。

结合第二方面，在第二方面的一种实现方式中，所述处理模块具体用于：当所述待检测秸秆图片与所述模板秸秆图片的相似度小于第一预设值时，确定所述待检测秸秆图片为异常秸秆图片。

结合第二方面，在第二方面的一种实现方式中，所述模板秸秆图片包括N种类型，所述处理模块具体用于：当所述待检测秸秆图片与所述模板秸秆图片中的N种类型的N个相似度结果中的相似度小于第一预设值时，确定所述待检测秸秆图片为异常秸秆图片；其中，N为大于或等于2的整数。

结合第二方面，在第二方面的一种实现方式中，所述处理模块具体用于：当所述待检测秸秆图片的分类结果与所述相似度结果不一致时，确定所述待检测秸秆图片为异常秸秆图片。

结合第二方面，在第二方面的一种实现方式中，所述模板秸秆图片包括N种类型，所述处理模块具体用于：当所述待检测秸秆图片与所述待检测秸秆图片的分类结果对应的类型的相似度不是N个相似度中的最大值时，确定所述待检测秸秆图片为异常秸秆图片；其中，N为大于或等于2的整数。

结合第二方面，在第二方面的一种实现方式中，在所述输入模块将多张待检测秸秆图片输入训练好的神经网络模型中之前，所述装置还包括：训练模块，用于将训练数据集和模板数据输入神经网络模型中进行训练，或者，将训练数据集和模板数据的特征输入神经网络模型中进行训练。

结合第二方面，在第二方面的一种实现方式中，所述训练模块具体用于：在所述神经网络模型中，将所述训练数据集的第一特征与第二特征进行自注意力学习，其中，所述第二特征为随机初始化得到的特征；将所述第二特征与第一特征进行自注意力学习后得到的第三特征与所述模板数据的第四特征进行交叉注意力学习。

结合第二方面，在第二方面的一种实现方式中，所述处理模块还用于：将所述异常秸秆图片存放在第一集合中。

结合第二方面，在第二方面的一种实现方式中，所述神经网络模型的损失函数为：

L_total＝α·L_cls+β·L_dis；

其中，

结合第二方面，在第二方面的一种实现方式中，所述模板秸秆图片包括的类型包括以下中的至少两种：干扰、无秸秆、个别图片有秸秆、少量秸秆连片、大量秸秆连片、秸秆全量。

第三方面，提供一种计算机可读存储介质，其上存储有计算机程序或指令，所述计算机程序或指令被执行时，使得如上述第一方面及其任一种可能的实现方式中所述的检测异常秸秆图片的方法被执行。

第四方面，提供一种计算机程序产品，该计算机程序产品包括：计算机程序(也可以称为代码，或指令)，当该计算机程序被运行时，使得如上述第一方面及其任一种可能的实现方式中所述的检测异常秸秆图片的方法被执行。

第五方面，提供一种芯片，所述芯片包括处理器和通信接口，所述通信接口用于接收信号，并将所述信号传输至所述处理器，所述处理器处理所述信号，使得如上述第一方面及其任一种可能的实现方式中所述的检测异常秸秆图片的方法被执行。

附图说明

图1是本申请实施例提供的秸秆图片分类的示意图。

图2是本申请中提升神经网络模型的泛化能力的示意图。

图3是本申请实施例提供的一种神经网络模型的示意图。

图4是本申请实施例提供的一种检测异常秸秆图片的方法的示意性流程图。

图5是本申请实施例提供的实验一的示意图。

图6是本申请实施例提供的实验二的示意图。

图7是本申请实施例提供的实验三的示意图。

图8是本申请实施例提供的一种检测装置的示意性框图。

具体实施方式

下面将结合附图，对本申请实施例中的技术方案进行描述。

在农业领域中，经常需要对作业地块进行采集照片，以获取作业地块的一些信息。例如，通过采集的作业地块的照片进行神经网络模型的训练，后续可以直接通过该训练好的神经网络模型识别作业地块的秸秆类型，使得农机有选择地进行作业，从而提升农业自动化程度。但由于在具体作业时，在对作业地块进行采集照片时，会受到如遮挡、光线、拍摄角度以及各种干扰的影响，导致拍摄的图片与训练集偏差较大，会对作业地块的分类结果造成影响。

有鉴于此，本申请实施例提供一种检测异常秸秆图片的方法和检测装置，该技术方案可以根据模型的输出结果确定待检测秸秆图片中的异常秸秆图片，从而可以在挑选错误数据时减少人工审核图片的数量。

下文将结合图1至图8介绍本申请实施例中的技术方案。

在农机作业的过程中，不同的地块中含有的秸秆量是不同的，为准确的区分地块中的秸秆量，需要对地块的秸秆量进行分类。对此，本申请实施例中对于采集的秸秆图片做了一些分类。

图1是本申请实施例提供的秸秆图片分类的示意图。如图1所示，根据采集到的作业地块中的秸秆量的多少对秸秆图片进行分类。

在一些实施例中，将秸秆图片分为干扰、无秸秆、个别图片有秸秆、少量秸秆连片、大量秸秆连片、秸秆全量等六类。

应理解，分类为“干扰”的图片可以认为采集的图片不是秸秆所在地块，例如，该图片中包括的内容是作业中的机器，从而会对秸秆量判断造成一些干扰，故将其分类为“干扰”。

分类为无秸秆、个别图片有秸秆、少量秸秆连片、大量秸秆连片、秸秆全量的图片中包括的内容是作业地块，根据其中包括的秸秆量进行区分。

在深度学习中，数据集的好坏会影响到模型的准确率。在本申请实施例中，数据集的制作可以包括如下步骤：

步骤一：获取作业地块的图片。

该步骤一中，可以使用手机、相机、车载摄像头等电子设备拍摄各个不同作业地块的图片，得到大量的秸秆图片，例如，可以获取总量为3000张的不同秸秆图片。

应理解，对于同一个作业地块，可以从多个角度拍摄获取该作业地块的多张秸秆图片，或者在不同天气下、不同时间段拍摄获取作业地块的多张秸秆图片。

步骤二：根据秸秆图片的特征对图片进行分类。

示例性地，对步骤一中获取的图片，根据图片中的秸秆量的多少分为干扰、无秸秆、个别图片有秸秆、少量秸秆连片、大量秸秆连片、秸秆全量等六类。

应理解，在一些实施例中，也可以根据图片中的秸秆量的多少将图片分为更多的类或更少的类，本身实施例不予限定。

步骤三：对各个类别的图片进行人工标注，得到数据集。

示例性地，步骤二中将图片分为六类，则该步骤三中可以对每个类别的图片进行数标注。例如，将类别为“干扰”的图片标注为1、将类别为“无秸秆”的图片标注为2、将类别为“个别图片有秸秆”的图片标注为3、将类别为“少量秸秆连片”的图片标注为4、将类别为“大量秸秆连片”的图片标注为5、将类别为“秸秆全量”的图片标注为6。

步骤四：初步输入网络中模型进行训练，验证数据集的合理性。

该步骤四中，可以将该数据集输入网络模型中进行训练，以验证数据集的合理性。

本申请实施例中，可以通过神经网络模型对该数据集进行训练，通过一系列的调参优化，可以得到各个类别的模板。

本申请实施例中，对于每个类型可以选择十张秸秆图片作为该类的模板，该十张秸秆图片为模板秸秆图片，各个类别的模板组成标准数据集。在后续处理中，可以通过该标准数据集判断待检测秸秆图片与标准数据集之间的差别，当差别较大时，可以认为该待检测秸秆图片为异常图片，然后可以将该异常图片自动挑出，从而可以在挑选错误数据时减少人工审核图片的数量。

应理解，该每个类别的图片数量还可以为其他值，例如，15、20等，本申请实施例不予限定。

下面介绍本申请实施例中涉及的损失函数：

本申请的损失函数主要由两部分组成：分类损失函数L_cls和相似度损失函数L_dis。

L_total＝α·L_cls+β·L_dis (1)

其中，α表示分类损失函数的权重、β表示相似度损失函数的权重。

分类损失函数L_cls为交叉熵损失函数，其定义如下：

其中，w_i表示类别的分值，c_i表示预测的类别。交叉熵损失函数是一个有效寻找最小值目标的损失函数。

相似度损失函数L_dis的定义如下：

其中，A_i表示模板token的特征向量，B_i表示标准数据的特征向量，L_dis计算了两个向量之间的余弦距离。

图2是本申请中提升神经网络模型的泛化能力的示意图。如图2所示，为了增加本申请实施例中神经网络模型的鲁棒性，可以对各个类别的图片进行数据增强处理。

在一些实施例中，可以对图片中的部分不重要的地方进行擦除处理，例如，在第一组图片中，对图片中的部分区域(如区域A)进行擦除图像信息处理。

或者，可以对秸秆图片进行旋转，得到不同角度的秸秆图片。或者，可以对秸秆图片进行裁切。或者，对秸秆图片添加噪声、模糊、颜色变换等处理，以达到数据增强的目的。

应理解，本申请实施例中对于数据增强的具体方式不予限定。

图3是本申请实施例提供的一种神经网络模型的示意图。如图3所示，该神经网络模型可以由六个阶段(stage)组成。图中为简便描述，仅示意出了stage1和stage6，应理解，省略的stage2-stage5的结构可以和stage1相同。

其中，每个stage中可以包含两个深度自注意力变换网络块(transformer block，TB)，在每个transformer block中，待检测秸秆图片的第一特征(token)和第二token进行自注意力(self-attention)机制学习。通过自注意力机制学习，可以使得网络模型学习作业地块中不同图片节点之间的关系，从而获取作业地块的全局表达。

应理解，该待检测秸秆图片的第二token可以是随机生成的，或者是预设的，本申请实施例不予限定。

例如，该待检测秸秆图片被划分为九个小块(patch)，该九个小块则为该待检测图片的第一token，则该第二token为一个小块的大小，该第二token与待检测图片的每个小块进行自注意力学习，从而该第二token可以学习到整个待检测秸秆图片的特征。

在待检测秸秆图片的第一特征(token)和第二token进行自注意力机制学习的同时，将第二token进行自注意力学习后得到的第三token与模板秸秆图片的第四token进行交叉注意力(cross-attention)机制学习。通过该交叉注意力学习，可以将作业地块的特征表示与模板的特征之间的关联特征进行了统一，从而可以模拟人的大脑在认识陌生事物时，通过先验知识进行理解和判断的过程。

应理解，该第四token的生成方式与第二token类似。例如，将模板秸秆图片分为九个小块，将模板秸秆图片的初始化token与上述九个小块分别进行自注意力学习，得到该第四token。

图4是本申请实施例提供的一种检测异常秸秆图片的方法的示意性流程图。如图4所示，该方法可以包括步骤410至步骤420。

410，将多张待检测秸秆图片输入预先训练好的神经网络模型中。

应理解，该多张待检测秸秆图片可以是使用手机、相机、车载摄像头等电子设备拍摄的各个不同作业地块的秸秆图片。

420，根据所述神经网络模型输出的分类结果和相似度结果确定所述多张待检测秸秆图片中的异常秸秆图片，其中，所述分类结果用于表示所述待检测秸秆图片的类别，所述相似度结果用于表示所述待检测秸秆图片与所述模板秸秆图片的相似度。

该步骤中，神经网络模型既可以输出多张待检测秸秆图片的分类，也可以输出待检测秸秆图片与模板秸秆图片的相似度。从而有利于确定待检测秸秆图片是否为异常秸秆图片，减少后续人工审核的工作量。

在一些实施例中，所述根据所述神经网络模型输出的分类结果和相似度结果确定所述多张待检测秸秆图片中的异常秸秆图片，包括：

当所述待检测秸秆图片与所述模板秸秆图片的相似度结果小于第一预设值时，确定所述待检测秸秆图片为异常秸秆图片。

可选地，所述模板秸秆图片包括N种类型，所述当所述待检测秸秆图片与所述模板秸秆图片的相似度小于第一预设值时，确定所述待检测秸秆图片为异常秸秆图片，包括：

当所述待检测秸秆图片与所述模板秸秆图片中的N种类型的N个相似度中最大的相似度小于第一预设值时，确定所述待检测秸秆图片为异常秸秆图片；

其中，N为大于或等于2的整数。

示例性地，当模板秸秆图片共分为六类时，对于多张待检测秸秆图片的每一张图片来说，神经网络模型会分别计算其与该六类模板秸秆图片的每一类进行计算，得到图片与该类的相似度。例如，对于待检测秸秆图片A，通过计算会得到六个相似度值，分别为相似度A、相似度B、相似度C、相似度D、相似度E、相似度F。当该六个相似度值均小于第一预设值时，可以确定该待检测秸秆图片A与六类模板秸秆图片的相似度小，则可以确定该待检测秸秆图片为异常秸秆图片。

应理解，该第一预设值可以是预先设定的，例如，可以为0.5、0.7等，本申请实施例对该第一预设值的具体取值不予限定。

在另一些实施例中，所述根据所述神经网络模型输出的分类结果和相似度结果确定所述多张待检测秸秆图片中的异常秸秆图片，包括：

当所述待检测秸秆图片的分类结果与所述相似度结果不一致时，确定所述待检测秸秆图片为异常秸秆图片。

该实施例中，可以通过待检测秸秆图片的分类结果和相似度结果共同确定该待检测秸秆图片是否为异常秸秆图片。

可选地，所述模板秸秆图片包括N种类型，当所述待检测秸秆图片的分类结果与所述相似度结果不一致时，确定所述待检测秸秆图片为异常秸秆图片，包括：

当所述待检测秸秆图片与所述待检测秸秆图片的分类结果所属模板类型的相似度不是N个相似度中的最大值时，确定所述待检测秸秆图片为异常秸在人工审图时参考异常排除的结果，能定位到模型最可能出错的图片。去除异常图片后的分类准确率能够满足业务需求，则不需要再审图，只考虑异常排除即可

秆图片；

其中，N为大于或等于2的整数。

示例性地，N＝6，即模板秸秆图片共分为六类，该待检测秸秆图片A的分类结果为类别A，但是该待检测秸秆图片A与模板秸秆类型的类别A的相似度结果不是六个相似度结果中的最大值，则可以确定该待检测秸秆图片为异常秸秆图片。例如，待检测秸秆图片A的类别为类别A，其与模板秸秆图片中的类别A的相似度结果为0.55、其与模板秸秆图片中的类别B的相似度为0.61、其与模板秸秆图片中的类别C的相似度为0.44、其与模板秸秆图片中的类别D的相似度为0.43、其与模板秸秆图片中的类别E的相似度为0.46、其与模板秸秆图片中的类别F的相似度为0.41，则可以确定该待检测秸秆图片A与模板秸秆图片中的类别B的相似度最大，但是其分类结果为类别A，则可以确定该待检测秸秆图片A为异常秸秆图片。

在一些实施例中，在所述将多张待检测秸秆图片输入训练好的神经网络模型中之前，所述方法还包括：

应理解，该模板数据可以是前文中的模板秸秆图片。

例如，如果将秸秆图片按照前文中的分类方法分为六类，则可以将训练数据集和该六类模板秸秆图片一同输入该神经网络模型中，从而该模板秸秆图片可以为训练数据集提供参考，有利于后续计算训练数据集与模板秸秆图片的相似度。

在另一个示例中，将训练数据集和模板数据的特征输入训练好的神经网络模型中。

应理解，该模板数据的特征可以是模板秸秆图片的token(如前文中的第四token)，该步骤中，可以将训练数据集经过(convolutional neural networks，CNN)映射(projection)之后转换为特征向量，然后读取模板秸秆图片的token，共同输入神经网络模型中进行训练。

该模板秸秆图片的token可以是预先生成的，例如，每类模板秸秆图片生成一个token。

在一些实施例中，所述将训练数据集和模板数据的特征输入神经网络模型中进行训练，包括：

在所述神经网络模型中，将所述训练数据集的第一特征与第二特征进行自注意力学习，其中，所述第二特征为随机初始化得到的特征；

将所述第二特征与所述第一特征进行自注意力学习后得到的第三特征与所述模板数据的第四特征进行交叉注意力学习。

示例性地，参见图3。该第一特征可以是训练数据集的秸秆图片分成的按顺序排列的小块(patch)，该第二特征(token)可以是随机初始化得到的，然后将该第二token与第一特征进行自注意力学习；之后，该第二token更新为第三特征(token)，然后与模板数据的第四token进行交叉注意力学习。

在一些实施例中，所述方法还包括：

将所述异常秸秆图片存放在第一集合中。

应理解，该第一集合可以位于电子设备的文件夹中，或目标路径中。

本申请实施例中，可以将识别出的异常秸秆图片存放在一起，从而有利于用户查看。

在一些实施例中，所述神经网络模型的损失函数为：

L_total＝α·L_cls+β·L_dis；

其中，

在一些实施例中，所述模板秸秆图片包括的类型包括以下中的至少两种：干扰、无秸秆、个别图片有秸秆、少量秸秆连片、大量秸秆连片、秸秆全量。

应理解，该模板秸秆图片中包括的类型还可以有其他划分方式，本申请实施例不予限定。

下面将结合几个实验验证本申请实施例中的技术方案的效果。

实验一：模板token进行参数更新，其损失函数不更新。

对神经网络模型进行训练时，将训练数据集的token和标准数据集(模板数据)的模板token输入神经网络模型，进行自注意力学习。

如图5所示，图5是实验一的示意图。将训练数据集的分类token和标准数据集的模板token输入神经网络模型中，进行自注意力学习，模板token随着训练不断进行参数更新。应理解，该分类token可以是前文中的第二token。

训练数据集的分类token用于计算损失函数loss1(softmax)，以用于对训练数据集中包括的秸秆图片进行分类，之后将分类token与模板token进行点乘(matmul)作为损失函数loss2，以用于计算待检测秸秆图片与模板秸秆图片的相似度，loss2部分不更新。

神经网络模型训练好之后，使用测试集验证模型。

实验一的结果参见表1。

表1 实验一的结果

待检测秸秆图片总量	813
		检测出的异常图片数量	267
原始分类准确率	86％
		去除异常图片后的分类准确率	91％
异常排除比例	33％

如表一所示，待检测秸秆图片的总量为813张，未对待检测秸秆图片进行异常检测的原始分类准确率为86％；当使用本申请的技术方案对813张待检测秸秆图片进行异常秸秆图片检测时，检测出的异常秸秆图片数量为267张，占总体待检测秸秆图片的33％(异常排除比例)；同时分类准确率提升为91％。

该技术方案中，原始分类准确率为86％，则识别错误的比例为14％，当用户希望查看究竟是哪些数据识别错误时，可能需要从813张图片中人工审核找到识别错误的14％。当使用检测算法检测异常秸秆图片时，分类准确率提升至91％，模型识别错误的比例为9％，提升了模型的分类准确率，用户可能只需从余下546张图片中寻找该识别错误的9％，从而可以降低人工审核的数据量。

实验二：对模板数据进行更新。

对神经网络模型进行训练时，将模板数据(模板秸秆图片)和训练数据集共同输入神经网络模型中。

如图6所示，图6是实验二的示意图。训练数据集的分类token用于计算损失函数loss1，以用于对训练数据集中的秸秆图片进行分类，模板数据是随着训练更新的，将分类token与模板数据进行点乘(matmul)作为损失函数loss2，以用于计算训练数据集中的秸秆图片与模板数据的相似度。

应理解，该分类token可以是前文中的第二token。

神经网络模型训练好之后，使用测试集验证模型。

实验二的结果参见表2。

表2 实验二的结果

待检测秸秆图片总量	813
		检测出的异常图片数量	224
原始分类准确率	86％
		去除异常图片后的分类准确率	92％
异常排除比例	28％

如表2所示，待检测秸秆图片的总量为813张，未对待检测秸秆图片进行异常检测的原始分类准确率为86％；当使用本申请的技术方案对813张待检测秸秆图片进行异常秸秆图片检测时，检测出的异常秸秆图片数量为224张，占总体待检测秸秆图片的28％(异常排除比例)；同时分类准确率提升为92％。

该技术方案中，原始分类准确率为86％，则识别错误的比例为14％，当用户希望查看究竟是哪些数据识别错误时，可能需要从813张图片中人工审核找到识别错误的14％。当使用检测算法检测异常秸秆图片时，分类准确率提升至92％，模型识别错误的比例为8％，提升了模型的分类准确率，用户可能只需从余下589张图片中寻找该识别错误的8％，从而可以降低人工审核的数据量。

实验三：模板token进行参数更新，增加交叉注意力层。

如图7所示，图7是实验三的示意图。对神经网络模型进行训练时，将训练数据集的token和初始化token进行自注意力学习、将初始化token更新后得到的分类token与模板数据的模板token进行交叉注意力学习，模板token随着训练不断进行参数更新。

交叉注意力学习后得到的分类token用于计算损失函数loss1，将模板token与模板数据进行点乘作为损失函数loss2，以用于训练数据集中的秸秆图片与模板数据的相似度。

神经网络模型训练好之后，使用测试集验证模型。

实验三的结果参见表3。

表3 实验三的结果

待检测秸秆图片总量	813
		检测出的异常图片数量	117
原始分类准确率	86％
		去除异常图片后的分类准确率	91％
异常排除比例	14％

如表三所示，待检测秸秆图片的总量为813张，未对待检测秸秆图片进行异常检测的原始分类准确率为86％；当使用本申请的技术方案对813张待检测秸秆图片进行异常秸秆图片检测时，检测出的异常秸秆图片数量为117张，占总体待检测秸秆图片的14％(异常排除比例)；同时分类准确率提升为91％。

该技术方案中，原始分类准确率为86％，则识别错误的比例为14％，当用户希望查看究竟是哪些数据识别错误时，可能需要从813张图片中人工审核找到识别错误的14％。当使用检测算法检测异常秸秆图片时，分类准确率提升至91％，模型识别错误的比例为9％，提升了模型的分类准确率，用户可能只需从余下696张图片中寻找该识别错误的9％，从而可以降低人工审核的数据量。

图8是本申请实施例提供的一种检测装置的示意性框图。如图8所示，该检测装置500可以包括输入模块510和处理模块520。

该输入模块510，用于将多张待检测秸秆图片和模板秸秆图片输入预先训练好的神经网络模型中，或者，将多张待检测秸秆图片和模板秸秆图片的特征输入预先训练好的神经网络模型中；

该处理模块520，用于根据所述神经网络模型输出的分类结果和相似度结果确定所述多张待检测秸秆图片中的异常秸秆图片，其中，所述分类结果用于表示所述待检测秸秆图片的类别，所述相似度结果用于表示所述待检测秸秆图片与所述模板秸秆图片的相似度。

应理解，该输入模块510、处理模块520还可以用于执行如前文实施例中任一种所述的检测异常秸秆图片的方法中的相应动作，以实现相应的功能。

本申请实施例还提供一种芯片，所述芯片包括处理器和通信接口，所述通信接口用于接收信号，并将所述信号传输至所述处理器，所述处理器处理所述信号，使得如上述实施例中所述的检测异常秸秆图片的方法被执行。

本申请实施例还提供一种计算机可读存储介质，其上存储有计算机程序或指令，所述计算机程序或指令被执行时使得计算机执行如前文中任一项所述的检测异常秸秆图片的方法。

本申请实施例还提供一种计算机程序产品，该计算机程序产品包括：计算机程序(也可以称为代码，或指令)，当该计算机程序被运行时，使得计算机执行如前文中任一项所述的检测异常秸秆图片的方法。

本申请实施例还提供了一种处理装置，包括处理器和接口；所述处理器用于执行上述任一方法实施例中的方法。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

本申请实施例中的方法，如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在计算机可读存储介质中，基于这样的理解，本申请的技术方案或技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。该存储介质至少包括：U盘、移动硬盘、只读存储器(read-only memory，ROM)、随机存取存储器(random access memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以权利要求的保护范围为准。

Claims

1.一种检测异常秸秆图片的方法，其特征在于，包括：

将多张待检测秸秆图片输入预先训练好的神经网络模型中；

根据所述神经网络模型输出的分类结果和相似度结果确定所述多张待检测秸秆图片中的异常秸秆图片，其中，所述分类结果用于表示所述待检测秸秆图片的类别，所述相似度结果用于表示所述待检测秸秆图片与所述模板秸秆图片的相似度。

2.根据权利要求1所述的方法，其特征在于，所述根据所述神经网络模型输出的分类结果和相似度结果确定所述多张待检测秸秆图片中的异常秸秆图片，包括：

当所述待检测秸秆图片与所述模板秸秆图片的相似度小于第一预设值时，确定所述待检测秸秆图片为异常秸秆图片。

3.根据权利要求2所述的方法，其特征在于，所述模板秸秆图片包括N种类型，所述当所述待检测秸秆图片与所述模板秸秆图片的相似度小于第一预设值时，确定所述待检测秸秆图片为异常秸秆图片，包括：

其中，N为大于或等于2的整数。

4.根据权利要求1所述的方法，其特征在于，所述根据所述神经网络模型输出的分类结果和相似度结果确定所述多张待检测秸秆图片中的异常秸秆图片，包括：

5.根据权利要求4所述的方法，其特征在于，所述模板秸秆图片包括N种类型，当所述待检测秸秆图片的分类结果与所述相似度结果不一致时，确定所述待检测秸秆图片为异常秸秆图片，包括：

当所述待检测秸秆图片与所述待检测秸秆图片的分类结果对应的类型的相似度不是N个相似度中的最大值时，确定所述待检测秸秆图片为异常秸秆图片；

其中，N为大于或等于2的整数。

6.根据权利要求1-5中任一项所述的方法，其特征在于，在所述将多张待检测秸秆图片输入训练好的神经网络模型中之前，所述方法还包括：

7.根据权利要求6所述的方法，其特征在于，所述将训练数据集和模板数据的特征输入神经网络模型中进行训练，包括：

8.根据权利要求1-7中任一项所述的方法，其特征在于，所述神经网络模型的损失函数为：

L_total＝α·L_cls+β·L_dis；

其中，

9.根据权利要求1-8中任一项所述的方法，其特征在于，所述模板秸秆图片包括的类型包括以下中的至少两种：干扰、无秸秆、个别图片有秸秆、少量秸秆连片、大量秸秆连片、秸秆全量。

10.一种检测异常秸秆图片的装置，其特征在于，包括：

输入模块，用于将多张待检测秸秆图片输入预先训练好的神经网络模型中；

处理模块，用于根据所述神经网络模型输出的分类结果和相似度结果确定所述多张待检测秸秆图片中的异常秸秆图片；其中，所述分类结果用于表示所述待检测秸秆图片的类别，所述相似度结果用于表示所述待检测秸秆图片与所述模板秸秆图片的相似度。

11.根据权利要求10所述的装置，其特征在于，所述处理模块具体用于：

12.根据权利要求11所述的装置，其特征在于，所述模板秸秆图片包括N种类型，所述处理模块具体用于：

当所述待检测秸秆图片与所述模板秸秆图片中的N种类型的N个相似度结果中的相似度小于第一预设值时，确定所述待检测秸秆图片为异常秸秆图片；

其中，N为大于或等于2的整数。

13.根据权利要求10所述的装置，其特征在于，所述处理模块具体用于：

14.根据权利要求13所述的装置，其特征在于，所述模板秸秆图片包括N种类型，所述处理模块具体用于：

其中，N为大于或等于2的整数。

15.根据权利要求10-14中任一项所述的装置，其特征在于，在所述输入模块将多张待检测秸秆图片输入训练好的神经网络模型中之前，所述装置还包括：

训练模块，用于将训练数据集和模板数据输入神经网络模型中进行训练，或者，将训练数据集和模板数据的特征输入神经网络模型中进行训练。

16.根据权利要求15所述的装置，其特征在于，所述训练模块具体用于：

将所述第二特征与第一特征进行自注意力学习后得到的第三特征与所述模板数据的第四特征进行交叉注意力学习。

17.根据权利要求10-15中任一项所述的装置，其特征在于，所述神经网络模型的损失函数为：

L_total＝α·L_cls+β·L_dis；

其中，

18.根据权利要求10-17中任一项所述的装置，其特征在于，所述模板秸秆图片包括的类型包括以下中的至少两种：干扰、无秸秆、个别图片有秸秆、少量秸秆连片、大量秸秆连片、秸秆全量。

19.一种芯片，其特征在于，所述芯片包括处理器和通信接口，所述通信接口用于接收信号，并将所述信号传输至所述处理器，所述处理器处理所述信号，使得如权利要求1-9中任一项所述的检测异常秸秆图片的方法被执行。

20.一种计算机可读存储介质，其上存储有计算机程序或指令，其特征在于，所述计算机程序或指令被执行时，使得如权利要求1-9中任一项所述的检测异常秸秆图片的方法被执行。