CN113313063A

CN113313063A - 麦穗检测方法、电子装置和存储介质

Info

Publication number: CN113313063A
Application number: CN202110684484.6A
Authority: CN
Inventors: 郭洪飞; 李嘉明; 何智慧; 任亚平; 韩世林; 朝宝
Original assignee: Jinan University
Current assignee: Jinan University; University of Jinan
Priority date: 2021-06-21
Filing date: 2021-06-21
Publication date: 2021-08-27

Abstract

本申请涉及一种麦穗检测方法、电子装置和存储介质，其中，该麦穗检测方法包括：获取待检测的第一小麦图像；分别利用第一注意力机制检测模型和第二注意力机制检测模型对其进行处理，得到第一标签数据和第二标签数据，其中，第一注意力机制检测模型是根据样本小麦图像和对应的标签数据训练得到的，第二注意力机制检测模型是根据第一标签图像和第一标签图像所对应的实测标签数据训练得到的，第一标签图像是根据样本小麦图像和第一标签数据生成的训练数据；基于预设融合算法对第一标签数据和第二标签数据进行融合处理，并确定麦穗检测结果。通过本申请，解决了相关技术中麦穗检测性能差、成本高的问题，实现了麦穗的准确检测。

Description

麦穗检测方法、电子装置和存储介质

技术领域

本申请涉及小麦检测技术领域，特别是涉及麦穗检测方法、电子装置和存储介质。

背景技术

小麦是世界贸易量最大的重要粮食作物,也是我国主要的粮食作物之一。育种对于确保小麦稳定产量尤为重要，当前普遍采用的小麦的育种方式是先选取培育品种在实验田进行小面积播种，待达到实验预期产量后，再进行大面积的推广种植。其中，小麦产量预测是小麦培育生产中的重要步骤，而麦穗检测可以为其提供重要的参考依据，因此如何准确的检测出小麦麦穗，也就成为了计算机自动预测小麦产量的关键。

现阶段小麦穗检测主要以传统的人工检测和传统深度学习检测为主。依靠传统的人工检测的方式效率不高，对于一片麦田往往需要几千张图片才能评估整个麦田的产量，不仅耗时、耗力，而且成本高。而采用传统的深度学习方法，例如一种麦穗计数方法及装置中，将麦田环境下拍摄到的图像输入至图像识别模型，输出图像的标签；又例如一种基于深度学习点监督思想的麦穗检测和计数方法中，小麦检测网络模型具体为首先通过下采样网络提取特征，然后通过上采样路径对提取的特征进行上采样的网络模型。直接使用传统的深度学习方法进行小麦检测时，其性能较差，同时由于采用的是有监督学习，即仅将预测小麦图像输入到模型中进行检测，没有对模型或预测图像进行处理来提升小麦检测性能，效果较差，且对于不同麦田或在扩充训练样本时需要重新标注不同小麦图像进行训练，其标注成本巨大。

目前针对相关技术中对麦穗检测性能差、成本高的问题，尚未提出有效的解决方案。

发明内容

本申请实施例提供了一种麦穗检测方法、电子装置和存储介质，以至少解决相关技术中麦穗检测性能差、成本高的问题。

第一方面，本申请实施例提供了一种麦穗检测方法，包括：获取待检测的第一小麦图像；分别利用第一注意力机制检测模型和第二注意力机制检测模型对所述第一小麦图像进行处理，得到所述第一小麦图像对应的第一标签数据和第二标签数据，其中，所述第一注意力机制检测模型是根据样本小麦图像和与所述样本小麦图像对应的标签数据训练得到的，所述第二注意力机制检测模型是根据第一标签图像和所述第一标签图像所对应的实测标签数据训练得到的，所述第一标签图像是根据所述样本小麦图像和所述第一标签数据生成的训练数据；基于预设融合算法对所述第一标签数据和第二标签数据进行融合处理，并根据融合处理后的标签数据确定麦穗检测结果，其中，所述标签数据包括：麦穗的预测框数据、预测框中图像为麦穗的预测概率。

在其中一些实施例中，获取待检测的第一小麦图像之后，所述检测方法包括：对所述小麦图像进行图像增强处理，生成多张增强的第一小麦图像，其中，所述图像增强处理至少包括图像平移、图像旋转和图像转置。

在其中一些实施例中，根据融合处理后的标签数据确定麦穗检测结果包括：将所述第一标签数据和所述第二标签数据所对应的所有预测框数据进行加权边框融合处理，得到融合后的标签数据；其中，所述预测框数据包括预测框的位置信息和置信度；将融合处理后的标签数据中，对应置信度大于预设阈值的标签数据作为麦穗检测结果。

在其中一些实施例中，基于预设融合算法对所述第一标签数据和第二标签数据进行融合处理，包括：将所述第一标签数据和第二标签数据中的所有预测框数据按置信度降序排列，得到第一预测表，并分别建立空的第一融合表和空的第二融合表；循环遍历所述第一预测表中的每组预测框数据，并在第一融合表中搜索与所述每组预测框数据相匹配的预测框数据，并获取搜索结果；根据所述搜索结果，将遍历到的预测框数据分别按预设的写入方式写入所述第二融合表所对应的预设位置，并根据所述第二融合表在所述预设位置处的多个所述预测框数据，更新处于所述第一融合表中与所述预设位置对应的位置处的预测框数据；对所述第一融合表中的预测框数据进行基于模型数的置信度调整，根据完成置信度调整的所述第一融合表中的所述预测框数据确定融合后的标签数据。

在其中一些实施例中，所述麦穗检测方法还包括：在未搜索到与遍历到的预测框数据相匹配的预测框数据的情况下，将所述遍历到的预测框数据分别写入所述第一融合表和所述第二融合表的末尾位置；在搜索到与遍历到的预测框数据相匹配的预测框数据的情况下，将所述遍历到的预测框数据写入至所述第二融合表的第一预设位置，对处于所述第一预设位置处的多组预测框数据的置信度进行加权，并根据加权后的置信度更新处于所述第一融合表中与所述第一预设位置对应的位置处的预测框数据，其中，所述第一预设位置包括，索引值与所述第一融合表中的第二预设位置相同的位置；所述第二预设位置包括与遍历到的预测框数据相匹配的预测框数据所在的位置。

在其中一些实施例中，分别利用第一注意力机制检测模型和第二注意力机制检测模型对所述第一小麦图像进行处理，得到所述第一小麦图像对应的第一标签数据和第二标签数据，包括：利用所述第一注意力机制检测模型从所述第一小麦图像中提取第一图像特征；对所述第一图像特征进行预测，生成所述第一标签数据，其中，所述第一标签数据包括第一预测框数据和第一预测概率；以及利用所述第二注意力机制检测模型从所述第一小麦图像中提取第二图像特征，生成所述第二标签数据，其中，所述第二标签数据包括第二预测框数据和第二预测概率。

在其中一些实施例中，所述麦穗检测方法还包括：利用检测模型从所述第一小麦图像中提取第一特征图，并从所述第一特征图中提取通道特征图，其中，所述检测模型包括所述第一注意力机制检测模型和所述第二注意力机制检测模型其中之一；将所述第一特征图和所述通道特征图相乘得到加强特征图；对所述通道特征图和加强特征图进行特征融合处理，得到所述图像特征，其中，所述特征融合处理包括池化处理、堆叠处理；所述池化处理包括广义均值池化。

在其中一些实施例中，所述第一注意力机制检测模型和第二注意力机制检测模型均采用K-Means聚类算法设置锚框。

第二方面，本申请实施例提供了一种电子装置，包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如第一方面所述的麦穗检测方法。

第三方面，本申请实施例提供了一种存储介质，其上存储有计算机程序，该程序被处理器执行时实现如上述第一方面所述的麦穗检测方法。

相比于相关技术，本申请实施例提供的麦穗检测方法、电子装置以及存储介质，通过获取待检测的第一小麦图像；分别利用第一注意力机制检测模型和第二注意力机制检测模型对所述第一小麦图像进行处理，得到所述第一小麦图像对应的第一标签数据和第二标签数据，其中，所述第一注意力机制检测模型是根据样本小麦图像和与所述样本小麦图像对应的标签数据训练得到的，所述第二注意力机制检测模型是根据第一标签图像和所述第一标签图像所对应的实测标签数据训练得到的，所述第一标签图像是根据所述样本小麦图像和所述第一标签数据生成的训练数据；基于预设融合算法对所述第一标签数据和第二标签数据进行融合处理，并根据融合处理后的标签数据确定麦穗检测结果，其中，所述标签数据包括：麦穗的预测框数据、预测框中图像为麦穗的预测概率。解决了相关技术中麦穗检测性能差、成本高的问题，实现了麦穗的准确检测，大大降低了麦穗的检测成本。

本申请的一个或多个实施例的细节在以下附图和描述中提出，以使本申请的其他特征、目的和优点更加简明易懂。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1是根据本申请实施例的麦穗检测方法的终端的硬件结构框图；

图2是根据本申请实施例的麦穗检测方法的流程图；

图3是根据本申请实施例的第一注意力机制检测模型和第二注意力机制检测模型的构建流程图；

图4是根据本申请优选实施例的麦穗检测方法的流程图；

图5是根据本申请实施例的麦穗检测装置的结构框图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行描述和说明。应当理解，此处所描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。基于本申请提供的实施例，本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例，都属于本申请保护的范围。此外，还可以理解的是，虽然这种开发过程中所作出的努力可能是复杂并且冗长的，然而对于与本申请公开的内容相关的本领域的普通技术人员而言，在本申请揭露的技术内容的基础上进行的一些设计，制造或者生产等变更只是常规的技术手段，不应当理解为本申请公开的内容不充分。

在本申请中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域普通技术人员显式地和隐式地理解的是，本申请所描述的实施例在不冲突的情况下，可以与其它实施例相结合。

除非另作定义，本申请所涉及的技术术语或者科学术语应当为本申请所属技术领域内具有一般技能的人士所理解的通常意义。本申请所涉及的“一”、“一个”、“一种”、“该”等类似词语并不表示数量限制，可表示单数或复数。本申请所涉及的术语“包括”、“包含”、“具有”以及它们任何变形，意图在于覆盖不排他的包含；例如包含了一系列步骤或模块(单元)的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元，而是可以还包括没有列出的步骤或单元，或可以还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。本申请所涉及的“连接”、“相连”、“耦接”等类似的词语并非限定于物理的或者机械的连接，而是可以包括电气的连接，不管是直接的还是间接的。本申请所涉及的“多个”是指大于或者等于两个。“和/或”描述关联对象的关联关系，表示可以存在三种关系，例如，“A和/或B”可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。本申请所涉及的术语“第一”、“第二”、“第三”等仅仅是区别类似的对象，不代表针对对象的特定排序。

本实施例提供的方法实施例可以在终端、计算机或者类似的运算装置中执行。以运行在终端上为例，图1是本申请实施例的麦穗检测方法的终端的硬件结构框图。如图1所示，终端10可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器104，可选地，上述终端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解，图1所示的结构仅为示意，其并不对上述终端的结构造成限定。例如，终端10还可包括比图1中所示更多或者更少的组件，或者具有与图1所示不同的配置。

存储器104可用于存储计算机程序，例如，应用软件的软件程序以及模块，如本发明实施例中的麦穗检测方法对应的计算机程序，处理器102通过运行存储在存储器104内的计算机程序，从而执行各种功能应用以及数据处理，即实现上述的方法。存储器104可包括高速随机存储器，还可包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器104可进一步包括相对于处理器102远程设置的存储器，这些远程存储器可以通过网络连接至终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

传输设备106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括终端10的通信供应商提供的无线网络。在一个实例中，传输设备106包括一个网络适配器(Network Interface Controller，简称为NIC)，其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中，传输设备106可以为射频(Radio Frequency，简称为RF)模块，其用于通过无线方式与互联网进行通讯。

本实施例提供了一种运行于上述终端的麦穗检测方法，图2是根据本申请实施例的麦穗检测方法的流程图，如图2所示，该流程包括如下步骤：

步骤S201，获取待检测的第一小麦图像。

在本实施例中，待检测的小麦图像其获取方式没有特殊限定，例如可以采用无人机拍摄方法获取整块麦田的小麦图像。

步骤S202，分别利用第一注意力机制检测模型和第二注意力机制检测模型对第一小麦图像进行处理，得到第一小麦图像对应的第一标签数据和第二标签数据，其中，第一注意力机制检测模型是根据样本小麦图像和与样本小麦图像对应的标签数据训练得到的，第二注意力机制检测模型是根据第一标签图像和第一标签图像所对应的实测标签数据训练得到的，第一标签图像是根据样本小麦图像和第一标签数据生成的训练数据。

在本实施例中，通过分别利用第一注意力机制检测模型和第二注意力机制检测模型对第一小麦图像进行处理，提升了检测的性能，并且，第一注意力机制检测模型是根据样本小麦图像和与样本小麦图像对应的标签数据训练得到的，第二注意力机制检测模型是根据第一标签图像和第一标签图像所对应的实测标签数据训练得到的，第一标签图像是根据样本小麦图像和第一标签数据生成的训练数据；相当于利用训练数据训练好第一注意力机制检测模型，并对样本小麦图像进行预测生成第一标签图像，将其扩充合并到训练集中再训练第二注意力机制检测模型，从而使得检测性能提升，检测准确率更高。

步骤S203，基于预设融合算法对第一标签数据和第二标签数据进行融合处理，并根据融合处理后的标签数据确定麦穗检测结果，其中，标签数据包括：麦穗的预测框数据、预测框中图像为麦穗的预测概率。

上述步骤S201至步骤S203，通过获取待检测的第一小麦图像；分别利用第一注意力机制检测模型和第二注意力机制检测模型对第一小麦图像进行处理，得到第一小麦图像对应的第一标签数据和第二标签数据，其中，第一注意力机制检测模型是根据样本小麦图像和与样本小麦图像对应的标签数据训练得到的，第二注意力机制检测模型是根据第一标签图像和第一标签图像所对应的实测标签数据训练得到的，第一标签图像是根据样本小麦图像和第一标签数据生成的训练数据；基于预设融合算法对第一标签数据和第二标签数据进行融合处理，并根据融合处理后的标签数据确定麦穗检测结果，其中，标签数据包括：麦穗的预测框数据、预测框中图像为麦穗的预测概率。解决了相关技术中麦穗检测性能差、成本高的问题，实现了麦穗的准确检测，大大降低了麦穗的检测成本。

需要说明的是，在本实施例中，嵌入注意力机制模块，输出的特征图权重具有全局感受野，能综合各个通道的信息，能增强特征图的表达能力，从而提高检测的性能；将半监督学习引入到麦穗检测中，结合两个改进的YOLOV5模型进行麦穗的检测，并利用加权盒融合算法，将两个模型的预测框进行融合来提高系统的性能。同时，采用测试时增强策略，对待检测的小麦图像进行数据增强，从而能获得更好地检测结果。

在其中一些实施例中，获取待检测的第一小麦图像之后，方法包括：

对小麦图像进行图像增强处理，生成多张增强的第一小麦图像，其中，图像增强处理至少包括图像平移、图像旋转和图像转置。

通过上述步骤中的对小麦图像进行像平移、图像旋转和图像转置等图像增强处理，生成多张增强的第一小麦图像，后续再分别对每一张增强的第一小麦图像进行处理，相当于扩充了输入的样本，从而提高了神经网络模型(注意力机制检测模型)的泛化能力，从而使得检测的准确率更高。

在其中一些实施例中，根据融合处理后的标签数据确定麦穗检测结果，包括如下步骤：

步骤1、将第一标签数据和第二标签数据所对应的所有预测框数据进行加权边框融合处理，得到融合后的标签数据；其中，预测框数据包括预测框的位置信息和置信度。

步骤2、将融合处理后的标签数据中，对应置信度大于预设阈值的标签数据作为麦穗检测结果。

通过上述步骤中的将第一标签数据和第二标签数据所对应的所有预测框数据进行加权边框融合处理，得到融合后的标签数据；将融合处理后的标签数据中，对应置信度大于预设阈值的标签数据作为麦穗检测结果，实现了检测准确率的提高；与传统的非极大值抑制算法和软非极大值抑制相比，加权边框融合算法使用所有预测边框的信息，而不是在许多空间重叠的预测盒中保留最大的IoU(重叠度)，以此对不同目标检测模型的预测进行融合来提高系统的性能。

在其中一些实施例中，基于预设融合算法对第一标签数据和第二标签数据进行融合处理，包括如下步骤：

步骤1、将第一标签数据和第二标签数据中的所有预测框数据按置信度降序排列，得到第一预测表，并分别建立空的第一融合表和空的第二融合表。

步骤2、循环遍历第一预测表中的每组预测框数据，并在第一融合表中搜索与每组预测框数据相匹配的预测框数据，并获取搜索结果。

步骤3、根据搜索结果，将遍历到的预测框数据分别按预设的写入方式写入第二融合表所对应的预设位置，并根据第二融合表在预设位置处的多个预测框数据，更新处于第一融合表中与预设位置对应的位置处的预测框数据。

步骤4、对第一融合表中的预测框数据进行基于模型数的置信度调整，根据完成置信度调整的第一融合表中的预测框数据确定融合后的标签数据。

通过上述步骤中的将第一标签数据和第二标签数据中的所有预测框数据按置信度降序排列，得到第一预测表，并分别建立空的第一融合表和空的第二融合表；循环遍历第一预测表中的每组预测框数据，并在第一融合表中搜索与每组预测框数据相匹配的预测框数据，并获取搜索结果；根据搜索结果，将遍历到的预测框数据分别按预设的写入方式写入第二融合表所对应的预设位置，并根据第二融合表在预设位置处的多个预测框数据，更新处于第一融合表中与预设位置对应的位置处的预测框数据；对第一融合表中的预测框数据进行基于模型数的置信度调整，根据完成置信度调整的第一融合表中的预测框数据确定融合后的标签数据，实现了第一标签数据和第二标签数据的加权边框融合，大大提高了模型检测的准确率。

在其中一些实施例中，麦穗检测方法还包括如下步骤：

步骤1、在未搜索到与遍历到的预测框数据相匹配的预测框数据的情况下，将遍历到的预测框数据分别写入第一融合表和第二融合表的末尾位置。

步骤2、在搜索到与遍历到的预测框数据相匹配的预测框数据的情况下，将遍历到的预测框数据写入至第二融合表的第一预设位置，对处于第一预设位置处的多组预测框数据的置信度进行加权，并根据加权后的置信度更新处于第一融合表中与第一预设位置对应的位置处的预测框数据，其中，第一预设位置包括，索引值与第一融合表中的第二预设位置相同的位置；第二预设位置包括与遍历到的预测框数据相匹配的预测框数据所在的位置。

通过上述步骤中的在未搜索到与遍历到的预测框数据相匹配的预测框数据的情况下，将遍历到的预测框数据分别写入第一融合表和第二融合表的末尾位置；在搜索到与遍历到的预测框数据相匹配的预测框数据的情况下，将遍历到的预测框数据写入至第二融合表的第一预设位置，对处于第一预设位置处的多组预测框数据的置信度进行加权，并根据加权后的置信度更新处于第一融合表中与第一预设位置对应的位置处的预测框数据，其中，第一预设位置包括，索引值与第一融合表中的第二预设位置相同的位置；第二预设位置包括与遍历到的预测框数据相匹配的预测框数据所在的位置；实现了第一标签数据和第二标签数据的加权边框融合，大大提高了模型检测的准确率。

在其中一些实施例中，分别利用第一注意力机制检测模型和第二注意力机制检测模型对第一小麦图像进行处理，得到第一小麦图像对应的第一标签数据和第二标签数据，包括：利用第一注意力机制检测模型从第一小麦图像中提取第一图像特征；对第一图像特征进行预测，生成第一标签数据，其中，第一标签数据包括第一预测框数据和第一预测概率；以及利用第二注意力机制检测模型从第一小麦图像中提取第二图像特征，生成第二标签数据，其中，第二标签数据包括第二预测框数据和第二预测概率。

通过上述步骤中的利用第一注意力机制检测模型从第一小麦图像中提取第一图像特征；对第一图像特征进行预测，生成第一标签数据，其中，第一标签数据包括第一预测框数据和第一预测概率；以及利用第二注意力机制检测模型从第一小麦图像中提取第二图像特征，生成第二标签数据，其中，第二标签数据包括第二预测框数据和第二预测概率；能综合各个通道的信息，由于注意力机制输出的图像特征权重具有全局感受野，增强了特征图的表达能力，从而能够提高检测的性能。

在其中一些实施例中，麦穗检测方法还包括如下步骤：

步骤1、利用检测模型从第一小麦图像中提取第一特征图，并从第一特征图中提取通道特征图，其中，检测模型包括第一注意力机制检测模型和第二注意力机制检测模型其中之一。

步骤2、将第一特征图和通道特征图相乘得到加强特征图。

步骤3、对通道特征图和加强特征图进行特征融合处理，得到图像特征，其中，特征融合处理包括池化处理、堆叠处理；池化处理包括广义均值池化。

通过上述步骤中的利用检测模型从第一小麦图像中提取第一特征图，并从第一特征图中提取通道特征图，其中，检测模型包括第一注意力机制检测模型和第二注意力机制检测模型其中之一；将第一特征图和通道特征图相乘得到加强特征图；对通道特征图和加强特征图进行特征融合处理，得到图像特征，其中，特征融合处理包括池化处理、堆叠处理；池化处理包括广义均值池化，实现了基于注意力机制的图像特征的提取，从而增强特征图的表达能力，提高检测的性能。

在其中一些实施例中，第一注意力机制检测模型和第二注意力机制检测模型均采用K-Means聚类算法设置锚框。

通过上述步骤中的采用K-Means聚类算法设置锚框，提升了本申请实施例的检测性能，由于传统的YOLOV5模型初始设置的边框过大，而麦穗属于小目标，通过采用K-Means聚类算法设置锚框(anchor box)对YOLOV5模型进行改进，进一步提升了本申请实施例的检测效率与准确率。

以下将介绍神经网络模型(注意力机制检测模型)的构建与训练方法，图3是根据本申请实施例的第一注意力机制检测模型和第二注意力机制检测模型的构建流程图，如图3所示，包括以下步骤：

步骤S301，获取若干带标签的小麦图像作为训练数据，采集若干未标注的小麦图像作为实测数据；训练数据可以使用公开数据集或自行标注数据集，实测数据的获取方式没有特殊限定，例如可以采用无人机拍摄方法获取整块麦田的小麦图像。

步骤S302，构建第一注意力机制检测模型和第二注意力机制检测模型，并采用K-Means聚类算法设置锚框。具体而言，读取训练数据，随机取出其中的W、H值作为初始化“种子点”，再使用K-Means算法进行迭代，计算得到锚框(anchor box)；注意力机制检测模型在YOLOV5的残差模块后嵌入了注意力机制模块，通过注意力机制加强特征图，将特征图输入注意力机制的网络学习重要特征通道，得到通道特征图，将通道特征图与原特征图相乘后得到加强后的特征图，分别对加强后的特征图与通道特征图进行广义均值池化并进行堆叠，得到堆叠输出；注意力机制模块可表示为C₁₂₈-C₆₄-C₁-C₁₂₈，C_k表示该卷积层中有k个卷积核，每个卷积核的大小为1×1；四个卷积层的步长均为1；每个卷积层后使用ELU作为激活函数；输出结果与加强后特征图采用的池化方式均为广义均值池化。

步骤S303，利用训练数据对第一注意力机制检测模型进行训练：

在训练过程中采用平移、旋转、转置等数据增强方法来提高模型的泛化能力；引入对Label Smoothing操作，防止模型在训练时过于自信地预测标签，改善泛化能力差的问题；采用CIoU作为损失函数，CIoU考虑了目标与边框之间的距离，重叠率、尺度以及惩罚项，使得目标框回归变得更加稳定，收敛精度更好，不会像IoU和GIoU一样出现训练过程中发散等问题，而惩罚因子把预测框长宽比拟合目标框的长宽比考虑进去。

CIoU计算公式如下，

其中，α为权重参数，b和b^gt分别为预测框的中心点和真实框的中心点，ρ表示欧几里得距离，v表示长宽比的一致性，ω^gt和h^gt被定义为目标框的长度和宽度，ω和h代表预测框的长度和宽度。

步骤S304，将步骤S301所采集的实测数据输入训练好的第一注意力机制检测模型中进行预测，得到带实测标签数据的第一标签图像：

首先选取每一个实测数据样本中最大预测概率的类，其次，对每一个实测数据样本进行筛选，当样本的最大预测概率大于预设阈值时，为该实测数据样本添加标签(也称为伪标签，伪标签指的是利用在已标注数据所训练的模型在未标注的数据上进行预测)，反之则不添加标签。

将上述添加了标签的实测数据图像称为第一标签图像，其标签数据为实测标签数据。

步骤S305，将第一标签图像与训练数据合并为新的训练集，并利用该新的训练集对第二注意力机制检测模型进行半监督学习方式的训练。第二注意力机制检测模型的代价函数如下：

Loss＝Loss(训练数据)+αlpha*Loss(伪标签数据)

代价函数的前部分是训练数据的代价，后部分为伪标签数据(实测标签数据)的代价，由于伪标签数据是由第一注意力机制检测模型预测得到的，相对于训练数据而言，其结果不完全可靠，因此需要设置参数αlpha对伪标签数据的损失函数进行调整，降低其在模型训练的权重。半监督学习是模式识别和机器学习领域研究的重点问题，是监督学习与无监督学习相结合的一种学习方法。半监督学习使用大量的未标记数据，以及同时使用标记数据，来进行模式识别工作；因而减少了大量小麦图像的标注，大大降低了成本。

下面通过优选实施例对本申请实施例进行描述和说明。

图4是根据本申请优选实施例的麦穗检测方法的流程图。如图4所示，该麦穗检测方法包括如下步骤：

步骤S401，获取若干带标签的小麦图像作为训练数据，拍摄某麦田的小麦图像作为实测数据。

步骤S402，对训练数据和实测数据中的小麦图像进行图像增强处理。

步骤S403，构建第一注意力机制检测模型和第二注意力机制检测模型。

步骤S404，利用经过图像增强处理的训练数据对第一注意力机制检测模型进行训练。

步骤S405，将经过图像增强处理的实测数据输入训练好的第一注意力机制检测模型中进行预测，得到带实测标签数据的第一标签图像。

步骤S406，将第一标签图像与经过增强处理的训练数据合并为新的训练集，并利用该新的训练集对第二注意力机制检测模型进行半监督学习方式的训练。

步骤S407，获取待检测的第一小麦图像，并对其进行图像增强处理，得到多张增强的第一小麦图像。

步骤S408，将多张增强的第一小麦图像分别输入第一注意力机制检测模型和第二注意力机制检测模型进行处理，得到对应的第一标签数据和第二标签数据。

步骤S409，基于预设融合算法对第一标签数据和第二标签数据进行融合处理，并根据融合处理后的标签数据确定麦穗检测结果，包括如下步骤：

步骤1、将第一标签数据和第二标签数据中的所有预测框数据按置信度C降序排列，得到第一预测表B。

步骤2、建立用于融合的空表：第一融合表F第二融合表L。

步骤3、循环遍历第一预测表B中的所有预测框数据，并在第一融合表F中搜索与预测框数据相匹配的预测框数据，如果未搜索到当前遍历的预测框数据，则将该当前遍历的预测框数据分别添加至第一融合表F和第二融合表L的末尾；否则，将该当前遍历的预测框数据添加至第二融合表L中对应位置，加入的位置是box在F中匹配框的index；L中每个位置可能有多个预测框数据，需要根据这多个预测框数据更新对应F[index]的值。F[index]更新方法如下，x，y对应的是预测框的坐标值，对坐标值根据置信度进行加权求和：

步骤4、遍历完成后，由于有些预测框仅由单个模型预测，这类预测框数据可能不够准确，则需要对F中的预测框数据再进行一次置信度的调整，调整公式如下，其中N为融合的模型数(N＝2)

需要说明的是，在上述流程中或者附图的流程图中示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。例如，步骤S401与步骤S403、步骤S402与步骤S403、步骤S406与步骤S407。

本实施例还提供了一种麦穗检测装置，该装置用于实现上述实施例及优选实施方式，已经进行过说明的不再赘述。如以下所使用的，术语“模块”、“单元”、“子单元”等可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现，但是硬件，或者软件和硬件的组合的实现也是可能并被构想的。

图5是根据本申请实施例的麦穗检测装置的结构框图，如图5所示，该装置包括：获取模块51、预测模块52、融合模块53。

获取模块51，用于获取待检测的第一小麦图像。

预测模块52，与获取模块51耦合连接，用于分别利用第一注意力机制检测模型和第二注意力机制检测模型对第一小麦图像进行处理，得到第一小麦图像对应的第一标签数据和第二标签数据，其中，第一注意力机制检测模型是根据样本小麦图像和与样本小麦图像对应的标签数据训练得到的，第二注意力机制检测模型是根据第一标签图像和第一标签图像所对应的实测标签数据训练得到的，第一标签图像是根据样本小麦图像和第一标签数据生成的训练数据。

融合模块53，与预测模块52耦合连接，用于基于预设融合算法对第一标签数据和第二标签数据进行融合处理，并根据融合处理后的标签数据确定麦穗检测结果，其中，标签数据包括：麦穗的预测框数据、预测框中图像为麦穗的预测概率。

在其中一些实施例中，获取模块51用于对小麦图像进行图像增强处理，生成多张增强的第一小麦图像，其中，图像增强处理至少包括图像平移、图像旋转和图像转置。

在其中一些实施例中，融合模块53用于将第一标签数据和第二标签数据所对应的所有预测框数据进行加权边框融合处理，得到融合后的标签数据；其中，预测框数据包括预测框的位置信息和置信度；将融合处理后的标签数据中，对应置信度大于预设阈值的标签数据作为麦穗检测结果。

在其中一些实施例中，融合模块53用于将第一标签数据和第二标签数据中的所有预测框数据按置信度降序排列，得到第一预测表，并建立空的第一融合表和第二融合表；循环遍历第一预测表中的每组预测框数据，并在第一融合表中搜索与预测框数据相匹配的预测框数据，当未搜索到当前遍历的预测框数据，则将该当前遍历的预测框数据分别添加至第一融合表和第二融合表的末尾；否则，将该当前遍历的预测框数据添加至第二融合表中对应位置，同时结合第二融合表中该位置所对应的多组预测框数据，加权求和更新第一融合表中所对应预测框数据的置信度；遍历完成后，对第一融合表中的预测框数据进行基于模型数的置信度调整，由调整后的第一融合表中的预测框数据得到融合后的标签数据。

在其中一些实施例中，预测模块52用于利用第一注意力机制检测模型从第一小麦图像中提取第一图像特征；对第一图像特征进行预测，生成第一标签数据，其中，第一标签数据包括第一预测框数据和第一预测概率；以及利用第二注意力机制检测模型从第一小麦图像中提取第二图像特征，生成第二标签数据，其中，第二标签数据包括第二预测框数据和第二预测概率。

在其中一些实施例中，预测模块52用于利用检测模型从第一小麦图像中提取第一特征图，并从第一特征图中提取通道特征图，其中，检测模型包括第一注意力机制检测模型和第二注意力机制检测模型其中之一；将第一特征图和通道特征图相乘得到加强特征图；对通道特征图和加强特征图进行特征融合处理，得到图像特征，其中，特征融合处理包括池化处理、堆叠处理；池化处理包括广义均值池化。

需要说明的是，上述各个模块可以是功能模块也可以是程序模块，既可以通过软件来实现，也可以通过硬件来实现。对于通过硬件来实现的模块而言，上述各个模块可以位于同一处理器中；或者上述各个模块还可以按照任意组合的形式分别位于不同的处理器中。

本实施例还提供了一种电子装置，包括存储器和处理器，该存储器中存储有计算机程序，该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。

可选地，上述电子装置还可以包括传输设备以及输入输出设备，其中，该传输设备和上述处理器连接，该输入输出设备和上述处理器连接。

可选地，在本实施例中，上述处理器可以被设置为通过计算机程序执行以下步骤：

S1，获取待检测的第一小麦图像。

S2，分别利用第一注意力机制检测模型和第二注意力机制检测模型对第一小麦图像进行处理，得到第一小麦图像对应的第一标签数据和第二标签数据，其中，第一注意力机制检测模型是根据样本小麦图像和与样本小麦图像对应的标签数据训练得到的，第二注意力机制检测模型是根据第一标签图像和第一标签图像所对应的实测标签数据训练得到的，第一标签图像是根据样本小麦图像和第一标签数据生成的训练数据。

S3，基于预设融合算法对第一标签数据和第二标签数据进行融合处理，并根据融合处理后的标签数据确定麦穗检测结果，其中，标签数据包括：麦穗的预测框数据、预测框中图像为麦穗的预测概率。

需要说明的是，本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例，本实施例在此不再赘述。

另外，结合上述实施例中的麦穗检测方法，本申请实施例可提供一种存储介质来实现。该存储介质上存储有计算机程序；该计算机程序被处理器执行时实现上述实施例中的任意一种麦穗检测方法。

本领域的技术人员应该明白，以上所述实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

1.一种麦穗检测方法，其特征在于，所述检测方法包括：

获取待检测的第一小麦图像；

分别利用第一注意力机制检测模型和第二注意力机制检测模型对所述第一小麦图像进行处理，得到所述第一小麦图像对应的第一标签数据和第二标签数据，其中，所述第一注意力机制检测模型是根据样本小麦图像和与所述样本小麦图像对应的标签数据训练得到的，所述第二注意力机制检测模型是根据第一标签图像和所述第一标签图像所对应的实测标签数据训练得到的，所述第一标签图像是根据所述样本小麦图像和所述第一标签数据生成的训练数据；

基于预设融合算法对所述第一标签数据和第二标签数据进行融合处理，并根据融合处理后的标签数据确定麦穗检测结果，其中，所述标签数据包括：麦穗的预测框数据、预测框中图像为麦穗的预测概率。

2.根据权利要求1所述的麦穗检测方法，其特征在于，获取待检测的第一小麦图像之后，所述方法包括：对所述小麦图像进行图像增强处理，生成多张增强的第一小麦图像，其中，所述图像增强处理至少包括图像平移、图像旋转和图像转置。

3.根据权利要求1所述的麦穗检测方法，其特征在于，根据融合处理后的标签数据确定麦穗检测结果，包括：

将所述第一标签数据和所述第二标签数据所对应的所有预测框数据进行加权边框融合处理，得到融合后的标签数据；其中，所述预测框数据包括预测框的位置信息和置信度；

将融合处理后的标签数据中，对应置信度大于预设阈值的标签数据作为麦穗检测结果。

4.根据权利要求1所述的麦穗检测方法，其特征在于，基于预设融合算法对所述第一标签数据和第二标签数据进行融合处理，包括：

将所述第一标签数据和第二标签数据中的所有预测框数据按置信度降序排列，得到第一预测表，并分别建立空的第一融合表和空的第二融合表；

循环遍历所述第一预测表中的每组预测框数据，并在第一融合表中搜索与所述每组预测框数据相匹配的预测框数据，并获取搜索结果；

根据所述搜索结果，将遍历到的预测框数据分别按预设的写入方式写入所述第二融合表所对应的预设位置，并根据所述第二融合表在所述预设位置处的多个所述预测框数据，更新处于所述第一融合表中与所述预设位置对应的位置处的预测框数据；

对所述第一融合表中的预测框数据进行基于模型数的置信度调整，根据完成置信度调整的所述第一融合表中的所述预测框数据确定融合后的标签数据。

5.根据权利要求4所述的麦穗检测方法，其特征在于，所述方法还包括：

在未搜索到与遍历到的预测框数据相匹配的预测框数据的情况下，将所述遍历到的预测框数据分别写入所述第一融合表和所述第二融合表的末尾位置；

在搜索到与遍历到的预测框数据相匹配的预测框数据的情况下，将所述遍历到的预测框数据写入至所述第二融合表的第一预设位置，对处于所述第一预设位置处的多组预测框数据的置信度进行加权，并根据加权后的置信度更新处于所述第一融合表中与所述第一预设位置对应的位置处的预测框数据，其中，所述第一预设位置包括，索引值与所述第一融合表中的第二预设位置相同的位置；所述第二预设位置包括与遍历到的预测框数据相匹配的预测框数据所在的位置。

6.根据权利要求1所述的麦穗检测方法，其特征在于，分别利用第一注意力机制检测模型和第二注意力机制检测模型对所述第一小麦图像进行处理，得到所述第一小麦图像对应的第一标签数据和第二标签数据，包括：

利用所述第一注意力机制检测模型从所述第一小麦图像中提取第一图像特征；对所述第一图像特征进行预测，生成所述第一标签数据，其中，所述第一标签数据包括第一预测框数据和第一预测概率；以及利用所述第二注意力机制检测模型从所述第一小麦图像中提取第二图像特征，生成所述第二标签数据，其中，所述第二标签数据包括第二预测框数据和第二预测概率。

7.根据权利要求6所述的麦穗检测方法，其特征在于，所述方法还包括：

利用检测模型从所述第一小麦图像中提取第一特征图，并从所述第一特征图中提取通道特征图，其中，所述检测模型包括所述第一注意力机制检测模型和所述第二注意力机制检测模型其中之一；

将所述第一特征图和所述通道特征图相乘得到加强特征图；

对所述通道特征图和加强特征图进行特征融合处理，得到所述图像特征，其中，所述特征融合处理包括池化处理、堆叠处理；所述池化处理包括广义均值池化。

8.根据权利要求1所述的麦穗检测方法，其特征在于，所述第一注意力机制检测模型和第二注意力机制检测模型均采用K-Means聚类算法设置锚框。

9.一种电子装置，包括存储器和处理器，其特征在于，所述存储器中存储有计算机程序，所述处理器被设置为运行所述计算机程序以执行权利要求1至8中任一项所述的麦穗检测方法。

10.一种存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至8中任一项所述的麦穗检测方法。