CN117315237B

CN117315237B - 目标检测模型的确定方法及装置、存储介质

Info

Publication number: CN117315237B
Application number: CN202311570763.5A
Authority: CN
Inventors: 林亦宁; 杨德城
Original assignee: Shanghai Supremind Intelligent Technology Co Ltd
Current assignee: Shanghai Supremind Intelligent Technology Co Ltd
Priority date: 2023-11-23
Filing date: 2023-11-23
Publication date: 2024-02-27
Anticipated expiration: 2043-11-23
Also published as: CN117315237A

Abstract

本发明公开了一种目标检测模型的确定方法及装置、存储介质，其中，上述方法包括：获取训练样本集合，其中，训练样本集合中的每个训练样本包括：样本图片、样本图片的多个标注框和每个标注框对应的标签；使用训练样本集合对待训练的检测模型进行训练，直到待训练的检测模型对应的目标损失函数的取值满足预设的收敛条件，其中，待训练的检测模型包括：用于对样本图片进行目标检测的目标网络和用于分别对目标网络检测出的预测框集合进行标签分配预测的N个标签分配器；N为大于1的正整数，目标损失函数的取值根据N个标签分配器产生的N组损失共同确定；将结束训练时的待训练的检测模型确定为目标检测模型。

Description

目标检测模型的确定方法及装置、存储介质

技术领域

本发明涉及图像识别领域，具体而言，涉及一种目标检测模型的确定方法及装置、存储介质。

背景技术

近年来，深度学习发展迅猛，被广泛应用到计算机视觉、语音识别以及自然语言处理上。随着数据规模积累的足够大，场景越加复杂，对模型的精度也有越来越高的要求。目标检测作为计算机视觉应用的主要探索之一，其模型和训练方法也得到一次次的改进和研发。目标检测训练方案中标签分配策略（label assigner）对训练精度的影响非常大，一个好的标签分配策略不仅能大幅度提升模型精度，还可以提升训练速度，加速模型收敛。而目前主流的标签分配策略有基于侯选框（bbox）和真实框(gt_box)的交并比来确定的，有基于bbox的中心点是否落在gt_box内来确定的，有通过统计学方案确定的如atss_assigner，也有基于模型训练不断优化的如simota_assigner。但目前的研究中，均集中在如何改进label assigner的策略来提升检测模型的精度，改进效果并不显著。

针对相关技术，现有检测模型对图片进行目标检测的准确度较低的问题，目前尚未提出有效的解决方案。

因此，有必要对相关技术予以改良以克服相关技术中的所述缺陷。

发明内容

本发明实施例提供了一种目标检测模型的确定方法及装置、存储介质，以至少解决现有检测模型对图片进行目标检测的准确度较低的问题。

根据本发明实施例的一方面，提供一种目标检测模型的确定方法，包括：获取训练样本集合，其中，所述训练样本集合中的每个训练样本包括：样本图片、所述样本图片的多个标注框和每个标注框对应的标签；使用所述训练样本集合对待训练的检测模型进行训练，直到所述待训练的检测模型对应的目标损失函数的取值满足预设的收敛条件，其中，所述待训练的检测模型包括：用于对所述样本图片进行目标检测的目标网络和用于分别对所述目标网络检测出的预测框集合进行标签分配预测的N个标签分配器；N为大于1的正整数，所述目标损失函数的取值根据所述N个标签分配器产生的N组损失共同确定；将结束训练时的待训练的检测模型确定为目标检测模型。

在一个示例性的实施例中，使用所述训练样本集合对待训练的检测模型进行训练，包括：通过以下步骤执行第i轮训练，其中，i为大于或等于1的正整数，经过第0轮训练的检测模型是未经过训练的所述待训练的检测模型：获取第i-1轮训练得到的目标网络对样本图片进行检测后得到的预测框集合；使用所述第i-1轮训练得到的N个标签分配器分别对所述第i轮检测出的预测框集合进行标签分配，得到N个标签分配预测结果，其中，每个标签分配预测结果包括所述预测框集合中每个预测框的标签；根据所述N个标签分配预测结果确定所述第i轮训练的目标分类损失函数的取值以及目标定位损失函数的取值，其中，所述目标损失函数包括所述目标分类损失函数和所述目标定位损失函数；所述N个标签分配器在得到所述N个标签分配预测结果的过程中产生了所述N组损失；在所述第i轮训练的所述目标定位损失函数的取值和所述目标分类损失函数的取值均满足对应的收敛条件的情况下，结束训练；在所述第i轮训练的所述目标定位损失函数的取值不满足对应的收敛条件、或者所述目标分类损失函数的取值不满足对应的收敛条件的情况下，调整经过第i-1轮训练得到的检测模型中的参数，得到经过所述第i轮训练得到的检测模型。

在一个示例性的实施例中，根据所述N个标签分配预测结果确定所述第i轮训练的目标分类损失函数的取值，包括：根据N个标签分配预测结果确定N个矩阵，其中，所述N个矩阵中的第j个矩阵用于表示第j个标签分配器产生的标签分配预测损失，所述第j个矩阵中的元素值包括第j个标签分配器为所述预测框集合中每个预测框进行标签分配预测产生的分配预测损失；根据所述N个矩阵确定所述第i轮训练的目标分类损失函数的值。

在一个示例性的实施例中，根据N个标签分配预测结果确定N个矩阵，包括：通过以下方式得到N个矩阵中的第j个矩阵，以得到所述N个矩阵：将N个标签分配预测结果中的第j个标签分配预测结果和与所述第j个标签分配预测结果对应的标签分配结果输入至分类损失函数，得到第j个矩阵；其中，所述第j个标签分配预测结果对应的标签分配结果是根据所述第j个标签分配器的标签分配策略、所述样本图片的多个标注框和每个标注框对应的标签对所述第i轮检测出的预测框集合进行标签分配的结果。

在一个示例性的实施例中，根据所述N个矩阵确定所述第i轮训练的目标分类损失函数的值，包括：从所述N个矩阵中确定目标矩阵；根据所述N个矩阵中除所述目标矩阵以外的N-1个矩阵确定目标权重矩阵，其中，目标权重矩阵中的元素值包括所述目标矩阵中每个预测框对应的分配预测损失的权重值；将所述目标权重矩阵和所述目标矩阵进行矩阵对位相乘运算，得到第i轮训练的目标分类损失函数的取值。

在一个示例性的实施例中，根据所述N个矩阵中除所述目标矩阵以外的N-1个矩阵确定目标权重矩阵，包括：将所述N-1个矩阵进行加法运算，得到第一中间矩阵；将所述第一中间矩阵进行归一化处理，得到第二中间矩阵；将预设矩阵与所述第二中间矩阵进行减法运算，得到目标权重矩阵，其中，所述预设矩阵与所述第二中间矩阵具有相同的行列数、且所述预设矩阵的每个元素值等于1。

在一个示例性的实施例中，根据所述N个标签分配预测结果确定所述第i轮训练的目标定位损失函数的取值，包括：根据所述N个标签分配预测结果确定N个标签分配器产生的N个定位损失；根据所述N个定位损失确定所述第i轮训练的目标定位损失函数的取值。

在一个示例性的实施例中，根据N个标签分配预测结果确定N个标签分配器产生的N个定位损失，包括：通过以下方式得到N个定位损失中的第j个定位损失，以得到N个定位损失：根据所述N个标签分配预测结果中的第j个标签分配预测结果确定第j组预测框，其中，所述第j组预测框中的每个预测框对应的标签不为背景标签；使用定位损失函数确定所述第j组预测框对应的位置信息与所述多个标注框对应的位置信息之间的定位损失，得到第j个定位损失。

在一个示例性的实施例中，将结束训练时的待训练的检测模型确定为目标检测模型之后，所述方法还包括：获取待进行目标检测的目标图片；通过所述目标检测模型对所述目标图片进行目标检测，以在所述目标图片中确定多个检测框以及所述多个检测框中每个检测框的标签。

根据本发明实施例的另一方面，还提供了一种目标检测模型的确定装置，包括：获取模块，用于获取训练样本集合，其中，所述训练样本集合中的每个训练样本包括：样本图片、所述样本图片的多个标注框和每个标注框对应的标签；训练模块，用于使用所述训练样本集合对待训练的检测模型进行训练，直到所述待训练的检测模型对应的目标损失函数的取值满足预设的收敛条件，其中，所述待训练的检测模型包括：用于对所述样本图片进行目标检测的目标网络和用于分别对所述目标网络检测出的预测框集合进行标签分配预测的N个标签分配器；N为大于1的正整数，所述目标损失函数的取值根据所述N个标签分配器产生的N组损失共同确定；确定模块，用于将结束训练时的待训练的检测模型确定为目标检测模型。

根据本发明实施例的又一方面，还提供了一种计算机可读的存储介质，该计算机可读的存储介质中存储有计算机程序，其中，该计算机程序被设置为运行时执行上述目标检测模型的确定方法。

根据本发明实施例的又一方面，还提供了一种电子装置，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其中，上述处理器通过计算机程序执行上述目标检测模型的确定方法。

本发明，由于在待训练的检测模型中设置了多个标签分配器，进而可以在训练的过程中同时兼顾各种标签分配器的优点来提升检测模型的性能，提高检测模型对图片进行目标检测的准确度，进而解决了现有检测模型对图片进行目标检测的准确度较低的问题。此外，在待训练的检测模型中设置多个标签分配器还可以提高模型的收敛速度，进而减少了对模型进行训练的装置的相关资源（例如：内存资源，CPU资源等等）的占用时间。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本发明的一部分，本发明的示例性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1是本发明实施例的目标检测模型的确定方法的计算机终端的硬件结构框图；

图2是根据本发明实施例的目标检测模型的确定方法的流程图；

图3是根据本发明实施例的目标检测模型的确定方法的整体框架图；

图4是根据本发明实施例的目标检测模型的确定装置的结构框图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分的实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。

需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

本发明实施例中所提供的方法实施例可以在计算机终端或者类似的运算装置中执行。以运行在计算机终端上为例，图1是本发明实施例的目标检测模型的确定方法的计算机终端的硬件结构框图。如图1所示，计算机终端可以包括一个或多个（图1中仅示出一个）处理器102（处理器102可以包括但不限于微处理器（Microprocessor Unit，简称是MPU）或可编程逻辑器件（Programmable logic device，简称是PLD））和用于存储数据的存储器104，在一个示例性实施例中，上述计算机终端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解，图1所示的结构仅为示意，其并不对上述计算机终端的结构造成限定。例如，计算机终端还可包括比图1中所示更多或者更少的组件，或者具有与图1所示等同功能或比图1所示功能更多的不同的配置。

存储器104可用于存储计算机程序，例如，应用软件的软件程序以及模块，如本发明实施例中的目标检测模型的确定方法对应的计算机程序，处理器102通过运行存储在存储器104内的计算机程序，从而执行各种功能应用以及数据处理，即实现上述的方法。存储器104可包括高速随机存储器，还可包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器104可进一步包括相对于处理器102远程设置的存储器，这些远程存储器可以通过网络连接至计算机终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

传输设备106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端的通信供应商提供的无线网络。在一个实例中，传输设备106包括一个网络适配器（Network Interface Controller，简称为NIC），其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中，传输设备106可以为射频（Radio Frequency，简称为RF）模块，其用于通过无线方式与互联网进行通讯。

具体的，在本实施例中提供了一种目标检测模型的确定方法，包括但不限于应用在上述计算机终端，图2是根据本发明实施例的目标检测模型的确定方法的流程图，该流程包括如下步骤：

步骤S202：获取训练样本集合，其中，所述训练样本集合中的每个训练样本包括：样本图片、所述样本图片的多个标注框和每个标注框对应的标签；

作为一种可选的示例，样本图片可以为具有多个动物的图片，多个标注框中的每个标注框分别对应一个动物，每个标注框对应的标签为标注框对应的动物的类别。需要说明的是，样本图片的标注框即为样本图片的真实框（gt_box）。

步骤S204：使用所述训练样本集合对待训练的检测模型进行训练，直到所述待训练的检测模型对应的目标损失函数的取值满足预设的收敛条件，其中，所述待训练的检测模型包括：用于对所述样本图片进行目标检测的目标网络和用于分别对所述目标网络检测出的预测框集合进行标签分配预测的N个标签分配器；N为大于1的正整数，所述目标损失函数的取值根据所述N个标签分配器产生的N组损失共同确定；

需要说明的是，在待训练的检测模型对应的目标损失函数的取值不满足预设的收敛条件的情况下，待训练的检测模型中的模型参数被调整。

需要说明的是，由于目标网络直接预测出的结果有大量的冗余信息，所以预测框集合中预测框bbox的数量会很多且大大多于标注框的数量，为了能将真实标签信息和模型预测的信息进行一一对应并实现损失计算，需要先将预测框集合经过label assigner处理，即使用标签分配器对预测框集合进行标签分配预测。

标签分配器label assigner会将预测框集合中大量的预测框bbox和真实框gt_box进行一一匹配，最终确定预测框中那部分bbox属于对应的gt_box，并输出对应的正样本编号（pos_inds），负样本编号（neg_inds）和标签分配详细结果（res_label_assinger)。进而结合label assigner的分配结果（即下述标签分配预测结果）可以实现以下对分类信息（即下述标签分配预测损失）和定位信息（即下述定位损失）的损失计算。

需要说明的是，N个标签分配器中的每个标签分配器会使用对应的标签分配策略对目标网络检测出的预测框集合进行标签分配预测。N个标签分配器中每个标签分配器对应的标签分配策略不同。

需要说明的是，由于标签分配器是对预测框集合中每个预测框进行标签的预测，即预测的标签和真实的标签之间可能是存在差异的，进而标签分配器在对预测框集合进行标签分配预测的过程中会产生损失。

步骤S206：将结束训练时的待训练的检测模型确定为目标检测模型。

在一个示例性的实施例中，在上述步骤S206之后，所述方法还包括：获取待进行目标检测的目标图片；通过所述目标检测模型对所述目标图片进行目标检测，以在所述目标图片中确定多个检测框以及所述多个检测框中每个检测框的标签。

例如，假设目标图片中具有多个动物，则可以使用目标检测模型对目标图片进行目标检测，在目标图片中通过多个检测框将目标图片中的多个动物框选出来，并确定检测框中动物的类型。

上述步骤S202-S206，由于在待训练的检测模型中设置了多个标签分配器，进而可以在训练的过程中同时兼顾各种标签分配器的优点来提升检测模型的性能，提高检测模型对图片进行目标检测的准确度，进而解决了现有检测模型对图片进行目标检测的准确度较低的问题。此外，在待训练的检测模型中设置多个标签分配器还可以提高模型的收敛速度，进而减少了对模型进行训练的装置的相关资源（例如：内存资源，CPU资源等等）的占用时间。

在一个示例性的实施例中，使用所述训练样本集合对待训练的检测模型进行训练，包括：通过以下步骤S11-S14执行第i轮训练，其中，i为大于或等于1的正整数，经过第0轮训练的检测模型是未经过训练的所述待训练的检测模型：

步骤S11：获取第i-1轮训练得到的目标网络对样本图片进行检测后得到的预测框集合；

需要说明的是，上述步骤S11之前，需要从训练样本集合中获取第i轮使用的训练样本，其中，所述第i轮使用的训练样本包括第i轮使用的样本图片、所述样本图片的多个标注框和每个标注框对应的标签；进而将第i轮使用的样本图片输入至第i-1轮训练得到的目标网络，得到第i轮检测出的预测框集合。

步骤S12：使用所述第i-1轮训练得到的N个标签分配器分别对所述第i轮检测出的预测框集合进行标签分配，得到N个标签分配预测结果，其中，每个标签分配预测结果包括所述预测框集合中每个预测框的标签；

需要说明的是，N个标签分配器中的每个标签分配器会使用对应的标签分配策略对预测框集合中的每个预测框进行标签分配预测，为每个预测框预测对应的标签，得到标签分配预测结果。

步骤S13：根据所述N个标签分配预测结果确定所述第i轮训练的目标分类损失函数的取值以及目标定位损失函数的取值，其中，所述目标损失函数包括所述目标分类损失函数和所述目标定位损失函数；所述N个标签分配器在得到所述N个标签分配预测结果的过程中产生了所述N组损失；

需要说明的是，N组损失中的每组损失包括标签分配预测损失和定位损失。

需要说明的是，在标签分配器对预测框集合中每个预测框进行标签分配预测以后，就可以确定样本图像中的某一个物体对应的预测框，由于某一个物体对应的预测框和某一个物体对应的真实框之间存在位置差异，进而标签分配器在进行标签分配预测以后会产生定位损失。

步骤S14：在所述第i轮训练的所述目标定位损失函数的取值和所述目标分类损失函数的取值均满足对应的收敛条件的情况下，结束训练；在所述第i轮训练的所述目标定位损失函数的取值不满足对应的收敛条件、或者所述目标分类损失函数的取值不满足对应的收敛条件的情况下，调整经过第i-1轮训练得到的检测模型中的参数，得到经过所述第i轮训练得到的检测模型。

在一个示例性的实施例中，上述步骤S13中，根据所述N个标签分配预测结果确定所述第i轮训练的目标分类损失函数的取值，可以通过以下步骤S21-S22实现：

步骤S21：根据N个标签分配预测结果确定N个矩阵，其中，所述N个矩阵中的第j个矩阵用于表示第j个标签分配器产生的标签分配预测损失，所述第j个矩阵中的元素值包括第j个标签分配器为所述预测框集合中每个预测框进行标签分配预测产生的分配预测损失；

在一个示例性的实施例中，上述步骤S21可以通过以下方式实现：通过以下方式得到N个矩阵中的第j个矩阵，以得到所述N个矩阵：将N个标签分配预测结果中的第j个标签分配预测结果和与所述第j个标签分配预测结果对应的标签分配结果输入至分类损失函数，得到第j个矩阵；

需要说明的是，j为大于或等于1，小于或等于N的正整数，所述第j个标签分配预测结果对应的标签分配结果是根据所述第j个标签分配器的标签分配策略、所述样本图片的多个标注框和每个标注框对应的标签对所述第i轮检测出的预测框集合进行标签分配的结果。标签分配结果中包括预测框集合中每个预测框的真实标签，而标签分配预测结果中包括标签分配器根据对应的标签分配策略预测出的每个预测框的预测标签。

需要说明的是，第j个矩阵可以通过确定，其中，/>表示分类损失函数，/>分别表示标签分配预测结果和标签分配结果，这里的标签分配预测结果和标签分配结果都是包含背景类别的信息，如对某一张图模型共输出预测框1000个，即bbox为1000个，那么/>为1*1000的矩阵表示标签分配器为每个预测框分配的标签，/>为1x1000的矩阵表示每个预测框的真实标签，其中这1000维中由pos_inds表示了正样本的对应索引，并在label assigner的时候分配了对应的正样本标签，neg_inds为负样本索引，并分配负样本标签（背景）。

步骤S22：根据所述N个矩阵确定所述第i轮训练的目标分类损失函数的值。

在一个示例性的实施例中，上述步骤S22可以通过以下步骤S31-S33实现：

步骤S31：从所述N个矩阵中确定目标矩阵；

作为一种可选的示例，可以随机从N个矩阵中确定一个目标矩阵，即随机从N个标签分配器中选择一个作为主标签分配器，其余N-1个标签分配器作为辅助标签分配器。

步骤S32：根据所述N个矩阵中除所述目标矩阵以外的N-1个矩阵确定目标权重矩阵，其中，目标权重矩阵中的元素值包括所述目标矩阵中每个预测框对应的分配预测损失的权重值；

在一个示例性的实施例中，上述步骤S32可以通过以下步骤S41-S43实现：

步骤S41：将所述N-1个矩阵进行加法运算，得到第一中间矩阵；

需要说明的是，在N等于2的情况下，第一中间矩阵即为N个矩阵中除目标矩阵以外的一个矩阵。

步骤S42：将所述第一中间矩阵进行归一化处理，得到第二中间矩阵；

步骤S43：将预设矩阵与所述第二中间矩阵进行减法运算，得到目标权重矩阵，其中，所述预设矩阵与所述第二中间矩阵具有相同的行列数、且所述预设矩阵的每个元素值等于1。

为了更好的理解，以下进行具体说明，假设N等于2，则目标权重矩阵) ；其中，/>表示归一化操作，/>为第一中间矩阵，/>（即上述预设矩阵）表示和归一化后第二中间矩阵具有相同行数和列数且所有元素都是1的矩阵。

在N大于2的情况下，目标权重矩阵的计算公式如下：

；

其中，表示将所述N-1个矩阵进行求和，得到第一中间矩阵。

步骤S33：将所述目标权重矩阵和所述目标矩阵进行矩阵对位相乘运算，得到第i轮训练的目标分类损失函数的取值。

即目标分类损失函数以下：

；

其中，为目标矩阵，/>为根据上述N-1个矩阵确定目标权重矩阵，/> 表示两个矩阵对位相乘，即如矩阵/>对位相乘矩阵/>结果为/>。

需要说明的是，当辅助标签分配器得到的和原标签分配器得到的有重叠时，那么损折训练的进行，共同被选中作为正样本的预测框对应计算出的损失值会越来越小，而辅助标签分配器和原标签分配器选中不重叠位置的正样本的损失会相对大一点，那么以辅助标签器分配得到的损失归一化后取反的数值作为对应位置分类损失的损失权重，可以使得同时被辅助标签分配器和原标签分配器选中的位置的分类损失有更高的权重，从而得到充分的优化，而没有同时被辅助标签分配器和原标签分配器选中为正样本的正样本，会被分配更低的权重，从而来限制这些框的学习，这样能排除这些分配不是很明确的困难样本，从而提升检测模型的训练效果。

在一个示例性的实施例中，上述步骤S13中，根据所述N个标签分配预测结果确定所述第i轮训练的目标定位损失函数的取值，包括：根据所述N个标签分配预测结果确定N个标签分配器产生的N个定位损失；根据所述N个定位损失确定所述第i轮训练的目标定位损失函数的取值。

也就是说，N个标签分配器中的每个标签分配器在进行标签分配预测以后均会产生定位损失，进而可以根据N个标签分配器产生的N个定位损失确定第i轮训练的目标定位损失函数的取值。

在一个示例性的实施例中，上述根据N个标签分配预测结果确定N个标签分配器产生的N个定位损失，可以通过以下方式实现：通过以下步骤S51-S52得到N个定位损失中的第j个定位损失，以得到N个定位损失：

步骤S51：根据所述N个标签分配预测结果中的第j个标签分配预测结果确定第j组预测框，其中，所述第j组预测框中的每个预测框对应的标签不为背景标签；

步骤S52：使用定位损失函数确定所述第j组预测框对应的位置信息与所述多个标注框对应的位置信息之间的定位损失，得到第j个定位损失。

为了更好的理解，以下进行具体说明，可以使用以下公式计算第j个定位损失：

；

其中，为定位损失函数，其中/>表示经过索引pos_inds从第j个标签分配预测结果中筛选出可能是正样本的预测框，/>为真实框，如果预测框为1000个，真实框为10个，则这里/>即为1000预测框中筛选出的s（10<s<1000）个/>。

显然，上述所描述的实施例仅仅是本发明一部分的实施例，而不是全部的实施例。为了更好的理解上述目标检测模型的确定方法，以下结合实施例对上述过程进行说明，但不用于限定本发明实施例的技术方案，具体地：

本发明提出一种基于辅助标签分配的检测模型训练的方法，在检测模型训练时，在原有的训练框架基础上新增辅助标签分配模块，使得模型在训练过程中同时采用多组（两组或者两组以上）不同参数或者不同方法的标签分配方案对相同的侯选框进行标签分配，从而得到多组不同训练损失；用辅助标签分配得到的结果约束并优化模型损失收敛过程，不仅能改善模型对困难样本检测的不准确性，还能实现加速收敛，提升模型精度的效果。

具体实现步骤主要有：数据输入，特征提取，标签分配，损失计算。

1）数据输入：实现数据集加载并按指定输入要求输入到模型中。

2）特征提取：通过backbone网络实现对数据抽象特征的提取。

3）标签分配：这一步主要实现对模型输出的预测框的标签分配，方便后面进一步计算分类和定位损失。主要结构如图3所示；

fpn提取的特征输入到head中，首先会被转化为对应的定位信息和分类信息，由于模型直接预测出的结果有大量的冗余信息，所以预测框bbox的数量会很多且大大多于真实框gt_box的数量，为了能将真实标签信息和模型预测的信息进行一一对应并实现损失计算，需要先经过标签分配器label assigner处理。

Label assigner会将大量bbox和gt_box进行一一匹配，最终确定预测框中哪部分bbox属于对应的gt_box，并输出对应的正样本编号（pos_inds）,负样本编号（neg_inds）和标签分配详细结果（res_label_assinger)。结合label assigner的标签分配结果，可以实现对分类信息和定位信息的损失计算。

4）损失计算：

分类信息损失计算，如以下公式1所示：

；

其中，表示最终的分类损失，/>表示分类损失函数，/>分别表示分类预测信息和真实信息，这里的预测信息和真实信息都是包含背景类别的信息，如对某一张图模型共输出预测框1000个，即bbox为1000个，其中只有10个真实框，那么为1x1000的矩阵表示模型的预测类别，/>为1x1000的矩阵表示真实类别，其中这1000维中由pos_inds表示了正样本的对应索引，并在label assigner的时候分配了对应的正样本标签，neg_inds为负样本索引，并分配负样本标签（背景）。

公式1中表示矩阵对位相乘，即如矩阵对位相乘矩阵/>结果为/>，/>表示每个预测框的分类预测损失（即上述实施例中的分配预测损失），/>表示辅助标签分配后产生的分类损失经过归一化和取反操作后得到的。具体变化如以下公式2所示：

；

其中，表示归一化操作，/>表示由辅助标签分配结果得到的每个预测框的分类损失，/>表示和归一化后辅助分类损失具有相同行数和列数且所有元素都是1的矩阵。

上述公式原理分析：当辅助标签分配得到的和原标签分配得到的有重叠时，那么损折训练的进行，共同被选中作为正样本的预测框对应计算出的损失值会越来越小，而辅助标签分配和原标签分配选中不重叠位置的正样本的损失会相对大一点，那么以辅助标签分配得到的损失归一化后取反的数值作为对应位置分类损失的损失权重，可以使得同时被辅助标签分配和原标签分配选中的位置的分类损失有更高的权重，从而得到充分的优化，而没有同时被辅助标签分配和原标签分配选中为正样本的正样本，会被分配更低的权重，从而来限制这些框的学习，这样能排除这些分配不是很明确的困难样本，从而提升检测模型的训练效果。

当辅助标签分配策略在两种以上的时候的处理方式：当辅助标签分配策略在两种以上的时候公式2变为以下公式3:

；

表示先将各个辅助标签分配策略的分类损失矩阵求和，然后再做归一化处理将各个框的损失值限定再0-1的范围内，最后按照上一步一个辅助标签分配策略的流程进行即可。

定位信息损失计算，如以下公式4所示：

；

其中，为定位损失函数，其中/>表示经过索引pos_inds从模型预测框中筛选出可能时正样本的预测框，/>为真实框，如果继续对应上面的假设，这里/>即为1000预测框中筛选出的s（10<s<1000）个/>。

需要说明的是，和传统的检测模型训练方法比较，本发明实施例的技术方案有如下优点：

1）训练时采用了两种以上的标签分配策略，辅助标签分配策略可以作为原标签分配策略的补充和纠偏因子，提升原标签分配策略的有效性。

2）由于标签分配上更加精准，能加速模型收敛速度，减小训练时间。

3）更加精准的标签分配策略能提升模型训练精度。

4）提升了模型对困难样本的检测精度。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质（如ROM/RAM、磁碟、光盘）中，包括若干指令用以使得一台终端设备（可以是手机，计算机，服务器，或者网络设备等）执行本发明各个实施例的方法。

在本实施例中还提供了一种目标检测模型的确定装置，该装置用于实现上述实施例及优选实施方式，已经进行过说明的不再赘述。如以下所使用的，术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的设备较佳地以软件来实现，但是硬件，或者软件和硬件的组合的实现也是可能并被构想的。

图4是根据本发明实施例的目标检测模型的确定装置的结构框图，该装置包括：

获取模块42，用于获取训练样本集合，其中，所述训练样本集合中的每个训练样本包括：样本图片、所述样本图片的多个标注框和每个标注框对应的标签；

训练模块44，用于使用所述训练样本集合对待训练的检测模型进行训练，直到所述待训练的检测模型对应的目标损失函数的取值满足预设的收敛条件，其中，所述待训练的检测模型包括：用于对所述样本图片进行目标检测的目标网络和用于分别对所述目标网络检测出的预测框集合进行标签分配预测的N个标签分配器；N为大于1的正整数，所述目标损失函数的取值根据所述N个标签分配器产生的N组损失共同确定；

确定模块46，用于将结束训练时的待训练的检测模型确定为目标检测模型。

上述装置，由于在待训练的检测模型中设置了多个标签分配器，进而可以在训练的过程中同时兼顾各种标签分配器的优点来提升检测模型的性能，提高检测模型对图片进行目标检测的准确度，进而解决了现有检测模型对图片进行目标检测的准确度较低的问题。此外，在待训练的检测模型中设置多个标签分配器还可以提高模型的收敛速度，进而减少了对模型进行训练的装置的相关资源（例如：内存资源，CPU资源等等）的占用时间。

在一个示例性的实施例中，训练模块44，还用于通过以下步骤执行第i轮训练，其中，i为大于或等于1的正整数，经过第0轮训练的检测模型是未经过训练的所述待训练的检测模型：获取第i-1轮训练得到的目标网络对样本图片进行检测后得到的预测框集合；使用所述第i-1轮训练得到的N个标签分配器分别对所述第i轮检测出的预测框集合进行标签分配，得到N个标签分配预测结果，其中，每个标签分配预测结果包括所述预测框集合中每个预测框的标签；根据所述N个标签分配预测结果确定所述第i轮训练的目标分类损失函数的取值以及目标定位损失函数的取值，其中，所述目标损失函数包括所述目标分类损失函数和所述目标定位损失函数；所述N个标签分配器在得到所述N个标签分配预测结果的过程中产生了所述N组损失；在所述第i轮训练的所述目标定位损失函数的取值和所述目标分类损失函数的取值均满足对应的收敛条件的情况下，结束训练；在所述第i轮训练的所述目标定位损失函数的取值不满足对应的收敛条件、或者所述目标分类损失函数的取值不满足对应的收敛条件的情况下，调整经过第i-1轮训练得到的检测模型中的参数，得到经过所述第i轮训练得到的检测模型。

在一个示例性的实施例中，训练模块44，还用于根据N个标签分配预测结果确定N个矩阵，其中，所述N个矩阵中的第j个矩阵用于表示第j个标签分配器产生的标签分配预测损失，所述第j个矩阵中的元素值包括第j个标签分配器为所述预测框集合中每个预测框进行标签分配预测产生的分配预测损失；根据所述N个矩阵确定所述第i轮训练的目标分类损失函数的值。

在一个示例性的实施例中，训练模块44，还用于通过以下方式得到N个矩阵中的第j个矩阵，以得到所述N个矩阵：将N个标签分配预测结果中的第j个标签分配预测结果和与所述第j个标签分配预测结果对应的标签分配结果输入至分类损失函数，得到第j个矩阵；其中，所述第j个标签分配预测结果对应的标签分配结果是根据所述第j个标签分配器的标签分配策略、所述样本图片的多个标注框和每个标注框对应的标签对所述第i轮检测出的预测框集合进行标签分配的结果。

在一个示例性的实施例中，训练模块44，还用于从所述N个矩阵中确定目标矩阵；根据所述N个矩阵中除所述目标矩阵以外的N-1个矩阵确定目标权重矩阵，其中，目标权重矩阵中的元素值包括所述目标矩阵中每个预测框对应的分配预测损失的权重值；将所述目标权重矩阵和所述目标矩阵进行矩阵对位相乘运算，得到第i轮训练的目标分类损失函数的取值。

在一个示例性的实施例中，训练模块44，还用于将所述N-1个矩阵进行加法运算，得到第一中间矩阵；将所述第一中间矩阵进行归一化处理，得到第二中间矩阵；将预设矩阵与所述第二中间矩阵进行减法运算，得到目标权重矩阵，其中，所述预设矩阵与所述第二中间矩阵具有相同的行列数、且所述预设矩阵的每个元素值等于1。

在一个示例性的实施例中，训练模块44，还用于根据所述N个标签分配预测结果确定N个标签分配器产生的N个定位损失；根据所述N个定位损失确定所述第i轮训练的目标定位损失函数的取值。

在一个示例性的实施例中，训练模块44，还用于通过以下方式得到N个定位损失中的第j个定位损失，以得到N个定位损失：根据所述N个标签分配预测结果中的第j个标签分配预测结果确定第j组预测框，其中，所述第j组预测框中的每个预测框对应的标签不为背景标签；使用定位损失函数确定所述第j组预测框对应的位置信息与所述多个标注框对应的位置信息之间的定位损失，得到第j个定位损失。

在一个示例性的实施例中，上述装置还包括检测模块，用于将结束训练时的待训练的检测模型确定为目标检测模型之后，获取待进行目标检测的目标图片；通过所述目标检测模型对所述目标图片进行目标检测，以在所述目标图片中确定多个检测框以及所述多个检测框中每个检测框的标签。

本发明的实施例还提供了一种计算机可读存储介质，该计算机可读存储介质中存储有计算机程序，其中，该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。

可选地，在本实施例中，上述存储介质可以被设置为存储用于执行以下步骤的计算机程序：

S1，获取训练样本集合，其中，所述训练样本集合中的每个训练样本包括：样本图片、所述样本图片的多个标注框和每个标注框对应的标签；

S2，使用所述训练样本集合对待训练的检测模型进行训练，直到所述待训练的检测模型对应的目标损失函数的取值满足预设的收敛条件，其中，所述待训练的检测模型包括：用于对所述样本图片进行目标检测的目标网络和用于分别对所述目标网络检测出的预测框集合进行标签分配预测的N个标签分配器；N为大于1的正整数，所述目标损失函数的取值根据所述N个标签分配器产生的N组损失共同确定；

S3，将结束训练时的待训练的检测模型确定为目标检测模型。

在一个示例性实施例中，上述计算机可读存储介质可以包括但不限于：U盘、只读存储器（Read-Only Memory，简称为ROM）、随机存取存储器（Random Access Memory，简称为RAM）、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。

本实施例中的具体示例可以参考上述实施例及示例性实施方式中所描述的示例，本实施例在此不再赘述。

本发明的实施例还提供了一种电子装置，包括存储器和处理器，该存储器中存储有计算机程序，该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。

可选地，在本实施例中，上述处理器可以被设置为通过计算机程序执行以下步骤：

在一个示例性实施例中，上述电子装置还可以包括传输设备以及输入输出设备，其中，该传输设备和上述处理器连接，该输入输出设备和上述处理器连接。

显然，本领域的技术人员应该明白，上述的本发明的各模块或各步骤可以用通用的计算装置来实现，它们可以集中在单个的计算装置上，或者分布在多个计算装置所组成的网络上，它们可以用计算装置可执行的程序代码来实现，从而，可以将它们存储在存储装置中由计算装置来执行，并且在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样，本发明不限制于任何特定的硬件和软件结合。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种目标检测模型的确定方法，其特征在于，包括：

获取训练样本集合，其中，所述训练样本集合中的每个训练样本包括：样本图片、所述样本图片的多个标注框和每个标注框对应的标签；

使用所述训练样本集合对待训练的检测模型进行训练，直到所述待训练的检测模型对应的目标损失函数的取值满足预设的收敛条件，其中，所述待训练的检测模型包括：用于对所述样本图片进行目标检测的目标网络和用于分别对所述目标网络检测出的预测框集合进行标签分配预测的N个标签分配器；N为大于1的正整数，所述目标损失函数的取值根据所述N个标签分配器产生的N组损失共同确定；

将结束训练时的待训练的检测模型确定为目标检测模型；

其中，使用所述训练样本集合对待训练的检测模型进行训练，包括：

通过以下步骤执行第i轮训练，其中，i为大于或等于1的正整数，经过第0轮训练的检测模型是未经过训练的所述待训练的检测模型：

获取第i-1轮训练得到的目标网络对样本图片进行检测后得到的预测框集合；

使用所述第i-1轮训练得到的N个标签分配器分别对第i轮检测出的预测框集合进行标签分配，得到N个标签分配预测结果，其中，每个标签分配预测结果包括所述预测框集合中每个预测框的标签；

根据所述N个标签分配预测结果确定所述第i轮训练的目标分类损失函数的取值以及目标定位损失函数的取值，其中，所述目标损失函数包括所述目标分类损失函数和所述目标定位损失函数；所述N个标签分配器在得到所述N个标签分配预测结果的过程中产生了所述N组损失；

在所述第i轮训练的所述目标定位损失函数的取值和所述目标分类损失函数的取值均满足对应的收敛条件的情况下，结束训练；在所述第i轮训练的所述目标定位损失函数的取值不满足对应的收敛条件、或者所述目标分类损失函数的取值不满足对应的收敛条件的情况下，调整经过第i-1轮训练得到的检测模型中的参数，得到经过所述第i轮训练得到的检测模型；

其中，根据所述N个标签分配预测结果确定所述第i轮训练的目标分类损失函数的取值，包括：

根据N个标签分配预测结果确定N个矩阵，其中，所述N个矩阵中的第j个矩阵用于表示第j个标签分配器产生的标签分配预测损失，所述第j个矩阵中的元素值包括第j个标签分配器为所述预测框集合中每个预测框进行标签分配预测产生的分配预测损失；

根据所述N个矩阵确定所述第i轮训练的目标分类损失函数的值。

2.根据权利要求1所述的方法，其特征在于，根据N个标签分配预测结果确定N个矩阵，包括：

通过以下方式得到N个矩阵中的第j个矩阵，以得到所述N个矩阵：

将所述N个标签分配预测结果中的第j个标签分配预测结果和与所述第j个标签分配预测结果对应的标签分配结果输入至分类损失函数，得到第j个矩阵；

其中，所述第j个标签分配预测结果对应的标签分配结果是根据所述第j个标签分配器的标签分配策略、所述样本图片的多个标注框和每个标注框对应的标签对所述第i轮检测出的预测框集合进行标签分配的结果。

3.根据权利要求1所述的方法，其特征在于，根据所述N个矩阵确定所述第i轮训练的目标分类损失函数的值，包括：

从所述N个矩阵中确定目标矩阵；

根据所述N个矩阵中除所述目标矩阵以外的N-1个矩阵确定目标权重矩阵，其中，目标权重矩阵中的元素值包括所述目标矩阵中每个预测框对应的分配预测损失的权重值；

将所述目标权重矩阵和所述目标矩阵进行矩阵对位相乘运算，得到第i轮训练的目标分类损失函数的取值。

4.根据权利要求3所述的方法，其特征在于，根据所述N个矩阵中除所述目标矩阵以外的N-1个矩阵确定目标权重矩阵，包括：

将所述N-1个矩阵进行加法运算，得到第一中间矩阵；

将所述第一中间矩阵进行归一化处理，得到第二中间矩阵；

将预设矩阵与所述第二中间矩阵进行减法运算，得到目标权重矩阵，其中，所述预设矩阵与所述第二中间矩阵具有相同的行列数、且所述预设矩阵的每个元素值等于1。

5.根据权利要求1所述的方法，其特征在于，根据所述N个标签分配预测结果确定所述第i轮训练的目标定位损失函数的取值，包括：

根据所述N个标签分配预测结果确定N个标签分配器产生的N个定位损失；

根据所述N个定位损失确定所述第i轮训练的目标定位损失函数的取值。

6.根据权利要求5所述的方法，其特征在于，根据N个标签分配预测结果确定N个标签分配器产生的N个定位损失，包括：

通过以下方式得到N个定位损失中的第j个定位损失，以得到N个定位损失：

根据所述N个标签分配预测结果中的第j个标签分配预测结果确定第j组预测框，其中，所述第j组预测框中的每个预测框对应的标签不为背景标签；

使用定位损失函数确定所述第j组预测框对应的位置信息与所述多个标注框对应的位置信息之间的定位损失，得到第j个定位损失。

7.根据权利要求1所述的方法，其特征在于，将结束训练时的待训练的检测模型确定为目标检测模型之后，所述方法还包括：

获取待进行目标检测的目标图片；

通过所述目标检测模型对所述目标图片进行目标检测，以在所述目标图片中确定多个检测框以及所述多个检测框中每个检测框的标签。

8.一种目标检测模型的确定装置，其特征在于，包括：

获取模块，用于获取训练样本集合，其中，所述训练样本集合中的每个训练样本包括：样本图片、所述样本图片的多个标注框和每个标注框对应的标签；

训练模块，用于使用所述训练样本集合对待训练的检测模型进行训练，直到所述待训练的检测模型对应的目标损失函数的取值满足预设的收敛条件，其中，所述待训练的检测模型包括：用于对所述样本图片进行目标检测的目标网络和用于分别对所述目标网络检测出的预测框集合进行标签分配预测的N个标签分配器；N为大于1的正整数，所述目标损失函数的取值根据所述N个标签分配器产生的N组损失共同确定；

确定模块，用于将结束训练时的待训练的检测模型确定为目标检测模型；

其中，所述训练模块，还用于通过以下步骤执行第i轮训练，其中，i为大于或等于1的正整数，经过第0轮训练的检测模型是未经过训练的所述待训练的检测模型：获取第i-1轮训练得到的目标网络对样本图片进行检测后得到的预测框集合；使用所述第i-1轮训练得到的N个标签分配器分别对第i轮检测出的预测框集合进行标签分配，得到N个标签分配预测结果，其中，每个标签分配预测结果包括所述预测框集合中每个预测框的标签；根据所述N个标签分配预测结果确定所述第i轮训练的目标分类损失函数的取值以及目标定位损失函数的取值，其中，所述目标损失函数包括所述目标分类损失函数和所述目标定位损失函数；所述N个标签分配器在得到所述N个标签分配预测结果的过程中产生了所述N组损失；在所述第i轮训练的所述目标定位损失函数的取值和所述目标分类损失函数的取值均满足对应的收敛条件的情况下，结束训练；在所述第i轮训练的所述目标定位损失函数的取值不满足对应的收敛条件、或者所述目标分类损失函数的取值不满足对应的收敛条件的情况下，调整经过第i-1轮训练得到的检测模型中的参数，得到经过所述第i轮训练得到的检测模型；

其中，所述训练模块，还用于根据N个标签分配预测结果确定N个矩阵，其中，所述N个矩阵中的第j个矩阵用于表示第j个标签分配器产生的标签分配预测损失，所述第j个矩阵中的元素值包括第j个标签分配器为所述预测框集合中每个预测框进行标签分配预测产生的分配预测损失；根据所述N个矩阵确定所述第i轮训练的目标分类损失函数的值。

9.一种计算机可读的存储介质，其特征在于，所述计算机可读的存储介质包括存储的程序，其中，所述程序运行时执行权利要求1至7任一项中所述的方法。

10.一种电子装置，包括存储器和处理器，其特征在于，所述存储器中存储有计算机程序，所述处理器被设置为通过所述计算机程序执行权利要求1至7任一项中所述的方法。