WO2020258793A1

WO2020258793A1 - 目标检测及目标检测网络的训练

Info

Publication number: WO2020258793A1
Application number: PCT/CN2019/128383
Authority: WO
Inventors: 李聪
Original assignee: 北京市商汤科技开发有限公司
Priority date: 2019-06-26
Filing date: 2019-12-25
Publication date: 2020-12-30
Also published as: US20210056708A1; TWI762860B; KR20210002104A; SG11202010475SA; TW202101377A; CN110298298A; CN110298298B; KR102414452B1; JP7096365B2; JP2021532435A

Abstract

一种目标检测及目标检测网络的训练方法、装置及设备。该目标检测方法包括：获得输入图像的特征数据（101）；根据所述特征数据，确定所述输入图像的多个候选边界框（102）；根据所述特征数据，获得所述输入图像的前景分割结果，其中，前景分割结果包含指示所述输入图像的多个像素中每个像素是否属于前景的指示信息（103）；根据所述多个候选边界框与所述前景分割结果，得到所述输入图像的目标检测结果（104）。

Description

目标检测及目标检测网络的训练

技术领域

本公开涉及图像处理技术领域，尤其涉及一种目标检测及目标检测网络的训练方法、装置及设备。

背景技术

目标检测是计算机视觉领域的重要问题，尤其对于飞机、舰船等军事目标的检测，由于其具有影像尺寸大、目标尺寸小的特点，导致检测难度较大。而且，对于具有密集排列状态的舰船等目标，检测精度较低。

发明内容

本公开实施例提供了一种目标检测及目标检测网络的训练方法、装置及设备。

第一方面，提供一种目标检测方法，包括：

获得输入图像的特征数据；根据所述特征数据，确定所述输入图像的多个候选边界框；根据所述特征数据，获得所述输入图像的前景分割结果，其中，前景分割结果包含指示所述输入图像的多个像素中每个像素是否属于前景的指示信息；根据所述多个候选边界框与所述前景分割结果，得到所述输入图像的目标检测结果。

结合本公开提供的任一实施方式，所述根据所述多个候选边界框与所述前景分割结果，得到所述输入图像的目标检测结果，包括：根据所述多个候选边界框中每个候选边界框与所述前景分割结果对应的前景图像区域之间的重叠区域，从多个候选边界框中选取至少一个目标边界框；基于所述至少一个目标边界框，得到所述输入图像的目标检测结果。

结合本公开提供的任一实施方式，所述根据所述多个候选边界框中每个候选边界框与所述前景分割结果对应的前景图像区域之间的重叠区域，从多个候选边界框中选取至少一个目标边界框，包括：对于所述多个候选边界框中每个候选边界框，若该候选边界框与对应的前景图像区域之间的重叠区域在该候选边界框中所占的比例大于第一阈值，则将该候选边界框作为所述目标边界框。

结合本公开提供的任一实施方式，所述至少一个目标边界框包括第一边界框和第二边界框，所述基于所述至少一个目标边界框，得到所述输入图像的目标检测结果，包括：基于所述第一边界框和所述第二边界框之间的夹角，确定所述第一边界框和所述第二边界框的重叠参数；基于所述第一边界框和所述第二边界框的重叠参数，确定所述第一边界框和所述第二边界框所对应的目标对象位置。

结合本公开提供的任一实施方式，所述基于所述第一边界框和所述第二边界框之间的夹角，确定所述第一边界框和所述第二边界框的重叠参数，包括：根据所述第一边界框和所述第二边界框之间的夹角，获得角度因子；根据所述第一边界框和所述第二边界框之间的交并比和所述角度因子，获得所述重叠参数。

结合本公开提供的任一实施方式，所述第一边界框和所述第二边界框的重叠参数为所述交并比与所述角度因子的乘积，其中，所述角度因子随着所述第一边界框和所述第二边界框之间的角度的增大而增大。

结合本公开提供的任一实施方式，在所述交并比保持一定的条件下，所述第一边界框和所述第二边界框的重叠参数随着所述第一边界框和所述第二边界框之间的角度的增大而增大。

结合本公开提供的任一实施方式，所述基于所述第一边界框和所述第二边界框的重叠参数，确定所述第一边界框和所述第二边界框所对应的目标对象位置，包括：在所述第一边界框和所述第二边界框的重叠参数大于第二阈值的情况下，将所述第一边界框和所述第二边界框中的其中一个边界框作为所述目标对象位置。

结合本公开提供的任一实施方式，所述将所述第一边界框和所述第二边界框中的其中一个边界框作为所述目标对象位置，包括：确定所述第一边界框与所述前景分割结果对应的前景图像区域之间的重叠参数和所述第二边界框与所述前景图像区域之间的重叠参数；将所述第一边界框和所述第二边界框中与所述前景图像区域之间的重叠参数较大的边界框作为所述目标对象位置。

结合本公开提供的任一实施方式，所述基于所述第一边界框和所述第二边界框的重叠参数，确定所述第一边界框和所述第二边界框所对应的目标对象位置，包括：在所述第一边界框和所述第二边界框的重叠参数小于或等于第二阈值的情况下，将所述第一边界框和所述第二边界框均作为所述目标对象位置。

结合本公开提供的任一实施方式，所述输入图像中待检测的目标对象的长宽比大于特定数值。

第二方面，提供一种目标检测网络的训练方法，所述目标检测网络包括特征提取网络、目标预测网络和前景分割网络，所述方法包括：

通过所述特征提取网络对样本图像进行特征提取处理，获得所述样本图像的特征数据；根据所述特征数据，通过所述目标预测网络获得多个样本候选边界框；根据所述特征数据，通过所述前景分割网络获得所述样本图像的样本前景分割结果，其中，所述样本前景分割结果包含指示所述样本图像的多个像素点中每个像素点是否属于前景的指示信息；根据所述多个样本候选边界框和所述样本前景分割结果以及所述样本图像的标注信息，确定网络损失值；基于所述网络损失值，对所述目标检测网络的网络参数进行调整。

结合本公开提供的任一实施方式，所述标注信息包括所述样本图像包含的至少一个目标对象的真实边界框，所述根据所述多个样本候选边界框和所述样本前景图像区域以及所述样本图像的标注信息，确定网络损失值，包括：对于所述多个候选边界框中的每个候选边界框，确定该候选边界框与所述样本图像标注的至少一个真实目标边界框中的每个真实目标边界框之间的交并比；根据确定的所述多个候选边界框中每个候选边界框的所述交并比，确定第一网络损失值。

结合本公开提供的任一实施方式，所述候选边界框和所述真实目标边界框之间的交并比是基于包含所述候选边界框与所述真实目标边界框的外接圆得到的。

结合本公开提供的任一实施方式，在确定所述网络损失值的过程中，所述候选边界框的宽度所对应的权重高于所述候选边界框的长度所对应的权重。

结合本公开提供的任一实施方式，所述根据所述特征数据，通过所述前景分割网络获得所述样本图像的样本前景分割结果，包括：对所述特征数据进行上采样处理，以使得处理后的所述特征数据的大小与样本图像的大小相同；基于所述处理后的所述特征数据进行像素分割，获得所述样本图像的样本前景分割结果。

结合本公开提供的任一实施方式，所述样本图像包含的目标对象的长宽比高于设定值。

第三方面，提供一种目标检测装置，包括：

特征提取单元，用于获得输入图像的特征数据；目标预测单元，用于根据所述特征数据，确定所述输入图像的多个候选边界框；前景分割单元，用于根据所述特征数据，获得所述输入图像的前景分割结果，其中，前景分割结果包含指示所述输入图像的多个像素中每个像素是否属于前景的指示信息；目标确定单元，用于根据所述多个候选边界框与所述前景分割结果，得到所述输入图像的目标检测结果。

第四方面，提供一种目标检测网络的训练装置，所述目标检测网络包括特征提取网络、目标预测网络和前景分割网络，所述装置包括：

特征提取单元，用于通过所述特征提取网络对样本图像进行特征提取处理，获得所述样本图像的特征数据；目标预测单元，用于根据所述特征数据，通过所述目标预测网络获得多个样本候选边界框；前景分割单元，用于根据所述特征数据，通过所述前景分割网络获得所述样本图像的样本前景分割结果，其中，所述样本前景分割结果包含指示所述样本图像的多个像素点中每个像素点是否属于前景的指示信息；损失值确定单元，用于根据所述多个样本候选边界框和所述样本前景分割结果以及所述样本图像的标注信息，确定网络损失值；参数调整单元，用于基于所述网络损失值，对所述目标检测网络的网络参数进行调整。

第五方面，提供一种目标测检设备，所述设备包括存储器、处理器，所述存储器用于存储可在所述处理器上运行的计算机指令，所述处理器用于在执行所述计算机指令时实现以上所述的目标检测方法。

第六方面，提供一种目标检测网络的训练设备，所述设备包括存储器、处理器，所述存储器用于存储可在所述处理器上运行的计算机指令，所述处理器用于在执行所述计算机指令时实现以上所述的目标检测网络的训练方法。

第七方面，提供一种非易失性计算机可读存储介质，其上存储有计算机程序，其特征在于，所述程序被处理器执行时，促使所述处理器实现以上所述的目标检测方法，和/或，实现以上所述的目标检测网络的训练方法。

本公开一个或多个实施例的目标检测及目标检测网络的训练方法、装置及设备，根据输入图像的特征数据确定多个候选边界框，并根据所述特征数据得到前景分割结果，通过结合所述多个候选边界框和前景分割结果，能够更准确地确定所检测的目标对象。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本说明书的实施例，并与说明书一起用于解释本说明书的原理。

图1是本申请实施例示出的一种目标检测方法的流程图。

图2是本申请实施例示出的一种目标检测方法的示意图。

图3A和图3B分别是本申请示例性实施例示出的船舰检测结果图。

图4是相关技术中的一种目标边界框的示意图。

图5A和图5B分别是本申请示例性实施例示出的重叠参数计算方法示意图。

图6是本申请实施例示出的一种目标检测网络的训练方法的流程图。

图7是本申请实施例示出的一种交并比计算方法示意图。

图8是本申请实施例示出的一种目标检测网络的网络结构图。

图9是本申请实施例示出的一种目标检测网络的训练方法的示意图。

图10是本申请实施例示出的一种预测候选边界框方法的流程图。

图11是本申请实施例示出的一种锚点框的示意图。

图12是本申请一示例性实施例示出的一种预测前景图像区域方法的流程图。

图13是本申请一示例性实施例示出的一种目标检测装置的结构示意图。

图14是本申请一示例性实施例示出的一种目标检测网络的训练装置的结构示意图。

图15是本申请一示例性实施例示出的一种目标检测设备的结构图。

图16是本申请一示例性实施例示出的一种目标检测网络的训练设备的结构图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

应理解，本公开实施例提供的技术方案主要应用于图像中细长小目标的检测，但本公开实施例对此不做限定。

图1示出了一种目标检测方法，该方法可以包括以下步骤。

在步骤101中，获得输入图像的特征数据(例如特征图feature map)。

在一些实施例中，输入图像可以是遥感图像。遥感图像可以是通过搭载在例如人造卫星、航拍飞机上的传感器探测的地物电磁辐射特征信号等所获得的图像。本领域技术人员应当理解，输入图像也可以是其他类型的图像，并不限于遥感图像。

在一个示例中，可以通过特征提取网络提取样本图像的特征数据，例如卷积神经网络，本公开实施例不限制特征提取网络的具体结构。所提取的特征数据是多通道的特征数据，特征数据的大小和通道数目由特征提取网络的具体结构确定。

在另一个示例中，可以从其他设备处获取输入图像的特征数据，例如，接收终端发送的特征数据，本公开实施例对此不作限制。

在步骤102中，根据所述特征数据，确定所述输入图像的多个候选边界框。

在本步骤中，利用例如感兴趣区域(Region Of Interest，ROI)等技术预测得到候选边界框，包括了获得候选边界框的参数信息，参数可以包括候选边界框的长度、宽度、中心点坐标、角度等一种或任意组合。

在步骤103中，根据所述特征数据，获得所述输入图像的前景分割结果，其中，前景分割结果包含指示所述输入图像的多个像素中每个像素是否属于前景的指示信息。

基于特征数据所获得的前景分割结果，包含了所述输入图像的多个像素中，每个像素属于前景和/或背景的概率，前景分割结果给出像素级的预测结果。

在步骤104，根据所述多个候选边界框与所述前景分割结果，得到所述输入图像的目标检测结果。

在一些实施例中，根据输入图像的特征数据所确定的多个候选边界框，和通过所述特征数据得到的前景分割结果，具有对应关系。将多个候选边界框映射到前景分割结果，与目标对象的轮廓拟合越好的候选边界框，与前景分割结果对应的前景图像区域越接近重叠。因此，可以结合所确定的多个候选边界框和所得到前景分割结果，可以更准确地确定所检测的目标对象。在一些实施例中，目标检测结果可以包括输入图像包括的目标对象的位置、数量等信息。

在一个示例中，可以根据所述多个候选边界框中每个候选边界框与所述前景分割结果对应的前景图像区域之间的重叠区域，从多个候选边界框中选取至少一个目标边界框；并基于所述至少一个目标边界框，得到所述输入图像的目标检测结果。

在所述多个候选边界框中，与前景图像区域之间的重叠区域越大，也即候选边界框与前景图像区域越接近重叠，说明该候选边界框与目标对象的轮廓拟合的越好，也说明该候选边界框的预测结果越准确。因此，根据候选边界框与前景图像之间的重叠区域，可以从所述多个候选边界框中选取出至少一个候选边界框作为目标边界框，将所选取的目标边界框中作为检测到的目标对象，获得所述输入图像的目标检测结果。

例如，可以将所述多个候选边界框中与所述前景图像区域之间的重叠区域在整个候选边界框中所占的比例大于第一阈值的候选边界框作为所述目标边界框。重叠区域在整个候选边界框中所占的比例越高，说明该候选边界框与前景图像区域的重叠程度越高。本领域技术人员应当理解，本公开不限定第一阈值的具体数值，其可以根据实际需求来确定。

本公开实施例的目标检测方法可以应用于长宽比悬殊的待检测目标对象，例如飞机、船舰、车辆等军事目标。在一个示例中，长宽比悬殊指长宽比大于特定数值，例如大于5。本领域技术人员应当理解，该特定数值可以依据检测目标而具体确定。在一个示例中，目标对象可以是船舰。

下面以输入图像为遥感图像且检测目标为船舰为例，说明目标检测的过程。本领域技术人员应当理解，对于其他的目标对象，也可以应用该目标检测方法。参见图2所示的目标检测方法示意图。

首先，获得该遥感图像(也即图2中的输入图像210)的多通道特征数据(也即图2中的特征图220)。

将上述特征数据分别输入到第一分支(图2中上部分支230)和第二分支(图2中下部分支240)，分别进行如下处理。

对于第一分支

对每个锚点(anchor)框生成一个置信度得分。该置信度得分与锚点框内为前景或背景的概率相关，例如，锚点框为前景的概率越高，置信度得分就越高。

在一些实施例中，锚点框是基于先验知识的矩形框。锚点框的具体实现方法可以参见后续训练目标检测网络中的描述，在此暂不详述。可以将锚点框作为一个整体进行预测，以计算锚点框内属于前景或背景的概率，即预测该锚点框内是否含有物体或特定目标，其中，若锚点框含有物体或特定目标，则将该锚点框判断为前景。

在一些实施例中，按照置信度得分，可以选出得分最高或超过一定阈值的若干锚点框作为前景锚点框，通过预测前景锚点框到候选边界框的偏移量，对前景锚点框进行偏移可以得到候选边界框，并且基于该偏移量可以获得候选边界框的参数。

在一个示例中，锚点框可以包括方向信息，并且可以设置多种长宽比，以覆盖待检测的目标对象。具体的方向个数以及长宽比的数值可以根据实际需求进行设置。如图11所示，所构造的锚点框对应6个方向，其中，w表示锚点框的宽度，l表示锚点框的长度，θ表示锚点框的角度(锚点框相对于水平的旋转角度)，(x,y)表示锚点框中心点的坐标。对应于方向上均匀分布的6个锚点框，θ分别为0°、30°、60°、90°、-30°、-60°。

在一个示例中，在生成候选边界框之后，可以进一步通过非极大值抑制方法(Non-Maximum Suppression，NMS)去除重叠的检测框。例如可以首先遍历所有候选边界框，选择置信度得分最高的候选边界框，遍历其余的候选边界框，如果和当前最高分边界框的交并比(Intersection over Union，IoU)大于一定阈值，则将该边界框删除。之后，从未处理的候选边界框中继续选取得分最高的，重复上述过程。多次迭代后，得最终未被抑制的保留下来，作为所确定的候选边界框。以图2为例，经NMS处理后，得到候选边界框图231中的标号为1、2、3的三个候选边界框。

对于第二分支

根据所述特征数据，对于输入图像中的每个像素，预测其为前景、背景的概率，通过将为前景概率高于设定值的像素作为前景像素，生成像素级的前景分割结果241。

由于第一分支和第二分支输出的结果尺寸是一致的，因此可以将候选边界框映射到像素分割结果中，据候选边界框与前景分割结果对应的前景图像区域之间的重叠区域，来确定目标边界框。例如，可以将重叠区域在整个候选边界框中所占的比例大于第一阈值的候选边界框作为所述目标边界框。

以图2为例，将标号为1、2、3的三个候选边界框映射至前景分割结果中，可以计算得出每个候选边界框与前景图像区域重叠区域在整个候选边界框中所占的比例，例如，针对候选边界框1，该比例为92％，针对候选边界框2，该比例为86％，针对候选边界框3，该比例为65％。在第一阈值为70％的情况下，则排除了候选边界框3为目标边界框的可能性，在最终检测输出结果图250中，目标边界框为候选边界框1和候选边界框2。

通过以上方法进行检测，输出的目标边界框仍有重叠的可能性。例如，在进行NMS处理时，如果阈值设置的过高，则有可能没有抑制掉重叠的候选边界框。在候选边界框与前景图像区域重叠区域在整个候选边界框中所占的比例都超过第一阈值的情况下，最终输出的目标边界框还有可能包括重叠的边界框。

在所选取的至少一个目标边界框包括第一边界框和第二边界框的情况下，本公开实施例可以通过以下方法确定最终目标对象。本领域技术人员应当理解，该方法不限于处理两个重叠边界框，也可以通过先处理两个，再处理保留的一个与其他边界框的方法，处理多个重叠边界框。

在一些实施例中，基于所述第一边界框和所述第二边界框之间的夹角，确定所述第一边界框和所述第二边界框的重叠参数；基于所述第一边界框和所述第二边界框的重叠参数，确定所述第一边界框和所述第二边界框所对应的目标对象位置。

在两个待检测目标对象紧密排列的情况下，二者的目标边界框(第一边界框和第二边界框)有可能是重复的。但这种情况，第一边界框和第二边界框的交并比通常是比较小的。因此，本公开通过设置第一边界框和第二边界框的重叠参数，来确定两个边界框中的检测物体是否均为目标对象。

在一些实施例中，在所述重叠参数大于第二阈值的情况下，则表示第一边界框和第二边界框中有可能只有一个目标对象，因此将其中的一个边界框作为目标对象位置。由于前景分割结果包括了像素级的前景图像区域，因此可以利用该前景图像区域来确定保留哪一个边界框，作为目标对象的边界框。例如，可以分别计算第一边界框与对应的前景图像区域的第一重叠参数以及第二边界框与对应的前景图像区域的第二重叠参数，将第一重叠参数和第二重叠参数中的较大值对应的目标边界框内确定为目标对象，并移除较小值对应的目标边界框。通过以上方法，则移除了在一个目标对象上重叠的两个或多个边界框。

在一些实施例中，在所述重叠参数小于或等于第二阈值的情况下，将所述第一边界框和所述第二边界框均作为目标对象位置。

以下示例性地说明确定最终目标对象的过程。

在一个实施例中，如图3A所示，边界框A、B为船舰检测结果，其中，边界框A和边界框B是重叠的，计算得出二者的重叠参数为0.1。在第二阈值为0.3的情况下，确定边界框A和边界框B是两个不同船舰的检测。将边界框映射到像素分割结果中可见，边界框A和边界框B分别对应着不同的船舰。在判断出两个边界框的重叠参数小于第二阈值的情况下，并不需要额外的将边界框映射到像素分割结果的过程，以上仅出于验证的目的。

在另一个实施例中，如图3B所示，边界框C、D为另一种船舰检测结果，其中，边界框C和边界框D是重叠的，计算得出二者的重叠参数为0.8，也即大于第二阈值0.3。基于该重叠参数计算结果，可以确定边界框C和边界框D实际上是同一船舰的边界框。在这种情况下，可以通过将边界框C和边界框D映射到像素分割结果中，利用对应的前景图像区域来进一步确定最终目标对象。计算边界框C与前景图像区域的第一重叠参数，以及计算边界框D与前景图像区域的第二重叠参数。例如，第一重叠参数为0.9，第二重叠参数为0.8，则确定数值较大的第一重叠参数所对应的边界框C包含船舰，并同时移除第二重叠参数所对应的边界框D，最终输出边界框C作为船舰的目标边界框。

在一些实施例中，利用像素分割结果对应的前景图像区域辅助确定重叠边界框的目标对象，由于像素分割结果对应的是像素级的前景图像区域，空间精度较高，因此通过重叠的边界框与前景图像区域的重叠参数进一步确定包含目标对象的目标边界框，提升了目标检测的精度。

相关技术中，由于采用的锚点框通常是不含角度参数的矩形框，对于长宽比悬殊的目标对象，例如船舰，当目标对象处于倾斜的状态，利用这种锚点框所确定的目标边界框是目标对象的外接矩形框，其面积与目标对象的真实面积相差是非常大的。对于两个紧密排列的目标对象，如图4所示，其中目标对象401对应的目标边界框403是其外接矩形框，目标对象402对应的目标边界框404也是其外接矩形框，这两个目标对象的目标边界框之间的重叠参数即是两个外接矩形框之间的交并比IoU。由于目标边界框与目标对象之间面积的差异，使得计算得到的交并比的误差是非常大的，因此导致了目标测检的召回率(recall)降低。

为此，如前所述，在一些实施例中，本公开的锚点框可以引入锚点框的角度参数，以增加交并比的计算准确性。由锚点框经过计算得到的不同的目标边界框的角度也可能互不相同。

基于此，本公开提出了如下计算重叠参数的方法：根据所述第一边界框和所述第二边界框之间的夹角，获得角度因子；根据所述第一边界框和所述第二边界框之间的交并比和所述角度因子，获得所述重叠参数。

在一个示例中，所述重叠参数为所述交并比与所述角度因子的乘积，其中，所述角度因子可以根据第一边界框和第二边界框之间的夹角得到，其值小于1，并且随着第一边界框和第二边界框之间的角度的增大而增大。

例如，该角度因子可以用公式(1)表示：

其中，θ为第一边界框和第二边界框之间的夹角。

在另一个示例中，在所述交并比保持一定的条件下，所述重叠参数随着所述第一边界框和所述第二边界框之间的角度的增大而增大。

以下以图5A和图5B为例，说明以上重叠参数计算方法对目标检测的影响。

对于图5A中的边界框501和边界框502，二者面积的交并比为AIoU1，二者之间的角度为θ ₁。对于图5B中的边界框503和边界框504，二者面积的交并比为AIoU2，二者之间的角度为θ ₂。其中，AIoU1<AIoU2。

利用上述重叠参数计算方法，增加角度因子γ进行重叠参数计算。例如，通过将两个边界框面积的交并比值与角度因子的值相乘，得到重叠参数。

例如，边界框501和边界框502的重叠参数β1可利用公式(2)进行计算：

边界框503和边界框504的重叠参数β2可利用公式(3)进行计算：

经计算可得，β1＞β2。

在加入了角度因子后，图5A和图5B的重叠参数计算结果相较于面积交并比的计算结果，在大小关系上是相反的。这是由于在图5A中，两个边界框之间的角度较大，使得角度因子的值也较大，因此得到的重叠参数变大。相应地，在图5B中，两个边界框之间的角度较小，使得角度因子的值也较小，因此得到的重叠参数变小。

对于两个紧密排列的目标对象来说，二者之间的角度可能是很小的。但是由于其排列紧密，检测得到的二者的边界框之间，面积重叠部分可能较大，如果仅以面积计算交并比的话，很可能交并比结果较大，使得容易被误判为两个边界框包含的是同一个目标对象。通过本公开实施例所提出的重叠参数计算方法，通过引入角度因子，使得排列紧密的目标对象之间的重叠参数计算结果变小，有利于准确地检测出目标对象，提升对紧密排列目标的召回率。

本领域技术人员应当理解，以上重叠参数计算方法不限于对目标边界框之间的重叠参数进行计算，也可用于候选边界框、前景锚点框、真实边界框、锚点框等带有角度参数的框之间的重叠参数计算。此外，也可以采用其他方式计算重叠参数，本公开实施例对此不做限定。

在一些例子中，上述目标检测方法可以由已训练好的目标检测网络实现，该目标检测网络可以为神经网络。在使用目标检测网络之前，需要先对其进行训练，以得到优化的参数值。

下面仍以船舰检测目标为例，说明目标检测网络的训练过程。所述目标检测网络可以包括特征提取网络、目标预测网络和前景分割网络。参见图6所示的训练方法实施例流程图，可以包括如下步骤。

在步骤601中，通过所述特征提取网络对样本图像进行特征提取处理，获得所述样本图像的特征数据。

在本步骤中，所述的样本图像可以是遥感图像。遥感图像是通过搭载在例如人造卫星、航拍飞机上的传感器探测的地物电磁辐射特征信号，所获得的图像。样本图像也可以是其他类型的图像，并不限于遥感图像。此外，所述样本图像包括预先标注的目标对象的标注信息。该标注信息可以包括标定的目标对象的真实边界框(ground truth)，在一个示例中，该标注信息可以是标定的真实边界框的四个顶点的坐标。特征提取网络可以是卷积神经网络，本公开实施例不限制特征提取网络的具体结构。

在步骤602中，根据所述特征数据，通过所述目标预测网络获得多个样本候选边界框。

在本步骤中，根据所述样本图像的特征数据，预测生成目标对象的多个候选边界框。所述候选边界框所包含的信息可以包括以下中的至少一种：该边界框内是前景、背景的概率，该边界框的参数，例如，该边界框的尺寸、角度、位置等。

在步骤603中，根据所述特征数据获得所述样本图像中的前景分割结果。

在本步骤中，根据所述特征数据，通过所述前景分割网络获得所述样本图像的样本前景分割结果。其中，所述样本前景分割结果包含指示所述样本图像的多个像素点中每个像素点是否属于前景的指示信息。也即，通过前景分割结果可以获得对应的前景图像区域，该前景图像区域包括所有被预测为前景的像素。

在步骤604，根据所述多个样本候选边界框和所述样本前景分割结果以及所述样本图像的标注信息，确定网络损失值。

所述网络损失值可以包括所述目标预测网络对应的第一网络损失值，和所述前景分割网络对应的第二网络损失值。

在一些例子中，所述第一网络损失值根据样本图像中的标注信息与所述样本候选边界框的信息得到。在一个示例中，目标对象的标注信息可以是目标对象的真实边界框的四个顶点的坐标，而预测得到的样本候选边界框的预测参数可以是候选边界框的长度、宽度、相对于水平的旋转角度、中心点的坐标。基于真实边界框的四个顶点的坐标，可以相应地计算出真实边界框的长度、宽度、相对于水平的旋转角度、中心点的坐标。因此，基于样本候选边界框的预测参数和真实边界框的真实参数，可以得到体现标注信息与预测信息之间的差异的第一网络损失值。

在一些例子中，所述第二网络损失值根据样本前景分割结果与真实的前景图像区域得到。基于预先标注的目标对象的真实边界框，可以获得在原始的样本图像中所标注的包含目标对象的区域，该区域中所包含的像素为真实的前景像素，为真实的前景图像区域。因此，基于样本前景分割结果与标注信息，也即通过预测的前景图像区域与真实的前景图像区域之间的比较，可以得到第二网络损失值。

在步骤605中，基于所述网络损失值，对所述目标检测网络的网络参数进行调整。

在一个示例中，可以通过梯度反向传播方法调整上述网络参数。

由于候选边界框的预测和前景图像区域的预测共享特征提取网络所提取的特征数据，通过两个分支的预测结果与标注的真实目标对象之间的差异来共同调整各个网络的参数，能够同时提供对象级的监督信息和像素级的监督信息，使特征提取网络所提取特征的质量得到提高。并且，本公开实施例用于预测候选边界框和前景图像的网络皆为one-stage检测器，能够实现较高的检测效率。

在一个示例中，可以基于所述多个样本候选边界框与所述样本图像标注的至少一个真实目标边界框之间的交并比，确定第一网络损失值。

在一个示例中，可以利用交并比的计算结果，从多个锚点框中选择正样本和/或负样本。例如，可以将与真实边界框的交并比大于一定数值，例如0.5，的锚点框，视为包含前景的候选边界框，将其作为正样本来训练目标检测网络；并且可以将与真实边界框的交并比小于一定数值，例如0.1，的锚点框，作为负样本来训练网络。基于所选择的正样本和/或负样本，确定第一网络损失值。

在计算第一网络损失值的过程中，由于目标对象长宽比悬殊，相关技术中计算得到的锚点框与真实边界框的交并比值可能较小，容易导致所选择的进行损失值计算的正样本变少，从而影响了训练精度。此外，本公开实施例采用的是带方向参数的锚点框，为了适应于该锚点框并提高交并比计算的准确性本公开提出了一种交并比计算方法，该方法可用于锚点框与真实边界框的交并比计算，也可用于候选边界框与真实边界框之间的交并比计算。

在该方法中，可以根据锚点框与真实边界框的外接圆面积的交集与并集的比值作为交并比。以下以图7为例进行说明。

边界框701和边界框702是长宽比悬殊、具有角度参数的矩形框，二者的长宽比例如为5。边界框701的外接圆为703，边界框702的外接圆为704，可以利用外接圆703和外接圆704面积的交集(图中阴影部分)与并集的比值，作为交并比。

对于锚点框与真实边界框的交并比计算，也可以采用其他方式，本公开实施例对此不做限定。

以上实施例中提出的计算交并比的方法，通过方向信息的约束，保留了更多在形状上类似但是方向上有差异的样本，提升了所选取的正样本的数量和比例，因此加强了对方向信息的监督与学习，进而提升了方向预测精度。

如下的描述中，将对目标检测网络的训练方法进行更详细的描述。其中，下文以检测的目标对象是船舰为例描述该训练方法。应当理解的是，本公开检测的目标对象不局限于船舰，也可以是其他长宽比较为悬殊的对象。

准备样本

在训练神经网络之前，首先可以先准备样本集，该样本集可以包括：用于训练目标检测网络的多个训练样本。

例如，可以按照下述方式获得训练样本。

在作为样本图像的遥感图像上，标注出船舰的真实边界框。在该遥感图像上，可能包括多个船舰，则需要标注出每一个船舰的真实边界框。同时，需要标注出每一个真实边界框的参数信息，例如该边界框的四个顶点的坐标。

在标注出船舰的真实边界框的同时，可以将该真实边界框内的像素确定为真实的前景像素，也即，标注船舰的真实边界框的同时也获得了船舰的真实前景图像。本领域技术人员应当理解，真实边界框内的像素也包括真实边界框本身所包括的像素。

确定目标检测网络结构

本公开一个实施例中，目标检测网络可以包括特征提取网络、以及分别与该特征提取网络级联的目标预测网络和前景分割网络。

其中，特征提取网络用于提取样本图像的特征，其可以是卷积神经网络，例如可以采用已有的VGG(Visual Geometry Group)网络、ResNet、DenseNet等等，也可以采用其他的卷积神经网络结构。本申请对特征提取网络的具体结构不做限定，在一种可选的实现方式中，特征提取网络可以包括卷积层、激励层、池化层等网络单元，由上述网络单元按照一定方式堆叠而成。

目标预测网络用于预测目标对象的边界框，也即预测生成候选边界框的预测信息。本申请对目标预测网络的具体结构不做限定，一种可选的实现方式中，目标预测网络可以包括卷积层、分类层、回归层等网络单元，由上述网络单元按照一定方式堆叠而成。

前景分割网络用于预测样本图像中的前景图像，也即预测包含目标对象的像素区域。本申请对前景分割网络的具体结构不做限定，一种可选的实现方式中，前景分割网络可以包括上采样层、掩膜(mask)层，由上述网络单元按照一定方式堆叠而成。

图8示出了本公开实施例可以应用的一种目标检测网络的网络结构，需要说明的是，图8仅是示例性示出了一种目标检测网络，实际实施中不局限于此。

如图8所示，目标提取网络包括特征提取网络810和分别与特征提取网络810级联的目标预测网络820和前景分割网络830。

其中，特征提取网络810包括依次连接的第一卷积层(C1)811、第一池化层(P1)812、第二卷积层(C2)813、第二池化层(P2)814和第三卷积层(C3)815，也即，在特征提取网络810中，卷积层和池化层交替连接在一起。卷积层可以通过多个卷积核分别提取图像中的不同特征，得到多幅特征图，池化层位于卷积层之后，可以对特征图的数据进行局部平均和降采样的操作，降低特征数据的分辨率。随着卷积层和池化层数量的增加，特征图的数目逐渐增多，并且特征图的分辨率逐渐降低。

特征提取网络810输出的多通道的特征数据分别输入至目标预测网络820和前景分割网络830。

目标预测网络820包括第四卷积层(C4)821、分类层822和回归层823。其中，分类层822和回归层823分别与第四卷积层821级联。

第四卷积层821利用滑动窗口(例如，3*3)对输入的特征数据进行卷积，每个窗口对应多个锚点框，每个窗口产生一个用于与分类层823和回归层824全连接的向量。此处还可以使用二个或多个卷积层，对输入的特征数据进行卷积。

分类层822用于判断锚点框所生成的边界框内是前景还是背景，回归层823用于得出候选边界框的大致位置，基于分类层822和回归层823的输出结果，可以预测出包含目标对象的候选边界框，并且输出该候选边界框内为前景、背景的概率以及该候选边界框的参数。

前景分割网络830包括上采样层831和掩膜层832。上采样层831用于将输入的特征数据转换为原始的样本图像大小；掩膜层832用于生成前景的二进制掩膜，即对于前景像素输出1，对于背景像素输出0。

此外，在计算候选边界框与前景图像区域重叠区域时，可以由第四卷积层821和掩膜层832进行图像尺寸的转换，使特征位置得到对应，即目标预测网络820和前景分割网络830的输出可以预测图像上同一位置的信息，进而计算重叠区域。

在训练该目标检测网络之前，可以设定一些网络参数，例如，可以设定特征提取网络810中每一个卷积层以及目标预测网络中卷积层使用的卷积核的数量，还可以设定卷积核的尺寸大小，等。而对于卷积核的取值、其他层的权重等参数值，可以通过迭代训练进行自学习。

在准备了训练样本和初始化目标检测网络结构的基础上，可以开始进行目标检测网络的训练。以下将列举目标检测网络的具体训练方法。

训练目标检测网络一

在一些实施例中，目标检测网络的结构可以参见图8所示。

参见图9的示例，输入目标检测网络的样本图像可以是包含船舰图像的遥感图像。并且在该样本图像上，标注出了所包含的船舰的真实边界框，标注信息可以是真实边界框的参数信息，例如该边界框的四个顶点的坐标。

输入的样本图像首先通过特征提取网络，提取样本图像的特征，输出该样本图像的多通道特征数据。输出特征数据的大小和通道数目由特征提取网络的卷积层结构和池化层结构确定。

该多通道特征数据一方面进入目标预测网络，目标预测网络基于当前的网络参数设置，基于输入的特征数据预测包含船舰的候选边界框，并生成该候选边界框的预测信息。该预测信息可以包括该边界框为前景、背景的概率，以及该边界框的参数信息，例如，该边界框的尺寸、位置、角度等。基于预先标注的目标对象的标注信息和预测得到的候选边界框的预测信息，可以得到第一网络损失函数的数值LOSS1，也即第一网络损失值。该第一网络损失函数的数值体现标注信息与预测信息之间的差异。

另一方面，该多通道特征数据进入前景分割网络，前景分割网络基于当前的网络参数设置，预测样本图像中包含船舰的前景图像区域。例如可以通过特征数据中每个像素为前景、背景的概率，通过将为前景概率大于设定值的像素都作为前景像素，进行像素分割，则可以得出预测的前景图像区域。

由于在样本图像中已经预先标注了船舰的真实边界框，通过该真实边界框的参数，例如四个顶点的坐标，可以得出样本图像中为前景的像素，即得知样本图像中的真实前景图像。基于预测的前景图像与通过标注信息得到的真实前景图像，可以得到第二网络损失函数的数值LOSS2，也即第二网络损失值。该第二网络损失函数的数值体现了预测的前景图像与标注信息之间的差异。

可以基于第一网络损失函数的数值和第二网络损失函数的数值共同确定的总损失值反向回传目标检测网络，以调整网络参数的取值，例如调整卷积核的取值、其他层的权重。在一个示例中，可以将第一网络损失函数和第二网络损失函数之和确定为总损失函数，利用总损失函数进行参数调整。

在训练目标检测网络时，可以将训练样本集分成多个图像子集(batch)，每个图像子集包括一个或多个训练样本。每次迭代训练时，向网络依次输入一个图像子集，结合该图像子集包括的训练样本中各个样本预测结果的损失值进行网络参数的调整。本次迭代训练完成后，向网络输入下一个图像子集，以进行下一次迭代训练。不同图像子集包括的训练样本至少部分不同。当达到预定结束条件时，则可以完成目标检测网络的训练。所述预定训练结束条件，例如可以是总损失值(LOSS值)降低到了一定阈值，或者达到了预定的目标检测网络迭代次数。

本实施的目标检测网络训练方法，由目标预测网络提供对象级的监督信息，通过像素分割网络提供像素级的监督信息，通过两种不同层次的监督信息，使特征提取网络所提取特征的质量得到提高，并且，利用one-stage的目标预测网络和像素分割网络进行检测，使检测效率得到了提高。

训练目标检测网络二

在一些实施例中，目标预测网络可以通过以下方式预测得到目标对象的候选边界框。目标预测网络的结构可以参见图8所示。

图10是预测候选边界框的方法的流程图，如图10所示，该流程可以包括以下步骤。

在步骤1001中，将所述特征数据的每一点作为锚点，以每一个锚点为中心构造多个锚点框。

例如，对于大小为[H×W]的特征层，共构造H×W×k个锚点框，其中，k是在每一个锚点生成的锚点框的个数。其中，对在一个锚点构造的多个锚点框设置不同的长宽比，以能够覆盖待检测的目标对象。首先，可以基于先验知识，例如统计大部分目标的尺寸分布，通过超参数设置直接生成先验锚点框，然后通过特征预测出锚点框。

在步骤1002中，将所述锚点映射回所述样本图像，得到每个锚点框在所述样本图像上包含的区域。

在本步骤中，将所有锚点映射回样本图像，也即将特征数据映射回样本图像，则可以得到以锚点为中心所生成的锚点框在样本图像中所框的区域。可以通过先验锚点框、预测值并结合当前的特征分辨率共同进行计算，将锚点框映射回样本图像的位置和大小，得到每个锚点框在样本图像上包含的区域。

以上过程相当于用一个卷积核(滑动窗口)在输入的特征数据上进行滑动操作，当卷积核滑动到特征数据的某一个位置时，以当前滑动窗口中心为中心映射回样本图像的一个区域，以样本图像上这个区域的中心即是对应的锚点，再以锚点为中心框出锚点框。也就是说，虽然锚点是基于特征数据定义的，但最终其是相对于原始的样本图像的。

对于图8所示的目标预测网络结构，可以通过第四卷积层821来实现提取特征的过程，第四卷积层821的卷积核例如可以是3×3大小。

在步骤1003中，基于映射回样本图像的锚点框与真实边界框的交并比确定前景锚点框，并获得所述前景锚点框内为前景、背景的概率。

在本步骤中，通过比较锚点框在所述样本图像上包含的区域与真实边界框的重叠情况来确定哪些锚点框内是前景，那些锚点框内是背景，也即给每一个锚点框都打上前景或背景的标签(label)，具有前景标签的锚点框即为前景锚点框，具有背景标签的锚点框即为背景锚点框。

在一个示例中，可以将与真实边界框的交并比大于第一设定值，例如0.5，的锚点框，视为包含前景的候选边界框。并且，还可以通过对锚点框进行二分类，确定锚点框内为前景、背景的概率。

可以利用前景锚点框来训练目标检测网络，例如将其作为正样本来训练网络，使这些前景锚点框参与损失函数的计算，而这一部分的损失通常被称为分类损失，其是基于前景锚点框的二分类概率与前景锚点框的标签进行比较得到的。

对于一个图像子集，可以使其包含从一张样本图像中随机提取的多个标签为前景的锚点框，例如256个，作为正样本用于训练。

在一个示例中，在正样本数量不足的情况下，还可以利用负样本来训练目标检测网络。负样本例如可以是与真实边界框的交并比小于第二设定值，例如0.1，的锚点框。

在该示例中，可以使一个图像子集包含从一张样本图像中随机提取的256个锚点框，其中128个标签为前景的锚点框，作为正样本，另外128个是与真实边界框的交并比小于第二设定值，例如0.1，的锚点框，作为负样本，使正负样本的比例达到1:1。如果一个图像中的正样本数小于128，则可以多用一些负样本以满足256个锚点框用于训练。

在步骤1004中，对所述前景锚点框进行边界框回归，得到候选边界框，并获得所述候选边界框的参数。

在本步骤中，前景锚点框、候选边界框的参数类型与锚点框的参数类型是一致的，也即，所构造的锚点框包含哪些参数，所生成的候选边界框也包含哪些参数。

在步骤1003中所获得的前景锚点框，由于长宽比可能与样本图像中的船舰的长宽比有差距，并且前景锚点框的位置、角度也可能与样本船舰有差距，因此，需要利用前景锚点框和与其对应的真实边界框之间的偏移量进行回归训练，使得目标预测网络具备通过前景点框预测其到候选边界框的偏移量的能力，从而获得候选边界框的参数。

通过步骤1003和步骤1004，可以获得候选边界框的信息：候选边界框内为前景、背景的概率，以及候选边界框的参数。基于上述候选边界框的信息，以及样本图像中的标注信息(目标对象对应的真实边界框)，可以得到第一网络损失。

在本公开实施例中，目标预测网络为one stage网络，在第一次预测得到候选边界框后，即输出候选边界框的预测结果，提高了网络的检测效率。

训练目标检测网络三

相关技术中，每一个锚点所对应的锚点框的参数通常包括长度、宽度和中心点的坐标。在本实例中，提出了一种旋转锚点框设置方法。

在一个示例中，以每一个锚点为中心构造多个方向的锚点框，并且可以设置多种长宽比，以覆盖待检测的目标对象。具体的方向个数以及长宽比的数值可以根据实际需求进行设置。如图11所示，所构造的锚点框对应6个方向，其中，w表示锚点框的宽度，l表示锚点框的长度，θ表示锚点框的角度(锚点框相对于水平的旋转角度)，(x,y)表示锚点框中心点的坐标。对应于方向上均匀分布的6个锚点框，θ分别为0°、30°、60°、90°、-30°、-60°。相应地，在该示例中，锚点框的参数可以表示为(x,y,w,l,θ)。其中，长宽比例可以设置为1、3、5，也可以针对检测的目标对象设置为其他数值。

在一些实施例中，候选边界框的参数也同样可以表示为(x,y,w,l,θ)，该参数可以利用图8中的回归层823进行回归计算。回归计算的方法如下。

首先，计算得到前景锚点框到真实边界框的偏移量。

例如，前景锚点框的参数值为[A _x,A _y,A _w,A _l,A _θ]，其中，A _x,A _y,A _w,A _l,A _θ分别表示前景锚点框的中心点x坐标、中心点y坐标、宽度、长度、角度；对应真实边界框的五个值为[G _x,G _y,G _w,G _l,G _θ]，其中，G _x,G _y,G _w,G _l,G _θ分别表示真实边界框的中心点x坐标、中心点y坐标、宽度、长度、角度

基于前景锚点框的参数值和真实边界框的值可以确定前景锚点框与真实边界框之间的偏移量[d _x(A),d _y(A),d _w(A),d _l(A),d _θ(A)]，其中，dx(A),dy(A),dw(A),dl(A),dθ(A)分别表示中心点x坐标、中心点y坐标、宽度、长度、角度的偏移量。各个偏移量例如可以分别通过公式(4)-(8)进行计算：

d _x(A)＝(G _x-A _x)/A _w (4)

d _y(A)＝(G _y-A _y)/A _l (5)

d _w(A)＝log(G _w/A _w) (6)

d _l(A)＝log(G _l/A _l) (7)

d _θ(A)＝G _θ-A _θ (8)

其中，公式(6)和公式(7)采用对数来表示长和宽的偏移，是为了在差别大时能快速收敛。

在一个示例中，在输入的多通道特征数据中有多个真实边界框的情况下，每个前景锚点框选择与它重叠度最高的真实边界框来计算偏移量。

接下来，得到前景锚点框到候选边界框的偏移量。

此处为寻找表达式建立锚点框与真实边界框的关系的过程，可以使用回归来实现。以图8中的网络结构为例，可以利用上述偏移量训练回归层823。在完成训练后，目标预测网络具备了识别每一个锚点框到与之对应的最优候选边界框的偏移量[d _x’(A),d _y’(A),d _w’(A),d _l’(A),d _θ’(A)]的能力，也就是说，基于锚点框的参数值即可以确定候选边界框的参数值，包括中心点x坐标、中心点y坐标、宽度、长度、角度。在训练时，可以利用回归层先算出前景锚点框到候选边界框的偏移量。由于训练时网络参数的优化还没有完成，所以该偏移量可能和实际的偏移量[d _x(A),d _y(A),d _w(A),d _l(A),d _θ(A)]的差距较大。

最后，基于所述偏移量对所述前景锚点框进行偏移，得到所述候选边界框，并获得所述候选边界框的参数。

在计算第一网络损失函数的数值时，可以利用前景锚点框到候选边界框的偏移量[d _x’(A),d _y’(A),d _w’(A),d _l’(A),d _θ’(A)]与训练时前景锚点框与真实边界框的偏移量[d _x(A),d _y(A),d _w(A),d _l(A),d _θ(A)]来计算回归损失。

前述预测的前景锚点框内为前景、背景的概率，在对该前景锚点框进行回归得到候选边界框后，该概率即为候选边界框内为前景、背景的概率，基于该概率则可以确定预测候选边界框内为前景、背景的分类损失。该分类损失与预测候选边界框的参数的回归损失之和，组成了第一网络损失函数的数值。对于一个图像子集，可以基于所有候选边界框的第一网络损失函数的数值，进行网络参数的调整。

通过设置具有方向的锚点框，可以生成更符合目标对象位姿的外接矩形边界框，使边界框之间的重叠部分的计算更加严格与精确。

训练目标检测网络四

在基于标准信息与候选边界框的信息得到第一网络损失函数的数值时，可以设置锚点框的各个参数的权重比例，使宽度的权重比例高于其他参数的权重比例，并根据设置的权重比例，计算第一网络损失函数的数值。

权重比例越高的参数，对于最终计算得到的损失函数值贡献越大，在进行网络参数调整时，会更注重调整的结果对该参数值的影响，从而使得该参数的计算精度高于其他参数。对于长宽比悬殊的目标对象，例如船舰，其宽度相较于长度来说非常小，因此将宽度的权重设置为高于其他参数的权重，可以提高宽度的预测精度。

训练目标检测网络五

在一些实施例中，可以通过以下方式预测得到样本图像中的前景图像区域。前景分割网络的结构可以参见图8所示。

图12是预测前景图像区域方法的实施例流程图，如图12所示，该流程可以包括如下步骤。

在步骤1201中，对所述特征数据进行上采样处理，以使处理后的特征数据的大小与样本图像的大小相同。

例如，可以通过反卷积层，或者双线性差值对特征数据进行上采样处理，将特征数据放大回样本图像大小。由于输入像素分割网络的是多通道特征数据，在经过上采样处理后，得到的是相应通道数目的、与样本图像大小一致的特征数据。特征数据上的每个位置都与原始图像位置一一对应。

在步骤1202中，基于所述处理后的所述特征数据进行像素分割，获得所述样本图像的样本前景分割结果。

对于特征数据的每个像素，可以判断出其属于前景、背景的概率。可以通过设定阈值，将属于前景的概率大于设定阈值的像素确定为前景像素，则对于每个像素都能够生成掩膜信息，通常可以用0、1表示，其中可以用0表示背景，1表示前景。基于该掩膜信息，可以确定为前景的像素，从而得到了像素级的前景分割结果。由于特征数据上的每个像素都与样本图像上的区域相对应，而样本图像中已经标注出了目标对象的真实边界框，因此根据标注信息，确定每个像素的分类结果与真实边界框的差异，得到分类损失。

由于该像素分割网络不涉及边界框的位置确定，因此其所对应的第二网络损失函数的数值，可以通过每个像素的分类损失之和确定。通过不断地调整网络参数，使得第二网络损失值达到最小，可以使得每个像素的分类更加准确，从而更准确地确定目标对象的前景图像。

在一些实施例中，通过对特征数据进行上采样处理，以及对于每个像素生成掩膜信息，可以得到像素级的前景图像区域，使目标检测的精确度得到了提高。

图13提供了一种目标检测装置，如图13所示，该装置可以包括：特征提取单元1301、目标预测单元1302、前景分割单元1303和目标确定单元1304。

特征提取单元1301，用于获得输入图像的特征数据。

目标预测单元1302，用于根据所述特征数据，确定所述输入图像的多个候选边界框。

前景分割单元1303，用于根据所述特征数据，获得所述输入图像的前景分割结果，其中，前景分割结果包含指示所述输入图像的多个像素中每个像素是否属于前景的指示信息。

目标确定单元1304，用于根据所述多个候选边界框与所述前景分割结果，得到所述输入图像的目标检测结果。

在另一个实施例中，所述目标确定单元1304具体用于：根据所述多个候选边界框中每个候选边界框与所述前景分割结果对应的前景图像区域之间的重叠区域，从多个候选边界框中选取至少一个目标边界框；基于所述至少一个目标边界框，得到所述输入图像的目标检测结果。

在另一个实施例中，所述目标确定单元1304在用于所述根据所述多个候选边界框中每个候选边界框与所述前景分割结果对应的前景图像区域之间的重叠区域，从多个候选边界框中选取至少一个目标边界框时，具体用于：对于所述多个候选边界框中每个候选边界框，若该候选边界框与对应的前景图像区域之间的重叠区域在该候选边界框中所占的比例大于第一阈值，则将该候选边界框作为所述目标边界框。

在另一个实施例中，所述至少一个目标边界框包括第一边界框和第二边界框，所述目标确定单元1304在用于基于所述至少一个目标边界框，得到所述输入图像的目标检测结果时，具体用于：基于所述第一边界框和所述第二边界框之间的夹角，确定所述第一边界框和所述第二边界框的重叠参数；基于所述第一边界框和所述第二边界框的重叠参数，确定所述第一边界框和所述第二边界框所对应的目标对象位置。

在另一个实施例中，所述目标确定单元1304在用于基于所述第一边界框和所述第二边界框之间的夹角，确定所述第一边界框和所述第二边界框的重叠参数时，具体用于：根据所述第一边界框和所述第二边界框之间的夹角，获得角度因子；根据所述第一边界框和所述第二边界框之间的交并比和所述角度因子，获得所述重叠参数。

在另一个实施例中，所述第一边界框和所述第二边界框的重叠参数为所述交并比与所述角度因子的乘积，其中，所述角度因子随着所述第一边界框和所述第二边界框之间的角度的增大而增大。

在另一个实施例中，在所述交并比保持一定的条件下，所述第一边界框和所述第二边界框的重叠参数随着所述第一边界框和所述第二边界框之间的角度的增大而增大。

在另一个实施例中，所述基于所述第一边界框和所述第二边界框的重叠参数，确定所述第一边界框和所述第二边界框所对应的目标对象位置，包括：在所述第一边界框和所述第二边界框的重叠参数大于第二阈值的情况下，将所述第一边界框和所述第二边界框中的其中一个边界框作为目标对象位置。

在另一个实施例中，将所述第一边界框和所述第二边界框中的其中一个边界框作为目标对象位置，包括：确定所述第一边界框与所述前景分割结果对应的前景图像区域之间的重叠参数和所述第二边界框与所述前景图像区域之间的重叠参数；将所述第一边界框和所述第二边界框中与所述前景图像区域之间的重叠参数较大的边界框作为目标对象位置。

在另一个实施例中，所述基于所述第一边界框和所述第二边界框的重叠参数，确定所述第一边界框和所述第二边界框所对应的目标对象位置，包括：在所述第一边界框和所述第二边界框的重叠参数小于或等于第二阈值的情况下，将所述第一边界框和第二边界框均作为目标对象位置。

在另一个实施例中，所述输入图像中待检测的目标对象的长宽比大于特定数值。

图14提供了一种目标检测网络的训练装置，所述目标检测网络包括特征提取网络、目标预测网络和前景分割网络。如图14所示，该装置可以包括：特征提取单元1401、目标预测单元1402、前景分割单元1403、损失值确定单元1404和参数调整单元1405。

特征提取单元1401，用于通过所述特征提取网络对样本图像进行特征提取处理，获得所述样本图像的特征数据。

目标预测单元1402，用于根据所述特征数据，通过所述目标预测网络获得多个样本候选边界框。

前景分割单元1403，用于根据所述特征数据，通过所述前景分割网络获得所述样本图像的样本前景分割结果，其中，所述样本前景分割结果包含指示所述样本图像的多个像素点中每个像素点是否属于前景的指示信息。

损失值确定单元1404，用于根据所述多个样本候选边界框和所述样本前景分割结果以及所述样本图像的标注信息，确定网络损失值。

参数调整单元1405，用于基于所述网络损失值，对所述目标检测网络的网络参数进行调整。

在另一个实施例中，所述标注信息包括所述样本图像包含的至少一个目标对象的真实边界框，所述损失值确定单元1404具体用于：对于所述多个候选边界框中的每个候选边界框，确定该候选边界框与所述样本图像标注的至少一个真实目标边界框中的每个真实目标边界框之间的交并比；根据确定的所述多个候选边界框中每个候选边界框的所述交并比，确定第一网络损失值。

在另一个实施例中，所述候选边界框和所述真实目标边界框之间的交并比是基于包含所述候选边界框与所述真实目标边界框的外接圆得到的。

在另一个实施例中，在确定所述网络损失值的过程中，所述候选边界框的宽度所对应的权重高于所述候选边界框的长度所对应的权重。

在另一个实施例中，所述前景分割单元1403具体用于：对所述特征数据进行上采样处理，以使得处理后的所述特征数据的大小与样本图像的大小相同；基于所述处理后的所述特征数据进行像素分割，获得所述样本图像的样本前景分割结果。

在另一个实施例中，所述样本图像包含的目标对象的长宽比高于设定值。

图15为本公开至少一个实施例提供的目标检测设备，所述设备包括存储器1501、处理器1502，所述存储器用于存储可在处理器上运行的计算机指令，所述处理器用于在执行所述计算机指令时实现本说明书任一实施例所述的目标检测方法。所述设备还可能包括网络接口1503及内部总线1504。存储器1501、处理器1502和网络接口1503通过内部总线1504进行相互之间的通信。

图16为本公开至少一个实施例提供的目标检测网络的训练设备，所述设备包括存储器1601、处理器1602，所述存储器用于存储可在处理器上运行的计算机指令，所述处理器用于在执行所述计算机指令时实现本说明书任一实施例所述的目标检测网络的训练方法。所述设备还可能包括网络接口1603及内部总线1604。存储器1601、处理器1602和网络接口1603通过内部总线1604进行相互之间的通信。

本说明书至少一个实施例还提供了一种非易失性计算机可读存储介质，其上存储有计算机程序，所述程序被处理器执行时实现本说明书任一实施例所述的目标检测方法，和/或，实现本说明书任一实施例所述的目标检测网络的训练方法。

在本申请实施例中，计算机可读存储介质可以是多种形式，比如，在不同的例子中，所述机器可读存储介质可以是：非易失性存储器、闪存、存储驱动器(如硬盘驱动器)、固态硬盘、任何类型的存储盘(如光盘、DVD等)，或者类似的存储介质，或者它们的组合。特殊的，所述的计算机可读介质还可以是纸张或者其他合适的能够打印程序的介质。使用这些介质，这些程序可以被通过电学的方式获取到(例如，光学扫描)、可以被以合适的方式编译、解释和处理，然后可以被存储到计算机介质中。

以上所述仅为本申请的较佳实施例而已，并不用以限制本申请，凡在本申请的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本申请保护的范围之内。

Claims

一种目标检测方法，其特征在于，所述方法包括：

获得输入图像的特征数据；

根据所述特征数据，确定所述输入图像的多个候选边界框；

根据所述特征数据，获得所述输入图像的前景分割结果，其中，前景分割结果包含指示所述输入图像的多个像素中每个像素是否属于前景的指示信息；

根据所述多个候选边界框与所述前景分割结果，得到所述输入图像的目标检测结果。
根据权利要求1所述的方法，其特征在于，所述根据所述多个候选边界框与所述前景分割结果，得到所述输入图像的目标检测结果，包括：

根据所述多个候选边界框中每个候选边界框与所述前景分割结果对应的前景图像区域之间的重叠区域，从多个候选边界框中选取至少一个目标边界框；

基于所述至少一个目标边界框，得到所述输入图像的目标检测结果。
根据权利要求2所述的方法，其特征在于，所述根据所述多个候选边界框中每个候选边界框与所述前景分割结果对应的前景图像区域之间的重叠区域，从多个候选边界框中选取至少一个目标边界框，包括：

对于所述多个候选边界框中每个候选边界框，若该候选边界框与对应的前景图像区域之间的重叠区域在该候选边界框中所占的比例大于第一阈值，则将该候选边界框作为所述目标边界框。
根据权利要求2或3所述的方法，其特征在于，所述至少一个目标边界框包括第一边界框和第二边界框，所述基于所述至少一个目标边界框，得到所述输入图像的目标检测结果，包括：

基于所述第一边界框和所述第二边界框之间的夹角，确定所述第一边界框和所述第二边界框的重叠参数；

基于所述第一边界框和所述第二边界框的重叠参数，确定所述第一边界框和所述第二边界框所对应的目标对象位置。
根据权利要求4所述的方法，其特征在于，所述基于所述第一边界框和所述第二边界框之间的夹角，确定所述第一边界框和所述第二边界框的重叠参数，包括：

根据所述第一边界框和所述第二边界框之间的夹角，获得角度因子；

根据所述第一边界框和所述第二边界框之间的交并比和所述角度因子，获得所述重叠参数。
根据权利要求5所述的方法，其特征在于，所述第一边界框和所述第二边界框的重叠参数为所述交并比与所述角度因子的乘积，其中，所述角度因子随着所述第一边界框和所述第二边界框之间的角度的增大而增大。
根据权利要求5或6所述的方法，其特征在于，在所述交并比保持一定的条件下，所述第一边界框和所述第二边界框的重叠参数随着所述第一边界框和所述第二边界框之间的角度的增大而增大。
根据权利要求4至7中任一项所述的方法，其特征在于，所述基于所述第一边界框和所述第二边界框的重叠参数，确定所述第一边界框和所述第二边界框所对应的目标对象位置，包括：

在所述第一边界框和所述第二边界框的重叠参数大于第二阈值的情况下，将所述第一边界框和所述第二边界框中的其中一个边界框作为所述目标对象位置。
根据权利要求8所述的方法，其特征在于，所述将所述第一边界框和所述第二边界框中的其中一个边界框作为所述目标对象位置，包括：

确定所述第一边界框与所述前景分割结果对应的前景图像区域之间的重叠参数和所述第二边界框与所述前景图像区域之间的重叠参数；

将所述第一边界框和所述第二边界框中与所述前景图像区域之间的重叠参数较大的边界框作为所述目标对象位置。
根据权利要求4至9中任一项所述的方法，其特征在于，所述基于所述第一边界框和所述第二边界框的重叠参数，确定所述第一边界框和所述第二边界框所对应的目标对象位置，包括：

在所述第一边界框和所述第二边界框的重叠参数小于或等于第二阈值的情况下，将所述第一边界框和所述第二边界框均作为所述目标对象位置。
根据权利要求1至10中任一项所述的方法，其特征在于，所述输入图像中待检测的目标对象的长宽比大于特定数值。
一种目标检测网络的训练方法，其特征在于，所述目标检测网络包括特征提取网络、目标预测网络和前景分割网络，所述方法包括：

通过所述特征提取网络对样本图像进行特征提取处理，获得所述样本图像的特征数据；

根据所述特征数据，通过所述目标预测网络获得多个样本候选边界框；

根据所述特征数据，通过所述前景分割网络获得所述样本图像的样本前景分割结果，其中，所述样本前景分割结果包含指示所述样本图像的多个像素点中每个像素点是否属于前景的指示信息；

根据所述多个样本候选边界框和所述样本前景分割结果以及所述样本图像的标注信息，确定网络损失值；

基于所述网络损失值，对所述目标检测网络的网络参数进行调整。
根据权利要求12所述的方法，其特征在于，所述标注信息包括所述样本图像包含的至少一个目标对象的真实边界框，所述根据所述多个样本候选边界框和所述样本前景图像区域以及所述样本图像的标注信息，确定网络损失值，包括：

对于所述多个候选边界框中的每个候选边界框，确定该候选边界框与所述样本图像标注的至少一个真实目标边界框中的每个真实目标边界框之间的交并比；

根据确定的所述多个候选边界框中每个候选边界框的所述交并比，确定第一网络损失值。
根据权利要求13所述的方法，其特征在于，所述候选边界框和所述真实目标边界框之间的交并比是基于包含所述候选边界框与所述真实目标边界框的外接圆得到的。
根据权利要求12至14中任一项所述的方法，其特征在于，在确定所述网络损失值的过程中，所述候选边界框的宽度所对应的权重高于所述候选边界框的长度所对应的权重。
根据权利要求12至15中任一项所述的方法，其特征在于，所述根据所述特征数据，通过所述前景分割网络获得所述样本图像的样本前景分割结果，包括：

对所述特征数据进行上采样处理，以使得处理后的所述特征数据的大小与样本图像的大小相同；

基于所述处理后的所述特征数据进行像素分割，获得所述样本图像的样本前景分割结果。
根据权利要求12-16中任一项所述的方法，其特征在于，所述样本图像包含的目标对象的长宽比高于设定值。
一种目标检测装置，其特征在于，所述装置包括：

特征提取单元，用于获得输入图像的特征数据；

目标预测单元，用于根据所述特征数据，确定所述输入图像的多个候选边界框；

前景分割单元，用于根据所述特征数据，获得所述输入图像的前景分割结果，其中，前景分割结果包含指示所述输入图像的多个像素中每个像素是否属于前景的指示信息；

目标确定单元，用于根据所述多个候选边界框与所述前景分割结果，得到所述输入图像的目标检测结果。
根据权利要求18所述的装置，其特征在于，所述目标确定单元具体用于：

根据所述多个候选边界框中每个候选边界框与所述前景分割结果对应的前景图像区域之间的重叠区域，从多个候选边界框中选取至少一个目标边界框；

基于所述至少一个目标边界框，得到所述输入图像的目标检测结果。
根据权利要求19所述的装置，其特征在于，所述目标确定单元在用于所述根据所述多个候选边界框中每个候选边界框与所述前景分割结果对应的前景图像区域之间的重叠区域，从多个候选边界框中选取至少一个目标边界框时，具体用于：

对于所述多个候选边界框中每个候选边界框，若该候选边界框与对应的前景图像区域之间的重叠区域在该候选边界框中所占的比例大于第一阈值，则将该候选边界框作为所述目标边界框。
根据权利要求19或20所述的装置，其特征在于，所述至少一个目标边界框包括第一边界框和第二边界框，所述目标确定单元在用于基于所述至少一个目标边界框，得到所述输入图像的目标检测结果时，具体用于：

基于所述第一边界框和所述第二边界框之间的夹角，确定所述第一边界框和所述第二边界框的重叠参数；

基于所述第一边界框和所述第二边界框的重叠参数，确定所述第一边界框和所述第二边界框所对应的目标对象位置。
根据权利要求21所述的装置，其特征在于，所述目标确定单元在用于基于所述第一边界框和所述第二边界框之间的夹角，确定所述第一边界框和所述第二边界框的重叠参数时，具体用于：

根据所述第一边界框和所述第二边界框之间的夹角，获得角度因子；

根据所述第一边界框和所述第二边界框之间的交并比和所述角度因子，获得所述重叠参数。
根据权利要求22所述的装置，其特征在于，所述第一边界框和所述第二边界框的重叠参数为所述交并比与所述角度因子的乘积，其中，所述角度因子随着所述第一边界框和所述第二边界框之间的角度的增大而增大。
根据权利要求22或23所述的装置，其特征在于，在所述交并比保持一定的条件下，所述第一边界框和所述第二边界框的重叠参数随着所述第一边界框和所述第二边界框之间的角度的增大而增大。
根据权利要求21至24中任一项所述的装置，其特征在于，所述基于所述第一边界框和所述第二边界框的重叠参数，确定所述第一边界框和所述第二边界框所对应的目标对象位置，包括：

在所述第一边界框和所述第二边界框的重叠参数大于第二阈值的情况下，将所述第一边界框和所述第二边界框中的其中一个边界框作为所述目标对象位置。
根据权利要求25所述的装置，其特征在于，将所述第一边界框和所述第二边界框中的其中一个边界框作为所述目标对象位置，包括：

确定所述第一边界框与所述前景分割结果对应的前景图像区域之间的重叠参数和所述第二边界框与所述前景图像区域之间的重叠参数；

将所述第一边界框和所述第二边界框中与所述前景图像区域之间的重叠参数较大的边界框作为所述目标对象位置。
根据权利要求21至26中任一项所述的装置，其特征在于，所述基于所述第一边界框和所述第二边界框的重叠参数，确定所述第一边界框和所述第二边界框所对应的目标对象位置，包括：

在所述第一边界框和所述第二边界框的重叠参数小于或等于第二阈值的情况下，将所述第一边界框和所述第二边界框均作为所述目标对象位置。
根据权利要求18至27中任一项所述的装置，其特征在于，所述输入图像中待检测的目标对象的长宽比大于特定数值。
一种目标检测网络的训练装置，其特征在于，所述目标检测网络包括特征提取网络、目标预测网络和前景分割网络，所述装置包括：

特征提取单元，用于通过所述特征提取网络对样本图像进行特征提取处理，获得所述样本图像的特征数据；

目标预测单元，用于根据所述特征数据，通过所述目标预测网络获得多个样本候选边界框；

前景分割单元，用于根据所述特征数据，通过所述前景分割网络获得所述样本图像的样本前景分割结果，其中，所述样本前景分割结果包含指示所述样本图像的多个像素点中每个像素点是否属于前景的指示信息；

损失值确定单元，用于根据所述多个样本候选边界框和所述样本前景分割结果以及所述样本图像的标注信息，确定网络损失值；

参数调整单元，用于基于所述网络损失值，对所述目标检测网络的网络参数进行调整。
根据权利要求29所述的装置，其特征在于，所述标注信息包括所述样本图像包含的至少一个目标对象的真实边界框，所述损失值确定单元具体用于：

对于所述多个候选边界框中的每个候选边界框，确定该候选边界框与所述样本图像标注的至少一个真实目标边界框中的每个真实目标边界框之间的交并比；

根据确定的所述多个候选边界框中每个候选边界框的所述交并比，确定第一网络损失值。
根据权利要求30所述的装置，其特征在于，所述候选边界框和所述真实目标边界框之间的交并比是基于包含所述候选边界框与所述真实目标边界框的外接圆得到的。
根据权利要求29至31中任一项所述的装置，其特征在于，在确定所述网络损失值的过程中，所述候选边界框的宽度所对应的权重高于所述候选边界框的长度所对应的权重。
根据权利要求29至32中任一项所述的装置，其特征在于，所述前景分割单元具体用于：

对所述特征数据进行上采样处理，以使得处理后的所述特征数据的大小与样本图像的大小相同；

基于所述处理后的所述特征数据进行像素分割，获得所述样本图像的样本前景分割结果。
根据权利要求29-33中任一项所述的装置，其特征在于，所述样本图像包含的目标对象的长宽比高于设定值。
一种目标检测设备，其特征在于，所述设备包括存储器、处理器，所述存储器用于存储可在所述处理器上运行的计算机指令，所述处理器用于在执行所述计算机指令时实现权利要求1至11任一所述的方法。
一种目标检测网络的训练设备，其特征在于，所述设备包括存储器、处理器，所述存储器用于存储可在所述处理器上运行的计算机指令，所述处理器用于在执行所述计算机指令时实现权利要求12至17任一所述的方法。
一种非易失性计算机可读存储介质，其上存储有计算机程序，其特征在于，所述程序被处理器执行时，促使所述处理器实现权利要求1至11任一所述的方法，或实现权利要求12至17任一所述的方法。