WO2021218037A1

WO2021218037A1 - 目标检测方法、装置、计算机设备和存储介质

Info

Publication number: WO2021218037A1
Application number: PCT/CN2020/119710
Authority: WO
Inventors: 李楚; 陈泽; 陈岩; 王志成
Original assignee: 北京迈格威科技有限公司
Priority date: 2020-04-29
Filing date: 2020-09-30
Publication date: 2021-11-04
Also published as: CN111709415A; CN111709415B

Abstract

本公开涉及一种目标检测方法、装置、计算机设备和存储介质。该方法包括：对待检测图像进行特征提取，得到n组不同尺度的第一特征，其中，n为大于1的整数；将n组不同尺度的第一特征输入第一特征融合网络，第一特征融合网络包括n个特征融合层，在第n个特征融合层中，将第n组第一特征作为第n组第二特征；在第i-1个特征融合层中，获取第i组第二特征以及第i组第二特征对应的权重参数，将第i组第二特征与权重参数相乘，并将相乘得到的特征与第i-1组第一特征融合，得到第i-1组第二特征，直至得到第1组第二特征；将n组第二特征输入检测网络，得到待检测图像中目标的类别信息和位置信息。该方法有利于提高目标检测的准确性。

Description

目标检测方法、装置、计算机设备和存储介质

相关申请的交叉引用

本公开要求于2020年04月29日提交的申请号为202010356470.7、名称为“目标检测方法、装置、计算机设备和存储介质”的中国专利申请的优先权，该中国专利申请的全部内容通过引用全部并入本文。

技术领域

本公开涉及图像数据处理技术领域，特别是涉及一种目标检测方法、装置、计算机设备和存储介质。

背景技术

随着人工智能技术的发展，目标检测作为计算机视觉中最基本和首要的任务之一，广泛应用于工业界和日常生活的各个方面，例如自动驾驶、安防监控以及游戏娱乐等领域。

传统技术中，目标检测方法先通过对图像进行卷积处理，得到多个尺度的特征图；接下来，对每个尺度的特征图进行卷积处理和插值处理，并与上一尺度的特征图进行叠加，得到上一尺度融合后的特征图；接下来，将每个尺度融合后的特征图输入检测网络，得到目标检测结果。

然而，在很多复杂场景中，例如多尺度变化场景，由于图像中目标的尺度变化很大，在此情形下采用传统的目标检测方法进行目标检测时，检测的准确性较低。

发明内容

基于此，有必要针对上述技术问题，提供一种能够提高目标检测准确性的目标检测方法、装置、计算机设备和存储介质。

一种目标检测方法，所述方法包括：

对待检测图像进行特征提取，得到n组不同尺度的第一特征，其中，n为大于1的整数；

将所述n组不同尺度的第一特征输入第一特征融合网络，所述第一特征融合网络包括n个特征融合层，在第n个特征融合层中，将第n组第一特征作为第n组第二特征；

在第i-1个特征融合层中，获取第i组第二特征以及所述第i组第二特征对应的权重参数，将所述第i组第二特征与所述权重参数相乘，并将相乘得到的特征与第i-1组第一特征融合，得到第i-1组第二特征，直至得到第1组第二特征；

将n组第二特征输入检测网络，得到所述待检测图像中目标的类别信息和位置信息。

在其中一个实施例中，获取第i组第二特征对应的权重参数，包括：

对所述第i组第二特征进行全局平均池化，得到池化后的特征；

将所述池化后的特征输入全连接网络，得到所述第i组第二特征对应的权重参数。

在其中一个实施例中，将所述第i组第二特征与所述权重参数相乘，包括：

将所述第i组第二特征进行卷积运算，得到卷积后的特征；

将所述卷积后的特征与所述权重参数相乘，得到相乘后的特征。

在其中一个实施例中，在第i-1个特征融合层中，获取第i组第二特征以及所述第i组第二特征对应的权重参数，将所述第i组第二特征与所述权重参数相乘，并将相乘得到的特征与第i-1组第一特征融合，得到第i-1组第二特征，包括：

在第i-1个特征融合层中，获取第i组第二特征以及所述第i组第二特征对应的权重参数，将所述第i组第二特征与所述权重参数相乘，得到相乘后的特征；

对所述相乘后的特征进行上采样，得到上采样后的特征；

获取所述上采样后的特征对应的权重参数，将所述上采样后的特征与所述权重参数相乘，并将相乘得到的特征与第i-1组第一特征融合，得到第i-1组第二特征。

在其中一个实施例中，获取所述上采样后的特征对应的权重参数，包括：

对所述上采样后的特征进行全局平均池化，得到池化后的特征；

将所述池化后的特征输入全连接网络，得到所述上采样后的特征对应的权重参数。

在其中一个实施例中，在第n个特征融合层中，将第n组第一特征作为第n组第二特征，包括：

对所述第n组第一特征进行全局平局池化，得到池化后的特征；

将所述池化后的特征与所述第n组第一特征相加，得到第n组第二特征。

在其中一个实施例中，将n组第二特征输入检测网络，得到所述待检测图像中目标的类别信息和位置信息，包括：

将n组第二特征输入第二特征融合网络，所述第二特征融合网络包括n个特征融合层，在第1个特征融合层中，将第1组第二特征作为第1组第三特征；

在第i个特征融合层中，获取第i-1组第三特征，并将所述第i-1组第三特征与第i组第二特征融合，得到第i组第三特征，直至得到第n组第三特征；

将n组第三特征输入检测网络，得到所述待检测图像中目标的类别信息和位置信息。

将所述n组第二特征输入区域生成网络，得到初始候选框；

将所述初始候选框输入级联的检测网络，所述检测网络包括级联的m个检测子网络，将所述初始候选框在原始特征上进行感兴趣区域池化操作，并将池化后的特征输入第1级检测子网络，得到第1级的检测框及置信度；

对于第j-1级检测框，在原始特征上进行感兴趣区域池化操作，并将池化后的特征输入第j级检测子网络，得到第j级的检测框及置信度，直至得到第m级检测框及置信度作为最终结果；

对所述最终结果进行非极大值抑制，得到所述待检测图像中目标的类别信息和位置信息。

一种目标检测装置，所述装置包括：

特征提取模块，用于对待检测图像进行特征提取，得到n组不同尺度的第一特征，其中，n为大于1的整数；

特征融合模块，用于将所述n组不同尺度的第一特征输入第一特征融合网络，所述第一特征融合网络包括n个特征融合层，在第n个特征融合层中，将第n组第一特征作为第n组第二特征；

所述特征融合模块，还用于在第i-1个特征融合层中，获取第i组第二特征以及所述第i组第二特征对应的权重参数，将所述第i组第二特征与所述权重参数相乘，并将相乘得到的特征与第i-1组第一特征融合，得到第i-1组第二特征，直至得到第1组第二特征；

检测模块，用于将n组第二特征输入检测网络，得到所述待检测图像中目标的类别信息和位置信息。

一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现以下步骤：

对待检测图像进行特征提取，得到n组不同尺度的第一特征，其中，n为大于1 的整数；

一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现以下步骤：

上述目标检测方法、装置、计算机设备和存储介质，在对特征进行融合时，通过获取第二特征对应的权重参数，并将该第二特征与其对应的权重参数进行一系列运算，可实现对第二特征的取舍，以达到有选择地将第二特征与下一第一特征进行融合的效果，如此能够更加有效地结合不同尺度特征的特征信息，有利于提高目标检测的准确性。

附图说明

图1为一个实施例中目标检测方法的流程示意图；

图2为一个实施例中获取第i组第二特征对应的权重参数的补充方案的流程示意图；

图3为一个实施例中将第i组第二特征与权重参数相乘的补充方案的流程示意图；

图4为一个实施例中确定第i-1组第二特征的补充方案的流程示意图；

图5为一个实施例中获取上采样后的特征对应的权重参数的补充方案的流程示意图；

图6为一个实施例中将n组第二特征输入检测网络，得到待检测图像中目标的类别信息和位置信息的补充方案的流程示意图；

图7为一个实施例中目标检测装置的结构框图；

图8为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本公开的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本公开进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本公开，并不用于限定本公开。

在一示例性实施例中，以本公开涉及的目标检测方法应用于目标检测设备进行举例说明。其中，该目标检测设备可以是终端，也可以是服务器，还可以是包括终端和服务器的系统，并通过终端和服务器的交互实现。其中，终端可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备，服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一示例性实施例中，如图1所示，提供了一种目标检测方法，具体可以通过以下步骤实现：

步骤S202，对待检测图像进行特征提取，得到n组不同尺度的第一特征。

其中，n为大于1的整数。

具体地，将待检测图像输入目标检测设备中，目标检测设备对该待检测图像进行多次不同尺度的特征提取，得到n组不同尺度的第一特征。其中，第一特征可以由三维张量构成。不同尺度的第一特征包含有不同的特征信息，例如，一些第一特征图具有丰富的语义信息，而一些第一特征图具有丰富的空间信息。

可选地，目标检测设备可以采用神经网络的骨干网络来对待检测图像进行多尺度特征提取。可选地，神经网络可以为卷积神经网络，例如，采用VGG16，ResNet等网络提取待检测图像中的特征，得到多组不同尺度的第一特征。

步骤S204，将n组不同尺度的第一特征输入第一特征融合网络，该第一特征融合网络包括n个特征融合层，在第n个特征融合层中，将第n组第一特征作为第n组第二特征。

具体地，目标检测设备将得到的n组不同尺度的第一特征输入预设的第一特征融合网络，通过第一特征融合网络中包含的n个特征融合层进行特征融合。为了实现融合目的，首先目标检测设备需要将第n组第一特征作为第n组第二特征。可选地，第n组第二特征可以是第n组第一特征，也就是同一特征在不同功能下对应的不同术语。此外，第n组第二特征也可以是第n组第一特征进一步的处理得到，此时，第n组第二特征与第n组第一特征并非同一特征。

可选地，第n组第一特征通常为尺度最小的第一特征，那么在实现上，目标检测设备可以根据第一特征的尺度大小，将尺度最小的第一特征确定为第n组第一特征。

步骤S206，在第i-1个特征融合层中，获取第i组第二特征以及第i组第二特征对应的权重参数，将第i组第二特征与权重参数相乘，并将相乘得到的特征与第i-1组第一特征融合，得到第i-1组第二特征，直至得到第1组第二特征。

具体地，在本步骤中，采用从n至1的次序进行相邻特征的融合。在融合过程中，针对第i-1个特征融合层中，需要融合的特征一方面来自第i组第二特征与第i组第二特征对应的权重参数的相乘得到的特征，另一方面来自第i-1组第一特征，在得到这两种特征数据后，在第i-1个特征融合层中完成该相乘得到的特征与第i-1组第一特征的融合过程，并得到第i-1组第二特征。以此类推，直到将第2组第二特征与第2组第二特征对应的权重参数的相乘得到的特征与第1组第一特征进行融合得到第1组第二特征。由此，本步骤涉及的特征融合过程完成。

可选地，目标检测设备将相乘得到的特征与第i-1组第一特征进行相加或拼接，得到第i-1组第二特征。

可选地，权重参数可以是预先设置的，也可以是根据各第二特征进一步处理得到的。需要提及，该权重参数主要是用于实现对各第二特征进行取舍，减少数据运算量并提高特征融合的有效性。比方说，当该权重参数为零或者负数时，通过将权重参数与第二特征进行相乘，由此通过判别乘积是否为正数即可实现对特征的取舍。

步骤S208，将n组第二特征输入检测网络，得到待检测图像中目标的类别信息和位置信息。

具体地，由上述实现步骤不难得出，特征融合之后会得到n组第二特征。接下来，目标检测设备将n组第二特征输入检测网络，得到待检测图像中目标的类别信息和位置信息。可选地，目标检测设备将n组第二特征输入Faster R-CNN网络或者Cascade RCNN的级联网络，最终输出待检测图像中目标的类别信息和位置信息。

上述目标检测方法中，在对特征进行融合时，通过获取第二特征对应的权重参数，并将该第二特征与其对应的权重参数进行一系列运算，可实现对第二特征的取舍，以达到有选择地将第二特征与下一第一特征进行融合的效果，如此能够更加有效地结合不同尺度特征的特征信息，有利于提高目标检测的准确性。

在一示例性实施例中，请参阅图2，获取第i组第二特征对应的权重参数，具体可以通过以下步骤实现：

S212，对第i组第二特征进行全局平均池化，得到池化后的特征；

S214，将池化后的特征输入全连接网络，得到第i组第二特征对应的权重参数。

具体地，为了增强权重参数与第二特征的关联性，提升特征取舍的准确性及有效性，在一示例中，目标检测设备对第i组第二特征进行降维，得到降维后的特征。接下来，目标检测设备将降维后的特征输入全连接网络，得到第i组第二特征对应的权重参数。可选地，目标检测设备对第i组第二特征进行池化操作，得到池化后的特征，即降维后的特征。进一步可选地，目标检测设备对第i组第二特征进行全局平均池化，得到池化后的特征。在另一实施例中，目标检测设备对第i组第二特征进行全局最大池化，得到池化后的特征。可见，获取第i组第二特征对应的权重参数的实现方式包括多种，本实施例不限于上述列举的实现方式。

本公开实施例中，对第二特征进行全局平均池化并经由全连接网络处理得到其对应的权重参数，可增强权重参数与第二特征的关联性，由此该权重参数能够更准确地对特征进行取舍。

在一示例性实施例中，请参阅图3，将第i组第二特征与权重参数相乘，具体可以通过以下步骤实现：

S222，将第i组第二特征进行卷积运算，得到卷积后的特征；

S224，将卷积后的特征与权重参数相乘，得到相乘后的特征。

具体地，目标检测设备对第i组第二特征进行卷积运算，得到卷积后的特征。接下来，目标检测设备将卷积后的特征与权重参数相乘，得到相乘后的特征。

本公开实施例中，采用相乘方式来对第二特征进行取舍，有利于提高特征取舍的准确性。

在一示例性实施例中，涉及在第i-1个特征融合层中，获取第i组第二特征以及第i 组第二特征对应的权重参数，将第i组第二特征与权重参数相乘，并将相乘得到的特征与第i-1组第一特征融合，得到第i-1组第二特征的一种可能的实现过程。在上述实施例的基础上，请参阅图4，步骤S206具体可以通过以下步骤实现：

S2062，在第i-1个特征融合层中，获取第i组第二特征以及第i组第二特征对应的权重参数，将第i组第二特征与权重参数相乘，得到相乘后的特征；

S2064，对相乘后的特征进行上采样，得到上采样后的特征；

S2066，获取上采样后的特征对应的权重参数，将上采样后的特征与权重参数相乘，并将相乘得到的特征与第i-1组第一特征融合，得到第i-1组第二特征。

具体地，考虑到各组第二特征的尺度是不同的，因此，为了提升特征融合时的方便性及准确性，目标检测设备在得到相乘后的特征后，对该相乘后的特征进行上采样，得到上采样后的特征，上采样的目的是将尺度较小的相乘后的特征变大至第i-1组第一特征的尺度大小，这样方便位置对应的特征进行融合。每次特征融合可看做是采用一种门结构(door)来控制可融合的特征，提升融合有效性。

本公开实施例中，采用一种门结构的方式来有选择地融合特征，从而基于融合后的特征进行目标检测，有利于提高目标检测的准确性。

在一示例性实施例中，请参阅图5，获取上采样后的特征对应的权重参数，具体可以通过以下步骤实现：

S206a，对上采样后的特征进行全局平均池化，得到池化后的特征；

S206b，将池化后的特征输入全连接网络，得到上采样后的特征对应的权重参数。

具体地，为了增强权重参数与上采样后的特征的关联性，提升特征取舍的准确性及有效性，在一示例中，目标检测设备对上采样后的特征进行降维，得到降维后的特征。接下来，目标检测设备将降维后的特征输入全连接网络，得到上采样后的特征对应的权重参数。可选地，目标检测设备对上采样后的特征进行池化操作，得到池化后的特征，即降维后的特征。进一步可选地，目标检测设备对上采样后的特征进行全局平均池化，得到池化后的特征。在另一实施例中，目标检测设备对上采样后的特征进行全局最大池化，得到池化后的特征。可见，获取上采样后的特征对应的权重参数的实现方式包括多种，本实施例不限于上述列举的实现方式。

本公开实施例中，对上采样后的特征进行全局平均池化并经由全连接网络处理得到其对应的权重参数，可增强权重参数与上采样后的特征的关联性，由此该权重参数能够更准确地对特征进行取舍。

在一示例性实施例中，在第n个特征融合层中，将第n组第一特征作为第n组第二特征，具体可以通过以下步骤实现：

步骤S232，对第n组第一特征进行全局平局池化，得到池化后的特征；

步骤S234，将池化后的特征与第n组第一特征相加，得到第n组第二特征。

具体地，以第n组第一特征为尺度最小的第一特征为例进行说明，目标检测设备对尺度最小的第一特征进行全局平局池化后，池化后的特征的维度变为N*C*1*1，其中N为批尺寸(batchsize)，C为通道数，再将该池化后的特征输入一个1*1卷积网络，变换通道数为256。接下来，目标检测设备利用广播机制(broadcast)使其变为N*256*H*W，即同一个H*W上的像素值相同，然后与尺度最小的第一特征相加，得到第二特征(第n组第二特征)。其中，相加的实现方式可以是：假设尺度最小的第一特征的维度为N*C*H*W，将其输入1*1卷积网络，可变换通道数为256，即维度变为N*256*H*W。此时将维度相同的第一特征与池化后的特征相加，得到第n组第二特征。

本公开实施例中，通过对第n组第一特征进行全局平局池化，可对整个网络在结构上做正则化处理以防止过拟合，有利于提高目标检测的准确性。

在一示例性实施例中，涉及将n组第二特征输入检测网络，得到待检测图像中目标的类别信息和位置信息的一种可能的实现过程。在上述实施例的基础上，请参阅图6，步骤S208具体可以通过以下步骤实现：

S2082，将n组第二特征输入第二特征融合网络，该第二特征融合网络包括n个特征融合层，在第1个特征融合层中，将第1组第二特征作为第1组第三特征；

S2084，在第i个特征融合层中，获取第i-1组第三特征，并将第i-1组第三特征与第i组第二特征融合，得到第i组第三特征，直至得到第n组第三特征；

S2086，将n组第三特征输入检测网络，得到待检测图像中目标的类别信息和位置信息。

具体地，目标检测设备将n组第二特征输入第二特征融合网络，该第二特征融合网络包括n个特征融合层，在第1个特征融合层中，将第1组第二特征作为第1组第三特征。接下来，目标检测设备在第i个特征融合层中，获取第i-1组第三特征，并将第i-1组第三特征与第i组第二特征融合，得到第i组第三特征，直至得到第n组第三特征。接下来，目标检测设备将n组第三特征输入检测网络，得到待检测图像中目标的类别信息和位置信息。

本公开实施例中，通过进一步对特征进行融合，可增强特征的语义信息，并提高小尺寸目标的检测准确性。

在一示例性实施例中，涉及将n组第二特征输入检测网络，得到待检测图像中目标的类别信息和位置信息的一种可能的实现过程。在上述实施例的基础上，步骤S208具体可以通过以下步骤实现：

S208a，将n组第二特征输入区域生成网络，得到初始候选框；

S208b，将初始候选框输入级联的检测网络，该检测网络包括级联的m个检测子网络，将初始候选框在原始特征上进行感兴趣区域池化操作，并将池化后的特征输入第1级检测子网络，得到第1级的检测框及置信度；

S208c，对于第j-1级检测框，在原始特征上进行感兴趣区域池化操作，并将池化后的特征输入第j级检测子网络，得到第j级的检测框及置信度，直至得到第m级检测框及置信度作为最终结果；

S208d，对最终结果进行非极大值抑制，得到待检测图像中目标的类别信息和位置信息。

具体地，目标检测设备将n组第二特征输入区域生成网络，得到初始候选框B0。接下来，目标检测设备采用级联的m个检测子网络，将初始候选框在原始特征上进行感兴趣区域池化操作，并将池化后的特征输入第1级检测子网络，得到第1级的检测框及置信度。接下来，对于第j-1级检测框，目标检测设备在原始特征上进行感兴趣区域池化操作，并将池化后的特征输入第j级检测子网络，得到第j级的检测框及置信度，直至得到第m级检测框及置信度作为最终结果。接下来，目标检测设备对最终结果进行非极大值抑制，得到待检测图像中目标的类别信息和位置信息。

应该理解的是，虽然图1-6的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图1-6中的至少一部分步骤可以包括多个步骤或者多个阶段，这些步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。

在一示例性实施例中，如图7所示，提供了一种目标检测装置，包括：特征提取模块302、特征融合模块304和检测模块306，其中：

该特征提取模块302用于对待检测图像进行特征提取，得到n组不同尺度的第一特征，其中，n为大于1的整数；

该特征融合模块304用于将n组不同尺度的第一特征输入第一特征融合网络，第一特征融合网络包括n个特征融合层，在第n个特征融合层中，将第n组第一特征作为第n组第二特征；

该特征融合模块304还用于在第i-1个特征融合层中，获取第i组第二特征以及第i组第二特征对应的权重参数，将第i组第二特征与权重参数相乘，并将相乘得到的特征与第i-1组第一特征融合，得到第i-1组第二特征，直至得到第1组第二特征；

该检测模块306用于将n组第二特征输入检测网络，得到待检测图像中目标的类别信息和位置信息。

上述目标检测装置中，在对特征进行融合时，通过获取第二特征对应的权重参数，并将该第二特征与其对应的权重参数进行一系列运算，可实现对第二特征的取舍，以达到有选择地将第二特征与下一第一特征进行融合的效果，如此能够更加有效地结合不同尺度特征的特征信息，有利于提高目标检测的准确性。

在一示例性实施例中，该特征融合模块304具体用于对第i组第二特征进行全局平均池化，得到池化后的特征；将池化后的特征输入全连接网络，得到第i组第二特征对应的权重参数。

在一示例性实施例中，该特征融合模块304具体用于将第i组第二特征进行卷积运算，得到卷积后的特征；将卷积后的特征与权重参数相乘，得到相乘后的特征。

在一示例性实施例中，该特征融合模块304具体用于在第i-1个特征融合层中，获取第i组第二特征以及第i组第二特征对应的权重参数，将第i组第二特征与权重参数相乘，得到相乘后的特征；对相乘后的特征进行上采样，得到上采样后的特征；获取上采样后的特征对应的权重参数，将上采样后的特征与权重参数相乘，并将相乘得到的特征与第i-1组第一特征融合，得到第i-1组第二特征。

在一示例性实施例中，该特征融合模块304具体用于对上采样后的特征进行全局平均池化，得到池化后的特征；将池化后的特征输入全连接网络，得到上采样后的特征对应的权重参数。

在一示例性实施例中，该特征融合模块304具体用于对第n组第一特征进行全局平局池化，得到池化后的特征；将池化后的特征与第n组第一特征相加，得到第n组第二特征。

在一示例性实施例中，该检测模块306具体用于将n组第二特征输入第二特征融合网络，第二特征融合网络包括n个特征融合层，在第1个特征融合层中，将第1组第二特征作为第1组第三特征；在第i个特征融合层中，获取第i-1组第三特征，并将第i-1组第三特征与第i组第二特征融合，得到第i组第三特征，直至得到第n组第三特征；将n组第三特征输入检测网络，得到待检测图像中目标的类别信息和位置信息。

在一示例性实施例中，该检测模块306具体用于将n组第二特征输入区域生成网络，得到初始候选框；将初始候选框输入级联的检测网络，检测网络包括级联的m个检测子网络，将初始候选框在原始特征上进行感兴趣区域池化操作，并将池化后的特征输入第1级检测子网络，得到第1级的检测框及置信度；对于第j-1级检测框，在原始特征上进行感兴趣区域池化操作，并将池化后的特征输入第j级检测子网络，得到第j级的检测框及置信度，直至得到第m级检测框及置信度作为最终结果；对最终结果进行非极大值抑制，得到待检测图像中目标的类别信息和位置信息。

关于目标检测装置的具体限定可以参见上文中对于目标检测方法的限定，在此不再赘述。上述目标检测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一示例性实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图8所示。该计算机设备800包括通过系统总线82连接的处理器81、存储器和网络接口88。其中，该计算机设备的处理器81用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质87、内存储器86。该非易失性存储介质87存储有操作系统83、计算机程序84和数据库85。该内存储器86为非易失性存储介质87中的操作系统和计算机程序的运行提供环境。该计算机设备800的网络接口88用于与外部的终端通过网络连接通信。该计算机程序84被处理器81执行时以实现一种目标检测方法。

本领域技术人员可以理解，图8中示出的结构，仅仅是与本公开方案相关的部分结构的框图，并不构成对本公开方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一示例性实施例中，还提供了一种计算机设备，包括存储器和处理器，存储器中存储有计算机程序，该处理器执行计算机程序时实现上述各方法实施例中的步骤。

在一示例性实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现上述各方法实施例中的步骤。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本公开所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory，ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory，RAM)或外部高速缓冲存储器。作为说明而非局限，RAM可以是多种形式，比如静态随机存取存储器(Static Random Access Memory，SRAM)或动态随机存取存储器(Dynamic Random Access Memory，DRAM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本公开的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本公开构思的前提下，还可以做出若干变形和改进，这些都属于本公开的保护范围。因此，本公开专利的保护范围应以所附权利要求为准。

Claims

一种目标检测方法，其中，所述方法包括：

对待检测图像进行特征提取，得到n组不同尺度的第一特征，其中，n为大于1的整数；

将所述n组不同尺度的第一特征输入第一特征融合网络，所述第一特征融合网络包括n个特征融合层，在第n个特征融合层中，将第n组第一特征作为第n组第二特征；

在第i-1个特征融合层中，获取第i组第二特征以及所述第i组第二特征对应的权重参数，将所述第i组第二特征与所述权重参数相乘，并将相乘得到的特征与第i-1组第一特征融合，得到第i-1组第二特征，直至得到第1组第二特征；

将n组第二特征输入检测网络，得到所述待检测图像中目标的类别信息和位置信息。
根据权利要求1所述的方法，其中，获取第i组第二特征对应的权重参数，包括：

对所述第i组第二特征进行全局平均池化，得到池化后的特征；

将所述池化后的特征输入全连接网络，得到所述第i组第二特征对应的权重参数。
根据权利要求1或2所述的方法，其中，将所述第i组第二特征与所述权重参数相乘，包括：

将所述第i组第二特征进行卷积运算，得到卷积后的特征；

将所述卷积后的特征与所述权重参数相乘，得到相乘后的特征。
根据权利要求1所述的方法，其中，在第i-1个特征融合层中，获取第i组第二特征以及所述第i组第二特征对应的权重参数，将所述第i组第二特征与所述权重参数相乘，并将相乘得到的特征与第i-1组第一特征融合，得到第i-1组第二特征，包括：

在第i-1个特征融合层中，获取第i组第二特征以及所述第i组第二特征对应的权重参数，将所述第i组第二特征与所述权重参数相乘，得到相乘后的特征；

对所述相乘后的特征进行上采样，得到上采样后的特征；

获取所述上采样后的特征对应的权重参数，将所述上采样后的特征与所述权重参数相乘，并将相乘得到的特征与第i-1组第一特征融合，得到第i-1组第二特征。
根据权利要求4所述的方法，其中，获取所述上采样后的特征对应的权重参数，包括：

对所述上采样后的特征进行全局平均池化，得到池化后的特征；

将所述池化后的特征输入全连接网络，得到所述上采样后的特征对应的权重参数。
根据权利要求1至5中任意一项所述的方法，其中，在第n个特征融合层中，将第n组第一特征作为第n组第二特征，包括：

对所述第n组第一特征进行全局平局池化，得到池化后的特征；

将所述池化后的特征与所述第n组第一特征相加，得到第n组第二特征。
根据权利要求1至6中任意一项所述的方法，其中，将n组第二特征输入检测网络，得到所述待检测图像中目标的类别信息和位置信息，包括：

将n组第二特征输入第二特征融合网络，所述第二特征融合网络包括n个特征融合层，在第1个特征融合层中，将第1组第二特征作为第1组第三特征；

在第i个特征融合层中，获取第i-1组第三特征，并将所述第i-1组第三特征与第i组第二特征融合，得到第i组第三特征，直至得到第n组第三特征；

将n组第三特征输入检测网络，得到所述待检测图像中目标的类别信息和位置信息。
根据权利要求1至6中任意一项所述的方法，其中，将n组第二特征输入检测网络，得到所述待检测图像中目标的类别信息和位置信息，包括：

将所述n组第二特征输入区域生成网络，得到初始候选框；

将所述初始候选框输入级联的检测网络，所述检测网络包括级联的m个检测子网络，将所述初始候选框在原始特征上进行感兴趣区域池化操作，并将池化后的特征输入第1级检测子网络，得到第1级的检测框及置信度；

对于第j-1级检测框，在原始特征上进行感兴趣区域池化操作，并将池化后的特征输入第j级检测子网络，得到第j级的检测框及置信度，直至得到第m级检测框及置信度作为最终结果；

对所述最终结果进行非极大值抑制，得到所述待检测图像中目标的类别信息和位置信息。
一种目标检测装置，其中，所述装置包括：

特征提取模块，用于对待检测图像进行特征提取，得到n组不同尺度的第一特征，其中，n为大于1的整数；

特征融合模块，用于将所述n组不同尺度的第一特征输入第一特征融合网络，所述第一特征融合网络包括n个特征融合层，在第n个特征融合层中，将第n组第一特征作为第n组第二特征；

所述特征融合模块，还用于在第i-1个特征融合层中，获取第i组第二特征以及所述第i组第二特征对应的权重参数，将所述第i组第二特征与所述权重参数相乘，并将相乘得到的特征与第i-1组第一特征融合，得到第i-1组第二特征，直至得到第1组第二特征；

检测模块，用于将n组第二特征输入检测网络，得到所述待检测图像中目标的类别信息和位置信息。
一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其中，所述处理器执行所述计算机程序时实现权利要求1至8中任一项所述方法的步骤。
一种计算机可读存储介质，其上存储有计算机程序，其中，所述计算机程序被处理器执行时实现权利要求1至8中任一项所述的方法的步骤。