CN117372685A

CN117372685A - 目标检测方法、装置、电子设备及存储介质

Info

Publication number: CN117372685A
Application number: CN202311676318.7A
Authority: CN
Inventors: 金毅勐; 蒋召; 周靖宇
Original assignee: Shenzhen Xumi Yuntu Space Technology Co Ltd; Chongqing Jikai Technology Service Co Ltd
Current assignee: Shenzhen Xumi Yuntu Space Technology Co Ltd; Chongqing Jikai Technology Service Co Ltd
Priority date: 2023-12-08
Filing date: 2023-12-08
Publication date: 2024-01-09
Anticipated expiration: 2043-12-08
Also published as: CN117372685B

Abstract

本申请涉及人工智能技术领域，提供了一种目标检测方法、装置、电子设备及存储介质。该方法通过将学生网络提取得到的第一特征图划分为N个学生网络候选区域，并在教师网络提取得到的第二特征图中确定与N个学生网络候选区域一一对应的N个教师网络候选区域，将每组对应的学生网络候选区域和教师网络候选区域中的特征进行对齐处理，从而解决了学生网络与教师网络的特征图差异较大导致的，教师网络无法较好指导学生网络学习的技术问题，降低了学生网络的学习难度，提升了知识迁移效果，进而使得使用该方法训练好的学生网络对待检测图像进行目标检测时，能够获得较高的检测精度。

Description

目标检测方法、装置、电子设备及存储介质

技术领域

本申请涉及人工智能技术领域，尤其涉及一种目标检测方法、装置、电子设备及存储介质。

背景技术

基于目标检测的知识迁移算法可以将大模型知识迁移至小模型中，应用小模型时，从而在提升了推理速度的同时，保证了目标检测精度。

现有基于特征的目标检测知识迁移算法存在一个问题，即通过整体的特征图进行损失计算，因为学生模型的表达能力有限，所以两者的特征图存在较大差异，所以这种优化方式不能很好的指导学生模型学习。

发明内容

有鉴于此，本申请实施例提供了一种目标检测方法、装置、电子设备及存储介质，以解决现有技术中基于知识迁移算法进行目标检测时，学生网络学习难度大、迁移效果不佳的问题。

本申请实施例的第一方面，提供了一种目标检测方法，包括：

获取待检测图像；

将待检测图像分别输入学生网络和训练好的教师网络，学生网络对待检测图像进行特征提取得到第一特征图，教师网络对待检测图像进行特征提取得到第二特征图；

基于第一特征图确定N个候选区域，N为正整数；

基于各候选区域，在第一特征图中确定学生网络候选区域特征，并在第二特征图中确定对应的教师网络候选区域特征；

基于各学生网络候选区域特征以及对应的教师网络候选区域特征计算得到学生网络的对齐损失函数，基于对齐损失函数得到学生网络的损失函数；

响应于损失函数大于预设阈值，更新学生网络的网络参数，并重新执行提取第一特征图、确定候选区域、确定各候选区域对应的学生网络候选区域特征和教师网络候选区域特征、基于各候选区域对应的学生网络候选区域特征和教师网络候选区域特征确定损失函数的步骤，直至损失函数小于或者等于预设阈值，得到训练好的学生网络；

使用训练好的学生网络，自待检测图像中检测得到目标。

本申请实施例的第二方面，提供了一种目标检测装置，包括：

获取模块，被配置为获取待检测图像；

特征提取模块，被配置为将待检测图像分别输入学生网络和训练好的教师网络，学生网络对待检测图像进行特征提取得到第一特征图，教师网络对待检测图像进行特征提取得到第二特征图；

确定模块，被配置为基于第一特征图确定N个候选区域，N为正整数；

确定模块还被配置为基于各候选区域，在第一特征图中确定学生网络候选区域特征，并在第二特征图中确定对应的教师网络候选区域特征；

计算模块，被配置为基于各学生网络候选区域特征以及对应的教师网络候选区域特征计算得到学生网络的对齐损失函数，基于对齐损失函数得到学生网络的损失函数；

迭代模块，被配置为响应于损失函数大于预设阈值，更新学生网络的网络参数，并重新执行提取第一特征图、确定候选区域、确定各候选区域对应的学生网络候选区域特征和教师网络候选区域特征、基于各候选区域对应的学生网络候选区域特征和教师网络候选区域特征确定损失函数的步骤，直至损失函数小于或者等于预设阈值，得到训练好的学生网络；

检测模块，被配置为使用训练好的学生网络，自待检测图像中检测得到目标。

本申请实施例的第三方面，提供了一种电子设备，包括存储器、处理器以及存储在存储器中并且可在处理器上运行的计算机程序，该处理器执行计算机程序时实现上述方法的步骤。

本申请实施例的第四方面，提供了一种计算机可读存储介质，该计算机可读存储介质存储有计算机程序，该计算机程序被处理器执行时实现上述方法的步骤。

本申请实施例与现有技术相比存在的有益效果是：本申请实施例通过将学生网络提取得到的第一特征图划分为N个候选区域，并为各候选区域确定对应的学生网络候选区域特征和教师网络候选区域特征，在各候选区域对学生网络候选区域特征和教师网络候选区域特征执行对齐操作后计算损失函数，从而解决了学生网络与教师网络的特征图差异较大导致的，教师网络无法较好指导学生网络学习的技术问题，降低了学生网络的学习难度，提升了知识迁移效果，进而使得使用该方法训练好的学生网络对待检测图像进行目标检测时，能够获得较高的检测精度。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。

图1是本申请实施例的应用场景的场景示意图。

图2是本申请实施例提供的一种目标检测方法的流程示意图。

图3是本申请实施例提供的基于第一特征图确定N个学生网络候选区域的方法的流程示意图。

图4是本申请实施例提供的计算学生网络的对齐损失函数的方法的流程示意图。

图5是本申请实施例提供的基于对齐损失函数得到学生网络的损失函数的方法的流程示意图。

图6是本申请实施例提供的目标检测方法的流程示意图。

图7是本申请实施例提供的蒸馏模块的工作流程示意图。

图8是本申请实施例提供的一种目标检测装置的示意图。

图9是本申请实施例提供的电子设备的示意图。

具体实施方式

以下描述中，为了说明而不是为了限定，提出了诸如特定系统结构、技术之类的具体细节，以便透彻理解本申请实施例。然而，本领域的技术人员应当清楚，在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中，省略对众所周知的系统、装置、电路以及方法的详细说明，以免不必要的细节妨碍本申请的描述。

下面将结合附图详细说明根据本申请实施例的一种目标检测方法和装置。

图1是本申请实施例的应用场景的场景示意图。该应用场景可以包括终端设备1、2和3、服务器4以及网络5。

终端设备1、2和3可以是硬件，也可以是软件。当终端设备1、2和3为硬件时，其可以是具有显示屏且支持与服务器4通信的各种电子设备，包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等；当终端设备1、2和3为软件时，其可以安装在如上所述的电子设备中。终端设备1、2和3可以实现为多个软件或软件模块，也可以实现为单个软件或软件模块，本申请实施例对此不作限制。进一步地，终端设备1、2和3上可以安装有各种应用，例如数据处理应用、即时通信工具、社交平台软件、搜索类应用、购物类应用等。

服务器4可以是提供各种服务的服务器，例如，对与其建立通信连接的终端设备发送的请求进行接收的后台服务器，该后台服务器可以对终端设备发送的请求进行接收和分析等处理，并生成处理结果。服务器4可以是一台服务器，也可以是由若干台服务器组成的服务器集群，或者还可以是一个云计算服务中心，本申请实施例对此不作限制。

需要说明的是，服务器4可以是硬件，也可以是软件。当服务器4为硬件时，其可以是为终端设备1、2和3提供各种服务的各种电子设备。当服务器4为软件时，其可以是为终端设备1、2和3提供各种服务的多个软件或软件模块，也可以是为终端设备1、2和3提供各种服务的单个软件或软件模块，本申请实施例对此不作限制。

网络5可以是采用同轴电缆、双绞线和光纤连接的有线网络，也可以是无需布线就能实现各种通信设备互联的无线网络，例如，蓝牙（Bluetooth）、近场通信（Near FieldCommunication，NFC）、红外（Infrared）等，本申请实施例对此不作限制。

用户可以通过终端设备1、2和3经由网络5与服务器4建立通信连接，以接收或发送信息等。具体地，用户可以通过终端设备1、2和3采集待检测目标的图像或者视频，并将采集得到的图像或者视频作为训练数据或者待检测数据传输至服务器4，以使服务器可以基于训练数据训练用于目标检测的教师网络和学生网络，并基于待检测数据使用训练好的学生网络进行目标检测。

需要说明的是，终端设备1、2和3、服务器4以及网络5的具体类型、数量和组合可以根据应用场景的实际需求进行调整，本申请实施例对此不作限制。

上文提及，现有基于特征的目标检测知识迁移算法存在一个问题，即通过整体的特征图进行损失计算，因为学生模型的表达能力有限，所以两者的特征图存在较大差异，所以这种优化方式不能很好的指导学生模型学习。

鉴于此，本申请实施例提供了一种目标检测方法，通过将学生网络提取得到的第一特征图划分为N个候选区域，并为各候选区域确定对应的学生网络候选区域特征和教师网络候选区域特征，在各候选区域对学生网络候选区域特征和教师网络候选区域特征执行对齐操作后计算损失函数，从而解决了学生网络与教师网络的特征图差异较大导致的，教师网络无法较好指导学生网络学习的技术问题，降低了学生网络的学习难度，提升了知识迁移效果，进而使得使用该方法训练好的学生网络对待检测图像进行目标检测时，能够获得较高的检测精度。

图2是本申请实施例提供的一种目标检测方法的流程示意图。图2的目标检测方法可以由图1的服务器执行。如图2所示，该目标检测方法包括如下步骤：

在步骤S201中，获取待检测图像。

在步骤S202中，将待检测图像分别输入学生网络和训练好的教师网络，学生网络对待检测图像进行特征提取得到第一特征图，教师网络对待检测图像进行特征提取得到第二特征图。

在步骤S203中，基于第一特征图确定N个候选区域。

其中，N为正整数。

在步骤S204中，基于各候选区域，在第一特征图中确定学生网络候选区域特征，并在第二特征图中确定对应的教师网络候选区域特征。

在步骤S205中，基于各学生网络候选区域特征以及对应的教师网络候选区域特征计算得到学生网络的对齐损失函数，基于对齐损失函数得到学生网络的损失函数。

在步骤S206中，响应于损失函数大于预设阈值，更新学生网络的网络参数，并重新执行提取第一特征图、确定候选区域、确定各候选区域对应的学生网络候选区域特征和教师网络候选区域特征、基于各候选区域对应的学生网络候选区域特征和教师网络候选区域特征确定损失函数的步骤，直至损失函数小于或者等于预设阈值，得到训练好的学生网络。

在步骤S207中，使用训练好的学生网络，自待检测图像中检测得到目标。

本申请实施例中，该目标检测方法可以由服务器执行。服务器可以获取历史目标检测数据，并基于该历史目标检测数据预先训练好一个教师网络。该教师网络可以是一个较大的网络模型，具有较强的特征表达能力。

本申请实施例中，服务器可以首先获取待检测图像，并使用该待检测图像训练学生网络。在另一些实施方式中，服务器也可以使用训练数据集中的图像来训练学生网络。学生网络可以通过迁移学习自教师网络学习目标检测知识。与教师网络相比，学生网络通常具有较小的规模，以及更简单的网络结构。

本申请实施例中，服务器可以将获取的待检测图像分别输入学生网络和训练好的教师网络，使用学生网络的第一特征提取网络对该待检测图像进行特征提取，得到第一特征图，并使用教师网络的特征提取网络对该待检测图像进行特征提取，得到第二特征图。其中，第一特征图是学生网络中对待检测图像中数据的初始表达，第二特征图是教师网络中对待检测图像中数据的初始表达。

本申请实施例中，可以基于第一特征图确定N个网络候选区域。也就是说，可以将第一特征图划分为N个不同的候选区域，具体的划分方法参见后文详细描述，此处不再赘述。

本申请实施例中，在确定了候选区域后，可以基于各候选区域，在第一特征图中确定学生网络候选区域特征，并在第二特征图中确定对应的教师网络候选区域特征。也就是说，针对各候选区域，其在学生网络的第一特征图和教师网络的第二特征图中存在对应的学生网络候选区域特征和教师网络候选区域特征。

本申请实施例中，可以各学生网络候选区域特征以及对应的教师网络候选区域特征，计算得到学生网络的对齐损失函数。也就是说，由于传统迁移算法直接使用教师网络的整体特征图和学生网络的整体特征图计算损失函数，而学生网络的表达能力有限，因此两份整体特征图存在较大差异，导致教师网络无法较好指导学生网络学习。为解决该技术问题，本申请实施例中，首先将学生网络的整体特征图划分为N个候选区域，并基于划分的候选区域，确定各区域对应的学生网络候选区域特征和教师网络候选区域特征，从而能够分区域计算教师网络和学生网络特征图间的损失，提升了学生网络的学习能力，进而提高了训练好的学生网络的检测精度。

本申请实施例中，在计算得到的损失函数大于预设阈值时，可以更新学生网络的网络参数，并重新执行提取第一特征图、确定候选区域、确定各候选区域对应的学生网络候选区域特征和教师网络候选区域特征、基于各候选区域对应的学生网络候选区域特征和教师网络候选区域特征确定损失函数的步骤，直至损失函数小于或者等于预设阈值，得到训练好的学生网络。最后，可以使用训练好的学生网络，自待检测图像中检测得到目标。

根据本申请实施例提供的技术方案，通过将学生网络提取得到的第一特征图划分为N个候选区域，并为各候选区域确定对应的学生网络候选区域特征和教师网络候选区域特征，在各候选区域对学生网络候选区域特征和教师网络候选区域特征执行对齐操作后计算损失函数，从而解决了学生网络与教师网络的特征图差异较大导致的，教师网络无法较好指导学生网络学习的技术问题，降低了学生网络的学习难度，提升了知识迁移效果，进而使得使用该方法训练好的学生网络对待检测图像进行目标检测时，能够获得较高的检测精度。

图3是本申请实施例提供的基于第一特征图确定N个学生网络候选区域的方法的流程示意图。如图3所示，该方法包括如下步骤：

在步骤S301中，将第一特征图输入训练好的候选区域网络。

在步骤S302中，使用训练好的候选区域网络将第一特征图划分为N个候选区域。

本申请实施例中，服务器可以将第一特征图输入训练好的候选区域网络（RegionProposal Network，RPN），使用该训练好的RPN网络将第一特征图划分为N个候选框。具体的，可以将第一特征图输入训练好的RPN网络，该RPN网络会输出一系列坐标和宽高，每个坐标可以视为一个候选框的中心点，结合宽高可以确定出一个候选框。

本申请实施例中，在第一特征图中确定学生网络候选区域特征可以是，将N个候选区域映射至第一特征图，得到各候选区域的学生网络候选区域特征。进一步的，在第二特征图中确定对应的教师网络候选区域特征可以是，将N个候选区域映射至第二特征图，得到与各候选区域的学生网络候选区域特征对应的教师网络候选区域。

也就是说，可以使用RPN网络对第一特征图进行划分，得到N个候选框。随后，将该N个候选框映射至学生网络的第一特征图，可以得到N个学生网络候选区域特征。另一方面，将该N个候选框映射至教师网络的第二特征图，即可得到N个教师网络候选区域特征。

图4是本申请实施例提供的计算学生网络的对齐损失函数的方法的流程示意图。如图4所示，该方法包括如下步骤：

在步骤S401中，对各候选区域中的学生网络候选区域特征再次执行特征提取操作，得到各候选区域的学生网络候选区域提取后的特征。

在步骤S402中，基于各候选区域的学生网络候选区域提取后的特征以及与其分别对应的教师网络候选区域特征计算得到学生网络的对齐损失函数。

本申请实施例中，在基于划分得到的N个候选区域映射得到对应的学生网络候选区域特征和教师网络候选区域特征后，由于学生网络的表达能力有限，因此各学生网络候选区域特征与其对应的教师网络候选区域特征间的差异仍然较大。此时，可以首先将对应区域的学生网络的特征与教师网络的特征进行对齐，然后再计算学生网络的对齐损失函数。

本申请实施例中，可以使用学生网络中的第二特征提取网络，对每个候选区域中的学生网络候选区域特征再次执行特征提取操作，得到各候选区域的学生网络候选区域提取后的特征。具体的，第二特征提取网络可以包括三个卷积层，分别为1x1卷积层、3x3卷积层和1x1卷积层。采用这种方式，使得变换后的学生网络候选区域中的特征与对应的教师网络候选区域中的特征更接近，即实现了特征对齐，从而可以计算得到更为合理的对齐损失函数。

本申请实施例中，可以基于各候选区域的学生网络候选区域提取后的特征以及对应的教师网络候选区域特征计算得到学生网络的对齐损失函数。其中，学生网络的对齐损失函数可以通过各候选区域的对齐损失函数加权求和计算得到，各候选区域的对齐损失函数可以通过计算学生网络候选区域提取后的特征与对应的教师网络候选区域特征之间的差异确定。

进一步的，基于各候选区域的学生网络候选区域提取后的特征以及对应的教师网络候选区域特征计算得到学生网络的对齐损失函数时，可以首先计算各候选区域的学生网络候选区域提取后的特征以及对应的教师网络候选区域特征的相对熵，即Kullback-Leibler散度（KL散度），然后将各候选区域的KL散度加权求和得到学生网络的对齐损失函数。

本申请实施例中，在更新学生网络的网络参数时，可以更新第一特征提取网络和第二特征提取网络的网络参数。进一步的，还可以根据需要更新学生网络中的其他网络参数，此处不做限制。

图5是本申请实施例提供的基于对齐损失函数得到学生网络的损失函数的方法的流程示意图。如图5所示，该方法包括如下步骤：

在步骤S501中，将第一特征图输入训练好的候选区域网络，计算得到学生网络的分类损失函数和坐标损失函数。

在步骤S502中，对对齐损失函数、分类损失函数和坐标损失函数求和，得到学生网络的损失函数。

本申请实施例中，学生网络的损失函数还可以包括分类损失函数和坐标损失函数，该分类损失函数和坐标损失函数可以由RPN网络对第一特征图计算得到。将对齐损失函数、分类损失函数和坐标损失函数求和，即可得到学生网络的损失函数。

图6是本申请实施例提供的目标检测方法的流程示意图。如图6所示，可以首先将待检测图像送入教师网络，利用教师网络的特征提取网络（BottleNet）提取教师网络的第二特征图，并将待检测图像送入学生网络，利用学生网络的第一BottleNet提取学生网络的第一特征图，其中，学生网络相比于教师网络结构更加简单。然后将提取获得的教师网络的第二特征图和学生网络的第一特征图送入基于候选区域特征对齐的蒸馏模块，计算出最终的损失。最后通过损失反向更新网络参数。

图7是本申请实施例提供的蒸馏模块的工作流程示意图。如图7所示，首先可以将学生网络的第一特征图送入RPN网络，得到候选区域。然后针对教师网络的第二特征图和学生网络的第一特征图，每个候选区域选取对应的教师网络候选区域特征和学生网络候选区域特征。接着将学生网络候选区域特征通过第二BottleNet进行变换，从而使学生网络候选区域特征与教师网络候选区域特征对齐。其中，第二BottleNet可以包括三个卷积层，分别是1x1卷积、3x3卷积和1x1卷积。接下来将变换后的学生网络候选区域特征与教师网络候选区域特征计算对齐损失函数，同时计算RPN网络输出的分类损失函数和坐标损失函数。最后将对齐损失函数、分类损失函数和坐标损失函数相加作为最终的总损失函数输出。

采用本申请实施例的技术方案，针对目标检测领域基于特征进行知识迁移的缺点，提出了一种基于候选区域特征对齐的知识迁移算法，其提升了知识迁移效果。通过增设用于对候选区域特征对齐的蒸馏模块，其避免了从全局特征约束学生网络，降低了学习难度，从而可以更好的进行知识迁移，提升学生模型精度。

上述所有可选技术方案，可以采用任意结合形成本申请的可选实施例，在此不再一一赘述。

下述为本申请装置实施例，可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节，请参照本申请方法实施例。

图8是本申请实施例提供的一种目标检测装置的示意图。如图8所示，该目标检测装置包括：

获取模块801，被配置为获取待检测图像；

特征提取模块802，被配置为将待检测图像分别输入学生网络和训练好的教师网络，学生网络对待检测图像进行特征提取得到第一特征图，教师网络对待检测图像进行特征提取得到第二特征图；

确定模块803，被配置为基于第一特征图确定N个候选区域，N为正整数；

确定模块803还被配置为基于各候选区域，在第一特征图中确定学生网络候选区域特征，并在第二特征图中确定对应的教师网络候选区域特征；

计算模块804，被配置为基于各学生网络候选区域特征以及对应的教师网络候选区域特征计算得到学生网络的对齐损失函数，基于对齐损失函数得到学生网络的损失函数；

迭代模块805，被配置为响应于损失函数大于预设阈值，更新学生网络的网络参数，并重新执行提取第一特征图、确定候选区域、确定各候选区域对应的学生网络候选区域特征和教师网络候选区域特征、基于各候选区域对应的学生网络候选区域特征和教师网络候选区域特征确定损失函数的步骤，直至损失函数小于或者等于预设阈值，得到训练好的学生网络；

检测模块806，被配置为使用训练好的学生网络，自待检测图像中检测得到目标。

本申请实施例中，基于第一特征图确定N个候选区域，包括：将第一特征图输入训练好的候选区域网络；使用训练好的候选区域网络将第一特征图划分为N个候选区域。

本申请实施例中，在第一特征图中确定学生网络候选区域特征，包括：将N个候选区域映射至第一特征图，得到各候选区域的学生网络候选区域特征；在第二特征图中确定对应的教师网络候选区域特征，包括：将N个候选区域映射至第二特征图，得到与各候选区域的学生网络候选区域特征对应的教师网络候选区域。

本申请实施例中，基于各学生网络候选区域特征以及对应的教师网络候选区域特征计算得到学生网络的对齐损失函数，包括：对各候选区域中的学生网络候选区域特征再次执行特征提取操作，得到各候选区域的学生网络候选区域提取后的特征；基于各候选区域的学生网络候选区域提取后的特征以及与其分别对应的教师网络候选区域特征计算得到学生网络的对齐损失函数。

本申请实施例中，基于各候选区域的学生网络候选区域提取后的特征以及与其分别对应的教师网络候选区域特征计算得到学生网络的对齐损失函数，包括：计算各候选区域的学生网络候选区域提取后的特征以及对应的教师网络候选区域特征的相对熵；将各候选区域的相对熵加权求和，得到学生网络的对齐损失函数。

本申请实施例中，学生网络对待检测图像进行特征提取得到第一特征图为，使用学生网络的第一特征提取网络对待检测图像进行特征提取得到第一特征图；对各候选区域中的学生网络候选区域特征再次执行特征提取操作为，使用学生网络的第二特征提取网络对各候选区域中的学生网络候选区域特征再次执行特征提取操作；更新学生网络的网络参数，至少包括：更新第一特征提取网络和第二特征提取网络的网络参数。

本申请实施例中，基于对齐损失函数得到学生网络的损失函数，包括：将第一特征图输入训练好的候选区域网络，计算得到学生网络的分类损失函数和坐标损失函数；对对齐损失函数、分类损失函数和坐标损失函数求和，得到学生网络的损失函数。

应理解，上述实施例中各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。

图9是本申请实施例提供的电子设备的示意图。如图9所示，该实施例的电子设备9包括：处理器901、存储器902以及存储在该存储器902中并且可在处理器901上运行的计算机程序903。处理器901执行计算机程序903时实现上述各个方法实施例中的步骤。或者，处理器901执行计算机程序903时实现上述各装置实施例中各模块/单元的功能。

电子设备9可以是桌上型计算机、笔记本、掌上电脑及云端服务器等电子设备。电子设备9可以包括但不仅限于处理器901和存储器902。本领域技术人员可以理解，图9仅仅是电子设备9的示例，并不构成对电子设备9的限定，可以包括比图示更多或更少的部件，或者不同的部件。

处理器901可以是中央处理单元（Central Processing Unit，CPU），也可以是其它通用处理器、数字信号处理器（Digital Signal Processor，DSP）、专用集成电路（Application Specific Integrated Circuit，ASIC）、现场可编程门阵列（Field-Programmable Gate Array，FPGA）或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。

存储器902可以是电子设备的内部存储单元，例如，电子设备9的硬盘或内存。存储器902也可以是电子设备9的外部存储设备，例如，电子设备9上配备的插接式硬盘，智能存储卡（Smart Media Card，SMC），安全数字（Secure Digital，SD）卡，闪存卡（Flash Card）等。存储器902还可以既包括电子设备9的内部存储单元也包括外部存储设备。存储器902用于存储计算机程序以及电子设备所需的其它程序和数据。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中，上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读存储介质中。基于这样的理解，本申请实现上述实施例方法中的全部或部分流程，也可以通过计算机程序来指令相关的硬件来完成，计算机程序可以存储在计算机可读存储介质中，该计算机程序在被处理器执行时，可以实现上述各个方法实施例的步骤。计算机程序可以包括计算机程序代码，计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括：能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器（Read-Only Memory，ROM）、随机存取存储器（Random Access Memory，RAM）、电载波信号、电信信号以及软件分发介质等。

以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围，均应包含在本申请的保护范围之内。

Claims

1.一种目标检测方法，其特征在于，包括：

获取待检测图像；

将所述待检测图像分别输入学生网络和训练好的教师网络，所述学生网络对所述待检测图像进行特征提取得到第一特征图，所述教师网络对所述待检测图像进行特征提取得到第二特征图；

基于所述第一特征图确定N个候选区域，N为正整数；

基于各学生网络候选区域特征以及对应的教师网络候选区域特征计算得到所述学生网络的对齐损失函数，基于所述对齐损失函数得到所述学生网络的损失函数；

响应于所述损失函数大于预设阈值，更新所述学生网络的网络参数，并重新执行提取第一特征图、确定候选区域、确定各候选区域对应的学生网络候选区域特征和教师网络候选区域特征、基于各候选区域对应的学生网络候选区域特征和教师网络候选区域特征确定损失函数的步骤，直至所述损失函数小于或者等于预设阈值，得到训练好的学生网络；

使用所述训练好的学生网络，自所述待检测图像中检测得到所述目标。

2.根据权利要求1所述的方法，其特征在于，所述基于所述第一特征图确定N个候选区域，包括：

将所述第一特征图输入训练好的候选区域网络；

使用所述训练好的候选区域网络将所述第一特征图划分为N个候选区域。

3.根据权利要求2所述的方法，其特征在于，所述在第一特征图中确定学生网络候选区域特征，包括：

将所述N个候选区域映射至所述第一特征图，得到各候选区域的学生网络候选区域特征；

所述在第二特征图中确定对应的教师网络候选区域特征，包括：

将所述N个候选区域映射至所述第二特征图，得到与所述各候选区域的学生网络候选区域特征对应的教师网络候选区域。

4.根据权利要求1所述的方法，其特征在于，所述基于各学生网络候选区域特征以及对应的教师网络候选区域特征计算得到所述学生网络的对齐损失函数，包括：

对各候选区域中的学生网络候选区域特征再次执行特征提取操作，得到各候选区域的学生网络候选区域提取后的特征；

基于所述各候选区域的学生网络候选区域提取后的特征以及与其分别对应的教师网络候选区域特征计算得到所述学生网络的对齐损失函数。

5.根据权利要求4所述的方法，其特征在于，所述基于所述各候选区域的学生网络候选区域提取后的特征以及与其分别对应的教师网络候选区域特征计算得到所述学生网络的对齐损失函数，包括：

计算所述各候选区域的学生网络候选区域提取后的特征以及对应的教师网络候选区域特征的相对熵；

将各候选区域的相对熵加权求和，得到所述学生网络的对齐损失函数。

6.根据权利要求4所述的方法，其特征在于，所述学生网络对所述待检测图像进行特征提取得到第一特征图为，使用所述学生网络的第一特征提取网络对所述待检测图像进行特征提取得到第一特征图；

所述对各候选区域中的学生网络候选区域特征再次执行特征提取操作为，使用所述学生网络的第二特征提取网络对各候选区域中的学生网络候选区域特征再次执行特征提取操作；

所述更新所述学生网络的网络参数，至少包括：

更新所述第一特征提取网络和第二特征提取网络的网络参数。

7.根据权利要求1至6中任一项所述的方法，其特征在于，所述基于所述对齐损失函数得到所述学生网络的损失函数，包括：

将所述第一特征图输入训练好的候选区域网络，计算得到所述学生网络的分类损失函数和坐标损失函数；

对所述对齐损失函数、分类损失函数和坐标损失函数求和，得到所述学生网络的损失函数。

8.一种目标检测装置，其特征在于，包括：

获取模块，被配置为获取待检测图像；

特征提取模块，被配置为将所述待检测图像分别输入学生网络和训练好的教师网络，所述学生网络对所述待检测图像进行特征提取得到第一特征图，所述教师网络对所述待检测图像进行特征提取得到第二特征图；

确定模块，被配置为基于所述第一特征图确定N个候选区域，N为正整数；

所述确定模块还被配置为基于各候选区域，在第一特征图中确定学生网络候选区域特征，并在第二特征图中确定对应的教师网络候选区域特征；

计算模块，被配置为基于各学生网络候选区域特征以及对应的教师网络候选区域特征计算得到所述学生网络的对齐损失函数，基于所述对齐损失函数得到所述学生网络的损失函数；

迭代模块，被配置为响应于所述损失函数大于预设阈值，更新所述学生网络的网络参数，并重新执行提取第一特征图、确定候选区域、确定各候选区域对应的学生网络候选区域特征和教师网络候选区域特征、基于各候选区域对应的学生网络候选区域特征和教师网络候选区域特征确定损失函数的步骤，直至所述损失函数小于或者等于预设阈值，得到训练好的学生网络；

检测模块，被配置为使用所述训练好的学生网络，自所述待检测图像中检测得到所述目标。

9.一种电子设备，包括存储器、处理器以及存储在所述存储器中并且可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述方法的步骤。

10.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述方法的步骤。