CN111126421B

CN111126421B - 目标检测方法、装置及可读存储介质

Info

Publication number: CN111126421B
Application number: CN201811290970.4A
Authority: CN
Inventors: 冯鑫山
Original assignee: Zhejiang Uniview Technologies Co Ltd
Current assignee: Zhejiang Uniview Technologies Co Ltd
Priority date: 2018-10-31
Filing date: 2018-10-31
Publication date: 2023-07-21
Anticipated expiration: 2038-10-31
Also published as: CN111126421A

Abstract

本申请实施例提供一种目标检测方法、装置及可读存储介质，应用于电子设备，目标检测方法包括：获取当前帧图像并将当前帧图像输入到目标检测模型中，通过第一特征提取网络提取当前帧图像的第一图像特征和第一中间特征组。通过所述第二特征提取网络对所述第一图像特征和所述第一中间特征组进行上采样运算以及特征融合运算，得到第二图像特征组。通过定位分类网络根据第一图像特征和第二图像特征组对当前帧图像进行定位分类，得到当前帧图像的目标检测结果。由此，通过提取第一中间特征组从而有效利用了特征提取过程中产生的特征图谱组，避免了特征提取过程中的信息浪费，提高了目标检测过程的信息量，进而提高了目标检测的精度。

Description

目标检测方法、装置及可读存储介质

技术领域

本申请涉及目标检测领域，具体而言，涉及一种目标检测方法、装置及可读存储介质。

背景技术

目标检测是智能监控系统中的一个重要组成部分。目标检测常应用于道路监控系统，以实现对道路情况的检测。目标检测是目标跟踪、事故判定等功能的实现基础。在目标检测领域，存在两种检测手段，单阶段检测与双阶段检测，其中单阶段检测速率较快但精度较差，双阶段检测精度较高但检测时间较长，缺乏一种检测速率较快且精度较高的目标检测手段。

申请内容

有鉴于此，本申请的目的在于提供一种目标检测方法及装置，以解决或者改善上述问题。

为了实现上述目的，本申请实施例采用的技术方案如下：

第一方面本申请提供一种目标检测方法，应用于电子设备，所述目标检测方法包括：

获取当前帧图像并将所述当前帧图像输入到目标检测模型中。

通过第一特征提取网络提取所述当前帧图像的第一图像特征以及第一中间特征组，并将所述第一图像特征输入到第二特征提取网络和定位分类网络中，同时将所述第一中间特征组输入到所述第二特征提取网络中。

通过所述第二特征提取网络对所述第一图像特征和所述第一中间特征组进行上采样运算以及特征融合运算，得到第二图像特征组，将所述第二图像特征组输入到所述定位分类网络中。

通过所述定位分类网络根据所述第一图像特征和所述第二图像特征组对所述当前帧图像中的各个目标进行定位分类，得到所述当前帧图像的目标检测结果。

可选地，所述第一特征提取网络包括多个依次连接的卷积层组，所述通过第一特征提取网络提取所述当前帧图像的第一图像特征以及第一中间特征组的步骤，包括：

依次通过每个卷积层组提取所述当前帧图像的特征图谱。

将所述多个依次连接的卷积层组中的预设卷积层组提取得到的特征图谱作为所述第一中间特征组。

将最后一个卷积层组提取得到的特征图谱作为所述第一图像特征，其中，所述特征图谱为每个卷积层组中的最后一个卷积单元提取得到的特征图像，每个卷积单元包括点卷积层和/或深度卷积层。

可选地，所述通过所述第二特征提取网络对所述第一图像特征和所述第一中间特征组进行上采样运算以及特征融合运算，得到第二图像特征组的步骤，包括：

将所述第一图像特征的特征图谱输入到对应的数据变换层，并将所述第一中间特征组中的各个特征图谱输入到对应的特征融合函数。

通过各个数据变换层将对应的特征图谱进行上采样，得到上采样后的特征图谱，并将所述上采样后的特征图谱输入到对应的特征融合函数。

通过各个特征融合函数将所述第一中间特征中对应的特征图谱和接收到的上采样后的特征图谱进行特征融合，得到特征融合后的特征图谱，并将得到的各个特征融合后的特征图谱作为所述第二图像特征组。

可选地，所述将所述第一图像特征的特征图谱输入到对应的数据变换层，并将所述第一中间特征组中的各个特征图谱输入到对应的特征融合函数的步骤，包括：

将所述第一图像特征的特征图谱输入到对应的特征卷积层，得到卷积后的特征图谱，并将所述卷积后的特征图谱输入到对应的数据变换层。

将所述第一中间特征组中各个特征图谱输入到对应的特征卷积层，得到卷积后的特征图谱组，并将所述卷积后的特征图谱组输入到对应的特征融合函数。

可选地，所述通过所述定位分类网络根据所述第一图像特征和所述第二图像特征组对所述当前帧图像中的各个目标进行定位分类，得到所述当前帧图像的目标检测结果的步骤，包括：

通过边框定位网络获取所述第一图像特征的特征图谱和所述第二图像特征组中的各个特征图谱的各个目标的定位信息，并将所述各个目标的定位信息发送到特征分类网络。

通过所述特征分类网络对所述各个目标的定位信息进行特征分类，得到所述第一图像特征的特征图谱以及所述第二图像特征组中的各个特征图谱的各个目标的检测结果。

将所述第一图像特征的特征图谱以及所述第二图像特征组中的各个特征图谱的各个目标的检测结果进行融合，得到当前帧图像的目标检测结果。

可选地，所述将所述第一图像特征的特征图谱以及所述第二图像特征组中的各个特征图谱的各个目标的检测结果进行融合，得到当前帧图像的目标检测结果的步骤，包括：

将所述第一图像特征的特征图谱和所述第二图像特征组中的各个特征图谱的各个目标的检测结果映射到所述当前帧图像上，得到映射后的所述第一图像特征的特征图谱和所述第二图像特征组中的各个特征图谱的各个目标的检测结果。

对所述映射后的所述第一图像特征的特征图谱和所述第二图像特征组中的各个特征图谱的各个目标的检测结果根据预设规律进行筛选，得到所述当前帧图像的目标检测结果。

可选地，所述获取当前帧图像并将所述当前帧图像输入到所述目标检测模型中的步骤，包括：

获取当前帧图像。

将当前帧图像输入到所述目标检测模型中对应的图像输入通道。

可选地，所述获取当前帧图像的步骤之前，所述方法包括：

配置所述目标检测模型。

所述配置所述目标检测模型的方法，包括：

建立目标检测训练模型，所述目标检测训练模型包括相互连接的第一特征提取网络、第二特征提取网络和定位分类网络以及与所述定位分类网络连接的损失计算函数。

响应用户操作，对所述目标检测训练模型的网络参数进行初始化，其中，所述网络参数包括所述第一特征提取网络、所述第二特征提取网络以及所述定位分类网络的网络参数。

获取训练样本，并将训练样本集中的每个训练样本图像输入到所述目标检测训练模型中，通过所述第一特征提取网络提取每个训练样本图像的第一图像特征和第一中间特征组，并将所述第一图像特征输入到所述第二特征提取网络和所述定位分类网络中，同时将所述第一中间特征组输入到所述第二特征提取网络中。

通过所述定位分类网络根据所述第一图像特征和所述第二图像特征组对所述当前帧图像中的各个目标进行定位分类，得到所述当前帧图像的目标检测结果，其中，目标检测结果包括各个目标的位置信息和分类信息。

将所述当前帧图像的目标检测结果中的各个目标的位置信息发送给边框回归损失函数进行计算以得到该训练样本图像的边框回归损失函数值，将所述当前帧图像的目标检测结果中的各个目标的分类信息发送给焦点损失函数以得到该训练样本图像的焦点损失函数值。

根据该训练样本图像的边框回归损失函数值和焦点损失函数值得到该训练样本图像的损失函数值。

根据所述损失函数值计算对应的反向梯度值，并根据所述反向梯度值，利用链式导数传导法计算所述目标检测训练模型的网络参数的偏导数。

基于所述偏导数更新所述目标检测训练模型的网络参数。

重复上述步骤，并判断每次训练得到的目标检测训练模型是否达到训练终止条件，在判定满足训练终止条件时，输出满足所述训练终止条件的目标检测训练模型中第一特征提取网络、第二特征提取网络以及定位分类网络作为所述目标检测模型。

第二方面，本申请实施例还提供一种目标检测装置，应用于电子设备，所述目标检测装置包括：

图像获取模块，用于获取当前帧图像并将所述当前帧图像输入到目标检测模型中。

第一特征提取模块，用于提取所述当前帧图像的第一图像特征以及第一中间特征组。

第二特征提取模块，用于对所述第一图像特征和所述第一中间特征组进行上采样运算以及特征融合运算，得到第二图像特征组。

以及定位分类模块，用于根据所述第一图像特征和所述第二图像特征组对所述当前帧图像中的各个目标进行定位分类，得到所述当前帧图像的目标检测结果。

第三方面，本申请实施例还提供一种可读存储介质，所述可读存储介质中存储有计算机程序，所述计算机程序被执行时实现上述目标检测方法。

相比现有技术，本申请提供的有益效果是：

本申请实施例提供的目标检测方法、装置及可读存储介质，通过提取第一中间特征组从而有效利用了特征提取过程中产生的特征图谱组，避免了特征提取过程中的信息浪费，提高了目标检测过程的信息量，进而提高了目标检测的精度。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍。应当理解，以下附图仅示出了本申请的某些实施例，因此不应被看作是对范围的限定。对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1为本申请实施例提供的用于实现目标检测方法的电子设备的结构示意框图。

图2为本申请实施例提供的目标检测装置的功能模块图。

图3为本申请实施例提供的目标检测方法的一种流程示意图。

图4为本申请实施例提供的目标检测模型的一种网络结构示意图。

图5为本申请实施例提供的目标检测模型的另一种网络结构示意图。

图6为本申请实施例提供的目标检测模型的一种目标检测效果图。

图7为本申请实施例提供的目标检测模型的另一种目标检测效果图。

图标：100-电子设备；110-总线；120-处理器；130-存储介质；140-总线接口；150-网络适配器；160-用户接口；200-目标检测装置；210-图像获取模块；220-第一特征提取模块；230-第二特征提取模块；240-定位分类模块。

具体实施方式

针对现有技术中的上述问题，本申请发明人在实现本申请技术方案的过程中，提出下述实施例，通过提取第一中间特征组从而有效利用了特征提取过程中产生的特征图谱组，避免了特征提取过程中的信息浪费，提高了目标检测过程的信息量，进而提高了目标检测的精度。

以上现有技术中的方案所存在的缺陷，均是申请人在经过实践并仔细研究后得出的结果，因此，上述问题的发现过程以及下文中本申请实施例针对上述问题所提出的解决方案，都应该是申请人在本申请过程中对本申请做出的贡献。

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。

因此，以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围，而是仅仅表示本申请的选定实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例，都属于本申请保护的范围。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步定义和解释。

在本申请的描述中，需要说明的是，术语“上”、“下”等指示的方位或位置关系为基于附图所示的方位或位置关系，或者是该申请产品使用时惯常摆放的方位或位置关系，仅是为了便于描述本申请和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本申请的限制。

在本申请的描述中，还需要说明的是，除非另有明确的规定和限定，术语“设置”、“连接”应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通。对于本领域的普通技术人员而言，可以具体情况理解上述术语在本申请中的具体含义。

下面结合附图，对本申请的一些实施方式作详细说明。在不冲突的情况下，下述的实施例及实施例中的关键可以相互组合。

请参阅图1，为本申请实施例提供的用于实现下述目标检测方法的电子设备100的结构示意框图。本实施例中，所述电子设备100可以是安防设备、服务器或者任意具有计算处理能力的设备。其中，安防设备可以用于对道路、小区门禁等实际场景进行监控，主要由前端设备和后端设备这两大部分组成，前端设备通常由摄像机、手动或电动镜头、云台、防护罩、监听器、报警探测器和多功能解码器等部件组成，它们各司其职，并通过有线、无线或光纤传输媒介与中心控制系统的各种设备建立相应的联系(传输视/音频信号及控制、报警信号)。在实际的监控系统中，这些前端设备不一定同时使用，但实现监控现场图像采集的摄像机和镜头是必不可少的。后端设备可进一步分为中心控制设备和分控制设备。

如图1所示，电子设备100可以由总线110作一般性的总线体系结构来实现。根据电子设备100的具体应用和整体设计约束条件，总线110可以包括任意数量的互连总线和桥接。总线110将各种电路连接在一起，这些电路包括处理器120、存储介质130和总线接口140。可选地，电子设备100可以使用总线接口140将网络适配器150等经由总线110连接。网络适配器150可用于实现电子设备100中物理层的信号处理功能，并通过天线实现射频信号的发送和接收。用户接口160可以连接外部设备，例如：键盘、显示器、鼠标或者操纵杆等。总线110还可以连接各种其它电路，如定时源、外围设备、电压调节器或者功率管理电路等，这些电路是本领域所熟知的，因此不再详述。

可以替换的，电子设备100也可配置成通用处理系统，例如通称为芯片，该通用处理系统包括：提供处理功能的一个或多个微处理器，以及提供存储介质130的至少一部分的外部存储器，所有这些都通过外部总线体系结构与其它支持电路连接在一起。

可替换的，电子设备100可以使用下述来实现：具有处理器120、总线接口140、用户接口160的ASIC(专用集成电路)；以及集成在单个芯片中的存储介质130的至少一部分，或者，电子设备100可以使用下述来实现：一个或多个FPGA(现场可编程门阵列)、PLD(可编程逻辑器件)、控制器、状态机、门逻辑、分立硬件部件、任何其它适合的电路、或者能够执行本申请通篇所描述的各种功能的电路的任意组合。

其中，处理器120负责管理总线110和一般处理(包括执行存储在存储介质130上的软件)。处理器120可以使用一个或多个通用处理器和/或专用处理器来实现。处理器120的例子包括微处理器、微控制器、DSP处理器和能够执行软件的其它电路。应当将软件广义地解释为表示指令、数据或其任意组合，而不论是将其称作为软件、固件、中间件、微代码、硬件描述语言还是其它。

在图1中存储介质130被示为与处理器120分离，然而，本领域技术人员很容易明白，存储介质130或其任意部分可位于电子设备100之外。举例来说，存储介质130可以包括传输线、用数据调制的载波波形、和/或与无线节点分离开的计算机制品，这些介质均可以由处理器120通过总线接口140来访问。可替换地，存储介质130或其任意部分可以集成到处理器120中，例如，可以是高速缓存和/或通用寄存器。

所述处理器120可执行下述实施例，具体地，所述存储介质130中可以存储有目标检测装置200，所述处理器120可以用于执行所述目标检测装置200。

在一种实施方式中，请参阅图2，为本申请实施例提供的上述目标检测装置200的功能模块图，所述目标检测装置200可包括

图像获取模块210，用于获取当前帧图像并将所述当前帧图像输入到目标检测模型中；

第一特征提取模块220，用于提取所述当前帧图像的第一图像特征以及第一中间特征组。

其中，图像特征指当前帧图像经过特征提取的到的特征图谱的集合。

第二特征提取模块230，用于对所述第一图像特征和所述第一中间特征组进行上采样运算以及特征融合运算，得到第二图像特征组。

以及定位分类模块240，用于根据所述第一图像特征和所述第二图像特征组对所述当前帧图像进行定位分类，得到所述当前帧图像的目标检测结果。

进一步地，请参阅图3，为本申请实施例提供的目标检测方法的一种流程示意图，本实施例中，所述目标检测方法由图1中所示的电子设备100执行，下面结合图3对图2中所示的目标检测装置200进行详细阐述。所应说明的是，本申请实施例提供的目标检测方法不以图3及以下所述的具体顺序为限制。所述方法的具体流程如下：

步骤S310，获取当前帧图像并将所述当前帧图像输入到所述目标检测模型中。本实施例中，该步骤S310可以由上述的提取模块210执行。

可选地，在对步骤S310进行进一步地阐述之前，所述目标检测方法还可以包括配置所述目标检测模型的步骤。

作为一种实施方式，所述配置所述目标检测模型的步骤，可以由以下子步骤实现：

首先，建立目标检测训练模型，所述目标检测训练模型包括相互连接的第一特征提取网络、第二特征提取网络和定位分类网络以及与所述定位分类网络连接的损失计算函数。

接着，响应用户操作，对所述目标检测训练模型的网络参数进行初始化，其中，所述网络参数包括所述第一特征提取网络、所述第二特征提取网络以及所述定位分类网络的网络参数。

接着，获取训练样本，并将训练样本集中的每个训练样本图像输入到所述目标检测训练模型中，通过所述第一特征提取网络提取每个训练样本图像的第一图像特征和第一中间特征组，并将所述第一图像特征输入到所述第二特征提取网络和所述定位分类网络中，同时将所述第一中间特征组输入到所述第二特征提取网络中。

接着，通过所述第二特征提取网络对所述第一图像特征和所述第一中间特征组进行上采样运算以及特征融合运算，得到第二图像特征组，将所述第二图像特征组输入到所述定位分类网络中。

接着，通过所述定位分类网络根据所述第一图像特征和所述第二图像特征组对所述当前帧图像进行定位分类，得到所述当前帧图像的目标检测结果，其中，目标检测结果包括各个目标对应的位置信息和分类信息。

接着，将所述当前帧图像的目标检测结果中各个目标对象的位置信息发送给边框回归损失函数进行计算以得到该训练样本图像的边框回归损失函数值，将述当前帧图像的目标检测结果中各个目标对象的分类信息发送给焦点损失函数以得到该训练样本图像的焦点损失函数值。

其中，训练样本集包括ImageNet分类数据集以及自定义数据集，ImageNet分类数据集以及自定义数据集包括样本图像以及与样本图像的标准检测结果，自定义数据集为本申请发明人建立，并用于训练所述目标检测训练模型的数据集。

焦点损失函数值是当前帧图像经焦点损失函数计算得到的结果与与当前帧图像的标准检测结果中对应的标准值的差值，边框回归损失函数值是当前帧图像经边框回归损失函数计算得到的结果与当前帧图像的标准检测结果中对应的标准值的差值。

具体地，目标检测的类型一般由训练样本集决定，在本实施例中，目标检测结果中的分类信息可以为行人、机动车、非机动车，对应的，训练样本集可以为ImageNet分类数据集中包括行人、机动车、非机动车的样本集，还包括少量的ImageNet分类数据集中其他样本集。

接着，根据该训练样本图像的边框回归损失函数值和焦点损失函数值得到该训练样本图像的损失函数值。

可以将训练样本图像分为背景块与包含待识别物体的前景目标，在一般的训练过程中，每个背景块产生的损失函数值很小，但是背景块数量与前景目标数量极不平衡，背景块与前景目标数量之比往往会达到1000:1甚至更高，造成所有背景块产生的损失往往在损失函数中占据支配地位，使得前景目标在训练中的使用效率较低。

基于上述问题，可选地，本申请提供的焦点损失函数可以为带有权重参数的交叉熵损失函数。所述焦点损失函数通过引入权重参数，降低了背景块在训练时的权值，从而降低背景块在训练时对目标检测网络的影响，让网络能更专注于学习前景目标的信息，从而提高目标检测方法对小目标物体的检测能力。

接着，根据所述损失函数值计算对应的反向梯度值，并根据所述反向梯度值，利用链式导数传导法计算所述目标检测训练模型的网络参数的偏导数。

最后，基于所述偏导数更新所述目标检测训练模型的网络参数。

基于上述设计，通过焦点损失函数降低了背景块在训练时的权重，从而解决了在训练时前景目标与背景块的不平衡对目标检测网络的影响，进而提高了目标检测网络的目标检测能力，尤其是对小目标的目标检测能力。

在上述的基础上，在本实施例中，所述当前帧图像可以为电子设备100获取的监控图像，其中，在将所述当前帧图像输入到目标检测模型之前可以对当前帧图像进行归一化处理，使所述当前帧图像的尺寸为预定尺寸(例如1024×576)，其中，当前帧图像可以为单通道灰度图像，也可以为多通道彩色图像等，具体可以根据实际需求进行选择，在此不作具体限制。

可选地，本实施例当前帧图像可以为RGB图像，，可以理解，本实施例提供的目标检测模型也可适用于非RGB图像。

作为一种实施方式，本实施例提供的目标检测模型可以包括多个图像输入通道，每个图像输入通道都可以对输入的图像进行目标检测，所述步骤S310可以由以下步骤实现：

首先，获取当前帧图像。

然后，将当前帧图像输入到所述目标检测模型中对应的图像输入通道。

基于上述设计，在一些计算能力较大的场景下，可以保证对多帧图像进行目标检测的实时性，以提高目标检测方法的检测效率。

步骤S320，通过第一特征提取网络提取所述当前帧图像的第一图像特征以及第一中间特征组，并将所述第一图像特征输入到第二特征提取网络和定位分类网络中，同时将所述第一中间特征组输入到所述第二特征提取网络中。本实施例中，该步骤S320可以由上述的第一特征提取模块220执行。

本实施例中，作为一种实施方式，所述步骤S320可以通过以下子步骤实现：

首先，依次通过每个卷积层组提取所述当前帧图像的特征图谱。

然后，将所述多个依次连接的卷积层组中的预设卷积层组提取得到的特征图谱作为所述第一中间特征组。

最后，将最后一个卷积层组提取得到的特征图谱作为所述第一图像特征，其中，所述特征图谱为每个卷积层组中的最后一个卷积单元提取得到的特征图像。

作为一种实施方式，第一特征提取网络可以包括初步提取网络以及深度提取网络，初步提取网络用于获得当前帧图像的第一中间特征组，深度提取网络用于获得当前帧图像的第一图像特征。

在当前帧图像较大的情况下，仅利用初步提取网络可能无法得到尺寸合适的第一图像特征，从而造成信息浪费并降低特征提取的精度，基于此，发明人设置深度提取网络用于对初步提取网络的结果进行进一步提取，从而得到尺寸合适的第一图像特征，提高特征提取的精度，进而提高目标检测的精度。

在本实施例中，所述卷积层组包括至少一个卷积单元，一个卷积单元包括点卷积层和/深度卷积层，上述依次通过每个卷积层组提取所述当前帧图像的特征图谱的步骤，可以通过以下子步骤实现：

对于每个卷积层组，依次通过该卷积层组中每个卷积单元提取所述当前帧图像的特征图像，并将最后一个卷积层提取得到的特征图像作为该卷积层组提取得到的当前帧图像的特征图谱。

其中，点卷积层和深度卷积层包括用于输入特征图像的输入端、用于输出卷积结果的输出端以及用于进行卷积操作的卷积核。

深度卷积层包括多个尺寸相同的卷积核，卷积核的数量和输入的特征图像的通道图像数量一致，深度卷积层的尺寸可以表述为卷积核长×卷积核宽×卷积核数量(输入的特征图像的通道图像数量)，其中，各个卷积核与当前进行采样的特征图像的通道图像一一对应。

利用深度卷积层对输入的特征图像进行卷积的步骤如下：

各个卷积核对对应的通道图像进行卷积，得到卷积后的通道图像；

将特征图谱中的通道图像替换为对应的卷积后的通道图像，以对应特征提取后的特征图像。

因此，相对于输入的特征图像，深度卷积层的特征图像的通道图像数量不变。

每个点卷积层包括多个数量相同的卷积核组，其中，每组卷积核的数量和输入的特征图像的通道图像数量一致，点卷积层的尺寸可以表述为卷积核长×卷积核宽×每组卷积核数量(输入的特征图像的通道图像数量)×组数(输出的特征图像的通道图像数量)。

利用点卷积层对输入的特征图像进行卷积的步骤如下：

对于每组卷积核组，将该卷积核组通道图像进行对应特征提取，得到该卷积核组的对应特征提取后的通道图像组；

将对应特征提取后的通道图像组叠加，得到该卷积核组组合特征提取后的特征图像，以得到各个卷积核组组合特征提取的特征图像，并将各个积核组组合特征提取的特征图像作为该点卷积层组合特征提取后的特征图像。

在本实施例中，当前帧图像在所述目标检测模型中通道图像数量不变，则每个卷积单元中，点卷积层的卷积核可以为1×1×3×3，深度卷积层的卷积核可以为3×3×3。

请参阅图4，提供了一种本实施例中的目标检测模型的网络结构示意图。

在本实施例中，第一特征提取网络可以包括六个卷积层组，其中第六卷积层组的特征图谱作为第一图像特征，第二卷积层组、第三卷积层组、第四卷积层组、第五卷积层组的特征图谱作为第一中间特征。

其中，每个卷积层组内特征图谱尺寸不变，每个卷积层组对上一卷积层组进行采样。

例如，当前帧图像的尺寸为1024×576×3时，相应的，第一卷积层组的特征图谱为512×288×3，第二卷积层组的特征图谱为256×144×3，第三卷积层组的特征图谱为128×72×3，第四卷积层组的特征图谱为64×36×3，第五卷积层组的特征图谱为32×18×3，第六卷积层组的特征图谱为16×9×3。

可以理解，当点卷积层的卷积核为1×1×3×3，深度卷积层的卷积核为3×3×3时，当前帧图像在所述目标检测模型中的通道图像数量不变。

作为一种实施方式，可以通过更改每个卷积单元中点卷积层和深度卷积层的卷积核尺寸来改变当前帧图像在所述目标检测模型中的通道图像数量，例如：当前帧图像的尺寸为1024×576×3，第一卷积层组的点卷积层的卷积核可以为1×1×3×4，深度卷积层的卷积核可以为3×3×4，则第一卷积层组的特征图谱可以为512×288×4。

需要注意的是，在上述过程中，需要保证卷积核的数量与所述目标检测模型中的通道图像数量对应，即保证深度卷积层的卷积核数量与输入的特征图像的通道图像数量相等，点卷积层的每组卷积核数量与输入的特征图像的通道图像数量相等且点卷积层的组数与输出的特征图像的通道图像数量相等。

通过上述设计，将特征提取过程中的特征图谱作为第一中间特征组，利用了第一特征提取过程中的特征图谱，避免了信息的浪费，此外，通过点卷积层和深度卷积层将卷积操作分解，减少了卷积操作的运算量，提高了目标检测方法的实时性。

步骤S330，通过所述第二特征提取网络对所述第一图像特征和所述第一中间特征组进行上采样运算以及特征融合运算，得到第二图像特征组，将所述第二图像特征组输入到所述定位分类网络中。本实施例中，该步骤S330可以由上述的提取模块230执行。

作为一种实施方式，步骤S330可以由以下子步骤实现：

首先，将所述第一图像特征的特征图谱输入到对应的数据变换层，并将所述第一中间特征组中的各个特征图谱输入到对应的特征融合函数。

然后，通过各个数据变换层将对应的特征图谱进行上采样，得到上采样后的特征图谱，并将所述上采样后的特征图谱输入到对应的特征融合函数。

作为一种实施方式，通过各个数据变换层将对应的特征图谱进行上采样，得到上采样后的特征图谱的过程可以为：

该数据变换层更改输入的特征图谱尺寸，并将输入的特征图谱的每个元素放置在尺寸改变后的特征图谱的对应位置，并将对改变后的特征图谱中的空白元素进行插值计算，其中，插值的方法为最近邻内插值、双线性插值、牛顿插值等常见插值方法中的一种。

最后，通过各个特征融合函数将所述第一中间特征中对应的特征图谱和接收到的上采样后的特征图谱进行特征融合，得到特征融合后的特征图谱，并将得到的各个特征融合后的特征图谱作为所述第二图像特征组。

作为一种实施方式，通过各个特征融合函数将所述第一中间特征中对应的特征图谱和接收到的上采样后的特征图谱进行特征融合，得到特征融合后的特征图谱的过程可以为：

将输入的两个特征图谱中对应的元素进行叠加，得到特征融合后的特征图谱，其中，输入到同一特征融合函数的特征图谱尺寸相同，对应的元素指在两个特征图谱中相同位置的元素，叠加方式可以为对应相加、求平均数以及加权求和中的一种。

详细地，特征融合函数与第一中间特征组中各个特征图谱一一对应，数据变换层与各个特征融合函数一一对应，数据变换层还与第一图像特征的特征图谱以及第一中间特征组中部分特征图谱一一对应，其中部分特征图谱可以是指第一中间特征组中除尺寸最大的特征图谱外的其他图谱。

作为一种实施方式，通过各个数据变换层将对应的特征图谱进行上采样的步骤中，对应的特征图谱指第一图像特征的特征图谱或第一中间特征组的部分特征图谱对应的特征融合函数的特征图谱。

对于与所述第一图像特征对应的数据变换层，将所述第一图像特征作为该数据变换层的输入，以得到该数据变换层的特征图谱，对于与所述第一中间特征组中部分特征图谱对应的数据变换层，将该特征图谱对应的融合函数的特征图谱作为该数据变换层的输入，以得到该数据变换层的特征图谱。

请继续参阅图4，本实施例中，所述第二特征提取网络可以包括四个特征融合函数以及四个数据变换层，其中，第六卷积层组的特征图谱，即第一图像特征与第一数据变换层对应；第五卷积层组的特征图谱与第二数据变换层以及第一特征融合函数对应；第四卷积层组的特征图谱与第三数据变换层以及第二特征融合函数对应；第三卷积层组的特征图谱与第四数据变换层以及第三特征融合函数对应；第二卷积层组的特征图谱与第四特征融合函数对应。

具体地，上述过程可以为：

第一数据变换层将第一图像特征作为输入，得到第一数据变换层的特征图谱，并将第一数据变换层的特征图谱发送到第一特征融合函数。

第一特征融合函数将第一数据变换层的特征图谱和第五卷积层组的特征图谱作为输入，得到第一特征融合函数的特征图谱，并将第一特征融合函数的特征图谱发送到第二数据变换层。

第二数据变换层将第一特征融合函数的特征图谱作为输入，得到第二数据变换层的特征图谱，并将第二数据变换层的特征图谱发送到第二特征融合函数。

第二特征融合函数将第二数据变换层的特征图谱和第四卷积层组的特征图谱作为输入，得到第二特征融合函数的特征图谱，并将第二特征融合函数的特征图谱发送到第三数据变换层。

第三数据变换层将第二特征融合函数的特征图谱作为输入，得到第三数据变换层的特征图谱，并将第三数据变换层的特征图谱发送到第三特征融合函数。

第三特征融合函数将第三数据变换层的特征图谱和第三卷积层组的特征图谱作为输入，得到第三特征融合函数的特征图谱，并将第三特征融合函数的特征图谱发送到第四数据变换层。

第四数据变换层将第三特征融合函数的特征图谱作为输入，得到第四数据变换层的特征图谱，并将第四数据变换层的特征图谱发送到第四特征融合函数。

第四特征融合函数将第四数据变换层的特征图谱和第二卷积层组的特征图谱作为输入，得到第四特征融合函数的特征图谱。

将各个特征融合函数的特征图谱作为第二图像特征。

详细地，如果，当前帧图像的尺寸为1024×576×3、第一卷积层组的特征图谱为512×288×3、第二卷积层组的特征图谱为256×144×3、第三卷积层组的特征图谱为128×72×3、第四卷积层组的特征图谱为64×36×3、第五卷积层组的特征图谱为32×18×3、第六卷积层组的特征图谱为16×9×3，则对应的第一数据变换层的特征图谱为32×18×3，第一特征融合函数的特征图谱为32×18×3，第二数据变换层的特征图谱为64×36×3，第二特征融合函数的特征图谱为64×36×3，第三数据变换层的特征图谱为128×72×3，第三特征融合函数的特征图谱为128×72×3，第四数据变换层的特征图谱为256×144×3，第四特征融合函数的特征图谱为256×144×3。

基于上述设计，利用了第一中间特征组，将第一中间特征组与第一图像特征进行特征融合，将第一中间特征组中的目标定位细节信息与第一图像特征中的语义信息融合，避免了特征提取过程中的信息浪费，提高了定位分类时对目标位置定位的精度。

作为一种实施方式，所述第二特征提取网络还包括特征卷积层，上述步骤中将所述第一图像特征的特征图谱输入到对应的数据变换层，并将所述第一中间特征组中的各个特征图谱输入到对应的特征融合函数的步骤，可以由以下子步骤实现：

首先，将所述第一图像特征的特征图谱输入到对应的特征卷积层，得到卷积后的特征图谱，将所述卷积后的特征图谱输入到对应的数据变换层。

然后，将所述第一中间特征组中各个特征图谱输入到对应的特征卷积层，得到卷积后的特征图谱组，并将所述卷积后的特征图谱组输入到对应的特征融合函数。

请参阅图5，提供了一种包含特征卷积层的目标检测模型的网络结构示意图，详细地，特征卷积层与第一图像特征的特征图谱以及第一中间特征组中的各个特征图谱一一对应。

作为一种实施方式，特征卷积层对1×1×3的卷积核组或3×3×3的卷积核组，在进行卷积时，特征卷积层的输入特征图谱与卷积后特征，调整第一中间特征组中的目标定位细节信息与第一图像特征中的语义信息融合时的语义信息比重，使特征图谱有更强的语义信息，进而提高第二图像特征组用于定位分类时的检测效果。

作为另一种实施方式，特征卷积层可以由多个特征卷积单元组成，每个特征卷积单元包括点卷积层和/或深度卷积层，在所述特征卷积层进行卷积时，改变输入特征图谱的通道图像数量和尺寸，以使卷积后特征与对应的特征融合函数输入的特征图谱尺寸一致。

基于上述设计，通过特征卷积层实现了特征融合时予以比重的调节，以使第二图像特征组有较强的语义特征，从而提高定位分类的检测效果，此外，特征卷积层还可以调整第一图像特征组的通道图像的尺寸和数量，以使特征提取过程中可以对当前帧图像的通道图像尺寸和数量进行更改，提升目标检测模型的泛用性。

步骤S340，通过所述定位分类网络根据所述第一图像特征和所述第二图像特征组对所述当前帧图像进行定位分类，得到所述当前帧图像的目标检测结果。本实施例中，该步骤S340可以由上述的提取模块240执行。

作为一种实施方式，步骤S340可以由以下子步骤实现：

首先，通过边框定位网络获取所述第一图像特征的特征图谱和所述第二图像特征组中的各个特征图谱的各个目标的定位信息，并所述各个目标的定位信息发送到特征分类网络。

然后，通过所述特征分类网络对所述各个目标的定位信息进行特征分类，得到所述第一图像特征的特征图谱以及所述第二图像特征组中的各个特征图谱的各个目标的检测结果。

最后，将所述第一图像特征的特征图谱以及所述第二图像特征组中的各个特征图谱的各个目标的检测结果进行融合，得到当前帧图像的目标检测结果。

基于上述设计，通过对各个特征图谱目标检测结果的叠加，相对于传统单一特征图谱目标检测，提高了目标检测的精确度。

上述步骤中将所述第一图像特征的特征图谱以及所述第二图像特征组中的各个特征图谱的各个目标的检测结果进行融合，得到当前帧图像的目标检测结果的步骤，可以由以下子步骤实现：

首先，将所述第一图像特征的特征图谱和所述第二图像特征组中的各个特征图谱的各个目标的检测结果映射到所述当前帧图像上，得到映射后的所述第一图像特征的特征图谱和所述第二图像特征组中的各个特征图谱的各个目标的检测结果。

可选地，映射过程可以近似为一个上采样过程，即将特征提取结果以图像以预设的比例扩大，例如，对于尺寸为64×36×3的特征图像，可以将该特征图像的特征提取结果尺寸乘以16，得到该特征图像映射到当前帧图像1024×576×3的提取结果。

然后，对所述映射后的所述第一图像特征的特征图谱和所述第二图像特征组中的各个特征图谱的各个目标的检测结果根据预设规律进行筛选，得到所述当前帧图像的目标检测结果。

作为一种实施方式，各个目标的检测结果包括，各个目标的位置信息以及分类信息，位置信息可以为该目标在图像中的定位边框，分类信息可以为该目标的类型以及该目标为这个类型的分类概率。

具体地，根据预设规律进行筛选的过程可以为以下子步骤：

根据预设的阈值概率进行筛选，得到各个特征图谱中的分类概率高于阈值的目标。

根据各个特征图谱中目标的定位边框尺寸筛选各个特征图谱的同一位置同一类型的目标，得到各个特征图谱的同一位置同一类型的目标中定位边框尺寸最小的目标。

基于上述设计，有效地将各个尺寸的特征图谱的目标检测结果进行叠加，有效利用了各个尺寸的特征图谱的目标检测后的语义信息，使目标检测结果更准确。

作为一种实施方式，步骤S340还可以通过以下子步骤实现：

对尺寸较小的特征图谱进行目标检测，得到对应的目标检测结果，并将该特征图谱的目标检测结果映射到尺寸较大的特征图谱，再基于映射后的目标检测结果对尺寸较大的特征图谱进行目标检测。

详细地，参考图5的网络结构，以上子步骤可以为：

对第六卷积层组的特征图谱进行目标检测，并将检测结果映射到第一特征融合函数的特征图谱上；

基于第六卷积层组的特征图谱的映射后的目标检测结果对第一特征融合函数的特征图谱进行目标检测，并将检测结果映射到第二特征融合函数的特征图谱上；

基于第一特征融合函数的特征图谱的映射后的目标检测结果对第二特征融合函数的特征图谱进行目标检测，并将检测结果映射到第三特征融合函数的特征图谱上；

基于第二特征融合函数的特征图谱映射后的目标检测结果对第三特征融合函数的特征图谱进行目标检测，并将检测结果映射到第四特征融合函数的特征图谱上；

基于第三特征融合函数的特征图谱映射后的目标检测结果对第四特征融合函数的特征图谱进行目标检测，并将检测结果映射到当前帧图像上，并将第四特征融合函数的特征图谱映的映射后的目标检测结果作为当前帧图像的目标检测结果。

例如，如果，当前帧图像的尺寸为1024×576×3、第六卷积层组的特征图谱为16×9×3、、第一特征融合函数的特征图谱为32×18×3、第二特征融合函数的特征图谱为64×36×3、第三特征融合函数的特征图谱为128×72×3、第四特征融合函数的特征图谱为256×144×3。

则对应的，上述过程可以为：将尺寸为16×9×3进行目标检测，将得到的16×9×3的目标检测结果映射到尺寸为32×18×3的特征图像上，基于图像映射结果对尺寸为32×18×3的特征图像进行目标检测，将得到的32×18×3的目标检测结果映射到尺寸为64×36×3的特征图像上，基于图像映射结果对尺寸为64×36×3的特征图像进行目标检测，将得到的128×72×3的目标检测结果映射到尺寸为128×72×3的特征图像上，基于图像映射结果对尺寸为256×144×3的特征图像进行目标检测，将得到的256×144×3的目标检测结果映射到尺寸为1024×576×3的当前帧图像上，得到当前帧图像的目标检测结果。

基于上述设计，减少了尺寸不同的特征图像的目标检测计算量，提高了算法的实时性。

请参考图6和图7，为本实施例提供的目标检测方法的目标检测效果图，目标检测效果图用边框的形式标注了当前帧图像中的各个目标，可以理解，本申请提供的图6和图7是多通道彩色图像转化为灰度图像的结果，当前帧图像可以为RGB图像，图6和图7中的边框可以为不同颜色以区别各个目标的类型。

其中，图6为夜晚道路的目标检测效果图，可以看到在前景目标和背景块都较为昏暗的情况下，本实施例提供的目标检测方法仍有较好的目标检测效果。

其中，图7为白天较为拥挤的道路的目标检测效果图，可以看到在前景目标较为小且较为密集的情况下，本实施例提供的目标检测方法仍有较好的目标检测效果。

在本申请所提供的实施例中，应该理解到，所揭露的装置和方法，也可以通过其它的方式实现。以上所描述的装置和方法实施例仅仅是示意性的，例如，附图中的流程图和框图显示了根据本申请的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分，所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现方式中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或动作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

另外，在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分，也可以是各个模块单独存在，也可以两个或两个以上模块集成形成一个独立的部分。

可以替换的，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其它可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的电子设备、服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘SolidStateDisk(SSD))等。

需要说明的是，在本文中，术语"包括"、"包含"或者其任何其它变体意在涵盖非排它性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其它要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句"包括一个……"限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

对于本领域技术人员而言，显然本申请不限于上述示范性实施例的细节，而且在不背离本申请的精神或基本关键的情况下，能够以其它的具体形式实现本申请。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本申请的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

Claims

1.一种目标检测方法，其特征在于，应用于电子设备，所述方法包括：

获取当前帧图像并将所述当前帧图像输入到目标检测模型中；

通过第一特征提取网络提取所述当前帧图像的第一图像特征以及第一中间特征组，并将所述第一图像特征输入到第二特征提取网络和定位分类网络中，同时将所述第一中间特征组输入到所述第二特征提取网络中，其中，所述第一中间特征组为所述第一特征提取网络包括的多个卷积层组中预设卷积层组对所述当前帧图像所提取到的特征图谱，所述第一图像特征为最后一个卷积层组对所述当前帧图像所提取到的特征图谱；

通过所述第二特征提取网络对所述第一图像特征和所述第一中间特征组进行上采样运算以及特征融合运算，得到第二图像特征组，将所述第二图像特征组输入到所述定位分类网络中；

通过所述定位分类网络根据所述第一图像特征和所述第二图像特征组对所述当前帧图像中的各个目标进行定位分类，得到所述当前帧图像的目标检测结果，其中，所述目标检测结果由所述第一图像特征的特征图谱以及所述第二图像特征组中的各个特征图谱的各个目标的检测结果进行融合得到。

2.根据权利要求1所述的目标检测方法，其特征在于，所述第一特征提取网络包括多个依次连接的卷积层组，所述通过第一特征提取网络提取所述当前帧图像的第一图像特征以及第一中间特征组的步骤，包括：

依次通过每个卷积层组提取所述当前帧图像的特征图谱；

将所述多个依次连接的卷积层组中的预设卷积层组提取得到的特征图谱作为所述第一中间特征组；

3.根据权利要求1所述的目标检测方法，其特征在于，所述通过所述第二特征提取网络对所述第一图像特征和所述第一中间特征组进行上采样运算以及特征融合运算，得到第二图像特征组的步骤，包括：

将所述第一图像特征的特征图谱输入到对应的数据变换层，并将所述第一中间特征组中的各个特征图谱输入到对应的特征融合函数；

通过各个数据变换层将对应的特征图谱进行上采样，得到上采样后的特征图谱，并将所述上采样后的特征图谱输入到对应的特征融合函数；

4.根据权利要求3所述的目标检测方法，其特征在于，所述将所述第一图像特征的特征图谱输入到对应的数据变换层，并将所述第一中间特征组中的各个特征图谱输入到对应的特征融合函数的步骤，包括：

将所述第一图像特征的特征图谱输入到对应的特征卷积层，得到卷积后的特征图谱，并将所述卷积后的特征图谱输入到对应的数据变换层；

5.根据权利要求1所述的目标检测方法，其特征在于，所述通过所述定位分类网络根据所述第一图像特征和所述第二图像特征组对所述当前帧图像中的各个目标进行定位分类，得到所述当前帧图像的目标检测结果的步骤，包括：

通过边框定位网络获取所述第一图像特征的特征图谱和所述第二图像特征组中的各个特征图谱的各个目标的定位信息，并将所述各个目标的定位信息发送到特征分类网络；

通过所述特征分类网络对所述各个目标的定位信息进行特征分类，得到所述第一图像特征的特征图谱以及所述第二图像特征组中的各个特征图谱的各个目标的检测结果；

6.根据权利要求5所述的目标检测方法，其特征在于，所述将所述第一图像特征的特征图谱以及所述第二图像特征组中的各个特征图谱的各个目标的检测结果进行融合，得到当前帧图像的目标检测结果的步骤，包括：

将所述第一图像特征的特征图谱和所述第二图像特征组中的各个特征图谱的各个目标的检测结果映射到所述当前帧图像上，得到映射后的所述第一图像特征的特征图谱和所述第二图像特征组中的各个特征图谱的各个目标的检测结果；

7.根据权利要求1所述的目标检测方法，其特征在于，所述获取当前帧图像并将所述当前帧图像输入到所述目标检测模型中的步骤，包括：

获取当前帧图像；

8.根据权利要求1-7中任意一项所述的目标检测方法，其特征在于，所述获取当前帧图像的步骤之前，所述方法包括：

配置所述目标检测模型；

所述配置所述目标检测模型的方法，包括：

建立目标检测训练模型，所述目标检测训练模型包括相互连接的第一特征提取网络、第二特征提取网络和定位分类网络以及与所述定位分类网络连接的损失计算函数；

响应用户操作，对所述目标检测训练模型的网络参数进行初始化，其中，所述网络参数包括所述第一特征提取网络、所述第二特征提取网络以及所述定位分类网络的网络参数；

获取训练样本，并将训练样本集中的每个训练样本图像输入到所述目标检测训练模型中，通过所述第一特征提取网络提取每个训练样本图像的第一图像特征和第一中间特征组，并将所述第一图像特征输入到所述第二特征提取网络和所述定位分类网络中，同时将所述第一中间特征组输入到所述第二特征提取网络中；

通过所述定位分类网络根据所述第一图像特征和所述第二图像特征组对所述当前帧图像中的各个目标进行定位分类，得到所述当前帧图像的目标检测结果，其中，目标检测结果包括各个目标的位置信息和分类信息；

将所述当前帧图像的目标检测结果中的各个目标的位置信息发送给边框回归损失函数进行计算以得到该训练样本图像的边框回归损失函数值，将所述当前帧图像的目标检测结果中的各个目标的分类信息发送给焦点损失函数以得到该训练样本图像的焦点损失函数值；

根据该训练样本图像的边框回归损失函数值和焦点损失函数值得到该训练样本图像的损失函数值；

根据所述损失函数值计算对应的反向梯度值，并根据所述反向梯度值，利用链式导数传导法计算所述目标检测训练模型的网络参数的偏导数；

基于所述偏导数更新所述目标检测训练模型的网络参数；

9.一种目标检测装置，其特征在于，应用于电子设备，所述目标检测装置包括：

图像获取模块，用于获取当前帧图像并将所述当前帧图像输入到目标检测模型中；

第一特征提取模块，用于提取所述当前帧图像的第一图像特征以及第一中间特征组，其中，所述第一中间特征组为所述第一特征提取网络包括的多个卷积层组中预设卷积层组对所述当前帧图像所提取到的特征图谱，所述第一图像特征为最后一个卷积层组对所述当前帧图像所提取到的特征图谱；

第二特征提取模块，用于对所述第一图像特征和所述第一中间特征组进行上采样运算以及特征融合运算，得到第二图像特征组；以及

定位分类模块，用于根据所述第一图像特征和所述第二图像特征组对所述当前帧图像中的各个目标进行定位分类，得到所述当前帧图像的目标检测结果，其中，所述目标检测结果由所述第一图像特征的特征图谱以及所述第二图像特征组中的各个特征图谱的各个目标的检测结果进行融合得到。

10.一种可读存储介质，其特征在于，所述可读存储介质中存储有计算机程序，所述计算机程序被执行时实现权利要求1-8中任意一项所述的目标检测方法。