CN116309274B

CN116309274B - 图像中小目标检测方法、装置、计算机设备及存储介质

Info

Publication number: CN116309274B
Application number: CN202211590968.5A
Authority: CN
Inventors: 陈晓红; 杨俊丰; 胡东滨; 徐雪松; 曹文治; 张震; 马涛
Original assignee: Hunan Red Pu Innovation Technology Development Co ltd
Current assignee: Hunan Red Pu Innovation Technology Development Co ltd
Priority date: 2022-12-12
Filing date: 2022-12-12
Publication date: 2024-01-30
Anticipated expiration: 2042-12-12
Also published as: CN116309274A

Abstract

本发明涉及目标检测领域，公开了一种图像中小目标检测方法、装置、计算机设备及存储介质，所述方法包括：获取待检测图像，并将所述待检测图像输入预训练好的超分辨模型中，确定所述待检测图像对应的高分辨特征；基于第二特征提取网络，对所述待检测图像进行特征提取，并根据提取到的所有特征构建初始特征金字塔；将所述初始特征金字塔和所述高分辨特征中相同尺寸的特征图分别执行融合处理，并根据得到的所有融合结果确定融合特征金字塔；基于所述融合特征金字塔，对所述待检测图像进行小目标检测，确定检测结果，采用本发明提高对图像中小目标进行检测时的检测精度。

Description

图像中小目标检测方法、装置、计算机设备及存储介质

技术领域

本发明涉及目标检测领域，尤其涉及一种图像中小目标检测方法、装置、计算机设备及存储介质。

背景技术

目标检测是计算机视觉领域的最关键任务之一，也是许多其他计算机视觉任务的基础，其目的是对给定的图像或视频中所有感兴趣的对象进行分类和定位。

近年来，在深度学习技术的推动下，目标检测取得突破性进展，涌现出诸多性能优良的算法。如基于卷积神经网络(Convolutional Neural Network，CNN)的算法，CNN算法主要包括单阶段和两阶段目标检测算法。但在处理图像具有几个或者几十个像素的小目标时，由于CNN中的下采样操作易过滤掉小目标的像素，使得小目标的信息丢失严重，从而导致CNN对小目标进行检测时，存在精度低的问题。

因此，现有方式对图像中小目标进行检测时存在精度低的技术问题。

发明内容

本发明实施例提供一种图像中小目标检测方法、装置、计算机设备和存储介质，以提高对图像中小目标进行检测时的检测精度。

为了解决上述技术问题，本申请实施例提供一种图像中小目标检测方法，包括：

获取待检测图像，并将所述待检测图像输入预训练好的超分辨模型中，确定所述待检测图像对应的高分辨特征，其中，所述超分辨模型是基于第一特征提取网络和条件变分自编码网络构建的，所述条件变分自编码网络用于提取所述待检测图像对应的高分辨率特征，所述高分辨率特征包括至少两个不同尺寸的特征图；

基于第二特征提取网络，对所述待检测图像进行特征提取，并根据提取到的所有特征构建初始特征金字塔，其中，所述初始特征金字塔包括至少一个特征图，所述高分辨特征中的特征图与所述初始特征金字塔中的特征图在尺寸上存在一对一的关系；

将所述初始特征金字塔和所述高分辨特征中相同尺寸的特征图分别执行融合处理，并根据得到的所有融合结果确定融合特征金字塔；

基于所述融合特征金字塔，对所述待检测图像进行小目标检测，确定检测结果。

为了解决上述技术问题，本申请实施例还提供一种图像中小目标检测装置，包括：

高分辨特征确定模块，用于获取待检测图像，并将所述待检测图像输入预训练好的超分辨模型中，确定所述待检测图像对应的高分辨特征，其中，所述超分辨模型是基于第一特征提取网络和条件变分自编码网络构建的，所述条件变分自编码网络用于提取所述待检测图像对应的高分辨率特征，所述高分辨率特征包括至少两个不同尺寸的特征图；

初始特征金字塔构建模块，用于基于第二特征提取网络，对所述待检测图像进行特征提取，并根据提取到的所有特征构建初始特征金字塔，其中，所述初始特征金字塔包括至少一个特征图，所述高分辨特征中的特征图与所述初始特征金字塔中的特征图在尺寸上存在一对一的关系；

融合模块，用于将所述初始特征金字塔和所述高分辨特征中相同尺寸的特征图分别执行融合处理，并根据得到的所有融合结果确定融合特征金字塔；

目标检测模块，用于基于所述融合特征金字塔，对所述待检测图像进行小目标检测，确定检测结果。

为了解决上述技术问题，本申请实施例还提供一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述图像中小目标检测方法的步骤。

为了解决上述技术问题，本申请实施例还提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述图像中小目标检测方法的步骤。

本发明实施例提供的图像中小目标检测方法、装置、计算机设备及存储介质，通过获取待检测图像，并将所述待检测图像输入预训练好的超分辨模型中，确定所述待检测图像对应的高分辨特征；基于第二特征提取网络，对所述待检测图像进行特征提取，并根据提取到的所有特征构建初始特征金字塔；将所述初始特征金字塔和所述高分辨特征中相同尺寸的特征图分别执行融合处理，并根据得到的所有融合结果确定融合特征金字塔；基于所述融合特征金字塔，对所述待检测图像进行小目标检测，确定检测结果，通过在特征金字塔中融入高分辨率特征，可以有效达到增强小目标信息的目的，进而提高对图像中小目标进行检测时的检测精度。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例的描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅5仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本申请可以应用于其中的示例性系统架构图；

图2是本申请的图像中小目标检测方法的一个实施例的流程图；

图3是本申请的图像中超分辨模型和特征金字塔的一个实施例的流程图；

图4是根据本申请的图像中小目标检测装置的一个实施例的结构示意图；

图5是根据本申请的计算机设备的一个实施例的结构示意图。

具体实施方式

除非另有定义，本文所使用的所有的技术和科学术语与属于本申请的技5术领域的技术人员通常理解的含义相同；本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的，不是旨在于限制本申请；本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形，意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述

附图中的术语“第一”、“第二”等是用于区别不同对象，而不是用于描述特定顺0序。

在本文中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参阅图1，如图1所示，系统架构100可以包括终端设备101、102、103，网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。

用户可以使用终端设备101、102、103通过网络104与服务器105交互，以接收或发送消息等。

终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备，包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture EpertsGroup Audio Layer III，动态影像专家压缩标准音频层面3)、MP4(Moving PictureEperts Group Audio Layer IV，动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。

服务器105可以是提供各种服务的服务器，例如对终端设备101、102、103上显示的页面提供支持的后台服务器。

需要说明的是，本申请实施例所提供的图像中小目标检测方法由服务器执行，相应地，图像中小目标检测装置设置于服务器中。

应该理解，图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器，本申请实施例中的终端设备101、102、103具体可以对应的是实际生产中的应用系统。

请参阅图2，图2示出本发明实施例提供的一种图像中小目标检测方法，以该方法应用在图1中的服务端为例进行说明，详述如下：

S201、获取待检测图像，并将待检测图像输入预训练好的超分辨模型中，确定待检测图像对应的高分辨特征，其中，超分辨模型是基于第一特征提取网络和条件变分自编码网络构建的，条件变分自编码网络用于提取待检测图像对应的高分辨率特征，高分辨率特征包括至少两个不同尺寸的特征图。

在步骤S201中，其具体是，获取待检测图像，并将待检测图像输入预训练好的超分辨模型中。采用超分辨模型的第一特征提取网络，对待检测图像进行特征提取，得到图像特征。基于图像特征和待检测图像，采用超分辨模型中的条件变分自编码网络进行高分辨特征计算，确定待检测图像对应的高分辨特征。

上述待检测图像的获取方式包括但不限于相机图片、视频帧图像。其具体可根据实际情况进行获取。

上述预训练好的超分辨模型是用于对图像进行超分辨处理的模型。

通过训练集和测试集，对基于第一特征提取网络和条件变分自编码网络构建的超分辨模型进行训练，直到训练完毕后，得到训练好的超分辨模型。

其中，上述训练集包括参考图像和低分辨率图像，参考图像为高清图像或高分辨率图像。第一特征提取网络用于对训练集中的参考图像和低分辨率图像分别进行特征提取，得到参考特征图和低分辨率特征图。条件变分自编码网络用于解决两个问题，一是将参考特征图进行映射到隐藏空间，以学习显示分布，并从显示分布中采样出对应模式，作为条件特征，用于调制低分辨率特征。二是从低分辨率特征图学习出均值图和方差图，并将均值图、方差图和条件特征一起进行计算，得到估计特征，并基于该估计特征重构得到高分辨率图像。

应理解，由于参考图像可以是任意高分辨率图像，而不一定是低分辨率图像对应的真实高分辨率图像，重构的高分辨率图像在内容和风格上都与参考图像相似，因此，在训练过程中需要引入损失函数。该损失函数包括但不限于KL散度损失函数(KL，Kullback-Leibler Divergence)、内容损失函数、风格损失函数、TV损失函数(TV，Total Variation，全变分损失函数)以及LPIPS损失函数(LPIPS，Learned Perceptual Image PatchSimilarity，感知损失函数)中的一种或多种。损失函数的选取可根据对精确度的具体要求进行适当调整。

下面以一具体实施例说明上述超分辨模型的训练过程，详细如下：

假设训练集为DIV2K数据集，DIV2K数据集包含1000张高清图像，以及若干张基于高清图像退化的低分辨率图像。其中，训练集、验证集和测试集的图像比例为8：1：1。假设第一特征提取网络为VGG-19网络。

首先，使用预训练的VGG-19网络从参考图像和低分辨率图像中提取参考特征图和低分辨率特征图。特别的，参考图像可以是任意高分辨率图像，采用DIV2K中的高清图像作为参考图像，以及高清图像对应的退化图像作为低分辨率图像。在将参考图像和低分辨率图像输入到VGG-19网络之前，先将参考图像和低分辨率图像的尺寸统一为256×256个像素大小，采用的方法是双线性插值。最终提取到的参考特征图和低分辨率特征图的大小均为32×32×512。基于参考特征图和低分辨率特征图，使用条件变分自编码网络获取估计特征，并使用条件变分自编码网络的解码器将估计特征上采样到原图像大小，即256×256。

如图3所示的超分辨模型，本申请实施例中的超分辨模型得到高分辨特征，该高分辨特征包括3个尺寸大小不一样的特征图J₃、特征图J₂和特征图J₁，其中，特征图J₃的大小为64×64，特征图J₂的大小为128×128，特征图J₁的大小为256×256。

通过获取待检测图像，并将待检测图像输入预训练好的超分辨模型中，确定待检测图像对应的高分辨特征，以便于后续在特征金字塔中融入高分辨率特征，可以有效达到增强小目标信息的目的，进而提高对图像中小目标进行检测时的检测精度。

S202、基于第二特征提取网络，对待检测图像进行特征提取，并根据提取到的所有特征构建初始特征金字塔，其中，初始特征金字塔包括至少一个特征图，高分辨特征中的特征图与初始特征金字塔中的特征图在尺寸上存在一对一的关系。

在步骤S202中，上述第二特征提取网络包括但不限于resnet残差网络、densenet卷积神经网络、ResNet-50深度残差网络。具体可根据实际情况进行调整。

优选地，本申请实施例采用50层的ResNet-50深度残差网络作为第二特征提取网络，对输入到超分辨网络中的待检测图像中的图像进行特征提取，得到特征金字塔C＝{C₂，C₃，C₄，C₅}，其中C₂，C₃，C₄，C₅分别表示ResNet-50深度残差网络中Conv2_x，Conv3_x，Conv4_x，Conv5_x最后1个残差块的输出，分别对应于输入图像的下采样倍数为4，8，16，32。具体可参见附图3。

若第二特征提取网络采用其他网络，如densenet卷积神经网络，特征金字塔C＝{C₂，C₃，C₄，C₅}中的C₂，C₃，C₄，C₅将分别表示densenet卷积神经网络中DenseBlock1，DenseBlock2，DenseBlock3，DenseBlock4的输出。

此处需要注意的是，初始特征金字塔包含的特征图比高分辨特征中的特征图多了一个特征图，即特征图C₅，其他特征图的尺寸一一对应，即特征图C₂与特征图J₂的尺寸一致，特征图C₃与特征图J₃的尺寸一致，特征图C₄与特征图J₄的尺寸一致。

通过第二特征提取网络，对待检测图像进行特征提取，并根据提取到的所有特征构建初始特征金字塔，以便于后续在特征金字塔中融入高分辨率特征，可以有效达到增强小目标信息的目的，进而提高对图像中小目标进行检测时的检测精度。

S203、将初始特征金字塔和高分辨特征中相同尺寸的特征图分别执行融合处理，并根据得到的所有融合结果确定融合特征金字塔。

在步骤S203中，其具体是，将高分辨特征与初始特征金字塔中上下采样过程中相同尺寸的特征图进行融合，得到特征增强的特征金字塔，即融合特征金字塔。

应理解，本申请实施例中的高分辨特征是在超分辨过程中产生的特征图，而不是超分辨过程后产生的特征。

通过在特征金字塔中融入高分辨率特征，可以有效达到增强小目标信息的目的，进而提高对图像中小目标进行检测时的检测精度。

S204、基于融合特征金字塔，对待检测图像进行小目标检测，确定检测结果。

在步骤S204中，其具体是，对融合特征金字塔进行检测，得到目标的位置、类别和置信度，并根据上述内容，确定检测结果。

在本实施例中，通过上述步骤，实现在特征金字塔中融入高分辨率特征，可以有效达到增强小目标信息的目的，进而提高对图像中小目标进行检测时的检测精度。

在本实施例的一些可选的实现方式中，在步骤S201中，获取待检测图像，并将待检测图像输入预训练好的超分辨模型中，确定待检测图像对应的高分辨特征的步骤包括S2011至S2016：

S2011、获取待检测图像。

S2012、基于无参考图像质量评价算法对待检测图像进行质量评分，得到评分结果。

S2013、基于评分结果，确定待检测图像的图像质量类型。

S2014、将待检测图像和待检测图像的图像质量类型输入预训练好的超分辨模型中。

S2015、采用超分辨模型的第一特征提取网络，对待检测图像进行特征提取，得到图像特征。

S2016、基于图像特征、待检测图像和待检测图像的图像质量类型，采用超分辨模型中的条件变分自编码网络进行高分辨特征计算，确定待检测图像对应的高分辨特征。

对于步骤S2011，获取待检测图像，并对所有待检测图像进行尺寸统一、随机翻转的预处理。其中，图像的统一尺寸为512×512个像素大小，随机翻转的概率为0.5。处理后的待检测图像，记为{I_X|x＝1，2，……，X}；其中I_X表示第x张待检测图像，X表示待检测图像集中的图像数量。

对于步骤S2012，上述无参考图像质量评价算法用于判断待检测图像属于低分辨率图像还是高分辨率图像的算法。

上述评分结果即图像的质量分数，图像的质量分数将被归一化到[0,1]之间。

对于步骤S2013，其具体是，根据评分结果与预设阈值对比，得到对比结果。若对比结果为评分结果低于预设阈值，则待检测图像为低分辨率图像，若对比结果为评分结果不低于预设阈值，则待检测图像为高分辨率图像。

假设预设阈值为0.6，即当图像的质量分数不小于0.6时，该图像属于高分辨率图像。当图像的质量分数小于0.6时，该图像属于低分辨率图像。

对于步骤S2014，若图像属于低分辨率图像，其在进行超分辨时，将超分辨模型中的高清图像作为参考图像来指导其对应的高分辨率特征的生成。若图像属于高分辨率图像，则其在进行超分辨时，将采用自身作为参考图像来指导其对应的高分辨率特征的生成。

对于步骤S2016，其具体是：采用条件变分自编码网络的编码器，对图像特征和待检测图像进行均值计算，得到均值结果。采用条件变分自编码网络的编码器，对图像特征和待检测图像进行方差计算，得到方差结果。基于均值结果和方差结果，确定隐变量。将隐变量、图像特征和待检测图像的图像质量类型作为条件变分自编码网络的解码器的输入，并基于条件变分自编码网络的解码器进行高分辨特征计算，确定待检测图像对应的高分辨特征。

其中，均值结果和方差结果可通过对超分辨模型中的高清图像作为参考图像学习得到一个生成模型，例如，学习参考图像像素之间的相关关系，并将其作为概率模型，计算均值结果和方差结果。

上述隐变量可根据如下公式(1)确定：

z＝μ+ε·σ (1)

其中，z为隐变量，μ为均值结果，σ为方差的平方根，ε为常数。

在本实施例中，通过在特征金字塔中融入高分辨率特征，可以有效达到增强小目标信息的目的，进而提高对图像中小目标进行检测时的检测精度。同时，利用无参考图像质量评价算法实现图像自适应超分，以提高算法检测效率。

在本实施例的一些可选的实现方式中，在步骤S203中，将初始特征金字塔和高分辨特征中相同尺寸的特征图分别执行融合处理，并根据得到的所有融合结果确定融合特征金字塔的步骤包括S2031至S2037：

S2031、按照特征图尺寸从大到小的顺序，依次将从初始特征金字塔中选取出的特征图作为当前金字塔特征图。

S2032、若当前金字塔特征图为尺寸最大的特征图时，则对当前金字塔特征图进行降维和卷积处理，得到当前金字塔特征图对应的融合特征图。

S2033、对当前金字塔特征图进行上采样处理，确定当前上采样特征图。

S2034、若当前金字塔特征图不为尺寸最大的特征图时，则对当前金字塔特征图进行降维处理，得到当前降维特征图。

S2035、对当前降维特征图、当前上采样特征图和高分辨特征中相同尺寸的特征图进行融合和卷积处理，得到当前金字塔特征图对应的融合特征图。

S2036、当初始特征金字塔中的特征图未选取完毕，则对当前金字塔特征图进行上采样处理，并根据得到的结果更新当前上采样特征图，并返回所述若当前金字塔特征图不为尺寸最大的特征图时，则对当前金字塔特征图进行降维处理，得到当前降维特征图的步骤继续执行。

S2037、当初始特征金字塔中的特征图选取完毕时，根据得到的所有融合特征图，确定融合特征金字塔。

结合附图3对上述步骤S2031至S2037进行解释说明，按照特征图尺寸从大到小的顺序，依次将从初始特征金字塔C＝{C₂，C₃，C₄，C₅}中选取出的特征图作为当前金字塔特征图，也就是一开始选取的时特征图C₅。

对于特征图C₅，该特征图为当前金字塔特征图为尺寸最大的特征图，则使用1×1的卷积对特征图C₅进行降维处理并对降维处理后的特征图进行1个3×3的卷积操作生成C₅对应的融合特征图，并使用最近邻插值方法对特征图C₅进行2倍上采样操作以得到当前上采样特征图P₅。

对于特征图C₄，该特征图不是当前金字塔特征图为尺寸最大的特征图，则使用1×1的卷积对特征图C₄进行降维处理，得到当前降维特征图C₄’，此时，当前上采样特征图P₅、当前降维特征图C₄’和高分辨特征图中的特征图J₃的尺寸一致。将当前上采样特征图P₅、当前降维特征图C₄’和高分辨特征图中的特征图J₃按元素进行叠加融合，并对融合后的特征图进行1个3×3的卷积操作生成C₄对应的融合特征图。

对于特征图C₃和C₂，其执行过程与特征图C₄一致，此处不在赘述。

对融合得到的特征图进行卷积操作时为了减轻最近邻插值带来的混叠影响，提高检测的准确率。

在本实施例中，通过在特征金字塔中融入高分辨率特征，可以有效达到增强小目标信息的目的，进而有效提高对图像中小目标进行检测时的检测精度。

在本实施例的一些可选的实现方式中，在步骤S204中，基于融合特征金字塔，对待检测图像进行小目标检测，确定检测结果的步骤包括：

S2041、基于预设先验框，对融合特征金字塔中的融合特征图进行边界框预测，得到至少一个预测边界框。

S2042、对所有预测边界框进行卷积和分类处理，得到每一个预测边界框的预测类别。

S2043、根据预测类别为小目标的预测边界框所在的位置，确定检测结果。

对于步骤S2041，上述预设先验框可根据实际情况具体调整。

优选地，本申请采用4个不同尺度预设先验框。

对于步骤S2042，对融合特征金字塔中的融合特征图进行单元格化，并对单元格化后的融合特征图使用不同尺度的预设先验框进行边界框预测。对于每个先验框，使用1个3×3卷积回归得到其对应的待检测目标的的边界框的预测位置，使用1个3×3卷积分类得到其对应的待检测目标的预测类别及置信度。

对于步骤S2043，其具体是，对预测类别为小目标的预测边界框执行非极大值抑制处理，并将通过非极大值抑制处理的预测边界框所在的位置，作为检测结果。

由于对于同一待检测目标可能会产生大量的预测框，因此利用非极大值抑制找出待检测目标的最佳预测框。即对同一待检测目标基于融合特征金字塔中的融合特征图产生的所有预测框进行非极大值抑制后得到其最终的检测框。使用OpenCV将待检测目标的位置、类别以及置信度的检测结果可视化地呈现在图像上。在本实施例中，通过对融合特征金字塔中的融合特征图进行边界框预测，并对预测结果进行卷积和分类处理，能快速准确确定出小目标的位置，提高对图像中小目标进行检测时的检测精度。

应理解，上述实施例中各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本发明实施例的实施过程构成任何限定。

图4示出与上述实施例图像中小目标检测方法一一对应的图像中小目标检测装置的原理框图。如图4所示，该图像中小目标检测装置包括高分辨特征确定模块31、初始特征金字塔构建模块32、融合模块33和目标检测模块34。各功能模块详细说明如下：

高分辨特征确定模块31，用于获取待检测图像，并将待检测图像输入预训练好的超分辨模型中，确定待检测图像对应的高分辨特征，其中，超分辨模型是基于第一特征提取网络和条件变分自编码网络构建的，条件变分自编码网络用于提取待检测图像对应的高分辨率特征，高分辨率特征包括至少两个不同尺寸的特征图。

初始特征金字塔构建模块32，用于基于第二特征提取网络，对待检测图像进行特征提取，并根据提取到的所有特征构建初始特征金字塔，其中，初始特征金字塔包括至少一个特征图，高分辨特征中的特征图与初始特征金字塔中的特征图在尺寸上存在一对一的关系。

融合模块33，用于将初始特征金字塔和高分辨特征中相同尺寸的特征图分别执行融合处理，并根据得到的所有融合结果确定融合特征金字塔。

目标检测模块34，用于基于融合特征金字塔，对待检测图像进行小目标检测，确定检测结果。

在本实施例的一些可选的实现方式中，高分辨特征确定模块31包括：

待检测图像获取单元，用于获取待检测图像。

评分结果确定单元，用于基于无参考图像质量评价算法对待检测图像进行质量评分，得到评分结果。

图像质量类型确定单元，用于基于评分结果，确定待检测图像的图像质量类型。

输入单元，用于将待检测图像和待检测图像的图像质量类型输入预训练好的超分辨模型中。

图像特征确定单元，用于采用超分辨模型的第一特征提取网络，对待检测图像进行特征提取，得到图像特征。

高分辨特征确定单元，用于基于图像特征、待检测图像和待检测图像的图像质量类型，采用超分辨模型中的条件变分自编码网络进行高分辨特征计算，确定待检测图像对应的高分辨特征。在本实施例的一些可选的实现方式中，高分辨特征确定单元包括：

均值结果确定单元，用于采用条件变分自编码网络的编码器，对图像特征和待检测图像进行均值计算，得到均值结果。

方差结果确定单元，用于采用条件变分自编码网络的编码器，对图像特征和待检测图像进行方差计算，得到方差结果。

隐变量确定单元，用于基于均值结果和方差结果，确定隐变量。

特征计算单元，用于将隐变量、图像特征和待检测图像的图像质量类型作为条件变分自编码网络的解码器的输入，并基于条件变分自编码网络的解码器进行高分辨特征计算，确定待检测图像对应的高分辨特征。

在本实施例的一些可选的实现方式中，融合模块33包括：

当前金字塔特征图确定单元，用于按照特征图尺寸从大到小的顺序，依次将从初始特征金字塔中选取出的特征图作为当前金字塔特征图。

第一融合特征图确定单元，用于若当前金字塔特征图为尺寸最大的特征图时，则对当前金字塔特征图进行降维和卷积处理，得到当前金字塔特征图对应的融合特征图。

上采样单元，用于对当前金字塔特征图进行上采样处理，确定当前上采样特征图。

降维单元，用于若当前金字塔特征图不为尺寸最大的特征图时，则对当前金字塔特征图进行降维处理，得到当前降维特征图。

第二融合特征图确定单元，用于对当前降维特征图、当前上采样特征图和高分辨特征中相同尺寸的特征图进行融合和卷积处理，得到当前金字塔特征图对应的融合特征图。

循环单元，用于当初始特征金字塔中的特征图未选取完毕，则对当前金字塔特征图进行上采样处理，并根据得到的结果更新当前上采样特征图，并返回若当前金字塔特征图不为尺寸最大的特征图时，则对当前金字塔特征图进行降维处理，得到当前降维特征图的步骤继续执行。

融合特征金字塔确定单元，用于当初始特征金字塔中的特征图选取完毕时，根据得到的所有融合特征图，确定融合特征金字塔。

在本实施例的一些可选的实现方式中，目标检测模块34包括：

预测边界框确定单元，用于基于预设先验框，对融合特征金字塔中的融合特征图进行边界框预测，得到至少一个预测边界框。

预测类别确定单元，用于对所有预测边界框进行卷积和分类处理，得到每一个预测边界框的预测类别。

检测结果确定单元，用于根据预测类别为小目标的预测边界框所在的位置，确定检测结果。

在本实施例的一些可选的实现方式中，检测结果确定单元包括：

非极大值抑制单元，用于对预测类别为小目标的预测边界框执行非极大值抑制处理，并将通过非极大值抑制处理的预测边界框所在的位置，作为检测结果。

关于图像中小目标检测装置的具体限定可以参见上文中对于图像中小目标检测方法的限定，在此不再赘述。上述图像中小目标检测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

为解决上述技术问题，本申请实施例还提供计算机设备。具体请参阅图5，图5为本实施例计算机设备基本结构框图。

所述计算机设备4包括通过系统总线相互通信连接存储器41、处理器42、网络接口43。需要指出的是，图中仅示出了具有组件连接存储器41、处理器42、网络接口43的计算机设备4，但是应理解的是，并不要求实施所有示出的组件，可以替代的实施更多或者更少的组件。其中，本技术领域技术人员可以理解，这里的计算机设备是一种能够按照事先设定或存储的指令，自动进行数值计算和/或信息处理的设备，其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit，ASIC)、可编程门阵列(Field－Programmable Gate Array，FPGA)、数字处理器(Digital Signal Processor，DSP)、嵌入式设备等。

所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。

所述存储器41至少包括一种类型的可读存储介质，所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如，SD或D界面显示存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中，所述存储器41可以是所述计算机设备4的内部存储单元，例如该计算机设备4的硬盘或内存。在另一些实施例中，所述存储器41也可以是所述计算机设备4的外部存储设备，例如该计算机设备4上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)等。当然，所述存储器41还可以既包括所述计算机设备4的内部存储单元也包括其外部存储设备。本实施例中，所述存储器41通常用于存储安装于所述计算机设备4的操作系统和各类应用软件，例如电子文件的控制的程序代码等。此外，所述存储器41还可以用于暂时地存储已经输出或者将要输出的各类数据。

所述处理器42在一些实施例中可以是中央处理器(Central Processing Unit，CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器42通常用于控制所述计算机设备4的总体操作。本实施例中，所述处理器42用于运行所述存储器41中存储的程序代码或者处理数据，例如运行电子文件的控制的程序代码。

所述网络接口43可包括无线网络接口或有线网络接口，该网络接口43通常用于在所述计算机设备4与其他电子设备之间建立通信连接。

本申请还提供了另一种实施方式，即提供一种计算机可读存储介质，所述计算机可读存储介质存储有界面显示程序，所述界面显示程序可被至少一个处理器执行，以使所述至少一个处理器执行如上述的图像中小目标检测方法的步骤。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本申请各个实施例所述的方法。

显然，以上所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例，附图中给出了本申请的较佳实施例，但并不限制本申请的专利范围。本申请可以以许多不同的形式来实现，相反地，提供这些实施例的目的是使对本申请的公开内容的理解更加透彻全面。尽管参照前述实施例对本申请进行了详细的说明，对于本领域的技术人员来而言，其依然可以对前述各具体实施方式所记载的技术方案进行修改，或者对其中部分技术特征进行等效替换。凡是利用本申请说明书及附图内容所做的等效结构，直接或间接运用在其他相关的技术领域，均同理在本申请专利保护范围之内。

Claims

1.一种图像中小目标检测方法，其特征在于，所述图像中小目标检测方法包括：

获取待检测图像，并将所述待检测图像输入预训练好的超分辨模型中，确定所述待检测图像对应的高分辨率特征，其中，所述超分辨模型是基于第一特征提取网络和条件变分自编码网络构建的，所述条件变分自编码网络用于提取所述待检测图像对应的高分辨率特征，所述高分辨率特征包括至少两个不同尺寸的特征图；

基于第二特征提取网络，对所述待检测图像进行特征提取，并根据提取到的所有特征构建初始特征金字塔，其中，所述初始特征金字塔包括至少一个特征图，所述高分辨率特征中的特征图与所述初始特征金字塔中的特征图在尺寸上存在一对一的关系；

将所述初始特征金字塔和所述高分辨率特征中相同尺寸的特征图分别执行融合处理，并根据得到的所有融合结果确定融合特征金字塔；

基于所述融合特征金字塔，对所述待检测图像进行小目标检测，确定检测结果；

其中，所述获取待检测图像，并将所述待检测图像输入预训练好的超分辨模型中，确定所述待检测图像对应的高分辨率特征的步骤包括：

获取待检测图像；

基于无参考图像质量评价算法对所述待检测图像进行质量评分，得到评分结果；

基于所述评分结果，确定所述待检测图像的图像质量类型；

将所述待检测图像和所述待检测图像的图像质量类型输入预训练好的超分辨模型中；

采用所述超分辨模型的第一特征提取网络，对所述待检测图像进行特征提取，得到图像特征；

基于所述图像特征、所述待检测图像和所述待检测图像的图像质量类型，采用所述超分辨模型中的条件变分自编码网络进行高分辨率特征计算，确定所述待检测图像对应的高分辨率特征；

其中，所述基于所述图像特征、所述待检测图像和所述待检测图像的图像质量类型，采用所述超分辨模型中的条件变分自编码网络进行高分辨率特征计算，确定所述待检测图像对应的高分辨率特征的步骤包括：

采用所述条件变分自编码网络的编码器，对所述图像特征和所述待检测图像进行均值计算，得到均值结果；

采用所述条件变分自编码网络的编码器，对所述图像特征和所述待检测图像进行方差计算，得到方差结果；

基于所述均值结果和所述方差结果，确定隐变量；

将所述隐变量、所述图像特征和所述待检测图像的图像质量类型作为所述条件变分自编码网络的解码器的输入，并基于所述条件变分自编码网络的解码器进行高分辨率特征计算，确定所述待检测图像对应的高分辨率特征。

2.如权利要求1所述的图像中小目标检测方法，其特征在于，所述将所述初始特征金字塔和所述高分辨率特征中相同尺寸的特征图分别执行融合处理，并根据得到的所有融合结果确定融合特征金字塔的步骤包括：

按照特征图尺寸从大到小的顺序，依次将从所述初始特征金字塔中选取出的特征图作为当前金字塔特征图；

若所述当前金字塔特征图为尺寸最大的特征图时，则对所述当前金字塔特征图进行降维和卷积处理，得到所述当前金字塔特征图对应的融合特征图；

对所述当前金字塔特征图进行上采样处理，确定当前上采样特征图；

若所述当前金字塔特征图不为尺寸最大的特征图时，则对所述当前金字塔特征图进行降维处理，得到当前降维特征图；

对所述当前降维特征图、所述当前上采样特征图和所述高分辨率特征中相同尺寸的特征图进行融合和卷积处理，得到所述当前金字塔特征图对应的融合特征图；

当所述初始特征金字塔中的特征图未选取完毕，则对所述当前金字塔特征图进行上采样处理，并根据得到的结果更新所述当前上采样特征图，并返回所述若所述当前金字塔特征图不为尺寸最大的特征图时，则对所述当前金字塔特征图进行降维处理，得到当前降维特征图的步骤继续执行；

当所述初始特征金字塔中的特征图选取完毕时，根据得到的所有融合特征图，确定融合特征金字塔。

3.如权利要求1所述的图像中小目标检测方法，其特征在于，所述基于所述融合特征金字塔，对所述待检测图像进行小目标检测，确定检测结果的步骤包括：

基于预设先验框，对所述融合特征金字塔中的融合特征图进行边界框预测，得到至少一个预测边界框；

对所有所述预测边界框进行卷积和分类处理，得到每一个所述预测边界框的预测类别；

根据预测类别为小目标的预测边界框所在的位置，确定检测结果。

4.如权利要求3所述的图像中小目标检测方法，其特征在于，所述根据预测类别为小目标的预测边界框所在的位置，确定检测结果的步骤包括：

对预测类别为小目标的预测边界框执行非极大值抑制处理，并将通过非极大值抑制处理的预测边界框所在的位置，作为检测结果。

5.一种图像中小目标检测装置，其特征在于，所述图像中小目标检测装置包括：

高分辨率特征确定模块，用于获取待检测图像，并将所述待检测图像输入预训练好的超分辨模型中，确定所述待检测图像对应的高分辨率特征，其中，所述超分辨模型是基于第一特征提取网络和条件变分自编码网络构建的，所述条件变分自编码网络用于提取所述待检测图像对应的高分辨率特征，所述高分辨率特征包括至少两个不同尺寸的特征图；

初始特征金字塔构建模块，用于基于第二特征提取网络，对所述待检测图像进行特征提取，并根据提取到的所有特征构建初始特征金字塔，其中，所述初始特征金字塔包括至少一个特征图，所述高分辨率特征中的特征图与所述初始特征金字塔中的特征图在尺寸上存在一对一的关系；

融合模块，用于将所述初始特征金字塔和所述高分辨率特征中相同尺寸的特征图分别执行融合处理，并根据得到的所有融合结果确定融合特征金字塔；

目标检测模块，用于基于所述融合特征金字塔，对所述待检测图像进行小目标检测，确定检测结果；

其中，所述高分辨率特征确定模块包括：

待检测图像获取单元，用于获取待检测图像；

评分结果确定单元，用于基于无参考图像质量评价算法对所述待检测图像进行质量评分，得到评分结果；

图像质量类型确定单元，用于基于所述评分结果，确定所述待检测图像的图像质量类型；

输入单元，用于将所述待检测图像和所述待检测图像的图像质量类型输入预训练好的超分辨模型中；

图像特征确定单元，用于采用所述超分辨模型的第一特征提取网络，对所述待检测图像进行特征提取，得到图像特征；

高分辨率特征确定单元，用于基于所述图像特征、所述待检测图像和所述待检测图像的图像质量类型，采用所述超分辨模型中的条件变分自编码网络进行高分辨率特征计算，确定所述待检测图像对应的高分辨率特征；

其中，所述高分辨特征确定单元包括：

均值结果确定单元，用于采用条件变分自编码网络的编码器，对图像特征和待检测图像进行均值计算，得到均值结果；

方差结果确定单元，用于采用条件变分自编码网络的编码器，对图像特征和待检测图像进行方差计算，得到方差结果；

隐变量确定单元，用于基于均值结果和方差结果，确定隐变量；

6.一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至4任一项所述的图像中小目标检测方法。

7.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至4任一项所述的图像中小目标检测方法。