CN113610087A

CN113610087A - 一种基于先验超分辨率的图像小目标检测方法及存储介质

Info

Publication number: CN113610087A
Application number: CN202110733573.5A
Authority: CN
Inventors: 蔡宇翔; 叶勇; 梁懿; 罗富财; 吴茜; 郭蔡炜; 蒋鑫; 王栋; 郑蔚涛; 张江龙; 叶庚; 潘丹; 庄莉; 于元隆; 蒋伟杰; 徐杰; 潘进土; 黄道
Original assignee: State Grid Corp of China SGCC; Fuzhou University; State Grid Information and Telecommunication Co Ltd; State Grid Fujian Electric Power Co Ltd; Information and Telecommunication Branch of State Grid Fujian Electric Power Co Ltd; Fujian Yirong Information Technology Co Ltd; Great Power Science and Technology Co of State Grid Information and Telecommunication Co Ltd
Current assignee: State Grid Corp of China SGCC; Fuzhou University; State Grid Information and Telecommunication Co Ltd; State Grid Fujian Electric Power Co Ltd; Information and Telecommunication Branch of State Grid Fujian Electric Power Co Ltd; Fujian Yirong Information Technology Co Ltd; Great Power Science and Technology Co of State Grid Information and Telecommunication Co Ltd
Priority date: 2021-06-30
Filing date: 2021-06-30
Publication date: 2021-11-05
Anticipated expiration: 2041-06-30
Also published as: CN113610087B

Abstract

本发明涉及一种基于先验超分辨率的图像小目标检测方法及存储介质，包括以下步骤：对目标物体进行采样获得高分辨率状态下的目标训练样本及全景训练样本；使用目标训练样本及全景训练样本训练超分辨率生成器；对目标物体全景图像裁剪获得低分辨率状态的目标图像，并通过超分辨率生成器生成高分辨状态的目标图像；对高分辨状态的目标图像裁剪成若干个预设大小的图片；然后输入目标检测网络中，得到最终的小目标检测结果。将低分辨率的图片超分辨率处理后生成高分辨的图像以增强小样本目标在样本表达中的信息，以得到更高的检测精度。在生成超分辨率的图像过程中使用生成目标高分辨先验进行监督式的模型训练，以此更好的生成超分辨率样本。

Description

一种基于先验超分辨率的图像小目标检测方法及存储介质

技术领域

本发明涉及计算机视觉领域，特别涉及一种基于先验超分辨率的图像小目标检测方法及存储介质。

背景技术

从机房内机柜的采样图像上检测和识别机柜内含有的服务器设备商标。采样图为机柜的全景图，检测目标在采样图像上含有多个不同类型的对象，每个对象在图像上的像素占比不足0.1％，为典型的小目标检测场景，涉及图像超分辨率和图像小目标检测。

传统的目标检测方法一般分为三个阶段：首先在给定的图像上选择一些候选区域，然后对这些区域提取特征，最后使用分类器进行分类。比较有代表性的算法有R-CNN和YOLO系列。其中R-CNN系列分为两个步骤完成，首先筛选和判断候选框，再针对候选框的内容进行分类，YOLO系列将以上两个步骤合并为一个步骤，直接在输出层回归物体目标框的位置和所属类别，从而实现端到端的一步到位。通过这种方式，YOLO可实现完全能满足实时性要求(达到24帧每秒，人眼就认为是连续的)。在深度学习中小目标的检测由于分辨率低，图片模糊，信息少，所以一直是一个实际且常见的困难问题。现有的方法一般通过以下手段来增强样本中的目标信息：1)通过在样本中增加小目标样本个数；2)通过网络中不同层次的特征融合，增强小样本的信息表达；3)使用生成器对小目标生成一个和大目标很相似的特征，然后把这个特征叠加在原来的小目标的特征图上，以此增强对小目标特征表达来提升小目标的检测性能。

还存在着以下的难点：小目标在全景样本中的像素占比过小，直接使用目标检测算法无法检测，现有的小目标样本增强算法在样本数量有限的情况下难以有限的增强小样本的目标信息。

发明内容

为此，需要提供一种基于先验超分辨率的图像小目标检测方法及存储介质，解决现有的小目标检测在全景样本中的像素占比过小，无法检测，及难以有限地增强小样本的目标信息，

为实现上述目的，发明人提供了一种基于先验超分辨率的图像小目标检测方法，包括以下步骤：

对目标物体进行局部采样获得高分辨率状态下的目标训练样本及全景采样获得全景训练样本；

使用采样获得的目标训练样本及全景训练样本训练超分辨率生成器SRNet；

对目标物体全景图像裁剪获得低分辨率状态的目标图像，并通过使用训练好的超分辨率生成器SRNet生成高分辨状态的目标图像；

使用采样获得的目标训练样本及全景训练样本训练目标检测网络CenterNet；

对高分辨状态的目标图像按照预设条件进行裁剪成若干个预设大小的图片，并存储裁剪后的每个图片的在原图中的坐标点位置；

将裁剪后的图片输入目标检测网络CenterNet中，得到最终的小目标检测结果。

进一步优化，所述步骤“对目标物体进行局部采样获得高分辨率状态下的目标训练样本及全景采样获得全景训练样本”之后还包括步骤：

并对获得的目标训练样本及全景训练样本进行边框及类别标注。

进一步优化，所述步骤“使用采样获得的目标训练样本及全景训练样本训练超分辨率生成器SRNet”具体包括以下步骤：

对输入的低分辨图像I1做双三次插值获得更大尺寸图像I2；

通过卷积和激活操作调整图像I2的像素点获得图像I3；

计算图像I3与真值之间的L2损失；

反向传播损失更新超分辨率生成器SRNet的参数。

进一步优化，所述步骤“对目标物体全景图像裁剪获得低分辨率状态的目标图像”具体包括以下步骤：

通过以高分辨率图像的目标框的中心点作为基准点，在改点的预设范围内，随机获得裁剪图片的中心，根据获得裁剪图片的中心点对目标物体全景图进行随机裁剪成多张低分辨率状态目标图像。

进一步优化，所述步骤“使用采样获得的目标训练样本及全景训练样本训练目标检测网络CenterNet”具体包括以下步骤：

对输入图像I使用特征提取网络获得图像I的特征；

使用上采样操作下获得高分辨率状态下的特征图；

输出表示物体中心概览的关键点热图、物体尺寸及下采样取整带来的中心点偏移；

对关键点热图执行最大池化获得局部峰值点，通过中心点偏移补偿目标中心后，结合物体尺寸获得检测框；

基于锚框的目标检测器使用标签的方式在训练过程将真值框与大量的锚框进行交并比计算，大于预设阈值的则认为锚框内存在目标。

进一步优化，所述步骤“基于锚框的目标检测器使用标签的方式在训练过程将真值框与大量的锚框进行交并比计算，大于预设阈值的则认为锚框内存在目标”之前还包括以下步骤：

将真值框编码为目标中心坐标和目标尺寸；

通过高斯散射核将下采样后的目标中心投射到关键点热图。

进一步优化，所述目标检测网络CenterNet的损失函数为中心点损失函数、中心点偏移损失函数及物体尺寸损失函数组成；

所述中心点损失函数为

用于将所有的正样本损失标准化为1,N是图像I的关键点数量，

为预测值，；

所述物体尺寸损失函数为

为预测的物体尺寸，S_k为标签真实尺寸；

所述中心点偏移损失函数为

进一步优化，所述目标检测网络CenterNet的损失函数L_dst＝L_k+A_sizeL_size+λ_offL_off。

进一步优化，所述步骤“将裁剪后的图片输入目标检测网络CenterNet中，得到最终的小目标检测结果”具体包括以下步骤：

将每张裁剪后的图片预测的预测框做坐标变换，映射到高分辨率的全景图像中；

对全景图像中所有的预测框做非极大值抑制NMS；

得到最终的小目标检测结果。

还提供了另一个技术方案：一种存储介质，所述存储介质包括计算机程序，所述计算机程序被处理器运行时执行上述所述基于先验超分辨率的图像小目标检测方法的步骤。

区别于现有技术，上述技术方案通过将低分辨率的图片超分辨率处理后生成高分辨的图像以增强小样本目标在样本表达中的信息，然后使用目标检测算法进行小目标检测，以得到更高的检测精度。在生成超分辨率的图像过程中使用生成目标高分辨先验进行监督式的模型训练，以此更好的生成超分辨率样本。

附图说明

图1为具体实施方式所述基于先验超分辨率的图像小目标检测方法的一种流程示意图；

图2为具体实施方式所述超分辨率生成器SRNet的训练过程的示意图；

图3为具体实施方式所述目标检测网络CenterNet的训练过程的示意图；

具体实施方式

为详细说明技术方案的技术内容、构造特征、所实现目的及效果，以下结合具体实施例并配合附图详予说明。

请参阅图1，本实施例提供一种基于先验超分辨率的图像小目标检测方法，包括以下步骤：

步骤S110：对目标物体进行局部采样获得高分辨率状态下的目标训练样本及全景采样获得全景训练样本；在本实施例中，目标物体为机柜，目标训练样本为机柜上的商标训练样本；所述步骤S110之后还包括步骤：并对获得的目标训练样本及全景训练样本进行边框及类别标注。通过对机柜进行局部采样获得高分辨率状态下的商标训练样本，对其进行边框和类别标注；然后对机柜进行全景采样获得全景训练样本，同样对其进行边框及标注。

步骤S120：使用采样获得的目标训练样本及全景训练样本训练超分辨率生成器SRNet；使用这些标注好的商标训练样本及全景采样样本进行训练超分辨率生成器SRNet，其中，超分辨率生成器SRNet的训练过程如图2所示，所述步骤“使用采样获得的目标训练样本及全景训练样本训练超分辨率生成器SRNet”具体包括以下步骤：

对输入的低分辨图像I1做双三次插值获得更大尺寸图像I2；

通过卷积和激活操作调整图像I2的像素点获得图像I3；

计算图像I3与真值之间的L2损失；

反向传播损失更新超分辨率生成器SRNet的参数。

首先对输入的低分辨率图像I1作双三次插值获得更大尺寸的图像I2，其后是由卷积和激活操作调整I2上的像素点值获得I3，最后计算I3和真值O之间的L2损失。反向传播损失跟新模型SRNet的参数。

步骤S130：对目标物体全景图像裁剪获得低分辨率状态的目标图像，并通过使用训练好的超分辨率生成器SRNet生成高分辨状态的目标图像；所述步骤S130具体包括以下步骤：

通过以高分辨率图像的目标框的中心点作为基准点，在改点的预设范围内，随机获得裁剪图片的中心，根据获得裁剪图片的中心点对目标物体全景图进行随机裁剪成多张低分辨率状态(512*512)目标图像。

步骤S140：使用采样获得的目标训练样本及全景训练样本训练目标检测网络CenterNet；同样需用标注好的目标训练样本及全景训练样本进行训练目标检测网络CenterNet；目标检测网络CenterNet的训练过程如图3所示，具体包括以下步骤：

对输入图像I使用特征提取网络获得图像I的特征；

使用上采样操作下获得高分辨率状态下的特征图；

首先对输入图像I使用特征提取网络获得图像I的特征，本实施例中使用Resnet50作为特征提取网络；其次使用上采样操作获得高分辨率状态下的特征图；最后输出到三个分支，分别为表示物体中心概率的关键点热图、物体尺寸、下采样取整带来的中心点偏移。在中心点与分类分支，对关键点热图执行简单的3*3最大池化获得局部峰值点，取代NMS后处理。用中心点偏移补偿目标中心后，结合物体尺寸即可获得检测框。基于锚框的目标检测器使用标签的方式为在训练过程中将真值框(Ground Truth Box，GT)与大量的锚框进行交并比计算，大于某一阈值则认为锚框内存在目标，这一方法包含大量冗余计算，减慢了算法运行速度。因此，我们将真值框编码为目标中心坐标和目标尺寸，并用高斯散射核将下采样后的目标中心投射到关键点热图上，高斯散射核函数公式如下：

其中式中：

为尺寸自适应标准差，与目标面积大小相关；Y_xyc为热图标签；x，y为中心真值，p_x，p_y为预测值。

步骤S150：对高分辨状态的目标图像按照预设条件进行裁剪成若干个预设大小的图片，并存储裁剪后的每个图片的在原图中的坐标点位置；其中，将高分辨率状态的目标图像进行有规律的裁剪，裁剪成24张有重叠的512*512大小的图片，并存储每张图片在原图中的坐标点位置，并将这些图片送入目标检测网络CenterNet中。

步骤S160：将裁剪后的图片输入目标检测网络CenterNet中，得到最终的小目标检测结果；当这些裁剪后的图片输入到目标检测网络CenterNet中，然后将每张裁剪后的图片预测的预测框做坐标变换，映射到高分辨率的全景图像中；对全景图像中所有的预测框做非极大值抑制NMS；得到最终的小目标检测结果。

本发明提出对原有图像剪切后再进行目标检测能够增加检测对象在图像中的像素占比，提高模型目标检测的性能；避免检测目标仅占据图像极小比例的像素下进行目标检测，模型会忽略占比极小的小目标，导致模型失效。先对总体样本局部采样高分辨率的小目标对象，以高分辨率的小目标样本训练从超分辨率生成器。然后使用超分辨率生成器替代传统的视觉插值方法对低分辨率剪切样本进行超分辨率转换，能够得到更有效的高分样本，从而提高模型检测小目标的性能。

其中，所述目标检测网络CenterNet的损失函数为中心点损失函数、中心点偏移损失函数及物体尺寸损失函数组成；

所述中心点损失函数为

用于将所有的正样本损失标准化为1,N是图像I的关键点数量，

为预测值，；

所述物体尺寸损失函数为

为预测的物体尺寸，S_k为标签真实尺寸；

所述中心点偏移损失函数为

CenterNet的损失函数主要由三部分组成：中心点损失函数、中心点偏移损失函数、物体尺寸损失函数。中心点损失如公式：

式中：N是图像I的关键点数量，用于将所有的正样本损失标准化为1,

为预测值。物体尺寸损失函数如下：

其中，

为预测的物体尺寸，而S为标签真实尺寸。

对于偏置损失函数，训练过程中，对图像进行了下采样，这样的特征图重新映射到原始图像上的时候会带来精度误差，因此对于每一个中心点，额外采用了一个局部偏移量去补偿它。所有类c的中心点共享同一个偏移量，使用L1损失来训练，得到偏置损伤函数的公式为：

其中，目标检测网络CenterNet的整体损失函数为中心点损失函数、中心点偏移损失函数及物体尺寸损失函数的和，每个损失函数都有相应的权重，所述目标检测网络CenterNet的损失函数L_det＝L_k+λ_sizeL_size+λ_offL_off。λ_size为物体尺寸损失函数L_size的权重，λ_off为偏置损失函数L_off的权重。

另一实施例中：一种存储介质，所述存储介质包括计算机程序，所述计算机程序被处理器运行时执行上述所述基于先验超分辨率的图像小目标检测方法的步骤，具体包括以下步骤：

对输入的低分辨图像I1做双三次插值获得更大尺寸图像I2；

通过卷积和激活操作调整图像I2的像素点获得图像I3；

计算图像I3余真值0之间的L2损失；

反向传播损失更新超分辨率生成器SRNet的参数。

对输入图像I使用特征提取网络获得图像I的特征；

使用上采样操作下获得高分辨率状态下的特征图；

其中式中：

所述中心点损失函数为

用于将所有的正样本损失标准化为1,N是图像I的关键点数量，

为预测值，；

所述物体尺寸损失函数为

为预测的物体尺寸，S_k为标签真实尺寸；

所述中心点偏移损失函数为

为预测值。物体尺寸损失函数如下：

其中，

为预测的物体尺寸，而S为标签真实尺寸。

需要说明的是，尽管在本文中已经对上述各实施例进行了描述，但并非因此限制本发明的专利保护范围。因此，基于本发明的创新理念，对本文所述实施例进行的变更和修改，或利用本发明说明书及附图内容所作的等效结构或等效流程变换，直接或间接地将以上技术方案运用在其他相关的技术领域，均包括在本发明的专利保护范围之内。