CN111178434A

CN111178434A - 一种基于Faster-RCNN的目标检测方法

Info

Publication number: CN111178434A
Application number: CN201911396092.9A
Authority: CN
Inventors: 武建宇; 李永
Original assignee: Beijing University of Technology
Current assignee: Beijing University of Technology
Priority date: 2019-12-30
Filing date: 2019-12-30
Publication date: 2020-05-19

Abstract

一种基于Faster‑RCNN的目标检测方法，涉及计算机视觉领域。首先对Faster‑RCNN的基础特征提取网络VGG16进行改进，在VGG16的Conv1_2卷积层和Conv2_2卷积层采用相加法进行特征融合，得到新的特征，然后再将新的特征与Conv4_3卷积层的输出特征进行融合；然后将之前的两个新特征与原始网络提取的最后一层特征进行融合完成特征的融合过程，将浅层特征与高层特征融合；最后各特征分别通过各自的RPN网络进行候选框的选择，相较原始单一的RPN网络会使分类和回归的结果更为精确。该方法有效的提高了目标检测的精度，尤其是尺寸较小目标的检测精度。

Description

一种基于Faster-RCNN的目标检测方法

技术领域

本发明涉及计算机视觉领域，更具体地，涉及一种基于Faster-RCNN的目标检测方法。

背景技术

目标检测是计算机视觉的一个重要的研究课题，在无人驾驶、人机交互、智能安防等领域有着重要作用和广泛的应用。然而在实际的应用场景中，物体大小、光照条件、遮挡以及背景相似度等条件影响着目标检测的准确度和检测的速度。

目前，目标检测的方法有两大类，传统的目标检测方法和基于深度学习的目标检测方法，区别在于进行特征提取的时候是手动的还是采用卷积神经网络以及候选框的选取。基于深度学习的目标检测又分为One-stage和 Two-stage两类。

作为Two-stage的代表Faster-RCNN通过添加RPN网络，基于Anchor机制来生成候选框，将特征提取、候选框选取、边框回归和分类都整合到了一个网络中，提高了检测精度和检测效率。在一些复杂的场景以及尺寸较小目标等情况下，Faster-RCNN的效果并不是很理想。因此，本文明提出了一种基于Faster-RCNN改进的目标检测方法，有效的提升了小目标检测的精度。

发明内容

本发明设计对基础网络特征和候选框提取网络进行修改，将图像的不同尺度特征进行了融合，并对各自的特征图进行候选区域的选择，其目的在于提高目标检测的准确率尤其是对小目标的检测进行了改进，提高较小目标的检测效果。

本发明采用了如下的技术方案及实现步骤：

一种基于Faster-RCNN的目标检测方法，其特征在于，具体包括以下步骤：

(1)采集数据集，选取图像训练集和测试集：

(1)-1数据集中应包含小目标的图像；目标面积占图像的百分之10以下称为小目标；

(1)-2用LabelImg工具对(1)-1中的图像进行标注生成符合pascal VOC 格式的xml文件；

(2)修改Faster-RCNN的基础特征提取网络进行特征的融合：

(2)-1将基础特征提取网络的Conv1_2卷积层和Conv2_2卷积层的特征用相加法进行融合，得到新的特征，记为C1；

(2)-2将Conv4_3卷积层的输出特征与(2)-1中的C1特征进行融合，得到新的特征，记为C2；

(2)-3将(2)-1求得的C1特征、(2)-2求得的C2融合特征以及特征网络最后一层Conv5_3的输出特征采取(2)-1中的方法进行融合，得到新的特征，记为C3；

(3)

将C1、C2、C3以及原网络结构Conv5_3层输出特征分别通过各自的RPN 网络进行候选区域选择；

(4)用训练数据集对改进的Faster-RCNN进行训练：

(4)-1将(1)-2中制作好的标注图像和xml文件分别放入JPEGImages 文件夹和Annotations文件夹下；

(4)-2在pascal_voc.py中更改self._classes中的类别，添加标注的各图片的类别；

(4)-3在faster_rcnn_end2end.sh脚本中将迭代次数ITERS修改为 10000次，运行Faster-RCNN的训练脚本开始训练，在10000次以上训练后完成训练，在voc_2007_trainval文件夹中可看到训练完的iter_10000.ckpt 训练模型；

(5)利用训练好的Faster-RCNN模型进行目标的检测：

(5)-1将测试集图片放入到demo文件夹下；

(5)-2运行demo脚本，参数为(4)-3训练完的模型iter_10000.ckpt，等待脚本运行结束后完成检测并查看结果。

本发明的创造性主要体现在：

浅层特征有丰富的细节信息，深层特征有强语义信息，由于图像经过不断的卷积变化，浅层特征所包含的信息不断地变换为深层特征的语义信息，而导致最后的特征包含的细节信息大量缺失，最后的检测结果还有提升的空间。

本发通过提取基础特征网络的不同尺度的特征，使得浅层特征与深层特征充分融合，将浅层细节信息与深层语义信息相融合，由于融合特征的尺度不一样，分别通过各自的RPN网络进行候选区域的选择，让得到的结果有了互补性，提高了目标检测的准确度。

附图说明

图1是本发明的总体流程图

图2是特征融合和分别生成候选框的子框图

具体实施方式

下面结合附图和实施例，对本发明作做一步的详细说明。

如图1整体流程所示，本发明公开了一种基于Faster-RCNN改进的目标检测方法，具体包括以下步骤：

(1)采集数据集，选取图像训练集和测试集：

(1)-1数据集中应特别包含小目标的图像，输入图像数据集，通过前置程序将图像大小缩放到最小边为600像素，最大边为800像素，以符合voc 原始数据的大小；

(2)修改Faster-RCNN的基础特征提取网络进行特征的融合：

(2)-1如下表为VGG16的网络配置表

表1 VGG16网络配置表

将基础特征提取网络的Conv1_2卷积层和Conv2_2卷积层的特征用相加法进行融合，得到新的特征，记为C1，相加法公式如下：

公式(1)中，X_i和Y_i分别代表两路输入通道，*表示卷积，c表示通道数

(2)-2将Conv4_3卷积层的输出特征与(2)-1中的C12特征采取(2) -1中的方法进行融合，得到新的特征，记为C2；

(3)改进RPN网络的结构

(3)-1将C1、C2、C3以及原网络结构Conv5_3层输出特征分别通过各自的RPN网络进行候选区域选择，RPN网络需要进行多任务处理，区域候选网络的总损失函数表达为：

公式2中，i是第i个anchor框，p_i是anchor预测为目标的概率，

是标签，当样本框为真时，其值为1，否则为0，N_cls为最小批量归一化值，N_reg为 anchor位置的数量，λ是为了将得分损失和位置损失进行近似等比例的设置， L_cls为判断anchor中是否有目标的损失函数，L_reg为位置回归损失函数，t_i为预测滑动框的4个坐标，

为与anchor相对应的真实框的目标框坐标；

分类损失函数如下：

边界框回归损失为函数：

(4)用训练数据集对改进的Faster-RCNN进行训练

(4)-2在pascal_voc.py中更改self._classes中的类别，添加自己标注的各图片的类别；

(4)-3在faster_rcnn_end2end.sh脚本中将迭代次数ITERS修改为10000次，运行Faster-RCNN的训练脚本开始训练，在10000次训练后完成训练，在voc_2007_trainval文件夹中可看到训练完的iter_10000.ckpt训练模型；

(5)利用训练好的Faster-RCNN模型进行目标的检测：

(5)-1将测试集图片放入到demo文件夹下；

实验数据：基于voc 2007数据集，再添加自标注的图像数据集，采用上述方法进行测试和验证。voc 2007原始数据集训练集为5011张，测试集4952 张，自标注的各类别训练集为3002张，测试集为2988张，以上共计训练集 8013张，测试集7940张，自标注小目标训练集为1433张，测试集1352张。在不同特征网络下所得的检测结果如下：

最终融合特征基础网络MF-VGG16的原始数据集检测精度为59.2％，小目标数据集检测精度为42.3％，相比未改进网络有较大的精度提升，表明该方法具有良好的检测精度。

Claims

1.一种基于Faster-RCNN的目标检测方法，其特征在于，具体包括以下步骤：

(1)采集数据集，选取图像训练集和测试集：

(1)-2用LabelImg工具对(1)-1中的图像进行标注生成符合pascalVOC格式的xml文件；

(2)修改Faster-RCNN的基础特征提取网络进行特征的融合：

(3)

将C1、C2、C3以及原网络结构Conv5_3层输出特征分别通过各自的RPN网络进行候选区域选择；

(4)用训练数据集对改进的Faster-RCNN进行训练：

(4)-1将(1)-2中制作好的标注图像和xml文件分别放入JPEGImages文件夹和Annotations文件夹下；

(4)-3运行Faster-RCNN的训练脚本开始训练；

(5)利用训练好的Faster-RCNN模型进行目标的检测：

(5)-1将测试集图片放入到demo文件夹下；

(5)-2运行demo脚本，参数为(4)-3训练完的模型参数，完成检测并查看结果。