CN109886082A - 一种基于ssd的小目标增强预测模块检测方法 - Google Patents
一种基于ssd的小目标增强预测模块检测方法 Download PDFInfo
- Publication number
- CN109886082A CN109886082A CN201910003211.3A CN201910003211A CN109886082A CN 109886082 A CN109886082 A CN 109886082A CN 201910003211 A CN201910003211 A CN 201910003211A CN 109886082 A CN109886082 A CN 109886082A
- Authority
- CN
- China
- Prior art keywords
- feature
- ssd
- channel
- detection target
- small object
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 34
- 230000002708 enhancing effect Effects 0.000 title description 6
- 238000005070 sampling Methods 0.000 claims abstract description 5
- 238000012549 training Methods 0.000 claims description 9
- 230000004913 activation Effects 0.000 claims description 5
- 238000000926 separation method Methods 0.000 claims description 3
- 238000009826 distribution Methods 0.000 claims description 2
- 230000004927 fusion Effects 0.000 abstract description 4
- 238000000034 method Methods 0.000 description 11
- 101100342039 Halobacterium salinarum (strain ATCC 29341 / DSM 671 / R1) kdpQ gene Proteins 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 230000001965 increasing effect Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Landscapes
- Image Analysis (AREA)
Abstract
本发明公开了一种基于SSD的小目标增强预测模块检测方法,包括以下步骤:步骤1:对检测目标进行拍照采样;步骤2:对检测目标进行特征重建;步骤3:对检测目标使用像素校准模块进行进一步优化。本发明增加了针对小目标检测的预测模块,降低其他层预测器的压力,并提升浅层特征来进行检测,提高了融合效率并增强了预测器的能力。
Description
技术领域
本发明属于目标检测领域,具体为一种基于SSD的小目标增强预测模块检测方法。
背景技术
神经网络的较深层的特征具有更好的分类和回归的性能,但是却丢失了空间细节,而这些细节是在检测小目标时必不可少的。现在通常有两种方法来检测小目标,一种是直接增大输入的图像的大小使目标更大,这会使得神经网络的节点的数量急剧增加;另一种方法利用是利用较低层的较大特征图像来选择较小的候选框,这会使计算量变小,但是浅层特征的表达能力较弱,效果较差。为了增强浅层特征,通常采用自上而下的特征重建,包括通过像素融合,如FPN和DSSD,以及不同层的特征结合,如Hypernet 和U-net。以上的两种方法都取得了成功,然而,却很难协调准确性和速度之间的平衡。像素的简单融合通常限制了特征表达的多样性,而太多层特征组合常常带来很多计算量和特征冗余。
基于神经网络的目标检测框架一般可分为两大类,单阶段的方法,如SSD,YOLO 和两阶段方法,如Faster-RCNN和RFCN。两阶段方法使用RPN(候选区提取网络)从背景中计算出候选框,这需要在第二阶段检测之前花费一些时间。单阶段的方法是直接在特征图上选出固定候选框,这减少了选择目标候选框的计算。SSD利用深度特征金字塔来检测多尺度对象,并将不同尺度的目标分配给特定预测器,从而降低每个预测器的压力,但是较低层的特征表达较弱,这限制了小目标检测器的性能。
发明内容
本发明目的在于针对小目标检测的预测模块,提供一种基于SSD的小目标增强预测模块检测方法,它可以降低其他层预测器的压力,并提升浅层特征来进行检测。
为达成上述目的,本发明所采用的技术方案如下:
一种基于SSD的小目标增强预测模块检测方法,包括以下步骤:
步骤1:对检测目标进行拍照采样;
步骤2:对检测目标进行特征重建;
步骤3:对检测目标使用像素校准模块进行进一步优化。
更进一步的,所述步骤1对检测目标进行拍照采样,具体为:采用无人机在距地面30米到200米的高度范围内进行拍摄,机载摄像机采用垂直向下的拍摄方式进行拍摄,拍摄完成后对拍摄的图像进行裁剪,设置裁剪后的目标图像面积分布在55*22到160* 150像素,设置目标图像的格式为JPG。
更进一步的,所述步骤2对检测目标进行特征重建,具体为:将主干网路网络通过ImageNet预训练模型进行微调,采用特征金子塔结构设置模块网络,将高层特征与浅层特征根据通道进行堆叠。
更进一步的,所述步骤3对检测目标使用像素校准模块进行进一步优化,具体为:使用卷积重新校准每个像素的特征,采用全局平均池构建明确的通道间相互关系模型,采用全连接层和Sigmoid激活函数对每个通道进行评分,并对特征进行校准,校准的输出公式为:
式中,和Fscale(uc,sc)表示通道ucRH×W和通道sc的乘积;
将上式简化后可得:
式中,和Fscale(u(n),s(n))表示像素特征un和通道sn之间的乘积;
最后使用通道分离卷积和1x1卷积层替代全局平均池和全连接层,并保留sigmoid激活函数。
与现有技术相比,本发明的有益效果为:
本发明克服了小目标检测准确度不精确的难题,增加了针对小目标检测的预测模块,它可以降低其他层预测器的压力,并提升浅层特征来进行检测,且提出了像素校准模块,提高了融合效率并增强了预测器的能力。
附图说明
图1为本发明检测网络结构示意图;
图2为本发明像素校准模块流程图;
图3为本发明目标面积对算法的影响图;
图4为本发明实施例模型SSD300、模型SSD512和模型SSD300+P3的其他因素影响对比图。
具体实施方式
下面结合附图和具体实施方式对本发明作进一步详细的描述。
(一)数据集
采用航拍车辆数据集NJVAD和VOC2007公共数据集上训练模型,来验证增强预测的模块有效;NJVAD的图像由无人机在距地面30米到200米的高度范围内拍摄,每个标记的图像均为原始图像中裁剪出来的图像,其中图像中目标面积分布在55*22到160 *150像素。图像为机载摄像机垂直向下拍摄。NJVAD数据集包含7570个标记图像,分辨率为600*600和900*900像素,格式为JPG。NJVAD是一类检测任务,这一类目标包括轿车,公共汽车,皮卡和卡车。数据集中的每个车辆均为手工标记。同时, VOC2007公共数据集中,训练集包括5011张图片,测试集包括4952张图片,共分为 21类。
(二)训练策略
在一块Nvidia GeForce 1080ti GPU显卡上进行端到端训练,使用SGD优化策略,设置初始学习率为10-3,重量衰减为0.0005,动量为0.9,批量大小为32。主干网络的预训练模型为ImageNet上的分类模型,在此基础上对检测网络进行调优。
我们的框架基于SSD[1]结构,其中主干网路网络通过ImageNet预训练模型进行微调,模块网络采用特征金子塔结构。
为了将浅层特征用于小目标检测,我们将高层特征与浅层特征根据通道堆叠。通过相邻层的通道堆叠来增加浅层特征的信息量,实现特征增强,如图1。
一般来说,特征维度过高会带来计算负担,但合理的维度可以提高预测的性能。我们比较了不同层数的连接效果以找出最佳特征维度。然后我们使用像素校准模块来优化功能。
采用像素校准(PR)模块来提升堆叠特征,如图2所示,使用卷积重新校准每个像素的特征。
为了构建明确的通道间相互关系模型,采用全局平均池,全连接层和Sigmoid激活函数对每个通道进行评分,并对特征进行校准,校准的输出通过以下公式计算:
式中,和Fscale(uc,sc)表示通道ucRH×W和通道sc的乘积;
将上式简化后可得:
式中,和Fscale(u(n),s(n))表示像素特征un和通道sn之间的乘积;最后使用通道分离卷积和1x1卷积层替代全局平均池和全连接层,并保留sigmoid激活函数。
(三)实验结果
各种算法在NJAVD数据集上的实验结果如表1所示。
方法 | 输入尺寸 | mAP | 帧率 | 候选框数 |
FPN(Resnet-50) | 224 | 89.09 | 35 | 5000 |
YOLO v3 | 224 | 86.8 | 78 | 9261 |
DSSD(Resnet-50) | 300 | 88.28 | 28 | 8732 |
SSD(slim VGG13) | 224 | 84.08 | 112 | 24564 |
SSD(slim VGG13)+PR3(2) | 224 | 87.85 | 108 | 31232 |
SSD(slim VGG13)+PR3(3) | 224 | 87.97 | 94 | 31232 |
SSD(VGG16) | 300 | 85.02 | 53 | 8732 |
SSD(VGG16) | 512 | 88.56 | 24 | 8732 |
SSD(VGG16)+PR3(2) | 300 | 88.91 | 48 | 31232 |
表1
为了更好地体现PR模块的优势,在NJVAD上运行不同配置的SSD,并在表2中记录它们的mAP。当逐渐改进来重构层时,mAP会增加,如表2所示。
方法 | mAP |
slim-SSD | 84.08 |
slim-SSD+cat3+conv | 87.35 |
slim-SSD+cat3+senet | 87.54 |
slim-SSD+cat3+PR3(2) | 87.85 |
slim-SSD+cat3+PR3(2) | 88.91 |
表2
同时,在VOC2007公共数据集上进行模型的训练和测试,使用检测分析工具分析不同区域和不同类别的对象的结果。图3显示了SSD300,SSD512和SSD300+P3在不同面积的目标检测上的比较结果。得益于新加的模块,可得出改方法在小目标的检测性能上接近SSD512,并且优于SSD300。
图4显示了不同因素对算法的影响。与SSD300相比,SSD+P3的平均得分高于SSD300,尤其在尺寸因素上。其他因素的分数,包括遮挡,侧面和局部也略有增加,这表明PR模块提高了探测器对小物体进行检测的性能,也减轻了其他因素的影响。
虽然本发明已以较佳实施例揭露如上,然其并非用以限定本发明。本发明所属技术领域中具有通常知识者,在不脱离本发明的精神和范围内,当可作各种的更动与润饰。因此,本发明的保护范围当视权利要求书所界定者为准。
Claims (4)
1.一种基于SSD的小目标增强预测模块检测方法,其特征在于,包括以下步骤:
步骤1:对检测目标进行拍照采样;
步骤2:对检测目标进行特征重建;
步骤3:对检测目标使用像素校准模块进行进一步优化。
2.根据权利要求1所述的一种基于SSD的小目标增强预测模块检测方法,其特征在于,所述步骤1对检测目标进行拍照采样,具体为:采用无人机在距地面30米到200米的高度范围内进行拍摄,机载摄像机采用垂直向下的拍摄方式进行拍摄,拍摄完成后对拍摄的图像进行裁剪,设置裁剪后的目标图像面积分布在55*22到160*150像素,设置目标图像的格式为JPG。
3.根据权利要求1所述的一种基于SSD的小目标增强预测模块检测方法,其特征在于,所述步骤2对检测目标进行特征重建,具体为:将主干网路网络通过ImageNet预训练模型进行微调,采用特征金子塔结构设置模块网络,将高层特征与浅层特征根据通道进行堆叠。
4.根据权利要求1所述的一种基于SSD的小目标增强预测模块检测方法,其特征在于,所述步骤3对检测目标使用像素校准模块进行进一步优化,具体为:使用卷积重新校准每个像素的特征,采用全局平均池构建明确的通道间相互关系模型,采用全连接层和Sigmoid激活函数对每个通道进行评分,并对特征进行校准,校准的输出公式为:
式中,和Fscale(uc,sc)表示通道ucRH×W和通道sc的乘积;
将上式简化后可得:
式中,和Fscale(u(n),s(n))表示像素特征un和通道sn之间的乘积;
最后使用通道分离卷积和1x1卷积层替代全局平均池和全连接层,并保留sigmoid激活函数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910003211.3A CN109886082A (zh) | 2019-01-03 | 2019-01-03 | 一种基于ssd的小目标增强预测模块检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910003211.3A CN109886082A (zh) | 2019-01-03 | 2019-01-03 | 一种基于ssd的小目标增强预测模块检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109886082A true CN109886082A (zh) | 2019-06-14 |
Family
ID=66925627
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910003211.3A Pending CN109886082A (zh) | 2019-01-03 | 2019-01-03 | 一种基于ssd的小目标增强预测模块检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109886082A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110687922A (zh) * | 2019-11-08 | 2020-01-14 | 湖北经济学院 | 一种无人机的视觉跟踪方法及具有视觉跟踪功能的无人机 |
CN111382678A (zh) * | 2020-02-25 | 2020-07-07 | 浙江大学 | 基于改进型cnn网络的旅游观光车客流统计算法 |
CN111462090A (zh) * | 2020-04-01 | 2020-07-28 | 上饶市中科院云计算中心大数据研究院 | 一种多尺度图像目标检测方法 |
CN112115880A (zh) * | 2020-09-21 | 2020-12-22 | 成都数之联科技有限公司 | 基于多标签学习的船舶污染监测方法及系统及装置及介质 |
CN112131996A (zh) * | 2020-09-17 | 2020-12-25 | 东南大学 | 基于通道分离卷积的路侧图像多尺度行人快速检测方法 |
CN112149533A (zh) * | 2020-09-10 | 2020-12-29 | 上海电力大学 | 一种基于改进ssd模型的目标检测方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108491757A (zh) * | 2018-02-05 | 2018-09-04 | 西安电子科技大学 | 基于多尺度特征学习的光学遥感图像目标检测方法 |
CN109101975A (zh) * | 2018-08-20 | 2018-12-28 | 电子科技大学 | 基于全卷积神经网络的图像语义分割方法 |
-
2019
- 2019-01-03 CN CN201910003211.3A patent/CN109886082A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108491757A (zh) * | 2018-02-05 | 2018-09-04 | 西安电子科技大学 | 基于多尺度特征学习的光学遥感图像目标检测方法 |
CN109101975A (zh) * | 2018-08-20 | 2018-12-28 | 电子科技大学 | 基于全卷积神经网络的图像语义分割方法 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110687922A (zh) * | 2019-11-08 | 2020-01-14 | 湖北经济学院 | 一种无人机的视觉跟踪方法及具有视觉跟踪功能的无人机 |
CN111382678A (zh) * | 2020-02-25 | 2020-07-07 | 浙江大学 | 基于改进型cnn网络的旅游观光车客流统计算法 |
CN111462090A (zh) * | 2020-04-01 | 2020-07-28 | 上饶市中科院云计算中心大数据研究院 | 一种多尺度图像目标检测方法 |
CN111462090B (zh) * | 2020-04-01 | 2023-09-01 | 上饶市中科院云计算中心大数据研究院 | 一种多尺度图像目标检测方法 |
CN112149533A (zh) * | 2020-09-10 | 2020-12-29 | 上海电力大学 | 一种基于改进ssd模型的目标检测方法 |
CN112131996A (zh) * | 2020-09-17 | 2020-12-25 | 东南大学 | 基于通道分离卷积的路侧图像多尺度行人快速检测方法 |
CN112115880A (zh) * | 2020-09-21 | 2020-12-22 | 成都数之联科技有限公司 | 基于多标签学习的船舶污染监测方法及系统及装置及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109886082A (zh) | 一种基于ssd的小目标增强预测模块检测方法 | |
WO2022083784A1 (zh) | 一种基于车联网的道路检测方法 | |
CN104766058B (zh) | 一种获取车道线的方法和装置 | |
CN110533084A (zh) | 一种基于自注意力机制的多尺度目标检测方法 | |
CN109101975A (zh) | 基于全卷积神经网络的图像语义分割方法 | |
CN114202672A (zh) | 一种基于注意力机制的小目标检测方法 | |
CN110796168A (zh) | 一种基于改进YOLOv3的车辆检测方法 | |
CN110427937A (zh) | 一种基于深度学习的倾斜车牌矫正和不定长车牌识别方法 | |
CN106971185B (zh) | 一种基于全卷积网络的车牌定位方法及装置 | |
CN110659664B (zh) | 一种基于ssd的高精度识别小物体的方法 | |
CN105354568A (zh) | 基于卷积神经网络的车标识别方法 | |
CN111914795A (zh) | 一种航拍图像中旋转目标检测方法 | |
CN109492596B (zh) | 一种基于K-means聚类和区域推荐网络的行人检测方法及系统 | |
CN110009015A (zh) | 基于轻量化网络和半监督聚类的高光谱小样本分类方法 | |
CN109784283A (zh) | 基于场景识别任务下的遥感图像目标提取方法 | |
CN106897681A (zh) | 一种遥感图像对比分析方法及系统 | |
CN107609575A (zh) | 书法评价方法、书法评价装置和电子设备 | |
CN110110599A (zh) | 一种基于多尺度特征融合的遥感图像目标检测方法 | |
CN111738114B (zh) | 基于无锚点精确采样遥感图像车辆目标检测方法 | |
CN114898327B (zh) | 一种基于轻量化深度学习网络的车辆检测方法 | |
CN112464912B (zh) | 基于YOLO-RGGNet的机器人端人脸检测方法 | |
CN109087337B (zh) | 基于分层卷积特征的长时间目标跟踪方法及系统 | |
CN105654122A (zh) | 基于核函数匹配的空间金字塔物体识别方法 | |
CN111178282A (zh) | 一种道路交通限速标志定位识别方法及装置 | |
CN109859222A (zh) | 基于级联神经网络的边缘提取方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190614 |
|
RJ01 | Rejection of invention patent application after publication |