CN110619356A

CN110619356A - 基于区域建议注意力的目标检测方法

Info

Publication number: CN110619356A
Application number: CN201910802929.9A
Authority: CN
Inventors: 李宏亮; 杨健榜; 王晓朋; 罗鹏飞; 陶聚; 王强
Original assignee: University of Electronic Science and Technology of China
Current assignee: University of Electronic Science and Technology of China
Priority date: 2019-08-28
Filing date: 2019-08-28
Publication date: 2019-12-27
Anticipated expiration: 2039-08-28
Also published as: CN110619356B

Abstract

本发明提供一种基于区域建议注意力的目标检测方法，针对RefineDet特征判别力不足的问题，将ARM生成的有无目标的分类结果特征谱作为区域建议注意力与ODM的多分类特征谱通过点乘的方式进行融合，在优化后的多分类特征谱中突出目标区域的显著性。本发明优化了多分类特征谱的判别力，提升了后续进行的RefineDet目标检测的分类效果，从而有效减少误检、漏检情况，提升目标检测的准确率。相比于现有RefineDet算法，能够在不增加参数的基础上，有效地提升目标检测的分类精度。

Description

基于区域建议注意力的目标检测方法

技术领域

本发明涉及目标检测技术。

背景技术

目标检测和图像分类、分割是计算机视觉的三大任务。目标检测是许多进阶视觉任务的先决条件，如：关系识别、场景解析、实例分割等等。当下，目标检测也被很多公司用到了造福民生的实际任务中，例如：智慧交通、安防、智能眼镜、自动驾驶等。由于目标检测的重大意义，大量科研人员投入到目标检测的研究上来，为目标检测的发展做出了巨大的贡献。随着计算机算力的大大提升，深度学习的蓬勃发展，目标检测迎来一个又一个里程碑式的提升。尽管如此，现有方法的检测准确率还是较低，实际使用中容易出现误检和漏检。因此目标检测还需要科研人员继续为之付出努力，提升其性能。

由于R-CNN系列的横空出世，宣布目标检测进入深度学习时代，主要可以分为两大类：(1)Two-Stage的目标检测方法，其先生成目标候选区域，然后再对候选区域进行回归和分类，典型代表是R-CNN(Regions with Convolutional Neural Network))系列算法，如R-CNN，Fast R-CNN，Faster R-CNN等；(2)One-Stage的目标检测算法，其不会产生候选框，直接生成目标的类别及坐标位置，典型算法如YOLO(You Only Look Once)、SSD(Single ShotMultiBox Detector)。RefineDet(Single-Shot Refinement Neural Network for ObjectDetection)是将前两类算法结合起来的One-Stage的方法。目标检测主要性能指标包括：检测精度和速度，检测精度又包括定位精度和分类精度。在实际使用中RefineDet算法在检测速度和定位精度表现较好，但是在分类精度上表现有待提高。

发明内容

本发明所要解决的技术问题是，提供一种优化RefineDet算法，提升分类效果的目标检测方法。

本发明为解决上述技术问题所采用的技术方案是，基于区域建议注意力的目标检测方法，包括以下步骤：

1)将待检测图像输入RefineDet网络，其ARM模块经卷积得到尺寸从大到小的N层0/1分类特征谱，N层不同尺寸的0/1分类特征谱经二分类处理后得到相应的N层分类结果特征谱；

2)ODM模块得到尺寸从小到大的N层多分类特征谱；

3)ODM模块将N层升维后的分类结果特征谱分别与相同尺寸的多分类特征谱通过哈达马积的方式进行融合，得到N层优化后的多分类特征谱；所述升维是指将分类结果特征谱升维到与多分类特征谱的通道数相同；

4)ODM模块将优化后的多分类特征谱用于后续RefineDet网络的目标定位和目标分类。

ARM是一个二分类模块，专注于有/无目标的检测。ODM是一个多分类模块，专注于所有类别的检测。本发明针对RefineDet特征判别力不足的问题，将ARM(AnchorRefinement Module)生成的有无目标的分类结果特征谱作为区域建议注意力与ODM(Object Detection Module)的多分类特征谱通过点乘的方式进行融合，在优化后的多分类特征谱中突出目标区域的显著性。

本发明的有益效果是，优化多分类特征谱的判别力，提升后续进行的RefineDet目标检测的分类效果，从而有效减少误检、漏检情况，提升目标检测的准确率。相比于现有RefineDet算法，能够在不增加参数的基础上，有效地提升目标检测的分类精度。

附图说明

图1：本发明流程图；

图2：多分类特征谱优化示意图。

具体实施方式

实施例在TITAN Xp服务器上进行实现，RefineDet目标检测网络包括ARM模块与ODM模块，模块中的特征谱均为不同尺寸的4层。如图1所示，主要包括几个步骤，ARM模块根据4层不用尺寸的0/1分类特征谱获得有无目标的分类结果特征谱即区域建议注意力。ODM模块生成4层多分类特征谱，将分类结果特征谱升维到256个通道与多分类特征谱相匹配，采用Hadamard积方式将同尺寸的分类结果特征谱和多分类特征谱进行融合，将融合后的特征谱作为优化的多分类特征谱进入后续目标的定位和分类处理，得到目标检测结果。

具体的，ODM模块生成多分类特征谱的方法是：ODM模块将ARM模块中各层0/1分类特征谱进行通道数匹配，将进行通道数匹配后最小尺寸的0/1分类特征谱作为ODM模块中最小尺寸的多分类特征谱，最小尺寸的多分类特征作为第1层多分类特征经3次上采样依次得到第2到第4层上采样特征谱；将尺寸相同的第n-1层上采样特征谱与其尺寸相同的通道数匹配后0/1分类特征谱相加后得到的特征谱作为第n层多分类特征谱；n＝2,3,4；所述通道数匹配为使得0/1分类特征谱的通道数与多分类特征谱的通道数相同的处理。

多分类特征谱优化的具体步骤如图2所示：

步骤一：

第1步：对待检测图像Image送入RefineDet目标检测网络进行处理，先经过ARM模块的多层卷积核得到尺寸从大到小的4层0/1分类特征谱Conv4-3、Conv5-3、fc7、Conv6-2；Conv4-3和Conv5-3的通道数均为512，fc7的通道数为1024，Conv6-2的通道数为256；4层不同尺寸的0/1分类特征谱经二分类处理后得到相应的4层分类结果特征谱，4层分类结果特征谱的通道数为2；在实际处理中，分类结果特征谱只取有目标的那1个通道的特征谱，所以输出至ODM模块的分类结果特征谱的通道数是1。

第2步：ODM模块将ARM模块中最小尺寸的0/1分类特征谱作为ODM模块中最小尺寸的多分类特征谱(第1层多分类特征谱)通过3次上采样得到尺寸从小到大的第2至4层多分类特征谱。除了第1层多分类特征谱P6外，其他第n层(n＝2,3,4)的多分类特征谱P5，P4，P3为：相同尺寸的0/1分类特征谱经降维(降维到256个通道)后与上采样后的第n-1层多分类特征谱相加后得到。

步骤二：

第1步：将4个不同尺寸的分类结果特征谱用1x1的卷积核从1个通道升维到256个通道；实施例中升维与降维操作的目的都是为了使得从ARM输出的特征谱与ODM的特征谱的通道数匹配。

第3步：将上一步得到的4个进行通道数匹配后的分类结果特征谱Conf3、Conf4、Conf5、Conf6和对应的尺寸相同的4层多分类特征谱一一进行点对点相乘(Hadamard积)式的融合，得到优化后的多分类特征谱P3′＝Conf3*P3、P4′＝Conf4*P4、P5′＝Conf5*P5、P6′＝Conf6*P6。

Claims

1.基于区域建议注意力的目标检测方法，其特征在于，包括以下步骤：

2)ODM模块得到尺寸从小到大的N层多分类特征谱；

2.如权利要求1所述方法，其特征在于，步骤2)具体为：ODM模块将ARM模块中各层0/1分类特征谱进行通道数匹配，将进行通道数匹配后最小尺寸的0/1分类特征谱作为ODM模块中最小尺寸的多分类特征谱，最小尺寸的多分类特征作为第1层多分类特征经N-1次上采样依次得到第2到第N层上采样特征谱；将尺寸相同的第n-1层上采样特征谱与其尺寸相同的通道数匹配后0/1分类特征谱相加后得到的特征谱作为第n层多分类特征谱；n＝2,…,N；所述通道数匹配为使得0/1分类特征谱的通道数与多分类特征谱的通道数相同的处理。

3.如权利要求1所述方法，其特征在于，N＝4。