CN113837080A - 一种基于信息增强与感受野增强的小目标检测方法 - Google Patents
一种基于信息增强与感受野增强的小目标检测方法 Download PDFInfo
- Publication number
- CN113837080A CN113837080A CN202111119578.5A CN202111119578A CN113837080A CN 113837080 A CN113837080 A CN 113837080A CN 202111119578 A CN202111119578 A CN 202111119578A CN 113837080 A CN113837080 A CN 113837080A
- Authority
- CN
- China
- Prior art keywords
- information
- enhancement
- receptive field
- feature
- scale
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于信息增强与感受野增强的小目标检测方法,旨在提高小目标的检测精度。本发明设计了两个模块来增强小目标的信息,其具体方法如下:首先为了获得输入特征的全局信息,局部信息和多尺度信息,设计了信息增强模块;其次设计了感受野增强模块,利用扩张卷积获得不同尺度感受野的特征并将其进行密集连接,从而获得具有判别性的特征;然后输入特征分别使用这两个模块进行信息增强,得到增强后的特征图;最后在得到增强后的特征图基础上进行下采样,共获得6个不同尺度的特征图,分别对这6个不同尺度的特征图进行目标检测,得到最终的检测结果。在数据集上的实验结果表明本发明算法对检测小目标具有较高的检测精度。
Description
技术领域
本发明属于计算机视觉领域,涉及对目标检测模型的改进、图像目标检测与仿真实现。
背景技术
目标检测作为计算机视觉的基本任务之一,它的主要任务是从输入图像中定位出感兴趣的目标并判断出每个目标所属的类别,目前已在多种场景中得到应用,如目标跟踪、智能监控和自动驾驶等领域。近年来,随着深度学习的不断发展,小目标检测研究得到广泛关注,被应用于城市智慧交通、物流管理、农林业发展、公共安全和抗灾救灾部署等任务场景中。但小目标在原图中所包含的像素数少,携带的信息有限,在深度网络中经过多次下采样后,分辨率进一步降低,造成特征信息减弱甚至丢失,同时不同尺度的特征图没有进行有效融合,未能建立信息间的传递与交流,从而造成检测难度增大,因此小目标检测仍是计算机视觉任务中一个亟待解决的难点。
由于目前专门针对小目标检测的算法研究较少,直接使用通用目标检测方法容易造成小目标错检漏检,效果不好。为此本发明设计了两个模块来增强小目标的信息,其具体方法如下:首先为了获得输入特征的全局信息,局部信息和多尺度信息,设计了信息增强模块;其次设计了感受野增强模块,利用扩张卷积获得不同尺度感受野的特征并将其进行密集连接,从而获得具有判别性的、融合了不同抽象级别信息的特征;然后输入特征分别使用这两个模块进行信息增强,得到增强后的特征图;最后在得到增强后的特征图基础上进行下采样,共获得6个不同尺度的特征图,分别对这6个不同尺度的特征图进行目标检测,得到最终的检测结果。
发明内容
1.发明目的:
本发明的目的是提出基于信息增强与感受野增强的小目标检测方法。
2.技术方案:
本发明提出一种基于信息增强与感受野增强的小目标检测方法,该网络能够建立并增强信息之间的交流与联系,产生更具判别性的特征。首先,本发明为了有助于定位小目标,对骨干网络提取到的浅层特征进行重复利用,将VGG-16网络中的低层特征与高层特征分别上采样和下采样至相同的尺度大小,然后将其在通道维度上进行拼接,获得含纹理信息和语义信息的多尺度特征图。其次,本发明提出了信息增强模块,此模块设计了全局信息分支、局部信息分支和多尺度语义信息分支,通过对输入特征的全局信息、局部信息和多尺度语义信息进行学习,获得富含小目标上下文信息的增强特征。然后,为减少小目标信息的丢失,本发明设计了感受野增强模块,利用不同扩张率的扩张卷积获得不同尺度感受野的特征,然后将其进行拼接融合。值得注意的是,本发明在获得不同尺度感受野特征时采用了密集连接,从而为不同尺度间的感受野特征建立了联系。最后,本发明在得到增强后的特征图基础上,进行下采样,共获得6个不同尺度的特征图,分别对这6个不同尺度的特征图进行目标检测,得到最终的检测结果。考虑到不同尺寸的特征图包含的细节信息不一致,本发明分别对300×300和512×512两种尺寸的输入图像进行了训练和测试,从而得到一个更具鲁棒性的模型。
本发明所述的一种基于信息增强与感受野增强的小目标检测方法,包括以下步骤:
步骤(1):在骨干特征提取网络VGG-16的基础上,将低层特征与高层特征分别上采样和下采样至相同的尺度大小,然后将其在通道维度上进行拼接,获得含纹理信息和语义信息的多尺度特征图;
步骤(2):将步骤(1)得到的多尺度特征图输入到信息增强模块,信息增强模块由三条分支构成,分别学习多尺度特征图的全局信息,局部信息和多尺度语义信息,最终将三条分支获得的特征相加融合,得到增强后的语义信息特征图;
步骤(3):将步骤(1)得到的多尺度特征图输入到感受野增强模块中,此模块由四条分支组成,第二、三、四条分支分别以不同卷积核的卷积和不同扩张率的扩张卷积增强学习特征点间水平和垂直空间的关系,最后第一条分支的原有特征与其余分支获得的特征进行拼接,建立并增强不同感受野特征图之间的联系,得到增强后的感受野特征图;
步骤(4):将步骤(2)得到的语义信息特征图与步骤(3)得到的感受野特征图进行像素点相加融合,得到最终的增强特征图;
步骤(5):将步骤(4)中得到的增强特征图进行下采样,共获得6个不同尺度的特征图,然后对其进行训练得到最终的检测结果。
3.有益效果:
本发明公开了基于信息增强与感受野增强的小目标检测方法,设计了信息增强和感受野增强两个模块,解决了小目标携带像素信息少和缺乏信息间的传递与交流的问题。在PASCAL VOC、MS COCO和UCAS-AOD数据集上的实验结果表明本发明算法对检测小目标具有较高的检测精度。
附图说明
图1为本发明整体流程框架。
图2为本发明信息增强模块结构图。
图3为本发明感受野增强模块结构图。
图4为本发明在MS COCO数据集上图像分割效果。
图5为本发明在和UCAS-AOD数据集上图像分割效果。
具体实施方式
下面结合附图和具体实施方式对本发明做进一步说明。一种基于信息增强与感受野增强的小目标检测方法,其具体实施方式步骤如下:
(S1):拼接融合特征。
为了有助于定位小目标,本发明重复利用并增强特征提取网络的浅层特征,将低层特征与高层特征分别上采样和下采样至相同的尺度大小,然后将其在通道维度上进行拼接,获得含纹理信息和语义信息的多尺度特征图。本发明中的低层特征和高层特征分别选用VGG-16网络中的Conv3-3和Conv5-3,并将其采样至Conv4-3的尺度大小。
(S2):设计信息增强模块。
传统的特征金字塔网络将高层特征图与低层特征图进行相加融合,从而建立信息间的传递,但高层获取的特征只包含了单一尺度的语义信息,无法获得更全面和更丰富的上下文信息。为了解决这个问题,本发明设计了信息增强模块,旨在获取多尺度特征图中更多的语义信息,并将不同尺度的特征图进行融合,建立信息间的语义交流。
本发明设计信息增强模块的核心思想是,在融合高层特征的多尺度语义信息的同时引入局部信息和全局信息,从而建立不同信息之间的交流学习,利用语义信息对空间细节信息进行注意力增强,生成更具判别性的特征。本发明输入的多尺度特征图的尺寸为2W×2H×C,我们通过如图2所示的三个并行路径来分别获取全局信息,局部信息和多尺度语义信息,其计算过程如公式(1-4)所示。
B1=Conv1×1(global(F)) (1)
B2=Conv3×3(F) (2)
B3=FPN(F) (3)
Fo=Add[B1,B2,B3] (4)
其中B1,B2,B3分别表示第一分支,第二分支和第三分支得到的特征图,global(·)表示全局平均池化,FPN(·)表示特征金字塔网络,Add[·]表示对应元素相加操作,Conv(·)表示卷积操作。第一条分支采用了全局平均池化,以获得每个通道的全局信息,再通过一个1×1卷积层调整通道数和进行通道全局信息的融合学习。第二条分支采用了一个3×3的卷积来获取特征图的局部信息。第三条分支设计了一个特征金字塔网络,融合三种不同尺度的特征。特征金字塔网络使用了三级步长为2的卷积网络,卷积核大小依次为5×5,3×3,1×1。金字塔网络依次对不同尺度的信息进行融合,可以更准确的融合相邻尺度的上下文信息,得到更丰富的多尺度语义信息。最后将三个分支的输出特征进行对应元素相加得到最后的增强特征。
(S3):提出感受野增强模块。
在目标检测任务中,通常存在许多小目标或者尺度变化较大的目标。为了解决这个问题,特征图最好能覆盖不同尺度的感受野。受DenseASPP的启发,本发明利用扩张卷积和密集连接方式,设计了感受野增强模块,用来获得高层特征更密集的采样和更大尺度的感受野,建立并增强不同感受野特征图之间的联系,学习到更丰富的信息,其结构如图3所示,其中四条分支分别表示为f1,f2,f3,f4。
f1即原有输入特征,直接与其他三条分支的输出特征进行拼接,从而进一步保持了原有输入特征的空间信息和语义信息,起到残差连接的效果。f2分支旨在增强水平方向上的空间信息,首先使用1×1卷积降低通道数,然后使用3×1的卷积在行维度上进行一维卷积,增强学习特征点间的水平空间关系,最后使用了扩张率为3的3×3卷积,进一步增强学习更大感受野的上下文信息。f2的输出特征和f1在通道维度上进行拼接后,输入f3分支。f3分支旨在增强垂直方向上的空间信息,首先使用1×1卷积降低通道数,然后使用1×3的卷积在列维度上进行一维卷积,增强学习特征点间的垂直空间关系,最后使用了扩张率为3的3×3卷积,进一步增强学习更大感受野的上下文信息。f4将f1,f2的输出特征和f3的输出特征进行拼接作为输入,然后对其进行1×1,1×3,3×1和扩张率为5的3×3卷积,对输入特征的列向量和行向量两个维度进行感受野增强。最后将四条分支的输出特征进行拼接,再通过一个1×1卷积调整通道数,得到最终的输出特征。其计算过程如公式(5-8)所示。
f2=Conv3×3,d=3(Conv3×1(Conv1×1(f))) (5)
f3=Conv3×3,d=3(Conv1×3(Conv1×1(C{f1,f2}))) (6)
f4=Conv3×3,d=5(Conv3×1(Conv1×3(Conv1×1(C{f1,f2,f3})))) (7)
fout=Conv1×1(C{f1,f2,f3,f4}) (8)
其中Conv3×3,d=3和Conv3×3,d=5分别表示扩张卷积层,Conv表示卷积操作,C{·}表示沿通道维度的拼接操作,fout表示最终输出特征。
以下结合目标检测效果图实施例对本发明效果进行详细描述。
表1比较了本发明提出的方法(以下简称FIEN)与其他方法对PASCAL VOC数据集中每个类别的检测精度。从表1的实验结果可以看出,本发明算法在所有类别中的检测精度都高于SSD算法,尤其是在包含小目标较多的Bottle和Plant类别上,其检测效果显著。对于一些小目标比例较多的类别如Boat、Chair和Bird,FIEN_RFB的检测精度比RFB分别提高了2.6%、1.4%和1.1%,这说明本发明提出的两个模块能够提取更丰富的上下文信息,有利于小目标的检测。
表1各个类别的检测精度
图4示例了本发明在MS COCO测试集的一些测试图片上得到的检测效果图。从图4可以看出,对于检测环境复杂、目标尺度多变且密集的小目标而言,本发明的检测精度较高,降低了误检率和漏检率,如图4中第三列第二行的行人,鸟和船等物体都被检测到了。由于本发明算法对骨干网络提取到的特征进行了拼接融合以及语义信息增强和感受野信息增强,使得各个尺度的目标都有概率被检测出来,故本发明在一些密集目标中也有不错的检测效果,如图4中第一列第二行的飞鸟,虽然有几只飞鸟没有检测到,但大部分飞鸟被检测到,其整体检测效果不错。
图5示例了一些本发明与SSD算法在UCAS-AOD数据集上得到的检测结果。UCAS-AOD数据集作为遥感方向的数据集,但其目标之间的关联性较强,更适合验证本发明方法对小目标检测的有效性。从图5的检测结果可以看出,SSD算法对小而密集的目标进行检测存在漏检现象,如图5(b)中有几辆靠近图像边缘的小汽车和几辆小飞机没有检测到。而使用本发明提出的FIEN方法则避免了漏检现象的发生,在图5(c)中对汽车和飞机的检测精度比SSD算法的检测精度高,同时将图像中存在的所有目标都检测到了,这表明本发明对检测小目标具有良好的效果。
本发明提出的基于信息增强与感受野增强的小目标检测方法,将骨干网络提取到的特征进行通道维度上的拼接融合,设计了信息增强模块获得输入特征的全局信息,局部信息和多尺度信息,提出了感受野增强模块,利用扩张卷积获得不同尺度感受野的特征并将其进行密集连接,从而获得具有判别性的、融合了不同抽象级别信息的特征。在得到增强后的特征图基础上进行下采样,共获得6个不同尺度的特征图并进行目标检测。在PASCALVOC、MS COCO和UCAS-AOD数据集上的实验结果表明本发明算法对检测小目标具有较高的检测精度。
Claims (1)
1.一种基于信息增强与感受野增强的小目标检测方法,包括以下步骤:
步骤(1):在骨干特征提取网络VGG-16的基础上,将低层特征与高层特征分别上采样和下采样至相同的尺度大小,然后将其在通道维度上进行拼接,获得含纹理信息和语义信息的多尺度特征图;
步骤(2):将步骤(1)得到的多尺度特征图输入到信息增强模块,信息增强模块由三条分支构成,分别学习多尺度特征图的全局信息,局部信息和多尺度语义信息,最终将三条分支获得的特征相加融合,得到增强后的语义信息特征图;
步骤(3):将步骤(1)得到的多尺度特征图输入到感受野增强模块中,此模块由四条分支组成,第二、三、四条分支分别以不同卷积核的卷积和不同扩张率的扩张卷积增强学习特征点间水平和垂直空间的关系,最后第一条分支的原有特征与其余分支获得的特征进行拼接,建立并增强不同感受野特征图之间的联系,得到增强后的感受野特征图;
步骤(4):将步骤(2)得到的语义信息特征图与步骤(3)得到的感受野特征图进行像素点相加融合,得到最终的增强特征图;
步骤(5):将步骤(4)中得到的增强特征图进行下采样,共获得6个不同尺度的特征图,然后对其进行训练得到最终的检测结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111119578.5A CN113837080B (zh) | 2021-09-24 | 2021-09-24 | 一种基于信息增强与感受野增强的小目标检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111119578.5A CN113837080B (zh) | 2021-09-24 | 2021-09-24 | 一种基于信息增强与感受野增强的小目标检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113837080A true CN113837080A (zh) | 2021-12-24 |
CN113837080B CN113837080B (zh) | 2023-07-25 |
Family
ID=78969709
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111119578.5A Active CN113837080B (zh) | 2021-09-24 | 2021-09-24 | 一种基于信息增强与感受野增强的小目标检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113837080B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102609715A (zh) * | 2012-01-09 | 2012-07-25 | 江西理工大学 | 一种结合多个兴趣点检测子的物体类识别方法 |
CN111967524A (zh) * | 2020-08-20 | 2020-11-20 | 中国石油大学(华东) | 基于高斯滤波反馈和空洞卷积的多尺度融合特征增强算法 |
CN112101153A (zh) * | 2020-09-01 | 2020-12-18 | 北京航空航天大学 | 基于感受野模块与多重特征金字塔的遥感目标检测方法 |
JP6830707B1 (ja) * | 2020-01-23 | 2021-02-17 | 同▲済▼大学 | ランダムバッチマスクとマルチスケール表現学習を融合した人物再同定方法 |
CN112507997A (zh) * | 2021-02-08 | 2021-03-16 | 之江实验室 | 一种基于多尺度卷积和感受野特征融合的人脸超分辨系统 |
CN112801117A (zh) * | 2021-02-03 | 2021-05-14 | 四川中烟工业有限责任公司 | 多路感受野引导的特征金字塔小目标检测网络及检测方法 |
CN112950477A (zh) * | 2021-03-15 | 2021-06-11 | 河南大学 | 一种基于双路径处理的高分辨率显著性目标检测方法 |
-
2021
- 2021-09-24 CN CN202111119578.5A patent/CN113837080B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102609715A (zh) * | 2012-01-09 | 2012-07-25 | 江西理工大学 | 一种结合多个兴趣点检测子的物体类识别方法 |
JP6830707B1 (ja) * | 2020-01-23 | 2021-02-17 | 同▲済▼大学 | ランダムバッチマスクとマルチスケール表現学習を融合した人物再同定方法 |
CN111967524A (zh) * | 2020-08-20 | 2020-11-20 | 中国石油大学(华东) | 基于高斯滤波反馈和空洞卷积的多尺度融合特征增强算法 |
CN112101153A (zh) * | 2020-09-01 | 2020-12-18 | 北京航空航天大学 | 基于感受野模块与多重特征金字塔的遥感目标检测方法 |
CN112801117A (zh) * | 2021-02-03 | 2021-05-14 | 四川中烟工业有限责任公司 | 多路感受野引导的特征金字塔小目标检测网络及检测方法 |
CN112507997A (zh) * | 2021-02-08 | 2021-03-16 | 之江实验室 | 一种基于多尺度卷积和感受野特征融合的人脸超分辨系统 |
CN112950477A (zh) * | 2021-03-15 | 2021-06-11 | 河南大学 | 一种基于双路径处理的高分辨率显著性目标检测方法 |
Non-Patent Citations (4)
Title |
---|
J .REDOM: "YOLOv3:an ancremental improvement", 《PROCEEDINGS OF THE COMPUTER VISION AND PATTERN RECOGNITION》 * |
SHANGNAN ZHAO,YONG SONG: "Infrared target detection method based on the receptive field and lateral inhibition of human visual system", 《OPTICAL SOCIETY OF AMERICA》 * |
罗会兰,童康: "基于深度学习的视频中人体动作 识别进展综述", 《电子学报》 * |
陈鸿坤,罗会兰: "多尺度语义信息融合的目标检测", 《电子与信息学报》, vol. 43, no. 7 * |
Also Published As
Publication number | Publication date |
---|---|
CN113837080B (zh) | 2023-07-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112380921A (zh) | 一种基于车联网的道路检测方法 | |
CN110853057B (zh) | 基于全局和多尺度全卷积网络的航拍图像分割方法 | |
CN111753677B (zh) | 基于特征金字塔结构的多角度遥感船舶图像目标检测方法 | |
CN111160205B (zh) | 一种交通场景嵌入式多类目标端对端统一检测方法 | |
CN113688836A (zh) | 一种基于深度学习的实时性道路图像语义分割方法及系统 | |
CN112488025B (zh) | 基于多模态特征融合的双时相遥感影像语义变化检测方法 | |
CN106910202B (zh) | 一种遥感图像地物的图像分割方法及系统 | |
CN110717493B (zh) | 一种基于深度学习的含堆叠字符的车牌识别方法 | |
CN113256649B (zh) | 一种基于深度学习的遥感图像选站选线语义分割方法 | |
CN111612051A (zh) | 一种基于图卷积神经网络的弱监督目标检测方法 | |
CN113780132A (zh) | 一种基于卷积神经网络的车道线检测方法 | |
CN113487600B (zh) | 一种特征增强尺度自适应感知船舶检测方法 | |
CN112990065A (zh) | 一种基于优化的YOLOv5模型的车辆分类检测方法 | |
CN112766409A (zh) | 一种遥感图像目标检测的特征融合方法 | |
CN110807485A (zh) | 基于高分遥感影像二分类语义分割图融合成多分类语义图的方法 | |
Li et al. | An aerial image segmentation approach based on enhanced multi-scale convolutional neural network | |
CN115482518A (zh) | 一种面向交通场景的可扩展多任务视觉感知方法 | |
CN113298817A (zh) | 一种准确率高的遥感图像语义分割方法 | |
CN115471754A (zh) | 一种基于多维多尺度U-net网络的遥感图像道路提取方法 | |
CN115565044A (zh) | 一种目标检测方法及系统 | |
CN114519819B (zh) | 一种基于全局上下文感知的遥感图像目标检测方法 | |
CN115861756A (zh) | 基于级联组合网络的大地背景小目标识别方法 | |
CN116579992A (zh) | 一种用于无人机巡检的小目标螺栓缺陷检测方法 | |
CN116363526A (zh) | MROCNet模型构建与多源遥感影像变化检测方法及系统 | |
CN113361528B (zh) | 一种多尺度目标检测方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |