CN112990348A - 一种自调节特征融合的小目标检测方法 - Google Patents

一种自调节特征融合的小目标检测方法 Download PDF

Info

Publication number
CN112990348A
CN112990348A CN202110389258.5A CN202110389258A CN112990348A CN 112990348 A CN112990348 A CN 112990348A CN 202110389258 A CN202110389258 A CN 202110389258A CN 112990348 A CN112990348 A CN 112990348A
Authority
CN
China
Prior art keywords
feature
feature fusion
interest
region
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110389258.5A
Other languages
English (en)
Other versions
CN112990348B (zh
Inventor
黄韬
余卫宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN202110389258.5A priority Critical patent/CN112990348B/zh
Publication of CN112990348A publication Critical patent/CN112990348A/zh
Application granted granted Critical
Publication of CN112990348B publication Critical patent/CN112990348B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种自调节特征融合的小目标检测方法,涉及人工智能领域。本发明包括以下步骤:获取第一特征图,利用目标检测算法,计算第一目标回归结果和第一分类结果,并通过第一目标回归结果和第一分类结果,得到感兴趣区域信息和第一特征图的置信度;感兴趣区域信息为感兴趣区域的高度和宽度;利用感兴趣区域的宽度和高度计算特征融合深度最大值;利用置信度计算特征融合深度;根据特征融合深度最大值和特征融合深度获取特征融合后的第二特征图;将第二特征图利用目标检测算法,计算第二目标回归和第二分类结果,完成目标检测。本发明综合考虑先验和后验信息以提高特征获取的准确度,减少了对“大小较小但容易检测的目标”的冗余消耗。

Description

一种自调节特征融合的小目标检测方法
技术领域
本发明涉及人工智能领域,更具体的说是涉及一种自调节特征融合的小目标检测方法。
背景技术
目标检测是人工智能的应用领域之一,在经过传统图像处理方法和卷积神经网络方法的发展后,深度学习方法展现出优异的效果,使目标检测得到了很好的提升。在使用深度学习进行目标检测的过程中,需要获取特征图,并根据其中的特征得到最终的目标位置和类别。另外,为了更广泛的实际应用,小目标检测是常见的任务,同时也成为对深度学习的挑战之一。在大小不同的目标检测中,对小目标的检测往往更为困难。与正常目标检测相比,小目标检测的困难点在于特征分辨率较小,导致最终类别检测结果的score相差不大且不高。由于小目标检测的困难点在于特征提取,目前的解决方法一般有改进特征提取网络,或使用tricks优化,或特征融合等其他方法。改进特征提取网络的方法固然有效,但改动较大且容易影响其他检测模块;使用tricks优化,例如soft-NMS通过后项处理方法优化检测结果,并未解决核心的困难点。而特征融合的方法即在特征层面进行改进,又不会过分影响网络结构,是常见的小目标检测解决方法。
特征金字塔是常用的特征融合方法之一,通过特征金字塔可以获得不同层数融合的特征图。特征金字塔在应用于Faster R-CNN时,会根据RoI(Region of interest)大小决定使用特征金字塔中不同层的输出。
但是,这种方法仅仅利用了RoI大小的先验信息来决定使用特征金字塔不同的输出作为特征图,缺乏对后验信息的考虑,而且RoI的先验信息也只是属于预测性质。此外,并非所有的小目标均需要多层特征融合结果作为特征图才能有较好的检测结果,对大小相同的目标取相同层数融合的特征图进行处理,会产生冗余的消耗。
发明内容
有鉴于此,本发明提供了一种自调节特征融合的小目标检测方法。
为了实现上述目的,本发明采用如下技术方案:
一种自调节特征融合的小目标检测方法,包括以下步骤:
获取第一特征图,利用目标检测算法,计算第一目标回归结果和第一分类结果,并通过所述第一目标回归结果和所述第一分类结果,得到感兴趣区域信息和所述第一特征图的置信度score;所述感兴趣区域信息为感兴趣区域的高度和宽度;
利用所述感兴趣区域的宽度和高度计算特征融合深度最大值;利用所述置信度score计算特征融合深度;
根据所述特征融合深度最大值和所述特征融合深度利用特征金字塔获取特征融合后的第二特征图;
将第二特征图利用所述目标检测算法,计算第二目标回归和第二分类结果,完成目标检测。
优选的,计算特征融合深度最大值具体如下:
Figure BDA0003016249630000021
Ni表示标准图像输入边长,h是感兴趣区域的高度,w是感兴趣区域的宽度,且h,w≤Ni
优选的,计算特征融合深度具体如下:
d=sum(D(S1,Si)≤θ·λ);
其中Si表示分类置信度score按从大到小顺序排列中第i位的值,D(·)表示S1与Si的距离,在此取D(S1,Si)=|S1-Si|,λ表示阈值常量。
优选的,特征金字塔获取特征图的具体过程如下:
第一特征图输入到特征金字塔中,完成特征提取,各特征提取层输出不同的特征,经特征融合后输出多种特征图,根据所述特征融合深度最大值和所述特征融合深度选取第二特征图。
经由上述的技术方案可知,与现有技术相比,本发明公开提供了一种自调节特征融合的小目标检测方法,通过利用预测RoI大小的先验信息结合score后验信息来调节特征融合深度,从而选择合适的特征融合结果作为特征图,综合考虑先验和后验信息可以提高特征获取的准确度;此外,通过类别score的差距影响特征融合深度,减少了对“大小较小但容易检测的目标”的冗余消耗。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1附图为本发明的流程示意图;
图2附图为本发明的特征金字塔图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例公开了一种自调节特征融合的小目标检测方法,如图1所示,包括以下步骤:
获取第一特征图,利用目标检测算法,计算第一目标回归结果和第一分类结果,并通过第一目标回归结果和第一分类结果,得到感兴趣区域信息和第一特征图的置信度score;感兴趣区域信息为感兴趣区域的高度和宽度;
利用感兴趣区域的宽度和高度计算特征融合深度最大值;利用置信度score计算特征融合深度;
根据特征融合深度最大值和特征融合深度利用特征金字塔获取特征融合后的第二特征图;
将第二特征图利用目标检测算法,计算第二目标回归和第二分类结果,完成目标检测。
在本实施例中,具体实现流程包括以下步骤:
在无特征融合条件下,计算目标回归和分类结果;
例如Faster R-CNN算法模型,其特征图是取自最后一个卷积层的输出。在无特征融合条件下,正常计算该目标的回归和分类结果,得到感兴趣区域的宽度和高度,以及其置信度score。
这里的第一特征图可以为任意卷积神经网络的输出图像。
(2)计算特征融合深度算法S2;
算法包括如下两个具体步骤。
步骤S21:计算特征融合深度最大值
Figure BDA0003016249630000041
Ni表示标准图像输入边长,例如数据集为ImageNet时取Ni=224。h和w分别是RoI的高和宽,且h,w≤Ni。此外,令dm为特征可融合深度上限,例如在Faster R-CNN中dm=5。通过①式计算dmax,若dmax≤dm,则dmax取①式;若dmax>dm,则取dmax=dm。以此限制保证最终结果dmax≤dm
步骤S22:计算特征融合深度
d=sum(D(S1,Si)≤θ·λ) ②
其中Si表示分类置信度score按从大到小顺序排列中第i位的值,例如S1表示score排名第1的类别所对应的值,Si中的i=2,3,4,5。D(·)表示S1与Si的距离,在此取D(S1,Si)=|S1-Si|。λ表示阈值常量,可取λ=0.4。θ表示调整系数,取
Figure BDA0003016249630000051
其中j=1,2,3,4,5。sum(·)表示计算符合不等式d(S1,Si)≤θ·λ的个数。通过②式计算d,若d≤dmax,则d取②式;若d>dmax,则取d=dmax。以此限制保证最终结果d≤dmax
dm和dmax决定了特征融合深度的上限,该上限表示特征金字塔自上而下特征融合的深度。②式中通过计算S1与其他Si的差距,反映排名第1的类别与其他类别的判断悬殊。由于score排名一般只有前几名的值较大,在此取排名前5的score值。若D(·)输出较小,表示预测两种类别的可能性相近,更容易满足不等式D(S1,Si)≤θ·λ。θ表示Si的比重,θ越大,越容易满足不等式D(S1,Si)≤θ·λ。可见,只有当Si与S1相近且比重较大的Si才满足不等式D(S1,Si)≤θ·λ。最后通过sum(·)计算特征融合深度。
(3)根据(2)中的结果,获取特征融合后的特征图。
如图2所示:
特征金字塔的输入是标准图像。首先,标准图像输入到特征提取网络进行特征提取,各个特征提取层C1-C5输出不同的特征;然后,经过M2-M5的特征融合后,特征金字塔会输出P2-P6共5种深度的特征图,其中P6深度最小,P2深度最大;最后,根据(2)中计算得到的特征融合深度d来决定所采用的特征融合后的特征图,特征融合深度d的值越大,则采用特征融合深度越大的特征图。例如特征融合深度d=1,则output取P6输出;若特征融合深度d=2,则output取P5输出,以此类推。output输出作为特征融合后的特征图。
(4)在(3)中得到特征融合后的特征图以后,根据所使用的目标检测算法,利用特征图上的特征信息既可以回归计算目标的位置,又可以计算目标的类别置信度,因此可以通过计算得到最终目标回归和分类的结果,完成目标检测。例如所使用的目标检测算法是Faster R-CNN,首先将特征融合后的特征图输入至RPN网络得到RoI,接着将RoI结合特征融合后的特征图输入至分类回归网络,最后经过分类回归网络的计算,得到目标回归和分类的结果。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (4)

1.一种自调节特征融合的小目标检测方法,其特征在于,包括以下步骤:获取第一特征图,利用目标检测算法,计算第一目标回归结果和第一分类结果,并通过所述第一目标回归结果和所述第一分类结果,得到感兴趣区域信息和所述第一特征图的置信度score;所述感兴趣区域信息为感兴趣区域的高度和宽度;
利用所述感兴趣区域的宽度和高度计算特征融合深度最大值;利用所述置信度score计算特征融合深度;
根据所述特征融合深度最大值和所述特征融合深度利用特征金字塔获取特征融合后的第二特征图;
将第二特征图利用所述目标检测算法,计算第二目标回归和第二分类结果,完成目标检测。
2.根据权利要求1所述的一种自调节特征融合的小目标检测方法,其特征在于,计算特征融合深度最大值具体如下:
Figure FDA0003016249620000011
Ni表示标准图像输入边长,h是感兴趣区域的高度,w是感兴趣区域的宽度,且h,w≤Ni
3.根据权利要求1所述的一种自调节特征融合的小目标检测方法,其特征在于,计算特征融合深度具体如下:
d=sum(D(S1,Si)≤θ·λ);
其中Si表示分类置信度score按从大到小顺序排列中第i位的值,D(·)表示S1与Si的距离,在此取D(S1,Si)=|S1-Si|,λ表示阈值常量。
4.根据权利要求1所述的一种自调节特征融合的小目标检测方法,其特征在于,特征金字塔获取特征图的具体过程如下:
第一特征图输入到特征金字塔中,完成特征提取,各特征提取层输出不同的特征,经特征融合后输出多种特征图,根据所述特征融合深度最大值和所述特征融合深度选取第二特征图。
CN202110389258.5A 2021-04-12 2021-04-12 一种自调节特征融合的小目标检测方法 Active CN112990348B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110389258.5A CN112990348B (zh) 2021-04-12 2021-04-12 一种自调节特征融合的小目标检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110389258.5A CN112990348B (zh) 2021-04-12 2021-04-12 一种自调节特征融合的小目标检测方法

Publications (2)

Publication Number Publication Date
CN112990348A true CN112990348A (zh) 2021-06-18
CN112990348B CN112990348B (zh) 2023-08-22

Family

ID=76338008

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110389258.5A Active CN112990348B (zh) 2021-04-12 2021-04-12 一种自调节特征融合的小目标检测方法

Country Status (1)

Country Link
CN (1) CN112990348B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102880866A (zh) * 2012-09-29 2013-01-16 宁波大学 一种人脸特征提取方法
CN107578418A (zh) * 2017-09-08 2018-01-12 华中科技大学 一种融合色彩和深度信息的室内场景轮廓检测方法
CN107886117A (zh) * 2017-10-30 2018-04-06 国家新闻出版广电总局广播科学研究院 基于多特征提取和多任务融合的目标检测算法
CN108510573A (zh) * 2018-04-03 2018-09-07 南京大学 一种基于深度学习的多视点人脸三维模型重建的方法
CN110335270A (zh) * 2019-07-09 2019-10-15 华北电力大学(保定) 基于层级区域特征融合学习的输电线路缺陷检测方法
CN111783819A (zh) * 2020-05-08 2020-10-16 国家电网有限公司 小规模数据集上基于感兴趣区域训练改进的目标检测方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102880866A (zh) * 2012-09-29 2013-01-16 宁波大学 一种人脸特征提取方法
CN107578418A (zh) * 2017-09-08 2018-01-12 华中科技大学 一种融合色彩和深度信息的室内场景轮廓检测方法
CN107886117A (zh) * 2017-10-30 2018-04-06 国家新闻出版广电总局广播科学研究院 基于多特征提取和多任务融合的目标检测算法
CN108510573A (zh) * 2018-04-03 2018-09-07 南京大学 一种基于深度学习的多视点人脸三维模型重建的方法
CN110335270A (zh) * 2019-07-09 2019-10-15 华北电力大学(保定) 基于层级区域特征融合学习的输电线路缺陷检测方法
CN111783819A (zh) * 2020-05-08 2020-10-16 国家电网有限公司 小规模数据集上基于感兴趣区域训练改进的目标检测方法

Also Published As

Publication number Publication date
CN112990348B (zh) 2023-08-22

Similar Documents

Publication Publication Date Title
CN110059554B (zh) 一种基于交通场景的多支路目标检测方法
CN109117876B (zh) 一种稠密小目标检测模型构建方法、模型及检测方法
CN111553387B (zh) 一种基于Yolov3的人员目标检测方法
CN108596053B (zh) 一种基于ssd和车辆姿态分类的车辆检测方法和系统
CN109800692B (zh) 一种基于预训练卷积神经网络的视觉slam回环检测方法
CN111126482B (zh) 一种基于多分类器级联模型的遥感影像自动分类方法
CN110543906B (zh) 基于Mask R-CNN模型的肤质自动识别方法
CN109272467B (zh) 一种基于多尺度边缘线索的层次化图像分割方法
CN108492298B (zh) 基于生成对抗网络的多光谱图像变化检测方法
JP5353631B2 (ja) 画像処理方法、画像処理プログラム及び画像処理装置
CN106022254A (zh) 图像识别技术
CN111325237B (zh) 一种基于注意力交互机制的图像识别方法
CN112560710B (zh) 一种用于构建指静脉识别系统的方法及指静脉识别系统
CN114821665A (zh) 一种基于卷积神经网络的城市人流小目标检测方法
Wang et al. An active contour model based on local pre-piecewise fitting bias corrections for fast and accurate segmentation
CN111862260B (zh) 基于跨域对偶生成式对抗网络的偏见消除方法与装置
CN111860637B (zh) 一种单发多框红外目标检测方法
CN111291760A (zh) 图像的语义分割方法、装置及电子设备
CN113313706A (zh) 基于检测参考点偏移分析的电力设备缺陷图像检测方法
CN110347853B (zh) 一种基于循环神经网络的图像哈希码生成方法
CN111368865B (zh) 遥感影像储油罐检测方法、装置、可读存储介质及设备
CN108520539B (zh) 一种基于稀疏学习可变模型的图像目标检测方法
CN114332921A (zh) 基于改进聚类算法的Faster R-CNN网络的行人检测方法
CN103971362A (zh) 基于直方图和精英遗传聚类算法的sar图像变化检测
CN111340139B (zh) 一种图像内容复杂度的判别方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant