CN114782709A - 一种基于高斯分配策略的图像小目标检测方法及系统 - Google Patents
一种基于高斯分配策略的图像小目标检测方法及系统 Download PDFInfo
- Publication number
- CN114782709A CN114782709A CN202210559371.8A CN202210559371A CN114782709A CN 114782709 A CN114782709 A CN 114782709A CN 202210559371 A CN202210559371 A CN 202210559371A CN 114782709 A CN114782709 A CN 114782709A
- Authority
- CN
- China
- Prior art keywords
- target
- gaussian distribution
- samples
- image
- network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Probability & Statistics with Applications (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于高斯分配策略的图像小目标检测方法及系统,通过加载图像和提取图像的相应特征,构成多尺度特征图集合;将提取的底层特征图和高层特征图进行特征融合,生成融合特征图;根据生成的融合特征图预测目标的类别、目标预测框的坐标值和目标框的中心度;使用高斯分配策略分配图像正负样本;结合分配的正负样本和网络输出的目标类别、预测框坐标和中心度计算网络损失;根据计算出的网络损失来更新网络参数直到网络收敛;利用训练好的网络,预测输入图像中目标的类别、目标预测框的坐标值和目标框的中心度,之后利用后处理算法获得检测结果。本发明使小目标检测器的性能平均提高两倍,对于非常微小的目标,甚至可以提高三倍。
Description
技术领域
本发明涉及图像智能处理技术领域,尤其公开了一种基于高斯分 配策略的图像小目标检测方法及系统。
背景技术
目前,小尺寸目标检测作为计算机视觉中的一个研究难点和热点 被广泛应用于驾驶辅助、遥感和大规模视频监控。在近期提出的新颖 的网络结构和标签分配策略的推动下,已经取得了较大的进步,但仍 然是一个非常具有挑战性的问题。鉴于当前应用的遥感图像小目标检 测场景,目标在图像上成像平均低于13个像素,甚至存在4个像素 的弱小目标,现有的目标检测算法很难精确检测此类目标。
目前的解决小目标检测的问题主要有三种思路。一是通过归一化 输入图像尺寸和多尺度特征学习来获取尺寸不变性特征(Scale match for tiny person detection:Proceedings of the IEEE/CVF Winter Conference on Applications of ComputerVision.(2020)1257{1265)。 第二是通过GAN网络或者上下文信息增强小目标的特征表示能力 (Perceptual generative adversarial networks for small object detection.:Proceedings of the IEEE conference on computer vision and patternrecognition.(2017)1222{1230)。第三种是通过特定的算法度量两个包 围框的相似性来提高小目标检测的性能(A normalized gaussian wasserstein distance for tinyobject detection.arXiv preprint arXiv:2110.13389(2021))。
这些方法虽然在一定程度上提高了小目标检测的性能,但是性能 提升有限,同时忽略了标签分配策略对小目标检测性能的影响。
目前的标签分配策略为小尺寸目标分配正样本过少,不同尺寸的 目标分配的正样本数量差异过大,会造成对小目标的检测精准度低, 无法满足使用要求。
因此,现有小尺寸目标检测方法中存在的上述缺陷,是目前亟待 解决的技术问题。
发明内容
本发明提供了一种基于高斯分配策略的图像小目标检测方法及 系统,旨在解决现有小尺寸目标检测方法中存在的上述缺陷。
本发明的一方面涉及一种基于高斯分配策略的图像小目标检测 方法,包括以下步骤:
加载图像和提取图像的相应特征,构成多尺度特征图集合;
将提取的底层特征图和高层特征图进行特征融合,生成融合特征 图;
根据生成的融合特征图进行检测输出,预测目标的类别、目标预 测框的坐标值和目标框的中心度;
使用高斯分配策略分配图像正负样本;
结合分配的正负样本和网络输出的目标类别、预测框坐标和中心 度计算网络损失;
根据计算出的网络损失来更新网络参数,重复以上训练步骤,不 断更新网络参数直到网络收敛;
利用训练好的网络,预测输入图像中目标的类别、目标预测框的 坐标值和目标框的中心度;
对检测结果进行非极大值抑制处理,去除重复预测的目标类别和 预测框坐标值,获得最佳检测结果。
进一步地,加载和提取图像的相应特征,构成多尺度特征图集合 的步骤之后还包括:
由标注产生的热图来对训练样本进行编码,利用预设的α阈值来 控制正样本的比例,热图中大于α阈值的样本为正样本,若热图中小 于或等于α阈值的样本为负样本;
对编码后的训练样本应用于回归权重。
对于一个标注框mth,(x,y,w,h)属于第m类,将线性地映射到特征 图的尺度上;
二维高斯分布的概率密度函数由以下公式给出:
其中,x表示高斯分布的坐标(x,y)、μ表示高斯分布的平均矢量、 ∑表示高斯分布的协方差矩阵;
其中,β用来限制w和h的最大值,以平衡分配给不同尺寸物体 的正样本数量;
通过对Hm进行逐元素取最大处理来更新H中的第cm通道;
对于旋转的标注框(x,y,w,h,θ),采用旋转的二维高斯分布N(μ,∑) 来产生目标的热图,
其中,w为旋转宽度、h表示旋转高度,θ表示旋转角度。
进一步地,由标注产生的热图来对训练样本进行编码,利用预设 的α阈值来控制正样本的比例,热图中大于α阈值的样本为正样本, 热图中小于或等于α阈值的样本为负样本的步骤中,
样本的目标的中心度定义为:
其中,l,r,t,b分别代表目标中心点到目标框左右上下四条边的距 离。
进一步地,对编码后的训练样本应用于回归权重的步骤中,
假设(i,j)在第m个标注框的子区域Am内,Wij为回归样本权重,
其中,Gm(i,j)是高斯概率在(i,j)处的高斯概率,am是第m个盒子 的面积。
本发明的另一方面涉及一种基于高斯分配策略的图像小目标检 测系统,包括:
特征提取模块,用于加载和提取图像的相应特征,构成多尺度特 征图集合;
特征融合模块,用于将提取的底层特征图和高层特征图进行特征 融合,生成融合特征图;
检测模块,用于根据生成的所述融合特征图进行检测输出,预测 目标的类别、目标预测框的坐标值和目标框的中心度;
分配模块,用于使用高斯分配策略分配图像正负样本;
计算模块,用于结合分配的正负样本和网络输出的目标类别、预 测框坐标和中心度计算网络损失;
更新模块,用于根据计算出的网络损失来更新网络参数,重复以 上训练步骤,不断更新网络参数直到网络收敛;
预测模块,用于利用训练好的网络,预测输入图像中目标的类别、 目标预测框的坐标值和目标框的中心度;
后处理模块,用于对检测结果进行非极大值抑制处理,去除重复 预测的目标类别和预测框坐标值,获得最佳检测结果。
进一步地,基于高斯分配策略的图像小目标检测系统还包括:
训练样本编码单元,用于由标注产生的热图来对训练样本进行编 码,利用预设的α阈值来控制正样本的比例,热图中大于α阈值的样 本为正样本,热图中小于或等于α阈值的样本为负样本;
回归权重单元,用于对编码后的训练样本应用于回归权重。
进一步地,热图映射单元中,对于一个标注框mth,(x,y,w,h)属于 第m类,将线性地映射到特征图的尺度上;
二维高斯分布的概率密度函数由以下公式给出:
其中,x表示高斯分布的坐标(x,y)、μ表示高斯分布的平均矢量、 ∑表示高斯分布的协方差矩阵;
其中,β用来限制w和h的最大值,以平衡分配给不同尺寸物体 的正样本数量;
通过对Hm进行逐元素取最大处理来更新H中的第cm通道;
对于旋转的标注框(x,y,w,h,θ),采用旋转的二维高斯分布N(μ,∑) 来产生目标的热图,
其中,w为旋转宽度、h表示旋转高度,θ表示旋转角度。
进一步地,训练样本编码单元中,样本的目标的中心度定义为:
其中,l,r,t,b分别代表目标中心点到目标框左右上下四条边的距 离。
进一步地,假设(i,j)在第m个标注框的子区域Am内,Wij为回归样 本权重,
其中,Gm(i,j)是高斯概率在(i,j)处的高斯概率,am是第m个盒子 的面积。
本发明所取得的有益效果为:
本发明提供一种基于高斯分配策略的图像小目标检测方法及系 统,通过加载图像和提取图像的相应特征,构成多尺度特征图集合; 将提取的底层特征图和高层特征图进行特征融合,生成融合特征图; 根据生成的融合特征图进行检测输出,预测目标的类别、目标预测框 的坐标值和目标框的中心度;使用高斯分配策略分配图像正负样本; 结合分配的正负样本和网络输出的目标类别、预测框坐标和中心度计 算网络损失;根据计算出的网络损失来更新网络参数,重复以上训练 步骤,不断更新网络参数直到网络收敛;利用训练好的网络,预测输 入图像中目标的类别、目标预测框的坐标值和目标框的中心度;对检 测结果进行非极大值抑制处理,去除重复预测的目标类别和预测框坐 标值,获得最佳检测结果。本发明提供的基于高斯分配策略的图像小 目标检测方法及系统,提出的高斯分配策略可以增加小目标分配的正 样本的数量,同时平衡不同尺寸物体分配的正样本的数量;提出的高 斯分配策略可以将归一化的高斯概率作为样本权重,在计算损失的过 程中对正样本的贡献进行重新加权,平衡不同尺寸物体的影响;提供 的算法可以使小目标检测器的性能平均提高两倍,对于非常微小的目 标,甚至可以提高三倍;性能比最先进的竞争对手高出3.4%(从20.8% 到24.2%),同时实现了7倍的加速。
附图说明
图1为本发明提供的基于高斯分配策略的图像小目标检测方法 一实施例的流程示意图;
图2为本发明提供的基于高斯分配策略的图像小目标检测方法 中网络结构图;
图3为本发明提供的基于高斯分配策略的图像小目标检测方法 中标注框映射为二维高斯分布示意图;
图4为本发明提供的基于高斯分配策略的图像小目标检测方法 中利用高斯热图编码训练样本示意图;
图5为本发明提供的基于高斯分配策略的图像小目标检测方法 中不同的标签方配策略对不同尺寸物体标签分配情况示意图;
图6为本发明提供的基于高斯分配策略的图像小目标检测方法 中训练阶段流程图;
图7为本发明提供的基于高斯分配策略的图像小目标检测方法 中推理阶段流程图;
图8为本发明提供的基于高斯分配策略的图像小目标检测方法 中的检测效果图;
图9为本发明提供的基于高斯分配策略的图像小目标检测系统 第一实施例的功能框图;
图10为本发明提供的基于高斯分配策略的图像小目标检测系统 第二实施例的功能框图。
附图标号说明:
10、特征提取模块;20、特征融合模块;30、检测模块;40、分 配模块;50、计算模块;60、更新模块;70、预测模块;80、后处理 模块;11、热图映射单元;12、训练样本编码单元;13、回归权重单 元。
具体实施方式
为了更好的理解上述技术方案,下面将结合说明书附图以及具体 的实施方式对上述技术方案做详细的说明。
如图1至图8所示,本发明第一实施例提出一种基于高斯分配策 略的图像小目标检测方法,包括以下步骤:
步骤S100、加载和提取图像的相应特征,构成多尺度特征图集 合。
接收样本图像,提取样本图像的特征,构成多尺度特征图集合; 由于目标尺寸较小,增加4倍下采样的特征图输出。特征提取可以采 用通用的Darknet53、Resnet50、DLA34等骨干网络。
步骤S200、将提取的底层特征图和高层特征图进行特征融合, 生成融合特征图。
将提取的底层特征图和高层特征图进行特征融合,生成下采样率 为4倍通道数为128的融合特征图。在特征融合模块中增加快捷连接 来引入高分辨率的特征。快捷连接引入了骨干网第2、3和4阶段的 特征,每个连接由3×3卷积层实现。第2、3、4阶段的层数分别为 3、2、1层。
步骤S300、根据生成的融合特征图进行检测输出,预测目标的 类别、目标预测框的坐标值和目标框的中心度。
接收特征融合模块生成的融合特征图,预测目标的类别、目标预 测框的坐标值和目标框的中心度。检测模块的所有分支和子模块都与 特征融合模块相连且都是卷积网络。检测模块包括分类分支和定位分 支。
1)分类分支用于对融合特征图做卷积处理,获得类别预测分数。 分类分支与所述特征融合模块相连,先通过2层128通道3×3卷积 层获取分类特征,然后通过一层目标类别数通道的3×3卷积获得类 别置信度。
2)定位分支用于对融合特征图做卷积处理,获得预测框的坐标 和中心度。定位分支与特征融合模块相连,通过两层64通道3×3卷 积层获取回归特征。
定位分支分为两个模块,一个是目标框回归模块,一个是中心度 回归模块。其中目标框回归模块采用1层4通道3×3卷积来获得目 标预测框的坐标值,中心度回归模块用于采用1层单通道3×3卷积 层获得目标的中心度。
步骤S400、使用高斯分配策略分配图像正负样本。
步骤S500、结合分配的正负样本和网络输出的目标类别、预测 框坐标和中心度计算网络损失。
损失函数由以下几个部分构成。
L=Lc+λoWLreg+λ1Lcen (1)
在公式(1)中,Lc为分类损失,在这里采用Focalloss。λo、λ1为 损失系数,用来调节不同损失的贡献,在这里取λo=2.0,λ1=1.0。Lreg为回归损失,采用IoUloss;W即L=Lc+λoWLreg+λ1Lcen L=Lc+λoWLreg+λ1Lcen L=Lc+λoWLreg+λ1Lcen L=Lc+λoWLreg+λ1Lcen为Wij, Lcen为中心度损失,采用L1损失。
步骤S600、根据计算出的网络损失来更新网络参数,重复以上 训练步骤,不断更新网络参数直到网络收敛。
计算网络损失,并进行梯度回传,更新网络参数,并不断迭代训 练直至网络收敛。
步骤S700、利用训练好的网络,预测输入图像中目标的类别、 目标预测框的坐标值和目标框的中心度。
步骤S800、对检测结果进行非极大值抑制处理,去除重复预测 的目标类别和预测框坐标值,获得最终检测结果。
利用后处理算法获得检测结果。图6为检测效果图。其中上半部 分图为没有使用高斯分配策略的小目标检测算法的检测结果,下半部 分方为使用高斯分配策略的小目标检测效果。图中可以看出算法能够 明显改善弱小目标检测精度。
本实施例提供的基于高斯分配策略的图像小目标检测方法,通过 加载图像和提取图像的相应特征,构成多尺度特征图集合;将提取的 底层特征图和高层特征图进行特征融合,生成融合特征图;根据生成 的融合特征图进行检测输出,预测目标的类别、目标预测框的坐标值 和目标框的中心度;使用高斯分配策略分配图像正负样本;结合分配 的正负样本和网络输出的目标类别、预测框坐标和中心度计算网络损 失;根据计算出的网络损失来更新网络参数,重复以上训练步骤,不 断更新网络参数直到网络收敛;利用训练好的网络,预测输入图像中 目标的类别、目标预测框的坐标值和目标框的中心度;对检测结果进行非极大值抑制处理,去除重复预测的目标类别和预测框坐标值,获 得最佳检测结果。本实施例提供的基于高斯分配策略的图像小目标检 测方法,提出的高斯分配策略可以增加小目标分配的正样本的数量, 同时平衡不同尺寸物体分配的正样本的数量;提出的高斯分配策略可 以将归一化的高斯概率作为样本权重,在计算损失的过程中对正样本 的贡献进行重新加权,平衡不同尺寸物体的影响;提供的算法可以使 小目标检测器的性能平均提高两倍,对于非常微小的目标,甚至可以 提高三倍;性能比最先进的竞争对手高出3.4%(从20.8%到24.2%), 同时实现了7倍的加速。
本实施例提供的基于高斯分配策略的图像小目标检测方法,步骤 S100之后还包括:
首先,对于一个标注框mth,(x,y,w,h)属于第m类,将线性地映射 到特征图的尺度上;
二维高斯分布的概率密度函数由以下公式给出:
在公式(2)中,x表示高斯分布的坐标(x,y)、μ表示高斯分布 的平均矢量、∑表示高斯分布的协方差矩阵。
在公式(3)和(4)中,β用来限制w和h的最大值,以平衡分 配给不同尺寸物体的正样本数量。
最后,通过对Hm进行逐元素取最大处理来更新H中的第cm通道。
对于旋转的标注框(x,y,w,h,θ),采用旋转的二维高斯分布N(μ,∑) 来产生目标的热图,
在公式(5)中,w为旋转宽度、h表示旋转高度,θ表示旋转角 度。
图3为标注框映射为二维高斯分布示意图,直观展示了如何将标 注框映射为二维高斯分布。
步骤S120、由标注产生的热图来对训练样本进行编码,利用预 设的α阈值来控制正样本的比例,热图中大于α阈值的样本为正样本, 热图中小于或等于α阈值的样本为负样本。所有热图中所有大于α阈 值的样本为正样本,其他位置的样本位负样本。
样本的目标的中心度定义为:
在公式(6)中,l,r,t,b分别代表目标中心点到目标框左右上下四 条边的距离。
图4为利用高斯热图编码训练样本示意图。图中高斯分布高于α 阈值平面的位置为正样本位置,其他位置为负样本位置。
步骤S130、对编码后的训练样本应用于回归权重。
假设(i,j)在第m个标注框的子区域Am内,Wij为回归样本权重,
在公式(7)中,Gm(i,j)是高斯概率在(i,j)处的高斯概率,am是 第m个盒子的面积。
将高斯分布应用于回归权重可以充分利用大物体中包含的更多 注释信息,并保留弱小物体的注释信息;还可以强调物体中心附近的 这些样本,并减少低质量样本的影响。
由于大多数待检测小目标不是严格的四边形,所以在小目标的边 界框附近往往会有很多背景,在这些物体中,前景像素都集中在边界 框的中心。基于高斯分布的标签分配策略可以增加小目标分配的正样 本数量,并且确保至少为每个目标分配一个正样本。对于正常大小的 物体,运用的策略会选择靠近中心的高质量正样本,并减少低质量样 本的影响,同时小目标的策略通过限制物体的最大半径有效减少了不 同尺寸物体分配正样本数量的差异。
图5为不同的标签分配策略对不同尺寸物体标签分配情况示意 图。从图中可以看出,基于高斯分布的分配策略能够增加小目标分配 的正样本数量,同时平衡不同尺寸物体分配的正样本的数量。
本实施例提供的基于高斯分配策略的图像小目标检测方法,将目 标标注框映射为二维热图;由标注产生的热图来对训练样本进行编码, 利用预设的α阈值来控制正样本的比例,热图中大于α阈值的样本为 正样本,热图中小于或等于α阈值的样本为负样本;对编码后的训练 样本应用于回归权重。本实施例提供的基于高斯分配策略的图像小目 标检测方法,提出的高斯分配策略可以增加小目标分配的正样本的数 量,同时平衡不同尺寸物体分配的正样本的数量;提出的高斯分配策 略可以将归一化的高斯概率作为样本权重,在计算损失的过程中对正 样本的贡献进行重新加权,平衡不同尺寸物体的影响;提供的算法可 以使小目标检测器的性能平均提高两倍,对于非常微小的目标,甚至 可以提高三倍;性能比最先进的竞争对手高出3.4%(从20.8%到24.2%),同时实现了7倍的加速。
优选地,请见图9和图10,本发明涉及一种基于高斯分配策略 的图像小目标检测系统,包括特征提取模块10、特征融合模块20、 检测模块30、获取模块40、分配模块50、计算模块60、更新模块 70和后处理模块80,其中,特征提取模块10,用于加载和提取图像 的相应特征,构成多尺度特征图集合;特征融合模块20,用于将提 取的底层特征图和高层特征图进行特征融合,生成融合特征图;检测 模块30,用于根据生成的融合特征图进行检测输出,预测目标的类 别、目标预测框的坐标值和目标框的中心度;分配模块40,用于使 用高斯分配策略分配图像正负样本;计算模块50,用于结合分配的 正负样本和网络输出的目标类别、预测框坐标和中心度计算网络损失; 更新模块60,用于根据计算出的网络损失来更新网络参数,重复以 上训练步骤,不断更新网络参数直到网络收敛;预测模块70,用于 利用训练好的网络,预测输入图像中目标的类别、目标预测框的坐标 值和目标框的中心度;后处理模块80,用于对检测结果进行非极大 值抑制处理,去除重复预测的目标类别和预测框坐标值,获得最终检 测结果。需要说明的是,在训练阶段不需要后处理模块,只有推理阶段,就是训练完模型后,在推理阶段需要后处理模块。
特征提取模块10接收样本图像,提取样本图像的特征,构成多 尺度特征图集合;由于目标尺寸较小,增加4倍下采样的特征图输出。 特征提取可以采用通用的Darknet53、Resnet50、DLA34等骨干网络。
特征融合模块20将提取的底层特征图和高层特征图进行特征融 合,生成下采样率为4倍通道数为128的融合特征图。在特征融合模 块中增加快捷连接来引入高分辨率的特征。快捷连接引入了骨干网第 2、3和4阶段的特征,每个连接由3×3卷积层实现。第2、3、4阶 段的层数分别为3、2、1层。
检测模块30接收特征融合模块生成的融合特征图,预测目标的 类别、目标预测框的坐标值和目标框的中心度。检测模块的所有分支 和子模块都与特征融合模块相连且都是卷积网络。检测模块包括分类 分支和定位分支。
1)分类分支用于对融合特征图做卷积处理,获得类别预测分数。 分类分支与所述特征融合模块相连,先通过2层128通道3×3卷积 层获取分类特征,然后通过一层目标类别数通道的3×3卷积获得类 别置信度。
2)定位分支用于对融合特征图做卷积处理,获得预测框的坐标 和中心度。定位分支与特征融合模块相连,通过两层64通道3×3卷 积层获取回归特征。
定位分支分为两个模块,一个是目标框回归模块,一个是中心度 回归模块。其中目标框回归模块采用1层4通道3×3卷积来获得目 标预测框的坐标值,中心度回归模块用于采用1层单通道3×3卷积 层获得目标的中心度。
获取模块40对检测结果进行非极大值抑制等后处理,用于去除 重复预测的目标类别和预测框坐标值,获得最佳预测目标的类别和预 测框的坐标值。在后处理模块中,将中心度和类别置信度相乘作为目 标分类置信度进行非极大值抑制,以去除低质量的预测框。
更新模块60计算网络损失,并进行梯度回传,更新网络参数, 并不断迭代训练直至网络收敛。
后处理模块80利用后处理算法获得检测结果。图8为检测效果 图。其中上半部分图为没有使用高斯分配策略的小目标检测算法的检 测结果,下半部分方为使用高斯分配策略的小目标检测效果。图中可 以看出算法能够明显改善弱小目标检测精度。
本实施例提供的基于高斯分配策略的图像小目标检测系统,通过 加载图像和提取图像的相应特征,构成多尺度特征图集合;将提取的 底层特征图和高层特征图进行特征融合,生成融合特征图;根据生成 的融合特征图进行检测输出,预测目标的类别、目标预测框的坐标值 和目标框的中心度;使用高斯分配策略分配图像正负样本;结合分配 的正负样本和网络输出的目标类别、预测框坐标和中心度计算网络损 失;根据计算出的网络损失来更新网络参数,重复以上训练步骤,不 断更新网络参数直到网络收敛;利用训练好的网络,预测输入图像中 目标的类别、目标预测框的坐标值和目标框的中心度;对检测结果进行非极大值抑制处理,去除重复预测的目标类别和预测框坐标值,获 得最佳检测结果。本实施例提供的基于高斯分配策略的图像小目标检 测系统,提出的高斯分配策略可以增加小目标分配的正样本的数量, 同时平衡不同尺寸物体分配的正样本的数量;提出的高斯分配策略可 以将归一化的高斯概率作为样本权重,在计算损失的过程中对正样本 的贡献进行重新加权,平衡不同尺寸物体的影响;提供的算法可以使 小目标检测器的性能平均提高两倍,对于非常微小的目标,甚至可以 提高三倍;性能比最先进的竞争对手高出3.4%(从20.8%到24.2%), 同时实现了7倍的加速。
请见图10,图10为本发明提供的基于高斯分配策略的图像小目 标检测系统第二实施例的功能框图,第一实施例的基础上,基于高斯 分配策略的图像小目标检测系统还包括热图映射单元41、训练样本 编码单元42和回归权重单元43,
首先,对于一个标注框mth,(x,y,w,h)属于第m类,将线性地映射 到特征图的尺度上;
二维高斯分布的概率密度函数由以下公式给出:
在公式(8)中,x表示高斯分布的坐标(x,y)、μ表示高斯分布 的平均矢量、∑表示高斯分布的协方差矩阵。
在公式(9)和(10)中,β用来限制w和h的最大值,以平衡分 配给不同尺寸物体的正样本数量。
最后,通过对Hm进行逐元素取最大处理来更新H中的第cm通道。
对于旋转的标注框(x,y,w,h,θ),采用旋转的二维高斯分布N(μ,∑) 来产生目标的热图,
在公式(11)中,w为旋转宽度、h表示旋转高度,θ表示旋转 角度。
训练样本编码单元42用于由标注产生的热图来对训练样本进行 编码,利用预设的α阈值来控制正样本的比例,热图中大于α阈值的 样本为正样本,若热图中小于或等于α阈值的样本为负样本。
样本的目标的中心度定义为:
在公式(12)中,l,r,t,b分别代表目标中心点到目标框左右上下 四条边的距离。
回归权重单元43,用于对编码后的训练样本应用于回归权重。
假设(i,j)在第m个标注框的子区域Am内,Wij为回归样本权重,
在公式(13)中,Gm(i,j)是高斯概率在(i,j)处的高斯概率,am是 第m个盒子的面积。
将高斯分布应用于回归权重可以充分利用大物体中包含的更多 注释信息,并保留弱小物体的注释信息;还可以强调物体中心附近的 这些样本,并减少低质量样本的影响。
由于大多数待检测小目标不是严格的四边形,所以在小目标的边 界框附近往往会有很多背景,在这些物体中,前景像素都集中在边界 框的中心。基于高斯分布的标签分配策略可以增加小目标分配的正样 本数量,并且确保至少为每个目标分配一个正样本。对于正常大小的 物体,运用的策略会选择靠近中心的高质量正样本,并减少低质量样 本的影响,同时小目标的策略通过限制物体的最大半径有效减少了不 同尺寸物体分配正样本数量的差异。
本实施例提供的基于高斯分配策略的图像小目标检测系统,将目 标标注框映射为二维热图;由标注产生的热图来对训练样本进行编码, 利用预设的α阈值来控制正样本的比例,热图中大于α阈值的样本为 正样本,热图中小于或等于α阈值的样本为负样本;对编码后的训练 样本应用于回归权重。本实施例提供的基于高斯分配策略的图像小目 标检测系统,提出的高斯分配策略可以增加小目标分配的正样本的数 量,同时平衡不同尺寸物体分配的正样本的数量;提出的高斯分配策 略可以将归一化的高斯概率作为样本权重,在计算损失的过程中对正 样本的贡献进行重新加权,平衡不同尺寸物体的影响;提供的算法可 以使小目标检测器的性能平均提高两倍,对于非常微小的目标,甚至 可以提高三倍;性能比最先进的竞争对手高出3.4%(从20.8%到 24.2%),同时实现了7倍的加速。
本实施例提供的基于高斯分配策略的图像小目标检测系统,整个 基于高斯分配策略的弱小目标检测过程分为训练和推理两个阶段。训 练流程图如图7所示,在训练阶段,执行以下操作:
1)使用预处理模块将图像切割为尺寸一致的样本图像以方便网 络进行处理,同时对图像进行水平或垂直翻转等简单的数据扩充工作, 并加载图像和相关标注。
2)使用特征提取模块接收样本图像,提取样本图像的特征,构 成多尺度特征图。由于目标尺寸较小,为了增强检测精度,增加4倍 下采样的特征图输出。
3)使用特征融合模块将特征提取模块提取的底层特征图和高层 特征图进行特征融合,生成下采样率为4倍通道数为128的融合特征 图。
4)使用检测模块接收特征融合模块生成的融合特征图,预测目 标的类别和目标预测框的坐标值和目标框的中心度。
5)采用基于高斯分类的标签分配模块,编码训练样本,获得回 归权重。具体实施步骤如下。首先将目标标注框映射到二维热图 在这里N、C、H、W、S分别表示批大小、类别数量, 高、宽和下采样率。对于一个标注框mth,(x,y,w,h)属于第m类,首先 将线性地映射到特征图的尺度上。然后,采用二维高斯分布N(m,∑)产 生目标热图
β用来限制w和h的最大值,以平衡分配给不同尺寸物体的正样 本数量。最后,通过对Hm进行逐元素取最大处理来更新H中的第cm通 道。
其次是编码训练样本。由标注产生的热图被用来对训练样本进行 编码。使用α来控制正样本的比例,所有热图中所有大于α阈值的 样本为正样本,其他位置的样本位负样本。目标的中心度定义为:
在公式(14)中,l,r,t,b分别代表目标中心点到目标框左右上下 四条边的距离。
最后获得回归权重。假设(i,j)在第m个标注框的子区域Am内,Wij为回归样本权重。
将高斯分布应用于回归权重可以充分利用大物体中包含的更多 注释信息,并保留弱小物体的注释信息。还可以强调物体中心附近的 这些样本,并减少低质量样本的影响。
6)计算上述正负样本的损失,并进行梯度回传,更新网络参数, 并不断迭代训练网络直至网络收敛。损失函数由以下几个部分构成。
L=Lc+λoWLreg+λ1Lcen (15)
在公式(15)中,Lc为分类损失,在这里采用Focalloss。λo、λ1为损失系数,用来调节不同损失的贡献,在这里取λo=2.0,λ1=1.0。 Lreg为回归损失,采用IoUloss;W即为Wij;Lcen为中心度损失,采用 L1损失。
推理阶段流程图如图8所示,在推理阶段,执行以下操作:
1)导入训练好的模型,初始化网络参数。
2)使用预处理模块对图像进行预处理并加载图像。
3)使用特征融合模块接收样本图像,提取样本图像的特征,构 成多尺度特征图。
4)使用特征融合模块将特征融合模块提取的底层特征图和高层 特征图进行特征融合,生成下采样率为4倍通道数为128的融合特征 图。
5)使用检测模块接收特征融合模块生成的融合特征图,预测目 标的类别和目标预测框的坐标值和目标框的中心度。
6)使用后处理模块主要对检测结果进行非极大值抑制等后处理。 将中心度和类别置信度相乘作为目标分类置信度进行非极大值抑制, 以去除低质量的预测框。
本实施例使用特征融合模块将低分辨率高语义特征融合到高分 辨率低语义的特征图上。
本实施例提出的高斯标签分配策略,增加小目标分配的正样本的 数量,同时平衡不同尺寸物体分配的正样本的数量。
本实施例将归一化的高斯概率作为样本权重,在计算损失的过程 中对正样本的贡献进行重新加权,平衡不同尺寸物体的影响,并且使 得靠近边界框中心的位置具有更高的权重。
下面以具体的实例来进行说明:
本次实验是在遥感图像小目标检测数据集AI-TOD(微小物体检 测数据集)上进行的,这是一个为航空图像中的微小目标检测而设计 的具有挑战性的数据集。包括8个对象类别,包含700621个对象实 例,分布在28036幅800×800像素的航拍图像中。AI-TOD中目标大 小的平均值和标准差仅为12.8像素和5.9像素,远远小于一般检测数 据集。
在训练期间,使用随机梯度下降(Stochastic Gradient Descent,SGD) 优化器进行了24个轮训练,动量为0.9,权重衰减为0.0001,批次大 小为6。设置了初始学习速率为0.01,并在第16和22轮衰减。在测 试期间,使用预设的0.05分来筛选出背景边框,并以0.65的IOU (Intersection Over Union,目标预测边界框和真实边界框的交集和并 集的比值)阈值来应用NMS(Non-Maximum Suppression,非极大值 抑制)。所有图像都转到800×800进行训练和测试。除了在所有实验 中的简单水平翻转没有使用任何其他数据增强方式。此外,为了加快 训练速度,采用了浮点16(FP16)算法。推理速度是在1个带有 GTX2080TiGPU(图形处理器)的服务器上测试的。
实例1正样本阈值α对性能的影响。
该参数被用来从候选者中选择正样本。进行了几个实验来研究超 参数的影响,在此次对比实验中将超参数最大尺寸β设为无穷大。
表1为不同的阈值α对性能的影响。当α=1.0时,的分配策略 与CenterNet是一样的,只有中心点为正样本,其他的都为负样本。 当α减小,每个目标分配的正样本数量的均值和方差均逐渐增大, 相应的性能也呈现上升后下降的趋势,因为正样本越多,监督信号越 多,但正样本数量不平衡会导致小目标被大目标淹没。当α=0.1时, 获得了最佳性能20.6%AP。
表1超参数α对性能的影响
实例2最大尺寸β对性能的影响。
超参数β用于平衡分配给大目标和小目标的正样本数量。表2为 不同的超参数β对性能的影响,使用不同的β进行了几个实验。在此 次实验中,将超参数α设置为0.1。β的增加将导致分配给大目标的 正样本的增加,但对小对象的影响不大。当β=7时,所有对象仅指定一个正样本。当β增加时,正样本的均值和方差缓慢增加,其性能 也相应提高。当β=16(略大于目标的平均大小)时,正采样的最大数量 限制为9,正采样的标准差减少到1.7。获得了最佳性能21.7%AP。
表2超参数β对性能的影响
实例3回归重新加权对性能的影响。
根据高斯分布对每个正值样本赋予不同的权值,可以突出目标中 心附近的正值样本,减少模糊和低质量样本的影响。还可以充分利用 大对象中包含的更多注释信息,并保留小对象的注释信息。与之相反 的另一种方法是按注释框进行归一化。表3为回归重新加权对性能的 影响。回归加权后,TTFNet和ATSS-S的性能分别提高了1.1%和0.4%。
表3回归重新加权对性能的影响
总之,本实施例提供的基于高斯分配策略的图像小目标检测方法 及系统,所取得的有益效果为:
本实施例提出的高斯分配策略可以增加小目标分配的正样本的 数量,同时平衡不同尺寸物体分配的正样本的数量。
本实施例提出的高斯分配策略可以将归一化的高斯概率作为样 本权重,在计算损失的过程中对正样本的贡献进行重新加权,平衡不 同尺寸物体的影响。
本实施例的算法可以使小目标检测器的性能平均提高两倍,对于 非常微小的目标,甚至可以提高三倍。本发明的性能比最先进的竞争 对手高出3.4%(从20.8%到24.2%),同时实现了7倍的加速。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦 得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。 所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围 的所有变更和修改。显然,本领域的技术人员可以对本发明进行各种 改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些 修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明 也意图包含这些改动和变型在内。
Claims (10)
1.一种基于高斯分配策略的图像小目标检测方法,其特征在于,包括以下步骤:
加载图像和提取图像的相应特征,构成多尺度特征图集合;
将提取的底层特征图和高层特征图进行特征融合,生成融合特征图;
根据生成的所述融合特征图进行检测输出,预测目标的类别、目标预测框的坐标值和目标框的中心度;
使用高斯分配策略分配图像正负样本;
结合分配的正负样本和网络输出的目标类别、预测框坐标和中心度计算网络损失;
根据计算出的网络损失来更新网络参数,重复以上训练步骤,不断更新网络参数直到网络收敛;
利用训练好的网络,预测输入图像中目标的类别、目标预测框的坐标值和目标框的中心度;
对检测结果进行非极大值抑制处理,去除重复预测的目标类别和预测框坐标值,获得最终检测结果。
对于一个标注框mth,(x,y,w,h)属于第m类,将线性地映射到特征图的尺度上;
二维高斯分布的概率密度函数由以下公式给出:
其中,x表示高斯分布的坐标(x,y)、μ表示高斯分布的平均矢量、∑表示高斯分布的协方差矩阵;
其中,β用来限制w和h的最大值,以平衡分配给不同尺寸物体的正样本数量;
通过对Hm进行逐元素取最大处理来更新H中的第cm通道;
对于旋转的标注框(x,y,w,h,θ),采用旋转的二维高斯分布N(μ,∑)来产生目标的热图,
其中,w为旋转宽度、h表示旋转高度,θ表示旋转角度。
6.一种基于高斯分配策略的图像小目标检测系统,其特征在于,包括:
特征提取模块(10),用于加载和提取图像的相应特征,构成多尺度特征图集合;
特征融合模块(20),用于将提取的底层特征图和高层特征图进行特征融合,生成融合特征图;
检测模块(30),用于根据生成的所述融合特征图进行检测输出,预测目标的类别、目标预测框的坐标值和目标框的中心度;
分配模块(40),用于使用高斯分配策略分配图像正负样本;
计算模块(50),用于结合分配的正负样本和网络输出的目标类别、预测框坐标和中心度计算网络损失;
更新模块(60),用于根据计算出的网络损失来更新网络参数,重复以上训练步骤,不断更新网络参数直到网络收敛;
预测模块(70),用于利用训练好的网络,预测输入图像中目标的类别、目标预测框的坐标值和目标框的中心度;
后处理模块(80),用于对检测结果进行非极大值抑制处理,去除重复预测的目标类别和预测框坐标值,获得最终检测结果。
8.如权利要求7所述的基于高斯分配策略的图像小目标检测系统,其特征在于,所述热图映射单元(11)中,对于一个标注框mth,(x,y,w,h)属于第m类,将线性地映射到特征图的尺度上;
二维高斯分布的概率密度函数由以下公式给出:
其中,x表示高斯分布的坐标(x,y)、μ表示高斯分布的平均矢量、∑表示高斯分布的协方差矩阵;
其中,β用来限制w和h的最大值,以平衡分配给不同尺寸物体的正样本数量;
通过对Hm进行逐元素取最大处理来更新H中的第cm通道;
对于旋转的标注框(x,y,w,h,θ),采用旋转的二维高斯分布N(μ,∑)来产生目标的热图,
其中,w为旋转宽度、h表示旋转高度,θ表示旋转角度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210559371.8A CN114782709A (zh) | 2022-05-20 | 2022-05-20 | 一种基于高斯分配策略的图像小目标检测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210559371.8A CN114782709A (zh) | 2022-05-20 | 2022-05-20 | 一种基于高斯分配策略的图像小目标检测方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114782709A true CN114782709A (zh) | 2022-07-22 |
Family
ID=82408702
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210559371.8A Pending CN114782709A (zh) | 2022-05-20 | 2022-05-20 | 一种基于高斯分配策略的图像小目标检测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114782709A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116228715A (zh) * | 2023-02-28 | 2023-06-06 | 抖音视界有限公司 | 息肉检测模型的训练方法、息肉检测方法及相关装置 |
CN117173423A (zh) * | 2023-08-09 | 2023-12-05 | 山东财经大学 | 图像小目标检测方法、系统、设备及介质 |
-
2022
- 2022-05-20 CN CN202210559371.8A patent/CN114782709A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116228715A (zh) * | 2023-02-28 | 2023-06-06 | 抖音视界有限公司 | 息肉检测模型的训练方法、息肉检测方法及相关装置 |
CN116228715B (zh) * | 2023-02-28 | 2023-09-22 | 抖音视界有限公司 | 息肉检测模型的训练方法、息肉检测方法及相关装置 |
CN117173423A (zh) * | 2023-08-09 | 2023-12-05 | 山东财经大学 | 图像小目标检测方法、系统、设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108647585B (zh) | 一种基于多尺度循环注意力网络的交通标识符检测方法 | |
CN109685152B (zh) | 一种基于dc-spp-yolo的图像目标检测方法 | |
CN111563473B (zh) | 基于密集特征融合和像素级注意力的遥感舰船识别方法 | |
CN111626128B (zh) | 一种基于改进YOLOv3的果园环境下行人检测方法 | |
US7844108B2 (en) | Information processing apparatus and method, recording medium and program | |
CN111626176B (zh) | 一种基于动态注意力机制的遥感目标快速检测方法及系统 | |
CN111126472A (zh) | 一种基于ssd改进的目标检测方法 | |
CN113052834B (zh) | 一种基于卷积神经网络多尺度特征的管道缺陷检测方法 | |
CN111461213B (zh) | 一种目标检测模型的训练方法、目标快速检测方法 | |
CN111079739B (zh) | 一种多尺度注意力特征检测方法 | |
CN114782709A (zh) | 一种基于高斯分配策略的图像小目标检测方法及系统 | |
CN114758288B (zh) | 一种配电网工程安全管控检测方法及装置 | |
CN112464911A (zh) | 基于改进YOLOv3-tiny的交通标志检测与识别方法 | |
CN111126278B (zh) | 针对少类别场景的目标检测模型优化与加速的方法 | |
CN113221787A (zh) | 基于多元差异性融合的行人多目标跟踪方法 | |
CN111310622A (zh) | 一种面向水下机器人智能作业的鱼群目标识别方法 | |
US11244188B2 (en) | Dense and discriminative neural network architectures for improved object detection and instance segmentation | |
CN112800955A (zh) | 基于加权双向特征金字塔的遥感影像旋转目标检测方法及系统 | |
CN111368634B (zh) | 基于神经网络的人头检测方法、系统及存储介质 | |
CN112434618A (zh) | 基于稀疏前景先验的视频目标检测方法、存储介质及设备 | |
CN112016569A (zh) | 基于注意力机制的目标检测方法、网络、设备和存储介质 | |
CN113159215A (zh) | 一种基于Faster Rcnn的小目标检测识别方法 | |
CN115620180A (zh) | 一种基于改进YOLOv5的航拍图像目标检测方法 | |
CN112561801A (zh) | 基于se-fpn的目标检测模型训练方法、目标检测方法及装置 | |
CN111738114A (zh) | 基于无锚点精确采样遥感图像车辆目标检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |