CN112488999B - 一种图像中小目标检测方法、系统、存储介质及终端 - Google Patents

一种图像中小目标检测方法、系统、存储介质及终端 Download PDF

Info

Publication number
CN112488999B
CN112488999B CN202011307843.8A CN202011307843A CN112488999B CN 112488999 B CN112488999 B CN 112488999B CN 202011307843 A CN202011307843 A CN 202011307843A CN 112488999 B CN112488999 B CN 112488999B
Authority
CN
China
Prior art keywords
small target
feature
target detection
module
attention
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011307843.8A
Other languages
English (en)
Other versions
CN112488999A (zh
Inventor
赵磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Terminus Technology Group Co Ltd
Original Assignee
Terminus Technology Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Terminus Technology Group Co Ltd filed Critical Terminus Technology Group Co Ltd
Priority to CN202011307843.8A priority Critical patent/CN112488999B/zh
Publication of CN112488999A publication Critical patent/CN112488999A/zh
Application granted granted Critical
Publication of CN112488999B publication Critical patent/CN112488999B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20212Image combination
    • G06T2207/20221Image fusion; Image merging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Abstract

本发明公开了一种图像中小目标检测方法、系统、存储介质及终端,该方法包括:当从待检测的图像中检测小目标时,加载预先训练的小目标检测模型;剔除小目标检测模型中反转注意力模块生成剔除后的小目标检测模型;其中,小目标检测模型是基于Faster RCNN检测网络、SSD检测器以及反转注意力模块创建的,所述反转注意力模块用于实现模型训练时将不同维度下生成的特征图进行融合;将待检测的目标图像输入剔除后的小目标检测模型中提取至少一个小目标特征;对至少一个小目标特征进行分类和边框回归处理后,生成处理后的小目标检测框。因此,采用本申请实施例,可以降低图像中的小目标、小人脸的检测难度,提升图像中小目标检测精度。

Description

一种图像中小目标检测方法、系统、存储介质及终端
技术领域
本发明涉及计算机的深度学习技术领域,特别涉及一种图像中小目标检测方法、系统、存储介质及终端。
背景技术
基于深度学习的目标检测任务中,特别是实际场景中广泛应用的人脸检测任务中,对于小目标、小人脸的检测难度很大,面临许多技术挑战,这是因为图片分辨率比较低,图片模糊,背景噪音多。
现有的小目标检测方法主要包括传统的图像金字塔和多尺度滑动窗口检测小目标。还包括基于数据扩增方法,通过增加小目标样本数量和种类来提升小目标检测性能;基于特征融合的方法,将高层、低层的多尺度特征融合来提升检测性能;基于锚采样和匹配策略的方法;利用上下文信息的方法等。现有技术中在进行模型训练时所用的目标检测训练集缺乏像素级别的标注,而仅对目标的位置坐标与类别作了标注,这就会导致目标检测网络训练时不能充分挖掘目标上下文信息,而深度网络模型从低分辨率的小目标上提取的特征比较粗糙,尺寸较小的目标相比较于预设大小的目标候选框,其特征信息所占比例比较小从而提升了图像中的小目标的检测难度,降低了图像中小目标检测精度。
发明内容
本申请实施例提供了一种图像中小目标检测方法、系统、存储介质及终端。为了对披露的实施例的一些方面有一个基本的理解,下面给出了简单的概括。该概括部分不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围。其唯一目的是用简单的形式呈现一些概念,以此作为后面的详细说明的序言。
第一方面,本申请实施例提供了一种图像中小目标检测方法,方法包括:
当从待检测的图像中检测小目标时,加载预先训练的小目标检测模型;
剔除所述小目标检测模型中的反转注意力模块后,生成剔除后的小目标检测模型;其中,所述小目标检测模型是基于Faster RCNN检测网络、SSD检测器以及反转注意力模块创建的,所述反转注意力模块用于实现模型训练时将不同维度下生成的特征图进行融合;
将所述待检测的目标图像输入所述剔除后的小目标检测模型中,提取至少一个小目标特征;
对所述至少一个小目标特征进行分类和边框回归处理后,生成处理后的小目标。
可选的,所述生成处理后的小目标检测框之后,还包括:
输出所述处理后的小目标,并将所述小目标进行展示。
可选的,还包括按照下述方法生成所述预先训练的小目标检测模型,包括:
设计小目标检测模型;
从图像数据库采集多个训练数据样本;
将所述多个训练数据样本输入所述创建的小目标检测模型进行训练,输出所述小目标检测模型的损失值;
当所述损失值到达预设最小阈值时,模型训练结束并生成预先训练的小目标检测模型。
可选的,所述方法还包括:
当所述损失值未到达预设最小阈值时,优化所述创建的小目标检测模型的模型参数;以及
继续执行所述将所述多个训练数据样本输入所述创建的小目标检测模型进行训练的步骤。
可选的,所述设计小目标检测模型,包括:
利用Faster RCNN检测网络和SSD检测器构建成多个检测网络;
采用注意力神经网络以及网络权重更新算法创建反转注意力模块;
将所述反转注意力模块添加到所述多个检测网络中,生成小目标检测模型。
可选的,所述小目标检测模型包括目标特征提取模块、候选区域生成模块、目标区域池化模块、候选目标检测模块、反转注意力模块以及更新特征图模块;
所述将所述多个训练数据样本输入所述创建的小目标检测模型进行训练,输出所述小目标检测模型的损失值,包括:
目标特征提取模块通过VGG和/或RESNET等卷积神经网络提取所述多个训练样本中每张图片的多个特征图;
候选区域生成模块通过候选区域生成网络从所述多个特征图中计算出所述多个特征图对应的小目标区域候选框;
目标区域池化模块将所述多个特征图对应的小目标区域候选框中感兴趣的目标区域进行池化操作,生成池化后的多个小目标区域候选框对应的特征图;
候选目标检测模块将所述多个训练样本中每张图片上的目标候选框对应的RoI特征进行分类并在原图上对边框进行回归操作,生成池化后的多个小目标区域候选框对应的分类损失和回归损失;
反转注意力模块基于多个小目标区域候选框对应的分类损失计算所述池化后的多个小目标区域候选框对应的特征图的特征图梯度,并基于所述多个小目标区域候选框对应的特征图的特征图梯度生成注意力反转增强模板图;
更新特征图模块将所述注意力反转增强模板图与所述池化后的多个小目标区域候选框对应的特征图进行逐元素乘积,生成融合后的特征图,根据所述融合后的特征图进行前向传播以计算检测损失,并输出所述小目标检测模型的损失值。
可选的,所述基于所述多个小目标区域候选框对应的特征图的特征图梯度生成注意力反转增强模板图,包括:
对所述特征图梯度进行全局平均池化得到第一权重向量;
对所述池化后的多个小目标区域候选框对应的特征图进行全局平均池化得到第二权重向量;
将所述第一权重向量和所述第二权重向量逐元素相乘得到目标注意力权重向量;
将所述目标注意力权重向量和所述池化后的多个小目标区域候选框对应的特征图逐通道相乘并求和得到注意力反转增强图;
将所述注意力反转增强图阈值化并求反得到注意力反转增强后的模板图(M);
将所述目标注意力权重向量经过归一化操作后得到向量(VB),并对所述向量(VB)阈值化并求反生成注意力反转增强后的模板图(VM);
根据所述注意力反转增强后的模板图(VM)元素取值,当所述(VM)中某个元素为0时,将所述模板图(M)作为注意力反转增强模板图;以及当(VM)为1,将所述池化后的多个小目标区域候选框对应的特征图作为注意力反转增强模板图。
第二方面,本申请实施例提供了一种图像中小目标检测系统,该系统包括:
模型加载模块,用于当从待检测的图像中检测小目标时,加载预先训练的小目标检测模型;
反转注意力模块剔除模块,用于剔除小目标检测模型中反转注意力模块生成剔除后的小目标检测模型;其中,小目标检测模型是基于Faster RCNN神经网络、SSD检测器以及反转注意力模块创建的,所述反转注意力模块用于实现模型训练时将不同维度下生成的特征图进行融合;
小目标特征提取模块,用于将待检测的目标图像输入剔除后的小目标检测模型中提取至少一个小目标特征;
小目标特征处理模块,用于对至少一个小目标特征进行分类和边框回归处理后,生成处理后的小目标。
第三方面,本申请实施例提供一种计算机存储介质,计算机存储介质存储有多条指令,指令适于由处理器加载并执行上述的方法步骤。
第四方面,本申请实施例提供一种终端,可包括:处理器和存储器;其中,存储器存储有计算机程序,计算机程序适于由处理器加载并执行上述的方法步骤。
本申请实施例提供的技术方案可以包括以下有益效果:
在本申请实施例中,图像中小目标检测系统当从待检测的图像中检测小目标时,首先加载预先训练的小目标检测模型,然后剔除小目标检测模型中反转注意力模块生成剔除后的小目标检测模型,再将待检测的目标图像输入剔除后的小目标检测模型中提取至少一个小目标特征,最后对至少一个小目标特征进行分类和边框回归处理后,生成处理后的小目标检测框。因此,采用本申请实施例,由于将基于梯度引导生成的注意力图和通道维注意力图进行融合,其中通道维注意力权重因子表达了不同特征通道间的重要程度,梯度引导生成的注意力权重因子表示特征图中该元素受关注的重视程度,融合后得到的注意力权重因子可以更加全面完整地表达小目标特征信息,提取特征更加多样、更加全面。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是本申请实施例提供的一种图像中小目标检测方法的流程示意图;
图2是本申请实施例提供的一种图像中小目标检测过程使用小样本分类网络处理的总体流程图;
图3是本申请实施例提供的一种反转注意力模块(注意力反转增强模块)的结构图;
图4是本申请实施例提供的一种图像中小目标检测模型的模型训练方法的流程示意图;
图5是本申请实施例提供的一种特征图池化系统的系统结构示意图;
图6是本申请实施例提供的一种终端示意图。
具体实施方式
以下描述和附图充分地示出本发明的具体实施方案,以使本领域的技术人员能够实践它们。
应当明确,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是如所附权利要求书中所详述的、本发明的一些方面相一致的系统和方法的例子。
在本发明的描述中,需要理解的是,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。此外,在本发明的描述中,除非另有说明,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
到目前为止,现有的小目标检测方法主要包括传统的图像金字塔和多尺度滑动窗口检测小目标。还包括基于数据扩增方法,通过增加小目标样本数量和种类来提升小目标检测性能;基于特征融合的方法,将高层、低层的多尺度特征融合来提升检测性能;基于锚采样和匹配策略的方法;利用上下文信息的方法等。现有技术中在进行模型训练时所用的目标检测训练集缺乏像素级别的标注,而仅对目标的位置坐标与类别作了标注,这就会导致目标检测网络训练时不能充分挖掘目标上下文信息,而深度网络模型从低分辨率的小目标上提取的特征比较粗糙,尺寸较小的目标相比较于预设大小的目标候选框,其特征信息所占比例比较小从而提升了图像中的小目标的检测难度,降低了图像中小目标检测精度。为此,本申请提供了一种图像中小目标检测方法、系统、存储介质及终端,以解决上述相关技术问题中存在的问题。本申请提供的技术方案中,由于将基于梯度引导生成的注意力图和通道维注意力图进行融合,其中通道维注意力权重因子表达了不同特征通道间的重要程度,梯度引导生成的注意力权重因子表示特征图中该元素受关注的重视程度,融合后得到的注意力权重因子可以更加全面完整地表达小目标特征信息,提取特征更加多样、更加全面,下面采用示例性的实施例进行详细说明。
下面将结合附图1-附图4,对本申请实施例提供的图像中小目标检测方法进行详细介绍。该方法可依赖于计算机程序实现,可运行于基于冯诺依曼体系的图像中小目标检测系统上。该计算机程序可集成在应用中,也可作为独立的工具类应用运行。
请参见图1,为本申请实施例提供了一种图像中小目标检测方法的流程示意图。如图1所示,本申请实施例的方法可以包括以下步骤:
S101,当从待检测的图像中检测小目标时,加载预先训练的小目标检测模型;
其中,待检测的目标图像为通过图像采集设备(例如摄像头等)获取到的图像帧,该图像帧内包括多个小目标,该小目标例如多个人脸或多个其他小物体。
通常,预先训练的小目标检测模型俗称方向注意力网络(IAN),方向注意力网络(IAN)在初步创建时是将反转注意力模块添加到基于Faster RCNN检测网络和SSD检测器构建成多个检测网络内所得到,该方向注意力网络(IAN)通过抑制感兴趣区域的权重,让网络学习到更多的、更全面的目标特征,并在感兴趣目标的特征图上进行分类和边框回归操作,改善目标检测器的抗遮挡、模糊和噪声能力。Faster RCNN检测网络是基于卷积神经网络的目标检测算法。
在一种可能的实现方式中,图像中小目标检测装置在检测图像帧中的小目标时,首先通过摄像头采集设备获取到目标图像,摄像头在采集到目标图像后,将目标图像通过有线或者无线的方式发送至小目标检测装置,小目标检测装置在监测到待检测的目标图像时,通过模型加载算法加载预先保存在终端内存地址中的预先训练的小目标检测模型。
具体的,模型加载算法为集成后的二分搜索算法,首先在终端内存地址中有序的数值序列中,从中间开始查找,如果查找元素小于中间元素,则在中间元素的左边区间再进行折半查找,如果查找元素大于中间元素,则在中间元素的右边区间再进行折半查找,直到取得的中间值等于查找的值或者查找的值不存在时,确定该模型保存在内存地址中,并将模型进行响应。
进一步地,预先训练的小目标检测模型在进行训练时,首先设计小目标检测模型,在从图像数据库采集多个训练数据样本,然后将多个训练数据样本输入创建的小目标检测模型进行训练,输出小目标检测模型的损失值,最后当损失值到达预设最小阈值时,模型训练结束并生成预先训练的小目标检测模型。
进一步地,当损失值未到达预设最小阈值时,优化创建的小目标检测模型的模型参数,以及继续将多个训练数据样本重新输入创建的小目标检测模型进行训练。
具体的,设计小目标检测模型时,首先利用Faster RCNN检测网络和SSD检测器构建成多个检测网络,然后采用注意力神经网络以及网络权重更新算法创建反转注意力模块,最后将反转注意力模块添加到多个检测网络中,生成小目标检测模型。
其中,小目标检测模型包括目标特征提取模块、候选区域生成模块、目标区域池化模块、候选目标检测模块、反转注意力模块以及更新特征图模块。
具体的,例如图2所示,在将多个训练数据样本输入创建的小目标检测模型进行训练时,目标特征提取模块通过VGG和/或RESNET卷积神经网络提取多个训练样本中每张图片的多个特征图,候选区域生成模块通过候选区域生成网络从多个特征图中计算出多个特征图对应的小目标区域候选框,目标区域池化模块将多个特征图对应的小目标区域候选框中感兴趣的目标区域进行池化操作,生成池化后的多个小目标区域候选框对应的特征图,候选目标检测模块将多个训练样本中每张图片上的目标候选框对应的RoI特征进行分类并在原图上对边框进行回归操作,生成池化后的多个小目标区域候选框对应的分类损失和回归损失,反转注意力模块基于多个小目标区域候选框对应的分类损失计算池化后的多个小目标区域候选框对应的特征图的特征图梯度,并基于多个小目标区域候选框对应的特征图的特征图梯度生成注意力反转增强模板图,更新特征图模块将注意力反转增强模板图与池化后的多个小目标区域候选框对应的特征图进行逐元素乘积,生成融合后的特征图,根据融合后的特征图进行前向传播以计算检测损失,并输出小目标检测模型的损失值。
具体的,例如图3所示,反转注意力模块基于多个小目标区域候选框对应的特征图的特征图梯度生成注意力反转增强模板图时,首先对特征图梯度进行全局平均池化得到第一权重向量,再对池化后的多个小目标区域候选框对应的特征图进行全局平均池化得到第二权重向量,再将第一权重向量和第二权重向量逐元素相乘得到目标注意力权重向量,然后将目标注意力权重向量和池化后的多个小目标区域候选框对应的特征图逐通道相乘并求和得到注意力反转增强图,再将注意力反转增强图阈值化并求反得到注意力反转增强后的模板图M,然后将目标注意力权重向量经过归一化操作后得到向量VB,并对向量VB阈值化并求反生成注意力反转增强后的模板图VM,最后根据注意力反转增强后的模板图VM元素取值,当VM中某个元素为0时,将模板图M作为注意力反转增强模板图;以及当VM为1,将池化后的多个小目标区域候选框对应的特征图作为注意力反转增强模板图。
S102,剔除所述小目标检测模型中的反转注意力模块后,生成剔除后的小目标检测模型;其中,所述小目标检测模型是基于Faster RCNN检测网络、SSD检测器以及反转注意力模块创建的,所述反转注意力模块用于实现模型训练时将不同维度下生成的特征图进行融合;
其中,反转注意力模块是采用注意力神经网络以及网络权重更新算法创建,目的是实现模型训练时将注意力转移到采用Faster RCNN检测网络处理训练样本后生成的特征图上。
通常,反转注意力模块仅在训练中更改网络权重,而在图像中小目标检测时需要将该模型进行剔除,剔除后即可对图像帧中的小目标进行检测。
在一种可能的实现方式中,根据步骤S101加载到预先训练完的小目标检测网络后,从预先训练完的小目标检测网络查找并定位出反转注意力模块,然后从反转注意力模块的位置出进行分割,将反转注意力模块进行剥离,最后得到剔除后的小目标检测模型。
S103,将所述待检测的目标图像输入所述剔除后的小目标检测模型中,提取至少一个小目标特征;
在一种可能的实现方式中,在基于步骤S102得到剔除反转注意力模块后的小目标检测模型时,该模型具备图像帧中的小目标检测能力,给定待检测的目标图像后,首先经过目标检测框架的主干网络(VGG或ResNet)提取图像特征,然后通过区域候选网络(RPN)从这些特征图生成的或预先计算的区域候选框,再使用感兴趣目标池化(RoI Pooling)为每个候选目标生成固定大小的特征图,RoI Pooling后的这些特征图最后经过全连接层来分类和边界框回归处理,最后生成处理后的小目标。
S104,对所述至少一个小目标特征进行分类和边框回归处理后,生成处理后的小目标。
通常,在生成处理后的小目标时,输出处理后的小目标,并将小目标进行展示到显示屏。
在本申请实施例中,图像中小目标检测系统当从待检测的图像中检测小目标时,首先加载预先训练的小目标检测模型,然后剔除小目标检测模型中反转注意力模块生成剔除后的小目标检测模型,再将待检测的目标图像输入剔除后的小目标检测模型中提取至少一个小目标特征,最后对至少一个小目标特征进行分类和边框回归处理后,生成处理后的小目标检测框。因此,采用本申请实施例,由于将基于梯度引导生成的注意力图和通道维注意力图进行融合,其中通道维注意力权重因子表达了不同特征通道间的重要程度,梯度引导生成的注意力权重因子表示特征图中该元素受关注的重视程度,融合后得到的注意力权重因子可以更加全面完整地表达小目标特征信息,提取特征更加多样、更加全面。
请参见图4,为本申请实施例提供的一种图像中小目标检测模型的模型训练方法的流程示意图。该图像中小目标检测模型的模型训练方法可以包括以下步骤:
S201,利用Faster RCNN检测网络和SSD检测器构建成多个检测网络;
S202,采用注意力神经网络以及网络权重更新算法创建反转注意力模块;
S203,将反转注意力模块添加到多个检测网络中,生成小目标检测模型;
S204,从图像数据库采集多个训练数据样本;
S205,目标特征提取模块通过VGG和/或RESNET等CNN网络提取多个训练样本中每张图片的多个特征图;
在一种可能的实现方式中,目标特征提取模块通过目标检测框架的CNN网络(VGG或ResNet)提取出每张图片的一系列特征图,其中每个层的特征图包含多个通道,每个通道对应一个特征图。
S206,候选区域生成模块通过候选区域生成网络从多个特征图中计算出多个特征图对应的小目标区域候选框;
在一种可能的实现方式中,区域候选生成模块通过候选区域生成网络(RPN)从这些特征图生成或计算区域候选框。
S207,目标区域池化模块将多个特征图对应的小目标区域候选框中感兴趣的目标区域进行池化操作,生成池化后的多个小目标区域候选框对应的特征图;
在一种可能的实现方式中,目标区域池化模块对感兴趣目标区域进行池化(RoIPooling)操作后为每个候选目标生成固定大小的特征图。
S208,候选目标检测模块将多个训练样本中每张图片上的目标候选框对应的RoI特征进行分类并在原图上对边框进行回归操作,生成池化后的多个小目标区域候选框对应的分类损失和回归损失;
在一种可能的实现方式中,候选目标检测模块将每个候选目标对应的RoIPooling后的特征经过后续的全连接层对应的两个并行分支分别进行softmax分类和边框回归,并分别计算相应的分类损失和回归损失。
S209,反转注意力模块基于多个小目标区域候选框对应的分类损失计算池化后的多个小目标区域候选框对应的特征图的特征图梯度,并基于多个小目标区域候选框对应的特征图的特征图梯度生成注意力反转增强模板图;
在一种可能的实现方式中,反转注意力模块由反向传播得到的目标类别的分类损失来计算目标特征图梯度G,对特征图梯度G进行全局平均池化(GAP)得到权重向量VG,同时对特征图F也进行GAP操作得到权重向量VF,将两者逐元素相乘得到注意力权重向量VA。将VA与特征图F逐通道相乘并求和得到注意力反转增强图C。对图C阈值化并求反,得到注意力反转增强后的模板图M,同时对VA经过softmax归一化操作得到向量VB,对其再阈值化并求反,得到向量模板VM。根据VM的0,1取值,当VM中某个元素为0时,注意力反转增强模板图H对应通道值取为M;当VM为1,注意力反转增强模板图H对应通道值取为F相应通道的特征图,例如图3所示。
S210,更新特征图模块将注意力反转增强模板图与池化后的多个小目标区域候选框对应的特征图进行逐元素乘积,生成融合后的特征图,根据融合后的特征图进行前向传播以计算检测损失,并输出小目标检测模型的损失值;
在一种可能的实现方式中,将反转增强模板图H与特征图F逐元素乘积用于特征细化,将细化后更新的特征图进行前向传播以计算检测损失值。
S211,当损失值到达预设最小阈值时,模型训练结束并生成预先训练的小目标检测模型。
在一种可能的实现方式中,当损失值未到达预设最小阈值时,检测网络经过反向传播更新原始检测网络参数,经过若干步训练达到性能要求后,直到损失值到达预设最小阈值时检测网络训练停止。
需要说明的是,在每次训练迭代中,IAN使用目标分类得分,计算主干网络生成的特征图的梯度,并迭代地反转网络的注意力。与仅关注目标的一小部分的原始检测器不同,带有IA模块的检测网络将更多注意力放在原始检测网络的互补空间部分、特征通道、甚至上下文上。这种IA模块沿着特征图的空间维和通道维进行操作,不需要对难分样本进行额外的训练,不用估计IA模块所需的额外网络参数,也没有测试开销。IA模块仅在训练中更改网络权重,而在测试中不更改任何权重。
在本申请实施例中,图像中小目标检测系统当从待检测的图像中检测小目标时,首先加载预先训练的小目标检测模型,然后剔除小目标检测模型中反转注意力模块生成剔除后的小目标检测模型,再将待检测的目标图像输入剔除后的小目标检测模型中提取至少一个小目标特征,最后对至少一个小目标特征进行分类和边框回归处理后,生成处理后的小目标检测框。因此,采用本申请实施例,由于将基于梯度引导生成的注意力图和通道维注意力图进行融合,其中通道维注意力权重因子表达了不同特征通道间的重要程度,梯度引导生成的注意力权重因子表示特征图中该元素受关注的重视程度,融合后得到的注意力权重因子可以更加全面完整地表达小目标特征信息,提取特征更加多样、更加全面。
下述为本发明系统实施例,可以用于执行本发明方法实施例。对于本发明系统实施例中未披露的细节,请参照本发明方法实施例。
请参见图5,其示出了本发明一个示例性实施例提供的图像中小目标检测系统的结构示意图。该图像中小目标检测系统可以通过软件、硬件或者两者的结合实现成为智能机器人的全部或一部分。该系统1包括模型加载模块10、反转注意力模块剔除模块20、小目标特征提取模块30、小目标特征处理模块40。
模型加载模块10,用于当监测到待检测的目标图像时,加载预先训练的小目标检测模型;
反转注意力模块剔除模块20,用于剔除所述小目标检测模型中的反转注意力模块后,生成剔除后的小目标检测模型;其中,所述小目标检测模型是基于Faster RCNN检测网络、SSD检测器以及反转注意力模块创建的,所述反转注意力模块用于实现模型训练时将不同维度下生成的特征图进行融合;
小目标特征提取模块30,用于将所述待检测的目标图像输入所述剔除后的小目标检测模型中,提取至少一个小目标特征;
小目标特征处理模块40,用于对所述至少一个小目标特征进行分类和边框回归处理后,生成处理后的小目标。
需要说明的是,上述实施例提供的图像中小目标检测系统在执行图像中小目标检测方法时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的图像中小目标检测系统与图像中小目标检测方法实施例属于同一构思,其体现实现过程详见方法实施例,这里不再赘述。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
在本申请实施例中,图像中小目标检测系统当从待检测的图像中检测小目标时,首先加载预先训练的小目标检测模型,然后剔除小目标检测模型中反转注意力模块生成剔除后的小目标检测模型,再将待检测的目标图像输入剔除后的小目标检测模型中提取至少一个小目标特征,最后对至少一个小目标特征进行分类和边框回归处理后,生成处理后的小目标检测框。因此,采用本申请实施例,由于将基于梯度引导生成的注意力图和通道维注意力图进行融合,其中通道维注意力权重因子表达了不同特征通道间的重要程度,梯度引导生成的注意力权重因子表示特征图中该元素受关注的重视程度,融合后得到的注意力权重因子可以更加全面完整地表达小目标特征信息,提取特征更加多样、更加全面。
本发明还提供一种计算机可读介质,其上存储有程序指令,该程序指令被处理器执行时实现上述各个方法实施例提供的图像中小目标检测方法。
本发明还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述各个方法实施例的图像中小目标检测方法。
请参见图6,为本申请实施例提供了一种终端的结构示意图。如图6所示,终端1000可以包括:至少一个处理器1001,至少一个网络接口1004,用户接口1003,存储器1005,至少一个通信总线1002。
其中,通信总线1002用于实现这些组件之间的连接通信。
其中,用户接口1003可以包括显示屏(Display)、摄像头(Camera),可选用户接口1003还可以包括标准的有线接口、无线接口。
其中,网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。
其中,处理器1001可以包括一个或者多个处理核心。处理器1001利用各种借口和线路连接整个终端1000内的各个部分,通过运行或执行存储在存储器1005内的指令、程序、代码集或指令集,以及调用存储在存储器1005内的数据,执行终端1000的各种功能和处理数据。可选的,处理器1001可以采用数字信号处理(Digital Signal Processing,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(Programmable Logic Array,PLA)中的至少一种硬件形式来实现。处理器1001可集成中央处理器(Central Processing Unit,CPU)、图像处理器(Graphics Processing Unit,GPU)和调制解调器等中的一种或几种的组合。其中,CPU主要处理操作系统、用户界面和应用程序等;GPU用于负责显示屏所需要显示的内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器1001中,单独通过一块芯片进行实现。
其中,存储器1005可以包括随机存储器(Random Access Memory,RAM),也可以包括只读存储器(Read-Only Memory)。可选的,该存储器1005包括非瞬时性计算机可读介质(non-transitory computer-readable storage medium)。存储器1005可用于存储指令、程序、代码、代码集或指令集。存储器1005可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现上述各个方法实施例的指令等;存储数据区可存储上面各个方法实施例中涉及到的数据等。存储器1005可选的还可以是至少一个位于远离前述处理器1001的存储系统。如图6所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及图像中小目标检测应用程序。
在图6所示的终端1000中,用户接口1003主要用于为用户提供输入的接口,获取用户输入的数据;而处理器1001可以用于调用存储器1005中存储的图像中小目标检测应用程序,并具体执行以下操作:
当从待检测的图像中检测小目标时,加载预先训练的小目标检测模型;
剔除所述小目标检测模型中的反转注意力模块后,生成剔除后的小目标检测模型;其中,所述小目标检测模型是基于Faster RCNN检测网络、SSD检测器以及反转注意力模块创建的,所述反转注意力模块用于实现模型训练时将不同维度下生成的特征图进行融合;
将所述待检测的目标图像输入所述剔除后的小目标检测模型中,提取至少一个小目标特征;
对所述至少一个小目标特征进行分类和边框回归处理后,生成处理后的小目标。
在一个实施例中,处理器1001在执行生成处理后的小目标检测框之后时,还执行以下操作:
输出处理后的小目标,并将小目标进行展示。
在一个实施例中,处理器1001在执行当监测到待检测的目标图像时,加载预先训练的小目标检测模型之前时,还执行以下操作:
设计小目标检测模型;
从图像数据库采集多个训练数据样本;
将多个训练数据样本输入创建的小目标检测模型进行训练,输出小目标检测模型的损失值;
当损失值到达预设最小阈值时,模型训练结束并生成预先训练的小目标检测模型。
在本申请实施例中,图像中小目标检测系统当从待检测的图像中检测小目标时,首先加载预先训练的小目标检测模型,然后剔除小目标检测模型中反转注意力模块生成剔除后的小目标检测模型,再将待检测的目标图像输入剔除后的小目标检测模型中提取至少一个小目标特征,最后对至少一个小目标特征进行分类和边框回归处理后,生成处理后的小目标检测框。因此,采用本申请实施例,由于将基于梯度引导生成的注意力图和通道维注意力图进行融合,其中通道维注意力权重因子表达了不同特征通道间的重要程度,梯度引导生成的注意力权重因子表示特征图中该元素受关注的重视程度,融合后得到的注意力权重因子可以更加全面完整地表达小目标特征信息,提取特征更加多样、更加全面。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,的存储介质可为磁碟、光盘、只读存储记忆体或随机存储记忆体等。
以上所揭露的仅为本申请较佳实施例而已,当然不能以此来限定本申请之权利范围,因此依本申请权利要求所作的等同变化,仍属本申请所涵盖的范围。

Claims (8)

1.一种图像中小目标检测方法,其特征在于,所述方法包括:
当从待检测的图像中检测小目标时,加载预先训练的小目标检测模型;
剔除所述小目标检测模型中的反转注意力模块后,生成剔除后的小目标检测模型;其中,所述小目标检测模型是基于Faster RCNN检测网络、SSD检测器以及反转注意力模块创建的,所述反转注意力模块用于实现模型训练时将不同维度下生成的特征图进行融合;
将所述待检测的目标图像输入所述剔除后的小目标检测模型中,提取至少一个小目标特征;
对所述至少一个小目标特征进行分类和边框回归处理后,生成处理后的小目标;其中,
还包括按照下述方法生成所述预先训练的小目标检测模型,包括:
设计小目标检测网络;
从图像数据库采集多个训练数据样本;
将所述多个训练数据样本输入所述创建的小目标检测网络进行训练,输出所述小目标检测网络的损失值;
当所述损失值到达预设最小阈值时,网络训练结束并生成预先训练的小目标检测模型;其中,
所述小目标检测网络包括目标特征提取模块、候选区域生成模块、目标区域池化模块、候选目标检测模块、反转注意力模块以及更新特征图模块;
所述将所述多个训练数据样本输入所述创建的小目标检测网络进行训练,输出所述小目标检测网络的损失值,包括:
目标特征提取模块通过VGG和/或RESNET卷积神经网络提取所述多个训练样本中每张图片的多个特征图;
候选区域生成模块通过候选区域生成网络从所述多个特征图中计算出所述多个特征图对应的小目标区域候选框;
目标区域池化模块将所述多个特征图对应的小目标区域候选框中感兴趣的目标区域进行池化操作,生成池化后的多个小目标区域候选框对应的特征图;
候选目标检测模块将所述多个训练样本中每张图片上的目标候选框对应的RoI特征进行分类并在原图上对边框进行回归操作,生成池化后的多个小目标区域候选框对应的分类损失和回归损失;
反转注意力模块基于多个小目标区域候选框对应的分类损失计算所述池化后的多个小目标区域候选框对应的特征图的特征图梯度,并基于所述多个小目标区域候选框对应的特征图的特征图梯度生成注意力反转增强模板图;
更新特征图模块将所述注意力反转增强模板图与所述池化后的多个小目标区域候选框对应的特征图进行逐元素乘积,生成融合后的特征图,根据所述融合后的特征图进行前向传播以计算检测损失,并输出所述小目标检测网络的损失值。
2.根据权利要求1所述的方法,其特征在于,所述生成处理后的小目标检测框之后,还包括:
输出所述处理后的小目标,并将所述小目标进行展示。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
当所述损失值未到达预设最小阈值时,优化所述创建的小目标检测网络的模型参数;以及
继续执行所述将所述多个训练数据样本输入所述创建的小目标检测网络进行训练的步骤。
4.根据权利要求1所述的方法,其特征在于,所述设计小目标检测网络,包括:
利用Faster RCNN检测网络和SSD检测器构建成多个检测网络;
采用注意力神经网络以及网络权重更新算法创建反转注意力模块;
将所述反转注意力模块添加到所述多个检测网络中,生成小目标检测网络。
5.根据权利要求1所述的方法,其特征在于,所述基于所述多个小目标区域候选框对应的特征图的特征图梯度生成注意力反转增强模板图,包括:
对所述特征图梯度进行全局平均池化得到第一权重向量;
对所述池化后的多个小目标区域候选框对应的特征图进行全局平均池化得到第二权重向量;
将所述第一权重向量和所述第二权重向量逐元素相乘得到目标注意力权重向量;
将所述目标注意力权重向量和所述池化后的多个小目标区域候选框对应的特征图逐通道相乘并求和得到注意力反转增强图;
将所述注意力反转增强图阈值化并求反得到注意力反转增强后的模板图M;
将所述目标注意力权重向量经过归一化操作后得到向量VB,并对所述向量VB阈值化并求反生成注意力反转增强后的模板图VM;
根据所述注意力反转增强后的模板图VM元素取值,当所述VM中某个元素为0时,将所述模板图M作为注意力反转增强模板图;以及当VM为1,将所述池化后的多个小目标区域候选框对应的特征图作为注意力反转增强模板图。
6.一种图像中小目标检测系统,其特征在于,所述系统包括:
模型加载模块,用于当从待检测的图像中检测小目标时,加载预先训练的小目标检测模型;
反转注意力模块剔除模块,用于剔除所述小目标检测模型中的反转注意力模块后,生成剔除后的小目标检测模型;其中,所述小目标检测模型是基于Faster RCNN检测网络、SSD检测器以及反转注意力模块创建的,所述反转注意力模块用于实现模型训练时将不同维度下生成的特征图进行融合;
小目标特征提取模块,用于将所述待检测的目标图像输入所述剔除后的小目标检测模型中,提取至少一个小目标特征;
小目标特征处理模块,用于对所述至少一个小目标特征进行分类和边框回归处理后,生成处理后的小目标;其中,
所述系统还具体用于:
设计小目标检测网络;
从图像数据库采集多个训练数据样本;
将所述多个训练数据样本输入所述创建的小目标检测网络进行训练,输出所述小目标检测网络的损失值;
当所述损失值到达预设最小阈值时,网络训练结束并生成预先训练的小目标检测模型;其中,
所述小目标检测网络包括目标特征提取模块、候选区域生成模块、目标区域池化模块、候选目标检测模块、反转注意力模块以及更新特征图模块;
所述将所述多个训练数据样本输入所述创建的小目标检测网络进行训练,输出所述小目标检测网络的损失值,包括:
目标特征提取模块通过VGG和/或RESNET卷积神经网络提取所述多个训练样本中每张图片的多个特征图;
候选区域生成模块通过候选区域生成网络从所述多个特征图中计算出所述多个特征图对应的小目标区域候选框;
目标区域池化模块将所述多个特征图对应的小目标区域候选框中感兴趣的目标区域进行池化操作,生成池化后的多个小目标区域候选框对应的特征图;
候选目标检测模块将所述多个训练样本中每张图片上的目标候选框对应的RoI特征进行分类并在原图上对边框进行回归操作,生成池化后的多个小目标区域候选框对应的分类损失和回归损失;
反转注意力模块基于多个小目标区域候选框对应的分类损失计算所述池化后的多个小目标区域候选框对应的特征图的特征图梯度,并基于所述多个小目标区域候选框对应的特征图的特征图梯度生成注意力反转增强模板图;
更新特征图模块将所述注意力反转增强模板图与所述池化后的多个小目标区域候选框对应的特征图进行逐元素乘积,生成融合后的特征图,根据所述融合后的特征图进行前向传播以计算检测损失,并输出所述小目标检测网络的损失值。
7.一种计算机存储介质,其特征在于,所述计算机存储介质存储有多条指令,所述指令适于由处理器加载并执行如权利要求1-5任意一项所述的方法步骤。
8.一种终端,其特征在于,包括:处理器和存储器;其中,所述存储器存储有计算机程序,所述计算机程序适于由所述处理器加载并执行如权利要求1-5任意一项所述的方法步骤。
CN202011307843.8A 2020-11-19 2020-11-19 一种图像中小目标检测方法、系统、存储介质及终端 Active CN112488999B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011307843.8A CN112488999B (zh) 2020-11-19 2020-11-19 一种图像中小目标检测方法、系统、存储介质及终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011307843.8A CN112488999B (zh) 2020-11-19 2020-11-19 一种图像中小目标检测方法、系统、存储介质及终端

Publications (2)

Publication Number Publication Date
CN112488999A CN112488999A (zh) 2021-03-12
CN112488999B true CN112488999B (zh) 2024-04-05

Family

ID=74932247

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011307843.8A Active CN112488999B (zh) 2020-11-19 2020-11-19 一种图像中小目标检测方法、系统、存储介质及终端

Country Status (1)

Country Link
CN (1) CN112488999B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113313028B (zh) * 2021-05-28 2024-03-12 国网陕西省电力公司电力科学研究院 一种火焰检测方法、系统、终端设备及可读存储介质
CN113269119B (zh) * 2021-06-07 2023-01-31 重庆大学 一种夜间车辆检测方法及装置
CN113378936B (zh) * 2021-06-11 2024-03-08 长沙军民先进技术研究有限公司 一种基于Faster RCNN的少样本目标检测方法
CN114067186B (zh) * 2021-09-26 2024-04-16 北京建筑大学 一种行人检测方法、装置、电子设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111145787A (zh) * 2019-12-26 2020-05-12 太原理工大学 一种基于主辅网络的语音情感特征融合方法及系统
CN111738344A (zh) * 2020-06-24 2020-10-02 上海应用技术大学 一种基于多尺度融合的快速目标检测方法
CN111914804A (zh) * 2020-08-18 2020-11-10 中科弘云科技(北京)有限公司 多角度旋转遥感图像小目标检测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111145787A (zh) * 2019-12-26 2020-05-12 太原理工大学 一种基于主辅网络的语音情感特征融合方法及系统
CN111738344A (zh) * 2020-06-24 2020-10-02 上海应用技术大学 一种基于多尺度融合的快速目标检测方法
CN111914804A (zh) * 2020-08-18 2020-11-10 中科弘云科技(北京)有限公司 多角度旋转遥感图像小目标检测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于注意力机制修正网络的行人属性识别;李辰征 等;《计算机工程与设计》;20200531;第41卷(第5期);摘要,第2节 *
改进的Faster RCNN煤矿井下行人检测算法;李伟山 等;《计算机工程与应用》;20190430;第55卷(第4期);摘要,第3节 *

Also Published As

Publication number Publication date
CN112488999A (zh) 2021-03-12

Similar Documents

Publication Publication Date Title
CN112488999B (zh) 一种图像中小目标检测方法、系统、存储介质及终端
CN112434721B (zh) 一种基于小样本学习的图像分类方法、系统、存储介质及终端
JP7236545B2 (ja) ビデオターゲット追跡方法と装置、コンピュータ装置、プログラム
CN108647585B (zh) 一种基于多尺度循环注意力网络的交通标识符检测方法
CN108664981B (zh) 显著图像提取方法及装置
CN108229504B (zh) 图像解析方法及装置
JP2015041383A (ja) 対象追跡方法及び対象追跡装置
KR102140805B1 (ko) 위성 영상의 물체 식별을 위한 뉴럴 네트워크 학습 방법 및 장치
KR102576344B1 (ko) 비디오를 처리하기 위한 방법, 장치, 전자기기, 매체 및 컴퓨터 프로그램
CN111401293B (zh) 一种基于Head轻量化Mask Scoring R-CNN的手势识别方法
CN111914843B (zh) 文字检测方法、系统、设备及存储介质
CN112989995B (zh) 文本检测方法、装置及电子设备
CN110210480B (zh) 文字识别方法、装置、电子设备和计算机可读存储介质
CN110349138B (zh) 基于实例分割框架的目标物体的检测方法及装置
CN115330940B (zh) 一种三维重建方法、装置、设备和介质
CN113591719A (zh) 一种自然场景任意形状文本检测方法、装置和训练方法
CN113378712A (zh) 物体检测模型的训练方法、图像检测方法及其装置
CN110633717A (zh) 一种目标检测模型的训练方法和装置
CN113724388B (zh) 高精地图的生成方法、装置、设备以及存储介质
CN112734931B (zh) 一种辅助点云目标检测的方法及系统
CN111292333A (zh) 用于分割图像的方法和装置
CN114972910B (zh) 图文识别模型的训练方法、装置、电子设备及存储介质
CN111583417A (zh) 一种图像语义和场景几何联合约束的室内vr场景构建的方法、装置、电子设备和介质
CN111444834A (zh) 图像文本行检测方法、装置、设备及存储介质
CN110728316A (zh) 一种课堂行为检测方法、系统、装置和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant