CN112464743A - 一种基于多尺度特征加权的小样本目标检测方法 - Google Patents

一种基于多尺度特征加权的小样本目标检测方法 Download PDF

Info

Publication number
CN112464743A
CN112464743A CN202011237385.5A CN202011237385A CN112464743A CN 112464743 A CN112464743 A CN 112464743A CN 202011237385 A CN202011237385 A CN 202011237385A CN 112464743 A CN112464743 A CN 112464743A
Authority
CN
China
Prior art keywords
network
feature
category
basic
loss
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011237385.5A
Other languages
English (en)
Other versions
CN112464743B (zh
Inventor
蒋雯
张子涵
耿杰
邓鑫洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northwestern Polytechnical University
Original Assignee
Northwestern Polytechnical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northwestern Polytechnical University filed Critical Northwestern Polytechnical University
Priority to CN202011237385.5A priority Critical patent/CN112464743B/zh
Publication of CN112464743A publication Critical patent/CN112464743A/zh
Application granted granted Critical
Publication of CN112464743B publication Critical patent/CN112464743B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/41Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/20Air quality improvement or preservation, e.g. vehicle emission control or emission reduction by using catalytic converters

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于多尺度特征加权的小样本目标检测方法,包括以下步骤:步骤一、将数据集划分为基本类别与小样本类别;步骤二、基类训练过程中构建特征提取网络;步骤三、构建特征分支网络,对多尺度的特征进行融合;步骤四、构建权重生成网络,预测相应类别对应的权重;步骤五、进行类别权重加权过程,使用不同类别的权重向量对特征进行加权;步骤六、使用综合检测器进行回归预测;步骤七、在网络框架不变的情况下将基本类别与小样本类别同时加入微调过程,重复上述步骤二至六最终得到小样本目标检测的结果。本发明结构清晰,设计了多尺度融合的网络结构让网络能够使用各个尺度的图像信息从而能更好的检测不同尺度的目标。

Description

一种基于多尺度特征加权的小样本目标检测方法
技术领域
本发明属于深度学习目标检测领域,具体针对小样本领域涉及一种基于多尺度特征加权的小样本目标检测方法。
背景技术
随着近年来计算机技术的发展,计算机的计算能力飞速增长,人工智能技术也逐渐进入人们的视野。人工智能技术旨在让机器达到像人一样的智能,可以自行处理问题,甚至比人更加准确更加快速。如今人工智能技术已经在生活中有着广泛的应用。人工智能技术通过深度学习框架对图片中的目标特征进行提取和学习让网络获得检测相应目标的能力从而达到了智能检测目标的能力。深度学习方法不需要人为设计特征表达来提取特征,而是通过训练海量的数据自行提取特征,这个过程节省了大量的时间和人力。而且已经被证实,在拥有足够数据量的情况下,使用深度学习的目标检测方法的检测精度要比传统检测方法高很多。
深度学习目标检测在训练数据量充足时都可以达到不错的效果,但是当训练数据量减少时,传统的深度学习目标检测网络的检测效果都会下降。在大多数目标检测情况下,不充足的数据量将会限制这些监督学习目标检测器。由于收集大量的有标注图片是极为花费人力物力的,所以小样本条件下的深度学习目标检测研究就显得尤为重要。
近年来针对小样本学习的研究更多的是集中在目标分类任务上,针对小样本条件下的目标检测研究相对较少。迁移学习,元学习等思想也相继被引入来解决小样本检测问题。Santoro等人提出使用记忆增强的方法来解决小样本学习任务。KUN FU等人在Meta-SSD中提出一种基于元学习的小样本检测思路,其通过构建一个元学习器(Meta-learner)去指导网络的学习,从而使网络模型能快速地适应新检测任务,从而实现小样本目标检测。这个方法给出了解决小样本目标检测的新思路。
但是目前的小样本目标检测存在着一些问题,主要表现在:(1)小样本条件下造成严重的正负类别不平衡问题;(2)模型的知识迁移能力都较弱。本发明中将提出一种解决方案用以解决上述两种小样本条件下所面临的问题。
发明内容
针对上述技术问题本发明提供了一种基于多尺度特征加权的小样本目标检测方法。首先方法在基本类别上训练,将多层的特征进行融合,并且通过权重提取网络给出对每个类别预测的权重,将融合后的特征与每个检测类别的权重进行加权从而获得特征对每个类别的预测从而获得最后的检测结果。本方法使用特征融合再加权的方法提高了模型对不同尺度的目标的检测能力,再通过少量小样本类别样本进行模型微调从而实现小样本条件下的目标检测。
本发明采用的技术方法是:一种基于多尺度特征加权的小样本目标检测方法,包括以下步骤:
步骤一、实验采用PASCAL VOC数据集,将数据集分为基本类别和小样本类别两种:
步骤101、将VOC 07train/val和VOC 12train/val中的所有数据统一作为训练集,将VOC 07test中数据作为实验用的测试集。
步骤102、将VOC数据集共20个类别中随机抽取5个类别作为小样本类别用于微调过程,其余15个类别作为基本类别用于基本训练过程。
步骤103、15个基本类别用于模型的基本训练,在完成基本训练后用所有20类别一起进行少量迭代的微调得到最后的检测模型。
步骤二、基本训练过程使用15类基本类别进行训练,先构建darknet特征提取网络,用于提取输入图片的图像特征:
步骤201、构建的darknet网络为基础网路,其包括5个卷积模块和7层卷积层构成,5个卷积模块分别由1、1、3、3、5个卷积层后接上一层最大值池化层构成。
步骤202、通过基础网络提取图片中的特征,此时网络输出小尺度的特征F用于后续的特征融合。
步骤三、构建特征分支网络,让多尺度的图片特征进行融合:
步骤301、模型中构建三处特征分支网络,分支网络将多个尺度的特征连接到一起以获得更全面的目标信息。
步骤302、设计的特征分支网络由一层卷积层和一层特征尺度调节层构成,卷积层用于将不同维度的特征图进行适当降维,尺度调节层将不同尺度的特征层调节成相同尺度便于融合。
步骤303、方法使用特征分支网络将第三个卷积模块中的第三层卷积层特征F1、第四个卷积模块中的第三个卷积层特征F2、和第五个卷积模块中的第五个卷积层的特征F3与主干网络提取的图像特征F进行融合获得最终的特征图。
步骤四、构建类别权重生成网络用于预测每个类别对应的权重向量:
步骤401、权重生成网络输入为每个类别的图片,输出为每个类别对应的权重向量Wi
步骤402、权重生成网络由六个卷积模块构成,每个模块包括一个卷积层和一个最大值池化层。
步骤五、基于类别权重向量的特征加权过程,通过类别权重向量对融合后的特征进行加权处理,让目标的特征更贴近其真实类别:
步骤501、将由步骤三获得的融合特征通过一层卷积层降维到类别权重的维度。
步骤502、将类别权重对融合特征进行1×1通道数不变的卷积得到加权后的特征Fw
步骤503、将加权后的特征进一步降维为到30维特征F30,对于每个边界框模型预测6维度参数(o,x,y,h,w,c),其中o为置信度、x为锚点的x坐标、y为锚点的y坐标、h为边界框的高、w为边界框的宽、c为目标的类别。由于每个锚点预先设定5种长宽比的边界框,所以每个锚点共预测30维参数。
步骤六、利用降维后的特征F30进行回归预测,获得最终的检测结果:
步骤601、将降维后的特征F30图输入检测模块进行预测。
步骤602、训练过程中对于置信度o使用均方差损失Lobj公式如下:
Figure BDA0002767191890000041
其中pi为网络的预测值,ti表示为相应的标签真实值。
步骤603、对于边界框坐标x、y、w、h,模型同样使用均方差损失,Lbbox损失如下:
Figure BDA0002767191890000042
网络对bbox的每一维坐标都计算相应的损失,总体的边界框损失为四个坐标损失的总和,其中xi、yi、wi、hi为网络的预测值,Xi、Yi、Wi、Hi为其真实值。
步骤604、模型训练过程中使用改进的mFocalLoss作为分类损失公式如下:
Figure BDA0002767191890000043
其中pi为网络的预测值,y=1表示预测的目标为正类,0表示预测的目标为负类,其中N为我们定义的一个超参数,其计算方式为
Figure BDA0002767191890000044
为一个批次中正类预测的个数除以所有预测的数量,这样一个自适应的正则化项相比于传统的FocalLoss损失中使用定值正则化项能更好的适应不同训练样本而造成的正负样本比例波动问题。自适应的正则化项能根据不同情况下的正负样本比例自适应的调整正负样本损失的占比。
步骤605、网络训练的总损失Loss公式如下:
Loss=Lobj+Lbbox+LmFocalLoss
网络最终的损失由置信度损失、边界框损失和分类损失三部分构成。
步骤606、在基本类别上训练完成训练后得到基本类别的模型Mbase,接下来将在基本类别模型的基础上进行小样本类别的微调训练。
步骤七、微调过程使用数据集中全部20个类别的少量样本进行微调,网络模型不变并且使用Mbase,每个类别只有几张图片(1,2,3,5,10)。进行少量几个迭代过程得到最终的小样本检测模型。通过微调好的小样本检测模型,我们可以得到小样本条件下的最终检测结果。
本发明与现有技术相比,主要具有如下的优点:
第一,本发明提出了基于多尺度特征加权的小样本目标检测方法,通过多尺度的特征融合让模型可以充分利用不同尺度的特征信息提高了特征信息的利用率,对检测不同尺度的目标很有帮助。模型利用不同类别的预测权重对特征进一步进行加权重组特征,让相应的视觉特征尽可能的贴近它的真实标签,从而通过只有几张图片的微调过程就可以快速让模型预测出小样本类别的权重向量从而完成小样本目标检测。
第二,本发明采用了一种改进的mFocalLoss,对FocalLoss的正则项做出改进,相比于原本FocalLoss使用固定值作为正则项,本发明通过提出一种自适应的正则项来平衡小样本检测中的正负样本不均衡问题。本发明通过使用一个批次中正例与负例的比例作为自适应的正则项,解决了不同批次中由于样本的差异造成的正负样本不均衡的问题。改进的FocalLoss同时会更聚焦于困难样本,困难样本将引入较大损失,不怎么关注容易样本,容易样本会引入较少的损失,从而让模型更专注困难样本进而达到更好的检测效果。
附图说明
图1为本发明的方法流程图。
具体实施方式
下面结合附图及本发明的实施例对本发明的方法作进一步详细的说明。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施方式例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为了便于描述,在这里可以使用空间相对术语,如“在……之上”、“在……上方”、“在……上表面”、“上面的”等,用来描述如在图中所示的一个器件或特征与其他器件或特征的空间位置关系。应当理解的是,空间相对术语旨在包含除了器件在图中所描述的方位之外的在使用或操作中的不同方位。例如,如果附图中的器件被倒置,则描述为“在其他器件或构造上方”或“在其他器件或构造之上”的器件之后将被定位为“在其他器件或构造下方”或“在其他器件或构造之下”。因而,示例性术语“在……上方”可以包括“在……上方”和“在……下方”两种方位。该器件也可以其他不同方式定位(旋转90度或处于其他方位),并且对这里所使用的空间相对描述作出相应解释。
如图1所示,本发明的一种基于多尺度特征加权的小样本目标检测方法,包括以下步骤:
步骤一、实验采用PASCAL VOC数据集,将数据集分为基本类别和小样本类别两种:
步骤101、将VOC 07train/val和VOC 12train/val中的所有数据统一作为训练集,将VOC 07test中数据作为实验用的测试集。
步骤102、将VOC数据集共20个类别中随机抽取5个类别作为小样本类别用于微调过程,其余15个类别作为基本类别用于基本训练过程。
步骤103、15个基本类别用于模型的基本训练,在完成基本训练后用所有20类别一起进行少量迭代的微调得到最后的检测模型。
步骤二、基础训练过程使用15类基本类别进行训练,先构建基于darknet的特征提取网络,用于提取输入图片的图像特征:
步骤201、构建的darknet网络为基础网路,其包括5个卷积模块和7层卷积层构成,5个卷积模块分别由1、1、3、3、5个卷积层后接上一层最大值池化层构成,其中每个卷积层使用LeakyReLU激活函数,训练过程中卷积层使用Dropout并且使用BatchNorm,以下所有涉及的卷积层均为上述结构。其中模块1和模块2中的卷积层为3×3步长为1的卷积,模块3中的三个卷积层分别为3×3、1×1、3×3步长为1的卷积层,模块4中的卷积层结构与模块3中相同,模块5中5层卷积层分别为3×3、1×1、3×3、1×1、3×3步长为1的卷积层。7层卷积层分别为3×3、1×1、3×3、1×1、3×3、3×3、3×3步长为1的卷积层。
步骤202、通过基础网络提取图片中的特征,此时网络输出小尺度的特征F用于后续的特征融合。
步骤三、构建特征分支网络,让多尺度的图片特征进行融合:
步骤301、模型中构建三处特征分支网络,分支网络将多个尺度的特征连接到一起以获得更全面的目标信息。
步骤302、设计的特征分支网络由一层卷积层和一层特征尺度调节层构成,卷积层用于将不同维度的特征图进行适当降维,尺度调节层将不同尺度的特征层调节成相同尺度便于后续的融合。
步骤303、方案先提取三组特征:第三个卷积模块中的第三层卷积层特征F1(维度为104×104×128)、第四个卷积模块中的第三个卷积层特征F2(维度为52×52×256)、和第五个卷积模块中的第五个卷积层的特征F3(维度为26×26×512),将特征F1先通过卷积层降维到104×104×4,再通过尺度变化为13×13×256,将特征F2降维到52×52×16,再尺度变换为13×13×256,同理将F3降维到26×26×64,再调整尺度为13×13×256。将尺度变换后的三组特征与主干网络提取的图像特征F(维度为13×13×1024)进行融合获得最终的特征图Fa(维度为13×13×1792)。
步骤四、构建类别权重生成网络用于对每个类别预测相应类别的权重向量:
步骤401、类别权重生成网络输入为每个类别的图片,输出为每个类别对应的权重向量Wi,每个类别预测一个1024维的向量,训练过程为15个类别,微调过程为20个类别。
步骤402、权重生成网络由六个卷积模块构成,每个模块包括一个3×3步长为1卷积层和一个最大值池化层。
步骤五、基于类别权重向量的特征加权过程,通过类别权重向量对融合后的特征进行加权处理,让目标的特征更贴近其真实类别:
步骤501、将融合后的特征Fa通过一层卷积层将其降维到13×13×1024以便与类别权重向量进行加权。
步骤502、将类别权重对融合后特征进行1×1通道数不变的卷积得到对于各个类别加权后的特征Fw
步骤503、将加权后的特征进一步降为到13×13×30的特征F30,对于每个边界框模型预测6维度参数(o,x,y,h,w,c),其中o为置信度、x为锚点的x坐标、y为锚点的y坐标、h为边界框的高、w为边界框的宽、c为目标的类别。由于每个锚点预先设定5种长宽比的边界框,所以每个锚点共预测30维参数。
步骤六、利用降维后的特征F30进行回归预测,获得最终的检测结果:
步骤601、将降维后的特征F30图输入检测模块进行预测。
步骤602、训练过程中对于置信度o使用均方差损失Lobj公式如下:
Figure BDA0002767191890000091
其中pi为网络的预测值,ti表示为相应的标签真实值。
步骤603、对于边界框坐标x、y、w、h,模型使用同样使用均方差损失,Lbbox损失如下:
Figure BDA0002767191890000092
网络对bbox的每一维坐标都计算相应的损失,总体的边界框损失为四个坐标损失的总和,其中xi、yi、wi、hi为网络的预测值,Xi、Yi、Wi、Hi为其真实值。
步骤604、模型训练过程中使用改进的mFocalLoss作为分类损失公式如下:
Figure BDA0002767191890000093
其中pi为网络的预测值,y=1表示预测的目标为正类,0表示预测的目标为负类,其中N为我们定义的一个超参数,其计算方式为
Figure BDA0002767191890000094
为一个批次中正类预测的个数除以所有预测的数量,这样一个自适应的正则化项相比于传统的FocalLoss损失中使用定值正则化项能更好的适应不同训练样本而造成的正负样本比例波动问题。自适应的正则化项能根据不同情况下的正负样本比例自适应的调整正负样本损失的占比。
步骤605、网络训练的总损失Loss公式如下:
Loss=Lobj+Lbbox+LmFocalLoss
网络最终的损失由置信度损失、边界框损失、和分类损失三部分构成。
步骤606、在每一批次数据上进行前向传播,然后使用梯度下降算法反向传播优化模型参数,在基本类别上收敛完成训练后得到基本类别的模型Mbase,接下来将在基本类别模型的基础上进行小样本类别的微调训练。
步骤七、微调过程使用数据集中全部20个类别的少量样本进行微调,网络模型不变并且使用Mbase,微调过程使用全部20个类别,每个类别只有几张图片(1,2,3,5,10),权重生成网络每次输入20个类别的样本个一张用于生成小样本类别的权重向量和进一步调整基类权重向量。实验进行少量几个迭代过程得到最终的小样本检测模型。通过微调好的小样本检测模型,可以得到小样本条件下的最终检测结果。
以上所述,仅是本发明的实施例,并非对本发明作任何限制,凡是根据本发明技术实质对以上实施例所作的任何简单修改、变更以及等效结构变化,均仍属于本发明技术方案的保护范围内。

Claims (1)

1.一种基于多尺度特征加权的小样本目标检测方法,其特征在于:其包括以下步骤:
步骤一、实验采用PASCAL VOC数据集,将数据集分为基本类别和小样本类别两种:
步骤101、将VOC 07train/val和VOC 12train/val中的所有数据统一作为训练集,将VOC 07test中数据作为实验用的测试集。
步骤102、将VOC数据集共20个类别中随机抽取5个类别作为小样本类别用于微调过程,其余15个类别作为基本类别用于基本训练过程。
步骤103、15个基本类别用于模型的基本训练,在完成基本训练后用所有20类别一起进行少量迭代的微调得到最后的检测模型。
步骤二、基本训练过程使用15类基本类别进行训练,先构建darknet特征提取网络,用于提取输入图片的图像特征:
步骤201、构建的darknet网络为基础网路,其包括5个卷积模块和7层卷积层构成,5个卷积模块分别由1、1、3、3、5个卷积层后接上一层最大值池化层构成。
步骤202、通过基础网络提取图片中的特征,此时网络输出小尺度的特征F用于后续的特征融合。
步骤三、构建特征分支网络,让多尺度的图片特征进行融合:
步骤301、模型中构建三处特征分支网络,分支网络将多个尺度的特征连接到一起以获得更全面的目标信息。
步骤302、设计的特征分支网络由一层卷积层和一层特征尺度调节层构成,卷积层用于将不同维度的特征图进行适当降维,尺度调节层将不同尺度的特征层调节成相同尺度便于融合。
步骤303、方法使用特征分支网络将第三个卷积模块中的第三层卷积层特征F1、第四个卷积模块中的第三个卷积层特征F2、和第五个卷积模块中的第五个卷积层的特征F3与主干网络提取的图像特征F进行融合获得最终的特征图。
步骤四、构建类别权重生成网络用于预测每个类别对应的权重向量:
步骤401、权重生成网络输入为每个类别的图片,输出为每个类别对应的权重向量Wi
步骤402、权重生成网络由六个卷积模块构成,每个模块包括一个卷积层和一个最大值池化层。
步骤五、基于类别权重向量的特征加权过程,通过类别权重向量对融合后的特征进行加权处理,让目标的特征更贴近其真实类别:
步骤501、将由步骤三获得的融合特征通过一层卷积层降维到类别权重的维度。
步骤502、将类别权重对融合特征进行1×1通道数不变的卷积得到加权后的特征Fw
步骤503、将加权后的特征进一步降维为到30维特征F30,对于每个边界框模型预测6维度参数(o,x,y,h,w,c),其中o为置信度、x为锚点的x坐标、y为锚点的y坐标、h为边界框的高、w为边界框的宽、c为目标的类别。由于每个锚点预先设定5种长宽比的边界框,所以每个锚点共预测30维参数。
步骤六、利用降维后的特征F30进行回归预测,获得最终的检测结果:步骤601、将降维后的特征F30图输入检测模块进行预测。
步骤602、训练过程中对于置信度o使用均方差损失Lobj公式如下:
Figure FDA0002767191880000021
其中pi为网络的预测值,ti表示为相应的标签真实值。
步骤603、对于边界框坐标x、y、w、h,模型同样使用均方差损失,Lbbox损失如下:
Figure FDA0002767191880000022
网络对bbox的每一维坐标都计算相应的损失,总体的边界框损失为四个坐标损失的总和,其中xi、yi、wi、hi为网络的预测值,Xi、Yi、Wi、Hi为其真实值。
步骤604、模型训练过程中使用改进的mFocalLoss作为分类损失公式如下:
Figure FDA0002767191880000031
其中pi为网络的预测值,y=1表示预测的目标为正类,0表示预测的目标为负类,其中N为我们定义的一个超参数,其计算方式为
Figure FDA0002767191880000032
为一个批次中正类预测的个数除以所有预测的数量,这样一个自适应的正则化项相比于传统的FocalLoss损失中使用定值正则化项能更好的适应不同训练样本而造成的正负样本比例波动问题。自适应的正则化项能根据不同情况下的正负样本比例自适应的调整正负样本损失的占比。
步骤605、网络训练的总损失Loss公式如下:
Loss=Lobj+Lbbox+LmFocalLoss
网络最终的损失由置信度损失、边界框损失和分类损失三部分构成。
步骤606、在基本类别上训练完成训练后得到基本类别的模型Mbase,接下来将在基本类别模型的基础上进行小样本类别的微调训练。
步骤七、微调过程使用数据集中全部20个类别的少量样本进行微调,网络模型不变并且使用Mbase,每个类别只有几张图片(1,2,3,5,10)。进行少量几个迭代过程得到最终的小样本检测模型。通过微调好的小样本检测模型,我们可以得到小样本条件下的最终检测结果。
CN202011237385.5A 2020-11-09 2020-11-09 一种基于多尺度特征加权的小样本目标检测方法 Active CN112464743B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011237385.5A CN112464743B (zh) 2020-11-09 2020-11-09 一种基于多尺度特征加权的小样本目标检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011237385.5A CN112464743B (zh) 2020-11-09 2020-11-09 一种基于多尺度特征加权的小样本目标检测方法

Publications (2)

Publication Number Publication Date
CN112464743A true CN112464743A (zh) 2021-03-09
CN112464743B CN112464743B (zh) 2023-06-02

Family

ID=74825298

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011237385.5A Active CN112464743B (zh) 2020-11-09 2020-11-09 一种基于多尺度特征加权的小样本目标检测方法

Country Status (1)

Country Link
CN (1) CN112464743B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112819110A (zh) * 2021-04-19 2021-05-18 中国科学院自动化研究所 基于权重生成的增量式小样本目标检测方法及系统
CN112949520A (zh) * 2021-03-10 2021-06-11 华东师范大学 一种基于多尺度小样本的航拍车辆检测方法及检测系统
CN113240039A (zh) * 2021-05-31 2021-08-10 西安电子科技大学 基于空间位置特征重加权的小样本目标检测方法及系统
CN113420642A (zh) * 2021-06-21 2021-09-21 西安电子科技大学 一种基于类别语义特征重加权的小样本目标检测方法及系统

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109064514A (zh) * 2018-07-03 2018-12-21 北京航空航天大学 一种基于投影点坐标回归的六自由度位姿估计算法
CN109800778A (zh) * 2018-12-03 2019-05-24 浙江工业大学 一种基于难分样本挖掘的Faster RCNN目标检测方法
CN109816024A (zh) * 2019-01-29 2019-05-28 电子科技大学 一种基于多尺度特征融合与dcnn的实时车标检测方法
CN109977793A (zh) * 2019-03-04 2019-07-05 东南大学 基于变尺度多特征融合卷积网络的路侧图像行人分割方法
CN110069997A (zh) * 2019-03-22 2019-07-30 北京字节跳动网络技术有限公司 场景分类方法、装置及电子设备
CN110287927A (zh) * 2019-07-01 2019-09-27 西安电子科技大学 基于深度多尺度和上下文学习的遥感影像目标检测方法
CN110298266A (zh) * 2019-06-10 2019-10-01 天津大学 基于多尺度感受野特征融合的深度神经网络目标检测方法
CN110309747A (zh) * 2019-06-21 2019-10-08 大连理工大学 一种支持多尺度快速深度行人检测模型
US20200143205A1 (en) * 2017-08-10 2020-05-07 Intel Corporation Convolutional neural network framework using reverse connections and objectness priors for object detection
CN111126472A (zh) * 2019-12-18 2020-05-08 南京信息工程大学 一种基于ssd改进的目标检测方法
CN111652321A (zh) * 2020-06-10 2020-09-11 江苏科技大学 一种基于改进yolov3算法的海上船舶检测方法
CN111695522A (zh) * 2020-06-15 2020-09-22 重庆邮电大学 一种平面内的旋转不变人脸检测方法、装置及存储介质

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200143205A1 (en) * 2017-08-10 2020-05-07 Intel Corporation Convolutional neural network framework using reverse connections and objectness priors for object detection
CN109064514A (zh) * 2018-07-03 2018-12-21 北京航空航天大学 一种基于投影点坐标回归的六自由度位姿估计算法
CN109800778A (zh) * 2018-12-03 2019-05-24 浙江工业大学 一种基于难分样本挖掘的Faster RCNN目标检测方法
CN109816024A (zh) * 2019-01-29 2019-05-28 电子科技大学 一种基于多尺度特征融合与dcnn的实时车标检测方法
CN109977793A (zh) * 2019-03-04 2019-07-05 东南大学 基于变尺度多特征融合卷积网络的路侧图像行人分割方法
CN110069997A (zh) * 2019-03-22 2019-07-30 北京字节跳动网络技术有限公司 场景分类方法、装置及电子设备
CN110298266A (zh) * 2019-06-10 2019-10-01 天津大学 基于多尺度感受野特征融合的深度神经网络目标检测方法
CN110309747A (zh) * 2019-06-21 2019-10-08 大连理工大学 一种支持多尺度快速深度行人检测模型
CN110287927A (zh) * 2019-07-01 2019-09-27 西安电子科技大学 基于深度多尺度和上下文学习的遥感影像目标检测方法
CN111126472A (zh) * 2019-12-18 2020-05-08 南京信息工程大学 一种基于ssd改进的目标检测方法
CN111652321A (zh) * 2020-06-10 2020-09-11 江苏科技大学 一种基于改进yolov3算法的海上船舶检测方法
CN111695522A (zh) * 2020-06-15 2020-09-22 重庆邮电大学 一种平面内的旋转不变人脸检测方法、装置及存储介质

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
BAITING ZHAO等: "Multi-Scale Residual Fusion Network for Super-Resolution Reconstruction of Single Image", 《IEEE ACCESS 》 *
YINGJIE LIU等: "Small-Object Detection in UAV-Captured Images via Multi-Branch Parallel Feature Pyramid Networks", 《IEEE ACCESS》 *
王建新等: "基于深度学习的自然场景文本检测与识别综述", 《软件学报》 *
陈杰: "深度学习正则化技术研究及其在驾驶安全风险领域的应用", 《中国博士学位论文全文数据库 工程科技I辑》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112949520A (zh) * 2021-03-10 2021-06-11 华东师范大学 一种基于多尺度小样本的航拍车辆检测方法及检测系统
CN112949520B (zh) * 2021-03-10 2022-07-26 华东师范大学 一种基于多尺度小样本的航拍车辆检测方法及检测系统
CN112819110A (zh) * 2021-04-19 2021-05-18 中国科学院自动化研究所 基于权重生成的增量式小样本目标检测方法及系统
CN112819110B (zh) * 2021-04-19 2021-06-29 中国科学院自动化研究所 基于权重生成的增量式小样本目标检测方法及系统
CN113240039A (zh) * 2021-05-31 2021-08-10 西安电子科技大学 基于空间位置特征重加权的小样本目标检测方法及系统
CN113240039B (zh) * 2021-05-31 2023-08-15 西安电子科技大学 基于空间位置特征重加权的小样本目标检测方法及系统
CN113420642A (zh) * 2021-06-21 2021-09-21 西安电子科技大学 一种基于类别语义特征重加权的小样本目标检测方法及系统

Also Published As

Publication number Publication date
CN112464743B (zh) 2023-06-02

Similar Documents

Publication Publication Date Title
CN112464743A (zh) 一种基于多尺度特征加权的小样本目标检测方法
CN110188685B (zh) 一种基于双注意力多尺度级联网络的目标计数方法及系统
CN112396002B (zh) 一种基于SE-YOLOv3的轻量级遥感目标检测方法
CN112257794B (zh) 一种基于yolo的轻量级的目标检测方法
Golovko et al. Convolutional neural network based solar photovoltaic panel detection in satellite photos
CN113128558B (zh) 基于浅层空间特征融合与自适应通道筛选的目标检测方法
CN110738146A (zh) 一种目标重识别神经网络及其构建方法和应用
CN112036447B (zh) 零样本目标检测系统及可学习语义和固定语义融合方法
CN111639679A (zh) 一种基于多尺度度量学习的小样本学习方法
CN112507904B (zh) 一种基于多尺度特征的教室人体姿态实时检测方法
CN112784756B (zh) 人体识别跟踪方法
CN110751209A (zh) 一种融合深度图像分类和检索的智能台风定强方法
CN112329861B (zh) 一种面向移动机器人多目标检测的分层特征融合方法
CN112966659A (zh) 一种基于深度学习的视频图像小目标检测方法
Dai Real-time and accurate object detection on edge device with TensorFlow Lite
CN115601692A (zh) 数据处理方法、神经网络模型的训练方法及装置
CN113033547A (zh) 一种基于MobileNetV2的焊接状态分类方法
CN116090517A (zh) 模型训练方法、目标检测方法、装置以及可读存储介质
Yang et al. Xception-based general forensic method on small-size images
Lu et al. Tformer: A transmission-friendly vit model for iot devices
CN116958148B (zh) 输电线路关键部件缺陷的检测方法、装置、设备、介质
CN113205137A (zh) 一种基于胶囊参数优化的图像识别方法及系统
CN116151356A (zh) 一种优化卷积神经网络的方法、系统、设备及介质
CN117173449A (zh) 基于多尺度detr的航空发动机叶片缺陷检测方法
CN115100136B (zh) 基于YOLOv4-tiny模型的工件类别与位姿估计方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant