CN114119966A - 基于多视角学习与元学习的小样本目标检测方法 - Google Patents
基于多视角学习与元学习的小样本目标检测方法 Download PDFInfo
- Publication number
- CN114119966A CN114119966A CN202111453576.XA CN202111453576A CN114119966A CN 114119966 A CN114119966 A CN 114119966A CN 202111453576 A CN202111453576 A CN 202111453576A CN 114119966 A CN114119966 A CN 114119966A
- Authority
- CN
- China
- Prior art keywords
- small sample
- learning
- target detection
- view
- sample target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 87
- 238000012549 training Methods 0.000 claims abstract description 31
- 238000000034 method Methods 0.000 claims abstract description 29
- 230000006870 function Effects 0.000 claims abstract description 14
- 238000005070 sampling Methods 0.000 claims abstract description 14
- 238000011176 pooling Methods 0.000 claims description 14
- 238000012545 processing Methods 0.000 claims description 4
- 238000012546 transfer Methods 0.000 claims description 4
- 238000010276 construction Methods 0.000 claims description 3
- 230000000717 retained effect Effects 0.000 claims description 3
- 238000013508 migration Methods 0.000 abstract description 2
- 230000005012 migration Effects 0.000 abstract description 2
- 230000002401 inhibitory effect Effects 0.000 abstract 1
- 230000001737 promoting effect Effects 0.000 abstract 1
- 230000008569 process Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 2
- 230000008014 freezing Effects 0.000 description 2
- 238000007710 freezing Methods 0.000 description 2
- 230000001965 increasing effect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于多视角学习与元学习的小样本目标检测方法,包括:构建小样本目标检测模型;基于多视角学习的类间样本对采样法,采用类别平衡的原则,构建多视角数据集;基于高信度深层特征的特征对比学习法,选择出基础类别和小样本类别的高信度特征并构建损失函数,实现类内与类间的特征对比学习;基于元学习的模型参数训练法,分别计算基础类别与小样本类别损失值对应的梯度,并回传更新小样本目标检测模型的参数。本发明通过构建多视角数据集与使用基于元学习的模型参数训练法,在模型微调阶段根据多视角的迁移特征信息,做出促进或抑制模型学习的判断,有效地解决基础类别的特征遗忘问题与小样本类别的过拟合问题。
Description
技术领域
本发明属于图像处理的技术领域,具体涉及一种基于多视角学习与元学习的小样本目标检测方法。
背景技术
小样本目标检测技术旨在在样本量较少的情况下,从图像中检测出相应的物体,在海上救援、医学图像等领域都有重要的应用价值。由于训练神经网络所需的样本量是较多的,所以小样本目标检测的核心问题是如何将检测物体的共有特征迁移到小样本类别的物体上,使得模型快速适应小样本类别的特征并得到同等水平的检测结果。
随着深度学习的发展,小样本目标检测结果的检测精度(mAP)已经得到了很显著的提升。但是现有的方法在模型微调阶段出现了严重的特征遗忘问题,遗忘了之前在样本充足的类别(基础类别)上学到的特征。这是因为神经网络更倾向于记住当前训练的样本特征,当模型在医学图像等小样本类别上训练后,对之前检测效果很好的人、车等基础类别的检测能力会大幅下降,同时因为小样本的数据量较小,模型在微调过程中容易在极少的小样本数据集上出现过拟合问题。特征遗忘问题会使模型逐渐遗忘检测物体的共有特征,对小样本特征的迁移学习也有一定程度上的阻碍,导致模型在基础类别和小样本类别上都出现不同程度的精度下降。
发明内容
本发明的主要目的在于克服现有技术的缺点与不足,提供一种基于多视角学习与元学习的小样本目标检测方法,通过构建样本多视角数据集与使用基于元学习的模型参数训练法,在模型微调阶段提供多视角的迁移特征信息,并根据这些信息判断当前迁移学习的情况,采取促进迁移或抑制迁移的行动,有效地解决基础类别的特征遗忘问题与小样本类别的过拟合问题。
为了达到上述目的,本发明采用以下技术方案:
本发明提供了一种基于多视角学习与元学习的小样本目标检测方法,包括下述步骤:
构建小样本目标检测模型,采用两阶段训练方式的小样本目标检测模型作为目标检测器;所述的两阶段训练方式分为预训练阶段与模型微调阶段,所述预训练阶段与模型微调阶段所使用的训练集不同,预训练阶段使用所有基础类别样本,让模型在大量基础类别样本中学习到图像的普遍特征;在模型微调阶段,模型将学习到的基础类别样本的特征迁移至小样本类别的特征学习上;所述目标检测器包括主干网络、候选框提取器、候选框池化层、候选框特征卷积层、回归器、分类器和高信度特征对比学习器;
基于多视角学习的类间样本对采样法,采用类别平衡的原则,将基础类别数据集划分为多个基础类别子数据集,每个子数据集中的样本数目与小样本类别样本数相等,分别组合每个基础类别子数据集和小样本类别样本,得到多个组合后的单视角混合数据集,即多视角数据集。
基于高信度深层特征的特征对比学习法,在小样本目标检测模型微调阶段,将多视角数据集输入小样本目标检测模型,高信度特征对比学习器选择出基础类别和小样本类别的高信度特征,根据高信度特征之间的欧式距离构建损失函数,实现基础类别和小样本类别的类内与类间的特征对比学习;
基于元学习的模型参数训练法,在小样本目标检测模型微调阶段,将多视角数据集输入小样本目标检测模型,分别得到基础类别与小样本类别的损失值,计算损失值对应的梯度并回传更新小样本目标检测模型的参数。
作为优选的技术方案,所述预训练好的检测器采用两阶段检测器Faster-RCNN。
作为优选的技术方案,所述主干网络采用ResNet-101网络架构。
作为优选的技术方案,在构建小样本目标检测模型后,先使用基础类别数据集对小样本目标检测模型进行预训练,再用多视角数据集进行小样本目标检测模型微调操作。
作为优选的技术方案,所述基于多视角学习的类间样本对采样法,具体为:
多视角数据集D由基础类别数据集Dbase和小样本类别数据集Dnovel构成,分别表示为:
其中,分别表示第i个基础类别样本和第j个小样本类别样本,x表示样本,i,j表示样本编号,base,novel分别表示基础类别和小样本类别,N1,N分别表示基础类别样本总数和小样本类别样本总数,且N1>>N;
从基础类别和小样本类别中各采样不同的N个样本,得到M个基础类别的子数据集与1个小样本类别的数据集,将每个基础类别的子数据集与小样本类别数据集组合得到单视角的混合数据集,采样完成后得到M个视角的多视角数据集,采用Dall表示多视角数据集,表示为:
Dall={D1,D2,...,DM}
其中,Di表示第i个视角的混合数据集。
作为优选的技术方案,在小样本目标检测模型微调阶段,依次将多个单视角混合数据集放入网络进行训练。
作为优选的技术方案,所述根据高信度特征之间的欧式距离构建损失函数,具体为:
在小样本目标检测模型微调阶段,多视角数据集中的图像经过主干网络、候选框提取器、候选框池化层与候选框特征卷积层,得到N个候选框的特征编码,采用pi和yi分别表示第i个候选框的特征编码与真实标签,使用全连接层与L2正则化操作处理特征编码,得到第i个候选框的正则化特征编码
匹配候选框与真实物体,根据候选框与真实物体的重合程度,保留交并比大于0.7的高信度候选框正则化特征编码,交并比IOU表示为:
其中,d1和d2分别表示候选框的区域和真实物体的区域;
构建对比损失函数LC,具体表示为:
其中,ui表示第i个候选框与真实物体的IOU值,表示第k个候选框的正则化特征编码,表示第i个候选框的特征对比学习损失函数,τ是一个超参数,yi表示第i个候选框的真实标签,Nyi表示真实类别为yi的候选框总数,II{yi=yj}表示判断第i个候选框的真实标签和第j个候选框的真实标签是否相同的示性函数,相同取值为1,否则为0。
作为优选的技术方案,所述基于元学习的模型参数训练法,具体为:
在小样本目标检测模型微调阶段,多视角数据集通过主干网络、候选框池化层得到深层特征,进一步通过定位器、分类器与高信度特征对比学习器得到一个总损失值L;
根据候选框的真实类别,损失值L划分为基础类别的损失值Lbase和小样本类别的损失值Lnovel;先计算基础类别损失值Lbase的梯度并回传更新小样本目标检测模型的参数,再计算小样本类别损失值Lnovel的梯度并回传更新小样本目标检测模型的参数,参数更新公式具体为:
θi=θi-1+γ·(θi,2-θi-1)
其中,θi表示第i步迭代的小样本目标检测模型参数值,α和γ分别表示小样本目标检测模型参数学习率和参数变化量学习率,θi,1表示θi-1经过Lbase的梯度回传更新的小样本目标检测模型的参数,θi,2表示θi,1经过Lnovel的梯度回传更新的小样本目标检测模型的参数。
作为优选的技术方案,所述总损失值L表示为:
L=Lreg+Lcls+LC
其中,Lreg,Lcls分别表示回归器和分类器的损失值,LC表示高信度特征对比学习损失值。
作为优选的技术方案,在回传更新小样本目标检测模型的参数时,冻结主干网络和候选框池化层的所有参数,保留小样本目标检测模型所提取的特征分布。
本发明与现有技术相比,具有如下优点和有益效果:
1、本发明基于多视角学习的类间样本对采样法,构建了一个类别平衡且样本量更充足的多视角数据集,缓解了小样本目标检测模型在基础类别上的特征遗忘问题,为小样本类别的特征提供了多视角的对比学习机会。
2、本发明通过高信度特征对比学习与基于元学习策略的参数学习法,进一步加强了多视角数据集的对比学习能力,通过冻结主干网络与候选框池化层参数和交替回传梯度更新参数的方式,保留了大量基础类别的特征,并在微调阶段考虑小样本类别回传梯度对模型特征的影响,对应地选择增强参数更新或抑制模型参数更新,缓解基础类别特征的遗忘问题与小样本类别的过拟合问题。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例基于多视角学习与元学习的小样本目标检测方法的流程图;
图2为本发明实施例基于元学习的模型参数更新流程图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在本申请中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本申请所描述的实施例可以与其它实施例相结合。
如图1所示,本申请的一个实施例中提供了一种基于多视角学习与元学习的小样本目标检测方法,包括下述步骤:
S1、构建小样本目标检测模型,采用两阶段训练方式的小样本目标检测模型作为目标检测器;所述的两阶段训练方式分为预训练阶段与模型微调阶段,所述预训练阶段与模型微调阶段所使用的训练集不同,预训练阶段使用所有基础类别样本,让模型在大量基础类别样本中学习到图像的普遍特征;在模型微调阶段,模型将学习到的基础类别样本的特征迁移至小样本类别的特征学习上,包括主干网络、候选框提取器、候选框池化层、候选框特征卷积层、回归器、分类器和高信度特征对比学习器;
构建小样本目标检测模型后,先使用基础类别数据集对小样本目标检测模型进行预训练,再用多视角数据集进行小样本目标检测模型微调操作。
本实施例中,预训练好的检测器采用两阶段检测器Faster-RCNN,主干网络采用ResNet-101网络;
S2、基于多视角学习的类间样本对采样法,用于增加大量的基础类别特征,为后续的特征对比学习提供了多视角的信息;采用类别平衡的原则,将数量充足的基础类别数据集划分为多个基础类别子数据集,每个子数据集的样本数目与小样本类别样本数相等,分别组合每个基础类别子数据集和小样本类别样本,得到多个组合后的单视角混合数据集,这些数据集的集合称为多视角数据集,具体为:
多视角数据集D由基础类别数据集Dbase和小样本类别数据集Dnovel构成,分别表示为:
其中,分别表示第i个基础类别样本和第j个小样本类别样本,x表示样本,i,j表示样本编号,base,hovel分别表示基础类别和小样本类别,N1,N分别表示基础类别样本总数和小样本类别样本总数,在小样本目标检测任务中,N1远大于N;
采用和分别表示第i个基础类别和第j个小样本类别,C表示类别,从基础类别和小样本类别中采样不同的N个样本,得到M个基础类别的子数据集与1个小样本类别的数据集,将每个基础类别的子数据集与小样本类别数据集组合组成单视角的混合数据集,采样完成后得到M个视角的多视角数据集,采用Dall表示多视角数据集,则多视角数据集Dall表示为:
Dall={D1,D2,...,DM}
其中,Di表示第i个视角的混合数据集。
在本实施例中,在小样本目标检测模型微调阶段依次将多个单视角混合数据集输入网络进行训练。
S3、基于高信度深层特征的特征对比学习法,用于进一步学习特征空间分布,加强多视角数据集的特征对比学习能力;高信度特征对比学习器选择出基础类别和小样本类别的高信度特征,根据高信度特征之间的欧式距离构建损失函数,实现基础类别和小样本类别的类内与类间的特征对比学习,具体为:
在模型微调阶段,多视角数据集图像经过主干网络、候选框提取器、候选框池化层与候选框特征卷积层,得到N个候选框的1024维特征编码,采用pi和yi分别表示第i个候选框的特征编码与真实标签,使用全连接层与L2正则化操作处理特征编码,得到第i个候选框的128维正则化特征编码进一步降低特征维度并且使得特征分布更集中;
匹配候选框与真实物体,根据候选框与真实物体的重合程度,保留交并比大于0.7的高信度候选框正则化特征编码,交并比IOU定义为:
其中,d1和d2分别表示候选框的区域和真实物体的区域;
构建对比损失函数LC,具体表示为:
其中,ui表示第i个候选框与真实物体的IOU值,表示第k个候选框的正则化特征编码,表示第i个候选框的特征对比学习损失函数,τ是一个超参数,在本实施例中取值为0.2,yi表示第i个候选框的真实标签,Nyi表示真实类别为yi的候选框总数,II{yi=yj}表示判断第i个候选框的真实标签和第j个候选框的真实标签是否相同的示性函数,相同取值为1,否则取值为0。
本实施例中,根据候选框特征与真实物体的重合程度选出高信度的候选框特征,更能反应该类别的特征,使用特征对比学习的方法增大不同类别的特征距离,缩小相同类别的特征距离,为小样本特征提供了多视角的对比学习信息,缓解了因样本量不足所导致的小样本类别过拟合问题。
S4、基于元学习的模型参数训练法,用于缓解小样本目标检测模型在微调过程中出现的特征遗忘问题;根据当前模型的学习方向,判断当前模型需要加强或抑制迁移学习能力,具体为:
如图2所示,在模型微调阶段,多视角数据集通过主干网络、候选框池化层得到深层特征,进一步通过定位器、分类器与高信度特征对比学习器得到一个总损失值L,计算方法为:
L=Lreg+Lcls+LC
采用Lreg,Lcls分别表示回归器和分类器的损失值。
根据候选框的真实类别,损失值L可被划分为基础类别的损失值Lbase和小样本类别的损失值Lnovel;先计算基础类别损失值Lbase的梯度并回传更新小样本目标检测模型的参数,再计算小样本类别损失值Lnovel的梯度并回传更新小样本目标检测模型的参数,在参数更新过程中,冻结主干网络和候选框池化层的所有参数,保留模型所提取的特征分布是相对稳定的,参数更新公式具体为:
θi=θi-1+γ·(θi,2-θi-1)
其中,θi表示第i步迭代的小样本目标检测模型参数值,α和γ分别表示小样本目标检测模型参数学习率和参数变化量学习率,θi,1表示θi-1经过Lbase的梯度回传更新的小样本目标检测模型的参数,θi,2表示θi,1经过Lnovel的梯度回传更新的小样本目标检测模型的参数。本实施例中,α和γ分别设置为0.002和1。
本实施例中,Lreg,Lcls,LC均可以根据候选框的真实类别划分为基础类别部分的损失值和小样本类别部分的损失值,可表示为:
本发明基于多视角学习与元学习的小样本目标检测方法,使用类间样本对采样法构建一个类别平衡的多视角数据集,输入小样本目标检测模型中进行模型微调操作,为小样本类别的特征提供了多视角的对比学习机会;输入的多视角数据集图像经过主干网络,从主干网络第四卷积组输出图像的特征图;然后通过候选框提取器进行锚点的二分类和回归定位得到一系列候选框,再经过候选框特征卷积层,输入分类器、回归器与高信度特征对比学习器计算损失值,最后将总损失值分为基础类别损失值和小样本类别损失值,进一步加强了多视角数据集的对比学习能力;在冻结主干网络和候选框池化层的情况下,先后回传基础类别和小样本类别的梯度并更新小样本目标检测模型的参数,有效的解决基础类别的特征遗忘问题与小样本类别的过拟合问题。
需要说明的是,对于前述的各方法实施例,为了简便描述,将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其它顺序或者同时进行。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
Claims (10)
1.基于多视角学习与元学习的小样本目标检测方法,其特征在于,包括下述步骤:
构建小样本目标检测模型,采用两阶段训练方式的小样本目标检测模型作为目标检测器;所述的两阶段训练方式分为预训练阶段与模型微调阶段,所述预训练阶段与模型微调阶段所使用的训练集不同,预训练阶段使用所有基础类别样本,让模型在大量基础类别样本中学习到图像的普遍特征;在模型微调阶段,模型将学习到的基础类别样本的特征迁移至小样本类别的特征学习上;所述目标检测器包括主干网络、候选框提取器、候选框池化层、候选框特征卷积层、回归器、分类器和高信度特征对比学习器;
基于多视角学习的类间样本对采样法,采用类别平衡的原则,将基础类别数据集划分为多个基础类别子数据集,每个子数据集中的样本数目与小样本类别样本数相等,分别组合每个基础类别子数据集和小样本类别样本,得到多个组合后的单视角混合数据集,即多视角数据集。
基于高信度深层特征的特征对比学习法,在小样本目标检测模型微调阶段,将多视角数据集输入小样本目标检测模型,高信度特征对比学习器选择出基础类别和小样本类别的高信度特征,根据高信度特征之间的欧式距离构建损失函数,实现基础类别和小样本类别的类内与类间的特征对比学习;
基于元学习的模型参数训练法,在小样本目标检测模型微调阶段,将多视角数据集输入小样本目标检测模型,分别得到基础类别与小样本类别的损失值,计算损失值对应的梯度并回传更新小样本目标检测模型的参数。
2.根据权利要求1所述基于多视角学习与元学习的小样本目标检测方法,其特征在于,所述预训练好的检测器采用两阶段检测器Faster-RCNN。
3.根据权利要求1所述基于多视角学习与元学习的小样本目标检测方法,其特征在于,所述主干网络采用ResNet-101网络架构。
4.根据权利要求1所述的基于样本多视角学习与元学习的小样本目标检测方法,其特征在于,在构建小样本目标检测模型后,先使用基础类别数据集对小样本目标检测模型进行预训练,再用多视角数据集进行小样本目标检测模型微调操作。
5.根据权利要求1所述基于多视角学习与元学习的小样本目标检测方法,其特征在于,所述基于多视角学习的类间样本对采样法,具体为:
多视角数据集D由基础类别数据集Dbase和小样本类别数据集Dnovel构成,分别表示为:
其中,分别表示第i个基础类别样本和第j个小样本类别样本,x表示样本,i,j表示样本编号,base,hovel分别表示基础类别和小样本类别,N1,N分别表示基础类别样本总数和小样本类别样本总数,且N1>>N;
从基础类别和小样本类别中各采样不同的N个样本,得到M个基础类别的子数据集与1个小样本类别的数据集,将每个基础类别的子数据集与小样本类别数据集组合得到单视角的混合数据集,采样完成后得到M个视角的多视角数据集,采用Dall表示多视角数据集,表示为:
Dall={D1,D2,...,DM}
其中,Di表示第i个视角的混合数据集。
6.根据权利要求5所述基于多视角学习与元学习的小样本目标检测方法,其特征在于,在小样本目标检测模型微调阶段,依次将多个单视角混合数据集放入网络进行训练。
7.根据权利要求1所述基于多视角学习与元学习的小样本目标检测方法,其特征在于,所述根据高信度特征之间的欧式距离构建损失函数,具体为:
在小样本目标检测模型微调阶段,多视角数据集中的图像经过主干网络、候选框提取器、候选框池化层与候选框特征卷积层,得到N个候选框的特征编码,采用pi和yi分别表示第i个候选框的特征编码与真实标签,使用全连接层与L2正则化操作处理特征编码,得到第i个候选框的正则化特征编码
匹配候选框与真实物体,根据候选框与真实物体的重合程度,保留交并比大于0.7的高信度候选框正则化特征编码,交并比IOU表示为:
其中,d1和d2分别表示候选框的区域和真实物体的区域;
构建对比损失函数LC,具体表示为:
8.根据权利要求1所述基于多视角学习与元学习的小样本目标检测方法,其特征在于,所述基于元学习的模型参数训练法,具体为:
在小样本目标检测模型微调阶段,多视角数据集通过主干网络、候选框池化层得到深层特征,进一步通过定位器、分类器与高信度特征对比学习器得到一个总损失值L;
根据候选框的真实类别,损失值L划分为基础类别的损失值Lbase和小样本类别的损失值Lnovel;先计算基础类别损失值Lbase的梯度并回传更新小样本目标检测模型的参数,再计算小样本类别损失值Lnovel的梯度并回传更新小样本目标检测模型的参数,参数更新公式具体为:
θi=θi-1+γ·(θi,2-θi-1)
其中,θi表示第i步迭代的小样本目标检测模型参数值,α和γ分别表示小样本目标检测模型参数学习率和参数变化量学习率,θi,1表示θi-1经过Lbase的梯度回传更新的小样本目标检测模型的参数,θi,2表示θi,1经过Lnovel的梯度回传更新的小样本目标检测模型的参数。
9.根据权利要求8所述基于多视角学习与元学习的小样本目标检测方法,其特征在于,所述总损失值L表示为:
L=Lreg+Lcls+LC
其中,Lreg,Lcls分别表示回归器和分类器的损失值,LC表示高信度特征对比学习损失值。
10.根据权利要求1或8所述基于多视角学习与元学习的小样本目标检测方法,其特征在于,在回传更新小样本目标检测模型的参数时,冻结主干网络和候选框池化层的所有参数,保留小样本目标检测模型所提取的特征分布。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111453576.XA CN114119966A (zh) | 2021-12-01 | 2021-12-01 | 基于多视角学习与元学习的小样本目标检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111453576.XA CN114119966A (zh) | 2021-12-01 | 2021-12-01 | 基于多视角学习与元学习的小样本目标检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114119966A true CN114119966A (zh) | 2022-03-01 |
Family
ID=80369221
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111453576.XA Pending CN114119966A (zh) | 2021-12-01 | 2021-12-01 | 基于多视角学习与元学习的小样本目标检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114119966A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114841257A (zh) * | 2022-04-21 | 2022-08-02 | 北京交通大学 | 一种基于自监督对比约束下的小样本目标检测方法 |
CN115392359A (zh) * | 2022-08-11 | 2022-11-25 | 广州里工实业有限公司 | 一种缺陷检测方法、系统、装置及存储介质 |
CN115409124A (zh) * | 2022-09-19 | 2022-11-29 | 小语智能信息科技(云南)有限公司 | 基于微调原型网络的小样本敏感信息识别方法 |
-
2021
- 2021-12-01 CN CN202111453576.XA patent/CN114119966A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114841257A (zh) * | 2022-04-21 | 2022-08-02 | 北京交通大学 | 一种基于自监督对比约束下的小样本目标检测方法 |
CN114841257B (zh) * | 2022-04-21 | 2023-09-22 | 北京交通大学 | 一种基于自监督对比约束下的小样本目标检测方法 |
CN115392359A (zh) * | 2022-08-11 | 2022-11-25 | 广州里工实业有限公司 | 一种缺陷检测方法、系统、装置及存储介质 |
CN115409124A (zh) * | 2022-09-19 | 2022-11-29 | 小语智能信息科技(云南)有限公司 | 基于微调原型网络的小样本敏感信息识别方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113378632B (zh) | 一种基于伪标签优化的无监督域适应行人重识别方法 | |
CN112734696B (zh) | 基于多域特征融合的换脸视频篡改检测方法及系统 | |
CN114119966A (zh) | 基于多视角学习与元学习的小样本目标检测方法 | |
CN108537264B (zh) | 基于深度学习的异源图像匹配方法 | |
CN108427921A (zh) | 一种基于卷积神经网络的人脸识别方法 | |
CN107480261A (zh) | 一种基于深度学习细粒度人脸图像快速检索方法 | |
CN104866810A (zh) | 一种深度卷积神经网络的人脸识别方法 | |
CN105138973A (zh) | 人脸认证的方法和装置 | |
CN109598220A (zh) | 一种基于多元输入多尺度卷积的人数统计方法 | |
CN113032613B (zh) | 一种基于交互注意力卷积神经网络的三维模型检索方法 | |
WO2024032010A1 (zh) | 一种基于迁移学习策略的少样本目标实时检测方法 | |
CN112270285B (zh) | 一种基于稀疏表示和胶囊网络的sar图像变化检测方法 | |
CN115761735A (zh) | 一种基于自适应伪标签纠正的半监督语义分割方法 | |
CN111144462B (zh) | 一种雷达信号的未知个体识别方法及装置 | |
CN114926742B (zh) | 一种基于二阶注意力机制的回环检测及优化方法 | |
CN114913498A (zh) | 一种基于关键点估计的并行多尺度特征聚合车道线检测方法 | |
CN114692732A (zh) | 一种在线标签更新的方法、系统、装置及存储介质 | |
CN112883931A (zh) | 基于长短期记忆网络的实时真假运动判断方法 | |
CN117372898A (zh) | 一种基于改进yolov8的无人机航拍图像目标检测方法 | |
CN113205103A (zh) | 一种轻量级的文身检测方法 | |
CN116189139A (zh) | 一种基于Transformer的交通标志检测方法 | |
CN114612658A (zh) | 基于双重类别级对抗网络的图像语义分割方法 | |
CN118279320A (zh) | 基于自动提示学习的目标实例分割模型建立方法及其应用 | |
CN117830616A (zh) | 基于渐进式伪标签的遥感图像无监督跨域目标检测方法 | |
CN111582057B (zh) | 一种基于局部感受野的人脸验证方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |