CN112329827A - 一种基于元学习的增量小样本目标检测方法 - Google Patents

一种基于元学习的增量小样本目标检测方法 Download PDF

Info

Publication number
CN112329827A
CN112329827A CN202011154301.1A CN202011154301A CN112329827A CN 112329827 A CN112329827 A CN 112329827A CN 202011154301 A CN202011154301 A CN 202011154301A CN 112329827 A CN112329827 A CN 112329827A
Authority
CN
China
Prior art keywords
target
meta
learning
size
diagram
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011154301.1A
Other languages
English (en)
Other versions
CN112329827B (zh
Inventor
王瀚漓
程孟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tongji University
Original Assignee
Tongji University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tongji University filed Critical Tongji University
Priority to CN202011154301.1A priority Critical patent/CN112329827B/zh
Publication of CN112329827A publication Critical patent/CN112329827A/zh
Application granted granted Critical
Publication of CN112329827B publication Critical patent/CN112329827B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Image Analysis (AREA)
  • Electrically Operated Instructional Devices (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于元学习的增量小样本目标检测方法,包括以下步骤:1)构建增量小样本目标检测模型,该模型包括特征提取器、目标定位器以及元学习器;2)对增量小样本目标检测模型进行训练;3)根据训练好的增量小样本目标检测模型进行新目标定位和分类。与现有技术相比,本发明具有样本需求少、克服遗忘、保护数据隐私等优点。

Description

一种基于元学习的增量小样本目标检测方法
技术领域
本发明涉及目标检测领域,尤其是涉及一种基于元学习的增量小样本目标检测方法。
背景技术
目前,基于卷积神经网络的目标检测方法取得了重大进展,其中一个非常重要的原因在于拥有充足的经过人工标注的数据。但是,人类具备而传统目标检测器不具备的一个能力就是根据少量数据进行快速学习的能力,因此,需要一种采用元学习的训练方式,使得目标检测器能够从充足的基础类别的数据中学习到一种模式,使得该目标检测器能够根据少量的新类别的数据学习到识别新类别物体的能力。
现阶段有效的小样本目标检测方法可以分为以下两个类别:
(1)基于度量学习的小样本目标检测方法:通过度量支持集(support set)中的图像与查询集(query set)中的图像之间的距离来识别检测框的类别;
(2)基于权重生成的小样本目标检测方法:通过学习生成模型中某些层的权重,使得模型能够通过少量新类别的样本学习到对新类别的检测能力。
然而这些方法要求目标检测器在学习识别新的类别时,不仅要使用新类别的样本,还需要使用基础类别的样本,这造成了训练时间开销问题以及基础类别数据的存储和隐私问题。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于元学习的增量小样本目标检测方法。
本发明的目的可以通过以下技术方案来实现:
一种基于元学习的增量小样本目标检测方法,用以使得目标检测器增量地学习到在新类别上的检测能力,包括以下步骤:
1)构建增量小样本目标检测模型,该模型包括特征提取器、目标定位器以及元学习器;
2)对增量小样本目标检测模型进行训练;
3)根据训练好的增量小样本目标检测模型进行新目标定位和分类。
所述的步骤1)中,特征提取器用以将经过数据增强后的图像作为输入,提取该图像的抽象特征,所述的目标定位器以特征提取器的抽象特征为输入,包含三个并行的工作端,即热力图端、尺寸端和补偿端,并分别输出热力图、尺寸图和补偿图,所述的元学习器用以实现元学习。
所述的热力图为
Figure BDA0002742251850000021
大小的张量,包含图像中可能包含物体的位置、物体的类别以及置信度信息,所述的尺寸图为
Figure BDA0002742251850000022
大小的张量,包含抽象特征上每一个点对应目标的尺寸信息,所述的补偿图为
Figure BDA0002742251850000023
大小的张量,包含抽象特征上每一个点对应的目标中心的偏移值信息。
所述的增量小样本目标检测模型根据热力图、尺寸图和补偿图中的信息进行解码获得图像中的物体定位和分类信息,具体为:
若热力图中点的值不小于该点周围8个点的值,则判定其为热点,据此获取热力图中的所有热点,热点决定了预测目标框的中心在图像中的坐标和类别;
根据热点在热力图上的坐标分别对应其在尺寸图和补偿图中的相应位置,据此获取预测目标框的尺寸和预测目标框中心的偏移值;
解码得到目标的位置和大小,预测目标框用公式表示为:
Figure BDA0002742251850000024
其中,
Figure BDA0002742251850000025
Figure BDA0002742251850000026
分别为热点的坐标,
Figure BDA0002742251850000027
Figure BDA0002742251850000028
分别为热点所对应的目标尺寸,
Figure BDA0002742251850000029
Figure BDA00027422518500000210
分别为热点所对应目标中心的偏移值。
所述的步骤2)包括基础训练阶段、元学习阶段和小样本微调阶段。
所述的基础训练阶段具体包括以下步骤:
201)对于每一张包含基础类别的图像,仅保留图像中基础类别目标框的标注;将图像经数据增强后,作为特征提取器的输入并输出抽象特征;
202)将抽象特征分别作为目标定位器中热力图端、尺寸端和补偿端的输入,输出热力图、尺寸图和补偿图,其中,热力图端采用Focal Loss作为损失函数,尺寸端和补偿端均使用L1损失函数作为损失函数,三个工作端的损失函数按照比例(超参数)进行加和作为整个模型的总检测损失并进行反向传播调整模型的参数;
203)在后续的元学习阶段和小样本微调阶段中,在基础训练阶段得到的特征提取器的参数以及目标定位器中的热力图端对应于基础类别的滤波器参数不再调整。
所述的元学习阶段具体包括以下步骤:
211)将包含基础类别的图像重新组织为多个不同的任务,每一个任务均包含一个支持集和一个测试集,其中,支持集和测试集中分别包含K个相同类别的物体图像,一个任务作为元学习器的一个样本,任务i中包含的2K张图像经过特征提取器得到K个支持特征fi s={fi,1,fi,2,…,fi,K}以及K个查询特征fi q={fi,K+1,fi,K+2,…,fi,2K},并将目标定位器的权重初始化为元学习器的权重;
212)将支持特征fi s={fi,1,fi,2,…,fi,K}经过目标定位器输出对应的热力图
Figure BDA0002742251850000031
尺寸图
Figure BDA0002742251850000032
和补偿图
Figure BDA0002742251850000033
后,计算总检测损失并反向传播对应的损失更新目标定位器的权重,获取目标定位器的一个中间状态;
213)将查询特征fi q={fi,K+1,fi,K+2,…,fi,2K}输入到处于中间状态的目标定位器中,输出对应的热力图、尺寸图和补偿图,计算总检测损失并反向传播更新元学习器的参数。
所述的步骤212)中,获取目标定位器的一个中间状态,具体表示为:
Figure BDA0002742251850000034
其中,w为目标定位器的参数,w′为目标定位器中间状态的参数,δ为学习率,
Figure BDA0002742251850000035
为目标定位器的总损失函数,
Figure BDA0002742251850000036
为以支持特征作为目标定位器的输入所产生的总损失对目标定位器参数w的梯度。
所述的步骤213)中,元学习器的目标函数表达式为:
Figure BDA0002742251850000037
其中,
Figure BDA0002742251850000038
表示第i个任务,
Figure BDA0002742251850000039
为任务的分布,
Figure BDA00027422518500000310
为在经过支持特征作为输入并更新目标定位器参数后,再由查询特征作为更新后的目标定位器的输入所产生的总损失。
所述的小样本微调阶段具体为:
在基础训练阶段和元学习阶段结束后,此时,增量小样本目标检测模型处于一个能够快速拟合少量新类别样本的状态,当少量新类别样本出现时,该模型在不使用任何基础类别样本进行平衡的情况下快速拟合新类别的样本,拟合得到的模型保持在基础类别上的检测性能,同时在新类别的物体上也具备检测能力。
与现有技术相比,本发明具有以下优点:
一、样本需求少:本发明提出采用基础样本训练模型,使模型处于能够快速拟合少量样本的初始状态,在提供少量新类别样本的情况下,使得模型能够对新类别具备一定地检测能力。
二、克服遗忘:本发明目标定位器中与基础类别的热图相关联的滤波器参数来自训练的第一阶段,并且在微调过程中不改变对应的参数,使得检测器在使用新类别的少量样本微调时,最大程度维持在基础类别上的检测效果,同时在新类别上具备一定地检测能力。
三、保护数据隐私:本发明在微调过程中,仅需要考虑新类别的少量样本,而无需重新使用基础类别的数据,在实际应用过程中,可以起到数据隐私保护的作用。
附图说明
图1为增量小样本目标检测模型示意图。
图2为增量小样本目标检测模型训练第二阶段原理图。
图3为目标定位器中热力图端细节示意图。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
如图1所示,本发明提出一种基于元学习的增量小样本目标检测方法,包括以下步骤:
1)特征提取步骤:给定初始图像,经过随机裁剪、翻转等数据增强方式并进行归一化操作以后,作为特征提取器的输入提取图像的抽象特征;
2)目标定位步骤:目标定位包含三个并行的工作端,分别是热力图端、尺寸端和补偿端。三个工作端都以图像的抽象特征作为输入,分别输出热力图、尺寸图和补偿图,其中,热力图是
Figure BDA0002742251850000051
大小的张量,H是图像的高度,W是图像的宽度,R是特征提取器的第一层至最后一层的总步长,C是目标类别总数,热力图中包含了图像中可能包含的物体的位置、物体的类别以及置信度信息;尺寸图和补偿图都是
Figure BDA0002742251850000052
大小的张量,尺寸图中包含了特征图上每一个点对应的目标的尺寸信息,补偿图包含了特征图上每一个点对应的目标中心的偏移值信息。
根据热力图、尺寸图和补偿图中的信息,可以解码出图像中的目标定位和分类结果,具体解码过程为:
首先,将热力图中的所有的“热点”(若热力图中的某个点的值大于等于其四周的8个点的值,则该点是一个“热点”),为所有候选的“热点”数量设置一个上限k(在本实施例中,k设置为50),若“热点”数量大于k,则取最大的k个“热点”作为该热力图的“热点”集合,反之,取所有“热点”作为“热点”集合。“热点”在热力图中的坐标决定了预测目标框的中心在图像中的坐标和类别,同时“热点”在热力图上的坐标在尺寸图和补偿图中的相应位置可以获取到预测目标框的尺寸和预测目标框中心的偏移值。由此可以解码出目标的位置和大小,预测目标框的位置和范围可以用公式表示为:
Figure BDA0002742251850000053
其中,
Figure BDA0002742251850000054
Figure BDA0002742251850000055
分别表示“热点”坐标,
Figure BDA0002742251850000056
Figure BDA0002742251850000057
分别表示“热点”所对应的目标的尺寸,
Figure BDA0002742251850000058
Figure BDA0002742251850000059
分别表示“热点”所对应的目标中心的偏移值。
整个模型的训练包括基础训练阶段、元学习阶段和小样本微调阶段,在本实施例中,训练过程如下:
(1)基础训练阶段:对于每一张包含基础类别的图像,仅保留图像中基础类别目标框的标注,将目标框中心位置作为高斯核(Gaussian kernel)可以得到热力图的真实值;根据目标中心点位置以及目标框的尺寸信息可以得到尺寸图的真实值;根据目标框中心点位置以及离散误差可以得到补偿图的真实值。
初始图像经过随机裁剪、随机翻转等数据增强后,作为特征提取器的输入并输出抽象特征;随后,抽象特征分别作为目标定位器中热力图端、尺寸端和补偿端的输入,输出热力图、尺寸图和补偿图,热力图端使用Focal Loss作为损失函数,而尺寸端和补偿端均使用L1损失函数作为损失函数,三个工作端的损失的加和作为整个模型的损失并进行反向传播调整模型的参数。
基础训练阶段的主要目的是得到特征提取器的参数,而在后续训练和微调过程中,特征提取器的参数将不再调整。此外,在基础训练阶段得到的目标定位器中的热力图端的对应于基础类别的滤波器的参数最终也将保留,如图3所示。
(2)元学习阶段:元学习阶段的过程如图2所示。将基础类别的数据重新组织为大量不同的任务,每一个任务包含一个支持集和一个测试集,其中支持集和测试集中分别包含K个相同类别的物体的图像,一个任务作为元学习的一个样本,一个任务中的2K张图像经过特征提取器得到K个支持特征fi s={fi,1,fi,2,…,fi,K}和K个查询特征fi q={fi,K+1,fi,K+2,…,fi,2K},而元学习过程包括以下三个步骤:
(i)将目标定位器的权重初始化为元学习器的权重;
(ii)支持特征fi s={fi,1,fi,2,…,fi,K}经过目标定位器输出对应的热力图
Figure BDA0002742251850000061
尺寸图
Figure BDA0002742251850000062
和补偿图
Figure BDA0002742251850000063
计算模型的检测损失并反向传播对应的损失更新目标定位器权重,获取一个中间状态,计算公式如下:
Figure BDA0002742251850000064
其中,w表示目标定位器的参数,w′是目标定位器中间状态的参数,δ是学习率,
Figure BDA0002742251850000065
是检测损失函数;
(iii)将查询特征fi q={fi,K+1,fi,K+2,…,fi,2K}再输入到处于中间状态的目标定位器,输出热力图、尺寸图和补偿图,计算模型的损失并反向传播更新元学习器的参数。
综上所述,元学习器的目标函数用公式表达为:
Figure BDA0002742251850000066
(3)小样本微调阶段:在基础训练阶段和元学习阶段结束以后,模型处于一个可以快速拟合少量新类别的样本的状态。当少量的新类别的样本出现时,模型可以在不使用任何基础类别样本进行平衡的情况下快速拟合新类别的样本,拟合得到模型可以保持在基础类别上的检测性能,同时在新类别的物体上具备一定的检测能力。
为了验证上述方法的性能,设计了以下实验。
本方法以ResNet-50作为主干,在两个目标检测基准数据集(MS COCO和PASCALVOC)上进行了实验验证。PSCAL VOC数据集只有20个类的物体,而MS COCO数据集有80个类的物体,其中60个类作为基础类别,而另外20个与PSCAL VOC数据集重合的类别作为新类别。在训练特征提取器时,MS COCO数据集中所有包含基础类别的图像都会被采用,其中若包含新类别的图像,则将新类别的标注去除。在训练元学习器时,所有的基础类别数据将被重新组织为充足的任务作为样本。对于每一个任务,其支持集包含K个随机采用的同一个类别的样本(K=1,5或10),而查询集包含与支持集相同类别的样本若干。在微调阶段,每一个新类别随机采样K个样本(K=1,5或10),然后用这些样本微调模型,使模型快速拟合。
在MS COCO数据集上,本方法考虑了在K=1,5或10的情况下模型分别在基础类别、新类别和全部类别下的表现。评价指标使用平均精度(mAP)和平均召回率(mAR)。结果如表1所示。可以看出,本方法在基础类别和全部类别上的效果均大幅度超过当前最好的方法(ONCE)。同时,本方法在新类别上的表现也同样具有竞争力。
表1 MS COCO数据集上的增量小样本目标检测方法性能比较
Figure BDA0002742251850000071
在PSCAL VOC数据集上,本方法考虑了交叉数据集(cross-dataset)设置,即使用MS COCO数据集中的基础类别数据进行训练,使用PSCAL VOC数据集中抽样的少量新类别的数据进行微调。实验结果如表2所示。从结果可以看出,本方法在PASCAL VOC数据集上的表现均超过了基准方法(Fine-Tuning)和目前最好的方法(ONCE)。
表2 PASCAL VOC数据集上增量小样本目标检测迁移性能比较
Figure BDA0002742251850000081
为了验证所提出方法的有效性,另外设计了两组消融实验。
为评估不同主干(ResNet-50、ResNet-101和DLA-34)对本方法的影响,在MS COCO数据集上分别采用三种不同的主干测试了K=1,5或10的情况下,模型在基础类别、新类别和所有类别下的性能。结果如表3所示。从结果可以看出,更好的主干可以提供更加泛化的特征,从而提升模型的效果。
表3 MS COCO数据集上的主干消融实验结果
Figure BDA0002742251850000082
Figure BDA0002742251850000091
为评估元学习器和微调策略对模型的影响,在MS COCO数据集上测试了基础模型(BM)、基础模型加上元学习器(BM+ML)以及本方法的对照实验,结果如表4所示。从结果可以看出,加入元学习器可以使模型有效提升模型对新类别的检测能力,但不能克服遗忘,即在基础类别上的检测性能显著出现显著下降。而本方法即可以克服遗忘,又可以有效提升在新类别上的表现。
表4 MS COCO数据集上的训练策略消融实验结果
Figure BDA0002742251850000092
实验可以证实,在两种目标检测基准数据集上,本发明提出的增量小样本目标检测方法具有样本需求少、克服遗忘以及数据隐私保护妥善等优点。在目前已知的先进增量小样本目标检测方法中,本方法具有较强的优势和应用前景。
以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术人员无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。

Claims (10)

1.一种基于元学习的增量小样本目标检测方法,用以使得目标检测器增量地学习到在新类别上的检测能力,其特征在于,包括以下步骤:
1)构建增量小样本目标检测模型,该模型包括特征提取器、目标定位器以及元学习器;
2)对增量小样本目标检测模型进行训练;
3)根据训练好的增量小样本目标检测模型进行新目标定位和分类。
2.根据权利要求1所述的一种基于元学习的增量小样本目标检测方法,其特征在于,所述的步骤1)中,特征提取器用以将经过数据增强后的图像作为输入,提取该图像的抽象特征,所述的目标定位器以特征提取器的抽象特征为输入,包含三个并行的工作端,即热力图端、尺寸端和补偿端,并分别输出热力图、尺寸图和补偿图,所述的元学习器用以实现元学习。
3.根据权利要求2所述的一种基于元学习的增量小样本目标检测方法,其特征在于,所述的热力图为
Figure FDA0002742251840000011
大小的张量,包含图像中可能包含物体的位置、物体的类别以及置信度信息,所述的尺寸图为
Figure FDA0002742251840000012
大小的张量,包含抽象特征上每一个点对应目标的尺寸信息,所述的补偿图为
Figure FDA0002742251840000013
大小的张量,包含抽象特征上每一个点对应的目标中心的偏移值信息。
4.根据权利要求3所述的一种基于元学习的增量小样本目标检测方法,其特征在于,所述的增量小样本目标检测模型根据热力图、尺寸图和补偿图中的信息进行解码获得图像中的物体定位和分类信息,具体为:
若热力图中点的值不小于该点周围8个点的值,则判定其为热点,据此获取热力图中的所有热点,热点决定了预测目标框的中心在图像中的坐标和类别;
根据热点在热力图上的坐标分别对应其在尺寸图和补偿图中的相应位置,据此获取预测目标框的尺寸和预测目标框中心的偏移值;
解码得到目标的位置和大小,预测目标框用公式表示为:
Figure FDA0002742251840000014
其中,
Figure FDA0002742251840000021
Figure FDA0002742251840000022
分别为热点的坐标,
Figure FDA0002742251840000023
Figure FDA0002742251840000024
分别为热点所对应的目标尺寸,
Figure FDA0002742251840000025
Figure FDA0002742251840000026
分别为热点所对应目标中心的偏移值。
5.根据权利要求1所述的一种基于元学习的增量小样本目标检测方法,其特征在于,所述的步骤2)包括基础训练阶段、元学习阶段和小样本微调阶段。
6.根据权利要求5所述的一种基于元学习的增量小样本目标检测方法,其特征在于,所述的基础训练阶段具体包括以下步骤:
201)对于每一张包含基础类别的图像,仅保留图像中基础类别目标框的标注;将图像经数据增强后,作为特征提取器的输入并输出抽象特征;
202)将抽象特征分别作为目标定位器中热力图端、尺寸端和补偿端的输入,输出热力图、尺寸图和补偿图,其中,热力图端采用FocalLoss作为损失函数,尺寸端和补偿端均使用L1损失函数作为损失函数,三个工作端的损失函数按照比例进行加和作为整个模型的总检测损失并进行反向传播调整模型的参数;
203)在后续的元学习阶段和小样本微调阶段中,在基础训练阶段得到的特征提取器的参数以及目标定位器中的热力图端对应于基础类别的滤波器参数不再调整。
7.根据权利要求5所述的一种基于元学习的增量小样本目标检测方法,其特征在于,所述的元学习阶段具体包括以下步骤:
211)将包含基础类别的图像重新组织为多个不同的任务,每一个任务均包含一个支持集和一个测试集,其中,支持集和测试集中分别包含K个相同类别的物体图像,一个任务作为元学习器的一个样本,任务i中包含的2K张图像经过特征提取器得到K个支持特征fi s={fi,1,fi,2,…,fi,K}以及K个查询特征fi q={fi,K+1,fi,K+2,…,fi,2K},并将目标定位器的权重初始化为元学习器的权重;
212)将支持特征fi s={fi,1,fi,2,…,fi,K}经过目标定位器输出对应的热力图
Figure FDA0002742251840000027
尺寸图
Figure FDA0002742251840000028
和补偿图
Figure FDA0002742251840000029
后,计算总检测损失并反向传播对应的损失更新目标定位器的权重,获取目标定位器的一个中间状态;
213)将查询特征fi q={fi,K+1,fi,K+2,…,fi,2K}输入到处于中间状态的目标定位器中,输出对应的热力图、尺寸图和补偿图,计算总检测损失并反向传播更新元学习器的参数。
8.根据权利要求7所述的一种基于元学习的增量小样本目标检测方法,其特征在于,所述的步骤212)中,获取目标定位器的一个中间状态,具体表示为:
Figure FDA0002742251840000031
其中,w为目标定位器的参数,w′为目标定位器中间状态的参数,δ为学习率,
Figure FDA0002742251840000032
为目标定位器的总损失函数,
Figure FDA0002742251840000033
为以支持特征作为目标定位器的输入所产生的总损失对目标定位器参数w的梯度。
9.根据权利要求8所述的一种基于元学习的增量小样本目标检测方法,其特征在于,所述的步骤213)中,元学习器的目标函数表达式为:
Figure FDA0002742251840000034
其中,
Figure FDA0002742251840000035
表示第i个任务,
Figure FDA0002742251840000036
为任务的分布,
Figure FDA0002742251840000037
为在经过支持特征作为输入并更新目标定位器参数后,再由查询特征作为更新后的目标定位器的输入所产生的总损失。
10.根据权利要求5所述的一种基于元学习的增量小样本目标检测方法,其特征在于,所述的小样本微调阶段具体为:
在基础训练阶段和元学习阶段结束后,此时,增量小样本目标检测模型处于一个能够快速拟合少量新类别样本的状态,当少量新类别样本出现时,该模型在不使用任何基础类别样本进行平衡的情况下快速拟合新类别的样本,拟合得到的模型保持在基础类别上的检测性能,同时在新类别的物体上也具备检测能力。
CN202011154301.1A 2020-10-26 2020-10-26 一种基于元学习的增量小样本目标检测方法 Active CN112329827B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011154301.1A CN112329827B (zh) 2020-10-26 2020-10-26 一种基于元学习的增量小样本目标检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011154301.1A CN112329827B (zh) 2020-10-26 2020-10-26 一种基于元学习的增量小样本目标检测方法

Publications (2)

Publication Number Publication Date
CN112329827A true CN112329827A (zh) 2021-02-05
CN112329827B CN112329827B (zh) 2022-08-23

Family

ID=74311653

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011154301.1A Active CN112329827B (zh) 2020-10-26 2020-10-26 一种基于元学习的增量小样本目标检测方法

Country Status (1)

Country Link
CN (1) CN112329827B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112819110A (zh) * 2021-04-19 2021-05-18 中国科学院自动化研究所 基于权重生成的增量式小样本目标检测方法及系统
CN112884760A (zh) * 2021-03-17 2021-06-01 东南大学 近水桥梁多类型病害智能检测方法与无人船设备
CN112949730A (zh) * 2021-03-11 2021-06-11 江苏禹空间科技有限公司 少样本的目标检测方法、装置、存储介质及设备
CN113159116A (zh) * 2021-03-10 2021-07-23 中国科学院大学 一种基于类间距平衡的小样本图像目标检测方法
CN113221993A (zh) * 2021-05-06 2021-08-06 西安电子科技大学 基于元学习和跨阶段沙漏的大视场小样本目标检测方法
CN113673589A (zh) * 2021-08-12 2021-11-19 南京理工大学 基于边框距离度量的标签选择自适应增量检测方法及系统
CN113822368A (zh) * 2021-09-29 2021-12-21 成都信息工程大学 一种基于无锚的增量式目标检测方法
CN117408679A (zh) * 2023-12-14 2024-01-16 北京星汉博纳医药科技有限公司 一种运维场景信息的处理方法及装置

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105654210A (zh) * 2016-02-26 2016-06-08 中国水产科学研究院东海水产研究所 一种利用海洋遥感多环境要素的集成学习渔场预报方法
CN106650789A (zh) * 2016-11-16 2017-05-10 同济大学 一种基于深度lstm网络的图像描述生成方法
US20190130214A1 (en) * 2017-10-30 2019-05-02 Sap Se Computer vision architecture with machine learned image recognition models
CN109901572A (zh) * 2018-12-13 2019-06-18 华为技术有限公司 自动驾驶方法、训练方法及相关装置
CN109902806A (zh) * 2019-02-26 2019-06-18 清华大学 基于卷积神经网络的噪声图像目标边界框确定方法
CN109961034A (zh) * 2019-03-18 2019-07-02 西安电子科技大学 基于卷积门控循环神经单元的视频目标检测方法
CN109961089A (zh) * 2019-02-26 2019-07-02 中山大学 基于度量学习和元学习的小样本和零样本图像分类方法
CN110766084A (zh) * 2019-10-28 2020-02-07 北京理工大学 基于cae与hl-cnn的小样本sar目标识别方法
CN110852447A (zh) * 2019-11-15 2020-02-28 腾讯云计算(北京)有限责任公司 元学习方法和装置、初始化方法、计算设备和存储介质
CN110866870A (zh) * 2019-10-29 2020-03-06 中山大学 一种医学图像任意倍数放大的超分辨处理方法
CN111476302A (zh) * 2020-04-08 2020-07-31 北京工商大学 基于深度强化学习的Faster-RCNN目标物体检测方法
CN111476292A (zh) * 2020-04-03 2020-07-31 北京全景德康医学影像诊断中心有限公司 医学图像分类处理人工智能的小样本元学习训练方法

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105654210A (zh) * 2016-02-26 2016-06-08 中国水产科学研究院东海水产研究所 一种利用海洋遥感多环境要素的集成学习渔场预报方法
CN106650789A (zh) * 2016-11-16 2017-05-10 同济大学 一种基于深度lstm网络的图像描述生成方法
US20190130214A1 (en) * 2017-10-30 2019-05-02 Sap Se Computer vision architecture with machine learned image recognition models
CN109901572A (zh) * 2018-12-13 2019-06-18 华为技术有限公司 自动驾驶方法、训练方法及相关装置
CN109902806A (zh) * 2019-02-26 2019-06-18 清华大学 基于卷积神经网络的噪声图像目标边界框确定方法
CN109961089A (zh) * 2019-02-26 2019-07-02 中山大学 基于度量学习和元学习的小样本和零样本图像分类方法
CN109961034A (zh) * 2019-03-18 2019-07-02 西安电子科技大学 基于卷积门控循环神经单元的视频目标检测方法
CN110766084A (zh) * 2019-10-28 2020-02-07 北京理工大学 基于cae与hl-cnn的小样本sar目标识别方法
CN110866870A (zh) * 2019-10-29 2020-03-06 中山大学 一种医学图像任意倍数放大的超分辨处理方法
CN110852447A (zh) * 2019-11-15 2020-02-28 腾讯云计算(北京)有限责任公司 元学习方法和装置、初始化方法、计算设备和存储介质
CN111476292A (zh) * 2020-04-03 2020-07-31 北京全景德康医学影像诊断中心有限公司 医学图像分类处理人工智能的小样本元学习训练方法
CN111476302A (zh) * 2020-04-08 2020-07-31 北京工商大学 基于深度强化学习的Faster-RCNN目标物体检测方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
ANDREW GILBERT: "Doppler Spectrum Classification with CNNs via Heatmap Location Encoding and a Multi-head Output Layer", 《ARXIV》 *
TY LIN: "Feature Pyramid Networks for Object Detection", 《ARXIV》 *
史文中: "多偏移遥感图像的BP神经网络亚像元定位", 《红外与毫米波学报》 *
奚先: "基于卷积神经网络的地震偏移剖面中散射体的定位和成像", 《地球物理学报》 *
李宏男: "面向无人机小样本目标识别的元学习方法研究", 《无人系统技术》 *

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113159116A (zh) * 2021-03-10 2021-07-23 中国科学院大学 一种基于类间距平衡的小样本图像目标检测方法
CN112949730A (zh) * 2021-03-11 2021-06-11 江苏禹空间科技有限公司 少样本的目标检测方法、装置、存储介质及设备
CN112949730B (zh) * 2021-03-11 2024-04-09 无锡禹空间智能科技有限公司 少样本的目标检测方法、装置、存储介质及设备
CN112884760A (zh) * 2021-03-17 2021-06-01 东南大学 近水桥梁多类型病害智能检测方法与无人船设备
CN112884760B (zh) * 2021-03-17 2023-09-26 东南大学 近水桥梁多类型病害智能检测方法与无人船设备
CN112819110A (zh) * 2021-04-19 2021-05-18 中国科学院自动化研究所 基于权重生成的增量式小样本目标检测方法及系统
CN112819110B (zh) * 2021-04-19 2021-06-29 中国科学院自动化研究所 基于权重生成的增量式小样本目标检测方法及系统
CN113221993B (zh) * 2021-05-06 2023-08-01 西安电子科技大学 基于元学习和跨阶段沙漏的大视场小样本目标检测方法
CN113221993A (zh) * 2021-05-06 2021-08-06 西安电子科技大学 基于元学习和跨阶段沙漏的大视场小样本目标检测方法
CN113673589A (zh) * 2021-08-12 2021-11-19 南京理工大学 基于边框距离度量的标签选择自适应增量检测方法及系统
CN113822368B (zh) * 2021-09-29 2023-06-20 成都信息工程大学 一种基于无锚的增量式目标检测方法
CN113822368A (zh) * 2021-09-29 2021-12-21 成都信息工程大学 一种基于无锚的增量式目标检测方法
CN117408679A (zh) * 2023-12-14 2024-01-16 北京星汉博纳医药科技有限公司 一种运维场景信息的处理方法及装置
CN117408679B (zh) * 2023-12-14 2024-03-22 北京星汉博纳医药科技有限公司 一种运维场景信息的处理方法及装置

Also Published As

Publication number Publication date
CN112329827B (zh) 2022-08-23

Similar Documents

Publication Publication Date Title
CN112329827B (zh) 一种基于元学习的增量小样本目标检测方法
CN111680706B (zh) 一种基于编码和解码结构的双通道输出轮廓检测方法
CN109635947B (zh) 基于答案采样的机器阅读理解模型训练方法及装置
CN110555399B (zh) 手指静脉识别方法、装置、计算机设备及可读存储介质
CN113128355A (zh) 一种基于通道剪枝的无人机图像实时目标检测方法
CN111079780B (zh) 空间图卷积网络的训练方法、电子设备及存储介质
CN114037844A (zh) 基于滤波器特征图的全局秩感知神经网络模型压缩方法
CN111914944A (zh) 基于动态样本选择和损失一致性的物体检测方法和系统
CN108376408A (zh) 一种基于曲率特征的三维点云数据快速加权配准方法
CN110889864B (zh) 一种基于双层深度特征感知的目标跟踪方法
CN106227884B (zh) 一种基于协同过滤的在线打车推荐方法
CN110889863A (zh) 一种基于目标感知相关滤波的目标跟踪方法
CN114492745A (zh) 基于知识蒸馏机制的类增量辐射源个体识别方法
CN111191786A (zh) 一种基于主动学习的迁移学习算法
CN113111975A (zh) 基于多核尺度卷积神经网络的sar图像目标分类方法
CN104615621B (zh) 搜索中的相关性处理方法和系统
CN117079132A (zh) 基于高斯距离损失的遥感图像目标检测方法
CN116883393B (zh) 一种基于无锚框目标检测算法的金属表面缺陷检测方法
CN110070120B (zh) 基于判别采样策略的深度度量学习方法及系统
CN116468686A (zh) 一种基于软优化知识蒸馏的带钢表面缺陷识别方法
CN116129189A (zh) 一种植物病害识别方法、设备、存储介质及装置
Chen et al. Bridge damage detection and recognition based on deep learning
CN114299119A (zh) 目标跟踪方法及装置
CN111652102B (zh) 一种输电通道目标物辨识方法及系统
CN114625838B (zh) 一种搜索系统的优化方法、装置、存储介质及计算机设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant