CN117351300A - 一种目标检测模型的小样本训练方法及装置 - Google Patents

一种目标检测模型的小样本训练方法及装置 Download PDF

Info

Publication number
CN117351300A
CN117351300A CN202311186407.3A CN202311186407A CN117351300A CN 117351300 A CN117351300 A CN 117351300A CN 202311186407 A CN202311186407 A CN 202311186407A CN 117351300 A CN117351300 A CN 117351300A
Authority
CN
China
Prior art keywords
training
model
features
detection model
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202311186407.3A
Other languages
English (en)
Other versions
CN117351300B (zh
Inventor
高顺利
崔涛
王亮
姜海
朱妍
马人杰
王一君
李夏喜
邓井川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Gas Group Co Ltd
Original Assignee
Beijing Gas Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Gas Group Co Ltd filed Critical Beijing Gas Group Co Ltd
Priority to CN202311186407.3A priority Critical patent/CN117351300B/zh
Publication of CN117351300A publication Critical patent/CN117351300A/zh
Application granted granted Critical
Publication of CN117351300B publication Critical patent/CN117351300B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种目标检测模型的小样本训练方法及装置。所述方法包括以下步骤:建立由数量较少的标注后的图像样本数据构成的训练数据集D;采用ImageNet数据集对目标检测模型进行预训练,得到预训练模型;将D输入到预训练模型进行特征提取,并对所提取的特征进行扩展;基于扩展后的特征对预训练模型进行微调,得到训练后的目标检测模型。本发明通过特征扩展,并基于扩展后的特征对预训练模型进行微调,可解决由于标签样本数据少而导致的目标检测模型出现过拟合的问题,提高目标检测精度。

Description

一种目标检测模型的小样本训练方法及装置
技术领域
本发明属于人工智能技术领域,具体涉及一种目标检测模型的小样本训练方法及装置。
背景技术
目前,基于深度学习的目标检测模型需要大量的标注样本才能取得良好的训练效果。然而,在实际应用中,获取大规模样本数据的成本十分昂贵,甚至有的数据根本无法采集。小样本学习能够仅凭少量样本就能实现对新类别的分类识别,从而减少对大规模标注数据的依赖。受到小样本学习的启发,小样本条件下的目标检测技术也在不断发展。使用包含足够标记样本的数据集,小样本目标检测只需要检测新类别中的少量标记样本,然后采用正确的训练方法、设计适当的模型结构和相应的损失函数,就可以获得具有泛化性能的检测模型。这大大提高了模型开发的效率。
小样本目标检测方法可以分为以下三种:
基于微调的方法:这种方法使用预训练的模型作为初始参数,并在小样本数据集上进行微调(fine-tuning)。通过在目标检测任务上进行有针对性的微调,模型能够适应新类别的目标,并提高在小样本条件下的检测性能。
基于模型的方法:这种方法通过设计特定的模型结构来应对小样本目标检测问题。常见的方法包括引入注意力机制(如多尺度注意力、空间注意力等)、引入更强大的特征表示(如多尺度特征融合、图像增强技术等)或者改进网络架构(如单阶段检测器的设计优化)等。
基于度量学习的方法:这种方法通过学习目标之间的相似性或距离来进行小样本目标检测。通过度量学习,模型能够将同一类别的目标彼此聚集,不同类别的目标彼此分开,从而提高小样本条件下的分类和检测性能。常见的度量学习方法包括孪生网络(Siamese Networks)、三元组损失(Triplet Loss)等。
以上三种方法虽然都有其独特的优势和适用场景,但效果都不够理想。为此,本实施例提出一种目标检测模型的小样本训练方法,通过引入基于K-组合均值的特征增强算法,可解决由于标签样本数据少而导致的目标检测模型出现过拟合的问题,提高目标检测精度。
发明内容
为了解决现有技术中存在的上述问题,本发明提供一种目标检测模型的小样本训练方法及装置。
为了实现上述目的,本发明采用以下技术方案。
第一方面,本发明提供一种目标检测模型的小样本训练方法,包括以下步骤:
建立由数量较少的标注后的图像样本数据构成的训练数据集D;
采用ImageNet数据集对目标检测模型进行预训练,得到预训练模型;
将D输入到预训练模型进行特征提取,并对所提取的特征进行扩展;
基于扩展后的特征对预训练模型进行微调,得到训练后的目标检测模型。
进一步地,所述目标检测模型为DETR模型。
更进一步地,所述对所提取的特征进行扩展,包括:
获取同一目标类别标签的K个特征,Fk为第k个特征,k=1,2,…,K;
从K个特征中任取i个特征,得到个不同的特征组合,计算每个特征组合中i个特征的均值,Fij为第j个特征组合的特征均值,/> 为从K个不同元素中取出i个元素的组合数;
将所有Fk和Fij组合成扩展后的特征,扩展后特征的数量为:
按照上述方法对所有目标类别标签的特征进行扩展。
更进一步地,同一目标类别标签的K个特征扩展后的特征对应的目标类别标签不变。
更进一步地,所述基于扩展后的特征对预训练模型进行微调,包括:
保持预训练模型中的卷积层和编码-解码器的结构和预训练参数不变,利用扩展后的特征对预训练模型的全连接层的参数进行优化。
第二方面,本发明提供一种目标检测模型的小样本训练装置,包括:
数据集构建模块,用于建立由数量较少的标注后的图像样本数据构成的训练数据集D;
模型预训练模块,用于采用ImageNet数据集对目标检测模型进行预训练,得到预训练模型;
特征提取扩展模块,用于将D输入到预训练模型进行特征提取,并对所提取的特征进行扩展;
模型微调模块,用于基于扩展后的特征对预训练模型进行微调,得到训练后的目标检测模型。
进一步地,所述目标检测模型为DETR模型。
更进一步地,所述对所提取的特征进行扩展,包括:
获取同一目标类别标签的K个特征,Fk为第k个特征,k=1,2,…,K;
从K个特征中任取i个特征,得到个不同的特征组合,计算每个特征组合中i个特征的均值,Fij为第j个特征组合的特征均值,/> 为从K个不同元素中取出i个元素的组合数;
将所有Fk和Fij组合成扩展后的特征,扩展后特征的数量为:
按照上述方法对所有目标类别标签的特征进行扩展。
更进一步地,同一目标类别标签的K个特征扩展后的特征对应的目标类别标签不变。
更进一步地,所述基于扩展后的特征对预训练模型进行微调,包括:
保持预训练模型中的卷积层和编码-解码器的结构和预训练参数不变,利用扩展后的特征对预训练模型的全连接层的参数进行优化。
与现有技术相比,本发明具有以下有益效果。
本发明通过建立由数量较少的标注后的图像样本数据构成的训练数据集D,采用ImageNet数据集对目标检测模型进行预训练,得到预训练模型,将D输入到预训练模型进行特征提取,并对所提取的特征进行扩展,基于扩展后的特征对预训练模型进行微调,得到训练后的目标检测模型,实现了目标检测模型的小样本训练。本发明通过特征扩展,并基于扩展后的特征对预训练模型进行微调,可解决由于标签样本数据少而导致的目标检测模型出现过拟合的问题,提高目标检测精度。
附图说明
图1为本发明实施例一种目标检测模型的小样本训练方法的流程图。
图2为DETR模型的网络结构示意图。
图3为增加K-组合均值特征增强算法的DETR模型的网络结构示意图。
图4为本发明实施例一种目标检测模型的小样本训练装置的组成框图。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚、明白,以下结合附图及具体实施方式对本发明作进一步说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例一种目标检测模型的小样本训练方法的流程图,包括以下步骤:
步骤101,建立由数量较少的标注后的图像样本数据构成的训练数据集D;
步骤102,采用ImageNet数据集对目标检测模型进行预训练,得到预训练模型;
步骤103,将D输入到预训练模型进行特征提取,并对所提取的特征进行扩展;
步骤104,基于扩展后的特征对预训练模型进行微调,得到训练后的目标检测模型。
本实施例中,步骤101主要用于构建小样本训练数据集。小样本训练数据集,顾名思义,是样本数据量较少的训练数据集。基于深度学习的目标检测模型需要大量的标注样本才能取得良好的效果。然而,在实际应用中,获取大规模样本数据的成本十分昂贵,甚至有的数据根本无法采集。为此,本实施例提供一种目标检测模型的小样本训练方法,采用小样本学习技术,仅凭少量样本实现对目标检测模型的训练,从而减少对大规模标注数据的依赖。现以第三方施工设备检测模型的训练数据集的构建方法为例进行说明。首先,进行第三方施工数据采集,数据库是由已有的网络数据和现场采样的数据构成,每一设备种类采集三百张左右图像,一共10个设备类别,如挖掘机、推土机等机械设备,还有第三方施工代表性物体,如水马。将数据库中的数据进行清洗,丢掉一些标记物小的图片,以及图像质量不清晰的样本,然后利用标注工具对图像进行标注,将每张图片中的物体标注出来,并同时将类别记录下来,生成标记框的相关文件,即数据集配套文件,继而得到第三方施工数据样本库。将数据集划分为训练集和测试集,80%为训练集,20%为测试集,得到一个可用作目标检测训练的数据库。
本实施例中,步骤102主要用于通过对目标检测模型进行预训练得到预训练模型。本实施例采用ImageNet大型图像数据集对目标检测模型进行预训练。ImageNet图像数据集始于2009年,是根据WordNet层次结构组织的图像数据集。在ImageNet中,每个类别提供平均1000幅图像。每个concept图像都是质量控制和人为标注的。ImageNet是一项持续的研究工作,旨在为世界各地的研究人员提供易于访问的图像数据库。目前ImageNet中总共有14197122幅图像,总共分为21841个类别,大类别包括amphibian、animal、appliance、bird等。目标检测模型的预训练主要是优化卷积层CNN和编码-解码器encoder-decoder的参数。
本实施例中,步骤103主要用于进行特征提取和特征扩展。本实施例通过将训练数据集D中的数据输入到预训练模型进行特征提取。由于D中的样本数据量较少,提取的特征的数量也较少,不能满足目标检测模型的训练精度要求。为了提高模型训练精度,本实施例基于提取的特征对每个目标类别标签的目标特征进行特征扩展,使扩展后的特征总数成倍甚至按几何级数增长。特征扩展的方法很多,本实施例对具体的特征扩展方法不作限定,后面的实施例将给出一种具体的特征扩展方法。
本实施例中,步骤104主要用于对预训练模型进行微调。为了实现目标检测模型的小样本训练,本实施例将目标检测模型的训练过程划分为两个阶段:第一阶段是预训练阶段,利用ImageNet大型图像数据集对目标检测模型进行预训练,得到预训练模型;第二阶段是微调阶段,利用小样本训练数据集D(加入了特征扩展算法)对预训练模型进行微调,得到最终的目标检测模型。两个阶段针对模型结构的不同部分进行训练,微调阶段保持预训练模型参数不变,利用预训练模型实现特征提取。
本实施例通过利用ImageNet大型图像数据集对目标检测模型进行预训练得到预训练模型,利用预训练模型对小样本训练集的数据进行特征提取,并对提取的特征进行扩展,使扩展后的特征总数成倍甚至按几何级数增长,最后利用扩展后的特征对预训练模型进行微调得到训练好的目标检测模型,实现了目标检测模型的小样本训练,可解决由于标签样本数据少而导致的目标检测模型出现过拟合的问题,提高目标检测精度。
作为一可选实施例,所述目标检测模型为DETR模型。
本实施例给出了目标检测模型的一种网络结构。本实施例的目标检测模型采用DETR网络结构,其基本架构示意图如图2所示,加入特征扩展算法后的示意图如图3所示。对DETR进行预训练时,首先将ImageNet数据集中的图像输入到DETR的主干网络中,该网络为CNN卷积神经网络,一般采用ResNet-50。图像经过卷积层提取到特征图。然后将特征图输入到transformer的编码器中。该编码器由一组编码器层组成,每个编码器层都是一个多头自注意力机制和前馈神经网络的堆叠。编码器的主要功能是提取输入图像的全局特征表示。编码器的输出以及查询向量输入到解码器中,解码器由一组解码器层组成,每个解码器层包含三个子层:多头自注意力机制、多头注意力机制(用于将输入特征图的信息与查询向量进行交互)和前馈神经网络。解码器的主要功能是通过与特征图交互来生成目标的位置和类别预测。DETR模型的解码器部分使用一种换位操作,将编码器输出的特征图中的每个位置视为候选区域,并与解码器中的查询向量进行交互。通过自注意力机制和注意力机制的交互,DETR模型利用全局特征生成目标的预测结果,而不需要显式的候选区域和候选区域特征。解码器的输出通过Task-Specific Head结构生成目标检测预测结果的特定部分。Task-Specific Head结构包括两个子模块:类别预测头和边界框预测头。类别预测头负责对每个候选区域进行目标类别的分类预测。它通常由全连接层组成,将输入的特征映射到预定义的类别数量上。对于DETR模型,类别预测头将候选区域特征与查询向量进行交互,并通过全连接层将其映射到类别预测的结果上。这样,模型可以根据特征和查询向量的组合来预测每个候选区域的目标类别。边界框预测头负责对每个候选区域进行边界框的回归预测,通常由全连接层组成,将输入的特征映射到包含边界框坐标的预定义输出空间中。对于DETR模型,边界框预测头通过全连接层将候选区域特征与查询向量进行交互,并将其映射到边界框的预测结果上。这样,模型可以根据特征和查询向量的组合来预测每个候选区域的边界框位置。最后将预测结果和真实标签进行一对一匹配。DETR的损失函数包括分类损失和回归损失两部分,分类损失采用交叉熵损失函数,回归损失则采用giou损失和L1损失的加权和。
作为一可选实施例,所述对所提取的特征进行扩展,包括:
获取同一目标类别标签的K个特征,Fk为第k个特征,k=1,2,…,K;
从K个特征中任取i个特征,得到个不同的特征组合,计算每个特征组合中i个特征的均值,Fij为第j个特征组合的特征均值,/> 为从K个不同元素中取出i个元素的组合数;
将所有Fk和Fij组合成扩展后的特征,扩展后特征的数量为:
按照上述方法对所有目标类别标签的特征进行扩展。
本实施例给出了特征扩展的一种技术方案。本实施例采用K-组合均值特征增强算法对提取的特征进行扩展,进行特征扩展的算法技术原理是:针对每一目标类别标签的K(不同类别的K值可以取不同的值)个特征,基于排列组合原理,从K个特征中任取i个(i=2,3,…,K)个特征,得到个不同的特征组合,然后计算每个特征组合的特征均值,最后将原有的K个特征和得到的特征均值组合在一起得到扩展后的特征。本实施例的K-组合均值特征增强算法可使K个特征扩展到2K-1个特征,使特征数量成几何级数增长,K值越大增长速度越快,比如K=10时,由10个特征扩展为1023个特征。
作为一可选实施例,同一目标类别标签的K个特征扩展后的特征对应的目标类别标签不变。
本实施例给出了特征扩展后目标类别标签的确定方法。根据上一实施例的K-组合均值特征增强算法可知,所述K个特征对应同一目标类别标签,扩展后的特征是所述K个特征中的部分特征或全部特征的均值,因此所述K个特征扩展后的目标类别标签仍应保持扩展前的标签不变。
作为一可选实施例,所述基于扩展后的特征对预训练模型进行微调,包括:
保持预训练模型中的卷积层和编码-解码器的结构和预训练参数不变,利用扩展后的特征对预训练模型的全连接层的参数进行优化。
本实施例给出了对预训练模型进行微调的一种技术方案。本实施例中,在进行模型训练的第二阶段即模型微调时,保持预训练模型中的卷积层和编码-解码器的结构和预训练参数不变,利用预训练模型对输入的图像数据进行特征提取,并利用K-组合均值特征增强模块对提取的特征进行特征扩展,然后利用扩展后的特征对预训练模型的全连接层的参数进行优化,如图3所示。
图4为本发明实施例一种目标检测模型的小样本训练装置的组成示意图,所述装置包括:
数据集构建模块11,用于建立由数量较少的标注后的图像样本数据构成的训练数据集D;
模型预训练模块12,用于采用ImageNet数据集对目标检测模型进行预训练,得到预训练模型;
特征提取扩展模块13,用于将D输入到预训练模型进行特征提取,并对所提取的特征进行扩展;
模型微调模块14,用于基于扩展后的特征对预训练模型进行微调,得到训练后的目标检测模型。
本实施例的装置,可以用于执行图1所示方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。后面的实施例也是如此,均不再展开说明。
作为一可选实施例,所述目标检测模型为DETR模型。
作为一可选实施例,所述对所提取的特征进行扩展,包括:
获取同一目标类别标签的K个特征,Fk为第k个特征,k=1,2,…,K;
从K个特征中任取i个特征,得到个不同的特征组合,计算每个特征组合中i个特征的均值,Fij为第j个特征组合的特征均值,/> 为从K个不同元素中取出i个元素的组合数;
将所有Fk和Fij组合成扩展后的特征,扩展后特征的数量为:
按照上述方法对所有目标类别标签的特征进行扩展。
作为一可选实施例,同一目标类别标签的K个特征扩展后的特征对应的目标类别标签不变。
作为一可选实施例,所述基于扩展后的特征对预训练模型进行微调,包括:
保持预训练模型中的卷积层和编码-解码器的结构和预训练参数不变,利用扩展后的特征对预训练模型的全连接层的参数进行优化。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种目标检测模型的小样本训练方法,其特征在于,包括以下步骤:
建立由数量较少的标注后的图像样本数据构成的训练数据集D;
采用ImageNet数据集对目标检测模型进行预训练,得到预训练模型;
将D输入到预训练模型进行特征提取,并对所提取的特征进行扩展;
基于扩展后的特征对预训练模型进行微调,得到训练后的目标检测模型。
2.根据权利要求1所述的目标检测模型的小样本训练方法,其特征在于,所述目标检测模型为DETR模型。
3.根据权利要求2所述的目标检测模型的小样本训练方法,其特征在于,所述对所提取的特征进行扩展,包括:
获取同一目标类别标签的K个特征,Fk为第k个特征,k=1,2,…,K;
从K个特征中任取i个特征,得到个不同的特征组合,计算每个特征组合中i个特征的均值,Fij为第j个特征组合的特征均值,i=2,3,…,K,/>Ci K为从K个不同元素中取出i个元素的组合数;
将所有Fk和Fij组合成扩展后的特征,扩展后特征的数量为:
按照上述方法对所有目标类别标签的特征进行扩展。
4.根据权利要求3所述的目标检测模型的小样本训练方法,其特征在于,同一目标类别标签的K个特征扩展后的特征对应的目标类别标签不变。
5.根据权利要求4所述的目标检测模型的小样本训练方法,其特征在于,所述基于扩展后的特征对预训练模型进行微调,包括:
保持预训练模型中的卷积层和编码-解码器的结构和预训练参数不变,利用扩展后的特征对预训练模型的全连接层的参数进行优化。
6.一种目标检测模型的小样本训练装置,其特征在于,包括:
数据集构建模块,用于建立由数量较少的标注后的图像样本数据构成的训练数据集D;
模型预训练模块,用于采用ImageNet数据集对目标检测模型进行预训练,得到预训练模型;
特征提取扩展模块,用于将D输入到预训练模型进行特征提取,并对所提取的特征进行扩展;
模型微调模块,用于基于扩展后的特征对预训练模型进行微调,得到训练后的目标检测模型。
7.根据权利要求6所述的目标检测模型的小样本训练装置,其特征在于,所述目标检测模型为DETR模型。
8.根据权利要求7所述的目标检测模型的小样本训练装置,其特征在于,所述对所提取的特征进行扩展,包括:
获取同一目标类别标签的K个特征,Fk为第k个特征,k=1,2,…,K;
从K个特征中任取i个特征,得到个不同的特征组合,计算每个特征组合中i个特征的均值,Fij为第j个特征组合的特征均值,i=2,3,…,K,/> 为从K个不同元素中取出i个元素的组合数;
将所有Fk和Fij组合成扩展后的特征,扩展后特征的数量为:
按照上述方法对所有目标类别标签的特征进行扩展。
9.根据权利要求8所述的目标检测模型的小样本训练装置,其特征在于,同一目标类别标签的K个特征扩展后的特征对应的目标类别标签不变。
10.根据权利要求9所述的目标检测模型的小样本训练装置,其特征在于,所述基于扩展后的特征对预训练模型进行微调,包括:
保持预训练模型中的卷积层和编码-解码器的结构和预训练参数不变,利用扩展后的特征对预训练模型的全连接层的参数进行优化。
CN202311186407.3A 2023-09-14 2023-09-14 一种目标检测模型的小样本训练方法及装置 Active CN117351300B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311186407.3A CN117351300B (zh) 2023-09-14 2023-09-14 一种目标检测模型的小样本训练方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311186407.3A CN117351300B (zh) 2023-09-14 2023-09-14 一种目标检测模型的小样本训练方法及装置

Publications (2)

Publication Number Publication Date
CN117351300A true CN117351300A (zh) 2024-01-05
CN117351300B CN117351300B (zh) 2024-05-14

Family

ID=89358394

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311186407.3A Active CN117351300B (zh) 2023-09-14 2023-09-14 一种目标检测模型的小样本训练方法及装置

Country Status (1)

Country Link
CN (1) CN117351300B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3050536A1 (en) * 2015-01-30 2016-08-03 Dentsply International, Inc. System and method for adding surface detail to digital crown models created using statistical techniques
CN113255791A (zh) * 2021-05-31 2021-08-13 西安电子科技大学 基于k-组合均值特征增强的小样本目标检测方法及系统
CN113283180A (zh) * 2021-06-28 2021-08-20 中国石油大学(华东) 基于K-means与SVR组合的致密油藏水平井压裂产能预测方法与应用
CN115546470A (zh) * 2022-09-22 2022-12-30 福建万福信息技术有限公司 一种小样本目标检测的方法、系统、设备和存储介质
CN116071660A (zh) * 2023-03-10 2023-05-05 广西师范大学 一种基于小样本的目标检测方法
CN116579980A (zh) * 2023-03-28 2023-08-11 中国科学技术大学 基于小样本学习的印刷电路板缺陷检测方法、介质及设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3050536A1 (en) * 2015-01-30 2016-08-03 Dentsply International, Inc. System and method for adding surface detail to digital crown models created using statistical techniques
CN113255791A (zh) * 2021-05-31 2021-08-13 西安电子科技大学 基于k-组合均值特征增强的小样本目标检测方法及系统
CN113283180A (zh) * 2021-06-28 2021-08-20 中国石油大学(华东) 基于K-means与SVR组合的致密油藏水平井压裂产能预测方法与应用
CN115546470A (zh) * 2022-09-22 2022-12-30 福建万福信息技术有限公司 一种小样本目标检测的方法、系统、设备和存储介质
CN116071660A (zh) * 2023-03-10 2023-05-05 广西师范大学 一种基于小样本的目标检测方法
CN116579980A (zh) * 2023-03-28 2023-08-11 中国科学技术大学 基于小样本学习的印刷电路板缺陷检测方法、介质及设备

Also Published As

Publication number Publication date
CN117351300B (zh) 2024-05-14

Similar Documents

Publication Publication Date Title
CN110443818B (zh) 一种基于涂鸦的弱监督语义分割方法与系统
CN113326731B (zh) 一种基于动量网络指导的跨域行人重识别方法
CN108399428B (zh) 一种基于迹比准则的三元组损失函数设计方法
CN111583263B (zh) 一种基于联合动态图卷积的点云分割方法
CN114092832B (zh) 一种基于并联混合卷积网络的高分辨率遥感影像分类方法
CN111079847B (zh) 一种基于深度学习的遥感影像自动标注方法
CN112347888B (zh) 基于双向特征迭代融合的遥感图像场景分类方法
CN111259786A (zh) 一种基于视频的外观和运动信息同步增强的行人重识别方法
CN111666406B (zh) 基于自注意力的单词和标签联合的短文本分类预测方法
CN112199532A (zh) 一种基于哈希编码和图注意力机制的零样本图像检索方法及装置
CN115222998B (zh) 一种图像分类方法
CN113807214B (zh) 基于deit附属网络知识蒸馏的小目标人脸识别方法
CN112966647A (zh) 一种基于逐层聚类及增强判别的行人重识别方法
CN111723660A (zh) 一种用于长形地面目标检测网络的检测方法
CN113920379B (zh) 一种基于知识辅助的零样本图像分类方法
CN117524353B (zh) 一种基于多维度分子信息的分子大模型、构建方法及应用
CN114972904A (zh) 一种基于对抗三元组损失的零样本知识蒸馏方法及系统
CN114329031A (zh) 一种基于图神经网络和深度哈希的细粒度鸟类图像检索方法
Rizzoli et al. Source-free domain adaptation for rgb-d semantic segmentation with vision transformers
CN117351300B (zh) 一种目标检测模型的小样本训练方法及装置
CN116385946A (zh) 面向视频的目标片段定位方法、系统、存储介质及设备
CN115861779A (zh) 一种基于有效特征表示的无偏场景图生成方法
Yang et al. NAM net: meta-network with normalization-based attention for few-shot learning
CN114937289B (zh) 一种基于异构伪标签学习的跨域行人检索方法
CN115497120B (zh) 基于Transformer的两步式领域自适应行人再识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant