CN113205142A - 一种基于增量学习的目标检测方法和装置 - Google Patents

一种基于增量学习的目标检测方法和装置 Download PDF

Info

Publication number
CN113205142A
CN113205142A CN202110501717.4A CN202110501717A CN113205142A CN 113205142 A CN113205142 A CN 113205142A CN 202110501717 A CN202110501717 A CN 202110501717A CN 113205142 A CN113205142 A CN 113205142A
Authority
CN
China
Prior art keywords
module
incremental learning
output
new
cls
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110501717.4A
Other languages
English (en)
Other versions
CN113205142B (zh
Inventor
陈璟洲
钱沄涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN202110501717.4A priority Critical patent/CN113205142B/zh
Publication of CN113205142A publication Critical patent/CN113205142A/zh
Application granted granted Critical
Publication of CN113205142B publication Critical patent/CN113205142B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了一种基于增量学习的目标检测方法和装置,包括:利用旧类别样本图像对目标检测网络进行训练得到原始模型;在原始模型的输出层增加新类别样本图像的新类别检测分支,并初始化新类别检测分支参数,得到增量学习模型;利用新类别样本图像训练增量学习模型,训练时,以新类别样本图像在增量学习模型的旧类别检测分支输出与在原始模型的预测输出的逼近误差、新类别样本图像在增量学习模型的新类别检测分支的检测误差构建损失函数,来优化训练增量学习模型参数,得到参数确定的目标检测模型;利用目标检测模型对测试样本图像进行目标检测。以提高目标检测模型的鲁棒性,提高检测精度。

Description

一种基于增量学习的目标检测方法和装置
技术领域
本发明属于目标识别领域,具体涉及一种基于增量学习的目标检测方法和装置。
背景技术
传统的目标检测任务中,都是预先定义好要检测的物体类别并收集好相应数据后,对模型进行训练的。利用预先定义好的数据集训练好模型,并且部署到摄像头、卫星、无人机等终端上时,一旦遇到之前数据集中不存在的物体类别时,模型对新类别的检测效果就会很差。收集到原有数据集类别中的新样本时,模型也无法及时利用新样本进行更新。这些问题导致检测模型鲁棒性不高,无法成为自动化更高的系统。
针对上述问题,传统的解决方案是每当收集到新类别的数据时,就与旧类别的数据集合并为一个更大的数据集,对模型进行重新训练与部署。但是这样会导致不断重新对模型架构进行设计,训练时系统的存储要求更高,训练更加耗时,模型的部署周期更长,难度加大。
基于增量学习的目标检测系统可以不断利用新获取的样本对自身进行更新,而不需要重新包括旧的数据集,也不需要重新设计新的架构,这样可以有效减轻系统的存储负担与训练时间,更快捷地进行部署。利用增量学习方式获得的目标检测模型,在新获取到的类别上具有良好的检测效果,同时还能在原有类别的数据集上保留检测能力。因此,目标检测的增量学习研究已经成为新的研究热点。
但是,应用增量学习方法到传统的目标检测模型上时,会遇到灾难遗忘的问题,即在旧类别的数据上训练好的模型,利用新类别的样本对模型的参数进行微调时,模型在旧类别的检测效果就会急剧下降。
目前,针对灾难遗忘的研究多集中于物体分类,针对目标检测问题却鲜有研究。常用的具有较好检测效果的目标检测模型通常包括两个阶段,第一阶段生成目标候选区域(RPN网络),第二阶段对目标候选区域进行进一步地修正。
因此,如何针对具有生成目标候选区域和对目标候选区域进行进一步地修正这两阶段的目标检测模型引入增量学习方法,使目标检测模型不借助于旧类别的数据,仅利用新类别数据在新类别上获得好的检测效果,同时保留针对旧类别的检测能力,是当前亟待解决的问题。
发明内容
鉴于上述,本发明的目的是提供一种基于增量学习的目标检测方法和装置,在不借助于旧类别样本的情况下,仅利用新类别样本进行目标检测模型的训练,以获得在新类别上具有良好检测效果且同时保留旧类别检测能力的目标检测模型。
第一方面,本发明实施例提供了一种基于增量学习的目标检测方法,包括以下步骤:
利用旧类别样本图像对目标检测网络进行训练得到原始模型;
在原始模型的输出层增加新类别样本图像的新类别检测分支,并初始化新类别检测分支参数,得到增量学习模型;
利用新类别样本图像训练增量学习模型,训练时,以新类别样本图像在增量学习模型的旧类别检测分支输出与在原始模型的预测输出的逼近误差、新类别样本图像在增量学习模型的新类别检测分支的检测误差构建损失函数,来优化训练增量学习模型参数,得到参数确定的目标检测模型;
利用目标检测模型对测试样本图像进行目标检测。
一个实施例中,所述目标检测网络采用FPN的网络,包括特征提取模块、RPN模块、CLS模块,其中,特征提取模块用于提取输入样本图像的特征图,FPN模块用于根据输入的特征图生成感兴趣区域并进行分类输出和回归输出,CLS模块用于对输入的感兴趣区域进一步修正,并进修正分类输出和回归输出;
在构建增量学习模型时,分别在FPN模块和CLS模块的输出层增加新类别检测分支,同时保留旧类别检测分支。
一个实施例中,在训练增量学习模型时,首先进行增量学习模型的预训练阶段,具体包括:固定特征特征提取模块、RPN模块和CLS模块的的旧类别检测分支不变,利用新类别样本图像优化RPN模块和CLS模块的新类别检测分支直至收敛。
一个实施例中,在进行增量学习模型的初始化阶段,获得新类别样本图像在原始模型的预测输出,以构建损失函数,其中,预测输出包括分类输出和回归输出。
一个实施例中,训练增量学习模型时,依据预训练阶段确定的增量学习模型,获得新类别样本图像分别在RPN模块和CLS模块的旧类别检测分支的预测输出,获得新类别样本图像分别在RPN模块和CLS模块的新类别检测分支的预测输出,其中,包括分类输出和回归输出;
依据新类别样本图像在原始模型的预测输出、在增量学习模型的RPN模块和CLS模块的旧类别检测分支的预测输出的逼近误差构建旧类别损失;
依据新类别样本图像在增量学习模型的RPN模块和CLS模块的旧类别检测分支的预测输出与标签的检测误差构建新类别损失;
综合旧类别损失和新类别损失构建的总损失函数来优化增量学习模型的网络参数。
一个实施例中,构建的总损失函数Loss为:
Loss=λoLossold+Lossnew
其中,λo为平衡超参数,Lossold为旧类别损失,具体为:
Figure BDA0003056635480000041
Lossnew为新类别损失,具体为:
Lossnew=Sigmoid(Y′n_RPN,Yn)+SmoothL1(B′n_RPN,Bn)+Softmax(Y′n_CLS,Yn)+SmoothL1(B′n_CLS,Bn)
其中,Y′o_RPN、B′o_RPN分别表示原始模型中RPN模块的分类输出和回归输出,
Figure BDA0003056635480000042
分别表示增量学习模型中RPN模块的旧类别检测分支的分类输出和回归输出,Y′o_CLS、B′o_CLS分别表示原始模型中CLS模块的分类输出和回归输出,
Figure BDA0003056635480000043
分别表示增量学习模型中CLS模块的旧类别检测分支的分类输出和回归输出;Y′n_RPN、B′n_RPN分别表示增量学习模型中RPN模块的新类别检测分支的分类输出和回归输出,Y′n_CLS、B′n_CLS分别表示增量学习模型中CLS模块的新类别检测分支的分类输出和回归输出,Yn、Bn分别表示新类别样本图像的分类标签和回归标签;在Lossold中,RPN模块的回归输出和分类输出均采用Smooth L1误差函数;CLS模块的回归输出采用Smooth L1误差函数,分类输出采用基于知识蒸馏的交叉熵损失函数;在Lossnew中,RPN模块和CLS模块的回归输出均采用Smooth L1损失函数,RPN模块的分类输出采用基于Sigmoid的交叉熵损失函数,CLS模块的分类输出采用基于Softmax的交叉熵损失函数。
一个实施例中,在训练增量学习模型时,依据损失函数采用随机梯度下降算法,对增量学习模型的网络参数进行更新。
第二方面,本发明实施例提供了一种基于增量学习的目标检测装置,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上执行的计算机程序,所述处理器执行所述计算机程序时实现第一方面所述的基于增量学习的目标检测方法的步骤。
实施例提供的上述技术方案具有的有益效果至少包括:对目标检测网络进行增量学习,获得对新类别的检测能力,同时保留旧类别的检测能力,有效解决了灾难遗忘问题,进而提高目标检测模型的鲁棒性,提高检测精度。另一方面,基于FPN的网络结构在多个特征尺度上对目标进行检测,能够有效检测尺度变化较大的目标,因此获得了相比于其他增量目标检测模型更好地检测效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动前提下,还可以根据这些附图获得其他附图。
图1是一实施例中增量学习模型的结构示意及训练过程图;
图2是一实施例中增量学习模型中RPN模块增加新类别检测分支示意图;
图3是一实施例中增量学习模型中CLS模块增加新类别检测分支示意图。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例对本发明进行进一步的详细说明。应当理解,此处所描述的具体实施方式仅仅用以解释本发明,并不限定本发明的保护范围。
为了解决因为灾难遗忘问题导致的目标检测模型的鲁棒性低,进而影响检测精度的问题。实施例提供了一种基于增量学习的目标检测方法和装置,在不借助于旧类别样本的情况下,仅利用新类别样本进行目标检测模型的训练,以获得在新类别上具有良好检测效果且同时保留旧类别检测能力的目标检测模型。
实施例提供的基于增量学习的目标检测方法,包括以下步骤:
步骤1,利用旧类别样本图像对目标检测网络进行训练得到原始模型。
实施例中,提供的目标检测网络采用Feature Pyramid Network(FPN)特征金字塔网络,如图1所示包括特征提取模块、Region Proposal Network(RPN)区域生成网络模块、Classification(CLS)分类回归模块,其中,特征提取模块作为共享模块,其参数表示为θs,用于提取输入样本图像的特征图。在特征提取模块中,如图1所示,包括4层卷积层,每层卷积层进一步通过卷积操作和上采样操作与低层级的卷积层相加和,之后再通过卷积操作送入各个层级共享的RPN模块中;RPN模块如图2所示,包括由全连接层构成的RPN隐藏层,以及针对旧类别的分类回归输出分支和针对新类别的分类回归输出分支,分别产生新老类别的候选框,经过对感兴趣区域RoI池化操作后送入后续CLS模块;CLS模块用于对输入的感兴趣区域进一步修正,如图3所示,包括两层全连接层和新旧类别的分类回归输出,其中分类输出预测感兴趣区域所属类别的概率、回归输出预测感兴趣区域具体的位置坐标。
利用旧类别样本图像对目标检测网络进行训练,直到网络收敛,保存训练好的模型参数得到原始模型,其中,模型参数包括特征提取模块的参数θs,RPN模块中旧类别检测分支的参数θo_PRN,CLS模块中旧类别检测分支的参数θo_CLS
步骤2,在原始模型的输出层增加新类别样本图像的新类别检测分支,并初始化新类别检测分支参数,得到增量学习模型。
实施例中,当扩展网络用于检测新类别时,在原始模型的RPN模块和CLS模块中添加用于检测新类别的新类别检测分支。如图2所示,在RPN模块的输出层中,保留针对旧类别的旧类别检测分支,其参数表示为θo_PRN,同时添加针对新类别的新类别检测分支,其参数表示为θn_RPN。如图3所示,即在CLS模块的输出层中,保留针对旧类别的检旧类别测分支,其参数表示为θo_CLS,同时添加针对新类别的新类别检测分支,其参数表示为θn_CLS
在原始模型的输出层增加新类别样本图像的新类别检测分支后,需要初始化新类别检测分支参数,实施例中随机初始化θn_RPNn_CLS
步骤3,利用新类别样本图像训练增量学习模型。
实施例中,新类别样本图像表示为Xn,Yn,Bn,其中,Yn,Bn标注的新类别样本图像Xn的分类标签和位置坐标。在训练增量学习模型之前,利用原始模型,获得新类别样本图像在原始模型的预测输出,其中预测输出包括分类输出和回归输出。
具体地,利用原始模型,获得新类别样本图像在原始模型的RPN模块的预测输出,即Y′o_RPN,B′o_RPN,RoIsprevious,其中,Y′o_RPN,B′o_RPN分别是RPN模块输出层中的分类输出与回归输出,RoIsprevious=RPN模块(Xn,Yn,Bnso_RPN)为原始模型在新类别样本上获得的感兴趣区域。
利用原始模型,获得新类别样本图像在原始模型的CLS模块的预测输出,即Y′o_CLS,B′o_CLS=CLS模块(RoIsprevious,Yn,Bnso_CLS),其中Y′o_CLS,B′o_CLS分别是CLS模块输出层中的分类输出与回归输出。
实施例中,训练增量学习模型时,首先进行增量学习模型的预训练阶段,具体包括:固定特征特征提取模块、RPN模块和CLS模块的旧类别检测分支的参数θso_RPNo_CLS不变,利用新类别样本图像优化RPN模块和CLS模块的新类别检测分支的参数θn_RPNn_CLS直至收敛。
训练增量学习模型时,依据预训练阶段确定的增量学习模型,获得新类别样本图像分别在RPN模块和CLS模块的旧类别检测分支的预测输出,获得新类别样本图像分别在RPN模块和CLS模块的新类别检测分支的预测输出,其中,包括分类输出和回归输出。
具体地,利用增量学习模型,获得新类别样本图像在RPN模块中旧类别分支上的输出,即
Figure BDA0003056635480000081
RoIscurrent_old,,其中
Figure BDA0003056635480000082
代表旧类别分支的分类输出与回归输出,RoIscurrent_old=RPN模块(Xn,Yn,Bn,
Figure BDA0003056635480000083
)代表在旧类别分支上产生的感兴趣区域;
利用增量学习模型,获得新类别样本图像在CLS模块中旧类别分支上的输出,即
Figure BDA0003056635480000084
模块(RoIsprevious,Yn,Bn,
Figure BDA0003056635480000085
),其中
Figure BDA0003056635480000086
分别代表旧类别目标的分类输出与回归输出。
利用增量学习模型,获得新类别样本图像在RPN模块中,新类别分支上的输出,即Y′n_RPN,B′n_RPN,RoIscurrent_new,其中Y′n_RPN,B′n_RPN代表新类别分支的分类输出与回归输出,RoIscurrent_new=RPN模块(Xn,Yn,Bn,
Figure BDA0003056635480000091
θn_CLS)代表在新类别分支上产生的感兴趣区域。
利用增量学习模型,获得新类别样本图像在CLS模块中,新类别分支上的输出,即Y′n_CLS,B′n_CLS,其中Y′n_CLS,B′n_CLS=CLS模块(RoIscurrent_new,Yn,Bn,
Figure BDA0003056635480000092
θn_CLS)分别代表新类别目标的分类输出与回归输出。
基于以上的分类输出和回归输出构建新类别损失和旧类别损失以得到总损失,利用随机梯度下降算法对模型参数进行更新。即:
Figure BDA0003056635480000093
其中λo为用于平衡新旧任务的超参。
实施例中,采用的总损失函数Loss为:
Loss=λoLossold+Lossnew
其中,λo为平衡超参数,Lossold为旧类别损失,具体为:
Figure BDA0003056635480000094
Lossnew为新类别损失,具体为:
Lossnew=Sigmoid(Y′n_RPN,Yn)+SmoothL1(B′n_RPN,Bn)+Softmax(Y′n_CLS,Yn)+SmoothL1(B′n_CLS,Bn)
其中,在利用新类别样本训练,使训练模型在旧类别分支上的输出逼近保存模型输出的损失函数Lossold中,RPN模块的回归输出和分类输出均采用Smooth L1误差函数;CLS模块的回归输出采用Smooth L1误差函数,分类输出采用基于知识蒸馏的交叉熵损失函数;采用基于知识蒸馏的损失函数,能够更好地捕捉训练模型和保存模型输出值中较小的部分,使得训练模型的输出更好地逼近保存模型的输出。利用新类别样本在训练模型的新类别分支上训练模型针对新类别目标的检测能力的损失函数Lossnew中,RPN模块和CLS模块的回归输出均采用Smooth L1损失函数,RPN模块的分类输出采用基于Sigmoid的交叉熵损失函数,CLS模块的分类输出采用基于Softmax的交叉熵损失函数。
针对每一个新类别样本图像都采用上述训练步骤进行训练,直到增量学习模型达到收敛,获得最后的目标检测模型。
步骤4,利用目标检测模型对测试样本图像进行目标检测。
当训练获得目标检测模型之后,将测试样本图像输入至目标检测模型,经计算获得目标检测结果。
实施例还提供了一种基于增量学习的目标检测装置,包括存储器、处理器以及存储在存储器中并可在所述处理器上执行的计算机程序,处理器执行所述计算机程序时实现基于增量学习的目标检测方法步骤,具体包括:
步骤1,利用旧类别样本图像对目标检测网络进行训练得到原始模型;
步骤2,在原始模型的输出层增加新类别样本图像的新类别检测分支,并初始化新类别检测分支参数,得到增量学习模型;
步骤3,利用新类别样本图像训练增量学习模型;
步骤4,利用目标检测模型对测试样本图像进行目标检测。
实际应用中,计算机存储器可以为在近端的易失性存储器,如RAM,还可以是非易失性存储器,如ROM,FLASH,软盘,机械硬盘等,还可以是远端的存储云。计算机处理器可以为中央处理器(CPU)、微处理器(MPU)、数字信号处理器(DSP)、或现场可编程门阵列(FPGA),即可以通过这些处理器实现基于增量学习的目标检测方法的步骤。
以上所述的具体实施方式对本发明的技术方案和有益效果进行了详细说明,应理解的是以上所述仅为本发明的最优选实施例,并不用于限制本发明,凡在本发明的原则范围内所做的任何修改、补充和等同替换等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种基于增量学习的目标检测方法,其特征在于,包括以下步骤:
利用旧类别样本图像对目标检测网络进行训练得到原始模型;
在原始模型的输出层增加新类别样本图像的新类别检测分支,并初始化新类别检测分支参数,得到增量学习模型;
利用新类别样本图像训练增量学习模型,训练时,以新类别样本图像在增量学习模型的旧类别检测分支输出与在原始模型的预测输出的逼近误差、新类别样本图像在增量学习模型的新类别检测分支的检测误差构建损失函数,来优化训练增量学习模型参数,得到参数确定的目标检测模型;
利用目标检测模型对测试样本图像进行目标检测。
2.如权利要求1所述的基于增量学习的目标检测方法,其特征在于,所述目标检测网络采用FPN的网络,包括特征提取模块、RPN模块、CLS模块,其中,特征提取模块用于提取输入样本图像的特征图,FPN模块用于根据输入的特征图生成感兴趣区域并进行分类输出和回归输出,CLS模块用于对输入的感兴趣区域进一步修正,并进修正分类输出和回归输出;
在构建增量学习模型时,分别在FPN模块和CLS模块的输出层增加新类别检测分支,同时保留旧类别检测分支。
3.如权利要求2所述的基于增量学习的目标检测方法,其特征在于,在训练增量学习模型时,首先进行增量学习模型的预训练阶段,具体包括:固定特征特征提取模块、RPN模块和CLS模块的旧类别检测分支不变,利用新类别样本图像优化RPN模块和CLS模块的新类别检测分支直至收敛。
4.如权利要求2所述的基于增量学习的目标检测方法,其特征在于,在进行增量学习模型的初始化阶段,获得新类别样本图像在原始模型的预测输出,以构建损失函数,其中,预测输出包括分类输出和回归输出。
5.如权利要求4所述的基于增量学习的目标检测方法,其特征在于,训练增量学习模型时,依据预训练阶段确定的增量学习模型,获得新类别样本图像分别在RPN模块和CLS模块的旧类别检测分支的预测输出,获得新类别样本图像分别在RPN模块和CLS模块的新类别检测分支的预测输出,其中,包括分类输出和回归输出;
依据新类别样本图像在原始模型的预测输出、在增量学习模型的RPN模块和CLS模块的旧类别检测分支的预测输出的逼近误差构建旧类别损失;
依据新类别样本图像在增量学习模型的RPN模块和CLS模块的旧类别检测分支的预测输出与标签的检测误差构建新类别损失;
综合旧类别损失和新类别损失构建的总损失函数来优化增量学习模型的网络参数。
6.如权利要求5所述的基于增量学习的目标检测方法,其特征在于,构建的总损失函数Loss为:
Loss=λoLossold+Lossnew
其中,λo为平衡超参数,Lossold为旧类别损失,具体为:
Figure FDA0003056635470000021
Lossnew为新类别损失,具体为:
Lossnew=Sigmoid(Y′n_RPN,Yn)+SmoothL1(B′n_RPN,Bn)+Softmax(Y′n_CLS,Yn)+SmoothL1(B′n_CLS,Bn)
其中,Y′o_RPN、B′o_RPN分别表示原始模型中RPN模块的分类输出和回归输出,
Figure FDA0003056635470000031
分别表示增量学习模型中RPN模块的旧类别检测分支的分类输出和回归输出,Y′o_CLS、B′o_CLS分别表示原始模型中CLS模块的分类输出和回归输出,
Figure FDA0003056635470000032
分别表示增量学习模型中CLS模块的旧类别检测分支的分类输出和回归输出;Y′n_RPN、B′n_RPN分别表示增量学习模型中RPN模块的新类别检测分支的分类输出和回归输出,Y′n_CLS、B′n_CLS分别表示增量学习模型中CLS模块的新类别检测分支的分类输出和回归输出,Yn、Bn分别表示新类别样本图像的分类标签和回归标签;在Lossold中,RPN模块的回归输出和分类输出均采用Smooth L1误差函数;CLS模块的回归输出采用Smooth L1误差函数,分类输出采用基于知识蒸馏的交叉熵损失函数;在Lossnew中,RPN模块和CLS模块的回归输出均采用Smooth L1损失函数,RPN模块的分类输出采用基于Sigmoid的交叉熵损失函数,CLS模块的分类输出采用基于Softmax的交叉熵损失函数。
7.如权利要求1所述的基于增量学习的目标检测方法,其特征在于,在训练增量学习模型时,依据损失函数采用随机梯度下降算法,对增量学习模型的网络参数进行更新。
8.一种基于增量学习的目标检测装置,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上执行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1~7任一项所述的基于增量学习的目标检测方法的步骤。
CN202110501717.4A 2021-05-08 2021-05-08 一种基于增量学习的目标检测方法和装置 Active CN113205142B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110501717.4A CN113205142B (zh) 2021-05-08 2021-05-08 一种基于增量学习的目标检测方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110501717.4A CN113205142B (zh) 2021-05-08 2021-05-08 一种基于增量学习的目标检测方法和装置

Publications (2)

Publication Number Publication Date
CN113205142A true CN113205142A (zh) 2021-08-03
CN113205142B CN113205142B (zh) 2022-09-06

Family

ID=77030586

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110501717.4A Active CN113205142B (zh) 2021-05-08 2021-05-08 一种基于增量学习的目标检测方法和装置

Country Status (1)

Country Link
CN (1) CN113205142B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115082740A (zh) * 2022-07-18 2022-09-20 北京百度网讯科技有限公司 目标检测模型训练方法、目标检测方法、装置、电子设备
CN115578605A (zh) * 2022-11-16 2023-01-06 北京阿丘科技有限公司 基于增量学习的数据分类方法、装置、设备及存储介质
CN116258944A (zh) * 2023-05-15 2023-06-13 成都理工大学 基于双网络的遥感影像分类模型样本增量学习方法
CN116311103A (zh) * 2023-05-10 2023-06-23 江西云眼视界科技股份有限公司 基于增量学习的路面积水检测方法、装置、介质及设备
CN116582372A (zh) * 2023-07-13 2023-08-11 深圳市前海新型互联网交换中心有限公司 一种物联网入侵检测方法、系统、电子设备及存储介质
WO2024060381A1 (zh) * 2022-09-20 2024-03-28 同济大学 一种增量式设备故障诊断方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110059672A (zh) * 2019-04-30 2019-07-26 福州大学 一种利用增量学习对显微镜细胞图像检测模型进行增类学习的方法
CN111931807A (zh) * 2020-06-24 2020-11-13 浙江大学 一种基于特征空间组合的小样本类增量学习方法
WO2020249961A1 (en) * 2019-06-14 2020-12-17 Vision Semantics Limited Optimised machine learning
CN112488209A (zh) * 2020-11-25 2021-03-12 南京大学 一种基于半监督学习的增量式图片分类方法
CN112580797A (zh) * 2020-11-26 2021-03-30 广东工业大学 一种多模态多标签预测模型的增量学习方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110059672A (zh) * 2019-04-30 2019-07-26 福州大学 一种利用增量学习对显微镜细胞图像检测模型进行增类学习的方法
WO2020249961A1 (en) * 2019-06-14 2020-12-17 Vision Semantics Limited Optimised machine learning
CN111931807A (zh) * 2020-06-24 2020-11-13 浙江大学 一种基于特征空间组合的小样本类增量学习方法
CN112488209A (zh) * 2020-11-25 2021-03-12 南京大学 一种基于半监督学习的增量式图片分类方法
CN112580797A (zh) * 2020-11-26 2021-03-30 广东工业大学 一种多模态多标签预测模型的增量学习方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
何丽等: "双分支迭代的深度增量图像分类方法", 《模式识别与人工智能》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115082740A (zh) * 2022-07-18 2022-09-20 北京百度网讯科技有限公司 目标检测模型训练方法、目标检测方法、装置、电子设备
CN115082740B (zh) * 2022-07-18 2023-09-01 北京百度网讯科技有限公司 目标检测模型训练方法、目标检测方法、装置、电子设备
WO2024060381A1 (zh) * 2022-09-20 2024-03-28 同济大学 一种增量式设备故障诊断方法
CN115578605A (zh) * 2022-11-16 2023-01-06 北京阿丘科技有限公司 基于增量学习的数据分类方法、装置、设备及存储介质
CN116311103A (zh) * 2023-05-10 2023-06-23 江西云眼视界科技股份有限公司 基于增量学习的路面积水检测方法、装置、介质及设备
CN116258944A (zh) * 2023-05-15 2023-06-13 成都理工大学 基于双网络的遥感影像分类模型样本增量学习方法
CN116258944B (zh) * 2023-05-15 2023-07-21 成都理工大学 基于双网络的遥感影像分类模型样本增量学习方法
CN116582372A (zh) * 2023-07-13 2023-08-11 深圳市前海新型互联网交换中心有限公司 一种物联网入侵检测方法、系统、电子设备及存储介质
CN116582372B (zh) * 2023-07-13 2023-09-26 深圳市前海新型互联网交换中心有限公司 一种物联网入侵检测方法、系统、电子设备及存储介质

Also Published As

Publication number Publication date
CN113205142B (zh) 2022-09-06

Similar Documents

Publication Publication Date Title
CN113205142B (zh) 一种基于增量学习的目标检测方法和装置
US11798132B2 (en) Image inpainting method and apparatus, computer device, and storage medium
Oh et al. Crowd counting with decomposed uncertainty
CN108764292B (zh) 基于弱监督信息的深度学习图像目标映射及定位方法
CN109478239B (zh) 检测图像中的对象的方法和对象检测系统
CN105447498B (zh) 配置有神经网络的客户端设备、系统和服务器系统
CN108304775B (zh) 遥感图像识别方法、装置、存储介质以及电子设备
CN111027493B (zh) 一种基于深度学习多网络软融合的行人检测方法
CN112529150B (zh) 一种模型结构、模型训练方法、图像增强方法及设备
WO2018108129A1 (zh) 用于识别物体类别的方法及装置、电子设备
Khan et al. Real-time plant health assessment via implementing cloud-based scalable transfer learning on AWS DeepLens
CN111291637A (zh) 一种基于卷积神经网络的人脸检测方法、装置及设备
CN110197195B (zh) 一种新型面向行为识别的深层网络系统及方法
CN110738235B (zh) 肺结核判定方法、装置、计算机设备及存储介质
CN111126140A (zh) 文本识别方法、装置、电子设备以及存储介质
CN112418195B (zh) 一种人脸关键点检测方法、装置、电子设备及存储介质
CN112070069A (zh) 遥感图像的识别方法和装置
CN113592060A (zh) 一种神经网络优化方法以及装置
JP6107531B2 (ja) 特徴抽出プログラム及び情報処理装置
CN113240079A (zh) 一种模型训练方法及装置
CN112465840A (zh) 语义分割模型训练方法、语义分割方法及相关装置
CN114359289A (zh) 一种图像处理方法及相关装置
CN111507288A (zh) 图像检测方法、装置、计算机设备和存储介质
CN110176006B (zh) 图像前景物体分割方法及装置
WO2022179606A1 (zh) 一种图像处理方法及相关装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant