CN113569940B - 一种基于知识迁移和概率校正的少样本目标检测方法 - Google Patents
一种基于知识迁移和概率校正的少样本目标检测方法 Download PDFInfo
- Publication number
- CN113569940B CN113569940B CN202110837028.0A CN202110837028A CN113569940B CN 113569940 B CN113569940 B CN 113569940B CN 202110837028 A CN202110837028 A CN 202110837028A CN 113569940 B CN113569940 B CN 113569940B
- Authority
- CN
- China
- Prior art keywords
- class
- target
- target detection
- samples
- detector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Biophysics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于知识迁移和概率校正的少样本目标检测方法,该方法包括:获取Base类数据集,构建只有少量样本的Novel类数据集并计算概率校正因子;构建目标检测模型并将Base类的数据输入到目标检测模型中训练分类器模块和回归器模块,得到基础检测器;按批次使用Base类和Novel类的混合数据进一步训练基础检测器。重复上一步骤,直到新的目标检测模型在混合数据集上充分收敛,得到新的目标检测器;利用训练得到的目标检测器对测试图像进行检测,然后得到测试图像目标检测结果。该发明可以适用只有少量标记样本的目标检测场景,能够有效解决计算机视觉中少样本目标检测任务。本发明作为少样本目标检测模型,可广泛应用于少样本目标检测领域及应用场景。
Description
技术领域
本发明涉及目标检测领域,尤其涉及一种基于知识迁移和概率校正的少样本目标检测方法。
技术背景
目标检测作为计算机视觉和模式识别领域的重要任务之一,被广泛地应用在我们生活的每个角落,如安防领域,交通领域,医疗领域等。目标检测包含定位和分类两个子任务。定位是指检测目标在原图的位置,一般用矩形框进行标记。分类是为了判断目标所属的类别,一般用类别标签和对应的概率值进行标记。
现在的目标检测模型通常都是基于深度学习,大致可以分为两种:不需要候选框的单阶段目标检测和需要候选框的两阶段目标检测。 YOLO,SSD等就是不需要候选框的单阶段目标检测模型,他们将整张图输入的CNN网络中得到卷积后的特征图,然后在每个特征点上面进行目标的定位和分类。不同于单阶段目标检测模型,Faster R-CNN, FPN等两阶段的目标检测模型会先在CNN网络得到的特征图上面检测可能存在目标的候选框,然后在对这些候选框做进一步的检测,得到更加准确的定位和分类结果。总的来说,单阶段的目标检测模型在速度上比两阶段的目标检测模型更快,但是两阶段的目标检测模型会比单阶段的目标检测模型更加精准。
然而,现在基于深度学习的目标检测模型都极度地以来大量的带标签数据,但是在一些实际场景中,我们很难获取足够的样本,比如一些濒危动物的样本。除此之外,在很多时候,我们需要检测的目标类别在公开的数据里是没有的,同时人为地去收集新类的大量样本并做标注需要耗费很多人力物力。所以,我们提供了一种只需要提供少量标记样本的目标检测方法来解决这类难题。
发明内容
鉴于现有技术的缺陷,本发明的目的是提供一种基于知识迁移和概率校正的少样本目标检测方法,解决计算机视觉中少样本目标检测任务这一重大难题,使得用户能以极低的代价,很方便地利用现有模型就可以完成少样本目标检测任务。
为了实现上述技术目的,本发明采用的技术方案如下:
一种基于知识迁移和概率校正的少样本目标检测方法,所述方法包括以下步骤:
S1获取Base类数据集,构建只有少量样本的Novel类数据集,统计两个数据集里每个类的样本数目并计算概率校正因子;
S2构建目标检测模型并将Base类的数据输入到目标检测模型中训练分类器模块和回归器模块,得到基础检测器;
S3按批次使用Base类和Novel类的混合数据进一步训练基础检测器;训练过程中,保持回归器模块不变,分类器模块根据概率校正因子对Base类和Novel类的分类概率进行校正,然后再计算损失函数并使用SGD优化器进行模型优化;
S4重复步骤S3,直到新的目标检测模型在混合数据集上充分收敛,得到新的目标检测器;
S5利用步骤S4中训练得到的目标检测器对测试图像进行检测,然后得到测试图像目标检测结果。
需要说明的是,所述步骤S1还包括:
S1.1获取已公开的目标检测数据集作为Base类数据集,数据集的每张图片里都包含若干个目标的类别标签和对应的位置标签;
S1.2为每个所需要检测的新类提供少量的样本,并为每个样本人工标注类别标签和位置标签,从而构建出Novel类数据集;
基于步骤S1.4,需要说明的是,每个类的概率校正因子和各自的样本数目成反比例关系,为了平滑概率校正因子做开四次方的操作。
需要说明的是,所述步骤S2还包括:
S2.1选择Faster R-CNN为目标检测框架,其分类器模块负责目标分类,回归器模块负责目标定位;
S2.2使用Base类数据集训练该目标检测模型,直到模型充分收敛后得到基础检测器。
需要说明的是,所述步骤S3通过知识迁移的方式将基础检测器的定位和分类能力迁移到对Novel类的检测中,还包括:
S3.1保持基础检测器的回归器模块不变,实现将基础检测器的定位能力迁移到检测Novel类中;
S3.2训练基础检测器对Novel的分类能力,该训练按批次进行,每批次选取等比例的Base类样本和Novel类样本,输入到基础检测器中,得到目标对应每个类的分类概率ci,其中,i表示不同的类别;
S3.3将步骤S1得到每个类的概率校正因子分别乘到步骤S3.2 得到的分类概率ci中,得到校正后的模型分类输出c'i=ri×ci;
S3.4使用步骤S3.3得到概率作为输出,利用它与目标的真实类别标签计算分类损失,通过SGD优化器对基础检测器做进一步优化。
需要说明的是,在测试阶段,继续使用步骤S1得到的概率校正因子对分类输出进行校正,得到更加准确的目标类别标签,最终获得目标检测模型。
本发明的有益效果在于,利用在ImageNet上预训练后的模型提取特征,然后通过无监督的降维方法TSNE提取该组图像之间最相似的特征描述实现目标协同定位。
附图说明
图1为本发明一种基于知识迁移和概率校正的少样本目标检测方法的步骤流程图;
图2为本发明中计算概率校正因子的步骤流程图;
图3为本发明一种基于知识迁移和概率校正的少样本目标检测方法的网络模型图。
具体实施例
以下将结合附图对本发明作进一步的描述,需要说明的是,本实施例以本技术方案为前提,给出了详细的实施方式和具体的操作过程,但本发明的保护范围并不限于本实施例。
实施例
如图1、图2,本发明为一种基于知识迁移和概率校正的少样本目标检测方法,所述方法包括以下步骤:
S1获取Base类数据集,构建只有少量样本的Novel类数据集,统计两个数据集里每个类的样本数目并计算概率校正因子。具体地,所述步骤S1包括以下操作:
S11获取已公开的目标检测数据集作为Base类数据集,如 PASCAL VOC,MS COCO等。数据集的每张图片里都包含若干个目标的类别标签和对应的位置标签。
S12为每个所需要检测的新类提供少量的样本,并为每个样本人工标注类别标签和位置标签,从而构建出Novel类数据集。
S2构建目标检测模型并将Base类的数据输入到目标检测模型中训练分类器模块和回归器模块,得到基础检测器。具体地,步骤S2 包含了以下两个操作:
S21选择Faster R-CNN为目标检测框架,其分类器模块负责目标分类,回归器模块负责目标定位;
S22使用Base类数据集训练该目标检测模型,直到模型充分收敛后得到基础检测器。
S3按批次使用Base类和Novel类的混合数据进一步训练基础检测器。训练过程中,保持回归器模块不变,分类器模块根据概率校正因子对Base类和Novel类的分类概率进行校正,然后再计算损失函数。具体地,步骤S3包含以下几个操作:
S31保持基础检测器的回归器模块不变,实现将基础检测器的定位能力迁移到检测Novel类中;
S32训练基础检测器对Novel的分类能力,该训练按批次进行,每批次选取等比例的基类样本和新类样本,输入到基础检测器中,得到目标对应每个类的分类概率ci,i表示不同的类别;
S33将步骤S1得到每个类的概率校正因子分别乘到步骤S32得到的分类概率ci中,得到校正后的模型分类输出c'i=ri×ci;
S34使用步骤S33得到概率作为输出,利用它与目标的真实类别标签计算分类损失,通过SGD优化器对基础检测器做进一步优化。
S4重复步骤S3,直到新的目标检测模型在混合数据集上充分收敛,得到新的目标检测器。
S5利用步骤S4中训练得到的目标检测器对测试图像进行检测,然后得到测试图像目标检测结果。具体地,进一步训练好的目标检测模型,在测试阶段,会继续使用步骤S1得到的概率校正因子对分类输出进行校正,得到更加准确的目标类别标签。
进一步作为本方法的优选实施例,所述步骤S1获取Base类数据集的方式具体包括:下载公开的PASCAL VOC数据集,这个数据集是经典的目标检测数据集,包含20个类,有3万多张图片及对应标签。
进一步作为本方法的优选实施例,所述步骤S2构建目标检测模型,其具体还包括:下载Faster R-CNN的源码,在Linux环境下部署,这个框架包含CNN特征提取网络,RPN候选框提取网络,ROI Pooling层,分类器模块和回归器模块等。
进一步作为本方法优选实施例,所述步骤S2将Base类的数据输入到目标检测模型中训练分类器模块和回归器模块,得到基础检测器,其具体如图3所示:
1、将图片输入到CNN特征提取网络中;
2、使用RPN候选框提取网络提取候选框;
3、使用ROI Pooling层提取候选框对应的卷积特征;
4、将提取的特征输入到分类器模块得到目标的类别标签和对应概率;
5、将提取的特征输入到回归器模块得到目标的定位框位置信息;
6、将步骤4和步骤5的输出与真实标签计算损失函数;
7、结合模型损失,使用SGD优化器对模型进行优化;
8、重复步骤1到步骤7直到模型充分收敛,也就是模型损失低于预设阈值;
9、保存训练好的基础检测器。
进一步作为本方法的优选实施例,所述步骤3按批次使用Base 类和Novel类的混合数据进一步训练基础检测器的步骤,同样可以参考图3。其训练过程类似于基础检测器的训练,不同的是:输出的分类概率需要使用概率校正因子进行纠正,然后再计算模型的损失函数,进而使用SGD优化器进行模型优化,直到模型充分收敛后得到新的目标检测器。
具体地,该方案主要针少样本的目标检测应用场景:
1、任务为检测只有少量标记样本的包裹;
2、获取Base类数据集,选取公开的PASCAL VOC数据集;
3、构建Novel类数据集,均为含有包裹的图片且做好标注;
4、使用Base类数据集训练一个基础检测器,这里选用Faster R-CNN;
5、使用本发明的方法在Base类和Novel类混合数据集上训练;
6、模型充分收敛后,使用新的目标检测器应用到包裹检测任务中,得到包裹检测结果。
对于本领域的技术人员来说,可以根据以上的技术方案和构思,给出各种相应的改变,而所有的这些改变,都应该包括在本发明权利要求的保护范围之内。
Claims (3)
1.一种基于知识迁移和概率校正的少样本目标检测方法,其特征在于,所述方法包括以下步骤:
S1获取Base类数据集,构建只有少量样本的Novel类数据集,统计两个数据集里每个类的样本数目并计算概率校正因子;
S2构建目标检测模型并将Base类的数据输入到目标检测模型中训练分类器模块和回归器模块,得到基础检测器;
S3按批次使用Base类和Novel类的混合数据进一步训练基础检测器;训练过程中,保持回归器模块不变,分类器模块根据概率校正因子对Base类和Novel类的分类概率进行校正,然后再计算损失函数并使用SGD优化器进行模型优化;
S4重复步骤S3,直到新的目标检测模型在混合数据集上充分收敛,得到新的目标检测器;
S5利用步骤S4中训练得到的目标检测器对测试图像进行检测,然后得到测试图像目标检测结果;所述步骤S1还包括:
S1.1获取已公开的目标检测数据集作为Base类数据集,数据集的每张图片里都包含若干个目标的类别标签和对应的位置标签;
S1.2为每个所需要检测的新类提供少量的样本,并为每个样本人工标注类别标签和位置标签,从而构建出Novel类数据集;
S1.3:统计两个数据集里每个类的样本数目si,其中,i表示不同的类别;并得到样本总数sall=∑si;
所述步骤S3通过知识迁移的方式将基础检测器的定位和分类能力迁移到对Novel类的检测中,还包括:
S3.1保持基础检测器的回归器模块不变,实现将基础检测器的定位能力迁移到检测Novel类中;
S3.2训练基础检测器对Novel的分类能力,该训练按批次进行,每批次选取等比例的Base类样本和Novel类样本,输入到基础检测器中,得到目标对应每个类的分类概率ci,其中,i表示不同的类别;
S3.3将步骤S1得到每个类的概率校正因子分别乘到步骤S3.2
得到的分类概率ci中,得到校正后的模型分类输出ci=i×ci;
S3.4使用步骤S3.3得到概率作为输出,利用它与目标的真实类别标签计算分类损失,通过SGD优化器对基础检测器做进一步优化。
2.根据权利要求1所述基于知识迁移和概率校正的少样本目标检测方法,其特征在于,所述步骤S2还包括:
S2.1选择Faster R-CNN为目标检测框架,其分类器模块负责目标分类,回归器模块负责目标定位;
S2.2使用Base类数据集训练该目标检测模型,直到模型充分收敛后得到基础检测器。
3.根据权利要求1所述基于知识迁移和概率校正的少样本目标检测方法,其特征在于,在测试阶段,继续使用步骤S1得到的概率校正因子对分类输出进行校正,得到更加准确的目标类别标签,最终获得目标检测模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110837028.0A CN113569940B (zh) | 2021-07-23 | 2021-07-23 | 一种基于知识迁移和概率校正的少样本目标检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110837028.0A CN113569940B (zh) | 2021-07-23 | 2021-07-23 | 一种基于知识迁移和概率校正的少样本目标检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113569940A CN113569940A (zh) | 2021-10-29 |
CN113569940B true CN113569940B (zh) | 2023-06-06 |
Family
ID=78166749
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110837028.0A Active CN113569940B (zh) | 2021-07-23 | 2021-07-23 | 一种基于知识迁移和概率校正的少样本目标检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113569940B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114140398B (zh) * | 2021-11-15 | 2024-07-16 | 上海大学 | 一种利用无缺陷图像的少样本缺陷检测方法 |
CN117011630B (zh) * | 2022-09-16 | 2024-08-06 | 腾讯科技(深圳)有限公司 | 一种目标检测模型的训练方法及装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109616105A (zh) * | 2018-11-30 | 2019-04-12 | 江苏网进科技股份有限公司 | 一种基于迁移学习的带噪语音识别方法 |
CN110321926A (zh) * | 2019-05-24 | 2019-10-11 | 北京理工大学 | 一种基于深度残差修正网络的迁移方法及系统 |
CN110472545A (zh) * | 2019-08-06 | 2019-11-19 | 中北大学 | 基于知识迁移学习的航拍电力部件图像的分类方法 |
CN112115916A (zh) * | 2020-09-29 | 2020-12-22 | 西安电子科技大学 | 域适应Faster R-CNN半监督SAR检测方法 |
CN112149722A (zh) * | 2020-09-11 | 2020-12-29 | 南京大学 | 一种基于无监督域适应的图像自动标注方法 |
CN112364931A (zh) * | 2020-11-20 | 2021-02-12 | 长沙军民先进技术研究有限公司 | 基于元特征和权重调整的少样本目标检测方法及网络模型 |
-
2021
- 2021-07-23 CN CN202110837028.0A patent/CN113569940B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109616105A (zh) * | 2018-11-30 | 2019-04-12 | 江苏网进科技股份有限公司 | 一种基于迁移学习的带噪语音识别方法 |
CN110321926A (zh) * | 2019-05-24 | 2019-10-11 | 北京理工大学 | 一种基于深度残差修正网络的迁移方法及系统 |
CN110472545A (zh) * | 2019-08-06 | 2019-11-19 | 中北大学 | 基于知识迁移学习的航拍电力部件图像的分类方法 |
CN112149722A (zh) * | 2020-09-11 | 2020-12-29 | 南京大学 | 一种基于无监督域适应的图像自动标注方法 |
CN112115916A (zh) * | 2020-09-29 | 2020-12-22 | 西安电子科技大学 | 域适应Faster R-CNN半监督SAR检测方法 |
CN112364931A (zh) * | 2020-11-20 | 2021-02-12 | 长沙军民先进技术研究有限公司 | 基于元特征和权重调整的少样本目标检测方法及网络模型 |
Non-Patent Citations (1)
Title |
---|
基于CNN的SAR车辆目标检测;常沛;夏勇;李玉景;吴涛;;雷达科学与技术(第02期);第1-5页 * |
Also Published As
Publication number | Publication date |
---|---|
CN113569940A (zh) | 2021-10-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11657602B2 (en) | Font identification from imagery | |
CN109919317B (zh) | 一种机器学习模型训练方法和装置 | |
CN113569940B (zh) | 一种基于知识迁移和概率校正的少样本目标检测方法 | |
CN112926405A (zh) | 一种安全帽佩戴检测方法、系统、设备及存储介质 | |
CN111967313B (zh) | 一种深度学习目标检测算法辅助的无人机图像标注方法 | |
WO2022218396A1 (zh) | 图像处理方法、装置和计算机可读存储介质 | |
CN111461101B (zh) | 工服标志的识别方法、装置、设备及存储介质 | |
CN110136198A (zh) | 图像处理方法及其装置、设备和存储介质 | |
CN112149722A (zh) | 一种基于无监督域适应的图像自动标注方法 | |
CN110222582B (zh) | 一种图像处理方法和相机 | |
CN111931581A (zh) | 一种基于卷积神经网络农业害虫识别方法、终端及可读存储介质 | |
CN110175657B (zh) | 一种图像多标签标记方法、装置、设备及可读存储介质 | |
CN111832578A (zh) | 兴趣点信息处理方法、装置、电子设备和存储介质 | |
CN111680705A (zh) | 适于目标检测的mb-ssd方法和mb-ssd特征提取网络 | |
CN109993187A (zh) | 一种用于识别物体类别的建模方法、机器人及存储装置 | |
CN113158891A (zh) | 一种基于全局特征匹配的跨摄像头行人重识别方法 | |
CN114241495B (zh) | 一种用于脱机手写文本识别的数据增强方法 | |
CN109657728A (zh) | 样例生产方法及模型训练方法 | |
CN117115614A (zh) | 户外影像的对象识别方法、装置、设备及存储介质 | |
CN117197864A (zh) | 基于深度学习的证件照分类识别及免冠检测方法及系统 | |
CN110956174A (zh) | 一种器件编号的识别方法 | |
CN116597244A (zh) | 一种基于元学习方法的小样本目标检测方法 | |
CN116310293A (zh) | 一种基于弱监督学习的生成高质量候选框目标检测方法 | |
CN113065559B (zh) | 图像比对方法、装置、电子设备及存储介质 | |
CN115424280A (zh) | 基于改进Faster-RCNN的手写数字检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |