CN113569940B

CN113569940B - 一种基于知识迁移和概率校正的少样本目标检测方法

Info

Publication number: CN113569940B
Application number: CN202110837028.0A
Authority: CN
Inventors: 马锦华; 吴发明; 胡彦旭
Original assignee: Sun Yat Sen University
Current assignee: Sun Yat Sen University
Priority date: 2021-07-23
Filing date: 2021-07-23
Publication date: 2023-06-06
Anticipated expiration: 2041-07-23
Also published as: CN113569940A

Abstract

本发明公开了一种基于知识迁移和概率校正的少样本目标检测方法，该方法包括：获取Base类数据集，构建只有少量样本的Novel类数据集并计算概率校正因子；构建目标检测模型并将Base类的数据输入到目标检测模型中训练分类器模块和回归器模块，得到基础检测器；按批次使用Base类和Novel类的混合数据进一步训练基础检测器。重复上一步骤，直到新的目标检测模型在混合数据集上充分收敛，得到新的目标检测器；利用训练得到的目标检测器对测试图像进行检测，然后得到测试图像目标检测结果。该发明可以适用只有少量标记样本的目标检测场景，能够有效解决计算机视觉中少样本目标检测任务。本发明作为少样本目标检测模型，可广泛应用于少样本目标检测领域及应用场景。

Description

一种基于知识迁移和概率校正的少样本目标检测方法

技术领域

本发明涉及目标检测领域，尤其涉及一种基于知识迁移和概率校正的少样本目标检测方法。

技术背景

目标检测作为计算机视觉和模式识别领域的重要任务之一，被广泛地应用在我们生活的每个角落，如安防领域，交通领域，医疗领域等。目标检测包含定位和分类两个子任务。定位是指检测目标在原图的位置，一般用矩形框进行标记。分类是为了判断目标所属的类别，一般用类别标签和对应的概率值进行标记。

现在的目标检测模型通常都是基于深度学习，大致可以分为两种：不需要候选框的单阶段目标检测和需要候选框的两阶段目标检测。 YOLO，SSD等就是不需要候选框的单阶段目标检测模型，他们将整张图输入的CNN网络中得到卷积后的特征图，然后在每个特征点上面进行目标的定位和分类。不同于单阶段目标检测模型，Faster R-CNN， FPN等两阶段的目标检测模型会先在CNN网络得到的特征图上面检测可能存在目标的候选框，然后在对这些候选框做进一步的检测，得到更加准确的定位和分类结果。总的来说，单阶段的目标检测模型在速度上比两阶段的目标检测模型更快，但是两阶段的目标检测模型会比单阶段的目标检测模型更加精准。

然而，现在基于深度学习的目标检测模型都极度地以来大量的带标签数据，但是在一些实际场景中，我们很难获取足够的样本，比如一些濒危动物的样本。除此之外，在很多时候，我们需要检测的目标类别在公开的数据里是没有的，同时人为地去收集新类的大量样本并做标注需要耗费很多人力物力。所以，我们提供了一种只需要提供少量标记样本的目标检测方法来解决这类难题。

发明内容

鉴于现有技术的缺陷，本发明的目的是提供一种基于知识迁移和概率校正的少样本目标检测方法，解决计算机视觉中少样本目标检测任务这一重大难题，使得用户能以极低的代价，很方便地利用现有模型就可以完成少样本目标检测任务。

为了实现上述技术目的，本发明采用的技术方案如下：

一种基于知识迁移和概率校正的少样本目标检测方法，所述方法包括以下步骤：

S1获取Base类数据集，构建只有少量样本的Novel类数据集，统计两个数据集里每个类的样本数目并计算概率校正因子；

S2构建目标检测模型并将Base类的数据输入到目标检测模型中训练分类器模块和回归器模块，得到基础检测器；

S3按批次使用Base类和Novel类的混合数据进一步训练基础检测器；训练过程中，保持回归器模块不变，分类器模块根据概率校正因子对Base类和Novel类的分类概率进行校正，然后再计算损失函数并使用SGD优化器进行模型优化；

S4重复步骤S3，直到新的目标检测模型在混合数据集上充分收敛，得到新的目标检测器；

S5利用步骤S4中训练得到的目标检测器对测试图像进行检测，然后得到测试图像目标检测结果。

需要说明的是，所述步骤S1还包括：

S1.1获取已公开的目标检测数据集作为Base类数据集，数据集的每张图片里都包含若干个目标的类别标签和对应的位置标签；

S1.2为每个所需要检测的新类提供少量的样本，并为每个样本人工标注类别标签和位置标签，从而构建出Novel类数据集；

S1.3：统计两个数据集里每个类的样本数目s_i，其中，i表示不同的类别；并得到样本总数

S1.4：根据步骤S1.3得到的样本总数，计算出每个类的概率校正因子

基于步骤S1.4，需要说明的是，每个类的概率校正因子和各自的样本数目成反比例关系，为了平滑概率校正因子做开四次方的操作。

需要说明的是，所述步骤S2还包括：

S2.1选择Faster R-CNN为目标检测框架，其分类器模块负责目标分类，回归器模块负责目标定位；

S2.2使用Base类数据集训练该目标检测模型，直到模型充分收敛后得到基础检测器。

需要说明的是，所述步骤S3通过知识迁移的方式将基础检测器的定位和分类能力迁移到对Novel类的检测中，还包括：

S3.1保持基础检测器的回归器模块不变，实现将基础检测器的定位能力迁移到检测Novel类中；

S3.2训练基础检测器对Novel的分类能力，该训练按批次进行，每批次选取等比例的Base类样本和Novel类样本，输入到基础检测器中，得到目标对应每个类的分类概率c_i,其中，i表示不同的类别；

S3.3将步骤S1得到每个类的概率校正因子分别乘到步骤S3.2 得到的分类概率c_i中，得到校正后的模型分类输出c'_i＝r_i×c_i；

S3.4使用步骤S3.3得到概率作为输出，利用它与目标的真实类别标签计算分类损失，通过SGD优化器对基础检测器做进一步优化。

需要说明的是，在测试阶段，继续使用步骤S1得到的概率校正因子对分类输出进行校正，得到更加准确的目标类别标签，最终获得目标检测模型。

本发明的有益效果在于，利用在ImageNet上预训练后的模型提取特征，然后通过无监督的降维方法TSNE提取该组图像之间最相似的特征描述实现目标协同定位。

附图说明

图1为本发明一种基于知识迁移和概率校正的少样本目标检测方法的步骤流程图；

图2为本发明中计算概率校正因子的步骤流程图；

图3为本发明一种基于知识迁移和概率校正的少样本目标检测方法的网络模型图。

具体实施例

以下将结合附图对本发明作进一步的描述，需要说明的是，本实施例以本技术方案为前提，给出了详细的实施方式和具体的操作过程，但本发明的保护范围并不限于本实施例。

实施例

如图1、图2，本发明为一种基于知识迁移和概率校正的少样本目标检测方法，所述方法包括以下步骤：

S1获取Base类数据集，构建只有少量样本的Novel类数据集，统计两个数据集里每个类的样本数目并计算概率校正因子。具体地，所述步骤S1包括以下操作：

S11获取已公开的目标检测数据集作为Base类数据集，如 PASCAL VOC，MS COCO等。数据集的每张图片里都包含若干个目标的类别标签和对应的位置标签。

S12为每个所需要检测的新类提供少量的样本，并为每个样本人工标注类别标签和位置标签，从而构建出Novel类数据集。

S13统计两个数据集里每个类的样本数目s_i，i表示不同的类别。并得到样本总数

S14根据步骤S13得到的数据，计算出每个类的概率校正因子

需要指出的是，每个类的概率校正因子和各自的样本数目成反比例关系，为了平滑概率校正因子做开四次方的操作。

S2构建目标检测模型并将Base类的数据输入到目标检测模型中训练分类器模块和回归器模块，得到基础检测器。具体地，步骤S2 包含了以下两个操作：

S21选择Faster R-CNN为目标检测框架，其分类器模块负责目标分类，回归器模块负责目标定位；

S22使用Base类数据集训练该目标检测模型，直到模型充分收敛后得到基础检测器。

S3按批次使用Base类和Novel类的混合数据进一步训练基础检测器。训练过程中，保持回归器模块不变，分类器模块根据概率校正因子对Base类和Novel类的分类概率进行校正，然后再计算损失函数。具体地，步骤S3包含以下几个操作：

S31保持基础检测器的回归器模块不变，实现将基础检测器的定位能力迁移到检测Novel类中；

S32训练基础检测器对Novel的分类能力，该训练按批次进行，每批次选取等比例的基类样本和新类样本，输入到基础检测器中，得到目标对应每个类的分类概率c_i,i表示不同的类别；

S33将步骤S1得到每个类的概率校正因子分别乘到步骤S32得到的分类概率c_i中，得到校正后的模型分类输出c'_i＝r_i×c_i；

S34使用步骤S33得到概率作为输出，利用它与目标的真实类别标签计算分类损失，通过SGD优化器对基础检测器做进一步优化。

S4重复步骤S3，直到新的目标检测模型在混合数据集上充分收敛，得到新的目标检测器。

S5利用步骤S4中训练得到的目标检测器对测试图像进行检测，然后得到测试图像目标检测结果。具体地，进一步训练好的目标检测模型，在测试阶段，会继续使用步骤S1得到的概率校正因子对分类输出进行校正，得到更加准确的目标类别标签。

进一步作为本方法的优选实施例，所述步骤S1获取Base类数据集的方式具体包括：下载公开的PASCAL VOC数据集，这个数据集是经典的目标检测数据集，包含20个类，有3万多张图片及对应标签。

进一步作为本方法的优选实施例，所述步骤S2构建目标检测模型，其具体还包括：下载Faster R-CNN的源码，在Linux环境下部署，这个框架包含CNN特征提取网络，RPN候选框提取网络，ROI Pooling层，分类器模块和回归器模块等。

进一步作为本方法优选实施例，所述步骤S2将Base类的数据输入到目标检测模型中训练分类器模块和回归器模块，得到基础检测器，其具体如图3所示：

1、将图片输入到CNN特征提取网络中；

2、使用RPN候选框提取网络提取候选框；

3、使用ROI Pooling层提取候选框对应的卷积特征；

4、将提取的特征输入到分类器模块得到目标的类别标签和对应概率；

5、将提取的特征输入到回归器模块得到目标的定位框位置信息；

6、将步骤4和步骤5的输出与真实标签计算损失函数；

7、结合模型损失，使用SGD优化器对模型进行优化；

8、重复步骤1到步骤7直到模型充分收敛，也就是模型损失低于预设阈值；

9、保存训练好的基础检测器。

进一步作为本方法的优选实施例，所述步骤3按批次使用Base 类和Novel类的混合数据进一步训练基础检测器的步骤，同样可以参考图3。其训练过程类似于基础检测器的训练，不同的是：输出的分类概率需要使用概率校正因子进行纠正，然后再计算模型的损失函数，进而使用SGD优化器进行模型优化，直到模型充分收敛后得到新的目标检测器。

具体地，该方案主要针少样本的目标检测应用场景：

1、任务为检测只有少量标记样本的包裹；

2、获取Base类数据集，选取公开的PASCAL VOC数据集；

3、构建Novel类数据集，均为含有包裹的图片且做好标注；

4、使用Base类数据集训练一个基础检测器，这里选用Faster R-CNN；

5、使用本发明的方法在Base类和Novel类混合数据集上训练；

6、模型充分收敛后，使用新的目标检测器应用到包裹检测任务中，得到包裹检测结果。

对于本领域的技术人员来说，可以根据以上的技术方案和构思，给出各种相应的改变，而所有的这些改变，都应该包括在本发明权利要求的保护范围之内。

Claims

1.一种基于知识迁移和概率校正的少样本目标检测方法，其特征在于，所述方法包括以下步骤：

S5利用步骤S4中训练得到的目标检测器对测试图像进行检测，然后得到测试图像目标检测结果；所述步骤S1还包括：

S1.3：统计两个数据集里每个类的样本数目s_i，其中，i表示不同的类别；并得到样本总数s_all＝∑s_i；

所述步骤S3通过知识迁移的方式将基础检测器的定位和分类能力迁移到对Novel类的检测中，还包括：

S3.3将步骤S1得到每个类的概率校正因子分别乘到步骤S3.2

得到的分类概率c_i中，得到校正后的模型分类输出c_i＝_i×c_i；

2.根据权利要求1所述基于知识迁移和概率校正的少样本目标检测方法，其特征在于，所述步骤S2还包括：

3.根据权利要求1所述基于知识迁移和概率校正的少样本目标检测方法，其特征在于，在测试阶段，继续使用步骤S1得到的概率校正因子对分类输出进行校正，得到更加准确的目标类别标签，最终获得目标检测模型。