CN113128513A

CN113128513A - 一种基于目标分割的小样本训练方法

Info

Publication number: CN113128513A
Application number: CN202110464870.4A
Authority: CN
Inventors: 张翔; 钟升; 匡乃亮; 唐磊; 范建平; 罗迒哉
Original assignee: Xian Microelectronics Technology Institute; Northwestern University
Current assignee: Xian Microelectronics Technology Institute; Northwestern University
Priority date: 2021-04-28
Filing date: 2021-04-28
Publication date: 2021-07-16
Anticipated expiration: 2041-04-28
Also published as: CN113128513B

Abstract

本发明公开了一种基于目标分割的小样本训练方法，属于图像语义分割领域。本发明包括：一、进行小样本数据集的目标类的分割，生成初始像素级标签；二、在小样本数据集上迭代训练所述语义分割网络，生成精细的像素级标签；三、将分割结果作用于原始图像上，得到目标图像；四、将所述目标图像融到大量图像中，生成带有所述目标图像的新图像，进而生成大量带有像素级标签的新图像；五、使用大量带有像素级标签的新图像来训练语义分割网络，从而训练一个可信赖的语义分割网络。本发明解决了人工标注像素级语义标签的耗时耗力操作，能够实现目标的精细化分割，为图像分割、目标检测提供良好的标注数据。

Description

一种基于目标分割的小样本训练方法

技术领域

本发明属于图像语义分割领域，尤其是一种基于目标分割的小样本训练方法。

背景技术

图像语义分割是计算机视觉的一项任务，它分配给每个像素一个语义标签，即图像中每个像素都有一个标签，比如对于二值分割，分割出前景目标和背景两类，其中前景目标的标签是1，背景的标签是0。语义分割广泛应用在各个领域，包括：自动驾驶、影像诊断等领域。

图像语义分割方法主要分为两大类：强监督语义分割和弱监督语义分割。强监督语义分割需要人工标注大量的像素级语义标签，这一过程耗时耗力且标注的标签质量因人而异；弱监督方法不需要像素级的图像标签，而是使用较弱的标签比如bounding boxes、scribbles，有的仅仅使用图像级标签来实现图像语义分割。尽管弱监督语义分割能够减少对像素级标签的需求但是这类算法往往需要大量的训练图片，收集大量的相关类别的图像也是非常耗时的工作。

发明内容

本发明的目的在于能够解决强监督语义分割存在的标注大量像素级标签及弱监督语义分割需要大量训练图片的问题，提供一种基于目标分割的小样本训练方法。

为达到上述目的，本发明采用以下技术方案予以实现：

一种基于目标分割的小样本训练方法，包括以下步骤：

步骤1：采用迁移学习的方法在带有像素级的标签数据集中训练语义分割网络，将分割知识迁移到语义相似类中实现待分割的小样本数据集的目标类的分割，生成初始像素级标签；

步骤2：在小样本数据集上迭代训练所述语义分割网络，将训练好的模型作为语义分割网络来生成精细的像素级标签；

步骤3：将步骤2的分割结果作用于原始图像上，生成只有目标的区域，得到目标图像；

步骤4：将所述目标图像融到大量图像中，生成带有所述目标图像的新图像，进而生成大量带有像素级标签的新图像；

步骤5：使用所述大量带有像素级标签的新图像来训练语义分割网络，从而训练一个可信赖的语义分割网络。

进一步的，步骤1中带有像素级的标签数据集包括PASCAL VOC、COCO及BSD语义分割数据集。

进一步的，步骤1中语义分割网络为DeepLabv3语义分割网络。

进一步的，步骤2中在小样本数据集上迭代训练所述语义分割网络，具体为：

步骤2-1、利用步骤1)训练得到的语义分割网络在小样本数据集上进行分割得到目标图像的粗标签；

步骤2-2、采用指导滤波细化分割结果；

步骤2-3、计算分割区域的面积，将所述分割区域的面积与整个图像的面积相比，得到比值；

若比值大于MAX或者小于MIN，则过滤掉分割结果；

步骤2-4、迭代步骤2-2～步骤2-3，步骤2-2的每次输入是上一次过滤掉的标签和原始图像，迭代到Mean Intersection over Union不再增长为止，将此时对应的模型作为分割模型，来生成精细化的分割结果。

进一步的，步骤2-2中采用指导滤波细化分割结果，具体为：

将原始图像和粗粒度标签输入到指导滤波中，指导滤波将原始图像的结构和边缘细节迁移到粗粒度标签中，从而得到细化的分割结果。

进一步的，所述指导滤波输出公式如下：

其中，w_ij是权重，取决于图像I，i和j表示像素索引；φ为粗粒度标签。

进一步的，步骤2-3中通过目标和图像的关系来确定MAX和MIN。

进一步的，MAX为0.9，MIN为0.1。

进一步的，步骤1中采用OTSU算法从图像中生成目标的初始像素级标签。

与现有技术相比，本发明具有以下有益效果：

本发明的基于目标分割的小样本训练方法，能够生成大规模带有像素级标签的训练图像用于图像语义分割任务，生成的分割结果可以媲美手工标注的像素级分割标签。本发明解决了人工标注像素级语义标签的耗时耗力操作，能够实现目标的精细化分割，为图像分割、目标检测提供良好的标注数据。

进一步的，使用传统的指导滤波方法融合原始图像的细节信息，从而进一步细化分割目标。

附图说明

图1为实施例的分割图，其中图1(a)-图1(f)为原图，图1(a`)-图1(f`)为对应的分割图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分的实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。

需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

下面结合附图对本发明做进一步详细描述：

步骤1、生成初始像素级标签

对于待分割的目标类，在公开的带有像素级的标签数据集中找所述目标类的语义相似类；

在公开的带有像素级标签的数据集中且没有语义相似类，采用OTSU算法从简单图像中生成目标的像素级标签；

采用DeepLabv3语义分割网络在带有像素级的标签数据集上训练语义分割网络；使用迁移学习的方法从带有像素级的标签数据集中训练语义分割网络，并将迁移知识迁移到语义相似类中实现这些类的分割。

带有像素级的标签数据集如PASCAL VOC,COCO，BSD等公开的语义分割数据集，这些数据集包含了现实生活着最常用的类的目标，与这些目标语义相似的类成千上万，这些类和相似类包含了现实生活中70％-80％的目标。

步骤2、在小样本数据集上迭代训练语义分割网络，生成精细的像素级标签；

步骤2-1、利用步骤1)生成的DeepLabv3+语义分割网络在小样本数据集上进行分割得到目标图像的粗标签；

步骤2-2、采用指导滤波进一步细化分割结果，通过指导滤波能够有效的分割图像的边缘细节

指导滤波网络有两个输入：(a)原始彩色图像；(b)粗粒度标签，指导滤波网络输出公式如下：

其中，w_ij是权重，取决于图像I；

步骤2-3、计算分割区域的面积，将其与整个图像的面积相比，若比值大于0.9，则过滤掉，因为目标一般不会占整个图像；若比值小于0.1也过滤掉，因为目标过小；

这两个阈值与目标本身有关，通过目标和图像的关系来确定这两个阈值；

步骤2-4、迭代步骤2-2～步骤2-3，每次输入是上一次过滤掉的标签和原始图像，迭代到mIoU不在增长时为止，选取mIoU最好的模型作为分割模型，来生成最终的精细化的分割结果。

步骤4、将步骤3中的目标图像融到大量图像中，得到带有目标图像的新图像，经过这一过程能从小样本中生成大量的带有像素级标签的图像；

步骤5、使用步骤4的大量带有像素级标签的图像来训练语义分割网络。

参见图1，图1(a)-图1(f)为原图，图1(a`)-图1(f`)为对应的分割图，从得到的分割结果可以看出，提出的方法能够自动生成像素级标签，生成像素级标签可以媲美手工标注的像素级分割标签。

以上内容仅为说明本发明的技术思想，不能以此限定本发明的保护范围，凡是按照本发明提出的技术思想，在技术方案基础上所做的任何改动，均落入本发明权利要求书的保护范围之内。

Claims

1.一种基于目标分割的小样本训练方法，其特征在于，包括以下步骤：

步骤2：在小样本数据集上迭代训练所述语义分割网络，将最终训练好的模型作为语义分割网络来生成精细的像素级标签；

2.根据权利要求1所述的基于目标分割的小样本训练方法，其特征在于，步骤1中带有像素级的标签数据集包括PASCAL VOC、COCO及BSD语义分割数据集。

3.根据权利要求1所述的基于目标分割的小样本训练方法，其特征在于，步骤1中语义分割网络为DeepLabv3语义分割网络。

4.根据权利要求1所述的基于目标分割的小样本训练方法，其特征在于，步骤2中在小样本数据集上迭代训练所述语义分割网络，具体为：

步骤2-2、采用指导滤波细化分割结果；

若比值大于MAX或者小于MIN，则过滤掉分割结果；

5.根据权利要求4所述的基于目标分割的小样本训练方法，其特征在于，步骤2-2中采用指导滤波细化分割结果，具体为：

6.根据权利要求5所述的基于目标分割的小样本训练方法，其特征在于，所述指导滤波输出公式如下：

7.根据权利要求4所述的基于目标分割的小样本训练方法，其特征在于，步骤2-3中通过目标和图像的关系来确定MAX和MIN。

8.根据权利要求7所述的基于目标分割的小样本训练方法，其特征在于，MAX为0.9，MIN为0.1。

9.根据权利要求1所述的基于目标分割的小样本训练方法，其特征在于，步骤1中采用OTSU算法从图像中生成目标的初始像素级标签。