CN114549842A

CN114549842A - 基于不确定性知识域自适应的半监督图像分割方法及系统

Info

Publication number: CN114549842A
Application number: CN202210423986.8A
Authority: CN
Inventors: 袭肖明; 孙良运; 聂秀山; 张光
Original assignee: Shandong Jianzhu University
Current assignee: Shandong Jianzhu University
Priority date: 2022-04-22
Filing date: 2022-04-22
Publication date: 2022-05-27
Anticipated expiration: 2042-04-22
Also published as: US20230342938A1; CN114549842B

Abstract

本申请属于图像分割技术领域，具体涉及一种基于不确定性知识域自适应的半监督图像分割方法及系统，包括以下步骤：获取待分割图像；基于所获取的待分割图像和预设的图像分割模型，进行待分割图像的分割处理；其中，所述图像分割模型采用半监督分割模型，基于所构建的不确定性知识库提取所获取的待分割图像的图像样本特征，基于特征迁移的域自适应将所提取到的图像样本特征迁移到半监督分割模型，完成待分割图像的分割处理。

Description

基于不确定性知识域自适应的半监督图像分割方法及系统

技术领域

本申请属于图像分割技术领域，具体涉及一种基于不确定性知识域自适应的半监督图像分割方法及系统。

背景技术

本部分的陈述仅仅是提供了与本申请相关的背景技术信息，不必然构成在先技术。

图像分割是计算机视觉的重要研究方向，在图像分析、自动驾驶、疾病诊断等众多任务中具有广泛的应用。近年来，深度卷积神经网络在语义分割方面取得了显著的进展。然而，基于卷积神经网络（Convolutional Neural Networks,简称CNN）的方法的成功得益于大量人工标记的数据。数据标记通常需要昂贵的时间成本，故而全监督语义分割对像素级别的手动标记的需求使得其比目标检测和图像分类等其他视觉任务所花费的成本更为昂贵。半监督分割方法可以利用大量的未标记数据和少量的标记数据学习分割模型，进而解决由于标记数据较少造成的分割精度下降的问题。

据发明人了解，现有的半监督方法虽然可在一定程度上解决标记数据较少的问题，但难以学习异常图像中所包含的不确定性知识（由于设备、外部采集环境等不确定因素造成的异常图像中包含的模糊特征）；例如，设备、外部采集环境等不确定性因素引起光学相干断层扫描仪(Optical Coherence Tomography，简称OCT)图像的异常（例如，噪声，边界模糊等等），影响了分割模型的精度。

发明内容

为了解决上述问题，本申请提出了一种基于不确定性知识域自适应的半监督图像分割方法及系统，引入不确定性知识迁移正则化项，将不确定性知识迁移到图像分割模型中，引入自训练模式，增加有效标记数据的数量，提升半监督分割框架的分割精度，有效地解决标记数据较少和不确定性因素引起的分割精度低问题。

根据一些实施例，本申请的第一方案提供了一种基于不确定性知识域自适应的半监督图像分割方法，采用如下技术方案：

一种基于不确定性知识域自适应的半监督图像分割方法，包括以下步骤：

获取待分割图像；

基于所获取的待分割图像和预设的图像分割模型，进行待分割图像的分割处理；

其中，所述图像分割模型采用半监督分割模型，基于所构建的不确定性知识库提取所获取的待分割图像的图像样本特征，基于特征迁移的域自适应将所提取到的图像样本特征迁移到半监督分割模型，完成待分割图像的分割处理。

作为进一步的技术限定，在构建不确定性知识库之前，对数据集进行数据增强的预处理；所述预处理包括随机裁剪、水平翻转、垂直翻转、随机旋转和添加高斯噪声。

进一步的，对预处理后的数据集进行图像尺寸的归一化处理，保证预处理后的数据集中的所有图片尺寸大小统一。

进一步的，在构建不确定性知识库的过程中，通过数据增强构造包含错分区域特征的图像，基于所构造的包含错分区域特征的图像得到不确定性知识。

进一步对，利用预训练好的U-net网络对输入图像进行分割，得到输入图像的分割掩模图，对标签图像的掩模图与输入图像的分割掩模图作差，得到包含错分区域的掩模图，完成错分区域的提取。

进一步的，对所得到的包含错分区域的掩模图取反，得到反向掩模图，实现数据增强框架掩码的重构；将重构后的数据增强框架掩码与反向掩模图进行点乘，得到新掩模图掩码；用新掩模图掩码替换据增强框架掩码，对输入图像进行数据增强，替换未错分区域，完成不确定性知识库的构建。

进一步的，对所得到的包含错分区域的掩模图取反的具体过程为：将所得到的包含错分区域的掩模图中的像素值为1的像素点赋值0，将所得到的包含错分区域的掩模图中的像素值为0的像素点赋值1。

作为进一步的技术限定，所述基于特征迁移的域自适应的过程中，采用不确定知识域自适应的双分支网络，所述包括第一分支和第二分支；所述第一分支通过提取不确定知识库中的图像样本特征，得到中间特征图；结合第二分支提取目标域中有标记输入样本的特征，得到标记目标域特征图；对所得到的中间特征图和所述标记目标域特征图施加知识迁移正则化项，完成特征迁移。

进一步对，所述知识迁移正则化项采用加权的相对熵，通过降低相对熵的数值拉进所述中间特征图与所述标记目标域特征图之间的分布距离。

根据一些实施例，本申请的第二方案提供了一种基于不确定性知识域自适应的半监督图像分割系统，采用如下技术方案：

一种基于不确定性知识域自适应的半监督图像分割系统，包括：

获取模块，被配置为获取待分割图像；

分割模块，被配置为基于所获取的待分割图像和预设的图像分割模型，进行待分割图像的分割处理；

与现有技术相比，本申请的有益效果为：

本申请提出了一种不确定性知识域自适应的半监督分割网络。将域自适应与半监督框架相结合，引入不确定性知识提升了半监督分割网络的精度。不同于传统的分割网络采用单分支结构，本发明提出的网络采用两个分支；第一个分支学习传统的分割模型难以获取的不确定性知识，通过引入域一致性约束将学到的不确定性知识融入到分割模型中。相对于传统的半监督框架而言，本发明针对性地学习了异常图像的专有知识，并将其迁移到分割模型中，对于异常图像可以取得更好的分割效果，融合了正则化一致性和自训练模式，可以更有效地利用未标记数据，进一步提升半监督分割方法的精度。

附图说明

构成本申请的一部分的说明书附图用来提供对本申请的进一步理解，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。

图1是本申请实施例一中的基于不确定性知识域自适应的半监督图像分割方法的流程图；

图2是本申请实施例一中的基于不确定性知识域自适应的半监督图像分割方法的网络学习流程图；

图3是本申请实施例二中的基于不确定性知识域自适应的半监督图像分割系统的结构框图。

具体实施方式

下面结合附图与实施例对本申请作进一步说明。

应该指出，以下详细说明都是例示性的，旨在对本申请提供进一步的说明。除非另有指明，本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是，这里所使用的术语仅是为了描述具体实施方式，而非意图限制根据本申请的示例性实施方式。如在这里所使用的，除非上下文另外明确指出，否则单数形式也意图包括复数形式，此外，还应当理解的是，当在本说明书中使用术语“包含”和/或“包括”时，其指明存在特征、步骤、操作、器件、组件和/或它们的组合。

在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。

实施例一

本申请实施例一介绍了一种基于不确定性知识域自适应的半监督图像分割方法。

如图1所示的一种基于不确定性知识域自适应的半监督图像分割方法，包括以下步骤：

获取待分割图像；

具体的，如图2所示，基于本实施例中的基于不确定性知识域自适应的半监督图像分割方法实现图像分割的网络学习过程包括以下步骤：

步骤S01：数据集预处理；

步骤S02：构建不确定性知识库；

步骤S03：不确定性知识迁移；

步骤S04：构建半监督分割框架；

步骤S05：网络训练。

作为一种或多种实施方式，在步骤S01中，由于原始数据集中包含的图像样本可能出现尺寸大小不一致的情况，不利于深度网络模型进行特征的提取及后续的学习。故而需要对现有数据集进行尺寸大小的归一化操作，归一化操作为针对数据集中的所有图片进行尺度变换，保证所有图片的尺寸大小统一。

为了获得更多的样本数据，需要对现有的数据集中的图像进行数据增强操作，主要的数据增强方式包括随机裁剪、水平翻转、垂直翻转、随机旋转、增加高斯噪声等。

作为一种或多种实施方式，在步骤S02中，利用数据增强的方式构造出包含错分区域特征的图像，进而使得网络通过这些图像学到更多的不确定性知识。

在本实施例中，采用一种difficutycutmix的数据增强方法。使用U-net对图像进行预分割，找到图像中错分的区域，将未错分区域的替换概率提高（使得错分区域特征更为显著），从而增广出的数据具有分错的不确定性区域，进而完成不确定性知识库的构建。

具体的，构建不确定性知识库的第一步是提取错分区域。首先利用预训练好的U-net网络对输入图像进行分割，得到输入图像的分割掩模图InputMask，之后用标签图像的掩模图LabelMask与

作差，得到包含错分区域的掩模图

：

（错分区域的像素值为1，其余区域的像素值均为0）。接着对ErrorMask取反得到反向掩模图NErrorMask，将ErrorMask中像素值为1的像素点赋值为0，将ErrorMask中像素值为0的像素点赋值为1便可得到NErrorMask。NErrorMask的获取是为了重构CutMix框架中的重构后的数据增强框架掩码M。为了保证在执行CutMix的过程中不对错分区域进行剪切操作，需要利用NErrorMask重构CutMix框架中的M，进而在执行CutMix操作的过程中将错分区域保护起来。将M与NErrorMask进行点乘，得到新的掩模图NewM便为重构后的新掩模图掩码。之后用NewM替换CutMix框架的公式中的M对输入图像做数据增强操作，将未错分的区域的替换概率提高（使得错分区域特征更为显著），从而增广出的数据都具有分错的不确定性区域，进而完成不确定性知识库的构建。

改进后的CutMix涉及的公式描述如下：

其中，

和

是两个不同的训练样本，

和

是对应的标签值。

和

是生成的新的训练样本和对应标签。

服从Beta分布：

。

作为一种或多种实施方式，在步骤S03中，本实施例采用一种不确定性知识域自适应的双分支网络。第一个分支用于学习不确定知识，并将学到的知识迁移到分割模型中（第二个分支）。第一个分支的输入是输入图像的difficutycutmix增广图像，使用U-net作为不确定性知识的学习网络。第二个分支的输入是原始输入图像（该图像中的目标与增广图像的目标一致），输入图像与其增广图像分布在两个域中。

为了将不确定性知识迁移到分割模型中，引入知识迁移正则化项，在本实施例中，知识迁移正则化项使用加权的相对熵（即KL散度），保证分割模型与不确定性学习模型的分割结果保持一致。

具体的，利用第一个分支中的尺度自适应特征增强学习器提取不确定性知识库中样本的特征，得到中间特征图Fuc。利用第二个分支中的目标学生网络特征学习器提取目标域中有标记输入样本的特征，得到标记目标域特征图F。对中间特征图Fuc和目标域特征图F施加加权的KL散度，通过降低加权KL散度的值拉近两个特征分布之间的距离，进而达到特征迁移的目的。

为了获取加权KL散度中的样本重要性权重

，需要将不确定性知识库中的部分样本作为训练集预训练U-net网络。利用该网络对不确定性知识库中样本的分割结果便可计算样本重要性权重

。

通过特征迁移，目标网络可以学到不确定性知识库中样本所包含的不确定性知识（样本错分区域所包含的特征）。KL散度的计算公式作为损失函数中正则化项的组成部分，具体公式描述如下：

其中，G表示熵函数，H表示交叉熵损失函数，

为第一个分支中的网络对不确定性知识样本

的分割概率图，

为分割时所考虑的类别数目。H的值越小，G的值越大，权重

的值也越大。

作为一种或多种实施方式，在步骤S04中，半监督框架主要包括一致性正则化和自训练两个过程。一致性正则化采用传统的mean-teacher半监督分割框架的一致性损失训练目标学生网络，在训练目标学生网络的过程中，教师网络会对输入的未标记数据打伪标签。基于这些伪标签可进一步对目标学生网络进行微调，即本实施例中的半监督框架中的自训练过程。

具体的，Mean-teacher框架通过均方误差（MSE）来计算教师网络与目标学生网络之间的一致性损失，通过对学生网络的参数进行指数加权平均处理（EMA）获得教师网络的参数。自训练模块利用Mean-teacher框架中的teacher网络生成未标记样本的伪标签，接着利用未标记样本和未标记样本对应的伪标签训练学生网络。

作为一种或多种实施方式，在步骤S05中，在网络训练过程中主要包括如下损失函数：

（1）标记样本训练过程中涉及的交叉熵损失Lce1和Lce2；

（2）保持第一个分支和第二个分支之间预测结果的一致性损失Lcon1；

（3）Mean-teacher框架中teacher网络与目标学生网络之间的一致性损失Lcon2，以及自训练过程中产生的交叉熵损失Lce3。

网络训练过程中的总损失函数可定义为：

其中，

为不确定性知识库中的样本，

为原始输入图像中的有标记样本，

为原始输入图像中的未标记样本，

为

对应的标签，

为

对应的伪标签，

为第一个分支中不确定性知识分割网络的预测结果，

为目标学生网络的预测结果，

为教师网络的预测结果。

为交叉熵损失，MSE为均方差。

MSE计算预测数据和真实数据之间的欧式距离。预测值和真实值越接近，两者的均方差就越小。其得分最大值所对应类别为预测类别。将现在输出的预测结果与历史加权输出的预测结果做均方差损失计算

。

网络在学习过程中会基于损失函数L重复进行反向传播训练，损失值会随着训练轮次的增多而慢慢下降。当损失值达到最小值时，得到的网络模型即为最佳训练结果。

本实施例采用difficutycutmix的方法构建不确定性知识库，是网络对不确定性知识学习的基础。引入不确定性知识迁移正则化项，将不确定性知识迁移到分割模型中。在mean-teacher框架的基础上引入自训练模式，增加有效标记数据的数量。最终，提升半监督分割框架的分割精度。

实施例二

本申请实施例二介绍了一种基于不确定性知识域自适应的半监督图像分割系统。

如图3所示的一种基于不确定性知识域自适应的半监督图像分割系统，包括：

获取模块，被配置为获取待分割图像；

详细步骤与实施例一提供的基于不确定性知识域自适应的半监督图像分割方法相同，在此不再赘述。

以上所述仅为本申请的优选实施例而已，并不用于限制本申请，对于本领域的技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

1.一种基于不确定性知识域自适应的半监督图像分割方法，其特征在于，包括以下步骤：

获取待分割图像；

2.如权利要求1中所述的一种基于不确定性知识域自适应的半监督图像分割方法，其特征在于，在构建不确定性知识库之前，对数据集进行数据增强的预处理；所述预处理包括随机裁剪、水平翻转、垂直翻转、随机旋转和添加高斯噪声。

3.如权利要求2中所述的一种基于不确定性知识域自适应的半监督图像分割方法，其特征在于，对预处理后的数据集进行图像尺寸的归一化处理，保证预处理后的数据集中的所有图片尺寸大小统一。

4.如权利要求3中所述的一种基于不确定性知识域自适应的半监督图像分割方法，其特征在于，在构建不确定性知识库的过程中，通过数据增强构造包含错分区域特征的图像，基于所构造的包含错分区域特征的图像得到不确定性知识。

5.如权利要求4中所述的一种基于不确定性知识域自适应的半监督图像分割方法，其特征在于，利用预训练好的U-net网络对输入图像进行分割，得到输入图像的分割掩模图，对标签图像的掩模图与输入图像的分割掩模图作差，得到包含错分区域的掩模图，完成错分区域的提取。

6.如权利要求5中所述的一种基于不确定性知识域自适应的半监督图像分割方法，其特征在于，对所得到的包含错分区域的掩模图取反，得到反向掩模图，实现数据增强框架掩码的重构；将重构后的数据增强框架掩码与反向掩模图进行点乘，得到新掩模图掩码；用新掩模图掩码替换据增强框架掩码，对输入图像进行数据增强，替换未错分区域，完成不确定性知识库的构建。

7.如权利要求6中所述的一种基于不确定性知识域自适应的半监督图像分割方法，其特征在于，对所得到的包含错分区域的掩模图取反的具体过程为：将所得到的包含错分区域的掩模图中的像素值为1的像素点赋值0，将所得到的包含错分区域的掩模图中的像素值为0的像素点赋值1。

8.如权利要求1中所述的一种基于不确定性知识域自适应的半监督图像分割方法，其特征在于，所述基于特征迁移的域自适应的过程中，采用不确定知识域自适应的双分支网络，所述包括第一分支和第二分支；所述第一分支通过提取不确定知识库中的图像样本特征，得到中间特征图；结合第二分支提取目标域中有标记输入样本的特征，得到标记目标域特征图；对所得到的中间特征图和所述标记目标域特征图施加知识迁移正则化项，完成特征迁移。

9.如权利要求8中所述的一种基于不确定性知识域自适应的半监督图像分割方法，其特征在于，所述知识迁移正则化项采用加权的相对熵，通过降低相对熵的数值拉进所述中间特征图与所述标记目标域特征图之间的分布距离。

10.一种基于不确定性知识域自适应的半监督图像分割系统，其特征在于，包括：

获取模块，被配置为获取待分割图像；