CN113657393A

CN113657393A - 一种形状先验缺失的图像半监督分割方法及系统

Info

Publication number: CN113657393A
Application number: CN202110936297.2A
Authority: CN
Inventors: 宁阳; 聂秀山; 袭肖明; 郭杰; 尹义龙; 张彩明
Original assignee: Shandong Jianzhu University
Current assignee: Shandong Jianzhu University
Priority date: 2021-08-16
Filing date: 2021-08-16
Publication date: 2021-11-16
Anticipated expiration: 2041-08-16
Also published as: CN113657393B

Abstract

本发明提出了一种形状先验缺失的图像半监督分割方法及系统，包括：针对形状先验缺失的图像，获得候选区域；基于上述候选区域，利用分割网络将N个空间像素映射到K个关键因子的再重建回N个空间像素的方式来捕获分割目标的长距离依赖，其中K远小于N，同时，捕获有利于边界分割的短距离依赖，利用长距离依赖及短距离依赖输出对候选区域非本地语义上下文聚合；针对候选区域非本地语义上下文聚合结果，对形状几何先验敏感的半监督对抗学习：使用评估网络通过半监督对抗学习的方式对无标签数据的潜在有用信息进行挖掘，以激励分割网络输出精确的分割结果。

Description

一种形状先验缺失的图像半监督分割方法及系统

技术领域

本发明属于图像分割处理技术领域，尤其涉及一种形状先验缺失的图像半监督分割方法及系统。

背景技术

本部分的陈述仅仅是提供了与本发明相关的背景技术信息，不必然构成在先技术。

近年来，随着人工智能技术的飞速发展，基于深度学习的方法在诸如图像分类、目标检测和语义分割等领域都取得了巨大的成功。其中的语义分割任务旨在为图像中的每个像素分配一个语义标签，其对于自动驾驶、计算机辅助诊断、虚拟现实和图像编辑等各种具有挑战性的应用至关重要。

目前，虽然一些基于深度学习的全监督方法在语义分割任务上取得了显著的进步，但它们通常需要大量的训练数据。与图像分类和目标检测不同，语义分割需要对每张训练图像进行准确的逐像素标注，这无疑会花费大量的费用和时间。值得注意的是，在一些特殊的领域，例如医学图像领域，由于图像的数量较少且通常需要大量的专业知识才能完成标注，因此大量存在的图像中只有少量被良好地标记，这无疑增大了图像分割在该领域的难度。另外，由于一些被分割对象通常具有较小的尺寸，例如城市图像中远处的车辆和红绿灯，以及缺少对形状的先验知识，例如医学图像中的胰腺器官，其通常具有较高的解剖学变异性，那么如何充分挖掘图像中的潜在有用信息并提取有用的特征来提升图像的分割精度显得至关重要。

发明内容

为克服上述现有技术的不足，本发明提供了一种形状先验缺失的图像半监督分割方法，可以进一步提升分割算法的精度。

为实现上述目的，本发明的一个或多个实施例提供了如下技术方案：

第一方面，公开了一种形状先验缺失的图像半监督分割方法，包括：

针对形状先验缺失的图像，获得候选区域；

基于上述候选区域，利用分割网络捕获分割目标的长距离依赖，同时，捕获有利于边界分割的短距离依赖，利用长距离依赖及短距离依赖输出对候选区域非本地语义上下文聚合；

针对候选区域非本地语义上下文聚合结果，对形状几何先验敏感的半监督对抗学习：使用评估网络通过半监督对抗学习的方式对无标签数据的潜在有用信息进行挖掘，以激励分割网络输出精确的分割结果。

进一步的技术方案，获得候选区域时，通过调整区域推荐网络的原始编码坐标，以构造对面积敏感的区域推荐网络来生成候选区域。

进一步的技术方案，调整区域推荐网络的原始编码坐标时，基于动态调整参数、边界框的宽度和高度来对输入分割目标的面积进行调整。

进一步的技术方案，分割网络通过引入图像空间分辨率的比例调节因子修正注意力机制的计算流程。

进一步的技术方案，分割网络中，针对候选区域，基于希尔伯特空间填充曲线获得一维序列化后的图像块，利用一组LSTM模块对其进行建模以捕获有利于边界分割的短距离依赖。

进一步的技术方案，基于有标签数据的分割约束和形状约束SDM，使AN通过半监督对抗学习的方式对无标签数据的潜在有用信息进行挖掘。

进一步的技术方案，对形状几何先验敏感的半监督对抗学习，具体为：

形状约束SDM用于描述从每个点到对象边界的距离信息；

通过将分割损失、SDM损失和评估损失进行结合，构造多任务半监督混合损失函数；

对多任务损失的分割损失，构造基于DICE损失和α平衡的Focal损失来使模型更好地学习形状先验缺失的目标与其上下文信息之间的差异；

定义多任务损失的SDM损失，对评估损失使用二元交叉熵损失来对其进行优化。

进一步的技术方案，基于半监督对抗学习来实现对多任务网络SN(SegmentationNetwork，SN)和评估网络AN(Assessment Network，AN)的交替训练；

经过一定的训练次数或者SN的分割精度达到一定的阈值，半监督对抗训练终止。

第二方面，公开了一种形状先验缺失的图像分割系统，包括：

候选区域获取模块，被配置为：针对形状先验缺失的图像，获得候选区域；

非本地语义上下文聚合模块，被配置为：基于上述候选区域，利用分割网络捕获分割目标的长距离依赖，同时，捕获有利于边界分割的短距离依赖，利用长距离依赖及短距离依赖输出对候选区域非本地语义上下文聚合；

半监督对抗学习模块，被配置为：针对候选区域非本地语义上下文聚合结果，对形状几何先验敏感的半监督对抗学习：使用评估网络通过半监督对抗学习的方式对无标签数据的潜在有用信息进行挖掘，以激励分割网络输出精确的分割结果。

以上一个或多个技术方案存在以下有益效果：

本发明提出的基于半监督对抗学习的形状先验缺失的图像分割对比之前的方法，在图像自动分割方面有优异表现。

首先，本发明将半监督对抗学习用于形状先验缺失的目标自动分割领域的框架。其次，本发明构造了一个鲁棒的非本地上下文聚合模块，该模块不但可以同时对长距离和短距离依赖关系进行捕获以增强特征表示能力，还可以方便地应用于其他图像分割任务。最后，本发明构造了一种对形状几何先验敏感的半监督对抗学习模块，该模块可以对无标记图像的潜在有用信息进行挖掘，并有效减少对大规模标记图像的需求。

本发明能有效解决图像中有标签数据量较少、无标签数据量较多和一些潜在有效信息未被充分挖掘和利用的问题。

本发明附加方面的优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

构成本发明的一部分的说明书附图用来提供对本发明的进一步理解，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。

图1为本发明提供的一种基于半监督对抗学习的形状先验缺失的图像分割算法实现形状先验缺失的目标自动分割的网络学习流程示意图；

图2为本发明提供的形状先验缺失的图像分割系统模型框架示意图。

具体实施方式

应该指出，以下详细说明都是示例性的，旨在对本发明提供进一步的说明。除非另有指明，本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是，这里所使用的术语仅是为了描述具体实施方式，而非意图限制根据本发明的示例性实施方式。

在不冲突的情况下，本发明中的实施例及实施例中的特征可以相互组合。

针对图像的语义分割任务所面临的上述现实问题，如果直接应用大数据驱动的全监督算法来说，显然不是最优的方法。而基于对抗学习的半监督学习算法能更好地应对以上挑战。半监督学习旨在从有限数量的标记数据和任意数量的未标记数据中学习，并且其效果在一定条件下可以与全监督算法相媲美。而借助对抗学习则可以充分挖掘未标记图像中包含的一些对模型的训练过程有益的潜在信息，例如形状先验约束，可以进一步提升分割算法的精度，因此，对不需要大量标记图像但仍可以实现竞争性能的分割模型得到进一步的发展。

半监督学习是一个基本的、具有挑战性的问题，旨在从有限数量的标记数据和任意数量的未标记数据中学习，并且学习效果在一定条件下可以与全监督算法相媲美。这无疑对实际的临床应用具有很大的影响。特别地，基于对抗学习的半监督学习方法凭借其强大的特征表达能力以及泛化能力受到了越来越多的关注，是目前比较火热的研究方向之一。

实施例一

如图1所示，本发明实施例中的一种基于半监督对抗学习的形状先验缺失的图像分割算法实现形状先验缺失的目标自动分割的网络学习过程，包括如下步骤：

步骤(1)：构造对面积敏感的定位算法：基于改进的区域推荐网络来实现对面积感知的定位算法来解决形状先验缺失数据集的类别不均衡问题。然后，基于对该数据集的统计获得大小一致的已处理数据作为后续分割网络的输入；

步骤(2):构造基于平滑扩张卷积的自动编码器模块：通过对数据集的统计，基于平滑扩张卷积来自适应地提取分割目标的特征；

基于最佳感受野提取当前分割目标的特征，在降低模型的计算复杂度的同时，有效解决由传统扩张卷积所引起的“网格效应”；

构造非本地语义上下文聚合模块：首先，将上述提取到的分割目标特征作为输入，并基于改进的空间注意力机制在学习输入特征长依赖关系的同时有效降低模型的计算复杂度；同时，基于希尔伯特空间填充曲线来学习输入特征分块间的短依赖关系；其次，基于聚合模块将上述两种依赖关系融合为增强后的特征作为输出，使SN能同时对分割目标的长依赖和短依赖关系进行建模；

步骤(3):构造对形状几何先验敏感的半监督对抗学习模块：首先，提取分割目标的形状几何先验信息，并将融合几何先验信息的有标签数据和无标签数据的分割结果作为输入；其次，基于半监督对抗学习进行迭代训练，既先基于AN对融合几何先验信息的有标签数据和无标签数据的分割结果进行分辨，再基于SN输出新的分割预测和SDM预测，并获得新的有标签数据和无标签数据的融合数据；最后，半监督对抗网络停止迭代并达到纳什均衡状态，此时SN网络的输出可作为最终分割预测结果。

计算多任务分割网络损失：首先，计算Dice损失和α平衡的Focal损失，将其进行加权作为分割损失；其次，计算有符号距离场(Signed Distance Map，SDM)损失；最后，将分割损失和SDM损失的加权和作为多任务学习网络SN的总损失；

计算评估网络损失：计算二进制交叉熵损失来对有标签图像和无标签图像的分割结果进行评估，以实现半监督对抗训练；

步骤(4)：网络训练：首先，随机初始化多任务学习网络SN的参数，训练AN，使其能够对有标签图像和无标签图像的分割结果进行区分；其次，冻结AN的参数训练SN，使其获得足以以假乱真的分割结果来欺骗AN，同时获得SDM预测结果；最后，经过一定回合的迭代训练，当AN不能对有标签图像和无标签图像的分割结果进行分辨的时候，训练停止并保存网络模型；

步骤(5)：网络预测：忽略AN，直接利用训练好的SN来对输入图像数据进行预测得到分割结果。

具体的步骤为：

上述步骤(1)中：构造对面积敏感的定位算法

首先，通过调整区域推荐网络的原始编码坐标，以构造对面积敏感的区域推荐网络来生成具有近100％召回率的候选区域(前景和背景比例约1：3)以降低分割数据集所面临的类别不均衡问题，区域推荐网络以原始图像为输入，输出粗略定位以后的候选图像用以提升后续SN的分割精度，具体来看，动态面积调整公式如下：

其中，η为动态调整参数，w和h分别表示边界框的宽度和高度，s表示输入分割目标的面积，可以用其像素数来近似。

因此，基于η的边界框的修改编码坐标满足下式：

其中x、y、w和h分别表示边界框的中心坐标、宽度和高度。x_a、y_a、w_a和h_a分别表示锚点的中心坐标、宽度和高度。

最后，应用非极大值抑制得到概率最大的候选区域，插值以后作为后续SN的输入。

上述步骤(2):构造非本地语义上下文聚合模块

由于语义分割任务通常需要较大的空间分辨率来维护图像的详细信息，因此较大的矩阵乘法是传统空间注意机制计算复杂度较高的主要原因。传统空间注意力机制的计算流程可以表示为下式：

为了降低空间注意力机制计算复杂度，首先，将此步骤的输入特征的像素数看作N，本发明通过低秩重建的思想将N个空间像素映射到K个关键因子的再重建回N个空间像素的方式来捕获分割目标的长距离依赖，其中K远小于N。通过引入图像空间分辨率的比例调节因子s，新的注意力机制的计算流程被更改为下式：

其次，为了获得分割目标更加精确的边界分割结果，本发明基于希尔伯特空间填充曲线获得一维序列化后的图像块，利用一组LSTM模块对其进行建模以捕获有利于边界分割的短距离依赖。

需要说明的是，上述步骤是对上一步的输入特征进行处理，因此此步和上一步两步是并行的。

最后，通过将长距离依赖和短距离依赖进行融合以获得增强后的特征作为输出。

上述步骤(3):构造对形状几何先验敏感的半监督对抗学习模块

为了对分割目标的形状信息进行建模，本发明基于有标签数据的分割约束和形状约束SDM(有符号距离场(Signed Distance Map，SDM))，使AN通过半监督对抗学习的方式对无标签数据的潜在有用信息进行充分挖掘，以激励SN获得更加精确的分割结果。

上述原始数据集是有标签的，对发明来说，将有标签数据划分为训练集和测试集，并假设在训练阶段训练集和测试集的标签分别是可见和不可见的，而在测试阶段，测试集的标签是可见的。

步骤(3-1)：形状约束SDM可用于描述从每个点到对象边界的距离信息，其GT(金标准，(Ground Truth，GT))可以通过下式进行描述：

其中x和y分别代表输入图像及其对应目标的边界。G_in、G_out和

分别代表目标的外部，内部和边界。

步骤(3-2)：通过将分割损失

SDM损失

和评估损失

进行结合，构造多任务半监督混合损失函数，其被定义如下：

其中S_p(x)和Z_p(x)分别代表多任务网络SN的分割头部和SDM头部。θ_s和θ_a分别代表SN网络和AN网络的训练参数。λ用来平衡分割损失和对抗损失的重要性，且被初始化为1。

步骤(3-3)：对步骤(3-2)的多任务损失的分割损失

来说，构造基于DICE损失和α平衡的Focal损失来促使模型更好地学习形状先验缺失的目标与其上下文信息之间的差异，其被定义如下：

具体来看，DICE损失

被重新设计并被定义如下：

其中H和W分别代表输入图像的宽度和高度，y_ci和

分别代表分割GT和预测结果，C代表类别数目。

α平衡的Focal损失

则被定义如下：

其中α和γ分别用来控制每一个类别和困难分割样本的比重。

步骤(3-4)：对步骤(3-2)的多任务损失的SDM损失

来说，为了使模型能够充分挖掘有标签数据和无标签数据的潜在有用信息以获得更加合理的分割结果，其被定义如下：

其中z_ci代表SDM的GT，

代表SDM的预测值。

步骤(3-5)：对步骤(3-2)的评估损失

来说，本发明使用二元交叉熵损失来对其进行优化，其被定义如下：

其中y代表输入图像的GT(无标签图像和有标签图像的分割结果分别是0和1)，

代表评估网络AN的预测结果(常量)。

上述步骤(4)中：网络训练

本发明基于半监督对抗学习来实现对多任务网络SN和评估网络AN的交替训练。

步骤(4-1)：对AN的优化通过以下公式进行：

通过这一步迭代训练，AN能够对有标签和无标签图像的分割结果进行准确评估。

步骤(4-2)：对SN的优化通过以下公式进行：

为了给AN在评估分割质量时提供更强的梯度信号以减少网络收敛时间，上式可改写为如下形式：

其中y_m是经过独热编码后由0和1组成的向量，分割目标类别为1，背景类别为0。

通过这一步迭代训练，SN的预测结果将会对AN产生欺骗，使其不能对有标签和无标签图像的分割结果进行准确评估。

上述步骤(5)中：网络预测：

输入待测试的图像数据进入已训练好的多任务网络SN并得到预测结果。

如图2所示，对整个基于半监督对抗学习的形状先验缺失的图像分割系统模型框架做解释说明。

图2中所对应的虚线框内系统为主要执行形状先验缺失的图像分割功能的系统模块，主要过程对应于步骤(2)和(3)中的过程。用户输入待测试图像数据(候选区域)进入分割系统，系统内部自动进行编码器非本地特征增强、融合形状先验信息的半监督对抗学习两个过程，最后SN输出形状先验缺失的图像分割结果与用户进行交互。

在测试交互阶段，首先，SN只需输出分割预测结果，并不输出SDM预测结果。SDM的相关运算只参与网络的训练，即只在网络的对抗训练中引入无标签图像的几何先验知识以提升SN的分割精度；另外，在此阶段，AN不参与任何运算，因此其不会对网络预测引入额外的计算复杂度。

在该实施例子中，上述方法主要利用的技术为：分割网络(SegmentationNetwork，SN)和评估网络(Assessment Network，AN)。

其中SN主要由两个模块组成：一个基于平滑扩张卷积自动编码器，它不仅有助于消除由广泛使用的扩张卷积而引起的所谓的网格化伪影，而且还可以在不引入额外计算量的情况下引入更大的感受野；一个非本地语义上下文聚合模块，它不仅可以捕获空间维度上的远程上下文依赖性，而且还可以通过聚合丰富的上下文信息来增强相邻图像块之间的空间相关性。

在一实施例子中，AN则由一个对形状几何先验敏感的半监督对抗模块构成，其通过对抗学习的方式将胰腺器官的形状几何先验融入网络的训练过程，能够充分利用和挖掘未标记图像的潜在有用信息来评估SN的分割质量，这使本发明具有了鲁棒的对抗学习能力，可以为未标记胰腺图像产生精确的分割预测。

实施例二

本实施例的目的是提供一种计算装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现上述方法的步骤。

实施例三

本实施例的目的是提供一种计算机可读存储介质。

一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时执行上述方法的步骤。

实施例四

本实施例的目的是提供一种形状先验缺失的图像分割系统，包括：

非本地语义上下文聚合模块，被配置为：基于上述候选区域，利用分割网络将N个空间像素映射到K个关键因子的再重建回N个空间像素的方式来捕获分割目标的长距离依赖，其中K远小于N，同时，捕获有利于边界分割的短距离依赖，利用长距离依赖及短距离依赖输出对候选区域非本地语义上下文聚合；

以上实施例二、三和四的装置中涉及的各步骤与方法实施例一相对应，具体实施方式可参见实施例一的相关说明部分。术语“计算机可读存储介质”应该理解为包括一个或多个指令集的单个介质或多个介质；还应当被理解为包括任何介质，所述任何介质能够存储、编码或承载用于由处理器执行的指令集并使处理器执行本发明中的任一方法。

本领域技术人员应该明白，上述本发明的各模块或各步骤可以用通用的计算机装置来实现，可选地，它们可以用计算装置可执行的程序代码来实现，从而，可以将它们存储在存储装置中由计算装置来执行，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。本发明不限制于任何特定的硬件和软件的结合。

上述虽然结合附图对本发明的具体实施方式进行了描述，但并非对本发明保护范围的限制，所属领域技术人员应该明白，在本发明的技术方案的基础上，本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

Claims

1.一种形状先验缺失的图像半监督分割方法，其特征是，包括：

针对形状先验缺失的图像，获得候选区域；

2.如权利要求1所述的一种形状先验缺失的图像半监督分割方法，其特征是，获得候选区域时，通过调整区域推荐网络的原始编码坐标，以构造对面积敏感的区域推荐网络来生成候选区域。

3.如权利要求2所述的一种形状先验缺失的图像半监督分割方法，其特征是，调整区域推荐网络的原始编码坐标时，基于动态调整参数、边界框的宽度和高度来对输入分割目标的面积进行调整。

4.如权利要求1所述的一种形状先验缺失的图像半监督分割方法，其特征是，分割网络通过引入图像空间分辨率的比例调节因子修正注意力机制的计算流程。

5.如权利要求1所述的一种形状先验缺失的图像半监督分割方法，其特征是，分割网络中，针对候选区域，基于希尔伯特空间填充曲线获得一维序列化后的图像块，利用一组LSTM模块对其进行建模以捕获有利于边界分割的短距离依赖。

6.如权利要求1所述的一种形状先验缺失的图像半监督分割方法，其特征是，基于有标签数据的分割约束和形状约束SDM，使AN通过半监督对抗学习的方式对无标签数据的潜在有用信息进行挖掘。

7.如权利要求1所述的一种形状先验缺失的图像半监督分割方法，其特征是，对形状几何先验敏感的半监督对抗学习，具体为：

形状约束SDM用于描述从每个点到对象边界的距离信息；

定义多任务损失的SDM损失，对评估损失使用二元交叉熵损失来对其进行优化；

优选的，还包括：基于半监督对抗学习来实现对多任务网络SN和评估网络AN的交替训练；

8.一种形状先验缺失的图像分割系统，其特征是，包括：

9.一种计算装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现上述权利要求1-7任一所述的方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时执行上述权利要求1-7任一所述的方法的步骤。