CN115797632A

CN115797632A - 一种基于多任务学习的图像分割方法

Info

Publication number: CN115797632A
Application number: CN202211527682.2A
Authority: CN
Inventors: 张利欣; 孙涵; 刘红敏; 樊彬; 曾慧
Original assignee: University of Science and Technology Beijing USTB
Current assignee: University of Science and Technology Beijing USTB
Priority date: 2022-12-01
Filing date: 2022-12-01
Publication date: 2023-03-14
Anticipated expiration: 2042-12-01
Also published as: CN115797632B

Abstract

本发明公开了一种基于多任务学习的图像分割方法，包括：构建样本数据集；其中，样本数据集由对比学习数据集、网状结构图像、对应语义分割标签和对应关系向量标签组成；构建基于对比学习的特征提取器；构建基于多任务学习的图像分割模型；其中，图像分割模型包括共享编码器、语义分割任务模块和关系预测任务模块；基于对比学习数据集对特征提取器进行训练；基于网状结构图像、对应语义分割标签和对应关系向量标签构成的样本数据集对图像分割模型进行训练；利用训练好的图像分割模型对待分割图像进行语义分割，得到分割结果。本发明的图像分割方法有效提升了网状结构图像分割精度，解决了目前网状结构图像分割精度不够理想的技术问题。

Description

一种基于多任务学习的图像分割方法

技术领域

本发明涉及图像处理与计算机视觉技术领域，特别涉及一种基于多任务学习的图像分割方法。

背景技术

在材料微观组织图像、医学图像等研究领域中，存在一类形态各异、交错闭合且相互连接的结构，本文称之为网状结构。除网状结构之外的各独立的连通域，称为网格。

材料的微观组织是决定材料宏观性能的关键，在很多材料的微观组织图像中，存在一种纵横交错的网状结构，对于不同材料的这种网状微观组织图像的定量研究对新材料研发、已有材料/结构性能评价和分析以及关键部件检测等都具有重要意义。结合先进的图像处理技术对材料的微观组织图像进行智能化分析计算，是实现微观组织的定量分析的重要手段，解决了传统人工计算不全面、不客观及效率低等问题，为分析材料结构，研究材料内在组织机制和形成机理提供了量化的指标数据，大大提高材料研发评价效率的同时，降低了相关成本。

在生物医学领域，细胞的细胞膜、视网膜等显微图像中也经常会出现网状结构图像。如精确的神经细胞膜分割是计算机辅助细胞形态学分析和功能连接认知的必要步骤，但由于细胞图像的复杂性，使得细胞膜分割在生物学图像处理领域仍是具有挑战性的任务。在细胞生物学中，使用图像处理技术与深度学习等对生物医学图像进行相应处理，可为细胞相关研究提供更客观的参考依据。

随着数字图像处理技术的发展和计算设备的不断升级，基于深度学习的语义分割方法被得以广泛应用。其与传统方法相比，具有更好的泛化能力、更快的运算速度和更高的精度。随着深度学习技术的不断发展，如何结合领域图像的特点，提出更精准高效的图像分割处理方法成为了研究热点。同时医学图像和材料组织图像等通常因样本获取、制备和实验等方面的问题，导致实验样本量有限，研究过程需要考虑小样本的问题。

目前，关于深度学习的现有技术如下：

1)UNet网络结构

UNet网络的典型特点是，它是U型对称结构，左侧是卷积层，右侧是上采样层，包含4个卷积层和对应的4个上采样层。UNet网络的每个卷积层得到的特征图都会连接到对应的上采样层，从而实现对每层特征图都有效使用到后续计算中。这样，同其他的一些网络结构比如FCN比较，UNet避免了直接在高级特征图中进行监督和损失计算，而是结合了低级特征图中的特征，从而可以使得最终所得到的特征图中既包含了高层特征，也包含很多的低层特征，实现了不同尺度下的特征融合，提高模型的结果精确度。

2)多任务学习

多任务学习与人类的认知方式具有相似之处。在相关任务学习中所获得的经验和知识可以用于辅助新任务的学习；同时，人们在学习任务的过程中可以获得通用的技能，这些技能可以用于更加复杂技能的学习。多任务学习已成功应用于自然语言处理、语音识别和计算机视觉等领域。

多任务学习有很多形式，联合学习、自主学习和带有辅助任务的学习等都可以称为多任务学习。其中，带辅助任务的学习方式通过划分任务为主任务和辅助任务，利用辅助任务的信息改进主任务的学习性能，从而可以学习到多个任务上的统一表示，进而实现对主任务的注意力机制。

3)对比学习

对比学习属于无监督学习，通过将数据与正负样本分别映射到特征空间并进行对比，缩小与正样本间的距离，扩大与负样本间的距离，来学习样本的特征表示。如何构造正负样本是对比学习的难点之一，正样本一般由标准图经数据增强得到。

但目前现有的基于深度学习的分割方法缺少针对网状结构特点的高效模型，对网状结构的分割效果有限；而现有的多任务学习方法也缺少对背景语义信息的关注问题；由此造成了目前网状结构图像的分割精度不够理想。

发明内容

本发明提供了一种基于多任务学习的图像分割方法，以解决现有方法缺乏对网状结构的针对性，且缺少对背景语义信息的关注，由此造成目前网状结构图像的分割精度不够理想的技术问题。

为解决上述技术问题，本发明提供了如下技术方案：

一方面，本发明提供了一种基于多任务学习的图像分割方法，适用于网状结构图像，网状结构图像中除网状结构之外的各独立的连通域为网格；

所述基于多任务学习的图像分割方法包括：

构建样本数据集；其中，所述样本数据集由对比学习数据集、网状结构图像、对应语义分割标签和对应关系向量标签组成；

构建基于对比学习的特征提取器；

构建基于多任务学习的图像分割模型；其中，所述图像分割模型包括共享编码器、用于执行主任务的语义分割任务模块和用于执行辅助任务的关系预测任务模块；其中，所述共享编码器对输入图像进行多级卷积和池化，输出特征图；所述关系预测任务模块基于所述特征图预测输入图像中网格内部点与其所属网格间的隶属关系，并得到关系预测结果；所述语义分割任务模块基于所述特征图，得到输入图像的分割结果；

利用所述对比学习数据集对构建的特征提取器进行训练；

基于训练好的特征提取器，利用所述网状结构图像、对应语义分割标签和对应关系向量标签构成的数据集对构建的图像分割模型进行训练；

利用训练好的图像分割模型对待分割图像进行语义分割，得到分割结果。

进一步地，所述语义分割任务模块采用UNet网络的解码器。

进一步地，所述特征提取器采用对比学习方式进行训练。

进一步地，所述特征提取器对待提取特征的图像进行处理的过程包括：

步骤1，在不降低特征图分辨率的情况下进行两次3*3卷积；

步骤2，最大值池化降低特征图分辨率；

步骤3，再执行步骤1至步骤2的操作两次。

进一步地，采用对比学习方式训练特征提取器时，采用InfoNCE loss作为损失函数，其公式为：

其中，L_infoNCE表示InfoNCE loss损失函数，f表示编码器，x表示输入图像，x⁺表示正样本，

表示第i个负样本，n为负样本数量，τ为温度系数，控制模型对负样本的区分度；sim是度量两个特征相似性的函数，采用余弦相似度计算。

进一步地，所述构建样本数据集，包括：

对于训练特征提取器所需对比学习数据集，采取随机细化或3*3膨胀网状结构的增强方式制作正样本，在数据集中随机选取多张与当前标准图无关的网状结构图作为负样本；

针对待分割的数据进行标注，并进行数据增强来扩充数据集；

针对数据增强后的数据集中已标注图像中的网格内部点与其所属网格间的隶属关系进行计算，得到相应图像的网格内部点与其所属网格间的隶属关系。

进一步地，隶属关系以各网格内部点指向其所属网格质心的向量进行表示。

进一步地，所述关系预测任务模块具体用于：

在所述图像分割模型训练时，初步特征图输入所述关系预测任务模块，得到初步关系预测向量；将所述初步关系预测向量与所述关系向量标签进行对比，得到关系预测误差；所述关系预测误差经过反向传播更新所述关系预测任务模块和所述共享编码器的模型参数，使所述共享编码器学习从网状结构图像提取包含关系信息的特征图，以丰富所述共享编码器的信息提取类型；

所述语义分割任务模块具体用于：

在所述图像分割模型训练时，初步特征图输入所述语义分割任务模块，得到初步语义分割结果；将所述初步语义分割结果与所述语义分割标签进行对比，得到语义分割误差；所述语义分割误差经过反向传播更新所述语义分割任务模块和所述共享编码器的模型参数，使所述共享编码器学习从网状结构图像提取包含语义信息的特征图。

进一步地，所述特征提取器具体用于：

在所述图像分割模型训练时，所述初步语义分割结果与所述语义分割标签输入训练好的特征提取器，分别得到语义分割结果的拓扑特征和语义分割标签的拓扑特征；所述语义分割结果的拓扑特征和所述语义分割标签的拓扑特征进行对比，得到拓扑特征差异；所述拓扑特征差异经过反向传播更新所述语义分割任务模块和所述共享编码器的模型参数，使所述共享编码器学习从网状结构图像提取包含拓扑信息的特征图，以丰富所述共享编码器的信息提取类型；

在所述图像分割模型预测时，所述语义分割任务模块将所述共享编码器提取到的包含语义信息、关系信息和拓扑信息的特征图通过多级卷积和上采样还原各级特征图分辨率，并进行同级间特征融合，得到同输入图像同等大小的更加准确的语义分割结果。

进一步地，对所述图像分割模型进行训练时，对于关系预测任务模块，采用均方误差计算关系预测损失；对于语义分割任务模块，一方面采用二元交叉熵计算像素级损失，另一方面，采用训练好的特征提取器提取分割结果和标签的拓扑特征，采用均方误差计算两特征间差异作为拓扑损失；三种损失联合更新模型参数。

再一方面，本发明还提供了一种电子设备，其包括处理器和存储器；其中，存储器中存储有至少一条指令，所述指令由处理器加载并执行以实现上述方法。

又一方面，本发明还提供了一种计算机可读存储介质，所述存储介质中存储有至少一条指令，所述指令由处理器加载并执行以实现上述方法。

本发明提供的技术方案带来的有益效果至少包括：

本发明针对现有图像分割方法中对目标关注度过高的现象，增加了关注背景的关系预测辅助任务。同时，通过采用对比学习训练特征提取器并计算拓扑损失的方法，提高了模型对网状结构的特征提取能力。从而有效提升了网状结构图像分割精度，解决了目前网状结构图像的分割精度不够理想的技术问题。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的基于多任务学习的图像分割方法的实施流程图；

图2是本发明实施例提供的基于多任务学习的图像分割模型的结构图；

图3是本发明实施例提供的关系预测任务对分割任务的辅助作用示意图；

图4是本发明实施例提供的对比学习过程示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明实施方式作进一步地详细描述。

第一实施例

本实施例针对现有技术缺少针对网状结构特点的高效模型，对网状结构的分割效果有限等问题，引入多任务学习方法，以小样本网状结构图像为对象，围绕网状结构特点开展图像分割方法设计，提供了一种基于多任务学习的图像分割方法，提出了一种基于多任务学习的SUR-UNet网络，用于准确分割网状结构图像；该网络在目标分割任务的基础上，增加辅组任务策略，通过增加背景点与其所属连通域间的隶属关系任务，使模型从目标与背景双向提取图像信息进行融合；同时，针对预训练模型无法获取精细拓扑损失的问题，本实施例采用对比学习训练特征提取器，使模型对于网状结构具有更强的针对性。并以材料微观组织图像、医学图像为典型应用，验证了本方法的可实施性和有效性。

具体地，该方法的执行流程如图1所示，包括以下步骤：

S1，构建样本数据集；

其中，所述样本数据集由对比学习数据集、网状结构图像、对应语义分割标签和对应关系向量标签组成；其构建过程如下；

S11，制作对比学习数据集，采取随机细化或3*3膨胀网状结构的增强方式制作正样本，在数据集中随机选取n张与当前标准图无关的网状结构图作为负样本；

S12，制作分割任务数据集，针对待分割的数据进行标注，并进行数据增强来扩充数据集，得到数据增强后的数据集；

S13，制作关系预测任务数据集，针对数据增强后的数据集，计算分割任务标签中各网格内部点与其所属网格间的隶属关系，得到相应图像的网格内部点与其所属网格间的隶属关系。其中，需要强调的是，所述隶属关系必须在分割任务数据集完成数据增强后计算，否则计算结果会存在偏差。

S2，构建基于对比学习的特征提取器；

S3，构建基于多任务学习的图像分割模型；

其中，所述图像分割模型如图2所示，包括：共享编码器、用于执行主任务的语义分割任务模块和用于执行辅助任务的关系预测任务模块；共享编码器对输入图像进行多级卷积和池化，输出特征图；所述关系预测任务模块基于所述特征图预测输入图像中网格内部点与其所属网格间的隶属关系，并得到关系预测结果；所述语义分割任务模块基于所述特征图，得到输入图像的分割结果；

需要说明的是，本模型加入了基于多任务学习的关系预测任务。该任务预测网格内部点与网格隶属关系(Subordinate Relationship，SUR)。此任务提升了共享编码器的信息提取能力，使编码器为分割任务提供了更丰富的语义信息。

此外，由于不同网格间最显著的差异是各网格空间位置，而最能表征各网格空间位置的一点是网格质心。因此，本实施例以各网格内部点指向其所属网格质心的向量来表示网格内部点与其所属网格间的隶属关系。一个平面图形的质心是图形中所有点坐标的算术平均值，质心计算公式如下：

其中，A为网格内点的集合，x_i和y_i为网格内点的坐标，n为像素点的总数，x_c和y_c为网格质心的坐标。

进一步地，在本实施例中，模型的骨干网络主体采用UNet网络。所述关系预测任务模块具体用于：在所述图像分割模型训练时，初步特征图输入所述关系预测任务模块，得到初步关系预测向量；将所述初步关系预测向量与所述关系向量标签进行对比，得到关系预测误差；所述关系预测误差经过反向传播更新所述关系预测任务模块和所述共享编码器的模型参数，使所述共享编码器学习从网状结构图像提取包含关系信息的特征图，以丰富所述共享编码器的信息提取类型；如图3所示。所述语义分割任务模块具体用于：在图像分割模型训练时，初步特征图输入所述语义分割任务模块，得到初步语义分割结果；将所述初步语义分割结果与所述语义分割标签进行对比，得到语义分割误差；所述语义分割误差经过反向传播更新所述语义分割任务模块和所述共享编码器的模型参数，使所述共享编码器学习从网状结构图像提取包含语义信息的特征图。

所述特征提取器具体用于：在所述图像分割模型训练时，所述初步语义分割结果与所述语义分割标签输入训练好的特征提取器，分别得到语义分割结果的拓扑特征和语义分割标签的拓扑特征；所述语义分割结果的拓扑特征和所述语义分割标签的拓扑特征进行对比，得到拓扑特征差异；所述拓扑特征差异经过反向传播更新所述语义分割任务模块和所述共享编码器的模型参数，使所述共享编码器学习从网状结构图像提取包含拓扑信息的特征图，以丰富所述共享编码器的信息提取类型；

S4，利用所述对比学习数据集对构建的特征提取器进行训练；

其中，特征提取器采用对比学习方式进行训练。输入是网状结构图，输出是网状拓扑结构特征。因此，正样本与标准图应有相似的结构特征，数据增强不应破坏原来的结构特征。而对网状结构细化以及小幅度膨胀不会改变原图的结构特征，所以本实施例采取随机细化或3*3膨胀网状结构的增强方式制作正样本，数据集中随机选取n张与当前标准图无关的网状结构图作为负样本。

如图4所示，首先将标准图和正负标签输入模型，得到各输入的特征映射；然后采用余弦相似度计算样本特征相似度，并计算InfoNCE loss；其中，需要说明的是，InfoNCEloss是对比学习中常用的损失函数，其公式如下：

其中，L_infoNCE表示InfoNCE loss损失函数，f为编码器，x为输入图像，x⁺为正样本，

为第i个负样本，n为负样本数量，τ为温度系数，控制模型对负样本的区分度；sim是度量两个特征相似性的函数，一般采用余弦相似度计算；

余弦相似度的计算公式如下：

对比学习的目标满足以下公式：

sim(f(x),f(x⁺))>>sim(f(x),f(x^-))

具体地，所述特征提取器对待提取图像进行处理的过程包括：

步骤1，在不降低特征图分辨率的情况下进行两次3*3卷积；

步骤2，最大值池化降低特征图分辨率；

步骤3，再执行步骤1至步骤2的操作两次。

本实施例对基于对比学习的特征提取器的训练过程为：将制作好的关系预测任务数据集送入特征提取器，采用InfoNCE loss作为损失函数，τ取0.07，采用余弦相似度计算拓扑特征的相似程度，学习率为10^-4，负样本数为2。

S5，基于训练好的特征提取器，利用所述网状结构图像、对应语义分割标签和对应关系向量标签构成的数据集对构建的图像分割模型进行训练；

其中，对基于多任务学习的图像分割模型SUR-UNet进行训练时，对于关系预测任务模块，本实施例采用均方误差计算关系预测损失；对于语义分割任务模块，本实施例一方面采用二元交叉熵计算像素级损失，另一方面，采用训练好的特征提取器提取分割结果和标签的拓扑特征，采用均方误差计算两特征间差异作为拓扑损失；学习率为10^-4，采用三种损失联合更新模型参数。

S6，利用训练好的图像分割模型对待分割图像进行语义分割，得到分割结果。

其中，上述S6为将待分割图像输入训练好的模型进行分割。且本实施例在生物医学细胞膜图像数据集(CREMI)上对本实施例模型进行验证。

综上，本实施例提供了一种基于多任务学习的图像分割方法，该方法针对现有图像分割方法中对目标关注度过高的现象，增加了关注背景的关系预测辅助任务。同时，通过采用对比学习训练特征提取器并计算拓扑损失的方法，提高了模型对网状结构的特征提取能力。在生物医学细胞膜图像数据集(CREMI)上进行验证，结果显示，本实施例所提供的图像分割方法的分割准确率达到了97.28％。由此可见，本实施例提供的方法有效提升了网状结构图像分割精度。

第二实施例

本实施例提供一种电子设备，其包括处理器和存储器；其中，存储器中存储有至少一条指令，所述指令由处理器加载并执行，以实现第一实施例的方法。

该电子设备可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上处理器(central processing units，CPU)和一个或一个以上的存储器，其中，存储器中存储有至少一条指令，所述指令由处理器加载并执行上述方法。

第三实施例

本实施例提供一种计算机可读存储介质，该存储介质中存储有至少一条指令，所述指令由处理器加载并执行，以实现上述第一实施例的方法。其中，该计算机可读存储介质可以是ROM、随机存取存储器、CD-ROM、磁带、软盘和光数据存储设备等。其内存储的指令可由终端中的处理器加载并执行上述方法。

此外，需要说明的是，本发明可提供为方法、装置或计算机程序产品。因此，本发明实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质上实施的计算机程序产品的形式。

本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上，使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

还需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。

最后需要说明的是，以上所述是本发明优选实施方式，应当指出，尽管已描述了本发明优选实施例，但对于本技术领域的技术人员来说，一旦得知了本发明的基本创造性概念，在不脱离本发明所述原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。

Claims

1.一种基于多任务学习的图像分割方法，适用于网状结构图像，网状结构图像中除网状结构之外的各独立的连通域为网格；其特征在于，所述方法包括：

构建基于对比学习的特征提取器；

利用所述对比学习数据集对构建的特征提取器进行训练；

2.如权利要求1所述的基于多任务学习的图像分割方法，其特征在于，所述语义分割任务模块采用UNet网络的解码器。

3.如权利要求1所述的基于多任务学习的图像分割方法，其特征在于，所述特征提取器采用对比学习方式进行训练。

4.如权利要求1所述的基于多任务学习的图像分割方法，其特征在于，所述特征提取器对待提取特征的图像进行处理的过程包括：

步骤1，在不降低特征图分辨率的情况下进行两次3*3卷积；

步骤2，最大值池化降低特征图分辨率；

步骤3，再执行步骤1至步骤2的操作两次。

5.如权利要求3所述的基于多任务学习的图像分割方法，其特征在于，采用对比学习方式训练特征提取器时，采用InfoNCE loss作为损失函数，其公式为：

6.如权利要求1所述的基于多任务学习的图像分割方法，其特征在于，所述构建样本数据集，包括：

7.如权利要求1或6所述的基于多任务学习的图像分割方法，其特征在于，所述隶属关系以各网格内部点指向其所属网格质心的向量进行表示。

8.如权利要求1所述的基于多任务学习的图像分割方法，其特征在于，所述关系预测任务模块具体用于：

所述语义分割任务模块具体用于：

9.如权利要求8所述的基于多任务学习的图像分割方法，其特征在于，所述特征提取器具体用于：

10.如权利要求1所述的基于多任务学习的图像分割方法，其特征在于，对所述图像分割模型进行训练时，对于关系预测任务模块，采用均方误差计算关系预测损失；对于语义分割任务模块，一方面采用二元交叉熵计算像素级损失，另一方面，采用训练好的特征提取器提取分割结果和标签的拓扑特征，采用均方误差计算两特征间差异作为拓扑损失；三种损失联合更新模型参数。