CN115661460A

CN115661460A - 一种具有对比机制的相似度感知框架的医学图像分割方法

Info

Publication number: CN115661460A
Application number: CN202211369798.8A
Authority: CN
Inventors: 罗雪琪; 林森林; 易颖娆; 何伟骅; 辜方清
Original assignee: Guangdong University of Technology
Current assignee: Guangdong University of Technology
Priority date: 2022-11-03
Filing date: 2022-11-03
Publication date: 2023-01-31
Anticipated expiration: 2042-11-03
Also published as: CN115661460B

Abstract

本申请公开了一种具有对比机制的相似度感知框架的医学图像分割方法，包括以下步骤：获取数据；对所述数据进行增强，得到数据集；基于所述数据集，选择分割模型；对所述分割模型进行对比学习，提高所述分割模型分割性能；对所述进行对比学习的分割模型再进行监督学习，共同训练模型；对所述共同训练的模型进行损失优化，优化后的模型用于医学图像分割。通过监督学习提供监督信息指导，并通过对比学习充分挖掘数据中潜在的相似性分析和学习特征，以保持监督学习分割的准确性，并学习数据的潜在有效特征。

Description

一种具有对比机制的相似度感知框架的医学图像分割方法

技术领域

本申请属于带有限制性标注数据的医学图像分割领域，具体涉及一种具有对比机制的相似度感知框架的医学图像分割方法。

背景技术

医学图像分割在医学图像处理中扮演着重要的角色，是分析医学图像的首要步骤。目的是使图像中解剖或病理结构的变化更加清晰，进而辅助解剖结构和感兴趣区域。

传统的医学图像分割大多基于阚值、区域、边缘检测和聚类分析。由于传统方法大多需要人工设计特征，不能够自动化地实现分割。并且不同的医学数据集需要不同的图像处理，传统的方法不足以应对日益增长的各式各样复杂的数据集。

由于神经网络拥有强大的表征能力，不再需要手工制作特征就可以实现端对端的分割，这也引起了研究人员的关注，并广泛地应用在生物医学领域。然而，深度学习的模型训练需要大量的标注数据才可以训练出一个具有强的表征能力模型。这需要花费大量的时间和成本，特别是获取大量带有高质量的标注的医学数据。

对比学习是一种自监督学习(self-supervised learning,SSL)方法，可以从大规模数据中学习图像级特征，而不需要任何手动标注。对比学习的主要思想是比较样本对在表示空间中的相似性，将相似对(正对)的表示集合在一起，分离不同对(负对)的表示。虽然对比学习是一种很有前途的方法，但目前对比学习不仅需要大量的正反例样本，而且对比学习是学习图像级特征，还没有能力操作用于像素级的任务，像对感兴趣的部分进行分割。因此，大多数先进的分割模型仍然基于监督学习，能稳定地产生准确的分割。

发明内容

本申请提出了一种具有对比机制的相似度感知框架的医学图像分割方法，准确的生物医学图像分割是临床诊断的基础。基于卷积神经网和Transformer的分割方法在各种医学成像模式中取得了优异的性能。这些方法大多是基于大规模精确注释的监督学习。然而，用于生物医学的专业注释数据很难获得。此外，大多数研究集中在复杂的网络结构上，而不是充分挖掘未标记图像的潜在特征。这些有监督的学习方法可以在注释良好的数据集中获得有竞争力的性能，但在还存在一定的空间可以继续提升分割性能。在本研究中，为了进一步提升带有限制性标注的医学图像分割的效果，我们提出了一种具有对比机制的相似度感知框架的医学图像分割方法，以保持监督学习的分割精度，并学习更多数据的潜在有效特征。与传统的对比学习不同，我们的方法将监督学习和对比学习同时结合起来，监督模块提供监督信息指导，并通过对比模块对未标注数据进行相似性分析，充分挖掘潜在特征。该框架可以在现有的模型上，进一步的完善模型，提高模型的分割精度。

为实现上述目的，本申请提供了如下方案：

一种具有对比机制的相似度感知框架的医学图像分割方法，包括以下步骤：

获取图像数据；

对所述图像数据进行增强，得到图像数据集；

基于所述图像数据集，选择分割模型；

对所述分割模型进行对比学习，提高所述分割模型分割性能；

对所述进行对比学习的分割模型再进行监督学习，共同训练模型；

对所述共同训练的模型进行损失优化，优化后的模型用于医学图像分割。

优选的，对所述图像数据进行增强的方法包括：组合数据增强和非线性变换增强。

优选的，所述组合数据增强的方法包括：几何变换与色彩空间变换的组合或几何变换与色彩空间变换自身的组合。

优选的，所述非线性变换增强的方法包括：随机擦除和Cutmix。

优选的，对所述分割模型进行对比学习的方法包括：将所述数据增强的数据集输入分割模型，分割模型对其进行输出，对输出的数据进行矩不变量映射。

优选的，所述进行监督学习的方法包括：选择不同分割损失函数。

优选的，对所述共同训练的模型进行损失的方法包括：对比损失函数和监督损失函数。

优选的，所述对比损失函数的方法包括：

余弦相似度对比损失函数的公式如下：

余弦相似度公式如下：

其中，z_i，z_j表示两个矩不变量映射,sim(·)函数表示相似度计算，z_i ^Tz_j表示两个对应向量相乘，||z_i||||z_j||表示两个对应两个向量的模；

式中，z_i，z_j表示两个矩不变量映射，sim(·)函数表示相似度计算，exp(·)表示是指数函数；

误差对比损失函数的公式如下：

||||₂表示对符号里面取绝对值，即二范数；

表示相对于z_i的相对误差。

优选的，所述监督损失函数的方法包括：监督损失函数的公式如下：

优选的，所述优化后的模型用于医学图像分割的方法包括：基于所述对比损失函数和所述监督损失函数确定最终总损失函数，然后最小化总损失函数，更新训练模型达到迭代次数为止。

本申请的有益效果为：

针对生物医学图像分割数据集稀缺的问题，本申请提出了一种基于对比度机制的相似感知的医学图像分割框架(SimBIS)，可灵活应用于不同的分割模型。目前大多数研究都集中在复杂的网络结构上，而不是像本专利从数据层面上去充分地探索潜在的特征。该框架包括一个数据增强模块(1)、一个对比模块(2)、一个监督模块(3)、一个分割模型(4)和损失函数(5)。此外，网络模块可以灵活应用于任何不同的分割模型。能够做到即插即用，并且可以在原有的模型上再继续优化得到更精准的分割效果。

SimBIS设计了多种数据增强功能。数据增强模块采用线性变换增强和非线性变换增强相结合的方法来提高增强图像的可分辨性，不仅提高图像的丰富性和多样性，数据增强模块还能与对比模块形成一种对抗机制。具体是，数据增强模块尽可能使图片的区分度更大，而对比模块通过自监督使图像的特征映射的相似度的误差更小(或者相似度更大)，进而优化网络和得到更具泛化和稳定的分割模型。本申请采用数据增强模块，既能实现适当的数据增强，在一定程度上可以缓解小规模医学图像分割数据稀缺的问题；又能有效地避免因过度有标注的数据增强使训练数据趋向于同个分布，进而导致的过拟合现象。

本申请设计一种监督学习和对比学习的联合学习策略。与现有模型相比，更充分地挖掘图像的潜在特征，获得更准确的分割。与传统的对比学习不同，SimBIS将监督学习和对比学习同时结合起来，通过监督模块提供监督信息指导，并通过对比模块充分挖掘数据中潜在的相似性分析和学习特征，以保持监督学习分割的准确性，并学习数据的潜在有效特征。

在对比模块中设计了新的对比损失函数和特征投影映射。在监督模块的指导下，对比损失函数仅使用正例计算相似度损失。这样可以避免对比学习中需要大量正负例来计算相似度的问题，极大地减少了计算量和提升了计算效率。损失函数用一个低维向量矩不变量来测的网络输出之间的相似性，一方面，将数据转化为低维向量可以大幅度减少训练的计算量，另一方面矩不变量可以直接衡量目标的相似性，本申请利用矩不变量的特性，将其作为一种特征表示，并应用在衡量从网络推导出的预测的差异，它们应该是完全相同或者是几乎一致的，这也减少了人工地增加标注的时间和支出。通过最大化预测间的相似性(或最小化预测的差异)，可以从另外一个角度来优化分割边界和预测的全局分布。

在总的损失函数中，由于SimBIS框架结合了监督学习和对比学习，因此总损失函数是监督损失函数和对比损失的加权和。它可以权衡监督学习和对比学习两者的效益，并用于反向传播来优化分割模型。

附图说明

为了更清楚地说明本申请的技术方案，下面对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例的一种具有对比机制的相似度感知框架的医学图像分割方法结构示意图；

附图标记说明：

1、数据增强模块；2、对比模块；3、监督模块；4、分割模型；5、损失函数。

具体实施方式

发明人在对医学图像进行分割的时候，发现使用小规模带有标注的数据对模型训练，最终的分割效果不能过充分地得到理想的效果。根据实验分析，可能是因为数据规模不够不能充分训练好一个网络的参数。为此，我们想使用数据增强技术来扩充我们的数据集，以求得训练好一个更具有泛化性的神经网络。但是经过我们的实验表明，过多的增强的数据并不会提高模型的性能，反而会造成过拟合。对于这个问题，我们提出了一个数据增强模块，这是一种部分的随机增强技术，通过人为地设置一个数据增强比例，对这部分数据进行随机数据增强，这些数据增强变换可以简单的组合变换增强(几何变换与色彩空间变换的组合，也可以是几何变换与色彩空间变换自身的组合)，也可以是一些简单的非线性变换(随机擦除，Cutmix)，以期待于产生新的样本，迫使模型学习更多的特征表示。对于单单使用数据增强技术是不够的，我们还想利用这些大量未标注的数据。通过利用对比学习的机制来学习到这些大量无标注数据的宝贵的底层特征，进而提高原有模型的分割性能。我们还设计了一个对比模块，还给出了新的对比损失函数和特征投影映射。在监督模块的指导下，对比损失函数仅使用正例计算相似度损失。对比损失函数用一个低维向量矩不变量来测的网络输出之间的相似性。最后，由于联合监督学习和对比学习，监督模块为对比模块的分割区域提供监督信息指导，对比模块可以通过相似度分析为监督模块挖掘更多潜在特征，进而得到更为精准又具备泛化性的模型。

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

为使本申请的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本申请作进一步详细的说明。

实施例一

如图1所示，为本申请实施例的一种具有对比机制的相似度感知框架的医学图像分割方法结构示意图，包括以下步骤：

获取数据；

对数据进行增强，得到数据集；将从部分带有标注和未标注数据生成增强数据集，根据数据集的特征，选择符合数据集的数据增强的变换集合。

组合数据增强可以是几何变换与色彩空间变换的组合，也可以是几何变换与色彩空间变换自身的组合。但是，数据增强的安全性必须根据任务来考虑。

非线性变换增强包括随机擦除和Cutmix两种变换增强，非线性变换增强t,t'～T有利于产生新的样本，使模型学习更多的特征表示。

设T是数据增强操作的集合，组合数据增强T₁和非线性变换增强T₂是两个从数据增强T中采样的独立不同数据增强操作,{T₁,T₂}∈T；并且设随机擦除为t_RE，Cutmix为t_CM，非线性变换增强{t_RE,t_CM}∈T₂。

数据集：本实施例使用了部分带有标注的数据和额外没有标注的相同域和相似域的数据通过上述的数据增强模块获得增强图像。其中，原始图像作为锚点，其增强后的图像作为正样本。{x_i,x_j}为一对经过数据增强T变换后的数据对。

对于带有标注的图像{x_n,y_n}_n＝1...N和没有标注的图像{x_m}_m＝1...M，设定比例因子α，只采取了αN+M张图片参与对比学习训练。

对于所有的图片x_k，k∈αN+M，它的两个变换可以表示为：x_i＝t(x_k)、x_j＝t'(x_k)生成用于对比学习的数据集。

基于数据集，选择分割模型；选择现有的任何的适用的神经网络模型，包括基于CNN的模型或者Transformer的模型；为了衡量我们算法的性能，本实施例以PraNet为分割模型，使用Kvasir-Seg，CVC-ClinicDB和ISIC2018分割任务进行测试。具体的性能见表1，表2，表3。

表1

Method	DSC	IoU	Recall	Precision
					U-Net	0.597	0.471	0.617	0.672
Res-Unet	0.69	0.572	0.725	0.745
					Res-Unet++	0.714	0.613	0.742	0.784
SFA	0.723	0.611	-	-
					ResUNet-mod	0.791	0.429	0.691	0.871
DoubleU-Net	0.813	0.733	0.84	0.861
					ColonSegNet	0.820	0.723	0.849	0.843
PSPNet	0.841	0.744	0.836	0.890
					HRNet	0.845	0.759	0.859	0.878
DDANet	0.857	0.78	0.8880	0.864
					DeepLabv3+	0.864	0.786	0.859	0.906
FANet	0.880	0.810	0.906	0.901
					PraNet	0.8980	0.84	-	-
HarDNet-MSEG	0.912	0.857	-	-
					TransFuse-S	0.918	0.868	-	-
TransFuse-L	0.918	0.868	-	-
					SimBIS(our)	0.928	0.876	0.93	0.939

表2

Method	DSC	IoU	Recall	Precision
					SFA	0.7	0.607	-	-
Res-Unet	0.778	0.454	0.668	0.887
					U-Net++	0.794	0.729	-	-
Res-Unet++	0.795	0.796	0.702	0.878
					U-Net	0.823	0.755	-	-
Deeplav3+(Xception)	0.889	0.870	0.925	0.936
					Deeplav3+(Mobilenet)	0.898	0.858	0.916	0.928
PraNet	0.899	0.849	-	-
					DoubleU-Net	0.923	0.861	0.845	0.959
HarDNet-MSEG	0.932	0.882	-	-
					TransFuse-S	0.918	0.868	-	-
TransFuse-L	0.934	0.886	-	-
					SimBIS(our)	0.929	0.887	0.957	0.926

表3

Method	DSC	IoU	Recall	Precision
					U-Net	0.674	0.549	0.708	-
AttentionU-Net	0.665	0.566	0.717	-
					R2U-Net	0.679	0.581	0.792	-
AttentionR2U-Net	0.691	0.592	0.726	-
					BCDU-Net	0.851	-	0.785	-
MedT	0.859	0.778	-	-
					FANet	0.873	0.802	0.865	0.923
Deeplav3+(Xception)	0.877	0.812	0.868	0.927
					Deeplav3+(Mobilenet)	0.878	0.823	0.883	0.924
CE-Net	0.891	0.816	-	-
					TransUNet	0.894	0.822	-	-
DobleU-Net	0.896	0.821	0.878	0.945
					SimBIS(our)	0.909	0.843	0.895	0.941

根据数据集的特点，整理模型的数据加载模块；根据数据集图像的通道和尺寸，调整模型参数。

对分割模型进行对比学习，提高分割模型分割性能；

在对比模块中设计了新的对比损失函数和特征投影映射。在监督模块的指导下，对比损失函数仅使用正例计算相似度损失。对比损失函数用一个低维向量矩不变量来测的网络输出之间的相似性。

为了能充分地挖掘数据的潜能进而继续提高模型的分割性能，我们想利用对比模块来达到这个目的。因为对比模块可以利用自我监督对比学习的机制，使模型学到更多有用的底层特征。

相比传统的对比学习，对比学习模块充当了训练Pre-TextTask的角色。一般Pre-TextTask中学习的模型是用给随后的Downstream Task。但是我们设计的SimBIS框架，Pre-TextTask和Downstream Task是同时进行的。这样的设计动机是我们将对比自监督学习用在分割任务上。如果单单只训练Pre-TextTask接着再用给Downstream Task，即使自监督学习的过程使用大量的正样本和负样本进行对比学习，模型也很难去找到感兴趣的分割感兴趣部位是什么和在图片的哪个位置。SimBIS框架结合了监督模块(DownstreamTask)，可以指导Pre-TextTask在对比自监督学习上准确地学习待分割目标的特征。

利用自我监督对比学习，使模型学到更多有用的底层特征，进而挖掘数据的潜能，继续提高模型的分割性能。

将数据增强的数据集输入分割模型，利用数据增强生成的数据集{x_i,x_j}作为分割模型f(·)的输入，将这些数据集输送进分割模型f(·)，模型的输出即为数据集的各自预测。对于一张增强图片x_i，它的分割预测

可以表示为：

分割模型对其进行输出，对输出的数据进行矩不变量映射，将这些每一个预测转化为矩不变量来表示。矩不变量可以将图片映射成一个低维的向量，并且矩不变量被证明是对于缩放、平移和缩放具有不变性。矩不变量的选择可以是胡矩不变(HuMomentInvariants)、几何矩不变量(GeometricMoment Invariants)、复矩不变(ComplexMomentInvariants)、勒让德矩不变量(LegendreMomentInvariants)和泽尼克矩不变量(Zernike MomentInvariants)。

本实施例中选择胡矩不变(HuMomentInvariants)，定义矩不变量映射为p_moment(·)，一张增强图片x_i的特征表示可以表示为：

对所述进行对比学习的分割模型再进行监督学习，共同训练模型；维持监督学习的分割精度，并学习未标记数据的潜在有效特征。监督学习能为对比学习的分割区域提供监督信息指导，而对比学习能够挖掘更多潜在的特征并将其提供给监督学习过程的学习，进而得到优化和获得更为精准的分割性能表现。在对于不同的特定的分割任务，使用者可以选择不同分割损失函数。

一般来说，采用自我监督学习的计算机视觉管道包括执行两个任务:Pre-TextTask和Downstream Tasks。Downstream Tasks是应用程序特定的任务，利用在Pre-TextTask中所学的知识。而我们的SimBIS框架是与对比学习同时进行的。它会隐式地给对比学习提供目标和分割位置。

对所述共同训练的模型进行损失，优化模型；基于对比损失函数和监督损失函数确定最终总损失函数，然后最小化总损失函数，更新训练模型达到迭代次数为止；

在对比损失函数l^con的构造中，包括余弦相似度对比损失函数

和误差对比损失函数

其中，

余弦相似度对比损失函数：

对于给定的两个矩不变量映射z_i，z_j，它们的余弦相似度可以表示为：

式中，z_i，z_j表示两个矩不变量映射,sim(·)函数表示相似度计算，z_i ^Tz_j表示两个对应向量相乘，||z_i||||z_j||表示两个对应两个向量的模，即向量的数值大小。

由于SimBIS框架结合了监督学习和对预测映射的学习。SimBIS有了一种导向作用对感兴趣的分割部位进行学习。此外，引入大量的负例会要求训练模型需要大的批尺寸和产生大量的计算。因此我们的对比损失计算也只使用正例计算对比损失，使用较小的批尺寸便可以对模型进行训练。

余弦相似度对比损失函数可的公式如下：

式中，z_i，z_j表示两个矩不变量映射，sim(·)函数表示相似度计算，exp(·)表示是指数函数，然后对aN+M个相加，再取平均。

误差对比损失函数：

在本实施例中，我们还提供了另外一种方案。可能在计算损失梯度的时候，数值的误差比向量的相似度更有利于反向传播。误差对比损失函数的公式如下：

||||₂指的是对符号里面取绝对值，也就是二范数。

指的是相对于z_i的相对误差。

监督损失函数：

给定的{x_n,y_n}_n＝1...N，定义监督损失函数l^sup为：

利用对比损失函数l^con和监督损失函数l^sup，确定w_sup，w_con。

SimBIS框架结合了监督学习和对比学习，因此总损失函数l_total是监督损失函数l^sup和对比损失l^con的加权和。最终，我们的损失函数可以表示为：l_total＝w_supl^sup+w_conl^con，然后最小化总损失函数L_total，训练模型达到到迭代次数E为止。

通过模型在测试集上的表现采用mDice(Dice Coefficient)，mIoU(Intersection-over-Union)，Recall和Precision来衡量模型性能的指标。

实施例二

针对生物医学图像分割数据集稀缺的问题，本申请提出了一种基于对比度机制的相似度感知的医学图像分割框架(SimBIS)，可灵活应用于不同的分割模型。目前大多数研究都集中在复杂的网络结构上，而不是像本专利从数据层面上去充分地探索潜在的特征。该框架包括一个数据增强模块、一个对比模块、一个监督模块、一个分割模型和损失函数。此外，网络模块可以灵活应用于任何不同的分割模型。能够做到即插即用，并且可以在原有的模型上再继续优化得到更精准的分割效果。

针对生物医学图像分割数据集稀缺的问题，提出了一种基于对比度机制的相似感知的医学图像分割框架。分割框架如图1所示。分割框架包含一个数据增强模块(1)、一个对比模块(2)、一个监督模块(3)、一个分割模型(4)和损失函数(5)。

数据增强模块将从部分带有标注和未标注数据生成增强数据对，作为对比模块的输入。将对比模块(2)与监督模块(3)相结合，挖掘图像感兴趣区域的潜在特征，进一步提高目标任务的分割性能。分割模型(4)将为对比模块(2)与监督模块(3)提供分割模型。最后，损失函数(5)计算对比模块(2)与监督模块(3)的损失，并通过反向传播优化分割模型.具体SimBIS的算法可见算法1.

本申请设计了多种数据增强功能。数据增强模块采用线性变换增强和非线性变换增强相结合的方法来提高增强图像的可分辨性，增加图像变换的多样性，还能与对比模块形成一种对抗机制。

数据增强模块是为对比模块所服务的。所生成的增强图片将用于对比模块的对比学习。由于无监督对比学习比有监督学习更受益于数据增强，并且组合数据增加操作对于学习好的表征至关重要。

不仅提高图像的丰富性和多样性，数据增强模块还能与对比模块形成一种对抗机制。具体是，数据增强模块尽可能使图片的区分度更大，而对比模块通过自监督使图像的特征映射的相似度的误差更小(或者相似度更大)，进而优化网络和提高性能。

在本申请中，数据增强操作T包含组合数据增强T₁和非线性变换T₂,其中{T₁,T₂}∈T。设T是数据增强操作的集合，其中t,t'～T是两个独立从T中采样的不同数据增强操作。

组合变换增强：这些组合变换可以是几何变换与色彩空间变换的组合，也可以是几何变换与色彩空间变换自身的组合。但是，数据增强的安全性必须根据任务来考虑。

非线性变换增强：为了提高图片的可区分度和增加图片变换的复杂性，我们引用了增加了随机擦除，t_RE和Cutmix，t_CM两种变换增强，{t_RE,t_CM}∈T₂。虽然非线性变换增强在一定的程度会破坏图片的完整性和产生对比相似度的误差。但是非线性变换增强似乎有利于产生新的样本，迫使模型学习更多的特征表示。

在以往的研究已证明过多的数据增强并不会为监督学习带来更多的收益。另外，进行监督学习训练，加入过多带有标注的增强数据可能使数据趋于同一个分布，进而造成过拟合现象。对于带有标注的图像{x_n,y_n}_n＝1...N和没有标注的图像{x_m}_m＝1...M，我们只采取了αN+M张图片参与对比学习训练，α为比例因子。

本申请提出了一种监督学习和对比学习的联合学习策略。监督模块为对比模块的分割区域提供监督信息指导，对比模块可以通过相似度分析为监督模块挖掘更多潜在特征。

相比传统的对比学习，对比学习模块充当了训练Pre-Text Task的角色。一般Pre-Text Task中学习的模型是用给随后的Downstream Task。但是我们设计的SimBIS框架，Pre-TextTask和Downstream Task是同时进行的。这样的设计动机是我们将对比自监督学习用在分割任务上。如果单单只训练Pre-Text Task接着再用给Downstream Task，即使自监督学习的过程使用大量的正样本和负样本进行对比学习，模型也很难去找到感兴趣的分割感兴趣部位是什么和在图片的哪个位置。SimBIS框架结合了监督模块(DownstreamTask)，可以指导Pre-Text Task在对比自监督学习上准确地学习待分割目标的特征。

在监督模块，这里处理的任务是目标任务。对应地，它也是在对比学习中的Downstream Tasks。一般来说，采用自我监督学习的计算机视觉管道包括执行两个任务:Pre-Text Task和Downstream Tasks。Downstream Tasks是应用程序特定的任务，利用在Pre-Text Task中所学的知识。而我们的SimBIS框架是与对比模块同时进行的。它会隐式地给对比学习提供目标和分割位置。

数据对：我们使用了部分带有标注的数据和额外没有标注的相同域和相似域的数据通过上述的数据增强模块获得增强图像。其中，原始图像作为锚点，其增强(变换)后的图像作为正样本。{x_i,x_j}为一对经过数据增强T变换后的数据对。

分割网络输出：我们将这些数据对喂进分割网络f(·)，网络的输出即为数据对的各自预测。这也是SimBIS框架要同时结合监督模块(DownstreamTask)的原因，可以得到靠近分割目标的预测。对于一张增强图片x_i，它的分割预测

可以表示为：

矩不变量映射：跟传统的对比学习类似，其使用一个浅层MLP将网络输出映射到一个低维的空间。由于网络的输出是各个数据对的预测，我们给出的方案是利用矩不变量，将这些每一个预测转化为矩不变量来表示。矩不变量可以将图片映射成一个低维的向量，并且矩不变量被证明是对于缩放、平移和缩放具有不变性。我们可以最大化数据对的相似度(或者它们最小化误差)，再经过反向传播，以此来迫使网络去学习这些数据对的底层特征表示。矩不变量的选择可以是胡矩不变(HuMoment Invariants)、几何矩不变量(GeometricMoment Invariants)、复矩不变(Complex Moment Invariants)、勒让德矩不变量(Legendre Moment Invariants)和泽尼克矩不变量(Zernike Moment Invariants)，可以默认选择胡矩不变(Hu Moment Invariants)。我们定义矩不变量映射为p_moment(·)，一张增强图片x_i的特征表示可以表示为：

对比损失函数：在对比损失函数l^con的构造中，我们给出了两种方案：(1)余弦相似度对比损失函数

(2)误差对比损失函数

其中，

余弦相似度对比损失函数：在对比设置中，最常用的相似度度量是余弦相似度，它作为不同对比损失函数的基础。对于给定的两个矩不变量映射z_i，z_j，它们的余弦相似度可以表示为：

其中，z_i，z_j表示两个矩不变量映射,sim(·)函数表示相似度计算，z_i ^Tz_j表示两个对应向量相乘，||z_i||||z_j||表示两个对应两个向量的模。

由于SimBIS框架结合了监督模块(Downstream Task)和对预测映射的学习。SimBIS有了一种导向作用对感兴趣的分割部位进行学习。此外，引入大量的负例会要求训练模型需要大的批尺寸和产生大量的计算。因此我们的对比损失计算也只使用正例计算对比损失，使用较小的批尺寸便可以对模型进行训练。

余弦相似度对比损失函数可表示为：

误差对比损失函数：在专利中，我们还给出了另外一种方案。我们给出的解释，可能在计算损失梯度的时候，数值的误差比向量的相似度更有利于反向传播。我们将误差对比损失函数定义为：

余弦相似度对比损失函数偏向两个矩不变量映射向量的方向，而欧拉误差对比损失函数偏向于两个矩不变量映射向量数值的变化。

SimBIS框架结合了监督模块和对比模块，因此总损失函数l_total是监督损失函数l^sup和对比损失l^con的加权和。最终，我们的损失函数可以表示为：

l_total＝-w_supl^sup-w_conl^con

这里w_sup和w_con分别为l^sup和l^con的权重。

SimBIS设计了多种数据增强功能。数据增强模块采用线性变换增强和非线性变换增强相结合的方法来提高增强图像的可分辨性，不仅提高图像的丰富性和多样性，数据增强模块还能与对比模块形成一种对抗机制。具体是，数据增强模块尽可能使图片的区分度更大，而对比模块通过自监督使图像的特征映射的相似度的误差更小(或者相似度更大)，进而优化网络和得到更具泛化和稳定的分割模型。本专利采用数据增强模块，既能实现适当的数据增强，在一定程度上可以缓解小规模医学图像分割数据稀缺的问题；又能有效地避免因过度有标注的数据增强使训练数据趋向于同个分布，进而导致的过拟合现象。

在对比模块中设计了新的对比损失函数和特征投影映射。在监督模块的指导下，对比损失函数仅使用正例计算相似度损失。这样可以避免对比学习中需要大量正负例来计算相似度的问题，极大地减少了计算量和提升了计算效率。损失函数用一个低维向量矩不变量来测的网络输出之间的相似性，一方面，将数据转化为低维向量可以大幅度减少训练的计算量，另一方面矩不变量可以直接衡量目标的相似性，本专利利用矩不变量的特性，将其作为一种特征表示，并应用在衡量从网络推导出的预测的差异，它们应该是完全相同或者是几乎一致的，这也减少了人工地增加标注的时间和支出。通过最大化预测间的相似性(或最小化预测的差异)，可以从另外一个角度来优化分割边界和预测的全局分布。

以上所述的实施例仅是对本申请优选方式进行的描述，并非对本申请的范围进行限定，在不脱离本申请设计精神的前提下，本领域普通技术人员对本申请的技术方案做出的各种变形和改进，均应落入本申请权利要求书确定的保护范围内。

Claims

1.一种具有对比机制的相似度感知框架的医学图像分割方法，其特征在于，包括以下步骤：

获取图像数据；

对所述图像数据进行增强，得到图像数据集；

基于所述图像数据集，选择分割模型；

2.根据权利要求1所述的具有对比机制的相似度感知框架的医学图像分割方法，其特征在于，对所述图像数据进行增强的方法包括：组合数据增强和非线性变换增强。

3.根据权利要求2所述的具有对比机制的相似度感知框架的医学图像分割方法，其特征在于，所述组合数据增强的方法包括：几何变换与色彩空间变换的组合或几何变换与色彩空间变换自身的组合。

4.根据权利要求2所述的具有对比机制的相似度感知框架的医学图像分割方法，其特征在于，所述非线性变换增强的方法包括：随机擦除和Cutmix。

5.根据权利要求1所述的具有对比机制的相似度感知框架的医学图像分割方法，其特征在于，对所述分割模型进行对比学习的方法包括：将所述数据增强的数据集输入分割模型，分割模型对其进行输出，对输出的数据进行矩不变量映射。

6.根据权利要求1所述的具有对比机制的相似度感知框架的医学图像分割方法，其特征在于，所述进行监督学习的方法包括：选择不同分割损失函数。

7.根据权利要求1所述的具有对比机制的相似度感知框架的医学图像分割方法，其特征在于，对所述共同训练的模型进行损失的方法包括：对比损失函数和监督损失函数。

8.根据权利要求7所述的具有对比机制的相似度感知框架的医学图像分割方法，其特征在于，所述对比损失函数的方法包括：

余弦相似度对比损失函数的公式如下：

余弦相似度公式如下：

其中，z_i，z_j表示两个矩不变量映射，sim(·)函数表示相似度计算，z_i ^Tz_j表示两个对应向量相乘，||z_i||||z_j||表示两个对应两个向量的模；

误差对比损失函数的公式如下：

|| ||₂表示对符号里面取绝对值，即二范数；

表示相对于z_i的相对误差。

9.根据权利要求7所述的具有对比机制的相似度感知框架的医学图像分割方法，其特征在于，所述监督损失函数的方法包括：监督损失函数的公式如下：

10.根据权利要求9所述的具有对比机制的相似度感知框架的医学图像分割方法，其特征在于，所述优化后的模型用于医学图像分割的方法包括：基于所述对比损失函数和所述监督损失函数确定最终总损失函数，然后最小化总损失函数，更新训练模型达到迭代次数为止。