CN113962999B

CN113962999B - 基于高斯混合模型和标签矫正模型的噪声标签分割方法

Info

Publication number: CN113962999B
Application number: CN202111218972.4A
Authority: CN
Inventors: 童若锋; 董家骅; 张月
Original assignee: Zhejiang University ZJU
Current assignee: Zhejiang University ZJU
Priority date: 2021-10-19
Filing date: 2021-10-19
Publication date: 2024-06-25
Anticipated expiration: 2041-10-19
Also published as: CN113962999A

Abstract

本发明公开了一种基于高斯混合模型和标签矫正模型的噪声标签分割方法。该方法包括以下模块：(1)预训练分割模型，可以是任意现有的分割模型；(2)噪声标签鉴定模块，该模块通过分割网络的预测结果与混有噪声标签的原标签比较，区分得到无噪标签和含噪标签，并挑选含噪标签进行标注；(3)标签矫正模块，该模块利用特征相似度选择置信度较高的像素以计算影像的伪标签；(4)置信反向传播模块，考虑到生成的伪标签可能带来新的噪声,该模块仅利用置信度高的伪标签和原始标签对网络进行参数训练。本发明提供的噪声标签分割方法，有效防止模型对噪声标签过分拟合，能够更准确地实现噪声标签背景下的医学图像感兴趣区域的分割。

Description

基于高斯混合模型和标签矫正模型的噪声标签分割方法

技术领域

本发明属于医学图像噪声标签领域，用于处理医学图像中由于各种原因引起的噪声标签问题，具体提出了一种基于高斯混合模型和标签矫正模型的噪声标签分割方法。

背景技术

图像分割是医学图像处理分析中的一个重要步骤，是图像处理、计算机视觉领域中的经典问题。医学图像的噪声标签分割一直是医学图像分析领域的一个新兴热点。噪声标签分割具体指训练数据集的标签存在各种噪声，会对模型的训练产生影响，直接导致模型的精度下降。而在实际生活中，因为专家疲惫或者本身较难区分等原因也确实存在部分漏标、错标等现象，噪声标签分割是真实存在的。因此，如何在没有进一步注释的情况下消除噪声标签对分割任务的干扰是一个值得研究的问题与挑战。

目前，医学图像噪声标签的处理方法主要可分为两大类：基于梯度的以及基于模型结构的。前者基于噪声标签在模型训练过程中往往更加难以拟合这一观点，Ren等人就通过这一想法寻找噪声标签并为这些标签样本分配了较低的权重。而后者则主要对模型结构进行改进，如Goldberger等人设计了一个适应层来模拟潜在真实标签被破坏成嘈杂标签的过程，Jiang等人引入MentorNet来发现“正确的”样本并更多地关注它们，Xue等人设计了一种在线不确定性样本挖掘方法和一种重新加权策略以消除噪声标签的干扰。当然，目前绝大多数研究都集中在分类任务上，因为它是自然图像处理领域中最基本的问题。而分割问题相较于分类问题可以将噪声标签的处理分为两大类：图像级别的以及像素级别的。前者主要为区分带噪声的图片与不带噪声的图片，以Zhu等人的标签质量评估策略为代表；而后者则面向像素点直接纠正，如Zhang等人的置信学习方法通过混淆矩阵的方法寻找可能标记错误的像素点并进行纠正。

而本发明从图像、像素两个级别出发，具体提出了基于高斯混合模型和标签矫正模型的噪声标签分割方法，运用高斯混合模型寻找噪声标签、运用标签矫正模型矫正标签，从而有效较少了噪声标签所带来的精度下降。

发明内容

本发明的目的在于针对现有技术的不足，基于高斯混合模型和标签矫正模型的噪声标签分割方法，从而解决了噪声标签背景下的医学图像感兴趣区域的分割问题。本发明通过分割模块、高斯混合模型、标签矫正模块、置信反传模块四个模块相结合，实现了噪声标签下的医学图像感兴趣区域的分割。

本发明的基于高斯混合模型和标签矫正模型的噪声标签分割方法，包括以下步骤：

(1)将输入图像和对应的混有噪声标签的原标签分为两个子数据集，对每个子数据集分别进行下述步骤(2)-(6)；

(2)根据输入图像和混有噪声标签的原标签进行简单模型预训练，并使用预训练模型预测输入图像，得到预测分割结果；

(3)计算损失函数，并利用自信预测熵对其进行修正，对修正后的损失函数采用期望最大化(EM)算法拟合高斯混合模型，从而对混有噪声标签的原标签进行聚类，区分得到无噪标签和含噪标签；

(4)对含噪标签使用标签矫正模块：计算输入图像中每个像素的显著度，以及属于目标区域的概率，根据计算结果判断像素点是否属于目标区域，得到输入图像的伪标签；

(5)在训练过程中，采用互补学习策略，将上述两个子数据集训练得到的两个网络互相校对,以剔除确认偏差；

(6)在梯度反向传播阶段，运用置信反向传播模块，仅使用低噪声伪标签和无噪的原标签对网络进行反向传播；

(7)训练结束后，由来自两个网络的模型共同预测测试样本的标签。

上述技术方案中，优选的，所述的步骤2)为：对输入图像和混有噪声标签的原标签的数据集X＝{x^(t),y^(t)}^k运用分割网络训练10-50回合作为预训练模型，并使用预训练模型对输入图像x^(t)进行预测，得到预测分割结果记做：

其中，x^(t)∈R^n×m表示数据集中第t个输入图像，y^(t)∈N^n×m表示数据集中第t个原标签，m、n为图片长宽像素点个数，k表示数据集样本数量，F表示特征提取器，C为分类器，C(F(·))即为预训练模型。其中，所述分割网络可以任意选取，例如UNet、Deeplab等。

所述的数据集样本数量k约为200-1000个样本，原标签中噪声标签的含量为25％-75％不等。

上述技术方案中，优选的，所述的步骤3)为：

采用交叉熵损失对输入图像x⁽ⁱ⁾与标签y⁽ⁱ⁾计算损失函数，根据预测分割结果计算自信预测熵H，利用自信预测熵H修正损失函数，得到最后，运用高斯混合模型对损失函数的集合进行聚类，并根据概率将其分为无噪标签和含噪标签。

更优选的，所述的步骤3)具体为：

1)计算损失函数

损失函数具体采用交叉熵损失，对于输入图像x^(t)与原标签y^(t)，其损失函数为：

式中，为预测分割结果中第i行第j列像素点，为原标签中第i行第j列像素点。

2)计算网络的自信预测熵：

式中，c表示类别，为第c个类别的概率，x为输入图片，θ为模型参数；

最后，计算修正后的损失函数：

3)区分无噪标签和含噪标签

对所有损失函数所构成的集合进行归一化，得到归一化后的集合l_{pred_noise}，对l_{pred_noise}使用期望最大化(EM)算法拟合一个双分量的高斯混合模型。至此，第t个样本标签属于无噪标签和含噪标签的概率为后验概率和

式中，表示归一化后的集合l_{pred_noise}中第t个样本标签所对应的值；

上述高斯混合模型拟合后得到两个高斯分量，其中，g_small为均值较小的一个高斯分量，g_large为均值较大的一个高斯分量。对于每个样本标签，当时，我们判定它为无噪标签；反之，我们认为它是含噪标签，并需要对其重新进行标注。

优选的，步骤3)中所述的高斯混合模型，具体为：

优选的，步骤3)中所述EM算法，

具体为：

1)计算似然函数

2)对似然函数取对数

式中，n为样本标签和预测分割结果的个数；

3)对上式求导，令导数为0，得似然方程；解似然方程，得到参数值μ₁,Σ₁,μ₂和Σ₂。

优选的，所述的步骤4)为：从疑似目标区域(即预训练预测分割结果所对应的区域)中挑选出最具代表性的显著区域(显著度较高的区域)，并以显著区域的特征作为计算伪标签的特征，经过标签矫正，得到伪标签y’^(t)。

优选的，所述的步骤4)中显著区域，计算方法如下：

1)对于输入图像x^(t)，根据预训练所得特征向量计算每个像素的显著度。其中，图像中任意像素点的特征向量指特征提取器F输出结果中第i行第j列的值，即：

所述特征提取器F与上述步骤2)中相同；

像素点p的显著度的计算方式如下：

其中，p,q均为图片上任意像素点，||f(p)||₂||f(q)||₂代表点p和点q的特征向量之间的欧式距离，R_sus表示输入图像中与预测分割结果相对应的区域，即疑似目标区域。显著度S(p)衡量了像素点p在疑似目标区域内的显著度，其值越大，p越能够代表整个疑似目标区域。

2)根据显著度求解显著区域。我们在显著度的基础上指定阈值σ(本发明中优选σ＝0.7)，选取S(p)＞σ的点p所构成的区域作为显著区域，记做proto＝{p|S(p)＞σ}。

优选的，所述步骤4)中伪标签计算步骤，具体如下：

1)我们为输入图像x^(t)中的每个像素点p重新计算属于目标区域的概率：

其中，K为显著区域proto内像素点的个数，proto_j为显著区域内第j个像素点的特征向量，||f(p)||₂||proto_j||₂表示点p和显著区域内第j个像素点特征向量之间的欧氏距离；

2)当score(p)＞η时(本发明中优选η＝0.7)，我们将像素划分为前景点，反之，将其划分为背景点。得到的所有前景点构成目标区域，背景点构成非目标区域。

3)对伪标签进行进一步的后处理优化：(1)去除面积过小的连通目标区域，将其作为非目标区域。(2)填充目标区域内部的小孔，将其作为目标区域。根据经验，所述的面积过小的连通目标区域和所述的目标区域内部的小孔，皆选择面积小于原目标区域总面积10％的连通区域。

优选的，所述的步骤5)为：在训练过程中，采用互补学习策略，对每个子数据集均进行如下操作：线性组合混有噪声标签的原标签y^(t)与对于当前子数据集网络下步骤4)中重新生成的伪标签y’^(t)，在步骤3)中由另一个子数据集训练生成网络所产生的干净概率w^(t)的指导下，对标记样本进行标签协同细化：

其中，干净概率w^(t)即为另一个子数据集在步骤3)中产生的属于无噪标签的概率。

优选的，所述的步骤6)为：将协同细化后的伪标签作为目标进行训练，在网络的反向传播过程中，通过拟合一个二分量的高斯混合模型来鉴别伪标签的噪声程度，筛除噪声程度较高的伪标签，不让这部分标签参与网络的梯度计算。

更优选的，所述的步骤6)具体为：

1)对每张图片根据步骤5)中生成的伪标签计算交叉熵损失：

其中，为当前训练网络预测结果。

2)将“新生成”的伪标签分为高噪声伪标签和低噪声伪标签

对“新生成”的伪标签所构成的损失函数集合进行归一化，得到归一化后的集合l_{pse_ce}。对l_{pred_ce}使用期望最大化(EM)算法拟合一个双分量的高斯混合模型，将对“新生成”的伪标签分为高噪声伪标签和低噪声伪标签，拟合方法与步骤3)中相类似。

3)筛除高噪声伪标签，仅对低噪声伪标签和无噪标签进行梯度反向传播。

优选的，所述的步骤7)为：使用两个子数据集所训练的模型分别对待分割图像x_test进行分割，图像x_test中像素点p属于目标区域的概率为两个模型输出的概率的平均值。

本发明还提供一种基于高斯混合模型和标签矫正模型的图像分割系统，该系统由上述方法训练得到。

本发明所提出的基于高斯混合模型和标签矫正模型的噪声标签分割方法，与传统的噪声标签分割算法相比，本发明通过高斯混合模型在图片级别区分噪声标签与无噪标签，运用显著区域的方式在像素级别矫正噪声标签，并且提出了互补学习策略、置信反向传播模块等，更为有效地矫正了噪声标签，避免了模型训练中噪声标签过拟合所带来的精度误差，从而大大提高目标区域的分割精度。

附图说明

图1是本发明实施的一种基于高斯混合模型和标签矫正模型的噪声标签分割方法流程图；

图2是本发明实施的一种基于高斯混合模型和标签矫正模型的噪声标签分割方法模型图(子数据集部分)；

图3是本发明实施例所述的标签矫正模块示意图；

图4是本发明实施例与传统噪声标签分割方法的效果对比图。

具体实施方式

下面结合附图和实施例，对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明，但不用来限制本发明的范围。

如图1所示是本发明提供的基于高斯混合模型和标签矫正模型的噪声标签分割方法流程图。包括如下步骤：

所述的步骤2)为：对输入图像和混有噪声标签的原标签的数据集X＝{x^(t),y^(t)}^k运用分割网络训练10-50回合作为预训练模型，并使用预训练模型对输入图像x^(t)进行预测，得到预测分割结果记做：

其中，x^(t)∈R^n×m表示数据集中第t个输入图像，y^(t)∈N^n×m表示数据集中第t个原标签，m、n为图片长宽像素点个数，k表示数据集样本数量，F表示特征提取器，C为分类器，C(F(·))即为预训练模型。

所述的步骤3)为：

更优选的，所述的步骤3)具体为：

1)计算损失函数

式中，为预测分割结果中第i行第j列像素点，为原标签y^(t)中第i行第j列像素点。

2)计算网络的自信预测熵：

最后，计算修正后的损失函数：

3)区分无噪标签和含噪标签

步骤3)中所述的高斯混合模型具体为：

步骤3)中所述EM算法，具体为：

1)计算似然函数

2)对似然函数取对数

式中，n为样本标签和预测分割结果的个数；

所述的步骤4)为：从疑似目标区域(即预训练预测分割结果所对应的区域)中挑选出最具代表性的显著区域(显著度较高的区域)，并以显著区域的特征作为计算伪标签的特征，经过标签矫正，得到伪标签y’^(t)。

所述的步骤4)中显著区域，计算方法如下：

2)对于输入图像x^(t)，根据预训练所得特征向量计算每个像素的显著度。其中，图像中任意像素点的特征向量指特征提取器F输出结果中第i行第j列的值，即：

所述特征提取器F与上述步骤2)中相同；

像素点p的显著度的计算方式如下：

所述步骤4)中伪标签计算步骤，具体如下：

所述的步骤5)为：在训练过程中，采用互补学习策略，对每个子数据集均进行如下操作：线性组合混有噪声标签的原标签y^(t)与对于当前子数据集网络下步骤4)中重新生成的伪标签y’^(t)，在步骤3)中由另一个子数据集训练生成网络所产生的干净概率w^(t)的指导下，对标记样本进行标签协同细化：

所述的步骤6)为：将协同细化后的伪标签作为目标进行训练，在网络的反向传播过程中，通过拟合一个二分量的高斯混合模型来鉴别伪标签的噪声程度，筛除噪声程度较高的伪标签，不让这部分标签参与网络的梯度计算。

步骤6)具体为：

1)对每张图片根据步骤5)中生成的伪标签计算交叉熵损失：

其中，为当前训练网络预测结果。

2)将“新生成”的伪标签分为高噪声伪标签和低噪声伪标签

所述的步骤7)为：使用两个子数据集所训练的模型分别对待分割图像x_test进行分割，图像x_test中像素点p属于目标区域的概率为两个模型输出的概率的平均值。

本发明能较准确地实现噪声标签背景下的医学影像分割问题，从图片级别与像素级别分别考虑，更好地修正了噪声标签，从而提高了模型精度。如图4所示，采用本发明方法相对于传统噪声背景下的分割方法，具有更高的精度和准确率。

以上实施方式仅用于说明本发明，而并非对本发明的限制，有关技术领域的普通技术人员，在不脱离本发明的精神和范围的情况下，还可以做出各种变化和变型，因此所有等同的技术方案也属于本发明的范畴，本发明的专利保护范围应由权利要求限定。

Claims

1.基于高斯混合模型和标签矫正模型的噪声标签分割方法，其特征在于，包括如下步骤：

(1)将数据集分为两个子数据集，对每个子数据集分别进行下述步骤(2)-((6)，所述数据集包括输入图像以及混有噪声标签的原标签；

(2)根据数据集进行简单模型预训练，并使用所得的预训练模型预测输入图像，得到预测分割结果；

(3)利用损失函数对混有噪声标签的原标签进行聚类，计算出原标签属于无噪标签和含噪标签的概率，进而区分得到无噪标签和含噪标签；

(4)对含噪标签使用标签矫正模块：计算输入图像中每个像素的显著度，以及属于目标区域的概率，根据计算结果对图像进行分割，得到输入图像的伪标签；

(5)采用互补学习策略，将两个子数据集训练得到的两个网络互相校对,以剔除确认偏差，得到协同细化后的伪标签；

(6)梯度反向传播阶段：运用置信反向传播模块，仅使用低噪声伪标签和无噪的原标签对网络进行反向传播；

(7)训练结束后，由来自两个网络的训练模型共同预测待分割样本的标签；

所述步骤(5)的互补学习策略具体为：

对两个子数据集均进行如下操作：线性组合混有噪声标签的原标签y^(t)与当前子数据集在步骤(4)中重新生成的伪标签y’^(t)，对标记样本进行标签协同细化，得到协同细化后的伪标签

其中，w^(t)为另一个子数据集在步骤(3)中产生的属于无噪标签的概率。

2.根据权利要求1所述的基于高斯混合模型和标签矫正模型的噪声标签分割方法，其特征在于，所述步骤(1)中两个子数据集不相交。

3.根据权利要求1所述的基于高斯混合模型和标签矫正模型的噪声标签分割方法，其特征在于，所述步骤(2)为：对输入图像和混有噪声标签的原标签的数据集X＝{x^(t)，y^(t)}^k运用现有的分割网络训练10-50回合作为预训练模型，并使用预训练模型对输入图像x^(t)进行预测，得到预测分割结果其中，x^(t)表示数据集中第t个输入图像，y^(t)表示数据集中第t个原标签，k表示数据集样本数量。

4.根据权利要求1所述的基于高斯混合模型和标签矫正模型的噪声标签分割方法，其特征在于，所述步骤(3)具体为：

(3.1)计算损失函数：

对于输入图像x^(t)与原标签y^(t)，其损失函数为：

式中，为预测分割结果中第i行第j列像素点，为原标签y^(t)中第i行第j列像素点，m、n为图像长宽像素点个数；

(3.2)计算自信预测熵：

式中，c表示类别，为第c个类别的概率，x为输入图片，θ为模型参数，为第i行第j列像素点的自信预测熵，H^(t)为第t个标签的自信预测熵；

最后，计算修正后的损失函数：

(3.3)区分无噪标签和含噪标签：

对所有修正后的损失函数所构成的集合进行归一化，得到归一化后的集合l_{pred_noise}，对l_{pred_noise}使用期望最大化EM算法拟合一个双分量的高斯混合模型，其中均值较小的高斯分量记为g_small，均值较大的高斯分量记为g_large；

第t个样本标签属于无噪标签和含噪标签的概率为后验概率和

式中，表示归一化后的集合l_{pred_noise}中第t个样本标签所对应的值；对于每个样本标签，当时，判定它为无噪标签；反之，则为含噪标签。

5.根据权利要求1所述的基于高斯混合模型和标签矫正模型的噪声标签分割方法，其特征在于，所述步骤(4)的标签矫正模块具体为：

(4.1)确定输入图像的各点显著度：

对于输入图像x^(t)，根据特征向量计算每个像素的显著度，计算方式如下：

其中，p，q均为图片上任意像素点，图像中第i行第j列像素点的特征向量指特征提取器F输出结果中第i行第j列的值：

||f(p)||₂||f(q)||₂代表点p和点q的特征向量之间的欧式距离，R_sus表示输入图像中与预测分割结果相对应的区域，即疑似目标区域，显著度S(p)衡量了像素点p在疑似目标区域内的显著度；

(4.2)根据显著度确定显著区域：指定阈值σ，选取S(p)>σ的点p所构成的区域作为显著区域，记做proto＝{p|S(p)>σ}；

(4.3)计算输入图像x^(t)中的每个像素点p属于目标区域的概率：

(4.4)根据概率对图像进行分割：指定阈值η(，当score(p)>η时，将像素点p划分为前景点，构成目标区域，反之，将p划分为背景点，构成非目标区域；

(4.5)对分割得到的伪标签进一步后处理优化：去除面积过小的连通目标区域，将其作为非目标区域；填充目标区域内部的小孔，将其作为目标区域。

6.根据权利要求5所述的基于高斯混合模型和标签矫正模型的噪声标签分割方法，其特征在于，所述阈值σ＝0.7，所述阈值η＝0.7；所述的面积过小的连通目标区域和所述的目标区域内部的小孔，皆选择面积小于原目标区域总面积10％的连通区域。

7.根据权利要求1所述的基于高斯混合模型和标签矫正模型的噪声标签分割方法，其特征在于，所述步骤(6)具体为：

(6.1)使用协同细化后的伪标签进行训练，利用得到的训练网络对输入图像进行预测，得到

(6.2)对每张图像计算交叉熵损失：

(6.3)对协同细化后的伪标签所构成的损失函数集合进行一一化，得到一一化后的集合l_{pse_ce}；对l_{pred_ce}使用期望最大化((EM)算法拟合一个双分量的高斯混合模型，将对协同细化后的伪标签分为高噪声伪标签和低噪声伪标签；

(6.4)筛除高噪声伪标签，仅对低噪声伪标签和无噪标签进行梯度反向传播。

8.根据权利要求1所述的基于高斯混合模型和标签矫正模型的噪声标签分割方法，其特征在于，所述步骤(7)具体为：使用两个子数据集所训练的模型分别对待分割图像x_test进行分割，图像x_test中像素点p属于目标区域的概率为两个模型输出的概率的平均值。

9.基于高斯混合模型和标签矫正模型的图像分割系统，其特征在于，由如权利要求1所述的方法训练得到。