CN115797637A - 基于模型间和模型内不确定性的半监督分割模型 - Google Patents
基于模型间和模型内不确定性的半监督分割模型 Download PDFInfo
- Publication number
- CN115797637A CN115797637A CN202211704924.0A CN202211704924A CN115797637A CN 115797637 A CN115797637 A CN 115797637A CN 202211704924 A CN202211704924 A CN 202211704924A CN 115797637 A CN115797637 A CN 115797637A
- Authority
- CN
- China
- Prior art keywords
- order
- model
- feature
- features
- semi
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Image Analysis (AREA)
Abstract
Description
技术领域
本发明属于医学图像分割技术领域,具体来说涉及一种基于模型间和模型内不确定性的半监督分割模型。
背景技术
深度学习模型在各种图像分割任务中表现出了极大的成功,尤其是当有大量带注释的训练样本时[1]–[4]。但是,获取像素级的注释是一件非常耗时的任务。这在很大程度上降低了效率,尤其是在需要领域知识和专业知识(例如生物医学图像处理)的应用中。半监督学习(semi-supervised learning,SSL)是应对这一挑战的方法之一,该方法使用有限监督的数据进行训练。在半监督图像分割中,模型从具有已知语义标签的像素中学习,并充分利用了任意未标注数据的信息。
半监督分割的主要挑战性问题之一是如何将标记数据和未标记数据之间的一致性进行建模。不一致将导致分割结果的不确定性或者差异性。在最近流行的半监督框架教师-学生框架(Mean Teacher[5])中,学生和教师模型[6]–[8]的预测之间存在不一致,这被称为模型间不确定性。由于未标记的数据没有金标准(Ground Truth),一种常见的策略是将教师模型的预测用作指导。然而,在Mean Teacher架构中,以往的工作并不能保证教师模型在未标记的数据上总是比学生模型产生更好的结果,上述这种预测差异有助于估计不确定性。其次,在以往工作中,学生模型本身内部的不确定性和网络扰动是被忽略的,这种不确定性被称为模型内不确定性。在一个特定层的卷积神经网络(CNN)中提取的特征可能会影响后续层,这极大影响了感受野,进而将导致信息在从浅层到深层的传播过程中存在不一致性[9],[10]。
发明内容
针对现有技术的不足,本发明的目的在于提供一种基于模型间和模型内不确定性的半监督分割模型,该半监督分割模型从标记和未标记的数据中进行高效学习,对降低专业医生标注数据的工作量具有重要的意义。
本发明的目的是通过下述技术方案予以实现的。
一种基于模型间和模型内不确定性的半监督分割模型,包括学生模型、教师模型和半监督学习损失模块,所述学生模型和教师模型分别为一个医学图像分割模型(PG-FANet),所述学生模型的初始数据为有标注数据和无标注数据,所述教师模型的初始数据为无标注数据,每个所述医学图像分割模型包括:卷积块、二阶网络模型结构、伪蒙版引导特征增强模块(MGFE)、多尺度多阶段特征聚合模块(MMFA)、第一卷积层、第二卷积层和第三卷积层,二阶网络模型结构包括:一阶子网络和二阶子网络;
卷积块用于向其输入初始数据并将从卷积块输出的粗糙特征分别流向一阶子网络和伪蒙版引导特征增强模块;
二阶子网络和一阶子网络的构架相同,各包括:I+1个残差块(RBi_s)和一个空洞空间卷积池化金字塔(ASPP)模块,一阶子网络的I+1个残差块(RBi_s)用于对粗糙特征进行精细化调整,再向一阶子网络的空洞空间卷积池化金字塔(ASPP)模块输送一阶精细化特征;一阶子网络的空洞空间卷积池化金字塔(ASPP)模块用于对一阶精细化特征提取高阶潜在特征;
第一卷积层用于对一阶子网络获得的高阶潜在特征生成伪蒙版;
伪蒙版引导特征增强模块用于利用伪蒙版增强粗糙特征的表达能力,以获得伪蒙版引导的融合特征;
二阶子网络的I+1个残差块(RBi_s)用于输入融合特征并输出二阶精细化特征,二阶子网络的空洞空间卷积池化金字塔(ASPP)模块用于接收二阶子网络的第I+1个残差块输出的二阶精细化特征并输出高阶潜在特征;
多尺度多阶段特征聚合模块(MMFA)包括:多尺度特征聚合模块和多阶段特征聚合模块,多尺度特征聚合模块用于对一阶子网络第i个残差块输出的低级特征和二阶子网络第i个残差块输出的低级特征进行多尺度特征聚合以获得多尺度聚合特征,其中,i=1、……、I;
第二卷积层用于融合多尺度聚合特征,以输出高阶特征;
多阶段特征聚合模块用于对一阶子网络第I+1个残差块的特征输出、二阶子网络的第I+1个残差块的特征输出和高阶特征进行多阶段特征聚合,进而输出多尺度多阶段聚合特征;
第三卷积层用于对多尺度多阶段聚合特征和由二阶子网络获得的高阶潜在特征进行特征拼接后再融合以获得预测结果;
所述半监督学习损失模块的计算公式为:
其中,Lseg为有监督的损失函数,λ(t)表示第t次训练的一致性损失的平衡因子,表示有标注数据集,Xl表示有标注数据集中的图像,Yl表示有标注数据集中图像的标注,M表示有标注数据集中图像的个数;表示无标注数据集中的图像,N表示无标注数据集的图像个数,λintra为控制模型内不确定性正则化Lintra的权重因子;
Lintra=Lmse(F1(xr|θt),F2(xr|θt))
其中,Ushape为形状不确定性,Ushape=-ushapelog ushape
ushape=|softmax(F2(xr|θt))-Softmax(F2(xr|θt′))|
F2(xr|θt)为学生模型在第t次训练的预测结果,F1(xr|θt)为学生模型在第t次训练的伪蒙版,Lmse表示均方误差损失函数;σ表示最小-最大归一化函数,用以将形状不确定性Ushape归一化到[0,1];
θt为学生模型在第t次训练的权重,θ′t=αθ′t-1+(1-α)θt,θ′t为教师模型在第t次训练的权重;θ′t-1为教师模型在第t-1次训练的权重,α为在总的训练过程中使用梯度下降更新学生模型θt的指数移动平均值(Exponential Moving Average)的衰减率;
F2(xr|θt′)为教师模型在第t次训练的预测结果,μ′r=-F2(xr|θt′)logF2(xr|θt′)。
在上述技术方案中,α=0~1。
在上述技术方案中,将模型间不确定性建模为:
模型内不确定性(Uintra)为:
在上述技术方案中,第一卷积层包括:上采样层和卷积层,第一卷积层的计算过程如下:
Ys=Conv(Up(Xc))
其中,Xc为由一阶子网络获得的高阶潜在特征,Up为第一卷积层中的上采样层,Conv为卷积层,Ys为伪蒙版。
在上述技术方案中,多尺度特征聚合模块的计算公式为:
其中,Xm为多尺度聚合特征,为第s阶子网络第i个残差块(RBis),为第s阶子网络第i-1个残差块输出的低级特征,s=1、2,i=1、……、I,其中,为卷积块输出的粗糙特征,为伪蒙版引导的融合特征,Up为上采样层,δ为参数校正线性单元(PReLU),为批归一化处理,Conv为卷积层。
在上述技术方案中,第二卷积层的运算过程如下:
X′m=Conv(Xm)
其中,X′m为高阶特征,Conv为卷积层,Xm为多尺度聚合特征。
在上述技术方案中,多阶段特征聚合模块的计算公式如下:
其中,X′m为高阶特征,Xh为多尺度多阶段聚合特征,Up为上采层,δ为参数校正线性单元(PReLU),为批归一化处理,Conv为卷积层,为第s阶子网络第I+1个残差块,s=1、2,为第s阶子网络第I个残差块的特征输出。
在上述技术方案中,第三卷积层包括:上采样、特征拼接和卷积层,第三卷积层的计算公式如下:
Ys=Conv(concat(Xh,Up(Xf)))
其中,Ys为预测结果,Conv为卷积层,concat为特征拼接操作,Xh为多尺度多阶段聚合特征,Up为上采样层,Xf为由二阶子网络获得的高阶潜在特征。
本发明的半监督分割模型利用部分标注数据有效地提取了细胞(MoNuSeg)/腺体(CRAG)的上下文特征,分割出相应细胞/腺体实例并用于下游任务分析,减少了标注数据的使用量,大大降低了专家标注数据所需的工作量。
附图说明
图1为本发明医学图像分割模型的结构示意图;
图2为半监督分割模型的结构示意图;
图3为(a)MoNuSeg数据集上使用5%/10%/20%/50%/70%/90%标注数据训练的细胞分割结果图;(b)CRAG数据集上使用5%/10%/20%/50%/70%/90%标注数据训练的腺体分割结果图;
图4为MoNuSeg和CRAG数据集上使用5%/10%/20%/50%标注数据训练的细胞和腺体分割结果图。
具体实施方式
下面结合具体实施例进一步说明本发明的技术方案。
实施例1
一种基于模型间和模型内不确定性的半监督分割模型,如图2所示,包括学生模型、教师模型和半监督学习损失模块,如图1所示,学生模型和教师模型分别为一个医学图像分割模型(PG-FANet),学生模型和教师模型参数独立,教师模型对学生模型的多阶输出进行指导以使得学生模型获得更好的分割性能,学生模型的初始数据为有标注数据和无标注数据,教师模型的初始数据为无标注数据,学生模型通过有监督损失和无监督损失利用有标注与无标注数据进行训练。每个医学图像分割模型包括:卷积块、二阶网络模型结构、伪蒙版引导特征增强模块(MGFE)、多尺度多阶段特征聚合模块(MMFA)、第一卷积层、第二卷积层和第三卷积层,二阶网络模型结构包括:一阶子网络和二阶子网络;
卷积块用于向其输入初始数据并将从卷积块输出的粗糙特征分别流向一阶子网络和伪蒙版引导特征增强模块;
二阶子网络和一阶子网络的构架相同,各包括:I+1个残差块(RBi_s)和一个空洞空间卷积池化金字塔(ASPP)模块,一阶子网络的I+1个残差块(RBi_s)用于对粗糙特征进行精细化调整,再向一阶子网络的空洞空间卷积池化金字塔(ASPP)模块输送一阶精细化特征;一阶子网络的空洞空间卷积池化金字塔(ASPP)模块用于对一阶精细化特征提取高阶潜在特征;在本发明的实施例中I=3;
第一卷积层用于对一阶子网络获得的高阶潜在特征生成伪蒙版;
一阶子网络用于粗略的伪蒙版生成,伪蒙版引导特征增强模块用于利用伪蒙版增强粗糙特征的表达能力,以获得伪蒙版引导的融合特征;伪蒙版引导特征增强模块在伪蒙版引导下将二阶子网络的注意力移到感兴趣区域上。伪蒙版引导特征增强模块将由卷积块产生的粗糙特征和第一阶段子网络的伪蒙版特征拼接起来并通过1×1的卷积层融合作为第二阶段子网络的输入;
二阶子网络的I+1个残差块(RBi_s)用于输入融合特征并输出二阶精细化特征,二阶子网络的空洞空间卷积池化金字塔(ASPP)模块用于接收二阶子网络的第I+1个残差块输出的二阶精细化特征并输出高阶潜在特征,用于细化预测结果;
鉴于二阶子网络和一阶子网络对不同尺度形状和大小进行提取特征,本发明使用多尺度多阶段特征聚合模块(MMFA)来聚合多尺度和多阶段特征,提高模型的特征表达能力,避免U形跳跃连接中的特征不兼容问题。多尺度多阶段特征聚合模块(MMFA)包括:多尺度特征聚合模块和多阶段特征聚合模块,多尺度特征聚合模块用于对一阶子网络第i个残差块输出的低级特征和二阶子网络第i个残差块输出的低级特征进行多尺度特征聚合以获得多尺度聚合特征,其中,i=1、……、I;
第二卷积层用于融合多尺度聚合特征,以输出高阶特征;
多阶段特征聚合模块用于对一阶子网络第I+1个残差块的特征输出、二阶子网络的第I+1个残差块的特征输出和高阶特征进行多阶段特征聚合,进而输出多尺度多阶段聚合特征;
第三卷积层用于对多尺度多阶段聚合特征和由二阶子网络获得的高阶潜在特征进行特征拼接后再融合以获得预测结果;
半监督学习损失模块的计算公式为:
其中,Lseg为有监督的损失函数,λ(t)表示第t次训练的一致性损失的平衡因子,其计算公式为T为训练总次数,在本发明中T设置为300。表示有标注数据集,Xl表示有标注数据集中的图像,Yl表示有标注数据集中图像的标注,M表示有标注数据集中图像的个数;表示无标注数据集中的图像,N表示无标注数据集的图像个数;λintra为控制模型内不确定性正则化Lintra的权重因子,本发明中设置为1;本发明利用形状不确定性Ushape来增强模型对边界区域的注意,将形状不确定性融合到Linter,Linter表示无监督的一致性损失,以最大程度地减少模型间不确定性,Lintra代表了附加的模型内不确定性正则化,它将模型内不确定性纳入了半监督学习目标中;
Lintra=Lmse(F1(xr|θt),F2(xrlθt))
其中,Ushape为形状不确定性,Ushape=-ushapelog ushape
ushape=|softmax(F2(xr|θt))-Softmax(F2(xr|θt′))|
F2(xr|θt)为学生模型在第t次训练的预测结果,F1(xr|θt)为学生模型在第t次训练的伪蒙版,Lmse表示均方误差损失函数;σ表示最小-最大归一化函数,用以将形状不确定性Ushape归一化到[0,1]。至此,学生模型和教师模型之间边界预测的差异可以通过本发明的形状不确定性加权方法降低,从而可以在训练过程中针对医学影像边界处细节的调整,保留分割对象的完整形状。除了促进组织学图像的完整分割外,本发明还利用形状信息不确定性权重(Ushape)来增强模型对边界区域的注意,以更好地分割预测。
每个训练过程中教师模型的权重更新依据于上次训练过程中的教师模型的权重以及本次训练过程中学生模型的权重,具体来说,教师模型在第t次训练的权重θ′t,θ′t=αθ′t-1+(1-α)θt;θt为学生模型在第t次训练的权重,θ′t-1为教师模型在第t-1次训练的权重,α为在总的训练过程中使用梯度下降更新学生模型θt的指数移动平均值(ExponentialMoving Average)的衰减率,一般可以取0到1,在本实施例中取0.99。
F2(xr|θt′)为教师模型在第t次训练的预测结果,u′r为第r个样本预测的不确定性估计,μ′r=-F2(xr|θt′)log F2(xr|θt′);
通过学生模型和教师模型的预测差异,可将模型间不确定性建模为:
但是,由于神经网络的层级体系结构,学生模型内的不同阶段的感受野存在差异,这将导致不同子网络的预测不一致。为了解决差异,每个子网络的结果预测必须高度一致。因此,本发明额外估计了模型内不确定性(Uintra)为:
一方面,监督的学习过程不断根据Ls1中Lseg项,不断提高学生模型的能力。另一方面,半监督的学习过程迫使学生模型的最终预测与教师模型的模型保持一致。同时,学生模型将一阶子网络的伪蒙版与一阶子网络的预测结果保持一致。通过这样的操作,最终限制了半监督学习中存在的不一致性。
由于教师模型并不能一直提供比学生模型更准确的预测。因此,本发明提出一种模型间和模型内不确定性一致性模块Uinter和Uintra,防止教师模型预测中存在的噪声和不确定性对学生模型进行错误引导。为了动态地防止教师模型获得较高不确定性的预测,本发明引入了可学习的损失函数Linter,以惩罚教师模型产生的不确定性。当教师模型提供不可靠的结果(高不确定性)时,近似于F2(xr|θt),相反,当教师模型自信(低不确定性)时,与F2(xr|θt)相近,提供了可靠预测作为学生模型学习的目标。
在上述技术方案中,第一卷积层包括:上采样层和卷积层,第一卷积层的计算过程如下:
Ys=Conv(Up(Xc))
其中,Xc为由一阶子网络获得的高阶潜在特征,Up为第一卷积层中的上采样层,Conv为卷积层,Ys为伪蒙版。
在上述技术方案中,多尺度特征聚合模块的计算公式为:
其中,Xm为多尺度聚合特征,为第s阶子网络第i个残差块(RBi_s),为第s阶子网络第i-1个残差块输出的低级特征,s=l、2,i=l、……、I,其中,为卷积块输出的粗糙特征,为伪蒙版引导的融合特征,Up为上采样层,δ为参数校正线性单元(PReLU),为批归一化处理,Conv为卷积层。多尺度特征聚合模块重新使用伪蒙版引导的信息,并获得更好的特征表示以进行进一步传播。
在上述技术方案中,第二卷积层用于进一步提高特征表达,为多阶段特征聚合模块提供更具有表达能力的高级特征,第二卷积层的运算过程如下:
X′m=Conv(Xm)
其中,X′m为高阶特征,Conv为卷积层,Xm为多尺度聚合特征;
在上述技术方案中,多阶段特征聚合模块中的卷积层用于接收一阶子网络第I+1个残差块的特征输出和二阶子网络的第I+1个残差块的特征输出。随着网络深度加深,低级特征的空间信息(例如区域边界)可能会丢失,本发明使用多阶段特征聚合模块融合了高阶特征、一阶子网络第I+1个残差块的特征输出和二阶子网络的第1+1个残差块的特征输出,避免了引入特征不兼容的U形跳跃连接。
多阶段特征聚合模块的计算公式如下:
其中,X′m为高阶特征,Xh为多尺度多阶段聚合特征,Up为上采层,δ为参数校正线性单元(PReLU),为批归一化处理,Conv为卷积层,为第s阶子网络第I+1个残差块,s=1、2,为第s阶子网络第I个残差块的特征输出。
在上述技术方案中,第三卷积层包括:上采样、特征拼接和卷积层,第三卷积层的计算公式如下:
Ys=Conv(concat(Xh,Up(Xf)))
其中,Ys为预测结果,Conv为卷积层,concat为特征拼接操作,Xh为多尺度多阶段聚合特征,Up为上采样层,Xf为由二阶子网络获得的高阶潜在特征。
实施例2
多器官细胞分割数据集(Multi-organ nuclei segmentation,MoNuSeg)[13]由44张H&E染色的组织病理学图像组成,组织病理学图像是从多家医院收集而得,分辨率为1000×1000像素。从44张组织病理学图像中选取30张组织病理学图像组成训练数据集和14张作为测试数据集,将训练数据集随机分成27张作为训练集A和3张作为验证集B,测试数据集作为测试集C。使用滑动窗口从每张组织病理学图像中裁剪大小为128×128的图像块,共计1728个图像块。对图像块执行在线数据增强,包括随机缩放、翻转、旋转和仿射操作,所有图像块都通过使用ImageNet[14]中图像的均值和标准差进行归一化。
用实施例1中半监督分割模型筛选细胞电镜图。
将训练集A的图像块作为初始数据分别送入学生模型和教师模型中训练,学生模型中使训练集A中带有手工注释细胞组织病理学图像的占比分别为5%、10%、20%、50%、70%和90%(余下为未标注数据),教师模型的训练集A不使用标注,将验证集B作为初始数据送入学生模型(不使用标注),通过验证集B选取最优θt的半监督分割模型,将不使用标注的测试集C的图像块顺序送入最优θt的学生模型并将预测结果按照小切块顺序重新堆叠,得到精准的细胞分割结果。实施例效果如图4所示,其中,图4中MoNuSeg对应的“全监督”为专利申请号2022113429217中实施例2中测试集C获得的预测结果。
实施例3
腺体数据集制作:结直肠腺癌(colorectal adenocarcinoma gland,CRAG)数据集共包含38张全视野数字切片(whole slide images,WSI),从中获取了213张具有不同癌症等级的H&E CRA图像[15]。用实施例1中半监督分割模型筛选腺体电镜图,选取173张H&ECRA图像组成训练数据集,选取40张H&E CRA图像组成测试数据集作为测试集F,将训练数据集随机分成153张作为训练集D以及20张作为验证集E。H&E CRA图像的分辨率大部分都是1512×1516。本发明从153张H&E CRA图像中提取了5508个480×480像素的图像块。进一步执行在线数据增强,包括随机缩放、翻转、旋转和仿射操作。所有这些图像块都通过使用ImageNet[14]中图像的均值和标准差进行归一化。
将训练集D的图像块送入学生模型和教师模型中进行训练,学生模型中使训练集D中带有手工注释腺体H&E CRA图像占比分别为5%、10%、20%、50%、70%和90%(余下为未标注数据),教师模型的训练集D不使用标注,用验证集E选择最优θt的半监督分割模型(不使用标注)。将不使用标注的测试集F的图像块按小切块顺序送入最优θt的学生模型进行预测,并将预测结果按照小切块顺序重新堆叠,得到精准的腺体分割结果。实施例效果如图4所示,其中,图4中CRAG对应的“全监督”为专利申请号2022113429217中实施例3中测试集F获得的预测结果。
对实施例2和实施例3中半监督分割模型(PG-FANet SSL)进行评估。
细胞分割质量分数指标包括:F1-score(F1),intersection over union(IoU),average Dice coefficient(Dice),aggregated Jaccard index(AJI),以及95%Hausdorff distance(95HD)。
腺体分割质量分数指标包括:F1-score(F1),object-level Dice coefficient(Diceobj),object-level Hausdorff distance(Hausobj)以及95%object-levelHausdorff distance(95HDobj)。
本发明还与最近最先进的半监督模型进行了比较,包括Mean Teacher(MT)[5]模型,不确定性感知的自集成模型(UA-MT)[6],差值一致性训练模型(ICT)[11],变换一致性自集成模型(TCSM)[7],和双不确定性权值模型(DUW)[12]。最近最先进的半监督模型使用带有手工注释细胞组织病理学图像的占比分别为5%、10%、20%、50%、70%和90%(余下为未标注数据)进行训练,其与实施例2的AJI的质量分数如图3的a所示;最近最先进的半监督模型使用带有手工注释腺体H&E CRA图像占比分别为5%、10%、20%、50%、70%和90%(余下为未标注数据)进行训练,其与实施例3的Diceobj的质量分数如图3的b所示。
细胞分割:如表1所示,首先,在使用相同标注量的数据上训练,本发明将半监督分割模型(PG-FANet SSL)与全监督方法PG-FANet full(专利申请号2022113429217)比较。随着标注图像的数量从5%到50%提升,本发明半监督分割模型(PG-FANet SSL)的AJI数值相比于全监督方法分别提高了5.9%、2.5%、2.7%和2.8%。值得注意的是,当标注的数据比例从5%增加到50%时,AJI分数获得了明显的改进,这表明当只有少量标注数据时,增加标注数据的数量会对模型产生重大影响。其次,相比之下,本发明半监督分割模型(PG-FANetSSL)与所有半监督学习模型进行了比较。结果表明,本发明相比于其它方法而言都取得了最佳的表现。
腺体分割:如表1所示,在使用相同标注量的数据上训练,与全监督基准实验PG-FANet Full(专利申请号2022113429217)相比,在使用5%和10%标记数据时,本发明半监督分割模型(PG-FANet SSL)在F1、Diceobj和Hausobj指标上显著改善了8.9%/5.2%,9.6%/5.7%和109.632/75.872。与最先进的半监督模型相比,本发明半监督分割模型(PG-FANetSSL)也表现出了最好的性能。
表1
表1中labeled data表示有标注数据在训练集A/训练集D中的比例,以“5%(1/8)”为例,“5%”表示标注数据在训练集A/训练集D中的占比,“1/8”为训练集A中有标注的组织病理学图像为1张/训练集D中有标注的H&E CRA图像为8张。
实施例4
依照表2去除实施例1中半监督分割模型中的Linter、Lintra或/和Ushape(表2中的“×”代表去除),分别按照实施例2中当训练集A中带有手工注释细胞的占比为5%(余下为未标注数据)和实施例3中当训练集D中带有手工注释腺体的占比为5%(余下为未标注数据)时送入学生模型进行训练,测试集C和测试集F的预测结果进行评估,如表2所示。如表2所示,一方面,添加模型间不一致性正则化策略改进了AJI/Diceobj性能指标,在MoNuSeg/CRAG数据集上分别提升了1.5%/8.5%。另一方面,降低模型内部不确定性会增加AJI/Diceobj性能。此外,由表2中可得,形状不确定性加权模块保留了医学图像中分割的完整形状,使得分割结果提升。借助所有一致性正规化策略,不确定性大大减少,从而改善了模型性能。
表2
[1]H.Su,F.Xing,X.Kong,Y.Xie,S.Zhang,and L. Yang,“Robust celldetection and segmentation in histopathological images using sparsereconstruction and stacked denoising autoencoders,”in InternationalConferenceon MedicalImage Computing and Computer-AssistedIntervention,2015,pp.383-390.
[2]S.Graham etal.,“MILD-Net:minimal information loss dilatednetworkfor gland instance segmentation in colon histology images,”MedicalImageAnalysis,vo1.52,pp.199-21 1,20l 9.[3]Y.Xu etal.,“Gland instancesegmentation using deep multichannel neural networks,”IEEE TransactionsonBiomedicalEngineering,vol.64,no.12,pp.290l-2912,2017.
[4]H.Qu,Z.Yan,G.M.Riedlinger,S.De,and D.N.Metaxas,“Improving nuclei/gland instance segmentation in histopathology images by full resolutiommeural network and spatial constrained loss,”in InternationalConference onMedicalImage Computing and Computer-AssistedIntervention,2019,pp.378-386.
[5]A.Tarvainen and H.Valpola,“Mean teachers are better role models:Weight-averaged consistemey targets improve semi-supervised deep learningresults,”inAdvances inNeuralInformationProcessing Systems,2017,pp.1195-1204.
[6]L.Yu,S.Wang,X.Li,C.-W.Fu,and P.-A.Heng,“Uncertainty-aware self-ensembling model for scmi-supervised 3D left atrium segmentation,”inInternationalConference on MedicalImage Computing and Computer-AssistedIntervention,2019,pp.605-613.
[7]X.Li,L.Yu,H.Chen,C.-W.Fu,L.Xing,and P.-A.Heng,“Transformatiom-Consistent Self-Ensembling Model for Semi-supervised Medical ImageSegmentation,”IEEE Transactions on NeuralNetworks andLearning Systems,pp.1-12,2020.
[8]Y.Zhou,H.Chem,H.Lin,and P.-A.Hemg,“Deep Semi-supervised KnowledgeDistillation for Overlapping Cervical Cell Instance Segmentation,”inInternationalConference on MedicalImage Computing and Computer-AssistedIntervention,2020,pp.521-531.
[9]Z.Zheng and Y.Yang,“Rectifying pseudo label learning viauncertainty estimation for domain adaptive semantic segmentation,”InternationalJournalofComputer Vision,vo1.129,no.4,pp.1106-1120,2021.
[10]Q.Dou etal,“PnP-AdaNet:Plug-and-Play Adversarial DomainAdaptation Network at Unpaired Cross-Modality Cardiac Segmentation,”IEEEAccess,vol.7,pp.99065-99076,2019,doi:10.1109/ACCESS.2019.2929258.
[11]V.Verma,A.Lamb,J.Kannala,Y.Bengio,and D.Lopez-Paz,“InterpolationConsistency Trainingfor Semi—supervised Learning,”inProceedingsofthe28thInternationalJoint Conference onArtiffcialIntelligence,2019,pp.3635-3641.
[12]Y.Wang etal.,“Double—Uncertainty Weighted Method for Semi-supervised Learning,”inInternationalConference onMedicalImage ComputingandComputer-4ssisted Intervention,2020,pp.542-551.
[13]N.Kumar etal,“A multi-organ nucleus segmentation challenge,”IEEETransactiohs onMedicalImaging,vol.39,no.5,pp.1380-1391,2019.
[14]J.Deng,W.Dong,R.Socher,L.-J.Li,K.Li,and L.Fei-Fei,“ImageNet:Alarge-scale hierarchical image database,”in2009IEEE Conference onComputerVisionandPatternRecognition,2009,pp.248-255.
[15]R.Awan etal,“Glandular morphometrics for objective grading ofcolorectal adenocarcinoma histology images,”ScientificReports,vol.7,no.1,pp.1-12,2017.
以上对本发明做了示例性的描述,应该说明的是,在不脱离本发明的核心的情况下,任何简单的变形、修改或者其他本领域技术人员能够不花费创造性劳动的等同替换均落入本发明的保护范围。
Claims (9)
1.一种基于模型间和模型内不确定性的半监督分割模型,其特征在于,包括学生模型、教师模型和半监督学习损失模块,所述学生模型和教师模型分别为一个医学图像分割模型,所述学生模型的初始数据为有标注数据和无标注数据,所述教师模型的初始数据为无标注数据,每个所述医学图像分割模型包括:卷积块、二阶网络模型结构、伪蒙版引导特征增强模块、多尺度多阶段特征聚合模块、第一卷积层、第二卷积层和第三卷积层,二阶网络模型结构包括:一阶子网络和二阶子网络;
卷积块用于向其输入初始数据并将从卷积块输出的粗糙特征分别流向一阶子网络和伪蒙版引导特征增强模块;
二阶子网络和一阶子网络的构架相同,各包括:I+1个残差块和一个空洞空间卷积池化金字塔模块,一阶子网络的I+1个残差块用于对粗糙特征进行精细化调整,再向一阶子网络的空洞空间卷积池化金字塔模块输送一阶精细化特征;一阶子网络的空洞空间卷积池化金字塔模块用于对一阶精细化特征提取高阶潜在特征;
第一卷积层用于对一阶子网络获得的高阶潜在特征生成伪蒙版;
伪蒙版引导特征增强模块用于利用伪蒙版增强粗糙特征的表达能力,以获得伪蒙版引导的融合特征;
二阶子网络的I+1个残差块用于输入融合特征并输出二阶精细化特征,二阶子网络的空洞空间卷积池化金字塔模块用于接收二阶子网络的第I+1个残差块输出的二阶精细化特征并输出高阶潜在特征;
多尺度多阶段特征聚合模块包括:多尺度特征聚合模块和多阶段特征聚合模块,多尺度特征聚合模块用于对一阶子网络第i个残差块输出的低级特征和二阶子网络第i个残差块输出的低级特征进行多尺度特征聚合以获得多尺度聚合特征,其中,i=1、……、I;
第二卷积层用于融合多尺度聚合特征,以输出高阶特征;
多阶段特征聚合模块用于对一阶子网络第I+1个残差块的特征输出、二阶子网络的第I+1个残差块的特征输出和高阶特征进行多阶段特征聚合,进而输出多尺度多阶段聚合特征;
第三卷积层用于对多尺度多阶段聚合特征和由二阶子网络获得的高阶潜在特征进行特征拼接后再融合以获得预测结果;
所述半监督学习损失模块的计算公式为:
其中,Lseg为有监督的损失函数,λ(t)表示第t次训练的一致性损失的平衡因子,表示有标注数据集,Xl表示有标注数据集中的图像,Yl表示有标注数据集中图像的标注,M表示有标注数据集中图像的个数;表示无标注数据集中的图像,N表示无标注数据集的图像个数,λintra为控制模型内不确定性正则化Lintra的权重因子;
Lintra=Lmse(F1(xr|θt),F2(xr|θt))
其中,Ushape为形状不确定性,Ushape=-ushapelogushape
ushape=|softmax(F2(xr|θt))-Softmax(F2(xr|θt′))|
F2(xr|θt)为学生模型在第t次训练的预测结果,F1(xr|θt)为学生模型在第t次训练的伪蒙版,F2(xr|θt′)为教师模型在第t次训练的预测结果,Lmse表示均方误差损失函数;σ表示最小-最大归一化函数,用以将形状不确定性Ushape归一化到[0,1];
θt为学生模型在第t次训练的权重,θ′t=αθ′t-1+(1-α)θt,θ′t为教师模型在第t次训练的权重;θ′t-1为教师模型在第t-1次训练的权重,α为在总的训练过程中使用梯度下降更新学生模型θt的指数移动平均值的衰减率;
μ′r=-F2(xr|θt′)logF2(xr|θt′)。
3.根据权利要求2所述的半监督分割模型,其特征在于,α=0~1。
5.根据权利要求4所述的半监督分割模型,其特征在于,第一卷积层包括:上采样层和卷积层,第一卷积层的计算过程如下:
Ys=Conv(Up(Xc))
其中,Xc为由一阶子网络获得的高阶潜在特征,Up为第一卷积层中的上采样层,Conv为卷积层,Ys为伪蒙版。
7.根据权利要求6所述的半监督分割模型,其特征在于,第二卷积层的运算过程如下:
X′m=Conv(Xm)
其中,X′m为高阶特征,Conv为卷积层,Xm为多尺度聚合特征。
9.根据权利要求8所述的半监督分割模型,其特征在于,第三卷积层包括:上采样、特征拼接和卷积层,第三卷积层的计算公式如下:
Ys=Conv(concat(Xh,Up(Xf)))
其中,Ys为预测结果,Conv为卷积层,concat为特征拼接操作,Xh为多尺度多阶段聚合特征,Up为上采样层,Xf为由二阶子网络获得的高阶潜在特征。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211704924.0A CN115797637A (zh) | 2022-12-29 | 2022-12-29 | 基于模型间和模型内不确定性的半监督分割模型 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211704924.0A CN115797637A (zh) | 2022-12-29 | 2022-12-29 | 基于模型间和模型内不确定性的半监督分割模型 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115797637A true CN115797637A (zh) | 2023-03-14 |
Family
ID=85428038
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211704924.0A Pending CN115797637A (zh) | 2022-12-29 | 2022-12-29 | 基于模型间和模型内不确定性的半监督分割模型 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115797637A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116778239A (zh) * | 2023-06-16 | 2023-09-19 | 酷哇科技有限公司 | 面向实例分割模型的半监督训练方法及设备 |
CN116862931A (zh) * | 2023-09-04 | 2023-10-10 | 北京壹点灵动科技有限公司 | 医学图像分割方法、装置、存储介质及电子设备 |
CN117333874A (zh) * | 2023-10-27 | 2024-01-02 | 江苏新希望科技有限公司 | 一种图像分割方法、系统、存储介质和装置 |
-
2022
- 2022-12-29 CN CN202211704924.0A patent/CN115797637A/zh active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116778239A (zh) * | 2023-06-16 | 2023-09-19 | 酷哇科技有限公司 | 面向实例分割模型的半监督训练方法及设备 |
CN116778239B (zh) * | 2023-06-16 | 2024-06-11 | 酷哇科技有限公司 | 面向实例分割模型的半监督训练方法及设备 |
CN116862931A (zh) * | 2023-09-04 | 2023-10-10 | 北京壹点灵动科技有限公司 | 医学图像分割方法、装置、存储介质及电子设备 |
CN116862931B (zh) * | 2023-09-04 | 2024-01-23 | 北京壹点灵动科技有限公司 | 医学图像分割方法、装置、存储介质及电子设备 |
CN117333874A (zh) * | 2023-10-27 | 2024-01-02 | 江苏新希望科技有限公司 | 一种图像分割方法、系统、存储介质和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108132968B (zh) | 网络文本与图像中关联语义基元的弱监督学习方法 | |
CN110046656B (zh) | 基于深度学习的多模态场景识别方法 | |
CN111563164B (zh) | 一种基于图神经网络的特定目标情感分类方法 | |
CN115797637A (zh) | 基于模型间和模型内不确定性的半监督分割模型 | |
EP3968179A1 (en) | Place recognition method and apparatus, model training method and apparatus for place recognition, and electronic device | |
CN110533024B (zh) | 基于多尺度roi特征的双二次池化细粒度图像分类方法 | |
CN112101190A (zh) | 一种遥感图像分类方法、存储介质及计算设备 | |
CN108090472B (zh) | 基于多通道一致性特征的行人重识别方法及其系统 | |
CN107944410B (zh) | 一种基于卷积神经网络的跨领域面部特征解析方法 | |
CN114998602B (zh) | 基于低置信度样本对比损失的域适应学习方法及系统 | |
CN113034506B (zh) | 遥感图像语义分割方法、装置、计算机设备和存储介质 | |
CN108595558B (zh) | 一种数据均衡策略和多特征融合的图像标注方法 | |
CN111161244B (zh) | 基于FCN+FC-WXGBoost的工业产品表面缺陷检测方法 | |
CN112633386A (zh) | 基于sacvaegan的高光谱图像分类方法 | |
CN114724007A (zh) | 训练分类模型、数据分类方法、装置、设备、介质及产品 | |
US20200143209A1 (en) | Task dependent adaptive metric for classifying pieces of data | |
CN110263174A (zh) | —基于焦点关注的主题类别分析方法 | |
CN110111365B (zh) | 基于深度学习的训练方法和装置以及目标跟踪方法和装置 | |
CN116258990A (zh) | 一种基于跨模态亲和力的小样本参考视频目标分割方法 | |
CN110569355A (zh) | 一种基于词块的观点目标抽取和目标情感分类联合方法及系统 | |
CN114511733A (zh) | 基于弱监督学习的细粒度图像识别方法、装置及可读介质 | |
CN114399661A (zh) | 一种实例感知主干网络训练方法 | |
CN114119669A (zh) | 一种基于Shuffle注意力的图匹配目标跟踪方法与系统 | |
CN114037893A (zh) | 一种基于卷积神经网络的高分辨率遥感图像建筑提取方法 | |
CN115797642B (zh) | 基于一致性正则化与半监督领域自适应图像语义分割算法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |