CN115018852B

CN115018852B - 一种基于半监督学习的腹部淋巴结检测方法及装置

Info

Publication number: CN115018852B
Application number: CN202210953335.XA
Authority: CN
Inventors: 秦壹民; 潘震; 张海仙
Original assignee: Sichuan University
Current assignee: Sichuan University
Priority date: 2022-08-10
Filing date: 2022-08-10
Publication date: 2022-12-06
Anticipated expiration: 2042-08-10
Also published as: CN115018852A

Abstract

本发明公开了一种基于半监督学习的腹部淋巴结检测方法及装置，涉及基于半监督学习的腹部淋巴结的检测，其目的在于解决难以获得大量精确标注的腹部淋巴结图像数据、标注数据过少不能很好完成深度神经网络训练的问题。其先利用有限的标注好的数据输入监督学习，形成具有一定成熟度的淋巴结检测模型；然后再将淋巴结检测模型复制成教师网络、学生网络，利用弱增强的无标注数据输入教师网络并生成伪标签，再利用伪标签与强增强的无标注数据输入学生模型进行训练，并更新教师模型、学生模型的参数；重复训练并直至模型收敛。通过利用无标注数据生成伪标签用于训练，可显著减少对原始样本数据的标注工作，从而在小数据集上也能达到比较好的性能。

Description

一种基于半监督学习的腹部淋巴结检测方法及装置

技术领域

本发明人工智能医学技术领域，涉及胃肠淋巴结筛查领域，更具体的是涉及一种基于半监督学习的腹部淋巴结的检测。

背景技术

结直肠癌是胃肠道中的常见恶性肿瘤。我国属于结直肠癌低发地区，但今年来结直肠癌发病有显著上升趋势，发病率及死亡率日益升高。目前最有效的方式的肠镜下的组织活检，但存在一定的风险性，因此精准、无创影像学的方法成为了现在研究热门。

在智能影像学研究中，基于深度学习的淋巴结自动检测是重要的研究方向，Fast-RCNN, YOLO等深度学习领域中热门的检测算法也在肺部淋巴结智能检测中大放异彩，具有较高的准确率。另外，淋巴结检测方面的专利申请，也是越来越多。

申请号为202010261006.X的发明专利申请就公开了一种检测模型训练方法、淋巴结检测方法、装置、设备及介质，检测模型训练方法包括：基于特征提取网络构建淋巴结检测模型；获取所述淋巴结检测模型的训练样本数据，使用所述训练样本数据对所述淋巴结检测模型进行训练，得到训练好的淋巴结检测模型，其中所述训练样本数据包括样本图像、所述样本图像对应的样本检测标签，以及所述样本图像对应的样本分割标签。该模型训练方法通过使用包括样本图像、样本图像对应的样本检测标签以及样本图像对应的样本分割标签的训练样本数据对淋巴结检测模型中的不同特征层进行多分支训练，使得训练好的淋巴结检测模型能够提供较全面的淋巴结检测信息。

申请号为202110192337.7的发明专利申请就公开了一种基于先验知识的医学图像淋巴结检测方法，其包括如下步骤：数据准备与标定、数据预处理、关键帧定位模型的构建、关键区域提取和淋巴结检测模型构建；该检测方法由两个级联的深度神经网络模型构成：关键帧定位深度神经网络模型和淋巴结检测深度神经网络模型。该方法还提出了两种先验知识：用于关键帧定位模型的关键帧空间先验知识和用于淋巴结检测模型的淋巴结锚点尺度先验知识。通过这两种先验知识，可以有效提升CT关键帧定位的准确性以及淋巴结检测的效果。

申请号为202110170258.6的发明专利申请就公开了一种基于注意力机制神经网络的腹部淋巴结分区方法，其包括以下步骤：步骤1：数据准备；步骤2：掩模生成，对数据进行预处理；步骤3：构建注意力机制残差网络模型；步骤4：重复步骤3，构建并训练淋巴结相对位置分区的模型；步骤5：使用步骤3、步骤4训练好的模型对检测任务自动检测出的腹部淋巴结节进行分类。本发明中通过利用原始CT图像与掩模叠加作为输入，并引入注意力机制到深度残差神经网络，从而可以对CT图像中的腹部淋巴结节进行准确分区。

正如上述的现有技术一样，越来越多的淋巴结检测技术中使用到深度神经网络，通过深度神经网络实现淋巴结的自动识别与检测。但深度神经网络往往是需要进行训练的，且深度神经网络的训练往往需要依赖大量精确标注的数据，而在一些小数据集上难以达到比较好的性能。此外，腹部组织器官复杂，存在血管断层、神经节等在结构上与淋巴结相似的组织，医生标注数据耗时耗力，数据标注一致性也难以保证，大量精确标注的数据难以获得。在此情形下，利用有限的标注数据训练高性能模型成为了一个具有现实意义的需求。

发明内容

本发明的目的在于：为了解决难以获得大量精确标注的腹部淋巴结图像数据、标注数据过少不能很好完成深度神经网络训练的问题，本发明提供一种基于半监督学习的淋巴结检测模型训练方法，采用教师-学生模型双模型学习方式，利用无标注数据提高模型性能，减轻模型训练对于精确标注数据的依赖。

本发明为了实现上述目的具体采用以下技术方案：

一种基于半监督学习的腹部淋巴结检测方法，包括：

获取训练样本数据，训练样本数据包括无标注的腹部CT图像、标注的腹部CT图像；

基于特征提取网络构建淋巴结检测模型；

使用标注的腹部CT图像对淋巴结检测模型进行训练；

将训练后的淋巴结检测模型复制成教师模型、学生模型；

将弱增强处理后的无标注的腹部CT图像输入教师模型，教师模型输出伪标签，将伪标签以及强增强处理后的无标注的腹部CT图像输入学生模型，并更新教师模型、学生模型的权重；重复训练，直至学生模型收敛；

将实时腹部CT图像输入训练后的学生模型，输出腹部CT图像的检测结果。

优选地，对获取的训练样本数据进行预处理，预处理包括：HU归一化处理、空间归一化处理、区域分割处理、区域填充处理以及区域移除处理。

优选地，淋巴结检测模型包括下采样、上采样；

下采样包括一个卷积模块与四个降采样模块，卷积模块由两个卷积核尺寸为3*3*3的卷积层组成，降采样模块由两个卷积核尺寸为3*3*3的卷积层、一个批归一化层与一个ReLu激活层；

上采样包括两个上采样模块和RPN模块，每个上采样模块后使用反卷积模块是特征图尺寸翻倍，并于上采样的相应特征图按位相加构成跳跃连接，并得到跨层次融合特征。

优选地，无标注的腹部CT图像的弱增强处理为旋转处理；无标注的腹部CT图像的强增强处理包括旋转处理、维度交换处理、伽马变换处理、对数变换处理以及随机擦除处理。

优选地，淋巴结检测模型的损失函数为：

其中，

为模型分类损失，

为边界框回归损失；

的具体计算公式为：

的具体计算公式为：

其中，

表示有标注数据的数量，

表示第i个样本，

表示第i个样本的标签，

表示一阶范式正则化。

优选地，教师模型中，设置超参数

作为评选候选淋巴结可行度的阈值，对于某一候选淋巴结

，

若

，则视为具有高可信度的伪标签。

优选地，学生模型通过反向传播算法更新模型权值，损失函数与权值更新算法为：

其中，

表示数据

对应的伪标签，

表示无监督损失的权重。

一种基于半监督学习的腹部淋巴结检测装置，包括：

样本数据获取模块，用于获取训练样本数据，训练样本数据包括无标注的腹部CT图像、标注的腹部CT图像；

检测模型搭建模块，用于基于特征提取网络构建淋巴结检测模型；

模型训练模块，用于使用标注的腹部CT图像对淋巴结检测模型进行训练；

模型复制模块，用于将训练后的淋巴结检测模型复制成教师模型、学生模型；

学生模型训练模块，用于将弱增强处理后的无标注的腹部CT图像输入教师模型，教师模型输出伪标签，将伪标签以及强增强处理后的无标注的腹部CT图像输入学生模型，并更新教师模型、学生模型的权重；重复训练，直至学生模型收敛；

实时标注模块，用于将实时腹部CT图像输入训练后的学生模型，输出腹部CT图像的检测结果。

一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行上述方法的步骤。

一种计算机可读存储介质，存储有计算机程序，所述计算机程序被处理器执行时，使得所述处理器执行上述方法的步骤。

本发明的有益效果如下：

本发明中，先利用有限的标注好的数据输入监督学习，形成具有一定成熟度的淋巴结检测模型；然后再将淋巴结检测模型复制成教师网络、学生网络，利用弱增强的无标注数据输入教师网络并生成伪标签，再利用伪标签与强增强的无标注数据输入学生模型进行训练，并更新教师模型、学生模型的参数；重复训练并直至模型收敛；通过利用无标注数据生成伪标签用于训练，无需每组样本数据都进行标注处理，可显著减少对原始样本数据的标注工作，从而在小数据集上也能达到比较好的性能，从而解决了难以获得大量精确标注的腹部淋巴结图像数据、标注数据过少不能很好完成深度神经网络训练的问题，采用教师-学生模型双模型学习方式，利用无标注数据提高模型性能，减轻模型训练对于精确标注数据的依赖。

附图说明

图1是本发明的流程示意图；

图2是本发明中淋巴结检测模型的结构示意图；

图3是本发明中淋巴结检测模型的训练示意图；

图4是本发明中教师模型、学生模型的训练示意图；

图5是本发明中样本数据预处理后的可视化图像；

图6是本发明中无标注数据进行增强处理后的示意图。

具体实施方式

实施例1

本实施例提供一种基于半监督学习的腹部淋巴结检测方法，其用于对腹部CT图像进行处理后，输出其淋巴结的检测结果。如图1所示，该检测方法具体包括：

获取训练样本数据：

获取训练样本数据，该样本数据包括无标注的腹部CT图像、标注的腹部CT图像。组织医学专家对少量腹部CT图像进行精确标注，通过二级标注流程获得标注好的腹部CT图像。

对训练样本数据进行预处理，其预处理包括：HU归一化处理、空间归一化处理、区域分割处理、区域填充处理以及区域移除处理，预处理后的可视化图像如图5所示。预处理的具体为：

HU归一化处理，HU(Houndsfield Unit, HU)值是CT值的计量单位，反映组织密度。本步骤将图像HU值归一化至[-1, 1]。根据医学先验知识，使用软组织窗宽窗位[300HU,40HU]，即以窗位40HU为中心，显示窗宽300HU的CT范围的图像，这意味着CT图像中大于190HU的体素点将会归一化至1，小于-110HU的体素点将归一化至-1，而后再缩放至[0,255]以满足程序的格式需求。

空间归一化处理，由于采集设备与病人体位的不同，不同CT图像之间，两相邻像素中心点之间的实际物理距离不同，这会导致相同的物体在不同CT图像上具有不同的显示大小，进而影响模型检测效果。使用最近邻插值法，将不同CT图像间距归一化至统一的[2,0.7, 0.7]，即z轴上两相邻像素中心点之间的物理距离为2mm，x轴与y轴上物理距离为0.7mm，该标准是数据集内所有图像统计出的平均间距。

区域分割处理，CT图像中包含了大量非腹部图像区域，如拍摄时的背板，因此需要移除非腹部区域，以获得更好的检测性能，减少检测时的消耗。采用阈值方法分割有效区域，首先对原图像使用中值模糊方法进行图像平滑，降低噪声的同时减少阈值分割时产生空洞，弱化非有效区域的图像亮度，然后对原图像与模糊后图像分别应用阈值分割，得到两个分割结果，对两个分割结果按位取或，即可得到区域分割结果。

区域填充处理，图5 (e) 中深色部分即为分割出的非有效区域，使用预设值170填充，以区分有效与非有效区域。所谓深色部分，是指图示外围灰色部分里面的区域。

区域移除处理，在分割结果边缘分别预留出5像素的边界，以提高预处理的容错率，而后移除边界之外的像素。

搭建模型：

基于特征提取网络构建淋巴结检测模型。该淋巴结检测模型包括下采样、上采样，如图2所示；

下采样包括一个卷积模块与四个降采样模块，用于提取更强的语义特征；卷积模块由两个卷积核尺寸为3*3*3的卷积层组成，降采样模块由两个卷积核尺寸为3*3*3的卷积层、一个批归一化层与一个ReLu激活层。降采样模块中的卷积特征由短路(short-cut)连接增强，降采样模块的设计能有效提高模型深度，增强模型性能，在每个降采样模块后使用最大池化层将特征图减半。

上采样用于保存位置特征，其包括两个上采样模块和RPN模块，每个上采样模块后使用反卷积模块是特征图尺寸翻倍，并于上采样的相应特征图按位相加构成跳跃连接，并得到跨层次融合特征。RPN网络会输出若干5维向量

，其中

表示对该候选淋巴结的预测概率，

表示该候选淋巴结中心点的三维坐标，

表示其直径。

由于算力、内存、显存等限制，模型训练时无法将CT立方体整体作为输入。因此，将CT立方体整体分割为多个尺寸为[128, 128, 128]的小尺寸立方体，在保持正负样本均衡的前提下，随机选择切分图像进行训练。在推理时，则将CT立方体整体切分为32个有重叠区域的小立方体，分别输入至模型中，再将模型预测结果映射至全局坐标，得到对CT整体图像的检测结果。

该框架整体分为两阶段，模型权重初始化阶段与双模型学习阶段。

模型权重初始化阶段，即淋巴结检测模型训练：

使用标注的腹部CT图像对淋巴结检测模型进行训练。如图3所示，在模型权重初始化阶段，所有有标注的腹部CT图像均将被用于训练淋巴结检测模型，通过有监督学习方法，初步优化模型权重。

模型权重初始化阶段，将会使用所有有标注的腹部CT图像优化模型权重

，该阶段属于有监督学习阶段，淋巴结检测模型的损失函数为：

其中，

为模型分类损失，

为边界框回归损失；

的具体计算公式为：

的具体计算公式为：

其中，

表示有标注数据的数量，

表示第i个样本，

表示第i个样本的标签，

表示一阶范式正则化。

复制并形成教师模型、学生模型：

在模型权重初始化阶段结束后，将所有有标注的腹部CT图像用于淋巴结检测模型训练并形成半成熟的淋巴结检测模型，然后将训练后的半成熟的淋巴结检测模型复制成教师模型、学生模型，即教师模型、学生模型的结构与淋巴结检测模型的结构一致。

双模型学习阶段，即学生模型训练：

在双模型联合学习阶段，教师模型用于生成伪标签供学生模型学习，学生模型通过伪标签学习方式更新模型权重，并将学到的知识反馈给教师模型；教师模型得到知识更新，产生更高质量伪标签，如此反复，直至模型收敛，如图4所示。具体为：

将无标注的腹部CT图像进行增强处理，增强处理方式包括两种不同的数据增强方式，即弱增强处理、强增强处理，所谓弱增强处理即为对无标注的腹部CT图像进行旋转处理；所谓强增强处理即为对无标注的腹部CT图像进行旋转处理、维度交换处理、伽马变换处理、对数变换处理以及随机擦除处理，强增强处理后的可视化展示如图6所示。

旋转处理，是指将三维立方体沿z轴随机旋转0°~180°。

维度交换处理，是指随机交换三维立方体维度。

伽马变换。使用伽马变换公式调整图像灰度。其中c与为预设常数常数，r为输入图像。

对数变换。使用对数变换公式调整图像灰度。其中c与v为预设常数，r为输入图。

随机擦除。在图像随机位置进行像素裁剪，并使用背景值170填充。

生成伪标签：

由于学生模型需要依靠教师模型产生的伪标签优化模型参数，因此伪标签质量对于整个算法性能具有重要影响。使用教师模型对弱增强无标注数据进行检测，得到候选淋巴结。由于模型可能存在对同一淋巴结多次重复检测，产生冗余检测边界框的问题，这对使用伪标签方法进行半监督学习是不利的，因此在预测结果之后使用三维NMS算法对预测结果进行后处理，得到聚合后的边界框与对应概率。本实施例中，教师模型使用阈值法，设置超参数

作为评选候选淋巴结可行度的阈值，对于某一候选淋巴结

，

若

，则视为具有高可信度的伪标签。

伪标签学习：

为利用无标注数据，教师模型将生成伪标签训练学生模型。在教师学生双模型学习机制中，教师模型使用弱增强无标注数据生成伪标签，学生模型使用强增强无标注数据学习伪标签知识。教师模型使用弱增强数据能提供更为可靠的伪标签，而改进教师模型性能的关键因素之一是需要保持学生模型与教师模型的多样性，因此使用强增强数据训练学生模型，保持学生模型与教师模型的差异性。

学生模型通过反向传播算法更新模型权值，其损失函数与权值更新算法为：

其中，

表示数据

对应的伪标签，

表示无监督损失的权重。

需要指出的是，无监督损失方程公式

并不包含边界框回归损失项，这是因为采用置信度阈值过滤方法生成的伪标签并不能过滤掉可能存在的边界框回归错误，教师模型预测的置信度仅能代表其对于淋巴结分类的信心，而不包含对边界框的信心。

双模型交互学习

为了提高教师模型性能，生成稳定可靠的伪标签，本实施例中使用EMA方法更新教师模型权重。EMA是机器学习中常见的求平滑平均值的方法，其公式如下：

式中：

为平滑系数。

随着

逐渐变化，可以视为教师模型权重是学生模型权重的时序集成。

在学生模型每次参数更新后，教师模型使用EMA算法更新权重，从学生模型的知识更新中得到反馈，提高自身生成的伪标签质量，进而生成更高质量伪标签供给学生训练，形成正向反馈。

实施例2

本实施例提供一种基于半监督学习的腹部淋巴结检测装置，其用于对腹部CT图像进行处理后，输出其淋巴结的检测结果。该检测装置具体包括：

，其中

表示对该候选淋巴结的预测概率，

表示该候选淋巴结中心点的三维坐标，

表示其直径。

其中，

为模型分类损失，

为边界框回归损失；

的具体计算公式为：

的具体计算公式为：

其中，

表示有标注数据的数量，

表示第i个样本，

表示第i个样本的标签，

表示一阶范式正则化。

旋转处理，是指将三维立方体沿z轴随机旋转0°~180°。

维度交换处理，是指随机交换三维立方体维度。

生成伪标签：

作为评选候选淋巴结可行度的阈值，对于某一候选淋巴结

，

若

，则视为具有高可信度的伪标签。

伪标签学习：

其中，

表示数据

对应的伪标签，

表示无监督损失的权重。

需要指出的是，无监督损失方程公式

双模型交互学习

式中：

为平滑系数。

随着

实施例3

本实施例还提供了一种计算机设备，包括存储器和处理器，存储器中存储有计算机程序，计算机程序被处理器执行时，使得处理器执行上述基于半监督学习的腹部淋巴结检测方法的步骤。

其中，所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。

所述存储器至少包括一种类型的可读存储介质，所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如，SD或D界面显示存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中，所述存储器可以是所述计算机设备的内部存储单元，例如该计算机设备的硬盘或内存。在另一些实施例中，所述存储器也可以是所述计算机设备的外部存储设备，例如该计算机设备上配备的插接式硬盘，智能存储卡(Smart Media Card，SMC)，安全数字(Secure Digital，SD)卡，闪存卡(Flash Card)等。当然，所述存储器还可以既包括所述计算机设备的内部存储单元也包括其外部存储设备。本实施例中，所述存储器常用于存储安装于所述计算机设备的操作系统和各类应用软件，例如运行所述基于半监督学习的腹部淋巴结检测方法的的程序代码等。此外，所述存储器还可以用于暂时地存储已经输出或者将要输出的各类数据。

所述处理器在一些实施例中可以是中央处理器(Central Processing Unit，CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器通常用于控制所述计算机设备的总体操作。本实施例中，所述处理器用于运行所述存储器中存储的程序代码或者处理数据，例如运行所述基于半监督学习的腹部淋巴结检测方法的的程序代码。

实施例4

本实施例还提供了一种计算机可读存储介质，存储有计算机程序，计算机程序被处理器执行时，使得处理器执行上述基于半监督学习的腹部淋巴结检测方法的步骤。

其中，所述计算机可读存储介质存储有界面显示程序，所述界面显示程序可被至少一个处理器执行，以使所述至少一个处理器执行基于半监督学习的腹部淋巴结检测方法的步骤。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器或者网络设备等)执行本申请各个实施例所述的方法。