CN112529878B

CN112529878B - 一种基于多视图半监督的淋巴结的分类方法、系统及设备

Info

Publication number: CN112529878B
Application number: CN202011482944.9A
Authority: CN
Inventors: 辛景民; 罗怡文; 刘思杰
Original assignee: Xian Jiaotong University
Current assignee: Xian Jiaotong University
Priority date: 2020-12-15
Filing date: 2020-12-15
Publication date: 2024-04-02
Anticipated expiration: 2040-12-15
Also published as: CN112529878A; WO2022127227A1

Abstract

本发明公开了一种基于多视图半监督的淋巴结的分类方法、系统及设备，对淋巴结的原始灰阶超声图像进行图像预处理，通过对预处理后的图像使用U型神经网络进行图像重建，加权融合得到多尺度融合的粗粒度图像特征，利用半监督的方式进行粗粒度特征表示学习；裁剪原始灰阶超声图像包含结节的ROI区域得到细粒度图像，将细粒度图像通过不同层级中加入了空间和通道注意力机制的vgg16网络进行加权处理后再进行全局平均池化，将不同层级的特征输出进行拼接得到细粒度融合特征，多视图信息通过对粗粒度视图特征和细粒度试图特征进行融合得到，使得融合特征能同时具备结节的环境信息和细节信息，获取到更加丰富准确地描述，能够进行准确分类，提高了分类精确度。

Description

一种基于多视图半监督的淋巴结的分类方法、系统及设备

技术领域

本发明属于医学图像处理领域，具体涉及一种基于多视图半监督的淋巴结的分类方法、系统及设备。

背景技术

临床上，通常以细针吸取活检(FNA)作为淋巴结鉴别的金标准，虽然能提供准确的结果，但侵入性检查甚至手术都可能导致颈部淋巴结病变，并在一定程度上影响患者的身体状况。超声作为一种非侵入性的方法，以其方便、经济的特点，已成为颈部淋巴结术前信息采集最常用的方法。甲状腺癌转移淋巴结具有一定的超声特征，可用于分析分化型甲状腺癌患者术前颈部淋巴结转移的情况，为淋巴结清扫提供参考。颈部淋巴结具有分区特性，其中二区、三区、四区，覆盖了下咽后颈前等部位，是颈廓重点的清除对象。

目前淋巴结分类方法主要分为两类，包括传统人工设计特征和数据驱动的方法。对于淋巴结分类任务，早期的方法多为人工设计特征，主要包括图像的灰度特征，目标的大小、纵横比以及医学描述特征等。该类方法所得到的特征多为传统基于灰度的图像特征或需要精细标定的医学特征，通常传统方法获得的描述性信息较为单一，不足以对灰阶超声图像进行足够有效的特征提取；而精细的医学特征标定需要专业医师的标定，则通常不易获得；这些局限性限制了图像有效信息的提取。深度学习在图像分析领域的发展使得基于数据驱动的方法在医疗影像领域获得成功，然而目前现有的方法通常只关注于淋巴结超声图像的内部特征，如结节内部是否有钙化、液化、回声是否均匀等，忽略了淋巴结的环境信息。然而，淋巴结在不同分区的情况下具有很大的形态学差异，其背景信息也存在较大的不同。因此，结节环境信息在分类过程中也占有十分重要作用，只通过结节内部信息进行特征提取而忽略环境信息会对最终特征提取的有效性造成影响，进而对分类的准确性造成影响。

发明内容

本发明的目的在于提供一种基于多视图半监督的淋巴结的分类方法、系统及设备，以克服现有技术的不足。

为达到上述目的，本发明采用如下技术方案：

一种基于多视图半监督的淋巴结的分类方法，包括以下步骤：

S1，对淋巴结的原始灰阶超声图像进行图像预处理，对预处理后的图像使用图像重建神经网络进行图像重建；

S2，对重建后的图像进行多尺度特征提取，通过构建环境信息伪标签的方式进行半监督学习，得到多尺度融合的粗粒度图像特征；

S3，将淋巴结的原始灰阶超声图像中结节区域的ROI进行剪裁得到细粒度图像，将细粒度图像通过不同层级中加入了空间和通道注意力机制的vgg16网络进行加权处理后再进行全局平均池化，将不同层级的特征输出进行拼接得到细粒度融合特征；

S4，将粗粒度图像特征和细粒度融合特征进行融合，使用两层全连接层通过sigmoid激活联合输出得到分类结果。

进一步的，进行图像重建时先进行下采样，再进行上采样，得到原始图像不同尺度下的特征表达，每次采样之前均使用残差模块进行操作，在上采样过程中添加跨层连接进行点加实现特征的融合，完成图像的重建。

进一步的，将图像重建神经网络中解码器的不同层级处进行输出实现多尺度特征提取，不同尺度的特征通过两个卷积操作和一个展开层后使用一个拼接层进行特征拼接，得到多尺度融合的粗粒度图像特征。

进一步的，通过图像重建神经网络的解码器部分进行原始图像的多尺度特征提取，将解码器中每次采样看作是图像的一个粒度，对每一个粒度下的图像特征进行提取处理，其中在进行最终的特征融合之前每个粒度的特征均进行两次卷积操作，并进行矩阵展开为一维向量，使用一个拼接层对不同粒度的特征进行拼接得到融合的多尺度融合的粗粒度图像特征。

进一步的，将得到的多尺度融合特征分别通过两个线性全连接层进行半监督的多任务学习；多尺度融合特征使用模糊聚类的方法对图像背景信息进行建模，得到背景的分区作为半监督学习中的伪标签信息，得到的背景伪标签与原始目标标签。

进一步的，使用模糊聚类的方法对源标签中没有的分区标签进行建模，使用融合多尺度特征进行模糊聚类算法：

如(1)式所示：

其中u_i，j代表第i个样本属于第j类的隶属度，v_j代表了聚类中心的原型，参数m是确定分类结果模糊度的加权指数。

进一步的，通过图像增强的方式增加细粒度图像的数据量，将细粒度图像输入细粒度融合特征网络，在细粒度融合特征网络中通过使用空间和通道注意力机制的方法对淋巴结的内部信息进行建模。

进一步的，首先对ROI图像进行图像增强，采用固定原始图像比例的方式，对原始图像进行随机尺寸调整，图像缩放的调整范围设置为64到256，增强后的图像I′作为细粒度网络的输入数据集：

I′＝scale(I，(64，256))

细粒度网络以vgg16作为模型的初始模型，在模型的不同阶段使用SC-block增加注意力机制模块；SC-block包含空间和通道两个维度的注意力机制；对于空间注意力机制部分，使用卷积核为1x1的卷积对图像特征的通道域进行压缩，通过使用sigmoid函数作用于压缩的特征进行归一化，得到特征图在空间维度的加权矩阵的概率图。

一种基于多视图半监督的淋巴结的分类系统，包括图像预处理重建模块、粗粒度图像特征采集模块、细粒度图像特征采集模块和分类模块；

图像预处理重建模块用于对淋巴结的原始灰阶超声图像进行图像预处理，并对预处理后的图像进行图像重建；将重建后的图像传输至粗粒度图像特征采集模块和细粒度图像特征采集模块，粗粒度图像特征采集模块对重建后的图像进行多尺度特征提取得到多尺度融合的粗粒度图像特征；细粒度图像特征采集模块对重建后的图像中结节区域的ROI进行剪裁得到细粒度图像，将细粒度图像进行全局池化，并将全局池化的不同层级的特征进行拼接得到细粒度融合特征；分类模块将粗粒度图像特征和细粒度融合特征进行融合，使用两层全连接层通过sigmoid激活联合输出得到分类结果并输出。

一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述基于多视图半监督的淋巴结的分类方法的步骤。

与现有技术相比，本发明具有以下有益的技术效果：

本发明一种基于多视图半监督的淋巴结分类方法，首先对淋巴结的原始灰阶超声图像进行图像预处理，通过对预处理后的图像使用U型神经网络进行图像重建，通过将每次上采样的结果并行叠加实现加权融合，获取原始图像的多粒度自表达信息，进而对多粒度信息进行融合得到多尺度融合的粗粒度图像特征，为了能够建模原始标签中缺失的淋巴结分区信息，对粗粒度视图原始标签中缺失的环境信息进行伪标签生成，利用半监督的方式进行粗粒度特征表示学习；通过裁剪原始灰阶超声图像包含结节的ROI区域得到细粒度图像，将细粒度图像通过不同层级中加入了空间和通道注意力机制的vgg16网络进行加权处理后再进行全局平均池化，将不同层级的特征输出进行拼接得到细粒度融合特征，多视图信息通过对粗粒度视图特征和细粒度试图特征进行融合得到，使得融合特征能同时具备结节的环境信息和细节信息，获取到更加丰富准确地描述，进而能够进行准确分类，提高了分类精确度。

进一步的，利用模糊聚类的方法对粗粒度视图原始标签中缺失的环境信息进行伪标签生成，模糊聚类的方法使用隶属度矩阵代替one-hot编码，相比传统硬聚类方法减少了聚类错误对模型的影响；粗粒度图像特征在进行训练时，以多任务的方式进行，伪标签和真实标签共同进行网络学习的监督，其中，在训练过程中伪标签不断进行迭代更新，以保证伪标签的有效性。

进一步的，采用的SC-block注意力机制模块被用于vgg16的不同层级，使得网络模型能够同时在空间和通道两个维度将注意力集中在更具有判别性的地方，再通过进行多尺度特征融合得到更好的细粒度图像描述。

进一步的，多视图的信息通过两个视图的多尺度特征的融合进行实现，多视图信息不仅包含了粗粒度图像中所具有的分区和环境信息，同时也包含细粒度部分的结节内部细节信息，通过对两个视图信息进行融合，获得更加全面有效的结节信息，进而提高了检测的准确性。

一种基于多视图半监督的淋巴结的分类系统，采用图像预处理重建模块、粗粒度图像特征采集模块、细粒度图像特征采集模块和分类模块；通过结节内部信息并结合环境信息对最终特征提取，有效提高了分类的准确性，结构简单，能够快速实现分类。

附图说明

图1为本发明实施例中的多视图半监督神经网络总图。

图2为本发明实施例中粗粒度视图神经网络分支的结构示意图。

图3为本发明实施例中细粒度视图神经网络分支的结构示意图。

图4为本发明实施例中样本空间在有无伪标签辅助训练情况下的聚类示意图。

具体实施方式

下面结合附图对本发明做进一步详细描述：

如图1所示，一种基于多视图半监督的淋巴结分类方法，包括以下步骤：

S1：对淋巴结的原始灰阶超声图像(粗粒度图像)进行图像预处理，对预处理后的图像使用图像重建神经网络(Hourglass网络)进行图像重建；

图像重建神经网络包括编码器和解码器，编码器和解码器结构包括下采样层和上采样层，进行图像重建时先进行下采样，得到原始图像不同尺度下的特征表达，再进行上采样，每次采样之前均使用残差模块进行操作，在上采样过程中添加跨层连接进行点加实现特征的融合，完成图像的重建。

S2：将图像重建神经网络中解码器的不同层级处的特征进行输出，实现多尺度特征提取。提取到的多尺度特征通过两个卷积操作和一个展开层处理后使用一个拼接层进行特征拼接，得到多尺度融合的粗粒度图像特征，即多尺度融合特征；每次卷积操作均包括依次进行的3x3卷积和批次归一化。

所述S2中通过使用图像重建的方法对淋巴结的多粒度信息进行提取融合的具体方法为：通过图像重建神经网络的解码器部分进行原始图像的多尺度特征提取，将解码器中每次采样看作是图像的一个粒度，对每一个粒度下的图像特征进行提取处理，其中在进行最终的特征融合之前每个粒度的特征均进行两次卷积操作，并进行矩阵展开为一维向量，使用一个拼接层对不同粒度的特征进行拼接得到融合的多尺度融合特征。

S3:得到的多尺度融合的粗粒度图像特征分别通过两个线性全连接层进行半监督的多任务学习(包括聚类和分类)；

具体的，多尺度融合特征使用模糊聚类的方法对图像背景信息进行建模，得到背景的分区作为半监督学习中的伪标签信息，得到的背景伪标签与原始目标标签(同时对网络进行监督学习)。

通过这种半监督学习训练的方式，使得融合层的特征(粗粒度特征)同时具有分类和分区的信息，训练过程中使用融合损失函数进行优化。

S4:如图3所示，细粒度图像由淋巴结的原始灰阶超声图像中包含结节区域的ROI进行剪裁得到，为了增加图像的多样性，对原始图像进行图像增强来扩大数据集，将细粒度图像输入细粒度融合特征网络，细粒度融合特征网络的架构基于vgg16网络，其中，在细粒度融合特征网络的不同尺度部分分别加入注意力机制模块SC block和一个全局池化模块，将通过全局池化的不同层级的特征进行拼接得到细粒度融合特征，再通过ReLu激活和一层由sigmoid激活的全连接层进行分类。

S5:将上述所得粗粒度图像特征和细粒度融合特征进行融合，最终使用两层全连接层，通过sigmoid激活联合输出得到最终的分类结果。

如图2所示，所述S3中通过使用模糊聚类的方法对淋巴结的环境信息进行建模的具体方法为：

使用模糊聚类的方法对源标签中没有的分区标签进行建模，我们使用融合多尺度特征进行模糊聚类算法：

如(1)式所示：

该优化问题的求解通常采用交互策略，即先给定V使U最小化，再给定U使V最小化，将原函数转化为两个简单的二次优化问题。因此，FCM算法可以很容易地部署到神经网络中，并进行模糊聚类来生成伪标签。聚类迭代过程中的更新公式如公式(2)所示。

一旦确定了一组群集中心{V＝v1，v2，...vc}，将通过公式(2B)重新计算隶属度U，直到满足条件||U(k+1)-U(K)||≤6。我们采用半监督的多任务学习方法，使用伪标签和真实标签对网络进行监督，使得网络能够同时获得分类和聚类信息。其中，由于在此处使用模糊聚类的方法对伪标签进行建模，即我们使用联合概率对图像背景所属类别进行描述，其相比于传统硬聚类算法的优势在于，使用概率分布代替one-hot编码，能够减少由于伪标签的不确定性在训练过程中对网络带来的影响，进而保证网络的训练不会由于为标签错误而出现偏差。该阶段的融合损失函数包括分类的交叉损失和聚类的均方误差损失，其定义为公式(3)，

其中，分类损失为交叉熵损失，聚类损失为均方误差，y_i为真实标签，u′_i为当前训练过程中的聚类伪标签，α和β分别为融合损失的超参数，目的在于平衡两类损失。

所述S4中通过使用空间和通道注意力机制的方法对淋巴结的内部信息进行建模的具体方法为：

首先对ROI图像进行图像增强，采用固定原始图像比例的方式，对原始图像进行随机尺寸调整，其目的在于模拟现实中对视图的放大和缩小，同时保留了结节的形态学信息，避免由于拉伸形变带来的影响。图像缩放的调整范围设置为64到256，增强后的图像I′作为细粒度网络的输入数据集。

I′＝scale(I，(64，256))

细粒度网络以vgg16作为模型的初始模型，为了能够对图像的不同尺度进行特征提取，在模型的不同阶段使用设计的SC-block注意力机制模块。此处所设计的SC-block注意力机制模块包含空间和通道两个维度的注意力机制。对于空间注意力机制部分，使用卷积核为1x1的卷积对图像特征的通道域进行压缩，通过使用sigmoid函数作用于压缩的特征进行归一化，得到特征图在空间维度的加权矩阵的概率图，其目的在于对空间域上重要的特征进行关注。

对于通道注意力机制模块，使用全局池化层将图像特征的空间域进行压缩，再通过使用一个通过sigmoid进行激活的全连接层得到通道域的权重矩阵，其目的在于对通道域上重要的特征进行关注。最后，分别使用空间域和通道域的加权矩阵对特征图进行点积后与原始图像一同进行求和，得到注意力加权特征矩阵X_atten。

X_atten＝x_ch+x_sp+x_ori

来自网络不同层级的特征通过SC-block进行加权处理后，分别使用一个全局池化层和一个矩阵展开层来对特征进行降维处理得到一维，最后不同粒度的特征通过一个拼接层进行融合得到X_fine，其中L为所选取的层级数。

得到融合的多尺度细粒度特征X_fine后，应用两个全连接层进行分类训练，该过程中的训练损失为交叉熵损失。

所述S5中，多视图融合的具体方法为，对粗粒度图像和细粒度图像的多尺度融合特征使用一个拼接层进行拼接，使用多视图的特征进行最终的分类，这里使用交叉熵损失进行训练：

其中，yi表示结节的真实类别标签，y^i表示预测的概率。

本发明通过结合淋巴结粗粒度视图和细粒度视图，通过利用编码器解码器模型对图像进行重建，得到多粒度的图像自表达信息，进而对这些信息进行融合获得粗粒度图像的多尺度特征，为了能够建模原始标签中缺失的淋巴结分区信息来进行辅助分类，利用模糊聚类的方法对粗粒度视图原始标签中缺失的环境信息进行伪标签生成，模糊聚类使用隶属度矩阵代替原始的one-hot编码，相比传统硬聚类方法减少了聚类错误对模型的影响；粗粒度图像特征在进行训练时，以多任务的方式进行，伪标签和真实标签共同进行网络学习的监督，其中，在训练过程中伪标签以交互的形式不断进行迭代更新，确保伪标签的有效性。

细粒度图像(包含结节的ROI)被应用于淋巴结结节内部信息的特征提取。SC-block注意力机制模块被用于vgg16的不同层，使得网络模型能够将注意力集中在更具有判别性的地方。通过对网络中的多尺度特征融合，得到更丰富的图像描述。

多视图的信息通过两个视图的多尺度特征的融合进行实现，多视图信息不仅包含了粗粒度图像中所具有的分区和环境信息，同时也包含细粒度部分的结节内部细节信息，通过对两个视图信息进行融合，获得更加全面有效的结节信息，进而提高了检测的准确性。

为了评估该网络的性能，我们选择了三个评价指标：准确率(P＝TP+TN/(TP+FP+TN+FN))、召回率(R＝TP/(TP+FN))和F1得分(F1＝2.P·R/(P+R))，其中P和R分别代表准确率和召回率，TP、FP、TN和FN分别代表真阳性、假阳性、真阴性和假阴性的数量。由于我们提出的方法是基于结节的两种视图，因此我们分别对这两种视图在其他网络上的性能进行了比较。我们比较了不同网络的分类性如Exception，ResNet50，Mobilnet V2，并计算了上述指标。所有比较的模型都是由ImageNet预先训练的。实验结果如表I所示，从表I可以看出，我们的模型在准确率和F1得分方面取得了最好的结果，但在召回率方面略逊于其中一个模型。然而，对于二分类问题，若模型结果呈现高召回率和低准确率的结果，则表明该模型倾向于将所有样本归为一类，不能做出有效的决策。

为了充分分析该方法各部分的有效性，我们将对比实验分为以下五个部分进行消融实验：1)原始ROI图像分类，2)baseline全图像分类，3)加入SC-block的细粒度网络分类，4)加入半监督聚类分析的粗粒度网络分类，5)多视图半监督学习框架的结果。如表II所示，我们提出的模型在准确率(0.803)和F1得分(0.820)方面达到了最高水平，同时召回率也可以保持在较高的水平(0.854)。通过消融实验的对比，我们可以证明FCM聚簇部分和SC-块在分类任务上的积极影响，最终的分类结果表明，半监督多视图框架能够进行有效的分类，在精度上达到最高值。

表II

为了进一步探讨软聚类半监督任务对粗粒度网络嵌入空间的影响的可解释性，分别在有无伪标签监督的情况下对多尺度特征的分布进行可视化。具体步骤在于，粗粒度网络的拼接层获取的特征进行FCM聚类，得到数据集中每个样本的隶属度矩阵，使用u＝max(u′_i)得到每个样本所属的类别，对已得到伪标签的特征进行可视化。由于提取到的样本特征为高维特征，且高维到低维的投影不会改变样本的分布，因此这里通过主成分分析法对高维特征进行降维(2维特征)，以便于可视化结果。如图4(A)表示仅由分类标签监督的图像嵌入，图4(B)表示分类标签和伪标签共同监督的图像嵌入。由图像中数据点的分布可以看出，加入聚类信息进行半监督多任务学习后，不同类别(红、黄、绿、蓝)的隐含层特征之间的边界更加清晰，低维空间中的不同类别的样本点重叠更少，且类内距离更小。可以证明，聚类信息可以帮助网络更好地学习空间信息，有效对样本进行辅助分类。

Claims

1.一种基于多视图半监督的淋巴结的分类方法，其特征在于，包括以下步骤：

将图像重建神经网络中解码器的不同层级处进行输出实现多尺度特征提取，不同尺度的特征通过两个卷积操作和一个展开层后使用一个拼接层进行特征拼接，得到多尺度融合的粗粒度图像特征；

通过图像重建神经网络的解码器部分进行原始图像的多尺度特征提取，将解码器中每次采样看作是图像的一个粒度，对每一个粒度下的图像特征进行提取处理，其中在进行最终的特征融合之前每个粒度的特征均进行两次卷积操作，并进行矩阵展开为一维向量，使用一个拼接层对不同粒度的特征进行拼接得到融合的多尺度融合的粗粒度图像特征；

将得到的多尺度融合特征分别通过两个线性全连接层进行半监督的多任务学习；多尺度融合特征使用模糊聚类的方法对图像背景信息进行建模，得到背景的分区作为半监督学习中的伪标签信息，得到的背景伪标签与原始目标标签；

使用模糊聚类的方法对源标签中没有的分区标签进行建模，使用融合多尺度特征进行模糊聚类算法：

如(1)式所示：

其中u_i,j代表第i个样本属于第j类的隶属度，v_j代表了聚类中心的原型，参数m是确定分类结果模糊度的加权指数；

通过图像增强的方式增加细粒度图像的数据量，将细粒度图像输入细粒度融合特征网络，在细粒度融合特征网络中通过使用空间和通道注意力机制的方法对淋巴结的内部信息进行建模；

S4，将粗粒度图像特征和细粒度融合特征进行融合，使用两层全连接层通过sigmoid激活联合输出得到分类结果

2.根据权利要求1所述的一种基于多视图半监督的淋巴结的分类方法，其特征在于，进行图像重建时先进行下采样，再进行上采样，得到原始图像不同尺度下的特征表达，每次采样之前均使用残差模块进行操作，在上采样过程中添加跨层连接进行点加实现特征的融合，完成图像的重建。

3.根据权利要求1所述的一种基于多视图半监督的淋巴结的分类方法，其特征在于，首先对ROI图像进行图像增强，采用固定原始图像比例的方式，对原始图像进行随机尺寸调整，图像缩放的调整范围设置为64到256,增强后的图像I′作为细粒度网络的输入数据集：

I′＝scale(I,(64,256))

4.一种基于权利要求1所述的一种基于多视图半监督的淋巴结的分类方法的多视图半监督的淋巴结的分类系统，其特征在于，包括图像预处理重建模块、粗粒度图像特征采集模块、细粒度图像特征采集模块和分类模块；

5.一种计算机设备，其特征在于，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述淋巴结的分类方法的步骤。