CN114283301A

CN114283301A - 一种基于Transformer的自适应医学影像分类方法及系统

Info

Publication number: CN114283301A
Application number: CN202111324473.3A
Authority: CN
Inventors: 詹紫微; 陈伟; 任菲; 王显棋; 王晓雯; 李妹; 龚家利; 杜保林
Original assignee: Chongqing Zhijian Life Technology Co ltd; Beijing Zhijian Life Technology Co ltd
Current assignee: Chongqing Zhijian Life Technology Co ltd
Priority date: 2021-11-10
Filing date: 2021-11-10
Publication date: 2022-04-05

Abstract

本发明提出一种基于Transformer的自适应医学影像分类方法及系统，包括通过卷积神经网络获取基础的图像特征信息，将图像特征信息传到通道注意力网络结构中，得到加权之后的通道注意力特征图，将通道注意力特征图传到Transformer网络中，得到经过Transformer处理之后的特征向量，最后将得到的特征向量输入到全连接层中，全连接层直接输出算法最后的分类结果。本发明将卷积神经网络与Transformer模型有效地结合在一起，既降低了模型冗余度，又可以捕获图像的全局上下文信息提取强有力的特征信息。

Description

一种基于Transformer的自适应医学影像分类方法及系统

技术领域

本发明涉及基于人工智能的影像分类技术领域，并特别涉及一种基于Transformer的自适应医学影像分类方法及系统。

背景技术

随着医学影像的不断累积，给使用传统机器学习模型对医学影像进行分类辅助的医生带来了巨大的挑战。深度学习算法在计算机视觉领域日渐成熟，为辅助医生进行精确的诊断提供了契机。卷积神经网络作为深度学习的一个重要分支在图像处理领域占据着十分重要的位置，卷积神经网络的局部感知和参数共享的特点可以有效提取图像特征，降低模型复杂度。目前经典的卷积神经网络模型比如：VGG模型，ResNet模型和DensNet模型等都被广泛应用于医学影像的特征提取。现有技术通过运用多种卷积神经网络对核磁共振脑部图像进行疾病诊断，对脑部的早期微小病变提供了重要的参考信息。以及现有技术提出基于深度学习算法的新型冠状病毒分类方法通过卷积神经网络提取特征向量，使用自编码器训练优化新型冠状病毒序列分类模型，有效提升了新型冠状病毒分类的准确性。

卷积神经网络是一种分层数据表示，高层特征依赖于底层特征，网络深度有助于提取语义信息，网络宽度有助于提取更丰富的特征信息。虽然卷积神经网络具备如此多的优点，但是由于卷积神经网络的局部感知和参数共享的特性，图像的像素之间关联信息较少，不利于网络充分利用上下文信息进行特征捕捉。虽然卷积神经网络可以通过不断叠加更深的网络层来提取覆盖全图的特征感受野，但是这样明显会增加网络计算量，造成梯度弥散等网络训练问题。

发明内容

本发明旨在解决以上现有技术的问题。提出了一种有效降低模型冗余度、融合全局上下文信息的基于Transformer的自适应医学影像分类算法。

具体来说，本发明提出一种基于Transformer的自适应医学影像分类方法，其中包括：

步骤1、构建包括卷积神经网络、通道注意力网络和Transformer网络的医学影像分类模型，获取多个已标注类别的原始医学影像；

步骤2、通过该卷积神经网络提取该原始图像的基础特征图，将该基础特征图输入至该通道注意力网络，得到加权之后的通道注意力特征图；

步骤3、该通道注意力特征图依次通过Transformer网络的编码层和解码层，得到各类别的概率分布，基于该概率分布得到该原始医学影像的分类结果；

步骤4、基于该分类结果和该原始医学影像已标注的类别，构建损失函数，以迭代训练该医学影像分类模型，直到损失函数收敛或达到预设迭代次数，保存当前医学影像分类模型作为最终识别模型；

步骤5、将待分类医学影像输入该最终识别模型，得到该待分类医学影像的医学影像类别。

所述的基于Transformer的自适应医学影像分类方法，其中该多个原始医学影像已通过缩放完成影像尺寸归一化处理。

所述的基于Transformer的自适应医学影像分类方法，其中该步骤2包括：

该通道注意力网络将该基础特征图进行压缩，得到通道级别的全局特征，然后对全局特征进行激发操作得到不同通道的权重；通过权重和该基础特征图进行相乘，得到该通道注意力特征图。

所述的基于Transformer的自适应医学影像分类方法，其中该原始医学影像和该待分类医学影像均为肺部CT影像，对应的类别包括：细菌、病毒、真菌和新冠。

本发明还提出了一种基于Transformer的自适应医学影像分类系统，其中包括：

模块1，用于构建包括卷积神经网络、通道注意力网络和Transformer网络的医学影像分类模型，获取多个已标注类别的原始医学影像；

模块2，用于通过该卷积神经网络提取该原始图像的基础特征图，将该基础特征图输入至该通道注意力网络，得到加权之后的通道注意力特征图；

模块3，用于使该通道注意力特征图依次通过Transformer网络的编码层和解码层，得到各类别的概率分布，基于该概率分布得到该原始医学影像的分类结果；

模块4，用于以该分类结果和该原始医学影像已标注的类别，构建损失函数，以迭代训练该医学影像分类模型，直到损失函数收敛或达到预设迭代次数，保存当前医学影像分类模型作为最终识别模型；

模块5，用于将待分类医学影像输入该最终识别模型，得到该待分类医学影像的医学影像类别。

所述的基于Transformer的自适应医学影像分类系统，其中该多个原始医学影像已通过缩放完成影像尺寸归一化处理。

所述的基于Transformer的自适应医学影像分类系统，其中该模块2，用于使该通道注意力网络将该基础特征图进行压缩，得到通道级别的全局特征，然后对全局特征进行激发操作得到不同通道的权重；通过权重和该基础特征图进行相乘，得到该通道注意力特征图。

所述的基于Transformer的自适应医学影像分类系统，其中该原始医学影像和该待分类医学影像均为肺部CT影像，对应的类别包括：细菌、病毒、真菌和新冠。

本发明还提出了一种存储介质，用于存储执行所述任意一种基于Transformer的自适应医学影像分类方法的程序。

本发明还提出了一种客户端，用于任意一种基于Transformer的自适应医学影像分类系统。

由以上方案可知，本发明的优点在于：

基于以上卷积神经网络存在的弊端，本发明将卷积神经网络与Transformer模型有效地结合在一起，既降低了模型冗余度，又可以捕获图像的全局上下文信息提取强有力的特征信息。

Transformer原本是面向自然语言处理技术领域所使用的网络结构，而非图像处理领域。本发明的提出将用于语言处理的Transformer和卷积神经网络相互结合，来解决病理影像分类的技术问题。Transformer网络结构的特点是参数较少因此模型较小，同时可以输入任意长度的特征信息来进行处理这样可以获取整图的全局上下文特征信息。

本发明中还加入了通道注意力网络结构，通过对特征通道的加权，实现对输入Transformer特征的自适应调节。

附图说明

图1为本发明的方法流程图；

图2为本发明网络结构图。

具体实施方式

本发明提出了一种基于Transformer的自适应医学影像分类方法，包括以下步骤：

S1、首先，获取原始图像(影像)，将原始图像缩放至统一大小传输到卷积神经网络中，通过卷积神经网络获取基础的图像特征信息。

S2、其次，将S1中得到的基础特征图传到通道注意力网络结构中，得到加权之后的通道注意力特征图。

S3、再次，将通道注意力特征图传到Transformer网络中，得到经过Transformer处理之后的特征向量。

S4、最后将S3得到的特征向量输入到全连接层中，全连接层直接输出算法最后的分类结果。

为让本发明的上述特征和效果能阐述的更明确易懂，下文特举实施例，并配合说明书附图作详细说明如下。

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、详细地描述。所描述的实施例仅仅是本发明的一部分实施例。

本发明解决上述技术问题的具体实施例包括：

步骤S1：先得到医学影像图片，将原始医学影像图片缩放到512×512大小，将缩放之后的影像图片输入到ResNet-50网络结构中提取通用特征图(基础特征图)。其中医学影像图片可为肺部、脑部等器官的CT影像。

Y＝F(x) (1)

式(1)中，x表示缩放之后的医学影像图片，F表示ResNet-50网络结构，Y表示提取到的通用特征图。

步骤S2：将步骤S1得到的通用特征图输入到通道注意力网络结构中，该网络结构主要由压缩和激发两部分组成，首先将通用特征图进行压缩操作，得到通道级别的全局特征，然后对全局特征进行激发操作得到不同通道的权重。

式(2)W₁和W₂表示全连接层，RELU表示Relu激活函数，H和W表示特征图Y的长和宽，·表示乘操作，σ表示sigmod激活函数。

步骤S3：将通道注意力特征图输入到Transformer网络结构中，通道注意力特征图依次通过Transformer网络结构中的编码层和解码层输出对应类别的概率分布。

R＝T(s) (3)

式(3)中，T表示Transformer网络结构。

步骤S4：最后将S3中得到的特征向量输入到全连接层网络中输出最后的类别预测结果。

以下为与上述方法实施例对应的系统实施例，本实施方式可与上述实施方式互相配合实施。上述实施方式中提到的相关技术细节在本实施方式中依然有效，为了减少重复，这里不再赘述。相应地，本实施方式中提到的相关技术细节也可应用在上述实施方式中。

本发明还提出了一种客户端，用于所述任意一种基于Transformer的自适应医学影像分类系统。

Claims

1.一种基于Transformer的自适应医学影像分类方法，其特征在于，包括：

2.如权利要求1所述的基于Transformer的自适应医学影像分类方法，其特征在于，该多个原始医学影像已通过缩放完成影像尺寸归一化处理。

3.如权利要求1所述的基于Transformer的自适应医学影像分类方法，其特征在于，该步骤2包括：

4.如权利要求1所述的基于Transformer的自适应医学影像分类方法，其特征在于，该原始医学影像和该待分类医学影像均为肺部CT影像，对应的类别包括：细菌、病毒、真菌和新冠。

5.一种基于Transformer的自适应医学影像分类系统，其特征在于，包括：

6.如权利要求4所述的基于Transformer的自适应医学影像分类系统，其特征在于，该多个原始医学影像已通过缩放完成影像尺寸归一化处理。

7.如权利要求4所述的基于Transformer的自适应医学影像分类系统，其特征在于，该模块2，用于使该通道注意力网络将该基础特征图进行压缩，得到通道级别的全局特征，然后对全局特征进行激发操作得到不同通道的权重；通过权重和该基础特征图进行相乘，得到该通道注意力特征图。

8.如权利要求4所述的基于Transformer的自适应医学影像分类系统，其特征在于，该原始医学影像和该待分类医学影像均为肺部CT影像，对应的类别包括：细菌、病毒、真菌和新冠。

9.一种存储介质，用于存储执行如权利要求1到4所述任意一种基于Transformer的自适应医学影像分类方法的程序。

10.一种客户端，用于权利要求5至8中任意一种基于Transformer的自适应医学影像分类系统。