CN116703867B

CN116703867B - 残差网络与通道注意力协同驱动下的基因突变预测方法

Info

Publication number: CN116703867B
Application number: CN202310683300.3A
Authority: CN
Inventors: 董云云; 孙丽超; 景超; 常锐云; 赵子安; 张源榕; 常云青; 杨炳乾; 白玉洁; 冯秀芳
Original assignee: Taiyuan University of Technology
Current assignee: Taiyuan University of Technology
Priority date: 2023-06-09
Filing date: 2023-06-09
Publication date: 2023-12-08
Anticipated expiration: 2043-06-09
Also published as: CN116703867A

Abstract

本发明提供了一种残差网络与通道注意力协同驱动下的基因突变预测方法，属于深度学习技术领域；解决了现有深度学习在基因突变预测中存在的无法获取大规模影像数据、难以判断基因突变的类型导致模型精度低的问题；包括如下步骤：输入肺部的CT图像并进行预处理，然后将预处理后的肺部CT图像输入进行卷积处理提取肺结节的初步特征；使用1×1的卷积层，将残差块与SE机制的通道连接，实现跨通道的交互并将提取的肺结节信息进行整合；通过由残差块和SE机制组成的模块，重复两次来提取肺结节的精细特征；通过自适应平均池化层与全连接层连接对提取肺结节的精细特征进行分类，根据分类结果对基因突变进行多任务预测；本发明应用于基因突变预测。

Description

残差网络与通道注意力协同驱动下的基因突变预测方法

技术领域

本发明提供了一种残差网络与通道注意力协同驱动下的基因突变预测方法，属于深度学习、影像基因辅助诊断技术领域。

背景技术

过去30年间我国肺癌死亡率逐步上升，CT影像包含大量潜在病理生理学的信息，使用CT影像进行计算机辅助诊断能够提高临床诊断的精度和稳定性，减少临床诊断需要的时间，降低各种主观因素带来的临床误诊风险和疏漏判断。

近年来，深度学习因其强大的特征提取能力，在人工智能医疗领域逐步发展起来。在利用计算机辅助医学治疗研究中，深度学习方法也崭露头角，但是在EGFR和KRAS突变的预测中仍存在如下挑战：①深度学习模型依赖于大规模的数据集，而医学影像基因数据难以大规模获取。②不同基因突变类型之间肺结节的形态、纹理和外观有极大的差异性(表现为结节在CT影像上的大小、位置和外观的差异)，仅从外观上很难区分出EGFR突变型/野生型以及KRAS突变型/野生型，因此，基于CT影像如何构建深度学习模型来预测突变仍然是一个棘手的问题。

发明内容

本发明为了解决现有深度学习在基因突变预测中存在的无法获取大规模影像数据、难以判断基因突变的类型导致模型精度低的问题，提出了一种残差网络与通道注意力协同驱动下的基因突变预测方法。

为了解决上述技术问题，本发明采用的技术方案为：一种残差网络与通道注意力协同驱动下的基因突变预测方法，包括如下步骤：以ResNet-18网络作为基础网络，使用由残差块和SE机制组成的模块，每个模块包括4个卷积层，最后通过一个全连接层构建得到包含残差网络和通道注意力的卷积神经网络模型；

S1：输入肺部的CT图像并进行预处理，然后将预处理后的肺部CT图像输入至构建好的卷积神经网络模型进行卷积处理提取肺结节的初步特征；

S2：使用1×1的卷积层，将残差块与SE机制的通道连接，实现跨通道的交互并将步骤S1中提取的肺结节信息进行整合；

S3：通过由残差块和SE机制组成的模块，重复两次来提取肺结节的精细特征；

S4：通过自适应平均池化层与全连接层连接对提取到的肺结节的精细特征进行分类，根据分类结果对多基因是否突变进行多任务预测。

所述步骤S1中输入肺部的CT图像为经过数据处理的肺部CT图像数据集，预处理包括采用数据增广扩大图像数据集，数据增广具体是通过对每个2D肺结节切片执行图像的选择、垂直翻转、水平翻转和改变图像亮度，将进行数据增广后的图像通过一个7×7卷积层、批量化规范层和3×3最大池化层，此外在数据预处理阶段还对CT图像进行了随机变换操作。

所述步骤S2中引入的连接残差块与SE机制的1×1卷积层能够调整通道和分辨率，改变通道数使输入和输出的图像的形状一致，且不改变特征图的尺度；

在步骤S2中的残差块后以及全连接层前加入了DropOut层。

所述步骤S3中的残差块首先通过两个相同输出通道数的3×3卷积层，每个3×3卷积层后接一个批量规范化层和ReLU函数，然后通过跨层数据通路，跳过这两个3×3卷积运算，将输入直接加在最后的ReLU激活函数前，在最后的ReLU激活函数前加入SE机制，对输入特征进行压缩和激励两个操作。

所述SE机制包括一个平均池化层和两个全连接层，通过压缩操作对输入的每个通道进行全局平均池化得到通道描述子，激励操作利用两层全连接池化层为每个通道生成权重，最后将激励的输出权重与先前特征进行重新加权，完成在通道维度上对原始特征的校准。

所述步骤S4中的分类标签为2，代表EGFR和KRAS基因是野生型还是突变型。

还能够将与肺部CT图像对应的患者的病例信息嵌入卷积神经网络模型中，加入更多与基因突变相关的先验知识。

本发明相对于现有技术具备的有益效果为：本发明提供的一种残差网络与通道注意力协同驱动下的基因突变预测方法通过四个残差块的一系列卷积层堆叠并插入非线性(即激活函数)与降采样，卷积神经网络可以在全局感受野内描绘图像的分层特征，进而成为强大的图像特征表达器。在保留内部数据的空间结构，尽可能多地获得到肺结节的相关特征，并且能够更加精确地将肺结节区域从原始图片中分割出来，从而可以捕获到肺结节形状与内部结构的隐藏信息，提高识别精度。

附图说明

下面结合附图对本发明做进一步说明：

图1为采用本发明方法进行基因突变预测的流程图；

图2为Stage2中的残差块的结构示意图；

图3为Stage3中的残差块的结构示意图；

图4为Stage2、Stage3中的SE机制的结构示意图；

图5为每个阶段后图像的通道数变化示意图。

具体实施方式

如图1至图5所示，本发明提供了一种残差网络与通道注意力协同驱动下的基因突变预测方法，以期利用非小细胞肺癌的CT影像预测多基因的突变。首先，对图像进行卷积处理提取肺结节的初步特征。其次，使用1×1的卷积层，将残差块与注意力块的通道连接，实现跨通道的交互并将之前模块的肺结节信息进行整合。再次，由残差模块和注意力模块组成，重复两次来提取肺结节的精细特征。此外，将患者的少许病历信息嵌入模型中，加入更多与突变相关的先验知识。最后，通过自适应平均池化层与全连接层连接对多基因是否突变进行多任务预测。

如图1所示，本发明中方法是以ResNet-18网络作为基础网络，并在特征提取阶段加入残差块，每个模块有4个卷积层最后通过一个全连接层。在不增加参数的情况下，增加了残差块，因此适用于提取肺结节的深度特征。本发明根据对肺结节特征提取深度进行区分，Stage1主要对图像进行卷积处理，初步提取肺结节特征。Stage2使用1×1的卷积层，将残差块与注意力块的通道连接，实现跨通道的交互并将之前模块的结节信息进行整合。Stage3由残差块和注意力模块组成，重复两次来提取结节的精细特征。Stage4通过自适应平均池化层与全连接层连接对EGFR和KRAS基因是否突变进行多任务预测。

Stage1为输入层，负责载入图像，本发明的输入图像为经过数据处理的EGFR和KRAS数据集，为缓解由于数据不足而导致的模型过拟合问题，使用数据增广技术来扩大训练数据集，具体通过对每个2D结节切片执行图像的选择、垂直翻转、水平翻转和改变图像亮度，以适应后续方法的处理。紧接着使进行数据增广后的图像通过一个7×7卷积层，批量化规范层和3×3最大池化层，对输入的图片进行降采样，尽可能保留原始图像的信息。将训练参数的批次大小设置成32，随后采用随机梯度下降算法，在15个Epoch中反复训练。在训练过程中学习率为0.001。为防止数据过拟合以及增强模型的泛化能力，在数据预处理阶段对CT图像进行了随机变换操作。

Stage2通过引入额外的1×1卷积层调整通道和分辨率，改变通道数从而使输入与输出的形状一致，因而可以相加，在保持特征图(feature map)尺度不变的前提下增加模型的深度，从而增加非线性表达能力，提高网络的表现能力。由于Stage1已经使用了步幅为2的最大池化(pooling)层，因此在无需降低通道宽度的情况下，即可获得所需的特征提取效果。在残差块后加入挤压和激励网络注意力机制(SE机制)。由于CT图像为天然的3D图像序列，其每个切片往往具有复杂的上下文环境和语义，注意力机制使用全局感受野动态调整每个特征图中每个通道的重要性，挖掘特征图不同维度之间的相关性信息，以辅助完成肺结节CT图像特征的提取，进而提高区分恶性肺结节的准确率。

Stage3的残差块首先通过两个相同输出通道数3×3的卷积层，每个卷积层后接一个批量规范化层和ReLU函数。然后通过跨层数据通路，跳过这两个卷积运算，将输入直接加在最后的ReLU激活函数前。与Stage2相比，Stage3没有加入1×1卷积层，因而之后的每个模块都通过残差块将上一个模块的高宽减半，以此来扩大感受野，通道数翻倍使图形不同通道间的信息得以融合。

设一个网络模型中的输入为x，网络的期望输出为H(x)，残差映射为F(x)如式(1)所示：

F(x)＝H(x)-x (1)。

如果将x直接传递给输出H(x)，那么该网络模型所要学习的目标就是残差映射。如图2所示，该结构代表了残差学习单元，残差学习单元由一组卷积层及捷径组成，网络的输入x通过捷径传递给残差学习单元的输出，使其可以直接学习残差H(x)-x。具体的，残差网络由一系列残差块组成。残差块的数学表达形式为式(2)：

x_i+1＝x_i+F(x_i，W_i) (2)；

上式中W_i为第1层卷积核的权值矩阵。

学习残差映射比学习原始映射更为简单，一方面残差学习单元中捷径连接不会使模型的规模及参数量改变。另一方面添加残差学习单元的网络能够在现有的深度下进行反向传播，且在加入捷径连接后，式(3)表示对x的偏导，H对x的偏导必定大于1，对应可知，网络模型层数的不断增加并不会出现梯度消失的问题。之后的每个模块都通过残差块将上一个模块的高宽减半，以此来扩大感受野，通道数翻倍使图形不同通道间的信息得以融合。

层与层之间的激活函数(activation function)使用修正线性单元ReLU，其表达式如式(4)所示：

ReLU(x)＝max(0，x) (4)。

在最后的ReLU激活函数前加入挤压和激励网络注意力机制(SE机制)，通过挤压和激励网络注意力机制SENet对输入特征进行压缩(Squeeze)和激励(Excitation)两个重要操作，通过Squeeze操作对输入的每个通道进行全局平均池化得到通道描述子，Excitation操作利用两层全连接池为每个通道生成权重，最后将Excitation的输出权重与先前特征进行重新加权，完成在通道维度上对原始特征的校准，使得图像分类的精度提升。

为了提高模型的泛化能力并加快训练速度，需对数据做批量归一化(BatchNormalization)处理。假设输入的一个批次的数为B＝{x1…xm}共m个数据，那么此次批次数据的均值通过式(5)计算：

方差通过式(6)计算：

对x通过式(7)做归一化：

引入缩放量γ和平移量β，输出公式如(8)：

将式(8)中的β的大小设置为1×e^-5，作用是提高归一化计算的稳定性。

SE机制包括一个全局平均池化层、两个全连接层。输入特征图U＝[u₁，u₂，…u_c]，先对U进行全局平均池化操作进行空间压缩，定义该过程为g(·)，得到向量z，并通过式(9)所示计算方法获得z中每个通道处的值z_k。

其中，定义：H为特征图的高；W为特征图的宽；C为通道数；(i,j)为特征图中的空间坐标。将z输入到全连接层，依次使用激活函数δ(·)、归一化层函数σ(·)计算得到第i个通道特征u_i的重要性程度，计为/>通过重新标定通道，完成最后的标准采样过程。综上所述，SE机制的实现如式(10)所示。从本质看，SE机制向特征图像引入了输入图像的动态先验，从而提升了网络对特征的识别能力。

Stage4由全连接层和自适应平均池化层组成。卷积取得是局部特征，全连接指的就是把这些局部特征重新通过权值矩阵组装成完整的图。同时为了缓解模型的过拟合问题，在Stage2第一个残差块后以及全连接层前加入了DropOut层，分别设置暂退概率为0.2、0.5。ResNet-18最后一个全连接层，对图像进行分类。本发明预测任务为区分野生型还是突变型，所以分类标签为2。池化层用于减少特征图的维度，降低卷积层对未知的敏感性，同时降低对空间降采样的敏感性，常见的下采样有最大池化(max-pooling)和平均池化(mean-pooling)，本发明采用自适应平均池化，用于多尺度肺结节特征的融合，扩大提取的肺结节的深度。

图4表示每个阶段后图像的通道数变化，在Stage1时图像为64×56×56，由于Stage2有1×1卷积层，因而不改变通道数，Stage3中分别通过三个残差块，使通道数从128翻倍为256，最后变为512。肺结节图像特征复杂难以分辨，ResNet采用残差设计让输入与各层输出直接建立连接，这样拟合目标由目标函数转变为残差(目标函数与输入的差值)，突出了输入值的微小的变化，避免在对图像特征提取的时候带来的特征信息耗散，因此契合肺结节良恶性分类问题的难点。通过向ResNet模块中嵌套注意力机制，在不增加对模型的监督前提下帮助捕捉图像在全局空间上的内部联系，对那些可以起到更大作用的信道增加他们的权重地位，而那些作用不是特别明显的维度则削弱他们的地位，充分提取特征图像不同信道之间的依赖信息，进行改善网络的性能表现。

关于本发明具体结构需要说明的是，本发明采用的各部件模块相互之间的连接关系是确定的、可实现的，除实施例中特殊说明的以外，其特定的连接关系可以带来相应的技术效果，并基于不依赖相应软件程序执行的前提下，解决本发明提出的技术问题，本发明中出现的部件、模块、具体元器件的型号、相互间连接方式以及，由上述技术特征带来的常规使用方法、可预期技术效果，除具体说明的以外，均属于本领域技术人员在申请日前可以获取到的专利、期刊论文、技术手册、技术词典、教科书中已公开内容，或属于本领域常规技术、公知常识等现有技术，无需赘述，使得本案提供的技术方案是清楚、完整、可实现的，并能根据该技术手段重现或获得相应的实体产品。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims

1.一种残差网络与通道注意力协同驱动下的基因突变预测方法，其特征在于：包括如下步骤：以ResNet-18网络作为基础网络，使用由残差块和SE机制组成的模块，每个模块包括4个卷积层，最后通过一个全连接层构建得到包含残差网络和通道注意力的卷积神经网络模型；

在步骤S2中的残差块后以及全连接层前加入了DropOut层；

所述步骤S3中的残差块首先通过两个相同输出通道数的3×3卷积层，每个3×3卷积层后接一个批量规范化层和ReLU函数，然后通过跨层数据通路，跳过这两个3×3卷积运算，将输入直接加在最后的ReLU激活函数前，在最后的ReLU激活函数前加入SE机制，对输入特征进行压缩和激励两个操作；

所述SE机制包括一个平均池化层和两个全连接层，通过压缩操作对输入的每个通道进行全局平均池化得到通道描述子，激励操作利用两层全连接池化层为每个通道生成权重，最后将激励的输出权重与先前特征进行重新加权，完成在通道维度上对原始特征的校准；

2.根据权利要求1所述的一种残差网络与通道注意力协同驱动下的基因突变预测方法，其特征在于：所述步骤S1 中输入肺部的CT图像为经过数据处理的肺部CT图像数据集，预处理包括采用数据增广扩大图像数据集，数据增广具体是通过对每个2D肺结节切片执行图像的选择、垂直翻转、水平翻转和改变图像亮度，将进行数据增广后的图像通过一个7×7卷积层、批量化规范层和3×3最大池化层，此外在数据预处理阶段还对CT图像进行了随机变换操作。

3.根据权利要求2所述的一种残差网络与通道注意力协同驱动下的基因突变预测方法，其特征在于：所述步骤S4中的分类标签为2，代表EGFR和KRAS基因是野生型还是突变型。

4.根据权利要求3所述的一种残差网络与通道注意力协同驱动下的基因突变预测方法，其特征在于：还能够将与肺部CT图像对应的患者的病例信息嵌入卷积神经网络模型中，加入更多与基因突变相关的先验知识。