CN115063657A

CN115063657A - 基于异构特征融合的缺血性脑卒中发病风险预测模型

Info

Publication number: CN115063657A
Application number: CN202210643230.4A
Authority: CN
Inventors: 童超; 张钰琦; 于孟渤
Original assignee: Beihang University
Current assignee: Beihang University
Priority date: 2022-06-08
Filing date: 2022-06-08
Publication date: 2022-09-16

Abstract

本发明针对缺血性脑卒中发病风险预测任务提出了使用颈动脉CTA影像进行预测的三维影像特征提取网络模型，以及使用电子病历、病史信息进行预测的机器学习模型。设计了融合以上模型使用异构数据联合预测的融合预测网络模型，如图1所示，最后通过多组对比实验对机器学习模型、数据重采样方法以及两个子模型在融合预测模型中权重占比的选择进行了探究，验证了所提模型在缺血性脑卒中发病风险预测任务中的有效性。

Description

基于异构特征融合的缺血性脑卒中发病风险预测模型

技术领域

本发明提出基于异构特征融合的缺血性脑卒中发病风险预测模型，属于图像数据处理^(G06T)。

背景技术

脑卒中是一种发病率、致残率和死亡率都很高的疾病，已成为全球公共卫生的主要威胁之一。“脑卒中”又被称为“中风”，是一种由于头颈部血管发生阻塞导致血液无法正常流入大脑或者脑部的血管突然发生破裂而导致的疾病。脑卒中疾病具有高死亡率、高复发率、高致残率的特点，对人们的生命财产安全和身体健康造成了非常严重的危害。近年来，我国脑卒中疾病的发病率以及死亡率不断升高，目前脑卒中已经成为我国致死率和致残率最高的慢性疾病。随着社会城市化和老龄化进程的加速，不健康生活方式逐渐流行，中国脑卒中疾病有呈现爆发增长的态势，并有年轻化、地域和性别差异明显以及低收入群体快速增长的趋势，脑卒中疾病防治面临巨大挑战。

脑卒中按照病因可分为两大类：缺血性脑卒中，又称脑梗死；出血性脑卒中，又称脑出血。而高达88％的脑卒中是缺血性脑卒中。颈动脉区域的粥样硬化斑块和颈动脉狭窄是引发缺血性脑卒中病症的常见原因，早期发现动脉粥样硬化和颈动脉狭窄是缺血性脑卒中预防和发病风险评估的关键。

目前，在临床上用于颈动脉疾病诊断的成像技术的主要有彩色多普勒超声技术、电子计算机断层扫描血管造影技术(CTA)、数字减影血管造影技术(DSA)和磁共振血管造影技术(MRA)。

数字减影血管造影技术在血管中注入造影剂之后进行成像，经过计算机图像处理之后可以获得去除肌肉、骨骼和其他软组织的减影图像。由于没有了其他组织重叠干扰，血管和其病变或狭窄情况可以更加清楚的得到展示，因此数字减影血管造影技术已代替一般血管造影成为颈动脉疾病诊断的金标准。但由于数字减影血管造影需要将导管插入动脉，属于有创检查，不适用于本文缺血性脑卒中发病风险预测任务所应用的早期筛查阶段。而彩色多普勒超声技术和和磁共振血管造影技术等其他无创血管成像方法存在着低分辨率、低信噪比、存在噪声或伪影的问题，且超声技术获取的二维图像无法完整涵盖颈动脉三维结构信息。

CT血管造影技术(CT Angiography，CTA)是一种使用CT技术的介入检测方法，在医学上又被称为非创伤性血管成像技术。CTA血管成像对于血管壁的改变、血管疾病以及显示血管管腔与病变区域情况有着重要价值。三维CTA影像能够显示和测量颈动脉的狭窄程度和颈动脉斑块情况，相较于金标准DSA技术，CTA具有对人体创伤小、易于操作、检查费用低的特点，适合早期筛查，并且三维影像还能够从多角度、全方位了解血管信息。CTA技术已在颈动脉相关疾病的诊断中得到了广泛的应用。

传统的缺血性脑卒中诊断方法主要依赖于医师的经验丰富程度，具有许多先天的限制，不仅速度缓慢，效率低下，而且不同医师之间的评测结果往往并不稳定，评测方法的鲁棒性不强，这给缺血性脑卒中诊断这一课题带来了效率、准确度方面的挑战。

随着机器学习技术和计算机算力的发展，部分研究者在脑卒中风险的预测任务中应用了机器学习和深度学习方法，并取得了较好的效果。

Pereira等学者使用卷积神经网络通过粒子群优化处理了CT图像中的缺血性和出血性脑卒中检测问题，并提供了包括每个案例原始CT图像、带有分割的颅骨的图像和带有放射学密度图的额外图像的数据集。Teoh等学者使用几个神经网络架构从电子健康记录中预测脑卒中病例，为了解决由于数据的不平衡导致的神经网络模型偏向于负面预测的问题，在标准交叉熵损失函数中加入了正则化项，对假阳性和假阴性预测进行惩罚。虽然机器学习在医疗领域很多方面都已经取得了不错的成绩，但是据调研显示，当前在缺血性脑卒中诊断方面，机器学习，尤其是深度学习方法的应用还很不足，同时大多数基于机器学习和深度学习的方法的没有充分利用丰富的临床数据，还有较大的改进空间。

发明内容

本发明的目的是基于深度学习和机器学习理论与方法，研究新型的、高性能的缺血性脑卒中发病风险预测模型，能够基于患者的三维CTA影像提取的特征以及各种相关的电子病例、病史信息等多种异构特征融合预测患者脑卒中病症的发病风险，辅助医生进行诊断和制定后续治疗方案。

本发明设计了一种基于异构特征融合的缺血性脑卒中发病风险预测模型，该模型基于三维密集网络和三维可变形卷积提出了一个三维影像特征提取网络，并将其与使用电子病例、病史信息进行预测的机器学习模型进行融合，共同组成使用异构数据联合预测的融合预测网络模型。通过多组对比实验验证了所提模型在缺血性脑卒中发病风险预测任务中的有效性。

本发明采用上述模型，首先对数据样本进行预处理，数据样本分为两个部分，一部分为电子病例和病史信息样本，另一部分为颈动脉三维CTA影像样本，然后构建训练数据，训练三维影像特征提取网络和XGBoost模型，最后通过融合预测网络预测受试者的缺血性脑卒中发病风险。

本发明包括下列步骤，

步骤1、构建训练数据：

1.对专业医师做出的缺血性脑卒中诊断结果作为样本的真实标签；

2.根据颈动脉的标准HU值(hounsfield unit，亨氏单位)对三维CTA影像像素值进行截取，对CTA影像数据进行重采样，保证所有CTA影像样本具有相同的像素间距，最后截取颈动脉区域作为网络模型输入图像；

3.对电子病例和病史信息样本的空白部分进行处理，处理方法包括删除这些记录，用平均值填充空白等，经过多次实验对比不同方法的结果，对电子病例和病史信息样本的空白部分使用决策树来预测缺失的值，之后对数据集中的文字特征进行编码，完成数据预处理。

步骤2、训练影像特征提取子模型：

1.针对颈动脉CTA影像的三维性质，利用由二维卷积扩展成三维卷积形式的密集连接网络提取影像特征，三维密集连接网络使用密集连接方式，每层网络与前层所有网络相连接，从而能够有效解决梯度消失和底层特征丢失的问题，在三维密集连接网络中，卷积层、池化层和批量归一化层均为三维形式；

2.将三维卷积层变为三维可变形卷积，通过增加可学习的额外偏移量的方式使三维空间感受野可以进行灵活调整，处理后的CTA影像特征图首先被送入一组三维卷积生成偏移特征，之后使用学习得到的偏移量指导原始卷积的在感受野偏移的基础上进行变形。三维可变形卷积的偏移量和权重的训练可表示为y(p₀)＝

其中p₀代表输出特征图中一个像素点的位置；y(p₀)表示卷积层在该位置的输出特征值，p_n代表方形卷积采样感受野R中的第n个值，w(p_n)代表卷积核相应位置的权值，Δp_n代表可变形卷积采样感受野R中的第n个值所对应的偏移量，并通过双线性差值方法得到精确值；

3.设置训练参数，其中训练参数包括模型学习优化方式、学习率及迭代次数等；例如模型学习优化方式采用Adam优化，学习率为0.001，迭代次数为400，并设置损失函数为交叉熵损失函数；

4.将CTA影像及对应标签信息输入三维卷积网络模型，前向传播计算均方误差损失，然后反向传播更新神经元权重进行训练；

5.重复上一步骤直至模型收敛，得到训练好的网络模型，保存最佳的模型参数作为最终结果。

步骤3、训练机器学习子模型：

1.构建XGBoost模型，在XGBoost模型中把损失函数的二阶泰勒展开的差值作为学习目标，相当于利用牛顿法进行优化，来逼近损失函数的最小值，也就是使得损失函数为0。目标函数定义如下:

其中

其中

代表损失函数,而∑_kΩ(f_k)代表正则化项，其中

为预测输出，y_i为label值，f_k为第k树模型，T为树叶子节点数，w为叶子权重值，λ为叶子权重惩罚正则项，防止过拟合。

2.利用步骤1中获取的补全后的训练数据和上一步构建的XGBoost模型，前向传播计算均方误差损失，然后反向传播更新神经元权重进行训练，保存最佳的模型参数作为最终结果。

步骤4、构建融合预测网络模型：

1.对在CTA影像数据集上训练完成的三维影像特征提取深度学习网络模型以及包含电子病例、病史信息数据的公共数据集上训练完成的机器学习模型进行迁移学习，通过参数迁移的方式将二者的权值参数迁移到融合预测网络模型对应的影像特征提取子模型和机器学习子模型中，最终通过权值融合得出联合风险评估结果。而两个模型在融合预测网络模型输出结果计算过程中所占的权重的最优值则通过网格搜索得出。；

2.对影像特征提取子模型和机器学习子模型的输出结果按照比例系数λ₁、λ₂进行融合，从而得到融合预测网络模型的最终输出预测概率值，具体计算方式表示为

本发明首先针对缺血性脑卒中发病风险预测任务提出了使用颈动脉CTA影像进行预测的三维影像特征提取网络模型，以及使用电子病例、病史信息进行预测的机器学习模型。之后设计了融合以上模型使用异构数据联合预测的融合预测网络模型，最后通过多组对比实验对机器学习模型、数据重采样方法以及两个子模型在融合预测模型中权重占比的选择进行了探究，并验证了所提模型在缺血性脑卒中发病风险预测任务中的有效性。

附图说明

图1为本发明的整体流程示意图；

图2为本发明提出的缺血性脑卒中发病风险预测模型结构图；

图3为缺血性脑卒中发病风险预测模型对比结果；

图4为二分类任务混淆矩阵。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面结合实施方式和附图，对本发明作进一步地详细描述。

参见图1，将本发明用于缺血性脑卒中发病风险预测时，其具体处理步骤如下：

1、构建训练数据：

训练本发明提出的异构特征融合模型所使用的数据集分别为Stroke PredictionDataset(https://www.kaggle.com/datasets/fedesoriano/stroke-prediction-dataset)公有数据集和私有数据集。

对于Stroke Prediction Dataset公共数据集，其包含电子病例和病史信息，本发明使用的指标有：性别、年龄、高血压病史、心脏病史、婚姻状况、工作类型、居住类型、血糖水平、身体质量指数(Body Mass Index，BMI)以及吸烟状况。进行预处理后，共提取了4908例电子病例和病史信息样本，随机选取其中80％共计3926例样本作为训练样本，其余982例样本作为测试样本。其中训练集正样本156例，负样本3770例，测试集正样本53例，负样本929例，存在着非常严重的正负样本数量不均衡的问题，其中没有患脑卒中的负样本数更多。因此需要使用数据重采样方法对正样本数据进行数据扩充或者对负样本数据进行筛选。本发明使用Chawla等人提出的SMOTE算法作为正负样本数量不均衡问题解决方案，SMOTE算法将数量较少类的样本数据根据设定好的采样倍率N合成新样本并添加到原有样本集中，该方法已经在很多医学类以及其他领域的研究中用于处理数据样本不均衡的问题。除此之外，公有数据集中包含一些缺失项，本发明对电子病例和病史信息样本的空白部分进行处理，处理方法包括删除这些记录，用平均值填充空白等，经过多次实验对比不同方法的结果，最后采用的方式是使用决策树来预测缺失的值，之后对数据集中的文字特征进行编码，完成数据预处理。

对于私有数据集，来包含CTA影像数据和电子病例和病史信息。首先根据颈动脉的标准HU值对三维CTA影像像素值进行截取。原始颈部CTA影像中还有骨骼等其它组织器官，导致图像中血管不明显，加大了深度学习网络模型训练的难度。本发明通过限制CTA影像的HU值范围来消除无关部分的干扰，即设置两个HU阈值：最小HU值和最大HU值。影像中像素的HU值若小于最小HU值或大于最大HU值，则将该HU值截断到阈值。通过该处理，排除了颈动脉HU值范围外大部分其它器官和组织的干扰，利于网络训练。接下来对CTA影像数据进行重采样。由于本发明所使用的CTA影像来自于多种扫描设备，采集后的数据像素z轴间距不统一，在利用CTA三维图像序列进行深度学习模型训练时，不同的切片厚度会对提取到的特征尺度产生影像，进而导致模型性能表现的下降。因此，本文通过三线性插值方法对输入CTA影像进行重采样。在重采样过程中，输入影像保持中心不变被重新映射到像素间距为(1,1,1)mm的空间坐标系，保证所有CTA影像样本具有相同的像素间距。最后截取颈动脉区域作为网络模型输入图像。具体来说，本发明以颈动脉分叉处为中心，根据专业医生建议选取向上2cm，向下3cm作为截取目标区域，由于输入影像已被映射到像素间距为(1,1,1)mm的空间坐标系，因此即为取以切片方向颈动脉分叉处为中心向上20张，向下30张，共计50张切片图像和颈动脉在截面上的范围组成的三维图像区域作为颈动脉区域进行截取。为了方便网络模型训练，截取后的颈动脉区域尺寸被调整为40×40×50大小。

2、搭建基于异构特征融合的缺血性脑卒中发病风险预测模型：

利用Francois Chollet等人提出的Keras深度学习框架，搭建本发明提出的网络模型，如图2所示。本发明所使用包含颈动脉三维CTA影像的私有数据集共有样本389例，对于提取三维影像特征的三维卷积神经网络模型来说尚且满足训练要求，但对于基于电子病例、病史等数据训练的机器学习模型来说数据量过少。因此引入了Stroke PredictionDataset公有数据集中的数据来辅助机器学习模型的训练，为了使分别训练的三维影像特征提取网络模型与机器学习模型能够进行异构特征联合预测，就需要利用迁移学习技术集成用于联合预测的模型。

3、训练基于异构特征融合的缺血性脑卒中发病风险预测模型：

训练数据前向传播计算均方误差损失，将损失反向传播更新影像特征提取子模型和机器学习子模型的模型参数。重复前向传播与反向传播直至模型收敛，训练完成后，模型参数保存在文件中。本发明的异构特征模型融合利用了迁移学习中的参数迁移方法，基于权值参数的迁移学习指的是参数在相关的学习任务上被共享。基于CTA影像数据的三维影像特征提取深度学习模型与基于电子病例、病史等数据训练完成的机器学习模型在进行预测时，均会得出分类结果的概率值。在融合预测网络模型中迁移使用这两个模型的参数，并将其输入结果进行融合，对影像特征提取子模型和机器学习子模型的输出结果按照比例系数λ_1、λ_2进行融合，从而得到融合预测网络模型的最终输出预测概率值，具体计算方式表示为

从而使CTA影像学检测和电子病例、病史等信息都能在脑卒中风险预测中发挥一定的作用。

本发明在CTA影像数据集上训练完成的三维影像特征提取深度学习网络模型以及包含电子病例、病史信息数据的公共数据集上训练完成的机器学习模型进行迁移学习。通过参数迁移的方式将二者的权值参数迁移到融合预测网络模型对应的影像特征提取子模型和机器学习子模型中，最终通过权值融合得出联合风险评估结果。而两个模型在融合预测网络模型输出结果计算过程中所占的权重的最优值则通过网格搜索得出。融合预测网络模型结构如图2所示。

4、在数据集上对本发明的模型进行评估：

为了对比本文所提使用三维密集连接和可变形卷积的三维影像特征提取网络模型以及融合预测网络模型的性能，采用与上述相同的训练集训练3D-CNN网络(Lecun等人)，3DResNet网络(何凯明等人)和使用普通卷积的3D-DenseNet网络(黄高等人)，并在相同的测试集上进行测试。通过测试样本的测试，3D-CNN网络，3D-ResNet网络、使用普通卷积的3D-DenseNet网络以及本发明三维影像特征提取网络、融合预测网络的测试结果如图3所示。

准确率(Accuracy)、灵敏度(Sensitivity)和特异度(Specificity)是医学影像预测分类任务中常用的评估指标，本文实验使用标注的金标准和网络模型预测结果计算上述指标用于三维影像特征提取网络模型效果表现评价。以上评价指标的计算方法来源于二维混淆矩阵，矩阵的行表示真实标签中的类别，列表示模型预测出的类别。以二分类任务为例，若将所有样本按照真实标签分为正类(Positive)样本与负类(Negative)样本两类，将正类样本中预测正确的记为T P，将正类样本中预测错误(预测为负类)的记为F N，将负类样本中预测正确的记为TN，将负类样本中预测错误(预测为正类)的记为FP，则二分类任务的混淆矩阵可以由图4表示。通过如上的二分类混淆矩阵可以对各项指标进行计算。

准确率表示所有样本中预测正确的样本的比例，其计算方式为

灵敏度常在医学诊断中表示算法能够正确判断正类样本(患者)的概率，其计算方式为：

特异度常在医学诊断中表示算法能够正确判断负类样本(非患者)的概率，其计算方式为：

从实验结果可以看出，在使用颈动脉CTA影像的对缺血性脑卒中发病风险进行预测的模型中，3D-ResNet在特异度指标上取得了最好的效果，而本发明所提的三维影像特征提取网络模型的准确率和对于医学预测任务更为重要的灵敏度指标分别达到了83.33％和91.67％，取得了最好的整体效果。在单独使用XGBoost等机器学习模型进行预测时，由于没有利用到CTA影像中的丰富信息，效果相对较差。而将其与三维影像特征提取网络模型进行联合构建的融合预测模型，在测试集上的准确率、特异度和灵敏度指标分别为89.74％、94.44％和85.71％，在所有三个指标上均取得了最好的效果。

综上，本发明提出的使用异构数据构建融合预测网络模型联合预测在缺血性脑卒中发病风险预测任务上具有明显优势。

以上所述，仅为本发明的具体实施方式，本说明书中所公开的任一特征，除非特别叙述，均可被其他等效或具有类似目的的替代特征加以替换；所公开的所有特征、或所有方法或过程中的步骤，除了互相排斥的特征和/或步骤以外，均可以任何方式组合。

Claims

1.运行基于异构特征融合的缺血性脑卒中发病风险预测模型的计算机系统，包括处理器与存储器，其特征在于，所述处理器通过执行存储在所述存储器中的程序来执行以下步骤：

步骤S1、构建训练数据：

S1.1根据颈动脉的标准HU值(hounsfield unit，亨氏单位)对三维CTA影像像素值进行截取，对CTA影像数据进行重采样，保证所有CTA影像样本具有相同的像素间距，最后截取颈动脉区域作为的训练样本，训练样本的真实标签来自对缺血性脑卒中诊断结果；

S1.2对电子病例和病史信息样本的空白部分进行处理，对电子病例和病史信息样本的空白部分使用决策树来预测缺失的值，之后对数据集中的文字特征进行编码，完成数据预处理；

步骤S2、训练三维影像特征提取网络模型：

S2.1针对颈动脉CTA影像的三维性质，利用由二维卷积扩展成三维卷积形式的密集连接网络提取影像特征，三维密集连接网络使用密集连接方式，每层网络与前层所有网络相连接，从而能够有效解决梯度消失和底层特征丢失的问题，在三维密集连接网络中，卷积层、池化层和批量归一化层均为三维形式；

S2.2将三维卷积层变为三维可变形卷积，通过增加可学习的额外偏移量的方式使三维空间感受野可以进行灵活调整，处理后的CTA影像特征图首先被送入一组三维卷积生成偏移特征，之后使用学习得到的偏移量指导原始卷积的在感受野偏移的基础上进行变形；S2.3设置训练参数，其中训练参数包括模型学习优化方式、学习率及迭代次数等；例如模型学习优化方式采用Adam优化，学习率为0.001，迭代次数为400，并设置损失函数为交叉熵损失函数；

S2.3将CTA影像及对应标签信息输入三维卷积网络模型，前向传播计算均方误差损失，然后反向传播更新神经元权重进行训练；

S2.3重复上一步骤直至模型收敛，得到训练好的网络模型，保存最佳的模型参数作为最终结果；

步骤S3、训练机器学习模型：

S3.1构建XGBoost模型，在XGBoost模型中把损失函数的二阶泰勒展开的差值作为学习目标，相当于利用牛顿法进行优化，来逼近损失函数的最小值，也就是使得损失函数为0；

S3.2利用步骤S1中获取的补全后的数据集信息和上一步构建的XGBoost模型，前向传播计算均方误差损失，然后反向传播更新神经元权重进行训练，保存最佳的模型参数作为最终结果；

步骤S4、融合预测网络模型：

S4.11.对在CTA影像数据集上训练完成的三维影像特征提取深度学习网络模型以及包含电子病例、病史信息数据的公共数据集上训练完成的机器学习模型进行迁移学习，通过参数迁移的方式将二者的权值参数迁移到融合预测网络模型对应的影像特征提取子模型和机器学习子模型中，最终通过权值融合得出联合风险评估结果；而两个模型在融合预测网络模型输出结果计算过程中所占的权重的最优值则通过网格搜索得出；

S4.2对影像特征提取子模型和机器学习子模型的输出结果按照比例系数λ₁、λ₂进行融合，从而得到融合预测网络模型的最终输出预测概率值，具体计算方式表示为

2.如权利要求1所述的计算机系统，其特征在于，将部分三维卷积层变为三维可变形卷积，三维可变形卷积的偏移量和权重的训练可表示为

其中p₀代表输出特征图中一个像素点的位置；y(p₀)表示卷积层在该位置的输出特征值，p_n代表方形卷积采样感受野R中的第n个值，w(p_n)代表卷积核相应位置的权值，Δp_n代表可变形卷积采样感受野R中的第n个值所对应的偏移量，并通过双线性差值方法得到精确值。

3.如权利要求1所述的计算机系统，其特征在于，XGBoost模型目标函数定义如下:L(φ)＝

其中

其中

代表损失函数,而∑_kΩ(f_k)代表正则化项，其中

4.如权利要求1所述的计算机系统，其特征在于，针对缺血性脑卒中发病风险预测任务提出了使用颈动脉CTA影像进行预测的三维影像特征提取网络模型，以及使用电子病例、病史信息进行预测的机器学习模型。之后设计了融合以上模型使用异构数据联合预测的融合预测网络模型，最后通过多组对比实验对机器学习模型、数据重采样方法以及两个子模型在融合预测模型中权重占比的选择进行了探究，并验证了所提模型在缺血性脑卒中发病风险预测任务中的有效性。