CN117689666A - 基于预测模型的脊髓内脱髓鞘假瘤病与肿瘤的诊断系统 - Google Patents
基于预测模型的脊髓内脱髓鞘假瘤病与肿瘤的诊断系统 Download PDFInfo
- Publication number
- CN117689666A CN117689666A CN202311721972.5A CN202311721972A CN117689666A CN 117689666 A CN117689666 A CN 117689666A CN 202311721972 A CN202311721972 A CN 202311721972A CN 117689666 A CN117689666 A CN 117689666A
- Authority
- CN
- China
- Prior art keywords
- model
- features
- demyelinating
- spinal cord
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 206010028980 Neoplasm Diseases 0.000 title claims abstract description 31
- 230000003210 demyelinating effect Effects 0.000 title claims abstract description 27
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 title claims abstract description 26
- 210000000278 spinal cord Anatomy 0.000 title claims abstract description 24
- 206010026865 Mass Diseases 0.000 title claims abstract description 12
- 238000002595 magnetic resonance imaging Methods 0.000 claims abstract description 23
- 201000010099 disease Diseases 0.000 claims abstract description 14
- 238000000605 extraction Methods 0.000 claims abstract description 11
- 238000007781 pre-processing Methods 0.000 claims abstract description 8
- 238000010276 construction Methods 0.000 claims abstract description 7
- 238000003709 image segmentation Methods 0.000 claims abstract description 7
- 238000000034 method Methods 0.000 claims description 25
- 238000012549 training Methods 0.000 claims description 18
- 238000012360 testing method Methods 0.000 claims description 15
- 239000002131 composite material Substances 0.000 claims description 7
- 238000010606 normalization Methods 0.000 claims description 7
- 238000012216 screening Methods 0.000 claims description 6
- 238000012952 Resampling Methods 0.000 claims description 5
- 238000012937 correction Methods 0.000 claims description 5
- 238000001914 filtration Methods 0.000 claims description 5
- 238000006243 chemical reaction Methods 0.000 claims description 2
- 238000003745 diagnosis Methods 0.000 abstract description 21
- 230000003902 lesion Effects 0.000 description 12
- 238000010801 machine learning Methods 0.000 description 12
- 239000011159 matrix material Substances 0.000 description 12
- 230000000694 effects Effects 0.000 description 7
- 238000003384 imaging method Methods 0.000 description 5
- 238000001356 surgical procedure Methods 0.000 description 5
- 238000001574 biopsy Methods 0.000 description 4
- 238000003748 differential diagnosis Methods 0.000 description 4
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 4
- 230000007170 pathology Effects 0.000 description 4
- 238000002203 pretreatment Methods 0.000 description 4
- 230000035945 sensitivity Effects 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 238000003759 clinical diagnosis Methods 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 238000007477 logistic regression Methods 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 238000007637 random forest analysis Methods 0.000 description 3
- 238000012706 support-vector machine Methods 0.000 description 3
- 208000024891 symptom Diseases 0.000 description 3
- 230000009897 systematic effect Effects 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- 206010003571 Astrocytoma Diseases 0.000 description 2
- 206010014967 Ependymoma Diseases 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 230000008030 elimination Effects 0.000 description 2
- 238000003379 elimination reaction Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 201000006417 multiple sclerosis Diseases 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- 208000019901 Anxiety disease Diseases 0.000 description 1
- 238000001358 Pearson's chi-squared test Methods 0.000 description 1
- 238000000692 Student's t-test Methods 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000036506 anxiety Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000003702 image correction Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 230000000116 mitigating effect Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 208000008795 neuromyelitis optica Diseases 0.000 description 1
- 210000001328 optic nerve Anatomy 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 201000011096 spinal cancer Diseases 0.000 description 1
- 206010062261 spinal cord neoplasm Diseases 0.000 description 1
- 208000037959 spinal tumor Diseases 0.000 description 1
- 238000012353 t test Methods 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 238000002759 z-score normalization Methods 0.000 description 1
Landscapes
- Magnetic Resonance Imaging Apparatus (AREA)
Abstract
本发明公开了一种基于预测模型的脊髓内脱髓鞘假瘤病与肿瘤的诊断系统,属于预测模型与系统的构建领域。一种脊髓内脱髓鞘假瘤病与肿瘤的诊断系统,包括:MRI扫描模块,用于获取患者目标区域的医学影像:图像分割模块,用于获取所述的MRI扫描模块中的医学影像,并对所述医学影像进行预处理与分割;特征提取模块,用于从图像分割模块处理后的医学影像中提取特征;模型预测模块,用于接收所提取的特征,进行预测。
Description
技术领域
本发明涉及预测模型与系统的构建技术领域,具体涉及一种基于预测模型的脊髓内脱髓鞘假瘤病与肿瘤的无创诊断系统。
背景技术
现有的脊髓内脱髓鞘假瘤病(Tumefactive demyelinating lesions,TDLs)与脊髓内肿瘤技术的鉴别主要包括以下三个方面,以及它们各自的不足:
1.影像学鉴别:对于未行强化的MRI,在T2加权像上,脊髓内肿瘤和脱髓鞘假瘤病都可能显示为高信号区域,难以区分。对于强化的MRI,脊髓内肿瘤通常会表现出增强,而脱髓鞘病变的增强可能不明显或表现为不规则模式。尽管如此,某些脱髓鞘病变在活动期也可能表现出增强,这也使两者难以区分。目前的鉴别手段包括使用传统影像学的特征性图像鉴别以及新型序列辅助鉴别。传统影像学的特征性图像鉴别过度依赖医生的经验,而缺乏一套系统性和可复制的诊断方法。而新型序列辅助鉴别虽然可能提供更多的信息,但对医疗设备的硬件要求过高,且检查时间长,这可能限制了其在临床实践中的应用。
2.病理学鉴别:这通常需要进行手术或活检来获取病理标本,然后通过病理学检查来诊断。然而,这种方法对患者的身体损伤较大,且手术风险较高。此外,手术或活检的结果可能需要等待一段时间,这可能延误了患者的治疗。
3.化学指标鉴别:这包括体检、血液检测和脑脊液检测等方法。这些方法通常耗时较长,且检测费用较高。此外,这些方法可能需要多次采样和检测,对患者的生活质量产生影响。
综上,在上述现有技术的基础上,肿瘤与脊髓内脱髓鞘假瘤病的区分仍然具有较高的难度。这些问题在神经科诊疗工作中造成了实质性的困境。在缺乏足够研究的情况下,诊断髓内TDL病变的准确性和效率都受到了严重影响。这不仅给医生带来了困扰,也对患者的治疗和康复产生了负面影响。
因此,现有的技术在鉴别中都存在一些重要的限制和不足,存在改进的空间。
发明内容
针对现有技术的不足,本发明提出了一种基于预测模型的脊髓内脱髓鞘假瘤病与肿瘤的诊断系统。
本发明的目的可以通过以下技术方案实现:
一种脊髓内脱髓鞘假瘤病与肿瘤的诊断系统,包括:
MRI扫描模块,用于获取患者目标区域的医学影像:
图像分割模块,用于获取所述的MRI扫描模块中的医学影像,并对所述医学影像进行预处理与分割;
特征提取模块,用于从图像分割模块处理后的医学影像中提取特征;
模型预测模块,用于接收所提取的特征,进行预测。
可选地,还包括模型解释模块,用于预测特征对于结果预测的贡献。
可选地,所述特征包括形状、大小、位置、纹理、边缘以及像素。
可选地,所述特征提取模块所提取的特征包括:一阶特征、形状特征和纹理特征。
可选地,所述预处理包括医学影像强度归一化、格式转换、固定分辨率重采样、N4磁场校正以及噪声去除。
可选地,所述模型预测模块配置为T1WI和T2WI加权图像的MLP复合模型。
本发明的另一方面,还涉及一种预测模型的构建方法,包括以下步骤:
进行特征过滤,在每次迭代期间删除当前集中冗余度最高的特征;采用最小绝对收缩和选择算子进行多变量选择;
将数据集中的数据随机分配训练数据集与测试数据集;
使用不同的分类器构建单个MR模型或者组合模型,
分析比较这些模型的预测结果,筛选出最优预测模型。
可选地,所述分类器包括LR、NaiveBayes、SVM、KNN、RF、ExtraTrees、XGBoost、LightGBM、GradientBoosting以及MLP。
本发明的第三方面,还涉及通过上述的构建方法构建获得的预测模型。
本发明的有益效果:
1.创新性的特征工程:本发明不仅包括传统的MRI图像特征,如形状、大小和位置,还融合了更深层次的影像组学特征,包括涵盖纹理、边缘和像素意义的特征。这些特征极大地丰富了数据,并有助于提高模型的预测性能。
2.集成学习模型的应用:本发明采用了集成学习模型,如随机森林或支持向量机等,而非单一的机器学习模型。集成模型通常具有更好的泛化能力和预测性能,通过结合多个弱学习器,可以有效地减少过拟合,并提高预测的准确性。
3.模型解释性的加强:通过引入解释性机器学习技术,比如SHAP(SHapleyAdditive exPlanations)或LIME(Local Interpretable Model-agnosticExplanations),本发明不仅关注模型的预测性能,还强调模型的解释性。这意味着我们能够理解每一个特征在模型预测中的贡献,这对于临床决策是非常重要的。
4.动态模型更新机制:本发明采取了动态模型更新机制。随着新的患者数据的不断积累,模型可以定期进行更新和优化,这样可以确保模型始终保持高效的预测性能。
附图说明
下面结合附图对本发明作进一步的说明。
图1为本申请实施例中的模型构建的工作流程图;
图2为提取的特征种类及样本分布;
图3为使用lasso回归进行特征筛选;
图4为分类器构建模型组的AUC值热图;
图5为MLP模型的ROC曲线和DCA曲线;
图6为综合MLP模型与放射科医师诊断比较的混肴矩阵;
图7为使用LIME理解5个实例在模型预测中的贡献。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
在本发明的实施例中,公开了一种脊髓内脱髓鞘假瘤病与肿瘤的预测模型构建方法与应用,大体工作流程如图1。
1.放射组学特征的提取
本实施例中,收集了2018年10月01日至2023年08月31日期间在东南大学附属中大医院就诊的髓内肿瘤和TDL患者的75例医疗影像数据,临床资料如表1。
表1. 75位患者临床资料
连续变量(年龄)的学生使用t检验分析,分类变量(性别)使用Pearson卡方检验分析。AST Astrocytoma(星形细胞瘤),EPN Ependymoma(室管膜瘤),MS Multiple Sclerosis(多发性硬化),NMO Neuromyelitis Optica(视神经谱系疾病).
从MRI扫描中提取出一组放射组学特征,这些特征可以用来描述脊髓内脱髓鞘假瘤病(TDLs)和肿瘤。包括以下步骤:
1)将原始图像的DICOM格式转化为软件可识别的NIfTI格式;
2)由于不同的扫描仪或采集协议,医疗体积经常表现出异质体素间距。此间距与图像中两个像素之间的物理间隔有关。空间归一化是用于减轻体素间距变异性影响的常用技术。在本实施例中,采用了固定分辨率重采样方法(确保来自不同扫描仪或不同扫描参数的图像具有统一的空间分辨率。这样可以确保提取的影像组学特征是可比较的,并且不会受到原始图像分辨率的影响)来解决上述挑战。所有图像均经过重新采样,将体素间距标准化为333毫米。
3)不同机器或扫描参数的影像强度可能会有所不同,为了避免这种差异对特征提取的影响,需要进行强度归一化。这一步使用Z-score标准化方法。
4)医学影像中通常会包含一些噪声,例如由于机器误差、生物体运动等引起的噪声。这些噪声可能会影响特征提取的结果,因此需要进行高斯滤波法进行噪声去除。
5)使用N4校正方法进行图像校正。
6)图像分割的目标是病变区域。当脊髓存在多个病变时,选择最大的病变作为感兴趣体积(volume of interest,VOI)。在PACS上,获取每个病例的轴向T1WI(T1加权图像)和T2WI(T2加权图像)的DICOM格式图像。利用3D Slicer软件(HTTP://https://www.slicer.org;版本5.0.3)
对感兴趣体积(VOI)进行手动分割。计算每个特征的组内相关系数(ICC),以评估观察者一致性和观察者内可靠性。观察者之间和观察者内部表现出ICC<0.75的特征被排除。
7)可以将提取的特征分为三个不同的组:(I)几何形状特征,(II)一阶特征和(III)纹理特征。肿瘤或者病变区域的三维形状特征由几何属性描述。强度的空间分布、包含图案以及二阶和高阶特征由纹理属性详细描述。在这种情况下,采用了多种方法来提取纹理属性,包括Gray LevelCo-occurrence Matrix(GLCM)Features灰度共生矩阵特征、Gray Level SizeZone Matrix(GLSZM)Features灰度级大小区域矩阵特征、Gray LevelRunLength Matrix(GLRLM)Features灰度游程矩阵(GLRLM)特征、Neighbouring Gray ToneDifference Matrix(NGTDM)Features相邻灰度差矩阵、Gray Level Dependence Matrix(GLDM)Features灰度依赖矩阵(GLDM)特征。总共导出了107个不同类别的影像组学特征,包括18个几何特征、14个一阶特征和75个纹理特征。使用Pyradiomics
(http://pyradiomics.readthedocs.io)实现的内部特征分析程序用于提取所有特征。特征分组及分布如图2。
2.机器学习模型的构建和训练
利用上述影像组学特征,构建一个机器学习模型进行训练。在模型训练过程中,本实施例中使用的训练数据包括已知诊断结果的TDLs和肿瘤的MRI数据。模型训练的目标是找到一种能够最好地利用影像组学特征来鉴别TDLs和肿瘤的方法。这个步骤的作用是生成一个能够准确预测TDLs和肿瘤的模型。包含以下步骤:
1)进行T检验统计检查,并对所有放射组学特征进行了特征筛选。仅保留p值小于0.05的放射组学特征。采用Pearson等级相关系数来计算特征之间的相关性,保留任何两个属性之间相关系数超过0.9的任何特征。
2)对于特征过滤,采用了递归消除方法,这需要在每次迭代期间删除当前集中冗余度最高的特征。随后,采用最小绝对收缩和选择算子(LASSO)进行多变量选择,如图3,选择最合适的λ值进而选择更有价值的特征子集来构建分类模型。
3)数据集以8:2的比例随机分布,将其分配给训练数据集或测试数据集。训练数据集包含模型训练的所有案例,而测试数据集用于对模型性能进行独立评估。
3.模型的验证和优化
使用多种模型及多种序列特征进行模型性能比较,通过对独立的测试数据集进行验证,评估模型的准确性、灵敏度、特异性等性能指标,进一步调整优化最终模型。包含以下步骤:
1)本实施例中,采用十个分类器(LR,Logistic Regression;NaiveBayes,NaiveBayes Classifier;SVM,Support Vector Machine;KNN:K Nearest NeighborsClassifier;RF,Random Forest Classifier;ExtraTrees,Extra Trees Classifier;XGBoost,eXtreme Gradient Boosting Classifier;LightGBM,Light Gradient BoostingMachine Classifier;GradientBoosting,Gradient Boosting Classifier;MLP,Multi-Layer Perceptron Classifier.)构建单个MR序列模型(T1WI/T2WI)或组合模型(T1WI和T2WI)。
2)随后,对这些模型进行了比较。为了评估这30个模型的预测性能,为训练和验证队列生成了ROC曲线。计算了ROC曲线下面积(AUC)、准确性、敏感性和特异性。如图4展现了构建的30种复合模型的AUC值。
3)综合比较,选择了组合T1WI和T2WI加权图像的MLP复合模型,图5展示了MLP模型的ROC曲线及DCA曲线。
4)放射科医生A拥有5年经验,放射科医生B拥有3年经验。两名放射科医生均不了解患者的诊断结果。在信息获取方面,放射科医生均知晓所有输入预测模型中的原始图像等信息,并有权利询问患者身体状况、症状等其他信息,也就是说,初始状态下放射科医生获得的信息不少于本实施例构建的预测模型。作为对比,本实施例中,选择采用MLP复合模型与放射科医生的模型进行比较。表2显示了两位放射科医生和放射组学模型的表现,图6显示了混淆矩阵。Delong检验结果表明,在训练集和完整队列中,放射组学模型显著优于放射科医生模型(P<0.05)。
表2.放射科医生和放射组学模型的诊断表现
4.治疗前诊断应用
最后,将优化后的模型应用于治疗前的脊髓内脱髓鞘假瘤病和肿瘤的鉴别诊断。这个步骤的作用是将模型转化为实际临床应用,帮助医生在治疗前得到更准确的诊断信息,从而做出更好的治疗决策。包含以下步骤:
1)首先,需要从医疗设备获取新的患者图像。这些图像为DICOM格式。包含T1WI(T1加权图像)和T2WI(T2加权图像)。
2)然后,对新的患者图像进行相同的预处理步骤。包括图像重采样、强度归一化、噪声去除、N4磁场校正。
3)接下来,从预处理过的图像中提取特征。这些和在训练模型时所使用的特征完全一致。
4)根据训练模型结果筛选特征。
5)将转换后的特征输入到模型中,得到模型的预测结果。这个结果是一个直接结果也可以使用概率值展示,表示患者属于脊髓内脱髓鞘假瘤病或肿瘤的可能性。
6)使用LIME进行模型特征解释,可以根据数据的适应情况调整特征权重,实例的LIME结果如图7。在图7中,LIME选择一个单个预测实例,然后在该实例周围生成一个模拟的数据集,以5个实例作为示范。这些模拟数据点根据它们与选定实例的相似度进行加权。然后,LIME训练一个简单的线性模型(比如线性回归或逻辑回归)来拟合这些模拟数据。最后,LIME将这个简单模型的权重解释为原本复杂模型的局部解释。每个特征的权重表示该特征对预测结果的重要性。
7)最终诊断系统通常需要结合患者的临床信息和医生的专业判断。例如,如果模型预测患者有脊髓内TDL的概率是80%,但患者的临床症状并不符合,那么医生应该选择进一步检查,而不是直接做出诊断。基于此,需要特别说明的是,本实施例中所述的诊断系统,仅仅是提供一种区别脊髓内肿瘤与TDL的参考或者说中间结果,其最终的诊断结果仍然需要专业人士的参与。
这些技术手段是本发明的关键部分,它们清晰地描述了如何从MRI数据中提取有用的放射组学特征,如何构建和训练一个机器学习模型,以及如何将这个模型应用于实际的临床诊断。通过这些技术手段,本发明能够提供一种新的、无创的、系统性的方法,用于提高脊髓内脱髓鞘假瘤病和肿瘤的鉴别诊断的准确性。
相较于现有技术,本发明的诊断系统结合了影像组学和机器学习技术,提供了一种新的、无创的、系统性的方法,用于提高脊髓内脱髓鞘假瘤病(Tumefactivedemyelinating lesions,TDLs)和肿瘤的鉴别诊断的准确性。以下是本发明的主要优点和技术效果:
1.无创性:本发明的方法只需要MRI数据,不需要进行手术或活检,因此是无创的。这显著降低了患者的身体损伤和手术风险。
2.高准确性:通过利用机器学习模型,本发明能够有效地利用多种放射组学特征来进行疾病鉴别。相比传统的影像学鉴别,这种方法能够提供更高的准确性。
3.快速性:一旦机器学习模型被训练和优化,它可以在短时间内对新的MRI数据进行鉴别。这比化学指标鉴别和病理学鉴别更快,可以为患者提供更快的诊断结果。
4.适用性广:由于本发明的方法只需要简单的MRI数据,因此它可以广泛地应用于各种医疗设备和病例中,无论是新型机器还是传统机器。
(一)预测模型的实验方法
1.数据收集
首先,收集一系列的MRI数据,包括脊髓内TDLs和肿瘤的数据。这些数据可以从多个医疗中心收集,以增加数据的多样性。所有的MRI图像都需要进行预处理,包括去噪,标准化和配准等步骤。
2.特征提取
对于每个MRI图像,通过勾画病变的VOI(Volume of Interest)提取一系列的影像组学特征。这些特征包括形状、大小、位置等传统特征,以及纹理、边缘、区域等深层特征。这些特征可以通过现有的图像处理软件或者自定义的算法进行提取。
3.模型训练和验证
然后,使用收集到的特征和对应的疾病标签(TDLs或肿瘤)来训练我们的集成学习模型。可以使用交叉验证的方法来评估模型的性能,并选择最好的模型参数。
4.模型测试和优化
最后,我们需要在一个独立的测试集上测试模型的性能。如果性能满意,我们就可以使用这个模型进行实际的临床诊断。否则,我们需要回到模型训练和验证的步骤,进行模型的优化。
5.数据解释
在实验结束后,可以收集一系列的数据,包括模型的准确性、灵敏度、特异性等性能指标。我们还可以收集模型的解释性数据,比如每个特征的LIME值。通过对这些数据的分析,我们可以理解模型的预测能力,以及每个特征在预测中的贡献。这些数据可以用来支持本发明的技术方案,证明其在鉴别TDLs和肿瘤方面的优越性。另一方面,通过直观看出每个特征的贡献,也能够为医生的诊断提供参考。
6.治疗前诊断应用
最后,我们将优化后的模型应用于治疗前的脊髓内脱髓鞘假瘤病和脊髓内肿瘤的鉴别诊断。这个步骤的作用是将我们的发明转化为实际临床应用,帮助医生在治疗前得到更准确的诊断信息,从而做出更好的治疗决策。
(二)实施实例
1.数据准备和预处理
1)已收集2018年10月01日至2023年08月31日期间在东南大学附属中大医院就诊的髓内肿瘤和TDL患者的75例医疗影像数据。
2)将这些患者的MRI扫描的DICOM图像格式转换为NIfTI格式。
3)使用固定分辨率重采样方法进行空间归一化,以减轻体素间距异质性的影响。
4)对MRI图像进行强度归一化,以消除不同扫描参数或机器引发的强度差异。
5)对MRI图像进行噪声去除,以消除可能影响特征提取的噪声。
6)对MRI图像进行N4校正。
7)对感兴趣体积(VOI)进行分割,特别是当存在多个病变时,选择最大的病变作为VOI。
2.放射组学特征提取
1)使用pyradiomics包提取放射组学特征,包括几何形状特征、一阶特征和纹理特征。
3.特征筛选和机器学习模型构建
1)进行T检验统计检查,删除p值大于0.05的特征。
2)计算特征之间的相关性,保留任何两个属性之间相关系数超过0.9的任何特征。
3)使用递归消除方法进行特征过滤,然后使用LASSO进行多变量选择。
4)划分数据集,比如以8:2的比例分配给训练数据集和测试数据集。
5)根据筛选后的特征构建和训练机器学习模型。
4.模型验证和优化
1)使用十个分类器(LR,Logistic Regression;NaiveBayes,Naive BayesClassifier;SVM,Support Vector Machine;KNN:K Nearest Neighbors Classifier;RF,Random Forest Classifier;ExtraTrees,Extra Trees Classifier;XGBoost,eXtremeGradient Boosting Classifier;LightGBM,Light Gradient Boosting MachineClassifier;GradientBoosting,Gradient Boosting Classifier;MLP,Multi-LayerPerceptron Classifier.)构建了模型。
2)对不同模型的预测性能进行比较,通过生成ROC曲线,计算AUC、准确性、敏感性和特异性。
3)根据比较结果,选择最优模型。根据此次数据集选用了复合T1&T2WI序列的MLP模型。
5.模型特征解释
1)使用LIME(局部可解释的模型阐释)来解释模型预测。LIME能够为每个预测提供一组权重,说明每个特征对预测结果的贡献程度。
2)通过分析LIME提供的特征权重,进一步理解模型的工作机制和决策过程。
使用LIME的意义在于:它能提供模型的透明度,帮助我们理解模型的预测行为。
6.辅助诊断
医生可以结合自己的专业知识和模型的预测结果,来做出最后的诊断。这个机器学习模型的优越性在于:
非侵入性:尽管临床上存在诊断金标准,但这些标准常常需要通过有创的方式,如切片或活检等来获取病理结果。这对于症状较轻或担心手术风险的患者来说,可能是一个重大的障碍。而我们的模型只需要使用MRI图像即可进行预测,大大减少了对患者的身体负担。
高效性:本发明的预测模型可以在几分钟内完成预测,大大提高了诊断的效率。
早期预警:在金标准诊断结果出来之前,我们的模型可以提供早期的预警信息,帮助医生提前制定治疗方案,提高患者的治疗质量。
解释性:本发明的预测模型不仅能做出预测,还能解释每个特性在预测中的作用,提供更多的诊断信息,帮助医生理解病情的复杂性。
精确性:我们的模型经过大量的数据训练,其预测精度可能与金标准诊断相当,并不逊于年轻放射科医生。
人文关怀:通过提供更快的预测结果,我们的模型可以减少患者等待诊断结果的焦虑和不确定性。此外,早期预警和个性化的预测结果也能让患者感到更被关注和理解,提高他们的就医体验,从而达到人文关怀的目的。
因此,尽管存在诊断金标准,本发明的机器学习模型仍然可以在临床诊断中发挥重要的辅助作用,提高诊断的效率和精度,提供更多的诊断信息,减少对患者的身体负担,以及提供更好的患者关怀。
本实施例提供的诊断预测模型在实践中显示出了优秀的诊疗效果。更为重要的是,本实施例的方法在辅助诊断效果上明显优于初级放射科医生的结果。这意味着,通过应用本实施例的预测模型,能够提高诊断的准确性和效率,缓解神经科的诊疗困境,有利于提升患者的治疗效果和生活质量。
总的来说,本发明的技术方案填补了领域内的研究空白,解决了存在的诊疗困境,并在实践中显示出了显著的优势。我们期待该研究能够进一步推动该领域的发展,并为神经科的诊疗工作带来实质性的改善。
在本说明书的描述中,参考术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。
Claims (9)
1.一种脊髓内脱髓鞘假瘤病与肿瘤的诊断系统,其特征在于,包括:
MRI扫描模块,用于获取患者目标区域的医学影像:
图像分割模块,用于获取所述的MRI扫描模块中的医学影像,并对所述医学影像进行预处理与分割;
特征提取模块,用于从图像分割模块处理后的医学影像中提取特征;
模型预测模块,用于接收所提取的特征,进行预测。
2.根据权利要求1所述的基于预测模型的脊髓内脱髓鞘假瘤病与肿瘤的诊断系统,其特征在于,还包括模型解释模块,用于预测特征对于结果预测的贡献。
3.根据权利要求1所述的基于预测模型的脊髓内脱髓鞘假瘤病与肿瘤的诊断系统,其特征在于,所述特征包括形状、大小、位置、纹理、边缘以及区域。
4.根据权利要求1所述的基于预测模型的脊髓内脱髓鞘假瘤病与肿瘤的诊断系统,其特征在于,所述特征提取模块所提取的特征包括:一阶特征、形状特征和纹理特征。
5.根据权利要求1所述的基于预测模型的脊髓内脱髓鞘假瘤病与肿瘤的诊断系统,其特征在于,所述预处理包括医学影像强度归一化、格式转换、固定分辨率重采样、N4磁场校正以及噪声去除。
6.根据权利要求1所述的基于预测模型的脊髓内脱髓鞘假瘤病与肿瘤的诊断系统,其特征在于,所述模型预测模块配置为T1WI和T2WI加权图像的MLP复合模型。
7.一种预测模型的构建方法,包括以下步骤:
进行特征过滤,在每次迭代期间删除当前集中冗余度最高的特征;采用最小绝对收缩和选择算子进行多变量选择;
将数据集中的数据随机分配训练数据集与测试数据集;
使用不同的分类器构建单个MR模型或者复合MR模型,
分析比较这些模型的预测结果,筛选出最优预测模型。
8.根据权利要求7所述的构建方法,其特征在于,所述分类器包括LR、NaiveBayes、SVM、KNN、RF、ExtraTrees、XGBoost、LightGBM、GradientBoosting以及MLP。
9.通过权利要求7或8所述的构建方法构建获得的预测模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311721972.5A CN117689666A (zh) | 2023-12-14 | 2023-12-14 | 基于预测模型的脊髓内脱髓鞘假瘤病与肿瘤的诊断系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311721972.5A CN117689666A (zh) | 2023-12-14 | 2023-12-14 | 基于预测模型的脊髓内脱髓鞘假瘤病与肿瘤的诊断系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117689666A true CN117689666A (zh) | 2024-03-12 |
Family
ID=90128126
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311721972.5A Pending CN117689666A (zh) | 2023-12-14 | 2023-12-14 | 基于预测模型的脊髓内脱髓鞘假瘤病与肿瘤的诊断系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117689666A (zh) |
-
2023
- 2023-12-14 CN CN202311721972.5A patent/CN117689666A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7069359B2 (ja) | 深層学習を使用して癌検出を改善するための方法およびシステム | |
Si et al. | Fully end-to-end deep-learning-based diagnosis of pancreatic tumors | |
Yousef et al. | A holistic overview of deep learning approach in medical imaging | |
CN107133638B (zh) | 基于两分类器的多参数mri前列腺癌cad方法及系统 | |
CN115131642B (zh) | 一种基于多视子空间聚类的多模态医学数据融合系统 | |
Hussain et al. | Deep learning-based diagnosis of disc degenerative diseases using MRI: a comprehensive review | |
Bashir-Gonbadi et al. | Brain tumor classification using deep convolutional autoencoder-based neural network: Multi-task approach | |
Li et al. | A novel radiogenomics framework for genomic and image feature correlation using deep learning | |
Azour et al. | Design guidelines for mammogram-based computer-aided systems using deep learning techniques | |
CN116504406A (zh) | 基于影像组合病理的肺癌术后风险模型构建方法和系统 | |
URAL | Computer aided deep learning based assessment of stroke from brain radiological ct images | |
Sekhar et al. | Efficient Alzheimer’s disease detection using deep learning technique | |
Rajive Gandhi et al. | A contrast adaptive histogram equalization with neural learning quantization (CAHE-NLQ) for blood clot detection in brain | |
CN117689666A (zh) | 基于预测模型的脊髓内脱髓鞘假瘤病与肿瘤的诊断系统 | |
Mousavi Moghaddam et al. | Lung parenchyma segmentation from CT images with a fully automatic method | |
CN113889235A (zh) | 一种三维医学影像无监督特征抽取系统 | |
Amini et al. | Application of machine learning methods in diagnosis of alzheimer disease based on fractal feature extraction and convolutional neural network | |
Ruikar et al. | DNN-based knee OA severity prediction system: pathologically robust feature engineering approach | |
Emirzade | A computer aided diagnosis system for lung cancer detection using SVM | |
Reddy et al. | Different Algorithms for Lung Cancer Detection and Prediction | |
Wibisono et al. | Segmentation-based knowledge extraction from chest X-ray images | |
Dawood et al. | Brain Tumors Detection using Computed Tomography Scans Based on Deep Neural Networks | |
Tamrakar et al. | Brain Tumor Detection Based on Watershed Segmentation and Classification Using Deep Learning | |
AU2021101306A4 (en) | A system and method for preserving disease-evidence-information to support the automated disease detection | |
CN116487038B (zh) | 轻度认知障碍向阿尔茨海默发展的预测系统和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |