CN114520052A

CN114520052A - 一种基于多模态融合的胰腺癌早期诊断方法与系统

Info

Publication number: CN114520052A
Application number: CN202210123985.1A
Authority: CN
Inventors: 王楷林; 冯瑞
Original assignee: Fudan University
Current assignee: Fudan University
Priority date: 2022-02-10
Filing date: 2022-02-10
Publication date: 2022-05-20

Abstract

本发明公开了一种基于多模态融合的胰腺癌早期诊断方法，具有这样的特征，包括以下步骤：步骤1，对病人的血检数据和影像数据进行预处理，获得血检数据特征和影像特征；步骤2，将影像特征和对应的血检数据特征融合，以双模态融合的结果作为数据集训练分类模型，得到多模态胰腺癌早期诊断模型；步骤3，根据病人的血检和影像结果，采用多模态胰腺癌早期诊断模型进行诊断工作。本发明诊断方法可用于胰腺癌高危人群的早期诊断，早期诊断模型的准确率达到了82.21％，大大提升早期胰腺癌诊断准确率，实现胰腺癌患者的早诊早治，提高生存率。本发明还公开了一种基于多模态融合的胰腺癌早期诊断系统，包括预处理部和诊断部。

Description

一种基于多模态融合的胰腺癌早期诊断方法与系统

技术领域

本发明涉及计算机视觉领域以及医学领域，具体涉及一种基于多模态融合的胰腺癌早期诊断方法与系统。

背景技术

胰腺癌是实体肿瘤中恶性程度和致死率最高的肿瘤之一，被称为“癌中之王”。中国国家癌症中心的最新统计数据也证实，胰腺癌在中国城市的男性恶性肿瘤发病率中排名第八，在大城市(北京和上海)的恶性肿瘤死亡率中排名第六。胰腺癌五年生存率仅为6％。2018年全球内有近45万胰腺癌新发病例，死亡超过43万例，预计2030年，胰腺癌将成为全球癌症死亡的第二大原因。其高死亡率归因于早期症状不明显、缺乏有效的诊断方法、病程进展迅速等。虽然近年来研究者为改善胰腺癌患者的预后做出了很多努力，如研究胰腺癌发生发展的机制、探索各种早期诊断，但其高死亡率并未得到明显改善。不断上升的发病率和持续的低生存率凸显了确定高风险患者筛查方法的必要性。

胰腺癌的早期诊断是降低其高死亡率的最佳途径之一，对胰腺癌发病风险较高的个体进行早期诊断才具有成本效益。

将从血液、尿液、唾液、粪便或胰液中获得的生物标志物作为胰腺癌早期诊断的非侵入性分子标志物，以辅助筛查、早期诊断和治疗胰腺癌，一直是一个值得深入研究的领域。目前糖类抗原19-9(CA19-9)是使用最为广泛的早期检测生物标志物。

胰腺癌早期诊断一直是一个重大挑战。胰腺癌的诊断主要依赖于影像学检查，计算机断层扫描(computed tomography，CT)和磁共振成像(Magnetic Resonance Imaging，MRI)是最常用的影像学技术。可以用于判断胰腺癌的癌变部位以及癌变性质、病变分期等。影像学检查，作为一种无创性的诊断方法，通过显示病变的形态,大小及强化状态，帮助医生做出临床诊断。另外，肿瘤治疗反应标准(response evaluation criteria in solidtumors，RECIST)也根据病变体积变化，来评估胰腺癌的治疗疗效。

影像学在胰腺癌的诊断、术前评估、疗效评估及预后预测等方面发挥了重要作用。随着人工智能和医学影像技术的发展，胰腺癌的早期诊断水平随着研究的深入不断得到提升，有望在将来真正应用于临床实践。

发明内容

本发明是为了解决上述问题而进行的，目的在于提供一种基于多模态融合的胰腺癌早期诊断方法与系统。

本发明提供了一种基于多模态融合的胰腺癌早期诊断方法，具有这样的特征，包括以下步骤：步骤1，对病人的血检数据和影像数据进行预处理，获得血检数据特征和影像特征；步骤2，将影像特征和对应的血检数据特征融合，以双模态融合的结果作为数据集训练分类模型，得到多模态胰腺癌早期诊断模型；步骤3，根据病人的血检和影像结果，采用多模态胰腺癌早期诊断模型进行诊断工作。

在本发明提供的基于多模态融合的胰腺癌早期诊断方法中，还可以具有这样的特征：其中，步骤1包括以下步骤：步骤1-1，对血检数据和影像数据进行数据清洗，去掉过于多缺实值的数据；步骤1-2，通过ResNet-50提取每位患者的影像特征；步骤1-3，通过OneHotEncoder提取患者的血检数据特征；步骤1-4，通过PCA对影像特征进行降维处理；步骤1-5，将影像特征与患者对应的血检数据特征进行拼接融合处理。

在本发明提供的基于多模态融合的胰腺癌早期诊断方法中，还可以具有这样的特征：其中，步骤1-1中，数据清洗时，由于病人的血检数据和影像数据存在缺失的问题，故将缺失值大于50％的数据去掉，其他缺失值采用众数填充。

在本发明提供的基于多模态融合的胰腺癌早期诊断方法中，还可以具有这样的特征：其中，步骤1-3中，通过OneHot Encoder提取患者的血检数据特征时，为避免多重共线性，故需要删除每列编码后第一列。

本发明提供了一种基于多模态融合的胰腺癌早期诊断系统，具有这样的特征，包括：预处理部，对病人的血检数据和影像数据进行预处理，获得血检数据特征和影像特征；诊断部，将影像特征和对应的血检数据特征融合，以双模态融合的结果作为数据集训练分类模型，得到多模态胰腺癌早期诊断模型，根据病人的血检和影像结果，采用多模态胰腺癌早期诊断模型进行诊断工作。

发明的作用与效果

根据本发明所涉及的基于多模态融合的胰腺癌早期诊断方法，因为诊断步骤为：步骤1，对病人的血检数据和影像数据进行预处理，获得血检数据特征和影像特征；步骤2，将影像特征和对应的血检数据特征融合，以双模态融合的结果作为数据集训练分类模型，得到多模态胰腺癌早期诊断模型；步骤3，根据病人的血检和影像结果，采用多模态胰腺癌早期诊断模型进行诊断工作。

因此，本发明提出的一种基于多模态融合的胰腺癌早期诊断方法，可用于胰腺癌高危人群的早期诊断，基于多模态融合的胰腺癌早期诊断模型的准确率达到了82.21％，大大提升早期胰腺癌诊断准确率，实现胰腺癌患者的早诊早治，提高生存率。同时减少了医生的工作量，在医生的诊断过程中起到了参考作用。

附图说明

图1是本发明实施例中胰腺癌早期诊断过程的流程图；

图2是本发明实施例中预处理步骤的流程图；以及

图3是本发明实施例中多模态融合部分的结构示意图。

具体实施方式

为了使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解，以下实施例结合附图对本发明一种基于多模态融合的胰腺癌早期诊断方法与系统作具体阐述。

在本实施例中，提供了一种基于多模态融合的胰腺癌早期诊断方法。

本实施例所涉及的基于多模态融合的胰腺癌早期诊断方法适用于胰腺癌高危人群的早期诊断，大大提升早期胰腺癌诊断准确率，实现胰腺癌患者的早诊早治，提高生存率。

本实施例实现的平台，操作系统为ubuntu16.04，使用Python 3.7语言实现，神经网络框架使用pytorch 1.3版本，CUDA版本为10.0，计算加速单元使用NVIDIA 1080Ti GPU。

本实施例中，采用的数据集来自12000名病人的血检报告结果和对应的腹部CT影像，包括训练集和测试集。

图1是本发明实施例中胰腺癌早期诊断过程的流程图。

如图1所示，本实施例所涉及的基于多模态融合的胰腺癌早期诊断方法包括如下步骤：

步骤S1，对病人的血检数据和影像数据进行预处理，获得血检数据特征和影像特征。

图2是本发明实施例中预处理步骤的流程图。

如图2所示，步骤S1包括以下步骤：

步骤S1-1，对血检数据和影像数据进行数据清洗，去掉过于多缺实值的数据。

数据清洗时，由于病人的血检数据和影像数据存在缺失的问题，故将缺失值大于50％的数据去掉，其他缺失值采用众数填充。

步骤S1-2，通过ResNet-50提取每位患者的胰腺影像特征。

在众多提取特征的CNN模型中，ResNet-50网络的性能优异，能够很好地提高后续分类模型的学习能力，所以本实施例中采用ResNet-50网络依次提取数据集每位患者的CT影像特征。

步骤S1-3，通过OneHot Encoder提取患者的血检数据特征。

通过OneHot Encoder提取患者的血检数据特征时，为避免多重共线性，故需要删除每列编码后第一列。

步骤S1-4，通过PCA对影像特征进行降维处理。

由于影像特征维度过高，可以利用PCA对该特征进行降维，PCA可以在保证主要特征信息不变的情况下降低特征维度，继而使得后续分类模型的处理速度有所提升，同时能够降低资源的占用。

步骤S1-5，将影像特征与患者对应的血检数据特征进行拼接融合处理。

图3是本发明实施例中多模态融合部分的结构示意图。

如图3所示，步骤S2，将影像特征和对应的血检数据特征融合，以双模态融合的结果作为数据集训练分类模型，得到多模态胰腺癌早期诊断模型。

步骤S3，根据病人的血检和影像结果，采用多模态胰腺癌早期诊断模型进行诊断工作。

在本实施例中，还提供了一种基于多模态融合的胰腺癌早期诊断系统，包括：

预处理部，利用本实施例中步骤S1的方法对病人的血检数据和影像数据进行预处理。

诊断部，利用本实施例中步骤S2～步骤S3的方法进行诊断工作。

实施例的作用与效果

根据本实施例所涉及的基于多模态融合的胰腺癌早期诊断方法，因为诊断步骤为：步骤1，对病人的血检数据和影像数据进行预处理，获得血检数据特征和影像特征；步骤2，将影像特征和对应的血检数据特征融合，以双模态融合的结果作为数据集训练分类模型，得到多模态胰腺癌早期诊断模型；步骤3，根据病人的血检和影像结果，采用多模态胰腺癌早期诊断模型进行诊断工作。

因此，上述实施例提出的基于多模态融合的胰腺癌早期诊断方法，可用于胰腺癌高危人群的早期诊断，基于多模态融合的胰腺癌早期诊断模型的准确率达到了82.21％，大大提升早期胰腺癌诊断准确率，实现胰腺癌患者的早诊早治，提高生存率。同时减少了医生的工作量，在医生的诊断过程中起到了参考作用。

此外，本实施例中采用的ResNet-50网络性能优异，能够很好地提高后续分类模型的学习能力。

此外，本实施例中利用PCA对该特征进行降维，PCA可以在保证主要特征信息不变的情况下降低特征维度，继而使得后续分类模型的处理速度有所提升，同时能够降低资源的占用。

上述实施方式为本发明的优选案例，并不用来限制本发明的保护范围。

Claims

1.一种基于多模态融合的胰腺癌早期诊断方法，其特征在于，包括以下步骤：

步骤1，对病人的血检数据和影像数据进行预处理，获得血检数据特征和影像特征；

步骤2，将所述影像特征和对应的所述血检数据特征融合，以双模态融合的结果作为数据集训练分类模型，得到多模态胰腺癌早期诊断模型；

步骤3，根据病人的血检和影像结果，采用所述多模态胰腺癌早期诊断模型进行诊断工作。

2.根据权利要求1所述的一种基于多模态融合的胰腺癌早期诊断方法，其特征在于：

其中，步骤1包括以下步骤：

步骤1-1，对所述血检数据和所述影像数据进行数据清洗，去掉过于多缺实值的数据；

步骤1-2，通过ResNet-50提取每位患者的所述影像特征；

步骤1-3，通过OneHot Encoder提取患者的所述血检数据特征；

步骤1-4，通过PCA对所述影像特征进行降维处理；

步骤1-5，将所述影像特征与患者对应的所述血检数据特征进行拼接融合处理。

3.根据权利要求2所述的一种基于多模态融合的胰腺癌早期诊断方法，其特征在于：

其中，步骤1-1中，所述数据清洗时，由于病人的所述血检数据和所述影像数据存在缺失的问题，故将缺失值大于50％的数据去掉，其他缺失值采用众数填充。

4.根据权利要求2所述的一种基于多模态融合的胰腺癌早期诊断方法，其特征在于：

其中，步骤1-3中，通过所述OneHot Encoder提取患者的所述血检数据特征时，为避免多重共线性，故需要删除每列编码后第一列。

5.一种基于多模态融合的胰腺癌早期诊断系统，其特征在于，包括：

预处理部，对病人的血检数据和影像数据进行预处理，获得血检数据特征和影像特征；

诊断部，将所述影像特征和对应的所述血检数据特征融合，以双模态融合的结果作为数据集训练分类模型，得到多模态胰腺癌早期诊断模型，根据病人的血检和影像结果，采用所述多模态胰腺癌早期诊断模型进行诊断工作。