CN114462522A - 肺癌生存期预测模型训练、预测方法、系统、装置及介质 - Google Patents
肺癌生存期预测模型训练、预测方法、系统、装置及介质 Download PDFInfo
- Publication number
- CN114462522A CN114462522A CN202210091362.0A CN202210091362A CN114462522A CN 114462522 A CN114462522 A CN 114462522A CN 202210091362 A CN202210091362 A CN 202210091362A CN 114462522 A CN114462522 A CN 114462522A
- Authority
- CN
- China
- Prior art keywords
- lung cancer
- prediction model
- data
- training
- lung
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 208000020816 lung neoplasm Diseases 0.000 title claims abstract description 172
- 206010058467 Lung neoplasm malignant Diseases 0.000 title claims abstract description 169
- 201000005202 lung cancer Diseases 0.000 title claims abstract description 169
- 238000012549 training Methods 0.000 title claims abstract description 110
- 238000000034 method Methods 0.000 title claims abstract description 86
- 230000004083 survival effect Effects 0.000 claims abstract description 77
- 238000004393 prognosis Methods 0.000 claims abstract description 48
- 210000004072 lung Anatomy 0.000 claims abstract description 38
- 238000007781 pre-processing Methods 0.000 claims abstract description 16
- 238000012216 screening Methods 0.000 claims abstract description 12
- 230000006870 function Effects 0.000 claims description 34
- 238000000605 extraction Methods 0.000 claims description 29
- 210000002569 neuron Anatomy 0.000 claims description 14
- 239000013598 vector Substances 0.000 claims description 13
- 230000004927 fusion Effects 0.000 claims description 12
- 238000013527 convolutional neural network Methods 0.000 claims description 8
- 230000004913 activation Effects 0.000 claims description 5
- 239000003814 drug Substances 0.000 abstract description 10
- 238000005516 engineering process Methods 0.000 description 7
- 238000012360 testing method Methods 0.000 description 6
- 230000009286 beneficial effect Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 208000037841 lung tumor Diseases 0.000 description 3
- 230000007170 pathology Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000002560 therapeutic procedure Methods 0.000 description 3
- 206010028980 Neoplasm Diseases 0.000 description 2
- 238000002679 ablation Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000002512 chemotherapy Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000001575 pathological effect Effects 0.000 description 2
- 238000001959 radiotherapy Methods 0.000 description 2
- 208000009956 adenocarcinoma Diseases 0.000 description 1
- CFQGDIWRTHFZMQ-UHFFFAOYSA-N argon helium Chemical compound [He].[Ar] CFQGDIWRTHFZMQ-UHFFFAOYSA-N 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 206010041823 squamous cell carcinoma Diseases 0.000 description 1
- 208000011580 syndromic disease Diseases 0.000 description 1
- 230000009885 systemic effect Effects 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
- 230000007723 transport mechanism Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Public Health (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biophysics (AREA)
- Computing Systems (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Databases & Information Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Pathology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- Apparatus For Radiation Diagnosis (AREA)
- Measuring And Recording Apparatus For Diagnosis (AREA)
Abstract
本发明公开一种肺癌生存期预测模型训练、预测方法、系统、装置及介质,涉及计算机辅助医学技术领域。其中,肺癌生存期预测模型训练方法包括以下步骤:获取多个患者的肺癌数据,其中,所述肺癌数据包括患者治疗前的肺部CT影像、临床治疗信息和患者的预后生存期标签;根据绿色治疗方法的条件对多个所述肺癌数据进行筛选和预处理得到多个初始化肺癌数据;保存多个所述初始化肺癌数据得到训练数据集;初始化肺癌生存期预测模型的参数;将所述训练数据集输入到初始化后的肺癌生存期预测模型中进行训练,得到训练好的肺癌生存期预测模型。本申请能够对肺癌患者的预后生存期进行预测,从而提供治疗指导。
Description
技术领域
本发明涉及计算机辅助医学技术领域,尤其涉及一种肺癌生存期预测模型训练、预测方法、系统、装置及介质。
背景技术
肺癌影响着越来越多人的身体健康,随着科学的进步和医疗技术的发展,对于肺癌临床上治疗方法却也日趋成熟和多样化。传统的肺癌治疗方法有手术、放疗、化疗等,随着医学技术的发展,出现一系列新的肺癌治疗方法,例如,2002年后,基于中医“寒热”理论,将微创冷冻消融技术纳入现代中医肿瘤治疗体系,提高中医肿瘤治疗体系的局部攻邪能力,发展出“中药+冷消融”的新型中医方法,即绿色治疗方法,能在一定程度上延长患者的生存期,近十余年得到广泛应用。
但是,目前对于绿色治疗方法的治疗效果缺少有效的分析方法,而导致缺少对肺癌患者的治疗指导,延缓了肺癌治疗技术的发展。
发明内容
本发明旨在至少解决现有技术中存在的技术问题之一。为此,本发明提出一种肺癌生存期预测模型训练、预测方法、系统、装置及介质,能够对肺癌患者的预后生存期进行预测,从而提供治疗指导。
一方面,本发明实施例提供了一种肺癌生存期预测模型训练方法,包括以下步骤:
获取多个患者的肺癌数据,其中,所述肺癌数据包括患者治疗前的肺部CT影像、临床治疗信息和患者的预后生存期标签;
根据绿色治疗方法的条件对多个所述肺癌数据进行筛选和预处理得到多个初始化肺癌数据;
保存多个所述初始化肺癌数据得到训练数据集;
初始化肺癌生存期预测模型的参数;
将所述训练数据集输入到初始化后的肺癌生存期预测模型中进行训练,得到训练好的肺癌生存期预测模型。
根据本发明一些实施例,所述根据绿色治疗方法对多个所述肺癌数据进行筛选和预处理得到多个初始化肺癌数据包括以下步骤:
提取出所述肺癌数据中的临床治疗信息;
对所述临床治疗信息进行语义识别,确定所述肺癌数据的治疗方法;
筛选出治疗方法为绿色治疗方法的肺癌数据得到多个待处理数据;
对多个所述待处理数据进行预处理得到多个初始化肺癌数据。
根据本发明一些实施例,所述对多个所述待处理数据进行预处理得到多个初始化肺癌数据包括以下步骤:
根据预设的像素规格对所述待处理数据中的所述肺部CT影像进行归一化处理,并以数组的形式进行保存得到所述肺部CT影像数据组;
对所述待处理数据中的所述临床治疗信息进行独热编码得到临床治疗信息向量;
保存所述CT影像数据组和所述临床治疗信息向量得到所述初始化肺癌数据。
根据本发明一些实施例,所述肺癌生存期预测模型包括影像特征提取模块、临床特征提取模块和特征融合模块,所述参数包括影像特征提取模块的第一参数、临床特征提取模块的第二参数和特征融合模块的第三参数,所述将所述训练数据集输入到初始化后的肺癌生存期预测模型中进行训练包括以下步骤:
将所述训练数据集的所述肺部CT影像数据组输入到所述影像特征提取模块,得到第一预测预后时间;
将所述训练数据集的所述临床治疗信息向量输入到所述临床特征提取模块,得到第二预测预后时间;
将所述第一预测预后时间和所述第二预测预后时间输入到所述特征融合模块,得到预后生存期预测结果;
根据所述预后生存期预测结果和所述预后生存期标签确定损失值;
根据损失值对所述第一参数、第二参数和第三参数进行更新。
根据本发明一些实施例,所述影像特征提取模块采用导入有EfficientNet权重的卷积神经网络搭建,所述卷积神经网络的输出层由一个神经元组成,所述神经元用于输出所述第一预测预后时间。
根据本发明一些实施例,所述临床特征提取模块采用两层全连接的隐藏层和一层输出层的网络搭建,所述隐藏层包括多个神经元,所述隐藏层采用Relu激活函数,所述输出层由一个神经元组成,所述神经元用于输出所述第二预测预后时间。
另一方面,本发明实施例还提供一种肺癌生存期预测方法,包括以下步骤:
获取待预测患者治疗前的肺部CT影像;
获取待预测患者的临床治疗信息,其中,所述临床治疗信息包括采用绿色治疗方法的治疗方案;
对所述肺部CT影像和所述临床治疗信息进行预处理后输入到如前面实施例所述的肺癌生存期预测模型中,得到患者的预后生存期。
另一方面,本发明实施例还提供一种肺癌生存期预测模型训练系统,包括:
第一模块,用于获取多个患者的肺癌数据,其中,所述肺癌数据包括患者治疗前的肺部CT影像、临床治疗信息和患者的预后生存期标签;
第二模块,用于根据绿色治疗方法的条件对多个所述肺癌数据进行筛选和预处理得到多个初始化肺癌数据;
第三模块,用于保存多个所述初始化肺癌数据得到训练数据集;
第四模块,用于初始化肺癌生存期预测模型的参数;
第五模块,用于将所述训练数据集输入到初始化后的肺癌生存期预测模型中进行训练,得到训练好的肺癌生存期预测模型。
另一方面,本发明实施例还提供一种肺癌生存期预测模型训练装置,包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当所述至少一个程序被所述至少一个处理器执行,使得至少一个所述处理器实现如前面所述的肺癌生存期预测模型训练方法。
另一方面,本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如前面所述的肺癌生存期预测模型训练方法或者实现如前面实施例所述的肺癌生存期预测方法。
本发明上述的技术方案至少具有如下优点或有益效果之一:获取多个患者的肺癌数据,其中,每个肺癌数据包括患者治疗前的肺部CT影像、临床治疗信息和患者的预后生存期标签,然后根据绿色治疗方法的条件对多个肺癌数据进行筛选和预处理得到多个初始化肺癌数据,保存多个初始化肺癌数据得到训练数据集,初始化肺癌生存期预测模型的参数,将训练数据集输入到初始化后的肺癌生存期预测模型中进行训练,得到训练好的肺癌生存期预测模型。基于患者治疗前的CT影像、临床治疗信息和预后生存期标签,训练得到关于绿色治疗方法的生存期预测模型,使用该生存期预测模型,能够预测采用绿色治疗方法的患者的预后生存期,从而为患者提供治疗指导。
附图说明
图1是本发明实施例提供的一种肺癌生存期预测模型训练方法流程图;
图2是本发明实施例提供的一种肺癌生存期预测方法流程图;
图3是本发明实施例提供的一种肺癌生存期预测模型训练系统示意图;
图4是本发明实施例提供的一种肺癌生存期预测模型的训练装置示意图;
图5是本发明实施提供的患者数量与总生存期的关系对比图;
图6是本发明实施例提供的训练次数与平均预测误差的关系对比图;
图7为本发明实施例提供的训练次数与损失函数值的关系对比图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或者类似的标号表示相同或者类似的原件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
在本发明的描述中,需要理解的是,涉及到方位描述,例如上、下、左、右等指示的方位或者位置关系为基于附图所示的方位或者位置关系,仅是为了便于描述本发明和简化描述,而不是指示或者暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
本发明的描述中,如果有描述到第一、第二等只是用于区分技术特征为目的,而不能理解为指示或者暗示相对重要性或者隐含指明所指示的技术特征的数量或者隐含指明所指示的技术特征的先后关系。
本申请实施例中提供一种肺癌生存期预测模型训练方法,本申请实施例中的肺癌生存期预测模型训练方法,可应用于终端中,也可应用于服务器中,还可以是运行于终端或服务器中的软件等。终端可以是平板电脑、笔记本电脑、台式计算机等,但并不局限于此。服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。参照图1,该方法主要包括以下步骤:
步骤S110,获取多个患者的肺癌数据,其中,肺癌数据包括患者治疗前的肺部CT影像、临床治疗信息和患者的预后生存期标签;
在一些实施例中,可以接入多个医院的诊断系统,批量获取不同患者的肺癌数据,从医院获取的肺癌数据包括患者治疗前两周内的肺部CT影像、临床治疗信息和预后生存期标签。对于没有预后生存期标签的肺癌数据,可以通过电话咨询或者走访患者的方式,进一步完善肺癌数据中的预后生存期标签。
进一步地,临床治疗信息可以包括病理类型、肺部肿瘤TNM分期和治疗方案,示例性地,病理类型有鳞癌、腺癌等,治疗方案有氩氦刀冷消融术、中医辨证全身治疗等,肺部肿瘤TNM分期有I期,II期,III期,IV期等。
步骤S120,根据绿色治疗方法的条件对多个肺癌数据进行筛选和预处理得到多个初始化肺癌数据;
具体地,对获取到肺癌数据中的临床治疗信息进行语义识别,从而确定肺癌数据对应的治疗方法。示例性地,基于自然语言处理技术,对临床治疗信息进行分词并形成多个词向量,将临床治疗信息的多个词向量输入治疗方法分类器中,得到该临床治疗信息对应的治疗方法,从而得到肺癌数据对应的治疗方法,例如,治疗方法可以有化疗、放疗、绿色治疗等治疗方法。在得到不同肺癌数据对应的治疗方法后,从中筛选出符合绿色治疗方法的肺癌数据,从而得到多个待处理数据。利用语义识别的方式可以快速且准确地筛选出符合绿色治疗方法的肺癌数据,从而提高基于绿色治疗方法肺癌生存期预测模型的构建速度。
进一步地,对待处理数据中的肺部CT影像和临床治疗信息分别采用不同的预处理方式。对于肺部CT影像,如果肺部CT影像为DICOM数据,则将统一肺部CT影像转换为jpg格式。然后按照预设的像素规格对肺部CT影像进行归一化处理,并以数组的形式进行保存得到肺部CT影像数据组。示例性地,将肺部CT影像统一调整为512*512像素规格,并将每一张肺部CT影像以数组的形式进行保存得到肺部CT影像数据组。对于每一个临床治疗信息进行独热编码得到临床治疗信息向量。示例性地,提取临床治疗信息中的病理类型、肺部肿瘤TNM分期和治疗方案的分类特征,对每一个分类特征进行数值映射和独热编码分别得到病理类编码、TNM分期编码和治疗方案编码,将病理类编码、TNM分期编码和治疗方案编码组合得到临床治疗信息向量。采用独热编码的方式处理临床治疗信息中的各个分类特征得到临床治疗信息向量来输入到模型中,能够提高肺癌生存期预测模型的训练效果。
步骤S130,保存多个初始化肺癌数据得到训练数据集;
步骤S140,初始化肺癌生存期预测模型的参数;
在一些实施例中,肺癌生存期预测模型可以包括影像特征提取模块、临床特征提取模块和特征融合模块,影像特征提取模块用于对肺部CT影像数据组进行特征提取分类后得到第一预测预后时间,临床特征提取模块用于对临床治疗信息向量进行特征提取分类后得到第二预测预后时间,特征融合模块用于将第一预测预后时间和第二预测预后进行特征融合得到预后生存期。初始化肺癌生存期预测模型的参数包括初始化影像特征提取模块的第一参数、临床特征提取模块的第二参数和特征融合模块的第三参数。
在一些实施例中,对于影像特征提取模块的构建,可在Tensorflow2.0版本的软件库中引入基于EfficientNet算法的卷积神经网络模型,然后将训练好的EfficientNet权重导入卷积神经网络中,其中,EfficientNet权重可以通过ImageNet数据集进行训练得到,用于卷积神经网络迁移学习。然后将上述卷积神经网络的输出层设置为一个神经元,该神经元用于输出提取到的第一预测预后时间,且在输出层不设置激活函数,使得输出的第一预测预后时间可以是大于1的连续变量,进而得到影像特征提取模块。
在一些实施例中,对于临床特征提取模块的构建,可在Tensorflow2.0版本的软件库中搭建两层全连接的隐藏层,两层隐藏层的神经元数量可以为10个,隐藏层的激活函数采用Relu函数。输出层的神经元数量为1个且输出层不设置激活函数,用于输出任意数值的第二预测预后时间。
在一些实施例中,第一预测预后时间和第二预测预后时间在特征融合模块后的输出可以采用取两者均值的方式,得到预后生存期。
步骤S150,将训练数据集输入到初始化后的肺癌生存期预测模型中进行训练,得到训练好的肺癌生存期预测模型。
在一些实施例中,在获取到训练数据集后,可以将训练数据集输入到初始化后的肺癌生存期预测模型中进行训练。具体地,将训练数据集中的肺部CT影像数据组输入到初始化后的影像特征提取模块中,得到第一预测预后时间;将训练数据集的临床治疗信息向量输入到临床特征提取模块,得到第二预测预后时间;将第一预测预后时间和第二预测预后时间输入到特征融合模块,得到预后生存期预测结果,可以根据生存期预测结果和前述预后生存期标签来评估肺癌生存期预测模型预测的准确性,进一步评估各个模块的准确性,从而对各个模块的参数进行更新。
对于肺癌生存期预测模型来说,模型预测结果的准确性可以通过损失函数(LossFunction)来衡量,损失函数是定义在单个训练数据上的,用于衡量一个训练数据的预测误差,具体是通过单个训练数据的标签和模型对该训练数据的预测结果确定该训练数据的损失值。而实际训练时,一个训练数据集有很多训练数据,因此一般采用代价函数(CostFunction)来衡量训练数据集的整体误差,代价函数是定义在整个训练数据集上的,用于计算所有训练数据的预测误差的平均值,能够更好地衡量出模型的预测效果。对于一般的机器学习模型来说,基于前述的代价函数,再加上衡量模型复杂度的正则项即可作为训练的目标函数,基于该目标函数便能求出整个训练数据集的损失值。常用的损失函数种类有很多,例如0-1损失函数、平方损失函数、绝对损失函数、对数损失函数、交叉熵损失函数等均可以作为机器学习模型的损失函数,在此不再一一阐述。本申请实施例中,可以从中任选一种损失函数来确定训练的损失值。基于训练的损失值,采用反向传播算法对模型的参数进行更新,迭代几轮即可得到训练好的肺癌生存期预测模型。具体的迭代轮数可以预先设定,或者在测试集达到精度要求时认为训练完成。
下面以基于绿色治疗方法的肺癌生存期预测模型为例,并结合图5至图7的测试数据,说明本发明实施例的有益效果:
图5为本发明实施提供的患者数量与总生存期的关系对比图,横轴表示患者数量,纵轴表示总生存期,线段510表示绿色治疗方法的患者实际总生存期,线段520表示绿色治疗方法的患者预测总生存期。
图6为本发明实施例提供的训练次数与平均预测误差的关系对比图,横轴表示训练次数,纵轴表示平均预测误差,线段620表示基于训练集的训练次数与平均预测误差关系,线段610表示基于测试集的训练次数与平均预测误差关系,可以看出随着训练次数增加,平均预测误差逐渐下降,最终稳定在37.8天。
图7为本发明实施例提供的训练次数与损失函数值的关系对比图,横轴表示训练次数,纵轴表示损失函数值,线段720表示基于训练集的训练次数与损失函数值关系,线段710表示基于测试集的训练次数与损失函数值关系,可以看出随着训练次数增加,损失函数值逐渐收敛。
本发明实施例构建的基于绿色治疗方法的肺癌生存期预测模型,相比于中医绿色治疗患者中位生存期等总体或抽样值的生存期分析方法,能够对单个患者进行个体化预测。
本发明实施例的基于绿色治疗方法的肺癌生存期预测模型,采用测试集进行测试后的平均预测误差为34.8天,对于患者的预后生存期预测准确性高,从而能够为患者提供较好的治疗指导。
本发明实施例在进行患者预后生存期预测时,需要提供常规检查的肺部CT影像和中医绿色治疗方法的相关临床信息即可进行疗效预测,使用方便。
参照图2,本申请实施例还提供一种肺癌生存期预测方法,包括但不限于步骤210、步骤220和步骤230。
步骤210,获取待预测患者治疗前的肺部CT影像和临床治疗信息,其中,临床治疗信息包括采用绿色治疗方法的治疗方案;
步骤220,对肺部CT影像和临床治疗信息进行预处理后输入到如前所述的肺癌生存期预测模型中,得到患者的预后生存期。
本申请实施例中,在训练好模型后,对于采用绿色治疗方法的待预测的患者,对患者的肺部CT影像和临床治疗信息进行预处理以符合肺癌生存期预测模型的输入格式,将肺部CT影像和临床治疗信息输入到肺癌生存期预测模型,可以得到患者的预后生存期,根据预后生存期可以对患者的治疗进行指导。
可以理解的是,上述肺癌生存期预测模型训练方法实施例中的内容均适用于本肺癌生存期预测方法实施例中,本肺癌生存期预测方法实施例所具体实现的功能与上述肺癌生存期预测模型训练方法实施例相同,并且达到的有益效果与上述肺癌生存期预测模型训练方法实施例所达到的有益效果也相同。
参照图3,本申请实施例中还提供一种肺癌生存期预测模型训练系统,包括:
第一模块,用于获取多个患者的肺癌数据,其中,肺癌数据包括患者治疗前的肺部CT影像、临床治疗信息和患者的预后生存期标签;
第二模块,用于根据绿色治疗方法的条件对多个肺癌数据进行筛选和预处理得到多个初始化肺癌数据;
第三模块,用于保存多个初始化肺癌数据得到训练数据集;
第四模块,用于初始化肺癌生存期预测模型的参数;
第五模块,用于将训练数据集输入到初始化后的肺癌生存期预测模型中进行训练,得到训练好的肺癌生存期预测模型。
可以理解的是,上述肺癌生存期预测模型训练方法实施例中的内容均适用于本系统实施例中,本系统实施例所具体实现的功能与上述肺癌生存期预测模型训练方法实施例相同,并且达到的有益效果与上述肺癌生存期预测模型训练方法实施例所达到的有益效果也相同。
参照图4,本申请实施例还提供一种肺癌生存期预测模型的训练装置,包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当至少一个程序被至少一个处理器执行时,使得至少一个处理器实现的肺癌生存期预测模型训练方法。
同理,上述肺癌生存期预测模型训练方法实施例中的内容均适用于本肺癌生存期预测模型训练装置实施例中,本肺癌生存期预测模型训练装置实施例所具体实现的功能与上述肺癌生存期预测模型训练方法实施例相同,并且达到的有益效果与上述肺癌生存期预测模型训练方法实施例所达到的有益效果也相同。
此外,本发明的一个实施例还提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令被一个或多个控制处理器执行,可使得上述一个或多个控制处理器执行上述方法实施例中的肺癌生存期预测模型训练方法或者肺癌生存期预测方法。
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统可以被实施为软件、固件、硬件及其适当的组合。某些物理组件或所有物理组件可以被实施为由处理器,如中央处理器、数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。
上面结合附图对本发明实施例作了详细说明,但是本发明不限于上述实施例,在所属技术领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化。
Claims (10)
1.一种肺癌生存期预测模型训练方法,其特征在于,包括以下步骤:
获取多个患者的肺癌数据,其中,所述肺癌数据包括患者治疗前的肺部CT影像、临床治疗信息和患者的预后生存期标签;
根据绿色治疗方法的条件对多个所述肺癌数据进行筛选和预处理得到多个初始化肺癌数据;
保存多个所述初始化肺癌数据得到训练数据集;
初始化肺癌生存期预测模型的参数;
将所述训练数据集输入到初始化后的肺癌生存期预测模型中进行训练,得到训练好的肺癌生存期预测模型。
2.根据权利要求1所述的肺癌生存期预测模型训练方法,其特征在于,所述根据绿色治疗方法的条件对多个所述肺癌数据进行筛选和预处理得到多个初始化肺癌数据包括以下步骤:
提取出所述肺癌数据中的临床治疗信息;
对所述临床治疗信息进行语义识别,确定所述肺癌数据的治疗方法;
筛选出治疗方法为绿色治疗方法的肺癌数据得到多个待处理数据;
对多个所述待处理数据进行预处理得到多个初始化肺癌数据。
3.根据权利要求2所述的肺癌生存期预测模型训练方法,其特征在于,所述对多个所述待处理数据进行预处理得到多个初始化肺癌数据包括以下步骤:
根据预设的像素规格对所述待处理数据中的所述肺部CT影像进行归一化处理,并以数组的形式进行保存得到所述肺部CT影像数据组;
对所述待处理数据中的所述临床治疗信息进行独热编码得到临床治疗信息向量;
保存所述CT影像数据组和所述临床治疗信息向量得到所述初始化肺癌数据。
4.根据权利要求3所述的肺癌生存期预测模型训练方法,其特征在于,所述肺癌生存期预测模型包括影像特征提取模块、临床特征提取模块和特征融合模块,所述参数包括影像特征提取模块的第一参数、临床特征提取模块的第二参数和特征融合模块的第三参数,所述将所述训练数据集输入到初始化后的肺癌生存期预测模型中进行训练包括以下步骤:
将所述训练数据集的所述肺部CT影像数据组输入到所述影像特征提取模块,得到第一预测预后时间;
将所述训练数据集的所述临床治疗信息向量输入到所述临床特征提取模块,得到第二预测预后时间;
将所述第一预测预后时间和所述第二预测预后时间输入到所述特征融合模块,得到预后生存期预测结果;
根据所述预后生存期预测结果和所述预后生存期标签确定损失值;
根据损失值对所述第一参数、所述第二参数和所述第三参数进行更新。
5.根据权利要求4所述的肺癌生存期预测模型训练方法,其特征在于,所述影像特征提取模块采用导入有EfficientNet权重的卷积神经网络搭建,所述卷积神经网络的输出层由一个神经元组成,所述神经元用于输出所述第一预测预后时间。
6.根据权利要求4所述的肺癌生存期预测模型训练方法,其特征在于,所述临床特征提取模块采用两层全连接的隐藏层和一层输出层的网络搭建,所述隐藏层包括多个神经元,所述隐藏层采用Relu激活函数,所述输出层由一个神经元组成,所述神经元用于输出所述第二预测预后时间。
7.一种肺癌生存期预测方法,其特征在于,包括以下步骤:
获取待预测患者治疗前的肺部CT影像;
获取待预测患者的临床治疗信息,其中,所述临床治疗信息包括绿色治疗方法的治疗方案;
对所述肺部CT影像和所述临床治疗信息进行预处理后输入到如权利要求1至6任一项所述的肺癌生存期预测模型中,得到患者的预后生存期。
8.一种肺癌生存期预测模型训练系统,其特征在于,包括:
第一模块,用于获取多个患者的肺癌数据,其中,所述肺癌数据包括患者治疗前的肺部CT影像、临床治疗信息和患者的预后生存期标签;
第二模块,用于根据绿色治疗方法的条件对多个所述肺癌数据进行筛选和预处理得到多个初始化肺癌数据;
第三模块,用于保存多个所述初始化肺癌数据得到训练数据集;
第四模块,用于初始化肺癌生存期预测模型的参数;
第五模块,用于将所述训练数据集输入到初始化后的肺癌生存期预测模型中进行训练,得到训练好的肺癌生存期预测模型。
9.一种肺癌生存期预测模型训练装置,其特征在于,包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当所述至少一个程序被所述至少一个处理器执行,使得至少一个所述处理器实现如权利要求1至6任一项所述的肺癌生存期预测模型训练方法。
10.一种计算机可读存储介质,其中存储有处理器可执行的程序,其特征在于,所述处理器可执行的程序被由所述处理器执行时用于实现如权利要求1至6任一项所述的肺癌生存期预测模型训练方法或者实现如权利要求7所述的肺癌生存期预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210091362.0A CN114462522B (zh) | 2022-01-26 | 2022-01-26 | 肺癌生存期预测模型训练、预测方法、系统、装置及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210091362.0A CN114462522B (zh) | 2022-01-26 | 2022-01-26 | 肺癌生存期预测模型训练、预测方法、系统、装置及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114462522A true CN114462522A (zh) | 2022-05-10 |
CN114462522B CN114462522B (zh) | 2024-09-27 |
Family
ID=81411546
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210091362.0A Active CN114462522B (zh) | 2022-01-26 | 2022-01-26 | 肺癌生存期预测模型训练、预测方法、系统、装置及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114462522B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116994770A (zh) * | 2023-09-27 | 2023-11-03 | 四川省医学科学院·四川省人民医院 | 一种基于多维度分析的免疫人群确定方法和系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112184658A (zh) * | 2020-09-24 | 2021-01-05 | 上海健康医学院 | 用于非小细胞肺癌预后生存预测的方法、介质及电子设备 |
CN112951406A (zh) * | 2021-01-27 | 2021-06-11 | 安徽理工大学 | 一种基于ct影像组学的肺癌预后辅助评估方法及系统 |
CN113257413A (zh) * | 2021-06-22 | 2021-08-13 | 安翰科技(武汉)股份有限公司 | 基于深度学习的癌症预后生存预测方法、设备及存储介质 |
WO2021258081A1 (en) * | 2020-06-16 | 2021-12-23 | Verily Life Sciences Llc | Systems and methods for directly predicting cancer patient survival based on histopathology images |
-
2022
- 2022-01-26 CN CN202210091362.0A patent/CN114462522B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021258081A1 (en) * | 2020-06-16 | 2021-12-23 | Verily Life Sciences Llc | Systems and methods for directly predicting cancer patient survival based on histopathology images |
CN112184658A (zh) * | 2020-09-24 | 2021-01-05 | 上海健康医学院 | 用于非小细胞肺癌预后生存预测的方法、介质及电子设备 |
CN112951406A (zh) * | 2021-01-27 | 2021-06-11 | 安徽理工大学 | 一种基于ct影像组学的肺癌预后辅助评估方法及系统 |
CN113257413A (zh) * | 2021-06-22 | 2021-08-13 | 安翰科技(武汉)股份有限公司 | 基于深度学习的癌症预后生存预测方法、设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
黄裕存;曹治;陆少范;黄胜福;邝宇良;: "基于CT增强图像纹理特征预测可切除胃癌患者预后", 中国医学影像技术, no. 07, 20 July 2020 (2020-07-20) * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116994770A (zh) * | 2023-09-27 | 2023-11-03 | 四川省医学科学院·四川省人民医院 | 一种基于多维度分析的免疫人群确定方法和系统 |
CN116994770B (zh) * | 2023-09-27 | 2024-01-02 | 四川省医学科学院·四川省人民医院 | 一种基于多维度分析的免疫人群确定方法和系统 |
Also Published As
Publication number | Publication date |
---|---|
CN114462522B (zh) | 2024-09-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11669792B2 (en) | Medical scan triaging system and methods for use therewith | |
Wu et al. | Segmentation of pulmonary nodules in CT images based on 3D‐UNET combined with three‐dimensional conditional random field optimization | |
CN112270666A (zh) | 基于深度卷积神经网络的非小细胞肺癌病理切片识别方法 | |
Mahesh et al. | Early predictive model for breast cancer classification using blended ensemble learning | |
CN110276741B (zh) | 结节检测及其模型训练的方法和装置以及电子设备 | |
CN112614133B (zh) | 一种无锚点框的三维肺结节检测模型训练方法及装置 | |
Mahapatra et al. | Active learning based segmentation of Crohns disease from abdominal MRI | |
WO2021098534A1 (zh) | 相似度确定、网络训练、查找方法及装置、电子装置和存储介质 | |
CN111612278A (zh) | 生命状态预测方法、装置、电子设备及存储介质 | |
Wang et al. | Feature‐shared adaptive‐boost deep learning for invasiveness classification of pulmonary subsolid nodules in CT images | |
Tao et al. | NSCR‐Based DenseNet for Lung Tumor Recognition Using Chest CT Image | |
Wang et al. | Neighbor matching for semi-supervised learning | |
Chi et al. | Deep semisupervised multitask learning model and its interpretability for survival analysis | |
US20240161035A1 (en) | Multi-model medical scan analysis system and methods for use therewith | |
Lu | Computer‐Aided Diagnosis Research of a Lung Tumor Based on a Deep Convolutional Neural Network and Global Features | |
Liu et al. | AHU-MultiNet: Adaptive loss balancing based on homoscedastic uncertainty in multi-task medical image segmentation network | |
Mohapatra et al. | Segmentation and Classification of Encephalon Tumor by Applying Improved Fast and Robust FCM Algorithm with PSO‐Based ELM Technique | |
CN114462522B (zh) | 肺癌生存期预测模型训练、预测方法、系统、装置及介质 | |
Yang et al. | A dense R‐CNN multi‐target instance segmentation model and its application in medical image processing | |
CN117036894B (zh) | 基于深度学习的多模态数据分类方法、装置及计算机设备 | |
CN117616467A (zh) | 训练并使用深度学习算法来基于降维表示比较医学图像的方法 | |
CN113220895A (zh) | 基于强化学习的信息处理方法、装置、终端设备 | |
CN117274185A (zh) | 检测方法、检测模型产品、电子设备及计算机存储介质 | |
Song et al. | Multi-scale Superpixel based Hierarchical Attention model for brain CT classification | |
Wang et al. | Automatic Segmentation of Optic Disc and Cup in Retinal Fundus Images Using Improved Two‐Layer Level Set Method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |