CN111640518A - 一种宫颈癌术后生存预测方法、系统、设备及介质 - Google Patents
一种宫颈癌术后生存预测方法、系统、设备及介质 Download PDFInfo
- Publication number
- CN111640518A CN111640518A CN202010488882.6A CN202010488882A CN111640518A CN 111640518 A CN111640518 A CN 111640518A CN 202010488882 A CN202010488882 A CN 202010488882A CN 111640518 A CN111640518 A CN 111640518A
- Authority
- CN
- China
- Prior art keywords
- model
- cervical cancer
- patient
- verification
- survival
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H70/00—ICT specially adapted for the handling or processing of medical references
- G16H70/60—ICT specially adapted for the handling or processing of medical references relating to pathologies
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/50—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
Landscapes
- Engineering & Computer Science (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Primary Health Care (AREA)
- Epidemiology (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Databases & Information Systems (AREA)
- Pathology (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本发明提供一种宫颈癌术后生存预测方法、系统、设备及介质,属于医学技术领域。本发明在传统患者评估的基础上,重点突出病理因素对患者术后生存的影响,以机器学习算法为基础,从而开发了一种预测早期宫颈癌患者术后发生生存的临床预测模型。本发明可以为早期宫颈癌术后辅助治疗方案的选择及精准治疗提供更加个性化的临床指导意见,因此具有良好的实际应用之价值。
Description
技术领域
本发明属于医学技术领域,具体涉及一种宫颈癌术后生存预测方法、系统、设备及介质。
背景技术
公开该背景技术部分的信息仅仅旨在增加对本发明的总体背景的理解,而不必然被视为承认或以任何形式暗示该信息构成已经成为本领域一般技术人员所公知的现有技术。
在全球女性范围内,宫颈癌是发病率第二位的恶性肿瘤,并且死亡率居恶性肿瘤的第三位。在中国,大约只有1/5的女性进行过宫颈癌的的筛查,这一比率远低于发达国家,因此中国女性宫颈癌的发病率有增高的趋势。
目前,宫颈癌患者的预后与国际妇产科临床联合会(FIGO)分期系统密切相关。宫颈癌的临床分期主要取决于妇科医生在进行任何治疗之前的盆腔检查。如果患者同时伴有盆腔炎、子宫内膜异位症或肥胖等情况,术前妇科检查判断临床分期是不准确的。另外早期宫颈癌患者的术后病理结果对患者的预后也有一定的影响。组织学和临床病理危险因素,如淋巴结阳性,宫旁浸润,淋巴间隙浸润,肿瘤大小,宫颈侵犯深度和组织学类型,已被确定对宫颈癌患者的预后存在重要意义。在这些危险因素中,淋巴结阳性和宫旁浸润被认为是高危因素。此外,宫颈间质浸润深度、肿瘤体积大、淋巴间隙浸润三个病理因素被定义为中危因素。危险因素直接影响患者术后辅助治疗方案的选择。
对于仅存在病理中危因素的早期宫颈癌患者,患者在手术治疗后,后续的辅助治疗方案选择仍存在一定争议。欧洲肿瘤医学协会(ESMO)宫颈癌临床实践指南的认为存在中等风险的患者不需要进一步的辅助治疗;美国FIGO宫颈癌指南建议:如果患者有以下两种危险因素(肿瘤最大直径大于4cm、淋巴血管间隙浸润、深部宫颈间质浸润)中的任何一种高危因素,术后则建议行放疗,不建议行化疗;除此之外,在美国国家综合癌症子宫颈癌的临床实践指南(NCCN)推荐:手术后淋巴淋巴结阴性患者,术前确诊为IA2、IB1或IIA1,如果病人有较大的肿瘤包块、深部SI和/或LVSI,则需要进行骨盆体外放射治疗。
发明人发现,患者存在的病理因素、辅助治疗方案的选择以及患者预后的准确评估,对患者预后有着重要的影响。因此,对于早期宫颈癌患者的术后生存的综合评估,对于临床决策的制定非常重要。
发明内容
本发明提供一种宫颈癌术后生存预测方法、系统、设备及介质。本发明在传统患者评估的基础上,重点突出病理因素对患者术后生存的影响,以机器学习算法为基础,从而开发了一种预测早期宫颈癌患者术后生存的临床预测模型。本发明可以为早期宫颈癌术后辅助治疗方案的选择及精准治疗提供更加个性化的临床指导意见,因此具有良好的实际应用之价值。
为了实现上述目的,本发明采用下述技术方案:
本发明的第一个方面,提供一种宫颈癌术后生存预测方法,所述方法包括:
获取宫颈癌术后患者的临床数据;
根据已建立的宫颈癌术后生存预测模型对待测对象进行预测,得到待测对象的宫颈癌术后生存的预测结果;
其中,所述宫颈癌术后生存预测模型是通过将预先采集的宫颈癌术后患者的临床数据采用机器学习算法进行模型训练获得。
进一步的,宫颈癌术后生存预测模型构建具体方法包括:
S1、以患者术后总生存期(OS)为结局,使用建模组预处理后的宫颈癌患者的临床数据,运用套索(LASSO)分析进行对上述临床因素进行危险因素的筛选;
S2、将LASSO所得的危险因素,以总生存期(OS)为结局,使用多因素Cox回归分析构建预测模型;优选的,将多因素Cox回归分析所得的危险因素,使用诺莫图(Nomogram)的方法进行展示。计算每一个患者在术后固定时间内(比如1年、3年、5年等均可计算)的生存得分,同时获得每位患者的生存概率。
本发明的第二个方面,提供一种宫颈癌术后生存预测系统,所述系统包括:
临床数据获取和处理模块:获取宫颈癌术后患者临床数据并进行预处理;
危险因素筛选模块:以患者术后总生存期(OS)为结局,对上述处理后的临床数据进行套索(LASSO)分析,获得危险因素;
模型构建模块:以患者总生存期(OS)为结局,对筛选出的危险因素使用多因素Cox回归分析构建预测模型。
本发明的第三个方面,提供一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成上述宫颈癌术后生存预测方法所进行的步骤。
本发明的第四个方面,提供一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成上述宫颈癌术后生存预测方法所进行的步骤。
上述一个或多个技术方案的有益技术效果:
(1)该早期宫颈癌患者术后生存预测模型,首次使用机器学习算法与传统的生存分析方法相结合,达到对术后仅存在中危病理因素的早期宫颈癌患者并且评估的预测,并且具有较高的准确性,为临床决策的制定提供了有利的工具。
(2)该模型的患者适用范围为:首次治疗方案为广泛子宫切除及淋巴结清扫;术后病理结果不包含病理高危因素的早期宫颈癌IA-IA2期的患者,因此模型的适用范围更加精准。
(3)对连续型数据(比如患者的年龄、身高及体重),采取ROC曲线最佳约登值的方法寻找最佳临界点,对患者年龄进行二分类的分组。
(4)危险因素的筛选,使用了套索分析(LASSO分析)的算法,高危因素筛选的过程更加严谨,对宫颈癌患者术后生存的预测更加精准。
(5)上述技术方案中的模型验证过程主要分为两步:1)独立的验证队列验证,该验证组的数据未进行模型的构建,是独立的患者分组,用于所建立模型的外部验证,获得预测模型的区分度(曲线下面积)、敏感度和特异度;2)机器学习算法验证,使用建模组和验证组所有的患者,使用7种机器学习算法(逻辑回归/支持向量机/随机森林/决策树/k近邻/朴素贝叶斯/Adaboost),采用10倍交叉验证的方法,获得预测模型的区分度(曲线下面积)、敏感度和特异度。以上两步验证的过程,均对模型的验证能力进行了全面的评估。
(6)使用多因素COX分析进行模型的构建之后,以nomogram展示模型,将患者的生存得分和生存概率相结合,可以更加简单、便捷的评估每位患者在术后特定时间点的术后发生死亡的风险。
(7)同时使用了7种机器学习算法,可以互相弥补各种算法之间的不足,进一步的提高模型的准确率,保证模型的质量。
(8)模型的构建和验证过程算法严谨,并且随着入组病例数的增加,可以进一步的提高模型的预测准确率。
(9)使用列线表的方式对所建模型进行了展示,可准确且迅速的获得每一位进行评估患者的风险得分以及相应的生存。并且可以根据模型,获得精准的网络预测计算器,计算每一位宫颈癌患者术后任何一时间点的生存情况。
(10)机器学习外部验证的过程,可以弥补回顾性研究,无前瞻性验证的缺陷。
综上,上述技术方案系首次提出,其立足点为“无高危病理因素的早期宫颈癌患者的术后生存评估”,对早期宫颈癌的精准诊疗有重要的意义,具有良好的实际应用之价值。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1为本发明实施例1中宫颈癌术后生存预测方法路线图。
图2为本发明实施例1中基于机器学习算法的模型外部验证图。
图3为本发明实施例1中列线表模式图。
图4为本发明实施例1中机器学习ROC曲线模式图。
具体实施方式
应该指出,以下详细说明都是例示性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。应理解,本发明的保护范围不局限于下述特定的具体实施方式;还应当理解,本发明实施例中使用的术语是为了描述特定的具体实施方式,而不是为了限制本发明的保护范围。下列具体实施方式中如果未注明具体条件的实验方法,通常按照本领域技术内的常规方法和条件。
本发明提供一种基于机器学习算法的早期宫颈癌手术治疗后患者生存预测模型的构建与验证。在传统患者评估的基础上,重点突出病理因素对患者术后生存的影响。以机器学习算法为基础,开发了一种用于预测早期宫颈癌患者术后生存预测模型。本发明中以运用套索算法(LASSO)对临床因素进行初步危险因素的筛选,将LASSO分析所得的危险因素,以总生存期(OS)为结局,使用多因素Cox回归分析构建术后生存预测模型。同时使用验证组的数据和机器学习算法(逻辑回归/支持向量机/随机森林/决策树/k近邻/朴素贝叶斯/Adaboost),对所得术后生存预测模型进行进一步的功能验证。
具体的,本发明的一个典型实施方式中,提供一种宫颈癌术后生存预测方法,所述方法包括:
获取宫颈癌术后患者的临床数据;
根据已建立的宫颈癌术后生存预测模型对待测对象进行预测,得到待测对象的宫颈癌术后生存的预测结果;
其中,所述宫颈癌术后生存预测模型是通过将预先采集的宫颈癌术后患者的临床数据采用机器学习算法进行模型训练获得。
本发明的又一具体实施方式中,获取宫颈癌术后患者的临床数据包括但不限于年龄、孕产史、HPV分型、FIGO分期、手术方式、术后病理和辅助治疗方案。
需要说明的是,本发明中,宫颈癌术后患者需排除高危病理因素,所述高危病理因素包括但不限于淋巴结转移、宫旁浸润、切缘阳性以及患者合并其他原发恶性肿瘤。因此,本发明实际构建的是一种无高危病理因素的早期宫颈癌患者的术后生存评估模型,有助于对早期宫颈癌进行精准诊疗。
本发明的又一具体实施方式中,所述患者为早期宫颈癌IA-IA2期的患者。
本发明的又一具体实施方式中,所述术后病理包括但不限于病理学类型、病理学分化程度、肿瘤最大直径、淋巴管间隙状态和宫颈间质浸润深度。
本发明的又一具体实施方式中,对临床数据进行预处理,具体的,对临床数据中的连续型数据(如年龄)采取ROC曲线最佳约登值的方法寻找最佳临界点,进行二分类的分组;对临床数据中的分类数据均作为分组数据进行处理,如下所示:
本发明的又一具体实施方式中,所述机器学习算法优选为套索(LASSO)分析和多因素Cox回归分析。
本发明的又一具体实施方式中,宫颈癌术后生存预测模型构建具体方法包括:
S1、以患者术后总生存期(OS)为结局,使用建模组预处理后的宫颈癌患者的临床数据,运用套索(LASSO)分析进行对上述临床因素进行危险因素的筛选;
S2、将LASSO所得的危险因素,以总生存期(OS)为结局,使用多因素Cox回归分析构建预测模型;优选的,将多因素Cox回归分析所得的危险因素,使用诺莫图(Nomogram)的方法进行展示。计算每一个患者在术后固定时间内(比如1年、3年、5年等均可计算)的生存得分,获得每位患者的生存概率。使用列线表,又称诺莫图(nomogram)的方式对所建模型进行展示,可准确且迅速的获得每一位进行评估患者的风险得分以及相应的生存。并且可以根据模型,获得精准的网络预测计算器,计算每一位患者在术后确定的时间点发生死亡的风险。
本发明的又一具体实施方式中,使用受试者工作特征曲线(ROC)判断模型的区分度;如果ROC曲线的下面积大于设定阈值(0.65),则表示宫颈癌术后生存预测模型预测能力满足要求,输出宫颈癌术后生存预测模型;
本发明的又一具体实施方式中,对上述宫颈癌术后生存预测模型进行验证,判断模型的区分能力。
本发明的又一具体实施方式中,所述验证方法包括模型的外部验证和/或基于机器学习算法的模型外部验证;
其中,所述模型的外部验证方法具体为:使用验证组宫颈癌患者的临床数据,对上述构建的模型进行验证,同时获得验证队列的ROC曲线,判断模型的区分能力;
所述基于机器学习算法的模型外部验证方法具体为:将建模组与验证组患者进行组合,利用上述模型中所得的危险因素,运用机器学习算法采用10折交叉验证的方法,获得ROC曲线,判断模型的区分能力。
本发明的又一具体实施方式中,所述机器学习算法包括逻辑回归(LR)、支持向量机(SVM)、随机森林(RF)、决策树(DT)、k近邻(KNN)、朴素贝叶斯(NB)、Adaboost(Ada)中的任意一种或多种。本发明采用多种机器学习算法,可以互相弥补各种算法之间的不足,进一步的提高模型的准确率,保证模型的质量。
本发明的又一具体实施方式中,提供一种宫颈癌术后生存预测系统,所述系统包括:
临床数据获取和处理模块:获取宫颈癌术后患者临床数据并进行预处理;
危险因素筛选模块:以患者术后总生存期(OS)为结局,对上述处理后的临床数据进行套索(LASSO)分析,获得危险因素;
模型构建模块:以患者总生存期(OS)为结局,对筛选出的危险因素使用多因素Cox回归分析构建预测模型。
其中,临床数据获取和处理模块中,
宫颈癌术后患者临床数据包括但不限于年龄、孕产史、HPV分型、FIGO分期、手术方式、术后病理和辅助治疗方案。
本发明的又一具体实施方式中,对临床数据中的连续型数据(如年龄)采取ROC曲线最佳约登值的方法寻找最佳临界点,进行二分类的分组;对临床数据中的分类数据均作为分组数据进行处理。
本发明的又一具体实施方式中,模型构建模块中,对构建得到的模型,使用诺莫图(Nomogram)的方法进行展示,评估患者生存得分及相应概率。
本发明的又一具体实施方式中,所述系统还包括模型验证模块,所述模型验证模块包括模型外部验证模块和机器学习算法验证模块;
本发明的又一具体实施方式中,所述模型外部验证模块:使用验证组宫颈癌患者的临床数据,对上述构建的模型进行验证,同时获得验证队列的ROC曲线,判断模型的区分能力。当ROC曲线下面积大于0.65,被认为存在良好的模型区分度。
本发明的又一具体实施方式中,所述机器学习算法验证模块:将建模组与验证组患者进行组合,利用上述模型中所得危险因素,运用机器学习算法采用10折交叉验证的方法进行测试。获得ROC曲线,并且获得模型的敏感度及特异度。同样的,ROC曲线下面积大于0.65,被认为存在良好的模型区分度;敏感度及特异度均大于0.5则认为模型存在良好的预测效果。
本发明的又一具体实施方式中,所述机器学习算法包括逻辑回归(LR)、支持向量机(SVM)、随机森林(RF)、决策树(DT)、k近邻(KNN)、朴素贝叶斯(NB)、Adaboost(Ada)中的任意一种或多种。本发明采用多种机器学习算法,可以互相弥补各种算法之间的不足,进一步的提高模型的准确率,保证模型的质量。
本发明的又一具体实施方式中,提供一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成上述宫颈癌术后生存预测方法所进行的步骤。
本发明的又一具体实施方式中,提供一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成上述宫颈癌术后生存预测方法所进行的步骤。
为了使得本领域技术人员能够更加清楚地了解本发明的技术方案,以下将结合具体的实施例详细说明本发明的技术方案。
实施例1
(1)患者入组标准:
1.术前临床分期为FIGOIA1-IIA2期的早期宫颈癌患者;
2.手术治疗为首选治疗方案,并且术前未行新辅助化疗或放疗;
3.手术方式为:广泛子宫切除术+盆腔淋巴结清扫术。
4.术后随访时间至少3年以上。
(2)患者排除标准:
1.术后病理结果包含淋巴结转移、宫旁浸润及切缘阳性三个病理高危因素;
2.不同时合并其他原发恶性肿瘤;
(3)患者入组人数:500例以上。
(4)患者分组:将上述患者按照3:1的比例随机分为建模组与验证组。
(5)建模所用临床资料的收集:收集上述患者的基本临床资料,包括:年龄、孕产史、HPV分型、FIGO分期、手术方式、术后病理(病理学类型、病理学分化程度、肿瘤最大直径、淋巴管间隙状态、宫颈间质浸润深度)、辅助治疗方案等以及心血管并发症等。
临床资料的分组:将将上述获得的患者临床资料,进行分组,作为构建临床分析模型的基础。对连续型数据(比如患者的年龄、身高及体重),我们采取ROC曲线最佳约登值的方法寻找最佳临界点,对患者年龄进行二分类的分组。对于分类数据,比如患者的HPV分型、临床FIGO分期、手术方式、术后病理和辅助治疗方案等,均作为分组数据处理,如下表所示。
(6)模型的构建:以患者术后总生存期(OS)为结局,使用建模组宫颈癌患者的临床数据,运用套索分析(又称LASSO分析),对临床因素进行危险因素的筛选。
LASSO方法是在最小二乘基础上增加了一个惩罚项来对估计参数进行压缩,当参数缩小到小于一个阈值的时候,就令它变为0,从而选择出对因变量影响较大的自变量并计算出相应的回归系数,最终能得到一个比较精简的模型。LASSO方法在处理存在多重共线性的样本数据时有明显的优势。
将LASSO算法所得的危险因素,以总生存期(OS)为结局,使用多因素Cox回归分析构建预测模型。
总生存期(OS):从随机化分组开始,至因任何原因引起死亡的时间。对于死亡之前就已经失访的受试者,通常将最后一次随访时间计算为死亡时间。
(7)生存得分和概率的计算:列线图,又称诺莫图(Nomogram),它是建立在多因素回归分析的基础上,使用多个临床指标或者生物属性,然后采用带有分数高低的线段,从而达到基于多个变量的值预测一定的临床结局或者某类事件发生的概率。因此进一步将COX多因素分析所得的高危因素,使用列线图的方法展示。计算每一个患者在术后固定时间内(比如1年、3年、5年等均可计算)的生存得分,同时获得每位患者的生存概率。使用受试者工作特征曲线(ROC)判断模型的区分度,并且获得模型的敏感度及特异度。
(8)模型的外部验证:使用验证组宫颈癌患者的临床数据,对上述构建的模型进行验证,同时获得验证队列的ROC曲线,判断模型的区分能力。ROC曲线下面积大于0.65,被认为存在良好的模型区分度。同时获得模型的敏感度及特异度,均大于0.5则认为模型存在良好的预测效果。
(9)基于机器学习算法的模型外部验证:将上述建模组与验证组患者进行组合,利用上述模型中所得的危险因素,运用广泛使用的7种机器学习算法:逻辑回归(LR)、支持向量机(SVM)、随机森林(RF)、决策树(DT)、k近邻(KNN)、朴素贝叶斯(NB)、Adaboost(Ada),采用10折交叉验证的方法,即所有患者随机分为10个相等大小的亚样本组,其中9个亚样本组作为训练数据,最后1个亚样本组作为验证数据进行测试。通过验证组所得的ROC曲线,使用上述7中机器学习算法,获得ROC曲线,并且获得模型的敏感度及特异度。同样的,ROC曲线下面积大于0.65,被认为存在良好的模型区分度;敏感度及特异度均大于0.5则认为模型存在良好的预测效果。
(10)若上述两种验证过程,即模型的外部验证和基于机器学习算法的模型外部验证均可获得ROC曲线下面积大于0.65的结果;敏感度及特异度,均大于0.5则认为模型存在良好的预测效果,则说明模型构建有效。上述过程可开发成自动医学分析小程序,对仅存在中危病理因素的早期宫颈癌患者术后的辅助治疗方案进行指导。
实施例2
一种宫颈癌术后生存预测系统,所述系统包括:
临床数据获取和处理模块:获取宫颈癌术后患者临床数据并进行预处理;
危险因素筛选模块:以患者术后总生存期(OS)为结局,对上述处理后的临床数据进行套索(LASSO)分析,获得危险因素;
模型构建模块:以患者总生存期(OS)为结局,对筛选出的危险因素使用多因素Cox回归分析构建预测模型。
其中,临床数据获取和处理模块中,
宫颈癌术后患者临床数据包括但不限于年龄、孕产史、HPV分型、FIGO分期、手术方式、术后病理和辅助治疗方案。
对临床数据中的连续型数据(如年龄)采取ROC曲线最佳约登值的方法寻找最佳临界点,进行二分类的分组;对临床数据中的分类数据均作为分组数据进行处理。
模型构建模块中,将多因素Cox回归分析所得的危险因素,使用诺莫图(Nomogram)的方法进行展示。
所述系统还包括模型验证模块,所述模型验证模块包括模型外部验证模块和机器学习算法验证模块;
所述模型外部验证模块:使用验证组宫颈癌患者的临床数据,对上述构建的模型进行验证,同时获得验证队列的ROC曲线,判断模型的区分能力。当ROC曲线下面积大于0.65,被认为存在良好的模型区分度。
所述机器学习算法验证模块:将建模组与验证组患者进行组合,利用上述模型中所得危险因素,运用7种机器学习算法(逻辑回归(LR)、支持向量机(SVM)、随机森林(RF)、决策树(DT)、k近邻(KNN)、朴素贝叶斯(NB)和Adaboost(Ada))采用10折交叉验证的方法进行测试。获得ROC曲线,并且获得模型的敏感度及特异度。同样的,ROC曲线下面积大于0.65,被认为存在良好的模型区分度;敏感度及特异度均大于0.5则认为模型存在良好的预测效果。
实施例3
一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成实施例1方法中的各个操作,为了简洁,在此不再赘述。
所述电子设备可以是移动终端以及非移动终端,非移动终端包括台式计算机,移动终端包括智能手机(Smart Phone,如Android手机、IOS手机等)、智能眼镜、智能手表、智能手环、平板电脑、笔记本电脑、个人数字助理等可以进行无线通信的移动互联网设备。
应理解,在本发明中,该处理器可以是中央处理单元CPU,该处理器还算可以是其他通用处理器、数字信号处理器DSP、专用集成电路ASIC,现成可编程门阵列FPGA或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
该存储器可以包括只读存储器和随机存取存储器,并向处理器提供指令和数据、存储器的一部分还可以包括非易失性随机存储器。例如,存储器还可以存储设备类型的信息。
在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。结合本发明所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器、闪存、只读存储器、可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。为避免重复,这里不再详细描述。本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元即算法步骤,能够以电子硬件或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其他的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能的划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外一点,所显示或讨论的相互之间的耦合或者直接耦合或者通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性、机械或其它的形式。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
应注意的是,以上实例仅用于说明本发明的技术方案而非对其进行限制。尽管参照所给出的实例对本发明进行了详细说明,但是本领域的普通技术人员可根据需要对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围。
Claims (10)
1.一种宫颈癌术后生存预测方法,其特征在于,所述方法包括:
获取宫颈癌术后患者的临床数据;
根据已建立的宫颈癌术后生存预测模型对待测对象进行预测,得到待测对象的宫颈癌术后生存的预测结果;
其中,所述宫颈癌术后生存预测模型是通过将预先采集的宫颈癌术后患者的临床数据采用机器学习算法进行模型训练获得。
2.如权利要求1所述的宫颈癌术后生存预测方法,其特征在于,获取宫颈癌术后患者的临床数据包括年龄、孕产史、HPV分型、FIGO分期、手术方式、术后病理和辅助治疗方案;
优选的,所述患者为早期宫颈癌IA-IA2期的患者;
优选的,所述术后病理包括但不限于病理学类型、病理学分化程度、肿瘤最大直径、淋巴管间隙状态和宫颈间质浸润深度。
3.如权利要求2所述的宫颈癌术后生存预测方法,其特征在于,对临床数据进行预处理,具体的,对临床数据中的连续型数据采取ROC曲线最佳约登值的方法寻找最佳临界点,进行二分类的分组;对临床数据中的分类数据均作为分组数据进行处理。
4.如权利要求1所述的宫颈癌术后生存预测方法,其特征在于,所述机器学习算法为套索分析和多因素Cox回归分析。
5.如权利要求1所述的宫颈癌术后生存预测方法,其特征在于,宫颈癌术后生存预测模型构建具体方法包括:
S1、以患者术后总生存期为结局,使用建模组预处理后的宫颈癌患者的临床数据,运用套索分析进行对上述临床因素进行危险因素的筛选;
S2、将LASSO所得的危险因素,以总生存期(OS)为结局,使用多因素Cox回归分析构建预测模型;
优选的,将多因素Cox回归分析所得的危险因素,使用诺莫图的方法进行展示;
优选的,使用受试者工作特征曲线判断模型的区分度;如果ROC曲线的下面积大于设定阈值,则表示宫颈癌术后生存预测模型预测能力满足要求,输出宫颈癌术后生存预测模型。
6.如权利要求5所述的宫颈癌术后生存预测方法,其特征在于,对宫颈癌术后生存预测模型进行验证,判断模型的区分能力;
所述验证方法包括模型的外部验证和/或基于机器学习算法的模型外部验证;
其中,所述模型的外部验证方法具体为:使用验证组宫颈癌患者的临床数据,对上述构建的模型进行验证,同时获得验证队列的ROC曲线,判断模型的区分能力;
所述基于机器学习算法的模型外部验证方法具体为:将建模组与验证组患者进行组合,利用上述模型中所得的危险因素,运用机器学习算法采用10折交叉验证的方法,获得ROC曲线,判断模型的区分能力;
优选的,所述机器学习算法包括逻辑回归、支持向量机、随机森林、决策树、k近邻、朴素贝叶斯、Adaboost中的任意一种或多种。
7.一种宫颈癌术后生存预测系统,其特征在于,所述系统包括:
临床数据获取和处理模块:获取宫颈癌术后患者临床数据并进行预处理;
危险因素筛选模块:以患者术后总生存期为结局,对上述处理后的临床数据进行套索分析,获得危险因素;
模型构建模块:以患者总生存期为结局,对筛选出的危险因素使用多因素Cox回归分析构建预测模型。
8.如权利要求7所述的宫颈癌术后生存预测系统,其特征在于,
临床数据获取和处理模块中,
宫颈癌术后患者临床数据包括但不限于年龄、孕产史、HPV分型、FIGO分期、手术方式、术后病理和辅助治疗方案;
优选的,对临床数据中的连续型数据(如年龄)采取ROC曲线最佳约登值的方法寻找最佳临界点,进行二分类的分组;对临床数据中的分类数据均作为分组数据进行处理;
优选的,模型构建模块中,对构建得到的模型,使用诺莫图(Nomogram)的方法进行展示;
优选的,所述系统还包括模型验证模块,所述模型验证模块包括模型外部验证模块和机器学习算法验证模块;
优选的,所述模型外部验证模块:使用验证组宫颈癌患者的临床数据,对上述构建的模型进行验证,同时获得验证队列的ROC曲线,判断模型的区分能力;
优选的,所述机器学习算法验证模块:将建模组与验证组患者进行组合,利用上述模型中所得危险因素,运用机器学习算法采用10折交叉验证的方法进行测试;获得ROC曲线,并且获得模型的敏感度及特异度;
优选的,所述机器学习算法包括逻辑回归、支持向量机、随机森林、决策树、k近邻、朴素贝叶斯、Adaboost中的任意一种或多种。
9.一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,其特征在于,所述计算机指令被处理器运行时,完成权利要求1-6任一项所述宫颈癌术后生存预测方法所述步骤。
10.一种计算机可读存储介质,其特征在于,用于存储计算机指令,所述计算机指令被处理器执行时,完成权利要求1-6任一项所述宫颈癌术后生存预测方法所述步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010488882.6A CN111640518A (zh) | 2020-06-02 | 2020-06-02 | 一种宫颈癌术后生存预测方法、系统、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010488882.6A CN111640518A (zh) | 2020-06-02 | 2020-06-02 | 一种宫颈癌术后生存预测方法、系统、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111640518A true CN111640518A (zh) | 2020-09-08 |
Family
ID=72332407
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010488882.6A Pending CN111640518A (zh) | 2020-06-02 | 2020-06-02 | 一种宫颈癌术后生存预测方法、系统、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111640518A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112397172A (zh) * | 2020-12-24 | 2021-02-23 | 上海墩庐生物医学科技有限公司 | 一种乳腺癌生存智能顾问互联网应用系统 |
CN112435743A (zh) * | 2020-12-09 | 2021-03-02 | 上海市第一人民医院 | 一种基于机器学习的膀胱癌病理组学智能诊断方法及其预后模型 |
CN112992346A (zh) * | 2021-04-09 | 2021-06-18 | 中山大学附属第三医院(中山大学肝脏病医院) | 重症脊髓损伤预后的预测模型的建立方法 |
CN113436740A (zh) * | 2021-07-03 | 2021-09-24 | 北京大学第三医院(北京大学第三临床医学院) | 术后不良结局风险的预测模型的构建方法 |
CN113517073A (zh) * | 2021-09-13 | 2021-10-19 | 生物岛实验室 | 肺癌手术后生存率预测方法和系统 |
CN113658698A (zh) * | 2021-08-05 | 2021-11-16 | 江苏省人民医院(南京医科大学第一附属医院) | 一种宫颈腺癌预后方法 |
CN114420291A (zh) * | 2022-01-14 | 2022-04-29 | 安徽省肿瘤医院 | 基于机器学习的胃癌淋巴结转移风险评估系统、设备及存储介质 |
CN114496306A (zh) * | 2022-01-28 | 2022-05-13 | 北京大学口腔医学院 | 基于机器学习的预后生存阶段预测方法和系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090061423A1 (en) * | 2005-02-18 | 2009-03-05 | Wyeth | Pharmacogenomic markers for prognosis of solid tumors |
CN106874663A (zh) * | 2017-01-26 | 2017-06-20 | 中电科软件信息服务有限公司 | 心脑血管疾病风险预测方法及系统 |
CN109902421A (zh) * | 2019-03-08 | 2019-06-18 | 山东大学齐鲁医院 | 一种宫颈癌预后评估方法、系统、存储介质及计算机设备 |
CN110577998A (zh) * | 2019-01-31 | 2019-12-17 | 上海交通大学医学院附属仁济医院 | 预测肝癌术后早期复发风险分子模型的构建及其应用评估 |
CN110648761A (zh) * | 2019-09-04 | 2020-01-03 | 广东技术师范大学 | 基于机器学习预测扩张型心肌病患者生存率的方法 |
-
2020
- 2020-06-02 CN CN202010488882.6A patent/CN111640518A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090061423A1 (en) * | 2005-02-18 | 2009-03-05 | Wyeth | Pharmacogenomic markers for prognosis of solid tumors |
CN106874663A (zh) * | 2017-01-26 | 2017-06-20 | 中电科软件信息服务有限公司 | 心脑血管疾病风险预测方法及系统 |
CN110577998A (zh) * | 2019-01-31 | 2019-12-17 | 上海交通大学医学院附属仁济医院 | 预测肝癌术后早期复发风险分子模型的构建及其应用评估 |
CN109902421A (zh) * | 2019-03-08 | 2019-06-18 | 山东大学齐鲁医院 | 一种宫颈癌预后评估方法、系统、存储介质及计算机设备 |
CN110648761A (zh) * | 2019-09-04 | 2020-01-03 | 广东技术师范大学 | 基于机器学习预测扩张型心肌病患者生存率的方法 |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112435743A (zh) * | 2020-12-09 | 2021-03-02 | 上海市第一人民医院 | 一种基于机器学习的膀胱癌病理组学智能诊断方法及其预后模型 |
CN112397172A (zh) * | 2020-12-24 | 2021-02-23 | 上海墩庐生物医学科技有限公司 | 一种乳腺癌生存智能顾问互联网应用系统 |
CN112992346A (zh) * | 2021-04-09 | 2021-06-18 | 中山大学附属第三医院(中山大学肝脏病医院) | 重症脊髓损伤预后的预测模型的建立方法 |
CN112992346B (zh) * | 2021-04-09 | 2023-05-09 | 中山大学附属第三医院(中山大学肝脏病医院) | 重症脊髓损伤预后的预测模型的建立方法 |
CN113436740A (zh) * | 2021-07-03 | 2021-09-24 | 北京大学第三医院(北京大学第三临床医学院) | 术后不良结局风险的预测模型的构建方法 |
CN113658698A (zh) * | 2021-08-05 | 2021-11-16 | 江苏省人民医院(南京医科大学第一附属医院) | 一种宫颈腺癌预后方法 |
CN113517073A (zh) * | 2021-09-13 | 2021-10-19 | 生物岛实验室 | 肺癌手术后生存率预测方法和系统 |
CN113517073B (zh) * | 2021-09-13 | 2022-04-12 | 生物岛实验室 | 肺癌手术后生存率预测模型构建方法和预测模型系统 |
CN114420291A (zh) * | 2022-01-14 | 2022-04-29 | 安徽省肿瘤医院 | 基于机器学习的胃癌淋巴结转移风险评估系统、设备及存储介质 |
CN114496306A (zh) * | 2022-01-28 | 2022-05-13 | 北京大学口腔医学院 | 基于机器学习的预后生存阶段预测方法和系统 |
CN114496306B (zh) * | 2022-01-28 | 2022-12-20 | 北京大学口腔医学院 | 基于机器学习的预后生存阶段预测方法和系统 |
WO2023143232A1 (zh) * | 2022-01-28 | 2023-08-03 | 北京大学口腔医学院 | 基于机器学习的预后生存阶段预测方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111640518A (zh) | 一种宫颈癌术后生存预测方法、系统、设备及介质 | |
CN111640509A (zh) | 一种宫颈癌术后复发风险预测方法及系统 | |
Bristow et al. | Ovarian malignancy risk stratification of the adnexal mass using a multivariate index assay | |
Kaijser et al. | Improving strategies for diagnosing ovarian cancer: a summary of the International Ovarian Tumor Analysis (IOTA) studies | |
KR102061800B1 (ko) | 기계 학습을 이용한 난소암의 예후 예측 방법, 장치 및 프로그램 | |
JP6063446B2 (ja) | 細胞におけるバイオマーカーの発現の積率による解析 | |
Kaijser | Towards an evidence-based approach for diagnosis and management of adnexal masses: findings of the International Ovarian Tumour Analysis (IOTA) studies | |
CN111739641A (zh) | 一种胃癌风险预测方法、系统、计算机设备及可读存储介质 | |
Olthof et al. | The role of lymph nodes in cervical cancer: incidence and identification of lymph node metastases—a literature review | |
Nunes et al. | A prospective validation of the IOTA logistic regression models (LR1 and LR2) in comparison to subjective pattern recognition for the diagnosis of ovarian cancer | |
CN111440869A (zh) | 一种用于预测原发性乳腺癌发生风险的dna甲基化标记物及其筛选方法和应用 | |
CN115375640A (zh) | 一种肿瘤异质性识别方法、装置、电子设备、存储介质 | |
Pareek et al. | [Retracted] Predicting the Spread of Vessels in Initial Stage Cervical Cancer through Radiomics Strategy Based on Deep Learning Approach | |
CN110760585A (zh) | 前列腺癌生物标志物及其应用 | |
Mathur et al. | Detecting malignancy of ovarian tumour using convolutional neural network: A review | |
Zheng et al. | Initial CT-based radiomics nomogram for predicting in-hospital mortality in patients with traumatic brain injury: a multicenter development and validation study | |
CN112382341B (zh) | 一种用于鉴定食管鳞癌预后相关的生物标志物的方法 | |
CN113345589A (zh) | 肝癌预后模型的构建方法及应用方法、电子设备 | |
CN116805509A (zh) | 结直肠癌免疫治疗预测标志物的构建方法及应用 | |
Kahaki et al. | Weakly supervised deep learning for predicting the response to hormonal treatment of women with atypical endometrial hyperplasia: a feasibility study | |
KR102305806B1 (ko) | 임상 정보와 유전자 다형성 정보를 이용한 폐암 환자의 수술 후 예후 예측 방법 | |
CN113284619A (zh) | 预测前列腺癌患者术后出现生化复发的方法及设备 | |
Akter et al. | Ovarian Cancer Classification from Pathophysiological Complications using Machine Learning Techniques | |
CN116013528B (zh) | 结合fish检测的膀胱癌术后复发风险预测方法、装置及介质 | |
CN116779179B (zh) | 一种基于支持向量机的肾细胞瘤背景信息分析系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |