CN111640509A - 一种宫颈癌术后复发风险预测方法及系统 - Google Patents

一种宫颈癌术后复发风险预测方法及系统 Download PDF

Info

Publication number
CN111640509A
CN111640509A CN202010488525.XA CN202010488525A CN111640509A CN 111640509 A CN111640509 A CN 111640509A CN 202010488525 A CN202010488525 A CN 202010488525A CN 111640509 A CN111640509 A CN 111640509A
Authority
CN
China
Prior art keywords
cervical cancer
model
risk
recurrence
clinical data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010488525.XA
Other languages
English (en)
Inventor
宋坤
褚然
李莉
谯旭
苏绚涛
解琳
陈威
姚舒
苑存忠
孔北华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qilu Hospital of Shandong University
Original Assignee
Qilu Hospital of Shandong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qilu Hospital of Shandong University filed Critical Qilu Hospital of Shandong University
Priority to CN202010488525.XA priority Critical patent/CN111640509A/zh
Publication of CN111640509A publication Critical patent/CN111640509A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Epidemiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Computational Mathematics (AREA)
  • Primary Health Care (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Analysis (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Biomedical Technology (AREA)
  • Algebra (AREA)
  • Pathology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Operations Research (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明提供一种宫颈癌术后复发风险预测方法及系统,属于医学技术领域。本发明提供一种以“中危病理因素”为基础的预测模型,达到对早期宫颈癌患者术后疾病复发风险的预测效果,立足点为“无高危病理因素的早期宫颈癌患者的术后疾病复发风险评估”,从而可以实现对宫颈癌患者术后任何一时间点的疾病复发风险预测,同时本发明使用验证组的数据和机器学习算法两种模型验证方法,同时对所得模型进行了外部验证,进一步保证了所构建模型的预测准确率,因此具有良好的实际应用之价值。

Description

一种宫颈癌术后复发风险预测方法及系统
技术领域
本发明属于医学技术领域,具体涉及一种宫颈癌术后复发风险预测方法及系统。
背景技术
公开该背景技术部分的信息仅仅旨在增加对本发明的总体背景的理解,而不必然被视为承认或以任何形式暗示该信息构成已经成为本领域一般技术人员所公知的现有技术。
全球范围内,每年有50多万女性被诊断出患有宫颈癌,并且有30多万人死于该病。虽然宫颈癌筛查降低了宫颈癌的发病率,但宫颈癌的全球数据显示,在过去几十年里,患者的生存率并没有得到明显的改善。此外,近90%的宫颈癌患者死亡发生在发展中国家和资源匮乏的国家。根治性子宫切除术联合盆腔淋巴结清扫术是早期宫颈癌患者的首选手术方案。另外早期宫颈癌患者的术后病理结果对患者的预后也有一定的影响。2018年FIGO分期系统首次纳入手术危险因素和淋巴结状态。除了盆腔淋巴结是否转移,其他病理高危因素包括宫旁浸润及手术切缘阳性等。此外,国际妇科肿瘤协会(GOG)将淋巴血管间隙浸润、宫颈间质浸润和肿瘤大小作为Sedlis标准,作为患者辅助治疗方案的中危因素。
对于存在中危病理因素的早期宫颈癌患者,手术治疗后的辅助治疗方案选择仍存在一定争议。欧洲肿瘤医学协会(ESMO)宫颈癌临床实践指南建议:存在中等风险的患者不需要进一步的辅助治疗;FIGO宫颈癌指南建议:如果患者有以下两种危险因素(肿瘤最大直径大于4cm、淋巴血管间隙浸润、深部宫颈间质浸润)中的任何一种高危因素,术后则建议行放疗,不建议行化疗;除此之外,在美国国家综合癌症子宫颈癌的临床实践指南推荐:手术后淋巴淋巴结阴性患者,术前确诊为IA2、IB1或IIA1,如果病人有较大的肿瘤包块、深部SI和/或LVSI,则需要进行骨盆体外放射治疗。
因此,国际医疗界对存在中危病理因素的宫颈癌患者的术后危险评估及辅助治疗方案的选择目前仍然存在争议。早期宫颈癌患者术后复发风险的预测,对患者术后的诊疗与随访至关重要。此外,发明人发现,目前尚无文献报道利用Sedlis标准中危病理因素对早期宫颈癌患者的术后复发进行评估和预测。
发明内容
本发明提供一种宫颈癌术后复发风险预测方法及系统。本发明提供一种以“中危病理因素”为基础的预测模型,达到对早期宫颈癌患者术后疾病复发风险的预测效果。立足点为“无高危病理因素的早期宫颈癌患者的术后疾病复发风险评估”,从而可以实现对宫颈癌患者术后任何一时间点的疾病复发风险预测,因此具有良好的实际应用之价值。
为了实现上述技术目的,本发明采用下述技术方案:
本发明的第一个方面,提供一种宫颈癌术后复发风险预测方法,所述方法包括:
获取宫颈癌术后患者的临床数据;
根据已建立的宫颈癌术后复发风险预测模型对待测对象进行预测,得到待测对象的宫颈癌术后复发风险的预测结果;
其中,所述宫颈癌术后复发风险预测模型是通过将预先采集的宫颈癌术后患者的临床数据采用算法进行模型训练获得。
进一步的,宫颈癌术后复发风险预测模型构建具体方法包括:
S1、以患者术后无进展生存期(DFS)为结局,使用建模组预处理后的宫颈癌患者的临床数据,运用单因素COX回归分析进行对上述临床因素进行危险因素的筛选;
S2、将单因素COX回归分析获得的危险因素,与Sedlis标准中的中危病理因素和术后辅助治疗方案等多个因素进行组合,使用COX多因素分析的方法建立复发预测模型;优选的,将上述复发预测模型,使用诺莫图(Nomogram)的方法进行展示;从而计算每一位患者术后复发的风险得分,并且获得在术后固定时间内(如术后1年、2年等均可计算)的复发风险。
本发明的第二个方面,提供一种宫颈癌术后复发风险预测系统,所述系统包括:
临床数据获取和处理模块:获取宫颈癌术后患者临床数据并进行预处理;
危险因素筛选模块:以患者术后无进展生存期(DFS)为结局,对上述处理后的临床数据进行单因素COX回归分析,获得危险因素;
模型构建模块:以患者无进展生存期(DFS)为结局,对筛选出的危险因素与Sedlis标准中的中危病理因素和术后辅助治疗方案等多个因素进行组合,使用COX多因素分析的方法建立复发预测模型。
本发明的第三个方面,提供一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成上述宫颈癌术后复发风险预测方法所进行的步骤。
本发明的第四个方面,提供一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成上述宫颈癌术后复发风险预测方法所进行的步骤。
上述一个或多个技术方案的有益技术效果:
(1)该模型构建和验证过程,以机器学习算法为基础。将传统的模型构建方法和机器学习进行结合,可以有效的提高模型构建的准确性。并且机器学习算法的外部验证过程,可以弥补回顾性研究,无前瞻性验证的缺陷。
(2)该模型的患者适用范围为不包含病理高危因素的IA2-IA2期,并且首次治疗方案为广泛子宫切除及盆腔淋巴结清扫的早期宫颈癌患者。因此该模型预测患者术后复发的适用范围更加精准。
(3)对连续型数据(比如患者的年龄、身高及体重等),采取ROC曲线最佳约登值的方法寻找最佳临界点,对患者年龄进行二分类的分组。
(4)危险因素的筛选,使用了单因素COX回归分析的算法,高危因素筛选的过程更加严谨,对宫颈癌患者术后死亡风险的预测更加精准。
(5)使用多因素COX回归分析进行模型的建立,并且基于模型建立相应的列线表,可以准确的获得每位患者术后疾病复发的风险得分,进而更加简单、便捷及个性化的快速检测每位患者的术后疾病复发风险。
(6)本发明的模型验证过程主要分为两步:1)独立的验证队列验证,该验证组的数据未进行模型的构建,是独立的患者分组,用于所建立模型的外部验证,可获得预测模型的区分度(曲线下面积)、敏感度和特异度;2)机器学习算法验证,使用建模组和验证组所有的患者,使用5种机器学习算法(逻辑回归/随机森林/决策树/朴素贝叶斯/Adaboost),采用5倍交叉验证的方法,获得预测模型的区分度(曲线下面积)、敏感度和特异度。以上两步验证的过程,均对模型的验证能力进行了全面的评估。
(7)上述技术方案同时使用了5种机器学习算法,可以互相弥补各种算法之间的不足,进一步的提高模型的预测准确率,保证所构建预测模型的质量。
(8)模型的构建和验证过程算法严谨,并且随着入组病例数的增加,可以进一步的提高模型的预测准确率。
综上,上述技术方案系首次提出,立足点为“无高危病理因素的早期宫颈癌患者的术后复发风险评估”,对早期宫颈癌的精准诊疗有重要的意义,因此具有良好的实际应用之价值。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1为本发明实施例1中宫颈癌术后复发风险预测方法路线图。
图2为本发明实施例1中基于机器学习算法的模型外部验证图。
图3为本发明实施例1中列线表模式图。
图4为本发明实施例1中机器学习ROC曲线模式图。
具体实施方式
应该指出,以下详细说明都是例示性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。应理解,本发明的保护范围不局限于下述特定的具体实施方式;还应当理解,本发明实施例中使用的术语是为了描述特定的具体实施方式,而不是为了限制本发明的保护范围。下列具体实施方式中如果未注明具体条件的实验方法,通常按照本领域技术内的常规方法和条件。
本发明提供一种以“中危病理因素”为基础的预测模型,达到对早期宫颈癌患者术后疾病复发风险的预测效果。立足点为“无高危病理因素的早期宫颈癌患者的术后疾病复发风险评估”,从而可以实现对宫颈癌患者术后任何一时间点的疾病复发风险预测。因此该发明对早期宫颈癌的精准诊疗有重要的意义。本发明中以无进展生存期(DFS)为结局,运用单因素及多因素COX回归分析进行模型的构建,使用列线表的方式展现模型,并且计算患者术后的疾病复发风险得分,进一步获得患者在术后特定时间的疾病复发风险。同时本发明使用验证组的数据和机器学习算法(逻辑回归/随机森林/决策树/朴素贝叶斯/Adaboost)两种模型验证方法,同时对所得模型进行了外部验证,进一步保证了所构建模型的预测准确率。
具体的,本发明的一个典型实施方式中,提供一种宫颈癌术后复发风险预测方法,所述方法包括:
获取宫颈癌术后患者的临床数据;
根据已建立的宫颈癌术后复发风险预测模型对待测对象进行预测,得到待测对象的宫颈癌术后复发风险的预测结果;
其中,所述宫颈癌术后复发风险预测模型是通过将预先采集的宫颈癌术后患者的临床数据采用算法进行模型训练获得。
本发明的又一具体实施方式中,获取宫颈癌术后患者的临床数据包括但不限于年龄、孕产史、HPV分型、FIGO分期、手术方式、术后病理、辅助治疗方案和合并症。
需要说明的是,本发明中患者具体为:IA2-IIA2期,无高危因素(淋巴结转移、宫旁浸润及切缘阳性),且经过广泛子宫切除及盆腔淋巴结清扫的宫颈癌患者。
本发明的又一具体实施方式中,所述术后病理包括但不限于病理学类型、病理学分化程度、肿瘤最大直径、淋巴管间隙状态和宫颈间质浸润深度。
本发明的又一具体实施方式中,对临床数据进行预处理,具体的,对临床数据中的连续型数据(如年龄)采取ROC曲线最佳约登值的方法寻找最佳临界点,进行二分类的分组;对临床数据中的分类数据,如患者的HPV分型、FIGO分期(2009版分期)、手术方式、术后病理和辅助治疗方案等,均作为分组数据处理,如下所示
Figure BDA0002520146750000071
本发明的又一具体实施方式中,所述算法优选为单因素COX回归分析和多因素COX回归分析。
本发明的又一具体实施方式中,宫颈癌术后复发风险预测模型构建具体方法包括:
S1、以患者术后无进展生存期(DFS)为结局,使用建模组预处理后的宫颈癌患者的临床数据,运用单因素COX回归分析进行对上述临床因素进行危险因素的筛选;
S2、将单因素COX回归分析所得的危险因素,与Sedlis标准中的中危病理因素以及术后辅助治疗方案等多个因素进行组合,以无进展生存期(DFS)为结局,使用多因素Cox回归分析构建预测模型;优选的,将上述预测模型,使用列线表(Nomogram)的方法进行展示。该表可根据各危险因素所占的权重,计算每一位患者术后复发的风险得分,并且获得在术后固定时间内(如术后1年、2年等均可计算)的复发风险。
本发明的又一具体实施方式中,所述步骤S2中,单因素COX回归分析所得的危险因素p值小于0.10;
Sedlis标准中的中危病理因素包括淋巴血管间隙浸润、宫颈间质浸润和肿瘤大小。
本发明的又一具体实施方式中,使用受试者工作特征曲线(ROC)判断模型的区分度;如果ROC曲线的下面积大于设定阈值(0.6),则表示宫颈癌术后复发风险预测模型预测能力满足要求,输出宫颈癌术后复发风险预测模型;
本发明的又一具体实施方式中,对上述宫颈癌术后复发风险预测模型进行验证,判断模型的区分能力。
本发明的又一具体实施方式中,所述验证方法包括模型的外部验证和/或基于机器学习算法的模型外部验证;
其中,所述模型的外部验证方法具体为:使用验证组宫颈癌患者的临床数据,对上述构建的模型进行验证,获得模型的ROC曲线,敏感度和特异度。ROC曲线下面积大于设定阈值(0.6),被认为存在良好的模型区分度;
所述基于机器学习算法的模型外部验证方法具体为:将建模组与验证组患者进行组合,利用上述模型中所得的危险因素,运用机器学习算法采用5折交叉验证的方法,获得ROC曲线,判断模型的区分能力。
本发明的又一具体实施方式中,所述机器学习算法包括逻辑回归(LR)、随机森林(RF)、决策树(DT)、朴素贝叶斯(NB)、Adaboost(Ada)的任意一种或多种。本发明采用多种机器学习算法,可以互相弥补各种算法之间的不足,进一步的提高模型的准确率,保证模型的质量。
本发明的又一具体实施方式中,提供一种宫颈癌术后复发风险预测系统,所述系统包括:
临床数据获取和处理模块:获取宫颈癌术后患者临床数据并进行预处理;
危险因素筛选模块:以患者术后无进展生存期(DFS)为结局,对上述处理后的临床数据进行单因素COX回归分析,获得危险因素;
模型构建模块:以患者无进展生存期(DFS)为结局,对筛选出的危险因素(优选p值小于0.10)与Sedlis标准中的中危病理因素以及术后辅助治疗方案等多个因素进行组合,使用多因素Cox回归分析构建预测模型。
其中,临床数据获取和处理模块中,
宫颈癌术后患者临床数据包括但不限于年龄、孕产史、HPV分型、FIGO分期、手术方式、术后病理、辅助治疗方案和合并症。
本发明的又一具体实施方式中,对临床数据中的连续型数据(如年龄)采取ROC曲线最佳约登值的方法寻找最佳临界点,进行二分类的分组;对临床数据中的分类数据均作为分组数据进行处理。
本发明的又一具体实施方式中,模型构建模块中,将构建获得的预测模型,使用列线表(nomogram)的方法展示,该表可根据各危险因素所占的权重,计算每一位患者术后复发的风险得分,并且获得在术后固定时间内(如术后1年、2年等均可计算)的复发风险。
本发明的又一具体实施方式中,所述系统还包括模型验证模块,所述模型验证模块包括模型外部验证模块和机器学习算法验证模块;
本发明的又一具体实施方式中,所述模型外部验证模块:使用验证组宫颈癌患者的临床数据,对上述构建的模型进行验证,同时获得验证队列的ROC曲线,判断模型的区分能力。当ROC曲线下面积大于0.6,被认为存在良好的模型区分度。
本发明的又一具体实施方式中,所述机器学习算法验证模块:将建模组与验证组患者进行组合,利用上述模型中所得危险因素,运用机器学习算法采用5折交叉验证的方法进行测试。获得ROC曲线,并且获得模型的敏感度及特异度。同样的,ROC曲线下面积大于0.6,被认为存在良好的模型区分度。
本发明的又一具体实施方式中,所述机器学习算法包括逻辑回归(LR)、随机森林(RF)、决策树(DT)、朴素贝叶斯(NB)、Adaboost(Ada)中的任意一种或多种。本发明采用多种机器学习算法,可以互相弥补各种算法之间的不足,进一步的提高模型的准确率,保证模型的质量。
本发明的又一具体实施方式中,提供一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成上述宫颈癌术后复发风险预测方法所进行的步骤。
本发明的又一具体实施方式中,提供一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成上述宫颈癌术后复发风险预测方法所进行的步骤。
为了使得本领域技术人员能够更加清楚地了解本发明的技术方案,以下将结合具体的实施例详细说明本发明的技术方案。
实施例1
1.根据2009年FIGO分期系统确定为IA2-IIA2期的宫颈癌患者;
2.术前未行新辅助化疗或放疗;
3.手术方式为改良型或根治型子宫切除术及盆腔淋巴结清扫术;
4.术后病理结果不包含淋巴结转移、宫旁浸润及切缘阳性三个病理高危因素;
5.不同时合并其他原发恶性肿瘤;
6.术后随访时间至少2年以上。
(1)患者入组人数:400例以上。
(2)患者分组:将上述患者按照3:1的比例随机分为建模组与验证组。
(3)建模所用临床资料的收集:收集上述患者的基本临床资料,包括:年龄、孕产史、HPV分型、FIGO分期、手术方式、术后病理(病理学类型、病理学分化程度、肿瘤最大直径、淋巴管间隙状态、宫颈间质浸润范围)、辅助治疗方案以及合并症等。
(4)临床资料的分组:将将上述获得的患者临床资料,进行分组,作为构建临床分析模型的基础。对连续型数据,比如患者的年龄、身高及体重等,我们采取ROC曲线最佳约登值的方法寻找最佳临界点,对患者年龄进行二分类的分组。对于分类数据,比如患者的HPV分型、FIGO分期(2009版分期)、手术方式、术后病理和辅助治疗方案等,均作为分组数据处理,如下表所示。
Figure BDA0002520146750000121
(5)模型的构建:以患者术后的无进展生存期(DFS)为结局,使用建模组宫颈癌患者的临床数据,运用单因素COX回归分析进行危险因素筛选。将p值小于0.10的危险因素,与Sedlis标准中的3个中危病理因素以及术后辅助治疗方案等多个因素进行组合,使用COX多因素分析的方法建立复发预测模型。
无进展生存期(DFS)定义为:无进展生存时间是指肿瘤疾病患者从接受治疗开始,到观察到疾病进展或者发生因为任何原因的复发之间的这段时间。
(6)模型的展示:上一步建立的预测模型,使用列线表(nomogram)的方法展示,该表可根据各危险因素所占的权重,计算每一位患者术后复发的风险得分,并且获得在术后固定时间内(如术后1年、2年等均可计算)的复发风险。
(7)模型的外部验证:使用验证组宫颈癌患者的临床数据,对上述构建的模型进行验证,获得模型的ROC曲线,敏感度和特异度。ROC曲线下面积大于0.6,被认为存在良好的模型区分度。
(8)基于机器学习算法的模型外部验证:机器学习是继专家系统之后人工智能应用的又一重要研究领域,也是人工智能和神经计算的核心研究课题之一。将上述建模组与验证组患者进行组合,利用上述模型中所得的危险因素,运用广泛使用的5种机器学习算法:逻辑回归(LR)、随机森林(RF)、决策树(DT)、朴素贝叶斯(NB)、Adaboost(Ada),采用5折交叉验证的方法,即所有患者随机分为5个相等大小的亚样本组,其中4个亚样本组作为训练数据,最后一个亚样本组作为验证数据进行测试。通过验证组所得的ROC曲线,使用上述5种机器学习算法,获得ROC曲线,以及模型的敏感度及特异度。同样的,ROC曲线下面积大于0.6,被认为存在良好的模型区分度。
(9)若上述两种验证过程,即模型的外部验证和基于机器学习算法的模型外部验证均可获得ROC曲线下面积大于0.6的结果,则说明模型构建有效。上述过程可开发成自动医学分析小程序,对无病理高危因素的早期宫颈癌患者术后的辅助治疗方案进行指导。
实施例2
一种宫颈癌术后复发风险预测系统,所述系统包括:
临床数据获取和处理模块:获取宫颈癌术后患者临床数据并进行预处理;
危险因素筛选模块:以患者术后无进展生存期(DFS)为结局,对上述处理后的临床数据进行单因素COX回归分析,获得危险因素;
模型构建模块:以患者无进展生存期(DFS)为结局,对筛选出的危险因素(优选p值小于0.10)与Sedlis标准中的中危病理因素以及术后辅助治疗方案等多个因素进行组合,使用多因素Cox回归分析构建预测模型。
其中,临床数据获取和处理模块中,
宫颈癌术后患者临床数据包括年龄、孕产史、HPV分型、FIGO分期、手术方式、术后病理、辅助治疗方案和合并症。
对临床数据中的连续型数据(如年龄)采取ROC曲线最佳约登值的方法寻找最佳临界点,进行二分类的分组;对临床数据中的分类数据均作为分组数据进行处理。
模型构建模块中,将构建获得的预测模型,使用列线表(nomogram)的方法展示,该表可根据各危险因素所占的权重,计算每一位患者术后复发的风险得分,并且获得在术后固定时间内(如术后1年、2年等均可计算)的复发风险。
所述系统还包括模型验证模块,所述模型验证模块包括模型外部验证模块和机器学习算法验证模块;
所述模型外部验证模块:使用验证组宫颈癌患者的临床数据,对上述构建的模型进行验证,同时获得验证队列的ROC曲线,判断模型的区分能力。当ROC曲线下面积大于0.6,被认为存在良好的模型区分度。
所述机器学习算法验证模块:将建模组与验证组患者进行组合,利用上述模型中所得危险因素,运用5种机器学习算法(逻辑回归(LR)、随机森林(RF)、决策树(DT)、朴素贝叶斯(NB)、Adaboost(Ada))采用5折交叉验证的方法进行测试。获得ROC曲线,并且获得模型的敏感度及特异度。同样的,ROC曲线下面积大于0.6,被认为存在良好的模型区分度。
实施例3
一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成实施例1方法中的各个操作,为了简洁,在此不再赘述。
所述电子设备可以是移动终端以及非移动终端,非移动终端包括台式计算机,移动终端包括智能手机(Smart Phone,如Android手机、IOS手机等)、智能眼镜、智能手表、智能手环、平板电脑、笔记本电脑、个人数字助理等可以进行无线通信的移动互联网设备。
应理解,在本发明中,该处理器可以是中央处理单元CPU,该处理器还算可以是其他通用处理器、数字信号处理器DSP、专用集成电路ASIC,现成可编程门阵列FPGA或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
该存储器可以包括只读存储器和随机存取存储器,并向处理器提供指令和数据、存储器的一部分还可以包括非易失性随机存储器。例如,存储器还可以存储设备类型的信息。
在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。结合本发明所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器、闪存、只读存储器、可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。为避免重复,这里不再详细描述。本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元即算法步骤,能够以电子硬件或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其他的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能的划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外一点,所显示或讨论的相互之间的耦合或者直接耦合或者通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性、机械或其它的形式。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
应注意的是,以上实例仅用于说明本发明的技术方案而非对其进行限制。尽管参照所给出的实例对本发明进行了详细说明,但是本领域的普通技术人员可根据需要对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围。

Claims (10)

1.一种宫颈癌术后复发风险预测方法,其特征在于,所述方法包括:
获取宫颈癌术后患者的临床数据;
根据已建立的宫颈癌术后复发风险预测模型对待测对象进行预测,得到待测对象的宫颈癌术后复发风险的预测结果;
其中,所述宫颈癌术后复发风险预测模型是通过将预先采集的宫颈癌术后患者的临床数据采用算法进行模型训练获得。
2.如权利要求1所述的宫颈癌术后复发风险预测方法,其特征在于,获取宫颈癌术后患者的临床数据包括年龄、孕产史、HPV分型、FIGO分期、手术方式、术后病理、辅助治疗方案和合并症;
优选的,患者具体为:IA2-IIA2期,无高危因素(淋巴结转移、宫旁浸润及切缘阳性),且经过广泛子宫切除及盆腔淋巴结清扫的宫颈癌患者;
优选的,所述术后病理包括病理学类型、病理学分化程度、肿瘤最大直径、淋巴管间隙状态和宫颈间质浸润深度。
3.如权利要求1所述的宫颈癌术后复发风险预测方法,其特征在于,对临床数据进行预处理,具体的,对临床数据中的连续型数据采取ROC曲线最佳约登值的方法寻找最佳临界点,进行二分类的分组;对临床数据中的分类数据,均作为分组数据处理。
4.如权利要求1所述的宫颈癌术后复发风险预测方法,其特征在于,所述算法为单因素COX回归分析和多因素COX回归分析;
优选的,宫颈癌术后复发风险预测模型构建具体方法包括:
S1、以患者术后无进展生存期(DFS)为结局,使用建模组预处理后的宫颈癌患者的临床数据,运用单因素COX回归分析进行对上述临床因素进行危险因素的筛选;
S2、将单因素COX回归分析所得的危险因素,与Sedlis标准中的中危病理因素以及术后辅助治疗方案等多个因素进行组合,以无进展生存期为结局,使用多因素Cox回归分析构建预测模型;
优选的,将上述预测模型,使用列线表的方法进行展示;
优选的,所述步骤S2中,单因素COX回归分析所得的危险因素p值小于0.10;
Sedlis标准中的中危病理因素包括淋巴血管间隙浸润、宫颈间质浸润和肿瘤大小。
5.如权利要求4所述的宫颈癌术后复发风险预测方法,其特征在于,使用受试者工作特征曲线判断模型的区分度;如果ROC曲线的下面积大于设定阈值(0.6),则表示宫颈癌术后复发风险预测模型预测能力满足要求,输出宫颈癌术后复发风险预测模型;
优选的,对所述宫颈癌术后复发风险预测模型进行验证,判断模型的区分能力;
所述验证方法包括模型的外部验证和/或基于机器学习算法的模型外部验证。
6.如权利要求5所述的宫颈癌术后复发风险预测方法,其特征在于,所述模型的外部验证方法具体为:使用验证组宫颈癌患者的临床数据,对上述构建的模型进行验证,获得模型的ROC曲线,敏感度和特异度;
所述基于机器学习算法的模型外部验证方法具体为:将建模组与验证组患者进行组合,利用上述模型中所得的危险因素,运用机器学习算法采用5折交叉验证的方法,获得ROC曲线,判断模型的区分能力;
所述机器学习算法包括逻辑回归、随机森林、决策树、朴素贝叶斯、Adaboost的任意一种或多种。
7.一种宫颈癌术后复发风险预测系统,其特征在于,所述系统包括:
临床数据获取和处理模块:获取宫颈癌术后患者临床数据并进行预处理;
危险因素筛选模块:以患者术后无进展生存期(DFS)为结局,对上述处理后的临床数据进行单因素COX回归分析,获得危险因素;
模型构建模块:以患者无进展生存期(DFS)为结局,对筛选出的危险因素(优选p值小于0.10)与Sedlis标准中的中危病理因素以及术后辅助治疗方案等多个因素进行组合,使用多因素Cox回归分析构建预测模型。
8.如权利要求7所述的宫颈癌术后复发风险预测系统,其特征在于,临床数据获取和处理模块中,
宫颈癌术后患者临床数据包括年龄、孕产史、HPV分型、FIGO分期、手术方式、术后病理、辅助治疗方案和合并症;
对临床数据中的连续型数据采取ROC曲线最佳约登值的方法寻找最佳临界点,进行二分类的分组;对临床数据中的分类数据均作为分组数据进行处理;
模型构建模块中,将构建获得的预测模型,使用列线表的方法展示;
优选的,所述系统还包括模型验证模块,所述模型验证模块包括模型外部验证模块和机器学习算法验证模块;
所述模型外部验证模块:使用验证组宫颈癌患者的临床数据,对上述构建的模型进行验证,同时获得验证队列的ROC曲线,判断模型的区分能力;当ROC曲线下面积大于0.6,被认为存在良好的模型区分度;
所述机器学习算法验证模块:将建模组与验证组患者进行组合,利用上述模型中所得危险因素,运用机器学习算法采用5折交叉验证的方法进行测试;获得ROC曲线,并且获得模型的敏感度及特异度;
优选的,所述机器学习算法包括逻辑回归、随机森林、决策树、朴素贝叶斯、Adaboost中的任意一种或多种。
9.一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,其特征在于,所述计算机指令被处理器运行时,完成权利要求1-6任一项所述宫颈癌术后复发风险预测方法所述步骤。
10.一种计算机可读存储介质,其特征在于,用于存储计算机指令,所述计算机指令被处理器执行时,完成权利要求1-6任一项所述宫颈癌术后复发风险预测方法所述步骤。
CN202010488525.XA 2020-06-02 2020-06-02 一种宫颈癌术后复发风险预测方法及系统 Pending CN111640509A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010488525.XA CN111640509A (zh) 2020-06-02 2020-06-02 一种宫颈癌术后复发风险预测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010488525.XA CN111640509A (zh) 2020-06-02 2020-06-02 一种宫颈癌术后复发风险预测方法及系统

Publications (1)

Publication Number Publication Date
CN111640509A true CN111640509A (zh) 2020-09-08

Family

ID=72331323

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010488525.XA Pending CN111640509A (zh) 2020-06-02 2020-06-02 一种宫颈癌术后复发风险预测方法及系统

Country Status (1)

Country Link
CN (1) CN111640509A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112397172A (zh) * 2020-12-24 2021-02-23 上海墩庐生物医学科技有限公司 一种乳腺癌生存智能顾问互联网应用系统
CN112420200A (zh) * 2020-10-27 2021-02-26 上海交通大学医学院附属瑞金医院 一种胰腺导管内乳头状黏液肿瘤早期恶变预测系统
CN112614128A (zh) * 2020-12-31 2021-04-06 山东大学齐鲁医院 一种基于机器学习的内镜下辅助活检的系统及方法
CN112785256A (zh) * 2021-01-14 2021-05-11 田进伟 临床试验中临床终点事件的实时评定方法及评定系统
CN112835316A (zh) * 2021-01-06 2021-05-25 重庆医科大学 新生儿败血症休克预测系统及监控设备
CN112991320A (zh) * 2021-04-07 2021-06-18 德州市人民医院 脑出血患者血肿扩大风险预测系统及方法
CN113517073A (zh) * 2021-09-13 2021-10-19 生物岛实验室 肺癌手术后生存率预测方法和系统
CN113552355A (zh) * 2021-07-21 2021-10-26 中国医学科学院北京协和医院 一种宫颈癌预后评分系统及其应用
CN113730080A (zh) * 2021-10-18 2021-12-03 重庆医科大学 结直肠癌患者术后护理装置及预测系统
CN114783607A (zh) * 2022-05-10 2022-07-22 中南大学湘雅医院 一种手术输血风险预测模型及其网络计算器的构建方法
CN116013528A (zh) * 2023-01-10 2023-04-25 中山大学孙逸仙纪念医院 结合fish检测的膀胱癌术后复发风险预测方法、装置及介质
WO2023143232A1 (zh) * 2022-01-28 2023-08-03 北京大学口腔医学院 基于机器学习的预后生存阶段预测方法和系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108334909A (zh) * 2018-03-09 2018-07-27 南京天数信息科技有限公司 基于ResNet的宫颈癌TCT数字切片数据分析方法
CN108565017A (zh) * 2018-04-23 2018-09-21 杜欣欣 一种宫颈病变的临床决策系统及其方法
CN108611416A (zh) * 2018-05-09 2018-10-02 中国科学院昆明动物研究所 一种基于多基因表达特征谱的宫颈癌个性化预后评估方法
CN109902421A (zh) * 2019-03-08 2019-06-18 山东大学齐鲁医院 一种宫颈癌预后评估方法、系统、存储介质及计算机设备
WO2020021261A1 (en) * 2018-07-24 2020-01-30 Dysis Medical Limited Computer classification of biological tissue

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108334909A (zh) * 2018-03-09 2018-07-27 南京天数信息科技有限公司 基于ResNet的宫颈癌TCT数字切片数据分析方法
CN108565017A (zh) * 2018-04-23 2018-09-21 杜欣欣 一种宫颈病变的临床决策系统及其方法
CN108611416A (zh) * 2018-05-09 2018-10-02 中国科学院昆明动物研究所 一种基于多基因表达特征谱的宫颈癌个性化预后评估方法
WO2020021261A1 (en) * 2018-07-24 2020-01-30 Dysis Medical Limited Computer classification of biological tissue
CN109902421A (zh) * 2019-03-08 2019-06-18 山东大学齐鲁医院 一种宫颈癌预后评估方法、系统、存储介质及计算机设备

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112420200A (zh) * 2020-10-27 2021-02-26 上海交通大学医学院附属瑞金医院 一种胰腺导管内乳头状黏液肿瘤早期恶变预测系统
CN112397172A (zh) * 2020-12-24 2021-02-23 上海墩庐生物医学科技有限公司 一种乳腺癌生存智能顾问互联网应用系统
CN112614128A (zh) * 2020-12-31 2021-04-06 山东大学齐鲁医院 一种基于机器学习的内镜下辅助活检的系统及方法
CN112835316A (zh) * 2021-01-06 2021-05-25 重庆医科大学 新生儿败血症休克预测系统及监控设备
CN112835316B (zh) * 2021-01-06 2022-04-19 重庆医科大学 新生儿败血症休克预测系统及监控设备
CN112785256A (zh) * 2021-01-14 2021-05-11 田进伟 临床试验中临床终点事件的实时评定方法及评定系统
CN112991320A (zh) * 2021-04-07 2021-06-18 德州市人民医院 脑出血患者血肿扩大风险预测系统及方法
CN113552355B (zh) * 2021-07-21 2022-05-20 中国医学科学院北京协和医院 一种宫颈癌预后评分系统及其应用
CN113552355A (zh) * 2021-07-21 2021-10-26 中国医学科学院北京协和医院 一种宫颈癌预后评分系统及其应用
CN113517073A (zh) * 2021-09-13 2021-10-19 生物岛实验室 肺癌手术后生存率预测方法和系统
CN113517073B (zh) * 2021-09-13 2022-04-12 生物岛实验室 肺癌手术后生存率预测模型构建方法和预测模型系统
CN113730080A (zh) * 2021-10-18 2021-12-03 重庆医科大学 结直肠癌患者术后护理装置及预测系统
WO2023143232A1 (zh) * 2022-01-28 2023-08-03 北京大学口腔医学院 基于机器学习的预后生存阶段预测方法和系统
CN114783607A (zh) * 2022-05-10 2022-07-22 中南大学湘雅医院 一种手术输血风险预测模型及其网络计算器的构建方法
CN114783607B (zh) * 2022-05-10 2023-06-23 中南大学湘雅医院 一种手术输血风险预测模型及其网络计算器的构建方法
CN116013528A (zh) * 2023-01-10 2023-04-25 中山大学孙逸仙纪念医院 结合fish检测的膀胱癌术后复发风险预测方法、装置及介质
CN116013528B (zh) * 2023-01-10 2023-11-24 中山大学孙逸仙纪念医院 结合fish检测的膀胱癌术后复发风险预测方法、装置及介质

Similar Documents

Publication Publication Date Title
CN111640509A (zh) 一种宫颈癌术后复发风险预测方法及系统
US11462325B2 (en) Multimodal machine learning based clinical predictor
CN111640518A (zh) 一种宫颈癌术后生存预测方法、系统、设备及介质
Spohn et al. Radiomics in prostate cancer imaging for a personalized treatment approach-current aspects of methodology and a systematic review on validated studies
CN112289455A (zh) 一种人工智能神经网络学习模型构建系统、构建方法
CN111640503B (zh) 一种晚期肺癌患者的肿瘤突变负荷的预测系统及方法
CN112561908B (zh) 乳腺图像病灶匹配方法、装置及存储介质
Wang et al. A novel approach combined transfer learning and deep learning to predict TMB from histology image
CN111440869A (zh) 一种用于预测原发性乳腺癌发生风险的dna甲基化标记物及其筛选方法和应用
CN112735592B (zh) 肺癌预后模型的构建方法及应用方法、电子设备
CN112542247A (zh) 乳腺癌新辅助化疗后病理学完全缓解概率预测方法及系统
Nunes et al. A prospective validation of the IOTA logistic regression models (LR1 and LR2) in comparison to subjective pattern recognition for the diagnosis of ovarian cancer
CN115375640A (zh) 一种肿瘤异质性识别方法、装置、电子设备、存储介质
Pareek et al. Predicting the spread of vessels in initial stage cervical cancer through radiomics strategy based on deep learning approach
CN111370061A (zh) 基于蛋白标记物与人工智能的癌症筛查方法
CN115881296B (zh) 一种甲状腺乳头状癌(ptc)风险辅助分层系统
CN116703880A (zh) 一种免疫状态预测模型构建方法、预测方法及构建装置
CN112382341B (zh) 一种用于鉴定食管鳞癌预后相关的生物标志物的方法
CN111863248B (zh) 一种构建临床决策模型的有效方法
Wang et al. Diagnostic and prognostic nomograms for lung metastasis in triple-negative breast cancer
KR102305806B1 (ko) 임상 정보와 유전자 다형성 정보를 이용한 폐암 환자의 수술 후 예후 예측 방법
Jha et al. Breast Cancer Prediction Using Voting Classifier Model
Akter et al. Ovarian Cancer Classification from Pathophysiological Complications using Machine Learning Techniques
CN117558452B (zh) Mods风险评估模型构建方法、装置、设备及介质
CN117554628B (zh) 用于mods早期预警的炎症因子组合物、模型及试剂盒

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination