CN112542247B - 乳腺癌新辅助化疗后病理学完全缓解概率预测方法及系统 - Google Patents

乳腺癌新辅助化疗后病理学完全缓解概率预测方法及系统 Download PDF

Info

Publication number
CN112542247B
CN112542247B CN202011155176.6A CN202011155176A CN112542247B CN 112542247 B CN112542247 B CN 112542247B CN 202011155176 A CN202011155176 A CN 202011155176A CN 112542247 B CN112542247 B CN 112542247B
Authority
CN
China
Prior art keywords
breast cancer
pathology
model
probability
chemotherapy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011155176.6A
Other languages
English (en)
Other versions
CN112542247A (zh
Inventor
宋尔卫
龚畅
沈君
杨雅平
程子亮
林婉宜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sun Yat Sen Memorial Hospital Sun Yat Sen University
Bioisland Laboratory
Original Assignee
Sun Yat Sen Memorial Hospital Sun Yat Sen University
Bioisland Laboratory
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sun Yat Sen Memorial Hospital Sun Yat Sen University, Bioisland Laboratory filed Critical Sun Yat Sen Memorial Hospital Sun Yat Sen University
Priority to PCT/CN2020/126030 priority Critical patent/WO2022036869A1/zh
Publication of CN112542247A publication Critical patent/CN112542247A/zh
Application granted granted Critical
Publication of CN112542247B publication Critical patent/CN112542247B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment

Landscapes

  • Medical Informatics (AREA)
  • Engineering & Computer Science (AREA)
  • Public Health (AREA)
  • Health & Medical Sciences (AREA)
  • Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明公开了一种乳腺癌新辅助化疗后病理学完全缓解概率预测方法,包括:S1.形成训练集;S2.筛选出独立预测因子;S3.获得权重得分;S4.分析计算乳腺癌新辅助化疗后病理学完全缓解的概率预测值。本发明又公开了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现步骤S1‑S4。本发明又公开了一种乳腺癌新辅助化疗后病理学完全缓解概率预测系统,包括训练集生成模块、多因素回归分析筛选模块、列线图模型构建及展示模块、权重得分生成模块、净收益分析模块。本发明能筛选出低获益可能的患者,并最终使这部分患者免除新辅助化疗。

Description

乳腺癌新辅助化疗后病理学完全缓解概率预测方法及系统
技术领域
本发明涉及医学信息技术领域,具体涉及一种乳腺癌新辅助化疗后病理学完全缓解概率的预测方法、预测系统,以及装有执行该预测方法的程序的计算机可读存储介质、乳腺癌新辅助化疗后病理学完全缓解概率预测模型的构建方法。
背景技术
乳腺癌是威胁全球妇女健康的主要恶性肿瘤之一,约70%的乳腺癌为激素受体阳性型。新辅助化疗可以缩小肿瘤的大小从而达到乳腺癌保乳手术和药物敏感性监测的目的。但与激素受体阴性的乳腺癌不同,激素受体阳性型乳腺癌对化疗的应答率相对较低,病理学完全缓解率为7%至38%。然而,激素受体阳性型乳腺癌患者实现病理学完全缓解后通常有较好的长期生存。有数个研究探索多基因模型与激素受体阳性型乳腺癌中新辅助化疗(NAC)诱导的病理学完全缓解(pCR)的关系,但很少有模型显示出对NAC后 pCR情况较强的预测价值。有学者回顾性分析Oncotype DX 21基因模型在含有989名雌激素受体阳性(HR+)、人表皮因子受体2阴性(HER2-)的乳腺癌患者人群中与NAC后pCR的关系,发现高的Oncotype DX风险评分(大于30分)与新辅助化疗后pCR的相关(优势比4.87,95%的置信区间2.01-11.82),Oncotype DX 多基因模型可以帮助识别合适NAC的人群。此外,包含有50基因的PAM50多基因模型的复发风险评分(ROR) 被用来评估淋巴结阴性的I期HR+绝经后乳腺癌、淋巴结阴性的II期HR+绝经后乳腺癌和1至3个淋巴结阳性的HR+绝经后乳腺癌患者远期复发风险。一项回顾性研究分析在HR+HER2-乳腺癌患者中,ROR评分与 NAC诱导的残余肿瘤负荷(RCB)的关系(RCB-0/I被认为等同于pCR状态,RCB-II/III被认为等同于非病理学完全缓解状态)发现,ROR评分是NAC应答的预测因子(p=0.047)。当ROR评分为30、50、70、90 时,患者对新辅助化疗敏感的估算概率分别为0.09、0.14、0.22、0.29,即ROR评分每升高20个点,这个病人增加59.1%的几率会对新辅助化疗敏感。ABCSG-34研究中,研究者根据患者的月经状态、HR表达水平、肿瘤分级及Ki 67水平的情况,决定患者行新辅助化疗或新辅助内分泌治疗。有研究,回顾性地将 ABCSG-34研究中的患者根据12基因EndoPredict的分子评分(MS),将患者分为高风险和低风险人群。其中,该研究将新辅助化疗人群,根据MS分为高风险的患者若实现RCB-0/I,则定义为阳性结果。研究分析发现,在新辅助化疗人群中,MS具有高敏感性(100%),低特异性(8.9%),低阳性预测值(26.4%),受试者工作特征(ROC)曲线下面积(AUC)95%置信区间(CI)为0.736(0.63,0.84)。
上述多基因模型预测HR+乳腺癌NAC诱导pCR概率尚未广泛应用于临床,使用Oncotype DX和PAM50 等多基因模型预测NAC诱导pCR概率仍有部分缺点。第一,目前的研究中很少有模型显示出对NAC后pCR 具有较强的预测价值,诊断效能低。第二,多基因模型检测价格昂贵,多被用于辅助术后辅助治疗的决策制定,推广难度大。第三,目前的多基因模型未纳入影像学等个体化信息。
发明内容
有鉴于此,有必要针对上述的问题,提出一种乳腺癌新辅助化疗后病理学完全缓解概率的预测方法、预测系统,以及装有执行该预测方法的程序的计算机可读存储介质、乳腺癌新辅助化疗后病理学完全缓解概率预测模型的构建方法,能减少新辅助化疗低获益可能的乳腺癌患者进行新辅助化疗,特别是激素受体阳性型乳腺癌,可定量地预测激素受体阳性型乳腺癌患者在接受新辅助化疗后实现病理学完全缓解的概率,筛选出低获益可能的患者,并最终使这部分患者免除新辅助化疗。
为实现上述目的,本发明采取以下的技术方案:
本发明提出一种乳腺癌新辅助化疗后病理学完全缓解概率预测方法,该方法包括以下步骤:
S1.收集患者信息,形成训练集;
S2.在S1形成的训练集中,通过多因素回归分析筛选出与临床病理状态相关的独立预测因子;
S3.将于S2获得的与临床病理状态相关的独立预测因子构建成列线图模型,同时获得纳入列线图模型的各个独立预测因子的权重得分;
S4.通过列线图模型分析获得乳腺癌新辅助化疗后病理学完全缓解的概率预测值。
本发明又提出一种乳腺癌新辅助化疗后病理学完全缓解概率预测模型的构建方法,该构建方法包括以下步骤:
S1,收集患者信息,形成训练集;
S2,在S1形成的训练集中,通过多因素回归分析筛选出与临床病理状态相关的独立预测因子;
S3,将S2获得的与临床病理状态相关的独立预测因子构建成列线图模型,同时获得纳入列线图模型的各个独立预测因子的权重得分;
S4,通过列线图模型分析获得乳腺癌新辅助化疗后病理学完全缓解的阈值概率的净收益,以评估该预测模型的临床效用。
本发明又提出一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现以下步骤S1-S4:
S1.收集患者信息,形成训练集;
S2.在S1形成的训练集中,通过多因素回归分析筛选出与临床病理状态相关的独立预测因子;
S3.将于S2获得的与临床病理状态相关的独立预测因子构建成列线图模型,同时获得纳入列线图模型的各个独立预测因子的权重得分;
S4.通过列线图模型分析获得乳腺癌新辅助化疗后病理学完全缓解的概率预测值。
进一步地,如前述任一项所述的预测方法或构建方法或计算机可读存储介质,于S1中,所述患者信息为需进行新辅助化疗的激素受体阳性型乳腺癌患者信息。
进一步地,如前述任一项所述的预测方法或构建方法或计算机可读存储介质,所述激素受体阳性型乳腺癌患者信息包括人口学特征信息、临床病理特征信息、术前乳腺癌穿刺标本的10-miRNA风险分值和定量动态对比增强MRI影像学特征信息基础信息。
进一步地,如前述任一项所述的预测方法或构建方法或计算机可读存储介质,于S2中,通过相关性分析获得新辅助化疗诱导的病理学完全缓解的影响因素,并在训练集中通过多因素回归分析筛选出与临床病理状态相关的独立预测因子;和/或,步骤S2还包括将训练集中患者术后病理结果分为病理学完全缓解组和非病理学完全缓解组。
进一步地,如前述任一项所述的预测方法或构建方法或计算机可读存储介质,于S3中,所述列线图模型的独立预测因子包括四个信息变量,分别为10-miRNA风险分值、孕激素受体水平、人表皮生长因子受体-2状态、容量转移常数。
进一步地,如前述任一项所述的预测方法或构建方法或计算机可读存储介质,于S3与S4之间还包括:
S31,对S3构建的列线图模型进行内部验证及外部验证,通过校准曲线与一致性指数的方式确定列线图模型的预测精度和判别能力。
进一步地,如前述任一项所述的预测方法或构建方法或计算机可读存储介质,S4包括以下步骤:
S41,获取列线图模型的四个信息变量的总分值;所述总分值评分公式为:总分值=孕激素受体水平分值+人表皮生长因子受体-2状态分值+10-miRNA风险分值+容量转移常数;
S42,根据所述总分值计算所述乳腺癌患者新辅助化疗后获得病理学完全缓解的概率预测值。
进一步地,如前述任一项所述的预测方法或构建方法或计算机可读存储介质,S4还包括以下步骤:
S43,将总分值与高获益组截断值进行数值对比,从而将患者划分为高获益组及获得低获益组,并根据概率预测值对高获益组及获得低获益组的患者判断是否建议患者进行新辅助化疗。
进一步地,如前述任一项所述的预测方法或构建方法或计算机可读存储介质,其中所述10-miRNA是从35个基因中筛出10个miRNAs,包括miR-30c、miR-21、miR-181a、miR-181c、miR-125b、miR-7、miR-200a、 miR-135b、miR-22和miR–200c,通过LASSO Cox回归建立RS危险评分公式,所得的模型系数即各miRNA 的权重,通过所述危险评分公式得到10-miRNA风险分值。
本发明还提出一种预测乳腺癌新辅助化疗后病理学完全缓解概率的模型,所述模型由上述构建方法构建。
本发明还提出前述任一项预测方法或构建方法或模型或计算机可读存储介质在制备诊断产品中的应用。
本发明还提出一种乳腺癌新辅助化疗后病理学完全缓解概率预测系统,该系统包括:
训练集生成模块,用于将收集的信息形成训练集;
多因素回归分析筛选模块,用于在由所述训练集生成模块生成的训练集中通过多因素回归分析筛选出与临床病理状态相关的独立预测因子;
列线图模型构建及展示模块,用于将由所述多因素回归分析筛选模块获得的与临床病理状态相关的独立预测因子构建成列线图模型并以列线图模型形式予以展示;
权重得分生成模块,用于获得纳入列线图模型的各个独立预测因子的权重得分;
净收益分析模块,用于通过列线图模型的决策曲线分析计算乳腺癌新辅助化疗后病理学完全缓解的概率预测值。
进一步地,该系统还包括以下模块的至少一种:
信息收集模块,用于收集需进行新辅助化疗的激素受体阳性型乳腺癌患者信息;
病理结果分组模块,用于在由所述训练集生成模块生成的训练集中将乳腺癌手术术后的病理结果分为病理学完全缓解组和非病理学完全缓解组;
相关性分析模块,用于通过相关性分析获得新辅助化疗诱导的病理学完全缓解的影响因素;
列线图模型验证模块,用于对由所述列线图模型构建及展示模块构建成的列线图模型进行内部验证及外部验证,通过校准曲线与一致性指数的方式确定列线图模型的预测精度和判别能力。
进一步地,所述多因素回归分析筛选模块筛选出与临床病理状态相关的独立预测因子包括四个信息变量,分别为10-miRNA风险分值、孕激素受体水平、人表皮生长因子受体-2状态、容量转移常数。
进一步地,所述净收益分析模块包括总分值获取子模块、概率预测值获取子模块和化疗建议判断子模块;
所述总分值获取子模块用于获取列线图模型的四个信息变量的总分值;
所述概率预测值获取子模块用于根据所述总分值计算所述激素受体阳性型乳腺癌患者新辅助化疗后获得病理学完全缓解的概率预测值;
所述化疗建议判断子模块用于将所述总分值与高获益组截断值进行数值对比,从而将患者划分为高获益组及获得低获益组,并根据所述概率预测值对高获益组及获得低获益组的患者判断是否建议患者进行新辅助化疗。
进一步地,如前述任一项所述的预测方法或构建方法或计算机可读存储介质,其中所述10-miRNA是从35个基因中筛出10个miRNAs,包括miR-30c、miR-21、miR-181a、miR-181c、miR-125b、miR-7、miR-200a、 miR-135b、miR-22和miR–200c,通过LASSO Cox回归建立RS危险评分公式,所得的模型系数即各miRNA 的权重,通过所述危险评分公式得到10-miRNA风险分值。
本发明的有益效果为:
本发明利用模型预测新辅助化疗诱导的病理学完全缓解的概率可以帮助筛选出更适合行新辅助化疗的激素受体阳性型乳腺癌患者,避免新辅助化疗反应不好的激素受体阳性型乳腺癌患者接受不必要的新辅助化疗所带来的毒副作用,并且因为未获得病理完全缓解而切换到新的治疗策略的时间上的浪费,帮助医师优化治疗策略,进一步指导患者选择合适的时机进行手术、化疗和(或)内分泌治疗。本发明在既往的回顾性研究建立的基于10个miRNAs的RS危险评分系统可以很好的预测激素受体阳性乳腺癌患者的复发风险,并未在前瞻性的人群中验证其对于新辅助治疗疗效的预测价值;本发明提供一种结合miRNA风险分值、临床病理特征和定量动态对比增强MRI影像学特征信息的列线图模型应用,可定量地预测激素受体阳性型乳腺癌患者在接受新辅助化疗后实现病理学完全缓解的概率,筛选出低获益可能的患者,并最终使这部分患者免除新辅助化疗。现有的多基因模型作为一种辅助诊断及决策制定的手段,多被用于辅助术后辅助治疗的决策制定,其作为预测HR+乳腺癌NAC诱导pCR概率的作用尚未在临床上推广。从目前相关的研究中,多基因模型用于预测HR+乳腺癌NAC诱导pCR概率的诊断效能低,且多基因模型检测价格昂贵,推广难度大,另外多基因模型未纳入影像学等个体化信息。本发明在既往的回顾性研究建立的基于10个miRNAs的RS危险评分系统可以很好的预测激素受体阳性乳腺癌患者的复发风险,但该评分并未在前瞻性人群中严重其对于新辅助化疗疗效的评估情况。此外多基因模型未能将预测乳腺癌患者从新辅助化疗的获益量化,临床实践中制定诊疗决策时,患者及其家属难以参与诊疗决策制定。而本发明的列线图模型,基于真实世界数据,计算个体化新辅助化疗获益的概率,患者及其家属能快速地理解并参与诊疗决策的制定。
与现有技术相比较,本发明具有准确性高、临床实用性强、使用方便的优点,因本发明是基于真实世界数据,首次构建并验证了一种用于激素受体阳性型乳腺癌中预测新辅助化疗诱导病理学完全缓解概率的非编码多基因和功能成像组合的模型。乳腺癌新辅助化疗诱导病理学完全缓解概率的可视化评估系统,是一种对医疗数据进行快速处理的信息化新方法。量化地区分高获益可能与低获益可能的人群,协助临床医生制定临床决策,助于患者及其家属了解自身病情,帮助一部分患者免除新辅助化疗,避免化疗的毒性和治疗时间的浪费。
附图说明
图1为本发明建立的预测乳腺癌新辅助化疗后病理学完全缓解概率的列线图模型;
图2为本发明经LASSO Cox回归建立10-miRNA的RS危险评分公式;
图3为本发明于训练集中列线图预测与真实的术后病理结果之间的校准曲线;
图4为本发明于验证集中列线图预测与真实的术后病理结果之间的校准曲线;
图5为本发明列线图模型、孕激素受体水平、人表皮受体因子2状态、10-miRNA风险分值,容量转移常数分别对新辅助化疗病理疗效预测评估的关于训练集的受试者工作特征曲线;
图6为本发明列线图模型、孕激素受体水平、人表皮受体因子2状态、10-miRNA风险分值,容量转移常数分别对新辅助化疗病理疗效预测评估的关于验证集的受试者工作特征曲线;
图7为本发明基于10-miRNA RS的多组学优化模型、单纯的10-miRNA RS模型、孕激素受体水平模型、人表皮受体因子2状态模型、容量转移常数模型分别对新辅助化疗病理疗效预测评估的决策曲线;
图8为本发明一种乳腺癌新辅助化疗后病理学完全缓解概率预测方法的工作流程图。
其中,图1中,Points:分数;PR_组:孕激素受体水平分组;HER2:人表皮生长因子受体2状态;RS_ 组:10-miRNA风险分值;Ktrans:容量转移常数组;Total Points:总分;Linear Predictor:线性预测值;PCR:病理学完全缓解概率。
图2中,Risk score:风险分值;expression:各miRNA表达量;系数:各miRNA权重。
图3中,横坐标是列线图模型预测事件发生率;纵坐标是实际事件发生率;ActualpCR Probabbility 的含义是:实际病理完全缓解概率;Apparent的含义是:拟合线;Bias-corrected的含义是:修正线; Ideal的含义是:参考线;Nomogram-Predicted pCRProbability的含义是:列线图-预测病理完全缓解概率;B=1000repetitions,boot的含义是:采用bootstrap方法重复抽取1000次;Mean absolute error=0.028n=273的含义是:平均绝对误差=0.028n=273。
图4中,横坐标是列线图模型预测事件发生率;纵坐标是实际事件发生率;ActualpCR Probabbility 的含义是:实际病理完全缓解概率;Apparent的含义是:拟合线;Bias-corrected的含义是:修正线; Ideal的含义是:参考线;Nomogram-Predicted pCRProbability的含义是:列线图-预测病理完全缓解概率;B=1000repetitions,boot的含义是:采用bootstrap方法重复抽取1000次;Mean absolute error=0.031n=98的含义是:平均绝对误差=0.031n=98。
图5中,横坐标是预测的精确度;纵坐标是预测的灵敏度;Sensitivity的含义是:敏感度;Model_AUC 的含义是:模型-曲线下面积;RS_AUC的含义是:风险分值_曲线下面积;Ktrans_AUC的含义是:容量转移常数_曲线下面积;PR_AUC的含义是:孕激素受体水平_曲线下面积;HER2_AUC的含义是:人表皮生长因子受体2状态_曲线下面积;Specificity的含义是:精确度。
图6中,横坐标是预测的精确度;纵坐标是预测的灵敏度;Sensitivity的含义是:敏感度;Model_AUC 的含义是:模型-曲线下面积;RS_AUC的含义是:风险分值_曲线下面积;Ktrans_AUC的含义是:容量转移常数_曲线下面积;PR_AUC的含义是:孕激素受体水平_曲线下面积;HER2_AUC的含义是:人表皮生长因子受体2状态_曲线下面积;Specificity的含义是:精确度。
图7中,横坐标是高风险阈值;纵坐标是净收益;Net Benefit的含义是:净收益;High Risk Threshold 的含义是:高风险阈值;Model的含义是:模型;RS的含义是:10-miRNA风险分值;Ktrans的含义是:容量转移常数;HER2的含义是:人表皮生长因子2状态;PR的含义是:孕激素受体水平;All的含义是:均达到病理完全缓解;None的含义是:均未达到病理完全缓解。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明实施例,对本发明的技术方案作进一步清楚、完整地描述。需要说明的是,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
本实施例提出一种乳腺癌新辅助化疗后病理学完全缓解概率预测方法,该方法包括以下步骤:
S1.收集患者信息,形成训练集;
S2.在S1形成的训练集中,通过多因素回归分析筛选出与临床病理状态相关的独立预测因子;
S3.将于S2获得的与临床病理状态相关的独立预测因子构建成列线图模型,同时获得纳入列线图模型的各个独立预测因子的权重得分;
S4.通过列线图模型分析计算乳腺癌新辅助化疗后病理学完全缓解的概率预测值。
进一步地,于S1中,所述患者信息为激素受体阳性型乳腺癌患者信息,包括人口学特征信息、临床病理特征信息、术前乳腺癌穿刺标本的10-miRNA风险分值和定量动态对比增强MRI影像学特征信息基础信息。
进一步地,于S2中,通过相关性分析获得新辅助化疗诱导的病理学完全缓解的影响因素,并在训练集中通过多因素回归分析筛选出与临床病理状态相关的独立预测因子;和/或,步骤S2还包括将训练集中患者术后病理结果分为病理学完全缓解组和非病理学完全缓解组。
进一步地,于S3中,所述列线图模型的独立预测因子包括四个信息变量,分别为10-miRNA风险分值、孕激素受体水平、人表皮生长因子受体-2状态、容量转移常数。
进一步地,S4包括以下步骤:
S41,获取列线图模型的四个信息变量的总分值;所述总分值评分公式为:总分值=孕激素受体水平分值+人表皮生长因子受体-2状态分值+10-miRNA风险分值+容量转移常数;
S42,根据所述总分值计算所述乳腺癌患者新辅助化疗后获得病理学完全缓解的概率预测值。
进一步地,S4还包括以下步骤:
S43,将总分值与高获益组截断值进行数值对比,从而将患者划分为高获益组及获得低获益组,并根据概率预测值对高获益组及获得低获益组的患者判断是否建议患者进行新辅助化疗。
进一步地,于S3与S4之间还包括:
S31,对S3构建的列线图模型进行内部验证及外部验证,通过校准曲线与一致性指数的方式确定列线图模型的预测精度和判别能力。
实施例2
本实施例提出一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现以下步骤S1-S4:
S1.收集患者信息,形成训练集;
S2.在S1形成的训练集中,通过多因素回归分析筛选出与临床病理状态相关的独立预测因子;
S3.将于S2获得的与临床病理状态相关的独立预测因子构建成列线图模型,同时获得纳入列线图模型的各个独立预测因子的权重得分;
S4.通过列线图模型分析计算乳腺癌新辅助化疗后病理学完全缓解的概率预测值。
进一步地,于S1中,所述患者信息为激素受体阳性型乳腺癌患者信息,包括人口学特征信息、临床病理特征信息、术前乳腺癌穿刺标本的10-miRNA风险分值和定量动态对比增强MRI影像学特征信息基础信息。
进一步地,于S2中,通过相关性分析获得新辅助化疗诱导的病理学完全缓解的影响因素,并在训练集中通过多因素回归分析筛选出与临床病理状态相关的独立预测因子;和/或,步骤S2还包括将训练集中患者术后病理结果分为病理学完全缓解组和非病理学完全缓解组。
进一步地,于S3中,所述列线图模型的独立预测因子包括四个信息变量,分别为10-miRNA风险分值、孕激素受体水平、人表皮生长因子受体-2状态、容量转移常数。
进一步地,S4包括以下步骤:
S41,获取列线图模型的四个信息变量的总分值;所述总分值评分公式为:总分值=孕激素受体水平分值+人表皮生长因子受体-2状态分值+10-miRNA风险分值+容量转移常数;
S42,根据所述总分值计算所述乳腺癌患者新辅助化疗后获得病理学完全缓解的概率预测值。
进一步地,S4还包括以下步骤:
S43,将总分值与高获益组截断值进行数值对比,从而将患者划分为高获益组及获得低获益组,并根据概率预测值对高获益组及获得低获益组的患者判断是否建议患者进行新辅助化疗。
进一步地,于S3与S4之间还包括:
S31,对S3构建的列线图模型进行内部验证及外部验证,通过校准曲线与一致性指数的方式确定列线图模型的预测精度和判别能力。
实施例3
本实施例提出一种乳腺癌新辅助化疗后病理学完全缓解概率预测模型的构建方法,该构建方法包括以下步骤:
S1.收集患者信息,形成训练集;
S2.在S1形成的训练集中,通过多因素回归分析筛选出与临床病理状态相关的独立预测因子;
S3.将S2获得的与临床病理状态相关的独立预测因子构建成列线图模型,同时获得纳入列线图模型的各个独立预测因子的权重得分;
S4.通过列线图模型分析计算乳腺癌新辅助化疗后病理学完全缓解的阈值概率的净收益,以评估该预测模型的临床效用。
进一步地,于S1中,所述患者信息为激素受体阳性型乳腺癌患者信息,包括人口学特征信息、临床病理特征信息、术前乳腺癌穿刺标本的10-miRNA风险分值和定量动态对比增强MRI影像学特征信息基础信息。
进一步地,于S2中,通过相关性分析获得新辅助化疗诱导的病理学完全缓解的影响因素,并在训练集中通过多因素回归分析筛选出与临床病理状态相关的独立预测因子;和/或,步骤S2还包括将训练集中患者术后病理结果分为病理学完全缓解组和非病理学完全缓解组。
进一步地,于S3中,所述列线图模型的独立预测因子包括四个信息变量,分别为10-miRNA风险分值、孕激素受体水平、人表皮生长因子受体-2状态、容量转移常数。
进一步地,S4包括以下步骤:
S41,获取列线图模型的四个信息变量的总分值;所述总分值评分公式为:总分值=孕激素受体水平分值+人表皮生长因子受体-2状态分值+10-miRNA风险分值+容量转移常数;
S42,根据所述总分值计算所述乳腺癌患者新辅助化疗后获得病理学完全缓解的概率预测值。
进一步地,S4还包括以下步骤:
S43,将总分值与高获益组截断值进行数值对比,从而将患者划分为高获益组及获得低获益组,并根据概率预测值对高获益组及获得低获益组的患者判断是否建议患者进行新辅助化疗。
进一步地,于S3与S4之间还包括:
S31,对S3构建的列线图模型进行内部验证及外部验证,通过校准曲线与一致性指数的方式确定列线图模型的预测精度和判别能力。
实施例4
本实施例提出一种乳腺癌新辅助化疗后病理学完全缓解概率预测系统,该系统包括:
训练集生成模块,用于将收集的信息形成训练集;
多因素回归分析筛选模块,用于在由所述训练集生成模块生成的训练集中通过多因素回归分析筛选出与临床病理状态相关的独立预测因子;
列线图模型构建及展示模块,用于将由所述多因素回归分析筛选模块获得的与临床病理状态相关的独立预测因子构建成列线图模型并以列线图模型形式予以展示;
权重得分生成模块,用于获得纳入列线图模型的各个独立预测因子的权重得分;
净收益分析模块,用于通过列线图模型的决策曲线分析计算乳腺癌新辅助化疗后病理学完全缓解的概率预测值。
进一步地,该系统还包括以下模块的至少一种:
信息收集模块,用于收集需进行新辅助化疗的激素受体阳性型乳腺癌患者信息;
病理结果分组模块,用于在由所述训练集生成模块生成的训练集中将乳腺癌手术术后的病理结果分为病理学完全缓解组和非病理学完全缓解组;
相关性分析模块,用于通过相关性分析获得新辅助化疗诱导的病理学完全缓解的影响因素;
列线图模型验证模块,用于对由所述列线图模型构建及展示模块构建成的列线图模型进行内部验证及外部验证,通过校准曲线与一致性指数的方式确定列线图模型的预测精度和判别能力。
进一步地,所述多因素回归分析筛选模块筛选出与临床病理状态相关的独立预测因子包括四个信息变量,分别为10-miRNA风险分值、孕激素受体水平、人表皮生长因子受体-2状态、容量转移常数。
进一步地,所述净收益分析模块包括总分值获取子模块、概率预测值获取子模块和化疗建议判断子模块;
所述总分值获取子模块用于获取列线图模型的四个信息变量的总分值;
所述概率预测值获取子模块用于根据所述总分值计算所述激素受体阳性型乳腺癌患者新辅助化疗后获得病理学完全缓解的概率预测值;
所述化疗建议判断子模块用于将所述总分值与高获益组截断值进行数值对比,从而将患者划分为高获益组及获得低获益组,并根据所述概率预测值对高获益组及获得低获益组的患者判断是否建议患者进行新辅助化疗。
实施例5
本实施例提出一种乳腺癌新辅助化疗后病理学完全缓解概率预测方法,包括以下步骤:
S1.在多中心前瞻性收集需要行新辅助化疗的激素受体阳性的乳腺癌患者信息,包括人口学特征信息、临床病理特征信息、术前乳腺癌穿刺标本的10-miRNA风险分值和定量动态对比增强MRI影像学特征信息基础数据,以中山大学孙逸仙纪念医院的数据作为训练集,山东大学附属第二医院、南昌市第三医院和广州医科大学附属第一医院的数据作为验证集;
S2.在训练集中,根据乳腺癌手术术后病理结果,分为病理学完全缓解组和非病理学完全缓解组,使用相关性分析,探索新辅助化疗诱导的病理完全缓解的影响因素,当p<0.05时,我们认为该变量与新辅助化疗后的临床病理状态具有相关性;在训练集中,通过多因素回归分析筛选出与临床病理状态相关的独立预测因子;
S3.将多因素回归分析的结果以列线图的形式展示出来,可以清晰的看到每个独立预测因子的权重得分,该步骤使用R软件实现;
S4.通过决策曲线分析计算阈值概率的净收益,以评估该预测模型的临床效用。
进一步地,于S3与S4之间,该预测方法还包括对所构建的列线图模型进行内部验证和外部验证,利用校准曲线与一致性指数来确定所构建的模型的预测精度和判别能力。
进一步地,适用于新辅助化疗前乳腺肿物和(或)腋窝淋巴结穿刺病理确诊为:激素受体阳性型乳腺癌,肿瘤TNM分期为II期及以上的非转移性乳腺癌的18岁以上的女性。
进一步地,S2步骤中,所述的纳入列线图模型的独立预测因子包括四个信息变量:10-miRNA风险分值,孕激素受体水平,人表皮生长因子受体2状态、容量转移常数。
进一步地,S3步骤中,所述的得到的列线图模型具体内容如附图1,其中,四个信息变量具体分值分别为,对于孕激素受体水平,孕激素受体水平大于20%者,得分0分;孕激素受体水平小于等于20%者,得分42.05分;
对于人表皮生长因子受体2状态,人表皮生长因子受体2状态阴性者,得分0分;人表皮生长因子受体2状态阳性者,得分37.41分;
对于10-miRNA风险分值,通过LASSO Cox回归建立如图2所示10-miRNA的RS危险评分公式,所得的模型系数即各miRNA的权重,通过所述公式得到10-miRNA风险分值。10-miRNA风险分值小于3.03分者,得分0分;10-miRNA风险分值大于等于3.03分者,得分76.44分;
对于容量转移常数,容量转移常数大于0.11者,得分0分;容量转移常数小于等于0.11,得分100 分。
进一步地,该列线图模型四个信息变量分值的总分对应模型倒数第三行总分值,总分260分;倒数第二行是线性预测值,通过Logistic多因素模型,可将对应位点线性预测值转化为最后一行相应的pCR概率值;根据所述总分值计算激素受体阳性型乳腺癌女性新辅助化疗后获得病理学完全缓解的概率预测值;所述总分值评分公式为:
孕激素受体水平(0或42.05)+人表皮生长因子受体2状态(0或37.41)+10-miRNA风险分值(0或 76.44)+容量转移常数(0或100)=总分值;
其中60分为高获益组截断值,
高获益组:所述总分值>60分为高分组病人,新辅助化疗后获得病理学完全缓解的概率为更高(例如 29.8%),可建议患者行新辅助化疗;
低获益组:所述总分值≤60分为低分组病人,新辅助化疗后获得病理学完全缓解的概率为较低(例如 3.0%),建议患者慎重行新辅助化疗。
实施例6
本实施例提出一种乳腺癌新辅助化疗后病理学完全缓解概率预测系统,该系统包括信息收集模块、训练集生成模块、病理结果分组模块、相关性分析模块、多因素回归分析筛选模块、列线图模型构建及展示模块、权重得分生成模块、列线图模型验证模块、确定列线图模型预测精度及判别能力模块和净收益分析模块;
所述信息收集模块用于通过多渠道中心收集需进行辅助化疗的激素受体阳性型乳腺癌患者信息;
所述训练集生成模块用于将由所述信息收集模块收集的信息形成训练集;
所述病理结果分组模块用于在由所述训练集生成模块生成的训练集中将乳腺癌手术术后的病理结果分为病理学完全缓解组和非病理学完全缓解组;
所述相关性分析模块用于通过相关性分析获得辅助化疗诱导的病理学完全缓解的影响因素;
所述多因素回归分析筛选模块用于在由所述训练集生成模块生成的训练集中通过多因素回归分析筛选出与临床病理状态相关的独立预测因子;
所述列线图模型构建及展示模块用于将由所述多因素回归分析筛选模块获得的与临床病理状态相关的独立预测因子构建成列线图模型并以列线图模型形式予以展示;
所述权重得分生成模块用于获得纳入列线图模型的各个独立预测因子的权重得分;
所述列线图模型验证模块用于对由所述列线图模型构建及展示模块构建成的列线图模型进行内部验证及外部验证;
所述确定列线图模型预测精度及判别能力模块用于通过校准曲线与一致性指数的方式确定列线图模型的预测精度和判别能力;
所述净收益分析模块用于通过列线图模型的决策曲线分析计算乳腺癌新辅助化疗后病理学完全缓解的概率预测值。
进一步地,所述多因素回归分析筛选模块筛选出与临床病理状态相关的独立预测因子包括四个信息变量,分别为10-miRNA风险分值、孕激素受体水平、人表皮生长因子受体-2状态、容量转移常数。
进一步地,所述净收益分析模块包括总分值获取子模块、与总分值对应的概率值获取子模块、概率预测值获取子模块、化疗建议判断子模块;
所述总分值获取子模块用于获取列线图模型的四个信息变量的总分值;
所述与总分值对应的概率值获取子模块用于将列线图模型的对应位点线性预测值转化为与总分值对应的乳腺癌新辅助化疗后病理学完全缓解的概率值;
所述概率预测值获取子模块用于根据所述总分值计算所述激素受体阳性型乳腺癌患者辅助化疗后获得病理学完全缓解的概率预测值;
所述化疗建议判断子模块用于将总分值与高获益组截断值进行数值对比,从而将患者划分为高获益组及获得低获益组,并根据概率预测值对高获益组及获得低获益组的患者判断是否建议患者进行新辅助化疗。
实施例7
本实施例提出一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现以下步骤S1-4:
S1.通过多渠道中心收集需进行辅助化疗的激素受体阳性型乳腺癌患者信息,将所收集的信息形成训练集;
S2.在于S1形成的训练集中,将乳腺癌手术术后的病理结果分为病理学完全缓解组和非病理学完全缓解组,通过相关性分析获得辅助化疗诱导的病理学完全缓解的影响因素,并在训练集中通过多因素回归分析筛选出与临床病理状态相关的独立预测因子;
S3.将于S2获得的与临床病理状态相关的独立预测因子构建成列线图模型并以列线图模型形式予以展示,并获得纳入列线图模型的各个独立预测因子的权重得分;
S4.通过列线图模型的决策曲线分析计算乳腺癌新辅助化疗后病理学完全缓解的阈值概率的净收益。
进一步地,于S3与S4之间,该预测方法还包括对所构建的列线图模型进行内部验证和外部验证,利用校准曲线与一致性指数来确定所构建的模型的预测精度和判别能力。
进一步地,S4包括以下步骤S41-S44:
S41,获取列线图模型的四个信息变量的总分值;所述总分值评分公式为:总分值=孕激素受体水平分值+人表皮生长因子受体-2状态分值+10-miRNA风险分值+容量转移常数;
S42,将列线图模型的对应位点线性预测值转化为与于S41获得的总分值对应的乳腺癌新辅助化疗后病理学完全缓解的概率值;
S43,根据所述总分值计算所述激素受体阳性型乳腺癌患者辅助化疗后获得病理学完全缓解的概率预测值;
S44,将总分值与高获益组截断值进行数值对比,从而将患者划分为高获益组及获得低获益组,并根据概率预测值对高获益组及获得低获益组的患者判断是否建议患者进行新辅助化疗。
实施例8
本实施例提出一种预测乳腺癌新辅助化疗后病理学完全缓解概率的列线图模型,所述风险预测模型的构建方法包括以下步骤:
S1.在多中心前瞻性收集需要行新辅助化疗的激素受体阳性的乳腺癌患者信息,包括人口学特征信息、临床病理特征信息、术前乳腺癌穿刺标本的10-miRNA风险分值和定量动态对比增强MRI影像学特征信息基础数据,以中山大学孙逸仙纪念医院的数据作为训练集,山东大学附属第二医院、南昌市第三医院和广州医科大学附属第一医院的数据作为验证集;
S2.在训练集中,根据乳腺癌手术术后病理结果,分为病理学完全缓解组和非病理学完全缓解组,使用相关性分析,探索新辅助化疗诱导的病理完全缓解的影响因素,当p<0.05时,则认为该变量与新辅助化疗后的临床病理状态具有相关性;在训练集中,通过多因素回归分析,筛选出与临床病理状态相关的独立预测因子;
S3.将多因素回归分析的结果以列线图的形式展示出来,可以清晰的看到每个独立预测因子的权重得分;
S4.通过决策曲线分析计算阈值概率的净收益,以评估该预测模型的临床效用。
进一步地,于S3与S4之间,该预测方法还包括对所构建的列线图模型进行内部验证和外部验证,利用校准曲线与一致性指数来确定所构建的模型的预测精度和判别能力。
优选地,所述的一种预测乳腺癌新辅助化疗后病理学完全缓解概率的列线图模型,适用于新辅助化疗前乳腺肿物和(或)腋窝淋巴结穿刺病理确诊为:激素受体阳性型乳腺癌,肿瘤TNM分期为II期及以上的非转移性乳腺癌的18岁以上的女性。
优选地,所述的S1步骤中,人口学特征信息、临床病理特征信息、10-miRNA风险分值信息和定量动态对比增强MRI影像学特征信息数据,包括患者年龄、乳腺癌雌激素受体水平、乳腺癌孕激素受体水平、乳腺癌人表皮因子受体2状态、乳腺癌Ki-67状态、新辅助化疗后临床病理状态、肿瘤大小、淋巴结肿瘤分级、10-miRNA风险分值、容量转移常数、反流率常数、血管外细胞外空间体积分数、血浆容量分数中的至少一个。
优选地,所述的S2步骤中,纳入列线图模型的独立预测因子包括四个信息变量:10-miRNA风险分值, 孕激素受体水平,人表皮生长因子受体2状态、容量转移常数。
优选地,所述的S3步骤中,得到的一种预测激素受体阳性型乳腺癌新辅助化疗后病理学完全缓解概率的列线图模型,具体内容如附图1,其中,四个信息变量具体分值分别为:对于孕激素受体水平,孕激素受体水平大于20%者,得分0分;孕激素受体水平小于等于20%者,得分42.05分;对于人表皮生长因子受体2状态,人表皮生长因子受体2状态阴性者,得分0分;人表皮生长因子受体2状态阳性者,得分37.41分;对于10-miRNA风险分值,10-miRNA风险分值小于3.03分者,得分0分;10-miRNA风险分值大于等于3.03分者,得分76.44分;对于容量转移常数,容量转移常数大于0.11者,得分0分;容量转移常数小于等于0.11,得分100分。
优选地,所述的S4步骤中,一种预测激素受体阳性型乳腺癌新辅助化疗后病理学完全缓解概率的列线图模型,该列线图模型四个信息变量分值的总分,对应模型倒数第二行总分值,总分260分;倒数第二行是线性预测值,通过Logistic多因素模型,可将对应位点线性预测值转化为最后一行相应的pCR概率值;根据所述总分值计算计算激素受体阳性型乳腺癌女性新辅助化疗后获得病理学完全缓解的概率预测值;所述总分值评分公式为:孕激素受体水平(0或42.05)+人表皮生长因子受体2状态(0或37.41) +10-miRNA风险分值(0或76.44)+容量转移常数(0或100)=总分值;其中60分为高获益组截断值,高获益组:所述总分值>60分为高分组病人,新辅助化疗后获得病理学完全缓解的概率为更高(例如29.8%),可建议患者行新辅助化疗;低获益组:所述总分值≤60分为低分组病人,新辅助化疗后获得病理学完全缓解的概率为较低(例如3.0%),建议患者慎重行新辅助化疗。
优选地,所述的S3步骤中,利用一致性指数来确定所构建的列线图模型的预测精度和判别能力,一致性指数是指ROC曲线下面积,一致性指数的范围为0至1,一致性指数越接近1提示模型区分度越好,对本发明建模所用的训练集数据均采用Bootstrap自抽样法进行内部验证,其中500个随机样本从原始数据集中替换1000次,并重新计算一致性指数,并用1000次迭代较正,并采用外部数据,即验证集数据,进行外部验证,同样使用Bootstrap自抽样法,重新计算一致性指数,进一步评价模型的预测精度。
优选地,所述的S3步骤中,利用校准曲线来确定所构建的列线图模型反映预测结果和实际结果符合程度,分别利用建模所用的训练集数据和验证集数据进行验证,B拟合参数设置1000,校准曲线图的横坐标是预测概率,用预测模型对事件发生的可能性进行预测,0到1表示发生事件可能性是0到100%;纵坐标是实际概率,患者实际的事件发生率;红色线是拟合线,表示预测值对应的实际值,其中,如果预测值=实际值,则红线与参考线(蓝线)完全重合;如果预测值>实际值,即高估了获益可能,红线在蓝线上面;如果预测值<实际值,即低估了获益可能,则红线在蓝线上面。
优选地,所述的S4步骤中,临床预测模型的决策曲线分析中基于10-miRNA RS的多组学优化模型比单纯的10-miRNA RS模型、容量转移常数模型、孕激素受体水平模型和人表皮生长因子受体2状态模型均较好。决策曲线分析表明,优化后的模型在较宽的预测pCR的阈值概率范围(5%~85%)内提供了较高的净收益。这些结果表明基于10-miRNA RS的优化模型可以更好地应用于临床。
实施例9
本发明具体工作过程如下:
(1)建模
(1.1)前瞻性收集2017年至2020年在孙逸仙纪念医院乳腺外科就诊的符合纳入标准的273例患者的基线资料,纳入标准为:新辅助化疗前乳腺肿物和(或)腋窝淋巴结穿刺病理确诊为:激素受体阳性型乳腺癌,肿瘤TNM分期为II期及以上的非转移性乳腺癌的18岁以上的女性。基线资料包括患者年龄、乳腺癌雌激素受体水平、乳腺癌孕激素受体水平、乳腺癌人表皮因子受体2状态、乳腺癌Ki-67状态、新辅助化疗后临床病理状态、肿瘤大小、淋巴结肿瘤分级、10-miRNA风险分值、容量转移常数、反流率常数、血管外细胞外空间体积分数、血浆容量分数。
表1为训练集的基线信息:
(1.2)根据患者新辅助化疗后经手术切除乳腺肿瘤的病理结果,将训练集分为病理学完全缓解组与非病理学完全缓解组,使用相关性分析的方法,p<0.05的变量被认为是有影响的预测因子,在训练集数据中有影响的变量有:雌激素受体水平(p=0.018),孕激素受体水平(p<0.001)、人表皮受体因子2状态(p<0.001)、10-miRNA风险分值(p<0.001),容量转移常数(p<0.001)、反流率常数(p<0.001)、血管外细胞外空间体积分(p=0.001)。
表2:训练集中病理学完全缓解组和非病理学完全缓解组的临床特征、10-miRNA风险分值和定量动态对比增强MRI影像学特征信息的比较
(1.3)在训练集数据中,使用回归分析进行单因素分析、多因素分析,筛选出独立预测因子。
表3:上述七个预测因子利用回归分析进行单因素分析和多因素分析的结果。
(1.4)构建列线图模型
本实施例中,使用单因素回归分析后,表3中p<0.05的4个特征信息为具有独立预测价值的变量,使用基于多因素回归结果构建列线图,见附图1。
(2)验证构建的列线图模型的预测精度和判别能力
对本发明建模所用的训练集数据采用Bootstrap自抽样法进行内部验证。采用外部数据,即验证集数据,进行外部验证。验证集数据是前瞻性性收集2017年至2020年在山东大学第二附属医院、南昌市第三医院、广州医科大学第一附属医院就诊的患者,分别收集了55例、20例、23例相关资料。
在训练集数据中,通过列线图预测模型得到Harrell’s一致性指数为0.860(95%CI,0.748-0.972),而在验证集,列线图的一致性指数为0.838(95%CI,0.711-0.964)。
校准曲线在训练集中表现出了模型预测与组织学结果的真实观察之间的极好一致性,在验证集中也表现出了良好的一致性,见附图3-4。
实施例10
将本发明的优化的列线图模型分别与孕激素受体水平、人表皮受体因子2状态、10-miRNA风险分值,容量转移常数对新辅助化疗病理疗效预测评估的ROC曲线图,结果见附图5-6。将本发明实例中基于 10-miRNA RS的多组学优化模型、单纯的10-miRNA RS模型、孕激素受体水平模型、人表皮受体因子2状态模型、容量转移常数模型分别对新辅助化疗病理疗效预测评估的决策曲线,结果见附图7。
图5-6中A表示训练集中优化的列线图模型与孕激素受体水平、人表皮受体因子2状态、10-miRNA风险分值,容量转移常数对新辅助化疗病理疗效预测评估的比较;B表示中优化的列线图模型与孕激素受体水平、人表皮受体因子2状态、10-miRNA风险分值,容量转移常数对新辅助化疗病理疗效预测评估的比较。
训练集中优化的列线图模型的AUC(95%,CI)为0.865(0.809-0.921),验证集中为0.838 (0.711-0.964),而单个指标激素受体水平、人表皮受体因子2状态、10-miRNA风险分值,容量转移常数)的AUC(95%,CI)均低于列线图模型,可见本发明的列线图模型用于预测乳腺癌新辅助化疗病理疗效的准确性高。
附图7中可见临床预测模型的决策曲线分析中基于10-miRNA RS的多组学优化模型比单纯的10-miRNA RS模型、容量转移常数模型、孕激素受体水平模型和人表皮生长因子受体2状态模型均较好。决策曲线分析表明,优化后的模型在较宽的预测pCR的阈值概率范围(5%~85%)内提供了较高的净收益。这些结果表明基于10-miRNA RS的优化模型可以更好地应用于临床。
本发明的工作原理:
基于前瞻性的真实世界数据,将复杂的多个变量分析以列线图模型的方式呈现,快速、直观、准确、个体化地预测激素受体阳性型乳腺癌患者接受新辅助化疗后的病理学完全缓解的概率。临床医生在临床实践中,对激素受体阳性型乳腺癌患者的人口学特征信息、10-miRNA风险分值和临床影像学特征信息根据本发明的列线图模型进行赋分,最后通过总评分与结局事件发生概率的关系,得出该个体的接受新辅助化疗风实现病理学完全缓解的概率,从而优化患者化疗和(或)内分泌,和手术治疗的顺序,减少了不必要的新辅助化疗,避免化疗的毒性和治疗时间的浪费。本发明中的测激素受体阳性型乳腺癌新辅助化疗后病理学完全缓解概率的列线图模型,是针对新辅助化疗前乳腺肿物和(或)腋窝淋巴结穿刺病理确诊为:激素受体阳性型乳腺癌,肿瘤TNM分期为II期及以上的非转移性乳腺癌的18岁以上的女性,首次建立的新辅助化疗后病理学完全缓解概率评估系统,列线图从理论上能更准确客观地预测这一部分患者从新辅助化疗获益的概率;本发明中的测激素受体阳性型乳腺癌新辅助化疗后病理学完全缓解概率的列线图模型,简明扼要,通俗易懂,便于临床医生预测患者从新辅助化疗获益的概率,同时有助于患者及其家属理解自身病情;本发明中的测激素受体阳性型乳腺癌新辅助化疗后病理学完全缓解概率的列线图模型,根据模型中的评分公式计算出的患者的总评分,可以明确区分高获益与低获益人群,协助临床医生制定临床决策,帮助一部分患者免除新辅助化疗,从而减少不必要的化疗毒性和治疗时间的浪费;本发明是通过统计临床历史数据,结合科学的统计学方法指导医生和患者进行预测及评价乳腺病灶恶性的风险,这是对医疗数据进行快速处理的信息化新方法。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (11)

1.一种激素受体阳性型乳腺癌新辅助化疗后病理学完全缓解概率预测方法,其特征在于,该方法包括以下步骤:
S1.收集需进行新辅助化疗的激素受体阳性型乳腺癌患者信息,形成训练集;所述激素受体阳性型乳腺癌患者信息包括人口学特征信息、临床病理特征信息、术前乳腺癌穿刺标本的10-miRNA风险分值和定量动态对比增强MRI影像学特征信息基础信息;
S2.在S1形成的训练集中,通过多因素回归分析筛选出与临床病理状态相关的独立预测因子;
S3.将于S2获得的与临床病理状态相关的独立预测因子构建成列线图模型,同时获得纳入列线图模型的各个独立预测因子的权重得分;所述独立预测因子包括四个信息变量,分别为10-miRNA风险分值、孕激素受体水平、人表皮生长因子受体-2状态、容量转移常数;
S4.通过列线图模型分析获得激素受体阳性型乳腺癌新辅助化疗后病理学完全缓解的概率预测值。
2.一种激素受体阳性型乳腺癌新辅助化疗后病理学完全缓解概率预测模型的构建方法,其特征在于,该构建方法包括以下步骤:
S1,收集需进行新辅助化疗的激素受体阳性型乳腺癌患者信息,形成训练集;所述激素受体阳性型乳腺癌患者信息包括人口学特征信息、临床病理特征信息、术前乳腺癌穿刺标本的10-miRNA风险分值和定量动态对比增强MRI影像学特征信息基础信息;
S2,在S1形成的训练集中,通过多因素回归分析筛选出与临床病理状态相关的独立预测因子;
S3,将S2获得的与临床病理状态相关的独立预测因子构建成列线图模型,同时获得纳入列线图模型的各个独立预测因子的权重得分;所述独立预测因子包括四个信息变量,分别为10-miRNA风险分值、孕激素受体水平、人表皮生长因子受体-2状态、容量转移常数;
S4,通过列线图模型分析获得激素受体阳性型乳腺癌新辅助化疗后病理学完全缓解的阈值概率的净收益,以评估该预测模型的临床效用。
3.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现以下步骤S1-S4:
S1.收集需进行新辅助化疗的激素受体阳性型乳腺癌患者信息,形成训练集;所述激素受体阳性型乳腺癌患者信息包括人口学特征信息、临床病理特征信息、术前乳腺癌穿刺标本的10-miRNA风险分值和定量动态对比增强MRI影像学特征信息基础信息;
S2.在S1形成的训练集中,通过多因素回归分析筛选出与临床病理状态相关的独立预测因子;
S3.将于S2获得的与临床病理状态相关的独立预测因子构建成列线图模型,同时获得纳入列线图模型的各个独立预测因子的权重得分;所述独立预测因子包括四个信息变量,分别为10-miRNA风险分值、孕激素受体水平、人表皮生长因子受体-2状态、容量转移常数;
S4.通过列线图模型分析获得激素受体阳性型乳腺癌新辅助化疗后病理学完全缓解的概率预测值。
4.根据前述任一项所述的预测方法或构建方法或计算机可读存储介质,其特征在于,于S2中,通过相关性分析获得新辅助化疗诱导的病理学完全缓解的影响因素,并在训练集中通过多因素回归分析筛选出与临床病理状态相关的独立预测因子。
5.根据前述任一项所述的预测方法或构建方法或计算机可读存储介质,其特征在于,步骤S2还包括将训练集中患者术后病理结果分为病理学完全缓解组和非病理学完全缓解组。
6.根据权利要求1~3任一项所述的预测方法或构建方法或计算机可读存储介质,其特征在于,于S3与S4之间还包括:
S31,对S3构建的列线图模型进行内部验证及外部验证,通过校准曲线与一致性指数的方式确定列线图模型的预测精度和判别能力。
7.根据权利要求1~3任一项所述的预测方法或构建方法或计算机可读存储介质,其特征在于,S4包括以下步骤:
S41,获取列线图模型的四个信息变量的总分值;所述总分值评分公式为:总分值=孕激素受体水平分值+人表皮生长因子受体-2状态分值+10-miRNA风险分值+容量转移常数;
S42,根据所述总分值计算所述激素受体阳性型乳腺癌患者新辅助化疗后获得病理学完全缓解的概率预测值。
8.根据权利要求7所述的预测方法或构建方法或计算机可读存储介质,其特征在于,S4还包括以下步骤:
S43,将总分值与高获益组截断值进行数值对比,从而将患者划分为高获益组及获得低获益组,并根据概率预测值对高获益组及获得低获益组的患者判断是否建议患者进行新辅助化疗。
9.一种激素受体阳性型乳腺癌新辅助化疗后病理学完全缓解概率预测系统,其特征在于,该系统包括:
训练集生成模块,用于将收集的信息形成训练集;
多因素回归分析筛选模块,用于在由所述训练集生成模块生成的训练集中通过多因素回归分析筛选出与临床病理状态相关的独立预测因子;所述独立预测因子包括四个信息变量,分别为10-miRNA风险分值、孕激素受体水平、人表皮生长因子受体-2状态、容量转移常数;
列线图模型构建及展示模块,用于将由所述多因素回归分析筛选模块获得的与临床病理状态相关的独立预测因子构建成列线图模型并以列线图模型形式予以展示;
权重得分生成模块,用于获得纳入列线图模型的各个独立预测因子的权重得分;
净收益分析模块,用于通过列线图模型的决策曲线分析计算激素受体阳性型乳腺癌新辅助化疗后病理学完全缓解的概率预测值。
10.根据权利要求9所述的预测激素受体阳性型乳腺癌新辅助化疗后病理学完全缓解概率的系统,其特征在于,该系统还包括以下模块的至少一种:
信息收集模块,用于收集需进行新辅助化疗的激素受体阳性型乳腺癌患者信息;
病理结果分组模块,用于在由所述训练集生成模块生成的训练集中将乳腺癌手术术后的病理结果分为病理学完全缓解组和非病理学完全缓解组;
相关性分析模块,用于通过相关性分析获得新辅助化疗诱导的病理学完全缓解的影响因素;
列线图模型验证模块,用于对由所述列线图模型构建及展示模块构建成的列线图模型进行内部验证及外部验证,通过校准曲线与一致性指数的方式确定列线图模型的预测精度和判别能力。
11.根据权利要求9所述的激素受体阳性型乳腺癌新辅助化疗后病理学完全缓解概率预测系统,其特征在于,所述净收益分析模块包括总分值获取子模块、概率预测值获取子模块和化疗建议判断子模块;
所述总分值获取子模块用于获取列线图模型的四个信息变量的总分值;
所述概率预测值获取子模块用于根据所述总分值计算所述激素受体阳性型乳腺癌患者新辅助化疗后获得病理学完全缓解的概率预测值;
所述化疗建议判断子模块用于将所述总分值与高获益组截断值进行数值对比,从而将患者划分为高获益组及获得低获益组,并根据所述概率预测值对高获益组及获得低获益组的患者判断是否建议患者进行新辅助化疗。
CN202011155176.6A 2020-08-17 2020-10-26 乳腺癌新辅助化疗后病理学完全缓解概率预测方法及系统 Active CN112542247B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PCT/CN2020/126030 WO2022036869A1 (zh) 2020-08-17 2020-11-03 乳腺癌新辅助化疗后病理学完全缓解概率预测方法及系统

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2020108260854 2020-08-17
CN202010826085 2020-08-17

Publications (2)

Publication Number Publication Date
CN112542247A CN112542247A (zh) 2021-03-23
CN112542247B true CN112542247B (zh) 2024-03-08

Family

ID=75013762

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011155176.6A Active CN112542247B (zh) 2020-08-17 2020-10-26 乳腺癌新辅助化疗后病理学完全缓解概率预测方法及系统

Country Status (2)

Country Link
CN (1) CN112542247B (zh)
WO (1) WO2022036869A1 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113571189A (zh) * 2021-08-23 2021-10-29 复旦大学附属中山医院 一种胆囊癌患者放化疗后生存获益的预测模型建立方法
CN114141360A (zh) * 2021-12-02 2022-03-04 山东大学 基于惩罚cox回归的乳腺癌预测方法
CN114582517A (zh) * 2022-03-04 2022-06-03 四川大学 一种牙周炎早期预判打分表的构建方法和应用
CN116092664B (zh) * 2022-11-25 2023-08-25 中山大学孙逸仙纪念医院 一种胰腺癌预后预测模型建立方法
CN116386901B (zh) * 2023-06-05 2024-01-30 南方医科大学南方医院 乙肝临床治愈预测模型构建方法及装置、预测方法及装置
CN117612711B (zh) * 2024-01-22 2024-05-03 神州医疗科技股份有限公司 一种分析肝癌复发数据的多模态预测模型构建方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107271671A (zh) * 2017-06-05 2017-10-20 龚畅 一种预测er(+)乳腺癌新辅助化疗效果的试剂盒和系统
CN110607366A (zh) * 2019-06-18 2019-12-24 中山大学孙逸仙纪念医院 一种用于预测激素受体阳性乳腺癌术前化疗敏感性的试剂盒
CN111192687A (zh) * 2018-11-14 2020-05-22 复旦大学附属儿科医院 一种进展期阑尾炎列线图预测模型及其用途

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6164689B2 (ja) * 2013-08-30 2017-07-19 国立大学法人大阪大学 乳癌術前化学療法に対する感受性の診断補助方法および判定装置
US10902591B2 (en) * 2018-02-09 2021-01-26 Case Western Reserve University Predicting pathological complete response to neoadjuvant chemotherapy from baseline breast dynamic contrast enhanced magnetic resonance imaging (DCE-MRI)
CN108588226A (zh) * 2018-06-22 2018-09-28 南阳师范学院 检测乳腺癌脑转移的miRNA组合及含有该组合的试剂盒
CN110923321B (zh) * 2019-12-26 2022-08-02 广东省人民医院(广东省医学科学院) 一种环状rna检测试剂盒预测三阴性乳腺癌新辅助化疗反应性

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107271671A (zh) * 2017-06-05 2017-10-20 龚畅 一种预测er(+)乳腺癌新辅助化疗效果的试剂盒和系统
CN111192687A (zh) * 2018-11-14 2020-05-22 复旦大学附属儿科医院 一种进展期阑尾炎列线图预测模型及其用途
CN110607366A (zh) * 2019-06-18 2019-12-24 中山大学孙逸仙纪念医院 一种用于预测激素受体阳性乳腺癌术前化疗敏感性的试剂盒

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Nomogram predicting clinical outcomes in breast cancer patients treated with neoadjuvant chemotherapy;Bhumsuk Keam 等;J Cancer Res Clin Oncol;第137卷;1301-1308 *
长链非编码RNA XIST可预测乳腺癌新辅助治疗的敏感性及预后;张姗 等;肿瘤(第07期);479-487 *

Also Published As

Publication number Publication date
WO2022036869A1 (zh) 2022-02-24
CN112542247A (zh) 2021-03-23

Similar Documents

Publication Publication Date Title
CN112542247B (zh) 乳腺癌新辅助化疗后病理学完全缓解概率预测方法及系统
US8510245B2 (en) Bayesian clinical decision model for determining probability of transplant glomerulopathy
Zhang et al. Using CatBoost algorithm to identify middle-aged and elderly depression, national health and nutrition examination survey 2011–2018
CN110246577B (zh) 一种基于人工智能辅助妊娠期糖尿病遗传风险预测的方法
CN112336358A (zh) 一种预测致密型乳腺的乳腺病灶恶性风险模型及其构建方法
EP2435940B1 (en) A method and device for side-effect prognosis and monitoring
Vandendorpe et al. Prognostic value of the texture analysis parameters of the initial computed tomographic scan for response to neoadjuvant chemoradiation therapy in patients with locally advanced rectal cancer
CN110970133B (zh) 一种crt风险评估方法和风险预测系统
Thornley et al. Sociodemographic differences in prevalence of diagnosed coronary heart disease in New Zealand estimated from linked national health records
CN111440869A (zh) 一种用于预测原发性乳腺癌发生风险的dna甲基化标记物及其筛选方法和应用
CN105653886B (zh) 一种预测前列腺穿刺活检患前列腺癌风险的装置
CN112071418B (zh) 基于增强ct影像组学的胃癌腹膜转移的预测系统及方法
CN112768060A (zh) 基于随机生存森林的肝癌术后复发预测方法、存储介质
Champendal et al. Artificial intelligence to support person-centred care in breast imaging-A scoping review
Grover et al. Stage and outcomes of invasive cervical cancer patients in Botswana: a prospective cohort study from 2013 to 2020
CN112687394A (zh) 转移性去势抵抗性前列腺癌患者在阿比特龙治疗中的预后预测模型及其建立方法和应用
CN115862856A (zh) 甲状腺癌远端转移风险的预测方法、装置
US12020823B2 (en) Integrated virtual patient framework
Xu et al. CT‐based radiomics prediction of CXCL13 expression in ovarian cancer
CN114613498A (zh) 一种基于机器学习的辅助mdt临床决策方法、系统及设备
CN113436721A (zh) 原发性中枢神经系统淋巴瘤预后模型的建立方法及应用
CN116168850B (zh) 一种计算甲状腺癌患者摄碘特征概率的方法和装置
Zou et al. A Bayesian hierarchical non‐linear regression model in receiver operating characteristic analysis of clustered continuous diagnostic data
CN115619810B (zh) 一种前列腺分区分割方法、系统及设备
CN110021433A (zh) 一种用于精准预测胃肠胰神经内分泌肿瘤患者预后的系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant