CN113066577B - 一种基于凝血指数的食管鳞癌生存率预测系统 - Google Patents
一种基于凝血指数的食管鳞癌生存率预测系统 Download PDFInfo
- Publication number
- CN113066577B CN113066577B CN202110231398.XA CN202110231398A CN113066577B CN 113066577 B CN113066577 B CN 113066577B CN 202110231398 A CN202110231398 A CN 202110231398A CN 113066577 B CN113066577 B CN 113066577B
- Authority
- CN
- China
- Prior art keywords
- survival rate
- coagulation index
- fibrinogen
- score
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000004083 survival effect Effects 0.000 title claims abstract description 67
- 230000015271 coagulation Effects 0.000 title claims abstract description 61
- 238000005345 coagulation Methods 0.000 title claims abstract description 61
- 206010041823 squamous cell carcinoma Diseases 0.000 title claims abstract description 11
- 230000001575 pathological effect Effects 0.000 claims abstract description 15
- 108010049003 Fibrinogen Proteins 0.000 claims description 25
- 102000008946 Fibrinogen Human genes 0.000 claims description 25
- 229940012952 fibrinogen Drugs 0.000 claims description 25
- 238000012216 screening Methods 0.000 claims description 24
- 210000001165 lymph node Anatomy 0.000 claims description 22
- 230000009790 vascular invasion Effects 0.000 claims description 22
- 238000004364 calculation method Methods 0.000 claims description 18
- 206010028980 Neoplasm Diseases 0.000 claims description 12
- 206010061534 Oesophageal squamous cell carcinoma Diseases 0.000 claims description 11
- 208000036765 Squamous cell carcinoma of the esophagus Diseases 0.000 claims description 11
- 208000007276 esophageal squamous cell carcinoma Diseases 0.000 claims description 11
- PGOHTUIFYSHAQG-LJSDBVFPSA-N (2S)-6-amino-2-[[(2S)-5-amino-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-4-amino-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-5-amino-2-[[(2S)-5-amino-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S,3R)-2-[[(2S)-5-amino-2-[[(2S)-2-[[(2S)-2-[[(2S,3R)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-5-amino-2-[[(2S)-1-[(2S,3R)-2-[[(2S)-2-[[(2S)-2-[[(2R)-2-[[(2S)-2-[[(2S)-2-[[2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-1-[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-amino-4-methylsulfanylbutanoyl]amino]-3-(1H-indol-3-yl)propanoyl]amino]-5-carbamimidamidopentanoyl]amino]propanoyl]pyrrolidine-2-carbonyl]amino]-3-methylbutanoyl]amino]-4-methylpentanoyl]amino]-4-methylpentanoyl]amino]acetyl]amino]-3-hydroxypropanoyl]amino]-4-methylpentanoyl]amino]-3-sulfanylpropanoyl]amino]-4-methylsulfanylbutanoyl]amino]-5-carbamimidamidopentanoyl]amino]-3-hydroxybutanoyl]pyrrolidine-2-carbonyl]amino]-5-oxopentanoyl]amino]-3-hydroxypropanoyl]amino]-3-hydroxypropanoyl]amino]-3-(1H-imidazol-5-yl)propanoyl]amino]-4-methylpentanoyl]amino]-3-hydroxybutanoyl]amino]-3-(1H-indol-3-yl)propanoyl]amino]-5-carbamimidamidopentanoyl]amino]-5-oxopentanoyl]amino]-3-hydroxybutanoyl]amino]-3-hydroxypropanoyl]amino]-3-carboxypropanoyl]amino]-3-hydroxypropanoyl]amino]-5-oxopentanoyl]amino]-5-oxopentanoyl]amino]-3-phenylpropanoyl]amino]-5-carbamimidamidopentanoyl]amino]-3-methylbutanoyl]amino]-4-methylpentanoyl]amino]-4-oxobutanoyl]amino]-5-carbamimidamidopentanoyl]amino]-3-(1H-indol-3-yl)propanoyl]amino]-4-carboxybutanoyl]amino]-5-oxopentanoyl]amino]hexanoic acid Chemical compound CSCC[C@H](N)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O PGOHTUIFYSHAQG-LJSDBVFPSA-N 0.000 claims description 7
- 239000003154 D dimer Substances 0.000 claims description 7
- 108010094028 Prothrombin Proteins 0.000 claims description 7
- 102100027378 Prothrombin Human genes 0.000 claims description 7
- 108090000190 Thrombin Proteins 0.000 claims description 7
- 108010000499 Thromboplastin Proteins 0.000 claims description 7
- 102000002262 Thromboplastin Human genes 0.000 claims description 7
- 108010052295 fibrin fragment D Proteins 0.000 claims description 7
- 239000000282 fibrinogen degradation product Substances 0.000 claims description 7
- 229940039716 prothrombin Drugs 0.000 claims description 7
- 229960004072 thrombin Drugs 0.000 claims description 7
- 230000023555 blood coagulation Effects 0.000 claims description 6
- 230000004069 differentiation Effects 0.000 claims description 5
- 230000009545 invasion Effects 0.000 claims description 5
- 210000005036 nerve Anatomy 0.000 claims description 5
- 230000007170 pathology Effects 0.000 claims description 4
- 238000010606 normalization Methods 0.000 claims 1
- 238000000034 method Methods 0.000 abstract description 9
- 238000012795 verification Methods 0.000 description 13
- 238000012549 training Methods 0.000 description 12
- 238000004393 prognosis Methods 0.000 description 10
- 208000000461 Esophageal Neoplasms Diseases 0.000 description 8
- 206010030155 Oesophageal carcinoma Diseases 0.000 description 8
- 201000004101 esophageal cancer Diseases 0.000 description 8
- 238000012937 correction Methods 0.000 description 7
- 238000001514 detection method Methods 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 5
- 239000008280 blood Substances 0.000 description 5
- 210000004369 blood Anatomy 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 238000010200 validation analysis Methods 0.000 description 5
- 238000007475 c-index Methods 0.000 description 4
- 230000014509 gene expression Effects 0.000 description 4
- 238000000611 regression analysis Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 3
- 238000001356 surgical procedure Methods 0.000 description 3
- 102000015081 Blood Coagulation Factors Human genes 0.000 description 2
- 108010039209 Blood Coagulation Factors Proteins 0.000 description 2
- 208000035346 Margins of Excision Diseases 0.000 description 2
- 239000000090 biomarker Substances 0.000 description 2
- 238000011088 calibration curve Methods 0.000 description 2
- 201000011510 cancer Diseases 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000002271 resection Methods 0.000 description 2
- 206010027476 Metastases Diseases 0.000 description 1
- 206010061309 Neoplasm progression Diseases 0.000 description 1
- 206010042135 Stomatitis necrotising Diseases 0.000 description 1
- 101150094609 TM9SF1 gene Proteins 0.000 description 1
- 206010064390 Tumour invasion Diseases 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 239000003114 blood coagulation factor Substances 0.000 description 1
- 230000009400 cancer invasion Effects 0.000 description 1
- 238000002648 combination therapy Methods 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000556 factor analysis Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000001325 log-rank test Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000009401 metastasis Effects 0.000 description 1
- 201000008585 noma Diseases 0.000 description 1
- 238000010837 poor prognosis Methods 0.000 description 1
- 230000002980 postoperative effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 201000005665 thrombophilia Diseases 0.000 description 1
- 238000011282 treatment Methods 0.000 description 1
- 238000011269 treatment regimen Methods 0.000 description 1
- 230000005751 tumor progression Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/60—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Public Health (AREA)
- Medical Informatics (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Optimization (AREA)
- General Health & Medical Sciences (AREA)
- Mathematical Analysis (AREA)
- Epidemiology (AREA)
- Computational Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Pure & Applied Mathematics (AREA)
- Primary Health Care (AREA)
- Mathematical Physics (AREA)
- Databases & Information Systems (AREA)
- Algebra (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Biomedical Technology (AREA)
- Operations Research (AREA)
- Pathology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本发明公开了一种基于凝血指数的食管鳞癌生存率预测系统,包括:数据输入单元,用于接收用户输入的预测因素的数据值,所述预测因素包括临床病理特征参数和凝血指数;生存率预测单元,其数据输入端与数据输入单元的数据输出端连接,用于根据所述预测因素的数据值预测出生存率值;结果输出单元,其数据输入端与生存率预测单元的数据输出端连接,用于输出所述生存率值。本发明方案中,预测因素还包括凝血指数,且凝血指数是多项参数综合使用,因此可以更加准确地预测病人的生存率,具有更大的临床应用前景。
Description
技术领域
本发明涉及生物信息处理技术领域,具体涉及一种基于凝血指数的食管鳞癌生存率预测系统。
背景技术
食管癌(EC)是一种很常见的癌症,其发病率和死亡率都较高。在中国,食管鳞状细胞癌(ESCC)是EC的主要病理类型,约占EC病例的90%。尽管目前在外科手术和综合治疗方面都取得了进展,但是食管鳞癌的预后仍然较差。研究者们在寻找预测食管鳞癌总生存率(OS)的生物标志物方面做出了极大的努力,并提出了一些预测预后的标志物,例如基因表达值,例如TM9SF1基因表达值,然而基因表达值的检测并不是常规检测项目,需要额外单独检查,不仅给患者增加检查费用负担,而且费时费力,不利于临床应用。
凝血指数是肿瘤患者临床常规检查项目,近年来,越来越多的研究着力于探究各种恶性肿瘤的进展与凝血之间的关系。越来越多的证据表明,凝血状态如高凝状态与肿瘤进展、侵袭和转移以及不良预后有关,也越来越多的研究报道某些血小板参数和纤维蛋白原可以作为ESCC的预后参数。然而,这些研究集中于独立的预后因素,这些参数组合的潜在预后作用尚未被充分探讨。
发明内容
为了改善现有技术中存在的仅基于单一凝血因素进行预后生存率讨论所存在的准确性差的技术问题,提供一种食管鳞癌预后列线图的生存率预测系统,通过多因素组合分析,以提高生存率预测结果的准确性。
为实现上述目的,本发明采用的技术方案如下:
一种基于凝血指数的食管鳞癌生存率预测系统,包括:
数据输入单元,用于接收用户输入的预测因素的数据值,所述预测因素包括临床病理特征参数和凝血指数,所述凝血指数包括血小板计数、血小板分布宽度、平均血小板体积、血小板压积、凝血酶时间、凝血酶原时间、国际标准化比值、活化部分凝血活酶时间、纤维蛋白原、D-二聚体、纤维蛋白原降解产物中的至少任意两项;
生存率预测单元,其数据输入端与数据输入单元的数据输出端连接,用于根据所述预测因素的数据值预测出生存率值;
结果输出单元,其数据输入端与生存率预测单元的数据输出端连接,用于输出所述生存率值。
上述方案中,数据输入单元接收的预测因素包括临床病理特征参数,还包括凝血指数,凝血指数与ESCC患者预后密切相关,且凝血指数是多项组合,因此可以更加准确地预测生存率,而且这些参数不仅与ESCC患者预后密切相关,且是临床可采集的参数,因此可实施性强,具有较大的临床应用前景。
所述临床病理特征参数包括性别、血管侵犯、切除淋巴结数目、pT分期和pN分期。
所述凝血指数包括血小板计数、平均血小板体积及纤维蛋白原。
还包括参数筛选单元,其数据输入端与数据输入单元的数据输出端连接,用于从血小板计数、血小板分布宽度、平均血小板体积、血小板压积、凝血酶时间、凝血酶原时间、国际标准化比值、活化部分凝血活酶时间、纤维蛋白原、D-二聚体、纤维蛋白原降解产物中,筛选出血小板计数、平均血小板体积及纤维蛋白原作为凝血指数。
所述参数筛选单元采用LASSO Cox回归模型筛选出血小板计数、平均血小板体积及纤维蛋白原作为凝血指数。
所述参数筛选单元还用于,采用Cox回归模型从年龄、性别、卡氏评分(KPS)、肿瘤部位、肿瘤分化程度、手术切缘、血管侵犯、神经侵犯、淋巴结数目、pT分期和pN分期中,筛选出性别、血管侵犯、切除淋巴结数目、pT分期和pN分期作为临床病理特征参数。
临床病理特征参数和凝血指数都有多项,通过参数筛选单元可以将那些冗余的,或者稳定性不够强的参数项筛除,使得系统中只保留非冗余且稳定性高的参数项,在保障预测准确性的同时也提高处理效率,且保障方案的持续可靠性。
所述生存率值包括3年生存率值和5年生存率值,其中,3年生存率值的计算公式为:
P3=5×10-8×point s3-2.7826×10-5×point s2+0.000479576×Point s+0.898194692;
5年生存率值的计算公式为:
P3=5×10-8×point s3-2.7826×10-5×point s2+0.000479576×Point s+0.898194692;
其中,points为由所有预测因素计算得到的数据值。
points=凝血指数得分+性别得分+血管侵犯得分+切除淋巴结数目得分+pT分期得分+pN分期得分,其中,凝血指数得分=69.564468918×凝血指数值+27.825787567。
凝血指数值=0.0005×血小板计数-0.0384×平均血小板体积+0.1148×纤维蛋白原,其中,血小板计数的单位是109/L,平均血小板体积的单位是fL,纤维蛋白原的单位是g/L。
与现有技术相比,本发明具有以下优势:
本研究纳入了与ESCC患者预后密切相关的凝血指数,并且并非仅仅局限于凝血指数的独立预后因素,而是纳入了凝血指数组合,并建立了凝血指数的计算公式。所选用的凝血参数均为手术前常规临床检查项目,检测方法简单、成熟、快速,且无需额外费用。而基于其他的一些参数指标如某某基因表达值等,不属于常规检测项目,需要额外单独检查,费时、费力,同时增加检查费用。另外,还考虑了与患者预后密切相关的临床临床病理特征,结合凝血指数,建立的列线图Nomogram模型可有效和准确地预测病人的生存率。并且,Nomogram模型选取的凝血指数、性别、血管侵犯、切除淋巴结数目、pT分期和pN分期,均为ESCC患者诊疗过程中常规需要获取的资料,在临床上具有可行性。本发明是首个建立的基于关键凝血指数组合的综合预后列线图,可作为临床日常工作预测预后的生物标志物,可有效、准确地预测病人的生存率,为临床医生开发一个综合的、直观的预测模型,具有巨大的临床应用前景。
针对于本发明还具有的其他优势将在后续的实施例中进行更细致的分析。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明基于凝血指数的食管鳞癌生存率预测系统的结构框图。
图2为筛选凝血指数的流程图。
图3为构建列线图模型的流程图。
图4为列线图的示意图。
图5a为基于训练样本进行内部验证时的3年生存率预测值与真实值对比图;图5b为基于训练样本进行内部验证时的5年生存率预测值与真实值对比图;图5c为基于验证样本进行外部验证时的3年生存率预测值与真实值对比图;图5d为基于训练样本集得到的Kaplan-Meier曲线图;5e为基于验证样本集得到的Kaplan-Meier曲线图。
具体实施方式
下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参考图1,本实施例中提供了一种基于凝血指数的食管鳞癌生存率预测系统,包括数据输入单元、生存率预测单元和结果输出单元,生存率预测单元的数据输入端与数据输入单元的数据输出端连接,结果输出单元的数据输入端与生存率预测单元的数据输出端连接。
其中,数据输入单元用于接收用户输入的预测因素的数据值。所述预测因素包括临床病理特征参数和凝血指数,所述临床病理特征参数包括性别、血管侵犯、切除淋巴结数目、pT分期和pN分期,所述凝血指数包括血小板计数、平均血小板体积及纤维蛋白原。
生存率预测单元用于根据所述预测因素的数据值预测出生存率值。
结果输出单元用于输出所述生存率值。更优化地,结果输出单元还可以利用可视化技术将生存率值进行可视化展示。
本实施例中,生存率预测单元可以分别计算3年生存率值和5年生存率值,但是这两个生存率值分别采用不同的计算公式计算得到。
3年生存率值的计算公式为:
P3=5×10-8×point s3-2.7826×10-5×point s2+0.000479576×Point s+0.898194692;
5年生存率值的计算公式为:
P3=5×10-8×point s3-3.8239×10-5×point s2+0.00048418×Point s+0.829340164其中,points为由所有预测因素计算得到的数据值。例如针对于上述数据输入单元所接收到的预测因素,points=凝血指数得分+性别得分+血管侵犯得分+切除淋巴结数目得分+pT分期得分+pN分期得分。
凝血指数得分=69.564468918×凝血指数值+27.825787567,凝血指数值=0.0005×血小板计数-0.0384×平均血小板体积+0.1148×纤维蛋白原,其中,血小板计数的单位是109/L,平均血小板体积的单位是fL,纤维蛋白原的单位是g/L。
性别得分的计算方式为:男性=32.07556,女性=0.00000。
血管侵犯得分的计算方式为:是=16.16008,否=0.00000。
切除淋巴结数目得分的计算方式为:是=13.45926,否=0.00000。
pT分期得分的计算方式为:T1=0.000000,T2=3.543174,T3=31.735408,T4a=59.005004,T4b=78.937070。
pN分期得分的计算方式为:N0=0.00000,N1=40.65095,N2=81.19201,N3=100.00000。
上述方案,例如方案中所涉及的预测因素,以及生存率计算所采用的计算公式,都是经过验证过的最优方案,可以直接应用。而对于上述方案中所涉及的预测因素所包含的参数项实际是经过筛选后的较优参数项,作为更简化(预测准确率要求不高的情况下)的实施方式,对于预测因素所涉及的参数项也可以包含更多。例如,凝血指数可以包括血小板计数、血小板分布宽度、平均血小板体积、血小板压积、凝血酶时间、凝血酶原时间、国际标准化比值、活化部分凝血活酶时间、纤维蛋白原、D-二聚体、纤维蛋白原降解产物中的至少任意两项;临床病理特征参数也可以包含年龄、性别、卡氏评分(KPS)、肿瘤部位、肿瘤分化程度、手术切缘、血管侵犯、神经侵犯、淋巴结数目、pT分期和pN分期中的至少任意两项。
因此,在研究阶段的方案中,实际上生存率预测系统还包括参数筛选单元,其数据输入端与数据输入单元的数据输出端连接。数据输入单元接收到血小板计数、血小板分布宽度、平均血小板体积、血小板压积、凝血酶时间、凝血酶原时间、国际标准化比值、活化部分凝血活酶时间、纤维蛋白原、D-二聚体、纤维蛋白原降解产物等这些参数项后,就从这些参数项中筛选出血小板计数、平均血小板体积及纤维蛋白原作为最终的凝血指数。另外,数据输入单元接收到年龄、性别、卡氏评分(KPS)、肿瘤部位、肿瘤分化程度、手术切缘、血管侵犯、神经侵犯、淋巴结数目、pT分期和pN分期等这些临床病理特征参数项后,参数筛选单元还从这些参数项中筛选出性别、血管侵犯、切除淋巴结数目、pT分期和pN分期作为最终的临床病理特征参数。
对于凝血指数的选取,本实施例中采用了最小绝对收缩和选择算子(LASSO)Cox回归方法,基于参数lambda(λ),识别出最具非冗余和稳健性的变量。λ的最佳值通过10折交叉验证确定,使得训练队列中偏似然偏差最小。最终的凝血指数是由所筛选特征的线性组合创建的,这些特征由LASSO回归定义加权系数。
具体的流程如图2所示,先输入从血液数据可得的前述的11个候选变量,再进行共线性检测,然后构建LASSO Cox回归模型,再选取最优参数λ,最后将回归系数大于零的变量作为最终变量,即筛选出血小板计数、平均血小板体积和纤维蛋白原这三个变量作为凝血指数,并建立最终的凝血指数计算公式如下:
凝血指数值=0.0005×血小板计数(109/L)-0.0384×平均血小板体积(fL)+0.1148×纤维蛋白原(g/L),凝血指数得分=69.564468918×凝血指数值+27.825787567。
而对于临床病理特征参数的选取,本实施例中采用了Cox回归模型进行筛选。筛选方式有两种,一种是直接从年龄、性别、卡氏评分(KPS)、肿瘤部位、肿瘤分化程度、手术切缘、血管侵犯、神经侵犯、淋巴结数目、pT分期和pN分期中,筛选出性别、血管侵犯、切除淋巴结数目、pT分期和pN分期作为临床病理特征参数。本发明实施例采用了第二种筛选方式,也就是将筛选后的凝血指数(血小板计数、平均血小板体积、纤维蛋白原)和上述11项临床病理特征参数一起进行了Cox多因素分析,采用Akaike信息准则(AIC)进行前后逐步变量筛选法,确定了凝血指数、性别、血管侵犯、切除淋巴结数目、pT分期和pN分期这6个因素作为与生存率相关的独立显著因素。根据这6个因素建立多因素Cox回归模型,用rms软件包构建nomgram列线图。
由于参数筛选单元只是研究阶段才需要,在应用阶段不需要,因此,在图1中,将参数筛选单元以虚线框进行区别表示。
基于参数筛选单元筛选出来的预测因素,建立多因素Cox回归模型,用rms软件包构建得到的列线图如图4所示。
本实施例中,参数筛选单元都是通过样本训练LASSO Cox回归模型和Cox回归模型,从而得到最终的参数项及相应的计算公式。并且训练结束后还进行了内部验证和外部验证,最终验证本发明方案的可行性及可靠性。
内部验证采用的样本为训练样本,而外部验证则采用了另外的样本,可称为验证样本。训练样本来源为2012年1月1日至2014年12月31日在XXX医院接受食管癌切除术的965例食管癌患者。验证样本来源为2015年1月1日至2016年12月31日在XXX医院接受食管癌切除术的848例食管癌患者。
样本数据来源为,从训练样本及验证样本中收集回顾性数据,回顾性数据包括临床和血液参数、术后治疗方案和随访信息。其中,血液参数测量来源于患者术前1周在XXX医院检验科常规检查的血液参数,包括血小板计数、血小板分布宽度、平均血小板体积、血小板压积、凝血酶时间、凝血酶原时间、国际标准化比值、活化部分凝血活酶时间、纤维蛋白原、D-二聚体、纤维蛋白原降解产物。表1列出了训练样本集和验证样本集的特征。
表1
如果将所有的血液参数都参与生存率预测,可能会造成数据冗余,降低处理效率,参数筛选单元通过对参数变量进行筛选,筛选出稳定性强且非冗余的参数项,可以提高处理效率,也可以保障预测结果的可靠性。
根据Cox多因素分析的结果,建立了预测3年和5年OS的Nomogram模型。对Nomogram验证分为两个阶段:
(1)利用训练样本进行内部验证:使用Nomogram对内部测试队列(即训练样本集)中的每个患者进行评估,并以每个患者的总分作为独立因素进行Cox回归分析,通过回归分析得到C-index指数及校正曲线,其中,C-index指数计算可以通过R软件survcomp()函数包实现,校正曲线使用Bootstrap重复采样(1000重采样),以确定预测和观察到的生存概率是否一致。
(2)利用外部测试样本进行外部验证:使用Nomogram对外部测试队列(即验证样本集)中的每个患者进行评估,并以每个患者的总分作为独立因素进行Cox回归分析,通过回归分析得到C-index指数及校正曲线,其中,C-index指数计算通过R软件survcomp()函数包实现;校正曲线使用Bootstrap重复采样(1000重采样),以确定预测和观察到的生存概率是否一致。
利用患者按列线图预测的总分的三分位数将训练队列及验证队列分成下、中、上三分位数组。采用Kaplan-Meier曲线和对数秩检验比较不同亚组患者的OS。所有统计计算均使用R软件v.3.5.1(https://www.r-project.org/),以P<0.05(双侧)为差异有统计学意义。
对凝血指数及临床病理特征参数进行了Cox多因素分析,结果如表2所示:
表2
变量 | HR(95%CI) | P值 |
凝血指数(线性) | 2.61(1.38-4.92) | 0.003 |
性别(女性vs男性) | 0.64(0.49-0.84) | 0.001 |
血管侵犯(是vs否) | 1.25(1.01-1.54) | 0.038 |
淋巴结数目(≥20vs<20) | 0.83(0.69-1) | 0.046 |
pT分期(第8版) | ||
T2 vs T1 | 1.05(0.68-1.61) | 0.823 |
T3 vs T1 | 1.55(1.05-2.28) | 0.027 |
T4a vs T1 | 2.25(1.42-3.58) | <0.001 |
T4b vs T1 | 2.96(1.6-5.48) | <0.001 |
pN分期(第8版) | ||
N1 vs N0 | 1.75(1.38-2.22) | <0.001 |
N2 vs N0 | 3.06(2.38-3.94) | <0.001 |
N3 vs N0 | 3.96(2.95-5.32) | <0.001 |
Akaike信息准则:6502.45 | ||
原始C-指数:0.70(0.68-0.72) | ||
Bootstrap C指数:0.69(0.67-0.71) |
从表2中可以看出,Cox多因素分析显示,凝血指数、性别、血管侵犯、切除淋巴结数目、pT分期和pN分期6个因素是与OS相关的独立显著因素(所有p值均<0.05)。
根据Cox多因素分析结果,建立了预测3年及5年OS的nomogram,如图4所示。其中凝血指数、性别、血管侵犯、切除淋巴结数目、pT分期和pN分期是Cox多因素分析中预测生存的独立危险因素,这些变量被纳入nomogram。其中,根据nomogram获得表3所示生存率计算公式,单一变量得分见表4。
表3
表4
预测变量 | 得分(point) |
凝血指标 | 69.564468918×凝血指数值+27.825787567 |
性别 | |
男 | 32.07556 |
女 | 0.00000 |
血管侵犯 | |
是 | 16.16008 |
否 | 0.00000 |
切除淋巴结 | |
是 | 13.45926 |
否 | 0.00000 |
pT分期 | |
T1 | 0.000000 |
T2 | 3.543174 |
T3 | 31.735408 |
T4a | 59.005004 |
T4b | 78.937070 |
pN分期 | |
N0 | 0.00000 |
N1 | 40.65095 |
N2 | 81.19201 |
N3 | 100.00000 |
在对内部测试样本的验证中,nomogram预测OS的c-index为0.70,用Bootstrap法校正偏倚后的c-index为0.69。用calibrate()函数绘制手术治疗后3年或5年生存率的校正曲线显示了模型的3年或5年OS预测值与实际估计值接近,提示nomogram预测值与真实观测值吻合较好,如图5a及图5b所示,Kaplan-Meier曲线的结果如图5d所示。
Nomogram通过外部测试样本中848例ESCC患者的c-index进行验证,校正曲线如图5c所示。外部验证阶段Nomogram预测患者OS的c-index为0.70,说明该模型有较好的判别能力。校正曲线表明,该方法的校正效果良好;nomogram预测的3年OS与实际结果吻合较好,Kaplan-Meier曲线的结果如图5e所示。
也就是说,本发明提供的生存率预测系统,是经过验证的具有较高的可靠性及准确性,可以很好的临床应用前景。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。
Claims (4)
1.一种基于凝血指数的食管鳞癌生存率预测系统,其特征在于,包括:
数据输入单元,用于接收用户输入的预测因素的数据值,所述预测因素包括临床病理特征参数和凝血指数,所述凝血指数包括血小板计数、血小板分布宽度、平均血小板体积、血小板压积、凝血酶时间、凝血酶原时间、国际标准化比值、活化部分凝血活酶时间、纤维蛋白原、D-二聚体、纤维蛋白原降解产物中的至少任意两项;
生存率预测单元,其数据输入端与数据输入单元的数据输出端连接,用于根据所述预测因素的数据值预测出生存率值;
结果输出单元,其数据输入端与生存率预测单元的数据输出端连接,用于输出所述生存率值;
所述临床病理特征参数包括性别、血管侵犯、切除淋巴结数目、pT分期和pN分期;
所述凝血指数包括血小板计数、平均血小板体积及纤维蛋白原;
所述生存率值包括3年生存率值和5年生存率值,其中,3年生存率值的计算公式为:
;
5年生存率值的计算公式为:
;
其中,points为由所有预测因素计算得到的数据值;
points=凝血指数得分+性别得分+血管侵犯得分+切除淋巴结数目得分+pT分期得分+pN分期得分,其中,凝血指数得分=69.564468918 × 凝血指数值+ 27.825787567;
凝血指数值=0.0005×血小板计数-0.0384×平均血小板体积+0.1148×纤维蛋白原,其中,血小板计数的单位是109/L,平均血小板体积的单位是fL,纤维蛋白原的单位是g/L。
2.根据权利要求1所述的基于凝血指数的食管鳞癌生存率预测系统,其特征在于,还包括参数筛选单元,其数据输入端与数据输入单元的数据输出端连接,用于从血小板计数、血小板分布宽度、平均血小板体积、血小板压积、凝血酶时间、凝血酶原时间、国际标准化比值、活化部分凝血活酶时间、纤维蛋白原、D-二聚体、纤维蛋白原降解产物中,筛选出血小板计数、平均血小板体积及纤维蛋白原作为凝血指数。
3.根据权利要求2所述的基于凝血指数的食管鳞癌生存率预测系统,其特征在于,所述参数筛选单元采用LASSO Cox回归模型筛选出血小板计数、平均血小板体积及纤维蛋白原作为凝血指数。
4.根据权利要求2所述的基于凝血指数的食管鳞癌生存率预测系统,其特征在于,所述参数筛选单元还用于,采用Cox回归模型从年龄、性别、卡氏评分(KPS)、肿瘤部位、肿瘤分化程度、手术切缘、血管侵犯、神经侵犯、淋巴结数目、pT分期和pN分期中,筛选出性别、血管侵犯、切除淋巴结数目、pT分期和pN分期作为临床病理特征参数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110231398.XA CN113066577B (zh) | 2021-03-02 | 2021-03-02 | 一种基于凝血指数的食管鳞癌生存率预测系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110231398.XA CN113066577B (zh) | 2021-03-02 | 2021-03-02 | 一种基于凝血指数的食管鳞癌生存率预测系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113066577A CN113066577A (zh) | 2021-07-02 |
CN113066577B true CN113066577B (zh) | 2024-01-26 |
Family
ID=76559527
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110231398.XA Active CN113066577B (zh) | 2021-03-02 | 2021-03-02 | 一种基于凝血指数的食管鳞癌生存率预测系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113066577B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114639482B (zh) * | 2022-03-21 | 2024-10-18 | 郑州轻工业大学 | 基于idpc和lasso的食管鳞癌预后生存风险评估方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105572355A (zh) * | 2015-03-13 | 2016-05-11 | 中国医学科学院肿瘤医院 | 检测食管癌的生物标志物 |
CN110853756A (zh) * | 2019-11-08 | 2020-02-28 | 郑州轻工业学院 | 基于som神经网络和svm的食管癌风险预测方法 |
CN112185549A (zh) * | 2020-09-29 | 2021-01-05 | 郑州轻工业大学 | 基于临床表型和逻辑回归分析的食管鳞癌风险预测方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8053183B2 (en) * | 2005-07-27 | 2011-11-08 | Oncotherapy Science, Inc. | Method of diagnosing esophageal cancer |
-
2021
- 2021-03-02 CN CN202110231398.XA patent/CN113066577B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105572355A (zh) * | 2015-03-13 | 2016-05-11 | 中国医学科学院肿瘤医院 | 检测食管癌的生物标志物 |
CN110853756A (zh) * | 2019-11-08 | 2020-02-28 | 郑州轻工业学院 | 基于som神经网络和svm的食管癌风险预测方法 |
CN112185549A (zh) * | 2020-09-29 | 2021-01-05 | 郑州轻工业大学 | 基于临床表型和逻辑回归分析的食管鳞癌风险预测方法 |
Non-Patent Citations (3)
Title |
---|
外周血纤维蛋白原及血小板与食管鳞癌临床病理特征及其预后的相关性;乔呈瑞;赵松;李向楠;赵佳;朱登彦;吴恺;曹克鑫;;中国老年学杂志(02);348-350 * |
系统免疫炎症指数对局部晚期食管鳞癌的预后价值;胡华芳;辛道;孟祥瑞;王峰;;肿瘤基础与临床(01);38-43 * |
食管鳞癌患者高血小板血症与预后关系分析;许鹏;雷畅;张兆卿;张志平;王丹云;王宗明;沈令广;杨长征;;医学与哲学(临床决策论坛版)(08);27-36 * |
Also Published As
Publication number | Publication date |
---|---|
CN113066577A (zh) | 2021-07-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6554087B2 (ja) | 測定分析物を使用する、疾患診断を改善するための方法 | |
Yan et al. | Integrated nomograms for preoperative prediction of microvascular invasion and lymph node metastasis risk in hepatocellular carcinoma patients | |
CN113517073B (zh) | 肺癌手术后生存率预测模型构建方法和预测模型系统 | |
Matsuhashi et al. | A simple prediction score for in-hospital mortality in patients with nonvariceal upper gastrointestinal bleeding | |
AU2019404445A1 (en) | Anomalous fragment detection and classification | |
CN113066577B (zh) | 一种基于凝血指数的食管鳞癌生存率预测系统 | |
Lazebnik et al. | Predicting acute kidney injury following open partial nephrectomy treatment using sat-pruned explainable machine learning model | |
Khan et al. | Reinforcing synthetic data for meticulous survival prediction of patients suffering from left ventricular systolic dysfunction | |
CN117438097A (zh) | 一种用于早期肝癌术后复发风险预测的方法及系统 | |
Kong et al. | Recalibration and validation of a preoperative risk prediction model for mortality in major colorectal surgery | |
Dias Louro et al. | Patterns of selection against centrosome amplification in human cell lines | |
CN116564512A (zh) | 心力衰竭合并肾功能不全患者的人工智能预后评估系统 | |
Tang et al. | Development and validation of nomogram to predict long-term prognosis of critically ill patients with acute myocardial infarction | |
CN116030963A (zh) | 一种甲胎蛋白阴性原发性肝细胞癌列线图诊断模型及其构建方法和应用 | |
Raoof et al. | Using a lymph node count metric to identify underperforming hospitals after rectal cancer surgery | |
Esteban et al. | A step-by-step algorithm for combining diagnostic tests | |
Ahmad et al. | Prediction of mortality in young adults with cardiovascular disease using artificial intelligence. Electron J Gen Med. 2024; 21 (3): em584 | |
WO2017185165A1 (en) | Gene signature for prostate cancer prognosis | |
US20220017965A1 (en) | Methods for predicting a response to bevacizumab or platinum-based chemotherapy or both in patients with ovarian cancer | |
Saef et al. | Predictive modeling to assess pretest probability of transthyretin gene variants based on demographic information | |
Han et al. | Development and validation of a nomogram for predicting death within 2 days after intracerebral hemorrhage | |
CN111263965A (zh) | 利用测量分析物改善疾病诊断的系统和方法 | |
CN115841844B (zh) | Covid-19和肺癌标志物筛选及预后风险模型构建方法 | |
CN118711678A (zh) | 一种肾透明细胞肿瘤预测方法、装置、设备及存储介质 | |
CN118658619A (zh) | 一种基于凝血参数的肺腺癌的预后风险评估模型及评估方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |