CN113361822A - 大唾液腺癌患者生存预测系统、方法及终端 - Google Patents
大唾液腺癌患者生存预测系统、方法及终端 Download PDFInfo
- Publication number
- CN113361822A CN113361822A CN202110785437.0A CN202110785437A CN113361822A CN 113361822 A CN113361822 A CN 113361822A CN 202110785437 A CN202110785437 A CN 202110785437A CN 113361822 A CN113361822 A CN 113361822A
- Authority
- CN
- China
- Prior art keywords
- survival rate
- prediction
- rate prediction
- variable
- cancer specific
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000004083 survival effect Effects 0.000 title claims abstract description 466
- 238000000034 method Methods 0.000 title claims abstract description 31
- 208000004337 Salivary Gland Neoplasms Diseases 0.000 title claims description 56
- 206010061934 Salivary gland cancer Diseases 0.000 title claims description 56
- 206010028980 Neoplasm Diseases 0.000 claims abstract description 210
- 201000011510 cancer Diseases 0.000 claims abstract description 182
- 208000009956 adenocarcinoma Diseases 0.000 claims abstract description 56
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 10
- 230000004069 differentiation Effects 0.000 claims description 35
- 238000012216 screening Methods 0.000 claims description 35
- 230000007170 pathology Effects 0.000 claims description 30
- 210000001165 lymph node Anatomy 0.000 claims description 21
- 238000012549 training Methods 0.000 claims description 21
- 238000001356 surgical procedure Methods 0.000 claims description 17
- 238000010276 construction Methods 0.000 claims description 16
- 230000015654 memory Effects 0.000 claims description 15
- 238000012795 verification Methods 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 5
- 238000010348 incorporation Methods 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims 1
- 210000003296 saliva Anatomy 0.000 abstract description 4
- 230000006399 behavior Effects 0.000 description 12
- 230000001575 pathological effect Effects 0.000 description 9
- 238000012545 processing Methods 0.000 description 8
- 201000009030 Carcinoma Diseases 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 210000003079 salivary gland Anatomy 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000010200 validation analysis Methods 0.000 description 3
- 208000003200 Adenoma Diseases 0.000 description 2
- 208000006402 Ductal Carcinoma Diseases 0.000 description 2
- 206010057269 Mucoepidermoid carcinoma Diseases 0.000 description 2
- 208000009287 Myoepithelioma Diseases 0.000 description 2
- 208000006336 acinar cell carcinoma Diseases 0.000 description 2
- 208000002517 adenoid cystic carcinoma Diseases 0.000 description 2
- 230000003542 behavioural effect Effects 0.000 description 2
- 238000011088 calibration curve Methods 0.000 description 2
- 238000004140 cleaning Methods 0.000 description 2
- 238000013211 curve analysis Methods 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000002327 eosinophilic effect Effects 0.000 description 2
- 208000037828 epithelial carcinoma Diseases 0.000 description 2
- 208000003849 large cell carcinoma Diseases 0.000 description 2
- 230000001926 lymphatic effect Effects 0.000 description 2
- 230000003211 malignant effect Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 201000002120 neuroendocrine carcinoma Diseases 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 210000003681 parotid gland Anatomy 0.000 description 2
- 201000007416 salivary gland adenoid cystic carcinoma Diseases 0.000 description 2
- 208000023173 salivary gland basal cell adenocarcinoma Diseases 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 208000000649 small cell carcinoma Diseases 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 210000003670 sublingual gland Anatomy 0.000 description 2
- 210000001913 submandibular gland Anatomy 0.000 description 2
- 206010001233 Adenoma benign Diseases 0.000 description 1
- 241000282414 Homo sapiens Species 0.000 description 1
- 208000007433 Lymphatic Metastasis Diseases 0.000 description 1
- 206010027476 Metastases Diseases 0.000 description 1
- 206010061309 Neoplasm progression Diseases 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000001574 biopsy Methods 0.000 description 1
- 210000004204 blood vessel Anatomy 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 235000019800 disodium phosphate Nutrition 0.000 description 1
- 208000010932 epithelial neoplasm Diseases 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000009401 metastasis Effects 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000010837 poor prognosis Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 208000011571 secondary malignant neoplasm Diseases 0.000 description 1
- 206010041823 squamous cell carcinoma Diseases 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 230000005751 tumor progression Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Public Health (AREA)
- Physics & Mathematics (AREA)
- Medical Informatics (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Development Economics (AREA)
- Biomedical Technology (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Pathology (AREA)
- Evolutionary Computation (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Game Theory and Decision Science (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本发明的大唾液腺癌患者生存预测系统、方法及终端,本发明通过收集大量收集患者的信息资料信息,通过比例风险回归和套索算法筛选合适预测因子,并通过构建比例风险模型绘制列线图;本发明筛选的预测因子是临床常见的信息,具有易于收集、可靠性强的特点,便于本专利的推广使用。通过构建比例风险模型绘制列线图,能够高效、准确地预测大唾液患者的总体生存率和癌症特异性生存率解决了现有技术的问题。
Description
技术领域
本发明涉及数据处理技术领域,特别是涉及一种大唾液腺癌患者生存预测系统、方法及终端。
背景技术
大唾液腺癌是发生在三对大唾液腺的癌症,包括腮腺、颌下腺和舌下腺。大唾液腺癌临床上相对罕见,发病率较低,据统计全球唾液腺癌发病率约为0.9-2.6例/10万人。尽管如此,大唾液腺癌生长迅速、易侵犯周围骨、血管、神经等组织,预后较差,严重威胁人类的生命健康。大唾液腺癌病理类型复杂多样。不同病理类型生物学行为大相径庭。由于大唾液腺癌病理类型复杂多样但发病率较低的特点,目前国内外对大唾液腺了解和研究非常局限。大唾液腺癌患者生存率的预测是口腔颌面外科的一大难题。目前国内外尚无一种准确、有效的方法预测大唾液腺患者的生存率。
发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供一种大唾液腺癌患者生存预测系统、方法及终端,用于解决现有技术中尚无一种准确、有效的方法预测大唾液腺患者的生存率的问题。
为实现上述目的及其他相关目的,本发明提供一种大唾液腺癌患者生存预测系统,包括:获取模块,用于获取多个大唾液腺癌确诊患者的基本数据;其中,所述基本数据包括:个人基本数据以及生存数据;初步筛选模块,连接所述获取模块,用于根据各大唾液腺癌确诊患者的基本数据构建用于总生存率预测和/或用于癌症特异性生存率预测的比例风险回归模型,以获得多个初步总生存率预测因子和/或初步癌症特异性生存率预测因子;最终筛选模块,连接所述初步筛选模块,用于根据由各大唾液腺癌确诊患者的基本数据计算总生存率预测最优惩罚系数和/或癌症特异性生存率预测最优惩罚系数,以获得经各初步总生存率预测因子和/或各初步癌症特异性生存率预测因子进行进一步筛选的一或多个最终总生存率预测因子和/或最终癌症特异性生存率预测因子;生存率模型构建模块,连接所述最终筛选模块,用于利用各大唾液腺癌确诊患者的基本数据训练由各最终总生存率预测因子和/或各最终癌症特异性生存率预测因子纳入的比例风险回归模型,获得总生存率预测模型和/或癌症特异性生存率预测模型;列线图绘制模块,连接所述生存率模型构建模块,用于基于所述总生存率预测模型和/或癌症特异性生存率预测模型,绘制总生存率预测列线图和/或癌症特异性生存率预测列线图,以对大唾液腺癌确诊患者的总生存率和/或癌症特异性生存率进行预测。
于本发明的一实施例中,所述个人基本数据包括:年龄、性别、种族、婚姻状况、部位、分化程度、AJCC分期、T\N\M分期、肿瘤大小、病理类型、是否手术、是否清扫淋巴结。
于本发明的一实施例中,所述初步筛选模块包括:回归模型构建单元,用于根据各大唾液腺癌确诊患者的个人基本数据构建用于总生存率预测和/或用于癌症特异性生存率预测的比例风险回归模型;其中,所述用于总生存率预测和/或用于癌症特异性生存率预测的比例风险回归模型的类型包括:单因素比例风险回归模型以及多因素比例风险回归模型;初步筛选单元,连接所述回归模型构建单元,用于基于用于总生存率预测和/或用于癌症特异性生存率预测的比例风险回归模型,获得多个初步总生存率预测因子和/或初步癌症特异性生存率预测因子。
于本发明的一实施例中,所述最终筛选模块包括:最优惩罚系数计算单元,用于基于套索算法,根据由各大唾液腺癌确诊患者的基本数据计算总生存率预测最优惩罚系数和/或癌症特异性生存率预测最优惩罚系数;最终筛选单元,连接所述最优惩罚系数计算单元,用于根据所述总生存率预测最优惩罚系数和/或癌症特异性生存率预测最优惩罚系数,分别对各初步总生存率预测因子和/或各初步癌症特异性生存率预测因子进行进一步筛选,获得一或多个最终总生存率预测因子和/或最终癌症特异性生存率预测因子;其中,所述最终总生存率预测因子包括:年龄、性别、种族、婚姻状况、部位、分化程度、AJCC分期、T\N\M分期、肿瘤大小、病理类型以及是否手术;和/或,所述最终癌症特异性生存率预测因子包括:年龄、性别、种族、分化程度、AJCC分期、T\N\M分期、肿瘤大小、病理类型、是否手术以及是否清扫淋巴结。
于本发明的一实施例中,所述生存率模型构建模块包括:预测因子纳入单元,用于将各最终总生存率预测因子和/或各最终癌症特异性生存率预测因子纳入比例风险回归模型;模型构建单元,连接所述预测因子纳入单元,用于利用各大唾液腺癌确诊患者的基本数据训练分别纳入最终总生存率预测因子和/或最终癌症特异性生存率预测因子的比例风险回归模型,获得总生存率预测模型和/或癌症特异性生存率预测模型;预测因子权重值获取单元,连接所述模型构建单元,用于获取所述总生存率预测模型中各最终总生存率预测因子分别所对应的权重参数值,和/或所述癌症特异性生存率预测模型中各述最终癌症特异性生存率预测因子分别所对应的权重参数值。
于本发明的一实施例中,所述列线图绘制模块还用于:基于所述总生存率预测模型中各最终总生存率预测因子分别所对应的权重参数值,和/或所述癌症特异性生存率预测模型中各最终癌症特异性生存率预测因子分别所对应的权重参数值,根据各大唾液腺癌确诊患者的基本数据绘制总生存率预测列线图和/或癌症特异性生存率预测列线图,以以对大唾液腺癌确诊患者的总生存率和/或癌症特异性生存率进行预测。
于本发明的一实施例中,所述总生存率预测列线图包括:分值标尺,其分值范围为0至100;对应各最终总生存率预测因子的预测变量,包括:年龄变量、性别变量、种族变量、婚姻状况变量、部位变量、分化程度变量、AJCC分期变量、T\N\M分期变量、肿瘤大小变量、病理类型变量以及是否手术变量;每个预测变量均包括若干个变量取值,每一个变量取值对应所述分值标尺上的一个分值;总分值标尺,其分值范围为0至500;生存率变量,为连续性变量,包括:一或多个生存率子变量;且每一个生存率子变量包括一变量取值范围,且每一个变量取值范围对应有所述总分值标尺上的一个分值范围;其中,所述分值标尺、各预测变量、所述总分值标尺以及各生存率子变量分别处于所述总生存率预测列线图的一行;和/或,所述癌症特异性生存率预测列线图包括:分值标尺,其分值范围为0至100;对应各最终癌症特异性生存率预测因子的预测变量,包括:年龄变量、性别变量、种族变量、分化程度变量、AJCC分期变量、T\N\M分期变量、肿瘤大小变量、病理类型变量、是否手术变量以及是否清扫淋巴结变量;每个预测变量均包括若干个变量取值,每一个变量取值对应所述分值标尺上的一个分值;总分值标尺,其分值范围为0至650;生存率变量,为连续性变量,包括:一或多个生存率子变量;且每一个生存率子变量包括一变量取值范围,且每一个变量取值范围对应有所述总分值标尺上的一个分值范围;其中,所述分值标尺、各预测变量、所述总分值标尺以及各生存率子变量分别处于所述癌症特异性生存率预测列线图的一行。
于本发明的一实施例中,所述系统还包括:列线图验证模块,连接所述列线图绘制模块,用于利用各大唾液腺癌确诊患者的基本数据对总生存率预测列线图和/或癌症特异性生存率预测列线图进行验证。
为实现上述目的及其他相关目的,本发明提供一种大唾液腺癌患者生存预测方法,所述方法包括:获取多个大唾液腺癌确诊患者的基本数据;其中,所述基本数据包括:个人基本数据以及生存数据;根据各大唾液腺癌确诊患者的基本数据构建用于总生存率预测和/或用于癌症特异性生存率预测的比例风险回归模型,以获得多个初步总生存率预测因子和/或初步癌症特异性生存率预测因子;根据由各大唾液腺癌确诊患者的基本数据计算总生存率预测最优惩罚系数和/或癌症特异性生存率预测最优惩罚系数,以获得经各初步总生存率预测因子和/或各初步癌症特异性生存率预测因子进行进一步筛选的一或多个最终总生存率预测因子和/或最终癌症特异性生存率预测因子;利用各大唾液腺癌确诊患者的基本数据训练由各最终总生存率预测因子和/或各最终癌症特异性生存率预测因子纳入的比例风险回归模型,获得总生存率预测模型和/或癌症特异性生存率预测模型;基于所述总生存率预测模型和/或癌症特异性生存率预测模型,绘制总生存率预测列线图和/或癌症特异性生存率预测列线图,以对大唾液腺癌确诊患者的总生存率和/或癌症特异性生存率进行预测;其中,所述个人基本数据包括:年龄、性别、种族、婚姻状况、部位、分化程度、AJCC分期、T\N\M分期、肿瘤大小、病理类型、是否手术、是否清扫淋巴结。
为实现上述目的及其他相关目的,本发明提供一种大唾液腺癌患者生存预测终端,包括:存储器,用于存储计算机程序;处理器,用于执行所述的大唾液腺癌患者生存预测方法。
如上所述,本发明的一种大唾液腺癌患者生存预测系统、方法及终端,具有以下有益效果:本发明通过收集大量收集患者的信息资料信息,通过比例风险回归和套索算法筛选合适预测因子,并通过构建比例风险模型绘制列线图;本发明筛选的预测因子是临床常见的信息,具有易于收集、可靠性强的特点,便于本专利的推广使用。通过构建比例风险模型绘制列线图,能够高效、准确地预测大唾液患者的总体生存率和癌症特异性生存率。
附图说明
图1显示为本发明一实施例中的大唾液腺癌患者生存预测系统的结构示意图。
图2显示为本发明一实施例中的总生存率预测列线图的示意图。
图3显示为本发明一实施例中的癌症特异性生存率预测列线图的示意图。
图4显示为本发明一实施例中的应用大唾液腺癌患者生存预测方法的流程示意图。
图5显示为本发明一实施例中的应用大唾液腺癌患者生存预测终端的结构示意图。
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
需要说明的是,在下述描述中,参考附图,附图描述了本发明的若干实施例。应当理解,还可使用其他实施例,并且可以在不背离本发明的精神和范围的情况下进行机械组成、结构、电气以及操作上的改变。下面的详细描述不应该被认为是限制性的,并且本发明的实施例的范围仅由公布的专利的权利要求书所限定。这里使用的术语仅是为了描述特定实施例,而并非旨在限制本发明。空间相关的术语,例如“上”、“下”、“左”、“右”、“下面”、“下方”、““下部”、“上方”、“上部”等,可在文中使用以便于说明图中所示的一个元件或特征与另一元件或特征的关系。
在通篇说明书中,当说某部分与另一部分“连接”时,这不仅包括“直接连接”的情形,也包括在其中间把其它元件置于其间而“间接连接”的情形。另外,当说某种部分“包括”某种构成要素时,只要没有特别相反的记载,则并非将其它构成要素,排除在外,而是意味着可以还包括其它构成要素。
其中提到的第一、第二及第三等术语是为了说明多样的部分、成分、区域、层及/或段而使用的,但并非限定于此。这些术语只用于把某部分、成分、区域、层或段区别于其它部分、成分、区域、层或段。因此,以下叙述的第一部分、成分、区域、层或段在不超出本发明范围的范围内,可以言及到第二部分、成分、区域、层或段。
再者,如同在本文中所使用的,单数形式“一”、“一个”和“该”旨在也包括复数形式,除非上下文中有相反的指示。应当进一步理解,术语“包含”、“包括”表明存在所述的特征、操作、元件、组件、项目、种类、和/或组,但不排除一个或多个其他特征、操作、元件、组件、项目、种类、和/或组的存在、出现或添加。此处使用的术语“或”和“和/或”被解释为包括性的,或意味着任一个或任何组合。因此,“A、B或C”或者“A、B和/或C”意味着“以下任一个:A;B;C;A和B;A和C;B和C;A、B和C”。仅当元件、功能或操作的组合在某些方式下内在地互相排斥时,才会出现该定义的例外。
本发明提供一种大唾液腺癌患者生存预测系统,本发明通过收集大量收集患者的信息资料信息,通过比例风险回归和套索算法筛选合适预测因子,并通过构建比例风险模型绘制列线图;本发明筛选的预测因子是临床常见的信息,具有易于收集、可靠性强的特点,便于本专利的推广使用。通过构建比例风险模型绘制列线图,能够高效、准确地预测大唾液患者的总体生存率和癌症特异性生存率,解决了现有技术的问题。
下面以附图为参考,针对本发明的实施例进行详细说明,以便本发明所述技术领域的技术人员能够容易地实施。本发明可以以多种不同形态体现,并不限于此处说明的实施例。
如图1展示本发明实施例中的一种大唾液腺癌患者生存预测系统的结构示意图。
所述系统包括:
获取模块11,用于获取多个大唾液腺癌确诊患者的基本数据;其中,所述基本数据包括:个人基本数据以及生存数据;
初步筛选模块12,连接所述获取模块11,用于根据各大唾液腺癌确诊患者的基本数据构建用于总生存率预测和/或用于癌症特异性生存率预测的比例风险回归模型,以获得多个初步总生存率预测因子和/或初步癌症特异性生存率预测因子;
最终筛选模块13,连接所述初步筛选模块12,用于根据由各大唾液腺癌确诊患者的基本数据计算总生存率预测最优惩罚系数和/或癌症特异性生存率预测最优惩罚系数,以获得经各初步总生存率预测因子和/或各初步癌症特异性生存率预测因子进行进一步筛选的一或多个最终总生存率预测因子和/或最终癌症特异性生存率预测因子;
生存率模型构建模块14,连接所述最终筛选模块13,用于利用各大唾液腺癌确诊患者的基本数据训练由各最终总生存率预测因子和/或各最终癌症特异性生存率预测因子纳入的比例风险回归模型,获得总生存率预测模型和/或癌症特异性生存率预测模型;
列线图绘制模块15,连接所述生存率模型构建模块14,用于基于所述总生存率预测模型和/或癌症特异性生存率预测模型,绘制总生存率预测列线图和/或癌症特异性生存率预测列线图,以对大唾液腺癌确诊患者的总生存率和/或癌症特异性生存率进行预测。
需说明的是,应理解图1系统实施例中的各模块的划分仅仅是一种逻辑功能的划分,实际实现时可以全部或部分集成到一个物理实体上,也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现;也可以全部以硬件的形式实现;还可以部分模块通过处理元件调用软件的形式实现,部分模块通过硬件的形式实现;
例如各模块可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(Application Specific Integrated Circuit,简称ASIC),或,一个或多个微处理器(digital signal processor,简称DSP),或,一个或者多个现场可编程门阵列(Field Programmable Gate Array,简称FPGA)等。再如,当以上某个模块通过处理元件调度程序代码的形式实现时,该处理元件可以是通用处理器,例如中央处理器(CentralProcessing Unit,简称CPU)或其它可以调用程序代码的处理器。再如,这些模块可以集成在一起,以片上系统(system-on-a-chip,简称SOC)的形式实现。
可选的,所述个人基本数据包括:年龄、性别、种族、婚姻状况、部位、分化程度、AJCC分期、T\N\M分期、肿瘤大小、病理类型、是否手术、是否清扫淋巴结。
其中,所述AJCC分期为美国癌症联合委员会分期,是美国癌症联合委员会制定并推广的一种癌症分期,通过评估患者的肿瘤进展情况而给出的一个综合反应癌症进展情况的分期。所述TNM分期是一种临床常用的癌症分期,通过对肿瘤原发灶(T)、淋巴结转移(N)、远处转移(M)情况进行评估,从而评估癌症进展状况的一种分期。
可选的,所述生存数据对应各患者的生存结果,包括:对应存活状态的存货数据以及对应死亡状态的死亡数据;优选的,所述死亡数据包括具体死亡原因,或是否因为大唾液腺癌死亡。
可选的,所述获取模块11还用于通过随机抽样法,将多个大唾液腺癌确诊患者的基本数据按照预设比例分为训练集和验证集;例如预设比例为7:3。
可选的,所述初步筛选模块12包括:回归模型构建单元,用于根据各大唾液腺癌确诊患者的个人基本数据构建用于总生存率预测和/或用于癌症特异性生存率预测的比例风险回归模型;其中,所述用于总生存率预测和/或用于癌症特异性生存率预测的比例风险回归模型的类型包括:单因素比例风险回归模型以及多因素比例风险回归模型;初步筛选单元,连接所述回归模型构建单元,用于基于用于总生存率预测和/或用于癌症特异性生存率预测的比例风险回归模型,获得多个初步总生存率预测因子和/或初步癌症特异性生存率预测因子。
在本实施例中,可以根据训练集中各大唾液腺癌确诊患者的个人基本数据构建用于总生存率预测和/或用于癌症特异性生存率预测的比例风险回归模型。
可选的,所述回归模型构建单元用于根据各大唾液腺癌确诊患者的个人基本数据构建用于预测总生存率的单因素比例风险回归模型以及多因素比例风险回归模型,根据所述单因素比例风险回归模型的P值与预测价值阈值对比获得具有预测价值的预测因子,再将所有具有预测价值的预测因子纳入所述多因素比例风险回归模型,通过获得各预测因子的P值与高预测价值阈值对比筛选获得多个初步总生存率预测因子;例如,所述预测价值阈值为0.001,所述高预测价值阈值为0.01。
和/或,根据各大唾液腺癌确诊患者的个人基本数据构建用于预测癌症特异性生存率的单因素比例风险回归模型以及多因素比例风险回归模型,根据所述单因素比例风险回归模型的P值与预测价值阈值对比获得具有预测价值的预测因子,再将所有具有预测价值的预测因子纳入所述多因素比例风险回归模型,通过获得各预测因子的P值与高预测价值阈值对比筛选获得多个初步癌症特异性生存率预测因子。
可选的,所述最终筛选模块包括:最优惩罚系数计算单元,用于基于套索算法,根据由各大唾液腺癌确诊患者的基本数据计算总生存率预测最优惩罚系数和/或癌症特异性生存率预测最优惩罚系数;最终筛选单元,连接所述最优惩罚系数计算单元,用于根据所述总生存率预测最优惩罚系数和/或癌症特异性生存率预测最优惩罚系数,分别对各初步总生存率预测因子和/或各初步癌症特异性生存率预测因子进行进一步筛选,获得一或多个最终总生存率预测因子和/或最终癌症特异性生存率预测因子;
其中,所述最终总生存率预测因子包括:年龄、性别、种族、婚姻状况、部位、分化程度、AJCC分期、T\N\M分期、肿瘤大小、病理类型以及是否手术;和/或,所述最终癌症特异性生存率预测因子包括:年龄、性别、种族、分化程度、AJCC分期、T\N\M分期、肿瘤大小、病理类型、是否手术以及是否清扫淋巴结。
在本实施例中,可以根据训练集中各大唾液腺癌确诊患者的基本数据计算总生存率预测最优惩罚系数和/或癌症特异性生存率预测最优惩罚系数。
可选的,所述最优惩罚系数计算单元用于利用R软件通过套索算法根据由各大唾液腺癌确诊患者的生存数据中计算总生存率预测最优惩罚系数和/或癌症特异性生存率预测最优惩罚系数;优选的,所述总生存率预测最优惩罚系数为0.001642673,所述癌症特异性生存率预测最优惩罚系数为0.0008036133。
其中,利用生存数据中的对应死亡状态的死亡数据中的死亡原因来进行最优惩罚系数的计算。
可选的,所述生存率模型构建模块14包括:预测因子纳入单元,用于将各最终总生存率预测因子和/或各最终癌症特异性生存率预测因子纳入比例风险回归模型;模型构建单元,连接所述预测因子纳入单元,用于利用各大唾液腺癌确诊患者的基本数据训练分别纳入最终总生存率预测因子和/或最终癌症特异性生存率预测因子的比例风险回归模型,获得总生存率预测模型和/或癌症特异性生存率预测模型;预测因子权重值获取单元,连接所述模型构建单元,用于获取所述总生存率预测模型中各最终总生存率预测因子分别所对应的权重参数值,和/或所述癌症特异性生存率预测模型中各述最终癌症特异性生存率预测因子分别所对应的权重参数值。
可选的,将年龄、性别、种族、婚姻状况、部位、分化程度、AJCC分期、T\N\M分期、肿瘤大小、病理类型、是否手术纳入用于总体生存率预测的比例风险回归模型;所具有各最终总生存率预测因子分别所对应的权重参数值构建模型公式为:生存率=年龄*权重1+性别*权重2+种族*权重3+婚姻状况*权重4+部位*权重5+分化程度*权重6+AJCC分期*权重7+T分期*权重8+N分期*权重9+M分期*权重10+肿瘤大小*权重11+是否手术*权重12+病理类型*权重13。
可选的,将年龄、性别、种族、分化程度、AJCC分期、T\N\M分期、肿瘤大小、病理类型、是否手术、是否清扫淋巴结纳入用于癌症特异性生存率预测的比例风险回归模型;所具有各最终癌症特异性生存率预测因子分别所对应的权重参数值构建模型公式为:生存率=性别*权重1+年龄*权重2+种族*权重3+分化程度*权重4+AJCC分期*权重5+T分期*权重6+N分期*权重7+M分期*权重8+肿瘤大小*权重9+是否手术*权重10+是否清扫淋巴结*权重11+病理类型*权重12。
可选的,所述列线图绘制模块15还用于:基于所述总生存率预测模型中各最终总生存率预测因子分别所对应的权重参数值,和/或所述癌症特异性生存率预测模型中各最终癌症特异性生存率预测因子分别所对应的权重参数值,根据各大唾液腺癌确诊患者的基本数据绘制总生存率预测列线图和/或癌症特异性生存率预测列线图,以对大唾液腺癌确诊患者的总生存率和/或癌症特异性生存率进行预测。
可选的,所述总生存率预测列线图包括:分值标尺,其分值范围为0至100;对应各最终总生存率预测因子的预测变量,包括:年龄变量、性别变量、种族变量、婚姻状况变量、部位变量、分化程度变量、AJCC分期变量、T\N\M分期变量、肿瘤大小变量、病理类型变量以及是否手术变量;每个预测变量均包括若干个变量取值,每一个变量取值对应所述分值标尺上的一个分值;例如,年龄变量包括:女性和男性,其中所述女性对应0分,男性对应13分。总分值标尺,其分值范围为0至500;生存率变量,为连续性变量,包括:一或多个生存率子变量;且每一个生存率子变量包括一变量取值范围,且每一个变量取值范围对应有所述总分值标尺上的一个分值范围;例如生存率子变量包括:3年生存率以及5年生存率。其中,所述分值标尺、各预测变量、所述总分值标尺以及各生存率子变量分别处于所述总生存率预测列线图的一行。
在一具体实施例中,如图2所示,所述总生存率预测列线图第一行为评分,分值范围0-100;第二行为性别,女性0分,男性13分;第三行为年龄,﹤40岁为0分,40-60岁为40分,60-80岁为61分,﹥80岁为100分;第四行为婚姻状况,未知为0分,已婚为1分,离异为7.5分,分居为10分,丧偶为18分;第五行为部位,腮腺和未明确大唾液腺为0分,舌下腺为7.5分,颌下腺为8分,多个大唾液腺为40分;第六行为分化程度,I级为0分,II级为18分,III级为38分,未知为30分,IV级为47.5分;第七行为AJCC分期,I级为0分,II级为1分,III级为12.5分,未知为20分,IV级为30分;第八行为T分期,0期为0分,1期为11分,X期为17.5分,2期为30分,3期为42分,4期为45分;第九行为N分期,0期为0分,1期为11分,X期为17分,2期为17.5分,3期为27分;第十行为M分期,0期为0分,X期为5分,1期为38分;第十一行为肿瘤大小,0-1cm为29分,1-2cm为55分,2-3cm为26分,3-4cm为21分,4-5cm为37.5分,﹥5cm为0分,未知是29.5分;第十二行为是否手术,是为0分,否是35分,未知是31分;第十三行是病理类型,1代表未知为60分,2代表继发性癌为48分,3代表大细胞癌为40分,4代表未分化癌是26分,5代表小细胞癌为46分,6代表鳞状细胞癌为51分,7代表淋巴上皮癌是0分,8代表腺癌是45分,9代表基底细胞腺癌为7.5分,10代表腺样囊性癌为40分,11代表神经内分泌癌为29分,12代表嗜酸性腺癌为57.5分,13代表黏液表皮样癌为31分,14代表导管癌为27.5分,15代表腺泡细胞癌为23分,16代表上皮-肌上皮癌为2分,17代表癌在多形性腺瘤中为35分,18代表恶性肌上皮瘤为25分,19代表其他为53分;第十四行是总分,分值范围是0-500分;第十五行是3年生存率,范围是0.1-0.9;第十六行是5年生存率,范围是0.1-0.9;
其中,在所述总生存率预测列线图中,第二行到第十四行为对应各最终总生存率预测因子的预测变量,在预测变量的具体选项作垂直线与第一行分值相交处即可得到该预测变量的得分,将所有预测变量得分相加即可得到该患者的总分。于第十五行总分向下作垂直线,与第十六行、第十七行生存率相交处即可得到该患者的三年、五年生存率。
可选的,所述癌症特异性生存率预测列线图包括:分值标尺,其分值范围为0至100;对应各最终癌症特异性生存率预测因子的预测变量,包括:年龄变量、性别变量、种族变量、分化程度变量、AJCC分期变量、T\N\M分期变量、肿瘤大小变量、病理类型变量、是否手术变量以及是否清扫淋巴结变量;每个预测变量均包括若干个变量取值,每一个变量取值对应所述分值标尺上的一个分值;总分值标尺,其分值范围为0至650;生存率变量,为连续性变量,包括:一或多个生存率子变量;且每一个生存率子变量包括一变量取值范围,且每一个变量取值范围对应有所述总分值标尺上的一个分值范围;其中,所述分值标尺、各预测变量、所述总分值标尺以及各生存率子变量分别处于所述癌症特异性生存率预测列线图的一行。
在一具体实施例中,如图3所示,所述癌症特异性生存率预测列线图第一行为评分,分值范围0-100分;第二行为性别,女性为0分,男性为4分;第三行为年龄,﹤40岁为0分,40-60岁为28分,60-80岁为38分,﹥80岁为73分;第四行为种族,未知为0分,其他为75分,白人为92分,黑人为100分;第五行为分化程度,I级为0分,II级为58分,III级是84分,IV是94分,未知是68分;第六行为AJCC分期,I期是2分,II期是0分,III期29分,IV期是53分,未知是26分;第七行为T分期,0期是0分,1期是28分,2期是58分,3期是67.5分,4期是70分,X期是48分;第八行为N分期,0期是0分,1期是25分,2期是29分,3期是44分,X期是17分;第九行为M分期,0期是0分,1期是46分,X期是18分;第十行为肿瘤大小,0-1cm为16分,1-2cm为47分,2-3cm为19分,3-4cm为11分,4-5cm为0分,﹥5cm为38分;第十一行为是否手术,是为0分,否为36分,未知为29分;第十二行为淋巴清扫,是为0分,否为12.5分,活检是14分,未知是32.5分;第十三行为病理类型1代表未知为93分,2代表继发性癌为76分,3代表大细胞癌为64分,4代表未分化癌是27分,5代表小细胞癌为67分,6代表鳞状细胞癌为81分,7代表淋巴上皮癌是23分,8代表腺癌是84分,9代表基底细胞腺癌为29分,10代表腺样囊性癌为77.5分,11代表神经内分泌癌为61分,12代表嗜酸性腺癌为78分,13代表黏液表皮样癌为59分,14代表导管癌为62分,15代表腺泡细胞癌为51分,16代表上皮-肌上皮癌为0分,17代表癌在多形性腺瘤中为70分,18代表恶性肌上皮瘤为53分,19代表其他为83分;第十四行为总分,分值范围是0-650分;第十五行是3年生存率,范围是0.1-0.9;第十六行是5年生存率,范围是0.1-0.9;
其中,在所述总生存率预测列线图中,第二行到第十四行为对应各癌症特异性生存率预测的预测变量,在预测变量的具体选项作垂直线与第一行分值相交处即可得到该预测变量的得分,将所有预测变量得分相加即可得到该患者的总分。于第十五行总分向下作垂直线,与第十六行、第十七行生存率相交处即可得到该患者的三年、五年生存率。
可选的,所述系统还包括:列线图验证模块,连接所述列线图绘制模块,用于利用各大唾液腺癌确诊患者的基本数据对总生存率预测列线图和/或癌症特异性生存率预测列线图进行验证。
可选的,所述列线图验证模块用于在训练集和验证集中分别对总生存率预测列线图的对总生存率预测列线图和/或癌症特异性生存率预测列线图进行验证。
可选的,利用绘制总生存率预测列线图和/或癌症特异性生存率预测列线图,可以根据待预测得大唾液腺癌确诊患者的基本数据对大唾液腺癌确诊患者的总生存率和/或癌症特异性生存率进行预测。
为了更好的描述所述大唾液腺癌患者生存预测系统,提供一具体实施例;
实施例1:一种大唾液腺癌患者生存预测系统。
获取模块,用于获取11362名通过病理检查确诊为大唾液腺癌的患者的基本资料以及生存数据。通过随机抽样法,将11362名患者按照7:3比例分为训练集(7953名患者)和验证集(3409名患者)。其中,所述基本资料包括:年龄、性别、种族、婚姻状况、部位、分化程度、AJCC分期、T\N\M分期、肿瘤大小、病理类型、是否手术、是否清扫淋巴结。
初步筛选模块,连接所述获取模块,用于将训练集中患者的基本资料构建比例风险回归模型,结果表明对于总生存率的预测,单因素比例风险回归模型表明所有预测因子均具有预测价值(P<0.001);多因素比例风险回归模型结果表明年龄、性别、种族、部位、分化程度、AJCC分期、T\N\M分期、肿瘤大小、病理类型、是否手术具有较高预测价值(P<0.01);对于癌症特异性生存率的预测,单因素比例风险回归模型表明所有预测因子均具有预测价值(P<0.001);多因素比例风险回归模型结果表明年龄、性别、种族、部位、分化程度、AJCC分期、T\N分期、肿瘤大小、病理类型、是否手术、是否清扫淋巴结具有较高预测价值(P<0.01)。
最终筛选模块,连接所述初步筛选模块,用于利用R软件通过套索算法计算确定最优惩罚系数λ。对于总生存率的预测,最优惩罚系数λ为0.001642673,对于癌症特异性生存率预测,最优惩罚系数λ为0.0008036133。
生存率模型构建模块,连接所述最终筛选模块,用于对于总生存率预测,年龄、性别、种族、婚姻状况、部位、分化程度、AJCC分期、T\N\M分期、肿瘤大小、病理类型、是否手术最终纳入比例风险回归模型,所构建模型公式为:生存率=年龄*1.4745+性别*2.0265+种族*0.8267+婚姻状况*1.0254+部位*1.0664+分化程度*1.0821+AJCC分期*1.3433+T分期*1.1565+N分期*1.0956+M分期*0.8740+肿瘤大小*0.8704+是否手术*1.8844+病理类型*0.9813。对于癌症特异性生存率的预测,年龄、性别、种族、分化程度、AJCC分期、T\N\M分期、肿瘤大小、病理类型、是否手术、是否清扫淋巴结最终纳入比例风险回归模型,构建公式为:生存率=性别*1.3085+年龄*1.5929+种族*0.8397+分化程度*1.1009+AJCC分期*1.4514+T分期*1.1952+N分期*1.1260+M分期*0.9311+肿瘤大小*0.8445+是否手术*2.1491+是否清扫淋巴结*0.9329+病理类型*0.9793。
列线图绘制模块,连接所述生存率模型构建模块,用于基于对应总生存率预测的比例风险回归模型和对于癌症特异性生存率的预测的比例风险回归模型,绘制对应总生存率预测的列线图A和对应癌症特异性生存率预测的列线图B。
列线图验证模块,连接所述列线图绘制模块,用于在训练集和验证集中分别对列线图A的表现验证。在训练集中ROC曲线结果显示,与AJCC分期和TNM分期相比,列线图A能够更加有效地预测患者的总体生存率和癌症特异性生存率(列线图A,AUC=83.5,95%CI=82.4-84.7;TNM分期,AUC=72.7,95%CI=71.3-74.1;AJCC分期,AUC=71.6,95%CI=70.2-73.0)。在验证集中结果类似(列线图A,AUC=82.7,95%CI=81.0-84.3;TNM分期,AUC=71.0,95%CI=68.9-73.2;AJCC分期,AUC=69.8,95%CI=67.7-71.9)。与AJCC分期和TNM分期相比,校准曲线显示列线图A能够更加准确地预测患者的总体生存率和癌症特异性生存率。临床决策曲线分析结果表明应用列线图A进行生存率预测临床获益明显高于AJCC分期、TNM分期以及不使用预测工具。在训练集和验证集中分别对列线图B的表现验证。在训练集中ROC曲线结果显示,与AJCC分期和TNM分期相比,列线图B能够更加有效地预测患者的总体生存率和癌症特异性生存率(列线图B,AUC=83.9,95%CI=82.6-85.2;TNM分期,AUC=75.9,95%CI=74.4-77.3;AJCC分期,AUC=73.9,95%CI=72.4-75.3)。在验证集中结果类似(列线图B,AUC=82.8,95%CI=80.9-84.7;TNM分期,AUC=74.5,95%CI=72.2-76.7;AJCC分期,AUC=72.6,95%CI=70.4-74.8)。与AJCC分期和TNM分期相比,校准曲线显示列线图B能够更加准确地预测患者的总体生存率和癌症特异性生存率。临床决策曲线分析结果表明应用列线图B进行生存率预测临床获益明显高于使用AJCC分期、TNM分期预测以及不使用任何预测工具。
通过在训练集和验证集与TNM分期、AJCC分期比较,能够科学地、有效地对模型和列线图的效果进行评估,从而保证其可靠性、有效性、及其应用价值。
与上述实施例原理相似的是,本发明提供一种大唾液腺癌患者生存预测方法。
以下结合附图提供具体实施例:
如图4展示本发明实施例中的一种大唾液腺癌患者生存预测方法的流程示意图。
所述方法包括:
步骤S41:获取多个大唾液腺癌确诊患者的基本数据;其中,所述基本数据包括:个人基本数据以及生存数据。
可选的,所述个人基本数据包括:年龄、性别、种族、婚姻状况、部位、分化程度、AJCC分期、T\N\M分期、肿瘤大小、病理类型、是否手术、是否清扫淋巴结。
步骤S42:根据各大唾液腺癌确诊患者的基本数据构建用于总生存率预测和/或用于癌症特异性生存率预测的比例风险回归模型,以获得多个初步总生存率预测因子和/或初步癌症特异性生存率预测因子。
可选的,步骤S42包括:根据各大唾液腺癌确诊患者的个人基本数据构建用于总生存率预测和/或用于癌症特异性生存率预测的比例风险回归模型;其中,所述用于总生存率预测和/或用于癌症特异性生存率预测的比例风险回归模型的类型包括:单因素比例风险回归模型以及多因素比例风险回归模型;基于用于总生存率预测和/或用于癌症特异性生存率预测的比例风险回归模型,获得多个初步总生存率预测因子和/或初步癌症特异性生存率预测因子。
步骤S43:根据由各大唾液腺癌确诊患者的基本数据计算总生存率预测最优惩罚系数和/或癌症特异性生存率预测最优惩罚系数,以获得经各初步总生存率预测因子和/或各初步癌症特异性生存率预测因子进行进一步筛选的一或多个最终总生存率预测因子和/或最终癌症特异性生存率预测因子。
可选的,步骤S43包括:基于套索算法,根据由各大唾液腺癌确诊患者的基本数据计算总生存率预测最优惩罚系数和/或癌症特异性生存率预测最优惩罚系数;根据所述总生存率预测最优惩罚系数和/或癌症特异性生存率预测最优惩罚系数,分别对各初步总生存率预测因子和/或各初步癌症特异性生存率预测因子进行进一步筛选,获得一或多个最终总生存率预测因子和/或最终癌症特异性生存率预测因子;其中,所述最终总生存率预测因子包括:年龄、性别、种族、婚姻状况、部位、分化程度、AJCC分期、T\N\M分期、肿瘤大小、病理类型以及是否手术;和/或,所述最终癌症特异性生存率预测因子包括:年龄、性别、种族、分化程度、AJCC分期、T\N\M分期、肿瘤大小、病理类型、是否手术以及是否清扫淋巴结。
步骤S44:利用各大唾液腺癌确诊患者的基本数据训练由各最终总生存率预测因子和/或各最终癌症特异性生存率预测因子纳入的比例风险回归模型,获得总生存率预测模型和/或癌症特异性生存率预测模型。
可选的,步骤S44包括:将各最终总生存率预测因子和/或各最终癌症特异性生存率预测因子纳入比例风险回归模型;利用各大唾液腺癌确诊患者的基本数据训练分别纳入最终总生存率预测因子和/或最终癌症特异性生存率预测因子的比例风险回归模型,获得总生存率预测模型和/或癌症特异性生存率预测模型;获取所述总生存率预测模型中各最终总生存率预测因子分别所对应的权重参数值,和/或所述癌症特异性生存率预测模型中各述最终癌症特异性生存率预测因子分别所对应的权重参数值。
步骤S45:基于所述总生存率预测模型和/或癌症特异性生存率预测模型,绘制总生存率预测列线图和/或癌症特异性生存率预测列线图,以对大唾液腺癌确诊患者的总生存率和/或癌症特异性生存率进行预测。
可选的,基于所述总生存率预测模型中各最终总生存率预测因子分别所对应的权重参数值,和/或所述癌症特异性生存率预测模型中各最终癌症特异性生存率预测因子分别所对应的权重参数值,根据各大唾液腺癌确诊患者的基本数据绘制总生存率预测列线图和/或癌症特异性生存率预测列线图,以对大唾液腺癌确诊患者的总生存率和/或癌症特异性生存率进行预测。
可选的,所述总生存率预测列线图包括:分值标尺,其分值范围为0至100;对应各最终总生存率预测因子的预测变量,包括:年龄变量、性别变量、种族变量、婚姻状况变量、部位变量、分化程度变量、AJCC分期变量、T\N\M分期变量、肿瘤大小变量、病理类型变量以及是否手术变量;每个预测变量均包括若干个变量取值,每一个变量取值对应所述分值标尺上的一个分值;总分值标尺,其分值范围为0至500;生存率变量,为连续性变量,包括:一或多个生存率子变量;且每一个生存率子变量包括一变量取值范围,且每一个变量取值范围对应有所述总分值标尺上的一个分值范围;其中,所述分值标尺、各预测变量、所述总分值标尺以及各生存率子变量分别处于所述总生存率预测列线图的一行;和/或,所述癌症特异性生存率预测列线图包括:分值标尺,其分值范围为0至100;对应各最终癌症特异性生存率预测因子的预测变量,包括:年龄变量、性别变量、种族变量、分化程度变量、AJCC分期变量、T\N\M分期变量、肿瘤大小变量、病理类型变量、是否手术变量以及是否清扫淋巴结变量;每个预测变量均包括若干个变量取值,每一个变量取值对应所述分值标尺上的一个分值;总分值标尺,其分值范围为0至650;生存率变量,为连续性变量,包括:一或多个生存率子变量;且每一个生存率子变量包括一变量取值范围,且每一个变量取值范围对应有所述总分值标尺上的一个分值范围;其中,所述分值标尺、各预测变量、所述总分值标尺以及各生存率子变量分别处于所述癌症特异性生存率预测列线图的一行。
可选的,所述方法还包括:利用各大唾液腺癌确诊患者的基本数据对总生存率预测列线图和/或癌症特异性生存率预测列线图进行验证。
如图5展示本发明实施例中的大唾液腺癌患者生存预测终端50的结构示意图。
所述大唾液腺癌患者生存预测终端50包括:存储器51及处理器52所述存储器51用于存储计算机程序;所述处理器52运行计算机程序实现如图4所述的大唾液腺癌患者生存预测方法。
可选的,所述存储器51的数量均可以是一或多个,所述处理器52的数量均可以是一或多个,而图5中均以一个为例。
可选的,所述大唾液腺癌患者生存预测终端50中的处理器52会按照如图1所述的步骤,将一个或多个以应用程序的进程对应的指令加载到存储器51中,并由处理器52来运行存储在第一存储器51中的应用程序,从而实现如图4所述大唾液腺癌患者生存预测方法中的各种功能。
可选的,所述存储器51,可能包括但不限于高速随机存取存储器、非易失性存储器。例如一个或多个磁盘存储设备、闪存设备或其他非易失性固态存储设备;所述处理器52,可能包括但不限于中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital SignalProcessing,简称DSP)、专用集成电路(Application Specific Integrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
可选的,所述处理器52可以是通用处理器,包括中央处理器(Central ProcessingUnit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
本发明还提供计算机可读存储介质,存储有计算机程序,所述计算机程序运行时实现如图4所示的大唾液腺癌患者生存预测方法。所述计算机可读存储介质可包括,但不限于,软盘、光盘、CD-ROM(只读光盘存储器)、磁光盘、ROM(只读存储器)、RAM(随机存取存储器)、EPROM(可擦除可编程只读存储器)、EEPROM(电可擦除可编程只读存储器)、磁卡或光卡、闪存、或适于存储机器可执行指令的其他类型的介质/机器可读介质。所述计算机可读存储介质可以是未接入计算机设备的产品,也可以是已接入计算机设备使用的部件。
综上所述,本发明的大唾液腺癌患者生存预测系统、方法及终端,通过收集大量收集患者的信息资料信息,通过比例风险回归和套索算法筛选合适预测因子,并通过构建比例风险模型绘制列线图;本发明筛选的预测因子是临床常见的信息,具有易于收集、可靠性强的特点,便于本专利的推广使用。通过构建比例风险模型绘制列线图,能够高效、准确地预测大唾液患者的总体生存率和癌症特异性生存率,解决了现有技术的问题。所以,本发明有效克服了现有技术中的种种缺点而具高度产业利用价值。
上述实施例仅示例性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,但凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。
Claims (10)
1.一种大唾液腺癌患者生存预测系统,其特征在于,所述系统包括:
获取模块,用于获取多个大唾液腺癌确诊患者的基本数据;其中,所述基本数据包括:个人基本数据以及生存数据;
初步筛选模块,连接所述获取模块,用于根据各大唾液腺癌确诊患者的基本数据构建用于总生存率预测和/或用于癌症特异性生存率预测的比例风险回归模型,以获得多个初步总生存率预测因子和/或初步癌症特异性生存率预测因子;
最终筛选模块,连接所述初步筛选模块,用于根据由各大唾液腺癌确诊患者的基本数据计算总生存率预测最优惩罚系数和/或癌症特异性生存率预测最优惩罚系数,以获得经各初步总生存率预测因子和/或各初步癌症特异性生存率预测因子进行进一步筛选的一或多个最终总生存率预测因子和/或最终癌症特异性生存率预测因子;
生存率模型构建模块,连接所述最终筛选模块,用于利用各大唾液腺癌确诊患者的基本数据训练由各最终总生存率预测因子和/或各最终癌症特异性生存率预测因子纳入的比例风险回归模型,获得总生存率预测模型和/或癌症特异性生存率预测模型;
列线图绘制模块,连接所述生存率模型构建模块,用于基于所述总生存率预测模型和/或癌症特异性生存率预测模型,绘制总生存率预测列线图和/或癌症特异性生存率预测列线图,以对大唾液腺癌确诊患者的总生存率和/或癌症特异性生存率进行预测。
2.根据权利要求1中所述的大唾液腺癌患者生存预测系统,其特征在于,所述个人基本数据包括:年龄、性别、种族、婚姻状况、部位、分化程度、AJCC分期、T\N\M分期、肿瘤大小、病理类型、是否手术、是否清扫淋巴结。
3.根据权利要求1中所述的大唾液腺癌患者生存预测系统,其特征在于,所述初步筛选模块包括:
回归模型构建单元,用于根据各大唾液腺癌确诊患者的个人基本数据构建用于总生存率预测和/或用于癌症特异性生存率预测的比例风险回归模型;其中,所述用于总生存率预测和/或用于癌症特异性生存率预测的比例风险回归模型的类型包括:单因素比例风险回归模型以及多因素比例风险回归模型;
初步筛选单元,连接所述回归模型构建单元,用于基于用于总生存率预测和/或用于癌症特异性生存率预测的比例风险回归模型,获得多个初步总生存率预测因子和/或初步癌症特异性生存率预测因子。
4.根据权利要求1中所述的大唾液腺癌患者生存预测系统,其特征在于,所述最终筛选模块包括:
最优惩罚系数计算单元,用于基于套索算法,根据由各大唾液腺癌确诊患者的基本数据计算总生存率预测最优惩罚系数和/或癌症特异性生存率预测最优惩罚系数;
最终筛选单元,连接所述最优惩罚系数计算单元,用于根据所述总生存率预测最优惩罚系数和/或癌症特异性生存率预测最优惩罚系数,分别对各初步总生存率预测因子和/或各初步癌症特异性生存率预测因子进行进一步筛选,获得一或多个最终总生存率预测因子和/或最终癌症特异性生存率预测因子;
其中,所述最终总生存率预测因子包括:年龄、性别、种族、婚姻状况、部位、分化程度、AJCC分期、T\N\M分期、肿瘤大小、病理类型以及是否手术;和/或,所述最终癌症特异性生存率预测因子包括:年龄、性别、种族、分化程度、AJCC分期、T\N\M分期、肿瘤大小、病理类型、是否手术以及是否清扫淋巴结。
5.根据权利要求1中所述的大唾液腺癌患者生存预测系统,其特征在于,所述生存率模型构建模块包括:
预测因子纳入单元,用于将各最终总生存率预测因子和/或各最终癌症特异性生存率预测因子纳入比例风险回归模型;
模型构建单元,连接所述预测因子纳入单元,用于利用各大唾液腺癌确诊患者的基本数据训练分别纳入最终总生存率预测因子和/或最终癌症特异性生存率预测因子的比例风险回归模型,获得总生存率预测模型和/或癌症特异性生存率预测模型;
预测因子权重值获取单元,连接所述模型构建单元,用于获取所述总生存率预测模型中各最终总生存率预测因子分别所对应的权重参数值,和/或所述癌症特异性生存率预测模型中各述最终癌症特异性生存率预测因子分别所对应的权重参数值。
6.根据权利要求5中所述的大唾液腺癌患者生存预测系统,其特征在于,所述列线图绘制模块还用于:基于所述总生存率预测模型中各最终总生存率预测因子分别所对应的权重参数值,和/或所述癌症特异性生存率预测模型中各最终癌症特异性生存率预测因子分别所对应的权重参数值,根据各大唾液腺癌确诊患者的基本数据绘制总生存率预测列线图和/或癌症特异性生存率预测列线图,以对以对大唾液腺癌确诊患者的总生存率和/或癌症特异性生存率进行预测。
7.根据权利要求1中所述的大唾液腺癌患者生存预测系统,其特征在于,所述总生存率预测列线图包括:
分值标尺,其分值范围为0至100;
对应各最终总生存率预测因子的预测变量,包括:年龄变量、性别变量、种族变量、婚姻状况变量、部位变量、分化程度变量、AJCC分期变量、T\N\M分期变量、肿瘤大小变量、病理类型变量以及是否手术变量;每个预测变量均包括若干个变量取值,每一个变量取值对应所述分值标尺上的一个分值;
总分值标尺,其分值范围为0至500;
生存率变量,为连续性变量,包括:一或多个生存率子变量;且每一个生存率子变量包括一变量取值范围,且每一个变量取值范围对应有所述总分值标尺上的一个分值范围;其中,所述分值标尺、各预测变量、所述总分值标尺以及各生存率子变量分别处于所述总生存率预测列线图的一行;
和/或,所述癌症特异性生存率预测列线图包括:
分值标尺,其分值范围为0至100;
对应各最终癌症特异性生存率预测因子的预测变量,包括:年龄变量、性别变量、种族变量、分化程度变量、AJCC分期变量、T\N\M分期变量、肿瘤大小变量、病理类型变量、是否手术变量以及是否清扫淋巴结变量;每个预测变量均包括若干个变量取值,每一个变量取值对应所述分值标尺上的一个分值;
总分值标尺,其分值范围为0至650;
生存率变量,为连续性变量,包括:一或多个生存率子变量;且每一个生存率子变量包括一变量取值范围,且每一个变量取值范围对应有所述总分值标尺上的一个分值范围;其中,所述分值标尺、各预测变量、所述总分值标尺以及各生存率子变量分别处于所述癌症特异性生存率预测列线图的一行。
8.根据权利要求1中所述的大唾液腺癌患者生存预测系统,其特征在于,所述系统还包括:列线图验证模块,连接所述列线图绘制模块,用于利用各大唾液腺癌确诊患者的基本数据对总生存率预测列线图和/或癌症特异性生存率预测列线图进行验证。
9.一种大唾液腺癌患者生存预测方法,其特征在于,所述方法包括:
获取多个大唾液腺癌确诊患者的基本数据;其中,所述基本数据包括:个人基本数据以及生存数据;
根据各大唾液腺癌确诊患者的基本数据构建用于总生存率预测和/或用于癌症特异性生存率预测的比例风险回归模型,以获得多个初步总生存率预测因子和/或初步癌症特异性生存率预测因子;
根据由各大唾液腺癌确诊患者的基本数据计算总生存率预测最优惩罚系数和/或癌症特异性生存率预测最优惩罚系数,以获得经各初步总生存率预测因子和/或各初步癌症特异性生存率预测因子进行进一步筛选的一或多个最终总生存率预测因子和/或最终癌症特异性生存率预测因子;
利用各大唾液腺癌确诊患者的基本数据训练由各最终总生存率预测因子和/或各最终癌症特异性生存率预测因子纳入的比例风险回归模型,获得总生存率预测模型和/或癌症特异性生存率预测模型;
基于所述总生存率预测模型和/或癌症特异性生存率预测模型,绘制总生存率预测列线图和/或癌症特异性生存率预测列线图,以对大唾液腺癌确诊患者的总生存率和/或癌症特异性生存率进行预测;
其中,所述个人基本数据包括:年龄、性别、种族、婚姻状况、部位、分化程度、AJCC分期、T\N\M分期、肿瘤大小、病理类型、是否手术、是否清扫淋巴结。
10.一种大唾液腺癌患者生存预测终端,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行如权利要求9所述的大唾液腺癌患者生存预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110785437.0A CN113361822A (zh) | 2021-07-12 | 2021-07-12 | 大唾液腺癌患者生存预测系统、方法及终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110785437.0A CN113361822A (zh) | 2021-07-12 | 2021-07-12 | 大唾液腺癌患者生存预测系统、方法及终端 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113361822A true CN113361822A (zh) | 2021-09-07 |
Family
ID=77539129
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110785437.0A Pending CN113361822A (zh) | 2021-07-12 | 2021-07-12 | 大唾液腺癌患者生存预测系统、方法及终端 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113361822A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114596964A (zh) * | 2022-05-09 | 2022-06-07 | 北京肿瘤医院(北京大学肿瘤医院) | 预测brca突变患者对侧乳腺癌发病风险的模型及应用 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016126883A1 (en) * | 2015-02-03 | 2016-08-11 | Cedars-Sinai Medical Center | Biomarker based prognostic model for predicting overall survival in patients with metastatic clear cell kidney cancer |
CN112002427A (zh) * | 2020-10-09 | 2020-11-27 | 重庆医科大学 | 失代偿期肝硬化合并感染危险预测模型的构建方法 |
CN112011616A (zh) * | 2020-09-02 | 2020-12-01 | 复旦大学附属中山医院 | 预测肝细胞癌肿瘤免疫浸润和术后生存时间的免疫基因预后模型 |
CN112635057A (zh) * | 2020-12-17 | 2021-04-09 | 郑州轻工业大学 | 基于临床表型和lasso的食管鳞癌预后指数模型构建方法 |
CN112635056A (zh) * | 2020-12-17 | 2021-04-09 | 郑州轻工业大学 | 基于Lasso的食管鳞癌患者风险预测列线图模型建立方法 |
CN112725454A (zh) * | 2021-02-03 | 2021-04-30 | 山东第一医科大学附属省立医院(山东省立医院) | 膀胱癌患者总体生存率预后模型 |
-
2021
- 2021-07-12 CN CN202110785437.0A patent/CN113361822A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016126883A1 (en) * | 2015-02-03 | 2016-08-11 | Cedars-Sinai Medical Center | Biomarker based prognostic model for predicting overall survival in patients with metastatic clear cell kidney cancer |
CN112011616A (zh) * | 2020-09-02 | 2020-12-01 | 复旦大学附属中山医院 | 预测肝细胞癌肿瘤免疫浸润和术后生存时间的免疫基因预后模型 |
CN112002427A (zh) * | 2020-10-09 | 2020-11-27 | 重庆医科大学 | 失代偿期肝硬化合并感染危险预测模型的构建方法 |
CN112635057A (zh) * | 2020-12-17 | 2021-04-09 | 郑州轻工业大学 | 基于临床表型和lasso的食管鳞癌预后指数模型构建方法 |
CN112635056A (zh) * | 2020-12-17 | 2021-04-09 | 郑州轻工业大学 | 基于Lasso的食管鳞癌患者风险预测列线图模型建立方法 |
CN112725454A (zh) * | 2021-02-03 | 2021-04-30 | 山东第一医科大学附属省立医院(山东省立医院) | 膀胱癌患者总体生存率预后模型 |
Non-Patent Citations (2)
Title |
---|
LI CHEN ET AL: "Postoperative Nomogram for Predicting Cancer-Specific and Overall Survival among Patients with Medullary Thyroid Cancer" * |
柳昌全 等: "基于SEER数据库的四肢骨肉瘤预后相关列线图的构建" * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114596964A (zh) * | 2022-05-09 | 2022-06-07 | 北京肿瘤医院(北京大学肿瘤医院) | 预测brca突变患者对侧乳腺癌发病风险的模型及应用 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kos et al. | Pitfalls in assessing stromal tumor infiltrating lymphocytes (sTILs) in breast cancer | |
CN109493969B (zh) | 评估Paget’s病伴浸润性导管癌患者预后的模型及其应用 | |
Necchi et al. | Nomogram-based prediction of overall survival in patients with metastatic urothelial carcinoma receiving first-line platinum-based chemotherapy: retrospective international study of invasive/advanced cancer of the urothelium (RISC) | |
Sun et al. | A computational tumor-infiltrating lymphocyte assessment method comparable with visual reporting guidelines for triple-negative breast cancer | |
CN112542247B (zh) | 乳腺癌新辅助化疗后病理学完全缓解概率预测方法及系统 | |
CN113192637A (zh) | 个体化定量评估进展为2型糖尿病的风险预测方法及装置 | |
CN107563134A (zh) | 一种用于精准预测胃癌患者预后的系统 | |
KR102044094B1 (ko) | 딥 러닝 기반 유전체 발현량 해석을 통한 암 또는 정상 판별 방법 및 그 장치 | |
CN112735592B (zh) | 肺癌预后模型的构建方法及应用方法、电子设备 | |
CN113361822A (zh) | 大唾液腺癌患者生存预测系统、方法及终端 | |
CN113270188A (zh) | 食管鳞癌根治术后患者预后预测模型构建方法及装置 | |
CN112562855B (zh) | 一种肝细胞癌术后早期复发风险预测方法、介质及终端设备 | |
CN110289092A (zh) | 使用所测分析物改进疾病诊断的方法 | |
CN114898874A (zh) | 一种肾透明细胞癌患者预后预测方法及系统 | |
Kader et al. | Evaluating statistical approaches to define clonal origin of tumours using bulk DNA sequencing: context is everything | |
CN110599485B (zh) | 丙肝肝纤维化特征信息提取方法及装置 | |
Endo et al. | The impact of tumor location on the value of lymphadenectomy for intrahepatic cholangiocarcinoma | |
CN114649094B (zh) | 一种基于核磁共振的乳腺癌多参数临床决策辅助装置 | |
CN111383766A (zh) | 计算机数据处理方法、装置、介质及电子设备 | |
Ouldamer et al. | Validation of a breast cancer nomogram for predicting nonsentinel node metastases after minimal sentinel node involvement: Validation of the Helsinki breast nomogram | |
Huang et al. | Comparison of different prognostic models for predicting cancer-specific survival in bladder transitional cell carcinoma | |
Jiang et al. | Association of the pathomics-collagen signature with lymph node metastasis in colorectal cancer: a retrospective multicenter study | |
CN113496769A (zh) | 基于病理组织的三联综合肿瘤分析系统和应用 | |
CN113496768A (zh) | 基于病理组织的二联综合肿瘤分析系统和应用 | |
McHugh et al. | Deep Learning and Colon Cancer Interpretation: Rise of the Machine |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210907 |