CN111370059A - 一种肿瘤突变负荷的预测系统及方法 - Google Patents
一种肿瘤突变负荷的预测系统及方法 Download PDFInfo
- Publication number
- CN111370059A CN111370059A CN202010148803.7A CN202010148803A CN111370059A CN 111370059 A CN111370059 A CN 111370059A CN 202010148803 A CN202010148803 A CN 202010148803A CN 111370059 A CN111370059 A CN 111370059A
- Authority
- CN
- China
- Prior art keywords
- tumor mutation
- mutation load
- training
- image
- prediction model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 206010028980 Neoplasm Diseases 0.000 title claims abstract description 127
- 230000035772 mutation Effects 0.000 title claims abstract description 120
- 238000000034 method Methods 0.000 title claims abstract description 17
- 238000012549 training Methods 0.000 claims abstract description 81
- 230000001575 pathological effect Effects 0.000 claims abstract description 65
- 206010058467 Lung neoplasm malignant Diseases 0.000 claims abstract description 56
- 201000005202 lung cancer Diseases 0.000 claims abstract description 56
- 208000020816 lung neoplasm Diseases 0.000 claims abstract description 56
- 238000012545 processing Methods 0.000 claims abstract description 51
- 230000003902 lesion Effects 0.000 claims abstract description 26
- 238000009169 immunotherapy Methods 0.000 claims abstract description 21
- 238000012163 sequencing technique Methods 0.000 claims abstract description 16
- 238000000605 extraction Methods 0.000 claims abstract description 8
- 238000012360 testing method Methods 0.000 claims description 25
- 238000002372 labelling Methods 0.000 claims description 17
- 108090000623 proteins and genes Proteins 0.000 claims description 16
- 230000007170 pathology Effects 0.000 claims description 8
- 230000004083 survival effect Effects 0.000 claims description 8
- 206010064571 Gene mutation Diseases 0.000 claims description 3
- 238000012544 monitoring process Methods 0.000 claims description 3
- 230000000869 mutational effect Effects 0.000 claims description 3
- 239000012188 paraffin wax Substances 0.000 claims description 3
- 238000011282 treatment Methods 0.000 abstract description 7
- 238000013528 artificial neural network Methods 0.000 abstract description 2
- 230000009286 beneficial effect Effects 0.000 abstract description 2
- 239000000090 biomarker Substances 0.000 description 3
- 238000002560 therapeutic procedure Methods 0.000 description 3
- 229940076838 Immune checkpoint inhibitor Drugs 0.000 description 2
- 108091008026 Inhibitory immune checkpoint proteins Proteins 0.000 description 2
- 102000037984 Inhibitory immune checkpoint proteins Human genes 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000012274 immune-checkpoint protein inhibitor Substances 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 108010074708 B7-H1 Antigen Proteins 0.000 description 1
- 102000008096 B7-H1 Antigen Human genes 0.000 description 1
- 201000009030 Carcinoma Diseases 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000037429 base substitution Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 210000004602 germ cell Anatomy 0.000 description 1
- 238000011532 immunohistochemical staining Methods 0.000 description 1
- 230000001506 immunosuppresive effect Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 229960005386 ipilimumab Drugs 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 229960003301 nivolumab Drugs 0.000 description 1
- 210000005259 peripheral blood Anatomy 0.000 description 1
- 239000011886 peripheral blood Substances 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000000392 somatic effect Effects 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 238000011269 treatment regimen Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/50—Mutagenesis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/30—Detection of binding sites or motifs
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H30/00—ICT specially adapted for the handling or processing of medical images
- G16H30/40—ICT specially adapted for the handling or processing of medical images for processing medical images, e.g. editing
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/80—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for detecting, monitoring or modelling epidemics or pandemics, e.g. flu
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Medical Informatics (AREA)
- Biophysics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- Public Health (AREA)
- Data Mining & Analysis (AREA)
- Biomedical Technology (AREA)
- Chemical & Material Sciences (AREA)
- Biotechnology (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Analytical Chemistry (AREA)
- Evolutionary Computation (AREA)
- Genetics & Genomics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Biology (AREA)
- Computational Linguistics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Artificial Intelligence (AREA)
- Primary Health Care (AREA)
- Epidemiology (AREA)
- Radiology & Medical Imaging (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Databases & Information Systems (AREA)
- Pathology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种肿瘤突变负荷的预测系统及方法,涉及神经网络。包括:获取模块,对数字病理图像并标注获得标注图像;第一处理模块,对病灶区进行测序得到真实肿瘤突变负荷;第二处理模块,对病灶区进行特征提取得到病理图像特征;集合模块,将标注图像、真实肿瘤突变负荷和病理图像特征生成训练数据组;训练模块,根据训练数据组训练获得肿瘤突变负荷预测模型;提取模块,提取采用免疫治疗方案的获益肺癌患者;第三处理模块,获取各获益肺癌患者的临床随访数据,并得到肿瘤突变负荷区间并输出;预测模块,将待预测患者的数字病理图像输入到模型中得到预测肿瘤突变负荷。具有以下有益效果:预测其肿瘤突变负荷,以确定治疗方案。
Description
技术领域
本发明涉及神经网络领域,尤其涉及一种肿瘤突变负荷的预测系统及方法。
背景技术
肿瘤突变负荷(TMB)被定义为每百万碱基中被检测出的,体细胞基因编码错误、碱基替换、基因插入或缺失错误的总数。
肿瘤突变负荷作为一个潜在的生物标志物出现,有研究证明肿瘤突变负荷不仅和肺癌的无复发生存率(PFS)有关,还和免疫检查点抑制剂的治疗疗效有相关性。
免疫检查点抑制剂已经在很大程度上改变了肺癌的治疗方式,通过免疫组化染色方法,有大量的证据支持PD-L1可以作为肺癌的治疗疗效预测生物标志物,然而就目前的临床数据显示只有20%左右的肿瘤患者会对这些治疗方式产生应答,免疫治疗成功应答背后的原因还亟待探索。
欧洲临床肿瘤协会(ESMO)和ESMO亚洲已经在指南里纳入了肿瘤突变负荷作为潜在的生物学标志物,对于肿瘤突变负荷高的患者建议ipilimumab联合nivolumab作为一线治疗方案。常用的肿瘤突变负荷检测方法主要利用病理标本或者外周血标本进行全外显子(WES)测序方法对肿瘤DNA和对照的胚系DNA进行分析。然而由于癌肿之间的差异性,肿瘤突变负荷检测敏感性并不高,且这项检查目前来说十分昂贵,在临床中并没有得到普及。人工智能算法在医疗领域的潜力得到了国内外专家一致的肯定,我们设想可以选择合适的卷积神经网络算法模型通过分析患者相应的电子病理图像,提取肿瘤突变负荷敏感性高的切片图像特征,辅助临床医生区分从免疫抑制剂治疗获益的患者人群,从而让更多潜在的免疫治疗敏感人群得到更好的治疗方案提高生存率。
发明内容
本发明为了解决上述问题,现提出一种肿瘤突变负荷的预测系统,包括:
获取模块,用于获取若干肺癌患者的数字病理图像,并对所述数字病理图像中的病灶区进行标注获得标注图像;
第一处理模块,连接所述获取模块,用于分别对所述标注图像中的所述病灶区进行基因测序,并根据基因测序结果处理得到相应的真实肿瘤突变负荷;
第二处理模块,分别连接所述获取模块和所述第一处理模块,用于分别对各标注图像中的病灶区进行特征提取,得到关联所述真实肿瘤突变负荷的病理图像特征;
集合模块,分别连接所述获取模块、所述第一处理模块和所述第二处理模块,用于将所述标注图像、所述真实肿瘤突变负荷和所述病理图像特征加入一图像特征集合,并根据各所述图像特征集合生成训练数据组;
训练模块,连接所述集合模块,用于根据所述训练数据组训练获得肿瘤突变负荷预测模型;
提取模块,连接所述获取模块,用于从各所述肺癌患者中提取得到采用免疫治疗方案的若干获益肺癌患者;
第三处理模块,分别连接所述第一处理模块和所述提取模块,用于获取各所述获益肺癌患者的临床随访数据,并根据对应的所述真实肿瘤突变负荷和所述临床随访数据处理得到所述获益肺癌患者的肿瘤突变负荷区间并输出;
预测模块,分别连接所述训练模块和所述第三处理模块,用于将待预测患者的所述数字病理图像输入到所述肿瘤突变负荷预测模型中得到所述待预测患者对应的预测肿瘤突变负荷并输出;
医生根据所述肿瘤突变负荷区间以及所述预测肿瘤突变负荷确定所述待预测患者的所述免疫治疗方案的适用性。
优选的,所述获取模块包括:
采集单元,用于获取若干肺癌患者的数字病理图像;
标注单元,连接所述采集单元,用于对所述数字病理图像中的病灶区进行标注获得标注图像。
优选的,所述训练模块具体包括:
分组单元,用于将所述训练数据组中的各所述图像特征集合划分为一训练集和一测试集;
训练单元,连接所述分组单元,用于根据所述训练集中的各所述图像特征集合对预先生成的第一预测模型进行训练得到第二预测模型;
测试单元,分别连接所述分组单元和所述训练单元,用于将所述测试集输入所述第二预测模型,并根据所述第二预测模型的输出结果以及对应的真实肿瘤突变负荷处理得到所述第二预测模型的预测准确率;
比较单元,分别连接所述训练单元和所述测试单元,用于将所述预测准确率与预设的准确率阈值进行比较,并在所述预测准确率小于所述准确率阈值时,对所述第一预测模型进行参数调整并重新训练,以及在预测准确率不小于所述准确率阈值时,将所述第二预测模型作为肿瘤突变负荷预测模型输出。
优选的,所述临床随访数据包括所述肺癌患者的临床信息,和/或基因突变监测数据,和/或免疫治疗方案信息,和/或总生存期,和/或无复发生存期。
优选的,所述数字病理图像为全视野数字病理图像。
优选的,通过对所述肺癌患者的病理切片进行扫描获取所述数字病理图像。
优选的,所述病理切片包括冰冻切片,和/或石蜡切片。
一种肿瘤突变负荷的预测方法,应用于肿瘤突变负荷的预测系统,具体包括以下步骤:
步骤S1,获取若干肺癌患者的数字病理图像,并对所述数字病理图像中的病灶区进行标注获得标注图像;
步骤S2,分别对所述标注图像中的所述病灶区进行基因测序,并根据基因测序结果处理得到相应的真实肿瘤突变负荷;
步骤S3,分别对各标注图像中的病灶区进行特征提取,得到关联所述真实肿瘤突变负荷的病理图像特征;
步骤S4,将所述标注图像、所述真实肿瘤突变负荷和所述病理图像特征加入一图像特征集合,并根据各所述图像特征集合生成训练数据组;
步骤S5,根据所述训练数据组训练获得肿瘤突变负荷预测模型;
步骤S6,从各所述肺癌患者中提取得到采用免疫治疗方案的若干获益肺癌患者;
步骤S7,获取各所述获益肺癌患者的临床随访数据,并根据对应的所述真实肿瘤突变负荷和所述临床随访数据处理得到所述获益肺癌患者的肿瘤突变负荷区间并输出;
步骤S8,将待预测患者的所述数字病理图像输入到所述肿瘤突变负荷预测模型中得到所述待预测患者对应的预测肿瘤突变负荷并输出;
医生根据所述肿瘤突变负荷区间以及所述预测肿瘤突变负荷确定所述待预测患者的所述免疫治疗方案的适用性。
优选的,所述步骤S1包括:
步骤S11,获取若干肺癌患者的数字病理图像;
步骤S12,对所述数字病理图像中的病灶区进行标注获得标注图像。
优选的,所述步骤S5包括:
步骤S51,将所述训练数据组中的各所述图像特征集合划分为一训练集和一测试集;
步骤S52,根据所述训练集中的各所述图像特征集合对预先生成的第一预测模型进行训练得到第二预测模型;
步骤S53,将所述测试集输入所述第二预测模型,并根据所述第二预测模型的输出结果以及对应的真实肿瘤突变负荷处理得到所述第二预测模型的预测准确率;
步骤S54,将所述预测准确率与预设的准确率阈值进行比较:
若所述预测准确率小于所述准确率阈值,则对所述第一预测模型进行参数调整并重新训练;
若预测准确率不小于所述准确率阈值,则将所述第二预测模型作为肿瘤突变负荷预测模型输出。
具有以下有益效果:
本发明通过肺癌患者的数字病理图像预测其肿瘤突变负荷,以获得该患者是否是免疫治疗方案的获益人群,方便医生实施相应治疗方案。
附图说明
图1为本发明较佳的实施例中,一种肿瘤突变负荷的预测系统的结构示意图;
图2为本发明较佳的实施例中,一种肿瘤突变负荷的预测方法的流程示意图;
图3为本发明较佳的实施例中,标注图像获取的流程示意图;
图4为本发明较佳的实施例中,肿瘤突变负荷预测模型的训练流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
下面结合附图和具体实施例对本发明作进一步说明,但不作为本发明的限定。
本发明为了解决上述问题,现提出一种肿瘤突变负荷的预测系统,如图1所示,包括:
获取模块1,用于获取若干肺癌患者的数字病理图像,并对数字病理图像中的病灶区进行标注获得标注图像;
第一处理模块2,连接获取模块1,用于分别对标注图像中的病灶区进行基因测序,并根据基因测序结果处理得到相应的真实肿瘤突变负荷;
第二处理模块3,分别连接获取模块1和第一处理模块2,用于分别对各标注图像中的病灶区进行特征提取,得到关联真实肿瘤突变负荷的病理图像特征;
集合模块4,分别连接获取模块1、第一处理模块2和第二处理模块3,用于将标注图像、真实肿瘤突变负荷和病理图像特征加入一图像特征集合,并根据各图像特征集合生成训练数据组;
训练模块5,连接集合模块4,用于根据训练数据组训练获得肿瘤突变负荷预测模型;
提取模块6,连接获取模块1,用于从各肺癌患者中提取得到采用免疫治疗方案的若干获益肺癌患者;
第三处理模块7,分别连接第一处理模块2和提取模块6,用于获取各获益肺癌患者的临床随访数据,并根据对应的真实肿瘤突变负荷和临床随访数据处理得到获益肺癌患者的肿瘤突变负荷区间并输出;
预测模块8,分别连接训练模块5和第三处理模块7,用于将待预测患者的数字病理图像输入到肿瘤突变负荷预测模型中得到待预测患者对应的预测肿瘤突变负荷并输出;
医生根据肿瘤突变负荷区间以及预测肿瘤突变负荷确定待预测患者的免疫治疗方案的适用性。
具体地,本实施例中,为了建立肿瘤突变负荷的预测系统,来通过该预测系统预测肿瘤突变负荷敏感的人群,以方便医生针对该人群采取相应的治疗方案。首先,通过获取模块1获取若干肺癌患者的数字病理图像,并对数字病理图像中的病灶区进行标注获得标注图像,得到标注图像用于系统建立的学习样本,优选的通过经验丰富的医生进行标注,或者通过多位医生进行商议后进行统一标注,以确保标注结果准确无误;然后通过第一处理模块2分别对标注图像中的病灶区进行基因测序,并根据基因测序结果处理得到相应的真实肿瘤突变负荷,获得与上述标注图像相对应的真实肿瘤突变负荷,使两者相匹配;再通过第二处理模块3,分别对各标注图像中的病灶区进行特征提取,得到关联真实肿瘤突变负荷的病理图像特征,病灶区的病理图像特征出用于后续系统自我学习训练;然后再通过集合模块4将标注图像、真实肿瘤突变负荷和病理图像特征加入一图像特征集合,并根据各图像特征集合生成训练数据组,将标注图像、真实肿瘤突变负荷和病理图像特征集合在一起,形成一个完整的训练样本,将这样的若干个训练样本再集合生成训练数据组,完成机器学习的所有数据的建立;再通过训练模块5,根据训练数据组训练获得肿瘤突变负荷预测模型;再通过提取模块6,从各肺癌患者中提取得到采用免疫治疗方案的若干获益肺癌患者;再通过第三处理模块7,获取各获益肺癌患者的临床随访数据,并根据对应的真实肿瘤突变负荷和临床随访数据处理得到获益肺癌患者的肿瘤突变负荷区间并输出,获得获益肺癌患者的肿瘤突变负荷区间,以确定获益人群的范围,最后通过预测模块8将待预测患者的数字病理图像输入到肿瘤突变负荷预测模型中得到待预测患者对应的预测肿瘤突变负荷并输出,医生根据肿瘤突变负荷区间以及预测肿瘤突变负荷确定待预测患者的免疫治疗方案的适用性,并采用相应的治疗方法,以达到最佳治疗效果。
本发明较佳的实施例中,获取模块1包括:
采集单元11,用于获取若干肺癌患者的数字病理图像;
标注单元12,连接采集单元11,用于对数字病理图像中的病灶区进行标注获得标注图像。
具体地,本实施例中,标注图像首先通过获取若干肺癌患者的数字病理图像,然后再对数字病理图像中的病灶区进行标注。
本发明较佳的实施例中,训练模块5具体包括:
分组单元51,用于将训练数据组中的各图像特征集合划分为一训练集和一测试集;
训练单元52,连接分组单元51,用于根据训练集中的各图像特征集合对预先生成的第一预测模型进行训练得到第二预测模型;
测试单元53,分别连接分组单元51和训练单元52,用于将测试集输入第二预测模型,并根据第二预测模型的输出结果以及对应的真实肿瘤突变负荷处理得到第二预测模型的预测准确率;
比较单元54,分别连接训练单元52和测试单元53,用于将预测准确率与预设的准确率阈值进行比较:
若预测准确率小于准确率阈值,则对第一预测模型进行参数调整并重新训练;
若预测准确率不小于准确率阈值,则将第二预测模型作为肿瘤突变负荷预测模型输出。
具体地,本实施例中,训练模块的训练过程为本发明的重点之一,首先分组单元51,将训练数据组中的各图像特征集合划分为一训练集和一测试集,划分成训练集和测试集分别对系统的建立进行训练和测试;然后再利用训练单元52,根据训练集中的各图像特征集合对预先生成的第一预测模型进行训练得到第二预测模型;然后再通过测试单元53,将测试集输入第二预测模型,并根据第二预测模型的输出结果以及对应的真实肿瘤突变负荷处理得到第二预测模型的预测准确率;最后对得到的预测准确率进行处理,通过比较单元54,将预测准确率与预设的准确率阈值进行比较,当预测准确率小于准确率阈值,则说明该准确率还不能满足要求,需要对第一预测模型进行参数调整并重新训练;当预测准确率不小于准确率阈值,则说明满足了使用要求,并将第二预测模型作为肿瘤突变负荷预测模型输出,从而完成肿瘤突变负荷预测模型的建立。
本发明较佳的实施例中,临床随访数据包括肺癌患者的临床信息,和/或基因突变监测数据,和/或免疫治疗方案信息,和/或总生存期,和/或无复发生存期。
本发明较佳的实施例中,数字病理图像为全视野数字病理图像。
本发明较佳的实施例中,通过对肺癌患者的病理切片进行扫描获取数字病理图像。
本发明较佳的实施例中,病理切片包括冰冻切片,和/或石蜡切片。
一种肿瘤突变负荷的预测方法,应用于肿瘤突变负荷的预测系统,如图2所示,具体包括以下步骤:
步骤S1,获取若干肺癌患者的数字病理图像,并对数字病理图像中的病灶区进行标注获得标注图像;
步骤S2,分别对标注图像中的病灶区进行基因测序,并根据基因测序结果处理得到相应的真实肿瘤突变负荷;
步骤S3,分别对各标注图像中的病灶区进行特征提取,得到关联真实肿瘤突变负荷的病理图像特征;
步骤S4,将标注图像、真实肿瘤突变负荷和病理图像特征加入一图像特征集合,并根据各图像特征集合生成训练数据组;
步骤S5,根据训练数据组训练获得肿瘤突变负荷预测模型;
步骤S6,从各肺癌患者中提取得到采用免疫治疗方案的若干获益肺癌患者;
步骤S7,获取各获益肺癌患者的临床随访数据,并根据对应的真实肿瘤突变负荷和临床随访数据处理得到获益肺癌患者的肿瘤突变负荷区间并输出;
步骤S8,将待预测患者的数字病理图像输入到肿瘤突变负荷预测模型中得到待预测患者对应的预测肿瘤突变负荷并输出;
医生根据肿瘤突变负荷区间以及预测肿瘤突变负荷确定待预测患者的免疫治疗方案的适用性。
本发明较佳的实施例中,如图3所示,步骤S1包括:
步骤S11,获取若干肺癌患者的数字病理图像;
步骤S12,对数字病理图像中的病灶区进行标注获得标注图像。
本发明较佳的实施例中,如图4所示,步骤S5包括:
步骤S51,将训练数据组中的各图像特征集合划分为一训练集和一测试集;
步骤S52,根据训练集中的各图像特征集合对预先生成的第一预测模型进行训练得到第二预测模型;
步骤S53,将测试集输入第二预测模型,并根据第二预测模型的输出结果以及对应的真实肿瘤突变负荷处理得到第二预测模型的预测准确率;
步骤S54,将预测准确率与预设的准确率阈值进行比较:
若预测准确率小于准确率阈值,则对第一预测模型进行参数调整并重新训练;
若预测准确率不小于准确率阈值,则将第二预测模型作为肿瘤突变负荷预测模型输出。
以上所述仅为本发明较佳的实施例,并非因此限制本发明的实施方式及保护范围,对于本领域技术人员而言,应当能够意识到凡运用本发明说明书及图示内容所作出的等同替换和显而易见的变化所得到的方案,均应当包含在本发明的保护范围内。
Claims (10)
1.一种肿瘤突变负荷的预测系统,其特征在于,包括:
获取模块,用于获取若干肺癌患者的数字病理图像,并对所述数字病理图像中的病灶区进行标注获得标注图像;
第一处理模块,连接所述获取模块,用于分别对所述标注图像中的所述病灶区进行基因测序,并根据基因测序结果处理得到相应的真实肿瘤突变负荷;
第二处理模块,分别连接所述获取模块和所述第一处理模块,用于分别对各标注图像中的病灶区进行特征提取,得到关联所述真实肿瘤突变负荷的病理图像特征;
集合模块,分别连接所述获取模块、所述第一处理模块和所述第二处理模块,用于将所述标注图像、所述真实肿瘤突变负荷和所述病理图像特征加入一图像特征集合,并根据各所述图像特征集合生成训练数据组;
训练模块,连接所述集合模块,用于根据所述训练数据组训练获得肿瘤突变负荷预测模型;
提取模块,连接所述获取模块,用于从各所述肺癌患者中提取得到采用免疫治疗方案的若干获益肺癌患者;
第三处理模块,分别连接所述第一处理模块和所述提取模块,用于获取各所述获益肺癌患者的临床随访数据,并根据对应的所述真实肿瘤突变负荷和所述临床随访数据处理得到所述获益肺癌患者的肿瘤突变负荷区间并输出;
预测模块,分别连接所述训练模块和所述第三处理模块,用于将待预测患者的所述数字病理图像输入到所述肿瘤突变负荷预测模型中得到所述待预测患者对应的预测肿瘤突变负荷并输出;
医生根据所述肿瘤突变负荷区间以及所述预测肿瘤突变负荷确定所述待预测患者的所述免疫治疗方案的适用性。
2.根据权利要求1所述的肿瘤突变负荷的预测系统,其特征在于,所述获取模块包括:
采集单元,用于获取若干肺癌患者的数字病理图像;
标注单元,连接所述采集单元,用于对所述数字病理图像中的病灶区进行标注获得标注图像。
3.根据权利要求1所述的肿瘤突变负荷的预测系统,其特征在于,所述训练模块具体包括:
分组单元,用于将所述训练数据组中的各所述图像特征集合划分为一训练集和一测试集;
训练单元,连接所述分组单元,用于根据所述训练集中的各所述图像特征集合对预先生成的第一预测模型进行训练得到第二预测模型;
测试单元,分别连接所述分组单元和所述训练单元,用于将所述测试集输入所述第二预测模型,并根据所述第二预测模型的输出结果以及对应的真实肿瘤突变负荷处理得到所述第二预测模型的预测准确率;
比较单元,分别连接所述训练单元和所述测试单元,用于将所述预测准确率与预设的准确率阈值进行比较,并在所述预测准确率小于所述准确率阈值时,对所述第一预测模型进行参数调整并重新训练,以及在预测准确率不小于所述准确率阈值时,将所述第二预测模型作为肿瘤突变负荷预测模型输出。
4.根据权利要求1所述的肿瘤突变负荷的预测系统,其特征在于,所述临床随访数据包括所述肺癌患者的临床信息,和/或基因突变监测数据,和/或免疫治疗方案信息,和/或总生存期,和/或无复发生存期。
5.根据权利要求1所述的肿瘤突变负荷的预测系统,其特征在于,所述数字病理图像为全视野数字病理图像。
6.根据权利要求5所述的肿瘤突变负荷的预测系统,其特征在于,通过对所述肺癌患者的病理切片进行扫描获取所述数字病理图像。
7.根据权利要求6所述的肿瘤突变负荷的预测系统,其特征在于,所述病理切片包括冰冻切片,和/或石蜡切片。
8.一种肿瘤突变负荷的预测方法,其特征在于,应用于如权利要求1至7所述的任意一项肿瘤突变负荷的预测系统,具体包括以下步骤:
步骤S1,获取若干肺癌患者的数字病理图像,并对所述数字病理图像中的病灶区进行标注获得标注图像;
步骤S2,分别对所述标注图像中的所述病灶区进行基因测序,并根据基因测序结果处理得到相应的真实肿瘤突变负荷;
步骤S3,分别对各标注图像中的病灶区进行特征提取,得到关联所述真实肿瘤突变负荷的病理图像特征;
步骤S4,将所述标注图像、所述真实肿瘤突变负荷和所述病理图像特征加入一图像特征集合,并根据各所述图像特征集合生成训练数据组;
步骤S5,根据所述训练数据组训练获得肿瘤突变负荷预测模型;
步骤S6,从各所述肺癌患者中提取得到采用免疫治疗方案的若干获益肺癌患者;
步骤S7,获取各所述获益肺癌患者的临床随访数据,并根据对应的所述真实肿瘤突变负荷和所述临床随访数据处理得到所述获益肺癌患者的肿瘤突变负荷区间并输出;
步骤S8,将待预测患者的所述数字病理图像输入到所述肿瘤突变负荷预测模型中得到所述待预测患者对应的预测肿瘤突变负荷并输出;
医生根据所述肿瘤突变负荷区间以及所述预测肿瘤突变负荷确定所述待预测患者的所述免疫治疗方案的适用性。
9.根据权利要求8所述的肿瘤突变负荷的预测方法,其特征在于,所述步骤S1包括:
步骤S11,获取若干肺癌患者的数字病理图像;
步骤S12,对所述数字病理图像中的病灶区进行标注获得标注图像。
10.根据权利要求8所述的肿瘤突变负荷的预测方法,其特征在于,所述步骤S5包括:
步骤S51,将所述训练数据组中的各所述图像特征集合划分为一训练集和一测试集;
步骤S52,根据所述训练集中的各所述图像特征集合对预先生成的第一预测模型进行训练得到第二预测模型;
步骤S53,将所述测试集输入所述第二预测模型,并根据所述第二预测模型的输出结果以及对应的真实肿瘤突变负荷处理得到所述第二预测模型的预测准确率;
步骤S54,将所述预测准确率与预设的准确率阈值进行比较:
若所述预测准确率小于所述准确率阈值,则对所述第一预测模型进行参数调整并重新训练;
若预测准确率不小于所述准确率阈值,则将所述第二预测模型作为肿瘤突变负荷预测模型输出。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010148803.7A CN111370059A (zh) | 2020-03-05 | 2020-03-05 | 一种肿瘤突变负荷的预测系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010148803.7A CN111370059A (zh) | 2020-03-05 | 2020-03-05 | 一种肿瘤突变负荷的预测系统及方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111370059A true CN111370059A (zh) | 2020-07-03 |
Family
ID=71208698
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010148803.7A Pending CN111370059A (zh) | 2020-03-05 | 2020-03-05 | 一种肿瘤突变负荷的预测系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111370059A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111968742A (zh) * | 2020-08-14 | 2020-11-20 | 上海市肺科医院 | 一种肺癌基因突变的跨模态预测系统及方法 |
CN112101409A (zh) * | 2020-08-04 | 2020-12-18 | 中国科学院计算技术研究所 | 基于病理图像的肿瘤突变负荷(tmb)分类方法与系统 |
CN112750530A (zh) * | 2021-01-05 | 2021-05-04 | 上海梅斯医药科技有限公司 | 一种模型的训练方法、终端设备和存储介质 |
CN113611390A (zh) * | 2021-07-27 | 2021-11-05 | 四川大学华西医院 | 胸腔镜肺癌切除术中转开胸风险诊断预测模型及构建系统 |
CN116189850A (zh) * | 2023-02-28 | 2023-05-30 | 山东第一医科大学附属肿瘤医院(山东省肿瘤防治研究院、山东省肿瘤医院) | 基于病理组学深度神经网络模型的免疫治疗疗效预测方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109609635A (zh) * | 2018-12-24 | 2019-04-12 | 深圳市海普洛斯生物科技有限公司 | 多基因富集的探针库及与多种肿瘤治疗相关的多个基因的检测方法 |
CN110004229A (zh) * | 2019-04-09 | 2019-07-12 | 上海交通大学医学院附属瑞金医院 | 多基因作为egfr单克隆抗体类药物耐药标志物的应用 |
CN110055327A (zh) * | 2019-03-26 | 2019-07-26 | 南通大学 | 用于预测癌症免疫治疗效果的内皮细胞标记物与试剂盒 |
CN110364266A (zh) * | 2019-06-28 | 2019-10-22 | 深圳裕策生物科技有限公司 | 用于指导临床肿瘤个体化用药的数据库及其构建方法和装置 |
CN110504032A (zh) * | 2019-08-23 | 2019-11-26 | 元码基因科技(无锡)有限公司 | 基于苏木精-伊红染片的图像处理来预测肿瘤突变负荷的方法 |
-
2020
- 2020-03-05 CN CN202010148803.7A patent/CN111370059A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109609635A (zh) * | 2018-12-24 | 2019-04-12 | 深圳市海普洛斯生物科技有限公司 | 多基因富集的探针库及与多种肿瘤治疗相关的多个基因的检测方法 |
CN110055327A (zh) * | 2019-03-26 | 2019-07-26 | 南通大学 | 用于预测癌症免疫治疗效果的内皮细胞标记物与试剂盒 |
CN110004229A (zh) * | 2019-04-09 | 2019-07-12 | 上海交通大学医学院附属瑞金医院 | 多基因作为egfr单克隆抗体类药物耐药标志物的应用 |
CN110364266A (zh) * | 2019-06-28 | 2019-10-22 | 深圳裕策生物科技有限公司 | 用于指导临床肿瘤个体化用药的数据库及其构建方法和装置 |
CN110504032A (zh) * | 2019-08-23 | 2019-11-26 | 元码基因科技(无锡)有限公司 | 基于苏木精-伊红染片的图像处理来预测肿瘤突变负荷的方法 |
Non-Patent Citations (2)
Title |
---|
殷悦等: "肿瘤突变负荷对非小细胞肺癌免疫治疗疗效的预测价值", 《中华老年多器官疾病杂志》 * |
王军委等: ""肺癌免疫治疗中肿瘤突变负荷(TMB)临床指导意义的研究进展"", 《中国免疫学杂志》 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112101409A (zh) * | 2020-08-04 | 2020-12-18 | 中国科学院计算技术研究所 | 基于病理图像的肿瘤突变负荷(tmb)分类方法与系统 |
CN111968742A (zh) * | 2020-08-14 | 2020-11-20 | 上海市肺科医院 | 一种肺癌基因突变的跨模态预测系统及方法 |
CN112750530A (zh) * | 2021-01-05 | 2021-05-04 | 上海梅斯医药科技有限公司 | 一种模型的训练方法、终端设备和存储介质 |
CN113611390A (zh) * | 2021-07-27 | 2021-11-05 | 四川大学华西医院 | 胸腔镜肺癌切除术中转开胸风险诊断预测模型及构建系统 |
CN113611390B (zh) * | 2021-07-27 | 2023-04-07 | 四川大学华西医院 | 胸腔镜肺癌切除术中转开胸风险诊断预测模型及构建系统 |
CN116189850A (zh) * | 2023-02-28 | 2023-05-30 | 山东第一医科大学附属肿瘤医院(山东省肿瘤防治研究院、山东省肿瘤医院) | 基于病理组学深度神经网络模型的免疫治疗疗效预测方法 |
CN116189850B (zh) * | 2023-02-28 | 2023-08-18 | 山东第一医科大学附属肿瘤医院(山东省肿瘤防治研究院、山东省肿瘤医院) | 基于病理组学深度神经网络模型的免疫治疗疗效预测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111370059A (zh) | 一种肿瘤突变负荷的预测系统及方法 | |
CN109271969B (zh) | 一种脑胶质瘤分级评价方法及其装置 | |
US8992435B2 (en) | System and method for classifying a heart sound | |
Etemad et al. | Machine learning from clinical data sets of a contemporary decision for orthodontic tooth extraction | |
CN111028223B (zh) | 一种微卫星不稳定肠癌能谱ct碘水图影像组学特征处理方法 | |
CN113077875B (zh) | Ct影像的处理方法及装置 | |
CN110584605A (zh) | 一种相似度匹配的诊断监控综合医疗系统及其匹配方法 | |
CN110600109B (zh) | 一种彩色图像融合的诊断监控综合医疗系统及其融合方法 | |
CN1359656A (zh) | 评估脑皮层中神经元损伤程度的方法与装置 | |
CN114220543B (zh) | 一种肿瘤患者身心痛苦指数评估方法以及系统 | |
CN110575178B (zh) | 一种运动状态判断的诊断监控综合医疗系统及其判断方法 | |
CN107212858A (zh) | 基于运动状态的生理信息采集装置及方法 | |
CN113130050A (zh) | 一种医学信息显示方法及显示系统 | |
CN112617833A (zh) | 一种基于静息态脑电波检测抑郁症的装置 | |
CN108652586B (zh) | 一种胃食管反流自动检测系统 | |
CN109492690B (zh) | 一种基于卷积神经网络检测ct图像的方法 | |
Liu et al. | Combining ExtremeNet with Shape Constraints and Re-Discrimination to Detect Cells from CD56 Images | |
Hubers et al. | Artificial intelligence-based classification of motor unit action potentials in real-world needle EMG recordings | |
Saadi et al. | Low-cost ecg monitoring system with classification using deep learning | |
Veeraiah et al. | Medical Internet of Things using Deep Learning Techniques for Skin Cancer Detection | |
CN109543774B (zh) | 异常血透配比检测方法、装置、设备及计算机存储介质 | |
CN115482914B (zh) | 一种医疗影像数据处理方法,设备及存储介质 | |
Saketh et al. | Lung cancer prediction using machine learning techniques | |
CN109943635A (zh) | 一种用于flt3-itd定量检测的装置 | |
Rai et al. | Parkinson’s disease detection using a novel weighted ensemble of CNN models |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200703 |