CN116386903B - 一种小细胞肺癌肿瘤间和肿瘤内异质性解读方法 - Google Patents
一种小细胞肺癌肿瘤间和肿瘤内异质性解读方法 Download PDFInfo
- Publication number
- CN116386903B CN116386903B CN202310657772.1A CN202310657772A CN116386903B CN 116386903 B CN116386903 B CN 116386903B CN 202310657772 A CN202310657772 A CN 202310657772A CN 116386903 B CN116386903 B CN 116386903B
- Authority
- CN
- China
- Prior art keywords
- heterogeneity
- subgroup
- roi
- thim
- lung cancer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 206010028980 Neoplasm Diseases 0.000 title claims abstract description 55
- 206010041067 Small cell lung cancer Diseases 0.000 title claims abstract description 30
- 208000000587 small cell lung carcinoma Diseases 0.000 title claims abstract description 28
- 238000000034 method Methods 0.000 title claims abstract description 22
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 38
- 238000004393 prognosis Methods 0.000 claims abstract description 32
- 230000008595 infiltration Effects 0.000 claims abstract description 15
- 238000001764 infiltration Methods 0.000 claims abstract description 15
- 230000001575 pathological effect Effects 0.000 claims abstract description 11
- 238000012795 verification Methods 0.000 claims abstract description 11
- 238000013507 mapping Methods 0.000 claims abstract description 10
- 238000011282 treatment Methods 0.000 claims abstract description 10
- 238000011156 evaluation Methods 0.000 claims abstract description 9
- 230000000694 effects Effects 0.000 claims abstract description 5
- 101150054688 thiM gene Proteins 0.000 claims abstract 10
- 238000004458 analytical method Methods 0.000 claims description 18
- 238000012360 testing method Methods 0.000 claims description 11
- 238000012549 training Methods 0.000 claims description 10
- 238000004422 calculation algorithm Methods 0.000 claims description 7
- 230000004083 survival effect Effects 0.000 claims description 7
- 210000001744 T-lymphocyte Anatomy 0.000 claims description 6
- 210000004027 cell Anatomy 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 5
- 101150027068 DEGS1 gene Proteins 0.000 claims description 4
- 108020004999 messenger RNA Proteins 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 3
- 230000008859 change Effects 0.000 claims description 3
- 238000003125 immunofluorescent labeling Methods 0.000 claims description 3
- 230000001105 regulatory effect Effects 0.000 claims description 3
- 230000008827 biological function Effects 0.000 claims description 2
- 238000010195 expression analysis Methods 0.000 claims description 2
- 238000010801 machine learning Methods 0.000 claims description 2
- 230000014509 gene expression Effects 0.000 abstract description 8
- 238000009169 immunotherapy Methods 0.000 abstract description 8
- 230000004044 response Effects 0.000 abstract description 8
- 230000002601 intratumoral effect Effects 0.000 abstract description 6
- 206010027336 Menstruation delayed Diseases 0.000 abstract description 3
- 230000009286 beneficial effect Effects 0.000 abstract description 3
- 230000031018 biological processes and functions Effects 0.000 abstract description 3
- 230000002980 postoperative effect Effects 0.000 abstract description 3
- 230000007246 mechanism Effects 0.000 abstract description 2
- 230000000955 neuroendocrine Effects 0.000 description 25
- 108091023040 Transcription factor Proteins 0.000 description 17
- 102000040945 Transcription factor Human genes 0.000 description 17
- 230000006872 improvement Effects 0.000 description 7
- 230000008901 benefit Effects 0.000 description 6
- 230000004069 differentiation Effects 0.000 description 4
- 210000001266 CD8-positive T-lymphocyte Anatomy 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000010837 poor prognosis Methods 0.000 description 3
- 230000000306 recurrent effect Effects 0.000 description 3
- 238000013517 stratification Methods 0.000 description 3
- 210000001519 tissue Anatomy 0.000 description 3
- 102100040006 Annexin A1 Human genes 0.000 description 2
- 101000959738 Homo sapiens Annexin A1 Proteins 0.000 description 2
- 101001117317 Homo sapiens Programmed cell death 1 ligand 1 Proteins 0.000 description 2
- 102100024216 Programmed cell death 1 ligand 1 Human genes 0.000 description 2
- 230000003828 downregulation Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000001531 micro-dissection Methods 0.000 description 2
- 210000000440 neutrophil Anatomy 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000035755 proliferation Effects 0.000 description 2
- 230000001737 promoting effect Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 230000019491 signal transduction Effects 0.000 description 2
- 230000001225 therapeutic effect Effects 0.000 description 2
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- 102100039398 C-X-C motif chemokine 2 Human genes 0.000 description 1
- 108010077544 Chromatin Proteins 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- 108090000695 Cytokines Proteins 0.000 description 1
- 230000004543 DNA replication Effects 0.000 description 1
- 102000003688 G-Protein-Coupled Receptors Human genes 0.000 description 1
- 108090000045 G-Protein-Coupled Receptors Proteins 0.000 description 1
- 101000889128 Homo sapiens C-X-C motif chemokine 2 Proteins 0.000 description 1
- 101000976697 Homo sapiens Inter-alpha-trypsin inhibitor heavy chain H1 Proteins 0.000 description 1
- 206010061218 Inflammation Diseases 0.000 description 1
- 102100023490 Inter-alpha-trypsin inhibitor heavy chain H1 Human genes 0.000 description 1
- 206010061309 Neoplasm progression Diseases 0.000 description 1
- 230000006044 T cell activation Effects 0.000 description 1
- 210000000447 Th1 cell Anatomy 0.000 description 1
- 210000004241 Th2 cell Anatomy 0.000 description 1
- 102000015098 Tumor Suppressor Protein p53 Human genes 0.000 description 1
- 108010078814 Tumor Suppressor Protein p53 Proteins 0.000 description 1
- 102000014384 Type C Phospholipases Human genes 0.000 description 1
- 108010079194 Type C Phospholipases Proteins 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000033289 adaptive immune response Effects 0.000 description 1
- 210000002203 alpha-beta t lymphocyte Anatomy 0.000 description 1
- 230000033115 angiogenesis Effects 0.000 description 1
- 230000003110 anti-inflammatory effect Effects 0.000 description 1
- 230000000259 anti-tumor effect Effects 0.000 description 1
- 230000005809 anti-tumor immunity Effects 0.000 description 1
- 210000003719 b-lymphocyte Anatomy 0.000 description 1
- 230000004791 biological behavior Effects 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 230000024245 cell differentiation Effects 0.000 description 1
- 238000002512 chemotherapy Methods 0.000 description 1
- 210000003483 chromatin Anatomy 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000024634 digestive tract morphogenesis Effects 0.000 description 1
- 230000002222 downregulating effect Effects 0.000 description 1
- 238000004043 dyeing Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 102100021145 fMet-Leu-Phe receptor Human genes 0.000 description 1
- 101710108492 fMet-Leu-Phe receptor Proteins 0.000 description 1
- 210000002950 fibroblast Anatomy 0.000 description 1
- 238000010230 functional analysis Methods 0.000 description 1
- 239000003862 glucocorticoid Substances 0.000 description 1
- 230000036039 immunity Effects 0.000 description 1
- 230000004054 inflammatory process Effects 0.000 description 1
- 230000028709 inflammatory response Effects 0.000 description 1
- 230000015788 innate immune response Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000021995 interleukin-8 production Effects 0.000 description 1
- 230000036210 malignancy Effects 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010172 mouse model Methods 0.000 description 1
- 210000004877 mucosa Anatomy 0.000 description 1
- 210000000822 natural killer cell Anatomy 0.000 description 1
- 230000013474 positive regulation of neural precursor cell proliferation Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 238000011127 radiochemotherapy Methods 0.000 description 1
- 230000007520 regulation of neural precursor cell proliferation Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- 238000011222 transcriptome analysis Methods 0.000 description 1
- 238000011269 treatment regimen Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 230000005751 tumor progression Effects 0.000 description 1
- 230000003827 upregulation Effects 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
- 230000029663 wound healing Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H70/00—ICT specially adapted for the handling or processing of medical references
- G16H70/60—ICT specially adapted for the handling or processing of medical references relating to pathologies
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B5/00—ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/20—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for electronic clinical trials or questionnaires
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Public Health (AREA)
- Life Sciences & Earth Sciences (AREA)
- Epidemiology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Primary Health Care (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Biophysics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- Software Systems (AREA)
- Bioethics (AREA)
- Pathology (AREA)
- Molecular Biology (AREA)
- Physiology (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开一种小细胞肺癌肿瘤间和肿瘤内异质性解读方法,包括步骤一、基于数字空间转录组学技术计算得到ROI样本异质性特征,步骤二、将ROI样本映射到患者水平并根据预后分层提出异质性分型模式进行分型,步骤三、解析异质性机制并寻找到决定异质性分型的核心基因集,步骤四、基于核心基因集构建肿瘤异质性指数模型THIM并进行THIM打分处理,步骤五、THIM智能模型的映射运用和验证;本发明在病理切片上破译了SCLC的肿瘤内异质性,在不进行显微切割的情况下精确比较同一肿瘤不同区域的基因表达、生物过程和免疫浸润,同时建立了THIM智能模型,实现对SCLC的预后和免疫治疗反应的预测,有助于局限期患者术后分层管理及晚期患者的免疫疗法疗效评估。
Description
技术领域
本发明涉及生物学技术领域,尤其涉及一种小细胞肺癌肿瘤间和肿瘤内异质性解读方法。
背景技术
小细胞肺癌(SCLC)是一种高度异质性的癌症,具有侵袭性进展和不良预后。目前,基于神经内分泌分化(NE)和转录因子(TF)的亚型已经被提出,但它们的预后意义和临床治疗相关性仍存在争议;最近的研究表明,肿瘤内和肿瘤间异质性(ITH)与多种恶性肿瘤的生物学行为和治疗脆弱性相关,然而,目前尚不清楚ITH在SCLC中的临床相关性的定义和解读。
小细胞肺癌的临床治疗策略几十年来进展缓慢,尽管最近的化疗结合免疫疗法显示出了有希望的益处,但临床受益人群有限,缺乏有效的疗效预测标志物。神经内分泌(NE)分型和转录因子(TF)分型提示修正了既往人们传统认为其为TP53和RB1共突变为特征的均一性肿瘤的认识,目前认为SCLC表现为较复杂的异质性,不仅表现为临床上相同分期患者具有不同的预后,也表现为肿瘤进展或治疗过程中的亚型转变。
但是,当前对于SCLC ITH的认识主要源于细胞系/小鼠模型或少量人体肿瘤新鲜样本的转录组测序或单细胞拟时序分析,缺乏对基于临床病理FFPE样本的病理异质性观察,更缺乏ITH相关的定量指标研究。肿瘤异质性的定义及其临床相关性仍不清楚,因此,本发明提出一种小细胞肺癌肿瘤间和肿瘤内异质性解读方法以解决现有技术中存在的问题。
发明内容
针对上述问题,本发明的目的在于提出一种小细胞肺癌肿瘤间和肿瘤内异质性解读方法,该小细胞肺癌肿瘤间和肿瘤内异质性解读方法在病理切片上破译了SCLC的肿瘤内和肿瘤间的异质性,可以在不进行显微切割的情况下精确比较同一肿瘤不同区域的基因表达、生物过程和免疫浸润,且证实了高度异质性亚组的预后较差,同时建立了THIM智能模型,实现对SCLC的预后和免疫治疗反应的预测,改善了临床相关的风险分层和分子分类,有助于局限期患者术后分层管理以及晚期患者的免疫疗法疗效评估。
为实现本发明的目的,本发明通过以下技术方案实现:一种小细胞肺癌肿瘤间和肿瘤内异质性解读方法,包括以下步骤:
步骤一、基于数字空间转录组学在同一病例切片上选取多个兴趣点ROI,再根据ROI的物理空间距离四种计算方法提取ROI样本异质性特征,并将其分为高异质性、中异质性和低异质性;
步骤二、将ROI样本异质性映射灰患者水平,对患者间的肿瘤异质性进行定义,并将其分为HC组和ML组,再对HC组和ML组进行生存分析和评分分析,并与传统TF分型和NE分型进行比对验证;
步骤三、利用转录组学功能差异表达分析对比HC组和ML组中特异上调的mRNA,并进行生物学功能注释,再使用免疫浸润评估算法解析HC组和ML组两个组间免疫微环境特征差异,并通过机器学习算法找到决定肿瘤异质性分型的10个核心基因集;
步骤四、基于步骤三中的10个核心基因集选择构建肿瘤异质性指数模型THIM,再将ROI样本异质性特征按照75%:15%:15%比例分为训练集、第一测试集和第二测试集对THIM模型进行打分处理;
步骤五、根据步骤四中的打分处理对其进行分组,并将分组分别映射到病人层面进行预后分析得到预后结果,完成THIM智能模型的验证。
进一步改进在于:所述步骤一中得到ROI样本异质性特征后先根据变异性打分公式计算全基因范围内每个基因的CV评分,并按从高到低的准则进行排序,选用排名前200的高变异基因作为候选特征,对ROI样本异质性特征进行无监督的层次聚类,再根据ITH评分、C评分和CV评分的分布趋势分别进行命名,得到高异质组H-H、中异质组M-H和低异质组L-H三组不同异质性的ROI分组,且三个分组之间实际的物理空间距离没有显著差异,实际的物理空间距离与C评分之间没有关联,以证明ROI的异质性是独立于人工选点产生的噪声。
进一步改进在于:所述步骤二中HC组和ML组生存分析显示两组患者的临床特征组合之间没有显著差异,经与临床病理特征联合进行预后分析,确定异质性分组是独立的临床病理特征,即HC组预后差于ML组。
进一步改进在于:所述步骤二中利用转录组层面ITH评分、C评分和CV评分队HC组和ML组进行评分分析,得到HC组患者和ML组患者之间具有显著异质性差异的结果。
进一步改进在于:所述步骤二中将HC组和ML组分组模式与传统TF分型和NE分型比对验证,得到HC组和ML组分组模式对患者预后的区分效能上优于传统TF分型和NE分型。
进一步改进在于:所述步骤三中使用免疫浸润评估算法解析HC组和ML组两组间免疫微环境特征差异后,得到在ML组中ROI样本中的所有T细和CD8+T细胞的浸润程度要显著高于HC组的细胞浸润变化结果。
进一步改进在于:所述步骤四中选择和构建THIM模型前先将129个DEGs利用自动编码器进行特征选择,重复500次,最后选择排名前10的基因最为候选,并对10组候选基因进行免疫荧光染色验证,最后依据验证后的10组候选基因进行模型选择和构建;其中10组候选基因中包含4个HC组特异和6个ML组特异。
进一步改进在于:所述步骤五中进行打分时将THIM打分大于0.45的定义为高异质性组,反之定义为低异质性组,所述步骤六中预后分析结果为高异质性组预后差于低异质性组。
本发明的有益效果为:本发明在病理切片上破译了SCLC的肿瘤内异质性,成功映射到患者水平并定义出瘤间异质性指数分组模型。在不进行显微切割的情况下精确比较同一肿瘤不同区域的基因表达、生物过程和免疫浸润,且证实了高度异质性亚组的预后较差;
同时本发明使用10个核心差异表达基因进行ITIH评分后建立了基于患者水平的不同肿瘤间异质性的THIM智能模型,实现对SCLC的预后和免疫治疗反应的预测,不仅可以显著分离患者的预后,而且比外部独立数据集上证明的PD-1/PDL1更好地预测免疫治疗疗效,改善了临床相关的风险分层和分子分类,有助于局限期患者术后分层管理及晚期患者联合免疫疗法的疗效评估。
附图说明
图1为本发明方法流程图。
图2为本发明129个DEGs利用自动编码器进行特征选择示意图。
图3为本发明核心基因的筛选过程到THIM智能模型的构建流程示意图。
具体实施方式
为了加深对本发明的理解,下面将结合实施例对本发明做进一步详述,本实施例仅用于解释本发明,并不构成对本发明保护范围的限定。
根据图1、图2和图3所示,本实施例提供了一种小细胞肺癌肿瘤间和肿瘤内异质性解读方法,包括以下步骤:
步骤一、数字空间转录组分析和位置信息揭示了小细胞肺癌(SCLC)客观存在肿瘤内和肿瘤间异质性(ITH)
基于数字空间转录组学的转录组和物理空间距离的四种计算方法,从转录组层面揭示ROI与ROI之间的关联以及各自的异质得分,从空间物理层面计算了同一个患者内ROI选点之间的真实距离,获取肿瘤组织真实轮廓、ROI选点的真实分布和WTA数据的染色图片,得到ROI样本的异质性特征分组;
在候选的样本中ROI物理距离的真实分布,说明ROI选点分布的多样性,既有近邻点也有远端区域;
在得到ROI样本后先根据变异性打分公式计算全基因范围内每个基因的CV-score(CV评分),并按从高到低的准则进行排序,选用排名前200的高变异基因作为候选特征,对ROI样本进行无监督的层次聚类,再根据ITH-score、C-score和CV-score的分布趋势分别进行命名,得到H-H高异质组、M-H中异质组和L-H低异质组三组不同异质性的ROI亚组,且三个亚组之间实际的物理空间距离(SPD)没有显著差异,SPD与C-score之间没有关联,以证明ROI的异质性是独立于人工选点产生的噪声。
步骤二、ROI分型组分揭示了与预后和治疗结果相关的肿瘤间异质性
将ROI样本映射回患者水平,根据患者预后定义肿瘤间异质性分组并将患者分成HC亚组和ML亚组,再根据转录组层面指标ITH评分、C评分和CV评分对HC亚组患者和ML亚组患者之间异质性进行验证;
再根据转录组层面指标ITH-score、C-score和CV-score对HC亚组患者和ML亚组患者之间异质性进行验证,确定两组患者的临床特征组合之间没有显著差异,经与临床病理特征联合进行预后分析,发现异质性分组是独立的临床病理特征;
预后分析显示在接受过手术+放化疗的病人中,ML亚组患者的预后(无论是OS还是DFS,包括3年5年生存率)显著优于HC亚组患者;
进一步联合生存状态和复发状态信息,揭示了ML亚组患者并没有出现死亡和复发事件,而HC亚组患者死亡事件占比为50%和复发事件占比为61.1%。
步骤三、小细胞肺癌ITH亚型与常规亚型的相互作用
比较并验证异质性分型较传统的TF分型和NE分型的优越性在于 异质性分型能更好地区分预后,对患者进行预后分层;
具体为根据传统的ANPY转录因子准则对ROI样本进行聚类划分并得到A、P和N三中亚型的ROI样本区域,将不同TF(转录因子)亚组的ROI区域映射到病人层面,得到了单纯的A、N和P亚型患者以及混合的TF complex(TF复合体)患者,比较了本研究提出的异质性分型与传统的TF分型适应性和优势,说明传统的适用于细胞系的TF分型在真实患者的肿瘤组织当中也存在复杂的异质性;
根据NE score(神经内分泌分化评分)亚型划分准则对ROI样本进行聚类划分,将NE score大于0的ROI样本定义为NE(神经内分泌分化)高的亚组,将NE score小于0的ROI样本定义为NE低的亚组,随后将不同的NE亚组的ROI样本区域映射到病人层面,发现结果与TF亚组相似,得到了单纯的NE高和NE低的亚组患者,也出现了NE complex(NE复合体)患者,该结果同样说明了NE分型在病人的大块组织中同样存在高度异质性,印证了本研究提出的异质性分型与传统的NE分型适应性和优势;
对映射结果进行分析时通过桑吉图比较分析ITH(肿瘤内和肿瘤间异质性)亚组与TF亚组和NE亚组患者之间的关联,得到无论是TF亚组还是NE亚组,在HC亚组和ML亚组中的分布都较为均衡,无统计学差异,说明在HC亚组既然存在单纯的A、N和P分型和单纯的NE高与NE低的患者,也存在TF complex和NE complex患者,侧面证明本研究提出的异质性分型既适应于传统分型,也能解释传统分型。
步骤四、转录组学功能分析揭示了ITH亚型CD8+T细胞浸润的变化
利用转录组学功能的差异表达分析得到在HC亚型和ML亚型中特异上调的mRNA,并进行生物学功能注释;
ML亚组样本都显著富集到免疫相关的功能上:IFN-γ响应,α-βT细胞分化的调节,粘膜中的先天免疫反应,mRNA代谢过程的负调控,白细胞介素8生产等...
HC亚组样本显著富集到:磷脂酶C激活G蛋白偶联受体信号通路的正调控,DNA复制依赖性染色质组装,神经前体细胞增殖的调节,神经前体细胞增殖的正调控,消化道形态发生等...
ANXA1:具有抗炎活性在糖皮质激素介导的炎症反应早期阶段的下调中起作用(通过相似性);通过增强由T细胞活化触发的信号级联来促进适应性免疫反应,调节活化T细胞的分化和增殖;促进T细胞分化为Th1细胞,并负调节分化为Th2细胞;对未受刺激的T细胞没有影响;促进炎症消退和伤口愈合;通过中性粒细胞N-甲酰肽受体作用,以增强CXCL2的释放;
进一步使用促肿瘤免疫,抗肿瘤免疫,血管生成/成纤维细胞和EMT/肿瘤增殖基因集合进行富集评估,发现抗肿瘤细胞因子在ML亚型中显著富集,而B细胞,NK细胞和中性粒细胞特征在HC亚型中显著富集。
然后再使用CIBERSORT、MCPCOUNTER、TIMER免疫浸润评估算法解析两个亚型组间CD8+T的ROI区域内的免疫微环境组成,得到在ML亚组中ROI样本中的所有T细和CD8+ T细胞的浸润程度要显著高于HC亚组的细胞浸润变化结果,从免疫微环境角度阐释异质性机制并寻找到决定异质性分型的核心基因集;
根据上述可知对ANXA1 RNA expression与T细胞和CD8+T细胞相关的蛋白质表达进行相关性分析,发现在ML亚组中两者具有显著关联,但是在HC亚组中无显著关联。
步骤五、肿瘤异质性指数模型(THIM)揭示了预后和治疗反应
基于核心基因集构建肿瘤异质性指数模型(THIM),再将ROI样本的异质性特征分组按划分比例为70%:30%划分为训练集和测试集,并利用训练集和测试集对肿瘤异质性指数模型(THIM)进行训练测试,得到THIM智能模型,并比较了6种方法与模型的分类性能,其中XGboost(极致梯度提升决策树)胜出,验证了THIM用于临床患者分组的临床价值;
其中选择和构建THIM模型前先将129个DEGs利用自动编码器进行特征选择,重复500次保证结果的鲁棒性,最后选择排名前10的基因最为候选,如说明书附图2所示,并对10组候选基因进行免疫荧光染色验证,最后依据验证后的10组候选基因进行模型选择和构建,如说明书附图3的流程示意图展示核心基因的筛选过程到THIM智能模型的构建,在10组候选基因中4个基因为HC亚组特异,6个基因为ML亚组特异。
步骤六、将THIM智能模型运用到训练集和测试集上进行THIM打分后进行分组,并将分组分别映射到病人层面进行预后分析得到预后结果,完成THIM智能模型的验证;
打分分组时打分高于0.45的为THIM high ROI(高异质性),反之为THIM low ROI(低异质性),将ROI的THIM分组映射到病人层面进行预后分析,结果显示THIM高组患者预后(OS/DFS的生存曲线;OS/DFS事件的发生)显著差于THIM低组患者。
使用外部独立测试集 George&Jiang cohort 验证了预后结果。
THIM score/label 均能有效预测免疫治疗反应,且性能优于基于PD-1和PDL1表达水平的预测结果(Roper cohort:该数据去除一个非典型样本),同时在ICB治疗响应组THIM score(THIM评分)明显较低,最后发现THIM high组患者对anti-PDL1免疫治疗均无响应。
以上显示和描述了本发明的基本原理、主要特征和优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。
Claims (7)
1.一种小细胞肺癌肿瘤间和肿瘤内异质性解读方法,其特征在于,包括以下步骤:
步骤一、基于数字空间转录组学在同一病例切片上选取ROI样本,再根据ROI样本的选点之间的物理空间距离提取ROI样本的异质性特征;
在得到ROI样本的异质性特征后,先根据变异系数计算公式计算全基因范围内每个基因的CV-score,并按从高到低的准则进行排序,选用排名前200的高变异基因作为候选特征,基于所述候选特征对所述ROI样本进行无监督的层次聚类,再根据ITH-score的分布趋势对所述ROI样本进行分组命名,得到高异质组H-H、中异质组M-H和低异质组L-H三组不同异质性的ROI分组;
步骤二、将所述ROI分组映射回患者水平,对患者的肿瘤间异质性和肿瘤内异质性进行定义,并将患者分为HC亚组和ML亚组,再对HC亚组和ML亚组进行生存分析和评分分析,并将HC亚组和ML亚组分别与传统TF分型和NE分型进行比对验证;
步骤三、利用转录组差异表达分析法对比HC亚组和ML亚组中特异上调的mRNA,并进行生物学功能注释,再使用免疫浸润评估算法解析HC亚组和ML亚组两组间的免疫微环境特征差异,并通过机器学习算法找到决定肿瘤异质性分型的10个核心基因集;
步骤四、基于步骤三中的10个核心基因集选择和构建肿瘤异质性指数模型THIM,再根据ROI样本的异质性特征将ROI样本按照70%:30%比例分为训练集和测试集,通过所述肿瘤异质性指数模型THIM对所述训练集和测试集进行打分处理;
步骤五、对步骤四中打分处理后的训练集和测试集进行分组,并将分组结果分别映射到病人层面进行预后分析,以得到预后结果,完成所述肿瘤异质性指数模型THIM的验证,利用验证后的肿瘤异质性指数模型THIM进行小细胞肺癌肿瘤间和肿瘤内异质性解读。
2.根据权利要求1所述的一种小细胞肺癌肿瘤间和肿瘤内异质性解读方法,其特征在于:步骤二中对HC亚组和ML亚组进行生存分析后,显示两组患者的临床特征组合之间没有显著差异,经与临床病理特征联合进行预后分析,确定异质性分组是独立的临床病理特征。
3.根据权利要求1所述的一种小细胞肺癌肿瘤间和肿瘤内异质性解读方法,其特征在于:步骤二中利用转录组层面ITH-score和C-score分别对HC亚组和ML亚组进行评分分析,得到HC亚组患者和ML亚组患者之间具有显著异质性差异的结果。
4.根据权利要求1所述的一种小细胞肺癌肿瘤间和肿瘤内异质性解读方法,其特征在于:步骤二中将HC亚组和ML亚组分别与传统TF分型和NE分型比对验证,得到HC亚组和ML亚组对患者预后的区分效果上优于传统TF分型和NE分型。
5.根据权利要求1所述的一种小细胞肺癌肿瘤间和肿瘤内异质性解读方法,其特征在于:步骤三中使用免疫浸润评估算法解析HC亚组和ML亚组两组间的免疫微环境特征差异后,得到在ML亚组中ROI样本中的所有T细胞的浸润程度要显著高于HC亚组的细胞浸润变化结果。
6.根据权利要求1所述的一种小细胞肺癌肿瘤间和肿瘤内异质性解读方法,其特征在于:步骤四中选择和构建所述肿瘤异质性指数模型THIM前先将129个DEGs利用自动编码器进行特征选择,重复500次,然后选择排名前10组的基因作为候选基因,并对前10组的候选基因进行免疫荧光染色验证,最后依据验证后的10组候选基因进行模型的选择和构建;其中10组候选基因中包含4个HC亚组特异和6个ML亚组特异。
7.根据权利要求1所述的一种小细胞肺癌肿瘤间和肿瘤内异质性解读方法,其特征在于:步骤五中进行打分处理后分组时将所述肿瘤异质性指数模型THIM打分大于0.45的训练集和测试集中的ROI样本定义为高异质性组,反之定义为低异质性组,所述步骤五中的预后结果为高异质性组预后结果差于低异质性组。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310657772.1A CN116386903B (zh) | 2023-06-06 | 2023-06-06 | 一种小细胞肺癌肿瘤间和肿瘤内异质性解读方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310657772.1A CN116386903B (zh) | 2023-06-06 | 2023-06-06 | 一种小细胞肺癌肿瘤间和肿瘤内异质性解读方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116386903A CN116386903A (zh) | 2023-07-04 |
CN116386903B true CN116386903B (zh) | 2023-11-10 |
Family
ID=86961942
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310657772.1A Active CN116386903B (zh) | 2023-06-06 | 2023-06-06 | 一种小细胞肺癌肿瘤间和肿瘤内异质性解读方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116386903B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112011616A (zh) * | 2020-09-02 | 2020-12-01 | 复旦大学附属中山医院 | 预测肝细胞癌肿瘤免疫浸润和术后生存时间的免疫基因预后模型 |
CN112601826A (zh) * | 2018-02-27 | 2021-04-02 | 康奈尔大学 | 通过全基因组整合进行循环肿瘤dna的超灵敏检测 |
CN113192560A (zh) * | 2021-03-02 | 2021-07-30 | 郑州大学第一附属医院 | 一种基于铁死亡进程的肝细胞癌分型体系的构建方法 |
WO2022053065A1 (zh) * | 2020-09-14 | 2022-03-17 | 信达生物制药(苏州)有限公司 | 用于预测或评估肺癌患者的生物标志物、检测方法及应用 |
CN114672569A (zh) * | 2022-05-24 | 2022-06-28 | 浙江大学医学院附属第一医院 | 基于色氨酸代谢基因的肝癌预后评估方法 |
CN114686591A (zh) * | 2022-05-12 | 2022-07-01 | 浙江大学医学院附属第四医院 | 基于基因表达情况的肺鳞癌免疫治疗疗效预测模型及其构建方法和应用 |
CN115375640A (zh) * | 2022-08-11 | 2022-11-22 | 哈尔滨医科大学 | 一种肿瘤异质性识别方法、装置、电子设备、存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021108382A1 (en) * | 2019-11-26 | 2021-06-03 | University Of Cincinnati | Characterizing intra-site tumor heterogeneity |
-
2023
- 2023-06-06 CN CN202310657772.1A patent/CN116386903B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112601826A (zh) * | 2018-02-27 | 2021-04-02 | 康奈尔大学 | 通过全基因组整合进行循环肿瘤dna的超灵敏检测 |
CN112011616A (zh) * | 2020-09-02 | 2020-12-01 | 复旦大学附属中山医院 | 预测肝细胞癌肿瘤免疫浸润和术后生存时间的免疫基因预后模型 |
WO2022053065A1 (zh) * | 2020-09-14 | 2022-03-17 | 信达生物制药(苏州)有限公司 | 用于预测或评估肺癌患者的生物标志物、检测方法及应用 |
CN113192560A (zh) * | 2021-03-02 | 2021-07-30 | 郑州大学第一附属医院 | 一种基于铁死亡进程的肝细胞癌分型体系的构建方法 |
CN114686591A (zh) * | 2022-05-12 | 2022-07-01 | 浙江大学医学院附属第四医院 | 基于基因表达情况的肺鳞癌免疫治疗疗效预测模型及其构建方法和应用 |
CN114672569A (zh) * | 2022-05-24 | 2022-06-28 | 浙江大学医学院附属第一医院 | 基于色氨酸代谢基因的肝癌预后评估方法 |
CN115375640A (zh) * | 2022-08-11 | 2022-11-22 | 哈尔滨医科大学 | 一种肿瘤异质性识别方法、装置、电子设备、存储介质 |
Non-Patent Citations (4)
Title |
---|
Genomic instability-derived plasma extracellular vesicle-microRNA signature as a minimally invasive predictor of risk and unfavorable prognosis in breast cancer;Siqi Bao et al.;《Journal of Nanobiotechnology》;第1-13页 * |
乳腺癌预后及干细胞特性相关基因筛选与风险模型的建立;裴建赢;《中国优秀硕士学位论文全文数据库》(第09期);第2-35页 * |
基于肿瘤免疫微环境构建头颈部鳞癌的多组学预后预测模型;张雪凝;《万方学位论文》;第12-66页 * |
肿瘤微环境免疫细胞与肿瘤患者预后相关分析;张毅;《中国优秀博士学位论文全文数据库》(第01期);第18-73页 * |
Also Published As
Publication number | Publication date |
---|---|
CN116386903A (zh) | 2023-07-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116042832B (zh) | 一种预测非小细胞肺癌免疫治疗获益程度及预后的生物标志物及应用 | |
CN109929934B (zh) | 免疫相关基因在结直肠癌预后的试剂盒和系统中的应用 | |
CN116386903B (zh) | 一种小细胞肺癌肿瘤间和肿瘤内异质性解读方法 | |
Wang et al. | Transcriptomic analysis of cutaneous squamous cell carcinoma reveals a multigene prognostic signature associated with metastasis | |
CN113337605A (zh) | 与胃癌预后相关的标志分子 | |
WO2021228888A1 (en) | Biomarkers for hyperprogressive disease and therapy response after immunotherapy | |
Zhang et al. | Machine learning-based prediction of candidate gene biomarkers correlated with immune infiltration in patients with idiopathic pulmonary fibrosis | |
CN110770849A (zh) | Praegnant转移性乳腺癌群组中的不良结果的预后指标 | |
CN115424728A (zh) | 一种肿瘤恶性细胞基因预后风险模型构建方法 | |
AU2022340811A1 (en) | Assessment of melanoma therapy response | |
Hao et al. | SPRR1B is Related to the Immune Microenvironment and Can Be Used as a Biomarker for the Diagnosis of Psoriasis | |
US20210102260A1 (en) | Patient classification and prognositic method | |
Peng et al. | Comprehensive landscape of m6A regulator-related gene patterns and tumor microenvironment infiltration characterization in gastric cancer | |
CN117165682B (zh) | 用于乳腺癌新辅助化疗获益和/或预后评估的标志物组合及其应用 | |
CN116403648B (zh) | 一种基于多维分析建立的小细胞肺癌免疫新分型方法 | |
CN116312814B (zh) | 一种肺腺癌分子分型模型的构建方法、设备、装置以及试剂盒 | |
CN114927231B (zh) | 一种基于基因表达信息预测早期肺腺癌进展的方法及装置 | |
Li et al. | Bioinformatic analysis of hub markers and immune cell infiltration characteristics of gastric cancer | |
Fernandez-Becker et al. | In silico analysis of T-bet activity in peripheral blood mononuclear cells in patients with inflammatory bowel disease (IBD) | |
CN118345168A (zh) | 一种用于诊断乳头状甲状腺癌的生物标志物及其应用 | |
Li et al. | Identification of potential biomarkers in myelodysplastic syndromes by weighted gene co-expression network analysis | |
CN117457069A (zh) | 一种基于m7G相关基因突变对肝癌进行分型的方法和生存预测模型构建 | |
CN117867113A (zh) | 用于预测宫颈癌患者预后的ICTR-lncRNAs及预测模型和应用 | |
Nunes et al. | Racial disparities in breast cancer: Identifying predisposing clinical and molecular features associated with African American patients | |
TWI498560B (zh) | 用於檢測大腸直腸癌之基因標記與檢測方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |