CN115798723B - 一种癌症复发风险预测模型构建方法 - Google Patents

一种癌症复发风险预测模型构建方法 Download PDF

Info

Publication number
CN115798723B
CN115798723B CN202310055764.XA CN202310055764A CN115798723B CN 115798723 B CN115798723 B CN 115798723B CN 202310055764 A CN202310055764 A CN 202310055764A CN 115798723 B CN115798723 B CN 115798723B
Authority
CN
China
Prior art keywords
cell
cells
genes
treatment
dataset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310055764.XA
Other languages
English (en)
Other versions
CN115798723A (zh
Inventor
吴嘉瑞
段小霞
刘鑫馗
黄志鸿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zeqiao Medical Technology Co ltd
Original Assignee
Beijing Zeqiao Medical Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Zeqiao Medical Technology Co ltd filed Critical Beijing Zeqiao Medical Technology Co ltd
Priority to CN202310055764.XA priority Critical patent/CN115798723B/zh
Publication of CN115798723A publication Critical patent/CN115798723A/zh
Application granted granted Critical
Publication of CN115798723B publication Critical patent/CN115798723B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了一种癌症复发风险预测模型构建方法,通过整合单细胞和全转录组测序数据集识别影响免疫治疗响应的与预后相关的基因,并构建预后风险模型,有利于不同肿瘤诊断生物标志物的应用手册制定与靶向药物的设计,为肿瘤的临床诊断与治疗提供新的思路。

Description

一种癌症复发风险预测模型构建方法
技术领域
本发明涉及生物技术领域,具体涉及一种癌症复发风险预测模型构建方法。
背景技术
肿瘤不是单纯的肿瘤细胞,而演变为由群落中的肿瘤细胞、免疫细胞、成纤维细胞、血管内皮细胞等基质细胞组成的复杂器官样结构,它涵盖器官内的所有结构,如免疫浸润、血管、细胞外基质等,异质恶性细胞与免疫细胞和非免疫细胞相互作用,形成肿瘤微环境(tumor microenvironment, TME)的复杂细胞网络。肿瘤免疫微环境(tumor immunemicroenvironment, TIME)的成分主要有两大类,即免疫细胞和分泌因子,如细胞因子、趋化因子和生长因子。关于前者,肿瘤免疫微环境包含极其多样化的免疫细胞亚群,包括T淋巴细胞、B淋巴细胞、自然杀伤(NK)细胞、巨噬细胞、树突状细胞(DC)、粒细胞和髓源性抑制细胞(MDSC)等。通常,T细胞、B细胞、NK细胞和巨噬细胞有助于抑制肿瘤生长,而MDSC和调节性T细胞(Treg)往往会抑制抗肿瘤免疫。不过鉴于免疫细胞与肿瘤细胞的复杂相互作用,免疫细胞的特定作用可能会发生动态变化,甚至完全相反。例如,CD8+ T细胞的抗肿瘤功能可能会通过T细胞的耗竭而受到抑制,而在糖酵解低的肿瘤中阻断CTLA-4后,调节性T细胞对产生干扰素-γ的细胞的功能失稳可能会促进抗肿瘤免疫。
肿瘤内和肿瘤之间的细胞异质性是理解和治疗癌症的主要障碍,如果使用大块肿瘤组织进行分析则掩盖复杂的异质性。快速发展的单细胞测序技术的出现,包括与单细胞基因组、表观基因组、转录组和多组学测序相关的方法,单细胞测序技术已逐步成为临床肿瘤研究的有力工具,并在癌症进化领域引发了令人兴奋的新发现,包括对治疗的抵抗和肿瘤微环境。这些技术可以使科研工作者更加清晰的探索肿瘤组织中每个细胞的分子状态,从而进一步研究肿瘤异质性、微环境细胞类型组成,特别是使在免疫治疗的背景下探索影响治疗反应的细胞状态成为现实。单个细胞是生命活动的最终单元,其中遗传机制和细胞环境相互作用并形成组织和器官等复杂结构的形成和功能。在单细胞分辨率下解剖组合物和表征相互作用,动力学和功能对于在正常和患病条件下充分理解几乎所有生命现象的生物学是至关重要的。癌症是由体细胞突变引起的疾病,其赋予不受控制的增殖和侵袭性,尤其可以受益于单细胞分析的进步。
发明内容
为此,本发明提供一种癌症复发风险预测模型构建方法,通过整合单细胞和全转录组测序数据集识别影响免疫治疗响应的预后基因,并构建预后风险模型,为肿瘤的临床诊断与治疗提供新的思路。
为了实现上述目的,本发明提供如下技术方案:
根据本发明实施例的第一方面,提出一种癌症复发风险预测模型构建方法,所述方法包括:
步骤一:从多个数据库中获得癌症患者的肿瘤组织的全转录组测序数据,以及患者接受免疫治疗前后配对的肿瘤组织单细胞转录组测序数据;
步骤二:对单细胞转录组测序数据集进行质量控制,符合标准的细胞并获取其测序数据;
步骤三:对预处理后的单细胞数据进行标准化和归一化,通过RPCA整合并进行降维聚类得到不同细胞群,对不同细胞群进行差异表达基因分析,获得不同细胞群的差异表达基因;
步骤四:获取不同细胞类型的标志基因,根据标志基因在不同细胞群中的分布情况对不同细胞群进行细胞类型注释;
步骤五:对细胞类型注释后的单细胞数据进行受体配体数据比对,构建细胞通讯网络,筛选患者免疫治疗前后细胞通讯强度发生变化的特定细胞类型;
步骤六:将其中注释为所述特定细胞类型的细胞群提取出来,对治疗前后的细胞进行差异表达基因分析,获得影响免疫治疗响应的关键基因;
步骤七:基于影响免疫治疗响应的关键基因,对全转录组测序数据分类,观察与治疗响应相关的基因能否将癌症患者划分为预后不同的分组;
步骤八:对基于单细胞转录组测序数据集获得的影响免疫治疗响应的关键基因进行单因素Cox回归分析,筛选与预后相关的关键基因;
步骤九:基于全转录组测序数据集建立训练集和验证集,对免疫治疗响应关键基因进行LASSO回归分析和多因素Cox回归分析,筛选与预后相关的关键基因,构建预后风险模型。
进一步地,所述步骤一,具体包括:
从cBioPortal、ENA和TCGA数据库获得三阴性乳腺癌患者肿瘤组织全转录组测序数据集,包括METABRIC、FUSCC和TCGA-BRCA队列;从BioKey和GEO数据库中获得三阴性乳腺癌免疫治疗单细胞测序数据集,包括BioKey数据集和GSE169246数据集;
纳入的数据集需满足以下条件:使用人类肿瘤组织样本;每个数据集至少包含预设个数的样本;纳入研究的单细胞转录组测序数据集样本为具有接受免疫治疗前后配对的肿瘤组织的患者样本。
进一步地,所述步骤一,具体包括:
在BioKey数据集中选择数例三阴性乳腺癌患者,每例患者均包含治疗期间和治疗前配对的肿瘤组织测序数据,以及T细胞克隆扩增与否的信息;在GSE169246数据集中选择数例接受抗PD-L1治疗联合化疗的三阴性乳腺癌患者,以及数例接受紫杉醇单药治疗的三阴性乳腺癌患者,每例患者均包含治疗前和治疗后配对的测序数据,纳入样品的组织类型为肿瘤组织的原发灶或转移灶;
对METABRIC和FUSCC队列中的三阴性乳腺癌患者进行筛选,保留同时具有基因表达谱数据和完整生存信息,且生存时间 ≥ 15天的患者。
进一步地,所述步骤二,具体包括:
质量控制标准如下:每个基因有100个以上的细胞表达;每个细胞表达500-6000个基因;线粒体RNA含量小于10%;红细胞RNA含量小于1%。
进一步地,所述步骤三,具体包括:
使用R软件中的“Seurat”包对预处理后的单细胞数据进行标准化和归一化,通过RPCA整合并进行降维聚类,降维时所采用的PC数为30,聚类时所采用的分辨率为0.8,然后对不同细胞群进行差异表达基因分析,获得不同细胞群的差异表达基因,差异表达基因的|log2FC|>0.5且adj.P<0.05。
进一步地,所述步骤四,具体包括:
使用R软件中的“SingleR”包或通过文献检索获得不同细胞类型的标志基因,根据标志基因在不同细胞群中的分布情况对不同细胞群进行细胞类型注释,将细胞群中表达最高的标志基因所对应的细胞类型注释为细胞群的细胞类型;
不同细胞类型的标志基因具体如下:T淋巴细胞:CD3D, CD3E, CD3G, CD2;CD4+T细胞:CD4, CD40LG, IL7R;CD8+T细胞:CD8A, CD8B, GZMK);自然杀伤细胞:GNLY, KLRD1,NKG7;增殖型T细胞:MKI67, TOP2A;髓系细胞:LYZ, CD68, CD14, FCGR3A;B淋巴细胞:CD79A, MS4A1, CD19, CD79B;浆细胞:JCHAIN, MZB1, CD38;浆细胞样树突状细胞:LILRA4, IL3RA, CLEC4C, TCL1A;肥大细胞:CPA3, TPSAB1, TPSB2;上皮细胞:EPCAM,KRT19, KRT7, CD24;成纤维细胞:COL1A1, DCN, COL3A1, COL1A2, PDGFRB;内皮细胞:PECAM1, CD34, VWF, ENG。
进一步地,所述步骤五,具体包括:
使用R软件中的“CellChat”包内置的数据库CellChatDB 进行受体配体数据比对,构建细胞通讯网络,筛选得到的患者治疗前后细胞通讯强度发生变化的特定细胞类型为CD8+T细胞,将其中注释为CD8+T细胞的细胞群提取出来。
进一步地,所述步骤六,具体包括:
在BioKey队列中,对治疗期间有无克隆扩增患者的CD8+T细胞进行差异表达分析,对克隆扩增患者治疗期间与治疗前的CD8+T细胞进行差异表达分析,分别获得差异基因;
在GSE169246队列中,对治疗后临床疗效为部分缓解与疾病稳定患者间的CD8+T细胞进行差异表达分析,对临床疗效为部分缓解的患者治疗后和治疗前的CD8+T细胞进行差异表达分析,分别获得差异基因;
分析方法为:提取所有患者中的CD8+T细胞,调用Seurat中的“FindAllMarkers”函数,利用Wilcoxon秩和检验得到不同分组的差异基因,设定阈值为|log2FC|>0.3,校正后P<0.05且基因至少在任一分组中大于50%的细胞中有表达,对所有差异基因进行整合,最终获得与CD8+T细胞和治疗响应相关的关键基因。
进一步地,所述步骤七,具体包括:
使用R软件中的“ConsensuClusterPlus”包对全转录组测序数据分类,观察与治疗响应相关的基因能否将癌症患者划分为预后不同的分组。
进一步地,所述步骤八,具体包括:
以METABRIC数据集作为训练集,FUSCC数据集作为验证集,使用R软件中的“survival”包、“survminer”包、“rms”包和“timeROC”包对影响治疗响应的关键基因进行Lasso回归分析和多因素Cox回归分析,筛选与预后相关的影响治疗响应的基因,构建预后风险模型,最终构建出一个包括8个三阴性乳腺癌免疫治疗响应基因预后风险模型,基因具体如下:FUS、NEU1、PLP2、ID2、PTGER4、GBP5、PRF1、CXCR6。
本发明具有如下优点:
本发明提出的一种癌症复发风险预测模型构建方法及系统,通过整合单细胞和全转录组测序数据集识别影响免疫治疗响应的与预后相关的基因,并构建预后风险模型,有利于不同肿瘤诊断生物标志物的应用手册制定与靶向药物的设计,为肿瘤的临床诊断与治疗提供新的思路。
附图说明
为了更清楚地说明本发明的实施方式或现有技术中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是示例性的,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图引伸获得其它的实施附图。
图1为本发明实施例1提供的一种癌症复发风险预测模型构建方法的流程示意图。
具体实施方式
以下由特定的具体实施例说明本发明的实施方式,熟悉此技术的人士可由本说明书所揭露的内容轻易地了解本发明的其他优点及功效,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了提供一种癌症复发风险预测模型构建方法,本发明实施例通过选择肿瘤患者群体作为研究对象,应用生物信息学方法,挖掘单细胞转录组测序和全转录组测序数据并对二者进行联合分析获得影响癌症免疫治疗敏感性的基因,构建预后风险模型,有利于不同肿瘤诊断生物标志物的应用手册制定与靶向药物的设计,为肿瘤的临床诊断与治疗提供新的思路。
本发明实施例提出的一种基于单细胞和全转录组测序数据的三阴性乳腺癌免疫治疗响应相关基因预后风险模型构建方法,如图1所示,具体包括:
从公共数据库获得2个三阴性乳腺癌免疫治疗单细胞测序数据集,包括BioKey数据集和GSE169246数据集。从cBioPortal、ENA和TCGA数据库获得三阴性乳腺癌患者肿瘤组织全转录组测序数据集,包括METABRIC、FUSCC和TCGA-BRCA队列。在单细胞转录组测序数据集BioKey中选择18例三阴性乳腺癌患者,每例患者均包含治疗期间和治疗前配对的肿瘤组织测序数据,以及T细胞克隆扩增与否的信息。在单细胞转录组测序数据集GSE169246中选择6例接受抗PD-L1治疗联合化疗的三阴性乳腺癌患者,以及6例接受紫杉醇单药治疗的三阴性乳腺癌患者,每例患者均包含治疗前和治疗后配对的测序数据,纳入样品的组织类型为肿瘤组织的原发灶或转移灶。对METABRIC和FUSCC队列中的三阴性乳腺癌患者进行筛选,保留同时具有基因表达谱数据和完整生存信息,且生存时间≥ 15天的患者,保留METABRIC队列中298例、FUSCC队列中358例三阴性乳腺癌患者纳入本研究,全部为女性原发癌患者。
对单细胞转录组测序数据集进行质量控制,选择符合标准的细胞用于后续研究,质量控制标准如下:1)每个基因有100个以上的细胞表达;2)每个细胞表达500-6000个基因;3)线粒体RNA含量小于10%;4)红细胞RNA含量小于1%。BioKey数据集中用于后续研究的细胞共90747个,GSE169246数据集中用于后续研究的细胞共118339个。
使用R软件中的“Seurat”包对预处理后的单细胞数据进行标准化和归一化,通过RPCA整合并进行降维聚类,降维时所采用的PC数为30,聚类时所采用的分辨率为0.8,BioKey数据集共降维聚类得到32个细胞cluster,GSE169246数据集共降维聚类得到24个细胞cluster。对不同细胞cluster进行差异表达基因分析,获得不同细胞cluster的差异表达基因,差异表达基因的|log2FC|>0.25且adj.P<0.05。通过文献检索获得不同细胞类型的marker基因,根据marker基因在不同细胞cluster中的分布情况对不同细胞cluster进行细胞类型注释,不同细胞类型的marker基因具体如下:1)T淋巴细胞:CD3D,CD3E,CD3G,CD2;2)CD4+T细胞:CD4,CD40LG,IL7R;3)CD8+T细胞:CD8A,CD8B,GZMK);4)自然杀伤细胞:GNLY,KLRD1,NKG7;5)增殖型T细胞:MKI67,TOP2A;6)髓系细胞:LYZ,CD68,CD14,FCGR3A;7)B淋巴细胞:CD79A,MS4A1,CD19,CD79B;8)浆细胞:JCHAIN,MZB1,CD38;9)浆细胞样树突状细胞:LILRA4,IL3RA,CLEC4C,TCL1A;10)肥大细胞:CPA3,TPSAB1,TPSB2;11)上皮细胞:EPCAM,KRT19,KRT7,CD24;12)成纤维细胞:COL1A1,DCN,COL3A1,COL1A2,PDGFRB;13)内皮细胞:PECAM1,CD34,VWF,ENG
BioKey数据集中的90747个细胞共鉴定得到12种细胞类型,GSE169246数据集中的118339个CD45+的免疫细胞共鉴定得到9种细胞类型。
在GSE169246数据集中,对治疗后和治疗前患者的细胞类型进行配对比较,疗效为部分缓解(PR)的患者CD8+T细胞在治疗后显著增加。在BioKey数据集中,接受免疫治疗期间,在T细胞克隆扩增的患者中多种免疫细胞的比例显著升高,特别是CD8+T细胞。综合两个数据集的结果,表明了CD8+T细胞对治疗响应的重要作用。
在BioKey队列中,对治疗期间有无克隆扩增患者的CD8+T细胞进行差异表达分析,对克隆扩增患者治疗期间与治疗前的CD8+T细胞进行差异表达分析,分别获得差异基因。在GSE169246队列中,对治疗后临床疗效为部分缓解与疾病稳定患者间的CD8+T细胞进行差异表达分析,对临床疗效为部分缓解的患者治疗后和治疗前的CD8+T细胞进行差异表达分析,分别获得差异基因。分析方法为:提取所有患者中的CD8+T细胞,调用Seurat中的“FindAllMarkers”函数,利用Wilcoxon秩和检验得到不同分组的差异基因,设定阈值为|log2FC|>0.3,校正后P<0.05且基因至少在任一分组中大于50%的细胞中有表达。对所有差异基因进行整合,最终获得与CD8+T细胞和治疗响应相关的关键基因。
基于影响免疫治疗响应的关键基因,使用R软件中的“ConsensuClusterPlus”包对全转录组测序数据分类,根据与治疗响应相关的基因将癌症患者划分为预后不同的分组。
以METABRIC数据集作为训练集,FUSCC数据集作为验证集,使用R软件中的“survival”包、“survminer”包、“rms”包和“timeROC”包对影响治疗响应的基因进行单因素Cox回归分析、Lasso回归分析和多因素Cox回归分析,筛选与预后相关的影响治疗响应的基因,构建预后风险模型,最终构建出一个包括8个三阴性乳腺癌免疫治疗响应基因预后风险模型,基因具体如下:FUS、NEU1、PLP2、ID2、PTGER4、GBP5、PRF1、CXCR6,所构建的预后风险模型在训练集与验证集的预测能力评价标准ROC均大于0.5,模型性能良好。
虽然,上文中已经用一般性说明及具体实施例对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。

Claims (3)

1.一种癌症复发风险预测模型构建方法,其特征在于,所述方法包括:
步骤一:从多个数据库中获得癌症患者的肿瘤组织的全转录组测序数据,以及患者接受免疫治疗前后配对的肿瘤组织单细胞转录组测序数据;所述步骤一,具体包括:
从cBioPortal、ENA和TCGA数据库获得三阴性乳腺癌患者肿瘤组织全转录组测序数据集,包括METABRIC、FUSCC和TCGA-BRCA队列;从BioKey和GEO数据库中获得三阴性乳腺癌免疫治疗单细胞测序数据集,包括BioKey数据集和GSE169246数据集;
纳入的数据集需满足以下条件:使用人类肿瘤组织样本;每个数据集至少包含预设个数的样本;纳入研究的单细胞转录组测序数据集样本为具有接受免疫治疗前后配对的肿瘤组织的患者样本;
所述步骤一,具体包括:
在BioKey数据集中选择数例三阴性乳腺癌患者,每例患者均包含治疗期间和治疗前配对的肿瘤组织测序数据,以及T细胞克隆扩增与否的信息;在GSE169246数据集中选择数例接受抗PD-L1治疗联合化疗的三阴性乳腺癌患者,以及数例接受紫杉醇单药治疗的三阴性乳腺癌患者,每例患者均包含治疗前和治疗后配对的测序数据,纳入样品的组织类型为肿瘤组织的原发灶或转移灶;
对METABRIC和FUSCC队列中的三阴性乳腺癌患者进行筛选,保留同时具有基因表达谱数据和完整生存信息,且生存时间 ≥ 15天的患者;
步骤二:对单细胞转录组测序数据集进行质量控制,符合标准的细胞并获取其测序数据;
步骤三:对预处理后的单细胞数据进行标准化和归一化,通过RPCA整合并进行降维聚类得到不同细胞群,对不同细胞群进行差异表达基因分析,获得不同细胞群的差异表达基因;
步骤四:获取不同细胞类型的标志基因,根据标志基因在不同细胞群中的分布情况对不同细胞群进行细胞类型注释;
所述步骤四,具体包括:
使用R软件中的“SingleR”包或通过文献检索获得不同细胞类型的标志基因,根据标志基因在不同细胞群中的分布情况对不同细胞群进行细胞类型注释,将细胞群中表达最高的标志基因所对应的细胞类型注释为细胞群的细胞类型;
不同细胞类型的标志基因具体如下:T淋巴细胞:CD3D, CD3E, CD3G, CD2;CD4+ T细胞:CD4, CD40LG, IL7R;CD8+ T细胞:CD8A, CD8B, GZMK;自然杀伤细胞:GNLY, KLRD1, NKG7;增殖型T细胞:MKI67, TOP2A;髓系细胞:LYZ, CD68, CD14, FCGR3A;B淋巴细胞:CD79A,MS4A1, CD19, CD79B;浆细胞:JCHAIN, MZB1, CD38;浆细胞样树突状细胞:LILRA4,IL3RA, CLEC4C, TCL1A;肥大细胞:CPA3, TPSAB1, TPSB2;上皮细胞:EPCAM, KRT19,KRT7, CD24;成纤维细胞:COL1A1, DCN, COL3A1, COL1A2, PDGFRB;内皮细胞:PECAM1,CD34, VWF, ENG;
步骤五:对细胞类型注释后的单细胞数据进行受体配体数据比对,构建细胞通讯网络,筛选患者免疫治疗前后细胞通讯强度发生变化的特定细胞类型;
所述步骤五,具体包括:
使用R软件中的“CellChat”包内置的数据库CellChatDB 进行受体配体数据比对,构建细胞通讯网络,筛选得到的患者治疗前后细胞通讯强度发生变化的特定细胞类型为CD8+ T细胞,将其中注释为CD8+ T细胞的细胞群提取出来;
步骤六:将其中注释为所述特定细胞类型的细胞群提取出来,对治疗前后的细胞进行差异表达基因分析,获得影响免疫治疗响应的关键基因;
所述步骤六,具体包括:
在BioKey队列中,对治疗期间有无克隆扩增患者的CD8+ T细胞进行差异表达分析,对克隆扩增患者治疗期间与治疗前的CD8+ T细胞进行差异表达分析,分别获得差异基因;
在GSE169246队列中,对治疗后临床疗效为部分缓解与疾病稳定患者间的CD8+ T细胞进行差异表达分析,对临床疗效为部分缓解的患者治疗后和治疗前的CD8+ T细胞进行差异表达分析,分别获得差异基因;
分析方法为:提取所有患者中的CD8+ T细胞,调用Seurat中的“FindAllMarkers”函数,利用Wilcoxon秩和检验得到不同分组的差异基因,设定阈值为|log2FC| > 0.3,校正后P <0.05且基因至少在任一分组中大于50%的细胞中有表达,对所有差异基因进行整合,最终获得与CD8+ T细胞和治疗响应相关的关键基因;
步骤七:基于影响免疫治疗响应的关键基因,对全转录组测序数据分类,观察与治疗响应相关的基因能否将癌症患者划分为预后不同的分组;
所述步骤七,具体包括:
使用R软件中的“ConsensuClusterPlus”包对全转录组测序数据分类,观察与治疗响应相关的基因能否将癌症患者划分为预后不同的分组;
步骤八:对基于单细胞转录组测序数据集获得的影响免疫治疗响应的关键基因进行单因素Cox回归分析,筛选与预后相关的关键基因;
步骤九:基于全转录组测序数据集建立训练集和验证集,对免疫治疗响应关键基因进行LASSO回归分析和多因素Cox回归分析,筛选与预后相关的关键基因,构建预后风险模型;
所述步骤九,具体包括:
以METABRIC数据集作为训练集,FUSCC数据集作为验证集,使用R软件中的“survival”包、“survminer”包、“rms”包和“timeROC”包对影响治疗响应的关键基因进行Lasso回归分析和多因素Cox回归分析,筛选与预后相关的影响治疗响应的基因,构建预后风险模型,最终构建出一个包括8个三阴性乳腺癌免疫治疗响应基因预后风险模型,基因具体如下:FUS、NEU1、PLP2、ID2、PTGER4、GBP5、PRF1、CXCR6。
2.根据权利要求1所述的一种癌症复发风险预测模型构建方法,其特征在于,所述步骤二,具体包括:
质量控制标准如下:每个基因有100个以上的细胞表达;每个细胞表达500-6000个基因;线粒体RNA含量小于10%;红细胞RNA含量小于1%。
3.根据权利要求1所述的一种癌症复发风险预测模型构建方法,其特征在于,所述步骤三,具体包括:
使用R软件中的“Seurat”包对预处理后的单细胞数据进行标准化和归一化,通过RPCA整合并进行降维聚类,降维时所采用的PC数为30,聚类时所采用的分辨率为0.8,然后对不同细胞群进行差异表达基因分析,获得不同细胞群的差异表达基因,差异表达基因的|log2FC| > 0.5且adj.P< 0.05。
CN202310055764.XA 2023-01-18 2023-01-18 一种癌症复发风险预测模型构建方法 Active CN115798723B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310055764.XA CN115798723B (zh) 2023-01-18 2023-01-18 一种癌症复发风险预测模型构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310055764.XA CN115798723B (zh) 2023-01-18 2023-01-18 一种癌症复发风险预测模型构建方法

Publications (2)

Publication Number Publication Date
CN115798723A CN115798723A (zh) 2023-03-14
CN115798723B true CN115798723B (zh) 2023-09-15

Family

ID=85429722

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310055764.XA Active CN115798723B (zh) 2023-01-18 2023-01-18 一种癌症复发风险预测模型构建方法

Country Status (1)

Country Link
CN (1) CN115798723B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116259360B (zh) * 2023-03-16 2024-02-09 中国人民解放军空军军医大学 肺腺癌中高增殖肿瘤亚群的鉴别及特征基因集与应用
CN116469473B (zh) * 2023-06-15 2023-09-22 北京智因东方转化医学研究中心有限公司 T细胞亚型鉴定的模型训练方法、装置、设备及存储介质
CN116825206B (zh) * 2023-08-30 2023-11-03 四川大学华西医院 探究fh-缺陷型肾癌关键细胞亚群的方法、装置和设备
CN117437974A (zh) * 2023-09-25 2024-01-23 北京大学 一种预测肿瘤细胞转移风险的方法及系统
CN117409855B (zh) * 2023-10-25 2024-04-26 苏州卫生职业技术学院 一种肝细胞癌患者错配修复相关预后模型及其构建、验证方法和应用

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200038660A (ko) * 2018-10-04 2020-04-14 사회복지법인 삼성생명공익재단 바이오마커의 선별 방법 및 이를 이용한 암의 진단을 위한 정보제공방법
CN113930506A (zh) * 2021-09-23 2022-01-14 江苏大学附属医院 一种预测肝细胞癌预后和治疗抵抗的谷氨酰胺代谢基因标签评分系统
CN115410713A (zh) * 2022-08-31 2022-11-29 广西壮族自治区肿瘤防治研究所 一种基于免疫相关基因的肝细胞癌预后风险预测模型构建
CN115424728A (zh) * 2022-11-02 2022-12-02 北京泽桥医疗科技股份有限公司 一种肿瘤恶性细胞基因预后风险模型构建方法
CN115478092A (zh) * 2022-09-05 2022-12-16 中南大学湘雅二医院 用于预测乳腺癌免疫治疗效果的模型

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB201810190D0 (en) * 2018-06-21 2018-08-08 Cancer Research Tech Ltd Prognostic and treatment response predictive method

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200038660A (ko) * 2018-10-04 2020-04-14 사회복지법인 삼성생명공익재단 바이오마커의 선별 방법 및 이를 이용한 암의 진단을 위한 정보제공방법
CN113930506A (zh) * 2021-09-23 2022-01-14 江苏大学附属医院 一种预测肝细胞癌预后和治疗抵抗的谷氨酰胺代谢基因标签评分系统
CN115410713A (zh) * 2022-08-31 2022-11-29 广西壮族自治区肿瘤防治研究所 一种基于免疫相关基因的肝细胞癌预后风险预测模型构建
CN115478092A (zh) * 2022-09-05 2022-12-16 中南大学湘雅二医院 用于预测乳腺癌免疫治疗效果的模型
CN115424728A (zh) * 2022-11-02 2022-12-02 北京泽桥医疗科技股份有限公司 一种肿瘤恶性细胞基因预后风险模型构建方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Single-Cell and Bulk RNA Sequencing Reveal Malignant Epithelial Cell Heterogeneity and Prognosis Signatures in Gastric Carcinoma;Zhihong Huang 等;《cells》;第1-19页 *
Xinkui Liu 等.Single-cell RNA-sequencing uncovers compound kushen injection synergistically improves the efficacy of chemptherapy by modulating the tumor environment of breast cancer.《Front Immunol》.2022,第1-28页. *
余鹏 等.基于癌症基因组图谱构建膀胱癌免疫基因预后评估模型.《解放军医学院学报》.2020,第41卷(第5期),第502-512页. *

Also Published As

Publication number Publication date
CN115798723A (zh) 2023-03-14

Similar Documents

Publication Publication Date Title
CN115798723B (zh) 一种癌症复发风险预测模型构建方法
Szabo et al. Single-cell transcriptomics of human T cells reveals tissue and activation signatures in health and disease
Mo et al. Stromal gene expression is predictive for metastatic primary prostate cancer
Chifman et al. Conservation of immune gene signatures in solid tumors and prognostic implications
Ruf et al. Tumor-associated macrophages trigger MAIT cell dysfunction at the HCC invasive margin
Salmén et al. Multidimensional transcriptomics provides detailed information about immune cell distribution and identity in HER2+ breast tumors
KR20220110751A (ko) 개인 맞춤형 암 요법을 위한 종양 생태계 디콘볼루션 시스템 및 방법
CN109929934B (zh) 免疫相关基因在结直肠癌预后的试剂盒和系统中的应用
Ebrahimi et al. The potential application of organoids in breast cancer research and treatment
Zeng et al. Exosomal miR-211-5p regulates glucose metabolism, pyroptosis, and immune microenvironment of melanoma through GNA15
Boufea et al. Single-cell RNA sequencing of human breast tumour-infiltrating immune cells reveals a γδ T-cell subtype associated with good clinical outcome
Miheecheva et al. Multiregional single-cell proteogenomic analysis of ccRCC reveals cytokine drivers of intratumor spatial heterogeneity
Ding et al. Single‐cell atlas reveals a distinct immune profile fostered by T cell‐B cell crosstalk in triple negative breast cancer
Garcia-Cortes et al. Loss of long-range co-expression is a common trait in cancer
Li et al. From cellular infiltration assessment to a functional gene set-based prognostic model for breast cancer
Ammons et al. Single-cell RNA sequencing reveals the cellular and molecular heterogeneity of treatment-naïve primary osteosarcoma in dogs
Loeffler-Wirth et al. Transcriptional states of CAR-T infusion relate to neurotoxicity–lessons from high-resolution single-cell SOM expression portraying
Yan et al. CD86 molecule might Be a novel immune-related prognostic biomarker for patients with bladder cancer by bioinformatics and experimental assays
Szabo et al. A single-cell reference map for human blood and tissue T cell activation reveals functional states in health and disease
Cursons et al. A natural killer cell gene signature predicts melanoma patient survival
Ren et al. Reconstruction of cell spatial organization based on ligand-receptor mediated self-assembly
Zhao et al. A cellular and spatial atlas of TP53-associated tissue remodeling in lung adenocarcinoma
Shembrey et al. A new highly-specific Natural Killer cell-specific gene signature predicting recurrence in colorectal cancer patients
Li et al. Predicting the Prognosis and Immunotherapeutic Response of Triple-Negative Breast Cancer by Constructing a Prognostic Model Based on CD8+ T Cell-Related Immune Genes
Jun et al. PhylEx: Accurate reconstruction of clonal structure via integrated analysis of bulk DNA-seq and single cell RNA-seq data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant