CN113192560A - 一种基于铁死亡进程的肝细胞癌分型体系的构建方法 - Google Patents

一种基于铁死亡进程的肝细胞癌分型体系的构建方法 Download PDF

Info

Publication number
CN113192560A
CN113192560A CN202110231772.6A CN202110231772A CN113192560A CN 113192560 A CN113192560 A CN 113192560A CN 202110231772 A CN202110231772 A CN 202110231772A CN 113192560 A CN113192560 A CN 113192560A
Authority
CN
China
Prior art keywords
subtypes
expression
frgs
frrs
cells
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110231772.6A
Other languages
English (en)
Inventor
孙玉岭
王立博
刘灶渠
朱荣涛
王维杰
梁若鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
First Affiliated Hospital of Zhengzhou University
Original Assignee
First Affiliated Hospital of Zhengzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by First Affiliated Hospital of Zhengzhou University filed Critical First Affiliated Hospital of Zhengzhou University
Priority to CN202110231772.6A priority Critical patent/CN113192560A/zh
Publication of CN113192560A publication Critical patent/CN113192560A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Zoology (AREA)
  • Immunology (AREA)
  • Pure & Applied Mathematics (AREA)
  • Wood Science & Technology (AREA)
  • Mathematical Physics (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Genetics & Genomics (AREA)
  • Pathology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Evolutionary Computation (AREA)
  • Public Health (AREA)
  • Hospice & Palliative Care (AREA)
  • Epidemiology (AREA)
  • Oncology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioethics (AREA)

Abstract

本发明公开了一种基于铁死亡进程的肝细胞癌分型体系的构建方法,包括如下步骤:步骤一、探索FRGs在HCC中的表达情况:首先分别纳入来自于GEO,TCGA和ICGC数据库的32个数据集共3933个肝细胞癌样本。本发明通过探索FRGs在HCC中的表达情况、异质性铁死亡亚型的识别和验证、两亚型的临床状态、评估FRRS在预测预后和免疫治疗疗效上的表现以及HCCS程序包的开发的步骤配合,共纳入了32个数据集的3933个肝癌样本进行分析,分为低铁死亡亚型和高铁死亡亚型,并显示出了特异的功能特征和临床结局,此外,基于铁死亡分型,还提出了一个铁死亡相关风险评分(FRRS),FRRS在预测预后和免疫治疗来疗效中都展示了较好的效果,可为铁死亡在肝癌中的研究奠定了基础。

Description

一种基于铁死亡进程的肝细胞癌分型体系的构建方法
技术领域
本发明涉及原发性肝癌技术领域,具体为一种基于铁死亡进程的肝细胞癌分型体系的构建方法。
背景技术
原发性肝癌(primary liver cancer)是世界上第五常见的恶性肿瘤,在肿瘤相关死亡的原因中位列第四,每年约有84万的新发病例,其中,肝细胞癌(hepatocellularcarcinoma,HCC)是其重要是组织学类型(占其75%-85%),具有高侵袭性和高致死率的特点,早期肝癌多采取手术切除,但肝癌切除术后5年复发率仍高达70%,且大多数患者于术后2年内复发,不可切除的肝细胞癌(HCC)患者通常接受多激酶抑制剂索拉非尼或轮伐替尼,然而药物耐药及不良反应使得患者的生存获益受限,近年来,以免疫检查点抑制剂(ICIs) 为代表的免疫治疗取得了很大进展,然而HCC生物学行为的异质性导致仅有25%的患者产生持久的治疗反应,尽管其他治疗方式如消融治疗、经导管肝动脉化疗栓塞术(TACE)也取得了很大进展,但高的复发率使得HCC患者5年生存率仅有18%。
铁死亡是一种新发现的,以铁依赖性脂质过氧化和活性氧诱导的程序性细胞死亡为特征,区别于典型的细胞凋亡、自噬和程序性坏死等的新型细胞死亡方式,索拉菲尼既是晚期HCC的一线用药,也可通过抑制system Xc-进而导致GSH耗竭诱导铁死亡来治疗肝细胞癌,已有研究证实在索拉非尼诱导细胞死亡的过程中,治疗精神病的药物氟哌啶醇可以增强索拉非尼诱导的HCC的铁死亡,除铁代谢外,脂质代谢也在肝细胞癌的铁死亡中起重要作用,然后目前对 HCC铁死亡的研究大多还停留在细胞和动物水平,缺乏大样本、多组学的系统化深入研究。
因此亟需设计一种基于铁死亡进程的肝细胞癌分型体系的构建方法来解决上述问题。
发明内容
本发明的目的在于提供一种基于铁死亡进程的肝细胞癌分型体系的构建方法,以解决上述背景技术中提出的现有HCC铁死亡的研究大多还停留在细胞和动物水平,缺乏大样本、多组学的系统化深入研究的问题。
为实现上述目的,本发明提供如下技术方案:一种基于铁死亡进程的肝细胞癌分型体系的构建方法,包括如下步骤:
步骤一、探索FRGs在HCC中的表达情况:首先分别纳入来自于 GEO,TCGA和ICGC数据库的32个数据集共3933个肝细胞癌样本,且32个数据集分别为GSE102079,GSE107170,GSE109211, GSE112790,GSE116174,GSE121248,GSE14323,NCI,GSE16757, GSE19977,GSE20017,GSE25097,GSE36376,GSE36411, GSE39791,GSE43619,GSE45436,GSE46444,GSE50579, GSE54236,GSE57957,GSE62043,GSE62232,GSE63898, GSE64041,GSE76297,GSE76427,GSE84005,GSE87630,GSE9843, TCGA-LIHC和ICGC-LIRI-JP,其中NCI TCGA-LIHC和ICHC-LIRI-JP 具有完整的表达信息和临床预后信息;
然后再采用affy软件包中的rma函数对来自Affymetrix平台的原始数据进行标准化,来自其他平台的数据直接下载标准化过的矩阵文件,之后再使用SVA包中的combat算法进行批次矫正, TCGA-LIHC队列的RNA-seq数据从UCSC-Xena数据库获得,并进一步转化为log2(TPM+1),ICGC-LIRI-JP数据集的RNA-seq数据直接从ICGC数据门户网站获得,随后,再对训练集和验证集的表达数据均转化为z-scoring,相应的临床和样本信息从GEO,UCSC和ICGC 数据库中获得,对于TCGA-LIHC中的体细胞突变数据、拷贝数变异数据和DNA甲基化数据均从TCGA门户网站下载,此外,从Thorsson 等人的研究中计算或招募了肿瘤突变负荷、单核苷酸变异和插入缺失新抗原负荷、微卫星不稳定性、癌睾丸抗原评分和TCR/BCR多样性等进行后续研究;
步骤二、异质性铁死亡亚型的识别和验证:接着再将来自于30 个GEO发现队列的共3327个样本作为发现队列,并通过 ConsensusClusterPlus软件包进一步分为k组(k=2~9),根据共识得分的CDF曲线,我们发现k=2是最优选择,之后,再应用 PAC和NbClust两种方法进行验证并得到了相同的结果,基于74个 FRGs的表达,这两个亚型的样本在二维主成分图上显著分离,为了确保GEO发现队列聚类结果的可靠性和稳定性,进一步在TCGA和ICGC 两个验证队列进行了IGP分析,结果显示,TCGA队列中C1的IGP值为90.3%,C2的IGP值为92.9%,而ICGC队列中C1的IGP值为88.4%和91.7%(所有p<0.001),与此一致的是NbClust也表明,在两个队列中分为两个亚型是最理想的,因此,根据聚类结果,最终将肝细胞癌样本分为C1和C2两种亚型;
过程中发现多数FRGs在C2明显上调,而C1则相反,从而铁死亡可以诱导肿瘤特异性免疫反应,增强免疫治疗的效果,进一步的相关性分析也提示HCC中74个FRGs的表达和TME细胞的浸润丰度之间存在强烈的相关性,进一步探索了TME细胞在两种亚型的浸润差异,结果显示C1的总体浸润水平较高,除了丰富的免疫激活细胞, C1还显示出更高丰度的免疫抑制细胞;
为进一步明确两种亚型的生物学特征,分别利用Hallmark和 KEGG基因集进行GSVA富集分析,C1明显富集在炎症相关通路中,如同种异体移植排斥反应、炎症反应和T细胞受体信号通路;而C2 主要与代谢相关通路密切相关,包括氧化磷酸化、脂肪酸代谢、胆汁酸代谢和氨基酸代谢,之后从TCGA和ICGC两个验证队列也获得了相似的结果,综合以上结果,我们定义两种分子亚型如下:1)高免疫低代谢型(C1):低水平的FRGs表达和炎症相关通路的富集以及高丰度的免疫细胞浸润;2)高代谢低免疫型(C2):高水平的FRGs 表达和代谢相关通路富集以及低丰度的免疫细胞浸润;
步骤三、两亚型的临床状态:然后再用Kaplan-Meier对两亚型样本进行生存分析,结果显示C2的OS和RFS优于C1,研究表明,案例可以通过抑制Xc-系统诱导铁死亡,使用pRRophetic软件包预测了两种亚型对索拉非尼的敏感性,结果提示C2更有可能从索拉非尼的治疗中获益,此外,之前的分析显示C1具有较丰富的免疫细胞浸润,免疫检查点分子(如PD-L1和CTLA-4)也在C1中过度表达,结果均表明C1可能对免疫治疗更敏感,因此,再进一步评估了免疫治疗对两种亚型的有效性,使用TIDE网页工具,C1的反应高于C2,在TCGA和ICGC两个验证队列中也获得了相似的结果,同时还利用 GenePattern平台的Submap算法来评估两种亚型和47例接受全面免疫治疗的患者的表达谱的相似性,结果表明C1与抗PD-1治疗有效的患者显著相关,之后我们在两个验证队列中也获得了相似的结果,此外,我们还观察到C1亚型患者与年龄小于65岁、女性、较晚的AJCC 分期、较高的肿瘤分级以及血管侵犯显著相关,两种亚型之间的BMI 没有显著差异;
步骤四、评估FRRS在预测预后和免疫治疗疗效上的表现:在 DEGs、SMGs、CAGs和ESGs四个不同来源的显著基因中,再挑选至少 2/4来源的33个基因进行进一步研究,单因素COX回归分析表明,6 个基因具有显著的预后意义(p<0.05),接下来,再纳入了这6 个基因(p<0.05)进行多因素COX回归分析,采用逐步回归替代法,基于最小的AIC值,确定最佳模型:FRRS=0.348*Expression (SLC16A3)-0.151*Expression(CPS1),生存分析显示高FRRS患者的预后更差,一致性指数分析也证实,FRRS在TCGA、ICGC和NCI 的三个独立队列中具有较高的准确性,结合临床因素,我们通过多因素Cox回归分析观察到FRRS是HCC的独立预后因素;
探索与免疫治疗反应有关的FRRS的生物学特征后,发现FRRS 与HAVCR2、CTLA4和PDCD1等ICP分子的表达,以及Treg细胞和MDSC 的浸润模式呈显著正相关,因此,再纳入了3个免疫治疗队列,以进一步研究FRRS是否可以预测患者对免疫治疗的反应性,与上述一致,高FRRS患者在这三个队列中均显示出了不利的生存期,此外,临床上对免疫治疗起反应的患者也展现出更低的FRRS,表明FRRS 较低的患者更有可能从免疫治疗中获益,采用ROC曲线的曲线下面积(AUC)评估FRRS预测免疫治疗反应的准确性,这些结果强烈提示FRRS是一个可靠的生物标志物,然后,再计算7种广泛使用的免疫治疗生物标志物,包括TMB、TIDE、MSI评分、Merck18、IFGN、 CD8和CD274,在所有三个队列中,FRRS在预测免疫治疗方面提供了更高的准确性,值得注意的是,虽然在FRRS在GSE78220队列中的预测能力比TIDE略低,但TIDE在预测IMvigor210队列和GSE100797 队列对免疫治疗的反应方面表现更差,综上,研究强有力地证实了 FRRS可用来评估肿瘤的免疫治疗反应和预测患者的预后,并且优于当前广泛使用的生物标记物;
步骤五、HCCS程序包的开发:基于质心法和皮尔森关联性分析,开发了名为HCCS的R程序包,HCCS中的ferroptosis_phenotype 可以将数据中的HCC样本划分到对应的铁死亡亚型C1或C2,并计算每个样本的FRRS,进一步可以预测患者的预后和评估患者的免疫治疗疗效,从而更好地服务于临床。
优选的,所述在步骤一探索FRGs在HCC中的表达情况时,基于铁死亡相关基因的HCC亚型的构建的过程中,共找到74个铁死亡相关基因,利用Consensus Cluster Plus软件包对GEO发现队列进行基于FRGs表达的共识聚类,且聚类方法采用基于欧氏距离的Kmeans算法,过程中进行1000次迭代,每次迭代取80%的样本,聚类数量设定为2~9个,通过共识评分的累积分布函数(CDF)和模糊聚类比例(PAC)确定最佳聚类数,之后应用NbClust包进一步验证最佳聚类数,最后再采用主成分分析在二维空间中区分不同亚型的信息。
优选的,所述在步骤一探索FRGs在HCC中的表达情况时,铁死亡相关亚型的验证过程中,使用clusterRepro软件包中的 in-group proportion(IGP)方法对TCGA和ICGC验证队列中的数据进行分析,IGP被定义为某一亚型样本的最近的邻居也被分配到同一亚型中的比例,为了测量IGP,首先计算了GEO发现队列中每种亚型的质心,再将TCGA和ICGC验证队列中的每份样本分配至质心和样本之间Pearson相关系数最高的特定亚型,用P值,即零分布IGP 比实际聚类IGP多出的部分,来评估聚类质量,如果两个队列之间的聚类足够相似,则IGP接近100%,反之接近0%,clusterRepro 包中的排列设置为2000。
优选的,所述在步骤一探索FRGs在HCC中的表达情况时,功能分析和免疫浸润评估过程中,对两种亚型的HCC样本进行了基因集变异分析(GSVA),从Molecular SignaturesDatabase下载了 Hallmark和KEGG基因集,并使用GSVA软件包进一步将基因表达矩阵转化为基因集矩阵,之后再使用limma软件包对C1和C2两种亚型进行基因集差异分析,筛选阈值设定为|logFC|>0.2,校正过的 P值<0.05,校正过的P值从Benjamini–Hochberg多重检验获得,且获得了23种免疫细胞的标记物,包括:固有免疫细胞(活化的树突状细胞,CD56+自然杀伤细胞,CD56-自然杀伤细胞,嗜酸性粒细胞,未成熟的树突状细胞,巨噬细胞,肥大细胞,MDSC,单核细胞,自然杀伤细胞,中性粒细胞,和浆细胞样树突状细胞)和适应性免疫细胞(活化B细胞、活化CD4+ T细胞、活化CD8+ T细胞、γδT 细胞、未成熟B细胞、自然杀伤T细胞、Treg细胞、滤泡辅助性T 细胞、Th1细胞、Th2细胞和Th17细胞),此外,内皮细胞和成纤维细胞也是TME的重要组成部分,在肿瘤炎症、血管生成、侵袭和转移中起着至关重要的作用,基于这些标记,应用单样本基因集富集分析(ssGSEA)算法评价25个TME细胞的浸润丰度。
优选的,所述在步骤一探索FRGs在HCC中的表达情况时,分型的临床特征、预后情况以及临床治疗反应预测过程中,比较两种亚型在年龄、性别、BMI、AJCC分期、分级和血管浸润方面的差异,并通过Kaplan-Meier生存分析估计了无复发生存期和总生存期,之后,应用pRRophetic软件包预测GEO发现队列和TCGA、ICGC验证队列对索拉菲尼的敏感性,通过岭回归估算样本的半数抑制浓度(IC50), IC50越小说明亚型对索拉菲尼的治疗越敏感,此外,还利用了TIDE 网页工具预测两种亚型对免疫治疗的敏感性,Submap算法被用来评价两种亚型和免疫治疗敏感/不敏感人群之间基因表达模式的相似度。
优选的,所述在步骤一探索FRGs在HCC中的表达情况时,两种亚型的基因组变异景观分析过程中,利用MutSigCV 1.41软件鉴定了两种亚型中的显著突变基因(SMGs),保留q值<0.05的基因进一步分析,MutationalPatterns软件包被用来提取各亚型的突变特征,非负矩阵分解(NMF)被用来确定突变特征的最佳数量,最终提示3个最佳,然后,再计算提取的突变特征与COSMIC数据库中已有的30个突变特征之间的余弦相似度,并以最相似的COSMIC特征对提取的特征进行命名,GenePattern中的GISTIC 2.0软件被用来识别显著扩增或缺失的体细胞拷贝数变异情况,再由以下程序来鉴定表观遗传学沉默基因(ESGs):(1)排除正常组织中甲基化的CpG 位点(平均β值>0.2);(2)以截断值(β值=0.3)为界将数据分为甲基化组和未甲基化组,并进一步去除甲基化组中甲基化频率少于10%肿瘤样本的探针;(3)对于每个探针,如果非甲基化组与甲基化组中对应基因的平均表达差值>1.64个未甲基化组的标准差,该探针将被标记为表观遗传学沉默;(4)当多个探针被分配到同一基因时,具有一半以上的相应探针的基因被标记为表观遗传沉默,则该基因被识别为ESG。
优选的,所述在步骤一探索FRGs在HCC中的表达情况时,构建铁死亡相关基因风险评分过程中,应用limma软件包来识别两种亚型之间的差异表达基因,校正后的P值从Benjamini–Hochberg多重检验活动并设置阈值:|log FC|>1和校正后的P值<0.05后,利用MutSigCV 1.41软件识别了两亚型的显著突变基因,利用GISTIC2.0软件包识别了两种亚型的显著拷贝数变异相关基因,利用 Venn图说明4个基因集之间的关系,然后选择至少存在于2个基因集中的基因进行进一步分析,单因素Cox回归分析被用来发现这些基因的预后价值,将具有显著统计学意义(p<0.05)的基因纳入多变量Cox回归分析中,之后,再利用逐步回归替代法构建了铁死亡相关风险评分(FRRS),并在AIC评分最小时选择最优模型,该最佳模型如下:
risk score=∑Expression(gene)*coef(gene);
其中expression(gene)表示基因的表达水平,coef(gene) 表示其回归系数,最后再根据survminer软件包确定的最佳临界值将HCC样本分为高FRRS组和低FRRS组,在三个独立队列(TCGA、 ICGC和NCI)中对FRRS进行了Kaplan-Meier分析,并进一步使用一致性指数(C指数)评估了模型的预测准确性。
优选的,所述在步骤一探索FRGs在HCC中的表达情况时,免疫治疗队列和治疗生物标志物的收集过程中,收集了公开的、有表达数据和完整临床信息的免疫治疗队列,以下3个队列最终被纳入研究中:(1)接受抗PD-L1抗体atezolizumab干预的晚期尿路上皮癌患者(IMvigor210队列);(2)接受抗PD-1抗体pembrolizumab 治疗的转移性黑色素瘤患者(GSE78220队列);(3)接受过继性T 细胞治疗的黑色素瘤患者(GSE100797队列),之后,再根据RECIST v1.1标准,排除治疗有效性无法评估的患者,在研究中完全缓解和部分缓解被视为免疫治疗缓解,与此同时疾病稳定和疾病进展则被视为免疫治疗无应答,将标准化表达数据进一步转化为z-scoring,在三个免疫治疗队列中评价了FRRS的预测性能,并将FRRS与其他7 种已知生物标志物进行了比较,包括TMB、TIDE、MSI评分、Merck18、 IFGN、CD8和CD274,应用受试者工作者曲线(ROC)和ROC曲线下面积(AUC)来评估不同生物标志物对免疫治疗反应的预测准确性。
优选的,所述在步骤一探索FRGs在HCC中的表达情况时,肝细胞癌中铁死亡相关基因的基因组变异景观过程中,根据收集到的74 个FRGs在TCGA-LIHC队列中的表达情况,总结出了FRGs的多组学变异情况,根据这些基因,明显地将肿瘤组织与正常组织区分开,大部多数FRGs在肿瘤和正常组织中表现出了显著的表达差异,进一步的研究发现,FRGs的突变频率很低,但拷贝数变异(CNVs)广泛存在,这表明相对于突变,CNVs可能在FRGs的调节中起主导作用,其中EGLN1、ENPP2和MUC1集中在拷贝数的扩增上,而SLC39A14、 ALOX15和ACSL1有很高的缺失频率,此外,DNA甲基化对FRGs(如 ACSL1、ACSL5和SCD等)也表现出广泛的调节作用,单因素Cox回归分析进一步证明大部分FRGs对HCC起保护作用,符合FRGs的保护生物学功能,上述的分析结果表明DNA甲基化和拷贝数变异而不是突变在HCC的铁死亡过程中发挥着重要作用。
与现有技术相比,本发明的有益效果是:
1、该基于铁死亡进程的肝细胞癌分型体系的构建方法通过探索FRGs在HCC中的表达情况、异质性铁死亡亚型的识别和验证、两亚型的临床状态、评估FRRS在预测预后和免疫治疗疗效上的表现以及HCCS程序包的开发的步骤配合,共纳入了32个数据集的3933个肝癌样本进行分析,分为低铁死亡亚型和高铁死亡亚型,并显示出了特异的功能特征和临床结局,此外,基于铁死亡分型,还提出了一个铁死亡相关风险评分(FRRS),FRRS在预测预后和免疫治疗来疗效中都展示了较好的效果,可为铁死亡在肝癌中的研究奠定了基础,以及为肝癌的临床管理和靶向治疗提供了依据和参考,且根据收集到的74个FRGs在TCGA-LIHC队列中的表达情况,可以明显地将肿瘤组织与正常组织区分开,大部多数FRGs在肿瘤和正常组织中表现出了显著的表达差异,且FRGs的突变频率很低,但拷贝数变异 (CNVs)广泛存在,这表明相对于突变,CNVs可能在FRGs的调节中起主导作用,其中EGLN1、ENPP2和MUC1集中在拷贝数的扩增上,而SLC39A14、ALOX15和ACSL1有很高的缺失频率。此外,DNA甲基化对FRGs(如ACSL1、ACSL5和SCD等)也表现出广泛的调节作用,单因素Cox回归分析进一步证明大部分FRGs对HCC起保护作用,符合FRGs的保护生物学功能,基于铁死亡过程的HCC分型模式,并找到一种新的肝细胞癌生物标志物:FRRS,其在预测HCC的预后和免疫治疗疗效上具有极佳的性能,且开发了一个R程序包:HCCS,可以方便地将HCC患者划分到不同的铁死亡亚型,为实现HCC患者的早期诊断、个体化治疗和全程管理带来了曙光。
附图说明
图1为本发明的方法流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,本发明提供的一种实施例:
一种基于铁死亡进程的肝细胞癌分型体系的构建方法,包括如下步骤:
步骤一、探索FRGs在HCC中的表达情况:首先分别纳入来自于 GEO,TCGA和ICGC数据库的32个数据集共3933个肝细胞癌样本,且32个数据集分别为GSE102079,GSE107170,GSE109211, GSE112790,GSE116174,GSE121248,GSE14323,NCI,GSE16757, GSE19977,GSE20017,GSE25097,GSE36376,GSE36411, GSE39791,GSE43619,GSE45436,GSE46444,GSE50579, GSE54236,GSE57957,GSE62043,GSE62232,GSE63898, GSE64041,GSE76297,GSE76427,GSE84005,GSE87630,GSE9843, TCGA-LIHC和ICGC-LIRI-JP,其中NCI TCGA-LIHC和ICHC-LIRI-JP 具有完整的表达信息和临床预后信息;
然后再采用affy软件包中的rma函数对来自Affymetrix平台的原始数据进行标准化,来自其他平台的数据直接下载标准化过的矩阵文件,之后再使用SVA包中的combat算法进行批次矫正, TCGA-LIHC队列的RNA-seq数据从UCSC-Xena数据库获得,并进一步转化为log2(TPM+1),ICGC-LIRI-JP数据集的RNA-seq数据直接从ICGC数据门户网站获得,随后,再对训练集和验证集的表达数据均转化为z-scoring,相应的临床和样本信息从GEO,UCSC和ICGC 数据库中获得,对于TCGA-LIHC中的体细胞突变数据、拷贝数变异数据和DNA甲基化数据均从TCGA门户网站下载,此外,从Thorsson 等人的研究中计算或招募了肿瘤突变负荷、单核苷酸变异和插入缺失新抗原负荷、微卫星不稳定性、癌睾丸抗原评分和TCR/BCR多样性等进行后续研究;
步骤二、异质性铁死亡亚型的识别和验证:接着再将来自于30 个GEO发现队列的共3327个样本作为发现队列,并通过 ConsensusClusterPlus软件包进一步分为k组(k=2~9),根据共识得分的CDF曲线,我们发现k=2是最优选择,之后,再应用 PAC和NbClust两种方法进行验证并得到了相同的结果,基于74个 FRGs的表达,这两个亚型的样本在二维主成分图上显著分离,为了确保GEO发现队列聚类结果的可靠性和稳定性,进一步在TCGA和ICGC 两个验证队列进行了IGP分析,结果显示,TCGA队列中C1的IGP值为90.3%,C2的IGP值为92.9%,而ICGC队列中C1的IGP值为88.4%和91.7%(所有p<0.001),与此一致的是NbClust也表明,在两个队列中分为两个亚型是最理想的,因此,根据聚类结果,最终将肝细胞癌样本分为C1和C2两种亚型;
过程中发现多数FRGs在C2明显上调,而C1则相反,从而铁死亡可以诱导肿瘤特异性免疫反应,增强免疫治疗的效果,进一步的相关性分析也提示HCC中74个FRGs的表达和TME细胞的浸润丰度之间存在强烈的相关性,进一步探索了TME细胞在两种亚型的浸润差异,结果显示C1的总体浸润水平较高,除了丰富的免疫激活细胞, C1还显示出更高丰度的免疫抑制细胞;
为进一步明确两种亚型的生物学特征,分别利用Hallmark和 KEGG基因集进行GSVA富集分析,C1明显富集在炎症相关通路中,如同种异体移植排斥反应、炎症反应和T细胞受体信号通路;而C2 主要与代谢相关通路密切相关,包括氧化磷酸化、脂肪酸代谢、胆汁酸代谢和氨基酸代谢,之后从TCGA和ICGC两个验证队列也获得了相似的结果,综合以上结果,我们定义两种分子亚型如下:1)高免疫低代谢型(C1):低水平的FRGs表达和炎症相关通路的富集以及高丰度的免疫细胞浸润;2)高代谢低免疫型(C2):高水平的FRGs 表达和代谢相关通路富集以及低丰度的免疫细胞浸润;
步骤三、两亚型的临床状态:然后再用Kaplan-Meier对两亚型样本进行生存分析,结果显示C2的OS和RFS优于C1,研究表明,案例可以通过抑制Xc-系统诱导铁死亡,使用pRRophetic软件包预测了两种亚型对索拉非尼的敏感性,结果提示C2更有可能从索拉非尼的治疗中获益,此外,之前的分析显示C1具有较丰富的免疫细胞浸润,免疫检查点分子(如PD-L1和CTLA-4)也在C1中过度表达,结果均表明C1可能对免疫治疗更敏感,因此,再进一步评估了免疫治疗对两种亚型的有效性,使用TIDE网页工具,C1的反应高于C2,在TCGA和ICGC两个验证队列中也获得了相似的结果,同时还利用 GenePattern平台的Submap算法来评估两种亚型和47例接受全面免疫治疗的患者的表达谱的相似性,结果表明C1与抗PD-1治疗有效的患者显著相关,之后我们在两个验证队列中也获得了相似的结果,此外,我们还观察到C1亚型患者与年龄小于65岁、女性、较晚的AJCC 分期、较高的肿瘤分级以及血管侵犯显著相关,两种亚型之间的BMI 没有显著差异;
步骤四、评估FRRS在预测预后和免疫治疗疗效上的表现:在 DEGs、SMGs、CAGs和ESGs四个不同来源的显著基因中,再挑选至少 2/4来源的33个基因进行进一步研究,单因素COX回归分析表明,6 个基因具有显著的预后意义(p<0.05),接下来,再纳入了这6 个基因(p<0.05)进行多因素COX回归分析,采用逐步回归替代法,基于最小的AIC值,确定最佳模型:FRRS=0.348*Expression (SLC16A3)-0.151*Expression(CPS1),生存分析显示高FRRS患者的预后更差,一致性指数分析也证实,FRRS在TCGA、ICGC和NCI 的三个独立队列中具有较高的准确性,结合临床因素,我们通过多因素Cox回归分析观察到FRRS是HCC的独立预后因素;
探索与免疫治疗反应有关的FRRS的生物学特征后,发现FRRS 与HAVCR2、CTLA4和PDCD1等ICP分子的表达,以及Treg细胞和MDSC 的浸润模式呈显著正相关,因此,再纳入了3个免疫治疗队列,以进一步研究FRRS是否可以预测患者对免疫治疗的反应性,与上述一致,高FRRS患者在这三个队列中均显示出了不利的生存期,此外,临床上对免疫治疗起反应的患者也展现出更低的FRRS,表明FRRS 较低的患者更有可能从免疫治疗中获益,采用ROC曲线的曲线下面积(AUC)评估FRRS预测免疫治疗反应的准确性,这些结果强烈提示FRRS是一个可靠的生物标志物,然后,再计算7种广泛使用的免疫治疗生物标志物,包括TMB、TIDE、MSI评分、Merck18、IFGN、 CD8和CD274,在所有三个队列中,FRRS在预测免疫治疗方面提供了更高的准确性,值得注意的是,虽然在FRRS在GSE78220队列中的预测能力比TIDE略低,但TIDE在预测IMvigor210队列和GSE100797 队列对免疫治疗的反应方面表现更差,综上,研究强有力地证实了 FRRS可用来评估肿瘤的免疫治疗反应和预测患者的预后,并且优于当前广泛使用的生物标记物;
步骤五、HCCS程序包的开发:基于质心法和皮尔森关联性分析,开发了名为HCCS的R程序包,HCCS中的ferroptosis_phenotype 可以将数据中的HCC样本划分到对应的铁死亡亚型C1或C2,并计算每个样本的FRRS,进一步可以预测患者的预后和评估患者的免疫治疗疗效,从而更好地服务于临床,通过探索FRGs在HCC中的表达情况、异质性铁死亡亚型的识别和验证、两亚型的临床状态、评估FRRS 在预测预后和免疫治疗疗效上的表现以及HCCS程序包的开发的步骤配合,共纳入了32个数据集的3933个肝癌样本进行分析,分为低铁死亡亚型和高铁死亡亚型,并显示出了特异的功能特征和临床结局,此外,基于铁死亡分型,还提出了一个铁死亡相关风险评分 (FRRS),FRRS在预测预后和免疫治疗来疗效中都展示了较好的效果,可为铁死亡在肝癌中的研究奠定了基础,以及为肝癌的临床管理和靶向治疗提供了依据和参考,且根据收集到的74个FRGs在 TCGA-LIHC队列中的表达情况,可以明显地将肿瘤组织与正常组织区分开,大部多数FRGs在肿瘤和正常组织中表现出了显著的表达差异,且FRGs的突变频率很低,但拷贝数变异(CNVs)广泛存在,这表明相对于突变,CNVs可能在FRGs的调节中起主导作用,其中EGLN1、 ENPP2和MUC1集中在拷贝数的扩增上,而SLC39A14、ALOX15和ACSL1 有很高的缺失频率,此外,DNA甲基化对FRGs(如ACSL1、ACSL5和SCD等)也表现出广泛的调节作用,单因素Cox回归分析进一步证明大部分FRGs对HCC起保护作用,符合FRGs的保护生物学功能,基于铁死亡过程的HCC分型模式,并找到一种新的肝细胞癌生物标志物:FRRS,其在预测HCC的预后和免疫治疗疗效上具有极佳的性能,且开发了一个R程序包:HCCS,可以方便地将HCC患者划分到不同的铁死亡亚型,为实现HCC患者的早期诊断、个体化治疗和全程管理带来了曙光。
在步骤一探索FRGs在HCC中的表达情况时,基于铁死亡相关基因的HCC亚型的构建的过程中,共找到74个铁死亡相关基因,利用 Consensus Cluster Plus软件包对GEO发现队列进行基于FRGs表达的共识聚类,且聚类方法采用基于欧氏距离的Kmeans算法,过程中进行1000次迭代,每次迭代取80%的样本,聚类数量设定为2~9 个,通过共识评分的累积分布函数(CDF)和模糊聚类比例(PAC) 确定最佳聚类数,之后应用NbClust包进一步验证最佳聚类数,最后再采用主成分分析在二维空间中区分不同亚型的信息,精准分析 74个铁死亡相关基因的不同亚型信息,提高74个铁死亡相关基因的信息精准率。
在步骤一探索FRGs在HCC中的表达情况时,铁死亡相关亚型的验证过程中,使用clusterRepro软件包中的in-group proportion (IGP)方法对TCGA和ICGC验证队列中的数据进行分析,IGP被定义为某一亚型样本的最近的邻居也被分配到同一亚型中的比例,为了测量IGP,首先计算了GEO发现队列中每种亚型的质心,再将TCGA 和ICGC验证队列中的每份样本分配至质心和样本之间Pearson相关系数最高的特定亚型,用P值,即零分布IGP比实际聚类IGP多出的部分,来评估聚类质量,如果两个队列之间的聚类足够相似,则 IGP接近100%,反之接近0%,clusterRepro包中的排列设置为2000,增强铁死亡相关亚型的验证效果,避免铁死亡相关亚型的验证出现错误,给研究人员造成误判走入误区。
在步骤一探索FRGs在HCC中的表达情况时,功能分析和免疫浸润评估过程中,对两种亚型的HCC样本进行了基因集变异分析 (GSVA),从Molecular Signatures Database下载了Hallmark和 KEGG基因集,并使用GSVA软件包进一步将基因表达矩阵转化为基因集矩阵,之后再使用limma软件包对C1和C2两种亚型进行基因集差异分析,筛选阈值设定为|logFC|>0.2,校正过的P值<0.05。校正过的P值从Benjamini–Hochberg多重检验获得,且获得了23 种免疫细胞的标记物,包括:固有免疫细胞(活化的树突状细胞,CD56+自然杀伤细胞,CD56-自然杀伤细胞,嗜酸性粒细胞,未成熟的树突状细胞,巨噬细胞,肥大细胞,MDSC,单核细胞,自然杀伤细胞,中性粒细胞,和浆细胞样树突状细胞)和适应性免疫细胞(活化B细胞、活化CD4+ T细胞、活化CD8+ T细胞、γδT细胞、未成熟B细胞、自然杀伤T细胞、Treg细胞、滤泡辅助性T细胞、Th1 细胞、Th2细胞和Th17细胞),此外,内皮细胞和成纤维细胞也是TME的重要组成部分,在肿瘤炎症、血管生成、侵袭和转移中起着至关重要的作用,基于这些标记,应用单样本基因集富集分析(ssGSEA) 算法评价25个TME细胞的浸润丰度,对各基因集进行精准功能分析和免疫浸润评估,且提升各基因集的全面性。
在步骤一探索FRGs在HCC中的表达情况时,分型的临床特征、预后情况以及临床治疗反应预测过程中,比较两种亚型在年龄、性别、BMI、AJCC分期、分级和血管浸润方面的差异,并通过 Kaplan-Meier生存分析估计了无复发生存期和总生存期,之后,应用pRRophetic软件包预测GEO发现队列和TCGA、ICGC验证队列对索拉菲尼的敏感性,通过岭回归估算样本的半数抑制浓度(IC50), IC50越小说明亚型对索拉菲尼的治疗越敏感,此外,还利用了TIDE 网页工具预测两种亚型对免疫治疗的敏感性,Submap算法被用来评价两种亚型和免疫治疗敏感/不敏感人群之间基因表达模式的相似度,对分型的临床特征、预后情况以及临床治疗反应进行准确预测,为研究人员提供辅助参考依据。
在步骤一探索FRGs在HCC中的表达情况时,两种亚型的基因组变异景观分析过程中,利用MutSigCV 1.41软件鉴定了两种亚型中的显著突变基因(SMGs),保留q值<0.05的基因进一步分析, MutationalPatterns软件包被用来提取各亚型的突变特征,非负矩阵分解(NMF)被用来确定突变特征的最佳数量,最终提示3个最佳,然后,再计算提取的突变特征与COSMIC数据库中已有的30个突变特征之间的余弦相似度,并以最相似的COSMIC特征对提取的特征进行命名,GenePattern中的GISTIC 2.0软件被用来识别显著扩增或缺失的体细胞拷贝数变异情况,再由以下程序来鉴定表观遗传学沉默基因(ESGs):(1)排除正常组织中甲基化的CpG位点(平均β值>0.2);(2)以截断值(β值=0.3)为界将数据分为甲基化组和未甲基化组,并进一步去除甲基化组中甲基化频率少于10%肿瘤样本的探针;(3)对于每个探针,如果非甲基化组与甲基化组中对应基因的平均表达差值>1.64个未甲基化组的标准差,该探针将被标记为表观遗传学沉默;(4)当多个探针被分配到同一基因时,具有一半以上的相应探针的基因被标记为表观遗传沉默,则该基因被识别为ESG,提高两种亚型的基因组变异景观的分析精确度,以便研究人员快速且精准的对两种亚型的基因组变异景观进行分析。
在步骤一探索FRGs在HCC中的表达情况时,构建铁死亡相关基因风险评分过程中,应用limma软件包来识别两种亚型之间的差异表达基因,校正后的P值从Benjamini–Hochberg多重检验活动并设置阈值:|log FC|>1和校正后的P值<0.05后,利用MutSigCV1.41软件识别了两亚型的显著突变基因,利用GISTIC2.0软件包识别了两种亚型的显著拷贝数变异相关基因,利用Venn图说明4个基因集之间的关系,然后选择至少存在于2个基因集中的基因进行进一步分析,单因素Cox回归分析被用来发现这些基因的预后价值,将具有显著统计学意义(p<0.05)的基因纳入多变量Cox回归分析中,之后,再利用逐步回归替代法构建了铁死亡相关风险评分 (FRRS),并在AIC评分最小时选择最优模型,该最佳模型如下:
risk score=∑Expression(gene)*coef(gene);
其中expression(gene)表示基因的表达水平,coef(gene) 表示其回归系数,最后再根据survminer软件包确定的最佳临界值将HCC样本分为高FRRS组和低FRRS组,在三个独立队列(TCGA、 ICGC和NCI)中对FRRS进行了Kaplan-Meier分析,并进一步使用一致性指数(C指数)评估了模型的预测准确性,采用公式计算,模型展示的方式对构建铁死亡相关基因进行风险评分,提高构建铁死亡相关基因风险的直观性和准确性。
在步骤一探索FRGs在HCC中的表达情况时,免疫治疗队列和治疗生物标志物的收集过程中,收集了公开的、有表达数据和完整临床信息的免疫治疗队列,以下3个队列最终被纳入研究中:(1)接受抗PD-L1抗体atezolizumab干预的晚期尿路上皮癌患者(IMvigor210队列);(2)接受抗PD-1抗体pembrolizumab治疗的转移性黑色素瘤患者(GSE78220队列);(3)接受过继性T细胞治疗的黑色素瘤患者(GSE100797队列),之后,再根据RECIST v1.1 标准,排除治疗有效性无法评估的患者,在研究中完全缓解和部分缓解被视为免疫治疗缓解,与此同时疾病稳定和疾病进展则被视为免疫治疗无应答,将标准化表达数据进一步转化为z-scoring,在三个免疫治疗队列中评价了FRRS的预测性能,并将FRRS与其他7种已知生物标志物进行了比较,包括TMB、TIDE、MSI评分、Merck18、 IFGN、CD8和CD274,应用受试者工作者曲线(ROC)和ROC曲线下面积(AUC)来评估不同生物标志物对免疫治疗反应的预测准确性,扩大了免疫治疗队列和治疗生物标志物的收集范围,提高免疫治疗队列和治疗生物标志物的收集全面性。
在步骤一探索FRGs在HCC中的表达情况时,肝细胞癌中铁死亡相关基因的基因组变异景观过程中,根据收集到的74个FRGs在 TCGA-LIHC队列中的表达情况,总结出了FRGs的多组学变异情况,根据这些基因,明显地将肿瘤组织与正常组织区分开,大部多数FRGs在肿瘤和正常组织中表现出了显著的表达差异,进一步的研究发现, FRGs的突变频率很低,但拷贝数变异(CNVs)广泛存在,这表明相对于突变,CNVs可能在FRGs的调节中起主导作用,其中EGLN1、ENPP2 和MUC1集中在拷贝数的扩增上,而SLC39A14、ALOX15和ACSL1有很高的缺失频率,此外,DNA甲基化对FRGs(如ACSL1、ACSL5和SCD 等)也表现出广泛的调节作用,单因素Cox回归分析进一步证明大部分FRGs对HCC起保护作用,符合FRGs的保护生物学功能,上述的分析结果表明DNA甲基化和拷贝数变异而不是突变在HCC的铁死亡过程中发挥着重要作用,从而直接披露出肝细胞癌中铁死亡相关基因的基因组变异景观信息,为研究人员提供参考方向。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

Claims (9)

1.一种基于铁死亡进程的肝细胞癌分型体系的构建方法,其特征在于:包括如下步骤:
步骤一、探索FRGs在HCC中的表达情况:首先分别纳入来自于GEO,TCGA和ICGC数据库的32个数据集共3933个肝细胞癌样本,且32个数据集分别为GSE102079,GSE107170,GSE109211,GSE112790,GSE116174,GSE121248,GSE14323,NCI,GSE16757,GSE19977,GSE20017,GSE25097,GSE36376,GSE36411,GSE39791,GSE43619,GSE45436,GSE46444,GSE50579,GSE54236,GSE57957,GSE62043,GSE62232,GSE63898,GSE64041,GSE76297,GSE76427,GSE84005,GSE87630,GSE9843,TCGA-LIHC和ICGC-LIRI-JP,其中NCI TCGA-LIHC和ICHC-LIRI-JP具有完整的表达信息和临床预后信息;
然后再采用affy软件包中的rma函数对来自Affymetrix平台的原始数据进行标准化,来自其他平台的数据直接下载标准化过的矩阵文件,之后再使用SVA包中的combat算法进行批次矫正,TCGA-LIHC队列的RNA-seq数据从UCSC-Xena数据库获得,并进一步转化为log2(TPM+1),ICGC-LIRI-JP数据集的RNA-seq数据直接从ICGC数据门户网站获得,随后,再对训练集和验证集的表达数据均转化为z-scoring,相应的临床和样本信息从GEO,UCSC和ICGC数据库中获得,对于TCGA-LIHC中的体细胞突变数据、拷贝数变异数据和DNA甲基化数据均从TCGA门户网站下载,此外,从Thorsson等人的研究中计算或招募了肿瘤突变负荷、单核苷酸变异和插入缺失新抗原负荷、微卫星不稳定性、癌睾丸抗原评分和TCR/BCR多样性等进行后续研究;
步骤二、异质性铁死亡亚型的识别和验证:接着再将来自于30个GEO发现队列的共3327个样本作为发现队列,并通过ConsensusClusterPlus软件包进一步分为k组(k=2~9),根据共识得分的CDF曲线,我们发现k=2是最优选择,之后,再应用PAC和NbClust两种方法进行验证并得到了相同的结果,基于74个FRGs的表达,这两个亚型的样本在二维主成分图上显著分离,为了确保GEO发现队列聚类结果的可靠性和稳定性,进一步在TCGA和ICGC两个验证队列进行了IGP分析,结果显示,TCGA队列中C1的IGP值为90.3%,C2的IGP值为92.9%,而ICGC队列中C1的IGP值为88.4%和91.7%(所有p<0.001),与此一致的是NbClust也表明,在两个队列中分为两个亚型是最理想的,因此,根据聚类结果,最终将肝细胞癌样本分为C1和C2两种亚型;
过程中发现多数FRGs在C2明显上调,而C1则相反,从而铁死亡可以诱导肿瘤特异性免疫反应,增强免疫治疗的效果,进一步的相关性分析也提示HCC中74个FRGs的表达和TME细胞的浸润丰度之间存在强烈的相关性,进一步探索了TME细胞在两种亚型的浸润差异,结果显示C1的总体浸润水平较高,除了丰富的免疫激活细胞,C1还显示出更高丰度的免疫抑制细胞;
为进一步明确两种亚型的生物学特征,分别利用Hallmark和KEGG基因集进行GSVA富集分析,C1明显富集在炎症相关通路中,如同种异体移植排斥反应、炎症反应和T细胞受体信号通路;而C2主要与代谢相关通路密切相关,包括氧化磷酸化、脂肪酸代谢、胆汁酸代谢和氨基酸代谢,之后从TCGA和ICGC两个验证队列也获得了相似的结果,综合以上结果,我们定义两种分子亚型如下:1)高免疫低代谢型(C1):低水平的FRGs表达和炎症相关通路的富集以及高丰度的免疫细胞浸润;2)高代谢低免疫型(C2):高水平的FRGs表达和代谢相关通路富集以及低丰度的免疫细胞浸润;
步骤三、两亚型的临床状态:然后再用Kaplan-Meier对两亚型样本进行生存分析,结果显示C2的OS和RFS优于C1,研究表明,案例可以通过抑制Xc-系统诱导铁死亡,使用pRRophetic软件包预测了两种亚型对索拉非尼的敏感性,结果提示C2更有可能从索拉非尼的治疗中获益,此外,之前的分析显示C1具有较丰富的免疫细胞浸润,免疫检查点分子(如PD-L1和CTLA-4)也在C1中过度表达,结果均表明C1可能对免疫治疗更敏感,因此,再进一步评估了免疫治疗对两种亚型的有效性,使用TIDE网页工具,C1的反应高于C2,在TCGA和ICGC两个验证队列中也获得了相似的结果,同时还利用GenePattern平台的Submap算法来评估两种亚型和47例接受全面免疫治疗的患者的表达谱的相似性,结果表明C1与抗PD-1治疗有效的患者显著相关,之后我们在两个验证队列中也获得了相似的结果,此外,我们还观察到C1亚型患者与年龄小于65岁、女性、较晚的AJCC分期、较高的肿瘤分级以及血管侵犯显著相关,两种亚型之间的BMI没有显著差异;
步骤四、评估FRRS在预测预后和免疫治疗疗效上的表现:在DEGs、SMGs、CAGs和ESGs四个不同来源的显著基因中,再挑选至少2/4来源的33个基因进行进一步研究,单因素COX回归分析表明,6个基因具有显著的预后意义(p<0.05),接下来,再纳入了这6个基因(p<0.05)进行多因素COX回归分析,采用逐步回归替代法,基于最小的AIC值,确定最佳模型:FRRS=0.348*Expression(SLC16A3)-0.151*Expression(CPS1),生存分析显示高FRRS患者的预后更差,一致性指数分析也证实,FRRS在TCGA、ICGC和NCI的三个独立队列中具有较高的准确性,结合临床因素,我们通过多因素Cox回归分析观察到FRRS是HCC的独立预后因素;
探索与免疫治疗反应有关的FRRS的生物学特征后,发现FRRS与HAVCR2、CTLA4和PDCD1等ICP分子的表达,以及Treg细胞和MDSC的浸润模式呈显著正相关,因此,再纳入了3个免疫治疗队列,以进一步研究FRRS是否可以预测患者对免疫治疗的反应性,与上述一致,高FRRS患者在这三个队列中均显示出了不利的生存期,此外,临床上对免疫治疗起反应的患者也展现出更低的FRRS,表明FRRS较低的患者更有可能从免疫治疗中获益,采用ROC曲线的曲线下面积(AUC)评估FRRS预测免疫治疗反应的准确性,这些结果强烈提示FRRS是一个可靠的生物标志物,然后,再计算7种广泛使用的免疫治疗生物标志物,包括TMB、TIDE、MSI评分、Merck18、IFGN、CD8和CD274,在所有三个队列中,FRRS在预测免疫治疗方面提供了更高的准确性,值得注意的是,虽然在FRRS在GSE78220队列中的预测能力比TIDE略低,但TIDE在预测IMvigor210队列和GSE100797队列对免疫治疗的反应方面表现更差,综上,研究强有力地证实了FRRS可用来评估肿瘤的免疫治疗反应和预测患者的预后,并且优于当前广泛使用的生物标记物;
步骤五、HCCS程序包的开发:基于质心法和皮尔森关联性分析,开发了名为HCCS的R程序包,HCCS中的ferroptosis_phenotype可以将数据中的HCC样本划分到对应的铁死亡亚型C1或C2,并计算每个样本的FRRS,进一步可以预测患者的预后和评估患者的免疫治疗疗效,从而更好地服务于临床。
2.根据权利要求1所述的一种基于铁死亡进程的肝细胞癌分型体系的构建方法,其特征在于:所述在步骤一探索FRGs在HCC中的表达情况时,基于铁死亡相关基因的HCC亚型的构建的过程中,共找到74个铁死亡相关基因,利用Consensus Cluster Plus软件包对GEO发现队列进行基于FRGs表达的共识聚类,且聚类方法采用基于欧氏距离的Kmeans算法,过程中进行1000次迭代,每次迭代取80%的样本,聚类数量设定为2~9个,通过共识评分的累积分布函数(CDF)和模糊聚类比例(PAC)确定最佳聚类数,之后应用NbClust 包进一步验证最佳聚类数,最后再采用主成分分析在二维空间中区分不同亚型的信息。
3.根据权利要求1所述的一种基于铁死亡进程的肝细胞癌分型体系的构建方法,其特征在于:所述在步骤一探索FRGs在HCC中的表达情况时,铁死亡相关亚型的验证过程中,使用clusterRepro软件包中的in-groupproportion(IGP)方法对TCGA和ICGC验证队列中的数据进行分析,IGP被定义为某一亚型样本的最近的邻居也被分配到同一亚型中的比例,为了测量IGP,首先计算了GEO发现队列中每种亚型的质心,再将TCGA和ICGC验证队列中的每份样本分配至质心和样本之间Pearson相关系数最高的特定亚型,用P值,即零分布IGP比实际聚类IGP多出的部分,来评估聚类质量,如果两个队列之间的聚类足够相似,则IGP接近100%,反之接近0%,clusterRepro包中的排列设置为2000。
4.根据权利要求1所述的一种基于铁死亡进程的肝细胞癌分型体系的构建方法,其特征在于:所述在步骤一探索FRGs在HCC中的表达情况时,功能分析和免疫浸润评估过程中,对两种亚型的HCC样本进行了基因集变异分析(GSVA),从Molecular Signatures Database下载了Hallmark和KEGG基因集,并使用GSVA软件包进一步将基因表达矩阵转化为基因集矩阵,之后再使用limma软件包对C1和C2两种亚型进行基因集差异分析,筛选阈值设定为|logFC|>0.2,校正过的P值<0.05,校正过的P值从Benjamini–Hochberg多重检验获得,且获得了23种免疫细胞的标记物,包括:固有免疫细胞(活化的树突状细胞,CD56+自然杀伤细胞,CD56-自然杀伤细胞,嗜酸性粒细胞,未成熟的树突状细胞,巨噬细胞,肥大细胞,MDSC,单核细胞,自然杀伤细胞,中性粒细胞,和浆细胞样树突状细胞)和适应性免疫细胞(活化B细胞、活化CD4+T细胞、活化CD8+T细胞、γδT细胞、未成熟B细胞、自然杀伤T细胞、Treg细胞、滤泡辅助性T细胞、Th1细胞、Th2细胞和Th17细胞),此外,内皮细胞和成纤维细胞也是TME的重要组成部分,在肿瘤炎症、血管生成、侵袭和转移中起着至关重要的作用,基于这些标记,应用单样本基因集富集分析(ssGSEA)算法评价25个TME细胞的浸润丰度。
5.根据权利要求1所述的一种基于铁死亡进程的肝细胞癌分型体系的构建方法,其特征在于:所述在步骤一探索FRGs在HCC中的表达情况时,分型的临床特征、预后情况以及临床治疗反应预测过程中,比较两种亚型在年龄、性别、BMI、AJCC分期、分级和血管浸润方面的差异,并通过Kaplan-Meier生存分析估计了无复发生存期和总生存期,之后,应用pRRophetic软件包预测GEO发现队列和TCGA、ICGC验证队列对索拉菲尼的敏感性,通过岭回归估算样本的半数抑制浓度(IC50),IC50越小说明亚型对索拉菲尼的治疗越敏感,此外,还利用了TIDE网页工具预测两种亚型对免疫治疗的敏感性,Submap算法被用来评价两种亚型和免疫治疗敏感/不敏感人群之间基因表达模式的相似度。
6.根据权利要求1所述的一种基于铁死亡进程的肝细胞癌分型体系的构建方法,其特征在于:所述在步骤一探索FRGs在HCC中的表达情况时,两种亚型的基因组变异景观分析过程中,利用MutSigCV 1.41软件鉴定了两种亚型中的显著突变基因(SMGs),保留q值<0.05的基因进一步分析,MutationalPatterns软件包被用来提取各亚型的突变特征,非负矩阵分解(NMF)被用来确定突变特征的最佳数量,最终提示3个最佳,然后,再计算提取的突变特征与COSMIC数据库中已有的30个突变特征之间的余弦相似度,并以最相似的COSMIC特征对提取的特征进行命名,GenePattern中的GISTIC 2.0软件被用来识别显著扩增或缺失的体细胞拷贝数变异情况,再由以下程序来鉴定表观遗传学沉默基因(ESGs):(1)排除正常组织中甲基化的CpG位点(平均β值>0.2);(2)以截断值(β值=0.3)为界将数据分为甲基化组和未甲基化组,并进一步去除甲基化组中甲基化频率少于10%肿瘤样本的探针;(3)对于每个探针,如果非甲基化组与甲基化组中对应基因的平均表达差值>1.64个未甲基化组的标准差,该探针将被标记为表观遗传学沉默;(4)当多个探针被分配到同一基因时,具有一半以上的相应探针的基因被标记为表观遗传沉默,则该基因被识别为ESG。
7.根据权利要求1所述的一种基于铁死亡进程的肝细胞癌分型体系的构建方法,其特征在于:所述在步骤一探索FRGs在HCC中的表达情况时,构建铁死亡相关基因风险评分过程中,应用limma软件包来识别两种亚型之间的差异表达基因,校正后的P值从Benjamini–Hochberg多重检验活动并设置阈值:|log FC|>1和校正后的P值<0.05后,利用MutSigCV1.41软件识别了两亚型的显著突变基因,利用GISTIC2.0软件包识别了两种亚型的显著拷贝数变异相关基因,利用Venn图说明4个基因集之间的关系,然后选择至少存在于2个基因集中的基因进行进一步分析,单因素Cox回归分析被用来发现这些基因的预后价值,将具有显著统计学意义(p<0.05)的基因纳入多变量Cox回归分析中,之后,再利用逐步回归替代法构建了铁死亡相关风险评分(FRRS),并在AIC评分最小时选择最优模型,该最佳模型如下:
risk score=∑Expression(gene)*coef(gene);
其中expression(gene)表示基因的表达水平,coef(gene)表示其回归系数,最后再根据survminer软件包确定的最佳临界值将HCC样本分为高FRRS组和低FRRS组,在三个独立队列(TCGA、ICGC和NCI)中对FRRS进行了Kaplan-Meier分析,并进一步使用一致性指数(C指数)评估了模型的预测准确性。
8.根据权利要求1所述的一种基于铁死亡进程的肝细胞癌分型体系的构建方法,其特征在于:所述在步骤一探索FRGs在HCC中的表达情况时,免疫治疗队列和治疗生物标志物的收集过程中,收集了公开的、有表达数据和完整临床信息的免疫治疗队列,以下3个队列最终被纳入研究中:(1)接受抗PD-L1抗体atezolizumab干预的晚期尿路上皮癌患者(IMvigor210队列);(2)接受抗PD-1抗体pembrolizumab治疗的转移性黑色素瘤患者(GSE78220队列);(3)接受过继性T细胞治疗的黑色素瘤患者(GSE100797队列),之后,再根据RECIST v1.1标准,排除治疗有效性无法评估的患者,在研究中完全缓解和部分缓解被视为免疫治疗缓解,与此同时疾病稳定和疾病进展则被视为免疫治疗无应答,将标准化表达数据进一步转化为z-scoring,在三个免疫治疗队列中评价了FRRS的预测性能,并将FRRS与其他7种已知生物标志物进行了比较,包括TMB、TIDE、MSI评分、Merck18、IFGN、CD8和CD274,应用受试者工作者曲线(ROC)和ROC曲线下面积(AUC)来评估不同生物标志物对免疫治疗反应的预测准确性。
9.根据权利要求1所述的一种基于铁死亡进程的肝细胞癌分型体系的构建方法,其特征在于:所述在步骤一探索FRGs在HCC中的表达情况时,肝细胞癌中铁死亡相关基因的基因组变异景观过程中,根据收集到的74个FRGs在TCGA-LIHC队列中的表达情况,总结出了FRGs的多组学变异情况,根据这些基因,明显地将肿瘤组织与正常组织区分开,大部多数FRGs在肿瘤和正常组织中表现出了显著的表达差异,进一步的研究发现,FRGs的突变频率很低,但拷贝数变异(CNVs)广泛存在,这表明相对于突变,CNVs可能在FRGs的调节中起主导作用,其中EGLN1、ENPP2和MUC1集中在拷贝数的扩增上,而SLC39A14、ALOX15和ACSL1有很高的缺失频率,此外,DNA甲基化对FRGs(如ACSL1、ACSL5和SCD等)也表现出广泛的调节作用,单因素Cox回归分析进一步证明大部分FRGs对HCC起保护作用,符合FRGs的保护生物学功能,上述的分析结果表明DNA甲基化和拷贝数变异而不是突变在HCC的铁死亡过程中发挥着重要作用。
CN202110231772.6A 2021-03-02 2021-03-02 一种基于铁死亡进程的肝细胞癌分型体系的构建方法 Pending CN113192560A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110231772.6A CN113192560A (zh) 2021-03-02 2021-03-02 一种基于铁死亡进程的肝细胞癌分型体系的构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110231772.6A CN113192560A (zh) 2021-03-02 2021-03-02 一种基于铁死亡进程的肝细胞癌分型体系的构建方法

Publications (1)

Publication Number Publication Date
CN113192560A true CN113192560A (zh) 2021-07-30

Family

ID=76973046

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110231772.6A Pending CN113192560A (zh) 2021-03-02 2021-03-02 一种基于铁死亡进程的肝细胞癌分型体系的构建方法

Country Status (1)

Country Link
CN (1) CN113192560A (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113782090A (zh) * 2021-09-18 2021-12-10 中南大学湘雅三医院 铁死亡模型构建方法与应用
CN114045339A (zh) * 2021-11-05 2022-02-15 山东第一医科大学附属省立医院(山东省立医院) 铁死亡相关基因在弥漫大b细胞淋巴瘤预后评估中的应用
CN114386530A (zh) * 2022-01-19 2022-04-22 复旦大学附属华山医院 基于深度学习的溃疡性结肠炎免疫分型的分类方法和系统
CN114480644A (zh) * 2022-01-07 2022-05-13 深圳市龙华区人民医院 肺腺癌基于代谢基因的分子分型
CN114672569A (zh) * 2022-05-24 2022-06-28 浙江大学医学院附属第一医院 基于色氨酸代谢基因的肝癌预后评估方法
CN115148287A (zh) * 2022-09-01 2022-10-04 中山大学肿瘤防治中心(中山大学附属肿瘤医院、中山大学肿瘤研究所) 基因焦点扩增分型模型的构建方法及肿瘤样本的分型方法
CN115188415A (zh) * 2022-07-12 2022-10-14 复旦大学附属肿瘤医院 一种基于免疫特征的肠癌分子分型方法和装置
CN116129998A (zh) * 2023-01-19 2023-05-16 中国医学科学院肿瘤医院 一种食管鳞状细胞癌数据的处理方法及其系统
CN116386903A (zh) * 2023-06-06 2023-07-04 中国医学科学院肿瘤医院 一种小细胞肺癌肿瘤间和肿瘤内异质性解读方法
CN117741148A (zh) * 2024-02-19 2024-03-22 苏州颐坤生物科技有限公司 一种用于免疫治疗疗效预测的标志物组合及模型构建方法和应用
CN118018531A (zh) * 2024-04-09 2024-05-10 深圳市鸿普森科技股份有限公司 一种针对物业场景下的数字人一体机

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113782090A (zh) * 2021-09-18 2021-12-10 中南大学湘雅三医院 铁死亡模型构建方法与应用
CN114045339A (zh) * 2021-11-05 2022-02-15 山东第一医科大学附属省立医院(山东省立医院) 铁死亡相关基因在弥漫大b细胞淋巴瘤预后评估中的应用
CN114480644A (zh) * 2022-01-07 2022-05-13 深圳市龙华区人民医院 肺腺癌基于代谢基因的分子分型
CN114386530A (zh) * 2022-01-19 2022-04-22 复旦大学附属华山医院 基于深度学习的溃疡性结肠炎免疫分型的分类方法和系统
CN114386530B (zh) * 2022-01-19 2024-08-13 复旦大学附属华山医院 基于深度学习的溃疡性结肠炎免疫分型的分类方法和系统
CN114672569A (zh) * 2022-05-24 2022-06-28 浙江大学医学院附属第一医院 基于色氨酸代谢基因的肝癌预后评估方法
CN115188415A (zh) * 2022-07-12 2022-10-14 复旦大学附属肿瘤医院 一种基于免疫特征的肠癌分子分型方法和装置
CN115148287B (zh) * 2022-09-01 2024-05-31 中山大学肿瘤防治中心(中山大学附属肿瘤医院、中山大学肿瘤研究所) 基因焦点扩增分型模型的构建方法及肿瘤样本的分型方法
CN115148287A (zh) * 2022-09-01 2022-10-04 中山大学肿瘤防治中心(中山大学附属肿瘤医院、中山大学肿瘤研究所) 基因焦点扩增分型模型的构建方法及肿瘤样本的分型方法
CN116129998A (zh) * 2023-01-19 2023-05-16 中国医学科学院肿瘤医院 一种食管鳞状细胞癌数据的处理方法及其系统
CN116129998B (zh) * 2023-01-19 2024-06-11 中国医学科学院肿瘤医院 一种食管鳞状细胞癌数据的处理方法及其系统
CN116386903A (zh) * 2023-06-06 2023-07-04 中国医学科学院肿瘤医院 一种小细胞肺癌肿瘤间和肿瘤内异质性解读方法
CN116386903B (zh) * 2023-06-06 2023-11-10 中国医学科学院肿瘤医院 一种小细胞肺癌肿瘤间和肿瘤内异质性解读方法
CN117741148A (zh) * 2024-02-19 2024-03-22 苏州颐坤生物科技有限公司 一种用于免疫治疗疗效预测的标志物组合及模型构建方法和应用
CN118018531A (zh) * 2024-04-09 2024-05-10 深圳市鸿普森科技股份有限公司 一种针对物业场景下的数字人一体机
CN118018531B (zh) * 2024-04-09 2024-06-25 深圳市鸿普森科技股份有限公司 一种针对物业场景下的数字人一体机

Similar Documents

Publication Publication Date Title
CN113192560A (zh) 一种基于铁死亡进程的肝细胞癌分型体系的构建方法
Chen et al. Co-expression network analysis identified FCER1G in association with progression and prognosis in human clear cell renal cell carcinoma
Sivendran et al. Dissection of immune gene networks in primary melanoma tumors critical for antitumor surveillance of patients with stage II–III resectable disease
CN111394456B (zh) 早期肺腺癌患者预后评估系统及其应用
CN111564214B (zh) 一种基于7个特殊基因的乳腺癌预后评估模型的建立与验证方法
Lin et al. Identification of an immune-related nine-lncRNA signature predictive of overall survival in colon cancer
CN111676288B (zh) 用于预测肺腺癌患者预后的系统及其应用
CN103502473A (zh) 胃肠胰神经内分泌肿瘤(gep-nen)的预测
CN113228190A (zh) 基于预测的肿瘤突变负荷的肿瘤分类
CN101960022A (zh) Ⅱ期和ⅲ期结肠癌的分子分期和预后
Wang et al. Identification of a six-gene signature associated with tumor mutation burden for predicting prognosis in patients with invasive breast carcinoma
Dong et al. Identification of a Pyroptosis‐Related Gene Signature for Prediction of Overall Survival in Lung Adenocarcinoma
CN115410713A (zh) 一种基于免疫相关基因的肝细胞癌预后风险预测模型构建
CN112088220A (zh) 替代标志物及用于肿瘤突变负荷测定的方法
CN113430266A (zh) G6pc及其所在基因组在制备肾透明细胞癌诊断或预后评估系统中的应用
Liu et al. Immune landscape refines the classification of colorectal cancer with heterogeneous prognosis, tumor microenvironment and distinct sensitivity to frontline therapies
Jinjia et al. The use of DNA repair genes as prognostic indicators of gastric cancer
Peng et al. Identification of a novel prognostic signature of genome instability-related LncRNAs in early stage lung adenocarcinoma
Yu et al. Identification of N6-methyladenosine-associated long non-coding RNAs for immunotherapeutic response and prognosis in patients with pancreatic cancer
Zhang et al. Hallmark guided identification and characterization of a novel immune-relevant signature for prognostication of recurrence in stage I–III lung adenocarcinoma
CN112908406A (zh) Pink1作为诊断标志物在构建肺鳞癌预后预测模型中的应用
CN114480644A (zh) 肺腺癌基于代谢基因的分子分型
Wang et al. Construction and validation of a novel prognostic model using the cellular senescence-associated long non-coding RNA in gastric cancer: A biological analysis
Dong et al. Identification of distinct molecular patterns and a four-gene signature in colon cancer based on invasion-related genes
Zhou et al. Identification of basement membrane-related signatures for estimating prognosis, immune infiltration landscape and drug candidates in pancreatic adenocarcinoma

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination