CN114317532B - 用于预测白血病预后的评估基因集、试剂盒、系统及应用 - Google Patents
用于预测白血病预后的评估基因集、试剂盒、系统及应用 Download PDFInfo
- Publication number
- CN114317532B CN114317532B CN202111679341.2A CN202111679341A CN114317532B CN 114317532 B CN114317532 B CN 114317532B CN 202111679341 A CN202111679341 A CN 202111679341A CN 114317532 B CN114317532 B CN 114317532B
- Authority
- CN
- China
- Prior art keywords
- expr
- prognosis
- risk
- genes
- patient
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 72
- 238000004393 prognosis Methods 0.000 title claims abstract description 46
- 238000011156 evaluation Methods 0.000 title claims abstract description 17
- 208000032839 leukemia Diseases 0.000 title description 2
- 208000031261 Acute myeloid leukaemia Diseases 0.000 claims abstract description 66
- 208000033776 Myeloid Acute Leukemia Diseases 0.000 claims abstract description 58
- 230000014509 gene expression Effects 0.000 claims abstract description 37
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 claims abstract description 36
- 230000034994 death Effects 0.000 claims abstract description 18
- 229910052742 iron Inorganic materials 0.000 claims abstract description 18
- 102000000795 Galectin 1 Human genes 0.000 claims abstract description 13
- 108010001498 Galectin 1 Proteins 0.000 claims abstract description 13
- -1 ZCAN 4 Proteins 0.000 claims abstract description 10
- 101000852773 Homo sapiens TLC domain-containing protein 4 Proteins 0.000 claims abstract description 9
- 101000931371 Homo sapiens Zinc finger protein ZFPM2 Proteins 0.000 claims abstract description 9
- 102100036695 TLC domain-containing protein 4 Human genes 0.000 claims abstract description 9
- 102100020996 Zinc finger protein ZFPM2 Human genes 0.000 claims abstract description 9
- 102100027708 Astrotactin-1 Human genes 0.000 claims abstract description 7
- 102100036466 Delta-like protein 3 Human genes 0.000 claims abstract description 7
- 102100035120 Forkhead box protein L1 Human genes 0.000 claims abstract description 7
- 102100029020 Homeobox protein HMX2 Human genes 0.000 claims abstract description 7
- 101000936741 Homo sapiens Astrotactin-1 Proteins 0.000 claims abstract description 7
- 101000928513 Homo sapiens Delta-like protein 3 Proteins 0.000 claims abstract description 7
- 101001023352 Homo sapiens Forkhead box protein L1 Proteins 0.000 claims abstract description 7
- 101000986307 Homo sapiens Homeobox protein HMX2 Proteins 0.000 claims abstract description 7
- 101000619910 Homo sapiens LIM/homeobox protein Lhx6 Proteins 0.000 claims abstract description 7
- 101000636209 Homo sapiens Matrix-remodeling-associated protein 5 Proteins 0.000 claims abstract description 7
- 101001128139 Homo sapiens NALCN channel auxiliary factor 2 Proteins 0.000 claims abstract description 7
- 101000610017 Homo sapiens Protocadherin beta-12 Proteins 0.000 claims abstract description 7
- 102100022098 LIM/homeobox protein Lhx6 Human genes 0.000 claims abstract description 7
- 102100030776 Matrix-remodeling-associated protein 5 Human genes 0.000 claims abstract description 7
- 102100031896 NALCN channel auxiliary factor 2 Human genes 0.000 claims abstract description 7
- 102100040145 Protocadherin beta-12 Human genes 0.000 claims abstract description 7
- 229940127276 delta-like ligand 3 Drugs 0.000 claims abstract description 7
- 101000595786 Homo sapiens Phospholipase A and acyltransferase 1 Proteins 0.000 claims abstract description 5
- 102100036072 Phospholipase A and acyltransferase 1 Human genes 0.000 claims abstract description 5
- 102100023733 Ephrin-B3 Human genes 0.000 claims abstract description 4
- 108010044085 Ephrin-B3 Proteins 0.000 claims abstract description 4
- 101000802336 Homo sapiens Zinc finger protein 560 Proteins 0.000 claims abstract description 4
- 102000006280 Twist-Related Protein 1 Human genes 0.000 claims abstract description 4
- 108010083162 Twist-Related Protein 1 Proteins 0.000 claims abstract description 4
- 101000785573 Homo sapiens Zinc finger and SCAN domain-containing protein 4 Proteins 0.000 claims description 6
- 102100026569 Zinc finger and SCAN domain-containing protein 4 Human genes 0.000 claims description 6
- 239000003153 chemical reaction reagent Substances 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000013480 data collection Methods 0.000 claims description 5
- 102100036850 C-C motif chemokine 23 Human genes 0.000 claims description 4
- 101000713081 Homo sapiens C-C motif chemokine 23 Proteins 0.000 claims description 4
- 230000009466 transformation Effects 0.000 claims description 3
- 238000000034 method Methods 0.000 abstract description 5
- 102100034657 Zinc finger protein 560 Human genes 0.000 abstract description 2
- 238000003745 diagnosis Methods 0.000 abstract description 2
- 201000010099 disease Diseases 0.000 abstract description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 abstract description 2
- 230000004083 survival effect Effects 0.000 description 25
- 238000004458 analytical method Methods 0.000 description 12
- 238000010200 validation analysis Methods 0.000 description 10
- 230000035772 mutation Effects 0.000 description 8
- 210000004027 cell Anatomy 0.000 description 7
- 238000012795 verification Methods 0.000 description 7
- 206010028980 Neoplasm Diseases 0.000 description 6
- 230000007170 pathology Effects 0.000 description 6
- 201000011510 cancer Diseases 0.000 description 5
- 238000000513 principal component analysis Methods 0.000 description 5
- 230000000284 resting effect Effects 0.000 description 5
- 238000012549 training Methods 0.000 description 5
- 210000001744 T-lymphocyte Anatomy 0.000 description 4
- 230000000875 corresponding effect Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 210000003630 histaminocyte Anatomy 0.000 description 4
- 210000002865 immune cell Anatomy 0.000 description 4
- 230000008595 infiltration Effects 0.000 description 4
- 238000001764 infiltration Methods 0.000 description 4
- 210000001616 monocyte Anatomy 0.000 description 4
- 238000003559 RNA-seq method Methods 0.000 description 3
- 238000011088 calibration curve Methods 0.000 description 3
- 230000002596 correlated effect Effects 0.000 description 3
- 210000004322 M2 macrophage Anatomy 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 2
- 238000007621 cluster analysis Methods 0.000 description 2
- 238000000556 factor analysis Methods 0.000 description 2
- 239000003642 reactive oxygen metabolite Substances 0.000 description 2
- 238000000611 regression analysis Methods 0.000 description 2
- 206010069754 Acquired gene mutation Diseases 0.000 description 1
- 206010000830 Acute leukaemia Diseases 0.000 description 1
- 206010059866 Drug resistance Diseases 0.000 description 1
- 238000010824 Kaplan-Meier survival analysis Methods 0.000 description 1
- 241000139306 Platt Species 0.000 description 1
- 238000011529 RT qPCR Methods 0.000 description 1
- 102000015098 Tumor Suppressor Protein p53 Human genes 0.000 description 1
- 108010078814 Tumor Suppressor Protein p53 Proteins 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 239000002246 antineoplastic agent Substances 0.000 description 1
- 210000003719 b-lymphocyte Anatomy 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000000090 biomarker Substances 0.000 description 1
- 210000001185 bone marrow Anatomy 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000005779 cell damage Effects 0.000 description 1
- 230000030833 cell death Effects 0.000 description 1
- 208000037887 cell injury Diseases 0.000 description 1
- 238000002512 chemotherapy Methods 0.000 description 1
- 229940044683 chemotherapy drug Drugs 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013211 curve analysis Methods 0.000 description 1
- 230000002498 deadly effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010201 enrichment analysis Methods 0.000 description 1
- 210000003979 eosinophil Anatomy 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 230000005965 immune activity Effects 0.000 description 1
- 230000028993 immune response Effects 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 230000037356 lipid metabolism Effects 0.000 description 1
- 230000003859 lipid peroxidation Effects 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 230000036210 malignancy Effects 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 210000001806 memory b lymphocyte Anatomy 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000036438 mutation frequency Effects 0.000 description 1
- 210000000822 natural killer cell Anatomy 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 210000005259 peripheral blood Anatomy 0.000 description 1
- 239000011886 peripheral blood Substances 0.000 description 1
- 238000010837 poor prognosis Methods 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012502 risk assessment Methods 0.000 description 1
- 238000013058 risk prediction model Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000037439 somatic mutation Effects 0.000 description 1
- 238000013517 stratification Methods 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明涉及一种用于预测急性髓细胞白血病患者预后的评估基因集、试剂盒、系统及应用,其中用于预测急性髓细胞白血病患者预后的评估基因集中的评估基因集为基于铁死亡相关聚类的差异表达基因集,其包括18个基因,18个基因为ZNF560、ZSCAN4、LHX6、TWIST1、FOXL1、ZFPM2、HMX2、ASTN1、DLL3、PCDHB12、PRINS、TMEM56、HRASLS、FAM155B、CCL23、LGALS1、EFNB3和MXRA5。本发明能够更加可靠地应用于临床实践,为急性髓细胞白血病患者提供疾病诊断及预后的新方法。
Description
技术领域
本发明属于肿瘤分子生物学技术领域,具体涉及一种用于预测急性髓细胞白血病患者预后的评估基因集、试剂盒、系统及应用。
背景技术
急性髓系白血病(AML)是一种发生于骨髓内的侵袭性恶性肿瘤,以髓系前体异常积聚为特征;作为一种最致命的急性白血病,AML患者的5年生存率仅为28.3%,大多数病例缓解后仍频繁复发,导致预后不良。
现有的研究表明AML中分子遗传异常与预后显著相关,这为AML的治疗选择以及风险分层系统提供了潜在的靶标;尽管关于AML患者生物标志物的探索方面取得了进展,但由于临床过程的多变性,属于同一组的患者也可能表现出不同的诊疗和预后效果。
铁死亡是一种关键的、由脂质过氧化过度积累引起的铁依赖性的细胞死亡方式;在铁死亡过程中,脂质代谢发生改变,细胞内脂质性活性氧(ROS)水平随之升高并大量蓄积,最终导致细胞出现损伤甚至死亡。现有技术中铁死亡广泛涉及癌症的发生发展和治疗耐药性,特别是可以让AML细胞对化疗药物的敏感性增加。
基于机体内免疫反应的发生涉及多种免疫细胞的参与,单个免疫基因或少数免疫细胞对于预后的评估并不完整。因此仍需要更准确、更高效的、能够预测癌症患者预后情况的方案。
发明内容
本发明基于TCGA数据库(TCGA-LAML)、GEO数据库(GSE71014)和TARGET数据库(TARGET-AML)中获取AML病例的基因表达谱及相应的临床信息,基于铁死亡相关聚类的差异表达基因,将TCGA队列中的患者分为两组并筛选了两组之间的差异表达基因,根据基因表达值得到预测急性髓系白血病预后的评估基因集。
本发明的第一目的是提供一种用于预测急性髓细胞白血病患者预后的评估基因集,其中,评估基因集为基于铁死亡相关聚类的差异表达基因集,其包括18个基因,18个基因为ZNF560、ZSCAN4、LHX6、TWIST1、FOXL1、ZFPM2、HMX2、ASTN1、DLL3、PCDHB12、PRINS、TMEM56、HRASLS、FAM155B、CCL23、LGALS1、EFNB3和MXRA5。
本发明的第二目的是提供一种用于预测急性髓细胞白血病患者预后的试剂盒,其包括检测前述评估基因集中18个基因表达水平的试剂,其中表达水平是指度量给定基因表达程度的参数的值。
具体的,试剂盒中所包含的试剂是本领域已知的任何可用于检测基因表达水平的试剂。
本发明的第三目的是提供一种用于预测急性髓细胞白血病患者预后的系统,其包括数据收集单元、预后风险评分单元和预测单元;
数据收集单元用于收集患者的样本,测定其基因表达值,其中基因为前述的评估基因集中的18个基因;
预后风险评分单元用于根据18个基因的表达值数据计算风险评分,其中风险评分的计算公式如下:
其中,Coefi为系数,xi为所选基因经过z-score变换后的相对表达值;
预测单元用于根据患者的风险评分来预测患者的预后情况,患者的风险评分越低,则预后情况越好。
作为本发明的另一种具体实施方式,若风险评分大于等于0,则预后风险为高风险,若风险评分小于0,则预后风险为低风险。
作为本发明的另一种具体实施方式,确定18个基因的系数,将风险评分的计算公式展开为:
Risk score=expr(LGALS1)×(1.54e-1)+expr(DLL3)×(-4.82e-2)+expr(ZFPM2)×(6.83e-2)+expr(LHX6)×(2.79e-2)+expr(MXRA5)×(-1.11e-2)+expr(TMEM56)×(-1.18e-2)+expr(CCL23)×(1.13e-2)+expr(FAM155B)×(3.08e-2)+expr(ZSCAN4)×(1.19e-2)+expr(PCDHB12)×(-1.82e-2)+expr(PRINS)×(-6.59e-2)+expr(FOXL1)×(-1.39e-3)+expr(ASTN1)×(-6.39e-3)+expr(HMX2)×(6.38e-2)+expr(HRASLS)×(4.28e-2)。
本发明的第四目的是检测基因表达水平的试剂在制备用于预测急性髓细胞白血病患者预后试剂盒或系统中的应用,其中,试剂盒前述的用于预测急性髓细胞白血病患者预后的试剂盒,系统为前述的用于预测急性髓细胞白血病患者预后的系统。
本发明具备以下有益效果:
本发明基于TCGA数据库(TCGA-LAML)、GEO数据库(GSE71014)和TARGET数据库(TARGET-AML)中获取AML病例的基因表达谱及相应的临床信息,基于铁死亡相关聚类的差异表达基因,将TCGA队列中的患者分为两组并筛选了两组之间的差异表达基因,根据基因表达值得到预测急性髓系白血病预后的评估基因集,能够更加可靠地应用于临床实践,为急性髓细胞白血病患者提供疾病诊断及预后的新方法。
下面结合附图对本发明作进一步的详细说明。
附图说明
图1是本发明的流程示意图;
图2是基于铁死亡相关基因的AML分类;
其中2A根据共识矩阵的最佳AML分类(k=2),2B两种亚型的Kaplan-Meier生存分析,2C两种亚型间显著表达的的铁死亡相关基因热图,2D基于铁死亡基因的样本分布的PCA分析;
图3是LASSO变量筛选过程;
图4是LASSO回归选择18个预后基因建立预后模型;
图5是AML患者的风险评分分布;
图6是基于风险评分的患者状态;
图7是训练集(TCGA-LAML数据集)中两个风险评分组的Kaplan-Meier生存曲线;
图8是训练集(TCGA-LAML数据集)的ROC曲线,其3年总生存率的AUC为0.827;
图9是验证集1(GSE71014)中两个风险评分组的Kaplan-Meier生存曲线;
图10是验证集1(GSE71014)的ROC曲线,其3年总生存率的AUC为0.621;
图11是验证集2(TARGET-AML)中两个风险评分组的Kaplan-Meier生存曲线;
图12是验证集2(TARGET-AML)的ROC曲线,其7年总生存率的AUC为为0.741;
图13显示了TCGA队列中临床病理特征、风险评分和预后价值之间的相关性;
其中13A是临床病理因素及风险评分的单因素分析,13B是临床病理因素及风险评分的多因素分析,13C是18个标记基因与临床病理特征相关性的热图,13D是ROC曲线显示风险评分、年龄和1/2等级对生存率预测效果,13E是ROC曲线显示风险评分、年龄、1/2类对AML风险分组的预测作用;
图14显示了风险评分与临床特征之间的关系;
图15是TCGA-LAML的列线图;
其中15A是列线图预测AML患者3年和5年的总生存期,15B是列线图对应3年的校准曲线,15C是列线图对应5年的校准曲线;
图16是预后模型的免疫浸润水平;
其中16A是危险基因与不同免疫浸润细胞类型的相关性,16B是高危组和低危组LGALS1表达与免疫浸润水平的相关性,16C、16D、16F分别是风险评分与B细胞、单核细胞、静息肥大细胞、/>CD4+T细胞的相关性;
图17显示了预后模型的突变状态;
其中17A显示了低高危组突变状态,17B显示了高危组突变状态;
图18是三个风险基因的体外验证;
其中18A是LGALS1,18B是ZFPM2,18C是TMEM56 mRNA在正常和AML样本中的表达水平。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不限于下面公开的具体实施例的限制。
实施例1
数据收集
从TCGA数据库(https://portal.gdc.cancer.gov/)中下载151例AML患者的RNA测序(RNA-seq)数据及相应的临床数据作为训练集。
从GEO数据库(https://www.ncbi.nlm.nih.gov/gds/)中下载104个AML样本作为验证集1。
从TARGET数据库(https://ocg.cancer.gov/programs/target)下载155个AML样本作为验证集2。
采用“limma”R包对基因表达谱进行归一化处理。
同时从FerDb(http://www.zhounan.org/ferrdb)并结合已知数据中收集了261个与铁死亡相关的基因(FRGs)。
基于铁死亡相关基因的共识聚类分析
首先,关于铁死亡相关基因集的AML分类如图2所示,发明人从TCGA数据库中提取AML患者的RNA-seq数据和相应的临床信息(n=151),基于261个FRGs,发明人对所有AML样本进行了一致性聚类分析;当类别编号K=2时,AML样本可以很好地分为第一组和第二组(如图2A所示),两组患者的Kaplan-Meier生存曲线显示,第二组级AML患者的生存期优于第一组级AML患者(Log-rank,P=0.024,图2B)。图2C是从两组之间表达差异显著的铁死亡相关基因的热图,基于铁死亡相关基因分类的样本分布主成分分析图(PCA)显示出良好的聚类质量(如图2D所示)。
本实施例中使用“ConsensusClusterPlus”R软件包将TCGA数据库中的AML患者按261个FRGs分为不同的组,然后使用“survival”R软件包执行不同组间的Kaplan-Meier总体生存曲线。
采用主成分分析(PCA)对样本进行聚类分析。
用“DESeq2”R包筛选不同聚类间的差异表达基因(|logFC|>1.5,FDR<0.05),通过基因本体论(GO)富集分析和京都基因与基因组百科全书(KEGG)分析,选择和可视化显著富集的铁死亡相关GO术语和KEGG通路。
构建与验证基于铁死亡相关聚类的差异表达基因的预后风险评分模型
为了筛出预后相关基因(P<0.05),发明人对这些差异基因进行单因素Cox回归分析,如图3所示,287个差异表达基因(DEGs)与患者生存显著相关(P<0.05),应用LASSO回归去除多余冗杂的预后相关基因,最终选取权重值不为0的18个基因作为最终的评估基因集,由此建立多风险预测模型如图4所示,进行预测患者预后。
其中18个基因具体是ZNF560、ZSCAN4、LHX6、TWIST1、FOXL1、ZFPM2、HMX2、ASTN1、DLL3、PCDHB12、PRINS、TMEM56、HRASLS、FAM155B、CCL23、LGALS1、EFNB3和MXRA5,其相应的权重系数见附图4。
按照以下公式计算风险评分:
其中,Coefi为系数,xi为所选基因经过z-score变换后的相对表达值,n为评估基因集中的基因个数,本发明中n为18。
风险评分公式展开为:
Risk score=expr(LGALS1)×(1.54e-1)+expr(DLL3)×(-4.82e-2)+expr(ZFPM2)×(6.83e-2)+expr(LHX6)×(2.79e-2)+expr(MXRA5)×(-1.11e-2)+expr(TMEM56)×(-1.18e-2)+expr(CCL23)×(1.13e-2)+expr(FAM155B)×(3.08e-2)+expr(ZSCAN4)×(1.19e-2)+expr(PCDHB12)×(-1.82e-2)+expr(PRINS)×(-6.59e-2)+expr(FOXL1)×(-1.39e-3)+expr(ASTN1)×(-6.39e-3)+expr(HMX2)×(6.38e-2)+expr(HRASLS)×(4.28e-2)。
验证模型准确性
构建风险模型后,根据风险评分将来自TCGA队列的AML样本分为高风险组、低风险组,如图5所示,其中若风险评分大于等于0,则预后风险为高风险,若风险评分小于0,则预后风险为低风险,相应的,图6示出了基于风险评分的患者状态。
使用“survival”和“survminer”R包比较两组患者的生存差异,采用“time-ROC”R软件包进行1年、3年和5年受试者特征曲线(ROC)分析,采用GEO数据库(GSE71014)和TARGET数据库(TARGET-AML)中的其他AML队列进行验证,进行同样的风险评分计算、风险亚组分型、生存分析和ROC曲线分析。
本实施例中所有数据采用R软件进行分析,P≤0.05为差异有统计学意义。
图7示出了训练集(TCGA-LAML数据集)中两个风险评分组的Kaplan-Meier生存曲线,从中可以看出,相较于高危险组,低危险组的生存情况更好;同时如图8所示,训练集第1、3、5年的生存期预后模型的ROC曲线下面积(AUC)分别是0.81、0.827和0.786。
作为验证集1,图9示出了验证集1(GEO数据库(GSE71014))中两个风险评分组的Kaplan-Meier生存曲线,从中可以看出,从中可以看出,相较于高危险组,低危险组的生存情况更好;同时如图10所示,验证集1中第1、3、5年生存期的预后模型的AUC值分别是0.587、0.621和0.576。
作为验证集2,图11示出了验证集2(TARGET数据库(TARGET-AML))中两个风险评分组的Kaplan-Meier生存曲线,从中可以看出,从中可以看出,相较于高危险组,低危险组的生存情况更好;同时如图12所示,验证集2中第3、5、7年生存期的预后模型的AUC值分别是0.657、0.655和0.741。
以上结果表明,在验证集1和验证集2中,本发明的预测模型对预测患者预后均有较好的效果。
相应的,本实施例中在构建预后模型之后,还可以进行高低评分浸润差异分析、高低风险组铁死亡因子突变分析和风险评分预测化疗反应等,如图1所示。
进一步的,本实施例还进行有如下过程:
预后风险评分模型的预后分析
为了进一步探讨临床病理特征与AML患者预后之间的关系,发明人从TCGA队列中提取临床数据,这些变量包括AML风险类别、年龄、性别、种族、类别和风险评分,并且进行了单因素和多因素Cox回归分析以确定独立的预后因素。
具体的,为进一步获取预后风险评分模型的临床价值,对TCGA队列进行了单因素和多因素Cox回归分析,在单变量Cox分析中,AML风险类别、年龄、Class和风险评分与AML患者预后显著相关(P值分别为P=0.00069,P=2×10-5,P=0.028,P=2.1×10-16,图13A)。多因素Cox回归分析结果显示,年龄和风险评分是影响AML患者预后的独立危险因素(P值分别为P=0.011,P<0.0001,图13B)。此外,图13C为18个风险基因与临床病理特征之间的相关性热图。接下来,我们对这些因素进行ROC分析,AUC值的结果表明与其他因素相比(AUC值均<0.7),风险评分可以显著预测总生存期和AML风险类别(AUC值分别是0.824,0.768,图13D、13E);同时还确定了风险评分与病理特征之间的相关性,根据上述结果可知,本实施例中风险评分与AML风险类别、年龄、类别和状态显著相关(所有P<0.05,图14)。
预测列线图的建立
通过“rms”R包构建nomogram预后图来显示变量与预后模型之间的关系,用3年和5年的校准曲线来评估列线图的准度;为了更好地说明风险评分在AML发展中的作用,发明人还分析了我们的风险评分与不同临床特征(AML风险类别、年龄、类别和状态)之间的关系。
具体的,在TCGA队列中,最终选择AML风险类别、年龄、性别、种族、类别和风险评分建立准确的预测列线图(图15A),计算得到的C指数为0.789,3年和5年总生存期的校准曲线与Platt校准曲线无偏差,表明列线图的预测精度较高(图15B、15C)。
预后模型与免疫浸润的相关性
利用CIBERSORT算法进行免疫浸润分析,评估高风险基因表达组、低风险基因表达组之间不同类型的免疫细胞表达;采用R包“ggstatsplot”分析风险评分与免疫细胞组分(CD4+T细胞、单核细胞、M2巨噬细胞、静息肥大细胞)的线性相关性,多基因相关图以R包“pheatmap”显示。
具体的,图16A为18个风险基因与22个免疫浸润细胞的关系热图;值得注意的是,LGALS1与免疫活性的相关性最为显著。低危险组中,B细胞、嗜酸性粒细胞、静息肥大细胞、静息自然杀伤细胞、/>CD4+T细胞和gamma deltaT细胞的LGALS1表达水平显著高于高危险组,而记忆B细胞、M2巨噬细胞和单核细胞中的LGALS1表达水平则相反(P<0.05,图16B)。此外,风险评分与/>B细胞、静息肥大细胞和naiveCD4+T细胞呈负相关(R=-0.26,P=0.0155;R=-0.47,P=2×10-7;R=-0.38,P=6.63×10-5,图16C、16E、16F);随着风险评分的增加,单核细胞比例呈线性增加(R=0.59,P=2.09×10-12,图16D)。
预后模型的突变分布
从TCGA数据库中获取AML的突变数据,使用R包“maftools”可视化高危险组和低危险组之间的体细胞突变。
发明人通过比较了两个风险组之间的突变模式,发现了差异,具体为高危组KRAS(25%vs 12.5%)和TP53(25%vs 12.5%)的突变频率高于低风险组,并且突变类型在两个风险组中都是错义变异(图17A、17B)。
验证风险基因
发明人利用24份新鲜或冰冻的AML新生骨髓和外周血标本,通过qPCR检测AML原代细胞中几种危险基因的表达,并与10例正常病例进行比较,如图18A-C所示,ZFPM2在两组间的表达水平无差异(P=0.3646),而LGALS1和TMEM56在AML样本中的表达水平明显低于正常样本(均P<0.05)。
虽然本发明以较佳实施例揭露如上,但并非用以限定本发明实施的范围。任何本领域的普通技术人员,在不脱离本发明的发明范围内,当可作些许的改进,即凡是依照本发明所做的同等改进,应为本发明的范围所涵盖。
Claims (6)
1.用于预测急性髓细胞白血病患者预后的评估基因集,其特征在于,所述评估基因集为基于铁死亡相关聚类的差异表达基因集,其包括18个基因,18个基因为ZNF560、ZSCAN4、LHX6、TWIST1、FOXL1、ZFPM2、HMX2、ASTN1、DLL3、PCDHB12、PRINS、TMEM56、HRASLS、FAM155B、CCL23、LGALS1、EFNB3和MXRA5。
2.用于预测急性髓细胞白血病患者预后的试剂盒,其特征在于,其包括检测权利要求1所述评估基因集中18个基因表达水平的试剂。
3.用于预测急性髓细胞白血病患者预后的系统,其特征在于,包括数据收集单元、预后风险评分单元和预测单元;
数据收集单元用于收集患者的样本,测定其基因表达值,其中基因为权利要求1所述的评估基因集中的18个基因;
预后风险评分单元用于根据18个基因的表达值数据计算风险评分,其中风险评分的计算公式如下:
其中,Coefi为系数,xi为所选基因经过z-score变换后的相对表达值;
预测单元用于根据患者的风险评分来预测患者的预后情况,患者的风险评分越低,则预后情况越好。
4.如权利要求3所述的用于预测急性髓细胞白血病患者预后的系统,其特征在于,若风险评分大于等于0,则预后风险为高风险,若风险评分小于0,则预后风险为低风险。
5.如权利要求3所述的用于预测急性髓细胞白血病患者预后的系统,其特征在于,确定18个基因的系数,将风险评分的计算公式展开为:
Risk score=expr(LGALS1)×(1.54e-1)+expr(DLL3)×(-4.82e-2)+expr(ZFPM2)×(6.83e-2)+expr(LHX6)×(2.79e-2)+expr(MXRA5)×(-1.11e-2)+expr(TMEM56)×(-1.18e-2)+expr(CCL23)×(1.13e-2)+expr(FAM155B)×(3.08e-2)+expr(ZSCAN4)×(1.19e-2)+expr(PCDHB12)×(-1.82e-2)+expr(PRINS)×(-6.59e-2)+expr(FOXL1)×(-1.39e-3)+expr(ASTN1)×(-6.39e-3)+expr(HMX2)×(6.38e-2)+expr(HRASLS)×(4.28e-2)。
6.检测基因表达水平的试剂在制备用于预测急性髓细胞白血病患者预后试剂盒或系统中的应用,其中,试剂盒为权利要求2所述的用于预测急性髓细胞白血病患者预后的试剂盒,系统为权利要求3-5任一项所述的用于预测急性髓细胞白血病患者预后的系统。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111679341.2A CN114317532B (zh) | 2021-12-31 | 2021-12-31 | 用于预测白血病预后的评估基因集、试剂盒、系统及应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111679341.2A CN114317532B (zh) | 2021-12-31 | 2021-12-31 | 用于预测白血病预后的评估基因集、试剂盒、系统及应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114317532A CN114317532A (zh) | 2022-04-12 |
CN114317532B true CN114317532B (zh) | 2024-01-19 |
Family
ID=81023436
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111679341.2A Active CN114317532B (zh) | 2021-12-31 | 2021-12-31 | 用于预测白血病预后的评估基因集、试剂盒、系统及应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114317532B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114645088B (zh) * | 2022-04-22 | 2023-12-15 | 广东省人民医院 | 克罗恩病进展风险相关评估基因集、试剂盒、应用和系统 |
CN116564421B (zh) * | 2023-06-08 | 2024-01-30 | 苏州卫生职业技术学院 | 一种急性髓系白血病患者铜死亡相关预后模型构建方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007037611A1 (en) * | 2005-09-27 | 2007-04-05 | Digital Genomics Inc. | Markers for predicting the response of a patient with acute myeloid leukemia to anti-cancer drugs |
CN106250717A (zh) * | 2015-06-04 | 2016-12-21 | 徐勇 | 急性髓性白血病的miRNA与转录因子模型及其构建方法和应用 |
CN108424969A (zh) * | 2018-06-06 | 2018-08-21 | 深圳市颐康生物科技有限公司 | 一种生物标志物、诊断或预估死亡风险的方法 |
CN112831562A (zh) * | 2021-01-25 | 2021-05-25 | 浙江科技学院 | 一种用于预测肝癌患者切除术后复发风险的生物标志物组合、试剂盒 |
CN113234829A (zh) * | 2021-06-23 | 2021-08-10 | 至本医疗科技(上海)有限公司 | 结肠癌预后评估基因集及其构建方法 |
CN113355426A (zh) * | 2021-08-11 | 2021-09-07 | 至本医疗科技(上海)有限公司 | 用于预测肝癌预后的评估基因集及试剂盒 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060141504A1 (en) * | 2004-11-23 | 2006-06-29 | Willman Cheryl L | Molecular technologies for improved risk classification and therapy for acute lymphoblastic leukemia in children and adults |
-
2021
- 2021-12-31 CN CN202111679341.2A patent/CN114317532B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007037611A1 (en) * | 2005-09-27 | 2007-04-05 | Digital Genomics Inc. | Markers for predicting the response of a patient with acute myeloid leukemia to anti-cancer drugs |
CN101326290A (zh) * | 2005-09-27 | 2008-12-17 | 数字基因组学株式会社 | 用于预测急性髓系白血病病人对抗癌药物应答的标记物 |
CN106250717A (zh) * | 2015-06-04 | 2016-12-21 | 徐勇 | 急性髓性白血病的miRNA与转录因子模型及其构建方法和应用 |
CN108424969A (zh) * | 2018-06-06 | 2018-08-21 | 深圳市颐康生物科技有限公司 | 一种生物标志物、诊断或预估死亡风险的方法 |
CN112831562A (zh) * | 2021-01-25 | 2021-05-25 | 浙江科技学院 | 一种用于预测肝癌患者切除术后复发风险的生物标志物组合、试剂盒 |
CN113234829A (zh) * | 2021-06-23 | 2021-08-10 | 至本医疗科技(上海)有限公司 | 结肠癌预后评估基因集及其构建方法 |
CN113355426A (zh) * | 2021-08-11 | 2021-09-07 | 至本医疗科技(上海)有限公司 | 用于预测肝癌预后的评估基因集及试剂盒 |
Non-Patent Citations (2)
Title |
---|
miR-186在急性髓系白血病中的表达及其临床意义;陈颖;李空飞;叶佩佩;陈哲;金敏威;李纪鹏;;中国卫生检验杂志(第21期);全文 * |
Nanog高表达可能是急性髓系白血病预后较好的生物标志;周娇;汤茜;张静;周凌宇;翟玲玲;易云云;易晶;林江;钱军;邓兆群;;江苏大学学报(医学版)(第03期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN114317532A (zh) | 2022-04-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230295738A1 (en) | Systems and methods for detection of residual disease | |
CN114317532B (zh) | 用于预测白血病预后的评估基因集、试剂盒、系统及应用 | |
Milanez-Almeida et al. | Cancer prognosis with shallow tumor RNA sequencing | |
CN110577998A (zh) | 预测肝癌术后早期复发风险分子模型的构建及其应用评估 | |
CN110580956A (zh) | 一组肝癌预后标志物及其应用 | |
EP2812693A1 (en) | A multi-biomarker-based outcome risk stratification model for pediatric septic shock | |
US20220170909A1 (en) | Radiomic signature for predicting lung cancer immunotherapy response | |
CN114317757A (zh) | 用于预测胰腺癌预后的评估基因集、试剂盒、应用及系统 | |
CN114360721A (zh) | 代谢相关子宫内膜癌的预后模型及构建方法 | |
CN113345592B (zh) | 一种急性髓细胞样白血病预后风险模型的构建及诊断设备 | |
CN111471773A (zh) | 预测胃腺癌患者预后的诊断生物标记物及其确定方法、应用 | |
CN117038092A (zh) | 基于Cox回归分析的胰腺癌的预后模型构建方法 | |
CN113782087B (zh) | 一种慢性淋巴细胞白血病sscr风险模型及其建立方法和应用 | |
CN116469552A (zh) | 一种用于乳腺癌多基因遗传风险评估的方法和系统 | |
Rezk et al. | Biomarker screening in preeclampsia: an RNA-sequencing approach based on data from multiple studies | |
CN114898874A (zh) | 一种肾透明细胞癌患者预后预测方法及系统 | |
CN111518882B (zh) | 通过分子标志物辨识激素性股骨头坏死的中医证型的系统 | |
CN117476097B (zh) | 一种基于三级淋巴结构特征基因的结直肠癌预后和治疗反应预测模型及其构建方法和应用 | |
Li et al. | Comprehensive analysis of autoimmune-related genes in amyotrophic lateral sclerosis from the perspective of 3P medicine | |
Wong et al. | Regional and bilateral MRI and gene signatures in facioscapulohumeral dystrophy: implications for clinical trial design and mechanisms of disease progression | |
Liu et al. | Differentially expressed mutant genes reveal potential prognostic markers for lung adenocarcinoma | |
WO2023246808A1 (zh) | 利用癌症中剪接异常的短外显子辅助癌症诊断和预后 | |
CN115074446B (zh) | 检测样本中40种生物标志物的表达水平的试剂在制备用于评估结直肠癌风险的试剂盒应用 | |
WO2023102786A1 (zh) | 基因标志物在预测孕妇早产风险中的应用 | |
US20240043935A1 (en) | Epigenetics analysis of cell-free dna |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |