CN109913549B - 基于cdc20基因共表达网络的胶质瘤分子分型及应用 - Google Patents
基于cdc20基因共表达网络的胶质瘤分子分型及应用 Download PDFInfo
- Publication number
- CN109913549B CN109913549B CN201910171388.4A CN201910171388A CN109913549B CN 109913549 B CN109913549 B CN 109913549B CN 201910171388 A CN201910171388 A CN 201910171388A CN 109913549 B CN109913549 B CN 109913549B
- Authority
- CN
- China
- Prior art keywords
- tfk
- cdc20
- gene
- group
- glioma
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
Abstract
本发明公开了一种基于CDC20基因共表达网络的胶质瘤分子分型及应用。本发明提供了用于检测胶质瘤患者的CDC20‑M基因群和CREBRF‑M基因群中各基因表达的物质在制备评估胶质瘤患者预后风险的产品中的应用;所述CDC20‑M基因群由139个基因组成,所述CREBRF‑M基因群由120个基因组成。本申请证明了CDC20‑M是胶质瘤中较差预后的敏感标志物。
Description
技术领域
本发明涉及生物技术领域,具体涉及一种基于CDC20基因共表达网络的胶质瘤分子分型及应用。
背景技术
胶质母细胞瘤(Glioblastomas,GBM)为成人中枢神经系统最常见的原发恶性肿瘤,占比超过50%。虽然已经有非常多的研究探究胶质母细胞瘤的发生原因以及可行的治疗方案,但是患有胶质母细胞瘤的病人生存期仍旧非常短,中位生存期只有不到两年。胶质母细胞瘤处于一种持续进化的过程,具有复杂的细胞学及遗传学异质性。胶质母细胞瘤的基因组包含许多的单核苷酸变异,也具有染色体不稳定性(Chromosomal instability,CIN)的特征,有研究发现胶质母细胞瘤细胞存在高频率的异常染色体数目事件(非整倍体)以及染色体结构变异事件。这些基因组不稳定性(Genomic instability,GI)的事件会使得每一个胶质母细胞瘤细胞产生新的克隆变异,驱动胶质瘤的进化发展,使得胶质母细胞瘤可以对各种常规治疗方案产生耐受。
胶质母细胞瘤和低等级胶质瘤可能分别起源于神经干细胞(Neural stem cells,NSCs)和祖细胞(Neural progenitor cells,NPCs)。在神经干细胞及祖细胞中,调控染色体分离的机制对于调节这类细胞自我更新以及分化是极为重要的。包括ASPM、NDE1、CEP120、CENPF以及TACCs在内的调节中心体和微管功能的基因出现异常,会导致新皮层发育阶段神经祖细胞库的细胞命运决定以及分化过程出现严重的错误。另外,已经有很多优秀的研究者对胶质瘤中基因组不稳定性的产生以及影响进行了深入的研究。Singh等人发现在不到5%的胶质母细胞瘤中存在成纤维细胞生长因子受体(FGFR)基因与TACC基因之间的融合现象,而FGFR-TACC融合基因产生的后果是导致这群胶质瘤出现染色体不稳定性。美国癌症基因组图谱计划(The Cancer Genome Atlas,TCGA)也于最近发现在16%的胶质母细胞瘤与低等级胶质瘤中存在很多参与有丝分裂连接复合物功能相关基因(包括NIPBL和STAG2)的突变和拷贝数变异事件。Carter等人找到了一群与非整倍体具有相关性的基因群,命名为CIN70signature,这群基因在胶质瘤以及其他几种肿瘤中均能预测病人较差的预后。基于SNP 6.0数据平台,TCGA于近期发表了一篇研究中提出了一个与癌症中TP53突变和整体突变频率相关的分值计算方法,命名为非整倍体分数(Aneuploidy socre)。CIN70signature在九种常见肿瘤中能很好地将病人的预后水平分开。但是,CIN70signature也有其局限性,首先,CIN70signature不能特异的代表胶质瘤的情况,CIN70signature的建立整合了6种不同肿瘤的数据库,能得到各种肿瘤中具有共性的那些基因,但每种肿瘤均具有特异性,CIN70signature并不能完全代表胶质瘤中的基因组不稳定性;其次,CIN70signature不能完全代表基因组不稳定性,CIN70signature的建立基于文章作者提出的一个非整倍体分数的算法,使基因依据此算法得到的分数高低排序选取排名靠前的70个基因组成CIN70signature,而非整倍体只能代表染色体数目上存在异常的状态,目前认为此现象是由于染色体分裂异常导致的,而基因组不稳定性不仅包括染色体不稳定性,也包括基因位点的突变,所以CIN70signature并不能完全代表基因组不稳定性;最后,CIN70signature无法对某一个病人进行CIN70signature的分型后对其进行预后预测,CIN70signature对于病人预后的预测需要依靠包含大量病人样本的表达数据库,依据CIN70signature在数据库中的表达水平取中间值将病人分为高低两组后来比较两组之间的预后情况,不能对单个独立病例进行有效的预后检测。另外,虽然以上这些研究揭示了基因组不稳定性在胶质瘤病因学上的重要性,但对基因组不稳定性发生的原因机制以及标志物的研究还非常少。
发明内容
本发明的目的是提供一种基于CDC20基因共表达网络的胶质瘤分子分型及应用。
第一方面,本发明要求保护用于检测胶质瘤患者的CDC20-M基因群和CREBRF-M基因群中各基因表达的物质在制备评估胶质瘤患者预后风险的产品中的应用。
所述CDC20-M基因群由如下139个基因组成:ASF1B(55723)、ASPM(259266)、AURKA(6790)、AURKB(9212)、BIRC5(332)、BRCA1(672)、BUB1(699)、BUB1B(701)、BUD31(8896)、C11orf82(220042)、CASC5(57082)、CASP2(835)、CCNA2(890)、CCNB1(891)、CCNB2(9133)、CDC20(991)、CDC25A(993)、CDC45(8318)、CDC6(990)、CDCA2(157313)、CDCA3(83461)、CDCA7(83879)、CDCA7L(55536)、CDCA8(55143)、CDK1(983)、CDK2(1017)、CDKN2C(1031)、CDKN3(1033)、CENPA(1058)、CENPE(1062)、CENPF(1063)、CENPK(64105)、CENPN(55839)、CENPW(387103)、CEP55(55165)、CHEK1(1111)、CKAP2L(150468)、CKS2(1164)、DBF4(10926)、DDX39A(10212)、DEPDC1(55635)、DEPDC1B(55789)、DLGAP5(9787)、DNMT1(1786)、DSN1(79980)、DTL(51514)、DTYMK(1841)、E2F7(144455)、ECT2(1894)、EME1(146956)、ESPL1(9700)、FAM64A(54478)、FANCD2(2177)、FANCI(55215)、FBXO5(26271)、FOXM1(2305)、GAS2L3(283431)、GINS1(9837)、GINS2(51659)、GJC1(10052)、GPX7(2882)、GTF2IRD2(84163)、GTSE1(51512)、HJURP(55355)、HMGB2(3148)、HMMR(3161)、IGF2BP3(10643)、KIAA0101(9768)、KIF11(3832)、KIF14(9928)、KIF15(56992)、KIF20A(10112)、KIF23(9493)、KIF2C(11004)、KIF4A(24137)、KIFC1(3833)、KNTC1(9735)、KPNA2(3838)、LMNB1(4001)、LMNB2(84823)、LRR1(122769)、MAD2L1(4085)、MCM2(4171)、MCM3(4172)、MCM6(4175)、MCM8(84515)、MELK(9833)、MKI67(4288)、MLF1IP(79682)、MND1(84057)、MYBL2(4605)、NCAPG(64151)、NCAPG2(54892)、NCAPH(23397)、NDC80(10403)、NEK2(4751)、NRM(11270)、NUF2(83540)、NUSAP1(51203)、PARPBP(55010)、PBK(55872)、PCNA(5111)、PDIA4(9601)、POC1A(25886)、POLE2(5427)、PRC1(9055)、PTBP1(5725)、PTTG1(9232)、RACGAP1(29127)、RAE1(8480)、RBBP8(5932)、RFC2(5982)、RFC3(5983)、RFC4(5984)、RNASEH2A(10535)、RRM2(6241)、SGOL2(151246)、SHCBP1(79801)、SMC4(10051)、SNRPB(6628)、SPAG5(10615)、SPC24(147841)、STIL(6491)、TACC3(10460)、TCF3(6929)、TIMELESS(8914)、TK1(7083)、TMEM48(55706)、TOP2A(7153)、TPX2(22974)、TRIP13(9319)、TTK(7272)、TYMS(7298)、UBE2C(11065)、UBE2S(27338)、USP1(7398)、ZNF765(91661)、ZNF850(342892)、ZWINT(11130)。
所述CREBRF-M基因群由如下120个基因组成:ABLIM1(3983)、ACADSB(36)、ADARB2(105)、ADD3(120)、AKAP6(9472)、AKR1C1(1645)、ANKRD46(157567)、ARHGAP32(9743)、ATP6V1G2(534)、AVPI1(60370)、CAB39L(81617)、CBX7(23492)、CCDC85A(114800)、CDS2(8760)、CHIC1(53344)、CPEB3(22849)、CREBRF(153222)、CRY2(1408)、CRYZL1(9946)、DCUN1D5(84259)、DNAJC12(56521)、EIF1(10209)、EZH1(2145)、FAIM2(23017)、FBRSL1(57666)、FBXL20(84961)、FBXO9(26268)、FRY(10129)、FSTL5(56884)、GABARAPL1(23710)、GABBR1(2550)、GABRG1(2565)、GARNL3(84253)、GRAMD1B(57476)、GTDC1(79712)、GTF2H5(404672)、HDAC4(9759)、HERC1(8925)、HLF(3131)、HMGCLL1(54511)、IGIP(492311)、IKZF5(64376)、JMY(133746)、KSR2(283455)、MAGEE1(57692)、MAPK10(5602)、MINOS1(440574)、MKX(283078)、MLLT6(4302)、MXI1(4601)、MYCBP2(23077)、NALCN(259232)、NAP1L2(4674)、NAP1L3(4675)、NCAM1(4684)、NCOA2(10499)、NEBL(10529)、NEGR1(257194)、NR1D2(9975)、NTRK2(4915)、OIP5-AS1(729082)、PAPOLG(64895)、PCGF5(84333)、PELI3(246330)、PIAS1(8554)、PLA2G6(8398)、PLEKHM3(389072)、POU6F1(5463)、PPM1A(5494)、PPM1L(151742)、PPP1R12B(4660)、PPP1R3E(90673)、PPP1R3F(89801)、PURA(5813)、RAB11FIP2(22841)、RABGGTB(5876)、RELN(5649)、REPS2(9185)、RPL37(6167)、RPS6KA5(9252)、RUNDC3A(10900)、SCAMP1(9522)、SCAPER(49855)、SEC62(7095)、SERP2(387923)、SGSM1(129049)、SH3BGRL2(83699)、SKP1(6500)、SLC12A6(9990)、SLK(9748)、SPTAN1(6709)、TBRG1(84897)、TEF(7008)、TOM1L2(146691)、TTBK2(146057)、TUB(7275)、UQCRB(7381)、USP46(64854)、VPS13D(55187)、YPEL3(83719)、YPEL4(219539)、ZBTB4(57659)、ZBTB44(29068)、ZMYND11(10771)、ZNF540(163255)、ZRANB1(54764)、ADRBK2(157)、KIAA0240(23506)、LOC283588(283588)、AGXT2L1(64850)、LOC283713(283713)、SEPT8(23176)、KIAA0368(23392)、C7orf41(222166)、GABARAPL3(23766)、FAM190B(54462)、BZRAP1(9256)、KIAA1107(23285)、LOC157562(157562)、KIAA1377(57562)。
上述各基因后面的括号内数字为相应基因在NCBI网站上的gene ID。
第二方面,本发明要求保护用于检测胶质瘤患者的CDC20-M基因群和CREBRF-M基因群中各基因表达的物质在制备预测胶质瘤患者预后生存率的产品中的应用。所述CDC20-M基因群和所述CREBRF-M基因群分别由哪些基因组成具体见前文。
第三方面,本发明要求保护用于检测胶质瘤患者的CDC20-M基因群和CREBRF-M基因群中各基因表达的物质在制备预测胶质瘤患者预后生存期的产品中的应用。所述CDC20-M基因群和所述CREBRF-M基因群分别由哪些基因组成具体见前文。
第四方面,本发明要求保护用于检测胶质瘤患者的CDC20-M基因群和CREBRF-M基因群中各基因表达的物质和记载有检测方法的可读性载体在制备能够评估胶质瘤患者预后风险、预测胶质瘤患者预后生存率和/或预测胶质瘤患者预后生存期的产品中的应用。所述CDC20-M基因群和所述CREBRF-M基因群分别由哪些基因组成具体见前文。
所述检测方法可为方法A或方法B:
所述方法A为在待测胶质瘤患者群体内部比较预后风险、预后生存率和/或预后生存期的方法,具体可包括如下步骤:
(A1)用所述“用于检测胶质瘤患者的CDC20-M基因群和CREBRF-M基因群中各基因表达的物质”获得所述待测胶质瘤患者群体中每个样本的CDC20-M基因群和CREBRF-M基因群中各基因的表达量数据,并进行log2处理,得到各基因的log2后的表达量数据;
(A2)利用一致性聚类算法,根据步骤(A1)所得的各基因的log2后的表达量数据,将所述待测胶质瘤患者群体分为四组,CDC20-M high组、CDC20-M intermediate组、CREBRF-M intermediate组和CREBRF-M high组;
(A3)按照如下任一对预后风险、预后生存率和/或预后生存期进行评估:(a1)与属于CREBRF-M intermediate组和CREBRF-M high组的待测胶质瘤患者相比,属于CDC20-Mhigh组和CDC20-M intermediate组的待测胶质瘤患者的预后风险显著提高,预后生存率显著降低和/或预后生存期显著缩短;(a2)按照CDC20-M high组、CDC20-M intermediate组、CREBRF-M intermediate组和CREBRF-M high组的顺序排列,待测胶质瘤患者预后风险依次递减,预后生存率和/或预后生存期依次递增。
所述方法A适用于所述待测胶质瘤患者群体中的胶质瘤样本种类来源并非单一化的情况,如既有高等级胶质瘤也有低等级胶质瘤(高等级胶质瘤为WHO对胶质瘤的分级标准为Ⅳ级的胶质瘤;低等级胶质瘤为Ⅱ-Ⅲ级的胶质瘤。所以来源需要有涵盖Ⅱ-Ⅳ级的的胶质瘤)。在本发明的一个实施例中,所述待测胶质瘤患者群体来自于TCGA胶质瘤数据库,具体为该数据库中的381例胶质瘤样本(胶质母细胞瘤160例,星形胶质细胞瘤69例,少突胶质细胞瘤91例,少突星形细胞瘤60例,无形态学诊断1例)。
基于围绕中心点划分(Partitioning around medoid,PAM)的一致性聚类算法(Consensus Clustering)是一种非监督类学习算法,适用于任何随机聚类分析,能够有效地鉴定差异分子表达模式和分类。此算法集成于R包ConsensusClusterPlus。本发明中,基于CDC20-M以及CREBRF-M在胶质瘤TCGA训练集(即前文所述的381例胶质瘤样本)中的样本一致性聚类步骤如下:
1.生成CDC20-M及CREBRF-M所有基因在TCGA训练集中的log2表达量文件;
2.打开Rstudio,导入此文件:edata<-read.table("1中生成文件.txt",sep="\t",header=T);
3.edata.m<-apply(edata[,X:Y],2,scale);
4.library("ConsensusClusterPlus");
5.
results=ConsensusClusterPlus(edata.m,maxK=6,reps=1000,pItem=0.9,pFeature=1,title="TCGA_training",clusterAlg="pam",distance="euclidean",seed=1262118388.71279,plot="png",writeTable=T,verbose=1);
6.得到K=2-10共9种聚类结果,选取最终聚类结果的依据是一致性矩阵图(Consensus matrix plot)要足够干净,尽量少出现中间过渡色,并且对应的CDF曲线要接近平行(起点接近0,终点接近1)。基于以上原则最终选取K=4的分组结果,依据此分组将TCGA训练集样本分为四组:CDC20-M high,CDC20-M intermediate,CREBRF-Mintermediate以及CREBRF-M high。
所述方法B为对待测胶质瘤患者的预后风险和/或预后生存期进行独立样本预测的方法,具体可包括如下步骤:
(B1)按照包括如下步骤的方法建立胶质瘤患者分型模型:
b1)获得n个待测胶质瘤患者的所述CDC20-M基因群和所述CREBRF-M基因群中各基因的表达量数据,并进行log2处理,得到各基因log2后的表达量数据;
b2)利用一致性聚类算法,根据步骤b1)所得各基因的log2后的表达量数据,将所述n个待测胶质瘤患者分为四组,CDC20-M high组、CDC20-M intermediate组、CREBRF-Mintermediate组和CREBRF-M high组;
b3)针对每个分组,分别计算组内所述CDC20-M基因群和所述CREBRF-M基因群中各基因的平均表达量,所以对于每个分组而言都有139+120个成员的一套平均表达量,四个分组就有四套平均表达量,每一套平均表达量就叫做每组特异的表达模式(Centroid)。四个分组就有四个Centroid。至此获得所述胶质瘤患者分型模型。
其中,所述n个待测胶质瘤患者的胶质瘤样本种类来源并非单一化的情况,如既有高等级胶质瘤也有低等级胶质瘤(高等级胶质瘤为WHO对胶质瘤的分级标准为Ⅳ级的胶质瘤;低等级胶质瘤为Ⅱ-Ⅲ级的胶质瘤。所以来源需要有涵盖Ⅱ-Ⅳ级的的胶质瘤)。在本发明的一个实施例中,所述n个待测胶质瘤患者来自于TCGA胶质瘤数据库,具体为该数据库中的381例胶质瘤样本(胶质母细胞瘤160例,星形胶质细胞瘤69例,少突胶质细胞瘤91例,少突星形细胞瘤60例,无形态学诊断1例)。
(B2)用所述“用于检测胶质瘤患者的CDC20-M基因群和CREBRF-M基因群中各基因表达的物质”获得所述待测胶质瘤患者的CDC20-M基因群和CREBRF-M基因群中各基因的表达量数据,并进行log2处理,得到各基因log2后的表达量数据;
(B3)将步骤(B2)所得的各基因log2后的表达量数据与步骤(B1)所建立的胶质瘤患者分型模型中的4个Centroid进行斯皮尔曼相关性分析,相关程度最高的Centroid所在组即为所述待测胶质瘤患者所在的组别;
(B4)按照如下任一对预后风险和/或预后生存期进行评估:(c1)如果所述待测胶质瘤患者属于CDC20-M high组或者CDC20-M intermediate组,则所述待测胶质瘤患者的预后风险相对较高,和/或预后生存期相对较短;如果所述待测胶质瘤患者属于CREBRF-Mintermediate组或CREBRF-M high组,则所述待测胶质瘤患者的预后风险相对较低,和/或预后生存期相对较长。(c2)按照CDC20-M high组、CDC20-M intermediate组、CREBRF-Mintermediate组和CREBRF-M high组的顺序排列,所述待测胶质瘤患者预后风险依次递减,和/或预后生存期依次递增。
在所述方法B中,所谓“独立样本预测”是指确定单个胶质瘤患者属于四组中的哪一组,从而对其预后进行预测。
第五方面,本发明要求保护用于评估胶质瘤患者预后风险、预测胶质瘤患者预后生存率和/或预测胶质瘤患者预后生存期的产品。
本发明所提供的产品含有用于检测胶质瘤患者的CDC20-M基因群和CREBRF-M基因群中各基因表达的物质和记载有前文第四方面中所述检测方法(所述方法A或所述方法B)的可读性载体。所述CDC20-M基因群和所述CREBRF-M基因群分别由哪些基因组成具体见前文。
第六方面,本发明要求保护建立胶质瘤患者分型模型的方法。
本发明所提供的建立胶质瘤患者分型模型的方法包括前文第四方面中的步骤b1)至b3)。
第七方面,本发明要求保护一种对待测胶质瘤患者进行分型的方法。
本发明所提供的对待测胶质瘤患者进行分型的方法,包括前文第四方面中的步骤(B1)至(B4)。
第八方面,本发明要求保护用于评估胶质瘤患者预后风险、预测胶质瘤患者预后生存率和/或预测胶质瘤患者预后生存期的基因群组。
本发明所提供的基因群组由CDC20-M基因群和CREBRF-M基因群组成。所述CDC20-M基因群和所述CREBRF-M基因群分别由哪些基因组成具体见前文。
第九方面,本发明要求保护前文第六或第七方面中所述方法或第八方面中所述的基因群组在制备用于评估胶质瘤患者预后风险、预测胶质瘤患者预后生存率和/或预测胶质瘤患者预后生存期的产品中的应用。
第十方面,本发明要求保护CDC20-M基因群作为标志物在制备用于评估胶质瘤患者预后风险、预测胶质瘤患者预后生存率和/或预测胶质瘤患者预后生存期的产品中的应用。所述CDC20-M基因群由哪些基因组成具体见前文。
另外,本发明还要求保护前文第四方面中所述的检测方法(即所述方法A或所述方法B)。
本申请的发明人所在团队提出在神经祖细胞中参与维持基因组稳定性的基因群网络出现了异常之后,可能会成为导致胶质瘤基因组不稳定性的驱动因素的假说。因此,本申请的目标是发现一个在胶质瘤中的基因组不稳定性标志物,此标志物需要具有以下几个方面的特征:(1)具有维持基因组稳定性的功能,这种功能的激活或异常调节可能会导致基因组不稳定或与基因组不稳定性存在极强相关性;(2)能够预测胶质瘤病人预后水平;(3)包含有可能作为临床靶向用药的靶点;(4)能够应用于大部分的胶质瘤(甚至其他肿瘤)。
为了验证这个假说,本申请在来自不同国家的胶质瘤病人的表达数据库中进行了筛选,通过筛选与调节神经祖细胞发育、在染色体不稳定性中具有已知重要作用的基因作为种子基因,利用基因共表达分析在胶质瘤数据库中寻找到一群与CDC20(有丝分裂后期促进复合物APC的激活因子)共表达基因模块(CDC20-M)。CDC20-M的成员包括细胞增殖的主要调控因子以及参与DNA损伤修复和染色体分离的重要组成成员。本申请证明了CDC20-M是胶质瘤中较差预后的敏感标志物。
附图说明
图1为1TCGA训练集基于CDC20-M/CREBRF-M的分组及预后分析。A:TCGA训练集基于CDC20-M及CREBRF-M表达水平的一致性聚类结果,不同的分组形式(K=2-10)均进行了评估。图中显示最佳分组(K=4)时的一致性矩阵图。B:CDC20-M及CREBRF-M在TCGA训练集样本依据一致性聚类K=4的分组排序后的表达热图,热图下方标注每组中CDC20-M/CREBRF-M比值的平均值及标准差。C:生存曲线表示一致性聚类分组后TCGA训练集各组间的预后差异,CDC20-M high与CREBRF-M high病人间的风险比率在生存曲线下方标注。
图2为TCGA验证集及CGGA数据库基于独立样本预测分组及预后分析。A和C分别表示CDC20-M及CREBRF-M在CGGA数据库和TCGA验证集样本依据独立样本预测分析分组排序后的表达热图,热图下方标注每组中CDC20-M/CREBRF-M比值的平均值及标准差。B和D分别表示独立样本预测分析分组后CGGA数据库和TCGA验证集各组间的预后差异,CDC20-M high与CREBRF-M high病人间的风险比率在生存曲线下方标注。
具体实施方式
下述实施例中所使用的实验方法如无特殊说明,均为常规方法。
下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
实施例1、CDC20-M以及CREBRF-M基因共表达模块的建立
肿瘤的基因组不稳定性表现于肿瘤样本携带大量的动态变化的染色体异常和基因突变。不同的肿瘤样本可能携带不同的染色体异常和基因突变,而且,肿瘤可能在某个发展节点上积累了重要的基因组异常,然后其基因组保持相对稳定。因此,如何鉴定基因组不稳定的肿瘤样本成为本领域研究的关键问题。可行的策略之一是在典型样本中,筛选与染色体变异数量相关的基因表达谱。
为了筛选特异的在胶质瘤中与基因组不稳定性存在紧密相关性的基因群,本发明利用皮尔森相关性分析,取皮尔森相关系数(Pearson correlation coefficient,PCC)>70%为临界点,通过文献筛选,以已知的与神经祖细胞(neural progenitor cell,NPC)自我更新、细胞增殖、染色体分离及DNA损伤修复相关的基因为种子基因,在胶质瘤表达数据库中得到其各自的基因共表达网络。通过尝试不同的种子基因,最后得到调控细胞周期M期的调控因子CDC20为种子的基因共表达模块(CDC20-Module,CDC20-M)作为研究对象。CDC20-M成员来自于GSE4290胶质瘤表达数据库中与CDC20(探针:202870_s _at)表达相关性最高的185个探针(包含139个基因)。组成CDC20-M的共139个基因如下:ASF1B(55723)、ASPM(259266)、AURKA(6790)、AURKB(9212)、BIRC5(332)、BRCA1(672)、BUB1(699)、BUB1B(701)、BUD31(8896)、C11orf82(220042)、CASC5(57082)、CASP2(835)、CCNA2(890)、CCNB1(891)、CCNB2(9133)、CDC20(991)、CDC25A(993)、CDC45(8318)、CDC6(990)、CDCA2(157313)、CDCA3(83461)、CDCA7(83879)、CDCA7L(55536)、CDCA8(55143)、CDK1(983)、CDK2(1017)、CDKN2C(1031)、CDKN3(1033)、CENPA(1058)、CENPE(1062)、CENPF(1063)、CENPK(64105)、CENPN(55839)、CENPW(387103)、CEP55(55165)、CHEK1(1111)、CKAP2L(150468)、CKS2(1164)、DBF4(10926)、DDX39A(10212)、DEPDC1(55635)、DEPDC1B(55789)、DLGAP5(9787)、DNMT1(1786)、DSN1(79980)、DTL(51514)、DTYMK(1841)、E2F7(144455)、ECT2(1894)、EME1(146956)、ESPL1(9700)、FAM64A(54478)、FANCD2(2177)、FANCI(55215)、FBXO5(26271)、FOXM1(2305)、GAS2L3(283431)、GINS1(9837)、GINS2(51659)、GJC1(10052)、GPX7(2882)、GTF2IRD2(84163)、GTSE1(51512)、HJURP(55355)、HMGB2(3148)、HMMR(3161)、IGF2BP3(10643)、KIAA0101(9768)、KIF11(3832)、KIF14(9928)、KIF15(56992)、KIF20A(10112)、KIF23(9493)、KIF2C(11004)、KIF4A(24137)、KIFC1(3833)、KNTC1(9735)、KPNA2(3838)、LMNB1(4001)、LMNB2(84823)、LRR1(122769)、MAD2L1(4085)、MCM2(4171)、MCM3(4172)、MCM6(4175)、MCM8(84515)、MELK(9833)、MKI67(4288)、MLF1IP(79682)、MND1(84057)、MYBL2(4605)、NCAPG(64151)、NCAPG2(54892)、NCAPH(23397)、NDC80(10403)、NEK2(4751)、NRM(11270)、NUF2(83540)、NUSAP1(51203)、PARPBP(55010)、PBK(55872)、PCNA(5111)、PDIA4(9601)、POC1A(25886)、POLE2(5427)、PRC1(9055)、PTBP1(5725)、PTTG1(9232)、RACGAP1(29127)、RAE1(8480)、RBBP8(5932)、RFC2(5982)、RFC3(5983)、RFC4(5984)、RNASEH2A(10535)、RRM2(6241)、SGOL2(151246)、SHCBP1(79801)、SMC4(10051)、SNRPB(6628)、SPAG5(10615)、SPC24(147841)、STIL(6491)、TACC3(10460)、TCF3(6929)、TIMELESS(8914)、TK1(7083)、TMEM48(55706)、TOP2A(7153)、TPX2(22974)、TRIP13(9319)、TTK(7272)、TYMS(7298)、UBE2C(11065)、UBE2S(27338)、USP1(7398)、ZNF765(91661)、ZNF850(342892)、ZWINT(11130)。上述各基因后面的括号内数字为相应基因在NCBI网站上的gene ID。
CDC20-M的139个成员中有37个与CIN70signature是一样的,说明两个基因群间具有一定的共性,但是,将CIN70signature中的基因放入胶质瘤表达数据库中进行监督聚类分析发现,将q值(False discovery rate)设为0.01,p值为0.008时,已经筛选掉了大部分在各样本间表达差异无统计学意义的基因后,CIN70signature中仍旧有接近五分之一的基因与其他成员间没有共表达关系。这使得将胶质瘤样本按照CIN70signature的表达来分组是不准确的。综上所述,本发明将采用CDC20-M作为探究胶质瘤基因组不稳定性的研究对象。
在确定了CDC20-M之后,为了使分类能更加稳定,本发明在胶质瘤表达数据库中以CREBRF为种子基因筛选到120个与其共表达的基因(PCC>70%)组成的模块CREBRF基因共表达模块(CREBRF-Module,CREBRF-M)作为在胶质瘤中与CDC20-M表达趋势完全相反的对照来进行样本分类。CREBRF作为非折叠蛋白应答(unfolded protein response;UPR)的负调节因子在各种成熟组织中广泛表达,在来自不同国家的胶质瘤表达数据库中CREBRF-M均高表达于正常组织及低等级胶质瘤,而在高等级胶质瘤表达程度低,与CDC20-M的表达趋势完全相反。之后的胶质瘤表达数据库的分类结果均依据CDC20-M及CREBRF-M两组基因群的表达水平来确定。CREBRF-M成员来自于GSE4290胶质瘤表达数据库中与CREBRF(探针:225556_at)表达相关性最高的157个探针(包含120个基因)。组成CREBRF-M的共120个基因如下:ABLIM1(3983)、ACADSB(36)、ADARB2(105)、ADD3(120)、AKAP6(9472)、AKR1C1(1645)、ANKRD46(157567)、ARHGAP32(9743)、ATP6V1G2(534)、AVPI1(60370)、CAB39L(81617)、CBX7(23492)、CCDC85A(114800)、CDS2(8760)、CHIC1(53344)、CPEB3(22849)、CREBRF(153222)、CRY2(1408)、CRYZL1(9946)、DCUN1D5(84259)、DNAJC12(56521)、EIF1(10209)、EZH1(2145)、FAIM2(23017)、FBRSL1(57666)、FBXL20(84961)、FBXO9(26268)、FRY(10129)、FSTL5(56884)、GABARAPL1(23710)、GABBR1(2550)、GABRG1(2565)、GARNL3(84253)、GRAMD1B(57476)、GTDC1(79712)、GTF2H5(404672)、HDAC4(9759)、HERC1(8925)、HLF(3131)、HMGCLL1(54511)、IGIP(492311)、IKZF5(64376)、JMY(133746)、KSR2(283455)、MAGEE1(57692)、MAPK10(5602)、MINOS1(440574)、MKX(283078)、MLLT6(4302)、MXI1(4601)、MYCBP2(23077)、NALCN(259232)、NAP1L2(4674)、NAP1L3(4675)、NCAM1(4684)、NCOA2(10499)、NEBL(10529)、NEGR1(257194)、NR1D2(9975)、NTRK2(4915)、OIP5-AS1(729082)、PAPOLG(64895)、PCGF5(84333)、PELI3(246330)、PIAS1(8554)、PLA2G6(8398)、PLEKHM3(389072)、POU6F1(5463)、PPM1A(5494)、PPM1L(151742)、PPP1R12B(4660)、PPP1R3E(90673)、PPP1R3F(89801)、PURA(5813)、RAB11FIP2(22841)、RABGGTB(5876)、RELN(5649)、REPS2(9185)、RPL37(6167)、RPS6KA5(9252)、RUNDC3A(10900)、SCAMP1(9522)、SCAPER(49855)、SEC62(7095)、SERP2(387923)、SGSM1(129049)、SH3BGRL2(83699)、SKP1(6500)、SLC12A6(9990)、SLK(9748)、SPTAN1(6709)、TBRG1(84897)、TEF(7008)、TOM1L2(146691)、TTBK2(146057)、TUB(7275)、UQCRB(7381)、USP46(64854)、VPS13D(55187)、YPEL3(83719)、YPEL4(219539)、ZBTB4(57659)、ZBTB44(29068)、ZMYND11(10771)、ZNF540(163255)、ZRANB1(54764)、ADRBK2(157)、KIAA0240(23506)、LOC283588(283588)、AGXT2L1(64850)、LOC283713(283713)、SEPT8(23176)、KIAA0368(23392)、C7orf41(222166)、GABARAPL3(23766)、FAM190B(54462)、BZRAP1(9256)、KIAA1107(23285)、LOC157562(157562)、KIAA1377(57562)。上述各基因后面的括号内数字为相应基因在NCBI网站上的gene ID。
实施例2、CDC20-M与现有胶质瘤预后诊断标志物的比较
为了验证CDC20-M在胶质瘤发生发展过程中的作用,本发明首先分析了CDC20-M在胶质瘤病人预后诊断预测上的能力,探究CDC20-M是否具有将所有类型及等级的胶质瘤按照其预后差异区分开的能力。对于胶质瘤的预后诊断目前在临床上已有一些常用的标志物,如年龄、IDH1突变、染色体臂1p及19q共缺失以及Ki-67的蛋白表达水平,所以本发明将CDC20-M与这几个成熟的预后诊断标志物进行多因素cox回归分析比较,所使用到的数据库涵盖了来自欧洲、美国及中国的共1305例病人样本(Rembrandt、GSE16011、TCGA及CGGA数据库),结果如表1所示。可以发现,无论在哪个国家的数据库中,CDC20-M的风险比率(Hazardratio)相对于其他几个成熟的预后诊断标志物而言均更高,且是唯一一个同时在四个数据库中的结果均具有统计学意义的因素,这样的结果说明CDC20-M的表达预测预后的能力要比其他几个预后诊断因素更明显,且相对预后差异更大。年龄、IDH1突变、染色体臂1p及19q共缺失以及MKI67的表达均不能在四个数据库中稳定得到具有统计学意义的风险比率。而CIN70signature与常用预后诊断标志物的多因素cox回归分析得到的结果在GSE16011以及TCGA数据库中均不能作为一个独立的预后预测指标。CDC20-M另一个优势在于其风险比率在所有四个数据库的指标中均是最大的,意味着按照CDC20-M分组的病人,不同组间的生存期差异相较于其他指标而言最显著。以上结果说明,相对于现有的预后诊断标志物,CDC20-M在预后诊断预测上更加敏感,值得深入研究。
表1 CDC20-M与胶质瘤常规预后诊断标志物的多因素cox回归分析比较
注:表中的CDC20-M score表示CDC20-M成员的平均表达量,MKI67score表示表达蛋白Ki-67的基因MKI67的RNA表达水平。IDH1mutation及1p19q co-deletion这两个因素的风险比率(Hazard ratio)是以IDH1未突变及1p19q未同缺失的病人为参照得出。
为了建立一个稳定的CDC20-M/CREBRF-M分类标准,本发明以TCGA胶质瘤数据库中包含381个样本(胶质母细胞瘤160例,星形胶质细胞瘤69例,少突胶质细胞瘤91例,少突星形细胞瘤60例,无形态学诊断1例)的数据库作为训练集进行分类。选取TCGA数据库的依据是这个数据库是目前为止最权威的胶质瘤数据库平台,包含最全面的病人临床信息及表达、遗传学水平数据,以这个平台的样本作为训练集是最合适的。利用一致性聚类算法,TCGA训练集依照CDC20-M及CREBRF-M的表达水平(各基因表达量数据进行log2处理)分为了四组:CDC20-M high、CDC20-M intermediate、CREBRF-M intermediate以及CREBRF-M high组(图1中的A和B)。具体如下:
基于围绕中心点划分(Partitioning around medoid,PAM)的一致性聚类算法(Consensus Clustering)是一种非监督类学习算法,适用于任何随机聚类分析,能够有效地鉴定差异分子表达模式和分类。此算法集成于R包ConsensusClusterPlus。本发明基于CDC20-M以及CREBRF-M在胶质瘤TCGA训练集中的样本一致性聚类步骤如下:
1.生成CDC20-M及CREBRF-M所有基因在TCGA训练集中的log2表达量文件;
2.打开Rstudio,导入此文件:edata<-read.table("1中生成文件.txt",sep="\t",header=T);
3.edata.m<-apply(edata[,X:Y],2,scale);
4.library("ConsensusClusterPlus");
5.
results=ConsensusClusterPlus(edata.m,maxK=6,reps=1000,pItem=0.9,pFeature=1,title="TCGA_training",clusterAlg="pam",distance="euclidean",seed=1262118388.71279,plot="png",writeTable=T,verbose=1);
6.得到K=2-10共9种聚类结果,选取最终聚类结果的依据是一致性矩阵图(Consensus matrix plot)要足够干净,尽量少出现中间过渡色,并且对应的CDF曲线要接近平行(起点接近0,终点接近1)。基于以上原则最终选取K=4的分组结果,依据此分组将TCGA训练集样本分为四组:CDC20-M high,CDC20-M intermediate,CREBRF-Mintermediate以及CREBRF-M high。
与CDC20-M high和CDC20-M intermediate组相比,CREBRF-M high和CREBRF-Mintermediate组的病人具有更差的预后,CDC20-M high组与CREBRF-M high组病人间的风险比率为11.35,说明CDC20-M high组的病人相对CREBRF-M high组的病人死亡风险高出11.35倍(图1中的C)。CDC20-M分组与经典的形态学分类并不完全一致,每一个CDC20-M分组中均包含不同组织学分类的胶质瘤,CDC20-M high组病人年龄相对更大,而CREBRF-M high组病人ATRX和IDH1突变及1p19q共缺失现象发生得相对更多。以上结果说明,TCGA训练集采用一致性聚类算法得到的CDC20-M分类是独立于其他分组方式,可以很好地预测病人预后,也具有其特定的遗传学特征。
实施例3、基于CDC20-M及CREBRF-M的独立样本预测
在得到稳定的CDC20-M分组后,本发明以TCGA训练集为基础,利用独立样本预测分析方法对其他来源的胶质瘤病人样本进行分组。在TCGA训练集中,对每个CDC20-M分类的组,分别计算CDC20-M及CREBRF-M中每个成员的平均表达量,所以对于每个分组而言都有139+120个成员的一套平均表达量,四个分组就有四套平均表达量,每一套平均表达量就叫做每组特异的表达模式(Centroid)。四个分组就有四个Centroid。本发明后续得到了CGGA的319例胶质瘤样本(胶质母细胞瘤140例,星形胶质细胞瘤67例,少突胶质细胞瘤40例,少突星形细胞瘤72例)及新的TCGA301例低等级胶质瘤样本(星形胶质细胞瘤100例,少突胶质细胞瘤82例,少突星形细胞瘤54例,无形态学诊断低等级胶质瘤65例)(TCGA验证集),将新的每一个样本的CDC20-M及CREBRF-M的表达与centroid进行斯皮尔曼相关性分析,与其相关程度最高的centroid所在组即为此样本的组别。这样的独立样本预测分析方法的优势之一在于能保持不同来源样本的分组稳定性,且不受胶质瘤样本种类来源单一化的影响(如TCGA验证集中没有高等级胶质瘤,如果在此数据库内部做一致性聚类分析,则可能造成错误分组),并且也能将大数据分析转化为独立样本预测,使得CDC20-M分型具有了临床实际运用价值。将两个数据库的每个样本进行逐一分组后,分别对其进行了表达热图分析、病人预后分析(图2)。通过分析结果发现,在两个数据库中,依据独立样本预测分析得到的CDC20-M分组的不同组之间在年龄、形态学分类及遗传学特征上均与TCGA训练集得到的结果一致,值得关注的是,在TCGA验证集中CDC20-M high组的病人相对CREBRF-M high组的病人死亡风险高出700.8倍,而此验证集中的胶质瘤样本均为低等级胶质瘤,一般而言低等级胶质瘤预后均较好,但通过CDC20-M的表达能分离出一群具有极差预后的低等级胶质瘤病人,说明了CDC20-M在预后预测上的灵敏性显著优于目前临床使用的形态学分类。在TCGA训练集中用CIN70signature表达进行同样的一致性聚类分析得到CIN70high组以及CIN70low组,在TCGA验证集以及CGGA数据库中依照独立样本预测的方法同样得到CIN70high以及CIN70low两组样本,两组病人的预后虽然存在显著性差异,但是CIN70high组的病人相对CIN70low组的病人死亡风险差异没有CDC20-M分类显著。以上在新的两个数据库中进行的独立样本预测分析的结果进一步证明了CDC20-M分组稳定的分类情况、遗传学特征及预后预测能力。
综上结果所示,在胶质瘤中依据CDC20-M/CREBRF-M表达量进行的分组在来自不同国家的数据库中均是稳定的,CDC20-M的分组能很好地将属于同一组织学分类或其他分类方式的病人从预后水平上区分开,并且在所有数据库中的病人预后诊断预测上均优于常规经典的预后诊断预测参数,高表达的CDC20-M是病人预后差及病情快速进展的标志。
综合以上各实施例的结果,可知:CDC20-M是一个高度稳定的胶质瘤极差预后标志。本发明利用多因素cox回归分析,将CDC20-M平均表达量同其他现有胶质瘤预后诊断标志物(年龄、遗传学特征IDH1突变和1p19q共缺失以及MKI67表达)进行了比较发现只有CDC20-M在四个不同国家的胶质瘤数据库中能稳定而显著地预测病人较差的预后情况。即使是在同一个形态学分类或EM/PM分类的亚型胶质瘤中,CDC20-M的表达也能很好地区分不同预后的病人。结合在胶质瘤中与CDC20-M表达趋势相反的CREBRF-M的表达,可以将TCGA胶质瘤表达数据库病人稳定的分为四组,CDC20-M high的病人相对于CREBRF-M high的病人患病风险高出11.35倍。以上结果从各个方面都能很好地证明CDC20-M的预后预测能力。为了使得CDC20-M的分类能更稳定的在其他数据库及单个病人样本上应用,以CDC20-M和CREBRF-M在TCGA胶质瘤表达数据库中得到的Centroids为基准,将新的胶质瘤样本表达与其比对得到新的样本CDC20-M的分组,对此分组后的样本进行了整体的生存曲线分析。以上分析证明了CDC20-M的预后预测能力是十分稳定而精准的,同时使用CDC20-M和CREBRF-M的表达可以定义单个病人的分组情况,从而为临床应用提供了可能。
Claims (8)
1.用于检测胶质瘤患者的CDC20-M基因群和CREBRF-M基因群中各基因表达的物质在制备评估胶质瘤患者预后风险的产品中的应用;
所述CDC20-M基因群由如下139个基因组成:ASF1B、ASPM、AURKA、AURKB、BIRC5、BRCA1、BUB1、BUB1B、BUD31、C11orf82、CASC5、CASP2、CCNA2、CCNB1、CCNB2、CDC20、CDC25A、CDC45、CDC6、CDCA2、CDCA3、CDCA7、CDCA7L、CDCA8、CDK1、CDK2、CDKN2C、CDKN3、CENPA、CENPE、CENPF、CENPK、CENPN、CENPW、CEP55、CHEK1、CKAP2L、CKS2、DBF4、DDX39A、DEPDC1、DEPDC1B、DLGAP5、DNMT1、DSN1、DTL、DTYMK、E2F7、ECT2、EME1、ESPL1、FAM64A、FANCD2、FANCI、FBXO5、FOXM1、GAS2L3、GINS1、GINS2、GJC1、GPX7、GTF2IRD2、GTSE1、HJURP、HMGB2、HMMR、IGF2BP3、KIAA0101、KIF11、KIF14、KIF15、KIF20A、KIF23、KIF2C、KIF4A、KIFC1、KNTC1、KPNA2、LMNB1、LMNB2、LRR1、MAD2L1、MCM2、MCM3、MCM6、MCM8、MELK、MKI67、MLF1IP、MND1、MYBL2、NCAPG、NCAPG2、NCAPH、NDC80、NEK2、NRM、NUF2、NUSAP1、PARPBP、PBK、PCNA、PDIA4、POC1A、POLE2、PRC1、PTBP1、PTTG1、RACGAP1、RAE1、RBBP8、RFC2、RFC3、RFC4、RNASEH2A、RRM2、SGOL2、SHCBP1、SMC4、SNRPB、SPAG5、SPC24、STIL、TACC3、TCF3、TIMELESS、TK1、TMEM48、TOP2A、TPX2、TRIP13、TTK、TYMS、UBE2C、UBE2S、USP1、ZNF765、ZNF850、ZWINT;
所述CREBRF-M基因群由如下120个基因组成:ABLIM1、ACADSB、ADARB2、ADD3、AKAP6、AKR1C1、ANKRD46、ARHGAP32、ATP6V1G2、AVPI1、CAB39L、CBX7、CCDC85A、CDS2、CHIC1、CPEB3、CREBRF、CRY2、CRYZL1、DCUN1D5、DNAJC12、EIF1、EZH1、FAIM2、FBRSL1、FBXL20、FBXO9、FRY、FSTL5、GABARAPL1、GABBR1、GABRG1、GARNL3、GRAMD1B、GTDC1、GTF2H5、HDAC4、HERC1、HLF、HMGCLL1、IGIP、IKZF5、JMY、KSR2、MAGEE1、MAPK10、MINOS1、MKX、MLLT6、MXI1、MYCBP2、NALCN、NAP1L2、NAP1L3、NCAM1、NCOA2、NEBL、NEGR1、NR1D2、NTRK2、OIP5-AS1、PAPOLG、PCGF5、PELI3、PIAS1、PLA2G6、PLEKHM3、POU6F1、PPM1A、PPM1L、PPP1R12B、PPP1R3E、PPP1R3F、PURA、RAB11FIP2、RABGGTB、RELN、REPS2、RPL37、RPS6KA5、RUNDC3A、SCAMP1、SCAPER、SEC62、SERP2、SGSM1、SH3BGRL2、SKP1、SLC12A6、SLK、SPTAN1、TBRG1、TEF、TOM1L2、TTBK2、TUB、UQCRB、USP46、VPS13D、YPEL3、YPEL4、ZBTB4、ZBTB44、ZMYND11、ZNF540、ZRANB1、ADRBK2、KIAA0240、LOC283588、AGXT2L1、LOC283713、SEPT8、KIAA0368、C7orf41、GABARAPL3、FAM190B、BZRAP1、KIAA1107、LOC157562、KIAA1377。
2.用于检测胶质瘤患者的CDC20-M基因群和CREBRF-M基因群中各基因表达的物质在制备预测胶质瘤患者预后生存率的产品中的应用;
所述CDC20-M基因群由如下139个基因组成:ASF1B、ASPM、AURKA、AURKB、BIRC5、BRCA1、BUB1、BUB1B、BUD31、C11orf82、CASC5、CASP2、CCNA2、CCNB1、CCNB2、CDC20、CDC25A、CDC45、CDC6、CDCA2、CDCA3、CDCA7、CDCA7L、CDCA8、CDK1、CDK2、CDKN2C、CDKN3、CENPA、CENPE、CENPF、CENPK、CENPN、CENPW、CEP55、CHEK1、CKAP2L、CKS2、DBF4、DDX39A、DEPDC1、DEPDC1B、DLGAP5、DNMT1、DSN1、DTL、DTYMK、E2F7、ECT2、EME1、ESPL1、FAM64A、FANCD2、FANCI、FBXO5、FOXM1、GAS2L3、GINS1、GINS2、GJC1、GPX7、GTF2IRD2、GTSE1、HJURP、HMGB2、HMMR、IGF2BP3、KIAA0101、KIF11、KIF14、KIF15、KIF20A、KIF23、KIF2C、KIF4A、KIFC1、KNTC1、KPNA2、LMNB1、LMNB2、LRR1、MAD2L1、MCM2、MCM3、MCM6、MCM8、MELK、MKI67、MLF1IP、MND1、MYBL2、NCAPG、NCAPG2、NCAPH、NDC80、NEK2、NRM、NUF2、NUSAP1、PARPBP、PBK、PCNA、PDIA4、POC1A、POLE2、PRC1、PTBP1、PTTG1、RACGAP1、RAE1、RBBP8、RFC2、RFC3、RFC4、RNASEH2A、RRM2、SGOL2、SHCBP1、SMC4、SNRPB、SPAG5、SPC24、STIL、TACC3、TCF3、TIMELESS、TK1、TMEM48、TOP2A、TPX2、TRIP13、TTK、TYMS、UBE2C、UBE2S、USP1、ZNF765、ZNF850、ZWINT;
所述CREBRF-M基因群由如下120个基因组成:ABLIM1、ACADSB、ADARB2、ADD3、AKAP6、AKR1C1、ANKRD46、ARHGAP32、ATP6V1G2、AVPI1、CAB39L、CBX7、CCDC85A、CDS2、CHIC1、CPEB3、CREBRF、CRY2、CRYZL1、DCUN1D5、DNAJC12、EIF1、EZH1、FAIM2、FBRSL1、FBXL20、FBXO9、FRY、FSTL5、GABARAPL1、GABBR1、GABRG1、GARNL3、GRAMD1B、GTDC1、GTF2H5、HDAC4、HERC1、HLF、HMGCLL1、IGIP、IKZF5、JMY、KSR2、MAGEE1、MAPK10、MINOS1、MKX、MLLT6、MXI1、MYCBP2、NALCN、NAP1L2、NAP1L3、NCAM1、NCOA2、NEBL、NEGR1、NR1D2、NTRK2、OIP5-AS1、PAPOLG、PCGF5、PELI3、PIAS1、PLA2G6、PLEKHM3、POU6F1、PPM1A、PPM1L、PPP1R12B、PPP1R3E、PPP1R3F、PURA、RAB11FIP2、RABGGTB、RELN、REPS2、RPL37、RPS6KA5、RUNDC3A、SCAMP1、SCAPER、SEC62、SERP2、SGSM1、SH3BGRL2、SKP1、SLC12A6、SLK、SPTAN1、TBRG1、TEF、TOM1L2、TTBK2、TUB、UQCRB、USP46、VPS13D、YPEL3、YPEL4、ZBTB4、ZBTB44、ZMYND11、ZNF540、ZRANB1、ADRBK2、KIAA0240、LOC283588、AGXT2L1、LOC283713、SEPT8、KIAA0368、C7orf41、GABARAPL3、FAM190B、BZRAP1、KIAA1107、LOC157562、KIAA1377。
3.用于检测胶质瘤患者的CDC20-M基因群和CREBRF-M基因群中各基因表达的物质在制备预测胶质瘤患者预后生存期的产品中的应用;
所述CDC20-M基因群由如下139个基因组成:ASF1B、ASPM、AURKA、AURKB、BIRC5、BRCA1、BUB1、BUB1B、BUD31、C11orf82、CASC5、CASP2、CCNA2、CCNB1、CCNB2、CDC20、CDC25A、CDC45、CDC6、CDCA2、CDCA3、CDCA7、CDCA7L、CDCA8、CDK1、CDK2、CDKN2C、CDKN3、CENPA、CENPE、CENPF、CENPK、CENPN、CENPW、CEP55、CHEK1、CKAP2L、CKS2、DBF4、DDX39A、DEPDC1、DEPDC1B、DLGAP5、DNMT1、DSN1、DTL、DTYMK、E2F7、ECT2、EME1、ESPL1、FAM64A、FANCD2、FANCI、FBXO5、FOXM1、GAS2L3、GINS1、GINS2、GJC1、GPX7、GTF2IRD2、GTSE1、HJURP、HMGB2、HMMR、IGF2BP3、KIAA0101、KIF11、KIF14、KIF15、KIF20A、KIF23、KIF2C、KIF4A、KIFC1、KNTC1、KPNA2、LMNB1、LMNB2、LRR1、MAD2L1、MCM2、MCM3、MCM6、MCM8、MELK、MKI67、MLF1IP、MND1、MYBL2、NCAPG、NCAPG2、NCAPH、NDC80、NEK2、NRM、NUF2、NUSAP1、PARPBP、PBK、PCNA、PDIA4、POC1A、POLE2、PRC1、PTBP1、PTTG1、RACGAP1、RAE1、RBBP8、RFC2、RFC3、RFC4、RNASEH2A、RRM2、SGOL2、SHCBP1、SMC4、SNRPB、SPAG5、SPC24、STIL、TACC3、TCF3、TIMELESS、TK1、TMEM48、TOP2A、TPX2、TRIP13、TTK、TYMS、UBE2C、UBE2S、USP1、ZNF765、ZNF850、ZWINT;
所述CREBRF-M基因群由如下120个基因组成:ABLIM1、ACADSB、ADARB2、ADD3、AKAP6、AKR1C1、ANKRD46、ARHGAP32、ATP6V1G2、AVPI1、CAB39L、CBX7、CCDC85A、CDS2、CHIC1、CPEB3、CREBRF、CRY2、CRYZL1、DCUN1D5、DNAJC12、EIF1、EZH1、FAIM2、FBRSL1、FBXL20、FBXO9、FRY、FSTL5、GABARAPL1、GABBR1、GABRG1、GARNL3、GRAMD1B、GTDC1、GTF2H5、HDAC4、HERC1、HLF、HMGCLL1、IGIP、IKZF5、JMY、KSR2、MAGEE1、MAPK10、MINOS1、MKX、MLLT6、MXI1、MYCBP2、NALCN、NAP1L2、NAP1L3、NCAM1、NCOA2、NEBL、NEGR1、NR1D2、NTRK2、OIP5-AS1、PAPOLG、PCGF5、PELI3、PIAS1、PLA2G6、PLEKHM3、POU6F1、PPM1A、PPM1L、PPP1R12B、PPP1R3E、PPP1R3F、PURA、RAB11FIP2、RABGGTB、RELN、REPS2、RPL37、RPS6KA5、RUNDC3A、SCAMP1、SCAPER、SEC62、SERP2、SGSM1、SH3BGRL2、SKP1、SLC12A6、SLK、SPTAN1、TBRG1、TEF、TOM1L2、TTBK2、TUB、UQCRB、USP46、VPS13D、YPEL3、YPEL4、ZBTB4、ZBTB44、ZMYND11、ZNF540、ZRANB1、ADRBK2、KIAA0240、LOC283588、AGXT2L1、LOC283713、SEPT8、KIAA0368、C7orf41、GABARAPL3、FAM190B、BZRAP1、KIAA1107、LOC157562、KIAA1377。
4.用于检测胶质瘤患者的CDC20-M基因群和CREBRF-M基因群中各基因表达的物质和记载有检测方法的可读性载体在制备能够评估胶质瘤患者预后风险、预测胶质瘤患者预后生存率和/或预测胶质瘤患者预后生存期的产品中的应用;
所述CDC20-M基因群由如下139个基因组成:ASF1B、ASPM、AURKA、AURKB、BIRC5、BRCA1、BUB1、BUB1B、BUD31、C11orf82、CASC5、CASP2、CCNA2、CCNB1、CCNB2、CDC20、CDC25A、CDC45、CDC6、CDCA2、CDCA3、CDCA7、CDCA7L、CDCA8、CDK1、CDK2、CDKN2C、CDKN3、CENPA、CENPE、CENPF、CENPK、CENPN、CENPW、CEP55、CHEK1、CKAP2L、CKS2、DBF4、DDX39A、DEPDC1、DEPDC1B、DLGAP5、DNMT1、DSN1、DTL、DTYMK、E2F7、ECT2、EME1、ESPL1、FAM64A、FANCD2、FANCI、FBXO5、FOXM1、GAS2L3、GINS1、GINS2、GJC1、GPX7、GTF2IRD2、GTSE1、HJURP、HMGB2、HMMR、IGF2BP3、KIAA0101、KIF11、KIF14、KIF15、KIF20A、KIF23、KIF2C、KIF4A、KIFC1、KNTC1、KPNA2、LMNB1、LMNB2、LRR1、MAD2L1、MCM2、MCM3、MCM6、MCM8、MELK、MKI67、MLF1IP、MND1、MYBL2、NCAPG、NCAPG2、NCAPH、NDC80、NEK2、NRM、NUF2、NUSAP1、PARPBP、PBK、PCNA、PDIA4、POC1A、POLE2、PRC1、PTBP1、PTTG1、RACGAP1、RAE1、RBBP8、RFC2、RFC3、RFC4、RNASEH2A、RRM2、SGOL2、SHCBP1、SMC4、SNRPB、SPAG5、SPC24、STIL、TACC3、TCF3、TIMELESS、TK1、TMEM48、TOP2A、TPX2、TRIP13、TTK、TYMS、UBE2C、UBE2S、USP1、ZNF765、ZNF850、ZWINT;
所述CREBRF-M基因群由如下120个基因组成:ABLIM1、ACADSB、ADARB2、ADD3、AKAP6、AKR1C1、ANKRD46、ARHGAP32、ATP6V1G2、AVPI1、CAB39L、CBX7、CCDC85A、CDS2、CHIC1、CPEB3、CREBRF、CRY2、CRYZL1、DCUN1D5、DNAJC12、EIF1、EZH1、FAIM2、FBRSL1、FBXL20、FBXO9、FRY、FSTL5、GABARAPL1、GABBR1、GABRG1、GARNL3、GRAMD1B、GTDC1、GTF2H5、HDAC4、HERC1、HLF、HMGCLL1、IGIP、IKZF5、JMY、KSR2、MAGEE1、MAPK10、MINOS1、MKX、MLLT6、MXI1、MYCBP2、NALCN、NAP1L2、NAP1L3、NCAM1、NCOA2、NEBL、NEGR1、NR1D2、NTRK2、OIP5-AS1、PAPOLG、PCGF5、PELI3、PIAS1、PLA2G6、PLEKHM3、POU6F1、PPM1A、PPM1L、PPP1R12B、PPP1R3E、PPP1R3F、PURA、RAB11FIP2、RABGGTB、RELN、REPS2、RPL37、RPS6KA5、RUNDC3A、SCAMP1、SCAPER、SEC62、SERP2、SGSM1、SH3BGRL2、SKP1、SLC12A6、SLK、SPTAN1、TBRG1、TEF、TOM1L2、TTBK2、TUB、UQCRB、USP46、VPS13D、YPEL3、YPEL4、ZBTB4、ZBTB44、ZMYND11、ZNF540、ZRANB1、ADRBK2、KIAA0240、LOC283588、AGXT2L1、LOC283713、SEPT8、KIAA0368、C7orf41、GABARAPL3、FAM190B、BZRAP1、KIAA1107、LOC157562、KIAA1377;
所述检测方法为方法A或方法B:
所述方法A为在待测胶质瘤患者群体内部比较预后风险、预后生存率和/或预后生存期的方法,包括如下步骤:
(A1)用所述“用于检测胶质瘤患者的CDC20-M基因群和CREBRF-M基因群中各基因表达的物质”获得所述待测胶质瘤患者群体中每个个体的CDC20-M基因群和CREBRF-M基因群中各基因的表达量数据,并进行log2处理,得到各基因log2后的表达量数据;
(A2)利用一致性聚类算法,根据步骤(A1)所得的各基因log2后的表达量数据,将所述待测胶质瘤患者群体分为四组,CDC20-M high组、CDC20-M intermediate组、CREBRF-Mintermediate组和CREBRF-M high组;
(A3)按照如下任一对预后风险、预后生存率和/或预后生存期进行评估:(a1)与属于CREBRF-M intermediate组和CREBRF-M high组的待测胶质瘤患者相比,属于CDC20-M high组和CDC20-M intermediate组的待测胶质瘤患者的预后风险提高,预后生存率降低和/或预后生存期缩短;(a2)按照CDC20-M high组、CDC20-M intermediate组、CREBRF-Mintermediate组和CREBRF-M high组的顺序排列,所述待测胶质瘤患者预后风险依次递减,预后生存率和/或预后生存期依次递增;
所述方法B为对待测胶质瘤患者的预后风险和/或预后生存期进行独立样本预测的方法,包括如下步骤:
(B1)按照包括如下步骤的方法建立胶质瘤患者分型模型:
b1)获得n个待测胶质瘤患者的所述CDC20-M基因群和所述CREBRF-M基因群中各基因的表达量数据,并进行log2处理,得到各基因log2后的表达量数据;
b2)利用一致性聚类算法,根据步骤b1)所得各基因log2后的表达量数据,将所述n个待测胶质瘤患者分为四组,CDC20-M high组、CDC20-M intermediate组、CREBRF-Mintermediate组和CREBRF-M high组;
b3)针对每个分组,分别计算组内所述CDC20-M基因群和所述CREBRF-M基因群中各基因的平均表达量,每个分组组内所述CDC20-M基因群和所述CREBRF-M基因群中各基因的平均表达量即为该组特异的表达模式Centroid;
(B2)用所述“用于检测胶质瘤患者的CDC20-M基因群和CREBRF-M基因群中各基因表达的物质”获得所述待测胶质瘤患者的CDC20-M基因群和CREBRF-M基因群中各基因的表达量数据,并进行log2处理,得到各基因log2后的表达量数据;
(B3)将步骤(B2)所得的各基因log2后的表达量数据与步骤(B1)所建立的胶质瘤患者分型模型中的Centroid进行斯皮尔曼相关性分析,相关程度最高的Centroid所在组即为所述待测胶质瘤患者所在的组别;
(B4)按照如下任一对预后风险和/或预后生存期进行评估:(c1)如果所述待测胶质瘤患者属于CDC20-M high组或者CDC20-M intermediate组,则所述待测胶质瘤患者的预后风险高,和/或预后生存期短;如果所述待测胶质瘤患者属于CREBRF-M intermediate组或CREBRF-M high组,则所述待测胶质瘤患者的预后风险低,和/或预后生存期长;(c2)按照CDC20-M high组、CDC20-M intermediate组、CREBRF-M intermediate组和CREBRF-M high组的顺序排列,所述待测胶质瘤患者预后风险依次递减,和/或预后生存期依次递增。
5.用于评估胶质瘤患者预后风险、预测胶质瘤患者预后生存率和/或预测胶质瘤患者预后生存期的产品,含有用于检测胶质瘤患者的CDC20-M基因群和CREBRF-M基因群中各基因表达的物质和记载有权利要求4中所述检测方法的可读性载体;
所述CDC20-M基因群由如下139个基因组成:ASF1B、ASPM、AURKA、AURKB、BIRC5、BRCA1、BUB1、BUB1B、BUD31、C11orf82、CASC5、CASP2、CCNA2、CCNB1、CCNB2、CDC20、CDC25A、CDC45、CDC6、CDCA2、CDCA3、CDCA7、CDCA7L、CDCA8、CDK1、CDK2、CDKN2C、CDKN3、CENPA、CENPE、CENPF、CENPK、CENPN、CENPW、CEP55、CHEK1、CKAP2L、CKS2、DBF4、DDX39A、DEPDC1、DEPDC1B、DLGAP5、DNMT1、DSN1、DTL、DTYMK、E2F7、ECT2、EME1、ESPL1、FAM64A、FANCD2、FANCI、FBXO5、FOXM1、GAS2L3、GINS1、GINS2、GJC1、GPX7、GTF2IRD2、GTSE1、HJURP、HMGB2、HMMR、IGF2BP3、KIAA0101、KIF11、KIF14、KIF15、KIF20A、KIF23、KIF2C、KIF4A、KIFC1、KNTC1、KPNA2、LMNB1、LMNB2、LRR1、MAD2L1、MCM2、MCM3、MCM6、MCM8、MELK、MKI67、MLF1IP、MND1、MYBL2、NCAPG、NCAPG2、NCAPH、NDC80、NEK2、NRM、NUF2、NUSAP1、PARPBP、PBK、PCNA、PDIA4、POC1A、POLE2、PRC1、PTBP1、PTTG1、RACGAP1、RAE1、RBBP8、RFC2、RFC3、RFC4、RNASEH2A、RRM2、SGOL2、SHCBP1、SMC4、SNRPB、SPAG5、SPC24、STIL、TACC3、TCF3、TIMELESS、TK1、TMEM48、TOP2A、TPX2、TRIP13、TTK、TYMS、UBE2C、UBE2S、USP1、ZNF765、ZNF850、ZWINT;
所述CREBRF-M基因群由如下120个基因组成:ABLIM1、ACADSB、ADARB2、ADD3、AKAP6、AKR1C1、ANKRD46、ARHGAP32、ATP6V1G2、AVPI1、CAB39L、CBX7、CCDC85A、CDS2、CHIC1、CPEB3、CREBRF、CRY2、CRYZL1、DCUN1D5、DNAJC12、EIF1、EZH1、FAIM2、FBRSL1、FBXL20、FBXO9、FRY、FSTL5、GABARAPL1、GABBR1、GABRG1、GARNL3、GRAMD1B、GTDC1、GTF2H5、HDAC4、HERC1、HLF、HMGCLL1、IGIP、IKZF5、JMY、KSR2、MAGEE1、MAPK10、MINOS1、MKX、MLLT6、MXI1、MYCBP2、NALCN、NAP1L2、NAP1L3、NCAM1、NCOA2、NEBL、NEGR1、NR1D2、NTRK2、OIP5-AS1、PAPOLG、PCGF5、PELI3、PIAS1、PLA2G6、PLEKHM3、POU6F1、PPM1A、PPM1L、PPP1R12B、PPP1R3E、PPP1R3F、PURA、RAB11FIP2、RABGGTB、RELN、REPS2、RPL37、RPS6KA5、RUNDC3A、SCAMP1、SCAPER、SEC62、SERP2、SGSM1、SH3BGRL2、SKP1、SLC12A6、SLK、SPTAN1、TBRG1、TEF、TOM1L2、TTBK2、TUB、UQCRB、USP46、VPS13D、YPEL3、YPEL4、ZBTB4、ZBTB44、ZMYND11、ZNF540、ZRANB1、ADRBK2、KIAA0240、LOC283588、AGXT2L1、LOC283713、SEPT8、KIAA0368、C7orf41、GABARAPL3、FAM190B、BZRAP1、KIAA1107、LOC157562、KIAA1377。
6.一种建立胶质瘤患者分型模型的方法,包括权利要求4中的步骤b1)至b3)。
7.基因群组在制备用于评估胶质瘤患者预后风险、预测胶质瘤患者预后生存率和/或预测胶质瘤患者预后生存期的产品中的应用;
所述基因群组由CDC20-M基因群和CREBRF-M基因群组成;
所述CDC20-M基因群由如下139个基因组成:ASF1B、ASPM、AURKA、AURKB、BIRC5、BRCA1、BUB1、BUB1B、BUD31、C11orf82、CASC5、CASP2、CCNA2、CCNB1、CCNB2、CDC20、CDC25A、CDC45、CDC6、CDCA2、CDCA3、CDCA7、CDCA7L、CDCA8、CDK1、CDK2、CDKN2C、CDKN3、CENPA、CENPE、CENPF、CENPK、CENPN、CENPW、CEP55、CHEK1、CKAP2L、CKS2、DBF4、DDX39A、DEPDC1、DEPDC1B、DLGAP5、DNMT1、DSN1、DTL、DTYMK、E2F7、ECT2、EME1、ESPL1、FAM64A、FANCD2、FANCI、FBXO5、FOXM1、GAS2L3、GINS1、GINS2、GJC1、GPX7、GTF2IRD2、GTSE1、HJURP、HMGB2、HMMR、IGF2BP3、KIAA0101、KIF11、KIF14、KIF15、KIF20A、KIF23、KIF2C、KIF4A、KIFC1、KNTC1、KPNA2、LMNB1、LMNB2、LRR1、MAD2L1、MCM2、MCM3、MCM6、MCM8、MELK、MKI67、MLF1IP、MND1、MYBL2、NCAPG、NCAPG2、NCAPH、NDC80、NEK2、NRM、NUF2、NUSAP1、PARPBP、PBK、PCNA、PDIA4、POC1A、POLE2、PRC1、PTBP1、PTTG1、RACGAP1、RAE1、RBBP8、RFC2、RFC3、RFC4、RNASEH2A、RRM2、SGOL2、SHCBP1、SMC4、SNRPB、SPAG5、SPC24、STIL、TACC3、TCF3、TIMELESS、TK1、TMEM48、TOP2A、TPX2、TRIP13、TTK、TYMS、UBE2C、UBE2S、USP1、ZNF765、ZNF850、ZWINT;
所述CREBRF-M基因群由如下120个基因组成:ABLIM1、ACADSB、ADARB2、ADD3、AKAP6、AKR1C1、ANKRD46、ARHGAP32、ATP6V1G2、AVPI1、CAB39L、CBX7、CCDC85A、CDS2、CHIC1、CPEB3、CREBRF、CRY2、CRYZL1、DCUN1D5、DNAJC12、EIF1、EZH1、FAIM2、FBRSL1、FBXL20、FBXO9、FRY、FSTL5、GABARAPL1、GABBR1、GABRG1、GARNL3、GRAMD1B、GTDC1、GTF2H5、HDAC4、HERC1、HLF、HMGCLL1、IGIP、IKZF5、JMY、KSR2、MAGEE1、MAPK10、MINOS1、MKX、MLLT6、MXI1、MYCBP2、NALCN、NAP1L2、NAP1L3、NCAM1、NCOA2、NEBL、NEGR1、NR1D2、NTRK2、OIP5-AS1、PAPOLG、PCGF5、PELI3、PIAS1、PLA2G6、PLEKHM3、POU6F1、PPM1A、PPM1L、PPP1R12B、PPP1R3E、PPP1R3F、PURA、RAB11FIP2、RABGGTB、RELN、REPS2、RPL37、RPS6KA5、RUNDC3A、SCAMP1、SCAPER、SEC62、SERP2、SGSM1、SH3BGRL2、SKP1、SLC12A6、SLK、SPTAN1、TBRG1、TEF、TOM1L2、TTBK2、TUB、UQCRB、USP46、VPS13D、YPEL3、YPEL4、ZBTB4、ZBTB44、ZMYND11、ZNF540、ZRANB1、ADRBK2、KIAA0240、LOC283588、AGXT2L1、LOC283713、SEPT8、KIAA0368、C7orf41、GABARAPL3、FAM190B、BZRAP1、KIAA1107、LOC157562、KIAA1377。
8.CDC20-M基因群作为标志物在制备用于评估胶质瘤患者预后风险、预测胶质瘤患者预后生存率和/或预测胶质瘤患者预后生存期的产品中的应用;
所述CDC20-M基因群由如下139个基因组成:ASF1B、ASPM、AURKA、AURKB、BIRC5、BRCA1、BUB1、BUB1B、BUD31、C11orf82、CASC5、CASP2、CCNA2、CCNB1、CCNB2、CDC20、CDC25A、CDC45、CDC6、CDCA2、CDCA3、CDCA7、CDCA7L、CDCA8、CDK1、CDK2、CDKN2C、CDKN3、CENPA、CENPE、CENPF、CENPK、CENPN、CENPW、CEP55、CHEK1、CKAP2L、CKS2、DBF4、DDX39A、DEPDC1、DEPDC1B、DLGAP5、DNMT1、DSN1、DTL、DTYMK、E2F7、ECT2、EME1、ESPL1、FAM64A、FANCD2、FANCI、FBXO5、FOXM1、GAS2L3、GINS1、GINS2、GJC1、GPX7、GTF2IRD2、GTSE1、HJURP、HMGB2、HMMR、IGF2BP3、KIAA0101、KIF11、KIF14、KIF15、KIF20A、KIF23、KIF2C、KIF4A、KIFC1、KNTC1、KPNA2、LMNB1、LMNB2、LRR1、MAD2L1、MCM2、MCM3、MCM6、MCM8、MELK、MKI67、MLF1IP、MND1、MYBL2、NCAPG、NCAPG2、NCAPH、NDC80、NEK2、NRM、NUF2、NUSAP1、PARPBP、PBK、PCNA、PDIA4、POC1A、POLE2、PRC1、PTBP1、PTTG1、RACGAP1、RAE1、RBBP8、RFC2、RFC3、RFC4、RNASEH2A、RRM2、SGOL2、SHCBP1、SMC4、SNRPB、SPAG5、SPC24、STIL、TACC3、TCF3、TIMELESS、TK1、TMEM48、TOP2A、TPX2、TRIP13、TTK、TYMS、UBE2C、UBE2S、USP1、ZNF765、ZNF850、ZWINT。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910171388.4A CN109913549B (zh) | 2019-03-07 | 2019-03-07 | 基于cdc20基因共表达网络的胶质瘤分子分型及应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910171388.4A CN109913549B (zh) | 2019-03-07 | 2019-03-07 | 基于cdc20基因共表达网络的胶质瘤分子分型及应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109913549A CN109913549A (zh) | 2019-06-21 |
CN109913549B true CN109913549B (zh) | 2021-02-05 |
Family
ID=66963745
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910171388.4A Active CN109913549B (zh) | 2019-03-07 | 2019-03-07 | 基于cdc20基因共表达网络的胶质瘤分子分型及应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109913549B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110468210A (zh) * | 2019-09-12 | 2019-11-19 | 暨南大学 | Cdc45作为胶质母细胞瘤标志物及其作为治疗靶点的应用 |
CN110850088B (zh) * | 2019-12-06 | 2021-08-20 | 四川大学华西医院 | Gtf2ird2自身抗体检测试剂在制备肺癌筛查试剂盒中的用途 |
CN112011612B (zh) * | 2020-07-27 | 2022-06-07 | 中国人民解放军陆军军医大学第一附属医院 | 胶质瘤患者生存预测的预后分类的生物标志物及试剂盒 |
CN112048555B (zh) * | 2020-07-27 | 2022-06-07 | 中国人民解放军陆军军医大学第一附属医院 | 胶质瘤患者生存预测的预后分类系统 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2006340769A1 (en) * | 2005-12-16 | 2007-10-04 | Genentech, Inc. | Method for diagnosing, prognosing and treating glioma |
CN104178556B (zh) * | 2013-05-28 | 2016-08-17 | 北京师范大学 | 神经胶质瘤分子分型基因群及其应用 |
CN108733980B (zh) * | 2018-05-09 | 2022-01-18 | 中国科学院昆明动物研究所 | 基于多基因表达特征谱胶质母细胞瘤个性化预后评估方法 |
-
2019
- 2019-03-07 CN CN201910171388.4A patent/CN109913549B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN109913549A (zh) | 2019-06-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109913549B (zh) | 基于cdc20基因共表达网络的胶质瘤分子分型及应用 | |
Archer et al. | Empirical characterization of random forest variable importance measures | |
EP4073805B1 (en) | Systems and methods for predicting homologous recombination deficiency status of a specimen | |
US7711492B2 (en) | Methods for diagnosing lymphoma types | |
US20220310199A1 (en) | Methods for identifying chromosomal spatial instability such as homologous repair deficiency in low coverage next- generation sequencing data | |
CN110468207B (zh) | 基于Taqman低密度芯片的胶质瘤EM/PM分子分型方法及其应用 | |
Larsson et al. | Comparative microarray analysis | |
Voigt et al. | Phenotype in combination with genotype improves outcome prediction in acute myeloid leukemia: a report from Children’s Oncology Group protocol AAML0531 | |
Hu et al. | Microarray meta-analysis identifies acute lung injury biomarkers in donor lungs that predict development of primary graft failure in recipients | |
Bonder et al. | Systematic assessment of regulatory effects of human disease variants in pluripotent cells | |
CN116895380A (zh) | 基于多因素特征融合的疾病风险预测方法MFF-DeepPRS | |
Rogan | Multigene signatures of responses to chemotherapy derived by biochemically-inspired machine learning | |
Jo et al. | Interpretation of SNP combination effects on schizophrenia etiology based on stepwise deep learning with multi-precision data | |
CN115331812A (zh) | 一种浆液性卵巢癌预后标志物模型的建立和验证方法 | |
CN108694304A (zh) | 一种身份关系鉴定方法、装置、设备及存储介质 | |
Abdulaimma et al. | Deep learning and genome-wide association studies for the classification of type 2 diabetes | |
Chang et al. | ICTD: A semi-supervised cell type identification and deconvolution method for multi-omics data | |
Alberts et al. | A verification protocol for the probe sequences of Affymetrix genome arrays reveals high probe accuracy for studies in mouse, human and rat | |
US20210055301A1 (en) | Molecular typing of multiple myeloma and application | |
Zheng et al. | A structural variation genotyping algorithm enhanced by CNV quantitative transfer | |
Kalya et al. | Machine Learning based Survival Group Prediction in Glioblastoma | |
Riccadonna et al. | Supervised classification of combined copy number and gene expression data | |
Tian et al. | Identification of genes involved in breast cancer metastasis by integrating protein–protein interaction information with expression data | |
KR102078200B1 (ko) | 개인 유전체 맵 기반 맞춤의학 분석 플랫폼 및 이를 이용한 분석 방법 | |
CN118745467A (zh) | 一种急性髓系细胞白血病生物标志物及急性髓系白血病分类模型和危险因素预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |