CN114592065A - 一组预测肝癌预后联合标志物及其应用 - Google Patents
一组预测肝癌预后联合标志物及其应用 Download PDFInfo
- Publication number
- CN114592065A CN114592065A CN202210421628.3A CN202210421628A CN114592065A CN 114592065 A CN114592065 A CN 114592065A CN 202210421628 A CN202210421628 A CN 202210421628A CN 114592065 A CN114592065 A CN 114592065A
- Authority
- CN
- China
- Prior art keywords
- liver cancer
- prognosis
- gene
- expression
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 208000014018 liver neoplasm Diseases 0.000 title claims abstract description 116
- 201000007270 liver cancer Diseases 0.000 title claims abstract description 115
- 238000004393 prognosis Methods 0.000 title claims abstract description 71
- 230000014509 gene expression Effects 0.000 claims abstract description 65
- 239000000090 biomarker Substances 0.000 claims abstract description 27
- 101000762405 Homo sapiens Borealin Proteins 0.000 claims abstract description 19
- 101000980907 Homo sapiens Cell division cycle-associated protein 3 Proteins 0.000 claims abstract description 19
- 102100024486 Borealin Human genes 0.000 claims abstract description 14
- 101000988651 Homo sapiens Humanin-like 1 Proteins 0.000 claims abstract description 14
- 101001050286 Homo sapiens Jupiter microtubule associated homolog 1 Proteins 0.000 claims abstract description 14
- 102100023133 Jupiter microtubule associated homolog 1 Human genes 0.000 claims abstract description 14
- 102100024479 Cell division cycle-associated protein 3 Human genes 0.000 claims abstract description 13
- 101000697353 Homo sapiens FACT complex subunit SSRP1 Proteins 0.000 claims abstract description 13
- 102100028166 FACT complex subunit SSRP1 Human genes 0.000 claims abstract description 11
- 238000002626 targeted therapy Methods 0.000 claims abstract 2
- 108090000623 proteins and genes Proteins 0.000 claims description 69
- 102100020736 Chromosome-associated kinesin KIF4A Human genes 0.000 claims description 13
- 101001139157 Homo sapiens Chromosome-associated kinesin KIF4A Proteins 0.000 claims description 13
- 238000012216 screening Methods 0.000 claims description 12
- 238000003559 RNA-seq method Methods 0.000 claims description 10
- 238000007427 paired t-test Methods 0.000 claims description 10
- 238000011870 unpaired t-test Methods 0.000 claims description 9
- 238000000611 regression analysis Methods 0.000 claims description 8
- 101000997749 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) Intrastrand cross-link recognition protein Proteins 0.000 claims description 7
- 238000010201 enrichment analysis Methods 0.000 claims description 6
- 230000002159 abnormal effect Effects 0.000 claims description 5
- 238000004458 analytical method Methods 0.000 claims description 5
- 239000003550 marker Substances 0.000 claims description 4
- 238000003753 real-time PCR Methods 0.000 claims description 3
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 2
- 230000010354 integration Effects 0.000 claims description 2
- 238000002360 preparation method Methods 0.000 claims description 2
- 238000007619 statistical method Methods 0.000 claims description 2
- 230000004083 survival effect Effects 0.000 abstract description 15
- 229940079593 drug Drugs 0.000 abstract description 2
- 239000003814 drug Substances 0.000 abstract description 2
- 230000005773 cancer-related death Effects 0.000 abstract 1
- 239000000092 prognostic biomarker Substances 0.000 abstract 1
- 210000001519 tissue Anatomy 0.000 description 46
- 210000005228 liver tissue Anatomy 0.000 description 15
- 206010028980 Neoplasm Diseases 0.000 description 11
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 8
- 238000000034 method Methods 0.000 description 8
- 230000001575 pathological effect Effects 0.000 description 7
- 238000012163 sequencing technique Methods 0.000 description 7
- 238000010839 reverse transcription Methods 0.000 description 6
- 201000011510 cancer Diseases 0.000 description 5
- 238000011529 RT qPCR Methods 0.000 description 4
- 239000000523 sample Substances 0.000 description 4
- 102000006382 Ribonucleases Human genes 0.000 description 3
- 108010083644 Ribonucleases Proteins 0.000 description 3
- 108091023040 Transcription factor Proteins 0.000 description 3
- 102000040945 Transcription factor Human genes 0.000 description 3
- 108020004999 messenger RNA Proteins 0.000 description 3
- 238000002156 mixing Methods 0.000 description 3
- 238000003757 reverse transcription PCR Methods 0.000 description 3
- 230000035945 sensitivity Effects 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- 108010093502 E2F Transcription Factors Proteins 0.000 description 2
- 239000013614 RNA sample Substances 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000034994 death Effects 0.000 description 2
- 231100000517 death Toxicity 0.000 description 2
- 230000003234 polygenic effect Effects 0.000 description 2
- 239000011541 reaction mixture Substances 0.000 description 2
- 210000004881 tumor cell Anatomy 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 101150028074 2 gene Proteins 0.000 description 1
- 101150096316 5 gene Proteins 0.000 description 1
- 108020004414 DNA Proteins 0.000 description 1
- 230000004568 DNA-binding Effects 0.000 description 1
- 108050006730 E2F Family Proteins 0.000 description 1
- 102000019274 E2F Family Human genes 0.000 description 1
- 108091092584 GDNA Proteins 0.000 description 1
- 102100031181 Glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 238000002123 RNA extraction Methods 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 230000027455 binding Effects 0.000 description 1
- 238000003766 bioinformatics method Methods 0.000 description 1
- 230000022131 cell cycle Effects 0.000 description 1
- 230000030833 cell death Effects 0.000 description 1
- 230000024245 cell differentiation Effects 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000009650 gentamicin protection assay Methods 0.000 description 1
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 1
- 230000009545 invasion Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000012257 pre-denaturation Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000028617 response to DNA damage stimulus Effects 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/6851—Quantitative amplification
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
- G16B50/30—Data warehousing; Computing architectures
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/118—Prognosis of disease development
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/158—Expression markers
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Physics & Mathematics (AREA)
- Organic Chemistry (AREA)
- General Health & Medical Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Zoology (AREA)
- Biotechnology (AREA)
- Biophysics (AREA)
- Wood Science & Technology (AREA)
- Genetics & Genomics (AREA)
- Medical Informatics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Immunology (AREA)
- Theoretical Computer Science (AREA)
- Molecular Biology (AREA)
- Analytical Chemistry (AREA)
- Pathology (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Biology (AREA)
- Biochemistry (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Microbiology (AREA)
- Public Health (AREA)
- Bioinformatics & Computational Biology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Data Mining & Analysis (AREA)
- Biomedical Technology (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- Hospice & Palliative Care (AREA)
- Oncology (AREA)
- Bioethics (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一组预测肝癌预后联合标志物及其应用,属于生物医药技术领域。肝癌是世界范围内最常见的癌症相关死亡原因之一,预后极差,识别其有效的预后生物标志物具有重要的临床意义。本发明提出了一种基于联合生物标志物对肝癌患者预后进行测定及其风险评估的模型,涉及的联合生物标记物包括:CDCA3,CDCA8,SSRP1,HN1以及KIF4A。本发明依据病例样本中联合生物标志物的表达情况,定量地计算其预后风险评分,根据患者的风险评分的中位值分为高、低风险组,结果低风险组患者的预后明显优于高风险组患者,并通过K‑Mplot生存曲线、ROC曲线及患者的生存时间和状态验证预后生存模型的准确性和特异性。因此,该预测模型对于肝癌的患者的预后预测及靶向治疗具有重要的意义。
Description
发明领域
本发明属于生物医药领域,具体涉及一组预测肝癌预后的联合标志物及其应用,具体涉及一组新的转录因子家族E2F相关的基因集,该基因集可以作为肝癌的预后标志物。
背景技术
肝癌是临床上最常见的恶性肿瘤之一,死亡人数在所有癌症中位居第三。早期难以发现,70%以上的肝癌患者在晚期确诊,因此,肝癌患者的预后极差。此外,传统的可识别的临床和病理症状在预测肝癌预后方面存在很大缺陷,为了延长肝癌患者的总体存活率,需要寻找更好发预测预后的新方法。
肝癌作为一种异质性疾病,并非由单个基因或其产物所决定,越来越多的文献报道,来自患者肿瘤组织的多基因预后特征比单基因更能准确地预测癌症患者的预后,特别是mRNA的多基因预后特征比非编码预后基因具有更好的预后准确性,可以提供更有效的个体化治疗。然而,目前在肝癌中尚缺乏mRNA联合生物标志物对肝癌预后的研究。因此,寻找有效的联合生物标志物对于评估肝癌的预后具有重要的意义。
E2F是编码一系列转录因子、具有多功能的转录因子家族。目前已报道E2F家族可通过结合共识DNA结合序列参与调控肿瘤细胞周期、DNA损伤反应、细胞分化和细胞死亡,从而影响肿瘤细胞的生长和侵袭。大量的证据表明,在多种癌症类型中,E2F通过控制其下游的靶标因子参与肿瘤的发生发展。本发明公开的联合生物标志物可用于肝癌患者的预后判断,对我国肝癌的治疗与预后判断现状具有显著意义。
发明内容
鉴于在预测肝癌预后的现有技术中缺乏足够的生物标志物,本发明提供一组用于预测肝癌预后的联合生物标记物及其确立方法和应用。为实现该目的,将进行如下说明:
第一方面,本发明提供了一组用于预测肝癌预后的联合生物标记物,所述联合生物标记物包括CDCA3,CDCA8,HN1,KIF4A以及SSRP1;所述联合标志物由Risk score表征:Risk score=0.3915*expression of gene HN1-0.3864*expression ofgene KIF4A-0.2886*expression ofgene CDCA3+0.4415*expression ofgene CDCA8+0.8842*expression ofgene SSRP1。
第二方面,本发明提供了将上述联合生物标记物用于预测肝癌预后的方法,所述方法包括如下步骤:
(1)从TCGA数据库,检索肝癌患者的癌组织及癌旁组织的RNA-Seq测序数据,并下载患者的临床病理资料;
(2)利用GSEA功能富集分析,筛选肝癌组织和癌旁正常组织中存在差异的基因集:采用GSEA功能富集分析,以|NES|>1并且NOM p-val<0.05为标准,选取具有显著统计学差异的基因集,用于确定肝癌治疗中有价值的标志性联合生物标志物;NES代表归一化后的富集分析评分,NOM p-val代表校正后的p value,表征富集结果的可信度;其中,转录因子E2F基因集|NES|=2.071552,NOM p-val=0.001961,是在肝癌组织和癌旁正常组织中差异最大的基因集,并对其进行了进一步的分析;
(3)单因素COX筛选差异基因集中影响预后的基因:利用单因素Cox回归分析,筛选出差异基因集中,影响肝癌患者预后的基因,以P<0.05为标准;
(4)多因素COX构建肝癌预后的风险模型:从单因素Cox分析结果中筛选P<0.001的预后基因,采用多因素Cox回归分析模拟并建立肝癌的预后模型,最终筛选出CDCA3、CDCA8、SSRP1、HN1、KIF4A构建预测肝癌患者预后的风险模型;对所选基因的表达水平进行加权,与多因素Cox回归分析得到的回归系数进行线性积分,风险评分=0.3915*expressionofgene HN1-0.3864*expression of gene KIF4A-0.2886*expression of gene CDCA3+0.4415*expression of gene CDCA8+0.8842*expression ofgene SSRP1,风险评分公式可用于计算每个肝癌患者的风险值,根据风险值的大小可以预测肝癌患者的预后;
(5)预后模型中基因的异常表达:利用TCGA数据库和GEO数据库中肝癌组织、正常肝组织的RNA-Seq数据,采用配对以及非配对T检验,对比CDCA3、CDCA8、SSRP1、HN1和KIF4A在肝癌组织及正常肝组织中的表达量的差异;
(6)风险模型准确性的验证:使用ROC曲线和Kaplan–Meier(K-M)曲线评估模型的准确性;ROC曲线下面积反映该预后模型的准确性和特异性,K-M曲线反映高风险组和低风险组患者预后的差异,以P<0.05为标准确定是否具有统计学意义;
(7)收集肝癌组织和癌旁正常肝组织,通过实时荧光定量PCR检测预后模型中基因CDCA3、CDCA8、SSRP1、HN1和KIF4A在肝癌组织和癌旁正常肝组织中的表达差异;
(8)统计分析:数据显示为平均值±SD/SEM,P值小于0.05认为是统计学有差异;
其中,所述步骤(1)中,检索数据并处理RNA序列数据,具体为:从TCGA下载了422例肝癌组织和88例癌旁正常肝组织的RNA-Seq数据和临床数据,网址如下:https://portal.gdc.cancer.gov/。
第三方面,本发明提供一组用于预测肝癌预后的标记物,该标记物含有上述的一组用于预测肝癌预后的生物标记物,该标记物在制备辅助判断肝癌预后试剂盒中的应用。
最后,本发明还提供一种辅助判断肝癌预后的试剂盒,该试剂盒含有上述一组用于预测肝癌预后的联合生物标记物。
有益效果
本发明提供一种联合生物标志物及其作为肝癌预后预测的方法,区别于单基因生物标志物,有更准确、有效的优点,将大大提高肝癌预后判断的准确性。总体生存分析显示,联合生物标志物中CDCA3,CDCA8,HN1,KIF4A以及SSRP1的基因表达水平高,患者的总生存时间缩短,ROC曲线下面积为0.755,表明上述联合生物标志物具有较高的灵敏度和准确性,因此,由这5个基因组成的联合生物标志物可作为优异的肝癌预后生物标志物。
附图1为实施例3中肝癌预后模型的构建。其中,图1A是患者由低到高的风险评分;图1B横坐标是患者评分由低到高,纵坐标是患者的生存时间,星号*和加号+分别代表患者的生存状态为死亡和存活;图1C的横坐标是按照患者的风险评分依次升高,该图代表随着患者风险评分的升高模型中5个基因的表达情况;图1D是模型公式中5个基因表达量的系数值。
附图2为实施例4中非配对以及配对t检验检测这5个基因在TCGA数据库,肝癌组织和癌旁正常肝组织中的表达量差异。其中,图2A-2E是模型中5个基因在肝癌组织和癌旁正常肝组织表达量的非配对t检验的结果,图2F-2J是模型中5个基因在肝癌组织和癌旁正常肝组织表达量的配对t检验的结果;非配对t检验和配对t检验结果均表明模型中5个基因在肝癌组织中存在异常高表达,且具有统计学意义。
附图3为实施例4中非配对以及配对t检验检测这5个基因在GEO数据库,肝癌组织和癌旁正常肝组织中的表达量差异。其中,图3A-3E是模型中5个基因在肝癌组织和癌旁正常肝组织表达量的非配对t检验的结果,图3F-3J是模型中5个基因在肝癌组织和癌旁正常肝组织表达量的配对t检验的结果;非配对t检验和配对t检验结果均表明模型中5个基因在肝癌组织中存在异常高表达,除SSRP1的配对t检验无统计学意义外,其它结果均有统计学意义;分析原因是可能由于样本量少导致的。
附图4为实施例5中ROC曲线和Kaplan-Meier生存曲线验证预后模型的准确性和特异性。其中,4A是高风险评分患者和低风险评分患者的Kaplan-Meier生存曲线,高风险评分患者的预后明显差于低风险评分患者;模型的ROC曲线下面积为0.755,证明该模型在预测患者预后方面具有很好的敏感性和特异性。
附图5为实施例6中,肝癌预后模型中的基因在临床样本中表达量的验证。通过提取临床肝癌组织和癌旁正常组织中的总RNA,分别进行逆转录和qRT-PCR检测模型中5个基因在临床肝癌组织和癌旁正常肝组织中的表达量,实验结果和生物信息学分析的结果一致,模型中的5个基因在肝癌组织中均存在显著高表达。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
本发明适用的数据包括转录组数据和临床数据,适用标本包括冻存在-80℃的组织标本。
实施例1TCGA数据库RNA-Seq测序数据和患者临床病理资料的下载
从TCGA数据库下载肝癌患者的肝癌组织、癌旁正常组织的RNA-Seq测序数据,并下载肝癌患者的临床病理资料,下载网址为:https://portal.gdc.cancer.gov/。TCGA数据库中,422例肝癌患者具有临床病理资料;373例肝癌患者有肝癌组织的RNA-Seq测序数据。既有临床病理资料又有肝癌组织测序数据的肝癌患者总计369例,其中,50例肝癌患者具有肝癌组织和癌旁正常肝组织的配对的RNA-Seq测序数据。由于mRNA的表达谱数据已经通过TCGA标准化,因此不对这些数据进行进一步的标准化,肝癌患者病理参数如表1所示:
表1.肝癌患者的临床病理参数
实施例2肝癌患者中差异表达基因集的筛选
采用GSEA 4.1.0版,利用肝癌组织和癌旁正常肝组织的RNA-Seq测序数据,分析肝癌组织和癌旁正常肝组织中差异表达的基因集。以|NES|>1.5,NOM P-val<0.05为标准筛选在肝癌组织中异常表达的基因集,用于确定肝癌治疗中对预后有预测价值的基因集;|NES|代表归一化后的富集分析评分,NOM p-val代表校正后的p value,表征富集结果的可信度;其中,转录因子E2F基因集中含有197个基因,其|NES|=2.071552,NOM p-val=0.001961,是在肝癌组织和癌旁正常组织中差异最大的基因集(表2)。
表2.肝癌患者中异常表达的基因集
实施例3肝癌预后模型的构建
利用单因素Cox回归分析,从GSEA筛选出的差异基因集中筛选影响肝癌患者预后,且P<0.001的基因,共筛选出20个基因;采用多因素Cox回归分析建立预后相关模型,最终筛选出HN1、KIF4A、CDCA3、CDCA8及SSRP1构建预测肝癌患者预后的风险模型,所选预后基因的多变量COX生存分析的详细结果如表3所示。风险评分=0.3915*expression of gene HN1-0.3864*expression of gene KIF4A-0.2886*expression of gene CDCA3+0.4415*expression of gene CDCA8+0.8842*expression of gene SSRP1。在构建的风险模型中,B(COX)是相应基因表达量的系数,P value是基因多因素COX生存分析影响预后的P值,HR是基因的风险系数(表3)。根据风险评分中位数将肝癌患者分为低危组和高危组(图1A),本发明发现高危组总生存时间较低危组短,死亡人数较高(图1B)。
表3.肝癌预后模型中基因的多因素COX分析结果
实施例4肝癌预后模型中基因在肝癌组织和癌旁正常组织中的表达差异
采用TCGA以及GEO数据库,使用非配对以及配对t检验在肝癌组织以及正常组织中分析预后模型中5个基因表达量的差异,结果显示筛选的5个基因在肝癌组织中的表达均高于相邻正常组织(图2、图3)。
实施例5ROC曲线和Kaplan-Meier生存曲线验证预后模型的准确性和特异性
将肝癌患者按风险评分中位数分为高低风险组,构建ROC曲线,ROC曲线下面积为0.755,表明风险评分在预测肝癌患者预后方面具有较高的特异性和敏感性(图4B)。该结果证明预后模型在预测肝癌患者预后方面具有较好的准确性和特异性。
利用Kaplan-Meier生存曲线,分析高低风险组患者的预后,低危组患者的生存时间明显优于高危组(图4A)。对肝癌患者的预后进行分层分析,以确定风险评分的有效性。该结果表明风险值高的患者的预后较差,预后模型可以很好的预测肝癌患者的预后。
实施例6肝癌预后模型中的基因在临床样本中表达量的验证(图5)
(1)肝癌肿瘤组织及配对正常组织样本的获得及总RNA提取
获得经手术分离的肝癌肿瘤组织样本21个,癌旁正常组织样本21个,用聚合美生物科技公司的TRIgent试剂提取总的RNA,对提取的总RNA进行定量。
(2)实时荧光定量RT-PCR检测CDCA3、CDCA8、HN1、KIF4A以及SSRP1在肝癌肿瘤样本中的表达。
利用实时荧光定量RT-PCR检测步骤(1)中获得的21个肝癌肿瘤样本及21个癌旁正常组织样本中5个基因的表达情况,具体步骤如下:
1)RNA反转录:使用艾科瑞生物工程有限公司的反转录试剂盒(Evo M-MLV MixKit with gDNA Clean for qPCR,货号:AG11706-S)进行RNA样本的反转录反应,具体按照试剂盒说明书的方法进行,步骤如下:①去除基因组DNA,取1微克提取的总RNA样本,加入2μl 5×gDNA Clean Reaction Mix,3μl RNase free water,混匀后置42℃,反应2分钟;②反转录反应,在①的反应液中加入4μl 5×Evo M-MLV RT Reaction Mix,6μl RNase freewater,总体积为20μl;混匀后短暂离心,置于BIO-RAD T100 Thermal Cycler仪中进行反转录反应,反应参数为37℃,15分钟;85℃,5秒;随后置于4℃保存。
2)实时荧光定量PCR:模型中基因的引物设计来源于生工生物工程有限公式,使用艾科瑞生物工程有限公司的Green Premix Pro Taq HS qPCR Kit(货号:AG11701)对样本中的CDCA3,CDCA8,HN1,KIF4A以及SSRP1的表达进行定量检测,具体方法按试剂盒的说明书进行,步骤如下:取2μl逆转录产物,加入5μl 2×SYBR Green Pro Taq HS Premix,0.4μl(10μM)上游引物,0.4μl(10μM)下游引物,最后加入2.2μl RNase free water,反应总体积为10μl。混匀后短暂离心,置于BIO-RAD CFX96 Optics Module实时定量PCR仪中进行PCR扩增反应,反应参数为95℃预变性30秒,95℃变性5秒,60℃退火延伸30秒;循环次数为40个循环。每个反应设置3个重复;
表4.肝癌预后模型中基因的引物序列如下:
3)数据分析:对同一样本分别检测其中目标RNA及内参RNA的表达;以内参RNA的表达量为基准,对目标RNA的表达进行归一化处理;随后采用通常使用的delta delta Ct法对目标RNA的表达量进行定量,本发明的内参为GAPDH。
Claims (6)
1.一组用于预测肝癌预后的联合生物标记物,其特征在于,所述联合生物标记物包括CDCA3、CDCA8、HN1、KIF4A以及SSRP1;
其中,所述联合标志物由基因表达量与对应系数的乘积之和构成的Risk score来表征:Risk score=0.3915*expression of gene HN1-0.3864*expression of gene KIF4A-0.2886*expression of gene CDCA3+0.4415*expression of gene CDCA8+0.8842*expression of gene SSRP1。
2.如权利要求1所述的预测肝癌患者预后及肝癌靶向治疗的基因集,其特征在于,所述的CDCA3、CDCA8、HN1、KIF4A以及SSRP1分别表示各基因在肝癌患者中的表达量。
3.如权利要求1所述的一组用于预测肝癌预后的联合生物标记物,其特征在于,包括如下步骤:
(1)从TCGA检索肝癌的和癌旁组织RNA-Seq的数据;
(2)筛选存在差异的基因集:采用GSEA功能富集分析,以|NES|>1并且NOM p-val<0.05为标准,选取具有显著统计学差异的基因集,用于确定肝癌治疗中有价值的标志性联合生物标志物;NES代表归一化后的富集分析评分,NOM p-val代表校正后的p value,表征富集结果的可信度;
(3)单因素COX筛选差异基因集中影响预后的基因:利用单因素Cox回归分析,筛选出差异基因集中影响肝癌患者预后的基因;
(4)多因素COX构建肝癌预后的风险模型:从单因素Cox分析结果中筛选P<0.001的预后基因,采用多因素Cox回归分析建立预后模型,最终筛选出CDCA3、CDCA8、SSRP1、HN1、KIF4A构建预测肝癌患者预后的风险模型;对所选基因的表达水平进行加权,与多因素Cox回归分析得到的回归系数进行线性积分,风险评分=0.3915*expression of gene HN1-0.3864*expression of gene KIF4A-0.2886*expression of gene CDCA3+0.4415*expression ofgene CDCA8+0.8842*expression of gene SSRP1,风险评分公式可用于计算每个肝癌患者的风险值;
(5)预后模型中基因的异常表达:在TCGA及GEO数据库中,采用配对以及非配对T检验,分析CDCA3、CDCA8、SSRP1、HN1和KIF4A在肝癌组织及正常组织中的表达量;
(6)评估风险模型准确性:使用ROC曲线和Kaplan–Meier(K-M)曲线评估模型的准确性;通过实时荧光定量PCR在临床组织中验证模型中CDCA3、CDCA8、SSRP1、HN1和KIF4A的表达;
(7)统计分析:数据显示为平均值±SD/SEM,P值小于0.05认为是统计学有差异。
4.如权利要求1所述的一组用于预测肝癌预后的联合生物标记物,其特征在于,所述步骤(1)检索数据并处理RNA序列数据具体为:从TCGA下载422例肝癌患者数据,包括RNA-Seq转录组数据和临床数据。
5.一组用于预测肝癌预后的标记物,该标记物含有如权利要求1所述的一组用于预测肝癌预后的联合生物标记物,该标记物在制备辅助判断肝癌预后试剂盒中的应用。
6.一种辅助判断肝癌预后的试剂盒,该试剂盒含有如权利要求1所述的一组用于预测肝癌预后的联合生物标记物。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210421628.3A CN114592065B (zh) | 2022-04-21 | 2022-04-21 | 一组预测肝癌预后联合标志物及其应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210421628.3A CN114592065B (zh) | 2022-04-21 | 2022-04-21 | 一组预测肝癌预后联合标志物及其应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114592065A true CN114592065A (zh) | 2022-06-07 |
CN114592065B CN114592065B (zh) | 2023-12-12 |
Family
ID=81812073
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210421628.3A Active CN114592065B (zh) | 2022-04-21 | 2022-04-21 | 一组预测肝癌预后联合标志物及其应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114592065B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116606932A (zh) * | 2023-03-22 | 2023-08-18 | 唐山市人民医院 | 一种胃癌预后预测风险模型的构建方法 |
CN116741271A (zh) * | 2023-06-09 | 2023-09-12 | 唐山市人民医院 | 一种食管鳞癌预后预测风险模型的构建方法及其应用 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1852974A (zh) * | 2003-06-09 | 2006-10-25 | 密歇根大学董事会 | 用于治疗和诊断癌症的组合物和方法 |
CN104769131A (zh) * | 2012-09-21 | 2015-07-08 | 英特盖根公司 | 用于在肝细胞癌中预后整体存活和无复发存活的方法 |
US20170298443A1 (en) * | 2014-09-25 | 2017-10-19 | Moffitt Genetics Corporation | Prognostic tumor biomarkers |
CN113436673A (zh) * | 2021-06-29 | 2021-09-24 | 北京泱深生物信息技术有限公司 | 一种用于肝癌预后预测的分子标志物及其应用 |
CN113785076A (zh) * | 2019-05-03 | 2021-12-10 | 株式会社递希真 | 预测癌症预后的方法及其组合物 |
CN113981085A (zh) * | 2021-11-08 | 2022-01-28 | 右江民族医学院附属医院 | 用于肝癌预后的mRNA基因组、mRNA基因对组、预测模型及应用 |
-
2022
- 2022-04-21 CN CN202210421628.3A patent/CN114592065B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1852974A (zh) * | 2003-06-09 | 2006-10-25 | 密歇根大学董事会 | 用于治疗和诊断癌症的组合物和方法 |
CN104769131A (zh) * | 2012-09-21 | 2015-07-08 | 英特盖根公司 | 用于在肝细胞癌中预后整体存活和无复发存活的方法 |
US20170298443A1 (en) * | 2014-09-25 | 2017-10-19 | Moffitt Genetics Corporation | Prognostic tumor biomarkers |
CN113785076A (zh) * | 2019-05-03 | 2021-12-10 | 株式会社递希真 | 预测癌症预后的方法及其组合物 |
CN113436673A (zh) * | 2021-06-29 | 2021-09-24 | 北京泱深生物信息技术有限公司 | 一种用于肝癌预后预测的分子标志物及其应用 |
CN113981085A (zh) * | 2021-11-08 | 2022-01-28 | 右江民族医学院附属医院 | 用于肝癌预后的mRNA基因组、mRNA基因对组、预测模型及应用 |
Non-Patent Citations (5)
Title |
---|
BOWEN WU等: "The diagnostic and prognostic value of cell division cycle associated gene family in Hepatocellular Carcinoma", vol. 11, no. 19 * |
GUANSHUI LUO等: "SSRP1 Is a Prognostic Biomarker Correlated with CD8+T CellInfiltration in Hepatocellular Carcinoma (HCC)" * |
ZHICHENG LIU等: "HN1 as a diagnostic and prognostic biomarker for liver cancer", vol. 40, no. 7 * |
张路遥;黄辉星;曹立环;余龙;: "CDCA8和INCENP mRNA在肝细胞癌组织中的表达及其临床意义", vol. 24, no. 02, pages 158 - 168 * |
蓝祝晶等: "KIF4A 在肝细胞癌中的表达及预后价值分析", vol. 31, no. 1 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116606932A (zh) * | 2023-03-22 | 2023-08-18 | 唐山市人民医院 | 一种胃癌预后预测风险模型的构建方法 |
CN116741271A (zh) * | 2023-06-09 | 2023-09-12 | 唐山市人民医院 | 一种食管鳞癌预后预测风险模型的构建方法及其应用 |
Also Published As
Publication number | Publication date |
---|---|
CN114592065B (zh) | 2023-12-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6275145B2 (ja) | まれな変異およびコピー数多型を検出するためのシステムおよび方法 | |
CN113286883A (zh) | 使用rna分析以检测疾病的方法 | |
US20240018598A1 (en) | COMPOSITIONS AND METHODS OF USING TRANSFER RNAS (tRNAS) | |
CN108277283B (zh) | lncRNA组合在制备预测肾透明细胞癌预后及分子靶向药物治疗敏感性的产品中的应用 | |
CN114592065B (zh) | 一组预测肝癌预后联合标志物及其应用 | |
JP2018524972A (ja) | 肺癌の診断または検出のための方法及び組成物 | |
US20190062841A1 (en) | Diagnostic assay for urine monitoring of bladder cancer | |
EP3472361A1 (en) | Compositions and methods for diagnosing lung cancers using gene expression profiles | |
CN114916233A (zh) | 泛癌症早筛预测方法 | |
CN113201590B (zh) | 用于评估肝细胞癌早期复发风险的lncRNA、评估方法及装置 | |
CN110699457B (zh) | 检测肺癌的引物组和试剂盒 | |
Noohi et al. | Prediction of blood miRNA-mRNA regulatory network in gastric cancer | |
EP3728630A1 (en) | Compositions and methods for diagnosing lung cancers using gene expression profiles | |
CA3214391A1 (en) | Cell-free dna sequence data analysis method to examine nucleosome protection and chromatin accessibility | |
CN117701720B (zh) | 宫颈癌clip3基因甲基化的检测试剂及试剂盒 | |
CN113604576B (zh) | 肺腺癌检测试剂盒、存储介质及电子设备 | |
CN116287252B (zh) | 长链非编码rna apcdd1l-dt在制备检测胰腺癌的产品中的应用 | |
CN115772566B (zh) | 用于辅助检测肺癌体细胞erbb2基因突变的甲基化生物标记物及其应用 | |
CN116515998A (zh) | 一种用于肝癌诊断的生物标志物的组合物及其应用 | |
Jaksik et al. | Nucleotide composition bias in high throughput gene expression measurement methods | |
Xu et al. | Identification of an Excellent PCR-Based Classifier to Predict Tumor Relapse in Stage II/III Colorectal Cancer and Its Clinical Application Irrespective of Consensus Molecular Subtypes | |
WO2024155681A1 (en) | Methods and systems for detecting and assessing liver conditions | |
Chen et al. | A Serum miRNA Signature Predicts the Prognosis of Locally Advanced Gastric Cancer | |
CN114231637A (zh) | 一种用于肺癌辅助诊断的snp标志物及试剂盒 | |
AU2023240345A1 (en) | Molecule counting of methylated cell-free dna for treatment monitoring |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |