CN112048556B - 原发性肝细胞肝癌分子分型及生存风险基因群及诊断产品和应用 - Google Patents

原发性肝细胞肝癌分子分型及生存风险基因群及诊断产品和应用 Download PDF

Info

Publication number
CN112048556B
CN112048556B CN202010799025.8A CN202010799025A CN112048556B CN 112048556 B CN112048556 B CN 112048556B CN 202010799025 A CN202010799025 A CN 202010799025A CN 112048556 B CN112048556 B CN 112048556B
Authority
CN
China
Prior art keywords
artificial sequence
related genes
genes
dna
gene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010799025.8A
Other languages
English (en)
Other versions
CN112048556A (zh
Inventor
周彤
胡志元
周伟庆
马琳琳
陆俊欢
魏星
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Huaao Platinum Ciss Medical Technology Co ltd
Original Assignee
Beijing Huaao Platinum Ciss Medical Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Huaao Platinum Ciss Medical Technology Co ltd filed Critical Beijing Huaao Platinum Ciss Medical Technology Co ltd
Priority to CN202010799025.8A priority Critical patent/CN112048556B/zh
Publication of CN112048556A publication Critical patent/CN112048556A/zh
Application granted granted Critical
Publication of CN112048556B publication Critical patent/CN112048556B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • G01N33/57438Specifically defined cancers of liver, pancreas or kidney
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57484Immunoassay; Biospecific binding assay; Materials therefor for cancer involving compounds serving as markers for tumor, cancer, neoplasia, e.g. cellular determinants, receptors, heat shock/stress proteins, A-protein, oligosaccharides, metabolites
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Immunology (AREA)
  • Urology & Nephrology (AREA)
  • Molecular Biology (AREA)
  • Hematology (AREA)
  • Biomedical Technology (AREA)
  • Analytical Chemistry (AREA)
  • Pathology (AREA)
  • Biochemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Cell Biology (AREA)
  • Organic Chemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Food Science & Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了原发性肝细胞肝癌分子分型及生存风险基因群及诊断产品和应用,所述基因群包括62个分子分型及生存风险评估相关基因和6个参考基因;所述62个分子分型及生存风险评估相关基因由18个细胞增殖相关基因、5个免疫相关基因、21个细胞外间质相关基因、17个外泌体相关基因、1个FTH家族基因组成。所述诊断产品包括用于检测所述基因群中基因的表达水平的试剂。本发明的原发性肝细胞肝癌分子分型及生存风险基因群及诊断产品通过筛选特定的基因群并对所述基因群中基因的表达水平进行检测,从而使得原发性肝细胞肝癌分子分型及生存风险评估具有较高的准确性。

Description

原发性肝细胞肝癌分子分型及生存风险基因群及诊断产品和 应用
技术领域
本发明涉及生物技术领域,具体来说,涉及原发性肝细胞肝癌分子分型及生存风险基因群及诊断产品和应用。
背景技术
原发性肝癌是一种高致死性的癌症类型,在中国发病率高,约占全世界发病人数的一半,我国发病率在肿瘤发病谱中占第四位,而死亡率为第二位。2015年我国有46.6万的新增肝癌病例和42.2万死亡病例。目前国内外对于手术后的肝癌的精准治疗仍面临很大挑战。
肝癌的大体分型和组织病理学分型已沿用了较长的时间,对于相同类型和相同分期的肝癌不管应用如何优化的临床治疗手段,其预后的差别仍然很大,且这些差别与组织病理学的分型或分期以及临床处理的方法之间并没有明显的相关性。因此,虽然诊疗的技术仍有不断的提升,但近10年来肝癌的5年生存率几乎没有明显的改善。
肝癌的治疗需要个性化,应把肝癌患者分为不同的亚群,在不同亚群临床病理分子特征的基础上采取相应的有效的治疗手段,以此提高肝癌的治疗效率。对于术后后继治疗的患者,如何选择具有针对性的治疗方案,提高治疗效率,需要新的技术手段来帮助医生和病人进行准确的判断。如何对肝癌患者进行精确分类,进而指导临床进行有效治疗,并同时避免无效或有害治疗是本发明的主要目标。
遗传学和表观遗传突变事件的研究有助于理解肝癌的发病机制并对患者进行分子分型,而分子分型可以指导临床个体化治疗和预后判断。个性化的肝癌治疗将肝癌患者分为不同的亚群,在不同亚群临床病理分子特征的基础上采取相应的有效的治疗手段,以此提高肝癌的治疗效率。
近期的一项研究结果显示,基于146个基因表达谱的分子标记物可有效识别索拉非尼的有效或无效肝癌患者。因而,如何在传统的肝癌临床病理分型和分期的基础上再结合肝癌的分子分型对肝癌患者进行针对性地个性化治疗,是提高疗效的重要思路与途径。
分子分型是肝癌分子病理学研究发展的方向和趋势,虽然Boyault等已利用转录组数据结合分子信号通路将西方肝癌分为6个亚型,且韩国学者将这一亚型分类用于亚洲肝癌患者,但对于将亚型用于预后及疗效评估尚未见报道。对肝癌的分子分型尚无统一的结论,目前的研究结果尚不能对临床医生和患者起到很好的指导治疗及预测预后的作用。
因此,本领域仍然亟需分型更准确、灵敏度和/或特异性更好的诊断分析产品和方法。
发明内容
针对相关技术中的上述技术问题,本发明提出原发性肝细胞肝癌(以下简称肝癌)分子分型及生存风险基因群及诊断产品和应用,能够克服现有技术的上述不足。
为实现上述技术目的,本发明的技术方案是这样实现的:
第一方面,本发明提供了一种用于原发性肝细胞肝癌分子分型和/或生存风险评估的基因群(又称为普瑞泰(Precitype)),包括62个分子分型及生存风险评估相关基因和6个参考基因;所述62个分子分型及生存风险评估相关基因由18个细胞增殖相关基因、5个免疫相关基因、21个细胞外间质相关基因、17个外泌体相关基因、1个FTH家族基因组成;
所述细胞增殖相关基因为:BIRC5、BUB1、CCNB2、CDC20、CDC6、CDK1、E2F1、FOXM1、GINS1、KIF18B、KIF2C、MKI67、MYBL2、PLK1、TOP2A、TPX2、TROAP、UBE2C,
所述免疫相关基因为:CD2、CD74、CD8A、PLA2G2D、SLAMF7,
所述细胞外间质相关基因为:ABCB11、ADH1B、ALDOB、APOF、AQP9、BHMT、CYP2A6、F9、FETUB、GLYAT、GYS2、HP、HPR、HRG、HSD17B6、RDH16、SERPINC1、SLC10A1、SLC27A5、TAT、TTR,
所述外泌体相关基因为:AEBP1、ANTXR1、APLNR、ASPN、CRISPLD2、DCN、EFEMP1、FBLN2、FMOD、GGT5、LAMC3、LUM、MFAP4、MGP、MXRA5、MYH11、SVEP1,
所述FTH家族基因为:FTH1;
所述6个参考基因为:GAPDH、GUSB、MRPL19、PSMC4、SF3A1、TFRC。
第二方面,本发明提供了另一种用于原发性肝细胞肝癌分子分型和/或生存风险评估的基因群,包括21个分子分型及生存风险评估相关基因和3个参考基因;所述21个分子分型及生存风险评估相关基因由7个细胞增殖相关基因、3个免疫相关基因、6个细胞外间质相关基因、4个外泌体相关基因、1个FTH家族基因组成;
所述细胞增殖相关基因为:BIRC5、CDC20、MKI67、MYBL2、TOP2A、TPX2、UBE2C,
所述免疫相关基因为:CD2、CD74、CD8A,
所述细胞外间质相关基因为:GLYAT、GYS2、HRG、SERPINC1、SLC10A1、TAT,
所述外泌体相关基因为:DCN、EFEMP1、LUM、MFAP4,
所述FTH家族基因为:FTH1;
所述3个参考基因为:ACTB、GAPDH和RPLP0。
第三方面,本发明提供了另一种用于原发性肝细胞肝癌分子分型和/或生存风险评估的基因群,包括21个分子分型及生存风险评估相关基因和3个参考基因;所述21个分子分型及生存风险评估相关基因由7个细胞增殖相关基因、3个免疫相关基因、6个细胞外间质相关基因、4个外泌体相关基因、1个FTH家族基因组成;
所述细胞增殖相关基因为:BIRC5、CDC20、MKI67、MYBL2、TOP2A、TPX2、UBE2C,
所述免疫相关基因为:CD2、CD74、CD8A,
所述细胞外间质相关基因为:GLYAT、GYS2、HRG、SERPINC1、SLC10A1、TAT,
所述外泌体相关基因为:DCN、EFEMP1、LUM、MFAP4,
所述FTH家族基因为:FTH1;
所述参考基因为:GAPDH、PSMC4和TFRC。
第四方面,本发明提供了一种对原发性肝细胞肝癌进行分子分型和/或生存风险评估的体外诊断产品,该体外诊断产品包括用于检测上述基因群中基因的表达水平的试剂。
优选地,所述试剂为用于检测由所述基因编码的多肽的量的试剂或用于检测所述基因的核酸(例如所述基因的DNA、RNA转录物或与RNA转录物互补的cDNA)的量的试剂。
优选地,所述用于检测由所述基因编码的多肽的量的试剂为能够与所述基因编码的多肽特异性结合的抗体、抗体片段或亲和性蛋白,更优选地,所述试剂为能够与所述基因编码的多肽特异性结合的抗体或抗体片段,所述抗体、抗体片段或者亲和性蛋白还可带有用于检测的标记物,所述标记物选自酶(例如过氧化物辣根酶)、放射性同位素、荧光标记物(例如Alexa Fluor染料、FITC、Texas Red、Cy3、Cy5等)、化学发光物质(例如鲁米诺)、生物素、量子点标记(Qdot),所述诊断产品为蛋白芯片(例如蛋白质微阵列)、ELISA诊断试剂盒或免疫组化(IHC)试剂盒;所述用于检测所述基因的核酸的量的试剂为用于检测所述基因转录的RNA(特别是mRNA)的量的试剂或检测与mRNA互补的cDNA的量的试剂。
优选地,所述用于检测所述基因的核酸的量的试剂为探针和/或引物,所述探针或引物能够与本发明的基因群的基因、其RNA转录物或与RNA转录物互补的cDNA的部分序列互补,其序列没有限制,优选具有高特异性,所述探针或引物可以是人工合成的。
优选地,所述用于检测所述基因的核酸的量的试剂为引物,所述引物用于定量PCR,包括但不限于半定量PCR和RT-PCR。用于定量PCR的引物的序列如SEQ ID NO.137-SEQID NO.208所示。
优选地,所述引物用于二代测序,优选地用于靶向测序,所述引物用于靶向测序且具有如SEQ ID NO.1-SEQ ID NO.136所示的序列。
优选地,所述试剂为探针,包括但不限于用于实时荧光定量PCR(RT-PCR)、原位杂交(ISH)、DNA印记或RNA印记、基因芯片技术等检测的探针。
优选地,所述探针为用于RT-PCR的探针,所述探针的序列如SEQ ID NO.137-SEQID NO.208所示。
优选地,所述探针为TaqMan探针,所述探针具有如SEQ ID NO.137-SEQ ID NO.208所示序列。所述探针可用于制备诊断产品,所述诊断产品为实时荧光定量PCR检测试剂盒。
优选地,所述试剂为可用于RT-PCR的探针和引物。所述探针为TaqMan探针,所述探针及引物的序列如SEQ ID NO.137-SEQ ID NO.208所示,所述探针和引物可用于制备诊断产品,所述诊断产品为实时荧光定量PCR检测试剂盒。
优选地,所述探针为能够用于原位杂交的探针,例如用于双色银染原位杂交(DISH)、DNA荧光原位杂交(DNA-FISH)、RNA荧光原位杂交(RNA-FISH)、显色原位杂交(CISH)等的探针,所述探针可带有标记物,所述标记物可为荧光基团(例如Alexa Fluor染料、FITC、Texas Red、Cy3、Cy5等)、生物素、地高辛等。
优选地,所述探针能够用于基因芯片检测,所述探针还可带有标记物,所述标记物可为荧光基团。所述探针可用于制备诊断产品,所述诊断产品为基因芯片。
优选地,所述诊断产品为基于二代测序(NGS)的诊断产品或基于荧光定量PCR的诊断产品,所述诊断产品为体外诊断产品的形式,优选诊断试剂盒的形式。
优选地,所述诊断产品可以为蛋白质微阵列、ELISA诊断试剂盒、免疫组化(IHC)试剂盒、二代测序试剂盒、实时荧光定量PCR试剂盒、基因芯片或其组合。
优选地,所述诊断产品为基于靶向测序的二代测序试剂盒或实时荧光定量PCR试剂盒。
优选地,所述诊断产品为基于靶向RNA-seq的二代测序试剂盒,其包含总RNA抽提试剂、逆转录试剂、二代测序试剂中的一种或多种,以及核苷酸序列如表4所示的引物。所述二代测序试剂为可供构建靶向RNA-seq的文库Illumina定制的试剂。
优选地,所述诊断产品为基于实时荧光定量PCR的PCR检测试剂盒,其包含总RNA抽提试剂、逆转录试剂、定量PCR试剂中的一种或多种,以及核苷酸序列如表5所示的引物和/或探针。所述定量PCR试剂为实时荧光定量PCR试剂。
所述总RNA抽提试剂可为本领域常规的总RNA抽提试剂。其实例包括但不限于RNAstorm CD201(Cell Data Sciences)、RNeasy FFPE Kit(Qiagen,#73504)、PureLink RNAMini Kit(Invitrogen)。
所述逆转录试剂可以为本领域常规的逆转录试剂,并且优选地包括dNTP溶液和/或RNA逆转录酶。逆转录试剂的实例包括但不限于NEB公司的
Figure BDA0002626679790000061
II逆转录酶(New England Biolabs,#M0368L)、ThermoFisher公司的RevertAid第一链cDNA合成试剂盒(RevertAid First Strand cDNA Synthesis Kit,ThermoFisher,#K1622)、ABI公司的TaqMan MicroRNA逆转录试剂盒(TaqManTM MicroRNA Reverse Transcription Kit,Applied Biosystems,#4366596)。
所述二代测序试剂可为本领域常规使用的试剂,只要能够满足对目标核酸进行二代测序的要求即可。二代测序试剂可以为市售产品,其实例包括但不限于Illumina公司的
Figure BDA0002626679790000062
Reagent Kit(Illumina,#MS-102-3001)和
Figure BDA0002626679790000063
Targeted RNA IndexKit A-96Indices(Illumina,#RT-402-1001)。二代测序技术为本领域常规的二代测序技术,优选为靶向RNA-seq技术。因此,所述二代测序试剂还可包括可供构建靶向RNA-seq的文库Illumina定制的试剂,例如Illumina公司的
Figure BDA0002626679790000064
Targeted RNA Custom PanelKit(Illumina,#RT-102-1001)。
所述定量PCR试剂为本领域常规使用的试剂,只要能够满足对目标核酸进行定量PCR的要求即可。所述定量PCR试剂较佳地为市售可得。所述定量PCR试剂为本领域常规的定量PCR试剂,且优选地包括dNTP溶液、DNA聚合酶。所述定量PCR试剂优选地为可用于实时荧光定量PCR的试剂,例如含有SYBR Green染料或用于TaqMan实时荧光定量PCR的试剂,更优选的为用于TaqMan实时荧光定量PCR的试剂。所述定量PCR试剂可选地包括可供构建定量PCR的文库的试剂。可通过可进行实时荧光定量检测的PCR仪(例如ABI 7500实时荧光定量PCR仪(Applied Biosystems)或罗氏的
Figure BDA0002626679790000071
480II)进行实时荧光定量PCR反应并计算基因表达水平。
优选地,所述诊断产品(优选试剂盒的形式)还包括从受试对象提取检测样本的器械;例如从受试对象体内提取组织或血液的器械,优选任何能用于取血的釆血针、注射器等。所述受试对象为哺乳动物,优选为人,特别是患有肝癌的患者。
第五方面,本发明提供了上述基因群在制备对原发性肝细胞肝癌进行分子分型和/或生存风险评估的诊断产品中的应用。
第六方面,本发明提供了上述诊断产品在制备对原发性肝细胞肝癌进行分子分型和/或生存风险评估的产品中的应用。
第七方面,本发明提供了一组免疫相关基因在制备评估肝癌远处转移风险的体外诊断产品中的应用,所述免疫相关基因包括CD2、CD74、CD8A。
可选地,所述免疫相关基因包括CD2、CD74、CD8A、PLA2G2D和SLAMF7。
上述基因群或诊断产品用于确定受试者对象的肝癌分子分型和/或生存风险的方法包括以下步骤:
(1)提供受试者对象的样本;
(2)测定所述样本中上述基因群中基因的表达水平;
(3)确定所述受试者的肝癌分子分型和/或生存的风险。
上述方法可以用于诊断或非诊断目的。
在步骤(1)中使用的样本没有特别的限制,只要能从其中获得基因群中的基因的表达水平即可,例如可以从所述样本提取受试者对象的总RNA。所述样本优选地为组织、血液、血浆、体液或其组合的样本,优选为组织样本,特别是石蜡组织样本。在优选的实施方案中,样本为肿瘤组织样本或包含肿瘤细胞的组织样本。
步骤(2)中可采用多种方法测定本发明的基因群中基因的表达水平,包括但不限于检测所述基因的核酸和其编码的多肽的量。本领域技术人员可根据需要选择步骤(1)中的样本种类和样本量,并选择本领域的常规技术实现步骤(2)所述测定。所述基因群可参见表1的描述。
优选地,步骤(2)可通过检测所述基因编码的多肽的量来实现。所述检测可通过如上所述的试剂与本领域已知的技术来实现,其中所述技术包括但不限于酶联免疫吸附分析法(ELISA)、化学发光免疫分析技术(例如免疫化学发光分析、化学发光酶免疫分析、电化学发光免疫分析)、流式细胞术、免疫组化法(IHC)。
优选地,步骤(2)可通过检测所述基因的核酸的量实现。所述检测可通过如上所述的试剂与本领域已知的技术来实现,其中所述技术包括但不限于分子杂交技术、定量PCR技术或核酸测序技术等来实现。分子杂交技术包括但不限于ISH技术(例如DISH、DNA-FISH、RNA-FISH、CISH技术等)、DNA印记或RNA印记技术、基因芯片技术(例如微阵列芯片或微流控芯片技术)等,优选原位杂交技术。定量PCR技术包括但不限于半定量PCR和RT-PCR技术,优选RT-PCR技术。核酸测序技术包括但不限于Sanger测序、二代测序(NGS)、三代测序、单细胞测序技术等,优选二代测序,更优选靶向RNA-seq技术。
优选地,在步骤(2)中,采用二代测序技术测定本发明的基因群中基因的表达水平。所述基因群可参见表4。步骤(2)可包括:
(2-1)提取样本中的总RNA;
(2-2)将(2-1)所述总RNA转化为cDNA,然后将其制备成可用于二代测序的文库;
(2-3)对步骤(2-2)获得的文库进行测序。
步骤(2-1)的提取可以通过本领域常规方法进行,优选地利用RNA提取试剂盒提取检测受试者的新鲜冷冻组织或石蜡包埋组织的总RNA。在更优选的实施方案中,可以使用RNAstorm CD201或Qiagen 73504进行提取。
优选地,步骤(2-2)可包括以下步骤:(i)将提取的总RNA反转录生成如表1所述的68个基因的cDNA;(ii)将所得cDNA制备成可供测序的文库。
步骤(2-3)可通过RNA测序完成。利用试剂盒中的引物对表4所示的基因进行扩增,根据步骤(2-2)所制备的文库的不同,可对所得基因进行二代测序。优选地,所述二代测序为靶向RNA-seq技术,可利用Illumina NextSeq/MiSeq/MiniSeq/iSeq测序仪进行双端测序或单端测序。
优选地,在步骤(2)中,采用RT-PCR方法测定本发明的基因群中基因的表达水平。所述基因群可参见表2。步骤(2)可以包括:
(2-1)提取样本中的总RNA;
(2-2)将(2-1)所述总RNA反转录为cDNA;
(2-3)将所获得cDNA进行RT-PCR检测。
步骤(2-1)的提取可以通过本领域常规方法进行,优选地利用可商购的RNA提取试剂盒RNA提取试剂盒提取受试对象的新鲜冷冻组织或石蜡包埋组织的总RNA。
步骤(2-2)所述反转录可使用可商购的逆转录试剂盒进行。
优选地,步骤(2-3)所述RT-PCR方法为TaqMan RT-PCR,可使用引物和探针对如表5所示的基因分别进行RT-PCR检测,所述引物和探针如上所述,所述探针为TaqMan探针。优选地所述引物和探针的序列如表5所示。
优选地,步骤(2-3)所述RT-PCR方法为基于SYBR Green染料的RT-PCR,可使用引物和可商购的SYBR Green预混物对表5所示基因分别或同时进行检测,所述引物如上所述。优选地,所述引物的序列如SEQ ID NO.137-SEQ ID NO.208所示(又参见表5)。上述RT-PCR检测可使用ABI 7500实时荧光定量PCR仪(Applied Biosystems)或罗氏的
Figure BDA0002626679790000091
480II)进行。反应结束后,记录每个基因的Ct值,代表了各个基因的表达水平。
优选地,在步骤(2)中,采用二代测序技术测定本发明的基因群中基因的表达水平。所述基因群可参见表3。步骤(2)可包括:
(2-1)提取样本中的总RNA;
(2-2)将(2-1)所述总RNA转化为cDNA,然后将其制备成可用于二代测序的文库;
(2-3)对步骤(2-2)获得的文库进行测序。
步骤(2-1)的提取可以通过本领域常规方法进行,优选地利用RNA提取试剂盒提取检测受试者的新鲜冷冻组织或石蜡包埋组织的总RNA。在更优选的实施方案中,可以使用RNAstorm CD201或Qiagen 73504进行提取。
优选地,步骤(2-2)可包括以下步骤:(i)将提取的总RNA反转录生成如表3所述的24个基因的cDNA;(ii)将所得cDNA制备成可供测序的文库。
步骤(2-3)可通过RNA测序完成。利用试剂盒中的引物对表3所示的基因进行扩增,根据步骤(2-2)所制备的文库的不同,可对所得基因进行二代测序。优选地,所述二代测序为靶向RNA-seq技术,可利用Illumina NextSeq/MiSeq/MiniSeq/iSeq测序仪进行双端测序或单端测序。
优选地,步骤(3)可以通过将所得测序结果进行统计分析完成。可以任选地根据Hu等开创的单一样品预测法SSP(Single Sample Predictor)和Parker等优化的方法来进行肝癌分型和风险预测。对将所得测序结果基因表达数据进行分析获得单一样品的亚型分型,并可以计算生存风险。
本发明的有益效果:本发明的原发性肝细胞肝癌分子分型及生存风险基因群及诊断产品通过筛选特定的基因群并对所述基因群中基因的表达水平进行检测,从而使得原发性肝细胞肝癌分子分型及生存风险评估具有较高的准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1表示根据肝癌组织中基因表达水平,将肝癌分为HCC1型、HCC2型、HCC3型、HCC4型、HCC5型、HCC6型及混合型(Mixed)。
图2表示肝癌每种亚型的生存风险。
图3表示增殖指数对肝癌预后的影响。
图4表示免疫指数对肝癌预后的影响。
图5表示FTH指数对肝癌预后的影响。
图6表示根据亚型、增殖指数、免疫指数及FTH指数所计算出的肝癌生存风险指数。
图7表示对22例肝癌样本进行肝癌分子分型及风险估计检的结果分布。
具体实施方式
以下将对本发明进一步详细说明,应理解,所述用语旨在描述目的,而非限制本发明。
除非另有说明,本发明使用的所述技术和科学术语具有与本发明所属领域技术人员通常所理解的相同的含义。若存在矛盾,则以本发明提供的定义为准。
当以范围、优选范围、或者优选的数值上限以及优选的数值下限的形式表述某个量、浓度或其他值或参数的时候,应当理解相当于具体揭示了通过将任意一对范围上限或优选数值与任意范围下限或优选数值结合起来的任何范围,而不考虑该范围是否具体揭示。除非另有说明,本发明所列出的数值范围旨在包括范围的端点和该范围内的所有整数和分数(小数)。
术语“约”、“大约”当与数值变量并用时,通常指该变量的数值和该变量的所有数值在实验误差内(例如对于平均值95%的置信区间内)或在指定数值的±10%内,或更宽范围内。
术语“任选”或“任选存在”是指随后描述的事件或情况可能发生或可能不发生,该描述包括发生所述事件或情况和不发生所述事件或情况。例如,当某个基团描述为任选地被取代时,其可以是未被取代的,也可以是被取代的,例如被一个或多个独立地选自本发明所述的那些取代基取代。本领域技术人员应当理解,任选还涵盖取代基的种类和数目可以任意选择和组合的含义,只要形成的化合物是稳定的。
表述“包含”或与其同义的类似表述“包括”、“含有”和“具有”等是开放性的,不排除额外的未列举的元素、步骤或成分。表述“由…组成”排除未指明的任何元素、步骤或成分。表述“基本上由……组成”指范围限制在指定的元素、步骤或成分,加上任选存在的不会实质上影响所要求保护的主题的基本和新的特征的元素、步骤或成分。应当理解,表述“包含”涵盖,表述“基本上由……组成”和“由……组成”。
在本发明中,术语“预后”是指对肝癌的病程和发展结果的预测,包括但不限于对肝癌复发的可能性的预测,复发可能性较低的肝癌的预后较好,反之则预后较差。
在本发明中,术语“复发”是指在指定观察期间内肝癌经治疗后肿瘤细胞的再次出现,根据再次发现肿瘤细胞的位置,可包括局部复发、区域复发或远处转移。在本发明中,术语“复发”优先表现为肝癌远处转移或局部复发,更优先表现为远处转移。
在本发明中,术语“风险”指不确定事件发生的概率或可能性。因此,肝癌复发的可能性可表示为“生存风险”,包括但不限于发生肝癌局部复发、区域复发或远处转移的风险。在本发明中,术语“生存风险”优先表示肝癌远处转移风险或局部复发风险,更优先表示远处转移风险,并可通过“无远处转移生存率”来体现。因此,在本发明中,无远处转移生存率较高的肝癌,其生存风险较低,预后较好;无远处转移生存率较低的肝癌,其生存风险较高,预后较差。
在本发明中,术语“多肽”是指由氨基酸以肽键连接组成的化合物,包括多肽的全长或氨基酸片段。在本发明中,术语“目标多肽”优先指待检测基因编码的多肽、蛋白或蛋白片段。
术语“核苷酸”包括脱氧核糖核苷酸和核糖核苷酸。术语“核酸”是指由两个或以上核苷酸组成的聚合物,涵盖脱氧核糖核酸(DNA)、核糖核酸(RNA)以及核酸类似物。在本发明中,术语“目标核酸”优先指目标基因的DNA、RNA转录物或与RNA转录物互补的cDNA。术语“RNA转录物”指总RNA,包括编码或者非编码RNA,例如mRNA、rRNA或tRNA,可直接来自于组织或外周血样本中,也可间接来自于细胞裂解后的组织或血液样本中。术语“mRNA”可包括前体mRNA和成熟mRNA,既可为mRNA全长也可为其片段。在本发明中,可用于检测的RNA优选为mRNA,更优选为成熟mRNA。术语“cDNA”是指具有与RNA互补碱基序列的DNA。本领域技术人员可应用本领域已知方法由基因的DNA获得其RNA转录物和/或与其RNA转录物互补的cDNA,例如,通过化学合成方法或分子克隆方法。
术语“杂交”是指在适当条件下,两个核酸片段通过稳定且特异的氢键结合,形成双螺旋复合物的过程。术语“探针”、“杂交探针”或“分子探针”是指包括至少5个核苷酸的核酸片段(可以为DNA或RNA),比如,包含5~1000个核苷酸,其能在指定条件下与目标核酸或其扩增产物杂交形成复合物。术语“TaqMan探针”是一种基于TaqMan技术的探针,其5’末端携带荧光基团,例如FAM、TET、HEX、NED、VIC或Cy5等,3’末端携带荧光淬灭基团(例如TAMRA和BHQ基团)或非荧光淬灭基团(TaqMan MGB探针),具有能够与目标核酸杂交的核苷酸序列,当应用于实时荧光定量PCR(RT-PCR)时可报告与其形成复合物的核酸的量。术语“扩增引物”或“引物”,是指包含5~100个核苷酸的核酸片段,优选地,包含能起始酶促反应(如,酶促扩增反应)的15~30个核苷酸。
术语“参考基因”在本发明中指能够作为参照物用于校正和标准化目标基因的表达水平的基因,可以考虑的参考基因纳入标准有:(1)在组织中稳定表达,其表达水平不受病理状况或药物治疗影响或者影响较小;(2)表达水平不宜过高,以避免在表达数据(如通过二代测序获得)获取的数据中占比过高,影响其他基因的数据检测和解读的准确性。因此,可用于检测本发明的参考基因表达水平的试剂也在本发明的保护范围之内。
本发明所述的基因表达水平的检测可通过检测核酸或多肽的量来实现,并可使用本领域的常规技术而没有任何限制。在所述检测中,目标多肽的量,可以针对样本中总蛋白的量或参考基因所编码的多肽的量来标准化。在所述检测中,目标核酸的量,例如目标基因的DNA、其RNA转录物或与RNA转录物互补的cDNA的量,可以针对样本中总DNA、总RNA或总cDNA的量或者针对一组参考基因的DNA、RNA转录物或与RNA转录物互补的cDNA的量来标准化。
下面通过实施例的方式进一步说明本发明,但并不因此将本发明限制在所述的实施例范围之中。下列实施例中未注明具体条件的实验方法,按照常规方法和条件,或按照商品说明书选择。本发明的实施例中所用的试剂和仪器均是可商购的。
实施例1
评估肝癌亚型分型及生存风险相关基因群的筛选
方法:通过EPIG基因表达谱分析程序(参见Zhou,Chou et al,2006.EnvironHealth Perspect 114(4),553-559;Chou,Zhou et al,2007.BMC Bioinformatics 8,427)分析TCGA数据库中370例具有完整临床信息的原发性肝癌基因表达量,筛选出与肝癌生存风险密切相关的细胞增殖相关基因、免疫相关基因、细胞间质相关基因、外泌体相关基因、FTH家族基因,并在每组基因中计算并优选对分型及生存风险贡献率大的基因。
结果:共筛选获得了与肝癌亚型分型及生存风险相关的62个基因及6个参考基因,即68个基因测试组合。基因列表见表1。
将所筛选的68个基因在221例原发性肝癌的Affymatrics基因芯片表达谱的数据中进行有效性和稳定性验证。
表1:肝癌分子分型和/或生存风险的基因群
Figure BDA0002626679790000141
Figure BDA0002626679790000151
Figure BDA0002626679790000161
实施例2
二代测序法肝癌进行分子分型及生存风险评估
实验方法:采用68基因测试组合,其中62个肝癌亚型分型及生存风险相关基因群(增殖相关基因BIRC5、BUB1、CCNB2、CDC20、CDC6、CDK1、E2F1、FOXM1、GINS1、KIF18B、KIF2C、MKI67、MYBL2、PLK1、TOP2A、TPX2、TROAP、UBE2C,免疫相关基因CD2、CD74、CD8A、PLA2G2D、SLAMF7,细胞外间质相关基因ABCB11、ADH1B、ALDOB、APOF、AQP9、BHMT、CYP2A6、F9、FETUB、GLYAT、GYS2、HP、HPR、HRG、HSD17B6、RDH16、SERPINC1、SLC10A1、SLC27A5、TAT、TTR,外泌体相关基因AEBP1、ANTXR1、APLNR、ASPN、CRISPLD2、DCN、EFEMP1、FBLN2、FMOD、GGT5、LAMC3、LUM、MFAP4、MGP、MXRA5、MYH11、SVEP1,以及FTH基因FTH1)用于分子分型及生存风险评估,6个参考基因(包括GAPDH、GUSB、MRPL19、PSMC4、SF3A1和TFRC)作为内标。计算生存风险指数时采用表1中除6个参考基因外的其他所有62个基因。实验结果:
1、肝癌分子分型
如上所述,利用表1所示62基因中的56个基因(增殖相关基因BIRC5、BUB1、CCNB2、CDC20、CDC6、CDK1、E2F1、FOXM1、GINS1、KIF18B、KIF2C、MKI67、MYBL2、PLK1、TOP2A、TPX2、TROAP、UBE2C,细胞外间质相关基因ABCB11、ADH1B、ALDOB、APOF、AQP9、BHMT、CYP2A6、F9、FETUB、GLYAT、GYS2、HP、HPR、HRG、HSD17B6、RDH16、SERPINC1、SLC10A1、SLC27A5、TAT、TTR,外泌体相关基因AEBP1、ANTXR1、APLNR、ASPN、CRISPLD2、DCN、EFEMP1、FBLN2、FMOD、GGT5、LAMC3、LUM、MFAP4、MGP、MXRA5、MYH11、SVEP1)对591例肝癌病例进行分子分型,将肝癌肿瘤分为6个亚型HCC1型、HCC2型、HCC3型、HCC4型、HCC5型、HCC6型及混合型,其中,混合型不属于HCC1至HCC6的任何一种亚型,但可能包含至少两种以上的亚型(见图1)。
通过计算不同亚型生存的数量和时间,绘制Kaplan-Meier生存曲线可以获得相应的转移风险。如图2所示,上述六个亚型的生存风险不同,其中,HCC1-3亚型5年生存率较好,HCC 4-6亚型及混合型5年生存率相对较差。
2、增殖指数
通过18个增殖相关基因BIRC5、BUB1、CCNB2、CDC20、CDC6、CDK1、E2F1、FOXM1、GINS1、KIF18B、KIF2C、MKI67、MYBL2、PLK1、TOP2A、TPX2、TROAP、UBE2C的表达水平计算出增殖指数,可将肝癌分为三组,增殖快、增殖中和增殖慢(见图3),其中增值快一组5年生存率最低。
Figure BDA0002626679790000171
3、免疫指数对不同亚型生存风险的影响
根据5个免疫相关基因CD2、CD74、CD8A、PLA2G2D、SLAMF7的表达水平计算免疫指数,根据免疫指数可将每个亚型进一步分为两组,免疫强组和免疫弱组,并观察两组之间的生存差异。其中,增殖性相对高的亚型HCC4、HCC5和HCC6,免疫强的病例的死亡风险显著低于免疫弱的病例(P<0.01);而增殖性低的亚型HCC1、HCC2和HCC3,免疫强的病例和免疫弱的病例的死亡风险无显著差异(见图4)。
Figure BDA0002626679790000172
4、FTH指数
根据FTH1的表达水平计算FTH指数。FTH指数弱,肝癌死亡风险相对低;FTH指数强,肝癌死亡风险相对高。此现象在HCC4和HCC6亚型中尤为明显。(见图5)。
5、生存风险评估
肿瘤生存风险的计算采用Cox模型,以死亡是否发生及发生时间作为观察终点,根据肿瘤的亚型、免疫指数、增殖指数和FTH指数对于生存发生影响的相对危险度确定相应系数,计算方法如下:
生存风险评分(Risk ofDeath,RD)的计算:0-100
0-49,低风险;50-69,中风险;70-100,高风险;
RD=0.01*HCC1+0.03*HCC2-0.2*HCC3-0.07*G4+0.12*HCC5)+0.17*HCC6+0.37*FTH指数+0.23*增殖指数-0.34*免疫指数
其中,“HCC1”代表该肿瘤与HCC1型肿瘤的pearson相关系数;
“HCC2”代表该肿瘤与HCC2型肿瘤的pearson相关系数;
“HCC3”代表该肿瘤与HCC3型肿瘤的pearson相关系数;
“HCC4”代表该肿瘤与HCC4型肿瘤的pearson相关系数;
“HCC5”代表该肿瘤与HCC5型肿瘤的pearson相关系数;
“HCC6”代表该肿瘤与HCC6型肿瘤的pearson相关系数;
如图6所示,根据所计算得出的生存风险评分,可将肿瘤生存的风险分为三组,低风险(0-49)、中等风险(50-69)和高风险(70-100)。
实施例3
定量PCR法肝癌分子分型及生存风险相评估
实验方法:采用24基因测试组合,其中21个肝癌亚型分型及生存风险相关基因群(增殖相关基因:BIRC5、CDC20、MKI67、MYBL2、TOP2A、TPX2和UBE2C;免疫相关基因:CD2、CD74和CD8A;细胞间质相关基因:GLYAT、GYS2、HRG、SERPINC1、SLC10A1、TAT;外泌体相关基因:DCN、EFEMP1、LUM和MFAP4;FTH基因:FTH1)用于分子分型及生存风险评估,3个参考基因(ACTB,GAPDH和RPLP0)作为内标。计算生存风险指数时采用表2中除参考基因外的其他所有21个基因。
表2:肝癌分子分型和/或生存风险的基因群
Figure BDA0002626679790000181
Figure BDA0002626679790000191
实施例4
二代测序法肝癌进行分子分型及生存风险评估
实验方法:采用24基因测试组合,其中21个肝癌亚型分型及生存风险相关基因群(增殖相关基因:BIRC5、CDC20、MKI67、MYBL2、TOP2A、TPX2和UBE2C;免疫相关基因:CD2、CD74和CD8A;细胞间质相关基因:GLYAT、GYS2、HRG、SERPINC1、SLC10A1、TAT;外泌体相关基因:DCN、EFEMP1、LUM和MFAP4;FTH基因:FTH1)用于分子分型及生存风险评估,3个参考基因(GAPDH、PSMC4和TFRC)作为内标。计算生存风险指数时采用表3中除参考基因外的其他所有21个基因。
表3:肝癌分子分型和/或生存风险的基因群
Figure BDA0002626679790000192
Figure BDA0002626679790000201
实施例5
评估肝癌分子分型及生存风险基因群的二代测序检测试剂盒分析方法
实验方法:取肝癌肿瘤组织,提取肿瘤细胞中的RNA,采用Illumina二代测序(NGS)技术,设计并优化如表1所示的68个基因对应的68对测序引物(参见表4),分别检测基因的表达水平。步骤如下:
(1):取检测对象肿瘤或石蜡包埋组织,获取检测对象含肿瘤细胞高的区域为原始材料。
(2):提取组织中总RNA,例如可使用Cell Data Sciences公司的RNA抽提试剂盒(RNA storm CD201)或Qiagen公司的RNA抽提试剂盒(Qiagen RNease FFPE kit,货号#73504)。
(3):将所得RNA制备成可供靶向RNA-seq技术二代测序的文库,文库的制备方法包括以下步骤:
(3-1):使用
Figure BDA0002626679790000212
II逆转录酶(New England Biolabs,#M0368L)将步骤(2)中提取的RNA反转录成cDNA。
(3-2):使用Illumina的
Figure BDA0002626679790000213
Targeted RNA建库试剂盒(#15034457)将所得cDNA处理制成可供测序的文库,具体步骤如下:(i)杂交:加入TOP(具体组成参见表4)4.5μ1,混匀后加入21μ1 OB1,升温至70℃后缓慢梯度降温至30℃;(ii)延伸和连接:将(i)中产物用磁力架吸附后弃上清,用试剂盒中AM1和UB1洗涤两次后弃上清,加入36μl ELM4,在PCR仪或金属浴中37℃孵育45分钟;(iii)对(ii)所得产物进行测序标签(Index)的连接,然后PCR:将(ii)所得产物用磁力架吸附后弃上清,加入稀释40倍的HP3 18μ1,用磁力架吸附后吸取16μ1,加入17.3μ1 TDP1、0.3μ1 PMM2、6.4μ1 Index,混匀后进行PCR扩增32个循环;(ⅳ)釆用Gnome DNA(QuestGenomics,南京)纯化试剂盒纯化DNA,得到文库。
(4):对所得DNA文库进行用NextSeq/MiSeq/MiniSeq/iSeq进行二代测序。用IlluminaNextSeq/MiSeq/MiniSeq/iSeq测序仪进行双端测序或单端测序。
(5):结果统计分析。将所得测序结果进行统计分析,根据Hu等提出的单一样品预测法SSP(Single Sample Predictor)或Parker等优化的方法来进行肝癌分型和风险预测。对所得测序结果基因表达数据进行分析。
表4:本发明的基因群的基因及其扩增引物
Figure BDA0002626679790000211
Figure BDA0002626679790000221
Figure BDA0002626679790000231
Figure BDA0002626679790000241
实施例6
评估肝癌分子分型及生存风险基因群的定量PCR检测试剂盒分析
实验方法:取肝癌肿瘤组织,提取肿瘤细胞中的RNA,采用TaqMan RT-PCR技术,设计并优化如表2所示24个基因对应的24对引物和24个TaqMan探针(参见表5),分别检测基因的表达水平。步骤如下:
(1):取检测对象肿瘤新鲜或石蜡包埋组织,获取检测对象中含肿瘤细胞高的区域作为原始材料。
(2):提取组织中总RNA。使用RNA storm CD201RNA或者Qiagen RNease FFPE kitRNA抽提试剂盒来提取。
(3):RT-PCR检测。所述RT-PCR检测的方法为TaqMan RT-PCR,对表2中所示基因(又见表5),分别进行RT-PCR检测。步骤如下:
(3-1):提取检测对象的总RNA;
(3-2):对(3-1)所得RNA进行反转录,具体步骤为:取总量为2μg左右的样本RNA(例如取200ng/μl左右的样本RNA 11μl),和11μl参考RNA一起反转录(Thermo K1622反转录试剂盒)获得样本cDNA和参考cDNA;向样本cDNA加入80μl无RNA酶水将其5倍稀释,向参考cDNA加入180μl无RNA酶水将其10倍稀释;
(3-3):对(3-2)所得对应每个基因的cDNA样本进行TaqMan RT-PCR检测对21个靶基因和3个参考基因(参见表5)分别进行检测。步骤如下:(i)制备每孔反应体系:(3-2)所得的cDNA样本2μl(总量100-400ng),如表5所示的正向、反向特异性引物及TaqMan荧光探针(10μM)共1.4μl,反应预混合液10μl,DEPC水6.6μl;(ii)95℃灭活逆转录酶2分钟;(iii)扩增与检测:95℃变性25秒,60℃退火、延伸及荧光检测60秒,进行45个循环,暂缓期60℃60秒;扩增反应结束后,记录每个基因的Ct值,代表了各个基因的表达水平。
(4):结果统计分析。将所得测序结果进行统计分析,根据Hu等提出的单一样品预测法SSP(Single Sample Predictor)或Parker等优化的方法来进行肝癌分型和风险预测。对所得测序结果基因表达数据进行分析。
实验结果:对22个肝癌样本进行肝癌分子分型及风险评估检测,结果见表6、图7。
表5:本发明的基因群的基因及其扩增引物和探针
Figure BDA0002626679790000251
Figure BDA0002626679790000261
Figure BDA0002626679790000271
表6:定量PCR检测肝癌样本结果
Figure BDA0002626679790000272
Figure BDA0002626679790000281
实施例7:肝癌分子分型预测索拉菲尼靶向治疗
(1)实验方法:收集139例原发性肝癌临床及基因表达数据,其中根据索拉菲尼治疗有效41例,无效98例。采用24基因测试组合进行肝癌亚型分型,并评估每个亚型内索拉菲尼治疗的有效率。
(2)实验结果:每个亚型索拉菲尼治疗有效率有显著差异,结果见表7。其中HCC1-4为低效组,总体有效率8%;HCC5-6为高效组,总体有效率64%,结果见表8。
表7:肝癌分子亚型与索拉菲尼有效率分布
分子亚型 HCC1 HCC2 HCC3 HCC4 HCC5 HCC6 总体
有效(n) 2 1 3 1 20 14 41
无效(n) 28 19 22 10 9 10 98
有效率 7% 5% 12% 9% 69% 58% 29%
表8:索拉菲尼有效率分组
分组 平均 低效组 高效组
有效率 29% 8% 64%
综上所述,借助于本发明的上述技术方案,通过筛选特定的基因群并对所述基因群中基因的表达水平进行检测,从而使得原发性肝细胞肝癌亚型分型及发生远处转移风险的评估具有较高的准确性。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
序列表
<110> 北京华奥铂瑞赛思医疗科技有限公司
<120> 原发性肝细胞肝癌分子分型及生存风险基因群及诊断产品和应用
<160> 208
<170> SIPOSequenceListing 1.0
<210> 1
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
gtttcctcaa attctttctt cttat 25
<210> 2
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
tcttggctct ttctctgtcc agttt 25
<210> 3
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
attgcccttg tagctctgca tgtgg 25
<210> 4
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
tccggggtgt ccatggccag aggac 25
<210> 5
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
ctgatcttca ggagtttgct gcttg 25
<210> 6
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
agttttcatt tactttcacc acatt 25
<210> 7
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
tgttgccagg acattggact gccag 25
<210> 8
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
cttgacagcc ccttgatgct gggtg 25
<210> 9
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
ggatcgggtt tgaggcatga cgaca 25
<210> 10
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
acccgcagcc ttcacccagc tccgc 25
<210> 11
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
aacctggaat cctgcataag cacat 25
<210> 12
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
ttggatgacg aagttccttt aatag 25
<210> 13
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
aaggtcctga cacgtcacgt aggcc 25
<210> 14
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
gctggctgtc agtgtcctcg gagag 25
<210> 15
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
gaatctgcgt tttcactctc cattg 25
<210> 16
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
ccgccgccgt taggccgtag ctccg 25
<210> 17
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
tcctccagaa cttgtctgag tccat 25
<210> 18
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
gttgcccttc gggcgcgcga tgcag 25
<210> 19
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
atggtgtgtg tcttcccagc cccgg 25
<210> 20
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
agttgtagcc ctggaggaag ctgtc 25
<210> 21
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
cagtccttac attggcactg tgaat 25
<210> 22
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 22
ggatcttgat agcgagaccg ggaaa 25
<210> 23
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 23
ctgtgcactg aagaacacat ttcct 25
<210> 24
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 24
ctctctgagg tggggagcag aggtt 25
<210> 25
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 25
tggtagtgca gctcatccag atcct 25
<210> 26
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 26
cagcgcgtcc gccgagacat ccccc 25
<210> 27
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 27
tgggcacaag atgagcttgg tgtga 25
<210> 28
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 28
tggaagaagt tgatctgcac gctgc 25
<210> 29
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 29
aagtccatat ggaagtcatc actct 25
<210> 30
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 30
tgactgcttt cgaaacaatt ttctc 25
<210> 31
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 31
cccttttctg aaatcttgaa gtctg 25
<210> 32
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 32
tagccgacag cctcccgcaa ctctt 25
<210> 33
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 33
cgttgaatat tgagcggtgg tttct 25
<210> 34
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 34
atcttggttc tcctggtcca cggcg 25
<210> 35
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 35
gtgacctgct ttgagtaggt ttctt 25
<210> 36
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 36
tccagagctc ggcagcatgt gtgtt 25
<210> 37
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 37
tcctccacat atgccaatga tgaga 25
<210> 38
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 38
gacaggctcg acactggatt ccttg 25
<210> 39
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 39
atggaaaagc ctgtgtacag ggctc 25
<210> 40
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 40
agggcgccgg cccagcatgg gcagt 25
<210> 41
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 41
atctcgccga aaggctgggc ttgtc 25
<210> 42
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 42
caggccgggg acatttgcaa acacg 25
<210> 43
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 43
tcacaggcac acagctgctg ctcac 25
<210> 44
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 44
ggatgttccc ctgggaaaag ttgta 25
<210> 45
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 45
tctttcacgg gtccagaggc tgctg 25
<210> 46
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 46
ccaaaggata tagatgaggg tgagg 25
<210> 47
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 47
atggtaattg caacccacag ccaac 25
<210> 48
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 48
atgaatttga ggaagccaga ggaaa 25
<210> 49
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 49
tttctttacc tcccatagca cagct 25
<210> 50
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 50
ctgtgctcat gtcgtttctg tcttc 25
<210> 51
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 51
atcctctgca ggcggttccc catgg 25
<210> 52
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 52
cagattcatc tgcagccagg atccc 25
<210> 53
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 53
tatcatgatg agtctgaggc cacgc 25
<210> 54
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 54
ccagtcattg agaagtgaga ctgcc 25
<210> 55
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 55
cctcgactga gaatagcttg ggcaa 25
<210> 56
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 56
aacgtgccca agaactcaga gaggg 25
<210> 57
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 57
aagattctcc cagtattcct tcctg 25
<210> 58
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 58
aacccagggt ttggtgtgca tgtcc 25
<210> 59
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 59
ggtttttcaa gtagaactcc gtgtt 25
<210> 60
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 60
tgcggatgag aaaggagtca atgaa 25
<210> 61
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 61
gccgattcag aattttgttg gcgtt 25
<210> 62
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 62
agcactgagt agatatccta aaagg 25
<210> 63
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 63
tgtaagatag aacagagatc ccagg 25
<210> 64
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 64
gtattcctgg gcgtcgttca ctcgg 25
<210> 65
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 65
gcaccttgca atggtaacat catgg 25
<210> 66
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 66
ctagtctctg cagatgtttc cggga 25
<210> 67
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 67
gtctgaatca cagtatagat gcctc 25
<210> 68
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 68
cacttcccaa gcaacttcaa agagc 25
<210> 69
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 69
atccactgct tctcattgtt taagg 25
<210> 70
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 70
tctgtgcgca gtttgtagta gttct 25
<210> 71
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 71
tgtcgtcccc agagcaggag ggaaa 25
<210> 72
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 72
actcatcttg gttggtcttg cctct 25
<210> 73
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 73
gcacatctaa gactaagtaa tatac 25
<210> 74
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 74
gtgggcatca gcaatccgca gcaat 25
<210> 75
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 75
aaggccgcca ggtagagcca catag 25
<210> 76
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 76
cttaggaaga gtccagtcct agaga 25
<210> 77
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 77
attattcacc aggccccaga gtcct 25
<210> 78
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 78
tctctcacgc actccttcac ccact 25
<210> 79
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 79
gagcagcaag gacaaaagat aaacc 25
<210> 80
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 80
tccagaggtt acagttccta tcaca 25
<210> 81
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 81
agaaggtgga gcaggtggtc atcac 25
<210> 82
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 82
ggttcatgtc ccccttcatg gccag 25
<210> 83
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 83
ttgggaagga tctcctccag gctct 25
<210> 84
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 84
cacccgggcc ccagagctca gcaca 25
<210> 85
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 85
tctgaatcat gtatgggtcc atcac 25
<210> 86
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 86
taaaggagaa agcagcctcc aagaa 25
<210> 87
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 87
atgcagctct ccagactcac tggtt 25
<210> 88
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 88
atggctccca ggtgtcatca gcagc 25
<210> 89
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 89
tttgtctttg gtcttttccg gaggc 25
<210> 90
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 90
tccctggccg cttccctggc ttgcc 25
<210> 91
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 91
agatttcatt ccagtggtgc agcac 25
<210> 92
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 92
aagtacaggt caaatccgcc gtagc 25
<210> 93
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 93
atgctttgag gacagctctg ggcag 25
<210> 94
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 94
gaaagcaagg gcaaaggccg gggag 25
<210> 95
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 95
acatactcct tcatggtgtc ttagt 25
<210> 96
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 96
agagtagtcc tcctaaaagt agaag 25
<210> 97
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 97
aaagatccgg aaggcctttc catcc 25
<210> 98
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 98
ctgaactcca ttcctgagcg agccc 25
<210> 99
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 99
cagagatgct gttgaaactc aatcc 25
<210> 100
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 100
tattcagtcc tttcaggcta gctgc 25
<210> 101
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 101
atcccactca tatccgtcag tgcat 25
<210> 102
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 102
tacgtgatgg tttcttcggt gtcct 25
<210> 103
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 103
tgtccggctg cgcagcaagt ctcga 25
<210> 104
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 104
ctacttctgg ggatagaatg gacag 25
<210> 105
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 105
agggaggtcc actgcatttt gtctc 25
<210> 106
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 106
gttgaacttt tcagagagtg accac 25
<210> 107
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 107
atggtggcat ccacgggtga gccct 25
<210> 108
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 108
ccgagcagac cttggagtcg gcggc 25
<210> 109
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 109
cctcacatac gtgatctcat aagcc 25
<210> 110
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 110
cctaggcgga gggtgatgtt gaccg 25
<210> 111
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 111
tgcacttaga ctcatttttg gcaaa 25
<210> 112
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 112
cttgacactg ctttcgttaa ttctt 25
<210> 113
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 113
ttgctgaagg caaaacctct ccaga 25
<210> 114
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 114
catctcctcg gatcccggag acctg 25
<210> 115
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 115
atgaaggtat ttgcatttct cctgt 25
<210> 116
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 116
gattaagttc ataagattcc atgct 25
<210> 117
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 117
ttctgacagg gcctgtatgc tatta 25
<210> 118
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 118
ttctttccac gtgtttagca atgcc 25
<210> 119
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 119
tcttgagctg cttgaccctg gcatt 25
<210> 120
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 120
tgtactgctc ggccatcttg cgctc 25
<210> 121
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 121
gagttttctc tagcatgaag aagaa 25
<210> 122
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 122
gcttgctgga aggcgccctt ggtgt 25
<210> 123
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 123
agggctggct atgggcggcc ggccg 25
<210> 124
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 124
acgagcgccg ggttccgtcc aagca 25
<210> 125
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 125
tgaggtccac caccctgttg ctgta 25
<210> 126
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 126
atgagcttga caaagtggtc gttga 25
<210> 127
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 127
attgaagctg gagggaactg gcatg 25
<210> 128
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 128
gcggccgccg gtaccactgc tcctc 25
<210> 129
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 129
ctgttcttcc ccttcgagga atgaa 25
<210> 130
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 130
tccacggggc ggtgcttgtc cacga 25
<210> 131
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 131
tctggggccg ggacacggac agtgc 25
<210> 132
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 132
cttctccacc aagatgccta tctcc 25
<210> 133
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 133
gaatcctcct ttgaagatgc ttctt 25
<210> 134
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 134
ggctgtttgg gctccgtggg cacgg 25
<210> 135
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 135
cttttggaga tacgtaggga gagag 25
<210> 136
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 136
cacgatcatt gagtttcttc atgac 25
<210> 137
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 137
tgggaagggt tgtgaatgag 20
<210> 138
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 138
tgggctatgg gtgaggttcc aatg 24
<210> 139
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 139
gctgtctcta ctttccagga tg 22
<210> 140
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 140
caaggagaac cagcctgaaa 20
<210> 141
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 141
agacgcccac caagaaggaa catc 24
<210> 142
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 142
ggatcttggc ttcctctaca tc 22
<210> 143
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 143
taacaccatc agcagggaaa g 21
<210> 144
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 144
ccaaaccagc aggaggtgat gagaa 25
<210> 145
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 145
ctgcactgga gttcccataa a 21
<210> 146
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 146
cacactgccc aagtctctat c 21
<210> 147
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 147
caaactcttc cagcctcacc ctgt 24
<210> 148
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 148
gagcaagctg ttgtcttctt tg 22
<210> 149
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 149
gacgcttcgt tatgggaaga ta 22
<210> 150
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 150
atggttccca catcaaaggc ttgc 24
<210> 151
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 151
gggccagttg tgatggataa 20
<210> 152
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 152
tctggaatta gggagggtga g 21
<210> 153
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 153
aggatcgtcc tgtggatctg gcta 24
<210> 154
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 154
gggaaggcag aaatcccttt at 22
<210> 155
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 155
ggcctttctg gttctctagt tc 22
<210> 156
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 156
ctgccgctct ttggctctct tctc 24
<210> 157
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 157
cttctacctc agccattctc ttc 23
<210> 158
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 158
caggtcatgt gtagatgcga taa 23
<210> 159
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 159
aagtgattgg tgtgcctggg tctc 24
<210> 160
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 160
ccaccagggc acataagaaa 20
<210> 161
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 161
gcacagggag aagggataac 20
<210> 162
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 162
ccagcctttg gccttggctt t 21
<210> 163
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 163
gctcagcctg caggtaaata 20
<210> 164
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 164
tccacaccat tcaggtcttt c 21
<210> 165
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 165
tctccaacgg caagggaaca agta 24
<210> 166
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 166
gcacagtatc ccaggtatca ag 22
<210> 167
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 167
ctcctttcct gctgaaatca aag 23
<210> 168
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 168
tatctcccaa tggtggcaaa ccca 24
<210> 169
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 169
tgagaggtgt gagtggtata ga 22
<210> 170
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 170
tcagtaccac cttctccttc a 21
<210> 171
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 171
cctccacttc atcttccaca tcactgc 27
<210> 172
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 172
cctcctcttc ctcatcgtat ct 22
<210> 173
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 173
ccctcaggaa catgagaaca tc 22
<210> 174
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 174
aatggtgtac cgcctcattt ggga 24
<210> 175
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 175
gaggcttggt ggtagaagaa c 21
<210> 176
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 176
gatgagggct cagaacagaa g 21
<210> 177
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 177
caaggccaat tcccgctttg ctac 24
<210> 178
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 178
tgccaggtgc tgatagaaag 20
<210> 179
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 179
gaaggacaag gtgccctata aa 22
<210> 180
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 180
actggtcctg gttctcattc cttgc 25
<210> 181
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 181
ggatttgagg acgatcccta tg 22
<210> 182
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 182
cctggactcg ggcaaatata a 21
<210> 183
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 183
tctcctcccg actggatagg aagc 24
<210> 184
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 184
gcctcaggac agtggtaata ag 22
<210> 185
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 185
cagttgaggt gggtttccat ag 22
<210> 186
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 186
tccctgtctt gaatagtgcc tccc 24
<210> 187
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 187
cccagcatac gtcttggatt t 21
<210> 188
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 188
cattgtccca gacgcttgta 20
<210> 189
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 189
atggaggata cctctgcctt ccga 24
<210> 190
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 190
cctgctgagg ctgttcatta t 21
<210> 191
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 191
taccagtggc cagtactatg a 21
<210> 192
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 192
tgggcaatca tcaccaaact gtgc 24
<210> 193
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 193
gtagctttca gggcagttac a 21
<210> 194
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 194
ctctgggtgt tgagaggttt ag 22
<210> 195
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 195
agtgggtagg gactgaaggt ctcaa 25
<210> 196
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 196
aagccagttc attcaggttc t 21
<210> 197
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 197
tacctgaatg agcaggtgaa ag 22
<210> 198
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 198
agaattgggt gaccacgtga ccaa 24
<210> 199
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 199
gatattccgc caagccagat 20
<210> 200
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 200
cactcttcca gccttccttc 20
<210> 201
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 201
agtttcgtgg atgccacagg actc 24
<210> 202
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 202
gtacaggtct ttgcggatgt 20
<210> 203
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 203
ggtgtgaacc atgagaagta tga 23
<210> 204
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 204
gagtccttcc acgataccaa ag 22
<210> 205
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 205
ggtgtgaacc atgagaagta tga 23
<210> 206
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 206
ggagaaactg ctgcctcata tc 22
<210> 207
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 207
cagcagctgg caccttatt 19
<210> 208
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 208
tggtgaacac aaagcccaca ttcc 24

Claims (10)

1.一种对原发性肝细胞肝癌进行分子分型和/或生存风险评估的诊断产品,其特征在于,包括用于检测原发性肝细胞肝癌分子分型和/或生存风险评估的基因群中基因的表达水平的试剂;
所述基因群包括62个分子分型及生存风险评估相关基因和6个参考基因,或包括21个分子分型及生存风险评估相关基因和3个参考基因;所述62个分子分型及生存风险评估相关基因由18个细胞增殖相关基因、5个免疫相关基因、21个细胞外间质相关基因、17个外泌体相关基因、1个FTH家族基因组成;所述18个细胞增殖相关基因为:BIRC5、BUB1、CCNB2、CDC20、CDC6、CDK1、E2F1、FOXM1、GINS1、KIF18B、KIF2C、MKI67、MYBL2、PLK1、TOP2A、TPX2、TROAP、UBE2C,所述5个免疫相关基因为:CD2、CD74、CD8A、PLA2G2D、SLAMF7,所述21个细胞外间质相关基因为:ABCB11、ADH1B、ALDOB、APOF、AQP9、BHMT、CYP2A6、F9、FETUB、GLYAT、GYS2、HP、HPR、HRG、HSD17B6、RDH16、SERPINC1、SLC10A1、SLC27A5、TAT、TTR,所述17个外泌体相关基因为:AEBP1、ANTXR1、APLNR、ASPN、CRISPLD2、DCN、EFEMP1、FBLN2、FMOD、GGT5、LAMC3、LUM、MFAP4、MGP、MXRA5、MYH11、SVEP1,所述6个参考基因为:GAPDH、GUSB、MRPL19、PSMC4、SF3A1、TFRC;所述21个分子分型及生存风险评估相关基因由7个细胞增殖相关基因、3个免疫相关基因、6个细胞外间质相关基因、4个外泌体相关基因、1个FTH家族基因组成;所述7个细胞增殖相关基因为:BIRC5、CDC20、MKI67、MYBL2、TOP2A、TPX2、UBE2C,所述3个免疫相关基因为:CD2、CD74、CD8A,所述6个细胞外间质相关基因为:GLYAT、GYS2、HRG、SERPINC1、SLC10A1、TAT,所述4个外泌体相关基因为:DCN、EFEMP1、LUM、MFAP4,所述3个参考基因为ACTB、GAPDH、RPLP0,或GAPDH、PSMC4、TFRC,所述FTH家族基因为:FTH1。
2.根据权利要求1所述的诊断产品,其特征在于,所述试剂为用于检测由所述基因编码的多肽的量的试剂或用于检测所述基因的核酸的量的试剂。
3.根据权利要求2所述的诊断产品,其特征在于,所述用于检测由所述基因编码的多肽的量的试剂为能够与所述基因编码的多肽特异性结合的抗体、抗体片段或亲和性蛋白;所述用于检测所述基因的核酸的量的试剂为用于检测所述基因转录的RNA的量的试剂或检测与mRNA互补的cDNA的量的试剂。
4.根据权利要求3所述的诊断产品,其特征在于,所述用于检测所述基因的核酸的量的试剂为探针和/或引物。
5.根据权利要求4所述的诊断产品,其特征在于,所述引物的序列如SEQ ID NO.1 -SEQ ID NO.136所示。
6.根据权利要求4所述的诊断产品,其特征在于,所述引物和探针的序列如SEQ ID NO.137 - SEQ ID NO. 208所示。
7.根据权利要求1所述的诊断产品,其特征在于,所述诊断产品为基于二代测序的诊断产品或基于荧光定量PCR的诊断产品。
8.根据权利要求7所述的诊断产品,其特征在于,所述诊断产品为试剂盒。
9.根据权利要求7所述的诊断产品,其特征在于,所述基于二代测序的诊断产品还包括总RNA抽提试剂、逆转录试剂、二代测序试剂中的一种或多种,所述基于荧光定量PCR的诊断产品还包括总RNA抽提试剂、逆转录试剂、定量PCR试剂中的一种或多种。
10.一种基因群在制备对原发性肝细胞肝癌进行分子分型和/或生存风险评估的诊断产品中的应用,其特征在于,所述基因群包括62个分子分型及生存风险评估相关基因和6个参考基因,或包括21个分子分型及生存风险评估相关基因和3个参考基因;所述62个分子分型及生存风险评估相关基因由18个细胞增殖相关基因、5个免疫相关基因、21个细胞外间质相关基因、17个外泌体相关基因、1个FTH家族基因组成;所述18个细胞增殖相关基因为:BIRC5、BUB1、CCNB2、CDC20、CDC6、CDK1、E2F1、FOXM1、GINS1、KIF18B、KIF2C、MKI67、MYBL2、PLK1、TOP2A、TPX2、TROAP、UBE2C,所述5个免疫相关基因为:CD2、CD74、CD8A、PLA2G2D、SLAMF7,所述21个细胞外间质相关基因为:ABCB11、ADH1B、ALDOB、APOF、AQP9、BHMT、CYP2A6、F9、FETUB、GLYAT、GYS2、HP、HPR、HRG、HSD17B6、RDH16、SERPINC1、SLC10A1、SLC27A5、TAT、TTR,所述17个外泌体相关基因为:AEBP1、ANTXR1、APLNR、ASPN、CRISPLD2、DCN、EFEMP1、FBLN2、FMOD、GGT5、LAMC3、LUM、MFAP4、MGP、MXRA5、MYH11、SVEP1,所述6个参考基因为:GAPDH、GUSB、MRPL19、PSMC4、SF3A1、TFRC;所述21个分子分型及生存风险评估相关基因由7个细胞增殖相关基因、3个免疫相关基因、6个细胞外间质相关基因、4个外泌体相关基因、1个FTH家族基因组成;所述7个细胞增殖相关基因为:BIRC5、CDC20、MKI67、MYBL2、TOP2A、TPX2、UBE2C,所述3个免疫相关基因为:CD2、CD74、CD8A,所述6个细胞外间质相关基因为:GLYAT、GYS2、HRG、SERPINC1、SLC10A1、TAT,所述4个外泌体相关基因为:DCN、EFEMP1、LUM、MFAP4,所述3个参考基因为ACTB、GAPDH、RPLP0,或GAPDH、PSMC4、TFRC,所述FTH家族基因为:FTH1。
CN202010799025.8A 2020-08-11 2020-08-11 原发性肝细胞肝癌分子分型及生存风险基因群及诊断产品和应用 Active CN112048556B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010799025.8A CN112048556B (zh) 2020-08-11 2020-08-11 原发性肝细胞肝癌分子分型及生存风险基因群及诊断产品和应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010799025.8A CN112048556B (zh) 2020-08-11 2020-08-11 原发性肝细胞肝癌分子分型及生存风险基因群及诊断产品和应用

Publications (2)

Publication Number Publication Date
CN112048556A CN112048556A (zh) 2020-12-08
CN112048556B true CN112048556B (zh) 2022-07-12

Family

ID=73601273

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010799025.8A Active CN112048556B (zh) 2020-08-11 2020-08-11 原发性肝细胞肝癌分子分型及生存风险基因群及诊断产品和应用

Country Status (1)

Country Link
CN (1) CN112048556B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114672556A (zh) * 2020-12-25 2022-06-28 上海善准生物科技有限公司 结直肠癌分子分型及生存风险基因群及诊断产品和应用
CN113185579B (zh) * 2021-04-29 2023-04-25 清华大学深圳国际研究生院 一种fmod拮抗多肽及其衍生物与应用
CN113584175A (zh) * 2021-08-30 2021-11-02 南京大学 一组评估肾乳头状细胞癌进展风险的分子标记及其筛选方法和应用
CN114507705A (zh) * 2022-01-26 2022-05-17 中山大学附属第一医院 一种微生物标志物及其在诊断男性泌尿道结石的应用
CN117987550A (zh) * 2024-01-22 2024-05-07 深圳慕光生物科技有限公司 一种生物标志物、应用及对癌症患者总生存率的预测方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010085124A2 (ko) * 2009-01-22 2010-07-29 재단법인 한국원자력의학원 간암진단과 재발 및 생존 예측용 마커, 이를 포함한 키트 및 상기 마커를 이용한 간암환자 예후 예측
WO2012130165A1 (zh) * 2011-03-31 2012-10-04 中国科学院上海生命科学研究院 一种诊断肝癌的标记物及其应用
CN107058550A (zh) * 2017-05-04 2017-08-18 上海东方肝胆外科医院 基于转录组测序技术用于早期肝癌诊断和预后评估的基因群及其应用
CN108611419A (zh) * 2018-05-11 2018-10-02 福建医科大学孟超肝胆医院 一种用于肝癌患者预后风险评估的基因检测试剂盒及应用

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010085124A2 (ko) * 2009-01-22 2010-07-29 재단법인 한국원자력의학원 간암진단과 재발 및 생존 예측용 마커, 이를 포함한 키트 및 상기 마커를 이용한 간암환자 예후 예측
WO2012130165A1 (zh) * 2011-03-31 2012-10-04 中国科学院上海生命科学研究院 一种诊断肝癌的标记物及其应用
CN107058550A (zh) * 2017-05-04 2017-08-18 上海东方肝胆外科医院 基于转录组测序技术用于早期肝癌诊断和预后评估的基因群及其应用
CN108611419A (zh) * 2018-05-11 2018-10-02 福建医科大学孟超肝胆医院 一种用于肝癌患者预后风险评估的基因检测试剂盒及应用

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
IL12基因多态性与原发性肝细胞肝癌遗传易感性的关联研究;刘莉等;《南京医科大学学报(自然科学版)》;20100115;第30卷(第01期);34-38 *
原发性肝癌患者外周血中肝癌相关基因基因芯片筛查;宫卫东等;《西南国防医药》;20100420;第20卷(第04期);22-24 *

Also Published As

Publication number Publication date
CN112048556A (zh) 2020-12-08

Similar Documents

Publication Publication Date Title
CN112048556B (zh) 原发性肝细胞肝癌分子分型及生存风险基因群及诊断产品和应用
US10260104B2 (en) Method for using gene expression to determine prognosis of prostate cancer
WO2021037134A1 (zh) 肺腺癌分子分型及生存风险基因群及诊断产品和应用
US20110111976A1 (en) Microrna biomarkers of tissue injury
US9422592B2 (en) System and method of detecting RNAS altered by cancer in peripheral blood
US10544462B2 (en) Biomarkers predictive of predisposition to depression and response to treatment
WO2010069129A1 (zh) 非小细胞肺癌标记物及其检测方法、试剂盒和生物芯片
AU2009234444A1 (en) Methods, agents and kits for the detection of cancer
CN107858434B (zh) lncRNA在肝癌诊断以及预后预测中的应用
WO2013125691A1 (ja) テスト体液サンプルの分類方法
EP2843060B1 (en) Method and program for determining sensitivity to breast cancer neoadjuvant chemotherapy
CN114672556A (zh) 结直肠癌分子分型及生存风险基因群及诊断产品和应用
WO2021175236A1 (zh) 干扰素信号通路相关基因群及诊断产品和应用
CN109022583A (zh) hsa_circ_0021977在制备诊断乳腺癌产品上的应用
US20230304081A1 (en) Primer and probe design method, detection composition, and kit for mirna detection
CN110295232B (zh) 用于结直肠癌的microRNA生物标记物
CA3192008A1 (en) System and methods of detection of oncrnas for cancer diagnosis
TWI674320B (zh) 用以預斷吉特曼症候群的方法及套組
CN114410795A (zh) 基于miRNA特征标记的肝癌早期检测
WO2020064006A2 (zh) 乳腺癌分子分型及远处转移风险基因群及诊断产品和应用
CN110951857A (zh) 基于数字pcr无创产前检测胎儿21、18、13三体综合征的方法及试剂盒
KR20210048794A (ko) 비결핵 항산균에 의한 감염 또는 감염 질환의 진단용 조성물
KR20200084435A (ko) 신장이식 환자의 급성거부반응 진단용 miRNA 바이오 마커 및 이의 용도
CN114774538B (zh) 一种检测人tmlhe基因拷贝数缺失的方法及试剂盒
CN118127187B (zh) 一种基于靶向测序的呼吸道病原微生物检测试剂盒及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant