CN117512108A - 用于多种肿瘤筛查、诊断的基因组合标志物及其应用 - Google Patents

用于多种肿瘤筛查、诊断的基因组合标志物及其应用 Download PDF

Info

Publication number
CN117512108A
CN117512108A CN202311397869.XA CN202311397869A CN117512108A CN 117512108 A CN117512108 A CN 117512108A CN 202311397869 A CN202311397869 A CN 202311397869A CN 117512108 A CN117512108 A CN 117512108A
Authority
CN
China
Prior art keywords
cancer
detecting
gene
primer
seq
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311397869.XA
Other languages
English (en)
Inventor
王征
王琳
徐鲁明
李孝琼
路小欢
邹丹祎
李琪琳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tongji Medical College of Huazhong University of Science and Technology
Original Assignee
Tongji Medical College of Huazhong University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tongji Medical College of Huazhong University of Science and Technology filed Critical Tongji Medical College of Huazhong University of Science and Technology
Priority to CN202311397869.XA priority Critical patent/CN117512108A/zh
Publication of CN117512108A publication Critical patent/CN117512108A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/166Oligonucleotides used as internal standards, controls or normalisation probes

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Medical Informatics (AREA)
  • Zoology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Molecular Biology (AREA)
  • Analytical Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Pathology (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Biology (AREA)
  • Immunology (AREA)
  • Oncology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Hospice & Palliative Care (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Artificial Intelligence (AREA)
  • Bioethics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Evolutionary Computation (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了用于多种肿瘤筛查、诊断的基因组合标志物及其应用,所述基因组合标志物至少包括SGK1、DNAJB6P1、HIC2、RPS7P1、MT2A和OR2W3,还可以包括GZMB、DENND3、TNIP2、FOSL1、ZNF256、LAGE3、RRAD、CCNJL中的任意一种或任意多种;所述肿瘤包括肺癌、大肠癌、胃癌、肝癌、乳腺癌、胰腺癌、甲状腺癌、肾癌、膀胱癌、宫颈癌。本发明提供的基因组合标志物可实现多种肿瘤的筛查和诊断,尤其是早期肿瘤的筛查,且准确率、灵敏度高,对早期肿瘤的发现和治疗具有重要意义。

Description

用于多种肿瘤筛查、诊断的基因组合标志物及其应用
技术领域
本发明涉及生物医学技术领域,具体涉及用于多种肿瘤筛查、诊断的基因组合标志物及其应用。
背景技术
在恶性肿瘤的早期即发现肿瘤、及时治疗,可大幅增加患者生存机会,减少出现治疗并发症的风险,并显著降低治疗费用。使用高通量测序、聚合酶链式反应(PCR)等方式检测来源于肿瘤细胞的循环游离核酸(如cfDNA、micro RNA等)是目前研究最为广泛的肿瘤早期诊断手段。然而,由于早期肿瘤体积较小、肿瘤细胞数量不多,所释放的循环核酸拷贝数极低,导致这些方法对早期肿瘤(尤其是0期和I期肿瘤)的检测灵敏度往往较低,甚至不足50%。因此,迫切需要研发新的肿瘤生物标志物来提高早期肿瘤的诊断效率。
恶性肿瘤作为一种系统性疾病,不仅影响肿瘤部位的微环境,而且影响免疫系统以及其他远端组织或器官。癌症诱导的全身效应可以在其他组织和器官中产生可检测的肿瘤相关信号,这些信号可以被用作肿瘤诊断的标志物。例如,肿瘤对血液系统的影响可以产生潜在的癌症检测生物标志物。白细胞或血小板来源的核糖核酸(RNA)已被用于检测多种癌症,如结肠直肠癌、肺癌等,多项研究表明血细胞内的核酸现是极具应用前景的肿瘤液体活检材料。
发明内容
有鉴于此,本发明旨在通过检测血细胞中某些基因的表达量,实现多种肿瘤的准确诊断,尤其是早期肿瘤的诊断。
为了实现上述目的,本发明的技术方案具体如下:
本发明第一方面提供了一种用于多肿瘤筛查、诊断的基因组合标志物,其包含以下14种基因中的任意一种或多种:GZMB、SGK1、DNAJB6P1、HIC2、DENND3、RPS7P1、TNIP2、FOSL1、ZNF256、LAGE3、RRAD、MT2A、CCNJL和OR2W3,所述肿瘤可以为肺癌、大肠癌、胃癌、肝癌、乳腺癌、胰腺癌、甲状腺癌、肾癌、膀胱癌和宫颈癌中的任意一种或多种。
优选地,在上述基因组合标志物中,至少包括以下6种基因:SGK1、DNAJB6P1、HIC2、RPS7P1、MT2A和OR2W3;更为优选地,基因组合标志物在包括上述6种基因的基础上,还包括以下任意一种或任意多种基因:GZMB、DENND3、TNIP2、FOSL1、ZNF256、LAGE3、RRAD、CCNJL。
本发明所涉及的GZMB、SGK1、DNAJB6P1、HIC2、DENND3、RPS7P1、TNIP2、FOSL1、ZNF256、LAGE3、RRAD、MT2A、CCNJL、OR2W3的基因信息见表1所示。
表1基因信息
从表1可知,HIC2、DENND3、RPS7P1、MT2A、OR2W3位于染色体正链,GZMB、SGK1、DNAJB6P1、TNIP2、FOSL1、ZNF256、LAGE3、RRAD、CCNJL位于染色体负链。
本发明第二方面提供了基因组合标志物在制备用于肿瘤筛查、诊断或辅助诊断的产品中的应用,其中,肿瘤为肺癌、大肠癌、胃癌、肝癌、乳腺癌、胰腺癌、甲状腺癌、肾癌、膀胱癌和宫颈癌中的至少一种,基因组合标志物包含以下14种基因中的任意一种或多种:GZMB、SGK1、DNAJB6P1、HIC2、DENND3、RPS7P1、TNIP2、FOSL1、ZNF256、LAGE3、RRAD、MT2A、CCNJL和OR2W3。
优选地,在上述应用中,基因组合标志物至少包括SGK1、DNAJB6P1、HIC2、RPS7P1、MT2A和OR2W36,还可以包括GZMB、DENND3、TNIP2、FOSL1、ZNF256、LAGE3、RRAD和CCNJL中任意一种或多种。
在上述应用中,产品通过检测待测样品中各基因的表达量或相对表达水平实现肿瘤筛查或诊断。优选地,所述待测样品为受试者血样样本。
在上述应用中,所述产品包括但不限于为核酸、试剂、试剂盒、基因芯片、高通量测序系统、分析系统等。其中,所述核酸包括实时定量PCR中使用的特异扩增所述基因的引物、基因芯片中使用的针对所述基因的探针等。
本发明第三方面提供了一种用于肿瘤筛查、诊断或辅助诊断的试剂盒,包括:用于检测SGK1基因表达量的引物、用于检测DNAJB6P1基因表达量的引物、用于检测HIC2基因表达量的引物、用于检测RPS7P1基因表达量的引物、用于检测MT2A基因表达量的引物和用于检测OR2W36基因表达量的引物。
优选地,在上述试剂盒中,所述用于检测SGK1基因表达量的引物由序列表中SEQID NO.1和2所示的两条单链DNA组成,所述用于检测DNAJB6P1基因表达量的引物由序列表中SEQ ID NO.3和4所示的两条单链DNA组成,所述用于检测HIC2基因表达量的引物由序列表中SEQ ID NO.5和6所示的两条单链DNA组成,所述用于检测RPS7P1基因表达量的引物由序列表中SEQ ID NO.7和8所示的两条单链DNA组成,所述用于检测MT2A基因表达量的引物由序列表中SEQ ID NO.9和10所示的两条单链DNA组成,所述用于检测OR2W3基因表达量的引物由序列表中SEQ ID NO.11和12所示的两条单链DNA组成。
优选地,在上述试剂盒中,还包括:用于检测GZMB基因表达量的引物、用于检测DENND3基因表达量的引物、用于检测TNIP2基因表达量的引物、用于检测FOSL1基因表达量的引物、用于检测ZNF256基因表达量的引物、用于检测LAGE3基因表达量的引物、用于检测RRAD基因表达量的引物和用于检测CCNJL基因表达量的引物中的任意一个或多个。
更为优选地,所述用于检测GZMB基因表达量的引物由序列表中SEQ ID NO.13和14所示的两条单链DNA组成,所述用于检测DENND3基因表达量的引物由序列表中SEQ IDNO.15和16所示的两条单链DNA组成,所述用于检测TNIP2基因表达量的引物由序列表中SEQID NO.17和18所示的两条单链DNA组成,所述用于检测FOSL1基因表达量的引物由序列表中SEQ ID NO.19和22所示的两条单链DNA组成,所述用于检测ZNF256基因表达量的引物由序列表中SEQ ID NO.21和22所示的两条单链DNA组成,所述用于检测LAGE3基因表达量的引物由序列表中SEQ ID NO.23和24所示的两条单链DNA组成,所述用于检测RRAD基因表达量的引物由序列表中SEQ ID NO.25和26所示的两条单链DNA组成,所述用于检测CCNJL基因表达量的引物由序列表中SEQ ID NO.27和28所示的两条单链DNA组成。
优选地,在上述试剂盒中,还包括用于检测内参基因表达量的引物。
更为优选地,所述内参基因为GAPDH基因和/或ACTB基因;用于检测GAPDH基因表达量的引物由序列表中SEQ ID NO.29和30所示的两条单链DNA组成,用于检测ACTB基因表达量的引物由序列表中SEQ ID NO.31和32所示的两条单链DNA组成。
本发明所述GAPDH基因在参考基因组GRCh37/hg19中的位置为Chr12:6643093-6647537(正链),所述ACTB基因在参考基因组GRCh37/hg19中的位置为Chr7:5566782-5603415(负链)。
本发明第四方面提供了一种肿瘤筛查、诊断的方法,包括以下步骤:
S1、采集受试者的血样样本;
S2、在样本中测量GZMB、SGK1、DNAJB6P1、HIC2、DENND3、RPS7P1、TNIP2、FOSL1、ZNF256、LAGE3、RRAD、MT2A、CCNJL和OR2W3中至少3种基因的表达量水平;
S3、使用基因表达量均一化算法计算出每个基因的相对表达水平;或,通过与内参基因表达量进行比较,计算出每个基因的相对表达水平;
S4、通过算法将每个基因的相对表达水平计算出一个诊断评分(即预测值),并与预先划定的临界值进行比较,如果诊断评分高于临界值,则该受试者患有肿瘤;若诊断评分低于临界值,则该受试者未患肿瘤。
优选地,步骤S2中至少测量SGK1、DNAJB6P1、HIC2、RPS7P1、MT2A和OR2W36这六种基因的表达量水平。
本发明第五方面提供了一种用于肿瘤筛查、诊断或辅助诊断的分析系统,该分析系统用于将本发明所述的基因组合标志物中各基因的表达量转化为预测值,根据该预测值判断是否为肿瘤患者。
相对于现有技术,本发明的有益效果为:
1.本发明提供的基因组合标志物是华中科技大学同济医学院附属协和医院的实际肿瘤病例与健康人血细胞的高通量测序数据中,通过特定的机器学习算法分析得来,数据可靠性与可信度高,而且可以准确对多种肿瘤进行诊断。
2.本发明通过检测血细胞RNA中基因组合标志物的表达水平,实现肺癌、大肠癌、胃癌、肝癌等多种肿瘤检测,具有高度敏感性和特异性;而且本发明为无创液体活检方法,采血量低,仅需少量外周血样本即可完成检测,人群依从性高。
3.实验数据表明,本发明的基因组合标志物对早期肿瘤具有较高的诊断灵敏度。
4.相比于循环肿瘤DNA(cfDNA)等方法,本发明仅需要普通转录组高通量测序或PCR方法即可实现肿瘤筛查、诊断,成本显著降低,普适性广。
附图说明
图1为肿瘤患者和健康人中GZMB、SGK1、DNAJB6P1、HIC2、DENND3、RPS7P1、TNIP2、FOSL1、ZNF256、LAGE3、RRAD、MT2A、CCNJL、OR2W3基因的表达量比较图。
图2为实施例3中通过LASSO回归算法所得出的肿瘤患者和健康人群的预测值。
图3为实施例3中由SGK1、DNAJB6P1、HIC2、RPS7P1、MT2A、OR2W3组成的6基因组合标志物诊断各分期肿瘤患者(包含肺癌、大肠癌、胃癌、肝癌、乳腺癌、甲状腺癌、肾癌、膀胱癌、宫颈癌)的ROC曲线图;其中A为所有分期,B为早期(0期和Ⅰ期);C为中晚期(Ⅱ~Ⅳ期)。
图4为实施例4支持向量机算法所得出的肿瘤患者和健康人群的预测值。
图5为实施例4中由GZMB、SGK1、DNAJB6P1、HIC2、DENND3、RPS7P1、TNIP2、FOSL1、ZNF256、LAGE3、RRAD、MT2A、CCNJL、OR2W3组成的基因组合标志物诊断各分期肺癌的ROC曲线图,其中A为所有分期,B为早期(0期和Ⅰ期),C为中晚期(Ⅱ~Ⅳ期)。
图6为实施例5中的基因组合标志物诊断各分期大肠癌的ROC曲线图,其中A为所有分期,B为早期(0期和Ⅰ期),C为中晚期(Ⅱ~Ⅳ期)。
图7为实施例5中的基因组合标志物诊断各分期胃癌的ROC曲线图,其中A为所有分期,B为早期(0期和Ⅰ期),C为中晚期(Ⅱ~Ⅳ期)。
图8为实施例5中的基因组合标志物诊断各分期肝癌的ROC曲线图,其中A为所有分期,B为早期(0期和Ⅰ期),C为中晚期(Ⅱ~Ⅳ期)。
图9为实施例5中的基因组合标志物诊断各分期乳腺癌的ROC曲线图,其中A为所有分期,B为早期(0期和Ⅰ期),C为中晚期(Ⅱ~Ⅳ期)。
图10为实施例5中的基因组合标志物诊断各分期甲状腺癌的ROC曲线图,其中A为所有分期,B为早期(0期和Ⅰ期),C为中晚期(Ⅱ~Ⅳ期)。
图11为实施例5中的基因组合标志物诊断各分期宫颈癌的ROC曲线图,其中A为所有分期,B为早期(0期和Ⅰ期),C为中晚期(Ⅱ~Ⅳ期)。
图12为实施例5中的基因组合标志物诊断各分期肾癌的ROC曲线图,其中A为所有分期,B为早期(0期和Ⅰ期),C为中晚期(Ⅱ~Ⅳ期)。
图13为实施例5中的基因组合标志物诊断各分期膀胱癌的ROC曲线图,其中A为所有分期,B为早期(0期和Ⅰ期),C为中晚期(Ⅱ~Ⅳ期)。
具体实施方式
下面结合附图和具体实施方式对本发明进行进一步的详细描述,给出的实施例仅为了更好的进一步阐释本发明,不对本发明的范围和保护内容构成限制。
实施例中未注明具体实验步骤或条件者,按照本领域内的文献所描述的常规实验步骤的操作或条件即可进行。所用试剂或仪器未注明生产厂商者,均为可以通过市场购买获得的常规试剂或仪器产品。
实施例1
在本例中,发明人利用华中科技大学同济医学院附属协和医院肿瘤外周血血细胞高通量转录组测序数据库进行筛选,以寻找可用于多种肿瘤诊断的基因组合标志物。
数据标准化处理:在Linux操作系统环境下,使用STAR软件将转录组数据与人参考基因组GRCh37/hg19进行比对,并通过quantMode-GeneCounts参数计算比对到每个基因上的reads数量。之后使用R软件中的“DESeq2”包中的“vst”命令,利用比对到每个基因上的reads数量对各个基因的表达量进行标准化,获取标准化后的基因表达量矩阵。
在R软件中,使用递归特征消除算法,计算各个基因对区分肿瘤患者与健康人的贡献度,GZMB、SGK1、DNAJB6P1、HIC2、DENND3、RPS7P1、TNIP2、FOSL1、ZNF256、LAGE3、RRAD、MT2A、CCNJL、OR2W3这14个基因为排名前14的基因,且贡献度如表2所示。其中,贡献度排名根据特征消除算法所给出的评分得出。
表2各基因对区分肿瘤患者与健康人的贡献度排名
排名 基因名 评分
1 GZMB 11.3
2 SGK1 14.5
3 DNAJB6P1 52.7
4 HIC2 61.1
5 DENND3 70.5
6 RPS7P1 74.2
7 TNIP2 78.1
8 FOSL1 83.3
9 ZNF256 88.4
10 LAGE3 90.9
11 RRAD 95.4
12 MT2A 99
13 CCNJL 108.3
14 OR2W3 110.5
差异分析:GZMB、SGK1、DNAJB6P1、HIC2、DENND3、RPS7P1、TNIP2、FOSL1、ZNF256、LAGE3、RRAD、MT2A、CCNJL、OR2W3在肿瘤患者和健康人中差异表达情况见图1,其中GZMB、SGK1、DNAJB6P1、DENND3、RRAD、MT2A具有统计学差异。
实施例2
基于实施例1获取的基因,本例根据NCBI数据库中基因的序列信息,设计以下引物用于各基因表达量的检测,具体如表3所示。
表3检测基因表达量的引物
表3中,“基因名称-F”、“基因名称-R”分别表示为检测该基因信使RNA的上游引物、下游引物,GAPDH和ACTB为内参基因。
实施例3
本例使用由SGK1、DNAJB6P1、HIC2、RPS7P1、MT2A、OR2W3组成的6基因组合标志物对大肠癌、胃癌、肝癌、乳腺癌、甲状腺癌、宫颈癌、肾癌、膀胱癌进行筛查、诊断,具体步骤如下:
(1)样本与数据。
使用真空采血管采集1~5毫升大肠癌、胃癌、肺癌、肝癌、乳腺癌、甲状腺癌、宫颈癌、肾癌或膀胱癌患者和健康对照血液标本。其中,血液样本可以为EDTAK2、枸橼酸钠或肝素抗凝的全血,本例选择EDTAK2抗凝的全血样本;健康对照为确定未患肿瘤的健康人群。
通过常规方法提取各样本RNA,之后通过常规方法构建转录组测序文库,获取样本中SGK1、DNAJB6P1、HIC2、RPS7P1、MT2A、OR2W3基因的表达量数据。
(2)获取标准化后的表达量。
按照实施例1中的数据标准化处理方法,经过对测序数据进行比对、标准化,获取各个基因的标准化后的表达量矩阵。
(3)建立肿瘤诊断模型。
随机选取所有样本的67%作为训练集用于建立多肿瘤诊断模型。以SGK1、DNAJB6P1、HIC2、RPS7P1、MT2A、OR2W3的标准化后的表达量作为特征,使用R软件中“glmnet”包,利用LASSO回归算法建立区分肿瘤患者与健康对照的二分类模型。在模型建立过程中,使用平均误差最小的λ作为模型使用的最优λ,获得最佳的模型。
(4)ROC曲线分析。
使用所有样本的33%作为测试集,评价所建立的诊断模型对多肿瘤的诊断效能。使用R软件中“glmnet”包中“predict”命令,利用上述构建的多肿瘤诊断模型对测试集样本进行预测,并获得预测值。结果如图2所示,肿瘤患者与健康对照的预测值有显著差别。使用R软件中“pROC”包绘制受试者工作曲线(ROC曲线),分析AUC值、灵敏度、特异度,判断基因组合标志物对肺癌的诊断效能。基因组合标志物诊断大肠癌、胃癌、肺癌、肝癌、乳腺癌、甲状腺癌、宫颈癌、肾癌、膀胱癌的效能参见表4和图3。
表4基因组合标志物对各类型肿瘤的诊断效能分析
AUC 灵敏度 特异度
全部肿瘤 0.842 78.8% 75.5%
大肠癌 0.847 85.0% 70.1%
胃癌 0.863 83.3% 75.5%
肝癌 0.838 82.8% 73.9%
肺癌 0.824 78.8% 75.5%
乳腺癌 0.798 70.8% 73.9%
甲状腺癌 0.832 80.6% 75.5%
宫颈癌 0.847 82.1% 78.2%
肾癌 0.808 76.9% 70.1%
膀胱癌 0.762 62.5% 80.8%
如上表所示,由SGK1、DNAJB6P1、HIC2、RPS7P1、MT2A、OR2W3组成的基因组合标志物能够有效对大肠癌、胃癌、肝癌、乳腺癌、甲状腺癌、宫颈癌、肾癌、膀胱癌进行诊断,尤其是早期肿瘤,且具有良好的灵敏度和特异性。
实施例4
本例使用由GZMB、SGK1、DNAJB6P1、HIC2、DENND3、RPS7P1、TNIP2、FOSL1、ZNF256、LAGE3、RRAD、MT2A、CCNJL、OR2W3组成的基因组合标志物对肺癌进行筛查、诊断,具体步骤如下:
(1)样本与数据。
使用真空采血管采集1~5毫升肺癌患者和健康对照血液标本,所述血液样本为EDTAK2抗凝的全血样本,健康对照为确定未患肿瘤的健康人群。通过常规方法提取RNA,之后通过常规方法构建转录组测序文库,获取样本中各个基因的表达量数据。
(2)获取标准化后表达量。
按照实施例1中的数据标准化处理方法,经过对测序数据进行比对、标准化,获取各个基因的标准化后的表达量矩阵。
(3)建立肺癌诊断模型。
随机选取所有样本的67%作为训练集用于建立肺癌诊断模型。以GZMB、SGK1、DNAJB6P1、HIC2、DENND3、RPS7P1、TNIP2、FOSL1、ZNF256、LAGE3、RRAD、MT2A、CCNJL、OR2W3的标准化后的表达量作为特征,使用R软件中“e1071”包,利用支持向量机机器学习算法建立区分肺癌患者与健康对照的二分类模型。在模型建立过程中,使用“e1071”包中的“tune.svm”命令,已获得最佳的准确率为目标,选取最佳的模型参数。
(4)ROC曲线分析。
使用所有样本的33%作为测试集,评价所建立的诊断模型对肺癌的诊断效能。使用R软件中“e1071”包中“predict”命令,利用上述构建的肺癌诊断模型对测试集样本进行预测,并获得预测值。如图4所示,肿瘤患者与健康对照的预测值有显著差别。使用R软件中“pROC”包绘制受试者工作曲线(ROC曲线),分析AUC值、灵敏度、特异度,判断基因组合标志物对肺癌的诊断效能。基因组合标志物诊断所有肺癌及早期(0-Ⅰ期)、中晚期(Ⅱ-Ⅳ期)肺癌的效能参见表5和图5。
表5基因组合标志物对肺癌的诊断效能分析
AUC 灵敏度 特异度
全部分期 0.914 87.2% 82.7%
0-Ⅰ期 0.913 92.5% 77.4%
Ⅱ-Ⅳ期 0.926 96.0% 83.7%
由此可见,本例所用的基因组合标志物能够有效诊断肺癌,尤其是早期肺癌。
实施例5
本例使用由GZMB、SGK1、DNAJB6P1、HIC2、DENND3、RPS7P1、TNIP2、FOSL1、ZNF256、LAGE3、RRAD、MT2A、CCNJL、OR2W3组成的基因组合标志物对大肠癌、胃癌、肝癌、乳腺癌、甲状腺癌、宫颈癌、肾癌、膀胱癌进行筛查、诊断。
使用与实施例4中相似的步骤,分别采集大肠癌、胃癌、肝癌、乳腺癌、甲状腺癌、宫颈癌、肾癌、膀胱癌患者血液样本,并分析前述基因组合标志物的基因表达量,建立诊断模型,分别对大肠癌、胃癌、肝癌、乳腺癌、甲状腺癌、宫颈癌、肾癌、膀胱癌进行预测,并分析诊断效能。所取得的诊断效能参见表6和图6-13。
表6基因组合标志物对各类型肿瘤的诊断效能分析
全部分期AUC 0-Ⅰ期AUC Ⅱ-Ⅳ期AUC
大肠癌 0.921 0.915 0.934
胃癌 0.953 0.949 0.964
肝癌 0.912 0.949 0.872
乳腺癌 0.905 0.920 0.914
甲状腺癌 0.901 0.900 0.916
宫颈癌 0.939 0.928 0.950
肾癌 0.880 0.874 0.965
膀胱癌 0.917 0.888 0.962
由此可见,本例的基因组合标志物能够有效对大肠癌、胃癌、肝癌、乳腺癌、甲状腺癌、宫颈癌、肾癌、膀胱癌进行诊断,尤其是早期肿瘤。
综上所述,本发明提供的基因组合标志物能够实现肿瘤的检测,具有高度敏感性和特异性,而且仅需少量外周血样本即可完成检测,适用于推广。
除非另有定义,否则本文使用的所有技术和科学术语具有与本领域普通技术人员通常理解的意思相同的含义。
上述实施案例只为说明本发明的技术方案及特点,其目的在于更好的让熟悉该技术的人士予以实施,并不能以此限制本发明的保护范围,凡根据本发明精神实质所作的等效变化或修饰,均在本发明保护范围之内,其中未详细说明的为现有技术。

Claims (10)

1.一种用于多肿瘤筛查、诊断的基因组合标志物,其特征在于,至少包括以下6种基因:SGK1、DNAJB6P1、HIC2、RPS7P1、MT2A和OR2W3。
2.根据权利要求1所述用的基因组合标志物,其特征在于,还包括以下任意一种或任意多种基因:GZMB、DENND3、TNIP2、FOSL1、ZNF256、LAGE3、RRAD、CCNJL。
3.如权利要求1或2所述的基因组合标志物在制备用于肿瘤筛查、诊断或辅助诊断的产品中的应用,所述肿瘤为肺癌、大肠癌、胃癌、肝癌、乳腺癌、胰腺癌、甲状腺癌、肾癌、膀胱癌和宫颈癌中的至少一种。
4.根据权利要求3所述的应用,其特征在于,所述产品为用于检测样本中各基因表达量或相对表达水平的引物、探针、试剂盒、基因芯片或分析系统。
5.根据权利要求4所述的应用,其特征在于,所述样本为受试者血样样本。
6.一种用于肿瘤筛查、诊断或辅助诊断的试剂盒,其特征在于,包括用于检测权利要求1所述基因组合标志物中各基因表达量的引物,其中:
用于检测SGK1表达量的引物如SEQ ID NO.1~2所示;
用于检测DNAJB6P1表达量的引物如SEQ ID NO.3~4所示;
用于检测HIC2表达量的引物如SEQ ID NO.5~6所示;
用于检测RPS7P1表达量的引物如SEQ ID NO.7~8所示;
用于检测MT2A表达量的引物如SEQ ID NO.9~10所示;
用于检测OR2W3表达量的引物如SEQ ID NO.11~12所示。
7.根据权利要求6所述的试剂盒,其特征在于,还至少包括以下任意一对或任意多对引物:
用于检测GZMB表达量的引物,其序列如SEQ ID NO.13~14所示;
用于检测DENND3表达量的引物,其序列如SEQ ID NO.15~16所示;
用于检测TNIP2表达量的引物,其序列如SEQ ID NO.17~18所示;
用于检测FOSL1表达量的引物,其序列如SEQ ID NO.19~20所示;
用于检测ZNF256表达量的引物,其序列如SEQ ID NO.21~22所示;
用于检测LAGE3表达量的引物,其序列如SEQ ID NO.23~24所示;
用于检测RRAD表达量的引物,其序列如SEQ ID NO.25~26所示;
用于检测CCNJL表达量的引物,其序列如SEQ ID NO.27~28所示。
8.根据权利要求6所述的试剂盒,其特征在于,还包括用于检测内参基因表达量的引物。
9.根据权利要求8所述的试剂盒,其特征在于,所述内参基因为GAPDH基因和/或ACTB基因,用于检测GAPDH基因表达量的引物如SEQ ID NO.29~30所示,用于检测ACTB基因表达量的引物如SEQ ID NO.31~32所示。
10.一种用于肿瘤筛查、诊断或辅助诊断的分析系统,其特征在于,所述分析系统用于将权利要求1或2所述基因组合标志物中各基因的表达量转化为用于判断受试者是否为肿瘤患的预测值。
CN202311397869.XA 2023-10-25 2023-10-25 用于多种肿瘤筛查、诊断的基因组合标志物及其应用 Pending CN117512108A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311397869.XA CN117512108A (zh) 2023-10-25 2023-10-25 用于多种肿瘤筛查、诊断的基因组合标志物及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311397869.XA CN117512108A (zh) 2023-10-25 2023-10-25 用于多种肿瘤筛查、诊断的基因组合标志物及其应用

Publications (1)

Publication Number Publication Date
CN117512108A true CN117512108A (zh) 2024-02-06

Family

ID=89763535

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311397869.XA Pending CN117512108A (zh) 2023-10-25 2023-10-25 用于多种肿瘤筛查、诊断的基因组合标志物及其应用

Country Status (1)

Country Link
CN (1) CN117512108A (zh)

Similar Documents

Publication Publication Date Title
CN103299188B (zh) 用于癌症的分子诊断试验
CN105219844B (zh) 一种筛查十一种疾病的基因标志物组合、试剂盒以及疾病风险预测模型
CN105506115B (zh) 一种检测诊断遗传性心肌病致病基因的dna文库及其应用
CN105874079A (zh) 用于肺癌的分子诊断测试
CN105874080A (zh) 用于食道癌的分子诊断测试
WO2020132499A2 (en) Systems and methods for using fragment lengths as a predictor of cancer
CN112086129A (zh) 预测肿瘤组织cfDNA的方法及系统
US20210262016A1 (en) Methods and systems for somatic mutations and uses thereof
US20240002949A1 (en) Panel of mirna biomarkers for diagnosis of ovarian cancer, method for in vitro diagnosis of ovarian cancer, uses of panel of mirna biomarkers for in vitro diagnosis of ovarian cancer and test for in vitro diagnosis of ovarian cancer
CN106399304B (zh) 一种与乳腺癌相关的snp标记
CN104988141B (zh) BRCA2基因g.32912799T>C突变及其在乳腺癌辅助诊断中的应用
CN104818322B (zh) miRNA和Cyfra21‑1联合在检测非小细胞肺癌中的应用
CN114480636B (zh) 胆汁细菌作为肝门部胆管癌诊断及预后标志物的用途
CN117512108A (zh) 用于多种肿瘤筛查、诊断的基因组合标志物及其应用
CN112852969B (zh) 表观遗传修饰lncRNA作为肿瘤诊断或肿瘤进展预测标志物
CN117316278A (zh) 一种基于cfDNA片段长度分布特征的癌症无创早筛方法及系统
CN108588218A (zh) 一种血清miRNA组合的微创检测试剂盒
CN111763736B (zh) 用于诊断甲状腺乳头状癌淋巴结转移的液体活检试剂盒
CN104946751B (zh) BRCA1基因g.41244291delT突变及其在乳腺癌辅助诊断中的应用
Teramoto et al. Prediction of lymphatic invasion/lymph node metastasis, recurrence, and survival in patients with gastric cancer by cDNA array-based expression profiling1
US11807908B2 (en) Genetic markers used for identifying benign and malignant pulmonary micro-nodules and the application thereof
US20230102121A1 (en) Reagent combination and kit for detecting liver cancers, and use thereof
CN106811528B (zh) 一种乳腺癌治病基因新突变及其应用
CN108841960B (zh) 一种结肠腺癌易感性预测试剂盒及系统
CN106636351A (zh) 一种与乳腺癌相关的snp标记及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination