CN114891890A - 一种结直肠癌相关基因筛查试剂盒 - Google Patents
一种结直肠癌相关基因筛查试剂盒 Download PDFInfo
- Publication number
- CN114891890A CN114891890A CN202210710398.2A CN202210710398A CN114891890A CN 114891890 A CN114891890 A CN 114891890A CN 202210710398 A CN202210710398 A CN 202210710398A CN 114891890 A CN114891890 A CN 114891890A
- Authority
- CN
- China
- Prior art keywords
- gene
- colorectal cancer
- genes
- sequence seq
- primer shown
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 86
- 206010009944 Colon cancer Diseases 0.000 title claims abstract description 56
- 208000001333 Colorectal Neoplasms Diseases 0.000 title claims abstract description 46
- 238000012216 screening Methods 0.000 title claims abstract description 29
- 230000003321 amplification Effects 0.000 claims abstract description 21
- 238000003199 nucleic acid amplification method Methods 0.000 claims abstract description 21
- 101000957259 Homo sapiens Mitotic spindle assembly checkpoint protein MAD2A Proteins 0.000 claims abstract description 15
- 102100038792 Mitotic spindle assembly checkpoint protein MAD2A Human genes 0.000 claims abstract description 15
- 102100021655 Extracellular sulfatase Sulf-1 Human genes 0.000 claims abstract description 14
- 101000820630 Homo sapiens Extracellular sulfatase Sulf-1 Proteins 0.000 claims abstract description 14
- 101001098930 Homo sapiens Pachytene checkpoint protein 2 homolog Proteins 0.000 claims abstract description 14
- 101000620365 Homo sapiens Protein TMEPAI Proteins 0.000 claims abstract description 14
- 102100022429 Protein TMEPAI Human genes 0.000 claims abstract description 11
- 239000003153 chemical reaction reagent Substances 0.000 claims abstract description 10
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 5
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 5
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 5
- 101000868643 Homo sapiens G2/mitotic-specific cyclin-B1 Proteins 0.000 claims description 12
- 102100038993 Pachytene checkpoint protein 2 homolog Human genes 0.000 claims description 11
- 102000004190 Enzymes Human genes 0.000 claims description 10
- 108090000790 Enzymes Proteins 0.000 claims description 10
- 238000011144 upstream manufacturing Methods 0.000 claims description 10
- 238000000034 method Methods 0.000 claims description 9
- 101150071041 Ccnb1 gene Proteins 0.000 claims description 6
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 claims description 6
- 101100022602 Homo sapiens MAD2L1 gene Proteins 0.000 claims description 6
- 101100190829 Homo sapiens PMEPA1 gene Proteins 0.000 claims description 6
- 101150067545 MAD2L1 gene Proteins 0.000 claims description 6
- 101150048283 SULF1 gene Proteins 0.000 claims description 6
- 101150068317 Trip13 gene Proteins 0.000 claims description 4
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 claims description 2
- AHCYMLUZIRLXAA-SHYZEUOFSA-N Deoxyuridine 5'-triphosphate Chemical compound O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(=O)NC(=O)C=C1 AHCYMLUZIRLXAA-SHYZEUOFSA-N 0.000 claims description 2
- 102000006943 Uracil-DNA Glycosidase Human genes 0.000 claims description 2
- 108010072685 Uracil-DNA Glycosidase Proteins 0.000 claims description 2
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 claims description 2
- SUYVUBYJARFZHO-UHFFFAOYSA-N dATP Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-UHFFFAOYSA-N 0.000 claims description 2
- RGWHQCVHVJXOKC-SHYZEUOFSA-J dCTP(4-) Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-J 0.000 claims description 2
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 claims description 2
- NHVNXKFIZYSCEB-XLPZGREQSA-N dTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 NHVNXKFIZYSCEB-XLPZGREQSA-N 0.000 claims description 2
- 239000000203 mixture Substances 0.000 claims description 2
- 229910021642 ultra pure water Inorganic materials 0.000 claims description 2
- 239000012498 ultrapure water Substances 0.000 claims description 2
- 101000798079 Homo sapiens E3 ubiquitin-protein ligase TRAIP Proteins 0.000 claims 1
- 101001017828 Homo sapiens Leucine-rich repeat flightless-interacting protein 1 Proteins 0.000 claims 1
- 102100033303 Leucine-rich repeat flightless-interacting protein 1 Human genes 0.000 claims 1
- 239000013642 negative control Substances 0.000 claims 1
- 239000013641 positive control Substances 0.000 claims 1
- 230000014509 gene expression Effects 0.000 description 39
- 206010028980 Neoplasm Diseases 0.000 description 16
- 239000000523 sample Substances 0.000 description 16
- 206010064571 Gene mutation Diseases 0.000 description 15
- 201000011510 cancer Diseases 0.000 description 11
- 230000004083 survival effect Effects 0.000 description 11
- 102100032340 G2/mitotic-specific cyclin-B1 Human genes 0.000 description 10
- 208000029742 colonic neoplasm Diseases 0.000 description 10
- 108020004999 messenger RNA Proteins 0.000 description 10
- 238000001514 detection method Methods 0.000 description 9
- 230000035772 mutation Effects 0.000 description 9
- 238000003745 diagnosis Methods 0.000 description 8
- 238000012360 testing method Methods 0.000 description 6
- 230000000875 corresponding effect Effects 0.000 description 5
- 102000004169 proteins and genes Human genes 0.000 description 4
- 239000013558 reference substance Substances 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000036438 mutation frequency Effects 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 208000003200 Adenoma Diseases 0.000 description 2
- 208000005016 Intestinal Neoplasms Diseases 0.000 description 2
- 239000000090 biomarker Substances 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 238000013399 early diagnosis Methods 0.000 description 2
- 238000001962 electrophoresis Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 201000002313 intestinal cancer Diseases 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000012257 pre-denaturation Methods 0.000 description 2
- 238000004393 prognosis Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 101150096316 5 gene Proteins 0.000 description 1
- 208000006545 Chronic Obstructive Pulmonary Disease Diseases 0.000 description 1
- 208000037062 Polyps Diseases 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 239000011543 agarose gel Substances 0.000 description 1
- 238000003766 bioinformatics method Methods 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000007853 buffer solution Substances 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 230000004186 co-expression Effects 0.000 description 1
- 210000001072 colon Anatomy 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000013079 data visualisation Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000010195 expression analysis Methods 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 238000013090 high-throughput technology Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 239000013610 patient sample Substances 0.000 description 1
- 238000003752 polymerase chain reaction Methods 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- XOOUIPVCVHRTMJ-UHFFFAOYSA-L zinc stearate Chemical compound [Zn+2].CCCCCCCCCCCCCCCCCC([O-])=O.CCCCCCCCCCCCCCCCCC([O-])=O XOOUIPVCVHRTMJ-UHFFFAOYSA-L 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/686—Polymerase chain reaction [PCR]
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Organic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Biotechnology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Immunology (AREA)
- Genetics & Genomics (AREA)
- Analytical Chemistry (AREA)
- Medical Informatics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Theoretical Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Pathology (AREA)
- Evolutionary Biology (AREA)
- Bioethics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Biochemistry (AREA)
- Epidemiology (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Public Health (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Oncology (AREA)
- Hospice & Palliative Care (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种结直肠癌相关基因筛查试剂盒,包括用于筛查PMEPA1、SULF1、MAD2L1、TRIP13基因拷贝数变异的核酸扩增试剂,通过本发明得到的扩增结果不易出现假阳性,有效地提高了样本的检测稳定性,同时省去了基因探针成本,可以直接判断上述与结直肠癌相关的基因表达是否有异。
Description
技术领域
本发明涉及生物检测技术领域,特别是涉及一种与人结直肠癌相关基因的筛查试剂盒。
背景技术
结直肠癌发展缓慢,一般会经历息肉、腺瘤、肠癌等过程,从腺瘤发展成为肠癌时间可长达5-10年。早期结直肠癌的5年存活率高达90%以上,而IV期的5年存活率仅为5%-7%,如在结直肠癌发展早期进行干预,可显著降低死亡率,结直肠癌的筛查不足,是造成我国结直肠癌五年生存期低的主要原因。
目前临床应用的影像学、实验室检查、肠镜等传统检测方法通常具有敏感性和特异性低,或花费高、有创、给患者带来不适等缺点。因此,临床亟需发展敏感、特异、经济、无创的方法,以方便结直肠癌的筛查,提高疾病诊断效率。
随着高通量技术的发展,越来越多的生物标志物被发现,以进行癌症的诊断和预测。研究表明,应用不同生物标志物对结直肠癌发生发展提供了早期诊断和预后方向,研究与早期结直肠癌相关的基因标志物,为实现早期结直肠癌的诊断、预测受试者发展成为结直肠癌的风险,进而实现早干预早治疗提供了新的手段和方向。
然而,癌症的机理相当复杂,相关基因数量巨大,不同患者发生变异的基因、其中变异的位点及变异形式不同,仅位点突变就有缺失、移码、插入等形式,一些基因的高表达或不表达也可能与癌症相关,因此很难选出有共性的基因,对全部相关基因进行检测也是一件几乎不能完成的任务。因此,通过有限数目的基因最大程度上判断出基因是否发生变化尤为重要。
发明内容
本发明的目的在于提供一种结直肠癌相关基因筛查试剂盒,能筛查PMEPA1、SULF1、MAD2L1、TRIP13和CCNB1五个基因的表达情况。
本发明的另一目的在于提供一种使用结直肠癌筛查试剂盒的方法,能够通过简单操作得到特定基因表达量的变化情况,以此判断筛查结果。
本发明公开了一种结直肠癌相关基因筛查试剂盒,包括用于扩增结直肠癌相关基因的核酸扩增试剂,其中所述试剂包括SEQ ID NO.1~10所示5对引物,用于筛查PMEPA1、SULF1、MAD2L1 TRIP13和CCNB1五个基因。
所述引物对分别用于扩增以下基因:
PMEPA1基因的PCR引物对为序列SEQ ID NO.1所示的上游引物和SEQ ID NO.2所示的下游引物;SULF1基因的PCR引物对为序列SEQ ID NO.3所示的上游引物和SEQ ID NO.4所示的下游引物;MAD2L1基因的PCR引物对为序列SEQ ID NO.5所示的上游引物和SEQ IDNO.6所示的下游引物;TRIP13基因的PCR引物对为序列SEQ ID NO.7所示的上游引物和SEQID NO.8所示的下游引物。CCNB1基因的PCR引物对为序列SEQ ID NO.9所示的上游引物和SEQ ID NO.10所示的下游引物。
所述扩增试剂还包括15mM dATP、15mM dCTP、15mM dGTP、15mM dUTP、15mM dTTP,pH为7-9、浓度为10mM的Tris-HCl+甘油缓冲液,20mM的MgCl2,10mM的MnCl2,Taq酶和UNG酶。
优选地,所述的Taq酶为热启动Taq酶,所述的UNG酶为尿嘧啶-N-糖基化酶。
为了便于对比出目的基因拷贝数增加的情况,所述的结直肠癌筛查试剂盒中还包括对照品和超纯水,所述对照品包括阴性对照品和阳性对照品。
本发明还公开了利用所述试剂盒筛查PMEPA1、SULF1、MAD2L1、TRIP13和CCNB1基因的方法,是将样品与试剂盒内的核酸扩增试剂混合,放入PCR仪中扩增后,拷贝数相较于正常人显著增高的样品为阳性结果。
所述扩增的循环体系为85-92℃ 15s,54-60℃ 60s, 51-59℃ 60s,循环45次。
进一步地,扩增循环前升温至88℃ 30s预变性,扩增循环结束后降温至35℃保温5min。
本发明基于机器学习和多种统计分析方法,从难以计数的结直肠癌相关基因中筛选出临床样本诊断高度相关的5个基因,并将其集合于一个试剂盒中,对于早期的结直肠癌样本的针对性很强,利用五种基因的集合检验对于结直肠癌(COAD)的筛查以及相应的监测技术开展结直肠癌的早筛早诊意义重大,具有广泛的临床应用前景。
此外,本发明利用的生物信息学方法,是基于现有的GEO数据库中的大量临床样本信息,在预测正常(Normal)和癌症(Tumor)结局的基础上,分析各变量预测能力的准确性。再根据DeLong's test检验,在预测正常(Normal)和癌症(Tumor)结局的基础上,综合分析各变量的诊断效能。对标志基因的联合诊断效能进行评估分析,利用SPSS对各基因的表达水平进行Logistics回归分析,通过拟合出的回归曲线计算出基因是否过量表达的概率。
因为本发明选择的肿瘤早筛基因的变异方式为拷贝数变异,不易出现假阴性,有效地提高了样本的检测稳定性,同时省去基因探针成本,PCR扩增程序简单,对结直肠癌临床早筛普及具有重要意义。
附图说明
图1是GEO数据库基因共表达Venn图。
图2是TCGA数据库和GTEx中5种基因表达差异柱状图。
图3是TCGA数据库中MAD2L1基因在癌症患者T和正常人N中表达差异柱状图。
图4是TCGA数据库中SULF1基因在癌症患者T和正常人N中表达差异柱状图。
图5是TCGA数据库中PMEPA1基因在癌症患者T和正常人N中表达差异柱状图。
图6是TCGA数据库中TRIP13基因在癌症患者T和正常人N中表达差异柱状图。
图7是TCGA数据库中CCNB1基因在癌症患者T和正常人N中表达差异柱状图。
图8是GEPIA2数据库中MAD2L1基因与结肠癌的总体生存曲线图。
图9是GEPIA2数据库中SULF1基因与结肠癌的总体生存曲线图。
图10是GEPIA2数据库中PMEPA1基因与结肠癌的总体生存曲线图。
图11是GEPIA2数据库中TRIP13基因与结肠癌的总体生存曲线图。
图12是GEPIA2数据库中CCNB1基因与结肠癌的总体生存曲线图。
图13是5种差异表达基因的在GEO数据库结直肠癌临床样本和正常样本中的聚类分析热图。
图14是5种基因对应GEO数据库的受试者工作曲线(ROC)。
图15是5种基因对应GSE110225数据集的受试者工作曲线(ROC)。
图16是Cbioportal数据库中PMEPA1基因在各数据集中基因突变概率柱状图。
图17是Cbioportal数据库中CCNB1基因在各数据集中基因突变概率柱状图。
图18是Cbioportal数据库中SULF1基因在各数据集中基因突变概率柱状图。
图19是Cbioportal数据库中MAD2L1基因在各数据集中基因突变概率柱状图。
图20是Cbioportal数据库中TTIP13基因在各数据集中基因突变概率柱状图。
图21是Cbioportal数据库中PMEPA1基因转录mRNA表达量差异与基因突变情况之间的关系图。
图22是Cbioportal数据库中CCNB1基因转录mRNA表达量差异与基因突变情况之间的关系图。
图23是Cbioportal数据库中SULF1基因转录mRNA表达量差异与基因突变情况之间的关系图。
图24是Cbioportal数据库中MAD2L1基因转录mRNA表达量差异与基因突变情况之间的关系图。
图25是Cbioportal数据库中TTIP13基因转录mRNA表达量差异与基因突变情况之间的关系图。
具体实施方式
实施例1。
从基因表达数据库——Gene Expression Omnibus(GEO)数据库中以“coloncaner”结直肠癌为关键词,搜索与结直肠癌相关的公共基因表达数据及其完整的注释,根据公共基因表达数据中记载的临床信息,选择结直肠癌患者的临床样本信息。下载GSE166427, GSE110223 ,GSE110224,GSE113513,GSE110225数据集。其中GSE166427来自GPL13667平台,包含97例正常的组织样本,197例癌症样本:GSE110223来自GPL96平台包含13例正常组织和13例结肠癌组织:GSE110224来自GPL570平台,包含17例正常组织和17例结肠癌组织;GSE110513来自GPL15207平台,包含14例非癌性周围组织和14例结肠癌组织;GSE110225包含多子集,包含30例正常组织和30例结肠癌组织对于下载的数据集的基因表达矩阵文件,使用GPL平台注释文件对基因表达谱进行注释,将基因探针转换成genesymbol。选择GSE166427, GSE110223 ,GSE110224,GSE113513作为训练集,GSE110225作为验证集。利用R包“limma”分析训练集四个数据集进行差异表达分析,对每个数据集筛选符合修改后p值(adj.p.value)<0.05,LogFC>2条件的基因,如图1所示,去除非蛋白编码蛋白后,综合比对筛选后数据,最后得到86个共表达基因。
利用TCGA数据集与GTEx数据集,下载临床信息,采用R包“gGPLot2”,R包“pROC”,分析86种差异表达基因的差异表达与总体生存期,选择p-value Cutoff值:0.01,cut off值:4.5为条件。筛查得到PMEPA1、SULF1、MAD2L1、 TRIP13和CCNB1基因,所选5种基因在临床样本中的具体表达情况如图2-7所示,所选5种基因对应的结直肠癌患者总体生存曲线如图8-12所示,在结直肠癌临床样本数据中基因表达情况均为上调,且基因表达情况与结直肠癌患者总体生存期呈负相关,差异具有统计学意义(P<0.05)。
分析训练集中数据集表达谱矩阵。运用R包"ComplexHeatmap"绘制差异表达基因(DEGs)在GEO数据库的表达情况热图,进行数据可视化,如图13表示,热图显示五种基因具有明显表达差异。为了进一步研究5种基因临床意义,对各基因的表达水平进行 Logistics回归分析,如图14所示,采用R包“pROC包”绘制选取的5种基因对应GEO数据库的受试者工作曲线(ROC)图,分析其诊断效能。得到结直肠癌靶向基因检测技术对结直肠癌和癌前病变的样本的检测结果对比,即表1、表2、表3。
表1 五种基因受试者工作曲线(ROC)样本参数
表2 五种基因受试者工作曲线(ROC)具体数值
表3 五种基因对应GEO数据库的受试者工作曲线(ROC)临床意义说明
综合表1至表3中的内容可以看出,在预测Normal和Tumor结局上,变量PMEPA1的预测能力有一定准确性(AUC = 0.831,CI = 0.799-0.864),变量SULF1的预测能力有较低准确性(AUC = 0.619,CI = 0.576-0.662),变量CCNB1的预测能力有较高准确性(AUC =0.980,CI = 0.972-0.989),变量MAD2L1的预测能力有较高准确性(AUC = 0.988,CI =0.983-0.994),变量TRIP13的预测能力有较高准确性(AUC = 0.996,CI = 0.993-0.999)。
根据诊断效能AUC值与置信区间,分析得到这5种基因对于结直肠癌预测均据有临床意义。
利用SPSS对各基因的表达水平进Logistics回归,通过拟合出的回归曲线计算出每个个体患病与否的概率,计算得出联合诊断方案的灵敏度、特异性以及准确性,绘制如图15所示的受试者工作曲线(ROC),其中验证集为GSE110225数据集。图15中包含了5个基因对应验证集GSE110225数据集的单独结果及部分优选组合方式的结果。
图15中每条曲线的具体数据对应表4,可以看出,在预测Normal和Tumor结局上,变量CCNB1、MAD2L1、TRIP13的预测能力有一定准确性(AUC = 0.830,CI = 0.696-0.975),PMEPA1、SULF1、MAD2L1、TRIP13四种基因组合检验有最高的准确性(AUC = 0.907,CI =0.808-1.000),上述4种基因与CCNB1综合5种基因联合检验的准确性也较高,(AUC=0.893,CI=0.784~1.000)。对比分析得PMEPA1、SULF1、MAD2L1 TRIP13四种基因或使用全部五个基因的集合检验诊断效能(AUC)值较大,具有优异性能,且设定的置信度相同时,总体稳定性好,可信度高。优于其他几种基因组合,因此,对结直肠癌colon cancer的筛查最具有临床意义。
表4 五种基因对应GSE110225数据集的受试者工作曲线(ROC)下面积(AUC)
实施例2。
运用Cbioportal生物信息分析网站,分析TCGA数据库,MSKCC数据库,DFCL数据库中结直肠癌患者PMEPA1,CCNB1,SULF1,MAD2L1,TRIP13基因突变情况,基因突变频率分别如图16-20所示,基因突变频率较低。
图16-20分别是基因PMEPA1,CCNB1,SULF1,MAD2L1,TRIP13在各数据集中基因突变概率,其中,横坐标为各数据库中基因研究数据集,纵坐标为对应基因突变概率。通过图16-20可以看出,本发明选中的5种基因基因突变频率较低,且主要为Amplification与Deletion的拷贝数变异。下面再进一步分析5种基因高表达究竟与哪种基因突变有关
分析选中的5种基因mRNA转录表达情况与基因突变之间的关系,PMEPA1, CCNB1,SULF1, MAD2L1, TRIP13基因的结果分别如图21-25所示。
图21-25是cbioportal数据库中基因转录mRNA表达量差异与基因突变情况之间的关系,其中横坐标为基因突变情况,纵坐标为基因转录mRNA差异表达情况。如图2-7所示,本发明选中的5种基因在结直肠癌临床样本与正常组织样本中基因表达对应的蛋白质含量差异明显,图21-25是对于这异常的高基因表达进行解释,5种基因对应的mRNA高转录量临床患者样本均为Amplification与Deletion的拷贝数变异。因为基因转录mRNA与基因表达蛋白质含量成正相关,因此可以得出:PMEPA1, CCNB1, SULF1, MAD2L1, TRIP13基因对应蛋白质高表达与突变基本无关系,其主要为基因拷贝数变异。在检测样本时,不需要考虑突变导致基因检测位点改变,可直接进行引物连接扩增,提高了检测的稳定性与简便性。
实施例3。
取血液作为样本,按下述方法使用结直肠癌筛查试剂盒:
1)配置如表5所示的15μL反应体系:
2)混匀后放入PCR仪中,设定如下循环体系后开始扩增:88℃ 30s预变性;90℃15s,57℃ 60s,55℃ 60s共45个循环;35℃ 5min后终止扩增。
3)扩增结束后将扩增产物转移至琼脂糖凝胶中电泳,电泳结束后观察样品条带,通过与对照组对比条带宽度及亮度的区别,判断拷贝数是否有变化,以此判断目标基因是否发生拷贝数变异。
序列表
<110> 山西医科大学
<120> 一种结直肠癌相关基因筛查试剂盒
<160> 10
<170> SIPOSequenceListing 1.0
<210> 1
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequences)
<400> 1
cgcctcctgc tacagttaat 20
<210> 2
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequences)
<400> 2
gacagcttgt agtggctcag 20
<210> 3
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequences)
<400> 3
agagtcgcag gcaatagaac 20
<210> 4
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequences)
<400> 4
actggtcaca ctgaagaagg 20
<210> 5
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequences)
<400> 5
atacggactc accttgcttg 20
<210> 6
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequences)
<400> 6
accgtagctg tgatctgtct 20
<210> 7
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequences)
<400> 7
cacagcctct tttctaagtg gt 22
<210> 8
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequences)
<400> 8
cacttctcag ggaaaattgc t 21
<210> 9
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequences)
<400> 9
gacctgtgtc aggctttctc 20
<210> 10
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequences)
<400> 10
atgtttccag tgacttcccg 20
Claims (9)
1.一种结直肠癌相关基因筛查试剂盒,包括用于扩增结直肠癌相关基因的核酸扩增试剂,其中所述试剂包括SEQ ID NO.1~8所示4对引物,用于扩增PMEPA1、SULF1、MAD2L1和TRIP13四个基因。
2.根据权利要求1所述的结直肠癌相关基因筛查试剂盒,其中所述试剂还包括SEQ IDNO.9所示的上游引物和SEQ ID NO.10所示的下游引物,用于扩增CCNB1基因。
3.根据权利要求1所述的结直肠癌相关基因筛查试剂盒,其中所述引物对分别用于扩增以下基因:
PMEPA1基因的PCR引物对为序列SEQ ID NO.1所示的上游引物和SEQ ID NO.2所示的下游引物;
SULF1基因的PCR引物对为序列SEQ ID NO.3所示的上游引物和SEQ ID NO.4所示的下游引物;
MAD2L1基因的PCR引物对为序列SEQ ID NO.5所示的上游引物和SEQ ID NO.6所示的下游引物;
TRIP13基因的PCR引物对为序列SEQ ID NO.7所示的上游引物和SEQ ID NO.8所示的下游引物。
4.根据权利要求1所述的结直肠癌相关基因筛查试剂盒,其中所述扩增试剂还包括15mM dATP、15mM dCTP、15mM dGTP、15mM dUTP、15mM dTTP,pH为7-9、浓度为10mM的Tris-HCl+甘油缓冲液,20mM的MgCl2,10mM的MnCl2,Taq酶和UNG酶。
5.根据权利要求4所述的结直肠癌相关基因筛查试剂盒,其中所述的Taq酶为热启动Taq酶,所述的UNG酶为尿嘧啶-N-糖基化酶。
6.根据权利要求1所述的结直肠癌相关基因筛查试剂盒,其中还包括对照品和超纯水,所述对照品包括阴性对照品和阳性对照品。
7.一种使用权利要求1至6任一项所述试剂盒筛查PMEPA1、SULF1、MAD2L1、TRIP13和CCNB1基因的方法,是将待测样品与试剂盒内的核酸扩增试剂混合,放入PCR仪中扩增后,拷贝数变多的样品为阳性结果。
8.根据权利要求7所述的方法,其中所述扩增的循环体系为85-92℃ 15s,54-60℃60s, 51-59℃ 60s,循环45次。
9.根据权利要求8所述的方法,其中扩增循环前升温至88℃ 30s预变性,扩增循环结束后降温至35℃保温5min。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210710398.2A CN114891890A (zh) | 2022-06-21 | 2022-06-21 | 一种结直肠癌相关基因筛查试剂盒 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210710398.2A CN114891890A (zh) | 2022-06-21 | 2022-06-21 | 一种结直肠癌相关基因筛查试剂盒 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114891890A true CN114891890A (zh) | 2022-08-12 |
Family
ID=82727529
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210710398.2A Pending CN114891890A (zh) | 2022-06-21 | 2022-06-21 | 一种结直肠癌相关基因筛查试剂盒 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114891890A (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110499364A (zh) * | 2019-07-30 | 2019-11-26 | 北京凯昂医学诊断技术有限公司 | 一种用于检测扩展型遗传病全外显子的探针组及其试剂盒和应用 |
CN110819715A (zh) * | 2019-11-26 | 2020-02-21 | 华夏帮服科技有限公司 | 用于结直肠癌检测的免疫基因标志物及试剂盒 |
CN114085905A (zh) * | 2020-08-24 | 2022-02-25 | 广州达健生物科技有限公司 | 用于检测结直肠癌的组合物及其试剂盒与应用 |
-
2022
- 2022-06-21 CN CN202210710398.2A patent/CN114891890A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110499364A (zh) * | 2019-07-30 | 2019-11-26 | 北京凯昂医学诊断技术有限公司 | 一种用于检测扩展型遗传病全外显子的探针组及其试剂盒和应用 |
CN110819715A (zh) * | 2019-11-26 | 2020-02-21 | 华夏帮服科技有限公司 | 用于结直肠癌检测的免疫基因标志物及试剂盒 |
CN114085905A (zh) * | 2020-08-24 | 2022-02-25 | 广州达健生物科技有限公司 | 用于检测结直肠癌的组合物及其试剂盒与应用 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8765383B2 (en) | Methods of predicting cancer risk using gene expression in premalignant tissue | |
CN106893784A (zh) | 用于预测肝癌预后的lncRNA标志物 | |
CN105671181B (zh) | 用于检测肺癌的基因标志物、引物、探针及试剂盒 | |
JP2019527544A (ja) | 分子マーカー、参照遺伝子、及びその応用、検出キット、並びに検出モデルの構築方法 | |
CN106574294A (zh) | 用于通过定量pcr从人粪便样本诊断结肠直肠癌的方法、引物及试剂盒 | |
CN108753974B (zh) | 一种结直肠癌肿瘤标志物及其检测方法与装置 | |
CN117165688A (zh) | 用于尿路上皮癌的标志物及其应用 | |
CN116987791B (zh) | 一组血浆标志物在甲状腺结节良恶性鉴别中的应用 | |
TWI571514B (zh) | 評估罹患大腸直腸癌風險的方法 | |
CN113046437A (zh) | 一种检测met e14跳跃突变的方法 | |
CN106987633A (zh) | 一种检测结直肠癌血清分泌型lncRNAs的引物和试剂盒 | |
CN114480636B (zh) | 胆汁细菌作为肝门部胆管癌诊断及预后标志物的用途 | |
CN114107515B (zh) | 早期胃癌预后差异基因与复发预测模型 | |
CN114277132B (zh) | 免疫相关的lncRNA表达谱预测小细胞肺癌辅助化疗获益及预后的应用 | |
CN114891890A (zh) | 一种结直肠癌相关基因筛查试剂盒 | |
CN111733242B (zh) | lncRNA AK024561作为卵巢癌诊断标志物的应用 | |
EP2247754A1 (en) | Colon cancer associated transcript 1 (ccat1) as a cancer marker | |
CN115094131A (zh) | 一种用于炎症性肠病的诊断标志物及其应用 | |
CN111172285A (zh) | 用于胰腺癌早期诊断和/或预后监测的miRNA组及其应用 | |
CN113186285B (zh) | 一种辅助诊断胃癌的方法及其使用的miRNA组合 | |
CN116287252B (zh) | 长链非编码rna apcdd1l-dt在制备检测胰腺癌的产品中的应用 | |
CN108866189B (zh) | 一种喉鳞状细胞癌易感性预测试剂盒及系统 | |
US20230193397A1 (en) | cDNA, mRNA, PROTEIN, AND KIT AND SYSTEM FOR EVALUATING GLIOMA PROGNOSIS | |
CN113278697B (zh) | 一种基于外周血内基因甲基化的肺癌诊断试剂盒 | |
CN108841959B (zh) | 一种口腔及头颈部恶性肿瘤易感性预测试剂盒及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |