CN108949757B - 基于二代测序平台检测微卫星不稳定性的引物组合物、试剂盒和方法 - Google Patents
基于二代测序平台检测微卫星不稳定性的引物组合物、试剂盒和方法 Download PDFInfo
- Publication number
- CN108949757B CN108949757B CN201810957432.XA CN201810957432A CN108949757B CN 108949757 B CN108949757 B CN 108949757B CN 201810957432 A CN201810957432 A CN 201810957432A CN 108949757 B CN108949757 B CN 108949757B
- Authority
- CN
- China
- Prior art keywords
- primer
- mutation
- gene
- sequence
- upstream
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000000203 mixture Substances 0.000 title claims abstract description 51
- 208000032818 Microsatellite Instability Diseases 0.000 title claims abstract description 47
- 238000000034 method Methods 0.000 title claims abstract description 46
- 238000007481 next generation sequencing Methods 0.000 title claims abstract description 10
- 230000035772 mutation Effects 0.000 claims abstract description 74
- 238000011144 upstream manufacturing Methods 0.000 claims abstract description 38
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 36
- 230000000295 complement effect Effects 0.000 claims abstract description 11
- 108020004414 DNA Proteins 0.000 claims description 58
- 238000012163 sequencing technique Methods 0.000 claims description 52
- 239000000523 sample Substances 0.000 claims description 48
- 108091092878 Microsatellite Proteins 0.000 claims description 15
- 239000013068 control sample Substances 0.000 claims description 10
- 102100037841 Beta-defensin 105 Human genes 0.000 claims description 9
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 claims description 9
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 claims description 9
- 101150104237 Birc3 gene Proteins 0.000 claims description 6
- 102000012410 DNA Ligases Human genes 0.000 claims description 6
- 108010061982 DNA Ligases Proteins 0.000 claims description 6
- 101000951733 Homo sapiens Beta-defensin 105 Proteins 0.000 claims description 6
- 101001106090 Homo sapiens Receptor expression-enhancing protein 5 Proteins 0.000 claims description 6
- 102100021077 Receptor expression-enhancing protein 5 Human genes 0.000 claims description 6
- 102100034157 DNA mismatch repair protein Msh2 Human genes 0.000 claims description 4
- 101001134036 Homo sapiens DNA mismatch repair protein Msh2 Proteins 0.000 claims description 4
- 101000730454 Homo sapiens Phosphatidylinositol 4-phosphate 5-kinase type-1 alpha Proteins 0.000 claims description 4
- 101150068332 KIT gene Proteins 0.000 claims description 4
- 229910015837 MSH2 Inorganic materials 0.000 claims description 4
- 238000011049 filling Methods 0.000 claims description 4
- 102100021886 Activin receptor type-2A Human genes 0.000 claims description 3
- 101150027490 Acvr2a gene Proteins 0.000 claims description 3
- 101150062679 Arhgef12 gene Proteins 0.000 claims description 3
- 108700003785 Baculoviral IAP Repeat-Containing 3 Proteins 0.000 claims description 3
- 102100021662 Baculoviral IAP repeat-containing protein 3 Human genes 0.000 claims description 3
- 101150063052 DEFB105A gene Proteins 0.000 claims description 3
- 101150117928 DEFB105B gene Proteins 0.000 claims description 3
- 101150012822 DOCK3 gene Proteins 0.000 claims description 3
- 102100031604 Dedicator of cytokinesis protein 3 Human genes 0.000 claims description 3
- 102100026245 E3 ubiquitin-protein ligase RNF43 Human genes 0.000 claims description 3
- 101000970954 Homo sapiens Activin receptor type-2A Proteins 0.000 claims description 3
- 101100387908 Homo sapiens DOCK3 gene Proteins 0.000 claims description 3
- 101000866238 Homo sapiens Dedicator of cytokinesis protein 3 Proteins 0.000 claims description 3
- 101000692702 Homo sapiens E3 ubiquitin-protein ligase RNF43 Proteins 0.000 claims description 3
- 101001008949 Homo sapiens Kinesin-like protein KIF14 Proteins 0.000 claims description 3
- 101001059989 Homo sapiens Mitogen-activated protein kinase kinase kinase kinase 3 Proteins 0.000 claims description 3
- 101100348782 Homo sapiens NOMO1 gene Proteins 0.000 claims description 3
- 101000578351 Homo sapiens Nodal modulator 1 Proteins 0.000 claims description 3
- 101000952097 Homo sapiens Probable ATP-dependent RNA helicase DDX59 Proteins 0.000 claims description 3
- 101100091155 Homo sapiens RNF43 gene Proteins 0.000 claims description 3
- 101000927774 Homo sapiens Rho guanine nucleotide exchange factor 12 Proteins 0.000 claims description 3
- 101000760288 Homo sapiens Zinc finger protein 2 Proteins 0.000 claims description 3
- 102100027631 Kinesin-like protein KIF14 Human genes 0.000 claims description 3
- 101150011852 MAP4K3 gene Proteins 0.000 claims description 3
- 102100028193 Mitogen-activated protein kinase kinase kinase kinase 3 Human genes 0.000 claims description 3
- 101150033433 Msh2 gene Proteins 0.000 claims description 3
- 101150065161 NOMO1 gene Proteins 0.000 claims description 3
- 102100027968 Nodal modulator 1 Human genes 0.000 claims description 3
- 102100032615 Phosphatidylinositol 4-phosphate 5-kinase type-1 alpha Human genes 0.000 claims description 3
- 102100037436 Probable ATP-dependent RNA helicase DDX59 Human genes 0.000 claims description 3
- 102100033193 Rho guanine nucleotide exchange factor 12 Human genes 0.000 claims description 3
- -1 SLC7a8 Proteins 0.000 claims description 3
- 101100379220 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) API2 gene Proteins 0.000 claims description 3
- 102100024687 Zinc finger protein 2 Human genes 0.000 claims description 3
- 101150028557 Znf2 gene Proteins 0.000 claims description 3
- 230000008030 elimination Effects 0.000 claims description 3
- 238000003379 elimination reaction Methods 0.000 claims description 3
- 238000001914 filtration Methods 0.000 claims description 3
- 238000007169 ligase reaction Methods 0.000 claims description 3
- 101150093371 reep5 gene Proteins 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 2
- 230000008520 organization Effects 0.000 claims description 2
- 238000001514 detection method Methods 0.000 abstract description 25
- 230000008569 process Effects 0.000 abstract description 9
- 230000035945 sensitivity Effects 0.000 abstract description 5
- 230000004907 flux Effects 0.000 abstract description 2
- 238000003752 polymerase chain reaction Methods 0.000 description 32
- 206010028980 Neoplasm Diseases 0.000 description 23
- 238000012360 testing method Methods 0.000 description 22
- 201000011510 cancer Diseases 0.000 description 19
- 238000006243 chemical reaction Methods 0.000 description 19
- 238000009396 hybridization Methods 0.000 description 17
- 239000003153 chemical reaction reagent Substances 0.000 description 15
- 206010009944 Colon cancer Diseases 0.000 description 14
- 230000003321 amplification Effects 0.000 description 13
- 238000003199 nucleic acid amplification method Methods 0.000 description 13
- 208000001333 Colorectal Neoplasms Diseases 0.000 description 12
- 239000011324 bead Substances 0.000 description 12
- 239000006228 supernatant Substances 0.000 description 10
- 102000004190 Enzymes Human genes 0.000 description 8
- 108090000790 Enzymes Proteins 0.000 description 8
- 230000033607 mismatch repair Effects 0.000 description 8
- 238000002156 mixing Methods 0.000 description 7
- 239000000843 powder Substances 0.000 description 7
- 125000003729 nucleotide group Chemical group 0.000 description 6
- 239000000047 product Substances 0.000 description 6
- 230000000717 retained effect Effects 0.000 description 6
- 238000012408 PCR amplification Methods 0.000 description 5
- 238000004925 denaturation Methods 0.000 description 5
- 230000036425 denaturation Effects 0.000 description 5
- 239000007788 liquid Substances 0.000 description 5
- 101150061338 mmr gene Proteins 0.000 description 5
- 239000002773 nucleotide Substances 0.000 description 5
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 5
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 4
- 238000012217 deletion Methods 0.000 description 4
- 230000037430 deletion Effects 0.000 description 4
- 239000012634 fragment Substances 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 108020004707 nucleic acids Proteins 0.000 description 4
- 102000039446 nucleic acids Human genes 0.000 description 4
- 150000007523 nucleic acids Chemical class 0.000 description 4
- 239000000243 solution Substances 0.000 description 4
- 239000002904 solvent Substances 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 239000000872 buffer Substances 0.000 description 3
- 210000004027 cell Anatomy 0.000 description 3
- 238000005119 centrifugation Methods 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 238000007405 data analysis Methods 0.000 description 3
- 238000001035 drying Methods 0.000 description 3
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 3
- 230000002055 immunohistochemical effect Effects 0.000 description 3
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 239000003550 marker Substances 0.000 description 3
- 102000004169 proteins and genes Human genes 0.000 description 3
- 230000008439 repair process Effects 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- 208000037051 Chromosomal Instability Diseases 0.000 description 2
- 208000031448 Genomic Instability Diseases 0.000 description 2
- 208000017095 Hereditary nonpolyposis colon cancer Diseases 0.000 description 2
- 101150078196 PIP5K1 gene Proteins 0.000 description 2
- 102000006382 Ribonucleases Human genes 0.000 description 2
- 108010083644 Ribonucleases Proteins 0.000 description 2
- 208000029742 colonic neoplasm Diseases 0.000 description 2
- 238000001816 cooling Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 238000004393 prognosis Methods 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 239000002096 quantum dot Substances 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 230000004083 survival effect Effects 0.000 description 2
- 238000010257 thawing Methods 0.000 description 2
- 238000012070 whole genome sequencing analysis Methods 0.000 description 2
- 108700028369 Alleles Proteins 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 102100028843 DNA mismatch repair protein Mlh1 Human genes 0.000 description 1
- 102100021147 DNA mismatch repair protein Msh6 Human genes 0.000 description 1
- 238000009007 Diagnostic Kit Methods 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 206010064571 Gene mutation Diseases 0.000 description 1
- 208000008051 Hereditary Nonpolyposis Colorectal Neoplasms Diseases 0.000 description 1
- 101000968658 Homo sapiens DNA mismatch repair protein Msh6 Proteins 0.000 description 1
- 201000005027 Lynch syndrome Diseases 0.000 description 1
- 206010027476 Metastases Diseases 0.000 description 1
- 102000008071 Mismatch Repair Endonuclease PMS2 Human genes 0.000 description 1
- 108010074346 Mismatch Repair Endonuclease PMS2 Proteins 0.000 description 1
- 101100107522 Mus musculus Slc1a5 gene Proteins 0.000 description 1
- 108010026664 MutL Protein Homolog 1 Proteins 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 238000010222 PCR analysis Methods 0.000 description 1
- 208000008425 Protein deficiency Diseases 0.000 description 1
- BQCADISMDOOEFD-UHFFFAOYSA-N Silver Chemical compound [Ag] BQCADISMDOOEFD-UHFFFAOYSA-N 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 239000007853 buffer solution Substances 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000007865 diluting Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 230000002357 endometrial effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000005429 filling process Methods 0.000 description 1
- 239000007850 fluorescent dye Substances 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 230000002496 gastric effect Effects 0.000 description 1
- 210000001035 gastrointestinal tract Anatomy 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 238000012224 gene deletion Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 230000005746 immune checkpoint blockade Effects 0.000 description 1
- 238000013115 immunohistochemical detection Methods 0.000 description 1
- 238000012151 immunohistochemical method Methods 0.000 description 1
- 238000003364 immunohistochemistry Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 210000000265 leukocyte Anatomy 0.000 description 1
- 238000004020 luminiscence type Methods 0.000 description 1
- 238000007403 mPCR Methods 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000009401 metastasis Effects 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 230000008506 pathogenesis Effects 0.000 description 1
- 230000002980 postoperative effect Effects 0.000 description 1
- 238000012257 pre-denaturation Methods 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 239000011535 reaction buffer Substances 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000002271 resection Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000010839 reverse transcription Methods 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 229910052709 silver Inorganic materials 0.000 description 1
- 239000004332 silver Substances 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 239000001226 triphosphate Substances 0.000 description 1
- 235000011178 triphosphate Nutrition 0.000 description 1
- 125000002264 triphosphate group Chemical class [H]OP(=O)(O[H])OP(=O)(O[H])OP(=O)(O[H])O* 0.000 description 1
- 238000013024 troubleshooting Methods 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/686—Polymerase chain reaction [PCR]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Engineering & Computer Science (AREA)
- Immunology (AREA)
- Analytical Chemistry (AREA)
- Genetics & Genomics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Pathology (AREA)
- Hospice & Palliative Care (AREA)
- Oncology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开基于二代测序平台检测微卫星不稳定性的引物组合物和方法。本发明的引物组合物包括上游引物组和下游引物组,且上游引物组中的各引物分别包括5’端的UID序列和与PCR通用引物对中的一种引物互补的结合区,下游引物组中的各引物分别包括与PCR通用引物对中的另一引物互补的结合区;其中上游引物组中的各引物分别特异性结合至特定基因群组中的至少一种基因的突变位点的上游,和下游引物组中的各引物分别特异性结合至该突变位点的下游。本发明的方法在很大程度上简化了检测过程并降低检测成本,具有通量高,灵敏度高,特异性高的特点。
Description
技术领域
本发明属于基因检测领域,具体地涉及一种基于二代测序平台检测微卫星不稳定性的引物组合物及方法。
背景技术
结直肠癌是常见的消化道恶性肿瘤,在我国常见恶性肿瘤死亡中,结直肠癌患者在男性占第五位,女性占第六位。我国每年结直肠癌新发病例超过25万,死亡病例约14万,新发和死亡病例均占全世界同期结直肠癌病例的20%。因此,降低我国结肠癌的发病率和死亡率是刻不容缓的重大临床科学问题。
结直肠癌根治性切除术后5年生存率24%-58%,平均仅为40%,术后复发和转移是其死亡的重要原因。研究发现,结直肠癌发病机理和基因组不稳定性密切相关,主要包括染色体不稳定性(chromosomal instability,CI)和微卫星不稳定性(microsatelliteinstability,MSI)。
微卫星不稳定性是指由于DNA错配修复(Mismatch Repair,MMR)导致的细胞的超突变状态,出现新的微卫星等位基因现象。它包括在短串联DNA重复序列(微卫星)中插入和缺失突变,以及整个基因组中的核苷酸替换。MSI是一种用于胃肠道、子宫内膜和结直肠肿瘤的诊断标志物。约15%的结直肠癌患者存在MSI现象,其中典型的遗传性非息肉病性结直肠癌(hereditary nonpolyposis colerectal cancer,HNPCC)患者90%以上为MSI型,表明MSI可作为判断HNPCC患者的重要标志物;与MSS(微卫星稳定)型的结肠癌相比,携带有MSI的结直肠癌患者的预后更好,并且二者药物反应也不一样,说明MSI可作为结直肠癌预后的独立预测因子,因此,MSI检测对结直肠癌患者意义重大。最近的研究表明,MSI可能是免疫检查点阻断疗法的一个标记。错配修复是指在含有错配碱基的DNA分子中,使核苷酸序列恢复正常的修复方式。MMR基因家族包含9个基因,主要用来纠正DNA双螺旋上错配的碱基对,还能修复一些因复制打滑而产生的小片段核苷酸插入或缺失。MMR基因突变或启动子甲基化可导致MMR基因功能缺失,从而引起含有错配碱基、核苷酸插入或缺失的DNA分子不能正常修复,最终引起广泛的MSI现象。
在检测癌细胞中MSI时,既可以直接检测MSI序列变化,也可以通过检测MMR基因缺失来确定是否发生MSI。临床上主要利用免疫组织化学(IHC)染色或聚合酶链式反应(PCR)方法检测患者的MSI状态。MMR基因缺陷检测常依赖于免疫组化(蛋白水平),而MSI检测一般依赖于分子手段,PCR检测(DNA水平)。IHC主要是检测MMR蛋白(MLH1、MSH2、MSH6和PMS2)表达情况。免疫组化检测可以直接鉴定出导致MSI发生的MMR缺陷基因,但是约5%-11%的MSI发生并不会出现MMR蛋白的缺陷。某些MMR蛋白错义突变,会损失MMR功能,但能被抗体检测识别,因此这是分子检测的优势。PCR主要是使用特异的引物,对癌组织样本中的微卫星位点进行逐一PCR或多重荧光PCR扩增,扩增产物经过凝胶电泳进行片段大小分析并与正常对照样本相比,查看其序列变化情况,通常对5个位点(NR-27、NR-24、NR-21、BAT-25和BAT-26)进行检测。
MSI可以根据程度被分成高微卫星不稳定性(MSI-H),低卫星不稳定性(MSI-L)或微卫星稳定(MSS)三类。一般来说,若在检测时2个以上的位点是不稳定的,即为MSI-H;如果检测时1个位点不稳定,即为MSI-L;如果没有检测位点是不稳定的,即为MSS。
目前,市场上对于遗传性肿瘤的诊断方法多数停留在单个肿瘤单个或几个位点的检测水平,这些方法都存在不同的缺陷,例如PCR方法有操作繁琐、引物或探针设计复杂、结果不易判读、通量低等问题;而多重PCR检测中,不同引物之间有干扰,在引物的选择及浓度上都有较高的要求;免疫组化的方法特异性和可重复性较低,对样本质量要求高,操作也比较复杂。所以,目前的微卫星不稳定的检测方法难以满足目前检测样本数量大、检测位点多、分布广、检测准确性高等检测要求。因此,急需一种新型的检测手段,不仅在实验上要操作简单、快捷,更要有高灵敏度和可重复性,以满足市场和医疗的需求。
发明内容
为解决现有技术中的至少部分技术问题,本发明提供基于二代测序平台检测微卫星不稳定性的引物组合物、试剂盒和方法。本发明提高了诊断的敏感性,且可多样本同时测序,在大样本量筛查的同时极大的降低成本。具体地,本发明包括以下内容。
本发明的第一方面,提供一种引物组合物,其包括上游引物组和下游引物组,且所述上游引物组中的各引物分别包括5’端的UID序列和与PCR通用引物对中的一种引物互补的结合区,所述下游引物组中的各引物分别包括与PCR通用引物对中的另一引物互补的结合区;其中所述上游引物组中的各引物分别特异性结合至下述基因群组中的至少一种基因的突变位点的上游,和所述下游引物组中的各引物分别特异性结合至所述突变位点的下游;所述基因群组包括KIT、MSH2、BIRC3、SLC7A8、ZNF2、MAP4K3、REEP5、DEFB105A、DEFB105B、ACVR2A、RNF43、DOCK3、GTF2IP1、LOC100093631、ARHGEF12、NOMO1、PIP5K1A、KIF14(dist.=4,175bp)和DDX59(dist.=19,111bp)。
在某些实施方案中,所述突变位点包括:KIT基因的BAT25突变、MSH2基因的BAT26突变、BIRC3基因的NR27突变、SLC7A8基因的NR21突变、ZNF2基因的NR24突变、MAP4K3基因的MONO-27突变、REEP5基因的D5S346突变、DEFB105A或DEFB105B基因的(A)9突变、ACVR2A基因的(A)8突变、RNF43基因的(C)7突变、DOCK3基因的(C)7突变、GTF2IP1或LOC100093631基因的(T)13突变、ARHGEF12基因的(T)8(C)5突变、NOMO1基因的(A)9突变、PIP5K1A基因的(T)9(C)6突变、KIF14(dist.=4,175bp)基因的(T)8突变和DDX59(dist.=19,111bp)基因的(T)8突变中的至少一种。
在某些实施方案中,所述上游引物组选自由序列为SEQ ID No:1-18的引物组成的组;所述下游引物组选自由序列为SEQ ID No:19-36的引物组成的组。
本发明的第二方面,提供基于二代测序平台检测微卫星不稳定性的试剂盒,其包括本发明第一方面所述的引物组合物。
本发明的第三方面,提供基于二代测序平台检测微卫星不稳定性的方法,其包括以下步骤:
(1)使组织样本与引物组合物杂交,其中所述引物组合物为根据权利要求1-3任一项所述的引物组合物;
(2)在适于DNA聚合酶或DNA连接酶反应的条件下填平间隙缺口,得到靶标DNA;
(3)以所述靶标DNA为模板利用PCR通用引物对进行扩增,得到测序文库。
在某些实施方案中,基于二代测序平台检测微卫星不稳定性的方法进一步包括(4)利用二代测序对所述测序文件进行双端测序,得到样本的双端测序数据。
在某些实施方案中,基于二代测序平台检测微卫星不稳定性的方法进一步包括(5)对于所述双端测序数据分别记为R1和R2,并提取R1序列的UID,将提取UID后的文件比对到参考基因组上,过滤比对结果,提取保留的比对结果的双端测序序列,并进行拼接。
在某些实施方案中,基于二代测序平台检测微卫星不稳定性的方法进一步包括(6)对于组织样本和对照样本,对每个微卫星位点分别统计拼接后序列的长度以,若所述组织样本和所述对照样本错峰,且中间相差碱基数大于等于2,则认为该位点不稳定。优选地,保留比对结果的条件是唯一比对到参考基因组上,且根据比对位置和随机碱基去重并保留质量最好的一条序列。
在某些实施方案中,基于二代测序平台检测微卫星不稳定性的方法进一步包括(7)判读标准为:不稳定位点数等于0,所述组织样本为MSS型;不稳定位点数等于1,所述组织样本为MSI-L型;不稳定位点数大于等于2,所述组织样本为MSI-H型。
本发明的方法不仅高效、系统、经济简便性,而且最大的优点在于提高了诊断的敏感性。本发明的优势有目标区域小,使测序成本显著降低,测序深度可高达1000×(常规全基因组测序为30×),可发现低频的突变信息。在后基因组时代,对基因组候选区段的重测序需求日益增加,人们对序列的关注超过了少数的SNP,候选区段的范围可能在5Kb-100Kb之间,使用传统PCR法或目标区域杂交捕获测序价格昂贵,通过本发明的方法很好地解决了这一难题。本发明的方法可多样本同时测序,在大样本量筛查的同时极大的降低成本。
具体实施方式
现详细说明本发明的多种示例性实施方式,该详细说明不应认为是对本发明的限制,而应理解为是对本发明的某些方面、特性和实施方案的更详细的描述。
应理解本发明中所述的术语仅仅是为描述特别的实施方式,并非用于限制本发明。另外,对于本发明中的数值范围,应理解为具体公开了该范围的上限和下限以及它们之间的每个中间值。在任何陈述值或陈述范围内的中间值以及任何其他陈述值或在所述范围内的中间值之间的每个较小的范围也包括在本发明内。这些较小范围的上限和下限可独立地包括或排除在范围内。
除非另有说明,否则本文使用的所有技术和科学术语具有本发明所述领域的常规技术人员通常理解的相同含义。虽然本发明仅描述了优选的方法和材料,但是在本发明的实施或测试中也可以使用与本文所述相似或等同的任何方法和材料。本说明书中提到的所有文献通过引用并入,用以公开和描述与所述文献相关的方法和/或材料。在与任何并入的文献冲突时,以本说明书的内容为准。除非另有说明,否则“%”为基于重量的百分数。
本发明所述的“微卫星不稳定”有时也称作“MSI”,是指以DNA微卫星重复序列长度改变为特征的基因突变,是基因组不稳定的一种类型,可导致多种肿瘤,例如结直肠癌。
[引物组合物]
本发明的第一方面,提供一种引物组合物,其用于基于二代测序平台检测微卫星不稳定性。
本发明的引物组合物包括上游引物组和下游引物组,且上游引物组中的各引物分别包括5’端UID序列和与PCR通用引物对中的一种引物互补的结合区,下游引物组中的各引物分别包括与PCR通用引物中的另一引物互补的结合区。其中上游引物组中的各引物分别特异性结合至基因群组中的至少一种基因的突变位点的上游,和下游引物组中的各引物分别特异性结合至所述突变位点的下游。即,上游引物组中的一条引物能够与下游引物组中的一条引物组成引物对,当与对应基因的特异性序列结合后,可扩增该基因中的特定突变位点。优选地,上游引物与其对应的下游引物之间的距离为100bp-1000kb,优选110bp-500kb,更优选120bp-300kb,进一步优选150bp-250kb。在优选的实施方案中,上游引物组的引物中,5’端UID序列与结合区至少部分重叠或完全重叠。在优选的实施方案中,下游引物组中的引物中,结合区位于所述各引物的3’端。
本发明所述的“UID”是指一种分子标签,是将原始样本进行特异性杂交后,在每一个片段都加上一段特有的标签序列,用来区分同一样本中的不同片段,在后续的数据分析中,就可以通过标签序列来排除由于DNA聚合酶或扩增以及测序过程中所引入的错误。本发明的分子标签通常由50nt以下,更优选25nt以下,还优选20nt以下,进一步优选15nt以下的随机序列(比如NNNNNNN),或者简并碱基(NNNRNYN)组成。另一方面,随机序列有长度优选为3nt以上,更优选5nt以上,进一步优选6nt以上。肿瘤的异质性会限制对驱动突变,特别是低频驱动突变的检测,而本发明引物的设计有利于增加目标区域测序深度,对发现低频突变以及在肿瘤研究与应用中尤为重要。另外,本发明的引物组合物可识别实验过程中引入的错误复制,降低假阳性。
本发明中的基因群组包括KIT、MSH2、BIRC3、SLC7A8、ZNF2、MAP4K3、REEP5、DEFB105A(亦称作DEFB105B)、ACVR2A、RNF43、DOCK3、GTF2IP1(亦称作LOC100093631)、ARHGEF12、NOMO1、PIP5K1A、KIF14(dist.=4,175bp)和DDX59(dist.=19,111bp)中的至少一种。优选地,本发明的基因群组由上述全部基因组成,这样的基因群组对于微卫星不稳定性的检测更加全面,且准确性高。表1示出本发明的基因群组中各基因的信息。
表1. 17个基因及其微卫星位点信息
本发明的上述基因中的突变位点可包括:KIT基因的BAT25突变、MSH2基因的BAT26突变、BIRC3基因的NR27突变、SLC7A8基因的NR21突变、ZNF2基因的NR24突变、MAP4K3基因的MONO-27突变、REEP5基因的D5S346突变、DEFB105A或DEFB105B基因的(A)9突变、ACVR2A基因的(A)8突变、RNF43基因的(C)7突变、DOCK3基因的(C)7突变、GTF2IP1或LOC100093631基因的(T)13突变、ARHGEF12基因的(T)8(C)5突变、NOMO1基因的(A)9突变、PIP5K1A基因的(T)9(C)6突变、KIF14(dist.=4,175bp)基因的(T)8突变和DDX59(dist.=19,111bp)基因的(T)8突变中的至少一种。优选地,本发明的引物组合物对应于上述全部突变位点。在某些实施方案中,本发明的引物组合物的上游引物组选自由序列为SEQ ID No:1-18的引物组成的组。下游引物组选自由序列为SEQ ID No:19-36的引物组成的组。
表2-1.示例性引物组合物的信息
表2-2.示例性引物组合物的信息
注:上游引物或下游引物中,小写字母表示的序列对应于内含子区,大写字母表示的序列对应于外显子区。
需要说明的是,本发明的引物组合物中的各引物均分别能够与特定基因的部分序列特异性结合,但与传统PCR引物用于扩增引物对之间的序列或区域不同,本发明的引物组合物的上游引物中的各引物与其对应的下游引物均结合至同一DNA或基因的单链两侧。例如,对于KIT基因的BAT25突变而言,上游引物组中的上游引物结合于含有BAT25突变位点的单链的上游侧,同时与该上游引物对应的下游引物结合于同一单链(即,含有BAT25突变位点的单链)的下游侧。
本发明的引物组合物的存在形式不特别限定,可以干粉或溶液形式存。本发明引物组合物可以是全部引物组成的混合物形式,也可以是各引物分别单独存在的形式,还可以是两种以上的部分引物组成混合物,以多种不同混合物的形式存在。
[基于二代测序平台检测微卫星不稳定性的试剂盒]
本发明的第二方面,提供一种基于二代测序平台检测微卫星不稳定性的试剂盒(有时也称作“本发明的试剂盒”),基包括本发明第一方面所述的引物组合物。
除了包含本发明第一方面所述的引物组合物外,优选地,本发明的试剂盒还可包含可提供引物延伸和扩增反应的试剂。例如,在一些实施方案中,试剂盒可进一步包括一种或多种下列组分:DNA聚合酶(诸如热稳定性DNA聚合酶等)、聚合酶链式反应缓冲液、逆转录缓冲液和脱氧核苷三磷酸(dNTP)。可选地,试剂盒可包括用于进行杂交分析的试剂。检测试剂可包括核苷酸类似物和/或标记部分,如直接可检测部分如荧光团(荧光染料)或放射性同位素,或者间接可检测部分,如结合对的成员例如生物素,或能够催化非可溶性比色或发光反应(luminometric reaction)的酶。另外,试剂盒可进一步包括包含用于核酸电泳检测用试剂的至少一种容器。此类试剂包括直接检测核酸的那些,如荧光嵌合剂或银染试剂,或用于检测标记的核酸的那些试剂。试剂盒还可包括以政府机构规定的形式与调控制造、使用或销售诊断试剂盒相关的注意事项。试剂盒还可提供有使用、储存和故障排除的详细说明书。试剂盒还可任选地设置在适合的优选用于以高通量设置的机器人操作的装置中。
试剂盒的组分可提供为干粉。当试剂和/或组分提供为干粉时,粉末可通过添加适合的溶剂来恢复原状。预期该溶剂还可设置于另一容器中。容器通常会包括至少一种小瓶、试管、烧瓶、瓶、注射器和/或其它容器手段,其中可选等分地放置溶剂。试剂盒还可包括用于包含无菌、药学上可接受的缓冲液和/或其它溶剂的第二容器手段。
在试剂盒中存在超过一种组分的情况下,该试剂盒还通常会包含另外的组分可单独放置于其中的第二、第三或其它另外的容器。然而,组分的各种组合可包括在容器中。
本发明的试剂盒还可包括保持或维持DNA或RNA的组分,例如抗核酸降解的试剂。此类组分可为例如或无RNase或具有抗RNase的保护的核酸酶。本文所述的任何组合物或试剂可为试剂盒中的组分。
[基于二代测序平台检测微卫星不稳定性的方法]
本发明的第三方面,提供一种基于二代测序平台检测微卫星不稳定性的方法(有时也称作“本发明的方法”),其至少包括下述步骤(1)-(3),可选地还包括步骤(4)-(7)。
本发明的步骤(1)为杂交步骤。具体地,使组织样本与本发明第一方面所述的引物组合物杂交。杂交过程包括使组织样本中的DNA变性,然后梯度降温和恒温杂交。其中DNA变性温度通常为90℃以上至100℃以下,例如,92℃、94℃、96℃、98℃等。变性时间(即,变性温度保持时间)一般为0.5-15分钟,优选1-10分钟,更优选2-5分钟。梯度降温是指由变性温度逐渐降至杂交温度的过程。优选的梯度为0.5-3℃/分钟,更优选1℃/分钟。恒温杂交是指在恒定的杂交温度下进行5-24小时,优选8-15小时的反应过程。
在优选的实施方案中,引物组合物中的上游引物和与其对应的下游引物分别与组织样本中的DNA结合后,两者之间的距离为100bp-1000kb,优选110bp-500kb,更优选120bp-300kb,进一步优选150bp-250kb。即,需要填平的间隙缺口的大小为100bp-1000kb,优选110bp-500kb,更优选120bp-300kb,进一步优选150bp-250kb。本发明的组织样本为来自受试者的待测样本,其包含DNA成分。在某些实施方案中,杂交过程在包含引物组合物的杂交混合物溶液中进行。具体地杂交混合物的成分为本领域已知的。可参考例如《分子克隆》等工具书。
本发明的步骤(2)为间隙缺口填平步骤。具体地,在适于DNA聚合酶或DNA连接酶反应的条件下使上游引物与其对应的下游引物之间的间隙缺口填平,从而形成与原单链序列互补且完全体现原序列信息的完整扩增链,即靶标DNA。如上所述,本发明的间隙缺口的大小为100bp-1000kb,优选110bp-500kb,更优选120bp-300kb,进一步优选150bp-250kb。步骤(2)的间隙缺口填平过程为单向扩增的过程。步骤(2)中DNA聚合酶和DNA连接酶可使用本领域已知的酶或商购可得的酶,适于DNA聚合酶或DNA连接酶反应的条件为本领域技术人员根据需要而容易确定的条件。其包括在含DNA聚合酶和DNA连接酶的缓冲液中使杂交后的样本在50-65℃下进行单碱基复制30-120分钟,优选40-100分钟,然后低温(例如4℃)保存。随后35-39℃延伸20-60分钟。最后高温(例如,90-100℃)酶失活。步骤(2)中的缓冲液还可包括dNTPs和NAD等单链延伸所需的物质。
本发明的步骤(3)为PCR扩增步骤。具体地,以所述靶标DNA为模板利用PCR通用引物对进行扩增,得到测序文库。PCR扩增条件为本领域已知的,可根据需要而调整。在某些实施方案中,扩增条件如下:98℃预变性30s,然后进入聚合酶链式反应扩增阶段:98℃变性10s,62℃退火30s,72℃延伸20s,并进行21个循环;最后72℃延伸20s,4℃静置。
本发明的步骤(4)为二代测序步骤。具体地,利用二代测序技术对所述测序文件进行双端测序,得到样本的双端测序数据。二代测序可使用本领域已知的仪器或平台进行。例如,Illumina MiniSeq、NextSeq等。
需要说明的是,本发明的步骤(1)至(3)过程中优选地同时进行阴性对照实验。其中对照样本为受试者血液白细胞DNA。
本发明的步骤(5)-(7)为数据分析和结果判断步骤。在示例性实施方案中,数据分析和结果判断过程如下:
1.测序后,对于每个样本,均得到双端测序数据,分别记为R1和R2。
2.提取R1序列的分子标签,并将提取随机碱基后的文件比对到参考基因组上。
3.过滤比对结果,需要满足以下条件:1)唯一比对到参考基因组上;2)根据比对位置和随机碱基去重并保留质量最好的一条序列。
4.提取保留的比对结果的双端测序序列,并拼接提到的双端测序序列。
5.对于组织样本和对照样本,对每个微卫星位点分别统计拼接后序列的长度。若组织样本和对照样本错峰,且中间相差碱基数大于等于2,则认为该位点不稳定。
6.判读标准:不稳定位点数等于0,该样本为MSS型;不稳定位点数等于1,该样本为MSI-L型;不稳定位点数大于等于2,该样本为MSI-H型。
本发明的方法能有效识别变异,用来分析特定基因组区域内的变异情况、拷贝数变异和微卫星不稳定等。相比于全基因组测序和其他目标区域捕获测序,不仅效率高,而且可以在降低测序成本的同时保证高深度测序。
实施例
1.试剂及样本准备
1.1试剂:AMPure XP Beads,Qubit,80%乙醇(新鲜配置)及low TE或无酶水
1.2准备工作
1.2.1溶解分装20mM NAD+
NAD+粉末性质稳定,初次使用需按下列要求溶解后分装
1)加1000μl无酶水至NAD+粉末中,溶解完全获得20mM NAD+液体。
2)涡旋震荡10秒,若仍有未融物,重复震荡10秒。
3)每管分装20μl 20mM NAD+液体置于冰上。
弃用每日剩余20mM NAD+,不可冻存二次使用。20mM NAD+可于-20℃保存3个月。
1.2.2溶解Oligo Pool(含SEQ ID NO:1-38)
1)加28μl无酶水至Oligo Pool粉末中,涡旋震荡各10秒,溶解完全获得液体。
2)室温静止孵育15分钟至复溶完全。
3)使用200μl移液器加97μl Hyb Inhancer至溶解的Oligo Pool液体中,混合均匀后保存于-15℃至-25℃。单管Oligo Pool/Hyb Inhancer混合液可进行24个反应。
Oligo Pool/Hyb Inhancer混合液可于-15℃至-25℃保存3个月。
1.2.3以Qubit定量为准,起始量为100ng。
1.2.4将酶提前至少10分钟从-20℃取出,置于冰上或4℃冰箱中,使其在使用前达到4℃。
除酶之外的其他试剂,解冻后需短时震荡后离心,置于冰上保存。
2.具体流程
2.1杂交
杂交预定程序如下:
2.1.1混合下列试剂。Buffer H和Oligo Pool/Hyb Inhancer混合液可预混。混合比例如下:
其中Oligo Pool为可特异识别目标区域的杂交引物池,在杂交过程中,每对上游引物带有10bp UMI,便于后续分析。
2.1.2将上述体系混合均匀后低速离心。置于PCR仪上,热盖开启,运行预设程序。
样品在PCR仪上孵育56℃18小时,在下一步操作前,需一直保持56℃。
2.2Gap Filling
2.2.1使用无酶水,将dNTPs由10mM五倍稀释至2mM。
2.2.2将下列预混液直接加入至16μl杂交产物中。
弃用当天剩余NAD+和2mM dNTPs。
2.2.3震荡混匀。于PCR仪上运行下列程序:
热盖开启,56℃孵育60分钟,4℃保存。
2.2.4配置下列混合液,直接加入至各反应管中。
2.2.5震荡混匀。热盖开启条件下,于PCR仪上运行下列程序:
2.3 PCR扩增
2.3.1 PCR反应液、所有的酶、冻融试剂和反应混合液需冰上待用。依下表制备PCR预混反应液。震荡混匀,短时离心,置于冰上待用。
2.3.2将PCR预混液和引物加入至0.2ml杂交反应管中(步骤1.2反应物)。保证引物最后加入反应体系中。
Primer建议使用NEB建库试剂盒配套的Primer MIX或自制Index primer。
2.3.3上下吹打20次,以便混匀反应液。
2.3.4短时离心后置于冰上。
2.3.5于PCR仪预设以下程序。热盖预热至105℃时,快速转入PCR反应管并运行程序。
2.4文库纯化
2.4.1提前30分钟取出AMPure XP磁珠,震荡混匀,置于室温备用。
2.4.2加65μl重悬过的AMPure XP磁珠至100μl PCR反应液中(若PCR反应液不足100μl,加水补齐)。上下吹打10次以至混匀。
2.4.3室温孵育10分钟。
2.4.4瞬时离心后,置于磁力架上3分钟,分离磁珠与上清。待上清清亮,小心转移上清至新管,弃去磁珠。(注:不可丢弃上清)
2.4.5加30μl重悬后AMPure XP磁珠至上清。混合均匀,室温孵育10分钟。
2.4.6瞬时离心后,置于磁力架上3分钟,分离磁珠与上清。待上清清亮,小心移除上清,保留磁珠。(注:不可丢弃磁珠)
2.4.7加入200μl新鲜配置的80%乙醇至样品管中,样品管需置于磁力架上。置于室温旋转管壁720度,静置至上清清亮,丢弃上清。
2.4.8重复步骤7一次。
2.4.9开盖,室温干燥至磁珠表面哑光色,避免过度干燥。(注:不可过度干燥,会导致低回收率)
2.4.10将反应管从磁力架上移除,加入25μl low TE重悬磁珠。
2.4.11震荡混匀,室温孵育3到5分钟。
2.4.12将反应管置于磁力架上以分离磁珠,孵育至液体清亮。
2.4.13转移上清至新管,标明样本名称、文库类型、建库日期、Index/barcode等信息。
保存文库于-20℃。
3.上机测序
文库构建完成后,对每个文库进行QPCR定量,根据定量结果和每个文库所需的数据量进行混样。将混好的样本池变性稀释到合适的上机浓度。使用illumina公司的MiniSeq测序仪、MiniSeq High Output reagent kit试剂盒、310cycles上机测序,PE*151,Index8bp。可获得用于分析的数据。
4.信息分析
取样本test为例,该样本的癌组织样本记为test_cancer,该样本的正常对照样本记为test_normal,分别进行上机测序,得到双端测序结果test_cancer_1.fq.gz,test_cancer2.fq.gz,test_normal_1.fq.gz,test_norma1_2.fq.gz。测序结果文件格式为FASTQ,FASTQ格式文件每4行表示一条测序序列,其中,第一行为序列标题(read ID),记录测序仪、测序位置、标记样本的index等信息;第二行是DNA模板序列,包含ATGC四种碱基;第三行为“+”符号或者跟第一行一样;第四行为测序质量,与第二行碱基一一对应。
对test_cancer和test_normal分别进行以下步骤,此处以test_cancer为例:
1)提取test_cancer_1.fq文件中每个序列的分子标签也就是UMI,并记录下来,结果文件记为test_cancer_1UMI.fq。对于R2文件的序列不做处理,只记录下R1文件中相对应的UMI,结果文件记为test_cancer_2UMI.fq。
2)将test_cancer_1UMI.fq和test_cancer_2UMI.fq使用比对软件以双端比对模式比对到人类参考基因组hg19.fa上,比对结果为test_cancer.sam。
3)将test_cancer.sam转换为test_cancer.bam格式,然后进行结果排序、选择R1和R2分别唯一比对到参考基因组上的比对结果、根据比对位置和步骤1)中记录的UMI进行比对结果去重,去重后结果记为test_cancer.sort.dedup.bam。如果比对位置和序列的UMI相同,则只保留质量最好的一条结果,这个结果表示一个DNA拷贝。
4)对于每个微卫星位点,根据设计的引物在基因组上的位置,保留满足以下条件的序列:一端序列的比对起始位置和该位点的上游引物在基因组的起始位置相同,且另一端序列的比对终止位置和该位点的下游引物在基因组的结束位置相同。满足条件的序列被认为是成对扩增引物的扩增产物,也就是我们要的目标区域。若一端序列的比对起始位置和该位点的上游引物在基因组的起始位置相同,而另一端序列的比对终止位置和该位点的下游引物在基因组的结束位置不同,则认为符合这种情况的序列不是我们所要求的目标扩增产物。反之,若一端序列的比对起始位置和该位点的上游引物在基因组的起始位置不同,而另一端序列的比对终止位置和该位点的下游引物在基因组的结束位置相同,则认为符合这种情况的序列也不是我们所要求的目标扩增产物。
5)对于每个微卫星位点来说,4)中保留的序列按照序列比对的FLAG分成两个文件分别记为R1_UMI_seq和R2UMI_seq,将两个文件中序列ID相对应的序列seq1和序列seq2合并为一条序列,合并后的序列储存在Merged_sequence文件中。
对于组织样本和对照样本,分别统计相应的微卫星位点的Merged_sequence文件内的序列长度。若组织样本和对照样本序列长度错峰,且峰值相差碱基数大于等于2,则认为该位点不稳定。
若不稳定位点数等于0,该样本为MSS型;不稳定位点数等于1,该样本为MSI-L型;不稳定位点数大于等于2,该样本为MSI-H型。
5.结果总结
对84例患者,同时进行了传统PCR金标准检测,以验证本发明的检测结果,进行实验稳定性和方法可行性的验证。传统PCR金标准对六个单核苷酸重复位点进行复合扩增,PCR方法最终确定了46例MSI-H样本,1例MSI-L样本和37例MSS样本。与PCR分析结果对比发现,本发明MSI的检测结果与PCR结果完全一致,敏感性100%,特异性100%。
表3. 84例患者使用PCR金标准及本方法判定微卫星不稳定的结果
在不背离本发明的范围或精神的情况下,可对本发明说明书的具体实施方式做多种改进和变化,这对本领域技术人员而言是显而易见的。由本发明的说明书得到的其他实施方式对技术人员而言是显而易见得的。本申请说明书和实施例仅是示例性的。
SEQUENCE LISTING
<110> 元码基因科技(苏州)有限公司
<120> 基于二代测序平台检测微卫星不稳定性的引物组合物、试剂盒和方法
<130> 1802281CN
<160> 36
<170> PatentIn version 3.3
<210> 1
<211> 29
<212> DNA
<213> 人工序列
<400> 1
taccaggtgg caaagggcat ggctttcct 29
<210> 2
<211> 28
<212> DNA
<213> 人工序列
<400> 2
ttggatattg cagcagtcag agccctta 28
<210> 3
<211> 26
<212> DNA
<213> 人工序列
<400> 3
tctgtgagat ccaggaaacc atgctt 26
<210> 4
<211> 23
<212> DNA
<213> 人工序列
<400> 4
ataaaagaga acacgaaaaa tat 23
<210> 5
<211> 28
<212> DNA
<213> 人工序列
<400> 5
aaaatagctc cctatttagt gaaaaatt 28
<210> 6
<211> 32
<212> DNA
<213> 人工序列
<400> 6
tcagtgctaa cattctaagg ctatactact ta 32
<210> 7
<211> 22
<212> DNA
<213> 人工序列
<400> 7
gaatggcatg aacccgggag gc 22
<210> 8
<211> 30
<212> DNA
<213> 人工序列
<400> 8
atggcatatg aataccagga tagctttata 30
<210> 9
<211> 25
<212> DNA
<213> 人工序列
<400> 9
cttttcagga cctgtagatg aatac 25
<210> 10
<211> 22
<212> DNA
<213> 人工序列
<400> 10
ttcctgcatt ttccccgacc aa 22
<210> 11
<211> 27
<212> DNA
<213> 人工序列
<400> 11
cttggagagt aggaattgcg atgatct 27
<210> 12
<211> 26
<212> DNA
<213> 人工序列
<400> 12
atcaaggggt gtgcctctgg ggacca 26
<210> 13
<211> 23
<212> DNA
<213> 人工序列
<400> 13
gttctgttcc ctttgcaggt cat 23
<210> 14
<211> 26
<212> DNA
<213> 人工序列
<400> 14
actaaagagg tcattcactt gttctc 26
<210> 15
<211> 26
<212> DNA
<213> 人工序列
<400> 15
atgtcattaa aagatacttt ttaaag 26
<210> 16
<211> 27
<212> DNA
<213> 人工序列
<400> 16
gtttctttca ccgcagtggg ctaccat 27
<210> 17
<211> 25
<212> DNA
<213> 人工序列
<400> 17
tacttatgtt tagtttgact caaac 25
<210> 18
<211> 30
<212> DNA
<213> 人工序列
<400> 18
ccaaagccta gtgagtatcc tatttttaca 30
<210> 19
<211> 29
<212> DNA
<213> 人工序列
<400> 19
tagagccata gttaaaatgc agaatgtca 29
<210> 20
<211> 32
<212> DNA
<213> 人工序列
<400> 20
tgaaatatta ttatacttgg attagataac ta 32
<210> 21
<211> 29
<212> DNA
<213> 人工序列
<400> 21
ggctagtaaa tcataattga gaaattctg 29
<210> 22
<211> 28
<212> DNA
<213> 人工序列
<400> 22
tagaactgtg ccagcgactc cggctgga 28
<210> 23
<211> 25
<212> DNA
<213> 人工序列
<400> 23
tctccgctca ctgcaagctc cgcct 25
<210> 24
<211> 31
<212> DNA
<213> 人工序列
<400> 24
ggcagagtct tgctctgtct cccacgctgg a 31
<210> 25
<211> 24
<212> DNA
<213> 人工序列
<400> 25
catacagctg atataaaaat ttgt 24
<210> 26
<211> 30
<212> DNA
<213> 人工序列
<400> 26
ctggttttat cttcaaagcg gagaaacatg 30
<210> 27
<211> 27
<212> DNA
<213> 人工序列
<400> 27
ctttcttctg caagtatttt ctggaag 27
<210> 28
<211> 24
<212> DNA
<213> 人工序列
<400> 28
agttaatttt tatgcaacag atca 24
<210> 29
<211> 25
<212> DNA
<213> 人工序列
<400> 29
aggaaggagt gcttggagaa tgaga 25
<210> 30
<211> 27
<212> DNA
<213> 人工序列
<400> 30
agatgctgga ggcgtcaact gggccag 27
<210> 31
<211> 23
<212> DNA
<213> 人工序列
<400> 31
agccctcccc ttcacctctc tcc 23
<210> 32
<211> 26
<212> DNA
<213> 人工序列
<400> 32
ggctcaagcg atcctcctgc ctaagc 26
<210> 33
<211> 26
<212> DNA
<213> 人工序列
<400> 33
tacagaacag cctctcaggg gccgca 26
<210> 34
<211> 24
<212> DNA
<213> 工人序列
<400> 34
caactctaca aaaaatacaa aaat 24
<210> 35
<211> 24
<212> DNA
<213> 人工序列
<400> 35
ctacttaggt cttggaagct agac 24
<210> 36
<211> 26
<212> DNA
<213> 人工序列
<400> 36
aatggataat gaaaagcttc aagtca 26
Claims (3)
1.一种基于二代测序平台检测微卫星不稳定性的方法,其包括以下步骤:
(1) 使组织样本与引物组合物杂交,其中所述引物组合物包括上游引物组和下游引物组,且上游引物中的各引物与其对应的下游引物均结合至同一DNA或基因的单链两侧,所述上游引物组中的各引物分别包括5’端的UID序列和与PCR通用引物对中的一种引物互补的结合区,所述下游引物组中的各引物分别包括与PCR通用引物对中的另一引物互补且位于所述各引物的3'端的结合区;其中所述上游引物组中的各引物分别特异性结合至下述基因群组中的至少一种基因的突变位点的上游,和所述下游引物组中的各引物分别特异性结合至所述突变位点的下游,所述上游引物组由序列为SEQ ID No:1-18的引物组成;所述下游引物组由序列为SEQ ID No:19-36的引物组成;所述基因群组由KIT、MSH2、BIRC3、SLC7A8、ZNF2、MAP4K3、REEP5、DEFB105A、DEFB105B、ACVR2A、RNF43、DOCK3、GTF2IP1、LOC100093631、ARHGEF12、NOMO1、PIP5K1A、KIF14 (dist. = 4,175 bp)和DDX59 (dist. = 19,111 bp)组成;
(2) 在适于DNA聚合酶或DNA连接酶反应的条件下填平间隙缺口,得到靶标DNA;
(3) 以所述靶标DNA为模板利用PCR通用引物对进行扩增,得到测序文库;
(4) 利用二代测序对所述测序文库进行双端测序,得到样本的双端测序数据;
(5) 对于所述双端测序数据分别记为R1和R2,并提取R1序列的UID,将提取UID后的文件比对到参考基因组上,过滤比对结果,提取保留的比对结果的双端测序序列,并进行拼接,其中保留比对结果的条件是唯一比对到参考基因组上,且根据比对位置和随机碱基去重并保留质量最好的一条序列;
(6) 对于组织样本和对照样本,对每个微卫星位点分别统计拼接后序列的长度,若所述组织样本和所述对照样本错峰,且中间相差碱基数大于等于2,则认为该位点不稳定;
(7) 判读标准为:不稳定位点数等于0,所述组织样本为MSS型;不稳定位点数等于1,所述组织样本为MSI-L型;不稳定位点数大于等于2,所述组织样本为MSI-H型。
2.根据权利要求1所述的基于二代测序平台检测微卫星不稳定性的方法,其中所述PCR通用引物对包括上游PCR引物和下游PCR引物,且所述上游PCR引物与所述上游引物组中各引物的结合区互补,所述下游PCR引物与所述下游引物组中各引物的结合区互补。
3.根据权利要求1所述的基于二代测序平台检测微卫星不稳定性的方法,其中,所述突变位点包括:KIT基因的BAT25突变、MSH2基因的BAT26突变、BIRC3基因的NR27突变、SLC7A8基因的NR21突变、ZNF2基因的NR24突变、MAP4K3基因的MONO-27突变、REEP5基因的D5S346突变、DEFB105A或DEFB105B基因的(A)9突变、ACVR2A基因的(A)8突变、RNF43基因的(C)7突变、DOCK3基因的(C)7突变、GTF2IP1或LOC100093631基因的(T)13突变、ARHGEF12基因的(T)8(C)5突变、NOMO1基因的(A)9突变、PIP5K1A基因的(T)9(C)6突变、KIF14 (dist. = 4,175bp)基因的(T)8突变和DDX59 (dist. = 19,111 bp)基因的(T)8突变。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110721220.3A CN113293204B (zh) | 2018-08-21 | 2018-08-21 | 基于二代测序平台检测微卫星不稳定性的引物组合物、试剂盒和方法 |
CN201810957432.XA CN108949757B (zh) | 2018-08-21 | 2018-08-21 | 基于二代测序平台检测微卫星不稳定性的引物组合物、试剂盒和方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810957432.XA CN108949757B (zh) | 2018-08-21 | 2018-08-21 | 基于二代测序平台检测微卫星不稳定性的引物组合物、试剂盒和方法 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110721220.3A Division CN113293204B (zh) | 2018-08-21 | 2018-08-21 | 基于二代测序平台检测微卫星不稳定性的引物组合物、试剂盒和方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108949757A CN108949757A (zh) | 2018-12-07 |
CN108949757B true CN108949757B (zh) | 2021-07-23 |
Family
ID=64473454
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810957432.XA Active CN108949757B (zh) | 2018-08-21 | 2018-08-21 | 基于二代测序平台检测微卫星不稳定性的引物组合物、试剂盒和方法 |
CN202110721220.3A Active CN113293204B (zh) | 2018-08-21 | 2018-08-21 | 基于二代测序平台检测微卫星不稳定性的引物组合物、试剂盒和方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110721220.3A Active CN113293204B (zh) | 2018-08-21 | 2018-08-21 | 基于二代测序平台检测微卫星不稳定性的引物组合物、试剂盒和方法 |
Country Status (1)
Country | Link |
---|---|
CN (2) | CN108949757B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108949757B (zh) * | 2018-08-21 | 2021-07-23 | 元码基因科技(苏州)有限公司 | 基于二代测序平台检测微卫星不稳定性的引物组合物、试剂盒和方法 |
CN110218772A (zh) * | 2019-06-10 | 2019-09-10 | 深圳海普洛斯医学检验实验室 | 一种检测微卫星不稳定性的引物组合物、试剂盒、检测方法及其应用 |
CN111471755B (zh) * | 2020-05-18 | 2023-11-24 | 上海思路迪生物医学科技有限公司 | 用于微卫星不稳定性检测的生物标志物组合、试剂盒及其用途 |
CN115595371B (zh) * | 2022-12-07 | 2023-04-11 | 元码基因科技(北京)股份有限公司 | 确定结直肠癌患者msi状态的方法及应用 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102230004A (zh) * | 2011-06-08 | 2011-11-02 | 北京阅微基因技术有限公司 | 肿瘤细胞微卫星不稳定状态的复合扩增体系及检测试剂盒 |
CN105256057A (zh) * | 2015-11-19 | 2016-01-20 | 湖南宏雅基因技术有限公司 | 基于二代测序平台的结肠癌微卫星不稳定性检测试剂盒 |
CN106755501A (zh) * | 2017-01-25 | 2017-05-31 | 广州燃石医学检验所有限公司 | 一种基于二代测序的同时检测微卫星位点稳定性和基因组变化的方法 |
CN107299139A (zh) * | 2017-07-25 | 2017-10-27 | 北京鑫诺美迪基因检测技术有限公司 | 一种用于检测微卫星不稳定性的组合物及其应用 |
CN108070658A (zh) * | 2017-12-13 | 2018-05-25 | 元码基因科技(北京)股份有限公司 | 检测msi的非诊断方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE602004024540D1 (de) * | 2004-10-19 | 2010-01-21 | Mtm Lab Ag | Zusammensetzungen und Methoden zur Bestimmung des |
CN108949757B (zh) * | 2018-08-21 | 2021-07-23 | 元码基因科技(苏州)有限公司 | 基于二代测序平台检测微卫星不稳定性的引物组合物、试剂盒和方法 |
-
2018
- 2018-08-21 CN CN201810957432.XA patent/CN108949757B/zh active Active
- 2018-08-21 CN CN202110721220.3A patent/CN113293204B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102230004A (zh) * | 2011-06-08 | 2011-11-02 | 北京阅微基因技术有限公司 | 肿瘤细胞微卫星不稳定状态的复合扩增体系及检测试剂盒 |
CN105256057A (zh) * | 2015-11-19 | 2016-01-20 | 湖南宏雅基因技术有限公司 | 基于二代测序平台的结肠癌微卫星不稳定性检测试剂盒 |
CN106755501A (zh) * | 2017-01-25 | 2017-05-31 | 广州燃石医学检验所有限公司 | 一种基于二代测序的同时检测微卫星位点稳定性和基因组变化的方法 |
CN107299139A (zh) * | 2017-07-25 | 2017-10-27 | 北京鑫诺美迪基因检测技术有限公司 | 一种用于检测微卫星不稳定性的组合物及其应用 |
CN108070658A (zh) * | 2017-12-13 | 2018-05-25 | 元码基因科技(北京)股份有限公司 | 检测msi的非诊断方法 |
Non-Patent Citations (4)
Title |
---|
A Novel and Reliable Method to Detect Microsatellite Instability in Colorectal Cancer by Next-Generation Sequencing;Lizhen Zhu等;《The Journal of Molecular Diagnostics》;20171219;第20卷(第2期);225-231 * |
Microsatellite alteration in plasma DNA discriminates multiple primary lung cancer from metastatic lung cancer;NG Tian等;《Translational Cancer Research》;20170831;第6卷(第4期);720-731 * |
Mutational burden on circulating cell-free tumor-DNA testing as a surrogate marker of mismatch repair deficiency or microsatellite instability in patients with colorectal cancers;Pashtoon Murtaza Kasi;《Journal of Gastrointestinal Oncology》;20170831;第8卷(第4期);747-748 * |
Systemic chemotherapy-induced microsatellite instability in the mononuclear cell fraction of women with breast cancer can be reproduced in vitro and abrogated by amifostine;Jorge L F Pinto等;《J Pharm Pharmacol》;20101231;第62卷;931-934 * |
Also Published As
Publication number | Publication date |
---|---|
CN108949757A (zh) | 2018-12-07 |
CN113293204A (zh) | 2021-08-24 |
CN113293204B (zh) | 2024-05-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108949757B (zh) | 基于二代测序平台检测微卫星不稳定性的引物组合物、试剂盒和方法 | |
EP0655090B1 (en) | Detection of gene sequences in biological fluids | |
CN108699553B (zh) | 用于筛选甲状腺癌中突变的组合物和方法 | |
CN105861678B (zh) | 一种用于扩增低浓度突变靶序列的引物和探针的设计方法 | |
WO2016172265A1 (en) | Method to increase sensitivity of next generation sequencing | |
CN107619870B (zh) | 能预示和鉴定绵羊羊毛长度的分子标记及其特异性引物对和应用 | |
CN106319065A (zh) | 基于高通量测序检测人brca1/2基因的捕获探针及试剂盒 | |
CN108070658B (zh) | 检测msi的非诊断方法 | |
CN109880911A (zh) | 25个人类染色体基因座的复合扩增试剂盒及其应用 | |
CN104328164A (zh) | 荧光探针杂交法检测人egfr基因突变试剂盒 | |
CN111690748B (zh) | 使用高通量测序检测微卫星不稳定的探针组、试剂盒及微卫星不稳定的检测方法 | |
CN110846408A (zh) | 用于检测ttn基因突变的引物组合及其应用 | |
CN109337956B (zh) | 基于ngs技术富集多基因茎环探针设计方法及试剂盒 | |
CN110564861A (zh) | 人类Y染色体STR基因座和InDel位点的荧光标记复合扩增试剂盒及其应用 | |
WO2017185758A1 (zh) | 用于微嵌合检测和个体识别的引物、探针、试剂盒及方法 | |
CN112795654A (zh) | 用于生物体融合基因检测与融合丰度定量的方法及试剂盒 | |
EP1650311A1 (en) | Compounds and methods for assessment of Microsatellite Instability (MSI) status | |
CN113416769B (zh) | 基于二代测序技术检测无对照样本的微卫星不稳定的方法、组合物和用途 | |
KR101775953B1 (ko) | 돌연변이 유전자 검사 방법 및 킷트 | |
CN111304329A (zh) | 一种检测braf基因v600e位点突变的试剂盒 | |
US20220307016A1 (en) | Library construction method for detecting endometrial cancer-related gene mutations based on high-throughput sequencing | |
CN108913774A (zh) | 一种c-KIT体细胞突变基因检测试剂盒及其检测方法 | |
CN112280864B (zh) | 一种甲状腺多基因联合检测试剂盒 | |
CN108624686A (zh) | 一种检测brca1/2突变的探针库、检测方法和试剂盒 | |
CN114134212A (zh) | 用于质粒定量的引物探针组合和试剂盒 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |