TW202411430A - 準確地平行檢測和定量核酸的方法 - Google Patents
準確地平行檢測和定量核酸的方法 Download PDFInfo
- Publication number
- TW202411430A TW202411430A TW112132632A TW112132632A TW202411430A TW 202411430 A TW202411430 A TW 202411430A TW 112132632 A TW112132632 A TW 112132632A TW 112132632 A TW112132632 A TW 112132632A TW 202411430 A TW202411430 A TW 202411430A
- Authority
- TW
- Taiwan
- Prior art keywords
- probe
- oligonucleotide
- sequence
- bridge
- barcode
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 76
- 150000007523 nucleic acids Chemical class 0.000 title claims abstract description 44
- 108020004707 nucleic acids Proteins 0.000 title claims abstract description 34
- 102000039446 nucleic acids Human genes 0.000 title claims abstract description 34
- 238000001514 detection method Methods 0.000 title claims description 13
- 238000011002 quantification Methods 0.000 title abstract description 13
- 239000000523 sample Substances 0.000 claims abstract description 348
- 230000002068 genetic effect Effects 0.000 claims abstract description 9
- 108091034117 Oligonucleotide Proteins 0.000 claims description 305
- 125000003729 nucleotide group Chemical group 0.000 claims description 70
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 claims description 68
- 239000002773 nucleotide Substances 0.000 claims description 60
- 230000000295 complement effect Effects 0.000 claims description 39
- 238000012163 sequencing technique Methods 0.000 claims description 28
- 108010042407 Endonucleases Proteins 0.000 claims description 21
- 102000004533 Endonucleases Human genes 0.000 claims description 21
- 239000007787 solid Substances 0.000 claims description 19
- 108091028732 Concatemer Proteins 0.000 claims description 18
- 230000003321 amplification Effects 0.000 claims description 18
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 18
- 101710163270 Nuclease Proteins 0.000 claims description 13
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 10
- 238000005516 engineering process Methods 0.000 claims description 10
- 239000000126 substance Substances 0.000 claims description 9
- 239000008280 blood Substances 0.000 claims description 8
- 210000004369 blood Anatomy 0.000 claims description 8
- 238000012165 high-throughput sequencing Methods 0.000 claims description 7
- 230000004048 modification Effects 0.000 claims description 7
- 238000012986 modification Methods 0.000 claims description 7
- 238000011049 filling Methods 0.000 claims description 6
- 238000005096 rolling process Methods 0.000 claims description 6
- 210000003296 saliva Anatomy 0.000 claims description 6
- 210000002700 urine Anatomy 0.000 claims description 6
- 101710147059 Nicking endonuclease Proteins 0.000 claims description 5
- 238000007672 fourth generation sequencing Methods 0.000 claims description 4
- 102000054765 polymorphisms of proteins Human genes 0.000 claims description 4
- 108700028369 Alleles Proteins 0.000 claims description 3
- 238000006073 displacement reaction Methods 0.000 claims description 3
- OZFPSOBLQZPIAV-UHFFFAOYSA-N 5-nitro-1h-indole Chemical class [O-][N+](=O)C1=CC=C2NC=CC2=C1 OZFPSOBLQZPIAV-UHFFFAOYSA-N 0.000 claims description 2
- 238000012408 PCR amplification Methods 0.000 claims description 2
- 238000000137 annealing Methods 0.000 claims description 2
- 210000003608 fece Anatomy 0.000 claims description 2
- UEZVMMHDMIWARA-UHFFFAOYSA-M phosphonate Chemical compound [O-]P(=O)=O UEZVMMHDMIWARA-UHFFFAOYSA-M 0.000 claims description 2
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 claims description 2
- 238000011176 pooling Methods 0.000 claims 1
- 230000017105 transposition Effects 0.000 claims 1
- 238000007481 next generation sequencing Methods 0.000 abstract description 13
- 108020004711 Nucleic Acid Probes Proteins 0.000 abstract description 4
- 239000002853 nucleic acid probe Substances 0.000 abstract description 4
- 108020004414 DNA Proteins 0.000 description 33
- 108090000623 proteins and genes Proteins 0.000 description 21
- 238000006243 chemical reaction Methods 0.000 description 20
- 238000003753 real-time PCR Methods 0.000 description 14
- 238000003556 assay Methods 0.000 description 12
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical group N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 8
- 238000007838 multiplex ligation-dependent probe amplification Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 102000004190 Enzymes Human genes 0.000 description 7
- 108090000790 Enzymes Proteins 0.000 description 7
- 206010028980 Neoplasm Diseases 0.000 description 7
- 108091008146 restriction endonucleases Proteins 0.000 description 7
- 108010061982 DNA Ligases Proteins 0.000 description 6
- 102000012410 DNA Ligases Human genes 0.000 description 6
- 238000013459 approach Methods 0.000 description 6
- 239000011324 bead Substances 0.000 description 6
- 201000011510 cancer Diseases 0.000 description 6
- 238000007385 chemical modification Methods 0.000 description 6
- 238000002474 experimental method Methods 0.000 description 6
- 238000009396 hybridization Methods 0.000 description 6
- 108010090804 Streptavidin Proteins 0.000 description 5
- 238000000746 purification Methods 0.000 description 5
- 230000035945 sensitivity Effects 0.000 description 5
- 102000053602 DNA Human genes 0.000 description 4
- 238000001712 DNA sequencing Methods 0.000 description 4
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 4
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 4
- 241001465754 Metazoa Species 0.000 description 4
- 229910019142 PO4 Inorganic materials 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 229960002685 biotin Drugs 0.000 description 4
- 235000020958 biotin Nutrition 0.000 description 4
- 239000011616 biotin Substances 0.000 description 4
- 230000021615 conjugation Effects 0.000 description 4
- 230000001605 fetal effect Effects 0.000 description 4
- 239000012634 fragment Substances 0.000 description 4
- 238000011528 liquid biopsy Methods 0.000 description 4
- 230000008774 maternal effect Effects 0.000 description 4
- 239000000203 mixture Substances 0.000 description 4
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 4
- 239000010452 phosphate Substances 0.000 description 4
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 4
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 4
- 108010063905 Ampligase Proteins 0.000 description 3
- 108060002716 Exonuclease Proteins 0.000 description 3
- 108020004682 Single-Stranded DNA Proteins 0.000 description 3
- 108010006785 Taq Polymerase Proteins 0.000 description 3
- 230000009471 action Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000003745 diagnosis Methods 0.000 description 3
- 230000002255 enzymatic effect Effects 0.000 description 3
- 102000013165 exonuclease Human genes 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000007614 genetic variation Effects 0.000 description 3
- 238000003205 genotyping method Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 230000035772 mutation Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 239000000047 product Substances 0.000 description 3
- 230000007306 turnover Effects 0.000 description 3
- 108090001008 Avidin Proteins 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- 101001121408 Homo sapiens L-amino-acid oxidase Proteins 0.000 description 2
- 102100026388 L-amino-acid oxidase Human genes 0.000 description 2
- 238000011529 RT qPCR Methods 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 238000001574 biopsy Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000010804 cDNA synthesis Methods 0.000 description 2
- 208000024971 chromosomal disease Diseases 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 230000029087 digestion Effects 0.000 description 2
- 238000007847 digital PCR Methods 0.000 description 2
- 238000005429 filling process Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 238000013537 high throughput screening Methods 0.000 description 2
- 239000012535 impurity Substances 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 238000005304 joining Methods 0.000 description 2
- 230000002934 lysing effect Effects 0.000 description 2
- 239000006249 magnetic particle Substances 0.000 description 2
- 238000003752 polymerase chain reaction Methods 0.000 description 2
- 108091033319 polynucleotide Proteins 0.000 description 2
- 102000040430 polynucleotide Human genes 0.000 description 2
- 239000002157 polynucleotide Substances 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 230000037452 priming Effects 0.000 description 2
- 238000004445 quantitative analysis Methods 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000028327 secretion Effects 0.000 description 2
- 239000002689 soil Substances 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- 238000013518 transcription Methods 0.000 description 2
- 230000035897 transcription Effects 0.000 description 2
- 239000002351 wastewater Substances 0.000 description 2
- AUTOLBMXDDTRRT-JGVFFNPUSA-N (4R,5S)-dethiobiotin Chemical compound C[C@@H]1NC(=O)N[C@@H]1CCCCCC(O)=O AUTOLBMXDDTRRT-JGVFFNPUSA-N 0.000 description 1
- HRPVXLWXLXDGHG-UHFFFAOYSA-N Acrylamide Chemical compound NC(=O)C=C HRPVXLWXLXDGHG-UHFFFAOYSA-N 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- 108020004394 Complementary RNA Proteins 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- SHIBSTMRCDJXLN-UHFFFAOYSA-N Digoxigenin Natural products C1CC(C2C(C3(C)CCC(O)CC3CC2)CC2O)(O)C2(C)C1C1=CC(=O)OC1 SHIBSTMRCDJXLN-UHFFFAOYSA-N 0.000 description 1
- 201000010374 Down Syndrome Diseases 0.000 description 1
- 201000006360 Edwards syndrome Diseases 0.000 description 1
- 108010007577 Exodeoxyribonuclease I Proteins 0.000 description 1
- 102100029075 Exonuclease 1 Human genes 0.000 description 1
- 101000827703 Homo sapiens Polyphosphoinositide phosphatase Proteins 0.000 description 1
- 208000026350 Inborn Genetic disease Diseases 0.000 description 1
- 108020005187 Oligonucleotide Probes Proteins 0.000 description 1
- 108091093037 Peptide nucleic acid Proteins 0.000 description 1
- 102100023591 Polyphosphoinositide phosphatase Human genes 0.000 description 1
- 239000013614 RNA sample Substances 0.000 description 1
- 101100233916 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) KAR5 gene Proteins 0.000 description 1
- 102000008579 Transposases Human genes 0.000 description 1
- 108010020764 Transposases Proteins 0.000 description 1
- 208000007159 Trisomy 18 Syndrome Diseases 0.000 description 1
- 239000011543 agarose gel Substances 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 125000000304 alkynyl group Chemical group 0.000 description 1
- 239000012491 analyte Substances 0.000 description 1
- 230000001640 apoptogenic effect Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- IVRMZWNICZWHMI-UHFFFAOYSA-N azide group Chemical group [N-]=[N+]=[N-] IVRMZWNICZWHMI-UHFFFAOYSA-N 0.000 description 1
- FFBHFFJDDLITSX-UHFFFAOYSA-N benzyl N-[2-hydroxy-4-(3-oxomorpholin-4-yl)phenyl]carbamate Chemical compound OC1=C(NC(=O)OCC2=CC=CC=C2)C=CC(=C1)N1CCOCC1=O FFBHFFJDDLITSX-UHFFFAOYSA-N 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 150000001615 biotins Chemical class 0.000 description 1
- -1 bisbiotin Chemical class 0.000 description 1
- 210000001124 body fluid Anatomy 0.000 description 1
- 239000010839 body fluid Substances 0.000 description 1
- 238000009835 boiling Methods 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 125000003636 chemical group Chemical group 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 239000003184 complementary RNA Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- QONQRTHLHBTMGP-UHFFFAOYSA-N digitoxigenin Natural products CC12CCC(C3(CCC(O)CC3CC3)C)C3C11OC1CC2C1=CC(=O)OC1 QONQRTHLHBTMGP-UHFFFAOYSA-N 0.000 description 1
- SHIBSTMRCDJXLN-KCZCNTNESA-N digoxigenin Chemical compound C1([C@@H]2[C@@]3([C@@](CC2)(O)[C@H]2[C@@H]([C@@]4(C)CC[C@H](O)C[C@H]4CC2)C[C@H]3O)C)=CC(=O)OC1 SHIBSTMRCDJXLN-KCZCNTNESA-N 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000011304 droplet digital PCR Methods 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 239000000839 emulsion Substances 0.000 description 1
- 230000007515 enzymatic degradation Effects 0.000 description 1
- 238000001976 enzyme digestion Methods 0.000 description 1
- 238000010195 expression analysis Methods 0.000 description 1
- 230000002550 fecal effect Effects 0.000 description 1
- 210000003754 fetus Anatomy 0.000 description 1
- 238000000684 flow cytometry Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 208000016361 genetic disease Diseases 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000000126 in silico method Methods 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 230000001338 necrotic effect Effects 0.000 description 1
- 239000002751 oligonucleotide probe Substances 0.000 description 1
- 201000003738 orofaciodigital syndrome VIII Diseases 0.000 description 1
- 244000052769 pathogen Species 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 210000002381 plasma Anatomy 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 238000009598 prenatal testing Methods 0.000 description 1
- 238000004393 prognosis Methods 0.000 description 1
- 238000012207 quantitative assay Methods 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 238000006049 ring expansion reaction Methods 0.000 description 1
- 229920002477 rna polymer Polymers 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 208000011580 syndromic disease Diseases 0.000 description 1
- 125000003396 thiol group Chemical class [H]S* 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 206010053884 trisomy 18 Diseases 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/6853—Nucleic acid amplification reactions using modified primers or templates
- C12Q1/6855—Ligating adaptors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2535/00—Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
- C12Q2535/122—Massive parallel sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/16—Primer sets for multiplex assays
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Immunology (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Analytical Chemistry (AREA)
- Physics & Mathematics (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本發明的揭示內容是關於次世代DNA定序方法和用途,用於對一個或多個核酸標靶(例如在大量的未純化的樣品材料中)進行準確且大規模平行定量。更具體地,本發明是關於包括用於檢測和定量複雜樣品中的基因標靶的探針的方法和試劑盒。本發明包括每一基因標靶、條形碼環狀寡核苷酸和橋寡核苷酸或橋寡核苷酸複合體各兩個標靶特異性核酸探針。
Description
本發明的揭示內容是關於經改良的次世代DNA定序方法,用於對一個或多個核酸標靶進行準確且大規模平行定量。更特別的是,本發明為關於包括用於檢測和定量複雜DNA池中基因標靶的探針的方法和試劑盒,主要用於基因標靶和變體檢測。本發明一個或多個標靶每個對每一基因標靶、條形碼環狀寡核苷酸和一個或多個橋寡核苷酸各使用一個或多個標靶特異性核酸探針。
隨著研究基因變異技術的進步,在植物和動物中檢測基因變異並不麻煩。然而,儘管定序成本下降,但檢測和準確定量基因變異(諸如突變),特別是在信號較弱的樣品中,目前仍然是麻煩、費力和昂貴的。各種問題可更準確地表述為例如用以在共同背景下檢測基因信號的特異性、用以檢測弱基因信號的靈敏度、用以準確定量經檢測的信號的準確性、當平行測定多個樣品時用以確定測定成本之每次測定的經標靶定向的基因標靶的通量數量、每次測定的成本、規模大小、及用以確定從採樣到取得結果的所需時間的周轉量(turn-over)。.
目前,液體活組織檢查和概念上類似的測定(諸如抗生素抗性基因檢測)的典型定量方法包括定量PCR(qPCR)、陣列qPCR、數位PCR、多重連接依賴式探針擴增(MLPA)或從次世代DNA定序數據的定量。雖然定量方法已是穩健和成熟的方法,但每個方法都與下面更詳細討論的具體問題有關係:
定量PCR:定量PCR(qPCR)是一種包括在PCR過程中(即實時)擴增經標靶定向的DNA分子的技術。實時PCR可以定量使用(定量實時PCR),以及也可以半定量使用,即高於/低於一定量的DNA分子(半定量實時PCR)。定量PCR(qPCR)是基因標靶定量的黃金標準。目前,qPCR反應的實驗室成本約為2$。然而,考慮到設置反應所需的大量實際操作時間(人工成本)、標準曲線的需要以及每個經定量標靶的重複,實際成本要高得多。由於每個基因標靶都需要單獨的定量實驗,因此實際操作時間會隨著樣品數量的增加而急劇增加。
陣列PCR:PCR陣列是分析有關基因的一通路或疾病聚焦基板的基因表達的最可靠工具。每個96孔板、384孔板或100孔盤PCR陣列都包括SYBR Green優化的引子測定,用於對一組聚焦基因進行徹底研究。qPCR技術的一個新的迭代是陣列qPCR,其將單個qPCR反應小型化。陣列PCR降低了單個qPCR反應的成本,並提高了該方法對多個標靶和樣品的可擴展性。然而,該方法目前侷限於讀出基礎設施的巨大資金成本及以每一晶片數千美元的成本自12個樣品分析出384個標靶(或者相反地,自384個樣品分析出12個標靶)加上。因此,使用上述設施來分析數千個樣品仍然非常昂貴。
數位PCR:數位聚合酶鏈式反應(Digital PCR,DigitalPCR,dPCR,dePCR)是一種通過微滴微流體和螢光檢測來提供標靶絕對定量的方法。這種方法相對成本有效(每個樣品一個標靶成本約為3$),但是,基於每個樣品規模得到的每個標靶所需的準備、設置和操作個別實驗的實際時間是難以擴展至數千個樣品的。
多重連接依賴式探針擴增(MLPA)提供了一種用於簡化單一樣品中檢測多個基因標靶的方法。然而,MLPA只提供標靶的相對定量,並需要對每個樣品進行個別的檢測實驗。最近,在MLPA的一變型例中引入了DNA條形碼的概念。與傳統的MLPA工作流程相比,該概念允許更好的定量分辨率和樣品多樣化。
基於次世代定序的方法:次世代定序(NGS),也稱為高通量定序,使得基於序列的基因表達分析從「數位」轉換成為類比技術。隨著DNA定序成本的不斷降低,從次世代DNA定序數據中進行標靶計數正變得越來越有吸引力,並且目前正使用於例如無創產前測試。然而,目前的方法存在定序資料庫製備成本高和定序工作浪費在非相關基因標靶定序上的問題。例如,在癌症相關液體活組織檢查中,非標靶定向方法導致腫瘤學的非相關基因座定序工作的浪費。在胎兒診斷學中,基因座的非標靶定向採樣極大地限制了解釋數據的統計選擇。Guardant Health Inc.提供了更有標靶定向性的定序方法,其中一系列RNA捕獲探針豐富了次世代DNA定序的標靶。
Akhras et al. (2007) PLoS ONE 2(2):e223公開了一種涉及條形碼化標靶特異性探針、標靶環化和定序的多重病原體檢測測定。還公開了使用橋寡核苷酸來連接標靶特異性探針。
WO2018109206描述了使用掛鎖探針和滾環擴增來檢測樣品中分析物的方法。沒有描述使用橋寡核苷酸。
WO2019038372描述了一種次世代定序方法,其中通過體外轉錄從含有T7聚合酶啟動子的連接複合體中選擇性地擴增感興趣的標靶序列,然後進行cDNA合成和定序。雖然這種方法可以對樣品中的許多標靶序列進行準確和平行的檢測和定量,但對於更複雜、大體積、稀釋和/或不純的樣品仍具有挑戰性。
因此,鑑於前述討論,為了克服前述缺點,諸如但不限於特異性、靈敏度、準確性、通量、成本、規模化(scaling)和周轉等之缺點,則有需要對於核酸標靶進行準確和大規模的平行定量。
本發明提供了一種使用次世代定序技術在大體積樣品(高達數十毫升)和/或稀釋和/或未純化的樣品材料中進行高靈敏度、可規模化且準確的靶定量的方法。而且,避免了諸如WO2019038372中描述的RNA擴增步驟,使該方法更加簡單。此外,本發明的方法包括使用單獨的條形碼環狀寡核苷酸進行樣品鑑定。條形碼環狀寡核苷酸的使用允許同時進行靶查詢和樣品索引,允許有效的樣品彙集,從而使定量測定更具成本效益和靈活性,並為引入唯一分子標識符(UMI)序列提供一種替代方法。由此產生的方案省略了對單獨樣品索引的需求,因此允許更短的讀取長度,並為短讀取和納米孔定序應用提供好處。
在第一個主要方面,本發明涉及一種高通量檢測多個樣品中一個或多個標靶核苷酸序列的方法,所述方法包括以下步驟:
(i)為每個樣品中的每個標靶核苷酸序列提供:第一探針、第二探針、條形碼環狀寡核苷酸,和橋寡核苷酸或能夠與所述條形碼環狀寡核苷酸黏合(annealing)以形成橋寡核苷酸複合體的多個橋寡核苷酸,
其中,所述第一探針包括位於所述第一探針的5'端的第一橋寡核苷酸特異性序列和位於所述第一探針的3'端的第一標靶特異性部分;
其中,所述第二探針包括位於所述第二探針的5'端的第二標靶特異性部分和位於所述第二探針的3'端的第二橋寡核苷酸特異性序列;
其中,所述條形碼環狀寡核苷酸自該分子的5'端起包括第三橋寡核苷酸特異性序列,條形碼環狀序列和第四橋寡核苷酸特異性序列;
其中,所述橋寡核苷酸或多個橋寡核苷酸包括與所述第一探針中的第一橋寡核苷酸特異性序列和所述第二探針中的第二橋寡核苷酸特異性序列互補的序列,和與所述條形碼環狀寡核苷酸中的第三橋寡核苷酸特異性序列和第四橋寡核苷酸特異性序列互補的序列;
並且其中,可選地,所述第一探針、所述第二探針、所述條形碼環狀寡核苷酸、所述橋寡核苷酸或者所述多個橋寡核苷酸的寡核苷酸中的至少一者包括核酸內切酶的識別序列;
(ii)對於所述一個或多個靶核苷酸序列中的每一種,優選對於在單獨管中的每個樣品,使所述第一探針和第二探針與所述條形碼環狀寡核苷酸和所述橋寡核苷酸或多個橋寡核苷酸接觸並允許自黏合為連接複合體;
(iii)使存在於待測試所述標靶核苷酸序列的每個樣品中的核酸與所述連接複合體接觸;
(iv)允許所述第一探針的第一標靶特異性部分和所述第二探針的第二標靶特異性部分與標靶序列上基本相鄰的區段雜交,從而形成雜交複合體;
(v)可選地,將來自所述多個樣品的雜交複合體彙集起來;
(vi)將所述雜交複合體中的探針連接起來,以提供經連接的連接複合體;
(vii)使用滾環擴增法,用鏈置換聚合酶從一個或多個經連接的連接複合體來擴增核酸,從而獲得單鏈的多聯體(concatemeric)序列;
(viii)可選地,在存在步驟(i)中指定的識別序列的條件下,進行通過以下方式獲得核酸片段的步驟:
(a)切割在步驟(vii)中獲得的單鏈的多聯體序列,或
(b)使在步驟(vii)中獲得的單鏈的多聯體序列與包含核酸內切酶的識別序列的特異性寡核苷酸黏合,其中所述寡核苷酸與步驟(i)中指定的所述識別序列黏合,從而獲得所述核酸內切酶的識別位點,以及用所述核酸內切酶切割經黏合的複合體;
(ix)使步驟(vii)中獲得的所述多聯體序列或步驟(viii)中獲得的核酸片段經受高通量定序技術以確定所述條形碼序列;以及
(x) 通過確定所述第一標靶特異性部分和/或第二標靶特異性部分的至少一部分,和/或與所述條形碼環狀寡核苷酸中的條形碼對應的條形碼序列的至少一部分,來鑑定所述多個樣品中標靶核苷酸序列的存在和/或數量,
其中,步驟(v)和步驟(vi)可按任何順序進行。
定義:
標靶核苷酸序列:術語“標靶核苷酸序列”可以是需要檢測的任何感興趣的核苷酸序列。應當理解,給出的術語是指連續核苷酸序列以及具有互補序列的核酸分子。在一些實施方式,標靶序列是代表多態性或與多態性相關的核苷酸序列。
多態性:術語“多態性”是指在群體中出現兩種或更多種基因決定的替代序列或等位基因。多態性標誌物或位點是發生序列差異的基因座。多態性基因座(polymorphic locus)可以小到一個鹼基對。
樣品:術語“樣品”在本文中用於含有兩種或更多種標靶序列的兩個或更多個樣品。根據本發明方法提供的樣品可已製備好,以便至少提取標靶核酸,並使那些核酸可被本發明中使用的探針接近。特別地,在一些實施方式中,每個樣品包含至少兩種不同的標靶序列,優選至少100種,更優選至少250種,更優選至少500種,最優選至少2000種或更多。術語“樣品”可以指但不限於從人體/動物體獲得的兩個或更多個樣品,包括尿液、活組織檢查樣品、唾液和其他分泌物、呼出的水分提取物、組織、血漿(液體活組織檢查樣品);或從環境獲得的兩個或更多個樣品,包括水、廢水、土壤、植物;或含病毒或細菌等的兩個或更多個樣品。在一個實施方式中,多個樣品包括血液樣品、唾液樣品、尿液樣品或糞便樣品、另一體液的樣品或身體材料的提取物,例如頭髮或皮屑。
探針:術語“探針”是可變長度(通常50至1000個鹼基長,優選50至200個鹼基長)的DNA或RNA片段,其可用於DNA或RNA樣品以檢測與探針中序列互補的核苷酸序列(DNA或RNA標靶)的存在。寡核苷酸探針與標靶序列互補的區段被設計成使得對於樣品中的每個標靶序列,提供一對第一探針和第二探針,由此每個探針在其末端含有與標靶序列的一部分互補的區段。此外,本公開還描述了用於接合第一探針和第二探針的橋寡核苷酸或橋寡核苷酸複合體。此外,本公開描述了條形碼環狀寡核苷酸,其包括側翼為兩個區段的環狀區段,這個兩個區段可與一個或多個橋寡核苷酸雜交。環狀區段不與一個或多個橋寡核苷酸雜交,並包括條形碼。
通用(Universal):當用於描述擴增過程時,術語“通用”是指能夠使用單個引子或一組引子進行多個擴增反應的序列。這種引子的使用極大地簡化了多重化,因為只需要兩個引子來擴增多個選定的核酸序列。當用於描述引發位點時,術語“通用”是通用引子將雜交的位點。還應該注意的是,可以使用通用引發序列/引子的“組”。
雜交:術語“雜交(或雜化)”描述DNA或RNA分子黏合成互補DNA或RNA的過程。DNA或RNA複製以及DNA轉錄成RNA都依賴於核苷酸雜交。
連接(Ligation):術語“連接”是通過酶的作用接合兩個核酸片段。DNA連接酶是能夠催化在互補鏈上相鄰位點結合的兩條多核苷酸鏈(的端部)之間形成磷酸二酯鍵的酶。在一個實施方式中,連接也可以化學方式進行,特別地如果多核苷酸的兩個相鄰的端部都被修飾以使得能夠化學連接。
擴增:本文使用的術語“擴增”指的是使用DNA聚合酶來增加核苷酸序列混合物中具體核苷酸序列的濃度。“PCR”或“聚合酶鏈式反應”是體外酶促擴增特定DNA/RNA片段的快速程序。待擴增的DNA/RNA可通過加熱樣品而變性。術語“引子”是RNA或DNA的鏈(通常約18至22個鹼基),其作為DNA合成的起點。這是複製DNA所必需的,因為催化這一過程的酶,DNA聚合酶,只能在現有的DNA鏈上添加新的核苷酸。
聚合酶:聚合酶是一種合成長鏈核酸或核酸聚合物的酶。DNA聚合酶和RNA聚合酶分別用於通過鹼基配對相互作用複製DNA或RNA模板鏈來組裝DNA和RNA分子。
高通量:術語“高通量”指的是同時處理和篩選大量DNA樣品的能力;以及在單個DNA樣品中同時篩選大量不同的基因座的能力。高通量定序或篩選,通常縮寫為HTS,是一種特別適用於同時有效篩選大量樣品的科學實驗方法。
核酸內切酶:核酸內切酶是一種在隨機或特定位置使DNA雙鏈或單鏈裂解或有缺口的酶。
條形碼:本發明中使用的探針和寡核苷酸可包括由核苷酸序列組成的一個或多個條形碼。條形碼序列可包括用於標靶列舉(target enumeration)的標靶核苷酸序列標識符序列、樣品標識符序列和/或分子條形碼(也稱為獨特分子標識符)。條形碼序列可包括隨機序列。
如上文所述,本公開涉及一種利用連接依賴性測定法在非常多的樣品中高通量檢測標靶核苷酸序列的方法。本公開提供了一種使用次世代定序允許的技術確定複雜核酸池中基因標靶序列的方法。本公開還提供了一種通過利用連接依賴性測定法在多個樣品中(優選在非常多的樣品中),對多種基因標靶進行剖析的方法。本公開提供了一種多重連接依賴性探針擴增的方法,其使得能夠查詢多個樣品中的不同標靶核酸。本發明的方法使得能夠對多個樣品中的一個或多個標靶核苷酸序列進行定序,為不同的標靶核酸提供多個不同的探針組。在處理定序數據時,獨特序列標識符用於鑑定基因標靶和對樣品池中的單個樣品進行絕對定量。
在第一個主要方面,本發明涉及一種高通量檢測多個樣品中一個或多個標靶核苷酸序列的方法,所述方法包括以下步驟:
(i)為每個樣品中的每個標靶核苷酸序列提供:第一探針、第二探針、條形碼環狀寡核苷酸,和橋寡核苷酸或能夠與所述條形碼環狀寡核苷酸黏合以形成橋寡核苷酸複合體的多個橋寡核苷酸,
其中,所述第一探針包括位於所述第一探針的5'端的第一橋寡核苷酸特異性序列和位於所述第一探針的3'端的第一標靶特異性部分;
其中,所述第二探針包括位於所述第二探針的5'端的第二標靶特異性部分和位於所述第二探針的3'端的第二橋寡核苷酸特異性序列;
其中,所述條形碼環狀寡核苷酸自該分子的5'端起包括第三橋寡核苷酸特異性序列、條形碼環狀序列和第四橋寡核苷酸特異性序列;
其中,所述橋寡核苷酸或多個橋寡核苷酸包括與所述第一探針中的第一橋寡核苷酸特異性序列和所述第二探針中的第二橋寡核苷酸特異性序列互補的序列,和與所述條形碼環狀寡核苷酸中的第三橋寡核苷酸特異性序列和第四橋寡核苷酸特異性序列互補的序列;
並且其中,可選地,所述第一探針、所述第二探針、所述條形碼環狀寡核苷酸、所述橋寡核苷酸或者所述多個橋寡核苷酸的寡核苷酸中的至少一者包括核酸內切酶的識別序列;
(ii)對於所述一個或多個標靶核苷酸序列中的每一種,優選對於在單獨管中的每個樣品,使所述第一探針和第二探針與所述條形碼環狀寡核苷酸和所述橋寡核苷酸或多個橋寡核苷酸接觸並允許自黏合為連接複合體;
(iii)使存在於待測試所述標靶核苷酸序列的每個樣品中的核酸與所述連接複合體接觸;
(iv)允許所述第一探針的第一標靶特異性部分和所述第二探針的第二標靶特異性部分與標靶序列上基本相鄰的區段雜交,從而形成多個雜交複合體(或可選的雜交複合體);
(v)可選地,將來自所述多個樣品的雜交複合體彙集起來;
(vi)將所述雜交複合體中的探針連接起來,以提供經連接的連接複合體;
(vii)使用滾環擴增法,用鏈置換聚合酶從一個或多個經連接的連接複合體擴增核酸,從而獲得單鏈的多聯體序列;
(viii)可選地,在存在步驟(i)中指定的識別序列的條件下,進行通過以下方式獲得核酸片段的步驟:
(a)切割在步驟(vii)中獲得的單鏈的多聯體序列,或
(b)使在步驟(vii)中獲得的單鏈的多聯體序列與包含核酸內切酶的識別序列的特異性寡核苷酸黏合,其中所述寡核苷酸與步驟(i)中指定的所述識別序列黏合,從而獲得所述核酸內切酶的識別位點,以及用所述核酸內切酶切割經黏合的複合體;
(ix)使步驟(vii)中獲得的所述多聯體序列或步驟(viii)中獲得的核酸片段經受高通量定序技術以確定所述條形碼序列;以及
(x)通過確定所述第一標靶特異性部分和/或第二標靶特異性部分的至少一部分,和/或與所述條形碼環狀寡核苷酸中的條形碼對應的條形碼序列的至少一部分,來鑑定所述多個樣品中標靶核苷酸序列的存在和/或數量,
其中,步驟(v)和步驟(vi)可按任何順序進行。
圖1提供了本發明方法實施方式的非限制性說明。
本發明的方法利用四種或更多種的核酸分子,其中兩種標靶特異性的核酸探針(第一探針和第二探針)對基因標靶具有特異性,另外兩種或更多種的其他核酸探針通常是通用的(橋寡核苷酸或橋寡核苷酸複合體和條形碼環狀寡核苷酸)。第一探針、第二探針和條形碼環狀寡核苷酸與一個或多個橋探針雜交形成連接複合體。使樣品DNA或RNA上具有標靶鑑定位點的連接複合體(含有一個或多個條形碼序列)與查詢樣品的互補標靶序列進行雜交。雜交後,第一探針和第二探針被化學連接或通過DNA連接酶酶法連接,形成經連接的連接複合體。在本發明中,在待分析的多個樣品的樣品分析過程中,將會形成多個這樣的經連接的連接複合體。
術語“多個樣品”可以指但不限於從人體或動物體獲得的兩個或更多個樣品,包括活組織檢查樣品、唾液和其他分泌物、呼出的水分提取物、組織、血漿(液體活組織檢查樣品);從環境獲得的兩個或更多個樣品,包括水、廢水、土壤、植物;或者含病毒或細菌的兩個或更多個樣品等。在一個實施方式中,使用的樣品不需要事先進行核酸的純化或濃縮。在另一個實施方式中,可以對樣品進行預處理,例如裂解細胞以暴露核酸。
標靶序列可包括需要檢測的任何感興趣的核苷酸序列。本公開的標靶核苷酸序列可從患者血液中的一部分DNA或母體血液中的一部分DNA獲得,但不限於此。患者血液中的一部分DNA可例如從凋亡/壞死的癌細胞中獲得,或者母體血液中的一部分DNA可以是胎兒或和/或母體來源的。進一步地,分析結果用於,例如評估個體患上給定類型癌症的風險,確定給定治療對給定癌症的療效,腫瘤中耐藥性相關突變的發展,或胎兒攜帶基因疾病(諸如常見的三染色體性唐氏綜合征、帕圖綜合征和愛德華茲綜合征)的風險。在某些實施方式中,該方法包括為每個標靶核苷酸序列提供多個不同的探針組。
如本文所使用的,術語“探針組”包括第一探針、第二探針、條形碼環狀寡核苷酸,以及一個或多個橋寡核苷酸。
在某些實施方式中,第一探針自分子的5’端起包括可選的5’磷酸、第一橋寡核苷酸特異性序列、可選的第一通用序列、可選的第一序列條形碼,和在其3’端的第一標靶特異性部分。
在某些實施方式中,第二探針自分子的5’端起包括可選的5’磷酸、第二標靶特異性部分、可選的第二序列條形碼、可選的第二通用序列,和在其3’端的第二橋寡核苷酸特異性序列。
橋寡核苷酸或多個橋寡核苷酸包括與所述第一探針中的第一橋寡核苷酸特異性序列和所述第二探針中的第二橋寡核苷酸特異性序列互補的序列,可選的通用序列,和與所述條形碼環狀寡核苷酸中的第三橋寡核苷酸特異性序列和第四橋寡核苷酸特異性序列互補的序列。
條形碼環狀寡核苷酸自分子的5'端起包括第三橋寡核苷酸特異性序列、條形碼環狀序列和第四橋寡核苷酸特異性序列。條形碼可用於在所有測試的樣品中的所有連接複合體中唯一地限定複合體。條形碼環狀寡核苷酸可以有任何合適的長度,例如,長度可在30和100bp之間,諸如40和60bp之間。
可選地,第一探針、第二探針、條形碼環狀寡核苷酸,或者一個或多個橋寡核苷酸中的至少一者包括核酸內切酶的識別序列。核酸內切酶識別序列能夠切割多聯體序列。在一個實施方式中,識別序列是限制性核酸內切酶(諸如EcoRI)的識別序列。在另一個實施方式中,識別序列是歸巢核酸內切酶(諸如I-CeuI)的識別序列。在另一個實施方式中,識別序列是嚮導DNAaseI或CRISPR-Cas類切割體系的識別序列。在另一個實施方式中,識別序列是缺口核酸內切酶的識別序列。
在一個實施方式中,所述條形碼環狀寡核苷酸含有核酸內切酶(諸如缺口核酸內切酶)的一個或多個識別序列。在又一個實施方式中,所述條形碼環狀寡核苷酸含有能夠相互黏合的兩個識別序列,從而獲得雙鏈核酸內切酶識別位點。在本文又一個實施方式中,所述方法不包括上文中指定的步驟(viii),但(相反)在步驟(vii)與步驟(ix)之間包括以下步驟:使所述條形碼環狀寡核苷酸中的兩個識別序列黏合,並用對所述識別位點具有特異性的核酸內切酶(諸如缺口核酸內切酶)來切割所得雙鏈核酸內切酶識別位點。
可選地,第一探針、第二探針、條形碼環狀寡核苷酸,或一個或多個橋寡核苷酸中的至少一者包括第一捕獲部。在本文在使用時,“第一捕獲部”是指使得探針、連接複合體或雜交複合體被連接至固體支持物的第二捕獲部所捕獲(即與之結合)的部分,諸如化學基團。本領域內已知的任何合適的捕獲部都可用於此目的。眾所周知的合適例子是使用包被有鏈黴親和素的磁珠捕獲生物素化的分子。因此,在一個實施方式中,第一捕獲部是生物素部,它可以與連接到固體支持物(諸如磁珠)上的鏈黴親和素或親和素部(第二捕獲部)相互作用。其他選擇包括生物素衍生物,諸如雙生物素、脫硫生物素或可光解的生物素,它們可用於與鏈黴親和素/親和素綴合。進一步的選擇包括使用硫醇和丙烯醯胺(acrydite)基團進行丙烯醯胺(acrydite)/丙烯醯胺(acrylamide)綴合,使用炔基和疊氮基進行點擊化學,和使用地高辛用於與抗地高辛抗體綴合。綴合配偶體(conjugation partner)可以設置在任何固體表面上,諸如珠子(磁性或其他)或固體支持物。因此,在本發明方法的一個實施方式中,所述第一探針、第二探針、條形碼環狀寡核苷酸,或者一個或多個橋寡核苷酸中的至少一者包括第一捕獲部,並且,在步驟(iv)和步驟(v)之間進行包括以下的中間步驟(iv)(a):使雜交複合體與含第二捕獲部的固體支持物接觸,允許所述第一捕獲部與第二捕獲部相互作用,從而使得所述雜交複合體與所述固體支持物相連;以及使與固體支持物相連的雜交複合體與樣品中未與所述固體支持物相連的組分分離。
可選地,第一標靶特異性部分、第二標靶特異性部分、第一橋寡核苷酸特異性序列、第二橋寡核苷酸特異性序列、第三橋寡核苷酸特異性序列和/或第四橋寡核苷酸特異性序列彼此獨立地包含至少一個經化學修飾的核苷酸以增加探針結合。增加探針結合的化學修飾包括但不限於核糖核酸、肽核酸和鎖定核酸(例如,如WO2019038372的圖3所示,該文件通過引用併入本文)。在一個實施方式中,第一探針、第二探針、條形碼環狀寡核苷酸或所有這三者的橋接部分包括經化學修飾的鹼基,以允許改善與一個或多個橋寡核苷酸的結合。在另一實施方式中,第一標靶特異性部分、第二標靶特異性部分、第一橋寡核苷酸特異性序列、第二橋寡核苷酸特異性序列、第三橋寡核苷酸特異性序列和/或第四橋寡核苷酸特異性序列彼此獨立地包含一個或多個經化學修飾的核苷酸。在某些實施方式中,化學修飾允許相鄰探針的化學連接。
在一些實施方式中,上文描述的探針與完全相鄰的基因基因座,即標靶核苷酸序列的相鄰區段,或者與相距至多500個鹼基對,例如相距至多200個鹼基對,諸如相距至多50個鹼基對,相距至多40個鹼基對,相距至多30個鹼基對,相距至多20個鹼基對,相距至多10個鹼基對或相距至多5個鹼基對結合。
在一些實施方式中,第一探針、第二探針、條形碼環狀寡核苷酸,或者一個或多個橋寡核苷酸可包括用於DNA定序平臺諸如(但不限於)Illumina的接頭序列。這些接頭序列允許得到的定序資料庫與定序設備的檢測部件(諸如Illumina流動池)結合。
此外,在一些實施方式中,橋寡核苷酸或者多個橋寡核苷酸中的寡核苷酸包括:
(i)一至五個3'突出的鹼基(即,不與第二探針形成雙螺旋的額外鹼基),和/或
(ii)3’磷酸,和/或
(iii)在從3'端起的三個位置內的一個或多個硫代磷酸酯修飾。
優選對於在單獨的管中的每個樣品,在探針與含標靶序列的樣品接觸之前,使第一探針、第二探針和條形碼環狀寡核苷酸與橋寡核苷酸(或能夠形成橋寡核苷酸複合體的多個寡核苷酸)接觸,並允許黏合成連接複合體(步驟(ii))。在與第一探針和第二探針黏合之前,可對橋寡核苷酸與條形碼環進行預黏合,或者所有的黏合步驟可以一次性完成。在其中橋不是一個寡核苷酸而是橋是能夠與條形碼環寡核苷酸黏合形成橋寡核苷酸複合體的多個寡核苷酸(諸如兩個寡核苷酸)的實施方式中(本文中在2B示出),該多個寡核苷酸可以在與第一和第二探針黏合前與條形碼環狀寡核苷酸預黏合,或者所有的黏合步驟可以一次完成,或者條形碼環狀寡核苷酸可以在標靶捕獲期間與經預黏合的探針複合體黏合。
優選地,每個連接複合體對第一標靶特異性序列、第二標靶特異性序列和一個或多個條形碼序列的組合是獨特的。這使得能夠在擴增後對標靶序列進行列舉,並對結果進行分析。
此後,使多個樣品中的一個或多個標靶核苷酸序列與多個連接複合體接觸(步驟(iii))。第一探針的第一標靶特異性部分和第二探針的第二標靶特異性部分與標靶序列上基本相鄰的區段雜交,從而形成雜交複合體(步驟(iv))。如上文所提及的,標靶序列上基本相鄰的區段可緊密相鄰,也可以存在多達500個鹼基對的間隙。
在一些實施方式中,樣品的體積超過100微升,例如超過1 ml。在又一實施方式中,樣品的核酸濃度低於5 pmol,諸如低於1 pmol,例如低於200 fmol。在一個實施方式中,多個樣品包括一個或多個血液樣品、一個或多個唾液樣品、一個或多個尿液樣品,或者一個或多個糞便樣品。
隨後,在一些實施方式中,如果第一探針、第二探針、條形碼環狀寡核苷酸或一個或多個橋寡核苷酸中的至少一者包含第一捕獲部,則使雜交複合體與含第二捕獲部的固體支持物接觸,並允許第一捕獲部與第二捕獲部相互作用,使雜交複合體與固體支持物相連(可選步驟(iv)(a))。此後,使與固體支持物相連的雜交複合體與樣品中未與固體支持物相連的組分分離。如果固體支持物是磁珠,則可以用磁鐵將磁珠固定住,並可去除剩餘的液體樣品。可選地,在繼續進行之前進行洗滌步驟。
步驟(iv)(a)帶來核酸的純化和富集,使得特別是對於高度不純的樣品具有改善的結果。在一個實施方式中,本發明的方法在步驟(iv)(a)之前不包括富集核酸的步驟。因此,在一個實施方式中,本方法在步驟(iv)之前不包含將原始樣品中的核酸濃縮大於2倍、大於10倍或大於100倍的步驟。在另一個實施方式中,本發明的方法在步驟(vi)的連接之後不包括純化步驟。
隨後,以酶法或化學法進行所形成的雜交複合體中探針的連接,以提供經連接的連接複合體(步驟(vi))。可選地,作為步驟(vi)的一部分,第一探針與第二探針之間、第一探針與條形碼環狀寡核苷酸之間和/或第二探針與條形碼環狀寡核苷酸之間的間隙(如果存在)可以通過引入聚合酶和一個或多個核苷酸來填補。聚合酶添加與橋寡核苷酸序列互補的核苷酸(a),從而填補第一探針、第二探針和條形碼環狀寡核苷酸之間的間隙,使探針連接起來並將條形碼環狀寡核苷酸納入橋互補鏈中。橋寡核苷酸或橋寡核苷酸複合體從5'位點或3'位點延伸與連接的探針互補,從而使存在於第一探針或第二探針中的標靶序列識別序列整合到橋寡核苷酸或橋寡核苷酸複合體中。優選地,使用不破壞雙鏈DNA的聚合酶,例如Taq聚合酶,以便在第一探針和第二探針與標靶序列黏合時均不干擾第一探針與第二探針的連接。在一個實施方式中,所述橋寡核苷酸,或所述多個橋寡核苷酸的一個或多個寡核苷酸,在與所述第一探針、第二探針或條形碼環狀寡核苷酸不互補的區域中,包括多個通用鹼基類似物,以允許引入適合用作標靶列舉的分子條形碼的隨機序列。在這樣的實施方式中,作為步驟(vi)的一部分,使用聚合酶和核苷酸進行間隙填補步驟,以生成這樣的隨機序列。在實施方式中,多個通用鹼基類似物是多個5-硝基吲哚。
然後從一個或多個標靶樣品中可選地彙集連接複合體(步驟(vi))。步驟(v)和步驟(vi)可按指定順序進行或可替代地以相反順序進行。
接下來,從一個或多個經連接的連接複合體中擴增核酸,從而獲得單鏈多聯體序列(步驟(vii))。使用鏈置換聚合酶,諸如phi29聚合酶(UniProtKB - P03680; DPOL_BPPH2)或Bst聚合酶(P52026; DPO1_GEOSE)通過滾環擴增來進行擴增。
在一個實施方式中,在步驟(v)之後,但在步驟(vii)之前,進行步驟(a)和步驟(b),其中步驟(a)包括允許經連接的連接複合體與標靶核苷酸序列解離,並且步驟(b)包括加入標靶特異性探針,所述標靶特異性探針包括與所述標靶核苷酸序列對應的序列,其中所述標靶特異性探針能夠與經連接的連接複合體黏合,並允許所述標靶特異性探針與經連接的連接複合體黏合,從而形成擴增模板。在此種實施方式中,在步驟(vii)中,用鏈置換聚合酶通過滾環擴增對所述擴增模板進行擴增。
可選地,在存在步驟(i)中指定的識別序列的情況下,步驟(viii)通過以下來進行以獲得核酸片段:
(a) 切割在步驟(vii)中獲得的單鏈的多聯體序列,或
(b) 使在步驟(vii)中獲得的單鏈的多聯體序列與包含核酸內切酶的識別序列的特異性寡核苷酸黏合,其中所述寡核苷酸與步驟(i)中指定的所述識別序列黏合,從而獲得所述核酸內切酶的識別位點;以及,用所述核酸內切酶切割經黏合的複合體。
隨後,在步驟(ix)中,使步驟(vii)中獲得的所述多聯體序列或者,如果進行了步驟(viii),則使步驟(viii)中獲得的核酸片段經受高通量定序技術以確定所述條形碼序列。
可選地,擴增後,去除固體支持物(如果存在),並且將上清液用於後續處理。例如,如果固體支持物是磁性顆粒,可使用磁鐵將它們去除。在本發明方法的其他一些實施方式中,在步驟(v)之後、步驟(vi)之後或步驟(vii)之後,立即破壞第一捕獲部與第二捕獲部之間的相互作用。例如,如果第一捕獲部是生物素且第二捕獲部是鏈黴親和素,則可通過加入過量的可溶性生物素來破壞相互作用。如果鏈黴親和素與磁性顆粒結合,則可隨後用磁鐵將其去除。
此外,可選地,緊鄰步驟(ix)且在步驟(ix)之前,使用與所述第一探針和第二探針的通用部分結合的引子進行PCR擴增,其中所述引子可選地包括用於後續步驟(ix)中的定序的接頭序列。
在另一個實施方式中,步驟(ix)中的定序是使用納米孔定序進行的,其中可選地使用轉座複合體對步驟(vii)中獲得的多聯體序列進行片段化。Wang等人(2021 Nat Biotechnol 39(11):1348)對用於納米孔定序的合適技術進行了綜述。
可以通過高通量定序技術(步驟(ix)和步驟(x))確定第一和/或第二標靶特異性部分的至少一部分和/或條形碼的至少一部分來鑑定多個樣品中標靶核苷酸序列的存在和/或數量,例如使用次世代定序平臺,包括但不限於Illumina iSeq、MiSeq、HiSeq、NextSeq或NovaSeq。優選地,通過對每個標靶和每個樣品的分子條形碼的數量進行計數來允許對基因標靶進行列舉(enumeration)。樣品從序列數據中分離出來(去卷積),並且在DNA定序後在silico中對序列標靶進行定量。
與傳統的核酸定序技術相比,本發明的優點包括但不限於低成本、高簡單性、高特異性、高靈敏度、高準確性、高通量、高可擴展性和高周轉性的定量測定。本發明的另一個方面是,由於在工作流程的初始階段進行了樣品索引,本發明的方法可將多個樣品彙集在一起,從而在測定成本和速度方面提供了改善。本發明的另一個方面是,本發明的方法使得能夠對包括人類和動物群體在內並且包括大體積的未純化樣品材料在內的多個樣品中的多種核酸標靶進行精確和大規模平行定量。如所提及的,在優選的實施方式中,使用的樣品,諸如尿液樣品,不需要事先進行核酸的純化或濃縮。在另一個實施方式中,可以對樣品進行預處理,例如裂解細胞以暴露核酸。本發明的一個特別的優點是能夠使用獨特的探針設計(即探針三聯體),來檢測和擴增感興趣的標靶序列。探針設計有特殊定位的經修飾的核苷酸,可提高黏合和結合效率。結合特性的改善引起更高的測定特異性、靈敏度和準確性。本發明的方法同樣適用于研究基因變異體並在診斷和預後中找到應用,包括但不限於對一個或多個序列和/或多態性(諸如SNP和/或插入缺失)、癌症診斷或來自母體血液的胎兒染色體疾病的樣品進行基因分型。在優選的實施方式中,對於兩個或更多個樣品或者對於兩個或更多個基因座/等位基因組合,使用條形碼序列來對樣品中的一個或多個序列和/或多態性(諸如SNP和/或插入缺失)進行基因分型。
在另一方面,本發明提供了含多個容器的成套的試劑盒(a kit of parts),其中,至少一個容器容納一組或多組的第一探針和第二探針,至少一個容器容納條形碼環狀寡核苷酸,並且至少一個容器容納一個或多個橋寡核苷或能夠與所述條形碼環狀寡核苷酸形成橋寡核苷酸複合體的多個橋寡核苷酸。其中,所述第一探針包括位於所述第一探針的5'端的第一橋寡核苷酸特異性序列和位於所述第一探針的3'端的第一標靶特異性部分;
其中,所述第二探針包括位於所述第二探針的5'端的第二標靶特異性部分和位於所述第二探針的3'端的第二橋寡核苷酸特異性序列;
其中,所述條形碼環狀寡核苷酸自分子的5'端起包括第三橋寡核苷酸特異性序列、條形碼環狀序列和第四橋寡核苷酸特異性序列;
其中,所述橋寡核苷酸或多個橋寡核苷酸包含與所述第一探針中的第一橋寡核苷酸特異性序列和所述第二探針中的第二橋寡核苷酸特異性序列互補的序列,和與所述條形碼環狀寡核苷酸中的第三橋寡核苷酸特異性序列和第四橋寡核苷酸特異性序列互補的序列;
其中,可選地,所述第一探針、所述第二探針、所述條形碼環狀寡核苷酸、所述橋寡核苷酸和所述多個橋寡核苷酸的寡核苷酸中的至少一者包括核酸內切酶的識別序列;
並且其中,可選地,所述成套的試劑盒進一步包括能夠與所述識別序列黏合的寡核苷酸,從而獲得所述核酸內切酶的識別位點。
優選地,對所述多個第一探針的3'端或所述多個第二探針的5'端,或這兩者進行修飾以允許所述多個第一探針與所述多個第二探針的化學連接。
優選地,橋寡核苷酸或多個橋寡核苷酸中的寡核苷酸在與第一探針序列互補的序列,或與第二探針序列互補的序列,或這兩者中包括一個或多個經化學修飾的核苷酸。
優選地,對所述第一探針的3'端或所述第二探針的5'端,或這兩者進行修飾以允許所述第一探針與所述第二探針的化學連接。
優選地,所述第一探針或第二探針的橋接部分,或這兩者,或所述條形碼環狀寡核苷酸、所述橋寡核苷酸或所述多個橋寡核苷酸中的寡核苷酸包括經化學修飾的鹼基,以改進與所述橋寡核苷酸或橋寡核苷酸複合體的結合。
在一個具體實施方式中,容納第一和第二探針組的至少一個容器、容納條形碼環狀寡核苷酸的至少一個容器,和容納橋寡核苷酸或能夠彼此黏合以形成橋寡核苷酸複合體的多個寡核苷酸的至少一個容器是同一容器。在這種情況下,四種或更多種的探針可以預先黏合並形成連接的複合體。
本發明的一個特別的優點是能夠使用獨特的探針設計,來檢測和擴增感興趣的標靶序列。探針被設計為具有引起更高的測定特異性、靈敏度和準確性的改善的結合特性。本發明應用于分子生物學、進化生物學、元基因組學、基因分型領域,更具體地說,但不限於癌症診斷或胎兒染色體疾病,包括但不限於對樣品的一個或多個序列和/或多態性(諸如SNP和/或插入缺失)進行基因分型。
在一個尤其優選的實施方式中,條形碼環狀寡核苷酸包括用於鑑定樣品的信息,並包括獨特的條形碼。在這種情況下,第一和第二探針普遍適用於所有樣品(並且僅包含用於鑑定標靶的信息)。因此,在一個優選的實施方式中,提供了根據本發明的方法或試劑盒,其中條形碼環狀寡核苷酸包括含獨特序列的條形碼,該獨特序列使得能夠列舉每個樣品的標靶序列。
實施例
方法
1、探針複合體的形成
探針複合體包含基因組標靶定向、樣品索引和構建Illumina定序資料庫所需的序列。
能夠形成包括以下的四部分探針複合體(如圖2所示):
(a)第一探針,從分子的5'端起具有第一橋寡核苷酸特異性序列,和位於第一探針的3'端的第一標靶特異性部分;
(b)第二探針,從分子的5'端起具有第二標靶特異性部分、第二序列條形碼和位於第二探針的3'端的第二橋寡核苷酸特異性序列;
(c)橋寡核苷酸,其具有分別與第一探針中的第一橋寡核苷酸特異性序列和第二探針中的第二橋寡核苷酸特異性序列互補的序列;
和(d)環狀寡核苷酸,其具有與橋寡核苷酸互補的序列。
通過在黏合反應中使所有三部分(橋、右臂和左臂)以等摩爾量結合來構建探針複合體。反應在熱循環儀中進行(黏合程序見表 1)。
表1
標靶捕獲
步驟 | 溫度 | 時間 |
1 | +95°C | 5 min |
2 | +95°C | 1 min |
-4°C/循環,到 2 10x | ||
3 | +55°C | 10 min |
4 | +55°C | 1 min |
-5°C/循環,到 5 5x | ||
5 | +4°C | 保持 |
標靶定向含有感興趣突變的特定基因組區域。經純化的DNA(例如來自組織、血漿、尿液或唾液)可以用作樣品,或者樣品可以是未純化的,只是經過預處理,例如煮沸和/或離心。
使探針複合體通過鹼基序列互補作用與標靶區域雜交。為了啟動標靶捕獲,反應探針和標靶DNA混合並在熱循環儀中孵育(標靶捕獲和間隙填補程序見表2)。將預先黏合的條形碼環(帶有每個樣品的特定索引序列)加入到標靶定向反應中。
表2
間隙填補(GapFill)反應
步驟 | 溫度 | 時間 | 過程 |
1 | +85°C | 4 min | 變性 |
2 | +75°C | 2.5 min | |
3 | +65°C | 2.5 min | |
4 | +55°C | 120 min | 標靶捕獲 |
5 | +50°C | 10 min | 間隙填補 |
6 | +45°C | 45 min | |
7 | +4°C | 保持 |
標靶捕獲後,彙集來自不同標靶定向反應的探針複合體,隨後加入Phusion DNA聚合酶、核苷酸和Ampligase DNA連接酶,並在+45°C下孵育45分鐘來延伸和連接。
4、核酸外切酶處理
間隙填補後,通過加入1µl的不耐熱的核酸外切酶1(NEB,#M0568L)和1µl的RecJF 核酸外切酶(NEB,#M0264L),並在+37℃下孵育30分鐘,來去除線性分子。核酸外切酶通過在+92°C下孵育12分鐘來失活。
5、滾環擴增
延伸和連接後,對環形探針分子進行滾環擴增(RCA)。在RCA反應中,將標靶捕獲反應與含EquipPhi29(Thermo Scientific)聚合酶的RCA反應混合物混合。反應在+42°C下孵育30 min至2小時。RCA反應後,通過用Qubit螢光儀測量單鏈DNA(ssDNA)濃度來分析反應效率。
6、酶消化
RCA反應產生長的多聯體ssDNA分子,其具有多個標靶資料庫複製。每個完整的標靶資料庫由EcoRI限制性酶識別序列分隔。該序列通過與含EcoRI限制性酶識別序列的特異性寡核苷酸黏合,能夠對長的多聯體進行序列特異性切割,並釋放出準備好的標靶資料庫。RCA產物在+37°C下用EcoRI消化1小時。
7、資料庫PCR
經消化的RCA產物在PCR反應中延伸到定序資料庫中,其中存在於右探針中的截短定序接頭延伸到流式細胞兼容的全長定序接頭中。
8、資料庫純化
資料庫PCR後,通過電泳後從瓊脂糖凝膠中提取資料庫分子或使用粒徑選擇珠(諸如Macherey Nagel NucleoMag)純化資料庫分子。
9、定序
可使用最先進的定序儀器對經純化的MiSeq或iSeq100兼容資料庫進行序列分析。重要的是,這些資料庫可以通過簡單的寡核苷酸修飾轉換成適合任何現有定序平臺的資料庫。結合使用Unix命令行工具以及Python和R編程語言來處理定序數據。簡而言之,序列處理的原理是鑑定每個讀數中的探針序列,對它們之間的基因組區域進行定序,並對與每個基因標靶相關的分子條形碼的數量進行計數。
實驗1
在第一個實驗中,探針混合物是五個獨立樣品中的4個環狀索引探針複合體的集合,其中前四個樣品具有單一環狀索引,第五個樣品為彙集在一起的1至4樣品。它們標靶定向四個基因融合體。標靶寡核苷酸具有唯一識別序列,允許鑑定每個標靶。
作為樣品,三種合成的標靶寡核苷酸以對數遞增的濃度混合。如上所述進行標靶捕獲、延伸和連接反應、滾環擴增、隨後的EcoRI消化和資料庫製備PCR。圖3是得到的定序資料庫的例子。
用MiSeq和iSeq100儀器對準備好的資料庫進行定序,通過匹配每個讀數中的探針序列、鑑定探針序列之間的基因組序列區域以及對分子條形碼進行計數來檢定序列數據中的標靶區域。計數數據準確地反映了彙集的環狀寡核苷酸分子的比例(圖4)。
圖1和圖2的詳細說明
圖1示出了所描述發明的一個實施方式的工作流程。在步驟1中,使樣品(102)中的核酸(DNA或RNA)與一組連接複合體(104)接觸。連接複合體在標靶核酸(106)上黏合。在步驟2中,從樣品材料可選地捕獲結合標靶的連接複合體,留下樣品雜質(103)。在步驟3中,將來自多個樣品(110)的經連接的連接複合體彙集在一起(112)。在步驟4中,將經黏合的、彙集的連接複合體進行連接,得到經連接的連接複合體。在步驟5中,使用phi29聚合酶或其他鏈置換聚合酶通過滾環擴增來擴增探針序列,得到探針的長的多聯體複製(116)。在步驟6中,使用限制性內切酶(諸如EcoRI)或歸巢核酸酶(諸如I-CeuI)將多聯體探針複製可選地切割為單體單元,並可選地使用PCR或乳液PCR進一步擴增(117)。在步驟7中,使用次世代DNA定序對經擴增的DNA進行定序。在步驟8中,使用生物信息學管線將DNA定序結果轉換為標靶計數。
圖2A示出了根據本文實施方式的探針四件套的原理結構。多個探針實體包括第一探針(202)、第二探針(201)、橋寡核苷酸(200)和條形碼環狀寡核苷酸(217)。此處,探針複合體包含第一探針與條形碼環狀寡核苷酸(210和213)之間、第二探針與條形碼環狀寡核苷酸(207和215)之間以及第一探針與第二探針(203和204)之間的間隙或缺口。通過引入聚合酶和一個或多個核苷酸來填補這些間隙。在此過程中,可使用Stoffel片段、Taq聚合酶或Phusion聚合酶和DNA連接酶(諸如Ampligase)的混合物。聚合酶填補這些間隙,隨後DNA連接酶的作用使探針、橋和條形碼環狀寡核苷酸連接成環形複合體。
第一探針的15-25個鹼基包括橋結合序列(210),該序列可選地包括經化學修飾的鹼基,用於有效橋寡核苷酸結合。第一探針自5'端進一步包括與基因標靶結合的15-30個鹼基(203)。210的一些或全部核苷酸可包括化學修飾,以增加探針對標靶或橋(209)的親和力。第一探針的最後一個鹼基可選地包括用於酶連接的磷酸部或允許化學連接到相鄰探針(205)的5'端的修飾。
第二探針的第一個鹼基可選地包括用於酶連接的磷酸部或允許化學連接到相鄰探針(206)的5'端的修飾。第二探針的5'端的15-30個鹼基包括第二探針的與基因標靶(204)結合的部分。第二探針(207)的最後15-25個鹼基與橋寡核苷酸(208)反向互補。核苷酸203、204、207或210的一些或全部可包括化學修飾,以增加探針對標靶或橋寡核苷酸的親和力。
橋寡核苷酸(209)的5'端的前15-25個鹼基與第一探針的橋寡核苷酸特異性序列(210)反向互補,並可選地包括經化學修飾的核苷酸以增加結合。橋寡核苷酸(208)的最後15-25個鹼基與第二探針的序列(207)反向互補,並可選地包括經化學修飾的核苷酸以增加結合。橋寡核苷酸的5'端可選地包括用於捕獲連接複合體的捕獲部(211)。此外,橋寡核苷酸包括序列214和216,與條形碼環狀寡核苷酸的序列213和215互補。橋寡核苷酸的3'端可選地包括磷酸(或其他可裂解的)部(212),以防止在間隙填補過程中延伸。
條形碼環狀寡核苷酸的5'端的前15-25個鹼基(215)與橋寡核苷酸序列216反向互補。條形碼環狀寡核苷酸包括含條形碼(218)的環狀區域。條形碼環狀寡核苷酸的最後15-25個鹼基(213)與橋寡核苷酸序列214反向互補。
圖2B示出了根據本發明實施方式的具有多個探針實體的探針組的原理結構。探針與圖2A中的那些探針相對應,除了本實施方式包括兩個橋寡核苷酸(200和220),其中橋寡核苷酸200包括209和214,而橋寡核苷酸220包括208和216。
圖2C示出了根據本發明實施方式的具有多個探針實體的探針組的原理結構。探針與圖2A中的那些探針相對應,除了橋寡核苷酸200包括含多個通用鹼基類似物的序列(219),以允許引入適合用作標靶列舉的分子條形碼的隨機序列。可存在一個或兩個所標示的序列219。
圖2D示出了根據本發明實施方式的探針四件套的原理結構。多個探針實體包括第一探針(202)、第二探針(201)、橋寡核苷酸(200)和條形碼環狀寡核苷酸(217)。此處,探針複合體包含第一探針與條形碼環狀寡核苷酸(210和213)之間、第二探針與條形碼環狀寡核苷酸(207和215)之間以及第一探針與第二探針(203和204)之間的間隙。通過引入聚合酶和一個或多個核苷酸來填補這些間隙。在此過程中,可使用Stoffel片段、Taq聚合酶或Phusion聚合酶和DNA連接酶(諸如Ampligase)的混合物。聚合酶填補這些間隙,隨後DNA連接酶的作用使探針、橋和條形碼環狀寡核苷酸連接成環形複合體。
第一探針的15-25個鹼基包括橋結合序列(210),該序列可選地包括經化學修飾的鹼基,用於有效橋接寡核苷酸結合。第一探針進一步包括用於擴增引子的結合位點(221)和條形碼序列(222),以及自5'端起15-30個鹼基與遺傳標靶結合的序列(203)。210的一些或全部核苷酸可包括化學修飾,以增加探針對標靶或橋(209)的親和力。第一探針的最後一個鹼基可選地包括用於酶連接的磷酸部或允許化學連接到相鄰探針(205)的5'端的修飾。
第二探針的第一個鹼基可選地包括用於酶連接的磷酸部或允許化學連接到相鄰探針(206)的5'端的修飾。第二探針的5'端的15-30個鹼基包括第二探針的與基因標靶結合的部分(204)。第二探針進一步包括擴增引子的結合位點(223)、定序接頭序列(224)、限制性核酸內切酶(諸如EcoRI)或歸巢核酸內切酶的識別位點(225)和另一個定序接頭序列(207)。第二探針的最後15-25個鹼基(207)與橋寡核苷酸(208)反向互補。203、204、207或210的一些或全部核苷酸可包括化學修飾,以增加探針對標靶或橋寡核苷酸的親和力。
橋寡核苷酸的5'端的前15-25個鹼基(209)與第一探針的橋寡核苷酸特異性序列(210)反向互補,並可選地包括經化學修飾的核苷酸以增加結合。橋寡核苷酸的最後15-25個鹼基(208)與第二探針的序列(207)反向互補,並可選地包括經化學修飾的核苷酸以增加結合。橋寡核苷酸與條形碼環狀寡核苷酸(220)兩端不反向互補的部分可選地包含限制性核酸內切酶的識別位點,以允許對不含環的結構的酶降解。橋寡核苷酸的5'端可選地包括用於捕獲連接複合體的捕獲部(211)。此外,橋寡核苷酸包括與條形碼環狀寡核苷酸的序列213和215互補的序列214和216。橋寡核苷酸的3'端可選地包括磷酸(或其他可裂解的)部(212),以防止在間隙填補過程中延伸。
條形碼環狀寡核苷酸的5'端的前15-25個鹼基(215)與橋寡核苷酸序列216反向互補。條形碼環狀寡核苷酸包括含條形碼(218)的環狀區域。條形碼環狀寡核苷酸的最後15-25個鹼基(213)與橋寡核苷酸序列214反向互補。
102:樣品
103:雜質
104:複合體
106:標靶核酸
110:樣品
112:彙集在一起
116:多聯體複製
117:擴增
200:核苷酸
201:第二探針
202:第一探針
203:核苷酸
204:核苷酸
205:探針
206:探針
207:核苷酸
208:核苷酸
209:核苷酸
210:核苷酸
211:捕獲部
212:部
213:序列
214:序列
215:序列、核苷酸
216:序列
217:核苷酸
218:條形碼
219:序列
220:核苷酸
3':端
5':端
圖1示出了根據本發明實施方式的多重連接測定(Multiplexed Ligation Assay,MLA)的流程圖。
圖2A、圖2B、圖2C和圖2D示出了根據本發明實施方式的探針的原理組合。
圖3示出了被限制性內切酶消化之前(泳道2)和之後(泳道1)的工作流程中的RCA產物。
圖4示出了通過列舉分子條形碼從次世代DNA定序數據中推斷出來,在四個重複反應中,實驗工作流程對基因標靶數量的對數遞減的線性響應。每行代表標靶序列的三個濃度。在三個數量級上的響應是線性的。
TW202411430A_112132632_SEQL.xml
200:核苷酸
201:第二探針
202:第一探針
203:核苷酸
204:核苷酸
205:探針
206:探針
207:核苷酸
208:核苷酸
209:核苷酸
210:核苷酸
211:捕獲部
212:部
213:序列
214:序列
215:序列、核苷酸
216:序列
217:核苷酸
218:條形碼
219:序列
220:核苷酸
3':端
5':端
Claims (21)
- 一種高通量檢測多個樣品中一個或多個標靶核苷酸序列的方法,所述方法包括以下步驟: (i)為每個樣品中的每個標靶核苷酸序列提供:第一探針、第二探針、條形碼環狀寡核苷酸,和橋寡核苷酸或能夠與所述條形碼環狀寡核苷酸黏合(annealing)以形成橋寡核苷酸複合體的多個橋寡核苷酸,其中 所述第一探針包括位於所述第一探針的5'端的第一橋寡核苷酸特異性序列和位於所述第一探針的3'端的第一標靶特異性部分; 所述第二探針包括位於所述第二探針的5'端的第二標靶特異性部分和位於所述第二探針的3'端的第二橋寡核苷酸特異性序列; 所述條形碼環狀寡核苷酸自分子的5'端起包括第三橋寡核苷酸特異性序列、條形碼環狀序列和第四橋寡核苷酸特異性序列; 所述橋寡核苷酸或多個橋寡核苷酸包括與所述第一探針中的第一橋寡核苷酸特異性序列和所述第二探針中的第二橋寡核苷酸特異性序列互補的序列,和與所述條形碼環狀寡核苷酸中的第三橋寡核苷酸特異性序列和第四橋寡核苷酸特異性序列互補的序列;並且 可選地,所述第一探針、所述第二探針、所述條形碼環狀寡核苷酸、所述橋寡核苷酸或者所述多個橋寡核苷酸的寡核苷酸中的至少一者包括核酸內切酶的識別序列; (ii)對於所述一個或多個標靶核苷酸序列中的每一種,優選對於在單獨管中的每個樣品,使所述第一探針和第二探針與所述條形碼環狀寡核苷酸和所述橋寡核苷酸或多個橋寡核苷酸接觸並允許自黏合為連接複合體; (iii)使存在於待測試所述標靶核苷酸序列的每個樣品中的核酸與所述連接複合體接觸; (iv)允許所述第一探針的第一標靶特異性部分和所述第二探針的第二標靶特異性部分與標靶序列上基本相鄰的區段雜交,從而形成雜交複合體; (v)可選地,將來自所述多個樣品的雜交複合體彙集起來; (vi)將所述雜交複合體中的探針連接起來,以提供經連接的連接複合體; (vii)使用滾環擴增法,用鏈置換聚合酶從一個或多個經連接的連接複合體中擴增核酸,從而獲得單鏈的多聯體序列; (viii)可選地,在存在步驟(i)中指定的識別序列的條件下,進行通過以下方式獲得核酸片段的步驟: (a)切割在步驟(vii)中獲得的單鏈的多聯體序列,或 (b)使在步驟(vii)中獲得的單鏈的多聯體序列與包含核酸內切酶的識別序列的特異性寡核苷酸黏合,其中所述寡核苷酸與步驟(i)中指定的所述識別序列黏合,從而獲得所述核酸內切酶的識別位點,以及用所述核酸內切酶切割經黏合的複合體; (ix)對步驟(vii)中獲得的所述多聯體序列或步驟(viii)中獲得的核酸片段進行高通量定序技術以確定所述條形碼序列;以及 (x)通過確定所述第一標靶特異性部分和/或第二標靶特異性部分的至少一部分,和/或與所述條形碼環狀寡核苷酸中的條形碼對應的條形碼序列的至少一部分,來鑑定所述多個樣品中標靶核苷酸序列的存在和/或數量, 其中,步驟(v)和步驟(vi)可按任何順序進行。
- 如請求項1所述的方法,其中,所述條形碼環狀寡核苷酸含有核酸內切酶,諸如缺口核酸內切酶的一個或多個識別序列。
- 如請求項2所述的方法,其中,所述條形碼環狀寡核苷酸含有能夠相互黏合的兩個識別序列,從而獲得雙鏈核酸內切酶識別位點。
- 如請求項3所述的方法,其中,所述方法不包括權利要求1中指定的步驟(viii),但在步驟(vii)與步驟(ix)之間包括以下步驟:允許所述條形碼環狀寡核苷酸中的兩個識別序列黏合,並用對所述識別位點具有特異性的核酸內切酶,諸如缺口核酸內切酶來裂解所得雙鏈核酸內切酶識別位點。
- 如前述請求項中任一項所述的方法,其中,所述橋寡核苷酸,或者所述多個橋寡核苷酸的一個或多個寡核苷酸包括,在與所述第一探針、第二探針或條形碼環狀寡核苷酸不互補的區域的多個通用鹼基類似物,以允許引入適合用作標靶列舉的分子條形碼的隨機序列,並且其中,作為步驟(vi)的一部分,使用聚合酶和核苷酸進行間隙填充步驟以生成這種隨機序列。
- 如請求項5的方法,其中,所述多個通用鹼基類似物是多個5-硝基吲哚。
- 如前述請求項中任一項所述的方法,其中,所述第一探針、第二探針或橋寡核苷酸或者多個橋寡核苷酸的寡核苷酸進一步包括序列條形碼。
- 如前述請求項中任一項所述的方法,其中 在步驟(v)之後,但在步驟(vii)之前,進行步驟(a)和步驟(b),其中步驟(a)包括允許經連接的連接複合體與所述標靶核苷酸序列解離,並且步驟(b)包括加入標靶特異性探針,所述標靶特異性探針包括與所述標靶核苷酸序列對應的序列,其中所述標靶特異性探針能夠與所述經連接的連接複合體黏合,並允許所述標靶特異性探針與所述經連接的連接複合體黏合,從而形成擴增模板,並且 其中,在步驟(vii)中,用鏈置換聚合酶通過滾環擴增對所述擴增模板進行擴增。
- 如前述請求項中任一項所述的方法,其中,所述第一探針、所述第二探針、所述條形碼環狀寡核苷酸、所述橋寡核苷酸或者所述多個橋寡核苷酸的寡核苷酸中的至少一者包括第一捕獲部,並且其中,在步驟(iv)和步驟(v)之間進行中間步驟(iv)(a),所述中間步驟(iv)(a)包括使雜交複合體與含第二捕獲部的固體支持物接觸,允許所述第一捕獲部與所述第二捕獲部相互作用,從而使得所述雜交複合體與所述固體支持物相連,以及使與固體支持物相連的雜交複合體與樣品中未與所述固體支持物相連的組分分離。
- 如前述請求項中任一項所述的方法,其中,所述多個樣品包括血液樣品、唾液樣品、尿樣品或糞便樣品。
- 如前述請求項中任一項所述的方法,其中,所述橋寡核苷酸或多個橋寡核苷酸的寡核苷酸包括: (i)一至五個3'突出的鹼基,和/或 (ii)3’磷酸,和/或 (iii)從3'端起的三個位置內的一個或多個硫代磷酸酯修飾。
- 如前述請求項中任一項所述的方法,其中,對所述第一探針的3'端或所述第二探針的5'端,或者所述第一探針的3'端和所述第二探針的5'端進行修飾以允許所述第一探針與所述第二探針的化學連接。
- 如前述請求項中任一項所述的方法,其中,所述第一探針或所述第二探針的橋接部分,或者所述第一探針的橋接部分和所述第二探針的橋接部分,或者所述條形碼環狀寡核苷酸、所述橋寡核苷酸或者所述多個橋寡核苷酸中的寡核苷酸包括經化學修飾的鹼基以改進與所述橋寡核苷酸或橋寡核苷酸複合體的結合。
- 如前述請求項中任一項所述的方法,其中,所述第一標靶特異性部分、第二標靶特異性部分、第一橋寡核苷酸特異性序列和/或第二橋寡核苷酸特異性序列,彼此獨立地包含一個或多個經化學修飾的核苷酸。
- 如前述請求項中任一項所述的方法,其中,所述橋寡核苷酸或者所述多個橋寡核苷酸的寡核苷酸,包括一個或多個經化學修飾的核苷酸。
- 如前述請求項中任一項所述的方法,其中,使用phi29聚合酶或Bst聚合酶進行步驟(vii)。
- 如前述請求項中任一項所述的方法,其中,緊鄰步驟(ix)且在步驟(ix)之前,使用與所述第一探針和所述第二探針的通用部分結合的引子進行PCR擴增,其中所述引子可選地包括用於步驟(ix)中的後續定序的接頭。
- 如前述請求項中任一項所述的方法,其中,使用納米孔定序進行步驟(ix)中的定序,其中可選地使用轉座複合體對步驟(vii)中獲得的多聯體序列進行片段化。
- 如前述請求項中任一項所述的方法,其中,通過對每個標靶和每個樣品的分子條形碼的數量進行計數來允許對基因標靶進行列舉。
- 如前述請求項中任一項所述的方法,其中,對於兩個或更多個的樣品或者對於兩個或更多個基因座/等位組合,使用條形碼序列來對樣品的一個或多個序列和/或多態性,諸如SNP和/或插入缺失,進行基因分型。
- 一種包括多個容器的成套的試劑盒,其中,至少一個容器容納一組或多組的第一探針和第二探針,至少一個容器容納條形碼環狀寡核苷酸,並且至少一個容器容納一個或多個橋寡核苷或者能夠與所述條形碼環狀寡核苷酸形成橋寡核苷酸複合體的多個橋寡核苷酸;其中 所述第一探針包括位於所述第一探針的5'端的第一橋寡核苷酸特異性序列和位於所述第一探針的3'端的第一標靶特異性部分; 所述第二探針包括位於所述第二探針的5'端的第二標靶特異性部分和位於所述第二探針的3'端的第二橋寡核苷酸特異性序列; 所述條形碼環狀寡核苷酸自分子的5'端起包括第三橋寡核苷酸特異性序列、條形碼環狀序列和第四橋寡核苷酸特異性序列, 所述橋寡核苷酸或多個橋寡核苷酸包含與所述第一探針中的第一橋寡核苷酸特異性序列和所述第二探針中的第二橋寡核苷酸特異性序列互補的序列,和與所述條形碼環狀寡核苷酸中的第三橋寡核苷酸特異性序列和第四橋寡核苷酸特異性序列互補的序列;並且 可選地,所述第一探針、所述第二探針、所述條形碼環狀寡核苷酸、所述橋寡核苷酸和所述多個橋寡核苷酸的寡核苷酸中的至少一者包括核酸內切酶的識別序列; 可選地,所述成套的試劑盒進一步包括能夠與所述識別序列黏合的寡核苷酸,從而獲得所述核酸內切酶的識別位點。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US17/899,851 US11970736B2 (en) | 2022-08-31 | 2022-08-31 | Methods for accurate parallel detection and quantification of nucleic acids |
US17/899,851 | 2022-08-31 |
Publications (1)
Publication Number | Publication Date |
---|---|
TW202411430A true TW202411430A (zh) | 2024-03-16 |
Family
ID=87845824
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW112132632A TW202411430A (zh) | 2022-08-31 | 2023-08-29 | 準確地平行檢測和定量核酸的方法 |
Country Status (7)
Country | Link |
---|---|
US (2) | US11970736B2 (zh) |
EP (1) | EP4332238A1 (zh) |
JP (1) | JP2024035109A (zh) |
KR (1) | KR20240032630A (zh) |
CN (1) | CN117625764A (zh) |
CA (1) | CA3208897A1 (zh) |
TW (1) | TW202411430A (zh) |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080269068A1 (en) * | 2007-02-06 | 2008-10-30 | President And Fellows Of Harvard College | Multiplex decoding of sequence tags in barcodes |
GB201621514D0 (en) | 2016-12-16 | 2017-02-01 | Q-Linea Ab | Padlock probe detection method |
EP3447152A1 (en) * | 2017-08-25 | 2019-02-27 | Eawag, Swiss Federal Institute of Aquatic Science and Technology | Accurate and massively parallel quantification of nucleic acid |
-
2022
- 2022-08-31 US US17/899,851 patent/US11970736B2/en active Active
-
2023
- 2023-08-10 CA CA3208897A patent/CA3208897A1/en active Pending
- 2023-08-10 JP JP2023131128A patent/JP2024035109A/ja active Pending
- 2023-08-16 KR KR1020230107251A patent/KR20240032630A/ko unknown
- 2023-08-16 CN CN202311034878.2A patent/CN117625764A/zh active Pending
- 2023-08-25 EP EP23193551.1A patent/EP4332238A1/en active Pending
- 2023-08-29 TW TW112132632A patent/TW202411430A/zh unknown
-
2024
- 2024-03-21 US US18/612,232 patent/US20240254551A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
US20240254551A1 (en) | 2024-08-01 |
US20240068022A1 (en) | 2024-02-29 |
EP4332238A1 (en) | 2024-03-06 |
CN117625764A (zh) | 2024-03-01 |
US11970736B2 (en) | 2024-04-30 |
CA3208897A1 (en) | 2024-02-29 |
JP2024035109A (ja) | 2024-03-13 |
KR20240032630A (ko) | 2024-03-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230340564A1 (en) | Accurate and massively parallel quantification of nucleic acid | |
JP2019176867A (ja) | 核酸プローブ及びゲノム断片検出方法 | |
US11486003B2 (en) | Highly sensitive methods for accurate parallel quantification of nucleic acids | |
US11898202B2 (en) | Methods for accurate parallel quantification of nucleic acids in dilute or non-purified samples | |
US11970736B2 (en) | Methods for accurate parallel detection and quantification of nucleic acids | |
EP4332235A1 (en) | Highly sensitive methods for accurate parallel quantification of variant nucleic acids | |
EP4215619A1 (en) | Methods for sensitive and accurate parallel quantification of nucleic acids |