KR20230069135A - 헤어핀 어댑터를 사용하여 시퀀싱 라이브러리에서 표적 서열을 농축시키는 방법 - Google Patents
헤어핀 어댑터를 사용하여 시퀀싱 라이브러리에서 표적 서열을 농축시키는 방법 Download PDFInfo
- Publication number
- KR20230069135A KR20230069135A KR1020237011164A KR20237011164A KR20230069135A KR 20230069135 A KR20230069135 A KR 20230069135A KR 1020237011164 A KR1020237011164 A KR 1020237011164A KR 20237011164 A KR20237011164 A KR 20237011164A KR 20230069135 A KR20230069135 A KR 20230069135A
- Authority
- KR
- South Korea
- Prior art keywords
- sequence
- double
- primer
- stranded
- adapter
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 218
- 238000012163 sequencing technique Methods 0.000 title claims abstract description 105
- 238000003199 nucleic acid amplification method Methods 0.000 claims abstract description 227
- 230000003321 amplification Effects 0.000 claims abstract description 226
- 150000007523 nucleic acids Chemical group 0.000 claims abstract description 208
- 239000012634 fragment Substances 0.000 claims abstract description 184
- 230000000295 complement effect Effects 0.000 claims abstract description 157
- 230000000694 effects Effects 0.000 claims abstract description 63
- 108020004707 nucleic acids Proteins 0.000 claims description 185
- 102000039446 nucleic acids Human genes 0.000 claims description 185
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 claims description 96
- 108060002716 Exonuclease Proteins 0.000 claims description 63
- 102000013165 exonuclease Human genes 0.000 claims description 63
- 239000002773 nucleotide Substances 0.000 claims description 56
- 125000003729 nucleotide group Chemical group 0.000 claims description 55
- 229940035893 uracil Drugs 0.000 claims description 48
- 108091008146 restriction endonucleases Proteins 0.000 claims description 35
- 108020004414 DNA Proteins 0.000 claims description 31
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 25
- 102000004190 Enzymes Human genes 0.000 claims description 22
- 108090000790 Enzymes Proteins 0.000 claims description 22
- 238000003776 cleavage reaction Methods 0.000 claims description 21
- 230000007017 scission Effects 0.000 claims description 21
- 238000002844 melting Methods 0.000 claims description 18
- 230000008018 melting Effects 0.000 claims description 18
- 230000027455 binding Effects 0.000 claims description 16
- 239000000203 mixture Substances 0.000 claims description 15
- 239000011541 reaction mixture Substances 0.000 claims description 14
- 239000003153 chemical reaction reagent Substances 0.000 claims description 12
- 239000011324 bead Substances 0.000 claims description 10
- 238000006073 displacement reaction Methods 0.000 claims description 9
- 102000004099 Deoxyribonuclease (Pyrimidine Dimer) Human genes 0.000 claims description 8
- 108010082610 Deoxyribonuclease (Pyrimidine Dimer) Proteins 0.000 claims description 8
- 102000006943 Uracil-DNA Glycosidase Human genes 0.000 claims description 8
- 108010072685 Uracil-DNA Glycosidase Proteins 0.000 claims description 8
- 238000000137 annealing Methods 0.000 claims description 7
- 230000029087 digestion Effects 0.000 claims description 7
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 claims description 6
- 230000002441 reversible effect Effects 0.000 claims description 6
- 239000007790 solid phase Substances 0.000 claims description 6
- 238000004925 denaturation Methods 0.000 claims description 5
- 230000036425 denaturation Effects 0.000 claims description 5
- 101150010487 are gene Proteins 0.000 claims description 3
- 229940104302 cytosine Drugs 0.000 claims description 3
- 238000004519 manufacturing process Methods 0.000 claims 1
- 108010068698 spleen exonuclease Proteins 0.000 abstract 1
- 239000000523 sample Substances 0.000 description 22
- 238000006243 chemical reaction Methods 0.000 description 13
- 238000001514 detection method Methods 0.000 description 11
- 108091093088 Amplicon Proteins 0.000 description 9
- 102000008579 Transposases Human genes 0.000 description 8
- 108010020764 Transposases Proteins 0.000 description 8
- 238000003752 polymerase chain reaction Methods 0.000 description 8
- 102000053602 DNA Human genes 0.000 description 6
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 6
- 108091034117 Oligonucleotide Proteins 0.000 description 5
- 230000008901 benefit Effects 0.000 description 5
- 238000012175 pyrosequencing Methods 0.000 description 5
- 239000007787 solid Substances 0.000 description 5
- 108090000364 Ligases Proteins 0.000 description 4
- 102000003960 Ligases Human genes 0.000 description 4
- 238000010276 construction Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000010348 incorporation Methods 0.000 description 4
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 3
- ZKHQWZAMYRWXGA-KQYNXXCUSA-J ATP(4-) Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)[C@H]1O ZKHQWZAMYRWXGA-KQYNXXCUSA-J 0.000 description 3
- ZKHQWZAMYRWXGA-UHFFFAOYSA-N Adenosine triphosphate Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)C(O)C1O ZKHQWZAMYRWXGA-UHFFFAOYSA-N 0.000 description 3
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 3
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 3
- 238000012408 PCR amplification Methods 0.000 description 3
- 238000003556 assay Methods 0.000 description 3
- 239000012530 fluid Substances 0.000 description 3
- 238000002866 fluorescence resonance energy transfer Methods 0.000 description 3
- 238000007403 mPCR Methods 0.000 description 3
- 230000001404 mediated effect Effects 0.000 description 3
- 108091033319 polynucleotide Proteins 0.000 description 3
- 102000040430 polynucleotide Human genes 0.000 description 3
- 239000002157 polynucleotide Substances 0.000 description 3
- 108090000623 proteins and genes Proteins 0.000 description 3
- 229940113082 thymine Drugs 0.000 description 3
- 241000894006 Bacteria Species 0.000 description 2
- 102000004594 DNA Polymerase I Human genes 0.000 description 2
- 108010017826 DNA Polymerase I Proteins 0.000 description 2
- 108010042407 Endonucleases Proteins 0.000 description 2
- 102000004533 Endonucleases Human genes 0.000 description 2
- 208000035977 Rare disease Diseases 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000013467 fragmentation Methods 0.000 description 2
- 238000006062 fragmentation reaction Methods 0.000 description 2
- 238000011901 isothermal amplification Methods 0.000 description 2
- 230000008774 maternal effect Effects 0.000 description 2
- 239000012071 phase Substances 0.000 description 2
- UEZVMMHDMIWARA-UHFFFAOYSA-M phosphonate Chemical compound [O-]P(=O)=O UEZVMMHDMIWARA-UHFFFAOYSA-M 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 230000017105 transposition Effects 0.000 description 2
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- 241000251468 Actinopterygii Species 0.000 description 1
- 241000269350 Anura Species 0.000 description 1
- 241000219195 Arabidopsis thaliana Species 0.000 description 1
- 241000239290 Araneae Species 0.000 description 1
- 235000007319 Avena orientalis Nutrition 0.000 description 1
- 244000075850 Avena orientalis Species 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 235000014698 Brassica juncea var multisecta Nutrition 0.000 description 1
- 235000006008 Brassica napus var napus Nutrition 0.000 description 1
- 240000000385 Brassica napus var. napus Species 0.000 description 1
- 235000006618 Brassica rapa subsp oleifera Nutrition 0.000 description 1
- 235000004977 Brassica sinapistrum Nutrition 0.000 description 1
- IEFMEURWCRZZJQ-UHFFFAOYSA-N CPH4 Chemical compound N1=C(C(O)=O)CNC2=NC(N)=NC(O)=C21 IEFMEURWCRZZJQ-UHFFFAOYSA-N 0.000 description 1
- 241000244203 Caenorhabditis elegans Species 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 241000700198 Cavia Species 0.000 description 1
- 241000195597 Chlamydomonas reinhardtii Species 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- 241000195493 Cryptophyta Species 0.000 description 1
- 241000252212 Danio rerio Species 0.000 description 1
- 241000168726 Dictyostelium discoideum Species 0.000 description 1
- 241000255925 Diptera Species 0.000 description 1
- 241000255601 Drosophila melanogaster Species 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 244000068988 Glycine max Species 0.000 description 1
- 235000010469 Glycine max Nutrition 0.000 description 1
- 241000711549 Hepacivirus C Species 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000927847 Homo sapiens DNA ligase 3 Proteins 0.000 description 1
- 241000725303 Human immunodeficiency virus Species 0.000 description 1
- 241000257303 Hymenoptera Species 0.000 description 1
- 241000270322 Lepidosauria Species 0.000 description 1
- 102100022173 Leucine-rich repeats and immunoglobulin-like domains protein 2 Human genes 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 241000202934 Mycoplasma pneumoniae Species 0.000 description 1
- 241000244206 Nematoda Species 0.000 description 1
- 108700019961 Neoplasm Genes Proteins 0.000 description 1
- 102000048850 Neoplasm Genes Human genes 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 239000012807 PCR reagent Substances 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 108091000080 Phosphotransferase Proteins 0.000 description 1
- 241000223960 Plasmodium falciparum Species 0.000 description 1
- 241000233872 Pneumocystis carinii Species 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 241000235347 Schizosaccharomyces pombe Species 0.000 description 1
- 240000006394 Sorghum bicolor Species 0.000 description 1
- 235000011684 Sorghum saccharatum Nutrition 0.000 description 1
- 241000191967 Staphylococcus aureus Species 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 102000004523 Sulfate Adenylyltransferase Human genes 0.000 description 1
- 108010022348 Sulfate adenylyltransferase Proteins 0.000 description 1
- 241001441722 Takifugu rubripes Species 0.000 description 1
- 241000255588 Tephritidae Species 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 244000098338 Triticum aestivum Species 0.000 description 1
- 208000034940 Undiagnosed disease Diseases 0.000 description 1
- 241000726445 Viroids Species 0.000 description 1
- 241000269368 Xenopus laevis Species 0.000 description 1
- 240000008042 Zea mays Species 0.000 description 1
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 1
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000000889 atomisation Methods 0.000 description 1
- 238000003339 best practice Methods 0.000 description 1
- 239000012472 biological sample Substances 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000001311 chemical methods and process Methods 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 235000005822 corn Nutrition 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 1
- 235000011180 diphosphates Nutrition 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 238000001976 enzyme digestion Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000007672 fourth generation sequencing Methods 0.000 description 1
- 238000003205 genotyping method Methods 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 238000011528 liquid biopsy Methods 0.000 description 1
- 238000000504 luminescence detection Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 230000009871 nonspecific binding Effects 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 239000011148 porous material Substances 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- 238000009598 prenatal testing Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 238000010008 shearing Methods 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000005945 translocation Effects 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 238000007482 whole exome sequencing Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1068—Template (nucleic acid) mediated chemical library synthesis, e.g. chemical and enzymatical DNA-templated organic molecule synthesis, libraries prepared by non ribosomal polypeptide synthesis [NRPS], DNA/RNA-polymerase mediated polypeptide synthesis
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2521/00—Reaction characterised by the enzymatic activity
- C12Q2521/30—Phosphoric diester hydrolysing, i.e. nuclease
- C12Q2521/301—Endonuclease
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2521/00—Reaction characterised by the enzymatic activity
- C12Q2521/30—Phosphoric diester hydrolysing, i.e. nuclease
- C12Q2521/319—Exonuclease
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2521/00—Reaction characterised by the enzymatic activity
- C12Q2521/50—Other enzymatic activities
- C12Q2521/531—Glycosylase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2525/00—Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
- C12Q2525/10—Modifications characterised by
- C12Q2525/155—Modifications characterised by incorporating/generating a new priming site
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2525/00—Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
- C12Q2525/10—Modifications characterised by
- C12Q2525/191—Modifications characterised by incorporating an adaptor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2525/00—Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
- C12Q2525/30—Oligonucleotides characterised by their secondary structure
- C12Q2525/301—Hairpin oligonucleotides
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2525/00—Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
- C12Q2525/30—Oligonucleotides characterised by their secondary structure
- C12Q2525/313—Branched oligonucleotides
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2535/00—Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
- C12Q2535/122—Massive parallel sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2537/00—Reactions characterised by the reaction format or use of a specific feature
- C12Q2537/10—Reactions characterised by the reaction format or use of a specific feature the purpose or use of
- C12Q2537/159—Reduction of complexity, e.g. amplification of subsets, removing duplicated genomic regions
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Genetics & Genomics (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Analytical Chemistry (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Biochemistry (AREA)
- Physics & Mathematics (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Immunology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Plant Pathology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
이중 가닥 핵산 단편을 포함하는 시퀀싱 라이브러리를 농축시키는 방법으로서, 이중 가닥 단편의 말단에 하나 이상의 어댑터를 갖는 이중 가닥 단편의 라이브러리를 제작하는 단계; 이중 가닥 단편을 변성시켜 단일 가닥 단편을 형성하는 단계; 및 이중 가닥 단편의 라이브러리 내 적어도 하나의 삽입체의 표적 서열에 결합하고, 비표적 서열에 결합하지 않는 연장 프라이머를 혼성화시키는 단계를 포함하는 방법이 본원에 개시된다. 일 구현예에서, 어댑터는 헤어핀 어댑터이며, 5'→3' 엑소뉴클레아제 활성을 갖는 폴리머라아제를 사용하여 연장 프라이머로부터 연장시켜 증폭 프라이머 서열에 적어도 부분적으로 상보적인 헤어핀 어댑터의 서열의 전부 또는 일부를 제거한다.
Description
관련 출원의 교차 참조
본 출원은 2020년 9월 11일자 출원된 "METHODS OF ENRICHING A TARGET SEQUENCE FROM A SEQUENCING LIBRARY USING HAIRPIN ADAPTORS"라는 발명의 명칭의 미국 임시 출원 제63/077,271호에 대한 우선권 및 이익을 주장하며, 상기 문헌의 개시내용은 그 전문이 본원에 참조로 인용된다.
서열 목록
본 출원은 ASCII 형식으로 전자문서로 제출된 서열목록을 포함하며, 이는 그 전체가 본원에 참조로 인용된다. 2021년 9월 8일자 생성된 상기 ASCII 사본의 명칭은 IP-2043-PCT_SL.txt이고, 크기는 806바이트이다.
기술분야
본 개시내용은 헤어핀 어댑터를 사용하여 시퀀싱 라이브러리에서 표적 서열을 농축시키는 제작에 관한 것이다.
시퀀싱 라이브러리에서 표적 서열을 농축시키는 것은 느리고 복잡한 워크플로우에 의해 방해를 받을 수 있다. 예를 들어, 혼성화 포획 방법을 사용한 라이브러리 농축은 혼성화 포획 단계 전 전체 라이브러리의 증폭을 필요로 한다. 또한, 표적화된 증폭을 이용한 통상의 농축 방식은 단편 말단 정보를 손실할 수 있다.
본 발명의 방법은 시퀀싱 라이브러리에서 표적 서열을 농축시키기 위해 헤어핀 어댑터를 사용한다. 일부 경우에, 단일 증폭 단계로 시퀀싱 라이브러리에서 표적 서열을 농축시킬 수 있다. 헤어핀 어댑터를 이용하는 이러한 방법은 무세포 DNA의 분석과 단편 중복제거 접근법에 도움이 될 수 있는 단편 말단 정보의 손실을 회피할 수 있다.
상세한 설명에 따르면, 이중 가닥 라이브러리 단편의 한쪽 또는 양쪽 가닥의 5' 말단에서 헤어핀 어댑터를 사용하여 시퀀싱 라이브러리에서 표적 서열을 농축시키는 방법이 본원에 기재된다. 분기형(forked) 어댑터, 및 분기형 어댑터를 이용하여 시퀀싱 라이브러리를 생성하는 방법 및 이를 위한 키트가 또한 본원에 기재된다.
핵산 시퀀싱 라이브러리를 제작하는 데 사용되는 어댑터로서, 5' 말단과 3' 말단을 갖는 제1 서열과, 5' 말단과 3' 말단을 갖는 제2 서열을 포함하며; 여기서 제1 서열의 3' 말단의 일부와 제2 서열의 5' 말단의 일부는 상보적이며, 함께 제1 이중 가닥 영역을 형성하고; 제1 서열의 5' 말단의 일부와 제2 서열의 3' 말단의 일부는 비상보적이고; 제1 가닥의 5' 말단 부분은 제2 이중 가닥 영역을 포함하는 어댑터가 본원에 개시된다.
일부 구현예에서, 제2 이중 가닥 영역은 헤어핀 구조이다. 일부 구현예에서, 제2 이중 가닥 영역은 비핵산 부분을 포함한다. 일부 구현예에서, 비핵산 부분은 링커이다. 일부 구현예에서, 제1 가닥의 5' 말단은 엑소뉴클레아제에 의해 분해되지 않는 부분을 포함한다. 일부 구현예에서, 제1 이중 가닥 영역은 적어도 5개의 연속된 뉴클레오타이드이다. 일부 구현예에서, 제2 이중 가닥 영역은 적어도 5개의 연속된 뉴클레오타이드이다. 일부 구현예에서, 제2 가닥의 5' 말단은 인산화된다. 일부 구현예에서, 제1 가닥과 제2 가닥의 모든 시토신 염기는 메틸화된다. 일부 구현예에서, 어댑터는 포획 모이어티를 추가로 포함한다.
핵산 시퀀싱 라이브러리를 제작하는 방법으로서, 복수의 이중 가닥 핵산 단편을 생성하는 단계와, 하나 이상의 분기형 어댑터를 복수의 이중 가닥 핵산 단편의 적어도 하나의 말단에 부착시키는 단계를 포함하는 방법이 또한 본원에 개시된다. 일부 구현예에서, 어댑터는 태그먼트화(tagmentation)를 통해 부착된다. 일부 구현예에서, 어댑터는 결찰을 통해 부착된다.
핵산 시퀀싱 라이브러리를 제작하기 위한 키트로서, 분기형 어댑터; 어댑터의 일부와 혼성화 가능한 적어도 하나의 프라이머; 적어도 하나의 효소; 및 dNTP를 포함하는 키트가 또한 본원에 기재된다.
일부 구현예에서, 적어도 하나의 효소는 엑소뉴클레아제 활성을 갖는다. 일부 구현예에서, 적어도 하나의 효소는 폴리머라아제이다. 일부 구현예에서, 적어도 하나의 구성요소는 동결건조된 또는 건조된 형태이다.
이중 가닥 단편의 시퀀싱 라이브러리에서 표적 서열을 농축시키는 방법으로서, 시퀀싱 라이브러리를 제작하는 단계(여기서, 각각의 단편은 이중 가닥 핵산을 포함하는 삽입체(insert)와, 이중 가닥 단편의 한쪽 또는 양쪽 가닥의 5' 말단에 있는 헤어핀 어댑터를 포함하고, 여기서 헤어핀 어댑터는 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열을 포함함); 이중 가닥 단편을 변성시켜 단일 가닥 단편을 형성하는 단계; 및 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제를 사용하여, 시퀀싱 라이브러리 내 적어도 하나의 삽입체에 포함된 표적 서열에 결합하는 연장 프라이머를 사용하여 핵산 가닥을 생성하고, 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열의 전부 또는 일부를 제거하는 단계를 포함하는 방법이 본원에 개시된다.
일부 구현예에서, 상기 방법은 증폭 프라이머 서열에 결합하는 증폭 프라이머를 사용하여 단편을 증폭시키는 단계를 추가로 포함한다.
일부 구현예에서, 헤어핀 어댑터는 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열 사이에 링커를 추가로 포함한다. 일부 구현예에서, 상기 링커는 엑소뉴클레아제에 의해 분해되지 않는다.
일부 구현예에서, 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제는 Taq이다. 일부 구현예에서, 연장 프라이머 및/또는 연장 프라이머를 사용하여 핵산 가닥을 생성하는 데 사용되는 폴리머라아제는 연장 후 제거된다. 일부 구현예에서, 연장 프라이머 및/또는 연장 프라이머를 사용하여 핵산 가닥을 생성하는 데 사용되는 폴리머라아제의 제거는, 고체상 가역적 고정화(SPRI: solid-phase reversible immobilization) 비드 및/또는 열감응성 폴리머라아제의 변성을 이용하여 이루어진다.
일부 구현예에서, 연장 프라이머를 사용하여 핵산 가닥을 생성하는 단계는 우라실을 포함하는 반응 혼합물을 이용하여 수행된다. 일부 구현예에서, 우라실을 포함하는 반응 혼합물을 이용하여 생성된 핵산 가닥은 하나 이상의 우라실 특이적 절단 시약(USER: uracil-specific excision reagent)에 의해 절단된다. 일부 구현예에서, USER은 우라실 DNA 글리코실라아제 및 엔도뉴클레아제 VIII이다. 일부 구현예에서, USER은 우라실 DNA 글리코실라아제 및 엔도뉴클레아제 VIII의 활성을 갖는 단일 효소이다.
일부 구현예에서, 라이브러리 내 복수의 이중 가닥 단편은 표적 서열을 포함하지 않는다. 일부 구현예에서, 상기 헤어핀 어댑터는 어댑터 서열에 적어도 부분적으로 상보적인 서열의 전부 또는 일부가 존재하는 라이브러리의 이중 가닥 단편에 포함되어 있다. 일부 구현예에서, 상기 방법은, 표적 서열을 포함하지 않는 라이브러리 내 복수의 이중 가닥 단편에서, 제한 엔도뉴클레아제를 이용하여 헤어핀 어댑터를 절단하는 단계를 추가로 포함한다.
일부 구현예에서, 우라실을 포함하는 반응 혼합물을 이용하여 생성된 핵산 가닥은 제한 엔도뉴클레아제 소화에 대해 저항성이 있다. 일부 구현예에서, 우라실을 핵산 가닥에 혼입시키면 이전에 제한 엔도뉴클레아제 절단 부위였던 서열이 변경되어, 이러한 가닥과 이의 상보체를 절단으로부터 보호한다. 일부 구현예에서, 제한 엔도뉴클레아제는 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열의 회합에 의해 형성된 이중 가닥 핵산에서 절단한다.
이중 가닥 단편의 시퀀싱 라이브러리에서 표적 서열을 농축시키는 방법으로서, 시퀀싱 라이브러리를 제작하는 단계(여기서, 각각의 단편은 이중 가닥 핵산을 포함하는 삽입체와, 이중 가닥 단편의 한쪽 또는 양쪽 가닥의 5' 말단에 있는 헤어핀 어댑터를 포함하고, 여기서 헤어핀 어댑터는 뉴클레오타이드 서열의 제1 세트(여기서, 뉴클레오타이드 서열의 제1 세트는 어댑터 서열과 어댑터 서열에 적어도 부분적으로 상보적인 서열을 포함함); 뉴클레오타이드 서열의 제2 세트(여기서, 뉴클레오타이드 서열의 제2 세트는 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열을 포함하며, 여기서 뉴클레오타이드 서열의 제1 세트는 뉴클레오타이드 서열의 제2 세트보다 삽입체에 더 가까움); 및 어댑터 서열에 적어도 부분적으로 상보적인 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열 사이의 링커를 포함함); 이중 가닥 단편을 변성시켜 단일 가닥 단편을 형성하는 단계; 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제를 사용하여, (1) 시퀀싱 라이브러리 내 적어도 하나의 삽입체에 포함된 표적 서열에 결합하는 제1 연장 프라이머를 사용하여 핵산 가닥을 생성하고(여기서, 핵산 가닥을 생성하기 위한 반응 혼합물은 우라실을 포함함), (2) 어댑터 서열에 적어도 부분적으로 상보적인 서열의 전부 또는 일부를 제거하는 단계; 제1 연장 프라이머를 제거하는 단계; USER을 제공하는 단계; 및 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제를 사용하여, (1) 이중 가닥 단편의 라이브러리 내 적어도 하나의 삽입체에 포함된 표적 서열에 결합하는 제2 연장 프라이머를 사용하여 핵산 가닥을 생성하고, (2) 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열의 전부 또는 일부를 제거하는 단계를 포함하는 방법이 또한 본원에 개시된다.
일부 구현예에서, 상기 방법은 증폭 프라이머 서열에 결합하는 증폭 프라이머를 사용하여 단편을 증폭시키는 단계를 추가로 포함한다. 일부 구현예에서, 증폭 프라이머 서열의 상보체 및/또는 어댑터 서열에 적어도 부분적으로 상보적인 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열 사이의 링커는 엑소뉴클레아제에 의해 분해되지 않는다.
일부 구현예에서, 증폭 프라이머 서열의 상보체 및/또는 어댑터 서열에 적어도 부분적으로 상보적인 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열 사이의 링커는 우라실을 포함한다.
일부 구현예에서, 상기 방법은 제1 프라이머를 사용하여 핵산 가닥을 생성한 후 제한 엔도뉴클레아제를 이용하여 헤어핀 어댑터를 절단하는 단계를 추가로 포함하며, 여기서 상기 헤어핀 어댑터는 어댑터 서열에 적어도 부분적으로 상보적인 서열의 전부 또는 일부가 존재하는 라이브러리의 이중 가닥 단편에 포함되어 있다.
일부 구현예에서, 헤어핀 어댑터는 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열 사이에 링커를 추가로 포함한다.
일부 구현예에서, USER은 제1 프라이머 연장에 의해 생성된 핵산 가닥, 헤어핀 어댑터에 포함된 링커 및/또는 어댑터 서열에 적어도 부분적으로 상보적인 서열을 절단한다.
일부 구현예에서, 제1 연장 프라이머와 제2 연장 프라이머는 상이한 서열에 결합한다. 일부 구현예에서, 제1 연장 프라이머와 제2 연장 프라이머는 이중 가닥 핵산의 동일한 가닥에 결합한다.
일부 구현예에서, 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제는 Taq이다. 일부 구현예에서, 폴리머라아제는 단편을 증폭시키는 단계 전에 제거된다.
일부 구현예에서, 제2 연장 프라이머는 상기 프라이머를 사용하여 핵산 가닥을 생성한 후에 제거된다. 일부 구현예에서, 폴리머라아제 및/또는 제2 연장 프라이머는 SPRI 비드를 사용하고/하거나 열감응성 폴리머라아제를 변성시키는 방식으로 제거된다.
이중 가닥 단편의 시퀀싱 라이브러리에서 표적 서열을 농축시키는 방법으로서, 시퀀싱 라이브러리를 제작하는 단계(여기서, 각각의 단편은 이중 가닥 핵산을 포함하는 삽입체와, 이중 가닥 단편의 한쪽 또는 양쪽 가닥의 5' 말단에 있는 헤어핀 어댑터를 포함하고, 여기서 헤어핀 어댑터는 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열을 포함함); 이중 가닥 단편을 변성시켜 단일 가닥 단편을 형성하는 단계; 프라이머 믹스와, 5'-3' 엑소뉴클레아제 활성 없이 결찰 활성과 폴리머라아제 활성을 갖는 효소 또는 효소들을 사용하여, (1) 프라이머 믹스의 제1 연장 프라이머를 사용하여 핵산 가닥을 생성하고(여기서, 프라이머 믹스는 제1 연장 프라이머와 차단된 제2 연장 프라이머를 포함하고, 여기서 제1 연장 프라이머와 차단된 제2 연장 프라이머는 이중 가닥 핵산에 포함된 상이한 관심 서열에 결합함), (2) 제1 연장 프라이머를 사용하여 생성된 핵산 가닥을 차단된 제2 연장 프라이머에 결찰시키는 단계; 삽입체에 결합되지 않은 프라이머 믹스를 제거하는 단계; 차단된 제2 연장 프라이머를 차단 해제하는 단계; 및 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제를 사용하여, (1) 결찰된 제1 연장 프라이머와 제2 연장 프라이머를 사용하여 핵산 가닥을 생성하고, (2) 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열의 전부 또는 일부를 제거하는 단계를 포함하는 방법이 또한 본원에 개시된다.
이중 가닥 단편의 시퀀싱 라이브러리에서 표적 서열을 농축시키는 방법이 또한 본원에 개시된다. 상기 방법은 시퀀싱 라이브러리를 제작하는 단계를 포함하며, 여기서 이중 가닥 단편의 각각의 단편은 말단 어댑터 사이에 배치된 삽입체를 포함하고, 여기서 각각의 말단 어댑터는 뉴클레오타이드 서열의 제1 세트(여기서, 뉴클레오타이드 서열의 제1 세트는 어댑터 서열과 어댑터 서열에 적어도 부분적으로 상보적인 서열을 포함함)와, 뉴클레오타이드 서열의 제1 세트의 3' 말단에서부터 멀리 연장되는 증폭 프라이머 서열을 포함한다. 상기 방법은 또한 이중 가닥 단편을 변성시켜 분리된 가닥을 형성하는 단계(각각의 분리된 가닥은 삽입체의 단일 가닥 부분을 포함함); 서열 특이적 연장 프라이머를 삽입체의 단일 가닥 부분 내 상보적 서열에 어닐링하는 단계; 어닐링된 연장 프라이머에서 상보적 가닥을 연장시켜 이중 가닥 말단을 갖는 상보적 가닥과 분리된 가닥의 듀플렉스(duplex)를 형성하는 단계(여기서, 이중 가닥 말단은 상보적 가닥의 3' 말단과 분리된 가닥의 5' 말단을 포함함); 이중 가닥 어댑터를 듀플렉스의 각각의 이중 가닥 말단에 결찰시키는 단계; 듀플렉스를 변성시키는 단계; 및 듀플렉스의 변성된 가닥을 증폭시켜 증폭된 생성물을 생성하는 단계를 포함한다.
일부 구현예에서, 차단된 제2 연장 프라이머는, 차단 해제되지 않는 한, 핵산 가닥을 생성할 수 없다. 일부 구현예에서, 차단된 제2 연장 프라이머는 제1 연장 프라이머에 의해 결합된 서열의 5' 및 적어도 하나의 삽입체에 포함된 표적 서열에 결합한다. 일부 구현예에서, 차단된 제2 연장 프라이머는 60℃ 미만의 용융 온도로 삽입체에 결합한다. 일부 구현예에서, 결찰된 제1 연장 프라이머와 제2 연장 프라이머를 사용하여 핵산 가닥을 생성하는 단계는 60℃ 이상의 온도에서 수행된다. 일부 구현예에서, 결찰된 제1 연장 프라이머와 제2 연장 프라이머의 어닐링 및 연장 온도는 제2 연장 프라이머의 용융 온도보다 높다. 일부 구현예에서, 제2 연장 프라이머는 증폭시키는 단계 전에 제거된다. 일부 구현예에서, 제2 연장 프라이머는 SPRI 비드 또는 엑소뉴클레아제를 사용하여 제거된다.
일부 구현예에서, 하나 이상의 연장 프라이머는 유전자 특이적 프라이머이다.
일부 구현예에서, 헤어핀 어댑터는 이중 가닥 단편의 한쪽 가닥의 5' 말단에 있다. 일부 구현예에서, 헤어핀 어댑터는 이중 가닥 단편의 양쪽 가닥의 5' 말단에 있다. 일부 구현예에서, 헤어핀 어댑터는 결찰 또는 태그먼트화에 의해 혼입된다. 일부 구현예에서, 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열은 각각 적어도 14개의 뉴클레오타이드를 포함한다. 일부 구현예에서, 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열은 각각 14개 내지 60개의 뉴클레오타이드를 포함한다. 일부 구현예에서, 헤어핀 어댑터는 안정성을 증가시키기 위한 하나 이상의 증강을 포함한다. 일부 구현예에서, 헤어핀 어댑터는 하나 이상의 변형된 또는 잠금된 핵산을 포함한다. 일부 구현예에서, 변형된 핵산은 8-아자-7-데아자구아노신을 포함한다. 일부 구현예에서, 헤어핀 어댑터는 60℃ 이상, 65℃ 이상 또는 70℃ 이상의 온도에서 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열의 회합을 유지한다.
일부 구현예에서, 증폭 프라이머 서열은 A14, A14', B15 또는 B15' 서열을 포함한다. 일부 구현예에서, 증폭 프라이머 서열이 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열과 회합되어 있을 때, 증폭 프라이머는 헤어핀 어댑터에 포함된 증폭 프라이머 서열에 결합할 수 없다. 일부 구현예에서, 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열은 증폭 프라이머 서열의 상보체와 50% 이상, 60% 이상, 70% 이상, 80% 이상, 90% 이상, 95% 이상 또는 99% 이상의 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열은 증폭 프라이머 서열의 상보체를 포함한다.
일부 구현예에서, 이중 가닥 단편의 한쪽 또는 양쪽 가닥은 헤어핀 어댑터의 3'에 하나 이상의 추가 어댑터를 포함한다. 일부 구현예에서, 이중 가닥 단편은 한쪽 또는 양쪽 가닥의 3' 말단에 하나 이상의 어댑터를 포함한다. 일부 구현예에서, 헤어핀 어댑터의 3'에 있는 하나 이상의 추가 어댑터 및/또는 한쪽 또는 양쪽 가닥의 3' 말단에 있는 하나 이상의 어댑터는 프라이머 서열, 인덱스 태그 서열, 포획 서열, 바코드 서열, 절단 서열 또는 시퀀싱 관련 서열, 또는 이들의 조합을 포함한다.
일부 구현예에서, 증폭 프라이머를 사용하여 단편을 증폭시키는 단계는 헤어핀 어댑터를 파괴하지 못한다. 일부 구현예에서, 증폭 프라이머를 사용하여 단편을 증폭시키는 데 사용되는 폴리머라아제에는 5'-3' 엑소뉴클레아제 활성이 결여되어 있거나, 증폭 프라이머를 사용하여 단편을 증폭시키는 데 사용되는 폴리머라아제는 가닥 치환 폴리머라아제가 아니다. 일부 구현예에서, 단편을 증폭시키는 데 사용되는 폴리머라아제는 Q5이다. 일부 구현예에서, 증폭은 브릿지 증폭이다.
일부 구현예에서, 상기 방법은 증폭된 단편을 시퀀싱하는 단계를 추가로 포함한다. 일부 구현예에서, 상기 방법은 삽입체의 전체 서열의 시퀀싱을 가능하게 한다.
일부 구현예에서, 이중 가닥 핵산은 DNA 또는 RNA를 포함한다. 일부 구현예에서, 이중 가닥 핵산은 무세포 DNA를 포함한다. 일부 구현예에서, 상기 방법은 단편 중복제거에 사용된다.
부가적인 목적 및 이점은 하기 상세한 설명에서 부분적으로 설명될 것이며, 부분적으로는 상세한 설명으로부터 명백해지거나, 실시에 의해 학습될 수 있다. 이러한 목적 및 이점은 특히 첨부된 청구범위에 언급된 요소 및 조합에 의해 실현되고 달성될 것이다.
상기 일반적인 설명 및 하기 상세한 설명은 단지 예시적이고 설명적이며, 청구범위를 제한하고자 하는 것이 아님을 이해해야 한다.
본 명세서에 통합되고 본 명세서의 일부를 구성하는 첨부된 도면은 하나의(여러) 구현예(들)를 예시하며, 해당 설명과 함께 본원에 기재된 원리를 설명하는 역할을 한다.
도 1은, 비표적 서열과 대조되는, 단편의 한쪽 또는 양쪽 5' 말단에 있는 헤어핀 어댑터를 사용하여 시퀀싱 라이브러리에서 표적 서열을 농축시키는 대표적인 방법을 보여준다.
도 2는, 본 개시내용의 양태에 따라, 헤어핀 어댑터가 증폭 프라이머 서열로부터의 증폭을 차단시킬 수 있는 방법을 보여준다.
도 3은, 본 개시내용의 양태에 따라, 헤어핀 어댑터가 적어도 부분적으로 상보적인 뉴클레오타이드 서열 2 세트(A14/A14' 및 X/X')를 포함하는 방법을 보여준다.
도 4는, 본 개시내용의 양태에 따라, 제1 연장 프라이머와 제2 연장 프라이머(각각 상이한 표적 서열에 결합함)가 링커를 통해 연결되는 방법을 보여준다.
도 5는, 본 개시내용의 양태에 따라, 표적 삽입체를 함유하지 않는 단편에서 어댑터가 결찰되지 않아 양방향 증폭이 없는 것과 대조되는, 표적 삽입체 함유 단편의 말단에 결찰된 이중 가닥 어댑터를 사용하여 시퀀싱 라이브러리에서 표적 서열을 농축시키는 대표적인 방법을 보여준다.
도 6은, 헤어핀 어댑터와 대조군 어댑터를 사용한 라이브러리 증폭 결과를 보여준다.
도 7은, 도 6의 라이브러리 증폭에 사용된 헤어핀 어댑터와 대조군 어댑터를 보여준다.
서열의 설명
표 1은 본원에 언급된 특정 서열의 목록을 제공한다.
[표 1]
구현예의 설명
I. 핵산 시퀀싱 라이브러리를 제작하는 데 사용되는 어댑터 및 라이브러리 제작
일부 구현예에서, 핵산 시퀀싱 라이브러리를 제작하는 데 어댑터가 사용된다.
일부 구현예에서, 이러한 어댑터는 분기형 어댑터이다. 본원에 사용된 "분기형 어댑터"라는 용어는, 2개의 가닥이 서로 어닐링된 제1 말단과 2개의 가닥이 서로 어닐링되지 않은 제2 말단을 갖는 이중 가닥 핵산을 의미한다. 즉, 분기형 어댑터는 이중 가닥 영역과 단일 가닥 영역을 포함한다. 일 구현예에서, 분기형 어댑터의 말단은 이중 가닥이다. 분기형 또는 Y형 어댑터의 예는, 예를 들어 미국 특허 제7,741,463호, 미국 특허 제10253359호 및 미국 특허 제9,868,982호에 기재되어 있으며, 상기 문헌들은 각각 그 전문이 본원에 참조로 인용된다.
일부 구현예에서, 핵산 시퀀싱 라이브러리를 제작하는 데 사용되는 어댑터는 5' 말단과 3' 말단을 갖는 제1 서열과, 5' 말단과 3' 말단을 갖는 제2 서열을 포함하며; 여기서 제1 서열의 3' 말단의 일부와 제2 서열의 5' 말단의 일부는 상보적이며, 함께 제1 이중 가닥 영역을 형성하고; 제1 서열의 5' 말단의 일부와 제2 서열의 3' 말단의 일부는 비상보적이고; 제1 가닥의 5' 말단 부분은 제2 이중 가닥 영역을 포함한다.
일부 구현예에서, 제2 이중 가닥 영역은 헤어핀 구조이다. 일부 구현예에서, 제2 이중 가닥 영역은 비핵산 부분을 포함한다. 일부 구현예에서, 비핵산 부분은 링커이다. 일부 구현예에서, 제1 가닥의 5' 말단은 엑소뉴클레아제에 의해 분해되지 않는 부분을 포함한다. 즉, 제1 가닥의 5' 말단은 엑소뉴클레아제에 저항성이 있을 수 있다. 일부 구현예에서, 제1 이중 가닥 영역은 적어도 5개의 연속된 뉴클레오타이드이다. 일부 구현예에서, 제2 이중 가닥 영역은 적어도 5개의 연속된 뉴클레오타이드이다. 일부 구현예에서, 제2 가닥의 5' 말단은 인산화된다. 일부 구현예에서, 제1 가닥과 제2 가닥의 모든 시토신 염기는 메틸화된다. 일부 구현예에서, 어댑터는 포획 모이어티를 추가로 포함한다.
일부 구현예에서, 핵산 시퀀싱 라이브러리를 제작하는 방법은 복수의 이중 가닥 핵산 단편을 생성하는 단계와, 분기형 어댑터를 복수의 이중 가닥 핵산 단편의 적어도 하나의 말단에 부착시키는 단계를 포함한다. 일부 구현예에서, 하나 이상의 어댑터는 태그먼트화를 통해 부착된다. 일부 구현예에서, 하나 이상의 어댑터는 결찰을 통해 부착된다.
다양한 라이브러리 제작이 당업계에 공지되어 있으며, 본 발명의 방법은 라이브러리 생성 수단에 의해 제한되지 않는다. 일부 구현예에서, 라이브러리는 태그먼트화 또는 결찰을 사용하여 제작된다. 예를 들어, 태그먼트화 또는 결찰 방법은 라이브러리 단편의 말단에 어댑터, 예를 들어 헤어핀 어댑터, 단일 가닥 어댑터 및/또는 이중 가닥 어댑터를 혼입시키는 데 사용될 수 있다.
일부 구현예에서, 트랜스포존 기반 기술은, 예를 들어 Nextera™ DNA 샘플 제조 키트(Illumina, Inc.)의 워크플로우에 예시된 바와 같이 DNA를 단편화하는 데 사용될 수 있으며, 여기서 게놈 DNA는 입력 DNA를 단편화하고 동시에 태그 지정("태그먼트화")하는 조작된 트랜스포좀에 의해 단편화되어, 단편의 말단에 고유한 어댑터 서열을 포함하는 단편화된 핵산 분자 집단을 생성할 수 있다.
전위를 통한 분기형 어댑터의 부가를 통해 시퀀싱 라이브러리를 제작하는 것은 미국 특허 제10,246,746호에 기재되어 있으며, 상기 문헌은 그 전문이 본원에 참조로 인용된다.
본원에 사용된 "태그먼트화"라는 용어는, 트랜스포존 말단 서열을 포함하는 어댑터와 복합체화된 트랜스포사아제(transposase) 효소를 포함하는 트랜스포좀 복합체에 의한 DNA의 변형을 나타낸다. 태그먼트화는 DNA의 단편화와 동시에 듀플렉스 단편의 양쪽 가닥의 5' 말단에의 어댑터의 결찰을 유도한다. 트랜스포사아제 효소를 제거하기 위한 정제 단계 후, 예를 들어 PCR, 결찰, 또는 당업자에게 공지된 임의의 다른 적합한 방법에 의해 조작된 단편의 말단에 추가 서열이 부가될 수 있다.
본원에 사용된 "트랜스포좀 복합체"는 적어도 하나의 트랜스포사아제(또는 본원에 기재된 바와 같은 다른 효소)와 트랜스포존 인식 서열로 구성된다. 일부 이러한 시스템에서, 트랜스포사아제는 트랜스포존 인식 서열에 결합하여 전위 반응을 촉진시킬 수 있는 기능성 복합체를 형성한다. 일부 양태에서, 트랜스포존 인식 서열은 이중 가닥 트랜스포존 말단 서열이다. 트랜스포사아제는 이중 가닥 핵산 내 트랜스포사아제 인식 부위에 결합하여, 트랜스포존 인식 서열을 이중 가닥 핵산에 삽입한다. 일부 이러한 삽입 사건에서, 트랜스포존 인식 서열(또는 말단 서열)의 한쪽 가닥이 이중 가닥 핵산으로 전달되어, 절단 사건이 일어난다. 트랜스포사아제와 함께 사용하기 위해 쉽게 조작될 수 있는 예시적인 전위 절차 및 시스템.
태그먼트화는 고정된 또는 용액상 트랜스포좀 복합체를 이용하여 수행될 수 있다.
결찰에 의한 어댑터의 혼입이 또한 널리 공지되어 있으며, Truseq 샘플 제조 키트(Illumina, Inc.)의 워크플로우에 예시되어 있다.
일부 구현예에서, 핵산 시퀀싱 라이브러리를 제작하기 위한 키트는 분기형 어댑터; 어댑터의 일부와 혼성화 가능한 적어도 하나의 프라이머; 적어도 하나의 효소; 및 dNTP를 포함한다. 일부 구현예에서, 적어도 하나의 효소는 엑소뉴클레아제 활성을 갖는다. 일부 구현예에서, 적어도 하나의 효소는 폴리머라아제이다. 일부 구현예에서, 키트의 적어도 하나의 구성요소는 동결건조된 또는 건조된 형태이다.
II. 헤어핀 어댑터를 사용하여 시퀀싱 라이브러리에서 표적 서열을 농축시키는 방법
헤어핀 어댑터를 사용하여 시퀀싱 라이브러리에서 표적 서열을 농축시키는 방법이 본원에 개시된다. 하기 기재되는 바와 같이, 표적 서열에 결합하는 연장 프라이머와 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제는 헤어핀 어댑터를 특이적으로 "잠금 해제"하고, 표적 서열을 포함하는 단편을 증폭시키는 데 사용될 수 있다(도 1 참조).
일부 구현예에서, 본 발명의 방법을 사용하면, 단편 말단을 회수할 수 없는 농축 방법(예컨대, 멀티플렉스 PCR을 사용하는 직접 표적화된 증폭)과 비교하여, 농축 동안 단편 말단을 회수할 수 있기 때문에, 시퀀싱 결과가 개선된다.
일부 구현예에서, 이중 가닥 단편의 시퀀싱 라이브러리에서 표적 서열을 농축시키는 방법은, 시퀀싱 라이브러리를 제작하는 단계(여기서, 각각의 단편은 이중 가닥 핵산을 포함하는 삽입체와, 이중 가닥 단편의 한쪽 또는 양쪽 가닥의 5' 말단에 있는 헤어핀 어댑터를 포함하고, 여기서 헤어핀 어댑터는 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열을 포함함); 이중 가닥 단편을 변성시켜 단일 가닥 단편을 형성하는 단계; 및 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제를 사용하여, (1) 시퀀싱 라이브러리 내 적어도 하나의 삽입체에 포함된 표적 서열에 결합하는 연장 프라이머를 사용하여 핵산 가닥을 생성하고, (2) 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열의 전부 또는 일부를 제거하는 단계를 포함한다.
일부 구현예에서, 헤어핀 어댑터는 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열을 포함한다.
본 발명의 방법은 무세포 DNA와 같은 단편화된 핵산의 전체 서열을 생성하는 것과 같은 다양한 용도에 사용된다. 나아가, 본 발명의 방법은 단편 중복제거에 사용될 수 있다.
A. 표적 서열 및 시퀀싱 라이브러리에서 표적 서열의 농축
본원에 사용된 "표적 서열"은 임의의 관심 서열을 나타낸다. 예를 들어, 표적 서열은 관심 유전자에 포함된 서열, 관심있는 특정 돌연변이, 또는 사용자가 관심있는 임의의 다른 서열을 포함할 수 있다.
일부 구현예에서, 시퀀싱 라이브러리에서 표적 서열을 농축시키는 본 발명의 방법이 없는 경우, 이중 가닥 핵산으로부터 생성된 라이브러리 단편 중 상대적으로 낮은 비율이 표적 서열을 포함할 수 있다.
일부 구현예에서, 라이브러리 내 복수의 이중 가닥 단편은 농축시키기 전에 표적 서열을 포함하지 않는다. 일부 구현예에서, 라이브러리 내 대부분의 이중 가닥 단편은 농축시키기 전에 표적 서열을 포함하지 않는다.
일부 구현예에서, 시퀀싱 라이브러리에서 표적 서열을 농축시킨다는 것은, 표적 서열을 포함하는 단편이 농축시키기 전에 비해 농축시킨 후 라이브러리에 2배 이상, 5배 이상, 10배 이상, 20배 이상, 50배 이상, 100배 이상, 1,000배 이상, 10,000배 이상 또는 100,000배 이상 더 많이 포함되어 있음을 의미한다. 따라서, 본 발명의 방법은 "농축된 라이브러리"를 생성하는 데 사용될 수 있다. 일부 구현예에서, 본 발명의 방법은 샘플에 포함된 이중 가닥 DNA의 작은 영역(즉, 몇 킬로베이스)을 고도로 농축시킬 수 있다.
일부 구현예에서, 표적 서열은 라이브러리 제작에 사용되는 이중 가닥 핵산에 포함되어 있다. 일부 구현예에서, 이중 가닥 핵산은 표적 농축을 필요로 하거나 표적 농축이 유익할 수 있는 임의의 샘플 유형에 포함되어 있을 수 있다. 일부 구현예에서, 표적 서열은 무세포 DNA(cfDNA)에 포함되어 있다. 일부 구현예에서, 표적 서열은 액체 생검 샘플과 같은 종양학 샘플에 포함되어 있다. 일부 구현예에서, 표적 서열은 엑솜(exome) 샘플에 포함되어 있다. 일부 구현예에서, 표적 서열은 미진단 희귀 질환(RUGD: rare and undiagnosed disease) 엑솜 샘플에 포함되어 있다. 일부 구현예에서, 표적 서열은 RNA 또는 cDNA 라이브러리에 포함되어 있다. 일부 구현예에서, 표적 서열은 메틸화 라이브러리에 포함되어 있다.
B. 증폭 프라이머 서열을 포함하는 헤어핀 어댑터
본원에 사용된 "헤어핀"은, 서로 적어도 부분적으로 상보적인 한 쌍의 핵산 서열을 포함하는 핵산을 나타낸다. 적어도 부분적으로 상보적인 이러한 2개의 핵산 서열은 서로 결합하여 핵산의 접힘(folding)을 매개할 수 있다. 일부 구현예에서, 적어도 부분적으로 상보적인 2개의 핵산 서열은 헤어핀 2차 구조를 갖는 핵산을 생성한다.
본원에 사용된 "헤어핀 어댑터"는, 서로 적어도 부분적으로 상보적인 적어도 한 쌍의 핵산 서열을 포함하는 어댑터를 나타낸다. 일부 구현예에서, 헤어핀 어댑터는 접힌 2차 구조를 갖는다.
도 1은, 각 가닥의 5' 말단에 헤어핀 어댑터를 갖는 이중 가닥 삽입체(삽입체 및 삽입체의 서열)를 포함하는 라이브러리 단편을 보여준다. 도 1의 대표적인 구현예에서, 각각의 헤어핀 어댑터는 서로 적어도 부분적으로 상보적인 한 쌍의 핵산 서열(A14/A14')을 포함한다. 일부 구현예에서, 서로 적어도 부분적으로 상보적인 한 쌍의 핵산 서열 사이의 염기쌍 형성은 어댑터를 헤어핀 2차 구조로 "잠금한다". 이러한 방법에서, 표적 서열을 포함하는 단편을 증폭시키는 방법의 특이성을 개선시키기 위해 사용되는 연장 프라이머의 길이를 증가시킬 수 있다.
일부 구현예에서, 헤어핀 어댑터는 서로 적어도 부분적으로 상보적인 한 쌍 초과의 핵산 서열을 포함한다. 일부 구현예에서, 헤어핀 어댑터는 서로 적어도 부분적으로 상보적인 2쌍의 핵산 서열을 포함한다. 일부 구현예에서, 헤어핀 어댑터는 서로 적어도 부분적으로 상보적인 2쌍 초과의 핵산 서열을 포함한다. 도 2는, 서로 적어도 부분적으로 상보적인 2쌍의 핵산 서열(A14/14' 쌍과 X/X' 쌍)을 포함하는 헤어핀 어댑터를 보여준다.
일부 구현예에서, 헤어핀 어댑터는 증폭 프라이머 서열을 포함한다. 일부 구현예에서, 헤어핀 어댑터는 증폭 프라이머 서열과 어댑터 서열에 적어도 부분적으로 상보적인 서열의 전부 또는 일부를 포함한다.
일부 구현예에서, 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열의 모든 부분이 제거되지 않는 한, 헤어핀 어댑터는 (서로 적어도 부분적으로 상보적인 한 쌍의 핵산 서열 사이의 염기쌍 형성을 통해) "잠금된다". 일부 구현예에서, 잠금된 헤어핀은 폴리머라아제가 증폭 프라이머 서열의 상보체를 연장시키고 생성하는 것을 방지한다.
일부 구현예에서, 본 발명의 방법은 헤어핀 어댑터에 부착되지 않은 단편의 증폭을 차단하는데, 이는 헤어핀 어댑터가 이후 증폭 단계에 사용될 수 있는 증폭 프라이머 서열을 포함하기 때문이다.
이러한 방식으로, 본 발명의 방법은 "잠금 해제된" 헤어핀 어댑터에 부착되는 라이브러리 단편의 증폭만 가능하게 한다. 헤어핀 어댑터에 부착되지 않은 라이브러리 단편과 "잠금된" 헤어핀 어댑터에 부착된 라이브러리 단편은 증폭되지 않는다. 바람직하지 않은 단편(즉, 표적 서열을 포함하지 않는 단편)의 증폭을 저해하는 이러한 수단은 다운스트림 방법과 관련된 비용과 사용자 시간을 회피할 수 있다.
일부 구현예에서, 헤어핀 어댑터는 이중 가닥 단편의 한쪽 가닥의 5' 말단에 있다. 일부 구현예에서, 헤어핀 어댑터는 이중 가닥 단편의 양쪽 가닥의 5' 말단에 있다. 일부 구현예에서, 헤어핀 어댑터는 결찰 또는 태그먼트화에 의해 혼입된다. 일부 구현예에서, 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열은 각각 적어도 14개의 뉴클레오타이드를 포함한다. 일부 구현예에서, 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열은 각각 14개 내지 60개의 뉴클레오타이드를 포함한다. 일부 구현예에서, 헤어핀 어댑터는 안정성을 증가시키기 위한 하나 이상의 증강을 포함한다. 일부 구현예에서, 헤어핀 어댑터는 하나 이상의 변형된 또는 잠금된 핵산을 포함한다. 일부 구현예에서, 변형된 핵산은 8-아자-7-데아자구아노신을 포함한다. 일부 구현예에서, 헤어핀 어댑터는 60℃ 이상, 65℃ 이상 또는 70℃ 이상의 온도에서 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열의 회합을 유지한다.
일부 구현예에서, 증폭 프라이머 서열은 A14 서열(서열번호 1) 또는 B15 서열(서열번호 2), 또는 이들의 상보체(각각, A14' 또는 B15')를 포함한다.
일부 구현예에서, 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열은 증폭 프라이머 서열의 상보체와 50% 이상, 60% 이상, 70% 이상, 80% 이상, 90% 이상, 95% 이상 또는 99% 이상의 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열은 증폭 프라이머 서열의 상보체를 포함한다.
1. 어댑터
일부 구현예에서, 라이브러리 단편은, 헤어핀 어댑터에 더하여 또는 이에 대한 대안으로, 이중 가닥 라이브러리 단편의 양쪽 5' 말단 또는 양쪽 3' 말단에만 제공되는 대칭 단일 어댑터와 같은 하나 이상의 어댑터를 포함한다(도 5). 일 구현예에서, 대칭 단일 어댑터는 이중 가닥 라이브러리 단편의 단일 가닥 말단을 생성한다. 일 구현예에서, 대칭 단일 어댑터는 B15 또는 B15' 어댑터이다. 일 구현예에서, 대칭 단일 어댑터는 A14 또는 A14' 어댑터이다.
일부 구현예에서, 이중 가닥 단편의 한쪽 또는 양쪽 가닥은 헤어핀 어댑터의 3'에 하나 이상의 추가 어댑터를 포함한다. 일부 구현예에서, 이중 가닥 단편은 한쪽 또는 양쪽 가닥의 3' 말단에 하나 이상의 어댑터를 포함한다.
일부 구현예에서, 어댑터 서열은 프라이머 서열, 인덱스 태그 서열, 포획 서열, 바코드 서열, 절단 서열 또는 시퀀싱 관련 서열, 또는 이들의 조합을 포함한다. 본원에 사용된 시퀀싱 관련 서열은 이후 시퀀싱 단계와 관련된 임의의 서열일 수 있다. 시퀀싱 관련 서열은 다운스트림 시퀀싱 단계를 단순화시키는 역할을 할 수 있다. 예를 들어, 시퀀싱 관련 서열은, 다르게는 어댑터를 핵산 단편에 결찰시키는 단계를 통해 혼입될 수 있는 서열일 수 있다. 일부 구현예에서, 어댑터 서열은 특정 시퀀싱 방법에서 플로우셀(flow cell)에의 결합을 용이하게 하기 위해 P5 또는 P7 서열(또는 이들의 상보체)을 포함한다.
일부 구현예에서, 헤어핀에 포함된 증폭 프라이머 서열은 범용 프라이머 서열이다. 범용 서열은 둘 이상의 핵산 분자에 공통적인, 즉, 이들이 공유하는 뉴클레오타이드 서열의 영역이다.
일부 구현예에서, 헤어핀 어댑터는 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열 사이에 링커를 추가로 포함한다. 일부 구현예에서, 이러한 링커는 뉴클레오타이드 링커이다. 일부 구현예에서, 이러한 링커는 비뉴클레오타이드(non-nucleotide) 링커이다. 일부 구현예에서, 이러한 링커는 합성 링커이다. 일부 구현예에서, 이러한 링커는 엑소뉴클레아제에 의해 분해되지 않기 때문에(즉, 링커는 엑소뉴클레아제에 저항성이 있음), 엑소뉴클레아제 활성은 링커에서 종결된다.
C. 이중 가닥 핵산
일부 구현예에서, 라이브러리를 생성하는 데 사용되는 이중 가닥 핵산은 DNA, RNA, 또는 이들의 유사체로 구성된다. 일부 구현예에서, 산의 공급원은 게놈 DNA, 메신저 RNA, 또는 천연 공급원으로부터의 다른 핵산이다. 일부 구현예에서, 이러한 공급원에서 유도된 핵산은 본원에 기재된 방법에 사용되기 전 증폭될 수 있다.
이중 가닥 핵산이 유도될 수 있는 예시적인 생물학적 샘플에는, 예를 들어 설치류, 마우스, 래트, 토끼, 기니피그, 유제류, 말, 양, 돼지, 염소, 소, 고양이, 개, 영장류, 인간 또는 비인간 영장류와 같은 포유류; 아라비돕시스 탈리아나(Arabidopsis thaliana), 옥수수, 수수, 귀리, 밀, 벼, 카놀라 또는 대두와 같은 식물; 클라미도모나스 레인하르디티(Chlamydomonas reinhardtii)와 같은 조류(algae); 카에노르하브디티스 엘레간스(Caenorhabditis elegans)와 같은 선충류; 드로소필라 멜라노가스테르(Drosophila melanogaster), 모기, 초파리, 꿀벌 또는 거미와 같은 곤충; 제브라피쉬(zebrafish)와 같은 어류; 파충류; 개구리 또는 제노푸스 라에비스(Xenopus laevis)와 같은 양서류; 딕티오스텔리움 디스코이데움(dictyostelium discoideum); 뉴모시스티스 카리니(Pneumocystis carinii), 타키푸구 루브리페스(Takifugu rubripes), 효모, 사카로마이세스 세레비시아(Saccharamoyces cerevisiae) 또는 스키조사카로마이세스 폼베(Schizosaccharomyces pombe)와 같은 진균류; 또는 열대열 말리리아 원충(Plasmodium falciparum)에서 유래된 것들이 포함된다. 이중 가닥 핵산은 또한 대장균, 포도상구균 또는 마이코플라즈마 폐렴균과 같은 박테리아; 고세균(archae); C형 간염 바이러스 또는 인간 면역결핍 바이러스와 같은 바이러스; 또는 비로이드와 같은 원핵생물에서 유도될 수 있다. 이중 가닥 핵산은 상기 유기체의 균질한 배양물 또는 집단에서, 또는 대안적으로, 예를 들어 공동체 또는 생태계에서 몇몇 상이한 유기체의 집합체에서 유도될 수 있다. 핵산은, 예를 들어 문헌[Sambrook et al, Molecular Cloning: A Laboratory Manual, 3rd edition, Cold Spring Harbor Laboratory, New York (2001)] 또는 문헌[Ausubel et al, Current Protocols in Molecular Biology, John Wiley and Sons, Baltimore, Md. (1998)]에 기재된 것들을 포함하는 당업계에 공지된 방법을 사용하여 단리될 수 있으며, 상기 문헌들은 각각 본원에 참조로 인용된다.
일부 구현예에서, 이중 가닥 핵산은 하나 이상의 더 큰 핵산의 단편으로 수득될 수 있다. 단편화는, 예를 들어 분무화, 초음파처리, 화학적 절단, 효소적 절단 또는 물리적 전단을 포함하는 당업계에 공지된 다양한 기술 중 임의의 것을 사용하여 수행될 수 있다.
이중 가닥 핵산의 집단 또는 이의 앰플리콘은, 본원에 제시된 방법 또는 조성물의 특정한 적용에 바람직하거나 적합한 평균 가닥 길이를 가질 수 있다. 예를 들어, 평균 가닥 길이는 100,000개 뉴클레오타이드, 50,000개 뉴클레오타이드, 10,000개 뉴클레오타이드, 5,000개 뉴클레오타이드, 1,000개 뉴클레오타이드, 500개 뉴클레오타이드, 100개 뉴클레오타이드 또는 50개 뉴클레오타이드 미만일 수 있다. 대안적으로 또는 부가적으로, 평균 가닥 길이는 10개 뉴클레오타이드, 50개 뉴클레오타이드, 100개 뉴클레오타이드, 500개 뉴클레오타이드, 1,000개 뉴클레오타이드, 5,000개 뉴클레오타이드, 10,000개 뉴클레오타이드, 50,000개 뉴클레오타이드 또는 100,000개 뉴클레오타이드 초과일 수 있다. 이중 가닥 핵산의 집단 또는 이의 앰플리콘의 평균 가닥 길이는 상기 제시된 최댓값과 최솟값 사이의 범위일 수 있다. 증폭 부위에서 생성된(또는 본원에서 달리 제조되거나 사용된) 앰플리콘의 평균 가닥 길이는, 상기 예시된 값에서 선택되는 상한과 하한 사이의 범위일 수 있음을 이해할 것이다.
일부 구현예에서, 이중 가닥 핵산은 200개 미만의 뉴클레오타이드, 150개 미만의 뉴클레오타이드, 100개 미만의 뉴클레오타이드, 75개 미만의 뉴클레오타이드, 50개 미만의 뉴클레오타이드 또는 36개 미만의 뉴클레오타이드와 같이 비교적 짧은 평균 가닥 길이를 갖는다. 평균 가닥 길이가 비교적 짧은 샘플 유형의 예는 무세포 DNA(cfDNA) 및 엑솜 시퀀싱 샘플이다.
일부 구현예에서, 이중 가닥 핵산은 모체 혈액 샘플의 무세포 DNA(cfDNA)이다. 일부 구현예에서, cfDNA는 모체 혈장 샘플에서 추출된다. 일부 구현예에서, cfDNA는 비침습성 산전 검사(NIPT: noninvasive prenatal testing)를 위한 것이다. 일부 구현예에서, 이중 가닥 핵산은 엑솜이다. 일부 구현예에서, 엑솜은 의심되는 미진단 희귀 질환(RUGD) 환자의 샘플에서 유래된다.
D. 연장 프라이머
본원에 사용된 "연장"은, 프라이머와 관련하여 사용될 때, 하나 이상의 뉴클레오타이드가 (예를 들어, 폴리머라아제 활성을 통해) 프라이머에 부가되거나, 하나 이상의 올리고뉴클레오타이드가 (예를 들어, 리가아제 활성을 통해) 프라이머에 부가되는 과정을 포함하는 것으로 의도된다.
일부 구현예에서, 하나 이상의 연장 프라이머는 이중 가닥 단편의 라이브러리 내 적어도 하나의 삽입체에 포함된 표적 서열에 결합한다. 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제를 사용하는 방법은 (1) 연장 프라이머를 사용하여 핵산 가닥을 생성하고, (2) 헤어핀 어댑터에서 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열의 전부 또는 일부를 제거하는 단계를 포함할 수 있다(도 1에 제시된 바와 같음). 일부 구현예에서, 잠금된 헤어핀은 폴리머라아제가 생성된 핵산 가닥 내 증폭 프라이머 서열의 상보체를 연장시키고 생성하는 것을 방지한다. 따라서, 연장 프라이머를 표적 서열을 포함하는 삽입체에 결합시키는 것은 이러한 단편에 대한 헤어핀 어댑터의 선택적인 "잠금 해제"를 가능하게 한다.
일부 구현예에서, 하나 이상의 연장 프라이머는 유전자 특이적 프라이머이다. 예를 들어, 연장 프라이머는 암 유전자의 표적 서열에 결합하여 시퀀싱 라이브러리에서 이러한 표적 서열을 농축시킬 수 있다.
일부 구현예에서, 상기 방법은 단일 연장 프라이머를 사용한다. 일부 구현예에서, 상기 방법은 하나 초과의 연장 프라이머를 사용한다.
일부 구현예에서, 연장 프라이머의 용융 온도는 60℃ 이상이다. 일부 구현예에서, 연장 프라이머의 용융 온도는 60℃ 이상, 65℃ 이상 또는 70℃ 이상이다. 일부 구현예에서, 용융 온도가 60℃ 이상인 연장 프라이머는 "핫 스타트(hot start)" 반응이 비특이적 결합을 감소시키는 것을 가능하게 한다. 일부 구현예에서, 연장 프라이머의 용융 온도는 프라이머 길이, GC 함량, 또는 당업자에게 널리 공지된 다른 인자에 의해 제어된다.
일부 구현예에서, 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제를 사용하여, 이중 가닥 단편의 라이브러리 내 적어도 하나의 삽입체에 포함된 표적 서열에 결합하는 연장 프라이머를 사용하여 핵산 가닥을 생성하고, 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열의 전부 또는 일부를 제거하는 단일 단계에 하나 초과의 연장 프라이머가 사용된다. 일부 구현예에서, 상기 방법의 단일 단계에 다중 연장 프라이머가 사용된다. 예를 들어, 다중 연장 프라이머는 관심 유전자 내 상이한 표적 서열 또는 상이한 관심 유전자에 결합할 수 있다.
일부 구현예에서, 다중 연장 프라이머가 하나 이상의 링커를 통해 연결된다(즉, 도 4에 제시된 바와 같음). 일부 구현예에서, 2개의 연장 프라이머가 링커를 통해 연결된다. 일부 구현예에서, 하나 이상의 링커를 통해 연결되는 다중 연장 프라이머는 더 높은 용융 온도를 갖는다. 일부 구현예에서, 하나 이상의 링커를 통해 연결된 다중 연장 프라이머는 각각의 연장 프라이머(예를 들어, 도 4에 제시된 바와 같은 fwd1' 및 fwd2')에 결합할 수 있는 표적 서열을 포함하는 삽입체에 결합한다.
일부 구현예에서, 2개의 연장 프라이머는 상기 방법 동안 하기 기재되는 바와 같이 함께 결찰될 수 있다.
일부 구현예에서, 상기 방법의 상이한 단계에 상이한 연장 프라이머가 사용된다.
E. 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제
일부 구현예에서, 상기 방법은, 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제를 사용하여, 이중 가닥 단편의 라이브러리 내 적어도 하나의 삽입체에 포함된 표적 서열에 결합하는 연장 프라이머를 사용하여 핵산 가닥을 생성하고, 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열의 전부 또는 일부를 제거하는 단계를 포함한다.
일부 구현예에서, 폴리머라아제의 5'-3' 엑소뉴클레아제 활성은 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열의 전부 또는 일부를 제거하는 것을 매개한다. 일부 구현예에서, 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제는 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열의 전부 또는 일부를 절단한다. 일부 구현예에서, 잠금된 헤어핀은 폴리머라아제가 생성된 핵산 가닥 내 증폭 프라이머 서열의 상보체를 연장시키고 생성하는 것을 방지한다.
일부 구현예에서, 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제는 Taq이다. 일부 구현예에서, 연장 프라이머 및/또는 연장 프라이머를 사용하여 핵산 가닥을 생성하는 데 사용되는 폴리머라아제는 연장 후 제거된다. 일부 구현예에서, 연장 프라이머 및/또는 연장 프라이머를 사용하여 핵산 가닥을 생성하는 데 사용되는 폴리머라아제의 제거는, 고체상 가역적 고정화(SPRI) 비드를 이용하여 이루어진다. 일부 구현예에서, 폴리머라아제는 변성에 의해 제거되는 열감응성 폴리머라아제이다. 일부 구현예에서, 열감응성 폴리머라아제는 전장 Bst 또는 DNA 폴리머라아제 I이다.
F. 증폭
일부 구현예에서, 상기 방법은 증폭 프라이머 서열에 결합하는 증폭 프라이머를 사용하여 단편을 증폭시키는 단계를 추가로 포함한다. 일부 구현예에서, 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열의 전부 또는 일부가 제거된 단편만 증폭될 수 있다. 일부 구현예에서, 잠금된 헤어핀은 폴리머라아제가 증폭 프라이머 서열의 상보체를 연장시키고 생성하는 것을 방지한다.
일부 구현예에서, 증폭 프라이머는 인덱스 서열(예를 들어, 도 1의 i5 및 i7 인덱스 서열 참조)을 포함할 수 있다. 이러한 인덱스 서열은 어레이에서 샘플 및 위치를 식별하는 데 사용될 수 있다. 일부 구현예에서, 인덱스 서열은 고유 분자 식별자(UMI: unique molecular identifier)를 포함한다. UMI는 특허 출원 WO 2016/176091, WO 2018/197950, WO 2018/197945, WO 2018/200380 및 WO 2018/204423에 기재되어 있으며, 상기 문헌들은 각각 그 전문이 본원에 참조로 인용된다.
일부 구현예에서, 증폭 프라이머를 사용하여 단편을 증폭시키는 단계는 헤어핀 어댑터를 파괴하지 못한다. 일부 구현예에서, 증폭 프라이머를 사용하여 단편을 증폭시키는 데 사용되는 폴리머라아제에는 5'-3' 엑소뉴클레아제 활성이 결여되어 있거나, 증폭 프라이머를 사용하여 단편을 증폭시키는 데 사용되는 폴리머라아제는 가닥 치환 폴리머라아제가 아니다. 일부 구현예에서, 단편을 증폭시키는 데 사용되는 폴리머라아제는 Q5이다. 일부 구현예에서, 증폭은 브릿지 증폭이다.
일부 구현예에서, 샘플은 고체 지지체 상에서 증폭된다.
예를 들어, 일부 구현예에서, 샘플은 미국 특허 제7,985,565호 및 제7,115,400호의 개시내용에 예시된 바와 같은 클러스터 증폭 방법을 사용하여 증폭되며, 상기 문헌들 각각의 내용은 그 전체가 본원에 참조로 인용된다. 미국 특허 제7,985,565호 및 제7,115,400호의 통합된 자료에는, 고정된 핵산 분자의 클러스터 또는 "콜로니"로 구성된 어레이를 형성하기 위해 증폭 생성물이 고체 지지체 상에 고정되게 하는 고체상 핵산 증폭 방법이 기재되어 있다. 이러한 어레이 상의 각각의 클러스터 또는 콜로니는 복수의 동일한 고정된 폴리뉴클레오타이드 가닥과 복수의 동일한 고정된 상보적 폴리뉴클레오타이드 가닥으로 형성된다. 이와 같이 형성된 어레이는 일반적으로 "클러스터링된 어레이"로 본원에서 지칭된다. 미국 특허 제7,985,565호 및 제7,115,400호에 기재된 바와 같은 고체상 증폭 반응의 생성물은, 고정된 폴리뉴클레오타이드 가닥과 고정된 상보적 가닥의 쌍의 어닐링에 의해 형성된 소위 "브릿지된" 구조이며, 여기서 양쪽 가닥은, 일부 구현예에서 공유결합 부착을 통해 5' 말단에서 고체 지지체 상에 고정되어 있다. 클러스터 증폭 방법은, 고정된 핵산 주형을 사용하여 고정된 앰플리콘을 생성하는 방법의 예이다. 본원에 제공된 방법에 따라 생성된 고정된 DNA 단편으로부터 고정된 앰플리콘을 생성하기 위해 다른 적합한 방법이 또한 사용될 수 있다. 예를 들어, 각 쌍의 증폭 프라이머의 한쪽 또는 양쪽 프라이머가 고정되어 있는지 여부에 관계없이, 고체상 PCR을 통해 하나 이상의 클러스터 또는 콜로니가 형성될 수 있다.
다른 구현예에서, 샘플은 용액 중에서 증폭된다. 예를 들어, 일부 구현예에서, 샘플이 고체 지지체로부터 절단되거나 달리 유리된 후, 증폭 프라이머가 용액 중에서 유리된 분자에 혼성화된다. 다른 구현예에서, 증폭 프라이머는 하나 이상의 초기 증폭 단계 동안 목적하는 샘플에 혼성화되고, 용액 중에서 후속 증폭 단계가 이어진다. 일부 구현예에서, 고정된 핵산 주형이 용액상 앰플리콘을 생성하는 데 사용될 수 있다.
본원에 기재된 또는 당업계에 일반적으로 공지된 증폭 방법 중 임의의 것을 범용 또는 표적 특이적 프라이머와 함께 이용하여 목적하는 샘플을 증폭시킬 수 있음을 이해할 것이다. 증폭에 적합한 방법에는, 비제한적으로, 미국 특허 제8,003,354호에 기재된 바와 같은 폴리머라아제 연쇄 반응(PCR), 가닥 치환 증폭(SDA), 전사 매개 증폭(TMA) 및 핵산 서열 기반 증폭(NASBA)이 포함되며, 상기 문헌은 그 전문이 본원에 참조로 인용된다. 상기 증폭 방법을 이용하여 하나 이상의 관심 핵산을 증폭시킬 수 있다. 예를 들어, 멀티플렉스 PCR, SDA, TMA, NASBA 등을 포함하는 PCR을 이용하여 고정된 DNA 단편을 증폭시킬 수 있다. 일부 구현예에서, 관심 핵산에 특이적으로 지시된 프라이머가 증폭 반응에 포함된다.
핵산을 증폭시키는 다른 적합한 방법은 올리고뉴클레오타이드 연장 및 결찰, 롤링 서클 증폭(RCA: rolling circle amplification)(문헌[Lizardi et al., Nat. Genet. 19:225-232 (1998)], 이는 본원에 참조로 인용됨) 및 올리고뉴클레오타이드 결찰 검정(OLA)(일반적으로 미국 특허 제7,582,420호, 제5,185,243호, 제5,679,524호 및 제5,573,907호; EP 0 320 308 B1; EP 0 336 731 B1; EP 0 439 182 B1; WO 90/01069; WO 89/12696; 및 WO 89/09835 참조, 상기 모든 문헌은 본원에 참조로 인용됨) 기술을 포함할 수 있다. 이러한 증폭 방법이 고정된 DNA 단편을 증폭시키도록 설계될 수 있음을 이해할 것이다. 예를 들어, 일부 구현예에서, 증폭 방법은 관심 핵산에 특이적으로 지시된 프라이머를 함유하는 결찰 프로브 증폭 또는 올리고뉴클레오타이드 결찰 검정(OLA) 반응을 포함할 수 있다. 일부 구현예에서, 증폭 방법은 관심 핵산에 특이적으로 지시된 프라이머를 함유하는 프라이머 연장-결찰 반응을 포함할 수 있다. 관심 핵산을 증폭시키도록 특이적으로 설계될 수 있는 프라이머 연장 및 결찰 프라이머의 비제한적인 예로서, 증폭은 미국 특허 제7,582,420호 및 제7,611,869호에 예시된 바와 같은 GoldenGate 검정(Illumina, Inc., San Diego, CA)에 사용되는 프라이머를 포함할 수 있으며, 상기 문헌들은 각각 그 전문이 본원에 참조로 인용된다.
본 개시내용의 방법에 사용될 수 있는 예시적인 등온 증폭 방법에는, 비제한적으로, 예를 들어 문헌[Dean et al., Proc. Natl. Acad. Sci. USA 99:5261-66 (2002)]에 예시된 바와 같은 다중 치환 증폭(MDA), 또는 예를 들어 미국 특허 제6,214,587호에 예시된 바와 같은 등온 가닥 치환 핵산 증폭이 포함되며, 상기 문헌들은 각각 그 전문이 본원에 참조로 인용된다. 본 개시내용에 사용될 수 있는 다른 비PCR 기반 방법에는, 예를 들어 문헌[Walker et al., Molecular Methods for Virus Detection, Academic Press, Inc., 1995]; 미국 특허 제5,455,166호 및 제5,130,238호, 및 문헌[Walker et al., Nucl. Acids Res. 20:1691-96 (1992)]에 기재된 가닥 치환 증폭(SDA), 또는 예를 들어 문헌[Lage et al., Genome Research 13:294-307 (2003)]에 기재된 과분지형 가닥 치환 증폭이 포함되며, 상기 문헌들은 각각 그 전문이 본원에 참조로 인용된다. 등온 증폭 방법은 게놈 DNA의 랜덤 프라이머 증폭을 위해 가닥 치환 Phi 29 폴리머라아제 또는 Bst DNA 폴리머라아제 대형 단편, 5'→3' exo-와 함께 사용될 수 있다. 이러한 폴리머라아제의 사용은 높은 진행성(processivity) 및 가닥 치환 활성을 이용한다. 높은 진행성은 폴리머라아제가 10 kb 내지 20 kb 길이의 단편을 생성하는 것을 가능하게 한다. 상기 제시된 바와 같이, 등온 조건 하에서 Klenow 폴리머라아제와 같이 낮은 진행성 및 가닥 치환 활성을 갖는 폴리머라아제를 사용한 경우에는 더 작은 단편이 생성될 수 있다. 증폭 반응, 조건 및 구성요소에 대한 추가 설명은 미국 특허 제7,670,810호의 개시내용에 상세하게 제시되어 있으며, 상기 문헌은 그 전문이 본원에 참조로 인용된다.
G. 시퀀싱
일부 구현예에서, 상기 방법은 증폭된 단편을 시퀀싱하는 단계를 추가로 포함한다. 일부 구현예에서, 상기 방법은 삽입체의 전체 서열의 시퀀싱을 가능하게 한다. 삽입체의 전체 서열을 생성하는 능력은, 프라이머가 결합하는 부분을 넘어서는 삽입체의 일부가 직접 표적화된 증폭으로 손실될 수 있기 때문에, 직접 표적화된 증폭(예컨대, 멀티플렉스 PCR)을 이용한 방법과 대조적이다.
본원에 기재된 농축 방법 후, 다수의 상이한 방법을 사용하여 시퀀싱이 수행될 수 있다.
하나의 예시적인 시퀀싱 방법은 합성에 의한 시퀀싱(SBS: sequencing-by-synthesis)이다. SBS에서, 주형 내 뉴클레오타이드의 서열을 결정하기 위해 핵산 주형을 따라 핵산 프라이머의 연장을 모니터링한다. 기본 화학 공정은 (예를 들어, 폴리머라아제 효소에 의해 촉진되는) 중합일 수 있다. 특정 폴리머라아제 기반 SBS 구현예에서, 프라이머에 부가되는 뉴클레오타이드의 순서와 유형의 검출이 주형의 서열을 결정하는 데 사용될 수 있도록, 형광 표지된 뉴클레오타이드가 주형 의존적 방식으로 프라이머에 부가된다(이에 따라, 프라이머가 연장됨).
플로우셀은 시퀀싱에 편리한 고체 지지체를 제공한다. 예를 들어, 제1 SBS 사이클을 개시하기 위해, 하나 이상의 표지된 뉴클레오타이드, DNA 폴리머라아제 등을 하나 이상의 증폭된 핵산 분자를 수용하는 플로우셀 내로/플로우셀을 통해 흐르게 할 수 있다. 프라이머 연장으로 인해 표지된 뉴클레오타이드가 혼입되는 부위를 검출할 수 있다. 선택적으로, 뉴클레오타이드는 뉴클레오타이드가 프라이머에 부가되면 추가의 프라이머 연장을 종결시키는 가역적 종결 특성을 추가로 포함할 수 있다. 예를 들어, 차단 해제제가 전달되어 모이어티가 제거될 때까지 후속 연장이 발생할 수 없도록, 가역적 종결인자 모이어티를 갖는 뉴클레오타이드 유사체를 프라이머에 부가할 수 있다. 따라서, 가역적 종결을 사용하는 구현예의 경우, 차단 해제 시약을 (검출 전 또는 후에) 플로우셀에 전달할 수 있다. 다양한 전달 단계 사이에서 세척을 수행할 수 있다. 이어서, 사이클을 n회 반복하여 프라이머를 n개 뉴클레오타이드만큼 연장시켜, 길이 n의 서열을 검출할 수 있다. 본 개시내용의 방법으로 생성된 앰플리콘과 함께 사용하기 위해 용이하게 조작될 수 있는 예시적인 SBS 절차, 유체 시스템 및 검출 플랫폼은, 예를 들어 문헌[Bentley et al., Nature 456:53-59 (2008)], WO 04/018497; US 7,057,026; WO 91/06678; WO 07/123744; US 7,329,492; US 7,211,414; US 7,315,019; US 7,405,281 및 US 2008/0108082에 기재되어 있으며, 상기 문헌들은 각각 본원에 참조로 인용된다.
순환 반응을 사용하는 다른 시퀀싱 절차, 예컨대 파이로시퀀싱(pyrosequencing)이 사용될 수 있다. 파이로시퀀싱은 특정 뉴클레오타이드가 초기 핵산 가닥에 혼입됨에 따라 무기 피로포스페이트(PPi)가 방출되는 것을 검출한다(문헌[Ronaghi, et al., Analytical Biochemistry 242(1), 84-9 (1996)]; 문헌[Ronaghi, Genome Res. 11(1), 3-11 (2001)]; 문헌[Ronaghi et al. Science 281(5375), 363 (1998)]; US 6,210,891; US 6,258,568 및 US 6,274,320, 상기 문헌들은 각각 본원에 참조로 인용됨). 파이로시퀀싱에서, 방출된 PPi는 ATP 설푸릴라아제에 의해 아데노신 트리포스페이트(ATP)로 즉시 전환됨에 따라 검출될 수 있으며, 생성된 ATP 수준은 루시퍼라아제 생성 광자를 통해 검출될 수 있다. 따라서, 시퀀싱 반응은 발광 검출 시스템을 통해 모니터링될 수 있다. 형광 기반 검출 시스템에 사용되는 여기 방사선원은 파이로시퀀싱 절차에 필요하지 않다. 본 개시내용에 따라 생성된 앰플리콘에 파이로시퀀싱을 적용하기 위해 조작될 수 있는 유용한 유체 시스템, 검출기 및 절차는, 예를 들어 WIPO 특허 출원 공개공보 WO 2012058096, US 2005/0191698 A1, US 7,595,883 및 US 7,244,559에 기재되어 있으며, 상기 문헌들은 각각 본원에 참조로 인용된다.
일부 구현예는 DNA 폴리머라아제 활성을 실시간 모니터링하는 것을 포함하는 방법을 이용할 수 있다. 예를 들어, 뉴클레오타이드 혼입은 형광단 함유 폴리머라아제와 γ-포스페이트 표지된 뉴클레오타이드 사이의 형광 공명 에너지 전달(FRET: fluorescence resonance energy transfer) 상호작용을 통해, 또는 제로모드 도파관(ZMW: zeromode waveguide)을 이용하여 검출될 수 있다. FRET 기반 시퀀싱을 위한 기술 및 시약은, 예를 들어 문헌[Levene et al. Science 299, 682-686 (2003)]; 문헌[Lundquist et al. Opt. Lett. 33, 1026-1028 (2008)]; 문헌[Korlach et al. Proc. Natl. Acad. Sci. USA 105, 1176-1181 (2008)]에 기재되어 있으며, 상기 문헌들의 개시내용은 본원에 참조로 인용된다.
일부 SBS 구현예는 뉴클레오타이드가 연장 생성물에 혼입될 때 방출되는 양성자의 검출을 포함한다. 예를 들어, 방출된 양성자의 검출을 기반으로 하는 시퀀싱은 Ion Torrent(Guilford, CT, a Life Technologies subsidiary)에서 상업적으로 입수 가능한 전기 검출기 및 관련 기술, 또는 하기 문헌에 기재된 시퀀싱 방법 및 시스템을 사용할 수 있다: US 2009/0026082 A1; US 2009/0127589 A1; US 2010/0137143 A1; 또는 US 2010/0282617 A1(상기 문헌들은 각각 본원에 참조로 인용됨). 운동역학적 배제(kinetic exclusion)를 사용하여 핵산을 증폭시키는 본원에 제시된 방법은 양성자를 검출하는 데 사용되는 기질에 용이하게 적용될 수 있다. 보다 구체적으로, 본원에 제시된 방법은 양성자를 검출하는 데 사용되는 앰플리콘의 클론 집단을 생성하는 데 사용될 수 있다.
또 다른 유용한 시퀀싱 기술은 나노포어 시퀀싱이다(예를 들어, 문헌[Deamer et al. Trends Biotechnol. 18, 147-151 (2000)]; 문헌[Deamer et al. Acc. Chem. Res. 35:817-825 (2002)]; 문헌[Li et al. Nat. Mater. 2:611-615 (2003)](상기 문헌들의 개시내용은 본원에 참조로 인용됨) 참조). 일부 나노포어 구현예에서, 핵산 또는 핵산에서 제거된 개별 뉴클레오타이드는 나노포어를 통과한다. 핵산 또는 뉴클레오타이드가 나노포어를 통과할 때, 공극의 전기 전도도 변동을 측정하는 방식으로 각각의 뉴클레오타이드 유형을 식별할 수 있다. (미국 특허 제7,001,792호; 문헌[Soni et al. Clin. Chem. 53, 1996-2001 (2007)]; 문헌[Healy, Nanomed. 2, 459-481 (2007)]; 문헌[Cockroft et al. J. Am. Chem. Soc. 130, 818-820 (2008)](상기 문헌들의 개시내용은 본원에 참조로 인용됨)).
본 개시내용에 따른 검출에 적용될 수 있는 어레이 기반 발현 및 유전자형 분석을 위한 예시적인 방법은, 미국 특허 제7,582,420호; 제6,890,741호; 제6,913,884호 또는 6,355,431호, 또는 미국 특허 공개공보 제2005/0053980 A1호; 제2009/0186349 A1호 또는 제2005/0181440 A1호에 기재되어 있으며, 상기 문헌들은 각각 본원에 참조로 인용된다.
본원에 제시된 방법의 이점은, 복수의 핵산을 병렬로 신속하고 효율적으로 검출할 수 있다는 점이다. 따라서, 본 개시내용은 상기 예시된 것들과 같은 당업계에 공지된 기술을 사용하여 핵산을 제조하고 검출할 수 있는 통합 시스템을 제공한다. 따라서, 본 개시내용의 통합 시스템은 증폭 시약 및/또는 시퀀싱 시약을 하나 이상의 고정된 DNA 단편에 전달할 수 있는 유체 구성요소를 포함할 수 있으며, 상기 시스템은 펌프, 밸브, 저장소, 유체 라인 등과 같은 구성요소를 포함한다. 플로우셀은 핵산의 검출을 위한 통합 시스템으로 구성되고/되거나 이에 사용될 수 있다. 예시적인 플로우셀은, 예를 들어 US 2010/0111768 A1 및 미국 특허 공개공보 제2012/0270305 A1호에 기재되어 있으며, 상기 문헌들은 각각 본원에 참조로 인용된다. 플로우셀에 대해 예시된 바와 같이, 통합 시스템의 유체 구성요소 중 하나 이상이 증폭 방법과 검출 방법에 사용될 수 있다. 핵산 시퀀싱 구현예를 예로 들면, 통합 시스템의 유체 구성요소 중 하나 이상이 본원에 제시된 증폭 방법과, 상기 예시된 바와 같은 시퀀싱 방법에서 시퀀싱 시약의 전달에 사용될 수 있다. 대안적으로, 통합 시스템은 증폭 방법을 수행하고 검출 방법을 수행하기 위해 별도의 유체 시스템을 포함할 수 있다. 증폭된 핵산을 생성하고 또한 핵산의 서열을 결정할 수 있는 통합 시퀀싱 시스템의 예에는, 비제한적으로, MiSeq™ 플랫폼(Illumina, Inc., San Diego, CA), 및 미국 특허 공개공보 제2012/0270305호에 기재된 장치가 포함되며, 상기 문헌은 본원에 참조로 인용된다.
III. 헤어핀 어댑터와, 우라실 특이적 절단 시약 또는 제한 엔도뉴클레아제를 사용하여 시퀀싱 라이브러리에서 표적 서열을 농축시키는 방법
본원에 기재된 헤어핀 어댑터는 다수의 상이한 워크플로우에 사용될 수 있다. 예를 들어, 표적 서열을 포함하는 단편의 존재를 증가시키고/시키거나 표적 서열을 포함하지 않는 단편의 존재를 감소시키기 위해 다수의 상이한 워크플로우가 사용될 수 있다.
A. 우라실을 포함하는 핵산 가닥과 우라실 특이적 절단 시약
일부 제한 효소는 우라실을 포함하는 핵산 가닥을 절단할 수 없다. 일부 구현예에서, 제한 엔도뉴클레아제 절단 부위 내 티민을 대체하면 엔도뉴클레아제에 의한 절단이 저해된다. (문헌[Glenn et al. Biotechniques 17(6): 1086-1090] 참조.) 일부 구현예에서, 상기 방법은, 도 2에 제시된 바와 같이, 제한 효소 소화에 대해 저항성이 있는 우라실을 포함하는 핵산 가닥을 생성하는 단계를 포함한다.
일부 구현예에서, 우라실을 포함하는 핵산 가닥 내 우라실은 제한 엔도뉴클레아제 절단 부위 내 티민을 대체한다.
일부 구현예에서, 우라실을 포함하는 핵산 가닥은 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열의 전부 또는 일부를 포함하기 때문에, 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열을 포함하는 이중 가닥 핵산을 제한 엔도뉴클레아제 절단에 대해 저항성이 있도록 만든다.
일부 구현예에서, 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제는 우라실을 포함할 수 있다.
일부 구현예에서, 상기 방법은 하나 이상의 우라실 특이적 절단 시약(USER)을 사용하는 것을 포함한다. USER은 우라실을 포함하는 핵산 가닥을 절단할 수 있다.
일부 구현예에서, 연장 프라이머를 사용하여 핵산 가닥을 생성하는 단계는 우라실을 포함하는 반응 혼합물을 이용하여 수행된다. 일부 구현예에서, 우라실을 포함하는 반응 혼합물을 이용하여 생성된 핵산 가닥은 하나 이상의 USER에 의해 절단된다. 일부 구현예에서, USER은 우라실 DNA 글리코실라아제 및 엔도뉴클레아제 VIII이다. 일부 구현예에서, USER은 우라실 DNA 글리코실라아제 및 엔도뉴클레아제 VIII의 활성을 갖는 단일 효소이다.
일부 구현예에서, 우라실을 포함하는 반응 혼합물을 이용하여 생성된 핵산 가닥은 제한 엔도뉴클레아제 소화에 대해 저항성이 있다.
B. 제한 엔도뉴클레아제
일부 구현예에서, 상기 방법은, 표적 서열을 포함하지 않는 라이브러리 내 복수의 이중 가닥 단편에서, 제한 엔도뉴클레아제를 이용하여 헤어핀 어댑터를 절단하는 단계를 추가로 포함한다.
일부 구현예에서, 제한 엔도뉴클레아제는 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열의 회합에 의해 형성된 이중 가닥 핵산에서 절단한다.
일부 구현예에서, 제한 엔도뉴클레아제는 어댑터 서열과 어댑터 서열에 적어도 부분적으로 상보적인 서열의 회합에 의해 형성된 이중 가닥 핵산에서 절단한다(예를 들어, 도 2에서의 A14/A14'의 절단 참조).
일부 구현예에서, 제한 엔도뉴클레아제에 의한 절단 효율은 엔도뉴클레아제의 절단 부위를 포함하는 이중 가닥 DNA 서열로 구성된 우라실의 양이 증가함에 따라 감소한다. 일부 구현예에서, 제한 엔도뉴클레아제는 우라실을 포함하는 하나 이상의 이중 가닥 핵산을 절단할 수 없다.
일부 구현예에서, 제한 엔도뉴클레아제의 절단 부위는 티민을 포함한다. 일부 구현예에서, 우라실을 핵산 가닥에 혼입시키면 이전에 제한 엔도뉴클레아제 절단 부위였던 서열이 변경되어, 이러한 가닥과 이의 상보체를 절단으로부터 보호한다. 일부 구현예에서, 제한 효소는 헤어핀 어댑터를 절단하고 오버행을 생성한다. 일부 구현예에서, 제한 효소는 헤어핀 어댑터를 절단하고 평활 말단을 생성한다.
C. 적어도 부분적으로 상보적인 하나 초과의 서열 세트를 포함하는 헤어핀 어댑터와 USER을 포함하는 방법
일부 구현예에서, 이중 가닥 단편의 시퀀싱 라이브러리에서 표적 서열을 농축시키는 방법은, 시퀀싱 라이브러리를 제작하는 단계(여기서, 각각의 단편은 이중 가닥 핵산을 포함하는 삽입체와, 이중 가닥 단편의 한쪽 또는 양쪽 가닥의 5' 말단에 있는 헤어핀 어댑터를 포함하고, 여기서 헤어핀 어댑터는 뉴클레오타이드 서열의 제1 세트(여기서, 뉴클레오타이드 서열의 제1 세트는 어댑터 서열과 어댑터 서열에 적어도 부분적으로 상보적인 서열을 포함함); 뉴클레오타이드 서열의 제2 세트(여기서, 뉴클레오타이드 서열의 제2 세트는 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열을 포함하며, 여기서 뉴클레오타이드 서열의 제1 세트는 뉴클레오타이드 서열의 제2 세트보다 삽입체에 더 가까움); 및 어댑터 서열에 적어도 부분적으로 상보적인 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열 사이의 링커를 포함함); 이중 가닥 단편을 변성시켜 단일 가닥 단편을 형성하는 단계; 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제를 사용하여, 시퀀싱 라이브러리 내 적어도 하나의 삽입체에 포함된 표적 서열에 결합하는 제1 연장 프라이머를 사용하여 핵산 가닥을 생성하고(여기서, 핵산 가닥을 생성하기 위한 반응 혼합물은 우라실을 포함함), 어댑터 서열에 적어도 부분적으로 상보적인 서열의 전부 또는 일부를 제거하는 단계; 제1 연장 프라이머를 제거하는 단계; USER을 제공하는 단계; 및 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제를 사용하여, (1) 이중 가닥 단편의 라이브러리 내 적어도 하나의 삽입체에 포함된 표적 서열에 결합하는 제2 연장 프라이머를 사용하여 핵산 가닥을 생성하고, (2) 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열의 전부 또는 일부를 제거하는 단계를 포함한다. 이러한 방법의 대표적인 예가 도 2에 제시되어 있다.
일부 구현예에서, 증폭 프라이머 서열의 상보체 및/또는 어댑터 서열에 적어도 부분적으로 상보적인 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열 사이의 링커는 엑소뉴클레아제에 저항성이 있다.
일부 구현예에서, 증폭 프라이머 서열의 상보체 및/또는 어댑터 서열에 적어도 부분적으로 상보적인 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열 사이의 링커는 우라실을 포함한다.
일부 구현예에서, 상기 방법은 제1 프라이머를 사용하여 핵산 가닥을 생성한 후 제한 엔도뉴클레아제를 이용하여 헤어핀 어댑터를 절단하는 단계를 추가로 포함하며, 여기서 상기 헤어핀 어댑터는 어댑터 서열에 적어도 부분적으로 상보적인 서열의 전부 또는 일부가 존재하고, 우라실을 포함하지 않는 라이브러리의 이중 가닥 단편에 포함되어 있다.
일부 구현예에서, 제1 프라이머 연장을 사용하여 생성된 핵산 가닥은 우라실을 포함하며, 제한 엔도뉴클레아제 소화에 대해 저항성이 있다.
일부 구현예에서, 헤어핀 어댑터는 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열 사이에 링커를 추가로 포함한다. 일부 구현예에서, 이러한 링커는 엑소뉴클레아제에 의해 분해되지 않는다. 일부 구현예에서, 이러한 링커는 합성 링커이다. 일부 구현예에서, 이러한 링커는 우라실을 포함하거나 다르게는 폴리머라아제 활성을 중지시키는 역할을 한다.
일부 구현예에서, USER은 제1 프라이머 연장에 의해 생성된 핵산 가닥, 헤어핀 어댑터에 포함된 링커 및/또는 어댑터 서열에 적어도 부분적으로 상보적인 서열을 절단한다. 일부 구현예에서, 제1 프라이머 연장에 의해 생성된 핵산 가닥, 헤어핀 어댑터에 포함된 링커 및/또는 어댑터 서열에 적어도 부분적으로 상보적인 서열은 하나 이상의 우라실을 포함한다.
일부 구현예에서, 제1 연장 프라이머와 제2 연장 프라이머는 상이한 서열에 결합한다. 일부 구현예에서, 제1 연장 프라이머와 제2 연장 프라이머는 이중 가닥 핵산의 동일한 가닥에 결합한다.
일부 구현예에서, 제2 연장 프라이머는 상기 프라이머를 사용하여 핵산 가닥을 생성한 후에 제거된다. 일부 구현예에서, 폴리머라아제 및/또는 제2 연장 프라이머는 SPRI 비드를 사용하여 제거된다. 일부 구현예에서, 폴리머라아제는 변성에 의해 제거되는 열감응성 폴리머라아제이다. 일부 구현예에서, 열감응성 폴리머라아제는 전장 Bst 또는 DNA 폴리머라아제 I이다.
IV. 다중 연장 프라이머의 결찰과 헤어핀 어댑터를 사용하여 시퀀싱 라이브러리에서 표적 서열을 농축시키는 방법
일부 구현예에서, 시퀀싱 라이브러리에서 표적 서열을 농축시키는 방법은, 시퀀싱 라이브러리를 제작하는 단계(여기서, 각각의 단편은 이중 가닥 핵산을 포함하는 삽입체와, 이중 가닥 단편의 한쪽 또는 양쪽 가닥의 5' 말단에 있는 헤어핀 어댑터를 포함하고, 여기서 헤어핀 어댑터는 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열을 포함함); 이중 가닥 단편을 변성시켜 단일 가닥 단편을 형성하는 단계; 프라이머 믹스와, 5'-3' 엑소뉴클레아제 활성 없이 결찰 활성과 폴리머라아제 활성을 갖는 효소 또는 효소들을 사용하여, 프라이머 믹스의 제1 연장 프라이머를 사용하여 핵산 가닥을 생성하고(여기서, 프라이머 믹스는 제1 연장 프라이머와 차단된 제2 연장 프라이머를 포함하고, 여기서 제1 연장 프라이머와 차단된 제2 연장 프라이머는 이중 가닥 핵산에 포함된 상이한 관심 서열에 결합함), 제1 연장 프라이머를 사용하여 생성된 핵산 가닥을 차단된 제2 연장 프라이머에 결찰시키는 단계; 삽입체에 결합되지 않은 프라이머 믹스를 제거하는 단계; 차단된 제2 연장 프라이머를 차단 해제하는 단계; 및 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제를 사용하여, (1) 결찰된 제1 연장 프라이머와 제2 연장 프라이머를 사용하여 핵산 가닥을 생성하고, (2) 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열의 전부 또는 일부를 제거하는 단계를 포함한다.
일부 구현예에서, 차단된 제2 연장 프라이머는, 차단 해제되지 않는 한, 핵산 가닥을 생성할 수 없다. 일부 구현예에서, 차단된 제2 연장 프라이머는 차단이 제거되지 않는 한 연장이 일어날 수 없도록 차단을 포함한다. 일부 구현예에서, 차단은 차단된 제2 프라이머 상의 3' 포스페이트의 존재이다. 일부 구현예에서, 차단된 제2 프라이머는 3' 포스페이트를 절단하는 키나아제에 의해 차단 해제된다. 일부 구현예에서, 차단 해제된 제2 연장 프라이머는 핵산 가닥을 생성할 수 있다.
일부 구현예에서, 차단된 제2 연장 프라이머는 제1 연장 프라이머에 의해 결합된 서열의 5' 및 적어도 하나의 삽입체에 포함된 표적 서열에 결합한다.
일부 구현예에서, 제2 연장 프라이머는 60℃ 미만의 용융 온도로 삽입체에 결합한다. 즉, 제2 연장 프라이머는 삽입체에 대한 결합이 상대적으로 약할 수 있다. 즉, 제2 연장 프라이머는, 제2 연장 프라이머가 차단되었는지 여부에 관계없이, 삽입체에 대한 결합이 상대적으로 약할 수 있다. 일부 구현예에서, 제2 연장 프라이머는 60℃ 초과, 65℃ 초과 또는 70℃ 초과의 온도에서 삽입체로부터 해리된다.
일부 구현예에서, 제2 연장 프라이머와 폴리머라아제는, "핫 스타트" 연장 프로토콜이 사용되는 경우, 표준 연장 프로토콜과 비교하여 더 적은 핵산 가닥을 생성한다. 일부 구현예에서, 제2 연장 프라이머와 폴리머라아제는, 온도가 60℃ 초과, 65℃ 초과 또는 70℃ 초과인 경우, 더 적은 핵산 가닥을 생성한다. 일부 구현예에서, 제2 연장 프라이머와 폴리머라아제는 60℃ 초과, 65℃ 초과 또는 70℃ 초과의 온도에서 핵산 가닥을 생성할 수 없다.
일부 구현예에서, 결찰된 제1 연장 프라이머와 제2 연장 프라이머는 60℃ 이상의 용융 온도로 삽입체에 결합한다. 즉, 결찰된 제1 연장 프라이머와 제2 연장 프라이머는 삽입체에 대한 결합이 상대적으로 강할 수 있다. 일부 구현예에서, 결찰된 제1 연장 프라이머와 제2 연장 프라이머는 60℃ 초과, 65℃ 초과 또는 70℃ 초과의 온도에서 삽입체와 회합된 상태로 유지된다. 일부 구현예에서, 결찰된 제1 연장 프라이머와 제2 연장 프라이머를 사용하여 핵산 가닥을 생성하는 단계는 60℃ 이상의 온도에서 수행된다. 일부 구현예에서, 결찰된 제1 연장 프라이머와 제2 연장 프라이머를 사용하여 핵산 가닥을 생성하는 단계는 60℃ 이상, 65℃ 이상 또는 70℃ 이상의 온도에서 수행된다. 일부 구현예에서, 결찰된 제1 연장 프라이머와 제2 연장 프라이머의 어닐링 및 연장 온도는 제2 연장 프라이머의 용융 온도보다 높다.
일부 구현예에서, 제2 연장 프라이머는 증폭시키는 단계 전에 제거된다. 일부 구현예에서, 제2 연장 프라이머는 SPRI 비드 또는 엑소뉴클레아제를 사용하여 제거된다.
실시예
실시예 1. 헤어핀 어댑터를 사용하여 시퀀싱 라이브러리에서 표적 서열을 농축시키는 방법
헤어핀 어댑터를 이용한 방법을 사용하여 시퀀싱 라이브러리에서 표적 서열을 농축시킬 수 있다. 도 1은, 각각의 상이한 삽입체(14)를 갖는 복수의 단편(12)으로 형성된 시퀀싱 라이브러리의 대표적인 단편인 이중 가닥 단편(12)의 예를 보여준다. 각각의 단편(12)은 양쪽 말단에 어댑터(18)를 포함한다. 예시된 구현예에서, 어댑터(18)는 동일하다. 어댑터는 제1 가닥(22)과 제2 가닥(23)을 갖는 분기형 어댑터이다. 제1 가닥(22)과 제2 가닥(23)은 이중 가닥 영역(24)을 형성한다. 제1 가닥은 또한 헤어핀 이중 가닥 영역(26)과 이러한 이중 가닥 영역(26)의 자가 상보적 부분 사이에 배치된 링커(27)를 갖는 헤어핀 영역(25)을 포함한다.
도 1의 특정 예에서, 헤어핀 영역(25)은 A14와 이의 상보체 A14'를 포함한다. 이중 가닥 영역(26) 내 A14/A14'의 염기쌍 형성은, 헤어핀 영역(25)이 온전한 경우, A14 프라이머 서열이 증폭 프라이머에 결합할 수 없음을 의미한다. 이러한 예에서, 헤어핀 영역(25)의 이중 가닥 영역(26)은 A14 프라이머 서열과 이의 상보체(A14')를 포함한다.
도 1에 제시된 워크플로우는 단편(12)을 변성시켜 양성 및 음성 가닥을 생성하는 단계를 포함한다. 예시된 예에서, 음성 가닥(28)이 도시되어 있다. 하지만, 워크플로우 단계는 구현예에서 양성 가닥에도 적용됨을 이해해야 한다. 단편(12)이 관심있는 표적화된 삽입체(14a)를 함유하는 경우, 가닥(28a)은 표적화된 삽입체(14a)의 일부에 상보적인 연장 프라이머(29)에 결합한다. 헤어핀 영역(25)의 A14' 서열은 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제(30)(예컨대, Taq)를 사용하여 제거된다. 폴리머라아제(30)는 이전의 이중 가닥 영역(26)을 단일 가닥으로 만들어, A14 서열을 이용 가능하게 만든다.
이어서, 폴리머라아제(30)가 제거된다. 제1 증폭 프라이머(36)로부터 전체 연장은 가닥(28a)을 카피할 수 있으며, 제2 증폭 프라이머(38)는 생성된 핵산 가닥 내 A14'에 결합하여 표적 서열을 포함하는 삽입체를 포함하는 단편을 특이적으로 증폭시킨다. 이러한 방법에서, (단편 생성 실패를 통해) 헤어핀 어댑터가 없는 단편, 또는 헤어핀 어댑터와 헤어핀 영역(25)이 "잠금된"(즉, 헤어핀의 A14 서열과 A14' 서열이 서로 회합되어 있는) 가닥(28b)과 같은 단편 또는 가닥은 증폭되지 않는다. 잠금된 헤어핀은 폴리머라아제가 A14에 이르도록 연장되는 것을 방지하기 때문에; 헤어핀을 포함하는 단편은 A14'를 포함하는 핵산 가닥을 생성할 수 없고, 따라서 A14 프라이머에 의해 증폭될 수 없다. 이러한 방법에서 연장 프라이머의 길이는 삽입체 서열을 포함하는 삽입체에의 결합에 대한 특이성을 보장하기 위해 증가될 수 있다. i5 서열과 i7 서열은 어레이에서 샘플 및 위치를 식별하는 데 사용될 수 있는 인덱스 서열을 나타낸다. ME = 모자이크 말단 서열(트랜스포사아제가 트랜스포존을 표적 서열에 통합시키는 데 필요한 트랜스포존 내 서열) 및 ME' = 모자이크 말단 서열의 상보체. 증폭은 각각의 말단에 상이한 시퀀싱 프라이머와 인덱스를 갖는 표적화된 삽입체(14)를 포함하는 전장 생성물(50)을 생성한다.
시퀀싱 라이브러리에서 표적 서열을 농축시키기 위해, 사용자는 이중 가닥 DNA 내 하나 이상의 표적 서열에 결합하는 연장 프라이머(즉, 표적 프로브)를 생성할 수 있다. 공지된 라이브러리 생성 및 태그 지정 수단(예컨대, Nextera, Truseq 등)을 사용하여, 헤어핀 함유 어댑터(18)를 이중 가닥 단편의 한쪽 또는 양쪽 5' 말단에 부가할 수 있다.
라이브러리의 이중 가닥 단편을 변성시킬 수 있다. 이어서, 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제를 사용하여, (1) 이중 가닥 단편의 라이브러리 내 적어도 하나의 삽입체에 포함된 표적 서열에 결합하는 연장 프라이머를 사용하여 핵산 가닥을 생성할 수 있고, (2) A14' 서열의 전부 또는 일부를 제거할 수 있다.
헤어핀의 A14' 서열이 제거된(즉, 헤어핀이 잠금 해제된) 단편에서, 증폭 프라이머를 사용하여 잠금 해제된 헤어핀 어댑터로 단편을 이어서 선택적으로 증폭시킬 수 있다. 이러한 방법을 사용하면, 잠금 해제된 헤어핀을 갖는 단편만 증폭되게 된다. 헤어핀의 A14' 서열의 전부 또는 일부가 온전한 헤어핀을 포함하는 단편은 증폭되지 않는다. 도 1에 도시된 비표적 삽입체(14b)를 포함하는 증폭되지 않은 예에서, 헤어핀 어댑터 내 A14 서열은 상보적 A14' 서열과 염기쌍을 형성한다. 헤어핀 어댑터가 온전한 경우, 증폭 프라이머는 "잠금된" 헤어핀 2차 구조로 인해 증폭 프라이머 서열에 결합할 수 없다. 따라서, 비표적 삽입체는 증폭되지 않는다.
도 1에 도시된 방법에서, 제1 가닥이 (B15'를 포함하는 프라이머를 사용하여) 증폭되는 경우, A14'를 포함하는 핵산 가닥이 생성된다(점선으로 표시되어 있음). 라이브러리 단편에서 새로 생성된 가닥을 변성시킨 후, A14를 포함하는 증폭 프라이머가 증폭을 위해 A14'에 결합할 수 있다(A14가 도 1의 점선 가닥에 결합하는 것으로 표시되어 있음).
실시예 2. 헤어핀 어댑터와 USER 시약을 사용하여 시퀀싱 라이브러리에서 표적 서열을 농축시키는 방법
"이중 잠금 해제" 방법을 사용하여 시퀀싱 라이브러리에서 표적 서열을 농축시킬 수 있다(도 2). 이러한 대표적인 방법에서, 헤어핀 영역(25)은 X' 서열 내 우라실, 또는 우라실을 포함하는 것과 같은 합성 링커(60)인 링커(27)를 포함한다. 표적화된 삽입체(14a) 내 표적 서열에 결합하는 2개의 연장 프라이머(fwd1(62)과 fwd2(64))의 순차적 사용은, "이중 잠금 해제"(A14'의 제거, 이어서 X'의 순차적 제거)를 사용하는 방식으로 시퀀싱 라이브러리에서 표적 서열의 농축을 증가시키는 것을 가능하게 한다. 이러한 순차적 방법에서, 제1 핵산 가닥은 우라실을 포함한다. 제한 엔도뉴클레아제를 사용하여 헤어핀 어댑터 내 A14/A14' 서열을 절단할 수 있으며, 여기서 A14' 서열이 제거되지 않고 우라실을 포함하는 서열로 대체된다. 제한 엔도뉴클레아제 단계를 사용하여 표적 서열을 포함하지 않는 삽입체(즉, "표적화되지 않은 삽입체"를 포함하는 단편)를 제거할 수 있다.
이러한 방법을 사용하면, 특이성을 증가시키는 이러한 방법의 단계에 기반하여, 시퀀싱 라이브러리에서 표적 서열이 고도로 농축되는 것을 확인할 수 있다. 이러한 방법은 단일 삽입체에 포함될 수 있는 표적 서열에 결합할 수 있는 2개의 연장 프라이머(fwd1과 fwd2)를 사용한다. 즉, fwd1과 fwd2는 이중 가닥 DNA 샘플에서 공간적으로 근접한 표적 서열에 결합할 수 있다.
이러한 방법에서 헤어핀 어댑터는 2 세트의 상보적 핵산(도 2의 A14/A14' 및 X/X')을 포함한다. 이러한 구현예에서, A14는 어댑터이고(A14'는 이의 상보체임), X는 증폭 프라이머 서열이다(X'는 이의 상보체임). 나아가, X' 및/또는 X'와 A14' 사이의 링커는 우라실을 포함하거나, 다르게는 엑소뉴클레아제에 저항성이 있다.
라이브러리 단편을 변성시키고, 연장 프라이머를 부가한다(fwd1). 이어서, 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제(예컨대, Taq)를 사용하여, (1) fwd1을 사용하여 핵산 가닥을 생성하고(여기서, 핵산 가닥을 생성하기 위한 반응 혼합물은 우라실 NTP를 포함함), (2) A14'의 전부 또는 일부를 제거한다. 따라서, 생성된 핵산 가닥은 우라실을 포함하며, 제한 엔도뉴클레아제 절단에 대해 저항성이 있다.
fwd1 프라이머를 (엑소뉴클레아제 또는 SPRI 비드를 사용하여) 제거한다.
또한, 제한 효소는 임의의 헤어핀 어댑터를 절단할 수 있으며, 여기서 A14'가 제거되지 않고 우라실을 포함하는 핵산 가닥으로 대체된다. 도 2에 도시된 바와 같이, 우라실을 포함하는 핵산 가닥은 A14 서열이 제한 엔도뉴클레아제에 의해 절단되는 것을 차단할 수 있다. 대조적으로, 우라실을 포함하는 핵산 가닥이 생성되지 않은 라이브러리 단편(즉, fwd1 프라이머에 결합하지 않았던 삽입체를 포함하는 단편) 상의 헤어핀 어댑터는 제한 엔도뉴클레아제에 의해 절단된다.
이어서, USER을 사용하여 우라실을 포함하는 핵산 가닥, 및/또는 합성 링커(A14'와 X' 사이) 또는 X' 내 우라실을 절단할 수 있다. 이어서, fwd2 프라이머가 결합할 수 있고, 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제(예컨대, Taq)를 사용하여, (1) 표적 서열에 결합하는 fwd2를 사용하여 핵산 가닥을 생성하고, (2) X'의 전부 또는 일부를 제거한다. 이제, X'가 제거되었으므로, X에 결합하는 증폭 프라이머를 사용하여 fwd1과 fwd2 모두에 결합할 수 있는 삽입체를 포함하는 단편을 선택적으로 증폭시킬 수 있다. 이러한 방법은, fwd1 프라이머와 fwd2 프라이머에 의해 매개되는 별도의 차단 해제 단계(A14'를 제거한 후, X'를 제거함)를 포함하고, 또한 우라실 없이 A14/A14'를 포함하는 온전한 헤어핀 어댑터의 제한 엔도뉴클레아제 절단을 포함하기 때문에, 특이성이 증가되었다.
실시예 3. 2개의 연장 프라이머의 결찰과 헤어핀 어댑터를 사용하여 시퀀싱 라이브러리에서 표적 서열을 농축시키는 방법
이러한 방법에서, 2개의 연장 프라이머(80, 82)(fwd1과 fwd2)를 사용하며, 이들 프라이머는 모두 관심 삽입체 내 표적 서열에 결합한다. 즉, 도 3에 도시된 바와 같이, fwd1 연장 프라이머와 fwd2 연장 프라이머는 각각 개별 표적화된 삽입체 서열(14a)의 상이한, 예를 들어 비연속 영역에 결합한다. 엑소뉴클레아제 활성이 없는 폴리머라아제와 리가아제를 사용하여, 결찰된 fwd1 및 fwd2 구조(84)를 생성한다. fwd2가 차단 해제된 후, 이러한 결찰된 프라이머를 핫 스타트 연장 반응에 사용할 수 있다. 즉, fwd2 프라이머가 차단되어, 연장을 매개할 수 없다. 이러한 경우, 엑소뉴클레아제 활성이 없는 폴리머라아제와 리가아제를 포함하는 효소 믹스를 이용하여 초기 연장을 수행한다. 엑소뉴클레아제 활성이 없는 폴리머라아제와 리가아제의 이러한 믹스는 ELM 믹스일 수 있다(예컨대, Illumina DNA PCR-Free Library Prep kit #1000000086922에 제공되어 있음). 따라서, fwd1로부터의 연장은 fwd2를 절단하지 않고 fwd1과 fwd2 사이의 핵산 가닥을 결찰시킨다.
결찰된 fwd1-fwd2 프라이머는, 결찰된 프라이머와 삽입체 사이에 있는 다수의 쌍을 이룬 뉴클레오타이드에 기반하여 삽입체에 고친화도 결합하게 된다. 이어서, fwd2에 대한 차단을 제거할 수 있다.
fwd2 프라이머는 표적 서열에 대해 상대적으로 낮은 친화도를 갖도록, 용융 온도가 60℃ 미만이 되도록 설계될 수 있다. 이러한 방식으로, "핫 스타트" 연장 반응(60℃ 이상의 온도에서 개시됨)은, fwd2 프라이머가 핵산 가닥의 생성 전에 삽입체로부터 해리될 수 있음을 의미한다. 대조적으로, 결찰된 fwd1-fwd2 차단 해제된 프라이머는 더 높은 온도에서 결합된 상태를 유지하고, 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제를 사용하여, (1) 결찰된 제1 연장 프라이머와 제2 연장 프라이머를 사용하여 핵산 가닥을 생성하고, (2) A14'의 전부 또는 일부를 제거하는 것을 매개할 수 있다.
이러한 방법을 사용하면, fwd1과 fwd2 둘 모두를 이용하여 시퀀싱 라이브러리에서 표적 서열을 농축시킬 수 있다. 따라서, 이러한 방법은 fwd1에 결합하는 표적 서열과 fwd2에 결합하는 표적 서열을 포함하는 관심 단편을 선택적으로 증폭시키는 데 있어서 더 큰 특이성을 나타낸다.
실시예 4. 연결된 연장 프라이머와 헤어핀 어댑터를 사용하여 시퀀싱 라이브러리에서 표적 서열을 농축시키는 방법
도 4에 도시된 또 다른 예에서, 2개의 프라이머(90, 92)는, 일 구현예에서, 표적화된 삽입체 서열에 상보적이지 않은 링커(94)를 통해 연결되어, 연결된 연장 프라이머 구조(96)를 형성한다. 도 4에서 fwd1과 fwd2로 예시된 프라이머(90, 92)는 표적화된 삽입체 서열의 2개의 상이한 비연속 영역에 상보적이다. 연결된 연장 프라이머 구조의 용융 온도는, 링커가 혼성화되지 않아, 용융 온도에 유의하게 기여하지 않기 때문에, 도 4에 도시된 바와 같이 fwd1' 프라이머 및 fwd2' 프라이머에 대한 상보적 서열에 혼성화될 때의 용융 온도에 의해 결정된다.
어닐링과 연장은 fwd1 연장 프라이머 또는 fwd2 연장 프라이머 단독의 용융 온도보다 높은 용융 온도에서 일어날 수 있다. 용융 온도는, fwd1 프라이머 또는 fwd2 프라이머 중 하나만 상보적 서열을 갖는 경우, 연결된 연장 프라이머 구조가 결합할 수 없을 정도로 충분히 높다. 2개의 프라이머가 모두 표적화된 삽입체 서열에 결합할 수 있는 경우, 연결된 연장 프라이머 구조는 연장을 위해 결합된 상태를 유지할 수 있다. 따라서, 2개의 별개의 서열이 존재해야 하는 더 높은 특이성 요건이 실현된다. 결합된 연결된 연장 프라이머 구조는, 헤어핀 어댑터의 이중 가닥 부분을 제거하여 도시된 바와 같이 5' A14 서열을 드러내거나 잠금 해제하기 위해, 본원에 일반적으로 논의된 바와 같은 엑소뉴클레아제 활성을 갖는 폴리머라아제를 사용하는 연장 반응에 사용될 수 있다.
링커는 2개의 상이한 프라이머를 연결하는 범용 서열일 수 있다. 복수의 상이한 표적화된 삽입체 서열을 위한 반응 혼합물을 생성하기 위해, 제1 프라이머와 제2 프라이머의 각각의 상이한 세트는 각각의 관심 표적 서열에 특이적일 수 있다. 따라서, 각각의 상이한 표적 서열은 특정 제1 프라이머와 특정 제2 연장 프라이머를 가질 수 있다. 하지만, 모든 세트에 대한 연결 서열은 각각의 제1 프라이머를 이의 상응하는 제2 프라이머와 연결하는 데 사용되는 동일한 서열일 수 있다. 이러한 배열은 공통 링커 서열에 의해 연결되는 더 짧은 특정 서열을 상대적으로 덜 비싸게 맞춤형으로 제조하는 것을 가능하게 한다. 링커는, 링커가 어떠한 표적화된 삽입체 서열에도 결합하지 않도록 설계될 수 있다.
실시예 5. 결찰된 이중 가닥 어댑터를 사용하여 시퀀싱 라이브러리에서 표적 서열을 농축시키는 방법
본원에 논의된 특정 구현예는 헤어핀 어댑터에 관한 것이지만, 도 5에 예시된 바와 같이 연장 매개 이중 가닥 어댑터 결찰을 이용하여 다른 구현예를 구현할 수 있다. 도 5는 삽입체(14)를 갖는 라이브러리 단편(12) 사이의 비교를 나타내며, 여기서 일부 단편(12)은 표적화된 삽입체 서열을 갖고(14a), 다른 단편(12)은 표적화된 삽입체 서열을 갖지 않는다(14b).
단편(12)은 말단 어댑터(100)를 갖는다. 각각의 말단 어댑터는 제1 가닥(101)과 제2 가닥(102)을 포함한다. 제1 가닥(101)과 제2 가닥(102)의 부분은 상보적이며, 함께 이중 가닥 영역(103)을 형성한다. 제2 가닥(102)의 또 다른 부분은 이중 가닥 영역(103)의 3' 말단으로부터 멀리 연장되는 단일 가닥 3' 말단 영역(104)을 포함한다. 도 5의 예시된 예에서 어댑터(100)는 헤어핀을 포함하지 않는다.
단편을 변성시켜 분리된 가닥을 형성하면, 표적화된 삽입체(14a)를 함유하는 가닥(112a)에 특이적으로 혼성화되는 표적 특이적 연장 프라이머(110)의 결합이 가능해진다. 표적 서열을 포함하지 않는 삽입체(14b)를 갖는 다른 가닥(112b)은 반응 조건 하에서 프라이머(110)에 결합하지 않는다. 일 구현예에서, 상기 방법은 각각의 상이한 표적 서열에 대해 상이한 서열을 갖는 복수의 표적 특이적 연장 프라이머(110)와 함께 사용될 수 있다.
프라이머(110)로부터 상보적 가닥을 연장시키면, 비표적 삽입체(14b)를 갖는 다른 가닥(112b) 상에 존재하지 않는 이중 가닥 말단(120)을 갖는 가닥(112a)과 상보적 가닥의 듀플렉스가 생성된다. 이중 가닥 말단(120)은 이중 가닥 어댑터(124)에 후속으로 결찰되게 되는 A-오버행을 부가하기 위해 연장될 수 있다. 가닥(112a)의 5' 말단에서의 결찰로 5' 말단을 조작하고, 이어서 이를 증폭시켜 표적화된 삽입체(14a)를 함유하는 본원에 제공된 바와 같은 상이한 말단 어댑터를 갖는 전장 생성물(130)을 생성할 수 있다. 예를 들어, 전장 생성물의 각각의 가닥은 5' 말단에 제1 증폭 프라이머 서열과 3' 말단에 제2 증폭 프라이머 서열을 가질 수 있다. 증폭은 본원에 논의된 바와 같은 인덱스된 프라이머를 사용할 수 있다. 예시된 예는 A-오버행 결찰을 나타내지만, 이중 가닥 말단(120)은 또한 평활한 이중 가닥 어댑터에 대한 평활한 이중 가닥 비주형 결찰일 수 있다.
예시된 방법에서, 비표적 삽입체(14b)를 갖는 가닥(112b)은 증폭되지 않는다. 프라이머(110)에 대한 결합 사건이 없기 때문에, 이중 가닥 말단을 생성하는 연장이 없다. 따라서, 프라이머 세트의 단일 프라이머(36)만 비표적 가닥(112b)에 결합할 수 있으며, 비표적 가닥은 증폭되지 않는다.
실시예 6. 헤어핀 어댑터와 대조군 어댑터를 사용한 라이브러리 증폭 결과
헤어핀 영역 내 결합하는 프라이머와 분기형 영역 내 결합하는 프라이머(양성 대조군)를 사용하여 결찰된 헤어핀 어댑터의 PCR 증폭 효과를 시험하기 위해 실험을 설계하였다. 인산화된 5' 말단을 갖는 3' 단일 A-오버행을 포함하도록 모델 80mer 올리고뉴클레오타이드 이중 가닥 DNA 주형을 합성하였다. 이러한 모델 주형은 이중 가닥 DNA 샘플 삽입체에 대한 단순화된 모델의 역할을 했다. 이러한 주형에, Illumina LIG2 시약을 사용하여 30℃에서 10분 동안 2개의 상이한 어댑터 유형을 결찰시켰다. 대조군 듀플렉스 올리고는 1 uM이었고, 어댑터는 9 uM이었다. 먼저, 듀플렉스 ME 영역, 한쪽 분기에 내부 서열 CPH4' 및 B15', 및 다른 쪽 분기에 A14를 함유하는 대조군 어댑터 유형을 사용하였다(도 7 대조군 어댑터 참조). 다른 어댑터 유형은 동일한 ME 듀플렉스 영역, 대조군 어댑터와 동일한 상부 가닥, 하지만 추가 내부 서열(CPH3)을 함유하는 분기의 하부 가닥, 및 A14의 헤어핀을 함유하고 있었다. 어댑터를 95℃에서 변성시킨 후, 얼음 위에서 급속 냉각시켜 Tris-HCl(pH 8), 10 mM NaCl 중에 50 uM의 스톡을 형성하였다. A14와 A14' 사이의 헤어핀 서열은 5개 염기 길이였음에 유의한다. 각각의 어댑터를 별도의 결찰 반응에 부가하여, 듀플렉스의 각각의 말단에 대조군 어댑터 또는 헤어핀 어댑터로 결찰된 듀플렉스를 생성하였다. 내부 프라이머(대조군 분기형 어댑터의 경우 CPH4-ME와 A14-i5-P5, 헤어핀 어댑터의 경우 CPH4-ME와 CPH3-ME) 또는 외부 프라이머(두 가지 어댑터의 경우 모두 A14-i5-P5와 B15-i7-P7)를 사용하여 PCR 증폭을 수행하였다. 결찰된 주형을 7.5배로 희석하고, Illumina PCR 믹스(EPM) 중 PCR 시약과 혼합하였다. 95℃에서의 초기 3분 변성, 이어서 95℃에서 20초, 60℃에서 15초의 8회 사이클을 사용하여, 연장 온도를 위한 온도 구배(72℃ 내지 60℃)로 증폭을 수행하였다. 72℃에서 5분 동안 최종 연장시킨 후, 4℃로 만들었다. Agilent D1000 HS Tapestation을 사용하여 증폭 생성물을 정량화하였다.
도 6은 연장 온도 대 피크 몰농도의 4개 패널을 보여주고, 도 7은 도 6의 결과를 생성하기 위해 사용된 대조군 어댑터 구조와 헤어핀 어댑터 구조를 보여준다. 연장 온도 구배에 대한 영향은 거의 없는 것으로 보이지만, 외부 프라이머로 증폭된 경우 헤어핀 어댑터에서 가장 낮은 증폭 생성물이 생성되었음이 명확하게 나타난다(하부 우측 패널). 헤어핀 어댑터에 대한 대조군 내부 프라이머는, 생성물이 내부 프라이머로 결찰된 어댑터 주형으로부터 증폭될 수 있음을 명확하게 보여주며, 이는 헤어핀 어댑터 결찰을 확인시켜 준다. 비헤어핀 어댑터 라이브러리의 경우, 내부 및 외부 프라이머 쌍에서 PCR을 사용하는 경우 유사한 수율이 관찰되었다. 이러한 데이터는, 헤어핀에 포함된 프라이머 쌍(이러한 경우 A14)이 사용되는 경우, 헤어핀 어댑터 서열이 PCR 증폭을 저해함을 시사한다. 즉, 헤어핀의 잠금된 구성은 증폭을 방지한다.
등가물
전술한 명세서는 당업자가 구현예를 실시할 수 있게 하기에 충분한 것으로 간주된다. 전술한 설명 및 실시예는 특정 구현예를 상세하게 설명하며, 발명자가 고려된 최상의 방식을 설명한다. 전술한 내용이 본문에서 아무리 상세하게 설명되었다 하더라도, 구현예는 다수의 방식으로 실시될 수 있으며, 첨부된 청구범위 및 이의 임의의 등가물에 따라 해석되어야 함을 이해할 것이다.
본원에 사용된 약이라는 용어는, 명시적으로 표시되는지 여부에 관계없이, 예를 들어 정수, 분수 및 백분율을 포함하는 수치값을 나타낸다. 약이라는 용어는 일반적으로, 당업자가 인용된 값과 동등한(예를 들어, 동일한 기능 또는 결과를 갖는) 것으로 간주하는 수치값의 범위(예를 들어, 인용된 범위의 +/- 5% 내지 10%)를 나타낸다. 적어도 및 약과 같은 용어가 수치값 또는 범위의 목록에 선행하는 경우, 이러한 용어는 목록에 제공된 모든 값 또는 범위를 조정한다. 일부 경우에, 약이라는 용어는 가장 가까운 유효숫자로 반올림된 수치값을 포함할 수 있다.
도 2는, 본 개시내용의 양태에 따라, 헤어핀 어댑터가 증폭 프라이머 서열로부터의 증폭을 차단시킬 수 있는 방법을 보여준다.
도 3은, 본 개시내용의 양태에 따라, 헤어핀 어댑터가 적어도 부분적으로 상보적인 뉴클레오타이드 서열 2 세트(A14/A14' 및 X/X')를 포함하는 방법을 보여준다.
도 4는, 본 개시내용의 양태에 따라, 제1 연장 프라이머와 제2 연장 프라이머(각각 상이한 표적 서열에 결합함)가 링커를 통해 연결되는 방법을 보여준다.
도 5는, 본 개시내용의 양태에 따라, 표적 삽입체를 함유하지 않는 단편에서 어댑터가 결찰되지 않아 양방향 증폭이 없는 것과 대조되는, 표적 삽입체 함유 단편의 말단에 결찰된 이중 가닥 어댑터를 사용하여 시퀀싱 라이브러리에서 표적 서열을 농축시키는 대표적인 방법을 보여준다.
도 6은, 헤어핀 어댑터와 대조군 어댑터를 사용한 라이브러리 증폭 결과를 보여준다.
도 7은, 도 6의 라이브러리 증폭에 사용된 헤어핀 어댑터와 대조군 어댑터를 보여준다.
서열의 설명
표 1은 본원에 언급된 특정 서열의 목록을 제공한다.
[표 1]
구현예의 설명
I. 핵산 시퀀싱 라이브러리를 제작하는 데 사용되는 어댑터 및 라이브러리 제작
일부 구현예에서, 핵산 시퀀싱 라이브러리를 제작하는 데 어댑터가 사용된다.
일부 구현예에서, 이러한 어댑터는 분기형 어댑터이다. 본원에 사용된 "분기형 어댑터"라는 용어는, 2개의 가닥이 서로 어닐링된 제1 말단과 2개의 가닥이 서로 어닐링되지 않은 제2 말단을 갖는 이중 가닥 핵산을 의미한다. 즉, 분기형 어댑터는 이중 가닥 영역과 단일 가닥 영역을 포함한다. 일 구현예에서, 분기형 어댑터의 말단은 이중 가닥이다. 분기형 또는 Y형 어댑터의 예는, 예를 들어 미국 특허 제7,741,463호, 미국 특허 제10253359호 및 미국 특허 제9,868,982호에 기재되어 있으며, 상기 문헌들은 각각 그 전문이 본원에 참조로 인용된다.
일부 구현예에서, 핵산 시퀀싱 라이브러리를 제작하는 데 사용되는 어댑터는 5' 말단과 3' 말단을 갖는 제1 서열과, 5' 말단과 3' 말단을 갖는 제2 서열을 포함하며; 여기서 제1 서열의 3' 말단의 일부와 제2 서열의 5' 말단의 일부는 상보적이며, 함께 제1 이중 가닥 영역을 형성하고; 제1 서열의 5' 말단의 일부와 제2 서열의 3' 말단의 일부는 비상보적이고; 제1 가닥의 5' 말단 부분은 제2 이중 가닥 영역을 포함한다.
일부 구현예에서, 제2 이중 가닥 영역은 헤어핀 구조이다. 일부 구현예에서, 제2 이중 가닥 영역은 비핵산 부분을 포함한다. 일부 구현예에서, 비핵산 부분은 링커이다. 일부 구현예에서, 제1 가닥의 5' 말단은 엑소뉴클레아제에 의해 분해되지 않는 부분을 포함한다. 즉, 제1 가닥의 5' 말단은 엑소뉴클레아제에 저항성이 있을 수 있다. 일부 구현예에서, 제1 이중 가닥 영역은 적어도 5개의 연속된 뉴클레오타이드이다. 일부 구현예에서, 제2 이중 가닥 영역은 적어도 5개의 연속된 뉴클레오타이드이다. 일부 구현예에서, 제2 가닥의 5' 말단은 인산화된다. 일부 구현예에서, 제1 가닥과 제2 가닥의 모든 시토신 염기는 메틸화된다. 일부 구현예에서, 어댑터는 포획 모이어티를 추가로 포함한다.
일부 구현예에서, 핵산 시퀀싱 라이브러리를 제작하는 방법은 복수의 이중 가닥 핵산 단편을 생성하는 단계와, 분기형 어댑터를 복수의 이중 가닥 핵산 단편의 적어도 하나의 말단에 부착시키는 단계를 포함한다. 일부 구현예에서, 하나 이상의 어댑터는 태그먼트화를 통해 부착된다. 일부 구현예에서, 하나 이상의 어댑터는 결찰을 통해 부착된다.
다양한 라이브러리 제작이 당업계에 공지되어 있으며, 본 발명의 방법은 라이브러리 생성 수단에 의해 제한되지 않는다. 일부 구현예에서, 라이브러리는 태그먼트화 또는 결찰을 사용하여 제작된다. 예를 들어, 태그먼트화 또는 결찰 방법은 라이브러리 단편의 말단에 어댑터, 예를 들어 헤어핀 어댑터, 단일 가닥 어댑터 및/또는 이중 가닥 어댑터를 혼입시키는 데 사용될 수 있다.
일부 구현예에서, 트랜스포존 기반 기술은, 예를 들어 Nextera™ DNA 샘플 제조 키트(Illumina, Inc.)의 워크플로우에 예시된 바와 같이 DNA를 단편화하는 데 사용될 수 있으며, 여기서 게놈 DNA는 입력 DNA를 단편화하고 동시에 태그 지정("태그먼트화")하는 조작된 트랜스포좀에 의해 단편화되어, 단편의 말단에 고유한 어댑터 서열을 포함하는 단편화된 핵산 분자 집단을 생성할 수 있다.
전위를 통한 분기형 어댑터의 부가를 통해 시퀀싱 라이브러리를 제작하는 것은 미국 특허 제10,246,746호에 기재되어 있으며, 상기 문헌은 그 전문이 본원에 참조로 인용된다.
본원에 사용된 "태그먼트화"라는 용어는, 트랜스포존 말단 서열을 포함하는 어댑터와 복합체화된 트랜스포사아제(transposase) 효소를 포함하는 트랜스포좀 복합체에 의한 DNA의 변형을 나타낸다. 태그먼트화는 DNA의 단편화와 동시에 듀플렉스 단편의 양쪽 가닥의 5' 말단에의 어댑터의 결찰을 유도한다. 트랜스포사아제 효소를 제거하기 위한 정제 단계 후, 예를 들어 PCR, 결찰, 또는 당업자에게 공지된 임의의 다른 적합한 방법에 의해 조작된 단편의 말단에 추가 서열이 부가될 수 있다.
본원에 사용된 "트랜스포좀 복합체"는 적어도 하나의 트랜스포사아제(또는 본원에 기재된 바와 같은 다른 효소)와 트랜스포존 인식 서열로 구성된다. 일부 이러한 시스템에서, 트랜스포사아제는 트랜스포존 인식 서열에 결합하여 전위 반응을 촉진시킬 수 있는 기능성 복합체를 형성한다. 일부 양태에서, 트랜스포존 인식 서열은 이중 가닥 트랜스포존 말단 서열이다. 트랜스포사아제는 이중 가닥 핵산 내 트랜스포사아제 인식 부위에 결합하여, 트랜스포존 인식 서열을 이중 가닥 핵산에 삽입한다. 일부 이러한 삽입 사건에서, 트랜스포존 인식 서열(또는 말단 서열)의 한쪽 가닥이 이중 가닥 핵산으로 전달되어, 절단 사건이 일어난다. 트랜스포사아제와 함께 사용하기 위해 쉽게 조작될 수 있는 예시적인 전위 절차 및 시스템.
태그먼트화는 고정된 또는 용액상 트랜스포좀 복합체를 이용하여 수행될 수 있다.
결찰에 의한 어댑터의 혼입이 또한 널리 공지되어 있으며, Truseq 샘플 제조 키트(Illumina, Inc.)의 워크플로우에 예시되어 있다.
일부 구현예에서, 핵산 시퀀싱 라이브러리를 제작하기 위한 키트는 분기형 어댑터; 어댑터의 일부와 혼성화 가능한 적어도 하나의 프라이머; 적어도 하나의 효소; 및 dNTP를 포함한다. 일부 구현예에서, 적어도 하나의 효소는 엑소뉴클레아제 활성을 갖는다. 일부 구현예에서, 적어도 하나의 효소는 폴리머라아제이다. 일부 구현예에서, 키트의 적어도 하나의 구성요소는 동결건조된 또는 건조된 형태이다.
II. 헤어핀 어댑터를 사용하여 시퀀싱 라이브러리에서 표적 서열을 농축시키는 방법
헤어핀 어댑터를 사용하여 시퀀싱 라이브러리에서 표적 서열을 농축시키는 방법이 본원에 개시된다. 하기 기재되는 바와 같이, 표적 서열에 결합하는 연장 프라이머와 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제는 헤어핀 어댑터를 특이적으로 "잠금 해제"하고, 표적 서열을 포함하는 단편을 증폭시키는 데 사용될 수 있다(도 1 참조).
일부 구현예에서, 본 발명의 방법을 사용하면, 단편 말단을 회수할 수 없는 농축 방법(예컨대, 멀티플렉스 PCR을 사용하는 직접 표적화된 증폭)과 비교하여, 농축 동안 단편 말단을 회수할 수 있기 때문에, 시퀀싱 결과가 개선된다.
일부 구현예에서, 이중 가닥 단편의 시퀀싱 라이브러리에서 표적 서열을 농축시키는 방법은, 시퀀싱 라이브러리를 제작하는 단계(여기서, 각각의 단편은 이중 가닥 핵산을 포함하는 삽입체와, 이중 가닥 단편의 한쪽 또는 양쪽 가닥의 5' 말단에 있는 헤어핀 어댑터를 포함하고, 여기서 헤어핀 어댑터는 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열을 포함함); 이중 가닥 단편을 변성시켜 단일 가닥 단편을 형성하는 단계; 및 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제를 사용하여, (1) 시퀀싱 라이브러리 내 적어도 하나의 삽입체에 포함된 표적 서열에 결합하는 연장 프라이머를 사용하여 핵산 가닥을 생성하고, (2) 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열의 전부 또는 일부를 제거하는 단계를 포함한다.
일부 구현예에서, 헤어핀 어댑터는 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열을 포함한다.
본 발명의 방법은 무세포 DNA와 같은 단편화된 핵산의 전체 서열을 생성하는 것과 같은 다양한 용도에 사용된다. 나아가, 본 발명의 방법은 단편 중복제거에 사용될 수 있다.
A. 표적 서열 및 시퀀싱 라이브러리에서 표적 서열의 농축
본원에 사용된 "표적 서열"은 임의의 관심 서열을 나타낸다. 예를 들어, 표적 서열은 관심 유전자에 포함된 서열, 관심있는 특정 돌연변이, 또는 사용자가 관심있는 임의의 다른 서열을 포함할 수 있다.
일부 구현예에서, 시퀀싱 라이브러리에서 표적 서열을 농축시키는 본 발명의 방법이 없는 경우, 이중 가닥 핵산으로부터 생성된 라이브러리 단편 중 상대적으로 낮은 비율이 표적 서열을 포함할 수 있다.
일부 구현예에서, 라이브러리 내 복수의 이중 가닥 단편은 농축시키기 전에 표적 서열을 포함하지 않는다. 일부 구현예에서, 라이브러리 내 대부분의 이중 가닥 단편은 농축시키기 전에 표적 서열을 포함하지 않는다.
일부 구현예에서, 시퀀싱 라이브러리에서 표적 서열을 농축시킨다는 것은, 표적 서열을 포함하는 단편이 농축시키기 전에 비해 농축시킨 후 라이브러리에 2배 이상, 5배 이상, 10배 이상, 20배 이상, 50배 이상, 100배 이상, 1,000배 이상, 10,000배 이상 또는 100,000배 이상 더 많이 포함되어 있음을 의미한다. 따라서, 본 발명의 방법은 "농축된 라이브러리"를 생성하는 데 사용될 수 있다. 일부 구현예에서, 본 발명의 방법은 샘플에 포함된 이중 가닥 DNA의 작은 영역(즉, 몇 킬로베이스)을 고도로 농축시킬 수 있다.
일부 구현예에서, 표적 서열은 라이브러리 제작에 사용되는 이중 가닥 핵산에 포함되어 있다. 일부 구현예에서, 이중 가닥 핵산은 표적 농축을 필요로 하거나 표적 농축이 유익할 수 있는 임의의 샘플 유형에 포함되어 있을 수 있다. 일부 구현예에서, 표적 서열은 무세포 DNA(cfDNA)에 포함되어 있다. 일부 구현예에서, 표적 서열은 액체 생검 샘플과 같은 종양학 샘플에 포함되어 있다. 일부 구현예에서, 표적 서열은 엑솜(exome) 샘플에 포함되어 있다. 일부 구현예에서, 표적 서열은 미진단 희귀 질환(RUGD: rare and undiagnosed disease) 엑솜 샘플에 포함되어 있다. 일부 구현예에서, 표적 서열은 RNA 또는 cDNA 라이브러리에 포함되어 있다. 일부 구현예에서, 표적 서열은 메틸화 라이브러리에 포함되어 있다.
B. 증폭 프라이머 서열을 포함하는 헤어핀 어댑터
본원에 사용된 "헤어핀"은, 서로 적어도 부분적으로 상보적인 한 쌍의 핵산 서열을 포함하는 핵산을 나타낸다. 적어도 부분적으로 상보적인 이러한 2개의 핵산 서열은 서로 결합하여 핵산의 접힘(folding)을 매개할 수 있다. 일부 구현예에서, 적어도 부분적으로 상보적인 2개의 핵산 서열은 헤어핀 2차 구조를 갖는 핵산을 생성한다.
본원에 사용된 "헤어핀 어댑터"는, 서로 적어도 부분적으로 상보적인 적어도 한 쌍의 핵산 서열을 포함하는 어댑터를 나타낸다. 일부 구현예에서, 헤어핀 어댑터는 접힌 2차 구조를 갖는다.
도 1은, 각 가닥의 5' 말단에 헤어핀 어댑터를 갖는 이중 가닥 삽입체(삽입체 및 삽입체의 서열)를 포함하는 라이브러리 단편을 보여준다. 도 1의 대표적인 구현예에서, 각각의 헤어핀 어댑터는 서로 적어도 부분적으로 상보적인 한 쌍의 핵산 서열(A14/A14')을 포함한다. 일부 구현예에서, 서로 적어도 부분적으로 상보적인 한 쌍의 핵산 서열 사이의 염기쌍 형성은 어댑터를 헤어핀 2차 구조로 "잠금한다". 이러한 방법에서, 표적 서열을 포함하는 단편을 증폭시키는 방법의 특이성을 개선시키기 위해 사용되는 연장 프라이머의 길이를 증가시킬 수 있다.
일부 구현예에서, 헤어핀 어댑터는 서로 적어도 부분적으로 상보적인 한 쌍 초과의 핵산 서열을 포함한다. 일부 구현예에서, 헤어핀 어댑터는 서로 적어도 부분적으로 상보적인 2쌍의 핵산 서열을 포함한다. 일부 구현예에서, 헤어핀 어댑터는 서로 적어도 부분적으로 상보적인 2쌍 초과의 핵산 서열을 포함한다. 도 2는, 서로 적어도 부분적으로 상보적인 2쌍의 핵산 서열(A14/14' 쌍과 X/X' 쌍)을 포함하는 헤어핀 어댑터를 보여준다.
일부 구현예에서, 헤어핀 어댑터는 증폭 프라이머 서열을 포함한다. 일부 구현예에서, 헤어핀 어댑터는 증폭 프라이머 서열과 어댑터 서열에 적어도 부분적으로 상보적인 서열의 전부 또는 일부를 포함한다.
일부 구현예에서, 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열의 모든 부분이 제거되지 않는 한, 헤어핀 어댑터는 (서로 적어도 부분적으로 상보적인 한 쌍의 핵산 서열 사이의 염기쌍 형성을 통해) "잠금된다". 일부 구현예에서, 잠금된 헤어핀은 폴리머라아제가 증폭 프라이머 서열의 상보체를 연장시키고 생성하는 것을 방지한다.
일부 구현예에서, 본 발명의 방법은 헤어핀 어댑터에 부착되지 않은 단편의 증폭을 차단하는데, 이는 헤어핀 어댑터가 이후 증폭 단계에 사용될 수 있는 증폭 프라이머 서열을 포함하기 때문이다.
이러한 방식으로, 본 발명의 방법은 "잠금 해제된" 헤어핀 어댑터에 부착되는 라이브러리 단편의 증폭만 가능하게 한다. 헤어핀 어댑터에 부착되지 않은 라이브러리 단편과 "잠금된" 헤어핀 어댑터에 부착된 라이브러리 단편은 증폭되지 않는다. 바람직하지 않은 단편(즉, 표적 서열을 포함하지 않는 단편)의 증폭을 저해하는 이러한 수단은 다운스트림 방법과 관련된 비용과 사용자 시간을 회피할 수 있다.
일부 구현예에서, 헤어핀 어댑터는 이중 가닥 단편의 한쪽 가닥의 5' 말단에 있다. 일부 구현예에서, 헤어핀 어댑터는 이중 가닥 단편의 양쪽 가닥의 5' 말단에 있다. 일부 구현예에서, 헤어핀 어댑터는 결찰 또는 태그먼트화에 의해 혼입된다. 일부 구현예에서, 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열은 각각 적어도 14개의 뉴클레오타이드를 포함한다. 일부 구현예에서, 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열은 각각 14개 내지 60개의 뉴클레오타이드를 포함한다. 일부 구현예에서, 헤어핀 어댑터는 안정성을 증가시키기 위한 하나 이상의 증강을 포함한다. 일부 구현예에서, 헤어핀 어댑터는 하나 이상의 변형된 또는 잠금된 핵산을 포함한다. 일부 구현예에서, 변형된 핵산은 8-아자-7-데아자구아노신을 포함한다. 일부 구현예에서, 헤어핀 어댑터는 60℃ 이상, 65℃ 이상 또는 70℃ 이상의 온도에서 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열의 회합을 유지한다.
일부 구현예에서, 증폭 프라이머 서열은 A14 서열(서열번호 1) 또는 B15 서열(서열번호 2), 또는 이들의 상보체(각각, A14' 또는 B15')를 포함한다.
일부 구현예에서, 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열은 증폭 프라이머 서열의 상보체와 50% 이상, 60% 이상, 70% 이상, 80% 이상, 90% 이상, 95% 이상 또는 99% 이상의 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열은 증폭 프라이머 서열의 상보체를 포함한다.
1. 어댑터
일부 구현예에서, 라이브러리 단편은, 헤어핀 어댑터에 더하여 또는 이에 대한 대안으로, 이중 가닥 라이브러리 단편의 양쪽 5' 말단 또는 양쪽 3' 말단에만 제공되는 대칭 단일 어댑터와 같은 하나 이상의 어댑터를 포함한다(도 5). 일 구현예에서, 대칭 단일 어댑터는 이중 가닥 라이브러리 단편의 단일 가닥 말단을 생성한다. 일 구현예에서, 대칭 단일 어댑터는 B15 또는 B15' 어댑터이다. 일 구현예에서, 대칭 단일 어댑터는 A14 또는 A14' 어댑터이다.
일부 구현예에서, 이중 가닥 단편의 한쪽 또는 양쪽 가닥은 헤어핀 어댑터의 3'에 하나 이상의 추가 어댑터를 포함한다. 일부 구현예에서, 이중 가닥 단편은 한쪽 또는 양쪽 가닥의 3' 말단에 하나 이상의 어댑터를 포함한다.
일부 구현예에서, 어댑터 서열은 프라이머 서열, 인덱스 태그 서열, 포획 서열, 바코드 서열, 절단 서열 또는 시퀀싱 관련 서열, 또는 이들의 조합을 포함한다. 본원에 사용된 시퀀싱 관련 서열은 이후 시퀀싱 단계와 관련된 임의의 서열일 수 있다. 시퀀싱 관련 서열은 다운스트림 시퀀싱 단계를 단순화시키는 역할을 할 수 있다. 예를 들어, 시퀀싱 관련 서열은, 다르게는 어댑터를 핵산 단편에 결찰시키는 단계를 통해 혼입될 수 있는 서열일 수 있다. 일부 구현예에서, 어댑터 서열은 특정 시퀀싱 방법에서 플로우셀(flow cell)에의 결합을 용이하게 하기 위해 P5 또는 P7 서열(또는 이들의 상보체)을 포함한다.
일부 구현예에서, 헤어핀에 포함된 증폭 프라이머 서열은 범용 프라이머 서열이다. 범용 서열은 둘 이상의 핵산 분자에 공통적인, 즉, 이들이 공유하는 뉴클레오타이드 서열의 영역이다.
일부 구현예에서, 헤어핀 어댑터는 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열 사이에 링커를 추가로 포함한다. 일부 구현예에서, 이러한 링커는 뉴클레오타이드 링커이다. 일부 구현예에서, 이러한 링커는 비뉴클레오타이드(non-nucleotide) 링커이다. 일부 구현예에서, 이러한 링커는 합성 링커이다. 일부 구현예에서, 이러한 링커는 엑소뉴클레아제에 의해 분해되지 않기 때문에(즉, 링커는 엑소뉴클레아제에 저항성이 있음), 엑소뉴클레아제 활성은 링커에서 종결된다.
C. 이중 가닥 핵산
일부 구현예에서, 라이브러리를 생성하는 데 사용되는 이중 가닥 핵산은 DNA, RNA, 또는 이들의 유사체로 구성된다. 일부 구현예에서, 산의 공급원은 게놈 DNA, 메신저 RNA, 또는 천연 공급원으로부터의 다른 핵산이다. 일부 구현예에서, 이러한 공급원에서 유도된 핵산은 본원에 기재된 방법에 사용되기 전 증폭될 수 있다.
이중 가닥 핵산이 유도될 수 있는 예시적인 생물학적 샘플에는, 예를 들어 설치류, 마우스, 래트, 토끼, 기니피그, 유제류, 말, 양, 돼지, 염소, 소, 고양이, 개, 영장류, 인간 또는 비인간 영장류와 같은 포유류; 아라비돕시스 탈리아나(Arabidopsis thaliana), 옥수수, 수수, 귀리, 밀, 벼, 카놀라 또는 대두와 같은 식물; 클라미도모나스 레인하르디티(Chlamydomonas reinhardtii)와 같은 조류(algae); 카에노르하브디티스 엘레간스(Caenorhabditis elegans)와 같은 선충류; 드로소필라 멜라노가스테르(Drosophila melanogaster), 모기, 초파리, 꿀벌 또는 거미와 같은 곤충; 제브라피쉬(zebrafish)와 같은 어류; 파충류; 개구리 또는 제노푸스 라에비스(Xenopus laevis)와 같은 양서류; 딕티오스텔리움 디스코이데움(dictyostelium discoideum); 뉴모시스티스 카리니(Pneumocystis carinii), 타키푸구 루브리페스(Takifugu rubripes), 효모, 사카로마이세스 세레비시아(Saccharamoyces cerevisiae) 또는 스키조사카로마이세스 폼베(Schizosaccharomyces pombe)와 같은 진균류; 또는 열대열 말리리아 원충(Plasmodium falciparum)에서 유래된 것들이 포함된다. 이중 가닥 핵산은 또한 대장균, 포도상구균 또는 마이코플라즈마 폐렴균과 같은 박테리아; 고세균(archae); C형 간염 바이러스 또는 인간 면역결핍 바이러스와 같은 바이러스; 또는 비로이드와 같은 원핵생물에서 유도될 수 있다. 이중 가닥 핵산은 상기 유기체의 균질한 배양물 또는 집단에서, 또는 대안적으로, 예를 들어 공동체 또는 생태계에서 몇몇 상이한 유기체의 집합체에서 유도될 수 있다. 핵산은, 예를 들어 문헌[Sambrook et al, Molecular Cloning: A Laboratory Manual, 3rd edition, Cold Spring Harbor Laboratory, New York (2001)] 또는 문헌[Ausubel et al, Current Protocols in Molecular Biology, John Wiley and Sons, Baltimore, Md. (1998)]에 기재된 것들을 포함하는 당업계에 공지된 방법을 사용하여 단리될 수 있으며, 상기 문헌들은 각각 본원에 참조로 인용된다.
일부 구현예에서, 이중 가닥 핵산은 하나 이상의 더 큰 핵산의 단편으로 수득될 수 있다. 단편화는, 예를 들어 분무화, 초음파처리, 화학적 절단, 효소적 절단 또는 물리적 전단을 포함하는 당업계에 공지된 다양한 기술 중 임의의 것을 사용하여 수행될 수 있다.
이중 가닥 핵산의 집단 또는 이의 앰플리콘은, 본원에 제시된 방법 또는 조성물의 특정한 적용에 바람직하거나 적합한 평균 가닥 길이를 가질 수 있다. 예를 들어, 평균 가닥 길이는 100,000개 뉴클레오타이드, 50,000개 뉴클레오타이드, 10,000개 뉴클레오타이드, 5,000개 뉴클레오타이드, 1,000개 뉴클레오타이드, 500개 뉴클레오타이드, 100개 뉴클레오타이드 또는 50개 뉴클레오타이드 미만일 수 있다. 대안적으로 또는 부가적으로, 평균 가닥 길이는 10개 뉴클레오타이드, 50개 뉴클레오타이드, 100개 뉴클레오타이드, 500개 뉴클레오타이드, 1,000개 뉴클레오타이드, 5,000개 뉴클레오타이드, 10,000개 뉴클레오타이드, 50,000개 뉴클레오타이드 또는 100,000개 뉴클레오타이드 초과일 수 있다. 이중 가닥 핵산의 집단 또는 이의 앰플리콘의 평균 가닥 길이는 상기 제시된 최댓값과 최솟값 사이의 범위일 수 있다. 증폭 부위에서 생성된(또는 본원에서 달리 제조되거나 사용된) 앰플리콘의 평균 가닥 길이는, 상기 예시된 값에서 선택되는 상한과 하한 사이의 범위일 수 있음을 이해할 것이다.
일부 구현예에서, 이중 가닥 핵산은 200개 미만의 뉴클레오타이드, 150개 미만의 뉴클레오타이드, 100개 미만의 뉴클레오타이드, 75개 미만의 뉴클레오타이드, 50개 미만의 뉴클레오타이드 또는 36개 미만의 뉴클레오타이드와 같이 비교적 짧은 평균 가닥 길이를 갖는다. 평균 가닥 길이가 비교적 짧은 샘플 유형의 예는 무세포 DNA(cfDNA) 및 엑솜 시퀀싱 샘플이다.
일부 구현예에서, 이중 가닥 핵산은 모체 혈액 샘플의 무세포 DNA(cfDNA)이다. 일부 구현예에서, cfDNA는 모체 혈장 샘플에서 추출된다. 일부 구현예에서, cfDNA는 비침습성 산전 검사(NIPT: noninvasive prenatal testing)를 위한 것이다. 일부 구현예에서, 이중 가닥 핵산은 엑솜이다. 일부 구현예에서, 엑솜은 의심되는 미진단 희귀 질환(RUGD) 환자의 샘플에서 유래된다.
D. 연장 프라이머
본원에 사용된 "연장"은, 프라이머와 관련하여 사용될 때, 하나 이상의 뉴클레오타이드가 (예를 들어, 폴리머라아제 활성을 통해) 프라이머에 부가되거나, 하나 이상의 올리고뉴클레오타이드가 (예를 들어, 리가아제 활성을 통해) 프라이머에 부가되는 과정을 포함하는 것으로 의도된다.
일부 구현예에서, 하나 이상의 연장 프라이머는 이중 가닥 단편의 라이브러리 내 적어도 하나의 삽입체에 포함된 표적 서열에 결합한다. 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제를 사용하는 방법은 (1) 연장 프라이머를 사용하여 핵산 가닥을 생성하고, (2) 헤어핀 어댑터에서 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열의 전부 또는 일부를 제거하는 단계를 포함할 수 있다(도 1에 제시된 바와 같음). 일부 구현예에서, 잠금된 헤어핀은 폴리머라아제가 생성된 핵산 가닥 내 증폭 프라이머 서열의 상보체를 연장시키고 생성하는 것을 방지한다. 따라서, 연장 프라이머를 표적 서열을 포함하는 삽입체에 결합시키는 것은 이러한 단편에 대한 헤어핀 어댑터의 선택적인 "잠금 해제"를 가능하게 한다.
일부 구현예에서, 하나 이상의 연장 프라이머는 유전자 특이적 프라이머이다. 예를 들어, 연장 프라이머는 암 유전자의 표적 서열에 결합하여 시퀀싱 라이브러리에서 이러한 표적 서열을 농축시킬 수 있다.
일부 구현예에서, 상기 방법은 단일 연장 프라이머를 사용한다. 일부 구현예에서, 상기 방법은 하나 초과의 연장 프라이머를 사용한다.
일부 구현예에서, 연장 프라이머의 용융 온도는 60℃ 이상이다. 일부 구현예에서, 연장 프라이머의 용융 온도는 60℃ 이상, 65℃ 이상 또는 70℃ 이상이다. 일부 구현예에서, 용융 온도가 60℃ 이상인 연장 프라이머는 "핫 스타트(hot start)" 반응이 비특이적 결합을 감소시키는 것을 가능하게 한다. 일부 구현예에서, 연장 프라이머의 용융 온도는 프라이머 길이, GC 함량, 또는 당업자에게 널리 공지된 다른 인자에 의해 제어된다.
일부 구현예에서, 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제를 사용하여, 이중 가닥 단편의 라이브러리 내 적어도 하나의 삽입체에 포함된 표적 서열에 결합하는 연장 프라이머를 사용하여 핵산 가닥을 생성하고, 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열의 전부 또는 일부를 제거하는 단일 단계에 하나 초과의 연장 프라이머가 사용된다. 일부 구현예에서, 상기 방법의 단일 단계에 다중 연장 프라이머가 사용된다. 예를 들어, 다중 연장 프라이머는 관심 유전자 내 상이한 표적 서열 또는 상이한 관심 유전자에 결합할 수 있다.
일부 구현예에서, 다중 연장 프라이머가 하나 이상의 링커를 통해 연결된다(즉, 도 4에 제시된 바와 같음). 일부 구현예에서, 2개의 연장 프라이머가 링커를 통해 연결된다. 일부 구현예에서, 하나 이상의 링커를 통해 연결되는 다중 연장 프라이머는 더 높은 용융 온도를 갖는다. 일부 구현예에서, 하나 이상의 링커를 통해 연결된 다중 연장 프라이머는 각각의 연장 프라이머(예를 들어, 도 4에 제시된 바와 같은 fwd1' 및 fwd2')에 결합할 수 있는 표적 서열을 포함하는 삽입체에 결합한다.
일부 구현예에서, 2개의 연장 프라이머는 상기 방법 동안 하기 기재되는 바와 같이 함께 결찰될 수 있다.
일부 구현예에서, 상기 방법의 상이한 단계에 상이한 연장 프라이머가 사용된다.
E. 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제
일부 구현예에서, 상기 방법은, 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제를 사용하여, 이중 가닥 단편의 라이브러리 내 적어도 하나의 삽입체에 포함된 표적 서열에 결합하는 연장 프라이머를 사용하여 핵산 가닥을 생성하고, 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열의 전부 또는 일부를 제거하는 단계를 포함한다.
일부 구현예에서, 폴리머라아제의 5'-3' 엑소뉴클레아제 활성은 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열의 전부 또는 일부를 제거하는 것을 매개한다. 일부 구현예에서, 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제는 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열의 전부 또는 일부를 절단한다. 일부 구현예에서, 잠금된 헤어핀은 폴리머라아제가 생성된 핵산 가닥 내 증폭 프라이머 서열의 상보체를 연장시키고 생성하는 것을 방지한다.
일부 구현예에서, 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제는 Taq이다. 일부 구현예에서, 연장 프라이머 및/또는 연장 프라이머를 사용하여 핵산 가닥을 생성하는 데 사용되는 폴리머라아제는 연장 후 제거된다. 일부 구현예에서, 연장 프라이머 및/또는 연장 프라이머를 사용하여 핵산 가닥을 생성하는 데 사용되는 폴리머라아제의 제거는, 고체상 가역적 고정화(SPRI) 비드를 이용하여 이루어진다. 일부 구현예에서, 폴리머라아제는 변성에 의해 제거되는 열감응성 폴리머라아제이다. 일부 구현예에서, 열감응성 폴리머라아제는 전장 Bst 또는 DNA 폴리머라아제 I이다.
F. 증폭
일부 구현예에서, 상기 방법은 증폭 프라이머 서열에 결합하는 증폭 프라이머를 사용하여 단편을 증폭시키는 단계를 추가로 포함한다. 일부 구현예에서, 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열의 전부 또는 일부가 제거된 단편만 증폭될 수 있다. 일부 구현예에서, 잠금된 헤어핀은 폴리머라아제가 증폭 프라이머 서열의 상보체를 연장시키고 생성하는 것을 방지한다.
일부 구현예에서, 증폭 프라이머는 인덱스 서열(예를 들어, 도 1의 i5 및 i7 인덱스 서열 참조)을 포함할 수 있다. 이러한 인덱스 서열은 어레이에서 샘플 및 위치를 식별하는 데 사용될 수 있다. 일부 구현예에서, 인덱스 서열은 고유 분자 식별자(UMI: unique molecular identifier)를 포함한다. UMI는 특허 출원 WO 2016/176091, WO 2018/197950, WO 2018/197945, WO 2018/200380 및 WO 2018/204423에 기재되어 있으며, 상기 문헌들은 각각 그 전문이 본원에 참조로 인용된다.
일부 구현예에서, 증폭 프라이머를 사용하여 단편을 증폭시키는 단계는 헤어핀 어댑터를 파괴하지 못한다. 일부 구현예에서, 증폭 프라이머를 사용하여 단편을 증폭시키는 데 사용되는 폴리머라아제에는 5'-3' 엑소뉴클레아제 활성이 결여되어 있거나, 증폭 프라이머를 사용하여 단편을 증폭시키는 데 사용되는 폴리머라아제는 가닥 치환 폴리머라아제가 아니다. 일부 구현예에서, 단편을 증폭시키는 데 사용되는 폴리머라아제는 Q5이다. 일부 구현예에서, 증폭은 브릿지 증폭이다.
일부 구현예에서, 샘플은 고체 지지체 상에서 증폭된다.
예를 들어, 일부 구현예에서, 샘플은 미국 특허 제7,985,565호 및 제7,115,400호의 개시내용에 예시된 바와 같은 클러스터 증폭 방법을 사용하여 증폭되며, 상기 문헌들 각각의 내용은 그 전체가 본원에 참조로 인용된다. 미국 특허 제7,985,565호 및 제7,115,400호의 통합된 자료에는, 고정된 핵산 분자의 클러스터 또는 "콜로니"로 구성된 어레이를 형성하기 위해 증폭 생성물이 고체 지지체 상에 고정되게 하는 고체상 핵산 증폭 방법이 기재되어 있다. 이러한 어레이 상의 각각의 클러스터 또는 콜로니는 복수의 동일한 고정된 폴리뉴클레오타이드 가닥과 복수의 동일한 고정된 상보적 폴리뉴클레오타이드 가닥으로 형성된다. 이와 같이 형성된 어레이는 일반적으로 "클러스터링된 어레이"로 본원에서 지칭된다. 미국 특허 제7,985,565호 및 제7,115,400호에 기재된 바와 같은 고체상 증폭 반응의 생성물은, 고정된 폴리뉴클레오타이드 가닥과 고정된 상보적 가닥의 쌍의 어닐링에 의해 형성된 소위 "브릿지된" 구조이며, 여기서 양쪽 가닥은, 일부 구현예에서 공유결합 부착을 통해 5' 말단에서 고체 지지체 상에 고정되어 있다. 클러스터 증폭 방법은, 고정된 핵산 주형을 사용하여 고정된 앰플리콘을 생성하는 방법의 예이다. 본원에 제공된 방법에 따라 생성된 고정된 DNA 단편으로부터 고정된 앰플리콘을 생성하기 위해 다른 적합한 방법이 또한 사용될 수 있다. 예를 들어, 각 쌍의 증폭 프라이머의 한쪽 또는 양쪽 프라이머가 고정되어 있는지 여부에 관계없이, 고체상 PCR을 통해 하나 이상의 클러스터 또는 콜로니가 형성될 수 있다.
다른 구현예에서, 샘플은 용액 중에서 증폭된다. 예를 들어, 일부 구현예에서, 샘플이 고체 지지체로부터 절단되거나 달리 유리된 후, 증폭 프라이머가 용액 중에서 유리된 분자에 혼성화된다. 다른 구현예에서, 증폭 프라이머는 하나 이상의 초기 증폭 단계 동안 목적하는 샘플에 혼성화되고, 용액 중에서 후속 증폭 단계가 이어진다. 일부 구현예에서, 고정된 핵산 주형이 용액상 앰플리콘을 생성하는 데 사용될 수 있다.
본원에 기재된 또는 당업계에 일반적으로 공지된 증폭 방법 중 임의의 것을 범용 또는 표적 특이적 프라이머와 함께 이용하여 목적하는 샘플을 증폭시킬 수 있음을 이해할 것이다. 증폭에 적합한 방법에는, 비제한적으로, 미국 특허 제8,003,354호에 기재된 바와 같은 폴리머라아제 연쇄 반응(PCR), 가닥 치환 증폭(SDA), 전사 매개 증폭(TMA) 및 핵산 서열 기반 증폭(NASBA)이 포함되며, 상기 문헌은 그 전문이 본원에 참조로 인용된다. 상기 증폭 방법을 이용하여 하나 이상의 관심 핵산을 증폭시킬 수 있다. 예를 들어, 멀티플렉스 PCR, SDA, TMA, NASBA 등을 포함하는 PCR을 이용하여 고정된 DNA 단편을 증폭시킬 수 있다. 일부 구현예에서, 관심 핵산에 특이적으로 지시된 프라이머가 증폭 반응에 포함된다.
핵산을 증폭시키는 다른 적합한 방법은 올리고뉴클레오타이드 연장 및 결찰, 롤링 서클 증폭(RCA: rolling circle amplification)(문헌[Lizardi et al., Nat. Genet. 19:225-232 (1998)], 이는 본원에 참조로 인용됨) 및 올리고뉴클레오타이드 결찰 검정(OLA)(일반적으로 미국 특허 제7,582,420호, 제5,185,243호, 제5,679,524호 및 제5,573,907호; EP 0 320 308 B1; EP 0 336 731 B1; EP 0 439 182 B1; WO 90/01069; WO 89/12696; 및 WO 89/09835 참조, 상기 모든 문헌은 본원에 참조로 인용됨) 기술을 포함할 수 있다. 이러한 증폭 방법이 고정된 DNA 단편을 증폭시키도록 설계될 수 있음을 이해할 것이다. 예를 들어, 일부 구현예에서, 증폭 방법은 관심 핵산에 특이적으로 지시된 프라이머를 함유하는 결찰 프로브 증폭 또는 올리고뉴클레오타이드 결찰 검정(OLA) 반응을 포함할 수 있다. 일부 구현예에서, 증폭 방법은 관심 핵산에 특이적으로 지시된 프라이머를 함유하는 프라이머 연장-결찰 반응을 포함할 수 있다. 관심 핵산을 증폭시키도록 특이적으로 설계될 수 있는 프라이머 연장 및 결찰 프라이머의 비제한적인 예로서, 증폭은 미국 특허 제7,582,420호 및 제7,611,869호에 예시된 바와 같은 GoldenGate 검정(Illumina, Inc., San Diego, CA)에 사용되는 프라이머를 포함할 수 있으며, 상기 문헌들은 각각 그 전문이 본원에 참조로 인용된다.
본 개시내용의 방법에 사용될 수 있는 예시적인 등온 증폭 방법에는, 비제한적으로, 예를 들어 문헌[Dean et al., Proc. Natl. Acad. Sci. USA 99:5261-66 (2002)]에 예시된 바와 같은 다중 치환 증폭(MDA), 또는 예를 들어 미국 특허 제6,214,587호에 예시된 바와 같은 등온 가닥 치환 핵산 증폭이 포함되며, 상기 문헌들은 각각 그 전문이 본원에 참조로 인용된다. 본 개시내용에 사용될 수 있는 다른 비PCR 기반 방법에는, 예를 들어 문헌[Walker et al., Molecular Methods for Virus Detection, Academic Press, Inc., 1995]; 미국 특허 제5,455,166호 및 제5,130,238호, 및 문헌[Walker et al., Nucl. Acids Res. 20:1691-96 (1992)]에 기재된 가닥 치환 증폭(SDA), 또는 예를 들어 문헌[Lage et al., Genome Research 13:294-307 (2003)]에 기재된 과분지형 가닥 치환 증폭이 포함되며, 상기 문헌들은 각각 그 전문이 본원에 참조로 인용된다. 등온 증폭 방법은 게놈 DNA의 랜덤 프라이머 증폭을 위해 가닥 치환 Phi 29 폴리머라아제 또는 Bst DNA 폴리머라아제 대형 단편, 5'→3' exo-와 함께 사용될 수 있다. 이러한 폴리머라아제의 사용은 높은 진행성(processivity) 및 가닥 치환 활성을 이용한다. 높은 진행성은 폴리머라아제가 10 kb 내지 20 kb 길이의 단편을 생성하는 것을 가능하게 한다. 상기 제시된 바와 같이, 등온 조건 하에서 Klenow 폴리머라아제와 같이 낮은 진행성 및 가닥 치환 활성을 갖는 폴리머라아제를 사용한 경우에는 더 작은 단편이 생성될 수 있다. 증폭 반응, 조건 및 구성요소에 대한 추가 설명은 미국 특허 제7,670,810호의 개시내용에 상세하게 제시되어 있으며, 상기 문헌은 그 전문이 본원에 참조로 인용된다.
G. 시퀀싱
일부 구현예에서, 상기 방법은 증폭된 단편을 시퀀싱하는 단계를 추가로 포함한다. 일부 구현예에서, 상기 방법은 삽입체의 전체 서열의 시퀀싱을 가능하게 한다. 삽입체의 전체 서열을 생성하는 능력은, 프라이머가 결합하는 부분을 넘어서는 삽입체의 일부가 직접 표적화된 증폭으로 손실될 수 있기 때문에, 직접 표적화된 증폭(예컨대, 멀티플렉스 PCR)을 이용한 방법과 대조적이다.
본원에 기재된 농축 방법 후, 다수의 상이한 방법을 사용하여 시퀀싱이 수행될 수 있다.
하나의 예시적인 시퀀싱 방법은 합성에 의한 시퀀싱(SBS: sequencing-by-synthesis)이다. SBS에서, 주형 내 뉴클레오타이드의 서열을 결정하기 위해 핵산 주형을 따라 핵산 프라이머의 연장을 모니터링한다. 기본 화학 공정은 (예를 들어, 폴리머라아제 효소에 의해 촉진되는) 중합일 수 있다. 특정 폴리머라아제 기반 SBS 구현예에서, 프라이머에 부가되는 뉴클레오타이드의 순서와 유형의 검출이 주형의 서열을 결정하는 데 사용될 수 있도록, 형광 표지된 뉴클레오타이드가 주형 의존적 방식으로 프라이머에 부가된다(이에 따라, 프라이머가 연장됨).
플로우셀은 시퀀싱에 편리한 고체 지지체를 제공한다. 예를 들어, 제1 SBS 사이클을 개시하기 위해, 하나 이상의 표지된 뉴클레오타이드, DNA 폴리머라아제 등을 하나 이상의 증폭된 핵산 분자를 수용하는 플로우셀 내로/플로우셀을 통해 흐르게 할 수 있다. 프라이머 연장으로 인해 표지된 뉴클레오타이드가 혼입되는 부위를 검출할 수 있다. 선택적으로, 뉴클레오타이드는 뉴클레오타이드가 프라이머에 부가되면 추가의 프라이머 연장을 종결시키는 가역적 종결 특성을 추가로 포함할 수 있다. 예를 들어, 차단 해제제가 전달되어 모이어티가 제거될 때까지 후속 연장이 발생할 수 없도록, 가역적 종결인자 모이어티를 갖는 뉴클레오타이드 유사체를 프라이머에 부가할 수 있다. 따라서, 가역적 종결을 사용하는 구현예의 경우, 차단 해제 시약을 (검출 전 또는 후에) 플로우셀에 전달할 수 있다. 다양한 전달 단계 사이에서 세척을 수행할 수 있다. 이어서, 사이클을 n회 반복하여 프라이머를 n개 뉴클레오타이드만큼 연장시켜, 길이 n의 서열을 검출할 수 있다. 본 개시내용의 방법으로 생성된 앰플리콘과 함께 사용하기 위해 용이하게 조작될 수 있는 예시적인 SBS 절차, 유체 시스템 및 검출 플랫폼은, 예를 들어 문헌[Bentley et al., Nature 456:53-59 (2008)], WO 04/018497; US 7,057,026; WO 91/06678; WO 07/123744; US 7,329,492; US 7,211,414; US 7,315,019; US 7,405,281 및 US 2008/0108082에 기재되어 있으며, 상기 문헌들은 각각 본원에 참조로 인용된다.
순환 반응을 사용하는 다른 시퀀싱 절차, 예컨대 파이로시퀀싱(pyrosequencing)이 사용될 수 있다. 파이로시퀀싱은 특정 뉴클레오타이드가 초기 핵산 가닥에 혼입됨에 따라 무기 피로포스페이트(PPi)가 방출되는 것을 검출한다(문헌[Ronaghi, et al., Analytical Biochemistry 242(1), 84-9 (1996)]; 문헌[Ronaghi, Genome Res. 11(1), 3-11 (2001)]; 문헌[Ronaghi et al. Science 281(5375), 363 (1998)]; US 6,210,891; US 6,258,568 및 US 6,274,320, 상기 문헌들은 각각 본원에 참조로 인용됨). 파이로시퀀싱에서, 방출된 PPi는 ATP 설푸릴라아제에 의해 아데노신 트리포스페이트(ATP)로 즉시 전환됨에 따라 검출될 수 있으며, 생성된 ATP 수준은 루시퍼라아제 생성 광자를 통해 검출될 수 있다. 따라서, 시퀀싱 반응은 발광 검출 시스템을 통해 모니터링될 수 있다. 형광 기반 검출 시스템에 사용되는 여기 방사선원은 파이로시퀀싱 절차에 필요하지 않다. 본 개시내용에 따라 생성된 앰플리콘에 파이로시퀀싱을 적용하기 위해 조작될 수 있는 유용한 유체 시스템, 검출기 및 절차는, 예를 들어 WIPO 특허 출원 공개공보 WO 2012058096, US 2005/0191698 A1, US 7,595,883 및 US 7,244,559에 기재되어 있으며, 상기 문헌들은 각각 본원에 참조로 인용된다.
일부 구현예는 DNA 폴리머라아제 활성을 실시간 모니터링하는 것을 포함하는 방법을 이용할 수 있다. 예를 들어, 뉴클레오타이드 혼입은 형광단 함유 폴리머라아제와 γ-포스페이트 표지된 뉴클레오타이드 사이의 형광 공명 에너지 전달(FRET: fluorescence resonance energy transfer) 상호작용을 통해, 또는 제로모드 도파관(ZMW: zeromode waveguide)을 이용하여 검출될 수 있다. FRET 기반 시퀀싱을 위한 기술 및 시약은, 예를 들어 문헌[Levene et al. Science 299, 682-686 (2003)]; 문헌[Lundquist et al. Opt. Lett. 33, 1026-1028 (2008)]; 문헌[Korlach et al. Proc. Natl. Acad. Sci. USA 105, 1176-1181 (2008)]에 기재되어 있으며, 상기 문헌들의 개시내용은 본원에 참조로 인용된다.
일부 SBS 구현예는 뉴클레오타이드가 연장 생성물에 혼입될 때 방출되는 양성자의 검출을 포함한다. 예를 들어, 방출된 양성자의 검출을 기반으로 하는 시퀀싱은 Ion Torrent(Guilford, CT, a Life Technologies subsidiary)에서 상업적으로 입수 가능한 전기 검출기 및 관련 기술, 또는 하기 문헌에 기재된 시퀀싱 방법 및 시스템을 사용할 수 있다: US 2009/0026082 A1; US 2009/0127589 A1; US 2010/0137143 A1; 또는 US 2010/0282617 A1(상기 문헌들은 각각 본원에 참조로 인용됨). 운동역학적 배제(kinetic exclusion)를 사용하여 핵산을 증폭시키는 본원에 제시된 방법은 양성자를 검출하는 데 사용되는 기질에 용이하게 적용될 수 있다. 보다 구체적으로, 본원에 제시된 방법은 양성자를 검출하는 데 사용되는 앰플리콘의 클론 집단을 생성하는 데 사용될 수 있다.
또 다른 유용한 시퀀싱 기술은 나노포어 시퀀싱이다(예를 들어, 문헌[Deamer et al. Trends Biotechnol. 18, 147-151 (2000)]; 문헌[Deamer et al. Acc. Chem. Res. 35:817-825 (2002)]; 문헌[Li et al. Nat. Mater. 2:611-615 (2003)](상기 문헌들의 개시내용은 본원에 참조로 인용됨) 참조). 일부 나노포어 구현예에서, 핵산 또는 핵산에서 제거된 개별 뉴클레오타이드는 나노포어를 통과한다. 핵산 또는 뉴클레오타이드가 나노포어를 통과할 때, 공극의 전기 전도도 변동을 측정하는 방식으로 각각의 뉴클레오타이드 유형을 식별할 수 있다. (미국 특허 제7,001,792호; 문헌[Soni et al. Clin. Chem. 53, 1996-2001 (2007)]; 문헌[Healy, Nanomed. 2, 459-481 (2007)]; 문헌[Cockroft et al. J. Am. Chem. Soc. 130, 818-820 (2008)](상기 문헌들의 개시내용은 본원에 참조로 인용됨)).
본 개시내용에 따른 검출에 적용될 수 있는 어레이 기반 발현 및 유전자형 분석을 위한 예시적인 방법은, 미국 특허 제7,582,420호; 제6,890,741호; 제6,913,884호 또는 6,355,431호, 또는 미국 특허 공개공보 제2005/0053980 A1호; 제2009/0186349 A1호 또는 제2005/0181440 A1호에 기재되어 있으며, 상기 문헌들은 각각 본원에 참조로 인용된다.
본원에 제시된 방법의 이점은, 복수의 핵산을 병렬로 신속하고 효율적으로 검출할 수 있다는 점이다. 따라서, 본 개시내용은 상기 예시된 것들과 같은 당업계에 공지된 기술을 사용하여 핵산을 제조하고 검출할 수 있는 통합 시스템을 제공한다. 따라서, 본 개시내용의 통합 시스템은 증폭 시약 및/또는 시퀀싱 시약을 하나 이상의 고정된 DNA 단편에 전달할 수 있는 유체 구성요소를 포함할 수 있으며, 상기 시스템은 펌프, 밸브, 저장소, 유체 라인 등과 같은 구성요소를 포함한다. 플로우셀은 핵산의 검출을 위한 통합 시스템으로 구성되고/되거나 이에 사용될 수 있다. 예시적인 플로우셀은, 예를 들어 US 2010/0111768 A1 및 미국 특허 공개공보 제2012/0270305 A1호에 기재되어 있으며, 상기 문헌들은 각각 본원에 참조로 인용된다. 플로우셀에 대해 예시된 바와 같이, 통합 시스템의 유체 구성요소 중 하나 이상이 증폭 방법과 검출 방법에 사용될 수 있다. 핵산 시퀀싱 구현예를 예로 들면, 통합 시스템의 유체 구성요소 중 하나 이상이 본원에 제시된 증폭 방법과, 상기 예시된 바와 같은 시퀀싱 방법에서 시퀀싱 시약의 전달에 사용될 수 있다. 대안적으로, 통합 시스템은 증폭 방법을 수행하고 검출 방법을 수행하기 위해 별도의 유체 시스템을 포함할 수 있다. 증폭된 핵산을 생성하고 또한 핵산의 서열을 결정할 수 있는 통합 시퀀싱 시스템의 예에는, 비제한적으로, MiSeq™ 플랫폼(Illumina, Inc., San Diego, CA), 및 미국 특허 공개공보 제2012/0270305호에 기재된 장치가 포함되며, 상기 문헌은 본원에 참조로 인용된다.
III. 헤어핀 어댑터와, 우라실 특이적 절단 시약 또는 제한 엔도뉴클레아제를 사용하여 시퀀싱 라이브러리에서 표적 서열을 농축시키는 방법
본원에 기재된 헤어핀 어댑터는 다수의 상이한 워크플로우에 사용될 수 있다. 예를 들어, 표적 서열을 포함하는 단편의 존재를 증가시키고/시키거나 표적 서열을 포함하지 않는 단편의 존재를 감소시키기 위해 다수의 상이한 워크플로우가 사용될 수 있다.
A. 우라실을 포함하는 핵산 가닥과 우라실 특이적 절단 시약
일부 제한 효소는 우라실을 포함하는 핵산 가닥을 절단할 수 없다. 일부 구현예에서, 제한 엔도뉴클레아제 절단 부위 내 티민을 대체하면 엔도뉴클레아제에 의한 절단이 저해된다. (문헌[Glenn et al. Biotechniques 17(6): 1086-1090] 참조.) 일부 구현예에서, 상기 방법은, 도 2에 제시된 바와 같이, 제한 효소 소화에 대해 저항성이 있는 우라실을 포함하는 핵산 가닥을 생성하는 단계를 포함한다.
일부 구현예에서, 우라실을 포함하는 핵산 가닥 내 우라실은 제한 엔도뉴클레아제 절단 부위 내 티민을 대체한다.
일부 구현예에서, 우라실을 포함하는 핵산 가닥은 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열의 전부 또는 일부를 포함하기 때문에, 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열을 포함하는 이중 가닥 핵산을 제한 엔도뉴클레아제 절단에 대해 저항성이 있도록 만든다.
일부 구현예에서, 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제는 우라실을 포함할 수 있다.
일부 구현예에서, 상기 방법은 하나 이상의 우라실 특이적 절단 시약(USER)을 사용하는 것을 포함한다. USER은 우라실을 포함하는 핵산 가닥을 절단할 수 있다.
일부 구현예에서, 연장 프라이머를 사용하여 핵산 가닥을 생성하는 단계는 우라실을 포함하는 반응 혼합물을 이용하여 수행된다. 일부 구현예에서, 우라실을 포함하는 반응 혼합물을 이용하여 생성된 핵산 가닥은 하나 이상의 USER에 의해 절단된다. 일부 구현예에서, USER은 우라실 DNA 글리코실라아제 및 엔도뉴클레아제 VIII이다. 일부 구현예에서, USER은 우라실 DNA 글리코실라아제 및 엔도뉴클레아제 VIII의 활성을 갖는 단일 효소이다.
일부 구현예에서, 우라실을 포함하는 반응 혼합물을 이용하여 생성된 핵산 가닥은 제한 엔도뉴클레아제 소화에 대해 저항성이 있다.
B. 제한 엔도뉴클레아제
일부 구현예에서, 상기 방법은, 표적 서열을 포함하지 않는 라이브러리 내 복수의 이중 가닥 단편에서, 제한 엔도뉴클레아제를 이용하여 헤어핀 어댑터를 절단하는 단계를 추가로 포함한다.
일부 구현예에서, 제한 엔도뉴클레아제는 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열의 회합에 의해 형성된 이중 가닥 핵산에서 절단한다.
일부 구현예에서, 제한 엔도뉴클레아제는 어댑터 서열과 어댑터 서열에 적어도 부분적으로 상보적인 서열의 회합에 의해 형성된 이중 가닥 핵산에서 절단한다(예를 들어, 도 2에서의 A14/A14'의 절단 참조).
일부 구현예에서, 제한 엔도뉴클레아제에 의한 절단 효율은 엔도뉴클레아제의 절단 부위를 포함하는 이중 가닥 DNA 서열로 구성된 우라실의 양이 증가함에 따라 감소한다. 일부 구현예에서, 제한 엔도뉴클레아제는 우라실을 포함하는 하나 이상의 이중 가닥 핵산을 절단할 수 없다.
일부 구현예에서, 제한 엔도뉴클레아제의 절단 부위는 티민을 포함한다. 일부 구현예에서, 우라실을 핵산 가닥에 혼입시키면 이전에 제한 엔도뉴클레아제 절단 부위였던 서열이 변경되어, 이러한 가닥과 이의 상보체를 절단으로부터 보호한다. 일부 구현예에서, 제한 효소는 헤어핀 어댑터를 절단하고 오버행을 생성한다. 일부 구현예에서, 제한 효소는 헤어핀 어댑터를 절단하고 평활 말단을 생성한다.
C. 적어도 부분적으로 상보적인 하나 초과의 서열 세트를 포함하는 헤어핀 어댑터와 USER을 포함하는 방법
일부 구현예에서, 이중 가닥 단편의 시퀀싱 라이브러리에서 표적 서열을 농축시키는 방법은, 시퀀싱 라이브러리를 제작하는 단계(여기서, 각각의 단편은 이중 가닥 핵산을 포함하는 삽입체와, 이중 가닥 단편의 한쪽 또는 양쪽 가닥의 5' 말단에 있는 헤어핀 어댑터를 포함하고, 여기서 헤어핀 어댑터는 뉴클레오타이드 서열의 제1 세트(여기서, 뉴클레오타이드 서열의 제1 세트는 어댑터 서열과 어댑터 서열에 적어도 부분적으로 상보적인 서열을 포함함); 뉴클레오타이드 서열의 제2 세트(여기서, 뉴클레오타이드 서열의 제2 세트는 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열을 포함하며, 여기서 뉴클레오타이드 서열의 제1 세트는 뉴클레오타이드 서열의 제2 세트보다 삽입체에 더 가까움); 및 어댑터 서열에 적어도 부분적으로 상보적인 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열 사이의 링커를 포함함); 이중 가닥 단편을 변성시켜 단일 가닥 단편을 형성하는 단계; 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제를 사용하여, 시퀀싱 라이브러리 내 적어도 하나의 삽입체에 포함된 표적 서열에 결합하는 제1 연장 프라이머를 사용하여 핵산 가닥을 생성하고(여기서, 핵산 가닥을 생성하기 위한 반응 혼합물은 우라실을 포함함), 어댑터 서열에 적어도 부분적으로 상보적인 서열의 전부 또는 일부를 제거하는 단계; 제1 연장 프라이머를 제거하는 단계; USER을 제공하는 단계; 및 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제를 사용하여, (1) 이중 가닥 단편의 라이브러리 내 적어도 하나의 삽입체에 포함된 표적 서열에 결합하는 제2 연장 프라이머를 사용하여 핵산 가닥을 생성하고, (2) 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열의 전부 또는 일부를 제거하는 단계를 포함한다. 이러한 방법의 대표적인 예가 도 2에 제시되어 있다.
일부 구현예에서, 증폭 프라이머 서열의 상보체 및/또는 어댑터 서열에 적어도 부분적으로 상보적인 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열 사이의 링커는 엑소뉴클레아제에 저항성이 있다.
일부 구현예에서, 증폭 프라이머 서열의 상보체 및/또는 어댑터 서열에 적어도 부분적으로 상보적인 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열 사이의 링커는 우라실을 포함한다.
일부 구현예에서, 상기 방법은 제1 프라이머를 사용하여 핵산 가닥을 생성한 후 제한 엔도뉴클레아제를 이용하여 헤어핀 어댑터를 절단하는 단계를 추가로 포함하며, 여기서 상기 헤어핀 어댑터는 어댑터 서열에 적어도 부분적으로 상보적인 서열의 전부 또는 일부가 존재하고, 우라실을 포함하지 않는 라이브러리의 이중 가닥 단편에 포함되어 있다.
일부 구현예에서, 제1 프라이머 연장을 사용하여 생성된 핵산 가닥은 우라실을 포함하며, 제한 엔도뉴클레아제 소화에 대해 저항성이 있다.
일부 구현예에서, 헤어핀 어댑터는 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열 사이에 링커를 추가로 포함한다. 일부 구현예에서, 이러한 링커는 엑소뉴클레아제에 의해 분해되지 않는다. 일부 구현예에서, 이러한 링커는 합성 링커이다. 일부 구현예에서, 이러한 링커는 우라실을 포함하거나 다르게는 폴리머라아제 활성을 중지시키는 역할을 한다.
일부 구현예에서, USER은 제1 프라이머 연장에 의해 생성된 핵산 가닥, 헤어핀 어댑터에 포함된 링커 및/또는 어댑터 서열에 적어도 부분적으로 상보적인 서열을 절단한다. 일부 구현예에서, 제1 프라이머 연장에 의해 생성된 핵산 가닥, 헤어핀 어댑터에 포함된 링커 및/또는 어댑터 서열에 적어도 부분적으로 상보적인 서열은 하나 이상의 우라실을 포함한다.
일부 구현예에서, 제1 연장 프라이머와 제2 연장 프라이머는 상이한 서열에 결합한다. 일부 구현예에서, 제1 연장 프라이머와 제2 연장 프라이머는 이중 가닥 핵산의 동일한 가닥에 결합한다.
일부 구현예에서, 제2 연장 프라이머는 상기 프라이머를 사용하여 핵산 가닥을 생성한 후에 제거된다. 일부 구현예에서, 폴리머라아제 및/또는 제2 연장 프라이머는 SPRI 비드를 사용하여 제거된다. 일부 구현예에서, 폴리머라아제는 변성에 의해 제거되는 열감응성 폴리머라아제이다. 일부 구현예에서, 열감응성 폴리머라아제는 전장 Bst 또는 DNA 폴리머라아제 I이다.
IV. 다중 연장 프라이머의 결찰과 헤어핀 어댑터를 사용하여 시퀀싱 라이브러리에서 표적 서열을 농축시키는 방법
일부 구현예에서, 시퀀싱 라이브러리에서 표적 서열을 농축시키는 방법은, 시퀀싱 라이브러리를 제작하는 단계(여기서, 각각의 단편은 이중 가닥 핵산을 포함하는 삽입체와, 이중 가닥 단편의 한쪽 또는 양쪽 가닥의 5' 말단에 있는 헤어핀 어댑터를 포함하고, 여기서 헤어핀 어댑터는 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열을 포함함); 이중 가닥 단편을 변성시켜 단일 가닥 단편을 형성하는 단계; 프라이머 믹스와, 5'-3' 엑소뉴클레아제 활성 없이 결찰 활성과 폴리머라아제 활성을 갖는 효소 또는 효소들을 사용하여, 프라이머 믹스의 제1 연장 프라이머를 사용하여 핵산 가닥을 생성하고(여기서, 프라이머 믹스는 제1 연장 프라이머와 차단된 제2 연장 프라이머를 포함하고, 여기서 제1 연장 프라이머와 차단된 제2 연장 프라이머는 이중 가닥 핵산에 포함된 상이한 관심 서열에 결합함), 제1 연장 프라이머를 사용하여 생성된 핵산 가닥을 차단된 제2 연장 프라이머에 결찰시키는 단계; 삽입체에 결합되지 않은 프라이머 믹스를 제거하는 단계; 차단된 제2 연장 프라이머를 차단 해제하는 단계; 및 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제를 사용하여, (1) 결찰된 제1 연장 프라이머와 제2 연장 프라이머를 사용하여 핵산 가닥을 생성하고, (2) 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열의 전부 또는 일부를 제거하는 단계를 포함한다.
일부 구현예에서, 차단된 제2 연장 프라이머는, 차단 해제되지 않는 한, 핵산 가닥을 생성할 수 없다. 일부 구현예에서, 차단된 제2 연장 프라이머는 차단이 제거되지 않는 한 연장이 일어날 수 없도록 차단을 포함한다. 일부 구현예에서, 차단은 차단된 제2 프라이머 상의 3' 포스페이트의 존재이다. 일부 구현예에서, 차단된 제2 프라이머는 3' 포스페이트를 절단하는 키나아제에 의해 차단 해제된다. 일부 구현예에서, 차단 해제된 제2 연장 프라이머는 핵산 가닥을 생성할 수 있다.
일부 구현예에서, 차단된 제2 연장 프라이머는 제1 연장 프라이머에 의해 결합된 서열의 5' 및 적어도 하나의 삽입체에 포함된 표적 서열에 결합한다.
일부 구현예에서, 제2 연장 프라이머는 60℃ 미만의 용융 온도로 삽입체에 결합한다. 즉, 제2 연장 프라이머는 삽입체에 대한 결합이 상대적으로 약할 수 있다. 즉, 제2 연장 프라이머는, 제2 연장 프라이머가 차단되었는지 여부에 관계없이, 삽입체에 대한 결합이 상대적으로 약할 수 있다. 일부 구현예에서, 제2 연장 프라이머는 60℃ 초과, 65℃ 초과 또는 70℃ 초과의 온도에서 삽입체로부터 해리된다.
일부 구현예에서, 제2 연장 프라이머와 폴리머라아제는, "핫 스타트" 연장 프로토콜이 사용되는 경우, 표준 연장 프로토콜과 비교하여 더 적은 핵산 가닥을 생성한다. 일부 구현예에서, 제2 연장 프라이머와 폴리머라아제는, 온도가 60℃ 초과, 65℃ 초과 또는 70℃ 초과인 경우, 더 적은 핵산 가닥을 생성한다. 일부 구현예에서, 제2 연장 프라이머와 폴리머라아제는 60℃ 초과, 65℃ 초과 또는 70℃ 초과의 온도에서 핵산 가닥을 생성할 수 없다.
일부 구현예에서, 결찰된 제1 연장 프라이머와 제2 연장 프라이머는 60℃ 이상의 용융 온도로 삽입체에 결합한다. 즉, 결찰된 제1 연장 프라이머와 제2 연장 프라이머는 삽입체에 대한 결합이 상대적으로 강할 수 있다. 일부 구현예에서, 결찰된 제1 연장 프라이머와 제2 연장 프라이머는 60℃ 초과, 65℃ 초과 또는 70℃ 초과의 온도에서 삽입체와 회합된 상태로 유지된다. 일부 구현예에서, 결찰된 제1 연장 프라이머와 제2 연장 프라이머를 사용하여 핵산 가닥을 생성하는 단계는 60℃ 이상의 온도에서 수행된다. 일부 구현예에서, 결찰된 제1 연장 프라이머와 제2 연장 프라이머를 사용하여 핵산 가닥을 생성하는 단계는 60℃ 이상, 65℃ 이상 또는 70℃ 이상의 온도에서 수행된다. 일부 구현예에서, 결찰된 제1 연장 프라이머와 제2 연장 프라이머의 어닐링 및 연장 온도는 제2 연장 프라이머의 용융 온도보다 높다.
일부 구현예에서, 제2 연장 프라이머는 증폭시키는 단계 전에 제거된다. 일부 구현예에서, 제2 연장 프라이머는 SPRI 비드 또는 엑소뉴클레아제를 사용하여 제거된다.
실시예
실시예 1. 헤어핀 어댑터를 사용하여 시퀀싱 라이브러리에서 표적 서열을 농축시키는 방법
헤어핀 어댑터를 이용한 방법을 사용하여 시퀀싱 라이브러리에서 표적 서열을 농축시킬 수 있다. 도 1은, 각각의 상이한 삽입체(14)를 갖는 복수의 단편(12)으로 형성된 시퀀싱 라이브러리의 대표적인 단편인 이중 가닥 단편(12)의 예를 보여준다. 각각의 단편(12)은 양쪽 말단에 어댑터(18)를 포함한다. 예시된 구현예에서, 어댑터(18)는 동일하다. 어댑터는 제1 가닥(22)과 제2 가닥(23)을 갖는 분기형 어댑터이다. 제1 가닥(22)과 제2 가닥(23)은 이중 가닥 영역(24)을 형성한다. 제1 가닥은 또한 헤어핀 이중 가닥 영역(26)과 이러한 이중 가닥 영역(26)의 자가 상보적 부분 사이에 배치된 링커(27)를 갖는 헤어핀 영역(25)을 포함한다.
도 1의 특정 예에서, 헤어핀 영역(25)은 A14와 이의 상보체 A14'를 포함한다. 이중 가닥 영역(26) 내 A14/A14'의 염기쌍 형성은, 헤어핀 영역(25)이 온전한 경우, A14 프라이머 서열이 증폭 프라이머에 결합할 수 없음을 의미한다. 이러한 예에서, 헤어핀 영역(25)의 이중 가닥 영역(26)은 A14 프라이머 서열과 이의 상보체(A14')를 포함한다.
도 1에 제시된 워크플로우는 단편(12)을 변성시켜 양성 및 음성 가닥을 생성하는 단계를 포함한다. 예시된 예에서, 음성 가닥(28)이 도시되어 있다. 하지만, 워크플로우 단계는 구현예에서 양성 가닥에도 적용됨을 이해해야 한다. 단편(12)이 관심있는 표적화된 삽입체(14a)를 함유하는 경우, 가닥(28a)은 표적화된 삽입체(14a)의 일부에 상보적인 연장 프라이머(29)에 결합한다. 헤어핀 영역(25)의 A14' 서열은 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제(30)(예컨대, Taq)를 사용하여 제거된다. 폴리머라아제(30)는 이전의 이중 가닥 영역(26)을 단일 가닥으로 만들어, A14 서열을 이용 가능하게 만든다.
이어서, 폴리머라아제(30)가 제거된다. 제1 증폭 프라이머(36)로부터 전체 연장은 가닥(28a)을 카피할 수 있으며, 제2 증폭 프라이머(38)는 생성된 핵산 가닥 내 A14'에 결합하여 표적 서열을 포함하는 삽입체를 포함하는 단편을 특이적으로 증폭시킨다. 이러한 방법에서, (단편 생성 실패를 통해) 헤어핀 어댑터가 없는 단편, 또는 헤어핀 어댑터와 헤어핀 영역(25)이 "잠금된"(즉, 헤어핀의 A14 서열과 A14' 서열이 서로 회합되어 있는) 가닥(28b)과 같은 단편 또는 가닥은 증폭되지 않는다. 잠금된 헤어핀은 폴리머라아제가 A14에 이르도록 연장되는 것을 방지하기 때문에; 헤어핀을 포함하는 단편은 A14'를 포함하는 핵산 가닥을 생성할 수 없고, 따라서 A14 프라이머에 의해 증폭될 수 없다. 이러한 방법에서 연장 프라이머의 길이는 삽입체 서열을 포함하는 삽입체에의 결합에 대한 특이성을 보장하기 위해 증가될 수 있다. i5 서열과 i7 서열은 어레이에서 샘플 및 위치를 식별하는 데 사용될 수 있는 인덱스 서열을 나타낸다. ME = 모자이크 말단 서열(트랜스포사아제가 트랜스포존을 표적 서열에 통합시키는 데 필요한 트랜스포존 내 서열) 및 ME' = 모자이크 말단 서열의 상보체. 증폭은 각각의 말단에 상이한 시퀀싱 프라이머와 인덱스를 갖는 표적화된 삽입체(14)를 포함하는 전장 생성물(50)을 생성한다.
시퀀싱 라이브러리에서 표적 서열을 농축시키기 위해, 사용자는 이중 가닥 DNA 내 하나 이상의 표적 서열에 결합하는 연장 프라이머(즉, 표적 프로브)를 생성할 수 있다. 공지된 라이브러리 생성 및 태그 지정 수단(예컨대, Nextera, Truseq 등)을 사용하여, 헤어핀 함유 어댑터(18)를 이중 가닥 단편의 한쪽 또는 양쪽 5' 말단에 부가할 수 있다.
라이브러리의 이중 가닥 단편을 변성시킬 수 있다. 이어서, 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제를 사용하여, (1) 이중 가닥 단편의 라이브러리 내 적어도 하나의 삽입체에 포함된 표적 서열에 결합하는 연장 프라이머를 사용하여 핵산 가닥을 생성할 수 있고, (2) A14' 서열의 전부 또는 일부를 제거할 수 있다.
헤어핀의 A14' 서열이 제거된(즉, 헤어핀이 잠금 해제된) 단편에서, 증폭 프라이머를 사용하여 잠금 해제된 헤어핀 어댑터로 단편을 이어서 선택적으로 증폭시킬 수 있다. 이러한 방법을 사용하면, 잠금 해제된 헤어핀을 갖는 단편만 증폭되게 된다. 헤어핀의 A14' 서열의 전부 또는 일부가 온전한 헤어핀을 포함하는 단편은 증폭되지 않는다. 도 1에 도시된 비표적 삽입체(14b)를 포함하는 증폭되지 않은 예에서, 헤어핀 어댑터 내 A14 서열은 상보적 A14' 서열과 염기쌍을 형성한다. 헤어핀 어댑터가 온전한 경우, 증폭 프라이머는 "잠금된" 헤어핀 2차 구조로 인해 증폭 프라이머 서열에 결합할 수 없다. 따라서, 비표적 삽입체는 증폭되지 않는다.
도 1에 도시된 방법에서, 제1 가닥이 (B15'를 포함하는 프라이머를 사용하여) 증폭되는 경우, A14'를 포함하는 핵산 가닥이 생성된다(점선으로 표시되어 있음). 라이브러리 단편에서 새로 생성된 가닥을 변성시킨 후, A14를 포함하는 증폭 프라이머가 증폭을 위해 A14'에 결합할 수 있다(A14가 도 1의 점선 가닥에 결합하는 것으로 표시되어 있음).
실시예 2. 헤어핀 어댑터와 USER 시약을 사용하여 시퀀싱 라이브러리에서 표적 서열을 농축시키는 방법
"이중 잠금 해제" 방법을 사용하여 시퀀싱 라이브러리에서 표적 서열을 농축시킬 수 있다(도 2). 이러한 대표적인 방법에서, 헤어핀 영역(25)은 X' 서열 내 우라실, 또는 우라실을 포함하는 것과 같은 합성 링커(60)인 링커(27)를 포함한다. 표적화된 삽입체(14a) 내 표적 서열에 결합하는 2개의 연장 프라이머(fwd1(62)과 fwd2(64))의 순차적 사용은, "이중 잠금 해제"(A14'의 제거, 이어서 X'의 순차적 제거)를 사용하는 방식으로 시퀀싱 라이브러리에서 표적 서열의 농축을 증가시키는 것을 가능하게 한다. 이러한 순차적 방법에서, 제1 핵산 가닥은 우라실을 포함한다. 제한 엔도뉴클레아제를 사용하여 헤어핀 어댑터 내 A14/A14' 서열을 절단할 수 있으며, 여기서 A14' 서열이 제거되지 않고 우라실을 포함하는 서열로 대체된다. 제한 엔도뉴클레아제 단계를 사용하여 표적 서열을 포함하지 않는 삽입체(즉, "표적화되지 않은 삽입체"를 포함하는 단편)를 제거할 수 있다.
이러한 방법을 사용하면, 특이성을 증가시키는 이러한 방법의 단계에 기반하여, 시퀀싱 라이브러리에서 표적 서열이 고도로 농축되는 것을 확인할 수 있다. 이러한 방법은 단일 삽입체에 포함될 수 있는 표적 서열에 결합할 수 있는 2개의 연장 프라이머(fwd1과 fwd2)를 사용한다. 즉, fwd1과 fwd2는 이중 가닥 DNA 샘플에서 공간적으로 근접한 표적 서열에 결합할 수 있다.
이러한 방법에서 헤어핀 어댑터는 2 세트의 상보적 핵산(도 2의 A14/A14' 및 X/X')을 포함한다. 이러한 구현예에서, A14는 어댑터이고(A14'는 이의 상보체임), X는 증폭 프라이머 서열이다(X'는 이의 상보체임). 나아가, X' 및/또는 X'와 A14' 사이의 링커는 우라실을 포함하거나, 다르게는 엑소뉴클레아제에 저항성이 있다.
라이브러리 단편을 변성시키고, 연장 프라이머를 부가한다(fwd1). 이어서, 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제(예컨대, Taq)를 사용하여, (1) fwd1을 사용하여 핵산 가닥을 생성하고(여기서, 핵산 가닥을 생성하기 위한 반응 혼합물은 우라실 NTP를 포함함), (2) A14'의 전부 또는 일부를 제거한다. 따라서, 생성된 핵산 가닥은 우라실을 포함하며, 제한 엔도뉴클레아제 절단에 대해 저항성이 있다.
fwd1 프라이머를 (엑소뉴클레아제 또는 SPRI 비드를 사용하여) 제거한다.
또한, 제한 효소는 임의의 헤어핀 어댑터를 절단할 수 있으며, 여기서 A14'가 제거되지 않고 우라실을 포함하는 핵산 가닥으로 대체된다. 도 2에 도시된 바와 같이, 우라실을 포함하는 핵산 가닥은 A14 서열이 제한 엔도뉴클레아제에 의해 절단되는 것을 차단할 수 있다. 대조적으로, 우라실을 포함하는 핵산 가닥이 생성되지 않은 라이브러리 단편(즉, fwd1 프라이머에 결합하지 않았던 삽입체를 포함하는 단편) 상의 헤어핀 어댑터는 제한 엔도뉴클레아제에 의해 절단된다.
이어서, USER을 사용하여 우라실을 포함하는 핵산 가닥, 및/또는 합성 링커(A14'와 X' 사이) 또는 X' 내 우라실을 절단할 수 있다. 이어서, fwd2 프라이머가 결합할 수 있고, 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제(예컨대, Taq)를 사용하여, (1) 표적 서열에 결합하는 fwd2를 사용하여 핵산 가닥을 생성하고, (2) X'의 전부 또는 일부를 제거한다. 이제, X'가 제거되었으므로, X에 결합하는 증폭 프라이머를 사용하여 fwd1과 fwd2 모두에 결합할 수 있는 삽입체를 포함하는 단편을 선택적으로 증폭시킬 수 있다. 이러한 방법은, fwd1 프라이머와 fwd2 프라이머에 의해 매개되는 별도의 차단 해제 단계(A14'를 제거한 후, X'를 제거함)를 포함하고, 또한 우라실 없이 A14/A14'를 포함하는 온전한 헤어핀 어댑터의 제한 엔도뉴클레아제 절단을 포함하기 때문에, 특이성이 증가되었다.
실시예 3. 2개의 연장 프라이머의 결찰과 헤어핀 어댑터를 사용하여 시퀀싱 라이브러리에서 표적 서열을 농축시키는 방법
이러한 방법에서, 2개의 연장 프라이머(80, 82)(fwd1과 fwd2)를 사용하며, 이들 프라이머는 모두 관심 삽입체 내 표적 서열에 결합한다. 즉, 도 3에 도시된 바와 같이, fwd1 연장 프라이머와 fwd2 연장 프라이머는 각각 개별 표적화된 삽입체 서열(14a)의 상이한, 예를 들어 비연속 영역에 결합한다. 엑소뉴클레아제 활성이 없는 폴리머라아제와 리가아제를 사용하여, 결찰된 fwd1 및 fwd2 구조(84)를 생성한다. fwd2가 차단 해제된 후, 이러한 결찰된 프라이머를 핫 스타트 연장 반응에 사용할 수 있다. 즉, fwd2 프라이머가 차단되어, 연장을 매개할 수 없다. 이러한 경우, 엑소뉴클레아제 활성이 없는 폴리머라아제와 리가아제를 포함하는 효소 믹스를 이용하여 초기 연장을 수행한다. 엑소뉴클레아제 활성이 없는 폴리머라아제와 리가아제의 이러한 믹스는 ELM 믹스일 수 있다(예컨대, Illumina DNA PCR-Free Library Prep kit #1000000086922에 제공되어 있음). 따라서, fwd1로부터의 연장은 fwd2를 절단하지 않고 fwd1과 fwd2 사이의 핵산 가닥을 결찰시킨다.
결찰된 fwd1-fwd2 프라이머는, 결찰된 프라이머와 삽입체 사이에 있는 다수의 쌍을 이룬 뉴클레오타이드에 기반하여 삽입체에 고친화도 결합하게 된다. 이어서, fwd2에 대한 차단을 제거할 수 있다.
fwd2 프라이머는 표적 서열에 대해 상대적으로 낮은 친화도를 갖도록, 용융 온도가 60℃ 미만이 되도록 설계될 수 있다. 이러한 방식으로, "핫 스타트" 연장 반응(60℃ 이상의 온도에서 개시됨)은, fwd2 프라이머가 핵산 가닥의 생성 전에 삽입체로부터 해리될 수 있음을 의미한다. 대조적으로, 결찰된 fwd1-fwd2 차단 해제된 프라이머는 더 높은 온도에서 결합된 상태를 유지하고, 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제를 사용하여, (1) 결찰된 제1 연장 프라이머와 제2 연장 프라이머를 사용하여 핵산 가닥을 생성하고, (2) A14'의 전부 또는 일부를 제거하는 것을 매개할 수 있다.
이러한 방법을 사용하면, fwd1과 fwd2 둘 모두를 이용하여 시퀀싱 라이브러리에서 표적 서열을 농축시킬 수 있다. 따라서, 이러한 방법은 fwd1에 결합하는 표적 서열과 fwd2에 결합하는 표적 서열을 포함하는 관심 단편을 선택적으로 증폭시키는 데 있어서 더 큰 특이성을 나타낸다.
실시예 4. 연결된 연장 프라이머와 헤어핀 어댑터를 사용하여 시퀀싱 라이브러리에서 표적 서열을 농축시키는 방법
도 4에 도시된 또 다른 예에서, 2개의 프라이머(90, 92)는, 일 구현예에서, 표적화된 삽입체 서열에 상보적이지 않은 링커(94)를 통해 연결되어, 연결된 연장 프라이머 구조(96)를 형성한다. 도 4에서 fwd1과 fwd2로 예시된 프라이머(90, 92)는 표적화된 삽입체 서열의 2개의 상이한 비연속 영역에 상보적이다. 연결된 연장 프라이머 구조의 용융 온도는, 링커가 혼성화되지 않아, 용융 온도에 유의하게 기여하지 않기 때문에, 도 4에 도시된 바와 같이 fwd1' 프라이머 및 fwd2' 프라이머에 대한 상보적 서열에 혼성화될 때의 용융 온도에 의해 결정된다.
어닐링과 연장은 fwd1 연장 프라이머 또는 fwd2 연장 프라이머 단독의 용융 온도보다 높은 용융 온도에서 일어날 수 있다. 용융 온도는, fwd1 프라이머 또는 fwd2 프라이머 중 하나만 상보적 서열을 갖는 경우, 연결된 연장 프라이머 구조가 결합할 수 없을 정도로 충분히 높다. 2개의 프라이머가 모두 표적화된 삽입체 서열에 결합할 수 있는 경우, 연결된 연장 프라이머 구조는 연장을 위해 결합된 상태를 유지할 수 있다. 따라서, 2개의 별개의 서열이 존재해야 하는 더 높은 특이성 요건이 실현된다. 결합된 연결된 연장 프라이머 구조는, 헤어핀 어댑터의 이중 가닥 부분을 제거하여 도시된 바와 같이 5' A14 서열을 드러내거나 잠금 해제하기 위해, 본원에 일반적으로 논의된 바와 같은 엑소뉴클레아제 활성을 갖는 폴리머라아제를 사용하는 연장 반응에 사용될 수 있다.
링커는 2개의 상이한 프라이머를 연결하는 범용 서열일 수 있다. 복수의 상이한 표적화된 삽입체 서열을 위한 반응 혼합물을 생성하기 위해, 제1 프라이머와 제2 프라이머의 각각의 상이한 세트는 각각의 관심 표적 서열에 특이적일 수 있다. 따라서, 각각의 상이한 표적 서열은 특정 제1 프라이머와 특정 제2 연장 프라이머를 가질 수 있다. 하지만, 모든 세트에 대한 연결 서열은 각각의 제1 프라이머를 이의 상응하는 제2 프라이머와 연결하는 데 사용되는 동일한 서열일 수 있다. 이러한 배열은 공통 링커 서열에 의해 연결되는 더 짧은 특정 서열을 상대적으로 덜 비싸게 맞춤형으로 제조하는 것을 가능하게 한다. 링커는, 링커가 어떠한 표적화된 삽입체 서열에도 결합하지 않도록 설계될 수 있다.
실시예 5. 결찰된 이중 가닥 어댑터를 사용하여 시퀀싱 라이브러리에서 표적 서열을 농축시키는 방법
본원에 논의된 특정 구현예는 헤어핀 어댑터에 관한 것이지만, 도 5에 예시된 바와 같이 연장 매개 이중 가닥 어댑터 결찰을 이용하여 다른 구현예를 구현할 수 있다. 도 5는 삽입체(14)를 갖는 라이브러리 단편(12) 사이의 비교를 나타내며, 여기서 일부 단편(12)은 표적화된 삽입체 서열을 갖고(14a), 다른 단편(12)은 표적화된 삽입체 서열을 갖지 않는다(14b).
단편(12)은 말단 어댑터(100)를 갖는다. 각각의 말단 어댑터는 제1 가닥(101)과 제2 가닥(102)을 포함한다. 제1 가닥(101)과 제2 가닥(102)의 부분은 상보적이며, 함께 이중 가닥 영역(103)을 형성한다. 제2 가닥(102)의 또 다른 부분은 이중 가닥 영역(103)의 3' 말단으로부터 멀리 연장되는 단일 가닥 3' 말단 영역(104)을 포함한다. 도 5의 예시된 예에서 어댑터(100)는 헤어핀을 포함하지 않는다.
단편을 변성시켜 분리된 가닥을 형성하면, 표적화된 삽입체(14a)를 함유하는 가닥(112a)에 특이적으로 혼성화되는 표적 특이적 연장 프라이머(110)의 결합이 가능해진다. 표적 서열을 포함하지 않는 삽입체(14b)를 갖는 다른 가닥(112b)은 반응 조건 하에서 프라이머(110)에 결합하지 않는다. 일 구현예에서, 상기 방법은 각각의 상이한 표적 서열에 대해 상이한 서열을 갖는 복수의 표적 특이적 연장 프라이머(110)와 함께 사용될 수 있다.
프라이머(110)로부터 상보적 가닥을 연장시키면, 비표적 삽입체(14b)를 갖는 다른 가닥(112b) 상에 존재하지 않는 이중 가닥 말단(120)을 갖는 가닥(112a)과 상보적 가닥의 듀플렉스가 생성된다. 이중 가닥 말단(120)은 이중 가닥 어댑터(124)에 후속으로 결찰되게 되는 A-오버행을 부가하기 위해 연장될 수 있다. 가닥(112a)의 5' 말단에서의 결찰로 5' 말단을 조작하고, 이어서 이를 증폭시켜 표적화된 삽입체(14a)를 함유하는 본원에 제공된 바와 같은 상이한 말단 어댑터를 갖는 전장 생성물(130)을 생성할 수 있다. 예를 들어, 전장 생성물의 각각의 가닥은 5' 말단에 제1 증폭 프라이머 서열과 3' 말단에 제2 증폭 프라이머 서열을 가질 수 있다. 증폭은 본원에 논의된 바와 같은 인덱스된 프라이머를 사용할 수 있다. 예시된 예는 A-오버행 결찰을 나타내지만, 이중 가닥 말단(120)은 또한 평활한 이중 가닥 어댑터에 대한 평활한 이중 가닥 비주형 결찰일 수 있다.
예시된 방법에서, 비표적 삽입체(14b)를 갖는 가닥(112b)은 증폭되지 않는다. 프라이머(110)에 대한 결합 사건이 없기 때문에, 이중 가닥 말단을 생성하는 연장이 없다. 따라서, 프라이머 세트의 단일 프라이머(36)만 비표적 가닥(112b)에 결합할 수 있으며, 비표적 가닥은 증폭되지 않는다.
실시예 6. 헤어핀 어댑터와 대조군 어댑터를 사용한 라이브러리 증폭 결과
헤어핀 영역 내 결합하는 프라이머와 분기형 영역 내 결합하는 프라이머(양성 대조군)를 사용하여 결찰된 헤어핀 어댑터의 PCR 증폭 효과를 시험하기 위해 실험을 설계하였다. 인산화된 5' 말단을 갖는 3' 단일 A-오버행을 포함하도록 모델 80mer 올리고뉴클레오타이드 이중 가닥 DNA 주형을 합성하였다. 이러한 모델 주형은 이중 가닥 DNA 샘플 삽입체에 대한 단순화된 모델의 역할을 했다. 이러한 주형에, Illumina LIG2 시약을 사용하여 30℃에서 10분 동안 2개의 상이한 어댑터 유형을 결찰시켰다. 대조군 듀플렉스 올리고는 1 uM이었고, 어댑터는 9 uM이었다. 먼저, 듀플렉스 ME 영역, 한쪽 분기에 내부 서열 CPH4' 및 B15', 및 다른 쪽 분기에 A14를 함유하는 대조군 어댑터 유형을 사용하였다(도 7 대조군 어댑터 참조). 다른 어댑터 유형은 동일한 ME 듀플렉스 영역, 대조군 어댑터와 동일한 상부 가닥, 하지만 추가 내부 서열(CPH3)을 함유하는 분기의 하부 가닥, 및 A14의 헤어핀을 함유하고 있었다. 어댑터를 95℃에서 변성시킨 후, 얼음 위에서 급속 냉각시켜 Tris-HCl(pH 8), 10 mM NaCl 중에 50 uM의 스톡을 형성하였다. A14와 A14' 사이의 헤어핀 서열은 5개 염기 길이였음에 유의한다. 각각의 어댑터를 별도의 결찰 반응에 부가하여, 듀플렉스의 각각의 말단에 대조군 어댑터 또는 헤어핀 어댑터로 결찰된 듀플렉스를 생성하였다. 내부 프라이머(대조군 분기형 어댑터의 경우 CPH4-ME와 A14-i5-P5, 헤어핀 어댑터의 경우 CPH4-ME와 CPH3-ME) 또는 외부 프라이머(두 가지 어댑터의 경우 모두 A14-i5-P5와 B15-i7-P7)를 사용하여 PCR 증폭을 수행하였다. 결찰된 주형을 7.5배로 희석하고, Illumina PCR 믹스(EPM) 중 PCR 시약과 혼합하였다. 95℃에서의 초기 3분 변성, 이어서 95℃에서 20초, 60℃에서 15초의 8회 사이클을 사용하여, 연장 온도를 위한 온도 구배(72℃ 내지 60℃)로 증폭을 수행하였다. 72℃에서 5분 동안 최종 연장시킨 후, 4℃로 만들었다. Agilent D1000 HS Tapestation을 사용하여 증폭 생성물을 정량화하였다.
도 6은 연장 온도 대 피크 몰농도의 4개 패널을 보여주고, 도 7은 도 6의 결과를 생성하기 위해 사용된 대조군 어댑터 구조와 헤어핀 어댑터 구조를 보여준다. 연장 온도 구배에 대한 영향은 거의 없는 것으로 보이지만, 외부 프라이머로 증폭된 경우 헤어핀 어댑터에서 가장 낮은 증폭 생성물이 생성되었음이 명확하게 나타난다(하부 우측 패널). 헤어핀 어댑터에 대한 대조군 내부 프라이머는, 생성물이 내부 프라이머로 결찰된 어댑터 주형으로부터 증폭될 수 있음을 명확하게 보여주며, 이는 헤어핀 어댑터 결찰을 확인시켜 준다. 비헤어핀 어댑터 라이브러리의 경우, 내부 및 외부 프라이머 쌍에서 PCR을 사용하는 경우 유사한 수율이 관찰되었다. 이러한 데이터는, 헤어핀에 포함된 프라이머 쌍(이러한 경우 A14)이 사용되는 경우, 헤어핀 어댑터 서열이 PCR 증폭을 저해함을 시사한다. 즉, 헤어핀의 잠금된 구성은 증폭을 방지한다.
등가물
전술한 명세서는 당업자가 구현예를 실시할 수 있게 하기에 충분한 것으로 간주된다. 전술한 설명 및 실시예는 특정 구현예를 상세하게 설명하며, 발명자가 고려된 최상의 방식을 설명한다. 전술한 내용이 본문에서 아무리 상세하게 설명되었다 하더라도, 구현예는 다수의 방식으로 실시될 수 있으며, 첨부된 청구범위 및 이의 임의의 등가물에 따라 해석되어야 함을 이해할 것이다.
본원에 사용된 약이라는 용어는, 명시적으로 표시되는지 여부에 관계없이, 예를 들어 정수, 분수 및 백분율을 포함하는 수치값을 나타낸다. 약이라는 용어는 일반적으로, 당업자가 인용된 값과 동등한(예를 들어, 동일한 기능 또는 결과를 갖는) 것으로 간주하는 수치값의 범위(예를 들어, 인용된 범위의 +/- 5% 내지 10%)를 나타낸다. 적어도 및 약과 같은 용어가 수치값 또는 범위의 목록에 선행하는 경우, 이러한 용어는 목록에 제공된 모든 값 또는 범위를 조정한다. 일부 경우에, 약이라는 용어는 가장 가까운 유효숫자로 반올림된 수치값을 포함할 수 있다.
SEQUENCE LISTING
<110> ILLUMINA CAMBRIDGE LIMITED
<120> METHODS OF ENRICHING A TARGET SEQUENCE FROM A SEQUENCING LIBRARY
USING HAIRPIN ADAPTORS
<130> IP-2043-PCT
<140>
<141>
<150> 63/077,271
<151> 2020-09-11
<160> 2
<170> PatentIn version 3.5
<210> 1
<211> 14
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 1
tcgtcggcag cgtc 14
<210> 2
<211> 15
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 2
gtctcgtggg ctcgg 15
Claims (91)
- 핵산 시퀀싱 라이브러리를 제작하는 데 사용되는 어댑터로서,
a. 5' 말단과 3' 말단을 갖는 제1 가닥과,
b. 5' 말단과 3' 말단을 갖는 제2 가닥을 포함하며;
여기서 제1 가닥의 3' 말단의 일부와 제2 가닥의 5' 말단의 일부는 상보적이며, 함께 제1 이중 가닥 영역을 형성하고;
제1 가닥의 5' 말단의 일부와 제2 가닥의 3' 말단의 일부는 비상보적이고;
제1 가닥의 5' 말단 부분은 제2 이중 가닥 영역을 포함하는, 어댑터. - 제1항에 있어서, 제2 이중 가닥 영역이 헤어핀 구조인, 어댑터.
- 제1항 또는 제2항에 있어서, 제2 이중 가닥 영역이 비핵산 부분을 포함하는, 어댑터.
- 제3항에 있어서, 비핵산 부분이 링커인, 어댑터.
- 제2항 내지 제4항 중 어느 한 항에 있어서, 제1 가닥의 5' 말단이 엑소뉴클레아제에 의해 분해되지 않는 링커 부분을 포함하는, 어댑터.
- 제1항 내지 제5항 중 어느 한 항에 있어서, 제1 이중 가닥 영역이 적어도 5개의 연속된 뉴클레오타이드인, 어댑터.
- 제1항 내지 제6항 중 어느 한 항에 있어서, 제2 이중 가닥 영역이 적어도 5개의 연속된 뉴클레오타이드인, 어댑터.
- 제1항 내지 제7항 중 어느 한 항에 있어서, 제2 가닥의 5' 말단이 인산화된 것인, 어댑터.
- 제1항 내지 제8항 중 어느 한 항에 있어서, 제1 가닥과 제2 가닥의 모든 시토신 염기가 메틸화된 것인, 어댑터.
- 제1항 내지 제9항 중 어느 한 항에 있어서, 포획 모이어티를 추가로 포함하는, 어댑터.
- 핵산 시퀀싱 라이브러리를 제작하는 방법으로서,
a. 복수의 이중 가닥 핵산 단편을 생성하는 단계; 및
b. 제1항 내지 제10항 중 어느 한 항의 어댑터를 복수의 이중 가닥 핵산 단편의 적어도 하나의 말단에 부착시키는 단계
를 포함하는, 방법. - 제11항에 있어서, 어댑터가 태그먼트화(tagmentation)를 통해 부착되는, 방법.
- 제11항에 있어서, 어댑터가 결찰을 통해 부착되는, 방법.
- 핵산 시퀀싱 라이브러리를 제작하기 위한 키트로서,
a. 제1항 내지 제10항 중 어느 한 항의 어댑터;
b. 어댑터의 일부와 혼성화 가능한 적어도 하나의 프라이머;
c. 적어도 하나의 효소; 및
d. dNTP
를 포함하는, 키트. - 제14항에 있어서, 적어도 하나의 효소가 엑소뉴클레아제 활성을 갖는, 키트.
- 제14항 또는 제15항에 있어서, 적어도 하나의 효소가 폴리머라아제인, 키트.
- 제14항 내지 제16항 중 어느 한 항에 있어서, 적어도 하나의 구성요소가 동결건조된 또는 건조된 형태인, 키트.
- 이중 가닥 단편의 시퀀싱 라이브러리에서 표적 서열을 농축시키는 방법으로서,
a. 시퀀싱 라이브러리를 제작하는 단계로서, 여기서 각각의 단편은
i. 이중 가닥 핵산을 포함하는 삽입체와,
ii. 이중 가닥 단편의 한쪽 또는 양쪽 가닥의 5' 말단에 있는 헤어핀 어댑터를 포함하며, 여기서 헤어핀 어댑터는 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열을 포함하는, 상기 제작하는 단계;
b. 이중 가닥 단편을 변성시켜 단일 가닥 단편을 형성하는 단계; 및
c. 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제를 사용하여,
i. 시퀀싱 라이브러리 내 적어도 하나의 삽입체에 포함된 표적 서열에 결합하는 하나 이상의 연장 프라이머를 사용하여 핵산 가닥을 생성하고,
ii. 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열의 전부 또는 일부를 제거하는 단계
를 포함하는, 방법. - 제18항에 있어서, 증폭 프라이머 서열에 결합하는 증폭 프라이머를 사용하여 단편을 증폭시키는 단계를 추가로 포함하는, 방법.
- 제18항 또는 제19항에 있어서, 헤어핀 어댑터가 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열 사이에 링커를 추가로 포함하고/하거나, 하나 초과의 연장 프라이머가 링커를 통해 부착되는, 방법.
- 제20항에 있어서, 링커가 엑소뉴클레아제에 의해 분해되지 않는, 방법.
- 제18항 내지 제21항 중 어느 한 항에 있어서, 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제가 Taq인, 방법.
- 제18항 내지 제22항 중 어느 한 항에 있어서, 하나 이상의 연장 프라이머 및/또는 연장 프라이머를 사용하여 핵산 가닥을 생성하는 데 사용되는 폴리머라아제가 연장 후 제거되는, 방법.
- 제23항에 있어서, 하나 이상의 연장 프라이머 및/또는 연장 프라이머를 사용하여 핵산 가닥을 생성하는 데 사용되는 폴리머라아제의 제거가, 고체상 가역적 고정화(SPRI: solid-phase reversible immobilization) 비드 및/또는 열감응성 폴리머라아제의 변성을 이용하여 이루어지는, 방법.
- 제18항 내지 제24항 중 어느 한 항에 있어서, 하나 이상의 연장 프라이머를 사용하여 핵산 가닥을 생성하는 단계가 우라실을 포함하는 반응 혼합물을 이용하여 수행되는, 방법.
- 제25항에 있어서, 우라실을 포함하는 반응 혼합물을 이용하여 생성된 핵산 가닥이 하나 이상의 우라실 특이적 절단 시약(USER: uracil-specific excision reagent)에 의해 절단되는, 방법.
- 제26항에 있어서, USER이 우라실 DNA 글리코실라아제 및 엔도뉴클레아제 VIII인, 방법.
- 제27항에 있어서, USER이 우라실 DNA 글리코실라아제 및 엔도뉴클레아제 VIII의 활성을 갖는 단일 효소인, 방법.
- 제18항 내지 제28항 중 어느 한 항에 있어서, 라이브러리 내 복수의 이중 가닥 단편이 표적 서열을 포함하지 않는, 방법.
- 제18항 내지 제29항 중 어느 한 항에 있어서, 상기 헤어핀 어댑터가, 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열의 전부 또는 일부가 존재하는 라이브러리의 이중 가닥 단편에 포함되어 있는, 방법.
- 제30항에 있어서, 표적 서열을 포함하지 않는 라이브러리 내 복수의 이중 가닥 단편에서, 제한 엔도뉴클레아제를 이용하여 헤어핀 어댑터를 절단하는 단계를 추가로 포함하는, 방법.
- 제25항 내지 제31항 중 어느 한 항에 있어서, 우라실을 포함하는 반응 혼합물을 이용하여 생성된 핵산 가닥이 제한 엔도뉴클레아제 소화에 대해 저항성이 있는, 방법.
- 제32항에 있어서, 제한 엔도뉴클레아제가 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열의 회합에 의해 형성된 이중 가닥 핵산에서 절단하는, 방법.
- 이중 가닥 단편의 시퀀싱 라이브러리에서 표적 서열을 농축시키는 방법으로서,
a. 시퀀싱 라이브러리를 제작하는 단계로서, 여기서 각각의 단편은
i. 이중 가닥 핵산을 포함하는 삽입체와,
ii. 이중 가닥 단편의 한쪽 또는 양쪽 가닥의 5' 말단에 있는 헤어핀 어댑터를 포함하며, 여기서 헤어핀 어댑터는
1. 뉴클레오타이드 서열의 제1 세트(여기서, 뉴클레오타이드 서열의 제1 세트는 어댑터 서열과 어댑터 서열에 적어도 부분적으로 상보적인 서열을 포함함);
2. 뉴클레오타이드 서열의 제2 세트(여기서, 뉴클레오타이드 서열의 제2 세트는 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열을 포함하며,
여기서 뉴클레오타이드 서열의 제1 세트는 뉴클레오타이드 서열의 제2 세트보다 삽입체에 더 가까움); 및
3. 어댑터 서열에 적어도 부분적으로 상보적인 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열 사이의 링커를 포함하는, 상기 제작하는 단계;
b. 이중 가닥 단편을 변성시켜 단일 가닥 단편을 형성하는 단계;
c. 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제를 사용하여,
i. 시퀀싱 라이브러리 내 적어도 하나의 삽입체에 포함된 표적 서열에 결합하는 제1 연장 프라이머를 사용하여 핵산 가닥을 생성하고(여기서, 핵산 가닥을 생성하기 위한 반응 혼합물은 우라실을 포함함),
ii. 어댑터 서열에 적어도 부분적으로 상보적인 서열의 전부 또는 일부를 제거하는 단계;
d. 제1 연장 프라이머를 제거하는 단계;
e. USER을 제공하는 단계; 및
f. 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제를 사용하여,
i. 이중 가닥 단편의 라이브러리 내 적어도 하나의 삽입체에 포함된 표적 서열에 결합하는 제2 연장 프라이머를 사용하여 핵산 가닥을 생성하고,
ii. 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열의 전부 또는 일부를 제거하는 단계
를 포함하는, 방법. - 제34항에 있어서, 증폭 프라이머 서열에 결합하는 증폭 프라이머를 사용하여 단편을 증폭시키는 단계를 추가로 포함하는, 방법.
- 제34항 또는 제35항에 있어서, 증폭 프라이머 서열의 상보체 및/또는 어댑터 서열에 적어도 부분적으로 상보적인 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열 사이의 링커가 엑소뉴클레아제에 의해 분해되지 않는, 방법.
- 제36항에 있어서, 증폭 프라이머 서열의 상보체 및/또는 어댑터 서열에 적어도 부분적으로 상보적인 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열 사이의 링커가 우라실을 포함하는, 방법.
- 제34항 내지 제37항 중 어느 한 항에 있어서, 제1 프라이머를 사용하여 핵산 가닥을 생성한 후 제한 엔도뉴클레아제를 이용하여 헤어핀 어댑터를 절단하는 단계를 추가로 포함하며, 여기서 상기 헤어핀 어댑터는, 어댑터 서열에 적어도 부분적으로 상보적인 서열의 전부 또는 일부가 존재하는 라이브러리의 이중 가닥 단편에 포함되어 있는, 방법.
- 제34항 내지 제38항 중 어느 한 항에 있어서, 제1 프라이머 연장을 사용하여 생성된 핵산 가닥이 우라실을 포함하며, 제한 엔도뉴클레아제 소화에 대해 저항성이 있는, 방법.
- 제34항 내지 제39항 중 어느 한 항에 있어서, 헤어핀 어댑터가 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열 사이에 링커를 추가로 포함하는, 방법.
- 제40항에 있어서, 링커가 엑소뉴클레아제에 의해 분해되지 않는, 방법.
- 제34항 내지 제41항 중 어느 한 항에 있어서, USER이 제1 프라이머 연장에 의해 생성된 핵산 가닥, 헤어핀 어댑터에 포함된 링커 및/또는 어댑터 서열에 적어도 부분적으로 상보적인 서열을 절단하는, 방법.
- 제42항에 있어서, USER이 우라실 DNA 글리코실라아제 및 엔도뉴클레아제 VIII인, 방법.
- 제42항에 있어서, USER이 우라실 DNA 글리코실라아제 및 엔도뉴클레아제 VIII의 활성을 갖는 단일 효소인, 방법.
- 제34항 내지 제44항 중 어느 한 항에 있어서, 제1 연장 프라이머와 제2 연장 프라이머가 상이한 서열에 결합하는, 방법.
- 제45항에 있어서, 제1 연장 프라이머와 제2 연장 프라이머가 이중 가닥 핵산의 동일한 가닥에 결합하는, 방법.
- 제34항 내지 제46항 중 어느 한 항에 있어서, 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제가 Taq인, 방법.
- 제34항 내지 제47항 중 어느 한 항에 있어서, 폴리머라아제가 단편을 증폭시키는 단계 전에 제거되는, 방법.
- 제34항 내지 제48항 중 어느 한 항에 있어서, 제2 연장 프라이머가 상기 프라이머를 사용하여 핵산 가닥을 생성한 후 제거되는, 방법.
- 제48항 또는 제49항에 있어서, 폴리머라아제 및/또는 제2 연장 프라이머가 SPRI 비드를 사용하고/하거나 열감응성 폴리머라아제를 변성시키는 방식으로 제거되는, 방법.
- 이중 가닥 단편의 시퀀싱 라이브러리에서 표적 서열을 농축시키는 방법으로서,
a. 시퀀싱 라이브러리를 제작하는 단계로서, 여기서 각각의 단편은
i. 이중 가닥 핵산을 포함하는 삽입체와,
ii. 이중 가닥 단편의 한쪽 또는 양쪽 가닥의 5' 말단에 있는 헤어핀 어댑터를 포함하며, 여기서 헤어핀 어댑터는 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열을 포함하는, 상기 제작하는 단계;
b. 이중 가닥 단편을 변성시켜 단일 가닥 단편을 형성하는 단계;
c. 프라이머 믹스와, 5'-3' 엑소뉴클레아제 활성 없이 결찰 활성과 폴리머라아제 활성이 있는 효소 믹스를 사용하여,
i. 프라이머 믹스의 제1 연장 프라이머를 사용하여 핵산 가닥을 생성하고(여기서, 프라이머 믹스는 제1 연장 프라이머와 차단된 제2 연장 프라이머를 포함하고, 여기서 제1 연장 프라이머와 차단된 제2 연장 프라이머는 이중 가닥 핵산에 포함된 상이한 관심 서열에 결합함),
ii. 제1 연장 프라이머를 사용하여 생성된 핵산 가닥을 차단된 제2 연장 프라이머에 결찰시키는 단계;
d. 삽입체에 결합되지 않은 프라이머 믹스를 제거하는 단계;
e. 차단된 제2 연장 프라이머를 차단 해제하는 단계; 및
f. 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제를 사용하여,
i. 결찰된 제1 연장 프라이머와 제2 연장 프라이머를 사용하여 핵산 가닥을 생성하고,
ii. 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열의 전부 또는 일부를 제거하는 단계
를 포함하는, 방법. - 제51항에 있어서, 증폭 프라이머 서열에 결합하는 증폭 프라이머를 사용하여 단편을 증폭시키는 단계를 추가로 포함하는, 방법.
- 제51항 또는 제52항에 있어서, 헤어핀 어댑터가 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열 사이에 링커를 추가로 포함하는, 방법.
- 제53항에 있어서, 링커가 엑소뉴클레아제에 의해 분해되지 않는, 방법.
- 제51항 내지 제54항 중 어느 한 항에 있어서, 차단된 제2 연장 프라이머가, 차단 해제되지 않는 한, 핵산 가닥을 생성할 수 없는, 방법.
- 제55항에 있어서, 차단된 제2 연장 프라이머가 제1 연장 프라이머에 의해 결합된 서열의 5' 및 적어도 하나의 삽입체에 포함된 표적 서열에 결합하는, 방법.
- 제51항 내지 제56항 중 어느 한 항에 있어서, 결찰된 제1 연장 프라이머와 제2 연장 프라이머의 어닐링 및 연장 온도가 제2 연장 프라이머의 용융 온도보다 높은, 방법.
- 제57항에 있어서, 차단된 제2 연장 프라이머가 60℃ 미만의 용융 온도로 삽입체에 결합하고/하거나 결찰된 제1 연장 프라이머와 제2 연장 프라이머를 사용하여 핵산 가닥을 생성하는 단계가 60℃ 이상의 온도에서 수행되는, 방법.
- 제51항 내지 제58항 중 어느 한 항에 있어서, 제2 연장 프라이머가 증폭시키는 단계 전에 제거되는, 방법.
- 제59항에 있어서, 제2 연장 프라이머가 SPRI 비드 또는 엑소뉴클레아제를 사용하여 제거되는, 방법.
- 제18항 내지 제60항 중 어느 한 항에 있어서, 하나 이상의 연장 프라이머가 유전자 특이적 프라이머인, 방법.
- 제18항 내지 제61항 중 어느 한 항에 있어서, 헤어핀 어댑터가 이중 가닥 단편의 한쪽 가닥의 5' 말단에 있는, 방법.
- 제18항 내지 제62항 중 어느 한 항에 있어서, 헤어핀 어댑터가 이중 가닥 단편의 양쪽 가닥의 5' 말단에 있는, 방법.
- 제18항 내지 제63항 중 어느 한 항에 있어서, 헤어핀 어댑터가 결찰 또는 태그먼트화에 의해 혼입되는, 방법.
- 제18항 내지 제64항 중 어느 한 항에 있어서, 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열이 각각 적어도 14개의 뉴클레오타이드를 포함하는, 방법.
- 제18항 내지 제65항 중 어느 한 항에 있어서, 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열이 각각 14개 내지 60개의 뉴클레오타이드를 포함하는, 방법.
- 제18항 내지 제66항 중 어느 한 항에 있어서, 헤어핀 어댑터가 안정성을 증가시키기 위한 하나 이상의 증강을 포함하며, 선택적으로 여기서 증강은 하나 이상의 변형된 또는 잠금된 핵산을 포함하는, 방법.
- 제18항 내지 제67항 중 어느 한 항에 있어서, 헤어핀 어댑터가 60℃ 이상, 65℃ 이상 또는 70℃ 이상의 온도에서 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열의 회합을 유지하는, 방법.
- 제18항 내지 제68항 중 어느 한 항에 있어서, 증폭 프라이머 서열이 A14, A14', B15 또는 B15' 서열을 포함하는, 방법.
- 제18항 내지 제69항 중 어느 한 항에 있어서, 증폭 프라이머 서열이 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열과 회합되어 있을 때, 증폭 프라이머가 헤어핀 어댑터에 포함된 증폭 프라이머 서열에 결합할 수 없는, 방법.
- 제18항 내지 제70항 중 어느 한 항에 있어서, 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열이 증폭 프라이머 서열의 상보체와 50% 이상, 60% 이상, 70% 이상, 80% 이상, 90% 이상, 95% 이상 또는 99% 이상의 서열 동일성을 갖는 서열을 포함하는, 방법.
- 제71항에 있어서, 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열이 증폭 프라이머 서열의 상보체를 포함하는, 방법.
- 제18항 내지 제72항 중 어느 한 항에 있어서, 이중 가닥 단편의 한쪽 또는 양쪽 가닥이 헤어핀 어댑터의 3'에 하나 이상의 추가 어댑터를 포함하는, 방법.
- 제18항 내지 제73항 중 어느 한 항에 있어서, 이중 가닥 단편이 한쪽 또는 양쪽 가닥의 3' 말단에 하나 이상의 어댑터를 포함하는, 방법.
- 제73항 또는 제74항에 있어서, 하나 이상의 어댑터가 프라이머 서열, 인덱스 태그 서열, 포획 서열, 바코드 서열, 절단 서열 또는 시퀀싱 관련 서열, 또는 이들의 조합을 포함하는, 방법.
- 제19항 내지 제75항 중 어느 한 항에 있어서, 증폭 프라이머를 사용하여 단편을 증폭시키는 단계가 헤어핀 어댑터를 파괴하지 못하는, 방법.
- 제76항에 있어서, 증폭 프라이머를 사용하여 단편을 증폭시키는 데 사용되는 폴리머라아제에 5'-3' 엑소뉴클레아제 활성이 결여되어 있거나, 증폭 프라이머를 사용하여 단편을 증폭시키는 데 사용되는 폴리머라아제가 가닥 치환 폴리머라아제가 아닌, 방법.
- 제77항에 있어서, 단편을 증폭시키는 데 사용되는 폴리머라아제가 Q5인, 방법.
- 제19항 내지 제78항 중 어느 한 항에 있어서, 증폭이 브릿지 증폭인, 방법.
- 제19항 내지 제79항 중 어느 한 항에 있어서, 증폭된 단편을 시퀀싱하는 단계를 추가로 포함하는, 방법.
- 제80항에 있어서, 삽입체의 전체 서열의 시퀀싱을 가능하게 하는, 방법.
- 제18항 내지 제81항 중 어느 한 항에 있어서, 이중 가닥 핵산이 DNA 또는 RNA를 포함하는, 방법.
- 제81항에 있어서, 이중 가닥 핵산이 무세포 DNA 또는 엑솜 샘플을 포함하는, 방법.
- 제18항 내지 제83항 중 어느 한 항에 있어서, 단편 중복제거에 사용되는, 방법.
- 이중 가닥 단편의 시퀀싱 라이브러리에서 표적 서열을 농축시키는 방법으로서,
a. 시퀀싱 라이브러리를 제작하는 단계로서, 여기서 이중 가닥 단편의 각각의 단편은 말단 어댑터 사이에 배치된 삽입체를 포함하고, 여기서 각각의 말단 어댑터는
뉴클레오타이드 서열의 제1 세트(여기서, 뉴클레오타이드 서열의 제1 세트는 어댑터 서열과 어댑터 서열에 적어도 부분적으로 상보적인 서열을 포함함)와,
뉴클레오타이드 서열의 제1 세트의 3' 말단에서부터 멀리 연장되는 증폭 프라이머 서열을 포함하는, 상기 제작하는 단계;
b. 이중 가닥 단편을 변성시켜 분리된 가닥을 형성하는 단계(각각의 분리된 가닥은 삽입체의 단일 가닥 부분을 포함함);
c. 서열 특이적 연장 프라이머를 삽입체의 단일 가닥 부분 내 상보적 서열에 어닐링하는 단계;
d. 어닐링된 연장 프라이머에서 상보적 가닥을 연장시켜 이중 가닥 말단을 갖는 상보적 가닥과 분리된 가닥의 듀플렉스(duplex)를 형성하는 단계(여기서, 이중 가닥 말단은 상보적 가닥의 3' 말단과 분리된 가닥의 5' 말단을 포함함);
e. 이중 가닥 어댑터를 듀플렉스의 각각의 이중 가닥 말단에 결찰시키는 단계;
f. 듀플렉스를 변성시키는 단계; 및
g. 듀플렉스의 변성된 가닥을 증폭시켜 증폭된 생성물을 생성하는 단계
를 포함하는, 방법. - 제85항에 있어서, 증폭된 생성물을 시퀀싱하는 단계를 추가로 포함하는, 방법.
- 제86항에 있어서, 증폭된 생성물을 시퀀싱하기 위해 인덱스 서열을 갖는 프라이머를 사용하는 것을 포함하는, 방법.
- 제85항 또는 제86항에 있어서, 이중 가닥 말단에 A 오버행을 부가하는 단계를 추가로 포함하며, 여기서 이중 가닥 어댑터는 상보적 T 오버행을 포함하는, 방법.
- 제85항 내지 제87항 중 어느 한 항에 있어서, 이중 가닥 어댑터가 제2 증폭 프라이머 서열과 제2 증폭 프라이머 서열에 상보적인 서열을 포함하는, 방법.
- 제88항에 있어서, 뉴클레오타이드 서열의 제1 세트의 3' 말단에서부터 멀리 연장되는 증폭 프라이머 서열이 제2 증폭 프라이머 서열과 상이한 서열을 포함하는, 방법.
- 제85항 내지 제89항 중 어느 한 항에 있어서, 서열 특이적 연장 프라이머가 각각의 상이한 표적 서열에 대해 복수의 상이한 서열을 포함하는, 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063077271P | 2020-09-11 | 2020-09-11 | |
US63/077,271 | 2020-09-11 | ||
PCT/EP2021/074931 WO2022053610A1 (en) | 2020-09-11 | 2021-09-10 | Methods of enriching a target sequence from a sequencing library using hairpin adaptors |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230069135A true KR20230069135A (ko) | 2023-05-18 |
Family
ID=77910787
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237011164A KR20230069135A (ko) | 2020-09-11 | 2021-09-10 | 헤어핀 어댑터를 사용하여 시퀀싱 라이브러리에서 표적 서열을 농축시키는 방법 |
Country Status (10)
Country | Link |
---|---|
US (1) | US20230416803A1 (ko) |
EP (1) | EP4211261A1 (ko) |
JP (1) | JP2023540177A (ko) |
KR (1) | KR20230069135A (ko) |
CN (1) | CN116323970A (ko) |
AU (1) | AU2021339945A1 (ko) |
CA (1) | CA3188197A1 (ko) |
IL (1) | IL300983A (ko) |
MX (1) | MX2023001400A (ko) |
WO (1) | WO2022053610A1 (ko) |
Family Cites Families (58)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU622426B2 (en) | 1987-12-11 | 1992-04-09 | Abbott Laboratories | Assay using template-dependent nucleic acid probe reorganization |
CA1341584C (en) | 1988-04-06 | 2008-11-18 | Bruce Wallace | Method of amplifying and detecting nucleic acid sequences |
WO1989009835A1 (en) | 1988-04-08 | 1989-10-19 | The Salk Institute For Biological Studies | Ligase-based amplification method |
US5130238A (en) | 1988-06-24 | 1992-07-14 | Cangene Corporation | Enhanced nucleic acid amplification process |
JP2801051B2 (ja) | 1988-06-24 | 1998-09-21 | アムジエン・インコーポレーテツド | 核酸塩基配列を検出するための方法及び試薬 |
EP0425563B1 (en) | 1988-07-20 | 1996-05-15 | David Segev | Process for amplifying and detecting nucleic acid sequences |
US5185243A (en) | 1988-08-25 | 1993-02-09 | Syntex (U.S.A.) Inc. | Method for detection of specific nucleic acid sequences |
CA2044616A1 (en) | 1989-10-26 | 1991-04-27 | Roger Y. Tsien | Dna sequencing |
US5573907A (en) | 1990-01-26 | 1996-11-12 | Abbott Laboratories | Detecting and amplifying target nucleic acids using exonucleolytic activity |
KR950013953B1 (ko) | 1990-01-26 | 1995-11-18 | 애보트 래보라토리즈 | 리가제 연쇄 반응에 적용가능한 표적 핵산의 증폭 방법 |
US5455166A (en) | 1991-01-31 | 1995-10-03 | Becton, Dickinson And Company | Strand displacement amplification |
AU694187B2 (en) | 1994-02-07 | 1998-07-16 | Beckman Coulter, Inc. | Ligase/polymerase-mediated genetic bit analysis TM of single nucleotide polymorphisms and its use in genetic analysis |
AU687535B2 (en) | 1994-03-16 | 1998-02-26 | Gen-Probe Incorporated | Isothermal strand displacement nucleic acid amplification |
GB9620209D0 (en) | 1996-09-27 | 1996-11-13 | Cemu Bioteknik Ab | Method of sequencing DNA |
GB9626815D0 (en) | 1996-12-23 | 1997-02-12 | Cemu Bioteknik Ab | Method of sequencing DNA |
ES2563643T3 (es) | 1997-04-01 | 2016-03-15 | Illumina Cambridge Limited | Método de secuenciación de ácido nucleico |
AR021833A1 (es) | 1998-09-30 | 2002-08-07 | Applied Research Systems | Metodos de amplificacion y secuenciacion de acido nucleico |
US20050191698A1 (en) | 1999-04-20 | 2005-09-01 | Illumina, Inc. | Nucleic acid sequencing using microsphere arrays |
US20060275782A1 (en) | 1999-04-20 | 2006-12-07 | Illumina, Inc. | Detection of nucleic acid reactions on bead arrays |
US6355431B1 (en) | 1999-04-20 | 2002-03-12 | Illumina, Inc. | Detection of nucleic acid amplification reactions using bead arrays |
US6274320B1 (en) | 1999-09-16 | 2001-08-14 | Curagen Corporation | Method of sequencing a nucleic acid |
US7244559B2 (en) | 1999-09-16 | 2007-07-17 | 454 Life Sciences Corporation | Method of sequencing a nucleic acid |
US7611869B2 (en) | 2000-02-07 | 2009-11-03 | Illumina, Inc. | Multiplexed methylation detection methods |
US7582420B2 (en) | 2001-07-12 | 2009-09-01 | Illumina, Inc. | Multiplex nucleic acid reactions |
JP2003521252A (ja) | 2000-02-07 | 2003-07-15 | イルミナ インコーポレイテッド | ユニバーサルプライミングを用いる核酸検出方法 |
US6913884B2 (en) | 2001-08-16 | 2005-07-05 | Illumina, Inc. | Compositions and methods for repetitive use of genomic DNA |
US7955794B2 (en) | 2000-09-21 | 2011-06-07 | Illumina, Inc. | Multiplex nucleic acid reactions |
US7001792B2 (en) | 2000-04-24 | 2006-02-21 | Eagle Research & Development, Llc | Ultra-fast nucleic acid sequencing device and a method for making and using the same |
EP1975251A3 (en) | 2000-07-07 | 2009-03-25 | Visigen Biotechnologies, Inc. | Real-time sequence determination |
EP1354064A2 (en) | 2000-12-01 | 2003-10-22 | Visigen Biotechnologies, Inc. | Enzymatic nucleic acid synthesis: compositions and methods for altering monomer incorporation fidelity |
US7057026B2 (en) | 2001-12-04 | 2006-06-06 | Solexa Limited | Labelled nucleotides |
ES2407681T3 (es) | 2002-08-23 | 2013-06-13 | Illumina Cambridge Limited | Nucleótidos modificados para la secuenciación de polinucleótidos. |
US7595883B1 (en) | 2002-09-16 | 2009-09-29 | The Board Of Trustees Of The Leland Stanford Junior University | Biological analysis arrangement and approach therefor |
US7670810B2 (en) | 2003-06-20 | 2010-03-02 | Illumina, Inc. | Methods and compositions for whole genome amplification and genotyping |
CA2579150C (en) | 2004-09-17 | 2014-11-25 | Pacific Biosciences Of California, Inc. | Apparatus and method for analysis of molecules |
US7405281B2 (en) | 2005-09-29 | 2008-07-29 | Pacific Biosciences Of California, Inc. | Fluorescent nucleotide analogs and uses therefor |
GB0522310D0 (en) | 2005-11-01 | 2005-12-07 | Solexa Ltd | Methods of preparing libraries of template polynucleotides |
EP3373174A1 (en) | 2006-03-31 | 2018-09-12 | Illumina, Inc. | Systems and devices for sequence by synthesis analysis |
WO2008051530A2 (en) | 2006-10-23 | 2008-05-02 | Pacific Biosciences Of California, Inc. | Polymerase enzymes and reagents for enhanced nucleic acid sequencing |
EP4134667A1 (en) | 2006-12-14 | 2023-02-15 | Life Technologies Corporation | Apparatus for measuring analytes using fet arrays |
US8262900B2 (en) | 2006-12-14 | 2012-09-11 | Life Technologies Corporation | Methods and apparatus for measuring analytes using large scale FET arrays |
US8349167B2 (en) | 2006-12-14 | 2013-01-08 | Life Technologies Corporation | Methods and apparatus for detecting molecular interactions using FET arrays |
WO2008096146A1 (en) | 2007-02-07 | 2008-08-14 | Solexa Limited | Preparation of templates for methylation analysis |
WO2009133466A2 (en) * | 2008-04-30 | 2009-11-05 | Population Genetics Technologies Ltd. | Asymmetric adapter library construction |
US20100137143A1 (en) | 2008-10-22 | 2010-06-03 | Ion Torrent Systems Incorporated | Methods and apparatus for measuring analytes |
WO2012058096A1 (en) | 2010-10-27 | 2012-05-03 | Illumina, Inc. | Microdevices and biosensor cartridges for biological or chemical analysis and systems and methods for the same |
US8951781B2 (en) | 2011-01-10 | 2015-02-10 | Illumina, Inc. | Systems, methods, and apparatuses to image a sample for biological or chemical analysis |
EP3083994B1 (en) | 2013-12-20 | 2021-08-18 | Illumina, Inc. | Preserving genomic connectivity information in fragmented genomic dna samples |
EP3180448A4 (en) * | 2014-08-14 | 2018-01-17 | Abbott Molecular Inc. | Multifunctional oligonucleotides |
US10844428B2 (en) | 2015-04-28 | 2020-11-24 | Illumina, Inc. | Error suppression in sequenced DNA fragments using redundant reads with unique molecular indices (UMIS) |
US20170283864A1 (en) * | 2016-03-31 | 2017-10-05 | Agilent Technologies, Inc. | Use of transposase and y adapters to fragment and tag dna |
GB201609221D0 (en) * | 2016-05-25 | 2016-07-06 | Oxford Nanopore Tech Ltd | Method |
EP3507365A4 (en) * | 2016-08-30 | 2020-05-06 | Metabiotech Corporation | METHOD AND COMPOSITIONS FOR PHASE CONTROLLED SEQUENCING |
ES2929281T3 (es) * | 2017-03-23 | 2022-11-28 | Univ Washington | Métodos para el enriquecimiento de secuencias de ácidos nucleicos dirigidos con aplicaciones para la secuenciación de ácidos nucleicos con corrección de errores |
AU2018259202B2 (en) | 2017-04-23 | 2022-03-24 | Illumina Cambridge Limited | Compositions and methods for improving sample identification in indexed nucleic acid libraries |
WO2018197950A1 (en) | 2017-04-23 | 2018-11-01 | Illumina Cambridge Limited | Compositions and methods for improving sample identification in indexed nucleic acid libraries |
DK3872187T3 (da) | 2017-04-23 | 2022-12-05 | Illumina Cambridge Ltd | Sammensætninger og fremgangsmåder til forbedring af prøveidentificering i indekserede nukleinsyrebiblioteker |
US11028435B2 (en) | 2017-05-01 | 2021-06-08 | Illumina, Inc. | Optimal index sequences for multiplex massively parallel sequencing |
-
2021
- 2021-09-10 WO PCT/EP2021/074931 patent/WO2022053610A1/en active Application Filing
- 2021-09-10 KR KR1020237011164A patent/KR20230069135A/ko unknown
- 2021-09-10 JP JP2023511647A patent/JP2023540177A/ja active Pending
- 2021-09-10 CA CA3188197A patent/CA3188197A1/en active Pending
- 2021-09-10 EP EP21777265.6A patent/EP4211261A1/en active Pending
- 2021-09-10 CN CN202180051665.3A patent/CN116323970A/zh active Pending
- 2021-09-10 IL IL300983A patent/IL300983A/en unknown
- 2021-09-10 AU AU2021339945A patent/AU2021339945A1/en active Pending
- 2021-09-10 MX MX2023001400A patent/MX2023001400A/es unknown
-
2022
- 2022-09-10 US US18/025,794 patent/US20230416803A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
AU2021339945A1 (en) | 2023-03-02 |
WO2022053610A1 (en) | 2022-03-17 |
JP2023540177A (ja) | 2023-09-22 |
EP4211261A1 (en) | 2023-07-19 |
CA3188197A1 (en) | 2022-03-17 |
MX2023001400A (es) | 2023-04-25 |
US20230416803A1 (en) | 2023-12-28 |
IL300983A (en) | 2023-04-01 |
CN116323970A (zh) | 2023-06-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11692213B2 (en) | Compositions and methods for targeted depletion, enrichment, and partitioning of nucleic acids using CRISPR/Cas system proteins | |
US20230137106A1 (en) | Methods and compositions for paired end sequencing using a single surface primer | |
CN112689673A (zh) | 转座体使能的dna/rna测序(ted rna-seq) | |
US8795968B2 (en) | Method to produce DNA of defined length and sequence and DNA probes produced thereby | |
KR20230091116A (ko) | 다수의 삽입체를 포함하는 시퀀싱 주형, 및 시퀀싱 처리량을 개선하기 위한 조성물 및 방법 | |
US20160348152A1 (en) | Compositions and Methods for Preparing Sequencing Libraries | |
WO2018227025A1 (en) | Creation and use of guide nucleic acids | |
US11667953B2 (en) | Methods and compositions for cluster generation by bridge amplification | |
CA3101648A1 (en) | Compositions and methods for making guide nucleic acids | |
CN113366115A (zh) | 高覆盖率stlfr | |
KR20230051508A (ko) | 핵산의 서열-특이적 표적화된 전위 및 선택과 분류 | |
CN112654715A (zh) | 改进多核苷酸簇克隆性优先性的方法 | |
KR20230069135A (ko) | 헤어핀 어댑터를 사용하여 시퀀싱 라이브러리에서 표적 서열을 농축시키는 방법 | |
WO2022251510A2 (en) | Oligo-modified nucleotide analogues for nucleic acid preparation |